需要收集不同类型的数据进行处理才能分析得到

西甲 02-27 阅读:111 评论:0

  足球是无可争议的世界第一运动,比赛所具有的极大不确定性这也是这项运动的魅力之一,如果我们想要洞悉足球比赛的走势,那么我们需要拆解问题,细数影响足球比赛的全部因素,然后想办法把这些因素全部量化,再通过数据统计和建模来帮助我们做决策。

  量化的重要性

  将宏观抽象概念量化为数值这一步很重要,否则你就只能靠感觉,而感觉是不靠谱的。举例来说,主场优势是一个宏观抽象概念,A队素有魔鬼主场之称,所以A队更有优势,你的感觉就倾向A队,可是A队的主场优势到底能起多少作用?能提升百分之多少战斗力?不知道,只知道起作用,就只能凭感觉。所幸,联赛是一个绝佳的舞台,主客场双循环的赛制能一定程度上利用控制变量法给我们带来答案,如果能统计出A队面对所有对手的主客场成绩,那么这个数值就能直观的告诉你问题的答案。

  接下来,我们先罗列所有的影响因素

  1. 纸面实力

  这是衡量一支球队战斗力的最直接的办法,有几个因素需要考虑,

  1)球员身价,衡量硬实力最直接的天然数值;

  2)超巨,球星,普通球员的数量分布;

  3)前锋,中场,后卫,门将的数量分布,每个位置球员的关键数据;

  4)伤病减员数量,以及每个伤缺球员的影响

  2. 球员状态

  这个很重要,可惜的是普通人接触不到,只能旁敲侧击:

  1)统计球员近来的比赛数据;

  2)抓取球队新闻做情感分析来第一时间掌握球员的动态;

  3)球队最近几场比赛的表现;

  4)医疗团队华佗还是兽医

  3. 团队凝聚

  1)抓取球队新闻做语义理解,找是否将帅不和,内部矛盾;

  2)记录球员性格,博格巴这种洗剪吹,萨卡这种乖乖仔,谁是炸弹一目了然

  4. 战斗意志

  1)根据联赛进程,争冠、争四,争六,保级还是无欲无求;

  2)双赛是保联赛还是保欧冠,足总杯和联赛杯谁是谁的鸡肋

  5. 战术选择

  1)主教练人选,主教练的更迭;

  2)做流派分类,瓜流,鸟流,各有克制,看谁人员配置技高一筹

  6. 主场优势

  这个其实最容易毫无争议的数值化,因为联赛本就是主客场双循环,很容易得出结论,甚至有疫情的那一年空场,我们都能分析少了球迷因素,主场优势下降多少

  1)球迷助威因素;

  2)场地大小,草皮情况;

  3)旅途劳顿

  7. 前后赛程

  1)球队板凳深度;

  2)球队一周双赛的战绩;

  3)是否有选择性的放弃;

  8. 历史战绩

  1)球风相克: 阿森纳面对曼城8连败是同源学艺不精;

  2)历史恩怨: 德甲鲁尔区德比,西班牙国家德比,河床博卡超级德比。

  9. 资本倾向

  1)通过裁判影响争冠或者争四,增加联赛激烈程度;比如上赛季进入冲刺期前,阿森纳大幅领先曼城时,遭遇关键误判(其中一场点球不判,另一场对手越位进球判进),这种就是典型的资本倾向型黑哨。我们需要通过AI的自然语言理解技术抽取当时的新闻事件,还原当时的积分场景,找出它可能发生的时间点和情况。等以后再遇到类似的情况时,那就可以做算法冷门预警。

  10. 菜价波动

  这个数值可天然获取,其实某种程度上编码了上述所有内容,而且又在此基础之上还编码了博弈的信息,因此如何利用该信息反倒是一件难事。在找到有效的挖掘并解码方式之前,聚类,相似度,最近邻这些方式的效果都有限。所以这里可以研究的内容很多,目前为止我的进展并不理想。

  建立模型

  综上所述,列举出所有的因素之后,我们应该把这些因素数值化,然后用数学模型来描述它们,最后求解该模型参数即可得到预测模型。假设我们一共10个因素,那么即使我们用一个最简单的模型,比如给每个因素乘以一个系数,这些系数就是模型的参数,也代表各个因素的影响因子,即:用简单的模型举一个例子

  式子中,x1至x10代表不同的10个因素,y代表比赛的结果,只要通过数据统计求解出上述系数,即可把x带入计算y。

  因为大家也清楚上述因素其实并不是孤立的,它们很多是相互影响的,所以上图中的简单线性关系并不能很好的建模,这里只是为了方便理解举了一个简单的例子。而在实际的应用中,我们可以用更加复杂的关系和更多的参数来描述这个复杂的模型。不过,建模固然重要,不过更为重要的是选出上述因素并把上述因素数值化,大家也能感觉到,有些因素的数值化可能稍微简单一些,而更多的则是一个复杂的过程,需要收集不同类型的数据进行处理才能分析得到。而我也正在做这件事情,有一些进展,但和我理想中的样子还相去甚远,路漫漫其修远兮,吾将上下而求索。

  你觉得上述因素列举的够全面吗?请评论这篇文章留下你的看法或者私信我,让我们一起来完善这个想法。

需要收集不同类型的数据进行处理才能分析得到

需要收集不同类型的数据进行处理才能分析得到

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

相关推荐