昨天揭幕战,墨西哥2:0赢了南非。
赛前我刚好刷到有媒体拉了五家AI大模型做赛前分析,千问给的判断是2:0。当时我截了张图,想着等踢完回来核对一下。
结果不光比分对了,红牌预判了,连节奏都说中了😂上半场进一个,下半场再补一个。实际比赛第9分钟就破门,下半场老将锦上添花,跟它写的一样。
我把千问赛前出的那份分析又翻出来看了一遍,发现它确实有点意思。
1我们平时聊球,一般聊的都是阵容、状态、历史战绩。千问当然也看了这些基本面,但它花了很大篇幅在聊一些我根本没想过的东西,比如海拔。
墨西哥城的球场在海拔2200米以上,千问认为高海拔导致空气含氧量低,球员跑动心率更高,疲劳来得更快。
对于常年在这个环境里比赛的墨西哥球员来说,这是日常。但对飞了十几个小时刚落地的南非球队,相当于一开场就背着一个隐形沙袋。
其实在赛前,AP通讯社就发过一篇专题报道,采访了运动科学专家,结论几乎是一样的:在高海拔条件下,球员的冲刺能力、高强度跑动持续性、甚至高位逼抢的频率都会明显下降。
墨西哥足球委员会主席自己都公开说过,海拔是东道主最大的武器。1970年那届在墨西哥办的时候,捷克斯洛伐克小组赛三战全败,后来被认为跟没适应高原有很大关系。五十多年过去了,这个变量一直都在,但大部分人聊球的时候不会把它当回事。
但千问不仅把它考虑进去了,还结合比赛当天的天气预报,发现有暴雨预警。湿滑场地对南非惯用的长传冲吊影响很大,等于又叠了一层debuff。这两个因素合在一起,虽然不算什么独家数据,但改变了一个关键判断:这不会是一场势均力敌的比赛。
两队的纸面差距是一回事,而当你把环境因素叠进去之后,差距瞬间被放大了。
2传统赛前分析,是在相对确定的框架里,比如A队强还是B队强,核心球员状态怎么样。但千问这次花了大量精力在处理场外变量:地理、气候、裁判风格、甚至球的飞行轨迹在不同海拔下的变化。
这让我想到,最近几年体育数据分析领域有一个一直在推进但很难落地的方向:把contextual variables(情境变量)纳入模型。学术界早就知道天气、海拔、时差这些因素对比赛结果有统计意义上的影响,但这些数据太碎、太非标了,传统的分析模型很难把它们系统化地吃进去。
一篇发在PMC上的研究就指出,目前大多数足球比赛结果的机器学习模型,在输入特征上仍然高度依赖比赛内的技术统计指标,而天气、湿度、场地、交通等客观环境指标还没有被充分纳入。
千问这次有意思的地方就在这里。它没有发明了什么新的分析框架,而是把那些一直存在、一直有用、但一直没被系统化使用的信息给串起来了。
这和它分析裁判的逻辑是一样的。千问赛前分析了主裁桑帕约的执法历史,判断这场比赛如果动作大,出牌会很果断。结果全场三张红牌,南非两张墨西哥一张,直接创了揭幕战历史纪录。
3更让我意想不到的是,今天上午10点的第二场比赛,千问竟然“二连准”,精准预测最终2:1的比分。真的是离谱的“封神”时刻!
其实我想聊的不只是千问在首日的表现。Decrypt前两天做了一个更大规模的测试,拉了七家AI模型分析整届赛事走势,结论很有意思:喂给模型不同的评分体系,出来的冠军就不一样。
用实时Elo排名的模型倾向选西班牙,用FIFA官方排名或者往届成绩的模型倾向选阿根廷。
我之前对AI做赛事分析这件事一直是持怀疑态度的,毕竟足球比赛里的偶然性很大,一个门柱、一次误判、一脚世界波,都可能彻底改变结果。但千问这次的表现让我换了一个角度,AI做赛事分析的价值,在于它提供了一种全新的观赛视角,帮你注意到那些你原本不会关注的因素,海拔、湿度、裁判风格、球员的文化习惯。
千问AI预测产品负责人程飞也说,足球最大的魅力就在于不确定性,谁说自己能百分之百说对比赛结果,那大概率不是AI,而是骗子。真正懂球的人都知道,没有任何公式能完美描述绿茵场上的每一次灵光一现。
今年夏天的足球赛事刚刚开始,104场比赛还有102场要踢。这已经不只是球迷的夏天了,也是AI的第一个足球夏天。
世界杯首日,千问率先拿了个开门红。





