泡泡资讯网

AI大模型能拿奥赛金牌了?先别急着封神。 这两天有篇论文挺火:上海AI Lab

AI大模型能拿奥赛金牌了?先别急着封神。

这两天有篇论文挺火:上海AI Lab、清华、北大、港中文、上海交大等团队,做出了一个叫 SU-01 的推理模型。最吸睛的是,它在一些数学、物理奥赛题上,已经能达到人类金牌选手的水平。

但重点不是AI又变强了,而是它走了一条很值得关注的路:SU-01的底子不算超级巨无霸,而是靠后期“精修”变强。
简单说,就是三步:
第一,先让它看几十万条高质量奥赛解题过程,不只是看答案,而是学会怎么推理、怎么检查、怎么改错。
第二,再用强化学习训练它。你可以理解成:做对了奖励,证明更严谨也奖励,让模型慢慢学会少犯逻辑漏洞。
第三,真正考试时,不要求它秒答,而是允许它“多想一会儿”。遇到难题,它可以写很长的草稿,自己验证、自己挑刺、自己重写,有些题的思考过程甚至能超过10万字级别的长度。

这其实说明一件事:AI变聪明,不一定只靠“出生时脑子更大”,也可以靠后天训练得更会思考,再加上考试时给足草稿纸和时间。
我更愿意把 SU-01 看成一个信号:小一点的模型,只要训练方法精细,也能在某些高难度领域打出顶级表现。未来法律、医疗、金融,可能都会出现类似的“专业推理型AI”。
不过也要冷静。别忘了,它能多想,是因为背后真在烧算力。训练可能更省了,推理反而更贵了。AI竞争,远没到省钱躺赢的时候。