[CL]《Stop When Reasoning Converges: Semantic-Preserving Early Exit for Reasoning Models》D Min, G Vaccarino, H Chen, Y Wu, G Yona, L Cheng [University of Illinois Chicago] (2026)
在大模型推理中,长思维链过度推理是一个悬而未决的难题。过去的方法受困于只看答案置信度或一致性,本质原因是答案看似稳定时,推理可能仍在自我修正。
本文的核心洞见是:把早停信号重新看作推理语义是否还在前进。由此,用冗余检测器发现“只是在重复”的步骤,再用答案验证确认安全停止这一关键操作,使模型少想而不截断关键思路。
这项工作真正留下的遗产是把推理压缩从长度控制转向语义收敛判断。它为后来者打开的新门是可迁移、可学习的停止策略,但尚未跨过的门槛是短链、弱分段与跨域检测校准。
arxiv.org/abs/2605.17672 机器学习 人工智能 论文 AI创造营







