泡泡资讯网

[CL]《The Tool Illusion: Rethinking Tool

[CL]《The Tool Illusion: Rethinking Tool Use in Web Agents》R Lou, B Peng, W Yao, Q Wu… [Microsoft Research & The Pennsylvania State University] (2026)

在网页智能体领域,"给智能体配备工具一定更好"的直觉被普遍接受,但这一结论几乎全部来自单框架、单模型家族的局限实验,不同研究甚至得出相互矛盾的结论:到底是弱模型还是强模型更能从工具中获益?这一基础问题悬而未决,使整个领域的进展建立在沙滩上。

本文的核心洞见是:把 LLM 合成工具重新看作能力蒸馏而非普适加速器。工具封装了构造者的决策知识,只有当使用者明显弱于构造者时,这种知识才能被有效继承;反之则适得其反。由此,"工具越复杂越好"的直觉被颠覆——真正决定性能的是工具集对常见用户意图的覆盖度与可组合性,而非单个工具的端到端综合性。

这项工作真正留下的遗产是:为工具化网页智能体提供了第一份跨框架、跨模型家族的受控基准,将"工具有益"从信仰变为了有条件的命题。它为后来者打开的新门是语义技能(Semantic Skills)作为黑盒工具的透明替代路径。但尚未跨过的门槛是:如何在预算有限时系统性地确定工具构造者与使用者之间的最优能力差,以及工具组合失败时的自动恢复机制。

arxiv.org/abs/2604.03465

机器学习 人工智能 论文 AI创造营