[LG]《ArtificialPhantasia:Evidencefor

爱生活爱珂珂 2025-10-06 06:59:46

[LG]《Artificial Phantasia: Evidence for Propositional Reasoning-Based Mental Imagery in Large Language Models》M McCarty, J Morales [Northeastern University] (2025)

人工幻象:大型语言模型具备基于命题推理的“心象”能力?

近期研究《Artificial Phantasia》探讨了大型语言模型(LLMs)是否能完成传统认知心理学中被认为必须依赖视觉心象的任务。研究设计了一个经典的“物体重构任务”:根据3-5步文字指令,想象字母与简单图形的变化,最终识别并命名构建出的物体。此任务传统观点认为,只有视觉心象才能完成,单靠语言无法实现。

🔍 研究亮点:

- 采用了48个全新设计的题目,确保不在模型训练数据内,避免数据泄露。

- 100名人类参与者完成同样任务,建立基线表现,平均正确率约54.7%。

- 多款顶尖LLM测试结果显示,OpenAI的o3系列和GPT-5显著超越人类表现(提升9.4%-12.3%,p

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注