AI能写万字文章,却一句话都看不懂自己在写什么
很多人觉得ChatGPT、文心一言真的在"思考",甚至把它们当"搜索引擎升级版"用。
说实话,这有点高估它们了。
OpenAI初代GPT论文写得明明白白:大模型本质上就是个超级概率计算器,没有理解力,更谈不上思考。 能写万字长文,只是因为它把"文字接龙"玩到了极致。
今天把这层窗户纸捅破,看看AI怎么"一本正经胡说八道"。
第一层:大模型的唯一工作,就是猜下一个字
不管宣传多玄乎,回归代码层面,大模型的任务简单到令人发指:
根据上文,算下一个字(Token)出现的概率。
输入"今天天气真",模型后台开始算:
"好"的概率:35%
"不错"的概率:20%
"烂"的概率:15%
...其余词瓜分剩下的30%
然后按概率分布挑一个接上。
接完"今天天气真好",再以这五字为上下文,算第六个字的概率。
周而复始,直到凑够字数或遇到停止符。
这就是"自回归"(Autoregressive)模型。
它不关心语义真假,只关心在人类文本库里,这个词跟前文放一起顺不顺眼。
AI写文章的过程,跟你手机键盘的"智能联想"一模一样,只是词汇量翻了几万亿倍,算得比你快几百万倍。
第二层:没有逻辑,没有常识,只是高级复读机
既然靠概率接龙,AI怎么看起来"懂"那么多?
因为它啃完了全网几乎所有的书、文章、代码、对话,把人类语言的排列规律摸透了。
问它"先有鸡还是先有蛋",它能写千字长文。这不是因为它思考了进化论,而是训练数据里:
"先有鸡"后接"还是先有蛋"概率极高;
"进化论"后接"自然选择"概率极高;
"蛋壳"后接"碳酸钙"概率极高。
它把这些高概率词组按语法拼起来,就像个熟读兵法的厨子照菜谱炒菜——看着像大厨手艺,其实只是步骤熟练。
它脑子里没有"鸡→进化→蛋"的因果链,只有"这些词经常一起出现"的统计规律。
这就导致致命弱点:常识缺失,逻辑断裂。
你让它算"小明5个苹果吃2个买3个剩几个",可能对,因为这题网上太多。但稍微改个需要生活推理的:"下雨天要不要给鱼打伞",它可能胡扯:"雨水酸性,为保护鱼鳞不被腐蚀,建议用荷叶遮挡。"
听着专业,实则荒谬——概率正确,逻辑全错。
第三层:跳出训练集,必出"幻觉"
最坑人的是"幻觉"(Hallucination)。
遇到训练数据里少见或没有的问题,AI不会说"我不知道"——程序设定它必须接词。
这时候怎么办?瞎编。
问它"2024年诺贝尔物理学奖得主",诚实的AI该说"暂无信息"。但大模型大概率编个"约翰·史密斯",捏造量子计算贡献,甚至伪造论文题目。
为什么?因为在它概率世界里,"诺贝尔奖得主是某某"这个句式本身概率极高。至于人是否真实、事是否靠谱,它完全不care——它只玩文字游戏,不分真假。
律师用它查法条被罚、学生用它写论文翻车,都是这原因:它分不清事实还是段子,只会把"像那么回事"的词凑一起。
能模仿鲁迅文风,但写不出《狂人日记》;能背代码,但造不出改变世界的App;能聊人生哲学,但下一秒可能告诉你"太阳西升,因地轴反转"。
它不是在骗你,是根本不知道什么叫真假,眼里只有"这个词接那个词像不像人话"。
所以,别神化AI。把它当检索增强型计算器就好——整理格式、润色文案、提供灵感,但别让它替你决策,更别轻信它的每一个"事实"。
最后我想问一下大家,你有没有遇过AI满嘴跑火车、编造事实的情况?它是怎么忽悠你的?评论区说出来让大家避避雷。
信源参考:
OpenAI《Language Models are Few-Shot Learners》(GPT-3论文)
Ian Goodfellow《Deep Learning》
Google Research《Survey of Hallucination in NLP》


