AI能写万字文章，却一句话都看不懂自己在写什么很多人觉得ChatGPT、文心

AI能写万字文章，却一句话都看不懂自己在写什么

很多人觉得ChatGPT、文心一言真的在"思考"，甚至把它们当"搜索引擎升级版"用。

说实话，这有点高估它们了。

OpenAI初代GPT论文写得明明白白：大模型本质上就是个超级概率计算器，没有理解力，更谈不上思考。能写万字长文，只是因为它把"文字接龙"玩到了极致。

今天把这层窗户纸捅破，看看AI怎么"一本正经胡说八道"。

第一层：大模型的唯一工作，就是猜下一个字

不管宣传多玄乎，回归代码层面，大模型的任务简单到令人发指：

根据上文，算下一个字（Token）出现的概率。

输入"今天天气真"，模型后台开始算：

"好"的概率：35%

"不错"的概率：20%

"烂"的概率：15%

...其余词瓜分剩下的30%

然后按概率分布挑一个接上。

接完"今天天气真好"，再以这五字为上下文，算第六个字的概率。

周而复始，直到凑够字数或遇到停止符。

这就是"自回归"（Autoregressive）模型。

它不关心语义真假，只关心在人类文本库里，这个词跟前文放一起顺不顺眼。

AI写文章的过程，跟你手机键盘的"智能联想"一模一样，只是词汇量翻了几万亿倍，算得比你快几百万倍。

第二层：没有逻辑，没有常识，只是高级复读机

既然靠概率接龙，AI怎么看起来"懂"那么多？

因为它啃完了全网几乎所有的书、文章、代码、对话，把人类语言的排列规律摸透了。

问它"先有鸡还是先有蛋"，它能写千字长文。这不是因为它思考了进化论，而是训练数据里：

"先有鸡"后接"还是先有蛋"概率极高；

"进化论"后接"自然选择"概率极高；

"蛋壳"后接"碳酸钙"概率极高。

它把这些高概率词组按语法拼起来，就像个熟读兵法的厨子照菜谱炒菜——看着像大厨手艺，其实只是步骤熟练。

它脑子里没有"鸡→进化→蛋"的因果链，只有"这些词经常一起出现"的统计规律。

这就导致致命弱点：常识缺失，逻辑断裂。

你让它算"小明5个苹果吃2个买3个剩几个"，可能对，因为这题网上太多。但稍微改个需要生活推理的："下雨天要不要给鱼打伞"，它可能胡扯："雨水酸性，为保护鱼鳞不被腐蚀，建议用荷叶遮挡。"

听着专业，实则荒谬——概率正确，逻辑全错。

第三层：跳出训练集，必出"幻觉"

最坑人的是"幻觉"（Hallucination）。

遇到训练数据里少见或没有的问题，AI不会说"我不知道"——程序设定它必须接词。

这时候怎么办？瞎编。

问它"2024年诺贝尔物理学奖得主"，诚实的AI该说"暂无信息"。但大模型大概率编个"约翰·史密斯"，捏造量子计算贡献，甚至伪造论文题目。

为什么？因为在它概率世界里，"诺贝尔奖得主是某某"这个句式本身概率极高。至于人是否真实、事是否靠谱，它完全不care——它只玩文字游戏，不分真假。

律师用它查法条被罚、学生用它写论文翻车，都是这原因：它分不清事实还是段子，只会把"像那么回事"的词凑一起。

能模仿鲁迅文风，但写不出《狂人日记》；能背代码，但造不出改变世界的App；能聊人生哲学，但下一秒可能告诉你"太阳西升，因地轴反转"。

它不是在骗你，是根本不知道什么叫真假，眼里只有"这个词接那个词像不像人话"。

所以，别神化AI。把它当检索增强型计算器就好——整理格式、润色文案、提供灵感，但别让它替你决策，更别轻信它的每一个"事实"。

最后我想问一下大家，你有没有遇过AI满嘴跑火车、编造事实的情况？它是怎么忽悠你的？评论区说出来让大家避避雷。

信源参考：

OpenAI《Language Models are Few-Shot Learners》（GPT-3论文）

Ian Goodfellow《Deep Learning》

Google Research《Survey of Hallucination in NLP》

泡泡资讯网

AI能写万字文章，却一句话都看不懂自己在写什么很多人觉得ChatGPT、文心

热门分类

AI能写万字文章，却一句话都看不懂自己在写什么 很多人觉得ChatGPT、文心

猜你喜欢

热门分类

AI能写万字文章，却一句话都看不懂自己在写什么很多人觉得ChatGPT、文心