笑死了,之前刁难AI的问题里面就有这个经典的:英文单词“strawberry”里面有几个“r”?结果一堆AI答错了……现在阿里“千问”正式入局AI to C,而行业却迎来了一场最基础的能力测试。9.11与9.8的大小比较,草莓单词中“r”的数量——这些看似简单的问题,恰恰成了检验AI理解与推理能力的试金石。当大模型们在这些基础关卡上暴露出短板,也提醒我们:人工智能的进化,依然需要从最根本的逻辑与常识筑底。

笑死了,之前刁难AI的问题里面就有这个经典的:英文单词“strawberry”里面有几个“r”?结果一堆AI答错了……现在阿里“千问”正式入局AI to C,而行业却迎来了一场最基础的能力测试。9.11与9.8的大小比较,草莓单词中“r”的数量——这些看似简单的问题,恰恰成了检验AI理解与推理能力的试金石。当大模型们在这些基础关卡上暴露出短板,也提醒我们:人工智能的进化,依然需要从最根本的逻辑与常识筑底。

作者最新文章
热门分类
社会TOP
社会最新文章