I圈节前放大招！DeepSeek刚发布的V3.2-Exp模型直接把行业成本底线拉

I圈节前放大招！DeepSeek刚发布的V3.2-Exp模型直接把行业成本底线拉到新高度——缓存命中场景输入成本仅$0.07/百万token，较上一代降幅超50%，输出成本同步砍至$0.16/百万token，高缓存场景综合成本直降70%-80%。更狠的是671B参数规模不变，却靠全新稀疏注意力（DSA）实现质的飞跃：长文本推理速度快2-3倍，内存占用少30%-40%，训练效率直接提升50%！

性能更是不降反升：MMLU-Pro保持85.0分满血水准，数学推理AIME 2025反而涨0.9分至89.3，Codeforces编程竞赛 rating狂加75分突破2121。128K超长上下文+华为昇腾0Day适配，128K序列下TTFT＜2秒、TPOT＜30毫秒，推理代码全开源，Hugging Face可直接下载。

一边是成本腰斩，一边是效率翻倍，还能无缝对接华为云Flexus平台，兼容OpenAI API格式。这波操作，是要把大模型从"奢侈品"变成家家能用的"日用品"？开发者速冲，附性能对比表👇 AI大模型技术突破

泡泡资讯网

I圈节前放大招！DeepSeek刚发布的V3.2-Exp模型直接把行业成本底线拉

热门分类