I圈节前放大招!DeepSeek刚发布的V3.2-Exp模型直接把行业成本底线拉到新高度——缓存命中场景输入成本仅$0.07/百万token,较上一代降幅超50%,输出成本同步砍至$0.16/百万token,高缓存场景综合成本直降70%-80%。更狠的是671B参数规模不变,却靠全新稀疏注意力(DSA)实现质的飞跃:长文本推理速度快2-3倍,内存占用少30%-40%,训练效率直接提升50%! 性能更是不降反升:MMLU-Pro保持85.0分满血水准,数学推理AIME 2025反而涨0.9分至89.3,Codeforces编程竞赛 rating狂加75分突破2121。128K超长上下文+华为昇腾0Day适配,128K序列下TTFT<2秒、TPOT<30毫秒,推理代码全开源,Hugging Face可直接下载。 一边是成本腰斩,一边是效率翻倍,还能无缝对接华为云Flexus平台,兼容OpenAI API格式。这波操作,是要把大模型从"奢侈品"变成家家能用的"日用品"?开发者速冲,附性能对比表👇 AI大模型 技术突破
I圈节前放大招!DeepSeek刚发布的V3.2-Exp模型直接把行业成本底线拉
南方的小猴子
2025-09-30 09:40:07
0
阅读:1