泡泡资讯网

DeepSeek V4预览版开源,AI成本战被重新点燃DeepSeek再次把开源

DeepSeek V4预览版开源,AI成本战被重新点燃

DeepSeek再次把开源大模型市场推到了聚光灯下。全新系列DeepSeek V4预览版正式发布,并同步开源,产品分为V4 Pro和V4 Flash两个版本。一个主打高性能、强推理和Agent能力,另一个主打速度、成本和轻量化部署。更关键的是,两款模型都支持百万级上下文窗口,并通过新的注意力机制降低显存和算力压力,这意味着长文档处理、复杂对话、多步骤任务和Agent应用的门槛正在继续下降。

从定位来看,DeepSeek V4 Pro是这次发布的旗舰模型。官方给出的方向非常明确:它要对标顶级闭源模型,在推理、世界知识、代码和Agent任务上冲击开源模型的上限。尤其在数学、STEM和竞赛型代码评测中,V4 Pro宣称已经超过目前公开评测中的开源模型,整体水平接近世界头部闭源模型。这对于开源生态来说,意义并不小,因为开源模型过去常被认为性价比高,但在最复杂任务上仍与闭源头部模型存在差距,而V4 Pro试图把这道差距继续压缩。

更值得关注的是Agent能力。现在的大模型竞争,已经从单纯聊天、问答、写作,逐渐转向能不能真正完成任务。代码生成、文档编写、工具调用、复杂项目拆解、多轮自我修正,才是企业级应用真正看重的部分。DeepSeek V4 Pro在Agentic Coding评测中已达到开源模型领先水平,并且已经成为DeepSeek内部员工使用的Agentic Coding模型。按照已有体验反馈,它在实际交付质量上优于Sonnet 4.5,接近Opus 4.6非思考模式,但与Opus 4.6思考模式仍有差距。

这说明一个信号:DeepSeek V4 Pro已经不只是能写代码,而是在向真正的AI工程助理靠近。过去很多模型在单点题目上表现不错,可一旦进入长链路任务,比如理解项目结构、连续修改文件、生成完整方案、处理复杂文档,能力就容易断层。V4 Pro如果能在Agent场景中保持稳定输出,它的价值就不局限于模型排行榜,而会直接进入开发者和企业工作流。

DeepSeek V4 Flash则是另一条路线。它的参数规模和激活规模更小,因此速度更快,成本更低,适合对延迟、价格和部署效率更敏感的场景。虽然在世界知识储备上略逊于V4 Pro,但推理能力接近旗舰版本。在简单Agent任务中,V4 Flash与V4 Pro表现相当,只有在高难度任务上才拉开差距。这种设计很现实:并非所有企业应用都需要最强模型,很多客服、文档摘要、流程自动化、轻量代码辅助和日常办公任务,更看重响应速度和调用成本。

真正改变游戏规则的,是DeepSeek V4的长上下文能力和算力效率。两款模型都支持1M token超长上下文,这意味着用户可以一次性输入更长的资料、更复杂的对话记录、更完整的代码仓库内容,也可以处理大篇幅合同、论文、财报、会议纪要和项目文档。过去长上下文往往意味着成本暴涨、显存压力上升、推理速度下降,但DeepSeek V4通过新的注意力机制,在token维度进行压缩,并结合DSA稀疏注意力技术,大幅降低计算和显存需求。

这一点对行业影响很直接。大模型如果只能处理短文本,它更像一个问答工具;当它能高效处理百万级上下文,它就更接近一个能读完整材料、理解上下文、承接复杂任务的工作系统。尤其对金融、法律、研发、咨询、教育、政企办公等行业来说,长上下文能力不再是锦上添花,而是模型能否进入真实业务场景的关键门槛。

API层面,DeepSeek V4也在降低开发者接入成本。开发者只需要将model参数切换为deepseek-v4-pro或deepseek-v4-flash即可调用,并且兼容OpenAI ChatCompletions和Anthropic两套接口标准。这种兼容性非常重要,因为它减少了迁移成本,让原本基于其他模型开发的应用,可以更快测试和接入DeepSeek V4。

DeepSeek还针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品做了专项适配和优化,尤其强调代码任务与文档生成任务的提升。这说明DeepSeek V4并不是单纯发布一个基础模型,而是已经开始围绕Agent生态做工程化适配。未来大模型竞争,很大一部分会落在生态兼容、工具协作和开发者体验上。

价格层面,这次发布也很有冲击力。OpenAI刚推出GPT-5.5,DeepSeek V4紧随其后开源上线,两者的定价策略形成鲜明对照。GPT-5.5以高价输出token模式继续维持闭源高端路线,而DeepSeek V4通过MIT许可证开源,把AI智能的成本底线继续往下压。对AI产品公司来说,这会迫使整个行业重新评估利润结构:当高能力模型越来越便宜,单纯靠模型调用差价赚钱的空间会被压缩,真正能赚钱的将是产品体验、垂直场景、数据壁垒和工程交付能力。

当然,DeepSeek V4 Pro目前也面临现实约束。由于高端算力供给有限,Pro版本当前服务吞吐能力仍然有限。DeepSeek预计,随着下半年华为昇腾950超节点批量上市,Pro版本价格有望大幅下调。昇腾CANN也将进行DeepSeek V4在昇腾平台的首发直播,这意味着国产AI模型与国产算力平台的协同正在继续加速。

这次DeepSeek V4预览版发布,真正的看点不只在于参数、榜单和跑分,更在于它把三个方向同时推到了台前:更强的Agent能力,更长的上下文窗口,更低的显存和算力需求。AI竞争已经进入工程化深水区,谁能让模型更好用、更便宜、更容易接入真实业务,谁就能在下一阶段拥有更强的生态话语权。

DeepSeek V4的出现,意味着开源大模型继续逼近闭源模型的核心能力区间。对于开发者,这是一次降低门槛的机会;对于企业,这是一次重新核算AI应用成本的契机;对于整个行业,这则是一次更明确的提醒:大模型的竞争正在从炫技走向落地,从参数走向效率,从聊天走向真正能干活的Agent时代。DeepSeek v4 百万上下文