梁文锋又冲上热搜了！他们居然又开发了新的模型！1月21日外媒曝光，梁文锋在

小茹吖 2026-01-22 22:16:39

梁文锋又冲上热搜了！他们居然又开发了新的模型！1 月 21 日外媒曝光，梁文锋在 DeepSeek 发布推理模型 R1 一周年之际，新模型 “MODEL1” 的项目名在开源社区悄然出现。整个 AI 圈都炸了。网友们刷到这条消息时，第一反应全是 “这哥真的不休息吗”。毕竟距离梁文锋带着 DeepSeek-R1 惊艳全球，才刚满一年。 R1 模型的含金量不用多说。这款参数达 685B 的大语言模型，在 2025 年初横空出世。它在 AIME 2025 数学推理测试中准确率飙到 87.5%，编程能力更是直接对标 ChatGPT 底层技术和谷歌 Gemini 3。最关键的是，R1 的训练成本仅花了 560 万美元，还不到同类美国模型的十分之一，较 Anthropic Claude 系列动辄 1 到 10 亿美元的投入形成碾压优势。我至今记得当时业内的震动，不少人都说这是中国 AI 从 “跟跑” 变 “领跑” 的标志性事件。梁文锋的狠劲不止在技术突破上。他在 R1 发布当天就做了个颠覆行业的决定。他宣布模型以 “开放权重” 形式全球开源，允许所有科研人员免费下载二次开发。这个操作直接打破了此前 AI 领域的闭源垄断格局。市场的反应更直观。R1 的发布与谷歌 TPU 芯片商业化形成协同。两者共同冲击了英伟达的行业垄断地位。英伟达股价较历史高点跌去 16%，市值蒸发超 5.6 万亿元人民币。这个数据足以说明，梁文锋带领的 DeepSeek 已经具备影响全球科技市场的核心实力。大家可能不知道，梁文锋的履历远比想象中传奇。他出身广东农村，父母都是教师。他本科和硕士都就读于浙江大学信息与电子工程学系。他早年深耕金融领域，2015 年创立幻方量化，2021 年就让公司资产管理规模突破千亿元，跻身国内量化私募 “四大天王” 之列。但他没止步于金融红利。他曾说过，“如果 AI 能预测股票，为什么不能预测更复杂的世界？” 这句话成了他转型的契机。 2023 年，梁文锋从幻方量化分拆出 DeepSeek，正式进军通用人工智能领域。他极具前瞻性地从幻方利润中投入 10 亿元打造 “萤火二号” 超级计算机，囤积了近万张英伟达 A100 显卡。这个决定在后来芯片管制加剧时，成了 DeepSeek 的核心优势。他这套 “提前囤粮” 的操作，也让外界看清了他不是投机者，而是真的想在 AI 底层技术上搞突破。更难得的是梁文锋的行事风格。他极度低调。若不是 2025 年 R1 发布当天他受邀参加国务院座谈会的画面曝光，很多人都不知道这位 “科技颠覆者” 长什么样。他还搞扁平化管理，甚至允许中学生参与核心项目。他拒绝短期商业化诱惑，一门心思扎进基础研究。这种纯粹的科研态度，在浮躁的 AI 圈显得格外珍贵。梁文锋这次冲上热搜，本质上是大家对中国 AI 技术突破的期待。从 R1 到 MODEL1，时间跨度只有一年。这种迭代速度的背后，是团队扎实的技术积累，更是梁文锋对科研本质的坚守。他用实际行动证明，中国 AI 不仅能做出顶尖技术，还能制定行业规则。未来几个月，MODEL1 的更多细节大概率会逐步曝光。整个 AI 圈都在盯着 DeepSeek 的动向。无论最终模型表现如何，梁文锋和他的团队已经给中国 AI 产业注入了强大的信心。

0 阅读：240

梁文锋又冲上热搜了！他们居然又开发了新的模型！1月21日外媒曝光，梁文锋在

我跟你讲，那个所谓的美国“斩杀线”，很多人都理解错了。它根本不是你穷得叮当响，也

美国估计要气死了，费尽心机给中国挖了个“黄金坑”，结果咱们不仅没往里跳，还顺手

中国无需急于突破EUV技术，而是集中力量攻克DUV技术，并完善整个产业链

最近海外润人群体“内讧”了。起因是一个润人看到了国内的飞速进步，称赞了我们几句，

达沃斯AI圆桌论坛上，印度电子信息部长瓦伊什瑙直接硬核回怼，被暗指归AI第二梯队

美利坚警察的爆料，丝毫不逊色牢A资本主义，优胜劣汰，残酷性胜过国内百倍

巴铁本以为占了个大便宜，结果到手的是个带电子枷锁的铁疙瘩。想拆开武直10ME探探