梁文锋又冲上热搜了!他们居然又开发了新的模型!1月21日外媒曝光,梁文锋在

小茹吖 2026-01-22 22:16:39

梁文锋又冲上热搜了!他们居然又开发了新的模型!1 月 21 日外媒曝光,梁文锋在 DeepSeek 发布推理模型 R1 一周年之际,新模型 “MODEL1” 的项目名在开源社区悄然出现。 整个 AI 圈都炸了。网友们刷到这条消息时,第一反应全是 “这哥真的不休息吗”。毕竟距离梁文锋带着 DeepSeek-R1 惊艳全球,才刚满一年。 R1 模型的含金量不用多说。这款参数达 685B 的大语言模型,在 2025 年初横空出世。它在 AIME 2025 数学推理测试中准确率飙到 87.5%,编程能力更是直接对标 ChatGPT 底层技术和谷歌 Gemini 3。 最关键的是,R1 的训练成本仅花了 560 万美元,还不到同类美国模型的十分之一,较 Anthropic Claude 系列动辄 1 到 10 亿美元的投入形成碾压优势。 我至今记得当时业内的震动,不少人都说这是中国 AI 从 “跟跑” 变 “领跑” 的标志性事件。 梁文锋的狠劲不止在技术突破上。他在 R1 发布当天就做了个颠覆行业的决定。他宣布模型以 “开放权重” 形式全球开源,允许所有科研人员免费下载二次开发。这个操作直接打破了此前 AI 领域的闭源垄断格局。 市场的反应更直观。R1 的发布与谷歌 TPU 芯片商业化形成协同。两者共同冲击了英伟达的行业垄断地位。 英伟达股价较历史高点跌去 16%,市值蒸发超 5.6 万亿元人民币。这个数据足以说明,梁文锋带领的 DeepSeek 已经具备影响全球科技市场的核心实力。 大家可能不知道,梁文锋的履历远比想象中传奇。他出身广东农村,父母都是教师。他本科和硕士都就读于浙江大学信息与电子工程学系。 他早年深耕金融领域,2015 年创立幻方量化,2021 年就让公司资产管理规模突破千亿元,跻身国内量化私募 “四大天王” 之列。 但他没止步于金融红利。他曾说过,“如果 AI 能预测股票,为什么不能预测更复杂的世界?” 这句话成了他转型的契机。 2023 年,梁文锋从幻方量化分拆出 DeepSeek,正式进军通用人工智能领域。 他极具前瞻性地从幻方利润中投入 10 亿元打造 “萤火二号” 超级计算机,囤积了近万张英伟达 A100 显卡。这个决定在后来芯片管制加剧时,成了 DeepSeek 的核心优势。 他这套 “提前囤粮” 的操作,也让外界看清了他不是投机者,而是真的想在 AI 底层技术上搞突破。 更难得的是梁文锋的行事风格。他极度低调。若不是 2025 年 R1 发布当天他受邀参加国务院座谈会的画面曝光,很多人都不知道这位 “科技颠覆者” 长什么样。 他还搞扁平化管理,甚至允许中学生参与核心项目。他拒绝短期商业化诱惑,一门心思扎进基础研究。这种纯粹的科研态度,在浮躁的 AI 圈显得格外珍贵。 梁文锋这次冲上热搜,本质上是大家对中国 AI 技术突破的期待。从 R1 到 MODEL1,时间跨度只有一年。 这种迭代速度的背后,是团队扎实的技术积累,更是梁文锋对科研本质的坚守。他用实际行动证明,中国 AI 不仅能做出顶尖技术,还能制定行业规则。 未来几个月,MODEL1 的更多细节大概率会逐步曝光。整个 AI 圈都在盯着 DeepSeek 的动向。 无论最终模型表现如何,梁文锋和他的团队已经给中国 AI 产业注入了强大的信心。

0 阅读:240
小茹吖

小茹吖

感谢大家的关注