泡泡资讯网

美国的外交电报突然发往全球。白纸黑字只有一句话:警告所有国家,离那个叫DeepS

美国的外交电报突然发往全球。白纸黑字只有一句话:警告所有国家,离那个叫DeepSeek的中国模型远点。就在这份警告信满世界飞的时候,杭州的办公大楼里,DeepSeek的团队甚至连发布会都没开。他们只是在官网上默默更新了一份技术报告,V4预览版直接上线。

梁文锋,1985年出生于广东湛江,高考考进了浙江大学电子信息工程专业,2010年拿到信息与通信工程硕士学位。毕业后没有走学术路线,而是去做了量化金融。

他和几个浙大同学一起创办了幻方科技,也就是后来管理规模突破千亿元的幻方量化私募基金。外界看到的是一家金融公司,但梁文锋心里想的,早就不只是赚钱了。

2019年,幻方砸了2亿元自研深度学习训练平台"萤火一号",搭载了1100块GPU。两年后,"萤火二号"投入翻了五倍,算力扩展到约一万张英伟达A100显卡。

这在当时的中国私募圈几乎是不可思议的事情,一家量化基金,为什么要囤这么多算力?

2022年底,ChatGPT横空出世。梁文锋决定正式转向AI研究。2023年4月,幻方量化对外宣布将成立新的研究组织,探索通用人工智能。

同年7月17日,杭州深度求索人工智能基础技术研究有限公司正式注册成立,梁文锋持股84.2945%,另外三位合伙人陈哲、李欢、郑达韡均是梁文锋在浙大的同窗。

DeepSeek从来不做跟随。

梁文锋在后来接受媒体采访时说过一句话,大意是:硅谷习惯把中国AI公司看成"跟随者",当一个中国团队以真正的创新者姿态出现,而且表现还很出色,他们就不知道怎么办了。

2024年5月,DeepSeek-V2悄悄上线,API定价低到离谱——每百万tokens输入1元、输出2元,大约是GPT-4 Turbo的百分之一。

这个价格像一块石头砸进了平静的水面。字节跳动、阿里巴巴、百度、腾讯相继跟进降价,阿里云旗下通义千问的API输入价格一口气降了97%,百度则直接宣布两款模型免费。

DeepSeek由此被称为"AI界的价格屠夫",连硅谷那边都开始打听这支队伍到底是谁。

2025年1月20日,DeepSeek-R1正式发布。训练成本不足600万美元,性能对标OpenAI的顶级模型。模型开源,允许任何人下载、调用、基于其输出训练新模型。

消息传出后,DeepSeek APP在苹果美国区应用商店超越ChatGPT,登上免费榜第一。

1月27日,美股开盘,英伟达单日跌幅接近17%,市值一个交易日蒸发近6000亿美元,创下美国金融史上单一公司单日市值缩水的最高记录。

博通、AMD、微软同步下跌,连美国电力供应商的股价也没能幸免。

有人把这一天称为AI领域的"斯普特尼克时刻"。

5月6日,外媒报道DeepSeek正在进行首轮融资谈判,估值最高接近500亿美元。

钱将用于扩充算力和改善团队待遇。这支平均年龄极低、核心技术岗几乎清一色本土培养的团队,正在被全球资本、产业和政策放到聚光灯下。

美国国家标准与技术研究院下属机构在5月1日的评测中指出,DeepSeek-V4 Pro的整体能力仍比最顶尖的模型落后数月,这不是批评,是一个真实的坐标。

差距在,但方向也在。

那封外交电报现在还在飞。而杭州办公室里的那份技术报告,已经被全球开发者下载了不知多少次。