标签: cuda
2026年4月,一个名叫梁文锋的广东湛江80后,让硅谷大佬们集体睡不着觉了。
2026年4月,一个名叫梁文锋的广东湛江80后,让硅谷大佬们集体睡不着觉了。他带领的DeepSeek团队,干了一件近乎“疯狂”的事,花了五个月时间,把1.6万亿参数的大模型底层代码,硬生生从英伟达的CUDA迁移到了华为昇腾架构上。这不是小修小补,是全栈重写。一位参与迁移的工程师打了个比喻:“难度大概相当于在飞机飞行过程中,把发动机拆下来换掉。”整个工程重写了40万行算子,精度对齐误差控制在0.5%以内。这么多年,大家都觉得离了英伟达的芯片就玩不转AI。美国守着算力这张底牌,以为谁也翻不了天。梁文锋偏不信这个邪。他直接拉上华为和国内另外七家芯片厂商,模型和国产芯片同步研发、同步上线。从CUDA到CANN,从跟随到领跑,这一换,直接把美国守了十几年的算力底牌撕开了一道口子。黄仁勋是真的坐不住了。他在媒体访谈中罕见发飙,当众反驳“芯片是浓缩铀不该出口给中国”的说法,警告过度限制,只会逼中国建立完整的自主生态。这话翻译过来就是:你们再逼下去,他们真不用我们了。而事实确实如此。DeepSeekV4适配的华为昇腾950PR芯片,单卡算力是英伟达对华特供版H20的2.87倍,采购价格却只有H200的三分之一到四分之一。消息一出,阿里巴巴、字节跳动、腾讯等大厂立刻向华为追加了数十万颗昇腾芯片订单。最狠的是,梁文锋压根不给资本指手画脚的机会。他直接和间接持有公司约84.29%的股权,拥有几乎100%的表决权。别人融资是为钱低头,他是让资本陪跑。有人说他是“比任正非更危险的男人”,也有人说他冒着自己沦为二流大模型的风险,给中国AI趟路。但他只说了一句大实话:“别人的地基再稳,也不如自己的踏实。”从通信到AI,从任正非到梁文锋,中国人被卡脖子的地方,迟早要长出自己的力量。这条路,已经趟出来了。欢迎大家点赞、评论、转发,让更多人看到!
DeepSeek-V4刷屏之后,模型本身的肌肉数值是符合预期的,仍然占据着开源阵
DeepSeek-V4刷屏之后,模型本身的肌肉数值是符合预期的,仍然占据着开源阵营里的头部位置,但跟跑分比起来,更值得关注的,其实是所谓的地基。好像也就是前几个月,黄仁勋说哪怕对手免费出售芯片也撼动不了英伟达的市场优势,言外之意,就是CUDA生态已经成为行业公认的几乎唯一水源了,猴头可以蹦跶,但一定跳不出五指山。然后就有了DeepSeek-V4,一个万亿参数级别的模型,训练推理全流程都跑在纯国产算力上,CUDA在这个量级里从头到脚被完整替代,还是头一回。可以去看一下UP主GenJi最新一期用可视化动图做的视频,让小白也能轻松看懂DeepSeek升级的来龙去脉,国产模型试着丢掉拐杖自己迈出去第一步,从「炸裂」程度上讲,V4不论跟V3还是R1相比,都是毫不逊色的。