DeepSeekV4发布
终于来了!DeepSeekV4 预览版本正式发布。
DeepSeek-V4 有百万字超长上下文,模型按大小分为两个版本,一个是 pro,一个是 flash。
在设计上,DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention)。
官方宣布:「从现在开始,1M(一百万)上下文将是 DeepSeek 所有官方服务的标配。」
V4 发布时,DeepSeek 在官方公众号写了一段“写在后面的话”: “不诱于誉,不恐于诽,率道而行,端然正己”。
这句荀子的古训,也许是对这场全球围观的最贴合回应。
308_IO人工智能
