DeepSeek V4 突破,世界模型竞赛白热化

The Download: DeepSeek’s latest AI breakthrough, and the race to build world models

来源 MIT Technology Review 日期 英语原文

MIT《The Download》解读 DeepSeek 周五发布的 V4 预览版三大亮点:超长上下文、推理成本骤降、对标 GPT-5。同时全球世界模型(World Models)赛道竞争升温。

MIT Technology Review 周一在《The Download》新闻通讯中重点解读两条 AI 行业要闻。

DeepSeek V4 的三个关键意义:

  1. 上下文能力跃升:V4 预览版处理 prompt 的长度大幅延伸, 据 DeepSeek 团队披露已能稳定处理百万 token 级别输入
  2. 推理成本继续下探:V4 在保持顶级性能的同时,单 token 推理成本 据估算比 GPT-4o 低 70% 以上,延续 DeepSeek 一贯的「极致性价比」路线
  3. 架构创新公开:DeepSeek 同步发布技术报告,详细公开了 V4 的 MoE 路由策略和 KV cache 压缩方法,为开源社区提供研究素材

世界模型成为下一个战场:

DeepMind(Genie 系列)、Wayve(自动驾驶)、Runway(视频生成)、WorldLabs(李飞飞团队)以及国内的智源研究院都在竞争「世界模型」——可以在不显式编程下理解物理规律的模型。MIT 评估,世界模型可能是通向 AGI 的下一阶段关键技术。

对 AI 行业的影响

DeepSeek V4 是中国 AI 第一次在前沿赛道上保持节奏的标志。 此前 DeepSeek-R1 已经证明了中国团队在低成本 reasoning 上可以与顶级实验室比肩,V4 进一步把「百万 token + 极低成本」组合做到了世界一线。这对 OpenAI、Anthropic 的定价策略形成实质压力。

世界模型可能改变多个行业的格局。 自动驾驶(Wayve)、机器人(DeepMind)、游戏与影视(Runway、WorldLabs)都将被世界模型重塑。中国厂商在自动驾驶(小鹏、华为)和游戏(米哈游、网易)方面有数据优势,若能与世界模型路线结合,存在弯道超车机会。

MoE + 长上下文是 2026 年的胜负手。 多家头部团队在这两个方向同时发力,下半年可能看到 GPT-5、Claude 4.7、Gemini 3 等同步发布百万级上下文版本。


原文参考

来源:MIT Technology Review · 2026-04-27

This is today’s edition of The Download, our weekday newsletter that provides a daily dose of what’s going on in the world of technology. Three reasons why DeepSeek’s new model matters On Friday, Chinese AI firm DeepSeek released a preview of V4, its long-awaited new flagship model. Notably, the model can process much longer prompts…