DeepSeek V4 突破，世界模型竞赛白热化

MIT Technology Review 周一在《The Download》新闻通讯中重点解读两条 AI 行业要闻。

DeepSeek V4 的三个关键意义：

上下文能力跃升：V4 预览版处理 prompt 的长度大幅延伸，据 DeepSeek 团队披露已能稳定处理百万 token 级别输入
推理成本继续下探：V4 在保持顶级性能的同时，单 token 推理成本据估算比 GPT-4o 低 70% 以上，延续 DeepSeek 一贯的「极致性价比」路线
架构创新公开：DeepSeek 同步发布技术报告，详细公开了 V4 的 MoE 路由策略和 KV cache 压缩方法，为开源社区提供研究素材

世界模型成为下一个战场：

DeepMind（Genie 系列）、Wayve（自动驾驶）、Runway（视频生成）、WorldLabs（李飞飞团队）以及国内的智源研究院都在竞争「世界模型」——可以在不显式编程下理解物理规律的模型。MIT 评估，世界模型可能是通向 AGI 的下一阶段关键技术。

对 AI 行业的影响

DeepSeek V4 是中国 AI 第一次在前沿赛道上保持节奏的标志。 此前 DeepSeek-R1 已经证明了中国团队在低成本 reasoning 上可以与顶级实验室比肩，V4 进一步把「百万 token + 极低成本」组合做到了世界一线。这对 OpenAI、Anthropic 的定价策略形成实质压力。

世界模型可能改变多个行业的格局。 自动驾驶（Wayve）、机器人（DeepMind）、游戏与影视（Runway、WorldLabs）都将被世界模型重塑。中国厂商在自动驾驶（小鹏、华为）和游戏（米哈游、网易）方面有数据优势，若能与世界模型路线结合，存在弯道超车机会。

MoE + 长上下文是 2026 年的胜负手。 多家头部团队在这两个方向同时发力，下半年可能看到 GPT-5、Claude 4.7、Gemini 3 等同步发布百万级上下文版本。

原文参考

来源：MIT Technology Review · 2026-04-27

This is today’s edition of The Download, our weekday newsletter that provides a daily dose of what’s going on in the world of technology. Three reasons why DeepSeek’s new model matters On Friday, Chinese AI firm DeepSeek released a preview of V4, its long-awaited new flagship model. Notably, the model can process much longer prompts…