被称为AI智驾下一个“必争之地”，为什么头部企业纷纷抢入？ ...

161 0 2025-1-13 09:10 发布者: 茶林黄Charlin 原作者: 赵建国中国汽车报网

站在2025新一年的起点，回顾十年以来自动驾驶的发展，不难发现，是AI给自动驾驶带来了几乎划时代的转变，而一些企业已经提出，AI赋能自动驾驶的“下一步”和“唯一解”，正因如此，诸多头部企业已经开始纷纷抢入的“ ...

站在2025新一年的起点，回顾十年以来自动驾驶的发展，不难发现，是AI给自动驾驶带来了几乎划时代的转变，而一些企业已经提出，AI赋能自动驾驶的“下一步”和“唯一解”，正因如此，诸多头部企业已经开始纷纷抢入的“世界模型”（World Model）。

近日，在拉斯维加斯举办的“科技春晚”2025 CES上，全球智驾芯片领军者之一的英伟达掌门人“皮衣黄”黄仁勋发布世界模型平台Cosmos WFMs，也称Cosmos，宣布入局世界模型。

“端到端”过气了？

2024年，被称为是“端到端”的元年，包括一些造车新势力的“端到端”还没有来得及量产上车，刚刚迈过2025年门槛，行业就有声音说“端到端”过气了。且不论“过气”与否，世界模型的到来，正在为智能驾驶打开新的天地。

无论如何，行业基本认可的是，世界模型是AI智驾领域当前最关键的方向，没有之一。“至今为止，世界模型并没有统一的定义，简而言之，世界模型可以认为是用AI去模拟世界，以最为类人的思维方式去实现AI智能驾驶、机器人等对现实世界的高度智能化的学习、训练、思考和推理的工具。”西安工业大学微电子技术实验室工程师魏冬在向记者介绍，从这个意义上看，如果建立在世界模型基础上的端到端，将比现有的端到端前进一大步。

目前，一些车企正在研发和应用的自动驾驶端到端技术，比之前已经量产上车的模块化架构更为先进。“这主要体现在模块化需要大量的人工编写代码，端到端已经省却了大量的人工，而世界模型可以使端到端更‘聪明’很多。”北方大数据与人工智能研究院研究员曾文翔告诉《中国汽车报》记者，自动驾驶在模块化阶段，几乎所有的感知识别、分析预测、规划决策、控制执行等均需要人工编写代码，工作量十分庞大，因此在一定程度上也制约着自动驾驶向高级别自动驾驶技术的演进进程。到端到端阶段，理论上可以凭借AI去完成感知识别、分析预测、规划决策、控制执行等自动驾驶的过程，但实际上由于现阶段对于端到端的理论认识并不全面，对于其中的运行过程也不十分了解，存在认知的盲区，也被行业称为“黑盒”，所以不能完全将端到端应用于自动驾驶，而是采取了“端到端+”的方式，即仍然有一部分靠人工编写代码来作为自动驾驶的安全保障。到世界模型阶段，技术上则会有飞跃式的进步，基本可以依靠世界模型来实现高级别自动驾驶。

如今，业内的共识是，一旦世界模型技术成熟，自动驾驶将迎来真正的爆发。

其作用究竟如何

“世界模型应用于自动驾驶，将使现阶段的一些瓶颈问题迎刃而解。”魏冬表示，一是可以‌生成逼真的驾驶场景‌，世界模型可以生成逼真的驾驶场景视频，这些视频能够用于训练机器人和自动驾驶汽车。例如，通过输入一段描述雨天的文本，世界模型可以生成出逼真的雨天驾驶场景视频，使开发者能够在虚拟环境中进行训练和测试‌；二是可以降低训练成本‌，世界模型生成的逼真视频，成本比使用传统数据方式低很多。传统的数据采集和处理过程相对成本更为高昂，而世界模型能够以较低的成本生成高质量的训练数据，从而降低自动驾驶系统的开发成本‌。三是可以‌实现数据闭环‌，在自动驾驶系统中，数据闭环是指从数据采集到存储、挖掘、标注、模型训练，再到仿真验证和集成部署的整个开发工作流。世界模型有助于高效、准确实现这一闭环，提高数据处理的效率和准确性，加速自动驾驶系统的迭代和优化‌。四是可以实现‌自动驾驶的整个流程，从感知、预测、规划，以及观察、描述、动作之间可实时无缝转换。有了世界模型，端到端才有了更可靠的保障，并具备提升的潜力。

事实上，即使已经进入AI助力阶段，现阶段的智能驾驶系统的发展，依然需要大量采集数据进行训练，但实车采集数据、人工标注的费用却在水涨船高，况且，能够满足训练要求的实际场景的数据量仍然不足，尤其是一些非常罕见和极端的情况基本无法采集。“世界模型可以借助高度流畅的视频生成技术，以及语言描述的常见场景和极端场景来创建驾驶场景，从而降低成本。”曾文翔表示，由此可见，只要是把知道和想象到的场景“告诉”世界模型，都能生成可以满足训练自动驾驶需求的场景，从而不断加速提升自动驾驶系统的迭代，也会提升自动驾驶系统的安全和可靠性能。

实验显示，目前的世界模型中，有的已经能够在0.1秒内推演出216种可能发生的轨迹，从而寻找最佳决策。

正在成为"必争之地"

世界模型能够“聪明”、快速、高效生成自动驾驶所需要的视频，既离不开高算力芯片、软件等方面的支持，也离不开汽车智能化相关技术的基础。因此，英伟达、谷歌、特斯拉等头部企业，都是带着自己的优势及眼光，积极抢入这一前景无限的新赛道。世界模型，正在成为AI智驾下一个“必争之地”。

此次2025 CES上，英伟达推出的世界基础模型平台Cosmos，能够生成海量逼真的、基于物理的合成数据，可用于训练和评估自动驾驶汽车、机器人等物理AI系统。英伟达透露，已经有包括Wayve、Uber等在内的多家企业开始试用Cosmos，用于从视频搜索和策划到为自动驾驶汽车构建AI模型。黄仁勋表示，自动驾驶将可能成为第一个价值数万亿美元的产业，而这都离不开对芯片的需求。

与此同时，谷歌DeepMind也在积极布局世界模型。DeepMind发布的世界模型平台Genie，可模拟虚拟世界以及逼真的动画和物理效果，并支持所有这些元素之间的交互。用户可以使用Genie创建包括自动驾驶在内的各种场景，可以使用文本、图像或两者的组合来提示Genie平台使其生成视频。

早在2023年，特斯拉自动驾驶就已经在应用世界模型训练自动驾驶。世界模型可以通过以前的视频片段和行动提示，生成“可能的未来”的全新视频。

而Uber参与投资的英国自动驾驶公司Wayve也在2023年发布了世界模型GAIA-1，它可以依靠视频、文本和动作的输入生成逼真的视频，能够生成分钟级的视频以及多种合理的未来场景，帮助自动驾驶模型的训练和仿真。

数年之前，掌上电脑创始人杰夫·霍金斯在《千脑智能》中，曾提出了“世界模型”的概念。至今，日新月异的AI、迅速走向前台的世界模型，都为自动驾驶等领域打开了一个全新世界的窗口，昭示着智能出行的“第三空间”正加速驶来。