1. 首页 > 人工智能

世界模型争夺战:物理AI核心,英伟达、特斯拉、北京人形竞相布局

作者:小小 更新时间:2025-11-03
摘要:世界模型正成为物理AI的竞争焦点,特斯拉世界模拟器可实现“1天吸收人类500年驾驶经验”,而英伟达Omniverse与北京人形开源平台正构建完整生态。2025年GTC大会上,黄仁勋阐释了如何通过Omniverse数字孪生技术训练机器人,将世界模型视为实现物理,世界模型争夺战:物理AI核心,英伟达、特斯拉、北京人形竞相布局

 

世界模型正成为物理AI的竞争焦点,特斯拉世界模拟器可实现“1天吸收人类500年驾驶经验”,而英伟达Omniverse与北京人形开源平台正构建完整生态。

2025年GTC大会上,黄仁勋阐释了如何通过Omniverse数字孪生技术训练机器人,将世界模型视为实现物理人工智能的关键。短短数月后,特斯拉于10月26日发布自研神经网络世界模型(World Simulator),演示了机器人在3D合成环境中自主训练的能力。

世界模型与传统AI模型的根本区别在于,它通过大量数据学习现实世界的物理规则,实施因果推理,从而预测和生成合乎现实规律的未来。正如黄仁勋所言,物理AI能够理解摩擦力、惯性、因果关系等概念,这将推动AI从数字世界向物理世界渗透。

01 概念界定:世界模型如何理解物理规则

世界模型与传统AI模型的本质差异在于其学习机制和目标。传统AI模型主要通过可获取的语言、图像及视频来理解现实场景,而世界模型则是通过大量数据学习现实世界的物理规则,实施因果推理,从而预测、生成合乎现实规律的未来。

世界模型的终极目标是训练人工智能适应现实世界而非理论世界,让AI进化为真正的物理AI。正如图灵奖得主、Meta首席AI科学家杨立昆所言:“我们不是在造会说话的机器人,而是在造会思考的物理实体。”

黄仁勋在GTC演讲中对物理AI给出了明确界定:它是“AI技术与物理世界深度交互的应用形态,核心是通过数字孪生、实时感知与自主决策,实现对实体系统的精准控制与效率优化”。世界模型正是实现这一目标的核心技术路径。

特斯拉自动驾驶副总裁Ashok Elluswamy在ICCV 2025的演讲中进一步阐释,世界模型能够根据当前状态和下一步行动来合成未来状态,这样的状态可以与智能体或策略AI模型连接起来,以闭环方式运行,从而评估性能。

02 技术价值:为何世界模型成为必争之地

世界模型引得人工智能先驱们竞相发力的核心原因在于其解决了具身智能的根本问题。宇树科技CEO王兴兴曾强调:“之所以目前机器人还未能达到智能,现在最大的问题是模型问题,而不是数据问题。”

根据弗若斯特沙利文发布的《2025年中国世界模型发展白皮书》,具身智能代表着AI从纯粹的信息处理转向物理世界的交互,其所需的数据需要整合文本指令、多视角视觉、物理交互等多维信号,复杂度远超纯文本或单一视觉模态。

世界模型能生成视觉逼真、物理精确的合成数据,有效克服传统仿真数据与真实世界之间的差异。据该机构统计,当前超过80%自动驾驶算法使用世界模型进行辅助训练,推动自动驾驶系统持续学习、自主验证并快速迭代优化。

东吴证券指出,作为具身智能的大脑,AI模型的技术路线仍处在探索阶段,并且成为了机器人等终端产品大规模应用的最大瓶颈。世界模型代表具身智能算法层最前沿的探索方向,预计具身智能大脑市场会成为市场里发展最快、技术难度最高的环节。

03 巨头布局:从英伟达到特斯拉的技术路径

在世界模型领域,英伟达和特斯拉分别代表了两种不同的技术路径和战略布局。

英伟达通过Omniverse数字孪生平台构建世界模型基础架构。黄仁勋在GTC大会上宣布,Omniverse与物理AI结合,通过数字孪生技术模拟物理世界,加速机器人训练与测试。英伟达还推出了开源人形机器人基础模型Isaac GR00T N1,支持双系统认知(慢思考规划+快思考执行),可迁移至工业制造场景。

特斯拉则走了一条更为激进的端到端路线。特斯拉发布的World Simulator可在1天内吸收相当于人类500年的驾驶经验,并生成高度逼真的驾驶场景,用于自动驾驶与人形机器人Optimus的训练与测试。特斯拉自动驾驶副总裁Ashok Elluswamy明确表示:“端到端才是智能驾驶的未来”。

两家公司的技术路径反映了不同的理念:英伟达注重构建完整的开发生态,而特斯拉则追求端到端的整体优化。Ashok Elluswamy指出,端到端方法具有多项优势:将人类价值观规则化极其困难,但从数据中学习则容易;端到端中梯度从控制一直流向传感器输入,从而整体优化整个网络;可轻松扩展以处理现实世界机器人的繁重和长尾问题。

04 中国进展:从闭门研发到开源生态

中国在世界模型领域正从跟跑者向并跑者转变,开源生态建设成为突出特点。

北京人形机器人创新中心联合优必选正式开放通用具身智能平台“慧思开物”SDK,标志着以开源开放为核心的具身智能生态建设迈入新阶段。随后,北京人形推出开源具身世界模型WoW,帮助更多具身智能机器人快速学习掌握各项技能。

中国科学院自动化研究所研究员王飞跃评价道:“开源是具身智能产业化的关键催化剂。北京人形的‘平台+模型’双开源策略,相当于为行业提供了‘操作系统+大脑’的基础设施,这将吸引更多开发者参与创新,形成技术迭代正循环”。

宇树科技开源了UnifoLM-WMA-0世界模型架构,为未来与更复杂模型的融合预留了工程接口。智元机器人发布了行业首个机器人世界模型开源平台Genie Envisioner,旨在使机器人在同一世界模型中完成从“看”到“想”再到“动”的端到端推理与执行。

湖北人形机器人创新中心发布了具身基础模型GigaBrain-0,其背后采用世界模型平台GigaWorld生成数据。成都人形机器人创新中心发布了国内首个基于世界模型的机器人任务执行系统R-WMES。这些进展显示中国在世界模型领域已形成较为完整的创新体系。

05 应用场景:从工业制造到自动驾驶

世界模型的应用正从实验室快速走向实际场景,工业制造和自动驾驶成为两大先行领域。

在北京人形的商业化案例中,自2025年9月起,“具身天工2.0”与“天轶2.0”机器人已进入福田康明斯发动机工厂,在无人生产线上自主完成料箱取放、搬运等任务。北京人形“具身天工Ultra”机器人还在李宁运动科学实验室用于跑鞋测试,通过精准模拟人类跑步姿态采集数据,解决了传统测试受个体差异限制的难题。

除北京人形外,其他企业也在推动商业化落地。优必选已在工业场景实现Walker S的批量应用;松延动力新一代人形机器人首发3个小时内销量突破200台;加速进化机器人出货量已超700台,实现全球市场交付。

在自动驾驶领域,世界模型的应用更为深入。特斯拉的世界模拟器可以生成各种挑战性场景,如右侧的车辆突然连并两条线,闯入预设的驾驶路径,也能让AI在已有的场景中执行自动驾驶任务,躲避行人和障碍物。

特斯拉方案之所以备受关注,正是因为其世界模型能够对外部真实多变的复杂环境进行动态模拟,通过虚拟推演未来场景来反向指导决策和模型优化。这种能力对于处理自动驾驶中的长尾问题至关重要。

06 挑战与展望:从技术突破到产业落地

尽管世界模型前景广阔,但其发展仍面临多重挑战,东吴证券判断世界模型的研究仍处于早期阶段。

特斯拉自动驾驶副总裁Ashok Ellusim指出,端到端自动驾驶面临“维数灾难”,以及可解释性和安全性保证的问题。在现实世界中,想让自动驾驶系统安全运行,就需要处理高帧率、高分辨率、长上下文输入,这可能导致高达20亿输入Token的处理需求。

世界模型如特斯拉的方案也面临透明度问题。尹西明解释道:“这套系统就像一个大黑箱,一旦出现问题,排查起来异常困难。此外,它对海量高质量训练数据的依赖,以及对计算资源的巨大需求,都构成了现实的技术壁垒”。

从投资视角看,国投证券建议关注三大方向:已经具备物理AI产品的国内CAE(计算机辅助工程)厂商;为世界物理模型提供技术支撑的3D感知厂商;提供工业数字孪生解决方案的厂商。

中国物联网产业协会秘书长柏斯维认为,人形机器人行业呈现三大趋势:开源生态成为竞争高地;工业场景率先规模化;软硬一体化能力决胜未来。这些趋势在世界模型领域同样适用,预示着未来竞争将更加注重生态构建和实际应用。

世界模型正成为物理AI时代的核心基础设施。当特斯拉的世界模拟器在1天内吸收人类500年驾驶经验,当英伟达Omniverse构建完整数字孪生生态,当北京人形通过开源策略加速行业创新,我们正在见证物理AI从概念走向落地的关键转折点。

世界模型的竞争本质上是物理AI时代“操作系统”的竞争。正如移动互联网时代的iOS和Android,世界模型将决定未来物理AI生态的格局和标准。