智源研究院发布2026十大AI趋势:AI从“预测下一个词”迈向“预测世界状态”

世界模型成为AGI共识方向,具身智能迎来行业“出清”,多智能体系统决定应用上限——AI正从数字世界大跨步迈入物理世界
2026年1月8日,北京智源人工智能研究院发布《2026十大AI技术趋势》报告指出,人工智能演进核心正发生关键转移:从追求参数规模的语言学习,迈向对物理世界底层秩序的深刻理解与建模。
智源研究院院长王仲远表示,基础模型的竞争焦点已从“参数有多大”转变为“能否理解世界如何运转”。“我们正从‘预测下一个词’跨越到‘预测世界的下一个状态’。” 这一转变标志着以Next-State Prediction(NSP)为代表的新范式,正推动AI从数字空间的“感知”迈向物理世界的“认知”与“规划”。
报告认为,2026年将是AI从数字世界迈入物理世界、从技术演示走向规模价值的关键分水岭。
01 认知范式升维:从语言学习到物理规律理解
行业共识正从语言模型转向能理解物理规律的多模态世界模型。从“预测下一个词”到“预测世界下一状态”,NSP范式标志着AI开始掌握时空连续性与因果关系。
世界模型成为AGI共识方向。以智源“悟界”多模态世界模型为代表的技术验证了这一路径,推动AI从感知走向真正的认知与规划。这一转变使得AI开始学习物理规律,为自动驾驶仿真、机器人训练等复杂任务提供全新的“认知”基础。
高质量真实数据面临枯竭,合成数据正成为模型训练的核心燃料。“修正扩展定律”为其提供了理论支撑。在自动驾驶和机器人领域,由世界模型生成的合成数据,将成为降低训练成本、提升性能的关键资产。
02 智能形态变革:从软件实体到社会化协同
智能形态正经历“实体化”与“社会化”双重变革。智能体从软件走向实体,从单体走向协同。
具身智能迎来行业“出清”,产业应用迈入广泛工业场景。具身智能正脱离实验室演示,进入产业筛选与落地阶段。随着大模型与运动控制、合成数据结合,人形机器人将于2026年突破Demo,转向真实的工业与服务场景。
多智能体系统决定应用上限,Agent时代的“TCP/IP”初具雏形。复杂问题的解决依赖多智能体协同。随着MCP、A2A等通信协议趋于标准化,智能体间拥有了通用“语言”。多智能体系统将突破单体智能天花板,在科研、工业等复杂工作流中成为关键基础设施。
03 应用价值兑现:从幻灭低谷到V型反转
产业应用正滑向“幻灭低谷期”,但预计2026下半年将迎来“V型”反转。企业级AI应用在经历概念验证热潮后,因数据、成本等问题步入低谷期。但随着数据治理与工具链成熟,一批真正可衡量价值的MVP产品将在垂直行业规模落地。
在消费端,一个“All in One”的超级应用入口正在形成。海外以OpenAI的ChatGPT与Google Gemini为引领,通过深度集成各类服务,塑造了一体化智能助手的新范式;国内字节、阿里、蚂蚁等依托生态积极布局。
AI在科研中的角色正从辅助工具升级为自主研究的“AI科学家”。科学基础模型与自动化实验室的结合,将极大加速新材料与药物研发。报告强调,我国需整合力量,加快构建自主的科学基础模型体系。
04 技术瓶颈突破:推理优化与安全防护并进
推理优化远未触顶,“技术泡沫”是假命题。推理效率仍是AI大规模应用的核心瓶颈与竞争焦点。通过算法创新与硬件变革,推理成本持续下降,能效比不断提升。这使得在资源受限的边缘端部署高性能模型成为可能,是AI普惠的关键前提。
为打破算力垄断与供应风险,构建兼容异构芯片的软件栈至关重要。繁荣的算子语言与趋于收敛的编译器技术正在降低开发门槛。以智源FlagOS为代表的平台,致力于构建软硬解耦、开放普惠的AI算力底座。
AI安全风险已从“幻觉”演变为更隐蔽的“系统性欺骗”。技术上,Anthropic的回路追踪研究致力于从内部理解模型机理;OpenAI推出自动化安全研究员。产业上,安全水位成为落地生死线。
2026年将是AI从数字世界迈入物理世界、从技术演示走向规模价值的关键分水岭。随着世界模型、具身智能和多智能体系统等技术的成熟,人工智能正从单纯的工具转变为能够理解和预测物理世界规律的智能伙伴。
智源研究院的报告为未来一年的技术探索与产业布局提供了清晰锚点,人工智能正在稳健地迈向价值兑现的新阶段。
