# 刘知远:AI正从大模型向智能体跃迁,专业智能体与多智能体协作将开启群体智能新时代
在2025外滩大会“智能体时代进化论”分论坛上,清华大学长聘副教授、面壁智能首席科学家刘知远,以“AI能力图谱”为起点,系统剖析了人工智能从“知识大脑”(大模型)向“行动者”(智能体)跃迁的必然趋势,并深入拆解了“专业智能体”的三大核心挑战与“多智能体系统”的协作难题,为行业勾勒出下一代AI发展的清晰路径。
## 一、AI能力图谱:从“认知”到“行动”的四阶演进
刘知远提出,人工智能的核心能力可归纳为四大板块,这一“能力图谱”不仅梳理了AI的现有基础,更揭示了向智能体跃迁的逻辑起点:
### 1. 基础层:基座大模型+多模态智能(“大脑”与“感官”)
- **基座大模型**:如同AI的“大脑”,负责高效认知世界。从2018年数千万参数的小模型,到如今上万亿参数的巨量模型,其“脑容量”的扩张让AI具备了更强的知识储备与推理能力;
- **多模态智能**:相当于AI的“感官”,让AI能敏锐感知文本、图像、音频、视频等多维度信息。这一层是AI与真实世界交互的基础,也是从“虚拟认知”走向“现实行动”的前提。
### 2. 进阶层:探索能力+群体协作(“行动”与“协同”)
- **探索能力**:让AI从“被动响应”转向“主动行动”,成为能使用工具、遵循专业流程(SOP)、自主学习的“专业智能体”,例如软件开发、数据分析、机械控制等领域的专项智能体;
- **群体协作**:多个专业智能体通过高效通信与协同,形成“多智能体系统”,释放群体智能价值——这正是AI从“个体智能”迈向“群体智能”的关键。
刘知远强调:“过去5年,大模型的参数规模与认知能力持续突破,更像是‘个体智能的涌现’;而未来,AI必须进入真实世界交互,通过‘专业探索’与‘群体协作’,完成从大模型到智能体的跃迁。”
## 二、AI发展的两大方向:从人类社会演进中获取启示
刘知远巧妙借鉴社会学理论,指出AI的发展方向与人类社会的演进规律高度契合,可概括为两大核心路径:
### 1. 个体专业化:构建“岗位孪生”的专业智能体
社会学奠基人涂尔干提出“个体专业化是群体效能提升的基础”——这一规律同样适用于AI。刘知远认为,AI的首要发展方向是“专业化”:针对各行各业的特定场景,打造具备专属知识、工具使用能力与流程经验的“专业智能体”,例如:
- 工业领域的“AI质检智能体”,掌握缺陷识别算法与工业相机操作;
- 金融领域的“AI风控智能体”,熟悉信贷规则与数据建模工具;
- 医疗领域的“AI辅助诊断智能体”,能解读影像数据并遵循临床指南。
“这些专业智能体不是‘通用万能工具’,而是‘岗位孪生伙伴’,能精准解决特定领域的复杂任务。”刘知远补充道。
### 2. 协作社会化:打造高效协同的多智能体系统
马克思提出“协作社会化是生产力发展的必然结果”,而AI的协作进化也将遵循这一逻辑。随着互联网、物联网技术的成熟,AI的协作将突破“单智能体局限”,形成覆盖更广、效率更高的“多智能体系统”:
- 例如,一个“智能工厂系统”中,“生产调度智能体”“设备维护智能体”“质量检测智能体”可实时共享数据,协同优化生产流程;
- 又如,“智慧城市系统”中,“交通管理智能体”“能源调度智能体”“应急响应智能体”联动,提升城市治理效率。
刘知远表示:“人类社会通过协作从‘分散劳作’走向‘工业化大生产’,AI也将通过多智能体协作,实现从‘单点智能’到‘群体智能’的跨越。”
## 三、专业智能体的三大核心挑战:泛化、自主、长程
要让AI成为能在真实世界独立行动的“专业智能体”,需突破三大技术瓶颈,这也是当前行业的核心攻关方向:
### 1. 泛化性:应对“多样多变”的真实环境
真实世界的环境与任务具有极强的多样性(如不同行业的工具、流程差异)与多变性(如突发故障、需求调整),这要求智能体具备“泛化能力”——在未训练过的场景中仍能合理决策。
刘知远指出,泛化性的关键在于两点:
- **工具与知识的跨场景迁移**:例如,编程智能体需能适配不同编程语言、开发工具;
- **动态环境的学习能力**:通过“世界模型”(模拟真实场景的虚拟环境)训练,让智能体在模拟中学习应对多样场景,再迁移到现实。
“国际上已出现不少探索,比如让智能体通过‘工具调用库’适配不同领域,但如何进一步降低跨场景学习成本,仍是关键。”
### 2. 自主性:从“被动模仿”到“主动探索”
传统大模型依赖“模仿学习”(从海量数据中学习人类行为),而专业智能体需具备“自主性”——在动态环境中主动感知、决策、学习,无需人类持续干预。
刘知远以DeepSeek R1、OpenAI o1为例:“这些模型表面是‘深度思考能力’,核心是背后的‘大规模强化学习’——让AI在探索中试错、总结经验,而非单纯模仿人类。未来2-3年,AI有望实现‘完全开放环境下的自主探索’,比如自主规划学习路径、调整工具使用策略。”
近期兴起的“反向学习”(Reverse Learning)技术,正是提升自主性的重要方向——让AI从“错误结果”反推优化策略,加速自主学习。
### 3. 长程性:处理“复杂长效”的任务链条
真实世界的专业任务往往具有“长程性”——需多步骤、长时间完成(如项目开发、设备运维),甚至是“终生任务”(如客户长期服务)。这要求智能体具备“长程能力”:
- **长上下文感知**:能记住任务全程的关键信息,避免“半途遗忘”;
- **经验复用**:从历史任务中提取经验,优化后续决策。
刘知远强调,长程性的突破需两大技术支撑:
- **高效记忆架构**:突破当前大模型的“上下文窗口限制”(如GPT-4o的128k tokens),设计能主动筛选、存储关键信息的“记忆系统”;
- **冗余消除与推理优化**:降低长任务中的计算成本,提升推理效率,避免“越算越慢”。
## 四、多智能体系统:突破“协作效率”与“资源消耗”的矛盾
当多个专业智能体协同工作时,新的挑战随之而来:**如何在提升协作能力的同时,降低资源消耗(如计算、通信成本)** 。刘知远认为,需解决三大核心问题:
### 1. 高效交互:标准化通信协议
多智能体协作的基础是“高效通信”,但当前缺乏统一的“智能体间通信协议”(类似互联网的TCP/IP协议),导致不同智能体难以兼容,通信成本高。
“Anthropic、Google等团队已在探索A2A(Agent-to-Agent)协议,我们团队也提出‘智能体互联网’(Internet of Agents)概念,核心是构建‘标准化、最小化’的通信协议——只传递关键信息,减少冗余数据。”刘知远补充,“谁能主导协议标准,谁就掌握多智能体协作的话语权。”
### 2. 动态编排:自主组织协作流程
复杂任务需多个智能体按序或并行协作(如“产品研发”需“需求分析智能体→设计智能体→开发智能体→测试智能体”联动),这要求系统具备“动态编排能力”——自主分配任务、调整协作顺序,无需人类手动调度。
目前,国内外已出现多智能体协作框架(如Meta的Toolformer、国内的AgentBuilder),但刘知远指出:“现有框架多适用于固定场景,如何实现‘分布式自主编排’(如跨地域、跨领域智能体的动态组队),仍是难点。”
### 3. 群体演化:从历史协作中学习
优秀的人类团队会从历史项目中总结经验,多智能体系统也需具备“群体演化能力”——共享协作经验、迁移知识,持续优化协作效率。
“这一领域目前以学术探索为主,比如让多智能体共享‘协作日志’,提取最优策略。但如何平衡‘经验共享’与‘数据隐私’,如何避免‘错误经验的传递’,仍需突破。”刘知远表示,“不过,现在学术界与产业界的边界越来越模糊,前沿技术落地速度在加快,这一问题有望在3-5年内取得关键进展。”
## 五、展望:群体智能的“第二次涌现”与“人机协同新生态”
刘知远在演讲结尾提出,AI的下一阶段目标是实现“群体智能的第二次涌现”:
- 第一次涌现:过去5年,大模型的个体认知能力突破,实现“个体智能涌现”;
- 第二次涌现:未来10年,通过专业智能体的规模化与多智能体的高效协作,实现“群体智能涌现”。
“人类社会由‘专家个体’与‘协作组织’构成,未来AI也将形成‘岗位孪生智能体’与‘组织孪生智能体群’——每个岗位有专属智能体,每个组织有智能体协作网络,最终实现‘人机协同的新生产方式’。”
他进一步指出,要实现这一愿景,需解决一个底层问题:“群体智能的涌现激励机制——如何确保新增一个智能体后,整个系统的协作效能能‘边际递增’,而非‘边际递减’;如何为任意智能体团队找到‘最优协作机制’。”
刘知远的演讲为行业提供了清晰的方向:AI的竞争已从“大模型参数规模”转向“智能体的行动能力”与“多智能体的协作效率”。当专业智能体能精准适配岗位需求,多智能体系统能高效联动时,人工智能将真正从“辅助工具”升级为“生产伙伴”,重塑各行各业的生产力格局。