卓视智通CEO吴柯维:多模态AI将重塑交通数智化新时代

3月5日,在第十五届(2026)智能交通市场年会主论坛上,北京卓视智通科技有限责任公司董事长兼CEO吴柯维发表了《多模态AI重塑交通数智化新时代》主题演讲,深入剖析了多模态人工智能技术对交通数字化转型的深远影响与重塑价值。
吴柯维分享了卓视智通基于多模态AI能力构建的产品体系,阐述了如何打通全天候、全要素、全态势的交通感知,并解锁端、边、云全链路赋能交通数智化的新路径。结合公司在交通感知、智慧停车、高速运营等领域的实践案例,他对技术内核、场景应用与落地进行了系统解读。
一、AI发展趋势:多模态与智能体成为核心
吴柯维指出,过去一年AI在多模态能力上取得重大突破,从“豆包”的普及到具身机器人、视频生成及AI智能体(如“小龙虾”应用)的涌现,AI已从科学家领域走向大众,实现科技平权。他认为,2026年AI领域的关键词是“多模态”与“智能体”。多模态不仅意味着输入类型(文本、图像、视频、点云等)的多元化,也体现在部署方式(云端、边缘、本地)和应用场景的多样化。智能体则预示着未来交通行业所有应用软件都应为AI预留接口,使其能直接操作系统、执行任务,从而深刻改变行业运作模式。
二、AI与交通的深度契合
吴柯维认为,AI与交通行业存在深层关联。AI的本质是对信息(Byte与Token)的加工与重组,而交通的本质是人与物(原子)的移动。当前热议的“一人公司”、“0人公司”模式,在物流行业早有体现;快递网络的运作逻辑也与AI智能体高度相似。他指出,交通“数智化”与“信息化”存在本质区别:信息化重在为人提供信息以供分析,而数智化重在为机器决策提供支撑,目标是让机器自主完成决策。
当前交通数字化面临两大核心痛点:一是面向管理者的“感知不准”,即数据准确性不足;二是面向公众的“感受不强”,即民众难以切实体会建设成效。多模态AI的发展与“手机+”等理念的提出,正是为了系统解决这些问题,重塑从公路数字化、车路云一体化到智慧停车的全领域。
三、多模态AI赋能全维度交通感知
吴柯维介绍,卓视智通通过融合大模型与小模型,显著提升了视频检测的准确率,能精准识别20多种交通事件和10余种流量数据,支持超100种车辆特征维度与38种以上交通违法取证,实测准确率超99%。
为实现全天候、全要素、全态势感知,公司创新性地融合可见光、热成像与毫米波雷达技术,研发新型检测设备,克服了夜间等恶劣环境下的感知短板。此外,多模态AI的赋能正从路侧向车载端、低空延伸:
? 车载端:与无人车公司合作打造“移动抓拍无人车”,为巡检与路侧停车管理提供新方案。
? 低空端:为高速公路建设与运营提供无人机智能巡检方案,实现工程进度监控、事件自动识别与应急联动处置,提升管理效率。
四、多模态AI驱动交通数智化落地实践
吴柯维强调,交通数字化的首要原则是服务出行者、提升体验。多模态AI正从两方面推动落地:
1. 重塑行业软件交互:通过“智通卓识”大模型3.0,打造支持私有化部署的智能交互系统,集成数字人、语音识别,实现类“豆包”的流畅体验,赋能交通事件审核、智能问数、报表生成等业务,让软件更易用。
2. 深化具体场景应用:
? 智慧停车与服务区:通过视频AI实现车位状态、车辆类型的精准检测与管理,方案已在全国数百个服务区应用。
? 车辆高精度识别:结合车牌、车脸、车型、三维结构等多维特征,借助多模态大模型将车辆识别精度推向极致,为“手机+”等业务提供核心支撑。公司相关技术已在超万个车道落地。
? 赋能公路与交管全场景:围绕公路数字化转型十大任务,提供覆盖收费站、隧道、干线、城市路口的全场景解决方案。针对交管领域特点,通过中心端AI+升级、边缘端低成本利旧,以及自主研发的“阿瞳目”雷视一体机、太阳能“交安哨卫”、无人机抓拍、智能头盔/眼镜等产品,实现从路口到路侧、从空中到移动端的立体化赋能。
吴柯维表示,卓视智通致力于通过多模态AI技术,与行业伙伴共同攻克交通数字化最后的感知难点,让技术成果真正服务于管理效率提升与公众出行体验改善。
