留言
报告导航:研究报告制造业汽车
2025年中国汽车多模态交互发展研究报告
字数:0.0万 页数:285 图表数:0
中文电子版:12000元 中文纸版:9600元 中文(电子+纸)版:12500元
编号:LYX 发布日期:2025-12 附件:

       发布的《2025年中国汽车多模态交互发展研究报告》。该报告全面梳理了汽车座舱可交互模态市场装配情况、多模态交互专利、主流座舱交互方式、2025年上市的重点车型交互方式应用、车企/供应商座舱交互方案,以及多模交互融合趋势等。

        一、多模态交互闭环进化:L1~L4智能座舱的渐进进化

        根据中国工程学会联合发布的《汽车智能座舱分级与综合评价白皮书》中,智能座舱分级体系可分为L0-L4共五个层级。

图:智能座舱分级体系
汽车多模态交互1.jpg
来源:佐思汽研《2025年中国汽车多模态交互发展研究报告》

        多模态交互能力作为推动座舱智能化的关键,其核心是依靠 AI 大模型与多硬件协同,实现多源交互数据的融合处理,并基于此完成对驾乘者意图的精准理解与场景化反馈,最终达成自然、安全且个性化的人机交互。 目前汽车智能座舱行业整体处于L2级阶段,部分领先厂商向L3级别探索和迈进。

汽车多模态交互2.jpg
来源:佐思汽研《2025年中国汽车多模态交互发展研究报告》

        L2级智能座舱的核心特征是“强感知,弱认知”。L2阶段座舱多模态交互功能实现信号级融合,基于多模态大模型技术,能“理解用户模糊意图”、“多指令同步处理”,执行用户即时、显性指令。当前多数量产智能座舱均能实现。

        •以理想i6为例,其搭载了最新的 MindGPT-4o 多模态模型,具备超长记忆、超低延迟的理解与响应能力,以及更自然的语言生成水平。支持多模态可见即可说(语音+视觉融合搜索:让不识字的小朋友也可以通过描述视频封面里的内容,选择自己想看的动画片);多模态指代交互(语音+手势:① 语音对物体的指代,发出指令的同时,伸出食指:向左指可控制车窗,即可完成车辆控制。② 语音对人员的指代,同排座位的乘客可以通过手势和语音配合实现对指定人员的语音控制,例如向右指并说“给他打开座椅加热”)。

汽车多模态交互3.jpg
图源:央视新闻

        L3级智能座舱的核心特征是“强感知,强认知”。L3阶段座舱多模态交互功能实现认知级融合,依托大模型能力,座舱系统能综合理解当下所处的完整场景,无需用户发起明确指令,主动发起合理的服务或建议。

        L4级智能座舱的核心特征是“全域认知,自主进化”,为用户打造“全域智能管家”。L4阶段智能座舱应用将远超工具属性,成为能预测用户未说出口的需求、拥有共同记忆、并为用户调度一切资源的“数字孪生伙伴”。其核心体验是:需求在用户明确感知或表达之前,系统已完成预测、规划并进入执行状态。

        二、多模态AI Agent实现懂你所需,预判所想
 
        AI Agent可视作是智能座舱从L2向L4演进过程中,功能得以具体落地的核心执行单元和关键技术架构。通过融合语音、视觉、触觉及情境信息,AI Agent 不仅能“听懂”指令,更能“看懂”环境、“感知”状态,从而将原本离散的座舱功能整合为连贯、主动、个性化的服务流程。

汽车多模态交互4.jpg
来源:佐思汽研《2025年中国汽车多模态交互发展研究报告》

        L2级下的Agent应用可看做“增强版指令执行”,是L2座舱交互能力的极致延伸。基于大模型技术,座舱系统将用户的一句复杂指令,拆解成多个步骤,然后调用不同的Agent工具去执行。例如乘员说:“我累了,帮我买一杯咖啡。”L2级座舱系统的大模型会理解这个复杂指令,然后依次调用:

        1.语音 Agent:实时解析用户需求;

        2.点餐 Agent:根据用户偏好、实时位置、餐厅营业状态推荐最佳选项;

        3.支付 Agent:自动完成无感支付;

        4.配送 Agent:结合车辆导航数据,动态规划送餐时间(如“车到餐至”,确保用户抵达目的地时餐品同步送达)。

        当前Agent应用本质上仍然是对用户一个显性、复杂指令的响应与执行。座舱系统没有“主动”做任何事,它只是在更智能地“完成用户交代的任务”。

        •案例(1):智己汽车发布与斑马智行联合研发的“IM AIOS生态座舱”。该座舱首次将阿里生态服务以AI Agent形式落地,开创“No Touch & No App”的人车交互模式。IM AIOS生态座舱推出的“AI 点餐 Agent”、“AI 票务 Agent”功能让用户仅需通过语音交互即可完成选餐/购票、支付,无需手动操作。

汽车多模态交互5.jpg
图源:智己汽车

        •案例(2):2025年8月4日,腾势汽车在品牌发布会上正式推出“车生活 Agent”智能服务系统,并率先搭载于腾势Z9、Z9GT两款旗舰车型。“车生活 Agent”支持语音点餐,并基于人脸识别技术实现刷脸支付,完成订单后,系统将自动规划导航路线,形成“需求-服务-闭环”的无感体验。

汽车多模态交互6.jpg
图源:腾势

        在下一个层级的智能座舱中, Agent应用从“你说,我做”变成了“我看,我猜,我建议,我们一起做”。用户无需任何显性指令,仅是叹了口气,揉了揉太阳穴。系统便可通过大模型综合判断“摄像头”(疲劳微表情)、“生物传感器”(心率变化)、“导航数据”(连续驾驶2小时)、“时间”(下午3点(午后困倦期) )数据,了解到“用户处于长途驾驶疲劳期,有休息和提神的需求”。基于此,系统将主动发起交互:“您看起来需要休息一下。前方*公里有一个服务区,有您常喝的**咖啡,需要为您开启导航吗?同时可以为您播放提神的音乐。” 用户同意后,系统再调用导航、娱乐等Agent工具。

前言
相关定义

01 汽车座舱多模态交互概述
1.1 智能座舱发展阶段
1.2 多模态交互定义
1.3 多模态交互发展体系

1.4 核心交互模态技术介绍(1):触觉交互
主流接触式触觉震动反馈技术
触觉交互核心应用场景

1.4 核心交互模态技术介绍(2):听觉交互
语音交互核心应用场景
语音交互——声纹识别

1.4 核心交互模态技术介绍(3):视觉交互
视觉交互:人脸识别技术路线图
视觉交互:DMS 技术路线图
视觉交互:手势识别技术路线图

1.4 核心交互模态技术介绍(4):嗅觉交互
1.5 智能座舱大模型应用场景
1.6 基于多模态AI大模型的人车交互功能
1.7 多模态交互产业链
1.8 多模态AI大模型产业链

1.9 多模态交互政策环境
智能网联汽车网络数据安全相关法规盘点
多模态交互法律法规(1):《数据安全法》
多模态交互法律法规(2):《汽车数据安全管理若干规定》
多模态交互法律法规(3):《数据出境安全评估办法》
多模态交互最新强制国标

1.10 座舱各交互模态装配情况
2025年车载语音识别装配量 & 装配率
2025年车外语音交互装配量 & 装配率
2025年车载手势识别装配量 & 装配率
2025年语音+手势融合交互装配量 & 装配率
2025年车载生物识别装配量 & 装配率
2025年车载 DMS 装配量 & 装配率
2025年车载 OMS 装配量 & 装配率

02 汽车多模态交互专利汇总
2.1 触觉交互相关专利汇总

座舱触觉交互专利

2.2 听觉交互相关专利汇总
汽车语音交互专利汇总(1):车企
汽车语音交互专利汇总(2):供应商
汽车语音交互专利汇总(3):大学/研究机构

2.3 视觉交互相关专利汇总
手势识别相关专利
情绪识别相关专利
舱内监测相关专利(1):IMS(座舱智能视觉监控系统)
舱内监测相关专利(2):DMS(驾驶员行为监测系统)
舱内监测相关专利(3):OMS(乘客监控系统)
舱内眼动追踪 & 人脸支付

2.4 嗅觉交互相关专利汇总
车载香氛系统相关专利汇总

2.5 其它特色交互模态相关专利汇总
指纹识别相关专利
心率识别相关专利
虹膜识别相关专利
生物肌电识别相关专利

03 主机厂多模态交互座舱方案
3.1 比亚迪
比亚迪历代智舱系统人机交互功能
比亚迪全新一代DiLink智能座舱
比亚迪DiLink智舱特色多模态交互应用
比亚迪接入DeepSeek R1 & 通义系列大模型,提升交互能力
比亚迪推出车生活 Agent,支持语音点单 + 刷脸支付
比亚迪近年交互模态 OTA 内容汇整
腾势近年交互模态 OTA 内容汇整
方程豹近年交互模态 OTA 内容汇整
仰望近年交互模态 OTA 内容汇整

3.2 上汽智己汽车
智己历代智舱系统人机交互功能
智己IM AIOS座舱开创“No Touch & No App”的人车交互模式
智己核心多模态交互:语音交互
智己近年交互模态 OTA 内容汇整

3.3一汽红旗
一汽红旗历代智舱系统人机交互功能
一汽红旗全新“灵犀座舱”重点打造视听交互
一汽红旗灵犀座舱人机交互功能梳理

3.4 吉利
吉利汽车历代智舱系统人机交互功能
领克汽车历代智舱系统人机交互功能
极氪汽车历代智舱系统人机交互功能
吉利AI智能座舱战略:全面迈入AI时代,实现“一个吉利,一个座舱”
吉利AI智能座舱技术架构
吉利新一代AI座舱操作系统Flyme Auto 2,让座舱交互迈向“服务找人”新体验
吉利汽车推出多模态智能体Eva,感知用户情绪,提供主动关怀
极氪最新Zeekr Al OS 7 智能座舱系统上线Al Eva Agent
吉利近年交互模态 OTA 内容汇整
领克近年交互模态 OTA 内容汇整
极氪近年交互模态 OTA 内容汇整

3.5 长城汽车
长城魏牌历代智舱系统人机交互功能
长城Coffee OS 3 智慧空间系统
长城Coffee OS 3.1 升级语音交互功能,支持数字健康应用于车机联动
长城Coffee OS 3.3 语音交互功能持续优化
长城魏牌近年交互模态 OTA 内容汇整
长城坦克近年交互模态 OTA 内容汇整

3.6 奇瑞
奇瑞汽车历代智舱系统人机交互功能
奇瑞雄狮科技智能座舱
奇瑞 & 商汤合作打造下一代AIOS,智舱实现主动服务与情感陪伴
奇瑞近年交互模态 OTA 内容汇整

3.7 长安汽车
长安汽车历代智舱系统人机交互功能
长安天枢智能座舱,提升人车交互及健康防护等功能体验
长安汽车近年交互模态 OTA 内容汇整

3.8 岚图
岚图历代智舱系统人机交互功能
岚图逍遥座舱2.0,升级五感以及智能化体验
岚图逍遥座舱多模态交互能力梳理
岚图汽车近年交互模态 OTA 内容汇整

3.9 理想
理想历代智舱系统人机交互功能
理想智能座舱7.0版本基于Mind GPT 全面升级理想同学功能
理想智能座舱7.4版本:理想同学生活助手Agent升级,实现帮点外卖功能
理想智能座舱8.0版本,理想同学全面升级为理想同学 Agent
理想汽车近年交互模态 OTA 内容汇整

3.10 蔚来
蔚来历代智舱系统人机交互功能
蔚来特色交互:NOMI语音交互系统
蔚来汽车近年交互模态 OTA 内容汇整
乐道汽车近年交互模态 OTA 内容汇整
萤火虫汽车近年交互模态 OTA 内容汇整

3.11 零跑
零跑历代智舱系统人机交互功能
零跑Leapmotor OS 4.0 PLUS智舱系统搭载双AI语音大模型
零跑 & Unity中国合作打造下一代智舱全新人机交互体验
零跑汽车近年交互模态 OTA 内容汇整

3.12 小鹏
小鹏历代智舱系统人机交互功能
小鹏VLM大模型定义新一代智舱交互体验
小鹏特色多模态交互功能
小鹏汽车近年交互模态 OTA 内容汇整

3.13 小米
小米澎湃智能座舱
“超级小爱”多模态融合应用
小米新增AI空间交互传感器,实现隔空手势控制
小米汽车近年交互模态 OTA 内容汇整

3.14 宝马
宝马历代智舱系统人机交互功能
宝马全景iDrive搭载超感质控方向盘,及AI大语言模型
宝马车载信息娱乐系统代表车型:全新宝马iX3

04 供应商座舱多模态座舱方案
4.1 德赛西威

德赛西威公司介绍
德赛西威发展战略
德赛西威多模交互方案: Smart Solution 3.0
德赛西威多模交互方案: Smart Solution 3.0 创新场景应用
德赛西威与面壁智能联合发布端侧大模型语音交互方案

4.2 均胜电子
均胜电子公司介绍
均联智行智能座舱演进定义
均胜电子 JoySpace+ 沉浸式智能座舱解决方案汇集多项多模态交互创新技术
均胜电子 JoySpace+ 沉浸式智能座舱解决方案:悦感交互
均胜电子 JoySpace+ 沉浸式智能座舱解决方案:光影空间
均胜电子 JoySpace+ 沉浸式智能座舱解决方案:灵动空间

4.3 商汤科技
商汤科技公司简介
商汤绝影智能座舱产品体系
商汤绝影端侧多模态大模型MAAS基模型服务
商汤绝影端侧多模态大模型开放模型原子能力(1):车舱全场景感知
商汤绝影端侧多模态大模型开放模型原子能力(2):多模态融合能力
商汤绝影端侧多模态大模型开放模型原子能力(3):多图感知能力
商汤绝影多模态交互应用案例

4.4 科大讯飞
科大讯飞公司简介
科大讯飞全栈智能交互技术
科大讯飞星火智慧座舱
科大讯飞星火智慧座舱2.0
科大讯飞星火智慧座舱2.0 应用
科大讯飞多模感知系统特点:安全守护、个性化交互、多模交互
多模态交互成为讯飞超脑2030计划重点方向

4.5 中科创达
中科创达公司简介
中科创达AIDV Roadmap
中科创达端-边-云 AI 座舱解决方案打造全链路多模态服务
中科创达AIBOX+AIOS一体化解决方案深度融合多模态交互
中科创达滴水OS 1.0 Evo,创新座舱交互体验

4.6 华为
华为公司简介
华为Hormony OS 演进历程
华为HarmonySpace 5基于五感协同技术实现沉浸式交互
华为HarmonySpace 基于千悟大模型,重塑多模态交互功能
华为千悟交互特点(1):提升小艺语音能力+车载传感+视觉感知能力,实现无感交互
华为千悟交互特点(2):支持毫米级精准感知、全舱多模态人体感知
华为特色交互功能:多模态监测系统打造驾驶员失能辅助功能

4.7 百度
百度公司简介
Apollo超级座舱:打造全感融合、全局规划和全域执行的智能体
百度智能座舱深度融合端-端跨模态AI语音
百度智能座舱深度融合端-端跨模态AI语音:推出小度想想智能体
百度智能座舱深度融合端-端跨模态AI语音:上车案例

4.8 斑马智行
斑马智行公司简介
斑马智行发布智能座舱AI技术品牌——元神AI
斑马智行元神AI发布“一箭十星”交互智能体
斑马智行发布元神AI 融合端到端智舱架构
斑马智行首发全模态端侧大模型实车方案AutoOmni
斑马智行联合生态伙伴发起“AI车载平台服务联盟”

05 典型车型多模态交互方案应用案例
5.1 典型车型多模态交互方案应用案例汇总(1)
5.1 典型车型多模态交互方案应用案例汇总(2)
5.1 典型车型多模态交互方案应用案例汇总(3)
5.1 典型车型多模态交互方案应用案例汇总(4)
5.1 典型车型多模态交互方案应用案例汇总(5)

5.2 全新智己L6:多模态交互功能全景梳理
5.2 全新智己L6:特色模态交互能力解析

5.3 方程豹豹8:多模态交互功能全景梳理
5.3 方程豹豹8:特色模态交互能力解析

5.4 红旗金葵花国雅:多模态交互功能全景梳理
5.4 红旗金葵花国雅:特色模态交互能力解析(1)
5.4 红旗金葵花国雅:特色模态交互能力解析(2)
5.4 红旗金葵花国雅:特色模态交互能力解析(3)

5.5 腾势 N9:多模态交互功能全景梳理
5.5 腾势 N9:特色模态交互能力解析(1)
5.5 腾势 N9:特色模态交互能力解析(2)

5.6 极氪9X:多模态交互功能全景梳理
5.6 极氪9X:特色模态交互能力解析

5.7 吉利银河A7:多模态交互功能全景梳理
5.8 零跑B10:多模态交互功能全景梳理

5.9 理想i6:多模态交互功能全景梳理
5.9 理想i6:特色模态交互能力解析(1)
5.9 理想i6:特色模态交互能力解析(2)

5.10 小鹏G7:多模态交互功能全景梳理
5.10 小鹏G7:特色模态交互能力解析

5.11 小米YU7:多模态交互功能全景梳理
5.11 小米YU7:特色模态交互能力解析

5.12 尊界S800:多模态交互功能全景梳理
5.12 尊界S800:特色模态交互能力解析(1)
5.12 尊界S800:特色模态交互能力解析(2)
5.12 尊界S800:特色模态交互能力解析(3)

5.13 问界M9 2025款:多模态交互功能全景梳理
5.13 问界M9 2025款:特色模态交互能力解析(1)
5.13 问界M9 2025款:特色模态交互能力解析(2)
5.13 问界M9 2025款:特色模态交互能力解析(3)
5.13 问界M9 2025款:特色模态交互能力解析(4)

5.14 全新宝马X3 M50:多模态交互功能全景梳理
5.14 全新宝马X3 M50:特色模态交互能力解析

5.15 奥迪 2026款 E5 Sportback:多模态交互功能全景梳理
5.15 奥迪 2026款 E5 Sportback:特色模态交互能力解析(1)
5.15 奥迪 2026款 E5 Sportback:特色模态交互能力解析(2)

5.16 全新奔驰纯电CLA :多模态交互功能全景梳理
5.16 全新奔驰纯电CLA :特色模态交互能力解析

06 多模态交互总结及发展趋势
6.1 主机厂大模型配置参数总结

6.2 趋势一:多模态交互在AI大模型下的进化
多模态集成下的车端场景应用
案例

6.3 趋势二
座舱端场景应用案例
应用案例

6.4 趋势三(语音交互)
6.5 趋势四(视觉交互)

    如果这份报告不能满足您的要求,我们还可以为您定制报告,请留言说明您的详细需求。
2005- 版权所有(c)   北京水清木华研究中心   京ICP备05069564号-6 北京市公安局海淀分局备案号:1101081902
在线客服系统