留言
报告导航:研究报告制造业汽车
2025年中国智能辅助驾驶数据闭环研究报告
字数:0.0万 页数:318 图表数:0
中文电子版:12000元 中文纸版:9600元 中文(电子+纸)版:12500元
编号:FZQ 发布日期:2025-10 附件:

        要点:

        •2023-2025年,合成数据占比从20%-30%升至50%-60%,成为填补长尾场景的核心资源

        •从采集到部署的全流程自动化工具链逐步落地,助力降本提效

        •车云一体数据闭环的高效协同是实现更快迭代的关键因素

        智能驾驶的数据闭环本质是“采集-传输-处理-训练-部署”的循环优化系统。2025年,行业正从“0→1”加速转向“高质化、高效化”时代,核心矛盾聚焦长尾场景覆盖与成本控制。OEM主机厂和Tier1供应商正在积极建立自己的数据闭环解决方案,通过高效的数据采集、处理和分析流程,持续改进智能辅助驾驶算法,从而显著提升智能驾驶系统的精准度和稳定性。

中国智能辅助驾驶数据闭环 1.jpg
来源:无问智科

        一、2023-2025年,合成数据占比从20%-30%升至50%以上

        高质量数据获取效率决定智驾进化速度。目前,汽车领域的数据来源包括量产车触发回传、采集车高价值特定场景数采等形式,也有通过路侧真实数据进行物理世界还原的工程实践,以及基于世界模型的数据合成技术。智能辅助驾驶技术规模化的核心路径→真实数据锚定基础能力,合成数据突破能力边界。2023至2025年,智能辅助驾驶训练数据中真实数据与合成数据的占比呈现显著变化,从早期以真实数据为主逐步转向合成数据占比提升的混合模式。

        •2023年真实数据主导,合成数据起步(合成数据占比 20%-30%):真实数据仍是主体,主要用于基础场景训练,但面临长尾场景覆盖不足的问题。例如,特斯拉早期依赖超百万辆车的真实路测数据,但极端场景(如暴雨中的行人闯入)采集效率低。合成数据占比约20%-30%,主要用于补充长尾场景。Applied Intuition实验表明,在真实数据中添加30%的骑行者高频出现合成数据后,感知模型对骑行者的识别准确率(mAP分数)显著提升。

        •2024年合成数据加速渗透(占比升至40%-50%):合成数据从“辅助工具”升级为“核心生产资料”,其渗透率升至40%-50%标志着智能驾驶进入数据驱动新范式。2024年底,上海高级别自动驾驶引领区启动100辆数据采集车计划,通过“真实数据采集+世界模型生成虚拟数据”的混合模式,合成数据占比接近50%;还比如英伟达DRIVE Sim生成远距离物体(100-350米)的合成数据,解决真实标注稀疏问题,添加9.2万张合成图像后,200米外车辆检测准确率(F1分数)提升33%。

        •2025年合成数据反超(占50%以上):合成数据与真实数据的比例向“5:5”甚至更高迈进。邬贺铨院士指出,L4/L5级训练中90%为仿真数据,仅保留10%-20%真实数据作为“基因库”以避免模型偏差。在合成数据创新应用方面,以理想汽车为例,其利用世界模型重建历史场景并扩展变体(如将普通路口虚拟为雨夜、雾天工况),自动生成极端案例循环训练。理想合成数据占比超90%,替代实车测试并验证可靠性。

        据理想郎咸朋介绍,2023 年,理想汽车一年用实车的有效测试里程大概有157万公里,每公里成本是 18 元。而到了2025年上半年,总共测了 4,000 万公里,其中实车只有 2 万公里,合成数据3800万公里,测试成本降至平均每公里 5 毛钱。并且测试质量还高,所有的场景都能举一反三,可以完全复测。

        合成数据的优势不仅体现在成本、效率上,还在于其超越了人类经验的价值密度。合成数据通过技术手段批量生成,成本极低,完美匹配 AI 高频训练需求;并且能自主生成 “人类未经历但符合物理规律” 的极端Corner Case场景。

 

中国智能辅助驾驶数据闭环 2.jpg
图源:佐思汽研

        二、从采集到部署的全流程自动化工具链逐步落地,助力降本提效

        智能驾驶数据闭环已从早期聚焦单一环节(如标注效率提升),转向覆盖“采集-标注-训练-仿真-部署”的全流程自动化架构。核心突破在于通过AI大模型与云边协同技术打通数据流转壁垒,实现闭环自进化。

        亮道智能LD Data Factory是实现从采集到交付的全链路4D真值解决方案。LD Data Factory 工具链产品已经交付中、德、日十多个汽车 OEMs 与 Tier-1。该自动化 4D 标注工具软件,已经为客户自动化标注超过 3300 小时的路采数据,获得高质量的 4D 连续帧真值;到 2025 年中,亮道智能为德国知名豪华车品牌车企,已经累计交付超过5500万帧数据。

        LD Data Factory整合“数据采集、自动化标注、人工标注、质量管控、性能评价”于一体,工具链涵盖AI 预处理与 VLM 辅助采集、自动化标注模块实现目标物检测、自动质检的全流程闭环、以及混合云与私有化部署。LD Data Factory 涵盖以下几大核心模块,并通过统一数据管理平台实现数据管理与任务协同:包括时间同步于空间标定、分布式存储与索引服务、可视化标注平台 LDEditor(全栈标注)、自动化质量管控 LD Validator以及感知性能评价 LD KPI模块。

中国智能辅助驾驶数据闭环 3.jpg
来源:亮道智能

        曼孚科技旗下主要产品目前包括一体化数据标注平台、数据管理平台(含向量数据库)以及模型训练平台等,覆盖从原始数据到模型落地的完整价值链,用户无需切换多个工具或平台,即可一站式完成算法开发全流程,重新定义AI数据服务新范式。其MindFlow SEED平台(第三代) 技术亮点包括支持4D点云标注(车道线、分割)、RPA自动化流程,AI预标注覆盖4000+功能模块。

        曼孚科技目前赋能客户包括上汽集团、长安汽车、长城汽车、吉利汽车、中国一汽、理想、华为、博世、亿咖通、智驾科技、四维图新、速腾聚创等。

        三、车云一体数据闭环的高效协同,是实现更快迭代的关键因素

        车云一体数据闭环的本质是构建“车端轻量化+云端智能化”的协同体系,打通数据流动壁垒,实现智能汽车的持续进化。车端负责实时采集环境感知数据(如道路状态、车辆运行数据),经脱敏加密、压缩后上传云端。而云端则处理海量数据(PB/EB级),进行标注、模型训练与算法优化,生成新能力下发至车端,实现OTA升级。

        智协慧同数据闭环方案就是车云一体方案,已获得超过15家汽车主机厂的信任与量产应用,部署于30余款主流车型中。

        智协慧同数据闭环方案构成包括车端的边缘计算引擎(vCompute)、边缘数据引擎(vADS)、边缘数据库(vData), 以及云端的算法开发工具(vStudio)、云端计算引擎(vAnalyze)和云端管理平台(vCloud)构成。该方案赋能可以实现数据传输成本下降75%,云端存储成本下降90%,云端计算成本下降33%,根据智协慧同合作的某主机厂案例核算得出:总成本优化可以下降85%。

中国智能辅助驾驶数据闭环 4.jpg
来源:智协慧同

        主机厂方面,以小鹏为例,其自建的“云端模型工厂”,2025年算力储备达10 EFLOPS,全链路迭代周期缩短至平均5天,支持从云端预训练到车端模型部署的快速闭环。

        小鹏推出的国内首个面向L4级高度自动驾驶的720亿参数多模态世界基座模型,具备链式推理能力(CoT),可模拟人类常识推理并生成控制信号。通过模型蒸馏技术将基模能力迁移至车端小模型,实现“小身材、大智商”的个性化部署。

中国智能辅助驾驶数据闭环 5.jpg
来源:小鹏汽车

        通过车端规则引擎初筛高价值数据(如Corner Case),云端结合合成数据生成技术(如GAN、扩散模型)填补数据空白,提升模型泛化能力。同时,端到端(E2E)与VLA模型整合多模态输入直接输出控制指令,依赖云端大模型训练(如小鹏720亿参数基座模型)实现车端轻量化部署。

        随着整个智驾系统全面模型化,车企在数据闭环上追求实现「成本更优、效率更高、服务更稳定」,智驾的交付方式正从单车部署交付代码的方式,加速向以订阅云服务为核心的方式转变,车云一体高效协同的数据闭环是智能汽车在AI驱动下实现更快迭代的关键。

术语

01 智能辅助驾驶数据闭环综述/趋势
1.1 数据闭环综述

数据智能平台一站式案例
数据闭环部署案例策略对比

1.2 数据闭环迈向全栈自进化时代

1.3 数据闭环进步案例总结(1)
1.3 数据闭环进步案例总结(2)
1.3 数据闭环进步案例总结(3)

1.4 数据闭环合作模式

1.5 主机厂数据闭环相关合作总结(1)
1.5 主机厂数据闭环相关合作总结(2)
1.5 主机厂数据闭环相关合作总结(3)

1.6 趋势一
1.7 趋势二
1.8 趋势三
1.9 趋势四
1.10 趋势五

1.11 趋势六
车端大算力加速普及
主要智能辅助驾驶芯片对比
云端算力及智算中心对比
智算中心案例分析

02 高质量数据采集/合成仿真研究
2.1 高质量数据采集
案例一:联友科技
案例二:昆易电子
案例三:天准科技
案例四:康谋科技
案例五:映云科技
案例六:智协慧同
案例七:车凌科技
案例八:汤元科技

2.2 合成/仿真数据
智能辅助驾驶合成数据概述
合成数据的优势与挑战
合成数据应用场景总结
合成数据应用占比变化
基于世界模型的数据合成技术(1)
基于世界模型的数据合成技术(2)
基于世界模型的数据合成技术(3)
基于世界模型的数据合成技术(4)
案例一:深信科创
深信科创 工具链产品(1)
深信科创 工具链产品(2)
深信科创 数据管理平台
深信科创 合成数据方案(1)
深信科创 合成数据方案(2)
深信科创 面向高级智驾的交通流合成数据平台
案例二:51SIM
51Sim端到端数据驱动闭环(1)
51Sim端到端数据驱动闭环(2)
51Sim端到端数据驱动闭环(3)
案例三:威蓝科技
威蓝科技数据产品
威蓝科技数据闭环(1)
威蓝科技数据闭环(2)
威蓝科技数据闭环(3)
案例四:千岑智能
案例五:光轮智能

03 数据存储/处理研究
3.1 数据存储

案例一:均联智行
案例二:宏杉科技
案例三:阿里云
案例四:百度
案例五:腾讯智慧出行
案例五:腾讯数据闭环平台(1)
案例五:腾讯数据闭环平台(2)
案例六:AWS

3.2 数据高效处理
案例一:联友科技
案例二:智协慧同
案例三:康谋科技
案例四:深信科创
案例五:阿里智能驾驶数据预处理解决方案(1)
案例五:阿里智能驾驶数据预处理解决方案(2)

04 自动化(AI)标注研究
总结:自动化标注方案对比

4.1 热热数据
热热数据 简介
热热数据 智能驾驶解决方案
Enable AI 智能数据标注平台(1)
Enable AI 智能数据标注平台(2)
热热数据 数据采集服务
热热数据 数据安全管理

4.2 曼孚科技
曼孚科技 简介
曼孚科技 数据服务方案(1)
曼孚科技 数据服务方案(2)
曼孚科技 第三代 MindFlow SEED平台
曼孚科技 4D点云处理
曼孚科技 发展动态

4.3 星尘数据
星尘数据简介
星尘自研算法(1)
星尘自研算法(2)
星尘Rosetta标注平台(1)
星尘Rosetta标注平台(2)
星尘MorningStar AI数据管理平台(1)
星尘MorningStar AI数据管理平台(2)
星尘COSMO大模型数据金字塔解决方案
星尘智能辅助驾驶服务场景
星尘智能辅助驾驶服务案例及技术能力
星尘数据标注服务客户

4.4 数据堂
数据堂 智能驾驶解决方案(1)
数据堂 智能驾驶解决方案(2)
数据堂 智能驾驶训练数据集
数据堂 智能驾驶训练数据集 对比(1)
数据堂 智能驾驶训练数据集 对比(2)
数加加Pro人工智能数据标注平台(1)
数加加Pro人工智能数据标注平台(2)

4.5 标贝科技
标贝科技 简介
标贝科技 发展历程
标贝易采工具
标贝科技 4D-BEV标注 工具
标贝科技 AI数据平台(1)
标贝科技 AI数据平台(2)
标贝科技 AI数据平台(3)
标贝科技大模型数据解决方案
标贝科技大规模高质量数据集(1)
标贝科技大规模高质量数据集(2)

4.6 博登智能
博登智能 简介
博登智能 产品矩阵
博登智能数据集
博登智能 智能辅助驾驶数据集
博登智能 智能辅助驾驶解决方案
博登智能 BASE数据标注平台(1)
博登智能 BASE数据标注平台(2)
博登智能 4D点云标注(1)
博登智能 4D点云标注(2)
博登智能 BBot智能体平台
博登智能 合作案例

4.7 柏川数据
柏川数据 技术布局
柏川数据 全链条数据服务
柏川数据 山海数据管理平台
柏川数据 智驾数据闭环方案(1)
柏川数据 智驾数据闭环方案(2)
柏川数据的真值复用解决方案
柏川数据 4D动态自动化标注大模型
柏川数据 数据闭环能力
柏川数据 合作伙伴
柏川数据 合作案例

05 算法与模型训练研究
算法演进
算法架构演进
主机厂核心算法架构对比(1)
主机厂核心算法架构对比(2)
VLA发展情况
VLA方案在数据闭环中的最新进展
OEM/Tier1在VLA方案上的最新进展
先进大模型对比分析(1)
先进大模型对比分析(2)
案例一: 元戎启行
元戎启行 智驾里程与商业化进展
元戎启行 端到端技术方案
元戎启行 数据闭环能力分析
案例二:Nullmax
Nullmax数据闭环技术进展
Nullmax平台化BEV-AI架构设计
Nullmax 一段式端到端核心技术(1)
Nullmax 一段式端到端核心技术(2)
Nullmax MaxDrive 平台化方案(1)
Nullmax MaxDrive 平台化方案(2)
Nullmax 最新发展动态
案例三:知行科技
知行科技 核心竞争力
知行科技 智驾技术及模型训练
知行科技大模型研发体系(1)
知行科技大模型研发体系(2)
知行科技 高级行泊算法平台与产品(1)
知行科技 高级行泊算法平台与产品(2)
知行科技 数据闭环能力
案例四:Momenta
Momenta数据闭环与量产落地(1)
Momenta数据闭环与量产落地(2)
Momenta量产/合作动态(1)
Momenta量产/合作动态(2)
世界模型概述
世界模型概述
最新世界模型总结
主流世界模型核心架构
世界模型合成数据发展方向
案例一:绝影智能
案例二:汤元科技
案例三:H公司
案例四:地平线
案例五:小米
案例六:Wayve

06 数据闭环技术代表供应商研究
总结:数据闭环技术代表供应商方案对比

6.1 无问智科
无问智科 简介
无问智科 核心技术
无问智科 数据闭环管理平台
无问智科 仿真验证平台
无问智科 AI数据标注平台

6.2 亮道智能
亮道智能 数据工厂
亮道智能 数据工厂核心模块
亮道智能4D真值工具链
亮道智能 连续帧4D标注
亮道智能 客户

6.3 智协慧同
智协慧同 简介
智协慧同 数据底座(1)
智协慧同 数据底座(2)
智协慧同 数据底座(3)
智协慧同 车云全栈产品
智协慧同 车云计算引擎
智协慧同 车云计算架构赋能(1)
智协慧同 车云计算架构赋能(2)
智协慧同 vADS智驾数据引擎
智协慧同 vData边缘数据库
智协慧同 vStudio算法开发工具

6.4 福瑞泰克
福瑞泰克 智能驾驶平台ODIN3.0(1)
福瑞泰克 智能驾驶平台ODIN3.0(2)
福瑞泰克 FUZE中间件平台
福瑞泰克 软件和算法
福瑞泰克 数据闭环服务
福瑞泰克 产品矩阵
福瑞泰克 发展动态
福瑞泰克 合作伙伴

6.5 智驾科技
MAXIEYE海市数据智能系统
MAXIEYE量产数据里程

6.6 如祺出行
如祺出行 数据闭环飞轮(1)
如祺出行 数据闭环飞轮(2)
如祺出行 标注基地
如祺出行 运营数据

6.7 优咔科技
优咔科技 简介
优咔科技 发展动态
优咔科技“遨云”智算解决方案(1)
优咔科技“遨云”智算解决方案(2)

6.8 全道科技
全道科技 自动化量产制图能力技术架构
全道科技数据闭环

6.9 四维图新
四维图新 AI Infra赋能的数据闭环 (1)
四维图新 AI Infra赋能的数据闭环 (2)
四维图新 服务/云端合作

6.10 光庭信息

07 典型主机厂数据闭环研究
7.1 小鹏

小鹏汽车数据闭环与软件供应链总结表
小鹏 算力数据中心与平台
小鹏汽车的数据管理平台(1)
小鹏汽车的数据管理平台(2)
小鹏智能辅助驾驶基座模型(1)
小鹏智能辅助驾驶基座模型(2)

7.2 小米汽车
小米汽车数据闭环与软件供应链总结表
小米汽车交付数据统计
小米汽车数据训练(1)
小米汽车数据训练(2)
小米端到端辅助驾驶
小米智驾物理世界建模体系
小米端到端OTA部署(1)
小米端到端OTA部署(2)

7.3 蔚来
蔚来汽车数据闭环与软件供应链总结表
蔚来世界模型(1)
蔚来世界模型(2)
蔚来汽车交付数据
蔚来汽车智能化功能OTA部署(1)
蔚来汽车智能化功能OTA部署(2)

7.4 理想汽车
理想汽车数据闭环与软件供应链总结表
理想模型训练(1)
理想模型训练(2)
理想汽车E2E训练数据规模
理想汽车智能驾驶数据训练量
理想智能化功能OTA部署

7.5 零跑汽车
零跑汽车数据闭环与软件供应链总结表
零跑汽车交付数据分析

7.6 智己汽车
智己数据闭环与软件供应链总结表

7.7 特斯拉
特斯拉数据闭环与软件供应链总结表

7.8 比亚迪
比亚迪数据闭环与软件供应链总结表
比亚迪端到端大模型训练
比亚迪天神之眼系列辅助驾驶功能总结
比亚迪全球化部署

7.9 吉利汽车
吉利汽车数据闭环与软件供应链总结表
吉利全域AI智能化(1)
吉利全域AI智能化(2)
吉利品牌/全球化产能布局

7.10 中国一汽
一汽红旗数据闭环与软件供应链总结表
中国一汽智能化升级(1)
中国一汽智能化升级(2)
中国一汽智能化升级(3)

7.11 广汽集团
广汽集团数据闭环体系(1)
广汽集团数据闭环体系(2)
广汽集团数据闭环体系(3)

7.12 长安汽车数据闭环与软件供应链总结表
7.13 东风汽车「一核双基双元」体系
7.14 东风日产数据闭环与软件供应链总结表
7.14 东风日产智能辅助驾驶软件方案和供应链搭建
7.15 大众汽车数据闭环与软件供应链总结表
7.16 丰田汽车数据闭环与软件供应链总结表

    如果这份报告不能满足您的要求,我们还可以为您定制报告,请留言说明您的详细需求。
2005- 版权所有(c)   北京水清木华研究中心   京ICP备05069564号-6 北京市公安局海淀分局备案号:1101081902
在线客服系统