随着自动驾驶引入软件2.0、端到端技术,智驾开发模式从基于规则的分任务模块,进化到以数据驱动的AI 2.0阶段,目前正逐步向着AGI通用人工智能的AI 3.0迈进。
数据驱动向认知驱动的智驾开发转变
来源:佐思汽研
在今年北京车展上,商汤绝影就展示了其下一代自动驾驶技术:DriveAGI的前瞻预览,它是基于多模态大模型对端到端智驾方案进行改进和升级。DriveAGI是自动驾驶大模型从数据驱动向认知驱动进化,超越司机的概念,加深其对于世界的理解能力,具备更强的推理能力、决策能力以及交互能力,是目前自动驾驶中最贴近人类思维模式、最能理解人类意图并有最强解决驾驶困难场景能力的技术方案。
商汤绝影下一代自动驾驶技术:DriveAGI
来源:商汤绝影
数据闭环是AI 1.0以后自动驾驶研发必不可少的一环,但是AI在自动驾驶应用的不同阶段,对数据闭环各环节的需求大不相同。
智驾系统从AI 1.0向AI 3.0演进,对数据闭环的影响
整理:佐思汽研
智驾系统全栈模型化开发,会给数据闭环带来哪些变化呢?
一、数据采集方式从采集车规模化采集转向量产车长尾场景采集为主,更加注重数据的高质化
从数据流转的环节看,首先智驾数据采集目前有多种方式,包括专用采集车、量产车数据采集回传、路侧数据采集融合、低空无人机采集交通数据、以及仿真合成数据等,实现覆盖范围最大化、场景最泛化、数据种类最齐全,最终配满数据的三个要素:海量性、完备性、准确性。其中量产车数据是主流方式。
部分车企智能驾驶数据累计对比
来源:佐思汽研
从上表可以看出,车企通过量产车不断累计海量的智能驾驶数据,并持续提炼有效高质数据以训练AI算法,例如理想汽车通过对超80万车主驾驶行为的评分,其中约3%驾驶行为分在90分以上的车主,可以称为「老司机」,而车队老司机的驾驶数据正是端到端模型训练的燃料,预计2024年年底理想汽车端到端模型学习预计可能超过500万公里。
那么有了足够的海量数据,如何充分提取有效场景数据、挖掘出更高质化的训练数据呢?可以透过以下例子来了解一下:
在数据压缩方面,车端收集的数据通常来自车载系统和各种传感器的环境感知数据,在用于分析或模型训练之前,必须经过严格的数据预处理和清洗,以确保其质量和一致性。车端数据可能来自不同的传感器和设备,每种设备可能都有其特定的数据格式。以RAW格式(即未经ISP算法处理的摄像头原始数据)存储的高清智驾场景数据,将成为未来高质量场景数据的趋势之一。这里以昆易电子为例,其“基于相机RAW数据压缩采集方案”不仅提高了数据采集的效率,也最大限度地保留了原始数据的完整性,为后续的数据处理与分析提供了可靠的基础。与传统的ISP后压缩数据回灌相比,RAW压缩数据回灌避免了ISP处理过程中导致的信息损失,可以更准确地还原原始图像信息,提高算法训练的准确性和智驾系统的性能。
RAW压缩数据回灌方式链路示意图
来源:昆易电子
在数据挖掘方面,基于离线3D点云大模型的数据挖掘案例值得关注,比如基于离线点云大模型,轻舟智航可进行高质量的3D数据挖掘,不断提升目标识别能力。不仅如此,轻舟还创新构建了基于文字到图像的多模态模型,只需通过自然语言文字描述,便可在无监督的情况下自动检索相应场景图像,挖掘出很多在平常数据使用中很难发现的、生活中也很难遇到的长尾场景,提高了挖掘长尾场景的效率。例如,输入“夜间雨天行驶的大卡车”、“躺在路边的人”等文字描述,系统就能自动反馈相应的场景,便于专项分析和训练。
基于离线3D点云大模型的数据挖掘
来源:轻舟智航
二、数据标注正向AI自动化的高精度标注发展,未来趋向少量标注或无需标注
随着大模型的广泛应用和深度学习技术的进步,对数据标注的需求呈现爆炸性增长。大模型性能在很大程度上取决于输入数据的质量。因此,对数据标注的准确性、一致性和可靠性的要求也越来越高。为应对大规模的数据标注需求,许多数据标注公司开始研发自动化标注功能,进一步提高数据标注效率。例如,
•亮道智能最新推出的BEV视觉+激光雷达点云的场景真值标注工具,可以支持单个track长达120秒的连续帧标注,拥有高效的数据处理效率与高度自动化水平。该场景真值标注工具除了可以输出目标物的ID、尺寸等基本信息以及三维的真值参数的输出,还可以通过连续帧标注,包括速度、加速度、遮挡关系等参数的真值等信息,提取场景真值,为仿真测试的数据泛化提供真实场景的数据基础。
•标贝科技基于大模型自动化能力,推出新工具4D-BEV标注,支持处理上亿像素点云数量,帮助快速准确的感知和理解车辆环境信息,通过将静态和动态感知任务结合在一起,对车辆、行人和路标等目标进行多视角、多时序的标注,提供更加精准的目标位置、速度、姿态和行为等信息。同时还可以提供场景中不同目标的交互信息,帮助自动驾驶系统更好地理解道路上的交通情况,从而进行更加精准的决策和控制。为提高标注效率和准确性,标贝科技4D-BEV工具加入了机器视觉算法以自动完成复杂的标注工作,对于车道线,路沿,停止线等,均可做到高质量识别。
•曼孚科技SEED数据标注平台支持自动驾驶等场景下2D、3D、4D全类别标注,如2/3D融合、3D点云分割、点云时序叠帧、BEV、4D点云车道线、4D点云分割等,全面覆盖自动驾驶各细分标注场景,此外其AI算法标注模型包括基于SAM分割大模型的AI智能分割、静态道路自适应分割、动态障碍物AI预处理、AI交互式标注等,典型自动驾驶数据标注场景平均效率可提升4-5倍以上,部分场景则可提升10-20倍以上。此外,曼孚科技数据标注大模型基于弱监督与半监督学习,通过少量人工标注数据与大量无标注数据,实现对场景物体的高效检测、分割与识别。
智能化数据标注平台对比
来源:佐思汽研
此外,2024年7月27日,蔚来正式发布中国首个智能驾驶世界模型 NWM(NIO World Model),即可以全量理解信息、生成新的场景、预测未来可能发生的多元自回归生成模型。值得注意的是,作为生成式模型,NWM 可将3秒钟的驾驶视频作为Prompt(提示词),生成长达120秒的视频,NWM通过自监督的过程,已经做到无需数据标注,更高效。
三、仿真测试在智驾开发中日益重要,高精准、高还原能力是提升场景覆盖质量的关键
高阶智驾需要在各种复杂和多样的场景中进行测试,这不仅需要高精准的传感器感知还原能力,还需要强大的3D场景重建能力,以及场景覆盖的泛化能力等。
•沛岱汽车全物理级传感器模型能够仿真细致的物理现象,例如电磁波的多路径反射、折射、干涉、多路径反射等,或动态传感器性能,例如探测丢失率、目标分辨率、测量不准度和“鬼影”物理现象等,从而获得传感器模型所需的高保真度。基于沛岱PlenRay物理射线技术的全物理级传感器模型,目前仿真还原率95%以上。
•dSPACE的AURELION (3D场景及物理传感器的高精度仿真)是一款灵活的传感器仿真和可视化软件解决方案。基于游戏引擎的物理级渲染对摄像头传感器像素级原始数据进行仿真;AURELION的毫米波雷达模块利用光线追踪技术对射线类传感器的信号级原始数据进行仿真;考虑特定材料对激光雷达的影响,输出的点云包含近真实计算的反射率值 ;对于每条射线提供逼真的运动失真效果与可供配置的时间偏移值。
•昇启科技旗下的千行仿真平台加入了丰富逼真的行人模型,支持行人微观轨迹的自定义,行人批量生成等功能。此外,平台还提供不同的高保真行人行为风格模型,涵盖了人车交互、横穿马路、斜穿路口等场景。对三类驾驶风格的驾驶员(保守型驾驶员,常规型驾驶员,激进型驾驶员)进行建模,并通过一定的概率分布对各参数进行细化,使得环境车辆的驾驶行为多样化、随机化。
•作为生成式仿真模型,蔚来NSim可以对NWM 推演的每一种轨迹与对应的仿真结果做对比。原本只能在和真实世界中唯一轨迹里做比对,加入NSim后,变成了在千万世界共同地验证,给到更多数据给到NWM训练。让输出的智驾轨迹和体验更安全更合理,更高效。
生成式仿真案例:NSim
来源:蔚来
在自动驾驶领域,端到端方案对于高保真场景的需求更加迫切,由于端到端系统需要能够在各种复杂场景中自如应对,需要将大量标注有自动驾驶行为的视频投入自动驾驶训练。目前,在3D场景重建方面,3D高斯泼溅技术(3DGS)在汽车行业正加速渗透应用,这是因为3DGS在渲染速度、图像质量、定位精度等方面呈现出了非常优异的表现,全面补足了NeRF的短板。同时,基于3DGS的重建场景能够1:1复刻在真实智驾上发现的边缘场景(Corner Case),通过动态场景泛化,提升端到端智驾系统应对Corner Case的能力。例如,
•51Sim创新性地将3DGS通过AI算法融合到传统图形渲染引擎中,在拟真度方面取得了突破性进展。51Sim融合方案具有高质量和实时渲染的能力,高保真的模拟场景不仅提高了自动驾驶系统的训练质量,还显著提升了仿真的真实性,使其几乎可以达到肉眼难辨的程度,大幅提升了仿真的置信度,并弥补了3DGS在细节和泛化能力的不足。
•此外,理想的仿真场景重建也利用了3D高斯泼溅。理想汽车的智驾方案是由三个系统构成,即端到端(快系统) + VLM(慢系统) + 世界模型。其中世界模型结合了重建和生成两种技术路径,将真实数据通过3DGS技术进行重建,并使用生成模型补充新视角。在场景重建时,其中的动静态要素将被分离,静态环境得到重建,动态物体则进行重建和新视角生成。再经过对场景的重新渲染,形成3D的物理世界,其中的动态资产可以被任意编辑和调整,实现场景的部分泛化。生成模型具有更强的泛化能力,天气、光照、车流等条件均可被自定义改变,生成符合真实规律的新场景,用于评价自动驾驶系统在各种条件下的适应能力。
3DGS重建场景
来源:网络
BEV多摄像头视频生成
来源:网络
简言之,重建和生成两者结合所构建的场景为自动驾驶系统能力的学习和测试创造了更优秀的虚拟环境,使系统具备了高效闭环的迭代能力,确保系统的安全可靠。
四、OEM全栈自研能力的“快速跑”,促使数据闭环技术提供商持续提升服务能力
数据闭环分感知层和规控层,它们各自都有独立的闭环流程。在两个方面,数据闭环相关技术提供商服务能力均有能力深化的进步,比如:
•感知方面,在项目开发的过程中,自动驾驶系统会定期发版,将感知、规控、通信、中间件等所有内容整合打包,而有的智驾方案商,比如Nullmax会将感知部分先行单独发版,然后通过自动化工具和测试人员进行测试,输出具体报告,评估前期问题的修复情况。如果感知版本存在问题,那么也还有时间继续修改和测试,这样可以极大程度避免上游的感知问题影响系统整体,而且更利于问题的定位和系统的改进,将系统发版和项目开发的效率大幅提升。
•规控方面,以轻舟智航为例,其自研的“时空联合规划算法”同时考虑空间和时间来规划轨迹,在三维中同时对行驶路径和速度求解,而非先单独求解路径,在路径基础上再求解速度从而形成轨迹。将“横纵分离”,升级为“横纵联合”意味着路径和速度曲线将同时作为优化问题的变量,得到二者的最优组合。
数据闭环技术提供商,一般提供整套数据闭环解决方案或分离式数据闭环产品(即模块化的工具服务,如标注平台、回灌工具、仿真工具等等)给主机厂和Tier1。对于数据治理能力较强的车企通常会外采自身能力不足的工具模块,集成到自己的数据处理平台体系;而对数据治理能力偏弱的主机厂则会考虑紧耦合式数据闭环产品或定制化服务,比如福瑞泰克的全新一代紧耦合式数据闭环平台产品—福嘉FUGA已经积累了超过800万公里的真实量产数据,以及超过100款量产车型的算法闭环迭代的经验,可以做到100倍以上的算法迭代效率,每月管理的高价值场景数据片段超3000组等。目前,FUGA数据闭环平台产品已在多家头部OEM的量产车型项目中展开实际的部署和应用,可以支持按天级的测试数据问题分析,以及按周级的数据清洗和统计报告分析。
01 自动驾驶数据闭环综述
1.1 数据闭环的演进
1.2 自动驾驶数据闭环建设难点
1.3 解决案例一
1.4 解决案例二
1.5 自动驾驶数据闭环产业链图谱
1.6 数据闭环之基:数据安全
1.6.1 汽车数据安全标准现状
1.6.2 自动驾驶各层级数据安全风险
1.6.3 数据安全治理概述
1.6.4 数据安全治理案例
02 数据采集研究
2.1 智驾数据采集的多样模式总结
2.1.1 案例一:量产车方式
2.1.2 案例二:采集车方式
2.1.3 案例三:无人机采集方式
2.1.4 案例四:路侧数据方式
2.1.5 案例五:仿真合成方式
2.2 典型数采/数据压缩方案
2.2.1 案例一:天准科技
2.2.2 案例二:昆易电子
2.2.3 案例三:智协慧同
03 数据标注研究
总结:智能化数据标注平台对比(1)
总结:智能化数据标注平台对比(2)
3.1 海天瑞声
3.1.1 海天瑞声 - DOTS-AD数据平台
3.1.2 海天瑞声 - DOTS-LLM大模型服务平台
3.2 曼孚科技
3.2.1 曼孚科技 - 自动驾驶AI数据标注解决方案
3.2.2 曼孚科技 - SEED数据服务平台
3.2.3 曼孚科技 - 数据安全解决方案
3.3 标贝科技
3.3.1 标贝科技 - 自动驾驶 2D图像标注平台
3.3.2 标贝科技 - 自动驾驶 3D点云标注平台
3.3.3 标贝科技 - 自动驾驶4D-BEV标注
3.3.4 标贝科技 - AI数据平台
3.4 整数智能
3.4.1 整数智能 - 4D标注工具 V2.0
3.5 晴数智慧
3.5.1 晴数智慧 - Annotator 智能化标注工具
3.6 景联文科技
3.6.1 景联文科技 - 数据标注服务
3.7 澳鹏Appen
3.7.1 澳鹏 - MatrixGo®高精度数据标注平台
3.7.2 澳鹏 - 大模型智能开发平台
3.8 Scale AI
3.8.1 Scale AI - 标注及微调服务
04 数据处理研究
4.1 自动驾驶数据闭环处理流程
4.1.1 自动驾驶数据闭环处理流程案例一
4.1.2 自动驾驶数据闭环处理流程案例二
4.2 自动驾驶数据分类分级
4.2.1 自动驾驶数据分类
4.2.2 自动驾驶数据分级
4.2.3 案例:某OEM数据分类分级
4.3 数据合规
4.3.1 数据合规概述
4.3.2 符合汽车数据安全4项合规要求的车型列表
4.3.3 数据合规方案案例一
4.3.4 数据合规方案案例二
4.4 数据传输
4.4.1 案例:EMQ
4.4.1.1 EMQ产品系列
4.4.1.2 EMQ 车云一体化的数据闭环平台
4.4.1.3 EMQ 车云协同数据闭环应用案例:某车企&某Tier1
4.4.1.4 EMQ车云灵活数采解决方案
4.5 智算中心
4.5.1 国内自动驾驶云端超算中心总结
4.5.2 智算案例一
4.5.3 智算案例二
4.6 数据闭环云平台
4.6.1 云服务赋能数据闭环概述
4.6.2 案例一:云端数据闭环工具SimCycle
4.6.3 案例二:华为云赋能数据闭环
4.6.4 案例三:经纬恒润智驾数据闭环云平台OrienLink
4.6.5 案例四:51 SimOne 云原生仿真平台
05 数据闭环技术供应商研究
总结:数据闭环技术供应商对比(1)
总结:数据闭环技术供应商对比(2)
总结:数据闭环技术供应商对比(3)
总结:数据闭环技术供应商对比(4)
总结:数据闭环技术供应商对比(5)
5.1 觉非科技
5.1.1 觉非科技 - 数据闭环方案
5.1.2 觉非科技 - 数据闭环方案(城市NOA)
5.1.3 觉非科技 - 数据闭环方案(高速NOA)
5.1.4 觉非科技 - 基于数据闭环的BEV+Transformer算法量产架构
5.1.5 觉非科技 - 多模态自动标注与工具链
5.1.6 觉非科技 - 基于4D检测的自动标注
5.2 轻舟智航
5.2.1 轻舟智航 – 数据闭环能力
5.2.2 轻舟智航 - 时空联合规划技术
5.2.3 轻舟智航 - 乘风基于征程®6全新中高阶智驾解决方案
5.2.4 轻舟智航 - 最新动态
5.3 卓驭
5.3.1 卓驭 - 技术路线
5.3.2 卓驭 - 4D纯视觉自标注技术
5.3.3 卓驭在智驾芯片算力优化(1)- 模型优化
5.3.4 卓驭在智驾芯片算力优化(2)- 计算加速(异构计算)
5.3.5 卓驭在智驾芯片算力优化(2)- 计算加速(模型推理优化)
5.3.6 卓驭在智驾芯片算力优化(2)- 计算加速(算子优化)
5.3.7 卓驭在智驾芯片算力优化(3)- 系统优化
5.4 毫末智行
5.4.1 毫末智行 - 智驾数据进展表
5.4.2 毫末智行 - HPilot系列
5.4.3 毫末智行 - DriveGPT
5.5 商汤绝影
5.5.1 商汤绝影 - 全新嵌入模型Piccolo2
5.5.2 商汤绝影 - UniAD真•端到端感知决策一体大模型
5.5.3 商汤绝影 - DriveAGI & 日日新SenseNova 5.0
5.5.4 商汤绝影 - ADNN 芯片异构计算平台
5.5.5 商汤绝影 - 原生多模态大模型车端部署
5.5.6 商汤绝影 - 最新动态
5.6 Momenta
5.6.1 Momenta - 数据闭环
5.6.2 Momenta - “无图”智能驾驶算法及高阶智驾方案
5.6.3 Momenta - 最新动态
5.7 福瑞泰克
5.7.1 福瑞泰克数据闭环平台产品 - 福嘉FUGA
5.8 Nullmax
5.8.1 Nullmax - 一站式数据在环平台
5.8.2 Nullmax - 多模态端到端 + 安全类脑
5.8.3 Nullmax - 自动化数据全流程
5.8.4 Nullmax - 可成长算法平台
5.9 元戎启行
5.9.1 元戎启行 - 端到端
5.9.2 元戎启行 - 端到端高阶智驾平台DeepRoute IO
5.9.3 元戎启行 - Deeproute-Driver
5.9.4 元戎启行 - D-PRO
5.9.5 元戎启行 - D-AIR
5.10 亮道智能
5.10.1 亮道智能 - 简介
5.10.2 亮道智能 - 数据闭环
5.10.3 亮道智能 - 场景真值工具链
5.10.3.1 亮道智能 - 场景真值标注
5.10.3.2 亮道智能 - 大数据管理平台
5.10.4 亮道智能 - LDCompass®真值系统
5.10.5 亮道智能 - 数据闭环SAAS整体解决方案
5.10.6 亮道智能 - 中欧数据中心
5.10.7 亮道智能 - 发展动态
5.10.8 亮道智能 - 合作案例
5.10.9 亮道智能 - 合作伙伴
5.11 博世
5.11.1 博世 - 数据闭环
5.11.2 博世 - 高阶智驾
5.12 智协慧同
5.12.1 智协慧同 - 车云数据底座
5.12.2 智协慧同 - 车云数据底座 - 灵活数采
5.12.3 智协慧同 - 车云数据底座 - 灵活数仓
5.12.4 智协慧同 - 车云数据底座 - 场景应用
5.12.5 智协慧同 - 车云一体工具链
5.12.6 智协慧同 - 车云一体工具链应用案例
5.13 优咔科技
5.13.1 优咔科技 - 业务布局
5.13.2 优咔科技 - 联网方案
5.13.3 优咔科技 - 自动驾驶数据闭环工具链平台
5.14 美行科技
5.14.1 美行科技 - 简介
5.14.2 美行科技 - 发展历程
5.14.3 美行科技 - 众源地图方案
5.14.4 美行科技 - 众源地图系统架构
5.14.5 美行科技 - 众源地图系统:建图流程
5.14.6 美行科技 - 众源地图系统:地图要素
5.14.7 美行科技 - 众源地图系统:智能驾驶功能场景
5.14.8 美行科技 - 众源自动化生产系统
5.14.9 美行科技 - 众源地图系统:地图引擎架构
5.14.10 美行科技 - 众源地图系统:基于视觉感知的多信源融合定位方案
5.14.11 美行科技 - 众源地图系统:数据合规架构
5.14.12 美行科技 - 合作伙伴
5.15 四维图新
5.15.1 四维图新 - 数据合规闭环
5.15.2 四维图新 - One Map数据平台
5.15.3 四维图新 - 轻量化地图产品HD Lite
5.15.4 四维图新 - 轻量版 领航辅助驾驶系统 NOP Lite
5.15.5 四维图新 - NI in Car智能化一体解决方案
5.15.6 四维图新 - 杰发科技芯片系列
5.15.7 四维图新 - 普强信息“深思”大模型
5.15.8 四维图新 - 六分科技 星璨Orion
5.15.9 四维图新 - “车路云一体化”解决方案
5.15.10 四维图新 - 最新动态
06 典型主机厂数据闭环研究
总结:主机厂数据闭环能力(1)
总结:主机厂数据闭环能力(2)
6.1 比亚迪
6.1.1 比亚迪 - "整车智能"战略
6.1.2 比亚迪 - 数据累积能力
6.1.3 比亚迪 - 数据闭环之算法能力
6.1.4 比亚迪 - 数据闭环之计算能力
6.1.5 比亚迪 - “天神之眼”高阶智驾系统
6.2 奇瑞
6.2.1 大卓智能 - 简介
6.2.2 大卓智能 - 数据闭环能力
6.2.3 大卓智能 - 卓界联合创新中心
6.2.4 大卓智能 - 最新动态
6.3 长城
6.3.1 长城汽车 - 智能驾驶系统
6.3.2 长城汽车 - SEE端到端智驾大模型
6.3.3 长城汽车 - 超算中心
6.4 吉利
6.4.1 极氪浩瀚智驾2.0 全场景端到端
6.4.2 极氪NZP的SuperVision方案
6.4.3 吉利 - 星睿智算中心
6.4.4 吉利 - 智能驾驶云端数据工厂
6.4.5 吉利 - 智能驾驶闭环系统
6.4.6 吉利 - ROBO Galaxy工具链解决流程方案
6.4.7 吉利 - 数据生产方式
6.4.8 吉利 - 自研算法底软抽象
6.4.9 吉利 - 智驾自研SOA化设计
6.4.10 吉利 - 全自研座舱操作系统
6.4.11 吉利 - 全球平台运营体系
6.5 理想
6.5.1 理想 - 多模态认知大模型
6.5.2 理想 - 智驾端到端方案
6.5.3 理想 - 智能驾驶3.0算法架构
6.5.4 理想 - 无图NOA
6.5.5 理想 - 智能试验室
6.5.6 理想 - 自研芯片进展
6.6 小鹏
6.6.1 小鹏 - 自动驾驶部门组织架构调整
6.6.2 小鹏 - 端到端体系
6.6.3 小鹏 - XNGP演进情况
6.6.4 小鹏 - XNGP的闭环数据迭代系统
6.6.5 小鹏 - 自研芯片
6.6.6 小鹏 - 扶摇智算中心
6.7 蔚来
6.7.1 蔚来 - 智能驾驶世界模型
6.7.2 蔚来 - 全新智能驾驶架构
6.7.3 蔚来 - 群体智能
6.7.4 蔚来 - 自研芯片
07 数据闭环发展趋势
7.1 趋势一
7.2 趋势二
7.3 趋势三
7.4 趋势四
7.5 趋势五
7.6 趋势六
7.7 趋势七
7.8 趋势八
7.9 趋势九