行业热点|从WAIC看自动驾驶数据的多元化场景需求与标注应对
2025-07-31发布
刚刚落下帷幕的 WAIC 世界人工智能大会,向世界展现了自动驾驶领域的前沿动态与无限可能。在这场盛会中,自动驾驶技术的多场景应用成为焦点,从穿梭于城市核心区域的 Robotaxi,到连接重要交通枢纽与文旅目的地的长途接驳,不同场景下的自动驾驶实践,让大众看到这项技术正逐步从实验室走向现实生活。
<图片来源于网络,如有侵权请联系删除>
而在这些令人瞩目的应用背后,自动驾驶高质量数据及数据标注起着不可或缺的支撑作用。
Robotaxi在复杂路况下的数据标注升级路径
在 WAIC 期间,上汽智己、小马智行、百度智行、奇瑞汽车等企业在大会场馆周边及浦东核心区域提供的 L4 级自动驾驶接驳体验服务,让公众切实感受到了 Robotaxi 的魅力。在城市核心板块,道路情况错综复杂,车辆川流不息,行人、非机动车频繁穿梭,交通信号灯、指示牌众多且样式各异,同时还可能存在施工路段、临时交通管制等特殊情况。面对如此复杂的路况,Robotaxi 需要精准识别各种交通元素,这就对数据产生了极高要求。
<图片来源于网络,如有侵权请联系删除>
从数据类型上看,不仅需要高清摄像头采集的图像数据,用于识别车辆、行人、交通标志和标线等;还需要激光雷达提供的点云数据,以精确感知周围物体的距离和形状;毫米波雷达数据则能在恶劣天气或光线不佳时,辅助检测目标物体的速度和方位。
并且,这些数据要具备极高的准确性和时效性,每一个细节都关乎行车安全。例如,对于突然闯入道路的行人,系统必须能够在极短时间内精准识别并做出正确反应,这依赖于大量包含此类场景的高质量数据进行训练。
在数据标注方面,传统的2D标注已难以满足需求,更先进的3D甚至4D标注技术应运而生。标注过程中,需要精确标注出不同物体的类别、位置、速度、运动轨迹等信息,对于交通标志和标线,还要标注其含义和有效范围。此外,针对城市核心区复杂多变的场景,标注数据需要具备更强的泛化性,以应对各种可能出现的特殊情况,这就要求标注团队具备丰富的经验和专业知识,对各类场景进行细致分类和标注。
长途接驳专线的数据需求与标注要点
赛可智能的智己汽车车队试点开通的浦东机场与上海迪士尼度假区的长途接驳专线,是 WAIC 展示的又一重要应用场景。长途驾驶与城市短途出行有很大不同,其行驶里程长,途经多种路况,包括高速公路、城市快速路、普通公路等,且可能面临不同的天气条件,如晴天、雨天、雾天等。
<图片来源于网络,如有侵权请联系删除>
在数据需求上,长途接驳需要更全面的路况数据。除了城市道路所需的交通元素识别数据外,还需要对高速公路上的车道线、出入口、服务区标识等进行精确标注;对于不同路段的限速信息、坡度、曲率等道路特征数据也不可或缺。同时,由于长途行驶时间长,车辆的疲劳监测数据以及应对不同天气状况的感知数据也极为关键。例如,在雾天行驶时,传感器数据的变化特征以及如何准确识别前方车辆和道路边界,需要大量针对性的数据来训练模型。
数据标注工作在长途接驳场景下更加复杂和细致。标注人员不仅要熟悉各类道路场景的标注规范,还要考虑到不同路段之间的衔接和变化。对于高速公路场景,要精确标注出每个车道的功能(如超车道、行车道、应急车道)、出入口的位置和方向、服务区的距离和标识等信息。在面对天气变化时,需要对不同天气条件下的图像和传感器数据进行分类标注,比如标注出雨天时路面的积水情况、雾天的能见度等级等,以便模型能够学习到不同天气对驾驶环境的影响,并做出相应决策。
此外,长途驾驶过程中的车辆行驶轨迹数据也需要详细标注,包括正常行驶轨迹、超车轨迹、避让障碍物轨迹等,为模型优化提供丰富的样本。
其他场景下的独特数据需求及标注应对
除了上述两种典型场景,WAIC 还展示了如无人安防巡检、智能座舱互动体验等与自动驾驶相关的应用场景,每个场景都有其独特的数据需求和标注挑战。
<图片来源于网络,如有侵权请联系删除>
在无人安防巡检场景中,聚誓科技联动展馆区域开展的无人安防巡检动态演示,需要数据能够准确识别各种安全隐患,如异常人员行为(徘徊、闯入禁区等)、设备故障(冒烟、火花等)、物品丢失或摆放异常等。数据标注时,要对这些异常情况进行精准分类和标注,同时标注出其发生的位置、时间以及相关环境信息,以便无人安防系统能够及时发现并处理问题。
而在智慧座舱互动体验区,汇聚了智己、地平线、上汽通用等品牌的最新智能座舱技术。这里的数据需求主要围绕人机交互展开,包括语音指令识别、手势识别、面部表情分析等数据。对于语音数据,需要标注出准确的语义内容、说话人的情感状态等;手势数据则要标注出手势的类型、动作轨迹和含义;面部表情数据要标注出表情所表达的情绪(如高兴、愤怒、疲劳等)。通过这些细致的标注,智能座舱系统才能更好地理解用户意图,提供更加个性化和便捷的服务。
结语
从 WAIC 所展示的丰富多样的自动驾驶应用场景中,我们清晰地看到,不同场景对自动驾驶数据有着截然不同的需求,而数据标注作为将原始数据转化为有效训练数据的关键环节,正不断创新和优化,以适应这些多元化的需求。无论是复杂的城市道路,还是漫长的长途线路,亦或是新兴的安防、座舱交互等场景,精准、高效的数据标注都是推动自动驾驶技术迈向成熟、实现广泛应用的坚实基石。
随着技术的不断发展和场景的持续拓展,我们有理由相信,自动驾驶数据标注领域将迎来更多的突破与创新,为自动驾驶产业的腾飞注入源源不断的动力。让我们共同期待,在数据与技术的双重驱动下,未来出行将变得更加智能、便捷与安全。