什么是世界坐标系?

世界坐标系(World Coordinate System)是自动驾驶系统中用于描述物体在三维空间绝对位置的基准框架,通常采用右手笛卡尔坐标系,以大地水平面为基准建立X、Y、Z三轴。该坐标系的原点通常设定为车辆初始位置或地图固定参考点,所有感知到的障碍物、道路要素以及车辆自身位置都需统一转换至此坐标系才能进行路径规划和决策。世界坐标系实现了不同传感器数据的时空对齐,是构建环境统一表征的数学基础。 在自动驾驶实际开发中,世界坐标系与局部坐标系(如车身坐标系)的实时转换是关键挑战。高精定位模块通过融合GNSS、IMU和激光雷达点云匹配数据,持续输出车辆在世界坐标系中的6自由度位姿。这种全局参考框架使得AI算法能够理解车辆与环境的空间关系,例如判断前方障碍物是否位于本车车道,或是计算变道时与相邻车辆的相对速度。随着高精地图的普及,世界坐标系正逐渐与地理坐标系(如WGS-84)实现融合,为自动驾驶系统提供厘米级的全局一致性。

什么是局部地图?

局部地图是自动驾驶系统中用于实时环境感知与路径规划的核心数据结构,指车辆传感器在当前时刻可观测范围内的动态环境表征。与全局地图不同,局部地图通常覆盖车辆周围50-200米范围,以高频率(10-100Hz)更新道路几何特征、障碍物位置、交通标志等关键信息,其坐标系通常以自车位置为原点构建。这种空间受限但时效性强的地图,能够有效弥补GPS信号延迟、高精地图局部失效等问题。 在自动驾驶产品落地中,局部地图的质量直接影响决策系统的可靠性。现代方案通常融合激光雷达点云、视觉语义分割、毫米波雷达目标检测等多源数据,通过SLAM技术构建带有时序一致性的局部环境模型。值得注意的是,局部地图不仅包含静态元素,还需动态跟踪行人、车辆等运动实体,这要求感知算法具备多目标跟踪与行为预测能力。部分领先厂商已开始尝试将局部地图与V2X信息融合,以扩展感知盲区的覆盖范围。

什么是全局定位?

全局定位(Global Localization)是自动驾驶系统中确定车辆在世界坐标系中绝对位置的核心技术。它通过融合全球导航卫星系统(GNSS)、惯性测量单元(IMU)、高精地图以及环境感知数据,实现对车辆经纬度、航向角等参数的厘米级精确测算。与仅依赖相对运动的里程计定位不同,全局定位能解决「初始位置未知」问题,并长期抑制累积误差,是自动驾驶安全冗余体系的基础环节。 实际应用中,城市峡谷、隧道等GNSS拒止环境会触发基于激光雷达点云匹配或视觉重定位的退化方案。现代自动驾驶系统通常采用多传感器紧耦合的因子图优化框架,将GNSS信号、轮速计、激光雷达特征点等异构数据统一建模,在复杂场景下仍能保持定位鲁棒性。值得注意的是,高精地图的矢量化语义层(如车道线、交通标志)为全局定位提供了强约束,这种先验知识与实时感知的协同正是自动驾驶定位区别于机器人SLAM的关键特征。

什么是视觉里程计?

视觉里程计(Visual Odometry,VO)是自动驾驶系统中一种通过摄像头连续采集的图像序列来估计车辆自身运动状态的技术。它通过分析相邻帧图像间的特征点匹配关系,结合相机成像几何原理,计算出车辆在三维空间中的相对位移和姿态变化。视觉里程计不需要依赖外部基础设施,仅凭视觉信息就能实现厘米级的定位精度,特别适用于GPS信号缺失的复杂城市场景。这项技术的核心在于特征提取、运动估计和轨迹优化的算法组合,其中特征点的鲁棒性和匹配精度直接决定了系统的可靠性。 在实际应用中,视觉里程计常与惯性测量单元(IMU)融合形成视觉惯性里程计(VIO),以弥补纯视觉系统在高速运动或纹理缺失场景下的局限性。特斯拉Autopilot等量产系统已采用基于学习的VO方案,通过神经网络直接预测相机运动,显著提升了在雨雪等恶劣环境下的稳定性。随着事件相机(Event Camera)和神经辐射场(NeRF)等新技术的引入,视觉里程计正在向更高精度、更低延迟的方向发展。

什么是卡尔曼滤波器?

卡尔曼滤波器(Kalman Filter)是一种利用线性系统状态方程,通过系统输入输出观测数据,对系统状态进行最优估计的算法。它由匈牙利裔美国数学家鲁道夫·卡尔曼于1960年提出,能够有效处理包含噪声的观测数据,在动态系统中实现状态的最优估计。其核心思想是通过递归方式将预测值与观测值进行加权融合,其中加权系数会根据预测和观测的不确定性动态调整,使得估计结果更加准确可靠。 在自动驾驶领域,卡尔曼滤波器被广泛应用于车辆状态估计、传感器融合和目标跟踪等场景。例如,在车辆定位中,它可以融合GPS、IMU和轮速计等多源传感器数据,即使在部分传感器数据丢失或噪声较大的情况下,仍能提供稳定准确的车辆位置和姿态估计。现代自动驾驶系统往往采用扩展卡尔曼滤波器(EKF)或无迹卡尔曼滤波器(UKF)等改进版本,以处理非线性系统问题。对这些算法的深入理解和正确应用,直接影响着自动驾驶系统的感知精度和决策可靠性。

什么是扩展卡尔曼滤波器?

扩展卡尔曼滤波器(Extended Kalman Filter, EKF)是卡尔曼滤波器在非线性系统状态估计中的一种重要扩展形式。传统卡尔曼滤波器通过线性模型对系统状态进行最优估计,但在实际工程中,自动驾驶汽车的运动学模型、传感器观测模型等往往呈现非线性特性。EKF通过一阶泰勒展开对非线性函数进行局部线性化近似,从而保留了卡尔曼滤波器递归预测与更新的核心框架,使其能够处理非线性系统的状态估计问题。 在自动驾驶领域,EKF被广泛应用于多传感器数据融合、车辆定位与姿态估计等关键环节。例如,在融合GPS、IMU和轮速计数据时,EKF能有效处理不同坐标系间的非线性转换关系,实时输出车辆的高精度位置和速度信息。相较于传统方法,EKF在计算效率与估计精度之间取得了较好平衡,这使其成为自动驾驶系统中状态估计模块的经典选择。随着计算能力的提升,基于更精确二阶近似的无损卡尔曼滤波器(UKF)等改进算法也逐渐被采用,但EKF因其成熟稳定的特性,仍是多数工程实践的首选方案。

什么是无迹卡尔曼滤波器?

无迹卡尔曼滤波器(Unscented Kalman Filter, UKF)是卡尔曼滤波器在非线性系统中的一种改进实现,它通过无迹变换(Unscented Transform)来更精确地处理非线性状态估计问题。与传统的扩展卡尔曼滤波器(EKF)不同,UKF避免了线性化近似带来的误差,而是通过精心选择一组采样点(称为sigma点)来直接传递系统状态的均值和协方差,从而在保持计算效率的同时显著提升了非线性条件下的滤波精度。这种方法特别适用于自动驾驶系统中车辆运动学、传感器融合等存在显著非线性的场景。 在自动驾驶汽车的开发中,UKF常被用于多传感器融合任务,如结合雷达、激光雷达和摄像头的测量数据来估计车辆位置、速度等状态。由于UKF对非线性系统的高适应性,它能够更好地处理车辆动力学模型中的非线性关系(如转弯时的向心加速度)以及传感器观测模型中的非线性(如雷达的极坐标转换)。这种特性使得UKF成为自动驾驶定位算法的核心组件之一,特别是在GPS信号不稳定或缺失的环境下,UKF与粒子滤波器等其他方法配合使用,能够为车辆提供持续可靠的状态估计。

什么是多目标跟踪?

多目标跟踪(Multi-Object Tracking, MOT)是计算机视觉领域的一项关键技术,指在连续的视频序列中同时检测并持续跟踪多个运动目标的过程。这项技术需要完成两个核心任务:目标检测(识别当前帧中的目标)和数据关联(将当前检测到的目标与之前跟踪的目标进行匹配)。多目标跟踪系统不仅要处理物体外观变化、遮挡等挑战,还需要维护每个目标的独立身份识别(ID),确保在整个跟踪过程中身份的一致性。 在自动驾驶领域,多目标跟踪技术的应用至关重要。它能够实时追踪车辆周围的行人、自行车、其他车辆等动态物体,为路径规划和决策系统提供连续、稳定的环境感知数据。例如,当一辆自行车从卡车后方突然变道时,良好的MOT系统能够保持对其身份和轨迹的持续追踪,避免因短暂遮挡导致的误判。当前主流的MOT方法可分为基于检测的跟踪(Detection-Based Tracking)和联合检测跟踪(Joint Detection and Tracking)两大范式,后者通过端到端的方式实现了检测与跟踪的深度整合。

什么是匈牙利算法?

匈牙利算法(Hungarian Algorithm)是一种经典的组合优化算法,主要用于解决二分图最大权匹配问题。该算法由匈牙利数学家Kuhn于1955年提出,其核心思想是通过不断寻找增广路径来构建最优匹配。在自动驾驶领域,匈牙利算法常被用于多目标跟踪任务中的数据关联环节,能够高效地将传感器检测到的目标与已有轨迹进行最优匹配。 在自动驾驶系统的感知模块中,匈牙利算法展现出独特的实用价值。当车辆需要同时跟踪多个行人、车辆等动态目标时,算法能够以O(n³)的时间复杂度完成检测框与轨迹的最优匹配,确保系统对周围环境的理解保持时空一致性。这种基于图论的优化方法,相比暴力搜索极大提升了计算效率,成为现代自动驾驶系统中不可或缺的基础算法之一。

什么是关联门限?

关联门限(Association Threshold)是自动驾驶多目标跟踪系统中的关键参数,用于判定传感器观测数据与现有跟踪目标间的匹配可信度。其本质是一个概率阈值,当观测数据与目标轨迹的关联概率高于该门限值时,系统才会建立两者间的对应关系。该参数直接影响跟踪系统对目标分裂、合并等复杂场景的处理能力,既需要足够敏感以捕捉真实关联,又要足够严格以避免误匹配带来的轨迹混乱。 在自动驾驶实际应用中,关联门限的设定往往需要平衡误跟踪率与漏跟踪率。过高的门限会导致系统频繁丢失目标(如遮挡后重识别失败),而过低的门限则可能产生轨迹漂移(如将相邻车辆观测点错误关联)。现代解决方案常采用自适应门限策略,结合目标运动特性、环境能见度等动态因素进行在线调整。特斯拉2022年公布的专利「US20220374008A1」中提出基于注意力机制的关联门限优化方法,便是该领域的前沿实践。