如果说传感器硬件是自动驾驶的“眼睛”,负责“看得见”,那感知系统就起到“看得懂”的作用。感知的算法处理车载的传感器收集到的数据,筛选出有用的信息,生成感知结果,教会车辆辨别障碍物、认路、学会交通规则。自动驾驶车辆对环境理解清晰,才能做出路径规划,进而执行驾驶动作。
像人类考驾照一样,看得见是报名门槛,看得懂是正式学车的第一课。传感器将“看到”的东西转化成了信息量庞大的电信号数据。
相机采集到的就是常见的图像,图像在机器眼里以3维矩阵的数据方式呈现,数据包含了图像的长和宽,以及颜色RGB三通道等信息。
激光雷达采集的数据在感知系统里呈现画面像年轮一样,这些年轮由十几万到几十万个密集的坐标点堆积而成,专业名称叫“激光点云”。点云包含了每个点的三维位置坐标和激光照射到物体的反射强度信息。
根据“眼睛”看到的各种数据,感知通过不同算法处理得出结果。我们将感知系统任务按照不同功能,分成两类:环境感知和障碍物感知。
障碍物感知:算法对可能会影响自动驾驶车辆行驶的周围物体做检测。自动驾驶系统的障碍物感知,遵循着检测、跟踪、预测这三个步骤。首先做3D物体检测,得到他们的种类、数量、位置和距离等;之后对物体进行跟踪、判断他们的运动速度,得到更稳定的检测结果;最终预测各障碍物未来5s左右的轨迹。
环境感知:利用算法识别道路区域、车道线、交通标志、红绿灯等信息,为车辆判断环境,为定位、规划等模块提供信息。我们可以看到,利用不同的数据和算法,同一种任务完成的方式和效果都不同。因此多传感器在算法和数据上相互融合,能得出更稳定、精准的感知结果。
车辆要实现感知,如同婴儿认识世界,要持续不断地教育和训练。深度学习算法和机器学习算法教会车辆“看懂”。我们为不同的感知任务,设计出类似人类大脑神经元工作原理的机器神经网络,神经网络利用海量路测数据,持续训练,加深环境认知,最后将不同感知任务的网络联合起来,得到整个感知系统。
除了靠神经网络去认识环境,还需要给感知系统定规矩,比如路上出现没有见过的东西该怎么做。还要让感知系统知道明辨是非,运用不依赖数据的机器学习算法去告诉感知系统:哪些东西不能碰,什么情况可以通行等等。让自动驾驶车辆“有思想”,做出准确、聪明的感知判断。
元戎启行感知技术优势
快:自动驾驶要做到像人类一样快速感知物体,要靠海量复杂的计算推理。元戎启行的推理引擎,实现了对计算资源的优化,推理速度是普通推理引擎的6倍。 因此算法计算延时很低,检测和分割任务在30ms内就能完成。
准:元戎启行感知技术精准感知车辆150m范围内物体。在繁忙十字路口,障碍物多样、数量庞大、状态多变的复杂场景,经得起考验。自研的多个算法,提升了对体积小、距离远、快速运动物体等较难处理场景的感知效果。
元戎启行的算法在全球多个权威榜单和感知比赛上取得过第一。
稳:元戎启行开发了基于几何的感知算法,和深度学习感知算法相结合,两套算法,保证性能的同时,也非常稳定。在极端天气、复杂场景下、以及面对稀有物体,也能稳定感知。