高性价比双目相机在商用车智驾领域价值亮点及未来启发

作为世界第一大商用车市场,中国商用车市场正处于转型升级的关键时期。近年来,无论是相关政策法规的出台,还是技术、方案的革新,商用车行业的发展始终围绕着保障安全和提高效率的核心主题。

10月28日,元橡科技CTO任杰出席商用车安全大讲堂线上交流会,从综合立体视觉解决方案价值亮点及未来启发的角度,分享和探讨高性价比商用车智驾系统研发量产实践。(以下为部分交流内容整理。)

关于商用车的安全与效率,我们在关注什么?

相比于乘用车而言,商用车既作为一种交通运输工具,也是我们日常经济活动中重要的生产资料。提高商用车的安全与效率,具体来说,我们可以延展出一些关键词,比如“节能环保”、“物流与交通设计”、“智慧城市”……以及我们重点关注的“智能驾驶主动安全”这一领域。

在商用车的营运过程中,普遍存在的一些隐患和问题包括:

l司机易疲劳驾驶,工作环境恶劣

l容易造成司机盲区,产生安全事故

l商用车质量惯性大,提速慢,司机驾驶习惯匀速,节省油耗

l急刹车对商用车司机造成严重安全伤害

l……

而现有的商用车智能驾驶系统仍存在着较大的“漏报”和“误报”的局限性。“漏报”也就是近来常常见诸报端的一些事故,比如撞上前方侧翻车辆等;“误报”则是感知系统会把一些不存在或没有风险的目标错误地识别,例如把地面上的一些画、幻影当成是真正的行人,从而产生了不必要的规避。

在漏报和误报之间取得均衡,提升整个智能驾驶系统的上限,是业内孜孜不倦追求的一个目标,因为人类社会驾驶场景里面还存在太多的长尾效应,太多目前常规的系统还不能克服的一些困难。

image.png

漏报(撞上前方侧翻车辆)丨来自互联网公开资料

image.png

image.png

误报(道路平面上的虚假行人)丨来自互联网公开资料

从场景规模和难度上我们把智能驾驶系统分成几大层次:

i.其一就是规模小一点、难度也低一点的封闭场景,比如港口、矿区无人驾驶;

ii.再往前,我们现在有很多物流企业,包括乘用车也已经在推进高速场景的NOA等等,当然,这种智能驾驶系统里也都存在着上述所提到的一些局限性;

iii.而到最后,我们真正希望推动的是在人类社会生活中更主要的一些场景,比如城市道路上,是不是能够有更好的系统去辅助人类司机,替代人类去完成一些艰苦的工作。这就要求系统具备强大的理解场景的能力和细节把握的能力,要求系统感知的信息足够稠密和高效。

image.png

这是智能驾驶发展和演进的趋势,而为了更好地解决当前智能驾驶的局限,面向未来更高阶的智能驾驶发展趋势,元橡科技始终专注推动“综合立体视觉”解决方案。

为什么是综合立体视觉解决方案?

双目立体视觉是人眼仿生学,它基于三角测量原理,通过视差和距离之间的反比关系,对周围环境能得到一个三维的感知。而我们提出的“综合立体视觉”的概念,在双目相机感知传感器的基础上,还要配合大脑中枢,把立体视觉和AI充分结合起来,去达到一种高效能的感知和处理能力。

元橡科技双目立体视觉的特点:低成本&高性能

l 图与RGB图天然对齐

l立体信息可识别对象,降低对样本量和硬件算力要求

l全类型对象检测,降低长尾效应风险

l局部可见障碍物、模糊目标均能测量

l百米检测误差小于5%,不依赖地面

l拓展性强,如限高、限宽、地形检测

l图像分辨率提高,小目标识别性能倍增,算力基本增加不大

和目前大家比较熟知的一些传感器(激光雷达、4D毫米波等)对比,元橡双目相机的立体视觉成像所包含信息的丰富程度是非常高的,我们常说一图胜千言,这是双目相机非常擅长并且应该发挥作用的地方,而从精准度上来讲,双目立体视觉测距性能已经非常快速地逼近激光雷达的性能。

高性价比的优势,决定了双目立体视觉系统成为实现商用车安全与效率平衡的可行性方案。

元橡自研的Deep Fusion架构很大程度上提高了系统鲁棒性和安全闭环保障。Deep Fusion框架融合视差和AI能力,可以实现目标类型的“N+1”,真正做到全类型障碍物检测,大大降低长尾效应的影响。

image.png

image.png

Deep Fusion特点:

l有效结合图像与视差信息,准确描述障碍物3D属性

l较低的算力需求下实现更远的检测能力

l全类型障碍物的检出能力

l提升融合毫米波能力:融合需要的目标空间位置和类别属性同时具备

其中“N+1”目标类型,“N”指车辆、行人、自行车、交通标识等指定多类型检测目标,通常用AI语义处理分析,而“1”则是指一些通用障碍物,比如树丛、栅栏,以及路面施工铁板等不知道什么时候出现的未知类型。对于这些,我们人类有很好的感知和避障能力,但目前的很多系统,尤其是单目系统,就很难去很好地识别。

image.png

image.png

元橡综合立体视觉解决方案

所以这也就是我们为什么希望给业界推荐综合立体视觉解决方案,因为我们看到了在这些方面上,我们提出的“N+1”完备目标检测新范式具有更好的泛化性、通用性,可以应用到更多的实际场景。比如商用车的限高,车身较高的商用车在通过一些桥梁、山区涵洞的时候如果发生刮蹭,带来的经济损失是非常大的,通过双目相机可以去做高度可通过性的检测,相类似的还有通过狭窄通道时的限宽预警等。立体视觉技术在诸如此类的场景需求上已经有了一些很好的应用,落地之后也得到了比较好的反馈。通过提前给到司机辅助性的信息和警告,可以有效避免一些刮蹭事故和经济损失。

高性价比商用智能驾驶的未来启发

首先,目前在乘用车上有两方面很强烈的趋势,一是高分辨率,二是大角度周身环绕。我们认为,未来在乘用车先行的技术带动下,商用车也会往这个趋势去应用和发展。

目前可能1M、2M的分辨率是主流,后期分辨率会变得越来越高。现在乘用车有很多新的旗舰车型开始上8M的前视,甚至是周视的设备,在周视环绕感知的传感器方案里,视觉是起到非常大的作用的。如果我们把车看成是泛机器人,有了比较好的感知传感器,它就有了很好的视野、触觉等感官,这样它就可以更智能地去做一些决策和判断,来更安全、快速、高效地完成运输任务。

而从今年特斯拉的AI Day展示的Tesla Occupancy Networks看,它基于车身一圈的传感器,通过占有网格的神经网络和大量的数据训练而得到一种相对比较直观的视觉效果。其实类似的这种三维感知的能力元橡很早之前也就能做到了,我们并不需要那么多复杂的传感器阵列,只是通过简单的双目立体视觉,同时也不需要那么大量的数据积累和数据闭环训练、标注维护。在三维环境感知方面,立体视觉的空间表达更精细,颗粒度更细,精准度也更好,这也是立体视觉高性价比和高性能的体现。

image.png

Tesla Occupancy Networks丨来自互联网公开资料

image.png

元橡高性价比的“Occupancy grid map”空间表达

高分辨率视觉传感器、大角度视场角(FOV)以及周身环绕感知能力将成为未来商用车智能驾驶系统的重中之重,是我们对于未来工作的展望和启发。

总体来讲,对于商用车发展的思考,我们始终认为是“安全第一”,在保障社会运转和人身安全的基础之上,再去提高运输效率,通过科技赋能,辅助司机改善工作环境,减轻劳动强度,规避分心和盲区等因素导致的安全隐患。元橡科技将致力于综合立体视觉解决方案,从更好的感知出发,实现更好的决策,更好的执行,最终得到更好的安全和效率。

image.png

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

Baidu
map