MIT让自动驾驶“透视眼”,破解关键技术影子摄影机ShadowCam

楼主

红旗不倒

236 主题
262 帖子
4759 积分

身份：管理员

E币：2733

发消息

 3475

 0

发表于 2019-11-8 11:02:14

显示全部楼层

现在，研究人员已经透过 AI 技术发展出「感应到影子就停车」的程度，而未来还有哪些地方需要优化，也是值得我们持续探索的问题。
自动驾驶技术已经成为科技领域的一项显学，而如何提升自动驾驶上路后的安全性，也正是许多研究人员们在着手解决的问题。

观察光影变换，就能知晓有「敌人」在逼近 —— 这听起来是不是很像武侠小说呢？
其实没有那么玄，MIT（麻省理工学院）的工程师告诉你，他的 AI 系统就能做到！

为了改善自动驾驶系统的安全性，MIT 的几位工程师近日开发了一个新的系统。它可以识别地面上的影子，进而判断拐角处是否有物体正在靠近车辆。

未来，自动驾驶车辆可以使用这个系统即时避免可能发生的车祸，比如从建筑物拐角出现的车辆和行人。不久的将来，医院大厅里用来传递药品或是提供补给的机器人也可以使用这个系统来避免撞到人。

煞车时间比传统雷达系统快了 1 秒

在一篇即将于下週 IROS 国际会议展示的论文里，研究人员为我们展示了这项成果。研究人员设计了两个场景，在停车场拐角处的自动驾驶车辆和大厅里导航的自动轮椅，当感应到有车辆靠近时，这款基于车辆系统的制动时间（编按：行驶中的汽车从开始刹车到汽车完全停下来所用的时间。）比传统的光学雷达系统（编按：传统的光学雷达系统只能探测到可见物体的镭射雷达。）快了 0.5～1 秒。

研究人员表示，0.5～1 秒看上去很短，但是对于一个快速移动的自动驾驶车辆而言，这不到一秒的提升却很重要。

「在某些场景下，比如机器人在有移动物体和人群的环境中移动，我们的方法可以预先警告机器人，提示有物体正在向角落移动，车辆会根据提示降低速度、调整路线、提前做好准备以避免碰撞。」论文作者、电脑科学和人工智慧实验室（CSAIL）负责人补充道。

「我们的理想是为街上正在快速移动的车辆提供类似『X 光』的视角辅助。」但是，目前这个系统只接受了室内环境的检验。室内的机器移动速度很慢而且光照条件波动很小，这使得该系统很容易探测并分析影子。

破解研发关键技术：影子摄影机 ShadowCam

研究人员基于「ShadowCam」（影子摄影机）系统开发了利用电脑视觉技术检测，并分类地面影子图像的系统。MIT 的 William Freeman 教授和 Antonio Torralba 教授参与了该系统的前期工作（并未在 IROS 论文署名），并在 2017 年和 2018 年的会议上展示了研究结果。

ShadowCam 使用了一连串镜头对准固定区域（比如拐角前的地面区域）进行拍摄，作为系统的输入数据。系统通过分析一张张图片来记录光照强度随着时间的变化，以此推断是否有物体正在远离或靠近。

有些变化肉眼看不见或者很难分辨，因而需要通过物体和环境的多种性质才能做判断。而 ShadowCam 通过分析收集到资讯，将每张图片分类为静止物体或是移动物体。如果系统检测到移动物体，那么系统会自动做出调整。

将 ShadowCam 应用于自动驾驶车辆还需要一些改进。例如，早期版本需要对场地添加增强的标籤（AprilTags，类似简化的 QR Code），机器人通过扫描 AprilTags 来确定自己的空间位置以及行进方向。ShadowCam 利用这些标记代表环境的特点，并重点关注那些可能有影子的像素区域上。但是在实际环境中，使用 AprilTags 是不现实的。

科学家如何克服 ShadowCam 的技术盲点？

于是，研究人员发明了一个新的处理方法，它结合了图像配准和一种新的视觉里程计算技术。在电脑视觉里，图像配准将多个图片重迭起来以发现图片间的变化。例如，医学图像配准将多个医学扫描图像重迭进行比较，用于分析病体在解剖学上的差异。

视觉里程计（已用于火星探测器）可以通过分析一系列图片中的位置和几何空间特徵来实时估计镜头的运动。研究人员使用了 Direct Sparse Odometry（DSO）技术，它可以计算环境中的特徵位点，达到与 AprilTags 标记法类似的效果。

重要的是，DSO 技术可以绘制环境特徵位点的 3D 云图，并利用电脑视觉工程挑选出你关注的某个区域内的环境特徵位点，比如靠近拐角的地面（此前，关注的区域需要事先手动标记）。

ShadowCam 收集了一系列关注区域的图片，因此它需要使用 DSO 图像配准方法将来自同一机器视角的图片迭加分析。尽管机器人在移动，它仍旧可以关注到影子所在的某一小块像素区域，以发现图片间存在的微小差异。

NASA 用 ShadowCam 执行月球任务

另一个技术是信号放大，该技术在第一篇论文中介绍过。包含影子的像素点会提高颜色的亮度以此降低讯号杂讯比。这项技术可以放大影子变化产生的微弱信号，使其能被检测到。如果被增强的信号达到一定的阈值（这部分取决于该像素区域与相邻区域的差异有多大），那么 ShadowCam 会把图片分类为「运动」。根据讯号的强弱，系统会告知汽车或者机器人是减速或是停止。

「检测到这个信号后，你就得小心了，这意味着可能有人正从拐角或是停止的车辆间跑出来，从而让自动驾驶车辆减速或是完全停止。」Naser 说。

完善自驾车 AI 系统的两项测试

在一项测试中，研究人员分别使用 AprilTags 标记法和基于 DSO 的方法评估了系统在分类移动物体和静止物体的表现。当人们经过拐角进入轮椅的既定路线时，自动驾驶的轮椅会朝着大厅拐角的方向走去。两种方法都取得了 70% 的准确率，这表明以后可以不再需要 AprilTags 标记法。

在另一项测试中，研究人员将 ShadowCam 安装到一辆停在地下车库的自动驾驶汽车中，并且关掉了车灯，用来模拟夜间的车辆行驶环境。他们对比了该系统和光学雷达在检测车辆上的表现。实验显示，ShadowCam 检测柱后车辆所用的时间比光学雷达快了 0.72 秒。更重要的是，研究人员将 ShadowCam 调试到适用于车库光线状态的模式，系统的分类准确率达到了约 86%。

接下来，研究人员将继续完善该系统，使其能在不同的室内室外光照条件下工作。未来也会出现各种通过影子检测速度的办法，实现目标区域内的检测影子的自动化。

写原创有奖励！2025面包板原创奖励正在进行中

 举报



 

  7