资讯中心

机器也能看见世界这背后的技术是什么?

来源:雷锋网 原标题:机器也能看见世界 这背后的技术是什么?
2016/5/23 9:22:03
36312
导读:搭载Realsense的3D摄像头能够帮助机器实现查看环境物体“深度”信息,通俗点讲,只需一个手势、一个眼神或者一个动作,电脑就知道你想做什么。
  【中国智能制造网 技术前沿】上个月的2016IDF大会上,英特尔终于向外界推出了Realsense技术的SDK和机器人开发工具包以及无人机平台。搭载Realsense的3D摄像头能够帮助机器实现查看环境物体“深度”信息,通俗点讲,只需一个手势、一个眼神或者一个动作,电脑就知道你想做什么。
  
激光雷达
 
  看似很酷炫的技术,实际上并没有外界想得那么高大上。
  
  Realsense之所以能够识别物体的深度信息,关键在于其具备三维重建功能。而能与Realsense齐名甚至是比Realsense更好的产品比比皆是,我们所知道的无人机、机器人以及无人驾驶汽车当中的壁障或路径规划等功能都基于三维重建技术。
  
  说到这里你也许会认为这些产品的技术原理并无差异,那么事实真是如此吗?
  
  随着三维重建的技术方案在不断成熟,其方案也是层出不穷。目前,业界主流的方案就有视觉和激光雷达两大类,例如Realsense和Leapmotion以及Kinect就是用视觉方法来实现环境感知功能,而激光雷达则是无人驾驶和扫地机器人等领域的核心一环。那么为什么出现多种方案呢?它们到底有什么差异?
  
  单目/双目视觉
  
  这种技术是利用摄像头来获取象物体表面信息,根据摄像头的数量,我们可以分为单目视觉和双目视觉。
  
  谈到三维重建技术,早可以追溯到上世纪60年代,当时的研究人员已经展开了双目视觉的研究,正是因为双目立体视觉的出现,业界才向现代计算机视觉技术迈进了一大步,从以往二维图像的分析导入到了三维场景,说双目视觉技术是三维重建的鼻祖并不为过。
  
  其原理比较简单,双目视觉设备直接通过两个红外传感器/摄像头从不同角度同时获得被测物的两幅数字图像,然后基于视差原理恢复出物体的三维几何信息,重建物体三维轮廓及位置,这种没有主动发射光源的也被叫做被动三维视觉。
  
  然而,在有两个摄像头的情况下如何甄别是否是同一个信息点是一个难题,这对软件算法提出了很高的要求。在这样的背景下,单目视觉问世了。
  
  单目视觉,顾名思义,只用一个摄像头来接收信息,因为比双目视觉系统少了一个接收端,所以在摄像头的另一侧需要一个结构光发射光源来填补空缺,相应的我们可以称之为主动视觉。英特尔Realsense是典型的单目摄像头 结构光的代表。因为结构光发射的是一个已知的图案,仅有的摄像头接收到了经过物体表面反射的图案之后,就可以经过图像处理计算出和原始图案的差异,后就实现了三维重构。
  
  使用视觉方法做三维重构的短板很明显,单目和双目鲁棒性都很差,这种系统的精度会随着周围环境的变化而受到影响,我们分别以双目和单目视觉举个例子:目前好的双目视觉方案精度可以做到几毫米甚至是零点几毫米,但这是在佳环境下的数值,当外界光线由强变弱时,双目视觉的精度会大打折扣,因为双目摄像头感知图像的能力会变弱,获取的图案也自然而然变得越来越模糊,这与手机摄像头的拍摄原理类似。
  
  而单目视觉恰恰相反,结构光的硬伤是“见光死”,它只适合光线较暗的环境,如果周围的光线很强,摄像头就很难准确的识别亮点,所以结构光法到了室外就显得有些水土不服了。
 

热门评论

上一篇:降低成本 3D打印技术如何用于模具制造行业?

下一篇:FDM等到期 如何开创3D打印技术下一代?

相关新闻

<