视觉定位与地图构建:当眼睛遇上迷宫 想象一下,你蒙上眼睛,被扔到一个完全陌生的房间。你的任务是:摸索着找到出口,并且在这个过程中,画出房间的简略地图。是不是有点像恐怖电影的开场? 这就是视觉定位与地图构建(Visual Localization and Mapping, VSLAM)要解决的核心问题。只不过,蒙上眼睛的是机器人,用来摸索的不是双手,而是摄像头。而那个陌生的房间,可以是茫茫宇宙,也可以是你的卧室。 简单来说,VSLAM就是让机器人在完全未知、没有GPS信号的环境中,仅仅依靠摄像头(以及可能有的其他传感器),一边定位自己在哪,一边绘制周围环境的地图。这听起来是不是有点像科幻小说?但它已经实实在在地应用在自动驾驶、无人机、AR/VR、机器人导航等诸多领域了。 那么,究竟是怎么做到让机器人仅凭“眼睛”就能认识世界呢?这就不得不提到两个关键技术:视觉惯性里程计(Visual Inertial Odometry, VIO)和视觉里程计(Visual Odometry, VO)。 视觉里程计:一步一个脚印的探索 我们先来说说VO。可以把它想象成一个谨慎的探险家,每走一步都要仔细观察周 …