基于視覺的同時定位與地圖生成方法(vSLAM) 在一定程度上解決了FastSLAM的上述不足,原因是在視覺圖像中包含了比激光傳感數據更加豐富的環境信息。VSLAM的提出得益于視覺圖像處理技術的發展,Lowe 等人提出了一種比例不變特征變換(Scale Invariant Feature Transform,SIFT)73,利用該方法提取的特征簡稱為SIFT 特征。與從視 覺圖像或激光信息中提取的直線、角點特征相比,SIFT 特征對于圖像的縮放、視角、光強等變化具有較好的不變性,這意味著SIFT特征具有更強的魯棒性,在數據關聯過程中不受環境光照變化、環境局部改變、特征部分遮擋以及機器人觀察視角的影響。
Rao-Blackwellized 粒子濾波器因式分解技術同樣被vSLAM所采用,所以vSLAM也 可以稱為基于視覺的FastSLAM。由 于vSLAM所使用的路標特征為SIFT 特征,而每一個 SIFT 特征又具備區別于其他特征的性能(Distinctive), 無論從地圖創建還是從實際應用的角度來說,vSLAM在數據關聯上的可操作性要優于FastSLAM。正如文獻[74]中提到, 在 vSLAM 中,機器人具有較強的“誘拐恢復”能力。主要原因是由vSLAM生成的地圖中 (如圖1.58所示)存在從視覺圖像中提取的路標。當機器人遭遇誘拐時,會根據路標匹 配從誘拐中恢復過來。
vSLAM同樣有其不足之處,正如前文所說,vSLAM借助于SIFT 特征的提取和匹配, 當未知環境中的SIFT 特征較為貧乏時,機器人將難以創建準確度較高的環境地圖。換句 話說,考慮某些極限情況,當周圍的環境為純色時,vSLAM 將無法正常使用。而在典型的 室內或室外環境中,尤其是環境較為混亂時,vSLAM卻具有良好的性能,這與FastSLAM 形成了鮮明的對照。
vSLAM的另一個不足之處是難以提供障礙物準確的相對坐標,這意味著由vSLAM創 建的環境地圖在精度上要劣于FastSLAM。因此,有些研究者采用雙目立體視覺提高地圖 創建的精度。但由于視覺圖像在深度信息上的丟失,視覺定位精度仍然受到圖像匹配和 攝像機參數校正的影響。
vSLAM 的Z后一個不足之處是大規模環境的地圖存儲問題。在何時何處從環境中 提取特征仍然是一個亟須解決的問題。現在較為常用的方法是采用定距離方式獲取 SIFT 特征。也就是機器人每移動一段距離然后停下來從該地點的東南西北四個方向獲取場景圖像并提取SIFT 特征作為路標。由于每一個場景包含幾十到上百個SIFT 特征, 在大規模環境下的地圖精度及地圖規模是需要權衡的一對矛盾。從應用的角度來說,在 vSLAM中的特征提取和特征匹配具有較高的計算負擔,如何保證機器人在vSLAM所創建 地圖中導航時的實時性是一個不可忽略的問題。
![]() |
| 機器人底盤 Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動機器人底盤 商用機器人 智能垃圾站 智能服務機器人 大屏機器人 霧化消毒機器人 展廳機器人 服務機器人底盤 具身智能教育機器人 智能配送機器人 導覽機器人 |