红外波段双目立体视觉系统国内外研究现状

深度感知的目的是从二维图像中得出三维场景的深度信息,是双目立体视觉的重要任务。对于这方面的研究,近年来国内外不少研究者都得出了成果。


红外波段双目立体视觉系统与可见光系统相比,在组成上大致相同,都由图像获取、相机标定、极线校正、立体匹配、深度感知和三维重建等几个部分组成。本文主要研究相机标定、极线校正、立体匹配合深度感知4个部分,接下来分别介绍这4个部分的研究现状。

1 、相机标定

    相机标定就是寻找三维场景中一点在像素坐标系中坐标,从而建立两个坐标之间的关系。建立这个关系后,根据像素坐标就可以反推世界坐标,进一步求得相机参数。相机参数一般分为内部参数和外部参数,内部参数包括相机焦距、光学中心坐标、旋转因子等;外部参数包括旋转矩阵和平移矩阵等。内外参数都可以反映世界坐标系和像素坐标系的映射关系。

   相机标定是由摄影中对镜头的校正发展来的[ ],后来在计算机视觉领域逐渐得到发展并成为一大热点问题。 1987 年,Tsai在综合前人工作的基础上,提出了一种基于径向排列约束的两步标定法。 Weng等人弥补了Tsai基于径向排列约束的标定法的不足,将切向畸变的不足引入相机模型中,从而使得两Tsai的方法在畸变非常严重的相机标定时也得到应用。微软研究院的Zhang[ ]提出了一种基于平面模板的相机标定法,不再使用制作成本较高的三维标定物,而使用更加简单二维棋盘格作为板。该方法在采集板图像时,要求二维棋牌格板相对于机有不同的旋转和平移,但是不需要知道具体运动参数,通过提取出的方格角点坐标计算相机参数,并同时考虑了径向畸变,最后优化得到所有参数。

    除去以上标定法,其他的研究者们也提出了一些其他的标定方法。Faugeras基于射影空间绝对二次曲线,推导出了相机内参数的Kruppa方程,并首次提出了相机自标定的概念。在国内,中科院的马颂德[ ]提出了基于纯平移运动的主动视觉相机标定方法,通过控制平台让相机在三维空间内做三次两两正交的平移运动,获得相机参数的约束条件后进而求解相机参数。

   从成像模型的角度来说,相机标定理论在红外波段和可见光波段是通用的。为了在红外波段更好的成像,在相机标定方面目前主要集中于研究红外方面。

2、 极线校正

   通常情况下,对于双目立体视觉系统,在设计时都会严格要求双目相机摆放位置满足光轴平行且等高的理想状态。从而使得得到的图像对满足极线约束,在立体匹配时只需进行一维搜索。而在实际情况中,双目相机基本不可能达到理想情况,又或者根本不能确定相机到底处于什么状态,此时在立体匹配时需要进行二维搜索,这样使得算法的复杂度增加不少。因此,对于拍得的图像必须进行极线校正。极线校正后,这两幅图像只在水平方向上存在视差,即满足极线约束。极线校正大大提高了立体匹配的成功率。

   极线校正的研究开始于20世纪90年代。Hartley最先对以往的极线校正理论进行总结研究,在此基础上提出了一种线性的极线校正方法[ ]。Loop也提出一种极线校正方法,是先进行射影变换,在进行仿射。但是射影变换过程需要解非线性方程,使得稳定性得不到保障。在2000年Fusiello[ ]提出了一种不同于前人的快速解决问题的极线校正方法,但需要先求得相机的旋转矩阵,且相机的视角相差不多,于2011年又对这种方法进行改进提出新的极限校正方法,但还是存在一些问题。国内东南大学的林国余教授[ ]等提出了不需要基础矩阵的极线校正方法,通过将变换矩阵分解为平移变换、旋转变换、标准投影变换和竖直坐标变换,结合匹配点进行优化,对有较大旋转和平移的情况仍能取得较好的校正结果。