R-CNN和YOLO自主驾驶的单目视觉目标检测研究

基于单目视觉以目标检测为研究对象,从目标候选框生成、特征提取和分类角度对自主驾驶领域单目视觉目标检测的发展现状进行回顾和综述。


摘要:近年来自主车发展迅速,但其障碍物检测往往依赖于昂贵的雷达设备,极大地增加了自主车的成本。利用相对廉价的单目相机所获取的图像替代雷达来实现目标检测,逐渐成为当今自主驾驶领域研究的热点。首先,本文基于单目视觉以自主驾驶领域的目标检测算法为研究对象,从目标候选框生成、特征提取和分类三个角度对目标检测算法的发展现状进行回顾和综述,阐述了研究基于单目视觉的目标检测算法的重要性和优点;其次,对相关基础知识卷积神经网络和非极大值抑制进行介绍;随后,详细介绍了R-CNN (Regions with CNN features) 和YOLO (You Only Look Once) 两种目标检测算法;接下来,利用R-CNN和YOLO对高速公路上的行车视频进行目标检测;最后,对用于自主驾驶的单目视觉目标检测研究进行总结。

关键词  自主驾驶  单目视觉  目标检测  R-CNN  YOLO

毕业设计说明书外文摘要

Title    Monocular Object Detection Research for  Autonomous Driving                              

Abstract:Autonomous driving has been developing rapidly in recent years. However, most efforts of object detection for autonomous driving are often dependent on expensive radar equipment, greatly increasing the cost of autonomous vehicles. Relatively inexpensive monocular camera as the replacement, that is, a single camera to obtain the image to achieve the object detection, has gradually become a focus of recent research in the domain of autonomous driving. In this paper, firstly, based on monocular vision, the development of object detection in self-driving field are reviewed and summarized from the three aspects of proposal generation, feature extraction and classification. The importance and advantages of research on monocular object detection for autonomous driving are introduced. Secondly, basic knowledge of CNN and NMS are explained. Thirdly, two object detection algorithms which are R-CNN (Regions with CNN features) and YOLO (You Only Look Once) are mainly introduced. Then, experiments about object detection of R-CNN and YOLO on driving video on the expressway are shown and analyzed. Finally, the research on monocular object detection for autonomous driving is concluded.

Keywords  Autonomous driving, Monocular vision, Object detection, R-CNN, YOLO

目   次

1  绪论1

1.1  研究背景及意义 1

1.2  研究现状 1

1.3  总体技术方案及其社会影响 4

1.4  技术方案的经济因素分析 4

1.5  论文章节布局 4

2  相关基础知识 6

2.1  卷积神经网络 6

2.2  非极大值抑制 9

2.3  相关参数含义 10

3  目标检测算法 11

3.1  R-CNN 11

3.2  YOLO13

4  实验 19

4.1  实验平台 19

4.2  数据库描述 19

4.3  评价指标 19

4.4  实验过程与结果分析 20

结论  29

致谢  30

参考文献31

附录A  视频流提取帧图片Python代码 34

1  绪论

本章绪论主要以自主驾驶领域的单目视觉目标检测算法为研究对象,将主要分为5个部分来介绍自主驾驶领域单目视觉目标检测算法:研究背景及意义、研究现状、总体技术方案及其社会影响、技术方案的经济因素分析以及论文章节安排。其中,研究现状部分根据目标检测方法将目标检测分为三个阶段即为:目标候选框生成、特征提取和分类,从这三个角度对自主驾驶领域单目视觉目标检测的发展现状进行综述。

1.1  研究背景及意义

近年来对集环境感知、规划决策、操作控制等功能于一体的自主车的研究发展迅速,目标检测是自主车环境信息感知的核心任务之一[1],但许多原始的目标检测工作往往依赖于昂贵的雷达设备,比如测速发电机、手工标注的环境地图,极大地增加了自主车的成本。相比较而言,随着图像处理、计算机视觉等学科的发展,基于视觉的目标检测利用相对廉价的单目相机来替代雷达设备,即以摄像头所获取的图像来实现目标检测,逐渐成为当今自主驾驶领域研究的热点。双目视觉和多目视觉目标检测方法通常使用多个摄像机从不同角度对同一场景进行监控,利用摄像机之间的视差值来计算场景的深度,这样可以克服外部环境因素的干扰,并能实现背景的实时更新,提高运动目标检测的实时性和鲁棒性[2]。然而,绝大多数汽车只装载了单个相机,因此研究基于单目视觉的目标检测算法具有十分重要的意义。