基于卷积神经网络的行人检测系统设计

通过研究卷积神经网络以及行人检测的发展,了解了卷积神经网络在图像分类、目标检测领域的优越性。


摘要:行人检测,作为目前目标检测中的研究热门,凭借在人工智能领域取得巨大成功的卷积神经网络,可以实现更好的表现。在本文中,我主要是通过研究卷积神经网络以及传统行人检测算法的发展,了解了卷积神经网络在图像分类、目标检测领域的优越性。根据行人检测的要求,我学习了Faster R-CNN目标检测框架以及特征提取网络模型MobileNet,并且在有限的硬件条件下,根据GitHub上第三方的开源代码实现了一种在TensorFlow上基于MobileNet的Faster R-CNN框架的行人检测方法,同时在Caltech行人检测数据集上实现了约35%的对数平均漏检率,大大超越了传统行人检测的算法。根据该代码,我也在静态行人图像上通过画边界框实现了行人检测的可视化。 同时,我也对卷积神经网络层数的设置对特征提取的影响以及MobileNet的优势与劣势进行了实验与讨论。

关键词: 行人检测;卷积神经网络;MobileNet;Faster R-CNN;TensorFlow

The Design of Pedestrian Detection System Based on Convolutional Neural Networks

Abstract:As a hot topic in the research of object detection,pedestrian detection could perform much better via the convolutional neural networks which has achieved great success in the field of Artificial Intelligence(AI).In this paper,I mainly learn about the superiority of convolutional neural network in the fields of image classification and object detection via the research of the evolution of the convolutional neural networks and the algorithms in pedestrian detection. According to the requirement of pedestrian detection,I study on the object detection framework Faster R-CNN and the feature extraction network model MobileNet,then implement a pedestrian detection technique on TensorFlow by applying Faster R-CNN as the framework which is based on MobileNet via the open source code compiled by third-party on GitHub.Consequently this technique has obtained about 35% log average miss rate on Caltech Pedestrian Dataset,which is far beyond the traditional algorithms.And I also implement the visualization of pedestrian detection by drawing the bounding boxes on the static pedestrian images via this code,as well.Meanwhile I have experiments and discussion about the influence of the setting of the number of layer in convolutional neural networks and MobileNet’s advantages and weak points.            

Keywords: pedestrian detection; convolutional neural network; MobileNet; Faster R-CNN; TensorFlow

目录

摘要 i

Abstract i

目录 iii

1 绪论 1

1.1 行人检测发展现状 1

1.2 卷积神经网络发展现状 2

1.3 有关本文 3

2 Faster R-CNN介绍 4

2.1 FASTER R-CNN的发展历史 4

2.2 FASTER R-CNN框架结构介绍 4

2.3 FASTER R-CNN训练方式介绍 6

2.4 非极大值抑制算法 6

2.5 FASTER R-CNN在目标检测上的具体表现 6

3 MobileNet介绍 7

3.1 深度可分离式卷积 7

3.2 MOBILENET网络结构 9

3.3 MOBILENET的两个超参数 11

3.4 MOBILENET在目标检测方面的优异表现 11

4 在Faster R-CNN上进行行人检测 13

4.1 软硬件配置说明 13

4.2 数据集:CALTECH行人检测数据集 14

4.2.1 数据集转换与预处理 14

4.3 FASTER R-CNN在TENSORFLOW上的实现 15

4.3.1 TensorFlow上实现的Faster R-CNN的特点以及需要注意的地方 15

4.3.2 将TensorFlow上的Faster R-CNN应用在在Caltech行人检测数据集上的具体流程 16

4.3.3 出现的问题与解决方法 19

5 实验 21

5.1 实验条件 21

5.2 实验过程 21

5.2.1 训练时间统计 21

5.2.2 合理利用可视化工具TensorBoard 22

5.3 实验结果 23

5.3.1 漏检率曲线比较 23

5.3.2 行人图像检测画框可视化 24

5.4 对实验结果的讨论 25

6 结论 26

致谢 27

参考文献 28