基于GoogLeNet特征融合的人脸验证算法研究

本文主要介绍了NN(NeuralNetwork)的基础知识,并详细分析了本文研究的深层神经网络——GoogLeNet网络,并实现了该神经网络。


摘要:随着神经网络和深度学习的快速发展,CNN现已广泛应用于人脸识别、图像分类、图像分割、物体检测等研究领域。其中有一种特殊的网络结构GoogLeNet在人脸识别任务中有着出色的表现,其基本思想是用大量的人脸图片来训练网络,然后抽取网络的最后一层输出作为强有力的特征,以此来完成人脸识别任务。

此外,考虑到深度神经网络的拓扑结构,除了网络最后一层输出的特征之外,网络的中间层输出往往也包含了很多最后一层不具有的重要的特征,所以从特征融合的角度对中间关键层的特征输出进行了研究,实验结果表明融合了关键层的特征有利于提高模型的识别能力。

关键词卷积神经网络深度学习GoogLeNet特征融合

毕业设计说明书外文摘要

Title    Deep Feature Fusion for Face Verification  

Abstract:With the rapid development of neural network and deep learning, convolution neural network is widely used in face recognition, image classification, image segmentation, object detection and other research fields. There is a special network structure GoogLeNet in the face recognition task has a good performance, the basic idea is to use a large number of face images to train the network, and then extract the last layer of the network output as a powerful feature, in order to complete face recognition task.

In addition, taking into account the depth of the neural network topology, in addition to the output of the last layer of the network, the middle layer output often contains a lot of the important features which the last layer does not have. Therefore, the output of the middle key layeres is studied from the perspective of feature fusion. Experimental results show that the features of the key layer are beneficial to improve the recognition ability of the model.

Keywords  CNN  Deep Learning  GoogLeNet  Feature Fusion

目次

1引言 1

1.1工程背景和意义 1

1.2总体技术方案 1

1.3论文章节安排 2

2神经网络的基础知识 3

2.1神经元 3

2.2神经网络 5

2.3卷积神经网络 6

2.4本章小结 7

3GoogLeNet网络 8

3.1Inception模型 8

3.2GoogLeNet网络实现 10

3.3本章小结 12

4特征融合算法设计 13

4.1算法设计思路 13

4.2算法实现 13

4.3本章小结 16

5实验与结果分析 17

5.1GoogLeNet网络的训练 17

5.2模型测试及结果分析 17

结论 24

致谢 25

参考文献 26

1引言

1.1工程背景和意义

1945年,人类历史上的第一台计算机ENIAC诞生,从此计算机飞速发展。在21世纪初,互联网时代来临,信息社会让科技近一步发展。早在几年前,人工智能就已经不是一个新颖的词汇了,智能通常在我们的理解中有着几个重要的特征:首先就是要具有感知能力,可以获取外部信息;另一方面,记忆和思维能力也是不可缺失的,对应于计算机中的存储和对信息的处理能力;当然,学习能力是智能最重要的体现,学习能力代表了可以独立解决一些问题的能力。人工智能的目标很简单,就是由人去创造一些具有智能特征的系统或机器,它的研究范围很广,其基本内容包括知识表示、机器学习等方面。

近年来,随着AlphaGo[18]击败职业围棋选手,深度学习[13],[7],[15],[9]渐渐为人们所知。在计算机视觉领域,有着一个超大型的图像数据库,建立于2009年,称为“ImageNet”。随之产生了以此数据集为基础的大型图像识别竞赛ImageNet挑战赛,于2010年第一次举办。2012年,Hinton教授和他的两个研究生将深度学习的知识应用于ImageNet比赛上,提出了AlexNet[13]网络模型,该网络是一个八层的卷积神经网络模型。自此以后,深度神经网络模型一直在ImageNet挑战赛中占据着很重要的位置。2014年,Google团队凭借着提出的一个22层的GoogLeNet网络[7]模型获得图像识别的冠军;2015年,一个新的深度网络——深度残差网络(ResNet)[15]得了ImageNet挑战赛的冠军。