基于GoogLeNet特征融合的人脸验证算法研究(2)

神经网络模型通常都是在网络的最后一层得到图像的特征图,然后把这些特征图用于图像识别任务,从而获得识别准确率[2],[3],[4],比如在DeepID[3]中,YiS


神经网络模型通常都是在网络的最后一层得到图像的特征图,然后把这些特征图用于图像识别任务,从而获得识别准确率[2],[3],[4],比如在DeepID[3]中,YiSunetc.先提取出DeepID,然后结合Jointbayesian技术[1]去识别人脸。然而随着网络结构的加深,这时候仅仅用最后一层的特征图用于图像识别未必是最优的结果,我们基于此把深度神经网络中间层的部分特征输出应用到图像识别任务上去,希望找出更优的结果,提高模型的表达能力。

1.2总体技术方案

本文的主要研究内容如下:

(1) 对神经网络和其发展历程进行简单的介绍,其中重点介绍卷积神经网络,从而引出本文的研究方向。

(2) 介绍并实现赢得2014年ImageNet挑战赛的GoogLeNet网络模型,在此模型的基础上进行研究工作。

(3) 在已实现的网络模型中提取人脸的特征图,设计算法完成特征融合,用于人脸识别任务。

(4) 根据所做的实验结果,剖析原因,进一步完善特征融合算法。

我们通过具体的人脸识别模型研究特征融合方法,提高模型的识别准确率。从社会影响的角度来说,本课题的技术方案有助于人脸识别模型在现实生活中的应用,比如说门禁系统可以在识别错误率较低的情况下加入人脸识别模型,这既可以方便人们的生活和工作,也有利于管理;从经济的角度来说,本设计方案的性价比高,这是因为我们在已有技术的基础上提高了人脸检测的正确率,通过特征融合算法改进了识别准确率,研究成本低,实用价值较高。

1.3论文章节安排

本文旨在研究深层神经网络中间关键层的特征是否对图像识别任务有积极的作用,任务包括网络的实现、特征的提取、融合以及人脸验证算法。本文主要安排如下:

第一章, 介绍课题研究的背景及意义,阐述研究的具体内容;

第二章, 简单介绍神经网络的基本知识,帮助学习本文的主要网络结构;

第三章, 本章的主要内容是详细分析GoogLeNet网络的基本结构和组成,并编程实现;

第四章, 本章主要分析了特征融合的算法过程,并完成和实现特征提取、融合及人脸验证算法的设计;

第五章, 主要介绍了针对本课题所做的实验,展示了实验结果,分析了实验结果形成的原因。

2神经网络的基础知识

2.1神经元

在生物学上,神经元是神经系统的基本组成部分,神经元是具有长突起的细胞,由细胞体和细胞突起组成。如下图所示:

神经元的基本功能主要由细胞突起和细胞体来完成的。神经元的突起主要分为两类,如上图所示,分别是树突和轴突。一个神经元细胞通常有多个树突和一个轴突组成,树突的作用是接收刺激并传入细胞体,相当于神经元的输入,而轴突则是把细胞产生的刺激信号传递给其他神经元,相当于神经元的输出。在生物神经网络中,每个神经元和其他神经元相连,当它接收到刺激时,就会向相连的神经元发送电信号,如果接受该电信号的神经元电位超过了一个阈值,那么它就会被激活,向其他神经元发送信号。

受生物体神经元的启发,在机器学习领域,人们将上述的情形抽象为下图所示的简单模型,这就是一直沿用至今的“M-P神经元模型”。

图2.1神经元模型

上图左边表示神经元的输入,表示神经元所接受的多个刺激,表示对应输入的权重,其正负模拟了生物神经元中突触的兴奋和抑制,其大小则表示不同的连接强度。另外,中的表示该神经元的阈值,神经元激活与否与该阈值有关。