ELM已经被广泛研究,并且在理论和应用中做出了显着的贡献。 ELM的通用能力已经扩展到内核学习,结果证明相较于经典特征而言,ELM适合于广泛类型的特
ELM已经被广泛研究,并且在理论和应用中做出了显着的贡献。 ELM的通用能力已经扩展到内核学习,结果证明相较于经典特征而言,ELM适合于广泛类型的特征映射。然而,当处理自然场景(比如视觉和听觉信号)或实际应用(例如图像分类和语音识别等)时,会产生一些问题。也就是说,原始ELM和其变体主要关注分类。而在许多应用中进行分类之前通常需要特征学习。因此,通常需要多层解决方案。而基于ELM的自动编码器作为其构建块的多层学习架构,这种自动编码器[10]简单地在层次结构中逐层堆叠,它可以将原始数据分解为多个隐藏层,并且将前一层的输出用作当前输入的输入,它在监督最小均方优化之前,将编码输出直接馈送到最后一层用于决策,而不进行随机特征映射。这个框架没有很好地利用ELM理论的优势,之前的研究已经表明[5],如果没有输入的随机投影,就不能保证ELM的通用近似能力。因此,ELM在多层实现中的潜力尚未完全发掘,需要对基于ELM的多层感知器(MLP)做进一步的研究,以达到更快的训练速度和更好的特征学习和分类性能。
层次学习的另一个主要趋势是深度学习[11](DL)或深度神经网络算法[12](DNN)。类似地,深层架构通过多层特征表示框架来提取特征,并且较高层的表示比较低层的表示具有更多的抽象信息。从概念的角度来看[11]-[15],DL是一种具有无监督初始化而不是常规随机初始化的多层网络的BP学习。DL将多层作为整体用无监督初始化来考虑,并且在这样的初始化之后,整个网络将由基于BP的NN训练,并且所有层被一起硬编码。必须要说的是,对于整个系统,DL框架中的所有隐藏参数需要被多次微调。因此DL的训练过于繁琐和耗时。
从上述分析可以看出,MLP的现有学习算法(包括基于ELM和基于DL的学习算法)不能以快速的学习速度获得良好的泛化性能。在本文中,受MLP理论的启发,我们采用了H-ELM,它进一步提高了原始ELM的学习性能,同时保持其训练效率的优势。
1.2 总体技术方案
(1)基于ELM的新型自动编码器通过l1范数优化开发。与DL中使用的现有自动编码器(即基于BP的NN)不同,所采用的ELM自动编码器的输入权重和隐藏节点偏置都是通过从随机空间返回的路径来建立。[5]中的ELM理论证明,随机特征映射可以提供通用逼近能力,通过这样做,可以利用更重要的隐藏层信息来用于特征表示。与[10]中的l2范数ELM自动编码器相比,这里应用l1范数来产生更多稀疏和有意义的隐藏特征。
(2)采用一种新的H-ELM框架用于高效的MLP。采用的H-ELM包括两个主要部分:(a)无监督的多层特征编码;(b)监督的特征分类。对于特征表示或提取,利用所提出的ELM稀疏自动编码器进行,并且堆栈架构中的每个层可以被认为是单独的部分;对于特征分类,获得的高级特征首先被随机矩阵散射,然后将原始ELM应用于最终决策。应该注意的是,基于ELM理论[5],提取特征的高维非线性变换可以进一步提高特征分类精度。此外,与DL框架中的贪心分层学习不同,在所采用的H-ELM框架中,特征提取和分类是两个独立的自主部分,并且对于通过特征提取和分类组合的整个系统,不需要参数微调,因此训练速度比传统的基于BP的DL快得多。
(3)为了证明所采用的H-ELM框架的优点,针对实际的计算机视觉应用(例如对象检测[2],识别[3]和跟踪[4])开发了几种基于H-ELM的特征提取和分类算法。证实了H-ELM的通用性和能力。
1.3 论文章节安排
本文的章节如下。
第二章介绍相关工作,包括ELM的基本概念和理论;第三章描述了所采用的H-ELM框架及其相关的ELM稀疏自动编码器;第四章比较H-ELM与ELM和其他相关的现有MLP学习算法在各种测试数据集上的性能;第五章介绍所采用的H-ELM在现实中的相关应用,包括汽车检测,手势识别和实时对象跟踪;最后一章得出结论。