几种典型特征选择算法的功能实现与性能对比分析(2)

1.2 研究现状 新世纪以来,短短不到20年的时间里,信息数据的存在的量级出现了几何倍数的增长,数据信息爆炸式的增长在近几年里被一个词汇来形容,


1.2 研究现状

  新世纪以来,短短不到20年的时间里,信息数据的存在的量级出现了几何倍数的增长,数据信息爆炸式的增长在近几年里被一个词汇来形容,那就是全球数据大爆炸。这就已经充分的表现出了数据信息的存在量已经达到了一个天文数字级的单位。与之对应到我们的生活和工作中,一切所有我们所牵涉到的数据信息也都变的臃肿起来,更细致、更具象的数据同时也带来了庞大的数据集让我们难以迅速的查找到我们所需要的信息。更别提涉及到数据更庞大的数据挖掘以及深度学习等新型学习领域的研究,因此此时特征选择算法已经成为处理数据的一种不可或缺的手段。

1.3 目的及意义

  本文名为对多种典型特征选择算法的功能实现和性能对比分析,实则是通过特征选择算法对数据的处理,得到不同特征选择之间的异同。从得到的实验结论上分析不同的特征选择算法在不同规模的特征子集的情况下得到的“准确率”。进而选出在同种情况或类似情况下,拥有最优特征子集的特征选择算法的试用范围。通过得到的数据的直观描述,也可以更明显的提供算法之间的对比优劣。

在特征选择算法在各学科领域以及实际应用中大放异彩的情况下,研究经典算法的意义在那?一般认为算法本身固然存在优缺点,但对于具体的问题,具体的研究对象,简单的算法不一定达不到实验目的,而复杂的研究算法并不一定是现实问题所采用的解决方法。因此,经典算法的存在意义就是让我们理解简单问题的解决途径,解决思路,由此推向复杂问题的解决过程,由易到难,一步一步的将复杂问题分割成一个个简单的问题,从而得到其解决方法。实则,更本质的原因在于未来的算法发展趋势必然是多种算法融合的发展模式,或是自己制定规则,标准的‘新型’算法。这类融合算法或者新型算法都明显或隐约的把握住算法的基础,乃至算法思考问题的灵魂,从而达到解决复杂问题或快速解决简单问题的目的。正所谓青出于蓝而胜于蓝,我们研究旧有的经典算法,其本质目的是为了推陈出新,在新的研究算法上才能够一骑绝尘,阔步前行。

1.4 文章框架及结构

第一章 介绍特征选择的背景,现状,研究目的及意义。

第二章 介绍特征选择理论以及特征选择方法的类别。

第三章 介绍本文所选择的特征选择算法的流程步骤,实现代码以及数据样本的获取。

第四章 介绍算法的评估准则和根据评估准则得出的实验结果,并对其进行实验结论分析。

第五章 介绍个人对算法发展和发展趋势的看法,并提出要根据实际问题针对性的选择算法。

第六章 总结本文和做出展望,总结文章整体的思想结构,并象征性的提出文章在实际实验中面临的问题,对这些问题的改进提出展望。

1.5 本章小结

具体的分析特征选择算法的发展背景与现状,提出研究经典特征选择算法的目的和意义。并对文章的整体结构在第四小节提出概述,让读者更易接受并掌握整体文章的脉络。