多元统计分析随着时间的推移,统计方法推陈出新,对于大数据以及多维度数据的处理方式越来越灵活简便.在数学建模中面对各种复杂繁琐的问题时,运用多元统计分析可以更快速的抓住其中
摘 要: 本文主要探究多元统计分析在数学建模中的应用.其中主要介绍了聚类分析、主成分分析的基本理论知识,并且结合所遇到的实际建模问题利用两种分析方法进行简单的数据整合、处理和分析,从而更快速的解决较为复杂的数学建模问题.
关键词: 聚类分析;主成分分析;多元统计分析
Application of Multivariate Statistical Analysis in Mathematical Modeling
Abstract: This paper mainly explores the application of multivariate statistical analysis in mathematical modeling. This paper mainly introduces the basic theory knowledge of clustering analysis and principal component analysis, and combines with the actual modeling of problems using two methods of analysis for simple integration, data processing and analysis, thus more complex mathematical modeling problems could be more quickly solved.
Key words: Cluster analysis;Principal component analysis;Multivariate statistical analysis
目 录
摘 要 1
引言 2
1. 聚类分析 3
1.1 相似性度量 3
1.2 变量聚类法 3
2. 聚类分析在数学建模中的应用 4
3. 主成分分析 5
3.1 基本思想及方法 6
3.2 主成分估计 7
4. 主成分分析在数学建模中的应用 9
5. 结论及展望 10
参考文献 12
致谢 13
多元统计分析在数学建模中的应用
引言
多元统计分析起源于经典统计学,是其中一种比较综合的分析方法.它是数理统计学中应用比较广泛且相对重要的一个分支,它可以在数量较多的研究对象或指标相关的情况下,统计解析它们的规律.多元统计分析具有方法多样、视角独特等特点,在实际应用中深受广大研究者的喜爱和充分应用,并且在这方面的研究中,不断完善其体系,创造更好的研究方法.比较经常用到的多元统计方法有如下几种:聚类分析、判别分析、主成分分析、因子分析等.
数学建模着重于对生活中问题的解决,近些年来数学建模的问题基本来源于应用领域中遇到的问题,其往往体现出庞大的信息量与数据量,因此如果要从看似没有章法的信息中提取出有用且有一定规律的结论,这意味着对复杂的数据与信息要有更好的分析方法和处理手法.刘青桂(2013)[1]解决酿酒葡萄分级模型建立问题时使用了聚类分析法,江开忠(2012)[2]针对重金属污染问题和小麦发育后期茎秆特征和抗倒性问题进行数据了多元统计分析,而杜海霞(2007)[3]则应用了主成分分析法解决了脑卒中的发病规律与环境因素的分析探讨问题,李春林(2013)[4]综合论述了在数学建模问题中灵活运用多元统计分析方法的一些技巧.
本文主要分为三个部分,第一部分主要介绍了聚类分析法的相关知识,并且就售货员售货量与受教育程度之间的关系进行聚类分析;第二部分介绍了主成分分析法的相关知识,并对中学生体征信息进行了简单的主成分分析;第三部分则是对前两部分内容进行总结,得出结论:应该更好的掌握多元统计分析方法,且运用其帮我们解决数学建模问题.
1. 聚类分析
人们将客观世界中所认知的事物进行细致的分类,比方说生物学研究者根据生物的习性与特征分为不同的类别,飞禽走兽,花鸟虫鱼,这也是人类认识这个世界最原始的技巧.在生活里遇到的问题中,对事物进行分类研究比将它们放在一个笼统杂乱的集体里进行研究来得更加简明和高效.据此,给出聚类分析的定义:一种把研究对象区分成相对来说具有相同性质的群组的统计分析方法.
1.1相似性度量