基于聚类对多个国家信息基础设施的

更新时间:2024-02-05 作者:用户投稿原创标记本站原创 点赞:8777 浏览:33344

摘 要:本文运用R软件对20个国家的信息基础设施发展情况进行分析,最后根据分析结果,将这20个国家分为了三类.

关 键 词 :聚类分析;信息基础设施;SPSS18.0

聚类分析的基本思想是,从一批样品的多个指标变量中,定义能度量样品间或变量间相似程度(或亲疏关系)的统计量,在此基础上求出各样品(或变量)之间相似程度度量值,按相似程度的大小,把样品(或变量)逐一分类,关系密切的类聚集到一个小的分类单位,关系疏远的类聚集到一个大的分类单位,直到所有的样品或变量都聚集完毕,把不同的类型一一划分出来,形成一个亲疏关系谱系图,用以更直观地显示分类对象(样品或变量)的差异和联系.

1.数据收集

根据信息基础设施的发展情况,对世界20个国家和地区进行聚类分析.

2.聚类分析

利用SPSS18.0软件对表1中的数据进行聚类分析,具体操作为:

(1)Analyze-Classify-Hierarchical Cluster Analysis,将所有的变量选入到Variables中,将国家选入Label Cases by.(2)在Statistics选项中,勾选Range of Solutions,在Mininum number of clusters中输入3,在Maxinum number of clusters中输入8.(3)在Plot选项中,勾选Dendrogram(4)在Method选项中.将Cluster Method选择Wards Methods,Tranorm Values:选择Standardize:Z Scores(5)在Se选项中,Cluster Membership: Range of solutions:3-8


聚类分析产生的最重要的结果就树状图.如图1-1所示.通过树状图可以非常直观地看出整个聚类过程和结果.

3.结论

按照上面的树状图,世界20个国家信息基础设施的发展情况可以大体分为3类,具体分类如下:

[参考文献]

[1](美)约翰逊(Johnson,R.A.).实用多元统计分析.清华大学出版社,2008.

[2]薛毅.统计建模与R软件.清华大学出版社.

作者简介:王芳(1981-),女,汉族,陕西西安人,助教,2010年毕业于西安工程大学供热、供燃气、通风机空调工程专业,硕士研究生学历,陕西国防工业职业技术学院在职教师,现从事暖通空调教学研究工作.