聚类分析

来自Wiki.Citydatum
跳转至: 导航搜索
提示:该页面还需进一步完善,欢迎加入我们!


聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。聚类分析可应用于很多领域,包括数学,计算机科学,统计学,生物学和经济学;在不同应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。

聚类与分类的不同在于,聚类所要求划分的类是未知的。

聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。

统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSSSASR语言等。

外部链接