k平均算法属于什么分析方法

如题所述

k平均算法属于一种矢量量化方法。

k平均聚类发明于1956年,是一个聚类算法,把n的对象根据他们的属性分为k个分割,k < n。它与处理混合正态分布的最大期望算法很相似,因为他们都试图找到数据中自然聚类的中心。它假设对象属性来自于空间向量,并且目标是使各个群组内部的均方误差总和最小。假设有k个群组Si, i=1,2,...,k。μi是群组Si内所有元素xj的重心,或叫中心点。

k平均聚类发明于1956年, 该算法最常见的形式是采用被称为劳埃德算法的迭代式改进探索法。劳埃德算法首先把输入点分成k个初始化分组,可以是随机的或者使用一些启发式数据。然后计算每组的中心点,根据中心点的位置把对象分到离它最近的中心,重新确定分组。继续重复不断地计算中心并重新分组,直到收敛,即对象不再改变分组。

k平均算法属于:

k-means聚类是一种矢量量化方法,最初源于信号处理,在数据挖掘中常用于聚类分析。 k-means聚类旨在将 n个观察值划分为 k 个聚类,其中每个观测值属于具有最近均值所在的聚类,它作为聚类的原型,可以将数据空间划分成沃罗诺伊单元。

近似的k平均算法已经被设计用于原始数据子集的计算。

从算法的表现上来说,它并不保证一定得到全局最优解,最终解的质量很大程度上取决于初始化的分组。由于该算法的速度很快,因此常用的一种方法是多次运行k平均算法,选择最优解。

k平均算法的一个缺点是,分组的数目k是一个输入参数,不合适的k可能返回较差的结果。另外,算法还假设均方误差是计算群组分散度的最佳参数。

温馨提示:答案为网友推荐,仅供参考
相似回答
大家正在搜