聚类术语无监督的学习,K-means算法是基于距离的聚类算法,采用距离作为相似性的评价指标,如果两个文档之间的距离越近那么认为两个文档的聚类越近。
算法:
1)初始化质心:从N个实验文本中随机选取K个文档作为质心
2)计算距离:对剩余的每个文本计算其到每个质心的距离,并把它归并到最近的质心的类
4)迭代条件:迭代2~3步直至新的质心与原质心相等或小于指定阈值,算法结束
但是该聚类方法存在以下问题:
但是该聚类方法存在以下问题:
1、初始类质心的选择对聚类结果会有很大的影响。
2、该方法需要不断的迭代计算,需要很大的运算开销。
相关推荐
基于K-means聚类算法的图像分割 算法的基本原理: 基于K-means聚类算法的图像分割以图像中的像素为数据点,按照指定的簇数进行聚类,然后将每个像素点以其对应的聚类中心替代,重构该图像。 算法步骤: ①随机选取...
基于 K-means 聚类算法的图像区域分割,首先从数据样本种选取K个点作为初始聚类中心,其次计算各个样本到聚类的距离,把样本归到离它最近的那个聚类中心所在的累,计算新形成的每个聚类的数据对象的平均值来得到新的...
但是,传统的K-means聚类算法在选取初始中心和度量相似性上有一定缺陷。针对传统的K-means算法中存在的问题,本文对原有的方法进行了改进。第一,在初始化聚类中心时选取了一种优化的方法作为初始聚类中心,替代原有的...
针对当前多区域物流中心选址需建立配送中心个数不定、位置、覆盖范围不明的问题,本文提出了一种改进的k-means聚类算法,以城市经济引力模型为基础,将城市运输距离与居民消费能力的指标相结合,重新定义对象之间...
主要介绍了详解Java实现的k-means聚类算法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
利用K-means聚类法将灰度图像划分成聚类分区, 在每个聚类分区应用最小平方法least-squares最小化二值半色调图像和原始灰度级图像之间的平方误差, 所构造的半色调算法与基于模型的最小平方法LSMB算法相比, 随着聚类...
基于k-means聚类算法的研究,黄韬,刘胜辉,本文首先分析研究聚类分析方法,对多种聚类分析算法进行分析比较,讨论各自的优点和不足,同时针对原k-means算法的聚类结果受随机��
主要介绍了Python用K-means聚类算法进行客户分群的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
用动画效果 帮助新手理解K-means聚类,有数据,有动画
实验五 K-Means聚类算法.ipynb
深大计软_最优化方法_实验1:K-Means聚类之Python实现手写数字图像MNIST分类
1.版本:matlab2019a,不会运行可私信 2.领域:【数据聚类】 3.内容:基于k-means聚类算法实现三维数据分类含Matlab源码 4.适合人群:本科,硕士等教研学习使用
将流形距离引入K-means聚类算法中,对于具有流形结构的数据集有很好的聚类效果,流形距离计算参数的设定充分考虑了全局和局部一致性。
(带注释)基于K-means聚类算法的图像区域分割.zip,MATLAB实现,详情可以参考:https://blog.csdn.net/didi_ya/article/details/115376184
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab).rar
基于K-means聚类算法的图像分割(MATLAB实现),如有需要,请下载!!
国信证券_20161205_金融工程专题研究:基于k-means聚类的多因子特征检验.pdf
上述代码是利用python内置的k-means聚类算法对鸢尾花数据的聚类效果展示,注意在运行该代码时需要采用pip或者其他方式为自己的python安装sklearn以及iris扩展包,其中X = iris.data[:]表示我们采用了鸢尾花数据的四...
K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求...