K-means聚类【数学建模】

K-means(K-均值聚类算法)是划分聚类分割的方法,将一个有N个元组或记录的数据集,分裂成K个分组,每个分组就是一个聚类,K

        1.每个分组至少包含一个数据记录

        2.每个数据记录属于且仅属于一个分组

算法步骤:

1.任意选择k个对象作为初始聚类中心

2.计算每个对象与聚类中心的距离,并根据最小距离重新划分

3.重新计算聚类中心,直到聚类中心不再变化,这种划分使得下式最小:E = \sum_{j=1}^{k}\sum_{xi\in wj}\left \| xi-mj \right \|^{2}

xi为第i样本点的位置;mj为第j个聚类中心的位置。

4.循环2 3 步,直到聚类中心不再改变。

特点:

采用两阶段反复循环过程算法

结束条件:不再有数据元素被重新分配

matlab代码:

%% 数据准备和初始化
clc
clear
x=[0 0;1 0; 0 1; 1 1;2 1;1 2; 2 2;3 2; 6 6; 7 6; 8 6; 6 7; 7 7; 8 7; 9 7 ; 7 8; 8 8; 9 8; 8 9 ; 9 9];
z=zeros(2,2);
z1=zeros(2,2);
z=x(1:2, 1:2);
%% 寻找聚类中心
while 1
    count=zeros(2,1);
    allsum=zeros(2,2);
    for i=1:20 % 对每一个样本i,计算到2个聚类中心的距离
        temp1=sqrt((z(1,1)-x(i,1)).^2+(z(1,2)-x(i,2)).^2);
        temp2=sqrt((z(2,1)-x(i,1)).^2+(z(2,2)-x(i,2)).^2);
        if(temp1

 

 

你可能感兴趣的