学习来源:清风老师
我们可以更加准确的在每个类中单独使用统计模型进行估计、分析或预测;也可以探究不同类之间的相关性和主要差异。 分类是已知类别的,聚类未知。
优点:
缺点:
k-means++算法选择初始聚类中心的基本原则是:初始的聚类中心之间的相互距离要尽可能的远。 只对K-means算法“初始化K个聚类中心” 这一步进行了优化
默认K-means++算法
还有K=3,消费分类更明显