1.【K-Means类聚】以样本间的距离为基础,将所有的观测划分到K个群体,使得群体和群体之间的距离尽量大,同时群体内部的观测之间的“距离和”最小。其中【K】代表总共要分的类即【K】个群组。【Means】代表在分析方法中要反复计算群体的中心即均值中心。
2.【K-Means类聚】使用的样本间距离定义为【欧式距离】。【误差平方】与【函数的计算公式】如图所示。
3.其意义在于当把一个整体分为K个群组之后,计算每个群组中所有点到该群组中心点的距离,把这些距离分别平方后加总得到该群体的误差平方和。将K个群体的误差平方和相加后的到总体误差平方和。