在Pandas中,可以使用一些评估指标来评估聚类模型的性能。其中常用的指标包括:
- 轮廓系数(Silhouette Score):衡量聚类的紧密度和分离度,取值范围为[-1, 1],值越接近1表示聚类效果越好。
from sklearn.metrics import silhouette_score silhouette_score(data, labels)
- Calinski-Harabasz指数(Calinski-Harabasz Score):也称为方差比指数,衡量聚类的稠密度和分散度,值越大表示聚类效果越好。
from sklearn.metrics import calinski_harabasz_score calinski_harabasz_score(data, labels)
- Davies-Bouldin指数(Davies-Bouldin Index):衡量聚类的紧密度和分离度,值越小表示聚类效果越好。
from sklearn.metrics import davies_bouldin_score davies_bouldin_score(data, labels)
其中,data是样本数据,labels是聚类结果的标签。通过这些评估指标,可以帮助我们评估聚类模型的性能。