在Scikit-learn中,可以使用AgglomerativeClustering类来实现层次聚类。具体步骤如下:
- 导入所需的库:
from sklearn.cluster import AgglomerativeClustering
- 实例化AgglomerativeClustering类,并设置参数:
# n_clusters表示要聚类的簇数 # linkage表示要使用的链接标准,可以是'ward', 'complete', 'average', 'single' # 具体参数可参考官方文档:https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html clustering = AgglomerativeClustering(n_clusters=2, linkage='ward')
- 使用fit_predict方法进行拟合和预测:
# X为数据集 labels = clustering.fit_predict(X)
- 最后,可以通过labels属性获取每个样本所属的簇:
print(labels)
这样就可以使用Scikit-learn实现层次聚类了。