在Scikit-learn中,可以使用特征选择技术通过sklearn.feature_selection
模块中提供的方法来选择最重要的特征。下面是一个简单的例子来展示如何使用特征选择:
from sklearn.datasets import load_iris from sklearn.feature_selection import SelectKBest from sklearn.feature_selection import chi2 # 加载数据集 iris = load_iris() X, y = iris.data, iris.target # 使用卡方检验选择最重要的特征 k_best = SelectKBest(score_func=chi2, k=2) X_new = k_best.fit_transform(X, y) # 打印选择的特征 print(X_new.shape)
在上面的例子中,我们使用了SelectKBest
类来选择最重要的2个特征,其中我们使用了卡方检验(chi2)作为评分函数。最后打印出选择的特征的形状。 此外,Scikit-learn还提供了其他的特征选择方法,如SelectFromModel
和RFE
等,具体可以查看官方文档以了解更多信息。