在Python的pandas库中,fillna()
函数用于填充缺失值(NaN)
-
使用常数值填充: 可以使用一个指定的常数值来填充缺失值。例如,将所有缺失值替换为0:
df.fillna(0, inplace=True)
-
使用前一个值填充(前向填充): 可以使用缺失值之前的那个值来填充缺失值。这种方法也称为前向填充(forward fill)。例如:
df.fillna(method='ffill', inplace=True)
-
使用后一个值填充(后向填充): 可以使用缺失值之后的那个值来填充缺失值。这种方法也称为后向填充(backward fill)。例如:
df.fillna(method='bfill', inplace=True)
-
使用平均值填充: 可以使用缺失值所在列的平均值来填充缺失值。例如:
df.fillna(df.mean(), inplace=True)
-
使用中位数填充: 可以使用缺失值所在列的中位数来填充缺失值。例如:
df.fillna(df.median(), inplace=True)
-
使用众数填充: 可以使用缺失值所在列的众数来填充缺失值。例如:
df.fillna(df.mode().iloc[0], inplace=True)
-
使用插值填充: 可以使用插值方法来填充缺失值。例如,使用线性插值:
df.interpolate(method='linear', inplace=True)
在使用fillna()
函数时,可以根据实际需求选择合适的填充策略。注意,填充缺失值是数据预处理的一部分,应该根据数据的特点和分析目标来选择合适的方法。