在Pandas中,处理缺失值的方法通常有以下几种:
- 删除缺失值:可以使用
dropna()
方法删除含有缺失值的行或列,参数axis
可以指定是删除行还是删除列。
df.dropna() # 删除含有缺失值的行 df.dropna(axis=1) # 删除含有缺失值的列
- 填充缺失值:可以使用
fillna()
方法填充缺失值,可以指定填充的值,如0、平均值、中位数等。
df.fillna(0) # 将缺失值填充为0 df.fillna(df.mean()) # 将缺失值填充为列的平均值
- 插值填充:可以使用
interpolate()
方法进行插值填充,根据缺失值前后的值进行插值填充。
df.interpolate() # 插值填充缺失值
- 使用其他值代替缺失值:可以使用
replace()
方法将缺失值替换为其他指定的值。
df.replace(np.nan, -1) # 将缺失值替换为-1