在Python的pandas库中,fillna()
函数用于填充缺失值。这个函数有多种方法可以填充缺失值,包括使用常数、前一个值、后一个值或插值方法等。
以下是一些使用fillna()
函数的例子:
- 使用常数填充缺失值:
import pandas as pd # 创建一个包含缺失值的DataFrame data = https://www.yisu.com/ask/{'A': [1, 2, None, 4], 'B': [None, 2, 3, 4]} df = pd.DataFrame(data) # 使用常数值填充缺失值,例如0 df_filled = df.fillna(0)
- 使用前一个值填充缺失值:
df_filled = df.fillna(method='ffill')
- 使用后一个值填充缺失值:
df_filled = df.fillna(method='bfill')
- 使用线性插值填充缺失值:
df_filled = df.interpolate()
- 使用指定列的前一个值填充缺失值:
df_filled = df.fillna(method='ffill', limit=1)
这里的limit=1
表示只使用前一个值填充,如果前一个值也是缺失值,则不进行填充。
需要注意的是,fillna()
函数默认会返回一个新的DataFrame,原始的DataFrame不会被修改。如果需要直接修改原始的DataFrame,可以使用inplace=True
参数:
df.fillna(0, inplace=True)
这样,原始的DataFrame就会被修改,所有的缺失值都会被填充为0。