fillna()
是 pandas 库中的一个函数,用于填充缺失值
- 首先,确保已经安装了 pandas 库。如果没有安装,可以使用以下命令进行安装:
pip install pandas
- 导入 pandas 库并创建一个包含缺失值(NaN)的 DataFrame:
import pandas as pd import numpy as np data = https://www.yisu.com/ask/{'A': [1, 2, np.nan], 'B': [4, np.nan, 6], 'C': [7, 8, 9]} df = pd.DataFrame(data) print("原始 DataFrame:") print(df)
这将输出以下内容:
原始 DataFrame: A B C 0 1.0 4.0 7 1 2.0 NaN 8 2 NaN 6.0 9
- 使用
fillna()
函数填充缺失值。有多种方法可以填充缺失值,例如使用常数、前一个值、后一个值等。以下是一些示例:
- 使用常数填充缺失值(例如 0):
filled_df = df.fillna(0) print("使用常数填充后的 DataFrame:") print(filled_df)
- 使用前一个值填充缺失值:
filled_df = df.fillna(method='ffill') print("使用前一个值填充后的 DataFrame:") print(filled_df)
- 使用后一个值填充缺失值:
filled_df = df.fillna(method='bfill') print("使用后一个值填充后的 DataFrame:") print(filled_df)
- 使用平均值填充缺失值:
filled_df = df.fillna(df.mean()) print("使用平均值填充后的 DataFrame:") print(filled_df)
注意:在实际应用中,根据数据的特点和需求选择合适的填充方法。