dropna()
和notnull()
是pandas库中用于处理缺失值的函数,它们的用法和功能有一些区别。
dropna()
是pandas库中DataFrame和Series对象的一个方法,用于删除含有缺失值的行或列。它的主要功能是过滤掉包含缺失值的行或列,返回一个新的DataFrame或Series对象。默认情况下,dropna()
会删除包含任何缺失值的行或列,也可以通过参数指定删除方式。例如,可以通过设置axis
参数为1来删除包含缺失值的列,通过设置subset
参数来指定删除含有缺失值的特定列。
示例代码:
import pandas as pd # 创建一个包含缺失值的DataFrame df = pd.DataFrame({'A': [1, 2, None, 4], 'B': [5, None, 7, 8]}) # 使用dropna()删除含有缺失值的行 df_dropna = df.dropna() print(df_dropna)
输出结果:
A B 0 1.0 5.0 3 4.0 8.0
notnull()
是pandas库中DataFrame和Series对象的一个方法,用于判断每个元素是否为非空值。它返回一个布尔值的DataFrame或Series,其中为非空值的元素对应的位置为True
,否则为False
。
示例代码:
import pandas as pd # 创建一个包含缺失值的DataFrame df = pd.DataFrame({'A': [1, 2, None, 4], 'B': [5, None, 7, 8]}) # 使用notnull()判断每个元素是否为非空值 df_notnull = df.notnull() print(df_notnull)
输出结果:
A B 0 True True 1 True False 2 False True 3 True True
总结一下,dropna()
主要用于删除含有缺失值的行或列,而notnull()
主要用于判断每个元素是否为非空值。