Pandas 是一个用于数据处理和分析的 Python 库,可以帮助用户轻松地进行数据清洗、转换、分析和可视化等操作。下面是一个简单的示例,展示了如何使用 Pandas 进行一些常见的操作:
- 导入 Pandas 库:
import pandas as pd
- 创建一个 DataFrame 对象:
data = https://www.yisu.com/ask/{'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'City': ['New York', 'London', 'Paris', 'Tokyo']} df = pd.DataFrame(data)
- 查看数据的前几行:
print(df.head())
- 查看数据的统计摘要信息:
print(df.describe())
- 选择特定列的数据:
print(df['Name'])
- 筛选满足条件的行:
print(df[df['Age'] > 30])
- 添加新列:
df['Gender'] = ['Female', 'Male', 'Male', 'Male'] print(df)
- 删除列:
df = df.drop('City', axis=1) print(df)
- 根据条件给数据分组:
grouped = df.groupby('Gender') print(grouped.mean())
- 将数据保存到文件:
df.to_csv('data.csv', index=False)
以上仅是 Pandas 库的一小部分功能示例,Pandas 还有很多强大的功能,比如合并数据、处理缺失值、数据透视表、时间序列分析等。可以通过查阅 Pandas 官方文档来学习更多详细的用法。