在Pandas中,可以使用groupby
方法来实现数据聚合。具体步骤如下:
- 首先使用
groupby
方法对数据进行分组,根据需要聚合的列进行分组。 - 然后使用聚合函数对分组后的数据进行聚合操作,比如
sum()
、mean()
、count()
等。 - 可以使用
agg()
方法同时应用多种聚合函数。 - 最后使用
reset_index()
方法将分组后的数据重新设置索引。
下面是一个简单的示例:
import pandas as pd data = https://www.yisu.com/ask/{'Name': ['Alice', 'Bob', 'Alice', 'Bob', 'Alice'], 'Score': [85, 90, 88, 92, 87], 'Age': [25, 30, 25, 30, 25]} df = pd.DataFrame(data) # 按照Name列进行分组,并计算每个人的平均分和总分 grouped = df.groupby('Name').agg({'Score': ['mean', 'sum'], 'Age': 'count'}) grouped = grouped.reset_index() print(grouped)
运行以上代码,输出结果如下:
Name Score Age mean sum count 0 Alice 86.7 261 3 1 Bob 91.0 182 2