日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

python?pandas中的agg函數用法_python

作者:python小工具 ? 更新時間: 2022-07-06 編程語言

pandas中的agg函數

python中的agg函數通常用于調用groupby()函數之后,對數據做一些聚合操作,包括sum,min,max以及其他一些聚合函數

如下所示:

>>> df = pd.read_excel(r"D:/myExcel/1.xlsx")
>>> df
? ? ? ? A ? B ? C
0 ? ? bob ?12 ?45
1 ?millor ?15 ?23
2 ? ? bob ?34 ?88
3 ? ? bob ?98 ?23

(1)獲取按A分組后B列的最大值

>>> df.groupby(by='A').agg({'B':'max'})
? ? ? ? ?B
A ? ? ? ??
bob ? ? 98
millor ?15

(2)獲取按A分組后B列的最大值和最小值

>>> df.groupby(by='A').agg({'B':['max','min']})
? ? ? ? ?B ? ?
? ? ? ?max min
A ? ? ? ? ? ??
bob ? ? 98 ?12
millor ?15 ?15

(3)獲取按A分組后B列的最大值和最小值以及C列的最大值

>>> df.groupby(by='A').agg({'B':['max','min'], 'C':'min'})
? ? ? ? ?B ? ? ? C
? ? ? ?max min min
A ? ? ? ? ? ? ? ??
bob ? ? 98 ?12 ?23
millor ?15 ?15 ?23

(4)默認是以函數名稱命名的,可以修改

>>> df.groupby(by='A').agg(
b_min=pd.NamedAgg(column='B', aggfunc='min'),
b_max=pd.NamedAgg(column='B', aggfunc='max'))
? ? ? ? b_min ?b_max
A ? ? ? ? ? ? ? ? ??
bob ? ? ? ?12 ? ? 98
millor ? ? 15 ? ? 15

通常在調用完agg函數后需要reset_index,因為pandas會默認將groupby()的列也做為index傳到結果中

>>> df.groupby('A').B.agg(['min', 'max'])
? ? ? ? min ?max
A ? ? ? ? ? ? ??
bob ? ? ?12 ? 98
millor ? 15 ? 15
>>> df.groupby('A').B.agg(['min', 'max']).reset_index()
? ? ? ? A ?min ?max
0 ? ? bob ? 12 ? 98
1 ?millor ? 15 ? 15

這就是python小工具關于agg函數的介紹,挺有用 的一個函數。?

pandas詳解 聚合運算agg()

在數據分析中,分組聚合二者缺一不可。對數據聚合(求和、平均值等)通常是不可避免的。pd.agg()很方便進行聚合操作。

1. 創建DataFrame對象

import pandas as pd
df1 = pd.DataFrame({'sex':list('FFMFMMF'),'smoker':list('YNYYNYY'),'age':[21,30,17,37,40,18,26],'weight':[120,100,132,140,94,89,123]})

在這里插入圖片描述

grouped = df1.groupby(['sex','smoker'])
# sex有 F M 二值,smoker有 Y N 二值,故分成四組。

2. 單列聚合

grouped['age'].agg('mean')
sex  smoker
F    N         30.0
     Y         28.0
M    N         40.0
     Y         17.5
Name: age, dtype: float64

3. 多列聚合

grouped.agg('mean')

在這里插入圖片描述

4. 多種聚合運算

grouped['age'].agg(['min','max'])

在這里插入圖片描述

5. 多種聚合運算并更改列名

grouped['age'].agg([('A','mean'),('B','max')])

在這里插入圖片描述

6. 不同的列運用不同的聚合函數

grouped.agg({'age':['sum','mean'], 'weight':['min','max']})

在這里插入圖片描述

7. 使用自定義的聚合函數

def Max_cut_Min(group):
    return group.max()-group.min()

grouped.agg(Max_cut_Min)

在這里插入圖片描述

8. 方便的descibe

grouped.describe()

在這里插入圖片描述

原文鏈接:https://blog.csdn.net/weixin_45144170/article/details/105008350

欄目分類
最近更新