網站首頁 編程語言 正文
創建一個dataframe結構
import pandas as pd df = pd.DataFrame( data={ 'name': ['z_s', 'l_s', 'w_w', 'z_l', 'y_s', 'j_j', 'l_b', 'z_f', 'hs_q', 'lbl_k', 'qy_n', 'mg_n'], 'score': [100, 97, 98, 89, 67, 59, 29, 87, 78, 89, 88, 80], 'group': [1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2], 'cls': ['A', 'A', 'A', 'B', 'B', 'B', 'A', 'A', 'A', 'B', 'B', 'B'], 'height': [178.0, 180.0, 176.0, 182.0, 189.0, 190.0, 172.5, 175.0, 165.0, 160.0, 158.5, 159.0] }, index=['stu_' + str(i) for i in np.arange(1, 13, 1)] ) print('df:\n', df) def func_add_one(x): return x + 1
transform方法
# 調用自定義函數 ret = df.loc[:, 'score'].transform(func_add_one) print('ret1:\n',ret) # 調用numpy指標 求均值 ret = df.groupby(by=['cls'])['score'].transform(np.mean) print('ret2:\n', ret) # 求 多列的均值 ret = df.groupby(by=['cls'])[['score','height']].transform(np.mean) print('ret3:\n', ret)
由結果可以發現,transform調用統計指標會將統計結果交給第一項,這樣可以保證統計結果的行數與原數組相同,使得之后方便將其拼接到原數組中。
如果想將結果進行聚合,可以調用apply方法:
apply方法
# 調用自定義函數 ret = df.loc[:, 'score'].apply(func_add_one) print('ret1:\n',ret) # 調用numpy指標 ret = df.groupby(by=['cls'])[['score','height']].apply(np.mean) print('ret2:\n', ret)
補充
transporm
方法是將DataFrame
或Series
中的值同時放入指定的函數中執行,再將結果返回。
獲取 name的第0個元素
def func_get_firstnameword(x): return x[0] ret = df['name'].transform(func_get_firstnameword) print('ret:\n', ret)
自定義方法擁有很大的可操作性,通過自定義方法可以對數據進行一系列操作,最終得到想要的結果。
str
除此之外,還可以使用str方法,這是一種類似于 dt 的方法(dt的使用)
ret = df['name'].str.split('_', expand=True)[0] print('ret:\n', ret)
str 的作用是將整個 Series
當作str對象,對Series
中的所有元素同時執行.split('_', expand=True)[0]
方法,其中expand=True
的作用是指定split()
方法是對整個Series
進行操作的,而不是只對第一個元素進行操作:
ret = df['name'].str.split('_')[0] print('ret:\n', ret)
總結
原文鏈接:https://blog.csdn.net/weixin_45760274/article/details/123514611
相關推薦
- 2022-08-22 Docker安裝LNMP環境的詳細過程(可部署TP項目)_docker
- 2022-09-09 Redis中ZSet的具體使用_Redis
- 2023-12-13 idea git只查看某個人提交的代碼記錄
- 2022-06-17 Go模板template用法詳解_Golang
- 2022-02-03 ionic4 ngFor中使用ngIf
- 2022-01-27 插入數據庫某個字段之前判斷是否重復
- 2022-09-08 Redis?Lua腳本實現ip限流示例_Redis
- 2022-05-01 python3中apply函數和lambda函數的使用詳解_python
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支