網站首頁 編程語言 正文
數據的合并與關聯是數據處理過程中經常遇到的問題,在SQL、HQL中大家可能都有用到 join、uion all 等 ,在 Pandas 中也有同樣的功能,來滿足數據處理需求,個人感覺 Pandas 處理數據還是非常方便,數據處理效率比較高,能滿足不同的業務需求
數據拼接:pd.concat
concat 是pandas級的函數,用來拼接或合并數據,其根據不同的軸既可以橫向拼接,又可以縱向拼接
函數參數
pd.concat( objs: 'Iterable[NDFrame] | Mapping[Hashable, NDFrame]', axis=0, join='outer', ignore_index: 'bool' = False, keys=None, levels=None, names=None, verify_integrity: 'bool' = False, sort: 'bool' = False, copy: 'bool' = True, ) -> 'FrameOrSeriesUnion'
-
objs
:合并的數據集,一般用列表傳入,例如:[df1,df2,df3] -
axis
:指定數據拼接時的軸,0是行,在行方向上拼接;1是列,在列方向上拼接 -
join
:拼接的方式有 inner,或者outer,與sql中的意思一樣
以上三個參數在實際工作中經常使用,其他參數不再做介紹
案例:
模擬數據
橫向拼接
橫向拼接-1
字段相同的列進行堆疊,字段不同的列分列存放,缺失值用NAN
來填充,下面對模擬數據進行變換用相同的字段,進行演示
橫向拼接-2
縱向拼接
縱向拼接
可以看出在縱向拼接的時候,會按索引進行關聯,使相同名字的成績放在一起,而不是簡單的堆疊
數據關聯:pd.merge
數據關聯與SQL中的join基本一樣,一次可以關聯兩個數據表,有左表、右表的區分,需要可以指定關聯的字段
函數參數
pd.merge( left: 'DataFrame | Series', right: 'DataFrame | Series', how: 'str' = 'inner', on: 'IndexLabel | None' = None, left_on: 'IndexLabel | None' = None, right_on: 'IndexLabel | None' = None, left_index: 'bool' = False, right_index: 'bool' = False, sort: 'bool' = False, suffixes: 'Suffixes' = ('_x', '_y'), copy: 'bool' = True, indicator: 'bool' = False, validate: 'str | None' = None, ) -> 'DataFrame'
-
left
:左表 -
right
:右表 -
how
:關聯的方式,{‘left’, ‘right’, ‘outer’, ‘inner’, ‘cross’}, 默認關聯方式為 ‘inner’ -
on
:關聯時指定的字段,兩個表共有的 -
left_on
:關聯時用到左表中的字段,在兩個表不共有關聯字段時使用 -
right_on
:關聯時用到右表中的字段,在兩個表不共有關聯字段時使用
以上參數在實際工作中經常使用,其他參數不再做介紹
案例:
數據關聯
merge 的使用與SQL中的 join 很像,使用方式基本一致,既有內連接,也有外連接,用起來基本沒有什么難度
兩者區別
- concat 只是 pandas 下的方法,而 merge 即是 pandas 下的方法,又是DataFrame 下的方法
- concat 可以橫向、縱向拼接,又起到關聯的作用
- merge 只能進行關聯,也就是縱向拼接
- concat 可以同時處理多個數據框DataFrame,而 merge 只能同時處理 2 個數據框
原文鏈接:https://blog.csdn.net/weixin_38037405/article/details/125287236
相關推薦
- 2022-05-06 Windows如何關閉被占用的端口
- 2021-12-20 使用Docker構建開發環境的方法步驟(?Windows和mac)_docker
- 2022-09-21 flutter實現底部不規則導航欄_Android
- 2022-06-06 Postgresql split_part()函數,根據符號切割字符串
- 2022-08-27 Python+matplotlib繪制多子圖的方法詳解_python
- 2022-10-14 el-tree 懶加載,默認加載N級.異步加載子節點
- 2022-07-13 SpringBoot中的SmartInitializingSingleton接口的使用
- 2022-11-02 golang服務報錯:?write:?broken?pipe的解決方案_Golang
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支