日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

一次性徹底講透Python中pd.concat與pd.merge_python

作者:我愛Python數據挖掘 ? 更新時間: 2022-08-06 編程語言

數據的合并與關聯是數據處理過程中經常遇到的問題,在SQL、HQL中大家可能都有用到 join、uion all 等 ,在 Pandas 中也有同樣的功能,來滿足數據處理需求,個人感覺 Pandas 處理數據還是非常方便,數據處理效率比較高,能滿足不同的業務需求

數據拼接:pd.concat

concat 是pandas級的函數,用來拼接或合并數據,其根據不同的軸既可以橫向拼接,又可以縱向拼接

函數參數

pd.concat(
    objs: 'Iterable[NDFrame] | Mapping[Hashable, NDFrame]',
    axis=0,
    join='outer',
    ignore_index: 'bool' = False,
    keys=None,
    levels=None,
    names=None,
    verify_integrity: 'bool' = False,
    sort: 'bool' = False,
    copy: 'bool' = True,
) -> 'FrameOrSeriesUnion'
  • objs:合并的數據集,一般用列表傳入,例如:[df1,df2,df3]
  • axis:指定數據拼接時的軸,0是行,在行方向上拼接;1是列,在列方向上拼接
  • join:拼接的方式有 inner,或者outer,與sql中的意思一樣

以上三個參數在實際工作中經常使用,其他參數不再做介紹

案例:

圖片

模擬數據

橫向拼接

圖片

橫向拼接-1

字段相同的列進行堆疊,字段不同的列分列存放,缺失值用NAN來填充,下面對模擬數據進行變換用相同的字段,進行演示

圖片

橫向拼接-2

縱向拼接

圖片

縱向拼接

可以看出在縱向拼接的時候,會按索引進行關聯,使相同名字的成績放在一起,而不是簡單的堆疊

數據關聯:pd.merge

數據關聯與SQL中的join基本一樣,一次可以關聯兩個數據表,有左表、右表的區分,需要可以指定關聯的字段

函數參數

pd.merge(
    left: 'DataFrame | Series',
    right: 'DataFrame | Series',
    how: 'str' = 'inner',
    on: 'IndexLabel | None' = None,
    left_on: 'IndexLabel | None' = None,
    right_on: 'IndexLabel | None' = None,
    left_index: 'bool' = False,
    right_index: 'bool' = False,
    sort: 'bool' = False,
    suffixes: 'Suffixes' = ('_x', '_y'),
    copy: 'bool' = True,
    indicator: 'bool' = False,
    validate: 'str | None' = None,
) -> 'DataFrame'

  • left:左表
  • right:右表
  • how:關聯的方式,{‘left’, ‘right’, ‘outer’, ‘inner’, ‘cross’}, 默認關聯方式為 ‘inner’
  • on:關聯時指定的字段,兩個表共有的
  • left_on:關聯時用到左表中的字段,在兩個表不共有關聯字段時使用
  • right_on:關聯時用到右表中的字段,在兩個表不共有關聯字段時使用

以上參數在實際工作中經常使用,其他參數不再做介紹

案例:

圖片

數據關聯

merge 的使用與SQL中的 join 很像,使用方式基本一致,既有內連接,也有外連接,用起來基本沒有什么難度

兩者區別

  • concat 只是 pandas 下的方法,而 merge 即是 pandas 下的方法,又是DataFrame 下的方法
  • concat 可以橫向、縱向拼接,又起到關聯的作用
  • merge 只能進行關聯,也就是縱向拼接
  • concat 可以同時處理多個數據框DataFrame,而 merge 只能同時處理 2 個數據框

原文鏈接:https://blog.csdn.net/weixin_38037405/article/details/125287236

欄目分類
最近更新