日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

使用pd.merge表連接出現多余行的問題解決_python

作者:路明非Re ? 更新時間: 2022-08-07 編程語言

本文的目標是將表1論文及出版物與表2出版物及其指標進行匹配。

表1 論文出版物信息(存在空值)

表2 出版物指標信息

利用pandas的merge函數實現表的左外連接。左外連接即左表的外連接,左表保持不變,匹配右表的行(合并后右表肯能存在空值)。

paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
    how='left',left_on='出版物',right_on='名稱',sort=False)

結果發現連接后表相比于表1論文出版物 多出來13行。進行探究發現是表2出版物指標信息中存在 出版物A-指標1,出版物A-指標2這樣的出版物重復行。進行匹配后會出現:

出版物  名稱  指標
出版物A  出版物A  指標1
出版物A  出版物A  指標2   #多余的行

這里選擇預先刪除 表2出版物指標 中的重復出版物信息。

publicationIndicator.drop_duplicates(subset=['名稱'],
		keep='first',inplace=True)

這樣結果就沒有問題了。

原文鏈接:https://blog.csdn.net/yefan_001/article/details/124611893

欄目分類
最近更新