網站首頁 編程語言 正文
drop_duplicates 方法實現對數據框 DataFrame 去除特定列的重復行,返回 DataFrame 格式數據。
一、使用語法及參數
使用語法:
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)
參數:
- subset – 指定特定的列 默認所有列
- keep:{‘first’, ‘last’, False} – 刪除重復項并保留第一次出現的項 默認第一個
- keep=False – 表示刪除所有重復項 不保留
- inplace – 是否直接修改原對象
- gnore_index=True – 重置索引 (version 1.0.0 才有這個參數)
二、實操
1.例子一
import pandas as pd
df = pd.DataFrame({'a':[1,1,2,2],
? ? ? ? ? ? ? ? ? ?'b':['a','b','a','b']})
# 單列
df.drop_duplicates('b', 'first', inplace=True)
print(df)
'''
? ?a ?b
0 ?1 ?a
1 ?1 ?b
'''
# 多列
df.drop_duplicates(subset=['a', 'b'], keep='first', inplace=False)
# 刪除所有重復項 不保留
df.drop_duplicates(subset=['a', 'b'], False)
2.例子二
# 構建測試數據框
import pandas as pd
df = pd.DataFrame({
? ? 'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'],
? ? 'style': ['cup', 'cup', 'cup', 'pack', 'pack'],
? ? 'rating': [4, 4, 3.5, 15, 5]
})
# 默認按所有列去重
df.drop_duplicates()
# 指定列
df.drop_duplicates(subset=['brand'])
# 保留最后一個重復值
df.drop_duplicates(subset=['brand', 'style'], keep='last')
3.刪除重復項后重置索引
# 方法一
df.drop_duplicates(ignore_index=True)
# 方法二
df.drop_duplicates().reset_index(drop=True)
# 方法三
df.index = range(df.shape[0])
原文鏈接:https://blog.csdn.net/qdPython/article/details/120869726
相關推薦
- 2022-07-11 MongoDB使用正則匹配、修改內容
- 2022-09-04 centos搭建部署docker環境的詳細步驟_docker
- 2022-05-27 淺談go中cgo的幾種使用方式_Golang
- 2023-03-29 C++中字符串全排列算法及next_permutation原理詳解_C 語言
- 2022-08-15 Property or field ‘xxx‘ cannot be found on object
- 2023-02-17 Go語言Gin處理響應方式詳解_Golang
- 2022-09-01 詳解C語言中for循環與while循環的用法_C 語言
- 2023-03-26 WPF使用觸發器需要注意優先級問題解決_C#教程
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支