網站首頁 編程語言 正文
概念
df.duplicated()
使用df.cuplicated()來查看重復數據,返回True,False,數據類型是bool.
也可以指定某一列是否有重復值df.cuplidated(‘colname’),不指定則默認為第一列。
df.dropduplicates(’col‘,keep=‘first’,inplace=False)
用來刪除重復行。
實例
讀取數據
# %% 提取數據 從sqlite
import pandas as pd
from sqlalchemy import create_engine
'''創建sqlite3連接'''
eg = create_engine('sqlite:///I:/jianguoyun/Udoc/WorkDb/dataset2022.db') #創建數據庫連接
# 讀取數據庫文件
q_store = """
select * from pj_store20220525
"""
# 讀取表
cols= ['貨號','品類','節慶','庫位','合格','換包裝','錯碼','維修','總數量' ]
df = pd.read_sql(q_store,eg)[cols]
計算重復項
# df.duplicated 計算重復項
cond = df.duplicated('貨號') # 查看貨號相同的項 df.duplicated返回的是布爾值
def_line = df[cond]
def_line
計算有多少個重復行
#有多少個重復行
dep_data = df.duplicated('貨號').sum()
dep_data
用df.drop_duplicates提取夏季品類
# 用df.drop_duplicates提取夏季品類
df_category = df.query('節慶=="夏季"').drop_duplicates('品類',keep='last',inplace=False)
df_category['品類'].sort_values()
參數:
- keep ,保留最后last還是第一行first,
- inplace:是否替換原列表,false:不替換,True,替換。
原文鏈接:https://blog.csdn.net/m0_46326858/article/details/124969949
相關推薦
- 2022-05-04 詳解Tomcat中查看JVM內存使用情況_Tomcat
- 2022-10-01 Go語言并發編程基礎上下文概念詳解_Golang
- 2022-07-12 mongoDB復雜查詢實例(嵌套多個數組和正則表達式使用)
- 2022-12-30 解決React報錯Style?prop?value?must?be?an?object_React
- 2022-03-31 Linux中Go環境配置和GoModule常用操作_Golang
- 2022-09-01 C語言中的程序環境與預處理詳情_C 語言
- 2022-12-07 C++AVL樹4種旋轉詳講(左單旋、右單旋、左右雙旋、右左雙旋)_C 語言
- 2022-03-26 .NET?6中使用DateOnly和TimeOnly類型_ASP.NET
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支