網站首頁 編程語言 正文
Pandas中Series和DataFrame的兩種數據類型中都有nunique()和unique()方法。這兩個方法作用很簡單,都是求Series或Pandas中的不同值。而unique()方法返回的是去重之后的不同值,而nunique()方法則直接放回不同值的個數。
具體如下:
如果Series或DataFrame中沒有None值,則unique()方法返回的序列數據的長度等于nunique()方法的返回值(如上述代碼中所展示的)。則當Series或DataFrame中有None值時,這兩個就不一定相等了。具體如下:
從上述結果可知, nunique()可以通過參數dropna來自定義設置在統計不同值過程中是否需要包含None值,而unique()方法中沒有可設置的參數,該方法在統計時無法排除None值。?
1 unique()
統計list中的不同值時,返回的是array.它有三個參數,可分別統計不同的量,返回的都是array.
當list中的元素也是list時,盡量不要用這種方法.
import numpy as np
a = [1,5,4,2,3,3,5]
# 返回一個array
print(np.unique(a))
# [1 2 3 4 5]
# 返回該元素在list中第一次出現的索引
print(np.unique(a,return_index=True))
# (array([1, 2, 3, 4, 5]), array([0, 3, 4, 2, 1]))
# 返回原list中每個元素在新的list中對應的索引
print(np.unique(a,return_inverse=True))
# (array([1, 2, 3, 4, 5]), array([0, 4, 3, 1, 2, 2, 4]))
# 返回該元素在list中出現的次數
print(np.unique(a,return_counts=True))
# (array([1, 2, 3, 4, 5]), array([1, 1, 2, 1, 2]))
# 當加參數時,unique()返回的是一個tuple,這里利用了tuple的性質,即有多少個元素即可賦值給對應的多少個變量
p,q,m,n = np.unique(a,return_index=True,return_inverse=True,return_counts=True)
print(p,q,m,n)
# [1 2 3 4 5] [0 3 4 2 1] [0 4 3 1 2 2 4] [1 1 2 1 2]
# 注意當list中的元素不是數字而是list的時候,輸出的數據類型與list中元素的長度有關
# 利用這種方法對list中元素去重或求里面元素的個數都不是好方法,很容易出錯
統計series中的不同值時,返回的是array,它沒有其它參數
import pandas as pd
se = pd.Series([1,3,4,5,2,2,3])
print(se.unique())
# [1 3 4 5 2]
2.nunique()
可直接統計dataframe中每列的不同值的個數,也可用于series,但不能用于list.返回的是不同值的個數.
df=pd.DataFrame({'A':[0,1,1],'B':[0,5,6]})
print(df)
print(df.nunique())
# A B
# 0 0 0
# 1 1 5
# 2 1 6
# A 2
# B 3
# dtype: int64
也可與groupby結合使用,統計每個塊的不同值的個數.
all_user_repay = all_user_repay.groupby(['user_id'])['listing_id'].agg(['nunique']).reset_index()
# user_id nunique
# 0 40 1
# 1 56 1
# 2 98 1
# 3 103 1
# 4 122 1
原文鏈接:https://blog.csdn.net/Ghjkku/article/details/125773412
相關推薦
- 2022-07-30 python?replace?空格數據處理的實現_python
- 2022-09-25 引入DjangoRESTframework
- 2023-04-06 Pytorch中關于model.eval()的作用及分析_python
- 2022-12-13 Python使用Matplotlib繪制三維散點圖詳解流程_python
- 2022-07-09 python如何給內存和cpu使用量設置限制_python
- 2022-05-09 Go語言context上下文管理的使用_Golang
- 2022-05-14 Python偽隨機數模塊random詳解_python
- 2022-07-01 python讀取nc數據并繪圖的方法實例_python
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支