網站首頁 編程語言 正文
1、如何統計序列中元素的出現頻度
實際案例:
- (1)某隨機序列
[12, 5, 6, 4, 6, 5, 5, 7, ...]
中找到出現次數最高的3個元素,它們出現次數是多少? - (2)對某英文文章的單詞,進行詞頻統計,找到出現次數最高的10個單詞,它們出現次數是多少?
解決方案:
使用collections.Counter
對象
將序列傳入Counter
的構造器,得到Counter
對象是元素頻度的字典。
Counter.most_common(n)
方法得到頻度最高的n個元素的列表。
2、代碼演示
(1)某隨機序列 [12, 5, 6, 4, 6, 5, 5, 7, ...] 中找到出現次數最高的3個元素,它們出現次數是多少?
from random import randint ? # 利用列表解析生成隨機序列 data = [randint(0, 20) for _ in range(30)] print(data) # 方法1: ''' 最終的統計結果肯定是一個字典,如:{2: 5, 4:9}, 以data中每一個元素作為字典的鍵,0作為初始值,創建這樣一個字典 ''' c = dict.fromkeys(data, 0) print(c) # 對data進行迭代,進行統計 for x in data: ? ? c[x] += 1 print(c) # 根據字典的值對字典項進行排序,并截取前3個元素 sort_dict = sorted(c.items(), key=lambda item: item[1], reverse=True)[0:3] print(sort_dict) ? ?? # 方法2: from collections import Counter # 直接將序列傳給Counter構造器 c2 = Counter(data) print(c2) # 直接使用對象的most_common()方法直接找到頻度最高3個 print(c2.most_common(3)) ? ?
(2)對某英文文章的單詞,進行詞頻統計,找到出現次數最高的10個單詞,它們出現次數是多少?
from collections import Counter # 導入正則表達式模塊 import re ? # 讀取整個文件內容作為字符串 txt = open('word.txt').read() print(txt) # 對詞頻進行統計,首先需要進行分割把每一個字取出來 # 用非字母的字符作為分割,然后傳給Counter()進行統計 c3 = Counter(re.split('\W+', txt)) # 使用most_common()選取10個頻度最高單詞 print(c3.most_common(10))
原文鏈接:https://blog.csdn.net/qq_37189082/article/details/124417597
相關推薦
- 2023-01-01 MongoDB?Shell常用基本操作命令詳解_MongoDB
- 2022-07-28 C++超詳細講解函數重載_C 語言
- 2022-04-23 C語言復雜鏈表的復制實例詳解_C 語言
- 2022-04-02 一文講解Kotlin中的contract到底有什么用_Android
- 2023-03-29 golang?channel讀取數據的幾種情況_Golang
- 2022-06-22 在?Python?中利用Pool?進行多處理_python
- 2023-01-15 PyQt5+QtChart繪制散點圖_python
- 2022-07-28 Jquery回調對象與延遲對象用法詳解_jquery
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支