網(wǎng)站首頁(yè) 編程語(yǔ)言 正文
1、如何統(tǒng)計(jì)序列中元素的出現(xiàn)頻度
實(shí)際案例:
- (1)某隨機(jī)序列
[12, 5, 6, 4, 6, 5, 5, 7, ...]
中找到出現(xiàn)次數(shù)最高的3個(gè)元素,它們出現(xiàn)次數(shù)是多少? - (2)對(duì)某英文文章的單詞,進(jìn)行詞頻統(tǒng)計(jì),找到出現(xiàn)次數(shù)最高的10個(gè)單詞,它們出現(xiàn)次數(shù)是多少?
解決方案:
使用collections.Counter
對(duì)象
將序列傳入Counter
的構(gòu)造器,得到Counter
對(duì)象是元素頻度的字典。
Counter.most_common(n)
方法得到頻度最高的n個(gè)元素的列表。
2、代碼演示
(1)某隨機(jī)序列 [12, 5, 6, 4, 6, 5, 5, 7, ...] 中找到出現(xiàn)次數(shù)最高的3個(gè)元素,它們出現(xiàn)次數(shù)是多少?
from random import randint ? # 利用列表解析生成隨機(jī)序列 data = [randint(0, 20) for _ in range(30)] print(data) # 方法1: ''' 最終的統(tǒng)計(jì)結(jié)果肯定是一個(gè)字典,如:{2: 5, 4:9}, 以data中每一個(gè)元素作為字典的鍵,0作為初始值,創(chuàng)建這樣一個(gè)字典 ''' c = dict.fromkeys(data, 0) print(c) # 對(duì)data進(jìn)行迭代,進(jìn)行統(tǒng)計(jì) for x in data: ? ? c[x] += 1 print(c) # 根據(jù)字典的值對(duì)字典項(xiàng)進(jìn)行排序,并截取前3個(gè)元素 sort_dict = sorted(c.items(), key=lambda item: item[1], reverse=True)[0:3] print(sort_dict) ? ?? # 方法2: from collections import Counter # 直接將序列傳給Counter構(gòu)造器 c2 = Counter(data) print(c2) # 直接使用對(duì)象的most_common()方法直接找到頻度最高3個(gè) print(c2.most_common(3)) ? ?
(2)對(duì)某英文文章的單詞,進(jìn)行詞頻統(tǒng)計(jì),找到出現(xiàn)次數(shù)最高的10個(gè)單詞,它們出現(xiàn)次數(shù)是多少?
from collections import Counter # 導(dǎo)入正則表達(dá)式模塊 import re ? # 讀取整個(gè)文件內(nèi)容作為字符串 txt = open('word.txt').read() print(txt) # 對(duì)詞頻進(jìn)行統(tǒng)計(jì),首先需要進(jìn)行分割把每一個(gè)字取出來(lái) # 用非字母的字符作為分割,然后傳給Counter()進(jìn)行統(tǒng)計(jì) c3 = Counter(re.split('\W+', txt)) # 使用most_common()選取10個(gè)頻度最高單詞 print(c3.most_common(10))
原文鏈接:https://blog.csdn.net/qq_37189082/article/details/124417597
相關(guān)推薦
- 2022-05-29 ASP.NET?Core全局異常處理_實(shí)用技巧
- 2022-09-20 Go泛型實(shí)戰(zhàn)教程之如何在結(jié)構(gòu)體中使用泛型_Golang
- 2022-08-27 C++中Boost的智能指針shared_ptr_C 語(yǔ)言
- 2022-03-31 解決在window下執(zhí)行SQLSERVER定時(shí)備份的問(wèn)題_MsSql
- 2022-05-12 Kotlin 擴(kuò)展函數(shù) 鏈?zhǔn)秸{(diào)用 泛型與擴(kuò)展函數(shù)
- 2022-12-11 C語(yǔ)言冷知識(shí)之預(yù)處理字符串操作符詳解_C 語(yǔ)言
- 2023-09-18 【解決】npm ERR A complete log of this run can be foun
- 2023-05-31 Pandas多個(gè)條件(AND,OR,NOT)中提取行_python
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細(xì)win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運(yùn)行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲(chǔ)小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運(yùn)算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認(rèn)證信息的處理
- Spring Security之認(rèn)證過(guò)濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯(cuò)誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實(shí)現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡(jiǎn)單動(dòng)態(tài)字符串(SD
- arthas操作spring被代理目標(biāo)對(duì)象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊(duì)列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠(yuǎn)程分支