網(wǎng)站首頁 編程語言 正文
pandas模塊
pandas是一個(gè)強(qiáng)大的分析結(jié)構(gòu)化數(shù)據(jù)的工具集;它的使用基礎(chǔ)是Numpy(提供高性能的矩陣運(yùn)算);用于數(shù)據(jù)挖掘和數(shù)據(jù)分析,同時(shí)也提供數(shù)據(jù)清洗功能。
- 便捷的數(shù)據(jù)處理能力
- 獨(dú)特的數(shù)據(jù)結(jié)構(gòu)
- 讀取文件方便
- 封裝了matplotlib的畫圖和numpy的計(jì)算
Pandas中常見的數(shù)據(jù)結(jié)構(gòu)有兩種:
Series | DateFrame |
---|---|
類似一維數(shù)組的對象, | 類似多維數(shù)組/表格數(shù)組;每列數(shù)據(jù)可以是不同的類型;索引包括列索引和行索引。 |
Series
- 構(gòu)建Series:
ser_obj = pd.Series(range(10))
- 由索引和數(shù)據(jù)組成(索引在左<自動(dòng)創(chuàng)建的>,數(shù)據(jù)在右)。
- 獲取數(shù)據(jù)和索引:
ser_obj.index; ser_obj.values
- 預(yù)覽數(shù)據(jù):?
ser_obj.head(n);ser_obj.tail(n)
DateFrame
- 獲取列數(shù)據(jù):
df_obj[col_idx]或df_obj.col_idx
- 增加列數(shù)據(jù):
df_obj[new_col_idx] = data
- 刪除列:
del df_obj[col_idx]
- 按值排序:
sort_values(by = “l(fā)abel_name”)
常用方法
Count | 非NA值得數(shù)量 |
---|---|
describe | 針對Series或各DataFrame列計(jì)算匯總統(tǒng)計(jì) |
min\max | 計(jì)算最小值和最大值 |
argmin\argmax | 計(jì)算能夠獲取到最大值或最小值的索引位置 |
idxmin\idxmax | 計(jì)算能夠獲取到最小值和最大值的索引值 |
quantile | 計(jì)算樣本的分位數(shù)(0-1) |
sum | 值得總和 |
mean | 值得平均值 |
median | 值的算術(shù)中位數(shù)(50%分位數(shù)) |
mad | 根據(jù)平均值計(jì)算平均絕對離差 |
var | 樣本值得方差 |
std | 樣本值得標(biāo)準(zhǔn)差 |
skew | 樣本值的偏度(三階距) |
kurt | 樣本值的峰度(四階距) |
cumsum | 樣本值的累計(jì)和 |
cummin\cummax | 樣本值的累計(jì)最大值和累計(jì)最小值 |
cumprod | 樣本值的累計(jì)積 |
diff | 計(jì)算一階差分(對時(shí)間序列很有用) |
pct_change | 計(jì)算百分?jǐn)?shù)變化 |
處理缺失數(shù)據(jù)
- Dropna()丟棄缺失數(shù)據(jù)
- Fillna()填充缺失數(shù)據(jù)
數(shù)據(jù)過濾
Df[filter_condition]依據(jù)filter_condition(條件)對Df(數(shù)據(jù))進(jìn)行過濾。
繪圖功能
Plot(kind,x,y,title,figsize) Kind(繪制什么形式的圖),x(x軸內(nèi)容),y(y軸內(nèi)容),title(圖標(biāo)題),figsize(圖大小)
保存圖片:plt.savefig()
("The fool doth think he is wise, but the wise man knows himself to be a fool." --威廉·莎士比亞
)
原文鏈接:https://blog.csdn.net/cjx14060307101/article/details/89023715
相關(guān)推薦
- 2023-01-07 利用Linux?Find命令快速查找文件方法_linux shell
- 2022-04-21 提升Python編碼能力的3個(gè)重要概念_python
- 2022-04-09 Maven 編譯提示:spring-boot-maven-plugin:2.1.9.RELEASE
- 2022-12-07 C++中new的用法及說明_C 語言
- 2022-04-15 使用python測試prometheus的實(shí)現(xiàn)_python
- 2022-03-28 python?Pandas中數(shù)據(jù)的合并與分組聚合_python
- 2022-10-01 如何在Python中對文件進(jìn)行操作_python
- 2022-11-20 Golang交叉編譯之跨平臺(tái)編譯使用詳解_Golang
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細(xì)win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運(yùn)行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲(chǔ)小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運(yùn)算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認(rèn)證信息的處理
- Spring Security之認(rèn)證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯(cuò)誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實(shí)現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡單動(dòng)態(tài)字符串(SD
- arthas操作spring被代理目標(biāo)對象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊(duì)列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠(yuǎn)程分支