日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學(xué)無先后,達(dá)者為師

網(wǎng)站首頁 編程語言 正文

Python中的pandas庫簡介及其使用教程_python

作者:搞點(diǎn)學(xué)術(shù)的研究生 ? 更新時(shí)間: 2022-12-08 編程語言

pandas模塊

pandas是一個(gè)強(qiáng)大的分析結(jié)構(gòu)化數(shù)據(jù)的工具集;它的使用基礎(chǔ)是Numpy(提供高性能的矩陣運(yùn)算);用于數(shù)據(jù)挖掘和數(shù)據(jù)分析,同時(shí)也提供數(shù)據(jù)清洗功能。

  • 便捷的數(shù)據(jù)處理能力
  • 獨(dú)特的數(shù)據(jù)結(jié)構(gòu)
  • 讀取文件方便
  • 封裝了matplotlib的畫圖和numpy的計(jì)算

Pandas中常見的數(shù)據(jù)結(jié)構(gòu)有兩種:

Series DateFrame
類似一維數(shù)組的對象, 類似多維數(shù)組/表格數(shù)組;每列數(shù)據(jù)可以是不同的類型;索引包括列索引和行索引。

Series

  • 構(gòu)建Series:ser_obj = pd.Series(range(10))
  • 由索引和數(shù)據(jù)組成(索引在左<自動(dòng)創(chuàng)建的>,數(shù)據(jù)在右)。
  • 獲取數(shù)據(jù)和索引:ser_obj.index; ser_obj.values
  • 預(yù)覽數(shù)據(jù):?ser_obj.head(n);ser_obj.tail(n)

DateFrame

  • 獲取列數(shù)據(jù):df_obj[col_idx]或df_obj.col_idx
  • 增加列數(shù)據(jù):df_obj[new_col_idx] = data
  • 刪除列:del df_obj[col_idx]
  • 按值排序:sort_values(by = “l(fā)abel_name”)

常用方法

Count 非NA值得數(shù)量
describe 針對Series或各DataFrame列計(jì)算匯總統(tǒng)計(jì)
min\max 計(jì)算最小值和最大值
argmin\argmax 計(jì)算能夠獲取到最大值或最小值的索引位置
idxmin\idxmax 計(jì)算能夠獲取到最小值和最大值的索引值
quantile 計(jì)算樣本的分位數(shù)(0-1)
sum 值得總和
mean 值得平均值
median 值的算術(shù)中位數(shù)(50%分位數(shù))
mad 根據(jù)平均值計(jì)算平均絕對離差
var 樣本值得方差
std 樣本值得標(biāo)準(zhǔn)差
skew 樣本值的偏度(三階距)
kurt 樣本值的峰度(四階距)
cumsum 樣本值的累計(jì)和
cummin\cummax 樣本值的累計(jì)最大值和累計(jì)最小值
cumprod 樣本值的累計(jì)積
diff 計(jì)算一階差分(對時(shí)間序列很有用)
pct_change 計(jì)算百分?jǐn)?shù)變化

處理缺失數(shù)據(jù)

  • Dropna()丟棄缺失數(shù)據(jù)
  • Fillna()填充缺失數(shù)據(jù)

數(shù)據(jù)過濾

Df[filter_condition]依據(jù)filter_condition(條件)對Df(數(shù)據(jù))進(jìn)行過濾。

繪圖功能

Plot(kind,x,y,title,figsize)
Kind(繪制什么形式的圖),x(x軸內(nèi)容),y(y軸內(nèi)容),title(圖標(biāo)題),figsize(圖大小)

保存圖片:plt.savefig()

"The fool doth think he is wise, but the wise man knows himself to be a fool." --威廉·莎士比亞

原文鏈接:https://blog.csdn.net/cjx14060307101/article/details/89023715

欄目分類
最近更新