日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學(xué)無(wú)先后,達(dá)者為師

網(wǎng)站首頁(yè) 編程語(yǔ)言 正文

Python利用Pandas進(jìn)行數(shù)據(jù)分析的方法詳解_python

作者:海擁 ? 更新時(shí)間: 2022-10-30 編程語(yǔ)言

Pandas是最流行的用于數(shù)據(jù)分析的 Python 庫(kù)。它提供高度優(yōu)化的性能,后端源代碼完全用CPython編寫。

我們可以通過(guò)以下方式分析 pandas 中的數(shù)據(jù):

1.Series

2.數(shù)據(jù)幀

Series

Series 是 pandas 中定義的一維(1-D)數(shù)組,可用于存儲(chǔ)任何數(shù)據(jù)類型。

代碼 #1

創(chuàng)建 Series

# 創(chuàng)建 Series 的程序

# 導(dǎo)入 Panda 庫(kù)
import pandas as pd

# 使用數(shù)據(jù)和索引創(chuàng)建 Series
a = pd.Series(Data, index = Index)

在這里,數(shù)據(jù)可以是:

  • 一個(gè)標(biāo)量值,可以是 integerValue、字符串
  • 可以是鍵值對(duì)的Python 字典
  • 一個(gè)Ndarray

注意:默認(rèn)情況下,索引從 0、1、2、...(n-1) 開(kāi)始,其中 n 是數(shù)據(jù)長(zhǎng)度。

代碼 #2

當(dāng) Data 包含標(biāo)量值時(shí)

# 使用標(biāo)量值創(chuàng)建 Series 的程序

# 數(shù)值數(shù)據(jù)
Data =[1, 3, 4, 5, 6, 2, 9]

# 使用默認(rèn)索引值創(chuàng)建系列
s = pd.Series(Data)	

# 預(yù)定義的索引值
Index =['a', 'b', 'c', 'd', 'e', 'f', 'g']

# 創(chuàng)建具有預(yù)定義索引值的系列
si = pd.Series(Data, Index)

輸出

具有默認(rèn)索引的標(biāo)量數(shù)據(jù)

帶索引的標(biāo)量數(shù)據(jù)

代碼#3

當(dāng)數(shù)據(jù)包含字典時(shí)

# 創(chuàng)建詞典 Series 程序
dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5}

# 創(chuàng)建字典類型 Series
sd = pd.Series(dictionary)

輸出

字典類型數(shù)據(jù)

代碼 #4

當(dāng) Data 包含 Ndarray

# 創(chuàng)建 ndarray series 的程序

# 定義二維數(shù)組
Data =[[2, 3, 4], [5, 6, 7]]

# 創(chuàng)建一系列二維數(shù)組
snd = pd.Series(Data)	

輸出

數(shù)據(jù)作為 Ndarray

數(shù)據(jù)框

DataFrames是 pandas 中定義的二維(2-D)數(shù)據(jù)結(jié)構(gòu),由行和列組成。

代碼 #1

創(chuàng)建 DataFrame

# 創(chuàng)建 DataFrame 的程序

# 導(dǎo)入庫(kù)
import pandas as pd

# 使用數(shù)據(jù)創(chuàng)建 DataFrame
a = pd.DataFrame(Data)

在這里,數(shù)據(jù)可以是:

  • 一本或多本詞典
  • 一個(gè)或多個(gè)Series
  • 2D-numpy Ndarray

代碼 #2

當(dāng)數(shù)據(jù)是字典時(shí)

# 使用兩個(gè)字典創(chuàng)建數(shù)據(jù)框的程序

# 定義字典 1
dict1 ={'a':1, 'b':2, 'c':3, 'd':4}

# 定義字典 2
dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9}

# 用 dict1 和 dict2 定義數(shù)據(jù)
Data = {'first':dict1, 'second':dict2}

# 創(chuàng)建數(shù)據(jù)框
df = pd.DataFrame(Data)

輸出

帶有兩個(gè)字典的 DataFrame

代碼 #3

當(dāng)數(shù)據(jù)是Series時(shí)

# 創(chuàng)建三個(gè)系列的Dataframe的程序
import pandas as pd

# 定義 series 1
s1 = pd.Series([1, 3, 4, 5, 6, 2, 9])

# 定義 series 2
s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3])

# 定義 series 3
s3 = pd.Series(['a', 'b', 'c', 'd', 'e'])	

# 定義 Data
Data ={'first':s1, 'second':s2, 'third':s3}

# 創(chuàng)建 DataFrame
dfseries = pd.DataFrame(Data)			

輸出

三個(gè) Series 的 DataFrame

代碼 #4

當(dāng) Data 為 2D-numpy ndarray注意:在創(chuàng)建 2D 數(shù)組的 DataFrame 時(shí)必須保持一個(gè)約束 - 2D 數(shù)組的維度必須相同。

# 從二維數(shù)組創(chuàng)建 DataFrame 的程序

# 導(dǎo)入庫(kù)
import pandas as pd

# 定義 2d 數(shù)組 1
d1 =[[2, 3, 4], [5, 6, 7]]

# 定義 2d 數(shù)組 2
d2 =[[2, 4, 8], [1, 3, 9]]

# 定義 Data
Data ={'first': d1, 'second': d2}

# 創(chuàng)建 DataFrame
df2d = pd.DataFrame(Data)	

輸出

帶有 2d ndarray 的 DataFrame

原文鏈接:https://juejin.cn/post/7139461530973634590

欄目分類
最近更新