日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

Python利用Pandas進行數據分析的方法詳解_python

作者:海擁 ? 更新時間: 2022-10-30 編程語言

Pandas是最流行的用于數據分析的 Python 庫。它提供高度優化的性能,后端源代碼完全用CPython編寫。

我們可以通過以下方式分析 pandas 中的數據:

1.Series

2.數據幀

Series

Series 是 pandas 中定義的一維(1-D)數組,可用于存儲任何數據類型。

代碼 #1

創建 Series

# 創建 Series 的程序

# 導入 Panda 庫
import pandas as pd

# 使用數據和索引創建 Series
a = pd.Series(Data, index = Index)

在這里,數據可以是:

  • 一個標量值,可以是 integerValue、字符串
  • 可以是鍵值對的Python 字典
  • 一個Ndarray

注意:默認情況下,索引從 0、1、2、...(n-1) 開始,其中 n 是數據長度。

代碼 #2

當 Data 包含標量值時

# 使用標量值創建 Series 的程序

# 數值數據
Data =[1, 3, 4, 5, 6, 2, 9]

# 使用默認索引值創建系列
s = pd.Series(Data)	

# 預定義的索引值
Index =['a', 'b', 'c', 'd', 'e', 'f', 'g']

# 創建具有預定義索引值的系列
si = pd.Series(Data, Index)

輸出

具有默認索引的標量數據

帶索引的標量數據

代碼#3

當數據包含字典時

# 創建詞典 Series 程序
dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5}

# 創建字典類型 Series
sd = pd.Series(dictionary)

輸出

字典類型數據

代碼 #4

當 Data 包含 Ndarray

# 創建 ndarray series 的程序

# 定義二維數組
Data =[[2, 3, 4], [5, 6, 7]]

# 創建一系列二維數組
snd = pd.Series(Data)	

輸出

數據作為 Ndarray

數據框

DataFrames是 pandas 中定義的二維(2-D)數據結構,由行和列組成。

代碼 #1

創建 DataFrame

# 創建 DataFrame 的程序

# 導入庫
import pandas as pd

# 使用數據創建 DataFrame
a = pd.DataFrame(Data)

在這里,數據可以是:

  • 一本或多本詞典
  • 一個或多個Series
  • 2D-numpy Ndarray

代碼 #2

當數據是字典時

# 使用兩個字典創建數據框的程序

# 定義字典 1
dict1 ={'a':1, 'b':2, 'c':3, 'd':4}

# 定義字典 2
dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9}

# 用 dict1 和 dict2 定義數據
Data = {'first':dict1, 'second':dict2}

# 創建數據框
df = pd.DataFrame(Data)

輸出

帶有兩個字典的 DataFrame

代碼 #3

當數據是Series時

# 創建三個系列的Dataframe的程序
import pandas as pd

# 定義 series 1
s1 = pd.Series([1, 3, 4, 5, 6, 2, 9])

# 定義 series 2
s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3])

# 定義 series 3
s3 = pd.Series(['a', 'b', 'c', 'd', 'e'])	

# 定義 Data
Data ={'first':s1, 'second':s2, 'third':s3}

# 創建 DataFrame
dfseries = pd.DataFrame(Data)			

輸出

三個 Series 的 DataFrame

代碼 #4

當 Data 為 2D-numpy ndarray注意:在創建 2D 數組的 DataFrame 時必須保持一個約束 - 2D 數組的維度必須相同。

# 從二維數組創建 DataFrame 的程序

# 導入庫
import pandas as pd

# 定義 2d 數組 1
d1 =[[2, 3, 4], [5, 6, 7]]

# 定義 2d 數組 2
d2 =[[2, 4, 8], [1, 3, 9]]

# 定義 Data
Data ={'first': d1, 'second': d2}

# 創建 DataFrame
df2d = pd.DataFrame(Data)	

輸出

帶有 2d ndarray 的 DataFrame

原文鏈接:https://juejin.cn/post/7139461530973634590

欄目分類
最近更新