網站首頁 編程語言 正文
Pandas是最流行的用于數據分析的 Python 庫。它提供高度優化的性能,后端源代碼完全用C或Python編寫。
我們可以通過以下方式分析 pandas 中的數據:
1.Series
2.數據幀
Series
Series 是 pandas 中定義的一維(1-D)數組,可用于存儲任何數據類型。
代碼 #1
創建 Series
# 創建 Series 的程序
# 導入 Panda 庫
import pandas as pd
# 使用數據和索引創建 Series
a = pd.Series(Data, index = Index)
在這里,數據可以是:
- 一個標量值,可以是 integerValue、字符串
- 可以是鍵值對的Python 字典
- 一個Ndarray
注意:默認情況下,索引從 0、1、2、...(n-1) 開始,其中 n 是數據長度。
代碼 #2
當 Data 包含標量值時
# 使用標量值創建 Series 的程序
# 數值數據
Data =[1, 3, 4, 5, 6, 2, 9]
# 使用默認索引值創建系列
s = pd.Series(Data)
# 預定義的索引值
Index =['a', 'b', 'c', 'd', 'e', 'f', 'g']
# 創建具有預定義索引值的系列
si = pd.Series(Data, Index)
輸出:
具有默認索引的標量數據
帶索引的標量數據
代碼#3
當數據包含字典時
# 創建詞典 Series 程序
dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5}
# 創建字典類型 Series
sd = pd.Series(dictionary)
輸出:
字典類型數據
代碼 #4
當 Data 包含 Ndarray
# 創建 ndarray series 的程序
# 定義二維數組
Data =[[2, 3, 4], [5, 6, 7]]
# 創建一系列二維數組
snd = pd.Series(Data)
輸出:
數據作為 Ndarray
數據框
DataFrames是 pandas 中定義的二維(2-D)數據結構,由行和列組成。
代碼 #1
創建 DataFrame
# 創建 DataFrame 的程序
# 導入庫
import pandas as pd
# 使用數據創建 DataFrame
a = pd.DataFrame(Data)
在這里,數據可以是:
- 一本或多本詞典
- 一個或多個Series
- 2D-numpy Ndarray
代碼 #2
當數據是字典時
# 使用兩個字典創建數據框的程序
# 定義字典 1
dict1 ={'a':1, 'b':2, 'c':3, 'd':4}
# 定義字典 2
dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9}
# 用 dict1 和 dict2 定義數據
Data = {'first':dict1, 'second':dict2}
# 創建數據框
df = pd.DataFrame(Data)
輸出:
帶有兩個字典的 DataFrame
代碼 #3
當數據是Series時
# 創建三個系列的Dataframe的程序
import pandas as pd
# 定義 series 1
s1 = pd.Series([1, 3, 4, 5, 6, 2, 9])
# 定義 series 2
s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3])
# 定義 series 3
s3 = pd.Series(['a', 'b', 'c', 'd', 'e'])
# 定義 Data
Data ={'first':s1, 'second':s2, 'third':s3}
# 創建 DataFrame
dfseries = pd.DataFrame(Data)
輸出:
三個 Series 的 DataFrame
代碼 #4
當 Data 為 2D-numpy ndarray注意:在創建 2D 數組的 DataFrame 時必須保持一個約束 - 2D 數組的維度必須相同。
# 從二維數組創建 DataFrame 的程序
# 導入庫
import pandas as pd
# 定義 2d 數組 1
d1 =[[2, 3, 4], [5, 6, 7]]
# 定義 2d 數組 2
d2 =[[2, 4, 8], [1, 3, 9]]
# 定義 Data
Data ={'first': d1, 'second': d2}
# 創建 DataFrame
df2d = pd.DataFrame(Data)
輸出:
帶有 2d ndarray 的 DataFrame
原文鏈接:https://juejin.cn/post/7139461530973634590
相關推薦
- 2022-04-28 Python模塊pexpect安裝及使用流程_python
- 2022-12-26 python使用Pyinstaller如何打包整個項目_python
- 2022-12-29 react如何修改循環數組對象的數據_React
- 2022-06-01 Python實現訪問者模式詳情_python
- 2022-06-12 Flutter仿微信通訊錄實現自定義導航條的示例代碼_Android
- 2022-12-23 loadavg數據異常引發問題起源分析_Android
- 2022-05-29 C/C++迭代器的失效問題詳解_C 語言
- 2022-09-10 python實現整數序列求和_python
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支