網(wǎng)站首頁(yè) 編程語(yǔ)言 正文
Pandas是最流行的用于數(shù)據(jù)分析的 Python 庫(kù)。它提供高度優(yōu)化的性能,后端源代碼完全用C或Python編寫。
我們可以通過(guò)以下方式分析 pandas 中的數(shù)據(jù):
1.Series
2.數(shù)據(jù)幀
Series
Series 是 pandas 中定義的一維(1-D)數(shù)組,可用于存儲(chǔ)任何數(shù)據(jù)類型。
代碼 #1
創(chuàng)建 Series
# 創(chuàng)建 Series 的程序
# 導(dǎo)入 Panda 庫(kù)
import pandas as pd
# 使用數(shù)據(jù)和索引創(chuàng)建 Series
a = pd.Series(Data, index = Index)
在這里,數(shù)據(jù)可以是:
- 一個(gè)標(biāo)量值,可以是 integerValue、字符串
- 可以是鍵值對(duì)的Python 字典
- 一個(gè)Ndarray
注意:默認(rèn)情況下,索引從 0、1、2、...(n-1) 開(kāi)始,其中 n 是數(shù)據(jù)長(zhǎng)度。
代碼 #2
當(dāng) Data 包含標(biāo)量值時(shí)
# 使用標(biāo)量值創(chuàng)建 Series 的程序
# 數(shù)值數(shù)據(jù)
Data =[1, 3, 4, 5, 6, 2, 9]
# 使用默認(rèn)索引值創(chuàng)建系列
s = pd.Series(Data)
# 預(yù)定義的索引值
Index =['a', 'b', 'c', 'd', 'e', 'f', 'g']
# 創(chuàng)建具有預(yù)定義索引值的系列
si = pd.Series(Data, Index)
輸出:
具有默認(rèn)索引的標(biāo)量數(shù)據(jù)
帶索引的標(biāo)量數(shù)據(jù)
代碼#3
當(dāng)數(shù)據(jù)包含字典時(shí)
# 創(chuàng)建詞典 Series 程序
dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5}
# 創(chuàng)建字典類型 Series
sd = pd.Series(dictionary)
輸出:
字典類型數(shù)據(jù)
代碼 #4
當(dāng) Data 包含 Ndarray
# 創(chuàng)建 ndarray series 的程序
# 定義二維數(shù)組
Data =[[2, 3, 4], [5, 6, 7]]
# 創(chuàng)建一系列二維數(shù)組
snd = pd.Series(Data)
輸出:
數(shù)據(jù)作為 Ndarray
數(shù)據(jù)框
DataFrames是 pandas 中定義的二維(2-D)數(shù)據(jù)結(jié)構(gòu),由行和列組成。
代碼 #1
創(chuàng)建 DataFrame
# 創(chuàng)建 DataFrame 的程序
# 導(dǎo)入庫(kù)
import pandas as pd
# 使用數(shù)據(jù)創(chuàng)建 DataFrame
a = pd.DataFrame(Data)
在這里,數(shù)據(jù)可以是:
- 一本或多本詞典
- 一個(gè)或多個(gè)Series
- 2D-numpy Ndarray
代碼 #2
當(dāng)數(shù)據(jù)是字典時(shí)
# 使用兩個(gè)字典創(chuàng)建數(shù)據(jù)框的程序
# 定義字典 1
dict1 ={'a':1, 'b':2, 'c':3, 'd':4}
# 定義字典 2
dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9}
# 用 dict1 和 dict2 定義數(shù)據(jù)
Data = {'first':dict1, 'second':dict2}
# 創(chuàng)建數(shù)據(jù)框
df = pd.DataFrame(Data)
輸出:
帶有兩個(gè)字典的 DataFrame
代碼 #3
當(dāng)數(shù)據(jù)是Series時(shí)
# 創(chuàng)建三個(gè)系列的Dataframe的程序
import pandas as pd
# 定義 series 1
s1 = pd.Series([1, 3, 4, 5, 6, 2, 9])
# 定義 series 2
s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3])
# 定義 series 3
s3 = pd.Series(['a', 'b', 'c', 'd', 'e'])
# 定義 Data
Data ={'first':s1, 'second':s2, 'third':s3}
# 創(chuàng)建 DataFrame
dfseries = pd.DataFrame(Data)
輸出:
三個(gè) Series 的 DataFrame
代碼 #4
當(dāng) Data 為 2D-numpy ndarray注意:在創(chuàng)建 2D 數(shù)組的 DataFrame 時(shí)必須保持一個(gè)約束 - 2D 數(shù)組的維度必須相同。
# 從二維數(shù)組創(chuàng)建 DataFrame 的程序
# 導(dǎo)入庫(kù)
import pandas as pd
# 定義 2d 數(shù)組 1
d1 =[[2, 3, 4], [5, 6, 7]]
# 定義 2d 數(shù)組 2
d2 =[[2, 4, 8], [1, 3, 9]]
# 定義 Data
Data ={'first': d1, 'second': d2}
# 創(chuàng)建 DataFrame
df2d = pd.DataFrame(Data)
輸出:
帶有 2d ndarray 的 DataFrame
原文鏈接:https://juejin.cn/post/7139461530973634590
相關(guān)推薦
- 2022-11-09 發(fā)布?Android?library?到?Maven?解析_Android
- 2022-04-10 C++?反匯編之關(guān)于Switch語(yǔ)句的優(yōu)化措施_C 語(yǔ)言
- 2022-06-18 C#使用ThreadPriority設(shè)置線程優(yōu)先級(jí)_C#教程
- 2022-10-22 PostgreSql生產(chǎn)級(jí)別數(shù)據(jù)庫(kù)安裝要注意事項(xiàng)_PostgreSQL
- 2024-01-28 在已有g(shù)it倉(cāng)庫(kù)的情況下,如何提交修改后的文件
- 2022-11-13 Git如何實(shí)現(xiàn)checkout遠(yuǎn)程tag_相關(guān)技巧
- 2023-07-18 讀取Springboot的jar包中的文件資源方式
- 2023-07-15 oracle查看死鎖以及處理死鎖
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細(xì)win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運(yùn)行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲(chǔ)小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運(yùn)算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認(rèn)證信息的處理
- Spring Security之認(rèn)證過(guò)濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯(cuò)誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實(shí)現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡(jiǎn)單動(dòng)態(tài)字符串(SD
- arthas操作spring被代理目標(biāo)對(duì)象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊(duì)列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠(yuǎn)程分支