網站首頁 編程語言 正文
一、讀取Excel文件
使用pandas的read_excel()方法,可通過文件路徑直接讀取。注意到,在一個excel文件中有多個sheet,因此,對excel文件的讀取實際上是讀取指定文件、并同時指定sheet下的數據。可以一次讀取一個sheet,也可以一次讀取多個sheet,同時讀取多個sheet時后續操作可能不夠方便,因此建議一次性只讀取一個sheet。
當只讀取一個sheet時,返回的是DataFrame類型,這是一種表格數據類型,它清晰地展示出了數據的表格型結構。
具體寫法為:
(1)不指定sheet參數,默認讀取第一個sheet,
?df=pd.read_excel("data_test.xlsx")
(2)指定sheet名稱讀取,
?df=pd.read_excel("data_test.xlsx",sheet_name="test1")
(3)指定sheet索引號讀取,
?df=pd.read_excel("data_test.xlsx",sheet_name=0) #sheet索引號從0開始
*同時讀取多個sheet,以字典形式返回。(不推薦)
(1)指定多個sheet名稱讀取, df=pd.read_excel("data_test.xlsx",sheet_name=["test1","test2"])
(2)指定多個sheet索引號讀取,
df=pd.read_excel("data_test.xlsx",sheet_name=[0,1])
(3)混合指定sheet名稱和sheet索引號讀取,
df=pd.read_excel("data_test.xlsx",sheet_name=[0,"test2"])
二、DataFrame對象的結構
對內容的讀取分有表頭和無表頭兩種方式,默認情形下是有表頭的方式,即將第一行元素自動置為表頭標簽,其余內容為數據;當在read_excel()方法中加上header=None參數時是不加表頭的方式,即從第一行起,全部內容為數據。讀取到的Excel數據均構造成并返回DataFrame表格類型(以下以df表示)。
對有表頭的方式,讀取時將自動地將第一行元素置為表頭向量,同時為除表頭外的各行內容加入行索引(從0開始)、各列內容加入列索引(從0開始)。
如圖所示:
對無表頭的方式,讀取時將自動地為各行內容加入行索引(從0開始)、為各列內容加入列索引(從0開始),行索引從第一行開始。
如圖所示:
三、用values方式獲取數據
1.基本方法
df.values,獲取全部數據,返回類型為ndarray(二維);
df.index.values,獲取行索引向量,返回類型為ndarray(一維);
df.columns.values,獲取列索引向量(對有表頭的方式,是表頭標簽向量),返回類型為ndarray(一維)。
根據具體需要,通過ndarray的使用規則獲取指定數據。數據獲取的結構示意圖如下所示。
有表頭
無表頭
2.獲取指定數據的寫法
(1)獲取全部數據:
df.values,獲取全部數據,返回類型為ndarray(二維)。
(2)獲取某個值:
df.values[i , j],第i行第j列的值,返回類型依內容而定。
(3)獲取某一行:
df.values[i],第i行數據,返回類型為ndarray(一維)。
(4)獲取多行:
df.values[[i1 , i2 , i3]],第i1、i2、i3行數據,返回類型為ndarray(二維)。
(5)獲取某一列:
df.values[: , j],第j列數據,返回類型為ndarray(一維)。
(6)獲取多列:
df.values[:,[j1,j2,j3]],第j1、j2、j3列數據,返回類型為ndarray(二維)。
(7)獲取切片:
df.values[i1:i2 , j1:j2],返回行號[i1,i2)、列號[j1,j2)左閉右開區間內的數據,返回類型為ndarray(二維)。
3.示例
帶表頭,excel內容為
Python腳本為:
import pandas as pd
df = pd.read_excel("data_test.xlsx")
print("\n(1)全部數據:")
print(df.values)
print("\n(2)第2行第3列的值:")
print(df.values[1,2])
print("\n(3)第3行數據:")
print(df.values[2])
print("\n(4)獲取第2、3行數據:")
print(df.values[[1,2]])
print("\n(5)第2列數據:")
print(df.values[:,1])
print("\n(6)第2、3列數據:")
print(df.values[:,[1,2]])
print("\n(7)第2至4行、第3至5列數據:")
print(df.values[1:4,2:5])
執行結果:
四、用loc和iloc方式獲取數據
1.基本寫法
loc和iloc方法是通過索引定位的方式獲取數據的,寫法為loc[A, B]和iloc[A, B]。其中A表示對行的索引,B表示對列的索引,B可缺省。A、B可為列表或i1:i2(切片)的形式,表示多行或多列。
這兩個方法的區別是,loc將參數當作標簽處理,iloc將參數當作索引號處理。也就是說,在有表頭的方式中,當列索引使用str標簽時,只可用loc,當列索引使用索引號時,只可用iloc;在無表頭的方式中,索引向量也是標簽向量,loc和iloc均可使用;在切片中,loc是閉區間,iloc是半開區間。
獲取指定數據的寫法:
(1)獲取全部數據:
df.loc[: , :].values
或
df.iloc[: , :].values,返回類型為ndarray(二維)。
(2)獲取某個值:
無表頭
df.loc[i, j]
或
df.iloc[i, j],第i行第j列的值,返回類型依內容而定。
有表頭
df.loc[i, "序號"],第i行‘序號’列的值。
或
df.iloc[i, j],第i行第j列的值。
(3)獲取某一行:
df.loc[i].values
或
df.iloc[i].values,第i行數據,返回類型為ndarray(一維)。
(4)獲取多行:
df.loc[[i1, i2, i3]].values,
或
df.iloc[[i1, i2, i3]].values,第i1、i2、i3行數據,返回類型為ndarray(二維)。
(5)獲取某一列:
無表頭
df.loc[:, j].values
或
df.iloc[:, j].values,第j列數據,返回類型為ndarray(一維)。
有表頭
df.loc[:,"姓名"].values,‘姓名’列數據,返回類型為ndarray(一維)。
或
df.iloc[:, j].values,第j列數據,返回類型為ndarray(一維)。
(6)獲取多列:
無表頭
df.loc[:, [j1 , j2]].values
或
df.iloc[:, [j1 , j2]].values,第j1、j2列數據,返回類型為ndarray(二維)。
有表頭
df.loc[:, ["姓名","性別"]].values,‘姓名’、‘性別’列數據,返回類型為ndarray(二維);
df.iloc[:, [j1 , j2]].values,第j1、j2列數據,返回類型為ndarray(二維)。
(7)獲取切片:
無表頭
df.loc[i1:i2, j1:j2].values,返回行號[i1,i2]、列號[j1,j2]閉區間內的數據,返回類型為ndarray(二維);
df.iloc[i1:i2, j1:j2].values,返回行號[i1,i2)、列號[j1,j2)左閉右開區間內的數據,返回類型為ndarray(二維)。
有表頭
df.loc[i1:i2, "序號":"姓名"].values,返回行號[i1,i2]、列號["序號","姓名"]閉區間的數據,返回類型為ndarray(二維);
df.iloc[i1:i2, j1:j2].values,返回行號[i1,i2)、列號[j1,j2)左閉右開區間內的數據,返回類型為ndarray(二維)。
2.示例
帶表頭,excel內容為
Python腳本為:
import pandas as pd
df = pd.read_excel("data_test.xlsx")
print("\n(1)全部數據:")
print(df.iloc[:,:].values)
print("\n(2)第2行第3列的值:")
print(df.iloc[1,2])
print("\n(3)第3行數據:")
print(df.iloc[2].values)
print("\n(4)第2列數據:")
print(df.iloc[:,1].values)
print("\n(5)第6行的姓名:")
print(df.loc[5,"姓名"])
print("\n(6)第2至3行、第3至4列數據:")
print(df.iloc[1:3,2:4].values)
執行結果:
原文鏈接:https://blog.csdn.net/npm_run_dev__/article/details/125881177
相關推薦
- 2022-09-26 Pytorch模型訓練和模型驗證
- 2022-05-06 React自定義Hook-useForkRef的具體使用_React
- 2022-06-10 FreeRTOS實時操作系統之可視化追蹤調試_操作系統
- 2022-07-24 Harbor高可用配置及倉庫使用介紹_云其它
- 2022-03-08 用C語言實現鏈式棧介紹_C 語言
- 2022-09-13 Go語言中map使用和并發安全詳解_Golang
- 2022-12-26 詳解Golang中Context的原理和使用技巧_Golang
- 2022-09-12 Python中.py程序在CMD控制臺以指定虛擬環境運行_python
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支