日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

Python使用pandas導入xlsx格式的excel文件內容操作代碼_python

作者:smart_cat ? 更新時間: 2023-01-29 編程語言

Python使用pandas導入xlsx格式的excel文件內容

1. 基本導入

在 Python中使用pandas導入.xlsx文件的方法是read_excel()。

# coding=utf-8
import pandas as pd

df = pd.read_excel(r'G:\test.xlsx')
print(df)

20221222175733

電腦中的文件路徑默認使用\,這個時候需要在路徑前面加一個r(轉義符)避免路徑里面的\被轉義。也可以不加 r,但是需要把路徑里面的所有\轉換成/,這個規則在導入其他格式文件時也是一樣的,我們一般選擇在路徑前面加r

2. 列標題與數據對齊

因為我們的表格中有中文,中文占用的字符和英文、數字占用的字符不一樣,因此需要調用pd.set_option()使表格對齊顯示。如果你是使用 Jupyter 來運行代碼的,Jupyter 會自動渲染出一個表格,則無需這個設置。

import pandas as pd
#處理數據的列標題與數據無法對齊的情況
pd.set_option('display.unicode.ambiguous_as_wide', True)
#無法對齊主要是因為列標題是中文
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx')
print(df)

效果如下:

20221222180651

3. 指定導入某個sheet

通過sheet_name參數可以指定要導入哪個sheet的內容。注意這里的名字是區分大小寫的。

import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name='Sheet1')
print(df)

除了可以指定具體的sheet名字,還可以傳入sheet的index下標,從0開始計數。例如:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0)
print(df)

如果不指定sheet_name參數,那么默認導入的都是第一個sheet的內容。

4. 指定行索引

在本地文件導入DataFrame時,行索引使用的從0開始的默認索引,可以通過設置index_col參數來設置。

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, index_col=0)
print(df)

20221222180855

5. 指定列索引

將本地文件導入DataFrame時,默認使用源數據表的第一行作為列索引,也可以通過設置header參數來設置列索引。 header參數值默認為0,即用第一行作為列索引;也可以是其他行,只需要傳入具體的那一行即可;也可以使用默認從0開始的數作為列索引。

使用默認從0開始的數作為列索引示意:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, header=None)
print(df)

20221222181152

6. 指定導入列

有的時候本地文件的列數太多,而我們又不需要那么多列時,我們就可以通過設定usecols參數來指定要導入的列。

20221222181410

從參數的形式來看,可以通過以下幾種形式來指定:

  • 通過列表指定,列表中是列的下標,從0開始計數。
  • 通過列表指定,列表中是列的名字
  • 通過元組指定, 元組中是列的名字

示例如下:

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=[0,1])
print(df)

20221222182310

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=['姓名','性別'])
print(df)

20221222182659

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=('姓名','年齡'))
print(df)

20221222182822

7. 指定導入的行數

如果文件很大,我們不想導入全部的行,只需要導入前面若干行進行分析即可,那么可以通過nrows參數來指定導入多少行數據

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, nrows=2)
print(df)

20221222183203

8. 更多的參數

請參考pandas官方文檔。

原文鏈接:https://blog.csdn.net/hubing_hust/article/details/128412197

欄目分類
最近更新