日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

Python使用pandas導入csv文件內容的示例代碼_python

作者:smart_cat ? 更新時間: 2023-01-29 編程語言

使用pandas導入csv文件內容

1. 默認導入

在Python中導入.csv文件用的方法是read_csv()。

使用read_csv()進行導入時,指定文件名即可

import pandas as pd
df = pd.read_csv(r'G:\test.csv')
print(df)

20221222165053

2. 指定分隔符

read_csv()默認文件中的數據都是以逗號分開的,但是有的文件不是用逗號分開的,這個時候就需要人為指定分隔符號,否則就會報錯。

分隔符通過sep參數指定。常見的分隔符除了逗號,還有空格以及制表符(\t)等

import pandas as pd
df = pd.read_csv(r'G:\test.csv', sep=',')
print(df)

3. 指定讀取行數

假設現在有一個幾百兆的文件,你想了解一下這個文件里有哪些數據,那么這個時候你就沒必要把全部數據都導入,你只要看到前面幾行即可,因此只要設置 nrows參數即可。

import pandas as pd
df = pd.read_csv(r'G:\test.csv', sep=',', nrows=2)
print(df)

20221222165130

4. 指定編碼格式

每個文件都是有編碼格式的,常用的編碼格式有utf-8和gbk等。有的時候兩個文件看起來一樣,它們的文件名一樣,格式也一樣,但如果它們的編碼格式不一樣,也是不一樣的文件,比如當你把一個Excel文件另存為保存時會出現兩個選項,雖然都是.csv文件,但是這兩種格式代表兩種不同的文件

20221222163325

Python用得比較多的兩種編碼格式是UTF-8和gbk,默認編碼格式是UTF-8。我們要根據導入文件本身的編碼格式進行設置,通過設置參數encoding來設置導入的編碼格式。

如果我們不指定encoding參數, 默認是使用utf-8編碼格式。

import pandas as pd
df = pd.read_csv(r'G:\test.csv', sep=',', nrows=3, encoding='utf-8')
print(df)

如果是CSV(逗號分隔) (*.csv)格式的文件,那么在導入的時候就需要把編碼格式更改為gbk,如果使用UTF-8就會報錯。

5. 列標題與數據對齊

因為我們的表格中有中文,中文占用的字符和英文、數字占用的字符不一樣,因此需要調用pd.set_option()使表格對齊顯示。如果你是使用 Jupyter 來運行代碼的,Jupyter 會自動渲染出一個表格,則無需這個設置。

import pandas as pd
#處理數據的列標題與數據無法對齊的情況
pd.set_option('display.unicode.ambiguous_as_wide', True)
#無法對齊主要是因為列標題是中文
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_csv(r'G:\test.csv', sep=',', nrows=3, encoding='utf-8')
print(df)

對齊后的效果:

20221222164851

原文鏈接:https://blog.csdn.net/hubing_hust/article/details/128410816

欄目分類
最近更新