網站首頁 編程語言 正文
使用pandas導入csv文件內容
1. 默認導入
在Python中導入.csv文件用的方法是read_csv()。
使用read_csv()進行導入時,指定文件名即可
import pandas as pd
df = pd.read_csv(r'G:\test.csv')
print(df)
2. 指定分隔符
read_csv()默認文件中的數據都是以逗號分開的,但是有的文件不是用逗號分開的,這個時候就需要人為指定分隔符號,否則就會報錯。
分隔符通過sep參數指定。常見的分隔符除了逗號,還有空格以及制表符(\t)等
import pandas as pd
df = pd.read_csv(r'G:\test.csv', sep=',')
print(df)
3. 指定讀取行數
假設現在有一個幾百兆的文件,你想了解一下這個文件里有哪些數據,那么這個時候你就沒必要把全部數據都導入,你只要看到前面幾行即可,因此只要設置 nrows參數即可。
import pandas as pd
df = pd.read_csv(r'G:\test.csv', sep=',', nrows=2)
print(df)
4. 指定編碼格式
每個文件都是有編碼格式的,常用的編碼格式有utf-8和gbk等。有的時候兩個文件看起來一樣,它們的文件名一樣,格式也一樣,但如果它們的編碼格式不一樣,也是不一樣的文件,比如當你把一個Excel文件另存為保存時會出現兩個選項,雖然都是.csv文件,但是這兩種格式代表兩種不同的文件
Python用得比較多的兩種編碼格式是UTF-8和gbk,默認編碼格式是UTF-8。我們要根據導入文件本身的編碼格式進行設置,通過設置參數encoding來設置導入的編碼格式。
如果我們不指定encoding參數, 默認是使用utf-8編碼格式。
import pandas as pd
df = pd.read_csv(r'G:\test.csv', sep=',', nrows=3, encoding='utf-8')
print(df)
如果是CSV(逗號分隔) (*.csv)格式的文件,那么在導入的時候就需要把編碼格式更改為gbk,如果使用UTF-8就會報錯。
5. 列標題與數據對齊
因為我們的表格中有中文,中文占用的字符和英文、數字占用的字符不一樣,因此需要調用pd.set_option()使表格對齊顯示。如果你是使用 Jupyter 來運行代碼的,Jupyter 會自動渲染出一個表格,則無需這個設置。
import pandas as pd
#處理數據的列標題與數據無法對齊的情況
pd.set_option('display.unicode.ambiguous_as_wide', True)
#無法對齊主要是因為列標題是中文
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_csv(r'G:\test.csv', sep=',', nrows=3, encoding='utf-8')
print(df)
對齊后的效果:
原文鏈接:https://blog.csdn.net/hubing_hust/article/details/128410816
相關推薦
- 2022-11-01 AndroidView與Compose框架交互實現介紹_Android
- 2022-07-10 uniapp.navigateTo找不到文件路徑,無法進行頁面跳轉,不報錯
- 2022-03-30 python生成密碼字典詳解_python
- 2022-06-14 C#實現加密的幾種方法介紹_C#教程
- 2022-08-02 shell自動拉取鏡像并運行容器的shell腳本_linux shell
- 2022-11-13 使用git?checkout到歷史某個版本_相關技巧
- 2022-07-14 python如何往列表頭部和尾部添加元素_python
- 2022-12-14 Android使用Room操作數據庫流程詳解_Android
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支