網(wǎng)站首頁 編程語言 正文
使用pandas導(dǎo)入csv文件內(nèi)容
1. 默認(rèn)導(dǎo)入
在Python中導(dǎo)入.csv文件用的方法是read_csv()。
使用read_csv()進(jìn)行導(dǎo)入時(shí),指定文件名即可
import pandas as pd
df = pd.read_csv(r'G:\test.csv')
print(df)
2. 指定分隔符
read_csv()默認(rèn)文件中的數(shù)據(jù)都是以逗號(hào)分開的,但是有的文件不是用逗號(hào)分開的,這個(gè)時(shí)候就需要人為指定分隔符號(hào),否則就會(huì)報(bào)錯(cuò)。
分隔符通過sep參數(shù)指定。常見的分隔符除了逗號(hào),還有空格以及制表符(\t)等
import pandas as pd
df = pd.read_csv(r'G:\test.csv', sep=',')
print(df)
3. 指定讀取行數(shù)
假設(shè)現(xiàn)在有一個(gè)幾百兆的文件,你想了解一下這個(gè)文件里有哪些數(shù)據(jù),那么這個(gè)時(shí)候你就沒必要把全部數(shù)據(jù)都導(dǎo)入,你只要看到前面幾行即可,因此只要設(shè)置 nrows參數(shù)即可。
import pandas as pd
df = pd.read_csv(r'G:\test.csv', sep=',', nrows=2)
print(df)
4. 指定編碼格式
每個(gè)文件都是有編碼格式的,常用的編碼格式有utf-8和gbk等。有的時(shí)候兩個(gè)文件看起來一樣,它們的文件名一樣,格式也一樣,但如果它們的編碼格式不一樣,也是不一樣的文件,比如當(dāng)你把一個(gè)Excel文件另存為保存時(shí)會(huì)出現(xiàn)兩個(gè)選項(xiàng),雖然都是.csv文件,但是這兩種格式代表兩種不同的文件
Python用得比較多的兩種編碼格式是UTF-8和gbk,默認(rèn)編碼格式是UTF-8。我們要根據(jù)導(dǎo)入文件本身的編碼格式進(jìn)行設(shè)置,通過設(shè)置參數(shù)encoding來設(shè)置導(dǎo)入的編碼格式。
如果我們不指定encoding參數(shù), 默認(rèn)是使用utf-8編碼格式。
import pandas as pd
df = pd.read_csv(r'G:\test.csv', sep=',', nrows=3, encoding='utf-8')
print(df)
如果是CSV(逗號(hào)分隔) (*.csv)格式的文件,那么在導(dǎo)入的時(shí)候就需要把編碼格式更改為gbk,如果使用UTF-8就會(huì)報(bào)錯(cuò)。
5. 列標(biāo)題與數(shù)據(jù)對(duì)齊
因?yàn)槲覀兊谋砀裰杏兄形模形恼加玫淖址陀⑽摹?shù)字占用的字符不一樣,因此需要調(diào)用pd.set_option()使表格對(duì)齊顯示。如果你是使用 Jupyter 來運(yùn)行代碼的,Jupyter 會(huì)自動(dòng)渲染出一個(gè)表格,則無需這個(gè)設(shè)置。
import pandas as pd
#處理數(shù)據(jù)的列標(biāo)題與數(shù)據(jù)無法對(duì)齊的情況
pd.set_option('display.unicode.ambiguous_as_wide', True)
#無法對(duì)齊主要是因?yàn)榱袠?biāo)題是中文
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_csv(r'G:\test.csv', sep=',', nrows=3, encoding='utf-8')
print(df)
對(duì)齊后的效果:
原文鏈接:https://blog.csdn.net/hubing_hust/article/details/128410816
相關(guān)推薦
- 2023-10-15 自定義帶下箭頭彈出框
- 2022-11-23 Python?property裝飾器使用案例介紹_python
- 2022-05-03 詳解利用python-highcharts庫繪制交互式可視化圖表_python
- 2022-03-17 sqlsever2019文件創(chuàng)建與變量示例_數(shù)據(jù)庫其它
- 2023-02-26 詳解pandas中Series()和DataFrame()的區(qū)別與聯(lián)系_python
- 2023-05-16 Android?ActivityManagerService啟動(dòng)流程詳解_Android
- 2023-01-26 Redis中的慢日志_Redis
- 2022-03-21 SQL?查詢連續(xù)登錄的用戶情況_MsSql
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細(xì)win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運(yùn)行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲(chǔ)小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運(yùn)算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認(rèn)證信息的處理
- Spring Security之認(rèn)證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯(cuò)誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實(shí)現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡(jiǎn)單動(dòng)態(tài)字符串(SD
- arthas操作spring被代理目標(biāo)對(duì)象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊(duì)列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠(yuǎn)程分支