日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學(xué)無先后,達(dá)者為師

網(wǎng)站首頁 編程語言 正文

python用pd.read_csv()方法來讀取csv文件的實現(xiàn)_python

作者:梧桐雪 ? 更新時間: 2022-08-06 編程語言

csv文件是一種用,和換行符區(qū)分?jǐn)?shù)據(jù)記錄和字段的一種文件結(jié)構(gòu),可以用excel表格編輯,也可以用記事本編輯,是一種類excel的數(shù)據(jù)存儲文件,也可以看成是一種數(shù)據(jù)庫。pandas提供了pd.read_csv()方法可以讀取其中的數(shù)據(jù)并且轉(zhuǎn)換成DataFrame數(shù)據(jù)幀。python的強大之處就在于他可以把不同的數(shù)據(jù)庫類型,比如txt/csv/.xls/.sql轉(zhuǎn)換成統(tǒng)一的DataFrame格式然后進(jìn)行統(tǒng)一的處理。真是做到了標(biāo)準(zhǔn)化。我們可以用以下代碼來演示csv文件的讀取操作。

import pandas as pd
data1 = pd.read_csv('rating.csv')
print(data1)
print("************取消第一行作為表頭*************")
data2 = pd.read_csv('rating.csv',header=None)
print(data2)
print("************為各個字段取名**************")
data3 = pd.read_csv('rating.csv',names=['user_id','book_id','rating'])
print(data3)
print("***********將某一字段設(shè)為索引***************")
data3 = pd.read_csv('rating.csv',
    names=['user_id','book_id','rating'],
    index_col = "user_id")
print(data3)
print("************用sep參數(shù)設(shè)置分隔符**************")
data4 = pd.read_csv('rating.csv',
    names=['user_id','book_id','rating'],
    sep=',')
print(data4)
print("************自動補全缺失數(shù)據(jù)為NaN**************")
data5 = pd.read_csv('data.csv',header=None)
print(data5)

輸出的結(jié)果如下:

? ?1 ? 258 ?5
0 ?2 ?4081 ?4
1 ?2 ? 260 ?5
2 ?2 ?9296 ?5
3 ?2 ?2318 ?3
4 ?2 ? ?26 ?4
5 ?2 ? 315 ?3
6 ?2 ? ?33 ?4
7 ?2 ? 301 ?5
************取消第一行作為表頭*************
? ?0 ? ? 1 ?2
0 ?1 ? 258 ?5
1 ?2 ?4081 ?4
2 ?2 ? 260 ?5
3 ?2 ?9296 ?5
4 ?2 ?2318 ?3
5 ?2 ? ?26 ?4
6 ?2 ? 315 ?3
7 ?2 ? ?33 ?4
8 ?2 ? 301 ?5
************為各個字段取名**************
? ?user_id ?book_id ?rating
0 ? ? ? ?1 ? ? ?258 ? ? ? 5
1 ? ? ? ?2 ? ? 4081 ? ? ? 4
2 ? ? ? ?2 ? ? ?260 ? ? ? 5
3 ? ? ? ?2 ? ? 9296 ? ? ? 5
4 ? ? ? ?2 ? ? 2318 ? ? ? 3
5 ? ? ? ?2 ? ? ? 26 ? ? ? 4
6 ? ? ? ?2 ? ? ?315 ? ? ? 3
7 ? ? ? ?2 ? ? ? 33 ? ? ? 4
8 ? ? ? ?2 ? ? ?301 ? ? ? 5
***********將某一字段設(shè)為索引***************
? ? ? ? ?book_id ?rating
user_id ? ? ? ? ? ? ? ??
1 ? ? ? ? ? ?258 ? ? ? 5
2 ? ? ? ? ? 4081 ? ? ? 4
2 ? ? ? ? ? ?260 ? ? ? 5
2 ? ? ? ? ? 9296 ? ? ? 5
2 ? ? ? ? ? 2318 ? ? ? 3
2 ? ? ? ? ? ? 26 ? ? ? 4
2 ? ? ? ? ? ?315 ? ? ? 3
2 ? ? ? ? ? ? 33 ? ? ? 4
2 ? ? ? ? ? ?301 ? ? ? 5
************用sep參數(shù)設(shè)置分隔符**************
? ?user_id ?book_id ?rating
0 ? ? ? ?1 ? ? ?258 ? ? ? 5
1 ? ? ? ?2 ? ? 4081 ? ? ? 4
2 ? ? ? ?2 ? ? ?260 ? ? ? 5
3 ? ? ? ?2 ? ? 9296 ? ? ? 5
4 ? ? ? ?2 ? ? 2318 ? ? ? 3
5 ? ? ? ?2 ? ? ? 26 ? ? ? 4
6 ? ? ? ?2 ? ? ?315 ? ? ? 3
7 ? ? ? ?2 ? ? ? 33 ? ? ? 4
8 ? ? ? ?2 ? ? ?301 ? ? ? 5
************自動補全缺失數(shù)據(jù)為NaN**************
? ? 0 ? ?1 ? 2 ? ? 3 ? 4
0 ? 1 ?2.0 ? 3 ? 4.0 ? 5
1 ? 6 ?7.0 ? 8 ? NaN ?10
2 ?11 ?NaN ?13 ?14.0 ?15
[Finished in 4.5s]

對代碼的具體解釋,可以參考星號隔離bar中的注釋。

原文鏈接:https://blog.csdn.net/weixin_41855010/article/details/104287348

欄目分類
最近更新