網站首頁 編程語言 正文
csv文件是一種用,和換行符區分數據記錄和字段的一種文件結構,可以用excel表格編輯,也可以用記事本編輯,是一種類excel的數據存儲文件,也可以看成是一種數據庫。pandas提供了pd.read_csv()方法可以讀取其中的數據并且轉換成DataFrame數據幀。python的強大之處就在于他可以把不同的數據庫類型,比如txt/csv/.xls/.sql轉換成統一的DataFrame格式然后進行統一的處理。真是做到了標準化。我們可以用以下代碼來演示csv文件的讀取操作。
import pandas as pd
data1 = pd.read_csv('rating.csv')
print(data1)
print("************取消第一行作為表頭*************")
data2 = pd.read_csv('rating.csv',header=None)
print(data2)
print("************為各個字段取名**************")
data3 = pd.read_csv('rating.csv',names=['user_id','book_id','rating'])
print(data3)
print("***********將某一字段設為索引***************")
data3 = pd.read_csv('rating.csv',
names=['user_id','book_id','rating'],
index_col = "user_id")
print(data3)
print("************用sep參數設置分隔符**************")
data4 = pd.read_csv('rating.csv',
names=['user_id','book_id','rating'],
sep=',')
print(data4)
print("************自動補全缺失數據為NaN**************")
data5 = pd.read_csv('data.csv',header=None)
print(data5)
輸出的結果如下:
? ?1 ? 258 ?5
0 ?2 ?4081 ?4
1 ?2 ? 260 ?5
2 ?2 ?9296 ?5
3 ?2 ?2318 ?3
4 ?2 ? ?26 ?4
5 ?2 ? 315 ?3
6 ?2 ? ?33 ?4
7 ?2 ? 301 ?5
************取消第一行作為表頭*************
? ?0 ? ? 1 ?2
0 ?1 ? 258 ?5
1 ?2 ?4081 ?4
2 ?2 ? 260 ?5
3 ?2 ?9296 ?5
4 ?2 ?2318 ?3
5 ?2 ? ?26 ?4
6 ?2 ? 315 ?3
7 ?2 ? ?33 ?4
8 ?2 ? 301 ?5
************為各個字段取名**************
? ?user_id ?book_id ?rating
0 ? ? ? ?1 ? ? ?258 ? ? ? 5
1 ? ? ? ?2 ? ? 4081 ? ? ? 4
2 ? ? ? ?2 ? ? ?260 ? ? ? 5
3 ? ? ? ?2 ? ? 9296 ? ? ? 5
4 ? ? ? ?2 ? ? 2318 ? ? ? 3
5 ? ? ? ?2 ? ? ? 26 ? ? ? 4
6 ? ? ? ?2 ? ? ?315 ? ? ? 3
7 ? ? ? ?2 ? ? ? 33 ? ? ? 4
8 ? ? ? ?2 ? ? ?301 ? ? ? 5
***********將某一字段設為索引***************
? ? ? ? ?book_id ?rating
user_id ? ? ? ? ? ? ? ??
1 ? ? ? ? ? ?258 ? ? ? 5
2 ? ? ? ? ? 4081 ? ? ? 4
2 ? ? ? ? ? ?260 ? ? ? 5
2 ? ? ? ? ? 9296 ? ? ? 5
2 ? ? ? ? ? 2318 ? ? ? 3
2 ? ? ? ? ? ? 26 ? ? ? 4
2 ? ? ? ? ? ?315 ? ? ? 3
2 ? ? ? ? ? ? 33 ? ? ? 4
2 ? ? ? ? ? ?301 ? ? ? 5
************用sep參數設置分隔符**************
? ?user_id ?book_id ?rating
0 ? ? ? ?1 ? ? ?258 ? ? ? 5
1 ? ? ? ?2 ? ? 4081 ? ? ? 4
2 ? ? ? ?2 ? ? ?260 ? ? ? 5
3 ? ? ? ?2 ? ? 9296 ? ? ? 5
4 ? ? ? ?2 ? ? 2318 ? ? ? 3
5 ? ? ? ?2 ? ? ? 26 ? ? ? 4
6 ? ? ? ?2 ? ? ?315 ? ? ? 3
7 ? ? ? ?2 ? ? ? 33 ? ? ? 4
8 ? ? ? ?2 ? ? ?301 ? ? ? 5
************自動補全缺失數據為NaN**************
? ? 0 ? ?1 ? 2 ? ? 3 ? 4
0 ? 1 ?2.0 ? 3 ? 4.0 ? 5
1 ? 6 ?7.0 ? 8 ? NaN ?10
2 ?11 ?NaN ?13 ?14.0 ?15
[Finished in 4.5s]
對代碼的具體解釋,可以參考星號隔離bar中的注釋。
原文鏈接:https://blog.csdn.net/weixin_41855010/article/details/104287348
相關推薦
- 2022-12-07 C++AVL樹4種旋轉詳講(左單旋、右單旋、左右雙旋、右左雙旋)_C 語言
- 2022-12-10 jquery異常問題Uncaught?TypeError:?$(...).on?is?not?a?f
- 2022-04-01 K8s產生ERROR的解決方法
- 2022-06-02 python?面向對象開發及基本特征_python
- 2022-07-14 利用Matlab實現圖像亮度分布統計圖_C 語言
- 2022-03-15 使用swagger-bootstrap-ui ,訪問的時候 404
- 2022-08-03 C++編程語言中賦值運算符重載函數(operator=)的使用_C 語言
- 2023-01-26 Redis慢查詢日志與監視器問題_Redis
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支