網站首頁 編程語言 正文
前言:
Python 是一種用于進行數據分析的出色語言,主要是因為以數據為中心的 Python 包的奇妙生態系統。Pandas 就是其中之一,它使導入和分析數據變得更加容易。
大多數用于分析的數據以表格格式的形式提供,例如 Excel 和逗號分隔文件 (CSV)。要訪問 csv 文件中的數據,我們需要一個函數 read_csv() 以數據框的形式檢索數據。在使用這個功能之前,我們必須導入 pandas 庫。
導入 Pandas 庫:?
import pandas as pd
read_csv() 函數用于從 csv 文件中檢索數據。read_csv() 方法的語法是:
pd.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None,
usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True,
dtype=None, engine=None, converters=None, true_values=None, false_values=None,
skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True,
na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False,
keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer',
thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None,
encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0,
doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)?
代碼 #1?從 csv 文件中檢索數據
# Import pandas
import pandas as pd
# 讀取csv文件
pd.read_csv("filename.csv")
這是帶有默認值的參數列表。并非所有這些都很重要,但記住這些實際上可以節省自己執行某些功能的時間。通過在 jupyter notebook 中按 shift + tab 可以查看任何函數的參數。
下面給出了有用的和它們的用法:
- filepath_or_buffer:這是要使用此函數檢索的文件的位置。它接受文件的任何字符串路徑或 URL。
- sep:表示分隔符,默認為 ', ',如 csv(逗號分隔值)。
- header:它接受 int、int 列表、行號用作列名和數據的開頭。如果沒有傳遞名稱,即header=None,那么它將顯示第一列為0,第二列顯示為1,以此類推。
- usecols:用于僅從 csv 文件中檢索選定的列。
- nrows:表示要從數據集中顯示的行數。
- index_col:如果沒有,則沒有索引號與記錄一起顯示。 ?
- 擠壓:如果為真且僅傳遞一列,則返回熊貓系列。
- skiprows:跳過新數據框中傳遞的行。
- 名稱:它允許檢索具有新名稱的列。
范圍 | Use |
---|---|
filepath_or_buffer | 文件的 URL 或目錄位置 |
sep | 代表分隔符,默認為 ', ' 如 csv(逗號分隔值) |
index_col | 將傳遞的列作為索引而不是 0、1、2、3…r? ?![]() |
header | 將傳遞的 row/s[int/int list] 作為標題 ?![]() |
use_cols | 僅使用傳遞的 col[string list] 來制作數據框 |
squeeze | 如果為 true 且僅傳遞一列,則返回 pandas 系列 |
skiprows | 跳過新數據框中傳遞的行 |
Code #2 :
# 導入 Pandas 庫
import pandas as pd
pd.read_csv(filepath_or_buffer = "pokemon.csv")
# 使傳遞的行標題
pd.read_csv("pokemon.csv", header =[1, 2])
# 將傳遞的列作為索引而不是 0、1、2、3....
pd.read_csv("pokemon.csv", index_col ='Type')
# 僅將傳遞的 cols 用于數據框
pd.read_csv("pokemon.csv", usecols =["Type"])
# 如果只有一列,則返回熊貓系列
pd.read_csv("pokemon.csv", usecols =["Type"], squeeze = True)
# 跳過新系列中傳遞的行
pd.read_csv("pokemon.csv", skiprows = [1, 2, 3, 4])
原文鏈接:https://juejin.cn/post/7139862125597425677
相關推薦
- 2022-12-09 c++結合opencv如何實現讀取多張圖片并顯示_C 語言
- 2022-12-21 Android?全局通知彈窗示例分析詳解_Android
- 2022-04-23 創建uniapp空項目并引入uViewUI
- 2023-08-15 :prop父組件給子組件傳遞函數 子組件接收 并default子組件自己的方法 問題
- 2022-11-16 生產redisson延時隊列不消費問題排查解決_Redis
- 2022-04-14 如何解決:git push error: failed to push some refs to
- 2022-09-25 如何查看Redis的host和port
- 2024-03-06 SpringAOP基于注解方式實現和細節
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支