日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

Python??Pandas教程之使用?pandas.read_csv()?讀取?csv_python

作者:海擁 ? 更新時間: 2022-11-08 編程語言

前言:

Python 是一種用于進行數據分析的出色語言,主要是因為以數據為中心的 Python 包的奇妙生態系統。Pandas 就是其中之一,它使導入和分析數據變得更加容易。

大多數用于分析的數據以表格格式的形式提供,例如 Excel 和逗號分隔文件 (CSV)。要訪問 csv 文件中的數據,我們需要一個函數 read_csv() 以數據框的形式檢索數據。在使用這個功能之前,我們必須導入 pandas 庫。

導入 Pandas 庫:?

import pandas as pd

read_csv() 函數用于從 csv 文件中檢索數據。read_csv() 方法的語法是:

pd.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, 
             usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, 
             dtype=None, engine=None, converters=None, true_values=None, false_values=None, 
             skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, 
             na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, 
             keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', 
             thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, 
             encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, 
             doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)?

代碼 #1?從 csv 文件中檢索數據

# Import pandas
import pandas as pd

# 讀取csv文件
pd.read_csv("filename.csv")

這是帶有默認值的參數列表。并非所有這些都很重要,但記住這些實際上可以節省自己執行某些功能的時間。通過在 jupyter notebook 中按 shift + tab 可以查看任何函數的參數。

下面給出了有用的和它們的用法:

  • filepath_or_buffer:這是要使用此函數檢索的文件的位置。它接受文件的任何字符串路徑或 URL。
  • sep:表示分隔符,默認為 ', ',如 csv(逗號分隔值)。
  • header:它接受 int、int 列表、行號用作列名和數據的開頭。如果沒有傳遞名稱,即header=None,那么它將顯示第一列為0,第二列顯示為1,以此類推。
  • usecols:用于僅從 csv 文件中檢索選定的列。
  • nrows:表示要從數據集中顯示的行數。
  • index_col:如果沒有,則沒有索引號與記錄一起顯示。 ?
  • 擠壓:如果為真且僅傳遞一列,則返回熊貓系列。
  • skiprows:跳過新數據框中傳遞的行。
  • 名稱:它允許檢索具有新名稱的列。
范圍 Use
filepath_or_buffer 文件的 URL 或目錄位置
sep 代表分隔符,默認為 ', ' 如 csv(逗號分隔值)
index_col 將傳遞的列作為索引而不是 0、1、2、3…r? ??
header 將傳遞的 row/s[int/int list] 作為標題 ??
use_cols 僅使用傳遞的 col[string list] 來制作數據框
squeeze 如果為 true 且僅傳遞一列,則返回 pandas 系列
skiprows 跳過新數據框中傳遞的行

Code #2 :

# 導入 Pandas 庫
import pandas as pd

pd.read_csv(filepath_or_buffer = "pokemon.csv")

# 使傳遞的行標題
pd.read_csv("pokemon.csv", header =[1, 2])

# 將傳遞的列作為索引而不是 0、1、2、3....
pd.read_csv("pokemon.csv", index_col ='Type')

# 僅將傳遞的 cols 用于數據框
pd.read_csv("pokemon.csv", usecols =["Type"])

# 如果只有一列,則返回熊貓系列
pd.read_csv("pokemon.csv", usecols =["Type"], squeeze = True)
							
# 跳過新系列中傳遞的行
pd.read_csv("pokemon.csv", skiprows = [1, 2, 3, 4])

原文鏈接:https://juejin.cn/post/7139862125597425677

欄目分類
最近更新