網站首頁 編程語言 正文
pandas.DataFrame中的現有列分配給索引index(行名,行標簽)。為索引指定唯一的名稱很方便,因為使用loc,at選擇(提?。┰貢r很容易理解。
將描述以下內容。
set_index()的使用方法
- 基本用法
- 將指定的列保留為數據:參數drop
- 分配多索引
- 將索引更改為另一列(重置)
- 更改原始對象:參數inplace
讀取csv文件等時指定索引
使用索引(行名)提?。ㄟx擇)行和元素
了解如何更改索引的一部分或將整個列表替換為列表等,而不是將現有列分配給索引。
請參考以下文章,
Pandas.DataFrame的行名和列名的修改
以下面的數據為例。
import pandas as pd
df = pd.read_csv('./data/22/sample_pandas_normal.csv')
print(df)
# ? ? ? name ?age state ?point
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 3 ? ? Dave ? 68 ? ?TX ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 5 ? ?Frank ? 30 ? ?NY ? ? 57
set_index()的使用方法
基本用法
在第一個參數鍵中指定用作索引的列的列名(列標簽)。指定的列設置為索引。
df_i = df.set_index('name')
print(df_i)
# age state point
# name
# Alice 24 NY 64
# Bob 42 CA 92
# Charlie 18 CA 70
# Dave 68 TX 70
# Ellen 24 CA 88
# Frank 30 NY 57
將指定的列保留為數據:參數drop
默認情況下,如上例所示,從數據列中刪除指定的列。如果參數drop = False,則指定的列將設置為index,并且也將保留在data列中。
df_id = df.set_index('name', drop=False)
print(df_id)
# name age state point
# name
# Alice Alice 24 NY 64
# Bob Bob 42 CA 92
# Charlie Charlie 18 CA 70
# Dave Dave 68 TX 70
# Ellen Ellen 24 CA 88
# Frank Frank 30 NY 57
分配多索引
如果在第一個參數鍵中指定了列名列表(列標簽),則將多列分配為多索引。
df_mi = df.set_index(['state', 'name'])
print(df_mi)
# age point
# state name
# NY Alice 24 64
# CA Bob 42 92
# Charlie 18 70
# TX Dave 68 70
# CA Ellen 24 88
# NY Frank 30 57
使用sort_index()排序時,它可以整齊顯示。
df_mi.sort_index(inplace=True)
print(df_mi)
# age point
# state name
# CA Bob 42 92
# Charlie 18 70
# Ellen 24 88
# NY Alice 24 64
# Frank 30 57
# TX Dave 68 70
使用sort_values()對行進行排序以進行說明。有關排序的詳細信息,請參見以下文章。
pandas.DataFrame,Series排序(sort_values,sort_index)
默認情況下,如果在set_index()中指定一列,則原始索引將被刪除。
print(df_i)
# ? ? ? ? ?age state ?point
# name ? ? ? ? ? ? ? ? ? ??
# Alice ? ? 24 ? ?NY ? ? 64
# Bob ? ? ? 42 ? ?CA ? ? 92
# Charlie ? 18 ? ?CA ? ? 70
# Dave ? ? ?68 ? ?TX ? ? 70
# Ellen ? ? 24 ? ?CA ? ? 88
# Frank ? ? 30 ? ?NY ? ? 57
df_ii = df_i.set_index('state')
print(df_ii)
# ? ? ? ?age ?point
# state ? ? ? ? ? ?
# NY ? ? ?24 ? ? 64
# CA ? ? ?42 ? ? 92
# CA ? ? ?18 ? ? 70
# TX ? ? ?68 ? ? 70
# CA ? ? ?24 ? ? 88
# NY ? ? ?30 ? ? 57
如果將參數append設置為True,則除了原始索引之外,還將將指定的列添加為新的層次結構索引。
df_mi = df_i.set_index('state', append=True)
print(df_mi)
# age point
# name state
# Alice NY 24 64
# Bob CA 42 92
# Charlie CA 18 70
# Dave TX 68 70
# Ellen CA 24 88
# Frank NY 30 57
添加的列是最底層。使用swaplevel()切換圖層。
print(df_mi.swaplevel(0, 1))
# age point
# state name
# NY Alice 24 64
# CA Bob 42 92
# Charlie 18 70
# TX Dave 68 70
# CA Ellen 24 88
# NY Frank 30 57
將索引更改為另一列(重置)
與前面的示例一樣,如果使用set_index()指定列,則原始索引將被刪除。
如果要保留原始索引,請使用reset_index(),它會從0開始按順序對索引重新編號。
print(df_i)
# ? ? ? ? ?age state ?point
# name ? ? ? ? ? ? ? ? ? ??
# Alice ? ? 24 ? ?NY ? ? 64
# Bob ? ? ? 42 ? ?CA ? ? 92
# Charlie ? 18 ? ?CA ? ? 70
# Dave ? ? ?68 ? ?TX ? ? 70
# Ellen ? ? 24 ? ?CA ? ? 88
# Frank ? ? 30 ? ?NY ? ? 57
df_ri = df_i.reset_index()
print(df_ri)
# ? ? ? name ?age state ?point
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 3 ? ? Dave ? 68 ? ?TX ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 5 ? ?Frank ? 30 ? ?NY ? ? 57
如果要將索引更改(重置)到另一列,請在reset_index()之后使用set_index()。如果一次性全部編寫,將如下所示。
df_change = df_i.reset_index().set_index('state')
print(df_change)
# name age point
# state
# NY Alice 24 64
# CA Bob 42 92
# CA Charlie 18 70
# TX Dave 68 70
# CA Ellen 24 88
# NY Frank 30 57
請注意,為方便起見,在此示例中將具有重疊值的列設置為索引,但是如果索引值不重疊(每個值都是唯一的),則更容易選擇數據。
另請參見以下有關reset_index()的文章。
Pandas.DataFrame,重置Series的索引index(reset_index)
更改原始對象:參數inplace
默認情況下,set_index()不會更改原始對象并返回新對象,但是如果inplace參數為True,則原始對象將被更改。
df.set_index('name', inplace=True)
print(df)
# age state point
# name
# Alice 24 NY 64
# Bob 42 CA 92
# Charlie 18 CA 70
# Dave 68 TX 70
# Ellen 24 CA 88
# Frank 30 NY 57
讀取csv文件等時指定索引
從csv文件等中讀取并生成pandas.DataFrame或pandas.Series時,如果原始文件包含要用作索引的列,則可以在讀取時指定該列。
使用read_csv()讀取文件時,在參數index_col中指定一個列號,該列即成為索引。
df = pd.read_csv('./data/22/sample_pandas_normal.csv', index_col=0)
print(df)
# age state point
# name
# Alice 24 NY 64
# Bob 42 CA 92
# Charlie 18 CA 70
# Dave 68 TX 70
# Ellen 24 CA 88
# Frank 30 NY 57
有關讀取csv和tsv文件的詳細信息,請參見以下文章。
Pandas讀取csv/tsv文件(read_csv,read_table)
使用索引(行名)提?。ㄟx擇)行和元素
與前面的示例一樣,如果在索引(行名,行標簽)中指定唯一的字符串,則可以按名稱提?。ㄟx擇)行或元素。
print(df)
# ? ? ? ? ?age state ?point
# name ? ? ? ? ? ? ? ? ? ??
# Alice ? ? 24 ? ?NY ? ? 64
# Bob ? ? ? 42 ? ?CA ? ? 92
# Charlie ? 18 ? ?CA ? ? 70
# Dave ? ? ?68 ? ?TX ? ? 70
# Ellen ? ? 24 ? ?CA ? ? 88
# Frank ? ? 30 ? ?NY ? ? 57
print(df.loc['Bob'])
# age ? ? ?42
# state ? ?CA
# point ? ?92
# Name: Bob, dtype: object
print(df.at['Bob', 'age'])
# 42
有關loc和at的信息,請參見以下文章。
Pandas獲取和修改任意位置的值(at,iat,loc,iloc)
原文鏈接:https://blog.csdn.net/qq_18351157/article/details/106902858
- 上一篇:沒有了
- 下一篇:沒有了
相關推薦
- 2022-04-03 Flutter實現旋轉掃描效果_Android
- 2022-09-18 在while中使用cin>>a?為條件及注意事項說明_C 語言
- 2023-10-12 利用touch-action解決驗證碼滑塊滑動時,背景跟隨一起滑動的問題,以及詳解touch-act
- 2022-04-12 用python繪制極坐標雷達圖_python
- 2022-03-17 Redis快速部署為Docker容器的實現方法_docker
- 2022-07-07 C語言用Easyx繪制圍棋和象棋的棋盤_C 語言
- 2023-04-11 pandas中實現將相同ID的字符串進行合并_python
- 2022-03-14 Spring mvc解決跨域請求:Response to preflight request doe
- 欄目分類
-
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支