日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網(wǎng)站首頁 編程語言 正文

Python?pandas之多級索引取值詳解_python

作者:宿者朽命 ? 更新時間: 2022-03-28 編程語言

最近發(fā)現(xiàn)周圍的很多小伙伴們都不太樂意使用pandas,轉而投向其他的數(shù)據(jù)操作庫,身為一個數(shù)據(jù)工作者,基本上是張口pandas,閉口pandas了,故而寫下此系列以讓更多的小伙伴們愛上pandas。

平臺:

windows 10

python 3.8

pandas 1.2.4

數(shù)據(jù)需求

給定一份多級索引數(shù)據(jù),查找指定值。

pic1

需求拆解

數(shù)據(jù)提取在pandas中,或者說在python中就是索引式提取,在單層索引中采用.loc.iloc方法已經(jīng)非常常見了,然而在索引層次多了之后卻有點不知所措,也只需要將各個索引看成整體進行提取就行。

需求處理

方法一

這里先給出一個比較笨拙的方法,先將索引進行重置為列數(shù)據(jù),通過列取得bool條件再進行提取

datac.reset_index(inplace=True)
datac[(datac['School'] == 'S_2') & (datac['Class'] == 'C_3')]

pic2

可以看到通過該類方法可以成功取到對應值

當然也可以采用.query方法進行條件篩選

datac.reset_index(inplace=True)
datac.query("School == 'S_1' and Class == 'C_3'")

pic3

方法二

既然為多級索引,pandas也會有對應的取值方式,既可以用鏈式調用的方式,也可以通過元組進行提取,首先看看多級索引的輸出值:

pic4

是一個MultiIndex類型數(shù)據(jù),其元素都是元組,即也能通過元組的方式進行索引調取

這兩種都一個共同的特點,從左到右,要先外層再內(nèi)層,否則會報KeyError錯誤

# 鏈式調用
datac.loc['S_1'].loc['C_1']

pic5

# 元組作為索引調用
datac.loc[('S_3', 'C_1'), :]

pic6

tips:

1.多層索引,即列名上方有層次結構也可以按這種方式進行提取。

2.想越過外層索引提取內(nèi)層索引需要交換索引順序才能順利提取。

# swaplevel 交換索引層級
datac.swaplevel(axis=0).loc[('C_1')]  # axis=0: index

pic7

總結

功夫再高,也怕菜刀。本例使用方法比較常規(guī),旨在鞏固基礎知識,當下次遇到能夠想起可以直接索引取值而不用將索引重置為列值,以高效完成數(shù)據(jù)提取任務。

原文鏈接:https://blog.csdn.net/weixin_46281427/article/details/122485166

欄目分類
最近更新