網站首頁編程語言正文

pandas?loc?iloc?ix用法詳細分析_python

作者：bitcarmanlee ? 更新時間： 2023-02-25 編程語言

1.什么是label

pandas處理數據時，我們會經常看到dataframe結構使用loc, iloc, ix等方法。那么這些方法到底有啥區別，下面我們來進行詳細分析。

首先我們先明確一點，這幾個方法都可以用來過濾dataframe的行列。他們的不同，主要還是使用方式的不同。

在分析之前，我們先來明確一下標簽label的概念。為了方便看得更清楚，先構造一個數據集

import pandas as pd

def test_loc():
    name = ['n1', 'n2', 'n3', 'n4', 'n5', 'n6']
    age = [1, 2, 3, 4, 5, 6]
    country = ['Chi', 'Chi', 'Ame', 'Ame', 'Jp', 'Koe']
    city = ['bj', 'sh', 'ny', 'ny', 'tok', 'se']
    data = pd.DataFrame({'name': name, 'age': age, 'country': country, 'city': city})

    # label
    print(data)

  name  age country city
0   n1    1     Chi   bj
1   n2    2     Chi   sh
2   n3    3     Ame   ny
3   n4    4     Ame   ny
4   n5    5      Jp  tok
5   n6    6     Koe   se

上面的data，0,1,2,3,4,5為索引，就是我們的行標簽。name ,age,country,city為列名，則是我們的列標簽。

2.loc用法

我們先直接上結論：loc可以基于行列標簽對數據進行篩選。

下面通過實驗來說明。

def test_loc():
    name = ['n1', 'n2', 'n3', 'n4', 'n5', 'n6']
    age = [1, 2, 3, 4, 5, 6]
    country = ['Chi', 'Chi', 'Ame', 'Ame', 'Jp', 'Koe']
    city = ['bj', 'sh', 'ny', 'ny', 'tok', 'se']
    data = pd.DataFrame({'name': name, 'age': age, 'country': country, 'city': city})
    # 取前幾行
    print(data.loc[[0, 1, 2]])
    print()
    print(data.loc[0:2])
    print()

    # 取某幾列
    print(data.loc[:, ['name', 'age', 'city']])
    print()

    # 取幾行幾列
    print(data.loc[0:2,['name', 'age', 'city']])
    print()

2.1 選擇行

loc的整體語法為loc[rows, columns]。逗號前面部分為選擇的行，后面部分為選擇的列，":"表示全選。

loc[0:2]與loc[[0, 1, 2]]的效果一致，都是表示選取前3行，可以認為此時是通過行標簽選擇數據。

2.2 選擇列

實際操作中，最常見的需求就是選擇某幾列而不是所有數據。loc[:, [‘name’, ‘age’, ‘city’]]就是選擇散列，逗號前面的:表示選擇所有行。

2.3 選擇指定的行列

data.loc[0:2,[‘name’, ‘age’, ‘city’]]這種用法，意思就是選擇前三行的name,age,city這三列。

2.4 loc小結

1.就像我們一開始提到的，loc是基于數據行列標簽對數據進行篩選。
2.針對行標簽選擇時，如果index是默認的整數序列，選擇的時候包括了末端的一行。
3.":"表示選擇所有行或者所有列。

3.iloc用法

直接上結論：iloc與loc的不同在于，loc基于數據標簽進行篩選，而iloc基于位置進行數據篩選，i可以認為是integer，即在loc的基礎上，用integer整數當作"索引"

看個例子

def test_iloc():
    name = ['n1', 'n2', 'n3', 'n4', 'n5', 'n6']
    age = [1, 2, 3, 4, 5, 6]
    country = ['Chi', 'Chi', 'Ame', 'Ame', 'Jp', 'Koe']
    city = ['bj', 'sh', 'ny', 'ny', 'tok', 'se']
    data = pd.DataFrame({'name': name, 'age': age, 'country': country, 'city': city})

    # iloc的索引，不包含最后一個
    print(data.iloc[0:2])
    print()

    #
    print(data.iloc[:, 0:2])
    print()
    print(data.iloc[:,[0, 1, 3]])
    print()

    # print(data.iloc[:, ['name', 'city']])
    # IndexError: .iloc requires numeric indexers, got ['name' 'city']

最后輸出為：

? name ?age country city
0 ? n1 ? ?1 ? ? Chi ? bj
1 ? n2 ? ?2 ? ? Chi ? sh

? name ?age
0 ? n1 ? ?1
1 ? n2 ? ?2
2 ? n3 ? ?3
3 ? n4 ? ?4
4 ? n5 ? ?5
5 ? n6 ? ?6

? name ?age city
0 ? n1 ? ?1 ? bj
1 ? n2 ? ?2 ? sh
2 ? n3 ? ?3 ? ny
3 ? n4 ? ?4 ? ny
4 ? n5 ? ?5 ?tok
5 ? n6 ? ?6 ? se

iloc[0:2]，表示選擇前兩行。注意在iloc中，末端那行不包括。因為起始索引是0，所以iloc[0:2]選擇的是第0行與第1行。

data.iloc[:, 0:2]表示選擇前兩列，data.iloc[:,[0, 1, 3]]表示選擇第0,1,3列。

如果我們嘗試用列名篩選數據，data.iloc[:, [‘name’, ‘city’]]
代碼會報錯

IndexError: .iloc requires numeric indexers, got ['name' 'city']

上面的錯誤信息就很明確的告訴了我們，iloc方法需要numeric indexers。

4.ix

最后一個ix，是歷史版本的用法。ix的作用，現在用loc,iloc基本都能實現，所以ix也基本上被loc,iloc所代替，現在官方不再推薦使用。

原文鏈接：https://blog.csdn.net/bitcarmanlee/article/details/128611846

上一篇：Golang嵌入資源文件實現步驟詳解_Golang
下一篇：C++中vector迭代器失效與深淺拷貝問題詳析_C 語言

日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

網站首頁編程語言正文

pandas?loc?iloc?ix用法詳細分析_python

目錄

1.什么是label

2.loc用法

2.1 選擇行

2.2 選擇列

2.3 選擇指定的行列

2.4 loc小結

3.iloc用法

4.ix

相關推薦

日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

網站首頁 編程語言 正文

pandas?loc?iloc?ix用法詳細分析_python

目錄

1.什么是label

2.loc用法

2.1 選擇行

2.2 選擇列

2.3 選擇指定的行列

2.4 loc小結

3.iloc用法

4.ix

相關推薦

網站首頁編程語言正文