日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

Pandas多個條件(AND,OR,NOT)中提取行_python

作者:餃子大人 ? 更新時間: 2023-05-31 編程語言

使用Pandas從多個條件(AND,OR,NOT)中提取行的方法。

有以下2點需要注意:

  • &,|,?的使用(and、or、not的錯誤)
  • 使用比較運算符時,請將每個條件括在括號中。

以下數據為例。

import pandas as pd

df = pd.read_csv('./data/09/sample_pandas_normal.csv')
print(df)
# ? ? ? name ?age state ?point
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 3 ? ? Dave ? 68 ? ?TX ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 5 ? ?Frank ? 30 ? ?NY ? ? 57

本例是使用pandas.DataFrame,但pandas.Series也同樣適用。

如何提取(選擇)行

首先,展示如何從pandas.DataFrame中提取(選擇)行以獲得新的pandas.DataFrame。

使用布爾列表(數組)或pandas.Series,只能提取(選擇)True行。

mask = [True, False, True, False, True, False]
df_mask = df[mask]
print(df_mask)
#       name  age state  point
# 0    Alice   24    NY     64
# 2  Charlie   18    CA     70
# 4    Ellen   24    CA     88

通過AND,OR,NOT多個條件提取(選擇)行的代碼-示例

具有兩個條件值的pandas.Series,可以使用&獲得如下結果。在這里,為了便于說明,將==和?用作二個條件,但是僅使用!=也是可以。

print(df['age'] < 35)
# 0 ? ? True
# 1 ? ?False
# 2 ? ? True
# 3 ? ?False
# 4 ? ? True
# 5 ? ? True
# Name: age, dtype: bool

print(~(df['state'] == 'NY'))
# 0 ? ?False
# 1 ? ? True
# 2 ? ? True
# 3 ? ? True
# 4 ? ? True
# 5 ? ?False
# Name: state, dtype: bool

print((df['age'] < 35) & ~(df['state'] == 'NY'))
# 0 ? ?False
# 1 ? ?False
# 2 ? ? True
# 3 ? ?False
# 4 ? ? True
# 5 ? ?False
# dtype: bool

僅提取(選擇)True行。

df_and = df[(df['age'] < 35) & ~(df['state'] == 'NY')]
print(df_and)
#       name  age state  point
# 2  Charlie   18    CA     70
# 4    Ellen   24    CA     88

對于OR也是如此。使用|。

print((df['age'] < 20) | (df['point'] > 90))
# 0 ? ?False
# 1 ? ? True
# 2 ? ? True
# 3 ? ?False
# 4 ? ?False
# 5 ? ?False
# dtype: bool

df_or = df[(df['age'] < 20) | (df['point'] > 90)]
print(df_or)
# ? ? ? name ?age state ?point
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 2 ?Charlie ? 18 ? ?CA ? ? 70

3個以上條件的運算符的優先級

運算符的優先級是NOT(?),AND(&),OR(|)。因此,結果因順序而異。

df_multi_1 = df[(df['age'] < 35) | ~(df['state'] == 'NY') & (df['point'] < 75)]
print(df_multi_1)
# ? ? ? name ?age state ?point
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 3 ? ? Dave ? 68 ? ?TX ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 5 ? ?Frank ? 30 ? ?NY ? ? 57

df_multi_2 = df[(df['age'] < 35) & (df['point'] < 75) | ~(df['state'] == 'NY')]
print(df_multi_2)
# ? ? ? name ?age state ?point
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 3 ? ? Dave ? 68 ? ?TX ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 5 ? ?Frank ? 30 ? ?NY ? ? 57

將每個組括在括號中比較安全。

df_multi_3 = df[((df['age'] < 35) | ~(df['state'] == 'NY')) & (df['point'] < 75)]
print(df_multi_3)
#       name  age state  point
# 0    Alice   24    NY     64
# 2  Charlie   18    CA     70
# 3     Dave   68    TX     70
# 5    Frank   30    NY     57

原文鏈接:https://blog.csdn.net/qq_18351157/article/details/105403779

  • 上一篇:沒有了
  • 下一篇:沒有了
欄目分類
最近更新