日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學(xué)無先后,達者為師

網(wǎng)站首頁 編程語言 正文

Pandas.DataFrame刪除指定行和列(drop)的實現(xiàn)_python

作者:餃子大人 ? 更新時間: 2023-05-31 編程語言

使用drop()方法刪除pandas.DataFrame的行和列。

在0.21.0版之前,請使用參數(shù)labels和axis指定行和列。從0.21.0開始,可以使用index或columns。

在此,將對以下內(nèi)容進行說明。

  • DataFrame指定的行刪除
    • 按行名指定(行標(biāo)簽)
    • 按行號指定
    • 未設(shè)置行名的注意事項
  • DataFrame指定的列刪除
    • 按列名指定(列標(biāo)簽)
    • 按列號指定
  • 多行多列的刪除

刪除缺失值NaN和刪除具有重復(fù)元素的行,請參考文章。

Pandas刪除,替換并提取其中的缺失值NaN(dropna,fillna,isnull)

以下數(shù)據(jù)用作示例代碼中的示例。

import pandas as pd

df = pd.read_csv('./data/12/sample_pandas_normal.csv', index_col=0)
print(df)
# ? ? ? ? ?age state ?point
# name
# Alice ? ? 24 ? ?NY ? ? 64
# Bob ? ? ? 42 ? ?CA ? ? 92
# Charlie ? 18 ? ?CA ? ? 70
# Dave ? ? ?68 ? ?TX ? ? 70
# Ellen ? ? 24 ? ?CA ? ? 88
# Frank ? ? 30 ? ?NY ? ? 57

DataFrame指定的行刪除

按行名指定(行標(biāo)簽)

它由第一個參數(shù)labels和第二個參數(shù)axis指定。行指定axis= 0。

print(df.drop('Charlie', axis=0))
#        age state  point
# name                   
# Alice   24    NY     64
# Bob     42    CA     92
# Dave    68    TX     70
# Ellen   24    CA     88
# Frank   30    NY     57

默認值為axis = 0,因此可以省略axis。

print(df.drop('Charlie'))
#        age state  point
# name                   
# Alice   24    NY     64
# Bob     42    CA     92
# Dave    68    TX     70
# Ellen   24    CA     88
# Frank   30    NY     57

從0.21.0或更高版本開始,它也可以由參數(shù)索引指定。

print(df.drop(index='Charlie'))
#        age state  point
# name                   
# Alice   24    NY     64
# Bob     42    CA     92
# Dave    68    TX     70
# Ellen   24    CA     88
# Frank   30    NY     57

如果要一次刪除多行,請在列表中指定。

print(df.drop(['Bob', 'Dave', 'Frank']))
# ? ? ? ? ?age state ?point
# name ? ? ? ? ? ? ? ? ? ??
# Alice ? ? 24 ? ?NY ? ? 64
# Charlie ? 18 ? ?CA ? ? 70
# Ellen ? ? 24 ? ?CA ? ? 88

print(df.drop(index=['Bob', 'Dave', 'Frank']))
# ? ? ? ? ?age state ?point
# name ? ? ? ? ? ? ? ? ? ??
# Alice ? ? 24 ? ?NY ? ? 64
# Charlie ? 18 ? ?CA ? ? 70
# Ellen ? ? 24 ? ?CA ? ? 88

默認情況下,原始DataFrame保持不變,并返回一個新的DataFrame。如果參數(shù)inplace設(shè)置為True,則將更改原始DataFrame。在這種情況下,不會返回任何新的DataFrame,并且返回值為None。

按行號指定

如果要按行號指定,請使用DataFrame的index屬性。

如果在index屬性的[]中指定行號,則可以獲得相應(yīng)的行名。可以在列表中指定多個行號。

print(df.index[[1, 3, 5]])
# Index(['Bob', 'Dave', 'Frank'], dtype='object', name='name')

在drop()第一個的參數(shù)中指定labels或index的名稱。

print(df.drop(df.index[[1, 3, 5]]))
# ? ? ? ? ?age state ?point
# name ? ? ? ? ? ? ? ? ? ??
# Alice ? ? 24 ? ?NY ? ? 64
# Charlie ? 18 ? ?CA ? ? 70
# Ellen ? ? 24 ? ?CA ? ? 88

print(df.drop(index=df.index[[1, 3, 5]]))
# ? ? ? ? ?age state ?point
# name ? ? ? ? ? ? ? ? ? ??
# Alice ? ? 24 ? ?NY ? ? 64
# Charlie ? 18 ? ?CA ? ? 70
# Ellen ? ? 24 ? ?CA ? ? 88

未設(shè)置行名的注意事項

如果未設(shè)置行名,則index默認為整數(shù)序號。當(dāng)使用數(shù)字值而不是這樣的字符串作為索引時要小心。

df_noindex = pd.read_csv('./data/12/sample_pandas_normal.csv')
print(df_noindex)
# ? ? ? name ?age state ?point
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 3 ? ? Dave ? 68 ? ?TX ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 5 ? ?Frank ? 30 ? ?NY ? ? 57

print(df_noindex.index)
# RangeIndex(start=0, stop=6, step=1)

如果是序列號,則無論原樣指定數(shù)字值還是使用index屬性,結(jié)果都將相同。

print(df_noindex.drop([1, 3, 5]))
# ? ? ? name ?age state ?point
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88

print(df_noindex.drop(df_noindex.index[[1, 3, 5]]))
# ? ? ? name ?age state ?point
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88

如果由于排序原因其不是序列號,結(jié)果將有所不同。當(dāng)直接指定數(shù)字值時,將刪除行標(biāo)簽為該數(shù)字值的行,而當(dāng)使用index屬性時,將刪除其行號為該數(shù)字值的行。

df_noindex_sort = df_noindex.sort_values('state')
print(df_noindex_sort)
# ? ? ? name ?age state ?point
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 5 ? ?Frank ? 30 ? ?NY ? ? 57
# 3 ? ? Dave ? 68 ? ?TX ? ? 70

print(df_noindex_sort.index)
# Int64Index([1, 2, 4, 0, 5, 3], dtype='int64')

print(df_noindex_sort.drop([1, 3, 5]))
# ? ? ? name ?age state ?point
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 0 ? ?Alice ? 24 ? ?NY ? ? 64

print(df_noindex_sort.drop(df_noindex_sort.index[[1, 3, 5]]))
# ? ? name ?age state ?point
# 1 ? ?Bob ? 42 ? ?CA ? ? 92
# 4 ?Ellen ? 24 ? ?CA ? ? 88
# 5 ?Frank ? 30 ? ?NY ? ? 57

DataFrame指定的列刪除

按列名指定(列標(biāo)簽)

它由第一個參數(shù)labels和第二個參數(shù)axis指定。列指定axis= 1。

print(df.drop('state', axis=1))
#          age  point
# name               
# Alice     24     64
# Bob       42     92
# Charlie   18     70
# Dave      68     70
# Ellen     24     88
# Frank     30     57

從0.21.0或更高版本開始,可以使用參數(shù)列指定它。

print(df.drop(columns='state'))
#          age  point
# name               
# Alice     24     64
# Bob       42     92
# Charlie   18     70
# Dave      68     70
# Ellen     24     88
# Frank     30     57

如果要一次刪除多個列,請在列表中指定。

print(df.drop(['state', 'point'], axis=1))
# ? ? ? ? ?age
# name ? ? ? ?
# Alice ? ? 24
# Bob ? ? ? 42
# Charlie ? 18
# Dave ? ? ?68
# Ellen ? ? 24
# Frank ? ? 30

print(df.drop(columns=['state', 'point']))
# ? ? ? ? ?age
# name ? ? ? ?
# Alice ? ? 24
# Bob ? ? ? 42
# Charlie ? 18
# Dave ? ? ?68
# Ellen ? ? 24
# Frank ? ? 30

參數(shù)inplace的使用方法與行的相同。

df_org = df.copy()
df_org.drop(columns=['state', 'point'], inplace=True)
print(df_org)
#          age
# name        
# Alice     24
# Bob       42
# Charlie   18
# Dave      68
# Ellen     24
# Frank     30

按列號指定

如果要按列號指定,請使用DataFrame的columns屬性。

print(df.columns[[1, 2]])
# Index(['state', 'point'], dtype='object')

print(df.drop(df.columns[[1, 2]], axis=1))
# ? ? ? ? ?age
# name ? ? ? ?
# Alice ? ? 24
# Bob ? ? ? 42
# Charlie ? 18
# Dave ? ? ?68
# Ellen ? ? 24
# Frank ? ? 30

print(df.drop(columns=df.columns[[1, 2]]))
# ? ? ? ? ?age
# name ? ? ? ?
# Alice ? ? 24
# Bob ? ? ? 42
# Charlie ? 18
# Dave ? ? ?68
# Ellen ? ? 24
# Frank ? ? 30

如果columns是整數(shù)值,請小心上述行。

多行多列的刪除

從0.21.0及更高版本開始,可以通過同時指定參數(shù)index和column來刪除多行/多列。

當(dāng)然,也可以通過行號/列號指定,和使用參數(shù)inplace。

print(df.drop(index=['Bob', 'Dave', 'Frank'],
? ? ? ? ? ? ? columns=['state', 'point']))
# ? ? ? ? ?age
# name ? ? ? ?
# Alice ? ? 24
# Charlie ? 18
# Ellen ? ? 24

print(df.drop(index=df.index[[1, 3, 5]],
? ? ? ? ? ? ? columns=df.columns[[1, 2]]))
# ? ? ? ? ?age
# name ? ? ? ?
# Alice ? ? 24
# Charlie ? 18
# Ellen ? ? 24

原文鏈接:https://blog.csdn.net/qq_18351157/article/details/105785367

  • 上一篇:沒有了
  • 下一篇:沒有了
欄目分類
最近更新