日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

使用Pandas修改DataFrame中某一列的值_python

作者:Sun_Sherry ? 更新時間: 2023-01-26 編程語言

寫這篇博客主要是因為在修改DataFrame列值的時候經常遇到bug,但到目前還沒把這種錯誤復現(xiàn)出來。

DataFrame是Pandas中的主要數(shù)據(jù)結構之一,本篇博客主要介紹如何DataFrame中某一列的值進行修改。

1 常規(guī)方法

這部分主要介紹修改DataFrame列值的常規(guī)方法。為了方便后續(xù)說明先構建如下數(shù)據(jù):

import pandas as pd
import numpy as np
df=pd.DataFrame([['A',1],['B',2],['C',5],['D',4],['E',10],['F',13],['G',8]],
                columns=['col_1','col_2'],
                index=list('abcdefg'))

df結果如下:

  • 使用常量修改DataFrame列的值

使用一個常量對DataFrame列中的數(shù)據(jù)進行修改時,代碼舉例如下:

df1=df.copy()
df1['col_1']='H'
df1.loc[['a','c','d'],'col_2']=100 #將指定索引的列值進行修改
df1.iloc[4:,-1]=200 

df1的結果如下:

  • 使用List\array修改DataFrame列的值

當需要對DataFrame列中的多個值進行修改時,可以使用List或array等變量型數(shù)據(jù)來對其進行修改。具體代碼如下:

df2=df.copy()
df2['col_1']=list(range(7))
df2.loc[df2.index<='d','col_2']=np.array([15,20,25,30])
df2.iloc[4:,-1]=np.array([10,5,0])

df2的結果如下:

  • 使用Series/DataFrame修改DataFrame列的值

除了以上兩種數(shù)據(jù)類型之外,還可以使用Series型數(shù)據(jù)來修改DataFrame列的值。但使用這種方法時,需要索引對齊,否則會出錯。具體舉例如下:

df3=df.copy()
df3['col_1']=pd.Series([1,2,3,4,5,6,7]) #索引不對齊時不會報錯,但沒有成功修改列值。
df3.loc[['a','b','c'],'col_2']=pd.Series([100,200,300],index=list('abc'))
df3.iloc[3:,-1]=pd.DataFrame([[4000],[5000],[6000],[7000]],index=list('cdef'))

其結果如下:

2. replace方法

DataFrame對象自帶的方法replace()也可以實現(xiàn)列值的修改。該方法中的參數(shù)主要有以下幾個:

參數(shù) 作用
to_replace 確定需要修改列值的數(shù)據(jù)。可接受的數(shù)據(jù)類型有:str, regex, list, dict, Series, int, float, or None
value 指定修改后的值。可接受的數(shù)據(jù)類型有:scalar, dict, list, str, regex, default None
inplace 是否本地置換
limit 指定前后填充的最大次數(shù)
regex 正則表達式符號。如果需要在to_replace中使用字符串形式的正則表達式對數(shù)據(jù)進行篩選的話,需要將其設置為True。
method 填充方式。‘pad’, ‘ffill’, ‘bfill’, None

創(chuàng)建如下數(shù)據(jù),具體如下:

df=pd.DataFrame([['A','A'],['B','B'],['C',5],['D',4]],
                columns=['col_1','col_2'],
                index=list('abcd'))

df的結果如下:

  • 對整個DataFrame中的指定數(shù)據(jù)進行替換
#A替換為aaa,B替換為bbb,4替換為100
df_1=df.replace(to_replace=['A','B',4],value=['aaa','bbb',100])
#將A替換為AAAA
df_2=df.replace(to_replace='A',value='AAAA')
#將A替換為AAAAA,5替換為2000
df_3=df.replace(to_replace={"A":'AAAAA',5:2000})

其結果如下:

  • 對DataFrame中的不同列指定不同的替換方式
#對于col_1列:將A替換為1,B替換為2
#對于col_2列:將A替換為100,B替換為200
df_4=df.replace({"col_1":{'A':1,'B':2},"col_2":{"A":100,"B":200}})

其結果如下:

  • 使用正則表達式篩選數(shù)據(jù)
#將A\B替換成new
df_5=df.replace(to_replace=r'[AB]',value='new',regex=True)

其結果如下:

補充:DataFrame修改某一行某一列的值[坑點]

# df.iloc[index]['column_name'] = val 這種方式是錯誤的
df['column_name'].iloc[i] = val # 正確

總結?

原文鏈接:https://blog.csdn.net/yeshang_lady/article/details/127619031

欄目分類
最近更新