網站首頁 編程語言 正文
一、DataFrame數據準備
增、刪、改、查的方法有很多很多種,這里只展示出常用的幾種。
參數inplace默認為False,只能在生成的新數據塊中實現編輯效果。當inplace=True時執行內部編輯,不返回任何值,原數據發生改變。
import numpy as np
import pandas as pd
#測試數據。
df = pd.DataFrame(data = [['lisa','f',22],['joy','f',22],['tom','m','21']],index = [1,2,3],columns = ['name','sex','age'])
數據:
? ?name sex age
1 ?lisa ? f ?22
2 ? joy ? f ?22
3 ? tom ? m ?21
二、增刪改查操作
1,增
(1).按列增加
citys = ['ny','zz','xy']
df.insert(0,'city',citys) #在第0列,加上column名稱為city,值為citys的數值。
jobs = ['student','AI','teacher']
df['job'] = jobs #默認在df最后一列加上column名稱為job,值為jobs的數據。
df.loc[:,'salary'] = ['1k','2k','2k','2k','3k'] #在df最后一列加上column名稱為salary,值為等號右邊數據。
(2)按行增加
若df中沒有index為“4”的這一行的話,該行代碼作用是往df中加一行index為“4”,值為等號右邊值的數據。若df中已經有index為“4”的這一行,則該行代碼作用是把df中index為“4”的這一行修改為等號右邊數據。
df.loc[4] = ['zz','mason','m',24,'engineer']
df_insert = pd.DataFrame({'name':['mason','mario'],'sex':['m','f'],'age':[21,22]},index = [4,5])
ndf = df.append(df_insert,ignore_index = True)
返回添加后的值,并不會修改df的值。ignore_index默認為False,意思是不忽略index值,即生成的新的ndf的index采用df_insert中的index值。若為True,則新的ndf的index值不使用df_insert中的index值,而是自己默認生成。
2,查
(1)方法一:df[‘column_name’] 和df[row_start_index, row_end_index]
df['name']
df['gender']
df[['name','gender']] #選取多列,多列名字要放在list里
df[0:] #第0行及之后的行,相當于df的全部數據,注意冒號是必須的
df[:2] #第2行之前的數據(不含第2行)
df[0:1] #第0行
df[1:3] #第1行到第2行(不含第3行)
df[-1:] #最后一行
df[-3:-1] #倒數第3行到倒數第1行(不包含最后1行即倒數第1行,這里有點煩躁,因為從前數時從第0行開始,從后數就是-1行開始,畢竟沒有-0)
(2)方法一:df.loc[index,column]
df.loc[index, column_name],選取指定行和列的數據
df.loc[0,'name'] # 'Snow'
df.loc[0:2, ['name','age']] #選取第0行到第2行,name列和age列的數據, 注意這里的行選取是包含下標的。
df.loc[[2,3],['name','age']] #選取指定的第2行和第3行,name和age列的數據
df.loc[df['gender']=='M','name'] #選取gender列是M,name列的數據
df.loc[df['gender']=='M',['name','age']] #選取gender列是M,name和age列的數據
(3)方法三:iloc[row_index, column_index]
'''
學習中遇到問題沒人解答?小編創建了一個Python學習交流群:711312441
尋找有志同道合的小伙伴,互幫互助,群里還有不錯的視頻學習教程和PDF電子書!
'''
df.iloc[0,0] #第0行第0列的數據,'Snow'
df.iloc[1,2] #第1行第2列的數據,32
df.iloc[[1,3],0:2] #第1行和第3行,從第0列到第2列(不包含第2列)的數據
df.iloc[1:3,[1,2] #第1行到第3行(不包含第3行),第1列和第2列的數據
3,改
(1)改行列標題
df.columns = ['name','gender','age'] #盡管我們只想把'sex'改為'gender',但是仍然要把所有的列全寫上,否則報錯。
df.rename(columns = {'name':'Name','age':'Age'},inplace = True) #只修改name和age。inplace若為True,直接修改df,否則,不修改df,只是返回一個修改后的數據。
df.index = list('abc')#把index改為a,b,c.直接修改了df。
df.rename({1:'a',2:'b',3:'c'},axis = 0,inplace = True)#無返回值,直接修改df的index。
(2)改數值
使用loc
df.loc[1,'name'] = 'aa' #修改index為‘1',column為‘name'的那一個值為aa。
df.loc[1] = ['bb','ff',11] #修改index為‘1'的那一行的所有值。
df.loc[1,['name','age']] = ['bb',11] #修改index為‘1',column為‘name'的那一個值為bb,age列的值為11。
使用iloc[row_index, column_index]
df.iloc[1,2] = 19 #修改某一無素
df.iloc[:,2] = [11,22,33] #修改一整列
df.iloc[0,:] = ['lily','F',15] #修改一整行
4,刪
(1)刪除行
df.drop([1,3],axis = 0,inplace = False)#刪除index值為1和3的兩行,
(2)刪除列
df.drop(['name'],axis = 1,inplace = False) #刪除name列。
del df['name'] #刪除name列。
ndf = df.pop('age') #刪除age列,操作后,df都丟掉了age列,age列返回給了ndf。
原文鏈接:https://blog.csdn.net/qdPython/article/details/127107947
相關推薦
- 2022-12-15 python將二維數組升為一維數組或二維降為一維方法實例_python
- 2022-11-13 Framework源碼面試之activity啟動流程_Android
- 2024-01-13 Maven項目導入第三方jar包
- 2022-10-12 解決“WARNINGThe?remote?SSH?server?rejected?X11?forwa
- 2022-07-19 Python數據分析之NumPy常用函數使用詳解_python
- 2022-10-07 C#如何實現調取釘釘考勤接口的功能_C#教程
- 2022-03-30 一篇文章帶你了解C語言的選擇結構_C 語言
- 2023-07-15 es6中export和export default的區別
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支