網(wǎng)站首頁 編程語言 正文
前言
拿到一堆數(shù)據(jù),首先我們是要對其進(jìn)行數(shù)據(jù)的預(yù)處理,其中數(shù)據(jù)存在一些值為空或者是我們不想要的數(shù)據(jù),對其進(jìn)行刪除或者是修改數(shù)據(jù)值。下面是對于該例子進(jìn)行刪除和修改:
>>> df
out[]:
salary age gender
0 10000 23 男
1 15000 34 女
2 23000 21 男
3 0 20 女
4 28500 0 男
5 35000 37 男
一、數(shù)據(jù)處理
1. df.replace()方法:將“男”用1來表示,“女孩”用0來表示。
>>> df.replace(["男", "女"], [1, 0])
out[]:
salary age gender
0 10000 23 1
1 15000 34 0
2 23000 21 1
3 0 20 0
4 28500 0 1
5 35000 37 1
2.??pd.DataFrame.loc()方法來指定列中數(shù)據(jù)為0的行:
>>> df = df.loc[~((df['salary'] == 0) | (df['age'] == 0))]
>>> df
out[]:
salary age gender
0 10000 23 1
1 15000 34 0
2 23000 21 1
3 35000 37 1
還可以用:?
df = df.loc[df['salary'] * df['age'] != 0]
二、刪除某行方法的使用
1.刪除全行都是為0的行
代碼如下:
>>> df.loc[~(df==0).all(axis=1)]
?看起來比較對稱可以這樣寫:
>>> df.loc[(df!=0).any(axis=1)]
使用dropna方法來刪除:
>>> new_df = df[df.loc[:]!=0].dropna()
2.用nan替換零,然后刪除所有行中數(shù)據(jù)都為nan的行。之后,將nan替換為零。
代碼如下:
import numpy as np
df = df.replace(0, np.nan)# 把0替換成nan
df = df.dropna(how='all', axis=0)# 刪除所有為nan的行
df = df.replace(np.nan, 0)# 再把nan替換成0
3.刪除某行中某個(gè)值為0的行
代碼如下:|
>>> df= df[df['salary'] != 0]
4.使用lambda函數(shù)來刪除行
代碼如下:
import pandas as pd
import numpy as np
np.random.seed(0)
df = pd.DataFrame(np.random.randn(5,3),
index=['one', 'two', 'three', 'four', 'five'],
columns=list('abc'))
df.loc[['one', 'three']] = 0 # 把第一行和第三行改為0
print(df)
print(df.loc[~df.apply(lambda row: (row==0).all(), axis=1)])
輸出為:
要在任何行中刪除所有值為0的列:?
new_df = df[df.loc[:]!=0].dropna()
new_df
?輸出為:
總結(jié)
原文鏈接:https://blog.csdn.net/ex_6450/article/details/126867123
相關(guān)推薦
- 2022-11-29 Mybatis中如何傳入map參數(shù)呢?
- 2024-03-18 Springboot如何判斷pom.xml中是否加載了某個(gè)jar依賴
- 2022-06-29 python人工智能tensorflow函數(shù)tf.layers.dense使用方法_python
- 2022-04-09 python去掉空格的一些常用方式_python
- 2023-12-09 出現(xiàn)錯(cuò)誤:SLF4J: Class path contains multiple SLF4J bin
- 2022-10-27 React事件處理和表單的綁定詳解_React
- 2023-06-04 pandas.DataFrame中提取特定類型dtype的列_python
- 2022-12-26 .NET?6實(shí)現(xiàn)滑動(dòng)驗(yàn)證碼的示例詳解_實(shí)用技巧
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細(xì)win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運(yùn)行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲(chǔ)小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運(yùn)算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認(rèn)證信息的處理
- Spring Security之認(rèn)證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯(cuò)誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實(shí)現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡單動(dòng)態(tài)字符串(SD
- arthas操作spring被代理目標(biāo)對象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊(duì)列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠(yuǎn)程分支