網站首頁 編程語言 正文
1.找到缺失值
導入數據集
df=pd.read_csv("nba.csv")
df.head(10)
替換異常值(數據集中異常值為“-”)
把數據集中的異常值用“NaN”替換
# 將空值形式的缺失值轉換成可識別的類型
data = data.replace('-', np.NaN)
2.計算缺失值的數量
用# isnull() 函數,確認各列是否有缺失值1.
null_all = df.isnull().sum()
print(null_all)
.sum();表示可以顯示各個列的缺失值數量。
null_all = df.isnull.any(axis=1)#表示那些行具有缺失值,
.any()表示只要按行或列計算,有缺失值就算入
.all()表示所在行或列全為缺失值才計入
.sum()表示計算列缺失值時,一列有多個缺失值,同理,計算行缺失,計算有多少個行。
3.處理缺失值
3.1:df.dropna():直接刪除行列
df表示數據集的名稱
- dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)
括號內上述參數都是函數默認。
axis=0:表示對行進行刪除操作,axis=1:對列刪除進行操作
how=‘any’:表示維度 存在“缺失值”就刪除相應行/列操作;how=‘all’:進行相關行或列刪除操作時,只有所有維度缺失才刪除。
thresh=None:等于幾表示有幾個缺失值存在才會刪除所在的行或列。
inplace=False:表示對原來的數據集不進行操作,True時表示對原來的數據集也進行操作。
3.2:df.fillna()填充缺失值
- fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)
axis : {0 or ‘index’, 1 or ‘columns’}
method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}
pad’, ‘ffill:將前面的值填充于后面位置。
backfill’, 'bfill:表示將后面的值填充于前面位置。
data.fillna(data.mean())#平均值填充
data.fillna(data.median())#中位數填充
3.3:KNN填充
from sklearn.impute import KNNImputer
imputer = KNNImputer(n_neighbors=4)#鄰居樣本求平均數
df1=imputer.fit_transform(df)
4.查看數據集的末尾
df.tail(10)
查看末尾10行
總結
原文鏈接:https://blog.csdn.net/ZGP1234/article/details/125234702
相關推薦
- 2023-03-23 一文帶你了解Python中的type,isinstance和issubclass_python
- 2023-03-01 Python中的getter與setter及deleter使用示例講解_python
- 2021-12-13 linux系統AutoFs自動掛載服務安裝配置_Linux
- 2022-08-15 常見哈希算法、Hmac算法和BouncyCastle
- 2024-07-15 使用itext導出pdf出現的中文無法顯示的問題
- 2023-02-12 JetpackCompose?Navigation導航實現流程_Android
- 2022-04-15 Python爬蟲之requests庫基本介紹_python
- 2022-05-15 Qt windows打開資源管理器并高亮文件
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支