網(wǎng)站首頁 編程語言 正文
詳解:
箱型圖提供了識別異常值的一個標準:
異常值通常被定義為小于QL-1.5IQR或大于QU+1.5IQR的值。
QL稱為下四分位數(shù),表示全部觀察值中有四分之一的數(shù)據(jù)取值比它小;
QU稱為上四分位數(shù),表示全部觀察值中有四分之一的數(shù)據(jù)取值比它大;
IQR稱為四分位數(shù)間距,是上四分位數(shù)QU與下四分位數(shù)QL之差,其間包含了全部觀察值的一半。
最小值 (minimum);
下四分位數(shù) (first quartile, Q1);
中值或中位數(shù) (median), 或第二個四分位數(shù) (second quartile, Q2);
上四分位數(shù) (third quartile, Q3);
最大值 (maximum)。
四分位間距 (interquartile range, IQR), 表示下四分位數(shù)Q1和上四分位數(shù)Q3的間距;
離群值 (outliers),表示小于minimum的值和大于maximum的值。
箱型圖依據(jù)實際數(shù)據(jù)繪制,沒有對數(shù)據(jù)作任何限制性要求(如服從某種特定的分布形式),它只是真實直觀地表現(xiàn)數(shù)據(jù)分布的本來面貌;
另一方面,箱型圖判斷異常值的標準以四分位數(shù)和四分位距為基礎(chǔ),四分位數(shù)具有一定的魯棒性:多達25%的數(shù)據(jù)可以變得任意遠而不會很大地擾動四分位數(shù),所以異常值不能對這個標準施加影響。
由此可見,箱型圖識別異常值的結(jié)果比較客觀,在識別異常值方面有一定的優(yōu)越性
boxplot(x, notch=None, sym=None, whis=None, positions=None,
widths=None, patch_artist=None, bootstrap=None, usermedians=None,
conf_intervals=None, meanline=None, showmeans=None, showcaps=None,
showbox=None, showfliers=None, boxprops=None, labels=None,
flierprops=None, medianpropos=None, meanprops=None, capprops=None,
whiskerpropos=None, manage_ticks=True, autorange=False,
zorder=None, *, data=None)
x:繪制箱型圖的數(shù)據(jù)。
·sym:表示異常值對應(yīng)的符號,默認為空心圓圈。
·vert:表示是否將箱形圖垂直擺放,默認為垂直擺放。
·whis:表示箱形圖上下須與上下四分位的距離,默認為1.5倍的四分位差。
·positions:表示箱體的位置。
·widths:表示箱體的寬度,默認為0.5。
·patch_artist:表示是否填充箱體的顏色,默認不填充。
·meanline:是否用橫跨箱體的線條標出中位數(shù),默認不使用。
·showcaps:表示是否顯示箱體頂部和底部的橫線,默認顯示。
·showboxs:表示是否顯示箱形圖的箱體,默認顯示。
·showfliers:表示是否顯示異常值,默認顯示。
·labels:表示箱形圖的標簽。
·boxpropos:表示控制箱體屬性的字典。
用法:
diamonds = pd.read_csv('./data/DiamondsPrices2022.csv')
diamonds.boxplot(column=['price'], showmeans=True, return_type='axes', figsize=(8, 8))
plt.title("價格中的異常值", size=12)
plt.show()
原文鏈接:https://blog.csdn.net/c_lanxiaofang/article/details/125893833
相關(guān)推薦
- 2023-07-14 react 如何實現(xiàn)富文本編輯器
- 2022-06-01 C#中內(nèi)聯(lián)函數(shù)的用法介紹_C#教程
- 2022-07-23 .Net創(chuàng)建型設(shè)計模式之簡單工廠模式(Simple?Factory)_基礎(chǔ)應(yīng)用
- 2023-07-15 React 中的 context使用方法
- 2023-01-20 C#實現(xiàn)自定義動畫鼠標的示例詳解_C#教程
- 2022-08-29 .NET?Core獲取配置文件內(nèi)容_實用技巧
- 2022-05-04 R語言向量下標和子集的使用_R語言
- 2022-07-03 DatePicker動態(tài)設(shè)置picker-options 中的disabledDate屬性操作;
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細win安裝深度學習環(huán)境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡單動態(tài)字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支