日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

混淆矩陣Confusion?Matrix概念分析翻譯_其它綜合

作者:vesper305 ? 更新時間: 2022-08-01 編程語言

Confusion Matrix

在機器學習領域,混淆矩陣(confusion matrix),又稱為可能性表格或是錯誤矩陣。它是一種特定的矩陣用來呈現算法性能的可視化效果,通常是監督學習(非監督學習,通常用匹配矩陣:matching matrix)。

其每一列代表預測值,每一行代表的是實際的類別。這個名字來源于它可以非常容易的表明多個類別是否有混淆(也就是一個class被預測成另一個class)。

Example

假設有一個用來對貓(cats)、狗(dogs)、兔子(rabbits)進行分類的系統,混淆矩陣就是為了進一步分析性能而對該算法測試結果做出的總結。假設總共有 27 只動物:8只貓, 6條狗, 13只兔子。結果的混淆矩陣如下圖:

在這個混淆矩陣中,實際有 8只貓,但是系統將其中3只預測成了狗;對于 6條狗,其中有 1條被預測成了兔子,2條被預測成了貓。從混淆矩陣中我們可以看出系統對于區分貓和狗存在一些問題,但是區分兔子和其他動物的效果還是不錯的。所有正確的預測結果都在對角線上,所以從混淆矩陣中可以很方便直觀的看出哪里有錯誤,因為他們呈現在對角線外面。

Table of confusion

在預測分析中,混淆表格(有時候也稱為混淆矩陣),是由false positives,falsenegatives,true positives和true negatives組成的兩行兩列的表格。它允許我們做出更多的分析,而不僅僅是局限在正確率。準確率對于分類器的性能分析來說,并不是一個很好地衡量指標,因為如果數據集不平衡(每一類的數據樣本數量相差太大),很可能會出現誤導性的結果。例如,如果在一個數據集中有95只貓,但是只有5條狗,那么某些分類器很可能偏向于將所有的樣本預測成貓。整體準確率為95%,但是實際上該分類器對貓的識別率是100%,而對狗的識別率是0%。

對于上面的混淆矩陣,其對應的對貓這個類別的混淆表格如下:

假定一個實驗有 P個positive實例,在某些條件下有 N 個negative實例。那么上面這四個輸出可以用下面的偶然性表格(或混淆矩陣)來表示:

公式陳列、定義如下:

True positive(TP)

eqv. with hit

True negative(TN)

eqv. with correct rejection

False positive(FP)

eqv. with false alarm, Type I error

False negative(FN)

eqv. with miss, Type II error

Sensitivity?ortrue positive rate(TPR)

eqv. with hit rate, recall

TPR = TP/P = TP/(TP + FN)

Specificity(SPC)ortrue negative rate(TNR)

SPC = TN/N = TN/(FP + TN)

Precision?orpositive prediction value(PPV)

PPV = TP/(TP + FP)

Negative predictive value(NPV)

NPV = TN/(TN + FN)

Fall-out?orfalse positive rate(FPR)

FPR = FP/N = FP/(FP + TN)

False discovery rate(FDR)

FDR = FP/(FP + TP) = 1 - PPV

Miss Rate orFalse Negative Rate(FNR)

FNR = FN/P = FN/(FN + TP)

Accuracy(ACC)

ACC = (TP + TN)/(P + N)

Preference

原文鏈接:https://blog.csdn.net/vesper305/article/details/44927047

欄目分類
最近更新