混亂矩陣
基於已知真值的一組測試資料,可以使用混淆矩陣來評估分類器。它是一個簡單的工具,有助於提供所用演算法效能的良好視覺概覽。
混淆矩陣表示為表格。在這個例子中,我們將檢視二進位制分類器的混淆矩陣。
在左側,可以看到 Actual 類(標記為 YES 或 NO ),而 top 表示正在預測和輸出的類(再次是 YES 或 NO )。
這意味著 50 個測試例項(實際上是 NO 例項)被分類器正確標記為 NO 。這些被稱為真陰性(TN) 。相反,100 個實際 YES 例項被分類器正確標記為 YES 例項。這些被稱為真陽性(TP) 。
5 個實際的 YES 例項被分類器錯誤標記。這些被稱為假陰性(FN) 。此外,10 個 NO 例項被分類器視為 YES 例項,因此這些是假陽性(FP) 。
基於這些 FP , TP , FN 和 TN ,我們可以得出進一步的結論。
-
真陽性率 :
- 試圖回答: 當一個例項實際上是 YES ,多久沒有分類預測是?
- 可以如下計算: TP /#actual YES instances = 100/105 = 0.95
-
誤報率 :
- 試圖回答: 當一個例項實際上是 NO ,多久沒有分類預測是?
- 可以如下計算: FP /#實際 NO 例項= 10/60 = 0.17