混亂矩陣

基於已知真值的一組測試資料,可以使用混淆矩陣來評估分類器。它是一個簡單的工具,有助於提供所用演算法效能的良好視覺概覽。

混淆矩陣表示為表格。在這個例子中,我們將檢視二進位制分類器混淆矩陣

StackOverflow 文件

在左側,可以看到 Actual 類(標記為 YESNO ),而 top 表示正在預測和輸出的類(再次是 YESNO )。

這意味著 50 個測試例項(實際上是 NO 例項)被分類器正確標記為 NO 。這些被稱為真陰性(TN) 。相反,100 個實際 YES 例項被分類器正確標記為 YES 例項。這些被稱為真陽性(TP)

5 個實際的 YES 例項被分類器錯誤標記。這些被稱為假陰性(FN) 。此外,10 個 NO 例項被分類器視為 YES 例項,因此這些是假陽性(FP)

基於這些 FPTPFNTN ,我們可以得出進一步的結論。

  • 真陽性率

    • 試圖回答: 當一個例項實際上是 YES ,多久沒有分類預測
    • 可以如下計算: TP /#actual YES instances = 100/105 = 0.95
  • 誤報率

    • 試圖回答: 當一個例項實際上是 NO ,多久沒有分類預測
    • 可以如下計算: FP /#實際 NO 例項= 10/60 = 0.17