混乱矩阵

基于已知真值的一组测试数据,可以使用混淆矩阵来评估分类器。它是一个简单的工具,有助于提供所用算法性能的良好视觉概览。

混淆矩阵表示为表格。在这个例子中,我们将查看二进制分类器混淆矩阵

StackOverflow 文档

在左侧,可以看到 Actual 类(标记为 YESNO ),而 top 表示正在预测和输出的类(再次是 YESNO )。

这意味着 50 个测试实例(实际上是 NO 实例)被分类器正确标记为 NO 。这些被称为真阴性(TN) 。相反,100 个实际 YES 实例被分类器正确标记为 YES 实例。这些被称为真阳性(TP)

5 个实际的 YES 实例被分类器错误标记。这些被称为假阴性(FN) 。此外,10 个 NO 实例被分类器视为 YES 实例,因此这些是假阳性(FP)

基于这些 FPTPFNTN ,我们可以得出进一步的结论。

  • 真阳性率

    • 试图回答: 当一个实例实际上是 YES ,多久没有分类预测
    • 可以如下计算: TP /#actual YES instances = 100/105 = 0.95
  • 误报率

    • 试图回答: 当一个实例实际上是 NO ,多久没有分类预测
    • 可以如下计算: FP /#实际 NO 实例= 10/60 = 0.17