混乱矩阵
基于已知真值的一组测试数据,可以使用混淆矩阵来评估分类器。它是一个简单的工具,有助于提供所用算法性能的良好视觉概览。
混淆矩阵表示为表格。在这个例子中,我们将查看二进制分类器的混淆矩阵。
在左侧,可以看到 Actual 类(标记为 YES 或 NO ),而 top 表示正在预测和输出的类(再次是 YES 或 NO )。
这意味着 50 个测试实例(实际上是 NO 实例)被分类器正确标记为 NO 。这些被称为真阴性(TN) 。相反,100 个实际 YES 实例被分类器正确标记为 YES 实例。这些被称为真阳性(TP) 。
5 个实际的 YES 实例被分类器错误标记。这些被称为假阴性(FN) 。此外,10 个 NO 实例被分类器视为 YES 实例,因此这些是假阳性(FP) 。
基于这些 FP , TP , FN 和 TN ,我们可以得出进一步的结论。
-
真阳性率 :
- 试图回答: 当一个实例实际上是 YES ,多久没有分类预测是?
- 可以如下计算: TP /#actual YES instances = 100/105 = 0.95
-
误报率 :
- 试图回答: 当一个实例实际上是 NO ,多久没有分类预测是?
- 可以如下计算: FP /#实际 NO 实例= 10/60 = 0.17