接收机工作特性曲线下面积(AUROC)

AUROC 是最常用的指标来评价分类的演出之一。本节介绍如何计算它。

AUC (曲线面积)大部分时间用于表示 AUROC,这是一种不好的做法,因为 AUC 是模糊的(可以是任何曲线)而 AUROC 不是。

概述 - 缩略语

缩写 含义
AUROC 接收机工作特性曲线下的面积
AUC Curce 下的区域
接收器工作特性
TP 真正的积极因素
TN 真正的否定
FP 误报
FN 假阴性
TPR 真阳性率
FPR 误报率

解释 AUROC

AUROC 有几个相同的解释

  • 期望均匀绘制的随机正数在均匀绘制的随机负数之前排序。
  • 在统一绘制的随机否定之前排列的预期阳性比例。
  • 如果排名在统一绘制的随机否定之前被分割,则预期的真阳性率。
  • 在统一抽取随机阳性后排序的预期负面比例。
  • 如果排名在统一绘制的随机正数之后被分割,则预期的假阳性率。

计算 AUROC

假设我们有一个概率的二元分类器,如逻辑回归。

在呈现 ROC 曲线(=接收器工作特性曲线)之前,必须理解混淆矩阵的概念。当我们进行二元预测时,可以有 4 种类型的结果:

  • 我们预测 0,而类实际上是 0 :这被称为真负,即我们正确地预测该类是负的(0)。例如,防病毒软件未将无害文件检测为病毒。
  • 我们预测 0,而类实际上是 1 :这被称为假阴性,即我们错误地预测该类是负的(0)。例如,防病毒软件无法检测到病毒。
  • 我们预测 1,而类实际上是 0 :这被称为假阳性,即我们错误地预测该类是正的(1)。例如,防病毒软件认为无害文件是病毒。
  • 我们预测 1,而类实际上是 1 :这被称为真阳性,即我们正确地预测该类是正的(1)。例如,防病毒软件正确地检测到了病毒。

为了得到混淆矩阵,我们回顾模型所做的所有预测,并计算这 4 种结果中每种结果出现的次数:

在此处输入图像描述

在这个混淆矩阵的例子中,在被分类的 50 个数据点中,45 个被正确分类,5 个被错误分类。

由于比较两个不同的模型,通常使用单个度量而不是几个度量更方便,我们从混淆矩阵计算两个度量,我们稍后将它们合并为一个:

  • 真阳性率TPR ),又名。敏感度,命中率召回 ,定义为 式 。直观地,该度量对应于相对于所有正数据点被正确认为为正的正数据点的比例。换句话说,更高的 TPR,我们将错过的正数据点越少。
  • 假阳性率FPR ),又名。失败 ,定义为 另一个 。直观地,该度量对应于相对于所有负数据点被错误地认为是正数的负数据点的比例。换句话说,更高的 FPR,我们将错过分类的负数据点越多。

要将 FPR 和 TPR 组合成一个单一的度量标准,我们首先计算两个以前的度量标准,并使用许多不同的阈值(例如 )进行逻辑回归,然后将它们绘制在单个图形上,横坐标和 TPR 上的 FPR 值纵坐标上的数值。得到的曲线称为 ROC 曲线,我们考虑的度量是该曲线的 AUC,我们称之为 AUROC。

下图以图形方式显示 AUROC:

在此处输入图像描述

在该图中,蓝色区域对应于接收器操作特性(AUROC)的曲线下面积。对角线中的虚线表示随机预测器的 ROC 曲线:它的 AUROC 为 0.5。随机预测器通常用作基线,以查看模型是否有用。