ROC 曲线(Receiver Operating Characteristic Curve,受试者工作特征曲线) 是评估二分类模型性能的重要工具。它通过展示不同分类阈值下的 真正例率(TPR) 与 假正例率(FPR) 的变化关系,直观反映模型对正负类的区分能力。
在类别极不平衡场景,最好同时参考 PR 曲线;ROC 对负类数量变化不如 PR 敏感。
阈值用来把连续分数 score 转成二分类标签: 当 \( \text{score} \ge t \) 预测为正类(1),否则为负类(0)。 拖动滑块会改变混淆矩阵、指标(Precision/Recall/FPR/TPR)、分布图着色,以及 ROC 曲线上红点的位置。
若分数未校准(不等于真实概率),先做 Platt/Isotonic 校准,再用代价敏感规则挑阈值更靠谱。
AUC(Area Under the ROC Curve)是 ROC 曲线下的面积,取值范围为 [0, 1]。 其经典概率解释为:从一个正类样本与一个负类样本中各随机抽取一个,模型给正类的分数高于负类的概率: \( \text{AUC} = \Pr\big(s_{+} > s_{-}\big) \)。 因此 AUC 越大,模型整体排序区分能力越强。
拖动阈值会改变 ROC 曲线上的红点位置,但 AUC 作为整体面积一般不随阈值改变(除非样本/分数分布变了)。