二分类_二分类评估

二分类评估是衡量模型在只有两个类别的数据集上的性能。常用的指标有准确率、精确率、召回率、F1分数和AUCROC曲线等。这些指标帮助理解模型预测的可靠性。

二分类问题在机器学习中非常常见，它涉及到将数据集中的样本分为两个类别，评估二分类模型的性能是确保其准确性和可靠性的关键步骤，以下是一些用于评估二分类模型的指标和方法。

（图片来源网络，侵删）

混淆矩阵

在二分类问题中，混淆矩阵是一个2×2的表格，用于描述模型的预测结果与实际观测值之间的关系，它由以下四个组成部分：

真正例（True Positive, TP）: 模型正确预测为正类的实例数量。

假正例（False Positive, FP）: 模型错误地将负类实例预测为正类的实例数量。

真负例（True Negative, TN）: 模型正确预测为负类的实例数量。

假负例（False Negative, FN）: 模型错误地将正类实例预测为负类的实例数量。

基于混淆矩阵，我们可以计算多种性能指标。

性能指标

（图片来源网络，侵删）

1、准确率（Accuracy）: 表示模型正确预测的比例，计算公式为 (TP + TN) / (TP + TN + FP + FN)。

2、精确率（Precision）: 表示被模型预测为正类的实例中实际为正类的比例，计算公式为 TP / (TP + FP)。

3、召回率（Recall）或灵敏度（Sensitivity）: 表示实际为正类的实例中被模型正确预测的比例，计算公式为 TP / (TP + FN)。

4、特异性（Specificity）: 表示实际为负类的实例中被模型正确预测的比例，计算公式为 TN / (TN + FP)。

5、F1分数（F1 Score）: 是精确率和召回率的调和平均数，计算公式为 2 * (Precision * Recall) / (Precision + Recall)。

6、AUCROC: 接收者操作特征曲线下面积（Area Under the Curve Receiver Operating Characteristic），用于衡量模型区分正负类的能力，值越接近1越好。

ROC曲线

ROC曲线是通过绘制不同阈值下的真阳性率（TPR）和假阳性率（FPR）来创建的，

（图片来源网络，侵删）

真阳性率（True Positive Rate, TPR）或召回率: 同上述召回率定义。

假阳性率（False Positive Rate, FPR）: 被模型错误预测为正类的负实例比例，计算公式为 FP / (FP + TN)。

ROC曲线下面积（AUC）提供了模型整体性能的一个量化度量，不受任何特定分类阈值的影响。

单元表格示例

指标	公式	说明
准确率	(TP + TN) / 总数	模型正确预测的整体比例
精确率	TP / (TP + FP)	被预测为正类的实例中实际为正类的比例
召回率	TP / (TP + FN)	实际为正类的实例中被正确预测的比例
特异性	TN / (TN + FP)	实际为负类的实例中被正确预测的比例
F1分数	2 * (Precision * Recall) / (Precision + Recall)	精确率和召回率的调和平均数
AUCROC	ROC曲线下面积	模型区分正负类能力的量化度量，值越接近1越好