性能度量
二分类任务的 混淆矩阵 和 其衍生的度量指标
True Positive (真正, TP) 被模型预测为正样本,是真的判断正确。所以就是正样本,也称作正的数。
True Negative(真负 , TN)被模型判断为负样本,是真的判断正确。所以就是负样本,也称作负的数。
False Positive (假正, FP)被模型判断为正样本,是假的判断错误。所以应该是负样本,也称作误报数。
False Negative(假负 , FN)被模型判断为负样本,是假的判断错误。所以应该是正样本,也称作漏报数。
1)常用的3个指标(多用于交叉验证)
- accuracy(准确率)——检验模型预测的正确率
预测正确个数/全部样本数
- precision(精确率)——检验模型预测正例的正确率
预测正确的正样本数 / 预测为的正样本数
- recall/TPR(召回率/真正率)——检验模型正例预测的全面性
预测正确的正样本数 / 真实的正样本数
2)不常用的3个指标(多用于绘图)
- specificity(特异性/真负率)——检验模型负例预测的正确率
预测正确的负样本数 / 真实的负样本数
- FPR(假正率)——用于和TPR一起绘制ROC曲线
预测错误的正样本数 / 真实的负样本数
- FNR(假负率)——用的少
预测错误的负样本数 / 真实的正样本数