机器学习算法评估实战
上QQ阅读APP看书,第一时间看更新

1.5 小结

本章主要介绍了分类问题的基础评估理论。

1.1节先通过鸢尾花数据集解释了构建训练集和测试集的基本原则——一致性和完整性。接着介绍了构建训练集和测试集的具体方法,包括留出法、K 折交叉验证法、采样法和交叉验证集+测试集法。

1.2节介绍了精确率、召回率和准确率的概念,同时分析了分类结果的混淆矩阵及其计算方法,然后进一步讲解了评估分类模型整体效果的直观方法——P-R曲线及其绘制方法,最后给出了实用的模型评估指标\mathrm{F}_{n} -score。

1.3节的主要内容是ROC和AUC,我们介绍了ROC的计算方法和绘图过程,以及AUC的含义和计算方法,最后说明了P-R曲线和ROC的联系和区别。

1.4节是分类问题的特殊场景——异常检测,我们介绍了异常检测适用的评估方法。