上QQ阅读APP看书,第一时间看更新
1.5 小结
本章主要介绍了分类问题的基础评估理论。
1.1节先通过鸢尾花数据集解释了构建训练集和测试集的基本原则——一致性和完整性。接着介绍了构建训练集和测试集的具体方法,包括留出法、折交叉验证法、采样法和交叉验证集+测试集法。
1.2节介绍了精确率、召回率和准确率的概念,同时分析了分类结果的混淆矩阵及其计算方法,然后进一步讲解了评估分类模型整体效果的直观方法——P-R曲线及其绘制方法,最后给出了实用的模型评估指标 -score。
1.3节的主要内容是ROC和AUC,我们介绍了ROC的计算方法和绘图过程,以及AUC的含义和计算方法,最后说明了P-R曲线和ROC的联系和区别。
1.4节是分类问题的特殊场景——异常检测,我们介绍了异常检测适用的评估方法。