天池-工业蒸汽量排放预测3
链接:工业蒸汽量预测_学习赛_赛题与数据_天池大赛-阿里云天池的赛题与数据 (aliyun.com)
模型评估
欠拟合与过拟合
模型的泛化与正则化
泛化:处理新样本的能力
正则化:添加一些规则以防止过拟合
交叉验证
1. 简单交叉验证
2. k折交叉验证,k值通常需要大于等于3
from sklearn.model_selection import Kfold
kf = KFold(n_splits=10)
学习曲线
在训练集大小不同时,通过绘制模型训练集和交叉验证集上的准确率来观察模型在新数据上的表现,如下:
验证曲线
横轴为某个超参数的一系列值,由此比较不同参数设置下模型的准确率