天池-工业蒸汽量排放预测4
链接:工业蒸汽量预测_学习赛_赛题与数据_天池大赛-阿里云天池的赛题与数据 (aliyun.com)
特征优化
合成特征
从一个或多个输入特征衍生而来的特征,包括以下类型
- 将一个特征与其本身或其他特征相乘(特征组合)
- 两个特征相除
- 对连续特征分箱处理,分为多个区间分箱
特征的简单变换
单调变换(取对数)都不适用于决策树。SVM,线性回归,神经网络等模型可以线性组合
1. 类别特征与数值特征的组合
2. 用决策树创建新变量
后记
其实还有模型融合部分,但是我觉得打比赛现场学习更有效