分类: 比赛

9 篇文章

Kaggle比赛:Titanic – Machine Learning from Disaster
Kaggle比赛:Titanic - Machine Learning from Disaster 链接:https://www.kaggle.com/competitions/titanic 成绩758/15641(2024.4.21): 还算不错吧,虽然是学习赛但好歹也是个5%嘻嘻 代码分析及思路 导入包与数据集 所有的包都放在一个代码块了,个…
天池-工业蒸汽量排放预测4
天池-工业蒸汽量排放预测4 链接:工业蒸汽量预测_学习赛_赛题与数据_天池大赛-阿里云天池的赛题与数据 (aliyun.com) 特征优化 合成特征 从一个或多个输入特征衍生而来的特征,包括以下类型 将一个特征与其本身或其他特征相乘(特征组合) 两个特征相除 对连续特征分箱处理,分为多个区间分箱 特征的简单变换 单调变换(取对数)都不适用于决策树。…
天池-工业蒸汽量排放预测3
天池-工业蒸汽量排放预测3 链接:工业蒸汽量预测_学习赛_赛题与数据_天池大赛-阿里云天池的赛题与数据 (aliyun.com) 模型评估 欠拟合与过拟合 模型的泛化与正则化 泛化:处理新样本的能力 正则化:添加一些规则以防止过拟合 交叉验证 1. 简单交叉验证 2. k折交叉验证,k值通常需要大于等于3 from sklearn.model_se…
天池-工业蒸汽量排放预测2
天池-工业蒸汽量排放预测2 链接:工业蒸汽量预测_学习赛_赛题与数据_天池大赛-阿里云天池的赛题与数据 (aliyun.com) 特征工程 ​ ——“数据和特征决定了机器学习的上限,而模型与算法只是逼近这个上限” 数据预处理 没啥好说的,但是有一个正负样本不平衡的问题: 正样本>负样本,且量大的情况下,采用下采样 正样本<负样本,且量不…
天池-工业蒸汽量排放预测1
天池-工业蒸汽量排放预测1 链接:工业蒸汽量预测_学习赛_赛题与数据_天池大赛-阿里云天池的赛题与数据 (aliyun.com) 数据探索 变量识别 通过变量类型,数据类型等方面分析,常见的有:字符型变量,数值型变量,连续性变量,类别性变量 变量分析 单变量分析 连续性变量需要统计数据的中心分布趋势与变量分布 类别性变量使用频次或者占比表示每一个类…
2022市调
也算是我的第一篇文章,虽然我的评价是毫无作用,但是稍微水一水还是很具有代表性滴~~ (顺便练习一下我的md,嘿嘿) 前言 咋开始的我忘记了,但是本着想当一次队长的心态拉了wzl,llj,然后llj又拉了cy(本来想让她帮我建模一部分的呜呜),最后又拉了wyy(这个决定真的是太对了) 网挑 额额,去后街的奶茶店一起做的,wzl真的运气不好,还好最后一…
2022数模校赛
卧槽这tm都什么玩意???(来自一年后的自己) 太抽象了,直接把表格放在正文,matlab画图依托答辩 模型都没建。。。。难道主打的就是一个算法吗? 我寻思这迪杰斯特拉算法也很平常啊。。。 真的不知道那天答辩我哪来的自信卧槽 心得 没有心得。。。 但是依然会非常怀念去年的夏天,自己从数模垃圾变成了现在这样,感谢队友的逼迫和自己的坚持,从0到1的过程…
2023美赛
今天刚刚提交,距截至日期还有10个半小时,打比赛以来最早的一次交卷(逆天又害怕) 在未开奖之前,先列举一下这次论文的不足吧 图:还行,美中不足的是这次三个激励函数编排的有一些问题== 公式:太少了,总共就21个公式 内容:这次反而少了,但是神经网络本来就没这么多。摘要感觉有点危险,虽然不是机翻但是仍然充满变数 接下来就是总结 学到了什么? 首先是数…
2023桂林银行杯
前言 算是第二次的正式数模比赛了,虽然现在看完全很简单(2023.4.11),但是对于之前什么都不会的我来说还是很有难度(还让老朴问了李大大大lao),数据预处理是第一步(去年都不会) 过程 只能说,随机森林是看了文献,直接套用代码上去的,所以权重都完全没有计算,菜的扣脚(老朴貌似都没有干啥!) 后言 首先,我早就应该发现jupyter的好用的!去…