在给大家分享知识的过程中,发现很多入门同学在学习竞赛都存在较多的问题:
而上述问题都是一个合格算法工程师必备的,本月我们将组织一次推荐系统竞赛训练营活动,希望能够帮助大家入门数据竞赛。在活动中我们将布置具体竞赛任务,然后参与的同学们不断闯关完成,尽可能的帮助大家入门。
10月份的竞赛活动将以Kaggle Spaceship Titanic赛题展开。
为了激励各位同学完成的学习任务,将学习任务根据难度进行划分,并根据是否完成进行评分难度高中低的任务分别分数为3、2和1。在完成学习后(本次活动,截止10月31),将按照积分顺序进行评选 Top3 的学习者。
打卡链接:https://shimo.im/forms/Kjw4phUwT9gA96b4/fill
打卡可以写在一个地址,每次有新完成的可以重复提交打卡!
Top1的学习者将获得以下奖励:
Top2-3的学习者将获得以下奖励:
历史活动打卡链接,可以参考如下格式:
昵称 | 得分 |
---|---|
Amihua | 14 |
麻辣香郭 | 14 |
元白@ | 14 |
无盐 | 10 |
明日之盛,昨日之俗 | 7 |
阿墨 | 4 |
大D | 3 |
MD_o | 3 |
是光。 | 1 |
困得睡不着 | |
ka ka | |
🐯 | |
Elaine | |
nigelnew73 | |
阿鲁卡多 | |
hinswhale | |
夜象复生 | |
L. | |
noexp | |
没流量的雍老板 | |
小邢的宽客梦 | |
Survivor | |
宵宵 | |
simula67 | |
GotillaXKZ |
欢迎来到 2912 年,您需要数据科学技能来解决宇宙之谜。我们收到了四光年外的信号,情况看起来不太妙。宇宙飞船泰坦尼克号是一个月前发射的星际客轮。船上有近 13,000 名乘客,这艘船开始了处女航,将太阳系的移民运送到围绕附近恒星运行的三颗新可居住的系外行星。
在绕过半人马座阿尔法星前往它的第一个目的地——炎热的巨蟹座 55 E 时,粗心的宇宙飞船泰坦尼克号与隐藏在尘埃云中的时空异常相撞。可悲的是,它遭遇了与 1000 年前同名的命运相似的命运。虽然船完好无损,但几乎有一半的乘客被运送到了异次元!
为了帮助救援人员和找回丢失的乘客,您面临的挑战是使用从飞船损坏的计算机系统中恢复的记录来预测哪些乘客被异常运送。
在本次比赛中,您的任务是预测在泰坦尼克号飞船与时空异常相撞期间是否有乘客被运送到另一个维度。为了帮助你做出这些预测,你会得到一组从船上受损的计算机系统中恢复的个人记录。
文件说明:
字段说明:
评估方式:提交的内容是根据其分类准确度、预测标签正确的百分比来评估的。
比赛提交格式为csv文件,格式如下:
PassengerId,Transported
0013_01,False
0018_01,False
0019_01,False
0021_01,False
etc.
任务名称 | 难度 |
---|---|
任务1:比赛报名与尝试 | 低、1 |
任务2:比赛数据分析 | 中、2 |
任务3:验证集划分与树模型 | 中、2 |
任务4:特征工程入门 | 中、2 |
任务5:特征工程进阶 | 中、2 |
任务6:树模型进阶 | 中、2 |
任务7:多折训练与集成 | 高、3 |
任务1:报名比赛
任务2:比赛数据分析
任务3:验证集划分与树模型
任务4:特征工程入门
from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder(handle_unknown='ignore')
X = [['Male', 1], ['Female', 3], ['Female', 2]]
enc.fit(X)
enc.transform([['Female', 1], ['Male', 4]]).toarray()
import pandas as pd
df = pd.DataFrame({'A': ['a', 'b', 'a'], 'B': ['b', 'a', 'c'],
'C': [1, 2, 3]})
pd.get_dummies(df, prefix=['col1', 'col2'])
任务5:特征工程进阶
任务6:高阶树模型
任务7:多折训练与集成
© 2019-2023 coggle.club 版权所有 京ICP备20022947 京公网安备 11030102010643号