这里是数据科学相关的课程和学习资源,页面展示课程个数:9
创建时间:20210901 更新时间:20231201 |
竞赛学习 |
我们将从本月组织一次竞赛训练营活动,希望能够帮助大家入门数据竞赛。在活动中我们将布置具体竞赛任务,然后参与的同学们不断闯关完成,竟可能的帮助大家入门。 | |
第1章:2024-01月(动手学RAG) 第2章:2023-09月(时序回归预测) 第3章:2023-08月(高效使用ChatGPT) 第4章:2023-07月(ChatGPT检测器) 第5章:2023-06月(图像分类和语义分割) 第6章:2023-04月(图像检索与匹配) 第7章:2023-03月(对话意图识别) 第8章:2023-02月(图分析与图节点嵌入) 第9章:2023-01月(文本匹配) 第10章:2022-12月(新闻推荐系统) 第11章:2022-10月(Spaceship Titanic) 第12章:2022-08月(华为推荐系统) 第13章:2022-07月(数据挖掘&NLP) 第14章:2022-05月(Transformers) 第15章:2022-04月(推荐系统) 第16章:2022-03月(网络编程&Spark) 第17章:2022-01月(LightGBM&文本匹配) 第18章:2021-12月(Pandas&反欺诈) 第19章:2021-11月(Linux&Pytorch) 第20章:2021-10月(结构化&CV&NLP) |
创建时间:20210125 更新时间:20210407 |
数据分析 交通数据 |
比赛链接:https://data.xm.gov.cn/contest-series/digit-china-2021/ 本专题赛以“数聚赋能 众智成城”为主题,征集基于城市管理大数据领域的算法模型和创新应用解决方案。旨在通过城市管理与大数据的融合,针对当前城市管理的难点和痛点,以共享单车管理为切入点,发掘出一系列城市智能管理创新项目,切实巩固提升城市精细化、智能化、人性化管理水平,推进基于大数据的城市智能管理项目的落地与发展,树立城市治理体系与治理能力现代化标杆,不断提升数字产业集聚高地影响力。 |
|
第1章:学习目录 第2章:赛题介绍 第3章:赛题任务解析 第4章:共享单车潮汐点分析 第5章:共享单车潮汐点建议 第6章:共享单车调度方案 第7章:单车畅行友好度方案 |
创建时间:20210215 更新时间:20210316 |
计算机视觉 语义分割 |
赛题以计算机视觉为背景,要求选手使用给定的航拍图像训练模型并完成地表建筑物识别任务。为更好的引导大家入门,我们为本赛题定制了学习方案和学习任务,具体包括语义分割的模型和具体的应用案例。在具体任务中我们将讲解具体工具和使用和完成任务的过程。 | |
第1章:学习说明 第2章:赛题理解 第3章:数据扩增方法 第4章:网络模型结构发展 第5章:评价函数与损失函数 第6章:模型训练与验证 第7章:模型集成 |
创建时间:20201001 更新时间:20210201 |
数据分析 |
赛题以数据分析为背景,要求选手使用公开的arXiv论文完成对应的数据分析操作。与之前的数据挖掘赛题不同,本次赛题不仅要求选手对数据进行建模,而且需要选手利用赛题数据完成具体的可视化分析。 | |
第1章:任务介绍 第2章:论文数据统计 第3章:论文作者统计 第4章:论文代码统计 第5章:论文种类分类 第6章:作者信息关联 |
创建时间:20200724 更新时间:20201128 |
时序数据 结构化数据 |
本次大赛以“互联工业·赋能赋智”为主题,由中国信息通信研究院、国网湖南省电力有限公司联合主办,华为、富士康工业互联网股份有限公司、北京工业大数据创新中心、国家电投集团大数据公司协办。昆仑智汇数据科技和天泽智云为此次大赛提供技术支持。 | |
第1章:学习目录 第2章:赛题介绍 |
创建时间:20200902 更新时间:20201002 |
数据分析 交通数据 |
比赛链接:https://data.xm.gov.cn/opendata-competition/ 出租车每天的运营中会产生大量的上下车点位相关信息,对这些数据进行科学合理的关联和挖掘,对比在工作日以及休息日、节假日的出租车数据的空间分布及其动态变化,对出租车候车泊位、管理调度和居民通勤特征的研究具有重要意义。 |
|
第1章:学习目录 第2章:赛题介绍 第3章:任务0-准备工作 第4章:任务1-数据读取 第5章:任务2-数据与可视化 第6章:任务3-地图数据统计 第7章:任务4-订单数据统计 第8章:任务5-订单调度分析 第9章:任务6-分析报告撰写 |
创建时间:20200801 更新时间:20200905 |
文本分类 机器学习 NLP |
赛题链接:https://tianchi.aliyun.com/competition/entrance/531810/introduction 通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。 |
|
第1章:赛题理解 第2章:数据读取与数据分析 第3章:基于机器学习的文本分类 第4章:基于深度学习的文本分类1 第5章:基于深度学习的文本分类2 第6章:基于深度学习的文本分类3 |
创建时间:20200512 更新时间:20200712 |
CV 字符识别 |
比赛链接:https://tianchi.aliyun.com/competition/entrance/531795/introduction 本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第二场 —— 零基础入门CV赛事之街景字符识别。赛题以计算机视觉中字符识别为背景,要求选手预测真实场景下的字符识别,这是一个典型的字符识别问题。通过这道赛题可以引导大家走入计算机视觉的世界,主要针对竞赛选手上手视觉赛题,提高对数据建模能力。 |
|
第1章:baseline 第2章:赛题理解 第3章:数据读取与数据扩增 第4章:字符识别模型 第5章:模型训练与验证 第6章:模型集成 |
创建时间:20200440 更新时间:20200640 |
结构化 |
比赛链接:https://tianchi.aliyun.com/competition/entrance/231784/introduction 本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第一场 —— 零基础入门数据挖掘之二手车交易价格预测大赛。赛题以二手车市场为背景,要求选手预测二手汽车的交易价格,这是一个典型的回归问题。通过这道赛题来引导大家走进AI数据竞赛的世界,主要针对于于竞赛新人进行自我练习。 |
|
第1章:Baseline 第2章:赛题理解 第3章:数据分析 第4章:特征工程 第5章:模型调参 第6章:模型融合 |
© 2019-2023 coggle.club 版权所有 京ICP备20022947 京公网安备 11030102010643号