课程汇总

这里是数据科学相关的课程和学习资源,页面展示课程个数:9

创建时间:20210901  更新时间:20231201

竞赛学习

我们将从本月组织一次竞赛训练营活动,希望能够帮助大家入门数据竞赛。在活动中我们将布置具体竞赛任务,然后参与的同学们不断闯关完成,竟可能的帮助大家入门。
第1章:2024-01月(动手学RAG)
第2章:2023-09月(时序回归预测)
第3章:2023-08月(高效使用ChatGPT)
第4章:2023-07月(ChatGPT检测器)
第5章:2023-06月(图像分类和语义分割)
第6章:2023-04月(图像检索与匹配)
第7章:2023-03月(对话意图识别)
第8章:2023-02月(图分析与图节点嵌入)
第9章:2023-01月(文本匹配)
第10章:2022-12月(新闻推荐系统)
第11章:2022-10月(Spaceship Titanic)
第12章:2022-08月(华为推荐系统)
第13章:2022-07月(数据挖掘&NLP)
第14章:2022-05月(Transformers)
第15章:2022-04月(推荐系统)
第16章:2022-03月(网络编程&Spark)
第17章:2022-01月(LightGBM&文本匹配)
第18章:2021-12月(Pandas&反欺诈)
第19章:2021-11月(Linux&Pytorch)
第20章:2021-10月(结构化&CV&NLP)

创建时间:20210125  更新时间:20210407

数据分析 交通数据

比赛链接:https://data.xm.gov.cn/contest-series/digit-china-2021/
本专题赛以“数聚赋能 众智成城”为主题,征集基于城市管理大数据领域的算法模型和创新应用解决方案。旨在通过城市管理与大数据的融合,针对当前城市管理的难点和痛点,以共享单车管理为切入点,发掘出一系列城市智能管理创新项目,切实巩固提升城市精细化、智能化、人性化管理水平,推进基于大数据的城市智能管理项目的落地与发展,树立城市治理体系与治理能力现代化标杆,不断提升数字产业集聚高地影响力。
第1章:学习目录
第2章:赛题介绍
第3章:赛题任务解析
第4章:共享单车潮汐点分析
第5章:共享单车潮汐点建议
第6章:共享单车调度方案
第7章:单车畅行友好度方案

创建时间:20210215  更新时间:20210316

计算机视觉 语义分割

赛题以计算机视觉为背景,要求选手使用给定的航拍图像训练模型并完成地表建筑物识别任务。为更好的引导大家入门,我们为本赛题定制了学习方案和学习任务,具体包括语义分割的模型和具体的应用案例。在具体任务中我们将讲解具体工具和使用和完成任务的过程。
第1章:学习说明
第2章:赛题理解
第3章:数据扩增方法
第4章:网络模型结构发展
第5章:评价函数与损失函数
第6章:模型训练与验证
第7章:模型集成

创建时间:20201001  更新时间:20210201

数据分析

赛题以数据分析为背景,要求选手使用公开的arXiv论文完成对应的数据分析操作。与之前的数据挖掘赛题不同,本次赛题不仅要求选手对数据进行建模,而且需要选手利用赛题数据完成具体的可视化分析。
第1章:任务介绍
第2章:论文数据统计
第3章:论文作者统计
第4章:论文代码统计
第5章:论文种类分类
第6章:作者信息关联

创建时间:20200724  更新时间:20201128

时序数据 结构化数据

本次大赛以“互联工业·赋能赋智”为主题,由中国信息通信研究院、国网湖南省电力有限公司联合主办,华为、富士康工业互联网股份有限公司、北京工业大数据创新中心、国家电投集团大数据公司协办。昆仑智汇数据科技和天泽智云为此次大赛提供技术支持。
第1章:学习目录
第2章:赛题介绍

创建时间:20200902  更新时间:20201002

数据分析 交通数据

比赛链接:https://data.xm.gov.cn/opendata-competition/
出租车每天的运营中会产生大量的上下车点位相关信息,对这些数据进行科学合理的关联和挖掘,对比在工作日以及休息日、节假日的出租车数据的空间分布及其动态变化,对出租车候车泊位、管理调度和居民通勤特征的研究具有重要意义。
第1章:学习目录
第2章:赛题介绍
第3章:任务0-准备工作
第4章:任务1-数据读取
第5章:任务2-数据与可视化
第6章:任务3-地图数据统计
第7章:任务4-订单数据统计
第8章:任务5-订单调度分析
第9章:任务6-分析报告撰写

创建时间:20200801  更新时间:20200905

文本分类 机器学习 NLP

赛题链接:https://tianchi.aliyun.com/competition/entrance/531810/introduction
通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。
第1章:赛题理解
第2章:数据读取与数据分析
第3章:基于机器学习的文本分类
第4章:基于深度学习的文本分类1
第5章:基于深度学习的文本分类2
第6章:基于深度学习的文本分类3

创建时间:20200512  更新时间:20200712

CV 字符识别

比赛链接:https://tianchi.aliyun.com/competition/entrance/531795/introduction
本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第二场 —— 零基础入门CV赛事之街景字符识别。赛题以计算机视觉中字符识别为背景,要求选手预测真实场景下的字符识别,这是一个典型的字符识别问题。通过这道赛题可以引导大家走入计算机视觉的世界,主要针对竞赛选手上手视觉赛题,提高对数据建模能力。
第1章:baseline
第2章:赛题理解
第3章:数据读取与数据扩增
第4章:字符识别模型
第5章:模型训练与验证
第6章:模型集成

创建时间:20200440  更新时间:20200640

结构化

比赛链接:https://tianchi.aliyun.com/competition/entrance/231784/introduction
本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第一场 —— 零基础入门数据挖掘之二手车交易价格预测大赛。赛题以二手车市场为背景,要求选手预测二手汽车的交易价格,这是一个典型的回归问题。通过这道赛题来引导大家走进AI数据竞赛的世界,主要针对于于竞赛新人进行自我练习。
第1章:Baseline
第2章:赛题理解
第3章:数据分析
第4章:特征工程
第5章:模型调参
第6章:模型融合

© 2019-2023 coggle.club 版权所有     京ICP备20022947    京公网安备 11030102010643号