任务6:分析报告撰写
发布时间:2020-09-07,作者:阿水, 鱼遇雨欲语与余
## 学习目标
- 分析报告要点;
- 完成具体分析要求;
- 完成分析报告;
## 分析报告撰写
数据分析报告要有一个清晰的架构,层次分明能降低阅读成本,有助于信息的传达。虽然不同类型的分析报告有其适用的呈现方式,但总的来说作为议论文的一种,大部分的分析报告还是适用总-分-(总) 的结构。
本次DCIC2020详细分析报告要求为:以PDF形式提交,所有素材包括但不限于文字、图片、视频、网站等均需为中文,网站/视频素材可在方案里指明网站或视频链接地址。所提交方案要求设计架构完整、逻辑清晰,确保技术可行和可落地,内容可包括但不限于:
- 作品摘要:对作品做整体介绍。
- 问题需求:分析赛题问题的特征、场景、痛点,清楚说明所解决的问题和受众。
- 数据应用:清楚列举使用到的数据清单、数据分析细节以及安全保障等。
- 算法分析:阐述算法整体架构、重点描述任务数据清洗、特征构建、信息挖掘、关系关联、过程可视化、算法应用融合等各阶段的主要技术、方法、流程和关键实现代码。
- 结果及结果分析:说明算法的使用方法,基于算法模型及赛题数据输出的模型分析结果集、评测成绩,以及针对结果的分析说明等。
- 应用成果:详细说明作品的预期应用成果。
- 作品价值:说明作品的潜在社会效益和经济效益,指出方案的独特价值和亮点。
- 实施建议:结合赛题分析结果,提出可行性实施建议等。
- 参考文献:列举参考的文章、书目等。
参考样例:2020年Q1滴滴出行城市交通出行报告
## 报告撰写建议
在赛题分析报告中,不能只是侧重分析,措施建议类、策略性的篇幅比例建议不低于30%,数据模型算法挖掘、数据分析结果不低于50%。
- 围绕赛题要求写,统计分析、结果对比和建议举措;
- 图要清晰美观,标注详细;
- 表要直接间接,数据竟可能正确;
- 赛题说明:出租车作为城市客运交通系统的重要组成部分,以高效、便捷、灵活等优点深受居民青睐。出租车每天的运营中会产生大量的上下车点位相关信息,对这些数据进行科学合理的关联和挖掘,对比在工作日以及休息日、节假日的出租车数据的空间分布及其动态变化,对出租车候车泊位、管理调度和居民通勤特征的研究具有重要意义。
- 出租车/网约车:上下车地点挖掘;
- 出租车/网约车:不同日期的空间变化;
- 出租车/网约车:泊车和调度问题;
- 赛题任务:参赛者需依据赛事方提供的出租车(包括巡游车和网约车)GPS和订单数据
- 一综合应用统计分析方法分别对所提供的巡游车和网约车运营的时间、空间分布特征进行量化计算,包括计算2年的每年工作日取日平均,非工作日取日平均和节假日取日平均,三种类型各自平均的时变分布变化,三种时间类型按网格划分的平均空间分布(网格划分颗粒度选手自选),并分别对比分析所提供的网约车、巡游车,计算2年每年按工作日取日平均,非工作日取日平均和节假日取日平均三种类型的日均空驶率、订单平均运距、订单平均运行时长、上下客点分布密度等时变特性
- 是根据巡游车和网约车的时空运营特征,并尝试对巡游车与网约车的融合发展提出相关建议。在分析过程,参赛者必须用到但不局限于提供的数据,可自行加入自有数据进行参赛,但需说明自带数据来源并保证数据合法合规使用
通过赛题理解&数据分析,参赛选手需要回答上述问题:
- 每年工作日取日平均,非工作日取日平均和节假日取日平均,三种情况下出租车&网约车:
- 运营时间规律:出车时间和运行时间;
- 空间分布规律:城市分布规律,订单分布规律;
- 日均空驶率:空驶里程(没有载客)在车辆总运行里程中所占的比例;
- 订单平均运距:订单平均距离计算;
- 订单平均运行时长:订单平时时长计算;
- 上下客点分布密度:上下车位置分布;
- 对出租车&网约车的调度、融合发展提出建议:
- 如何进行订单调度?识别打不到车的位置;
- 如何进行停车场推荐?
- 订单差异性分析?
分析报告简单版本:仅供参考
## 学习内容总结
通过6次任务学习,基本上大家都可以掌握基本的数据分析要点:
Pandas
基础;
- 数据分析流程;
- 数据可视化细节;
虽然本次学习的周期并不长,但任务非常明确。在学习的过程中,希望大家能从中收获到一些东西;
## 学习资源
- 分析报告模板
- 数据分析规范总结
## 课堂任务
- 除去任务1-任务4对分析思路,你还能想到哪些点(结合学习任务,也可以扩展)?
- 如何做一个交互式展示大屏?
## 打卡任务
- 你在学习完本次任务后,还有没有其他想学习的?
- 完成报告撰写,并进行提交;