如何成为数据科学家？数据科学业界大牛们倾囊相授

2014年加入百度，先后带团队建设为百度地图6大Place场景做数据分析，后专注于百度外卖大数据生态从0开始孵化并最终完善。自主研发涉及到数据采集3大平台、开放式ETL4件套、OLAP分析平台、Adhoc、大数据分布式调度、数据集市、数据仓库等，另外技术驱动数十个辅助业务分析角色的分析挖掘平台。为大数据研发打造离线、实时数据整套解决方案，目前构建并推广AI学习平台系统；在AI和大数据技术创新层面，作为发明型专利第一发明人拥有44项发明。

李御玺

出版著作《智能化的流程管理》、《数据挖掘实用案例分析》以及教材《商务智能（第四版）》、《机器学习》、译作《商务智能数据分析的管理视角（第四版）》、《人机共生——洞察和规避数据分析中的机遇与误区》等10多部。获得上海市2015年上海市科技进步二等奖。

付波

王学武

设计并主持多项大数据与人工智能项目，项目内容涵盖多源异构数据自动化采集、交媒体舆情分析、多语言自然语言处理、图数据库集成与图算法应用等领域。长期为全球500强客户提供数据产品咨询，搭建企业级大数据平台与应用，在安全、交通、金融、媒体等行业的大数据项目管理方面有丰富经验。

教学案例

以上的实战派数据科学大佬们，也正式成为了CDA数据分析研究院荣誉科学家成员，共同参与制定CDA LEVEL 3数据科学家人才标准大纲及数据科学家精英培训，将自身在大数据发展这几年的实战成果，以教学案例的形式倾囊相授。案例包括：

案例一
大数据指标模型治理与实践

案例介绍：

大数据对业务数据ETL处理后，面临在数据仓库层面对业务词库定义、指标建模、元数据统一等问题；后期对外数据通过产品化和AdHoc方式交付数据，存在指标定义相同，但是语义理解存在较大偏差，如何进行指标模型的多口径计算逻辑统一，避免繁琐的人工维护和迭代，是本议题主张的部分；通过一处定义数据指标，多处交付统一的模型抽象、定义、训练和交付整体实践。

技能涉及：

元数据、大数据计算、ETL、数据建模、计算口径、血缘关系、语义理解、统一模型。

案例介绍：

文本分析(Text analysis)是文本挖掘、信息检索的一个基本问题。它将文本中抽取出的特征词进行量化，进而表示其文本信息。由于文本是由特定的人进行编撰的，文本的语义结构不可避免地会反映人的特定立场、观点、价值和利益。通过大量数据的支撑，并结合文本内容的分析，可以推断出文本编撰者的意图和目的，以进行各种不同场景应用。

技能涉及：

分词、词性标注、命名实体标订、情绪标订、词关联分析、文件分类、文件摘要、文件聚类、文字云

Lesson周期：

三个月，线上约20课时，线下50+课时（周末面授）

Lesson目标：

将数据分析师、数据工程师打造为数据科学家

2019年2月23日开学，限额30人哟，机不可失——https://www.cda.cn/kecheng/53.htmlo

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

如何成为数据科学家？数据科学业界大牛们倾囊相授

相关推荐