2014年加入百度,先后带团队建设为百度地图6大Place场景做数据分析,后专注于百度外卖大数据生态从0开始孵化并最终完善。自主研发涉及到数据采集3大平台、开放式ETL4件套、OLAP分析平台、Adhoc、大数据分布式调度、数据集市、数据仓库等,另外技术驱动数十个辅助业务分析角色的分析挖掘平台。为大数据研发打造离线、实时数据整套解决方案,目前构建并推广AI学习平台系统;在AI和大数据技术创新层面,作为发明型专利第一发明人拥有44项发明。
李御玺
出版著作《智能化的流程管理》、《数据挖掘实用案例分析》以及教材《商务智能(第四版)》、《机器学习》、译作《商务智能 数据分析的管理视角(第四版)》、《人机共生——洞察和规避数据分析中的机遇与误区》等10多部。获得上海市2015年上海市科技进步二等奖。
付波
王学武
设计并主持多项大数据与人工智能项目,项目内容涵盖多源异构数据自动化采集、 交媒体舆情分析、多语言自然语言处理、图数据库集成与图算法应用等领域。长期为全球500强客户提供数据产品咨询,搭建企业级大数据平台与应用,在安全、交通、金融、媒体等行业的大数据项目管理方面有丰富经验。
教学案例
以上的实战派数据科学大佬们,也正式成为了CDA数据分析研究院荣誉科学家成员,共同参与制定CDA LEVEL 3数据科学家人才标准大纲及数据科学家精英培训,将自身在大数据发展这几年的实战成果,以教学案例的形式倾囊相授。案例包括:
案例一
大数据指标模型治理与实践
案例介绍:
大数据对业务数据ETL处理后,面临在数据仓库层面对业务词库定义、指标建模、元数据统一等问题;后期对外数据通过产品化和AdHoc方式交付数据,存在指标定义相同,但是语义理解存在较大偏差,如何进行指标模型的多口径计算逻辑统一,避免繁琐的人工维护和迭代,是本议题主张的部分;通过一处定义数据指标,多处交付统一的模型抽象、定义、训练和交付整体实践。
技能涉及:
元数据、大数据计算、ETL、数据建模、计算口径、血缘关系、语义理解、统一模型。
案例介绍:
文本分析(Text analysis)是文本挖掘、信息检索的一个基本问题。它将文本中抽取出的特征词进行量化,进而表示其文本信息。由于文本是由特定的人进行编撰的,文本的语义结构不可避免地会反映人的特定立场、观点、价值和利益。通过大量数据的支撑,并结合文本内容的分析,可以推断出文本编撰者的意图和目的,以进行各种不同场景应用。
技能涉及:
分词、词性标注、命名实体标订、情绪标订、词关联分析、文件分类、文件摘要、文件聚类、文字云
Lesson周期:
三个月,线上约20课时,线下50+课时(周末面授)
Lesson目标:
将数据分析师、数据工程师打造为数据科学家
2019年2月23日开学,限额30人哟,机不可失——https://www.cda.cn/kecheng/53.htmlo
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!