全面系统介绍Spark源码,提供分析源码的实用技巧和合理的阅读顺序,充分了解Spark的设计思想和运行机理!
许鹏 著
ISBN 978-7-121-25420-8
2015年3月出版
定价:68.00元
304页
16开
Spark Contributor,1.本书全面、系统地介绍了2.提供给读者一系列分析源码的实用技巧,并给出一个合理的阅读顺序
3.始终抓住资源分配、消息传递、容错处理等基本问题,抽丝拨茧
4.一步步寻找答案,所有问题迎刃而解,使读者知其然更知其所以然
内容提要
《目录
第一部分
6.1 Spark Streaming整体架构6.1.1 DStream 132
6.1.2 编程接口6.1.3 Streaming WordCount 134
6.2 Spark Streaming执行过程6.2.1 StreamingContext初始化过程6.2.2 数据接收6.2.3 数据处理6.2.4 BlockRDD 155
6.3 窗口操作6.4 容错性分析6.5 Spark Streaming vs. Storm 165
6.5.1 Storm简介6.5.2 Storm和6.6 应用举例6.6.1 搭建6.6.2 KafkaWordCount 169
第
8.1 GraphX简介8.1.1 主要特点8.1.2 版本演化8.1.3 应用场景8.2 分布式图计算处理技术介绍8.2.1 属性图8.2.2 图数据的存储与分割8.3 Pregel计算模型8.3.1 BSP 220
8.3.2 像顶点一样思考8.4 GraphX图计算框架实现分析8.4.1 基本概念8.4.2 图的加载与构建8.4.3 图数据存储与分割8.4.4 操作接口8.4.5 Pregel在8.5 PageRank 235
8.5.1 什么是8.5.2 PageRank核心思想连城
介绍 ——华为大数据平台开发部部长汪源
Spark目前正在蓬勃发展,越来越多的公司把大数据计算任务迁移到 ——前言
笔者接触Storm源码分析期间,笔者还学习了Spark源码采用Spark的整体框架非常庞大,涵盖的范围也很广,随着笔者在工作中使用得越来越具体,这样的感受也越来越深。另外,必须要说对于
许 鹏
2015年
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!