书籍 Apache Spark源码剖析的封面

Apache Spark源码剖析

许鹏

出版时间

2015-03-01

ISBN

9787121254208

评分

★★★★★
书籍介绍
《Apache Spark源码剖析》以Spark 1.02版本源码为切入点,着力于探寻Spark所要解决的主要问题及其解决办法,通过一系列精心设计的小实验来分析每一步背后的处理逻辑。 《Apache Spark源码剖析》第3~5章详细介绍了Spark Core中作业的提交与执行,对容错处理也进行了详细分析,有助读者深刻把握Spark实现机理。第6~9章对Spark Lib库进行了初步的探索。在对源码有了一定的分析之后,读者可尽快掌握Spark技术。 《Apache Spark源码剖析》对于Spark应用开发人员及Spark集群管理人员都有极好的学习价值;对于那些想从源码学习而又不知如何入手的读者,也不失为一种借鉴。 许鹏:长期致力于电信领域和互联网的软件研发,在数据处理方面积累了大量经验,对系统的可扩展性、可靠性方面进行过深入学习和研究。因此,累积了大量的源码阅读和分析的技巧与方法。目前在杭州同盾科技担任大数据平台架构师一职。对于Linux内核,作者也曾进行过深入的分析。
目录
前言
第一部分 Spark概述
第1章 初识Spark
1.1 大数据和Spark
1.2 与Spark的第一次亲密接触

显示全部
用户评论
作者自己也不知道自己在写些什么。 来面试被拒了。
我的意见是很一般般!讲基本原理的部分没有讲太清楚,含含糊糊的,讲底层的时候全是大段的代码,让人云里雾里。
贴代码太多,图例和讲解太少,但好在基本讲清楚,后面对Streaming、SQL、GraphX、Mllib基本讲解也不错。(2015.6.2jd)
可读性较差,写得比较浅,大段贴代码
有所收获,但是这本书的讲解确实太粗略了。我觉得如果三四百页都用来讲解spark-core差不多。简单地列出代码加上些许讲解,这能称为源码剖析?
Spark 1.x源码。
支持的是1.0版本,有点老,配合官方文档一起食用