会员
深入理解Spark:核心思想与源码分析
计算机网络软件工程及软件方法学14.3万字
更新时间:2019-01-01 01:29:39 最新章节:附录H 源码编译错误
书籍简介
本书不会教你如何开发Spark应用程序,只是用一些经典例子演示。本书简单介绍HadoopMapReduce、HadoopYARN、Mesos、Tachyon、ZooKeeper、HDFS、AmazonS3,但不会过多介绍这些框架的使用,因为市场上已经有丰富的这类书籍供读者挑选。本书也不会过多介绍Scala、Java、Shell的语法,读者可以在市场上选择适合自己的书籍阅读。本书最后还添加了几个附录,包括:附录A介绍的Spark中最常用的工具类Utils;附录B是Akka的简介与工具类AkkaUtils的介绍;附录C为Jetty的简介和工具类JettyUtils的介绍;附录D为Metrics库的简介和测量容器MetricRegistry的介绍;附录E演示了Hadoop1.0版本中的wordcount例子;附录F介绍了工具类CommandUtils的常用方法;附录G是关于Netty的简介和工具类NettyUtils的介绍;附录H列举了笔者编译Spark源码时遇到的问题及解决办法。
品牌:机械工业出版社
上架时间:2015-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
耿嘉安
- 会员本书对Spark内部高度抽象的数据结构RDD、分布式DAG调度器/驱动器,以及高效的基于Non-blockingIO分布式计算框架Akka/Netty等内核设计进行了深度剖析,不可多得,是适合大型分布式计算架构师和资深开源贡献者阅读的参考书。程序设计25.2万字
同类热门书
最新上架
- 会员本书基于软件测试过程模型,构建软件测试价值模型、能力模型及基于能力战略的软件测试策略框架,讨论软件测试终止、测试预言、测试生成问题。基于图结构、图元素及软件失效行为,介绍逻辑驱动、数据驱动、剖面驱动的基础理论、基础技术及实践者方法。基于技术创新及软件测试发展需求,构建面向服务、大数据及应用、软硬件一体化测试的技术框架,讨论基于服务模型的形式化描述及求解、服务实体及基于时间波动的服务实时性测试、大数计算机43.9万字
- 会员本书详细介绍了可用于数据处理的表格格式、云产品、框架、存储层,以及如何将这些内容组合在一起,以获得适合自己需求的高性能解决方案。作者在书中提供的决策框架将帮助你明智地决定选择哪种数据湖。本书是大数据领域每个人的必读书。阅读本书后,你将了解构建云数据湖所需的所有基础知识,并能够以多种方式应用这些知识。本书主要面向数据架构师、数据开发人员和数据运维专业人员,他们希望广泛地了解设置和运营云数据湖的各个方计算机10.7万字