内容提要

大数据处理系统必须关注存储、计算与容错问题。本书以此为起点,系统地介绍了 Hadoop 和Spark技术原理以及应用编程方法。本书主要内容包括:大数据概述、Hadoop和Spark原理、HDFS与HDFS API编程与应用、YARN与MapReduce API编程与应用、Spark Streaming和Spark SQL编程等。

本书旨在帮助初学者迅速掌握Hadoop和Spark原理及其应用,提升读者的大数据应用与开发能力,同时本书极强的系统性、可操作性以及大量精心设计的案例对于有一定基础的中高级读者有非常好的参考价值。