Spark大数据商业实战三部曲pdf下载pdf下载

Spark大数据商业实战三部曲百度网盘pdf下载

作者:
简介:本篇主要提供Spark大数据商业实战三部曲pdf下载
出版社:
出版时间:2018-02-01
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

基本信息

  • 商品名称:Spark大数据商业实战三部曲(内核解密商业案例性能调优)(精)
  • 作者:编者:王家林//段智华//夏阳
  • 定价:299
  • 出版社:清华大学
  • ISBN号:9787302489627

其他参考信息(以实物为准)

  • 出版时间:2018-02-01
  • 印刷时间:2018-02-01
  • 版次:1
  • 印次:1
  • 开本:16开
  • 包装:精装
  • 页数:1143
  • 字数:1815千字

内容提要

《Spark大数据商业实战三部曲:内核解密|商业案例|性能调优》基于Spark 2.2.X,以Spark商业案例实战和Spark在生产环境下几乎所有类型的性能调优为核心,以Spark内核解密为基石,分为上篇、中篇、下篇,对企业生产环境下的Spark商业案例与性能调优抽丝剥茧地进行剖析。上篇基于Spark源码,从一个动手实战案例入手,循序渐进地全面解析了Spark 2.2新特性及Spark内核源码;中篇选取Spark开发中*具有代表的经典学习案例,深入浅出地介绍,在案例中综合应用Spark的大数据技术;下篇性能调优内容基本**覆盖了Spark在生产环境下的所有调优技术。

作者简介

王家林,中国有名的Spark培训专家,ApacheSpark、Android技术中国区布道师,DT大数据梦工厂创始人和首席专家,Android软硬整合专家。深入研究了Spark中0.5.0到2.2.1中的共30个版本的Spark源码,尤其撞长Spark在生产环境下各种类型和场景的故陣排除和解决。目前致力于大数据Spark和人工智能TensorFlow的深度S合。
  段智华,就职于中国电信股份有限公司上海分公司,系统架构师,CSDNW客专家。专注于Spark大数据技术研发及准广,跟随Spark核心源码技术的发展,深入研究Spark2.1.1版本及Spark2.2.0版本的源码优化,对Spa......

目录

上篇 内核解密
第1章 电光石火间体验Spark 2.2开发实战
1.1 通过RDD实战电影点评系统入门及源码阅读
1.1.1 Spark核心概念图解
1.1.2 通过RDD实战电影点评系统案例
1.2 通过DataFrame和DataSet实战电影点评系统
1.2.1 通过DataFrame实战电影点评系统案例
1.2.2 通过DataSet实战电影点评系统案例
1.3 Spark 2.2源码阅读环境搭建及源码阅读体验
第2章 Spark 2.2技术及原理
2.1 Spark 2.2综述
2.1.1 连续应用程序
2.1.2 新的
2.2 Spark 2.2
2.2.1 第二代Tungsten引擎
2.2.2 SparkSe
2.2.3 累加器
2.3 Spark 2.
2.3.1 Spar
2.3.2 DataFrame和Datas
2.3.3 Timed Wi
2.4 Spark 2.2 Stre
2.4.1 Structured Stre
2.4.2 增量输出模式
2.5 Spark 2.2
2.5.1 基于DataFrame的Machine Learni
2.5.2 R的分布式算法
2.6 Spark 2.2 Gr
第3章 Spark的灵魂:RDD和D
3.1 为什么说RDD和DataSet是Spark的灵魂
3.1.1 RDD的定义及五大特性剖析
3.1.2 DataSet的定义及内部机制剖析
3.2 RDD弹性特性七个方面解析
3.3 RDD依赖关系
3.3.1 窄依赖解析
3.3.2 宽依赖解析
3.4 解析Spark中的DAG逻辑视图
3.4.1 DAG生成的机制
3.4.2 DAG逻辑视图解析
3.5 RDD内部的计算机制
3.5.1 Task解析
3.5.2 计算过程深度解析
3.6 Spark RDD容错原理及其四大核心要点解析
3.6.1 Spark RDD容错原理
3.6.2 RDD容错的四大核心要点
3.7 Spark RDD中Runtime流程解析
3.7.1 Runtime架构图
3.7.2 生命周期
3.8 通过WordCount实战解析Spark RDD内部机制
3.8.1 Spark WordCount动手实践