Spark大数据分析实战|64123pdf下载pdf下载

Spark大数据分析实战|64123百度网盘pdf下载

作者:
简介:本篇主要提供Spark大数据分析实战|64123pdf下载
出版社:
出版时间:2016-01-01
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍


 书名:  Spark大数据分析实战|64123
 图书定价:  59元
 图书作者:  高彦杰;倪亚宇
 出版社:  机械工业出版社
 出版日期:  2016/1/1 0:00:00
 ISBN号:  9787111523079
 开本:  16开
 页数:  213
 版次:  1-1
 作者简介
高彦杰,毕业于中国人民大学,就职于微软亚洲研究院。开源技术爱好者,对spark及其他开源大数据系统与技术有较为深入的认识和研究,实践经验丰富。较早接触并使用spark,对spark应用开发、spark系统的运维和测试比较熟悉.深度阅读了spark的源代码,了解spark的运行机制,擅长spark的查询优化。 曾*有畅销书《spark大数据处理:技术、应用与性能优化》。 倪亚宇,清华大学自动化系在读博士研究生,曾于微软亚洲研究院、IBM研究院实习。对大规模的推荐系统和机器学习算法有较为深入的研究和丰富的实践经验。
 内容简介
高彦杰、倪亚宇编*的《Spark大数据分析实战》是一本根据应用场景讲解如何通过Spark进行大数据分析与应用构建的*作,以实战为导向。作者结合典型应用场景,抽象出通用与简化后的模型,以便于读者能举一反三,直接应用。
本书首先从技术层面讲解了Spark的机制、生态系统与开发相关的内容;然后从应用角度讲解了日志分析、推荐系统、情感分析、协同过滤、搜索引擎、社交网络分析、新闻数据分析等多个常见的大数据场景下的数据分析。在每个场景中,首先是对场景进行抽象与概括,然后将Spark融入其中构建数据分析算法与应用,*后结合其他开源系统或工具构建*为丰富的数据分析流水线。
 目录

前言
第1章 Spark简介
1.1 初识Spark
1.2 Spark生态系统BDAS
1.3 Spark架构与运行逻辑
1.4 弹性分布式数据集
1.4.1 RDD简介
1.4.2 RDD算子分类
1.5 本章小结
第2章 Spark开发与环境配置
2.1 Spark应用开发环境配置
2.1.1 使用Intellij开发Spark程序
2.1.2 使用SparkShell进行交互式数据分析
2.2 远程调试Spark程序
2.3 Spark编译
2.4 配置Spark源码阅读环境
2.5 本章小结
第3章 BDAS简介
3.1 SQL on Spark
3.1.1 为什么使用Spark SQL
3.1.2 Spark SQL架构分析
3.2 Spark Streaming
3.2.1 Spark Streaming简介
3.2.2 Spark Streaming架构
3.2.3 Spark Streaming原理剖析
3.3 GraphX
3.3.1 GraphX简介
3.3.2 GraphX的使用简介
3.3.3 GraphX体系结构
3.4 MLlib
3.4.1 MLlib简介
3.4.2 MLlib中的聚类和分类
3.5 本章小结
第4章 Lamda架构日志分析流水线
4.1 日志分析概述
4.2 日志分析指标
……
第5章 基于云平台和用户日志的推荐系统
第6章 Twitter情感分析
第7章 热点新闻分析系统
第8章 构建分布式的协同过滤推荐系统
第9章 基于Spark的社交网络分析
第10章 基于Spark的大规模新闻主题分析
第11章 构建分布式的搜索引擎
 编辑推荐
Spark已经在全球范围内被广泛使用,无论是微软、Intel、阿里巴巴、百度、腾讯等国际互联网巨头,还是一些初创公司,都在使用Spark。《Spark大数据分析实战》作者结合实战经验,编写了《Spark大数据分析实战》。《Spark大数据分析实战》抽象出典型数据分析应用场景,适当简化,只进行主干介绍,讲解Spark应用开发、数据分析算法,并结合其他开源系统与组件,勾勒出数据分析流水线全貌。