Spark大数据技术与应用pdf下载pdf下载

Spark大数据技术与应用百度网盘pdf下载

作者:
简介:本篇主要提供Spark大数据技术与应用pdf下载
出版社:
出版时间:2019-04-01
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

基本信息

  • 商品名称:Spark大数据技术与应用(数据科学与大数据技术专业系列规划教材)
  • 作者:编者:赵红艳//许桂秋
  • 定价:39.8
  • 出版社:人民邮电
  • ISBN号:9787115503473

其他参考信息(以实物为准)

  • 出版时间:2019-04-01
  • 印刷时间:2019-04-01
  • 版次:1
  • 印次:1
  • 开本:16开
  • 包装:平装
  • 页数:132
  • 字数:214千字

目录

第1章 Spark简介与运行原理
1.1 Spark是什么
1.1.1 Spark的版本发展历程
1.1.2 Spark与Hadoop的区别与联系
1.1.3 Spark的应用场景
1.2 Spark的生态系统
1.3 Spark的架构与原理
1.3.1 Spark架构设计
1.3.2 Spark作业运行流程
1.3.3 Spark分布式计算流程
1.4 Spark 2.X新特性
1.4.1 精简的API
1.4.2 Spark作为编译器
1.4.3 智能化程度
1.5 小结
习题
第2章 Spark的环境搭建
2.1 环境搭建前的准备
2.2 Spark相关配置
2.2.1 安装SSH
2.2.2 SSH免密码登录
2.2.3 修改访问权限
2.2.4 修改profile文件
2.2.5 修改Spark配置文件
2.3 Spark集群启动与关闭
2.4 Spark应用提交到集群
2.5 Spark Web监控页面
2.6 小结
习题
第3章 使用Python开发Spark应用
3.1 Python编程语言
3.1.1 Python语言介绍
3.1.2 PySpark是什么
3.2 PySpark的启动与日志设置
3.2.1 PySpark的启动方式
3.2.2 日志输出内容控制
3.3 PySpark开发包的安装
3.3.1 使用pip命令安装
3.3.2 使用离线包安装
3.4 使用PyCharm编写Spark应用
3.4.1 PyCharm的安装与基本配置
3.4.2 编写Spark应用
3.5 小结
习题
第4章 Spark RDD
4.1 弹性分布式数据集
4.1.1 RDD的定义
4.1.2 RDD的特点
4.1.3 RDD的创建
4.1.4 RDD的操作