Alluxio大数据统一存储原理与实践pdf下载pdf下载

Alluxio大数据统一存储原理与实践百度网盘pdf下载

作者:
简介:本篇主要提供Alluxio大数据统一存储原理与实践pdf下载
出版社:
出版时间:2019-08-01
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

作  者:范斌,顾荣 著
定  价:79
出 版 社:电子工业出版社
出版日期:2019年08月01日
页  数:199
装  帧:平装
ISBN:9787121367823
目录
章Alluo系统快速入门1
1.1Alluo背景概述1
1.1.1Alluo系统功能简介4
1.1.2Alluo项目发展历史5
1.2获取/编译Alluo软件6
1.2.1下载预编译的Alluo可执行包6
1.2.2编译Alluo源代码6
1.3Alluo的搭建部署及程序运行10
1.3.1单机模式10
1.3.2集群模式13
1.3.3高可用集群模式16
第2章Alluo系统架构及读写工作机制22
2.1Alluo的构架简介与基本特征22
2.1.1提升远程存储读写性能23
2.1.2统一持久化数据访问接口24
2.1.3数据的快速复用和共享26
2.2Alluo的系统功能组件27
2.2.1AlluoMaster组件27
2.2.2AlluoWorker组件29
2.2.3AlluoClient组件30
2.3Alluo读写场景的行为分析31
2.3.1Alluo的读场景数据流31
2.3.2Alluo的写场景数据流37
第3章Alluo与底层存储系统的集成40
3.1配置HDFS作为Alluo底层存储40
3.1.1准备步骤与基本配置流程41
3.1.2不错参数配置43
3.1.3使用HDFS在本地运行Alluo44
3.2配置SecureHDFS作为Alluo底层存储44
3.2.1准备步骤与基本配置流程45
3.2.2使用安全认证模式HDFS在本地运行Alluo46
3.3配置AWSS3作为Alluo底层存储47
3.3.1准备步骤与基本配置流程47
3.3.2不错参数配置49
3.3.3使用S3在本地运行Alluo51
3.4配置GoogleGCS作为Alluo底层存储52
3.4.1准备步骤与基本配置流程52
3.4.2不错参数配置53
3.4.3使用GCS本地运行Alluo54
3.5配置AzureBLOBStore作为Alluo底层存储系统55
3.5.1准备步骤与基本配置流程55
3.5.2使用AzureBLOBStore本地运行Alluo57
第4章Alluo与上层计算框架的集成58
4.1Alluo的管理员操作命令58
4.1.1操作命令列表59
4.1.2操作命令示例59
4.2Alluo的用户操作命令61
4.2.1操作命令列表62
4.2.2操作命令示例65
4.3Alluo与Hadoop操作命令行的集成78
4.3.1前期准备与配置78
4.3.2具体使用示例79
4.4Alluo与HadoopMapReduce的集成79
4.4.1前期准备与配置80
4.4.2具体使用示例82
4.5Alluo与Spark的集成83
4.5.1前期准备与配置83
4.5.2使用Alluo作为输入/输出源85
4.5.3Alluo与Spark集成常见问题分析与解决86
4.6Alluo与Hive的集成89
4.6.1安装并配置Hive环境89
4.6.2使用Alluo存储部分Hive表90
4.6.3使用Alluo作为默认文件系统(存储全部数据)93
4.检查Hive和Alluo的集成情况(支持Hive2.x)95
4.7Alluo与Presto的集成96
4.7.1前期准备96
4.7.2部署分发Alluo客户端jar包98
4.7.3Presto操作命令示例98
4.8Alluo与TensorFlow的集成100
4.8.1深度学习面临的数据挑战100
4.8.2基于Alluo解决深度学习存储问题的分析101
4.8.3安装并配置AlluoFUSE102
4.8.4TensorFlow使用AlluoFUSE管理访问数据103
第5章Alluo基本功能的介绍与使用105
5.1Alluo系统环境与属性的配置105
5.1.1Alluo系统组件参数的配置106
5.1.2Alluo客户端组件参数的配置109
5.1.3Alluo参数配置的相关工具112
5.2Alluo底层文件系统的配置与管理113
5.2.1Alluo挂载底层存储113
5.2.2Alluo与底层存储的元数据一致性保证116
5.3Alluo缓存资源的配置与管理120
5.3.1配置Alluo缓存存储资源121
5.3.2Alluo缓存数据的载入、驻留及释放126
5.3.3配置Alluo缓存数据的生存时间127
5.4Alluo系统Web用户界面的查看与使用128
5.4.1AlluoMasterWeb界面介绍128
5.4.2AlluoWorkerWeb界面介绍134
第6章Alluo不错功能的介绍与使用137
6.1Alluo的安全认证与权限控制137
6.1.1Alluo安全认证模式的介绍138
6.1.2Alluo访问权限控制的介绍139
6.1.3Alluo用户模拟功能的介绍141
6.1.4Alluo审计日志功能的介绍142
6.2Alluo的内置Metrics系统143
6.3Alluo文件系统日志的使用与维护145
Alluo系统的异常排查148
Alluo:大数据统一存储原理与实践
第7章Alluo的应用案例与生产实践152
7.1陌陌基于Alluo加速SparkSQL查询152
7.1.1Alluo缓存应用背景简介153
7.1.2陌陌应用场景结合Alluo的分析153
7.1.3基于Alluo的陌陌AdHoc查询系统架构155
7.1.4基于Alluo的查询性能评估与分析156
7.1.5陌陌在Alluo实战方面的后续实践158
7.2京东基于Alluo和Presto构建交互式查询引擎158
7.2.1京东大数据平台的业务问题背景159
7.2.2JDPrestoonAlluo架构与特性的介绍160
7.2.3JDPrestoonAlluo的性能评估与分析161
7.2.4JDPrestoonAlluo的应用总结1
7.3Alluo在携程实时计算平台中的应用与实践165
7.3.1携程实时计算的应用背景165
7.3.2基于Alluo的跨集群数据共享方案与性能评估168
7.4去哪儿网利用Alluo提升异地存储访问性能169
7.4.1去哪儿网流式处理背景简介170
7.4.2原有系统架构及相关问题分析171
7.4.3基于Alluo改进后的系统架构介绍与性能评估172
7.5百度基于Alluo加速远程数据读取176
7.5.1百度跨机房数据查询问题的描述177
7.5.2使用Alluo缓存远端数据的方案与效果177
7.5.3使用Alluo分层存储的方案与效果178
7.5.4基于Alluo提速远程数据访问的总结180
第8章Alluo的开源社区开发者指南181
8.1Alluo的源代码规范181
8.1.1源代码风格要求182
8.1.2Alluo的单元测试184
8.1.3Alluo的日志系统184
8.1.4Alluo的RPC定义186
8.1.5Alluo文件系统日志消息186
8.2Alluo的单元测试流程介绍187
8.2.1运行Alluo单元测试187
8.2.2创建Alluo单元测试188
8.2.3单元测试需要避免的情况190
8.2.4Alluo单元测试的全局状态管理191
8.3贡献源代码至Alluo开源社区193
8.3.1开发者的系统要求和环境准备194
8.3.2下载Alluo源代码并配置开发者邮箱194
8.3.3编译Alluo源代码195
8.3.4领取一个开发者新手任务196
8.3.5在本地副本中创建一个新的开发分支196
8.3.6提交本地的commit197
8.3.7提交一个社区PullRequest198
8.3.8审阅社区PullRequest199
内容简介
Alluo 这一以内存为中心的分布式虚拟文件系统,初诞生于加州大学伯克利分校的 AMPLab,其开源社区在目前大数据生态系统中发展很快。本书以广泛使用的 Alluo 1.8.1 版本为基础进行编写,是一本全面介绍 Alluo 相关技术原理与实践案例的书籍。本书主要内容包括 Alluo 系统快速入门、Alluo 系统架构及读写工作机制、Alluo 与底层存储系统的集成、Alluo 与上层计算框架的集成、Alluo 基本功能和不错功能的介绍与使用。此外,本书还详细介绍了 Alluo 的应用案例与生产实践,并详细解读了 Alluo 的核心框架和技术应用,旨在为大数据从业人员和大数据存储技术爱好者提供一个深入学平台,也可用作开源社区开发者指南。