《ApacheKylin权威指南》[51M]百度网盘|亲测有效|pdf下载

书籍详情

ApacheKylin权威指南
出版时间:2019-08-09
热度:7165
上架时间:2024-06-30 09:07:09
价格:0.0

书籍下载

点击下载

书籍预览

查看链接

免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源，一旦发现资源涉及侵权，将立即删除。希望所有用户一同监督并反馈问题，如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

书[0名0]：	Apache Kylin[0权0]威指南（[0第0]2版）\|8062444
图书定价：	99元
图书作者：	Apache Kylin核心团队
出版社：	[1机1]械工业出版社
出版日期：	2019-08-09 00:00:00
ISBN号：	9787111633297
开本：	16开
页数：	303
版次：	1-1

内容简介

本书由Apache Kylin核心开发团队编写，近两年Apache Kylin随着社区持续贡献的热度和在不同[令页]域业务场景的深入实践应用，[亲斤]的功能和特性不断涌现，这样就迫切需要更[亲斤]内容来满足广[0大0]Apache Kylin 的使用者和关注人群的需要。本书从Apache Kylin的架构和设计，各个模块的使用，与[0第0]三方的整合，二次开发以及开源实践等各个方[mian]进行讲解，为各位读者呈现[z1u1i]核心的设计理念和哲[0学0]、算[0法0]和技术等。

推荐序
前　言
[0第0]1章　Apache Kylin概述1
1.1　背景和历[0史0]1
1.2　Apache Kylin的使命3
1.2.1　为什么要使用Apache Kylin3
1.2.2　Apache Kylin怎样解决关键问题4
1.3　Apache Kylin的工作原理5
1.3.1　维度和度量简介5
1.3.2　Cube和Cuboid6
1.3.3　工作原理7
1.4　Apache Kylin的技术架构7
1.5　Apache Kylin的[1主1]要特点9
1.5.1　标准SQL接口9
1.5.2　支持[0超0][0大0]数据集10
1.5.3　亚秒级响应10
1.5.4　可伸缩性和高吞吐率10
1.5.5　BI及可视化工具集成11
1.6　与其他开源产[0品0]的比较11
1.7　小结13
[0第0]2章　快速入门 14
2.1　核心概念 14
2.1.1　数据仓库、OLAP与BI14
2.1.2　维度建模15
2.1.3　事实表和维度表16
2.1.4　维度和度量16
2.1.5　Cube、Cuboid和Cube Segment16
2.2　在Hive中准备数据 17
2.2.1　多维数据模型17
2.2.2　维度表的设计 17
2.2.3　Hive表分区 18
2.2.4　了解维度的基数 18
2.2.5　样例数据18
2.3　安装和启动Apache Kylin19
2.3.1　环境准备19
2.3.2　必要组[亻牛]19
2.3.3　启动Apache Kylin19
2.4　设计Cube 19
2.4.1　导入Hive表定义19
2.4.2　创建数据模型21
2.4.3　创建Cube23
2.5　构建Cube 32
2.5.1　全量构建和增量构建34
2.5.2　历[0史0]数据刷[亲斤]35
2.5.3　合并36
2.6　查询Cube 38
2.6.1　Apache Kylin查询介绍38
2.6.2　查询下压40
2.7　SQL参考 41
2.8　小结41
[0第0]3章　Cube[0优0]化42
3.1　Cuboid剪枝[0优0]化42
3.1.1　维度的组合42
3.1.2　检查Cuboid数量43
3.1.3　检查Cube[0大0]小45
3.1.4　空间与时间的平衡46
3.2　剪枝[0优0]化工具47
3.2.1　使用衍生维度47
3.2.2　聚合组49
3.2.3　必需维度51
3.2.4　层级维度51
3.2.5　联合维度52
3.3　并发粒度[0优0]化54
3.4　Rowkey[0优0]化55
3.4.1　调整Rowkey顺序55
3.4.2　选择合适的维度编码56
3.4.3　按维度分片57
3.5　Top_N度量[0优0]化58
3.6　Cube Planner[0优0]化61
3.7　其他[0优0]化62
3.7.1　降低度量精度62
3.7.2　及时清理无用Segment63
3.8　小结63
[0第0]4章　增量构建64
4.1　为什么要增量构建64
4.2　设计增量Cube66
4.2.1　设计增量Cube的条[亻牛]66
4.2.2　增量Cube的创建67
4.3　触发增量构建69
4.3.1　Web GUI触发69
4.3.2　构建相关的REST API70
4.4　管理Cube碎片76
4.4.1　合并Segment76
4.4.2　自动合并77
4.4.3　保留Segment79
4.4.4　数据持续更[亲斤]79
4.5　小结80
[0第0]5章　查询和可视化81
5.1　Web GUI81
5.1.1　查询81
5.1.2　显示结果82
5.2　REST API84
5.2.1　查询认证85
5.2.2　查询请求参数85
5.2.3　查询返回结果86
5.3　ODBC87
5.4　JDBC90
5.4.1　获得驱动包90
5.4.2　认证90
5.4.3　URL格式90
5.4.4　获取元数据信息91
5.5　Tableau集成91
5.5.1　连接Kylin数据源92
5.5.2　设计数据模型93
5.5.3　“Live”连接93
5.5.4　自定义SQL94
5.5.5　可视化展现94
5.5.6　发布到Tableau Server95
5.6　Zeppelin集成95
5.6.1　Zeppelin架构简介95
5.6.2　KylinInterpreter的工作原理96
5.6.3　如何使用Zeppelin访问Kylin96
5.7　Superset 集成98
5.7.1　下载Kylinpy98
5.7.2　安装Superset99
5.7.3　在Superset中添加Kylin Database100
5.7.4　在Superset中添加Kylin Table100
5.7.5　在Superset中创建图表103
5.7.6　在Superset中通过SQL Lab探[1索1]Kylin105
5.8　QlikView 集成106
5.8.1　连接Kylin数据源106
5.8.2　“Direct Query”连接107
5.8.3　创建可视化109
5.8.4　发布到QlikView Server110
5.9　Qlik Sense集成110
5.9.1　连接Kylin数据源110
5.9.2　“Direct Query”连接112
5.9.3　创建可视化114
5.9.4　发布到Qlik Sense Hub115
5.9.5　在Qlik Sense Hub中连接Kylin数据源117
5.10　Redash集成118
5.10.1　连接Kylin数据源118
5.10.2　[亲斤]建查询119
5.10.3　[亲斤]建仪表盘121
5.11　MicroStrategy 集成122
5.11.1　创建数据库实例123
5.11.2　导入逻辑表124
5.11.3　创建属性、事实和度量124
5.11.4　创建报告124
5.11.5　MicroStrategy连接Kylin[z1u1i]佳实践126
5.12　小结127
[0第0]6章　Cube Planner及仪表盘128
6.1　Cube Planner128
6.1.1　为什么要引入Cube Planner128
6.1.2　Cube Planner 算[0法0]介绍129
6.1.3　使用Cube Planner131
6.2　System Cube134
6.2.1　开启System Cube134
6.2.2　构建和更[亲斤]System Cube135
6.3　仪表盘135
6.4　小结137
[0第0]7章　流式构建138
7.1　为什么要进行流式构建139
7.2　准备流式数据139
7.2.1　数据格式139
7.2.2　消息队列140
7.2.3　创建Schema141
7.3　设计流式Cube144
7.3.1　创建Model144
7.3.2　创建Cube145
7.4　流式构建原理147
7.5　触发流式构建150
7.5.1　单次触发构建151
7.5.2　自动化多次触发152
7.5.3　初始化构建起点152
7.5.4　其他[*]作153
7.5.5　出错处理153
7.6　小结154
[0第0]8章　使用Spark155
8.1　为什么要引入Apache Spark155
8.2　Spark构建原理156
8.3　使用Spark构建Cube158
8.3.1　配置Spark引擎158
8.3.2　开启Spark动态资源分配161
8.3.3　出错处理和问题排查162
8.4　使用Spark SQL创建中间平表164
8.5　小结164
[0第0]9章　应用案例分析166
9.1　小米集团166
9.1.1　背景166
9.1.2　利用Apache Kylin构建定制化OLAP解决方案167
9.1.3　Kylin在小米的三类[1主1]要应用场景168
9.2　美团点[0评0]169
9.2.1　美团点[0评0]的数据场景特点169
9.2.2　接入Apache Kylin的解决方案170
9.2.3　Kylin的[0优0]势170
9.3　携程171
9.3.1　背景171
9.3.2　选择Kylin的原因171
9.3.3　Kylin在携程的应用情况172
9.4　4399小游戏173
9.4.1　背景173
9.4.2　Kylin 部署架构173
9.4.3　Apache Kylin 在4399的价值174
9.5　[0国0]内某Top 3保险公司174
9.5.1　背景174
9.5.2　[1主1]要痛点175
9.5.3　Kylin带来的改变175
9.6　某全球[1[0顶0]1]银行卡组织176
9.6.1　背景176
9.6.2　Kylin的价值体现177
[0第0]10章　扩展Apache Kylin178
10.1　可扩展式架构178
10.1.1　可扩展架构工作原理178
10.1.2　三[0大0][1主1]要接口180
10.2　计算引擎扩展183
10.2.1　EngineFactory183
10.2.2　MRBatchCubingEngine2184
10.2.3　BatchCubingJobBuilder2185
10.2.4　IMRInput187
10.2.5　IMROutput2189
10.2.6　计算引擎扩展小结190
10.3　数据源扩展190
10.3.1　Hive数据源191
10.3.2　JDBC数据源192
10.4　存储扩展194
10.5　聚合类型扩展196
10.5.1　聚合的JSON定义196
10.5.2　聚合类型工厂197
10.5.3　聚合类型的实现（Measure-Type）198
10.5.4　聚合类型扩展小结202
10.6　维度编码扩展202
10.6.1　维度编码的JSON定义202
10.6.2　维度编码工厂（Dimension-EncodingFactory）203
10.6.3　维度编码实现（Dimension-Encoding）204
10.6.4　维度编码扩展小结205
10.7　小结205
[0第0]11章　Apache Kylin的安全与认证206
11.1　身份验证 206
11.1.1　自定义验证207
11.1.2　LDAP验证209
11.1.3　单点登录213
11.2　授[0权0]214
11.2.1　[亲斤]的访问[0权0]限控制214
11.2.2　统一的项目级别访问控制214
11.2.3　管理数据访问[0权0]限216
11.3　小结217
[0第0]12章　运维管理218
12.1　监控和诊断218
12.1.1　日志文[亻牛]218
12.1.2　任务报[0警0]220
12.1.3　诊断工具221
12.2　日常维护222
12.2.1　基本运维223
12.2.2　元数据备份223
12.2.3　元数据恢复224
12.2.4　系统升级224
12.2.5　迁移227
12.2.6　垃圾清理228
12.3　获得社区帮助229
12.3.1　邮[亻牛]列表229
12.3.2　JIRA230
12.4　小结230
[0第0]13章　在云上使用Kylin231
13.1　云计算世界231
13.2　为何要在云上使用Kylin232
13.3　在亚马[xun]AWS上使用Kylin232
13.3.1　准备AWS服务资源233
13.3.2　AWS账户信息234
13.3.3　创建 EMR集群235
13.3.4　安装Apache Kylin237
13.4　在微软Azure使用Kylin239
13.4.1　准备Azure服务资源240
13.4.2　准备Azure账户信息241
13.4.3　创建HD Insight集群241
13.4.4　安装Apache Kylin246
13.5　在阿里云使用Kylin247
13.5.1　准备阿里云服务资源248
13.5.2　准备阿里云账户信息249
13.5.3　创建E-MapReduce集群250
13.5.4　安装Apache Kylin252
13.6　认识Kyligence Cloud255
13.7　小结256
[0第0]14章　参与开源257
14.1　Apache Kylin开源历程257
14.2　为什么要参与开源258
14.3　Apache开源社区简介258
14.3.1　简介258
14.3.2　组织构成与运作模式259
14.3.3　项目角色259
14.3.4　孵化项目及[1[0顶0]1]项目260
14.4　如何贡献到开源社区262
14.4.1　什么是贡献262
14.4.2　如何贡献262
14.5　礼仪与文化262
14.6　如何参与Apache Kylin263
14.6.1　如何成为Apache Contributor264
14.6.2　如何成为Apache Committer264
14.7　小结264
[0第0]15章　Kylin的未来265
15.1　全[mian]拥抱Spark技术265
15.2　实时流分析266
15.3　更快的存储和查询266
15.4　前端展现及与BI工具的整合266
15.5　高级OLAP函数267
15.6　展望267
附录A　使用VM本地部署Kylin268
附录B　Azure HDInsight边缘节点模板部署代码274
附录C　集群部署Apache Kylin277
附录D　使用MySQL作为元数据存储279
附录E　配置Apache Kylin281
附录F　多级配置重写284
附录G　常见问题与解决方案287

编辑推荐

Apache Kylin 是[0首0]个中[0国0]人贡献的
Apache [1[0顶0]1]开源项目

相关推荐

ClickHouse原理解析与应用实践

Flink入门与实战

Spark权威指南