基本信息
- 商品名称:Storm应用实践(实时事务处理之策略)/大数据技术丛书
- 作者:(美)肖恩T.艾伦//马修·扬科夫斯基//彼得·巴蒂罗纳|译者:罗聪翼//龚成志
- 定价:69
- 出版社:机械工业
- ISBN号:9787111586210
其他参考信息(以实物为准)
- 出版时间:2018-01-01
- 印刷时间:2018-01-01
- 版次:1
- 印次:1
- 开本:16开
- 包装:平装
- 页数:228
内容提要
肖恩T.艾伦、马修·扬科夫斯基、彼得·巴蒂罗
纳著的《Storm应用实践(实时事务处理之策略)》
是一本基于生产环境指导使用Storm的实践应用指南
!作者将TheLadders的项目实践经验融入本书,无论
是刚接触Storm的新人,还是拥有丰富经验的开发者
,都可以通过书中基于Storm不同类型的应用案例演
示,习得Storm的核心概念,以及如何基于生产环境
对Storm集群做优化、调试和故障排查。
通过阅读本书,你将学到:
Storm核心概念,包括拓扑、元祖、流、Spout、
Blot和流分组策略;
如何没计健壮的拓扑,以及其从本地到远程的实
现;
学会应用Storm UI以及其他工具优化Storm;
Storm中的资源冲突以及解决方案;
深入理解Storm的内核原理;
Trident的核心功能和应用。
作者简介
肖恩T.艾伦(Sean T.Allen),现为Wallaroo Labs架构副总裁,之前曾担任TheLadders首席架构师。他专注于开发弹性、可扩展、能够移动核心业务指标的系统。他在软件行业从业20多年,拥有丰富的领域经验,能够创建灵活的数据工作流、分布式系统和基于s0A的应用框架。
目录
译者序
序
前言
致谢
关于本书
关于原书封面插图
第1章 Storm简介
1.1 什么是大数据
1.1.1 大数据的四大特性
1.1.2 大数据工具
1.2 Storm如何应用于大数据应用场景
1.3 为什么你希望使用Storm
1.4 小结
第2章 Storm核心概念
2.1 问题定义:GitHub提交数监控看板
2.1.1 数据:起点和终点
2.1.2 分解问题
2.2 Storm基础概念
2.2.1 拓扑
2.2.2 元组
2.2.3 流
2.2.4 spout
2.2.5 bolt
2.2.6 流分组
2.3 在Storm中实现GitHub提交数监控看板
2.3.1 建立一个Storm工程
2.3.2 实现spout
2.3.3 实现bolt
2.3.4 集成各个部分组成拓扑
2.4 小结
第3章 拓扑设计
3.1 拓扑设计方法
3.2 问题定义:一个社交热力图
3.3 将解决方案映射至Storm的逻辑
3.3.1 考虑数据流本身施加的要求
3.3.2 将数据点表示为元组
3.3.3 确定拓扑组成的步骤
3.4 设计的初步实现
3.4.1 spout:从数据源读取数据
3.4.2 bolt:连接至外部服务
3.4.3 bolt:将数据寄放在内存里
3.4.4 bolt:持久化存储到数据库
3.4.5 定义组件间的流分组策略
3.4.6 在本地集群模式中构建一个拓扑
3.5 扩展拓扑
3.5.1 理解Storm中的并行机制
3.5.2 调整拓扑配置来解决设计中遗留的瓶颈
3.5.3 调整拓扑以解决数据流中固有的瓶颈
3.6 拓扑的设计范式
3.6.1 分解为功能组件的设计方法