本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
肖恩T.艾伦、马修·扬科夫斯基、彼得·巴蒂罗
纳著的《Storm应用实践(实时事务处理之策略)》
是一本基于生产环境指导使用Storm的实践应用指南
!作者将TheLadders的项目实践经验融入本书,无论
是刚接触Storm的新人,还是拥有丰富经验的开发者
,都可以通过书中基于Storm不同类型的应用案例演
示,习得Storm的核心概念,以及如何基于生产环境
对Storm集群做优化、调试和故障排查。
通过阅读本书,你将学到:
Storm核心概念,包括拓扑、元祖、流、Spout、
Blot和流分组策略;
如何没计健壮的拓扑,以及其从本地到远程的实
现;
学会应用Storm UI以及其他工具优化Storm;
Storm中的资源冲突以及解决方案;
深入理解Storm的内核原理;
Trident的核心功能和应用。
肖恩T.艾伦(Sean T.Allen),现为Wallaroo Labs架构副总裁,之前曾担任TheLadders首席架构师。他专注于开发弹性、可扩展、能够移动核心业务指标的系统。他在软件行业从业20多年,拥有丰富的领域经验,能够创建灵活的数据工作流、分布式系统和基于s0A的应用框架。
译者序
序
前言
致谢
关于本书
关于原书封面插图
第1章 Storm简介
1.1 什么是大数据
1.1.1 大数据的四大特性
1.1.2 大数据工具
1.2 Storm如何应用于大数据应用场景
1.3 为什么你希望使用Storm
1.4 小结
第2章 Storm核心概念
2.1 问题定义:GitHub提交数监控看板
2.1.1 数据:起点和终点
2.1.2 分解问题
2.2 Storm基础概念
2.2.1 拓扑
2.2.2 元组
2.2.3 流
2.2.4 spout
2.2.5 bolt
2.2.6 流分组
2.3 在Storm中实现GitHub提交数监控看板
2.3.1 建立一个Storm工程
2.3.2 实现spout
2.3.3 实现bolt
2.3.4 集成各个部分组成拓扑
2.4 小结
第3章 拓扑设计
3.1 拓扑设计方法
3.2 问题定义:一个社交热力图
3.3 将解决方案映射至Storm的逻辑
3.3.1 考虑数据流本身施加的要求
3.3.2 将数据点表示为元组
3.3.3 确定拓扑组成的步骤
3.4 设计的初步实现
3.4.1 spout:从数据源读取数据
3.4.2 bolt:连接至外部服务
3.4.3 bolt:将数据寄放在内存里
3.4.4 bolt:持久化存储到数据库
3.4.5 定义组件间的流分组策略
3.4.6 在本地集群模式中构建一个拓扑
3.5 扩展拓扑
3.5.1 理解Storm中的并行机制
3.5.2 调整拓扑配置来解决设计中遗留的瓶颈
3.5.3 调整拓扑以解决数据流中固有的瓶颈
3.6 拓扑的设计范式
3.6.1 分解为功能组件的设计方法