Hadoop大数据解决方案pdf下载pdf下载

Hadoop大数据解决方案百度网盘pdf下载

作者:
简介:本篇主要提供Hadoop大数据解决方案pdf下载
出版社:
出版时间:2017-02-01
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

内容简介

  Hadoop开源且基于Java、儿乎没有入门障碍,它提供了迅速占据市场的实用人数据解决办案。《Hadoop大数据解决方案》由包括己认证Hadoop开发者、Committers和峰会演讲者在内的专家团队编写,可以作为有关该框架流程和功能的自学教程。书中单独介绍了各个组件,最后用实际项目将它们联系起来并构建示例应用。
  《Hadoop大数据解决方案》跳过数据库开发基础知识,直奔主题,帮助有经验的开发者快速上手,并开始在真实场景中使用Hadoop。
  《Hadoop大数据解决方案》向你展示使用HadoopStack配置存储、用户体验和内存计算的方法。
  《Hadoop大数据解决方案》解释使用Kafka实时消息和Storm数据流将Hadoop与其他系统集成的方法。
  《Hadoop大数据解决方案》演示关键安全特性与技术,同时给出保证数据安全的专家建议。
  《Hadoop大数据解决方案》讲授使用ApacheBigTop打包、测试和配置的基础知识,以及使用Ignite快速执行MapReduce的方法。
  《Hadoop大数据解决方案》带你领略示例应用构建过程,展示核心组件如何协同工作,同时提供了所有示例代码。

作者简介

  Benoy Antony,一位ApacheHadoop代码提交者,贡献了与安全以及HDFS相关的一些特性。他是DataApps(http://dataApps.io)公司的创始人,这是一家专门创建大数据应用的公司。他维护一份关于Hadoop安全的wiki,网址为http://HadoopSecurity.org。Benoy是eBay的Hadoop架构师,在eBay,他致力于在不影响用户生产效率的前提下提高eBayHadoop群集的安全性和可用性。他经常在类似HadoopSummit这样的会议上进行演讲。
  
  Konstantin Boudnik,博士,Memcore.io的联合创始人、CEO,他是Hadoop早的开发者之一,而且是Apache Bigtop(创建用于数据处理项目软件栈的开源框架及社区)的联合作者。Konstantin博士在软件开发、大量快速数据分析、Git以及分布式系统等领域有着超过20年的经验,而且在分布式计算领域拥有15项美国专利。Boudnik博士为分布式计算和数据处理领域的多个开源项目做出过贡献。他已经帮助并推动了该领域中多个成功的Apache项目。
  
  Cheryl Adams,一位云数据和基础设施架构师。她的工作包括为大型政府合同提供卫生保健数据,通过脚本部署基于生产的更新、监控并排除故障以及使用新的工具监控数据库、Web服务器、WebAPI和存储等环境。
  
  Branky Shao,eBay的软件工程师,正在使用Elasticsearch、Cassandra、Kafka和Storm构建实时应用。他自2010年起就从事与Hadoop生态系统相关的技术工作。他在设计和实现各种软件方面具有丰富经验,包括分布式系统、数据整合、框架/API和Web应用。他对开源软件有强烈的兴趣,同时也是Cascading项目的贡献者。
  
  Cazen Lee,SamsungSDS的一位软件架构师。目前,他负责Samsung大数据平台的Hadoop模型。在加盟Samsung之前,Cazen是金融行业中综合数据仓库层的开发者和架构师,与Samsung人寿保险和韩国证券金融公司配合工作。他对机器学习和神经网络模型也很感兴趣。

内页插图

目录

第1章 Hadoop概述
1.1 商业分析与大数据
1.1.1 Hadoop的组件
1.1.2 Hadoop分布式文件系统(HDFS)
1.1.3 MapReduce是什么
1.1.4 YARN是什么
1.2 ZooKeeper是什么
1.3 Hive是什么
1.4 与其他系统集成
1.4.1 Hadoop生态系统
1.4.2 数据集成与Hadoop
1.5 小结

第2章 存储
2.1 HadoopHDFS的基础知识
2.1.1 概念
2.1.2 架构
2.1.3 接口
2.2 在分布式模式下设置HDFS群集
2.3 HDFS的高级特性
2.3.1 快照
2.3.2 离线查看器
2.3.3 分层存储
2.3.4 纠删码
2.4 文件格式
2.5 云存储
2.6 小结

第3章 计算
3.1 HadoopMapReduce的基础
3.1.1 概念
3.1.2 架构
3.2 如何启动MapReduce作业
3.2.1 编写Map任务
3.2.2 编写reduce任务
3.2.3 编写MapReduce作业
3.2.4 配置
3.3 MapReduce的高级特性
3.3.1 分布式缓存
3.3.2 计数器
3.3.3 作业历史服务器
3.4 与Spark作业的区别
3.5 小结
……

第4章 用户体验
第5章 与其他系统集成
第6章 Hadoop安全
第7章 自由的生态圈:Hadoop与ApacheBigTop
第8章 Hadoop软件栈的In-Memory计算
术语表