作 者:邓杰 编著
定 价:99
出 版 社:机械工业出版社
出版日期:2018年06月01日
页 数:402
装 帧:平装
ISBN:9787111600107
●前言
●章 集群及开发环境搭建1
●1.1 环境准备1
●1.1.1 基础软件下载1
●1.1.2 准备Linux操作系统2
●1.2 安装Hadoop4
●1.2.1 基础环境配置4
●1.2.2 Zookeeper部署7
●1.2.3 Hadoop部署9
●1.2.4 效果验证21
●1.2.5 集群架构详解24
●1.3 Hadoop版Hello World25
●1.3.1 Hadoop Shell介绍25
●1.3.2 WordCount初体验27
●1.4 开发环境28
●1.4.1 搭建本地开发环境28
●1.4.2 运行及调试预览31
●1.5 小结34
●第2章 实战:快速构建一个Hadoop项目并线上运行35
●2.1 构建一个简单的项目工程35
●部分目录
本书采用“理论+实战”的形式编写,全面介绍了Hadoop大数据挖掘的相关知识。本书共分为13章,涵盖的主要内容有:集群及开发环境搭建;快速构建一个Hadoop项目并线上运行;Hadoop套件实战;Hive编程——使用SQL提交MapReduce任务到Hadoop集群;游戏玩家的用户行为分析——特征提取;Hadoop平台管理与维护;Hadoop异常处理解决方案;初识Hadoop核心源码;Hadoop通信机制和内部协议;Hadoop分布式文件系统剖析;ELK实战案例——游戏应用实时日志分析平台;Kafka实战案例——实时处理游戏用户数据;Hadoop拓展——Kafka剖析。本书不但适合刚入门的初学者系统学习Hadoop的各种基础语法和开发技巧,而且也适合有多年开发经验的开发者进阶提高。另外,本书也适合社会培训机构和相关院校作为教材或者教学参考书。
邓杰 编著
邓杰,博客园资历博主,资历大数据全栈开发者,极客学院大数据讲师,开源爱好者。善于开发大数据监控系统辅助日常工作,提升工作效率。开发了大数据自助类平台系统。开发并在GitHub上发布了Kafka系统监控管理工具Kafka Eagle,深受业内开发者的赞誉。作为极客学院特邀讲师,制作了多个技术视频,讲授Hadoop和Kafka等相关技术课程,广受学员好评。
前言 大数据时代,数据的存储与挖掘至关重要。企业在追求高可靠性、高扩展性及高容错性的大数据处理平台的同时还希望能够降低成本,而Hadoop为实现这些需求提供了解决方案。 Hadoop在分布式计算与存储上具有先天优势。它作为Apache软件基金会的开源项目,其版本迭代持续至今,而且已经拥有一个非常活跃的社区和众多开发者,并且成为了当前非常流行的大数据处理平台。很多公司,特别是互联网公司,都纷纷开始使用或者已经使用Hadoop来做海量数据存储与数据挖掘。 Hadoop简单易学,其学习曲线平缓且学习周期短。它的操作命令和Linux命令非常相似。一个熟悉Linux的开发者只需要短短的一周时间,就可以学会Hadoop开发,完成一个高可用集群的部署和高可用应用程序的等