作 者:余明辉,张良均 主编
定 价:39.8
出 版 社:人民邮电出版社
出版日期:2018年02月01日
页 数:188
装 帧:平装
ISBN:9787115370662
●一章Hadoop介绍1
●1.1Hadoop概述1
●1.1.1Hadoop简介1
●1.1.2Hadoop的发展历史2
●1.1.3Hadoop的特点3
●1.2Hadoop核心4
●1.2.1分布式文件系统——HDFS4
●1.2.2分布式计算框架——MapReduce7
●1.2.3集群资源管理器——YARN9
●1.3Hadoop生态系统12
●1.4Hadoop应用场景14
●小结15
●二章Hadoop集群的搭建及配置16
●任务2.1安装及配置虚拟机17
●2.1.1创建Linux虚拟机17
●2.1.2设置固定IP25
●2.1.3远程连接虚拟机27
●2.1.4虚拟机在线安装软件29
●2.1.5任务实现32
●任务2.2安装Java32
●部分目录
本书以任务为导向,较为全面地介绍了Hadoop大数据技术的相关知识。全书共6章,具体内容包括Hadoop介绍、Hadoop集群的搭建及配置、Hadoop基础操作、MapReduce编程入门、MapReduce进阶编程、项目案例:电影网站用户性别预测。本书的2~5章包含了实训与课后练习,通过练习和操作实践,帮助读者巩固所学的内容。本书可以作为高校大数据技术类专业的教材,也可作为大数据技术爱好者的自学用书。
余明辉,张良均 主编
张良均,信息系统项目管理师,泰迪杯大学生数据挖掘竞赛的发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数二十余篇,已取得国家发明12项,主编图书《神经网络实用教程》《数据挖掘:实用案例分析》《Python数据分析与挖掘》等多本图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。