R语言与数据挖掘/大数据技术丛书pdf下载pdf下载

R语言与数据挖掘/大数据技术丛书百度网盘pdf下载

作者:
简介:本篇主要提供R语言与数据挖掘/大数据技术丛书pdf下载
出版社:
出版时间:2016-06-01
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

基本信息

  • 商品名称:R语言与数据挖掘/大数据技术丛书
  • 作者:张良均//谢佳标//杨坦//肖刚//黄博等
  • 定价:59
  • 出版社:机械工业
  • ISBN号:9787111540526

其他参考信息(以实物为准)

  • 出版时间:2016-06-01
  • 印刷时间:2016-06-01
  • 版次:1
  • 印次:1
  • 开本:16开
  • 包装:平装
  • 页数:302

内容提要

张良均、谢佳标、杨坦、肖刚著的《R语言与数 据挖掘》是一本适合教学和零基础自学的R语言与数 据挖掘教程,即便完全没有R语言编程基础和数据挖 掘基础,根据本书中的理论知识和上机实践,你也能 迅速掌握如何使用R语言进行数据挖掘的方法。本书 已经被多所高校预定为教材,为了便于教学,书中还 提供了大量的上机实验和教学资源。
     基础篇(1~5章),主要包括R语言及图形操作 工具RStudio的安装及使用方法,数据类型和数据对 象,数据预处理的常用操作(包括数据重命名、缺失 值分析、排序、随机抽样等),绘图功能(包括散点 图、直方图、条形图、箱线图等)。
     建模应用篇(6~10章),主要介绍了数据挖掘 中常用算法的函数在R语言中的使用方法及其结果, 涵盖了目前数据挖掘的5大类算法,包括分类与预测 、聚类分析、关联规则、智能推荐和时间序列。按照 从模型建立到模型评价架构的顺序进行介绍,使读者 能熟练地掌握从建模到对模型评价的完整建模过程。
     Rattle篇(11章),介绍了R语言的图形界面工 具Rattle,此工具能够在一个图形化的界面上对本书 所介绍的R语言功能进行操作,使读者能*好地体验 到使用R语言进行数据挖掘的整个流程。
     书中配套提供了原始样本数据文件及对应章节示 例代码。每个章节有对应的练习实验,读者可通过完 成对应的练习,迅速掌握R语言的用法和数据挖掘的 方法。
    

作者简介

张良均,**大数据挖掘专家和模式识别专家,有10多年的大数据挖掘应用、咨询经验,10余年数据仓库系统管理与实施经验,超过10年的系统开发与设计经验。为电信、电力、互联网、生产制造、零售、银行、生物、化工、医药等多个行业上百家大型企业提供过数据挖掘应用与咨询服务,实践经验非常丰富。此外,他精通Java EE企业级应用开发,是广东工业大学和华南师范大学兼职教授,著有《神经网络实用教程》、《数据挖掘:实用案例分析》等畅销书。 谢佳标,**R语言专家,多次于中国R语言大会发表演讲,具有十余年的数据挖掘实战经验。目前于某上市互联网游戏公司,任**数据分析师,负责大数据挖掘及可视化。培训过的精品课程有:《R语言基础训练》《数据分析之R语言实战》《机器学习与R语言实践》等。

目录

前言
**部分 基础篇
**章 R语言的安装与使用
1.1 R安装与升级
1.2 R使用入门
1.2.1 R操作界面
1.2.2 RStudio窗口介绍
1.2.3 R常用操作
1.3 R数据分析包
1.4 配套资源使用说明
1.5 小结
1.6 上机实验
第2章 数据对象与数据读写
2.1 数据类型
2.2 数据结构
2.2.1 向量
2.2.2 矩阵
2.2.3 数组
2.2.4 数据框
2.2.5 因子
2.2.6 列表
2.3 数据文件的读写
2.3.1 键盘输入数据
2.3.2 读取不同格式的数据
2.3.3 从其他统计软件获取数据
2.3.4 从数据库获取数据
2.3.5 从网页获取数据
2.4 小结
2.5 上机实验
第3章 R语言常用数据管理
3.1 变量的重命名
3.2 缺失值分析
3.3 数据排序
3.4 随机抽样
3.5 数值运算函数
3.6 字符串处理
3.7 文本分词
3.8 apply函数族
3.9 数据整合
3.10 控制流
3.11 函数的编写
3.12 小结
3.13 上机实验
第4章 图形探索
4.1 图形元素
4.1.1 颜色
4.1.2 点
4.1.3 文本
4.1.4 线条
4.1.5 图例
4.1.6 坐标轴
4.2 图形组合
4.3 图形保存
4.4 图形函数
4.5 小结
4.6 上机实验
第5章 **绘图工具
5.1 lattice包绘图工具
5.1.1 绘图特色
5.1.2 基本图形
5.2 ggplot2包绘图工具
5.2.1 从qplot开始
5.2.2 ggplot作图
5.3 交互式绘图工具简介
5.3.1 rCharts包
5.3.2 recharts包
5.3.3 googleVis包
5.3.4 htmlwidgets包
5.3.5 shiny包
5.4 小结
5.5 上机实验
第二部分 建模应用篇
第6章 分类与预测
6.1 回归分析
6.2 决策树
6.2.1 C4.5算法
6.2.2 CART算法
6.2.3 C5.0算法
6.3 人工神经网络
6.4 KNN算法
6.5 朴素贝叶斯分类
6.6 其他分类与预测算法函数
6.7 分类与预测算法评价
6.8 小结
6.9 上机实验
第7章 聚类分析
7.1 K-Means聚类分析函数
7.2 层次聚类算法
7.3 其他聚类分析函数
7.4 小结
7.5 上机实验
第8章 关联规则
8.1 Apriori关联规则
8.2 小结
8.3 上机实验
第9章 智能推荐
9.1 智能推荐模型构建
9.2 智能推荐模型评价
9.3 小结
9.4 上机实验
**0章 时间序列
10.1 ARIMA模型
10.2 其他时间序列模型
10.3 小结
10.4 上机实验
第三部分 Rattle篇
**1章 可视化数据挖掘工具
11.1 Rattle简介及其安装
11.1.1 Rattle简介
11.1.2 Rattle安装
11.2 功能预览
11.3 数据导入
11.3.1 导入CSV数据
11.3.2 导入ARFF数据
11.3.3 导入ODBC数据
11.3.4 R Dataset——导入其他数据源
11.3.5 导入RData File数据集
11.3.6 导入Library数据
11.4 数据探索
11.4.1 数据总体概况
11.4.2 数据分布探索
11.4.3 相关性
11.4.4 主成分
11.4.5 交互图
11.5 数据建模
11.5.1 聚类分析
11.5.2 关联规则
11.5.3 决策树
11.5.4 随机森林
11.6 模型评估
11.6.1 混淆矩阵
11.6.2 风险图
11.6.3 ROC图及相关图表
11.6.4 模型得分数据集
11.7 小结
11.8 上机实验
参考资料