SPSSModeler数据挖掘方法及应用pdf下载pdf下载

SPSSModeler数据挖掘方法及应用百度网盘pdf下载

作者:
简介:本篇主要提供SPSSModeler数据挖掘方法及应用pdf下载
出版社:
出版时间:2020-03-01
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

基本信息

  • 商品名称:SPSS Modeler数据挖掘方法及应用(第3版)/数据科学与大数据技术系列
  • 作者:编者:薛薇|责编:刘真平
  • 定价:69
  • 出版社:电子工业
  • ISBN号:9787121363191

其他参考信息(以实物为准)

  • 出版时间:2020-03-01
  • 印刷时间:2020-03-01
  • 版次:3
  • 印次:1
  • 开本:16开
  • 包装:平装
  • 页数:348
  • 字数:576千字

编辑推荐语

一、采用SPSS Modeler 18中文版进行讲解,通俗易懂、理论和应用实践相结合。 二、突出算法基本思路、软件操作使用和结果解读是本书的重要特征。 三、在章节安排上进行了调整。首先,基于应用场景广泛性的考虑,压缩了第2版的部分内容,如2.3节、4.7节等;其次,第3版略去了软件版本升级中未保留下来的模块的相关章节内容,如9.3节等;再次,依据数据挖掘方法论的业务理解、数据理解、数据准备、建立模型、方案评估、方案实施,将第2版的第3、4章进行了重排,构成了第3章SPSS Modeler的数据理解和第4章SPSS Modeler的数据准备相关内容; 后,Logistic回归分析和判别分析等现代统计方法在数据挖掘和机器学习中日渐普及,为突出方法的重要性,将第2版8.1节和8.2节独立成章。 四、增加了一些重要的建模策略和方法,极大丰富了教材内容。

内容提要

数据挖掘是大数据分析中 活跃的地带。SPSS Modeler充分利用计算机系统的运算处理能力和图形展现能力,将数据挖掘方法、应用与工具有机地融为一体,成为内容全面、功能强大、操作友好的数据挖掘软件产品,是大数据分析的理想工具。本书以数据挖掘的实践过程为主线,系统介绍了决策树、人工神经网络、支持向量机、Logistic回归、判别分析、贝叶斯网络、聚类分析等一系列经典数据挖掘方法,以及数据整理和降维处理等 知识,同时给出了SPSS Modeler实现的全过程。讲解方法从易到难,说明问题由浅入深,软件操作详细全面。本书力求以 通俗的方式阐述数据挖掘方法的核心思想与基本原理,同时配合SPSS Modeler 18(中文版)软件操作说明,希望读者能够直观理解方法的本质,快速掌握软件使用技巧,并应用到数据挖掘实践中。本书提供实例数据和电子课件,读者可登录华信教育资源网www.hxedu.com.cn免费下载使用。本书可作为高等院校管理类、财经类、计算机类专业本科生和研究生的数据挖掘教材,也可作为商业管理、金融保险、社会教育等行业进行数据挖掘实践的参考用书。

作者简介

薛薇,工学硕士,经济学博士,中国人民大学应用统计学科研究中心副主任,中国人民大学统计学院副教授。主要研究领域:机器学习和文本挖掘、复杂网络建模等。关注统计和数据挖掘算法及软件应用。涉足企业客户终身价值测算,基于文本挖掘的热点事件主题提取和分类,金融、贸易等复杂网络动态建模等方面。主要代表性教材:《SPSS统计分析方法及应用》、《R语言数据挖掘方法及应用》、《R语言:大数据分析中的统计方法及应用》、《SPSS Modeler数据挖掘方法及应用》等。

目录

目 录
第1章 数据挖掘和SPSS Modeler使用概述1
1.1 数据挖掘的产生背景1
1.1.1 海量大数据的分析需求催生数据挖掘1
1.1.2 应用对理论的挑战催生数据挖掘2
1.2 什么是数据挖掘4
1.2.1 数据挖掘和数据库中的知识发现5
1.2.2 数据挖掘方法论6
1.2.3 数据挖掘的任务和应用9
1.2.4 数据挖掘得到的知识形式11
1.2.5 数据挖掘算法的分类14
1.3 SPSS Modeler软件概述17
1.3.1 SPSS Modeler的数据流17
1.3.2 SPSS Modeler的窗口19
1.3.3 数据流的基本管理21
1.3.4 缓存节点和超节点24
1.3.5 从一个示例看SPSS Modeler的使用25
第2章 SPSS Modeler的数据读入和数据集成31
2.1 变量类型31
2.1.1 从数据挖掘角度看变量类型31
2.1.2 从计算机存储角度看变量类型32
2.2 读入数据32
2.2.1 读自由格式的文本文件33
2.2.2 读Excel电子表格数据36
2.2.3 读SPSS格式文件37
2.3 数据集成38
2.3.1 数据的纵向合并38
2.3.2 数据的横向合并40
2.3.3 数据源替换43
第3章 SPSS Modeler的数据理解45
3.1 变量说明45
3.1.1 变量的重新实例化46
3.1.2 有效变量值和无效值调整47
3.1.3 变量角色的说明49
3.2 数据质量的评估和调整50
3.2.1 数据的基本特征与质量评价报告50
3.2.2 变量值的调整53
3.2.3 数据质量管理56
3.3 数据的排序58
3.3.1 单变量排序58
3.3.2 多重排序59
3.4 数据的分类汇总60
3.4.1 单变量分类汇总60
3.4.2 多重分类汇总61
第4章 SPSS Modeler的数据准备62
4.1 变量变换62
4.1.1 CLEM表达式62
4.1.2 变量值的重新计算65
4.1.3 变量类别值的调整67
4.2 变量派生68
4.2.1 生 变量68
4.2.2 生成服从正态分布的新变量72
4.2.3 派生哑变量75
4.3 数据精简76
4.3.1 随机抽样76
4.3.2 根据条件选取样本79
4.4 建模中的数据集处理策略80
4.4.1 样本的平衡处理80
4.4.2 样本子集的划分81
第5章 SPSS Modeler的基本分析85
5.1 数值型变量的基本分析85
5.1.1 计算基本描述统计量85
5.1.2 绘制散点图88
5.1.3 绘制线图91
5.2 两分类型变量相关性的研究93
5.2.1 两分类型变量相关性的图形分析93
5.2.2 两分类型变量相关性的数值分析98
5.3 两总体的均值比较102
5.3.1 两总体均值比较的图形分析102
5.3.2 独立样本的均值检验104
5.3.3 配对样本的均值检验108
5.4 RFM分析110
5.4.1 什么是RFM分析110
5.4.2 RFM汇总110
5.4.3 计算RFM得分112
第6章 SPSS Modeler的数据精简115
6.1 变量值的离散化处理115
6.1.1 无监督的数据分组115
6.1.2 有监督的数据分组116
6.1.3 变量值离散化处理的应用示例119
6.2 特征选择122
6.2.1 特征选择的一般方法123
6.2.2 特征选择的应用示例124
6.3 因子分析128
6.3.1 什么是因子分析128
6.3.2 因子提取和因子载荷矩阵的求解131
6.3.3 因子的命名解释134
6.3.4 计算因子得分135
6.3.5 因子分析的应用示例136
第7章 分类预测:SPSS Modeler的决策树141
7.1 决策树算法概述141
7.1.1 什么是决策树141
7.1.2 决策树的几何理解143
7.1.3 决策树的核心问题143
7.2 SPSS Modeler的C5.0算法及其应用146
7.2.1 信息熵和信息增益146
7.2.2 C5.0决策树的生长算法147
7.2.3 C5.0决策树的剪枝算法152
7.2.4 C5.0决策树的基本应用示例154
7.2.5 C5.0的推理规则集158
7.2.6 损失矩阵163
7.2.7 N折交叉验证和Boosting技术165
7.3 SPSS Modeler的分类回归树及其应用169
7.3.1 分类回归树的生长过程169
7.3.2 分类回归树的剪枝过程171
7.3.3 损失矩阵对分类回归树的影响174
7.3.4 分类回归树的基本应用示例174
7.3.5 分类回归树的交互建模178
7.3.6 交互建模中分类回归树的评价180
7.4 SPSS Modeler的CHAID算法及其应用185
7.4.1 CHAID算法185
7.4.2 穷举CHAID算法186
7.4.3 CHAID算法的剪枝187
7.4.4 CHAID算法的应用示例187
7.5 SPSS Modeler的QUEST算法及其应用189
7.5.1 QUEST算法189
7.5.2 QUEST算法的应用示例191
7.6 模型的对比分析192
7.6.1 不同模型的误差对比192
7.6.2 不同模型的收益对比195
第8章 分类预测:SPSS Modeler的人工神经网络198
8.1 人工神经网络算法概述198
8.1.1 人工神经网络的概念和种类198
8.1.2 人工神经网络中的节点和意义200
8.1.3 人工神经网络建立的一般步骤202
8.2 SPSS Modeler的B-P反向传播网络204
8.2.1 感知机模型204
8.2.2 B-P反向传播网络的特点207
8.2.3 B-P反向传播算法209
8.2.4 B-P反向传播网络的其他问题212
8.3 SPSS Modeler的B-P反向传播网络的应用214
8.3.1 基本操作215
8.3.2 结果说明215
8.4 SPSS Modeler的径向基函数网络及其应用216
8.4.1 径向基函数网络中的隐节点和输出节点217
8.4.2 径向基函数网络的学习过程217
8.4.3 径向基函数网络的应用示例219
第9章 分类预测:SPSS Modeler的支持向量机221
9.1 支持向量分类的基本思路221
9.1.1 支持向量分类的数据和目标221
9.1.2 支持向量分类的三种情况223
9.2 线性可分问题下的支持向量分类224
9.2.1 如何求解超平面224
9.2.2 如何利用超平面进行分类预测226
9.3 广义线性可分下的支持向量分类227
9.3.1 如何求解超平面227
9.3.2 可调参数的意义:把握程度和精度的权衡228
9.4 线性不可分下的支持向量分类229
9.4.1 线性不可分的一般解决途径和维灾难问题229
9.4.2 支持向量分类克服维灾难的途径230
9.5 支持向量回归232
9.5.1 支持向量回归与一般线性回归:目标和策略232
9.5.2 支持向量回归的基本思路233
9.6 支持向量机的应用235
9.6.1 基本操作235
9.6.2 结果解读236
0章 分类预测:SPSS Modeler的Logistic回归分析238
10.1 Logistic回归分析概述238
10.2 二项Logistic回归分析239
10.2.1 二项Logistic回归方程239
10.2.2 二项Logistic回归方程系数的含义241
10.2.3 二项Logistic回归方程的检验242
10.2.4 二项Logistic回归分析中的虚拟自变量246
10.3 二项Logistic回归分析的应用246
10.3.1 基本操作247
10.3.2 结果解读249
10.4 多项Logistic回归分析及其应用257
10.4.1 多项Logistic回归分析概述257
10.4.2 多项Logistic回归分析的应用示例257
1章 分类预测:SPSS Modeler的判别分析262
11.1 距离判别262
11.1.1 距离判别的基本思路262
11.1.2 判别函数的计算263
11.2 Fisher判别264
11.2.1 Fisher判别的基本思路264
11.2.2 Fisher判别的计算266
11.3 贝叶斯判别267
11.3.1 贝叶斯判别的基本思路267
11.3.2 贝叶斯判别的计算267
11.4 判别分析的应用268
11.4.1 基本操作268
11.4.2 判别分析的准备工作269
11.4.3 结果解读273
2章 分类预测:SPSS Modeler的贝叶斯网络279
12.1 贝叶斯方法基础279
12.1.1 贝叶斯概率和贝叶斯公式279
12.1.2 朴素贝叶斯分类法280
12.2 贝叶斯网络概述282
12.2.1 什么是贝叶斯网络282
12.2.