IBMSPSS数据分析与挖掘实战案例精粹pdf下载pdf下载

IBMSPSS数据分析与挖掘实战案例精粹百度网盘pdf下载

作者:
简介:本篇主要提供IBMSPSS数据分析与挖掘实战案例精粹pdf下载
出版社:清华大学出版社
出版时间:2013-02
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

产品特色

编辑推荐

  业内资深专家十余年实战经验总结,从上千个真实案例中精选出18个案例,帮助读者迅速成长为真正的数据分析与挖掘高手!
  初学者的入门向导,进阶者的成才之路,实战专家的案例指南。
  “做中学”是学习统计分析的优路径,翔实的案例,丰富的细节,助你快速上手数据分析!

内容简介

  《IBM SPSS数据分析与挖掘实战案例精粹》以ibm spss statistics 20.0和ibm spss modeler 14.1为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,详细讲解整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,使读者在阅读时能突破方法和工具的局限,真正聚集于对数据分析精髓的领悟。《IBM SPSS数据分析与挖掘实战案例精粹》所附光盘包括案例数据和分析程序/流文件,读者可完整重现全部的分析内容。
  《IBM SPSS数据分析与挖掘实战案例精粹》适合从初学者到专家各个级别的数据分析人员阅读,尤其适合于以下读者群:需要提升实战能力的数据分析专业人员;在市场营销、金融、财务、人力资源管理中需要应用数据分析的人士;从事咨询、科研等工作的专业人士;同时也适合于各专业的本科和研究生作为学习数据分析应用的参考书。

作者简介

  张文彤 博士,数据挖掘、市场研究、统计软件教学与应用领域专家,现任全球第八大市场研究集团INTAGE中国公司全国技术总监。曾在复旦大学任教数载,期间协助SPSS在中国建立并完善了其培训体系,是国内知名的SPSS培训师之一。在数据挖掘、市场研究、医药数据分析等领域均经验丰富,曾负责为知名跨国公司完成了中国城市女性市场细分模型、销量预测模型、商圈选址模型等各类项目,并协助完成多项IT、电信、税务、银行等行业的数据挖掘项目。


  钟云飞 资深数据分析专家,拥有超过10年的统计分析与数据挖掘在各行业的软件应用及咨询经验,历任SPSS、SAS软件公司首席咨询顾问,目前在国际商业机器(中国)有限公司软件部工作,从事SPSS软件企业应用的推广工作。主要关注统计分析与数据挖掘在银行、电信、政府、保险、零售等行业的应用实践,致力于使用数据分析方法帮助企业和政府组织从数据中获取有价值的信息,从而提高管理水平

内页插图

目录

第一部分 spss数据分析基础
第1章 数据分析方法论简介
1.1 三种数据分析方法论
1.2 crisp-dm方法论介绍
第2章 数据分析方法体系简介
2.1 统计软件中的数据存储格式
2.2 数据的统计描述与参数估计
2.3 常用假设检验方法
2.4 多变量模型
2.5 多元统计分析模型
2.6 智能统计分析/数据挖掘方法
第3章 ibm spss statistics操作入门
3.1 案例背景
3.2 数据文件的读入与变量整理
3.3 问卷数据分析
3.4 项目总结和讨论
第4章 ibm spss statistics操作进阶
4.1 案例背景
4.2 问卷录入
4.3 问卷质量校验
4.4 问卷数据分析
4.5 项目总结和讨论
第5章 ibm spss modeler操作入门
5.1 ibm spss modeler概述
5.2 ibm spss modeler相关操作与技巧
5.3 ibm spss modeler功能介绍
5.4 案例分析:药物选择决策支持
5.5 如何进一步学习ibm spss modeler

第二部分 影响因素发现与数值预测
第6章 酸奶饮料新产品口味测试
研究案例
6.1 案例背景
6.2 数据理解
6.3 不同品牌的评分差异分析
6.4 两因素方差分析模型分析
6.5 分析结论与讨论
第7章 偏态分布的激素水平影响因素分析
7.1 案例背景
7.2 数据理解
7.3 对因变量变换后的建模分析
7.4 秩变换分析
7.5 利用cox模型进行分析
7.6 项目总结与讨论
第8章 某车企汽车年销量预测案例
8.1 案例背景
8.2 数据理解
8.3 变量变换后的线性回归
8.4 曲线拟合
8.5 利用非线性回归进行拟合
8.6 项目总结与讨论
第9章 脑外伤急救后迟发性颅脑损伤影响因素分析案例
9.1 案例背景
9.2 数据理解
9.3 构建二分类logistic回归模型
9.4 利用树模型发现交互项
9.5 使用广义线性过程进行分析
9.6 项目总结与讨论
第10章 中国消费者信心指数影响因素分析
10.1 案例背景
10.2 数据理解
10.3 标准glm框架下的建模分析
10.4 多元方差分析模型的结果
10.5 最优尺度回归
10.6 多水平模型框架下的建模分析
10.7 项目总结与讨论

第三部分 信息浓缩、分类与感知图呈现
第11章 探讨消费者购买保健品的动机
11.1 案例背景
11.2 数据理解
11.3 利用因子分析进行信息浓缩
11.4 基于因子分析结果进行市场细分
11.5 项目总结与讨论
第12章 1988年汉城奥运会男子十项全能成绩分析
12.1 案例背景
12.2 数据理解
12.3 利用因子分析进行信息浓缩
12.4 主成分回归
12.5 将主成分回归方程还原回原始变量的形式
12.6 项目总结与讨论
第13章 打败sars
13.1 案例背景
13.2 数据理解与数据准备
13.3 “非典”信息关注倾向的多维偏好分析
13.4 突发事件险种购买倾向的多重对应分析
13.5 “非典”对未来生活方式的影响
13.6 项目总结与讨论
第14章 住院费用影响因素挖掘
14.1 案例背景
14.2 数据理解与数据准备
14.3 采用聚类分析寻找费用类型
14.4 住院费用影响因素的神经网络分析
14.5 不同疗法疗效与费用比较的神经网络分析
14.6 项目总结与讨论

第四部分 数据挖掘案例精选
第15章 淘宝大卖家之营销数据分析
15.1 案例背景
15.2 利用rfm模型定位促销名单
15.3 寻找有重购行为买家的特征
15.4 总结与讨论
第16章 超市商品购买关联分析
16.1 案例背景
16.2 数据准备
16.3 商品购买关联分析
16.4 结果应用
第17章 电信业客户流失分析
17.1 案例背景
17.2 商业理解
17.3 数据理解与数据准备
17.4 建立模型与模型评估
17.5 模型的应用及营销预演
17.6 总结与讨论
第18章 信用风险评分方法
18.1 案例背景
18.2 商业理解
18.3 数据理解与数据准备
18.4 建立模型与模型评估
18.5 对若干问题的说明
第19章 医疗保险业的欺诈发现
19.1 案例背景
19.2 商业理解
19.3 数据理解与数据准备
19.4 建立模型
19.5 结果发布
19.6 进一步阅读
第20章 电子商务中的数据挖掘应用
20.1 案例背景
20.2 数据理解
20.3 数据准备
20.4 建立模型与模型发布
20.5 进一步阅读

附录
附录a 本书光盘内容介绍
附录b spss软件的安装与激活
附录c 书中统计方法、模型与知识点
索引
附录d ibm spss statiscs函数一览表
附录e ibm spss modeler节点功能简介
参考文献
后记

精彩书摘

  6.5分析结论与讨论
  6.5.1分析结论
  综上分析,本研究的基本结论如下:
  在10种样品中,大致可分为两个评价层次,口味评分较高的是香*、海*、子*和两种试制品,它们之间无差异。两种试制品的人群测试效果应当是令人满意的,可以考虑投入生产,推向市场。
  在研究涉及的4个城市中,受访者对相同样品的评分有所差异,广州的平均评分低于北京、上海和成都。
  本次研究中未发现品牌和城市间存在交互作用,即品牌口味评分间的差异在不同城市间是相同的,尚未发现特殊的地域偏好。
  6.5.2Bonehmark:用还是不用
  在新品上市研究或者满意度研究中,方差分析是常用的统计模型。一般而言,当新产品研制出来后,客户总是希望它能够超越目前市场上的大部分同类产品(无论这种同类产品是本公司还是竞争对手的产品)。因此,为了保证分析结果能够贴近实际销售市场,在研究设计中会考虑将市场上现有的主流产品加入,将其作为比较基准(Benchmark),这个被加入的产品可以是希望替换的本公司产品,也可以是希望打败的主要竞争对手的产品。这样新品效果测试中常见的研究组合可能有如下类型:
  所有待研究的新品+希望替换的现有产品。
  所有待研究的新品+竞争对手的主打产品。
  所有待研究的新品+希望替换的现有产品+竞争对手的主打产品。
  根据统计学理论,配对或配伍研究设计的效率远远高于普通的成组设计,因此最佳的设计方案是让每一位受访者对所有的样品均给出评价。但是,在测试样品较多时,这实际上是不现实的,因为过于冗长的反复测试只能得到高度失真的劣质数据。此时可能需要采用更精巧的不完全设计,比如每位受访者只试用其中的两种或者三种样品,在研究设计正确时,使用方差分析模型仍然可以将全部数据连接起来,最终给出正确的检验结论。
  在经费充足的情况下,为了保证和Benchmarlk样品比较结果的精确性,还可以对以上设计方法作进一步的优化,例如要求每位受访者都评价Benchmark和一种新样品,这样所有新样品和Benchmark都有直接比较的结果,因而更为精确。虽然从统计效能的角度讲,这样做并不合算,但是由于客户较易接受这种简单明了的设计,且确实能达到提高和Benchmark比较精度的目的,因此当经费充足时,也可以考虑此种方式。
  再来看本案例的设计。首先,由于本研究中所涉及的一些其他研究目的的限制,在研究中无法采用每位受访者品尝多种样品的配对或配伍设计方式,只能采用每位受访者只品尝一种样品进行评分的方式。其次,实际上在本研究设计中并未明确加入基准样品,也就是该企业希望用新品替换的老产品并未在设计中出现,这样做的原因在于该企业认为目前正在研制的新产品其各项指标都有改进,研究者有充分的信心认为任何一种新配方的效果至少不会低于现有产品,因此不需要进行这种比较。虽然不使用Benchmark是不太常见的做法,但在本研究中应当是可行的。也就是说,真正在统计分析和统计设计中,对相应的统计原则要加以灵活使用,切不可照本宣科,脱离实际。
  ……

前言/序言

  所谓艺术,就是指如果只靠系统地学习既有知识体系,但自身不具备相当的天赋,或者没有经过长期实践以积累经验和激发灵感,始终难以登堂入室成为大师的那些学科;音乐、舞蹈、绘画等就是如此。大英百科全书就把统计学定义为:一门收集数据、分析数据,并根据数据进行推断的艺术和科学。显然,作为一门应用学科,统计学非常强调实战能力。一名出色的统计师需要通过经历各种各样的实战分析项目来吸取经验、教训以便持续成长。光靠操作教科书上那些标准案例,他只能成为工匠,而不能成为大师。
  近年来,随着计算机技术的飞速发展,统计工具出现了日新月异的变化,大大提高了其可用性。统计学和数据库技术、人工智能技术的融合,更是进一步催生了数据挖掘这个目前炙手可热,也更强调实战能力的领域。具体到SPSS系列产品,随着IBM的并购,原先的SPSS软件已经成为IBM SPSS Statstics,它定位于标准的统计分析需求,而更贴近企业用户的数据分析与挖掘的需求则由IBMSPSSModelel‘来满足。分析工具的高度易用性和实战需求的同步发展,使得各行各业对统计分析和数据挖掘人员的需求呈现爆炸性增长,远远超过了正常培养周期能够提供的数量,而广大统计分析人员也迫切希望能够得到的是一本讲解提高实战操作技能的书,而不是单纯以介绍某一种统计软件为目的的参考书,以便帮助自己迅速提升实战能力。因此,笔者便有了编写这样一本书的打算。
  笔者先后于2000年、2002年和2004年编写过三轮SPSS教程/参考书,均获得了读者的好评。作为在数据分析领域从业十余年的统计专业人员,本书的作者深知在漫长的经验积累阶段所需要付出的努力和汗水,更能体会到编写一本实战案例书的市场价值。虽然作者从业以来经手的分析案例有上千个,但很多优秀案例都因涉及相应公司的业务机密而无法和读者分享。而且案例的复杂程度和代表性也颇费思量,过于复杂会牵扯太多的具体业务细节,影响案例的可读性,而案例过于简单,则无法展示实战分析中可能遇到的各种情况,参考价值不大。在反复讨论之后,笔者最终决定编写此书,因为这件事情有利于推动数据分析行业的发展,非常值得去做。