JAVA机器学习乌黛·卡马特,克里希纳·肖佩拉(K
更新日期:2024-07-13 00:59:56
书店:辽宁出版集团图书专营店
浏览量:1101
价格:0.0¥

书籍下载

内容介绍

作  者:(美)乌黛·卡马特(Dr. Uday Kamath), 克里希纳·肖佩拉(K 著 陈瑶 陈峰 刘江一 等译 译
定  价:89
出 版 社:机械工业出版社
出版日期:2017年02月01日
页  数:340
装  帧:平装
ISBN:9787111609193
主编推荐
本书详细讲解机器学习中的不错技术,包括分类、聚类、离群值检测、流学习、主动学习、半监督学习、概率图建模、文本挖掘、深度学习以及大数据批处理与流机器学习。相应的,每一章的示例及现实世界的案例研究展示了如何使用完整的方以及目前可用的基于Java的佳工具,来应用刚刚学习的技术。对于解决各个领域中数据科学方面的问题,以及构建强大的机器学习模型所需要的工具和技术,读完本书之后,你都会有所了解。通过阅读本书,你将:•掌握关键的Java机器学习库,通过理论和实践指导,发掘可以解决的每一类问题等
目录
推荐序译者序前言作者简介审校者简介章  机器学习回顾1  1.1  机器学习历史和定义2  1.2  哪些不属于机器学习3  1.3  机器学习概念和术语4  1.4  机器学习类型及其子类6  1.5  用于机器学习的数据集8  1.6  机器学习的应用10  1.7  机器学习中的实际问题10  1.8  机器学习角色与过程111.8.1  角色121.8.2  过程12  1.9  机器学习工具和数据集14  1.10  小结16第2章  监督学习在现实世界中的实践方法18  2.1  正式描述和符号192.1.1  数据质量分析202.1.2  描述性数据分析202.1.3  可视化分析20  2.2  数据转换与预处理212.2.1  特征构造222.2.2  处理缺失值222.2.3  离群值232.2.4  离散化242.2.5  数据采样242.2.6  训练集、验证集和测试集26  2.3  特征关联分析与降维282.3.1  特征搜索技术292.3.2  特征评估技术29  2.4  模型建立322.4.1  线性模型322.4.2  非线性模型352.4.3  集成学习和元学习器40  2.5  模型评价、评估和比较422.5.1  模型评价422.5.2  模型评估指标432.5.3  模型比较45  2.6  Horse Colic分类案例研究472.6.1  业务问题482.6.2  机器学习映射482.6.3  数据分析482.6.4  监督学习实验492.6.5  结果、观察和分析58  2.7  小结60  2.8  参考文献61第3章  无监督机器学习技术63  3.1  与监督学同存在的问题63  3.2  无监督学习的特定问题  3.3  特征分析和降维3.3.1  符号3.3.2  线性方法3.3.3  非线性方法67  3.4  聚类703.4.1  聚类算法703.4.2  谱聚类753.4.3  仿射传播753.4.4  聚类的验证和评估77  3.5  离群值或异常值检测793.5.1  离群值算法793.5.2  离群值评估技术85  3.6  实际案例研究863.6.1  工具和软件863.6.2  业务问题863.6.3  机器学习映射863.6.4  数据收集873.6.5  数据质量分析873.6.6  数据采样和转换883.6.7  特征分析和降维883.6.8  聚类模型、结果和评估913.6.9  离群值模型、结果和评估94  3.7  小结95  3.8  参考文献95第4章  半监督学习和主动学习98  4.1  半监督学习994.1.1  表示、符号和假设条件994.1.2  半监督学习技术1014.1.3  半监督学习的案例研究106  4.2  主动学习1114.2.1  表示和符号1124.2.2  主动学习场景1124.2.3  主动学习方法1124.2.4  不确定性采样1124.2.5  版本空间采样1134.2.6  数据分布采样115  4.3  主动学习中的案例研究11.3.1  工具和软件11.3.2  业务问题11.3.3  机器学习映射11.3.4  数据采集1174.3.5  数据采样和转换1174.3.6  特征分析和降维1174.3.7  模型、结果和评估1174.3.8  主动学习结果分析121  4.4  小结121  4.5  参考文献122第5章  实时流机器学习123  5.1  假设条件和数学符号124  5.2  基本的流处理和计算技术1245.2.1  流计算1245.2.2  滑动窗口1255.2.3  采样126  5.3  概念漂移和漂移探测1275.3.1  数据管理1285.3.2  局部内存128  5.4  增量监督学习1305.4.1  建模技术1305.4.2  在线环境的验证、评估和比较136  5.5  使用聚类的增量无监督学习138  5.6  使用离群值检测的无监督学习1485.6.1  基于分区的聚类离群值检测1485.6.2  基于距离的聚类离群值检测149  5.7  流学习案例研究1515.7.1  工具和软件1525.7.2  业务问题1525.7.3  机器学习映射1525.7.4  数据采集1535.7.5  数据采样和转换1545.7.6  模型、结果和评估1555.7.7  流学习结果分析158  5.8  小结160  5.9  参考文献160第6章  概率图建模163  6.1  回顾概率163  6.2  图的概念1666.2.1  图的结构和属性1666.2.2  子图和团1676.2.3  路、迹和环167  6.3  贝叶斯网络1686.3.1  表示1696.3.2  推断1716.3.3  学习180  6.4  马尔可夫网络和条件随机场1866.4.1  表示1876.4.2  推断1886.4.3  学习1896.4.4  条件随机场189  6.5  特殊网络1906.5.1  树增强型网络1906.5.2  马尔可夫链190  6.6  工具和使用1936.6.1  OpenMarkov1936.6.2  Weka贝叶斯网络图形界面194  6.7  案例研究1946.7.1  业务问题1966.7.2  机器学习映射1966.7.3  数据采样和转换1966.7.4  特征分析1966.7.5  模型、结果和评估1976.7.6  结果分析200  6.8  小结201  6.9  参考文献201第7章  深度学习203  7.1  多层前馈神经网络2037.1.1  输入、神经元、激活函数和数学符号2037.1.2  多层神经网络204  7.2  神经网络的局限209  7.3  深度学习210  7.4  案例研究2317.4.1  工具和软件2327.4.2  业务问题2327.4.3  机器学习映射2337.4.4  数据采样和转换2337.4.5  特征分析2337.4.6  模型、结果和评估233  7.5  小结242  7.6  参考文献243第8章  文本挖掘和自然语言处理245  8.1  NLP及其子领域和任务2468.1.1  文本分类2478.1.2  词性标注2478.1.3  文本聚类2478.1.4  信息抽取和命名实体识别2478.1.5  情感分析和观点挖掘2478.1.6  指代消解2488.1.7  词义消歧2488.1.8  机器翻译2488.1.9  语义推理及推断2498.1.10  文本摘要2498.1.11  自动问答249  8.2  挖掘非结构化数据的问题249  8.3  文本处理和转换2508.3.1  文档收集与标准化2508.3.2  词元化2518.3.3  停止词移除2518.3.4  词干提取或词形还原2518.3.5  局部/全局字典或词汇表2528.3.6  特征抽取/生成2538.3.7  特征表示和相似度2558.3.8  特征选择和降维258  8.4  文本挖掘主题2598.4.1  文本分类2608.4.2  主题建模2608.4.3  文本聚类2638.4.4  命名实体识别2678.4.5  深度学习与NLP270  8.5  工具和使用2728.5.1  Mallet2728.5.2  用Mallet进行主题建模2738.5.3  业务问题2748.5.4  机器学习映射2748.5.5  数据采集2748.5.6  数据采样和转换2758.5.7  特征分析和降维2768.5.8  模型、结果和评估2768.5.9  文本处理结果分析277  8.6  小结278  8.7  参考文献278第9章  大数据机器学习:终领域281  9.1  大数据的特点283  9.2  大数据机器学习283  9.3  批量大数据机器学习290  9.4  案例研究2949.4.1  业务问题2969.4.2  机器学习映射2969.4.3  数据采集2969.4.4  数据采样和转换2969.4.5  使用Spark MLlib作为大数据机器学台298  9.5  实时大数据机器学习305  9.6  机器学习的未来310  9.7  小结310  9.8  参考文献311附录A  线性代数313附录B  概率论317
内容虚线

内容简介

本书涵盖了机器学习中的经典技术,如分类、聚类、降维、离群值检测、半监督学习和主动学习。同时介绍了近期高深的主题,包括流数据学习、深度学习以及大数据学习的挑战。每一章指定一个主题,包括通过案例研究,介绍前沿的基于Java的工具和软件,以及完整的知识发现周期:数据采集、实验设计、建模、结果及评估。每一章都是独立的,提供了很大的使用灵活性。附带的网站提供了源码和数据。对于学生和数据分析从业员来说,这确实很难得,大家可以直接用刚学到的方法进行实验,或者通过将这些方法应用到真实环境中,加深对它们的理解。
作者简介
(美)乌黛·卡马特(Dr. Uday Kamath), 克里希纳·肖佩拉(K 著 陈瑶 陈峰 刘江一 等译 译
Uday Kamath博士是BAE系统应用智能公司的首席数据科学家,专门研究可扩展机器学习,并在反洗钱(AML)、金融犯罪欺诈检验、网络空间安全和生物信息学领域拥有20年的研究经验。Kamath博士负责BAE系统应用智能公司AI部门核心产品的研究分析,这些产品涉及的领域有行为科学、社交网络和大数据机器学习方面。在Kenneth De Jong博士的指导下,他获得了乔治梅森大学的博士学位,他的论文研究聚焦于大数据和自动化序列挖掘的机器学习领域。Krishna Choppella在BAE系统应用智能公司的角色是作为解决方案架构师,构建工具和客户解决方案。他有20年的Java编程经验,主要兴趣是数据等
摘要
内容待完善