基本信息
- 商品名称:Java数据科学指南
- 作者:(加)鲁什迪·夏姆斯|译者:武传海
- 定价:79
- 出版社:人民邮电
- ISBN号:9787115481634
其他参考信息(以实物为准)
- 出版时间:2018-06-01
- 印刷时间:2018-06-01
- 版次:1
- 印次:1
- 开本:16开
- 包装:平装
- 页数:302
- 字数:396千字
内容提要
现如今,数据科学已经成为一个热门的技术领域
,它涵盖了人工智能的各个方面,例如数据处理、信
息检索、机器学习、自然语言处理、数据可视化等。
而Java作为一门经典的编程语言,在数据科学领域也
有着杰出的表现。
鲁什迪·夏姆斯著的《Java数据科学指南》旨在
通过Java编程来引导读者 好地完成数据科学任务。
本书通过9章内容,详细地介绍了数据获取与清洗、
索引的建立和检索数据、统计分析、数据学习、信息
的提取、大数据处理、深度学习、数据可视化等重要
主题。
本书适合想通过Java解决数据科学问题的读者,
也适合数据科学领域的专业人士以及普通Java开发人
员阅读。
目录
第 1章 获取数据与清洗数据1
1.1 简介
1.2 使用Java从分层目录中提取所有文件名
准备工作
操作步骤
1.3 使用Apache Commons IO从多层目录中提取所有文件名
准备工作
操作步骤
1.4 使用Java 8从文本文件一次性读取所有内容
操作步骤
1.5 使用Apache Commons IO从文本文件一次性读取所有内容
准备工作
操作方法
1.6 使用Apache Tika提取PDF文本
准备知识
操作步骤
1.7 使用正则表达式清洗ASCII文本文件
操作步骤
1.8 使用Univocity解析CSV文件
准备工作
操作步骤
1.9 使用Univocity解析TSV文件
准备工作
操作步骤
1.10 使用JDOM解析XML文件
准备工作
操作步骤
1.11 使用JSON.simple编写JSON文件
准备工作
操作步骤
1.12 使用JSON.simple读取JSON文件
……
第2章 为数据建立索引与搜索数据
第3章 数据统计分析
第4章 数据学习Ⅰ
第5章 数据学习Ⅱ
第6章 从文本数据提取信息
第7章 处理大数据
第8章 数据深度学习
第9章 数据可视化