虽说自然语言处理(Natural Language Processing, NLP)技术的历史并不悠久,却有着自身成熟的理论体系,覆盖多门学科,比如数学、计算机科学、语言学、认知心理学等基础知识,同时它又是一门应用性极强的技术,在很多领域都具备落地性。这种理论加实际操作能力的要求对初学者形成了双重困难。通俗地阐述基本的、必备的理论知识,克服困难,使读者能够快速从容地上手实际项目,成为一名初级自然语言处理工程师,这是本书的目标。
本书浓缩编者多年的知识积累和实务工作经验奉献于读者朋友。书中采用大量的图示与代码案例分析,将枯燥复杂的理论知识用平实的语言娓娓道来,让读者在熟悉的场景中能够动态地理解专业知识。在具体内容安排上,抛开深奥的理论化条文,除了必备的基础理论、知识介绍外,不贪多求全,强调实务操作、快速上手——从如何对文本数据进行预处理、基础分析到实用的自然语言处理实践任务如文本摘要生成、聊天系统等,让读者循序渐进地入门系统的自然语言处理技术。随着本书的讲解,读者的自然语言处理学习之旅一定会成为一番难忘的快乐体验。
本书特色
1内容安排实用实在、详略得当,符合初学者的认知规律
本书内容涵盖了从自然语言数据处理、基础任务(如分词、词性标注、命名实体识别等)到实战性任务(如文本分类、文本摘要、聊天系统等)所必须掌握的知识,从内容结构上非常注重知识的实用性和可操作性。必须掌握的细节处不吝笔墨,辅以图表以及代码加深读者印象;对仅需要大致了解处简要介绍一些相关理论及前沿动态。这样的安排使得初学者能够掌握必备知识,了解并思考学术前沿及行业应用,符合初学者对自然语言处理知识的认知规律。
2行文简单直白,以实例引导理论,特别适合初学者阅读
本书行文简单直白,全程都有相应的实例作为引导,对于比较难的内容尽量以举例的形式帮助读者理解。在介绍这些知识时,并不是教条式的,填鸭式的讲解,而是尽量以平实化的语言讲解相关理论,犹如帮助一位老朋友,一步步地成为初级自然语言处理工程师。
3设置思考题以及项目代码,激发初学者的热情与兴趣
本书的每一章都设置有相应的思考题,并在附录中提供了相关参考答案;读者可以自测对章节内容的学习的掌握程度。此外,本书章节介绍的代码实例,相关的电子版本会随书赠予,使读者能够进行实践操作,更加深入地理解知识。这些实践内容是学习自然语言处理过程中必不可少的环节,通过思考题以及代码的操作练习,能够使读者朋友快速地入门自然语言处理。
自然语言处理从入门到实战
本书内容及体系结构
第一部分自然语言处理核心技术
第1章自然语言处理初探
本章主要为读者朋友介绍,在这短短不到一百年的时间里,自然语言处理早期的发展历程,近些年突飞猛进的发展,以及自然语言处理的基本任务,在各行各业中的应用和基本的工具框架。
第2章自然语言处理与机器学习
本章主要介绍一些常见机器学习模型的原理、对比分析各类机器学习模型的优缺点以及机器学习工具库的使用。
第3章自然语言处理与神经网络
本章将为大家揭开深度学习的神秘面纱,主要介绍神经网络的基本结构以及一些常见的训练过程中的优化方案。
第二部分自然语言处理基本任务
第4章文本预处理
本章主要介绍文本预处理的基础项目以及相关工具、关键词提取的一些常用的方法以及数据不平衡的处理方法。
第5章文本的表示技术
本章将纵向梳理文本表示技术的发展脉络,分析各类表示方法的优缺点。
第6章序列标注
本章将为大家介绍一些常见的序列标注场景以及不同场景下的应用模型。
第7章关系抽取
本章主要讲解关系抽取的主要方法、前沿研究以及相关的应用框架。
第三部分自然语言处理高级任务
第8章知识图谱
本章主要介绍知识图谱的相关概念、技术、应用等。
第9章文本分类
本章主要介绍基本的文本分类方法以及相关工具的应用。
第10章文本摘要
本章主要介绍自动文本摘要中的两大类型,抽取式(extractive)摘要和生成式(abstractive)摘要,并且通过代码搭建演示两个简单版本的抽取式摘要生成器。
第11章机器翻译
本章主要介绍机器翻译的历史、相关技术原理、现状与不足等,通过本章的学习,读者将了解机器翻译的源起、统计机器翻译的原理、神经机器翻译的原理以及常见的改进版本的神经机器翻译模型。
第12章聊天系统
本章节主要介绍聊天系统的基本类型及应用、关键技术,并且用代码演示开发一款简单的闲聊系统。
第四部分自然语言处理求职
第13章自然语言处理技术的现在、未来及择业
最后一章为有志于入门或从事自然语言处理的读者提供更多的、与自然语言处理相关的常识性及实用性内容,比如学术界、工业界等方面的研究现状、未来发展热点、如何准备面试等。
本书读者对象
有一定的编程及机器学习基础,想入门自然语言处理的读者
因为兴趣,想系统性地了解自然语言处理的读者
准备求职自然语言处理初级岗位的读者
虽说自然语言处理(Natural Language Processing, NLP)技术的历史并不悠久,却有着自身成熟的理论体系,覆盖多门学科,比如数学、计算机科学、语言学、认知心理学等基础知识,同时它又是一门应用性极强的技术,在很多领域都具备落地性。这种理论加实际操作能力的要求对初学者形成了双重困难。通俗地阐述基本的、必备的理论知识,克服困难,使读者能够快速从容地上手实际项目,成为一名初级自然语言处理工程师,这是本书的目标。
本书浓缩编者多年的知识积累和实务工作经验奉献于读者朋友。书中采用大量的图示与代码案例分析,将枯燥复杂的理论知识用平实的语言娓娓道来,让读者在熟悉的场景中能够动态地理解专业知识。在具体内容安排上,抛开深奥的理论化条文,除了必备的基础理论、知识介绍外,不贪多求全,强调实务操作、快速上手——从如何对文本数据进行预处理、基础分析到实用的自然语言处理实践任务如文本摘要生成、聊天系统等,让读者循序渐进地入门系统的自然语言处理技术。随着本书的讲解,读者的自然语言处理学习之旅一定会成为一番难忘的快乐体验。
本书特色
1内容安排实用实在、详略得当,符合初学者的认知规律
本书内容涵盖了从自然语言数据处理、基础任务(如分词、词性标注、命名实体识别等)到实战性任务(如文本分类、文本摘要、聊天系统等)所必须掌握的知识,从内容结构上非常注重知识的实用性和可操作性。必须掌握的细节处不吝笔墨,辅以图表以及代码加深读者印象;对仅需要大致了解处简要介绍一些相关理论及前沿动态。这样的安排使得初学者能够掌握必备知识,了解并思考学术前沿及行业应用,符合初学者对自然语言处理知识的认知规律。
2行文简单直白,以实例引导理论,特别适合初学者阅读
本书行文简单直白,全程都有相应的实例作为引导,对于比较难的内容尽量以举例的形式帮助读者理解。在介绍这些知识时,并不是教条式的,填鸭式的讲解,而是尽量以平实化的语言讲解相关理论,犹如帮助一位老朋友,一步步地成为初级自然语言处理工程师。
3设置思考题以及项目代码,激发初学者的热情与兴趣
本书的每一章都设置有相应的思考题,并在附录中提供了相关参考答案;读者可以自测对章节内容的学习的掌握程度。此外,本书章节介绍的代码实例,相关的电子版本会随书赠予,使读者能够进行实践操作,更加深入地理解知识。这些实践内容是学习自然语言处理过程中必不可少的环节,通过思考题以及代码的操作练习,能够使读者朋友快速地入门自然语言处理。
自然语言处理从入门到实战
前言
本书内容及体系结构
第一部分自然语言处理核心技术
第1章自然语言处理初探
本章主要为读者朋友介绍,在这短短不到一百年的时间里,自然语言处理早期的发展历程,近些年突飞猛进的发展,以及自然语言处理的基本任务,在各行各业中的应用和基本的工具框架。
第2章自然语言处理与机器学习
本章主要介绍一些常见机器学习模型的原理、对比分析各类机器学习模型的优缺点以及机器学习工具库的使用。
第3章自然语言处理与神经网络
本章将为大家揭开深度学习的神秘面纱,主要介绍神经网络的基本结构以及一些常见的训练过程中的优化方案。
第二部分自然语言处理基本任务
第4章文本预处理
本章主要介绍文本预处理的基础项目以及相关工具、关键词提取的一些常用的方法以及数据不平衡的处理方法。
第5章文本的表示技术
本章将纵向梳理文本表示技术的发展脉络,分析各类表示方法的优缺点。
第6章序列标注
本章将为大家介绍一些常见的序列标注场景以及不同场景下的应用模型。
第7章关系抽取
本章主要讲解关系抽取的主要方法、前沿研究以及相关的应用框架。
第三部分自然语言处理高级任务
第8章知识图谱
本章主要介绍知识图谱的相关概念、技术、应用等。
第9章文本分类
本章主要介绍基本的文本分类方法以及相关工具的应用。
第10章文本摘要
本章主要介绍自动文本摘要中的两大类型,抽取式(extractive)摘要和生成式(abstractive)摘要,并且通过代码搭建演示两个简单版本的抽取式摘要生成器。
第11章机器翻译
本章主要介绍机器翻译的历史、相关技术原理、现状与不足等,通过本章的学习,读者将了解机器翻译的源起、统计机器翻译的原理、神经机器翻译的原理以及常见的改进版本的神经机器翻译模型。
第12章聊天系统
本章节主要介绍聊天系统的基本类型及应用、关键技术,并且用代码演示开发一款简单的闲聊系统。
第四部分自然语言处理求职
第13章自然语言处理技术的现在、未来及择业
最后一章为有志于入门或从事自然语言处理的读者提供更多的、与自然语言处理相关的常识性及实用性内容,比如学术界、工业界等方面的研究现状、未来发展热点、如何准备面试等。
本书读者对象
有一定的编程及机器学习基础,想入门自然语言处理的读者
因为兴趣,想系统性地了解自然语言处理的读者
准备求职自然语言处理初级岗位的读者