深入浅出Embedding:原理解析与应用实践pdf下载pdf下载

深入浅出Embedding:原理解析与应用实践百度网盘pdf下载

作者:
简介:本篇主要提供深入浅出Embedding:原理解析与应用实践pdf下载
出版社:机械工业出版社自营官方旗舰店
出版时间:2021-06
pdf下载价格:9.00¥


预览


内容介绍

产品特色

编辑推荐

适读人群 :所有从事人工智能技术领域的研究者和开发者。

(1)作者背景资深:作者是有20余年从业经验的AI技术专家和高级数据科学家。
(2)豪华专家阵容:黄铁军(中国人工智能学会会士/北京智源人工智能研究院院长)、周明(创新工场首席科学家/中国计算机学会副理事长)。
(3)内容系统全面:系统讲解了Embedding的基础、技术、原理、方法和性能优化。
(4)注重实操:详细列举和分析Embedding在机器学习性能提升、中英文翻译、推荐系统等6个重要场景的应用实践。
(5)学习门槛低:秉承复杂问题简单化原则,避免艰涩难懂数学公式,尽可能采用可视化的表达方式,内容循序渐进。

内容简介

这是一本系统、全面、理论与实践相结合的Embedding技术指南,由资深的AI技术专家和高级数据科学家撰写,得到了黄铁军、韦青、张峥、周明等中国人工智能领域的领军人物的一致好评和推荐。

在内容方面,本书理论与实操兼顾,一方面系统讲解了Embedding的基础、技术、原理、方法和性能优化,一方面详细列举和分析了Embedding在机器学习性能提升、中英文翻译、推荐系统等6个重要场景的应用实践;在写作方式上,秉承复杂问题简单化的原则,尽量避免复杂的数学公式,尽量采用可视化的表达方式,旨在降低本书的学习门槛,让读者能看得完、学得会。

全书一共16章,分为两个部分:

第1部分(第1~9章)Embedding理论知识

主要讲解Embedding的基础知识、原理以及如何让Embedding落地的相关技术,如TensorFlow和PyTorch中的Embedding层、CNN算法、RNN算法、迁移学习方法等,重点介绍了Transformer和基于它的GPT、BERT预训练模型及BERT的多种改进版本等。

第二部分(第10 ~16章)Embedding应用实例

通过6个实例介绍了Embedding及相关技术的实际应用,包括如何使用Embedding提升传统机器学习性,如何把Embedding技术应用到推荐系统中,如何使用Embedding技术提升NLP模型的性能等。


作者简介

吴茂贵

资深大数据和人工智能技术专家,在BI、数据挖掘与分析、数据仓库、机器学习等领域工作超过20年。在基于Spark、TensorFlow、PyTorch、Keras等的机器学习和深度学习方面有大量的工程实践实践,对Embedding有深入研究。

著有《深度实践Spark机器学习》《Python深度学习:基于TensorFlow》《Python深度学习:基于Pytorch》等多部著作,广受读者好评。

王红星

高级数据科学家,任职于博世(中国)投资有限公司苏州分公司,负责BOSCH数据湖,数据分析与人工智能相关的产品与服务的设计和开发。在大数据、机器学习、人工智能方面有丰富的实践经验。


精彩书评

Embedding(嵌入)是当下人工智能领域的热点,并发挥着越来越重要的作用。本书从Embedding基础概念和方法讲起,逐渐深入其原理,并以应用实例作为辅助,是快速了解并掌握Embedding的参考指南。

——黄铁军 中国人工智能学会会士/北京智源人工智能研究院院长

机器学习的范式一直在迅速发展,讲解机器学习原理与应用的书籍可谓汗牛充栋,但是很少看到把Embedding技术讲解透彻的书籍。本书深入浅出地讲解了Embedding的来龙去脉,采用大量案例和可视化的写作方法,降低了Embedding理论和技术的学习门槛;同时将基本原理和代码实现相结合,能够帮助读者快速将理论与实践融会贯通。

——韦青 微软中国首席技术官

如果模型是大楼,那么Embedding就是砖瓦,Embedding是人工智能领域的基本元素和核心操作,我个人认为也是脑和类脑衔接的桥梁。本书对Embedding基础知识的讲解比较全面,也有很多实战的例子,涵盖了目前比较常用的视觉和自然语言处理中的Embedding范式及其在模型中的应用,比较适合初学者。推荐。

——张峥 上海纽约大学计算机系终身教授,亚马逊云计算上海AI研究院院长

Embedding及其相关模型发展很快,已成为深度学习领域的研究热点和重点。本书不仅有针对性地讲解了Embedding的基础知识和原理,而且还给出了大量应用案例,如用Embedding提升机器学习性能和NLP模型性能等,原理与实践紧密结合。

——周明 创新工场首席科学家/中国计算机学会副理事长/ACL主席(2019)

前言/序言

为什么写这本书

近年来,视觉处理和自然语言处理(NLP)技术都取得了不小的进步。更可喜的是,这些新技术的落地和应用也带动了相关领域如传统机器学习、推荐、排序等的快速发展。

这些新技术的背后都离不开Embedding(嵌入)技术,Embedding已成为这些技术的基本元素和核心操作。Embedding起源于Word Embedding,经过多年的发展,已取得长足进步。从横向发展来看,由原来单纯的Word Embedding,发展成现在的Item Embedding、Entity Embedding、Graph Embedding、Position Embedding、Segment Embedding等;从纵向发展来看,由原来静态的Word Embedding发展成动态的预训练模型,如ELMo、BERT、GPT、GPT-2、GPT-3、ALBERT、XLNet等,这些预训练模型可以通过微调服务下游任务。Embedding不再固定不变,从而使这些预训练模型可以学习到新的语义环境下的语义,高效完成下游的各种任务,如分类、问答、摘要生成、阅读理解等,其中有很多任务的完成效率已超过人工完成的平均水平。

这些技术不但强大,而且非常实用。掌握这些技术因而成为当下很多AI技术爱好者的迫切愿望。本书就是为实现广大AI技术爱好者这个愿望而写的!

虽然本书不乏新概念、新内容,但仍采用循序渐进的方法。为了让尽可能多的人掌握这些技术,书中先介绍相关基础知识,如语言模型、迁移学习、注意力机制等,所以无须担心没有基础看不懂本书。然后,本书通过多个典型实例,使用最新版本的PyTorch或TensorFlow实现一些核心代码,并从零开始介绍如何实现这些实例,如利用Transformer进行英译中、使用BERT实现对中文语句的分类、利用GPT-2实现文本生成等。为了帮助大家更好地理解各种原理和逻辑,书中尽量采用可视化的讲解方法,并辅以相关关键公式、代码实例进一步说明。总而言之,无须担心没有高等数学背景无法看懂、看透本书。

本书特色

本书把基本原理与代码实现相结合,并精准定位切入点,将复杂问题简单化。书中使用大量可视化方法说明有关原理和逻辑,并用实例说明使抽象问题具体化。

读者对象

对机器学习、深度学习,尤其是NLP最新进展感兴趣的在校学生、在职人员。

有一定PyTorch、TensorFlow基础,并希望通过解决一些实际问题来进一步提升这方面水平的AI技术爱好者。

对机器学习、推荐排序、深度学习等前沿技术感兴趣的读者。

如何阅读本书

本书分为两部分,共16章。

第一部分为Embedding基础知识(第1~9章),重点介绍了Embedding技术的发展历史及最新应用,并对各种预训练模型涉及的基础知识做了详细说明,如语言模型、迁移学习、注意力机制等。第1章说明万物皆可嵌入;第2章讲解如何获取Embedding;第3、4章分别介绍视觉处理、文本处理方面的基础知识;第5章为本书重点,介绍了多种注意力机制;第6~8章介绍了ELMo、BERT、GPT、XLNet等多种预训练模型;第9章介绍了推荐排序系统。

第二部分为Embedding应用实例(第10~16章),以实例为主介绍了Embedding技术的多种应用,以及使用新技术解决NLP方面的一些问题。第10章介绍如何使用Embedding处理机器学习中的分类特征;第11章介绍如何使用Embedding提升机器学习性能;第12章介绍如何使用Transformer实现将英文翻译成中文;第13章介绍Embedding在推荐系统中的前沿应用;第14章介绍如何使用BERT实现中文语句分类问题;第15章介绍如何使用GPT-2实现文本生成;第16章是对Embedding技术的总结。

勘误和支持

由于笔者水平有限,加之编写时间仓促,书中难免出现错误或不准确的地方,恳请读者批评指正。你可以通过访问http://www.feiguyunai.com下载代码和数据,也可以通过邮箱(wumg3000@163.com)进行反馈。非常感谢你的支持和帮助,也非常欢迎大家加入图书群(QQ:799038260)进行在线交流。

致谢

在本书编写过程中,我得到了很多同事、朋友、老师和同学的支持!感谢刘未昕、张粤磊、张魁等同事的支持(他们负责整个环境的搭建和维护),感谢博世王冬的鼓励和支持!感谢上海交大慧谷的程国旗老师,上海大学的白延琴老师、李常品老师,上海师范大学的田红炯老师、李昭祥老师,赣南师大的许景飞老师等的支持和帮助!

感谢机械工业出版社杨福川老师、李艺老师给予本书的大力支持和帮助。

最后,感谢我的爱人赵成娟在繁忙的教学之余帮助审稿,并提出了不少改进意见和建议。

吴茂贵

2021年3月31日于上海