序 言
人工智能发展至今已经有几十年,期间经历了各种曲折历程,虽曾出现波峰,但更多的却是波谷。然而从21 世纪开始,随着算法、计算能力和大数据等相关科研技术的发展和突破,尤其是最近十几年互联网和移动互联网的快速崛起,现阶段人工智能已处于高速发展的时期,落地的应用和场景层出不穷,成为时代的“宠儿”。
以深度学习为代表的人工智能技术,正以一种深刻和特别的方式改变着我们的生活,极有可能与大数据技术一起引领第四次工业革命。因此,互联网一线公司都投入了大量资源,积极进行研究和尝试,希望利用人工智能技术来解决业务中的各类问题。
携程作为中国最大、世界第二大的互联网旅行服务公司,其结合自身的业务场景和海量出行数据,从多个方面对人工智能领域进行了积极探索。本书的作者们来自携程的多个研发部门,读者会发现从旅行产品的个性化推荐和搜索,到旅行场景的OCR、机器翻译和知识图谱,再到产品层面的主题图片优选、推荐理由抽取,以及安全风控和如何工程化提升研发效率,在本书中都有相应的阐述。当然,我们的工作才刚刚开始,我们相信人工智能技术会为旅行等服务领域带来巨大改变。
与传统的人工智能图书不同,本书不会偏重理论,是从具体业务场景来展现人工智能技术的落地方案,因此书中选取的都是真实的技术案例,作者编写本书的初衷也是希望让更多人参与到人工智能技术的实际研发中来。人工智能并不神秘,虽然人们的学习曲线较陡, 前仍在高速发展中,还有很多新的方向可以探索和落地,希望这本书可以抛砖引玉,给读者带来一定的收获。
携程长期秉承技术驱动产品和业务的理念,一直在积极地和行业内的技术同人进行交流和分享。我们相信,只要大家一起行动起来,合力打造一个开放和交流的技术生态圈,必将会让我们技术人得到真正的成长。
欢迎大家针对书中的内容进行深入探讨,如果发现问题或有更好的想法,期待能及时向我们提供反馈。旅行是带给人幸福的行业,如果有识之士希望通过技术实现“让旅行更幸福”,也欢迎加入携程的技术团队。我们对技术的价值和力量深信不疑。
携程技术副总裁 李小林
前 言
近年来,得益于深度学习和硬件计算能力的快速发展,人工智能技术正快速渗透到互联网应用的方方面面,这样的变化同样也伴随着携程产品技术的迭代更新。人工智能技术不仅直接提升了携程的订单收入、用户满意度等关键产品指标,还在业务运营、内容生产、信息安全与风险控制等方面发挥了重要作用。
携程作为OTA 领域的领军企业,积累了大量的用户出行场景数据、客服场景咨询与沟通数据、产品相关内容数据等,这些数据在机器学习模型的训练中发挥了巨大的作用。另外,携程有足够多的复杂场景,这些真实的复杂场景催生并推动了人工智能在携程中的广泛应用。同时,携程的产品线丰富且分支较多,因此将人工智能服务化和中台化成为必不可少的模块,它会对共性需求进行收口,以通用服务/ 中台的形式提供服务,有效降低部门之间的重复工作,节省开发成本,缩短开发周期。
与传统的人工智能书籍不同,本书更加关注如何将具体业务场景的问题分析和模型建模转化为具体的机器学习和深度学习问题,同时对于复杂业务场景,详细阐述了对应的算法架构体系,也介绍了如何更好地拟合各种业务指标,如自主率、点击率、人效比、网站的安全性等,最大限度地对业务进行赋能。作者希望通过具体的实践案例,给读者带来启发和借鉴。
作者介绍了OTA 场景在落地时的一些差异性问题,帮助用户理解在不同应用场景中可能遇到的一些差异性问题。例如,由于旅游产品的非标属性,用户在决策之前非常依赖内容化信息,因此携程在AI 内容化方面做了大量的工作和实践,帮助用户减少决策前的费力度;在同一酒店,不同的供应商和房型具有入住政策、软硬件设施和价格的差异,个性化推荐的召回池不是酒店实体,而是更加细分的入住政策、服务和设施,这些是入住体验的关键影响因素。
本书的内容安排如下。
第1 章和第2 章介绍了人工智能的一些基础原理,包括数学基础和模型构建,使读者快速回顾和了解算法中的一些基础内容,加深对后续章节中的技术细节的理解。
第3 章介绍了个性化推荐与搜索,如冷启动、个性化搜索、酒店排序、瀑布流排序等方面的实践,具体阐述如何利用算法为用户提供更好的优质服务。
第4 章介绍了携程在AI 服务化方面的工作,从旅游领域知识图谱、QA 问答、机器翻译和证件全文本识别四个方向进行详细阐述,这些方向都能够带给用户更好的服务体验、更细致的产品细节、更快速的问题解答、国际化的畅通体验和更便捷的操作服务。
第5 章和第6 章介绍了AI 如何有效提高工作人员在相关场景中的运营工作效率,从内容产品化、房态预测、用户模拟评分、邮件自动化、实时智能异常检测等多个方面进行了具体介绍,有效地发现了业务趋势和问题,并在一定条件下进行了自动处理。
第7 章和第8 章介绍了AI 在信息安全和风险控制方面的一些具体应用,详细阐述了对应的难点、目标和解决方案。
第9 ~ 11 章介绍了在AI 中台化方面的实践——AI 挖掘中台、AI 运营中台和通用数据服务,说明了在中台化建设中如何进行业务架构和系统架构规划。
本书面向的读者主要是人工智能领域的从业人员,包括产品和技术同人,同时也欢迎从事其他岗位和行业的读者通过阅读本书,对人工智能的原理和应用有一定的了解,一起探索和拓展人工智能的应用落地。对于想要入门的算法同人,建议详细阅读数学基础和模型构建章节,以便能够更好地结合理论和实践。没有相关数学知识背景或仅仅对具体应用场景感兴趣的同人,可以跳过数学基础和模型构建的内容。
感谢参与本书写作的来自携程的同人,他们将工作中的宝贵经验进行提炼和总结,并形成知识体系分享给读者。感谢出版社的工作人员,在本书的出版过程中给予的帮助和支持。
《携程人工智能实践》编委会