《Flink内核原理与实现》[41M]百度网盘|亲测有效|pdf下载

书籍详情

Flink内核原理与实现
出版时间:2020-09-01
热度:7100
上架时间:2024-06-30 09:07:09
价格:9.0

书籍下载

9.0元标准版 8.9元简单版

书籍预览

查看预览查看链接

免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源，一旦发现资源涉及侵权，将立即删除。希望所有用户一同监督并反馈问题，如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

产品特色

编辑推荐

1. 作者团队权威：近10位行业专家联袂推荐，带你参透Flink的内核原理。

2. 内容全面详实：从Flink的基本思想、原理到其后期的技术实现与管理。

3. 读者覆盖面广：从大数据开发、架构人员到性能优化运维工程师。

内容简介

《Flink内核原理与实现》既讲解了Flink的入门、安装、流计算开发入门、类型和序列化系统、监控运维、安全管理配置等基础知识，又讲解了Flink的时间概念、Window的实现原理及其代码解析，Flink的容错机制原理，Flink容错的关键设计、代码实现分析，Flink Job从源码到执行整个过程的解析，Flink Job的调度策略、资源管理策略、内存管理、数据交换的关键设计和代码实现分析，Flink的RPC通信框架等深度内容。

《Flink内核原理与实现》适合对实时计算感兴趣的大数据开发、运维领域的从业人员阅读，此外对机器学习工程技术人员也有所帮助。

作者简介

1. 冯飞，有 10余年IT研发经验，专注于大数据相关技术领域，持续跟踪研究大数据计算引擎的理论模型及其演进，深入研读Flink、Apache Beam、Spark等的源码，尤其精通Flink。目前从事批流AI融合的新一代数据仓库设计、研发等工作。

2. 崔鹏云，毕业于北京邮电大学，获硕士学位，曾在MicroSoft和Teradata国外知名企业的研发中心供职9年，有15年的企业级海量数据离线和在线分析技术应用实战经验，拥有国内外众多TB及PB级大数据客户实时数据处理和分析落地能力。

3. 陈冠华，毕业于北京大学计算机软件与理论专业，获博士学位。2009~2011年在北京大学从事博士后研究工作，研究领域包括大数据内存及实时计算技术、数据仓库、数据挖掘和机器学习等，有超过15年的海量数据离线和在线处理技术的学术研究与实践经验。

前言/序言

关于本书

随着Flink的应用越来越广泛，关于Flink的书籍、文章也越来越多，但是系统性地阐述Flink设计原理和实现方法的书籍却很少。本书的核心目标是对Flink的设计与原理做一个比较系统的介绍，尽量将Flink的核心原理与其实现细节呈现给读者，但是由于篇幅有限，加之Flink体系庞大且复杂，本书难以将其细节一一呈现，只能选择重点部分加以阐述，如有疏漏、谬误之处还请包涵。各个大数据计算引擎在原理上类似，但在设计取向和实现方法上会有不同。希望通过阅读本书，读者能够对分布式计算引擎有更加深入的理解，开拓视野。

关于如何使用Flink，业内已经有相关书籍、官方文档、网络技术文章可以参考，因此本书不是介绍如何开发Flink应用，而是以Word Count经典案例贯穿本书，作为讲解和演示。《Flink内核原理与实现》涉及的Hadoop、Yarn、K8s、Mesos、Kafka等Flink之外的大数据领域的组件，不是本书主要介绍的内容，读者可以阅读相应的书籍，也可以参考网上的技术文章。

适合人群

《Flink内核原理与实现》特别适合“穷理以致其知，反躬以践其实”的人阅读，具体有以下人群。

● 愿意深入了解Flink设计与实现原理的Flink开发者。

● 对流计算感兴趣的大数据开发人员、技术爱好者。

● 对性能优化和部署感兴趣的运维工程师与架构师。

● 对Flink感兴趣的Spark开发人员、架构师。

阅读建议

建议首先通读本书，对Flink建立一个基本的认识，了解其核心流程，不同的组件及其作用、相互之间的关联关系，避免沉浸在细节中，窥一斑不见全貌。有了总体的认识之后，再有针对性地了解细节。

《Flink内核原理与实现》内容大概分为三大部分：基础知识、核心执行、运维管理。

基础知识包含第1~7章。第1章是总体性的介绍；第2章介绍Flink应用中的基本概念及其API层；第3~7章介绍Flink底层运行的核心抽象及其实现，如内存管理、时间与窗口、类型与序列化、状态原理等。

核心执行包含第8~14章。其中第8~13章是Flink作业提交、执行、应用容错等方面实现原理的介绍；第14章是Flink SQL实现原理的介绍，未来SQL是比较重要的应用开发方式。

运维管理包含第15、16章。第15章是Flink运维监控原理的介绍；第16章是Flink集群内部的通信框架介绍。

强烈建议各位读者，不要从学习的角度去阅读本书，而是从设计一个批流一体的大数据计算引擎的角度来进行阅读，思考作为设计者必须要解决哪些问题，如何解决这些问题。

《Flink内核原理与实现》以Flink 1.10版本为基础编写，随着Flink的演进，后续将会持续更新，敬请期待。

读者沟通

在阅读本书的过程中，读者若遇到任何问题、有任何建议，都可以向deep_in_flink@126.com发送邮件，或者在https://github.com/ffly1985/deep-in-flink上提交issue，对于读者比较关注的内容，编者将在后续版本中丰富完善。

致谢

感谢我们所生活的时代，这是一个信息爆炸的时代，数据量呈指数级增长，大数据的技术快速发展，数据处理的手段也在不断进化，实时智能时代的到来使得本书有了面世的机会。

感谢为 Flink 的发展壮大付出辛苦努力的社区，为了 Flink 的完善、推广付出巨大努力的阿里 Flink 团队，还有其他分享 Flink 经验的各行业领军企业，正是有了它们共同的努力，才使得 Flink 成为流计算事实上的标准。

感谢中国移动信息技术中心的领导尚晶、郭志伟、武智晖、刘辉等，在本书编写过程中，他们给了很多思路和意见。同时与中国移动各省分公司的集中交流、研讨，也使得Flink在运营商领域的位置计算、业务信息补全、复杂事件处理等实时计算场景下的适用性得到了印证。

感谢编者所在公司给予的良好技术氛围和工作环境，使得作者能够全心全意投入到技术的研究中，同时要感谢同事张文霞、孙得强、李运波、王茂均、赵红岩花费了大量时间分享 Flink 的实战经验、提出建议、书稿勘误，使得本

查看全部↓

相关推荐

Python金融大数据分析

数据中台让数据用起来

大数据治理

Flink内核原理与实现

产品特色

编辑推荐

内容简介

作者简介

目录

前言/序言