8.一文搞定Flink单作业提交模式（per-job）的运行时状态

如题所述

第1个回答 2022-06-05

在Flink进行数据处理的时候，有两个最重要的两个组件，分别是：作业管理器（JobManager）和任务管理器（TaskManager）。对于一个提交执行的作业，JM是真正的管理者，负责管理和调度工作。如果集群没有配置高可用的话，只能有一个JM。TM是负责工作的工作者，负责执行任务和处理数据，所以可以有很多个。

整个JM由三个部分组成，分别是JobMaster、ResourceManager、Dispatcher。

JMaster是JManager中最核心的组件，负责处理单独的作业。所以每一个Job都会有一个对应JobMaster与之对应，多个job可以同时运行在一个FLink集群中，也就证明一个Flink集群中可以有多个JobMaster同时存在。在作业被提交的时候，JMaster会率先接受到要执行的应用。这些应用包括：Jar包、数据流图（dataflow graph）、作业图（JobGraph）。然后将接收到的作业图转换成为一个物理层面的数据流图，也就是执行图，这个执行图包含了所有要并发执行的任务。随后JMaster会根据这个执行图去到RM中申请必要的资源。一旦获得到了足够的资源，就会将执行图发送到要运行执行图的TaskMaster上面。并且在程序运行的过程中，JobMaster会负责协调所有的需要中央协调的工作，如保存点机制。

RM在Flink的集群中只有一个，它主要负责的是资源的分配与管理，也就是对TaskManager上的solt的分配工作。并且在面对不同的环境的时候，RM也有不同的体现。如果是standalone，因为TM是独立运行的，所有RM只能分发可用的TM的任务槽，没办法单独启动TM。但是如果是yarn的工作模式下，RM能够将有空闲的TM发送给JMaster，如果资源不够使用的话，就会向yarn发起请求提供启动TM的容器。并且如果有的TM处于空闲状态，RM还负责停止它们的工作。

它主要负责提供Rest风格的接口来提交应用。并且还负责为每一个新提交的作业启动一个新的JMaster组件，并且还会启动一个WEB UI，方便用来展示和键控作业执行的信息。

TM负责FLink集群中的具体工作部分，数据流的计算就是由这个组件来完成的，每一个TM都会有一定数量的任务槽，这个任务槽是一个TM上最小的资源封装单位，solt的数量决定了TM能够并行处理的任务的数量。在TM启动之后，会向RM注册自己的solt，当收到RM对其发送的指令之后，就会根据要求发送能够提供计算的solt给JMaster调用，这样数据计算就能够实现了，并且在进行计算的过程中，TaskManager可以缓冲数据，还能够与其他的TM交互完成数据的交换。

因为我本人所接触的Flink的部署模式都是基于资源管理平台yarn来实现工作的，采用的作业提交方式也是通过per-job提交方式进行提交的，所以在本次讲述的过程中，也是以这个内容为蓝本展开讲解。

yarn-per-job作业提交流程：
在单作业模式下，Flink集群不会预先启动，而是在进行作业提交的时候，才会启动新的JobManager。

1.客户端向yarn提交作业，并且需要将Flink的Jar包和配置文件信息上传到HDFS，以便后续启动FLink相关组件的容器。
2.YARN资源管理器分配Container资源，启动Application Master，这个APP里面包含了Flink的JobManager，并且要将提交上来的作业交给JMaster。
3.JMaster向flink的rm请求资源。
4.flink的rm向yarn请求container资源。
5.yarn启动包含TM的container资源。
6.TM向JMaster注册自己拥有的solt数量。
7.flink的RM向TM申请solt。
8.TM连接到对应的JMaster，然后通过solt。
9.JMaster将要执行的任务分发给TM，执行。

相似回答

flink的per-job模式答：启动yarn的per job：在yarn的web页面观察：输入测试数据：在flink的web页面观察：

Flink提交任务部署的两种方式答：启动一个单独的job提交到yarn集群上，即单job单session，实现资源的完全隔离。生产一般建议使用per job模式。每个任务启动一个flink集群，各个集群之间独立运行，互不影响,且每个集群可以设置独立的配置提交命令参数说明

Flink on YARN的第三种部署模式:Application Mode答：顾名思义，在Per-Job模式下，每个提交到YARN上的作业会各自形成单独的Flink集群，拥有专属的JobManager和TaskManager。可见，以Per-Job模式提交作业的启动延迟可能会较高，但是作业之间的资源完全隔离，一个作业的TaskManager失败不会影响其他作业的运行，JobManager的负载也是分散开来的，不存在单点问题。当作...

Flink on Yarn模式下的TaskManager个数答：Parallel的配置有好几种方式，可以配置全局默认参数，可以在client端配置参数，可以配置operator参数等等。由于不是本文讨论的重点，因此可以参考 Flink官网 .这个参数是配置一个TaskManager有多少个并发的slot数。有两种配置方式：注意： Per job模式提交作业时并不像session模式能够指定拉起多少个TaskManager，...

Flink集群部署模式答：Flink Session Cluster集群部署模式也称为session mode。该模式集群会预先启动、长时间运行，并且能够接收多个job提交运行。也就是提交到集群的job共享一套flink runtime cluster(JobManager和TaskManager)。该模式特点如下：Flink Job Cluster集群部署模式又称为per-job mode。该模式与Job绑定，集群管理器会为...

大家正在搜

上行文的行文方式 hadoop提交模式 hadoop几种运行模式微信表单查看模式下不能提交以兼容模式运行程序的利弊查看模式下不能提交怎么办为什么兼容模式提交不了兼容模式也无法运行囿文的模式合法吗