浅谈Flink容错机制之作业执行和守护进程

浅谈Flink容错机制之作业执行和守护进程

一、作业执行容错Flink的错误恢复机制分为多个级别,即Execution级别的Failover策略和ExecutionGraph级别的JobRestart策略。当出现错误时,Flink会先尝试触发范围小的错误恢复机制,如果仍处理不了才会升级为更大范围的错误恢复机制,具体可以看下面的序列图。当Task发生错误

1253067 TFnetwork_cn