伍佰目录 短网址
  当前位置:海洋目录网 » 站长资讯 » 站长资讯 » 文章详细 订阅RssFeed

Flink心跳机制分析

来源:本站原创 浏览:91次 时间:2023-05-10

心跳机制通过定期向对方发送请求方式用于检测客户端或者服务端是否存活的一种机制,常见的心跳检测有两种:

  1. socket 套接字SO_KEEPALIVE本身带有的心跳机制,定期向对方发送心跳包,对方在收到心跳包后会自动回复;

  2. 应用自身实现心跳机制,同样也是使用定期发送请求的方式

Flink中ResourceManager、JobMaster、TaskExecutor三者之间存在相互检测的心跳机制,ResourceManager会主动发送请求探测JobMaster、TaskExecutor是否存活,JobMaster也会主动发送请求探测TaskExecutor是否存活,以便进行任务重启或者失败处理。

Flink中心跳机制主要由以下几个类(接口)协作完成:

  1. HeartbeatTarget接口,表示监控目标,包含两个方法,requestHeartbeat发送心跳请求,receiveHeartbeat接受心跳请求;

  2. HeartbeatManager接口,继承了HeartbeatTarget接口,心跳管理者,用于start/stop 监控对象;

  3. HeartbeatManagerImpl类,实现了HeartbeatManager接口,其内部包含一个实现了Runnable接口的HeartbeatMonitor静态内部类,它包含了心跳目标HeartbeatTarget以及其状态,如果超时就会调用HeartbeatListener心跳监听者进行相应的处理,HeartbeatManagerImpl所处位置可以理解为client,存在于JobMaster与TaskExecutor中;

  4. HeartbeatManagerSenderImpl类,继承 HeartbeatManagerImpl类,用于周期发送心跳请求,所处位置可以理解为server, 存在于JobMaster、ResourceManager中。

以JobMaster与TaskExecutor之间的心跳检测为例,看下其具体的请求流程。

初始化过程
一、JobMaster在启动过程中会调用HeartbeatServices.createHeartbeatManagerSender方法创建一个HeartbeatManagerSenderImpl对象taskManagerHeartbeatManager,会反复启动一个定时器,定时扫描需要探测的对象并且发送心跳请求

二、 JobMaster在执行任务部署时会向ResourceManager申请slot资源,ResourceManager在向yarn申请到资源后会启动TaskExecutor进程,在TaskExecutor启动过程中会调用HeartbeatServices.createHeartbeatManager方法创建一个HeartbeatManagerImpl对象jobManagerHeartbeatManager

注册过程
一、在启动TaskExecutor之后,会向其申请slot,调用requestSlot方法,在这个过程中会向JobMaster注册自身信息,通过rpc调用其registerTaskManager方法;

二、JobMaster在收到rpc请求后调用registerTaskManager方法,会通过taskManagerHeartbeatManager.monitorTarget方法将其添加到监控目标中,monitorTarget方法会将监控对象HeartbeatTarget封装在HeartbeatMonitor里面,初始化会调用resetHeartbeatTimeout重置心跳超时时间,启动一个超时时间heartbeatTimeout的定时器;

三、在注册完之后TaskManager之后,TaskExecutor会收到一个注册成功的请求,会调用其establishJobManagerConnection方法,用于与JobMaster建立连接,会向jobManagerHeartbeatManager添加监控目标,同样会封装成为一个HeartbeatMonitor并且启动一个定时器;

由此可见JobMaster与TaskExecutor是双向检测的,在heartbeatTimeout时间内没有收到心跳信息就会认为已超时,JobMaster认为TaskExecutor出现timeout 会调用TaskManagerHeartbeatListener的notifyHeartbeatTimeout方法,TaskExecutor任务JobMaster出现timeout会调用JobManagerHeartbeatListener的notifyHeartbeatTimeout方法。但是需要明确心跳的主动请求者是JobMaster。

心跳过程
一、在TaskExecutor注册到JobMaster中之后就代表了心跳机制开始,在taskManagerHeartbeatManager中也就是HeartbeatManagerSenderImpl中定时schedual调用HeartbeatTarget.requestHeartbeat,最后会通过rpc方式调用taskManager的heartbeatFromJobManager方法;

二、TaskExecutor收到heartbeatFromJobManager的rpc请求之后,会调用jobManagerHeartbeatManager也就是HeartbeatManagerImpl的requestHeartbeat方法,在这个过程中有两个处理步骤:

  1. 调用对应HeartbeatMonitor的reportHeartbeat方法,cancelTimeout取消注册时候的超时定时任务,并且注册下一个超时检测futureTimeout;

  2. 调用monitorTarget的receiveHeartbeat方法,也就是会通过rpc调用JobMaster的heartbeatFromTaskManager方法返回一些负载信息;

三、JobMaster在接收到rpc请求后调用其heartbeatFromTaskManager方法,会调用taskManagerHeartbeatManager的receiveHeartbeat方法,在这个过程中同样有两个处理步骤:

  1. 调用对应HeartbeatMonitor的reportHeartbeat方法,cancelTimeout取消注册时候的超时定时任务,并且注册下一个超时检测futureTimeout;

  2. 调用TaskManagerHeartbeatListener的reportPayload方法,上报收到TaskExecutor的负载信息

至此一次完整心跳过程已经完成,会根据heartbeatInterval执行下一次心跳。


  推荐站点

  • At-lib分类目录At-lib分类目录

    At-lib网站分类目录汇集全国所有高质量网站,是中国权威的中文网站分类目录,给站长提供免费网址目录提交收录和推荐最新最全的优秀网站大全是名站导航之家

    www.at-lib.cn
  • 中国链接目录中国链接目录

    中国链接目录简称链接目录,是收录优秀网站和淘宝网店的网站分类目录,为您提供优质的网址导航服务,也是网店进行收录推广,站长免费推广网站、加快百度收录、增加友情链接和网站外链的平台。

    www.cnlink.org
  • 35目录网35目录网

    35目录免费收录各类优秀网站,全力打造互动式网站目录,提供网站分类目录检索,关键字搜索功能。欢迎您向35目录推荐、提交优秀网站。

    www.35mulu.com
  • 就要爱网站目录就要爱网站目录

    就要爱网站目录,按主题和类别列出网站。所有提交的网站都经过人工审查,确保质量和无垃圾邮件的结果。

    www.912219.com
  • 伍佰目录伍佰目录

    伍佰网站目录免费收录各类优秀网站,全力打造互动式网站目录,提供网站分类目录检索,关键字搜索功能。欢迎您向伍佰目录推荐、提交优秀网站。

    www.wbwb.net