【分布式计算框架】分布式计算系统storm任务调度算法

更新时间：2020-03-17 来源：linux 手机版 字体：大中小

【www.bbyears.com--linux】

分布式计算系统storm中worker、executor、task比较 http://www.111cn.net/sys/linux/96715.htm

3种Scheduler概述

    EventScheduler：将系统中的可用资源均匀地分配给需要资源的topology，其实也不是绝对均匀，后续会详细说明
    DefaultScheduler：和EvenetScheduler差不多，只不过会先将其它topology不需要的资源重新收集起来，再进行EventScheduler
    IsolationScheduler：用户可定义这个topology的机器资源，storm分配的时候会优先分配这些topology，以保证分配给该topology的机器只为这一个topology服务

DefaultScheduler

    调用cluster的needsSchedualerTopologies方法获得需要进行任务分配的topologies
    开始分别对每一个topology进行处理
        调用cluster的getAvailableSlots方法获得当前集群可用的资源，以集合的形式返回，赋值给available-slots
        获得当前topology的executor信息并转化为集合存入all-executors，根据topology计算executors信息，采用compute-executors算法，稍后会讲解
        然后调用EventScheduler的get-alive-assigned-node+port->executors方法获得该topology已经获得的资源，返回集合的形式存入alive-assigned，为什么要计算当前topology的已分配资源情况而不是计算集群中所有已分配资源？，猜测可能是进行任务rebalance的时候会有用吧。
        接着就调用slot-can-reassign对alive-assigned中的slots信息进行判断，选出其中能被重新分配的slot存入变量can-reassigned
        这样可用的资源就由available-slots和can-reassigned两部分组成
        接下来计算当前topology能使用的全部slot数目total-slots--to-use：min(topology的NumWorker数,available-slots+can-reassigned)
        如果total-slots--to-use>当前已分配的slots数目，则调用bad-slots方法计算可被释放的slot
        调用cluster的freeSlots方法释放计算出来的bad-slot
        最后调用EventScheduler的schedule-topologies-evenly进行分配
        继续下一个topology

主要流程梳理：获得当前集群空闲资源->计算当前topology的executor信息（分配时会用得上）->计算可重新分配和可释放的资源->分配

EventScheduler

EventScheduler调度算法与Default相比少了一个计算可重新分配资源的环节，直接利用Supervisor中空闲的slot进行分配，在此不再细讲。

EventScheduler和DefaultScheduler调度举例：

这两种调度机制在一般情况下调度结果基本保持一致，所以一起来看：

集群初始状态

接下来我们提交3个topology

Topology

Worker数

Executer数

Task数

T-1

T-2

T-3

1、提交T-1

    sort-slots算法对可用slots进行处理，结果为{[s1 6700] [s2 6700] [s3 6700] [s4 6700] [s1 6701] [s2 6701] [s3 6701] [s4 6701] [s1 6702] [s2 6702] [s3 6702] [s4 6702] [s1 6703] [s2 6703] [s3 6703] [s4 6703]}
    compute-executors算法计算后得到的Executor列表为：{[1 2] [3 4] [5 6] [7 8] [9 10] [11 12] [13 14] [15 16]}；注：格式为[start-task-id end-task-id]，共8个worker，第一个包含2个task，start-task-id为1，end-task-id为2，所以记为[1 2]，后面依次类推...compute-executors算法会在下一篇博客中详解
    8个Executor在3个worker上的分布状态为[3，3，2]
    分配结果为：
        {[1 2] [3 4] [5 6]} -> [s1 6700]
        {[7 8] [9 10] [11 12]} -> [s2 6700]
        {[13 14] [15 16]} -> [s3 6700]

分配后集群状态为：

2、提交T-2

    可用的slot经过sort-slots后：{[s1 6701] [s2 6701] [s3 6701] [s4 6700] [s1 6702] [s2 6702] [s3 6702] [s4 6701] [s1 6703] [s2 6703] [s3 6703] [s4 6702] [s4 6703]}
    comput-executors计算后得到的executor列表：{[1 1] [2 2] [3 3] [4 4] [5 5] [6 6] [7 7] [8 8] [9 9] [10 10]}
    10个executor在5个worker上的分布为[2，2，2，2，2]
    分配结果为：
        {[1 1] [2 2]} -> [s1 6701]
        {[3 3] [4 4]} -> [s2 6701]
        {[5 5] [6 6]} -> [s3 6701]
        {[7 7] [8 8]} -> [s4 6700]
        {[9 9] [10 10]} -> [s1 6702]

分配后集群状态为：

3、提交T-3

    sort-slots后slot列表为：{[s1 6703] [s2 6702] [s3 6702] [s4 6701] [s2 6703] [s3 6703] [s4 6702] [s2 6704] [s3 6704] [s4 6703] [s4 6704]}
    compute-executors后得到的executor列表为：{[1 2] [3 4] [5 6] [7 8] [9 10]}
    5个executor在3个worker上的分布为：[2,2,1]
    分配结果为：
        {[1 2] [3 4]} -> [s1 6703]
        {[5 6] [7 8]} -> [s2 6702]
        [9 10] -> [s3 6702]

分配后集群状态为：

如图，此任务调度方式也不是绝对均匀的，s1已经满负荷运转，而s4才刚使用一个slots。

本文来源：http://www.bbyears.com/caozuoxitong/87733.html

链接：http://www.bbyears.com/caozuoxitong/87733.html
【分布式计算框架】分布式计算系统storm任务调度算法(转载时请注明本文出处及链接)

猜你感兴趣

[手机渡镆是什么]渡劫手机版切换武器方法分享 2020-03-17
天冷了关心问候短信怎么说|天冷了关心问候短信怎么写 2020-03-17
【以撒的结合胎衣卡片】以撒的结合：胎衣卡Mega撒旦进入方法分享 2020-03-17
[恋舞ol破解版无限免费]恋舞OL双十一天蝎座关卡通关攻略 2020-03-17
【微信个性签名大全励志】qq微信个性签名大全女生 2020-03-17
【反洗钱三号令】女王号令三大职业技能解析分享 2020-03-17
【平安夜祝福语大全暖心】平安夜祝福语大全 2020-03-17
[口水三国第一季]口水三国抗蜀经验心得分享 2020-03-17
【变形金刚雷霆舰队】雷霆舰队掠夺战玩法攻略详解 2020-03-17
【使命召唤黑色行动4】使命召唤12：黑色行动3字幕开启方法 2020-03-17

本类排行

本类最新

更多>>

【分布式计算框架】分布式计算系统storm任务调度算法

猜你感兴趣

热门标签

本类排行

本类最新