CN108415761A - 一种基于网络流量优化的Storm任务调度方法 - Google Patents

一种基于网络流量优化的Storm任务调度方法 Download PDF

Info

Publication number
CN108415761A
CN108415761A CN201810092610.7A CN201810092610A CN108415761A CN 108415761 A CN108415761 A CN 108415761A CN 201810092610 A CN201810092610 A CN 201810092610A CN 108415761 A CN108415761 A CN 108415761A
Authority
CN
China
Prior art keywords
thread
subset
machine
fitness
chromosome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810092610.7A
Other languages
English (en)
Other versions
CN108415761B (zh
Inventor
谷建华
周兴社
周健华
闫旭涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201810092610.7A priority Critical patent/CN108415761B/zh
Publication of CN108415761A publication Critical patent/CN108415761A/zh
Application granted granted Critical
Publication of CN108415761B publication Critical patent/CN108415761B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种基于网络流量优化的Storm任务调度方法,涉及数据交换网络领域,通过进程间流量统计,根据通信关系矩阵,采用遗传算法进行网络k划分,并在机器内Worker进程间流量优化,根据机器和进程的对应表和进程和线程对应表,通过Storm命令rebalance来触发实施任务分配,本发明减少了节点间的流量,提高了现有资源的使用效率,减少了很多不必要的流量传输,降低了系统的延迟、提高了吞吐量;弥补了Storm任务调度中对任务间流量信息考虑不足的问题,优化了系统内机器间和机器内进程间流量不均衡的问题,使得导致系统延迟降低、吞吐量得到提高。

Description

一种基于网络流量优化的Storm任务调度方法
技术领域
本发明涉及数据交换网络领域,尤其是一种Storm任务调度方法。
背景技术
随着计算机的发展,传感器数据、金融数据、在线交易数据等实时流数据不断增多。数据种类多且体量大、源源不断、时性强。这些实时数据产生速度快、消失快,有效时间短。当前实时数据蕴含着丰富的价值,实时数据的高效处理保证了交易的快速处理和信息的实时获取。当前业界推出了Storm、Spark等分布式实时流数据处理框架。Storm是个分布式、可扩展、容错的实时流处理系统。Storm的这些特点使得它在业界得到了广泛使用。但是Storm仍在不断的发展和完善中,仍有许多需要改进的方面。
Storm是个分布式的系统,任务分配到不同的机器和机器中的多个进程。相同的硬件情况下,不合理的任务分配方式将严重影响系统的效率。Storm的实时性要求很高,不同的调度算法将导致网络流量在系统内不同的流动方式,不合理的流动将导致传输和处理延迟,进而对Storm的性能产生影响。任务调度算法的差异,在系统资源相同的情况将影响着系统的性能。
现在Storm中默认的调度算法采用轮询的方式,将拓扑的任务轮询的方式均匀的放置到空闲的slot中,在调度时没有考虑到任务间的网络通信开销对系统性能的影响,可能造成机器间通信量大、通信延迟高,降低了系统性能,特别是实时流处理系统的数据量大,网络开销将严重影响系统的实时性。
发明内容
为了克服现有技术的不足,针对Storm现有的调度方法没有考虑到任务间的通信开销,导致系统数据流量不均衡、节点间流量大、延迟高和吞吐量下降的问题,本发明提供一种基于网络流量优化的Storm任务调度方法,通过在任务运行时监控进程的流量,对进程间流量关系分析,给出优化的调度方案,在尽量不改变现有的Worker进程数量和线程任务数量的情况下进行,通信流量优化。
本发明解决其技术问题所采用的技术方案是的步骤如下:
步骤1:进程间流量统计
通过tcpdump命令采用抓包的方式统计进程间发送的信息,统计运行时Storm各个Worker进程间的数据传输速率,即可得到通信关系矩阵;
在n个进程中,进程di和进程dj间的数据传输速率为进程di到dj和dj到di的通信速率之和,其中,1≤i≤n,1≤j≤n,通信关系矩阵w中的i行j列的wij表示进程di和进程dj间的数据传输速率,将n个进程间的数据传输速率进行汇总得到通信关系矩阵w,通信关系矩阵如下所示:
步骤2:根据Worker进程间的通信关系矩阵,将n个进程划分到k个机器上,本发明采用遗传算法进行网络k划分,所述遗传算法的步骤包括编码表示、定义适应度、选择操作、杂交操作和变异操作;
首先按照步骤1得到通信关系矩阵,随机产生m个初始例子染色体,其中,m取值范围为20~100,据编码产生初始种群,计算每个染色体的适应度,然后执行选择操作,根据每个个体的适应度比例确定选择概率,根据选择概率和轮盘选择策略在种群中选择个体,若随机概率大于杂交概率α则进行杂交操作,若随机概率大于变异概率β则进行变异操作;不断循环整个过程,进行选择产生新种群、变异和杂交操作,进行r次循环,其中r的取值范围为100~500,直到适应度值达到稳定,即适应度值不再变化,将种群中适应度值最大的个体所代表的方案作为划分方案,得到机器对应的进程表;
具体步骤如下:
步骤2.1:编码表示
共n个进程,运行在k个机器上,进行编码表示时将n个进程划分到k个子集,即等于现在使用的机器数量k,编码中染色体x表示为{g1,g2,...gi,...,gn},1≤i≤n,且gi取值范围为{0,1,2,...,k-1},表示每个进程属于一个子集,且每个染色体应包含0到k-1的所有值;
步骤2.2:定义适应度
定义无向图G=(V,E,w),顶点集V={v1,v2,v3...vn},边的集合用w表示各个边之间的权值,边的权值即是步骤1中的通信关系矩阵的权值,将无向图G划分为k个子集,P1,P2...,Pk,且子集间互不相交,最大化各个子集内的通信量如公式2所示:
其中vi∈Ps,vj∈Pt,s,t∈{1,2,...,n}且s=t表示同一个子集,在子集内累加边的权值为w(vi,vj),且系统storm运行的应用不变的情况下总的权值和是固定的,当各子集中权值和最大时,子集间权重达到最小;
fit表示每个染色体的适应度,适应度公式如下所示:
其中,gi,gj∈{0,1,...,k-1}表示子集,gi表示划分的子集,gi=gj表示划分到同一个子集中,traffic表示子集内所有节点间的w(vi,vj)传输速率和,balance表示均衡参数,均衡参数balance定义如下所示:
si表示子集i包含的节点数,表示平均每个子集应得到的节点数,n代表进程个数,|si-n/k|表示每个子集节点数与平均节点数差的绝对值;
p表示均衡系数,为所有染色体中最小传输速率和与最大均衡参数的比值,定义如下所示:
p=min(traffic)/max(balance) (5)
定义参数σ改变对均衡度和传输量的重视程度,其中0≤σ≤1;
步骤2.3:选择操作
选择操作采用轮盘选择方法,根据步骤2.2计算个体适应度fit除以总的适应度表示选择概率,选择概率Pi如下所示:
b为总群中染色体的个数,以Pi为概率选择新的个体;
步骤2.4:杂交操作
设置杂交概率为α,杂交概率取值范围为0.4~0.9,同时在此时产生随机数δ,其中,0<δ<1,当δ大于α时进行杂交操作,杂交时交换种群中两个染色体的u个对应位,其中,u取值范围为2~10,如果杂交操作使得部分基因缺少,即每个染色体x没有包含0到k-1的所有值,则杂交失败,不进行该次杂交,杂交成功则保留染色体对u个位置改变;
步骤:2.5:变异操作
设置变异概率β,取值范围为0.0001~0.2,此时产生新的随机数δ′,当δ′大于β时进行变异操作,随机选择两个点,对换这两个点的数值即实现变异操作,连续v次随机对换一个染色体两个基因位即实现变异操作,其中,v取值为3~10;
步骤3:机器内Worker进程间流量优化
当两个进程间传输速率大于阈值h,h为网卡速度的1%~10%,将两个进程中的线程进行重新组织,详细步骤如下:
步骤3.1:设定数据传输速率阈值h,h为网卡速度的2%,两个进程间数据传输速率大于阈值h的两两进程,得到进程配对表{c0c1,c1c2,...,cici+1},0<i<k/2;将大于阈值h的配对进程,按照传输速率对进程配对表降序排列;
步骤3.2:根据步骤3.1得到的降序排列的进程配对表,依次得到流量最大的两个配对进程cici+1,根据配对的两个进程cici+1内的线程关系,得到线程上下游关系表{e1,e2,e3,...,ei};
步骤3.3:根据配对进程cici+1的线程上下游关系表,将进程内的线程按照如下的方式进行重新分配线程:
分配最上游线程ei,将最上游的各个线程以轮询的方式分配到cici+1进程中;然后再分配线程ei的直接下游线程ei+1,将线程ei+1分配到存在线程ei的进程中;即ei和ei+1总是成对出现,得到新的进程和线程对应表;
步骤4:任务分配
根据步骤2得到机器和进程的对应表和步骤3得到的进程和线程对应表,可知每个线程所属的进程,每个进程所属的机器得到了任务分配的全部信息,进行任务分配时,采用Storm的Cluster类的setAssignments函数依次将进程分配到机器上,进程信息及包含的线程通过进程和线程对应表进行查询,机器信息通过机器和进程的对应表查询获得,任务分配过程通过Storm命令rebalance来触发实施任务分配。
本发明的有益效果在于将Worker进程均衡划分到多个机器,减少了节点间的流量;同时将相互关联的线程放置到同一个进程中将减少进程间通信的数据量,提高通信效率,让任务在资源情况不变的情况下更加有效的通信,提高现有资源的使用效率,减少了很多不必要的流量传输,降低了系统的延迟、提高了吞吐量;弥补了Storm任务调度中对任务间流量信息考虑不足的问题,优化了系统内机器间和机器内进程间流量不均衡的问题,使得导致系统延迟降低、吞吐量得到提高。
附图说明
图1表示了进程间通信网络图,节点间的连线上的数字表示进程间传输速率。
图2表示将n个进程划分到k个机器的结果示意图,其中n=7,k=3,大圈表示划分机器。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
减少数据在网络间传输的延迟,提高数据处理速度,提升系统的吞吐量。解决系统默认调度的情况下,对机器和进程间的数据传输速率考虑不全面的问题。
步骤1:进程间流量统计
统计运行时Storm各个Worker进程间的数据传输速率,得到通信关系矩阵,实时统计进程间的网络流量信息,为了更加准确的了解进程间的网络流量信息,将统计t(t=30s)时间内的流量的平均值。通过tcpdump命令采用抓包的方式统计进程间发送的信息,得到进程间的数据传输速率,统计机器的n个Worker进程间的数据传输速率,在n个进程中,进程di和进程dj间的数据传输速率为进程di到dj和dj到di的通信速率之和,其中,1≤i≤n,1≤j≤n,通信关系矩阵w中的i行j列的wij表示进程di和进程dj间的数据传输速率,将n个进程间的传输速率进行汇总得到通信关系矩阵w,通信关系矩阵如下所示:
图1表示了进程间通信网络图,节点间的连线上的数字表示进程间传输速率。
步骤2:根据Worker进程间的通信关系矩阵,将n个进程划分到k个机器上,本发明采用遗传算法进行网络k划分,所述遗传算法的步骤包括编码表示、定义适应度、选择操作、杂交操作和变异操作;
首先按照步骤1得到通信关系矩阵,随机产生m个初始例子染色体,其中,m取值范围一般为20~100,本发明取m=50。据编码产生初始种群,计算每个染色体的适应度,然后执行选择操作,根据每个个体的适应度比例确定选择概率,根据选择概率和轮盘选择策略在种群中选择个体,若随机概率大于杂交概率α则进行杂交操作,若随机概率大于变异概率β则进行变异操作;不断循环整个过程,进行选择产生新种群、变异和杂交操作,进行r次循环,其中r的取值范围为100~500,本发明取r=300,直到适应度值达到稳定,即适应度值不再发生变化,将种群中适应度值最大的个体所代表的方案作为划分方案,得到机器对应的进程表;
具体步骤如下:
步骤2.1:编码表示
共n个进程,运行在k个机器上,进行编码表示时将n个进程,需要将进程划分到k个子集,即等于现在使用的机器数量k,编码中染色体x表示为{g1,g2,...gi,...,gn},1≤i≤n,且gi取值范围为{0,1,2,...,k-1},表示每个进程属于一个子集,例如g1=2,表示第1个进程属于第2个子集,i∈{1,2,...,n},且每个染色体应包含0到k-1的所有值,否则将导致基金缺少,造成部分子集没有分配到节点;
例如对一个10个节点的划分,划分到3个子集内,即n=10,k=3,染色体的例子如表1所示。
表1:染色体例子
编号 1 2 3 4 5 9 10
染色体 0 1 2 0 1 1 2
根据编码表示的方法,通过产生0到k-1的随机数填充染色体的n个位置。连续产生m(m应大于20)个染色体。同时随机产生的染色体,可能不包含0到k-1的所有数字,这样导致部分子集没有划分到节点,对于这样的染色体应该排除掉。
步骤2.2:定义适应度
通过定义适应度,使得更满足条件的染色体更能在下一代中得到保存,适应度越高表示更加满足划分条件,在步骤2.3中选择操作留下来的概率增大;
定义无向图G=(V,E,w),顶点集V={v1,v2,v3...vn},边的集合用w表示各个边之间的权值,边的权值即是步骤1中的通信关系矩阵的权值,将无向图G划分为k个子集,P1,P2...,Pk,且子集间互不相交,步骤2的目的在于减少不同子集间的通信量即减少跨机器的网络传输量,在各个进程(顶点V)间通信总量确定的情况下,最小化子集间的通信量便是最大化各个子集内的通信量,最大化各个子集内的通信量如公式2所示:
其中vi∈Ps,vj∈Pt,s,t∈{1,2,...,n}且s=t表示同一个子集,在子集内累加边的权值为w(vi,vj),且系统storm运行的应用不变的情况下总的权值和是固定的,各子集中权值和最大,也就是子集间权重达到最小,仅仅让子集间的权值和达到最小将导致各个子集的负载不均衡,下面将通过定义适应度平衡子集间权重减小程度和子集划分的均衡度两个方面。
fit表示每个染色体的适应度,适应度越高表示更加满足划分条件,适应度旨在减少子集间流量的同时使得各个机器上的进程数量更加均衡,同时,通过balance均衡参数来使得划分更加均衡,适应度公式如下所示:
其中,gi,gj∈{0,1,...,k-1}表示子集,机器个数为k,gi表示划分的子集,gi=gj表示划分到同一个子集中,traffic表示子集内所有节点间的w(vi,vj)传输速率和,balance表示均衡参数,当各个子集内的节点数越均衡,balance越小减少的分越小,则适应度越大,均衡参数balance定义如下所示:
si表示子集i包含的节点数,表示平均每个子集应得到的节点数,n代表进程个数,|si-n/k|表示每个子集节点数与平均节点数差的绝对值,balance越小说明越均衡;
p表示均衡系数,主要是为了平衡传输速率和与均衡参数的数量级差异,p为所有染色体中最小传输速率和与最大均衡参数的比值,定义如下所示:
p=min(traffic)/max(balance) (5)
通过引入均衡参数使得子集间划分更加均衡的有更大的概率得以保留,使得划分更加均衡,即机器的负载更加均衡,同时不同人对流量减少程度和均衡度的需求不同,通过定义参数σ来改变对均衡度和传输量的重视程度,其中0≤σ≤1,σ越高表示对均衡度越重视;本发明中σ=0.5。
通过适应度的定义,在努力降低节点间传输量的基础上,使得划分更加均匀,各个机器的负载更加均衡,使得Storm任务调度方法更加具有实践意义。
步骤2.3:选择操作
选择操作采用轮盘选择方法,根据步骤2.2计算个体适应度fit除以总的适应度表示选择概率,选择概率Pi如下所示:
b为总群中染色体的个数,以Pi为概率选择新的个体,当前适应度高的有更大的概率保存到下一代中,经过多次循环,适应度更高即更加满足划分条件的个体将有更大的概率得到保留;同时,每次将适应度最高的直接放入下一个种群中,使得每次迭代时,最优的总会得到保存,提高稳定性。
步骤2.4:杂交操作
设置杂交概率为α,杂交概率取值为0.4~0.9,本发明取α=50%。同时在此时产生随机概率δ,0<δ<1,当δ大于α时进行杂交操作,杂交时交换总群中两个染色体的u个对应位,u取值范围为2~10,u取染色体总位数n的10%。如果杂交操作使得部分基因缺少,即每个染色体x没有包含0到k-1的所有值,没有进程划分到特定机器上,造成划分为空的情况,则杂交失败,不进行该次杂交,杂交成功则保留染色体对u个位置改变;
步骤:2.5:变异操作
设置变异概率β,取值范围为0.0001~0.2,本发明β=5%,此时新产生随机概率δ′,当δ′大于β时进行变异操作,采取连续v次随机对换一个染色体两个基因位来实现,v为染色体总位数n的5%,取值范围为3~10,随机选择两个点,对换这两个点的数值即实现变异操作;
根据Worker进程间的通信关系矩阵,将进程划分到机器上,为降低机器间的通信量,即最小化机器间的网络传输量,最大化机器内的网络传输量,同时保证各个机器内的进程数量均衡。划分的原则如下:
1)机器间的通信量最小,即减少通信需要跨交换机的数据流量。
2)机器内的通信量尽最大,网络流量大部分在机器内部得以完成。
3)各个机器内的进程数量趋于平衡,使得各个机器的负载更加均衡。
最小化机器间的网络通信量,无法保证各个机器的负载均衡,通过结合均衡度和机器间通信量两个维度来评价分配方案,形成最优的分配方案。划分后减少机器间的经过网络的数据传输量,减少了需要经过交换机甚至需要经过多个交换机的数据传输量。减少了跨机器或交换机的数据传输量,降低了数据传输延迟。同时因为大量数据不再需要通过网络传输,Java传输数据时便不再需要经过复杂的序列化和反序列化操作,进一步降低通信延迟。
将满足三个划分原则的进程划分到多个机器的问题转换成网络k划分的问题,将进程当做网络节点,机器当做子网,网络k划分问题属于组合优化的范畴,即根据网络拓扑模型寻找最佳的网络配置将n个网络节点划分到k个子网,最小化子网间的数据传输量,这是个NP完全问题,对于该问题的求解有许多方法,遗传算法解决该问题,具有简单易用、鲁棒性强和全局搜索的特点。本发明采用改进的遗传算法进行网络k划分,主要使得划分的各个机器上的进程数量尽可能均衡,通过进程划分,减低机器间的通信量,降低通讯延迟,提升系统的吞吐量和实时性。
划分的一种结果如图2所示,7个进程划分到3个机器(大圆圈表示)中。机器间的传输量为5,远远小于机器内的网络传输量。
步骤3:机器内Worker进程间流量优化
步骤1和步骤2中降低了机器间的通信量,最大化机器内的通信量,但是机器内通信时还是需要通过端口进行转发,端口在转发时Java仍会进行序列化和反序列化等操作,同时在端口发送时需要在进程的公共队列排队等待,这些操作花费了很多时间,仍然需要进进一步优化机器内部的通信;
寻找两个进程间传输速率大于阈值h,将两个进程中的线程按照下面的步骤进行重新组织,主要目的是将两个Worker内有上下游关系的放到同一个Worker内,将进程间的数据传输变成线程间的直接发送来降低传输延迟;
当两个进程间传输速率大于阈值h,h一般为网卡速度的1%~10%,本发明取h为网卡速度的2%。将两个进程中的线程进行重新组织,详细步骤如下:
步骤3.1:设定数据传输速率阈值h,h设置为网卡速度的2%,两个进程间数据传输速率大于阈值h的两两进程,得到进程配对表{c0c1,c1c2,...,cici+1}(0<i<k/2);将大于阈值的配对进程,按照传输速率降序排,得到降序排列后的进程配对表;
步骤3.2:根据步骤3.1得到的降序排列的进程配对表,依次得到流量最大的两个配对进程cici+1,分析配对的两个进程cici+1内的线程,得到线程上下游关系表{e1,e2,e3,...,ei},越排在前面的线程越位于上游;
每个线程都有属于的组件,组件间按照从头到尾的方式连接,得到线程属于的组件便可以得到上下游的组件同时得到上下游的线程。
步骤3.3:根据配对进程cici+1的线程上下游关系表,将进程内的线程按照如下的方式进行重新分配线程:
分配最上游线程ei,将最上游的各个线程以轮询的方式分配到cici+1进程中;然后再分配线程ei的直接下游线程ei+1,将线程ei+1优先分配到存在线程ei的进程中;这样ei和ei+1总是成对出现,减少了进程间的数据传输流量;依次将步骤3.1得到的排序后的进程配对表中的两两进程,进行线程的重新分配操作,然后得到新的进程和线程对应表;
步骤4:任务分配
根据步骤2得到的机器和进程的对应表和步骤3得到的进程和线程对应表,便知道每个线程所属的进程,每个进程所属的机器,得到了任务分配的全部信息,进行分配时,采用Storm的Cluster类的setAssignments函数依次将进程分配到具体机器上,进程信息及包含的线程通过进程和线程对应表查询,具体机器信息通过机器和进程的对应表查询获得,任务分配过程通过Storm命令rebalance来触发,按照步骤2和步骤3的过程进行任务重新组织,即可实施任务分配。
根据步骤2和步骤3得到的机器间和机器内的调度方案,可以得到每个进程对应的线程信息和每个机器包含的进程信息,便可以形成进程和线程对应表和机器对应的进程表,两张表构成任务分配表。通过继承IScheduler接口来实现自定义的调度器NetworkTrafficOptimizationScheduler。定义调度器可以按照任务分配表进行任务分配。具体采用Storm的Cluster类的setAssignments函数来根据任务分配表来分配新的调度方案。函数setAssignments依次将进程及进程包含的线程分配到对应的机器,机器和进程的对应关系通过机器对应的进程表查询。通过Storm命令rebalance可以调用自定义的调度器。当自定调度器判断拓扑任务已经运行而且运行了rebalance命令,调用自定义调度器。
自定义调度器首先统计机器中各个进程间数据传输速率,得到通信关系矩阵。根据通信关系矩阵。然后,按照步骤2采用神经网络的方式得到机器对应的进程表。在一个机器内按照步骤3方法,进行机器内进程间流量优化,得到进程和线程对应表。最后根据进程和线程对应表和机器对应的进程表得到任务分配表。通过setAssignments将线程分到对应的进程,进程分到对应的机器上,便采用新的方案来运行任务。

Claims (1)

1.一种基于网络流量优化的Storm任务调度方法,其特征在于包括下述步骤:
步骤1:进程间流量统计
通过tcpdump命令采用抓包的方式统计进程间发送的信息,统计运行时Storm各个Worker进程间的数据传输速率,即可得到通信关系矩阵;
在n个进程中,进程di和进程dj间的数据传输速率为进程di到dj和dj到di的通信速率之和,其中,1≤i≤n,1≤j≤n,通信关系矩阵w中的i行j列的wij表示进程di和进程dj间的数据传输速率,将n个进程间的数据传输速率进行汇总得到通信关系矩阵w,通信关系矩阵如下所示:
步骤2:根据Worker进程间的通信关系矩阵,将n个进程划分到k个机器上,本发明采用遗传算法进行网络k划分,所述遗传算法的步骤包括编码表示、定义适应度、选择操作、杂交操作和变异操作;
首先按照步骤1得到通信关系矩阵,随机产生m个初始例子染色体,其中,m取值范围为20~100,据编码产生初始种群,计算每个染色体的适应度,然后执行选择操作,根据每个个体的适应度比例确定选择概率,根据选择概率和轮盘选择策略在种群中选择个体,若随机概率大于杂交概率α则进行杂交操作,若随机概率大于变异概率β则进行变异操作;不断循环整个过程,进行选择产生新种群、变异和杂交操作,进行r次循环,其中r的取值范围为100~500,直到适应度值达到稳定,即适应度值不再变化,将种群中适应度值最大的个体所代表的方案作为划分方案,得到机器对应的进程表;
具体步骤如下:
步骤2.1:编码表示
共n个进程,运行在k个机器上,进行编码表示时将n个进程划分到k个子集,即等于现在使用的机器数量k,编码中染色体x表示为{g1,g2,...gi,...,gn},1≤i≤n,且gi取值范围为{0,1,2,...,k-1},表示每个进程属于一个子集,且每个染色体应包含0到k-1的所有值;
步骤2.2:定义适应度
定义无向图G=(V,E,w),顶点集V={v1,v2,v3...vn},边的集合用w表示各个边之间的权值,边的权值即是步骤1中的通信关系矩阵的权值,将无向图G划分为k个子集,P1,P2...,Pk,且子集间互不相交,最大化各个子集内的通信量如公式2所示:
其中vi∈Ps,vj∈Pt,s,t∈{1,2,...,n}且s=t表示同一个子集,在子集内累加边的权值为w(vi,vj),且系统storm运行的应用不变的情况下总的权值和是固定的,当各子集中权值和最大时,子集间权重达到最小;
fit表示每个染色体的适应度,适应度公式如下所示:
其中,gi,gj∈{0,1,...,k-1}表示子集,gi表示划分的子集,gi=gj表示划分到同一个子集中,traffic表示子集内所有节点间的w(vi,vj)传输速率和,balance表示均衡参数,均衡参数balance定义如下所示:
si表示子集i包含的节点数,表示平均每个子集应得到的节点数,n代表进程个数,|si-n/k|表示每个子集节点数与平均节点数差的绝对值;
p表示均衡系数,为所有染色体中最小传输速率和与最大均衡参数的比值,定义如下所示:
p=min(traffic)/max(balance) (5)
定义参数σ改变对均衡度和传输量的重视程度,其中0≤σ≤1;
步骤2.3:选择操作
选择操作采用轮盘选择方法,根据步骤2.2计算个体适应度fit除以总的适应度表示选择概率,选择概率Pi如下所示:
b为总群中染色体的个数,以Pi为概率选择新的个体;
步骤2.4:杂交操作
设置杂交概率为α,杂交概率取值范围为0.4~0.9,同时在此时产生随机数δ,其中,0<δ<1,当δ大于α时进行杂交操作,杂交时交换种群中两个染色体的u个对应位,其中,u取值范围为2~10,如果杂交操作使得部分基因缺少,即每个染色体x没有包含0到k-1的所有值,则杂交失败,不进行该次杂交,杂交成功则保留染色体对u个位置改变;
步骤:2.5:变异操作
设置变异概率β,取值范围为0.0001~0.2,此时产生新的随机数δ′,当δ′大于β时进行变异操作,随机选择两个点,对换这两个点的数值即实现变异操作,连续v次随机对换一个染色体两个基因位即实现变异操作,其中,v取值为3~10;
步骤3:机器内Worker进程间流量优化
当两个进程间传输速率大于阈值h,h为网卡速度的1%~10%,将两个进程中的线程进行重新组织,详细步骤如下:
步骤3.1:设定数据传输速率阈值h,h为网卡速度的2%,两个进程间数据传输速率大于阈值h的两两进程,得到进程配对表{c0c1,c1c2,...,cici+1},0<i<k/2;将大于阈值h的配对进程,按照传输速率对进程配对表降序排列;
步骤3.2:根据步骤3.1得到的降序排列的进程配对表,依次得到流量最大的两个配对进程cici+1,根据配对的两个进程cici+1内的线程关系,得到线程上下游关系表{e1,e2,e3,...,ei};
步骤3.3:根据配对进程cici+1的线程上下游关系表,将进程内的线程按照如下的方式进行重新分配线程:
分配最上游线程ei,将最上游的各个线程以轮询的方式分配到cici+1进程中;然后再分配线程ei的直接下游线程ei+1,将线程ei+1分配到存在线程ei的进程中;即ei和ei+1总是成对出现,得到新的进程和线程对应表;
步骤4:任务分配
根据步骤2得到机器和进程的对应表和步骤3得到的进程和线程对应表,可知每个线程所属的进程,每个进程所属的机器得到了任务分配的全部信息,进行任务分配时,采用Storm的Cluster类的setAssignments函数依次将进程分配到机器上,进程信息及包含的线程通过进程和线程对应表进行查询,机器信息通过机器和进程的对应表查询获得,任务分配过程通过Storm命令rebalance来触发实施任务分配。
CN201810092610.7A 2018-01-31 2018-01-31 一种基于网络流量优化的Storm任务调度方法 Active CN108415761B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810092610.7A CN108415761B (zh) 2018-01-31 2018-01-31 一种基于网络流量优化的Storm任务调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810092610.7A CN108415761B (zh) 2018-01-31 2018-01-31 一种基于网络流量优化的Storm任务调度方法

Publications (2)

Publication Number Publication Date
CN108415761A true CN108415761A (zh) 2018-08-17
CN108415761B CN108415761B (zh) 2021-11-05

Family

ID=63127214

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810092610.7A Active CN108415761B (zh) 2018-01-31 2018-01-31 一种基于网络流量优化的Storm任务调度方法

Country Status (1)

Country Link
CN (1) CN108415761B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522108A (zh) * 2018-10-30 2019-03-26 西安交通大学 一种基于Kernel合并的GPU任务调度系统及方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6490566B1 (en) * 1999-05-05 2002-12-03 I2 Technologies Us, Inc. Graph-based schedule builder for tightly constrained scheduling problems
CN101807159A (zh) * 2010-03-18 2010-08-18 西北工业大学 一种自适应任务调度方法
CN102866912A (zh) * 2012-10-16 2013-01-09 首都师范大学 一种单指令集异构多核系统静态任务调度方法
CN104572297A (zh) * 2014-12-24 2015-04-29 西安工程大学 一种基于遗传算法的Hadoop作业调度方法
CN105786626A (zh) * 2016-04-11 2016-07-20 南京邮电大学 基于K划分的Storm平台线程分配方法
CN105893145A (zh) * 2016-03-24 2016-08-24 海信集团有限公司 一种基于遗传算法的任务调度方法及装置
CN106547613A (zh) * 2016-10-20 2017-03-29 西北工业大学 任务处理流程的调度及故障恢复方法
US20170116522A1 (en) * 2015-10-05 2017-04-27 Telekom Malaysia Berhad Method For Task Scheduling And Resources Allocation And System Thereof
CN107038071A (zh) * 2017-05-26 2017-08-11 重庆邮电大学 一种基于数据流预测的Storm任务伸缩调度算法
CN107273209A (zh) * 2017-06-09 2017-10-20 北京工业大学 基于最小生成树聚类改进遗传算法的Hadoop任务调度方法
CN107273197A (zh) * 2017-06-14 2017-10-20 北京工业大学 基于正交实验改进的谱聚类遗传算法的Hadoop任务调度方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6490566B1 (en) * 1999-05-05 2002-12-03 I2 Technologies Us, Inc. Graph-based schedule builder for tightly constrained scheduling problems
CN101807159A (zh) * 2010-03-18 2010-08-18 西北工业大学 一种自适应任务调度方法
CN102866912A (zh) * 2012-10-16 2013-01-09 首都师范大学 一种单指令集异构多核系统静态任务调度方法
CN104572297A (zh) * 2014-12-24 2015-04-29 西安工程大学 一种基于遗传算法的Hadoop作业调度方法
US20170116522A1 (en) * 2015-10-05 2017-04-27 Telekom Malaysia Berhad Method For Task Scheduling And Resources Allocation And System Thereof
CN105893145A (zh) * 2016-03-24 2016-08-24 海信集团有限公司 一种基于遗传算法的任务调度方法及装置
CN105786626A (zh) * 2016-04-11 2016-07-20 南京邮电大学 基于K划分的Storm平台线程分配方法
CN106547613A (zh) * 2016-10-20 2017-03-29 西北工业大学 任务处理流程的调度及故障恢复方法
CN107038071A (zh) * 2017-05-26 2017-08-11 重庆邮电大学 一种基于数据流预测的Storm任务伸缩调度算法
CN107273209A (zh) * 2017-06-09 2017-10-20 北京工业大学 基于最小生成树聚类改进遗传算法的Hadoop任务调度方法
CN107273197A (zh) * 2017-06-14 2017-10-20 北京工业大学 基于正交实验改进的谱聚类遗传算法的Hadoop任务调度方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JIELONG XU ET AL.: "《T-Storm: Traffic-Aware Online Scheduling in Storm》", 《2014 IEEE 34TH INTERNATIONAL CONFERENCE ON DISTRIBUTED COMPUTING SYSTEMS》 *
代应祥: "《基于Hadoop的作业调度策略研究》", 《中国优秀硕士学位论文全文数据库(信息科技辑)电子期刊》 *
范嘉骅: "《Storm中自适应任务调度的研究与优化》", 《万方在线平台》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522108A (zh) * 2018-10-30 2019-03-26 西安交通大学 一种基于Kernel合并的GPU任务调度系统及方法
CN109522108B (zh) * 2018-10-30 2020-10-27 西安交通大学 一种基于Kernel合并的GPU任务调度系统及方法

Also Published As

Publication number Publication date
CN108415761B (zh) 2021-11-05

Similar Documents

Publication Publication Date Title
CN110618870B (zh) 一种深度学习训练任务的工作方法及装置
CN102098684B (zh) 认知无线网络中跨层资源分配系统及方法
CN104902001B (zh) 基于操作系统虚拟化的Web请求负载均衡方法
CN107659419A (zh) 网络切片方法和系统
CN109600178A (zh) 一种边缘计算中能耗与时延和最小化的优化方法
CN107820321B (zh) 一种基于蜂窝网络的窄带物联网中大规模用户智能接入方法
CN106385468A (zh) Web集群的可预测动态负载均衡方法
CN108055701B (zh) 一种资源调度方法及基站
CN108055292B (zh) 一种虚拟机向物理机映射的优化方法
CN102195885A (zh) 报文处理方法及装置
CN103096485B (zh) 一种lte系统中多用户多入多出频选调度的方法
CN105071992B (zh) 变电站配用电业务通信带宽预测方法
CN104881322A (zh) 一种基于装箱模型的集群资源调度方法及装置
CN106027288A (zh) 一种配电线路信息监测业务通信流量预测方法
CN108388726A (zh) 一种考虑多目标多约束性能均衡的机械结构稳健优化设计方法
CN104602355B (zh) Lte系统中混合业务调度方法
WO2020134145A1 (zh) 时频空资源分配方法、计算机装置及计算机可读存储介质
CN108415761A (zh) 一种基于网络流量优化的Storm任务调度方法
CN101827446B (zh) 一种无线承载调度方法和装置
CN116708446B (zh) 基于网络性能综合权值决策的算网调度服务方法及系统
CN105120008B (zh) 一种基于分层的分布式云计算中心负载平衡方法
CN107087309A (zh) 用户QoS的固定速率约束下的多基站系统比例公平调度方法
CN107153677A (zh) 一种查找价值用户的数据处理方法和系统
CN105187488A (zh) 一种基于遗传算法实现mas负载均衡的方法
CN101212410A (zh) 一种实现下行资源调度的方法、系统及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant