CN107608777A - 一种分布式环境中大数据处理任务的调度方法 - Google Patents

一种分布式环境中大数据处理任务的调度方法 Download PDF

Info

Publication number
CN107608777A
CN107608777A CN201710834984.7A CN201710834984A CN107608777A CN 107608777 A CN107608777 A CN 107608777A CN 201710834984 A CN201710834984 A CN 201710834984A CN 107608777 A CN107608777 A CN 107608777A
Authority
CN
China
Prior art keywords
task
evaluation
queue
head
evaluation index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710834984.7A
Other languages
English (en)
Inventor
魏小敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710834984.7A priority Critical patent/CN107608777A/zh
Publication of CN107608777A publication Critical patent/CN107608777A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)

Abstract

本发明公开一种分布式环境中大数据处理任务的调度方法,涉及大数据处理技术领域;在分布式环境中,当任务到达队首时,判断当前空闲的计算节点是否含有队首任务所需要的数据,当前空闲计算节点包含队首任务所需数据,直接将队首任务调度到该节点上,否则根据任务的动态信息将任务分类,对不同类别的任务设置不同的等待时间阈值,根据任务的类别和等待时间阈值判断该任务是直接调度还是继续等待。

Description

一种分布式环境中大数据处理任务的调度方法
技术领域
本发明公开一种调度方法,涉及大数据处理技术领域,具体的说是一种分布式环境中大数据处理任务的调度方法。
背景技术
Hadoop作为一个处理、存储和分析海量的分布式、非结构化数据的开源框架,具有廉价的处理大数据的能力,能够以—种可靠、高效、可伸缩的方式处理分布式环境下的“大数据”。现在国内外的很多公司都选择使用Hadoop平台来进行大数据方面的相关业务。但是Hadoop在性能方面仍然有很多可提升的空间。同时通过研究Hadoop自身的性能影响因素,如MapReduce作业执行流程的合理性、数据分布、数据本地性及任务调度算法等方面对其进行改进。对任务进行调度时,要尽量提高数据本地性。为了提高MapReduce任务的数据本地性,相关领域的专家提出了延迟调度算法该算法采用“延迟调度”的策略,通过增加一定的等待时间开销来提高任务的数据本地性。然而该算法的前提是假设所有的任务都是短任务,并且对每个任务设置的是统一的静态等待时间阈值,这样的做法降低了算法的复杂度,却存在一些问题:(1)不同长短的任务设置相同的等待时间阈值:在实际应用场景中,不可能满足“所有的任务都是短任务”这一假设,现实情况是既有短任务又有长任务。对于短任务来说,任务本身的执行时间较短,甚至有可能低于任务的等待时间,那么在这种情况下,仍然让任务等待较长的时间,以增加时间开销来片面地追求数据本地化显然是不合理的;而对于长任务来说,任务本身的执行时间就很长,再加上较长的等待时间,会大大延长整体作业的完成时间。(2)不同的网络环境设置相同的等待时间阀值:随着任务的调度,某些节点已无任务所需的本地数据,那么当这些节点空闲时,依照延迟调度算法的策略,只有当一些任务等待的时间超过设定的阀值后,才有可能被调度到这些空闲的计算节点上。当这些无任务所需本地数据的空闲节点得不到超时任务时,就会一直等待下去,从而造成资源的浪费并且增加时间开销,特别是在负载比较大的情况下,有任务本地数据的计算节点不会很快空闲,那么就会导致一方面有很多任务一直在排队等待调度,而另一方面却有部分节点一直处于空闲状态,严重影响作业的完成时间。
本发明提供一种分布式环境中大数据处理任务的调度方法,利用具有更高性能的分布式任务调度算法,针对以上缺陷,对延迟算法进行一些改进,达到提高MapReduce任务调度的数据本地性以及缩短作业的完成时间,减少不必要的时间开销的目的,提高MapReduce任务调度的整体性能。
TCDDS,the Dynamic Delay Scheduling Based on Task Classification,基于任务分类的动态延迟调度算法。
FIFO,First In First Out,先进先出调度算法。
Fuzzy Commprehensive Evaluation Mthod,模糊综合评价法。
发明内容
本发明针对目前技术发展的需求和不足之处,提供一种分布式环境中大数据处理任务的调度方法。
一种分布式环境中大数据处理任务的调度方法,在分布式环境中,当任务到达队首时,判断当前空闲的计算节点是否含有队首任务所需要的数据,当前空闲计算节点包含队首任务所需数据,直接将队首任务调度到该节点上,
否则根据任务的动态信息将任务分类,对不同类别的任务设置不同的等待时间阈值,根据任务的类别和等待时间阈值判断该任务是直接调度还是继续等待。
所述的方法中根据任务的动态信息,将任务分成三类:高优先级任务、中优先级任务和低优先级任务,高优先级任务的等待时间阈值为0,低优先级任务在三者中等待时间阈值最长,而中优先级任务的等待时间阈值在高优先级任务与低优先级任务之间。
所述的方法中当前空闲计算节点不包含队首任务所需数据,而队首待调度的任务是高优先级任务,立即调度队首任务,而不再令其等待。
所述的方法中当前空闲计算节点不包含队首任务所需数据,而队首待调度的任务是中优先级任务,则先调度队伍中的其他任务而让队首任务等待,直到含有该任务所需数据的计算节点空闲,立即调度该任务;
或者队首任务的等待时间超过等待时间阈值,则立刻调度队首任务而不再令其继续等待。
所述的方法中当前空闲计算节点不包含队首任务所需数据,而队首待调度的任务是低优先级任务,先调度队伍中的其他任务而让队首任务等待,直到含有该任务所需数据的计算节点空闲,立即调度该任务;
或者队首任务的等待时间超过等待时间阈值,则立刻调度队首任务而不再令其继续等待。
所述的方法中利用模糊综合评价法将任务进行分类,则任务为评价对象,任务的动态信息作为评价指标,
具体步骤为:
步骤1:根据对评价对象可能做出的各种总的评价结果,确定评价对象的评价结果集,
步骤2:根据对评价对象进行评价所依照的评价指标,确定评价对象的评价指标集,
步骤3:根据分布式环境中各评价指标对大数据任务处理的影响,确定评价指标的权重矢量,
步骤4:利用单因素模糊评价,得到评价对象对各评价指标的隶属度,利用每个评价指标逐个对评价对象进行量化,确立模糊关系矩阵,
步骤5:选择合适的模糊合成算子将权重矢量与模糊关系矩阵合成,得到各评价对象的模糊综合评价的结果矢量,
步骤6:分析模糊综合评价的结果矢量,确定任务的分类结果。
所述的方法中根据属性将步骤2中的评价指标分类,每一类评价指标作为第一级评价指标,第一级评价指标包括该类别下的评价指标参数,作为第二级评价指标。
所述的方法中步骤4中利用单因素模糊评价,分别对各个评价指标进行分析,寻找其类似的模糊分布,将评价指标的隶属度函数定义为相应模糊分布的隶属度函数,并选择合适的参数,获得评价对象对各评价指标的隶属度。
所述的方法中任务的动态信息包括任务本身信息,计算节点信息以及当前的网络性能信息。
本发明与现有技术相比具有的有益效果是:
本发明提出了一种分布式环境中大数据处理任务的调度方法,在分布式环境中,可基于任务分类的动态延迟调度算法,充分考虑影响任务的等待时间阈值的因素,在为任务设置等待时间阈值时,将多种因素的影响都考虑在内,按照一定的策略将任务分类,对不同类别的任务设置不同的等待时间阈值,根据任务的类别和等待时间阈值来对其进行调度。在本发明中利用TCDDS算法,对任务进行分类的依据并不仅仅是任务自身的信息,而是综合考虑任务本身、计算节点以及网络环境等各方面的信息因素,这些因素中包括动态变化的信息因素,因此本发明的任务分类是在待分类任务进入队伍之后,即将被调度之前,而不是事先就对所有的任务进行分类,所以本发明对任务进行的分类是动态的,分类结果实时受到动态变化的信息因素影响,解决了在已有的任务调度中,仅依靠单一因素分类任务,而导致任务的时间开销与节点分配不合理的问题,减少时间开销和提高数据本地性,从而提高系统整体性能。
附图说明
图1本发明方法的应用流程示意图。
具体实施方式
本发明提供一种分布式环境中大数据处理任务的调度方法,在分布式环境中,当任务到达队首时,判断当前空闲的计算节点是否含有队首任务所需要的数据,当前空闲计算节点包含队首任务所需数据,直接将队首任务调度到该节点上,
否则根据任务的动态信息将任务分类,对不同类别的任务设置不同的等待时间阈值,根据任务的类别和等待时间阈值判断该任务是直接调度还是继续等待。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,对本发明进一步详细说明。
利用本发明方法,在分布式环境中,任务的动态信息主要包括任务本身信息,计算节点信息以及当前的网络性能信息,其中影响任务等待时间阈值的因素主要是任务长度信息,计算节点信息中影响任务等待时间阈值的因素主要是节点的空闲速率及空闲节点含有队首待调度任务的本地数据的概率简称本地概率,而在网络性能方面影响任务等待时间阈值的主要是带宽、时延和流量,
以利用模糊综合评价法将任务进行分类为例,任务为评价对象,任务的动态信息作为评价指标,具体步骤如下:
步骤1:根据对评价对象可能做出的各种总的评价结果,确定评价对象的评价结果集V,其中设V={v1,v2,……vm},是对评价对象可能做出的各种总的评价结果的集合,其中,vj代表第j个评价结果j=1,2,……m;m为总的评价结果数,可划分为3-5个等级,本发明中的等待时间阈值为评价结果,将评价结果划分为3个等级为例,v1=长,v2=中,v3=短,而又以“长”、“中”、“短”这三个评价结果分别对应着“低优先级任务”、“中优先级任务”和“高优先级任务”这三个分类为例,评价结果集V={v1,v2,v3}={长,中,短};
其中高优先级任务,意味着该任务能够被调度到含有自己所需数据的计算节点上的概率是很低的,即使进行较长时间的等待也不一定能满足任务的数据本地性,因而可以直接放弃对数据本地性的追求,避免徒劳地增加时间开销;
中优先级任务,意味着该任务能够被调度到含有自己所需数据的计算节点上的概率略高于高优先级任务,所以可以适当地等待一段时间;
低优先级任务,意味着该任务能够被调度到含有自己所需数据的计算节点上的概率是很高的,在这种情况下,通过增加一定程度的时间开销来尽可能地提高任务的数据本地性是很有必要的;
步骤2:根据对评价对象进行评价所依照的评价指标,确定评价对象的评价指标集U,其中设U={u1,u2,...,un},是评价者对评价对象进行评价所依照的n种评价指标的集合,其中,ui代表第i个评价指标,i=1,2,...,n,n为评价指标的总个数,由具体的评价指标体系来决定,可按照属性将评价指标分为若干类,每一类都可视为单一的评价指标,用第一级评价指标来表示,在每个第一级评价指标下可以设置若干个该类别的评价指标参数,用uim来表示,此为第二级评价指标,本发明中,评价指标就是任务的分类依据,即前面说明的任务的动态信息,是影响任务的等待时间阈值设定的因素,因此U={任务,节点,网络}。其中,任务自身方面,能影响任务等待时间阈值的因素主要是任务长度,因此:U1=任务={u11}={任务长度};在计算节点方面,影响任务等待时间阈值的因素主要是计算节点的空闲速率,简称空闲速率以及空闲计算节点含有队首待调度任务的本地数据的概率,简称为本地概率,因此U2=节点={u21,u22}={空闲速率,本地速率}。在网络环境方面,影响任务等待时间阈值的主要是带宽、时延和流量因素,因此:
U3=网络={u31,u32,u33}={网络带宽,网络时延,网络流量};
则上述评价指标体系包含以下内容:三个第一级指标:任务、节点、网络和六个第二级指标:任务长度、空闲速率、本地概率、网络带宽、网络时延、网络流量;评价对象的评价指标集可以表示为U=U1∪U2∪U3={任务长度,空闲速率,本地概率,网络带宽,网络时延,网络流量};
步骤3:根据分布式环境中各评价指标对大数据任务处理的影响,确定评价指标的权重矢量,
设W=(w1,w2,...,wn)为权重分配模矢量,其中wi表示第i个评价指标的权重,要求:wi≥0,且W反映了各指评价标重要程度;表1为对比矩阵标度定义,根据上述表1各项指标对比矩阵标度定义,可知表中元素i与元素j相比的相对重要性Aij的标度,则元素j与元素i相比的相对重要性Aji的标度如以下公式所示:
表1
根据分布式环境中各评价指标对大数据任务处理的影响,可以设定三个第一级评价指标的重要性两两对比,得出第一级评价指标的对比矩阵A1为表2所示;
表2
第一级指标 U1 U2 U3
U1 1 7 9
U2 1/7 1 3
U3 1/9 1/3 1
矩阵A1可以表示为:
由特征值和特征向量可得矩阵A1的特征向量:
对特征向量做归一化处理,即可得到这三个第一级评价指标间的相对权重,又由归一化公式:
则第一级评价指标U1、U2、U3间的相对权重为:
同理,根据以上步骤可以得出节点、网络的第二级评价指标的重要性两两对比,对比值分别见下表3、表4所示;
表3
第一级指标 U21 U22
U21 1 3
U22 1/3 1
表4
第一级指标 U31 U32 U33
U31 1 3 3
U32 1/3 1 1
U33 1/3 1 1
根据上述计算过程,可以得到计算节点的第二级评价指标u21和u22之间的相对权重矢量为:
Q=(0.75,0.25)
同理得到网络的第二级评价指标u31、u32和u33之间的相对权重矢量为:
R=(0.6,0.2,0.2)
由上述矢量P的值,将矢量Q和矢量R代入矢量P,最终可以得到所有指标的权重矢量:
W=(0.766,0.116,0.039,0.041,0.014,0.014);
步骤4:利用单因素模糊评价,得到评价对象对各评价指标的隶属度,利用每个评价指标逐个对评价对象进行量化,确立模糊关系矩阵;
单独从一个评价指标出发对评价对象进行评价,得出评价对象对每一个评价结果的隶属度大小,最终得到评价对象对评价集合V整体的隶属度大小,这种方法称为单因素模糊评价。利用单因素模糊评价,得到评价对象对各评价指标的隶属度,也就是逐个对评价对象从每个评价指标ui上进行量化,进而可得到模糊关系矩阵,如下面公式所示:
其中rij表示表示某个评价对象从评价指标ui来看对单一评价结果vj的隶属度,且0≤rij≤1,i=1,2,...,6,j=1,2,3;由步骤1可知,评价结果集V={v1,v2,v3}={长,中,短}。由步骤4可知,本发明确定的六个评价指标的权重为W=(0.776,0.116,0.039,0.041,0.014,0.014);
隶属度函数就是表示某元素属于某个模糊集合的“程度”,隶属度的大小表示的就是某元素属于某个模糊集合的程度的大小,本发明中隶属度函数的确立,采用根据模糊分布的方法来确立方法。常用的模糊分布有阶梯型模糊分布、矩阵型模糊分布、正态分布、柯西分布等,模糊现象的隶属度函数与某种模糊分布相似时,则可以直接将其作为隶属度函数,然后根据实际情况确定公式中的参数。本发明确立隶属度函数的方法是:对各个评价指标进行分析,寻找类似的模糊分布,将评价指标的隶属度函数定义为相应模糊分布的隶属度函数,并设置合适的参数:
首先,对评价指标u1即任务长度进行分析,对于u1,任务长度是决定任务的等待时间阈值的一个很重要的指标。任务较长或较短时,等待时间阈值都不宜过长,所以u1对v1的隶属度函数应是中间型分布,对v2的隶属度函数是偏大型分布,对v3的隶属度函数是偏小型分布,可以使用正态分布来定义u1对vj的隶属度函数,通过仿真不断对参数进行调整后,最终得到如以下公式所示u1对vj的隶属度函数:
u1对v1的隶属度函数A11(x)如以下公式所示:
u1对v2的隶属度函数A12(x)如以下公式所示:
u1对v3的隶属度函数A13(x)如以下公式所示:
对评价指标u2即节点空闲速率进行分析。空闲节点释放的速度越快,就意味着任务被调度到含有自己所需数据的节点上的可能性就越大,在这种情况下,可能稍微延长一点等待时间就能换取更大的数据本地性,因此等待时间阈值可以较长。所以u2对v1的隶属度函数是偏大型分布,对v2的隶属度函数是偏小型分布,对v3的隶属度函数是中间型分布,因此可以使用柯西分布来定义u2对vj的隶属度函数,通过仿真不断对参数进行调整后,最终得到如下所示的隶属度函数:
u2对v1的隶属度函数A21(x)如以下公式所示:
u2对v2的隶属度函数A22(x)如以下公式所示:
u2对v3的隶属度函数A23(x)如以下公式所示:
对评价指标u3即本地概率进行分析。u3对v1的隶属度函数应是偏大型分布,对v2的隶属度函数是中间型分布,对v3的隶属度函数是偏小型分布,因此可以使用K次抛物型分布来定义u3对vj的隶属度函数,通过仿真不断对参数进行调整后,最终得到如下所示的隶属度函数:
u3对v1的隶属度函数A31(x)如以下公式所示:
u3对v2的隶属度函数A32(x)如以下公式所示:
u3对v3的隶属度函数A33(x)如以下公式所示:
对评价指标u4即网络带宽进行分析。u4对v1的隶属度函数应是偏小型分布,对v2的隶属度函数是中间型分布,对v3的隶属度函数是偏大型分布,因此可以使用梯形分布来定义u4对vj的隶属度函数,通过仿真不断对参数进行调整后,最终得到如下所示的隶属度函数:
u4对v1的隶属度函数A41(x)如以下公式所示:
u4对v2的隶属度函数A42(x)如以下公式所示:
u4对v3的隶属度函数A43(x)如以下公式所示:
同理,对评价指标u5即网络时延进行分析。u5对v1的隶属度函数应是偏大型分布,对v2的隶属度函数是中间型分布,对v3的隶属度函数是偏小型分布。因此其隶属度函数分布与u3相似;
同理,对评价指标u6即网络流量进行分析。u6对v1的隶属度函数应是偏小型分布,对v2的隶属度函数是中间型分布,对v3的隶属度函数是偏大型分布。因此其隶属度函数分布与u4相似;
步骤5:选择合适的模糊合成算子将权重矢量与模糊关系矩阵合成,得到各评价对象的模糊综合评价的结果矢量,
其中利用合适的模糊合成算子将模糊权重矢量W与模糊关系矩阵R合成得到各被评价对象的模糊综合评价结果矢量B,本发明的评价指标集中,u4、u5和u6这三个评价指标之间并非是相互独立的,而且期望得到的最佳评价结果是在这几个指标的共同作用下得到的最终结果,期望得到的最佳评价结果是在这几个指标的共同作用下得到的最终结果,选择加权平均型的综合评判算子:
矩阵R中每一个元素rij和权重向量中的每一个元素wi对最后的评价结果都有一定的贡献,因此该算子是加权平均型的综合评判,而且各指标之间能够相互补偿,当各指标的权重分布较为均衡时,得到的结果可信度较高;
步骤6:分析模糊综合评价的结果矢量,确定任务的分类结果,
在步骤5中,得到了模糊综合评价结果矢量B,然而该矢量并不能作为最终的评价结果,仍需进行进一步的分析和处理,本发明可采用最大隶属度原则和加权平均原则对模糊综合评价矢量B进行处理,以最大隶属度原则来进行处理为例,
br=max{b1,b2,…,bn}
最终的评价结果就是分量最大的br对应的结果,也就是被评价任务的分类结果,根据上述举例,br实际上有三个分量,就是对应的{长、中、短},即br=max{b1,b2,b3},比如br={0.2,0.5,0.3},那么根据隶属度最大原则0.5最大,这个任务的评价结果就是{中},而任务分类的结果:高优先级任务、中优先级任务和低优先级任务分别对应的等待时间阈值为tH、tM、tL
则对任务进行调度的过程为:
当任务到达队首时,判断当前空闹的计算节点是否含有队首任务所需要的数据;
若当前空闲的计算节点含有队首任务所需要的数据,则将队首任务调度到该节点上;若当前空闲的计算节点不含队首任务所需要的数据,则统计当前节点和网络的状态,并依据前面所述模糊综合评价法对任务进行分类;
若该任务的分类结果为高优先级任务,则立即将该任务调度到当前空闲的计算节点上;
若该任务的分类结果为中优先级任务,则令该任务暂时等待。如果在等待的过程中,有含有该任务所需数据的节点空闲,立即调度该任务;如果该任务等待的时间超过tM,则无论下一个空闲的节点是否含有该任务所需的数据,都立即调度该任务;
若该任务的分类结果为低优先级任务,则令该任务暂时等待。如果在等待的过程中,有含有该任务所需数据的节点空闲,立即调度该任务;如果该任务等待的时间超过tL,则无论下一个空闲的节点是否含有该任务所需的数据,都立即调度该任务。
本发明利用具有更高性能的分布式任务调度算法,对延迟算法进行一些改进,达到提高MapReduce任务调度的数据本地性以及缩短作业的完成时间,减少不必要的时间开销的目的,提高MapReduce任务调度的整体性能。同样本发明可以应用于云计算平台中任务处理。

Claims (9)

1.一种分布式环境中大数据处理任务的调度方法,其特征在于在分布式环境中,当任务到达队首时,判断当前空闲的计算节点是否含有队首任务所需要的数据,当前空闲计算节点包含队首任务所需数据,直接将队首任务调度到该节点上,
否则根据任务的动态信息将任务分类,对不同类别的任务设置不同的等待时间阈值,根据任务的类别和等待时间阈值判断该任务是直接调度还是继续等待。
2.根据权利要求1所述的方法,其特征在于根据任务的动态信息,将任务分成三类:高优先级任务、中优先级任务和低优先级任务,高优先级任务的等待时间阈值为0,低优先级任务在三者中等待时间阈值最长,而中优先级任务的等待时间阈值在高优先级任务与低优先级任务之间。
3.根据权利要求2所述的方法,其特征在于当前空闲计算节点不包含队首任务所需数据,而队首待调度的任务是高优先级任务,立即调度队首任务,而不再令其等待。
4.根据权利要求2或3所述的方法,其特征在于当前空闲计算节点不包含队首任务所需数据,而队首待调度的任务是中优先级任务,则先调度队伍中的其他任务而让队首任务等待,直到含有该任务所需数据的计算节点空闲,立即调度该任务;
或者队首任务的等待时间超过等待时间阈值,则立刻调度队首任务而不再令其继续等待。
5.根据权利要求4所述的方法,其特征在于当前空闲计算节点不包含队首任务所需数据,而队首待调度的任务是低优先级任务,先调度队伍中的其他任务而让队首任务等待,直到含有该任务所需数据的计算节点空闲,立即调度该任务;
或者队首任务的等待时间超过等待时间阈值,则立刻调度队首任务而不再令其继续等待。
6.根据权利要求1-3或5任一所述的方法,其特征在于利用模糊综合评价法将任务进行分类,则任务为评价对象,任务的动态信息作为评价指标,
具体步骤为:
步骤1:根据对评价对象可能做出的各种总的评价结果,确定评价对象的评价结果集,
步骤2:根据对评价对象进行评价所依照的评价指标,确定评价对象的评价指标集,
步骤3:根据分布式环境中各评价指标对大数据任务处理的影响,确定评价指标的权重矢量,
步骤4:利用单因素模糊评价,得到评价对象对各评价指标的隶属度,利用每个评价指标逐个对评价对象进行量化,确立模糊关系矩阵,
步骤5:选择合适的模糊合成算子将权重矢量与模糊关系矩阵合成,得到各评价对象的模糊综合评价的结果矢量,
步骤6:分析模糊综合评价的结果矢量,确定任务的分类结果。
7.根据权利要求6所述的方法,其特征在于根据属性将步骤2中的评价指标分类,每一类评价指标作为第一级评价指标,第一级评价指标包括该类别下的评价指标参数,作为第二级评价指标。
8.根据权利要求7所述的方法,其特征在于步骤4中利用单因素模糊评价,分别对各个评价指标进行分析,寻找其类似的模糊分布,将评价指标的隶属度函数定义为相应模糊分布的隶属度函数,并选择合适的参数,获得评价对象对各评价指标的隶属度。
9.根据权利要求7或8所述的方法,其特征在于任务的动态信息包括任务本身信息,计算节点信息以及当前的网络性能信息。
CN201710834984.7A 2017-09-15 2017-09-15 一种分布式环境中大数据处理任务的调度方法 Pending CN107608777A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710834984.7A CN107608777A (zh) 2017-09-15 2017-09-15 一种分布式环境中大数据处理任务的调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710834984.7A CN107608777A (zh) 2017-09-15 2017-09-15 一种分布式环境中大数据处理任务的调度方法

Publications (1)

Publication Number Publication Date
CN107608777A true CN107608777A (zh) 2018-01-19

Family

ID=61060238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710834984.7A Pending CN107608777A (zh) 2017-09-15 2017-09-15 一种分布式环境中大数据处理任务的调度方法

Country Status (1)

Country Link
CN (1) CN107608777A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408217A (zh) * 2018-11-13 2019-03-01 杭州数梦工场科技有限公司 一种spark任务运行时间调整方法、装置及设备
CN109947532A (zh) * 2019-03-01 2019-06-28 中山大学 一种教育云平台中的大数据任务调度方法
CN111479176A (zh) * 2019-11-27 2020-07-31 重庆前卫克罗姆表业有限责任公司 一种基于NB-IoT的自适应模糊数据上传方法
CN111610977A (zh) * 2020-05-19 2020-09-01 腾讯科技(深圳)有限公司 一种编译方法和相关装置
CN112381503A (zh) * 2020-11-06 2021-02-19 上海瀚银信息技术有限公司 一种项目上线优化管理系统及方法
CN112988361A (zh) * 2021-05-13 2021-06-18 神威超算(北京)科技有限公司 集群任务分配方法、装置和计算机可读介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106453492A (zh) * 2016-08-30 2017-02-22 浙江大学 基于模糊模式识别的Docker容器云平台下的容器调度方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106453492A (zh) * 2016-08-30 2017-02-22 浙江大学 基于模糊模式识别的Docker容器云平台下的容器调度方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
胡齐: ""海量频谱监测数据的传输存储与调度技术研究"", 《华中科技大学硕士论文》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408217A (zh) * 2018-11-13 2019-03-01 杭州数梦工场科技有限公司 一种spark任务运行时间调整方法、装置及设备
CN109947532A (zh) * 2019-03-01 2019-06-28 中山大学 一种教育云平台中的大数据任务调度方法
CN111479176A (zh) * 2019-11-27 2020-07-31 重庆前卫克罗姆表业有限责任公司 一种基于NB-IoT的自适应模糊数据上传方法
CN111479176B (zh) * 2019-11-27 2022-05-27 重庆前卫表业有限公司 一种基于NB-IoT的自适应模糊数据上传方法
CN111610977A (zh) * 2020-05-19 2020-09-01 腾讯科技(深圳)有限公司 一种编译方法和相关装置
CN112381503A (zh) * 2020-11-06 2021-02-19 上海瀚银信息技术有限公司 一种项目上线优化管理系统及方法
CN112988361A (zh) * 2021-05-13 2021-06-18 神威超算(北京)科技有限公司 集群任务分配方法、装置和计算机可读介质
CN112988361B (zh) * 2021-05-13 2021-08-20 中诚华隆计算机技术有限公司 集群任务分配方法、装置和计算机可读介质

Similar Documents

Publication Publication Date Title
CN107608777A (zh) 一种分布式环境中大数据处理任务的调度方法
CN110096349A (zh) 一种基于集群节点负载状态预测的作业调度方法
Kang et al. Web service selection for resolving conflicting service requests
CN104657221A (zh) 一种云计算中基于任务分类的多队列错峰调度模型及方法
CN111984381A (zh) 一种基于历史数据预测的Kubernetes资源调度优化方法
CN109783225B (zh) 一种多租户大数据平台的租户优先级管理方法及系统
Guo et al. On-demand resource provision based on load estimation and service expenditure in edge cloud environment
CN113641417B (zh) 一种基于分支定界法的车辆安全任务卸载方法
Dutta et al. A smart job scheduling system for cloud computing service providers and users: modeling and simulation
CN104657205A (zh) 一种基于虚拟化的视频内容分析方法及系统
CN108510150A (zh) 一种基于边缘计算的纺纱cps及其实时任务处理方法
Guo et al. Intelligent task offloading and resource allocation in digital twin based aerial computing networks
Jin et al. Optimal policy characterization enhanced proximal policy optimization for multitask scheduling in cloud computing
He et al. DROI: Energy-efficient virtual network embedding algorithm based on dynamic regions of interest
Mebrek et al. Intelligent resource allocation and task offloading model for IoT applications in fog networks: a game-theoretic approach
Kannan et al. A multi-objective load balancing and power minimization in cloud using bio-inspired algorithms
Li et al. A QoS-based scheduling algorithm for instance-intensive workflows in cloud environment
Mao et al. Optimal scheduling algorithm of MapReduce tasks based on QoS in the hybrid cloud
US12106158B2 (en) Fair task offloading and migration method for edge service networks
CN106445680B (zh) 基于综合效用的计算单元迁移方法
Cui et al. Latency-Aware Container Scheduling in Edge Cluster Upgrades: A Deep Reinforcement Learning Approach
Phung-Duc et al. Energy-aware data centers with s-staggered setup and abandonment
CN108563497A (zh) 一种高效的多维度算法调度方法、任务服务器
Chen et al. M-DRL: Deep reinforcement learning based coflow traffic scheduler with MLFQ threshold adaption
Chitsaz et al. Scaling Power Management in Cloud Data Centers: A Multi-Level Continuous-Time MDP Approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180119

RJ01 Rejection of invention patent application after publication