CN115686799A - 一种大数据平台中的任务调度方法、装置、设备及介质 - Google Patents

一种大数据平台中的任务调度方法、装置、设备及介质 Download PDF

Info

Publication number
CN115686799A
CN115686799A CN202211712518.9A CN202211712518A CN115686799A CN 115686799 A CN115686799 A CN 115686799A CN 202211712518 A CN202211712518 A CN 202211712518A CN 115686799 A CN115686799 A CN 115686799A
Authority
CN
China
Prior art keywords
node
average value
performance
working
utilization rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211712518.9A
Other languages
English (en)
Other versions
CN115686799B (zh
Inventor
李小翔
王世军
舒安杰
宋彦良
孙英
潘东阳
冯帆
韦玮
杨永前
邸智
付雄
孙可欣
石英钰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaneng Real Estate Co ltd
Huaneng Clean Energy Research Institute
Original Assignee
Huaneng Real Estate Co ltd
Huaneng Clean Energy Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaneng Real Estate Co ltd, Huaneng Clean Energy Research Institute filed Critical Huaneng Real Estate Co ltd
Priority to CN202211712518.9A priority Critical patent/CN115686799B/zh
Publication of CN115686799A publication Critical patent/CN115686799A/zh
Application granted granted Critical
Publication of CN115686799B publication Critical patent/CN115686799B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明属于大数据技术领域,具体涉及一种大数据平台中的任务调度方法、装置、设备及介质。本发明的任务调度方法先计算了工作节点的资源使用率均值集合及节点性能权值,然后根据资源使用率均值集合和节点性能权值计算工作节点的性能分数,筛选出评分最高的节点,并将任务调度至该节点上。综合考虑节点的CPU使用率、内存使用率、网卡发送带宽利用率和网卡接收带宽利用率,并考虑这些资源使用率的碎片率和任务的数据亲和性,保证整个大数据平台任务调度的高效运行。避免了作业在节点之间的分配和调度不合理,造成整个大数据平台的性能下降的问题。

Description

一种大数据平台中的任务调度方法、装置、设备及介质
技术领域
本发明属于大数据技术领域,具体涉及一种大数据平台中的任务调度方法、装置、设备及介质。
背景技术
随着移动互联网和物联网的爆发,大数据价值在越来越多的场景中被挖掘,来自全世界各个方面的数据量急速膨胀,计算机需要计算处理的大数据任务越来越多。如果大数据平台能够将大数据任务合理的分配给所有可用的工作节点进行处理,那么大数据平台的运行和数据处理效率将会大大提升。任务调度系统是大数据开发平台的核心组件之一,其关注的重点之一包括底层物理资源的分配管理,目标是最大化地利用集群机器的CPU、磁盘、网络等硬件资源。如何将大数据任务合理地分配给工作节点,这是任务调度系统需要解决的问题。如果任务分配不均,或者工作节点异构,这会导致某些区域的工作节点负载过高,造成整个大数据平台的性能下降。
现有的大数据平台的任务调度策略,如Hadoop,其任务调度策略默认为两种:先进先出调度策略和公平共享模式调度策略。先进先出任务调度策略:每一个作业被切分成多个任务,第一个作业优先获取所有可用资源,接下来第二个作业在获取剩余可用资源。公平调度策略主要由公平调度器负责,设计目标是为所有的应用分配公平的资源,通过参数来设置使用公平调度。现有的大数据平台的任务调度策略,再如Spark,Spark任务依然采用Hadoop默认先进先出策略和公平调度策略,但Spark调度策略考虑任务间的依赖。
上述这些方法的优点在于易于实现和应用,但没有考虑到节点异构的情况,也没有考虑节点可用资源的余量,导致作业在节点之间的分配和调度不合理,造成整个大数据平台的性能下降。
发明内容
针对上述背景技术中作业在节点之间的分配和调度不合理,造成整个大数据平台的性能下降的问题,本发明提出了一种大数据平台中的任务调度方法、装置、设备及介质。综合考虑了被调度节点的CPU使用率、内存使用率、网卡发送带宽利用率和网卡接收带宽利用率,既可以降低工作节点对网络带宽的依赖,又能提高节点资源的利用率,从而增强大数据平台的运行效率。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一方面,提供了一种大数据平台中的任务调度方法,包括如下步骤:
获取当前所有可用的工作节点;
对于每一个可用的所述工作节点,计算其资源使用率均值集合;
根据所述资源使用率均值集合确定所述工作节点的节点性能权值;
根据所述资源使用率均值集合计算所述工作节点的节点性能指标平均值;
根据所述资源使用率均值集合及所述节点性能指标平均值计算所述工作节点的节点性能碎片率;
根据所述节点性能碎片率、所述资源使用率均值集合和所述节点性能权值计算所述工作节点的性能分数;
获取当前所有可用的工作节点的性能分数;
将任务调度至性能分数最高的工作节点。
进一步的,所述对于每一个可用的所述工作节点,计算其资源使用率均值集合的步骤中,所述资源使用率均值集合包括CPU使用率均值、内存使用率均值、网卡发送带宽利用率均值和网卡接收带宽利用率均值。
进一步的,所述根据所述资源使用率均值集合确定所述工作节点的节点性能权值的步骤中,依据下式确定所述工作节点的节点性能权值:
Figure 706999DEST_PATH_IMAGE001
其中,W A 为工作节点的节点性能权值,m C 为CPU使用率均值,m M 为内存使用率均值,m T 为网卡发送带宽使用率均值,m R 为网卡接收带宽使用率均值。
进一步的,所述根据所述资源使用率均值集合计算所述工作节点的节点性能指标平均值的步骤中,按照下式计算所述工作节点的节点性能指标平均值:
Figure 852678DEST_PATH_IMAGE002
其中,m为工作节点的节点性能指标平均值。
进一步的,所述根据所述资源使用率均值集合及所述节点性能指标平均值计算所述工作节点的节点性能碎片率的步骤中,按照下式计算所述工作节点的节点性能碎片率:
Figure 179754DEST_PATH_IMAGE003
其中,F为工作节点的节点性能碎片率。
进一步的,根据所述节点性能碎片率、所述资源使用率均值集合和所述节点性能权值计算所述工作节点的性能分数的步骤中,按照下式计算工作节点的性能分数:
Figure 729684DEST_PATH_IMAGE004
其中,S为工作节点的性能分数,E为工作节点与数据节点的位置关系,数据节点为任务依赖数据所在节点,W A 为节点性能权值,W C 为CPU权值,W N 为内存权值,W T 为网络发送带宽权值,W R 为网络接收带宽权值。
进一步的,所述工作节点与数据节点的位置关系
Figure 548736DEST_PATH_IMAGE005
的数值按照以下规则依次进行 判断:
若工作节点与数据节点相同,则所述工作节点与数据节点的位置关系E=4;
若工作节点与数据节点属于同一局域网段,则所述工作节点与数据节点的位置关系E=2;
获取工作节点W所属数据中心的全部局域网段CIDRs,将数据节点W D 的IP地址与全部局域网段CIDRs中的网段依次进行匹配,若数据节点W D 的IP地址属于CIDRs其中的一个网段,则工作节点W与数据节点W D 位于同一数据中心,工作节点W与数据节点W D 的位置关系E=1;
如果上述条件均未满足,则所述工作节点与数据节点的位置关系E=0.3。
本发明的第二方面,提供了一种大数据平台中的任务调度装置,包括:
第一获取模块,用于获取当前所有可用的工作节点;
第一计算模块,用于对于每一个可用的所述工作节点,计算其资源使用率均值集合;
第二计算模块,用于根据所述资源使用率均值集合确定所述工作节点的节点性能权值;
第三计算模块,用于根据所述资源使用率均值集合计算所述工作节点的节点性能指标平均值;
第四计算模块,用于根据所述资源使用率均值集合及所述节点性能指标平均值计算所述工作节点的节点性能碎片率;
第五计算模块,用于根据所述节点性能碎片率、所述资源使用率均值集合和所述节点性能权值计算所述工作节点的性能分数;
第二获取模块,用于获取当前所有可用的工作节点的性能分数;
调度模块,用于将任务调度至性能分数最高的工作节点。
本发明的第三方面,提供了一种电子设备,包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序以实现上述的大数据平台中的任务调度方法。
本发明的第四方面,提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现上述的大数据平台中的任务调度方法。
与现有技术相比较,本发明的有益效果如下:
本发明提供的任务调度方法,先计算了工作节点的资源使用率均值集合及节点性能权值,然后根据资源使用率均值集合及节点性能指标平均值计算节点性能碎片率,最后根据节点性能碎片率、资源使用率均值集合和节点性能权值计算工作节点的性能分数,筛选出评分最高的节点,并将任务调度至该节点上。综合考虑节点的CPU使用率、内存使用率、网卡发送带宽利用率和网卡接收带宽利用率,并考虑这些资源使用率的碎片率和任务的数据亲和性,保证整个大数据平台任务调度的高效运行。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例一种大数据平台中的任务调度方法流程图;
图2为本发明实施例一种大数据平台中的任务调度装置的结构框图;
图3为本发明实施例一种电子设备的结构框图。
具体实施方式
下面将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
以下详细说明均是示例性的说明,旨在对本发明提供进一步的详细说明。除非另有指明,本发明所采用的所有技术术语与本申请所属领域的一般技术人员的通常理解的含义相同。本发明所使用的术语仅是为了描述具体实施方式,而并非意图限制根据本发明的示例性实施方式。
实施例1
如图1所示,本方案提供了一种大数据平台中的任务调度方法,包括如下步骤:
S1、获取当前所有可用的工作节点。
具体的,通过调度器获取所有可用的工作节点,并将所有可用的工作节点存储为节点数组A W
本方案中,定义资源使用率集合U,包含CPU使用率U C 、内存使用率U M 、网卡发送带宽利用率U T 和网卡接收带宽利用率U R ;资源使用率集合U={U C , U M , U T , U R }。
定义资源使用率时间集合元组(t,U),其中t为时间戳,U为资源使用率集合。
定义资源使用率哈希表UMap,其键的数据类型为字符串,表示节点的IP地址,其值的数据类型为资源使用率时间集合元组(t,U),对资源使用率哈希表UMap进行初始化,初始内容为空。
S2、对于节点数组A W 中的每一个工作节点,计算其资源使用率均值集合。
具体的,先对节点数组A W 进行遍历,取工作节点W。然后通过操作系统API获取工作节点W的CPU使用率U C 、内存使用率U M 、网卡协商传输速率Dr。
设网卡发送数据量为Tx,网卡接收数据量为Rx;在当前时刻采集网卡发送数据量Tx 1、网卡接收数据量Rx 1,经过时间间隔△t=1s后采集网卡发送数据量Tx 2,网卡接收数据量Rx 2;则网卡发送带宽利用率
Figure 842314DEST_PATH_IMAGE006
,网卡接收带宽利用率
Figure 289476DEST_PATH_IMAGE007
获取工作节点W操作系统的当前时间戳t以及网卡IP地址ip,令资源使用率数组
Figure 137871DEST_PATH_IMAGE008
,其中,UMap为资源使用率哈希表。
若资源使用率数组A U 为空,则对资源使用率数组A U 进行初始化,初始化容量为16。
若资源使用率数组A U 的容量未满,则将资源使用率时间集合元组(t,U)加入到资 源使用率数组A U 当中,否则对资源使用率数组A U 进行遍历,根据资源使用率数组A U 存储的资 源使用率时间集合元组(t,U)中的时间戳t,来筛选出最早加入资源使用率数组A U 的资源使 用率时间集合元组(t,U),并将资源使用率时间集合元组(t,U)从资源使用率数组A U 中移 除,最后令
Figure 303273DEST_PATH_IMAGE009
;对所有节点数组A W 的遍历进入下一层循环,若节点数组A W 遍历完成,则退出遍历。
S3、根据资源使用率均值集合确定工作节点的节点性能权值。
定义节点分数哈希表SMap,其键的数据类型为字符串,表示节点的IP地址,其值的数据类型为浮点数,表示节点分数。对节点分数哈希表SMap进行初始化,初始内容为空。
对节点数组A W 进行遍历,获取工作节点W的网卡IP地址ip,令资源使用率数组
Figure 134963DEST_PATH_IMAGE010
;其中,UMap为资源使用率哈希表。若资源使用率数组A U 为空,则跳过本次 循环。否则根据资源使用率数组A U 存储的资源使用率时间集合元组(t,U)中的资源使用率 集合U,计算工作节点W的资源使用率均值集合M,资源使用率均值集合M包含CPU使用率均值m C 、内存使用率均值m M 、网卡发送带宽利用率均值m T 和网卡接收带宽利用率均值m R
本方案中,依据下式确定工作节点的节点性能权值:
Figure 843156DEST_PATH_IMAGE001
其中,W A 为工作节点的节点性能权值。
S4、根据资源使用率均值集合计算工作节点的节点性能指标平均值。
具体的,本方案中按照下式计算工作节点的节点性能指标平均值:
Figure 469309DEST_PATH_IMAGE002
其中,m为工作节点的节点性能指标平均值。
S5、根据资源使用率均值集合及节点性能指标平均值计算工作节点的节点性能碎片率。
具体的,本方案中按照下式计算工作节点的节点性能碎片率:
Figure 122007DEST_PATH_IMAGE003
其中,F为工作节点的节点性能碎片率。
S6、根据节点性能碎片率、资源使用率均值集合和节点性能权值计算各个工作节点的性能分数。
具体的,本方案中按照下式计算工作节点的性能分数:
Figure 882022DEST_PATH_IMAGE004
其中,S为工作节点的性能分数,E为工作节点与数据节点的位置关系,数据节点为任务依赖数据所在节点,W A 为节点性能权值,W C 为CPU权值,W N 为内存权值,W T 为网络发送带宽权值,W R 为网络接收带宽权值。
本方案中,取CPU权值W C =1.5、内存权值W N =1.2、网络发送带宽权值W T =0.2、网络接收带宽权值W R =0.8。
本方案中,工作节点与数据节点的位置关系E的数值,按照以下规则依次进行判断:
若工作节点W与数据节点W D 相同,则工作节点W与数据节点W D 的位置关系数值E=4;
若工作节点W与数据节点W D 属于同一局域网段,则工作节点W与数据节点W D 的位置关系数值E=2;
获取工作节点W所属数据中心的全部局域网段CIDRs,将数据节点W D 的IP地址与全部局域网段CIDRs中的网段依次进行匹配,若数据节点W D 的IP地址属于CIDRs其中的一个网段,则工作节点W与数据节点W D 位于同一数据中心;若工作节点W与数据节点W D 位于同一数据中心,则工作节点W与数据节点W D 的位置关系E=1;
如果上述条件均未满足,则工作节点W与数据节点W D 的位置关系E=0.3。
S7、获取当前所有可用的工作节点的性能分数。
S8、将任务调度至性能分数最高的工作节点。
具体的,本方案中令
Figure 303776DEST_PATH_IMAGE011
,其中S为工作节点W的性能分数,SMap为节 点分数哈希表,ip为工作节点W的IP地址。
根据节点分数哈希表SMap存储的工作节点的性能分数S,对节点分数哈希表SMap进行降序排序。对降序排序后的节点分数哈希表SMap进行遍历,取节点分数哈希表SMap的键,即IP地址ip,根据IP地址ip定位到工作节点W。
调度器尝试将任务调度至工作节点W。若经过时间阈值T=5秒的等待后,任务未成功调度至节点W,则进入下一层循环。对节点分数哈希表SMap的遍历结束后,若任务未调度成功,则本次的调度失败。
本方案提供的一种大数据平台中的任务调度方法,综合考虑了被调度节点的CPU使用率、内存使用率、网卡发送带宽利用率和网卡接收带宽利用率,并考虑这些资源使用率的碎片率和任务的数据亲和性。
实施例2
如图2所示,基于与上述实施例的同一发明构思,本方案的第二方面,还提供了一种大数据平台中的任务调度装置,包括:
第一获取模块,用于获取当前所有可用的工作节点。
第一计算模块,用于对于每一个可用的工作节点,计算其资源使用率均值集合。
具体的,由第一计算模块计算所得的资源使用率均值集合包括CPU使用率均值、内存使用率均值、网卡发送带宽利用率均值和网卡接收带宽利用率均值。
第二计算模块,用于根据资源使用率均值集合确定工作节点的节点性能权值;
具体的,第二计算模块中,依据下式确定工作节点的节点性能权值:
Figure 366410DEST_PATH_IMAGE001
其中,W A 为工作节点的节点性能权值,m C 为CPU使用率均值,m M 为内存使用率均值,m T 为网卡发送带宽使用率均值,m R 为网卡接收带宽使用率均值。
第三计算模块,用于根据资源使用率均值集合计算工作节点的节点性能指标平均值;
具体的,第三计算模块中,按照下式计算工作节点的节点性能指标平均值:
Figure 116191DEST_PATH_IMAGE012
其中,m为工作节点的节点性能指标平均值。
第四计算模块,用于根据资源使用率均值集合及节点性能指标平均值计算工作节点的节点性能碎片率;
具体的,第四计算模块中,按照下式计算工作节点的节点性能碎片率:
Figure 820842DEST_PATH_IMAGE003
其中,F为工作节点的节点性能碎片率。
第五计算模块,用于根据节点性能碎片率、资源使用率均值集合和节点性能权值计算工作节点的性能分数;
具体的,第五计算模块中,按照下式计算工作节点的性能分数:
Figure 97102DEST_PATH_IMAGE004
其中,S为工作节点的性能分数,E为工作节点与数据节点的位置关系,数据节点为任务依赖数据所在节点,W A 为节点性能权值,W C 为CPU权值,W N 为内存权值,W T 为网络发送带宽权值,W R 为网络接收带宽权值。
进一步具体的,工作节点与数据节点的位置关系
Figure 455271DEST_PATH_IMAGE005
的数值按照以下规则依次进行 判断:
若工作节点与数据节点相同,则工作节点与数据节点的位置关系E=4;
若工作节点与数据节点属于同一局域网段,则工作节点与数据节点的位置关系E=2;
获取工作节点W所属数据中心的全部局域网段CIDRs,将数据节点W D 的IP地址与全部局域网段CIDRs中的网段依次进行匹配,若数据节点W D 的IP地址属于CIDRs其中的一个网段,则工作节点W与数据节点W D 位于同一数据中心,工作节点W与数据节点W D 的位置关系E=1;
如果上述条件均未满足,则工作节点与数据节点的位置关系E=0.3。
第二获取模块,用于获取当前所有可用的工作节点的性能分数。
调度模块,用于将任务调度至性能分数最高的工作节点。
实施例3
如图3所示,基于与上述实施例的同一发明构思,本方案的第三方面,还提供了一种用于实现上述实施例一种大数据平台中的任务调度方法的电子设备100;电子设备100包括存储器101、至少一个处理器102、存储在存储器101中并可在至少一个处理器102上运行的计算机程序103及至少一条通讯总线104。存储器101可用于存储计算机程序103,处理器102通过运行或执行存储在存储器101内的计算机程序,以及调用存储在存储器101内的数据,实现实施例1一种大数据平台中的任务调度方法步骤。
存储器101可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备100的使用所创建的数据(比如音频数据)等。此外,存储器101可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。
至少一个处理器102可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器102可以是微处理器或者该处理器102也可以是任何常规的处理器等,处理器102是电子设备100的控制中心,利用各种接口和线路连接整个电子设备100的各个部分。
电子设备100中的存储器101存储多个指令以实现一种大数据平台中的任务调度方法,处理器102可执行多个指令从而实现:
获取当前所有可用的工作节点;
对于每一个可用的工作节点,计算其资源使用率均值集合;
根据资源使用率均值集合确定工作节点的节点性能权值;
根据资源使用率均值集合计算工作节点的节点性能指标平均值;
根据资源使用率均值集合及节点性能指标平均值计算工作节点的节点性能碎片率;
根据节点性能碎片率、资源使用率均值集合和节点性能权值计算工作节点的性能分数;
获取当前所有可用的工作节点的性能分数;
将任务调度至性能分数最高的工作节点。
实施例4
电子设备100集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器及只读存储器(ROM,Read-Only Memory)。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (10)

1.一种大数据平台中的任务调度方法,其特征在于,包括如下步骤:
获取当前所有可用的工作节点;
对于每一个可用的所述工作节点,计算其资源使用率均值集合;
根据所述资源使用率均值集合确定所述工作节点的节点性能权值;
根据所述资源使用率均值集合计算所述工作节点的节点性能指标平均值;
根据所述资源使用率均值集合及所述节点性能指标平均值计算所述工作节点的节点性能碎片率;
根据所述节点性能碎片率、所述资源使用率均值集合和所述节点性能权值计算所述工作节点的性能分数;
获取当前所有可用的工作节点的性能分数;
将任务调度至性能分数最高的工作节点。
2.根据权利要求1所述的大数据平台中的任务调度方法,其特征在于,所述对于每一个可用的所述工作节点,计算其资源使用率均值集合的步骤中,所述资源使用率均值集合包括CPU使用率均值、内存使用率均值、网卡发送带宽利用率均值和网卡接收带宽利用率均值。
3.根据权利要求2所述的大数据平台中的任务调度方法,其特征在于,所述根据所述资源使用率均值集合确定所述工作节点的节点性能权值的步骤中,依据下式确定所述工作节点的节点性能权值:
Figure 148736DEST_PATH_IMAGE001
其中,W A 为工作节点的节点性能权值,m C 为CPU使用率均值,m M 为内存使用率均值,m T 为网卡发送带宽使用率均值,m R 为网卡接收带宽使用率均值。
4.根据权利要求3所述的大数据平台中的任务调度方法,其特征在于,所述根据所述资源使用率均值集合计算所述工作节点的节点性能指标平均值的步骤中,按照下式计算所述工作节点的节点性能指标平均值:
Figure 993195DEST_PATH_IMAGE002
其中,m为工作节点的节点性能指标平均值。
5.根据权利要求4所述的大数据平台中的任务调度方法,其特征在于,所述根据所述资源使用率均值集合及所述节点性能指标平均值计算所述工作节点的节点性能碎片率的步骤中,按照下式计算所述工作节点的节点性能碎片率:
Figure 679392DEST_PATH_IMAGE003
其中,F为工作节点的节点性能碎片率。
6.根据权利要求5所述的大数据平台中的任务调度方法,其特征在于,根据所述节点性能碎片率、所述资源使用率均值集合和所述节点性能权值计算所述工作节点的性能分数的步骤中,按照下式计算工作节点的性能分数:
Figure 417540DEST_PATH_IMAGE004
其中,S为工作节点的性能分数,E为工作节点与数据节点的位置关系,数据节点为任务依赖数据所在节点,W A 为节点性能权值,W C 为CPU权值,W N 为内存权值,W T 为网络发送带宽权值,W R 为网络接收带宽权值。
7.根据权利要求6所述的大数据平台中的任务调度方法,其特征在于,所述工作节点与 数据节点的位置关系
Figure 921203DEST_PATH_IMAGE005
的数值按照以下规则依次进行判断:
若工作节点与数据节点相同,则所述工作节点与数据节点的位置关系E=4;
若工作节点与数据节点属于同一局域网段,则所述工作节点与数据节点的位置关系E=2;
获取工作节点W所属数据中心的全部局域网段CIDRs,将数据节点W D 的IP地址与全部局域网段CIDRs中的网段依次进行匹配,若数据节点W D 的IP地址属于CIDRs其中的一个网段,则工作节点W与数据节点W D 位于同一数据中心,工作节点W与数据节点W D 的位置关系E=1;
如果上述条件均未满足,则所述工作节点与数据节点的位置关系E=0.3。
8.一种大数据平台中的任务调度装置,其特征在于,包括:
第一获取模块,用于获取当前所有可用的工作节点;
第一计算模块,用于对于每一个可用的所述工作节点,计算其资源使用率均值集合;
第二计算模块,用于根据所述资源使用率均值集合确定所述工作节点的节点性能权值;
第三计算模块,用于根据所述资源使用率均值集合计算所述工作节点的节点性能指标平均值;
第四计算模块,用于根据所述资源使用率均值集合及所述节点性能指标平均值计算所述工作节点的节点性能碎片率;
第五计算模块,用于根据所述节点性能碎片率、所述资源使用率均值集合和所述节点性能权值计算所述工作节点的性能分数;
第二获取模块,用于获取当前所有可用的工作节点的性能分数;
调度模块,用于将任务调度至性能分数最高的工作节点。
9.一种电子设备,其特征在于,包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1至7中任意一项所述的大数据平台中的任务调度方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现如权利要求1至7中任意一项所述的大数据平台中的任务调度方法。
CN202211712518.9A 2022-12-29 2022-12-29 一种大数据平台中的任务调度方法、装置、设备及介质 Active CN115686799B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211712518.9A CN115686799B (zh) 2022-12-29 2022-12-29 一种大数据平台中的任务调度方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211712518.9A CN115686799B (zh) 2022-12-29 2022-12-29 一种大数据平台中的任务调度方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN115686799A true CN115686799A (zh) 2023-02-03
CN115686799B CN115686799B (zh) 2023-04-07

Family

ID=85056396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211712518.9A Active CN115686799B (zh) 2022-12-29 2022-12-29 一种大数据平台中的任务调度方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN115686799B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170324678A1 (en) * 2016-05-04 2017-11-09 Facebook, Inc. Network bandwidth sharing in a distributed computing system
CN107784030A (zh) * 2016-08-31 2018-03-09 华为技术有限公司 一种处理连接查询的方法及装置
WO2021128737A1 (zh) * 2019-12-25 2021-07-01 上海商汤智能科技有限公司 资源调度方法及装置、电子设备和存储介质
JP2021144719A (ja) * 2014-11-05 2021-09-24 アビニシオ テクノロジー エルエルシー 影響分析
CN114625500A (zh) * 2022-02-23 2022-06-14 南京航空航天大学 云环境下拓扑感知的微服务应用调度的方法及应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021144719A (ja) * 2014-11-05 2021-09-24 アビニシオ テクノロジー エルエルシー 影響分析
US20170324678A1 (en) * 2016-05-04 2017-11-09 Facebook, Inc. Network bandwidth sharing in a distributed computing system
CN107784030A (zh) * 2016-08-31 2018-03-09 华为技术有限公司 一种处理连接查询的方法及装置
WO2021128737A1 (zh) * 2019-12-25 2021-07-01 上海商汤智能科技有限公司 资源调度方法及装置、电子设备和存储介质
CN114625500A (zh) * 2022-02-23 2022-06-14 南京航空航天大学 云环境下拓扑感知的微服务应用调度的方法及应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
冯兴杰;贺阳;: "基于节点性能的Hadoop作业调度算法改进" *
陈红;: "基于Hadoop的分布式SQL数据库索引设计与实践" *

Also Published As

Publication number Publication date
CN115686799B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
US11681547B2 (en) File operation task optimization
WO2018072687A1 (zh) 一种资源调度的方法、装置和过滤式调度器
CN112162865A (zh) 服务器的调度方法、装置和服务器
EP2309388B1 (en) Network distributed system including an allocation control server and one or more clients carrying out parallel task processing by means of multicore processors.
CN103309738B (zh) 用户作业调度方法及装置
CN109564528B (zh) 分布式计算中计算资源分配的系统和方法
WO2023198061A1 (zh) 一种容器调度方法、电子设备和存储介质
CN112817728B (zh) 任务调度方法、网络设备和存储介质
WO2024021489A1 (zh) 一种任务调度方法、装置及Kubernetes调度器
CN106790332B (zh) 一种资源调度方法、系统及主节点
CN107577534A (zh) 一种资源调度方法及装置
CN114371926B (zh) 一种精细化资源分配方法、装置、电子设备及介质
CN109766172A (zh) 一种异步任务调度方法以及装置
CN103503412A (zh) 用于调度资源的方法及装置
CN105488134A (zh) 大数据处理方法及大数据处理装置
CN111190691A (zh) 适用于虚拟机的自动迁移方法、系统、装置及存储介质
CN111666158A (zh) 一种基于Kubernetes的容器调度方法、装置、存储介质及电子设备
CN110048966B (zh) 基于截止时间的最小化系统开销的Coflow调度方法
CN109491775B (zh) 一种用于边缘计算环境下的任务处理与调度方法
WO2020108337A1 (zh) 一种cpu资源调度方法及电子设备
WO2024088078A1 (zh) 一种带宽调节方法、系统、设备及存储介质
CN115686799B (zh) 一种大数据平台中的任务调度方法、装置、设备及介质
CN109788061B (zh) 计算任务部署方法及装置
CN115904671B (zh) 一种边缘计算环境下的任务调度方法、装置、设备及介质
CN116483547A (zh) 资源调度方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant