CN115033363A - 一种计算任务调度方法、系统、计算设备及存储介质 - Google Patents

一种计算任务调度方法、系统、计算设备及存储介质 Download PDF

Info

Publication number
CN115033363A
CN115033363A CN202210635680.9A CN202210635680A CN115033363A CN 115033363 A CN115033363 A CN 115033363A CN 202210635680 A CN202210635680 A CN 202210635680A CN 115033363 A CN115033363 A CN 115033363A
Authority
CN
China
Prior art keywords
computing
task
server
servers
configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210635680.9A
Other languages
English (en)
Inventor
杨光
杜涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China International Financial Ltd By Share Ltd
Original Assignee
China International Financial Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China International Financial Ltd By Share Ltd filed Critical China International Financial Ltd By Share Ltd
Priority to CN202210635680.9A priority Critical patent/CN115033363A/zh
Publication of CN115033363A publication Critical patent/CN115033363A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)

Abstract

本发明公开了一种计算任务调度方法、系统、计算设备及存储介质,该方法适于在调度服务器中执行,调度服务器与多个计算服务器通信连接,每个计算服务器关联有对应的用户组、硬件配置、软件配置和数据配置,该方法包括:判断任务检查队列中是否存在计算任务;若任务检查队列中存在计算任务,则对任务检查队列中每个计算任务,根据计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对多个计算服务器进行匹配,以确定是否可选出匹配计算任务的计算服务器;若确定可选出匹配计算任务的计算服务器,则向选出的计算服务器中负载最小的计算服务器,发送计算任务以实现任务调度。

Description

一种计算任务调度方法、系统、计算设备及存储介质
技术领域
本发明涉及计算机及数据处理技术领域,特别涉及一种计算任务调度方法、系统、计算设备及存储介质。
背景技术
目前,数据处理系统一般可分为两类,分别是批处理系统和流处理系统。但无论是批处理系统,还是流处理系统,多采用通用运行时设计,在多用户使用场景下,当计算任务涉及到定制化的软硬件运行环境要求时,常常会遇到因对计算节点的同质性要求、计算集群采用通用架构等带来的各种问题。
由于对计算节点的同质性要求,无法在同一个计算集群中做到多用户的资源物理隔离,除非搭建多个计算集群,而如果搭建多个计算集群,则又缺乏统一的任务管理调度和监控视图。不仅如此,在上述同质性要求下,在同一个计算集群中难以实现将依赖不同硬件的计算任务分发至不同硬件的计算节点,如将使用GPU(Graphics Processing Unit,图形处理器)计算的计算任务分发至具备GPU的计算节点,而将只使用CPU(Central ProcessingUnit,中央处理器)计算的计算任务分发至仅具备CPU的计算节点。
在计算集群采用通用架构时,每次运算都需要将计算任务依赖的软件分发至对应的计算节点,导致大量网络I/O(Input/Output,输入/输出)操作和磁盘I/O操作,延长了完成整个计算任务的时间。而且,计算任务所需数据并不存在于计算节点,每次运算还要在每个计算节点加载所需数据,多次重复网络I/O操作和磁盘I/O操作,使得计算任务的完成时间增加。此外,缺乏定时调度机制也会对计算任务执行的灵活性和运行效率产生一定影响。
因此,需要一种计算任务调度方法,以期解决上述问题。
发明内容
为此,本发明提供一种计算任务调度方案,以力图解决或者至少缓解上面存在的问题。
根据本发明的一个方面,提供一种计算任务调度方法,适于在调度服务器中执行,调度服务器与多个计算服务器通信连接,每个计算服务器关联有对应的用户组、硬件配置、软件配置和数据配置,该方法包括如下步骤:首先,判断任务检查队列中是否存在计算任务;若任务检查队列中存在计算任务,则对任务检查队列中每个计算任务,根据计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对多个计算服务器进行匹配,以确定是否可选出匹配计算任务的计算服务器;若确定可选出匹配计算任务的计算服务器,则向选出的计算服务器中负载最小的计算服务器,发送计算任务以实现任务调度。
可选地,在根据本发明的计算任务调度方法中,根据计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对多个计算服务器进行匹配,以确定是否可选出匹配计算任务的计算服务器的步骤,包括:根据计算任务所属用户组,对多个计算服务器进行匹配,以确定是否存在计算任务所属用户组关联的计算服务器;若确定存在计算任务所属用户组关联的计算服务器,则基于计算任务所属用户组关联的计算服务器生成第一计算服务器集合,并根据计算任务所属硬件配置,对多个计算服务器进行匹配,以确定是否存在计算任务所属硬件配置关联的计算服务器。
可选地,在根据本发明的计算任务调度方法中,根据计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对多个计算服务器进行匹配,以确定是否可选出匹配计算任务的计算服务器的步骤,包括:若确定存在计算任务所属硬件配置关联的计算服务器,则基于计算任务所属硬件配置关联的计算服务器生成第二计算服务器集合,并根据计算任务所属软件配置,对多个计算服务器进行匹配,以确定是否存在计算任务所属软件配置关联的计算服务器。
可选地,在根据本发明的计算任务调度方法中,根据计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对多个计算服务器进行匹配,以确定是否可选出匹配计算任务的计算服务器的步骤,包括:若确定存在计算任务所属软件配置关联的计算服务器,则基于计算任务所属软件配置关联的计算服务器生成第三计算服务器集合,并根据计算任务所属数据配置,对多个计算服务器进行匹配,以确定是否存在计算任务所属数据配置关联的计算服务器。
可选地,在根据本发明的计算任务调度方法中,根据计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对多个计算服务器进行匹配,以确定是否可选出匹配计算任务的计算服务器的步骤,包括:若确定存在计算任务所属数据配置关联的计算服务器,则基于计算任务所属数据配置关联的计算服务器生成第四计算服务器集合,并计算第一计算服务器集合、第二计算服务器集合、第三计算服务器集合和第四计算服务器集合的交集;若交集不为空,则确定可选出匹配计算任务的计算服务器,并将交集中的计算服务器作为匹配计算任务的计算服务器。
可选地,在根据本发明的计算任务调度方法中,还包括:若确定不可选出匹配计算任务的计算服务器,则向发起计算任务的客户端设备发送匹配失败通知。
可选地,在根据本发明的计算任务调度方法中,调度服务器与多个客户端设备通信连接,方法还包括:接收多个客户端设备中任一客户端设备发送的任务指令;若任务指令的指令类型为发起计算任务指令,则将任务指令关联的计算任务发送至任务检查队列。
可选地,在根据本发明的计算任务调度方法中,还包括:若任务指令的指令类型为中断计算任务指令,则检查任务指令关联的计算任务是否在任务检查队列中;若任务指令关联的计算任务在任务检查队列中,则将任务指令关联的计算任务从任务检查队列移除;若任务指令关联的计算任务不在任务检查队列中,则向发送任务指令的客户端设备返回任务错误信息。
可选地,在根据本发明的计算任务调度方法中,还包括:若任务指令的指令类型为定期执行设置指令,则将任务指令关联的计算任务设置为定期执行任务。
可选地,在根据本发明的计算任务调度方法中,还包括:定时检查是否有计划启动时间小于当前时间但尚未执行的定期执行任务;若有,则将计划启动时间小于当前时间但尚未执行的定期执行任务,发送至任务检查队列。
可选地,在根据本发明的计算任务调度方法中,还包括预先建立调度服务器与多个计算服务器之间的通信连接,预先建立调度服务器与多个计算服务器之间的通信连接的步骤,包括:读取配置文件,配置文件包括多个计算服务器地址和端口;根据多个计算服务器地址和端口,分别与对应的计算服务器建立通信连接。
可选地,在根据本发明的计算任务调度方法中,还包括:检查调度服务器是否已连接上配置文件相关的全部计算服务器;若是,则切换至任务指令接收状态;若不是,则对未连接上的计算服务器重新建立通信连接。
可选地,在根据本发明的计算任务调度方法中,还包括:对多个计算服务器中的每个计算服务器,向计算服务器发送对应的数据加载配置文件,以指示计算服务器根据接收到的数据加载配置文件加载所需的数据文件至本地,并向调度服务器反馈数据加载结果。
可选地,在根据本发明的计算任务调度方法中,还包括:接收多个计算服务器中每个计算服务器定期发送的服务器状态和任务状态,并将服务器状态和任务状态反馈至对应的客户端设备。
根据本发明的又一个方面,提供一种计算任务调度系统,包括:调度服务器,所述调度服务器用于执行如上所述的计算任务调度方法对计算任务进行调度;以及与所述调度服务器通信连接的多个计算服务器。
根据本发明的又一个方面,提供了一种计算设备,包括:至少一个处理器;以及存储器,存储有程序指令,其中,程序指令被配置为适于由至少一个处理器执行,程序指令包括用于执行如上所述的计算任务调度方法的指令。
根据本发明的又一个方面,提供了一种存储有程序指令的可读存储介质,当程序指令被计算设备读取并执行时,使得计算设备执行如上所述的计算任务调度方法。
根据本发明的计算任务调度方案,先判断任务检查队列中是否存在计算任务,当存在时,对任务检查队列中每个计算任务,根据计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对与调度服务器通信连接的多个计算服务器进行匹配,若确定可选出匹配计算任务的计算服务器,则向选出的计算服务器中负载最小的计算服务器发送计算任务,实现了以多级分发机制对计算任务进行自动匹配,提供了统一任务管理调度视图。此外,通过定时执行计算任务检查以处理定期执行任务,对计算服务器进行组织调度,实现计算任务的定时调度功能。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明的一个实施例的计算任务调度系统100的示意图;
图2示出了根据本发明的一个实施例的计算设备200的结构框图;以及
图3示出了根据本发明的一个实施例的计算任务调度方法300的流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明的一个实施例的计算任务调度系统100的示意图。应当指出,图1的计算任务调度系统100仅是示例性的,在具体实现中,根据实际情况,计算任务调度系统100中可以有不同数量的调度服务器和计算服务器,本发明对此并不进行限定。
如图1所示,计算任务调度系统100包括计算服务器111、计算服务器112和调度服务器120,调度服务器120分别与计算服务器111、计算服务器112通信连接。此外,调度服务器120还分别与客户端设备131、客户端设备132通信连接,客户端设备131和客户端设备132上均安装有需要通过计算任务调度系统100处理计算任务的客户端(图1未示出)。
应注意的是,图1所示的客户端设备131、客户端设备132虽然是计算设备的图例,但这并不限制其设备类型,客户端设备131、客户端设备132既可以是计算设备(如个人计算机等),也可以是移动终端(如智能手机等),同样也不限制客户端设备的数量。
以客户端设备131为例,用户可通过客户端设备131上安装的客户端(如浏览器)向调度服务器120发送任务指令,调度服务器120接收到任务指令后,先判断任务指令的指令类型,若任务指令的指令类型为发起计算任务指令,则调度服务器120将该任务指令关联的计算任务发送至任务检查队列。
上述内容描述了任务检查队列中计算任务的来源,以下给出计算任务调度的一个简单示例。调度服务器120判断任务检查队列中是否存在计算任务,若任务检查队列中存在计算任务,则对任务检查队列中每个计算任务,调度服务器120根据计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对计算服务器111、计算服务器112进行匹配,以确定是否可选出匹配计算任务的计算服务器。
假设计算服务器111、计算服务器112均可匹配该计算任务,则调度服务器120向选出的计算服务器中负载最小的计算服务器,发送计算任务以实现任务调度。根据可用计算服务器的工作情况,确定负载最小的计算服务器为计算服务器111,则将该计算任务发送至计算服务器111,以指示计算服务器111执行该计算任务,从而完成了任务调度。
需要说明的是,本发明中的计算服务器,如图1所示的计算服务器111、计算服务器112,可理解为是计算节点,这些计算节点与调度服务器120所构成的计算任务调度系统100,实际上是一个具有统一任务管理调度视图的计算集群。通过对用户、计算资源、计算任务进行提前定义,这一计算集群中的每个计算服务器关联有对应的用户组、硬件配置、软件配置和数据配置。
具体来说,每个计算服务器都有其隶属的用户组,属于不同用户组的计算服务器之间物理隔离,并具备特定的硬件配置标签、软件配置标签、数据配置标签,以便每个计算任务都会被分发到属于其发起用户所在用户组、与其依赖硬件环境相同、与其依赖软件环境相同、加载了其所依赖数据文件的计算服务器上进行计算。上述硬件配置通常是指的机器所具备的硬件特征,且不同的计算服务器具有不同的硬件特征,如计算服务器111可以是仅配置了CPU的机器,而计算服务器112可以是同时配置了CPU与GPU的机器。
图2示出了根据本发明的一个实施例的计算设备200的结构框图。
如图2所示,在基本的配置202中,计算设备200典型地包括系统存储器206和一个或者多个处理器204。存储器总线208可以用于在处理器204和系统存储器206之间的通信。
取决于期望的配置,处理器204可以是任何类型的处理,包括但不限于:微处理器(UP)、微控制器(UC)、数字信息处理器(DSP)或者它们的任何组合。处理器204可以包括诸如一级高速缓存210和二级高速缓存212之类的一个或者多个级别的高速缓存、处理器核心214和寄存器216。示例的处理器核心214可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器218可以与处理器204一起使用,或者在一些实现中,存储器控制器218可以是处理器204的一个内部部分。
取决于期望的配置,系统存储器206可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器206可以包括操作系统220、一个或者多个应用222以及程序数据224。在一些实施方式中,应用222可以布置为在操作系统上由一个或多个处理器204利用程序数据224执行指令。
计算设备200还包括储存设备232,储存设备232包括可移除储存器236和不可移除储存器238。
计算设备200还可以包括储存接口总线234。储存接口总线234实现了从储存设备232(例如,可移除储存器236和不可移除储存器238)经由总线/接口控制器230到基本配置202的通信。操作系统220、应用222以及程序数据224的至少一部分可以存储在可移除储存器236和/或不可移除储存器238上,并且在计算设备200上电或者要执行应用222时,经由储存接口总线234而加载到系统存储器206中,并由一个或者多个处理器204来执行。
计算设备200还可以包括有助于从各种接口设备(例如,输出设备242、外设接口244和通信设备246)到基本配置202经由总线/接口控制器230的通信的接口总线240。示例的输出设备242包括图形处理单元248和音频处理单元250。它们可以被配置为有助于经由一个或者多个A/V端口252与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口244可以包括串行接口控制器254和并行接口控制器256,它们可以被配置为有助于经由一个或者多个I/O端口258和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备246可以包括网络控制器260,其可以被布置为便于经由一个或者多个通信端口264与一个或者多个其他计算设备262通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以是这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中以编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备200可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。当然,计算设备200也可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、数码照相机、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。甚至可以被实现为服务器,如文件服务器、数据库服务器、应用程序服务器和WEB服务器等。本发明的实施例对此均不做限制。
在根据本发明的实施例中,计算设备200可实现为图1所示的调度服务器120,并被配置为执行根据本发明的计算任务调度方法300。其中,布置在操作系统上的应用222中包含用于执行本发明的计算任务调度方法300的多条程序指令,这些程序指令可以指示处理器204执行本发明的计算任务调度方法300,以便计算设备200通过执行本发明的计算任务调度方法300来调度计算任务。
图3示出了根据本发明的一个实施例的计算任务调度方法300的流程图。计算任务调度方法300可以在计算设备(例如前述计算设备200)中执行。在该实施方式中,计算设备实现为调度服务器,调度服务器与多个计算服务器通信连接,每个计算服务器关联有对应的用户组、硬件配置、软件配置和数据配置。
如图3所示,方法300始于步骤S310。在步骤S310中,判断任务检查队列中是否存在计算任务。根据本发明的一个实施例,调度服务器在执行步骤S310之前,需要完成初始化启动,以便连接多个计算服务器,即方法300还包括预先建立调度服务器与多个计算服务器之间的通信连接。
在该实施方式中,先读取配置文件,配置文件包括多个计算服务器地址和端口,再根据多个计算服务器地址和端口,分别与对应的计算服务器建立通信连接。对计算服务器而言,其与调度服务器之间可通过Socket(套接字)通讯方式建立连接。
当然,配置文件还包括HTTP(Hyper Text Transfer Protocol,超文本传输协议)监听端口、用户组、硬件配置组、软件配置组和数据配置组。在建立与多个计算服务器之间的通信连接时,调度服务器还可根据配置文件中的HTTP监听端口,在相应端口开启HTTP服务,以供客户端访问。换言之,通过HTTP以网页形式向用户提供交互渠道,以便用户使用客户端设备上的客户端(即浏览器),指示调度服务器进行计算任务编写、计算任务发起、计算任务取消、计算任务定期执行设置、计算任务执行监控。
根据本发明的一个实施例,方法300还包括:检查调度服务器是否已连接上配置文件相关的全部计算服务器,若是,则切换至任务指令接收状态,若不是,则对未连接上的计算服务器重新建立通信连接。
在这一阶段中,各计算服务器通常也是先进行自身的初始化,再检查是否与调度服务器建立有通信连接,若尚未与调度服务器建立通信连接,则继续等待来自调度服务器的连接,若与调度服务器已建立有通信连接,则等待调度服务器发送数据加载配置文件。
根据本发明的一个实施例,方法300还包括:对多个计算服务器中的每个计算服务器,向计算服务器发送对应的数据加载配置文件,以指示计算服务器根据接收到的数据加载配置文件加载所需的数据文件至本地,并向调度服务器反馈数据加载结果。
此时,对一个计算服务器而言,其与调度服务器之间的通信连接已建立完成,那么,该计算服务器可接收到调度服务器发送的数据加载配置文件,并根据该数据加载配置文件加载所需的数据文件至本地。不管加载成功或是失败,计算服务器均会向调度服务器反馈数据加载结果,如果加载失败,则计算服务器反馈的数据加载结果为数据加载失败,如果加载成功,则计算服务器反馈的数据加载结果为数据加载成功。
在该实施方式中,如果加载成功,计算服务器还会定期向调度服务器发送服务器状态和任务状态,以便调度服务器将接收到的服务器状态和任务状态推送给客户端设备。
根据本发明的一个实施例,方法300还包括:接收多个计算服务器中每个计算服务器定期发送的服务器状态和任务状态,并将服务器状态和任务状态反馈至对应的客户端设备,以便用户通过客户端设备上安装的客户端进行查看。
在调度服务器与多个计算服务器之间的连接全部建立好后,调度服务器已做好准备来接收用户通过客户端设备上安装的客户端发送的任务指令并执行。根据本发明的一个实施例,调度服务器与多个客户端设备通信连接,方法300还包括:接收多个客户端设备中任一客户端设备发送的任务指令,根据任务指令的指令类型,对任务指令关联的计算任务执行相应的操作。
在该实施方式中,若任务指令的指令类型为发起计算任务指令,则将任务指令关联的计算任务发送至任务检查队列。若任务指令的指令类型为中断计算任务指令,则检查任务指令关联的计算任务是否在任务检查队列中,若任务指令关联的计算任务在任务检查队列中,则将任务指令关联的计算任务从任务检查队列移除,若任务指令关联的计算任务不在任务检查队列中,则向发送任务指令的客户端设备返回任务错误信息。
若任务指令的指令类型为定期执行设置指令,则将任务指令关联的计算任务设置为定期执行任务。根据本发明的一个实施例,方法300还包括:定时检查是否有计划启动时间小于当前时间但尚未执行的定期执行任务,若有,则将计划启动时间小于当前时间但尚未执行的定期执行任务,发送至任务检查队列。
根据本发明的一个实施例,若任务检查队列中存在计算任务,则执行步骤S320,若任务检查队列中不存在计算任务,则再次执行步骤S310,重新判断任务检查队列中是否存在计算任务。
在步骤S320中,若任务检查队列中存在计算任务,则对任务检查队列中每个计算任务,根据计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对多个计算服务器进行匹配,以确定是否可选出匹配计算任务的计算服务器。
根据本发明的一个实施例,可通过如下方式根据计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对多个计算服务器进行匹配,以确定是否可选出匹配计算任务的计算服务器。
首先,根据计算任务所属用户组,对多个计算服务器进行匹配,以确定是否存在计算任务所属用户组关联的计算服务器,若确定存在计算任务所属用户组关联的计算服务器,则基于计算任务所属用户组关联的计算服务器生成第一计算服务器集合,并根据计算任务所属硬件配置,对多个计算服务器进行匹配,以确定是否存在计算任务所属硬件配置关联的计算服务器。
反之,若确定不存在计算任务所属用户组关联的计算服务器,说明确定不可选出匹配计算任务的计算服务器,若确定不可选出匹配计算任务的计算服务器,则向发起计算任务的客户端设备发送匹配失败通知。其中,匹配失败通知用于告知用户找不到可匹配的计算服务器来运行计算任务。
而后,若确定存在计算任务所属硬件配置关联的计算服务器,则基于计算任务所属硬件配置关联的计算服务器生成第二计算服务器集合,并根据计算任务所属软件配置,对多个计算服务器进行匹配,以确定是否存在计算任务所属软件配置关联的计算服务器。
若确定不存在计算任务所属硬件配置关联的计算服务器,说明确定不可选出匹配计算任务的计算服务器,若确定不可选出匹配计算任务的计算服务器,则向发起计算任务的客户端设备发送匹配失败通知。
接下来,若确定存在计算任务所属软件配置关联的计算服务器,则基于计算任务所属软件配置关联的计算服务器生成第三计算服务器集合,并根据计算任务所属数据配置,对多个计算服务器进行匹配,以确定是否存在计算任务所属数据配置关联的计算服务器。
若确定不存在计算任务所属软件配置关联的计算服务器,说明确定不可选出匹配计算任务的计算服务器,若确定不可选出匹配计算任务的计算服务器,则向发起计算任务的客户端设备发送匹配失败通知。
最终,若确定存在计算任务所属数据配置关联的计算服务器,则基于计算任务所属数据配置关联的计算服务器生成第四计算服务器集合,并计算第一计算服务器集合、第二计算服务器集合、第三计算服务器集合和第四计算服务器集合的交集。
若交集不为空,则确定可选出匹配计算任务的计算服务器,并将交集中的计算服务器作为匹配计算任务的计算服务器,若交集为空,则确定不可选出匹配计算任务的计算服务器,向发起计算任务的客户端设备发送匹配失败通知。
若确定不存在计算任务所属数据配置关联的计算服务器,说明确定不可选出匹配计算任务的计算服务器,若确定不可选出匹配计算任务的计算服务器,则向发起计算任务的客户端设备发送匹配失败通知。
在该实施方式中,假设得到的第一计算服务器集合包括计算服务器A1、A2、A3和A5,第二计算服务器集合包括计算服务器A1、A3、A4、A5、A7和A8,第三计算服务器集合包括A1、A3、A4、A5、A6和A7,第四计算服务器集合包括A1、A2、A3、A5、A8和A9。对上述4个计算服务器集合取交集,可得交集中有计算服务器A1、A3和A5,作为匹配计算任务的计算服务器。
最后,进入步骤S330,若确定可选出匹配计算任务的计算服务器,则向选出的计算服务器中负载最小的计算服务器,发送计算任务以实现任务调度。根据本发明的一个实施例,选出的计算服务器包括计算服务器A1、A3和A5,根据这3个计算服务器的工作情况,从中选择负载最小的计算服务器A5,向其发送计算任务,以指示计算服务器A5来运行该计算任务,从而实现了任务调度。
在上述阶段中,各计算服务器会检查自身是否接收到调度服务器发送的计算任务,若未接收到,则继续等待调度服务器发送的计算任务,若已接收到,则运行接收到的计算任务。
例如,当计算服务器A5接收到调度服务器发送的计算任务时,计算服务器A5开始运行该计算任务,服务器状态也从等待调度服务器发送计算任务的状态,转变为运行计算任务的状态,而该计算任务的任务状态也将由待运行变成运行中,并被上报至调度服务器。
根据本发明实施例的计算任务调度方案,先判断任务检查队列中是否存在计算任务,当存在时,对任务检查队列中每个计算任务,根据计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对与调度服务器通信连接的多个计算服务器进行匹配,若确定可选出匹配计算任务的计算服务器,则向选出的计算服务器中负载最小的计算服务器发送计算任务,实现了以多级分发机制对计算任务进行自动匹配,提供了统一任务管理调度视图。此外,通过定时执行计算任务检查以处理定期执行任务,对计算服务器进行组织调度,实现计算任务的定时调度功能。
在上述技术方案中,计算任务调度系统在硬件层面支持异构计算集群,可统一调度和监控,在用户层面支持计算服务器分组,物理隔离,安全可控,在软件层面支持定制化运行,提前配置,方便灵活,在数据层面支持差异化数据环境,预先加载,快速调用,在计算服务器层面支持负载均衡,按需调度,经济快捷。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、U盘、软盘、CD-ROM或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的计算任务调度方法。
A8如A7所述的方法,还包括:
若所述任务指令的指令类型为中断计算任务指令,则检查所述任务指令关联的计算任务是否在所述任务检查队列中;
若所述任务指令关联的计算任务在所述任务检查队列中,则将所述任务指令关联的计算任务从所述任务检查队列移除;
若所述任务指令关联的计算任务不在所述任务检查队列中,则向发送所述任务指令的客户端设备返回任务错误信息。
A9如A7或A8所述的方法,还包括:
若所述任务指令的指令类型为定期执行设置指令,则将所述任务指令关联的计算任务设置为定期执行任务。
A10如A1-A9中任一项所述的方法,还包括:
定时检查是否有计划启动时间小于当前时间但尚未执行的定期执行任务;
若有,则将所述计划启动时间小于当前时间但尚未执行的定期执行任务,发送至所述任务检查队列。
A11如A1-10中任一项所述的方法,还包括预先建立所述调度服务器与所述多个计算服务器之间的通信连接,所述预先建立所述调度服务器与所述多个计算服务器之间的通信连接的步骤,包括:
读取配置文件,所述配置文件包括多个计算服务器地址和端口;
根据所述多个计算服务器地址和端口,分别与对应的计算服务器建立通信连接。
A12如A11所述的方法,还包括:
检查所述调度服务器是否已连接上所述配置文件相关的全部计算服务器;
若是,则切换至任务指令接收状态;
若不是,则对未连接上的计算服务器重新建立通信连接。
A13如A11或A12所述的方法,还包括:
对所述多个计算服务器中的每个计算服务器,向所述计算服务器发送对应的数据加载配置文件,以指示所述计算服务器根据接收到的数据加载配置文件加载所需的数据文件至本地,并向所述调度服务器反馈数据加载结果。
A14如A13所述的方法,还包括:
接收所述多个计算服务器中每个计算服务器定期发送的服务器状态和任务状态,并将所述服务器状态和所述任务状态反馈至对应的客户端设备。
以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。
在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (10)

1.一种计算任务调度方法,适于在调度服务器中执行,所述调度服务器与多个计算服务器通信连接,每个计算服务器关联有对应的用户组、硬件配置、软件配置和数据配置,所述方法包括:
判断任务检查队列中是否存在计算任务;
若所述任务检查队列中存在计算任务,则对所述任务检查队列中每个计算任务,根据所述计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对所述多个计算服务器进行匹配,以确定是否可选出匹配所述计算任务的计算服务器;
若确定可选出匹配所述计算任务的计算服务器,则向选出的计算服务器中负载最小的计算服务器,发送所述计算任务以实现任务调度。
2.如权利要求1所述的方法,其中,所述根据所述计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对所述多个计算服务器进行匹配,以确定是否可选出匹配所述计算任务的计算服务器的步骤,包括:
根据所述计算任务所属用户组,对所述多个计算服务器进行匹配,以确定是否存在所述计算任务所属用户组关联的计算服务器;
若确定存在所述计算任务所属用户组关联的计算服务器,则基于所述计算任务所属用户组关联的计算服务器生成第一计算服务器集合,并根据所述计算任务所属硬件配置,对所述多个计算服务器进行匹配,以确定是否存在所述计算任务所属硬件配置关联的计算服务器。
3.如权利要求2所述的方法,其中,所述根据所述计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对所述多个计算服务器进行匹配,以确定是否可选出匹配所述计算任务的计算服务器的步骤,包括:
若确定存在所述计算任务所属硬件配置关联的计算服务器,则基于所述计算任务所属硬件配置关联的计算服务器生成第二计算服务器集合,并根据所述计算任务所属软件配置,对所述多个计算服务器进行匹配,以确定是否存在所述计算任务所属软件配置关联的计算服务器。
4.如权利要求3所述的方法,其中,所述根据所述计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对所述多个计算服务器进行匹配,以确定是否可选出匹配所述计算任务的计算服务器的步骤,包括:
若确定存在所述计算任务所属软件配置关联的计算服务器,则基于所述计算任务所属软件配置关联的计算服务器生成第三计算服务器集合,并根据所述计算任务所属数据配置,对所述多个计算服务器进行匹配,以确定是否存在所述计算任务所属数据配置关联的计算服务器。
5.如权利要求4所述的方法,其中,所述根据所述计算任务所属用户组、硬件配置、软件配置和数据配置中至少之一,对所述多个计算服务器进行匹配,以确定是否可选出匹配所述计算任务的计算服务器的步骤,包括:
若确定存在所述计算任务所属数据配置关联的计算服务器,则基于所述计算任务所属数据配置关联的计算服务器生成第四计算服务器集合,并计算所述第一计算服务器集合、所述第二计算服务器集合、所述第三计算服务器集合和所述第四计算服务器集合的交集;
若所述交集不为空,则确定可选出匹配所述计算任务的计算服务器,并将所述交集中的计算服务器作为匹配所述计算任务的计算服务器。
6.如权利要求1-5中任一项所述的方法,还包括:
若确定不可选出匹配所述计算任务的计算服务器,则向发起所述计算任务的客户端设备发送匹配失败通知。
7.如权利要求1-6中任一项所述的方法,其中,所述调度服务器与多个客户端设备通信连接,所述方法还包括:
接收多个客户端设备中任一客户端设备发送的任务指令;
若所述任务指令的指令类型为发起计算任务指令,则将所述任务指令关联的计算任务发送至所述任务检查队列。
8.一种计算任务调度系统,包括:
调度服务器,所述调度服务器用于执行如权利要求1-7中任一项所述的方法对计算任务进行调度;以及
与所述调度服务器通信连接的多个计算服务器。
9.一种计算设备,包括:
至少一个处理器;以及
存储器,存储有程序指令,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-7中任一项所述的方法的指令。
10.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-7中任一项所述方法。
CN202210635680.9A 2022-06-06 2022-06-06 一种计算任务调度方法、系统、计算设备及存储介质 Pending CN115033363A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210635680.9A CN115033363A (zh) 2022-06-06 2022-06-06 一种计算任务调度方法、系统、计算设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210635680.9A CN115033363A (zh) 2022-06-06 2022-06-06 一种计算任务调度方法、系统、计算设备及存储介质

Publications (1)

Publication Number Publication Date
CN115033363A true CN115033363A (zh) 2022-09-09

Family

ID=83123810

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210635680.9A Pending CN115033363A (zh) 2022-06-06 2022-06-06 一种计算任务调度方法、系统、计算设备及存储介质

Country Status (1)

Country Link
CN (1) CN115033363A (zh)

Similar Documents

Publication Publication Date Title
US7783811B2 (en) Efficient interrupt message definition
CN111343288B (zh) 作业调度方法、系统及计算设备
CN110806928A (zh) 一种作业提交方法及系统
CN112559143A (zh) 任务调度方法、系统及计算设备
CN110795343A (zh) 测试系统、测试方法和计算设备
CN112764694A (zh) 一种打印系统、打印方法及计算设备
CN114579285A (zh) 一种任务运行系统、方法及计算设备
CN113721990A (zh) 数据处理方法、数据处理设备、加速卡和存储介质
CN115033363A (zh) 一种计算任务调度方法、系统、计算设备及存储介质
CN115658471A (zh) 一种测试任务调度方法、测试任务执行方法及测试系统
CN113300895A (zh) 一种线索处理方法、系统及计算设备
CN113961086B (zh) 一种快捷键实现方法、计算设备及存储介质
CN111432357B (zh) 信息处理方法、系统及计算设备
CN114510331A (zh) 一种线程数量调整方法、装置及计算设备
CN114721672A (zh) 一种应用安装方法、计算设备及存储介质
CN114327673A (zh) 一种任务启动方法、装置、电子设备及存储介质
CN110647383A (zh) 一种基于docker容器的应用管理方法及计算设备
CN113485769B (zh) 一种应用程序运行方法、计算设备及存储介质
CN110134502A (zh) 任务处理方法、装置、系统、计算机设备和存储介质
CN111917620B (zh) Mcu业务处理方法、装置、电子设备及可存储介质
CN112800318B (zh) 一种邮件搜索方法及计算设备
CN113746754B (zh) 一种数据传输方法、装置、设备及存储介质
CN113076113B (zh) 安装操作系统的方法、主机和系统
CN114244794B (zh) 一种定时任务推送方法、计算设备及可读存储介质
CN114020584B (zh) 一种作业分流方法、装置及计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination