CN110362410A - 基于离线应用的资源控制方法、系统、设备及存储介质 - Google Patents

基于离线应用的资源控制方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN110362410A
CN110362410A CN201910670592.0A CN201910670592A CN110362410A CN 110362410 A CN110362410 A CN 110362410A CN 201910670592 A CN201910670592 A CN 201910670592A CN 110362410 A CN110362410 A CN 110362410A
Authority
CN
China
Prior art keywords
task
calculating task
computing cluster
calculate node
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910670592.0A
Other languages
English (en)
Inventor
申波
董延锋
韩文欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Manyun Software Technology Co Ltd
Original Assignee
Jiangsu Manyun Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Manyun Software Technology Co Ltd filed Critical Jiangsu Manyun Software Technology Co Ltd
Priority to CN201910670592.0A priority Critical patent/CN110362410A/zh
Publication of CN110362410A publication Critical patent/CN110362410A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了基于离线应用的资源控制方法、系统、设备及存储介质,该方法:接收计算任务,将计算任务导入到计算集群的数据库,将数据库中的未完成任务队列中的计算任务分别分配到计算集群中的空闲的计算节点;当计算集群运行于高负荷状态时,根据第一预设轮询间隔,轮询计算集群中正在运行的计算任务,获得每个正在运行的计算任务对计算集群的资源使用率和运行该计算任务的计算节点的编号;将每个计算任务的资源使用率排序,并释放资源使用率最大的至少一个计算任务对应的计算节点;将计算节点被释放的计算任务加入到未完成任务队列,本发明能够保持长时间健康稳定运行脱离不了系统的强抗压性,低故障率,并且能快速完成迭代升级。

Description

基于离线应用的资源控制方法、系统、设备及存储介质
技术领域
本发明涉及汽车安全领域,具体地说,涉及基于离线应用的资源控制方法、系统、设备及存储介质。
背景技术
目前,跟踪系统主要目的是为“统一查询平台系统”赋能,查询平台中所展示的离线应用消耗系统资源信息来源于此技术的应用,比如:impala、spark、hive等任务执行中消耗的内存、CPU内核电压、磁盘容量、执行时长等信息。
在实际工作中,往往有不合理的任务占据集群主要资源,影响到队列中其它任务的执行,如何合理分配资源执行任务呢?众所周知,大数据领域实时/离线任务对机器的内存、CPU、硬盘容量等硬件设备有着严苛要求,机器成本也相对昂贵,若刨去升级硬件或扩增集群容量不谈,如何既能节约成本又能稳健运行任务呢?那么此技术诞生了,通过该技术能够实时了解集群中任务对机器设备的资源消耗情况,出现性能瓶颈随时释放大任务释放资源,根据性能数据指标提前规划/扩(缩)容集群,如此就能防范于未然了。
随着大数据开放平台等上游业务产品的用户和提交任务数日益增加,用户的技术层次不同影响到提交SQL(结构化查询语言,Structured Query Language,简称SQL)任务的质量也不尽相同,导致低效率SQL占据集群多数资源,如此一来,很容易造成数据任务瘫痪,影响面甚广;通过上游产品无法实时查看低质量SQL在执行过程中对集群资源的消耗情况,有时用户权限不足也无法执行释放任务此类操作。
现有技术存在以下缺点:
开源工具比较通用化,无法提供个性化需求;
没有权限管控对外接口,无法接入公司内部SSO和HR系统;
没有执行施放任务等操作;
资源消耗跟踪的时间粒度过于粗放。
因此,本发明提供了一种基于离线应用的资源控制方法、系统、设备及存储介质。
发明内容
针对现有技术中的问题,本发明的目的在于提供基于离线应用的资源控制方法、系统、设备及存储介质,能够保持长时间健康稳定运行脱离不了系统的强抗压性,低故障率;保证跟踪系统简单实用,低耦合,高内聚,并且能快速完成迭代升级。
本发明的实施例提供一种基于离线应用的资源控制方法,包括以下步骤:
S101、接收计算任务;
S102、将所述计算任务导入到计算集群的数据库;
S103、将所述数据库中的未完成任务队列中的所述计算任务分别分配到所述计算集群中的空闲的计算节点;
S104、判断计算集群是否运行于高负荷状态,所述计算集群运行于高负荷状态的条件为计算资源的使用率超过预设阈值,若是,则执行步骤S105,若否,则执行步骤S108;
S105、根据第一预设轮询间隔,轮询所述计算集群中正在运行的所述计算任务,获得每个正在运行的所述计算任务对所述计算集群的资源使用率和运行该计算任务的计算节点的编号;
S106、将每个所述计算任务的资源使用率排序,并释放资源使用率最大的至少一个所述计算任务对应的计算节点;
S107、将所述计算节点被释放的计算任务加入到未完成任务队列,返回步骤S103;以及
S108、根据第二预设轮询间隔,所述第二预设轮询间隔大于所述第一预设轮询间隔。
优选地,所述步骤S108包括,根据第二预设轮询间隔,轮询所述计算集群中正在运行的所述计算任务,获得每个正在运行的所述计算任务的执行时长和运行该计算任务的计算节点的编号;
所述步骤S108之后还包括以下步骤
S109、释放执行时长超过预设第三阈值的所述计算任务对应的计算节点,所述第三阈值为5分钟,返回步骤S103。
优选地,所述计算集群运行于高负荷状态的条件需要满足以下中的任意一个:
内存或CPU的使用率超过第一阈值;或者
单个所述计算任务的执行时长超过第二阈值。
优选地,所述第一阈值的取值范围为65%至90%。
优选地,所述第二阈值的取值范围为100秒至300秒。
优选地,所述第一预设轮询间隔的取值范围是1秒到10秒。
优选地,所述第二预设轮询间隔的取值范围是30秒到120秒。
本发明的实施例提供一种基于离线应用的资源控制系统,实现如上述的基于离线应用的资源控制方法,其特征在于,包括:
任务接收模块,接收计算任务;
任务导入模块,将所述计算任务导入到计算集群的数据库;
任务分配模块,将所述数据库中的未完成任务队列中的所述计算任务分别分配到所述计算集群中的空闲的计算节点;
负荷判断模块,判断计算集群是否运行于高负荷状态,所述计算集群运行于高负荷状态的条件为计算资源的使用率超过预设阈值,若是,则执行第一轮询模块,若否,则执行第二轮询模块;
第一轮询模块,根据第一预设轮询间隔,轮询所述计算集群中正在运行的所述计算任务,获得每个正在运行的所述计算任务对所述计算集群的资源使用率和运行该计算任务的计算节点的编号;
任务排序模块,将每个所述计算任务的资源使用率排序,并释放资源使用率最大的至少一个所述计算任务对应的计算节点;
任务调度模块,将所述计算节点被释放的计算任务加入到未完成任务队列,返回任务分配模块;以及
第二轮询模块,根据第二预设轮询间隔,所述第二预设轮询间隔大于所述第一预设轮询间隔。
本发明的实施例还提供一种基于离线应用的资源控制设备,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述基于离线应用的资源控制方法的步骤。
本发明的实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述基于离线应用的资源控制方法的步骤。
本发明的目的在于提供基于离线应用的资源控制方法、系统、设备及存储介质,能够保持长时间健康稳定运行脱离不了系统的强抗压性,低故障率;保证跟踪系统简单实用,低耦合,高内聚,并且能快速完成迭代升级。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
图1是本发明的基于离线应用的资源控制方法的流程图。
图2是本发明的基于离线应用的资源控制系统的模块示意图。
图3是本发明的基于离线应用的资源控制设备的结构示意图。以及
图4是本发明一实施例的计算机可读存储介质的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。
本发明提供一种基于离线应用的资源控制方法,包括以下步骤:
S101、接收计算任务;
S102、将所述计算任务导入到计算集群的数据库;
S103、将所述数据库中的未完成任务队列中的所述计算任务分别分配到所述计算集群中的空闲的计算节点;
S104、判断计算集群是否运行于高负荷状态,所述计算集群运行于高负荷状态的条件为计算资源的使用率超过预设阈值,若是,则执行步骤S105,若否,则执行步骤S108;
S105、根据第一预设轮询间隔,轮询所述计算集群中正在运行的所述计算任务,获得每个正在运行的所述计算任务对所述计算集群的资源使用率和运行该计算任务的计算节点的编号;
S106、将每个所述计算任务的资源使用率排序,并释放资源使用率最大的至少一个所述计算任务对应的计算节点;
S107、将所述计算节点被释放的计算任务加入到未完成任务队列,返回步骤S103;
S108、根据第二预设轮询间隔,所述第二预设轮询间隔大于所述第一预设轮询间隔。
在一个优选方案中,所述步骤S108包括,根据第二预设轮询间隔,轮询所述计算集群中正在运行的所述计算任务,获得每个正在运行的所述计算任务的执行时长和运行该计算任务的计算节点的编号;
所述步骤S108之后还包括以下步骤
S109、释放执行时长超过预设第三阈值的所述计算任务对应的计算节点,所述第三阈值为5分钟,返回步骤S103。
在一个优选方案中,所述计算集群运行于高负荷状态的条件需要满足以下中的任意一个:
内存或CPU的使用率超过第一阈值;或者
单个所述计算任务的执行时长超过第二阈值。
在一个优选方案中,所述第一阈值的取值范围为65%至90%。
在一个优选方案中,所述第二阈值的取值范围为100秒至300秒。
在一个优选方案中,所述第一预设轮询间隔的取值范围是1秒到10秒。
在一个优选方案中,所述第二预设轮询间隔的取值范围是30秒到120秒。
图1是本发明的基于离线应用的资源控制方法的流程图。如图1所示,本发明的实施例提供一种基于离线应用的资源控制方法,包括以下步骤:
S101、接收计算任务;
S102、将所述计算任务导入到计算集群的数据库;
S103、将所述数据库中的未完成任务队列中的所述计算任务分别分配到所述计算集群中的空闲的计算节点;
S104、判断计算集群是否运行于高负荷状态,所述计算集群运行于高负荷状态的条件需要满足以下中的任意一个:内存或CPU的使用率超过70%;或者单个所述计算任务的执行时长超过2分钟,若是,则执行步骤S105,若否,则执行步骤S108;
S105、根据第一预设轮询间隔5秒一次,轮询所述计算集群中正在运行的所述计算任务,获得每个正在运行的所述计算任务对所述计算集群的资源使用率和运行该计算任务的计算节点的编号;
S106、将每个所述计算任务的资源使用率排序,并释放资源使用率最大的至少一个所述计算任务对应的计算节点;
S107、将所述计算节点被释放的计算任务加入到未完成任务队列,返回步骤S103;
S108、根据第二预设轮询间隔1分钟一次,所述第二预设轮询间隔大于所述第一预设轮询间隔,根据第二预设轮询间隔,轮询所述计算集群中正在运行的所述计算任务,获得每个正在运行的所述计算任务的执行时长和运行该计算任务的计算节点的编号;
S109、释放执行时长超过预设第三阈值的所述计算任务对应的计算节点,所述第三阈值为5分钟,返回步骤S103。
本实施例中可以利用收集任务可以包括跟踪系统提供pegion服务接口,上游产品通过调用pegion服务,将用户提交的任务信息回传至跟踪系统,关键信息如:queryId/dispatcherId/user/sql等等。
本实施例中可以利用负载均衡策略可以是根据zookeeper的一致性特征来设计负载均衡功能,解决分担business service压力,生产环境biz project共4台机器,比如编号1、2、3、4,每台机器请求dispatcher服务时,带上IP和端口,在zk节点创建临时节点,并接收返回的dispatcherId-1、dispatcherId-2、dispatcherId-3、dispatcherId-4,这样每台机器都处理各自相应的任务,不会出现其中一台处理量大,另一个处理量小或者不处理的情况,以达到负载均衡的目的。
本实施例中可以利用个性化定时器:Lion配置轮询时间间隔,根据ip和port调用dispatcher服务获取dispatcherid,开始查询相应mysql任务信息;时间可以设置比如:整点运行、间隔xx分钟(或年月日时分秒)运行、延迟xx分钟执行等。
本实施例中可以利用Hadoop YARN API工具包:Hive任务:调用官方resourcemanager api接口,解析json文件格式数据,并将资源消耗信息写入mysql库表。Impala任务:调用CDH API接口,解析txt文件格式数据,并将资源消耗信息写入库表。
本实施例中的任务查杀可以是通过编写shell脚本执行查杀Hive任务;或者通过调用cdh api执行查询Impala任务。
本发明提供了基于离线应用的资源控制方法,能够保持长时间健康稳定运行脱离不了系统的强抗压性,低故障率;保证跟踪系统简单实用,低耦合,高内聚,并且能快速完成迭代升级。
图2是本发明的基于离线应用的资源控制系统的模块示意图。如图2所示,本发明的实施例还提供一种基于离线应用的资源控制系统5,实现如上述的基于离线应用的资源控制方法,包括:
任务接收模块51,接收计算任务;
任务导入模块52,将所述计算任务导入到计算集群的数据库;
任务分配模块53,将所述数据库中的未完成任务队列中的所述计算任务分别分配到所述计算集群中的空闲的计算节点;
负荷判断模块54,判断计算集群是否运行于高负荷状态,所述计算集群运行于高负荷状态的条件为计算资源的使用率超过预设阈值,若是,则执行第一轮询模块55,若否,则执行第二轮询模块58;
第一轮询模块55,根据第一预设轮询间隔,轮询所述计算集群中正在运行的所述计算任务,获得每个正在运行的所述计算任务对所述计算集群的资源使用率和运行该计算任务的计算节点的编号;
任务排序模块56,将每个所述计算任务的资源使用率排序,并释放资源使用率最大的至少一个所述计算任务对应的计算节点;
任务调度模块57,将所述计算节点被释放的计算任务加入到未完成任务队列,返回任务分配模块53;以及
第二轮询模块58,根据第二预设轮询间隔,所述第二预设轮询间隔大于所述第一预设轮询间隔。
本发明的基于离线应用的资源控制系统使用技术取长补短,无缝对接SSO和HR系统,权限管控粒度收精确到库表的读写;根据任务的资源消耗情况和任务执行时长等关键数据指标进行任务查杀,释放资源保证集群环境稳定运行;跟踪系统的时间粒度取决于Lion配置,比如:集群环境资源消耗比过高,设值1分钟轮询一次;反之过低设值5秒钟轮询一次。
本发明提供了基于离线应用的资源控制系统,能够保持长时间健康稳定运行脱离不了系统的强抗压性,低故障率;保证跟踪系统简单实用,低耦合,高内聚,并且能快速完成迭代升级。
本发明实施例还提供一种双跳灯控制设备,包括处理器。存储器,其中存储有处理器的可执行指令。其中,处理器配置为经由执行可执行指令来执行的基于离线应用的资源控制方法的步骤。
如上所示,该实施例能够保持长时间健康稳定运行脱离不了系统的强抗压性,低故障率;保证跟踪系统简单实用,低耦合,高内聚,并且能快速完成迭代升级。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
图3是本发明的双跳灯控制设备的结构示意图。下面参照图3来描述根据本发明的这种实施方式的电子设备600。图3显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图3所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的基于离线应用的资源控制方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。
如上所示,该实施例能够保持长时间健康稳定运行脱离不了系统的强抗压性,低故障率;保证跟踪系统简单实用,低耦合,高内聚,并且能快速完成迭代升级。
图4是本发明的计算机可读存储介质的结构示意图。参考图4所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上,本发明的目的在于提供基于离线应用的资源控制方法、系统、设备及存储介质,能够保持长时间健康稳定运行脱离不了系统的强抗压性,低故障率;保证跟踪系统简单实用,低耦合,高内聚,并且能快速完成迭代升级。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种基于离线应用的资源控制方法,其特征在于,包括以下步骤:
S101、接收计算任务;
S102、将所述计算任务导入到计算集群的数据库;
S103、将所述数据库中的未完成任务队列中的所述计算任务分别分配到所述计算集群中的空闲的计算节点;
S104、判断计算集群是否运行于高负荷状态,所述计算集群运行于高负荷状态的条件为计算资源的使用率超过预设阈值,若是,则执行步骤S105,若否,则执行步骤S108;
S105、根据第一预设轮询间隔,轮询所述计算集群中正在运行的所述计算任务,获得每个正在运行的所述计算任务对所述计算集群的资源使用率和运行该计算任务的计算节点的编号;
S106、将每个所述计算任务的资源使用率排序,并释放资源使用率最大的至少一个所述计算任务对应的计算节点;
S107、将所述计算节点被释放的计算任务加入到未完成任务队列,返回步骤S103;以及
S108、根据第二预设轮询间隔,所述第二预设轮询间隔大于所述第一预设轮询间隔。
2.根据权利要求1所述的基于离线应用的资源控制方法,其特征在于:所述步骤S108包括,根据第二预设轮询间隔,轮询所述计算集群中正在运行的所述计算任务,获得每个正在运行的所述计算任务的执行时长和运行该计算任务的计算节点的编号;
所述步骤S108之后还包括以下步骤
S109、释放执行时长超过预设第三阈值的所述计算任务对应的计算节点,所述第三阈值为5分钟,返回步骤S103。
3.根据权利要求1所述的基于离线应用的资源控制方法,其特征在于:所述计算集群运行于高负荷状态的条件需要满足以下中的任意一个:
内存或CPU的使用率超过第一阈值;或者
单个所述计算任务的执行时长超过第二阈值。
4.根据权利要求3所述的基于离线应用的资源控制方法,其特征在于:所述第一阈值的取值范围为65%至90%。
5.根据权利要求3所述的基于离线应用的资源控制方法,其特征在于:所述第二阈值的取值范围为100秒至300秒。
6.根据权利要求1所述的基于离线应用的资源控制方法,其特征在于:所述第一预设轮询间隔的取值范围是1秒到10秒。
7.根据权利要求1所述的基于离线应用的资源控制方法,其特征在于:所述第二预设轮询间隔的取值范围是30秒到120秒。
8.一种基于离线应用的资源控制系统,实现如权利要求1至7中任意一项所述的基于离线应用的资源控制方法,其特征在于,包括:
任务接收模块,接收计算任务;
任务导入模块,将所述计算任务导入到计算集群的数据库;
任务分配模块,将所述数据库中的未完成任务队列中的所述计算任务分别分配到所述计算集群中的空闲的计算节点;
负荷判断模块,判断计算集群是否运行于高负荷状态,所述计算集群运行于高负荷状态的条件为计算资源的使用率超过预设阈值,若是,则执行第一轮询模块,若否,则执行第二轮询模块;
第一轮询模块,根据第一预设轮询间隔,轮询所述计算集群中正在运行的所述计算任务,获得每个正在运行的所述计算任务对所述计算集群的资源使用率和运行该计算任务的计算节点的编号;
任务排序模块,将每个所述计算任务的资源使用率排序,并释放资源使用率最大的至少一个所述计算任务对应的计算节点;
任务调度模块,将所述计算节点被释放的计算任务加入到未完成任务队列,返回任务分配模块;以及
第二轮询模块,根据第二预设轮询间隔,所述第二预设轮询间隔大于所述第一预设轮询间隔。
9.一种基于离线应用的资源控制设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7中任意一项所述基于离线应用的资源控制方法的步骤。
10.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1至7中任意一项所述基于离线应用的资源控制方法的步骤。
CN201910670592.0A 2019-07-24 2019-07-24 基于离线应用的资源控制方法、系统、设备及存储介质 Pending CN110362410A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910670592.0A CN110362410A (zh) 2019-07-24 2019-07-24 基于离线应用的资源控制方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910670592.0A CN110362410A (zh) 2019-07-24 2019-07-24 基于离线应用的资源控制方法、系统、设备及存储介质

Publications (1)

Publication Number Publication Date
CN110362410A true CN110362410A (zh) 2019-10-22

Family

ID=68220727

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910670592.0A Pending CN110362410A (zh) 2019-07-24 2019-07-24 基于离线应用的资源控制方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110362410A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021190087A1 (zh) * 2020-03-26 2021-09-30 北京金山云网络技术有限公司 任务执行方法、装置、系统和服务器

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1836214A (zh) * 2003-08-14 2006-09-20 甲骨文国际公司 需要时节点和服务器实例分配和解除分配
CN103530182A (zh) * 2013-10-22 2014-01-22 海南大学 一种作业调度方法和装置
CN106406987A (zh) * 2015-07-29 2017-02-15 阿里巴巴集团控股有限公司 一种集群中的任务执行方法及装置
CN106897133A (zh) * 2017-02-27 2017-06-27 郑州云海信息技术有限公司 一种基于pbs作业调度管理集群负载的实现方法
CN107590002A (zh) * 2017-09-15 2018-01-16 东软集团股份有限公司 任务分配方法、装置、存储介质、设备及分布式任务系统
CN108874535A (zh) * 2018-05-14 2018-11-23 中国平安人寿保险股份有限公司 一种任务调节方法、计算机可读存储介质及终端设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1836214A (zh) * 2003-08-14 2006-09-20 甲骨文国际公司 需要时节点和服务器实例分配和解除分配
CN103530182A (zh) * 2013-10-22 2014-01-22 海南大学 一种作业调度方法和装置
CN106406987A (zh) * 2015-07-29 2017-02-15 阿里巴巴集团控股有限公司 一种集群中的任务执行方法及装置
CN106897133A (zh) * 2017-02-27 2017-06-27 郑州云海信息技术有限公司 一种基于pbs作业调度管理集群负载的实现方法
CN107590002A (zh) * 2017-09-15 2018-01-16 东软集团股份有限公司 任务分配方法、装置、存储介质、设备及分布式任务系统
CN108874535A (zh) * 2018-05-14 2018-11-23 中国平安人寿保险股份有限公司 一种任务调节方法、计算机可读存储介质及终端设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021190087A1 (zh) * 2020-03-26 2021-09-30 北京金山云网络技术有限公司 任务执行方法、装置、系统和服务器

Similar Documents

Publication Publication Date Title
US11803546B2 (en) Selecting interruptible resources for query execution
Calheiros et al. Energy-efficient scheduling of urgent bag-of-tasks applications in clouds through DVFS
CN109117260A (zh) 一种任务调度方法、装置、设备和介质
CN102402458B (zh) 具有非对称处理器核的系统上的虚拟机和/或多级调度支持
CN109144696A (zh) 一种任务调度方法、装置、电子设备及存储介质
CN106385329B (zh) 资源池的处理方法、装置和设备
CN102999385B (zh) 计算设备中多处理器协同处理方法
CN108989238A (zh) 一种分配业务带宽的方法以及相关设备
KR20210067415A (ko) 클라우드 컴퓨팅 기반의 플랫폼 제공 시스템 및 이를 이용한 플랫폼 제공 방법
CN110162388A (zh) 一种任务调度方法、系统及终端设备
CN109992407A (zh) 一种yarn集群gpu资源调度方法、装置和介质
CN109783472A (zh) 表数据的迁移方法、装置、计算机设备和存储介质
CN111694646A (zh) 资源调度方法、装置、电子设备及计算机可读存储介质
CN103946802A (zh) 分配集群的信息资源以执行提交给该集群的工作的方法、计算机程序及设备
Varghese et al. Cloud futurology
CN102812439A (zh) 多处理器计算机系统中的功率管理
CN106201723A (zh) 一种数据中心的资源调度方法及装置
CN105975340A (zh) 一种虚拟机应用分配部署算法
CN103294556B (zh) 用于主机系统准入控制的方法和系统
US20160019089A1 (en) Method and system for scheduling computing
US11307898B2 (en) Server resource balancing using a dynamic-sharing strategy
CN110275760A (zh) 基于虚拟主机处理器的进程挂起方法及其相关设备
CN109840141A (zh) 基于云监控的线程控制方法、装置、电子设备及存储介质
CN114327894A (zh) 资源分配方法、装置、电子设备及存储介质
CN111464331A (zh) 一种线程创建的控制方法、系统及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191022

RJ01 Rejection of invention patent application after publication