CN114003377A - 一种基于es服务的内存熔断方法、装置、设备及可读介质 - Google Patents
一种基于es服务的内存熔断方法、装置、设备及可读介质 Download PDFInfo
- Publication number
- CN114003377A CN114003377A CN202111235730.6A CN202111235730A CN114003377A CN 114003377 A CN114003377 A CN 114003377A CN 202111235730 A CN202111235730 A CN 202111235730A CN 114003377 A CN114003377 A CN 114003377A
- Authority
- CN
- China
- Prior art keywords
- task
- priority
- resource
- preset
- list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000004044 response Effects 0.000 claims abstract description 52
- 238000012544 monitoring process Methods 0.000 claims abstract description 36
- 238000004590 computer program Methods 0.000 claims description 11
- 230000036541 health Effects 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 4
- 238000004806 packaging method and process Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000001681 protective effect Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
- G06F9/5016—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3037—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/48—Indexing scheme relating to G06F9/48
- G06F2209/484—Precedence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5021—Priority
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供了一种基于ES服务的内存熔断的方法、装置、设备及可读介质,该方法包括:监控集群各节点实例的资源状态和任务运行情况;基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表;响应于检测到资源状态达到预设第一阈值,根据列表中的优先级为任务分配不同的系统资源;响应于检测到资源状态达到预设第二阈值,根据列表中的优先级将优先级低的任务进行内存熔断以释放资源。通过使用本发明的方案,能够有效避免高负载复杂场景下集群的重要任务执行失败,更好的保护重要任务的运行平稳,极大的提高ES服务运行的稳定性和高效能。
Description
技术领域
本发明涉及计算机领域,并且更具体地涉及一种基于ES服务的内存熔断的方法、装置、设备及可读介质。
背景技术
ES(指一种分布式全文数据库系统服务Elasticsearch)应用服务本身将当前环境可以使用RAM资源进行分类区分,其中堆外占用为索引中的FST索引内容,当索引开启时常驻内存。在应用的堆内则进行更加精细的区分,包括fileddataCache、requestCache、queryCache等内存区域,这部分堆内内存使用区域均位于ES应用的JVM划分RAM资源中,用于ES检索系统的特殊内容、索引、检索等部分功能的运行。对于ES的堆内使用内存区域,ES存在一套内存熔断机制,内存熔断机制针对分配的可用资源使用情况进行任务熔断管理,当某一分区任务资源使用过限,便会自动启动熔断保护机制,以便及时终止当前异常任务并释放资源,避免应用和系统因为资源缺乏导致宕机故障。
当前主流版本的ES服务架构是一种业务无感知架构,当一套集群系统的任务并发较大时,无论服务运行多少任务,应用内部始终是以请求队列排队运行的方式运行任务,没有优先级区分。而ES对于应用资源则属于有感知消耗,尤其是其内存系统的特性会消耗大量的RAM资源,当磁盘存储较多的数据之后,经常会面临ES索引占用RAM资源较多而整体环境RAM消耗较大,叠加服务器系统RAM资源释放不及时的问题,导致应用所需的运行节点感知RAM资源紧张进而触发ES应用的任务熔断机制引起检索任务异常终止问题。
ES的常规熔断触发会强制停止当前请求任务的正常执行,待到系统资源重新释放后才能恢复后续的正常功能使用。ES系统在运行这些请求任务的时候是统一使用请求分发的方式进行的,没有做优先级的区分,在实际的业务场景中,索引(一般指索引数据写入)或检索(指搜索)任务都是有业务方面的优先级区分,尤其是在一些实时搜索场景,业务高峰时段的实时检索请求通常要求在近实时的时间内返回结果,而一些索引数据写入任务或批处理的统计分析任务则并不要求实时反馈结果。基于上述特点,如果一个集群系统的任务压力较重,而恰好又处在业务高峰时段,此时就会容易导致任务挤压运行,且无优先级的流量控制导致大量请求堆积,而堆内资源使用一旦达到阈值就会引起瞬时段内的大量请求任务无差别执行失败,从而影响重要任务的执行结果反馈,影响业务运行。
发明内容
有鉴于此,本发明实施例的目的在于提出一种基于ES服务的内存熔断的方法、装置、设备及可读介质,通过使用本发明的技术方案,能够有效避免高负载复杂场景下集群的重要任务执行失败,更好的保护重要任务的运行平稳,极大的提高ES服务运行的稳定性和高效能。
基于上述目的,本发明的实施例的一个方面提供了一种基于ES服务的内存熔断的方法,包括以下步骤:
监控集群各节点实例的资源状态和任务运行情况;
基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表;
响应于检测到资源状态达到预设第一阈值,根据列表中的优先级为任务分配不同的系统资源;
响应于检测到资源状态达到预设第二阈值,根据列表中的优先级将优先级低的任务进行内存熔断以释放资源。
根据本发明的一个实施例,监控集群各节点实例的资源状态和任务运行情况包括:
监控收集各节点和实例返回的集群资源信息;
监控记录各节点实例的任务运行情况,筛选出有效的任务信息;
监控集群的健康状态情况以及各节点的任务稳定性。
根据本发明的一个实施例,基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表包括:
分析一定时间段内监控到的资源状态和任务运行情况并结合用户自定义的任务的优先级设定集群内任务的整体优先级顺序;
根据整体优先级顺序设定优先级列表。
根据本发明的一个实施例,响应于检测到资源状态达到预设第一阈值,根据列表中的优先级为任务分配不同的系统资源包括:
响应于检测到资源状态达到预设第一阈值,将列表中优先级低的任务的部分资源调整到优先级高的任务;
响应于检测到资源状态小于预设第一阈值,将调整的资源返回到原来的优先级低的任务中。
根据本发明的一个实施例,响应于检测到资源状态达到预设第一阈值,将列表中优先级低的任务的部分资源调整到优先级高的任务包括:
响应于检测到资源状态达到预设第一阈值,将列表中优先级低的任务的90%的资源平均调整到优先级高的任务中。
根据本发明的一个实施例,响应于检测到资源状态达到预设第二阈值,根据列表中的优先级将优先级低的任务进行内存熔断以释放资源包括:
响应于检测到资源状态达到预设第二阈值,将列表中优先级最低的任务进行熔断关闭;
响应于检测到资源状态小于预设第二阈值,将列表中优先级最低的任务进行恢复。
根据本发明的一个实施例,预设第一阈值为RAM使用量达到70%,预设第二阈值为RAM使用量达到80%。
本发明的实施例的另一个方面,还提供了一种基于ES服务的内存熔断的装置,装置包括:
监控模块,监控模块配置为监控集群各节点实例的资源状态和任务运行情况;
设置模块,设置模块配置为基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表;
调整模块,调整模块配置为响应于检测到资源状态达到预设第一阈值,根据列表中的优先级为任务分配不同的系统资源;
熔断模块,熔断模块配置为响应于检测到资源状态达到预设第二阈值,根据列表中的优先级将优先级低的任务进行内存熔断以释放资源。
本发明的实施例的另一个方面,还提供了一种计算机设备,该计算机设备包括:
至少一个处理器;以及
存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述任意一项方法的步骤。
本发明的实施例的另一个方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任意一项方法的步骤。
本发明具有以下有益技术效果:本发明实施例提供的基于ES服务的内存熔断的方法,通过监控集群各节点实例的资源状态和任务运行情况;基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表;响应于检测到资源状态达到预设第一阈值,根据列表中的优先级为任务分配不同的系统资源;响应于检测到资源状态达到预设第二阈值,根据列表中的优先级将优先级低的任务进行内存熔断以释放资源的技术方案,能够有效避免高负载复杂场景下集群的重要任务执行失败,更好的保护重要任务的运行平稳,极大的提高ES服务运行的稳定性和高效能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为根据本发明一个实施例的基于ES服务的内存熔断的方法的示意性流程图;
图2为根据本发明一个实施例的基于ES服务的内存熔断的装置的示意图;
图3为根据本发明一个实施例的计算机设备的示意图;
图4为根据本发明一个实施例的计算机可读存储介质的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
基于上述目的,本发明的实施例的第一个方面,提出了一种基于ES服务的内存熔断的方法的一个实施例。图1示出的是该方法的示意性流程图。
如图1中所示,该方法可以包括以下步骤:
S1监控集群各节点实例的资源状态和任务运行情况。
通过监测集群各节点实例的资源状态和任务运行情况,在集群资源方面包括各ES服务所在节点和实例的CPU使用率、RAM存量、磁盘存储、网络情况等资源使用情况,在服务方面主要监控ES的服务运行情况和服务特征等,比如部分检索任务或写入任务的规律性和实时性要求,这些参数情况会被封装传递。
S2基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表。
通过解析封装传递的参数,并结合用户自定义的主动控制参数进行集群任务情况分析,绘制任务拓扑图,通过业务时段定义、优先次序定义,将不同任务进行优先级识别和系统分析,输出任务的高低优先级数、实时和非实时结果需求任务、规律性分析任务等并进行标签标记,并进行详细的优先级排序定义,主动定义任务特殊场景下的运行次序逻辑,合理进行任务分类管理。
S3响应于检测到资源状态达到预设第一阈值,根据列表中的优先级为任务分配不同的系统资源。
根据上层传递的各项参数和任务优先级列表进行任务管理,当接收到节点实例运行资源阈值情况,如RAM接近熔断值,将根据设定的优先级识别,主动调整任务的运行次序逻辑,优先分配资源给优先级别较高的任务,并限制优先阶别较低任务的资源提供,达到平衡任务均衡合理的目的,避免特殊场景下任务相互抢占资源的情况。
S4响应于检测到资源状态达到预设第二阈值,根据列表中的优先级将优先级低的任务进行内存熔断以释放资源。
例如搜索任务运行时检测到RAM达到接近实际熔断值时,此时已经超出了任务平衡调度的管理能力,则此时可以对标签带有优先级数较低的,属于非实时结果需求任务、规律性等分析任务进行选择性熔断,保证实时性和重要程度较高的任务在熔断机制中被保护,降低当前ES服务的资源使用压力,维持ES服务正常运行和搜索结果的正常反馈。
通过本发明的技术方案,能够有效避免高负载复杂场景下集群的重要任务执行失败,更好的保护重要任务的运行平稳,极大的提高ES服务运行的稳定性和高效能。
在本发明的一个优选实施例中,监控集群各节点实例的资源状态和任务运行情况包括:
监控收集各节点和实例返回的集群资源信息;
监控记录各节点实例的任务运行情况,筛选出有效的任务信息;
监控集群的健康状态情况以及各节点的任务稳定性。可以在集群中定义资源精准监测模块,用于监控收集各节点和实例返回的集群资源信息,包括CPU、内存RAM、磁盘IO信息等,监控记录各节点实例的任务运行情况,筛选出有效的任务信息指标,监控集群的健康状态情况以及各节点的任务稳定性情况,封装经过初步合并过滤处理的集群节点资源、服务运行、任务稳定性等信息,并进行信息封装传递。
在本发明的一个优选实施例中,基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表包括:
分析一定时间段内监控到的资源状态和任务运行情况并结合用户自定义的任务的优先级设定集群内任务的整体优先级顺序;
根据整体优先级顺序设定优先级列表。将接收到的资源监测模块传递的集群节点资源、服务运行、任务稳定性等封装信息并进行解析,接收用户自定义参数文件中的自主定义参数,如任务平衡调度阈值(如RAM使用达到70%)、选择性熔断阈值(如RAM使用达到80%)、任务的优先级主动定义等,其中任务优先级主动定义有0/1/2/3/4等五个等级,越高等级代表任务重要程度越高,在进行任务平衡调度时就会得到更多的优先保障,而优先级别低的任务则更容易会被主动或强制停止运行。通过统计分析系统记录的近一个月内的查询等请求运行情况、以及用户主动定义的任务优先级参数,确定任务的优先次序,如用户的主动优先级定义可以按照实际级别加入控制列表,用户未进行定义的任务可以按照索引和检索的类别,如果是规律性的每天在特定时段运行的任务,可以进行较低优先级别设置,实时查询请求来自客户端的瞬时任务可设置较高优先级别,业务峰值时段的索引(数据写入)处理任务控制为低优先级任务。得到整体的优先级列表,该列表每小时进行更新维护。将优先级列表信息和参数等信息再次封装传递至任务平衡调度管理模块。
在本发明的一个优选实施例中,响应于检测到资源状态达到预设第一阈值,根据列表中的优先级为任务分配不同的系统资源包括:
响应于检测到资源状态达到预设第一阈值,将列表中优先级低的任务的部分资源调整到优先级高的任务;
响应于检测到资源状态小于预设第一阈值,将调整的资源返回到原来的优先级低的任务中。接收并解析任务优先级列表信息和用户自定义参数等信息,如各项运行任务的优先级控制列表、如任务平衡调度阈值假设为当前RAM总量的70%。如果发现RAM使用已经达到当前RAM总量的70%,则需要启动任务平衡调度。对优先级别高的任务进行资源运行保护,优先级别低的任务进行资源限制,其中资源提供按照优先级别进行相应的配比提供,比如优先级最低的任务限制资源使用为先前的10%。继续接收上层传递的资源情况和任务情况,如果资源用量下降至不再紧张如RAM在70%以下,则可关闭平衡调度操作。
在本发明的一个优选实施例中,响应于检测到资源状态达到预设第一阈值,将列表中优先级低的任务的部分资源调整到优先级高的任务包括:
响应于检测到资源状态达到预设第一阈值,将列表中优先级低的任务的90%的资源平均调整到优先级高的任务中。
在本发明的一个优选实施例中,响应于检测到资源状态达到预设第二阈值,根据列表中的优先级将优先级低的任务进行内存熔断以释放资源包括:
响应于检测到资源状态达到预设第二阈值,将列表中优先级最低的任务进行熔断关闭;
响应于检测到资源状态小于预设第二阈值,将列表中优先级最低的任务进行恢复。如果当前接收到的节点资源使用情况达到甚至超过选择性熔断阈值,即RAM使用达到或超过总量的80%,则启动保护性熔断机制。保护性熔断的运行机制同样会取到任务的优先级别列表和任务详情,然后对优先级最低的任务进行直接熔断关闭,释放资源。当接收到RAM资源使用降低至瞬时80%以下,则停止保护性熔断的运行。
在本发明的一个优选实施例中,预设第一阈值为RAM使用量达到70%,预设第二阈值为RAM使用量达到80%。
本发明的技术方案通过资源的精准监控对ES服务运行节点的资源和服务情况进行状态收集,通过动态近实时的资源和服务运行信息,让请求定义组件可以对ES集群整体的资源和服务运行情况进行统一分析,结合用户自主定义的任务控制参数,对任务进行优先定位生成任务优先控制列表和任务拓扑,对整体的任务进行精准定位以便于控制。在任务平衡调度阶段通过对各项参数指标和任务优先列表的整合评估,并在资源使用超限的情况下启动任务调节能力,通过任务调度优先次序、重要程度和场景需求进行任务调控,对优先级高的任务进行资源支持保护,对于低优先级的任务进行资源供给限制。如果集群压力超过了平衡调度阶段阈值能力,最终则需要选择性熔断保护模块来进行任务的选择性熔断,保护重要任务可以平稳有效的运行并反馈有效结果,而对于次要任务则选择性的进行熔断,达到释放资源的目的。通过这样一系列的机制可以避免ES原有的熔断机制仅仅简单控制分区资源和总体资源的阈值并进行熔断的操作,有效避免高负载复杂场景下集群的任务能力,极大的提高ES服务运行的稳定性和高效能。
需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,上述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中存储介质可为磁碟、光盘、只读存储器(Read-Only Memory,ROM)或随机存取存储器(Random AccessMemory,RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
此外,根据本发明实施例公开的方法还可以被实现为由CPU执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被CPU执行时,执行本发明实施例公开的方法中限定的上述功能。
基于上述目的,本发明的实施例的第二个方面,提出了一种基于ES服务的内存熔断的装置,如图2所示,装置200包括:
监控模块201,监控模块201配置为监控集群各节点实例的资源状态和任务运行情况;
设置模块202,设置模块202配置为基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表;
调整模块203,调整模块203配置为响应于检测到资源状态达到预设第一阈值,根据列表中的优先级为任务分配不同的系统资源;
熔断模块204,熔断模块204配置为响应于检测到资源状态达到预设第二阈值,根据列表中的优先级将优先级低的任务进行内存熔断以释放资源。
基于上述目的,本发明实施例的第三个方面,提出了一种计算机设备。图3示出的是本发明提供的计算机设备的实施例的示意图。如图3所示,本发明实施例包括如下装置:至少一个处理器21;以及存储器22,存储器22存储有可在处理器上运行的计算机指令23,指令由处理器执行时实现以下方法:
监控集群各节点实例的资源状态和任务运行情况;
基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表;
响应于检测到资源状态达到预设第一阈值,根据列表中的优先级为任务分配不同的系统资源;
响应于检测到资源状态达到预设第二阈值,根据列表中的优先级将优先级低的任务进行内存熔断以释放资源。
在本发明的一个优选实施例中,监控集群各节点实例的资源状态和任务运行情况包括:
监控收集各节点和实例返回的集群资源信息;
监控记录各节点实例的任务运行情况,筛选出有效的任务信息;
监控集群的健康状态情况以及各节点的任务稳定性。
在本发明的一个优选实施例中,基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表包括:
分析一定时间段内监控到的资源状态和任务运行情况并结合用户自定义的任务的优先级设定集群内任务的整体优先级顺序;
根据整体优先级顺序设定优先级列表。
在本发明的一个优选实施例中,响应于检测到资源状态达到预设第一阈值,根据列表中的优先级为任务分配不同的系统资源包括:
响应于检测到资源状态达到预设第一阈值,将列表中优先级低的任务的部分资源调整到优先级高的任务;
响应于检测到资源状态小于预设第一阈值,将调整的资源返回到原来的优先级低的任务中。
在本发明的一个优选实施例中,响应于检测到资源状态达到预设第一阈值,将列表中优先级低的任务的部分资源调整到优先级高的任务包括:
响应于检测到资源状态达到预设第一阈值,将列表中优先级低的任务的90%的资源平均调整到优先级高的任务中。
在本发明的一个优选实施例中,响应于检测到资源状态达到预设第二阈值,根据列表中的优先级将优先级低的任务进行内存熔断以释放资源包括:
响应于检测到资源状态达到预设第二阈值,将列表中优先级最低的任务进行熔断关闭;
响应于检测到资源状态小于预设第二阈值,将列表中优先级最低的任务进行恢复。
在本发明的一个优选实施例中,预设第一阈值为RAM使用量达到70%,预设第二阈值为RAM使用量达到80%。
基于上述目的,本发明实施例的第四个方面,提出了一种计算机可读存储介质。图4示出的是本发明提供的计算机可读存储介质的实施例的示意图。如图4所示,计算机可读存储介质31存储有被处理器执行时执行如下方法的计算机程序32:
监控集群各节点实例的资源状态和任务运行情况;
基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表;
响应于检测到资源状态达到预设第一阈值,根据列表中的优先级为任务分配不同的系统资源;
响应于检测到资源状态达到预设第二阈值,根据列表中的优先级将优先级低的任务进行内存熔断以释放资源。
在本发明的一个优选实施例中,监控集群各节点实例的资源状态和任务运行情况包括:
监控收集各节点和实例返回的集群资源信息;
监控记录各节点实例的任务运行情况,筛选出有效的任务信息;
监控集群的健康状态情况以及各节点的任务稳定性。
在本发明的一个优选实施例中,基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表包括:
分析一定时间段内监控到的资源状态和任务运行情况并结合用户自定义的任务的优先级设定集群内任务的整体优先级顺序;
根据整体优先级顺序设定优先级列表。
在本发明的一个优选实施例中,响应于检测到资源状态达到预设第一阈值,根据列表中的优先级为任务分配不同的系统资源包括:
响应于检测到资源状态达到预设第一阈值,将列表中优先级低的任务的部分资源调整到优先级高的任务;
响应于检测到资源状态小于预设第一阈值,将调整的资源返回到原来的优先级低的任务中。
在本发明的一个优选实施例中,响应于检测到资源状态达到预设第一阈值,将列表中优先级低的任务的部分资源调整到优先级高的任务包括:
响应于检测到资源状态达到预设第一阈值,将列表中优先级低的任务的90%的资源平均调整到优先级高的任务中。
在本发明的一个优选实施例中,响应于检测到资源状态达到预设第二阈值,根据列表中的优先级将优先级低的任务进行内存熔断以释放资源包括:
响应于检测到资源状态达到预设第二阈值,将列表中优先级最低的任务进行熔断关闭;
响应于检测到资源状态小于预设第二阈值,将列表中优先级最低的任务进行恢复。
在本发明的一个优选实施例中,预设第一阈值为RAM使用量达到70%,预设第二阈值为RAM使用量达到80%。
此外,根据本发明实施例公开的方法还可以被实现为由处理器执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被处理器执行时,执行本发明实施例公开的方法中限定的上述功能。
此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
在一个或多个示例性设计中,功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(DSL)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、DSL或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(CD)、激光盘、光盘、数字多功能盘(DVD)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
Claims (10)
1.一种基于ES服务的内存熔断的方法,其特征在于,包括以下步骤:
监控集群各节点实例的资源状态和任务运行情况;
基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表;
响应于检测到资源状态达到预设第一阈值,根据所述列表中的优先级为任务分配不同的系统资源;
响应于检测到资源状态达到预设第二阈值,根据所述列表中的优先级将优先级低的任务进行内存熔断以释放资源。
2.根据权利要求1所述的方法,其特征在于,监控集群各节点实例的资源状态和任务运行情况包括:
监控收集各节点和实例返回的集群资源信息;
监控记录各节点实例的任务运行情况,筛选出有效的任务信息;
监控集群的健康状态情况以及各节点的任务稳定性。
3.根据权利要求1所述的方法,其特征在于,基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表包括:
分析一定时间段内监控到的资源状态和任务运行情况并结合用户自定义的任务的优先级设定集群内任务的整体优先级顺序;
根据整体优先级顺序设定优先级列表。
4.根据权利要求1所述的方法,其特征在于,响应于检测到资源状态达到预设第一阈值,根据所述列表中的优先级为任务分配不同的系统资源包括:
响应于检测到资源状态达到预设第一阈值,将所述列表中优先级低的任务的部分资源调整到优先级高的任务;
响应于检测到资源状态小于预设第一阈值,将调整的资源返回到原来的优先级低的任务中。
5.根据权利要求4所述的方法,其特征在于,响应于检测到资源状态达到预设第一阈值,将所述列表中优先级低的任务的部分资源调整到优先级高的任务包括:
响应于检测到资源状态达到预设第一阈值,将所述列表中优先级低的任务的90%的资源平均调整到优先级高的任务中。
6.根据权利要求1所述的方法,其特征在于,响应于检测到资源状态达到预设第二阈值,根据所述列表中的优先级将优先级低的任务进行内存熔断以释放资源包括:
响应于检测到资源状态达到预设第二阈值,将所述列表中优先级最低的任务进行熔断关闭;
响应于检测到资源状态小于预设第二阈值,将所述列表中优先级最低的任务进行恢复。
7.根据权利要求1所述的方法,其特征在于,所述预设第一阈值为RAM使用量达到70%,所述预设第二阈值为RAM使用量达到80%。
8.一种基于ES服务的内存熔断的装置,其特征在于,所述装置包括:
监控模块,所述监控模块配置为监控集群各节点实例的资源状态和任务运行情况;
设置模块,所述设置模块配置为基于监控到的资源状态和任务运行情况设定任务优先级,并根据设定的任务优先级设定优先级控制列表;
调整模块,所述调整模块配置为响应于检测到资源状态达到预设第一阈值,根据所述列表中的优先级为任务分配不同的系统资源;
熔断模块,所述熔断模块配置为响应于检测到资源状态达到预设第二阈值,根据所述列表中的优先级将优先级低的任务进行内存熔断以释放资源。
9.一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-7任意一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111235730.6A CN114003377A (zh) | 2021-10-22 | 2021-10-22 | 一种基于es服务的内存熔断方法、装置、设备及可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111235730.6A CN114003377A (zh) | 2021-10-22 | 2021-10-22 | 一种基于es服务的内存熔断方法、装置、设备及可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114003377A true CN114003377A (zh) | 2022-02-01 |
Family
ID=79923917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111235730.6A Pending CN114003377A (zh) | 2021-10-22 | 2021-10-22 | 一种基于es服务的内存熔断方法、装置、设备及可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114003377A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117806778A (zh) * | 2024-02-29 | 2024-04-02 | 济南浪潮数据技术有限公司 | 资源管理方法、系统、设备及介质 |
CN117880229A (zh) * | 2024-03-11 | 2024-04-12 | 苏州特思恩科技有限公司 | 一种buffer资源自动释放器的实现方法 |
CN117806778B (zh) * | 2024-02-29 | 2024-06-07 | 济南浪潮数据技术有限公司 | 资源管理方法、系统、设备及介质 |
-
2021
- 2021-10-22 CN CN202111235730.6A patent/CN114003377A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117806778A (zh) * | 2024-02-29 | 2024-04-02 | 济南浪潮数据技术有限公司 | 资源管理方法、系统、设备及介质 |
CN117806778B (zh) * | 2024-02-29 | 2024-06-07 | 济南浪潮数据技术有限公司 | 资源管理方法、系统、设备及介质 |
CN117880229A (zh) * | 2024-03-11 | 2024-04-12 | 苏州特思恩科技有限公司 | 一种buffer资源自动释放器的实现方法 |
CN117880229B (zh) * | 2024-03-11 | 2024-05-17 | 苏州特思恩科技有限公司 | 一种buffer资源自动释放器的实现方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10972344B2 (en) | Automated adjustment of subscriber policies | |
EP3072260B1 (en) | Methods, systems, and computer readable media for a network function virtualization information concentrator | |
CN108681484B (zh) | 一种任务的分配方法、装置及设备 | |
US10284650B2 (en) | Method and system for dynamic handling in real time of data streams with variable and unpredictable behavior | |
US6862619B1 (en) | Network management system equipped with event control means and method | |
EP3002924B1 (en) | Stream-based object storage solution for real-time applications | |
US20060168156A1 (en) | Hierarchical system configuration method and integrated scheduling method to provide multimedia streaming service on two-level double cluster system | |
EP0990349A1 (en) | A telecommunications performance management system | |
US8706858B2 (en) | Method and apparatus for controlling flow of management tasks to management system databases | |
WO2022057001A1 (zh) | 一种设备纳管方法、系统及纳管集群 | |
CN113347111B (zh) | 基于用户体验的流量调整方法及管理系统 | |
CN112165436A (zh) | 流量控制方法、装置及系统 | |
WO2015106795A1 (en) | Methods and systems for selecting resources for data routing | |
CN114661419A (zh) | 一种服务质量控制系统及方法 | |
CN114003377A (zh) | 一种基于es服务的内存熔断方法、装置、设备及可读介质 | |
CN115277577A (zh) | 数据处理方法、装置、计算机设备和计算机可读存储介质 | |
Bhushan et al. | Priority-queue based dynamic scaling for efficient resource allocation in fog computing | |
CN111506425B (zh) | 服务质量数据处理方法和装置 | |
CN104702654A (zh) | 基于视频云存储系统的存储与提取性能平衡的方法与装置 | |
CN110971532B (zh) | 一种网络资源管理方法、装置及设备 | |
WO2018188405A1 (zh) | 云应用资源的配置方法及装置 | |
US10986036B1 (en) | Method and apparatus for orchestrating resources in multi-access edge computing (MEC) network | |
CN114296891A (zh) | 任务的调度方法、系统、计算设备、存储介质及程序产品 | |
CN115878309A (zh) | 资源分配方法、装置、处理核、设备和计算机可读介质 | |
CN116719630B (zh) | 案件调度方法、设备、存储介质及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |