CN113326170B - 任务延迟风险检测方法、电子设备及存储介质 - Google Patents

任务延迟风险检测方法、电子设备及存储介质 Download PDF

Info

Publication number
CN113326170B
CN113326170B CN202110644030.6A CN202110644030A CN113326170B CN 113326170 B CN113326170 B CN 113326170B CN 202110644030 A CN202110644030 A CN 202110644030A CN 113326170 B CN113326170 B CN 113326170B
Authority
CN
China
Prior art keywords
server
tenant
tasks
interval
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110644030.6A
Other languages
English (en)
Other versions
CN113326170A (zh
Inventor
笪尚
谢健
卢明杰
邸帅
卢道和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202110644030.6A priority Critical patent/CN113326170B/zh
Publication of CN113326170A publication Critical patent/CN113326170A/zh
Priority to PCT/CN2021/136007 priority patent/WO2022257389A1/zh
Application granted granted Critical
Publication of CN113326170B publication Critical patent/CN113326170B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3017Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is implementing multitasking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明实施例公开了一种任务延迟风险检测方法、电子设备及存储介质,其中,该方法包括:获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数;在所述服务器集群中第一服务器对应的待处理任务的总数未处于所述第一服务器对应的第一区间的情况下,输出第一提示信息;其中,所述第一提示信息表征所述第一服务器存在任务延迟风险;所述第一区间表征服务器的缓存队列中允许存在的待处理任务的最大总数的区间;所述第一区间基于所述服务器集群中每台服务器对应的第一信息确定出;所述第一信息表征每个租户对应的服务器在处理历史任务时的数据处理能力。

Description

任务延迟风险检测方法、电子设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种任务延迟风险检测方法、电子设备及存储介质。
背景技术
随着计算机技术的发展,越来越多的技术(例如,大数据等)应用在金融领域,传统金融业正在逐步向金融科技转变,然而,由于金融行业的安全性、实时性要求,金融科技也对技术提出了更高的要求。金融科技领域下,针对服务器集群,通过基于峰值时间用户提交任务的速度和每秒处理的最大任务数量之间的差值判断是否小于设定阈值,来确定服务器集群是否能够满足计算需求。但是,针对执行大数据批量任务的服务器集群而言,由于用户在单位时间内提交的任务数量有限,且单个任务响应时间长,因此,采用这种方法无法准确地确定出服务器集群是否能够满足计算需求,进而无法准确地确定是否存在任务延迟风险。
发明内容
有鉴于此,本发明实施例提供一种任务延迟风险检测方法、电子设备及存储介质,以解决相关技术中无法准确地确定出服务器集群是否存在任务延迟风险的技术问题。
为达到上述目的,本发明的技术方案是这样实现的:
本发明实施例提供了一种任务延迟风险检测方法,包括:
获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数;
在所述服务器集群中第一服务器对应的待处理任务的总数未处于所述第一服务器对应的第一区间的情况下,输出第一提示信息以及输出第一租户对应的待新增的服务器的数量;其中,
所述第一提示信息表征所述第一服务器存在任务延迟风险;所述第一区间表征服务器的缓存队列中允许存在的待处理任务的最大总数的区间;所述第一区间基于所述服务器集群中每台服务器对应的第一信息确定出;所述第一信息表征每个租户对应的服务器在处理历史任务时的数据处理能力;所述第一租户为所述第一服务器对应的租户。
上述方案中,所述第一信息包括每个租户的历史任务信息;所述方法还包括:
基于服务器集群中每台服务器对应的每个租户的历史任务信息,确定出每台服务器对应的每个租户的最大任务总量、每台服务器对应的峰值平均处理速度、每个租户对应的服务器的总数和每个租户对应的历史任务的最大设定延迟时间;其中,最大任务总量表征等待处理的历史任务的最大总量;峰值平均处理速度表征任务处理速度的所有峰值的均值;
基于所述每台服务器对应的每个租户对应的最大任务总量、所述每台服务器对应的峰值平均处理速度、所述每个租户对应的服务器的总数和确定出的最大设定延迟时间,确定出每台服务器对应的第一区间。
上述方案中,所述基于所述每台服务器对应的每个租户对应的最大任务总量、所述每台服务器对应的峰值平均处理速度、所述每个租户对应的服务器的总数和确定出的最大设定延迟时间,确定出每台服务器对应的第一区间,包括:
基于每个租户对应的服务器的总数和所述每台服务器对应的每个租户对应的最大任务总量,确定出服务器对应的第一区间的第一边界值;
基于所述每台服务器对应的峰值平均处理速度和确定出的最大设定延迟时间,确定出服务器对应的第一区间的第二边界值;所述第一边界值小于所述第二边界值。
上述方案中,所述第一信息还包括服务器的性能参数;所述方法还包括:
基于所述每个租户对应的服务器的总数、每个租户对应的每台服务器的性能参数和所述每台服务器对应的每个租户对应的最大任务总量,确定出服务器对应的第一区间的第一边界值。
上述方案中,所述方法还包括:
通过执行定时任务,更新每台服务器对应的第一区间。
上述方案中,所述方法还包括:
基于第一参数确定出所述第一租户对应的待新增的服务器的数量;其中,
所述第一参数包括:
所述第一租户对应的每台服务器对应的待处理任务的总数;
所述第一租户对应的每台服务器对应的第一区间的至少一个边界值;
所述第一租户对应的服务器的总数。
上述方案中,所述第一参数还包括:
所述第一区间对应的设定冗余值。
上述方案中,所述从服务器集群中每台服务器对应的缓存队列中,读取每台服务器对应的待处理任务的总数,包括:
在检测到服务器集群中至少一台第二服务器存在设定的负载风险,并已降低所述至少一台第二服务器对应的设定并发任务阈值的情况下,获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数。
本发明实施例还提供了一种电子设备,包括:
获取单元,用于获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数;
提示单元,用于在所述服务器集群中第一服务器对应的待处理任务的总数未处于所述第一服务器对应的第一区间的情况下,输出第一提示信息以及输出第一租户对应的待新增的服务器的数量;其中,
所述第一提示信息表征所述第一服务器存在任务延迟风险;所述第一区间表征服务器的缓存队列中允许存在的待处理任务的最大总数的区间;所述第一区间基于所述服务器集群中每台服务器对应的第一信息确定出;所述第一信息表征每个租户对应的服务器在处理历史任务时的数据处理能力;所述第一租户为所述第一服务器对应的租户。
本发明实施例还提供了一种电子设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行上述任务延迟风险检测方法的步骤。
本发明实施例还提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任务延迟风险检测方法的步骤。
本发明实施例,基于服务器集群中每台服务器对应的第一信息确定出每台服务器对应的第一区间;获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数;在服务器集群中第一服务器对应的待处理任务的总数未处于第一服务器对应的第一区间的情况下,输出第一提示信息,以提示第一服务器存在任务延迟风险;其中,第一信息表征每个租户对应的服务器在处理历史任务时的数据处理能力;第一区间表征服务器的缓存队列中允许存在的待处理任务的最大总数的区间。上述方案中,基于服务器对历史任务的处理情况确定出对应的第一区间,通过将服务器对应的待处理任务的总数与该服务器对应的第一区间进行比较,可以根据比较结果准确地确定出该服务器是否能够满足计算需求,从而能够准确地确定出服务器是否存在任务延迟风险。
附图说明
图1为本发明实施例提供的任务延迟风险检测方法的实现流程示意图;
图2为本发明实施例提供的任务延迟风险检测方法中确定第一区间的实现流程示意图;
图3为本发明实施例提供的电子设备的结构示意图;
图4为本发明实施例提供的电子设备的硬件组成结构示意图。
具体实施方式
针对一个服务器集群,由于服务器集群每秒处理的最大任务数量TPStotal相对来说是一个定值,可以对服务器集群中每台服务器每秒处理的最大任务数量进行求和得到,因此,在确定出峰值时间用户提交任务的速度TPSjob的情况下,计算出TPStotal与TPSjob之间的差值,判断该差值是否小于设定阈值,在该差值小于设定阈值的情况下,说明服务器集群处理任务的速度大于用户提交任务的速度,服务器集群能够满足租户的计算需求,不存在任务延迟风险;在该差值大于或等于该设定阈值的情况下,说明服务器集群处理任务的速度跟不上用户提交任务的速度,服务器集群不能满足用户的计算需求,存在任务延迟风险。其中,
Figure GDA0003908178430000051
TPSjob表征用户在峰值时间内每秒提交的任务的数量;JOBg表征一天内用户向服务器集群提交的任务总量;φ%表征在峰值时间内处理的任务与总任务量的百分比;θ%表征峰值时间与总时间的百分比。
针对单个任务响应时间短、单位时间内用户提交的任务数量数大的场景下,采用上述方法可以准确地确定出服务器集群是否能够满足计算需求,但是,服务器集群用于处理大数据批量任务时,用户在单位时间内提交的任务数量有限,且单个任务响应时间较长,采用上述方法无法准确地确定出服务器集群是否能够满足计算需求,进而无法准确地确定是否存在任务延迟风险。
为了解决上述技术问题,本发明实施例提供了一种任务延迟风险检测方法,基于服务器集群中每台服务器对应的第一信息确定出每台服务器对应的第一区间;获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数;在服务器集群中第一服务器对应的待处理任务的总数未处于第一服务器对应的第一区间的情况下,输出第一提示信息,以提示第一服务器存在任务延迟风险;其中,第一信息表征每个租户对应的服务器在处理历史任务时的数据处理能力;第一区间表征服务器的缓存队列中允许存在的待处理任务的最大总数的区间。上述方案中,基于服务器对历史任务的处理情况确定出对应的第一区间,通过将服务器对应的待处理任务的总数与该服务器对应的第一区间进行比较,可以根据比较结果准确地确定出该服务器是否能够满足计算需求,从而能够准确地确定出服务器是否存在任务延迟风险。
图1为本发明实施例提供的任务延迟风险检测方法的实现流程示意图,其中,流程的执行主体为终端或服务器等电子设备。如图1示出的,任务延迟风险检测方法包括:
步骤101:获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数。
这里,服务器集群中的每个服务器配置有一个缓存队列,缓存队列用于在服务器没有空闲资源,例如,空闲线程时,将接收到的任务缓存到缓存队列中,以等待资源释放,在释放出空闲资源时,利用释放出的空闲资源处理从缓存队列中取出的任务。
电子设备可以向服务器集群中的每台服务器发送获取请求,以请求获取对应服务器对应的缓存队列中缓存的待处理任务的总数;电子设备接收服务器基于获取请求发送的缓存队列中缓存的待处理任务的总数。
电子设备也可以接收服务器主动上报的缓存队列中缓存的待处理任务的总数。其中,
服务器可以从各自对应的缓存队列中读取待处理任务的总数,并将读取到的待处理任务的总数向电子设备发送;在服务器记录了缓存队列中读取待处理任务的总数的情况下,可以将记录的待处理任务的总数向电子设备发送。
在实际应用中,在检测到服务器集群中的服务器存在负载风险的情况下,通常会下调对应服务器对应的设定并发任务阈值,考虑到在服务器集群中的服务器存在负载风险,并已降低对应服务器对应的设定并发任务阈值的情况下,可能引发任务延迟风险,在一些实施例中,所述从服务器集群中每台服务器对应的缓存队列中,读取每台服务器对应的待处理任务的总数,包括:
在检测到服务器集群中至少一台第二服务器存在设定的负载风险,并已降低所述至少一台第二服务器对应的设定并发任务阈值的情况下,获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数。
这里,电子设备可以通过运行设定脚本,来检测服务器集群中每台服务器是否存在设定的负载风险;在检测到服务器集群中的至少一台第二服务器存在设定的负载风险的情况下,降低对应的第二服务器对应的设定并发任务阈值;在已降低至少一台第二服务器对应的设定并发任务阈值的情况下,获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数,以便电子设备能够基于确定出的待处理任务的总数,确定出对应的服务器是否存在任务延迟风险。其中,设定并发任务阈值是指可处理的并发任务的最大数量;设定的负载风险包括以下至少之一:
租户对应的任务类型发生变更;
耗时长的任务的数量增加;
服务器的负载过高;
执行任务失败。
任务延迟风险包括以下之一:
缓存队列中缓存的待处理任务的总数过大或过小;
任务执行时长超出了允许的设定范围;
任务延迟时间大于设定延迟时间。
步骤102:在所述服务器集群中第一服务器对应的待处理任务的总数未处于所述第一服务器对应的第一区间的情况下,输出第一提示信息;其中,
所述第一提示信息表征所述第一服务器存在任务延迟风险;所述第一区间表征服务器的缓存队列中允许存在的待处理任务的最大总数的区间;所述第一区间基于所述服务器集群中每台服务器对应的第一信息确定出;所述第一信息表征每个租户对应的服务器在处理历史任务时的数据处理能力。
这里,电子设备将获取到的每台服务器对应的待处理任务的总数与对应服务器对应的第一区间进行比较,得到比较结果。在比较结果表征第一服务器对应的待处理任务的总数未处于第一服务器对应的第一区间的情况下,表征第一服务器存在任务延迟风险,输出第一提示信息。其中,
第一服务器是指服务器集群中的任一服务器;第一服务器对应的待处理任务的总数未处于第一服务器对应的第一区间是指,第一服务器对应的待处理任务的总数小于第一服务器对应的第一区间的第一边界值,或者第一服务器对应的待处理任务的总数大于第一服务器对应的第一区间的第二边界值。
需要说明的是,第一区间是在获取服务器对应的缓存队列中缓存的待处理任务的总数之前确定出的。
实际应用时,第一信息至少包括服务器对应的每个租户的历史任务信息;第一信息还可以包括服务器的性能参数。
本发明实施例中,基于服务器对历史任务的处理情况确定出对应的第一区间,通过将服务器对应的待处理任务的总数与该服务器对应的第一区间进行比较,可以根据比较结果准确地确定出该服务器是否能够满足计算需求,从而能够准确地确定出服务器是否存在任务延迟风险,并在服务器存在任务延迟风险的情况下,输出第一提示信息,对任务延迟风险进行预警,以便运维人员进行处理。
图2示出了本发明实施例提供的任务延迟风险检测方法中确定第一区间的实现流程示意图,在一些实施例中,所述第一信息包括每个租户的历史任务信息,所述方法还包括:
步骤201:基于服务器集群中每台服务器对应的每个租户的历史任务信息,确定出每台服务器对应的每个租户的最大任务总量、每台服务器对应的峰值平均处理速度、每个租户对应的服务器的总数和每个租户对应的历史任务的最大设定延迟时间;其中,最大任务总量表征等待处理的历史任务的最大总量;峰值平均处理速度表征任务处理速度的所有峰值的均值。
这里,电子设备可以实时或按照设定时间间隔采集服务器集群中每个服务器对应的每个租户对应的历史任务信息。其中,历史任务信息包括服务器对应的每个租户在不同时刻对应的等待处理的历史任务的总量、服务器在不同时刻对应的任务处理速度、以及每个租户对应的每个历史任务对应的最大设定延迟时间;任务处理速度表征每秒处理的历史任务的数量。
这里,电子设备基于服务器集群中每台服务器对应的每个租户的历史任务信息,确定出服务器与租户之间的对应关系,并基于服务器与租户之间的对应关系,确定出每个租户对应的服务器的总数。
电子设备从服务器对应的每个租户对应的历史任务信息中,确定出服务器对应的每个租户在不同时刻对应的等待处理的历史任务的总量;从服务器对应的每个租户在不同时刻对应的等待处理的历史任务的总量中,确定出服务器对应的每个租户对应的等待处理的历史任务的最大总量,得到该服务器对应的每个租户的最大任务总量。
电子设备从服务器对应的每个租户对应的历史任务信息中,确定出服务器在不同时刻对应的任务处理速度,任务处理速度表征每秒处理的任务的数量;基于服务器在不同时刻对应的任务处理速度,确定出服务器对应的任务处理速度曲线;从服务器对应的任务处理速度曲线中,确定出该服务器对应的任务处理速度的所有峰值;计算该服务器对应的任务处理速度的所有峰值的均值,得到服务器对应的峰值平均处理速度。
历史任务信息包括历史任务对应的最大设定延迟时间,电子设备从服务器对应的每个租户的历史任务信息中,确定出服务器对应的每个租户对应的每个历史任务的最大设定延迟时间。
步骤202:基于所述每台服务器对应的每个租户对应的最大任务总量、所述每台服务器对应的峰值平均处理速度、所述每个租户对应的服务器的总数和确定出的最大设定延迟时间,确定出每台服务器对应的第一区间。
需要说明的是,当一台服务器对应的每个租户对应的每个历史任务的最大设定延迟时间中,存在不同的最大设定延迟时间时,将所有历史任务的最大设定延迟时间中的最小值,确定为该台服务器对应的历史任务的最大设定延迟时间。
考虑到实际应用中存在一个租户对应多台服务器的应用场景,以及多个租户对应多台服务器的应用场景,电子设备在确定出每台服务器对应的每个租户对应的最大任务总量的情况下,基于每个租户对应的服务器,以及基于每台服务器对应的每个租户的最大任务总量,对同一个租户对应的等待处理的历史任务的最大总量进行求和,得到每个租户对应的最大任务积累量。
电子设备基于每台服务器对应的历史任务的最大设定延迟时间、每个租户对应的最大任务积累量、每个租户对应的服务器的总数以及每台服务器对应的峰值平均处理速度,确定出每台服务器对应的第一区间。
实际应用时,电子设备按天统计每个租户对应的最大任务积累量,基于每个租户每天对应的最大任务积累量,确定出每个租户在设定周期内对应的最大任务积累量,采用每个租户在设定周期内对应的最大任务积累量计算该租户对应的服务器对应的第一区间。其中,设定周期的时长大于一天,例如,设定周期可以以周为最小单位,也可以以月为最小单位。
在本实施例中,电子设备可以基于服务器对应的历史任务信息确定出对应的第一区间,通过基于历史任务信息确定出的第一区间,来检测服务器是否存在任务延迟风险,可以提高任务延迟风险的检测结果的准确度。
在一些实施例中,在步骤202中所述基于所述每台服务器对应的每个租户对应的最大任务总量、所述每台服务器对应的峰值平均处理速度、所述每个租户对应的服务器的总数和确定出的最大设定延迟时间,确定出每台服务器对应的第一区间,包括:
基于每个租户对应的服务器的总数和所述每台服务器对应的每个租户对应的最大任务总量,确定出服务器对应的第一区间的第一边界值;
基于所述每台服务器对应的峰值平均处理速度和确定出的最大设定延迟时间,确定出服务器对应的第一区间的第二边界值;所述第一边界值小于所述第二边界值。
这里,电子设备基于每个租户对应的服务器,以及基于每台服务器对应的每个租户的最大任务总量,对同一个租户对应的等待处理的历史任务的最大总量进行求和,得到每个租户对应的最大任务积累量;基于每个租户对应的最大任务积累量和每个租户对应的服务器的总数,计算出每个租户对应的每台服务器平均处理的任务数量,得到该租户对应的每台服务器对应的第一区间的第一边界值,即最小值。
实际应用时,基于以下公式计算每个租户对应的每台服务器对应的第一区间的第一边界值:
Figure GDA0003908178430000101
其中,LBgi表征第g个租户对应的第i台服务器的第一区间的第一边界值;MAXg表征第g个租户对应的最大任务积累量;Ig表征第g个租户对应的服务器的总数。
电子设备将每台服务器对应的所有历史任务的最大设定延迟时间中的最小值,确定为对应服务器对应的历史任务的最大设定延迟时间;基于每台服务器对应的历史任务的最大设定延迟时间和每台服务器对应的峰值平均处理速度,计算出每台服务器对应的第一区间的第二边界值,即最大值。其中,将同一台服务器对应的历史任务的最大设定延迟时间和峰值平均处理速度之间的乘积,确定为该服务器对应的第一区间的第二边界值。
实际应用时,基于以下公式计算出每台服务器对应的第一区间的第二边界值:UBgi=TPSgi×Tbgi;其中,TPSgi表征第g个租户对应的第i台服务器对应的峰值平均处理速度;Tbgi表征第g个租户对应的第i台服务器对应的历史任务的最大设定延迟时间。
本实施例中,在确定出每台服务器对应的第一区间的过程中,不考虑每台服务器的性能差异,可以简化计算第一区间的计算过程,提高计算第一区间的效率。
考虑到服务器集群中每台服务器的性能可能不同,每个租户对应的不同服务器的数据处理能力可能不同,为了更准确地确定出第一区间中的第一边界值,在一些实施例中,所述第一信息还包括服务器的性能参数;所述方法还包括:
基于所述每个租户对应的服务器的总数、每个租户对应的每台服务器的性能参数和所述每台服务器对应的每个租户对应的最大任务总量,确定出服务器对应的第一区间的第一边界值。
这里,电子设备基于每个租户对应的每台服务器的性能参数,确定出每个租户对应的每台服务器的性能权重;电子设备基于每个租户对应的服务器,以及基于每台服务器对应的每个租户的最大任务总量,对同一个租户对应的等待处理的历史任务的最大总量进行求和,得到每个租户对应的最大任务积累量;基于每个租户对应的服务器的总数、每个租户对应的最大任务积累量和每个租户对应的每台服务器的性能权重,确定出每个租户对应的每台服务器对应的第一区间的第一边界值。其中,性能参数包括服务器的处理器的参数和/或服务器的内存的参数。
在一些实施例中,电子设备可以从每个租户对应的所有服务器中,确定一台基准服务器;基于该租户对应的基准服务器的第一性能参数与非基准服务器的第二性能参数,确定出非基准服务器的性能权重。其中,可以基于第二性能参数与第一性能参数之间的比值,确定出基准服务器的性能权重与非基准服务器的性能权重之间的比值。
实际应用时,采用以下公式计算出每个租户对应的每台服务器对应的第一区间的第一边界值:
Figure GDA0003908178430000121
其中,Cgk表征第g个租户对应的第k台服务器的性能权重;Cgi表征第g个租户对应的第i台服务器的的性能权重。
示例性地,在某个租户对应3台服务器,且服务器1的性能权重为C1,服务器2的性能权重为1.5C1,服务器3的性能权重为C1的情况下,该租户对应的服务器1对应的
Figure GDA0003908178430000122
需要说明的是,不管服务器集群中每台服务器的性能是否相同,计算服务器对应的第一区间的第二边界值的方法不变。也就是说,不管第一信息是否包括服务器的性能参数,计算服务器对应的第一区间的第二边界值的方法相同。
考虑到服务器对应的第一区间会随着处理的任务类型和任务数量等因素的变化而变化,为了提高任务延迟风险的检测结果的准确度,在一些实施例中,所述方法还包括:
通过执行定时任务,更新每台服务器对应的第一区间。
这里,定时任务用于触发电子设备定时更新服务器对应的第一区间。
在实际应用中,电子设备通过执行定时任务,重新计算每台服务器对应的第一区间的第一边界值和第二边界值;基于重新计算出的第一区间的第一边界值和第二边界值,对对应的服务器当前对应的第一区间进行更新。
本实施例中,定时更新第一区间,可以定时基于服务器最新的任务处理能力来评估服务器是否存在任务延迟风险,可以提高任务延迟风险的检测结果的准确度。
在一些实施例中,所述方法还包括:
在所述服务器集群中第一服务器对应的待处理任务的总数未处于所述第一服务器对应的第一区间的情况下,输出第一租户对应的待新增的服务器的数量;其中,所述第一租户为所述第一服务器对应的租户。
这里,电子设备在检测到第一租户对应的服务器中的第一服务器对应的待处理任务的总数未处于第一服务器对应的第一区间的情况下,确定出在消除任务延迟风险的情况下,第一租户对应的待新增的服务器的数量,并输出第一租户对应的待新增的服务器的数量。
本实施例中,电子设备在检测到第一服务器对应的待处理任务的总数未处于第一服务器对应的第一区间的情况下,可以输出消除任务延迟风险时租户对应的需要新增的服务器的数量,以便运维人员对服务器集群进行扩容;相对于运维人员基于个人经验确定需要新增的服务器的数据的方法,可以减少因对服务器集群进行扩容后仍然无法满足计算需求,需要再次进行扩容的情况发生。
为了输出准确的第一租户对应的待新增的服务器的数量,以减少对服务器集群扩容后仍无法满足计算需求而频繁扩容的情况,在一些实施例中,所述方法还包括:
基于第一参数确定出所述第一租户对应的待新增的服务器的数量;其中,
所述第一参数包括:
所述第一租户对应的每台服务器对应的待处理任务的总数;
所述第一租户对应的每台服务器对应的第一区间的至少一个边界值;
所述第一租户对应的服务器的总数。
为了提高服务器集群的稳定性,为服务器的第一区间设置冗余值Cr;在一些实施例中,所述第一参数还包括:
所述第一区间对应的设定冗余值。
这里,当服务器的待处理任务的总数小于该服务器对应的第一区间的第一边界值时,会导致峰值时间资源紧张,从而导致任务延迟,甚至出现租户提交的任务被服务器拒绝;当服务器的待处理任务的总数大于该服务器对应的第一区间的第二边界值时,会导致峰值时间缓存队列中的待处理任务过多,对于每个新提交的任务必须等待的时间过长,造成批量延误;故,在服务器的待处理任务的总数未处于该服务器对应的第一区间的情况下,均存在任务延迟风险,需要在服务器集群中增加该服务器对应的租户所对应的服务器的数量,以消除任务延迟风险。
实际应用时,在未获取到第一区间对应的设定冗余值的情况下,电子设备在确定出第一服务器存在任务延迟风险的情况下,基于服务器与租户之间的对应关系,确定出第一服务器对应的第一租户,以及确定出第一租户对应的所有服务器;基于第一租户对应的每台服务器对应的待处理任务的总数、第一租户对应的每台服务器对应的第一区间的至少一个边界值、第一租户对应的服务器的总数,确定出第一租户对应的待新增的服务器的数量。
在获取到第一区间对应的设定冗余值的情况下,电子设备基于服务器对应的第一区间的至少一个边界值、第一区间对应的设定冗余值以及服务器的待处理任务的总数,来确定服务器是否存在任务延迟风险。其中,在服务器的待处理任务的总数小于或等于对应的第一区间的第一边界值与设定冗余值之和的情况下,或者在服务器的待处理任务的总数大于或等于对应的第一区间的第二边界值与设定冗余值之差的情况下,表征该服务器当前存在任务延迟风险。即,
在Cjb≤LB+Cr的情况下,或者在Cjb≥UB-Cr的情况下,服务器存在任务延迟风险。其中,Cjb表征服务器的待处理任务的总数;LB表征服务器对应的第一区间的第一边界值;Cr表征第一区间的设定冗余值;UB表征服务器对应的第一区间的第二边界值。
在实际应用中,针对不同的场景,确定第一租户对应的待新增的服务器的数量的方法不同,下面分别介绍在服务器之间存在性能差异,以及不存在性能差异的情况下,确定第一租户对应的待新增的服务器的数量的实现过程:
在服务器对应的第一信息中不包括服务器的性能参数的情况下,不需要考虑服务器之间的性能差异,通过以下方法确定第一租户对应的待新增的服务器的数量:
在未设置第一区间的冗余值的情况下,当第一服务器对应的待处理任务的总数小于第一服务器对应的第一区间的第一边界值时,基于第一服务器对应的第一区间的第一边界值、第一租户对应的服务器的总数以及第一服务器对应的待处理任务的总数,确定出第一租户对应的待新增的服务器的数量。实际应用时,电子设备计算第一服务器对应的第一区间的第一边界值与第一服务器对应的待处理任务的总数之间的第一差值,计算该第一差值与第一租户对应的服务器的总数之间的乘积,基于该乘积与第一服务器对应的待处理任务的总数之间的商,确定出第一租户对应的待新增的服务器的数量。即,通过公式
Figure GDA0003908178430000151
计算第一租户对应的待新增的服务器的数量;I为第一租户对应的服务器的总数;n表征第一租户对应的待新增的服务器的数量;Cjb表征第一服务器对应的待处理任务的总数。
在未设置第一区间的冗余值的情况下,当第一服务器对应的待处理任务的总数大于第一服务器对应的第一区间的第二边界值时,基于第一服务器对应的第一区间的第一边界值和第二边界值,重新计算出第一服务器对应的待处理任务的总数;基于第一服务器对应的第一区间的第一边界值、第一租户对应的服务器的总数以及重新计算出的第一服务器对应的待处理任务的总数,确定出第一租户对应的待新增的服务器的数量。实际应用时,通过公式
Figure GDA0003908178430000152
计算第一租户对应的待新增的服务器的数量,其中,
Figure GDA0003908178430000153
在设置了第一区间的冗余值的情况下,当第一服务器的待处理任务的总数小于或等于对应的第一区间的第一边界值与设定冗余值之和时,基于第一服务器对应的第一区间的第一边界值、第一区间对应的设定冗余值、第一租户对应的服务器的总数以及第一服务器对应的待处理任务的总数,确定出第一租户对应的待新增的服务器的数量。实际应用时,电子设备基于公式
Figure GDA0003908178430000161
计算第一租户对应的待新增的服务器的数量。
在设置了第一区间的冗余值的情况下,当第一服务器对应的待处理任务的总数大于或等于对应的第一区间的第二边界值与设定冗余值之差时,基于第一服务器对应的第一区间的第一边界值和第二边界值,重新计算出第一服务器对应的待处理任务的总数;基于第一服务器对应的第一区间的第一边界值、第一区间对应的设定冗余值、第一租户对应的服务器的总数以及重新计算出的第一服务器对应的待处理任务的总数,确定出第一租户对应的待新增的服务器的数量。实际应用时,通过公式
Figure GDA0003908178430000162
计算第一租户对应的待新增的服务器的数量;其中,/>
Figure GDA0003908178430000163
在服务器对应的第一信息中包括服务器的性能参数的情况下,需要考虑服务器之间的性能差异,通过以下方法确定第一租户对应的待新增的服务器的数量:
在未设置第一区间的冗余值的情况下,当第一服务器对应的待处理任务的总数小于第一服务器对应的第一区间的第一边界值时,基于第一服务器对应的第一区间的第一边界值和第二边界值、第一租户对应的服务器的总数以及第一租户对应的每台服务器对应的待处理任务的总数,确定出第一租户对应的待新增的服务器的数量。实际应用时,电子设备通过公式(1)和公式(2)确定出第一租户对应的待新增的服务器的数量:
Figure GDA0003908178430000164
LBk≤Cjbk≤UBk (2)
其中,
Figure GDA0003908178430000165
表征扩容后第一租户对应的每台服务器对应的待处理任务的总数之和;/>
Figure GDA0003908178430000171
表征扩容前第一租户对应的每台服务器对应的第一区间的第一边界值与对应的待处理任务的总数之间的差值的总和;Cjbi表征扩容前第一租户对应的第i台服务器对应的待处理任务的总数;Cjbk表征第k台服务器对应的待处理任务的总数;LBk表征第k台服务器对应的第一区间的第一边界值;UBk表征第k台服务器对应的第一区间的第二边界值。
在未设置第一区间的冗余值的情况下,当第一服务器对应的待处理任务的总数大于或等于对应的第一区间的第二边界值与设定冗余值之差时,基于第一租户对应的每台服务器对应的第一区间的第一边界值和第二边界值,重新计算出第一租户对应的每台服务器对应的待处理任务的总数;基于第一租户对应的每台服务器对应的第一区间的第一边界值和第二边界值、第一租户对应的服务器的总数以及重新计算出的第一租户对应的每台服务器对应的待处理任务的总数,确定出第一租户对应的待新增的服务器的数量。实际应用时,电子设备基于以下公式(3)至公式(5),确定出第一租户对应的待新增的服务器的数量:
Figure GDA0003908178430000172
LBk≤Cjbk≤UBk (4)
Figure GDA0003908178430000173
在设置了第一区间的冗余值的情况下,当第一服务器的待处理任务的总数小于或等于对应的第一区间的第一边界值与设定冗余值之和时,基于第一服务器对应的第一区间的第一边界值和第二边界值、第一租户对应的服务器的总数、第一租户对应的每台服务器对应第一区间对应的设定冗余值、以及第一租户对应的每台服务器对应的待处理任务的总数,确定出第一租户对应的待新增的服务器的数量。实际应用时,电子设备通过公式(1)′和公式(2)确定出第一租户对应的待新增的服务器的数量,其中,公式(1)′如下:
Figure GDA0003908178430000174
其中,Cri表征在第i台服务器对应的第一区间的设定冗余值。
在设置了第一区间的冗余值的情况下,当第一服务器对应的待处理任务的总数大于或等于对应的第一区间的第二边界值与设定冗余值之差时,基于第一租户对应的每台服务器对应的第一区间的第一边界值和第二边界值,重新计算出第一租户对应的每台服务器对应的待处理任务的总数;基于第一租户对应的每台服务器对应的第一区间的第一边界值和第二边界值、第一租户对应的每台服务器对应的第一区间对应的设定冗余值、第一租户对应的服务器的总数以及重新计算出的第一租户对应的每台服务器对应的待处理任务的总数,确定出第一租户对应的待新增的服务器的数量。实际应用时,电子设备基于以下公式(3)′、公式(4)和公式(5),确定出第一租户对应的待新增的服务器的数量,其中,公式(3)′如下:
Figure GDA0003908178430000181
为实现本发明实施例的方法,本发明实施例还提供了一种服务器,如图3所示,该电子设备包括:
获取单元31,用于获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数;
提示单元32,用于在所述服务器集群中第一服务器对应的待处理任务的总数未处于所述第一服务器对应的第一区间的情况下,输出第一提示信息;其中,
所述第一提示信息表征所述第一服务器存在任务延迟风险;所述第一区间表征服务器的缓存队列中允许存在的待处理任务的最大总数的区间;所述第一区间基于所述服务器集群中每台服务器对应的第一信息确定出;所述第一信息表征每个租户对应的服务器在处理历史任务时的数据处理能力。
在一些实施例中,获取单元31用于:
在检测到服务器集群中至少一台第二服务器存在设定的负载风险,并已降低所述至少一台第二服务器对应的设定并发任务阈值的情况下,获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数。
在一些实施例中,所述第一信息包括每个租户的历史任务信息;该电子设备还包括:
第一确定单元,用于基于服务器集群中每台服务器对应的每个租户的历史任务信息,确定出每台服务器对应的每个租户的最大任务总量、每台服务器对应的峰值平均处理速度、每个租户对应的服务器的总数和每个租户对应的历史任务的最大设定延迟时间;其中,最大任务总量表征等待处理的历史任务的最大总量;峰值平均处理速度表征任务处理速度的所有峰值的均值;
第二确定单元,用于基于所述每台服务器对应的每个租户对应的最大任务总量、所述每台服务器对应的峰值平均处理速度、所述每个租户对应的服务器的总数和确定出的最大设定延迟时间,确定出每台服务器对应的第一区间。
在一些实施例中,所述第二确定单元具体用于:
基于每个租户对应的服务器的总数和所述每台服务器对应的每个租户对应的最大任务总量,确定出服务器对应的第一区间的第一边界值;
基于所述每台服务器对应的峰值平均处理速度和确定出的最大设定延迟时间,确定出服务器对应的第一区间的第二边界值;所述第一边界值小于所述第二边界值。
在一些实施例中,所述第一信息还包括服务器的性能参数;所述第二确定单元还用于:基于所述每个租户对应的服务器的总数、每个租户对应的每台服务器的性能参数和所述每台服务器对应的每个租户对应的最大任务总量,确定出服务器对应的第一区间的第一边界值。
在一些实施例中,该电子设备还包括:
更新单元,用于通过执行定时任务,更新每台服务器对应的第一区间。
在一些实施例中,该电子设备还包括:
输出单元,用于在所述服务器集群中第一服务器对应的待处理任务的总数未处于所述第一服务器对应的第一区间的情况下,输出第一租户对应的待新增的服务器的数量;其中,所述第一租户为所述第一服务器对应的租户。
在一些实施例中,该电子设备还包括:
第三确定单元,用于基于第一参数确定出所述第一租户对应的待新增的服务器的数量;其中,
所述第一参数包括:
所述第一租户对应的每台服务器对应的待处理任务的总数;
所述第一租户对应的每台服务器对应的第一区间的至少一个边界值;
所述第一租户对应的服务器的总数。
在一些实施例中,所述第一参数还包括:
所述第一区间对应的设定冗余值。
实际应用时,上述各单元可由电子设备中的处理器,比如中央处理器(CPU,Central Processing Unit)、数字信号处理器(DSP,Digital Signal Processor)、微控制单元(MCU,Microcontroller Unit)或可编程门阵列(FPGA,Field-Programmable GateArray)等实现。当然,处理器需要运行存储器中存储的程序来实现上述各程序模块的功能。
需要说明的是:上述实施例提供的电子设备在进行任务延迟风险检测时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的电子设备与任务延迟风险检测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
基于上述程序模块的硬件实现,且为了实现本发明实施例的方法,本发明实施例还提供了一种电子设备。图4为本发明实施例电子设备的硬件组成结构示意图,如图4所示,电子设备4包括:
通信接口41,能够与其它设备比如网络设备等进行信息交互;
处理器42,与所述通信接口41连接,以实现与其它设备进行信息交互,用于运行计算机程序时,执行上述一个或多个技术方案提供的任务延迟风险检测方法。而所述计算机程序存储在存储器43上。
当然,实际应用时,电子设备4中的各个组件通过总线系统44耦合在一起。可理解,总线系统44用于实现这些组件之间的连接通信。总线系统44除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图4中将各种总线都标为总线系统44。
本发明实施例中的存储器43用于存储各种类型的数据以支持电子设备4的操作。这些数据的示例包括:用于在电子设备4上操作的任何计算机程序。
可以理解,存储器43可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本发明实施例描述的存储器43旨在包括但不限于这些和任意其它适合类型的存储器。
上述本发明实施例揭示的方法可以应用于处理器42中,或者由处理器42实现。处理器42可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器42中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器42可以是通用处理器、DSP,或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器42可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器43,处理器42读取存储器43中的程序,结合其硬件完成前述方法的步骤。
可选地,所述处理器42执行所述程序时实现本发明实施例的各个方法中由终端实现的相应流程,为了简洁,在此不再赘述。
在示例性实施例中,本发明实施例还提供了一种存储介质,即计算机存储介质,具体为计算机可读存储介质,例如包括存储计算机程序的第一存储器43,上述计算机程序可由终端的处理器42执行,以完成前述方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种任务延迟风险检测方法,其特征在于,包括:
获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数;
在所述服务器集群中第一服务器对应的待处理任务的总数未处于所述第一服务器对应的第一区间的情况下,输出第一提示信息以及输出第一租户对应的待新增的服务器的数量;其中,
所述第一提示信息表征所述第一服务器存在任务延迟风险;所述第一区间表征服务器的缓存队列中允许存在的待处理任务的最大总数的区间;所述第一区间基于所述服务器集群中每台服务器对应的第一信息确定出;所述第一信息表征每个租户对应的服务器在处理历史任务时的数据处理能力;所述第一信息至少包括服务器对应的每个租户的历史任务信息,所述第一信息还包括服务器的性能参数;所述第一租户为所述第一服务器对应的租户。
2.根据权利要求1所述的方法,其特征在于,所述第一信息包括每个租户的历史任务信息;所述方法还包括:
基于服务器集群中每台服务器对应的每个租户的历史任务信息,确定出每台服务器对应的每个租户的最大任务总量、每台服务器对应的峰值平均处理速度、每个租户对应的服务器的总数和每个租户对应的历史任务的最大设定延迟时间;其中,最大任务总量表征等待处理的历史任务的最大总量;峰值平均处理速度表征任务处理速度的所有峰值的均值;
基于所述每台服务器对应的每个租户对应的最大任务总量、所述每台服务器对应的峰值平均处理速度、所述每个租户对应的服务器的总数和确定出的最大设定延迟时间,确定出每台服务器对应的第一区间。
3.根据权利要求2所述的方法,其特征在于,所述基于所述每台服务器对应的每个租户对应的最大任务总量、所述每台服务器对应的峰值平均处理速度、所述每个租户对应的服务器的总数和确定出的最大设定延迟时间,确定出每台服务器对应的第一区间,包括:
基于每个租户对应的服务器的总数和所述每台服务器对应的每个租户对应的最大任务总量,确定出服务器对应的第一区间的第一边界值;
基于所述每台服务器对应的峰值平均处理速度和确定出的最大设定延迟时间,确定出服务器对应的第一区间的第二边界值;所述第一边界值小于所述第二边界值。
4.根据权利要求3所述的方法,其特征在于,所述第一信息还包括服务器的性能参数;所述方法还包括:
基于所述每个租户对应的服务器的总数、每个租户对应的每台服务器的性能参数和所述每台服务器对应的每个租户对应的最大任务总量,确定出服务器对应的第一区间的第一边界值。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
通过执行定时任务,更新每台服务器对应的第一区间。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于第一参数确定出所述第一租户对应的待新增的服务器的数量;其中,
所述第一参数包括:
所述第一租户对应的每台服务器对应的待处理任务的总数;
所述第一租户对应的每台服务器对应的第一区间的至少一个边界值;
所述第一租户对应的服务器的总数。
7.根据权利要求6所述的方法,其特征在于,所述第一参数还包括:
所述第一区间对应的设定冗余值。
8.根据权利要求1至4任一项所述的方法,其特征在于,所述获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数,包括:
在检测到服务器集群中至少一台第二服务器存在设定的负载风险,并已降低所述至少一台第二服务器对应的设定并发任务阈值的情况下,获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数。
9.一种电子设备,其特征在于,包括:
获取单元,用于获取服务器集群中每台服务器对应的缓存队列中缓存的待处理任务的总数;
提示单元,用于在所述服务器集群中第一服务器对应的待处理任务的总数未处于所述第一服务器对应的第一区间的情况下,输出第一提示信息以及输出第一租户对应的待新增的服务器的数量;其中,
所述第一提示信息表征所述第一服务器存在任务延迟风险;所述第一区间表征服务器的缓存队列中允许存在的待处理任务的最大总数的区间;所述第一区间基于所述服务器集群中每台服务器对应的第一信息确定出;所述第一信息表征每个租户对应的服务器在处理历史任务时的数据处理能力;所述第一信息至少包括服务器对应的每个租户的历史任务信息,所述第一信息还包括服务器的性能参数;所述第一租户为所述第一服务器对应的租户。
10.一种电子设备,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,
其中,所述处理器用于运行所述计算机程序时,执行权利要求1至8任一项所述的方法的步骤。
CN202110644030.6A 2021-06-09 2021-06-09 任务延迟风险检测方法、电子设备及存储介质 Active CN113326170B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110644030.6A CN113326170B (zh) 2021-06-09 2021-06-09 任务延迟风险检测方法、电子设备及存储介质
PCT/CN2021/136007 WO2022257389A1 (zh) 2021-06-09 2021-12-07 任务延迟风险检测方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110644030.6A CN113326170B (zh) 2021-06-09 2021-06-09 任务延迟风险检测方法、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113326170A CN113326170A (zh) 2021-08-31
CN113326170B true CN113326170B (zh) 2023-06-09

Family

ID=77420339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110644030.6A Active CN113326170B (zh) 2021-06-09 2021-06-09 任务延迟风险检测方法、电子设备及存储介质

Country Status (2)

Country Link
CN (1) CN113326170B (zh)
WO (1) WO2022257389A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326170B (zh) * 2021-06-09 2023-06-09 深圳前海微众银行股份有限公司 任务延迟风险检测方法、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104954184A (zh) * 2015-06-15 2015-09-30 四川长虹电器股份有限公司 云端后台服务器集群的监控、告警方法及系统
CN109800975A (zh) * 2018-12-29 2019-05-24 亚信科技(中国)有限公司 一种资源评估方法、装置、计算机设备和存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0969367A3 (en) * 1998-05-28 2001-07-11 Compaq Computer Corporation System and method used in a computer system for distributing tasks between multiprocessing I/O subsystems
CN1214666C (zh) * 2003-04-07 2005-08-10 华为技术有限公司 位置业务中限制位置信息请求流量的方法
CN104252347A (zh) * 2013-06-27 2014-12-31 鸿富锦精密工业(深圳)有限公司 任务等待时间处理系统及方法
CN109032779B (zh) * 2018-07-09 2020-11-24 广州酷狗计算机科技有限公司 任务处理方法、装置、计算机设备及可读存储介质
CN109343941B (zh) * 2018-08-14 2023-02-21 创新先进技术有限公司 任务处理方法、装置、电子设备及计算机可读存储介质
WO2020252614A1 (en) * 2019-06-17 2020-12-24 Beijing Voyager Technology Co., Ltd. Systems and methods for data processing
CN110554916B (zh) * 2019-07-31 2022-07-29 苏宁云计算有限公司 基于分布式集群的风险指标计算方法及装置
CN113326170B (zh) * 2021-06-09 2023-06-09 深圳前海微众银行股份有限公司 任务延迟风险检测方法、电子设备及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104954184A (zh) * 2015-06-15 2015-09-30 四川长虹电器股份有限公司 云端后台服务器集群的监控、告警方法及系统
CN109800975A (zh) * 2018-12-29 2019-05-24 亚信科技(中国)有限公司 一种资源评估方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
WO2022257389A1 (zh) 2022-12-15
CN113326170A (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
CN110996352B (zh) 一种流量控制方法、装置、计算机设备及存储介质
CN111367651B (zh) 服务限流系统、方法、装置及电子设备
CN110196767B (zh) 服务资源控制方法、装置、设备和存储介质
CN113326170B (zh) 任务延迟风险检测方法、电子设备及存储介质
CN111475108A (zh) 一种分布式存储方法、计算机设备及计算机可读存储介质
CN112506950A (zh) 数据聚合处理方法、计算节点、计算集群及存储介质
CN111124315A (zh) 一种数据处理方法、装置、电子设备及存储介质
US9983911B2 (en) Analysis controller, analysis control method and computer-readable medium
CN111782378B (zh) 自适应性的处理性能调整方法、服务器及可读存储介质
CN111159009B (zh) 一种日志服务系统的压力测试方法及装置
CN110750498A (zh) 对象访问方法、装置及存储介质
CN115499513A (zh) 数据请求的处理方法、装置、计算机设备和存储介质
CN113220429B (zh) Java线程池的任务处理方法、装置、设备和介质
KR101674324B1 (ko) 실시간 제어 응용에 적용되는 태스크 스케쥴링 장치 및 방법
US11822973B2 (en) Operation fencing system
CN111858019B (zh) 任务调度方法、装置及计算机可读存储介质
US20100174873A1 (en) Priority Promotion for Service Requests
CN116450367B (zh) 数据处理方法、装置、设备及存储介质
CN113448708B (zh) 异步等待时长优化方法、装置、计算机设备和存储介质
CN115150400B (zh) 服务故障的处理方法、装置、云服务平台和存储介质
CN116528300B (zh) 任务下发方法、装置、系统及通信设备
US20230289273A1 (en) Thermal throttling supression device, thermal throttling supression method, and thermal throttling suppression program
CN109474543B (zh) 一种队列资源管理方法、装置及存储介质
US20220083533A1 (en) Performing Operations based on Distributedly Stored Data
CN118035514A (zh) 基于区块链系统的敏感信息过滤方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant