CN110413482B - 检测方法和装置 - Google Patents

检测方法和装置 Download PDF

Info

Publication number
CN110413482B
CN110413482B CN201910693655.4A CN201910693655A CN110413482B CN 110413482 B CN110413482 B CN 110413482B CN 201910693655 A CN201910693655 A CN 201910693655A CN 110413482 B CN110413482 B CN 110413482B
Authority
CN
China
Prior art keywords
training
historical
service load
key
data center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910693655.4A
Other languages
English (en)
Other versions
CN110413482A (zh
Inventor
葛峥
赵琪琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN201910693655.4A priority Critical patent/CN110413482B/zh
Publication of CN110413482A publication Critical patent/CN110413482A/zh
Application granted granted Critical
Publication of CN110413482B publication Critical patent/CN110413482B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents

Abstract

本公开提供了一种检测方法,该方法包括:获取数据中心当前的业务负载量;基于该业务负载量,预测关键指标的数值范围,该关键指标用于表征数据中心的资源开销状况;获取关键指标的实际值;确定实际值是否在数值范围内,以检测数据中心是否出现异常。本公开还提供了一种检测装置、一种电子设备以及一种计算机可读存储介质。

Description

检测方法和装置
技术领域
本公开涉及计算机技术领域,特别是涉及一种检测方法和装置。
背景技术
数据中心是金融业经营的心脏,其正常运行与否,直接影响着业务运行成功率,甚至关系着整个企业的生死存亡。运维是数据中心最为重要的工作,通过监控和分析整个数据中心的运转情况,保障数据中心良好运转。
数据中心涉及的系统繁多,其系统指标也是成千上万,每个指标的异常情况,都可能影响着系统的正常运行。因此,如何快速监控并定位数据中心的异常情况,是运维工作人员的首要任务和重要挑战。
目前,数据中心各系统指标的监控与分析大多处于人工化、非智能化的状态,并呈现阈值固定、形式单一、覆盖不全面等特点,严重影响着监控的有效性和时效性。
发明内容
本公开的一个方面提供了一种检测方法方法,包括:获取数据中心当前的业务负载量;基于上述业务负载量,预测关键指标的数值范围,上述关键指标用于表征上述数据中心的资源开销状况;获取上述关键指标的实际值;以及确定上述实际值是否在上述数值范围内,以检测上述数据中心是否出现异常。
可选地,上述基于上述业务负载量,预测关键指标的数值范围,包括:获取预测模型;以及将上述业务负载量输入上述预测模型,以预测上述关键指标的上述数值范围。
可选地,上述方法还包括:训练上述预测模型,该操作包括:获取训练数据集,上述训练数据集中包含第一历史业务负载量以及对应的上述关键指标的第一历史值;以及利用上述第一历史业务负载量和上述第一历史值训练上述预测模型。
可选地,上述方法还包括:获取测试数据集,上述测试数据集中包含第二历史业务负载量以及对应的上述关键指标的第二历史值;将上述第二历史业务负载量输入上述预测模型得到输出值;以及比较上述输出值与上述第二历史值,以优化上述预测模型。
可选地,上述训练上述预测模型,包括:离线训练上述预测模型。
可选地,上述业务负载量包括以下中的至少之一:柜面交易量、ATM交易量、个人网银交易量和手机银行交易量。
可选地,上述基于上述业务负载量,预测关键指标的数值范围,包括:基于交易类型将上述业务负载量转换为交易率配比向量;以及基于上述交易率配比向量预测上述关键指标的数值范围。
本公开的另一个方面提供了一种检测装置,包括:第一获取模块,用于获取数据中心当前的业务负载量;预测模块,用于基于上述业务负载量,预测关键指标的数值范围,上述关键指标用于表征上述数据中心的资源开销状况;第二获取模块,用于获取上述关键指标的实际值;以及确定模块,用于确定上述实际值是否在上述数值范围内,以检测上述数据中心是否异常。
本公开的另一方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现上述根据本公开实施例的方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,上述指令在被执行时用于实现根据本公开实施例上述的方法。
本公开的另一方面提供了一种计算机程序,上述计算机程序包括计算机可执行指令,上述指令在被执行时用于实现根据本公开实施例上述的方法。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了根据本公开实施例的适于检测方法和装置的系统架构;
图2示意性示出了根据本公开实施例的检测方法的流程图;
图3示意性示出了根据本公开实施例的基于业务负载量预测关键指标的数值范围的流程图;
图4示意性示出了根据本公开实施例的预测模型训练方法的流程图;
图5示意性示出了根据本公开实施例的预测模型优化方法的流程图;
图6示意性示出了根据本公开实施例的检测装置的框图;以及
图7示意性示出了根据本公开实施例的电子设备的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。
当前系统指标监控具有以下局限性。
第一,普适性不足。当前指标监控策略因未考虑环境差异,当系统变更或业务调整时会出现监控阈值不适用的问题,需要人为更新阈值,增加运维工作量和风险。
第二,自适性不足。当前系统监控策略因未考虑时间因素而设置了固定阈值,监控策略无法通过动态调整来自适应系统。这样,当系统长期运行时,监控漏洞日积月累后会暴露出不适应的缺点。
第三,关联性不足。当前指标监控策略因忽略多指标间的关联影响,仅单一维度考虑某一指标的影响,易造成大量监控误报情况,进而影响系统异常的根因分析。
本公开的实施例提供了一种检测方法以及能够应用该方法的检测装置。该方法例如可以包括以下操作。获取数据中心当前的业务负载量。基于该业务负载量,预测关键指标的数值范围,该关键指标例如可以用于表征所述数据中心的资源开销状况。获取关键指标的实际值。确定该实际值是否在数值范围内,以检测数据中心是否出现异常。
图1示意性示出了根据本公开实施例的适于检测方法及装置的系统架构。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括监控设备101、102、103,网络104和服务器105。网络104用于在监控设备101、102、103和服务器105之间提供通信链路。
监控设备101、102、103例如可以是服务器。监控设备101、102、103可以用于采集数据中心的业务负载量及关键指标的实际值(如CPU、IO、磁盘等的实际消耗)。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。服务器105可以是提供数据中心异常检测的服务器。根据本公开实施例,服务器105通过网络104获取监控设备101、102、103采集的数据中心当前的业务负载量,基于该业务负载量,预测关键指标的数值范围,该关键指标用于表征数据中心的资源开销状况。服务器105获取监控设备101、102、103采集的该关键指标的实际值,并确定实际值是否在预测的数值范围内,以检测数据中心是否出现异常。
需要说明的是,本公开实施例所提供的检测方法可以由服务器105执行。相应地,本公开实施例所提供的检测装置可以设置于服务器105中。或者,本公开实施例所提供的检测方法也可以由不同于服务器105且能够与监控设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的检测装置也可以设置于不同于服务器105且能够与监控设备101、102、103和/或服务器105通信的服务器或服务器集群中。或者,本公开实施例所提供的存储设备也可以部分由服务器105执行,部分由监控设备101、102、103执行。相应的,本公开实施例所提供的检测装置也可以部分设置于服务器105中,部分设置于监控设备101、102、103中。
应该理解,图1中的监控设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的监控设备、网络和服务器。
图2示意性示出了根据本公开实施例的检测方法的流程图。
如图2所示,本公开实施例的检测方法例如可以包括操作S210~操作S240。
在操作S210,获取数据中心当前的业务负载量。
业务负载量是数据中心系统的重要指标,是系统整体健康程度的直观体现。当业务负载量较低时,系统资源开销较少,系统CPU、IO等指标处于低位。当业务负载量较高时,系统资源开销较多,系统CPU、IO等指标处于高位。因此,系统的业务负载波动,将直接影响系统关键指标的波动,可作为系统健康度监控的直接诱因。
系统联机时段业务负载量主要来源于交易。根据本公开实施例,业务负载量例如可以是柜面交易量、ATM交易量、个人网银交易量和手机银行交易量中的至少一个。
由于业务负载量随着环境及业务场景的变化而变化,因此可以实时获取数据中心的业务负载量。具体地,该业务负载量例如可以通过监控设备(Application Monitor andControl,AMC)实时获取。
在操作S220,基于业务负载量,预测关键指标的数值范围,该关键指标用于表征数据中心的资源开销状况。
由于系统联机时段负载主要来源于交易,交易配比决定了系统关键指标的数据。因此可以通过交易与系统关键指标的关系模型,求解任意交易场景下系统关键指标的数值范围,该数值范围表示的是数据中心无异常时对应的关键指标的数值范围。
在操作S230,获取关键指标的实际值。
根据本公开实施例,该实际值例如可以从主机资源监控组件(Resource MonitorFacility,RMF)中实时获取。
在操作S240,确定实际值是否在数值范围内,以检测数据中心是否出现异常。
根据本公开实施例,由于预测关键指标的数值范围表征数据中心无异常情况,即正常运行状态。因此,若获取的关键指标的实际值落在预测所得的数值范围内,则表明数据中心无异常情况。应该理解,在本公开实施例中,该预测关键指标的数值范围可作为指标监控的阈值。
通过本公开实施例,由于采用了实时获取数据中心的业务负载量的技术手段,因此充分考虑了环境差异及业务场景差异等因数对关键指标的影响,使得预测的关键指标的数值范围(指标监控的阈值)具有自适应性,可以提高异常检测的有效性。
图3示意性示出了根据本公开实施例的基于业务负载量预测关键指标的数值范围的流程图。
如图3所示,本公开实施例的操作S220即基于业务负载量预测关键指标的数值范围例如可以包括操作S221~操作S222。
在操作S221,获取预测模型,该预测模型为根据历史数据训练得到。
在操作S222,将业务负载量输入预测模型,以预测关键指标的数值范围。
根据本公开实施例,该预测模型可以基于输入的业务负载量,输出对应的关键指标的数值范围,作为关键指标的预测值。应该理解,在本公开实施例中,该预测模型能够体现系统正常运行状态下,各业务负载量与关键指标的关联关系,因此可以将预测模型输出的预测值作为指标监控阈值,用来进行关键指标异常检测。
在本公开实施例中,还可以基于交易类型将各业务负载量转换为交易率配比向量,从而基于交易率配比向量预测关键指标的数值范围。
在本公开实施例中,通过该预测模型预测关键指标的数值范围时,实际使用的是实时获取的业务负载量。
通过本公开实施例,使用实时数据在线预测关键指标的数值范围,用以对数据中心关键指标进行实时监控,从而可以有效提高异常检测的时效性。
图4示意性示出了根据本公开实施例的预测模型训练方法的流程图。
如图4所示,本公开实施例的预测模型训练方法例如可以包括操作S410~操作S420。
在操作S410,获取训练数据集,该训练数据集中包含第一历史业务负载量以及对应的关键指标的第一历史值。
在本公开实施例中,例如可以获取历史业务负载量以及对应的关键指标的历史值,并将获取的数据作为训练数据。具体地,该关键指标的历史值可以从分布式处理平台的数据总线Kafka中获取。历史业务负载量可从Oracle数据库中获取。为便于后续模型训练,可对数据进行数据量化及数据抽取处理。数据量化的主要操作包括将业务负载量按照交易类型进行拆解量化,形成交易率配比向量其中t表示时间(颗粒度为分钟),n表示交易类型数目。同时,同步采集相同时间维度上的关键指标/>其中t表示时间,m表示关键指标数目。量化后的交易率和系统关键指标统一存入数据库HBase中。数据抽取的主要作用是利用数据仓库技术(Extract Transform Load,简称ETL)将Hbase数据库中的数据提取出来作为训练数据,供后续模型训练使用。
在操作S420,利用第一历史业务负载量和第一历史值训练预测模型。
在本公开实施例中,训练预测模型的过程即建立交易率配比向量与系统关键指标的关系的过程。具体地,令交易率配比向量为自变量,即T表示时间长度。令系统关键指标为因变量,即/>可以通过机器学习算法寻求x与yk的关系,即求解满足条件yk=fk(x)的关系模型f。该关系模型f即可作为预测模型,用于根据数据中心当前的业务负载量,预测关键指标的数值范围。其输入为当前业务负载量,输出为预测的关键指标数值范围。
在本公开实施例中,模型训练时可以采用历史数据进行离线训练。此外,还可以定期更新数据集不断优化训练模型,使其自适应环境差异和业务场景变化。
通过本公开实施例,使用历史数据进行离线训练预测模型,从而可以避免在业务高峰期占用系统资源。同时,采用机器学习算法自动建立业务负载与系统指标的关联关系,且定期动态调整训练模型,具有较强的普适性和自适性。
图5示意性示出了根据本公开实施例的预测模型优化方法的流程图。
如图5所示,本公开实施例的预测模型优化方法例如可以包括操作S510~操作S530。
在操作S510,获取测试数据集,该测试数据集中包含第二历史业务负载量以及对应的关键指标的第二历史值。
基于操作S410相同的操作,通过对历史业务负载量以及对应的关键指标的历史值进行数据量化及数据抽取处理,即可获得测试数据集。
在操作S520,将第二历史业务负载量输入预测模型得到输出值。
在操作S530,比较该输出值与第二历史值,以优化预测模型。
通过本公开实施例,使用测试数据集对预测模型进行优化,可获得更优的预测模型,从而能够更有效地对数据中心进行异常检测。
图6示意性示出了根据本公开实施例的检测装置的框图。
如图6所示,应用于数据中心异常检测的检测装置600包括第一获取模块601、预测模块602、第二获取模块603和确定模块604。该检测装置可以执行上面参考方法实施例部分描述的方法,在此不再赘述。
具体地,第一获取模块601,用于获取数据中心当前的业务负载量。
预测模块602,用于基于该业务负载量,预测关键指标的数值范围,该关键指标用于表征所述数据中心的资源开销状况。
第二获取模块603,用于获取所述关键指标的实际值。
确定模块604,用于确定实际值是否在预测数值范围内,以检测数据中心是否异常。
作为一种可选的实施例,该检测装置除了包括如图6所示的第一获取模块601、预测模块602、第二获取模块603和确定模块604外,例如还可以包括:采集模块、处理模块、训练模块及优化模块。
具体地,采集模块例如可以用于获取原始的业务负载量及对应的关键指标的值。
处理模块例如可以用于对原始的业务负载量及对应的关键指标的值进行预处理,得到训练数据集及测试数据集。该训练数据集中包含历史业务负载量以及对应的关键指标的历史值,该测试数据集中包含业务负载测试量以及对应的关键指标的测试值。
训练模块例如可以用于根据训练数据集训练预测模型。
优化模块例如可以用于根据测试数据集优化训练得到的预测模型。
需要说明的是,装置部分的实施例方式与方法部分的实施例方式对应类似,并且所达到的技术效果也对应类似,在此不再赘述。
根据本公开的实施例的模块中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,第一获取模块601、预测模块602、第二获取模块603、确定模块604中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块第一获取模块601、预测模块602、第二获取模块603、确定模块604中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一获取模块601、预测模块602、第二获取模块603、确定模块604中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图7示意性示出了根据本公开实施例的电子设备的框图。图7示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700包括处理器710、计算机可读存储介质720。该电子设备700可以执行根据本公开实施例的方法。
具体地,处理器710例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器710还可以包括用于缓存用途的板载存储器。处理器710可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
计算机可读存储介质720,例如可以是非易失性的计算机可读存储介质,具体示例包括但不限于:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;等等。
计算机可读存储介质720可以包括计算机程序721,该计算机程序721可以包括代码/计算机可执行指令,其在由处理器710执行时使得处理器710执行根据本公开实施例的方法或其任何变形。
计算机程序721可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序721中的代码可以包括一个或多个程序模块,例如包括721A、模块721B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器710执行时,使得处理器710可以执行根据本公开实施例的方法或其任何变形。
根据本公开的实施例,第一获取模块601、预测模块602、第二获取模块603、确定模块604中的至少一个可以实现为参考图7描述的计算机程序模块,其在被处理器710执行时,可以实现上面描述的相应操作。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。电要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

Claims (8)

1.一种检测方法,包括:
实时获取数据中心当前的业务负载量;
基于所述业务负载量,预测关键指标的数值范围,所述关键指标用于表征所述数据中心的资源开销状况;
从主机资源监控组件中实时获取所述关键指标的实际值;以及
确定所述实际值是否在所述数值范围内,以检测所述数据中心是否出现异常,
其中,所述基于所述业务负载量,预测关键指标的数值范围,包括:
获取预测模型
训练所述预测模型;以及
将所述业务负载量输入所述预测模型,以预测所述关键指标的所述数值范围,
其中,训练所述预测模型,具体包括:
获取训练数据集,所述训练数据集中包含第一历史业务负载量以及对应的所述关键指标的第一历史值;
对所述训练数据集中的数据进行数据量化,数据量化的操作包括将业务负载量按照交易类型进行拆解量化,形成交易率配比向量,其中t表示时间,颗粒度为分钟,n表示交易类型数目;以及
利用所述第一历史业务负载量和所述第一历史值训练所述预测模型。
2.根据权利要求1所述的方法,其中,所述方法还包括:
获取测试数据集,所述测试数据集中包含第二历史业务负载量以及对应的所述关键指标的第二历史值;
将所述第二历史业务负载量输入所述预测模型得到输出值;以及
比较所述输出值与所述第二历史值,以优化所述预测模型。
3.根据权利要求1所述的方法,其中,所述训练所述预测模型,包括:
离线训练所述预测模型。
4.根据权利要求1所述的方法,其中,所述业务负载量包括以下中的至少一个:柜面交易量、ATM交易量、个人网银交易量和手机银行交易量。
5.根据权利要求1所述的方法,其中,所述基于所述业务负载量,预测关键指标的数值范围,包括:
基于交易类型将所述业务负载量转换为交易率配比向量;以及
基于所述交易率配比向量预测所述关键指标的数值范围。
6.一种检测装置,包括:
第一获取模块,用于实时获取数据中心当前的业务负载量;
预测模块,用于基于所述业务负载量,预测关键指标的数值范围,所述关键指标用于表征所述数据中心的资源开销状况;
第二获取模块,从主机资源监控组件中实时用于获取所述关键指标的实际值;以及
确定模块,用于确定所述实际值是否在所述数值范围内,以检测所述数据中心是否异常,
其中,所述基于所述业务负载量,预测关键指标的数值范围,包括:
获取预测模型;
训练所述预测模型;以及
将所述业务负载量输入所述预测模型,以预测所述关键指标的所述数值范围,
其中,训练所述预测模型,具体包括:
获取训练数据集,所述训练数据集中包含第一历史业务负载量以及对应的所述关键指标的第一历史值;
对所述训练数据集中的数据进行数据量化,数据量化的操作包括将业务负载量按照交易类型进行拆解量化,形成交易率配比向量,其中t表示时间,颗粒度为分钟,n表示交易类型数目;以及
利用所述第一历史业务负载量和所述第一历史值训练所述预测模型。
7.一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至5中任一项所述的方法。
8.一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现权利要求1至5中任一项所述的方法。
CN201910693655.4A 2019-07-29 2019-07-29 检测方法和装置 Active CN110413482B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910693655.4A CN110413482B (zh) 2019-07-29 2019-07-29 检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910693655.4A CN110413482B (zh) 2019-07-29 2019-07-29 检测方法和装置

Publications (2)

Publication Number Publication Date
CN110413482A CN110413482A (zh) 2019-11-05
CN110413482B true CN110413482B (zh) 2023-10-03

Family

ID=68364063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910693655.4A Active CN110413482B (zh) 2019-07-29 2019-07-29 检测方法和装置

Country Status (1)

Country Link
CN (1) CN110413482B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930603A (zh) * 2020-08-14 2020-11-13 工银科技有限公司 服务器性能检测方法、装置、系统及介质
CN113159933A (zh) * 2021-05-20 2021-07-23 中国工商银行股份有限公司 一种风险控制方法、系统、设备及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108075906A (zh) * 2016-11-08 2018-05-25 上海有云信息技术有限公司 一种用于云计算数据中心的管理方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150371244A1 (en) * 2014-06-23 2015-12-24 Ca, Inc. Forecasting information technology workload demand
US9699049B2 (en) * 2014-09-23 2017-07-04 Ebay Inc. Predictive model for anomaly detection and feedback-based scheduling

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108075906A (zh) * 2016-11-08 2018-05-25 上海有云信息技术有限公司 一种用于云计算数据中心的管理方法及系统

Also Published As

Publication number Publication date
CN110413482A (zh) 2019-11-05

Similar Documents

Publication Publication Date Title
CN111212038B (zh) 基于大数据人工智能的开放数据api网关系统
CN106951984B (zh) 一种系统健康度动态分析预测方法及装置
CN110865929A (zh) 异常检测预警方法及系统
CN111045894B (zh) 数据库异常检测方法、装置、计算机设备和存储介质
CN110912737A (zh) 一种基于混合模型的动态感知性能预告警方法
WO2017071369A1 (zh) 一种预测用户离网的方法和设备
Chen et al. Optimal variability sensitive condition-based maintenance with a Cox PH model
CN110413482B (zh) 检测方法和装置
CN112052145A (zh) 性能告警阈值的确定方法、装置、电子设备和介质
EP3503473A1 (en) Server classification in networked environments
CN111539493A (zh) 一种告警预测方法、装置、电子设备及存储介质
CN111930603A (zh) 服务器性能检测方法、装置、系统及介质
CN109753408A (zh) 一种基于机器学习的流程异常预测方法
US8180716B2 (en) Method and device for forecasting computational needs of an application
CN115174353B (zh) 故障根因确定方法、装置、设备及介质
CN110795324B (zh) 一种数据处理方法及装置
US11410049B2 (en) Cognitive methods and systems for responding to computing system incidents
CN107480703B (zh) 交易故障检测方法及装置
JP7062505B2 (ja) 設備管理支援システム
CN116755974A (zh) 云计算平台运维方法、装置、电子设备及存储介质
CN114138535A (zh) 存储系统的故障诊断方法、装置、电子设备、介质及产品
CN114819367A (zh) 一种基于工业互联网的公共服务平台
CN113656452A (zh) 调用链指标异常的检测方法、装置、电子设备及存储介质
CN112395167A (zh) 一种作业故障预测方法、装置及电子设备
CN104883273A (zh) 虚拟化服务管理平台中业务影响模型的处理方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant