CN113535444B - 异动检测方法、装置、计算设备及计算机存储介质 - Google Patents

异动检测方法、装置、计算设备及计算机存储介质 Download PDF

Info

Publication number
CN113535444B
CN113535444B CN202010292248.5A CN202010292248A CN113535444B CN 113535444 B CN113535444 B CN 113535444B CN 202010292248 A CN202010292248 A CN 202010292248A CN 113535444 B CN113535444 B CN 113535444B
Authority
CN
China
Prior art keywords
resource
abnormal
influence
transaction
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010292248.5A
Other languages
English (en)
Other versions
CN113535444A (zh
Inventor
蒋通通
叶晓龙
余建利
乔柏林
胡林熙
刘苗苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Zhejiang Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202010292248.5A priority Critical patent/CN113535444B/zh
Publication of CN113535444A publication Critical patent/CN113535444A/zh
Application granted granted Critical
Publication of CN113535444B publication Critical patent/CN113535444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0775Content or structure details of the error report, e.g. specific table structure, specific error fields

Abstract

本发明实施例涉及通信技术领域,公开了一种异动检测,该方法包括:获取业务支撑系统中各资源的运行数据;确定各资源的运行数据是否能够生成相应的异动;确定能够生成异动的运行数据对应的目标资源;根据各目标资源的影响程度确定关键异动资源;对关键异动资源的运行数据进行检测,以确定异动原因。通过上述方式,本发明实施例实现了对业务支撑系统中异动的检测。

Description

异动检测方法、装置、计算设备及计算机存储介质
技术领域
本发明实施例涉及通信技术领域,具体涉及一种异动检测方法、装置、计算设备及计算机存储介质。
背景技术
业务支撑系统是业务的基石,包括了承载业务运行的各种软硬件IT资源,例如,网络设备、安全设备、主机、数据库、中间件等。这些IT资源结合在一起,共同承担一组产生特定客户价值的任务。
业务支撑系统发生故障时,按照故障等级大小可能会影响部分或者全部业务办理,引起客户投诉。所以及时有效的解决故障是IT系统运维过程中最重要的事情。
目前系统故障处理主要依靠个人经验,对某一种IT资源的单一异动进行检测。但是支撑系统中各资源存在深入关联,因此,依靠个人经验进行异动检测耗费大量的人力资源成本。
发明内容
鉴于上述问题,本发明实施例提供了一种异动检测方法、装置、计算设备及计算机存储介质,用于解决现有技术中存在的依靠个人经验进行异动检测消耗的人力资源成本高的问题。
根据本发明实施例的一个方面,提供了一种异动检测方法,所述方法包括:
获取业务支撑系统中各资源的运行数据;
确定各资源的运行数据是否能够生成相应的异动;
确定能够生成异动的运行数据对应的目标资源;
根据各目标资源的影响程度确定关键异动资源;
对所述关键异动资源的运行数据进行检测,以确定异动原因。
可选的,所述确定各资源的运行数据是否能够生成相应的异动,包括:
将各资源的运行数据分别输入相应的异动判别函数中,根据所述异动判别函数的结果确定各资源的运行数据能否生成相应的异动。
可选的,在获取业务支撑系统中各资源的运行数据之前,所述方法还包括:
获取业务支撑系统中第一资源的多组历史运行数据,所述第一资源为所述业务支撑系统的各资源中的任意一个资源;
根据所述第一资源是否生成异动将所述多组历史运行数据分为两类;
对两类历史运行数据分别使用第一标签和第二标签标识,以得到多组训练数据,每一组训练数据包括一组历史运行数据和该组历史运行数据对应的标签;
根据所述多组训练数据训练逻辑回归模型,得到所述第一资源对应的异动判别函数。
可选的,所述影响程度包括影响系统数、影响时间和影响用户数,所述根据各目标资源的影响程度确定关键异动资源,包括:
如果目标资源的影响系统数大于预设系统数,则确定所述目标资源的影响时间是否大于预设时间;
如果所述目标资源的影响时间大于预设时间,则确定所述目标资源的影响用户数是否大于预设数值;
如果所述目标资源的影响用户数大于预设数值,则确定所述目标资源为关键异动资源。
可选的,如果目标资源的影响系统数小于或等于预设系统数,则确定所述目标资源为非关键异动资源。
可选的,如果目标资源的影响时间小于或等于预设时间,则确定所述目标资源为非关键异动资源。
可选的,在获取业务支撑系统中各资源的运行数据之后,所述方法还包括:
将所述运行数据中的非数值型数据转换为数值型数据,得到第一运行数据;
对所述第一运行数据进行归一化处理,得到标准运行数据;
所述确定各资源的运行数据是否能够生成相应的异动,包括:
确定各资源的标准运行数据是否能够生成相应的异动。
根据本发明实施例的另一方面,提供了一种异动检测装置,所述装置包括:
获取模块,用于获取业务支撑系统中各资源的运行数据;
第一确定模块,用于确定各资源的运行数据是否能够生成相应的异动;
第二确定模块,用于确定能够生成异动的运行数据对应的目标资源;
第三确定模块,用于根据各目标资源的影响程度确定关键异动资源;
检测模块,用于对所述关键异动资源的运行数据进行检测,以确定异动原因。
根据本发明实施例的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述的异动检测方法的操作。
根据本发明实施例的还一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令在计算设备/装置上运行时,使得计算设备/装置执行上述的一种异动检测方法的操作。
本发明实施例在确定业务支撑系统的故障根因时综合考虑了各资源的运行数据,定位出了产生故障的关键异动资源,对关键异动资源进行检测以确定业务支撑系统的故障原因,相较于对每一个资源进行人工确认,本发明例减少了人力资源成本,且综合各资源的运行数据进行异动检测的检测结果更加准确。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
附图仅用于示出实施方式,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种异动检测方法的流程示意图;
图2示出了本发明实施例提供的一种异动检测方法中确定关键异动资源的决策树示意图;
图3示出了本发明另一实施例提供的一种异动检测方法的流程示意图;
图4示出了本发明实施例提供的一种异动检测装置的功能框图;
图5示出了本发明实施例提供的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。
图1示出了本发明实施例的一种异动检测方法的流程图,该方法由计算设备执行。计算设备包括但不仅限于计算机。如图1所示,该方法包括以下步骤:
步骤110:获取业务支撑系统中各资源的运行数据。
在本步骤中,业务支撑系统包括承载业务运行的各种软硬件IT资源。例如,网络设备、安全设备、主机、数据库、中间件等。各资源在承担业务时,生成相应的运行数据。在本发明实施例中,各资源的运行数据包括:日志数据、主机指标数据、实例指标数据、网络流量、中间件指标数据等。其中,日志数据进一步包括日志量、日志关键字等。主机指标数据进一步包括主机CPU、主机IO等。各资源的运行数据按照一定频率获取。每一次获取的各资源的运行数据可以按照各资源类别及运行数据的类别存储在一个表格中。例如,在一个实施例中,每分钟获取一次各资源的运行数据。某一分钟获取的运行数据的存储形式如表1所示:
表1
步骤120:确定各资源的运行数据是否能够生成相应的异动。
在本步骤中,每一个资源对应一个异动判别函数。异动判别函数是一个二分类函数,该函数的输出结果表示该资源异动或该资源无异动。异动判别函数可以由任意一个二分类的机器学习模型训练得到。具体的模型训练过程在下一个实施例中说明,请参阅下一个实施例的描述。
各资源的运行数据能否生成异动的确定方法相同。以各资源中的其中一个资源的运行数据能否生成异动为例对本步骤进行说明。
该资源的一个类别的运行数据为一个维度,各类别的运行数据构成一组检测数据。一组检测数据用于确定该资源能否生成异动。例如,网络设备1的日志量为一个维度的数据,日志关键字为一个维度的数据,所有维度的数据构成一组检测数据。在具体实施过程中,一些维度的数据是非数值型的,例如,日志关键字。对于非数值型数据,为了便于计算,将其转换为数值型数据。在进行转换时,对于二值型的非数值型数据,用0或者1表示。对于非二值型的非数值型数据,根据其数据的类别分别用一个数字表示。例如,假设日志关键字包括四种类型,则各关键字分别用1至4四个数字表示。上述表示方式仅是一种示例,并不表示对该部分内容的限定,本发明实施例并不以非数值型数据转换为数值型数据的方法为限。
在一些实施例中,各维度的数据在全部转换为数值型数据之后,各维度数据之间的数量级之间存在很大差异,例如,日志量的数量级以百或千为单位,主机IO的数量级以个为单位。在本发明实施例中,对于数量级差别较大的各维度的数据分别进行归一化处理,得到标准运行数据。根据标准运行数据确定该资源能否生成异动。通过这种方式,消除了各维度之间的数量级差异,从而减小计算过程中的误差。
以异动判别函数为逻辑回归算法训练得到的函数为例,对各资源中的一个资源的异动判别进行说明。假设其中一个资源经过逻辑回归算法训练之后得到的异动判别函数为:其中,p(x)表示一组检测数据输入异动判别函数后得到的概率,c0、c1...cn-1均为训练后得到的已知值。n表示该资源中包含的维度个数,x1...xn分别表示各维运行数据的值。在逻辑回归算法中,以得到的概率值与0.5的比较结果确定是否生成相应的异动。概率值大于0.5时能够生成异动还是概率值小于0.5时能够生成异动由本领域技术人员在训练异动判别函数时定义,本发明实施例并不以此为限。假设训练过程中,概率值大于0.5表示能够生成异动,概率值小于0.5表示不能够生成异动,则将该资源的一组检测数据输入该异动判别函数后,如果得到的概率值大于0.5表示该资源的运行数据能够生成相应的异动;如果得到的概率值小于0.5表示该资源的运行数据不能生成相应的异动。
步骤130:确定能够生成异动的运行数据对应的目标资源。
在本步骤中,获取的各资源的运行数据经过步骤120的方法判别之后,将判别结果为能够生成异动的资源筛选出来作为目标资源。
步骤140:根据各目标资源的影响程度确定关键异动资源。
在本步骤中,业务支撑系统中底层的资源影响程度越高,底层资源故障经常造成各层资源产生异动。关键异动资源是指影响程度满足预设条件的目标资源。其中,预设条件是由影响程度包含的各维度对应的阈值决定的。各维度对应的阈值为经验值。在本发明实施例中,影响程度包括影响系统数、影响时间、影响用户数三个维度。
在本发明实施例中,通过决策树确定关键异动资源。本发明实施例构建的决策树如图2所示。在该决策树中,以影响系统数作为根节点,影响时间和影响用户数作为内部节点,关键异动资源和非关键异动资源作为叶子节点。其中,根节点的测试对象包含所有的目标资源。内部节点的测试对象为上一层的根节点或内部节点筛选之后的目标资源。例如,影响时间的测试对象为满足影响系统数的目标资源,影响用户数的测试对象为满足影响时间的目标资源。
在一个具体的实施方式中,如图2所示,影响系统数的系统阈值为2个,影响时间的时间阈值为30分钟,影响用户数的阈值为50个。各影响维度对应的数值可以根据本发明实施例的具体应用场景进行设定,本发明实施例并不以此为限。
在图2中,如果目标资源的影响系统数大于2个,则确定目标资源的影响时间是否大于30分钟;如果目标资源的影响时间大于30分钟,则确定目标资源的影响用户数是否大于50个;如果目标资源的影响用户数大于50个,则确定目标资源为关键异动资源。
如果目标资源的影响系统数小于或等于2个,则直接确定该目标资源为非关键异动资源,不再判断影响时间。同样的,如果影响时间小于或等于30分钟,则直接确定该目标资源为非关键异动资源,不再判断影响用户数。
步骤150:对关键异动资源的运行数据进行检测,以确定异动原因。
在本步骤中,对关键异动资源的运行数据进行检测,如果运行数据中某一个维度或多个维度的数据异常,则根据该维度的数据结合专家经验确定异动原因。例如,主机1为关键异动资源,主机1的多维运行数据中的主机CPU过高,根据专家经验,造成主机CPU过高的原因可能是驱动损坏、病毒入侵等原因,则对各原因一一排查,确定原因。
本发明实施例在确定业务支撑系统的故障根因时综合考虑了各资源的运行数据,定位出了产生故障的关键异动资源,对关键异动资源进行检测以确定业务支撑系统的故障原因,相较于对每一个资源进行人工确认,本发明例减少了人力资源成本,且综合各资源的运行数据进行异动检测的检测结果更加准确。
图3示出了本发明另一个实施例的一种异动检测方法的流程图。如图3所示,该方法包括以下步骤:
步骤210:获取业务支撑系统中第一资源的多组历史运行数据。
在本步骤中,第一资源是业务支撑系统的各资源中的任意一个资源。
步骤220:根据第一资源是否生成异动将多组历史运行数据分为两类。
在本步骤中,将第一资源异动时对应的历史运行数据分为一类,第一资源未异动时对应的历史运行数据分为一类。
步骤230:对两类历史运行数据分别使用第一标签和第二标签标识,以得到多组训练数据。
在本步骤中,第一标签和第二标签相区分。本发明实施例并不限定第一标签和第二标签的具体形式,例如,第一标签为0,第二标签为1。每一组训练数包括一组历史运行数据和该组历史运行数据对应的标签。
在一些实施例中,历史运行数据也需要进行数值型转换、归一化处理等数据处理操作。对历史运行数据的处理可以参阅步骤120中的相应描述,为了描述简便,在此不做赘述。
步骤240:根据多组训练数据训练逻辑回归模型,得到第一资源对应的异动判别函数。
在本步骤中,逻辑回归模型的函数形式为:将各组训练数据代入该逻辑回归模型,得到c0、c1...cn-1的值。其中,一组训练数据中的各维运行数据分别对应x1...xn,p(x)对应该组训练数据中的标签。
步骤250:获取业务支撑系统中各资源的运行数据。
步骤260:将各资源的运行数据分别输入相应的异动判别函数中,根据异动判别函数的结果确定各资源的运行数据能否生成相应的异动。
步骤270:确定能够生成异动的运行数据对应的目标资源。
步骤280:根据各目标资源的影响程度确定关键异动资源。
步骤290:对关键异动资源的运行数据进行检测,以确定异动原因。
本发明实施例通过逻辑回归算法确定了各资源的异动判别函数,该异动判别函数综合了各资源的历史运行数据,通过确定的异动判别函数确定各资源的实际运行数据能否生成相应的异动时,得到的结果更加可靠。
图4示出了本发明实施例的一种异动检测装置的功能框图。如图4所示,该装置包括:获取模块310、第一确定模块320、第二确定模块330、第三确定模块340和检测模块350。获取模块310用于获取业务支撑系统中各资源的运行数据;第一确定模块320用于确定各资源的运行数据是否能够生成相应的异动;第二确定模块330用于确定能够生成异动的运行数据对应的目标资源;第三确定模块340用于根据各目标资源的影响程度确定关键异动资源;检测模块350用于对所述关键异动资源的运行数据进行检测,以确定异动原因。
在一种可选的方式中,第一确定模块320进一步用于:
将各资源的运行数据分别输入相应的异动判别函数中,根据所述异动判别函数的结果确定各资源的运行数据能否生成相应的异动。
在一种可选的方式中,异动检测装置还包括:第一获取模块360、分类模块370、标识模块380和训练模块390。
第一获取模块360用于获取业务支撑系统中第一资源的多组历史运行数据,所述第一资源为所述业务支撑系统的各资源中的任意一个资源。
分类模块370用于根据所述第一资源是否生成异动将所述多组历史运行数据分为两类。
标识模块380用于对两类历史运行数据分别使用第一标签和第二标签标识,以得到多组训练数据,每一组训练数据包括一组历史运行数据和该组历史运行数据对应的标签。
训练模块390用于根据所述多组训练数据训练逻辑回归模型,得到所述第一资源对应的异动判别函数。
在一种可选的方式中,所述影响程度包括影响系统数、影响时间和影响用户数,第三确定模块340进一步用于:
如果目标资源的影响系统数大于预设系统数,则确定所述目标资源的影响时间是否大于预设时间;
如果所述目标资源的影响时间大于预设时间,则确定所述目标资源的影响用户数是否大于预设数值;
如果所述目标资源的影响用户数大于预设数值,则确定所述目标资源为关键异动资源。
在一种可选的方式中,第三确定模块340进一步用于:
如果目标资源的影响系统数小于或等于预设系统数,则确定所述目标资源为非关键异动资源。
在一种可选的方式中,第三确定模块340进一步用于:
如果目标资源的影响时间小于或等于预设时间,则确定所述目标资源为非关键异动资源。
在一种可选的方式中,所述装置还包括:数据处理模块300,数据处理模块300用于:
将所述运行数据中的非数值型数据转换为数值型数据,得到第一运行数据;
对所述第一运行数据进行归一化处理,得到标准运行数据;
所述第一确定模块320进一步用于:
确定各资源的标准运行数据是否能够生成相应的异动。
本发明实施例在确定业务支撑系统的故障根因时综合考虑了各资源的运行数据,定位出了产生故障的关键异动资源,对关键异动资源进行检测以确定业务支撑系统的故障原因,相较于对每一个资源进行人工确认,本发明例减少了人力资源成本,且综合各资源的运行数据进行异动检测的检测结果更加准确。
图5示出了本发明实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图5所示,该计算设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。处理器402,用于执行程序410,具体可以执行上述用于异动检测方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机可执行指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以被处理器402调用使计算设备执行图1中的步骤110~步骤150,图3中的步骤210~步骤290,以及实现图4中的模块310~模块300的功能。
本发明实施例提供了一种计算机可读存储介质,所述存储介质存储有至少一可执行指令,该可执行指令在计算设备/装置上运行时,使得所述计算设备/装置执行上述任意方法实施例中的一种异动检测方法。
本发明实施例提供了一种计算机程序,所述计算机程序可被处理器调用使计算设备执行上述任意方法实施例中的异动检测方法。
本发明实施例提供了一种计算机程序产品,计算机程序产品包括存储在计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令在计算机上运行时,使得所述计算机执行上述任意方法实施例中的异动检测方法。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。

Claims (10)

1.一种异动检测方法,其特征在于,所述方法包括:
获取业务支撑系统中各资源的运行数据;
确定各资源的运行数据是否能够生成相应的异动;每一个资源对应一个移动判别函数,移动判别函数是一个二分类函数,所述二分类函数的输出结果表示所述资源异动或所述资源无异动;所述异动判别函数由任意一个二分类的机器学习模型训练得到;
确定能够生成异动的运行数据对应的目标资源;
根据各目标资源的影响程度确定关键异动资源;所述影响程度包括影响系统数、影响时间、影响用户数;通过决策树确定所述关键异动资源,在所述决策树中,以所述影响系统数为根节点,所述影响时间和所述影响用户数作为内部节点,所述关键异动资源和非关键异动资源作为叶子节点,其中,所述根节点的测试对象包含所有的目标资源,所述内部节点的测试对象为上一层的根节点或内部节点筛选之后的目标资源;
对所述关键异动资源的运行数据进行检测,以确定异动原因。
2.根据权利要求1所述的方法,其特征在于,所述确定各资源的运行数据是否能够生成相应的异动,包括:
将各资源的运行数据分别输入相应的异动判别函数中,根据所述异动判别函数的结果确定各资源的运行数据能否生成相应的异动。
3.根据权利要求2所述的方法,其特征在于,在获取业务支撑系统中各资源的运行数据之前,所述方法还包括:
获取业务支撑系统中第一资源的多组历史运行数据,所述第一资源为所述业务支撑系统的各资源中的任意一个资源;
根据所述第一资源是否生成异动将所述多组历史运行数据分为两类;
对两类历史运行数据分别使用第一标签和第二标签标识,以得到多组训练数据,每一组训练数据包括一组历史运行数据和该组历史运行数据对应的标签;
根据所述多组训练数据训练逻辑回归模型,得到所述第一资源对应的异动判别函数。
4.根据权利要求1所述的方法,其特征在于,所述影响程度包括影响系统数、影响时间和影响用户数,所述根据各目标资源的影响程度确定关键异动资源,包括:
如果目标资源的影响系统数大于预设系统数,则确定所述目标资源的影响时间是否大于预设时间;
如果所述目标资源的影响时间大于预设时间,则确定所述目标资源的影响用户数是否大于预设数值;
如果所述目标资源的影响用户数大于预设数值,则确定所述目标资源为关键异动资源。
5.根据权利要求4所述的方法,其特征在于,如果目标资源的影响系统数小于或等于预设系统数,则确定所述目标资源为非关键异动资源。
6.根据权利要求4所述的方法,其特征在于,如果目标资源的影响时间小于或等于预设时间,则确定所述目标资源为非关键异动资源。
7.根据权利要求1所述的方法,其特征在于,在获取业务支撑系统中各资源的运行数据之后,所述方法还包括:
将所述运行数据中的非数值型数据转换为数值型数据,得到第一运行数据;
对所述第一运行数据进行归一化处理,得到标准运行数据;
所述确定各资源的运行数据是否能够生成相应的异动,包括:
确定各资源的标准运行数据是否能够生成相应的异动。
8.一种异动检测装置,其特征在于,所述装置包括:
获取模块,用于获取业务支撑系统中各资源的运行数据;
第一确定模块,用于确定各资源的运行数据是否能够生成相应的异动,每一个资源对应一个移动判别函数,移动判别函数是一个二分类函数,所述二分类函数的输出结果表示所述资源异动或所述资源无异动;所述异动判别函数由任意一个二分类的机器学习模型训练得到;
第二确定模块,用于确定能够生成异动的运行数据对应的目标资源;
第三确定模块,用于根据各目标资源的影响程度确定关键异动资源;所述影响程度包括影响系统数、影响时间、影响用户数;通过决策树确定所述关键异动资源,在所述决策树中,以所述影响系统数为根节点,所述影响时间和所述影响用户数作为内部节点,所述关键异动资源和非关键异动资源作为叶子节点,其中,所述根节点的测试对象包含所有的目标资源,所述内部节点的测试对象为上一层的根节点或内部节点筛选之后的目标资源;
检测模块,用于对所述关键异动资源的运行数据进行检测,以确定异动原因。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7任意一项所述的异动检测方法的操作。
10.一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令在计算设备/装置上运行时,使得计算设备/装置执行如权利要求1-7任意一项所述的一种异动检测方法的操作。
CN202010292248.5A 2020-04-14 2020-04-14 异动检测方法、装置、计算设备及计算机存储介质 Active CN113535444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010292248.5A CN113535444B (zh) 2020-04-14 2020-04-14 异动检测方法、装置、计算设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010292248.5A CN113535444B (zh) 2020-04-14 2020-04-14 异动检测方法、装置、计算设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN113535444A CN113535444A (zh) 2021-10-22
CN113535444B true CN113535444B (zh) 2023-11-03

Family

ID=78119997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010292248.5A Active CN113535444B (zh) 2020-04-14 2020-04-14 异动检测方法、装置、计算设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN113535444B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101741609A (zh) * 2008-11-14 2010-06-16 中国移动通信集团广西有限公司 一种业务支撑系统可用性的评估方法及系统
CN105354198A (zh) * 2014-08-19 2016-02-24 中国移动通信集团湖北有限公司 一种数据处理方法及装置
CN107220217A (zh) * 2017-05-31 2017-09-29 北京京东尚科信息技术有限公司 基于逻辑回归的特征系数训练方法和装置
CN108073497A (zh) * 2018-01-29 2018-05-25 上海洞识信息科技有限公司 一种基于数据中心数据采集平台的多指标异动分析方法
CN108596229A (zh) * 2018-04-13 2018-09-28 北京华电智慧科技产业有限公司 在线异常的监测诊断方法和系统
CN108683530A (zh) * 2018-04-28 2018-10-19 北京百度网讯科技有限公司 多维度数据的数据分析方法、装置及存储介质
CN109711570A (zh) * 2018-12-26 2019-05-03 中国移动通信集团江苏有限公司 设备运行检测的方法、装置、设备和介质
CN109753408A (zh) * 2018-12-11 2019-05-14 江阴逐日信息科技有限公司 一种基于机器学习的流程异常预测方法
CN110162422A (zh) * 2019-04-30 2019-08-23 阿里巴巴集团控股有限公司 一种基于决策树的问题定位方法和装置
CN110275814A (zh) * 2019-06-28 2019-09-24 深圳前海微众银行股份有限公司 一种业务系统的监控方法及装置
CN110300008A (zh) * 2018-03-22 2019-10-01 北京华为数字技术有限公司 一种确定网络设备的状态的方法及装置
CN110348839A (zh) * 2019-05-31 2019-10-18 口碑(上海)信息技术有限公司 设备状态数据的监控处理方法、装置及系统
CN110428018A (zh) * 2019-08-09 2019-11-08 北京中电普华信息技术有限公司 一种全链路监控系统中的异常预测方法及装置
CN110535864A (zh) * 2019-08-30 2019-12-03 北京达佳互联信息技术有限公司 服务异常检测方法、装置、设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9904587B1 (en) * 2015-12-18 2018-02-27 Amazon Technologies, Inc. Detecting anomalous behavior in an electronic environment using hardware-based information

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101741609A (zh) * 2008-11-14 2010-06-16 中国移动通信集团广西有限公司 一种业务支撑系统可用性的评估方法及系统
CN105354198A (zh) * 2014-08-19 2016-02-24 中国移动通信集团湖北有限公司 一种数据处理方法及装置
CN107220217A (zh) * 2017-05-31 2017-09-29 北京京东尚科信息技术有限公司 基于逻辑回归的特征系数训练方法和装置
CN108073497A (zh) * 2018-01-29 2018-05-25 上海洞识信息科技有限公司 一种基于数据中心数据采集平台的多指标异动分析方法
CN110300008A (zh) * 2018-03-22 2019-10-01 北京华为数字技术有限公司 一种确定网络设备的状态的方法及装置
CN108596229A (zh) * 2018-04-13 2018-09-28 北京华电智慧科技产业有限公司 在线异常的监测诊断方法和系统
CN108683530A (zh) * 2018-04-28 2018-10-19 北京百度网讯科技有限公司 多维度数据的数据分析方法、装置及存储介质
CN109753408A (zh) * 2018-12-11 2019-05-14 江阴逐日信息科技有限公司 一种基于机器学习的流程异常预测方法
CN109711570A (zh) * 2018-12-26 2019-05-03 中国移动通信集团江苏有限公司 设备运行检测的方法、装置、设备和介质
CN110162422A (zh) * 2019-04-30 2019-08-23 阿里巴巴集团控股有限公司 一种基于决策树的问题定位方法和装置
CN110348839A (zh) * 2019-05-31 2019-10-18 口碑(上海)信息技术有限公司 设备状态数据的监控处理方法、装置及系统
CN110275814A (zh) * 2019-06-28 2019-09-24 深圳前海微众银行股份有限公司 一种业务系统的监控方法及装置
CN110428018A (zh) * 2019-08-09 2019-11-08 北京中电普华信息技术有限公司 一种全链路监控系统中的异常预测方法及装置
CN110535864A (zh) * 2019-08-30 2019-12-03 北京达佳互联信息技术有限公司 服务异常检测方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
数据中心无监督智能交易监控平台建设;周斌峰;余仁杰;李卫;张小翠;;中国金融电脑(第01期);58-62 *

Also Published As

Publication number Publication date
CN113535444A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
US8453027B2 (en) Similarity detection for error reports
US9459950B2 (en) Leveraging user-to-tool interactions to automatically analyze defects in IT services delivery
US11620384B2 (en) Independent malware detection architecture
US20150356489A1 (en) Behavior-Based Evaluation Of Crowd Worker Quality
US20210097343A1 (en) Method and apparatus for managing artificial intelligence systems
US20200004956A1 (en) System and method for detecting malicious files using two-stage file classification
US10803057B1 (en) Utilizing regular expression embeddings for named entity recognition systems
US11860721B2 (en) Utilizing automatic labelling, prioritizing, and root cause analysis machine learning models and dependency graphs to determine recommendations for software products
US11003695B2 (en) Method, apparatus and article of manufacture for categorizing computerized messages into categories
CN111507470A (zh) 一种异常账户的识别方法及装置
CN109614795B (zh) 一种事件感知的安卓恶意软件检测方法
Zhao et al. Automatically and adaptively identifying severe alerts for online service systems
CN111104242A (zh) 基于深度学习的操作系统的异常日志的处理方法及装置
WO2021068563A1 (zh) 样本数据处理方法、装置、计算机设备及存储介质
CN110633211A (zh) 对于多接口的测试方法、装置、服务器及介质
US11748448B2 (en) Systems and techniques to monitor text data quality
Dasgupta et al. Towards auto-remediation in services delivery: Context-based classification of noisy and unstructured tickets
US11625630B2 (en) Identifying intent in dialog data through variant assessment
CN112579781A (zh) 文本归类方法、装置、电子设备及介质
WO2016118792A1 (en) Text classification using bi-directional similarity
US11815994B2 (en) Techniques to provide self-healing data pipelines in a cloud computing environment
CN113535444B (zh) 异动检测方法、装置、计算设备及计算机存储介质
CN111738290A (zh) 图像检测方法、模型构建和训练方法、装置、设备和介质
US20230196020A1 (en) Learning framework for processing communication session transcripts
US11954685B2 (en) Method, apparatus and computer program for selecting a subset of training transactions from a plurality of training transactions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant