CN113516518A - 参数异常原因的确定方法、装置、电子设备及存储介质 - Google Patents
参数异常原因的确定方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113516518A CN113516518A CN202110858779.0A CN202110858779A CN113516518A CN 113516518 A CN113516518 A CN 113516518A CN 202110858779 A CN202110858779 A CN 202110858779A CN 113516518 A CN113516518 A CN 113516518A
- Authority
- CN
- China
- Prior art keywords
- abnormal
- parameter
- path
- value
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 230000002159 abnormal effect Effects 0.000 claims abstract description 677
- 238000004458 analytical method Methods 0.000 claims abstract description 71
- 230000005856 abnormality Effects 0.000 claims abstract description 49
- 238000004364 calculation method Methods 0.000 claims abstract description 32
- 230000015654 memory Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 7
- 238000012544 monitoring process Methods 0.000 claims description 4
- 238000007405 data analysis Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 208000002693 Multiple Abnormalities Diseases 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请提供了一种参数异常原因的确定方法、装置、电子设备及存储介质,该确定方法包括:根据计算异常参数的计算公式以及该异常参数的各个维度,确定该异常参数的各个异常路径;针对每个异常路径,根据该异常路径中包含的各个子参数的正常值和异常值,确定该异常路径的贡献值和主要子参数;根据每个异常路径的贡献值,该异常路径以及该异常路径的上级异常路径分别被访问的次数,确定该异常路径的异常分析值;基于每个异常路径的异常分析值,将异常分析值满足预设要求的异常路径的主要子参数作为新的异常参数,直至满足退出条件时,确定根源异常参数和总异常路径。本申请通过对异常路径的异常分析值的确定,提高了确定参数异常原因的准确度。
Description
技术领域
本申请涉及大数据分析技术领域,具体而言,涉及一种参数异常原因的确定方法、装置、电子设备及存储介质。
背景技术
随着大数据技术在各行各业的广泛使用,很多企业在处理业务时逐渐趋向于数字化和线上化,具体的,通过对异常参数的数据分析定位参数发生异常的原因,随着需要监测的参数数量的急剧增加,对异常参数的数据分析方法提出了更高要求。
当前,在对海量参数进行数据分析时,通常使用微软提出的Adtributor方法,以及清华实验室提出的Hotspot与Squeeze方法。但是,使用Adtributor方法分析异常参数时,只能发现一维原因,不能发现多维交叉原因,比如,A=B+C=D×E,D和B之间存在交叉,当A异常时,只能确定B是A异常的原因,但是无法确定D中的B是A异常的原因。使用Hotspot与Squeeze的方法,在存在多个异常原因时,无法确定每个异常原因的影响程度,比如,E=F+G,当E异常时,无法确定F和G对E异常的影响程度。
因此,亟需一种既能够准确选择异常参数的分析路径,又能够确定每个异常原因的影响程度的异常参数分析方法。
发明内容
有鉴于此,本申请实施例的目的在于提供一种参数异常原因的确定方法、装置、电子设备及存储介质,能够基于异常参数每个异常路径的异常分析值,确定异常参数的分析路径,并确定异常路径中每个子参数对异常参数的影响程度,提高了确定参数异常原因的准确度。
第一方面,本申请实施例提供了一种参数异常原因的确定方法,所述确定方法包括:
根据计算异常参数所使用的计算公式以及该异常参数对应的各个维度,确定该异常参数的各个异常路径;
针对每个异常路径,根据该异常路径中包含的各个子参数的正常值和异常值,确定该异常路径的贡献值和主要子参数;
根据每个异常路径的贡献值,该异常路径以及该异常路径的上级异常路径分别被访问的次数,确定该异常路径的异常分析值;
基于每个异常路径的异常分析值,将异常分析值满足预设要求的异常路径的主要子参数作为新的异常参数,直至满足退出条件时,将异常分析值满足预设要求的异常路径的主要子参数确定为根源异常参数,将异常分析值满足预设要求的异常路径以及该异常路径的关联异常路径确定为总异常路径。
在一种可能的实施方式中,通过如下方式筛选出所述异常参数:
针对每个核心参数,根据该核心参数在历史时间段内的历史参数值,该核心参数的预测时间段的时间长度,以及该核心参数在历史时间段和预测时间段内的周期、节假日日期和特殊事件日期,确定该核心参数在所述预测时间段内的预测值、上界值以及下界值;
根据每个核心参数在所述预测时间段内的实际值、上界值以及下界值,从各个核心参数中筛选出异常参数。
在一种可能的实施方式中,所述针对每个异常路径,根据该异常路径中包含的各个子参数的正常值和异常值,确定该异常路径的贡献值和主要子参数,包括:
根据每个异常路径包括的各个子参数的正常值和异常值,确定该异常路径的差距值;
针对每个异常路径中的每个子参数,根据该异常路径的差距值,各个子参数的正常值和异常值,确定该子参数的子贡献值;
针对每个异常路径,根据该异常路径中每个子参数的子贡献值,确定该异常路径的贡献值和主要子参数。
在一种可能的实施方式中,所述退出条件包括:
不存在计算所述异常分析值满足预设要求的异常路径的主要子参数的计算公式;或者,
监测作为新的异常参数的主要子参数的数量,所述数量大于第一预设阈值;或者,
所述异常分析值满足预设要求的异常路径的贡献值小于第二预设阈值。
在一种可能的实施方式中,所述确定方法还包括:
将所述根源异常参数和所述总异常路径发送至目标客户端。
在一种可能的实施方式中,通过如下方式确定目标异常路径的关联异常路径:
若异常路径中包括所述目标异常路径对应的异常参数,则将该异常路径确定为所述目标异常路径的关联异常路径;或者,
若异常路径中包括所述目标异常路径的任一关联异常路径对应的异常参数,则将该异常路径确定为所述目标异常路径的关联异常路径。
在一种可能的实施方式中,通过如下方式确定目标异常路径的上级异常路径:
若目标异常路径的任一关联异常路径对应的异常参数为首个异常参数,则将该关联异常路径确定为上级异常路径。
第二方面,本申请实施例提供了一种参数异常原因的确定装置,所述确定装置包括:
第一确定模块,用于根据计算异常参数所使用的计算公式以及该异常参数对应的各个维度,确定该异常参数的各个异常路径;
第二确定模块,用于针对每个异常路径,根据该异常路径中包含的各个子参数的正常值和异常值,确定该异常路径的贡献值和主要子参数;
第三确定模块,用于根据每个异常路径的贡献值,该异常路径以及该异常路径的上级异常路径分别被访问的次数,确定该异常路径的异常分析值;
第四确定模块,用于基于每个异常路径的异常分析值,将异常分析值满足预设要求的异常路径的主要子参数作为新的异常参数,直至满足退出条件时,将异常分析值满足预设要求的异常路径的主要子参数确定为根源异常参数,将异常分析值满足预设要求的异常路径以及该异常路径的关联异常路径确定为总异常路径。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行第一方面任一项所述的参数异常原因的确定方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行第一方面任一项所述的参数异常原因的确定方法的步骤。
本申请实施例提供的一种参数异常原因的确定方法、装置、电子设备及存储介质,根据计算异常参数所使用的计算公式以及该异常参数对应的各个维度,确定该异常参数的各个异常路径;针对每个异常路径,根据该异常路径中包含的各个子参数的正常值和异常值,确定该异常路径的贡献值和主要子参数;根据每个异常路径的贡献值,该异常路径以及该异常路径的上级异常路径分别被访问的次数,确定该异常路径的异常分析值;基于每个异常路径的异常分析值,将异常分析值满足预设要求的异常路径的主要子参数作为新的异常参数,直至满足退出条件时,将异常分析值满足预设要求的异常路径的主要子参数确定为根源异常参数,将异常分析值满足预设要求的异常路径以及该异常路径的关联异常路径确定为总异常路径。本申请实施例能够基于异常参数每个异常路径的异常分析值,确定异常参数的分析路径,并确定异常路径中每个子参数对异常参数的影响程度,提高了确定参数异常原因的准确度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的一种参数异常原因的确定方法的流程图;
图2示出了本申请实施例提供的另一种参数异常原因的确定方法的流程图;
图3示出了本申请实施例提供的另一种参数异常原因的确定方法的流程图;
图4示出了本申请实施例提供的一种参数异常原因的确定装置的结构示意图;
图5示出了本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着大数据技术在各行各业的广泛使用,很多企业在处理业务时逐渐趋向于数字化和线上化,具体的,通过对异常参数的数据分析定位参数发生异常的原因,随着需要监测的参数数量的急剧增加,对异常参数的数据分析方法提出了更高要求。
当前,在对海量参数进行数据分析时,通常使用微软提出的Adtributor方法,以及清华实验室提出的Hotspot与Squeeze方法。但是,使用Adtributor方法分析异常参数时,只能发现一维原因,不能发现多维交叉原因,比如,A=B+C=D×E,D和B之间存在交叉,当A异常时,只能确定B是A异常的原因,但是无法确定D中的B是A异常的原因。使用Hotspot与Squeeze的方法,在存在多个异常原因时,无法确定每个异常原因的影响程度,比如,E=F+G,当E异常时,无法确定F和G对E异常的影响程度。
因此,亟需一种既能够准确选择异常参数的分析路径,又能够确定每个异常原因的影响程度的异常参数分析方法。
基于上述问题,本申请实施例提供了一种参数异常原因的确定方法、装置、电子设备及存储介质,根据计算异常参数所使用的计算公式以及该异常参数对应的各个维度,确定该异常参数的各个异常路径;针对每个异常路径,根据该异常路径中包含的各个子参数的正常值和异常值,确定该异常路径的贡献值和主要子参数;根据每个异常路径的贡献值,该异常路径以及该异常路径的上级异常路径分别被访问的次数,确定该异常路径的异常分析值;基于每个异常路径的异常分析值,将异常分析值满足预设要求的异常路径的主要子参数作为新的异常参数,直至满足退出条件时,将异常分析值满足预设要求的异常路径的主要子参数确定为根源异常参数,将异常分析值满足预设要求的异常路径以及该异常路径的关联异常路径确定为总异常路径。本申请实施例能够基于异常参数每个异常路径的异常分析值,确定异常参数的分析路径,并确定异常路径中每个子参数对异常参数的影响程度,提高了确定参数异常原因的准确度。
采用本申请实施例提供的参数异常原因的确定方法,能够逐个层级地挖掘参数异常的原因,以“收入=新客户收入+老客户收入=搜索引流收入+广告引流收入+推荐引流收入”为例,假设参数“收入”异常,使用Adtributor方法时,只能确定参数“收入”异常的原因是“广告引流收入”,而“广告引流收入”又包括“新客户的广告引流收入”和“老客户的广告引流收入”,Adtributor方法无法更深层级地确定参数“收入”异常的原因是“新客户的广告引流收入”还是“老客户的广告引流收入”,即无法挖掘多维交叉原因,采用本申请实施例提供的参数异常原因的确定方法,在确定了“搜索引流收入+广告引流收入+推荐引流收入”是参数“收入”的异常路径,且“广告引流收入”是该异常路径的主要子参数后,会继续挖掘“广告引流收入”对应的计算公式,即“广告引流收入=新客户的广告引流收入+老客户的广告引流收入”,因此,能够确定参数“收入”异常的原因是“新客户的广告引流收入”还是“老客户的广告引流收入”,即能够确定多维交叉原因,使确定的参数异常原因更加的精确。并且,使用本申请实施例提供的参数异常原因的确定方法,能够确定异常参数的每个异常路径所包括的各个子参数的子贡献值,解决了Hotspot与Squeeze方法存在的缺陷,即能够确定每个子参数对异常参数发生异常的影响程度。
针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本申请针对上述问题所提出的解决方案,都应该是发明人在本申请过程中对本申请做出的贡献。
下面将结合本申请中附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种参数异常原因的确定方法进行详细介绍。
参见图1所示,图1为本申请实施例提供的一种参数异常原因的确定方法的流程图,该确定方法包括以下步骤:
S101、根据计算异常参数所使用的计算公式以及该异常参数对应的各个维度,确定该异常参数的各个异常路径。
本申请实施例中,首先从多个参数中筛选出异常参数,异常参数为数值存在误差的参数,从多个参数中筛选出异常参数的方法在后续步骤301-步骤302中进行详细说明,每个异常参数可以对应多个计算公式,比如,异常参数“收入”对应有两个计算公式:收入=新客户收入+老客户收入=搜索引流收入+广告引流收入+推荐引流收入,当然,在特殊情况下,异常参数可能不存在对应的计算公式。
每个异常参数还可以对应多个维度,比如异常参数“收入”对应有两个维度:地区和时间,在“地区”维度下,收入等于每个地区收入的总和,在“时间”维度下,收入等于每段时间收入的总和,当然,在特殊情况下,异常参数可能不存在对应的维度,如果一个异常参数既不存在对应的计算公式,也不存在对应的维度,说明该异常参数就是根源异常参数,无需再追溯该异常参数发生异常更深层次的原因。
异常参数发生异常的原因可能在于该异常参数的某个计算公式中的计算因子存在问题,也可能在于该异常参数的某个维度下的数据存在问题,所以,根据异常参数对应的每个计算公式以及每个维度,可以确定该异常参数的异常路径,异常路径的数量等于计算公式的数量与维度的数量的总和,比如,上述异常参数“收入”的异常路径包括:新客户收入+老客户收入、搜索引流收入+广告引流收入+推荐引流收入、维度“地区”,维度“时间”。
需要说明的是,这里的参数通常为业务中涉及的指标,指标值的大小能够反映业务的进展情况,基于指标值对业务的行进方案进行调整,以便更好地对业务作出合理决策。
S102、针对每个异常路径,根据该异常路径中包含的各个子参数的正常值和异常值,确定该异常路径的贡献值和主要子参数。
本申请实施例中,由于异常路径可能是计算公式也可能是维度,而计算公式通常包括多个计算因子,维度通常包括多个数据,因此,异常路径中会包括多个子参数,比如,异常参数“收入”的某个异常路径为计算公式:新客户收入+老客户收入,那么新客户收入、老客户收入就是该个异常路径中包含的子参数,再比如,异常参数“收入”的某个异常路径为维度:地区(具体包括北京地区、上海地区、广州地区、深圳地区),那么北京地区、上海地区、广州地区、深圳地区就是该个异常路径中包含的子参数。
每个子参数的数值都是连续进行获取的,可以获取每个子参数连续多个时刻的数值,若异常参数在某一时刻的数值发生异常,则将该异常参数对应的各个异常路径中包含的子参数在该时刻的数值确定为子参数的异常值,将该时刻的前一时刻的数值确定为子参数的正常值,比如,子参数A是异常参数某个异常路径中包括的子参数,分别获取子参数A在t0、t1、t2、t3、t4、t5、t6时刻的数值,若异常参数在t6时刻的数值发生异常,则将t6时刻的数值确定为子参数A的异常值,将t5时刻的数值确定为子参数A的正常值。
由于每个异常参数可以对应多个异常路径,需要从多个异常路径中选择出唯一一个异常路径,该异常路径是最优的异常路径,基于该个选择出的异常路径继续挖掘异常参数的参数异常原因,使用贡献值能够判断每个异常路径对异常参数发生异常的影响程度,异常路径的贡献值越大说明这个异常路径对异常参数发生异常的影响程度越大,因此,需要计算每个异常路径的贡献值。
另外,不仅要确定每一个异常路径对异常参数发生异常的影响程度,还要确定每个异常路径中的每个子参数对异常参数发生异常的影响程度,并将影响程度最大的子参数作为异常路径的主要子参数。
具体的,参见图2所示,图2为本申请实施例提供的另一种参数异常原因的确定方法的流程图,在本申请实施例提供的参数异常原因的确定方法中,通过如下方式确定异常路径的贡献值和主要子参数:
S1021、根据每个异常路径包括的各个子参数的正常值和异常值,确定该异常路径的差距值。
S1022、针对每个异常路径中的每个子参数,根据该异常路径的差距值,各个子参数的正常值和异常值,确定该子参数的子贡献值。
S1023、针对每个异常路径,根据该异常路径中每个子参数的子贡献值,确定该异常路径的贡献值和主要子参数。
综合上述步骤S1021-步骤S1023,对计算公式和维度两种不同的异常路径的贡献值和主要子参数的确定方法分别进行说明:
(1)针对于计算公式:
步骤一:根据计算公式中每个子参数的正常值确定异常参数的正常值,根据计算公式中每个子参数的异常值确定异常参数的异常值,将该异常参数的异常值与该异常参数的正常值的差值,确定为该异常路径的差距值。
比如,异常参数S=B×C+D,异常参数S的正常值S0=B0×C0+D0,异常参数S的异常值S1=B1×C1+D1,则异常参数S在该个异常路径下的差距值ΔS=S1-S0。
步骤二:利用连环替代法逐次替代之前变量,求得每个子参数的子贡献值,比如,通过如下方式计算子参数B、C、D的子贡献值:
ΔB=B1×C0+D0-B0×C0+D0;
ΔC=B1×C1+D0-B1×C0+D0;
ΔD=B1×C1+D1-B1×C1+D0。
步骤三:针对每个异常路径,根据该异常路径中每个子参数的子贡献值,将最大的子贡献值确定为该异常路径的贡献值,将子贡献值最大的子参数确定为该异常路径的主要子参数。
比如,异常参数S在B×C+D这个异常路径下的贡献值Q(s,a)=max(ΔB,ΔC,ΔD),如果ΔD最大,则D为该异常路径的主要子参数。
(1)针对于维度:
步骤一:根据维度中每个子参数的正常值确定异常参数的正常值,根据维度中每个子参数的异常值确定异常参数的异常值,将该异常参数的异常值与该异常参数的正常值的差值,确定为该异常路径的差距值。
步骤二:针对每个异常路径中的每个子参数,计算该子参数的异常值与正常值的差值,将所述差值与该个异常路径的差距值的比值作为该子参数的子贡献值。
步骤三:针对每个异常路径,根据该异常路径中每个子参数的子贡献值,将最大的子贡献值确定为该异常路径的贡献值,将子贡献值最大的子参数确定为该异常路径的主要子参数。
S103、根据每个异常路径的贡献值,该异常路径以及该异常路径的上级异常路径分别被访问的次数,确定该异常路径的异常分析值。
本申请实施例中,利用UCB算法选择异常路径,即利用UCB算法确定每个异常路径的异常分析值,具体的,每个异常路径的异常分析值A的计算公式为:
其中,N(s)为该异常路径的上级异常路径被访问的次数,N(s,a)为该异常路径被访问的次数,a为异常参数的每个异常路径,A(s)为包含异常参数每个异常路径的集合。
举例说明什么是异常路径的上级异常路径,对于异常参数A(A为首个异常参数),存在两个异常路径A=B1+B2=C1+C2,假设B1+B2的异常分析值更大,B1为异常路径B1+B2的主要子参数,且B1=D1+D2=E1+E2,假设D1+D2的异常分析值更大,D1为异常路径D1+D2的主要子参数,且D1=F1+F2=G1+G2,当D1更新为新的异常参数时,针对于异常路径F1+F2,其上级异常路径为B1+B2,即追溯首个异常参数A的异常原因,追溯的异常路径包括:A=B1+B2→B1=D1+D2→D1=F1+F2,异常路径B1+B2、D1+D2、F1+F2的上级异常路径均为B1+B2。
S104、基于每个异常路径的异常分析值,将异常分析值满足预设要求的异常路径的主要子参数作为新的异常参数,直至满足退出条件时,将异常分析值满足预设要求的异常路径的主要子参数确定为根源异常参数,将异常分析值满足预设要求的异常路径以及该异常路径的关联异常路径确定为总异常路径。
本申请实施例中,在确定每个异常路径的异常分析值后,将异常分析值最大的异常路径作为异常参数最有可能发生异常的那个路径,将该异常路径的主要子参数作为新的异常参数,并重复步骤S101-步骤S104,直至满足退出条件,将异常分析值最大的异常路径的主要子参数确定为根源异常参数,其中,根源异常参数是导致首个异常参数发生异常的根本原因,根据上述的例子,如果异常路径F1+F2中F1的子贡献值大于F2的子贡献值,则将F1确定为根源异常参数,即首个异常参数A发生异常的根本原因是F1发生了异常,并且,将异常路径F1+F2以及异常路径F1+F2的关联异常路径A=B1+B2、B1=D1+D2、D1=F1+F2确定为首个异常参数A发生异常的总异常路径,这里,将根源异常参数和总异常路径确定为参数异常原因。
在确定了新的异常参数后,更新相关的异常路径的访问次数,比如,将该新的异常参数所在的异常路径的访问次数加一,将该新的异常参数所在的异常路径的上级异常路径的访问次数加一。
其中,退出条件包括:
(1)不存在计算所述异常分析值满足预设要求的异常路径的主要子参数的计算公式;比如,不存在计算主要子参数F1的计算公式。
(2)监测作为新的异常参数的主要子参数的数量,所述数量大于第一预设阈值;比如,从首个异常参数A到主要子参数F1,异常参数一共被拆解了3次,如果3大于第一预设阈值,则不再进行拆解,F1为根源异常参数。这里,第一预设阈值是用户根据实际需求设置的。
(3)所述异常分析值满足预设要求的异常路径的贡献值小于第二预设阈值。这里,第二预设阈值是用户根据实际需求设置的。
当满足上述任意一条退出条件时,不再确定新的异常参数,可以确定根源异常参数和总异常路径。
需要说明的是,通过如下方式确定目标异常路径的关联异常路径:
方式一:若异常路径中包括所述目标异常路径对应的异常参数,则将该异常路径确定为所述目标异常路径的关联异常路径。
本申请中是逐级挖掘通向根源异常参数的异常路径的,针对某一个异常路径,通往该异常路径的所有层级的异常路径都是该异常路径的关联异常路径,具体的,针对某一个异常路径,该异常路径最直接的关联异常路径中一定包括该异常路径对应的异常参数,比如,异常参数A的异常路径分别为:A=B1+B2、B1=D1+D2、D1=F1+F2,对于异常路径F1+F2,其最直接的关联异常路径D1+D2中包括异常路径F1+F2对应的异常参数D1。
方式二:若异常路径中包括所述目标异常路径的任一关联异常路径对应的异常参数,则将该异常路径确定为所述目标异常路径的关联异常路径。
为了能够找到异常路径的所有关联异常路径,要找全所有层级的关联异常路径,比如,在找到异常路径F1+F2的直接关联异常路径D1+D2后,关联异常路径D1+D2对应的异常参数为B1,包含B1的异常路径为B1+B2,即B1+B2也是异常路径F1+F2的关联异常路径,这样逐个层级的寻找,能够确定异常路径F1+F2的所有关联异常路径。
另外,在确定了一个异常路径的所有关联异常路径后,通过如下方式确定目标异常路径的上级异常路径:
若目标异常路径的任一关联异常路径对应的异常参数为首个异常参数,则将该关联异常路径确定为上级异常路径。
上级异常路径是最上层级的关联异常路径,其对应的异常参数一定是首个异常参数,比如,异常路径F1+F2的上级异常路径为B1+B2。
在实际中,可以将根源异常参数和总异常路径发送至目标客户端,以使目标客户端能够显示根源异常参数和总异常路径,使对应的用户能够了解首个异常参数发生异常的原因。
本申请实施例提供的一种参数异常原因的确定方法,能够基于异常参数每个异常路径的异常分析值,从多个异常路径中选择最有可能发生的总异常路径,并通过对异常路径中每个子参数的子贡献值的确定,精准定位到对参数发生异常影响最大的根源异常参数,提高了确定参数异常原因的准确度。
进一步的,参见图3所示,图3为本申请实施例提供的另一种参数异常原因的确定方法的流程图,在本申请实施例提供的参数异常原因的确定方法中,通过如下方式筛选出所述异常参数:
S301、针对每个核心参数,根据该核心参数在历史时间段内的历史参数值,该核心参数的预测时间段的时间长度,以及该核心参数在历史时间段和预测时间段内的周期、节假日日期和特殊事件日期,确定该核心参数在所述预测时间段内的预测值、上界值以及下界值。
本申请实施例中,利用prophet算法从多个核心参数中筛选异常参数,这里,核心参数是用户根据实际情况进行设置的,一般是行业内较为核心的参数,即企业管理者在管理业务的过程中较为关注的一些指标,通过对各个参数进行筛选,确定哪些是核心参数,哪些是非核心参数,再对核心参数是否异常进行判断,能够提高参数异常判断的效率,在较短的时间内了解业务的核心参数是否发生异常,提高工作效率,使用prophet算法同时考虑了趋势性、周期性以及节假日等影响因素,针对每个核心参数,具体执行步骤如下:
步骤一:输入核心参数在历史时间段内的历史参数值,具体的,可以是核心参数的历史时间序列值,比如,核心参数在过去一年内每天的数据,即(s1,s2…sn)。
步骤二:输入核心参数的预测时间段的时间长度,具体的,可以是核心参数的预测时间序列的长度,比如,预测未来一周每日的数据,此时,时间长度为7。
步骤三:设置prophet算法的多个参数,具体包括,核心参数在历史时间段和预测时间段内的周期、节假日日期和特殊事件日期,比如,在过去一年内以及未来一周内参数变化的周期,所有的节假日的日期,特殊事件发生的日期,这里,特殊事件可以是促销活动、店庆活动等可能影响核心参数值变化的事件。
步骤四:输出结果,具体包括,预测时间段内每一个时间点的预测值f、上界值(预测值上界)u、下界值(预测值下界)l,比如,未来7天内每一天的预测值、上界值、下界值。
S302、根据每个核心参数在所述预测时间段内的实际值、上界值以及下界值,从各个核心参数中筛选出异常参数。
本申请实施例中,每个核心参数在预测时间段内均对应有实际值,预测时间段是已经发生的时间段,针对每个核心参数,将该核心参数的上界值和下界值,与该核心参数的实际值分别进行比较,以判断该核心参数是否为异常参数,具体的,判断规则如下:
规则1:若实际值大于上界值,则判断出现异常增长;
规则2:若实际值小于下界值,则判断出现异常下降;
若核心参数的实际值满足以上任一规则,则确定该核心参数为异常参数,参照上述步骤S101-步骤S104对该异常参数的参数异常原因进行确定。
基于同一发明构思,本申请实施例中还提供了与参数异常原因的确定方法对应的参数异常原因的确定装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述参数异常原因的确定方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参见图4所示,图4为本申请实施例提供的一种参数异常原因的确定装置的结构示意图,该确定装置包括:
第一确定模块401,用于根据计算异常参数所使用的计算公式以及该异常参数对应的各个维度,确定该异常参数的各个异常路径;
第二确定模块402,用于针对每个异常路径,根据该异常路径中包含的各个子参数的正常值和异常值,确定该异常路径的贡献值和主要子参数;
第三确定模块403,用于根据每个异常路径的贡献值,该异常路径以及该异常路径的上级异常路径分别被访问的次数,确定该异常路径的异常分析值;
第四确定模块404,用于基于每个异常路径的异常分析值,将异常分析值满足预设要求的异常路径的主要子参数作为新的异常参数,直至满足退出条件时,将异常分析值满足预设要求的异常路径的主要子参数确定为根源异常参数,将异常分析值满足预设要求的异常路径以及该异常路径的关联异常路径确定为总异常路径。
在一种可能的实施方式中,所述确定装置还包括:
第五确定模块,用于针对每个核心参数,根据该核心参数在历史时间段内的历史参数值,该核心参数的预测时间段的时间长度,以及该核心参数在历史时间段和预测时间段内的周期、节假日日期和特殊事件日期,确定该核心参数在所述预测时间段内的预测值、上界值以及下界值;
筛选模块,用于根据每个核心参数在所述预测时间段内的实际值、上界值以及下界值,从各个核心参数中筛选出异常参数。
在一种可能的实施方式中,所述第二确定模块402,在针对每个异常路径,根据该异常路径中包含的各个子参数的正常值和异常值,确定该异常路径的贡献值和主要子参数时,包括:
根据每个异常路径包括的各个子参数的正常值和异常值,确定该异常路径的差距值;
针对每个异常路径中的每个子参数,根据该异常路径的差距值,各个子参数的正常值和异常值,确定该子参数的子贡献值;
针对每个异常路径,根据该异常路径中每个子参数的子贡献值,确定该异常路径的贡献值和主要子参数。
在一种可能的实施方式中,所述退出条件包括:
不存在计算所述异常分析值满足预设要求的异常路径的主要子参数的计算公式;或者,
监测作为新的异常参数的主要子参数的数量,所述数量大于第一预设阈值;或者,
所述异常分析值满足预设要求的异常路径的贡献值小于第二预设阈值。
在一种可能的实施方式中,所述确定装置还包括:
发送模块,用于将所述根源异常参数和所述总异常路径发送至目标客户端。
在一种可能的实施方式中,所述确定装置还包括:
第六确定模块,用于若异常路径中包括所述目标异常路径对应的异常参数,则将该异常路径确定为所述目标异常路径的关联异常路径;
第七确定模块,用于若异常路径中包括所述目标异常路径的任一关联异常路径对应的异常参数,则将该异常路径确定为所述目标异常路径的关联异常路径。
在一种可能的实施方式中,所述确定装置还包括:
第八确定模块,用于若目标异常路径的任一关联异常路径对应的异常参数为首个异常参数,则将该关联异常路径确定为上级异常路径。
本申请实施例提供的一种参数异常原因的确定装置,能够基于异常参数每个异常路径的异常分析值,从多个异常路径中选择最有可能发生的总异常路径,并通过对异常路径中每个子参数的子贡献值的确定,精准定位到对参数发生异常影响最大的根源异常参数,提高了确定参数异常原因的准确度。
参见图5所示,图5为本申请实施例提供的一种电子设备的结构示意图,该电子设备500包括:处理器501、存储器502和总线503,所述存储器502存储有所述处理器501可执行的机器可读指令,当电子设备运行时,所述处理器501与所述存储器502之间通过总线503通信,所述处理器501执行所述机器可读指令,以执行如上述参数异常原因的确定方法的步骤。
具体地,上述存储器502和处理器501能够为通用的存储器和处理器,这里不做具体限定,当处理器501运行存储器502存储的计算机程序时,能够执行上述参数异常原因的确定方法。
对应于上述参数异常原因的确定方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述参数异常原因的确定方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种参数异常原因的确定方法,其特征在于,所述确定方法包括:
根据计算异常参数所使用的计算公式以及该异常参数对应的各个维度,确定该异常参数的各个异常路径;
针对每个异常路径,根据该异常路径中包含的各个子参数的正常值和异常值,确定该异常路径的贡献值和主要子参数;
根据每个异常路径的贡献值,该异常路径以及该异常路径的上级异常路径分别被访问的次数,确定该异常路径的异常分析值;
基于每个异常路径的异常分析值,将异常分析值满足预设要求的异常路径的主要子参数作为新的异常参数,直至满足退出条件时,将异常分析值满足预设要求的异常路径的主要子参数确定为根源异常参数,将异常分析值满足预设要求的异常路径以及该异常路径的关联异常路径确定为总异常路径。
2.根据权利要求1所述的确定方法,其特征在于,通过如下方式筛选出所述异常参数:
针对每个核心参数,根据该核心参数在历史时间段内的历史参数值,该核心参数的预测时间段的时间长度,以及该核心参数在历史时间段和预测时间段内的周期、节假日日期和特殊事件日期,确定该核心参数在所述预测时间段内的预测值、上界值以及下界值;
根据每个核心参数在所述预测时间段内的实际值、上界值以及下界值,从各个核心参数中筛选出异常参数。
3.根据权利要求1所述的确定方法,其特征在于,所述针对每个异常路径,根据该异常路径中包含的各个子参数的正常值和异常值,确定该异常路径的贡献值和主要子参数,包括:
根据每个异常路径包括的各个子参数的正常值和异常值,确定该异常路径的差距值;
针对每个异常路径中的每个子参数,根据该异常路径的差距值,各个子参数的正常值和异常值,确定该子参数的子贡献值;
针对每个异常路径,根据该异常路径中每个子参数的子贡献值,确定该异常路径的贡献值和主要子参数。
4.根据权利要求1所述的确定方法,其特征在于,所述退出条件包括:
不存在计算所述异常分析值满足预设要求的异常路径的主要子参数的计算公式;或者,
监测作为新的异常参数的主要子参数的数量,所述数量大于第一预设阈值;或者,
所述异常分析值满足预设要求的异常路径的贡献值小于第二预设阈值。
5.根据权利要求1所述的确定方法,其特征在于,所述确定方法还包括:
将所述根源异常参数和所述总异常路径发送至目标客户端。
6.根据权利要求1所述的确定方法,其特征在于,通过如下方式确定目标异常路径的关联异常路径:
若异常路径中包括所述目标异常路径对应的异常参数,则将该异常路径确定为所述目标异常路径的关联异常路径;或者,
若异常路径中包括所述目标异常路径的任一关联异常路径对应的异常参数,则将该异常路径确定为所述目标异常路径的关联异常路径。
7.根据权利要求6所述的确定方法,其特征在于,通过如下方式确定目标异常路径的上级异常路径:
若目标异常路径的任一关联异常路径对应的异常参数为首个异常参数,则将该关联异常路径确定为上级异常路径。
8.一种参数异常原因的确定装置,其特征在于,所述确定装置包括:
第一确定模块,用于根据计算异常参数所使用的计算公式以及该异常参数对应的各个维度,确定该异常参数的各个异常路径;
第二确定模块,用于针对每个异常路径,根据该异常路径中包含的各个子参数的正常值和异常值,确定该异常路径的贡献值和主要子参数;
第三确定模块,用于根据每个异常路径的贡献值,该异常路径以及该异常路径的上级异常路径分别被访问的次数,确定该异常路径的异常分析值;
第四确定模块,用于基于每个异常路径的异常分析值,将异常分析值满足预设要求的异常路径的主要子参数作为新的异常参数,直至满足退出条件时,将异常分析值满足预设要求的异常路径的主要子参数确定为根源异常参数,将异常分析值满足预设要求的异常路径以及该异常路径的关联异常路径确定为总异常路径。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至7任一项所述的参数异常原因的确定方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一项所述的参数异常原因的确定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110858779.0A CN113516518B (zh) | 2021-07-28 | 2021-07-28 | 参数异常原因的确定方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110858779.0A CN113516518B (zh) | 2021-07-28 | 2021-07-28 | 参数异常原因的确定方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113516518A true CN113516518A (zh) | 2021-10-19 |
CN113516518B CN113516518B (zh) | 2024-04-05 |
Family
ID=78068795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110858779.0A Active CN113516518B (zh) | 2021-07-28 | 2021-07-28 | 参数异常原因的确定方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113516518B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108959415A (zh) * | 2018-06-07 | 2018-12-07 | 北京奇艺世纪科技有限公司 | 一种异常维度定位方法、装置及电子设备 |
CN111078521A (zh) * | 2019-12-18 | 2020-04-28 | 北京三快在线科技有限公司 | 异常事件的分析方法、装置、设备、系统及存储介质 |
CN111444247A (zh) * | 2020-06-17 | 2020-07-24 | 北京必示科技有限公司 | 一种基于kpi指标的根因定位方法、装置及存储介质 |
CN112187554A (zh) * | 2020-12-01 | 2021-01-05 | 北京蒙帕信创科技有限公司 | 一种基于蒙特卡洛树搜索的运维系统故障定位方法和系统 |
-
2021
- 2021-07-28 CN CN202110858779.0A patent/CN113516518B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108959415A (zh) * | 2018-06-07 | 2018-12-07 | 北京奇艺世纪科技有限公司 | 一种异常维度定位方法、装置及电子设备 |
CN111078521A (zh) * | 2019-12-18 | 2020-04-28 | 北京三快在线科技有限公司 | 异常事件的分析方法、装置、设备、系统及存储介质 |
CN111444247A (zh) * | 2020-06-17 | 2020-07-24 | 北京必示科技有限公司 | 一种基于kpi指标的根因定位方法、装置及存储介质 |
CN112187554A (zh) * | 2020-12-01 | 2021-01-05 | 北京蒙帕信创科技有限公司 | 一种基于蒙特卡洛树搜索的运维系统故障定位方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113516518B (zh) | 2024-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11734315B2 (en) | Method and system for implementing efficient classification and exploration of data | |
Tavana et al. | Multi-objective control chart design optimization using NSGA-III and MOPSO enhanced with DEA and TOPSIS | |
JP6555061B2 (ja) | クラスタリングプログラム、クラスタリング方法、および情報処理装置 | |
CN112527827B (zh) | 用于多维数据的自动洞察 | |
JP6531821B2 (ja) | 予測モデル更新システム、予測モデル更新方法および予測モデル更新プログラム | |
CN112052138A (zh) | 业务数据质量检测方法、装置、计算机设备及存储介质 | |
US20210027191A1 (en) | Efficiently determining local machine learning model feature contributions | |
CN110889724A (zh) | 客户流失预测方法、装置、电子设备和存储介质 | |
CN112734559A (zh) | 企业信用风险评价方法、装置及电子设备 | |
US10713573B2 (en) | Methods and systems for identifying and prioritizing insights from hidden patterns | |
US20230004560A1 (en) | Systems and methods for monitoring user-defined metrics | |
JP6704089B2 (ja) | ライブラリ検索装置、ライブラリ検索システム、及びライブラリ検索方法 | |
JP2013065084A (ja) | 予測方法及び予測プログラム | |
CN114118770A (zh) | 一种指标计算方法及装置 | |
US7647333B2 (en) | Cube-based percentile calculation | |
EP2731021B1 (en) | Apparatus, program, and method for reconciliation processing in a graph database | |
CN113516518A (zh) | 参数异常原因的确定方法、装置、电子设备及存储介质 | |
CN114510584B (zh) | 文献识别方法、装置、电子设备以及计算机可读存储介质 | |
US20230153647A1 (en) | Recommendations using graph machine learning-based regression | |
CN115936875A (zh) | 金融产品挂单处理方法和装置 | |
Cornuéjols et al. | On the safety of Gomory cut generators | |
CN115563310A (zh) | 一种关键业务节点的确定方法、装置、设备及介质 | |
CN114118637A (zh) | 一种配件需求的预测模型构建方法、装置及计算机设备 | |
CN111008749B (zh) | 一种需求预测的方法及装置 | |
CN114117066A (zh) | 审计调阅资料文件夹的推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |