CN109656969A - 数据异动分析方法及装置 - Google Patents
数据异动分析方法及装置 Download PDFInfo
- Publication number
- CN109656969A CN109656969A CN201811369529.5A CN201811369529A CN109656969A CN 109656969 A CN109656969 A CN 109656969A CN 201811369529 A CN201811369529 A CN 201811369529A CN 109656969 A CN109656969 A CN 109656969A
- Authority
- CN
- China
- Prior art keywords
- feature
- service
- parameter
- target service
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 24
- 230000002159 abnormal effect Effects 0.000 claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000004422 calculation algorithm Methods 0.000 claims description 21
- 238000012216 screening Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 7
- 241000208340 Araliaceae Species 0.000 claims description 4
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 4
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 4
- 235000008434 ginseng Nutrition 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000007405 data analysis Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 7
- 238000005194 fractionation Methods 0.000 description 5
- 230000000306 recurrent effect Effects 0.000 description 5
- 241000039077 Copula Species 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000012141 concentrate Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 244000062793 Sorghum vulgare Species 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 235000019713 millet Nutrition 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数据分析技术领域,尤其涉及数据异动分析方法及装置,所述方法包括:确定待分析的目标业务参数;根据目标业务参数所处的业务场景,获取与目标业务参数关联的多个业务特征;对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,预设关联条件为在同一关联参数下发生数据异常情况,特征关联项集中包含满足所述预设关联条件的多个业务特征;从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。本发明能够明确致使目标业务参数发生异常的业务特征之间的内在对应关系,从而更加准确、快速地定位出目标业务参数的异常原因。
Description
技术领域
本发明涉及数据分析技术领域,尤其涉及数据异动分析方法及装置。
背景技术
随着科学技术的不断发展,为了给人们的生活带来更多便利,出现了越来越多的产品和服务,这些产品和服务覆盖了人们生活的方方面面,在产品和服务应用的过程中包含各类业务线。各类业务线在运作时将不断地获得业务数据,而业务数据往往会出现异常的情况,例如,某日的新增用户量激增等等。现有技术在面对业务数据的异常时,往往盲目地对异常的业务数据进行分析,难以快速准确地找到异常的原因。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据异动分析方法及装置。
依据本发明的第一个方面,本发明提供一种数据异动分析方法,所述方法包括:
确定待分析的目标业务参数;
根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征;
对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征;
从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
优选的,所述获取与所述目标业务参数关联的多个业务特征,包括:
对所述目标业务参数进行业务特征分级拆分,获得多个业务特征。
优选的,所述关联参数包括时间参数和与所述目标业务参数关联的业务特征参数中的至少一种参数。
优选的,所述从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征,包括:
从所述至少一个特征关联项集中筛选出频繁项集;
计算筛选出的各个频繁项集的置信度;
将置信度大于预设置信度阈值的频繁项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
优选的,所述从所述至少一个特征关联项集中筛选出频繁项集,包括:
基于频繁项算法从所述至少一个特征关联项集中筛选出频繁项集。
优选的,所述确定待分析的目标业务参数,包括:
将截止当前时刻产生的历史业务数据中存在异常业务数据的业务参数确定为目标业务参数;或
将当前时刻之后产生的业务数据中存在异常业务数据的业务参数确定为目标业务参数。
依据本发明的第二个方面,本发明提供一种数据异动分析装置,所述装置包括:
第一确定模块,用于确定待分析的目标业务参数;
获取模块,用于根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征;
获得模块,用于对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征;
第二确定模块,用于从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
优选的,所述获取模块,具体用于:
对所述目标业务参数进行业务特征分级拆分,获得多个业务特征。
优选的,所述关联参数包括时间参数和与所述目标业务参数关联的业务特征参数中的至少一种参数。
优选的,所述第二确定模块,包括:
筛选单元,用于从所述至少一个特征关联项集中筛选出频繁项集;
计算单元,用于计算筛选出的各个频繁项集的置信度;
确定单元,用于将置信度大于预设置信度阈值的频繁项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
优选的,所述筛选单元,具体用于:
基于频繁项算法从所述至少一个特征关联项集中筛选出频繁项集。
优选的,所述第一确定模块,包括:
第一确定单元,用于将截止当前时刻产生的历史业务数据中存在异常业务数据的业务参数确定为目标业务参数;或
第二确定单元,用于将当前时刻之后产生的业务数据中存在异常业务数据的业务参数确定为目标业务参数。
依据本发明的第三个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前述第一个方面中的方法步骤。
依据本发明的第四个方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如前述第一个方面中的方法步骤。
根据本发明的数据异动分析方法及装置,首先确定待分析的目标业务参数,接着根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征,再对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征,最后从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征,通过上述方法能够明确致使目标业务参数发生异常的业务特征之间的内在对应关系,从而更加准确、快速地定位出目标业务参数的异常原因,提高了确定目标业务参数异常原因的效率和准确度。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考图形表示相同的部件。在附图中:
图1示出了本发明实施例中数据异动分析方法的流程图;
图2示出了本发明实施例中数据异动分析装置的结构图;
图3示出了本发明实施例中计算机设备的结构图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供一种数据异动分析方法,所述方法应用于电子设备中,具体的,该方法可以应用在依托于电子设备的各类产品和服务中,例如,电子设备中的应用程序或网站等等,这些产品和服务中包含各类业务线,其中,电子设备可以为手机、平板电脑或计算机等等。参见图1,本发明实施例中的数据异动分析方法包括以下步骤:
步骤101:确定待分析的目标业务参数。
具体来讲,业务线中包含诸多业务参数,业务参数为用于衡量业务情况的指标,例如,业务参数可以为日新增用户量,业务参数也可以为日新增活跃用户量,等等。在本发明实施例中,首先在若干业务参数中确定出待分析的业务参数,将待分析的业务参数作为目标业务参数。对于如何确定出待分析的目标业务参数,下面提供两种具体的实施方式:
在第一种实施方式中,将截止当前时刻产生的历史业务数据中存在异常业务数据的业务参数确定为目标业务参数。
具体来讲,随着时间的推移,对应每个业务参数而言,将会不断的产生业务数据,其中,截止当前时刻所产生的业务数据被称为历史业务数据。在第一种实施方式中,先从历史业务数据中确定出异常业务数据,异常业务数据为满足预设数据异常条件的业务数据,例如,当预设数据异常条件为日新增用户量超过2万时,若某一业务数据表明日新增用户量为3万,则该业务数据即为异常业务数据。在从历史业务数据中确定出异常业务数据之后,将异常业务数据对应的业务参数确定为目标业务参数,例如,若日新增用户量为3万这一业务数据为异常业务数据,则将日新增用户量作为目标业务参数。
进一步来讲,可以基于算法方式或统计方式从历史业务数据中确定出异常业务数据。算法方式包括时序算法、关联规则算法或回归分析算法。统计方式包括预设阈值统计方法、动态阈值统计方法、分位数统计方法或箱线图检测方法。上述算法和统计方法均为现有技术,此处不再赘述。
在第二种实施方式中,将当前时刻之后产生的业务数据中存在异常业务数据的业务参数确定为目标业务参数。
具体来讲,基于历史业务数据可以对当前时刻之后产生的业务数据进行异常业务数据的预测,即,预测当前时刻之后的业务数据是否存在异常业务数据,因此,在第二种实施方式中,先预测当前时刻之后产生的业务数据中的异常业务数据,同样,异常业务数据为满足预设数据异常条件的业务数据,在预测出异常业务数据之后,将异常业务数据对应的业务参数确定为目标业务参数。
进一步来讲,可以基于历史业务数据通过递归神经网络模型从当前时刻之后产生的业务数据中确定出异常业务数据,递归神经网络模型是一种深度学习算法,递归神经网络的隐藏层的节点内具有内部记忆存储功能,随着输入数据的改变,内部记忆内容不断被更新,递归神经网络能够充分利用这种内部记忆存储状态处理任意序列的数据,例如时间序列。递归神经网络模型同样为现有技术,此处不再赘述。
在完成步骤101之后,执行步骤102:根据目标业务参数所处的业务场景,获取与目标业务参数关联的多个业务特征。
具体来讲,在将业务参数放置于业务场景下,业务参数将会与业务特征关联,业务特征为业务参数在业务场景下的特征参数,每个业务参数存在多个业务特征。在本发明实施例中,根据业务场景,获取与目标业务参数关联的多个业务特征。具体地,可以对目标业务参数进行业务特征分级拆分,从而获得多个业务特征,即,先将目标业务参数进行第一级拆分,获得第一级业务特征,接着对第一级业务特征进行第二级拆分,获得第二级业务特征,直至各个业务特征无法继续拆分为止。例如,以目标业务参数为日新增用户量为例,对该目标业务参数进行分级拆分,得到第一级业务特征分别为手机品牌、地域和渠道,可以将手机品牌命名为W1、将地域命名为W2以及将渠道命名为W3,对各个第一级业务特征进一步拆分,与手机品牌对应拆分获得第二级业务特征包括华为、三星、小米和中兴,可以将华为命名为W101、将三星命名为W102、将小米命名为W103以及将中兴命名为W104,与地域对应拆分获得第二级业务特征包括北京、上海和武汉,可以将北京命名为W201、将上海命名为W202以及将武汉命名为W203,与渠道对应拆分获得内部渠道、付费渠道和免费渠道,可以将内部渠道命名为W301、将付费渠道命名为W302以及将免费渠道命名为W303。
在完成步骤102之后,执行步骤103:对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,预设关联条件为在同一关联参数下发生数据异常情况,特征关联项集中包含满足预设关联条件的多个业务特征。
具体来讲,在筛选时,以在同一关联参数下发生数据异常情况作为关联条件,关联参数为时间参数和与目标业务参数关联的业务特征参数中的至少一种参数。
若关联参数为时间参数,则步骤103具体为:对在同一预设时间周期内发生数据异常情况的业务特征进行筛选,获得至少一个特征关联项集,例如,预设时间周期为一天,在获取到大于预设时间周期的预设时间段(如5天)内的业务数据之后,对同一天发生数据异常情况的业务特征进行筛选,若第一天只有W101和W102这两个业务特征发生数据异常情况,第二天没有业务特征发生数据异常情况,第三天只有W101、W202和W203这三个业务特征发生数据异常情况,第四天只有W101、W302和W303这三个业务特征发生数据异常情况,第五天只有W102发生数据异常情况,则最终获得第一特征关联项集为{W101,W102}、第二特征关联项集为{W101,W202,W203}、第三特征关联项集为{W101,W302,W303}。
若关联参数为与目标业务参数关联的业务特征参数,则步骤103具体为:对在同一业务特征下发生数据异常情况的其他业务特征进行筛选,获得至少一个特征关联项集,例如,若将地域作为业务特征参数,则对同一地域发生数据异常情况的其他业务特征进行筛选,若针对武汉而言只有W102和W103这两个业务特征发生数据异常情况,针对上海而言只有W101、W302和W303这三个业务特征发生数据异常情况,针对北京而言没有业务特征发生数据异常情况,则最终获得第一特征关联项集为{W102,W103}、第二特征关联项集为{W101,W302,W303}。
若关联参数包括时间参数和与目标业务参数关联的业务特征参数,则,步骤103具体为:对同一预设时间周期且在同一业务特征下发生数据异常情况的其他业务特征进行筛选,获得至少一个特征关联项集,例如,若所有数据均针对武汉地区,若第一天只有W101和W102这两个业务特征发生数据异常情况,第二天没有业务特征发生数据异常情况,第三天只有W101、W202和W203这三个业务特征发生数据异常情况,第四天没有业务特征发生数据异常情况,第五天只有W102发生数据异常情况,则最终获得第一特征关联项集为{W101,W102}、第二特征关联项集为{W101,W202,W203}。
需要说明的是,在本发明实施例中,发生数据异常情况指的是与业务特征对应的业务数据满足预设数据异常条件,例如,若预设数据异常条件为日新增用户量超过2万,则当业务特征对应的业务数据表明日新增用户量为3万时,表明该业务特征发生数据异常情况。其中,发生数据异常情况也表明存在异常业务数据。
在完成步骤103之后,执行步骤104:从至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使目标业务参数发生异动的关联业务特征。
对于步骤104而言,具体来讲,首先,从至少一个特征关联项集中筛选出频繁项集,计算筛选出的各个频繁项集的置信度,将置信度大于预设置信度阈值的频繁项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。对于如何从至少一个特征关联项集中筛选出频繁项集,可以采用频繁项算法,基于频繁项算法从至少一个特征关联项集中筛选出频繁项集,其中,频繁项算法包括Apriori算法和FP-Growth算法,其中Apriori算法和FP-Growth算法均为现有技术,本申请对选用何种频繁项算法不做限定。另外,在筛选出频繁项集之后,本申请还会计算各个频繁项集的置信度,置信度为用于衡量频繁项集的可靠程度的参数,可以采用现有技术中的任一统计学公式计算获得,本申请对采用何种公式获得频繁项集的置信度不做限定。预设置信度阈值可以根据用户的实际需求进行调整,例如,可以将0.7作为预设置信度阈值,从而将置信度大于0.7的频繁项集作为目标频繁项集,并将目标频繁项集包含的各个业务特征确定为使目标业务参数发生异动的关联业务特征。
例如,针对第一特征关联项集{W101,W102}、第二特征关联项集{W101,W202,W203}和第三特征关联项集为{W101,W302,W303}而言,基于频繁项算法确定出第一特征关联项集和第二特征关联项集为频繁项集,接着,计算第一特征关联项集的置信度以及第二特征关联项集的置信度,若第一特征关联项集的置信度为0.8,第二特征关联项集的置信度为0.4,若预设置信度阈值为0.7,则将第一特征关联项集包含的W101和W102确定为致使目标业务参数发生异动的关联业务特征。
在本发明实施例中,通过先基于频繁项算法从特征关联项集中筛选出频繁项集,再从频繁项集中基于置信度确定出使目标业务参数发生异动的关联业务特征,能够进一步准确地确定出导致目标业务参数出现异动的原因,提高了确定目标业务参数异常原因的效率以及准确度。
基于同一发明构思,本发明实施例还提供一种数据异动分析装置,如图2所示,所述装置包括:
第一确定模块201,用于确定待分析的目标业务参数;
获取模块202,用于根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征;
获得模块203,用于对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征;
第二确定模块204,用于从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
优选的,所述获取模块,具体用于:
对所述目标业务参数进行业务特征分级拆分,获得多个业务特征。
优选的,所述关联参数包括时间参数和与所述目标业务参数关联的业务特征参数中的至少一种参数。
优选的,所述第二确定模块,包括:
筛选单元,用于从所述至少一个特征关联项集中筛选出频繁项集;
计算单元,用于计算筛选出的各个频繁项集的置信度;
确定单元,用于将置信度大于预设置信度阈值的频繁项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
优选的,所述筛选单元,具体用于:
基于频繁项算法从所述至少一个特征关联项集中筛选出频繁项集。
优选的,所述第一确定模块,包括:
第一确定单元,用于将截止当前时刻产生的历史业务数据中存在异常业务数据的业务参数确定为目标业务参数;或
第二确定单元,用于将当前时刻之后产生的业务数据中存在异常业务数据的业务参数确定为目标业务参数。
基于同一发明构思,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述实施例所述的方法步骤。
基于同一发明构思,本发明实施例还提供了一种计算机设备,如图3所示,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该计算机设备可以为包括手机、平板电脑、PDA(Personal DigitalAssistant,个人数字助理)、POS(Point of Sales,销售终端)、车载电脑等任意终端设备,以计算机设备为手机为例:
图3示出的是与本发明实施例提供的计算机设备相关的部分结构的框图。参考图3,该计算机设备包括:存储器301和处理器302。本领域技术人员可以理解,图3中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图3对计算机设备的各个构成部件进行具体的介绍:
存储器301可用于存储软件程序以及模块,处理器302通过运行存储在存储器301的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器301可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储数据(比如音频数据、电话本等)等。此外,存储器301可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器302是计算机设备的控制中心,通过运行或执行存储在存储器301内的软件程序和/或模块,以及调用存储在存储器301内的数据,执行各种功能和处理数据。可选的,处理器302可包括一个或多个处理单元;优选的,处理器302可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。
在本发明实施例中,该计算机设备所包括的处理器302可以具有前述实施例中任一方法步骤所对应的功能。
总之,根据本发明的数据异动分析方法及装置,首先确定待分析的目标业务参数,接着根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征,再对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征,最后从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征,通过上述方法能够明确致使目标业务参数发生异常的业务特征之间的内在对应关系,从而更加准确、快速地定位出目标业务参数的异常原因,提高了确定目标业务参数异常原因的效率和准确度。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
A1、一种数据异动分析方法,其特征在于,所述方法包括:
确定待分析的目标业务参数;
根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征;
对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征;
从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
A2、根据A1所述的数据异动分析方法,其特征在于,所述获取与所述目标业务参数关联的多个业务特征,包括:
对所述目标业务参数进行业务特征分级拆分,获得多个业务特征。
A3、根据A1所述的数据异动分析方法,其特征在于,所述关联参数包括时间参数和与所述目标业务参数关联的业务特征参数中的至少一种参数。
A4、根据A1所述的数据异动分析方法,其特征在于,所述从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征,包括:
从所述至少一个特征关联项集中筛选出频繁项集;
计算筛选出的各个频繁项集的置信度;
将置信度大于预设置信度阈值的频繁项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
A5、根据A4所述的数据异动分析方法,其特征在于,所述从所述至少一个特征关联项集中筛选出频繁项集,包括:
基于频繁项算法从所述至少一个特征关联项集中筛选出频繁项集。
A6、根据A1所述的数据异动分析方法,其特征在于,所述确定待分析的目标业务参数,包括:
将截止当前时刻产生的历史业务数据中存在异常业务数据的业务参数确定为目标业务参数;或
将当前时刻之后产生的业务数据中存在异常业务数据的业务参数确定为目标业务参数。
B7、一种数据异动分析装置,其特征在于,所述装置包括:
第一确定模块,用于确定待分析的目标业务参数;
获取模块,用于根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征;
获得模块,用于对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征;
第二确定模块,用于从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
B8、根据B7所述的数据异动分析装置,其特征在于,所述获取模块,具体用于:
对所述目标业务参数进行业务特征分级拆分,获得多个业务特征。
B9、根据B7所述的数据异动分析装置,其特征在于,所述关联参数包括时间参数和与所述目标业务参数关联的业务特征参数中的至少一种参数。
B10、根据B7所述的数据异动分析装置,其特征在于,所述第二确定模块,包括:
筛选单元,用于从所述至少一个特征关联项集中筛选出频繁项集;
计算单元,用于计算筛选出的各个频繁项集的置信度;
确定单元,用于将置信度大于预设置信度阈值的频繁项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
B11、根据B10所述的数据异动分析装置,其特征在于,所述筛选单元,具体用于:
基于频繁项算法从所述至少一个特征关联项集中筛选出频繁项集。
B12、根据B7所述的数据异动分析装置,其特征在于,所述第一确定模块,包括:
第一确定单元,用于将截止当前时刻产生的历史业务数据中存在异常业务数据的业务参数确定为目标业务参数;或
第二确定单元,用于将当前时刻之后产生的业务数据中存在异常业务数据的业务参数确定为目标业务参数。
C13、一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现根据求A1-A6中任一所述的方法步骤。
C14、一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现根据A1-A6中任一所述的方法步骤。
Claims (10)
1.一种数据异动分析方法,其特征在于,所述方法包括:
确定待分析的目标业务参数;
根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征;
对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征;
从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
2.如权利要求1所述的数据异动分析方法,其特征在于,所述获取与所述目标业务参数关联的多个业务特征,包括:
对所述目标业务参数进行业务特征分级拆分,获得多个业务特征。
3.如权利要求1所述的数据异动分析方法,其特征在于,所述关联参数包括时间参数和与所述目标业务参数关联的业务特征参数中的至少一种参数。
4.如权利要求1所述的数据异动分析方法,其特征在于,所述从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征,包括:
从所述至少一个特征关联项集中筛选出频繁项集;
计算筛选出的各个频繁项集的置信度;
将置信度大于预设置信度阈值的频繁项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
5.如权利要求4所述的数据异动分析方法,其特征在于,所述从所述至少一个特征关联项集中筛选出频繁项集,包括:
基于频繁项算法从所述至少一个特征关联项集中筛选出频繁项集。
6.如权利要求1所述的数据异动分析方法,其特征在于,所述确定待分析的目标业务参数,包括:
将截止当前时刻产生的历史业务数据中存在异常业务数据的业务参数确定为目标业务参数;或
将当前时刻之后产生的业务数据中存在异常业务数据的业务参数确定为目标业务参数。
7.一种数据异动分析装置,其特征在于,所述装置包括:
第一确定模块,用于确定待分析的目标业务参数;
获取模块,用于根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征;
获得模块,用于对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征;
第二确定模块,用于从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
8.如权利要求7所述的数据异动分析装置,其特征在于,所述获取模块,具体用于:
对所述目标业务参数进行业务特征分级拆分,获得多个业务特征。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一权利要求所述的方法步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一权利要求所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811369529.5A CN109656969B (zh) | 2018-11-16 | 2018-11-16 | 数据异动分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811369529.5A CN109656969B (zh) | 2018-11-16 | 2018-11-16 | 数据异动分析方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109656969A true CN109656969A (zh) | 2019-04-19 |
CN109656969B CN109656969B (zh) | 2024-08-23 |
Family
ID=66111331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811369529.5A Active CN109656969B (zh) | 2018-11-16 | 2018-11-16 | 数据异动分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109656969B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111858245A (zh) * | 2020-07-17 | 2020-10-30 | 北京奇艺世纪科技有限公司 | 一种异常数据的分析方法、装置、电子设备及存储介质 |
Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101739818A (zh) * | 2009-11-19 | 2010-06-16 | 北京世纪高通科技有限公司 | 基于关联规则的道路交通事故数据挖掘方法及装置 |
CN102681011A (zh) * | 2011-03-15 | 2012-09-19 | 无锡物联网产业研究院 | 一种地震数据的挖掘方法和系统 |
US20120254242A1 (en) * | 2011-03-31 | 2012-10-04 | Infosys Technologies Limited | Methods and systems for mining association rules |
CN103368921A (zh) * | 2012-04-06 | 2013-10-23 | 三星电子(中国)研发中心 | 用于智能设备的分布式用户建模系统和方法 |
CN104657915A (zh) * | 2015-03-10 | 2015-05-27 | 国家电网公司 | 一种动态自适应的电力系统终端安全威胁评估方法 |
CN104794234A (zh) * | 2015-05-06 | 2015-07-22 | 华北电力大学 | 用于同业对标的数据处理方法和装置 |
CN105302657A (zh) * | 2015-11-05 | 2016-02-03 | 网易宝有限公司 | 一种异常情况分析方法和装置 |
CN105606958A (zh) * | 2015-12-31 | 2016-05-25 | 国网浙江奉化市供电公司 | 电力系统故障信息的处理方法、系统及装置 |
CN106600115A (zh) * | 2016-11-28 | 2017-04-26 | 湖北华中电力科技开发有限责任公司 | 一种企业信息系统运维智能分析方法 |
CN107092993A (zh) * | 2017-06-05 | 2017-08-25 | 国网陕西省电力公司电力科学研究院 | 基于灾害类型和线路信息的重合闸成功率关联分析方法 |
CN107391515A (zh) * | 2016-05-17 | 2017-11-24 | 李明轩 | 基于关联规则分析的电力系统指标分析方法 |
CN107392645A (zh) * | 2017-06-20 | 2017-11-24 | 小草数语(北京)科技有限公司 | 用户挖掘方法、装置及其设备 |
CN107451708A (zh) * | 2017-04-26 | 2017-12-08 | 国家电网公司 | 一种基于Apriori算法的电网设备监控信息置信关联分析方法 |
CN108021937A (zh) * | 2017-11-28 | 2018-05-11 | 国网辽宁省电力有限公司 | 基于成本关联的数据变动识别网络及其分类器布点方法 |
CN108111346A (zh) * | 2017-12-19 | 2018-06-01 | 深圳市麦斯杰网络有限公司 | 告警关联分析中频繁项集的确定方法、装置及存储介质 |
CN108156037A (zh) * | 2017-12-29 | 2018-06-12 | 中国移动通信集团江苏有限公司 | 告警关联分析方法、装置、设备及介质 |
CN108255996A (zh) * | 2017-12-29 | 2018-07-06 | 西安交大捷普网络科技有限公司 | 基于Apriori算法的安全日志分析方法 |
CN108446184A (zh) * | 2018-02-23 | 2018-08-24 | 北京天元创新科技有限公司 | 分析故障根原因的方法和系统 |
CN108650684A (zh) * | 2018-02-12 | 2018-10-12 | 中国联合网络通信集团有限公司 | 一种关联规则确定方法及装置 |
CN108768753A (zh) * | 2018-06-26 | 2018-11-06 | 腾讯科技(深圳)有限公司 | 告警源的定位方法、装置、存储介质及电子装置 |
-
2018
- 2018-11-16 CN CN201811369529.5A patent/CN109656969B/zh active Active
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101739818A (zh) * | 2009-11-19 | 2010-06-16 | 北京世纪高通科技有限公司 | 基于关联规则的道路交通事故数据挖掘方法及装置 |
CN102681011A (zh) * | 2011-03-15 | 2012-09-19 | 无锡物联网产业研究院 | 一种地震数据的挖掘方法和系统 |
US20120254242A1 (en) * | 2011-03-31 | 2012-10-04 | Infosys Technologies Limited | Methods and systems for mining association rules |
CN103368921A (zh) * | 2012-04-06 | 2013-10-23 | 三星电子(中国)研发中心 | 用于智能设备的分布式用户建模系统和方法 |
CN104657915A (zh) * | 2015-03-10 | 2015-05-27 | 国家电网公司 | 一种动态自适应的电力系统终端安全威胁评估方法 |
CN104794234A (zh) * | 2015-05-06 | 2015-07-22 | 华北电力大学 | 用于同业对标的数据处理方法和装置 |
CN105302657A (zh) * | 2015-11-05 | 2016-02-03 | 网易宝有限公司 | 一种异常情况分析方法和装置 |
CN105606958A (zh) * | 2015-12-31 | 2016-05-25 | 国网浙江奉化市供电公司 | 电力系统故障信息的处理方法、系统及装置 |
CN107391515A (zh) * | 2016-05-17 | 2017-11-24 | 李明轩 | 基于关联规则分析的电力系统指标分析方法 |
CN106600115A (zh) * | 2016-11-28 | 2017-04-26 | 湖北华中电力科技开发有限责任公司 | 一种企业信息系统运维智能分析方法 |
CN107451708A (zh) * | 2017-04-26 | 2017-12-08 | 国家电网公司 | 一种基于Apriori算法的电网设备监控信息置信关联分析方法 |
CN107092993A (zh) * | 2017-06-05 | 2017-08-25 | 国网陕西省电力公司电力科学研究院 | 基于灾害类型和线路信息的重合闸成功率关联分析方法 |
CN107392645A (zh) * | 2017-06-20 | 2017-11-24 | 小草数语(北京)科技有限公司 | 用户挖掘方法、装置及其设备 |
CN108021937A (zh) * | 2017-11-28 | 2018-05-11 | 国网辽宁省电力有限公司 | 基于成本关联的数据变动识别网络及其分类器布点方法 |
CN108111346A (zh) * | 2017-12-19 | 2018-06-01 | 深圳市麦斯杰网络有限公司 | 告警关联分析中频繁项集的确定方法、装置及存储介质 |
CN108156037A (zh) * | 2017-12-29 | 2018-06-12 | 中国移动通信集团江苏有限公司 | 告警关联分析方法、装置、设备及介质 |
CN108255996A (zh) * | 2017-12-29 | 2018-07-06 | 西安交大捷普网络科技有限公司 | 基于Apriori算法的安全日志分析方法 |
CN108650684A (zh) * | 2018-02-12 | 2018-10-12 | 中国联合网络通信集团有限公司 | 一种关联规则确定方法及装置 |
CN108446184A (zh) * | 2018-02-23 | 2018-08-24 | 北京天元创新科技有限公司 | 分析故障根原因的方法和系统 |
CN108768753A (zh) * | 2018-06-26 | 2018-11-06 | 腾讯科技(深圳)有限公司 | 告警源的定位方法、装置、存储介质及电子装置 |
Non-Patent Citations (2)
Title |
---|
刘云香 等: "改进的Apriori算法在用户WAP上网的喜好数据挖掘系统中的研究与应用", 《电脑知识与技术》, vol. 11, no. 16, 5 June 2015 (2015-06-05), pages 4 - 5 * |
石百千: "基于关联挖掘的借阅数据分析", 《电脑知识与技术》, vol. 5, no. 27, 25 September 2009 (2009-09-25), pages 7593 - 7595 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111858245A (zh) * | 2020-07-17 | 2020-10-30 | 北京奇艺世纪科技有限公司 | 一种异常数据的分析方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109656969B (zh) | 2024-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108121795A (zh) | 用户行为预测方法及装置 | |
US10387240B2 (en) | System and method for monitoring and measuring application performance using application index | |
CN107885796A (zh) | 信息推荐方法及装置、设备 | |
US20190114649A1 (en) | Method and system for identifying fraudulent publisher networks | |
CN110210227A (zh) | 风险检测方法、装置、设备和存储介质 | |
US20150371163A1 (en) | Churn prediction in a broadband network | |
US9305302B2 (en) | Weighting sentiment information | |
CN109240929A (zh) | 软件质量预测方法、装置、终端和计算机可读存储介质 | |
CN107609004A (zh) | 应用程序埋点方法和装置、计算机设备和存储介质 | |
US20150058077A1 (en) | Reporting results of an ab type of test | |
CN106383882A (zh) | 推荐信息的方法、装置及服务器 | |
CN107908548A (zh) | 一种生成测试用例的方法和装置 | |
US20180089715A1 (en) | System and method for analyzing and predicting emotion reaction | |
CN112948226B (zh) | 一种用户画像绘制方法和装置 | |
Willi et al. | Recurrent neural processes | |
Pourbafrani et al. | Semi-automated time-granularity detection for data-driven simulation using process mining and system dynamics | |
CN109409940A (zh) | 基于路径的浏览处理方法、装置、设备和存储介质 | |
CN109062799A (zh) | 广告场景的回归测试方法、装置及系统 | |
CN115062734A (zh) | 可输出解释性信息的风控建模方法、装置、设备及介质 | |
Bertrand et al. | A survey on the application of process mining to smart spaces data | |
CN109656969A (zh) | 数据异动分析方法及装置 | |
CN109597744A (zh) | 数据异动分析方法及装置 | |
Eken | Assessing personalized software defect predictors | |
Omori et al. | Comparing concept drift detection with process mining tools | |
CN111523921B (zh) | 漏斗分析方法、分析设备、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |