CN109634804A - 数据异动分析方法及装置 - Google Patents

数据异动分析方法及装置 Download PDF

Info

Publication number
CN109634804A
CN109634804A CN201811369533.1A CN201811369533A CN109634804A CN 109634804 A CN109634804 A CN 109634804A CN 201811369533 A CN201811369533 A CN 201811369533A CN 109634804 A CN109634804 A CN 109634804A
Authority
CN
China
Prior art keywords
unusual fluctuation
feature
service parameter
child node
target service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811369533.1A
Other languages
English (en)
Inventor
蒋晓宇
车文彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201811369533.1A priority Critical patent/CN109634804A/zh
Publication of CN109634804A publication Critical patent/CN109634804A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据分析技术领域,尤其涉及数据异动分析方法及装置,所述方法包括:判断目标业务参数是否发生异动;若所述目标业务参数发生异动,确定所述目标业务参数发生异动的原因;基于所述目标业务参数发生异动的原因,建立用于表征业务参数与导致业务参数发生异动的原因之间对应关系的异动原因分析模型;根据用户对所述目标业务参数发生异动的原因的反馈,对所述异动原因分析模型进行更新;利用更新后的所述异动原因分析模型,在所述目标业务参数再次发生异动时确定所述目标业务参数发生异动的原因。本发明能够准确快速的确定出业务参数发生异动的原因。

Description

数据异动分析方法及装置
技术领域
本发明涉及数据分析技术领域,尤其涉及数据异动分析方法及装置。
背景技术
随着科学技术的不断发展,为了给人们的生活带来更多便利,出现了越来越多的产品和服务,这些产品和服务覆盖了人们生活的方方面面,在产品和服务应用的过程中包含各类业务线,例如,新增用户量、新增活跃用户量等等。各类业务线在运作时将不断地获得业务数据,而业务数据往往会出现异常的情况,例如,某日的新增用户量激增等等。现有技术在面对业务数据的异常时,难以快速准确地找到异常的原因。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据异动分析方法及装置。
依据本发明的第一个方面,本发明提供一种数据异动分析方法,所述方法包括:
判断目标业务参数是否发生异动;
若所述目标业务参数发生异动,确定所述目标业务参数发生异动的原因;
基于所述目标业务参数发生异动的原因,建立用于表征业务参数与导致业务参数发生异动的原因之间对应关系的异动原因分析模型;
根据用户对所述目标业务参数发生异动的原因的反馈,对所述异动原因分析模型进行更新;
利用更新后的所述异动原因分析模型,在所述目标业务参数再次发生异动时确定所述目标业务参数发生异动的原因。
优选的,所述确定所述目标业务参数发生异动的原因,包括:
基于数据异动显性分析方法确定所述目标业务参数发生异动的原因;和/或
基于数据异动隐性分析方法确定所述目标业务参数发生异动的原因。
优选的,所述基于数据异动显性分析方法确定所述目标业务参数发生异动的原因,包括:
将所述目标业务参数作为根节点特征,根据所述目标业务参数所处的业务场景,对与所述目标业务参数关联的业务特征进行树结构拆解,获得至少一级子节点特征,并根据各级子节点特征之间的对应关系,建立与所述目标业务参数对应的业务特征树结构;
将与所述目标业务参数对应的业务数据归类到所述业务特征树结构的各个子节点特征中,并确定出各个子节点特征的业务数据情况;
将业务数据情况满足预设节点异常条件的子节点特征区别于其它子节点特征进行标识,并将所述业务数据情况满足预设节点异常条件的子节点特征作为所述目标业务参数发生异动的原因。
优选的,同一级子节点特征中的各个子节点特征互不相同。
优选的,所述将业务数据情况满足预设节点异常条件的子节点特征区别于其它子节点特征进行标识,包括以下方法中的至少一种:
将业务数据情况满足预设节点异常条件的子节点特征以不同的图形区别于其它子节点特征进行标识;
将业务数据情况满足预设节点异常条件的子节点特征以不同的颜色区别于其它子节点特征进行标识;
将业务数据情况满足预设节点异常条件的子节点特征以不同的字符标识方式区别于其它子节点特征进行标识。
优选的,在所述建立与所述目标业务参数对应的业务特征树结构之后,所述方法还包括:
从每一级子节点特征中确定出对上级节点特征具有预设权重的子节点特征为目标子节点特征;
将所述目标子节点特征区别于该级子节点特征中的其它子节点特征进行标识。
优选的,所述从每一级子节点特征中确定出对上级节点特征具有预设权重的子节点特征为目标子节点特征,包括:
获取每一级子节点特征中的各个子节点特征相对于上级节点特征的皮尔森相关系数;
将皮尔森相关系数达到预设相关性阈值的子节点特征确定为所述目标子节点特征。
优选的,所述基于数据异动隐性分析方法确定所述目标业务参数发生异动的原因,包括:
根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征;
对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征;
从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征,并将所述关联业务特征作为所述目标业务参数发生异动的原因。
优选的,所述获取与所述目标业务参数关联的多个业务特征,包括:
对所述目标业务参数进行业务特征分级拆分,获得多个业务特征。
优选的,所述关联参数包括时间参数和与所述目标业务参数关联的业务特征参数中的至少一种参数。
优选的,所述从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征,包括:
从所述至少一个特征关联项集中筛选出频繁项集;
计算筛选出的各个频繁项集的置信度;
将置信度大于预设置信度阈值的频繁项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
优选的,所述从所述至少一个特征关联项集中筛选出频繁项集,包括:
基于频繁项算法从所述至少一个特征关联项集中筛选出频繁项集。
依据本发明的第二个方面,本发明提供一种数据异动分析装置,所述装置包括:
判断模块,用于判断目标业务参数是否发生异动;
第一确定模块,用于若所述目标业务参数发生异动,确定所述目标业务参数发生异动的原因;
建立模块,用于基于所述目标业务参数发生异动的原因,建立用于表征业务参数与导致业务参数发生异动的原因之间对应关系的异动原因分析模型;
更新模块,用于根据用户对所述目标业务参数发生异动的原因的反馈,对所述异动原因分析模型进行更新;
第二确定模块,用于利用更新后的所述异动原因分析模型,在所述目标业务参数再次发生异动时确定所述目标业务参数发生异动的原因。
优选的,所述第一确定模块,包括:
第一确定子模块,用于基于数据异动显性分析方法确定所述目标业务参数发生异动的原因;和/或
第二确定子模块,用于基于数据异动隐性分析方法确定所述目标业务参数发生异动的原因。
优选的,所述第一确定子模块,包括:
拆解单元,用于将所述目标业务参数作为根节点特征,根据所述目标业务参数所处的业务场景,对与所述目标业务参数关联的业务特征进行树结构拆解,获得至少一级子节点特征,并根据各级子节点特征之间的对应关系,建立与所述目标业务参数对应的业务特征树结构;
第一确定单元,用于将与所述目标业务参数对应的业务数据归类到所述业务特征树结构的各个子节点特征中,并确定出各个子节点特征的业务数据情况;
标识单元,用于将业务数据情况满足预设节点异常条件的子节点特征区别于其它子节点特征进行标识,并将所述业务数据情况满足预设节点异常条件的子节点特征作为所述目标业务参数发生异动的原因。
优选的,同一级子节点特征中的各个子节点特征互不相同。
优选的,所述标识单元,包括以下单元中的至少一种:
第一标识子单元,用于将业务数据情况满足预设节点异常条件的子节点特征以不同的图形区别于其它子节点特征进行标识;
第二标识子单元,用于将业务数据情况满足预设节点异常条件的子节点特征以不同的颜色区别于其它子节点特征进行标识;
第三标识子单元,用于将业务数据情况满足预设节点异常条件的子节点特征以不同的字符标识方式区别于其它子节点特征进行标识。
优选的,所述装置还包括:
目标子节点特征确定单元,用于从每一级子节点特征中确定出对上级节点特征具有预设权重的子节点特征为目标子节点特征;
目标子节点特征标识单元,用于将所述目标子节点特征区别于该级子节点特征中的其它子节点特征进行标识。
优选的,所述目标子节点特征确定单元,包括:
获取子单元,用于获取每一级子节点特征中的各个子节点特征相对于上级节点特征的皮尔森相关系数;
确定子单元,用于将皮尔森相关系数达到预设相关性阈值的子节点特征确定为所述目标子节点特征。
优选的,所述第二确定子模块,包括:
获取单元,用于根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征;
获得单元,用于对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征;
第二确定单元,用于从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征,并将所述关联业务特征作为所述目标业务参数发生异动的原因。
优选的,所述获取单元,具体用于:
对所述目标业务参数进行业务特征分级拆分,获得多个业务特征。
优选的,所述关联参数包括时间参数和与所述目标业务参数关联的业务特征参数中的至少一种参数。
优选的,所述第二确定单元,包括:
筛选子单元,用于从所述至少一个特征关联项集中筛选出频繁项集;
计算子单元,用于计算筛选出的各个频繁项集的置信度;
确定子单元,用于将置信度大于预设置信度阈值的频繁项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
优选的,所述筛选子单元,具体用于:
基于频繁项算法从所述至少一个特征关联项集中筛选出频繁项集。
依据本发明的第三个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前述第一个方面中的方法步骤。
依据本发明的第四个方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如前述第一个方面中的方法步骤。
根据本发明的数据异动分析方法及装置,首先判断目标业务参数是否发生异动,若所述目标业务参数发生异动,确定所述目标业务参数发生异动的原因,接着基于所述目标业务参数发生异动的原因,建立用于表征业务参数与导致业务参数发生异动的原因之间对应关系的异动原因分析模型,根据用户对所述目标业务参数发生异动的原因的反馈,对所述异动原因分析模型进行更新,最后利用更新后的所述异动原因分析模型,在所述目标业务参数再次发生异动时确定所述目标业务参数发生异动的原因,通过上述方法在基于目标业务参数发生异动的原因的基础上建立了异动原因分析模块,并结合用户对目标业务参数发生异动的原因的反馈对该异动原因分析模块进行更新,更新后的异动原因分析模块更加符合用户的需求,从而利用更新后的异动原因分析模型对业务参数发生异动的原因进行确定,能够准确快速的确定出业务参数发生异动的原因。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考图形表示相同的部件。在附图中:
图1示出了本发明中数据异动分析方法的流程图;
图2示出了本发明中基于数据异动显性分析方法确定目标业务参数发生异动的原因的流程图;
图3示出了本发明中第一实施例下的业务特征树结构的示意图;
图4示出了本发明中第二实施例下的业务特征树结构的示意图;
图5示出了本发明中基于数据异动隐性分析方法确定目标业务参数发生异动的原因的流程图;
图6示出了本发明中数据异动分析装置的结构图;
图7示出了本发明实施例中计算机设备的结构图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供一种数据异动分析方法,所述方法应用于电子设备中,具体的,该方法可以应用在依托于电子设备的各类产品和服务中,例如,电子设备中的应用程序或网站等等,这些产品和服务中包含各类业务线,其中,电子设备可以为手机、平板电脑或计算机等等。参见图1,本发明实施例中的数据异动分析方法包括以下步骤:
步骤101:判断目标业务参数是否发生异动。
具体来讲,业务线中包含诸多业务参数,业务参数为用于衡量业务情况的指标,例如,业务参数可以为日新增用户量,业务参数也可以为日新增活跃用户量,等等。在本发明实施例中,首先判断目标业务参数是否发生异动,对于如何判断目标业务参数是否发生异动,下面提供两种具体的实施方式:
在第一种实施方式中,监控目标业务参数截止当前时刻产生的历史业务数据是否发生异动。若目标业务参数截止当前时刻产生的历史业务数据发生异动,则表明目标业务参数发生异动,否则表明目标业务参数未发生异动。
具体来讲,随着时间的推移,对应每个业务参数而言,将会不断的产生业务数据,其中,截止当前时刻所产生的业务数据被称为历史业务数据,通过判断历史业务数据中是否存在异常业务数据,以实现监控历史业务数据是否发生异动的效果。异常业务数据为满足预设数据异常条件的业务数据,例如,当预设数据异常条件为日新增用户量超过2万时,若某一业务数据表明日新增用户量为3万,则该业务数据即为异常业务数据。若历史业务数据中存在异常业务数据,则表明目标业务参数发生异动。进一步来讲,可以基于算法方式或统计方式判断历史业务数据中是否存在异常业务数据。算法方式包括时序算法、关联规则算法或回归分析算法。统计方式包括预设阈值统计方法、动态阈值统计方法、分位数统计方法或箱线图检测方法。上述算法和统计方法均为现有技术,此处不再赘述。
在第二种实施方式中,预测目标业务参数在当前时刻之后产生的业务数据是否发生异动。若目标业务参数在当前时刻之后产生的业务数据发生异动,则表明目标业务参数发生异动,否则表明目标业务参数未发生异动。
具体来讲,通过预测目标业务参数在当前时刻之后产生的业务数据中是否存在异常业务数据,以实现预测目标业务参数在当前时刻之后产生的业务数据是否发生异动的效果。进一步来讲,可以基于历史业务数据通过递归神经网络模型预测目标业务参数在当前时刻之后产生的业务数据中是否存在异常业务数据,递归神经网络模型一种深度学习算法,递归神经网络的隐藏层的节点内具有内部记忆存储功能,随着输入数据的改变,内部记忆内容不断被更新,递归神经网络能够充分利用这种内部记忆存储状态处理任意序列的数据,例如时间序列。递归神经网络模型同样为现有技术,此处不再赘述。
在步骤101之后,执行步骤102:若目标业务参数发生异动,确定目标业务参数发生异动的原因。
具体来讲,对于如何确定目标业务参数发生异动的原因,本发明实施例给出以下三种具体实施方式。
在第一种实施方式中,基于数据异动显性分析方法确定所述目标业务参数发生异动的原因。具体来讲基于数据异动显性分析方法确定所述目标业务参数发生异动的原因如图2所示,包括以下步骤:
步骤201:将所述目标业务参数作为根节点特征,根据所述目标业务参数所处的业务场景,对与所述目标业务参数关联的业务特征进行树结构拆解,获得至少一级子节点特征,并根据各级子节点特征之间的对应关系,建立与所述目标业务参数对应的业务特征树结构。
步骤202:将与所述目标业务参数对应的业务数据归类到所述业务特征树结构的各个子节点特征中,并确定出各个子节点特征的业务数据情况。
步骤203:将业务数据情况满足预设节点异常条件的子节点特征区别于其它子节点特征进行标识,并将所述业务数据情况满足预设节点异常条件的子节点特征作为所述目标业务参数发生异动的原因。
在本发明实施例中,通过基于数据异动显性分析方法确定所述目标业务参数发生异动的原因,能够准确、快速以及直观地定位出目标业务参数的异常原因,提高了确定目标业务参数异常原因的效率。
具体来讲,在将业务参数放置于业务场景下,业务参数将会与业务特征关联,业务特征为业务参数在业务场景下的特征参数,每个业务参数存在至少一个业务特征。在本发明实施例中,根据业务场景,将与目标业务参数关联的业务特征进行树结构拆分,对于如何进行树结构拆分,下面给出详细说明:
首先,将目标业务参数作为根节点特征,拆分出第一级子节点特征,接着,对第一级子节点特征中的各个子节点特征进一步拆分,获得第二级子节点特征,接着,对第二级子节点特征中的各个子节点特征进一步拆分,获得第三级子节点特征,依次类推,直至子节点特征无法继续拆分为止。其中,上下级子节点特征之间存在对应关系,同一级子节点特征中的各个子节点特征互不相同。
进一步,在拆分出至少一级子节点特征之后,根据各级子节点特征之间的对应关系建立业务特征树结构。对于一个目标业务参数而言,最终将会建立出一个业务特征树结构。
下面将以目标业务参数为日新增用户量为例给出第一实施例,以对如何建立业务特征树结构进行详细描述:
将日新增用户量作为根节点特征,拆分出的第一级子节点特征包括地域和手机品牌,对地域进行拆分,获得北京、上海和武汉,对手机品牌进行拆分,获得华为、小米和中兴,其中,北京、上海、武汉、华为、小米和中兴均为第二级子节点特征,其中,北京、上海和武汉为相对于地域的第二级子节点特征,北京、上海、武汉和地域具有对应关系,华为、小米和中兴为相对于手机品牌的第二级子节点特征,华为、小米、中兴和手机品牌具有对应关系。对华为进行拆分,获得P20、NOVA和荣耀,其中,P20、NOVA和荣耀为第三级子节点特征,并且,P20、NOVA和荣耀为相对于华为的第三级子节点特征,P20、NOVA、荣耀和华为具有对应关系,最终建立出的业务特征树结构如图3所示。
对于步骤203和步骤204而言,结合前述关于日新增用户量的例子,将与日新增用户量对应的所有业务数据进行归类,确定出各个节点特征的业务数据情况,在归类时,节点特征包含根节点特征和节点特征,即,根据业务数据,统计出:对应日新增用户量的业务数据情况为8万人,对应北京的业务数据情况为2万人,对应上海的业务数据情况为2万人,对应武汉的业务数据情况为4万人,对应华为的业务数据情况为3万人,对应小米的业务数据情况为2万人,对应中兴的业务数据情况为3万人,对应P20的业务数据情况为2万人,对应NOVA的业务数据情况为5千人,对应荣耀的业务数据情况为5千人。
进一步,对于每个节点特征而言,均存在一个对应的预设节点异常条件,不同的节点特征对应的预设节点异常条件可以不同,也可以相同,例如,与北京对应有第一预设节点异常条件,与武汉对应有第二预设节点异常条件,第一预设节点异常条件可以与第二预设节点异常条件相同,如均为:日新增用户量超过3万则判定为出现异常,第一预设节点异常条件也可以与第二预设节点异常条件不相同,如:第一预设节点异常条件为:日新增用户量超过3万则判定为出现异常,第二预设节点异常条件为:日新增用户量超过2万则判定为出现异常。其中,满足预设节点异常条件的子节点特征表明与该子节点特征对应的业务特征出现异常。
对于如何将业务数据情况满足预设节点异常条件的子节点特征区别于其它子节点特征进行标识,包括以下三种方法中的至少一种:
第一种方法为:将业务数据情况满足预设节点异常条件的子节点特征以不同的图形区别于其它子节点特征进行标识。即,业务数据情况满足预设节点异常条件的子节点特征具有第一图形标识方式,其它子节点特征具有第二图形标识方式,第一图形标识方式与第二图形标识方式不同,例如,业务数据情况满足预设节点异常条件的子节点特征以方形进行标识,其它子节点特征以圆形进行标识,进一步,若业务数据情况满足预设节点异常条件的子节点特征包括武汉、华为和荣耀,则在标识后得到的业务特征树结构中,将武汉、华为和荣耀利用方形标识,其余子节点特征利用圆形标识。
第二种方法为:将业务数据情况满足预设节点异常条件的子节点特征以不同的颜色区别于其它子节点特征进行标识。即,业务数据情况满足预设节点异常条件的子节点特征具有第一颜色标识方式,其它子节点特征具有第二颜色标识方式,第一颜色标识方式与第二颜色标识方式不同,例如,业务数据情况满足预设节点异常条件的子节点特征以蓝色进行标识,其它子节点特征以绿色进行标识。进一步,若业务数据情况满足预设节点异常条件的子节点特征包括武汉、华为和荣耀,则在标识后得到的业务特征树结构中,将武汉、华为和荣耀利用蓝色标识,其余子节点特征利用绿色标识。
第三种方法为:将业务数据情况满足预设节点异常条件的子节点特征以不同的字符标识方式区别于其它子节点特征进行标识。即,业务数据情况满足预设节点异常条件的子节点特征具有第一字符标识方式,其它子节点特征具有第二字符标识方式,第一字符标识方式与第二字符标识方式不同,例如,业务数据情况满足预设节点异常条件的子节点特征以楷体进行标识,其它子节点特征以黑体进行标识。进一步,若业务数据情况满足预设节点异常条件的子节点特征包括武汉、华为和荣耀,则在标识后得到的业务特征树结构中,武汉、华为和荣耀利用楷体标识,其余子节点特征利用黑体标识。
需要说明的是,在本发明实施例中,通过建立业务特征树结构,并在业务特征树结构中,将业务数据情况满足预设节点异常条件的子节点特征区别于其它子节点特征进行标识,能够准确、快速以及直观地定位出目标业务参数的异常原因,提高了确定目标业务参数异常原因的效率。
另外,在本发明实施例中,由于不同的业务特征对目标业务参数的影响重要程度不同,即,不同的子节点特征对于上级节点特征的影响重要程度不同,因此,在建立业务特征树结构之后,可以从每一级子节点特征中确定出对上级节点特征具有预设权重的子节点特征为目标子节点特征,将目标子节点特征区别于该级子节点特征中的其它子节点特征进行标识。具体地,可以根据皮尔森相关系数确定各个子节点特征的权重,即,计算出各个子节点特征相对于上级节点特征的皮尔森相关系数,将皮尔森相关系数达到预设相关性阈值的子节点特征作为目标子节点特征,其中,皮尔森相关系数越大,表明子节点特征对于上级节点特征的影响程度更大,目标子节点特征为对上级节点特征影响程度较大的子节点特征,通常来说,目标子节点特征为对上级节点特征影响程度最大的子节点特征。需要说明的是,上级节点特征包括该子节点特征上属的任一级节点特征,例如,对于荣耀而言,上级节点特征可以为华为、手机品牌或日新增用户量。
进一步来讲,对于如何将目标子节点特征区别于该级子节点特征中的其它子节点特征进行标识可以采用与前述将业务数据情况满足预设节点异常条件的节点特征区别于其它节点特征进行标识相同的标识方法,即,可以以不同的图形和/或不同的颜色和/或不同的字符标识方式进行区别标识,此处不再赘述。
下面将结合前述实施方式给出第二实施例以进一步对本发明的数据异动显性分析方法进行说明。
在建立出如图3所示的业务特征树结构之后,经过对业务数据的归类,以及判断各子节点特征的业务数据情况是否满足预设节点异常条件之后,确定出武汉、华为和荣耀这三个子节点特征(即业务特征)出现异常,将这三个子节点特征在业务特征树结构中以阴影的方式区别于其它子节点特征进行标识。同时,计算各个地域对于日新增用户量的皮尔森系数、各个手机品牌对于日新增用户量的皮尔森系数,以及华为品牌下的各个型号对于华为的皮尔森系数,通过与预设相关性阈值的比较,确定出武汉、华为和荣耀为目标子节点特征,即,相较于北京和上海,武汉对日新增用户量的影响程度最大,相较于小米和中兴,华为对日新增用户量的影响最大,相较于P20和NOVA,荣耀对华为的影响最大,进而通过将武汉、华为和荣耀所对应的图形扩大以区别于其它节点特征,即武汉、华为和荣耀所对应的圆形大于其它子节点特征所对应的圆形,最终获得图4所示的业务特征树结构。
本发明实施例通过将目标子节点特征区别于该级子节点特征中的其它子节点特征进行标识,能够进一步直观的展现出对于目标业务参数影响程度高的业务特征是否为异动原因。
在第二种实施方式中,基于数据异动隐性分析方法确定所述目标业务参数发生异动的原因。具体来讲,基于数据异动隐性分析方法确定所述目标业务参数发生异动的原因,如图5所示,包括以下步骤:
步骤501:根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征。
步骤502:对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征。
步骤503:从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征,并将所述关联业务特征作为所述目标业务参数发生异动的原因。
在本发明实施例中,通过基于数据异动隐性分析方法确定所述目标业务参数发生异动的原因,能够明确致使目标业务参数发生异常的业务特征之间的内在对应关系,从而更加准确、快速地定位出目标业务参数的异常原因,提高了确定目标业务参数异常原因的效率和准确度。
具体来讲,对于步骤501而言,在本发明实施例中,根据业务场景,获取与目标业务参数关联的多个业务特征。具体地,可以对目标业务参数进行业务特征分级拆分,从而获得多个业务特征,即,先将目标业务参数进行第一级拆分,获得第一级业务特征,接着对第一级业务特征进行第二级拆分,获得第二级业务特征,直至各个业务特征无法继续拆分为止。例如,以目标业务参数为日新增用户量为例,对该目标业务参数进行分级拆分,得到第一级业务特征分别为手机品牌、地域和渠道,可以将手机品牌命名为W1、将地域命名为W2以及将渠道命名为W3,对各个第一级业务特征进一步拆分,与手机品牌对应拆分获得第二级业务特征包括华为、三星、小米和中兴,可以将华为命名为W101、将三星命名为W102、将小米命名为W103以及将中兴命名为W104,与地域对应拆分获得第二级业务特征包括北京、上海和武汉,可以将北京命名为W201、将上海命名为W202以及将武汉命名为W203,与渠道对应拆分获得内部渠道、付费渠道和免费渠道,可以将内部渠道命名为W301、将付费渠道命名为W302以及将免费渠道命名为W303。
具体来讲,对于步骤502而言,在筛选时,以在同一关联参数下发生数据异常情况作为关联条件,关联参数为时间参数和与目标业务参数关联的业务特征参数中的至少一种参数。
若关联参数为时间参数,则步骤502具体为:对在同一预设时间周期内发生数据异常情况的业务特征进行筛选,获得至少一个特征关联项集,例如,预设时间周期为一天,在获取到大于预设时间周期的预设时间段(如5天)内的业务数据之后,对同一天发生数据异常情况的业务特征进行筛选,若第一天只有W101和W102这两个业务特征发生数据异常情况,第二天没有业务特征发生数据异常情况,第三天只有W101、W202和W203这三个业务特征发生数据异常情况,第四天只有W101、W302和W303这三个业务特征发生数据异常情况,第五天只有W102发生数据异常情况,则最终获得第一特征关联项集为{W101,W102}、第二特征关联项集为{W101,W202,W203}、第三特征关联项集为{W101,W302,W303}。
若关联参数为与目标业务参数关联的业务特征参数,则步骤502具体为:对在同一业务特征下发生数据异常情况的其他业务特征进行筛选,获得至少一个特征关联项集,例如,若将地域作为业务特征参数,则对同一地域发生数据异常情况的其他业务特征进行筛选,若针对武汉而言只有W102和W103这两个业务特征发生数据异常情况,针对上海而言只有W101、W302和W303这三个业务特征发生数据异常情况,针对北京而言没有业务特征发生数据异常情况,则最终获得第一特征关联项集为{W102,W103}、第二特征关联项集为{W101,W302,W303}。
若关联参数包括时间参数和与目标业务参数关联的业务特征参数,则,步骤502具体为:对同一预设时间周期且在同一业务特征下发生数据异常情况的其他业务特征进行筛选,获得至少一个特征关联项集,例如,若所有数据均针对武汉地区,若第一天只有W101和W102这两个业务特征发生数据异常情况,第二天没有业务特征发生数据异常情况,第三天只有W101、W202和W203这三个业务特征发生数据异常情况,第四天没有业务特征发生数据异常情况,第五天只有W102发生数据异常情况,则最终获得第一特征关联项集为{W101,W102}、第二特征关联项集为{W101,W202,W203}。
需要说明的是,在本发明实施例中,发生数据异常情况指的是与业务特征对应的业务数据满足预设数据异常条件,例如,若预设数据异常条件为日新增用户量超过2万,则当业务特征对应的业务数据表明日新增用户量为3万时,表明该业务特征发生数据异常情况。其中,发生数据异常情况也表明存在异常业务数据。
对于步骤503而言,具体来讲,首先,从至少一个特征关联项集中筛选出频繁项集,计算筛选出的各个频繁项集的置信度,将置信度大于预设置信度阈值的频繁项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。对于如何从至少一个特征关联项集中筛选出频繁项集,可以采用频繁项算法,基于频繁项算法从至少一个特征关联项集中筛选出频繁项集,其中,频繁项算法包括Apriori算法和FP-Growth算法,其中Apriori算法和FP-Growth算法均为现有技术,本申请对选用何种频繁项算法不做限定。另外,在筛选出频繁项集之后,本申请还会计算各个频繁项集的置信度,置信度为用于衡量频繁项集的可靠程度的参数,可以采用现有技术中的任一统计学公式计算获得,本申请对采用何种公式获得频繁项集的置信度不做限定。预设置信度阈值可以根据用户的实际需求进行调整,例如,可以将0.7作为预设置信度阈值,从而将置信度大于0.7的频繁项集作为目标频繁项集,并将目标频繁项集包含的各个业务特征确定为使目标业务参数发生异动的关联业务特征。
例如,针对第一特征关联项集{W101,W102}、第二特征关联项集{W101,W202,W203}和第三特征关联项集为{W101,W302,W303}而言,基于频繁项算法确定出第一特征关联项集和第二特征关联项集为频繁项集,接着,计算第一特征关联项集的置信度以及第二特征关联项集的置信度,若第一特征关联项集的置信度为0.8,第二特征关联项集的置信度为0.4,若预设置信度阈值为0.7,则将第一特征关联项集包含的W101和W102确定为致使目标业务参数发生异动的关联业务特征。
在本发明实施例中,通过先基于频繁项算法从特征关联项集中筛选出频繁项集,再从频繁项集中基于置信度确定出使目标业务参数发生异动的关联业务特征,能够进一步准确地确定出导致目标业务参数出现异动的原因,提高了确定目标业务参数异常原因的效率以及准确度。
在第三实施方式中,可以结合基于数据异动显性分析方法和基于数据异动隐性分析方法共同确定目标业务参数发生异动的原因。
在完成步骤102之后,执行步骤103:基于所述目标业务参数发生异动的原因,建立用于表征业务参数与导致业务参数发生异动的原因之间对应关系的异动原因分析模型。
具体来讲,在获得目标业务参数发生异动的原因之后,建立目标业务参数和目标业务参数发生异动的原因之间的对应关系,并依据该对应关系凭借递归神经网络建立异动原因分析模型,该异动原因分析模型能够反映业务参数和业务参数发生异动的原因之间的关系。针对不断获得的多个目标业务参数,该异动原因分析模型能够通过多个目标业务参数以及对应的异动原因不断更新完善。
在完成步骤103之后,执行步骤104:根据用户对所述目标业务参数发生异动的原因的反馈,对所述异动原因分析模型进行更新。
具体来讲,在确定出目标业务参数发生异动的原因之后,将该原因展现给用户,用户可以根据其关注点和需求对该原因进行调整反馈,从而利用用户对目标业务参数发生异动的原因的反馈对异动原因分析模型进行更新,从而形成异动原因分析模型的闭环,实现对于异动原因分析的学习过程。
在完成步骤104之后,执行步骤105:利用更新后的所述异动原因分析模型,在所述目标业务参数再次发生异动时确定所述目标业务参数发生异动的原因。
具体来讲,由于对异动原因分析模型进行了更新,更新后的异动原因分析模型更加符合用户的分析需求,从而当目标业务参数再次发生异动时,根据该异动原因分析模型对目标业务参数发生移动的原因进行分析确定,不仅能够快速的确定出异动原因而且确定出的异动原因准确。
基于同一发明构思,本发明实施例还提供一种数据异动分析装置,如图6所示,所述装置包括:
判断模块601,用于判断目标业务参数是否发生异动;
第一确定模块602,用于若所述目标业务参数发生异动,确定所述目标业务参数发生异动的原因;
建立模块603,用于基于所述目标业务参数发生异动的原因,建立用于表征业务参数与导致业务参数发生异动的原因之间对应关系的异动原因分析模型;
更新模块604,用于根据用户对所述目标业务参数发生异动的原因的反馈,对所述异动原因分析模型进行更新;
第二确定模块605,用于利用更新后的所述异动原因分析模型,在所述目标业务参数再次发生异动时确定所述目标业务参数发生异动的原因。
优选的,所述第一确定模块,包括:
第一确定子模块,用于基于数据异动显性分析方法确定所述目标业务参数发生异动的原因;和/或
第二确定子模块,用于基于数据异动隐性分析方法确定所述目标业务参数发生异动的原因。
优选的,所述第一确定子模块,包括:
拆解单元,用于将所述目标业务参数作为根节点特征,根据所述目标业务参数所处的业务场景,对与所述目标业务参数关联的业务特征进行树结构拆解,获得至少一级子节点特征,并根据各级子节点特征之间的对应关系,建立与所述目标业务参数对应的业务特征树结构;
第一确定单元,用于将与所述目标业务参数对应的业务数据归类到所述业务特征树结构的各个子节点特征中,并确定出各个子节点特征的业务数据情况;
标识单元,用于将业务数据情况满足预设节点异常条件的子节点特征区别于其它子节点特征进行标识,并将所述业务数据情况满足预设节点异常条件的子节点特征作为所述目标业务参数发生异动的原因。
优选的,同一级子节点特征中的各个子节点特征互不相同。
优选的,所述标识单元,包括以下单元中的至少一种:
第一标识子单元,用于将业务数据情况满足预设节点异常条件的子节点特征以不同的图形区别于其它子节点特征进行标识;
第二标识子单元,用于将业务数据情况满足预设节点异常条件的子节点特征以不同的颜色区别于其它子节点特征进行标识;
第三标识子单元,用于将业务数据情况满足预设节点异常条件的子节点特征以不同的字符标识方式区别于其它子节点特征进行标识。
优选的,所述装置还包括:
目标子节点特征确定单元,用于从每一级子节点特征中确定出对上级节点特征具有预设权重的子节点特征为目标子节点特征;
目标子节点特征标识单元,用于将所述目标子节点特征区别于该级子节点特征中的其它子节点特征进行标识。
优选的,所述目标子节点特征确定单元,包括:
获取子单元,用于获取每一级子节点特征中的各个子节点特征相对于上级节点特征的皮尔森相关系数;
确定子单元,用于将皮尔森相关系数达到预设相关性阈值的子节点特征确定为所述目标子节点特征。
优选的,所述第二确定子模块,包括:
获取单元,用于根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征;
获得单元,用于对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征;
第二确定单元,用于从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征,并将所述关联业务特征作为所述目标业务参数发生异动的原因。
优选的,所述获取单元,具体用于:
对所述目标业务参数进行业务特征分级拆分,获得多个业务特征。
优选的,所述关联参数包括时间参数和与所述目标业务参数关联的业务特征参数中的至少一种参数。
优选的,所述第二确定单元,包括:
筛选子单元,用于从所述至少一个特征关联项集中筛选出频繁项集;
计算子单元,用于计算筛选出的各个频繁项集的置信度;
确定子单元,用于将置信度大于预设置信度阈值的频繁项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
优选的,所述筛选子单元,具体用于:
基于频繁项算法从所述至少一个特征关联项集中筛选出频繁项集。
基于同一发明构思,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述实施例所述的方法步骤。
基于同一发明构思,本发明实施例还提供了一种计算机设备,如图7所示,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该计算机设备可以为包括手机、平板电脑、PDA(Personal DigitalAssistant,个人数字助理)、POS(Point of Sales,销售终端)、车载电脑等任意终端设备,以计算机设备为手机为例:
图7示出的是与本发明实施例提供的计算机设备相关的部分结构的框图。参考图7,该计算机设备包括:存储器701和处理器702。本领域技术人员可以理解,图7中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图7对计算机设备的各个构成部件进行具体的介绍:
存储器701可用于存储软件程序以及模块,处理器702通过运行存储在存储器701的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器701可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储数据(比如音频数据、电话本等)等。此外,存储器701可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器702是计算机设备的控制中心,通过运行或执行存储在存储器701内的软件程序和/或模块,以及调用存储在存储器701内的数据,执行各种功能和处理数据。可选的,处理器702可包括一个或多个处理单元;优选的,处理器702可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。
在本发明实施例中,该计算机设备所包括的处理器702可以具有前述实施例中任一方法步骤所对应的功能。
总之,根据本发明的数据异动分析方法及装置,首先判断目标业务参数是否发生异动,若所述目标业务参数发生异动,确定所述目标业务参数发生异动的原因,接着基于所述目标业务参数发生异动的原因,建立用于表征业务参数与导致业务参数发生异动的原因之间对应关系的异动原因分析模型,根据用户对所述目标业务参数发生异动的原因的反馈,对所述异动原因分析模型进行更新,最后利用更新后的所述异动原因分析模型,在所述目标业务参数再次发生异动时确定所述目标业务参数发生异动的原因,通过上述方法在基于目标业务参数发生异动的原因的基础上建立了异动原因分析模块,并结合用户对目标业务参数发生异动的原因的反馈对该异动原因分析模块进行更新,更新后的异动原因分析模块更加符合用户的需求,从而利用更新后的异动原因分析模型对业务参数发生异动的原因进行确定,能够准确快速的确定出业务参数发生异动的原因。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
A1、一种数据异动分析方法,其特征在于,所述方法包括:
判断目标业务参数是否发生异动;
若所述目标业务参数发生异动,确定所述目标业务参数发生异动的原因;
基于所述目标业务参数发生异动的原因,建立用于表征业务参数与导致业务参数发生异动的原因之间对应关系的异动原因分析模型;
根据用户对所述目标业务参数发生异动的原因的反馈,对所述异动原因分析模型进行更新;
利用更新后的所述异动原因分析模型,在所述目标业务参数再次发生异动时确定所述目标业务参数发生异动的原因。
A2、根据A1所述的数据异动分析方法,其特征在于,所述确定所述目标业务参数发生异动的原因,包括:
基于数据异动显性分析方法确定所述目标业务参数发生异动的原因;和/或
基于数据异动隐性分析方法确定所述目标业务参数发生异动的原因。
A3、根据A2所述的数据异动分析方法,其特征在于,所述基于数据异动显性分析方法确定所述目标业务参数发生异动的原因,包括:
将所述目标业务参数作为根节点特征,根据所述目标业务参数所处的业务场景,对与所述目标业务参数关联的业务特征进行树结构拆解,获得至少一级子节点特征,并根据各级子节点特征之间的对应关系,建立与所述目标业务参数对应的业务特征树结构;
将与所述目标业务参数对应的业务数据归类到所述业务特征树结构的各个子节点特征中,并确定出各个子节点特征的业务数据情况;
将业务数据情况满足预设节点异常条件的子节点特征区别于其它子节点特征进行标识,并将所述业务数据情况满足预设节点异常条件的子节点特征作为所述目标业务参数发生异动的原因。
A4、根据A3所述的数据异动分析方法,其特征在于,同一级子节点特征中的各个子节点特征互不相同。
A5、根据A3所述的数据异动分析方法,其特征在于,所述将业务数据情况满足预设节点异常条件的子节点特征区别于其它子节点特征进行标识,包括以下方法中的至少一种:
将业务数据情况满足预设节点异常条件的子节点特征以不同的图形区别于其它子节点特征进行标识;
将业务数据情况满足预设节点异常条件的子节点特征以不同的颜色区别于其它子节点特征进行标识;
将业务数据情况满足预设节点异常条件的子节点特征以不同的字符标识方式区别于其它子节点特征进行标识。
A6、根据A3所述的数据异动分析方法,其特征在于,在所述建立与所述目标业务参数对应的业务特征树结构之后,所述方法还包括:
从每一级子节点特征中确定出对上级节点特征具有预设权重的子节点特征为目标子节点特征;
将所述目标子节点特征区别于该级子节点特征中的其它子节点特征进行标识。
A7、根据A6所述的数据异动分析方法,其特征在于,所述从每一级子节点特征中确定出对上级节点特征具有预设权重的子节点特征为目标子节点特征,包括:
获取每一级子节点特征中的各个子节点特征相对于上级节点特征的皮尔森相关系数;
将皮尔森相关系数达到预设相关性阈值的子节点特征确定为所述目标子节点特征。
A8、根据A2所述的数据异动分析方法,其特征在于,所述基于数据异动隐性分析方法确定所述目标业务参数发生异动的原因,包括:
根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征;
对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征;
从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征,并将所述关联业务特征作为所述目标业务参数发生异动的原因。
A9、根据A8所述的数据异动分析方法,其特征在于,所述获取与所述目标业务参数关联的多个业务特征,包括:
对所述目标业务参数进行业务特征分级拆分,获得多个业务特征。
A10、根据A8所述的数据异动分析方法,其特征在于,所述关联参数包括时间参数和与所述目标业务参数关联的业务特征参数中的至少一种参数。
A11、根据A8所述的数据异动分析方法,其特征在于,所述从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征,包括:
从所述至少一个特征关联项集中筛选出频繁项集;
计算筛选出的各个频繁项集的置信度;
将置信度大于预设置信度阈值的频繁项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
A12、根据A11所述的数据异动分析方法,其特征在于,所述从所述至少一个特征关联项集中筛选出频繁项集,包括:
基于频繁项算法从所述至少一个特征关联项集中筛选出频繁项集。
B13、一种数据异动分析装置,其特征在于,所述装置包括:
判断模块,用于判断目标业务参数是否发生异动;
第一确定模块,用于若所述目标业务参数发生异动,确定所述目标业务参数发生异动的原因;
建立模块,用于基于所述目标业务参数发生异动的原因,建立用于表征业务参数与导致业务参数发生异动的原因之间对应关系的异动原因分析模型;
更新模块,用于根据用户对所述目标业务参数发生异动的原因的反馈,对所述异动原因分析模型进行更新;
第二确定模块,用于利用更新后的所述异动原因分析模型,在所述目标业务参数再次发生异动时确定所述目标业务参数发生异动的原因。
B14、根据B13所述的数据异动分析装置,其特征在于,所述第一确定模块,包括:
第一确定子模块,用于基于数据异动显性分析方法确定所述目标业务参数发生异动的原因;和/或
第二确定子模块,用于基于数据异动隐性分析方法确定所述目标业务参数发生异动的原因。
B15、根据B13所述的数据异动分析装置,其特征在于,所述第一确定子模块,包括:
拆解单元,用于将所述目标业务参数作为根节点特征,根据所述目标业务参数所处的业务场景,对与所述目标业务参数关联的业务特征进行树结构拆解,获得至少一级子节点特征,并根据各级子节点特征之间的对应关系,建立与所述目标业务参数对应的业务特征树结构;
第一确定单元,用于将与所述目标业务参数对应的业务数据归类到所述业务特征树结构的各个子节点特征中,并确定出各个子节点特征的业务数据情况;
标识单元,用于将业务数据情况满足预设节点异常条件的子节点特征区别于其它子节点特征进行标识,并将所述业务数据情况满足预设节点异常条件的子节点特征作为所述目标业务参数发生异动的原因。
B16、根据B15所述的数据异动分析装置,其特征在于,同一级子节点特征中的各个子节点特征互不相同。
B17、根据B15所述的数据异动分析装置,其特征在于,所述标识单元,包括以下单元中的至少一种:
第一标识子单元,用于将业务数据情况满足预设节点异常条件的子节点特征以不同的图形区别于其它子节点特征进行标识;
第二标识子单元,用于将业务数据情况满足预设节点异常条件的子节点特征以不同的颜色区别于其它子节点特征进行标识;
第三标识子单元,用于将业务数据情况满足预设节点异常条件的子节点特征以不同的字符标识方式区别于其它子节点特征进行标识。
B18、根据B15所述的数据异动分析装置,其特征在于,所述装置还包括:
目标子节点特征确定单元,用于从每一级子节点特征中确定出对上级节点特征具有预设权重的子节点特征为目标子节点特征;
目标子节点特征标识单元,用于将所述目标子节点特征区别于该级子节点特征中的其它子节点特征进行标识。
B19、根据B18所述的数据异动分析装置,其特征在于,所述目标子节点特征确定单元,包括:
获取子单元,用于获取每一级子节点特征中的各个子节点特征相对于上级节点特征的皮尔森相关系数;
确定子单元,用于将皮尔森相关系数达到预设相关性阈值的子节点特征确定为所述目标子节点特征。
B20、根据B13所述的数据异动分析装置,其特征在于,所述第二确定子模块,包括:
获取单元,用于根据所述目标业务参数所处的业务场景,获取与所述目标业务参数关联的多个业务特征;
获得单元,用于对满足预设关联条件的业务特征进行筛选,获得至少一个特征关联项集,其中,所述预设关联条件为在同一关联参数下发生数据异常情况,所述特征关联项集中包含满足所述预设关联条件的多个业务特征;
第二确定单元,用于从所述至少一个特征关联项集中将置信度大于预设置信度阈值的特征关联项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征,并将所述关联业务特征作为所述目标业务参数发生异动的原因。
B21、根据B20所述的数据异动分析装置,其特征在于,所述获取单元,具体用于:
对所述目标业务参数进行业务特征分级拆分,获得多个业务特征。
B22、根据B20所述的数据异动分析装置,其特征在于,所述关联参数包括时间参数和与所述目标业务参数关联的业务特征参数中的至少一种参数。
B23、根据B20所述的数据异动分析装置,其特征在于,所述第二确定单元,包括:
筛选子单元,用于从所述至少一个特征关联项集中筛选出频繁项集;
计算子单元,用于计算筛选出的各个频繁项集的置信度;
确定子单元,用于将置信度大于预设置信度阈值的频繁项集所包含的各个业务特征确定为使所述目标业务参数发生异动的关联业务特征。
B24、根据B23所述的数据异动分析装置,其特征在于,所述筛选子单元,具体用于:
基于频繁项算法从所述至少一个特征关联项集中筛选出频繁项集。
C25、一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现根据A1-A12中任一权利要求所述的方法步骤。
D26、一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现根据A1-A12中任一权利要求所述的方法步骤。

Claims (10)

1.一种数据异动分析方法,其特征在于,所述方法包括:
判断目标业务参数是否发生异动;
若所述目标业务参数发生异动,确定所述目标业务参数发生异动的原因;
基于所述目标业务参数发生异动的原因,建立用于表征业务参数与导致业务参数发生异动的原因之间对应关系的异动原因分析模型;
根据用户对所述目标业务参数发生异动的原因的反馈,对所述异动原因分析模型进行更新;
利用更新后的所述异动原因分析模型,在所述目标业务参数再次发生异动时确定所述目标业务参数发生异动的原因。
2.如权利要求1所述的数据异动分析方法,其特征在于,所述确定所述目标业务参数发生异动的原因,包括:
基于数据异动显性分析方法确定所述目标业务参数发生异动的原因;和/或
基于数据异动隐性分析方法确定所述目标业务参数发生异动的原因。
3.如权利要求2所述的数据异动分析方法,其特征在于,所述基于数据异动显性分析方法确定所述目标业务参数发生异动的原因,包括:
将所述目标业务参数作为根节点特征,根据所述目标业务参数所处的业务场景,对与所述目标业务参数关联的业务特征进行树结构拆解,获得至少一级子节点特征,并根据各级子节点特征之间的对应关系,建立与所述目标业务参数对应的业务特征树结构;
将与所述目标业务参数对应的业务数据归类到所述业务特征树结构的各个子节点特征中,并确定出各个子节点特征的业务数据情况;
将业务数据情况满足预设节点异常条件的子节点特征区别于其它子节点特征进行标识,并将所述业务数据情况满足预设节点异常条件的子节点特征作为所述目标业务参数发生异动的原因。
4.如权利要求3所述的数据异动分析方法,其特征在于,同一级子节点特征中的各个子节点特征互不相同。
5.如权利要求3所述的数据异动分析方法,其特征在于,所述将业务数据情况满足预设节点异常条件的子节点特征区别于其它子节点特征进行标识,包括以下方法中的至少一种:
将业务数据情况满足预设节点异常条件的子节点特征以不同的图形区别于其它子节点特征进行标识;
将业务数据情况满足预设节点异常条件的子节点特征以不同的颜色区别于其它子节点特征进行标识;
将业务数据情况满足预设节点异常条件的子节点特征以不同的字符标识方式区别于其它子节点特征进行标识。
6.如权利要求3所述的数据异动分析方法,其特征在于,在所述建立与所述目标业务参数对应的业务特征树结构之后,所述方法还包括:
从每一级子节点特征中确定出对上级节点特征具有预设权重的子节点特征为目标子节点特征;
将所述目标子节点特征区别于该级子节点特征中的其它子节点特征进行标识。
7.如权利要求6所述的数据异动分析方法,其特征在于,所述从每一级子节点特征中确定出对上级节点特征具有预设权重的子节点特征为目标子节点特征,包括:
获取每一级子节点特征中的各个子节点特征相对于上级节点特征的皮尔森相关系数;
将皮尔森相关系数达到预设相关性阈值的子节点特征确定为所述目标子节点特征。
8.一种数据异动分析装置,其特征在于,所述装置包括:
判断模块,用于判断目标业务参数是否发生异动;
第一确定模块,用于若所述目标业务参数发生异动,确定所述目标业务参数发生异动的原因;
建立模块,用于基于所述目标业务参数发生异动的原因,建立用于表征业务参数与导致业务参数发生异动的原因之间对应关系的异动原因分析模型;
更新模块,用于根据用户对所述目标业务参数发生异动的原因的反馈,对所述异动原因分析模型进行更新;
第二确定模块,用于利用更新后的所述异动原因分析模型,在所述目标业务参数再次发生异动时确定所述目标业务参数发生异动的原因。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一权利要求所述的方法步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一权利要求所述的方法步骤。
CN201811369533.1A 2018-11-16 2018-11-16 数据异动分析方法及装置 Pending CN109634804A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811369533.1A CN109634804A (zh) 2018-11-16 2018-11-16 数据异动分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811369533.1A CN109634804A (zh) 2018-11-16 2018-11-16 数据异动分析方法及装置

Publications (1)

Publication Number Publication Date
CN109634804A true CN109634804A (zh) 2019-04-16

Family

ID=66068447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811369533.1A Pending CN109634804A (zh) 2018-11-16 2018-11-16 数据异动分析方法及装置

Country Status (1)

Country Link
CN (1) CN109634804A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860508A (zh) * 2021-01-13 2021-05-28 支付宝(杭州)信息技术有限公司 一种基于知识图谱的异常定位方法、装置以及设备
CN112926951A (zh) * 2021-03-26 2021-06-08 广东电网有限责任公司佛山供电局 一种设备异动的识别方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860508A (zh) * 2021-01-13 2021-05-28 支付宝(杭州)信息技术有限公司 一种基于知识图谱的异常定位方法、装置以及设备
CN112860508B (zh) * 2021-01-13 2023-02-28 支付宝(杭州)信息技术有限公司 一种基于知识图谱的异常定位方法、装置以及设备
CN112926951A (zh) * 2021-03-26 2021-06-08 广东电网有限责任公司佛山供电局 一种设备异动的识别方法及装置
CN112926951B (zh) * 2021-03-26 2023-01-24 广东电网有限责任公司佛山供电局 一种设备异动的识别方法及装置

Similar Documents

Publication Publication Date Title
CN103841204B (zh) 基于移动终端的免流量下载方法、装置及系统
CN106102164B (zh) 一种确定接入点位置的方法与装置
CN109844666A (zh) 用于车内预测性故障检测的系统和方法
CN106355449A (zh) 用户选取方法和装置
CN106651392A (zh) 一种智能商业选址方法、装置及系统
CN109242135A (zh) 一种模型运营方法、装置、及业务服务器
CN109034036A (zh) 一种视频分析方法、教学质量评估方法及系统、计算机可读存储介质
CN108399114A (zh) 一种系统性能测试方法、装置及存储介质
CN110457175B (zh) 业务数据处理方法、装置、电子设备及介质
CN109634804A (zh) 数据异动分析方法及装置
CN110019996A (zh) 一种家庭关系识别方法和系统
CN107908548A (zh) 一种生成测试用例的方法和装置
CN105917625A (zh) 使用附加数据的检测到的网络异常的分类
CN105787364A (zh) 任务的自动化测试方法、装置及系统
CN104427547B (zh) 业务和网络关联测试方法、装置及系统
CN105095464B (zh) 一种检索系统的检测方法和装置
CN110209551B (zh) 一种异常设备的识别方法、装置、电子设备及存储介质
CN109447658A (zh) 反欺诈模型的生成及应用方法、装置、设备及存储介质
CN108280096A (zh) 数据清洗方法及数据清洗装置
CN115062734A (zh) 可输出解释性信息的风控建模方法、装置、设备及介质
CN106126592A (zh) 搜索数据的处理方法及装置
US11558769B2 (en) Estimating apparatus, system, method, and computer-readable medium, and learning apparatus, method, and computer-readable medium
CN110378739B (zh) 一种数据流量匹配方法及装置
CN107291616A (zh) 一种项目报告在线生成平台
CN109597744A (zh) 数据异动分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination