WO2016138805A1

WO2016138805A1 - 一种分布数据异动判断定位方法及系统

Info

Publication number: WO2016138805A1
Application number: PCT/CN2016/072348
Authority: WO
Inventors: 李亮; 刘朋飞; 牟川
Original assignee: 北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司
Priority date: 2015-03-04
Filing date: 2016-01-27
Publication date: 2016-09-09
Also published as: HK1208927A1; CN104715027A; CN104715027B

Abstract

一种分布数据异动判断定位方法及系统，方法包括：由多个维度交叉组合得到多个维度组合，生成多个关于一级维度的当前一级维度分布数据，以及多个关于维度组合的当前维度组合分布数据，生成多个关于一级维度的历史一级维度基准值分布数据，以及多个关于维度组合的历史维度组合基准值分布数据；得到每个当前一级维度分布数据的结构异动，得到每个当前维度组合分布数据的结构异动，如果有结构异动超过异动阈值的异动一级维度分布数据或异动维度组合分布数据则进行告警。对多维度分布数据分别在一级维度及维度组合上进行检验，克服了现有异动判定与异动定位方法的各种不足，使得异动判断更为迅速准确。

Description

一种分布数据异动判断定位方法及系统

技术领域

本发明涉及分布数据异动相关技术领域，特别是一种分布数据异动判断定位系统。

背景技术

在互联网行业，尤其在电子商务网站业务中，每时每刻都在产生海量的数据，通常这些数据里包括各种指标，且每个指标有不同的维度视角。指标如订单量、订单金额等，维度如省份、订单类型、支付方式等等。当一个指标发生波动时，每个维度相应数据也会随之波动。举例来说，当在线支付系统出现故障时，订单量、订单金额等指标总体上会受到影响，相应地，各种支付方式对应的订单量和订单金额会有波动，此外在其他维度如省份、订单类型上的数据也同样受影响。此时，如何从数据中找出是支付系统出问题导致的异常呢？

在市场环境多变、业务的优化升级、促销的此起彼伏等因素叠加，也会造成这些数据跌宕起伏。数据发生波动时，能否判定为异动(异常波动)；异动情况下，如何在众多数据中准确、快速地定位，即甄别出异动指标主要源于哪些维度，是数据异动挖掘的核心问题。

对于异动数据定位，现有的技术大致采用基于阈值比较波动幅度的方法。具体来说，该方法对近期(如最近一周、最近一月)数据(具体维度上的相应数据)做加权平均计算出历史基准值，比较最新数据和历史基准值这两组数据，考察每个数据波动幅度，如果波动幅度超出某个阈值(阈值一般是凭经验人为设定)时，则判定数据发生了异动，并选其中波动幅度最大的作为造成数据异动的主因。

现有数据异动定位技术方案的主要缺点：总体来说，现有人工异动监测与定位主观性强，从怀疑异动到逐层分解定位到具体明细的异动维度所涉及的环节多、流程长、过程繁杂低效。具体来说，首先是阈值的人为主观设定，不够科学客观；其次是某些场景下(如节假日数据的惯性走低)，基于阈值比较的方法容易导致误判；最后是当多组数据同时超出相应阈值时，通常很难定位数据异动的主因。

发明内容

基于此，有必要针对现有技术对数据异动难以准确判断的技术问题，提供一种分布数据异动判断定位方法及系统。

一种分布数据异动判断定位方法，包括：

分布数据准备步骤，包括：获取多维度分布数据，以及多维度基准值分布数据，所述多维度基准值分布数据为所述多维度分布数据的每个数据对应的历史基准值，由多个维度交叉组合得到多个维度组合，根据所述多维度分布数据分别生成多个关于一级维度的当前一级维度分布数据，以及多个关于维度组合的当前维度组合分布数据，根据所述多维度基准值分布数据分别生成多个关于一级维度的历史一级维度基准值分布数据，以及多个关于维度组合的历史维度组合基准值分布数据；

异动判定步骤，包括：将所述当前一级维度分布数据与对应的历史一级维度基准值分布数据进行比较得到每个当前一级维度分布数据相对于对应的历史一级维度基准值分布数据的结构异动，结构异动超过异动阈值的当前一级维度分布数据为异动一级维度分布数据，将所述当前维度组合分布数据与历史维度组合基准值分布数据进行比较得到每个当前维度组合分布数据相对于对应的历史维度组合基准值分布数据的结构异动，结构异动超过异动阈值的当前维度组合分布数据为异动维度组合分布数据，如果有异动一级维度分布数据或异动维度组合分布数据则进行告警。

一种分布数据异动判断定位系统，包括：

分布数据准备模块，用于：获取多维度分布数据，以及多维度基准值分布数据，所述多维度基准值分布数据为所述多维度分布数据的每个数据对应的历史基准值，由多个维度交叉组合得到多个维度组合，根据所述多维度分布数据分别生成多个关于一级维度的当前一级维度分布数据，以及多个关于维度组合的当前维度组合分布数据，根据所述多维度基准值分布数据分别生成多个关于一级维度的历史一级维度基准值分布数据，以及多个关于维度组合的历史维度组合基准值分布数据；

异动判定模块，用于：将所述当前一级维度分布数据与对应的历史一级维度基准值分布数据进行比较得到每个当前一级维度分布数据相对于对应的历史一级维度基准值分布数据的结构异动，结构异动超过异动阈值的当前一级维度分布数据为异动一级维度分布数据，将所述当前维度组合分布数据与历史维度组合基准值分布数据进行比较得到每个当前维度组合分布数据相对于对应的历史维度组合基准值分布数据的结构异动，结构异动超过异动阈值的当前维度组合分布数据为异动维度组合分布数据，如果有异动一级维度分布数据或异动维度组合分布数据则进行告警。

本发明对多维度分布数据分别在一级维度及维度组合上进行检验，克服了现有异动判定与异动定位方法的各种不足，使得异动判断更为迅速准确。

附图说明

图1为本发明一种分布数据异动判断定位方法的工作流程图；

图2为本发明一种分布数据异动判断定位系统的结构模块图；

图3为本发明最佳实施例的模块示意图。

具体实施方式

下面结合附图和具体实施例对本发明做进一步详细的说明。

如图1所示为本发明一种分布数据异动判断定位方法的工作流程图，包括：

步骤S101，包括：获取多维度分布数据，以及多维度基准值分布数据，所述多维度基准值分布数据为所述多维度分布数据的每个数据对应的历史基准值，由多个维度交叉组合得到多个维度组合，根据所述多维度分布数据分别生成多个关于一级维度的当前一级维度分布数据，以及多个关于维度组合的当前维度组合分布数据，根据所述多维度基准值分布数据分别生成多个关于一级维度的历史一级维度基准值分布数据，以及多个关于维度组合的历史维度组合基准值分布数据；

步骤S102，包括：将所述当前一级维度分布数据与对应的历史一级维度基准值分布数据进行比较得到每个当前一级维度分布数据相对于对应的历史一级维度基准值分布数据的结构异动，结构异动超过异动阈值的当前一级维度分布数据为异动一级维度分布数据，将所述当前维度组合分布数据与历史维度组合基准值分布数据进行比较得到每个当前维度组合分布数据相对于对应的历史维度组合基准值分布数据的结构异动，结构异动超过异动阈值的当前维度组合分布数据为异动维度组合分布数据，如果有异动一级维度分布数据或异动维度组合分布数据则进行告警。

步骤S101中，将多维度分布数据分解为关于一级维度的当前一级维度分布数据，以及多个关于维度组合的当前维度组合分布数据。每一个维度下包括多个数据。以订单量指标作为维度的在线支付系统的分布数据为例，省份、订单类型、支付方式等维度为一级维度，“省份_订单类型”、“省份_支付方式”、“订单类型_支付方式”、“省份_订单类型_支付方式”则为维度组合。每一维包括多个数据，例如省份维中可以包括：省份A的数据、省份B的数据、省份C的数据，而订单类型维中可以包括：订单类型D的数据、订单类型E的数据、订单类型F的数据，支付方式维可以包括：支付方式G的数据、支付方式H的数据、支付方式I的数据。则“省份_订单类型”包括：省份A且订单类型D的数据、省份A且订单类型E的数据、省份A且订单类型F的数据、省份B且订单类型D的数据、省份B且订单类型E的数据、省份B且订单类型F的数据、省份C且订单类型D的数据、省份C且订单类型E的数据、省份C且订单类型F的数据。“省份_支付方式”、“订单类型_支付方式”、“省份_订单类型_支付方式”，以此类推。同样地可以得到由多维度基准值分布数据所得的历史一级维度基准值分布数据和历史维度组合基准值分布数据。其中，多维度基准值分布数据是对应多维度分布数据每个维度的每个数据的基准值，例如对于省份A的基准值、对于省份B的基准值等。将多维度分布数据里的每个数据对应的前期非异动数据进行处理，加权平均生成历史基准值并存储为一个多维数据表则得到多维度基准值分布数据。多维度分布数据可以采用时粒度、日粒度、周粒度、月粒度、年粒度等时间粒度进行保存，前期非异动数据则是指多维度分布数据中所保存的数据采用相同时间粒度进行保存的前期数据中无异动的数据。例如对于省份A的数据，如果采用日粒度进行保存，则为前N天的省份A的数据中无异动的数据，对其进行加权平均则得到省份A的历史基准值。

步骤S102中，对当前一级维度分布数据，以及当前维度组合分布数据分别计算其相对于历史一级维度基准值分布数据和历史维度组合基准值分布数据的结构异动。基于假设检验对上述两组数据进行结构诊断，来发现两组数据的结构是否一致，不一致则认为有异动。即通过结构异动判断当前一级维度分布数据与历史一级维度基准值分布数据的结构是否一致，通过结构异动判断当前维度组合分布数据与历史维度组合基准值分布数据的结构是否一致。假设检验的思想是小概率反证法思想，小概率思想时指小概率事件(如P＜0.01或P＜0.05)在一次试验中基本不会发生。步骤S102中，利用这一思想，就是先假设两组数据结构保持一致，然后用统计检验的方法确定假设成立的可能性大小，如可能性很小，则假设不成立，说明两组数据结构有变化，从而得出在这个维度上是有异动的。

本发明技术方案，基于假设检验的思路，通过对指标数据在维度上的结构检验或维度交叉后的数据结构进行检验的方法，相比于基于阈值比较波动幅度的判定方法，能够更准确地判断异动，并能快速作出异动定位。

仍然拿之前的例子来说明，当在线支付系统出现故障时，订单量、订单金额会有波动，支付方式维度的数据肯定会有波动，同样省份维度或订单类型维度的数据也会有波动。现有的基于阈值比较波动幅度的方法，一般来说会发现这三个维度上的数据都有异动，但很难定位出是支付环节导致的异动。但通过本发明基于假设检验的方法，分别对支付方式、省份、订单类型这三个维度上的数据进行检验，不难发现，省份、订单类型数据跟历史基准值比较，可能数值均有下降，但在整体结构上是基本一致(如省份维度，每个省份的数据占比变化不大)的，通过结构检验，就不会判断为异常。但从支付方式维度来看，在线支付出问题时，在线支付的订单量或订单金额占比必然下降很严重，其他支付方式如货到付款、邮政汇款等的占比则此消彼长大幅上升，其结构发生了明显异常，对数据进行结构检验，就能捕捉到这个异常，从而实现数据的异动定位。所以本发明弥补了现有异动判定与异动定位方法的不足。

在其中一个实施例中，还包括：

异动定位步骤，包括：将结构异动最高的异动一级维度分布数据所对应的维度作为关键异动维度，所述异动维度组合分布数据所对应的维度组合为异动维度组合，所述异动维度组合中包括所述关键异动维度的维度组合为受关键异动维度影响的维度组合，所述受关键异动维度影响的维度组合所包括的除关键异动维度以外的其他维度为受关键异动维度影响的维度，显示所述关键异动维度以及受关键异动维度影响的维度。

本实施例中，通过判断关键异动维度，从而找出受关键异动维度影响的维度组合，得出受关键异动维度影响的其他维度。

在其中一个实施例中：

所述异动判定步骤，具体包括：计算当前一级维度分布数据与对应的历史一级维度基准值分布数据的卡方值，所述异动一级维度分布数据为对应的卡方值超过异动阈值的当前一级维度分布数据，计算当前维度组合分布数据与对应的历史维度组合基准值分布数据的卡方值，所述异动维度组合分布数据为对应的卡方值超过异动阈值的当前维度组合分布数据；

所述异动定位步骤，具体包括：结构异动最高的异动一级维度分布数据为与最小卡方值对应的异动一级维度分布数据。

卡方检验：卡方检验是一种假设检验方法，统计样本的实际观测值与理论推断值之间的偏离程度，实际观测值与理论推断值之间的偏离程度就决定卡方值的大小，卡方值越大，越不符合，偏差越小，卡方值就越小，越趋于符合，若量值完全相等时，卡方值就为0，表明理论值完全符合。通过卡方值可以得出假设成立的概率，即显著性水平或P值，P值越小，则假设成立的可能性小，假设越不成立。

本实施例采用最小卡方值对异动进行判断，使得异动判断定位更为可靠。

在其中一个实施例中：

所述异动定位步骤，具体包括：选择与最小卡方值对应的异动一级维度分布数据为最小异动一级维度分布数据，从其他的异动一级维度分布数据中，选择对应的卡方值与最小卡方值的差值小于差值阈值的异动一级维度分布数据，与对应的历史一级维度基准值分布数据进行拟合优度检验计算得到可决系数，结构异动最高的异动一级维度分布数据为与最小可决系数对应的异动一级维度分布数据。

拟合优度(Goodness of Fit)是指回归直线对观测值的拟合程度。度量拟合优度的统计量是可决系数(亦称确定系数)R^2。R^2的取值范围是[0，1]。R^2的值越接近1，说明回归直线对观测值的拟合程度越好；反之，R^2的值越接近0，说明回归直线对观测值的拟合程度越差。

本实施例中对异动判断采用卡方值与拟合优度检验结合的方式对异动进行判断定位，使得异动判断定位更为准确。

在其中一个实施例中，所述异动定位步骤，还包括：将关键异动维度所对应的异动一级维度分布数据作为关键异动一级维度分布数据，对关键异动一级维度分布数据与对应的历史一级维度基准值分布数据的每一数据项分别计算差值，将其中差值的绝对值最大的数据项作为异动主因，显示所述异动主因。

本实施例能够显示出异动主因，使得异动判断定位更为精确。

图2为本发明一种分布数据异动判断定位系统的结构模块图，包括：

分布数据准备模块201，用于：获取多维度分布数据，以及多维度基准值分布数据，所述多维度基准值分布数据为所述多维度分布数据的每个数据对应的历史基准值，由多个维度交叉组合得到多个维度组合，根据所述多维度分布数据分别生成多个关于一级维度的当前一级维度分布数据，以及多个关于维度组合的当前维度组合分布数据，根据所述多维度基准值分布数据分别生成多个关于一级维度的历史一级维度基准值分布数据，以及多个关于维度组合的历史维度组合基准值分布数据；

异动判定模块202，用于：将所述当前一级维度分布数据与对应的历史一级维度基准值分布数据进行比较得到每个当前一级维度分布数据相对于对应的历史一级维度基准值分布数据的结构异动，结构异动超过异动阈值的当前一级维度分布数据为异动一级维度分布数据，将所述当前维度组合分布数据与历史维度组合基准值分布数据进行比较得到每个当前维度组合分布数据相对于对应的历史维度组合基准值分布数据的结构异动，结构异动超过异动阈值的当前维度组合分布数据为异动维度组合分布数据，如果有异动一级维度分布数据或异动维度组合分布数据则进行告警。

在其中一个实施例中，还包括：

异动定位模块，用于：将结构异动最高的异动一级维度分布数据所对应的维度作为关键异动维度，所述异动维度组合分布数据所对应的维度组合为异动维度组合，所述异动维度组合中包括所述关键异动维度的维度组合为受关键异动维度影响的维度组合，所述受关键异动维度影响的维度组合所包括的除关键异动维度以外的其他维度为受关键异动维度影响的维度，显示所述关键异动维度以及受关键异动维度影响的维度。

在其中一个实施例中：

所述异动判定模块，具体用于：计算当前一级维度分布数据与对应的历史一级维度基准值分布数据的卡方值，所述异动一级维度分布数据为对应的卡方值超过异动阈值的当前一级维度分布数据，计算当前维度组合分布数据与对应的历史维度组合基准值分布数据的卡方值，所述异动维度组合分布数据为对应的卡方值超过异动阈值的当前维度组合分布数据；

所述异动定位模块，具体用于：结构异动最高的异动一级维度分布数据为与最小卡方值对应的异动一级维度分布数据。

在其中一个实施例中：

所述异动定位模块，具体用于：选择与最小卡方值对应的异动一级维度分布数据为最小异动一级维度分布数据，从其他的异动一级维度分布数据中，选择对应的卡方值与最小卡方值的差值小于差值阈值的异动一级维度分布数据，与对应的历史一级维度基准值分布数据进行拟合优度检验计算得到可决系数，结构异动最高的异动一级维度分布数据为与最小可决系数对应的异动一级维度分布数据。

在其中一个实施例中，所述异动定位模块，还用于：将关键异动维度所对应的异动一级维度分布数据作为关键异动一级维度分布数据，对关键异动一级维度分布数据与对应的历史一级维度基准值分布数据的每一数据项分别计算差值，将其中差值的绝对值最大的数据项作为异动主因，显示所述异动主因。

图3为本发明最佳实施例的模块示意图，包括：

数据准备模块310：数据准备模块的主要功能是对多指标多维度数据进行预处理。具体包括：

数据输入子模块311，用于获取以日粒度存储在多维数据表里的最新数据；

数据预处理子模块312，就是对最新数据进行预处理，对以日粒度存储在多维数据表里的数据，分别根据维度或维度交叉后的多级维度，进行数据聚合、空值列处理、占比小数据列处理，从而生成出指标在一级维度或维度交叉后的多级维度的分布数据。具体来说，以订单量指标为例，分别对省份、订单类型、支付方式等维度(一级维度)进行数据预处理。

维度交叉子模块313，对这些维度做全排列组合交叉，生成新的多级维度来进行相应的数据预处理，如“省份_订单类型”，“省份_支付方式”，“订单类型_支付方式”，“省份_订单类型_支付方式”。这样，我们不仅能从一级维度的视角去考察数据的异动情况，还可以细化到多级维度来发掘局部数据是否有异动。

历史基准值处理子模块314，对以日粒度存储在多维数据表里的前期非异动数据进行处理，加权平均生成历史基准值并存储为一个多维数据表。对这个包含历史基准值的多维数据表，同样地通过数据预处理子模块312和维度交叉子模块313执行相应预处理流程，就能够得到指标在一级维度或维度交叉后的多级维度的历史基准值分布数据。

异动判定模块320：数据经过数据准备模块流程预处理后，能输出两组数据，即一级维度或维度交叉后多级维度上当日的分布数据和历史基准值分布数据。异动判定模块的主要功能是基于假设检验对这两组数据进行结构诊断，来发现两组数据的结构是否一致，不一致则认为有异动。假设检验的思想时小概率反证法思想，小概率思想时指小概率事件(如P＜0.01或P＜0.05)在一次试验中基本不会发生。异动判定模块，利用这一思想，就是先假设两组数据结构保持一致，然后用统计检验的方法确定假设成立的可能性大小，如可能性很小，则假设不成立，说明两组数据结构有变化，从而得出在这个维度上是有异动的。本模块包括卡方检测子模块321和拟合优度子模块322，采用卡方检验和拟合优度检验的方法，某些场景下，整体数据波动较大时，多个维度上卡方检验得出的P值可能都近似相等，此时拟合优度检验计算出来的可决系数R^2可以用来辅助验证这些维度上结构变化的大小。当出现异动时进行告警。

异动定位模块330：本模块的主要功能是从异动判定模块获取的所有结构有变化维度中挖掘出关键异动维度，以及受关键异动维度影响的其他各级维度，包括维度定位子模块331和交叉维度下钻子模块332，分别对应维度定位算法和交叉维度下钻算法。维度定位算法，会在一级维度和二级维度里找关键异动维度，即在同级维度里优先比较P值的大小并辅助比较R^2值的大小，把最小的认为是关键异动维度。然后在该关键异动维度计算当日的分布数据和历史基准值分布数据各项的差值并排序，把其中差值绝对值最大的数据项认为是导致异动的主因。交叉维度下钻算法是在关键异动维度定位后，把那些维度组合中包含关键异动维度且自身又被判定为异动的维度作为受关键异动维度影响的维度。举例来说，假如“支付方式”跟其他维度如“省份”、“订单类型”比较假设检验的结果，最终“支付方式”被定位为关键异动维度的话，则在“支付方式”维度里比较各项的波动情况，如果其中在线支付数据波动最大，则把在线支付数据的波动认为是异动的主因。最后，就是在包含支付方式这一关键异动维度的交叉维度(即“省份_支付方式”，“订单类型_支付方式”等)里，找出受关键异动维度影响的维度。最后输出关键异动维度、受关键异动维度影响的维度和异动的主因。

以上所述实施例仅表达了本发明的儿种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

一种分布数据异动判断定位方法，其特征在于，包括：

分布数据准备步骤，包括：获取多维度分布数据，以及多维度基准值分布数据，所述多维度基准值分布数据为所述多维度分布数据的每个数据对应的历史基准值，由多个维度交叉组合得到多个维度组合，根据所述多维度分布数据分别生成多个关于一级维度的当前一级维度分布数据，以及多个关于维度组合的当前维度组合分布数据，根据所述多维度基准值分布数据分别生成多个关于一级维度的历史一级维度基准值分布数据，以及多个关于维度组合的历史维度组合基准值分布数据；

异动判定步骤，包括：将所述当前一级维度分布数据与对应的历史一级维度基准值分布数据进行比较得到每个当前一级维度分布数据相对于对应的历史一级维度基准值分布数据的结构异动，结构异动超过异动阈值的当前一级维度分布数据为异动一级维度分布数据，将所述当前维度组合分布数据与历史维度组合基准值分布数据进行比较得到每个当前维度组合分布数据相对于对应的历史维度组合基准值分布数据的结构异动，结构异动超过异动阈值的当前维度组合分布数据为异动维度组合分布数据，如果有异动一级维度分布数据或异动维度组合分布数据则进行告警。
根据权利要求1所述的分布数据异动判断定位方法，其特征在于，还包括：

异动定位步骤，包括：将结构异动最高的异动一级维度分布数据所对应的维度作为关键异动维度，所述异动维度组合分布数据所对应的维度组合为异动维度组合，所述异动维度组合中包括所述关键异动维度的维度组合为受关键异动维度影响的维度组合，所述受关键异动维度影响的维度组合所包括的除关键异动维度以外的其他维度为受关键异动维度影响的维度，显示所述关键异动维度以及受关键异动维度影响的维度。
根据权利要求2所述的分布数据异动判断定位方法，其特征在于：

所述异动判定步骤，具体包括：计算当前一级维度分布数据与对应的历史一级维度基准值分布数据的卡方值，所述异动一级维度分布数据为对应的卡方值超过异动阈值的当前一级维度分布数据，计算当前维度组合分布数据与对应的历史维度组合基准值分布数据的卡方值，所述异动维度组合分布数据为对应的卡方值超过异动阈值的当前维度组合分布数据；

所述异动定位步骤，具体包括：结构异动最高的异动一级维度分布数据为与最小卡方值对应的异动一级维度分布数据。
根据权利要求2所述的分布数据异动判断定位方法，其特征在于：

所述异动判定步骤，具体包括：计算当前一级维度分布数据与对应的历史一级维度基准值分布数据的卡方值，所述异动一级维度分布数据为对应的卡方值超过异动阈值的当前一级维度分布数据，计算当前维度组合分布数据与对应的历史维度组合基准值分布数据的卡方值，所述异动维度组合分布数据为对应的卡方值超过异动阈值的当前维度组合分布数据；

所述异动定位步骤，具体包括：选择与最小卡方值对应的异动一级维度分布数据为最小异动一级维度分布数据，从其他的异动一级维度分布数据中，选择对应的卡方值与最小卡方值的差值小于差值阈值的异动一级维度分布数据，与对应的历史一级维度基准值分布数据进行拟合优度检验计算得到可决系数，结构异动最高的异动一级维度分布数据为与最小可决系数对应的异动一级维度分布数据。
根据权利要求2所述的分布数据异动判断定位方法，其特征在于，所述异动定位步骤，还包括：将关键异动维度所对应的异动一级维度分布数据作为关键异动一级维度分布数据，对关键异动一级维度分布数据与对应的历史一级维度基准值分布数据的每一数据项分别计算差值，将其中差值的绝对值最大的数据项作为异动主因，显示所述异动主因。
一种分布数据异动判断定位系统，其特征在于，包括：

分布数据准备模块，用于：获取多维度分布数据，以及多维度基准值分布数据，所述多维度基准值分布数据为所述多维度分布数据的每个数据对应的历史基准值，由多个维度交叉组合得到多个维度组合，根据所述多维度分布数据分别生成多个关于一级维度的当前一级维度分布数据，以及多个关于维度组合的当前维度组合分布数据，根据所述多维度基准值分布数据分别生成多个关于一级维度的历史一级维度基准值分布数据，以及多个关于维度组合的历史维度组合基准值分布数据；

异动判定模块，用于：将所述当前一级维度分布数据与对应的历史一级维度基准值分布数据进行比较得到每个当前一级维度分布数据相对于对应的历史一级维度基准值分布数据的结构异动，结构异动超过异动阈值的当前一级维度分布数据为异动一级维度分布数据，将所述当前维度组合分布数据与历史维度组合基准值分布数据进行比较得到每个当前维度组合分布数据相对于对应的历史维度组合基准值分布数据的结构异动，结构异动超过异动阈值的当前维度组合分布数据为异动维度组合分布数据，如果有异动一级维度分布数据或异动维度组合分布数据则进行告警。
根据权利要求6所述的分布数据异动判断定位系统，其特征在于，还包括：

异动定位模块，用于：将结构异动最高的异动一级维度分布数据所对应的维度作为关键异动维度，所述异动维度组合分布数据所对应的维度组合为异动维度组合，所述异动维度组合中包括所述关键异动维度的维度组合为受关键异动维度影响的维度组合，所述受关键异动维度影响的维度组合所包括的除关键异动维度以外的基他维度为受关键异动维度影响的维度，显示所述关键异动维度以及受关键异动维度影响的维度。
根据权利要求6所述的分布数据异动判断定位系统，其特征在于：

所述异动判定模块，具体用于：计算当前一级维度分布数据与对应的历史一级维度基准值分布数据的卡方值，所述异动一级维度分布数据为对应的卡方值超过异动阈值的当前一级维度分布数据，计算当前维度组合分布数据与对应的历史维度组合基准值分布数据的卡方值，所述异动维度组合分布数据为对应的卡方值超过异动阈值的当前维度组合分布数据；

所述异动定位模块，具体用于：结构异动最高的异动一级维度分布数据为与最小卡方值对应的异动一级维度分布数据。
根据权利要求6所述的分布数据异动判断定位系统，其特征在于：

所述异动判定模块，具体用于：计算当前一级维度分布数据与对应的历史一级维度基准值分布数据的卡方值，所述异动一级维度分布数据为对应的卡方值超过异动阈值的当前一级维度分布数据，计算当前维度组合分布数据与对应的历史维度组合基准值分布数据的卡方值，所述异动维度组合分布数据为对应的卡方值超过异动阈值的当前维度组合分布数据；

所述异动定位模块，具体用于：选择与最小卡方值对应的异动一级维度分布数据为最小异动一级维度分布数据，从其他的异动一级维度分布数据中，选择对应的卡方值与最小卡方值的差值小于差值阈值的异动一级维度分布数据，与对应的历史一级维度基准值分布数据进行拟合优度检验计算得到可决系数，结构异动最高的异动一级维度分布数据为与最小可决系数对应的异动一级维度分布数据。
根据权利要求6所述的分布数据异动判断定位系统，其特征在于，所述异动定位模块，还用于：将关键异动维度所对应的异动一级维度分布数据作为关键异动一级维度分布数据，对关键异动一级维度分布数据与对应的历史一级维度基准值分布数据的每一数据项分别计算差值，将其中差值的绝对值最大的数据项作为异动主因，显示所述异动主因。