CN107957988A - 用于确定数据异常原因的方法、装置及电子设备 - Google Patents

用于确定数据异常原因的方法、装置及电子设备 Download PDF

Info

Publication number
CN107957988A
CN107957988A CN201610906956.7A CN201610906956A CN107957988A CN 107957988 A CN107957988 A CN 107957988A CN 201610906956 A CN201610906956 A CN 201610906956A CN 107957988 A CN107957988 A CN 107957988A
Authority
CN
China
Prior art keywords
index
sub
abnormal
exception
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610906956.7A
Other languages
English (en)
Inventor
姜骁
刘磊
车九洲
吴镇宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610906956.7A priority Critical patent/CN107957988A/zh
Publication of CN107957988A publication Critical patent/CN107957988A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing

Abstract

本申请公开了一种用于确定数据异常原因的方法、装置及电子设备。其中,所述用于确定数据异常原因的方法包括:获取对待分析的异常主指标产生影响的子指标;根据各个子指标的实际数据和各个子指标的基准数据,确定存在异常的子指标;根据异常子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常主指标的异常原因。采用本申请提供的方法,能够对发生异常的监控指标进行自动的分析,找出可能的异常原因,从而解决业务现象的溯源和分析问题。

Description

用于确定数据异常原因的方法、装置及电子设备
技术领域
本申请涉及数据处理技术,具体涉及一种用于确定数据异常原因的方法;相应的,本申请同时涉及一种用于确定数据异常原因的装置及电子设备,一种数据监测方法、装置及电子设备,一种用于请求数据监测的方法、装置及电子设备,一种数据监测系统,一种用于构建分析文本模板的方法及装置,一种用于构建对应关系的方法、装置及系统。
背景技术
随着计算机技术的发展,基于计算机的业务系统也日益增多,各种业务系统为用户提供了丰富多彩的服务。为了便于掌握业务的运行状况以对业务进行管理或者对系统进行调整,大部分的业务系统都会记录大量的业务监控数据,供业务运营人员参考使用。
目前,业务监控系统通常只给出各种运营监控指标的具体数据,而无法对异常指标进行分析,即:无法给出异常指标的产生原因。然而,对于运营人员而言,监控指标的异常原因是具有实际指导意义的信息,运营人员需要清楚监控指标的异常原因,才能确定对业务系统的调整方法。
综上所述,通过运营人员对异常指标进行分析是一项极为复杂、且消耗大量人力的工作。如何对监控指标进行自动的分析、找出可能的异常原因,是本领域技术人员需要迫切解决的问题。
发明内容
本申请提供一种用于确定数据异常原因的方法,以解决现有技术下无法对监控指标知识的异常原因进行自动分析的问题。本申请还提供用于确定数据异常原因的装置及电子设备,一种数据监测方法、装置及电子设备,一种用于请求数据监测的方法、装置及电子设备,一种数据监测系统,一种用于构建分析文本模板的方法及装置,一种用于构建对应关系的方法、装置及系统。
本申请提供一种用于确定数据异常原因的方法,包括:
获取对待分析的异常主指标产生影响的子指标;
根据各个子指标的实际数据和各个子指标的基准数据,确定存在异常的子指标;
根据异常子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常主指标的异常原因。
可选的,所述获取对待分析的异常主指标产生影响的子指标,采用如下方式:
根据预设的指标关系集,获取对所述异常主指标产生影响的子指标。
可选的,所述获取对待分析的异常主指标产生影响的子指标,采用如下方式:
获取与所述异常主指标之间的关联度大于等于预设的最小关联度阈值的指标,作为对所述异常主指标产生影响的子指标。
可选的,所述基准数据包括以下数据的至少一者:相对预设时间范围内实际数据均值的正向基准波动幅度,相对预设时间范围内实际数据均值的负向基准波动幅度,预设的最大数据阈值、预设的最小数据阈值。
可选的,所述基准数据包括所述正向基准波动幅度和所述负向基准波动幅度;
所述确定存在异常的子指标,采用如下方式:
若所述子指标的实际数据相对所述子指标的所述均值的波动幅度大于所述正向基准波动幅度,则将所述子指标作为异常子指标;
若所述子指标的实际数据相对所述子指标的所述均值的波动幅度小于负向基准波动幅度,则将所述子指标作为异常子指标。
可选的,所述基准数据包括所述正向基准波动幅度和所述负向基准波动幅度;
所述异常子指标的异常情况,采用如下方式确定:
若所述异常子指标的实际数据相对所述异常子指标的均值的波动幅度大于所述正向基准波动幅度,则将所述异常子指标的异常情况设置为正向波动异常;
若所述异常子指标的实际数据相对所述异常子指标的均值的波动幅度小于所述负向基准波动幅度,则将所述异常子指标的异常情况设置为负向波动异常。
可选的,所述分析文本模板包括带有指标变量名的可变化文本模板;
所述生成所述异常主指标的异常原因,包括:
针对各个异常子指标,根据该指标的异常情况和所述对应关系集,获取该指标的该异常情况对所述异常主指标产生影响的分析文本模板;以及根据该指标的实际数据和所述分析文本模板,生成该指标的该异常情况对所述异常主指标产生影响的分析文本;
对各个所述分析文本进行拼接,获得所述异常主指标的异常原因。
可选的,所述对应关系集,采用如下方式生成:
根据预设的模板生成规则,生成各个子指标的各种异常情况各自对应的分析文本模板,形成所述对应关系集。
可选的,所述对应关系集,采用如下步骤生成:
接收客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
根据接收到的至少一个对应关系,生成所述对应关系集。
相应的,本申请还提供一种用于确定数据异常原因的装置,包括:
子指标获取单元,用于获取对待分析的异常主指标产生影响的子指标;
异常子指标确定单元,用于根据各个子指标的实际数据和各个子指标的基准数据,确定存在异常的子指标;
异常原因生成单元,用于根据异常子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常主指标的异常原因。
可选的,所述子指标获取单元,具体用于根据预设的指标关系集,获取对所述异常主指标产生影响的子指标。
可选的,所述子指标获取单元,具体用于获取与所述异常主指标之间的关联度大于等于预设的最小关联度阈值的指标,作为对所述异常主指标产生影响的子指标。
可选的,所述基准数据包括:相对预设时间范围内实际数据均值的正向基准波动幅度和相对预设时间范围内实际数据均值的负向基准波动幅度;
所述异常子指标确定单元,具体用于若所述子指标的实际数据相对所述子指标的所述均值的波动幅度大于所述正向基准波动幅度,则将所述子指标作为异常子指标;以及若所述子指标的实际数据相对所述子指标的所述均值的波动幅度小于负向基准波动幅度,则将所述子指标作为异常子指标。
可选的,所述分析文本模板包括带有指标变量名的可变化文本模板;
所述异常原因生成单元包括:
分析文本生成子单元,用于针对各个异常子指标,根据该指标的异常情况和所述对应关系集,获取该指标的该异常情况对所述异常主指标产生影响的分析文本模板;以及根据该指标的实际数据和所述分析文本模板,生成该指标的该异常情况对所述异常主指标产生影响的分析文本;
分析文本拼接子单元,用于对各个所述分析文本进行拼接,获得所述异常主指标的异常原因。
可选的,还包括:
对应关系集生成单元,用于生成所述对应关系集。
可选的,所述对应关系集生成单元,具体用于根据预设的模板生成规则,生成各个子指标的各种异常情况各自对应的分析文本模板,形成所述对应关系集。
可选的,所述对应关系集生成单元包括:
对应记录接收子单元,用于接收客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
对应关系集生成子单元,用于根据接收到的至少一个对应关系,生成所述对应关系集。
相应的,本申请还提供一种电子设备,包括:
处理器;以及
存储器,用于存储实现用于确定数据异常原因的方法的程序,该设备通电并通过所述处理器运行该用于确定数据异常原因的方法的程序后,执行下述步骤:获取对待分析的异常主指标产生影响的子指标;根据各个子指标的实际数据和各个子指标的基准数据,确定存在异常的子指标;根据异常子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常主指标的异常原因。
相应的,本申请还提供一种数据监测方法,包括:
接收客户端发送的针对特定业务系统的业务运营监测请求;
根据所述特定业务系统的各个预设业务运营主指标的实际数据和各个预设业务运营主指标的基准数据,确定存在异常的预设业务运营主指标;
针对各个异常的预设业务运营主指标,获取对所述异常的预设业务运营主指标产生影响的预设业务运营子指标;并根据各个预设业务运营子指标的实际数据和各个预设业务运营子指标的基准数据,确定存在异常的预设业务运营子指标;以及根据异常的预设业务运营子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常的预设业务运营主指标的异常原因;
向所述客户端回送各个异常的预设业务运营主指标的异常原因。
可选的,还包括:
接收所述客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
根据接收到的至少一个对应关系,生成所述对应关系集。
相应的,本申请还提供一种数据监测装置,包括:
监测请求接收单元,用于接收客户端发送的针对特定业务系统的业务运营监测请求;
异常主指标确定单元,用于根据所述特定业务系统的各个预设业务运营主指标的实际数据和各个预设业务运营主指标的基准数据,确定存在异常的预设业务运营主指标;
异常原因生成单元,用于针对各个异常的预设业务运营主指标,获取对所述异常的预设业务运营主指标产生影响的预设业务运营子指标;并根据各个预设业务运营子指标的实际数据和各个预设业务运营子指标的基准数据,确定存在异常的预设业务运营子指标;以及根据异常的预设业务运营子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常的预设业务运营主指标的异常原因;
异常原因回送单元,用于向所述客户端回送各个异常的预设业务运营主指标的异常原因。
可选的,还包括:
对应关系接收单元,用于接收所述客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
对应关系集生成单元,用于根据接收到的至少一个对应关系,生成所述对应关系集。
相应的,本申请还提供一种用于请求数据监测的方法,包括:
向服务器发送针对特定业务系统的业务运营监测请求;
接收所述服务器回送的所述特定业务系统中存在异常的各个预设业务运营主指标的异常原因。
可选的,还包括:
向所述服务器提交通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系。
相应的,本申请还提供一种用于请求数据监测的装置,包括:
监测请求发送单元,用于向服务器发送针对特定业务系统的业务运营监测请求;
异常原因接收单元,用于接收所述服务器回送的所述特定业务系统中存在异常的各个预设业务运营主指标的异常原因。
可选的,还包括:
对应关系发送单元,用于向所述服务器提交通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系。
相应的,本申请还提供一种数据监测系统,包括:根据上述任一项所述的数据监测装置;以及根据上述任一项所述的用于请求数据监测的装置。
相应的,本申请还提供一种用于构建分析文本模板的方法,包括:
获取待处理的主指标;
获取对所述主指标产生影响的子指标;
根据预设的模板生成规则,生成各个子指标的各种异常情况各自对所述主指标的异常原因的影响分析文本模板。
可选的,还包括:
存储所述主指标、与各个子指标的各种异常情况及所述异常情况对应的所述影响分析文本模板之间的对应关系。
相应的,本申请还提供一种用于构建分析文本模板的装置,包括:
主指标获取单元,用于获取待处理的主指标;
子指标获取单元,用于获取对所述主指标产生影响的子指标;
模板构建单元,用于根据预设的模板生成规则,生成各个子指标的各种异常情况各自对所述主指标的异常原因的影响分析文本模板。
相应的,本申请还提供一种用于构建对应关系的方法,包括:
接收客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
存储接收到的至少一个对应关系。
相应的,本申请还提供一种用于构建对应关系的装置,包括:
对应关系接收单元,用于接收客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
对应关系存储单元,用于存储接收到的至少一个对应关系。
相应的,本申请还提供一种用于构建对应关系的系统,包括:根据上述任一项所述的用于构建对应关系的装置;以及对应关系提交装置;
所述对应关系提交装置,用于向服务器提交通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系。
与现有技术相比,本申请提供的用于确定数据异常原因的方法,通过获取对待分析的异常主指标产生影响的子指标;根据各个子指标的实际数据和各个子指标的基准数据,确定存在异常的子指标;根据异常子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常主指标的异常原因。
使用本申请提供的用于确定数据异常原因的方法,在业务数据化程度日益提高的背景下,能够根据对异常主指标产生影响的异常子指标的异常情况、和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常主指标的异常原因;这种处理方式,能够对发生异常的监控指标进行自动的分析,找出可能的异常原因,从而解决业务现象的溯源和分析问题。
附图说明
图1是本申请提供的一种用于确定数据异常原因的方法的实施例的流程图;
图2是本申请提供的一种用于确定数据异常原因的方法的实施例的界面示意图;
图3是本申请提供的一种用于确定数据异常原因的装置的实施例的示意图;
图4是本申请提供的一种电子设备的实施例的示意图;
图5是本申请提供的一种数据监测方法的实施例的流程图;
图6是本申请提供的一种数据监测装置的实施例的示意图;
图7是本申请提供的一种用于请求数据监测的方法的实施例的流程图;
图8是本申请提供的一种用于请求数据监测的装置的实施例的示意图;
图9是本申请提供的一种数据监测系统的实施例的示意图。
图10是本申请提供的一种用于构建分析文本模板的方法的实施例的流程图;
图11是本申请提供的一种用于构建分析文本模板的装置的实施例的示意图;
图12是本申请提供的一种用于构建对应关系的方法的实施例的流程图;
图13是本申请提供的一种用于构建对应关系的装置的实施例的示意图;
图14是本申请提供的一种用于构建对应关系的系统的实施例的示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本申请中,提供了一种用于确定数据异常原因的方法、装置及电子设备,一种数据监测方法、装置及电子设备,一种用于请求数据监测的方法、装置及电子设备,一种数据监测系统,一种用于构建分析文本模板的方法及装置,一种用于构建对应关系的方法、装置及系统。在下面的实施例中逐一进行详细说明。
本申请提供的用于确定数据异常原因的方法,其核心的基本思想为:对一个关心的主指标关联若干影响它的子指标,并对每个子指标的异常情况进行对主指标的关联分析,用实际异常的所有子指标分析组成主指标异常的原因分析。由于能够对发生异常的主指标进行自动的分析,找出可能的异常原因,因而,解决了业务现象的溯源和分析问题。
请参看图1,其为本申请的用于确定数据异常原因的方法实施例的流程图。所述方法包括如下步骤:
步骤S101:获取对待分析的异常主指标产生影响的子指标。
所述主指标是指受其他指标影响的指标,对主指标产生影响的其他指标称为该主指标的子指标。所述子指标可以为直接子指标,还可以为间接子指标。所述间接子指标包括对所述直接子指标产生影响的子指标。
例如,如果A、B、C、D、E、F这5个指标的关系为:B、C、D、E、F的波动会影响指标A,记作B,C,D,E,F→A,则指标A为主指标,指标B、C、D、E、F为指标A的子指标、且为直接子指标;如果指标B1和B2的波动会影响指标B,则指标B1和B2为指标B的直接子指标,为指标A的间接子指标。如果指标A为用户关心的运营指标,需要定期分析该指标是否正常并找到异常原因,则在发现指标A为异常数据时,可应用本申请提供的方法找到发生异常的具体原因。
以聚划算竞拍业务系统为例,该系统会在运营过程中记录下大量的监控数据,如,某个商品类目的平均单坑产出(单个资源位平均销售额)、大盘(聚划算平台)整体销量、大盘UV(unique visitor,独立访客)、大盘PV(页面浏览量或点击量)等;其中,由于平均单坑产出受到大盘整体销量、大盘UV、大盘PV等指标的影响,因此,平均单坑产出为主指标,其它指标为子指标;由于大盘整体销量受到大盘UV、大盘PV的影响,因此,大盘UV、大盘PV这两个指标为大盘整体销量的直接子指标,同时,这两个指标为平均单坑产出的间接子指标。
异常指标是指实际数据超出基准数据的指标,如果实际数据未超出基准数据,则为正常指标。在实际应用中,可根据预设的异常数据判断周期,判断预设主指标的实际数据是否存在异常,例如,每小时判断一次,或每天判断一次。
所述实际数据是指,指标在实际业务运营中的数据,例如,平均单坑产出的本次数据等。所述基准数据是指,确定指标的实际数据怎样达到其性能水平的调查结果。
所述基准数据包括但不限于:相对平均值的数据波动幅度,如:相对预设时间范围内实际数据均值的正向基准波动幅度、相对预设时间范围内实际数据均值的负向基准波动幅度;所述基准数据还包括指定的数据变化范围,如:预设的最大数据阈值、预设的最小数据阈值等。
例如,相对预设时间范围内实际数据均值的正向基准波动幅度为20%、相对预设时间范围内实际数据均值的负向基准波动幅度为10%;或者数据变化范围为(800,1500),即:预设的最大数据阈值为1500、预设的最小数据阈值为800。
所述基准数据可以是运营人员根据经验或根据业务目标直接设定的基准数据,也可以是通过对预设时间范围内的多个实际数据进行统计形成的基准数据。所述预设时间范围可根据业务需求确定,例如,设定为1个月、3个月等。
下面以聚划算竞拍业务系统为例说明异常指标的判定,例如,平均单坑产出的本次数据为x1,该指标在最近三个月的均值为xAveg,该指标在最近三个月相对均值的波动幅度(正向、负向)为20%,那么,如果该指标的基准数据为最近三个月相对均值的波动幅度,且该指标的本次数据相对该均值的波动幅度为30%(或-25%),则将该指标作为异常指标。
要实施本申请提供的方法,需要首先获取对待分析的异常主指标产生影响的子指标,要获取对异常主指标产生影响的子指标,可采用多种不同的具体实施方式,下面给出两种可选的实施方式。
方式一、根据预设的指标关系集,获取对所述异常主指标产生影响的子指标。
要采用方式一实现步骤S101,首先需要设定不同指标之间的相互影响关系。不同指标之间的相互影响关系可能存储在数据库中的指标关系表中,也可能在配置文件中进行设定。根据不同指标之间的相互影响关系的存储方式、设定方式的不同,可采用多种不同的具体实施方式实现本步骤S101,例如,通过数据库查询方式,根据预设的指标关系表获取对异常主指标产生影响的各个子指标;或者,通过读取配置文件的方式获取对异常主指标产生影响的各个子指标。
在本实施例中,将不同指标之间的相互影响关系存储在预设的指标关系表中,如表1所示:
主指标 对指标产生影响的直接子指标
平均单坑产出 大盘销量、商品质量…
大盘销量 大盘UV、大盘PV…
坏坑率 商品质量…
表1
由表1可见,大盘销量和商品质量为平均单坑产出的直接子指标,大盘PV、大盘UV为大盘销量的直接子指标,因此,大盘PV、大盘UV为平均单坑产出的间接子指标。
需要注意的是,在根据表1方式设定的不同指标之间的相互影响关系获取对主指标产生影响的子指标时,根据实际业务需求,可以仅获取直接子指标,也可以逐层获取各级子指标,直至获取到对主指标产生影响的所有子指标。
方式二、获取与所述异常主指标之间的关联度大于等于预设的最小关联度阈值的指标,作为对所述异常主指标产生影响的子指标。
采用方式二实现步骤S101,可包括如下具体步骤:1)获取所述异常主指标与其它各个预设指标之间的指标关联度;2)将与所述异常主指标之间的指标关联度大于等于预设的最小关联度阈值的指标,作为对所述异常主指标产生影响的子指标。
指标之间的关联度,可以采用皮尔逊相关系数、欧几里德距离等进行表达。在本实施例中,将两个指标的皮尔逊相关系数作为指标关联度,利用样本相关系数推断两个指标是否相关,描述了两个指标间联系的紧密程度。
要采用方式二实现步骤S101,还需要预先根据各个指标的实际数据,计算不同指标之间的关联度。
获取到对待分析的异常主指标产生影响的子指标之后,就可以进入下一步骤确定存在异常的子指标。
步骤S103:根据各个子指标的实际数据和各个子指标的基准数据,确定存在异常的子指标。
要实施本步骤,首先需要获取各个子指标的实际数据和各个子指标的基准数据,然后针对各个子指标,通过对比其实际数据和基准数据,即可确定该指标是否发生异常。
例如,对平均单坑产出产生影响的子指标包括大盘流量,大盘流量在最近一周内的平均值为1000万,该指标的基准数据被运营人员人工设定为:负向10%波动幅度、正向20%波动幅度,那么,如果大盘流量的当前数据为900万,则判定该子指标正常;如果当前数据为800万,则判定该子指标发生异常。
具体实施时,本步骤S103可包括如下具体步骤:1)针对各个子指标,获取子指标的实际数据;以及根据该指标在预设时间范围内的各个实际数据,计算获得该子指标的基准波动幅度,如:基准波动幅度为数据分布在相对均值波动幅度为20%以内,即:正向基准波动幅度为20%,负向基准波动幅度为-20%;2)根据获得的各个子指标的实际数据和基准数据,确定存在异常的子指标。
需要说明的是,本步骤S103不仅可以通过上述具体步骤实现,还可以采用其他具体实施方式,例如,先计算指标的均值和方差,然后再通过正态分布拟合与离群点计算的方式确定指标是否异常。在实际应用中,可根据具体业务需求,选用各种不同的具体实施方式找到异常子指标。
此外,还需要说明的是,各个子指标可对应不同类型的基准数据,例如,衡量指标A是否异常依据的基准数据为正向基准波动幅度和负向基准波动幅度;衡量指标B是否异常依据的基准数据为预设的最大数据阈值和最小数据阈值。在实际应用中,可根据具体业务需求为各个子指标设定各自不同的数据异常判断方法。
通过本步骤确定对异常主指标产生影响的异常子指标后,就可以进入下一步骤生成异常主指标的异常原因。
步骤S105:根据异常子指标的异常情况和预设的异常情况与分析文本模板的对应关系集,生成所述异常主指标的异常原因。
所述子指标的异常情况,包括但不限于:正向波动异常或负向波动异常,还包括其它可能的异常情况,例如,大于预设的最大数据阈值、或小于预设的最小数据阈值等。
在本实施例中,基准数据包括相对预设时间范围内实际数据均值的正向基准波动幅度、及相对预设时间范围内实际数据均值的负向基准波动幅度;相应的,所述子指标的异常情况包括正向波动异常或负向波动异常。
所述正向波动异常是指,所述子指标的实际数据大于所述正向基准波动幅度;所述负向波动异常是指,所述子指标的实际数据小于所述负向基准波动幅度。
要实施本步骤S105,需要首先确定各个异常子指标的异常情况,然后根据各个异常子指标的异常情况,以及预先生成的异常情况与分析文本模板的对应关系集,生成所述异常主指标的异常原因。
具体实施时,针对各个异常子指标,可采用如下方式确定其异常情况:若异常子指标的实际数据相对该指标均值的波动幅度大于所述正向基准波动幅度,则将该指标的异常情况设置为正向波动异常;若异常子指标的实际数据相对该指标均值的波动幅度小于所述负向基准波动幅度,则将该指标的异常情况设置为负向波动异常。
所述预先生成的异常情况与分析文本模板的对应关系集,定义了各种不同的子指标异常情况对主指标异常原因的影响分析文本模板。
所述分析文本模板可以为不带有指标变量名的固定文本模板,即:分析文本是固定不变的;所述分析文本模板还可以为带有指标变量名的可变化文本模板,即:分析文本根据指标数据发生变化。
下面仍以聚划算竞拍业务系统为例,对所述预先生成的异常情况与分析文本模板的对应关系集进行说明。在聚划算竞拍业务中,大盘销量是平均单坑产出的直接子指标,大盘UV和大盘PV是大盘销量的直接子指标,则可为大盘销量的各种异常情况设定对应的对平均单坑产出的分析文本模板,例如,大盘销量“异常上升”时对平均单坑产出的分析文本模板为:大盘销量为%大盘销量指标的变量名%,高于平均%平均大盘销量指标的变量名%,大盘销量提升明显,大盘UV为%大盘UV指标的变量名%,UV的提高会间接提高销量,进而提高单产,平均UV数据%平均UV评价指标的变量名%,建议对比大盘数据,大盘PV%大盘PV评价指标的变量名%为%大盘PV指标的变量名%,整体流量%整体流量评价指标的变量名%,同时,竞拍平均PV数据为%竞拍平均PV评价指标的变量名%;相应的,大盘销量“异常下降”时对平均单坑产出的分析文本模板为:大盘销量为%大盘销量指标的变量名%,低于平均%平均大盘销量指标的变量名%,大盘销量提升下降,大盘UV为%大盘UV指标的变量名%,UV的提高会间接降低销量,进而降低单产,平均UV数据%平均UV评价指标的变量名%,建议对比大盘数据,大盘PV%大盘PV评价指标的变量名%为%大盘PV指标的变量名%,整体流量%整体流量评价指标的变量名%,同时,竞拍平均PV数据为%竞拍平均PV评价指标的变量名%。
上例仅给出了一种可选的所述异常情况与分析文本模板的对应关系的设定方式,具体实施时,也可采用其他设定方式,只要能够表达子指标的异常情况对主指标的异常原因的分析文本模板即可,例如,仅在子指标和主指标之间设置所述对应关系,将具体异常情况的表达作为相应子指标的评价指标的变量名,进行文本输出;或者,仅在直接子指标的异常情况和主指标之间设置所述对应关系,将间接子指标的异常情况和其直接影响的子指标间设置所述对应关系等。
在本实施例中,预设的各种异常情况对应的分析文本模板如表2所示:
要实施本申请提供的方法,首先需要生成所述异常情况与分析文本模板的对应关系集。要生成该对应关系集,可采用多种不同的具体实施方式,下面给出两种可选的实施方式。
方式一、根据预设的模板生成规则,生成各个子指标的各种异常情况各自对应的分析文本模板,形成所述对应关系集。
所述预设的模板生成规则为通用的模板生成规则,例如,模板生成规则为:“较均值波动今日”+主指标名+%主指标的变量名%+“,高于”+月平均主指标名+%月平均主指标的变量名%+“;”+子指标名+%子指标的变量名%等规则。
采用方式一,可根据模板生成规则,自动生成各个子指标的各种异常情况各自对应的分析文本模板,从而形成所述对应关系集。
方式二、根据客户端提交的通过模板编辑工具设置的主指标、子指标的异常情况与分析文本模板之间的对应记录,生成所述对应关系集。
采用方式二生成所述对应关系集,可包括如下具体步骤:1)接收客户端提交的用户通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;2)根据接收到的至少一个对应关系,生成所述对应关系集。
所述客户端首先加载模板编辑工具,用户(如:运营人员)可根据经验在所述模板编辑工具的界面中编辑文本分析模板,例如,用户可首先选取主指标,然后,再选取对该主指标产生影响的子指标,接下来,可针对各个子指标的各种异常情况,编辑异常情况对应的文本分析模板。
此外,运营人员也可以在配置文件中设置所述异常情况与分析文本模板的对应关系的方式,例如,采用轻量级的JSON数据格式设定所述异常情况与分析文本模板的对应关系,或者,采用XML文件方式设定所述异常情况与分析文本模板的对应关系。
具体实施时,可在同一配置文件中,设置上述不同指标之间的相互影响关系、及所述预先生成的异常情况与分析文本模板的对应关系集,以便于运营人员能够对这两方面信息进行统一管理。
在获得异常子指标的异常情况后,即可根据所述预先生成的异常情况与分析文本模板的对应关系集,生成查找异常主指标的异常原因。
在本实施例中,所述分析文本模板采用带有指标变量名的可变化文本模板;相应的,本步骤S105可包括如下具体步骤:1)针对各个异常子指标,根据该指标的异常情况和所述对应关系集,获取该指标的该异常情况对所述异常主指标产生影响的分析文本模板;以及根据该指标的实际数据和所述分析文本模板,生成该指标的该异常情况对所述异常主指标产生影响的分析文本;2)对各个所述分析文本进行拼接,获得所述异常主指标的异常原因。
为了提升最终生成的异常原因的可读性,可通过自然语言处理技术对各个所述分析文本进行拼接,以获得语言更为通顺的异常原因,从而达到提高用户体验的效果。
作为一种可选的方案,可根据子指标波动的正负向和连接词的词性分析,将异常子指标对异常主指标的影响拼接成一段自然语言的分析。例如,子指标A为正向波动异常,子指标B为负向波动异常,则连接这两个指标对应的分析文本时,可选用“而”、“但是”等连接词;子指标A和子指标B均为正向波动异常,则连接这两个指标对应的分析文本时,可选用“并且”、“同时”等连接词。
请参看图2,其为本申请的用于确定数据异常原因的方法的实施例的界面示意图。图2为聚划算竞拍业务系统下的监控数据及异常原因分析展示界面图,该图包括单坑产出、坏坑率、下线商品数、竞拍情况、商品审核情况等6个运营人员直接关心的指标,图2展示了上述各个指标的实际运营数据及各自对应的异常原因分析,其中,各个异常原因均应用本申请提供的方法生成。在本实施例中,根据预设的异常原因分析周期执行本申请提供的方法,例如,每天执行一次、或每周执行一次等。
在上述的实施例中,提供了一种用于确定数据异常原因的方法,与之相对应的,本申请还提供一种用于确定数据异常原因的装置。该装置是与上述方法的实施例相对应。
请参看图3,其为本申请的用于确定数据异常原因的装置实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例的一种用于确定数据异常原因的装置,包括:
子指标获取单元101,用于获取对待分析的异常主指标产生影响的子指标;
异常子指标确定单元103,用于根据各个子指标的实际数据和各个子指标的基准数据,确定存在异常的子指标;
异常原因生成单元105,用于根据异常子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常主指标的异常原因。
可选的,所述子指标获取单元101,具体用于根据预设的指标关系集,获取对所述异常主指标产生影响的子指标。
可选的,所述子指标获取单元101,具体用于获取与所述异常主指标之间的关联度大于等于预设的最小关联度阈值的指标,作为对所述异常主指标产生影响的子指标。
可选的,所述基准数据包括:相对预设时间范围内实际数据均值的正向基准波动幅度和相对预设时间范围内实际数据均值的负向基准波动幅度;
所述异常子指标确定单元103,具体用于若所述子指标的实际数据相对所述子指标的所述均值的波动幅度大于所述正向基准波动幅度,则将所述子指标作为异常子指标;以及若所述子指标的实际数据相对所述子指标的所述均值的波动幅度小于负向基准波动幅度,则将所述子指标作为异常子指标。
可选的,所述分析文本模板包括带有指标变量名的可变化文本模板;
所述异常原因生成单元105包括:
分析文本生成子单元,用于针对各个异常子指标,根据该指标的异常情况和所述对应关系集,获取该指标的该异常情况对所述异常主指标产生影响的分析文本模板;以及根据该指标的实际数据和所述分析文本模板,生成该指标的该异常情况对所述异常主指标产生影响的分析文本;
分析文本拼接子单元,用于对各个所述分析文本进行拼接,获得所述异常主指标的异常原因。
可选的,还包括:
对应关系集生成单元,用于生成所述对应关系集。
可选的,所述对应关系集生成单元,具体用于根据预设的模板生成规则,生成各个子指标的各种异常情况各自对应的分析文本模板,形成所述对应关系集。
可选的,所述对应关系集生成单元包括:
对应记录接收子单元,用于接收客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
对应关系集生成子单元,用于根据接收到的至少一个对应关系,生成所述对应关系集。
请参见图4,其为本申请的电子设备实施例的示意图。由于设备实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的设备实施例仅仅是示意性的。
本实施例的一种电子设备,该电子设备包括:处理器101;以及存储器103,用于存储实现用于确定数据异常原因的方法的程序,该设备通电并通过所述处理器运行该用于确定数据异常原因的方法的程序后,执行下述步骤:获取对待分析的异常主指标产生影响的子指标;根据各个子指标的实际数据和各个子指标的基准数据,确定存在异常的子指标;根据异常子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常主指标的异常原因。
与上述的用于确定数据异常原因的方法相对应,本申请还提供一种数据监测方法。请参考图5,其为本申请提供的一种数据监测方法的实施例的流程示意图,本实施例与第一实施例内容相同的部分不再赘述,请参见实施例一中的相应部分。本申请提供的一种数据监测方法包括:
步骤S101:接收客户端发送的针对特定业务系统的业务运营监测请求。
要实施本申请提供的数据监测方法,首先需要接收客户端发送的针对特定业务系统的业务运营监测请求。所述业务运营监测请求可包括特定业务系统的系统标识。
所述特定业务系统包括但不限于电子商务系统,也可以是其它各种业务运营系统或运营支撑系统,例如,应用在电信领域的运营支撑系统等。
在本实施例中,特定业务系统为聚划算平台的某个商品类目对应的业务子系统(俗称“频道”)。聚划算平台包括多个商品类目的频道,例如,“女装”频道、“数码”频道等,为了有效地管理整个聚划算平台,每个频道由不同的运营人员负责管理,每个业务子系统的运营人员,可通过其使用的客户端向执行本申请提供的数据监测方法的服务器,发送针对其所管辖的频道的业务运营监测请求,该请求可包括该频道的频道标识。
当接收到客户端发送的针对特定业务系统的业务运营监测请求之后,就可以进入下一步骤,确定存在异常的预设业务运营主指标。
步骤S103:根据所述特定业务系统的各个预设业务运营主指标的实际数据和各个预设业务运营主指标的基准数据,确定存在异常的预设业务运营主指标。
所述特定业务系统通常包括大量的业务运营数据,本申请将运营人员直接感兴趣的业务运营数据,称为预设业务运营主指标。
确定预设的业务运营主指标是否异常的方式与上述实施例一中确定子指标是否异常的方式相同,相关说明请参见实施例一中的相关描述,此处不再赘述。
在确定存在异常的预设业务运营主指标之后,就可以进入下一步骤,生成各个异常的预设业务运营主指标的异常原因。
步骤S105:针对各个异常的预设业务运营主指标,获取对所述异常的预设业务运营主指标产生影响的预设业务运营子指标;并根据各个预设业务运营子指标的实际数据和各个预设业务运营子指标的基准数据,确定存在异常的预设业务运营子指标;以及根据异常的预设业务运营子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常的预设业务运营主指标的异常原因。
本步骤与上述实施例一相同,相关说明请参见实施例一中的相关描述,此处不再赘述。
作为一种可选的方案,本申请提供的数据监测方法,还可包括如下步骤:1)接收所述客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;2)根据接收到的至少一个对应关系,生成所述对应关系集。
所述主指标包括预设业务运营主指标,所述子指标包括预设业务运营子指标。采用这种可选的方案,用户可以通过模板编辑工具设置所述异常情况与分析文本模板的对应关系,并通过用户客户端提交设置的对应关系,服务器接收到这些对应关系后,根据这些对应关系,即可生成所述的异常情况与分析文本模板的对应关系集,以供生成所述异常的预设业务运营主指标的异常原因所用。
步骤S107:向所述客户端回送各个异常的预设业务运营主指标的异常原因。
最后,需要将拼接获得的各个异常主指标的异常原因返回给发送请求的客户端。
在上述的实施例中,提供了一种数据监测方法,与之相对应的,本申请还提供一种数据监测装置。请参看图6,其为本申请的一种数据监测装置实施例示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例的一种数据监测装置,包括:
监测请求接收单元101,用于接收客户端发送的针对特定业务系统的业务运营监测请求;
异常主指标确定单元103,用于根据所述特定业务系统的各个预设业务运营主指标的实际数据和各个预设业务运营主指标的基准数据,确定存在异常的预设业务运营主指标;
异常原因生成单元105,用于针对各个异常的预设业务运营主指标,获取对所述异常的预设业务运营主指标产生影响的预设业务运营子指标;并根据各个预设业务运营子指标的实际数据和各个预设业务运营子指标的基准数据,确定存在异常的预设业务运营子指标;以及根据异常的预设业务运营子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常的预设业务运营主指标的异常原因;
异常原因回送单元107,用于向所述客户端回送各个异常的预设业务运营主指标的异常原因。
可选的,还包括:
对应关系接收单元,用于接收所述客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
对应关系集生成单元,用于根据接收到的至少一个对应关系,生成所述对应关系集。
与上述的数据监测方法相对应,本申请还提供一种用于请求数据监测的方法。请参考图7,其为本申请提供的一种用于请求数据监测的方法的实施例的流程示意图,本实施例与第一实施例内容相同的部分不再赘述,请参见实施例一中的相应部分。本申请提供的一种用于请求数据监测的方法包括:
步骤S101:向服务器发送针对特定业务系统的业务运营监测请求。
关于所述特定业务系统及所述业务运营监测请求的相关说明,请参见上述数据监测方法实施例中的相关描述,此处不再赘述。
步骤S103:接收所述服务器回送的所述特定业务系统中存在异常的各个预设业务运营主指标的异常原因。
客户端将显示该业务系统中存在异常的各个预设业务运营主指标的异常原因。请参看图2,该图显示了聚划算“女装”频道中单坑产出、坏坑率、下线商品数、竞拍情况、商品审核情况等6个运营人员直接关心的指标,包括指标的实际运营数据及各自对应的异常原因分析。
作为一种可选的方案,本申请提供的用于请求数据监测的方法,还可包括如下步骤:向所述服务器提交通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系。
所述主指标包括预设业务运营主指标,所述子指标包括预设业务运营子指标。采用这种可选的方案,用户可以通过模板编辑工具设置各个子指标的各种异常情况与该异常情况对主指标的异常原因的影响分析文本模板之间的对应关系,并通过用户客户端提交设置的对应关系。服务器接收到这些对应关系后,根据这些对应关系,即可生成上述实施例所述的异常情况与分析文本模板的对应关系集。
在上述的实施例中,提供了一种用于请求数据监测的方法,与之相对应的,本申请还提供一种用于请求数据监测的装置。请参看图8,其为本申请的一种用于请求数据监测的装置实施例示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例的一种用于请求数据监测的装置,包括:
监测请求发送单元101,用于向服务器发送针对特定业务系统的业务运营监测请求;
异常原因接收单元103,用于接收所述服务器回送的所述特定业务系统中存在异常的各个预设业务运营主指标的异常原因。
可选的,还包括:
对应关系发送单元,用于向所述服务器提交通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系。
本申请实施例还提供了一种数据监测系统,如图9所示,该系统包括上述实施例所述的数据监测装置101和用于请求数据监测的装置102。所述数据监测装置101通常部署于服务器,但并不局限于服务器,也可以是能够实现所述数据监测方法的任何设备;所述用于请求数据监测的装置102通常部署于移动通讯设备、个人电脑、PAD、iPad等终端设备。
例如,用于请求数据监测的装置102部署在个人电脑上,能够向服务器发送针对特定业务系统的业务运营监测请求;所述数据监测装置101部署在服务器上,在接收到客户端发送的所述业务运营监测请求之后,将根据该业务系统的各个预设业务运营主指标的实际数据和各个预设业务运营主指标的基准数据,确定存在异常的预设业务运营主指标;然后,再针对各个异常的预设业务运营主指标,获取对所述异常的预设业务运营主指标产生影响的预设业务运营子指标;并根据各个预设业务运营子指标的实际数据和各个预设业务运营子指标的基准数据,确定存在异常的预设业务运营子指标;以及根据异常的预设业务运营子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常的预设业务运营主指标的异常原因;最后,所述数据监测装置101向客户端回送各个异常的预设业务运营主指标的异常原因;所述用于请求数据监测的装置102将接收到的所述异常原因显示在屏幕上,以供运营人员参考用。
与上述的用于确定数据异常原因的方法相对应,本申请还提供一种用于构建分析文本模板的方法。请参考图10,其为本申请提供的一种用于构建分析文本模板的方法的实施例的流程示意图,本实施例与第一实施例内容相同的部分不再赘述,请参见实施例一中的相应部分。本申请提供的一种用于构建分析文本模板的方法包括:
步骤S101:获取待处理的主指标。
通过执行本申请提供的用于构建分析文本模板的方法,可构建对主指标产生影响的各个子指标的各种异常情况对主指标的异常原因的影响分析文本模板。因此,要实施本申请提供的用于构建分析文本模板的方法,首先需要获取待处理的主指标。
获取到待处理的主指标,就可以进入下一步骤,获取对主指标产生影响的子指标。
步骤S103:获取对所述主指标产生影响的子指标。
获取对主指标产生影响的子指标的具体实施方式与上述实施例一中获取对待分析的异常主指标产生影响的子指标的具体实施方式相似,相关说明请参见实施例一中的相关描述,此处不再赘述。
可选的,获取对主指标产生影响的子指标,可采用如下方式:根据预设的指标关系集,获取对主指标产生影响的子指标。
可选的,获取对主指标产生影响的子指标,可采用如下方式:获取与主指标之间的关联度大于等于预设的最小关联度阈值的指标,作为对主指标产生影响的子指标。
步骤S105:根据预设的模板生成规则,生成各个子指标的各种异常情况各自对所述主指标的异常原因的影响分析文本模板。
本步骤与上述实施例一相同,相关说明请参见实施例一中的相关描述,此处不再赘述。
具体实施时,本申请提供的用于构建分析文本模板的方法,还可包括如下步骤:存储所述主指标、与各个子指标的各种异常情况及所述异常情况对应的所述影响分析文本模板之间的对应关系。
在上述的实施例中,提供了一种用于构建分析文本模板的方法,与之相对应的,本申请还提供一种用于构建分析文本模板的装置。请参看图11,其为本申请的一种用于构建分析文本模板的装置实施例示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例的一种用于构建分析文本模板的装置,包括:
主指标获取单元101,用于获取待处理的主指标;
子指标获取单元103,用于获取对所述主指标产生影响的子指标;
模板构建单元105,用于根据预设的模板生成规则,生成各个子指标的各种异常情况各自对所述主指标的异常原因的影响分析文本模板。
与上述的用于确定数据异常原因的方法相对应,本申请还提供一种用于构建对应关系的方法。请参考图12,其为本申请提供的一种用于构建对应关系的方法的实施例的流程示意图,本实施例与第一实施例内容相同的部分不再赘述,请参见实施例一中的相应部分。本申请提供的一种用于构建对应关系的方法包括:
步骤S101:接收客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系。
所述子指标是指,对所述主指标产生影响的子指标。用户可以通过模板编辑工具设置各个子指标的各种异常情况与该异常情况对主指标的异常原因的影响分析文本模板之间的对应关系,并通过用户客户端提交设置的对应关系。服务器接收到这些对应关系后,根据这些对应关系,即可生成上述实施例所述的异常情况与分析文本模板的对应关系集。
步骤S103:存储接收到的至少一个对应关系。
在上述的实施例中,提供了一种用于构建对应关系的方法,与之相对应的,本申请还提供一种用于构建对应关系的装置。请参看图13,其为本申请的一种用于构建对应关系的装置实施例示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例的一种用于构建对应关系的装置,包括:
对应关系接收单元101,用于接收客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
对应关系存储单元103,用于存储接收到的至少一个对应关系。
本申请实施例还提供了一种用于构建对应关系的系统,如图14所示,该系统包括上述实施例所述的用于构建对应关系的装置101和对应关系提交装置102。其中,所述对应关系提交装置102,用于向服务器提交通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系。
所述用于构建对应关系的装置101通常部署于服务器,但并不局限于服务器,也可以是能够实现所述用于构建对应关系的方法的任何设备;所述对应关系提交装置102通常部署于移动通讯设备、个人电脑、PAD、iPad等终端设备。
例如,对应关系提交装置102部署在个人电脑上,能够向服务器提交通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;所述用于构建对应关系的装置101部署在服务器上,在接收到客户端提交的至少一个对应关系之后,将存储接收到的至少一个对应关系。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (37)

1.一种用于确定数据异常原因的方法,其特征在于,包括:
获取对待分析的异常主指标产生影响的子指标;
根据各个子指标的实际数据和各个子指标的基准数据,确定存在异常的子指标;
根据异常子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常主指标的异常原因。
2.根据权利要求1所述的用于确定数据异常原因的方法,其特征在于,所述获取对待分析的异常主指标产生影响的子指标,采用如下方式:
根据预设的指标关系集,获取对所述异常主指标产生影响的子指标。
3.根据权利要求1所述的用于确定数据异常原因的方法,其特征在于,所述获取对待分析的异常主指标产生影响的子指标,采用如下方式:
获取与所述异常主指标之间的关联度大于等于预设的最小关联度阈值的指标,作为对所述异常主指标产生影响的子指标。
4.根据权利要求3所述的用于确定数据异常原因的方法,其特征在于,还包括:
根据各个指标的实际数据,计算获得不同指标之间的关联度。
5.根据权利要求1所述的用于确定数据异常原因的方法,其特征在于,所述基准数据包括以下数据的至少一者:相对预设时间范围内实际数据均值的正向基准波动幅度,相对预设时间范围内实际数据均值的负向基准波动幅度,预设的最大数据阈值、预设的最小数据阈值。
6.根据权利要求5所述的用于确定数据异常原因的方法,其特征在于:
所述基准数据包括所述正向基准波动幅度和所述负向基准波动幅度;
所述确定存在异常的子指标,采用如下方式:
若所述子指标的实际数据相对所述子指标的所述均值的波动幅度大于所述正向基准波动幅度,则将所述子指标作为异常子指标;
若所述子指标的实际数据相对所述子指标的所述均值的波动幅度小于负向基准波动幅度,则将所述子指标作为异常子指标。
7.根据权利要求5所述的用于确定数据异常原因的方法,其特征在于:
所述基准数据包括所述正向基准波动幅度和所述负向基准波动幅度;
所述异常子指标的异常情况,采用如下方式确定:
若所述异常子指标的实际数据相对所述异常子指标的均值的波动幅度大于所述正向基准波动幅度,则将所述异常子指标的异常情况设置为正向波动异常;
若所述异常子指标的实际数据相对所述异常子指标的均值的波动幅度小于所述负向基准波动幅度,则将所述异常子指标的异常情况设置为负向波动异常。
8.根据权利要求1所述的用于确定数据异常原因的方法,其特征在于,不同子指标对应不同类型的基准数据。
9.根据权利要求1所述的用于确定数据异常原因的方法,其特征在于:
所述分析文本模板包括带有指标变量名的可变化文本模板;
所述生成所述异常主指标的异常原因,包括:
针对各个异常子指标,根据该指标的异常情况和所述对应关系集,获取该指标的该异常情况对所述异常主指标产生影响的分析文本模板;以及根据该指标的实际数据和所述分析文本模板,生成该指标的该异常情况对所述异常主指标产生影响的分析文本;
对各个所述分析文本进行拼接,获得所述异常主指标的异常原因。
10.根据权利要求9所述的用于确定数据异常原因的方法,其特征在于,所述对各个所述分析文本进行拼接,采用如下方式:
通过自然语言处理技术对各个所述分析文本进行拼接。
11.根据权利要求1所述的用于确定数据异常原因的方法,其特征在于,所述对应关系集,采用如下方式生成:
根据预设的模板生成规则,生成各个子指标的各种异常情况各自对应的分析文本模板,形成所述对应关系集。
12.根据权利要求1所述的用于确定数据异常原因的方法,其特征在于,所述对应关系集,采用如下步骤生成:
接收客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
根据接收到的至少一个对应关系,生成所述对应关系集。
13.根据权利要求1所述的用于确定数据异常原因的方法,其特征在于,根据预设的异常原因分析周期执行所述用于确定数据异常原因的方法。
14.一种用于确定数据异常原因的装置,其特征在于,包括:
子指标获取单元,用于获取对待分析的异常主指标产生影响的子指标;
异常子指标确定单元,用于根据各个子指标的实际数据和各个子指标的基准数据,确定存在异常的子指标;
异常原因生成单元,用于根据异常子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常主指标的异常原因。
15.根据权利要求14所述的用于确定数据异常原因的装置,其特征在于:
所述子指标获取单元,具体用于根据预设的指标关系集,获取对所述异常主指标产生影响的子指标。
16.根据权利要求14所述的用于确定数据异常原因的装置,其特征在于:
所述子指标获取单元,具体用于获取与所述异常主指标之间的关联度大于等于预设的最小关联度阈值的指标,作为对所述异常主指标产生影响的子指标。
17.根据权利要求14所述的用于确定数据异常原因的装置,其特征在于:
所述基准数据包括:相对预设时间范围内实际数据均值的正向基准波动幅度和相对预设时间范围内实际数据均值的负向基准波动幅度;
所述异常子指标确定单元,具体用于若所述子指标的实际数据相对所述子指标的所述均值的波动幅度大于所述正向基准波动幅度,则将所述子指标作为异常子指标;以及若所述子指标的实际数据相对所述子指标的所述均值的波动幅度小于负向基准波动幅度,则将所述子指标作为异常子指标。
18.根据权利要求14所述的用于确定数据异常原因的装置,其特征在于:
所述分析文本模板包括带有指标变量名的可变化文本模板;
所述异常原因生成单元包括:
分析文本生成子单元,用于针对各个异常子指标,根据该指标的异常情况和所述对应关系集,获取该指标的该异常情况对所述异常主指标产生影响的分析文本模板;以及根据该指标的实际数据和所述分析文本模板,生成该指标的该异常情况对所述异常主指标产生影响的分析文本;
分析文本拼接子单元,用于对各个所述分析文本进行拼接,获得所述异常主指标的异常原因。
19.根据权利要求14所述的用于确定数据异常原因的装置,其特征在于,还包括:
对应关系集生成单元,用于生成所述对应关系集。
20.根据权利要求19所述的用于确定数据异常原因的装置,其特征在于:
所述对应关系集生成单元,具体用于根据预设的模板生成规则,生成各个子指标的各种异常情况各自对应的分析文本模板,形成所述对应关系集。
21.根据权利要求19所述的用于确定数据异常原因的装置,其特征在于,所述对应关系集生成单元包括:
对应记录接收子单元,用于接收客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
对应关系集生成子单元,用于根据接收到的至少一个对应关系,生成所述对应关系集。
22.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现用于确定数据异常原因的方法的程序,该设备通电并通过所述处理器运行该用于确定数据异常原因的方法的程序后,执行下述步骤:获取对待分析的异常主指标产生影响的子指标;根据各个子指标的实际数据和各个子指标的基准数据,确定存在异常的子指标;根据异常子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常主指标的异常原因。
23.一种数据监测方法,其特征在于,包括:
接收客户端发送的针对特定业务系统的业务运营监测请求;
根据所述特定业务系统的各个预设业务运营主指标的实际数据和各个预设业务运营主指标的基准数据,确定存在异常的预设业务运营主指标;
针对各个异常的预设业务运营主指标,获取对所述异常的预设业务运营主指标产生影响的预设业务运营子指标;并根据各个预设业务运营子指标的实际数据和各个预设业务运营子指标的基准数据,确定存在异常的预设业务运营子指标;以及根据异常的预设业务运营子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常的预设业务运营主指标的异常原因;
向所述客户端回送各个异常的预设业务运营主指标的异常原因。
24.根据权利要求23所述的数据监测方法,其特征在于,还包括:
接收所述客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
根据接收到的至少一个对应关系,生成所述对应关系集。
25.一种数据监测装置,其特征在于,包括:
监测请求接收单元,用于接收客户端发送的针对特定业务系统的业务运营监测请求;
异常主指标确定单元,用于根据所述特定业务系统的各个预设业务运营主指标的实际数据和各个预设业务运营主指标的基准数据,确定存在异常的预设业务运营主指标;
异常原因生成单元,用于针对各个异常的预设业务运营主指标,获取对所述异常的预设业务运营主指标产生影响的预设业务运营子指标;并根据各个预设业务运营子指标的实际数据和各个预设业务运营子指标的基准数据,确定存在异常的预设业务运营子指标;以及根据异常的预设业务运营子指标的异常情况和预先生成的异常情况与分析文本模板的对应关系集,生成所述异常的预设业务运营主指标的异常原因;
异常原因回送单元,用于向所述客户端回送各个异常的预设业务运营主指标的异常原因。
26.根据权利要求25所述的数据监测装置,其特征在于,还包括:
对应关系接收单元,用于接收所述客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
对应关系集生成单元,用于根据接收到的至少一个对应关系,生成所述对应关系集。
27.一种用于请求数据监测的方法,其特征在于,包括:
向服务器发送针对特定业务系统的业务运营监测请求;
接收所述服务器回送的所述特定业务系统中存在异常的各个预设业务运营主指标的异常原因。
28.根据权利要求27所述的数据监测方法,其特征在于,还包括:
向所述服务器提交通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系。
29.一种用于请求数据监测的装置,其特征在于,包括:
监测请求发送单元,用于向服务器发送针对特定业务系统的业务运营监测请求;
异常原因接收单元,用于接收所述服务器回送的所述特定业务系统中存在异常的各个预设业务运营主指标的异常原因。
30.根据权利要求29所述的数据监测装置,其特征在于,还包括:
对应关系发送单元,用于向所述服务器提交通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系。
31.一种数据监测系统,其特征在于,包括:根据上述权利要求25所述的数据监测装置;以及根据上述权利要求29所述的用于请求数据监测的装置。
32.一种用于构建分析文本模板的方法,其特征在于,包括:
获取待处理的主指标;
获取对所述主指标产生影响的子指标;
根据预设的模板生成规则,生成各个子指标的各种异常情况各自对所述主指标的异常原因的影响分析文本模板。
33.根据权利要求32所述的用于构建分析文本模板的方法,其特征在于,还包括:
存储所述主指标、与各个子指标的各种异常情况及所述异常情况对应的所述影响分析文本模板之间的对应关系。
34.一种用于构建分析文本模板的装置,其特征在于,包括:
主指标获取单元,用于获取待处理的主指标;
子指标获取单元,用于获取对所述主指标产生影响的子指标;
模板构建单元,用于根据预设的模板生成规则,生成各个子指标的各种异常情况各自对所述主指标的异常原因的影响分析文本模板。
35.一种用于构建对应关系的方法,其特征在于,包括:
接收客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
存储接收到的至少一个对应关系。
36.一种用于构建对应关系的装置,其特征在于,包括:
对应关系接收单元,用于接收客户端提交的通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系;
对应关系存储单元,用于存储接收到的至少一个对应关系。
37.一种用于构建对应关系的系统,其特征在于,包括:根据上述权利要求36所述的用于构建对应关系的装置;以及对应关系提交装置;
所述对应关系提交装置,用于向服务器提交通过模板编辑工具设置的至少一个主指标、子指标的异常情况与分析文本模板之间的对应关系。
CN201610906956.7A 2016-10-18 2016-10-18 用于确定数据异常原因的方法、装置及电子设备 Pending CN107957988A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610906956.7A CN107957988A (zh) 2016-10-18 2016-10-18 用于确定数据异常原因的方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610906956.7A CN107957988A (zh) 2016-10-18 2016-10-18 用于确定数据异常原因的方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN107957988A true CN107957988A (zh) 2018-04-24

Family

ID=61953460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610906956.7A Pending CN107957988A (zh) 2016-10-18 2016-10-18 用于确定数据异常原因的方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN107957988A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829638A (zh) * 2018-06-01 2018-11-16 阿里巴巴集团控股有限公司 一种业务数据波动处理方法及装置
CN110163479A (zh) * 2019-04-18 2019-08-23 红云红河烟草(集团)有限责任公司 一种烟草卷包车间质量异常问题主因模型的建立方法
CN110677310A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 流量归因方法、装置以及终端
CN111026570A (zh) * 2019-11-01 2020-04-17 支付宝(杭州)信息技术有限公司 用于确定业务系统异常原因的方法和装置
CN112463564A (zh) * 2020-11-30 2021-03-09 中国工商银行股份有限公司 确定影响主机状态的关联指标的方法及装置
CN112612929A (zh) * 2020-12-29 2021-04-06 珠海金山网络游戏科技有限公司 数据处理方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1542902A (zh) * 2003-04-29 2004-11-03 台湾积体电路制造股份有限公司 判断造成半导体机台异常原因的系统与方法
CN102365641A (zh) * 2009-03-26 2012-02-29 皇家飞利浦电子股份有限公司 基于诊断信息自动检索报告模板的系统
US20130080886A1 (en) * 2002-08-14 2013-03-28 Document Analytic Technologies, Llc Computer-based system and method for generating, classifying, searching, and analyzing standardized text templates and deviations from standardized text templates
CN104598764A (zh) * 2015-02-16 2015-05-06 上海市疾病预防控制中心 基于电子病历实现异常病例和事件数据监测的系统及方法
CN105447323A (zh) * 2015-12-11 2016-03-30 百度在线网络技术(北京)有限公司 一种数据异常波动检测方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130080886A1 (en) * 2002-08-14 2013-03-28 Document Analytic Technologies, Llc Computer-based system and method for generating, classifying, searching, and analyzing standardized text templates and deviations from standardized text templates
CN1542902A (zh) * 2003-04-29 2004-11-03 台湾积体电路制造股份有限公司 判断造成半导体机台异常原因的系统与方法
CN102365641A (zh) * 2009-03-26 2012-02-29 皇家飞利浦电子股份有限公司 基于诊断信息自动检索报告模板的系统
CN104598764A (zh) * 2015-02-16 2015-05-06 上海市疾病预防控制中心 基于电子病历实现异常病例和事件数据监测的系统及方法
CN105447323A (zh) * 2015-12-11 2016-03-30 百度在线网络技术(北京)有限公司 一种数据异常波动检测方法和装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829638A (zh) * 2018-06-01 2018-11-16 阿里巴巴集团控股有限公司 一种业务数据波动处理方法及装置
CN108829638B (zh) * 2018-06-01 2022-12-16 创新先进技术有限公司 一种业务数据波动处理方法及装置
CN110677310A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 流量归因方法、装置以及终端
CN110163479A (zh) * 2019-04-18 2019-08-23 红云红河烟草(集团)有限责任公司 一种烟草卷包车间质量异常问题主因模型的建立方法
CN111026570A (zh) * 2019-11-01 2020-04-17 支付宝(杭州)信息技术有限公司 用于确定业务系统异常原因的方法和装置
CN111026570B (zh) * 2019-11-01 2022-05-31 支付宝(杭州)信息技术有限公司 用于确定业务系统异常原因的方法和装置
CN112463564A (zh) * 2020-11-30 2021-03-09 中国工商银行股份有限公司 确定影响主机状态的关联指标的方法及装置
CN112463564B (zh) * 2020-11-30 2024-03-05 中国工商银行股份有限公司 确定影响主机状态的关联指标的方法及装置
CN112612929A (zh) * 2020-12-29 2021-04-06 珠海金山网络游戏科技有限公司 数据处理方法及装置

Similar Documents

Publication Publication Date Title
CN107957988A (zh) 用于确定数据异常原因的方法、装置及电子设备
CN108564286B (zh) 一种基于大数据征信的人工智能金融风控授信评定方法和系统
CN107194743B (zh) 一种网络调查问卷生成方法和装置
US20220292527A1 (en) Methods of assessing long-term indicators of sentiment
US20130304622A1 (en) Methods and systems for computing trading strategies for use in portfolio management and computing associated probability distributions for use in option pricing
US20160170974A1 (en) Statistical process control and analytics for translation supply chain operational management
CN106156965B (zh) 一种物流服务调度方法与设备
CN109446812A (zh) 一种嵌入式系统固件安全分析方法及系统
Goutte et al. Variance optimal hedging for continuous time additive processes and applications
CN109657962A (zh) 一种品牌的声量资产的评估方法及系统
AU2021200291A1 (en) Apparatuses, computer-implemented methods, and computer program products for improved monitored building environment monitoring and scoring
CN114782123A (zh) 一种信用评估方法及系统
EP2662820A1 (en) A robust position detection, cause-and-effect and rule determinants to govern excessive risks for global regulatory compliance
US20100280969A1 (en) Method and system for managing pension portfolios
CN112950359A (zh) 一种用户识别方法和装置
Malyscheff et al. Natural gas storage valuation via least squares Monte Carlo and support vector regression
CN111179055A (zh) 授信额度调整方法、装置和电子设备
CN109767333A (zh) 选基方法、装置、电子设备及计算机可读存储介质
CN109460778A (zh) 活动评估方法、装置、电子设备及存储介质
CN110210880A (zh) 数据处理方法、装置以及计算机可读存储介质
US11682036B2 (en) Machine learning with data synthesization
CN112907362A (zh) 贷款业务的处理方法、装置、电子设备和存储介质
CN109165238B (zh) 一种用于生成周期指标数据的数据处理方法及装置
CN109684430A (zh) 用于输出信息的方法和装置
Celina et al. Algorithm-Driven Predictive Analysis of Blue-Chip Stocks in the Murky Indian Environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180424

RJ01 Rejection of invention patent application after publication