CN109726075B - 一种异常数据指标分析的方法及装置 - Google Patents

一种异常数据指标分析的方法及装置 Download PDF

Info

Publication number
CN109726075B
CN109726075B CN201811452306.5A CN201811452306A CN109726075B CN 109726075 B CN109726075 B CN 109726075B CN 201811452306 A CN201811452306 A CN 201811452306A CN 109726075 B CN109726075 B CN 109726075B
Authority
CN
China
Prior art keywords
abnormal data
abnormal
target factor
data index
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811452306.5A
Other languages
English (en)
Other versions
CN109726075A (zh
Inventor
马志伟
苏杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Idreamsky Technology Co ltd
Original Assignee
Shenzhen Idreamsky Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Idreamsky Technology Co ltd filed Critical Shenzhen Idreamsky Technology Co ltd
Priority to CN201811452306.5A priority Critical patent/CN109726075B/zh
Publication of CN109726075A publication Critical patent/CN109726075A/zh
Application granted granted Critical
Publication of CN109726075B publication Critical patent/CN109726075B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种异常数据指标分析的方法和装置,其中该方法包括:获取异常数据指标;根据异常数据指标的实际值、异常数据指标的预测值、异常数据指标在目标因素下的预测值和异常数据指标在目标因素下的实际值确定目标因素导致异常数据指标发生异常的几率;根据目标因素导致异常数据指标发生异常的几率确定目标因素是否是导致所述异常数据指标发生异常的因素。采用本发明实施例,通过分析目标因素导致异常数据指标发生异常的几率,可以快速有效确定导致异常数据指标发生异常的因素。

Description

一种异常数据指标分析的方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种异常数据指标分析的方法及装置。
背景技术
随着业务的不断增长和发展,业务的数据指标也在不断增多。系统运行维护过程中需要对各种数据指标进行监控。目前,现有的对各种系统运行维护过程中的数据指标监控的方式很多,例如:采用设置阈值的方式或者采用统计学原理的方式等对数据指标进行监控。通过对各种数据指标进行监控,检查这些数据指标是否异常。例如,在市场营销领域中,经常需要对市场渠道的数据进行分析,对于每个渠道来源首先依据采集的数据统计对应的数据指标,然后对所述数据指标进行监控,通过与阈值比较判定是否为异常指标。
然而,判断该数据指标为异常指标之后,却不知道这个数据指标为什么异常,不能确定导致该数据指标异常的因素。因此,如何确定导致数据指标异常的因素是目前需要解决的问题。
发明内容
本发明实施例提供一种异常数据指标分析的方法和装置,通过分析目标因素导致异常数据指标发生异常的几率,可以快速有效确定导致异常数据指标发生异常的因素。
本发明实施例第一方面提供了一种异常数据指标分析的方法,该方法包括:
获取异常数据指标;
根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在目标因素下的预测值和所述异常数据指标在所述目标因素下的实际值确定所述目标因素导致所述异常数据指标发生异常的几率;
根据所述目标因素导致所述异常数据指标发生异常的几率确定所述目标因素是否是导致所述异常数据指标发生异常的因素。
实施本发明实施例,通过分析目标因素导致异常数据指标发生异常的几率,可以快速有效确定导致异常数据指标发生异常的因素。
可选的,根据所述目标因素导致所述异常数据指标发生异常的几率确定所述目标因素是否是导致所述数据指标发生异常的因素之后,还包括:
根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在所述目标因素下的预测值和所述异常数据指标所述目标因素下的实际值确定所述目标因素的异常预测差异度,所述异常预测差异度用于衡量所述目标因素的第一参数和第二参数的差异度,所述第一参数为所述异常数据指标在所述目标因素下的预测值和所述异常数据指标的预测值的比值,所述第二参数为所述异常数据指标在所述目标因素下的实际值和所述异常数据指标的实际值的比值;
根据所述目标因素导致所述异常数据发生异常的几率以及所述目标因素的异常预测差异度确定所述目标因素是否为满足预设条件的因素,所述预设条件用于从M个因素中筛选N个因素,所述M个因素为导致所述数据指标发生异常的因素,所述M为大于等于2的正整数,所述N小于所述M。
可选的,异常数据指标由单个变量确定时,所述根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在目标因素下的预测值和所述异常数据指标在所述目标因素下的实际值确定所述目标因素导致所述数据指标发生异常的几率,包括:
根据公式一计算所述目标因素的导致所述异常数据指标发生异常的几率,所述公式一为:
Figure GDA0003569754630000021
其中,ai为所述单个变量的实际值,fi为所述单个变量的预测值,Ai为所述单个变量在所述目标因素下的实际值,Fi为所述单个变量在所述目标因素下的预测值。
可选的,异常数据指标由第一变量和第二变量确定时,所述根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在目标因素下的预测值和所述异常数据指标在目标因素下的实际值确定所述目标因素导致所述异常数据指标发生异常的几率,包括:
根据公式二计算所述目标因素导致所述异常数据指标发生异常的几率,所述公式二为:
Figure GDA0003569754630000022
其中,a1为所述第一变量的实际值,f1为所述第一变量的预测值,A1为所述第一变量在所述目标因素下的实际值,F1为所述第一变量在所述目标因素下的预测值。a2为所述第二变量的实际值,f2为所述第二变量的预测值,A2为所述第二变量标在所述目标因素下的实际值,F2为所述第二变量在目标因素下的预测值。
可选的,所述根据所述目标因素导致所述异常数据指标发生异常的几率确定所述目标因素是否是导致所述异常数据指标发生异常的因素,包括:
判断所述目标因素导致所述异常数据指标发生异常的几率是否大于或等于第一阈值;
若是,将所述目标因素确定为导致所述异常数据指标发生异常的因素。
可选的,异常数据指标由单个变量确定,所述根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在所述目标因素下的预测值和所述异常数据指标所述目标因素下的实际值确定所述目标因素的异常预测差异度,包括:
根据公式
Figure GDA0003569754630000031
确定所述目标因素的异常预测差异度,其中,
Figure GDA0003569754630000032
ai为所述单个变量的实际值,fi为所述单个变量的预测值,Ai为所述单个变量在目标因素下的实际值,Fi为所述单个变量在目标因素下的预测值;
可选的,所述异常数据指标由第一变量和第二变量确定,所述根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在所述目标因素下的预测值和所述异常数据指标所述目标因素下的实际值确定所述目标因素的异常预测差异度,包括:
根据公式
Figure GDA0003569754630000033
确定所述第一变量的异常预测差异度,其中,
Figure GDA0003569754630000034
a1为所述第一变量的实际值,f1为所述第一变量的预测值,A1为所述第一变量在目标因素下的实际值,F1为所述第一变量在目标因素下的预测值;
根据公式
Figure GDA0003569754630000035
确定所述第二变量的异常预测差异度,其中,
Figure GDA0003569754630000041
a2为所述第二变量的实际值,f2为所述第二变量的预测值,A2为所述第二变量在目标因素下的实际值,F2为所述第二变量在目标因素下的预测值;
根据所述第一变量的异常预测差异度和所述第二变量的异常预测差异度确定所述目标因素的异常预测差异度。
可选的,根据所述目标因素导致所述异常数据指标发生异常的几率以及所述目标因素的异常预测差异度确定所述目标因素是否为满足预设条件的因素之后,还包括:
若所述目标因素是满足所述预设条件的因素,则根据所述目标因素导致所述异常数据指标发生异常的几率和/或所述目标因素的异常预测差异度确定所述目标因素在所述M个因素中的排名。
可选的,所述根据所述目标因素导致所述异常数据指标发生异常的几率以及所述目标因素的异常预测差异度确定所述目标因素是否为满足预设条件的因素,包括:
根据所述M个因素各自导致所述异常数据指标发生异常的几率确定第二阈值;
根据所述M个因素各自的异常预测差异度确定第三阈值;
根据所述目标因素导致所述异常数据指标发生异常的几率是否大于等于所述第二阈值以及所述目标因素的异常预测差异度是否大于等于所述第三阈值判断所述目标因素是否为满足所述预设条件的因素;
若所述目标因素导致所述异常数据指标发生异常的几率大于等于所述第二阈值且所述目标因素的异常预测差异度大于等于所述第三阈值,则所述目标因素为满足所述预设条件的因素。
实施本发明实施例,通过分析目标因素导致异常数据指标发生异常的几率,确定该目标因素是否为导致异常数据指标发生异常的因素,通过多个因素的几率和异常预测差异度的值确定导致该异常数据指标异常的程度进行排名,可以快速有效找出导致异常数据指标异常的重要影响因素。
第二方面,本发明实施例提供了一种异常数据指标分析的装置,该装置包括:
获取单元,用于获取异常数据指标;
第一确定单元,用于根据异常数据指标的实际值、异常数据指标的预测值、异常数据指标在目标因素下的预测值和异常数据指标在目标因素下的实际值确定目标因素导致异常数据指标发生异常的几率;
第二确定单元,用于根据目标因素导致所述异常数据指标发生异常的几率确定目标因素是否是导致异常数据指标发生异常的因素。
可选的,异常数据指标由单个变量确定,第一确定单元具体用于根据公式一计算目标因素的导致异常数据指标发生异常的几率,公式一为:
Figure GDA0003569754630000051
其中,ai为单个变量的实际值,fi为单个变量的预测值,Ai为单个变量在目标因素下的实际值,Fi为单个变量在目标因素下的预测值。
可选的,异常数据指标由第一变量和第二变量确定,第一确定单元具体用于根据公式二计算目标因素导致异常数据指标发生异常的几率,公式二为:
Figure GDA0003569754630000052
其中,a1为第一变量的实际值,f1为第一变量的预测值,a1为第一变量在目标因素下的实际值,F1为第一变量在目标因素下的预测值。a2为第二变量的实际值,f2为第二变量的预测值,A2为第二变量标在目标因素下的实际值,F2为第二变量在目标因素下的预测值。
可选的,第二确定单元具体用于判断目标因素导致所述异常数据指标发生异常的几率是否大于或等于第一阈值;若是,将目标因素确定为导致异常数据指标发生异常的因素。
可选的,该装置还包括:
第三确定单元,用于根据异常数据指标的实际值、异常数据指标的预测值、异常数据指标在目标因素下的预测值和异常数据指标目标因素下的实际值确定目标因素的异常预测差异度,异常预测差异度用于衡量目标因素的第一参数和第二参数的差异度,第一参数为异常数据指标在目标因素下的预测值和异常数据指标的预测值的比值,第二参数为异常数据指标在目标因素下的实际值和异常数据指标的实际值的比值;
第四确定单元,用于根据目标因素导致所述异常数据指标发生异常的几率以及目标因素的异常预测差异度确定目标因素是否为满足预设条件的因素,预设条件用于从M个因素中筛选N个因素,M个因素为导致数据指标发生异常的因素,M为大于等于2的正整数,N小于M。
可选的,异常数据指标由单个变量确定,第三确定单元具体用于根据公式
Figure GDA0003569754630000061
确定目标因素的异常预测差异度,其中,
Figure GDA0003569754630000062
ai为单个变量的实际值,fi为单个变量的预测值,Ai为单个变量在目标因素下的实际值,Fi为单个变量在目标因素下的预测值。
可选的,异常数据指标由第一变量和第二变量确定,第三确定单元具体用于根据公式
Figure GDA0003569754630000063
确定第一变量的异常预测差异度,其中,
Figure GDA0003569754630000064
a1为第一变量的实际值,f1为第一变量的预测值,A1为第一变量在目标因素下的实际值,F1为第一变量在目标因素下的预测值;
根据公式
Figure GDA0003569754630000065
确定第二变量的异常预测差异度,其中,
Figure GDA0003569754630000066
a2为第二变量的实际值,f2为第二变量的预测值,A2为第二变量在目标因素下的实际值,F2为第二变量在目标因素下的预测值;
根据第一变量的异常预测差异度和第二变量的异常预测差异度确定目标因素的异常预测差异度。
可选的,第四确定单元具体用于根据M个因素各自导致异常数据指标发生异常的几率确定第二阈值;
根据M个因素各自的异常预测差异度确定第三阈值;
根据目标因素导致异常数据指标发生异常的几率是否大于等于第二阈值以及目标因素的异常预测差异度是否大于等于第三阈值判断目标因素是否为满足预设条件的因素;
若目标因素导致异常数据指标发生异常的几率大于等于第二阈值且目标因素的异常预测差异度大于等于第三阈值,则目标因素为满足预设条件的因素。
可选的,该装置还包括:
第五确定单元,用于根据目标因素导致异常数据指标发生异常的几率和/或目标因素的异常预测差异度确定目标因素在M个因素中的排名。
第三方面,本发明实施例提供了一种服务器,用于执行第一方面所提供的异常数据指标分析的方法。该终端包括:存储器、处理器和通信接口。其中,所述存储器用于存储支持终端设备执行上述方法的计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方面的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,可读存储介质上存储有指令,当其在处理器上运行时,使得处理器执行上述第一方面描述的异常数据指标分析的方法。
第五方面,本发明实施例提供了一种包含指令的计算机程序产品,当其在处理器上运行时,使得处理器执行上述第一方面描述的异常数据指标分析的方法。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种系统架构示意图;
图2是本发明实施例提供的一种服务器结构示意图;
图3是本发明实施例提供的一种异常数据指标分析方法的流程示意图;
图4是本发明实施例提供的一种异常数据指标分析方法的流程示意图;
图5是本发明实施例提供的一种异常数据指标分析装置的结构示意图。
具体实施方式
本发明实施例提供一种异常数据指标分析的方法和装置,通过分析目标因素导致异常数据指标发生异常的几率,可以快速有效确定导致异常数据指标发生异常的因素。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
本发明说明书、权利要求书和附图中出现的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,术语“第一”、“第二”和“第三”等是用于区别不同的对象,而并非用于描述特定的顺序。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
参见图1,图1是本发明实施例涉及的一种通信系统的架构示意图,该通信系统包括终端100和服务器200。其中终端与服务器通过互联网相互通信。本发明实施例中提及的终端101例如可为手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备或其他移动终端。在该通信系统中,用户通过终端100登录应用平台,用户登录应用平台通过相应操作产生数据指标。服务器200用于监测并统计数据指标。例如,服务器200监测该应用平台的日新增用户数量和日留存用户数量。服务器200还对异常数据指标进行分析,找出导致异常数据指标发生异常的因素,以确保平台的正常运行。其中,该平台可以是web网页或者应用APP。
参见图2,图2是本发明实施例提供的一种服务器的结构示意图。如图2所示,该服务器200可包括:存储器201、通信接口202、和一个或多个处理器203。这些部件可通过总线204或者其他方式连接,图1以通过总线连接为例。其中:
存储器201可以和处理器203通过总线204或者输入输出端口耦合,存储器201也可以与处理器203集成在一起。存储器201用于存储各种软件程序和/或多组指令。具体的,存储器201可包括高速随机存取的存储器,并且也可包括非易失性存储器,例如一个或多个磁盘存储设备、闪存设备或其他非易失性固态存储设备。存储器201还可以存储网络通信程序,该网络通信程序可用于与一个或多个附加设备,一个或多个终端,一个或多个网络设备进行通信。
处理器203可以是通用处理器,例如中央处理器(central processing unit,CPU),还可以是数字信号处理器(digital signal processing,DSP)、专用集成电路(application specific integrated circuit,ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路。处理器203可处理通过通信接口202接收到的数据。
通信接口202用于服务器200与其他网络设备进行通信,例如终端进行通信。通信接口202可以是收发器、收发电路等,其中,通信接口是统称,可以包括一个或多个接口,例如终端与服务器之间的接口。通信接口202可以包括有线接口和无线接口,例如标准接口、以太网、多机同步接口。
处理器203可用于读取和执行计算机可读指令。具体的,处理器203可用于调用存储于存储器201中的数据。可选地,当处理器203发送任何消息或数据时,其具体通过驱动或控制通信接口202做所述发送。可选地,当处理器203接收任何消息或数据时,其具体通过驱动或控制通信接口202做所述接收。因此,处理器203可以被视为是执行发送或接收的控制中心,通信接口202是发送和接收操作的具体执行者。
在本发明实施例中,通信接口202具体用于执行下述方法实施例中涉及的数据收发的步骤,处理器203具体用于实施除数据收发之外的数据处理的步骤。
结合图2所示的服务器,本发明实施例提供了一种异常数据指标分析的方法,参见图3,图3为本发明的一个实施例提供的一种异常数据指标分析的方法的流程示意图。其中,如图3所示,本发明的一个实施例提供的一种异常数据指标分析的方法可以包括:
S301,获取异常数据指标。
具体的,服务器通过接口获取异常数据指标,所述异常数据指标由单个量或者多个变量确定,所述异常数据指标包括:日新增用户数量、用户留存数量、用户留存率等。其中日新增用户数量为单个变量,用户留存率是用户留存数量和新增用户数量的比值,所以由用户留存数量和新增用户数量两个变量确定。
S302,根据异常数据指标的实际值、异常数据指标的预测值、异常数据指标在目标因素下的预测值和异常数据指标在目标因素下的实际值确述目标因素导致异常数据指标发生异常的几率。
可选的,当异常数据指标由单个变量确定时,根据公式一计算目标因素的导致所述异常数据指标发生异常的几率,公式一具体为:
Figure GDA0003569754630000101
其中,ai为单个变量的实际值,fi为单个变量的预测值,Ai为单个变量在所述目标因素下的实际值,Fi为单个变量在所述目标因素下的预测值。
例如,以某个游戏平台的异常数据指标为日新增用户来举例说明。若该日新增用户数量的实际值为100,预估值为300。影响该游戏平台的日新增用户数量的因素包括:华为手机、oppo手机,三星手机。其中,日新增用户数量在因素为华为手机下的实际值为50,预测值为200;新增用户数量在因素为oppo手机下的实际值为30,预测值为70;新增用户数量在因素为三星手机下的实际值为20,预测值为300。
利用公式
Figure GDA0003569754630000102
计算华为手机导致日新增用户数量发生异常的几率,数值代入公式为:
Figure GDA0003569754630000103
所以,华为手机导致新增用户数量发生异常的几率为0.75。同样的,将oppo手机和三星手机的数值代入该公式,计算得到oppo手机和三星手机导致日新增用户数量发生异常的几率分别为:0.2,0.05。
可选的,当异常数据指标由第一变量和第二变量确定时,根据公式二计算目标因素导致所述异常数据指标发生异常的几率,公式二具体为:
Figure GDA0003569754630000104
Figure GDA0003569754630000105
其中,a1为第一变量的实际值,f1为第一变量的预测值,A1为第一变量在所述目标因素下的实际值,F1为第一变量在所述目标因素下的预测值。a2为第二变量的实际值,f2为第二变量的预测值,A2为第二变量标在目标因素下的实际值,F2为第二变量在目标因素下的预测值。
例如,以某游戏平台的异常数据指标为留存率(留存用户数量/新增用户数量)来举例说明。其中,留存用户数量为第一变量,新增用户数量为第二变量。影响留存率的因素为华为手机,oppo手机和三星手机。
留存用户数量的实际值为100,预估值为400。其中,新增用户数量在因素为华为手机下的实际值为50,预测值为300;新增用户数量在因素为oppo手机下的实际值为30,预测值为60;新增用户数量在因素为三星手机下的实际值为20,预测值为40。
新增用户数量的实际值为300,预估值为700。其中,新增用户数量在因素为华为手机下的实际值为200,预测值为500;新增用户数量在因素为oppo手机下的实际值为50,预测值为150;新增用户数量在因素为三星手机下的实际值为50,预测值为50。
利用公式
Figure GDA0003569754630000111
计算华为手机导致留存率发生异常的几率,数值代入公式为
Figure GDA0003569754630000112
所以,华为手机导致留存率发生异常的几率为-0.194。同样的,将oppo手机和三星手机的数值代入该公式,计算得到oppo手机和三星手机导致留存率发生异常的几率分别为:0.045,-0.029。由于华为手机和三星手机导致留存率发生异常的几率的值都为负数,oppo手机几率的值为负数,因此去掉与总趋势相反的oppo手机的几率。因此,将华为手机和三星手机导致留存率发生异常的几率的值进行归一化,得到华为手机和三星手机导致留存率发生异常的几率的值分别为:0.87,0.13。
S303,根据目标因素导致所述异常数据指标发生异常的几率确定目标因素是否是导致所述异常数据指标发生异常的因素。
可选的,根据步骤S302计算得到的目标因素导致异常数据指标发生异常的几率,判断目标因素导致所述异常数据指标发生异常的几率是否大于或等于第一阈值。若目标因素导致所述异常数据指标发生异常的几率大于等于第一阈值,将目标因素确定为导致异常数据指标发生异常的因素。例如,所述第一阈值大于0小于1。
例如,以第一阈值为0.5为例来进行说明。若异常数据指标为日新增用户,华为手机、oppo手机和三星手机导致日新增用户数量发生异常的几率分别为:0.75,0.2,0.05,由于华为手机的几率大于等于第一阈值,所以将华为手机确定为导致日新增用户发生异常的因素。
以上是以某一数据指标为例来说明如何找到导致该数据指标发生异常的因素的,在具体应用中,针对各个数据指标,均可以采用上述方案进行异常数据指标的分析过程,以找出导致各个数据指标发生异常的因素。
通过实施本发明实施例,通过分析目标因素导致异常数据指标发生异常的几率,可以快速有效确定导致异常数据指标发生异常的因素。
参见图4,图4为本发明的一个实施例提供的一种异常数据指标分析的方法的流程示意图。终端在执行步骤S303之后,还包括如下步骤S304-S306。以下对步骤S304-S306进行详细介绍:
S304,根据异常数据指标的实际值、异常数据指标的预测值、异常数据指标在目标因素下的预测值和异常数据指标目标因素下的实际值确定目标因素的异常预测差异度。
可选的,若异常数据指标由单个变量确定,根据公式
Figure GDA0003569754630000121
Figure GDA0003569754630000122
确定所述目标因素的异常预测差异度,其中,
Figure GDA0003569754630000123
ai为单个变量的实际值,fi为单个变量的预测值,Ai为单个变量在目标因素下的实际值,Fi为单个变量在目标因素下的预测值。
以异常数据指标为日新增用户来举例进行说明。若该日新增用户数量的实际值为100,预估值为300。影响该游戏平台的日新增用户数量的因素包括:华为手机、oppo手机,三星手机。其中,日新增用户数量在因素为华为手机下的实际值为50,预测值为200;新增用户数量在因素为oppo手机下的实际值为30,预测值为70;新增用户数量在因素为三星手机下的实际值为20,预测值为300。
利用公式
Figure GDA0003569754630000124
分别计算华为手机、oppo手机和三星手机的异常预测差异度分别为0.61,0.28,0.16。
可选的,若异常数据指标由第一变量和第二变量确定,根据公式
Figure GDA0003569754630000125
确定第一变量的异常预测差异度,其中,
Figure GDA0003569754630000126
a1为第一变量的实际值,f1为第一变量的预测值,A1为第一变量在目标因素下的实际值,F1为第一变量在目标因素下的预测值。
根据公式
Figure GDA0003569754630000127
确定第二变量的异常预测差异度,其中,
Figure GDA0003569754630000128
a2为第二变量的实际值,f2为第二变量的预测值,A2为第二变量在目标因素下的实际值,F2为第二变量在目标因素下的预测值。
根据第一变量的异常预测差异度和第二变量的异常预测差异度确定目标因素的异常预测差异度。
以异常数据指标为留存率(留存用户数量/新增用户数量)来进行说明。其中,留存用户数量为第一变量,新增用户数量为第二变量。影响留存率的因素为华为手机,oppo手机和三星手机。
留存用户数量的实际值为100,预估值为400。其中,新增用户数量在因素为华为手机下的实际值为50,预测值为300;新增用户数量在因素为oppo手机下的实际值为30,预测值为60;新增用户数量在因素为三星手机下的实际值为20,预测值为40。
新增用户数量的实际值为300,预估值为700。其中,新增用户数量在因素为华为手机下的实际值为200,预测值为500;新增用户数量在因素为oppo手机下的实际值为50,预测值为150;新增用户数量在因素为三星手机下的实际值为50,预测值为50。
利用公式
Figure GDA0003569754630000131
计算留存用户数量下华为手机、oppo手机和三星手机的异常预测差异度分别为:0.65,0.23,0.16.
利用公式
Figure GDA0003569754630000132
计算新增用户数量下华为手机、oppo手机和三星手机的异常预测差异度分别为:0.72,0.20,0.12。
将留存用户数量下华为手机、oppo手机和三星手机的异常预测差异度和新增用户数量下华为手机、oppo手机和三星手机的异常预测差异度对应相加,得到留存率下华为手机、oppo手机和三星手机的异常预测差异度分别为:1.37,0.43,0.28。
S305,根据目标因素导致所述异常数据指标发生异常的几率以及目标因素的异常预测差异度确定目标因素是否为满足预设条件的因素。
可选的,所述预设条件用于从M个因素中筛选N个因素,M个因素为导致数据指标发生异常的因素,M为大于等于2的正整数,N小于M。筛选的N个因素是导致异常数据指标发生异常的几率和/或异常预测差异度值在M个因素中较大的因素。
可选的,根据M个因素各自导致所述异常数据指标发生异常的几率确定第二阈值。
例如,导致日新增用户数量发生异常的因素有华为手机、三星手机和苹果手机,华为手机、三星手机和苹果手机导致日新增用户发生异常的几率分别为:0.32,0.34,0.31。第二阈值可以是三者的平均值0.32,也可以是三者的中值0.32。
根据M个因素各自的异常预测差异度确定第三阈值。
例如,导致日新增用户数量发生异常的因素有华为手机、三星手机和苹果手机,华为手机、三星手机和苹果手机的异常预测差异度分别为0.58,0.30,0.17。第三阈值可以是三者的平均值0.35,也可以是三者的中值0.30。
根据目标因素导致异常数据指标发生异常的几率是否大于等于第二阈值以及目标因素的异常预测差异度是否大于等于第三阈值判断目标因素是否为满足预设条件的因素;若目标因素导致异常数据指标发生异常的几率大于等于第二阈值且目标因素的异常预测差异度大于等于所述第三阈值,则目标因素为满足预设条件的因素。
以第二阈值取平均值并且第三阈值取中值为例来进行说明,第二阈值为0.32,第三阈值为0.35,由于华为手机和三星手机导致该数据指标发生异常的几率大于等于第二阈值0.32,并且两者的异常预测差异度大于等于第三阈值0.35。所以将华为手机和三星手机确定为满足预设条件的因素。
S306,将满足预设条件的因素根据各自导致异常数据指标发生异常的几率和/或各自的异常预测差异度确定所述目标因素在所述M个因素中的排名。
在第一种实现方式中,将满足预设条件的因素按照各自导致异常数据指标发生异常的几率从高到低的顺序进行排序。若存在A个导致异常数据指标发生异常的几率相同的因素,将这A个因素按照各自的异常预测差异度从高到低的顺序进行排序。
在第二种实现方式中,将满足预设条件的因素按照各自的异常预测差异度从高到低的顺序进行排序。若存在B个异常预测差异度相同的因素,将这B个因素按照各自导致异常数据指标发生异常的几率从高到低的顺序进行排序。
例如,满足预设条件的因素华为手机、三星手机和苹果手机导致异常数据指标发生异常的几率分别为:0.33,0.28,0.32;异常预测差异度分别为:0.24,0.24,0.61。在第一种实现方式中,三者的排名顺序为:华为手机、苹果手机、三星手机;在第二种实现方式中,三者的排名顺序为:苹果手机,华为手机、三星手机。
实施本发明实施例,通过分析目标因素导致异常数据指标发生异常的几率,确定该目标因素是否为导致异常数据指标发生异常的因素,通过多个因素的几率和异常预测差异度的值确定导致该异常数据指标异常的程度进行排名,可以快速有效找出导致异常数据指标异常的重要影响因素。
参见图5,图5为本发明实施例提供的异常数据指标分析的装置的结构示意图,如图5所示该异常数据指标分析的装置500包括:获取单元501,第一确定单元502,第二确定单元503。
其中,获取单元501用于获取异常数据指标;第一确定单元501,用于根据异常数据指标的实际值、异常数据指标的预测值、异常数据指标在目标因素下的预测值和异常数据指标在目标因素下的实际值确定目标因素导致异常数据指标指标发生异常的几率;第二确定单元502,用于根据目标因素导致所述异常数据指标发生异常的几率确定目标因素是否是导致异常数据指标发生异常的因素。
可选的,异常数据指标由单个变量确定,第一确定单元502具体用于根据公式一计算目标因素的导致异常数据指标发生异常的几率,公式一为:
Figure GDA0003569754630000151
其中,ai为单个变量的实际值,fi为单个变量的预测值,Ai为单个变量在目标因素下的实际值,Fi为单个变量在目标因素下的预测值。
可选的,异常数据指标由第一变量和第二变量确定,第一确定单元502具体用于根据公式二计算目标因素导致异常数据指标发生异常的几率,公式二为:
Figure GDA0003569754630000152
其中,a1为第一变量的实际值,f1为第一变量的预测值,a1为第一变量在目标因素下的实际值,F1为第一变量在目标因素下的预测值。a2为第二变量的实际值,f2为第二变量的预测值,A2为第二变量标在目标因素下的实际值,F2为第二变量在目标因素下的预测值。
可选的,第二确定503单元具体用于判断目标因素导致所述异常数据指标发生异常的几率是否大于或等于第一阈值;若是,将目标因素确定为导致异常数据指标发生异常的因素。
可选的,该装置500还包括:
第三确定单元,用于根据异常数据指标的实际值、异常数据指标的预测值、异常数据指标在目标因素下的预测值和异常数据指标目标因素下的实际值确定目标因素的异常预测差异度,异常预测差异度用于衡量目标因素的第一参数和第二参数的差异度,第一参数为异常数据指标在目标因素下的预测值和异常数据指标的预测值的比值,第二参数为异常数据指标在目标因素下的实际值和异常数据指标的实际值的比值;
第四确定单元,用于根据目标因素导致所述异常数据发生异常的几率以及目标因素的异常预测差异度确定目标因素是否为满足预设条件的因素,预设条件用于从M个因素中筛选N个因素,M个因素为导致数据指标发生异常的因素,M为大于等于2的正整数,N小于M。
可选的,异常数据指标由单个变量确定,第三确定单元具体用于根据公式
Figure GDA0003569754630000161
确定目标因素的异常预测差异度,其中,
Figure GDA0003569754630000162
ai为单个变量的实际值,fi为单个变量的预测值,Ai为单个变量在目标因素下的实际值,Fi为单个变量在目标因素下的预测值。
可选的,异常数据指标由第一变量和第二变量确定,第三确定单元具体用于根据公式
Figure GDA0003569754630000163
确定第一变量的异常预测差异度,其中,
Figure GDA0003569754630000164
a1为第一变量的实际值,f1为第一变量的预测值,A1为第一变量在目标因素下的实际值,F1为第一变量在目标因素下的预测值;
根据公式
Figure GDA0003569754630000165
确定第二变量的异常预测差异度,其中,
Figure GDA0003569754630000166
a2为第二变量的实际值,f2为第二变量的预测值,A2为第二变量在目标因素下的实际值,F2为第二变量在目标因素下的预测值。
根据第一变量的异常预测差异度和第二变量的异常预测差异度确定目标因素的异常预测差异度。
可选的,第四确定单元具体用于根据M个因素各自导致异常数据指标发生异常的几率确定第二阈值;
根据M个因素各自的异常预测差异度确定第三阈值;
根据目标因素导致异常数据指标发生异常的几率是否大于等于第二阈值以及目标因素的异常预测差异度是否大于等于第三阈值判断目标因素是否为满足预设条件的因素;
若目标因素导致异常数据指标发生异常的几率大于等于第二阈值且目标因素的异常预测差异度大于等于第三阈值,则目标因素为满足预设条件的因素。
可选的,该装置500还包括:
第五确定单元,用于根据目标因素导致异常数据指标发生异常的几率和/或目标因素的异常预测差异度确定目标因素在M个因素中的排名。
在本申请的另一实施例中提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如数字多功能光盘(digital versatile disc,DVD)、半导体介质(例如固态硬盘solid state disk,SSD)等。
以上所述的具体实施方式,对本发明实施例的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明实施例的具体实施方式而已,并不用于限定本发明实施例的保护范围,凡在本发明实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明实施例的保护范围之内。

Claims (8)

1.一种异常数据指标分析的方法,其特征在于,包括:
获取异常数据指标;
根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在目标因素下的预测值和所述异常数据指标在所述目标因素下的实际值确定所述目标因素导致所述异常数据指标发生异常的几率;
根据所述目标因素导致所述异常数据指标发生异常的几率确定所述目标因素是否是导致所述异常数据指标发生异常的因素;
根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在所述目标因素下的预测值和所述异常数据指标所述目标因素下的实际值确定所述目标因素的异常预测差异度,包括:当所述异常数据指标由单个变量确定时,根据公式
Figure FDA0003795627540000011
确定所述目标因素的异常预测差异度,其中,
Figure FDA0003795627540000012
ai为所述单个变量的实际值,fi为所述单个变量的预测值,Ai为所述单个变量在目标因素下的实际值,Fi为所述单个变量在目标因素下的预测值,所述异常预测差异度用于衡量所述目标因素的第一参数和第二参数的差异度,所述第一参数为所述异常数据指标在所述目标因素下的预测值和所述异常数据指标的预测值的比值,所述第二参数为所述异常数据指标在所述目标因素下的实际值和所述异常数据指标的实际值的比值;
根据所述目标因素导致所述异常数据指标发生异常的几率以及所述目标因素的异常预测差异度确定所述目标因素是否为满足预设条件的因素,所述预设条件用于从M个因素中筛选N个因素,所述M个因素为导致所述数据指标发生异常的因素,所述M为大于等于2的正整数,所述N小于所述M。
2.根据权利要求1所述的方法,其特征在于,所述异常数据指标由单个变量确定,所述根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在目标因素下的预测值和所述异常数据指标在所述目标因素下的实际值确定所述目标因素导致所述数据指标发生异常的几率,包括:
根据公式一计算所述目标因素的导致所述异常数据指标发生异常的几率,所述公式一为:
Figure FDA0003795627540000013
其中,ai为所述单个变量的实际值,fi为所述单个变量的预测值,Ai为所述单个变量在所述目标因素下的实际值,Fi为所述单个变量在所述目标因素下的预测值。
3.根据权利要求1所述的方法,其特征在于,所述异常数据指标由第一变量和第二变量确定,所述根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在目标因素下的预测值和所述异常数据指标在目标因素下的实际值确定所述目标因素导致所述异常数据指标发生异常的几率,包括:
根据公式二计算所述目标因素导致所述异常数据指标发生异常的几率,所述公式二为:
Figure FDA0003795627540000021
其中,a1为所述第一变量的实际值,f1为所述第一变量的预测值,A1为所述第一变量在所述目标因素下的实际值,F1为所述第一变量在所述目标因素下的预测值,a2为所述第二变量的实际值,f2为所述第二变量的预测值,A2为所述第二变量标在所述目标因素下的实际值,F2为所述第二变量在所述目标因素下的预测值。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述目标因素导致所述异常数据指标发生异常的几率确定所述目标因素是否是导致所述异常数据指标发生异常的因素,包括:
判断所述目标因素导致所述异常数据发生异常的几率是否大于或等于第一阈值;
若是,将所述目标因素确定为导致所述异常数据指标发生异常的因素。
5.根据权利要求1所述的方法,其特征在于,所述异常数据指标由第一变量和第二变量确定,所述根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在所述目标因素下的预测值和所述异常数据指标所述目标因素下的实际值确定所述目标因素的异常预测差异度,包括:
根据公式
Figure FDA0003795627540000022
确定所述第一变量的异常预测差异度,其中,
Figure FDA0003795627540000023
a1为所述第一变量的实际值,f1为所述第一变量的预测值,A1为所述第一变量在目标因素下的实际值,F1为所述第一变量在目标因素下的预测值;
根据公式
Figure FDA0003795627540000024
确定所述第二变量的异常预测差异度,其中,
Figure FDA0003795627540000025
a2为所述第二变量的实际值,f2为所述第二变量的预测值,A2为所述第二变量在目标因素下的实际值,F2为所述第二变量在目标因素下的预测值;
根据所述第一变量的异常预测差异度和所述第二变量的异常预测差异度确定所述目标因素的异常预测差异度。
6.一种异常数据指标分析的装置,其特征在于,包括:
获取单元,用于获取异常数据指标;
第一确定单元,用于根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在目标因素下的预测值和所述异常数据指标在所述目标因素下的实际值确定所述目标因素导致所述异常数据指标发生异常的几率;
第二确定单元,用于根据所述目标因素导致所述异常数据指标发生异常的几率确定所述目标因素是否是导致所述异常数据指标发生异常的因素;
第三确定单元,用于根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在所述目标因素下的预测值和所述异常数据指标所述目标因素下的实际值确定所述目标因素的异常预测差异度,包括:当所述异常数据指标由单个变量确定时,根据公式
Figure FDA0003795627540000031
确定所述目标因素的异常预测差异度,其中,
Figure FDA0003795627540000032
ai为所述单个变量的实际值,fi为所述单个变量的预测值,Ai为所述单个变量在目标因素下的实际值,Fi为所述单个变量在目标因素下的预测值,所述异常预测差异度用于衡量所述目标因素的第一参数和第二参数的差异度,所述第一参数为所述异常数据指标在所述目标因素下的预测值和所述异常数据指标的预测值的比值,所述第二参数为所述异常数据指标在所述目标因素下的实际值和所述异常数据指标的实际值的比值;
第四确定单元,根据所述目标因素导致所述异常数据指标发生异常的几率以及所述目标因素的异常预测差异度确定所述目标因素是否为满足预设条件的因素,所述预设条件用于从M个因素中筛选N个因素,所述M个因素为导致所述数据指标发生异常的因素,所述M为大于等于2的正整数,所述N小于所述M。
7.一种服务器,其特征在于,包括处理器、通信接口和存储器,所述处理器、所述通信接口和所述存储器相互连接,其中,所述通信接口用于与其它网络设备进行通信,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-5任一项所述的异常数据指标分析的方法。
8.一种计算机可读存储介质,其特征在于,所述可读存储介质上存储有指令,当所述可读存储介质在处理器上运行时,使得所述处理器执行如权利要求1-5任一项所述的异常数据指标分析的方法。
CN201811452306.5A 2018-11-30 2018-11-30 一种异常数据指标分析的方法及装置 Active CN109726075B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811452306.5A CN109726075B (zh) 2018-11-30 2018-11-30 一种异常数据指标分析的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811452306.5A CN109726075B (zh) 2018-11-30 2018-11-30 一种异常数据指标分析的方法及装置

Publications (2)

Publication Number Publication Date
CN109726075A CN109726075A (zh) 2019-05-07
CN109726075B true CN109726075B (zh) 2022-10-14

Family

ID=66295153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811452306.5A Active CN109726075B (zh) 2018-11-30 2018-11-30 一种异常数据指标分析的方法及装置

Country Status (1)

Country Link
CN (1) CN109726075B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596229A (zh) * 2018-04-13 2018-09-28 北京华电智慧科技产业有限公司 在线异常的监测诊断方法和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9218570B2 (en) * 2013-05-29 2015-12-22 International Business Machines Corporation Determining an anomalous state of a system at a future point in time
CN106126391A (zh) * 2016-06-28 2016-11-16 北京百度网讯科技有限公司 系统监控方法和装置
CN107086944B (zh) * 2017-06-22 2020-04-21 北京奇艺世纪科技有限公司 一种异常检测方法和装置
CN107330614A (zh) * 2017-06-29 2017-11-07 北京京东尚科信息技术有限公司 一种业务活动效果的实时评估方法和装置
CN108829638B (zh) * 2018-06-01 2022-12-16 创新先进技术有限公司 一种业务数据波动处理方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596229A (zh) * 2018-04-13 2018-09-28 北京华电智慧科技产业有限公司 在线异常的监测诊断方法和系统

Also Published As

Publication number Publication date
CN109726075A (zh) 2019-05-07

Similar Documents

Publication Publication Date Title
CN111178760B (zh) 风险监测方法、装置、终端设备及计算机可读存储介质
CN108255673B (zh) 应用程序占用资源的检测方法、装置和存储介质
US20170064076A1 (en) Nuisance call detection device and method
US20200410376A1 (en) Prediction method, training method, apparatus, and computer storage medium
CN108334530B (zh) 用户行为信息分析方法、设备及存储介质
CN109309735B (zh) 连接处理方法、服务器、系统及存储介质
CN108390856B (zh) 一种DDoS攻击检测方法、装置及电子设备
WO2023125272A1 (zh) Radius环境下的全链路压测方法、装置、计算机设备及存储介质
EP4167149A1 (en) Method and apparatus for building predictive model, computing device, and storage medium
EP3883190B1 (en) Detection device, detection method, and detection program
US10498806B2 (en) Computer-executable server load monitoring method, apparatus performing the same and storage medium storing the same
CN109726075B (zh) 一种异常数据指标分析的方法及装置
CN111159009B (zh) 一种日志服务系统的压力测试方法及装置
CN114175748B (zh) 通信频率调节方法、装置、电子设备及存储介质
CN111315026B (zh) 信道的选择方法、装置、网关及计算机可读存储介质
US10180894B2 (en) Identifying a stack frame responsible for resource usage
CN111431764B (zh) 节点确定方法、设备、系统及介质
CN110213120B (zh) 一种消息中间件的压测方法、装置及终端设备
CN111177625A (zh) 数据获取方法、数据上报方法、终端设备及存储介质
CN112988523A (zh) 一种多维度的游戏系统告警方法和系统
CN115441919B (zh) 一种基于通信抗干扰的方法及相关装置
JP7176295B2 (ja) 判定装置、ゲートウェイ、判定方法及び判定プログラム
CN117056663B (zh) 一种数据处理方法、装置、电子设备及存储介质
CN115470859A (zh) 数据处理方法、装置、电子设备及存储介质
CN116962226A (zh) 一种状态监控方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant