CN109726075A - 一种异常数据指标分析的方法及装置 - Google Patents

一种异常数据指标分析的方法及装置 Download PDF

Info

Publication number
CN109726075A
CN109726075A CN201811452306.5A CN201811452306A CN109726075A CN 109726075 A CN109726075 A CN 109726075A CN 201811452306 A CN201811452306 A CN 201811452306A CN 109726075 A CN109726075 A CN 109726075A
Authority
CN
China
Prior art keywords
factor
abnormal data
data index
abnormal
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811452306.5A
Other languages
English (en)
Other versions
CN109726075B (zh
Inventor
马志伟
苏杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN CHUANGMENG TIANDI TECHNOLOGY CO LTD
Original Assignee
SHENZHEN CHUANGMENG TIANDI TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN CHUANGMENG TIANDI TECHNOLOGY CO LTD filed Critical SHENZHEN CHUANGMENG TIANDI TECHNOLOGY CO LTD
Priority to CN201811452306.5A priority Critical patent/CN109726075B/zh
Publication of CN109726075A publication Critical patent/CN109726075A/zh
Application granted granted Critical
Publication of CN109726075B publication Critical patent/CN109726075B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种异常数据指标分析的方法和装置,其中该方法包括:获取异常数据指标;根据异常数据指标的实际值、异常数据指标的预测值、异常数据指标在目标因素下的预测值和异常数据指标在目标因素下的实际值确定目标因素导致异常数据指标发生异常的几率;根据目标因素导致异常数据指标发生异常的几率确定目标因素是否是导致所述异常数据指标发生异常的因素。采用本发明实施例,通过分析目标因素导致异常数据指标发生异常的几率,可以快速有效确定导致异常数据指标发生异常的因素。

Description

一种异常数据指标分析的方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种异常数据指标分析的方法及装 置。
背景技术
随着业务的不断增长和发展,业务的数据指标也在不断增多。系统运行维 护过程中需要对各种数据指标进行监控。目前,现有的对各种系统运行维护过 程中的数据指标监控的方式很多,例如:采用设置阈值的方式或者采用统计学 原理的方式等对数据指标进行监控。通过对各种数据指标进行监控,检查这些 数据指标是否异常。例如,在市场营销领域中,经常需要对市场渠道的数据进 行分析,对于每个渠道来源首先依据采集的数据统计对应的数据指标,然后对 所述数据指标进行监控,通过与阈值比较判定是否为异常指标。
然而,判断该数据指标为异常指标之后,却不知道这个数据指标为什么异 常,不能确定导致该数据指标异常的因素。因此,如何确定导致数据指标异常 的因素是目前需要解决的问题。
发明内容
本发明实施例提供一种异常数据指标分析的方法和装置,通过分析目标因 素导致异常数据指标发生异常的几率,可以快速有效确定导致异常数据指标发 生异常的因素。
本发明实施例第一方面提供了一种异常数据指标分析的方法,该方法包括:
获取异常数据指标;
根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常 数据指标在目标因素下的预测值和所述异常数据指标在所述目标因素下的实际 值确定所述目标因素导致所述异常数据指标发生异常的几率;
根据所述目标因素导致所述异常数据指标发生异常的几率确定所述目标因 素是否是导致所述异常数据指标发生异常的因素。
实施本发明实施例,通过分析目标因素导致异常数据指标发生异常的几率, 可以快速有效确定导致异常数据指标发生异常的因素。
可选的,根据所述目标因素导致所述异常数据指标发生异常的几率确定所 述目标因素是否是导致所述数据指标发生异常的因素之后,还包括:
根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常 数据指标在所述目标因素下的预测值和所述异常数据指标所述目标因素下的实 际值确定所述目标因素的异常预测差异度,所述异常预测差异度用于衡量所述 目标因素的第一参数和第二参数的差异度,所述第一参数为所述异常数据指标 在所述目标因素下的预测值和所述异常数据指标的预测值的比值,所述第二参 数为所述异常数据指标在所述目标因素下的实际值和所述异常数据指标的实际 值的比值;
根据所述目标因素导致所述异常数据发生异常的几率以及所述目标因素的 异常预测差异度确定所述目标因素是否为满足预设条件的因素,所述预设条件 用于从M个因素中筛选N个因素,所述M个因素为导致所述数据指标发生异 常的因素,所述M为大于等于2的正整数,所述N小于所述M。
可选的,异常数据指标由单个变量确定时,所述根据所述异常数据指标的 实际值、所述异常数据指标的预测值、所述异常数据指标在目标因素下的预测 值和所述异常数据指标在所述目标因素下的实际值确定所述目标因素导致所述 数据指标发生异常的几率,包括:
根据公式一计算所述目标因素的导致所述异常数据指标发生异常的几率, 所述公式一为:其中,ai为所述单个变量的实际值,fi为所述单个变 量的预测值,Ai为所述单个变量在所述目标因素下的实际值,Fi为所述单个变量 在所述目标因素下的预测值。
可选的,异常数据指标由第一变量和第二变量确定时,所述根据所述异常 数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在目标因 素下的预测值和所述异常数据指标在目标因素下的实际值确定所述目标因素导 致所述异常数据指标发生异常的几率,包括:
根据公式二计算所述目标因素导致所述异常数据指标发生异常的几率,所 述公式二为:其中,a1为所述第一变量的实际值,f1为 所述第一变量的预测值,A1为所述第一变量在所述目标因素下的实际值,F1为 所述第一变量在所述目标因素下的预测值。a2为所述第二变量的实际值,f2为所 述第二变量的预测值,A2为所述第二变量标在所述目标因素下的实际值,F2为 所述第二变量在目标因素下的预测值。
可选的,所述根据所述目标因素导致所述异常数据指标发生异常的几率确 定所述目标因素是否是导致所述异常数据指标发生异常的因素,包括:
判断所述目标因素导致所述异常数据指标发生异常的几率是否大于或等于 第一阈值;
若是,将所述目标因素确定为导致所述异常数据指标发生异常的因素。
可选的,异常数据指标由单个变量确定,所述根据所述异常数据指标的实 际值、所述异常数据指标的预测值、所述异常数据指标在所述目标因素下的预 测值和所述异常数据指标所述目标因素下的实际值确定所述目标因素的异常预 测差异度,包括:
根据公式确定所述目标因素的异常预 测差异度,其中,ai为所述单个变量的实际值,fi为所述单个 变量的预测值,Ai为所述单个变量在目标因素下的实际值,Fi为所述单个变量在 目标因素下的预测值;
可选的,所述异常数据指标由第一变量和第二变量确定,所述根据所述异 常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在所述 目标因素下的预测值和所述异常数据指标所述目标因素下的实际值确定所述目 标因素的异常预测差异度,包括:
根据公式确定所述第一变量的异常 预测差异度,其中,a1为所述第一变量的实际值,f1为所述第 一变量的预测值,A1为所述第一变量在目标因素下的实际值,F1为所述第一变 量在目标因素下的预测值;
根据公式确定所述第二变量的异常 预测差异度,其中,a2为所述第二变量的实际值,f2为所述第 二变量的预测值,A2为所述第二变量在目标因素下的实际值,F2为所述第二变 量在目标因素下的预测值;
根据所述第一变量的异常预测差异度和所述第二变量的异常预测差异度确 定所述目标因素的异常预测差异度。
可选的,根据所述目标因素导致所述异常数据指标发生异常的几率以及所 述目标因素的异常预测差异度确定所述目标因素是否为满足预设条件的因素之 后,还包括:
若所述目标因素是满足所述预设条件的因素,则根据所述目标因素导致所 述异常数据指标发生异常的几率和/或所述目标因素的异常预测差异度确定所述 目标因素在所述M个因素中的排名。
可选的,所述根据所述目标因素导致所述异常数据指标发生异常的几率以 及所述目标因素的异常预测差异度确定所述目标因素是否为满足预设条件的因 素,包括:
根据所述M个因素各自导致所述异常数据指标发生异常的几率确定第二阈 值;
根据所述M个因素各自的异常预测差异度确定第三阈值;
根据所述目标因素导致所述异常数据指标发生异常的几率是否大于等于所 述第二阈值以及所述目标因素的异常预测差异度是否大于等于所述第三阈值判 断所述目标因素是否为满足所述预设条件的因素;
若所述目标因素导致所述异常数据指标发生异常的几率大于等于所述第二 阈值且所述目标因素的异常预测差异度大于等于所述第三阈值,则所述目标因 素为满足所述预设条件的因素。
实施本发明实施例,通过分析目标因素导致异常数据指标发生异常的几率, 确定该目标因素是否为导致异常数据指标发生异常的因素,通过多个因素的几 率和异常预测差异度的值确定导致该异常数据指标异常的程度进行排名,可以 快速有效找出导致异常数据指标异常的重要影响因素。
第二方面,本发明实施例提供了一种异常数据指标分析的装置,该装置包 括:
获取单元,用于获取异常数据指标;
第一确定单元,用于根据异常数据指标的实际值、异常数据指标的预测值、 异常数据指标在目标因素下的预测值和异常数据指标在目标因素下的实际值确 定目标因素导致异常数据指标发生异常的几率;
第二确定单元,用于根据目标因素导致所述异常数据指标发生异常的几率 确定目标因素是否是导致异常数据指标发生异常的因素。
可选的,异常数据指标由单个变量确定,第一确定单元具体用于根据公式 一计算目标因素的导致异常数据指标发生异常的几率,公式一为:其中,ai为单个变量的实际值,fi为单个变量的预测值,Ai为单个变量在目标因 素下的实际值,Fi为单个变量在目标因素下的预测值。
可选的,异常数据指标由第一变量和第二变量确定,第一确定单元具体用 于根据公式二计算目标因素导致异常数据指标发生异常的几率,公式二为:其中,a1为第一变量的实际值,f1为第一变量的预测 值,A1为第一变量在目标因素下的实际值,F1为第一变量在目标因素下的预测 值。a2为第二变量的实际值,f2为第二变量的预测值,A2为第二变量标在目标 因素下的实际值,F2为第二变量在目标因素下的预测值。
可选的,第二确定单元具体用于判断目标因素导致所述异常数据指标发生 异常的几率是否大于或等于第一阈值;若是,将目标因素确定为导致异常数据 指标发生异常的因素。
可选的,该装置还包括:
第三确定单元,用于根据异常数据指标的实际值、异常数据指标的预测值、 异常数据指标在目标因素下的预测值和异常数据指标目标因素下的实际值确定 目标因素的异常预测差异度,异常预测差异度用于衡量目标因素的第一参数和 第二参数的差异度,第一参数为异常数据指标在目标因素下的预测值和异常数 据指标的预测值的比值,第二参数为异常数据指标在目标因素下的实际值和异 常数据指标的实际值的比值;
第四确定单元,用于根据目标因素导致所述异常数据指标发生异常的几率 以及目标因素的异常预测差异度确定目标因素是否为满足预设条件的因素,预 设条件用于从M个因素中筛选N个因素,M个因素为导致数据指标发生异常的 因素,M为大于等于2的正整数,N小于M。
可选的,异常数据指标由单个变量确定,第三确定单元具体用于根据公式确定目标因素的异常预测差异度,其中,ai为单个变量的实际值,fi为单个变量的预测值,Ai为单个变 量在目标因素下的实际值,Fi为单个变量在目标因素下的预测值。
可选的,异常数据指标由第一变量和第二变量确定,第三确定单元具体用 于根据公式确定第一变量的异常预测差 异度,其中,a1为第一变量的实际值,f1为第一变量的预测值, A1为第一变量在目标因素下的实际值,F1为第一变量在目标因素下的预测值;
根据公式确定第二变量的异常预测 差异度,其中,a2为第二变量的实际值,f2为第二变量的预测 值,A2为第二变量在目标因素下的实际值,F2为第二变量在目标因素下的预测 值;
根据第一变量的异常预测差异度和第二变量的异常预测差异度确定目标因 素的异常预测差异度。
可选的,第四确定单元具体用于根据M个因素各自导致异常数据指标发生 异常的几率确定第二阈值;
根据M个因素各自的异常预测差异度确定第三阈值;
根据目标因素导致异常数据指标发生异常的几率是否大于等于第二阈值以 及目标因素的异常预测差异度是否大于等于第三阈值判断目标因素是否为满足 预设条件的因素;
若目标因素导致异常数据指标发生异常的几率大于等于第二阈值且目标因 素的异常预测差异度大于等于第三阈值,则目标因素为满足预设条件的因素。
可选的,该装置还包括:
第五确定单元,用于根据目标因素导致异常数据指标发生异常的几率和/或 目标因素的异常预测差异度确定目标因素在M个因素中的排名。
第三方面,本发明实施例提供了一种服务器,用于执行第一方面所提供的 异常数据指标分析的方法。该终端包括:存储器、处理器和通信接口。其中, 所述存储器用于存储支持终端设备执行上述方法的计算机程序,所述计算机程 序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方 面的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,可读存储介质上 存储有指令,当其在处理器上运行时,使得处理器执行上述第一方面描述的异 常数据指标分析的方法。
第五方面,本发明实施例提供了一种包含指令的计算机程序产品,当其在 处理器上运行时,使得处理器执行上述第一方面描述的异常数据指标分析的方 法。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需 要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些 实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可 以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种系统架构示意图;
图2是本发明实施例提供的一种服务器结构示意图;
图3是本发明实施例提供的一种异常数据指标分析方法的流程示意图;
图4是本发明实施例提供的一种异常数据指标分析方法的流程示意图;
图5是本发明实施例提供的一种异常数据指标分析装置的结构示意图。
具体实施方式
本发明实施例提供一种异常数据指标分析的方法和装置,通过分析目标因 素导致异常数据指标发生异常的几率,可以快速有效确定导致异常数据指标发 生异常的因素。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示 例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述 的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。 在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。 而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示 例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可 以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结 合和组合。
本发明说明书、权利要求书和附图中出现的术语“包括”和“具有”以及 它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的 过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地 还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或 设备固有的其它步骤或单元。此外,术语“第一”、“第二”和“第三”等是 用于区别不同的对象,而并非用于描述特定的顺序。下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行描述。
参见图1,图1是本发明实施例涉及的一种通信系统的架构示意图,该通信 系统包括终端100和服务器200。其中终端与服务器通过互联网相互通信。本发 明实施例中提及的终端101例如可为手机、平板电脑、笔记本电脑、掌上电脑、 移动互联网设备或其他移动终端。在该通信系统中,用户通过终端100登录应 用平台,用户登录应用平台通过相应操作产生数据指标。服务器200用于监测 并统计数据指标。例如,服务器200监测该应用平台的日新增用户数量和日留 存用户数量。服务器200还对异常数据指标进行分析,找出导致异常数据指标 发生异常的因素,以确保平台的正常运行。其中,该平台可以是web网页或者 应用APP。
参见图2,图2是本发明实施例提供的一种服务器的结构示意图。如图2所 示,该服务器200可包括:存储器201、通信接口202、和一个或多个处理器203。 这些部件可通过总线204或者其他方式连接,图1以通过总线连接为例。其中:
存储器201可以和处理器203通过总线204或者输入输出端口耦合,存储 器201也可以与处理器203集成在一起。存储器201用于存储各种软件程序和/ 或多组指令。具体的,存储器201可包括高速随机存取的存储器,并且也可包 括非易失性存储器,例如一个或多个磁盘存储设备、闪存设备或其他非易失性 固态存储设备。存储器201还可以存储网络通信程序,该网络通信程序可用于 与一个或多个附加设备,一个或多个终端,一个或多个网络设备进行通信。
处理器203可以是通用处理器,例如中央处理器(central processing unit,CPU), 还可以是数字信号处理器(digital signal processing,DSP)、专用集成电路(application specific integrated circuit,ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路。处理器203可处理通过通信接口202接收到的数据。
通信接口202用于服务器200与其他网络设备进行通信,例如终端进行通 信。通信接口202可以是收发器、收发电路等,其中,通信接口是统称,可以 包括一个或多个接口,例如终端与服务器之间的接口。通信接口202可以包括 有线接口和无线接口,例如标准接口、以太网、多机同步接口。
处理器203可用于读取和执行计算机可读指令。具体的,处理器203可用 于调用存储于存储器201中的数据。可选地,当处理器203发送任何消息或数 据时,其具体通过驱动或控制通信接口202做所述发送。可选地,当处理器203 接收任何消息或数据时,其具体通过驱动或控制通信接口202做所述接收。因 此,处理器203可以被视为是执行发送或接收的控制中心,通信接口202是发 送和接收操作的具体执行者。
在本发明实施例中,通信接口202具体用于执行下述方法实施例中涉及的 数据收发的步骤,处理器203具体用于实施除数据收发之外的数据处理的步骤。
结合图2所示的服务器,本发明实施例提供了一种异常数据指标分析的方 法,参见图3,图3为本发明的一个实施例提供的一种异常数据指标分析的方法 的流程示意图。其中,如图3所示,本发明的一个实施例提供的一种异常数据 指标分析的方法可以包括:
S301,获取异常数据指标。
具体的,服务器通过接口获取异常数据指标,所述异常数据指标由单个量 或者多个变量确定,所述异常数据指标包括:日新增用户数量、用户留存数量、 用户留存率等。其中日新增用户数量为单个变量,用户留存率是用户留存数量 和新增用户数量的比值,所以由用户留存数量和新增用户数量两个变量确定。
S302,根据异常数据指标的实际值、异常数据指标的预测值、异常数据指 标在目标因素下的预测值和异常数据指标在目标因素下的实际值确述目标因素 导致异常数据指标发生异常的几率。
可选的,当异常数据指标由单个变量确定时,根据公式一计算目标因素的 导致所述异常数据指标发生异常的几率,公式一具体为:其中,ai为 单个变量的实际值,fi为单个变量的预测值,Ai为单个变量在所述目标因素下的 实际值,Fi为单个变量在所述目标因素下的预测值。
例如,以某个游戏平台的异常数据指标为日新增用户来举例说明。若该日 新增用户数量的实际值为100,预估值为300。影响该游戏平台的日新增用户数 量的因素包括:华为手机、oppo手机,三星手机。其中,日新增用户数量在因 素为华为手机下的实际值为50,预测值为200;新增用户数量在因素为oppo手 机下的实际值为30,预测值为70;新增用户数量在因素为三星手机下的实际值 为20,预测值为300。
利用公式计算华为手机导致日新增用户数量发生异常的几率,数 值代入公式为:所以,华为手机导致新增用户数量 发生异常的几率为0.75。同样的,将oppo手机和三星手机的数值代入该公式, 计算得到oppo手机和三星手机导致日新增用户数量发生异常的几率分别为:0.2, 0.05。
可选的,当异常数据指标由第一变量和第二变量确定时,根据公式二计算 目标因素导致所述异常数据指标发生异常的几率,公式二具体为: 其中,a1为第一变量的实际值,f1为第一变量的预测值,A1为 第一变量在所述目标因素下的实际值,F1为第一变量在所述目标因素下的预测 值。a2为第二变量的实际值,f2为第二变量的预测值,A2为第二变量标在目标 因素下的实际值,F2为第二变量在目标因素下的预测值。
例如,以某游戏平台的异常数据指标为留存率(留存用户数量/新增用户数 量)来举例说明。其中,留存用户数量为第一变量,新增用户数量为第二变量。 影响留存率的因素为华为手机,oppo手机和三星手机。
留存用户数量的实际值为100,预估值为400。其中,新增用户数量在因素 为华为手机下的实际值为50,预测值为300;新增用户数量在因素为oppo手机 下的实际值为30,预测值为60;新增用户数量在因素为三星手机下的实际值为 20,预测值为40。
新增用户数量的实际值为300,预估值为700。其中,新增用户数量在因素 为华为手机下的实际值为200,预测值为500;新增用户数量在因素为oppo手 机下的实际值为50,预测值为150;新增用户数量在因素为三星手机下的实际 值为50,预测值为50。
利用公式计算华为手机导致留存率发生异常的几率,数值代入公式为
所以,华为手机导致留存率发生异常的几率为-0.194。同样的,将oppo手机和 三星手机的数值代入该公式,计算得到oppo手机和三星手机导致留存率发生异 常的几率分别为:0.045,-0.029。由于华为手机和三星手机导致留存率发生异常 的几率的值都为负数,oppo手机几率的值为负数,因此去掉与总趋势相反的oppo 手机的几率。因此,将华为手机和三星手机导致留存率发生异常的几率的值进 行归一化,得到华为手机和三星手机导致留存率发生异常的几率的值分别为: 0.87,0.13。
S303,根据目标因素导致所述异常数据指标发生异常的几率确定目标因素 是否是导致所述异常数据指标发生异常的因素。
可选的,根据步骤S302计算得到的目标因素导致异常数据指标发生异常的 几率,判断目标因素导致所述异常数据指标发生异常的几率是否大于或等于第 一阈值。若目标因素导致所述异常数据指标发生异常的几率大于等于第一阈值, 将目标因素确定为导致异常数据指标发生异常的因素。例如,所述第一阈值大 于0小于1。
例如,以第一阈值为0.5为例来进行说明。若异常数据指标为日新增用户, 华为手机、oppo手机和三星手机导致日新增用户数量发生异常的几率分别为: 0.75,0.2,0.05,由于华为手机的几率大于等于第一阈值,所以将华为手机确定 为导致日新增用户发生异常的因素。
以上是以某一数据指标为例来说明如何找到导致该数据指标发生异常的因 素的,在具体应用中,针对各个数据指标,均可以采用上述方案进行异常数据 指标的分析过程,以找出导致各个数据指标发生异常的因素。
通过实施本发明实施例,通过分析目标因素导致异常数据指标发生异常的 几率,可以快速有效确定导致异常数据指标发生异常的因素。
参见图4,图4为本发明的一个实施例提供的一种异常数据指标分析的方法 的流程示意图。终端在执行步骤S303之后,还包括如下步骤S304-S306。以下 对步骤S304-S306进行详细介绍:
S304,根据异常数据指标的实际值、异常数据指标的预测值、异常数据指 标在目标因素下的预测值和异常数据指标目标因素下的实际值确定目标因素的 异常预测差异度。
可选的,若异常数据指标由单个变量确定,根据公式 确定所述目标因素的异常预测差异度,其中,ai为 单个变量的实际值,fi为单个变量的预测值,Ai为单个变量在目标因素下的实际 值,Fi为单个变量在目标因素下的预测值。
以异常数据指标为日新增用户来举例进行说明。若该日新增用户数量的实 际值为100,预估值为300。影响该游戏平台的日新增用户数量的因素包括:华 为手机、oppo手机,三星手机。其中,日新增用户数量在因素为华为手机下的 实际值为50,预测值为200;新增用户数量在因素为oppo手机下的实际值为30, 预测值为70;新增用户数量在因素为三星手机下的实际值为20,预测值为300。
利用公式分别计算华为手机、oppo手机和三星手机的异常预测差异度分别为0.61,0.28,0.16。
可选的,若异常数据指标由第一变量和第二变量确定,根据公式确定第一变量的异常预测差异度,其中,a1为第一变量的实际值,f1为第一变量的预测值,A1为第一变 量在目标因素下的实际值,F1为第一变量在目标因素下的预测值。
根据公式确定第二变量的异常预测 差异度,其中,a2为第二变量的实际值,f2为第二变量的预测 值,A2为第二变量在目标因素下的实际值,F2为第二变量在目标因素下的预测 值。
根据第一变量的异常预测差异度和第二变量的异常预测差异度确定目标因 素的异常预测差异度。
以异常数据指标为留存率(留存用户数量/新增用户数量)来进行说明。其 中,留存用户数量为第一变量,新增用户数量为第二变量。影响留存率的因素 为华为手机,oppo手机和三星手机。
留存用户数量的实际值为100,预估值为400。其中,新增用户数量在因素 为华为手机下的实际值为50,预测值为300;新增用户数量在因素为oppo手机 下的实际值为30,预测值为60;新增用户数量在因素为三星手机下的实际值为 20,预测值为40。
新增用户数量的实际值为300,预估值为700。其中,新增用户数量在因素 为华为手机下的实际值为200,预测值为500;新增用户数量在因素为oppo手 机下的实际值为50,预测值为150;新增用户数量在因素为三星手机下的实际 值为50,预测值为50。
利用公式计算留存用户数量下华为 手机、oppo手机和三星手机的异常预测差异度分别为:0.65,0.23,0.16.
利用公式计算新增用户数量下华为 手机、oppo手机和三星手机的异常预测差异度分别为:0.72,0.20,0.12。
将留存用户数量下华为手机、oppo手机和三星手机的异常预测差异度和新 增用户数量下华为手机、oppo手机和三星手机的异常预测差异度对应相加,得 到留存率下华为手机、oppo手机和三星手机的异常预测差异度分别为:1.37, 0.43,0.28。
S305,根据目标因素导致所述异常数据指标发生异常的几率以及目标因素 的异常预测差异度确定目标因素是否为满足预设条件的因素。
可选的,所述预设条件用于从M个因素中筛选N个因素,M个因素为导致 数据指标发生异常的因素,M为大于等于2的正整数,N小于M。筛选的N个 因素是导致异常数据指标发生异常的几率和/或异常预测差异度值在M个因素中 较大的因素。
可选的,根据M个因素各自导致所述异常数据指标发生异常的几率确定第 二阈值。
例如,导致日新增用户数量发生异常的因素有华为手机、三星手机和苹果 手机,华为手机、三星手机和苹果手机导致日新增用户发生异常的几率分别为: 0.32,0.34,0.31。第二阈值可以是三者的平均值0.32,也可以是三者的中值0.32。
根据M个因素各自的异常预测差异度确定第三阈值。
例如,导致日新增用户数量发生异常的因素有华为手机、三星手机和苹果 手机,华为手机、三星手机和苹果手机的异常预测差异度分别为0.58,0.30,0.17。 第三阈值可以是三者的平均值0.35,也可以是三者的中值0.30。
根据目标因素导致异常数据指标发生异常的几率是否大于等于第二阈值以 及目标因素的异常预测差异度是否大于等于第三阈值判断目标因素是否为满足 预设条件的因素;若目标因素导致异常数据指标发生异常的几率大于等于第二 阈值且目标因素的异常预测差异度大于等于所述第三阈值,则目标因素为满足 预设条件的因素。
以第二阈值取平均值并且第三阈值取中值为例来进行说明,第二阈值为0.32, 第三阈值为0.35,由于华为手机和三星手机导致该数据指标发生异常的几率大 于等于第二阈值0.32,并且两者的异常预测差异度大于等于第三阈值0.35。所 以将华为手机和三星手机确定为满足预设条件的因素。
S306,将满足预设条件的因素根据各自导致异常数据指标发生异常的几率 和/或各自的异常预测差异度确定所述目标因素在所述M个因素中的排名。
在第一种实现方式中,将满足预设条件的因素按照各自导致异常数据指标 发生异常的几率从高到低的顺序进行排序。若存在A个导致异常数据指标发生 异常的几率相同的因素,将这A个因素按照各自的异常预测差异度从高到低的 顺序进行排序。
在第二种实现方式中,将满足预设条件的因素按照各自的异常预测差异度 从高到低的顺序进行排序。若存在B个异常预测差异度相同的因素,将这B个 因素按照各自导致异常数据指标发生异常的几率从高到低的顺序进行排序。
例如,满足预设条件的因素华为手机、三星手机和苹果手机导致异常数据 指标发生异常的几率分别为:0.33,0.28,0.32;异常预测差异度分别为:0.24,0.24,0.61。在第一种实现方式中,三者的排名顺序为:华为手机、苹果手机、 三星手机;在第二种实现方式中,三者的排名顺序为:苹果手机,华为手机、 三星手机。
实施本发明实施例,通过分析目标因素导致异常数据指标发生异常的几率, 确定该目标因素是否为导致异常数据指标发生异常的因素,通过多个因素的几 率和异常预测差异度的值确定导致该异常数据指标异常的程度进行排名,可以 快速有效找出导致异常数据指标异常的重要影响因素。
参见图5,图5为本发明实施例提供的异常数据指标分析的装置的结构示意 图,如图5所示该异常数据指标分析的装置500包括:获取单元501,第一确定 单元502,第二确定单元503。
其中,获取单元501用于获取异常数据指标;第一确定单元501,用于根据 异常数据指标的实际值、异常数据指标的预测值、异常数据指标在目标因素下 的预测值和异常数据指标在目标因素下的实际值确定目标因素导致异常数据指 标指标发生异常的几率;第二确定单元502,用于根据目标因素导致所述异常数 据指标发生异常的几率确定目标因素是否是导致异常数据指标发生异常的因素。
可选的,异常数据指标由单个变量确定,第一确定单元502具体用于根据 公式一计算目标因素的导致异常数据指标发生异常的几率,公式一为:其中,ai为单个变量的实际值,fi为单个变量的预测值,Ai为单个变量在目标因 素下的实际值,Fi为单个变量在目标因素下的预测值。
可选的,异常数据指标由第一变量和第二变量确定,第一确定单元502具 体用于根据公式二计算目标因素导致异常数据指标发生异常的几率,公式二为:其中,a1为第一变量的实际值,f1为第一变量的预测 值,A1为第一变量在目标因素下的实际值,F1为第一变量在目标因素下的预测 值。a2为第二变量的实际值,f2为第二变量的预测值,A2为第二变量标在目标 因素下的实际值,F2为第二变量在目标因素下的预测值。
可选的,第二确定503单元具体用于判断目标因素导致所述异常数据指标 发生异常的几率是否大于或等于第一阈值;若是,将目标因素确定为导致异常 数据指标发生异常的因素。
可选的,该装置500还包括:
第三确定单元,用于根据异常数据指标的实际值、异常数据指标的预测值、 异常数据指标在目标因素下的预测值和异常数据指标目标因素下的实际值确定 目标因素的异常预测差异度,异常预测差异度用于衡量目标因素的第一参数和 第二参数的差异度,第一参数为异常数据指标在目标因素下的预测值和异常数 据指标的预测值的比值,第二参数为异常数据指标在目标因素下的实际值和异 常数据指标的实际值的比值;
第四确定单元,用于根据目标因素导致所述异常数据发生异常的几率以及 目标因素的异常预测差异度确定目标因素是否为满足预设条件的因素,预设条 件用于从M个因素中筛选N个因素,M个因素为导致数据指标发生异常的因素, M为大于等于2的正整数,N小于M。
可选的,异常数据指标由单个变量确定,第三确定单元具体用于根据公式确定目标因素的异常预测差异度,其中,ai为单个变量的实际值,fi为单个变量的预测值,Ai为单个变 量在目标因素下的实际值,Fi为单个变量在目标因素下的预测值。
可选的,异常数据指标由第一变量和第二变量确定,第三确定单元具体用 于根据公式确定第一变量的异常预测差 异度,其中,a1为第一变量的实际值,f1为第一变量的预测值, A1为第一变量在目标因素下的实际值,F1为第一变量在目标因素下的预测值;
根据公式确定第二变量的异常预测 差异度,其中,a2为第二变量的实际值,f2为第二变量的预测 值,A2为第二变量在目标因素下的实际值,F2为第二变量在目标因素下的预测 值。
根据第一变量的异常预测差异度和第二变量的异常预测差异度确定目标因 素的异常预测差异度。
可选的,第四确定单元具体用于根据M个因素各自导致异常数据指标发生 异常的几率确定第二阈值;
根据M个因素各自的异常预测差异度确定第三阈值;
根据目标因素导致异常数据指标发生异常的几率是否大于等于第二阈值以 及目标因素的异常预测差异度是否大于等于第三阈值判断目标因素是否为满足 预设条件的因素;
若目标因素导致异常数据指标发生异常的几率大于等于第二阈值且目标因 素的异常预测差异度大于等于第三阈值,则目标因素为满足预设条件的因素。
可选的,该装置500还包括:
第五确定单元,用于根据目标因素导致异常数据指标发生异常的几率和/或 目标因素的异常预测差异度确定目标因素在M个因素中的排名。
在本申请的另一实施例中提供一种计算机可读存储介质,所述计算机可读 存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被 处理器执行时实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或 使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明 的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部 或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介 质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器, 或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述 的存储介质包括:U盘、移动硬盘、只读存储器(read-onlymemory,ROM)、 随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存 储程序代码的介质。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组 合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实 现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行 所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功 能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编 程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算 机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可 以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、 数字用户线(digital subscriber line,DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储 介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集 成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如, 软盘、硬盘、磁带)、光介质(例如数字多功能光盘(digital versatile disc,DVD)、 半导体介质(例如固态硬盘solidstate disk,SSD)等。
以上所述的具体实施方式,对本发明实施例的目的、技术方案和有益效果 进行了进一步详细说明,所应理解的是,以上所述仅为本发明实施例的具体实 施方式而已,并不用于限定本发明实施例的保护范围,凡在本发明实施例的技 术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明 实施例的保护范围之内。

Claims (10)

1.一种异常数据指标分析的方法,其特征在于,包括:
获取异常数据指标;
根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在目标因素下的预测值和所述异常数据指标在所述目标因素下的实际值确定所述目标因素导致所述异常数据指标发生异常的几率;
根据所述目标因素导致所述异常数据指标发生异常的几率确定所述目标因素是否是导致所述异常数据指标发生异常的因素。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标因素导致所述异常数据发生异常的几率确定所述目标因素是否是导致所述数据指标发生异常的因素之后,还包括:
根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在所述目标因素下的预测值和所述异常数据指标所述目标因素下的实际值确定所述目标因素的异常预测差异度,所述异常预测差异度用于衡量所述目标因素的第一参数和第二参数的差异度,所述第一参数为所述异常数据指标在所述目标因素下的预测值和所述异常数据指标的预测值的比值,所述第二参数为所述异常数据指标在所述目标因素下的实际值和所述异常数据指标的实际值的比值;
根据所述目标因素导致所述异常数据指标发生异常的几率以及所述目标因素的异常预测差异度确定所述目标因素是否为满足预设条件的因素,所述预设条件用于从M个因素中筛选N个因素,所述M个因素为导致所述数据指标发生异常的因素,所述M为大于等于2的正整数,所述N小于所述M。
3.根据权利要求1所述的方法,其特征在于,所述异常数据指标由单个变量确定,所述根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在目标因素下的预测值和所述异常数据指标在所述目标因素下的实际值确定所述目标因素导致所述数据指标发生异常的几率,包括:
根据公式一计算所述目标因素的导致所述异常数据指标发生异常的几率,所述公式一为:其中,ai为所述单个变量的实际值,fi为所述单个变量的预测值,Ai为所述单个变量在所述目标因素下的实际值,Fi为所述单个变量在所述目标因素下的预测值。
4.根据权利要求1所述的方法,其特征在于,所述异常数据指标由第一变量和第二变量确定,所述根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在目标因素下的预测值和所述异常数据指标在目标因素下的实际值确定所述目标因素导致所述异常数据指标发生异常的几率,包括:
根据公式二计算所述目标因素导致所述异常数据指标发生异常的几率,所述公式二为:其中,a1为所述第一变量的实际值,f1为所述第一变量的预测值,A1为所述第一变量在所述目标因素下的实际值,F1为所述第一变量在所述目标因素下的预测值,a2为所述第二变量的实际值,f2为所述第二变量的预测值,A2为所述第二变量标在所述目标因素下的实际值,F2为所述第二变量在所述目标因素下的预测值。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述目标因素导致所述异常数据指标发生异常的几率确定所述目标因素是否是导致所述异常数据指标发生异常的因素,包括:
判断所述目标因素导致所述异常数据发生异常的几率是否大于或等于第一阈值;
若是,将所述目标因素确定为导致所述异常数据指标发生异常的因素。
6.根据权利要求2所述的方法,其特征在于,所述异常数据指标由单个变量确定,所述根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在所述目标因素下的预测值和所述异常数据指标所述目标因素下的实际值确定所述目标因素的异常预测差异度,包括:
根据公式确定所述目标因素的异常预测差异度,其中,ai为所述单个变量的实际值,fi为所述单个变量的预测值,Ai为所述单个变量在目标因素下的实际值,Fi为所述单个变量在目标因素下的预测值。
7.根据权利要求2所述的方法,其特征在于,所述异常数据指标由第一变量和第二变量确定,所述根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在所述目标因素下的预测值和所述异常数据指标所述目标因素下的实际值确定所述目标因素的异常预测差异度,包括:
根据公式确定所述第一变量的异常预测差异度,其中,a1为所述第一变量的实际值,f1为所述第一变量的预测值,A1为所述第一变量在目标因素下的实际值,F1为所述第一变量在目标因素下的预测值;
根据公式确定所述第二变量的异常预测差异度,其中,a2为所述第二变量的实际值,f2为所述第二变量的预测值,A2为所述第二变量在目标因素下的实际值,F2为所述第二变量在目标因素下的预测值;
根据所述第一变量的异常预测差异度和所述第二变量的异常预测差异度确定所述目标因素的异常预测差异度。
8.一种异常数据指标分析的装置,其特征在于,包括:
获取单元,用于获取异常数据指标;
第一确定单元,用于根据所述异常数据指标的实际值、所述异常数据指标的预测值、所述异常数据指标在目标因素下的预测值和所述异常数据指标在所述目标因素下的实际值确定所述目标因素导致所述异常数据指标发生异常的几率;
第二确定单元,用于根据所述目标因素导致所述异常数据指标发生异常的几率确定所述目标因素是否是导致所述异常数据指标发生异常的因素。
9.一种服务器,其特征在于,包括处理器、通信接口和存储器,所述处理器、所述通信接口和所述存储器相互连接,其中,所述通信接口用于与其它网络设备进行通信,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-8任一项所述的异常数据指标分析的方法。
10.一种计算机可读存储介质,其特征在于,所述可读存储介质上存储有指令,当所述可读存储介质在处理器上运行时,使得所述处理器执行如权利要求1-8任一项所述的异常数据指标分析的方法。
CN201811452306.5A 2018-11-30 2018-11-30 一种异常数据指标分析的方法及装置 Active CN109726075B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811452306.5A CN109726075B (zh) 2018-11-30 2018-11-30 一种异常数据指标分析的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811452306.5A CN109726075B (zh) 2018-11-30 2018-11-30 一种异常数据指标分析的方法及装置

Publications (2)

Publication Number Publication Date
CN109726075A true CN109726075A (zh) 2019-05-07
CN109726075B CN109726075B (zh) 2022-10-14

Family

ID=66295153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811452306.5A Active CN109726075B (zh) 2018-11-30 2018-11-30 一种异常数据指标分析的方法及装置

Country Status (1)

Country Link
CN (1) CN109726075B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140358833A1 (en) * 2013-05-29 2014-12-04 International Business Machines Corporation Determining an anomalous state of a system at a future point in time
CN106126391A (zh) * 2016-06-28 2016-11-16 北京百度网讯科技有限公司 系统监控方法和装置
CN107086944A (zh) * 2017-06-22 2017-08-22 北京奇艺世纪科技有限公司 一种异常检测方法和装置
CN107330614A (zh) * 2017-06-29 2017-11-07 北京京东尚科信息技术有限公司 一种业务活动效果的实时评估方法和装置
CN108596229A (zh) * 2018-04-13 2018-09-28 北京华电智慧科技产业有限公司 在线异常的监测诊断方法和系统
CN108829638A (zh) * 2018-06-01 2018-11-16 阿里巴巴集团控股有限公司 一种业务数据波动处理方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140358833A1 (en) * 2013-05-29 2014-12-04 International Business Machines Corporation Determining an anomalous state of a system at a future point in time
CN106126391A (zh) * 2016-06-28 2016-11-16 北京百度网讯科技有限公司 系统监控方法和装置
CN107086944A (zh) * 2017-06-22 2017-08-22 北京奇艺世纪科技有限公司 一种异常检测方法和装置
CN107330614A (zh) * 2017-06-29 2017-11-07 北京京东尚科信息技术有限公司 一种业务活动效果的实时评估方法和装置
CN108596229A (zh) * 2018-04-13 2018-09-28 北京华电智慧科技产业有限公司 在线异常的监测诊断方法和系统
CN108829638A (zh) * 2018-06-01 2018-11-16 阿里巴巴集团控股有限公司 一种业务数据波动处理方法及装置

Also Published As

Publication number Publication date
CN109726075B (zh) 2022-10-14

Similar Documents

Publication Publication Date Title
KR102339239B1 (ko) 클라우드-디바이스 협업적 실시간 사용자 사용 및 성능 비정상 검출을 위한 시스템 및 방법
US11106560B2 (en) Adaptive thresholds for containers
CN111212330B (zh) 一种网络性能瓶颈值的确定方法、装置及存储介质
US20210319375A1 (en) Churn prediction in a broadband network
US10033659B2 (en) Reputation-based mediation of virtual control planes
US11500888B2 (en) Methods and systems for detecting anomalies in cloud services based on mining time-evolving graphs
US10951722B2 (en) Deriving mobile application usage from network traffic
US11871249B2 (en) Intelligent monitoring systems and methods for cloud-based Wi-Fi
CN108319974B (zh) 数据处理方法、装置、存储介质和电子装置
US20140181278A1 (en) Virtual resource provider with virtual control planes
US8832839B2 (en) Assessing system performance impact of security attacks
CN109800119A (zh) 一种产品功能测试方法及装置
CN108459908A (zh) 对云计算中的不兼容的共同租户对的识别
JP2019520747A (ja) ホームネットワークにおいてWi−Fiカバレッジを最適化するためのシステムおよび関連方法
US8667399B1 (en) Cost tracking for virtual control planes
CN110166271A (zh) 一种检测网络节点异常的方法和装置
US20230275973A1 (en) Computerized system and method for churn prediction and system updates based therefrom
US20220377582A1 (en) Predicting the likelihood of subscriber churn
CN104978212B (zh) 一种未知crash上报方法和装置
US20180357654A1 (en) Testing and evaluating predictive systems
EP3391589B1 (en) Autonomic method for managing a computing system
WO2017102602A1 (en) Autonomic method for managing a computing system
CN109726075A (zh) 一种异常数据指标分析的方法及装置
EP3391295B1 (en) Autonomic method for managing a computing system
JP7339321B2 (ja) 機械学習モデル更新方法、コンピュータプログラムおよび管理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant