CN106096226A - 一种数据评估方法、装置及服务器 - Google Patents
一种数据评估方法、装置及服务器 Download PDFInfo
- Publication number
- CN106096226A CN106096226A CN201610363840.3A CN201610363840A CN106096226A CN 106096226 A CN106096226 A CN 106096226A CN 201610363840 A CN201610363840 A CN 201610363840A CN 106096226 A CN106096226 A CN 106096226A
- Authority
- CN
- China
- Prior art keywords
- value
- index data
- data value
- target period
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000009826 distribution Methods 0.000 claims abstract description 155
- 238000011156 evaluation Methods 0.000 claims description 66
- 238000011157 data evaluation Methods 0.000 claims description 46
- 238000012937 correction Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 description 52
- 230000014759 maintenance of location Effects 0.000 description 26
- 238000007689 inspection Methods 0.000 description 9
- 238000013486 operation strategy Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Z—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
- G16Z99/00—Subject matter not provided for in other main groups of this subclass
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种数据评估方法、装置及服务器,该方法包括:确定目标周期的指标数据值及历史周期的指标数据值;根据所述目标周期的指标数据值的置信水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值;将所述目标周期的指标数据值与所述标准下阈值进行比对;在所述目标周期的指标数据值大于所述标准下阈值时,确定评估结果为指标数据值达标,在所述目标周期的指标数据值小于所述标准下阈值时,确定评估结果为指标数据值不达标。本发明实施例提供的数据评估方法,能够提升指标数据值评估的准确性。
Description
技术领域
本发明涉及数据处理技术领域,更具体地说,涉及一种数据评估方法、装置及服务器。
背景技术
游戏、音视频等应用上线后,出于合理优化投入的应用资源,调整应用运营策略等目的,往往需要对不同周期的用户活跃率,用户留存率等指标数据值进行监控,并判断所要评估的周期的指标数据值是否达标,从而为优化投入的应用资源、调整应用运营策略等提供数据支持;可见,对指标数据值进行评估具有极大的意义。
基于此,如何准确的对指标数据值进行评估,成为了本领域技术人员研究的关注点。
发明内容
有鉴于此,本发明实施例提供一种数据评估方法、装置及服务器,以提升指标数据值评估的准确性。
为实现上述目的,本发明实施例提供如下技术方案:
一种数据评估方法,包括:
确定目标周期的指标数据值及历史周期的指标数据值;
根据所述目标周期的指标数据值的置信水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值;
将所述目标周期的指标数据值与所述标准下阈值进行比对;
在所述目标周期的指标数据值大于所述标准下阈值时,确定评估结果为指标数据值达标,在所述目标周期的指标数据值小于所述标准下阈值时,确定评估结果为指标数据值不达标。
本发明实施例还提供一种数据评估装置,包括:
指标数据值确定模块,用于确定目标周期的指标数据值及历史周期的指标数据值;
下阈值确定模块,用于根据所述目标周期的指标数据值的置信水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值;
第一比对模块,用于将所述目标周期的指标数据值与所述标准下阈值进行比对;
第一评估结果确定模块,用于在所述目标周期的指标数据值大于所述标准下阈值时,确定评估结果为指标数据值达标,在所述目标周期的指标数据值小于所述标准下阈值时,确定评估结果为指标数据值不达标。
本发明实施例还提供一种服务器,包括上述所述的数据评估装置。
基于上述技术方案,本发明实施例提供的数据评估方法包括:确定目标周期的指标数据值及历史周期的指标数据值;根据所述目标周期的指标数据值的置信水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值;将所述目标周期的指标数据值与所述标准下阈值进行比对;在所述目标周期的指标数据值大于所述标准下阈值时,确定评估结果为指标数据值达标,在所述目标周期的指标数据值小于所述标准下阈值时,确定评估结果为指标数据值不达标。可以看出,本发明实施例在需对目标周期的指标数据值进行评估时,可基于置信水平分布值、目标周期的指标数据值及历史周期的指标数据值确定目标周期用于评估的标准下阈值,使得所确定的标准下阈值能够与所要评估的周期与历史周期的具体情况相匹配,则基于所确定的标准下阈值与所述目标周期的指标数据值进行比对,可得到更为客观、准确性较高的评估结果。本发明实施例提供的数据评估方法,能够提升指标数据值评估的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面 描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的数据评估方法的流程图;
图2为本发明实施例提供的确定目标周期对应的标准下阈值的方法流程图;
图3为本发明实施例提供的数据评估方法的另一流程图;
图4为本发明实施例提供的确定目标周期对应的标准上阈值的方法流程图;
图5为本发明实施例对预测的指标数据值进行修正的方法流程图;
图6为本发明实施例提供的数据评估装置的结构框图;
图7为本发明实施例提供的数据评估装置的另一结构框图;
图8为本发明实施例提供的指标数据值确定模块的结构框图;
图9为本发明实施例提供的服务器的硬件结构框图。
具体实施方式
目前对指标数据值的评估主要是将所要评估的周期的指标数据值(指标数据值如所要评估的周期的用户活跃率值、用户留存率值等),与固定标准下阈值进行比对,得出指标数据值达标或不达标的评估结果;然而不同时期影响指标数据值评估结果的因素的具体情况可能不同,因此以固定标准下阈值的方式实现指标数据值的评估,会存在评估准确性较低的问题;
本发明的发明人研究发现,判断指标数据值是否达标的标准下阈值应受指标数据值的历史情况及所要评估的周期的情况影响,不同周期用于评估的标准下阈值应具有动态可变的特性;基于此,本发明的发明人考虑在每一个所要评估的周期,通过历史周期及所要评估的周期的指标数据值,动态的确定标准下阈值;从而基于动态确定的标准下阈值,在每一个所要评估的周期实现指标数据值是否达标的评估,提升评估结果的准确性。
基于上述发明思想,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普 通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的数据评估方法的流程图,该方法可应用于服务器,该服务器可以是应用服务器,该应用服务器可以是为游戏、音视频等应用提供服务支持,和/或,能够监控应用的指标数据的网络侧服务器;该服务器也可以是能够与应用服务器进行数据交互,从应用服务器处获取指标数据进行分析评估的服务器;
参照图1,本发明实施例提供的数据评估方法可以包括:
步骤S100、确定目标周期的指标数据值及历史周期的指标数据值;
可选的,指标数据值可以是用户活跃率值、用户留存率值等某一类型的指标数据的数值表示;
目标周期可以认为是本发明实施例需要进行指标数据值评估的周期,历史周期可以是目标周期以前的至少一个周期;可选的,历史周期可以是目标周期以前的多个周期(如历史周期可以是目标周期以前的所有周期);
周期之间的时间间隔大小可视实际情况而定,本发明实施例可以设置固定时间间隔作为周期间隔,显然,周期之间的时间间隔也可能是动态变化的;
可选的,为便于理解,以t表示目标周期,则历史周期可以是1至t-1的各周期,本发明实施例可以获取t周期的指标数据值,及1至t-1的各周期的指标数据值。
步骤S110、根据所述目标周期的指标数据值的置信水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值;
目标周期对应的标准下阈值是用于判断目标周期的指标数据值是否达标的界限值;
可选的,本发明实施例可以确定所述目标周期的指标数据值的置信水平分布值,基于置信水平分布值,根据所述目标周期的指标数据值及历史周期的指标数据值,确定目标周期对应的标准下阈值;置信水平分布值可以表示置信水平的分布情况,置信水平是指目标周期的标数据值落在样本统计设定区域内的概率;
可选的,目标周期的指标数据值的样本容量大小可能是不同的,而基于 样本容量的大小,样本容量可以区分为第一样本容量(小样本)和第二样本容量(大样本),如样本容量小于设定样本容量阈值(如30)可以认为是小样本容量,而样本容量大于设定样本容量阈值可以认为是大样本容量;
为了准确的确定不同类型样本容量情况下的标准下阈值,本发明实施例可进一步区分不同样本容量类型下的置信水平分布值;即确定目标周期的指标数据值的样本容量类型对应的置信水平分布值(如在区分目标周期的指标数据值的样本容量类型的基础上,确定目标周期的指标数据值的置信水平分布值),根据所确定的置信水平分布值,所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值;
可选的,目标周期的指标数据值的样本容量类型对应的置信水平分布值分为,第一样本容量类型时对应的置信水平第一类型分布值,和第二样本容量类型时对应的置信水平第二类型分布值;
即在目标周期的指标数据值的样本容量类型为第一样本容量情况下,本发明实施例可基于置信水平第一类型分布值,根据所述目标周期的指标数据值及历史周期的指标数据值,确定目标周期对应的标准下阈值;在目标周期的指标数据值的样本容量类型为第二样容量情况下,基于置信水平第二类型分布值根据所述目标周期的指标数据值及历史周期的指标数据值,确定目标周期对应的标准下阈值。
步骤S110、将所述目标周期的指标数据值与所述标准下阈值进行比对;
步骤S120、在所述目标周期的指标数据值大于所述标准下阈值时,确定评估结果为指标数据值达标,在所述目标周期的指标数据值小于所述标准下阈值时,确定评估结果为指标数据值不达标。
本发明实施例提供的数据评估方法包括:确定目标周期的指标数据值及历史周期的指标数据值;根据所述目标周期的指标数据值的置信水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值;将所述目标周期的指标数据值与所述标准下阈值进行比对;在所述目标周期的指标数据值大于所述标准下阈值时,确定评估结果为指标数据值达标,在所述目标周期的指标数据值小于所述标准下阈值时,确定评估结果为指标数据值不达标。可以看出,本发明实施例在需对目标周期的指标数据值进行评估时,可基于置信水平分布值、目标周期的指标数据值及历 史周期的指标数据值确定目标周期用于评估的标准下阈值,使得所确定的标准下阈值能够与所要评估的周期与历史周期的具体情况相匹配,则基于所确定的标准下阈值与所述目标周期的指标数据值进行比对,可得到更为客观、准确性较高的评估结果。本发明实施例提供的数据评估方法,能够提升指标数据值评估的准确性。
本发明实施例提供的数据评估方法可应用于活动运营效果的评估,即本发明实施例可通过对所要评估的周期内活动的指标数据值进行评估,得到所要评估的周期内活动运营效果的评估结果;如游戏等应用上线后,往往会举行线上活动来提升用户使用应用的感兴趣度,而如何对活动运营效果进行评估,则对调整应用运营策略,优化应用资源具有重大参考意义;
以活动运营到当前经过了t周期为例,若对第t周期的用户活跃率值、用户留存率值等指标数据值进行评估,则服务器可获取第t周期的指标数据值,及第t周期以前1至t-1周期的指标数据值;从而根据第t周期的指标数据值,及1至t-1周期的指标数据值,确定第t周期评估所用的标准下阈值;
定义第t周期的指标数据值为Xt,第t周期评估所用的标准下阈值为X1,则本发明实施例可比对Xt与X1的大小,在Xt>X1时,确定第t周期的指标数据值达标,则相应的,第t周期的活动运营效果达标,在Xt<X1时,确定第t周期的指标数据值不达标,则相应的,第t周期的活动运营效果不达标;
可选的,在得到所述目标周期的指标数据值的评估结果后,本发明实施例可基于评估结果进行应用资源优化,和/或运营策略调整;下表1示出了评估结果与应用资源优化、与运营策略调整的关系;可选的,指标数据值等于标准下阈值,可以认为的达标的一种情况;
表1
可选的,若进行如下定义:
原假设,通过收集数据,予以反对的假设,以符号H0表示;
备择假设,通过收集数据,予以支持的假设,是原假设的对立面,以符号H1表示;
第一类错误概率,在原假设是正确的情况下,却拒绝原假设的情况出现的概率,以符号α表示;
置信水平,指标数据值落在样本统计设定区域内的概率,以1-α表示;
则对于第t期的指标数据值Xt进行评估,可假设如下:
H0,第t期指标数据值不达标;
H1,第t期指标数据值达标;
则可形成判断域即在原假设H0(第t期指标数据值不达标)的条件下,第t期指标数据值Xt小于标准下阀值X1的概率小于α;其直观含义为,在假定了第t期指标数据值Xt不达标的条件下,其实际概率为小于α的小概率事件,由此,将产生拒绝原假设H0的下阀值X1。
基于上述思路,本发明实施例可确定用于判断指标数据值是否达标的界限值(标准下阈值),图2示出了本发明实施例提供的确定目标周期对应的标准下阈值的方法流程图,参照图2,该方法可以包括:
步骤S200、确定与目标周期的指标数据值的样本容量类型对应的置信水平分布值;
步骤S210、根据所确定的置信水平分布值,所述目标周期的指标数据值及历史周期的指标数据值,确定目标周期对应的标准下阈值。
可选的,本发明实施例可根据所述目标周期的指标数据值及历史周期的指标数据值,确定指标数据均值及指标数据标准差;从而基于指标数据均值,指标数据标准差,所确定的置信水平分布值确定目标周期对应的标准下阈值;
可选的,本发明实施例可确定目标周期的指标数据值及历史周期的指标数据值的总个数;基于所述目标周期的指标数据值、历史周期的指标数据值及所述总个数,确定目标周期及历史周期整体的指标数据的均值及标准差,得到指标数据均值及指标数据标准差。
可选的,以目标周期为t周期,则确定目标周期的标准下阈值可根据如下公式实现;
其中,X1为目标周期对应的标准下阈值,Xavg为指标数据均值,Xstd为指标数据标准差,n为目标周期的指标数据值及历史周 期的指标数据值的总个数,kα为与目标周期的指标数据值的样本容量类型对应的置信水平分布值。
可选的,在目标周期的指标数据值的样本容量类型为第一样本容量情况下,所确定的置信水平分布值可以为第一样本容量对应的置信水平第一类型分布值;在目标周期的指标数据值的样本容量类型为第二样容量情况下,所确定的置信水平分布值可以为第二样本容量对应的置信水平第二类型分布值;即所确定的置信水平分布值可以包括:置信水平第一类型分布值或置信水平第二类型分布值;
相应的,如果目标周期的指标数据值的样本容量为第一样本容量,则本发明实施例确定目标周期对应的标准下阈值的方法可以为:
确定第一样本容量对应的置信水平第一类型分布值,基于指标数据均值,指标数据标准差,及置信水平第一类型分布值,确定目标周期对应的标准下阈值。
如果目标周期的指标数据值的样本容量为第二样本容量,则本发明实施例确定目标周期对应的标准下阈值的方法可以为:
确定第二样本容量对应的置信水平第二类型分布值,基于指标数据均值及指标数据标准差,置信水平第二类型分布值,确定目标周期对应的标准下阈值。
可选的,置信水平第一类型分布值可以是置信水平为1-α的t分布值;
t分布是指如果在方差σ未知的情况下,用样本估计方差S替代σ,且随机变量的概率函数为
则该随机变量服从t分布;t分布主要适用于小样本容量(第一样本容量)的情况,一般认为小样本的方差未知,需适用t分布,而不适用正态分布。
可选的,置信水平第二类型分布值可以是置信水平为1-α的正态分布值;
正态分布是指,在随机变量服从概率函数为时,
则该随机变量服从均值为μ,方差为σ的正态分布;正态分布一般适用于大样本容量(第二样本容量)的情况。
可选的,在目标周期的指标数据值的样本容量为第一样本容量时,置信水平第一类型分布值可以包括置信水平为1-α的t分布值,相应的,确定目标 周期的标准下阈值可根据如下公式实现;
其中,tα为置信水平为1-α的t分布值。
可选的,在目标周期的指标数据值的样本容量为第二样本容量时,置信水平第二类型分布值可以包括置信水平为1-α的正态分布值,相应的,确定目标周期的标准下阈值可根据如下公式实现;
其中,zα为置信水平为1-α的正态分布值。
上文提供的数据评估方法为本发明的发明人通过单精度单侧检验方法,实现的指标数据值评估,单精度单侧检验方法为只通过置信水平的单侧检验方法;单侧检验方法可以认为是,既判断是否相等又判断方向(≥或≤)的检验;
而本发明的发明人在研究中发现,在通过各所要评估的周期动态调整标准下阈值,实现指标数据值评估的基础上,还可进一步在指标数据值达标的情况下,判断指标数据值是否超标,从而为进一步准确的优化应用的资源投入、调整应用运营策略提供可能。
本发明实施例主要是在上文单精度单侧检验方法基础上,优化应用双精度单侧检验方法,实现指标数据值达标情况下是否超标的评估;双精度单侧检验方法是指,同时运用置信水平和功效水平的单侧检验方法;置信水平已在上文有过解释可参照,而功效水平是基于第二类错误概率的基础上定义的;第二类错误概率是指在原假设是错误的情况下,却接受原假设的情况出现的概率,以β表示;而功效水平是指拒绝原假设后,接受备择假设的概率,以1-β表示。
优选的,图3示出了本发明实施例提供的数据评估方法的另一流程图,参照图3,该方法可以包括:
步骤S300、确定目标周期的指标数据值及历史周期的指标数据值;
步骤S310、根据所述目标周期的指标数据值的置信水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值;及根据所述目标周期的指标数据值的功效水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准上阈值,所述标准上阈值大于所述标准下阈值;
目标周期对应的标准上阈值是在目标周期的指标数据值达标的基础上, 用于判断目标周期的指标数据值是否超标的界限值;
可选的,本发明实施例可以确定所述目标周期的指标数据值的功效水平分布值,基于功效水平分布值,根据所述目标周期的指标数据值及历史周期的指标数据值,确定目标周期对应的标准上阈值;功效水平分布值可以表示功效水平的分布情况;
可选的,为了准确的确定不同类型样本容量情况下的标准上阈值,本发明实施例可进一步区分不同样本容量类型下的功效水平分布值;即确定目标周期的指标数据值的样本容量类型对应的功效水平分布值(如在区分目标周期的指标数据值的样本容量类型的基础上,确定目标周期的指标数据值的功效水平分布值),根据所确定的功效水平分布值,所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准上阈值;
可选的,目标周期的指标数据值的样本容量类型对应的功效水平分布值分为,第一样本容量类型时对应的功效水平第一类型分布值,或,第二样本容量类型时对应的功效水平第二类型分布值。
步骤S320、将所述目标周期的指标数据值与所述标准下阈值进行比对;
步骤S330、在所述目标周期的指标数据值小于所述标准下阈值时,确定评估结果为指标数据值不达标;
步骤S340、在所述目标周期的指标数据值大于所述标准下阈值时,确定评估结果为指标数据值达标,并将所述目标周期的指标数据值与所述标准上阈值比对;
步骤S340、在所述目标周期的指标数据值大于所述标准上阈值时,确定评估结果为指标数据值超标,在所述目标周期的指标数据值大于所述标准小阈值且小于所述标准上阈值时,确定评估结果为指标数据值达标但未超标。
相比于图1所示方法,图3所示方法在图1所示方法的基础上,可进一步将目标周期的指标数据值达标的情况细分为指标数据值超标,和指标数据值达标但未超标,进一步提升了指标数据值评估的准确性,为准确的进行应用资源优化和运营策略调整提供了可能。
本发明实施例提供的数据评估方法可应用于活动运营效果的评估,若活动运营到当前经过了t周期,若对第t周期的用户活跃率值、用户留存率值等指标数据值进行评估,则服务器可获取第t周期的指标数据值,及第t周期以前1 至t-1周期的指标数据值;根据第t周期的指标数据值,及1至t-1周期的指标数据值,确定第t周期评估所用的标准下阈值及标准上阈值;
定义第t周期的指标数据值为Xt,第t周期评估所用的标准下阈值为X1,标准上阈值为X2,则本发明实施例可比对Xt与X1的大小,在Xt<X1时,确定第t周期的指标数据值不达标,则相应的,第t周期的活动运营效果不达标;在Xt>X1时,确定第t周期的指标数据值达标,进一步将Xt与X2进行比对,则在Xt>X2时,确定第t周期的指标数据值超标,在X1<Xt<X2时,确定第t周期的指标数据值达标但不超标;
可选的,在得到所述目标周期的指标数据值的评估结果后,本发明实施例可基于评估结果进行应用资源优化,和/或运营策略调整;下表2示出了评估结果与应用资源优化、与运营策略调整的关系;可选的,指标数据值等于标准下阈值或等于标准上阈值,均可以认为是达标的情况;
表2
将表1与表2进行比对,可以发现图3进一步细分指标数据值达标但不超标,及超标的情况,可细化应用资源优化、与运营策略调整手段,提升所确定的应用资源优化、与运营策略调整手段与实际情况的匹配度。
可选的,若进行如下假设:
对于第t期的指标数据值Xt进行评估,可假设如下:
第一层原假设H0,第t期指标数据值不达标;
第一层备择假设H1,第t期指标数据值达标;
第一层备择假设基础上的原假设H10,第t期指标数据值达标但不超标;
第一层备择假设基础上的备择假设H11,第t期指标数据值超标;
值得注意的是,H10和H11是在H1的条件下分别作出的原假设和备择假设,H10和H11是在H1基础下的一种递进关系;本发明实施例可通过H0,H1计算标准下阀值,再在H1条件下,通过H10,H11计算标准上阀值;
则可形成判断域
其中,是指在原假设H0(第t期指标数据值不达标)的条件下,第t期指标数据值Xt小于标准下阀值X1的概率小于α;其直观含义为,在假定了第t期指标数据值Xt不达标的条件下,其实际概率为小于α的小概率事件,由此,将产生拒绝原假设H0的标准下阀值X1;
是指在备择假设H1的条件下,第t期指标数据值Xt大于标准上阀值X2的概率大于1-β;其直观含义为,在假定了第t期指标数据值Xt达标的条件下,Xt大于标准上阈值X2的概念为大于1-β的大概率事件,由此,将产生接受备择假设的标准上阀值X2。
可选的,标准下阈值的确定方法可如上文相应部分所示;确定用于判断指标数据值是否超标的界限值(标准上阈值)的方法可如图4所示,参照图4,该方法可以包括:
步骤S400、确定与目标周期的指标数据值的样本容量类型对应的功效水平分布值;
步骤S410、根据所确定的功效水平分布值,所述目标周期的指标数据值及历史周期的指标数据值,确定目标周期对应的标准上阈值。
可选的,本发明实施例可根据所述目标周期的指标数据值及历史周期的指标数据值,确定指标数据均值及指标数据标准差;从而基于指标数据均值,指标数据标准差,所确定的功效水平分布值确定目标周期对应的标准上阈值;
可选的,以目标周期为t周期,则确定目标周期的标准上阈值可根据如下公式实现;
其中,X2为目标周期对应的标准上阈值,Xavg为指标数据均值,Xstd为指标数据标准差,n为目标周期的指标数据值及历史周期的指标数据值的总个数,kβ为与目标周期的指标数据值的样本容量类型对应的功效水平分布值。
可选的,为了准确的确定不同类型样本容量情况下的标准上阈值,本发 明实施例可进一步区分功效水平不同类型的分布值,得到第一样本容量对应的功效水平第一类型分布值,第二样本容量对应的功效水平第二类型分布值;
相应的,如果目标周期的指标数据值的样本容量为第一样本容量,则本发明实施例确定目标周期对应的标准上阈值的方法可以为:
确定第一样本容量对应的功效水平第一类型分布值,基于指标数据均值,指标数据标准差,及功效水平第一类型分布值确定目标周期对应的标准上阈值。
如果目标周期的指标数据值的样本容量为第二样本容量,则本发明实施例确定目标周期对应的标准上阈值的方法可以为:
确定第二样本容量对应的功效水平第二类型分布值,基于指标数据均值,指标数据标准差,及功效水平第二类型分布值,确定目标周期对应的标准上阈值。
可选的,在目标周期的指标数据值的样本容量为第一样本容量时,功效水平第一类型分布值可以是功效水平为1-β的t分布值;相应的,确定目标周期的标准上阈值可根据如下公式实现;
其中,tβ为功效水平为1-β的t分布值。
可选的,在目标周期的指标数据值的样本容量为第二样本容量时,功效水平第二类型分布值可以是功效水平为1-β的正态分布值;相应的,确定目标周期的标准上阈值可根据如下公式实现;
其中,zβ为功效水平为1-β的正态分布值。
例如,某一游戏应用的活动,在某一周的用户特权活跃率为24.57%,置信水平为95%、功效水平为85%,相应的特权活跃率标准上阀值为24.02%,标准下阀值为21.23%,则可以看出,由于特权活跃率真实值大于上阀值(24.57%>24.02%),因此判断该周的活动效果评估为超标,可适当减少应用资源的投入。
下表3示出了利用本发明实施例对某一游戏活动进行评估后,不同类型的指标数据达标率、超标率、不达标率的比例;其中,达标率为活动过程中一类型的指标数据达标的期数除以活动的总期数,超标率为活动过程中一类型的指标数据超标的期数除以活动的总期数,不达标率为活动过程中一类型的指标数据不达标的期数除以活动的总期数;
可以看出,本发明实施例提供的单精度单侧检验方法,与双精度单侧检验方法可随着活动的进行动态的调整评估结果,评估结果的准确性较高;尤其值得注意的是,由于超标情况下可以减少资源投入,因此采用本发明实施例优选的双精度单侧检验方法,能够为活动运营平均节约资源率16.24%。
表3
可选的,上文评估所用的目标周期的指标数据值,可以通过对所预测的目标周期的指标数据值进行修正得到;为使得评估所用的目标周期的指标数据值具有较高准确度,本发明实施例可在通过设定预测模型预测出指标数据值后,通过指标数据值置信区间对所预测的指标数据值进行修正;
可选的,图5示出了对预测的指标数据值进行修正的方法流程图,参照图5,该方法可以包括:
步骤S500、通过设定预测模型预测指标数据值;
可选的,所预测的指标数据值可以是针对目标周期所预测的指标数据值;
可选的,本发明实施例可在预测指标数据值前,确定所述设定预测模型判决的统计量F值,将F与Fa比较,其中,F表示用历史周期的指标数据值计算的F统计量的值,Fa表示置信水平为1-α的F统计量的值;如果F≤Fa,则说明 所述设定预测模型的拟合效果较差,需要重新拟合该设定预测模型;否则,可确定所述设定预测模型的拟合较好,可以采用所述设定预测模型预测指标数据值,得到所预测的指标数据值。
步骤S510、根据所预测指标数据值及历史周期的指标数据值,确定指标数据值置信区间,所述指标数据值置信区间具有下区间值和上区间值,上区间值大于小区间值;
可选的,指标数据值置信区间可以是由下区间值和上区间值构成的范围区间;本发明实施例可以在置信水平1-α下,通过所预测指标数据值及历史周期的指标数据值构建置信区间;
可选的,指标数据值置信区间可以为,
可选的,若以Y表示留存率,则留存率的置信区间可以为,
步骤S520、如果所预测的指标数据值不大于所述小区间值,以所述小区间值修正所预测的指标数据值;如果所述小区间值小于所预测的指标数据值,且所预测的指标数据值不大于所述上区间值,则保留所预测的指标数据值;如果所预测的指标数据值大于所述上区间值,以所述上区间值修正所预测的指标数据值。
步骤S520得到的最终的指标数据值可作为评估时所用到的,目标周期的指标数据值。
为了让所预测的指标数据值在大概率下更接近真实值,本发明实施例可通过置信区间对所预测的指标数据值进行修正;可选的,以表示所预测的指标数据值,若则以替代进行修正;若则保留不进行修正;若则以替代进行修正。
本发明的发明研究发现,在现有的数据运营流程中,并没有对留存率和特权活跃率这两个数据指标进行评估的流程;下面则以对留存率和特权活跃率两个数据指标值进行评估为例,下面对本发明实施例提供的优选方案进行介绍;下文介绍主要分为留存率的评估,和对预测的留存率进行修正;
一、由于留存率数据存在严重滞后性的问题,对留存率与活跃率进行数据分析发现,t+1期留存率与t,t-1,…t-p期活跃率存在较高线性关系;为此,构建t+1期留存率与t期活跃率的时间序列模型,将对留存率的评估判断转化为对当期活跃率的评估;
以小样本情况为例,假设H0为第t期活跃率不达标,H1为第t期活跃率达标,并基于置信水平为1-α的t分布值确定标准下阈值X1;假设H11为第t期活跃率达标但不超标,H11为第t期活跃率超标,并基于功效水平为1-β的t分布值确定标准上阈值X2;
如果第t期活跃率小于X1,则活跃率未达标,如果第t期活跃率大于X1且小于X2,则活跃率达标但未超标,如果第t期活跃率大于X2,则活跃率超标。
二、通过留存率和活跃率历史数据回归得到时间序列模型的回归系数值,并得到实际的模型判决统计量F值。将F与Fa(其中,F表示用历史数据计算的F统计量的值,Fa表示置信水平为1-α的F统计量的值)进行比较,如果F≤Fa,说明模型拟合效果较差,需要重新拟合;否则,模型拟合较好,可以用该模型进行留存率预测。在置信水平1-α下,通过留存率历史数据构建留存率的置信区间:
为了让留存率预测的结果在大概率下更接近真实值,则需要通过上述留存率置信区间进行修正;修改方式包括:
向上修正,如果t期留存率预测值则用 替代作为t期留存率值;
不修正,如果则t期留存率值为此时不需要修正;
向下修正,如果则用替代作为t期留存率值。
下表4示出了修正预测值和未修正预测值情况下,所得到的指标数据值的误差缩减率的比较示意,可参照。
表4
其中,修正预测值的误差绝对期望=Σ(|修正预测值下的误差|×概率);未修正预测值的误差绝对期望=Σ(|未修正预测值下的误差|×概率);
期望误差缩减率=(未修正预测值的误差绝对期望-修正预测值的误差绝对期望)÷未修正预测值的误差绝对期望。
本发明实施例提供的数据评估方法,结合了单侧检验构建优劣性评估标准的特点,以及通过置信水平和功效水平给出评估标准动态阈值(上、下阀值),克服固定阈值评估标准不可变的缺点;进一步通过优化,使得评估结果细分为不达标、达标与超标,同时在小样本情况下使用t分布计算,避免小样本情况下正态分布不适用的问题;本发明实施例能够有效、准确的对指标数据值进行评估,实现诸如线上应用的活动运营效果评估等,为准确的进行应用资源优化、运营策略调整提供基础。
下面对本发明实施例提供的数据评估装置进行介绍,下文描述的数据评估装置可与上文描述的数据评估方法相互对应参照。
图6为本发明实施例提供的数据评估装置的结构框图,该数据评估装置可应用于服务器,参照图6,该数据评估装置可以包括:
指标数据值确定模块100,用于确定目标周期的指标数据值及历史周期的指标数据值;
下阈值确定模块200,用于根据所述目标周期的指标数据值的置信水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值;
第一比对模块300,用于将所述目标周期的指标数据值与所述标准下阈值进行比对;
第一评估结果确定模块400,用于在所述目标周期的指标数据值大于所述标准下阈值时,确定评估结果为指标数据值达标,在所述目标周期的指标数据值小于所述标准下阈值时,确定评估结果为指标数据值不达标。
可选的,下阈值确定模块200具体可用于:确定目标周期的指标数据值的样本容量类型对应的置信水平分布值;根据所确定的置信水平分布值,所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值。
更进一步,下阈值确定模块200具体可用于:根据所述目标周期的指标数据值及历史周期的指标数据值,确定指标数据均值及指标数据标准差;基于指标数据均值,指标数据标准差,所确定的置信水平分布值确定目标周期对应的标准下阈值。
优选的下阈值确定模块200具体可基于公式确定标准下阈值;其中,X1为目标周期对应的标准下阈值,Xavg为指标数据均值,Xstd为指标数据标准差,n为目标周期的指标数据值及历史周期的指标数据值的总个数,kα为与目标周期的指标数据值的样本容量类型对应的置信水平分布值。
可选的,如果目标周期的指标数据值的样本容量类型为第一样本容量,则下阈值确定模块所确定的与目标周期的指标数据值的样本容量类型对应的置信水平分布值,可以为置信水平第一类型分布值,所述置信水平第一类型分布值可以包括置信水平为1-α的t分布值;
相应的,下阈值确定模块具体可基于公式确定标准下阈值;其中,tα为置信水平为1-α的t分布值。
可选的,如果目标周期的指标数据值的样本容量类型为第二样本容量,则下阈值确定模块所确定的与目标周期的指标数据值的样本容量类型对应的置信水平分布值,可以为置信水平第二类型分布值,所述置信水平第二类型分布值可以包括置信水平为1-α的正态分布值;
相应的,下阈值确定模块具体可基于公式确定标准下阈值;其中,zα为置信水平为1-α的正态分布值。
可选的,图7示出了本发明实施例提供的数据评估装置的另一结构框图,结合图6和图7所示,该装置还可以包括:
上阈值确定模块500,用于根据所述目标周期的指标数据值的功效水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准上阈值,所述标准上阈值大于所述标准下阈值;
第二比对模块600,用于在所述目标周期的指标数据值大于所述标准下阈值时,将所述目标周期的指标数据值与所述标准上阈值比对;
第二评估结果确定模块700,用于在所述目标周期的指标数据值大于所述标准上阈值时,确定评估结果为指标数据值超标,在所述目标周期的指标数据值大于所述标准小阈值且小于所述标准上阈值时,确定评估结果为指标数据值达标但未超标。
可选的,上阈值确定模块500具体可用于:确定与目标周期的指标数据值的样本容量类型对应的功效水平分布值;根据所确定的功效水平分布值,所述目标周期的指标数据值及历史周期的指标数据值,确定目标周期对应的标准上阈值。
更进一步,上阈值确定模块500具体可用于:根据所述目标周期的指标数据值及历史周期的指标数据值,确定指标数据均值及指标数据标准差;基于指标数据均值,指标数据标准差,所确定的功效水平分布值确定目标周期对应的标准上阈值。
优选的上阈值确定模块500具体可基于公式确定标准上阈值;其中,X2为目标周期对应的标准下阈值,Xavg为指标数据均值,Xstd为指标数据标准差,n为目标周期的指标数据值及历史周期的指标数据值的总个数,kβ为与目标周期的指标数据值的样本容量类型对应的功效水平分布值。
可选的,如果目标周期的指标数据值的样本容量类型为第一样本容量,则上阈值确定模块所确定的与目标周期的指标数据值的样本容量类型对应的功效水平分布值,可以为功效水平第一类型分布值,所述功效水平第一类型分布值可以包括功效水平为1-β的t分布值;
相应的,上阈值确定模块具体可基于公式确定标准上阈值;其中,tβ为功效水平为1-β的t分布值。
可选的,如果目标周期的指标数据值的样本容量类型为第二样本容量,则上阈值确定模块所确定的与目标周期的指标数据值的样本容量类型对应的功效水平分布值,可以为功效水平第二类型分布值,所述功效水平第二类型分布值可以包括功效水平为1-β的正态分布值;
相应的,上阈值确定模块具体可基于公式确定标准上阈值;其中,zβ为功效水平为1-β的正态分布值。
可选的,图8示出了指标数据值确定模块100的可选结构,图8所示指标数据值确定模块100可用于确定目标周期的指标数据值,参照图8,指标数据值确定模块100可以包括:
预测单元110,用于通过设定预测模型预测目标周期的指标数据值;
置信区间确定单元120,用于根据所预测指标数据值及历史周期的指标数据值,确定指标数据值置信区间,所述指标数据值置信区间具有下区间值和上区间值,上区间值大于小区间值;
修正单元130,用于如果所预测的指标数据值不大于所述小区间值,以所述小区间值修正所预测的指标数据值;如果所述小区间值小于所预测的指标数据值,且所预测的指标数据值不大于所述上区间值,则保留所预测的指标数据值;如果所预测的指标数据值大于所述上区间值,以所述上区间值修正所预测的指标数据值。
可选的,本发明实施例提供的数据评估装置还可基于评估结果,优化应用资源。
本发明实施例提供的数据评估装置,能够提升指标数据值评估的准确性,为优化投入的应用资源、调整应用运营策略等提供数据支持。
本发明实施例还提供一种服务器,该服务器还可以包括上述所述的数据评估装置。
图9示出了本发明实施例提供的服务器的硬件结构框图,参照图9,该服务器可以包括:处理器1,通信接口2,存储器3和通信总线4;
其中处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
可选的,通信接口2可以为通信模块的接口,如GSM模块的接口;
处理器1,用于执行程序;
存储器3,用于存放程序;
程序可以包括程序代码,所述程序代码包括计算机操作指令。
处理器1可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
其中,程序可具体用于:
确定目标周期的指标数据值及历史周期的指标数据值;
根据所述目标周期的指标数据值的置信水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值;
将所述目标周期的指标数据值与所述标准下阈值进行比对;
在所述目标周期的指标数据值大于所述标准下阈值时,确定评估结果为指标数据值达标,在所述目标周期的指标数据值小于所述标准下阈值时,确定评估结果为指标数据值不达标。
可选的,程序还可进一步用于:
根据所述目标周期的指标数据值的功效水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准上阈值,所述标准上阈值大于所述标准下阈值;
在所述目标周期的指标数据值大于所述标准下阈值时,将所述目标周期的指标数据值与所述标准上阈值比对;
在所述目标周期的指标数据值大于所述标准上阈值时,确定评估结果为指标数据值超标,在所述目标周期的指标数据值大于所述标准小阈值且小于所述标准上阈值时,确定评估结果为指标数据值达标但未超标。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性 地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (18)
1.一种数据评估方法,其特征在于,包括:
确定目标周期的指标数据值及历史周期的指标数据值;
根据所述目标周期的指标数据值的置信水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值;
将所述目标周期的指标数据值与所述标准下阈值进行比对;
在所述目标周期的指标数据值大于所述标准下阈值时,确定评估结果为指标数据值达标,在所述目标周期的指标数据值小于所述标准下阈值时,确定评估结果为指标数据值不达标。
2.根据权利要求1所述的数据评估方法,其特征在于,所述根据置信水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值包括:
确定目标周期的指标数据值的样本容量类型对应的置信水平分布值;
根据所确定的置信水平分布值,所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值。
3.根据权利要求2所述的数据评估方法,其特征在于,所述根据所确定的置信水平分布值,所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值包括:
根据所述目标周期的指标数据值及历史周期的指标数据值,确定指标数据均值及指标数据标准差;
基于指标数据均值,指标数据标准差,所确定的置信水平分布值确定目标周期对应的标准下阈值。
4.根据权利要求3所述的数据评估方法,其特征在于,所述基于指标数据均值,指标数据标准差,所确定的置信水平分布值确定目标周期对应的标准下阈值包括:
根据公式确定标准下阈值;其中,X1为目标周期对应的标准下阈值,Xavg为指标数据均值,Xstd为指标数据标准差,n为目标周期的指标数据值及历史周期的指标数据值的总个数,kα为与目标周期的指标数据值的样本容量类型对应的置信水平分布值。
5.根据权利要求2-4任一项所述的数据评估方法,其特征在于,所述确定目标周期的指标数据值的样本容量类型对应的置信水平分布值包括:
在目标周期的指标数据值的样本容量类型为第一样本容量时,确定置信水平第一类型分布值,所述置信水平第一类型分布值包括置信水平为1-α的t分布值。
6.根据权利要求2-4任一项所述的数据评估方法,其特征在于,所述确定目标周期的指标数据值的样本容量类型对应的置信水平分布值包括:
在目标周期的指标数据值的样本容量类型为第二样本容量时,确定置信水平第二类型分布值,所述置信水平第二类型分布值包括置信水平为1-α的正态分布值。
7.根据权利要求1所述的数据评估方法,其特征在于,还包括:
根据所述目标周期的指标数据值的功效水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准上阈值,所述标准上阈值大于所述标准下阈值;
在所述目标周期的指标数据值大于所述标准下阈值时,将所述目标周期的指标数据值与所述标准上阈值比对;
在所述目标周期的指标数据值大于所述标准上阈值时,确定评估结果为指标数据值超标,在所述目标周期的指标数据值大于所述标准小阈值且小于所述标准上阈值时,确定评估结果为指标数据值达标但未超标。
8.根据权利要求7所述的数据评估方法,其特征在于,所述根据功效水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准上阈值包括:
确定与目标周期的指标数据值的样本容量类型对应的功效水平分布值;
根据所确定的功效水平分布值,所述目标周期的指标数据值及历史周期的指标数据值,确定目标周期对应的标准上阈值。
9.根据权利要求8所述的数据评估方法,其特征在于,所述根据所确定的功效水平分布值,所述目标周期的指标数据值及历史周期的指标数据值,确定目标周期对应的标准上阈值包括:
根据所述目标周期的指标数据值及历史周期的指标数据值,确定指标数据均值及指标数据标准差;
基于指标数据均值,指标数据标准差,所确定的功效水平分布值确定目标周期对应的标准上阈值。
10.根据权利要求9所述的数据评估方法,其特征在于,所述基于指标数据均值,指标数据标准差,所确定的功效水平分布值确定目标周期对应的标准上阈值包括:
根据公式确定标准上阈值;其中,X2为目标周期对应的标准上阈值,Xavg为指标数据均值,Xstd为指标数据标准差,n为目标周期的指标数据值及历史周期的指标数据值的总个数,kβ为与目标周期的指标数据值的样本容量类型对应的功效水平分布值。
11.根据权利要求8-10任一项所述的数据评估方法,其特征在于,所述确定与目标周期的指标数据值的样本容量类型对应的功效水平分布值包括:
在目标周期的指标数据值的样本容量类型为第一样本容量时,确定功效水平第一类型分布值,所述功效水平第一类型分布值包括功效水平为1-β的t分布值。
12.根据权利要求8-10任一项所述的数据评估方法,其特征在于,所述确定与目标周期的指标数据值的样本容量类型对应的功效水平分布值包括:
在目标周期的指标数据值的样本容量类型为第二样本容量时,确定功效水平第二类型分布值,所述功效水平第二类型分布值包括功效水平为1-β的正态分布值。
13.根据权利要求1所述的数据评估方法,其特征在于,所述确定目标周期的指标数据值包括:
通过设定预测模型预测目标周期的指标数据值;
根据所预测指标数据值及历史周期的指标数据值,确定指标数据值置信区间,所述指标数据值置信区间具有下区间值和上区间值,上区间值大于小区间值;
如果所预测的指标数据值不大于所述小区间值,以所述小区间值修正所预测的指标数据值;如果所述小区间值小于所预测的指标数据值,且所预测的指标数据值不大于所述上区间值,则保留所预测的指标数据值;如果所预测的指标数据值大于所述上区间值,以所述上区间值修正所预测的指标数据值。
14.根据权利要求1或7所述的数据评估方法,其特征在于,还包括:
基于评估结果,优化应用资源。
15.一种数据评估装置,其特征在于,包括:
指标数据值确定模块,用于确定目标周期的指标数据值及历史周期的指标数据值;
下阈值确定模块,用于根据所述目标周期的指标数据值的置信水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准下阈值;
第一比对模块,用于将所述目标周期的指标数据值与所述标准下阈值进行比对;
第一评估结果确定模块,用于在所述目标周期的指标数据值大于所述标准下阈值时,确定评估结果为指标数据值达标,在所述目标周期的指标数据值小于所述标准下阈值时,确定评估结果为指标数据值不达标。
16.根据权利要求15所述的数据评估装置,其特征在于,还包括:
上阈值确定模块,用于根据所述目标周期的指标数据值的功效水平分布值、所述目标周期的指标数据值及历史周期的指标数据值,确定所述目标周期对应的标准上阈值,所述标准上阈值大于所述标准下阈值;
第二比对模块,用于在所述目标周期的指标数据值大于所述标准下阈值时,将所述目标周期的指标数据值与所述标准上阈值比对;
第二评估结果确定模块,用于在所述目标周期的指标数据值大于所述标准上阈值时,确定评估结果为指标数据值超标,在所述目标周期的指标数据值大于所述标准小阈值且小于所述标准上阈值时,确定评估结果为指标数据值达标但未超标。
17.根据权利要求15所述的数据评估装置,其特征在于,所述指标数据值确定模块包括:
预测单元,用于通过设定预测模型预测目标周期的指标数据值;
置信区间确定单元,用于根据所预测指标数据值及历史周期的指标数据值,确定指标数据值置信区间,所述指标数据值置信区间具有下区间值和上区间值,上区间值大于小区间值;
修正单元,用于如果所预测的指标数据值不大于所述小区间值,以所述小区间值修正所预测的指标数据值;如果所述小区间值小于所预测的指标数据值,且所预测的指标数据值不大于所述上区间值,则保留所预测的指标数据值;如果所预测的指标数据值大于所述上区间值,以所述上区间值修正所预测的指标数据值。
18.一种服务器,其特征在于,包括权利要求15-17任一项所述的数据评估装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610363840.3A CN106096226B (zh) | 2016-05-27 | 2016-05-27 | 一种数据评估方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610363840.3A CN106096226B (zh) | 2016-05-27 | 2016-05-27 | 一种数据评估方法、装置及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106096226A true CN106096226A (zh) | 2016-11-09 |
CN106096226B CN106096226B (zh) | 2018-12-11 |
Family
ID=57230129
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610363840.3A Active CN106096226B (zh) | 2016-05-27 | 2016-05-27 | 一种数据评估方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106096226B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106803137A (zh) * | 2017-01-25 | 2017-06-06 | 东南大学 | 城市轨道交通afc系统实时进站客流量异常检测方法 |
CN107218964A (zh) * | 2017-05-23 | 2017-09-29 | 中国人民解放军国防科学技术大学 | 一种试验子样容量性状的判定方法 |
CN109101509A (zh) * | 2017-06-20 | 2018-12-28 | 中兴通讯股份有限公司 | 数据准确性检测方法、装置、服务器及计算机存储介质 |
CN110069364A (zh) * | 2019-04-17 | 2019-07-30 | 中广核核电运营有限公司 | 备件数据纠错方法、装置、计算机设备和存储介质 |
CN110278121A (zh) * | 2018-03-15 | 2019-09-24 | 中兴通讯股份有限公司 | 一种检测网络性能异常的方法、装置、设备及存储介质 |
CN110472891A (zh) * | 2019-08-26 | 2019-11-19 | 上海蔚来汽车有限公司 | 加电服务能力或资源的评估或管理方法、系统和存储介质 |
WO2020015216A1 (zh) * | 2018-07-19 | 2020-01-23 | 平安科技(深圳)有限公司 | 参数阈值确定方法、装置及计算机存储介质 |
CN112988719A (zh) * | 2019-12-02 | 2021-06-18 | 金色熊猫有限公司 | 一种数据质量检测方法、装置、可读介质及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020046002A1 (en) * | 2000-06-10 | 2002-04-18 | Chao Tang | Method to evaluate the quality of database search results and the performance of database search algorithms |
US20050096850A1 (en) * | 2003-11-04 | 2005-05-05 | Center For Advanced Science And Technology Incubation, Ltd. | Method of processing gene expression data and processing program |
CN104112076A (zh) * | 2014-07-17 | 2014-10-22 | 清华大学 | 基于模糊数学的运行风险评估方法及评估系统 |
CN104123468A (zh) * | 2014-07-25 | 2014-10-29 | 华北电力大学(保定) | 基于核心状态量集合的配电变压器状态评估方法 |
CN104933299A (zh) * | 2015-06-03 | 2015-09-23 | 浪潮软件集团有限公司 | 一种数据处理的方法及装置 |
CN105488331A (zh) * | 2015-11-23 | 2016-04-13 | 东软熙康健康科技有限公司 | 数据处理方法及装置 |
-
2016
- 2016-05-27 CN CN201610363840.3A patent/CN106096226B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020046002A1 (en) * | 2000-06-10 | 2002-04-18 | Chao Tang | Method to evaluate the quality of database search results and the performance of database search algorithms |
US20050096850A1 (en) * | 2003-11-04 | 2005-05-05 | Center For Advanced Science And Technology Incubation, Ltd. | Method of processing gene expression data and processing program |
CN104112076A (zh) * | 2014-07-17 | 2014-10-22 | 清华大学 | 基于模糊数学的运行风险评估方法及评估系统 |
CN104123468A (zh) * | 2014-07-25 | 2014-10-29 | 华北电力大学(保定) | 基于核心状态量集合的配电变压器状态评估方法 |
CN104933299A (zh) * | 2015-06-03 | 2015-09-23 | 浪潮软件集团有限公司 | 一种数据处理的方法及装置 |
CN105488331A (zh) * | 2015-11-23 | 2016-04-13 | 东软熙康健康科技有限公司 | 数据处理方法及装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106803137A (zh) * | 2017-01-25 | 2017-06-06 | 东南大学 | 城市轨道交通afc系统实时进站客流量异常检测方法 |
CN107218964A (zh) * | 2017-05-23 | 2017-09-29 | 中国人民解放军国防科学技术大学 | 一种试验子样容量性状的判定方法 |
CN107218964B (zh) * | 2017-05-23 | 2020-01-24 | 中国人民解放军国防科学技术大学 | 一种试验子样容量性状的判定方法 |
CN109101509A (zh) * | 2017-06-20 | 2018-12-28 | 中兴通讯股份有限公司 | 数据准确性检测方法、装置、服务器及计算机存储介质 |
CN110278121A (zh) * | 2018-03-15 | 2019-09-24 | 中兴通讯股份有限公司 | 一种检测网络性能异常的方法、装置、设备及存储介质 |
WO2020015216A1 (zh) * | 2018-07-19 | 2020-01-23 | 平安科技(深圳)有限公司 | 参数阈值确定方法、装置及计算机存储介质 |
CN110069364A (zh) * | 2019-04-17 | 2019-07-30 | 中广核核电运营有限公司 | 备件数据纠错方法、装置、计算机设备和存储介质 |
CN110472891A (zh) * | 2019-08-26 | 2019-11-19 | 上海蔚来汽车有限公司 | 加电服务能力或资源的评估或管理方法、系统和存储介质 |
CN110472891B (zh) * | 2019-08-26 | 2023-10-17 | 上海蔚来汽车有限公司 | 加电服务能力或资源的评估或管理方法、系统和存储介质 |
CN112988719A (zh) * | 2019-12-02 | 2021-06-18 | 金色熊猫有限公司 | 一种数据质量检测方法、装置、可读介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN106096226B (zh) | 2018-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106096226B (zh) | 一种数据评估方法、装置及服务器 | |
CN110880984B (zh) | 基于模型的流量异常监测方法、装置、设备及存储介质 | |
Colas et al. | How many random seeds? statistical power analysis in deep reinforcement learning experiments | |
CN108364195B (zh) | 用户留存概率预测方法、装置、预测服务器及存储介质 | |
CN112188531B (zh) | 异常检测方法、装置、电子设备及计算机存储介质 | |
Biesanz et al. | Assessing mediational models: Testing and interval estimation for indirect effects | |
US9996444B2 (en) | Automated methods and systems for calculating hard thresholds | |
US11778255B2 (en) | Methods and apparatus to determine probabilistic media viewing metrics | |
EP3690767A1 (en) | Method and apparatus for determining risk management decision-making critical values | |
CN106612511B (zh) | 一种基于支持向量机的无线网络吞吐量的评估方法及装置 | |
CN109426655B (zh) | 数据分析方法、装置、电子设备及计算机可读存储介质 | |
US20140278236A1 (en) | Techniques for automated bayesian posterior sampling using markov chain monte carlo and related schemes | |
CN111967717A (zh) | 一种基于信息熵值的数据质量评价方法 | |
François et al. | The permutation test for feature selection by mutual information. | |
CN113270107A (zh) | 音频信号中噪声响度的获取方法、装置和电子设备 | |
US20130275816A1 (en) | Identifying a dimension associated with an abnormal condition | |
CN110602207A (zh) | 基于离网预测推送信息的方法、装置、服务器和存储介质 | |
CN113516453A (zh) | 建设项目投资资金管控预警方法、装置、设备及介质 | |
TWI592810B (zh) | 衡量二元資料於時間等級的群聚級別的無母數分析方法 | |
CN106713322A (zh) | 一种面向网络设备信息安全评估的模糊度量方法 | |
CN111258863B (zh) | 数据异常检测方法、装置、服务器和计算机可读存储介质 | |
CN111783883A (zh) | 一种异常数据的检测方法及装置 | |
CN111258866A (zh) | 计算机性能预测方法、装置、设备及可读存储介质 | |
CN105554798B (zh) | 一种基站优先级确定方法及优先级确定装置 | |
CN112565275B (zh) | 一种网络安全场景的异常检测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |