CN103761282A - 一种检验数据一致性的方法、装置 - Google Patents

一种检验数据一致性的方法、装置 Download PDF

Info

Publication number
CN103761282A
CN103761282A CN201410012550.5A CN201410012550A CN103761282A CN 103761282 A CN103761282 A CN 103761282A CN 201410012550 A CN201410012550 A CN 201410012550A CN 103761282 A CN103761282 A CN 103761282A
Authority
CN
China
Prior art keywords
data
group
hypothesis
test statistics
numbering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410012550.5A
Other languages
English (en)
Inventor
李京辉
孟照方
陈崴嵬
黄志勇
郭景赞
饶栋
赵剑雄
杨杉
徐乐西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201410012550.5A priority Critical patent/CN103761282A/zh
Publication of CN103761282A publication Critical patent/CN103761282A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2135Metering

Abstract

本发明实施例提供一种检验数据一致性的方法、装置,涉及信息安全领域,用于利用数据对之间的关联性实现运维支撑系统中数据一致性的检验。所述方法包括:采集运维支撑系统中的待检验的两组数据,设置第一假设,第二假设和检验水准α,所述第一假设为所述第一组数据和所述第二组数据一致;所述第二假设为所述第一组数据和所述第二组数据不一致;根据威尔科克森Wilcoxon符号秩方法确定检验统计量T;在所述预定数目n小于等于临界数目的情况下,按照双侧检验水准α查找秩和检验界值表,获取临界值Tα;如果所述检验统计量T大于所述临界值Tα,接收所述第一假设。本发明实施例适用于对运维支撑系统数据进行一致性分析的情景。

Description

一种检验数据一致性的方法、装置
技术领域
本发明涉及信息安全领域,尤其涉及一种检验数据一致性的方法、装置。
背景技术
目前,运维支撑系统主要包括网管系统和网络优化系统,该运维支撑系统为网络的网络监控、数据管理和数据分析等方面提供了重要手段,为运维人员在网络质量监控、评估、维护、规划优化等工作中提供了有力的支撑。
如图1所示,在网管系统中,源设备发出数据,该数据可以分为性能数据、配置数据、告警数据等多种类型,该数据流经操作维护中心(Operation and Maintenance Center,OMC),省份平台,总部平台,在数据流转过程中,需要对总部平台与省份平台上的KPI(KeyPerformance Indicator,关键绩效指标)数据进行一致性的检验,还需要对省分份平台和OMC上的KPI数据进行进行一致性的检验;在网络优化系统中的数据流转的过程与网管系统中相同,同样也需要对省份平台和总部平台中流转的KPI数据进行一致性的检验,从而保证数据流转过程中不会出现错误、缺失等情况。
通常,在运维支撑系统数据一致性检验方法中,主要是看每一对数据的差值是否在要求的第一阈值内,如果在,则认为一致;否则认为不一致。
但是,现有技术中的算法中,注重单个数据对之间的差值运算,也就是只注重单个数据对的关系,没有考虑数据对之间的关联性。
发明内容
本发明的实施例提供一种检验数据一致性的方法、装置,用于利用数据对之间的关联性实现运维支撑系统中数据一致性的检验。
为达到上述目的,本发明的实施例采用如下技术方案:
一方面,提供一种检验数据一致性的方法,所述方法包括:
采集运维支撑系统中的待检验的两组数据,第一组数据包括预定数目n的第一数据;第二组数据包括所述预定数目n的第二数据,所述第一数据和所述第二数据根据采集顺序依次形成所述预定数目n个数据对;
设置第一假设,第二假设和检验水准α,所述第一假设为所述第一组数据和所述第二组数据一致;所述第二假设为所述第一组数据和所述第二组数据不一致;所述检验水准α表征所述第二假设的概率;
根据威尔科克森Wilcoxon符号秩方法确定检验统计量T;
在所述预定数目n小于等于临界数目的情况下,按照双侧检验水准α查找秩和检验界值表,获取临界值Tα;如果所述检验统计量T大于所述临界值Tα,接收所述第一假设,如果所述检验统计量T小于所述临界值Tα,拒绝所述第一假设。
另一方面,提供一种检验数据一致性的装置,所述装置包括:采集单元,设置单元,确定单元和第一检验单元;
所述采集单元用于采集运维支撑系统中的待检验的两组数据,第一组数据包括预定数目的第一数据;第二组数据包括所述预定数目的第二数据,所述第一数据和所述第二数据根据采集顺序依次形成所述预定数目n个数据对;
所述设置单元用于设置第一假设,第二假设和检验水准α,所述第一假设为所述第一组数据和所述第二组数据一致;所述第二假设为所述第一组数据和所述第二组数据不一致;所述检验水准α表征所述第二假设的概率;
所述确定单元用于根据威尔科克森Wilcoxon符号秩方法确定检验统计量T;
所述第一检验单元用于在所述预定数目小于等于临界数目的情况下,按照双侧检验水准α查找秩和检验界值表,获取临界值Tα;如果所述检验统计量T大于所述临界值Tα,接收所述第一假设,如果所述检验统计量T小于所述临界值Tα,拒绝所述第一假设。
本发明提供一种检验数据一致性的方法和装置,在运维支撑系统中获取第一组数据和第二组数据,设置两组数据一致和不一致的假设,根据Wilcoxon符号秩方法确定检验统计量T,该方法将各数据对差值之间进行编秩,并将编秩之后正秩和与负秩和中的绝对值较小者确定为统计量,在所述预定数目n小于等于临界数目的情况下,通过所述检验统计量T与临界值Tα的比较确定第一组数据与第二组数据是否一致,这样,通过采用Wilcoxon符号秩方法使得本发明充分利用数据对之间的关联性,从而实现运维支撑系统中数据一致性的检验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的网管系统中的数据流转示意图;
图2为本发明实施例提供的一种检验数据一致性的方法;
图3为本发明实施例提供的另一种检验数据一致性的方法;
图4为本发明实施例提供的另一种检验数据一致性的方法;
图5为本发明实施例提供的一种检验数据一致性的装置。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例提供一种检验数据一致性的方法,如图2所示,所述方法包括:以下步骤101~104:
101、采集运维支撑系统中的待检验的两组数据,第一组数据包括预定数目n的第一数据;第二组数据包括所述预定数目n的第二数据,所述第一数据和所述第二数据根据采集顺序依次形成所述预定数目n个数据对。
102、设置第一假设,第二假设和检验水准α,所述第一假设为所述第一组数据和所述第二组数据一致;所述第二假设为所述第一组数据和所述第二组数据不一致;所述检验水准α表征所述第二假设的概率。
103、根据威尔科克森Wilcoxon符号秩方法确定检验统计量T。
104、在所述预定数目n小于等于临界数目的情况下,按照双侧检验水准α查找秩和检验界值表,获取临界值Tα;如果所述检验统计量T大于所述临界值Tα,接收所述第一假设,如果所述检验统计量T小于所述临界值Tα,拒绝所述第一假设。
本发明提供一种检验数据一致性的方法,在运维支撑系统中获取第一组数据和第二组数据,设置两组数据一致和不一致的假设,根据Wilcoxon符号秩方法确定检验统计量T,该方法将各数据对差值之间进行编秩,并将编秩之后正秩和与负秩和中的绝对值较小者确定为统计量,该符号秩方法利用了数据对之间的关联性,在所述预定数目n小于等于临界数目的情况下,通过所述检验统计量T与临界值Tα的比较确定第一组数据与第二组数据是否一致,这样,通过采用Wilcoxon符号秩方法使得本发明充分利用数据对之间的关联性,从而实现运维支撑系统中数据一致性的检验。
实施例二
本发明实施例提供一种检验数据一致性的方法;如图3所示,所述方法包括:以下步骤201~206;
201、采集运维支撑系统中的待检验的两组数据,第一组数据包括预定数目n的第一数据;第二组数据包括所述预定数目n的第二数据,所述第一数据和所述第二数据根据采集顺序依次形成所述预定数目n个数据对。从而,在第一组数据中的第i个第一数据,与第二组数据中的第i个第二数据相对应,1≤i≤n。
需要说明的是,在本发明实施例中,在采集两组数据过程中,采集条件相同,包括采集的时间,采集链路和过滤条件等。在相同的采集条件下所采集第一组数据和第二组数据都为同一源设备所发送的数据中的KPI数据。所述KPI数据包括TCH(请求次数)或SDCCH(占用成功次数)等统计指标数据。
在本发明中,从同一源设备发出的数据,经过在运维支撑系统的网络优化系统中的流转,所述第一组数据可以为所述数据流转到总部平台之后所述数据中的KPI数据,所述第二组数据为所述数据流转到省份平台之后所述数据中的KPI数据;或者,所述第一组数据为所述数据流转到省份平台之后所述数据中的KPI数据,所述第二组数据为所述数据流转到OMC之后所述数据中的KPI数据。
同样,第一组数据和第二组数据还可以为在网管系统中各平台之间流转的数据中的KPI数据。另外,第一组数据也可以为源设备发送数据至网络优化系统的省份平台之后所述数据中的KPI数据,所述第二组数据为同一源设备发送所述数据至网管系统的省份平台之后所述数据的KPI数据等。
202、设置第一假设,第二假设和检验水准α,所述第一假设为所述第一组数据和所述第二组数据一致;所述第二假设为所述第一组数据和所述第二组数据不一致;所述检验水准α表征所述第二假设的概率。
203、根据威尔科克森Wilcoxon符号秩方法确定检验统计量T。
具体的,在实现以上步骤203的过程中,通过以下步骤3001~3008实现。
3001、求取第一数据与相对应的第二数据的差值,得到差值数据。
3002、将各个差值数据取绝对值。
3004、根据绝对值大小,对各个差值数据进行编号,获取编号数据。
在存在相同绝对值的情况下,将相同绝对值的差值数据的编号求平均,得到平均值;将所述平均值替代所述相同绝对值的差值数据的编号,得到编号数据。
如表1,第一组数据与第二组数据存在相同绝对值的情况,相同绝对值的差值数据的编号为2,3,4,5;平均值3.5。
表1
采集时间 10:00 11:00 12:00 13:00 14:00 15:00 16:00
第一组数据 300 300 300 332 340 323 300
第二组数据 303 303 303 320 316 322 303
差值数据 -3 -3 -3 12 24 1 -3
绝对值 3 3 3 12 24 1 3
编号 2 3 4 6 7 1 5
编号数据 3.5 3.5 3.5 6 7 1 3.5
编秩数据 -3.5 -3.5 -3.5 6 7 1 -3.5
在不存在相同绝对值的情况下,根据所述绝对值大小,按照从小到大顺序,对各个差值数据进行编号,得到编号数据。如表2,第一组数据与第二组数据不存在相同绝对值的情况。
表2
采集时间 10:00 11:00 12:00 13:00 14:00 15:00 16:00
第一组数据 300 300 300 332 340 323 300
第二组数据 302 304 305 320 316 322 306
差值数据 -3 -4 -5 12 24 1 -6
绝对值 3 4 5 12 24 1 6
编号 2 3 4 6 7 1 5
编号数据 2 3 4 6 7 1 5
编秩数据 -2 -3 -4 6 7 1 -5
3005、根据所述差值数据的符号配置各个编号数据的符号。
3006、将带符号的编号数据确定为编秩数据。
3007、求取所述编秩数据中的各个正秩数据之和,得到正秩和,并且求取所述编秩数据中的各个负秩数据之和,得到负秩和。
3008、将所述正秩和与所述负秩和中的绝对值较小者确定为检验统计量T。根据上述表1,得到正秩和为14,负秩和-14,T为14。
可见,在n小于等于临界数目的情况下,通过以上步骤203在Wilcoxon符号秩方法中,将各数据对差值之间进行编秩,并将编秩之后正秩和与负秩和中的绝对值较小者确定为检验统计量。
204、判断所述预定数目n是否小于临界数目,在判断结果为是的情况下执行205;在判断结果为否的情况下,执行206和207。
205、在所述预定数目n小于等于临界数目的情况下,按照双侧检验水准α查找秩和检验界值表,获取临界值Tα;如果所述检验统计量T大于所述临界值Tα,接收所述第一假设,如果所述检验统计量T小于所述临界值Tα,拒绝所述第一假设。
优选的,所述临界数目为25。
例如,检验水准α为0.05,根据表1提供的数据,预定数目n为7,根据秩和检验界值表,如表3,可以得到临界值Tα为2,检验统计量T为14大于2,则,接收第一组数据与第二组数据一致的假设。
表3
Figure BDA0000455678410000071
Figure BDA0000455678410000081
本发明实施例对于小于临界数目的两组数据对,进行了Wilcoxon符号秩方法的有效检验,避免了现有技术的方法当数目小于25时每组数据对检验时偶然波动性因素较大。
206、在所述预定数目n大于临界数目的情况下,根据所述检验统计量T,所述数据对的数目n得到统计均值U。
207、根据所述检验水准α,从正态分布表获取分位点Z,如果所述统计均值U小于等于所述分位点Z,接收第一假设;如果所述统计均值U大于所述分位点Z,拒绝所述第一假设。
本发明实施例提供一种检验数据一致性的方法,运维支撑系统中获取第一组数据和第二组数据,设置两组数据一致和不一致的假设,根据Wilcoxon符号秩方法确定检验统计量T,在所述预定数目n小于等于临界数目的情况下,通过所述检验统计量T与临界值Tα的比较确定第一组数据与第二组数据是否一致,在所述预定数目n大于临界数目的情况下,采用近似正态分布方法进行统计分析,在检验过程中通过采用Wilcoxon符号秩方法确定检验统计量,使得本发明充分利用数据对之间的关联性,从而实现运维支撑系统中数据一致性的检验。
实施例三
本发明实施例提供一种检验数据一致性的方法,本发明实施例在数据对的预定数目n大于临界数目的情况下进行具体分析。如图4所示,所述方法包括:以下步骤301~306;
301、采集运维支撑系统中的待检验的两组数据,第一组数据包括预定数目n的第一数据;第二组数据包括所述预定数目n的第二数据,所述第一数据和所述第二数据根据采集顺序依次形成所述预定数目n个数据对。
例如,表4示出第一组数据为网络优化系统总部平台数据,第二组数据为省份平台数据,并且第一组数据与第二组数据中数据对数目n为40,临界数目25,40大于临界数目25。
表4
总部平台 省份平台 总部平台 省份平台
1431 1430 190 192
353 349 135 137
309 311 873 872
370 372 93 95
159 161 93 95
551 548 17 14
10 7 52 54
25 24 154 156
15 14 167 165
313 316 45 46
3 7 201 203
1 3 48 50
163 158 79 82
160 155 46 48
189 188 89 91
147 146 44 46
222 225 141 139
104 107 21 22
127 125 195 199
50 48 163 165
302、设置第一假设,第二假设和检验水准α,所述第一假设为所述第一组数据和所述第二组数据一致;所述第二假设为所述第一组数据和所述第二组数据不一致;在本发明实施例中假设α为0.05。
303、根据威尔科克森Wilcoxon符号秩方法确定检验统计量T。
具体的,在实现以上步骤303的方法与上述实施例获取编秩数据的方法一秩,在此不再赘述。
如表5所示,网管系统中,总部平台数据和省份平台数据的差值数据和编秩数据。
表5
Figure BDA0000455678410000111
根据表5数据,得到正秩和323.5,负秩和-507,检验统计量T为323.5。
304、在各个编秩数据中存在相同秩次时,获取校正量;所述校正量为∑(ti 3-ti),其中ti为第i个相同秩次的个数;例如,如果存在相同秩次为:3.5,3.5,6,6,6,则校正量为∑(ti 3-ti)=(23-2)+(33-3)=30。
305、根据所述校正量,所述检验统计量T,所述数据对的数目n,确定统计均值U;所述统计均值U为
Figure BDA0000455678410000112
需要说明的是,根据本发明实施例提供的数据存在相同秩次,因此需要获取校正量,并根据校正量获取统计均值U,在所述编秩数据中不存在相同秩次时,根据所述检验统计量T,所述数据对的数目n,确定统计均值U;所述统计均值U为
可见,本发明在n大于临界数目的情况下,通过采用Wilcoxon符号秩方法对各数据对差值之间进行编秩,并将编秩之后的绝对值较小者确定为检验统计量T,充分考虑了数据对之间的关联性。
306、根据所述检验水准α,从正态分布表获取分位点Z,如果所述统计均值U小于等于所述分位点Z,接收第一假设;如果所述统计均值U大于所述分位点Z,拒绝所述第一假设。
例如,将由表5得到的T=323.5,n=40,根据统计均值U计算公式,得到U=1.176,根据正态分布表,得到Z=1.65,可见U小于Z,按照α为0.05的水平接收第一假设,则第一组数据总部平台数据和第二组数据省份平台数据一致。
本发明实施例提供一种检验数据一致性的方法,运维支撑系统中获取第一组数据和第二组数据,设置两组数据一致和不一致的假设,根据Wilcoxon符号秩方法确定检验统计量T,在所述预定数目n大于临界数目的情况下,采用近似正态分布方法进行统计分析,而现有技术中,根据所有数据对中存在的不一致数据对的比率决定第一组数据和第二组数据是否一致,从而实现运维支撑系统中数据一致性的检验;可见,本发明通过采用Wilcoxon符号秩方法确定检验统计量,该符号秩方法对各数据对差值之间进行编秩并将编秩之后的绝对值较小者确定为检验统计量,充分考虑了数据对之间的关联性,进一步通过正态分布方法进行统计分析,从而实现一致性检验。
实施例四
本发明实施例提供一种检验数据一致性的装置10,如图5所示,所述装置10包括:采集单元11,设置单元12,确定单元13和第一检验单元14;
所述采集单元11用于采集运维支撑系统中的待检验的两组数据,第一组数据包括预定数目n的第一数据;第二组数据包括所述预定数目n的第二数据,所述第一数据和所述第二数据根据采集顺序依次形成所述预定数目n个数据对;
所述设置单元12用于设置第一假设,第二假设和检验水准α,所述第一假设为所述第一组数据和所述第二组数据一致;所述第二假设为所述第一组数据和所述第二组数据不一致;所述检验水准α表征所述第二假设的概率;
所述确定单元13用于根据威尔科克森Wilcoxon符号秩方法确定检验统计量T;优选的,所述确定单元13具体用于:
求取第一数据与相对应的第二数据的差值,得到差值数据;
将各个差值数据取绝对值;
根据绝对值大小,对各个差值数据进行编号,获取编号数据;
根据所述差值数据的符号配置各个编号数据的符号;
将带符号的编号数据确定为编秩数据;
求取所述编秩数据中的各个正秩数据之和,得到正秩和,并且求取所述编秩数据中的各个负秩数据之和,得到负秩和;
将所述正秩和与所述负秩和中的绝对值较小者确定为检验统计量T。
所述第一检验单元14用于在所述预定数目n小于等于临界数目的情况下,按照双侧检验水准α查找秩和检验界值表,获取临界值T;如果所述检验统计量T大于所述临界值Tα,接收所述第一假设,如果所述检验统计量T小于所述临界值Tα,拒绝所述第一假设。优选的,所述临界数目为25。
进一步的,所述装置10还包括:第二检验单元15;
所述第二检验单元15用于:在所述预定数目n大于临界数目的情况下,根据所述检验统计量T,所述数据对的数目n得到统计均值U;
根据所述检验水准α,从正态分布表获取分位点Z,如果所述统计均值U小于等于所述分位点Z,接收第一假设;如果所述统计均值U大于所述分位点Z,拒绝所述第一假设。
所述第二检验单元15具体用于:
在所述编秩数据中不存在相同秩次时,所述检验统计量T,所述数据对的数目n,确定统计均值U;所述统计均值U为
Figure BDA0000455678410000131
在各个编秩数据中存在相同秩次时,获取校正量;所述校正量为∑(ti 3-ti),其中ti为第i个相同秩次的个数;
根据所述校正量,所述检验统计量T,所述数据对的数目n,确定统计均值U;所述统计均值U为
Figure BDA0000455678410000132
优选的,所述确定单元13具体用于:
在存在相同绝对值的情况下,将相同绝对值的差值数据的编号求平均,得到平均值;将所述平均值替代所述相同绝对值的差值数据的编号,得到编号数据;
在不存在相同绝对值的情况下,根据所述绝对值大小,按照从小到大顺序,对各个差值数据进行编号,得到编号数据。
本发明实施例提供一种检验数据一致性的装置,通过采集单元获取第一组数据和第二组数据,通过设置单元设置两组数据一致和不一致的假设,通过确定单元根据Wilcoxon符号秩方法确定检验统计量T,通过第一检验单元在所述预定数目n小于等于临界数目的情况下,通过所述检验统计量T与临界值Tα的比较确定第一组数据与第二组数据是否一致,通过第二检验单元在所述预定数目n大于临界数目的情况下,采用近似正态分布方法进行统计分析,可见,本发明在n大于临界数目或者小于等于临界数目的情况下,通过采用Wilcoxon符号秩方法确定检验统计量,该符号秩方法对各数据对差值之间进行编秩,并将编秩之后正秩和与负秩和中的绝对值较小者确定为检验统计量,充分考虑了数据对之间的关联性,进一步通过正态分布方法进行统计分析,从而实现一致性检验。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种检验数据一致性的方法,其特征在于,所述方法包括:
采集运维支撑系统中的待检验的两组数据,第一组数据包括预定数目n的第一数据;第二组数据包括所述预定数目n的第二数据,所述第一数据和所述第二数据根据采集顺序依次形成所述预定数目n个数据对;
设置第一假设,第二假设和检验水准α,所述第一假设为所述第一组数据和所述第二组数据一致;所述第二假设为所述第一组数据和所述第二组数据不一致;所述检验水准α表征所述第二假设的概率;
根据威尔科克森Wilcoxon符号秩方法确定检验统计量T;
在所述预定数目n小于等于临界数目的情况下,按照双侧检验水准α查找秩和检验界值表,获取临界值Tα;如果所述检验统计量T大于所述临界值Tα,接收所述第一假设,如果所述检验统计量T小于所述临界值Tα,拒绝所述第一假设。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述预定数目大于临界数目的情况下,根据所述检验统计量T,所述数据对的数目n得到统计均值U;
根据所述检验水准α,从正态分布表获取分位点Z,如果所述统计均值U小于等于所述分位点Z,接收第一假设;如果所述统计均值U大于所述分位点Z,拒绝所述第一假设。
3.根据权利要求2所述的方法,其特征在于,所述根据威尔科克森Wilcoxon符号秩方法确定检验统计量T;具体包括
求取第一数据与相对应的第二数据的差值,得到差值数据;
将各个差值数据取绝对值;
根据绝对值大小,对各个差值数据进行编号,获取编号数据;
根据所述差值数据的符号配置各个编号数据的符号;
将带符号的编号数据确定为编秩数据;
求取所述编秩数据中的各个正秩数据之和,得到正秩和,并且求取所述编秩数据中的各个负秩数据之和,得到负秩和;
将所述正秩和与所述负秩和中的绝对值较小者确定为检验统计量T。
4.根据权利要求3所述的方法,其特征在于,所述在所述预定数目大于临界数目的情况下,根据所述检验统计量T,所述数据对的数目n得到统计均值U;具体包括:
在所述编秩数据中不存在相同秩次时,所述检验统计量T,所述数据对的数目n,确定统计均值U;所述统计均值U为
Figure FDA0000455678400000021
在各个编秩数据中存在相同秩次时,获取校正量;所述校正量为∑(ti 3-ti),其中ti为第i个相同秩次的个数;
根据所述校正量,所述检验统计量T,所述数据对的数目n,确定统计均值U;所述统计均值U为
5.根据权利要求3或4所述的方法,其特征在于,所述根据绝对值大小,对各个差值数据进行编号,获取编号数据,具体包括:
在存在相同绝对值的情况下,将相同绝对值的差值数据的编号求平均,得到平均值;
将所述平均值替代所述相同绝对值的差值数据的编号,得到编号数据;
在不存在相同绝对值的情况下,根据所述绝对值大小,按照从小到大顺序,对各个差值数据进行编号,得到编号数据。
6.一种检验数据一致性的装置,其特征在于,所述装置包括:采集单元,设置单元,确定单元和第一检验单元;
所述采集单元用于采集运维支撑系统中的待检验的两组数据,第一组数据包括预定数目的第一数据;第二组数据包括所述预定数目的第二数据,所述第一数据和所述第二数据根据采集顺序依次形成所述预定数目n个数据对;
所述设置单元用于设置第一假设,第二假设和检验水准α,所述第一假设为所述第一组数据和所述第二组数据一致;所述第二假设为所述第一组数据和所述第二组数据不一致;所述检验水准α表征所述第二假设的概率;
所述确定单元用于根据威尔科克森Wilcoxon符号秩方法确定检验统计量T;
所述第一检验单元用于在所述预定数目小于等于临界数目的情况下,按照双侧检验水准α查找秩和检验界值表,获取临界值Tα;如果所述检验统计量T大于所述临界值Tα,接收所述第一假设,如果所述检验统计量T小于所述临界值Tα,拒绝所述第一假设。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:第二检验单元;
所述第二检验单元用于:在所述预定数目大于临界数目的情况下,根据所述检验统计量T,所述数据对的数目n得到统计均值U;
根据所述检验水准α,从正态分布表获取分位点Z,如果所述统计均值U小于等于所述分位点Z,接收第一假设;如果所述统计均值U大于所述分位点Z,拒绝所述第一假设。
8.根据权利要求7所述的装置,其特征在于,所述确定单元具体用于:
求取第一数据与相对应的第二数据的差值,得到差值数据;
将各个差值数据取绝对值;
根据绝对值大小,对各个差值数据进行编号,获取编号数据;
根据所述差值数据的符号配置各个编号数据的符号;
将带符号的编号数据确定为编秩数据;
求取所述编秩数据中的各个正秩数据之和,得到正秩和,并且求取所述编秩数据中的各个负秩数据之和,得到负秩和;
将所述正秩和与所述负秩和中的绝对值较小者确定为检验统计量T。
9.根据权利要求8所述的装置,其特征在于,所述第二检验单元具体用于:
在所述编秩数据中不存在相同秩次时,所述检验统计量T,所述数据对的数目n,确定统计均值U;所述统计均值U为
Figure FDA0000455678400000031
在各个编秩数据中存在相同秩次时,获取校正量;所述校正量为∑(ti 3-ti),其中ti为第i个相同秩次的个数;
根据所述校正量,所述检验统计量T,所述数据对的数目n,确定统计均值U;所述统计均值U为
Figure FDA0000455678400000032
10.根据权利要求8或9所述的装置,其特征在于,所述确定单元具体用于:
在存在相同绝对值的情况下,将相同绝对值的差值数据的编号求平均,得到平均值;将所述平均值替代所述相同绝对值的差值数据的编号,得到编号数据;
在不存在相同绝对值的情况下,根据所述绝对值大小,按照从小到大顺序,对各个差值数据进行编号,得到编号数据。
CN201410012550.5A 2014-01-10 2014-01-10 一种检验数据一致性的方法、装置 Pending CN103761282A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410012550.5A CN103761282A (zh) 2014-01-10 2014-01-10 一种检验数据一致性的方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410012550.5A CN103761282A (zh) 2014-01-10 2014-01-10 一种检验数据一致性的方法、装置

Publications (1)

Publication Number Publication Date
CN103761282A true CN103761282A (zh) 2014-04-30

Family

ID=50528519

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410012550.5A Pending CN103761282A (zh) 2014-01-10 2014-01-10 一种检验数据一致性的方法、装置

Country Status (1)

Country Link
CN (1) CN103761282A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506384A (zh) * 2017-07-25 2017-12-22 北京供销科技有限公司 一种数据一致性问题的发现修正方法及系统
CN108088407A (zh) * 2017-12-15 2018-05-29 成都光明光电股份有限公司 光学玻璃制品形貌偏差校正方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040195500A1 (en) * 2003-04-02 2004-10-07 Sachs Jeffrey R. Mass spectrometry data analysis techniques
CN1816039A (zh) * 2005-02-01 2006-08-09 华为技术有限公司 进行数据一致性校验及同步的方法和分布式系统
CN101278512A (zh) * 2005-09-29 2008-10-01 杜比实验室特许公司 在基于分组的通信网中利用数据一致性检验进行纠错
CN101478623A (zh) * 2009-02-02 2009-07-08 中国网络通信集团公司 话单传输方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040195500A1 (en) * 2003-04-02 2004-10-07 Sachs Jeffrey R. Mass spectrometry data analysis techniques
CN1816039A (zh) * 2005-02-01 2006-08-09 华为技术有限公司 进行数据一致性校验及同步的方法和分布式系统
CN101278512A (zh) * 2005-09-29 2008-10-01 杜比实验室特许公司 在基于分组的通信网中利用数据一致性检验进行纠错
CN101478623A (zh) * 2009-02-02 2009-07-08 中国网络通信集团公司 话单传输方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
徐建邦 等,: "《统计学(第1版)》", 31 January 2011, 东北财经大学出版社 *
郭传法: ""对Wilcoxon秩和检验法的改进"", 《白求恩医科大学学报》 *
马燕: "《卫生统计学(第1版)》", 31 July 2000, 人民卫生出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506384A (zh) * 2017-07-25 2017-12-22 北京供销科技有限公司 一种数据一致性问题的发现修正方法及系统
CN108088407A (zh) * 2017-12-15 2018-05-29 成都光明光电股份有限公司 光学玻璃制品形貌偏差校正方法及系统

Similar Documents

Publication Publication Date Title
CN106708909B (zh) 数据质量的检测方法和装置
US9983941B2 (en) Method and apparatus for recovering data
AU2018214120B2 (en) System and method for determining an optimum QC strategy for immediate release results
CN111174370A (zh) 故障检测方法及装置、存储介质、电子装置
CN107391335B (zh) 一种用于检查集群健康状态的方法和设备
CN111400505A (zh) 一种用电信息采集系统匹配故障消缺方案的方法及系统
CN116862081B (zh) 一种污染治理设备运维方法及系统
JP2020102209A (ja) ソフトウェアプログラム不良位置の識別
CN106815137A (zh) 用户界面测试方法与装置
CN113889271A (zh) 针对学生的心理健康测试方法及装置
CN103761282A (zh) 一种检验数据一致性的方法、装置
CN105207797A (zh) 故障定位方法和装置
CN116414815A (zh) 数据质量检测方法、装置、计算机设备和存储介质
CN111001275B (zh) 废气处理系统数据处理方法、装置、及可存储介质
CN111131815A (zh) 智能电视性能监控与异常进程处理方法及装置
CN105159826B (zh) 一种定位目标程序中的错误语句的方法和装置
CN112365269A (zh) 风险检测方法、装置、设备以及存储介质
CN107517474B (zh) 一种网络分析优化方法及装置
CN112783942B (zh) 基于区块链的数据采集质量核验方法及系统及装置及介质
CN105069705A (zh) 基于巡检机器人的数据考核方法和系统
CN112732773B (zh) 一种继电保护缺陷数据的唯一性校核方法及系统
CN105988927A (zh) 一种检测在软件的运行过程中的变速作弊行为的方法
CN111142898B (zh) 一种基于群体智能模式的数据防泄漏终端升级方法及系统
CN106650939A (zh) 一种基于知识库的试验数据智能判读方法
CN106776235A (zh) 一种运维机房的监控系统、方法和搜索引擎

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140430

RJ01 Rejection of invention patent application after publication