CN109101509A - 数据准确性检测方法、装置、服务器及计算机存储介质 - Google Patents
数据准确性检测方法、装置、服务器及计算机存储介质 Download PDFInfo
- Publication number
- CN109101509A CN109101509A CN201710471956.3A CN201710471956A CN109101509A CN 109101509 A CN109101509 A CN 109101509A CN 201710471956 A CN201710471956 A CN 201710471956A CN 109101509 A CN109101509 A CN 109101509A
- Authority
- CN
- China
- Prior art keywords
- measured
- index
- data
- model
- measurement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本发明提供一种数据准确性检测方法、装置、服务器及计算机存储介质,通过当前确定的待测对象与预设待测对象与指标模型对应关系表从模型数据库中获取与当前待测对象对应的指标模型,每一指标模型中包含有待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、各测量指标对应的指标阈值,根据获取的指标模型提取当前待测对象各测量指标对应的被测数据,分别带入各测量指标对应的计算模型得到各测量指标的指标值,将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果确定待测对象各测量指标对应的被测数据是否准确,可以实现对各种待测业务的数据进行统一的测量,实用性强,易于推广。
Description
技术领域
本发明涉及大数据处理技术领域,尤其涉及一种数据准确性检测方法、装置、服务器及计算机存储介质。
背景技术
随着移动互联网、可穿戴设备、物联网等领域应用的快速增长,数据的规模也出现爆炸性增长,预计到2020年全球数据规模将达到40ZB(Zettabyte,泽字节),数据正成为巨大的经济资产。
大数据处理过程中,数据质量的好坏将直接影响到分析结果的准确性。因此,大数据不仅仅是数据量巨大,还对数据的质量有一定的要求。然而,现实中的大数据处理,其数据来源和数据结构繁多复杂。如何衡量数据清洗结果的准确性是大数据应用的重点也是难点,因此,如何对清洗后的大数据进行有效的准确性检查成为了亟待解决的重要问题。目前,业界对数据准确性的校验没有统一的方法,例如,有的数据检测平台会以字段为单位对每个字段下的数据进行检测,由于需要对每个字段下的数据进行验证,计算检测的复杂度就比较高,也比较浪费系统资源。
发明内容
本发明实施例提供的一种数据准确性检测方法、装置、服务器及计算机存储介质,主要解决的技术问题是:提供一种新的数据准确性检测方法、装置、服务器及计算机存储介质对数据的准确性进行检测。
为解决上述技术问题,本发明实施例提供一种数据准确性检测方法,包括:
确定当前待检查的待测对象;
根据所述待测对象和预设待测对象与指标模型对应关系表从模型数据库中获取与所述待测对象对应的指标模型;每一指标模型中包含有待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值;
根据获取的指标模型提取所述待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值;
将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果确定所述待测对象各测量指标对应的被测数据是否准确。
本发明实施例还提供一种数据准确性检测装置,包括:
确定模块,用于确定当前待检查的待测对象;
获取模块,用于根据所述待测对象和预设待测对象与指标模型对应关系表从模型数据库中获取与所述待测对象对应的指标模型;每一指标模型中包含有待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值;
处理模块,用于根据获取的指标模型提取所述待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值;
判断模块,用于将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果确定所述待测对象各测量指标对应的被测数据是否准确。
本发明实施例还提供一种服务器,包括处理器、存储器及通信总线;
所述通信总线用于实现所述处理器和所述存储器之间的连接通信;
所述处理器用于执行所述存储器中存储的数据准确性检测程序以实现上述的数据准确性检查方法中的步骤。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行前述的数据准确性检测方法。
本发明的有益效果是:
根据本发明实施例提供的一种新的数据准确性检测方法、装置及服务器以及计算机存储介质,通过当前确定的待检查的待测对象与预设待测对象与指标模型对应关系表从模型数据库中获取与当前待检查的待测对象对应的指标模型,每一指标模型中包含有待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值,根据获取的指标模型提取当前待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值,将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果确定待测对象各测量指标对应的被测数据是否准确,也即是本发明是通过将计算得到的各测量指标对应的指标值分别与预设指标阈值进行比较,根据比较结果来判断与各测量指标分别对应的被测数据是否正确,预设待测对象与指标模型对应关系表中的任何待测对象都能通过本发明提供的方案进行数据的准确性检查,简化了大数据系统中数据准确性的检查过程,由于存储有各待测对象与指标模型之间的对应关系,从而便于对各种待测业务的数据进行统一的测量管理,实用性强,易于推广。
附图说明
图1为本发明实施例一中数据准确性检测方法流程示意图;
图2为本发明实施例一中确定待测对象的流程示意图;
图3为本发明实施例一中大数据处理系统的结构示意图;
图4为本发明实施例一中大数据处理的模型示意图;
图5为本发明实施例二中数据准确性检测方法流程示意图;
图6为本发明实施例二中待测逻辑组对象的组成结构示意图;
图7为本发明实施例二中待测业务对象的组成结构示意图;
图8为本发明实施例二中指标模型的组成结构示意图;
图9为本发明实施例三中数据准确性检测装置的结构示意图;
图10为本发明实施例三中服务器的结构示意图。
具体实施方式
下面通过具体实施方式结合附图对本发明实施例作进一步详细说明。
实施例一:
本实施例提供了一种数据准确性检测方法,请参见图1所示,包括:
S101:确定当前待检查的待测对象。
应当理解的是,本实施例中的待测对象可以是待测业务对象,或者可以是由一个或者多个待测业务对象封装组成的待测逻辑组对象,或者可以是由一个或者多个待测逻辑组对象封装组成的更高层次的待测数据结构对象。
S102:根据待测对象和预设待测对象与指标模型对应关系表从模型数据库中获取与当前待检查的待测对象对应的指标模型。
需要说明的是,每一指标模型中包含有待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值。
应当理解的是,本实施例中待测对象与指标模型的对应关系,以及每一指标模型包含的待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值都应当是由开发人员根据实际情况预先设定好的。
对于每一个待测对象,都应当有与其自身相关的数据,通常情况下如果这些数据准确,则可以认为该待测对象是正常的、准确的,而该待测对象的测量指标则是用于衡量与该待测对象相关的数据是否准确的标准,若该待测对象的测量指标的指标值与对应的预设指标阈值匹配,则可以认为与该待测对象相关的数据是正确的。
以待测对象为语音业务为例来进行说明,通常情况下对语音业务有影响的指标包括但不限于:呼叫成功率、网络时延、掉话率等等,所以开发人员可以预先将语音业务与语音业务对应的指标模型之间的对应关系存储在待测对象与指标模型对应关系表中,该语音业务对应的指标模型中包含有该语音业务的测量指标,也即呼叫成功率、网络时延、掉话率,以及各测量指标对应的被测数据,以及各测量指标对应的计算模型,以及各测量指标对应的指标阈值,以掉话率这一测量指标为例,其对应的被测数据可以包括与掉话次数相关的数据、与呼叫次数相关的数据以及与未呼通次数相关的数据,其对应的计算模型可以包括:掉话率=掉话次数/(呼叫次数-未呼通次数),而其对应的指标阈值可以为0.3%,一般而言指标阈值可以根据实际需求任意设置。
在一些实施例中,预设待测对象与指标模型对应关系表中可以包含有待测业务对象与指标模型的对应关系,例如,预设待测对象与指标模型对应关系表中的一部分可以参见下表一所示:
表一
待测对象 | 指标模型 |
待测业务对象1 | 指标模型1 |
待测业务对象2 | 指标模型2 |
待测业务对象3 | 指标模型3 |
…… | …… |
需要说明的是,本实施例中的一个待测业务对象与一个指标模型对应,具体包括每个不同的待测业务对象与不同的指标模型对应,或者多个不同的待测业务对象可以对应同一个指标模型。
当然,在其他一些实施例中,预设待测对象与指标模型对应关系表中可以包含有待测逻辑组对象与指标模型组的对应关系,其中,待测逻辑组对象中包含至少一个待测业务对象,与待测逻辑组对象对应的指标模型组中包括与该待测逻辑组对象中各待测业务对象分别对应的指标模型;此时,预设待测对象与指标模型对应关系表中的一部分可以参见下表二所示:
表二
待测对象 | 指标模型 |
待测逻辑组对象A | 指标模型组A |
…… | …… |
其中,表二中的待测逻辑组对象A中可以同时包括表一中的待测业务对象1、待测业务对象2以及待测业务对象3,此时,指标模型组A中则应当包括表二中的指标模型1、指标模型2以及指标模型3。应当说明的是,可以根据业务场景,用户需求等等将一个或者多个待测业务对象封装成一个待测逻辑组对象。
此时,对于步骤S101而言,请参见图2所示,确定当前待检查的待测对象包括:
S21:接收检测指令信息。
需要说明的是,本实施例中的检测指令可以由测试人员通过外界输入设备下发。
S22:从检测指令信息中提取当前待检查的待测逻辑组对象,该逻辑组对象中包含至少一个待测业务对象。
当然还有一些实施例中的待测对象与指标模型对应关系表中可以同时包含待测业务对象与指标模型的对应关系,以及待测逻辑组对象与指标模型组的对应关系。
应当说明的是,本实施例中的待测对象与指标模型对应关系表中还可以包含由待测逻辑组对象封装组成的更高层次的待测数据结构对象与由指标模型组封装组成的更高层次的指标模型结构的对应关系,具体而言,也即是将待测逻辑组封装组成更高层次的结构,并与指标模型组封装组成的更高层次的指标模型结构对应,这里不再赘述。
S103:根据获取的指标模型提取当前待检查的待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值。
需要说明的是,本实施例中各测量指标对应的被测数据可以为当前待检查的待测对象各测量指标所对应的测量字段下的数据。
本实施中根据获取的指标模型提取当前待检查的待测对象各测量指标对应的被测数据可以包括:
根据获取的指标模型从清洗后的数据表中提取该待测对象各测量指标对应的测量字段下的数据。
S104:将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果确定待测对象各测量指标对应的被测数据是否准确。
本实施例中根据比较结果确定待测对象各测量指标对应的被测数据是否准确可以包括:
在该待测对象的某一测量指标的指标值与该待测对象相应测量指标的指标阈值相匹配时,判定该测量指标所对应的被测数据准确,否则,判定该测量指标所对应的被测数据不准确。
例如,该待测对象的测量指标为KPI1,且该待测指标只对应有一个测量指标,其对应的被测数据为A字段下的数据、B字段下的数据以及C字段下的数据,若计算得到KPI1的指标值与其预先对应设定的指标阈值匹配,则可以认为A字段下的数据、B字段下的数据以及C字段下的数据的总体来说是准确的。
这里需要对上述计算得到的指标值与指标阈值匹配进行说明,例如,在一些情况下,若指标值小于等于指标阈值,则可以认为该指标值与指标阈值匹配;或者,在其他一些情况下,也可以在指标值大于等于指标阈值时,认为该指标值与指标阈值匹配。
还需要说明的是,本实施例中在根据该待测对象和预设待测对象与指标模型对应关系表从模型数据库中获取与该待测对象对应的指标模型之前还可以包括:
判断待测对象与指标模型对应关系表中是否存在当前待检测的待测对象与指标模型的对应关系,如否,在模型数据库中为当前待检查的待测对象配置相应的指标模型,并在待测对象与指标模型对应关系表中配置当前待检测的待测对象与相应指标模型的对应关系。
需要说明的是,上述的配置过程可以是自动的,也即是可以根据待测对象与指标模型对应关系表中已有的对应关系,以及模型数据库中各指标模型所包含的内容总结推测出当前待检查的待测对象与指标模型的对应关系,以及相应指标模型下所包含的内容;当然,上述配置过程也可以是由维护人员通过外界输入设备自主实现的。
这样,当待测对象与指标模型对应关系表中没有包含当前待检查待测对象与指标模型的对应关系时,只需要在已有的对应关系表中添加相应的对应关系,在已有的模型数据库中添加相应的指标模型即可,无需修改测试平台的结构框架,保证了系统的灵活性和可扩展性。
最后需要说明的是,本实施例所提供的数据准确性检测方法还可以包括:
在根据获取的指标模型提取该待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值之后,将计算得到的各测量指标的指标值与该待测对象进行关联保存;
和/或,
在根据比较结果确定该待测对象各测量指标对应的被测数据是否准确之后,将被测数据的准确性判定结果与该待测对象进行关联保存;例如当被测数据包括A字段下的数据、B字段下的数据时,可以分别将各个字段下的数据的准确性判定结果与该待测对象关联保存,比如可以通过如下形式进行保存:待测对象1,A字段数据准确,B字段数据不准确。
这样,在进行了关联保存之后,就可供页面查询或者生成报表,以供运维人员快速发现网络中的数据问题。
一般来说,大数据处理系统主要由以下部分组成:数据采集层、存储共享层和应用表示层,具体可以参见图3所示,其中数据采集层主要是对一些关键节点中的数据进行采集,也即是对应本实施例中步骤S103中提取当前待检查的待测对象各测量指标对应的被测数据这一过程,而存储共享层包括数据在分布式系统中的存储和计算,应用表示层则是对用户进行数据的呈现。
本实施例提供的数据准确性检测方法,通过对大数据处理过程中的待测对象预先建立待测对象与指标模型关系对应表,以及为每一个指标模型配置待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值,这样在确定了需要进行准确性检测的待测对象之后,就可以直接获取到该待测对象对应的指标模型,并能根据该指标模型提取当前待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值,将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果对待测对象各测量指标对应的被测数据的准确性进行判定,简化了大数据系统中数据准确性的检查过程,实用性强,易于推广。
实施例二:
为了更好的理解本发明,本实施例在实施例一的基础上提供一种更加具体的数据准确性检测方法,图4是一种电信系统中网络优化大数据处理的简易模型,数据源是运营商提供的用户话单数据,将数据源数据汇聚到分布式存储系统HDFS(Hadoop DistributedFile System,分布式文件系统)集群中。Spark(一种专为大规模数据处理而设计的快速通用的计算引擎)节点中主要根据业务需求进行逻辑运算,最终清洗生成的主题表同步到Gbase(一种数据库产品)数据库中,供运营维护人员访问查看。
以上述模型为基础,本实施例以待测对象为待测逻辑组对象为例来进行说明,请参见图5所示,本实施例提供的数据准确性检测方法包括:
S501:接收检测指令信息。
S502:从检测指令信息中提取出当前待检查的待测逻辑组对象。
假设本实施例中确定出的当前待检查的待测逻辑组对象由弱覆盖业务和过覆盖业务封装组成。一般而言清洗后的数据结构都是繁多复杂的,为了提高后续的检测效率,此时可以先对与弱覆盖业务和过覆盖业务相关的数据在清洗后的数据表中进行采集,将采集到的数据存放于指标埋点表中,需要说明的是,此时可以将与弱覆盖业务相关的数据和与过覆盖业务相关的数据整合存储到一张表中,也可以分别存储在不同的表中。
S503:根据该待测逻辑组对象和预设待测逻辑组对象与指标模型组对应关系表从模型数据库中获取与当前待检查的待测逻辑组对象对应的指标模型组。
需要说明的是,每一指标模型中包含有待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值。
本实施例中与该待测逻辑组对象对应的指标模型组中包括过覆盖业务对应的指标模型以及弱覆盖业务对应的指标模型。
本实施例中可以用XML(Extensible Markup Language,可扩展标记语言)进行相应的代码编码,实现待测逻辑组对象与指标模型组之间的对应,以及指标模型的构建。
对于一个待测逻辑组对象而言,都有其对应的ID信息,也即唯一身份标识,名称信息,以及组成该待测逻辑组对象的业务对象信息,其结构可以参见图6所示,本实施例中的待测逻辑组对象由弱覆盖业务和过覆盖业务封装组成,假设该待测逻辑组对象的名称为网络优化,其对应的部分软件代码可以如下:
对于一个待测业务对象而言,都有其对应的ID信息,也即唯一身份标识,名称信息,以及与该待测业务对象对应的指标模型的信息,其结构可以参见图7所示,对于每一个指标模型而言,都有其对应的待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值,而每一个测量指标都应当有其对应的ID信息,也即唯一身份标识,名称信息,其结构可以参见图8。
本实施例中假设弱覆盖业务对象对应的指标模型中包含有两个测量指标,过覆盖业务对象对应的指标模型中包含有一个测量指标,其对应部分的软件代码可以如下:
应当理解的是,上述的Kpi指相应待测业务对象对应的指标模型中的测量指标。还需要说明的是,本实施例中的被测数据为待测业务对象各测量指标所对应的测量字段下的数据,以弱覆盖业务对应的指标模型中的两个测量指标为MR(Measurement Report,测量报告)点数以及栅格比例为例,其对应的部分软件代码可以如下:
S504:根据获取的指标模型从指标埋点表中提取组成该待测逻辑组对象的待测业务对象各测量指标对应的测量字段下的数据。
以弱覆盖业务为例,根据上述编写的软件代码,也即是从指标埋点表中筛选出属性iskpi=“true”的字段数据,该字段数据也即是弱覆盖业务的两个测量指标MR点数以及栅格比例对应的测量字段下的数据。
S505:将提取的被测数据分别带入各测量指标对应的计算模型计算得到各测量指标的指标值。
S506:将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果确定待测对象各测量指标对应的被测数据是否准确。
S507:将计算得到的各测量指标的指标值与该待测对象进行关联保存,并将被测数据的准确性判定结果与该待测对象进行关联保存。
本发明实施例还提供一种计算机存储介质,其中,计算机存储介质中存储有数据准确性检测程序,该数据准确性检测程序被处理器执行时实现如上述实施例一和实施例二中任一数据准确性检测方法的步骤。
本实施例提供的数据准确性检测方法以及计算机存储介质,通过对大数据处理过程中的待测对象预先建立待测对象与指标模型关系对应表,以及为每一个指标模型配置待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值,这样在确定了需要进行准确性检测的待测对象之后,就可以直接获取到该待测对象对应的指标模型,并能根据该指标模型提取当前待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值,将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果对待测对象各测量指标对应的被测数据的准确性进行判定,简化了大数据系统中数据准确性的检查过程,实用性强,易于推广。
实施例三:
请参见图9所示,本实施例提供一种数据准确性检测装置,包括确定模块91、获取模块92、处理模块93、以及判断模块94,其中,确定模块91用于确定当前待检查的待测对象;获取模块92用于根据确定的待测对象和预设待测对象与指标模型对应关系表从模型数据库中获取与该待测对象对应的指标模型,每一指标模型中包含有待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值;处理模块93用于根据获取的指标模型提取该待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值;判断模块94用于将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果确定该待测对象各测量指标对应的被测数据是否准确。
应当理解的是,本实施例中的待测对象可以是待测业务对象,或者可以是由一个或者多个待测业务对象封装组成的待测逻辑组对象,或者可以是由一个或者多个待测逻辑组对象封装组成的更高层次的待测数据结构对象。本实施例中待测对象与指标模型的对应关系,以及每一指标模型包含的待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值都应当是由开发人员根据实际情况预先设定好的。
对于每一个待测对象,都应当有与其自身相关的数据,通常情况下如果这些数据准确,则可以认为该待测对象是正常的、准确的,而该待测对象的测量指标则是用于衡量与该待测对象相关的数据是否准确的标准,若该待测对象的测量指标的指标值与对应的预设指标阈值匹配,则可以认为与该待测对象相关的数据是正确的。
以待测对象为语音业务为例来进行说明,通常情况下对语音业务有影响的指标包括但不限于:呼叫成功率、网络时延、掉话率等等,所以开发人员可以预先将语音业务与语音业务对应的指标模型之间的对应关系存储在待测对象与指标模型对应关系表中,该语音业务对应的指标模型中包含有该语音业务的测量指标,也即呼叫成功率、网络时延、掉话率,以及各测量指标对应的被测数据,以及各测量指标对应的计算模型,以及各测量指标对应的指标阈值,以掉话率这一测量指标为例,其对应的被测数据可以包括与掉话次数相关的数据、与呼叫次数相关的数据以及与未呼通次数相关的数据,其对应的计算模型可以包括:掉话率=掉话次数/(呼叫次数-未呼通次数),而其对应的指标阈值可以为0.3%,一般而言指标阈值可以根据实际需求任意设置。
在一些实施例中,预设待测对象与指标模型对应关系表中可以包含有待测业务对象与指标模型的对应关系,需要说明的是,本实施例中的一个待测业务对象与一个指标模型对应,具体包括每个不同的待测业务对象与不同的指标模型对应,或者多个不同的待测业务对象可以对应同一个指标模型。当然,在其他一些实施例中,预设待测对象与指标模型对应关系表中可以包含有待测逻辑组对象与指标模型组的对应关系,其中,待测逻辑组对象中包含至少一个待测业务对象,与待测逻辑组对象对应的指标模型组中包括与该待测逻辑组对象中各待测业务对象分别对应的指标模型;此时,本实施例中的确定模块91可以用于接收检测指令信息,从检测指令信息中提取当前待检查的待测逻辑组对象,该逻辑组对象中包含至少一个待测业务对象。需要说明的是,本实施例中的检测指令可以由测试人员通过外界输入设备下发。
当然还有一些实施例中的待测对象与指标模型对应关系表中可以同时包含待测业务对象与指标模型的对应关系,以及待测逻辑组对象与指标模型组的对应关系。
应当说明的是,本实施例中的待测对象与指标模型对应关系表中还可以包含由待测逻辑组对象封装组成的更高层次的待测数据结构对象与由指标模型组封装组成的更高层次的指标模型结构的对应关系,具体而言,也即是将待测逻辑组封装组成更高层次的结构,并与指标模型组封装组成的更高层次的指标模型结构对应,这里不再赘述。
需要说明的是,本实施例中各测量指标对应的被测数据可以为当前待检查的待测对象各测量指标所对应的测量字段下的数据。此时,处理模块93可以用于根据获取的指标模型从清洗后的数据表中提取该待测对象各测量指标对应的测量字段下的数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值。
本实施例中的判断模块94具体可以用于在该待测对象的某一测量指标的指标值与该待测对象相应测量指标的指标阈值相匹配时,判定该测量指标所对应的被测数据准确,否则,判定该测量指标所对应的被测数据不准确。例如,该待测对象的测量指标为KPI1,且该待测指标只对应有一个测量指标,其对应的被测数据为A字段下的数据、B字段下的数据以及C字段下的数据,若计算得到KPI1的指标值与其预先对应设定的指标阈值匹配,则判断模块94可以判定A字段下的数据、B字段下的数据以及C字段下的数据的总体来说是准确的。
本实施例所提供的数据准确性检测装置还可以包括配置模块,用于在判定出待测对象与指标模型对应关系表中不存在当前待检测的待测对象与指标模型的对应关系时,在模型数据库中为当前待检查的待测对象配置相应的指标模型,并在待测对象与指标模型对应关系表中配置当前待检测的待测对象与相应指标模型的对应关系。需要说明的是,上述的配置过程可以是自动的,也即是可以根据待测对象与指标模型对应关系表中已有的对应关系,以及模型数据库中各指标模型所包含的内容总结推测出当前待检查的待测对象与指标模型的对应关系,以及相应指标模型下所包含的内容;当然,上述配置过程也可以是由维护人员通过外界输入设备自主实现的。
这样,当待测对象与指标模型对应关系表中没有包含当前待检查待测对象与指标模型的对应关系时,只需要在已有的对应关系表中添加相应的对应关系,在已有的模型数据库中添加相应的指标模型即可,保证了系统的灵活性和可扩展性。
本实施例所提供的数据准确性检测装置还可以包括存储模块,用于在根据获取的指标模型提取该待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值之后,将计算得到的各测量指标的指标值与该待测对象进行关联保存;和/或,在根据比较结果确定该待测对象各测量指标对应的被测数据是否准确之后,将被测数据的准确性判定结果与该待测对象进行关联保存;例如当被测数据包括A字段下的数据、B字段下的数据时,可以分别将各个字段下的数据的准确性判定结果与该待测对象关联保存,比如可以通过如下形式进行保存:待测对象1,A字段数据准确,B字段数据不准确。
这样,在进行了关联保存之后,就可供页面查询或者生成报表,以供运维人员快速发现网络中的数据问题。
应当理解的是,本实施例中实现确定模块91、获取模块92、处理模块93、判断模块94、配置模块以及存储模块功能的算法或者程序可以构造在存储器中,控制器或者处理器可以运行该存储器中的算法或者程序以实现本实施例中确定模块91、获取模块92、处理模块93、判断模块94、配置模块以及存储模块的功能。
请参见图10所示,本实施例还提供一种服务器,包括处理器1000、存储器1002以及通信总线1003。
其中,通信总线1003用于实现处理器1000和存储器1002之间的连接通信。
处理器1000用于执行存储器1002中存储的数据准确性检测程序以实现上述实施例一或实施例二中任一数据准确性检查方法中的步骤。
本实施例提供的数据准确性检测装置、服务器,通过对大数据处理过程中的待测对象预先建立待测对象与指标模型关系对应表,以及为每一个指标模型配置待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值,这样在确定了需要进行准确性检测的待测对象之后,就可以直接获取到该待测对象对应的指标模型,并能根据该指标模型提取当前待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值,将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果对待测对象各测量指标对应的被测数据的准确性进行判定,简化了大数据系统中数据准确性的检查过程,实用性强,易于推广。
显然,本领域的技术人员应该明白,上述本发明实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在计算机存储介质(ROM/RAM、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
以上内容是结合具体的实施方式对本发明实施例所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (10)
1.一种数据准确性检测方法,包括:
确定当前待检查的待测对象;
根据所述待测对象和预设待测对象与指标模型对应关系表从模型数据库中获取与所述待测对象对应的指标模型;每一指标模型中包含有待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值;
根据获取的指标模型提取所述待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值;
将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果确定所述待测对象各测量指标对应的被测数据是否准确。
2.如权利要求1所述的数据准确性检测方法,其特征在于,所述待测对象与指标模型对应关系表中包含待测逻辑组对象与指标模型组的对应关系,所述待测逻辑组对象中包含至少一个待测业务对象,与所述待测逻辑组对象对应的指标模型组中包括与所述待测逻辑组对象中各待测业务对象分别对应的指标模型;
所述确定当前待检查的待测对象包括:
接收检测指令信息;
从所述检测指令信息中提取当前待检查的待测逻辑组对象,所述待测逻辑组对象中包含至少一个待测业务对象。
3.如权利要求1所述的数据准确性检测方法,其特征在于,所述被测数据为所述待测对象各测量指标所对应的测量字段下的数据;
所述根据获取的指标模型提取所述待测对象各测量指标对应的被测数据包括:
根据获取的指标模型从清洗后的数据表中提取所述待测对象各测量指标对应的测量字段下的数据。
4.如权利要求1-3任一项所述的数据准确性检查方法,其特征在于,所述根据比较结果确定所述待测对象各测量指标对应的被测数据是否准确包括:
在所述待测对象的某一测量指标的指标值与所述待测对象相应测量指标的指标阈值相匹配时,判定该测量指标所对应的被测数据准确,否则,判定该测量指标所对应的被测数据不准确。
5.如权利要求1-3任一项所述的数据准确性检测方法,其特征在于,所述根据所述待测对象和预设待测对象与指标模型对应关系表从模型数据库中获取与所述待测对象对应的指标模型之前还包括:
判断所述待测对象与指标模型对应关系表中是否存在所述当前待检测的待测对象与指标模型的对应关系,如否,在所述模型数据库中为所述当前待检查的待测对象配置相应的指标模型,并在所述待测对象与指标模型对应关系表中配置所述当前待检测的待测对象与相应指标模型的对应关系。
6.如权利要求1-3任一项所述的数据准确性检测方法,其特征在于,所述方法还包括:
在根据获取的指标模型提取所述待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值之后,将计算得到的各测量指标的指标值与所述待测对象进行关联保存;
和/或,
在根据比较结果确定所述待测对象各测量指标对应的被测数据是否准确之后,将所述被测数据的准确性判定结果与所述待测对象进行关联保存。
7.一种数据准确性检测装置,包括:
确定模块,用于确定当前待检查的待测对象;
获取模块,用于根据所述待测对象和预设待测对象与指标模型对应关系表从模型数据库中获取与所述待测对象对应的指标模型;每一指标模型中包含有待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值;
处理模块,用于根据获取的指标模型提取所述待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值;
判断模块,用于将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果确定所述待测对象各测量指标对应的被测数据是否准确。
8.如权利要求7所述的数据准确性检测装置,其特征在于,所述判断模块用于在所述待测对象的某一测量指标的指标值与所述待测对象相应测量指标的指标阈值相匹配时,判定该测量指标所对应的被测数据准确,否则,判定该测量指标所对应的被测数据不准确。
9.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有数据准确性检测程序,所述数据准确性检测程序被处理器执行时实现如权利要求1-6中任一项所述数据准确性检测方法的步骤。
10.一种服务器,包括处理器、存储器及通信总线;
所述通信总线用于实现所述处理器和所述存储器之间的连接通信;
所述处理器用于执行所述存储器中存储的数据准确性检测程序以实现如权利要求1-6任一项所述的数据准确性检查方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710471956.3A CN109101509A (zh) | 2017-06-20 | 2017-06-20 | 数据准确性检测方法、装置、服务器及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710471956.3A CN109101509A (zh) | 2017-06-20 | 2017-06-20 | 数据准确性检测方法、装置、服务器及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109101509A true CN109101509A (zh) | 2018-12-28 |
Family
ID=64795899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710471956.3A Pending CN109101509A (zh) | 2017-06-20 | 2017-06-20 | 数据准确性检测方法、装置、服务器及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109101509A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111414699A (zh) * | 2020-03-25 | 2020-07-14 | 平安资产管理有限责任公司 | 信息分析预测方法、装置、计算机系统及可读存储介质 |
CN112672370A (zh) * | 2020-12-23 | 2021-04-16 | 中移(杭州)信息技术有限公司 | 网元指标数据的自动检测方法及系统、设备和存储介质 |
CN112685244A (zh) * | 2020-12-07 | 2021-04-20 | 武汉虹信科技发展有限责任公司 | 设备指标检测方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010250769A (ja) * | 2009-04-20 | 2010-11-04 | Mitsubishi Electric Corp | 分析結果可視化装置及び分析結果可視化方法及び分析結果可視化プログラム |
CN103246574A (zh) * | 2012-02-10 | 2013-08-14 | 阿里巴巴集团控股有限公司 | 数据准确性的校验方法及装置 |
CN103559330A (zh) * | 2013-10-10 | 2014-02-05 | 上海华为技术有限公司 | 数据一致性检测方法及系统 |
CN103970851A (zh) * | 2014-05-05 | 2014-08-06 | 神华集团有限责任公司 | 海量凭证数据直接出具大型企业集团总部财务报表的方法 |
CN106096226A (zh) * | 2016-05-27 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 一种数据评估方法、装置及服务器 |
CN106557546A (zh) * | 2016-10-20 | 2017-04-05 | 中国电力科学研究院 | 一种对特高压在线监测数据进行挖掘并评价的方法及系统 |
-
2017
- 2017-06-20 CN CN201710471956.3A patent/CN109101509A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010250769A (ja) * | 2009-04-20 | 2010-11-04 | Mitsubishi Electric Corp | 分析結果可視化装置及び分析結果可視化方法及び分析結果可視化プログラム |
CN103246574A (zh) * | 2012-02-10 | 2013-08-14 | 阿里巴巴集团控股有限公司 | 数据准确性的校验方法及装置 |
CN103559330A (zh) * | 2013-10-10 | 2014-02-05 | 上海华为技术有限公司 | 数据一致性检测方法及系统 |
CN103970851A (zh) * | 2014-05-05 | 2014-08-06 | 神华集团有限责任公司 | 海量凭证数据直接出具大型企业集团总部财务报表的方法 |
CN106096226A (zh) * | 2016-05-27 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 一种数据评估方法、装置及服务器 |
CN106557546A (zh) * | 2016-10-20 | 2017-04-05 | 中国电力科学研究院 | 一种对特高压在线监测数据进行挖掘并评价的方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111414699A (zh) * | 2020-03-25 | 2020-07-14 | 平安资产管理有限责任公司 | 信息分析预测方法、装置、计算机系统及可读存储介质 |
CN112685244A (zh) * | 2020-12-07 | 2021-04-20 | 武汉虹信科技发展有限责任公司 | 设备指标检测方法及装置 |
CN112672370A (zh) * | 2020-12-23 | 2021-04-16 | 中移(杭州)信息技术有限公司 | 网元指标数据的自动检测方法及系统、设备和存储介质 |
CN112672370B (zh) * | 2020-12-23 | 2023-03-31 | 中移(杭州)信息技术有限公司 | 网元指标数据的自动检测方法及系统、设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107239458B (zh) | 基于大数据推算开发对象关系的方法及装置 | |
CN106708818A (zh) | 一种压力测试方法和系统 | |
US9098630B2 (en) | Data selection | |
US10331156B2 (en) | System and method for big data geographic information system discovery | |
CN112181804B (zh) | 一种参数校验方法、设备以及存储介质 | |
CN109635564A (zh) | 一种检测暴力破解行为的方法、装置、介质及设备 | |
CN109101509A (zh) | 数据准确性检测方法、装置、服务器及计算机存储介质 | |
CN109359003A (zh) | 游戏服务器压力测试方法、装置及设备 | |
CN106201856A (zh) | 一种多版本性能测试方法及装置 | |
CN110427375B (zh) | 字段类别的识别方法及装置 | |
CN110019116A (zh) | 数据追溯方法、装置、数据处理设备及计算机存储介质 | |
CN110209714A (zh) | 报表生成方法、装置、计算机设备及计算机可读存储介质 | |
CN104022913B (zh) | 用于数据集群的测试方法和装置 | |
CN110489317A (zh) | 基于工作流的云系统任务运行故障诊断方法与系统 | |
CN106802865B (zh) | 用于软件测试的应答模拟装置及方法 | |
CN110377519A (zh) | 大数据系统的性能容量测试方法、装置、设备及存储介质 | |
US20180293089A1 (en) | Method and device for adding indicative icon in interactive application | |
CN113220597A (zh) | 测试方法、测试装置、电子设备及存储介质 | |
CN104361138B (zh) | 成本分摊及溯源装置和方法 | |
CN115576831A (zh) | 一种测试案例推荐方法、装置、设备及存储介质 | |
CN105930260B (zh) | 一种系统可用性测试方法及装置 | |
CN114281549A (zh) | 数据的处理方法及装置 | |
CN113778996A (zh) | 一种大数据流数据处理方法、装置、电子设备及存储介质 | |
CN112307088A (zh) | 流程节点状态查询方法、装置、设备及存储介质 | |
CN108073612A (zh) | 同步sql执行计划的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |