CN103246574B - 数据准确性的校验方法及装置 - Google Patents

数据准确性的校验方法及装置 Download PDF

Info

Publication number
CN103246574B
CN103246574B CN201210031020.6A CN201210031020A CN103246574B CN 103246574 B CN103246574 B CN 103246574B CN 201210031020 A CN201210031020 A CN 201210031020A CN 103246574 B CN103246574 B CN 103246574B
Authority
CN
China
Prior art keywords
desired value
object table
verification
verification rule
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210031020.6A
Other languages
English (en)
Other versions
CN103246574A (zh
Inventor
邓浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210031020.6A priority Critical patent/CN103246574B/zh
Publication of CN103246574A publication Critical patent/CN103246574A/zh
Priority to HK13110968.2A priority patent/HK1183545A1/zh
Application granted granted Critical
Publication of CN103246574B publication Critical patent/CN103246574B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种数据准确性的校验方法及装置。其中,该方法包括:获取与目标表相关的校验规则信息,其中,目标表为需要进行数据准确性校验的目标数据表;利用与目标表相关的校验规则信息对目标表进行数据准确性校验;以及根据校验结果输出不同的提示信息。通过本申请,能够使得对数据准确性的监控校验更及时。

Description

数据准确性的校验方法及装置
技术领域
本申请涉及数据处理领域,具体而言,涉及一种数据准确性的校验方法及装置。
背景技术
随着数据仓库规模的扩大,应用的不断增多,数据间的依赖关系也越来越复杂,一个统计报表/绩效指标,都可能需要来源于多个数据表,并经过多层转换,才能计算得到。同时,数据在企业的日常运营中发挥的作用越来越大,而业务部门应用数据时对数据的首要要求是准确,不准确的数据非但不能辅导运营,提升业务效率,还有可能会误导业务部门,以致做出错误决策。
因为数据计算的复杂性,数据出错的机率相对比较大,而数据的使用方不会接受计算错误的数据,因而对数据计算结果进行监控,校验,确保提供正确的结果是非常重要的。
目前,一般的数据仓库系统会编写一些数据校验脚本,对计算得到的数据进行校验,这些脚本以数据监控任务方式单独放到调度系统中运行,数据监控任务一般不影响或干涉数据提取、转换和加载(Extraction-Transformation-Loading,简称为ETL)工作流的运行。当校验得出计算结果有异常时,后续再由工程师查找原因,进行数据的回滚计算操作。
对于上述的数据准确性(或者,称作数据质量)的校验方法,通常存在以下几个问题:
首先,由于ETL任务与数据校验任务分离,数据校验的结果只是作为事后进行故障排查分析的参考,并不能有效地隔离某项数据错误给整个系统带来的影响,因而造成监控处理不够及时,事后的处理成本较高。
其次,由于进行数据校验的业务逻辑脚本分散的封装在各个数据校验任务脚本中,重复编写,维护不便,进而造成同类数据校验程序并存,没有通用性。
此外,现有的数据准确性校验规则较简单,通常只考虑与源表对比行数,对基于商业指标的监控,考虑较少。
针对现有技术中的数据准确性的校验方法往往造成监控处理不够及时的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种数据准确性的校验方法及装置,以解决现有技术中的数据准确性的校验方法往往造成监控处理不够及时的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种数据准确性的校验方法。
根据本申请的数据准确性的校验方法包括:获取与目标表相关的校验规则信息,其中,目标表为需要进行数据准确性校验的目标数据表;利用与目标表相关的校验规则信息对目标表进行数据准确性校验;以及根据校验结果输出不同的提示信息。
进一步地,获取与目标表相关的校验规则信息包括:在校验规则配置表中获取与第一目标表相关的校验规则信息;以及在校验规则配置表中获取与第二目标表相关的校验规则信息,其中,在校验规则配置表中配置有与多个目标表相关的校验规则信息。
进一步地,上述方法还包括:接收用户输入的校验规则信息;以及根据接收的校验规则信息对校验规则配置表中的校验规则信息进行更新。
进一步地,在利用目标表相关的校验规则信息对目标表进行数据准确性校验之后,方法还包括:将校验结果记录在校验日志表中。
进一步地,利用与目标表相关的校验规则信息对目标表进行数据准确性校验包括:根据校验规则信息生成目标数据指标值查询程序;根据目标数据指标值查询程序对目标表进行查询,得到目标数据指标值;根据校验规则信息生成基准数据指标值查询程序;根据基准数据指标值查询程序对目标表进行查询,得到基准数据指标值;对目标数据指标值与基准数据指标值进行比较以对目标表进行数据准确性校验。
进一步地,利用与目标表相关的校验规则信息对目标表进行数据准确性校验包括:根据校验规则信息生成目标数据指标值查询程序;根据目标数据指标值查询程序对目标表进行查询,得到目标数据指标值;以及对目标数据指标值与基准数据指标值进行比较以对目标表进行数据准确性校验,根据校验结果输出不同的提示信息包括:判断目标数据指标值与基准数据指标值的差值是否大于等于第一预定阈值;在目标数据指标值与基准数据指标值的差值大于等于第一预定阈值时,返回校验失败信息并输出第一告警信息;在目标数据指标值与基准数据指标值的差值小于第一预定阈值时,判断目标数据指标值与基准数据指标值的差值是否大于等于第二预定阈值,其中,第二预定阈值小于第一预定阈值;在目标数据指标值与基准数据指标值的差值小于第二预定阈值时,返回校验成功信息;以及在目标数据指标值与基准数据指标值的差值大于等于第二预定阈值时,返回校验成功信息并输出第二告警信息。
进一步地,利用与目标表相关的校验规则信息对目标表进行数据准确性校验包括采用以下校验规则对目标表进行数据准确性校验:对目标表中的数据进行横向校验;对目标表中的数据进行纵向校验;以及基于预定的指标值对目标表中的数据进行校验。
为了实现上述目的,根据本申请的另一方面,提供了一种数据准确性的校验装置。该数据准确性的校验装置包括:获取模块,用于获取与目标表相关的校验规则信息,其中,目标表为需要进行数据准确性校验的目标数据表;校验模块,用于利用与目标表相关的校验规则信息对目标表进行数据准确性校验;以及提示模块,用于根据校验结果输出不同的提示信息。
进一步地,获取模块包括:第一获取模块,用于在校验规则配置表中获取与第一目标表相关的校验规则信息;以及第二获取模块,用于在校验规则配置表中获取与第二目标表相关的校验规则信息,其中,在校验规则配置表中配置有与多个目标表相关的校验规则信息。
进一步地,获取模块包括:接收模块,用于接收用户输入的校验规则信息;以及更新模块,用于根据接收的校验规则信息对校验规则配置表中的校验规则信息进行更新。
进一步地,在利用目标表相关的校验规则信息对目标表进行数据准确性校验之后,方法还包括:记录模块,用于将校验结果记录在校验日志表中。
进一步地,校验模块包括:第一生成模块,用于根据校验规则信息生成目标数据指标值查询程序;第一查询模块,用于根据目标数据指标值查询程序对目标表进行查询,得到目标数据指标值;第二生成模块,用于根据校验规则信息生成基准数据指标值查询程序;第二查询模块,根据基准数据指标值查询程序对目标表进行查询,得到基准数据指标值;校验子模块,用于对目标数据指标值与基准数据指标值进行比较以对目标表进行数据准确性校验。
进一步地,校验模块包括:第一生成模块,用于根据校验规则信息生成目标数据指标值查询程序;第一查询模块,用于根据目标数据指标值查询程序对目标表进行查询,得到目标数据指标值;以及校验子模块,用于对目标数据指标值与基准数据指标值进行比较以对目标表进行数据准确性校验,提示模块包括:第一判断模块,用于判断目标数据指标值与基准数据指标值的差值是否大于等于第一预定阈值;第一提示模块,用于在目标数据指标值与基准数据指标值的差值大于等于第一预定阈值时,返回校验失败信息并输出第一告警信息;第二判断模块,用于在目标数据指标值与基准数据指标值的差值小于第一预定阈值时,判断目标数据指标值与基准数据指标值的差值是否大于等于第二预定阈值,其中,第二预定阈值小于第一预定阈值;第二提示模块,用于在目标数据指标值与基准数据指标值的差值小于第二预定阈值时,返回校验成功信息;以及第三提示模块,用于在目标数据指标值与基准数据指标值的差值大于等于第二预定阈值时,返回校验成功信息并输出第二告警信息。
进一步地,利用与目标表相关的校验规则信息对目标表进行数据准确性校验包括采用以下校验规则对目标表进行数据准确性校验:第一校验模块,用于对目标表中的数据进行横向校验;第二校验模块,用于对目标表中的数据进行纵向校验;以及第三校验模块,用于基于预定的指标值对目标表中的数据进行校验。
通过本申请,采用获取与目标表相关的校验规则信息,其中,目标表为需要进行数据准确性校验的目标数据表;利用与目标表相关的校验规则信息对目标表进行数据准确性校验;以及根据校验结果输出不同的提示信息,由于在进行数据准确性校验之后根据校验结果输出不同的提示信息,因而可以根据提示信息进行及时处理,从而解决了现有技术中的数据准确性的校验方法往往造成监控处理不够及时的问题,进而达到了使得对数据准确性的监控校验更及时的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请第一实施例的数据准确性的校验装置示意图;
图2是根据本申请第二实施例的数据准确性的校验装置示意图;
图3是根据本申请第三实施例的数据准确性的校验装置示意图;
图4是根据本申请第四实施例的数据准确性的校验装置示意图;
图5是根据本申请第五实施例的数据准确性的校验装置示意图;
图6是根据本申请第六实施例的数据准确性的校验装置示意图;
图7是根据本申请实施例的数据准确性的校验系统示意图;
图8是根据本申请实施例的数据准确性的校验方法流程图;以及
图9是根据图7所示的校验系统的数据准确性的校验方法流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
实施例1
图1是根据本申请第一实施例的数据准确性的校验装置示意图。
如图1所示,该数据准确性的校验装置包括获取模块10、校验模块20和提示模块30。
其中,获取模块10,用于获取与目标表相关的校验规则信息,其中,目标表为需要进行数据准确性校验的目标数据表,其中,校验规则信息可以是存储在预先配置的表格中,校验规则是指对数据准确性进行校验的逻辑规则,是判断数据是否准确的标准。
校验模块20,用于利用与目标表相关的校验规则信息对目标表进行数据准确性校验,具体地,校验模块20可以是利用与目标表相关的一条或者多条校验规则信息对目标表进行数据准确性校验,也可以是利用与目标表相关的校验规则信息对目标表预定范围的数据进行数据准确性校验,例如,仅对目标表中的行数据进行准确性校验。
提示模块30,用于根据不同的校验结果输出不同的提示信息。例如,在校验成功时,输出成功信息,在校验失败时,输出失败信息,从而实现对校验结果进行监控的目的。
本申请通过定义校验数据准确性的校验模块20,为数据仓库ETL过程提供通用的数据准确性校验功能,能对ETL过程中生成的数据进行实时的数据准确性校验,在校验过程中发现的问题,可以即时通知相关责任人员进行处理。以缩短数据问题发现的时间,降低事后处理的成本。
在该数据准确性的校验装置中,由于在通过校验模块20对目标表进行数据准确性校验之后,提示模块30根据不同的校验结果输出不同的提示信息,因而可以根据提示信息进行及时的处理,从而使得对数据准确性的监控校验更及时。
本申请实施例中所提供的数据准确性的校验装置可以应用于数据处理系统中,以供具体的数据处理计算任务,例如,ETL任务,进行数据的准确性校验。其中,数据处理系统中的ETL任务处理单元通过访问数据准确性校验规则信息,提取相应的准确性校验规则,然后由校验装置进行数据计算结果的准确性校验,并且还可以根据校验结果进行错误报警或校验成功等后续操作。
实施例2
为了提高校验规则的通用性,作为实施例1的一种优选实施方式,获取模块10可以包括第一获取模块101和第二获取模块102,如图2所示。
第一获取模块101用于在校验规则配置表中获取与第一目标表相关的校验规则信息;第二获取模块102用于在校验规则配置表中获取与第二目标表相关的校验规则信息,其中,在校验规则配置表中配置有与多个目标表相关的校验规则信息。
本申请通过在数据仓库中定义一个通用的校验规则配置表,以目标表为中心,配置数据校验规则,进一步地,通过在数据准确性的校验装置中设置多个获取模块,多个获取模块均从该通用的校验规则配置表中获取与不同目标表,例如,第一目标表和第二目标表,对应的校验规则信息以对不同目标表中的数据进行准确性校验,实现了校验规则的统一配置。此外,由于同一校验规则配置表中的校验规则信息能够用来对不同目标表中的数据进行准确性校验,从而提高了校验规则的通用性。
实施例3
为了方便对校验规则进行更新,以及便于维护,作为实施例1的一种优选方式,获取模块10可以包括接收模块103和更新模块104,如图3所示。
接收模块103用于接收用户输入的校验规则信息,更新模块104用于根据接收的校验规则信息对校验规则配置表中的校验规则信息进行更新。
该实施例中的获取模块10可以仅包括接收模块103和更新模块104,也可以同时包括第一获取模块101、第二获取模块102、接收模块103和更新模块104。
如上述实施例2所述,本申请通过通用的校验规则配置表实现了校验规则的统一配置,从而在需要对校验规则配置表中的校验规则进行更新时,只需要通过接收模块103输入需要更新的校验规则信息,然后更新模块104即可以通过接收模块103接收到的信息对校验规则配置表中的校验规则信息进行更新。
由于校验规则配置统一,因而维护简单方便,可以对数据校验的规则进行统一配置,所有规则集中在一个数据表中,调整数据校验规则,只需更新相应数据表中的逻辑即可,不需要对ETL任务,调度任务,监控任务做出变更,而且其他程序引用更加方便,不再需要单独编写校验程序。
优选地,在本申请的任一实施例中,数据准确性的校验装置还可以包括记录模块40,该记录模块40用于在利用目标表相关的校验规则信息对目标表进行数据准确性校验之后,将校验结果记录在校验日志表中,从而便于对错误的数据进行查询。如图3所示。
实施例4
图4是根据本申请第四实施例的数据准确性的校验装置示意图。
为了使得数据准确性的校验更加准确,作为上述实施例的一种优选实施方式,校验模块20还可以包括:
第一生成模块211,用于根据校验规则信息生成目标数据指标值查询程序;
第一查询模块212,用于根据目标数据指标值查询程序对目标表进行查询,得到目标数据指标值;
第二生成模块213,用于根据校验规则信息生成基准数据指标值查询程序;
第二查询模块214,根据基准数据指标值查询程序对目标表进行查询,得到基准数据指标值;
校验子模块215,用于对目标数据指标值与基准数据指标值进行比较以对目标表进行数据准确性校验。
在该实施例中,不只通过第一生成模块211和第一查询模块212得到目标数据指标值,而且通过设置第二生成模块213和第二查询模块214来得到基准数据指标值,即,基准数据也是动态的,相比于固定不变的基准数据,能够使得数据准确性的校验更加准确。
实施例5
图5是根据本申请第四实施例的数据准确性的校验装置示意图。
为了使得数据准确性的校验装置的提示更加及时和准确,作为本申请的一种优选实施方式,校验模块20包括第一生成模块221、第一查询模块222和校验子模块223,提示模块30包括第一判断模块301、第一提示模块302、第二判断模块303、第二提示模块304和第三提示模块305。
第一生成模块221,用于根据校验规则信息生成目标数据指标值查询程序;第一查询模块222,用于根据目标数据指标值查询程序对目标表进行查询,得到目标数据指标值;校验子模块223,用于对目标数据指标值与基准数据指标值进行比较以对目标表进行数据准确性校验,
第一判断模块301,用于判断目标数据指标值与基准数据指标值的差值是否大于等于第一预定阈值;第一提示模块302,用于在目标数据指标值与基准数据指标值的差值大于等于第一预定阈值时,返回校验失败信息并输出第一告警信息;第二判断模块303,用于在目标数据指标值与基准数据指标值的差值小于第一预定阈值时,判断目标数据指标值与基准数据指标值的差值是否大于等于第二预定阈值,其中,第二预定阈值小于第一预定阈值;第二提示模块304,用于在目标数据指标值与基准数据指标值的差值小于等于第二预定阈值时,返回校验成功信息;以及第三提示模块305,用于在目标数据指标值与基准数据指标值的差值大于第二预定阈值时,返回校验成功信息并输出第二告警信息。
在该实施例中,不只在校验成功或者失败时返回相应的信息,而且在校验成功的情况下,利用第二判断模块303继续判断是否需要发出告警信息,其中,在满足提醒阈值的情况下,发出告警信息,从而可以使用户预先获知校验准确性较低的数据,保证了数据的及时性和准确性。
实施例6
图6是根据本申请第六实施例的数据准确性的校验装置示意图。
为了对目标表中的数据进行多角度的校验,作为本申请的一种优选实施方式,校验模块20还可以包括第一校验模块230、第二校验模块231和第三校验模块232,如图5所示。
第一校验模块230,用于对目标表中的数据进行横向校验;第二校验模块231,用于对目标表中的数据进行纵向校验;以及第三校验模块232,用于基于预定的指标值对目标表中的数据进行校验。其中,横向校验是指将需校验的数据表中的某一汇总指标值,与从其它表计算的同一指标的汇总值进行对比,看差异是否在可接受范围内的方法。纵向校验是指将需校验的数据表中的某一汇总指标值,与以前日期的该表计算的同一指标的汇总值进行对比,看差异是否在可接受范围内的方法。
在本实施例中,可以通过多个不同的校验模块从不同的角度对目标表中的数据进行校验,从而使得数据校验更加全面,同时支持的数据校验规则比较丰富,既可以是数据行数的横向,纵向对比,也可以是基于某一商业指标值的对比,对比的数据可以是在同一数据库中,也可以是在不同库中。
为了描述的方便,在对本申请实施例的数据准确性的校验装置进行描述时,以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
图7是根据本申请实施例的数据准确性的校验系统示意图。
如图7所示,该校验系统除了包括本申请实施例的数据准确性的校验装置之外,还包括校验规则配置表以及ETL任务系统。其中,校验规则配置表与本申请的获取模块10相连接,以便获取模块10可以从校验规则配置表中获取校验规则信息,ETL任务系统连接至本申请的校验模块20,以便ETL任务系统可以根据校验结果进行相应的处理。
ETL任务是指进行具体数据计算任务的程序,数据计算完成后,可通过调用数据校验执行模块进行数据计算结果的准确性校验,数据校验模块接收到要进行校验的数据表参数后,从数据校验规则配置模块中获取校验规则,进行数据的准确性校验,校验结果表明是数据计算结果错误或存疑时,通过调用报警系统,将错误或警告信息传送给维护人员。
ETL任务系统和报警系统是在整个数据仓库系统中的独立子系统,与数据校验功能存在交互,相互调用关系。非本申请所描述的数据校验系统具体实现内容。
以下对本申请实施例提供的数据准确性的校验方法进行描述。根据本申请实施例的数据准确性的校验方法可以采用上述本申请实施例中的数据准确性的校验装置的相应模块来执行。
图8是根据本申请实施例的数据准确性的校验方法流程图。如图8所示,该方法包括以下步骤:
步骤S602,获取与目标表相关的校验规则信息,其中,目标表为需要进行数据准确性校验的目标数据表;
步骤S604,利用与目标表相关的校验规则信息对目标表进行数据准确性校验;以及
步骤S606,根据校验结果输出不同的提示信息。
在该方法中,由于在对目标表进行数据准确性校验之后,根据不同的校验结果输出不同的提示信息,因而可以根据提示信息进行及时的处理,从而使得对数据准确性的监控校验更及时。
优选地,获取与目标表相关的校验规则信息包括:在校验规则配置表中获取与第一目标表相关的校验规则信息;以及在校验规则配置表中获取与第二目标表相关的校验规则信息,其中,在校验规则配置表中配置有与多个目标表相关的校验规则信息。此时,由于同一校验规则配置表中的校验规则信息能够用来对不同目标表中的数据进行准确性校验,从而提高了校验规则的通用性。
优选地,上述方法还包括:接收用户输入的校验规则信息;以及根据接收的校验规则信息对校验规则配置表中的校验规则信息进行更新。由于所有规则集中在一个数据表中,调整数据校验规则,只需更新相应数据表中的逻辑即可,不需要对ETL任务,调度任务,监控任务做出变更,而且其他程序引用更加方便,不再需要单独编写校验程序。
优选地,在利用目标表相关的校验规则信息对目标表进行数据准确性校验之后,上述方法还包括:将校验结果记录在校验日志表中。由于利用目标表相关的校验规则信息对目标表进行数据准确性校验之后,将校验结果记录在校验日志表中,因而便于对错误的数据进行查询。
优选地,利用与目标表相关的校验规则信息对目标表进行数据准确性校验包括:根据校验规则信息生成目标数据指标值查询程序;根据目标数据指标值查询程序对目标表进行查询,得到目标数据指标值;根据校验规则信息生成基准数据指标值查询程序;根据基准数据指标值查询程序对目标表进行查询,得到基准数据指标值;对目标数据指标值与基准数据指标值进行比较以对目标表进行数据准确性校验。在该实施例中,不只动态得到目标数据指标值,而且动态得到基准数据指标值,相比于固定不变的基准数据,能够使得数据准确性的校验更加准确。
优选地,利用与目标表相关的校验规则信息对目标表进行数据准确性校验包括:根据校验规则信息生成目标数据指标值查询程序;根据目标数据指标值查询程序对目标表进行查询,得到目标数据指标值;以及对目标数据指标值与基准数据指标值进行比较以对目标表进行数据准确性校验。根据校验结果输出不同的提示信息包括:判断目标数据指标值与基准数据指标值的差值是否大于等于第一预定阈值;在目标数据指标值与基准数据指标值的差值大于等于第一预定阈值时,返回校验失败信息并输出第一告警信息;在目标数据指标值与基准数据指标值的差值小于第一预定阈值时,判断目标数据指标值与基准数据指标值的差值是否大于等于第二预定阈值,其中,第二预定阈值小于第一预定阈值;在目标数据指标值与基准数据指标值的差值小于第二预定阈值时,返回校验成功信息;以及在目标数据指标值与基准数据指标值的差值大于等于第二预定阈值时,返回校验成功信息并输出第二告警信息。在该实施例中,不只在校验成功或者失败时返回相应的信息,而且在校验成功的情况下,继续判断是否需要发出告警信息,其中,在满足提醒阈值的情况下,发出告警信息,从而可以使用户预先获知校验准确性较低的数据,保证了数据的及时性和准确性。
优选地,利用与目标表相关的校验规则信息对目标表进行数据准确性校验包括采用以下校验规则对目标表进行数据准确性校验:对目标表中的数据进行横向校验;对目标表中的数据进行纵向校验;以及基于预定的指标值对目标表中的数据进行校验。在本实施例中,可以通过多个不同的校验模块从不同的角度对目标表中的数据进行校验,从而使得数据校验更加全面,同时支持的数据校验规则比较丰富,既可以是数据行数的横向,纵向对比,也可以是基于某一商业指标值的对比,对比的数据可以是在同一数据库中,也可以是在不同库中。
图9是根据图7所示的校验系统的数据准确性的校验方法流程图。
如图9所示,整个方案包括以下一些内容
校验规则配置:
在数据仓库中定义一个通用的校验规则配置表,以目标表为中心,配置数据校验规则。
校验规则调用执行
具体地,校验规则执行的流程为:
步骤S1,ETL任务调用数据校验执行模块,其调用参数为目标表名。
步骤S2,数据校验执行模块从数据校验规则配置存储模块中取得与该表相关的校验规则(可以是任意多个校验规则),进行具体的数据校验。并根据校验结果,进行后续的报警或返回成功状态等动作。
具体的调用执行过程为:
步骤S21,根据目标表名参数,从数据校验规则配置表取回所有与目标表相关的校验规则信息,具体地,可以根据需要在校验规则表中设置一下参数:
目标数据库名称
目标表名
目标表指标计算规则
目标表数据时间
目标表数据取值时间表达式
源数据库名称
源表名或源子查询
源表指标计算规则
源表数据取值时间表达式
源表数据时间
指标校验错误失败报警阀值
指标校验不一致通知提醒阀值
步骤S22,数据校验模块将取到的与该表相关的所有规则,轮询执行每条规则,校验规则可以对数据行数或某一商业指标值进行横向,纵向对比。
步骤S3,执行校验规则,执行一个具体规则的过程可以如下:
步骤S311,根据目标数据库名称,目标表名,目标表指标计算规则,目标表数据时间,目标表数据取值时间表达式等信息,生成一个计算目标表数据指标值或行数的动态sql。
步骤S312,连上目标数据库,执行生成的动态sql,取得目标数据指标值查询程序。
步骤S321,根据源数据库名称,源表名,源表指标计算规则,源表数据时间,源表数据取值时间表达式等信息,生成一个计算源表数据指标值或行数的动态sql。
步骤S322,连上源数据库,执行生成的源动态sql,取得源数据指标值。
对该条规则的源表和目标表的指标计算结果进行对比,规则中配置有失败报警阀值的,且两者结果差异超过这个阀值,返回失败,并调用报警模块,将错误信息通过手机短信,邮件发送给相关维护人员。当结果差异小于失败报警阀值,但规则配置有差异通知提醒阀值的,将差异信息通过邮件方式发送给相关维护人员,但不返回出错。
ETL任务接收校验结果,进行成功或失败处理。
通过以上描述可以看出,本申请实施例实现了以下技术效果:
监控及时,错误及警告信息实时通知;
校验规则配置统一,维护简单方便;
支持的数据校验规则比较丰富。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (12)

1.一种数据准确性的校验方法,其特征在于包括:
获取与目标表相关的校验规则信息,其中,所述目标表为需要进行数据准确性校验的目标数据表;
利用与所述目标表相关的校验规则信息对所述目标表进行数据准确性校验;以及
根据校验结果输出不同的提示信息,
其中,利用与所述目标表相关的校验规则信息对所述目标表进行数据准确性校验包括:
根据所述校验规则信息生成目标数据指标值查询程序;
根据所述目标数据指标值查询程序对所述目标表进行查询,得到目标数据指标值;
根据所述校验规则信息生成基准数据指标值查询程序;
根据所述基准数据指标值查询程序对所述目标表进行查询,得到基准数据指标值;
对所述目标数据指标值与所述基准数据指标值进行比较以对所述目标表进行数据准确性校验。
2.根据权利要求1所述的数据准确性的校验方法,其特征在于,获取与目标表相关的校验规则信息包括:
在校验规则配置表中获取与第一目标表相关的校验规则信息;以及
在所述校验规则配置表中获取与第二目标表相关的校验规则信息,
其中,在所述校验规则配置表中配置有与多个目标表相关的校验规则信息。
3.根据权利要求2所述的数据准确性的校验方法,其特征在于,所述方法还包括:
接收用户输入的校验规则信息;以及
根据接收的校验规则信息对所述校验规则配置表中的校验规则信息进行更新。
4.根据权利要求1所述的数据准确性的校验方法,其特征在于,在利用所述目标表相关的校验规则信息对所述目标表进行数据准确性校验之后,所述方法还包括:
将校验结果记录在校验日志表中。
5.根据权利要求1所述的数据准确性的校验方法,其特征在于,
根据校验结果输出不同的提示信息包括:
判断所述目标数据指标值与所述基准数据指标值的差值是否大于第一预定阈值;
在所述目标数据指标值与所述基准数据指标值的差值大于等于所述第一预定阈值时,返回校验失败信息并输出第一告警信息;
在所述目标数据指标值与所述基准数据指标值的差值小于所述第一预定阈值时,判断所述目标数据指标值与所述基准数据指标值的差值是否大于等于第二预定阈值,其中,所述第二预定阈值小于所述第一预定阈值;
在所述目标数据指标值与所述基准数据指标值的差值小于所述第二预定阈值时,返回校验成功信息;以及
在所述目标数据指标值与所述基准数据指标值的差值大于等于所述第二预定阈值时,返回校验成功信息并输出第二告警信息。
6.根据权利要求1所述的数据准确性的校验方法,其特征在于,利用与所述目标表相关的校验规则信息对所述目标表进行数据准确性校验包括采用以下校验规则对所述目标表进行数据准确性校验:
对所述目标表中的数据进行横向校验;
对所述目标表中的数据进行纵向校验;以及
基于预定的指标值对所述目标表中的数据进行校验。
7.一种数据准确性的校验装置,其特征在于包括:
获取模块,用于获取与目标表相关的校验规则信息,其中,所述目标表为需要进行数据准确性校验的目标数据表;
校验模块,用于利用与所述目标表相关的校验规则信息对所述目标表进行数据准确性校验;以及
提示模块,用于根据校验结果输出不同的提示信息,
其中,所述校验模块包括:
第一生成模块,用于根据所述校验规则信息生成目标数据指标值查询程序;
第一查询模块,用于根据所述目标数据指标值查询程序对所述目标表进行查询,得到目标数据指标值;
第二生成模块,用于根据所述校验规则信息生成基准数据指标值查询程序;
第二查询模块,根据所述基准数据指标值查询程序对所述目标表进行查询,得到基准数据指标值;
校验子模块,用于对所述目标数据指标值与所述基准数据指标值进行比较以对所述目标表进行数据准确性校验。
8.根据权利要求7所述的数据准确性的校验装置,其特征在于,所述获取模块包括:
第一获取模块,用于在校验规则配置表中获取与第一目标表相关的校验规则信息;以及
第二获取模块,用于在所述校验规则配置表中获取与第二目标表相关的校验规则信息,
其中,在所述校验规则配置表中配置有与多个目标表相关的校验规则信息。
9.根据权利要求8所述的数据准确性的校验装置,其特征在于,所述获取模块包括:
接收模块,用于接收用户输入的校验规则信息;以及
更新模块,用于根据接收的校验规则信息对所述校验规则配置表中的校验规则信息进行更新。
10.根据权利要求7所述的数据准确性的校验装置,其特征在于,在利用所述目标表相关的校验规则信息对所述目标表进行数据准确性校验之后,所述装置还包括:
记录模块,用于将校验结果记录在校验日志表中。
11.根据权利要求7所述的数据准确性的校验装置,其特征在于,
所述提示模块包括:
第一判断模块,用于判断所述目标数据指标值与所述基准数据指标值的差值是否大于等于第一预定阈值;
第一提示模块,用于在所述目标数据指标值与所述基准数据指标值的差值大于等于所述第一预定阈值时,返回校验失败信息并输出第一告警信息;
第二判断模块,用于在所述目标数据指标值与所述基准数据指标值的差值小于所述第一预定阈值时,判断所述目标数据指标值与所述基准数据指标值的差值是否大于第二预定阈值,其中,所述第二预定阈值小于所述第一预定阈值;
第二提示模块,用于在所述目标数据指标值与所述基准数据指标值的差值小于所述第二预定阈值时,返回校验成功信息;以及
第三提示模块,用于在所述目标数据指标值与所述基准数据指标值的差值大于等于所述第二预定阈值时,返回校验成功信息并输出第二告警信息。
12.根据权利要求7所述的数据准确性的校验装置,其特征在于,利用与所述目标表相关的校验规则信息对所述目标表进行数据准确性校验包括采用以下校验规则对所述目标表进行数据准确性校验:
第一校验模块,用于对所述目标表中的数据进行横向校验;
第二校验模块,用于对所述目标表中的数据进行纵向校验;以及
第三校验模块,用于基于预定的指标值对所述目标表中的数据进行校验。
CN201210031020.6A 2012-02-10 2012-02-10 数据准确性的校验方法及装置 Active CN103246574B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201210031020.6A CN103246574B (zh) 2012-02-10 2012-02-10 数据准确性的校验方法及装置
HK13110968.2A HK1183545A1 (zh) 2012-02-10 2013-09-26 數據準確性的校驗方法及裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210031020.6A CN103246574B (zh) 2012-02-10 2012-02-10 数据准确性的校验方法及装置

Publications (2)

Publication Number Publication Date
CN103246574A CN103246574A (zh) 2013-08-14
CN103246574B true CN103246574B (zh) 2015-11-11

Family

ID=48926105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210031020.6A Active CN103246574B (zh) 2012-02-10 2012-02-10 数据准确性的校验方法及装置

Country Status (2)

Country Link
CN (1) CN103246574B (zh)
HK (1) HK1183545A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193681A (zh) * 2016-03-15 2017-09-22 阿里巴巴集团控股有限公司 数据校验方法及装置

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104252512A (zh) * 2013-11-05 2014-12-31 深圳市华傲数据技术有限公司 一种数据库数据核算方法和装置
CN105450592A (zh) 2014-08-05 2016-03-30 阿里巴巴集团控股有限公司 安全校验方法、装置、服务器及终端
CN104462243B (zh) * 2014-11-19 2018-09-07 上海烟草集团有限责任公司 一种结合数据校验的etl调度系统及方法
CN105786911B (zh) * 2014-12-25 2019-08-16 阿里巴巴集团控股有限公司 应用数据的校验方法及装置
CN104766180A (zh) * 2015-04-24 2015-07-08 国家电网公司 一种提高停电信息报送正确率的方法
CN104820710B (zh) * 2015-05-19 2018-05-01 福建新大陆电脑股份有限公司 一种数据校验值生成方法及系统
CN105893214A (zh) * 2016-06-28 2016-08-24 国家电投集团河南电力有限公司技术信息中心 一种基于电力企业erp数据质量集中监控的方法及装置
CN106294294B (zh) * 2016-08-03 2019-03-26 上海电气泰雷兹交通自动化系统有限公司 轨道交通信号系统统一格式数据文件的一致性校验方法
CN107368530A (zh) * 2017-06-14 2017-11-21 广东网金控股股份有限公司 一种基于自定义特性验证数据有效性的方法及系统
CN109101509A (zh) * 2017-06-20 2018-12-28 中兴通讯股份有限公司 数据准确性检测方法、装置、服务器及计算机存储介质
CN107402970B (zh) * 2017-06-29 2020-09-08 北京星选科技有限公司 信息生成方法及装置
CN107885609B (zh) * 2017-11-08 2022-02-01 泰康保险集团股份有限公司 业务冲突处理方法及装置、存储介质和电子设备
CN108829534B (zh) * 2018-05-31 2024-04-05 康键信息技术(深圳)有限公司 数据问题修复方法、装置、计算机设备和存储介质
CN108898485A (zh) * 2018-06-07 2018-11-27 阿里巴巴集团控股有限公司 一种数据校验的方法及装置
CN108762241A (zh) * 2018-06-21 2018-11-06 河南思维轨道交通技术研究院有限公司 数据校核装置及其控制方法
CN109341742A (zh) * 2018-09-17 2019-02-15 北京英视睿达科技有限公司 环境监测设备校验方法及系统
CN109446493B (zh) * 2018-10-17 2022-06-24 网易(杭州)网络有限公司 数据处理方法、装置、存储介质和电子装置
CN110446073A (zh) * 2019-08-20 2019-11-12 北京奇艺世纪科技有限公司 一种视频编目信息的校验方法及相关设备
CN113128943B (zh) * 2019-12-30 2023-12-05 北京懿医云科技有限公司 数据质量监控方法、装置、电子设备、存储介质
CN111598267B (zh) * 2020-05-19 2023-09-29 徐州徐工挖掘机械有限公司 工程机械及其工作数据校验方法、装置和系统、存储介质
CN111626882B (zh) * 2020-05-28 2022-07-19 泰康保险集团股份有限公司 数据检测方法、装置、计算机可读介质及电子设备
CN112241328B (zh) * 2020-09-10 2024-01-23 长沙市到家悠享网络科技有限公司 数据处理方法、装置及系统
CN112540996B (zh) * 2020-11-12 2023-11-24 Oppo(重庆)智能科技有限公司 一种业务数据的校验方法、装置、电子设备及存储介质
CN112734281A (zh) * 2021-01-21 2021-04-30 山东健康医疗大数据有限公司 一种医疗数据治理中质控和任务调度的解耦处理方法
CN113050949A (zh) * 2021-03-23 2021-06-29 上海万向区块链股份公司 基于java的防止父子依赖job执行后数据错乱的方法及系统
CN113066335A (zh) * 2021-04-01 2021-07-02 中核核电运行管理有限公司 一种弯管操作指导系统
CN116633698B (zh) * 2023-07-25 2023-10-31 中国电信股份有限公司 数据传输方法、装置、计算机设备、存储介质和程序产品

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6141767A (en) * 1998-04-03 2000-10-31 Sony Corporation Method of and apparatus for verifying reliability of contents within the configuration ROM of IEEE 1394-1995 devices
CN101021890A (zh) * 2007-03-20 2007-08-22 华为技术有限公司 一种对页面数据进行校验的方法、系统和服务器
CN101178675A (zh) * 2007-12-14 2008-05-14 华为技术有限公司 校验数据的方法和装置
CN101364291A (zh) * 2008-07-17 2009-02-11 中冶长天国际工程有限责任公司 数据准确性的校验方法、装置及一种工时数据校验系统
CN101446914A (zh) * 2007-11-26 2009-06-03 阿里巴巴集团控股有限公司 一种数据库监控方法及装置
CN101572696A (zh) * 2008-04-29 2009-11-04 华为技术有限公司 一种网页表单数据验证的方法和装置
CN102073912A (zh) * 2009-11-23 2011-05-25 中国移动通信集团黑龙江有限公司 数据质量控制方法、装置及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070038894A1 (en) * 2005-08-09 2007-02-15 Microsoft Corporation Test Data verification with different granularity levels

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6141767A (en) * 1998-04-03 2000-10-31 Sony Corporation Method of and apparatus for verifying reliability of contents within the configuration ROM of IEEE 1394-1995 devices
CN101021890A (zh) * 2007-03-20 2007-08-22 华为技术有限公司 一种对页面数据进行校验的方法、系统和服务器
CN101446914A (zh) * 2007-11-26 2009-06-03 阿里巴巴集团控股有限公司 一种数据库监控方法及装置
CN101178675A (zh) * 2007-12-14 2008-05-14 华为技术有限公司 校验数据的方法和装置
CN101572696A (zh) * 2008-04-29 2009-11-04 华为技术有限公司 一种网页表单数据验证的方法和装置
CN101364291A (zh) * 2008-07-17 2009-02-11 中冶长天国际工程有限责任公司 数据准确性的校验方法、装置及一种工时数据校验系统
CN102073912A (zh) * 2009-11-23 2011-05-25 中国移动通信集团黑龙江有限公司 数据质量控制方法、装置及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张荣顺.数据处理系统中确认输入数据准确性可靠性的几种方法.《山东建材学院学报》.1987,第1卷(第3期), *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193681A (zh) * 2016-03-15 2017-09-22 阿里巴巴集团控股有限公司 数据校验方法及装置
CN107193681B (zh) * 2016-03-15 2020-07-31 阿里巴巴集团控股有限公司 数据校验方法及装置

Also Published As

Publication number Publication date
HK1183545A1 (zh) 2013-12-27
CN103246574A (zh) 2013-08-14

Similar Documents

Publication Publication Date Title
CN103246574B (zh) 数据准确性的校验方法及装置
US8060782B2 (en) Root cause problem identification through event correlation
CN100559350C (zh) 基于历史对可疑组件排优先级
EP3822790B1 (en) Data processing method and device
CN113407522B (zh) 一种数据处理方法、装置、计算机设备和计算机可读存储介质
CN102819758B (zh) 在运动生产线上提高射频标签读写成功率的系统及方法
US20160092290A1 (en) Processing data errors for a data processing system
CN102650875B (zh) 检查系统、管理服务器、检查装置及检查数据管理方法
CN108170566A (zh) 产品故障信息处理方法、系统、设备和协同工作平台
CN105447681A (zh) 一种理化检测控制与信息管理系统
US20220156704A1 (en) Method and system for transmitting data from manufacturing data originators to target computing systems using defined message schemas
CN110503544A (zh) 征信数据报送方法、装置、系统、计算机设备和存储介质
CN107833001A (zh) 物流箱管理方法、装置及电子设备
CN112070622A (zh) 基于mes系统的物料追踪方法、系统、设备及存储介质
CN111782456A (zh) 异常检测方法、装置、计算机设备和存储介质
CN112184264A (zh) 一种基于区块链的药品监管方法、装置、服务器和介质
US10674337B2 (en) Method and device for processing operation for device peripheral
JP2017167578A (ja) インシデント管理システム
CN111624964B (zh) 权限动态管控方法、装置、服务端和可读存储介质
KR102298342B1 (ko) 정보 연동 시스템 및 정보 연동 방법
CN103676892A (zh) 一种号牌压制任务管理方法及系统
CN106933694A (zh) 应用程序错误定位方法及装置
CN112308491A (zh) 货物库存监测方法、装置、设备及计算机可读存储介质
WO2009154928A1 (en) Supplier build status visibility tool
US11222293B2 (en) Systems and methods for analyzing product movement information and generating compliance profiles

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1183545

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1183545

Country of ref document: HK