CN117632928A - 数据质量校验方法、装置、电子设备及可读存储介质 - Google Patents

数据质量校验方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN117632928A
CN117632928A CN202311603208.8A CN202311603208A CN117632928A CN 117632928 A CN117632928 A CN 117632928A CN 202311603208 A CN202311603208 A CN 202311603208A CN 117632928 A CN117632928 A CN 117632928A
Authority
CN
China
Prior art keywords
data
data table
verification
quality
verified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311603208.8A
Other languages
English (en)
Inventor
甘乐
赵鹏举
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202311603208.8A priority Critical patent/CN117632928A/zh
Publication of CN117632928A publication Critical patent/CN117632928A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • General Factory Administration (AREA)

Abstract

本申请公开了数据质量校验方法、装置、电子设备及可读存储介质,所述数据质量校验方法包括:在目标数据仓库的数据处理层获取待校验数据表;根据所述数据处理层,确定所述待校验数据表的数据校验时间点,其中,所述数据校验时间点位于所述数据处理层的数据处理周期内;在所述数据校验时间点对所述待校验数据表进行数据质量校验。本申请解决了进行数据质量管控的管控效果差的技术问题。

Description

数据质量校验方法、装置、电子设备及可读存储介质
技术领域
本申请涉及数据仓库技术领域,尤其涉及一种数据质量校验方法、装置、电子设备及可读存储介质。
背景技术
随着科技的不断发展,为提高数据的交互性,数据仓库的应运而生,与此同时,作为互联网企业十分依赖的新型重要资产,数据质量的好坏也就直接关系到数据的精准度,这就使得对于数据质量的管控成为了不可或缺的一环。
目前,在数据质量管控过程中,在经过数据仓库加工的数据表中的数据进行应用时才会进行数据质量校验,而后对校验出的异常数据进行修复,但是,由于数据应用时会涉及到大规模数据,导致易出现影响决策准确性的情况,所以,当前进行数据质量管控的管控效果差。
发明内容
本申请的主要目的在于提供一种数据质量校验方法、装置、电子设备及可读存储介质,旨在解决现有技术中进行数据质量管控的管控效果差的技术问题。
为实现上述目的,本申请提供一种数据质量校验方法,所述数据质量校验方法包括:
在目标数据仓库的数据处理层获取待校验数据表;
根据所述数据处理层,确定所述待校验数据表的数据校验时间点,其中,所述数据校验时间点位于所述数据处理层的数据处理周期内;
在所述数据校验时间点对所述待校验数据表进行数据质量校验。
可选地,所述校验时间点为所述数据处理层对所述待校验数据表进行数据处理前的第一校验时间点,所述在所述数据校验时间点对所述待校验数据表进行数据质量校验的步骤包括:
在所述第一校验时间点获取所述待校验数据表的数据校验信息;
根据所述数据校验信息,对所述待校验数据表进行数据质量校验。
可选地,所述数据校验时间点为所述数据处理层对所述待校验数据表进行数据处理后的第二校验时间点,所述在所述数据校验时间点对所述待校验数据表进行数据质量校验的步骤包括:
根据所述数据标识信息,检测所述数据处理层对所述待校验数据表进行的数据处理是否存在异常;
若是,则校验得到所述待校验数据表数据质量异常的校验结果;
若否,则根据所述数据校验信息,对所述待校验数据表进行数据质量校验。
可选地,所述数据校验信息包括日波动数据量和日环比数据量,所述根据所述数据校验信息,对所述待校验数据表进行数据质量校验的步骤包括:
获取所述待校验数据表对应的历史数据表;
根据所述待校验数据表和所述历史数据表之间的数据量关系,对所述历史数据表进行数据表类型检测;
若检测到所述待校验数据表为第一类型数据表,则根据所述日波动数据量,对所述待校验数据表进行数据质量校验;
若检测到所述待校验数据表为第二类型数据表,则根据所述日环比数据量,对所述待校验数据表进行数据质量校验。
可选地,所述数据校验时间点为所述数据处理层生成所述待校验数据表对应的业务数据指标的第三校验时间点,所述在所述数据校验时间点对所述待校验数据表进行数据质量校验的步骤包括:
在所述第三校验时间点获取所述业务数据指标的数据指标值;
根据所述数据指标值和预设数据指标值之间的大小关系,对所述待校验数据表进行数据质量校验。
可选地,所述数据质量校验方法还包括:
在所述目标数据仓库对应的至少一个数据集市下的核心数据表均完成数据处理后,获取各所述数据集市共同对应的基础数据表集,其中,所述基础数据表集包括至少一个基础数据表;
对于任一所述基础数据表,为所述基础数据表匹配对应的数据质量校验规则,以及根据所述数据质量校验规则,对所述基础数据表进行数据质量校验;
在预设数据质量管控界面显示所述基础数据表集的数据质量校验结果。
可选地,所述为所述基础数据表匹配对应的数据质量校验规则的步骤包括:
根据所述基础数据表的字段标识,提取所述基础数据表的至少一个核心字段;
根据各所述核心字段和对应的字段权重,为所述基础数据表匹配预设校验规则模板;
将各所述核心字段插入所述预设校验规则模板,得到所述数据质量校验规则。
为实现上述目的,本申请还提供一种数据质量校验装置,所述数据质量校验装置包括:
获取模块,用于获取待校验数据表在所述目标数据仓库所处的数据处理层;
确定模块,用于根据所述数据处理层,确定所述待校验数据表的数据校验信息;
校验模块,用于根据所述数据校验信息,对所述待校验数据表进行数据质量校验。
可选地,所述数据校验时间点为所述数据处理层对所述待校验数据表进行数据处理前的第一校验时间点,所述校验模块还用于:
在所述第一校验时间点获取所述待校验数据表的数据校验信息;
根据所述数据校验信息,对所述待校验数据表进行数据质量校验。
可选地,所述数据校验时间点为所述数据处理层对所述待校验数据表进行数据处理后的第二校验时间点,所述校验模块还用于:
在所述第二校验时间点获取所述待校验数据表的数据标识信息和数据校验信息;
根据所述数据标识信息,检测所述数据处理层对所述待校验数据表进行的数据处理是否存在异常;
若是,则校验得到所述待校验数据表数据质量异常的校验结果;
若否,则根据所述数据校验信息,对所述待校验数据表进行数据质量校验。
可选地,所述数据校验信息包括日波动数据量和日环比数据量,所述校验模块还用于:
获取所述待校验数据表对应的历史数据表;
根据所述待校验数据表和所述历史数据表之间的数据量关系,对所述历史数据表进行数据表类型检测;
若检测到所述待校验数据表为第一类型数据表,则根据所述日波动数据量,对所述待校验数据表进行数据质量校验;
若检测到所述待校验数据表为第二类型数据表,则根据所述日环比数据量,对所述待校验数据表进行数据质量校验。
可选地,所述数据校验时间点为所述数据处理层生成所述待校验数据表对应的业务数据指标的第三校验时间点,所述校验模块还用于:
在所述第三校验时间点获取所述业务数据指标的数据指标值;
根据所述数据指标值和预设数据指标值之间的大小关系,对所述待校验数据表进行数据质量校验。
可选地,所述数据质量校验装置还用于:
在所述目标数据仓库对应的至少一个数据集市下的核心数据表均完成数据处理后,获取各所述数据集市共同对应的基础数据表集,其中,所述基础数据表集包括至少一个基础数据表;
对于任一所述基础数据表,为所述基础数据表匹配对应的数据质量校验规则,以及根据所述数据质量校验规则,对所述基础数据表进行数据质量校验;
在预设数据质量管控界面显示所述基础数据表集的数据质量校验结果。
可选地,所述数据质量校验装置还用于:
根据所述基础数据表的字段标识,提取所述基础数据表的至少一个核心字段;
根据各所述核心字段和对应的字段权重,为所述基础数据表匹配预设校验规则模板;
将各所述核心字段插入所述预设校验规则模板,得到所述数据质量校验规则。
本申请还提供一种电子设备,所述电子设备包括:至少一个处理器以及与所述至少一个处理器通信连接的存储器,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述的数据质量校验方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有实现数据质量校验方法的程序,所述数据质量校验方法的程序被处理器执行时实现如上述的数据质量校验方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的数据质量校验方法的步骤。
本申请提供了一种数据质量校验方法、装置、电子设备及可读存储介质,也即,在目标数据仓库的数据处理层获取待校验数据表;根据所述数据处理层,确定所述待校验数据表的数据校验时间点,其中,所述数据校验时间点位于所述数据处理层的数据处理周期内;在所述数据校验时间点对所述待校验数据表进行数据质量校验。
本申请在进行待校验数据表的数据质量校验时,首先在目标数据仓库的数据处理层直接获取数据处理层中的待校验数据表,进而通过数据处理层确定待校验数据表的数据校验时间点,最终在位于数据处理层数据处理周期内的数据校验时间点对待校验数据表进行数据质量校验,由于数据校验时间点位于数据处理层的数据处理周期内,进而即可在数据处理层中对待校验数据表进行数据质量校验,即,实现了将待校验数据表中的数据在目标数据仓库中进行数据质量校验的目的。
由于数据校验时间点发生于数据处理层的数据处理周期内,进而对于待待校验数据表中的数据在数据处理层中即可实现数据质量校验,也即,实现了对于目标数据仓库的数据在应用前进行数据指标校验的目的,从而得以对应用数据是否存在数据质量异常进行预判。
基于此,本申请通过在数据处理层的数据处理周期内对待校验数据表进行数据质量校验,进而得以提前判定待校验数据表中的数据质量情况,即,实现了对于目标数据仓库的数据在应用前进行数据指标校验的目的。而非在数据表被使用时才能发现存在数据质量异常。所以,克服了由于数据应用时会涉及到大规模数据,导致易出现影响决策准确性的情况的技术缺陷,所以,提升了进行数据质量管控的管控效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例一提供的数据质量校验方法的流程示意图;
图2为本申请实施例二提供的数据质量校验方法的流程示意图;
图3为本申请实施例一提供的数据质量校验方法的数据质量校验的流程示意图;
图4为本申请实施例三提供的数据质量校验装置的结构示意图;
图5为本申请实施例四提供的电子设备的结构示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本发明保护的范围。
实施例一
首先,应当理解的是,通过数据仓库进行数据加工的方式已经广泛应用于各行各业之中,但是,在数据加工的过程中,数据表中的数据质量可能因为以下等原因引发数据异常:1)上游数据表的数据发生逻辑变动,但是未能及时知会下游的数据表开发者;2)数据表的开发者在逻辑调整过程中未能思考周全,导致数量跑批出现异常;3)在数据表每日定时输出数据时,数据跑批临时出现异常(如上游数据表的数据没有准备好,或者1大数据跑批工具出现异常等)。而上述数据异常通常需要在数据表进行应用时才会发现,此时既容易出现影响决策准确性的情况,也容易增加数据仓库成本,所以,目前亟需一种能够预判数据质量,以提升数据质量管控的管控效果的方法。
本申请实施例提供一种数据质量校验方法,在本申请数据质量校验方法的实施例一中,参照图1,所述数据质量校验方法包括:
步骤S10,在目标数据仓库的数据处理层获取待校验数据表;
步骤S20,根据所述数据处理层,确定所述待校验数据表的数据校验时间点,其中,所述数据校验时间点位于所述数据处理层的数据处理周期内;
步骤S30,在所述数据校验时间点对所述待校验数据表进行数据质量校验。
在本实施例中,需要说明的是,虽然图1示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,数据质量校验方法应用于数据质量校验系统,数据质量校验系统具体可以为数据库管理系统,数据质量校验系统可部署于电子设备,电子设备具体可以为计算机或者个人PC等,目标数据仓库用于表征进行数据质量校验的数据仓库,数据仓库的数据处理整体可抽象为输入和输出,数据处理层用于表征基于数据处理方式进行的分层,具体可以为ODS层(Operational Data Store,数据操作层)、DWD层(Data Warehouse Detail,数据明细层)、DWM层(Data Warehouse Middle,数据中间层)以及DWS层(Data Warehouse Servce,数据服务层)等,不同的数据处理层对待校验数据表中的数据进行相应的数据处理,其中,数据操作层用于汇聚来自不同业务系统的源数据,数据明细层用于在数据操作层的基础上对源数据进行加工处理,数据中间层用于对通用的维度进行轻度聚合操作,待校验数据表用于表征等待进行数据质量校验的数据表,具体可以为核心业务数据表、全量数据表、快照数据表、增量数据表、拉链数据表、维度表、实体表以及事实表等。
另外地,需要说明的是,数据校验时间点用于保证进行数据质量校验的具体时间,具体可以到秒级,数据处理周期是指数据处理层从接收数据到对数据进行处理后发送出去的整个时间周期,针对不同数据处理层不同类型的数据质量校验方式可参照现有技术的具体方式,例如数据质量校验方式可以为依赖于SQL脚本进行校验的方式,本申请实施例在此不再赘述。
作为一种示例,步骤S10至步骤S30包括:获取目标数据仓库的数据处理层,将所述数据处理层中的核心业务数据表作为所述待校验数据表;根据所述数据处理层,确定所述待校验数据表的数据校验时间点,其中,所述数据校验时间点位于所述数据处理层的数据处理周期内;在所述当前时间点为所述数据校验时间点时,根据所述待校验数据表对应的预设SQL脚本,对所述待校验数据表进行数据质量校验。
本申请实施例通过对目标数据仓库的不同数据处理层的数据设置不同的数据校验时间点,进而在当前时间点为对应的数据处理层的数据校验时间点时,采用相应的数据质量校验方式对待校验数据表进行校验,从而实现在目标数据仓库的数据处理层处理待校验数据表时即对待校验数据表进行数据质量校验,而非在待校验数据表的数据使用阶段才进行数据质量的校验,也即,实现了对于目标数据仓库的数据在应用前进行数据指标校验的目的,而非在数据表被使用时才能发现存在数据质量异常,所以,克服了由于数据应用时会涉及到大规模数据,导致易出现影响决策准确性的情况的技术缺陷,所以,提升了进行数据质量管控的管控效果。
其中,所述数据校验时间点为所述数据处理层对所述待校验数据表进行数据处理前的第一校验时间点,所述在所述数据校验时间点对所述待校验数据表进行数据质量校验的步骤包括:
步骤A10,在所述第一校验时间点获取所述待校验数据表的数据校验信息;
步骤A20,根据所述数据校验信息,对所述待校验数据表进行数据质量校验。
在本实施例中,需要说明的是,由于不同的数据处理层对数据进行处理的方式不同,且不同数据处理层位于待校验数据表的数据在目标数据仓库中的不同流转阶段,进而对于不同的数据处理层需设置不同的数据质量校验时间点,其中,数据校验时间点为数据处理层对待校验数据表进行数据处理前的第一校验时间点,通过在第一校验时间点进行数据质量校验,可有效检测出输入数据处理层的源数据是否存在异常,即,提升了对待校验数据表的数据质量校验针对性,例如,在一种可实施的方式中,假设数据处理层为ODS层,则在第一校验时间点进行数据质量校验可校验出从业务系统同步的业务数据质量,其中,数据校验信息用于表征判定数据质量的参数,具体可以为数据量、数据波动量以及数据增长量等。
作为一种示例,步骤A10至步骤A20包括:在所述第一校验时间点获取所述待校验数据表的数据量;根据所述数据量对所述待校验数据表进行数据质量校验。由于第一校验时间点为数据处理层对待校验数据表进行数据处理前的时间点,即,在该校验时间点进行数据校验将有效地校验出即将输入至数据处理层的源数据的数据质量情况,而非在数据处理层校验出数据质量异常情况后,无法针对性分析出产生数据质量异常的原因,所以,提升了对待校验数据表的数据质量校验针对性。
其中,所述数据校验时间点为所述数据处理层对所述待校验数据表进行数据处理后的第二校验时间点,所述在所述数据校验时间点对所述待校验数据表进行数据质量校验的步骤包括:
步骤B10,在所述第二校验时间点获取所述待校验数据表的数据标识信息和数据校验信息;
步骤B20,根据所述数据标识信息,检测所述数据处理层对所述待校验数据表进行的数据处理是否存在异常;
步骤B30,若是,则校验得到所述待校验数据表数据质量异常的校验结果;
步骤B40,若否,则根据所述数据校验信息,对所述待校验数据表进行数据质量校验。
在本实施例中,需要说明的是,对于数据处理层的输入,可通过在第一校验时间点进行数据质量校验进行判别,而数据处理层在对待校验数据表进行处理的过程中也可能导致数据异常,所以,为有效检测出数据处理层的输出数据是否存在异常,即,提升了对待校验数据表的数据质量校验针对性,所以,在进行数据质量校验时,可通过设置第二校验时间点进行数据处理层输出数据的数据质量校验,其中,第二校验时间点为数据处理层对待校验数据表进行数据处理后的时间点,数据标识信息用于标识数据的身份,具体可以为主键,例如,在一种可实施的方式中,在同一主键下存在多条数据时,则表示待校验数据表在处理的过程中存在数据异常,或者在校验待校验数据表的主键出现异常时,则表明待校验数据表在数据处理的过程中存在数据异常,与此同时,由于进行数据处理的数据处理层相当于目标数据仓库的中间层,进而在针对待校验数据表在数据处理层的数据处理过程进行数据质量校验外,还需要依赖于数据校验信息对待校验数据表进行数据质量校验。
作为一种示例,步骤B10至步骤B40包括:在所述第二校验时间点获取所述待校验数据表的主键和数据校验信息;根据所述主键,检测所述数据处理层对所述待校验数据表进行的数据处理是否存在异常;若检测到所述主键存在异常,则确定所述数据管理层对所述待校验数据表进行的数据处理存在异常,以及校验得到所述待校验数据表数据质量异常的校验结果;若检测到所述主键不存在异常,则通过所述数据校验信息对所述待校验数据表进行数据质量校验。
其中,所述数据校验信息包括日波动数据量和日环比数据量,所述根据所述数据校验信息,对所述待校验数据表进行数据质量校验的步骤包括:
步骤C10,获取所述待校验数据表对应的历史数据表;
步骤C20,根据所述待校验数据表和所述历史数据表之间的数据量关系,对所述历史数据表进行数据表类型检测;
步骤C30,若检测到所述待校验数据表为第一类型数据表,则根据所述日波动数据量,对所述待校验数据表进行数据质量校验;
步骤C40,若检测到所述待校验数据表为第二类型数据表,则根据所述日环比数据量,对所述待校验数据表进行数据质量校验。
在本实施例中,需要说明的是,通过收集具体的数据进行一一比对,将降低数据质量校验效率,进而在本申请实施例中通过引入日波动数据量和日环比数据量作为数据校验信息对待校验数据表进行数据质量校验,其中,日波动数据量用于表征每日数据量的变化值,日环比数据量用于表征当前周期内的数据量与上一周期的数据量之间的比值,对于不同类型的数据表而言,其数据量的变化情况存在一定的特性,例如,对于全量数据表而言,其数据来量是随着时间的拉长而增加的,而增量数据表的数据量是处于动态变化中的,即可能增加也可能减少,其中,第一类型数据表具体可以为增量数据表,第二类型数据表具体可以为全量数据表,对于增量数据表和全量数据表的区分,既可以通过人工方式去判别,也可通过待校验数据表的表类型标签字段进行区分,由于增量数据表和全量数据表在数据量上存在量级差距,也可通过引入历史数据表进行区分,历史数据表用于表征单周期内所采集到的数据,具体可以为待校验数据表在一天前的数据表,例如,在一种可实施的方式中,假设历史数据表的数据量为100,而待校验数据表的数据量为10000,则表明待校验数据表为全量数据表。
作为一种示例,步骤C10至步骤C40包括:获取所述待校验数据表对应的历史数据表;通过检测所述待校验数据表和所述历史数据表之间的数据量之差,对所述历史数据表进行数据表类型检测;若检测到所述待校验数据表为增量数据表,则通过确定所述增量数据表的日波动数据量是否超过预设日波动数据量阈值,对所述增量数据表进行数据质量检测;若检测到所述待校验数据表为全量数据表,则通过确定所述日环比数据量是否超过预设日环比数据量阈值,对所述全量数据表进行数据质量校验。
其中,所述通过确定所述增量数据表的日波动数据量是否超过预设日波动数据量阈值,对所述增量数据表进行数据质量检测的具体步骤为:
若确定所述增量数据表的日波动数据值超过预设日波动数据量阈值,则校验得到所述增量数据表数据质量异常的校验结果,若确定所述增量数据表的日波动数据值未超过预设日波动数据量阈值,则校验得到所述增量数据表数据质量正常的校验结果。
其中,所述通过确定所述日环比数据量是否超过预设日环比数据量阈值,对所述全量数据表进行数据质量校验的具体步骤为:
若确定所述日环比数据量大于1,则表征每日数据表处于递增之中,即,校验得到所述全量数据表数据质量正常的校验结果,若确定所述日环比数据量小于或者等于1,则表征每日数据表未处于递增之中,即,校验得到所述全量数据表数据质量异常的校验结果。
其中,所述数据校验时间点为所述数据处理层生成所述待校验数据表对应的业务数据指标的第三校验时间点,所述在所述数据校验时间点对所述待校验数据表进行数据质量校验的步骤包括:
步骤D10,在所述第三校验时间点获取所述业务数据指标的数据指标值;
步骤D20,根据所述数据指标值和预设数据指标值之间的大小关系,对所述待校验数据表进行数据质量校验。
在本实施例中,需要说明的是,在目标数据仓库输出业务数据指标前,可通过监控业务数据指标的指标值确认业务数据指标在不同时间段的波动值是否处于正常波动范围内,从而得以校验等待进行使用的待校验数据表是否数据质量异常,即,第三校验时间点为数据处理层生成业务数据指标的时间点,通过第三校验时间点,即,在第三校验时间点进行数据校验将有效地校验出即将进行应用的数据表的数据质量情况,其中,数据指标值具体可以为订单率、订单完成率以及订单退回率等。
作为一种示例,步骤D10至步骤D20包括:在所述第三校验时间点获取所述业务数据指标的数据指标值;若所述数据指标值大于预设数据指标值,则校验得到所述待校验数据表数据质量异常的校验结果,若所述数据指标值小于或者等于预设数据指标值,则校验得到所述待校验数据表数据质量正常的校验结果。
本申请实施例提供了一种数据质量校验方法,也即,在目标数据仓库的数据处理层获取待校验数据表;根据所述数据处理层,确定所述待校验数据表的数据校验时间点,其中,所述数据校验时间点位于所述数据处理层的数据处理周期内;在所述数据校验时间点对所述待校验数据表进行数据质量校验。
本申请实施例在进行待校验数据表的数据质量校验时,首先在目标数据仓库的数据处理层直接获取数据处理层中的待校验数据表,进而通过数据处理层确定待校验数据表的数据校验时间点,最终在位于数据处理层数据处理周期内的数据校验时间点对待校验数据表进行数据质量校验,由于数据校验时间点位于数据处理层的数据处理周期内,进而即可在数据处理层中对待校验数据表进行数据质量校验,即,实现了将待校验数据表中的数据在目标数据仓库中进行数据质量校验的目的。
由于数据校验时间点发生于数据处理层的数据处理周期内,进而对于待待校验数据表中的数据在数据处理层中即可实现数据质量校验,也即,实现了对于目标数据仓库的数据在应用前进行数据指标校验的目的,从而得以对应用数据是否存在数据质量异常进行预判。
基于此,本申请实施例通过在数据处理层的数据处理周期内对待校验数据表进行数据质量校验,进而得以提前判定待校验数据表中的数据质量情况,即,实现了对于目标数据仓库的数据在应用前进行数据指标校验的目的。而非在数据表被使用时才能发现存在数据质量异常。所以,克服了由于数据应用时会涉及到大规模数据,导致易出现影响决策准确性的情况的技术缺陷,所以,提升了进行数据质量管控的管控效果。
实施例二
进一步地,参照图2,在本申请另一实施例中,与上述实施例一相同或相似的内容,可以参考上文介绍,后续不再赘述。在此基础上,所述数据质量校验方法还包括:
步骤E10,在所述目标数据仓库对应的至少一个数据集市下的核心数据表均完成数据处理后,获取各所述数据集市共同对应的基础数据表集,其中,所述基础数据表集包括至少一个基础数据表;
步骤E20,对于任一所述基础数据表,为所述基础数据表匹配对应的数据质量校验规则,以及根据所述数据质量校验规则,对所述基础数据表进行数据质量校验;
步骤E30,在预设数据质量管控界面显示所述基础数据表集的数据质量校验结果。
在本实施例中,需要说明的是,由于目标数据仓库中数据表的表单量十分庞大,倘若为目标数据仓库不同数据处理层的数据表均设置对应的数据质量校验规则,将导致进行数据质量校验的校验工作量十分之大,进而在对于一些基础数据表,可采用大数据的数据质量批量监测工具,即,通过批量的1文本指令(每一数据质量校验规则对应一行命令),对数据集市下批量的基础数据表设置数据质量校验,其中,数据质量校验规则可由运维人员基于实际需求运用大数据工具实际设置得到,例如,在一种可实施的方式中,数据质量校验规则可基于excel工具设置得到,数据质量校验规则包括规则序号、校验模板、数据库名、数据表名、主键、校验类型、表行数阈值、过滤条件以及告警接收人等,预设数据质量管控界面为数据质量校验系统的可视化界面,其中,核心数据表和基础数据表可通过表中数据是否为业务数据进行区分。
作为一种示例,步骤E10至步骤E30包括:在所述目标数据仓库对应的至少一个数据集市下的核心数据表均完成数据处理后,获取各所述数据集市共同对应的基础数据表集,其中,所述基础数据表集包括至少一个基础数据表;对于任一所述基础数据表,以所述基础数据表的主键为索引,在预设数据质量校验规则表中查询到对应的数据质量校验规则,根据所述数据质量校验规则,对所述基础数据表进行数据质量校验;在所述基础数据表集中的所有基础数据表均校验完成后,在预设数据质量管控界面显示所述基础数据集的数据质量校验结果。
其中,所述为所述基础数据表匹配对应的数据质量校验规则的步骤包括:
步骤F10,根据所述基础数据表的字段标识,提取所述基础数据表的至少一个核心字段;
步骤F20,根据各所述核心字段和对应的字段权重,为所述基础数据表匹配预设校验规则模板;
步骤F30,将各所述核心字段插入所述预设校验规则模板,得到所述数据质量校验规则。
在本实施例中,需要说明的是,同一类型的基础数据表只是在部分字段上存在区别,其数据质量校验逻辑具备共性,进而通过更改数据质量校验规则中的字段即可实现基础数据质量校验逻辑的复用,其中,核心字段具体可以为关联于业务的字段,在存在多个关联业务的字段时,可通过不同字段权重,确定基础数据表的模板倾向度,模板倾向度用于表征基础数据表倾向于预设校验规则模板的倾向程度,从而在预设校验规则末班中插入核心字段后,即可得到基础数据表的数据质量校验规则。
作为一种示例,步骤F10至步骤F30包括:根据所述基础数据表的字段标识,提取所述基础数据表的至少一个核心字段;以各所述核心字段和对应的字段权重,计算所述基础数据表的模板倾向度,以所述模板倾向度为索引,查询得到所述基础数据表对应的预设校验规则模板;将各所述核心字段插入至所述预设校验规则模板,得到所述数据质量校验规则。
其中,需要说明的是,在不同数据处理层均可设置对应的数据校验时间点进行数据校验,与此同时,当某一数据处理层校验得到待校验数据表数据质量异常的校验结果之后,可通过执行具体的告警操作进行数据质量校验情况反馈,例如,参照图3,图3为表示数据质量校验的流程示意图,针对不同数据处理层和不同数据表均设置有数据质量监控手段,在某一数据管理层或者某一类数据表(核心数据表或者基础数据表)出现数据质量异常时则电话告警运维人员。
本申请实施例提供了一种数据质量校验结果显示方法,也即,在所述目标数据仓库对应的至少一个数据集市下的核心数据表均完成数据处理后,获取各所述数据集市共同对应的基础数据表集,其中,所述基础数据表集包括至少一个基础数据表;对于任一所述基础数据表,为所述基础数据表匹配对应的数据质量校验规则,以及根据所述数据质量校验规则,对所述基础数据表进行数据质量校验;在预设数据质量管控界面显示所述基础数据表集的数据质量校验结果。本申请实施例在面对数据集市下的大规模数据基础表时,提前通过大数据工具为不同的数据基础表设置有数据质量校验规则,进而在数据质量校验的过程中可通过批量的文本指令对基础数据表进行校验,并最终在预设数据质量管控界面进行数据质量校验结果的显示,从而提升了对数据集市下数据质量校验的校验效率。
实施例三
本申请实施例还提供一种数据质量校验装置,参照图4,所述数据质量校验装置包括:
获取模块101,用于获取待校验数据表在所述目标数据仓库所处的数据处理层;
确定模块102,用于根据所述数据处理层,确定所述待校验数据表的数据校验信息;
校验模块103,用于根据所述数据校验信息,对所述待校验数据表进行数据质量校验。
可选地,所述数据校验时间点为所述数据处理层对所述待校验数据表进行数据处理前的第一校验时间点,所述校验模块103还用于:
在所述第一校验时间点获取所述待校验数据表的数据校验信息;
根据所述数据校验信息,对所述待校验数据表进行数据质量校验。
可选地,所述数据校验时间点为所述数据处理层对所述待校验数据表进行数据处理后的第二校验时间点,所述校验模块103还用于:
在所述第二校验时间点获取所述待校验数据表的数据标识信息和数据校验信息;
根据所述数据标识信息,检测所述数据处理层对所述待校验数据表进行的数据处理是否存在异常;
若是,则校验得到所述待校验数据表数据质量异常的校验结果;
若否,则根据所述数据校验信息,对所述待校验数据表进行数据质量校验。
可选地,所述数据校验信息包括日波动数据量和日环比数据量,所述校验模块103还用于:
获取所述待校验数据表对应的历史数据表;
根据所述待校验数据表和所述历史数据表之间的数据量关系,对所述历史数据表进行数据表类型检测;
若检测到所述待校验数据表为第一类型数据表,则根据所述日波动数据量,对所述待校验数据表进行数据质量校验;
若检测到所述待校验数据表为第二类型数据表,则根据所述日环比数据量,对所述待校验数据表进行数据质量校验。
可选地,所述数据校验时间点为所述数据处理层生成所述待校验数据表对应的业务数据指标的第三校验时间点,所述校验模块103还还用于:
在所述第三校验时间点获取所述业务数据指标的数据指标值;
根据所述数据指标值和预设数据指标值之间的大小关系,对所述待校验数据表进行数据质量校验。
可选地,所述数据质量校验装置还用于:
在所述目标数据仓库对应的至少一个数据集市下的核心数据表均完成数据处理后,获取各所述数据集市共同对应的基础数据表集,其中,所述基础数据表集包括至少一个基础数据表;
对于任一所述基础数据表,为所述基础数据表匹配对应的数据质量校验规则,以及根据所述数据质量校验规则,对所述基础数据表进行数据质量校验;
在预设数据质量管控界面显示所述基础数据表集的数据质量校验结果。
可选地,所述数据质量校验装置还用于:
根据所述基础数据表的字段标识,提取所述基础数据表的至少一个核心字段;
根据各所述核心字段和对应的字段权重,为所述基础数据表匹配预设校验规则模板;
将各所述核心字段插入所述预设校验规则模板,得到所述数据质量校验规则。
本发明提供的数据质量校验装置,采用上述实施例中的数据质量校验方法,解决了进行数据质量管控的管控效果差的技术问题。与现有技术相比,本发明实施例提供的数据质量校验装置的有益效果与上述实施例提供的数据质量校验方法的有益效果相同,且该数据质量校验装置中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
实施例四
本发明实施例提供一种电子设备,电子设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例一中的数据质量校验方法。
下面参考图5,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备可以包括处理装置1001(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(ROM)1002中的程序或者从存储装置1003加载到随机访问存储器(RAM)1004中的程序而执行各种适当的动作和处理。在RAM1004中,还存储有电子设备操作所需的各种程序和数据。处理装置1001、ROM1002以及RAM1004通过总线1005彼此相连。输入/输出(I/O)接口1006也连接至总线。
通常,以下系统可以连接至I/O接口1006:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置1007;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置1008;包括例如磁带、硬盘等的存储装置1003;以及通信装置1009。通信装置可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种系统的电子设备,但是应理解的是,并不要求实施或具备所有示出的系统。可以替代地实施或具备更多或更少的系统。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置1009从网络上被下载和安装,或者从存储装置1003被安装,或者从ROM1002被安装。在该计算机程序被处理装置1001执行时,执行本公开实施例的方法中限定的上述功能。
本发明提供的电子设备,采用上述实施例中的数据质量校验方法,解决了进行数据质量管控的管控效果差的技术问题。与现有技术相比,本发明实施例提供的电子设备的有益效果与上述实施例提供的数据质量校验方法的有益效果相同,且该电子设备中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式的描述中,具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
实施例五
本实施例提供一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行上述实施例中的数据质量校验方法。
本发明实施例提供的计算机可读存储介质例如可以是U盘,但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读存储介质可以是电子设备中所包含的;也可以是单独存在,而未装配入电子设备中。
上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被电子设备执行时,使得电子设备:在目标数据仓库的数据处理层获取待校验数据表;根据所述数据处理层,确定所述待校验数据表的数据校验时间点,其中,所述数据校验时间点位于所述数据处理层的数据处理周期内;在所述数据校验时间点对所述待校验数据表进行数据质量校验。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该单元本身的限定。
本发明提供的计算机可读存储介质,存储有用于执行上述数据质量校验方法的计算机可读程序指令,解决了进行数据质量管控的管控效果差的技术问题。与现有技术相比,本发明实施例提供的计算机可读存储介质的有益效果与上述实施例提供的数据质量校验方法的有益效果相同,在此不做赘述。
实施例六
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的数据质量校验方法的步骤。
本申请提供的计算机程序产品解决了进行数据质量管控的管控效果差的技术问题。与现有技术相比,本发明实施例提供的计算机程序产品的有益效果与上述实施例提供的数据质量校验方法的有益效果相同,在此不做赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

Claims (10)

1.一种数据质量校验方法,其特征在于,所述数据质量校验方法包括:
在目标数据仓库的数据处理层获取待校验数据表;
根据所述数据处理层,确定所述待校验数据表的数据校验时间点,其中,所述数据校验时间点位于所述数据处理层的数据处理周期内;
在所述数据校验时间点对所述待校验数据表进行数据质量校验。
2.如权利要求1所述数据质量校验方法,其特征在于,所述数据校验时间点为所述数据处理层对所述待校验数据表进行数据处理前的第一校验时间点,
所述在所述数据校验时间点对所述待校验数据表进行数据质量校验的步骤包括:
在所述第一校验时间点获取所述待校验数据表的数据校验信息;
根据所述数据校验信息,对所述待校验数据表进行数据质量校验。
3.如权利要求1所述数据质量校验方法,其特征在于,所述数据校验时间点为所述数据处理层对所述待校验数据表进行数据处理后的第二校验时间点,
所述在所述数据校验时间点对所述待校验数据表进行数据质量校验的步骤包括:
在所述第二校验时间点获取所述待校验数据表的数据标识信息和数据校验信息;
根据所述数据标识信息,检测所述数据处理层对所述待校验数据表进行的数据处理是否存在异常;
若是,则校验得到所述待校验数据表数据质量异常的校验结果;
若否,则根据所述数据校验信息,对所述待校验数据表进行数据质量校验。
4.如权利要求2或3任一所述数据质量校验方法,其特征在于,所述数据校验信息包括日波动数据量和日环比数据量,
所述根据所述数据校验信息,对所述待校验数据表进行数据质量校验的步骤包括:
获取所述待校验数据表对应的历史数据表;
根据所述待校验数据表和所述历史数据表之间的数据量关系,对所述历史数据表进行数据表类型检测;
若检测到所述待校验数据表为第一类型数据表,则根据所述日波动数据量,对所述待校验数据表进行数据质量校验;
若检测到所述待校验数据表为第二类型数据表,则根据所述日环比数据量,对所述待校验数据表进行数据质量校验。
5.如权利要求1所述数据质量校验方法,其特征在于,所述数据校验时间点为所述数据处理层生成所述待校验数据表对应的业务数据指标的第三校验时间点,
所述在所述数据校验时间点对所述待校验数据表进行数据质量校验的步骤包括:
在所述第三校验时间点获取所述业务数据指标的数据指标值;
根据所述数据指标值和预设数据指标值之间的大小关系,对所述待校验数据表进行数据质量校验。
6.如权利要求1所述数据质量校验方法,其特征在于,所述数据质量校验方法还包括:
在所述目标数据仓库对应的至少一个数据集市下的核心数据表均完成数据处理后,获取各所述数据集市共同对应的基础数据表集,其中,所述基础数据表集包括至少一个基础数据表;
对于任一所述基础数据表,为所述基础数据表匹配对应的数据质量校验规则,以及根据所述数据质量校验规则,对所述基础数据表进行数据质量校验;
在预设数据质量管控界面显示所述基础数据表集的数据质量校验结果。
7.如权利要求6所述数据质量校验方法,其特征在于,所述为所述基础数据表匹配对应的数据质量校验规则的步骤包括:
根据所述基础数据表的字段标识,提取所述基础数据表的至少一个核心字段;
根据各所述核心字段和对应的字段权重,为所述基础数据表匹配预设校验规则模板;
将各所述核心字段插入所述预设校验规则模板,得到所述数据质量校验规则。
8.一种数据质量校验装置,其特征在于,所述数据质量校验装置包括:
获取模块,用于获取待校验数据表在所述目标数据仓库所处的数据处理层;
确定模块,用于根据所述数据处理层,确定所述待校验数据表的数据校验信息;
校验模块,用于根据所述数据校验信息,对所述待校验数据表进行数据质量校验。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;
与所述至少一个处理器通信连接的存储器;
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一项所述的数据质量校验方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有实现数据质量校验方法的程序,所述实现数据质量校验方法的程序被处理器执行以实现如权利要求1至7中任一项所述数据质量校验方法的步骤。
CN202311603208.8A 2023-11-27 2023-11-27 数据质量校验方法、装置、电子设备及可读存储介质 Pending CN117632928A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311603208.8A CN117632928A (zh) 2023-11-27 2023-11-27 数据质量校验方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311603208.8A CN117632928A (zh) 2023-11-27 2023-11-27 数据质量校验方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN117632928A true CN117632928A (zh) 2024-03-01

Family

ID=90015797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311603208.8A Pending CN117632928A (zh) 2023-11-27 2023-11-27 数据质量校验方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN117632928A (zh)

Similar Documents

Publication Publication Date Title
US11487539B2 (en) Systems and methods for automating and monitoring software development operations
CN112650685B (zh) 自动化测试方法、装置、电子设备及计算机存储介质
CN110674047B (zh) 软件测试方法、装置及电子设备
CN111679990B (zh) 测试数据生成方法、装置、可读介质及电子设备
CN113312341B (zh) 一种数据质量监控方法、系统和计算机设备
CN111581005B (zh) 终端修复方法、终端和存储介质
CN115825312B (zh) 色谱检测数据交互方法、装置、设备和计算机可读介质
CN112817831A (zh) 应用性能监测方法、装置、计算机系统和可读存储介质
CN112054934B (zh) 一种协议检测方法、装置及电子设备
CN117632928A (zh) 数据质量校验方法、装置、电子设备及可读存储介质
CN111367791B (zh) 一种生成测试用例的方法、装置、介质和电子设备
CN109960659B (zh) 用于检测应用程序的方法和装置
CN112181750A (zh) 工控网络设备的稳定性的测试方法、装置及介质
CN111831527A (zh) 扫描数据库性能问题的方法、装置、电子设备、及介质
CN110928801A (zh) 角色权限的测试方法及装置、计算机介质和电子设备
CN115994100B (zh) 系统活跃度检测方法、装置、电子设备及可读存储介质
WO2023138572A1 (zh) 用户标签检测方法、装置、电子设备及可读存储介质
CN115237816B (zh) 系统功能验证方法、装置、电子设备及可读存储介质
CN115994070B (zh) 系统可用率检测方法、装置、电子设备及可读存储介质
CN115437535B (zh) 针对烟草制丝车间的数据处理方法、装置、设备与介质
CN117493150A (zh) 代码质量检测方法、装置、设备、存储介质及程序
CN116467139A (zh) 系统告警重复率检测方法、电子设备及可读存储介质
CN118069491A (zh) 增量覆盖率确定方法、装置、设备、存储介质和程序产品
CN115203220A (zh) 一种数据处理方法、系统、电子设备及存储介质
CN115344301A (zh) 配置文件校验方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination