CN117827832A - 数据核验方法、装置、计算机设备和存储介质 - Google Patents
数据核验方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN117827832A CN117827832A CN202311731608.7A CN202311731608A CN117827832A CN 117827832 A CN117827832 A CN 117827832A CN 202311731608 A CN202311731608 A CN 202311731608A CN 117827832 A CN117827832 A CN 117827832A
- Authority
- CN
- China
- Prior art keywords
- verification
- rule
- target
- data
- service data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013524 data verification Methods 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000012795 verification Methods 0.000 claims abstract description 419
- 238000004590 computer program Methods 0.000 claims abstract description 30
- 238000013507 mapping Methods 0.000 claims description 32
- 230000006870 function Effects 0.000 claims description 16
- 238000012423 maintenance Methods 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种数据核验方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待核验业务数据,确定待核验业务数据的业务数据类型;根据业务数据类型确定目标规则表,并根据业务数据类型和确定待核验业务数据的目标核验方式;基于目标核验方式在目标规则表中确定待执行核验规则,并基于待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果。采用本方法能够降低数据核验的运维复杂度。
Description
技术领域
本申请涉及数据质量检核技术领域,特别是涉及一种数据核验方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
目前的业务监管报送系统需要质量核验的业务数据项大幅增长,且业务数据的数据结构越来越复杂,不同业务下的各业务数据的检验标准各不相同,因此,针对业务数据的核验越来越困难。
传统技术中,技术人员根据人为制定的业务数据核验规则,确定配置参数和模板信息,根据配置参数和模板信息自动化生成规则SQL(Structured Query Language,结构化查询语言),通过将规则SQL与Hadoop(分布式系统基础架构)生态系统中的应用程序代码结合,生成规则检核的业务数据核验程序,即将规则SQL打包为JAR(Java Archive,Java文件归档)包,并在Hadoop(分布式系统基础架构)生态系统中部署该JAR包,完成对业务数据核验程序的编译,通过业务数据核验程序对业务数据进行质量核验。其中,将数据从关系型数据库中的SQL规则导入到Hadoop生态系统中进行跨平台分析的过程中,需要使用大数据工具组件Sqoop(SQL-to-Hadoop,一种数据传输工具)进行数据传输。
然而,传统技术中,由于业务数据核验程序需要大数据工具组件进行跨平台分析,导致业务数据核验程序的运维复杂度较高。
发明内容
基于此,有必要针对上述技术问题,提供一种数据核验方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种数据核验方法,包括:
获取待核验业务数据,确定所述待核验业务数据的业务数据类型;
根据所述业务数据类型确定目标规则表,并根据所述业务数据类型和确定所述待核验业务数据的目标核验方式;
基于所述目标核验方式在所述目标规则表中确定待执行核验规则,并基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果。
在其中一个实施例中,所述根据所述业务数据类型和确定所述待核验业务数据的目标核验方式,包括:
根据所述业务数据类型和主键信息表确定报送模型主键配置;
基于所述报送模型主键配置对所述业务数据进行匹配,基于匹配结果确定目标核验方式。
在其中一个实施例中,所述目标规则表包括基础规则配置表;
所述基于所述目标核验方式在所述目标规则表中确定待执行核验规则,并基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果,包括:
基于目标核验方式确定目标扫描方式;
根据所述目标扫描方式对待核验业务数据进行数据扫描,得到目标核验数据;
针对每个所述目标核验数据,在所述基础规则配置表中确定所述目标核验数据对应的待执行核验规则;
根据每个所述目标核验数据对应的所述待执行核验规则分别对每个所述目标核验数据进行本地核验,得到目标核验结果。
在其中一个实施例中,所述基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果,包括:
基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到初始核验结果;
根据所述初始核验结果分别在问题明细表和规则定义表中进行匹配,得到所述初始核验结果对应的问题明细信息和核验描述信息;
根据所述问题明细信息、所述核验描述信息和所述初始核验结果构建核验清单,作为目标核验结果。
在其中一个实施例中,所述获取待核验业务数据之前,所述方法还包括:
获取初始核验规则,根据预设分类规则对初始规则进行分类,得到合理性校验规则、码表型校验规则、函数型校验规则和跨表型校验规则;
根据所述合理性校验规则、所述码表型校验规则、所述函数型校验规则和所述跨表型校验规则构建基础规则配置表和专项规则映射表,作为目标规则表。
在其中一个实施例中,所述目标规则表包括专项规则映射表;
所述基于所述目标核验方式在所述目标规则表中确定待执行核验规则,并基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果,包括:
在所述目标核验方式包括专项核验的情况下,根据专项规则映射表确定待执行核验规则;
基于所述待执行核验规则对所述待核验业务数据进行数据核验,得到目标核验结果。
第二方面,本申请还提供了一种数据核验装置,包括:
获取模块,用于获取待核验业务数据,确定所述待核验业务数据的业务数据类型;
第一确定模块,用于根据所述业务数据类型确定目标规则表,并根据所述业务数据类型和确定所述待核验业务数据的目标核验方式;
第一核验模块,用于基于所述目标核验方式在所述目标规则表中确定待执行核验规则,并基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果。
在其中一个实施例中,所述第一确定模块具体用于根据所述业务数据类型和主键信息表确定报送模型主键配置;
基于所述报送模型主键配置对所述业务数据进行匹配,基于匹配结果确定目标核验方式。
在其中一个实施例中,所述目标规则表包括基础规则配置表;所述第一核验模块具体用于基于目标核验方式确定目标扫描方式;
根据所述目标扫描方式对待核验业务数据进行数据扫描,得到目标核验数据;
针对每个所述目标核验数据,在所述基础规则配置表中确定所述目标核验数据对应的待执行核验规则;
根据每个所述目标核验数据对应的所述待执行核验规则分别对每个所述目标核验数据进行本地核验,得到目标核验结果。
在其中一个实施例中,所述第一核验模块具体用于基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到初始核验结果;
根据所述初始核验结果分别在问题明细表和规则定义表中进行匹配,得到所述初始核验结果对应的问题明细信息和核验描述信息;
根据所述问题明细信息、所述核验描述信息和所述初始核验结果构建核验清单,作为目标核验结果。
在其中一个实施例中,所述装置还包括:
分类模块,用于获取初始核验规则,根据预设分类规则对初始规则进行分类,得到合理性校验规则、码表型校验规则、函数型校验规则和跨表型校验规则;
构建模块,用于根据所述合理性校验规则、所述码表型校验规则、所述函数型校验规则和所述跨表型校验规则构建基础规则配置表和专项规则映射表,作为目标规则表。
在其中一个实施例中,所述目标规则表包括专项规则映射表,所述装置还包括:
第二确定模块,用于在所述目标核验方式包括专项核验的情况下,根据专项规则映射表确定待执行核验规则;
基于所述待执行核验规则对所述待核验业务数据进行数据核验,得到目标核验结果。
第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待核验业务数据,确定所述待核验业务数据的业务数据类型;
根据所述业务数据类型确定目标规则表,并根据所述业务数据类型和确定所述待核验业务数据的目标核验方式;
基于所述目标核验方式在所述目标规则表中确定待执行核验规则,并基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果。第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待核验业务数据,确定所述待核验业务数据的业务数据类型;
根据所述业务数据类型确定目标规则表,并根据所述业务数据类型和确定所述待核验业务数据的目标核验方式;
基于所述目标核验方式在所述目标规则表中确定待执行核验规则,并基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果。
第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取待核验业务数据,确定所述待核验业务数据的业务数据类型;
根据所述业务数据类型确定目标规则表,并根据所述业务数据类型和确定所述待核验业务数据的目标核验方式;
基于所述目标核验方式在所述目标规则表中确定待执行核验规则,并基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果。上述数据核验方法、装置、计算机设备、存储介质和计算机程序产品,获取待核验业务数据,确定所述待核验业务数据的业务数据类型;根据所述业务数据类型确定目标规则表,并根据所述业务数据类型和确定所述待核验业务数据的目标核验方式;基于所述目标核验方式在所述目标规则表中确定待执行核验规则,并基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果。采用本方法,通过目标规则表包含的核验规则对待核验业务数据进行本地核验的方法,可以在单一数据开发环境中进行执行和维护,无需使用跨平台传输的大数据工具组件,且对于目标规则表的维护成本远小于对跨平台数据处理的业务数据核验程序的运维难度,进而降低数据核验的运维复杂度。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中数据核验方法的应用环境图;
图2为一个实施例中确定目标核验方式的流程示意图;
图3为一个实施例中确定目标核验结果的流程示意图;
图4为一个另实施例中确定目标核验结果的流程示意图;
图5为一个实施例中确定目标规则表的流程示意图;
图6为一个实施例中规则分类方法的示意图;
图7为一个另实施例中确定目标核验结果的流程示意图;
图8为一个实施例中数据核验方法示例的流程示意图;
图9为一个实施例中数据核验装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种数据核验方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤102,获取待核验业务数据,确定待核验业务数据的业务数据类型。
本申请实施例中,终端获取待核验业务数据,业务数据可以为不同业务类型的业务保单中包含的业务数据,监管部门对于不同的业务类型具有不同的监管标准。保险企业在上报业务数据前,可以初步对于业务数据进行核验,包括保单数据、理赔数据、保费数据、客户数据等进行核验,确保业务数据的完整性、准确性和合规性。终端可以根据待核验业务数据的具体来源确定业务数据类型,包括数据接口、数据文件等,根据待核验业务数据的文件或接口,包括FTP(File Transfer Protocol,文件传输协议)下载或API调用,确定待核验业务数据的业务数据类型。或者,终端可以根据待核验业务数据所属的业务保单中记载的保单类型,确定待核验业务数据的业务数据类型。
步骤104,根据业务数据类型确定目标规则表,并根据业务数据类型和确定待核验业务数据的目标核验方式。
本申请实施例中,终端可以预先对业务数据类型进行分组,不同分组结果中的业务数据类型对应不同的规则表。终端根据业务数据类型所处的业务领域和具体地业务需求,在分别对应不同业务类型的规则表中确定目标规则表。随着业务需求的变化和业务数据的演进,目标规则表需要不断地进行维护和更新。这包括添加新的规则、修改旧的规则、删除过时的规则等,以保持规则表与业务需求的一致性。
终端确定目标规则表之后,可以根据目标核验方式对待核验业务数据进行核验。目标核验方式是根据具体的业务数据类型和核验需求来确定的,例如,目标核验方式可以包括跨表核验、单表核验和专项核验,其中,跨表核验为在单个数据表格中进行业务数据的核验,通常涉及到对表格结构、字段规则、数据范围等方面的验证,以确保数据质量和准确性,单表核验常用于比较简单的业务场景;跨表核验为将多个数据表格中的数据进行联合核验,通常涉及到表格之间的关联、关联字段的规则校验、数据匹配等方面的核验,跨表核验通常用于比较复杂的业务场景,例如,目标核验中对数据进行业务逻辑验证、跨表数据比对等方面的需求。跨表核验需要进行多个表格之间的联合查询和验证;专项核验为通过专项规则映射表中的专项规则对专项业务类型的核验,专项规则映射表包含专项业务类型和各专项业务类型对应的专项规则的映射关系。
步骤106,基于目标核验方式在目标规则表中确定待执行核验规则,并基于待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果。
本申请实施例中,终端支持根据检核需求进行程序调用,可支持增量监控、存量扫描和补报检核等场景,基于目标核验方式在目标规则表中自动计算并限定检核范围、选择报送模型等待执行核验规则,并基于待执行核验规则在业务数据中进行筛选、比对、计算等操作,以确定数据是否满足核验规则的要求。可选的,终端可以支持单个规则、报送表、报送模型的扫描方式。
在一个可选的实施例中,在监管部门的核验规则更新时,由于本申请实施例的规则表存储在数据库中,终端可以根据规则更新情况对规则表进行动态修改和扩展,使得在运行时可以根据业务需求进行调整,而无需重新编译和部署代码。
上述数据核验方法中,通过目标规则表包含的核验规则对待核验业务数据进行本地核验的方法,可以在单一数据开发环境中进行执行和维护,无需使用跨平台传输的大数据工具组件,且对于目标规则表的维护成本远小于对跨平台数据处理的业务数据核验程序的运维难度,进而降低数据核验的运维复杂度。
在一个示例性的实施例中,如图2所示,步骤104包括步骤202至步骤204。其中:
步骤202,根据业务数据类型和主键信息表确定报送模型主键配置。
本申请实施例中,主键信息表为预先存储的包含各业务类型对应的需要进行核验的主键信息,包含不同业务表对应的主键列信息和对应的业务数据类型。报送模型可以由多个业务数据表组成,用于将原始业务数据转换为满足报送格式的标准化数据格式,报送模型的数据记录中包含一个或多个主键字段,用于标识每个数据记录,便于进行数据关联、过滤和排序等操作。终端在预先存储的主键信息表中获取业务数据类型对应的主键信息,例如,在保险业务的保单中,通常将保单编号、日期或姓名等数据作为主键。终端根据主键信息表重的主键信息,将需要作为主键的列配置到报送模型,例如,将多个业务表中确定作为主键信息的业务数据类型,并根据该作为主键信息的业务数据类型配置报送模型的主键配置。
在一个可选的实施例中,完成报送模型的主键配置后,终端可以通过查询数据源,检查主键是否能唯一标识每个数据记录,且没有重复,以确保报送模型的数据准确性和唯一性。
步骤204,基于报送模型主键配置对业务数据进行匹配,基于匹配结果确定目标核验方式。
本申请实施例中,终端根据报送模型主键配置对业务数据进行匹配,在多个业务数据表重确定作为主键的列信息,作为匹配结果,该主键的列信息对应业务数据类型,终端中可以预先存储针对不同业务数据类型对应的核验方式,并基于业务数据类型对应的核验方式,基于该匹配结果确定目标核验方式。
本实施例中,基于报送模型主键配置对业务数据进行匹配,并根据匹配结果确定目标核验方式,可以帮助实现数据的准确性和完整性,以满足数据核验的需求。
在一个示例性的实施例中,目标规则表包括基础规则配置表,如图3所示,步骤106包括步骤302至步骤308。其中:
步骤302,基于目标核验方式确定目标扫描方式。
本申请实施例中,不同的目标核验方式具有对应的扫描方式,终端基于目标核验方式在多个扫描方式中确定目标扫描方式。
步骤304,根据目标扫描方式对待核验业务数据进行数据扫描,得到目标核验数据。
本申请实施例中,终端根据确定完成的目标扫描方式对待核验业务数据进行扫描,在待核验业务数据所属的业务表单中确定出具有对应的核验规则的目标核验数据。
步骤306,针对每个目标核验数据,在基础规则配置表中确定目标核验数据对应的待执行核验规则。
本申请实施例中,目标规则表包含基础规则表和专项规则表,终端针对每个目标核验数据,在基础规则配置表中确定目标核验数据对应的待执行核验规则。例如,当目标核验方式为单表核验的情况下,终端首先确定待核验业务数据的业务数据类型,并对包含待核验业务数据的业务数据表和业务数据类型对应的目标规则表进行扫描,得到目标核验数据和目标核验数据对应的核验规则;当目标核验方式为跨表核验的情况下,终端需要扫描主表、右表和主表、右表分别对应的目标规则表进行扫描,得到主表、右表中具有对应关系的目标核验数据和目标核验数据对应的核验规则。
步骤308,根据每个目标核验数据对应的待执行核验规则分别对每个目标核验数据进行本地核验,得到目标核验结果。
本申请实施例中,终端根据每个目标核验数据确定其对应的待执行核验规则后,对每条目标核验数据进行单独的核验。在核验过程中,需要逐一执行待执行核验规则,针对不同的数据类型的目标核验数据和目标核验数据的数据结构进行不同的核验处理。
本实施例中,通过数据库中规则表进行查询的方式,确定待核验业务数据中目标核验业务数据对应的核验规则,并根据核验规则对目标合演数据进行本地核验,得到目标核验结果,实现对待核验数据的核验,且在监管要求发生变化时,扫描更新后的基础规则配置表可以直接实现示对待核验数据的核验,降低了对于核验方法的维护复杂度。
在一个示例性的实施例中,如图4所示,步骤106包括步骤402至步骤406。其中:
步骤402,基于待执行核验规则对待核验业务数据进行本地数据核验,得到初始核验结果。
本申请实施例中,终端基于待执行核验规则对待核验业务数据进行核验得到的结果为初步核验结果,得到的初始核验结果为针对待核验业务数据是否符合核验规则的核验结果。
步骤404,根据初始核验结果分别在问题明细表和规则定义表中进行匹配,得到初始核验结果对应的问题明细信息和核验描述信息。
本申请实施例中,终端在得到待核验业务数据在数据层面的初始核验结果后,在进行输出时,需要将业务数据的初始核验结果和相关信息的描述共同输出,以便针对初始核验结果解决对应的问题,终端将初始核验结果在问题明细表和核验描述信息表进行匹配,以获取初始核验结果对应的问题明细信息和核验描述信息,核验描述信息可以提供初始核验结果相关的解释和说明,其中,问题明细信息和核验描述信息与初始核验结果的匹配可以通过主键或其他关键字段进行对应匹配,以便精准匹配出对应的信息。例如,在问题明细表中根据关键字段值进行匹配,确定初始核验结果对应的问题明细信息,问题明细信息可以包括错误类型、错误描述、错误级别等详细的核验描述信息。
步骤406,根据问题明细信息、核验描述信息和初始核验结果构建核验清单,作为目标核验结果。
本申请实施例中,终端将匹配到的问题明细信息和核验描述信息与初始核验结果进行关联,构建目标核验结果,并将不同业务类型的待核验业务数据的目标核验结果存储至核验结果表中,以便后续对核验结果中的问题进行分析。
终端还可以针对目标检核结果和数据清分配置,将问题数据清分,识别主键、流水号等关键字段信息,在核验结果表中插入针对核验结果中的问题的统计信息,自动化输出检核清单。终端通过规则定义表,可以自动计算并输出规则维度、专项维度数据治理工作需要关注的核心指标。
本实施例中,通过将初始核验结果与问题明细信息和核验描述信息进行关联,构建具有详细问题描述和核验信息的目标核验结果,可以辅助核验人员更好地理解和解决问题,提高数据核验后对目标核验结果进行分析的效率和准确性。
在一个示例性的实施例中,如图5所示,步骤102之前,该方法还包括步骤502至步骤504,其中:
步骤502,获取初始核验规则,根据预设分类规则对初始规则进行分类,得到合理性校验规则、码表型校验规则、函数型校验规则和跨表型校验规则。
本申请实施例中,监管下发的初始核验规则分类为表内核验规则和表间核验规则,表内核验规则为针对单一报送模型中中单表核验方式中对单一表单内的待核验数据进行核验的核验规则,表间核验规则为针对多个报送模型中跨表核验方式的针对至少两个表单中,具有关联关系的待核验模型进行共同核验的核验规则,其中表间核验规则通常分为存在型的校验和逻辑型的校验。
如图6所示,图6为规则分类方法的示例图,终端获取初始核验规则,该初始核验规则包括多个核验规则,其中,合理性校验规则包括针对非空、枚举值的待核验业务数据进行合演的规则,例如,终端将初始核验规则的规则文本拆解为判断文本和验证文本两部分,判断文本即为对于规则校验的前提条件进行判断,即存在“若一个数据项满足……条件时”等判断条件时,将当前核验规则作为判断文本;验证文本为对于该核验规则需要校验的对象(即判断文本对应的主数据项)进行核验,若该规则不需要进行判断,则直接补入缺省值,此类规则的验证文本部分不能为空。
码表型校验规则为基于监管的《业务代码表》中包含的具有强制要求为码值填报的数据项进行校验。此类校验规则固定关联表为《业务代码表》,基于合理性规则相同的原理,将初始核验规则拆解为数据域关联条件文本和验证文本两部分,数据域关联文本为关联此数据项所属数据域,验证文本为对于数据项的码值是否在数据域中存在进行判断。
函数型校验规则为针对包含复杂校验规则的场景下,包含多个判断和验证的校验规则。例如,基于业务规范的针对证件号码,以及证件号码中代表性别的编号与性别,以及代表出生日期的编号与出生日期的一致性校验;函数型校验规则还包括需要嵌套函数进行使用的初始校验规则,例如对于数据项的前几位或者长度进行校验;函数型校验规则还包括复杂程度高的初始校验规则,例如数据项可填报多码值,则需要对于多个码值进行拆分校验;函数型校验规则还包括一个判断或验证文本会涉及到多个字段的初始校验规则,例如,财务模块报送模型常用的金额类计算校验。
跨表型校验规则针对表间核验规则,不同报送模型之间的跨表校验通常针对两个数据模型,分为主表和右表,右表通常为全量表,主表为增量表或全量表。同样可拆解为关联数据域和验证文本两部分,关联数据域为两表关联的条件,使用主键或外键进行关联,可以避免出现笛卡尔积关联降低检核效率。此类校验还可以实现两表以上的数据校验,可使用关联数据域字段辅助添加关联表。
步骤504,根据合理性校验规则、码表型校验规则、函数型校验规则和跨表型校验规则构建基础规则配置表和专项规则映射表,作为目标规则表。
本申请实施例中,终端根据合理性校验规则、码表型校验规则、函数型校验规则和跨表型校验规则构建基础规则配置表和专项规则映射表,其中,目标规则表中的判断操作和验证操作文本可以辅助实现此类规则配置,在此字段嵌套业务函数,传入判断和校验字段以及函数标识,可自动化输出校验文本。其中业务函数统一使用一个存储过程进行开发和维护,便于统一和复用模板。
在一个可选的实施例中,用于待核验业务数据在基础规则配置表和专项规则映射表中进行匹配的配置字段,除了不同规则模式对应的核心字段外,还可以包括共同的提取字段为交易编码、省机构号、数据主系统来源、业务系统来源字段,此类字段固定在数据检核程序中可避免重复提取。此外,基础规则配置表和专项规则映射表中还包括强制配置验证字段和验证条件,以及,支持个性化字段核验的配置,例如,问题数据字段加工过程的过程字段或辅助字段,便于在数据探查阶段对于问题进行归因。在完成规则配置后,需要确保报送表的主键字段已经录入,检核程序可以自动识别规则所属的报送模型,自动将主键信息和流水号信息插入到问题库中。
本实施例中,通过初始核验规则,根据预设分类规则对初始规则进行分类,进而构建目标规则映射表,可以实现自动化配置目标核验规则表,提高数据核验的效率。
在一个示例性的实施例中,目标规则表包括专项规则映射表,如图7所示,,步骤106之后,该方法还包括步骤702至步骤704。其中:
步骤702,在目标核验方式包括专项核验的情况下,根据专项规则映射表确定待执行核验规则。
本申请实施例中,当目标核验方式为专项核验的情况下,终端需要扫描专项规则映射表和专项业务数据表,得到业务数据类型为专项业务的目标核验数据与专项业务对应的核验规则。
步骤704,基于待执行核验规则对待核验业务数据进行数据核验,得到目标核验结果。
本申请实施例中,专项规则映射表包含业务维度上具有特殊性的校验规则,在终端针对专项业务类型的待核验业务数据,单独调用转向规则映射表确定待执行核验规则,在该待执行核验规则下,基于步骤308相同的原理,对专项业务类型的待核验业务数据进行数据核验,得到目标核验结果,本申请实施例对于数据核验过程不再赘述。
本实施例中,通过设置专项规则映射表,使用专项规则映射表对专项业务类型的待核验业务数据进行数据核验,可以扩大数据核验的适配范围,提高数据核验的准确性。
在一个示例性实施例中,如图8所示,图8为一种数据核验方法的示例的流程图,终端中包含配置完成的规则定义表、规则配置表和专项规则映射表。在增量监控、存量检核和补报检核的情况下,终端按照预设执行方式代码匹配扫描方式,执行方式包括规则扫描、单表扫描和转向扫描,并根据规则类型代码触发对应的校验方式,并根据初始校验结果与问题明细表、问题统计表和规则定义表相关联,得到核验清单,作为目标核验结果。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的数据核验方法的数据核验装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个数据核验装置实施例中的具体限定可以参见上文中对于数据核验方法的限定,在此不再赘述。
在一个示例性的实施例中,如图9所示,提供了一种数据核验装置900,包括:获取模块901、第一确定模块902和第一核验模块903,其中:
获取模块901,用于获取待核验业务数据,确定待核验业务数据的业务数据类型;
第一确定模块902,用于根据业务数据类型确定目标规则表,并根据业务数据类型和确定待核验业务数据的目标核验方式;
第一核验模块903,用于基于目标核验方式在目标规则表中确定待执行核验规则,并基于待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果。
在其中一个实施例中,第一确定模块902具体用于根据业务数据类型和主键信息表确定报送模型主键配置;
基于报送模型主键配置对业务数据进行匹配,基于匹配结果确定目标核验方式。
在其中一个实施例中,目标规则表包括基础规则配置表;第一核验模块903具体用于基于目标核验方式确定目标扫描方式;
根据目标扫描方式对待核验业务数据进行数据扫描,得到目标核验数据;
针对每个目标核验数据,在基础规则配置表中确定目标核验数据对应的待执行核验规则;
根据每个目标核验数据对应的待执行核验规则分别对每个目标核验数据进行本地核验,得到目标核验结果。
在其中一个实施例中,第一核验模块903具体用于基于待执行核验规则对待核验业务数据进行本地数据核验,得到初始核验结果;
根据初始核验结果分别在问题明细表和规则定义表中进行匹配,得到初始核验结果对应的问题明细信息和核验描述信息;
根据问题明细信息、核验描述信息和初始核验结果构建核验清单,作为目标核验结果。
在其中一个实施例中,该装置900还包括:
分类模块,用于获取初始核验规则,根据预设分类规则对初始规则进行分类,得到合理性校验规则、码表型校验规则、函数型校验规则和跨表型校验规则;
构建模块,用于根据合理性校验规则、码表型校验规则、函数型校验规则和跨表型校验规则构建基础规则配置表和专项规则映射表,作为目标规则表。
在其中一个实施例中,目标规则表包括专项规则映射表,该装置900还包括:
第二确定模块,用于在目标核验方式包括专项核验的情况下,根据专项规则映射表确定待执行核验规则;
基于待执行核验规则对待核验业务数据进行数据核验,得到目标核验结果。
上述数据核验装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个示例性的实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储XX数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据核验方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个示例性的实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取待核验业务数据,确定待核验业务数据的业务数据类型;
根据业务数据类型确定目标规则表,并根据业务数据类型和确定待核验业务数据的目标核验方式;
基于目标核验方式在目标规则表中确定待执行核验规则,并基于待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据业务数据类型和主键信息表确定报送模型主键配置;
基于报送模型主键配置对业务数据进行匹配,基于匹配结果确定目标核验方式。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
基于目标核验方式在目标规则表中确定待执行核验规则,并基于待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果,包括:
基于目标核验方式确定目标扫描方式;
根据目标扫描方式对待核验业务数据进行数据扫描,得到目标核验数据;
针对每个目标核验数据,在基础规则配置表中确定目标核验数据对应的待执行核验规则;
根据每个目标核验数据对应的待执行核验规则分别对每个目标核验数据进行本地核验,得到目标核验结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
基于待执行核验规则对待核验业务数据进行本地数据核验,得到初始核验结果;
根据初始核验结果分别在问题明细表和规则定义表中进行匹配,得到初始核验结果对应的问题明细信息和核验描述信息;
根据问题明细信息、核验描述信息和初始核验结果构建核验清单,作为目标核验结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取初始核验规则,根据预设分类规则对初始规则进行分类,得到合理性校验规则、码表型校验规则、函数型校验规则和跨表型校验规则;
根据合理性校验规则、码表型校验规则、函数型校验规则和跨表型校验规则构建基础规则配置表和专项规则映射表,作为目标规则表。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
基于目标核验方式在目标规则表中确定待执行核验规则,并基于待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果,包括:
在目标核验方式包括专项核验的情况下,根据专项规则映射表确定待执行核验规则;
基于待执行核验规则对待核验业务数据进行数据核验,得到目标核验结果。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种数据核验方法,其特征在于,所述方法包括:
获取待核验业务数据,确定所述待核验业务数据的业务数据类型;
根据所述业务数据类型确定目标规则表,并根据所述业务数据类型和确定所述待核验业务数据的目标核验方式;
基于所述目标核验方式在所述目标规则表中确定待执行核验规则,并基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述业务数据类型和确定所述待核验业务数据的目标核验方式,包括:
根据所述业务数据类型和主键信息表确定报送模型主键配置;
基于所述报送模型主键配置对所述业务数据进行匹配,基于匹配结果确定目标核验方式。
3.根据权利要求1所述的方法,其特征在于,所述目标规则表包括基础规则配置表;
所述基于所述目标核验方式在所述目标规则表中确定待执行核验规则,并基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果,包括:
基于目标核验方式确定目标扫描方式;
根据所述目标扫描方式对待核验业务数据进行数据扫描,得到目标核验数据;
针对每个所述目标核验数据,在所述基础规则配置表中确定所述目标核验数据对应的待执行核验规则;
根据每个所述目标核验数据对应的所述待执行核验规则分别对每个所述目标核验数据进行本地核验,得到目标核验结果。
4.根据权利要求1所述的方法,其特征在于,所述基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果,包括:
基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到初始核验结果;
根据所述初始核验结果分别在问题明细表和规则定义表中进行匹配,得到所述初始核验结果对应的问题明细信息和核验描述信息;
根据所述问题明细信息、所述核验描述信息和所述初始核验结果构建核验清单,作为目标核验结果。
5.根据权利要求1所述的方法,其特征在于,所述获取待核验业务数据之前,所述方法还包括:
获取初始核验规则,根据预设分类规则对初始规则进行分类,得到合理性校验规则、码表型校验规则、函数型校验规则和跨表型校验规则;
根据所述合理性校验规则、所述码表型校验规则、所述函数型校验规则和所述跨表型校验规则构建基础规则配置表和专项规则映射表,作为目标规则表。
6.根据权利要求1至4任意一项所述的方法,其特征在于,所述目标规则表包括专项规则映射表;
所述基于所述目标核验方式在所述目标规则表中确定待执行核验规则,并基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果,包括:
在所述目标核验方式包括专项核验的情况下,根据专项规则映射表确定待执行核验规则;
基于所述待执行核验规则对所述待核验业务数据进行数据核验,得到目标核验结果。
7.一种数据核验装置,其特征在于,所述装置包括:
获取模块,用于获取待核验业务数据,确定所述待核验业务数据的业务数据类型;
第一确定模块,用于根据所述业务数据类型确定目标规则表,并根据所述业务数据类型和确定所述待核验业务数据的目标核验方式;
第一核验模块,用于基于所述目标核验方式在所述目标规则表中确定待执行核验规则,并基于所述待执行核验规则对待核验业务数据进行本地数据核验,得到目标核验结果。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311731608.7A CN117827832A (zh) | 2023-12-15 | 2023-12-15 | 数据核验方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311731608.7A CN117827832A (zh) | 2023-12-15 | 2023-12-15 | 数据核验方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117827832A true CN117827832A (zh) | 2024-04-05 |
Family
ID=90522001
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311731608.7A Pending CN117827832A (zh) | 2023-12-15 | 2023-12-15 | 数据核验方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117827832A (zh) |
-
2023
- 2023-12-15 CN CN202311731608.7A patent/CN117827832A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7644055B2 (en) | Rule-based database object matching with comparison certainty | |
US8065323B2 (en) | Offline validation of data in a database system for foreign key constraints | |
US9558230B2 (en) | Data quality assessment | |
US20070074155A1 (en) | Apparatus and method for data profile based construction of an extraction, transform, load (etl) task | |
US20120150820A1 (en) | System and method for testing data at a data warehouse | |
WO2005031503A2 (en) | Sytem and method for generating data validation rules | |
CN112148509A (zh) | 数据处理方法、装置、服务器及计算机可读存储介质 | |
US20140074700A1 (en) | Automated Transactions Clearing System and Method | |
CN106682099A (zh) | 一种数据的存储方法和装置 | |
CN112783867A (zh) | 为满足实时大数据业务需求的数据库优化方法及云服务器 | |
US11928100B2 (en) | Method and system for creating a unified data repository | |
CN111061733A (zh) | 数据处理方法、装置、电子设备和计算机可读存储介质 | |
US10430413B2 (en) | Data information framework | |
US20130006683A1 (en) | System and method of managing testing for a healthcare systems transition | |
CN116719799A (zh) | 环保数据治理方法、装置、计算机设备和存储介质 | |
CN117827832A (zh) | 数据核验方法、装置、计算机设备和存储介质 | |
KR101178998B1 (ko) | 데이터 인증 방법 및 시스템 | |
CN111723129B (zh) | 报表生成方法、报表生成装置和电子设备 | |
CN114443485A (zh) | 基于数据迁移的业务系统功能验证方法及系统 | |
WO2017072872A1 (ja) | 業務プログラム生成支援システムおよび業務プログラム生成支援方法 | |
CN111143399A (zh) | 数据处理方法、装置、存储介质和计算机设备 | |
CN106980496A (zh) | 基于fog数据总线的工具集成方法及系统 | |
CN114238367A (zh) | 资产安全信息管理方法、装置及计算机设备 | |
CN116881163A (zh) | 金融信息系统中测试数据的生成处理方法、装置和设备 | |
CN117785939A (zh) | 基于规则引擎的数据分析方法、装置、计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |