CN112579632A - 一种数据核验方法、装置、设备和介质 - Google Patents

一种数据核验方法、装置、设备和介质 Download PDF

Info

Publication number
CN112579632A
CN112579632A CN202011585208.6A CN202011585208A CN112579632A CN 112579632 A CN112579632 A CN 112579632A CN 202011585208 A CN202011585208 A CN 202011585208A CN 112579632 A CN112579632 A CN 112579632A
Authority
CN
China
Prior art keywords
data
verification
type
request
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011585208.6A
Other languages
English (en)
Inventor
张东凯
邓智鸿
郑积聪
应加炜
汝斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202011585208.6A priority Critical patent/CN112579632A/zh
Publication of CN112579632A publication Critical patent/CN112579632A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种数据核验方法、装置、设备和介质,所述方法包括:从客户端获取数据核验请求,并根据所述数据核验请求所属接口的接口信息,确定所述数据核验请求的请求类型;其中,所述请求类型为单笔核验请求或批量核验请求;根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定所述请求类型对应的目标核验规则;采用所述目标核验规则对所述客户端中的待核验数据进行核验。本发明实施例通过针对不同类型的数据核验请求,从候选核验规则中选取对应的目标核验规则进行数据核验,从而提高了数据核验的准确性。

Description

一种数据核验方法、装置、设备和介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种数据核验方法、装置、设备和介质。
背景技术
在金融领域中,为了对各金融机构的经营管理数据进行监管,金融监管部门要求各金融机构定期的报送经营管理数据,在目前强监管的环境下,数据报送错误可能会面临按笔罚款或监管机构的问询。因此在向金融监管部门报送数据前,需要对数据进行核验。
现有的数据核验方法,大多是通过固定的核验规则对待核验数据进行核验,无法灵活适应于多种类型的数据核验请求,从而导致数据核验的准确性较差。
发明内容
本申请实施例公开一种数据核验方法、装置、设备和介质,以解决现有数据核验方法无法灵活适应于多种类型的数据核验请求,从而导致数据核验准确性较差的问题。
第一方面,本发明实施例提供了一种数据核验方法,包括:
从客户端获取数据核验请求,并根据所述数据核验请求所属接口的接口信息,确定所述数据核验请求的请求类型;其中,所述请求类型为单笔核验请求或批量核验请求;
根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定所述请求类型对应的目标核验规则;
采用所述目标核验规则对所述客户端中的待核验数据进行核验。
第二方面,本发明实施例提供了一种数据核验装置,包括:
请求类型确定模块,用于从客户端获取数据核验请求,并根据所述数据核验请求所属接口的接口信息,确定所述数据核验请求的请求类型;其中,所述请求类型为单笔核验请求或批量核验请求;
目标核验规则确定模块,用于根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定所述请求类型对应的目标核验规则;
数据核验模块,用于采用所述目标核验规则对所述客户端中的待核验数据进行核验。
第三方面,本发明实施例提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的数据核验方法。
第四方面,本发明实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的数据核验方法。
本发明实施例通过针对不同类型的数据核验请求,从候选核验规则中选取对应的目标核验规则进行数据核验,从而提高了数据核验的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通用户来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施例一提供的一种数据核验方法的流程图;
图2为本发明实施例二提供的一种数据核验方法的流程图;
图3为本发明实施例三提供的一种数据核验方法的流程图;
图4为本发明实施例四提供的一种数据核验装置的结构示意图;
图5为本发明实施例五提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明实施例,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明实施例相关的结构而非全部结构。
由于监管机构要求数据来源于多个业务系统,并且数据采集的结果往往需要再进行加工,所以数据报送系统一般为基于数据仓库对数据加工整合后的后端系统。而报送一般要求的时效性比较高,数据通过数据仓库经加工后如发现数据存在大量不符合报送要求时,再要求在业务系统客户端进行调整,将大大延长数据的报送周期。为了保证数据报送的准时性,需要在业务系统客户端就实时进行数据检核。
实施例一
图1是本发明实施例一提供的一种数据核验方法的流程图。本实施例可适用于对报送金融监管机构的经营管理数据进行核验的情况,该方法可以由本发明实施例提供的数据核验装置来执行,所述装置可以由软件和/或硬件的方式来实现。如图1所示,该方法可以包括:
步骤101、从客户端获取数据核验请求,并根据所述数据核验请求所属接口的接口信息,确定所述数据核验请求的请求类型;其中,所述请求类型为单笔核验请求或批量核验请求。
其中,单笔核验请求表示待核验数据为单笔数据,例如单笔数据库表数据或单笔文件数据等,批量核验请求表示待核验数据为批量数据,例如批量数据库表数据或批量文件数据等。
在一种实施方式中,客户端根据待核验数据生成数据核验请求,并根据数据核验请求的类型,在服务端暴露的接口中确定目标接口,并调用目标接口将数据核验请求发送给服务端。例如,若数据核验请求的类型为单笔核验请求,则调用服务端暴露的单笔核验接口,将数据核验请求发送给服务端;又例如,若数据核验请求的类型为批量核验请求,则调用服务端暴露的批量核验接口,将数据核验请求发送给服务端。服务端从客户端获取到数据核验请求后,根据数据核验请求所属接口的接口信息,即客户端所调用接口的接口信息,确定数据核验请求的请求类型。
可选的,若所述数据核验请求所属接口的接口信息为单笔核验接口,则确定所述数据核验请求的请求类型为单笔核验请求;若所述数据核验请求所属接口的接口信息为批量核验接口,则确定所述数据核验请求的请求类型为批量核验请求。
可选的,客户端根据待核验数据生成数据核验请求之前,还包括:
根据用户指定的数据库属性信息,与目标数据库建立连接,并从所述目标数据库中获取数据库表数据,或者,根据用户指定的文件属性信息访问目标文件,并从所述目标文件中获取文件数据。
其中,数据库属性信息和文件属性信息可由用户根据核验需求任意指定。数据库属性信息包括但不限于数据库名、数据库种类、数据库连接URL(Uniform ResourceLocator,资源定位符)串、用户名和密码;文件属性信息包括但不限于文件名、文件的类型和文件的结构等。
通过从客户端获取数据核验请求,并根据所述数据核验请求所属接口的接口信息,确定所述数据核验请求的请求类型,为后续确定请求类型对应的目标核验规则奠定了基础。
步骤102、根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定所述请求类型对应的目标核验规则。
其中,用户根据实际业务需求,例如金融监管机构对上报数据的格式需求,预先配置有至少一种候选核验规则。可选的,所述候选核验规则包括非空核验、字段长度核验、非法字符核验以及日期格式核验中的至少一种,此外,候选核验规则还可以包括字段截取核验、正则表达式核验、计数核验以及字段首尾字符核验等。并且,用户还基于候选核验规则建立了核验规则与数据核验请求类型的关联关系,一种数据核验请求类型可以关联一个核验规则,也可以关联多个核验规则。
在一种实施方式中,服务端根据预先建立的核验规则与请求类型的关联关系,将与从客户端获取的数据核验请求的请求类型对应的候选核验规则,作为目标核验规则。例如单笔核验请求关联核验规则A、核验规则B和核验规则C,则将候选核验规则中的核验规则A、核验规则B和核验规则C作为目标核验规则。
通过根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定请求类型对应的目标核验规则,实现了根据请求类型确定适配的目标核验规则的效果,为后续根据目标核验规则对待核验数据进行核验,奠定了基础。
步骤103、采用所述目标核验规则对所述客户端中的待核验数据进行核验。
在一种实施方式中,从客户端中获取待核验数据,并通过目标核验规则对待核验数据中的各字段进行核验,将不符合目标核验规则的字段作为异常字段,并生成报警信息以通知相关用户对待核验数据中的异常字段进行修改。
本发明实施例提供的技术方案,通过从客户端获取数据核验请求,并根据数据核验请求所属接口的接口信息,确定数据核验请求的请求类型,进而根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定请求类型对应的目标核验规则,最终采用目标核验规则对客户端中的待核验数据进行核验,实现了根据不同类型的数据核验请求,选取相匹配的目标核验规则对待核验数据进行核验的效果,提高了数据核验的准确性。
在上述实施例的基础上,所述方法还包括:
响应用户对于所述核验规则与请求类型的关联关系的配置操作,对所述核验规则与请求类型的关联关系进行更新。
在一种实施方式中,用户可根据实际业务需求的变更,对核验规则与请求类型的关联关系进行配置,配置操作包括但不限于新增关联关系、删减关联关系和修改关联关系等,其中新增关联关系表示为任一请求类型新增关联的核验规则;删减关联关系表示为任一请求类型删减当前关联的任一核验规则;修改关联关系表示将任一核验规则当前关联的请求类型,修改为其它请求类型,例如核验规则A当前关联的请求类型为单笔核验请求,对其修改关联关系,将核验规则A关联的请求类型修改为批量核验请求。服务端响应用户对于核验规则与请求类型的关联关系的配置操作,对核验规则与请求类型的关联关系进行更新。
通过响应用户对于核验规则与请求类型的关联关系的配置操作,对核验规则与请求类型的关联关系进行更新,减少了开发工作量,提高了数据核验的灵活性。
实施例二
图2为本发明实施例二提供的一种数据核验方法的流程图。本实施例适用于数据核验请求的请求类型为单笔核验请求的情况,如图2所示,该方法可以包括:
步骤201、从客户端获取数据核验请求,并根据所述数据核验请求所属接口的接口信息,确定所述数据核验请求的请求类型。
步骤202、若请求类型为单笔核验请求,则根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定单笔核验请求对应的目标核验规则,并将单笔核验请求对应的目标核验规则作为第一类核验规则。
步骤203、采用所述第一类核验规则对所述单笔数据库表数据,或所述单笔文件数据进行核验。
在一种实施方式中,服务端向客户端发送数据获取指令,以从客户端中获取单笔数据库表数据,或单笔文件数据。服务端采用第一类核验规则对单笔数据库表数据,或单笔文件数据进行核验,确定单笔数据库表数据,或单笔文件数据中是否具有异常字段。
可选的,步骤203包括A、B和C三个步骤:
A、从所述客户端中获取所述单笔数据库表数据,或单笔文件数据。
在一种实施方式中,服务端向客户端发送数据获取指令,客户端进而调用服务端的单笔核验接口,将单笔数据库表数据,或单笔文件数据以Map方式传输给服务端。
B、将所述单笔数据库表数据,或单笔文件数据中的各字段,分别与所述第一类核验规则进行匹配。
在一种实施方式中,服务端通过预设的语法分析器生成工具,例如antlr4,对第一类核验规则进行解析计算,从而将第一类核验规则转化为可实现的函数判断逻辑,例如非空核验可转化为非空函数,又例如字段长度核验可转化为长度函数等。进而通过转化后的逻辑判断函数,对单笔数据库表数据,或单笔文件数据中的各字段进行匹配核验。
C、将所述单笔数据库表数据中不符合所述第一类核验规则的字段,作为第一类异常字段,或者,将所述单笔文件数据中不符合所述第一类核验规则的字段,作为第二类异常字段。
在一种实施方式中,将单笔数据库表数据中不符合逻辑判断函数的字段,作为第一类异常字段;或者,将单笔文件数据中不符合逻辑判断函数的字段,作为第二类异常字段。例如,将空字段作为异常字段,又例如,将字段长度大于阈值的字段,作为异常字段。
本发明实施例提供的技术方案,通过若请求类型为单笔核验请求,则根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定单笔核验请求对应的目标核验规则,并将单笔核验请求对应的目标核验规则作为第一类核验规则,采用第一类核验规则对单笔数据库表数据,或单笔文件数据进行核验,实现了采用适配的目标核验规则对单笔数据库表数据,或单笔文件数据进行核验的效果,提高了对于单笔数据库表数据,或单笔文件数据核验的准确性。
实施例三
图3为本发明实施例三提供的一种数据核验方法的流程图。本实施例适用于数据核验请求的请求类型为批量核验请求的情况,如图2所示,该方法可以包括:
步骤301、从客户端获取数据核验请求,并根据所述数据核验请求所属接口的接口信息,确定所述数据核验请求的请求类型。
步骤302、若请求类型为批量核验请求,则根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定批量核验请求对应的目标核验规则,并将批量核验请求对应的目标核验规则作为第二类核验规则。
步骤303、采用所述第二类核验规则对所述批量数据库表数据,或所述批量文件数据进行核验。
在一种实施方式中,服务端向客户端发送数据获取指令,以从客户端中获取批量数据库表数据,或批量文件数据。服务端采用第二类核验规则对批量数据库表数据,或批量文件数据进行核验,确定批量数据库表数据,或批量文件数据中是否具有异常字段。
可选的,步骤303中“采用所述第二类核验规则对所述批量文件数据进行核验”,包括以下三个步骤:
1)按照预设批次从所述客户端中分批获取所述批量文件数据。
示例性的,假设批量文件数据总共包括100个文件数据,预设批次为20次,则分20批从客户端获取批量文件数据,每批获取5个文件数据。
2)将各批次获取的批量文件数据中的各字段,分别与所述第二类核验规则进行匹配。
在一种实施方式中,服务端通过预设的语法分析器生成工具,例如antlr4,对第二类核验规则进行解析计算,从而将第二类核验规则转化为可实现的函数判断逻辑。进而通过转化后的逻辑判断函数,对各批次获取的批量文件数据中的各字段进行匹配核验。
3)将各批次获取的批量文件数据中不符合所述第二类核验规则的字段,作为第三类异常字段。
在一种实施方式中,将各批次获取的批量文件数据中不符合逻辑判断函数的字段,作为第三类异常字段。
通过按照预设批次从客户端中分批获取批量文件数据,并将各批次获取的批量文件数据中的各字段,分别与第二类核验规则进行匹配,进而将各批次获取的批量文件数据中不符合第二类核验规则的字段,作为第三类异常字段,由于采用了分批获取批量文件数据的方式,从而避免了一次获取所有批量文件数据可能导致数据丢失的问题,保证数据核验能够顺利进行。
可选的,步骤303中“采用所述第二类核验规则对所述批量数据库表数据进行核验”,包括以下三个步骤:
1)从预设的结构化查询语句中,获取所述第二类核验规则对应的结构化查询语句。
其中,用户预先对所有候选核验规则都通过自定义编写的方式,编写了对应的结构化查询语句,例如SQL,SQL支持参数传递、多表关联查询以及数据库的原生语法。并且还建立了各候选核验规则与结构化查询语句的关联关系。
在一种实施方式中,服务端基于候选核验规则与结构化查询语句的关联关系,从预先编写的结构化查询语句中,获取第二类核验规则对应的结构化查询语句。
2)将所述结构化查询语句发送给所述客户端,以使得所述客户端执行所述结构化查询语句,以查询得到所述批量数据库表数据中不符合所述第二类核验规则的字段。
在一种实施方式中,服务端对外提供REST服务,客户端通过调用REST服务从服务端获取第二类核验规则对应的结构化查询语句,并在批量数据库表数据所属的数据库中,执行该结构化查询语句,从而在数据库中查询得到批量数据库表数据中不符合第二类核验规则的字段,并直接在数据库中对异常字段进行标注。
3)接收所述客户端发送的所述批量数据库表数据中不符合所述第二类核验规则的字段,作为第四类异常字段。
在一种实施方式中,客户端将查询得到的批量数据库表数据中不符合所述第二类核验规则的字段,发送给服务端,服务端接收并将这些字段作为第四类异常字段。
通过从预设的结构化查询语句中,获取第二类核验规则对应的结构化查询语句,并将结构化查询语句发送给客户端,以使得客户端执行结构化查询语句,以查询得到批量数据库表数据中不符合第二类核验规则的字段,进而接收客户端发送的批量数据库表数据中不符合第二类核验规则的字段,作为第四类异常字段,由于将数据核验的过程下发给客户端执行,从而无需客户端再将大量的数据库表数据发送给服务端,减轻了网络带宽的占用,并且也免去了数据传输所耗费的时间,提高了数据核验的效率。
本发明实施例提供的技术方案,通过从客户端获取数据核验请求,并根据数据核验请求所属接口的接口信息,确定数据核验请求的请求类型,若请求类型为批量核验请求,则根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定批量核验请求对应的目标核验规则,并将批量核验请求对应的目标核验规则作为第二类核验规则,最终采用第二类核验规则对批量数据库表数据,或批量文件数据进行核验,实现了采用适配的目标核验规则对批量数据库表数据,或批量文件数据进行核验的效果,提高了对于批量数据库表数据,或批量文件数据核验的准确性。
在上述实施例的基础上,所述方法还包括:
将所述第一类异常字段、第二类异常字段和第三类异常字段发送给所述客户端,以使得所述客户端将所述第一类异常字段、第二类异常字段和第三类异常字段进行存储。
在一种实施方式中,服务端将第一类异常字段、第二类异常字段和第三类异常字段打包发送给客户端,使得客户端在本地对第一类异常字段、第二类异常字段和第三类异常字段进行存储,以供后续分析。
在上述实施例的基础上,所述方法还包括:
将所述第一类异常字段和所述第四类异常字段,作为数据库表异常字段进行存储;将所述第二类异常字段和所述第三类异常字段,作为文件异常字段进行存储。
在一种实施方式中,服务端将第一类异常字段和第四类异常字段,作为数据库表异常字段存储于服务端中的第一预设文件中,以供后续分析;将第二类异常字段和第三类异常字段,作为文件异常字段存储于服务端中的第二预设文件中,以供后续分析。
在上述实施例的基础上,所述方法还包括:
确定所述数据库表异常字段的数量,与已核验的数据库表数据的总字段数量之间的第一比值;若所述第一比值大于或等于第一预设阈值,则生成数据库表预警信息。
示例性的,假设数据库表异常字段的数量为200,已核验的数据库表数据的总字段数量为10000,第一预设阈值为0.015,第一比值为200/10000=0.02,由于第一比值0.02大于第一预设阈值为0.015,则表示数据库表数据出现大批量的数据质量问题,相应生成数据库表预警信息,提醒相应人员进行关注,并对数据表数据所属的数据库进行风险问题排查。
在上述实施例的基础上,所述方法还包括:
确定所述文件异常字段的数量,与已核验的文件数据的总字段数量之间的第二比值;若所述第二比值大于或等于第二预设阈值,则生成文件预警信息。
示例性的,假设文件异常字段的数量为100,已核验的文件数据的总字段数量为10000,第二预设阈值为0.01,第二比值为100/10000=0.01,由于第二比值0.01等于第二预设阈值为0.01,则表示文件数据出现大批量的数据质量问题,相应生成文件预警信息,提醒相应人员进行关注,并对文件数据所属的文件进行风险问题排查。
实施例四
图4为本发明实施例四提供的一种数据核验装置的结构示意图,所述数据核验装置可执行本发明任一实施例所提供的一种数据核验方法,具备执行方法相应的功能模块和有益效果。如图4所示,该装置可以包括:
请求类型确定模块41,用于从客户端获取数据核验请求,并根据所述数据核验请求所属接口的接口信息,确定所述数据核验请求的请求类型;其中,所述请求类型为单笔核验请求或批量核验请求;
目标核验规则确定模块42,用于根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定所述请求类型对应的目标核验规则;
数据核验模块43,用于采用所述目标核验规则对所述客户端中的待核验数据进行核验。
在上述实施例的基础上,所述请求类型确定模块41,具体用于:
若所述数据核验请求所属接口的接口信息为单笔核验接口,则确定所述数据核验请求的请求类型为单笔核验请求;
若所述数据核验请求所属接口的接口信息为批量核验接口,则确定所述数据核验请求的请求类型为批量核验请求。
在上述实施例的基础上,所述待核验数据为单笔数据库表数据、批量数据库表数据、单笔文件数据以及批量文件数据中的一种;
所述目标核验规则确定模块42,具体用于:
将所述单笔核验请求对应的目标核验规则作为第一类核验规则,且将所述批量核验请求对应的目标核验规则作为第二类核验规则;
相应的,所述数据核验模块43,具体用于:
采用所述第一类核验规则对所述单笔数据库表数据,或所述单笔文件数据进行核验;
采用所述第二类核验规则对所述批量数据库表数据,或所述批量文件数据进行核验。
在上述实施例的基础上,所述数据核验模块43,具体还用于:
从所述客户端中获取所述单笔数据库表数据,或单笔文件数据;
将所述单笔数据库表数据,或单笔文件数据中的各字段,分别与所述第一类核验规则进行匹配;
将所述单笔数据库表数据中不符合所述第一类核验规则的字段,作为第一类异常字段,或者,将所述单笔文件数据中不符合所述第一类核验规则的字段,作为第二类异常字段。
在上述实施例的基础上,所述数据核验模块43,具体还用于:
按照预设批次从所述客户端中分批获取所述批量文件数据;
将各批次获取的批量文件数据中的各字段,分别与所述第二类核验规则进行匹配;
将各批次获取的批量文件数据中不符合所述第二类核验规则的字段,作为第三类异常字段。
在上述实施例的基础上,所述数据核验模块43,具体还用于:
从预设的结构化查询语句中,获取所述第二类核验规则对应的结构化查询语句;
将所述结构化查询语句发送给所述客户端,以使得所述客户端执行所述结构化查询语句,以查询得到所述批量数据库表数据中不符合所述第二类核验规则的字段;
接收所述客户端发送的所述批量数据库表数据中不符合所述第二类核验规则的字段,作为第四类异常字段。
在上述实施例的基础上,所述装置还包括异常字段发送模块,具体用于:
将所述第一类异常字段、第二类异常字段和第三类异常字段发送给所述客户端,以使得所述客户端将所述第一类异常字段、第二类异常字段和第三类异常字段进行存储。
在上述实施例的基础上,所述装置还包括异常字段存储模块,具体用于:
将所述第一类异常字段和所述第四类异常字段,作为数据库表异常字段进行存储;
将所述第二类异常字段和所述第三类异常字段,作为文件异常字段进行存储。
在上述实施例的基础上,所述装置还包括第一预警模块,具体用于:
确定所述数据库表异常字段的数量,与已核验的数据库表数据的总字段数量之间的第一比值;
若所述第一比值大于或等于第一预设阈值,则生成数据库表预警信息。
在上述实施例的基础上,所述装置还包括第二预警模块,具体用于:
确定所述文件异常字段的数量,与已核验的文件数据的总字段数量之间的第二比值;
若所述第二比值大于或等于第二预设阈值,则生成文件预警信息。
在上述实施例的基础上,所述候选核验规则包括非空核验、字段长度核验、非法字符核验以及日期格式核验中的至少一种。
在上述实施例的基础上,所述装置还包括关联关系更新模块,具体用于:
响应用户对于所述核验规则与请求类型的关联关系的配置操作,对所述核验规则与请求类型的关联关系进行更新。
本发明实施例所提供的一种数据核验装置,可执行本发明任一实施例所提供的一种数据核验方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任一实施例所提供的一种数据核验方法。
实施例五
图5为本发明实施例五提供的一种电子设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性电子设备500的框图。图5显示的电子设备500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500以通用计算电子设备的形式表现。电子设备500的组件可以包括但不限于:一个或者多个处理器或者处理单元501,系统存储器502,连接不同系统组件(包括系统存储器502和处理单元501)的总线503。
总线503表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备500典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备500访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器502可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)504和/或高速缓存存储器505。电子设备500可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统506可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线503相连。存储器502可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块507的程序/实用工具508,可以存储在例如存储器502中,这样的程序模块507包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块507通常执行本发明所描述的实施例中的功能和/或方法。
电子设备500也可以与一个或多个外部电子设备509(例如键盘、指向电子设备、显示器510等)通信,还可与一个或者多个使得用户能与该电子设备500交互的电子设备通信,和/或与使得该电子设备500能与一个或多个其它计算电子设备进行通信的任何电子设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口611进行。并且,电子设备500还可以通过网络适配器512与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器512通过总线503与电子设备500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、电子设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元501通过运行存储在系统存储器502中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的数据核验方法,包括:
从客户端获取数据核验请求,并根据所述数据核验请求所属接口的接口信息,确定所述数据核验请求的请求类型;其中,所述请求类型为单笔核验请求或批量核验请求;
根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定所述请求类型对应的目标核验规则;
采用所述目标核验规则对所述客户端中的待核验数据进行核验。
实施例六
本发明实施例六还提供了一种计算机可读存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种数据核验方法,该方法包括:
从客户端获取数据核验请求,并根据所述数据核验请求所属接口的接口信息,确定所述数据核验请求的请求类型;其中,所述请求类型为单笔核验请求或批量核验请求;
根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定所述请求类型对应的目标核验规则;
采用所述目标核验规则对所述客户端中的待核验数据进行核验。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的一种数据核验方法中的相关操作。本发明实施例的计算机可读存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域用户会理解,本发明不限于这里所述的特定实施例,对本领域用户来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (15)

1.一种数据核验方法,其特征在于,包括:
从客户端获取数据核验请求,并根据所述数据核验请求所属接口的接口信息,确定所述数据核验请求的请求类型;其中,所述请求类型为单笔核验请求或批量核验请求;
根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定所述请求类型对应的目标核验规则;
采用所述目标核验规则对所述客户端中的待核验数据进行核验。
2.根据权利要求1所述的方法,其特征在于,根据所述数据核验请求所属接口的接口信息,确定所述数据核验请求的请求类型,包括:
若所述数据核验请求所属接口的接口信息为单笔核验接口,则确定所述数据核验请求的请求类型为单笔核验请求;
若所述数据核验请求所属接口的接口信息为批量核验接口,则确定所述数据核验请求的请求类型为批量核验请求。
3.根据权利要求2所述的方法,其特征在于,所述待核验数据为单笔数据库表数据、批量数据库表数据、单笔文件数据以及批量文件数据中的一种;
从候选核验规则中确定所述请求类型对应的目标核验规则,包括:
将所述单笔核验请求对应的目标核验规则作为第一类核验规则,且将所述批量核验请求对应的目标核验规则作为第二类核验规则;
相应的,采用所述目标核验规则对所述客户端中的待核验数据进行核验,包括:
采用所述第一类核验规则对所述单笔数据库表数据,或所述单笔文件数据进行核验;
采用所述第二类核验规则对所述批量数据库表数据,或所述批量文件数据进行核验。
4.根据权利要求3所述的方法,其特征在于,采用所述第一类核验规则对所述单笔数据库表数据,或所述单笔文件数据进行核验,包括:
从所述客户端中获取所述单笔数据库表数据,或单笔文件数据;
将所述单笔数据库表数据,或单笔文件数据中的各字段,分别与所述第一类核验规则进行匹配;
将所述单笔数据库表数据中不符合所述第一类核验规则的字段,作为第一类异常字段,或者,将所述单笔文件数据中不符合所述第一类核验规则的字段,作为第二类异常字段。
5.根据权利要求4所述的方法,其特征在于,采用所述第二类核验规则对所述批量文件数据进行核验,包括:
按照预设批次从所述客户端中分批获取所述批量文件数据;
将各批次获取的批量文件数据中的各字段,分别与所述第二类核验规则进行匹配;
将各批次获取的批量文件数据中不符合所述第二类核验规则的字段,作为第三类异常字段。
6.根据权利要求5所述的方法,其特征在于,采用所述第二类核验规则对所述批量数据库表数据进行核验,包括:
从预设的结构化查询语句中,获取所述第二类核验规则对应的结构化查询语句;
将所述结构化查询语句发送给所述客户端,以使得所述客户端执行所述结构化查询语句,以查询得到所述批量数据库表数据中不符合所述第二类核验规则的字段;
接收所述客户端发送的所述批量数据库表数据中不符合所述第二类核验规则的字段,作为第四类异常字段。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
将所述第一类异常字段、第二类异常字段和第三类异常字段发送给所述客户端,以使得所述客户端将所述第一类异常字段、第二类异常字段和第三类异常字段进行存储。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
将所述第一类异常字段和所述第四类异常字段,作为数据库表异常字段进行存储;
将所述第二类异常字段和所述第三类异常字段,作为文件异常字段进行存储。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
确定所述数据库表异常字段的数量,与已核验的数据库表数据的总字段数量之间的第一比值;
若所述第一比值大于或等于第一预设阈值,则生成数据库表预警信息。
10.根据权利要求8所述的方法,其特征在于,所述方法还包括:
确定所述文件异常字段的数量,与已核验的文件数据的总字段数量之间的第二比值;
若所述第二比值大于或等于第二预设阈值,则生成文件预警信息。
11.根据权利要求1所述的方法,其特征在于,所述候选核验规则包括非空核验、字段长度核验、非法字符核验以及日期格式核验中的至少一种。
12.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应用户对于所述核验规则与请求类型的关联关系的配置操作,对所述核验规则与请求类型的关联关系进行更新。
13.一种数据核验装置,其特征在于,包括:
请求类型确定模块,用于从客户端获取数据核验请求,并根据所述数据核验请求所属接口的接口信息,确定所述数据核验请求的请求类型;其中,所述请求类型为单笔核验请求或批量核验请求;
目标核验规则确定模块,用于根据预设的核验规则与请求类型的关联关系,从候选核验规则中确定所述请求类型对应的目标核验规则;
数据核验模块,用于采用所述目标核验规则对所述客户端中的待核验数据进行核验。
14.一种电子设备,其特征在于,所述电子设备还包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-12中任一所述的数据核验方法。
15.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-12中任一所述的数据核验方法。
CN202011585208.6A 2020-12-28 2020-12-28 一种数据核验方法、装置、设备和介质 Pending CN112579632A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011585208.6A CN112579632A (zh) 2020-12-28 2020-12-28 一种数据核验方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011585208.6A CN112579632A (zh) 2020-12-28 2020-12-28 一种数据核验方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
CN112579632A true CN112579632A (zh) 2021-03-30

Family

ID=75140406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011585208.6A Pending CN112579632A (zh) 2020-12-28 2020-12-28 一种数据核验方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN112579632A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990741A (zh) * 2021-03-31 2021-06-18 建信金融科技有限责任公司 一种工作量评估方法、装置、设备及存储介质
CN113282353A (zh) * 2021-06-08 2021-08-20 苏州沁游网络科技有限公司 一种数据验证方法、电子设备和存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150095287A1 (en) * 2013-09-30 2015-04-02 International Business Machines Corporation Database auditing for bulk operations
CN107451136A (zh) * 2016-05-30 2017-12-08 阿里巴巴集团控股有限公司 数据核对方法及装置
CN107908725A (zh) * 2017-11-14 2018-04-13 中国银行股份有限公司 一种批量数据校验方法、装置和系统
CN108427733A (zh) * 2018-02-28 2018-08-21 网易(杭州)网络有限公司 审核规则的设置方法、装置和系统、设备、存储介质
CN110543483A (zh) * 2019-08-30 2019-12-06 北京百分点信息科技有限公司 一种数据稽核方法、装置及电子设备
CN110764942A (zh) * 2019-09-17 2020-02-07 平安银行股份有限公司 多种类数据校验方法、装置、计算机系统及可读存储介质
CN111328067A (zh) * 2018-12-17 2020-06-23 中国移动通信集团安徽有限公司 用户信息核对方法、装置、系统、设备及介质
CN111966716A (zh) * 2020-08-20 2020-11-20 支付宝(杭州)信息技术有限公司 数据处理方法以及装置
CN111988402A (zh) * 2020-08-20 2020-11-24 支付宝(杭州)信息技术有限公司 一种数据核验方法、装置及电子设备
CN112015739A (zh) * 2020-09-14 2020-12-01 支付宝(杭州)信息技术有限公司 一种数据核验、数据查询方法及装置
CN112035159A (zh) * 2020-08-28 2020-12-04 中国建设银行股份有限公司 一种稽核模型的配置方法、装置、设备及存储介质
CN112085611A (zh) * 2020-09-07 2020-12-15 中国平安财产保险股份有限公司 数据异步核验方法、装置、电子设备及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150095287A1 (en) * 2013-09-30 2015-04-02 International Business Machines Corporation Database auditing for bulk operations
CN107451136A (zh) * 2016-05-30 2017-12-08 阿里巴巴集团控股有限公司 数据核对方法及装置
CN107908725A (zh) * 2017-11-14 2018-04-13 中国银行股份有限公司 一种批量数据校验方法、装置和系统
CN108427733A (zh) * 2018-02-28 2018-08-21 网易(杭州)网络有限公司 审核规则的设置方法、装置和系统、设备、存储介质
CN111328067A (zh) * 2018-12-17 2020-06-23 中国移动通信集团安徽有限公司 用户信息核对方法、装置、系统、设备及介质
CN110543483A (zh) * 2019-08-30 2019-12-06 北京百分点信息科技有限公司 一种数据稽核方法、装置及电子设备
CN110764942A (zh) * 2019-09-17 2020-02-07 平安银行股份有限公司 多种类数据校验方法、装置、计算机系统及可读存储介质
CN111966716A (zh) * 2020-08-20 2020-11-20 支付宝(杭州)信息技术有限公司 数据处理方法以及装置
CN111988402A (zh) * 2020-08-20 2020-11-24 支付宝(杭州)信息技术有限公司 一种数据核验方法、装置及电子设备
CN112035159A (zh) * 2020-08-28 2020-12-04 中国建设银行股份有限公司 一种稽核模型的配置方法、装置、设备及存储介质
CN112085611A (zh) * 2020-09-07 2020-12-15 中国平安财产保险股份有限公司 数据异步核验方法、装置、电子设备及存储介质
CN112015739A (zh) * 2020-09-14 2020-12-01 支付宝(杭州)信息技术有限公司 一种数据核验、数据查询方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990741A (zh) * 2021-03-31 2021-06-18 建信金融科技有限责任公司 一种工作量评估方法、装置、设备及存储介质
CN113282353A (zh) * 2021-06-08 2021-08-20 苏州沁游网络科技有限公司 一种数据验证方法、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN107506451B (zh) 用于数据交互的异常信息监控方法及装置
CN112035858A (zh) Api访问控制方法、装置、设备及介质
CN111427971B (zh) 用于计算机系统的业务建模方法、装置、系统和介质
CN111930489B (zh) 一种任务调度方法、装置、设备及存储介质
CN111680313B (zh) 一种数据处理方法、装置、设备及存储介质
CN111177671A (zh) 一种数据管理平台、方法及电子设备
CN112579632A (zh) 一种数据核验方法、装置、设备和介质
CN112445866A (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN115168341A (zh) 一种业务处理方法、系统、介质及设备
CN113190517B (zh) 数据集成方法、装置、电子设备和计算机可读介质
CN114239511A (zh) 填充数据的方法和填充数据的装置
CN112965943A (zh) 一种数据处理方法、装置、电子设备以及存储介质
US20230153357A1 (en) Method of processing an observation information, electronic device and storage medium
CN115576978A (zh) 一种业务处理请求的响应方法、装置、系统及介质
CN115600038A (zh) 页面渲染方法、装置、设备及介质
CN114817990A (zh) 对敏感数据的管理方法、装置、电子设备及存储介质
CN115033574A (zh) 信息生成方法、信息生成装置、电子设备及存储介质
CN111401889B (zh) 基于区块链的信用数据处理方法、装置、设备和介质
CN113468218A (zh) 一种对数据库慢sql进行监测和管理的方法和装置
CN110827001A (zh) 一种会计事件记账方法、系统、设备和存储介质
CN111026763A (zh) 一种数据处理方法、装置、设备及存储介质
CN112261072A (zh) 一种服务调用方法、装置、设备和存储介质
CN113900895B (zh) 信息处理方法、信息处理装置、存储介质与电子设备
CN109710673B (zh) 作品处理方法、装置、设备和介质
CN116016719A (zh) 报文处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination