CN113553367B - 一种数据导入校验方法、设备及介质 - Google Patents

一种数据导入校验方法、设备及介质 Download PDF

Info

Publication number
CN113553367B
CN113553367B CN202110832288.9A CN202110832288A CN113553367B CN 113553367 B CN113553367 B CN 113553367B CN 202110832288 A CN202110832288 A CN 202110832288A CN 113553367 B CN113553367 B CN 113553367B
Authority
CN
China
Prior art keywords
data
checked
cache
verified
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110832288.9A
Other languages
English (en)
Other versions
CN113553367A (zh
Inventor
王召冠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur General Software Co Ltd
Original Assignee
Inspur General Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur General Software Co Ltd filed Critical Inspur General Software Co Ltd
Priority to CN202110832288.9A priority Critical patent/CN113553367B/zh
Publication of CN113553367A publication Critical patent/CN113553367A/zh
Application granted granted Critical
Publication of CN113553367B publication Critical patent/CN113553367B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24552Database cache management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据导入校验方法、设备及介质,方法包括:获取待校验数据列,并确定待校验数据列依赖的源数据库;分批加载待校验数据列中预设行数的待校验数据,并判断待校验数据与内存中第一缓存变量的缓存数据是否匹配;若否,则通过结构化查询语言SQL脚本,在源数据库中对待校验数据进行检索,确定检索结果集;将检索结果集合并至第一缓存变量,并通过第一缓存变量中合并后的缓存数据对待校验数据进行校验。本申请实施例通过判断待校验数据与内存中第一缓存变量的缓存数据是否匹配,能够对待校验数据进行去重处理,并且通过在源数据库中检索是否存在,并把检索结果集做内存缓存处理,优化了应用系统的数据导入校验性能。

Description

一种数据导入校验方法、设备及介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种数据导入校验方法、设备及介质。
背景技术
应用系统中涉及大量数据导入校验时,通常会引出性能瓶颈的问题,如果数据量问题没有处理好,可能会出现内存溢出和响应超时的现象。
其中,如果待校验数据量很少,可以直接循环遍历即可,并且如果校验数据源数据量较小,一次全部加装到内存,也可以减少频繁的SQL(结构化查询语言,Structured QueryLanguage)请求。
但是,对于大型应用系统,通常校验的数据量比较多,校验所依赖的数据源更多,导致出现系统不响应甚至崩溃的情况,从而影响其他功能模块。
发明内容
本申请实施例提供一种数据导入校验方法、设备及介质,用于解决应用系统在大量数据导入时,校验性能低的问题。
本申请实施例采用下述技术方案:
一方面,本申请实施例提供了一种数据导入校验方法,该方法包括:获取待校验数据列,并确定所述待校验数据列依赖的源数据库;分批加载所述待校验数据列中预设行数的待校验数据,并判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配;若否,则通过结构化查询语言SQL脚本,在所述源数据库中对所述待校验数据进行检索,确定检索结果集;将所述检索结果集合并至所述第一缓存变量,并通过所述第一缓存变量中合并后的缓存数据对所述待校验数据进行校验。
一个示例中,所述获取待校验数据列,并确定所述待校验数据列依赖的源数据库,具体包括:获取帮助类型的数据列集合;在所述数据列集合中,确定待校验数据列;确定所述待校验数据列依赖的所述源数据库,并根据所述帮助类型对应的元数据,确定所述待校验数据列向所述源数据库的访问方式。
一个示例中,所述判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配,具体包括:通过数据主键加载所述预设行数的待校验数据;判断所述第一缓存变量的缓存数据中是否存在所述待校验数据。
一个示例中,所述并通过SQL脚本,在所述源数据库中对所述待校验数据进行检索,确定检索结果集,具体包括:将所述待校验数据缓存至第二缓存变量;将所述第二缓存变量的键值转换为数组或List集合;将所述数组或List集合作为参数,通过组织所述SQL脚本的In操作,在所述源数据库中对所述待校验数据进行检索,确定所述检索结果集。
一个示例中,所述将所述检索结果集合并至所述第一缓存变量,具体包括:确定所述检索结果集的主键值和数据实体为Key-value方式;通过所述Key-value方式,将所述检索结果集合并至所述第一缓存变量中。
一个示例中,所述并通过所述第一缓存变量中合并后的缓存数据对所述待校验数据进行校验,具体包括:通过所述待校验数据的主键值判断所述待校验数据是否存在于所述合并后的缓存数据中,并通过rowIndex定位所述待校验数据的数据行在所述待校验数据列中的位置,以标记校验结果。
一个示例中,所述并判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配,具体包括:若是,则获取所述第一缓存变量中对应的校验扩展规则;通过所述校验扩展规则,判断所述待校验数据是否合法;若是,则确定所述待校验数据通过校验。
一个示例中,所述分批加载所述待校验数据列中预设行数的待校验数据,并判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配,具体包括:分批加载所述待校验数据列中预设行数的待校验数据;按照逐行取值的方式,判断各数据行对应的待校验数据与所述第一缓存变量的缓存数据是否匹配。
另一方面,本申请实施例提供了一种数据导入校验设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:获取待校验数据列,并确定所述待校验数据列依赖的源数据库;分批加载所述待校验数据列中预设行数的待校验数据,并判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配;若否,则通过结构化查询语言SQL脚本,在所述源数据库中对所述待校验数据进行检索,确定检索结果集;将所述检索结果集合并至所述第一缓存变量,并通过所述第一缓存变量中合并后的缓存数据对所述待校验数据进行校验。
另一方面,本申请实施例提供了一种数据导入校验非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:获取待校验数据列,并确定所述待校验数据列依赖的源数据库;分批加载所述待校验数据列中预设行数的待校验数据,并判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配;若否,则通过结构化查询语言SQL脚本,在所述源数据库中对所述待校验数据进行检索,确定检索结果集;将所述检索结果集合并至所述第一缓存变量,并通过所述第一缓存变量中合并后的缓存数据对所述待校验数据进行校验。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
本申请实施例通过首先获取待校验数据列,然后按列分批加载数据行,能够实现对待校验数据进行批量校验。进一步地,通过判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配,能够对待校验数据进行去重处理,并且通过在源数据库中检索是否存在,并把检索结果集做内存缓存处理,能够减少大幅DB的访问次数问题,同时也将减少了内存占用量,提高系统的并发性与吞吐量,优化了应用系统的数据导入校验性能。
附图说明
为了更清楚地说明本申请的技术方案,下面将结合附图来对本申请的部分实施例进行详细说明,附图中:
图1为本申请实施例提供的一种数据导入校验方法的流程示意图;
图2为本申请实施例提供的一种数据导入校验的实施方案示意图;
图3为本申请实施例提供的一种数据导入校验设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本申请的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面参照附图来对本申请的一些实施例进行详细说明。
图1为本申请实施例提供的一种数据导入校验方法的流程示意图。该方法可以应用于不同的业务领域,比如,互联网金融业务领域、电商业务领域、即时通讯业务领域、公务业务领域等。该流程可以由相应领域的计算设备执行,流程中的某些输入参数或者中间结果允许人工干预调节,以帮助提高准确性。
本申请实施例涉及的分析方法的实现可以为终端设备,也可以为服务器,本申请对此不作特殊限制。为了方便理解和描述,以下实施例均以服务器为例进行详细描述。
需要说明的是,该服务器可以是单独的一台设备,可以是有多台设备组成的系统,即,分布式服务器,本申请对此不做具体限定。
图1中的流程具体包括以下步骤:
S101:获取待校验数据列,并确定待校验数据列依赖的源数据库。
具体地,服务器预先获取帮助类型的数据列集合,并定义为ArrayList<Column>结构的变量columnArray,然后在数据列集合中,确定待校验数据列,并确定待校验数据列依赖的源数据库,最后通过帮助类型对应的元数据,获取对源数据库的数据访问方式,并组织所有需要校验的数据列及依赖的源数据库。
S102:分批加载待校验数据列中预设行数的待校验数据,并判断待校验数据与内存中第一缓存变量的缓存数据是否匹配。
具体地,服务器预先定义第一缓存变量checkMap,第一缓存变量存放键为Sring类型、值为Object类型的数据,比如,HashMap<string,object>。通过引入HashMap以校验数据为key,减少重复数据的冗余存储。
然后,服务器通过数据主键分批加载待校验数据列中预设行数的待校验数据,也就是说,循环取出需要校验的预设行数据值,并且按照逐行取值的方式,判断各数据行对应的待校验数据与第一缓存变量的缓存数据是否匹配。
若匹配,则获取第一缓存变量中对应的校验扩展规则,并且通过校验扩展规则,判断待校验数据是否合法,若合法,则说明待校验数据通过校验。若不合法,则说明待校验数据不通过校验。也就是说,即使在第一缓存变量的缓存数据中存在待校验数据,但是并不合法,也无法通过校验。
S103:若否,则通过结构化查询语言SQL脚本,在源数据库中对待校验数据进行检索,确定检索结果集。SQL的选择操作一次加载,减少逐行处理的请求次数。
具体地,服务器预先定义第二缓存变量todoMap,第二缓存变量存放键为Sring类型、值为roeIndex类型的数据,比如,HashMap<string,rowIndex>。
若待校验数据与第一缓存变量的缓存数据不匹配时,服务器则将待校验数据缓存至第二缓存变量,将第二缓存变量的键值转换为数组或List集合,比如,将HashMap<string,rowIndex>的键值转换为数组或List集合,然后将数组或List集合作为参数,通过组织SQL脚本的In操作,在源数据库中对待校验数据进行检索,确定检索结果集。其中,若源数据库包括待校验数据,则将待校验数据存入检索结果集。
比如,待校验的10行数据与第一缓存变量的缓存数据不匹配,则在源数据库中对10行数据值进行检索,此时,有8行数据可以在源数据库检索到,另外2行数据并未在源数据库检索到,则将该8行数据存入检索结果集中,另外2行数据不存入检索结果集中。
S104:将检索结果集合并至第一缓存变量,并通过第一缓存变量中合并后的缓存数据对待校验数据进行校验。
具体地,服务器确定所述检索结果集的主键值和数据实体为Key-value方式,通过Key-value方式,将检索结果集追加至第一缓存变量中,循环第二缓存变量中待校验的数据,然后通过待校验数据的主键值判断待校验数据是否存在于合并后的缓存数据中,若存在,则获取第一缓存变量中对应的校验扩展规则,并且通过校验扩展规则,判断待校验数据是否合法,若合法,则说明待校验数据通过校验。若不合法,则说明待校验数据不通过校验,最后通过rowIndex定位待校验数据的数据行在待校验数据列中的位置,以标记校验结果。
最后,迭代计算所有分批结果集与所有待校验的数据列。
需要说明的是,虽然本申请实施例是参照图1来对步骤S101至步骤S104依次进行介绍说明的,但这并不代表步骤S101至步骤S104必须按照严格的先后顺序执行。本申请实施例之所以按照图1中所示的顺序对步骤S101至步骤S104依次进行介绍说明,是为了方便本领域技术人员理解本申请实施例的技术方案。换句话说,在本申请实施例中,步骤S101至步骤S104之间的先后顺序可以根据实际需要进行适当调整。
通过图1中的方法及相关内容,本申请实施例通过首先获取待校验数据列,然后按列分批加载数据行,能够实现对待校验数据进行批量校验。进一步地,通过判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配,能够对待校验数据进行去重处理,并且通过在源数据库中检索是否存在,并把检索结果集做内存缓存处理,能够减少大幅DB的访问次数问题,同时也将减少了内存占用量,提高系统的并发性与吞吐量,优化了应用系统的数据导入校验性能。
基于此,本申请实施例还提供了一种数据导入校验的具体实施方案,应用于图1中的方法中。
如图2所示,S201:获取定义为帮助类型的数据列,定义缓存变量checkMap。
S202:存在待校验数据列。
S203:取出数据列Cn的100行待校验数据。
S204:checkMap中是否匹配。
具体地,服务器按照逐行取值的方式,判断各数据行对应的待校验数据与第一缓存变量的缓存数据是否匹配,若是,执行步骤S203,若否,则执行步骤S205。
S205:组织todoMap,批量SQL请求。
具体地,服务器则将待校验数据缓存至第二缓存变量todoMap,将第二缓存变量的键值转换为数组或List集合,比如,将HashMap<string,rowIndex>的键值转换为数组或List集合,然后将数组或List集合作为参数,通过组织SQL脚本的In操作,在源数据库中对待校验数据进行检索,确定检索结果集。
S206:检索结果集合并至checkMap。
具体地,服务器确定检索结果集的主键值和数据实体为Key-value方式,通过Key-value方式,将检索结果集追加至第一缓存变量checkMap中。
S207:对todoMap中的待校验行数据进行二次内存校验,根据todoMap定位原始数据行。
具体地,服务器通过待校验数据的主键值判断待校验数据是否存在于合并后的缓存数据中,若存在,则获取第一缓存变量中对应的校验扩展规则,并且通过校验扩展规则,判断待校验数据是否合法,若合法,则说明待校验数据通过校验。若不合法,则说明待校验数据不通过校验,最后通过rowIndex定位待校验数据的数据行在待校验数据列中的位置,以标记校验结果。
基于同样的思路,本申请的一些实施例还提供了上述方法对应的设备和非易失性计算机存储介质。
图3为本申请实施例提供的一种数据导入校验设备的结构示意图,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取待校验数据列,并确定待校验数据列依赖的源数据库;
分批加载待校验数据列中预设行数的待校验数据,并判断待校验数据与内存中第一缓存变量的缓存数据是否匹配;
若否,则通过结构化查询语言SQL脚本,在源数据库中对待校验数据进行检索,确定检索结果集;
将检索结果集合并至第一缓存变量,并通过第一缓存变量中合并后的缓存数据对待校验数据进行校验。
本申请的一些实施例提供的一种数据导入校验非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
获取待校验数据列,并确定待校验数据列依赖的源数据库;
分批加载待校验数据列中预设行数的待校验数据,并判断待校验数据与内存中第一缓存变量的缓存数据是否匹配;
若否,则通过结构化查询语言SQL脚本,在源数据库中对待校验数据进行检索,确定检索结果集;
将检索结果集合并至第一缓存变量,并通过第一缓存变量中合并后的缓存数据对待校验数据进行校验。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备和介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例提供的设备和介质与方法是一一对应的,因此,设备和介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述设备和介质的有益技术效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请技术原理之内所作的任何修改、等同替换、改进等,均应落入本申请的保护范围之内。

Claims (5)

1.一种数据导入校验方法,其特征在于,所述方法包括:
获取待校验数据列,并确定所述待校验数据列依赖的源数据库;
分批加载所述待校验数据列中预设行数的待校验数据,并判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配;
若否,则通过结构化查询语言SQL脚本,在所述源数据库中对所述待校验数据进行检索,确定检索结果集;
将所述检索结果集合并至所述第一缓存变量,并通过所述第一缓存变量中合并后的缓存数据对所述待校验数据进行校验;
所述并判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配,具体包括:
若是,则获取所述第一缓存变量中对应的校验扩展规则;
通过所述校验扩展规则,判断所述待校验数据是否合法;
若是,则确定所述待校验数据通过校验;
所述判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配,具体包括:
通过数据主键加载所述预设行数的待校验数据;
判断所述第一缓存变量的缓存数据中是否存在所述待校验数据;
所述通过SQL脚本,在所述源数据库中对所述待校验数据进行检索,确定检索结果集,具体包括:
将所述待校验数据缓存至第二缓存变量;
将所述第二缓存变量的键值转换为数组或List集合;
将所述数组或List集合作为参数,通过组织所述SQL脚本的In操作,在所述源数据库中对所述待校验数据进行检索,确定所述检索结果集;
所述将所述检索结果集合并至所述第一缓存变量,具体包括:
确定所述检索结果集的主键值和数据实体为Key-value方式;
通过所述Key-value方式,将所述检索结果集合并至所述第一缓存变量中;
所述将所述检索结果集合并至所述第一缓存变量,具体包括:
确定所述检索结果集的主键值和数据实体为Key-value方式;
通过所述Key-value方式,将所述检索结果集合并至所述第一缓存变量中;
所述并通过所述第一缓存变量中合并后的缓存数据对所述待校验数据进行校验,具体包括:
通过所述待校验数据的主键值判断所述待校验数据是否存在于所述合并后的缓存数据中,并通过rowIndex定位所述待校验数据的数据行在所述待校验数据列中的位置,以标记校验结果。
2.根据权利要求1所述的方法,其特征在于,所述获取待校验数据列,并确定所述待校验数据列依赖的源数据库,具体包括:
获取帮助类型的数据列集合;
在所述数据列集合中,确定待校验数据列;
确定所述待校验数据列依赖的所述源数据库,并根据所述帮助类型对应的元数据,确定所述待校验数据列向所述源数据库的访问方式。
3.根据权利要求1所述的方法,其特征在于,所述分批加载所述待校验数据列中预设行数的待校验数据,并判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配,具体包括:
分批加载所述待校验数据列中预设行数的待校验数据;
按照逐行取值的方式,判断各数据行对应的待校验数据与所述第一缓存变量的缓存数据是否匹配。
4.一种数据导入校验设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取待校验数据列,并确定所述待校验数据列依赖的源数据库;
分批加载所述待校验数据列中预设行数的待校验数据,并判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配;
若否,则通过结构化查询语言SQL脚本,在所述源数据库中对所述待校验数据进行检索,确定检索结果集;
将所述检索结果集合并至所述第一缓存变量,并通过所述第一缓存变量中合并后的缓存数据对所述待校验数据进行校验;
所述并判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配,具体包括:
若是,则获取所述第一缓存变量中对应的校验扩展规则;
通过所述校验扩展规则,判断所述待校验数据是否合法;
若是,则确定所述待校验数据通过校验;
所述判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配,具体包括:
通过数据主键加载所述预设行数的待校验数据;
判断所述第一缓存变量的缓存数据中是否存在所述待校验数据;
所述通过SQL脚本,在所述源数据库中对所述待校验数据进行检索,确定检索结果集,具体包括:
将所述待校验数据缓存至第二缓存变量;
将所述第二缓存变量的键值转换为数组或List集合;
将所述数组或List集合作为参数,通过组织所述SQL脚本的In操作,在所述源数据库中对所述待校验数据进行检索,确定所述检索结果集;
所述将所述检索结果集合并至所述第一缓存变量,具体包括:
确定所述检索结果集的主键值和数据实体为Key-value方式;
通过所述Key-value方式,将所述检索结果集合并至所述第一缓存变量中;
所述将所述检索结果集合并至所述第一缓存变量,具体包括:
确定所述检索结果集的主键值和数据实体为Key-value方式;
通过所述Key-value方式,将所述检索结果集合并至所述第一缓存变量中;
所述并通过所述第一缓存变量中合并后的缓存数据对所述待校验数据进行校验,具体包括:
通过所述待校验数据的主键值判断所述待校验数据是否存在于所述合并后的缓存数据中,并通过rowIndex定位所述待校验数据的数据行在所述待校验数据列中的位置,以标记校验结果。
5.一种数据导入校验非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:
获取待校验数据列,并确定所述待校验数据列依赖的源数据库;
分批加载所述待校验数据列中预设行数的待校验数据,并判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配;
若否,则通过结构化查询语言SQL脚本,在所述源数据库中对所述待校验数据进行检索,确定检索结果集;
将所述检索结果集合并至所述第一缓存变量,并通过所述第一缓存变量中合并后的缓存数据对所述待校验数据进行校验;
所述并判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配,具体包括:
若是,则获取所述第一缓存变量中对应的校验扩展规则;
通过所述校验扩展规则,判断所述待校验数据是否合法;
若是,则确定所述待校验数据通过校验;
所述判断所述待校验数据与内存中第一缓存变量的缓存数据是否匹配,具体包括:
通过数据主键加载所述预设行数的待校验数据;
判断所述第一缓存变量的缓存数据中是否存在所述待校验数据;
所述通过SQL脚本,在所述源数据库中对所述待校验数据进行检索,确定检索结果集,具体包括:
将所述待校验数据缓存至第二缓存变量;
将所述第二缓存变量的键值转换为数组或List集合;
将所述数组或List集合作为参数,通过组织所述SQL脚本的In操作,在所述源数据库中对所述待校验数据进行检索,确定所述检索结果集;
所述将所述检索结果集合并至所述第一缓存变量,具体包括:
确定所述检索结果集的主键值和数据实体为Key-value方式;
通过所述Key-value方式,将所述检索结果集合并至所述第一缓存变量中;
所述将所述检索结果集合并至所述第一缓存变量,具体包括:
确定所述检索结果集的主键值和数据实体为Key-value方式;
通过所述Key-value方式,将所述检索结果集合并至所述第一缓存变量中;
所述并通过所述第一缓存变量中合并后的缓存数据对所述待校验数据进行校验,具体包括:
通过所述待校验数据的主键值判断所述待校验数据是否存在于所述合并后的缓存数据中,并通过rowIndex定位所述待校验数据的数据行在所述待校验数据列中的位置,以标记校验结果。
CN202110832288.9A 2021-07-22 2021-07-22 一种数据导入校验方法、设备及介质 Active CN113553367B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110832288.9A CN113553367B (zh) 2021-07-22 2021-07-22 一种数据导入校验方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110832288.9A CN113553367B (zh) 2021-07-22 2021-07-22 一种数据导入校验方法、设备及介质

Publications (2)

Publication Number Publication Date
CN113553367A CN113553367A (zh) 2021-10-26
CN113553367B true CN113553367B (zh) 2023-07-07

Family

ID=78104092

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110832288.9A Active CN113553367B (zh) 2021-07-22 2021-07-22 一种数据导入校验方法、设备及介质

Country Status (1)

Country Link
CN (1) CN113553367B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572979A (zh) * 2014-12-31 2015-04-29 北京锐安科技有限公司 一种处理结构化查询语言sql的方法及装置
CN111488237A (zh) * 2020-05-15 2020-08-04 征图新视(江苏)科技股份有限公司 一种二维码大数据快速校验方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9235618B2 (en) * 2013-04-06 2016-01-12 Citrix Systems, Inc. Systems and methods for caching of SQL responses using integrated caching

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572979A (zh) * 2014-12-31 2015-04-29 北京锐安科技有限公司 一种处理结构化查询语言sql的方法及装置
CN111488237A (zh) * 2020-05-15 2020-08-04 征图新视(江苏)科技股份有限公司 一种二维码大数据快速校验方法

Also Published As

Publication number Publication date
CN113553367A (zh) 2021-10-26

Similar Documents

Publication Publication Date Title
US11625501B2 (en) Masking sensitive information in records of filtered accesses to unstructured data
CN111949541B (zh) 多源数据库语句检查方法及装置
US8122008B2 (en) Joining tables in multiple heterogeneous distributed databases
US11461321B2 (en) Technology to reduce cost of concatenation for hash array
WO2018129500A1 (en) Optimized navigable key-value store
CN105718455A (zh) 一种数据查询方法及装置
CN112434015B (zh) 数据存储的方法、装置、电子设备及介质
CN112181902A (zh) 数据库的存储方法、装置及电子设备
CN114626092A (zh) 具有关联关系的多字段数据的脱敏方法、系统、装置及计算机存储介质
CN113553367B (zh) 一种数据导入校验方法、设备及介质
CN116775830A (zh) 一种在线技术文档搜索方法、设备及介质
CN116610694A (zh) 一种基于列和访问语句关系的规则校验方法和系统
CN111159192B (zh) 基于大数据的数据入库方法、装置、存储介质和处理器
CN115687392A (zh) 一种sql语句的优化执行方法、装置、电子设备及介质
US10572477B2 (en) Selection of implementation for query execution
US20200081925A1 (en) Method and system for cached early-binding document search
CN108228604B (zh) 基于内存对象的模型构建方法、信息查询方法及装置
CN118113682A (zh) 一种基于Redis的数据库性能优化方法、系统、设备及介质
US11625373B2 (en) Determining additions, deletions and updates to database tables
JP6915356B2 (ja) 分析プログラム、分析装置及び分析方法
CN117806975A (zh) 测试方法、装置、设备及存储介质
US20220309384A1 (en) Selecting representative features for machine learning models
US20210042275A1 (en) Data blocking in a database system
CN117632889A (zh) 一种审计日志的全文索引处理方法和系统
CN116680275A (zh) 基于跳跃表的数据读写方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant