CN112817935A - 基于字段类型的数据处理方法、装置、设备及存储介质 - Google Patents

基于字段类型的数据处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112817935A
CN112817935A CN202110090031.0A CN202110090031A CN112817935A CN 112817935 A CN112817935 A CN 112817935A CN 202110090031 A CN202110090031 A CN 202110090031A CN 112817935 A CN112817935 A CN 112817935A
Authority
CN
China
Prior art keywords
data
migrated
field type
preset
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110090031.0A
Other languages
English (en)
Inventor
刘杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Puhui Enterprise Management Co Ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN202110090031.0A priority Critical patent/CN112817935A/zh
Publication of CN112817935A publication Critical patent/CN112817935A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/2445Data retrieval commands; View definitions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Abstract

本申请涉及数据处理技术领域,揭露一种基于字段类型的数据处理方法、装置、设备及存储介质,其中方法包括接收数据迁移指令,获取数据迁移指令对应的待迁移数据;识别待迁移数据中的字段类型;匹配字段类型对应的预设配置文件,获取字段类型对应的预设校验规则和预设修正规则;在对待迁移数据迁移过程中,通过预设校验规则对迁移数据进行校验处理,得到异常数据;通过预设修正规则对异常数据进行修正处理,得到修正数据;将修正数据重新加入到待迁移数据中进行数据迁移,并输出修正数据对应的日志信息。本申请还涉及区块链技术,待迁移数据存储于区块链中。本申请通过在数据迁移过程中对数据进行校验和修正,以提高数据迁移的效率。

Description

基于字段类型的数据处理方法、装置、设备及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种基于字段类型的数据处理方法、装置、设备及存储介质。
背景技术
随着开源数据库的应用和云计算的发展,出现了越来越多的数据跨数据库迁移的需求。所谓的数据迁移是指,根据提供的数据迁移的工具,按照指定的步骤和规则,将一种数据库(源数据库)的数据导出,以其他语句或者数据文件的形式,装载到目标数据库中。
在现有的数据迁移方式中,直接根据预设的迁移规则,对数据进行迁移。但是,在数据迁移过程中,由于数据是跨数据库迁移的,往往会产生一些异常数据,导致数据迁移过程中断,这时候需要重新修改数据的映射程序,这样导致了数据迁移效率低下。现亟需一种能够在数据迁移对数据进行校验和修正,以提高数据迁移的效率的方法。
发明内容
本申请实施例的目的在于提出一种基于字段类型的数据处理方法、装置、设备及存储介质,在数据迁移过程中对数据进行校验和修正,以提高数据迁移的效率。
为了解决上述技术问题,本申请实施例提供一种基于字段类型的数据处理方法,包括:
接收数据迁移指令,并根据所述数据迁移指令,获取所述数据迁移指令对应的待迁移数据;
识别所述待迁移数据中的字段类型;
匹配所述字段类型对应的预设配置文件,并对所述预设配置文件进行解析,以获取所述字段类型对应的预设校验规则和预设修正规则;
在对所述待迁移数据迁移过程中,通过所述预设校验规则对所述迁移数据进行校验处理,得到异常数据;
通过所述预设修正规则对所述异常数据进行修正处理,得到修正数据;
将所述修正数据重新加入到所述待迁移数据中进行数据迁移,并输出所述修正数据对应的日志信息。
为了解决上述技术问题,本申请实施例提供一种基于字段类型的数据处理装置,包括:
待迁移数据获取模块,用于接收数据迁移指令,并根据所述数据迁移指令,获取所述数据迁移指令对应的待迁移数据;
字段类型识别模块,用于识别所述待迁移数据中的字段类型;
预设规则获取模块,用于匹配所述字段类型对应的预设配置文件,并对所述预设配置文件进行解析,以获取所述字段类型对应的预设校验规则和预设修正规则;
待迁移数据校验模块,用于在对所述待迁移数据迁移过程中,通过所述预设校验规则对所述迁移数据进行校验处理,得到异常数据;
异常数据修正模块,用于通过所述预设修正规则对所述异常数据进行修正处理,得到修正数据;
修正数据加入模块,用于将所述修正数据重新加入到所述待迁移数据中进行数据迁移,并输出所述修正数据对应的日志信息。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种计算机设备,包括,一个或多个处理器;存储器,用于存储一个或多个程序,使得一个或多个处理器实现上述任意一项所述的基于字段类型的数据处理方法。
为解决上述技术问题,本发明采用的一个技术方案是:一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的基于字段类型的数据处理方法。
本发明实施例提供了一种基于字段类型的数据处理方法、装置、设备及存储介质。本发明实施例通过接收数据迁移指令,并根据数据迁移指令,获取数据迁移指令对应的待迁移数据;识别待迁移数据中的字段类型;匹配字段类型对应的预设配置文件,并对预设配置文件进行解析,以获取字段类型对应的预设校验规则和预设修正规则;在对待迁移数据迁移过程中,通过预设校验规则对迁移数据进行校验处理,得到异常数据;通过预设修正规则对异常数据进行修正处理,得到修正数据;将修正数据重新加入到待迁移数据中进行数据迁移,并输出修正数据对应的日志信息,实现在数据迁移过程中,对待迁移数据进行校验,得到异常数据,并对异常数据进行及时的修正,使得对待迁移数据的迁移过程不中断,有利于提高数据迁移的效率。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的基于字段类型的数据处理方法的应用环境示意图;
图2根据本申请实施例提供的基于字段类型的数据处理方法的一实现流程图;
图3是本申请实施例提供的基于字段类型的数据处理方法中子流程的一实现流程图;
图4是本申请实施例提供的基于字段类型的数据处理方法中子流程的又一实现流程图;
图5是本申请实施例提供的基于字段类型的数据处理方法中子流程的又一实现流程图;
图6是本申请实施例提供的基于字段类型的数据处理方法中子流程的又一实现流程图;
图7是本申请实施例提供的基于字段类型的数据处理方法中子流程的又一实现流程图;
图8是本申请实施例提供的基于字段类型的数据处理方法中子流程的又一实现流程图;
图9是本申请实施例提供的基于字段类型的数据处理装置示意图;
图10是本申请实施例提供的计算机设备的示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
下面结合附图和实施方式对本发明进行详细说明。
请参阅图1,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、搜索类应用、即时通信工具等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的基于字段类型的数据处理方法一般由服务器执行,相应地,基于字段类型的数据处理装置一般配置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
请参阅图2,图2示出了基于字段类型的数据处理方法的一种具体实施方式。
需注意的是,若有实质上相同的结果,本发明的方法并不以图2所示的流程顺序为限,该方法包括如下步骤:
S1:接收数据迁移指令,并根据数据迁移指令,获取数据迁移指令对应的待迁移数据。
具体的,在需要进行数据迁移时,用户端会向服务器发送数据迁移指令,在服务器接收到数据迁移指令后,服务器会对该数据迁移指令进行解析,获取需要数据迁移的源数据表的名称和源数据库的名称,并根据源数据表的名称和源数据库的名称,构建查询语句,并通过该查询语句去获取待迁移数据。
其中,待迁移数据包括至少一个字段,且待迁移数据包括至少一条数据记录。示例性的,待迁移数据可以为包括多行数据记录的数据表,或者为列一致的多行文本。其中,数据迁移指令中包括需要进行数据迁移对应的源数据表的名称和源数据库的名称,和数据迁移规则。
S2:识别待迁移数据中的字段类型。
具体的,由于不同的待迁移数据有不同的字段类型,每一种字段类型都有对应的校验规则和修正规则,为了后续能够匹配每一种字段类型的校验规则和修正规则,则首先需要获取到待迁移数据中所有的字段类型。
其中,字段又称为属性,二维表的一列称为一个字段(属性)。在数据库中的每一列的每一个名称,就是字段名,其字段类型也是数据类型,例如int,char,varchar,bit等等。
S3:匹配字段类型对应的预设配置文件,并对预设配置文件进行解析,以获取字段类型对应的预设校验规则和预设修正规则。
具体的,在服务器中预设了存储每一种字段类型对应的配置文件的配置文件集合,其配置文件集合里包括对于每一种字段类型对应的预设配置文件,其中,预设配置文件中包括有字段类型对应的预设校验规则和预设修正规则。通过将在待迁移数据中的每一种字段类型对应的字段类型标志遍历服务器中的配置文件集合,将符合字段类型标志对应的预设配置文件进行解析,获取到每一种字段类型对应的预设校验规则和预设修正规则。
其中,预设校验规则和预设修正规则为用户端事先根据每一种字段对应配置的规则,并将其部署于服务器中。在服务器进行数据迁移时,能够获取字段类型对应的预设校验规则和预设修正规则,对待迁移数据进行校验和修正,以实现提高数据迁移的效率。
在一些具体的实施例中,预设校验规则,例如LONG(校验内容为数字类型),DATE(校验内容为时间),PATTERN(校验内容匹配指定的正则表达式),ENUM(校验内容为指定范围中的值),NOTBLANK(校验内容不为空)。预设修正规则,例如LOG(日志输出),SKIP(跳过这条记录),SUBSTRING(截取startIndex到endIndex的字符串),DEFAULT(将内容替换为指定value值)。
S4:在对待迁移数据迁移过程中,通过预设校验规则对迁移数据进行校验处理,得到异常数据。
具体的,为了提高数据迁移效率,服务器在对待迁移数据进行迁移的过程中,将同步通过预设校验规则对待迁移数据进行校验处理。进一步的,服务器通过对应的预设校验规则遍历对应的字段类型的待迁移数据,通过正则匹配的方式,将字段类型中的待迁移数据与预设校验规则进行匹配,若是字段类型中的待迁移数据与预设校验不能匹配,则说明该待迁移数据为异常数据。其中,异常数据是指在数据迁移过程中,不能够与预设校验规则进行匹配的数据,其在数据迁移过程中往往会表现出异常,容易导致数据迁移过程中断,所以本申请实施例为了提高数据迁移效率,校验出异常数据,再通过后续对异常事件进行修正,以保证数据迁移过程不中断,进而实现数据迁移的效率。
在一具体实施例中,例如对字段类型为Bean预设配置规则为(PATTERN(\\d+[A-Z]+$)&LENGTH(0,15)),其表示的字段类型为Bean的field值内容应该是前面为数字开头并且以大写字母结尾,并且值的长度应该小于15位,如果不符合这个规则,这将该字段类型对应的待迁移数据识别为异常数据。
S5:通过预设修正规则对异常数据进行修正处理,得到修正数据。
具体的,由于在服务器中事先部署着每一种字段类型出现异常情况下,都对应有预设修正规则。只要对异常数据进行字段类型的识别,获取到字段类型对应的预设修正规则,并通过预设修正规则对异常数据进行修正处理,从而得到修正数据。进一步的,为了提高数据迁移效率,保证数据迁移过程不出现中断的情况,在对异常数据的修正处理过程是与待迁移数据的数据迁移过程是同步的。该对异常数据进行修正处理后得到的修正数据,能够满足数据迁移过程的迁移规则,以保证数据迁移过程不中断。
如上述具体实施例,对字段类型为Bean预设配置规则为(PATTERN(\\d+[A-Z]+$)&LENGTH(0,15)),该字段类型对应的预设修正规则为(LOG&DEFAULT(6666EEE)),若该字段类型对应的待迁移数据被识别为异常数据,则通过该预设修正规则为(LOG&DEFAULT(6666EEE))对该异常数据进行修正,也即将字段类型为Bean的field的值替换为“6666EEE”。
S6:将修正数据重新加入到待迁移数据中进行数据迁移,并输出修正数据对应的日志信息。
具体的,通过对异常数据进行修正处理后,得到的修正数据已经满足了数据迁移规则,不会出现数据报错或者是迁移中断的情况,所以将修正数据重新加入到待迁移数据中,重新对修正数据进行数据迁移。同时,将修正数据对应的日志信息进行输出,便于在数据迁移完成后,能够快速获取到出现修正数据对应的异常数据,进而对这些异常数据进行统一的处理,并且分析待迁移数据出现异常数据的情况。
本实施例中,通过接收数据迁移指令,并根据数据迁移指令,获取数据迁移指令对应的待迁移数据;识别待迁移数据中的字段类型;匹配字段类型对应的预设配置文件,并对预设配置文件进行解析,以获取字段类型对应的预设校验规则和预设修正规则;在对待迁移数据迁移过程中,通过预设校验规则对迁移数据进行校验处理,得到异常数据;通过预设修正规则对异常数据进行修正处理,得到修正数据;将修正数据重新加入到待迁移数据中进行数据迁移,并输出修正数据对应的日志信息,实现在数据迁移过程中,对待迁移数据进行校验,得到异常数据,并对异常数据进行及时的修正,使得对待迁移数据的迁移过程不中断,有利于提高数据迁移的效率。
请参阅图3,图3示出了步骤S4的一种具体实施方式,步骤S4中在对待迁移数据迁移过程中,通过预设校验规则对迁移数据进行校验处理,得到异常数据的具体实现过程,详叙如下:
S41:在对待迁移数据迁移过程中,通过正则匹配的方式,将预设校验规则与对应字段类型的待迁移数据进行匹配,得到匹配结果。
具体的,在对迁移数据迁移过程中,遍历所有待迁移数据,通过正则匹配的方式,将每一种字段类型对应的待迁移数据和对应的预设校验规则进行一一匹配,得到匹配结果。若是待迁移数据能够与预设校验规则匹配,则该待迁移数据不是异常数据,在数据迁移过程中,能够正常迁移;若是待迁移数据不能够与预设校验规则匹配,则说明该迁移数据为异常数据。
S42:若匹配结果为待迁移数据与预设校验规则不匹配,则将匹配结果对应的待迁移数据作为异常数据。
具体的,若匹配结果为待迁移数据与预设校验规则不匹配,说明该待迁移数据在数据迁移过程中,会使得迁移报错或者出现迁移中断,则将该待迁移数据作为异常数据,便于后续对其进行修正,以提高数据迁移的效率。
在本实施中,在对待迁移数据迁移过程中,通过正则匹配的方式,将预设校验规则与对应字段类型的待迁移数据进行匹配,得到匹配结果,若匹配结果为待迁移数据与预设校验规则不匹配,则将匹配结果对应的待迁移数据作为异常数据,实现识别数据迁移过程中,存在的异常数据,便于后续对其修正,有利于提高数据迁移的效率。
请参阅图4,图4示出了步骤S4之前的一种具体实施方式,该实施例包括:
S4A:解析数据迁移指令,获取待迁移数据对应的迁移规则。
具体的,由于本申请是要提高数据迁移的效率,所以需要获取待迁移数据对应的迁移规则。通过对数据迁移指令进行解析,获取其待迁移数据对应的迁移规则,该迁移规则由用户端事先配置好,再通过数据迁移指令发送到服务器中。
S4B:将待迁移数据进行封装,得到封装数据。
具体的,数据的迁移过程实则为数据的一种映射过程,通过对待迁移数据进行封装,得到封装数据,便于后续对其进行数据迁移。
S4C:根据迁移规则,将封装数据往目标数据库进行迁移。
具体的,通过迁移规则,将上述封装数据往目标数据库进行迁移,并且在数据迁移过程中,服务器会对数据进行校验和修正。其中,目标数据库是指将待迁移数据转移到另一数据库中,所指的数据库。该目标数据库由用户端事先指定,该目标数据库类型包括但不限于:MySQL、MariaDB、MongoDB、CouchDB和Oracle数据库等等。在一具体实施例中,目标数据库为MySQL。
本实施例中,通过解析数据迁移指令,获取待迁移数据对应的迁移规则,将待迁移数据进行封装,得到封装数据,根据迁移规则,将封装数据往目标数据库进行迁移,实现对待迁移数据进行迁移,便于后续对待迁移数据进行校验和修正。
请参阅图5,图5示出了步骤S1的一种具体实施方式,步骤S1中接收数据迁移指令,并根据数据迁移指令,获取数据迁移指令对应的待迁移数据的具体实现过程,详叙如下:
S11:接收数据迁移指令。
具体的,服务器通过接收数据迁移指令,便于后续获取待迁移数据。
S12:解析数据迁移指令,获取源数据表的名称和源数据库的名称。
具体的,通过解析数据迁移指令,获取待迁移数据对应对源数据表的名称和源数据库的名称,便于后续获取待迁移数据。
S13:根据源数据表的名称和源数据库的名称,构建并执行查询语句以获取待迁移数据。
具体的,本申请实施例所述的查询语句是指,用于获取所述待前迁移的查询语句,例如,源数据表的名称为ipm_trade_inv_dist,源数据库的名称为alinv,查询语句为:select*from alinv.ipm_trade_inv_dist,即:查询语句用于获取源数据库alinv中源数据表ipm_trade_inv_dist内的所有原始数据。进一步的,本申请实施例以待迁移数据的源数据表为主表,以迁移到的目标数据库的目标数据表为从属表。因此,本实施例首先根据源表信息获取待迁移数据,获取到待迁移数据后,再根据待迁移数据的数据标识和目标表信息,对待迁移数据进行迁移,最终将待迁移数据迁移到目标数据库中。
本实施例中,通过接收数据迁移指令,解析数据迁移指令,获取源数据表的名称和源数据库的名称,并根据源数据表的名称和源数据库的名称,构建并执行查询语句以获取待迁移数据,实现获取待迁移数据,便于后续对待迁移数据进行数据迁移和在数据迁移过程中,对待迁移数据进行校验和修正。
请参阅图6,图6示出了步骤S2的一种具体实施方式,步骤S2中识别待迁移数据中的字段类型的具体实现过程,详叙如下:
S21:遍历待迁移数据,获取待迁移数据中所有的字段类型标志。
具体的,对于不同的数据类型,其有不同的字段类型,每种字段类型标志都不同。通过遍历待迁移数据,能够识别和获取到所有的字段类型标志。例如对于字段类型为Enterprise Java Bean,其字段类型标志为Bean,该字段类型为描述Java的软件组件模型。
S22:通过字段类型标志,判断出待迁移数据中的字段类型。
本实施例中,通过该字段类型标志,判断出其字段类型,便于后续根据字段类型进行相应的数据校验和数据修正。
本实施例中,通过遍历待迁移数据,获取待迁移数据中所有的字段类型标志,并通过字段类型标志,判断出待迁移数据中的字段类型,便于后续后续根据字段类型进行相应的数据校验和数据修正,以提高数据迁移的效率。
请参阅图7,图7示出了步骤S3的一种具体实施方式,步骤S3中匹配字段类型对应的预设配置文件,并对预设配置文件进行解析,以获取字段类型对应的预设校验规则和预设修正规则的具体实现过程,详叙如下:
S31:获取待迁移数据对应的配置文件集合。
具体的,用户端在数据迁移前,对每一种字段类型配置了对应的校验规则和修正规则,并将其配置成配置文件集合的形式存储于服务器之中。所以,通过获取待迁移数据对应的配置文件集合,以便后续获取对应的预设校验规则和预设修正规则。
S32:匹配每种字段类型在配置文件集合中对应的预设配置文件。
具体的,由于每一种字段类型都有对应的预设配置文件,通过字段类型识别和匹配对应的预设配置文件。
S33:对预设配置文件进行解析,获取每种字段类型对应的预设校验规则和预设修正规则。
具体的,通过对预设配置文件进行解析,能够得到每种字段类型对应的预设校验规则和预设修正规则,便于后续进行数据的校验和修正。
本实施例中,通过获取待迁移数据对应的配置文件集合,匹配每种字段类型在配置文件集合中对应的预设配置文件,对预设配置文件进行解析,获取每种字段类型对应的预设校验规则和预设修正规则,实现获取对应的预设校验规则和预设修正规则,便于后续数据迁移过程中,对数据进行校验和修正,有利于提高数据迁移的效率。
请参阅图8,图8示出了步骤S5的一种具体实施方式,步骤S5中通过预设修正规则对异常数据进行修正处理,得到修正数据的具体实现过程,详叙如下:
S51:识别异常数据中的字段类型。
具体的,由于是对异常数据进行统一的处理,这就可能将不同的字段类型的异常数据进行混合,所以为了后续进行异常数据修正处理,需要先识别异常数据中的字段类型。
S52:根据字段类型,匹配字段类型对应的预设修正规则。
具体的,上述步骤识别出了异常数据中的字段类型,则将每一种字段类型进行获取对应的预设修正规则。
S53:根据预设修正规则,将异常数据进行修正处理,得到修正数据。
具体的,由于用户端事先对每一种字段类型都配置了相应对的修正规则,所以通过该预设修正规则中的修正处理方式,对异常数据进行修正处理,从而得到修正数据。
本实施例中,通过识别异常数据中的字段类型,根据字段类型,匹配字段类型对应的预设修正规则,根据预设修正规则,将异常数据进行修正处理,得到修正数据,实现对异常数据进行修正,使得数据在迁移过程中,不是异常数据的影响而导致数据迁移中断,有利于提高数据迁移的效率。
需要强调的是,为进一步保证上述待迁移数据的私密和安全性,上述待迁移数据还可以存储于一区块链的节点中。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
请参考图9,作为对上述图2所示方法的实现,本申请提供了一种基于字段类型的数据处理装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图9所示,本实施例的基于字段类型的数据处理装置包括:待迁移数据获取模块71、字段类型识别模块72、预设规则获取模块73、待迁移数据校验模块74、异常数据修正模块75及修正数据加入模块76,其中:
待迁移数据获取模块71,用于接收数据迁移指令,并根据数据迁移指令,获取数据迁移指令对应的待迁移数据;
字段类型识别模块72,用于识别待迁移数据中的字段类型;
预设规则获取模块73,用于匹配字段类型对应的预设配置文件,并对预设配置文件进行解析,以获取字段类型对应的预设校验规则和预设修正规则;
待迁移数据校验模块74,用于在对待迁移数据迁移过程中,通过预设校验规则对迁移数据进行校验处理,得到异常数据;
异常数据修正模块75,用于通过预设修正规则对异常数据进行修正处理,得到修正数据;
修正数据加入模块76,用于将修正数据重新加入到待迁移数据中进行数据迁移,并输出修正数据对应的日志信息。
进一步的,待迁移数据校验模块74包括:
匹配结果获取单元,用于在对待迁移数据迁移过程中,通过正则匹配的方式,将预设校验规则与对应字段类型的待迁移数据进行匹配,得到匹配结果;
异常数据识别单元,用于若匹配结果为待迁移数据与预设校验规则不匹配,则将匹配结果对应的待迁移数据作为异常数据。
进一步的,在待迁移数据校验模块74之前,该基于字段类型的数据处理装置还包括:
迁移规则获取模块,用于解析数据迁移指令,获取待迁移数据对应的迁移规则;
封装数据获取模块,用于将待迁移数据进行封装,得到封装数据;
数据迁移模块,用于根据迁移规则,将封装数据往目标数据库进行迁移。
进一步的,待迁移数据获取模块71包括:
数据迁移指令接收单元,用于接收数据迁移指令;
数据迁移指令解析单元,用于解析数据迁移指令,获取源数据表的名称和源数据库的名称;
查询语句执行单元,用于根据源数据表的名称和源数据库的名称,构建并执行查询语句以获取待迁移数据。
进一步的,字段类型识别模块72包括:
字段类型标志获取单元,用于遍历待迁移数据,获取待迁移数据中所有的字段类型标志;
字段类型判断单元,用于通过字段类型标志,判断出待迁移数据中的字段类型。
进一步的,预设规则获取模块73包括:
配置文件集合单元,用于获取待迁移数据对应的配置文件集合;
预设配置文件匹配单元,用于匹配每种字段类型在配置文件集合中对应的预设配置文件;
预设配置文件解析单元,用于对预设配置文件进行解析,获取每种字段类型对应的预设校验规则和预设修正规则。
进一步的,异常数据修正模块75包括:
字段类型获取单元,用于识别异常数据中的字段类型;
修正规则匹配单元,用于根据字段类型,匹配字段类型对应的预设修正规则;
修正数据获取单元,用于根据预设修正规则,将异常数据进行修正处理,得到修正数据。
需要强调的是,为进一步保证上述待迁移数据的私密和安全性,上述待迁移数据还可以存储于一区块链的节点中。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图10,图10为本实施例计算机设备基本结构框图。
计算机设备8包括通过系统总线相互通信连接存储器81、处理器82、网络接口83。需要指出的是,图中仅示出了具有三种组件存储器81、处理器82、网络接口83的计算机设备8,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
存储器81至少包括一种类型的可读存储介质,可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器81可以是计算机设备8的内部存储单元,例如该计算机设备8的硬盘或内存。在另一些实施例中,存储器81也可以是计算机设备8的外部存储设备,例如该计算机设备8上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器81还可以既包括计算机设备8的内部存储单元也包括其外部存储设备。本实施例中,存储器81通常用于存储安装于计算机设备8的操作系统和各类应用软件,例如基于字段类型的数据处理方法的程序代码等。此外,存储器81还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器82在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器82通常用于控制计算机设备8的总体操作。本实施例中,处理器82用于运行存储器81中存储的程序代码或者处理数据,例如运行上述基于字段类型的数据处理方法的程序代码,以实现基于字段类型的数据处理方法的各种实施例。
网络接口83可包括无线网络接口或有线网络接口,该网络接口83通常用于在计算机设备8与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序可被至少一个处理器执行,以使至少一个处理器执行如上述的一种基于字段类型的数据处理方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例的方法。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (10)

1.一种基于字段类型的数据处理方法,其特征在于,包括:
接收数据迁移指令,并根据所述数据迁移指令,获取所述数据迁移指令对应的待迁移数据;
识别所述待迁移数据中的字段类型;
匹配所述字段类型对应的预设配置文件,并对所述预设配置文件进行解析,以获取所述字段类型对应的预设校验规则和预设修正规则;
在对所述待迁移数据迁移过程中,通过所述预设校验规则对所述迁移数据进行校验处理,得到异常数据;
通过所述预设修正规则对所述异常数据进行修正处理,得到修正数据;
将所述修正数据重新加入到所述待迁移数据中进行数据迁移,并输出所述修正数据对应的日志信息。
2.根据权利要求1所述的基于字段类型的数据处理方法,其特征在于,所述在对所述待迁移数据迁移过程中,通过所述预设校验规则对所述迁移数据进行校验处理,得到异常数据,包括:
在对所述待迁移数据迁移过程中,通过正则匹配的方式,将所述预设校验规则与对应所述字段类型的待迁移数据进行匹配,得到匹配结果;
若所述匹配结果为所述待迁移数据与所述预设校验规则不匹配,则将所述匹配结果对应的待迁移数据作为所述异常数据。
3.根据权利要求1所述的基于字段类型的数据处理方法,其特征在于,在所述在对所述待迁移数据迁移过程中,通过所述预设校验规则对所述迁移数据进行校验处理,得到异常数据之前,所述方法还包括:
解析所述数据迁移指令,获取所述待迁移数据对应的迁移规则;
将所述待迁移数据进行封装,得到封装数据;
根据所述迁移规则,将所述封装数据往目标数据库进行迁移。
4.根据权利要求1所述的基于字段类型的数据处理方法,其特征在于,所述接收数据迁移指令,并根据所述数据迁移指令,获取所述数据迁移指令对应的待迁移数据,包括:
接收所述数据迁移指令;
解析所述数据迁移指令,获取源数据表的名称和源数据库的名称;
根据所述源数据表的名称和源数据库的名称,构建并执行查询语句以获取所述待迁移数据。
5.根据权利要求1所述的基于字段类型的数据处理方法,其特征在于,所述识别所述待迁移数据中的字段类型,包括:
遍历所述待迁移数据,获取所述待迁移数据中所有的字段类型标志;
通过所述字段类型标志,判断出所述待迁移数据中的所述字段类型。
6.根据权利要求1所述的基于字段类型的数据处理方法,其特征在于,所述匹配所述字段类型对应的预设配置文件,并对所述预设配置文件进行解析,以获取所述字段类型对应的预设校验规则和预设修正规则,包括:
获取所述待迁移数据对应的配置文件集合;
匹配每种所述字段类型在所述配置文件集合中对应的预设配置文件;
对所述预设配置文件进行解析,获取每种所述字段类型对应的所述预设校验规则和所述预设修正规则。
7.根据权利要求1至6任一项所述的基于字段类型的数据处理方法,其特征在于,所述通过所述预设修正规则对所述异常数据进行修正处理,得到修正数据,包括:
识别所述异常数据中的所述字段类型;
根据所述字段类型,匹配所述字段类型对应的所述预设修正规则;
根据所述预设修正规则,将所述异常数据进行所述修正处理,得到所述修正数据。
8.一种基于字段类型的数据处理装置,其特征在于,包括:
待迁移数据获取模块,用于接收数据迁移指令,并根据所述数据迁移指令,获取所述数据迁移指令对应的待迁移数据;
字段类型识别模块,用于识别所述待迁移数据中的字段类型;
预设规则获取模块,用于匹配所述字段类型对应的预设配置文件,并对所述预设配置文件进行解析,以获取所述字段类型对应的预设校验规则和预设修正规则;
待迁移数据校验模块,用于在对所述待迁移数据迁移过程中,通过所述预设校验规则对所述迁移数据进行校验处理,得到异常数据;
异常数据修正模块,用于通过所述预设修正规则对所述异常数据进行修正处理,得到修正数据;
修正数据加入模块,用于将所述修正数据重新加入到所述待迁移数据中进行数据迁移,并输出所述修正数据对应的日志信息。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于字段类型的数据处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于字段类型的数据处理方法。
CN202110090031.0A 2021-01-22 2021-01-22 基于字段类型的数据处理方法、装置、设备及存储介质 Pending CN112817935A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110090031.0A CN112817935A (zh) 2021-01-22 2021-01-22 基于字段类型的数据处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110090031.0A CN112817935A (zh) 2021-01-22 2021-01-22 基于字段类型的数据处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112817935A true CN112817935A (zh) 2021-05-18

Family

ID=75858857

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110090031.0A Pending CN112817935A (zh) 2021-01-22 2021-01-22 基于字段类型的数据处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112817935A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113312338A (zh) * 2021-06-29 2021-08-27 中国农业银行股份有限公司 数据一致性的校验方法、装置、设备、介质及程序产品
CN115242349A (zh) * 2022-06-21 2022-10-25 苏州盈数智能科技有限公司 企业级数据校验方法、装置、计算机设备及存储介质
CN115941712A (zh) * 2022-12-08 2023-04-07 中国平安财产保险股份有限公司 报送数据的处理方法、装置、计算机设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120330911A1 (en) * 2011-06-27 2012-12-27 International Business Machines Corporation Automatic generation of instantiation rules to determine quality of data migration
CN104077401A (zh) * 2014-07-04 2014-10-01 用友软件股份有限公司 用于数据库的数据迁移装置和数据迁移方法
US20150370845A1 (en) * 2014-06-18 2015-12-24 International Business Machines Corporation Storage device data migration
US20160098470A1 (en) * 2014-10-01 2016-04-07 SkyKick, Inc. Automated staged data migration
CN109407964A (zh) * 2017-08-18 2019-03-01 阿里巴巴集团控股有限公司 一种数据的迁移方法、装置及设备
US10282259B1 (en) * 2010-08-06 2019-05-07 Open Invention Network Llc System and method for event-driven live migration of multi-process applications
CN110297813A (zh) * 2019-05-22 2019-10-01 平安银行股份有限公司 数据迁移方法、装置、计算机设备及存储介质
CN110321339A (zh) * 2019-07-04 2019-10-11 深圳乐信软件技术有限公司 一种数据迁移方法、装置、设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10282259B1 (en) * 2010-08-06 2019-05-07 Open Invention Network Llc System and method for event-driven live migration of multi-process applications
US20120330911A1 (en) * 2011-06-27 2012-12-27 International Business Machines Corporation Automatic generation of instantiation rules to determine quality of data migration
US20150370845A1 (en) * 2014-06-18 2015-12-24 International Business Machines Corporation Storage device data migration
CN104077401A (zh) * 2014-07-04 2014-10-01 用友软件股份有限公司 用于数据库的数据迁移装置和数据迁移方法
US20160098470A1 (en) * 2014-10-01 2016-04-07 SkyKick, Inc. Automated staged data migration
CN109407964A (zh) * 2017-08-18 2019-03-01 阿里巴巴集团控股有限公司 一种数据的迁移方法、装置及设备
CN110297813A (zh) * 2019-05-22 2019-10-01 平安银行股份有限公司 数据迁移方法、装置、计算机设备及存储介质
CN110321339A (zh) * 2019-07-04 2019-10-11 深圳乐信软件技术有限公司 一种数据迁移方法、装置、设备和存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113312338A (zh) * 2021-06-29 2021-08-27 中国农业银行股份有限公司 数据一致性的校验方法、装置、设备、介质及程序产品
CN115242349A (zh) * 2022-06-21 2022-10-25 苏州盈数智能科技有限公司 企业级数据校验方法、装置、计算机设备及存储介质
CN115242349B (zh) * 2022-06-21 2023-11-14 苏州盈数智能科技有限公司 企业级数据校验方法、装置、计算机设备及存储介质
CN115941712A (zh) * 2022-12-08 2023-04-07 中国平安财产保险股份有限公司 报送数据的处理方法、装置、计算机设备及存储介质
CN115941712B (zh) * 2022-12-08 2024-04-26 中国平安财产保险股份有限公司 报送数据的处理方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN109474578B (zh) 报文消息校验方法、装置、计算机设备和存储介质
US10769228B2 (en) Systems and methods for web analytics testing and web development
CN109683953B (zh) 一种基于可视化界面进行配置文件处理的方法及装置
CN112817935A (zh) 基于字段类型的数据处理方法、装置、设备及存储介质
EP3270300A1 (en) Method and device for form verification
WO2019019640A1 (zh) 订单信息的模拟处理方法、装置、存储介质和计算机设备
CN112039900B (zh) 网络安全风险检测方法、系统、计算机设备和存储介质
CN111290742A (zh) 参数验证方法、装置、电子设备及可读存储介质
CN112559354A (zh) 前端代码规范检测方法、装置、计算机设备及存储介质
CN112558946A (zh) 一种生成代码的方法、装置、设备和计算机可读存储介质
CN111814203B (zh) 一种环境数据的处理方法、装置、设备及存储介质
CN112631924A (zh) 自动化测试方法、装置、计算机设备及存储介质
CN112540924A (zh) 接口自动化测试方法、装置、设备及存储介质
CN112631911A (zh) 自动化测试方法、装置、计算机设备及存储介质
CN112395485A (zh) 一种政策大数据挖掘方法、装置、计算机设备及存储介质
CN113434254B (zh) 客户端部署方法、装置、计算机设备及存储介质
CN110443039A (zh) 插件安全性的检测方法、装置以及电子设备
CN112965731B (zh) 基于Tinker的Flutter热更新方法、装置、设备及存储介质
CN112416784A (zh) 基于配置中心的接口校验方法、系统及装置及存储介质
CN111782244A (zh) 配置文件的更新方法、装置、计算机设备及存储介质
CN112083925A (zh) 基于h5页面开发的数据获取方法、装置、设备及存储介质
CN111552663A (zh) 文件一致性验证方法、装置、计算机设备及存储介质
CN114968822A (zh) 接口测试方法、装置、计算机设备及存储介质
CN113360172B (zh) 应用部署方法、装置、计算机设备及存储介质
CN114626352A (zh) 报表自动化生成方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination