CN110413593B - 数据迁移方法、装置、计算机设备及存储介质 - Google Patents
数据迁移方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN110413593B CN110413593B CN201910533780.9A CN201910533780A CN110413593B CN 110413593 B CN110413593 B CN 110413593B CN 201910533780 A CN201910533780 A CN 201910533780A CN 110413593 B CN110413593 B CN 110413593B
- Authority
- CN
- China
- Prior art keywords
- partition
- data
- temporary
- temporary table
- basic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 110
- 238000013508 migration Methods 0.000 title claims abstract description 60
- 230000005012 migration Effects 0.000 title claims abstract description 60
- 238000005192 partition Methods 0.000 claims abstract description 227
- 230000008569 process Effects 0.000 claims description 55
- 230000015654 memory Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 15
- 238000010586 diagram Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/214—Database migration support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了数据迁移方法、装置、计算机设备及存储介质。该方法包括:创建与基础表的表结构相同的第一临时表;根据所述基础表中设置的分区规则,将所述基础表中的数据通过分区交换存储至所述第一临时表中对应的分区,以得到第二临时表;以及在第一历史表中创建与所述第二临时表的表结构对应的分区,将所述第二临时表中的数据通过分区交换存储至所述第一历史表中对应的分区,以得到第二历史表。该方法以分区表形式的临时表为媒介,先将基础表中的数据交换到临时表中,然后再将整个临时表数据交换到历史表的新增分区中,交换完成重新重建失效索引,避免了大批量的数据增删操作,提高了数据迁移效率。
Description
技术领域
本发明涉及数据传输技术领域,尤其涉及一种数据迁移方法、装置、计算机设备及存储介质。
背景技术
目前,随着企业财务数据管理的需求,一般需要将账单系统中的多个账期的数据进行数据处理(如数据汇总计算)后得到已处理数据,也即对基础表进行数据处理。而这些基础表中存储的已处理数据需要转移至历史表中,而目前常用的方法是将基础表中存储的已处理数据通过插入指令(如数据库中的insert指令)而插入至历史表,上述整个迁移过程涉及到删除基础表中海量的已处理数据,而且还需要将这些已处理数据写入历史表,导致数据迁移效率低下。
发明内容
本发明实施例提供了一种数据迁移方法、装置、计算机设备及存储介质,旨在解决现有技术中通过将基础表中存储的已处理数据通过插入指令插入至历史表时,涉及到删除基础表中海量的已处理数据,而且还需要将这些已处理数据写入历史表,导致数据迁移效率低下的问题。
第一方面,本发明实施例提供了一种数据迁移方法,其包括:
创建与基础表的表结构相同的第一临时表;其中,所述基础表用于存储业务数据,所述第一临时表是空白状态的分区表;
根据所述基础表中设置的分区规则,将所述基础表中的数据通过分区交换存储至所述第一临时表中对应的分区,以得到第二临时表;以及
在第一历史表中创建与所述第二临时表的表结构对应的分区,将所述第二临时表中的数据通过分区交换存储至所述第一历史表中对应的分区,以得到第二历史表;其中,所述第一历史表中新创建的分区为空白状态的分区。
第二方面,本发明实施例提供了一种数据迁移装置,其包括:
临时表创建单元,用于创建与基础表的表结构相同的第一临时表;其中,所述基础表用于存储业务数据,所述第一临时表是空白状态的分区表;
临时表写入单元,用于根据所述基础表中设置的分区规则,将所述基础表中的数据通过分区交换存储至所述第一临时表中对应的分区,以得到第二临时表;以及
数据分区交换单元,用于在第一历史表中创建与所述第二临时表的表结构对应的分区,将所述第二临时表中的数据通过分区交换存储至所述第一历史表中对应的分区,以得到第二历史表;其中,所述第一历史表中新创建的分区为空白状态的分区。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的数据迁移方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的数据迁移方法。
本发明实施例提供了一种数据迁移方法、装置、计算机设备及存储介质。该方法包括创建与基础表的表结构相同的第一临时表;其中,所述基础表用于存储业务数据,所述第一临时表是空白状态的分区表;根据所述基础表中设置的分区规则,将所述基础表中的数据通过分区交换存储至所述第一临时表中对应的分区,以得到第二临时表;以及在第一历史表中创建与所述第二临时表的表结构对应的分区,将所述第二临时表中的数据通过分区交换存储至所述第一历史表中对应的分区,以得到第二历史表;其中,所述第一历史表中新创建的分区为空白状态的分区。该方法以分区表形式的临时表为媒介,先将基础表中的数据交换到临时表中,然后再将整个临时表数据交换到历史表的新增分区中,交换完成重新重建失效索引,避免了大批量的数据增删操作,提高了数据迁移效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的数据迁移方法的应用场景示意图;
图2为本发明实施例提供的数据迁移方法的流程示意图;
图3为本发明实施例提供的数据迁移方法的子流程示意图;
图4为本发明实施例提供的数据迁移方法的另一子流程示意图;
图5为本发明实施例提供的数据迁移方法的另一子流程示意图;
图6为本发明实施例提供的数据迁移装置的示意性框图;
图7为本发明实施例提供的数据迁移装置的子单元示意性框图;
图8为本发明实施例提供的数据迁移装置的另一子单元示意性框图;
图9为本发明实施例提供的数据迁移装置的另一子单元示意性框图;
图10为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的数据迁移方法的应用场景示意图,图2为本发明实施例提供的数据迁移方法的流程示意图,该数据迁移方法应用于服务器中,该方法通过安装于服务器中的应用软件进行执行。
如图2所示,该方法包括步骤S110~S130。
S110、创建与基础表的表结构相同的第一临时表;其中,所述基础表用于存储业务数据,所述第一临时表是空白状态的分区表。
在本实施例中,为了更清楚的理解本申请的技术方案,下面针对本申请中所涉及的终端进行详细介绍。
一是第一服务器,用于存储基础表,基础表中用于存储业务数据(例如财务收支数据)。例如集团企业设置的多个分支机构、子公司均设置有第一服务器。
二是第二服务器,用于接收并存储第一服务器上传的基础表,将基础表中的数据交换存储至历史表的新建分区。本申请的技术方案是在第二服务器的角度进行描述。
当第二服务器接收了第一服务器所上传的基础表后,对各基础表中的数据进行数据处理。例如第一服务器为银行账单系统,第二服务器为集团的总服务器,第一服务器所收集的是账期数据,这些账期数据存储在基础表中,在第一服务器将基础表发送至第二服务器后,通过第二服务器对基础表进行银行跑批(银行跑批就是结账和批量,最主要是产生总账,进行总分核对。白天用户在柜台交易,都是及时对账户进行操作,交易数据也是存储于第一服务器中,没有经过整合,故晚上在第二服务器中批量进行一些业务的整合和报表的生成,如定期储蓄整合、到期自动转存等业务核对)。在第二服务器中完成了对基础表的跑批后,得到了跑批后的基础表。为了将基础表中的数据迁移到历史表中时,为了避免直接将基础表中的海量数据通过insert(insert即数据库中的数据插入操作)的方式直接插入到历史表中,可以先创建一个空白的分区表作为临时表,并根据基础表中的设置的分区规则的个数,在空白的临时表中创建对应相同个数的子分区,以临时表为基础表和历史表之间的媒介,来实现将临时表中的数据快速迁移至历史表的对应分区。
在一实施例中,如图3所示,步骤S110包括:
S111、获取所述基础表中设置的分区规则的分区个数;
S112、创建表格分区个数与所述分区个数相同的第一临时表。
在本实施例中,先获取所述基础表中设置的分区规则的分区个数,例如,基础表中存储有满足P1规则的数据,也存储有满足P2规则的数据;此时创建一个具有2个分区的第一临时表,且所示第一临时表为分区表。当创建了空白的分区表作为第一临时表后,即可通过分区交换技术将基础表中的数据交换迁移至第一临时表。为了确保数据分区交换的进行,需要使得第一临时表中的表结构以及分区个数与基础表完全相同。
S120、根据所述基础表中设置的分区规则,将所述基础表中的数据通过分区交换存储至所述第一临时表中对应的分区,以得到第二临时表。
在本实施例中,当完成了创建第一临时表后,通过分区交换技术将基础表中各分区的数据交换至第一临时表中。分区交换技术可以实现数据快速转移,故适用于数据加载提速、历史数据清理等处理。分区交换技术实际上只修改了数据字典中的数据物理段位置,而不是实际的移动数据,故速度很快。
在一实施例中,如图4所示,步骤S120包括:
S121、获取所述基础表中各分区规则对应的基表;
S122、将每一分区规则对应的基表中的数据交换至所述第一临时表中对应的分区中,以得到填充后第一临时表;
S123、重建所述填充后第一临时表的失效索引,得到所述第二临时表。
在本实施例中,例如所述基础表中存储有满足P1规则的数据,也存储有满足P2规则的数据;先获取满足P1规则的数据形成基表1,获取满足P2规则的数据形成基表2,将基表1中的数据交换至临时表的分区1中,再将基表2中的数据交换至临时表中的分区2中。
在第二服务器中,基础表与第一临时表之间的分区交换过程具体如下:
1)通过creattable指令以创建第一临时表,而且通过partitionby range()指令以将第一临时表中划分出与基础表的基表个数相同的分区;
2)通过create table表分区名称as select字段名称from表名称where分区规则,及select count(*)from表名称指令分别获取基础表中满足P1规则的数据组成的基表1,以及获取基础表中满足P2规则的数据组成的基表2;
3)通过alter table表名称exchange partition临时表分区N with基表N指令来实现将每一分区规则对应的基表中的数据交换至所述第一临时表中对应的分区中,以得到填充后第一临时表;
4)通过Alter index idx rebuild指令实现重建所述填充后第一临时表的失效索引,得到所述第二临时表。
为了确保上述分区交换完全交换成功,可进一步通过select count(*)from基表名称来查询基表1和基表2的数据是否都变成0,若基表1和基表2的数据均变成0,表示基础表与第一临时表完成分区交换。由于数据分区交换仅:对数据字典中分区和表的定义进行了修改,没有数据的修改或复制,数据迁移效率较高。
在一实施例中,步骤S123包括:
若所述填充后第一临时表中有分区的索引状态为失效状态,通过预设的索引重建指令进行失效索引的重建,以得到所述第二临时表。
在本实施例中,重建历史表中的失效索引的过程如下:
a)查询历史表中各分区的索引状态;
具体的,可以查询历史表中各分区的status字段值为USABLE/UNUSABLE,若status属性值为UNUSABLE则表示索引失效,若status属性值为UNUSABLE则表示索引有效;例如通过select*from user_indexes查看status字段查看索引状态;
b)若历史表中有分区的索引状态为失效状态,通过索引重建指令进行失效索引的重建;例如通过alter INDEX idx rebuild指令来进行失效索引的重建。
当完成了对填充后第一临时表的失效索引重建后,即可得到第二临时表。第二临时表与第一临时表的区别在于,第一临时表是空白状态的分区表,而第二临时表是包括数据信息的分区表。
S130、在第一历史表中创建与所述第二临时表的表结构对应的分区,将所述第二临时表中的数据通过分区交换存储至所述第一历史表中对应的分区,以得到第二历史表;其中,所述第一历史表中新创建的分区为空白状态的分区。
在本实施例中,为了将第二临时表作为媒介将数据迁移至第一历史表,此时可以采用与步骤S120中相似的过程。先是在第一历史表中创建与所述第二临时表的表结构对应的分区,以确保在第一历史表中有空白的分区来接收所交换的数据。之后再通过数据交换将所述第二临时表中的数据通过分区交换存储至所述第一历史表中对应的分区,以得到第二历史表。同样采取了分区交换技术,故数据迁移效率较高。
在一实施例中,如图5所示,步骤S130包括:
S131、根据分区名称获取所述第二临时表中各分区对应的数据;
S132、将所述第二临时表中各分区的数据交换至所述第一历史表中对应的分区中,以得到填充后第二临时表;
S133、重建所述填充后第二临时表的失效索引,得到所述第二历史表。
在本实施例中,是先根据名称统计分区表属性的第二临时表中的分区个数,然后在第一历史表中创建与所述第二临时表的表结构对应的分区,之后将所述第二临时表中各分区对应的数据分别通过分区交换技术交换至所述第一历史表中对应的分区中,以得到填充后第二临时表。此时填充后第二临时表可能存在索引失效的情况,只需重建所述填充后第二临时表的失效索引,得到所述第二历史表。通过上述过程,即实现了将快速基础表中的数据迁移至历史表中。
在一实施例中,步骤S110之前还包括:
获取基础表的总张数;
若所述总张数大于1,创建预先设置的总进程个数的进程,且每一进程中创建两个队列对象;其中,所创建的两个队列对象分别记为第一队列对象和第二队列对象,所述第一队列对象和第二队列对象的初始状态均为空队列;
根据各基础表的编号与所述总进程个数的余数,将各基础表分配至对应的进程;
若当前进程接收到基础表,将各基础表对应的数据写入任务通过入队线程加入当前进程的所述第一队列对象,以得到第一状态第一队列对象;
若各基础表对应的数据写入任务完成写入所述第一队列对象且所述第二队列对象为空队列,将所述第一状态第一队列对象的内存数据与所述第二队列对象进行数据互换,以得到第二状态第一队列对象和第一状态第二队列对象。
在本实施例中,为了提高数据迁移的效率,当多个第一服务器分别将对应的基础表上传至第二服务器后,经过跑批后的基础表可通过多线程进行数据迁移,即每一线程控制一个基础表与第一历史表之间的数据迁移过程。而且为了提高多线程的效率,可创建用于入队的第一队列对象和用于出队的第二队列对象。具体过程如下:
根据基础表的总张数及预先设置的总进程个数将多张基础表分配至对应的进程中,例如有20张基础表分别记为基础表1-基础表20,而预先设置的总进程个数为8,分别记为进程1-进程8,根据基础表对应编号N与总进程个数8的余数来实现基础表的分配。具体的,由于基础表1、基础表9、基础表17除以8的余数均为1,则将上述基础表1、基础表9、基础表17对应的数据写入任务分配至进行1,以此类推,直接将上述20个基础表均分配至对应的进程。而且每一进程中目前有线程ThreadA(即线程A)和ThreadB(线程B),直接使用两个Queue对象,Queue1(即第一队列对象)只给ThreadA用来入队,Queue2(即第二队列对象)只给ThreadB用来出队,这样入队和出队操作就可以分离,不用去争抢锁。
达到一定触发条件的时候两个Queue的内存就进行交换,原来入队的Queue变为出队的Queue,出队的Queue变成入队的Queue。这个触发条件可以由ThreadA来控制,在ThreadA认为不需要继续入队并且ThreadB的队列为空的时候,两个Queue可以进行交换。
在一实施例中,所述若各基础表对应的数据写入任务完成写入所述第一队列对象且所述第二队列对象为空队列,将所述第一状态第一队列对象的内存数据与所述第二队列对象进行数据互换,以得到第二状态第一队列对象和第一状态第二队列对象之后,还包括:
通过出队线程获取所述第一状态第二队列对象中排名首位的数据写入任务,以得到当前数据写入任务;
将所述第一状态第二队列对象中排名首位的数据写入任务进行移除,得到更新后的第一状态第二队列对象;
根据当前写入任务执行所述创建与基础表的表结构相同的第一临时表的步骤;
所述在第一历史表中创建与所述第二临时表的表结构对应的分区,将所述第二临时表中的数据通过分区交换存储至所述第一历史表中对应的分区,以得到第二历史表之后,还包括:
获取所述第一状态第二队列对象,返回执行通过出队线程获取所述第一状态第二队列对象中排名首位的数据写入任务,以得到当前数据写入任务的步骤。
在本实施例中,由于多进程可以同时执行,而且多线程也可以同时执行,多进程中的每一进程当前执行的的数据写入任务是可并发同时进行的,而同一进程内的多个线程可以依序进行,也可以并发进行。若同一进程内的多个线程是依序进行时,每执行完一个线程则下一线程启动继续执行。通过上述方式实现了多张基础表的并发写入第一历史表,提高了效率。
该方法以分区表形式的临时表为媒介,先将基础表中的数据交换到临时表中,然后再将整个临时表数据交换到历史表的新增分区中,交换完成重新重建失效索引,避免了大批量的数据增删操作,提高了数据迁移效率。
本发明实施例还提供一种数据迁移装置,该数据迁移装置用于执行前述数据迁移方法的任一实施例。具体地,请参阅图6,图6是本发明实施例提供的数据迁移装置的示意性框图。该数据迁移装置100可以配置于服务器中。
如图6所示,数据迁移装置100包括临时表创建单元110、临时表写入单元120、数据分区交换单元130。
临时表创建单元110,用于创建与基础表的表结构相同的第一临时表;其中,所述基础表用于存储业务数据,所述第一临时表是空白状态的分区表。
在本实施例中,所涉及的终端有第一服务器和第二服务器。第一服务器,用于存储基础表,基础表中用于存储业务数据(例如财务收支数据)。例如集团企业设置的多个分支机构、子公司均设置有第一服务器。第二服务器,用于接收并存储第一服务器上传的基础表,将基础表中的数据交换存储至历史表的新建分区。本申请的技术方案是在第二服务器的角度进行描述。
当第二服务器接收了第一服务器所上传的基础表后,对各基础表中的数据进行数据处理。例如第一服务器为银行账单系统,第二服务器为集团的总服务器,第一服务器所收集的是账期数据,这些账期数据存储在基础表中,在第一服务器将基础表发送至第二服务器后,通过第二服务器对基础表进行银行跑批(银行跑批就是结账和批量,最主要是产生总账,进行总分核对。白天用户在柜台交易,都是及时对账户进行操作,交易数据也是存储于第一服务器中,没有经过整合,故晚上在第二服务器中批量进行一些业务的整合和报表的生成,如定期储蓄整合、到期自动转存等业务核对)。在第二服务器中完成了对基础表的跑批后,得到了跑批后的基础表。为了将基础表中的数据迁移到历史表中时,为了避免直接将基础表中的海量数据通过insert(insert即数据库中的数据插入操作)的方式直接插入到历史表中,可以先创建一个空白的分区表作为临时表,并根据基础表中的设置的分区规则的个数,在空白的临时表中创建对应相同个数的子分区,以临时表为基础表和历史表之间的媒介,来实现将临时表中的数据快速迁移至历史表的对应分区。
在一实施例中,如图7所示,临时表创建单元110包括:
分区个数获取单元111,用于获取所述基础表中设置的分区规则的分区个数;
第一临时表创建单元112,用于创建表格分区个数与所述分区个数相同的第一临时表。
在本实施例中,先获取所述基础表中设置的分区规则的分区个数,例如,基础表中存储有满足P1规则的数据,也存储有满足P2规则的数据;此时创建一个具有2个分区的第一临时表,且所示第一临时表为分区表。当创建了空白的分区表作为第一临时表后,即可通过分区交换技术将基础表中的数据交换迁移至第一临时表。为了确保数据分区交换的进行,需要使得第一临时表中的表结构以及分区个数与基础表完全相同。
临时表写入单元120,用于根据所述基础表中设置的分区规则,将所述基础表中的数据通过分区交换存储至所述第一临时表中对应的分区,以得到第二临时表。
在本实施例中,当完成了创建第一临时表后,通过分区交换技术将基础表中各分区的数据交换至第一临时表中。分区交换技术可以实现数据快速转移,故适用于数据加载提速、历史数据清理等处理。分区交换技术实际上只修改了数据字典中的数据物理段位置,而不是实际的移动数据,故速度很快。
在一实施例中,如图8所示,临时表写入单元120包括:
基表定位单元121,用于获取所述基础表中各分区规则对应的基表;
第一交换单元122,用于将每一分区规则对应的基表中的数据交换至所述第一临时表中对应的分区中,以得到填充后第一临时表;
第一重建单元123,用于重建所述填充后第一临时表的失效索引,得到所述第二临时表。
在本实施例中,例如所述基础表中存储有满足P1规则的数据,也存储有满足P2规则的数据;先获取满足P1规则的数据形成基表1,获取满足P2规则的数据形成基表2,将基表1中的数据交换至临时表的分区1中,再将基表2中的数据交换至临时表中的分区2中。
由于数据分区交换仅:对数据字典中分区和表的定义进行了修改,没有数据的修改或复制,数据迁移效率较高。
在一实施例中,第一重建单元123还用于:
若所述填充后第一临时表中有分区的索引状态为失效状态,通过预设的索引重建指令进行失效索引的重建,以得到所述第二临时表。
在本实施例中,当完成了对填充后第一临时表的失效索引重建后,即可得到第二临时表。第二临时表与第一临时表的区别在于,第一临时表是空白状态的分区表,而第二临时表是包括数据信息的分区表。
数据分区交换单元130,用于在第一历史表中创建与所述第二临时表的表结构对应的分区,将所述第二临时表中的数据通过分区交换存储至所述第一历史表中对应的分区,以得到第二历史表;其中,所述第一历史表中新创建的分区为空白状态的分区。
在本实施例中,为了将第二临时表作为媒介将数据迁移至第一历史表,此时可以采用与临时表写入单元120中相似的处理过程。先是在第一历史表中创建与所述第二临时表的表结构对应的分区,以确保在第一历史表中有空白的分区来接收所交换的数据。之后再通过数据交换将所述第二临时表中的数据通过分区交换存储至所述第一历史表中对应的分区,以得到第二历史表。同样采取了分区交换技术,故数据迁移效率较高。
在一实施例中,如图9所示,数据分区交换单元130包括:
分区定位单元131,用于根据分区名称获取所述第二临时表中各分区对应的数据;
第二交换单元132,用于将所述第二临时表中各分区的数据交换至所述第一历史表中对应的分区中,以得到填充后第二临时表;
第二重建单元133,用于重建所述填充后第二临时表的失效索引,得到所述第二历史表。
在本实施例中,是先根据名称统计分区表属性的第二临时表中的分区个数,然后在第一历史表中创建与所述第二临时表的表结构对应的分区,之后将所述第二临时表中各分区对应的数据分别通过分区交换技术交换至所述第一历史表中对应的分区中,以得到填充后第二临时表。此时填充后第二临时表可能存在索引失效的情况,只需重建所述填充后第二临时表的失效索引,得到所述第二历史表。通过上述过程,即实现了将快速基础表中的数据迁移至历史表中。
在一实施例中,数据迁移装置100还包括:
表张数获取单元,用于获取基础表的总张数;
多线程启动单元,用于若所述总张数大于1,创建预先设置的总进程个数的进程,且每一进程中创建两个队列对象;其中,所创建的两个队列对象分别记为第一队列对象和第二队列对象,所述第一队列对象和第二队列对象的初始状态均为空队列;
分配单元,用于根据各基础表的编号与所述总进程个数的余数,将各基础表分配至对应的进程;
入队单元,用于若当前进程接收到基础表,将各基础表对应的数据写入任务通过入队线程加入当前进程的所述第一队列对象,以得到第一状态第一队列对象;
内存互换单元,用于若各基础表对应的数据写入任务完成写入所述第一队列对象且所述第二队列对象为空队列,将所述第一状态第一队列对象的内存数据与所述第二队列对象进行数据互换,以得到第二状态第一队列对象和第一状态第二队列对象。
在本实施例中,为了提高数据迁移的效率,当多个第一服务器分别将对应的基础表上传至第二服务器后,经过跑批后的基础表可通过多线程进行数据迁移,即每一线程控制一个基础表与第一历史表之间的数据迁移过程。而且为了提高多线程的效率,可创建用于入队的第一队列对象和用于出队的第二队列对象。具体过程如下:
根据基础表的总张数及预先设置的总进程个数将多张基础表分配至对应的进程中,例如有20张基础表分别记为基础表1-基础表20,而预先设置的总进程个数为8,分别记为进程1-进程8,根据基础表对应编号N与总进程个数8的余数来实现基础表的分配。具体的,由于基础表1、基础表9、基础表17除以8的余数均为1,则将上述基础表1、基础表9、基础表17对应的数据写入任务分配至进行1,以此类推,直接将上述20个基础表均分配至对应的进程。而且每一进程中目前有线程ThreadA(即线程A)和ThreadB(线程B),直接使用两个Queue对象,Queue1(即第一队列对象)只给ThreadA用来入队,Queue2(即第二队列对象)只给ThreadB用来出队,这样入队和出队操作就可以分离,不用去争抢锁。
达到一定触发条件的时候两个Queue的内存就进行交换,原来入队的Queue变为出队的Queue,出队的Queue变成入队的Queue。这个触发条件可以由ThreadA来控制,在ThreadA认为不需要继续入队并且ThreadB的队列为空的时候,两个Queue可以进行交换。
在一实施例中,数据迁移装置100还包括:
任务获取单元,用于通过出队线程获取所述第一状态第二队列对象中排名首位的数据写入任务,以得到当前数据写入任务;
队列更新单元,用于将所述第一状态第二队列对象中排名首位的数据写入任务进行移除,得到更新后的第一状态第二队列对象;
线程执行单元,用于根据当前写入任务执行所述创建与基础表的表结构相同的第一临时表的步骤;
所述数据迁移装置100,还包括:
队列获取单元,用于获取所述第一状态第二队列对象,返回执行通过出队线程获取所述第一状态第二队列对象中排名首位的数据写入任务,以得到当前数据写入任务的步骤。
在本实施例中,由于多进程可以同时执行,而且多线程也可以同时执行,多进程中的每一进程当前执行的的数据写入任务是可并发同时进行的,而同一进程内的多个线程可以依序进行,也可以并发进行。若同一进程内的多个线程是依序进行时,每执行完一个线程则下一线程启动继续执行。通过上述方式实现了多张基础表的并发写入第一历史表,提高了效率。
该装置实现了根据不同对象、事件类型,设置不同的督办提醒流程,减少了人工确定督办时间和督办类型的随意性,提高了事项的督办效率。
上述数据迁移装置可以实现为计算机程序的形式,该计算机程序可以在如图10所示的计算机设备上运行。
请参阅图10,图10是本发明实施例提供的计算机设备的示意性框图。该计算机设备500是服务器,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图10,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行数据迁移方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行数据迁移方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图10中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如本发明实施例提供的数据迁移方法。
本领域技术人员可以理解,图10中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图10所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现如本发明实施例提供的数据迁移方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (6)
1.一种数据迁移方法,其特征在于,包括:
创建与基础表的表结构相同的第一临时表;其中,所述基础表用于存储业务数据,所述第一临时表是空白状态的分区表;
根据所述基础表中设置的分区规则,将所述基础表中的数据通过分区交换存储至所述第一临时表中对应的分区,以得到第二临时表;以及
在第一历史表中创建与所述第二临时表的表结构对应的分区,将所述第二临时表中的数据通过分区交换存储至所述第一历史表中对应的分区,以得到第二历史表;其中,所述第一历史表中新创建的分区为空白状态的分区;
所述根据所述基础表中设置的分区规则,将所述基础表中的数据通过分区交换存储至所述第一临时表中对应的分区,以得到第二临时表,包括:
获取所述基础表中各分区规则对应的基表;
将每一分区规则对应的基表中的数据交换至所述第一临时表中对应的分区中,以得到填充后第一临时表;
重建所述填充后第一临时表的失效索引,得到所述第二临时表;
其中,所述分区交换技术为修改数据字典中的数据物理段位置;
所述创建与基础表的表结构相同的第一临时表,包括:
获取所述基础表中设置的分区规则的分区个数;
创建表格分区个数与所述分区个数相同的第一临时表;
所述重建所述填充后第一临时表的失效索引,得到所述第二临时表,包括:
若所述填充后第一临时表中有分区的索引状态为失效状态,通过预设的索引重建指令进行失效索引的重建,以得到所述第二临时表;
所述将所述第二临时表中的数据通过分区交换存储至所述第一历史表中对应的分区,以得到第二历史表,包括:
根据分区名称获取所述第二临时表中各分区对应的数据;
将所述第二临时表中各分区的数据交换至所述第一历史表中对应的分区中,以得到填充后第二临时表;
重建所述填充后第二临时表的失效索引,得到所述第二历史表。
2.根据权利要求1所述的数据迁移方法,其特征在于,所述创建与基础表的表结构相同的第一临时表之前,还包括:
获取基础表的总张数;
若所述总张数大于1,创建预先设置的总进程个数的进程,且每一进程中创建两个队列对象;其中,所创建的两个队列对象分别记为第一队列对象和第二队列对象,所述第一队列对象和第二队列对象的初始状态均为空队列;
根据各基础表的编号与所述总进程个数的余数,将各基础表分配至对应的进程;
若当前进程接收到基础表,将各基础表对应的数据写入任务通过入队线程加入当前进程的所述第一队列对象,以得到第一状态第一队列对象;
若各基础表对应的数据写入任务完成写入所述第一队列对象且所述第二队列对象为空队列,将所述第一状态第一队列对象的内存数据与所述第二队列对象进行数据互换,以得到第二状态第一队列对象和第一状态第二队列对象。
3.根据权利要求2所述的数据迁移方法,其特征在于,所述若各基础表对应的数据写入任务完成写入所述第一队列对象且所述第二队列对象为空队列,将所述第一状态第一队列对象的内存数据与所述第二队列对象进行数据互换,以得到第二状态第一队列对象和第一状态第二队列对象之后,还包括:
通过出队线程获取所述第一状态第二队列对象中排名首位的数据写入任务,以得到当前数据写入任务;
将所述第一状态第二队列对象中排名首位的数据写入任务进行移除,得到更新后的第一状态第二队列对象;
根据当前写入任务执行所述创建与基础表的表结构相同的第一临时表的步骤;
所述在第一历史表中创建与所述第二临时表的表结构对应的分区,将所述第二临时表中的数据通过分区交换存储至所述第一历史表中对应的分区,以得到第二历史表之后,还包括:
获取所述第一状态第二队列对象,返回执行通过出队线程获取所述第一状态第二队列对象中排名首位的数据写入任务,以得到当前数据写入任务的步骤。
4.一种数据迁移装置,其特征在于,包括:
临时表创建单元,用于创建与基础表的表结构相同的第一临时表;其中,所述基础表用于存储业务数据,所述第一临时表是空白状态的分区表;
临时表写入单元,用于根据所述基础表中设置的分区规则,将所述基础表中的数据通过分区交换存储至所述第一临时表中对应的分区,以得到第二临时表;以及
数据分区交换单元,用于在第一历史表中创建与所述第二临时表的表结构对应的分区,将所述第二临时表中的数据通过分区交换存储至所述第一历史表中对应的分区,以得到第二历史表;其中,所述第一历史表中新创建的分区为空白状态的分区;
所述临时表写入单元具体用于:
获取所述基础表中各分区规则对应的基表;
将每一分区规则对应的基表中的数据交换至所述第一临时表中对应的分区中,以得到填充后第一临时表;
重建所述填充后第一临时表的失效索引,得到所述第二临时表;
其中,所述分区交换技术为修改数据字典中的数据物理段位置;
所述临时表创建单元具体用于:
获取所述基础表中设置的分区规则的分区个数;
创建表格分区个数与所述分区个数相同的第一临时表;
所述临时表写入单元在执行所述重建所述填充后第一临时表的失效索引,得到所述第二临时表步骤时,具体用于:
若所述填充后第一临时表中有分区的索引状态为失效状态,通过预设的索引重建指令进行失效索引的重建,以得到所述第二临时表;
所述数据分区交换单元具体用于:
根据分区名称获取所述第二临时表中各分区对应的数据;
将所述第二临时表中各分区的数据交换至所述第一历史表中对应的分区中,以得到填充后第二临时表;
重建所述填充后第二临时表的失效索引,得到所述第二历史表。
5.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至3中任一项所述的数据迁移方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至3中任一项所述的数据迁移方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910533780.9A CN110413593B (zh) | 2019-06-19 | 2019-06-19 | 数据迁移方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910533780.9A CN110413593B (zh) | 2019-06-19 | 2019-06-19 | 数据迁移方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110413593A CN110413593A (zh) | 2019-11-05 |
CN110413593B true CN110413593B (zh) | 2024-05-17 |
Family
ID=68359433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910533780.9A Active CN110413593B (zh) | 2019-06-19 | 2019-06-19 | 数据迁移方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110413593B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110851421B (zh) * | 2019-11-06 | 2022-04-08 | 珠海格力电器股份有限公司 | 减少数据迁移耗时的方法、装置、存储介质及电子设备 |
CN111694814B (zh) * | 2020-05-27 | 2024-04-09 | 平安银行股份有限公司 | 日期分区表批量扩展方法、装置、计算机设备及存储介质 |
CN113656380A (zh) * | 2021-08-23 | 2021-11-16 | 工银科技有限公司 | 数据生命周期管理方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103593447A (zh) * | 2013-11-18 | 2014-02-19 | 北京国双科技有限公司 | 用于数据库表的数据处理方法和装置 |
KR101416890B1 (ko) * | 2013-05-03 | 2014-07-08 | 주식회사 엘지유플러스 | 데이터 처리 방법 및 장치 |
CN106325933A (zh) * | 2016-08-24 | 2017-01-11 | 明算科技(北京)股份有限公司 | 批量数据同步方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8090751B2 (en) * | 2002-02-05 | 2012-01-03 | Hewlett-Packard Development Company, L.P. | Operational data store |
-
2019
- 2019-06-19 CN CN201910533780.9A patent/CN110413593B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101416890B1 (ko) * | 2013-05-03 | 2014-07-08 | 주식회사 엘지유플러스 | 데이터 처리 방법 및 장치 |
CN103593447A (zh) * | 2013-11-18 | 2014-02-19 | 北京国双科技有限公司 | 用于数据库表的数据处理方法和装置 |
CN106325933A (zh) * | 2016-08-24 | 2017-01-11 | 明算科技(北京)股份有限公司 | 批量数据同步方法和装置 |
Non-Patent Citations (2)
Title |
---|
基于Excel VBA实现分类汇总的动态管理方法;周敏;;信息系统工程;20100920(第09期);第49-50页 * |
基于M/M/m队列的通信网络排队模型化研究;张霖;刘建明;李宏周;彭智勇;;科学技术与工程;20130218;第13卷(第05期);第1175-1185页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110413593A (zh) | 2019-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110413593B (zh) | 数据迁移方法、装置、计算机设备及存储介质 | |
CN105103130B (zh) | 用于实现可扩展争用自适应统计计数器的系统和方法 | |
CN107391628A (zh) | 数据同步方法及装置 | |
CN102968498B (zh) | 数据处理方法及装置 | |
KR102301257B1 (ko) | 블록체인 부분 원장 | |
CN107608773B (zh) | 任务并发处理方法、装置及计算设备 | |
CN105190559B (zh) | 用于实现存储更新概率值的共享概率计数器的系统和方法 | |
CN108055343A (zh) | 用于机房的数据同步方法及装置 | |
CN112074818A (zh) | 用于能够在区块链网络中访问过去的交易的方法及节点 | |
CN106293492B (zh) | 一种存储管理方法及分布式文件系统 | |
CN107450855B (zh) | 一种用于分布式存储的模型可变的数据分布方法及系统 | |
CN106990915A (zh) | 一种基于存储介质类型和加权配额的存储资源管理方法 | |
CN111932257B (zh) | 一种区块链并行化处理方法及装置 | |
US20170371571A1 (en) | Efficient erasure coding of large data objects | |
CN108595268A (zh) | 一种基于MapReduce的数据分配方法、装置及计算机可读存储介质 | |
CN107451013A (zh) | 基于分布式系统的数据恢复方法、装置及系统 | |
CN107665255A (zh) | 键值数据库数据变更的方法、装置、设备及存储介质 | |
CN110431580A (zh) | 使用随机数表来减少并发区块链交易失败 | |
CN109714249A (zh) | 一种小程序消息的推送方法及相关装置 | |
CN109086462A (zh) | 一种分布式文件系统中元数据的管理方法 | |
CN111078413B (zh) | 一种定时任务的执行方法、装置、计算机设备及存储介质 | |
CN108958973A (zh) | 分布式文件系统纠删码数据重构存储节点选择方法及装置 | |
US9805109B2 (en) | Computer, control device for computer system, and recording medium | |
CN113342897A (zh) | 一种数据同步的方法及装置 | |
CN113347238A (zh) | 基于区块链的消息分区方法及系统、设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |