CN112783856A - 数据迁移方法和装置 - Google Patents
数据迁移方法和装置 Download PDFInfo
- Publication number
- CN112783856A CN112783856A CN201911104799.8A CN201911104799A CN112783856A CN 112783856 A CN112783856 A CN 112783856A CN 201911104799 A CN201911104799 A CN 201911104799A CN 112783856 A CN112783856 A CN 112783856A
- Authority
- CN
- China
- Prior art keywords
- data
- document
- database
- relational database
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013508 migration Methods 0.000 title claims abstract description 50
- 230000005012 migration Effects 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000006243 chemical reaction Methods 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000000835 fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000002253 acid Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/214—Database migration support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/116—Details of conversion of file system types or formats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/119—Details of migration of file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数据迁移方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:确定关系型数据库中待迁移的至少一条数据记录;从关系型数据库中读取所述数据记录,并将每一数据记录转换为符合文档型数据库存储格式的数据文档;将转换得到的数据文档写入文档型数据库。该实施方式能够提高从关系型数据库到文档型数据库的数据迁移效率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据迁移方法和装置。
背景技术
随着大数据技术的发展,需要将关系型数据库中的数据迁移到非关系型数据库如文档型数据库中。现有的数据迁移方案中,首先需要将关系型数据库中待迁移的数据存储为本地逗号分隔值CSV(Comma-Separated Values)文件,之后将本地文件切片并以串行的方式读取并转换为文档型数据库所要求的格式,最后写入文档型数据库。其中,上述本地对应于执行数据迁移的电子设备,该电子设备既不同于关系型数据库所在的电子设备,也不同于文档型数据库所在的电子设备。
这种方案需要将关系型数据库中的数据写入本地再插入文档型数据库,其执行流程较复杂导致效率较低。同时,只能用串行方式读取本地CSV文件进一步降低其效率,并且本地文件的写入会占用本地存储空间。
发明内容
有鉴于此,本发明实施例提供一种数据迁移方法和装置,可从关系型数据库中读取待迁移的数据记录并在格式转换之后直接写入文档型数据库,从而提高数据迁移效率。
为实现上述目的,根据本发明的一个方面,提供了一种数据迁移方法。
本发明实施例的数据迁移方法用于将关系型数据库中的数据迁移到文档型数据库;所述方法包括:确定关系型数据库中待迁移的至少一条数据记录;从关系型数据库中读取所述数据记录,并将每一数据记录转换为符合文档型数据库存储格式的数据文档;将转换得到的数据文档写入文档型数据库。
可选地,确定关系型数据库中待迁移的至少一条数据记录,包括:通过结构化查询语言SQL语句确定关系型数据库中待迁移的至少一条数据记录。
可选地,从关系型数据库中读取所述数据记录,包括:创建至少一个数据读取线程,为每一数据读取线程分配需要读取的数据记录标识;利用所述数据读取线程从关系型数据库中并行读取所述数据记录。
可选地,将每一数据记录转换为符合文档型数据库存储格式的数据文档,包括:针对每一数据记录中的每一字段:保持该字段的字段值不变,依据预先建立的、关系型数据库与文档型数据库之间的字段名映射关系将该字段的字段名更新为文档型数据库中的字段名;将每一更新后的字段名与其对应的字段值组合为所述数据文档。
可选地,所述方法进一步包括:在将每一数据记录转换为符合文档型数据库存储格式的数据文档之后,将所述数据文档发送到预先建立的消息队列中;以及,将转换得到的数据文档写入文档型数据库,包括:创建至少一个数据写入线程,利用所述数据写入线程从所述消息队列中获取所述数据文档并将所述数据文档写入文档型数据库。
可选地,所述关系型数据库包括MySQL或Oracle,所述文档型数据库包括MongoDB或CouchDB。
为实现上述目的,根据本发明的另一方面,提供了一种数据迁移装置。
本发明实施例提供的数据迁移装置用于将关系型数据库中的数据迁移到文档型数据库,可以包括:数据查询单元、数据转换单元以及数据写入单元。其中,数据查询单元可用于确定关系型数据库中待迁移的至少一条数据记录;数据转换单元可用于从关系型数据库中读取所述数据记录,并将每一数据记录转换为符合文档型数据库存储格式的数据文档;数据写入单元可用于将转换得到的数据文档写入文档型数据库。
可选地,数据查询单元可进一步用于:通过结构化查询语言SQL语句确定关系型数据库中待迁移的至少一条数据记录。
可选地,数据转换单元可进一步用于:创建至少一个数据读取线程,为每一数据读取线程分配需要读取的数据记录标识;利用所述数据读取线程从关系型数据库中并行读取所述数据记录。
可选地,数据转换单元可进一步用于:针对每一数据记录中的每一字段:保持该字段的字段值不变,依据预先建立的、关系型数据库与文档型数据库之间的字段名映射关系将该字段的字段名更新为文档型数据库中的字段名;将每一更新后的字段名与其对应的字段值组合为所述数据文档。
可选地,数据写入单元可进一步用于:在将每一数据记录转换为符合文档型数据库存储格式的数据文档之后,将所述数据文档发送到预先建立的消息队列中;创建至少一个数据写入线程,利用所述数据写入线程从所述消息队列中获取所述数据文档并将所述数据文档写入文档型数据库。
可选地,所述关系型数据库包括MySQL或Oracle,所述文档型数据库包括MongoDB或CouchDB。
为实现上述目的,根据本发明的又一方面,提供了一种电子设备。
本发明的一种电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明所提供的数据迁移方法。
为实现上述目的,根据本发明的再一方面,提供了一种计算机可读存储介质。
本发明的一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明所提供的数据迁移方法。
根据本发明的技术方案,上述发明中的一个实施例具有如下优点或有益效果:本发明可直接从关系型数据库读取待迁移的数据记录并在格式转换之后写入文档型数据库,避免了数据在本地的存储,由此提高了数据迁移效率同时不需占用本地存储空间。此外,由于本发明从关系型数据库直接读取数据记录,因此可使用多个线程并行读取,从而进一步加快数据迁移速度,最终实现关系型数据库到文档型数据库的高效稳定的数据迁移方案。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是本发明实施例中数据迁移方法的主要步骤示意图;
图2是本发明实施例中数据迁移装置的组成部分示意图;
图3是根据本发明实施例可以应用于其中的示例性系统架构图;
图4是用来实现本发明实施例中数据迁移方法的电子设备结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要指出的是,在不冲突的情况下,本发明的实施例以及实施例中的技术特征可以相互结合。
图1是根据本发明实施例中数据迁移方法的主要步骤示意图。本发明实施例的数据迁移方法用于将关系型数据库中的数据迁移到文档型数据库,其中,文档型数据库是一种非关系型数据库。以下将对上述概念逐一说明。
一般地,关系型数据库是指采用了关系模型(即二维表格模型)来组织数据的数据库,二维表中的一行称为一条记录,一列称为一个字段,一个或多个可唯一标识一条记录的字段称为主键。以下均为常见的关系型数据库:Oracle、SQL Server、MySQL、PostgreSQL、DB2、Access、SQLite、Teradata、MariaDB。
非关系型数据库为非关系型的、且一般不保证遵循ACID原则(即,原子性Atomic、一致性Consistency、隔离性Isolation、持久性Durability)的数据存储系统,其可分为key-value(键值对)数据库、文档型数据库、搜索引擎和分布式数据库。其中,文档型数据库的逻辑结构是一种由文档(document)、集合(collection)、数据库(database)组成的层次结构。文档与关系型数据库中的记录对应,其数据结构类似于JS对象标记JSON(JavaScriptObject Notation),由至少一个键值对组成,每一键值对属于一个字段(其中的键为字段名,值为字段值)。多个文档组成一个集合,集合与关系型数据库中的表对应,多个集合在逻辑上组织在一起即为数据库。常用的文档型数据库有MongoDB、CouchDB等。需要说明的是,本发明方法可用于从任意一种关系型数据库到任意一种文档型数据库的数据迁移。
如图1所示,本发明实施例的数据迁移方法可具体按照如下步骤执行:
步骤S101:确定关系型数据库中待迁移的至少一条数据记录。
在本步骤中,可根据需求确定关系型数据库中需要迁移的一条或者多条数据记录(即表中的记录)。具体应用中,可编写相应的结构化查询语言SQL(Structured QueryLanguage)语句并在关系型数据库中执行,从而查询待迁移的数据记录。
步骤S102:从关系型数据库中读取数据记录,并将每一数据记录转换为符合文档型数据库存储格式的数据文档。
在本发明实施例中,可利用多线程技术从关系型数据库中并行读取步骤S101中确定的待迁移数据记录。具体地,可创建至少一个数据读取线程,并为每一数据读取线程分配需要读取的数据记录标识,之后利用上述数据读取线程从关系型数据库中并行读取待迁移数据记录。例如,如果待迁移的数据记录为一百万条,每一线程的最大读取数量为十万条,则可创建10个数据读取线程,并为第一数据读取线程分配第一条到第十万条数据记录,为第二数据读取线程分配第十万零一条到第二十万条数据记录,为第三数据读取线程分配第二十万零一条到第三十万条数据记录,为第四数据读取线程分配第三十万零一条到第四十万条数据记录,为第五数据读取线程分配第四十万零一条到第五十万条数据记录,为第六数据读取线程分配第五十万零一条到第六十万条数据记录,为第七数据读取线程分配第六十万零一条到第七十万条数据记录,为第八数据读取线程分配第七十万零一条到第八十万条数据记录,为第九数据读取线程分配第八十万零一条到第九十万条数据记录,为第十数据读取线程分配第九十万零一条到第一百万条数据记录。可以理解,以上数据记录可通过数据记录标识(即数据记录在主键的值)进行唯一标记。
在读取待迁移数据记录之后,可将每一数据记录转换为符合文档型数据库存储格式的数据文档。由于关系型数据库与文档型数据库中的字段名可能存在差异,因此首先需要根据预先建立的关系型数据库与文档型数据库之间的字段名映射关系执行字段名更新,在此过程中,字段值保持不变。具体而言,针对待迁移的每一数据记录中的每一字段:保持该字段的字段值不变,依据上述字段名映射关系将该字段的字段名更新为文档型数据库中的字段名,此后将每一更新后的字段名与其对应的字段值组合为文档型数据库中的数据文档(即文档型数据库集合中的文档)。需要说明的是,以上更新指的是:如果关系型数据库与文档型数据库中具有映射关系的字段名不同,则将关系型数据库中的字段名更改为相应的、文档型数据库中的字段名;如果关系型数据库与文档型数据库中具有映射关系的字段名相同,则保持关系型数据库中的字段名不变。
例如,如果要将以下的一条数据记录转换为数据文档:
name | age | address |
甲 | 10 | 北京 |
且预先建立的字段名映射关系如下表所示:
关系型数据库中字段名 | 文档型数据库中字段名 |
name | student_name |
age | student_age |
address | student_address |
则首先保持甲、10、北京不变,将name更新为student_name,将age更新为student_age,将address更新为student_address,之后将更新后的字段名与原字段值按照文档型数据库要求的存储格式组合为{"student_name":"甲","student_age":10,"student_address":"北京"},此即为一条数据文档。
步骤S103:将转换得到的数据文档写入文档型数据库。
在经过步骤S102获得符合文档型数据库存储格式要求的数据文档之后,可将数据文档发送到预先建立的消息队列中,从而实现数据文档生产与消费的解耦。在消息队列消费侧,可创建至少一个数据写入线程,利用数据写入线程从消息队列中消费数据文档并将数据文档写入文档型数据库。具体应用中,可控制用于生产数据文档(包括读取数据记录、将数据记录转换为数据文档、将数据文档发送到消息队列)的线程数量与用于消费数据文档的线程数量的比值处于合理范围,这样既可以保证数据迁移的正常运行,又不会占用额外资源。
经过上述设置,即可实现关系型数据库到文档型数据库稳定、高效、持续的数据迁移,经测试,千万级的数据量可实现分钟级的迁移。此外,如果关系型数据库中的待迁移数据记录发生变动,在本发明实施例中,可在利用SQL语句确定待迁移数据记录之后,首先检测其中的增量记录,并仅对增量记录执行迁移,这样可避免重复的数据迁移过程。
在本发明实施例的技术方案中,可直接从关系型数据库读取待迁移的数据记录并在格式转换之后写入文档型数据库,避免了数据在本地的存储,由此提高了数据迁移效率同时不需占用本地存储空间。此外,由于本发明从关系型数据库直接读取数据记录,因此可使用多个线程并行读取,从而进一步加快数据迁移速度,最终实现关系型数据库到文档型数据库的高效稳定的数据迁移方案。
需要说明的是,对于前述的各方法实施例,为了便于描述,将其表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,某些步骤事实上可以采用其它顺序进行或者同时进行。此外,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是实现本发明所必须的。
为便于更好的实施本发明实施例的上述方案,下面还提供用于实施上述方案的相关装置。
请参阅图2所示,本发明实施例提供的数据迁移装置200用于将关系型数据库中的数据迁移到文档型数据库,可以包括:数据查询单元201、数据转换单元202以及数据写入单元203。
其中,数据查询单元201可用于确定关系型数据库中待迁移的至少一条数据记录;数据转换单元202可用于从关系型数据库中读取所述数据记录,并将每一数据记录转换为符合文档型数据库存储格式的数据文档;数据写入单元203可用于将转换得到的数据文档写入文档型数据库。
在本发明实施例中,数据查询单元201可进一步用于:通过结构化查询语言SQL语句确定关系型数据库中待迁移的至少一条数据记录。
作为一个优选方案,数据转换单元202可进一步用于:创建至少一个数据读取线程,为每一数据读取线程分配需要读取的数据记录标识;利用所述数据读取线程从关系型数据库中并行读取所述数据记录。
实际应用中,数据转换单元202可进一步用于:针对每一数据记录中的每一字段:保持该字段的字段值不变,依据预先建立的、关系型数据库与文档型数据库之间的字段名映射关系将该字段的字段名更新为文档型数据库中的字段名;将每一更新后的字段名与其对应的字段值组合为所述数据文档。
在具体应用场景中,数据写入单元203可进一步用于:在将每一数据记录转换为符合文档型数据库存储格式的数据文档之后,将所述数据文档发送到预先建立的消息队列中;创建至少一个数据写入线程,利用所述数据写入线程从所述消息队列中获取所述数据文档并将所述数据文档写入文档型数据库。
此外,在本发明实施例中,所述关系型数据库包括MySQL或Oracle,所述文档型数据库包括MongoDB或CouchDB。
在本发明实施例的技术方案中,可直接从关系型数据库读取待迁移的数据记录并在格式转换之后写入文档型数据库,避免了数据在本地的存储,由此提高了数据迁移效率同时不需占用本地存储空间。此外,由于本发明从关系型数据库直接读取数据记录,因此可使用多个线程并行读取,从而进一步加快数据迁移速度,最终实现关系型数据库到文档型数据库的高效稳定的数据迁移方案。
图3示出了可以应用本发明实施例的数据迁移方法或数据迁移装置的示例性系统架构300。
如图3所示,系统架构300可以包括终端设备301、302、303,网络304和服务器305(此架构仅仅是示例,具体架构中包含的组件可以根据申请具体情况调整)。网络304用以在终端设备301、302、303和服务器305之间提供通信链路的介质。网络304可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备301、302、303通过网络304与服务器305交互,以接收或发送消息等。终端设备301、302、303上可以安装有各种客户端应用,例如数据迁移类应用(仅为示例)。
终端设备301、302、303可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器305可以是提供各种服务的服务器,例如对用户利用终端设备301、302、303所操作的数据迁移类应用提供支持的后台服务器(仅为示例)。后台服务器可以对接收到的数据迁移请求进行处理,并将处理结果(例如数据迁移是否完成--仅为示例)反馈给终端设备301、302、303。
需要说明的是,本发明实施例所提供的数据迁移方法一般由服务器305执行,相应地,数据迁移装置一般设置于服务器305中。
应该理解,图3中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
本发明还提供了一种电子设备。本发明实施例的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明所提供的数据迁移方法。
下面参考图4,其示出了适于用来实现本发明实施例的电子设备的计算机系统400的结构示意图。图4示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,计算机系统400包括中央处理单元(CPU)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM403中,还存储有计算机系统400操作所需的各种程序和数据。CPU401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
以下部件连接至I/O接口405:包括键盘、鼠标等的输入部分406;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便从其上读出的计算机程序根据需要被安装入存储部分408。
特别地,根据本发明公开的实施例,上文的主要步骤图描述的过程可以被实现为计算机软件程序。例如,本发明实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤图所示的方法的程序代码。在上述实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元401执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。在本发明中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这根据所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括数据查询单元、数据转换单元和数据写入单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,数据查询单元还可以被描述为“向数据转换单元提供待迁移数据记录的单元”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中的。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该设备执行时,使得该设备执行的步骤包括:确定关系型数据库中待迁移的至少一条数据记录;从关系型数据库中读取所述数据记录,并将每一数据记录转换为符合文档型数据库存储格式的数据文档;将转换得到的数据文档写入文档型数据库。
在本发明实施例的技术方案中,可直接从关系型数据库读取待迁移的数据记录并在格式转换之后写入文档型数据库,避免了数据在本地的存储,由此提高了数据迁移效率同时不需占用本地存储空间。此外,由于本发明从关系型数据库直接读取数据记录,因此可使用多个线程并行读取,从而进一步加快数据迁移速度,最终实现关系型数据库到文档型数据库的高效稳定的数据迁移方案。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种数据迁移方法,用于将关系型数据库中的数据迁移到文档型数据库;其特征在于,所述方法包括:
确定关系型数据库中待迁移的至少一条数据记录;
从关系型数据库中读取所述数据记录,并将每一数据记录转换为符合文档型数据库存储格式的数据文档;以及
将转换得到的数据文档写入文档型数据库。
2.根据权利要求1所述的方法,其特征在于,确定关系型数据库中待迁移的至少一条数据记录,包括:
通过结构化查询语言SQL语句确定关系型数据库中待迁移的至少一条数据记录。
3.根据权利要求1所述的方法,其特征在于,从关系型数据库中读取所述数据记录,包括:
创建至少一个数据读取线程,为每一数据读取线程分配需要读取的数据记录标识;
利用所述数据读取线程从关系型数据库中并行读取所述数据记录。
4.根据权利要求1所述的方法,其特征在于,将每一数据记录转换为符合文档型数据库存储格式的数据文档,包括:
针对每一数据记录中的每一字段:保持该字段的字段值不变,依据预先建立的、关系型数据库与文档型数据库之间的字段名映射关系将该字段的字段名更新为文档型数据库中的字段名;
将每一更新后的字段名与其对应的字段值组合为所述数据文档。
5.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:在将每一数据记录转换为符合文档型数据库存储格式的数据文档之后,将所述数据文档发送到预先建立的消息队列中;以及,将转换得到的数据文档写入文档型数据库,包括:
创建至少一个数据写入线程,利用所述数据写入线程从所述消息队列中获取所述数据文档并将所述数据文档写入文档型数据库。
6.根据权利要求1-5任一所述的方法,其特征在于,所述关系型数据库包括MySQL或Oracle,所述文档型数据库包括MongoDB或CouchDB。
7.一种数据迁移装置,用于将关系型数据库中的数据迁移到文档型数据库;其特征在于,所述装置包括:
数据查询单元,用于确定关系型数据库中待迁移的至少一条数据记录;
数据转换单元,用于从关系型数据库中读取所述数据记录,并将每一数据记录转换为符合文档型数据库存储格式的数据文档;以及
数据写入单元,用于将转换得到的数据文档写入文档型数据库。
8.根据权利要求7所述的装置,其特征在于,数据转换单元进一步用于:
针对每一数据记录中的每一字段:保持该字段的字段值不变,依据预先建立的、关系型数据库与文档型数据库之间的字段名映射关系将该字段的字段名更新为文档型数据库中的字段名;将每一更新后的字段名与其对应的字段值组合为所述数据文档。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911104799.8A CN112783856A (zh) | 2019-11-07 | 2019-11-07 | 数据迁移方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911104799.8A CN112783856A (zh) | 2019-11-07 | 2019-11-07 | 数据迁移方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112783856A true CN112783856A (zh) | 2021-05-11 |
Family
ID=75749892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911104799.8A Pending CN112783856A (zh) | 2019-11-07 | 2019-11-07 | 数据迁移方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112783856A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102308297A (zh) * | 2011-07-13 | 2012-01-04 | 华为技术有限公司 | 一种数据迁移方法、数据迁移装置及数据迁移系统 |
CN103530327A (zh) * | 2013-09-25 | 2014-01-22 | 清华大学深圳研究生院 | 一种从非关系型数据库到关系型数据库的数据迁移方法 |
CN104123392A (zh) * | 2014-08-11 | 2014-10-29 | 吉林禹硕动漫游戏科技股份有限公司 | 一种关系型数据库迁移到HBase数据库的工具和方法 |
US20160350292A1 (en) * | 2015-05-27 | 2016-12-01 | Alibaba Group Holding Limited | Method and apparatus for real-time data migration |
JP2018109898A (ja) * | 2017-01-05 | 2018-07-12 | 株式会社日立製作所 | データマイグレーションシステム |
CN108804606A (zh) * | 2018-05-29 | 2018-11-13 | 上海欣能信息科技发展有限公司 | 一种电力量测类数据迁移到HBase的方法及系统 |
CN109739883A (zh) * | 2019-01-03 | 2019-05-10 | 广东南方数码科技股份有限公司 | 提升数据查询性能的方法、装置和电子设备 |
CN110019135A (zh) * | 2017-12-27 | 2019-07-16 | 航天信息股份有限公司 | 一种将关系型数据迁移至HBase数据库的方法及装置 |
-
2019
- 2019-11-07 CN CN201911104799.8A patent/CN112783856A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102308297A (zh) * | 2011-07-13 | 2012-01-04 | 华为技术有限公司 | 一种数据迁移方法、数据迁移装置及数据迁移系统 |
WO2012083679A1 (zh) * | 2011-07-13 | 2012-06-28 | 华为技术有限公司 | 一种数据迁移方法、数据迁移装置及数据迁移系统 |
CN103530327A (zh) * | 2013-09-25 | 2014-01-22 | 清华大学深圳研究生院 | 一种从非关系型数据库到关系型数据库的数据迁移方法 |
CN104123392A (zh) * | 2014-08-11 | 2014-10-29 | 吉林禹硕动漫游戏科技股份有限公司 | 一种关系型数据库迁移到HBase数据库的工具和方法 |
US20160350292A1 (en) * | 2015-05-27 | 2016-12-01 | Alibaba Group Holding Limited | Method and apparatus for real-time data migration |
JP2018109898A (ja) * | 2017-01-05 | 2018-07-12 | 株式会社日立製作所 | データマイグレーションシステム |
CN110019135A (zh) * | 2017-12-27 | 2019-07-16 | 航天信息股份有限公司 | 一种将关系型数据迁移至HBase数据库的方法及装置 |
CN108804606A (zh) * | 2018-05-29 | 2018-11-13 | 上海欣能信息科技发展有限公司 | 一种电力量测类数据迁移到HBase的方法及系统 |
CN109739883A (zh) * | 2019-01-03 | 2019-05-10 | 广东南方数码科技股份有限公司 | 提升数据查询性能的方法、装置和电子设备 |
Non-Patent Citations (2)
Title |
---|
李宁;: "一种异构关系型数据库间的数据同步方案", 福建电脑, no. 10 * |
赵艳妮;郭华磊;: "一种RDBMS到MongoDB数据迁移方法", 现代计算机(专业版), no. 22 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11550769B2 (en) | Data processing method, apparatus, and system | |
US11249969B2 (en) | Data storage method and apparatus, and storage medium | |
CN109189835B (zh) | 实时生成数据宽表的方法和装置 | |
US10353923B2 (en) | Hadoop OLAP engine | |
US8977646B2 (en) | Leveraging graph databases in a federated database system | |
CN107256206B (zh) | 字符流格式转换的方法和装置 | |
CN107229718B (zh) | 处理报表数据的方法和装置 | |
CN109614402B (zh) | 多维数据查询方法和装置 | |
WO2019052209A1 (zh) | 数据存储方法、装置及存储介质 | |
CN107729399B (zh) | 数据处理的方法和装置 | |
CN107977396B (zh) | 一种KeyValue数据库的数据表的更新方法与表数据更新装置 | |
US20170286471A1 (en) | Methods and apparatuses for enterprise revision-based auditing of database management systems | |
CN108363741B (zh) | 大数据统一接口方法、装置、设备及存储介质 | |
CN115168398A (zh) | 数据查询方法、装置、电子设备及存储介质 | |
CN113190517B (zh) | 数据集成方法、装置、电子设备和计算机可读介质 | |
Choi et al. | Improving database system performance by applying NoSQL | |
US20210026854A1 (en) | Transaction processing method and system, and server | |
CN112925859A (zh) | 数据存储方法和装置 | |
CN112783856A (zh) | 数据迁移方法和装置 | |
US20220335044A1 (en) | Database query execution on multiple databases | |
CN112817930A (zh) | 一种数据迁移的方法和装置 | |
CN115794806A (zh) | 金融数据的网格化处理系统及方法、装置、计算设备 | |
CN113449000A (zh) | 分布式系统本地缓存的刷新装置及方法 | |
CN111832304B (zh) | 楼盘名称的查重方法、装置、电子设备及存储介质 | |
CN113515504B (zh) | 数据管理方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |