CN114443363A - 一种数据处理方法、装置、设备及介质 - Google Patents

一种数据处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN114443363A
CN114443363A CN202111617277.5A CN202111617277A CN114443363A CN 114443363 A CN114443363 A CN 114443363A CN 202111617277 A CN202111617277 A CN 202111617277A CN 114443363 A CN114443363 A CN 114443363A
Authority
CN
China
Prior art keywords
data
time
period
target database
cdc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111617277.5A
Other languages
English (en)
Inventor
陈超
陈金曈
郑惠祥
梁庆聪
彭潘庭
严程向
李志伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Cloud Technology Co Ltd
Original Assignee
Tianyi Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyi Cloud Technology Co Ltd filed Critical Tianyi Cloud Technology Co Ltd
Priority to CN202111617277.5A priority Critical patent/CN114443363A/zh
Publication of CN114443363A publication Critical patent/CN114443363A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及数据安全领域,具体涉及一种数据处理方法、装置、设备及介质,用于提高数据备份的灵活性。该方法包括:确定当前周期的第一时间段和第二时间段,所述第二时间段为所述第一时间段之后的时间段;将源数据库在所述第一时间段内的第一数据备份至第一目标数据库;确定所述源数据库在所述第二时间段内新增的第二数据,将所述第二数据备份至所述第一目标数据库;实时运行变更数据获取CDC服务,获得多个第一CDC文件,其中,每个第一CDC文件为所述源数据库在所述当前周期内每次发生数据变更时获取的变更数据;将所述多个第一CDC文件写入所述第一目标数据库。

Description

一种数据处理方法、装置、设备及介质
技术领域
本申请涉及数据安全领域,具体涉及一种数据处理方法、装置、设备及介质。
背景技术
计算机系统中重要的数据、档案或历史纪录,不论是对企业用户还是对个人用户都是至关重要的,一时不慎丢失,都会造成不可估量的损失。为了防止系统出现操作失误或系统故障而导致数据丢失或数据损坏等意外情况出现,通常会将系统中的数据复制到其他存储介质中进行备份。
目前,通常都是通过文件拷贝的方式,将源数据库中的数据复制到目标数据库中,从而实现数据备份。这种数据备份的方式需要源数据库停止服务,从而防止数据变更,因此数据备份的应用场景受限,备份方式不够灵活。
发明内容
本申请实施例提供一种数据处理方法、装置、设备及介质,用于提高数据备份的灵活性。
第一方面,本申请提供一种数据处理方法,包括:
确定当前周期的第一时间段和第二时间段,所述第二时间段为所述第一时间段之后的时间段;
将源数据库在所述第一时间段内的第一数据备份至第一目标数据库;
确定所述源数据库在所述第二时间段内新增的第二数据,将所述第二数据备份至所述第一目标数据库;
实时运行变更数据获取CDC服务,获得多个第一CDC文件,其中,每个第一CDC文件为所述源数据库在所述当前周期内每次发生数据变更时获取的变更数据;
将所述多个第一CDC文件写入所述第一目标数据库。
在一种可能的实施例中,将所述第二数据备份至所述第一目标数据库,包括:
将所述第二时间段划分为多个子时间段,其中,所述第二数据包括所述多个子时间段内新增的第二子数据;
将每个子时间段内新增的第二子数据备份至所述第一目标数据库。
在一种可能的实施例中,在将所述多个第一CDC文件写入所述第一目标数据库之后,所述方法还包括:
从所述第一目标数据库中删除历史周期内备份的数据,或者将所述历史周期备份的数据迁移至第二目标数据库,其中,所述历史周期为所述当前周期之前的,且与所述当前周期的时间间隔大于预设时长的周期。
在一种可能的实施例中,在将所述多个第一CDC文件写入所述第一目标数据库之后,所述方法还包括:
当对待恢复的数据进行恢复时,确定所述待恢复的数据在所述第一目标数据库中的时间起点和时间终点;
从所述第一目标数据库中获取所述时间起点和所述时间终点之间的第三数据和多个第二CDC文件;
将所述第三数据和所述多个第二CDC文件恢复至所述源数据库。
第二方面、本申请提供一种数据处理装置,包括:
确定模块,用于确定当前周期的第一时间段和第二时间段,所述第二时间段为所述第一时间段之后的时间段;
备份模块,用于将源数据库在所述第一时间段内的第一数据备份至第一目标数据库;
所述备份模块,还用于确定所述源数据库在所述第二时间段内新增的第二数据,将所述第二数据备份至所述第一目标数据库;
获得模块,用于实时运行变更数据获取CDC服务,获得多个第一CDC文件,其中,每个第一CDC文件为所述源数据库在所述当前周期内每次发生数据变更时获取的变更数据;
所述备份模块,还用于将所述多个第一CDC文件写入所述第一目标数据库。
在一种可能的实施例中,所述备份模块具体用于:
将所述第二时间段划分为多个子时间段,其中,所述第二数据包括所述多个子时间段内新增的第二子数据;
将每个子时间段内新增的第二子数据备份至所述第一目标数据库。
在一种可能的实施例中,所述装置还包括更新模块,所述更新模块用于:
在将所述多个第一CDC文件写入所述第一目标数据库之后,从所述第一目标数据库中删除历史周期内备份的数据,或者将所述历史周期备份的数据迁移至第二目标数据库,其中,所述历史周期为所述当前周期之前的,且与所述当前周期的时间间隔大于预设时长的周期。
在一种可能的实施例中,所述装置还包括恢复模块,所述恢复模块用于:
在将所述多个第一CDC文件写入所述第一目标数据库之后,当对待恢复的数据进行恢复时,确定所述待恢复的数据在所述第一目标数据库中的时间起点和时间终点;
从所述第一目标数据库中获取所述时间起点和所述时间终点之间的第三数据和多个第二CDC文件;
将所述第三数据和所述多个第二CDC文件恢复至所述源数据库。
第三方面,本申请提供一种电子设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行第一方面中任一项所述的方法。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时,使所述计算机执行第一方面中任一项所述的方法。
在本申请实施例中,将源数据库在当前周期的第一时间段内的第一数据备份至第一目标数据库,确定源数据库在第一时间段之后的第二时间段内新增的第二数据,将第二数据备份至第一目标数据库,仅对第一时间段内的第一数据进行全量数据备份,对新增的第二数据进行差异备份,不用源数据库停止服务,备份方式更加灵活。且实时运行变更数据获取CDC服务,获得多个第一CDC文件,每个第一CDC文件为源数据库在当前周期内每次发生数据变更时获取的变更数据,将多个第一CDC文件写入第一目标数据库,实现差异数据备份,有效结合全量数据备份、差异数据备份和差异数据备份,提高数据备份的灵活性。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种数据处理方法的应用场景图;
图2为本申请实施例提供的一种数据处理方法的流程示意图;
图3为本申请实施例提供的一种数据处理系统的结构图;
图4为本申请实施例提供的一种数据处理装置的结构图;
图5为本申请实施例提供的一种电子设备的结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面将结合本发明实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以按不同于此处的顺序执行所示出或描述的步骤。
本申请的说明书和权利要求书及上述附图中的术语“第一”和“第二”是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的保护。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例中,“多个”可以表示至少两个,例如可以是两个、三个或者更多个。
目前的数据库类型有多种,包括MySQL数据库、Oracle数据库等。当前MySQL数据库在关系型数据库领域的市场份额在逐步上升,MySQL容灾有多种方案,一种是基于同步技术的主从同步方案,主服务器提供读写能力,从服务器可以同步主服务器的数据并提供读能力,在主服务器离线时,提供主从切换,从而保持服务不中断。另一种是基于备份技术的离线方案,将数据迁移到安全的存储介质进行离线保存,是对同步技术的补充,防止主服务器和从服务器同步发生严重事故同时离线的情况。
备份技术主要是通过拷贝数据目录做快照,从而实现数据备份,由于MySQL数据库提供服务时,数据文件处于变更中,因此对数据目录做快照时需要数据库停止服务,从而防止数据变更,停止服务时间取决于快照速度,应用场景受限,备份方式不够灵活。
为了提高数据备份的灵活性,本申请实施例提供一种数据处理方法,该数据处理方法可以由数据处理设备执行,数据处理设备可以通过终端或服务器实现。终端例如移动终端、固定终端或便携式终端,例如移动手机、站点、单元、设备、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、笔记本计算机、平板计算机、个人通信系统(PCS)设备、定位设备或者其任意组合,包括这些设备的配件和外设或者其任意组合。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器,但并不局限于此。
下面对本申请实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施过程中,可以根据实际需要灵活地应用本申请实施例提供的技术方案。
请参照图1,为本申请实施例提供的一种数据处理方法的应用场景示意图,该应用场景包括目标数据110和数据处理设备120。
数据处理设备120从源数据库中获取到目标数据110之后,将目标数据110备份至目标数据库中,当源数据库中的目标数据110丢失时,将目标数据库中的目标数据110恢复至源数据库。其中,数据处理设备120具体如何分备份和恢复目标数据110的过程将在下文进行详细介绍。
如上介绍了本申请实施例的应用场景,下面以图1中的数据处理设备120执行数据处理方法为例,对本申请实施例提供的一种数据处理方法进行介绍。请参照图2,为本申请实施例提供的一种数据处理方法的流程示意图。
S201、确定当前周期的第一时间段和第二时间段。
具体的,数据处理设备可以确定每个周期的时间段,将每个周期划分为两个时间段,例如将当前周期的时间段划分为第一时间段和第二时间段。其中,第二时间段为第一时间段之后的时间段。例如一周的时间为一个周期,如果第一时间段为周一,那么第二时间段为周二至周日,如果第一时间段为周一至周三,那么第二时间段为周四至周日。
S202、将源数据库在第一时间段内的第一数据备份至第一目标数据库。
具体的,数据处理设备在确定当前周期的第一时间段和第二时间段之后,可以确定源数据库在第一时间段内的第一数据,通过拷贝数据文件的方式,将第一数据备份至第二目标数据库。源数据库和第一目标数据库可以是MYSQL、Oracles等数据库。
S203、确定源数据库在第二时间段内新增的第二数据,将第二数据备份至第一目标数据库。
具体的,数据处理设备在将第一数据备份至第二目标数据库之后,可以确定源数据库在第二时间段内是否存在新增的第二数据,例如,数据处理设备在拷贝数据文件的同时记录redo log,redo log是物理日志,可以缓存数据库的所有操作变化,根据redo log确定源数据库在第二时间段内是否存在新增的第二数据。若确定存在新增的第二数据,则将新增的第二数据备份至第一目标数据库。
为了降低备份粒度,在一种可能的实施例中,数据处理设备可以将第二时间段划分为多个子时间段,第二数据包括多个子时间段内新增的第二子数据,将每个子时间段内新增的第二子数据备份至第一目标数据库。
继续以一周的时间为一个周期为例,第一时间段为周一,第二时间段为周二至周日,将第二时间段划分为6个子时间段,6个子时间段分别指的是周二、周三、周四、周五、周六和周日,第二数据包括6个子时间段中每个子时间段内新增的第二子数据,例如源数据库在周二新增了工资表、在周三新增了产品目录、在周四新增了资产清单,工资表、产品目录和资产清单就是每个子时间段内新增的第二子数据。
S204、实时运行变更数据获取CDC服务,获得多个第一CDC文件。
具体的,源数据库开启变更数据获取(Change Data Capture,CDC),实时运行CDC服务,可以在对源数据库的数据表进行插入INSERT、更新UPDATE或者删除DELETE等操作时,实时提取变化的数据,并且将变化的数据保存为CDC文件,从而获得多个第一CDC文件。其中,每个第一CDC文件为源数据库在当前周期内每次发生数据变更时获取的变更数据。
S205、将多个第一CDC文件写入第一目标数据库。
具体的,数据处理设备获得多个第一CDC文件之后,可以将多个第一CDC文件写入第一目标数据库时,将每个第一CDC文件的文件名以及每个第一CDC文件在第一目标数据库中的起止位点记录为元数据。
考虑到第一目标数据库的存储空间有限,因此在一种可能的实施例中,数据处理设备可以从第一目标数据库中删除历史周期内备份的数据。其中,历史周期为当前周期之前的、且与当前周期的时间间隔大于预设时长的周期。
例如当前周期的起始时间与历史周期的起始时间之差大于预设时长,或者当前周期的结束时间与历史周期的结束时间之差大于预设时长。具体例如7天为一个周期,当前周期为2021年12月20日至2021年12月26日,预设时长为14天,则历史周期指的是起始时间为2021年12月6日之前的周期、或者结束时间为2021年12月12日之前的周期。历史周期具体例如为2021年12月6日至2021年12月12日,则数据处理设备可以从第一目标数据库中删除该历史周期即2021年12月6日至2021年12月12日内备份的数据。
在一种可能的实施例中,数据处理设备可以将历史周期备份的数据迁移至第二目标数据库。其中,历史周期的含义请参照前文论述的内容,此处不再赘述。第二目标数据库与第一目标数据库是在不同的存储介质中,第二目标数据库所在的存储介质可以比第一目标数据库所在的存储介质更廉价,从而节省存储成本。
在本申请实施例中,考虑到数据恢复时通常是恢复到近期某个时间点的数据,第一目标数据库中可以只保留近期备份的数据,可以将早期备份的数据迁移到更廉价的存储空间,或者删除早期备份的数据,从而节省存储成本。
在将多个第一CDC文件写入第一目标数据库之后,可能出现源数据库中的数据丢失或数据损坏的情况,此时需要将第一目标数据库中备份的数据恢复至源数据库中,以恢复源数据库的正常运行。
在一种可能实施例中,当对待恢复的数据进行恢复时,确定待恢复的数据在第一目标数据库中的时间起点和时间终点,从第一目标数据库中获取时间起点和时间终点之间的第三数据和多个第二CDC文件,将第三数据和多个第二CDC文件恢复至源数据库。
具体的,待恢复的数据原来所在的源数据库可能还在运行,首先停止运行源数据库,根据待恢复的数据的时间起点和时间终点,从第一目标数据库中获取该时间起点和时间终点之间的第三数据以及多个第二CDC文件,第三数据包括全量备份的数据和差异备份的数据,当第二时间段被划分为多个第二子时间段时,差异备份的数据会有多个,合并这些找到的全量备份的数据和多个差异备份的数据,将合并后的数据恢复到源数据库,并启动该源数据库,最后将多个第二CDC文件重放到源数据库,从而完成数据恢复。
综上所述,本申请实施例提供的数据处理方法,以文件拷贝为基础的全量备份,可以快速获得一份基准数据,相较于纯变更数据日志的方式可以提供更好的基础性能,备份效率更高。且全量备份和多个差异备份的组合,可以兼顾存储空间和备份粒度。增量日志备份是对差异备份的进一步补充,让备份粒度降低到两个差异备份之间的任何位点。恢复时先使用文件恢复,再通过CDC文件补充到需要的位点,可以提升数据恢复的速度。
作为一种实施例,图2所述实施例中的目标数据例如为图1中的目标数据110、数据处理设备例如为图1中的数据处理设备120。
作为一种实施例,本申请实施例提供一种数据处理系统,该系统用于实现前文论述的数据处理方法。请参照图3,为本申请实施例提供的一种数据处理系统的结构图。该系统包括调度模块301、文件拷贝引擎模块302、协调服务模块303、增量日志同步引擎模块304、源数据库305、以及目标数据库306。协调服务模块303。
其中,调度模块301用于调度协调服务模块303,协调服务模块303采用开源组件zookeeper,用于协调文件拷贝引擎模块302和增量日志同步引擎模块304何时运行。文件拷贝引擎模块302用于执行全量数据备份和差异数据备份,增量日志同步引擎模块304用于执行增量数据备份,源数据库305用于存储数据,目标数据库306用于备份源数据库305中存储的数据。
下面以图3所示的数据处理系统为例,对本申请实施例提供的数据处理方法进行介绍。
数据处理系统按照图3所示部署完成后,检测网络访问是否正常,在确保网络访问正常的情况下,调度模块301、文件拷贝引擎模块302、增量日志同步引擎模块304才可以按照设计对协调服务模块303中的zookeeper特定目录进行监听。其中,调度模块301录入源数据库305和目标数据库306的访问信息和备份周期等控制信息,按照协议处理成znode后,被文件拷贝引擎模块302、增量日志同步引擎模块304监听到。文件拷贝引擎模块302将在调度周期到来时访问源数据库305,开始拷贝文件进行数据备份,增量日志同步引擎模块304开始读取源数据库305的CDC文件,最终源数据库305的数据将按照目录规范存储到目标数据库306中。当需要将目标数据库306中的数据恢复至源数据库305时,目标数据库306中的数据文件即全量备份和差异备份的数据会被合并后恢复到源数据库305中,多个CDC文件也会被重放到源数据库305中。
基于同一发明构思,本申请实施例提供一种数据处理装置,该数据处理装置能够实现前述的数据处理方法对应的功能。请参照图4,该装置包括:
确定模块401,用于确定当前周期的第一时间段和第二时间段,第二时间段为第一时间段之后的时间段;
备份模块402,用于将源数据库在第一时间段内的第一数据备份至第一目标数据库;
备份模块402,还用于确定源数据库在第二时间段内新增的第二数据,将第二数据备份至第一目标数据库;
获得模块403,用于实时运行变更数据获取CDC服务,获得多个第一CDC文件,其中,每个第一CDC文件为源数据库在当前周期内每次发生数据变更时获取的变更数据;
备份模块402,还用于将多个第一CDC文件写入第一目标数据库。
在一种可能的实施例中,备份模块402具体用于:
将第二时间段划分为多个子时间段,其中,第二数据包括多个子时间段内新增的第二子数据;
将每个子时间段内新增的第二子数据备份至第一目标数据库。
在一种可能的实施例中,该装置还包括更新模块404,更新模块404用于:
在将多个第一CDC文件写入第一目标数据库之后,从第一目标数据库中删除历史周期内备份的数据,或者将历史周期备份的数据迁移至第二目标数据库,其中,历史周期为当前周期之前的,且与当前周期的时间间隔大于预设时长的周期。
在一种可能的实施例中,该装置还包括恢复模块405,恢复模块405用于:
在将多个第一CDC文件写入第一目标数据库之后,当对待恢复的数据进行恢复时,确定待恢复的数据在第一目标数据库中的时间起点和时间终点;
从第一目标数据库中获取时间起点和时间终点之间的第三数据和多个第二CDC文件;
将第三数据和多个第二CDC文件恢复至源数据库。
作为一种实施例,图4论述的装置可以用于执行图2所示的实施例中所述的方法,因此,对于该装置的各功能模块所能够实现的功能等可参考图2所示的实施例的描述,此处不再赘述。
本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,在本申请各个实施例中的各功能模块可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
基于同一发明构思,本申请实施例中还提供了一种电子设备,请参照图5,该电子设备包括:
至少一个处理器501,以及与至少一个处理器501连接的存储器502,本申请实施例中不限定处理器501与存储器502之间的具体连接介质,图5中是以处理器501和存储器502之间通过总线500连接为例。总线500在图5中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线500可以分为地址总线、数据总线、控制总线等,为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。或者,处理器501也可以称为控制器,对于名称不做限制。
在本申请实施例中,存储器502存储有可被至少一个处理器501执行的指令,至少一个处理器501通过执行存储器502存储的指令,可以执行图2所述任一的数据处理方法。处理器501还可以实现图4所示的装置中各个模块的功能。
其中,处理器501是该装置的控制中心,可以利用各种接口和线路连接整个该控制设备的各个部分,通过运行或执行存储在存储器502内的指令以及调用存储在存储器502内的数据,该装置的各种功能和处理数据,从而对该装置进行整体监控。
在一种可能的设计中,处理器501可包括一个或多个处理单元,处理器501可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器501中。在一些实施例中,处理器501和存储器502可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器501可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的数据处理方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器502作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器502可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等。存储器502是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器502还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
通过对处理器501进行设计编程,可以将前述实施例中介绍的数据处理方法所对应的代码固化到芯片内,从而使芯片在运行时能够执行图2所示的数据处理方法的步骤。如何对处理器501进行设计编程为本领域技术人员所公知的技术,这里不再赘述。
基于同一发明构思,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序包括程序指令,程序指令当被计算机执行时,使计算机执行如前文论述任一的数据处理方法。由于上述计算机可读存储介质解决问题的原理与数据处理方法相似,因此上述计算机可读存储介质的实施可以参见方法的实施,重复之处不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
确定当前周期的第一时间段和第二时间段,所述第二时间段为所述第一时间段之后的时间段;
将源数据库在所述第一时间段内的第一数据备份至第一目标数据库;
确定所述源数据库在所述第二时间段内新增的第二数据,将所述第二数据备份至所述第一目标数据库;
实时运行变更数据获取CDC服务,获得多个第一CDC文件,其中,每个第一CDC文件为所述源数据库在所述当前周期内每次发生数据变更时获取的变更数据;
将所述多个第一CDC文件写入所述第一目标数据库。
2.如权利要求1所述的方法,其特征在于,将所述第二数据备份至所述第一目标数据库,包括:
将所述第二时间段划分为多个子时间段,其中,所述第二数据包括所述多个子时间段内新增的第二子数据;
将每个子时间段内新增的第二子数据备份至所述第一目标数据库。
3.如权利要求1所述的方法,其特征在于,在将所述多个第一CDC文件写入所述第一目标数据库之后,所述方法还包括:
从所述第一目标数据库中删除历史周期内备份的数据,或者将所述历史周期备份的数据迁移至第二目标数据库,其中,所述历史周期为所述当前周期之前的,且与所述当前周期的时间间隔大于预设时长的周期。
4.如权利要求1-3任一项所述的方法,其特征在于,在将所述多个第一CDC文件写入所述第一目标数据库之后,所述方法还包括:
当对待恢复的数据进行恢复时,确定所述待恢复的数据在所述第一目标数据库中的时间起点和时间终点;
从所述第一目标数据库中获取所述时间起点和所述时间终点之间的第三数据和多个第二CDC文件;
将所述第三数据和所述多个第二CDC文件恢复至所述源数据库。
5.一种数据处理装置,其特征在于,包括:
确定模块,用于确定当前周期的第一时间段和第二时间段,所述第二时间段为所述第一时间段之后的时间段;
备份模块,用于将源数据库在所述第一时间段内的第一数据备份至第一目标数据库;
所述备份模块,还用于确定所述源数据库在所述第二时间段内新增的第二数据,将所述第二数据备份至所述第一目标数据库;
获得模块,用于实时运行变更数据获取CDC服务,获得多个第一CDC文件,其中,每个第一CDC文件为所述源数据库在所述当前周期内每次发生数据变更时获取的变更数据;
所述备份模块,还用于将所述多个第一CDC文件写入所述第一目标数据库。
6.如权利要求5所述的装置,其特征在于,所述备份模块具体用于:
将所述第二时间段划分为多个子时间段,其中,所述第二数据包括所述多个子时间段内新增的第二子数据;
将每个子时间段内新增的第二子数据备份至所述第一目标数据库。
7.如权利要求5所述的装置,其特征在于,所述装置还包括更新模块,所述更新模块用于:
在将所述多个第一CDC文件写入所述第一目标数据库之后,从所述第一目标数据库中删除历史周期内备份的数据,或者将所述历史周期备份的数据迁移至第二目标数据库,其中,所述历史周期为所述当前周期之前的,且与所述当前周期的时间间隔大于预设时长的周期。
8.如权利要求5-7任一项所述的装置,其特征在于,所述装置还包括恢复模块,所述恢复模块用于:
在将所述多个第一CDC文件写入所述第一目标数据库之后,当对待恢复的数据进行恢复时,确定所述待恢复的数据在所述第一目标数据库中的时间起点和时间终点;
从所述第一目标数据库中获取所述时间起点和所述时间终点之间的第三数据和多个第二CDC文件;
将所述第三数据和所述多个第二CDC文件恢复至所述源数据库。
9.一种电子设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行权利要求1-4中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时,使所述计算机执行如权利要求1-4中任一项所述的方法。
CN202111617277.5A 2021-12-27 2021-12-27 一种数据处理方法、装置、设备及介质 Pending CN114443363A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111617277.5A CN114443363A (zh) 2021-12-27 2021-12-27 一种数据处理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111617277.5A CN114443363A (zh) 2021-12-27 2021-12-27 一种数据处理方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN114443363A true CN114443363A (zh) 2022-05-06

Family

ID=81365211

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111617277.5A Pending CN114443363A (zh) 2021-12-27 2021-12-27 一种数据处理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114443363A (zh)

Similar Documents

Publication Publication Date Title
US20210011627A1 (en) Performing Backup Operations Using Replicas
US11397648B2 (en) Virtual machine recovery method and virtual machine management device
CN110096476B (zh) 数据备份方法、装置及计算机可读存储介质
CN102594849B (zh) 数据备份、恢复方法、虚拟机快照删除、回滚方法及装置
EP3304310B1 (en) System and method for automatic cloud-based full-data backup and restore on mobile devices
US8250033B1 (en) Replication of a data set using differential snapshots
AU2012347883A1 (en) System and method for restoring application data
US11157451B2 (en) Adaptable multi-layered storage for deduplicating electronic messages
US11194669B2 (en) Adaptable multi-layered storage for generating search indexes
CN108614876B (zh) 一种基于Redis数据库的系统和数据处理方法
US20150012494A1 (en) System and method of performing continuous backup of a data file on a computing device
US11681586B2 (en) Data management system with limited control of external compute and storage resources
CN111338844A (zh) 一种数据库备份管理的方法及电子设备
CN110019063B (zh) 计算节点数据容灾回放的方法、终端设备及存储介质
CN114328005A (zh) 容器数据增量备份的方法及系统
WO2023240995A1 (zh) 一种双机热备系统的数据恢复方法、装置及介质
CN114443363A (zh) 一种数据处理方法、装置、设备及介质
CN114328020A (zh) 一种集群文件系统的数据备份方法及相关装置
CN113986450A (zh) 一种虚拟机备份方法及装置
CN116340051A (zh) 数据处理方法、相关装置及设备
US10884874B1 (en) Federated restore of availability group database replicas
CN112148532A (zh) 硬盘数据的批量恢复方法、装置、存储介质及电子设备
CN110688258A (zh) 一种快照创建方法及装置
CN110109775A (zh) 虚拟机恢复方法、装置、终端设备及存储介质
US10284593B1 (en) Protecting newly restored clients from computer viruses

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination