CN108196979B - 数据备份方法和装置 - Google Patents

数据备份方法和装置 Download PDF

Info

Publication number
CN108196979B
CN108196979B CN201711460906.1A CN201711460906A CN108196979B CN 108196979 B CN108196979 B CN 108196979B CN 201711460906 A CN201711460906 A CN 201711460906A CN 108196979 B CN108196979 B CN 108196979B
Authority
CN
China
Prior art keywords
data
relational database
time
storage cluster
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711460906.1A
Other languages
English (en)
Other versions
CN108196979A (zh
Inventor
姜彦国
徐俊劲
白若兰
刘志杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xingxuan Technology Co Ltd
Original Assignee
Beijing Xingxuan Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xingxuan Technology Co Ltd filed Critical Beijing Xingxuan Technology Co Ltd
Priority to CN201711460906.1A priority Critical patent/CN108196979B/zh
Publication of CN108196979A publication Critical patent/CN108196979A/zh
Application granted granted Critical
Publication of CN108196979B publication Critical patent/CN108196979B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Abstract

本申请提供了一种数据备份方法和装置,该方法包括:将关系型数据库保存的短期数据在数据仓库进行备份,并将所述关系型数据库的日志推送至Hadoop存储集群进行备份;根据预设条件从所述数据仓库备份的数据中筛选出远期数据;将所述远期数据从所述数据仓库推送至所述Hadoop存储集群进行保存。避免了远期数据的丢失,并且可以利用保存的远期数据和日志来将远期数据恢复至任意时间点。

Description

数据备份方法和装置
技术领域
本申请涉及互联网技术,具体涉及一种数据备份方法和装置。
背景技术
Hadoop是一个能够对海量数据进行分布式处理的软件框架,让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。并且可以很快的从一台服务器扩展到几千上万台服务器规模的集群,同时在软件架构层面提供了更高的高可用性和容错性。
Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)被设计成适合运行在通用硬件上的分布式文件系统。HDFS有着高容错性的特点,并且设计用来部署在低成本硬件上。而且它提供高吞吐量来访问应用程序的数据,适合有着超大数据集的应用程序。HDFS可以实现流形式访问文件系统中的数据。
MySQL是一种关系数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。对MySQL数据库的数据进行备份时,通常将MySQL数据备份在一个数据仓库内,例如使用“mysqldump”命令或者“mysqlhotcopy”工具进行数据备份。当备份的数据量超过数据仓库的存储量时,远期的备份数据会被新的备份数据覆盖。
发明内容
本申请实施例提供了一种数据备份方法和装置,以解决现有技术中远期的备份数据会被覆盖从而无法查询的技术问题。
根据本申请实施例的一个方面,提供了一种数据备份方法,所述方法包括:将关系型数据库保存的短期数据在数据仓库进行备份,并将关系型数据库的日志推送至Hadoop存储集群进行备份;根据预设条件从数据仓库备份的数据中筛选出远期数据;将远期数据从数据仓库推送至Hadoop存储集群进行保存。
在一个实施例中,所述数据备份方法还包括:接收与关系型数据库对应的查询请求;判断查询请求的目标数据是否属于远期数据;响应于查询请求的目标数据为远期数据,从Hadoop存储集群查询目标数据;响应于查询请求的目标数据为短期数据,从数据仓库查询目标数据。
在一个实施例中,所述数据备份方法还包括:接收针对远期数据的数据恢复请求,从Hadoop存储集群获取对应的远期数据并恢复至关系型数据库。
优选的,接收针对远期数据的数据恢复请求,从Hadoop存储集群获取对应的远期数据并恢复至所述关系型数据库包括:
接收针对远期数据的数据恢复请求,数据恢复请求要将第一时刻的远期数据恢复至关系型数据库;从Hadoop存储集群获取第二时刻的远期数据,第二时刻早于第一时刻;从Hadoop存储集群获取远期数据从第二时刻到第一时刻的日志;根据第二时刻的远期数据执行日志,得到第一时刻的远期数据;将第一时刻的远期数据恢复至关系型数据库。
在一个实施例中,根据预设条件从数据仓库备份的数据中筛选出远期数据包括:判断数据的创建时间或者上一次更新时间距离当前时间是否长于预设门限;响应于创建时间或者上一次更新时间距离当前时间长于预设门限,判定所述数据属于远期数据。
根据本申请实施例的另一个方面,提供了一种数据备份装置,所述装置包括:备份模块,用于将关系型数据库保存的短期数据在数据仓库进行备份,并将关系型数据库的日志推送至Hadoop存储集群进行备份;筛选模块,用于根据预设条件从数据仓库备份的数据中筛选出远期数据;保存模块,用于将远期数据从数据仓库推送至Hadoop存储集群进行保存。
在一个实施例中,所述数据备份装置还包括:查询请求接收模块,用于接收与关系型数据库对应的查询请求;判断模块,用于判断查询请求的目标数据是否属于远期数据;远期数据查询模块,用于响应于查询请求的目标数据为远期数据,从Hadoop存储集群查询目标数据;短期数据查询模块,用于响应于查询请求的目标数据为短期数据,从数据仓库查询目标数据。
在一个实施例中,所述数据备份装置还包括:数据恢复模块,用于接收针对远期数据的数据恢复请求,从Hadoop存储集群获取对应的远期数据并恢复至关系型数据库。
优选的,所述数据恢复模块包括:数据恢复请求接收单元,用于接收针对远期数据的数据恢复请求,数据恢复请求要将第一时刻的远期数据恢复至关系型数据库;数据获取单元,用于从Hadoop存储集群获取第二时刻的远期数据,第二时刻早于第一时刻;日志获取单元,用于从Hadoop存储集群获取远期数据从第二时刻到第一时刻的日志;日志执行单元,用于根据第二时刻的远期数据执行日志,得到第一时刻的远期数据;数据恢复单元,用于将第一时刻的远期数据恢复至关系型数据库。
在一个实施例中,所述筛选模块包括:判断单元,用于判断数据的创建时间或者上一次更新时间距离当前时间是否长于预设门限;处理单元,用于响应于创建时间或者上一次更新时间距离当前时间长于预设门限,判定数据属于远期数据。
根据本申请实施例的另一个方面,提供了一种电子设备,包括存储器和处理器;存储器用于存储一条或多条计算机指令,其中,一条或多条计算机被所述处理器执行以实现上述数据备份方法。
根据本申请实施例的另一个方面,提供了一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现上述数据备份方法。
本申请实施例的有益效果包括:将远期数据推送至Hadoop存储集群进行保存,而关系型数据库的日志被全部推送至Hadoop存储集群进行保存,以用于数据恢复,防止远期数据因数据仓库存储容量的限制而被覆盖,避免了远期数据的丢失,并且可以利用保存的远期数据和日志将远期数据恢复至任意时间点。
附图说明
通过以下参照附图对本申请实施例的描述,本申请的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1是本申请实施例数据备份系统的架构示意图;
图2是本申请实施例提供的数据备份方法的流程示意图;
图3是本申请实施例进行数据查询时的流程示意图;
图4是本申请实施例进行数据恢复时的流程示意图;
图5是本申请实施例提供的数据备份装置的框图;
图6是本申请实施例提供的电子设备的结构示意图。
具体实施方式
以下基于实施例对本申请进行描述,但是本申请并不仅仅限于这些实施例。在下文对本申请的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本申请。为了避免混淆本申请的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。
此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。
除非上下文明确要求,否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本申请实施例将数据仓库中备份的数据按照预设规则划分为远期数据和短期数据,将远期数据推送至Hadoop存储集群进行保存,而对关系型数据库的日志不区分远期和短期,被全部推送至Hadoop存储集群进行保存,以用于数据恢复,防止数据仓库中的远期数据因存储容量的限制而被覆盖,从而避免了远期数据的丢失,并且可以利用保存的远期数据和日志来恢复任意时间点的远期数据。
图1是本申请实施例数据备份系统的架构示意图,包括关系型数据库10,数据仓库11,Hadoop存储集群12和服务器13。其中,关系型数据库10可以是MySQL、PostgreSQL和Microsoft SQL Server等数据库中的任意一种。数据仓库11用于对关系型数据库10进行备份和管理,关系型数据库10中新创建的数据表或者更新后的数据表都备份在数据仓库11。Hadoop存储集群12内部包括多个存储服务节点,用于保存数据仓库11推送的远期数据。服务器13用于控制关系型数据库10的数据备份并响应来自系统外部的数据查询请求和数据恢复请求。
服务器13将关系型数据库10的短期数据在数据仓库11进行备份。短期数据包括在关系型数据库10中新创建的数据表和由于写操作而导致数据更新的数据表。对于短期数据而言,其在创建或者更新后,服务器13会在数据仓库11复制对应的数据表作为备份。
对于已经备份在数据仓库11的数据,服务器13根据预设条件从备份的数据中筛选出远期数据。预设条件可以是该数据的创建时间距离当前时间达到预设门限,例如创建时间距离当前时间已达到3天;也可以是该数据的更新时间距离当前时间达到预设门限,例如更新时间距离当前时间已达到3天。本申请实施例中的预设条件不仅仅局限于上述两种情形,可根据实际需求进行配置,筛选远期数据时也可以利用各种预设条件的组合来进行。
服务器13将筛选出的远期数据从数据仓库11推送到Hadoop存储集群12,推送的数据表按照分布式存储的方式保存在Hadoop存储集群12。Hadoop存储集群12具有提供海量数据存储服务的能力,能够避免远期数据在数据仓库11中因被新的备份数据覆盖而造成数据丢失。
对于关系型数据库10的日志,服务器13将其直接从关系型数据库10推送至Hadoop存储集群12,按照分布式存储的方式进行保存,以用于远期数据的恢复。
对关系型数据库10的数据进行查询时,由服务器13接收来自外部设备的数据查询请求。数据查询请求可以包括表名称、字段名称等信息。服务器13根据数据查询请求确定目标数据,根据表名称、字段名称等信息判断目标数据是否属于远期数据。
如果目标数据属于远期数据,则服务器13从Hadoop存储集群12查询目标数据,此时服务器13相对于Hadoop存储集群12相当于一个数据查询客户端,根据目标数据的相关信息从Hadoop存储集群12查询到远期数据。服务器13将查询结果返回发送数据查询请求的外部设备。
如果目标数据属于短期数据,则服务器13从数据仓库11查询目标数据,根据目标数据的相关信息从数据仓库11查询到该短期数据。服务器13将查询结果返回发送数据查询请求的外部设备。对于短期数据在进行数据备份的数据仓库11进行查询操作,避免访问关系型数据库10中的原始数据,提升了原始数据的安全性。
对关系型数据库10进行数据恢复时,也同样由服务器13接收来自外部设备的数据恢复请求。数据恢复请求包括表名称、字段名称、时间戳等信息。服务器13根据表名称、字段名称确定恢复的目标数据,根据时间戳确定目标数据恢复的时间点或版本。
如果需要恢复的数据属于短期数据,服务器13从数据仓库11中获取对应的备份数据并恢复至关系型数据库10。
如果需要恢复的目标数据属于远期数据,数据仓库11中对应的备份数据有可能已经被覆盖,此时服务器13从Hadoop存储集群12获取对应的远期数据并恢复至关系型数据库11。如果需要恢复的远期数据的时间戳与Hadoop存储集群12中保存的远期数据的时间戳相同,则直接获取该远期数据进行数据恢复。
如果需要恢复的远期数据的时间戳与Hadoop存储集群12中保存的远期数据的时间戳不同,则需要利用Hadoop存储集群12中保存的日志来配合进行数据恢复。例如,需要恢复的远期数据的时间戳为第一时刻t1,该远期数据在Hadoop存储集群12中距离第一时刻t1最近的时间戳为第二时刻t2,并且第二时刻t2早于第一时刻t1。那么,服务器13获取第二时刻t2的该远期数据和从第二时刻t2至第一时刻t1的与该远期数据相关的日志。服务器13利用第二时刻t2的远期数据,开始执行从第二时刻t2至第一时刻t1的与该远期数据相关的日志,进而得到该远期数据在第一时刻t1的数据状态,然后将该远期数据在第一时刻t1的数据状态恢复至关系型数据库10,或者恢复至其他目标数据库。
利用Hadoop存储集群12保存远期数据,既能够防止远期数据的丢失,还能够结合日志将远期数据恢复至任何时间点。
基于以上说明,本申请实施例提供了一种数据备份方法,适用于服务器13,如图2所示,该方法包括以下步骤。
S20,将关系型数据库保存的短期数据在数据仓库进行备份,并将关系型数据库的日志推送至Hadoop存储集群进行备份;
S21,根据预设条件从数据仓库备份的数据中筛选出远期数据;
S22,将远期数据从数据仓库推送至Hadoop存储集群进行保存。
将短期数据备份在数据仓库,将数据仓库中的远期数据以及关系型数据库的日志推送至Hadoop存储集群进行保存,能够避免远期数据在数据仓库中因被覆盖而丢失,并且能够利用日志对远期数据进行数据恢复。
在一个实施例中,如图3所示,在进行数据查询时,本申请实施例提供的数据备份方法进一步包括以下步骤。
S23,接收与关系型数据库对应的查询请求。
S24,判断查询请求的目标数据是否属于远期数据。当查询请求的目标数据属于远期数据时,执行步骤S25;当查询请求的目标数据属于短期数据时,执行步骤S26。
S25,从Hadoop存储集群查询目标数据。
S26,从数据仓库查询目标数据。
使得远期数据不会因数据仓库存储容量有限而造成丢失,仍然可通过Hadoop存储集群进行查询。
在一个实施例中,在进行数据恢复时,本申请实施例提供的数据备份方法进一步包括以下步骤。
S27,接收针对远期数据的数据恢复请求,从Hadoop存储集群获取对应的远期数据并恢复至关系型数据库。
当数据恢复请求的时间戳与Hadoop存储集群保存的远期数据的时间戳不一致时,如图4所示,步骤S27进一步包括以下步骤。
S271,接收针对远期数据的数据恢复请求,数据恢复请求要将第一时刻的远期数据恢复至关系型数据库。
S272,从Hadoop存储集群获取第二时刻的远期数据,第二时刻早于第一时刻;
S273,从Hadoop存储集群获取远期数据从第二时刻到第一时刻的日志;
S274,根据第二时刻的远期数据执行日志,得到第一时刻的远期数据;
S275,将第一时刻的远期数据恢复至关系型数据库。
利用Hadoop存储集群保存的远期数据和日志可以将远期数据恢复至任意时间点。
在一个实施例中,S21进一步包括以下步骤。
S211,判断数据的创建时间或者上一次更新时间距离当前时间是否长于预设门限。当数据的创建时间或者上一次更新时间距离当前时间长于预设门限时,执行S212;当数据的创建时间或者上一次更新时间距离当前时间小于或等于预设门限时,执行S213。
S212,判定该数据属于远期数据。
S213,判定该数据属于短期数据。
通过各种预设规则从数据仓库的备份数据中筛选出远期数据,防止这些远期数据丢失。
本申请实施例还提供了一种数据备份装置,如图5所示,该数据备份装置包括:
备份模块30,用于将关系型数据库保存的短期数据在数据仓库进行备份,并将关系型数据库的日志推送至Hadoop存储集群进行备份;
筛选模块31,用于根据预设条件从数据仓库备份的数据中筛选出远期数据;
保存模块32,用于将远期数据从数据仓库推送至Hadoop存储集群进行保存。
在一个实施例中,数据备份装置还包括:
查询请求接收模块,用于接收与关系型数据库对应的查询请求;
判断模块,用于判断查询请求的目标数据是否属于远期数据;
远期数据查询模块,用于响应于查询请求的目标数据为远期数据,从Hadoop存储集群查询目标数据;
短期数据查询模块,用于响应于查询请求的目标数据为短期数据,从数据仓库查询目标数据。
在一个实施例中,数据备份装置还包括:
数据恢复模块,用于接收针对远期数据的数据恢复请求,从Hadoop存储集群获取对应的远期数据并恢复至关系型数据库。
优选的,数据恢复模块包括:
数据恢复请求接收单元,用于接收针对远期数据的数据恢复请求,数据恢复请求要将第一时刻的远期数据恢复至关系型数据库;
数据获取单元,用于从Hadoop存储集群获取第二时刻的远期数据,第二时刻早于第一时刻;
日志获取单元,用于从Hadoop存储集群获取远期数据从第二时刻到第一时刻的日志;
日志执行单元,用于根据第二时刻的远期数据执行日志,得到第一时刻的远期数据;
数据恢复单元,用于将第一时刻的远期数据恢复至关系型数据库。
在一个实施例中,筛选模块31包括:
判断单元,用于判断数据的创建时间或者上一次更新时间距离当前时间是否长于预设门限;
处理单元,用于响应于创建时间或者上一次更新时间距离当前时间长于预设门限,判定数据属于远期数据。
此外,数据备份装置还可以通过硬件处理器(hardware processor)来实现上述各个程序步骤。下面参考图6,其示出了适于用来实现本申请实施例的电子设备的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口606。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括备份模块、筛选模块和保存模块。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入电子设备中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所存储的一个或者多个程序被一个设备执行时,使得所述设备:将关系型数据库保存的短期数据在数据仓库进行备份,并将关系型数据库的日志推送至Hadoop存储集群进行备份;根据预设条件从数据仓库备份的数据中筛选出远期数据;将远期数据从数据仓库推送至Hadoop存储集群进行保存。
以上所述仅为本申请的优选实施例,并不用于限制本申请,对于本领域技术人员而言,本申请可以有各种改动和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
a1、一种数据备份方法,所述方法包括:
将关系型数据库保存的短期数据在数据仓库进行备份,并将所述关系型数据库的日志推送至Hadoop存储集群进行备份;根据预设条件从所述数据仓库备份的数据中筛选出远期数据;将所述远期数据从所述数据仓库推送至所述Hadoop存储集群进行保存。
a2、根据a1所述的方法,所述方法还包括:
接收与所述关系型数据库对应的查询请求;判断所述查询请求的目标数据是否属于远期数据;响应于所述查询请求的目标数据为远期数据,从所述Hadoop存储集群查询所述目标数据;响应于所述查询请求的目标数据为短期数据,从所述数据仓库查询所述目标数据。
a3、根据a1所述的方法,所述方法还包括:
接收针对远期数据的数据恢复请求,从所述Hadoop存储集群获取对应的远期数据并恢复至所述关系型数据库。
a4、根据a3所述的方法,接收针对远期数据的数据恢复请求,从所述Hadoop存储集群获取对应的远期数据并恢复至所述关系型数据库包括:
接收针对远期数据的数据恢复请求,所述数据恢复请求要将第一时刻的所述远期数据恢复至所述关系型数据库;从所述Hadoop存储集群获取第二时刻的所述远期数据,所述第二时刻早于第一时刻;从所述Hadoop存储集群获取所述远期数据从第二时刻到第一时刻的日志;根据第二时刻的所述远期数据执行所述日志,得到第一时刻的所述远期数据;将第一时刻的所述远期数据恢复至所述关系型数据库。
a5、根据a1所述的方法,根据预设条件从所述数据仓库备份的数据中筛选出远期数据包括:
判断数据的创建时间或者上一次更新时间距离当前时间是否长于预设门限;响应于创建时间或者上一次更新时间距离当前时间长于预设门限,判定所述数据属于远期数据。
b6、一种数据备份装置,所述装置包括:
备份模块,用于将关系型数据库保存的短期数据在数据仓库进行备份,并将所述关系型数据库的日志推送至Hadoop存储集群进行备份;筛选模块,用于根据预设条件从所述数据仓库备份的数据中筛选出远期数据;保存模块,用于将所述远期数据从所述数据仓库推送至所述Hadoop存储集群进行保存。
b7、根据b6所述的装置,所述装置还包括:
查询请求接收模块,用于接收与所述关系型数据库对应的查询请求;判断模块,用于判断所述查询请求的目标数据是否属于远期数据;远期数据查询模块,用于响应于所述查询请求的目标数据为远期数据,从所述Hadoop存储集群查询所述目标数据;短期数据查询模块,用于响应于所述查询请求的目标数据为短期数据,从所述数据仓库查询所述目标数据。
b8、根据b6所述的装置,所述装置还包括:
数据恢复模块,用于接收针对远期数据的数据恢复请求,从所述Hadoop存储集群获取对应的远期数据并恢复至所述关系型数据库。
b9、根据b8所述的装置,所述数据恢复模块包括:
数据恢复请求接收单元,用于接收针对远期数据的数据恢复请求,所述数据恢复请求要将第一时刻的所述远期数据恢复至所述关系型数据库;数据获取单元,用于从所述Hadoop存储集群获取第二时刻的所述远期数据,所述第二时刻早于第一时刻;日志获取单元,用于从所述Hadoop存储集群获取所述远期数据从第二时刻到第一时刻的日志;日志执行单元,用于根据第二时刻的所述远期数据执行所述日志,得到第一时刻的所述远期数据;数据恢复单元,用于将第一时刻的所述远期数据恢复至所述关系型数据库。
b10、根据b6所述的装置,所述筛选模块包括:
判断单元,用于判断数据的创建时间或者上一次更新时间距离当前时间是否长于预设门限;处理单元,用于响应于创建时间或者上一次更新时间距离当前时间长于预设门限,判定所述数据属于远期数据。
c11、一种电子设备,包括存储器和处理器;所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机被所述处理器执行以实现权利要求1至5任意一项所述方法的步骤。
d12、一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现权利要求1至5任意一项所述方法的步骤。

Claims (8)

1.一种数据备份方法,其特征在于,所述方法包括:
将关系型数据库保存的短期数据在数据仓库进行备份,并将所述关系型数据库的日志推送至Hadoop存储集群进行备份;
根据预设条件从所述数据仓库备份的数据中筛选出远期数据;
将所述远期数据从所述数据仓库推送至所述Hadoop存储集群进行保存;
接收针对远期数据的数据恢复请求,从所述Hadoop存储集群获取对应的远期数据并恢复至所述关系型数据库;
接收针对远期数据的数据恢复请求,从所述Hadoop存储集群获取对应的远期数据并恢复至所述关系型数据库包括:
接收针对远期数据的数据恢复请求,所述数据恢复请求要将第一时刻的所述远期数据恢复至所述关系型数据库;
从所述Hadoop存储集群获取第二时刻的所述远期数据,所述第二时刻早于第一时刻;
从所述Hadoop存储集群获取所述远期数据从第二时刻到第一时刻的日志;
根据第二时刻的所述远期数据执行所述日志,得到第一时刻的所述远期数据;
将第一时刻的所述远期数据恢复至所述关系型数据库。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收与所述关系型数据库对应的查询请求;
判断所述查询请求的目标数据是否属于远期数据;
响应于所述查询请求的目标数据为远期数据,从所述Hadoop存储集群查询所述目标数据;
响应于所述查询请求的目标数据为短期数据,从所述数据仓库查询所述目标数据。
3.根据权利要求1所述的方法,其特征在于,根据预设条件从所述数据仓库备份的数据中筛选出远期数据包括:
判断数据的创建时间或者上一次更新时间距离当前时间是否长于预设门限;
响应于创建时间或者上一次更新时间距离当前时间长于预设门限,判定所述数据属于远期数据。
4.一种数据备份装置,其特征在于,所述装置包括:
备份模块,用于将关系型数据库保存的短期数据在数据仓库进行备份,并将所述关系型数据库的日志推送至Hadoop存储集群进行备份;
筛选模块,用于根据预设条件从所述数据仓库备份的数据中筛选出远期数据;
保存模块,用于将所述远期数据从所述数据仓库推送至所述Hadoop存储集群进行保存;
数据恢复模块,用于接收针对远期数据的数据恢复请求,从所述Hadoop存储集群获取对应的远期数据并恢复至所述关系型数据库;
所述数据恢复模块包括:
数据恢复请求接收单元,用于接收针对远期数据的数据恢复请求,所述数据恢复请求要将第一时刻的所述远期数据恢复至所述关系型数据库;
数据获取单元,用于从所述Hadoop存储集群获取第二时刻的所述远期数据,所述第二时刻早于第一时刻;
日志获取单元,用于从所述Hadoop存储集群获取所述远期数据从第二时刻到第一时刻的日志;
日志执行单元,用于根据第二时刻的所述远期数据执行所述日志,得到第一时刻的所述远期数据;
数据恢复单元,用于将第一时刻的所述远期数据恢复至所述关系型数据库。
5.根据权利要求4所述的装置,其特征在于,所述装置还包括:
查询请求接收模块,用于接收与所述关系型数据库对应的查询请求;
判断模块,用于判断所述查询请求的目标数据是否属于远期数据;
远期数据查询模块,用于响应于所述查询请求的目标数据为远期数据,从所述Hadoop存储集群查询所述目标数据;
短期数据查询模块,用于响应于所述查询请求的目标数据为短期数据,从所述数据仓库查询所述目标数据。
6.根据权利要求4所述的装置,其特征在于,所述筛选模块包括:
判断单元,用于判断数据的创建时间或者上一次更新时间距离当前时间是否长于预设门限;
处理单元,用于响应于创建时间或者上一次更新时间距离当前时间长于预设门限,判定所述数据属于远期数据。
7.一种电子设备,其特征在于,包括存储器和处理器;所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机被所述处理器执行以实现权利要求1至3任意一项所述方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1至3任意一项所述方法的步骤。
CN201711460906.1A 2017-12-28 2017-12-28 数据备份方法和装置 Active CN108196979B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711460906.1A CN108196979B (zh) 2017-12-28 2017-12-28 数据备份方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711460906.1A CN108196979B (zh) 2017-12-28 2017-12-28 数据备份方法和装置

Publications (2)

Publication Number Publication Date
CN108196979A CN108196979A (zh) 2018-06-22
CN108196979B true CN108196979B (zh) 2021-07-09

Family

ID=62585257

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711460906.1A Active CN108196979B (zh) 2017-12-28 2017-12-28 数据备份方法和装置

Country Status (1)

Country Link
CN (1) CN108196979B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109460438B (zh) * 2018-09-26 2024-04-12 中国平安人寿保险股份有限公司 消息数据存储方法、装置、计算机设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101635638A (zh) * 2008-07-25 2010-01-27 中兴通讯股份有限公司 一种容灾系统及其容灾方法
CN101794246A (zh) * 2010-02-24 2010-08-04 成都市华为赛门铁克科技有限公司 备份存储系统、备份系统及数据备份方法和恢复方法
CN103778034A (zh) * 2014-02-26 2014-05-07 广州杰赛科技股份有限公司 基于云存储的数据备份容灾方法及系统
CN204101747U (zh) * 2014-10-17 2015-01-14 中国地质大学(武汉) 一种基于pic32的电磁数据存储系统
CN104468654A (zh) * 2013-09-18 2015-03-25 杭州信核数据科技有限公司 连接到云存储的存储管理网关、方法及数据分层备份系统
US20150370502A1 (en) * 2014-06-19 2015-12-24 Cohesity, Inc. Making more active use of a secondary storage system
CN107451013A (zh) * 2017-06-30 2017-12-08 北京奇虎科技有限公司 基于分布式系统的数据恢复方法、装置及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105022680A (zh) * 2015-08-05 2015-11-04 浪潮(北京)电子信息产业有限公司 一种数据备份方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101635638A (zh) * 2008-07-25 2010-01-27 中兴通讯股份有限公司 一种容灾系统及其容灾方法
CN101794246A (zh) * 2010-02-24 2010-08-04 成都市华为赛门铁克科技有限公司 备份存储系统、备份系统及数据备份方法和恢复方法
CN104468654A (zh) * 2013-09-18 2015-03-25 杭州信核数据科技有限公司 连接到云存储的存储管理网关、方法及数据分层备份系统
CN103778034A (zh) * 2014-02-26 2014-05-07 广州杰赛科技股份有限公司 基于云存储的数据备份容灾方法及系统
US20150370502A1 (en) * 2014-06-19 2015-12-24 Cohesity, Inc. Making more active use of a secondary storage system
CN204101747U (zh) * 2014-10-17 2015-01-14 中国地质大学(武汉) 一种基于pic32的电磁数据存储系统
CN107451013A (zh) * 2017-06-30 2017-12-08 北京奇虎科技有限公司 基于分布式系统的数据恢复方法、装置及系统

Also Published As

Publication number Publication date
CN108196979A (zh) 2018-06-22

Similar Documents

Publication Publication Date Title
US10956403B2 (en) Verifying data consistency
US9552161B2 (en) Repetitive data block deleting system and method
US8645323B2 (en) Large volume data replication using job replication
CN109144785B (zh) 用于备份数据的方法和装置
US20100088271A1 (en) Hsm two-way orphan reconciliation for extremely large file systems
US10838827B2 (en) System and method for time parameter based database restoration
CN110753112A (zh) 云服务的弹性伸缩方法和装置
CN113364877B (zh) 数据处理方法、装置、电子设备和介质
CN111752960B (zh) 数据处理方法和装置
CN111338834B (zh) 数据存储方法和装置
CN111818145B (zh) 一种文件传输方法、装置、系统、设备及存储介质
WO2017107984A1 (zh) 一种数据恢复方法及装置
CN111143231B (zh) 用于数据处理的方法、设备和计算机程序产品
CN108196979B (zh) 数据备份方法和装置
CN113254267A (zh) 分布式数据库的数据备份方法和装置
CN111488117B (zh) 用于管理元数据的方法、电子设备和计算机可读介质
US20170177273A1 (en) Statistics management for scale-out storage
US11163748B1 (en) Fingerprint backward compatibility in deduplication backup systems
CN110609731B (zh) 用于管理虚拟机的方法、设备和计算机程序产品
US20120303590A1 (en) Management of deduplicated data during restoration in a network archival and retrieval system
CN114996057A (zh) 数据备份方法及装置、电子设备和计算机可读存储介质
CN112235332A (zh) 一种集群的读写切换方法和装置
CN113761075A (zh) 切换数据库的方法、装置、设备和计算机可读介质
US20180302480A1 (en) Method and device for maintaining session of network storage device
US9880904B2 (en) Supporting multiple backup applications using a single change tracker

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 202, 2 floors, 1-3 floors, No. 11 Shangdi Information Road, Haidian District, Beijing 100085

Applicant after: Beijing Xingxuan Technology Co.,Ltd.

Address before: Room 202, 2 floors, 1-3 floors, No. 11 Shangdi Information Road, Haidian District, Beijing 100085

Applicant before: Beijing Xiaodu Information Technology Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant