CN112380067A - 一种Hadoop环境下基于元数据的大数据备份系统及方法 - Google Patents

一种Hadoop环境下基于元数据的大数据备份系统及方法 Download PDF

Info

Publication number
CN112380067A
CN112380067A CN202011375213.4A CN202011375213A CN112380067A CN 112380067 A CN112380067 A CN 112380067A CN 202011375213 A CN202011375213 A CN 202011375213A CN 112380067 A CN112380067 A CN 112380067A
Authority
CN
China
Prior art keywords
backup
data
big data
cluster
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011375213.4A
Other languages
English (en)
Other versions
CN112380067B (zh
Inventor
胡耀
李春漾
应志野
张超
殷晋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
West China Hospital of Sichuan University
Original Assignee
West China Hospital of Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by West China Hospital of Sichuan University filed Critical West China Hospital of Sichuan University
Priority to CN202011375213.4A priority Critical patent/CN112380067B/zh
Publication of CN112380067A publication Critical patent/CN112380067A/zh
Application granted granted Critical
Publication of CN112380067B publication Critical patent/CN112380067B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种Hadoop环境下基于元数据的大数据备份系统及方法,包括备份客户端、备份服务端、备份策略智能化管理端、大数据集群端、大数据备份集群端。本发明主要通过对Hadoop大数据环境的元数据架构的优化和调整,充利用大数据分布式,高I/O等特性,在保证数据信息安全的前提下,本发明可根据用户需求,支持大数据平台内关键数据快速进行集群内数据备份与恢复、不同集群间数据备份与恢复以及根据当前和历史记录对备份策略进行智能备份。

Description

一种Hadoop环境下基于元数据的大数据备份系统及方法
技术领域
本发明涉及大数据数据存储技术领域,尤其涉及一种Hadoop环境下基于元数据的大数据备份系统及方法。
背景技术
Hadoop架构目前是世界上应用最广泛的大数据架构,随着大数据应用领域越来越广,大数据的安全性越发的受到重视。虽然目前大数据技术通过分布式架构中数据块多层冗余的方式,已可以实现大数据平台的冗余与平台数据备份,但目前的软件备份技术无法支持平台管理员误操作恢复、软件版本变更或软件BUG的数据恢复,基于时间点的数据恢复和有选择的重点数据的快速备份与恢复,备份或恢复操作可能对现有大数据集群等业务影响预警等场景。
发明内容
本发明旨在提供一种Hadoop环境下基于元数据的大数据备份系统及方法,充利用大数据分布式、高I/O等特性,在保证数据信息安全的前提下,支持大数据平台内关键数据进行快速一级和二级以及根据当前和历史性能记录对备份策略进行智能备份推荐。
为达到上述目的,本发明是采用以下技术方案实现的:
本发明公开一种Hadoop环境下基于元数据的大数据备份系统及方法,包括备份客户端、备份服务端、备份策略智能化管理端、大数据集群端、大数据备份集群端,
备份客户端:用于为用户提供可视化备份访问、定制备份计划;
备份服务端:包括生产元数据同步器、生产元数据列表、一级备份元数据列表、二级备份元数据列表;
备份策略智能化管理端:对备份策略进行存储和根据集群历史性能数据智能推荐数据备份或恢复的时间窗口;
大数据集群端:用于大数据的采集、集成、存储与分析,存储和恢复由备份客户端指定的一级备份数据;
大数据备份集群端:用于存储和恢复客户端指定的二级备份数据。
优选的,备份服务端通过大数据集群中备namenode的日志监控程序,实时加密同步Editlog日志至生产元数据列表中。
本发明还公开使用上述备份系统的大数据备份方法,包括一级数据备份、二级数据备份、一级数据恢复、二级数据恢复;
一级数据备份包括以下步骤:
S11、备份客户端通过解密器访问备份服务端,获得最新的元数据清单列表,
S12、用户使用备份客户端从元数据清单列表中选择需要进行一级数据备份的文件,
S13、备份服务端根据一级数据备份的文件清单,向大数据集群端提交备份文件的数据复制作业申请,
S14、大数据集群端的日志监控程序发现备份数据的Editlog日志,并在备份服务端的一级备份元素列表中使用加密运算法生成一级备份元数据列表临时文件,
S15、当大数据集群端的日志监控程序发现大数据集群备份成功后,备份服务端的一级备份元数据列表临时文件与一级备份元数据文件合并,
如备份失败,则删除一级备份元数据列表临时文件;
二级数据备份包括以下步骤:
S21、备份客户端访问备份服务端,获得最新的元数据清单列表,
S22、用户使用备份客户端从元数据清单列表中选择需要进行二级数据备份的文件,
S23、大数据备份集群端根据需备份文件需求,从大数据集群端读取相应的文件并写入大数据备份集群端中,
S24、大数据备份集群端的日志监控程序发现备份数据的Editlog日志,并在备份服务端的二级备份元素列表中使用加密运算法生成二级备份元数据列表临时文件,
S25、当备大数据备份集群端的日志监控程序发现大数据集群备份成功后,备份服务端的二级备份元数据列表临时文件与二级备份元数据文件合并,
如备份失败,则删除二级备份元数据列表临时文件;
一级数据恢复包括以下步骤:
S31、备份客户端通过解密算法,从备份服务端获取“一级备份元数据列表”清单,并获得需要恢复的文件列表的元数据信息,
S32、在大数据集群端中根据元数据信息,找到需恢复的数据文件。
S33、在大数据集群端中复制需恢复的数据文件。
S34、利用大数据集群端的日志监控程序监控数据恢复状态,并实时同步至备份服务端上;
二级数据恢复包括以下步骤:
S41、备份客户端通过解密算法,从备份服务端获取“二级备份元数据列表”清单和需要恢复的文件列表的元数据位置,
S42、根据文件列表的元数据位置,在大数据备份集群端中提取相关恢复数据,并向大数据集群端发出写数据申请,将需恢复数据写入大数据集群端中,
S43、利用大数据备份集群端的日志监控程序监控数据恢复状态,并实时同步至备份服务端上。
优选的,还包括智能数据备份与恢复,其步骤为:
S51、当用户在备份策略智能化管理端提交备份策略申请时,备份策略智能化管理端调取历史集群性能数据并根据备份文件大小、文件数量预估备份或恢复数据将会占用的资源(CPU、内存、磁盘I/O等),并且判断此次备份或恢复操作是否会影响现有集群正常的计算使用,
S52、当用户选择的数据备份时间预估会影响大数据集群端的正常使用时,备份策略智能化管理端会抽取近一月的集群性能数据,筛选出CPU或内存占用率小于80%且无磁盘I/O延迟的时间窗口和对应时间窗口的集群资源使用状态,并且根据此次备份需要占用资源和备份时间需求寻找相似的时间窗口,为用户推荐该备份窗口,
S53、当用户手动发起策略化备份或恢复进程时,备份策略智能化管理端可查看当前大数据集群性能情况,
当目前大数据集群端CPU或内存使用率大于80%或有较大I/O延迟时,则提示用户是否强制进行数据备份或恢复。
优选的,步骤S14和步骤S24中的加密算法均为AES与RSA混合加密。
本发明的有益效果:
1、本发明充分的利用了HDFS现在架构特点,对现有生产大数所平台改造难度小。
2、本发明利用HDFS的分布式架构,I/O并发力强的特点,数据备份和恢复速度较快。
3、本发明利用HDFS冗余备份机制,此种方法备份和恢复数据可靠性强。
4、本发明因采用元数据索引的备份的方式,所以备份方式灵活,可支持全备份,增量备份,异地备份等多种方式。
5、本发明对备份元数据进行加密,从而提高了数据的安全性。
6、本发明可对数据备份时间窗口进行智能预警和推荐。
附图说明
图1为本发明的架构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。
本发明中:
一级数据备份是指数据在生产大数据集群端中备份,
二级数据备份是指数据在大数据备份集群端中备份,
磁盘I/O是指磁盘的输入和/或输出操作,
HDFS是指分布式文件系统。
如图1所示,本发明包括备份客户端、备份服务端、备份策略智能化管理端、大数据集群端、大数据备份集群端,
备份客户端:用于为用户提供可视化备份访问、定制备份计划;
备份服务端:包括生产元数据同步器、生产元数据列表、一级备份元数据列表、二级备份元数据列表;
备份策略智能化管理端:对备份策略进行存储和根据集群历史性能数据智能推荐数据备份或恢复的时间窗口;
大数据集群端:用于大数据的采集、集成、存储与分析,存储和恢复由备份客户端指定的一级备份数据;
大数据备份集群端:用于存储和恢复客户端指定的二级备份数据。
备份服务端通过大数据集群中备namenode的日志监控程序,实时加密同步Editlog日志至生产元数据列表中。
上述备份系统的大数据备份方法主要包括一级数据备份、二级数据备份、一级数据恢复、二级数据恢复;
一级数据备份包括以下步骤:
S11、备份客户端通过解密器访问备份服务端,获得最新的元数据清单列表,
S12、用户使用备份客户端从元数据清单列表中选择需要进行一级数据备份的文件,
S13、备份服务端根据一级数据备份的文件清单,向大数据集群端提交备份文件的数据复制作业申请,
S14、大数据集群端的日志监控程序发现备份数据的Editlog日志,并在备份服务端的一级备份元素列表中使用加密运算法生成一级备份元数据列表临时文件,
S15、当大数据集群端的日志监控程序发现大数据集群备份成功后,备份服务端的一级备份元数据列表临时文件与一级备份元数据文件合并,
如备份失败,则删除一级备份元数据列表临时文件;
二级数据备份包括以下步骤:
S21、备份客户端访问备份服务端,获得最新的元数据清单列表,
S22、用户使用备份客户端从元数据清单列表中选择需要进行二级数据备份的文件,
S23、大数据备份集群端根据需备份文件需求,从大数据集群端读取相应的文件并写入大数据备份集群端中,
S24、大数据备份集群端的日志监控程序发现备份数据的Editlog日志,并在备份服务端的二级备份元素列表中使用加密运算法生成二级备份元数据列表临时文件,
S25、当备大数据备份集群端的日志监控程序发现大数据集群备份成功后,备份服务端的二级备份元数据列表临时文件与二级备份元数据文件合并,
如备份失败,则删除二级备份元数据列表临时文件;
一级数据恢复包括以下步骤:
S31、备份客户端通过解密算法,从备份服务端获取“一级备份元数据列表”清单,并获得需要恢复的文件列表的元数据信息,
S32、在大数据集群端中根据元数据信息,找到需恢复的数据文件。
S33、在大数据集群端中复制需恢复的数据文件。
S34、利用大数据集群端的日志监控程序监控数据恢复状态,并实时同步至备份服务端上;
二级数据恢复包括以下步骤:
S41、备份客户端通过解密算法,从备份服务端获取“二级备份元数据列表”清单和需要恢复的文件列表的元数据位置,
S42、根据文件列表的元数据位置,在大数据备份集群端中提取相关恢复数据,并向大数据集群端发出写数据申请,将需恢复数据写入大数据集群端中,
S43、利用大数据备份集群端的日志监控程序监控数据恢复状态,并实时同步至备份服务端上。
智能数据备份与恢复,其步骤为:
S51、当用户在备份策略智能化管理端提交备份策略申请时,备份策略智能化管理端调取历史集群性能数据并根据备份文件大小、文件数量预估备份或恢复数据将会占用的资源(CPU、内存、磁盘I/O等),并且判断此次备份或恢复操作是否会影响现有集群正常的计算使用,
S52、当用户选择的数据备份时间预估会影响大数据集群端的正常使用时,备份策略智能化管理端会抽取近一月的集群性能数据,筛选出CPU或内存占用率小于80%且无磁盘I/O延迟的时间窗口和对应时间窗口的集群资源使用状态,并且根据此次备份需要占用资源和备份时间需求寻找相似的时间窗口,为用户推荐该备份窗口,
S53、当用户手动发起策略化备份或恢复进程时,备份策略智能化管理端可查看当前大数据集群性能情况,
当目前大数据集群端CPU或内存使用率大于80%或有较大I/O延迟时,则提示用户是否强制进行数据备份或恢复。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (5)

1.一种Hadoop环境下基于元数据的大数据备份系统,其特征在于:包括备份客户端、备份服务端、备份策略智能化管理端、大数据集群端、大数据备份集群端,
备份客户端:用于为用户提供可视化备份访问、定制备份计划;
备份服务端:包括生产元数据同步器、生产元数据列表、一级备份元数据列表、二级备份元数据列表;
备份策略智能化管理端:对备份策略进行存储和根据集群历史性能数据智能推荐数据备份或恢复的时间窗口;
大数据集群端:用于大数据的采集、集成、存储与分析,存储和恢复由备份客户端指定的一级备份数据;
大数据备份集群端:用于存储和恢复客户端指定的二级备份数据。
2.根据权利要求1所述的备份系统,其特征在于:备份服务端通过大数据集群中备namenode的日志监控程序,实时加密同步Editlog日志至生产元数据列表中。
3.一种使用权利要求2所述备份系统的大数据备份方法,其特征在于:包括一级数据备份、二级数据备份、一级数据恢复、二级数据恢复;
一级数据备份包括以下步骤:
S11、备份客户端通过解密器访问备份服务端,获得最新的元数据清单列表,
S12、用户使用备份客户端从元数据清单列表中选择需要进行一级数据备份的文件,
S13、备份服务端根据一级数据备份的文件清单,向大数据集群端提交备份文件的数据复制作业申请,
S14、大数据集群端的日志监控程序发现备份数据的Editlog日志,并在备份服务端的一级备份元素列表中使用加密运算法生成一级备份元数据列表临时文件,
S15、当大数据集群端的日志监控程序发现大数据集群备份成功后,备份服务端的一级备份元数据列表临时文件与一级备份元数据文件合并,
如备份失败,则删除一级备份元数据列表临时文件;
二级数据备份包括以下步骤:
S21、备份客户端访问备份服务端,获得最新的元数据清单列表,
S22、用户使用备份客户端从元数据清单列表中选择需要进行二级数据备份的文件,
S23、大数据备份集群端根据需备份文件需求,从大数据集群端读取相应的文件并写入大数据备份集群端中,
S24、大数据备份集群端的日志监控程序发现备份数据的Editlog日志,并在备份服务端的二级备份元素列表中使用加密运算法生成二级备份元数据列表临时文件,
S25、当备大数据备份集群端的日志监控程序发现大数据集群备份成功后,备份服务端的二级备份元数据列表临时文件与二级备份元数据文件合并,
如备份失败,则删除二级备份元数据列表临时文件;
一级数据恢复包括以下步骤:
S31、备份客户端通过解密算法,从备份服务端获取“一级备份元数据列表”清单,并获得需要恢复的文件列表的元数据信息,
S32、在大数据集群端中根据元数据信息,找到需恢复的数据文件,
S33、在大数据集群端中复制需恢复的数据文件,
S34、利用大数据集群端的日志监控程序监控数据恢复状态,并实时同步至备份服务端上;
二级数据恢复包括以下步骤:
S41、备份客户端通过解密算法,从备份服务端获取“二级备份元数据列表”清单和需要恢复的文件列表的元数据位置,
S42、根据文件列表的元数据位置,在大数据备份集群端中提取相关恢复数据,并向大数据集群端发出写数据申请,将需恢复数据写入大数据集群端中,
S43、利用大数据备份集群端的日志监控程序监控数据恢复状态,并实时同步至备份服务端上。
4.根据权利要求3所述的备份方法,其特征在于:还包括智能数据备份与恢复,其步骤为:
S51、当用户在备份策略智能化管理端提交备份策略申请时,备份策略智能化管理端调取历史集群性能数据并根据备份文件大小、文件数量预估备份或恢复数据将会占用的资源,并且判断此次备份或恢复操作是否会影响现有集群正常的计算使用,
S52、当用户选择的数据备份时间预估会影响大数据集群端的正常使用时,备份策略智能化管理端会抽取近一月的集群性能数据,筛选出CPU或内存占用率小于80%且无磁盘I/O延迟的时间窗口和对应时间窗口的集群资源使用状态,并且根据此次备份需要占用资源和备份时间需求寻找相似的时间窗口,为用户推荐该备份窗口,
S53、当用户手动发起策略化备份或恢复进程时,备份策略智能化管理端可查看当前大数据集群性能情况,
当目前大数据集群端CPU或内存使用率大于80%或有较大I/O延迟时,则提示用户是否强制进行数据备份或恢复。
5.根据权利要求3所述的备份方法,其特征在于:步骤S14和步骤S24中的加密算法均为AES与RSA混合加密。
CN202011375213.4A 2020-11-30 2020-11-30 一种Hadoop环境下基于元数据的大数据备份系统及方法 Active CN112380067B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011375213.4A CN112380067B (zh) 2020-11-30 2020-11-30 一种Hadoop环境下基于元数据的大数据备份系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011375213.4A CN112380067B (zh) 2020-11-30 2020-11-30 一种Hadoop环境下基于元数据的大数据备份系统及方法

Publications (2)

Publication Number Publication Date
CN112380067A true CN112380067A (zh) 2021-02-19
CN112380067B CN112380067B (zh) 2023-08-22

Family

ID=74589184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011375213.4A Active CN112380067B (zh) 2020-11-30 2020-11-30 一种Hadoop环境下基于元数据的大数据备份系统及方法

Country Status (1)

Country Link
CN (1) CN112380067B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114048515A (zh) * 2022-01-11 2022-02-15 四川大学 一种基于联邦学习和区块链的医疗大数据共享方法
CN114328029A (zh) * 2022-03-02 2022-04-12 苏州浪潮智能科技有限公司 一种应用资源的备份方法、装置、电子设备及存储介质
WO2022227719A1 (zh) * 2021-04-26 2022-11-03 华为云计算技术有限公司 数据备份方法、系统及相关设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744749A (zh) * 2014-01-11 2014-04-23 浪潮电子信息产业股份有限公司 一种基于预算算法的虚拟机智能备份方法
CN104426968A (zh) * 2013-08-30 2015-03-18 腾讯科技(深圳)有限公司 数据管理方法和装置
CN104461792A (zh) * 2014-12-03 2015-03-25 浪潮集团有限公司 一种解决hadoop分布式文件系统namenode单点故障的ha方法
CN105516313A (zh) * 2015-12-10 2016-04-20 国网四川省电力公司信息通信公司 一种用于大数据的分布式存储系统
CN107180082A (zh) * 2017-05-03 2017-09-19 珠海格力电器股份有限公司 一种基于多级缓存机制的数据更新系统及方法
CN107315659A (zh) * 2017-06-27 2017-11-03 郑州云海信息技术有限公司 一种元数据的冗余备份方法及装置
CN107800808A (zh) * 2017-11-15 2018-03-13 广东奥飞数据科技股份有限公司 一种基于Hadoop架构的数据存储系统
CN109407977A (zh) * 2018-09-25 2019-03-01 佛山科学技术学院 一种大数据分布式存储管理方法及系统
US10552268B1 (en) * 2018-10-05 2020-02-04 EMC IP Holding Company LLC Broken point continuous backup in virtual datacenter

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104426968A (zh) * 2013-08-30 2015-03-18 腾讯科技(深圳)有限公司 数据管理方法和装置
CN103744749A (zh) * 2014-01-11 2014-04-23 浪潮电子信息产业股份有限公司 一种基于预算算法的虚拟机智能备份方法
CN104461792A (zh) * 2014-12-03 2015-03-25 浪潮集团有限公司 一种解决hadoop分布式文件系统namenode单点故障的ha方法
CN105516313A (zh) * 2015-12-10 2016-04-20 国网四川省电力公司信息通信公司 一种用于大数据的分布式存储系统
CN107180082A (zh) * 2017-05-03 2017-09-19 珠海格力电器股份有限公司 一种基于多级缓存机制的数据更新系统及方法
CN107315659A (zh) * 2017-06-27 2017-11-03 郑州云海信息技术有限公司 一种元数据的冗余备份方法及装置
CN107800808A (zh) * 2017-11-15 2018-03-13 广东奥飞数据科技股份有限公司 一种基于Hadoop架构的数据存储系统
CN109407977A (zh) * 2018-09-25 2019-03-01 佛山科学技术学院 一种大数据分布式存储管理方法及系统
US10552268B1 (en) * 2018-10-05 2020-02-04 EMC IP Holding Company LLC Broken point continuous backup in virtual datacenter

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ZHI QIU 等: ""Research of Hadoop-based data flow management system"", 《THE JOURNAL OF CHINA UNIVERSITIES OF POSTS AND TELECOMMUNICATIONS》, vol. 18, pages 164 - 168 *
周长俊 等: ""Hadoop备份数据存放策略的改进"", 《计算机技术与发展》, pages 11 - 16 *
特例独行的猪: ""Hadoop中的NameNode和Secondary NameNode,BackUpNode"", pages 1 - 2 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022227719A1 (zh) * 2021-04-26 2022-11-03 华为云计算技术有限公司 数据备份方法、系统及相关设备
CN114048515A (zh) * 2022-01-11 2022-02-15 四川大学 一种基于联邦学习和区块链的医疗大数据共享方法
CN114048515B (zh) * 2022-01-11 2022-03-22 四川大学 一种基于联邦学习和区块链的医疗大数据共享方法
CN114328029A (zh) * 2022-03-02 2022-04-12 苏州浪潮智能科技有限公司 一种应用资源的备份方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN112380067B (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
CN103197990B (zh) 自动优先恢复及相关的装置和方法
CN112380067B (zh) 一种Hadoop环境下基于元数据的大数据备份系统及方法
US9940206B2 (en) Handling failed cluster members when replicating a database between clusters
US9135264B2 (en) Distributed catalog, data store, and indexing
CN100547555C (zh) 一种基于指纹的数据备份系统
JP5260536B2 (ja) プライマリー・クラスタの高速リカバリ
US7680998B1 (en) Journaled data backup during server quiescence or unavailability
US20080168218A1 (en) Backup system with continuous data protection
US20070294310A1 (en) Method and apparatus for storing and recovering fixed content
CN106708653B (zh) 一种基于纠删码与多副本的混合税务大数据安全保护方法
CN110109778A (zh) 一种大量小数据文件备份方法及恢复方法
CN101647006A (zh) 用于数据备份的方法和系统
JPH08254047A (ja) 故障許容鍵管理装置及び方法
US8078585B2 (en) Reactive file recovery based on file naming and access information
CN113886143B (zh) 虚拟机持续数据保护方法、装置及数据恢复方法、装置
CN113190384B (zh) 基于纠删码的数据恢复控制方法、装置、设备及介质
WO2021208400A1 (zh) 现代应用的备份恢复系统及方法
CN107135097A (zh) 基于簿记建档的容灾系统及容灾方法
US20240311346A1 (en) Storage tiering for computing system snapshots
US11042454B1 (en) Restoration of a data source
US9740571B1 (en) Intelligent continuous data protection snapshot based backups
US8195612B1 (en) Method and apparatus for providing a catalog to optimize stream-based data restoration
US20220413971A1 (en) System and Method for Blockchain Based Backup and Recovery
CN101901173A (zh) 一种灾备系统及灾备方法
JPH05120110A (ja) フアイルの自動バツクアツプシステム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant