TW201516655A - 基於分散式文檔系統的資料備份還原系統及方法 - Google Patents

基於分散式文檔系統的資料備份還原系統及方法 Download PDF

Info

Publication number
TW201516655A
TW201516655A TW102139173A TW102139173A TW201516655A TW 201516655 A TW201516655 A TW 201516655A TW 102139173 A TW102139173 A TW 102139173A TW 102139173 A TW102139173 A TW 102139173A TW 201516655 A TW201516655 A TW 201516655A
Authority
TW
Taiwan
Prior art keywords
data
backup
distributed document
document system
module
Prior art date
Application number
TW102139173A
Other languages
English (en)
Inventor
Ming-Chuan Kao
zhong-wei Li
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Publication of TW201516655A publication Critical patent/TW201516655A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1471Saving, restoring, recovering or retrying involving logging of persistent data for recovery

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Retry When Errors Occur (AREA)

Abstract

一種基於分散式文檔系統的資料備份還原系統,包括:控制模組,用於控制備份還原進程定時備份資料;記錄模組,用於當用戶端對資料進行用戶操作時,記錄下用戶操作資訊;還原模組,用於當分散式文檔系統的主節點出現異常時,控制備份還原進程利用該備份還原進程備份的資料還原資料;讀取模組,用於讀取備份還原進程最近一次的資料備份時間;查看模組,用於以讀取的資料備份時間作為起始時間,讀取該起始時間之後的用戶操作資訊;恢復模組,用於根據該起始時間之後所記錄的用戶操作資訊恢復每個用戶操作。

Description

基於分散式文檔系統的資料備份還原系統及方法
本發明涉及一種資料備份還原系統及方法,尤其涉及一種基於分散式文檔系統的資料備份還原系統及方法。
於運用分散式文檔系統儲存文檔時,通常為單點故障,必須及時備份主節點的元資料資訊,才能保證資料的完整性。分散式文檔系統自身提供的備份還原進程自帶備份功能可以實現備份資料,但是該進程備份的過程存在時間空文檔,於該時間空文檔內的操作出現異常則無法獲得備份,亦無法得到恢復。
鑒於以上內容,有必要提供一種基於分散式文檔系統的資料備份還原系統及方法,以對分散式文檔系統中所有資料操作進行備份還原。
一種基於分散式文檔系統的資料備份還原系統,運行於伺服器上,該系統包括:控制模組,用於控制分散式文檔系統的備份還原進程定時備份分散式文檔系統的資料;記錄模組,用於當用戶端對分散式文檔系統的資料進行用戶操作時,記錄下用戶操作資訊;還原模組,用於當分散式文檔系統的主節點出現異常時,控制所述備份還原進程利用該備份還原進程備份的資料還原該分散式文檔系統的資料;讀取模組,用於讀取所述備份還原進程最近一次的資料備份時間;查看模組,用於以所述讀取的資料備份時間作為起始時間,讀取該起始時間之後的操作資訊;及恢復模組,用於根據該起始時間之後所記錄的操作資訊恢復每個用戶操作。
一種基於分散式文檔系統的資料備份還原方法,該方法運行於伺服器中,該方法包括:控制步驟,控制分散式文檔系統的備份還原進程定時備份分散式文檔系統的資料;記錄步驟,當用戶端對分散式文檔系統的資料進行用戶操作時,記錄下用戶操作資訊;還原步驟,當分散式文檔系統的主節點出現異常時,控制所述備份還原進程利用該備份還原進程備份的資料還原該分散式文檔系統的資料;讀取步驟,讀取所述備份還原進程最近一次的資料備份時間;查看步驟,以所述讀取的資料備份時間作為起始時間,讀取該起始時間之後的操作資訊;及恢復步驟,根據該起始時間之後所記錄的操作資訊恢復每個用戶操作。
相較於習知技術,所述基於分散式文檔系統資料備份還原系統及方法,於分散式文檔系統自身的備份還原的資料備份還原功能之外,提供了於備份還原執行備份還原資料的時間間隔內所執行的用戶操作進行資料備份還原,使得分散式文檔系統的所有資料均可以得到備份和及時還原。
圖1是本發明基於分散式文檔系統資料備份還原系統較佳實施例的運行環境圖。
圖2是本發明中基於分散式文檔系統資料備份還原系統的功能模組圖。
圖3是本發明中基於分散式文檔系統資料備份還原方法較佳實施例的作業流程圖。
如圖1所示,是本發明基於分散式文檔系統的資料備份還原系統較佳實施例的運行環境圖。本實施例中,該分散式文檔系統可為Hadoop,即Hadoop Distributed File System,簡稱HDFS。所述資料備份還原系統10運行於分散式文檔系統1的第一伺服器11中,該第一伺服器11連接於第二伺服器12,該第二伺服器12作為分散式文檔系統的主節點(如Hadoop的NameNode節點)。所述第一伺服器11和第二伺服器12亦可整合為一個伺服器。所述第一伺服器11上運行於分散式文檔系統的備份還原進程(如Hadoop的SecondaryNameNode進程),該備份還原進程用於當主節點出現異常時,對資料進行定時備份及利用備份的資料進行資料還原。所述分散式文檔系統1和多個用戶端2進行通信,使得於所述用戶端2上可以對分散式文檔系統1中的資料(如第一伺服器11與第二伺服器12中的資料)進行操作,該操作包括:新增資料和修改資料。
如圖2所示,是圖1中基於分散式文檔系統資料備份還原系統10的功能模組圖。所述基於分散式文檔系統資料備份還原系統10包括:控制模組100、分析模組101、備份模組102、記錄模組103、還原模組104、讀取模組105、查看模組106、判斷模組107及恢復模組108。所述模組是具有特定功能的軟體程式段,該軟體儲存於電腦可讀儲存介質或其他儲存設備,可被電腦或其他包含處理器的計算裝置執行,從而完成本發明中分散式文檔系統資料備份還原的流程。
控制模組100用於控制所述備份還原進程定時備份分散式文檔系統1的資料,並記錄下每次備份資料的資料備份時間。本實施例中,該定時的時間為一小時,即所述備份還原進程每隔一個小時對分散式文檔系統1的資料進行備份。所述資料可以備份到第一伺服器11中。
分析模組101用於當用戶端2對分散式文檔系統1的資料進行用戶操作時,分析該用戶操作,判斷該用戶操作為新增資料還是修改資料。所述新增資料是指用戶端2上傳資料至分散式文檔系統1中,如從用戶端2上複製一份word文文檔至分散式文檔系統1中。所述修改資料是指於分散式文檔系統1中進行操作,如:創建文檔夾、刪除文檔、修改文檔案名、移動文檔等。
備份模組102用於當所述用戶操作為新增資料時,將用戶新增的資料備份至第一伺服器11中。
記錄模組103用於記錄下該用戶操作資訊,如記錄下新增資料的操作資訊或修改資料的操作資訊。本實施例中,該操作資訊包括,但不限於,用戶操作時間、用戶端2的名稱、運算元據的原始位址和目標位址等。該用戶操作資訊可用日誌(log)的形式進行記錄,如記錄至分散式文檔系統 log中。
還原模組104用於當分散式文檔系統1的主節點出現異常時,控制所述備份還原進程利用該備份還原進程最近一次備份的資料還原該分散式文檔系統1的資料。所述主節點出現異常表現為分散式文檔系統1無法運行。
讀取模組105用於讀取所述備份還原進程最近一次的資料備份時間。
查看模組106用於以所述讀取的資料備份時間作為起始時間,讀取該起始時間之後記錄的所有用戶操作。
判斷模組107用於判斷所述讀取的用戶操作是新增資料還是修改資料。
恢復模組108用於當所讀取的用戶操作是新增資料時,讀取所述備份模組102所備份的該用戶操作對應的新增的資料,並新增該資料以恢復該用戶操作。當所讀取的用戶操作是修改資料時,讀取該修改資料的操作資訊,重新執行該操作。如:該用戶操作為刪除文檔,則該恢復模組108讀取該用戶操作的操作資訊,該操作資訊中包括需要刪除文檔的名稱、文檔的位址等,該恢復模組108根據該操作資訊重新刪除該文檔。
如圖3所示,是本發明基於分散式文檔系統的資料備份還原方法較佳實施例的作業流程圖。
步驟S30,控制模組100控制所述備份還原進程定時備份分散式文檔系統1的資料,並記錄資料備份時間。本實施例中,該定時的時間為一小時,即所述備份還原進程每隔一個小時對分散式文檔系統1的資料進行備份。所述資料可以備份到第一伺服器11中。
步驟S31,當用戶端2對分散式文檔系統1的資料進行用戶操作時,分析模組101分析該用戶操作,判斷該用戶操作為新增資料還是修改資料。所述新增資料是指用戶端2上傳資料至分散式文檔系統1中,如從用戶端2上複製一份word文文檔至分散式文檔系統1中。所述修改資料是指於分散式文檔系統1中進行操作,如:創建文檔夾、刪除文檔、修改文檔案名、移動文檔等。當所述用戶操作為新增資料時,執行步驟S32。當所述用戶操作為修改資料時,直接執行步驟S33。
步驟S32,備份模組102將用戶新增的資料備份至第一伺服器11中,並執行步驟S33。
步驟S33,記錄模組103記錄下該用戶操作資訊,如記錄下新增資料的操作資訊或修改資料的操作資訊。本實施例中,該操作資訊包括,但不限於,用戶操作時間、用戶端2的名稱、運算元據的原始位址和目標位址等。該用戶操作資訊可用日誌(log)的形式進行記錄,如記錄至分散式文檔系統 log中。
步驟S34,當分散式文檔系統1的主節點出現異常時,還原模組104控制所述備份還原進程利用該備份還原進程最近一次備份的資料還原該分散式文檔系統1的資料。所述主節點出現異常表現為分散式文檔系統1無法運行。
步驟S35,讀取模組105讀取備份還原進程最近一次的資料備份時間。步驟S36,查看模組106以所述讀取的資料備份時間作為起始時間,讀取該起始時間之後記錄的所有用戶操作。
步驟S37,判斷模組107用於判斷所述讀取的用戶操作是新增資料還是修改資料。當所述讀取的用戶操作是新增資料時,執行步驟S37。當所述讀取的用戶操作是修改資料時,執行步驟S38。
步驟S38,恢復模組108讀取所述備份模組102所備份的該用戶操作對應的新增的資料,並新增該資料以恢復該用戶操作。
步驟S39,恢復模組108讀取該修改資料的操作資訊,重新執行該操作。如:該用戶操作為刪除文檔,則該恢復模組108讀取該用戶操作的操作資訊,該操作資訊中包括需要刪除文檔的名稱、文檔的位址等,該恢復模組108根據該操作資訊重新刪除該文檔。
綜上所述,本發明符合發明專利要件,爰依法提出專利申請。惟,以上所述者僅爲本發明之較佳實施例,本發明之範圍並不以上述實施例爲限,舉凡熟悉本案技藝之人士爰依本發明之精神所作之等效修飾或變化,皆應涵蓋於以下申請專利範圍內。
1‧‧‧分散式文檔系統
10‧‧‧資料備份還原系統
11‧‧‧第一伺服器
12‧‧‧第二伺服器
2‧‧‧用戶端
100‧‧‧控制模組
101‧‧‧分析模組
102‧‧‧備份模組
103‧‧‧記錄模組
104‧‧‧還原模組
105‧‧‧讀取模組
106‧‧‧查看模組
107‧‧‧判斷模組
108‧‧‧恢復模組
10‧‧‧資料備份還原系統
100‧‧‧控制模組
101‧‧‧分析模組
102‧‧‧備份模組
103‧‧‧記錄模組
104‧‧‧還原模組
105‧‧‧讀取模組
106‧‧‧查看模組
107‧‧‧判斷模組
108‧‧‧恢復模組

Claims (8)

  1. 一種基於分散式文檔系統的資料備份還原系統,運行於伺服器上,該資料備份還原系統包括:
    控制模組,用於控制分散式文檔系統的備份還原進程定時備份分散式文檔系統的資料;
    記錄模組,用於當用戶端對分散式文檔系統的資料進行用戶操作時,記錄下用戶操作資訊;
    還原模組,用於當分散式文檔系統的主節點出現異常時,控制所述備份還原進程利用該備份還原進程最近一次備份的資料還原該分散式文檔系統的資料;
    讀取模組,用於讀取所述備份還原進程最近一次的資料備份時間;
    查看模組,用於以所述讀取的資料備份時間作為起始時間,讀取該起始時間之後的操作資訊;及
    恢復模組,用於根據該起始時間之後所記錄的操作資訊恢復每個用戶操作。
  2. 如申請專利範圍第1項所述之基於分散式文檔系統的資料備份還原系統,該系統還包括:
    分析模組,用於當用戶端對分散式文檔系統的資料進行操作時,分析該用戶操作,判斷該用戶操作為新增資料還是修改資料;及
    備份模組,用於當所述用戶操作為新增資料時,將用戶新增的資料備份至伺服器中。
  3. 如申請專利範圍第2項所述之基於分散式文檔系統的資料備份還原系統,所述恢復模組還用於當所述讀取模步驟讀取的用戶操作是新增資料時,讀取所述備份的該用戶操作對應的新增資料,並新增該資料以恢復該用戶操作;或當所述讀取步驟讀取的用戶操作是修改資料時,讀取該修改資料的操作資訊,根據該操作資訊重新執行該操作。
  4. 如申請專利範圍第2項所述之基於分散式文檔系統的資料備份還原系統,所述新增資料是指上傳資料至分散式文檔系統,所述修改資料是指於分散式文檔系統中修改資料。
  5. 一種基於分散式文檔系統的資料備份還原方法,該方法運行於伺服器中,該方法包括:
    控制步驟,控制分散式文檔系統的備份還原進程定時備份分散式文檔系統的資料;
    記錄步驟,當用戶端對分散式文檔系統的資料進行用戶操作時,記錄下用戶操作資訊;
    還原步驟,當分散式文檔系統的主節點出現異常時,控制所述備份還原進程利用該備份還原進程備份的資料還原該分散式文檔系統的資料;
    讀取步驟,讀取所述備份還原進程最近一次的資料備份時間;
    查看步驟,以所述讀取的資料備份時間作為起始時間,讀取該起始時間之後的操作資訊;及
    恢復步驟,根據該起始時間之後所記錄的操作資訊恢復每個用戶操作。
  6. 如申請專利範圍第5項所述之基於分散式文檔系統的資料備份還原方法,該方法於控制步驟之後還包括:
    分析步驟,當用戶端對分散式文檔系統的資料進行操作時,分析該用戶操作,判斷該用戶操作為新增資料還是修改資料;
    備份步驟,當所述用戶操作為新增資料時,將用戶新增的資料備份至伺服器中。
  7. 如申請專利範圍第6項所述之基於分散式文檔系統的資料備份還原方法,所述恢復步驟包括:
    當所述讀取模步驟讀取的用戶操作是新增資料時,讀取所述備份的該用戶操作對應的新增資料,並新增該資料以恢復該用戶操作;或
    當所述讀取步驟讀取的用戶操作是修改資料時,讀取該修改資料的操作資訊,根據該操作資訊重新執行該操作。
  8. 如申請專利範圍第6項所述之基於分散式文檔系統的資料備份還原方法,所述新增資料是指上傳資料至分散式文檔系統,所述修改資料是指於分散式文檔系統中修改資料。
TW102139173A 2013-10-17 2013-10-29 基於分散式文檔系統的資料備份還原系統及方法 TW201516655A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310487760.5A CN104572339A (zh) 2013-10-17 2013-10-17 基于分布式文件系统的数据备份还原系统及方法

Publications (1)

Publication Number Publication Date
TW201516655A true TW201516655A (zh) 2015-05-01

Family

ID=52827106

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102139173A TW201516655A (zh) 2013-10-17 2013-10-29 基於分散式文檔系統的資料備份還原系統及方法

Country Status (3)

Country Link
US (1) US20150112946A1 (zh)
CN (1) CN104572339A (zh)
TW (1) TW201516655A (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9672122B1 (en) * 2014-09-29 2017-06-06 Amazon Technologies, Inc. Fault tolerant distributed tasks using distributed file systems
CN106469100B (zh) * 2015-08-17 2019-04-05 华为技术有限公司 一种数据恢复的方法、存储的方法相应的装置及系统
CN107451013B (zh) * 2017-06-30 2020-12-25 北京奇虎科技有限公司 基于分布式系统的数据恢复方法、装置及系统
CN109257235B (zh) * 2018-11-12 2022-03-22 深信服科技股份有限公司 网络异常恢复方法、装置、设备及计算机可读存储介质
CN111176900A (zh) * 2019-12-30 2020-05-19 浪潮电子信息产业股份有限公司 一种分布式存储系统及其数据恢复方法、装置和介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE500599C2 (sv) * 1992-12-08 1994-07-25 Ellemtel Utvecklings Ab Sätt att optimera minnesutrymme i en databas
US6453325B1 (en) * 1995-05-24 2002-09-17 International Business Machines Corporation Method and means for backup and restoration of a database system linked to a system for filing data
US7373364B1 (en) * 2002-03-05 2008-05-13 Network Appliance, Inc. System and method for creating a point-in-time restoration of a database file
US8145601B2 (en) * 2004-09-09 2012-03-27 Microsoft Corporation Method, system, and apparatus for providing resilient data transfer in a data protection system
CN101996108B (zh) * 2009-08-18 2013-05-08 中兴通讯股份有限公司 一种分布式环境的备份和恢复方法及其系统
CN102479115A (zh) * 2010-11-23 2012-05-30 鸿富锦精密工业(深圳)有限公司 数据备份与恢复系统及方法
CN102073560A (zh) * 2011-01-17 2011-05-25 北京深思洛克软件技术股份有限公司 一种数据备份方法和装置
CN103197988A (zh) * 2012-01-05 2013-07-10 中国移动通信集团湖南有限公司 一种数据备份、恢复的方法、设备和数据库系统
US9218383B2 (en) * 2013-03-15 2015-12-22 International Business Machines Corporation Differentiated secondary index maintenance in log structured NoSQL data stores
CN103218256B (zh) * 2013-04-18 2016-04-13 中国工商银行股份有限公司 一种主机批量的回退方法以及系统
US9471436B2 (en) * 2013-04-23 2016-10-18 Facebook, Inc. Use of incremental checkpoints to restore user data stream processes

Also Published As

Publication number Publication date
US20150112946A1 (en) 2015-04-23
CN104572339A (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
US9645892B1 (en) Recording file events in change logs while incrementally backing up file systems
US9348827B1 (en) File-based snapshots for block-based backups
US9411821B1 (en) Block-based backups for sub-file modifications
US20220114067A1 (en) Systems and methods for instantiation of virtual machines from backups
EP3125119B1 (en) A method for restoring files from a continuous recovery system
EP3125120B1 (en) System and method for consistency verification of replicated data in a recovery system
US9377964B2 (en) Systems and methods for improving snapshot performance
US8260747B2 (en) System, method, and computer program product for allowing access to backup data
US10162555B2 (en) Deduplicating snapshots associated with a backup operation
EP3101545B1 (en) System and method for generating backups of a protected system from a recovery system
US8732128B2 (en) Shadow copy bookmark generation
KR101693683B1 (ko) 가상 데이터베이스 되감기
US10204016B1 (en) Incrementally backing up file system hard links based on change logs
US10108501B2 (en) Terminal backup and recovery method
KR20090110823A (ko) 데이터 섀도잉 시스템 및 데이터의 자동 백업 저장 방법
US10146633B2 (en) Data recovery from multiple data backup technologies
US8762347B1 (en) Method and apparatus for processing transactional file system operations to enable point in time consistent file data recreation
US8538925B2 (en) System and method for backing up test data
CN111913663A (zh) 存储卷在线迁移的方法、装置和存储卷在线迁移的系统
TW201516655A (zh) 基於分散式文檔系統的資料備份還原系統及方法
CN105593829A (zh) 从原始映像备份中排除文件系统对象
CN111506253A (zh) 一种分布式存储系统及其存储方法
US9262290B2 (en) Flash copy for disaster recovery (DR) testing
JP6070146B2 (ja) 情報処理装置及びバックアップ方法
US8595271B1 (en) Systems and methods for performing file system checks