DE102013204972A1 - Hybride Sicherung und Wiederherstellung eines sehr grossen Dateisystems unter Verwendung von Metadaten-Abbildsicherung und herkömmlicher Sicherung - Google Patents

Hybride Sicherung und Wiederherstellung eines sehr grossen Dateisystems unter Verwendung von Metadaten-Abbildsicherung und herkömmlicher Sicherung Download PDF

Info

Publication number
DE102013204972A1
DE102013204972A1 DE102013204972A DE102013204972A DE102013204972A1 DE 102013204972 A1 DE102013204972 A1 DE 102013204972A1 DE 102013204972 A DE102013204972 A DE 102013204972A DE 102013204972 A DE102013204972 A DE 102013204972A DE 102013204972 A1 DE102013204972 A1 DE 102013204972A1
Authority
DE
Germany
Prior art keywords
file
backup
files
file system
hsm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE102013204972A
Other languages
English (en)
Other versions
DE102013204972B4 (de
Inventor
Steven M. Berman
Neeta Garimella
Wayne A. Sawdon
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE102013204972A1 publication Critical patent/DE102013204972A1/de
Application granted granted Critical
Publication of DE102013204972B4 publication Critical patent/DE102013204972B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/185Hierarchical storage management [HSM] systems, e.g. file migration or policies thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process

Abstract

Ein Mechanismus wird zum Verwenden einer Mischform einer Metadaten-Abbildsicherung und herkömmlicher Sicherung zum Schutz sehr großer und sich schnell ändernder Dateisysteme bereitgestellt. Der Mechanismus führt eine Metadaten-Abbildsicherung eines Dateisystems mit einem hierarchischen Speichermanagement (HSM) durch. Die Metadaten-Abbildsicherung sichert die Metadaten des Dateisystems, indem ein Zeitpunkt-Abbild des HSM-Dateisystems erzeugt wird. Gleichzeitig mit dem Durchführen der Metadaten-Abbildsicherung des HSM-Dateisystems identifiziert der Mechanismus eine Gruppe von residenten Dateien, die noch nicht offline in dem HSM-Dateisystem gespeichert sind. Der Mechanismus identifiziert unveränderliche Dateien in der Gruppe von residenten Dateien, um eine optimierte Gruppe von residenten Dateien zu bilden und leitet die optimierte Gruppe von residenten Dateien zu einem herkömmlichen Sicherungssystem weiter. Das herkömmliche Sicherungssystem sichert Dateidaten für die Gruppe von residenten Dateien. Der Mechanismus führt ferner eine Metadaten-Abbildwiederherstellung des HSM-Dateisystems durch. Die Metadaten-Abbildwiederherstellung stellt das Zeitpunkt-Abbild des HSM-Dateisystems wieder her. Als Reaktion auf das Erkennen, dass ein verlagerter verwalteter Status einer Datei nicht wiederhergestellt werden kann, setzt der Mechanismus ein unveränderliches Bit des Dateiattributs zurück, stellt Dateidaten für die Datei unter Verwendung des herkömmlichen Sicherungssystems wieder her und setzt das unveränderliche Bitattribut der Datei.

Description

  • HINTERGRUND
  • Die vorliegende Anwendung bezieht sich allgemein auf eine verbesserte Datenverarbeitungsvorrichtung und ein verbessertes Datenverarbeitungsverfahren und insbesondere auf Mechanismen zur hybriden Sicherung und Wiederherstellung eines sehr großen Dateisystems unter Verwendung von Metadaten-Abbildsicherung und herkömmlicher Sicherung.
  • Ein Dateisystem ist eine Software-Komponente, die eine festgelegte Gruppe von Speichereinheiten verwaltet und auf eine Weise Zugriff auf Daten bereitstellt, die ein einheitliches Hinzufügen, Ändern und Löschen von Daten und Dateien erleichtert. Der Begriff wird auch verwendet, um den Daten- und Metadatensatz zu beschreiben, der in einer bestimmten Gruppe von Speichereinheiten enthalten ist. Eine Datei ist eine benannte Bitfolge, auf die eine Computeranwendung zugreifen kann. Eine Datei weist bestimmte Standardattribute wie beispielsweise Länge, Änderungszeitpunkt und Zeitpunkt des letzten Zugriffs auf. Metadaten sind Daten, die Informationen über einen oder mehrere Datenaspekte wie beispielsweise Zeitpunkt und Datum des Anlegens, Anleger oder Autor, Speicherort und Ähnliches bereitstellen.
  • Das Aufkommen von Speichernetzwerk(SAN)-Dateisystemen und kostengünstigen Speichern hat dazu geführt, dass sehr große Dateisysteme mit einer sehr großen Anzahl von Dateien möglich sind. Unglücklicherweise ist die Zeit, die zur vollständigen Wiederherstellung von Dateisystemen von einer Sicherungskopie benötigt wird, proportional zur Größe des Dateisystems. Der Kunde hat die Wahl, Dateien von besonderem Interesse zuerst manuell wiederherzustellen und den Zugriff auf das Dateisystem mit einem nur unvollständig wiederhergestellten Datensatz zu erlauben oder den Zugriff zu verzögern, bis alle Daten wiederhergestellt sind. Bei der ersten Option muss der Administrator genau die Daten angeben, auf die zugegriffen werden soll, da Anwendungen, die auf nicht wiederhergestellte Daten zugreifen, fehlschlagen. Bei der zweiten Option muss die Wiederaufnahme des Geschäftsbetriebs verschoben werden, bis alle Dateien wiederhergestellt sind.
  • KURZDARSTELLUNG
  • Bei einer veranschaulichenden Ausführungsform wird ein Verfahren zur hybriden Metadaten-Abbildsicherung und herkömmlichen Sicherung in einem Datenverarbeitungssystem bereitgestellt. Das Verfahren weist auf, dass eine Metadaten-Abbildsicherung eines Dateisystems durchgeführt wird, das durch hierarchisches Speichermanagement (HSM) gesteuert wird. Die Metadaten-Abbildsicherung sichert die Metadaten des Dateisystems, um ein Zeitpunkt-Abbild der Struktur des durch HSM gesteuerten Dateisystems zu erzeugen. Das Verfahren weist weiterhin auf, dass gleichzeitig mit dem Durchführen der Metadaten-Abbildsicherung des HSM-Dateisystems eine Gruppe von residenten Dateien identifiziert wird, die noch nicht offline in dem HSM-Dateisystem gespeichert sind. Das Verfahren weist ferner ein Identifizieren von unveränderlichen Dateien in der Gruppe von residenten Dateien auf, um eine optimierte Gruppe von residenten Dateien zu bilden, sowie ein Weiterleiten der optimierten Gruppe von residenten Dateien zu einem herkömmlichen Sicherungssystem, wobei das herkömmliche Sicherungssystem Dateidaten nur für die Gruppe von residenten Dateien sichert.
  • Bei anderen veranschaulichenden Ausführungsformen wird ein Computerprogrammprodukt bereitgestellt, das ein durch einen Computer nutzbares oder lesbares Medium mit einem computerlesbaren Programm aufweist. Wenn das computerlesbare Programm in einer Datenverarbeitungseinheit ausgeführt wird, veranlasst es die Datenverarbeitungseinheit, verschiedene einzelne und Kombinationen der oben genannten Operationen in Bezug auf das Verfahren der veranschaulichenden Ausführungsform durchzuführen.
  • Bei einer noch weiteren veranschaulichenden Ausführungsform wird ein System/eine Vorrichtung bereitgestellt. Das System/die Vorrichtung kann einen oder mehrere Prozessoren und einen Speicher aufweisen, der mit dem einen oder den mehreren Prozessoren verbunden ist. Der Speicher kann Befehle aufweisen, die, wenn sie von dem einen oder den mehreren Prozessoren ausgeführt werden, den einen oder die mehreren Prozessoren veranlassen, verschiedene einzelne und Kombinationen der oben genannten Operationen in Bezug auf das Verfahren der veranschaulichenden Ausführungsform durchzuführen.
  • Diese und andere Merkmale und Vorteile der vorliegenden Erfindung werden anhand der nachfolgenden ausführlichen Beschreibung der beispielhaften Ausführungsformen der vorliegenden Erfindung dargestellt oder erschließen sich dem Fachmann.
  • KURZE BESCHREIBUNG DER VERSCHIEDENEN ANSICHTEN DER ZEICHNUNGEN
  • Die Erfindung sowie ein bevorzugter Verwendungsmodus und weitere Ziele und Vorteile davon ergeben sich anhand der folgenden ausführlichen Beschreibung veranschaulichender Ausführungsformen, die in Verbindung mit den beigefügten Zeichnungen zu lesen sind, wobei:
  • 1 ein Blockschaltbild eines Datenverarbeitungssystems zeigt, in dem veranschaulichende Ausführungsformen umgesetzt werden können;
  • 2 grundlegende Elemente in einem Dateisystem gemäß einer veranschaulichenden Ausführungsform darstellt;
  • 3 ein Blockschaubild ist, das ein hybrides Metadaten-Abbildsicherungs-/Wiederherstellungs- und herkömmliches Sicherungs-/Archivierungssystem gemäß einer veranschaulichenden Ausführungsform darstellt;
  • 4 ein Ablaufplan ist, der die Funktionsweise eines hybriden Metadaten-Abbildsicherungs-/Wiederherstellungs- und herkömmlichen Sicherungs-/Archivierungssystems gemäß einer veranschaulichenden Ausführungsform darstellt; und
  • 5 ein Ablaufplan ist, der die Funktionsweise eines hybriden Metadaten-Abbildwiederherstellungs- und herkömmlichen Wiederherstellungssystems gemäß einer veranschaulichenden Ausführungsform darstellt.
  • AUSFÜHRLICHE BESCHREIBUNG
  • Eine Metadaten-Abbildsicherung ist ein Mittel zum Erfassen der organisationsbezogenen Informationen eines Dateisystems wie diese in Metadaten in einem einheitlichen einzelnen Abbild gespeichert sind, das verwendet werden kann, um den gesamten Namensbereich des Dateisystems einschließlich Verzeichnisnamen und Dateinamen wiederherzustellen. Die Metadaten-Abbildsicherung kann Objektnamen, Zugriffssteuerungslisten, erweiterte Attribute, Eigentümer, Gruppe und Modus-Informationen über jedes Dateisystemobjekt enthalten. Die Metadaten-Abbildsicherung enthält nicht die jedem Objekt zugeordneten Daten. Es wird vielmehr erwartet, dass das HSM-System die meisten oder alle Daten für die Objekte des Dateisystems speichert und dafür verwendet werden kann, diese wieder abzurufen, nachdem zuerst das Abbild der Metadaten wiederhergestellt wurde.
  • Die veranschaulichenden Ausführungsformen stellen einen Mechanismus zum Verwenden einer Mischform einer Metadaten-Abbildsicherung und einer herkömmlichen Sicherung für Dateien bereit. Der Mechanismus kann die Gesamtheit der Dateien in einem großen und stark beanspruchten Dateisystem zum Schutz vor Datenverlust leistungsfähig sichern. Das Verwenden eines Änderungsüberwachungsprotokolls zum Erstellen einer Liste von unvollständigen Dateien und/oder gesicherten Abbildern ermöglicht es dem Mechanismus, spezielle Maßnahmen für diejenigen Dateien in dem Dateisystem zu ergreifen, die nicht für eine einfache Metadaten-Abbildsicherung in Frage gekommen sind. Es gibt einen Sonderfall zum Wiederherstellen von unveränderlichen Dateien, damit Daten durch einen herkömmlichen Sicherungs-/Archivierungswiederherstellungsprozess wiederhergestellt werden können.
  • Die veranschaulichenden Ausführungsformen können für viele verschiedene Arten von Datenverarbeitungsumgebungen verwendet werden. Um einen Kontext für die Beschreibung der spezifischen Elemente und der Funktionalität der veranschaulichenden Ausführungsformen bereitzustellen, wird im Folgenden 1 als eine beispielhafte Umgebung vorgestellt, in der Aspekte der veranschaulichenden Ausführungsformen umgesetzt werden können. Es ist offensichtlich, dass 1 nur ein Beispiel ist und keine Beschränkung der Umgebungen darstellen oder nahelegen soll, in denen Aspekte oder Ausführungsformen der vorliegenden Erfindung umgesetzt werden können. An den dargestellten Umgebungen können viele Änderungen vorgenommen werden, ohne vom Erfindungsgedanken und Schutzumfang der vorliegenden Erfindung abzuweichen.
  • 1 zeigt ein Blockschaltbild eines Datenverarbeitungssystems, in dem veranschaulichende Ausführungsformen umgesetzt werden können. Das Datenverarbeitungssystem 100 ist ein Beispiel eines Computers, in dem durch einen Computer nutzbarer Code oder Befehle zum Ausführen der Prozesse für die veranschaulichenden Ausführungsformen enthalten sein können. In diesem veranschaulichenden Beispiel beinhaltet das Datenverarbeitungssystem 100 die Datenübertragungsstruktur 102, die Datenübertragungen zwischen der Verarbeitungseinheit 104, dem Speicher 106, dem permanenten Speicher 108, der Datenübertragungseinheit 110, der Eingabe/Ausgabe(E/A)-Einheit 112 und der Anzeige 114 bereitstellt.
  • Die Verarbeitungseinheit 104 dient dazu, Befehle für Software auszuführen, die in den Speicher 106 geladen werden kann. Bei der Verarbeitungseinheit 104 kann es sich je nach spezieller Ausführung um eine Gruppe von einem oder mehreren Prozessoren oder einen Multiprozessorkern handeln. Die Verarbeitungseinheit 104 kann des Weiteren unter Verwendung eines oder mehrerer heterogener Prozessorsysteme ausgeführt werden, in denen ein Hauptprozessor mit sekundären Prozessoren auf einem einzelnen Chip enthalten ist. Bei einem weiteren veranschaulichenden Beispiel kann die Verarbeitungseinheit 104 ein symmetrisches Multiprozessorsystem mit mehreren Prozessoren desselben Typs sein.
  • Der Speicher 106 und der permanente Speicher 108 sind Beispiele für die Speichereinheiten 116. Eine Speichereinheit ist ein beliebiges Hardware-Element, das Informationen wie beispielsweise Daten, Programmcode in funktionaler Form und/oder andere geeignete Informationen vorübergehend und/oder permanent speichern kann, ohne darauf beschränkt zu sein. Der Speicher 106 kann in diesen Beispielen zum Beispiel ein Direktzugriffsspeicher oder eine beliebige andere geeignete flüchtige oder nichtflüchtige Speichereinheit sein. Der permanente Speicher 108 kann je nach spezieller Ausführung verschiedene Formen aufweisen. Der permanente Speicher 108 kann zum Beispiel eine oder mehrere Komponenten oder Einheiten beinhalten. Der permanente Speicher 108 kann zum Beispiel eine Festplatte, ein Flash-Speicher, eine wiederbeschreibbare optische Platte, ein wiederbeschreibbares Magnetband oder eine Kombination des Vorgenannten sein. Die von dem permanenten Speicher 108 verwendeten Medien können auch austauschbar sein. Für den permanenten Speicher 108 kann zum Beispiel eine austauschbare Festplatte verwendet werden.
  • Die Datenübertragungseinheit 110 stellt in diesen Beispielen Datenübertragungen mit anderen Datenverarbeitungssystemen oder Einheiten bereit. In diesen Beispielen ist die Datenübertragungseinheit 110 eine Netzwerkschnittstellenkarte. Die Datenübertragungseinheit 110 kann Datenübertragungen über physische und/oder drahtlose Datenübertragungsverbindungen bereitstellen.
  • Die Eingabe/Ausgabe-Einheit 112 ermöglicht die Eingabe und Ausgabe von Daten im Zusammenhang mit anderen Einheiten, die mit dem Datenverarbeitungssystem 100 verbunden sein können. Die Eingabe/Ausgabe-Einheit 112 kann zum Beispiel eine Verbindung für eine Benutzereingabe über eine Tastatur, eine Maus und/oder eine andere geeignete Eingabeeinheit bereitstellen. Die Eingabe/Ausgabe-Einheit 112 kann des Weiteren eine Ausgabe an einen Drucker senden. Die Anzeige 114 stellt einen Mechanismus zum Anzeigen von Informationen für einen Benutzer bereit.
  • Befehle für das Betriebssystem, für Anwendungen und/oder Programme können in den Speichereinheiten 116 enthalten sein, die über die Datenübertragungsstruktur 102 mit der Verarbeitungseinheit 104 Daten austauschen. Bei diesen veranschaulichenden Beispielen liegen die Befehle in einer funktionalen Form in dem permanenten Speicher 108 vor. Diese Befehle können in den Speicher 106 geladen werden, um von der Verarbeitungseinheit 104 ausgeführt zu werden. Die Prozesse der verschiedenen Ausführungsformen können unter Verwendung von auf einem Computer ausgeführten Befehlen, die in einen Speicher wie beispielsweise den Speicher 106 geladen werden können, von der Verarbeitungseinheit 104 durchgeführt werden.
  • Diese Befehle werden als Programmcode, durch einen Computer nutzbarer Programmcode oder durch einen Computer lesbarer Programmcode bezeichnet, der von einem Prozessor in der Prozessoreinheit 104 gelesen und ausgeführt werden kann. Der Programmcode in den verschiedenen Ausführungsformen kann in unterschiedlichen physischen computerlesbaren Medien wie beispielsweise dem Speicher 106 oder dem permanenten Speicher 108 ausgeführt werden.
  • Der Programmcode 118 befindet sich in funktionaler Form in den computerlesbaren Medien 120, die selektiv austauschbar sind und in ein Datenverarbeitungssystem 110 geladen oder übertragen werden können, um von der Verarbeitungseinheit 104 ausgeführt zu werden. Der Programmcode 118 und die computerlesbaren Medien 120 bilden in diesen Beispielen das Computerprogrammprodukt 122. Bei einem Beispiel können die computerlesbaren Medien 120 in physischer Form vorliegen, beispielsweise als eine optische oder magnetische Platte, die in ein Laufwerk oder eine andere Einheit eingelegt oder eingesetzt wird, das bzw. die Teil des permanenten Speichers 108 ist, um in eine Speichereinheit wie beispielsweise eine Festplatte übertragen zu werden, die Teil des permanenten Speichers 108 ist. In physischer Form können die computerlesbaren Medien 120 auch die Form eines permanenten Speichers wie beispielsweise einer Festplatte, eines Thumbdrive oder eines Flash-Speichers aufweisen, der mit dem Datenverarbeitungssystem 100 verbunden ist. Die physische Form der computerlesbaren Medien 120 wird auch als computerbeschreibbare Speichermedien bezeichnet. In einigen Fällen sind die computerlesbaren Medien 120 unter Umständen nicht austauschbar.
  • Alternativ kann der Programmcode 118 von den computerlesbaren Medien 120 über eine Datenübertragungsverbindung zu der Datenübertragungseinheit 110 und/oder durch eine Verbindung mit der Eingabe/Ausgabe-Einheit 112 zum Datenverarbeitungssystem 100 übertragen werden. Die Datenübertragungsverbindung und/oder die Verbindung kann bzw. können in den veranschaulichenden Beispielen physisch oder drahtlos sein. Die computerlesbaren Medien können auch die Form nichtphysischer Medien wie beispielsweise Datenübertragungsverbindungen oder drahtlose Übertragungen mit Programmcode aufweisen.
  • Bei einigen veranschaulichenden Ausführungsformen kann der Programmcode 118 über ein Netzwerk in den permanenten Speicher 108 von einer anderen Einheit oder einem anderen Datenverarbeitungssystem für die Nutzung in dem Datenverarbeitungssystem 100 heruntergeladen werden. In einem computerlesbaren Speichermedium in einem Server-Datenverarbeitungssystem gespeicherter Programmcode kann zum Beispiel über ein Netzwerk von dem Server in das Datenverarbeitungssystem 100 heruntergeladen werden. Bei dem Datenverarbeitungssystem, das den Programmcode 118 bereitstellt, kann es sich um einen Server-Computer, einen Client-Computer oder eine andere Einheit handeln, die den Programmcode 118 speichern und übermitteln kann.
  • Bei den verschiedenen für das Datenverarbeitungssystem 100 veranschaulichten Komponenten sind keine architektonischen Beschränkungen hinsichtlich der Art und Weise beabsichtigt, in der verschiedene Ausführungsformen umgesetzt werden können. Die verschiedenen veranschaulichenden Ausführungsformen können in einem Datenverarbeitungssystem umgesetzt werden, das Komponenten beinhaltet, die zusätzlich zu den für das Datenverarbeitungssystem 100 veranschaulichten Komponenten hinzukommen oder diese ersetzen. Andere in 1 gezeigte Komponenten können sich von den dargestellten veranschaulichenden Beispielen unterscheiden. Die verschiedenen Ausführungsformen können unter Verwendung einer beliebigen Hardware-Einheit oder eines beliebigen Hardware-Systems umgesetzt werden, die bzw. das Programmcode ausführen kann. Das Datenverarbeitungssystem kann zum Beispiel organische Komponenten beinhalten, die mit anorganischen Komponenten kombiniert sein können, und/oder das System kann vollständig aus organischen Komponenten bestehen, wobei menschliche organische Komponenten ausgeschlossen sind. Eine Speichereinheit kann zum Beispiel aus einem organischen Halbleiter bestehen.
  • In einem weiteren Beispiel handelt es sich bei der Speichereinheit in dem Datenverarbeitungssystem 100 um eine beliebige Hardware-Vorrichtung, die Daten speichern kann. Der Speicher 106, der permanente Speicher 108 und die computerlesbaren Medien 120 stellen Beispiele für Speichereinheiten in physischer Form dar.
  • In einem anderen Beispiel kann ein Bussystem zur Umsetzung der Datenübertragungsstruktur 102 verwendet werden und aus einem oder mehreren Bussen wie beispielsweise einem Systembus oder einem Eingabe/Ausgabe-Bus bestehen. Das Bussystem kann selbstverständlich unter Verwendung einer beliebigen geeigneten Architektur ausgeführt werden, die eine Übertragung von Daten zwischen verschiedenen mit dem Bussystem verbundenen Komponenten oder Einheiten bereitstellt. Eine Datenübertragungseinheit kann darüber hinaus eine oder mehrere Einheiten wie ein Modem oder ein Netzwerkadapter beinhalten, die zum Übertragen und Empfangen von Daten verwendet werden. Ein Speicher kann zum Beispiel weiterhin der Speicher 106 oder ein Cachespeicher sein, wie beispielsweise in einem Schnittstellen- und Speichercontroller-Hub, der in der Datenübertragungsstruktur 102 enthalten sein kann.
  • Bei dem Speicher 108 kann es sich um ein Dateisystem handeln, das durch hierarchisches Speichermanagement gesteuert wird. Das hierarchische Speichermanagement (HSM) ist eine Datenspeichertechnik, bei der automatisch Daten zwischen kostenintensiven und kostengünstigen Speichermedien verschoben werden. HSM-Systeme gibt es deshalb, weil schnelle Speichereinheiten wie Festplattenlaufwerk-Arrays und Halbleiterdatenträger teurer (pro gespeichertem Byte) sind als langsamere Einheiten wie optische Platten- und Magnetbandlaufwerke. Es wäre zwar ideal, wenn alle Daten jederzeit auf schnellen Einheiten zur Verfügung stünden, für viele Organisationen ist dies jedoch viel zu teuer. Stattdessen speichern HSM-Systeme den Großteil der Unternehmensdaten auf langsameren Einheiten und kopieren die Daten dann bei Bedarf automatisch auf schnellere Plattenlaufwerke oder sogar Halbleiterdatenträger. HSM macht aus den schnellen Plattenlaufwerken im Grunde Cachespeicher für die langsameren Massenspeichereinheiten. Das HSM-System überwacht die Art und Weise, wie die Daten verwendet werden und beurteilt, welche Daten sicher in langsamere Einheiten verschoben werden können und welche Daten auf den schnellen Einheiten bleiben sollten.
  • Bei einem typischen HSM-Szenario werden häufig verwendete Datendateien auf Plattenlaufwerken oder Halbleiterdatenträgern gespeichert, schließlich jedoch auf ein Bandmedium verlagert, wenn sie während eines bestimmten Zeitraums, üblicherweise ein paar Monate, nicht verwendet werden. Dateien in der schnellsten Stufe werden als ”residente” Dateien bezeichnet. Wenn ein Benutzer auf eine Datei zugreift, die sich nur auf einem Band befindet, wird die Datei automatisch zurück auf die schnellste Stufe oder den residenten Speicher verschoben. Der Vorteil dabei ist, dass die Gesamtmenge an gespeicherten Daten viel größer sein kann als die verfügbare Plattenspeicherkapazität, da sich jedoch nur selten benutzte Dateien auf Band befinden, bemerken die meisten Benutzer eine Verlangsamung nicht. HSM-Systeme können auch verfügbare Bandbreite verwenden, um Daten auf ein Band vorzuverlagern. Wenn Daten vorverlagert werden, gibt es Kopien der Daten sowohl in dem Speicher der schnellsten Stufe als auch auf dem Band. Der Vorteil der Vorverlagerung besteht darin, dass die verfügbare Speichernetzwerkbandbreite genutzt wird, um Daten auf die langsamere Stufe wie beispielsweise ein Band zu kopieren, bevor der dringende Bedarf nach mehr verfügbarem Platz entsteht. Dadurch sind Daten vor möglichem Verlust besser gesichert, und die zur vollständigen Verlagerung unveränderter, residenter Dateien benötigte Zeit wird verkürzt.
  • 2 stellt grundlegende Elemente in einem Dateisystem gemäß einer veranschaulichenden Ausführungsform dar. Ein typisches Dateisystem wie das dargestellte System beinhaltet die Verzeichnisbaumstruktur 210, die Inode-Datei 220 und die Datendatei 240 mit dem Datenblock 242. Ein ”Verzeichnis” ist eine Steuerstruktur, die einen Namen einem Datensatz zuordnet, der durch einen Inode dargestellt wird. Ein ”Inode” ist eine Datenstruktur, die die Attribute der Datei sowie eine Reihe von Zeigern auf Bereiche einer Platte oder anderer Speichermedien beinhaltet, die die Daten enthalten, aus denen die Datei besteht. Indirekte Blöcke können den Inode mit zusätzlichen Zeigern versehen, zum Beispiel für sehr große Dateien.
  • Die Verzeichnisbaumstruktur, die Inode-Datei und die Daten sind üblicherweise selbst als Dateien in einem Dateisystem enthalten. Wie zum Beispiel in 2 gezeigt, weist die Inode-Datei 220 eine Ansammlung von einzelnen Datensätzen oder Einträgen 230 auf. In dem dargestellten Beispiel gibt es pro Dateisystem nur eine Inode-Datei; es sind jedoch Fälle denkbar, bei denen das Dateisystem mehrere Inode-Dateien aufweist. Die Einträge in die Verzeichnisbaumstruktur 210 beinhalten ein Namenfeld 216 und eine Inode-Nummer 217.
  • Um eine Datei als Verzeichnis zu kennzeichnen, können spezielle Einträge verwendet werden. Ein Verzeichnis ist eine spezielle Datei, in der die Namen der gespeicherten Dateien in einer beliebig tiefen Verzeichnisbaumstruktur verwaltet werden. Eine Verzeichnisbaumstruktur ist eine Verzeichnissammlung, die alle Verzeichnisse in dem Dateisystem enthält. Ein Verzeichnis ist ein spezifischer Dateityp, der ein Element in der Verzeichnisbaumstruktur ist. Ein Verzeichnis ist eine Ansammlung von Zeigern auf Knoten, die entweder Dateien oder Verzeichnisse sind, die eine niedrigere Position in der Verzeichnisbaumstruktur innehaben. Ein Verzeichniseintrag ist ein einzelner Datensatz in einem Verzeichnis, der auf eine Datendatei oder ein Verzeichnis zeigt.
  • In 2 enthält eine beispielhafte Verzeichnisbaumstruktur wie dargestellt Elemente der Form 215. 2 veranschaulicht zwar eine Hierarchie mit nur zwei Ebenen (aus Gründen der Zweckmäßigkeit), es versteht sich jedoch, dass die Tiefe der hierarchischen Baumstruktur eines Verzeichnisses nicht auf zwei Ebenen beschränkt ist. Tatsächlich können für sehr große Dateisysteme Dutzende oder sogar Hunderte von Ebenen in einer Verzeichnisbaumstruktur vorhanden sein. Die Tiefe der Verzeichnisbaumstruktur macht allerdings mehrere, sequenzielle Verzeichnisverweise erforderlich, wenn nur eine Datei identifiziert werden muss oder wenn nur auf eine Datei zugegriffen werden muss. Auf alle Fälle werden die ”Blätter” der Verzeichnisbaumstruktur verwendet, um einen Dateinamen 216 einem Eintrag 230 in der Inode-Datei 220 zuzuordnen. Der Verweis befindet sich bei ”mode-Nummer” 217, die einen Zeiger oder einen Hinweis in die Inode-Datei 220 bereitstellt.
  • Die Verzeichnisbaumstruktur 210 stellt einen hierarchischen Namensbereich für das Dateisystem dadurch bereit, dass es im Gegensatz zu einem Verweis durch eine Inode-Nummer einen Verweis auf einzelne Dateieinträge durch den Dateinamen und einen Pfad durch den Baum ermöglicht. Jeder Eintrag in einem Verzeichnis zeigt auf einen Inode. Dieser Inode kann selbst ein anderes Verzeichnis oder eine Datendatei sein. Der Eintrag in dem Feld 217 verweist auf den Inode-Eintrag 230. Der Inode-Dateieintrag 230 in der Inode-Datei 220 kann als eine lineare Liste ausgeführt werden. Jeder Eintrag in der Liste kann eine Vielzahl von Feldern beinhalten: die Inode-Nummer 231, die Erzeugungsnummer 232, die individuellen Dateiattribute 233, den Datenzeiger 234, das Datum der letzten Änderung 235, das Datum des letzten Zugriffs 236, das Datum der letzten Metadaten-Änderung 237, das Anzeigefeld zum Anzeigen, ob der Inode ein Verzeichnis oder eine Datendatei 238 darstellt, eine Anzeige, ob Attribute wiederhergestellt werden 239 und eine Anzeige, ob Daten wiederhergestellt werden 240.
  • Der Datenzeiger 234 zeigt auf den Datenblock 250, der die Daten 252 enthält. In einem durch hierarchisches Speichermanagement (HSM) verwalteten Dateisystem kann die Datendatei 252 auf der schnellsten Stufe wie beispielsweise dem Halbleiterspeicher oder dem Festplattenlaufwerkspeicher resident sein oder in eine langsamere Stufe wie beispielsweise ein Band in einem Bandspeicher verlagert oder dort archiviert werden. Wenn eine Datei daher von einer höheren Stufe zu einer niedrigeren Stufe oder umgekehrt verschoben wird, ändert das HSM-Dateisystem den Datenzeiger 234 und die Dateiattribute 233, um den Verlagerungsstatus anzuzeigen.
  • In einem HSM-Dateisystem können Daten, die zu Dateien gehören, auf die selten zugegriffen wird, von teuren Online-Plattenspeichern in weniger teure Nearline- oder Offline-Bandspeicher verlagert werden. Die Dateiattribute, die den Namen (Verzeichniseintrag), die Größe, die Zugriffssteuerung usw. beinhalten, bleiben immer online; nur die Daten oder ein Teil der Daten wird offline verschoben. In dem in 2 dargestellten Beispiel blieben die Verzeichnisbaumstruktur 210 und die Inode-Datei 220 demnach online, während der Datenblock 250 im Offline-Speicher sein kann.
  • Um Daten vor Verlust zu schützen, wird eine Sicherungskopie aller Dateidaten benötigt. Wenn Dateidaten offline verlagert wurden, ist es teuer, diese Daten für Sicherungszwecke wieder aufzurufen. Für durch HSM verwaltete Dateisysteme sind daher andere Techniken erforderlich. Eine Technik zum Sichern und Wiederherstellen eines HSM-Dateisystems besteht darin, Daten in diese weniger teuren Speicher der zweiten Stufe online vorzuverlagern und dann eine Metadaten-Abbildsicherung durchzuführen, die ein schnelles Wiederherstellen sehr großer Dateisysteme ermöglicht. Eine Metadaten-Abbildsicherung erfasst die Metadaten der Online-Datei (d. h. Verzeichnisbaumstruktur und Inode-Datei), einschließlich der Verweise auf die Offline-Dateidaten, die von dem HSM-Dateisystem verwaltet werden. Die entsprechende ”Metadaten-Abbildwiederherstellung” stellt die Datei-Metadaten schnell wieder her, wobei alle Dateidaten offline auf der zweiten Stufe des HSM-Dateisystems bleiben. Alle Online-Dateien in dem durch HSM verwalteten Dateisystem müssen für die sehr schnelle ”Metadaten-Abbildwiederherstellung” vorverlagert werden, damit die Dateidaten bei Bedarf wieder aufgerufen werden können. Der Vorverlagerungsschritt muss abgeschlossen sein, bevor die Metadaten-Abbildsicherung durchgeführt wird.
  • In einer Archivierungsspeichereinheit wie dem IBM Information Archive ist das Dateisystem ein durch HSM verwaltetes Dateisystem mit zwei Stufen. Während der Verwendung schreibt der Endbenutzer Dateien in die Einheit. Wenn das Schreiben abgeschlossen ist, hat der Benutzer die Wahl, die Daten ”festzuschreiben”, um sicherzustellen, dass die Daten zuverlässig gespeichert und als unveränderlich gekennzeichnet werden, wodurch weitere Änderungen an den Dateidaten selbst verhindert werden. Die Einheit verarbeitet später die ”festgeschriebenen” Dateien, indem sie sie auf die zweite Speicherstufe vorverlagert oder verlagert. Eine typische in einer solchen Einheit zur Wiederherstellung nach einem Absturz durchgeführte Datensicherung erzeugt zum Beispiel ein Zeitpunkt-Abbild des Dateisystems und muss alle Dateien beinhalten, in denen der Benutzer die Daten festgeschrieben hat.
  • Das System behält die Dateiinhalte bei, indem die Datei als ”unveränderlich” gekennzeichnet wird, wobei zu diesem Zweck ein Bit in den Inode wie beispielsweise in die Attribute 233 gesetzt wird. Sobald dieses Bit gesetzt ist, können die Dateidaten nicht mehr geändert oder gelöscht werden. Bei dem Ansatz der Metadaten-Abbildsicherung muss jede Datei, die geschützt werden muss, von einem HSM oder einer Datenverwaltungsprogrammierschnittstellen(DMAPI)-Anwendung verwaltet und vorverlagert oder vollständig verlagert werden; andernfalls sind die Dateidaten unter Umständen nicht mehr über das Metadaten-Abbildwiederherstellungsverfahren abrufbar. In großen und stark beanspruchten Dateisystemen sind einige als residente Dateien bekannte Dateien noch nicht vorverlagert oder verlagert und müssen durch ein alternatives Mittel gesichert werden, um einen Datenverlust zu verhindern. In einem solchen System kann es daher Dateien geben, die als unveränderlich gekennzeichnet sind, die aber immer noch in einem Speicher der ersten Stufe resident sind. Diese Dateien sind von dem HSM/DMAPI noch nicht verlagert worden. Bei diesen Dateien werden nur der Inode und die Metadaten mittels Metadaten-Abbildsicherung und Metadaten-Abbildwiederherstellung gesichert und wiederhergestellt, wobei die Dateidaten ungeschützt sind. Diese Dateien müssen somit durch einen anderen Mechanismus geschützt werden.
  • Gemäß veranschaulichenden Ausführungsformen wird ein Mechanismus zum Verwenden einer Mischform von Metadaten-Abbildsicherung und herkömmlicher Sicherung für teilweise aufgenommene Dateien bereitgestellt. Der Mechanismus sichert die gesamte Dateisammlung in einem großen und stark beanspruchten Dateisystem leistungsfähig zum Schutz vor Datenverlust. Der Mechanismus verwendet ein Änderungsüberwachungsprotokoll, um eine Liste von residenten Dateien festzulegen, die seit der letzten Sicherung hinzugefügt oder geändert worden sind, und ergreift spezielle Maßnahmen für diejenigen Dateien, die aufgrund ihres residenten Status nicht für eine einfache Metadaten-Abbildsicherung in Frage gekommen sind. Der Mechanismus ermöglicht es ferner, dass Daten für unveränderliche Dateien durch einen herkömmlichen Sicherungs-/Archiv-Wiederherstellungsprozess wiederhergestellt werden.
  • Der Mechanismus der veranschaulichenden Ausführungsformen erkennt unveränderliche, residente Dateien während der Metadaten-Abbildwiederherstellung und setzt ihr unveränderliches Bit in den Attributen 233 zurück, um eine Wiederherstellung der Datenblöcke dieser Datei zu ermöglichen. Zu dem Erkennungsmechanismus gehört ein Datenaustausch mit der HSM/DMAPI-Anwendung, um zu ermitteln, ob die Daten wirklich von der HSM-Anwendung verwaltet werden. Wenn die Daten nicht von der HSM-Anwendung verwaltet werden, setzt der Mechanismus das unveränderliche Bit zurück, um eine Wiederherstellung der Datenblöcke der Datei zu ermöglichen. Bei Dateigrößen von 0 Byte muss achtgegeben werden, da diese gegebenenfalls nicht von dem HSM bearbeitet werden, und nur die Metadaten-Abbildwiederherstellung eine gültige und vollständige Wiederherstellung dieser Dateien darstellt.
  • Ein externer Datenschutzmechanismus für unveränderliche residente Dateien bewirkt das Wiederherstellen der Daten und das Setzen des unveränderlichen Bits als Teil der Dateiattribute. Der externe Datenschutzmechanismus muss von dem Unveränderlichkeitsaspekt Kenntnis haben, um ein Wiederherstellen des unveränderlichen Bits vor den Daten zu vermeiden. Dies stellt auch ein Schlüsselelement dar, um sicherzustellen, dass der Wiederherstellungsprozess die Unveränderlichkeit der Daten beibehält, um die Einhaltung der Konformitätsregeln der Archivierungseinheit zu gewährleisten.
  • 3 ist ein Blockschaubild, das ein hybrides Metadaten-Abbildsicherungs-/Wiederherstellungs- und herkömmliches Sicherungs/Archivierungssystem gemäß einer veranschaulichenden Ausführungsform darstellt. Der Client 310 für hierarchisches Speichermanagement (HSM) ist über eine direkte Verbindung, ein Netzwerk, ein Speicherbereichsnetzwerk (SAN) oder eine Struktur oder Ähnliches mit dem durch HSM verwalteten Dateisystem 320 verbunden. Der HSM-Client 310 greift auf Dateien in dem durch HSM verwalteten Dateisystem 320 zu, indem er Dateien anlegt, liest, ändert, schreibt und löscht.
  • Das durch HSM verwaltete Dateisystem 320 speichert die Dateien, auf die zuletzt und/oder am häufigsten zugegriffen wurde, auf der Stufe 1 332, die gewöhnlich der teurere, jedoch schnellere Speicher ist. Bei der Stufe 1 332 kann es sich zum Beispiel um einen Festplattenlaufwerkspeicher handeln, da diese Einheiten einen schnellen Zugriff auf die Dateidaten bereitstellen. Das durch HSM verwaltete Dateisystem 320 speichert die Metadaten der Datei wie die Verzeichnisbaumstruktur und die Inode-Datei im Speicher (nicht dargestellt) und/oder auf der Stufe 1 332.
  • Das durch HSM verwaltete Dateisystem verschiebt Daten, die zu Dateien gehören, auf die selten zugegriffen wird, von der Stufe 1 332 auf die Stufe 2 334, bei der es sich üblicherweise um den weniger teuren, jedoch langsameren Speicher handelt. Bei der Stufe 2 334 kann es sich zum Beispiel um einen Bandspeicher handeln. Allgemein werden Dateidaten auf der Stufe 1 332 als ”resident” oder ”online” bezeichnet, während Dateidaten auf der Stufe 2 334 als ”offline” bezeichnet werden.
  • Das in 3 dargestellte Beispiel zeigt zwar zwei Stufen, ein Dateisystem mit hierarchischem Speichermanagement kann jedoch mehr Stufen aufweisen. Die Stufe 1 332 kann zum Beispiel auf Speichermedien oder Halbleiterdatenträgern beruhend sein. Ein Halbleiterdatenträger (SSD, solid-state disk), manchmal auch als Halbleiterplatte oder elektronische Platte bezeichnet, ist eine Datenspeichereinheit, die einen Halbleiterspeicher verwendet, um permanente Daten mit der Absicht zu speichern, Zugriff auf dieselbe Weise wie bei einem herkömmlichen Block-E/A-Festplattenlaufwerk bereitzustellen. Halbleiterdatenträger unterscheiden sich von herkömmlichen Magnetplatten wie Festplattenlaufwerken (HDD, hard disk drive) oder Disketten, bei denen es sich um elektromechanische Einheiten mit sich drehenden Platten und beweglichen Lese/Schreib-Köpfen handelt. Halbleiterdatenträger dagegen verwenden Mikrochips, die Daten in nichtflüchtigen Speicherschaltungen speichern und keine beweglichen Teile beinhalten. Im Vergleich zu elektromechanischen Festplattenlaufwerken sind Halbleiterdatenträger üblicherweise weniger anfällig gegen physische Stöße, sie sind leise, weisen eine kürzere Zugriffszeit und Latenzzeit auf, sind jedoch pro Gigabyte (GB) teurer. Halbleiterdatenträger verwenden die gleiche Schnittstelle wie Festplattenlaufwerke und ersetzen diese dadurch problemlos in den meisten Anwendungen. Bei der Stufe 2 334 kann es sich um einen Festplattenspeicher und bei einer dritten Stufe um einen Band laufwerkspeicher handeln. Die oberste Stufe mit den schnellsten Speichereinheiten fungiert generell als Cachespeicher für die unteren Stufen. Alle Dateidaten in der obersten Stufe gelten als ”online”, während alle Dateidaten in den unteren Stufen als ”nearline” oder ”offline” gelten.
  • Die Stufe 2 334 weist einen ”Plattenpool” für die HSM-Daten auf, der als ”Nearline”-Speicher bezeichnet wird, da er nicht ”online” im Dateisystem ist, jedoch auch nicht ganz in den Bandspeicher verschoben wurde. Daten veralten gewöhnlich in einem Plattenpool, bevor sie in einem Bandspeicher festgeschrieben werden.
  • Die veranschaulichenden Ausführungsformen definieren das Sicherungs-Metadaten-Abbild als die Verzeichnisstruktur des Dateisystems (für den Namensbereich) und die Metadaten für die Dateien in dem Dateisystem wie Eigentümer, Zugriffszeit, Dateigröße usw. enthaltend. Jede Datei beinhaltet ferner ihre Berechtigungen, die häufig als ihre Zugriffssteuerungsliste (ACL, access control list) bezeichnet wird, sowie die erweiterten Attribute, die zum Lokalisieren der Dateidaten in der Offline-Sicherung erforderlich sind. Es handelt sich dabei um die Mindestmenge an Daten, die wiederhergestellt werden muss, um ein durch HSM verwaltetes Dateisystem wiederherzustellen.
  • Gemäß der veranschaulichenden Ausführungsform erzeugt der HSM-Client 310 eine Momentaufnahme des durch HSM verwalteten Dateisystems 320 und führt anschließend eine Metadaten-Abbildsicherung über das HSM-Sicherungssystem 325 aus, um die oben beschriebenen Metadaten zu sichern (z. B. die Verzeichnisstruktur und die Dateiattribute). Gleichzeitig mit der Metadaten-Abbildsicherung beginnt der HSM-Client 310 einen Prozess, um residente Dateien zu identifizieren, deren Daten noch nicht offline kopiert wurden und die daher nicht in der Metadaten-Abbildsicherung geschützt sind. Der HSM-Client 310 leitet diese Liste an ein herkömmliches Sicherungssystem 326 weiter, das die identifizierten residenten Dateien unter Verwendung einer herkömmlichen Sicherungs-/Archivierungstechnik sichert.
  • Um das durch HSM verwaltete Dateisystem 320 zum Beispiel nach einem katastrophalen Ausfall wiederherzustellen, führt der HSM-Client 310 eine Metadaten-Abbildwiederherstellung über das HSM-Sicherungssystem 325 durch, um das Dateisystembild (z. B. die Verzeichnisstruktur und die Dateiattribute) wiederherzustellen. Der Prozess der Metadaten-Abbildwiederherstellung erkennt, wenn er eine Datei nicht in dem richtigen durch DMAPI verlagerten Status wiederherstellen kann. Das Wiederherstellen einer Datei kann zum Beispiel fehlschlagen, wenn ihre erweiterten Attribute nicht eine eindeutige Kennung enthalten, die auf einen Offline-Speicher zeigt. Wenn ein solches Fehlschlagen erkannt wird, muss die Datei zum Zeitpunkt der Metadaten-Abbildsicherung resident gewesen sein und möglicherweise auch unveränderlich. Der Wiederherstellungsprozess für diese residenten Dateien muss das unveränderliche Bit in den Attributen der Datei ändern und damit dafür sorgen, dass die Dateidaten geschrieben werden können, um eine Wiederherstellung der Dateidaten zu ermöglichen. Das herkömmliche Sicherungssystem 326 stellt die Dateien wieder her, die als resident erkannt wurden.
  • Bei einer beispielhaften Ausführungsform ermöglicht der Sicherungs-/Wiederherstellungsmechanismus das Wiederherstellen unveränderlicher Dateien durch eine externe Datenschutzlösung, indem eine Programmierschnittstelle (API, application programming interface) bereitgestellt wird, die den Status des unveränderlichen Bits nicht wiederherstellt, wenn der Wiederherstellungsprozess den Rest der Attribute wiederherstellt, bis die Datei von dem Wiederherstellungsprozess geschlossen wird. Das unveränderliche Bit würde bei einem Prozess- oder Systemabsturz implizit zurückgesetzt werden.
  • Für den Fachmann ist ersichtlich, dass die vorliegende Erfindung als System, Verfahren oder Computerprogrammprodukt ausgeführt werden kann. Aspekte der vorliegenden Erfindung können daher die Form einer kompletten Hardware-Ausführung, einer kompletten Software-Ausführung (einschließlich Firmware, residenter Software, Mikrocode usw.) oder eine Ausführungsform haben, bei der Hardware- und Software-Aspekte kombiniert sind, die allgemein hier als ”Schaltung”, ”Modul” oder ”System” bezeichnet werden können. Aspekte der vorliegenden Erfindung können des Weiteren die Form eines Computerprogrammprodukts haben, das in einem oder mehreren computerlesbaren Medien ausgeführt ist, die über einen darin enthaltenen computerlesbaren Programmcode verfügen.
  • Eine beliebige Kombination von einem computerlesbaren Medium oder mehreren computerlesbaren Medien kann bzw. können verwendet werden. Das computerlesbare Medium kann ein computerlesbares Signalmedium oder ein computerlesbares Speichermedium sein. Bei einem computerlesbaren Speichermedium kann es sich zum Beispiel unter anderem um ein elektronisches, magnetisches, optisches, elektromagnetisches, Infrarot- oder Halbleitersystem, eine solche Vorrichtung oder Einheit oder eine geeignete Kombination davon handeln. Zu genaueren Beispielen (einer nicht vollständigen Liste) für das computerlesbare Speichermedium gehören wie folgt: eine elektrische Verbindung mit einer oder mehreren Leitungen, ein tragbarer Computer-Diskettenspeicher, eine Festplatte, ein Direktzugriffsspeicher (RAM), ein Nur-Lese-Speicher (ROM), ein löschbarer, programmierbarer Nur-Lese-Speicher (EPROM oder Flash-Speicher), ein Lichtwellenleiter, ein tragbarer Compact-Disc-Nur-Lese-Speicher (CD-ROM), eine optische Speichereinheit, eine magnetische Speichereinheit oder eine geeignete Kombination davon. Im Zusammenhang mit diesem Dokument kann ein computerlesbares Speichermedium ein physisches Medium sein, das ein Programm enthalten oder speichern kann, welches von oder in Verbindung mit einem System, einer Vorrichtung oder Einheit zum Ausführen von Befehlen verwendet wird.
  • Ein computerlesbares Signalmedium kann ein weitergeleitetes Datensignal mit darin enthaltenem computerlesbarem Programmcode aufweisen, zum Beispiel in einem Basisband oder als Teil einer Trägerwelle. Ein solches weitergeleitetes Signal kann eine Vielfalt von Formen haben, einschließlich elektromagnetische, optische Formen oder eine geeignete Kombination davon, ohne darauf beschränkt zu sein. Ein computerlesbares Signalmedium kann ein beliebiges computerlesbares Medium sein, das kein computerlesbares Speichermedium ist und das ein Programm zur Verwendung durch oder in Verbindung mit einem System, einer Vorrichtung oder Einheit zum Ausführen von Befehlen übertragen, weitergegeben oder transportieren kann.
  • In einem computerlesbaren Medium enthaltener Programmcode kann unter Verwendung eines geeigneten Mediums übermittelt werden, das unter anderem drahtlos, drahtgebunden, Lichtwellenleiterkabel, Hochfrequenz (HF) usw. oder eine geeignete Kombination davon sein kann.
  • Der Computerprogrammcode zum Ausführen der perationen in Verbindung mit Aspekten der vorliegenden Erfindung kann in einer beliebigen Kombination von einer oder mehreren Programmiersprachen geschrieben werden, zu denen eine objektorientierte Programmiersprache wie beispielsweise JavaTM SmalltalkTM, C++ oder ähnliche sowie herkömmliche prozedurale Programmiersprachen wie beispielsweise die Programmiersprache ”C” oder ähnliche Programmiersprachen gehören. Der Programmcode kann ganz auf dem Computer des Benutzers, teilweise auf dem Computer des Benutzers, als eigenständiges Software-Paket, teilweise auf dem Computer des Benutzers und teilweise auf einem entfernt angeordneten Computer oder ganz auf dem entfernt angeordneten Computer oder Server ausgeführt werden. Im letztgenannten Szenario kann der entfernt angeordnete Computer über ein beliebiges Netz mit dem Computer des Benutzers verbunden sein, zum Beispiel über ein lokales Netz (LAN) oder ein Weitverkehrsnetz (WAN), oder es kann die Verbindung zu einem externen Computer hergestellt werden (beispielsweise über das Internet durch einen Internetdienstanbieter).
  • Aspekte der vorliegenden Erfindung werden untenstehend unter Bezugnahme auf Ablaufplandarstellungen und/oder Blockschaubilder von Verfahren, Vorrichtungen (Systemen) und Computerprogrammprodukten gemäß bevorzugter Ausführungsformen der Erfindung beschrieben. Es versteht sich, dass jeder Block der Ablaufplandarstellungen und/oder Blockschaubilder sowie Kombinationen von Blöcken in den Ablaufplandarstellungen und/oder Blockschaubildern durch Computerprogrammbefehle umgesetzt werden können. Diese Computerprogrammbefehle können einem Prozessor eines Universalrechners, Spezialrechners oder einer anderen programmierbaren Datenverarbeitungsvorrichtung bereitgestellt werden, um eine Maschine zu bilden, so dass die Befehle, die über den Prozessor des Computers oder der anderen programmierbaren Datenverarbeitungsvorrichtung ausgeführt werden, ein Mittel erzeugen, um die in dem Block oder den Blöcken des Ablaufplans und/oder des Blockschaubilds festgelegten Funktionen/Maßnahmen umzusetzen.
  • Diese Computerprogrammbefehle können auch in einem computerlesbaren Medium gespeichert werden, das einen Computer, eine andere programmierbare Datenverarbeitungsvorrichtung oder andere Einheiten steuern kann, um auf eine bestimmte Weise zu funktionieren, so dass die in dem computerlesbaren Medium gespeicherten Befehle ein Herstellungsprodukt einschließlich der Befehle erzeugen, die die in dem Block oder den Blöcken des Ablaufplans und/oder des Blockschaubilds festgelegte Funktion/Maßnahme umsetzen.
  • Die Computerprogrammbefehle können ferner in einen Computer, eine andere programmierbare Datenverarbeitungsvorrichtung oder andere Einheiten geladen werden, um eine Reihe von Betriebsschritten auszulösen, die auf dem Computer, in der anderen programmierbaren Vorrichtung oder den anderen Einheiten durchgeführt werden, um einen auf einem Computer implementierten Prozess zu erzeugen, so dass die Befehle, die auf dem Computer oder in der anderen programmierbaren Vorrichtung ausgeführt werden, Prozesse bereitstellen, um die in dem Block oder den Blöcken des Ablaufplans und/oder des Blockschaubilds festgelegten Funktionen/Maßnahmen umzusetzen.
  • 4 ist ein Ablaufplan, der die Funktionsweise eines hybriden Metadaten-Abbildsicherungs-/Wiederherstellungs- und herkömmlichen Sicherungs-/Archivierungssystems gemäß einer veranschaulichenden Ausführungsform darstellt. Die Operation beginnt in Block 400, und das System macht eine Momentaufnahme des Dateisystems, um ein übereinstimmendes Zeitpunkt-Abbild des Dateisystems sicherzustellen (Block 401), von dem eine Sicherung gemacht wird. Das System startet die Metadaten-Abbildsicherung des Dateisystems (Block 402), um Verzeichnis, Inode, Metadaten (Zugriffssteuerungslisten und erweiterte Attribute) zu erfassen. Es sei darauf hingewiesen, dass das System keine Datenblöcke erfasst, da davon ausgegangen wird, dass sich diese bereits in dem HSM-Pool befinden (Offline-Speicher).
  • Gleichzeitig mit der Metadaten-Abbildsicherung in den Blöcken 401 und 402 identifiziert das System eine Liste mit residenten Dateien (Block 403). Bei diesen Dateien werden die Daten nicht in den Offline-Speicher gespeichert. Zusätzlich kann bei einigen der residenten Dateien das unveränderliche Bit gesetzt sein, bei anderen jedoch nicht. Die genannte Liste kann durch leistungsstarkes Abtasten der Inodes des Dateisystems oder mit Hilfe eines Überprüfungssystems ermittelt werden, das Dateiaktualisierungsaktivitäten verfolgt. Das System optimiert die Liste, damit nur solche Daten gesichert werden, die vollständig in das Archivsystem übertragen wurden und abgeschlossen sind (Block 404). Wenn eine Datei zum Beispiel aktiv ist, wenn die Momentaufnahme in Block 401 gemacht wird, sichert das System sie nicht. Es kann ferner wünschenswert sein, nur residente Dateien zu sichern, bei denen ein unveränderliches Bit gesetzt ist. Bei einer beispielhaften Ausführungsform kann das System die Liste der residenten Dateien mit der Spezifizierung von Richtlinienattributen optimieren, um die Dateiauswahl zu unterstützen. Das System leitet die optimierte Liste der residenten Dateien zu einem herkömmlichen Sicherungssystem weiter, um einen vollständigen Schutz des gesamten Dateisystems und seiner Daten sicherzustellen (Block 405).
  • Wenn anschließend die gesamte Metadaten-Abbildsicherung und die Sicherung der residenten Dateien abgeschlossen sind, endet die Operation in Block 406.
  • 5 ist ein Ablaufplan, der die Funktionsweise eines hybriden Metadaten-Abbildwiederherstellungs- und herkömmlichen Wiederherstellungssystems gemäß einer veranschaulichenden Ausführungsform darstellt. Die Operation beginnt in Block 500, und das System stellt das Metadaten-Abbild des Dateisystems wieder her (Block 501). Bei diesem Verfahren zur Metadaten-Abbildwiederherstellung werden die Metadaten der Datei für durch DMAPI verwaltete Dateien sowie residente Dateien wiederhergestellt.
  • Damit residente Dateien wiederhergestellt werden können, muss das System erkennen, wenn es eine solche Datei in einem verlagerten durch DMAPI verwalteten Status nicht wiederherstellen kann. Das System ermittelt in Block 502, ob eine solche Datei in dem residenten Status wiederhergestellt wurde. Das System erkennt diesen Fall, wenn die Metadaten der Datei keine eindeutige Kennung aufweisen, die auf ihren Offline-Speicher zeigen. Wenn dies nicht erkannt wird, ermittelt das System als Nächstes, ob die Wiederherstellung abgeschlossen ist (Block 503). Wenn die Wiederherstellung abgeschlossen ist, endet die Operation in Block 504. Wenn die Wiederherstellung nicht abgeschlossen ist, kehrt die Operation zu Block 501 zurück, um die Wiederherstellung des Metadaten-Abbildes des Dateisystems fortzusetzen.
  • Wenn das System erkennt, dass eine residente Datei in Block 502 wiederhergestellt wurde, prüft das System den Status des unveränderlichen Bits (Block 505) und ermittelt, ob das unveränderliche Bit gesetzt ist (Block 506). Wenn das unveränderliche Bit gesetzt ist, ändert das System das unveränderliche Bit (Block 507). Danach oder wenn das unveränderliche Bit in Block 506 nicht gesetzt wurde, stellt das System die residente Datei unter Verwendung eines herkömmlichen Sicherungs/Wiederherstellungssystems wieder her (Block 508). Wenn der vorherige Status des unveränderlichen Bits gesetzt war, setzt das System das unveränderliche Bit (Block 509). Die Operation geht zu Block 503 weiter, um zu ermitteln, ob die Wiederherstellung nun abgeschlossen ist. Die Metadaten-Abbildwiederherstellung und Wiederherstellung der unveränderlichen Dateidaten kann gleichzeitig mit dem Beginn der Datenwiederherstellung durchgeführt werden, wenn eine solche Datei in dem Metadaten-Abbildwiederherstellungsstrom erkannt wird.
  • Der Ablaufplan und die Blockschaubilder in den Figuren zeigen die Architektur, Funktionalität und den Betrieb möglicher Ausführungen von Systemen, Verfahren und Computerprogrammprodukten gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung. In dieser Hinsicht kann jeder Block in dem Ablaufplan oder den Blockschaubildern ein Modul, Segment oder einen Teil eines Codes darstellen, das/der einen oder mehrere ausführbare Befehle zur Umsetzung der festgelegten Logikfunktion(en) umfasst. Es ist ferner darauf hinzuweisen, dass die im Block angegebenen Funktionen bei einigen alternativen Ausführungen in einer anderen Reihenfolge als in den Figuren dargestellt ablaufen können. Zwei aufeinanderfolgend dargestellte Blöcke können zum Beispiel tatsächlich im Wesentlichen gleichzeitig ausgeführt werden, oder die Blöcke können je nach entsprechender Funktionalität manchmal in umgekehrter Reihenfolge ausgeführt werden. Des Weiteren ist darauf hinzuweisen, dass jeder Block der Blockschaubilder und/oder der Ablaufplandarstellung sowie Kombinationen von Blöcken in den Blockschaubildern und/oder der Ablaufplandarstellung durch spezielle auf Hardware beruhende Systeme umgesetzt werden können, die die angegebenen Funktionen oder Maßnahmen durchführen, oder durch Kombinationen von speziellen Hardware- und Computerbefehlen.
  • Die veranschaulichenden Ausführungsformen stellen somit einen Mechanismus zum Verwenden einer Mischform von Metadaten-Abbildsicherung und herkömmlicher Sicherung für teilweise aufgenommene Dateien bereit. Der Mechanismus kann die gesamte Dateisammlung in einem großen und stark beanspruchten Dateisystem zum Schutz vor Datenverlust leistungsfähig sichern, insbesondere im Fall von residenten und unveränderlichen Dateien.
  • Wie oben bereits aufgeführt, ist ersichtlich, dass die bevorzugten Ausführungsformen die Form einer kompletten Hardware-Ausführung, einer kompletten Software-Ausführung oder eine Ausführungsform haben können, bei der Hardware- und Software-Elemente enthalten sind. Bei einer beispielhaften Ausführungsform sind die Mechanismen der bevorzugten Ausführungsformen in Software- oder Programmcode umgesetzt, der Firmware, residente Software, Mikrocode usw. enthält, ohne darauf beschränkt zu sein.
  • Zu geeigneten Datenverarbeitungssystemen zum Speichern und/oder Ausführen von Programmcode gehört mindestens ein Prozessor, der direkt oder indirekt über einen Systembus mit Speicherelementen verbunden ist. Zu den Speicherelementen können ein lokaler Speicher, der während der eigentlichen Ausführung des Programmcodes verwendet wird, ein Massenspeicher und Cachespeicher gehören, die ein vorübergehendes Speichern von mindestens einem Teil des Programmcodes bereitstellen, um die Häufigkeit zu verringern, mit der Code während der Ausführung aus dem Massenspeicher abgerufen werden muss.
  • Eingabe/Ausgabe- oder E/A-Einheiten (einschließlich Tastaturen, Anzeigen, Zeigegeräte usw., ohne darauf beschränkt zu sein) können entweder direkt oder über zwischengeschaltete E/A-Steuereinheiten mit dem System verbunden sein. Netzwerkadapter können ebenfalls mit dem System verbunden sein, um es dem Datenverarbeitungssystem zu ermöglichen, mit anderen Datenverarbeitungssystemen oder entfernt angeordneten Druckern oder Speichereinheiten über zwischengeschaltete private oder öffentliche Netzwerke verbunden zu werden. Modems, Kabelmodems und Ethernet-Karten sind nur einige der derzeit erhältlichen Arten von Netzwerkadaptern.
  • Die Beschreibung der vorliegenden Erfindung wurde zum Zwecke der Veranschaulichung und Beschreibung vorgestellt, soll jedoch nicht erschöpfend oder auf die Erfindung in der offenbarten Form beschränkt sein. Fachleuten sind viele Änderungen und Abwandlungen ersichtlich. Die Ausführungsform wurde ausgewählt und beschrieben, um die Grundgedanken der Erfindung und die praktische Anwendung am besten zu erläutern und um anderen Fachleuten ein Verständnis der Erfindung für verschiedene Ausführungsformen mit verschiedenen Änderungen zu ermöglichen, wie sie für die jeweils beabsichtigte Verwendung geeignet sind.

Claims (15)

  1. Computerprogrammprodukt, das ein computerlesbares Speichermedium mit einem darauf gespeicherten computerlesbaren Programm aufweist, wobei das computerlesbare Programm, wenn es in einer Datenverarbeitungseinheit ausgeführt wird, die Datenverarbeitungseinheit zu Folgendem veranlasst: Durchführen einer Metadaten-Abbildsicherung eines Dateisystems mit hierarchischem Speichermanagement (HSM), wobei die Metadaten-Abbildsicherung die Metadaten des Dateisystems sichert, um ein Zeitpunkt-Abbild des HSM-Dateisystems zu erzeugen; gleichzeitig mit dem Durchführen der Metadaten-Abbildsicherung des HSM-Dateisystems Identifizieren einer Gruppe von residenten Dateien, die noch nicht offline in dem HSM-Dateisystem gespeichert sind; Auswählen von Dateien aus der Gruppe von residenten Dateien auf der Grundlage festgelegter Kriterien, um eine optimierte Gruppe von residenten Dateien zu bilden; und Weiterleiten der optimierten Gruppe von residenten Dateien zu einem Sicherungssystem, wobei das Sicherungssystem Dateidaten für die optimierte Gruppe von residenten Dateien sichert.
  2. Computerprogrammprodukt nach Anspruch 1, wobei die Metadaten des Dateisystems eine Verzeichnisbaumstruktur und eine Inode-Datei aufweisen.
  3. Computerprogrammprodukt nach Anspruch 2, wobei die Inode-Datei eine Vielzahl von Inode-Einträgen aufweist, wobei jeder Inode-Eintrag einen Datenzeiger aufweist, der auf einen Online-Speicher oder Offline-Speicher verweist.
  4. Computerprogrammprodukt nach Anspruch 3, wobei das Identifizieren der Gruppe von residenten Dateien ein Identifizieren von Inodes mit Datenzeigern aufweist, die auf einen Online-Speicher verweisen.
  5. Computerprogrammprodukt nach Anspruch 3, wobei jeder Inode-Eintrag eine Gruppe von Attributen aufweist und wobei das Auswählen von Dateien aus der Gruppe von residenten Dateien auf der Grundlage festgelegter Kriterien ein Identifizieren von Inode-Einträgen mit einem in den Attributen gesetzten unveränderlichen Bit aufweist.
  6. Computerprogrammprodukt nach Anspruch 5, wobei das Identifizieren von unveränderlichen Dateien in der Gruppe von residenten Dateien ein Durchführen eines Abtastens von Inodes des Dateisystems aufweist, um unveränderliche Objekte zu erkennen.
  7. Computerprogrammprodukt nach Anspruch 3, wobei das Identifizieren der Gruppe von residenten Dateien ein Durchführen eines Abtastens von Inodes des Dateisystems aufweist, um residente Dateien zu erkennen.
  8. Computerprogrammprodukt nach Anspruch 1, wobei das computerlesbare Programm die Datenverarbeitungseinheit weiterhin zu Folgendem veranlasst: Durchführen einer Metadaten-Abbildwiederherstellung des HSM-Dateisystems, wobei die Metadaten-Abbildwiederherstellung das Zeitpunkt-Abbild des HSM-Dateisystems wiederherstellt; und als Reaktion auf das Erkennen, dass ein verlagerter verwalteter Status einer Datei nicht wiederherzustellen ist, Rücksetzen eines unveränderlichen Bits der Datei, Wiederherstellen der Dateidaten für die Datei unter Verwendung des Sicherungssystems und Setzen des unveränderlichen Bits der Datei.
  9. Computerprogrammprodukt nach Anspruch 8, wobei das Wiederherstellen von Dateidaten für die Datei unter Verwendung des Sicherungssystems gleichzeitig mit dem Durchführen eines Wiederaufrufs von verlagerten Dateien durchgeführt wird.
  10. Computerprogrammprodukt nach Anspruch 1, wobei das computerlesbare Programm die Datenverarbeitungseinheit weiterhin zu Folgendem veranlasst: Durchführen einer Metadaten-Abbildwiederherstellung des HSM-Dateisystems, wobei die Metadaten-Abbildwiederherstellung das Zeitpunkt-Abbild des HSM-Dateisystems wiederherstellt und die Unveränderlichkeit aller Dateien in dem HSM-Dateisystem beibehält.
  11. Computerprogrammprodukt nach Anspruch 1, wobei das Identifizieren der Gruppe von residenten Dateien ein Identifizieren der Gruppe von residenten Dateien über ein Überprüfungssystem aufweist, das Dateiaktualisierungsaktivitäten verfolgt.
  12. Computerprogrammprodukt nach Anspruch 1, wobei das computerlesbare Programm in einem computerlesbaren Speichermedium in einem Datenverarbeitungssystem gespeichert ist und wobei das computerlesbare Programm über ein Netzwerk von einem entfernt angeordneten Datenverarbeitungssystem heruntergeladen wurde.
  13. Computerprogrammprodukt nach Anspruch 1, wobei das computerlesbare Programm in einem computerlesbaren Speichermedium in einem Server-Datenverarbeitungssystem gespeichert ist und wobei das computerlesbare Programm über ein Netzwerk in ein entfernt angeordnetes Datenverarbeitungssystem heruntergeladen wird, um in einem computerlesbaren Speichermedium in dem entfernt angeordneten System verwendet zu werden.
  14. Verfahren in einem Datenverarbeitungssystem zur hybriden Metadaten-Abbildsicherung und Sicherung, wobei das Verfahren aufweist: Durchführen einer Metadaten-Abbildsicherung eines Dateisystems mit hierarchischem Speichermanagement (HSM), wobei die Metadaten-Abbildsicherung die Metadaten des Dateisystems sichert, um ein Zeitpunkt-Abbild des HSM-Dateisystems zu erzeugen; gleichzeitig mit dem Durchführen der Metadaten-Abbildsicherung des HSM-Dateisystems Identifizieren einer Gruppe von residenten Dateien, die nicht offline in dem HSM-Dateisystem gespeichert sind; Auswählen von Dateien in der Gruppe von residenten Dateien auf der Grundlage festgelegter Kriterien, um eine optimierte Gruppe von residenten Dateien zu bilden; und Weiterleiten der optimierten Gruppe von residenten Dateien zu einem Sicherungssystem, wobei das Sicherungssystem die Dateidaten für die optimierte Gruppe von residenten Dateien sichert.
  15. Vorrichtung, aufweisend: einen Prozessor; und einen Speicher, der mit dem Prozessor verbunden ist, wobei der Speicher Befehle aufweist, die, wenn sie von dem Prozessor ausgeführt werden, den Prozessor zu Folgendem veranlassen: Durchführen einer Metadaten-Abbildsicherung eines Dateisystems mit hierarchischem Speichermanagement (HSM), wobei die Metadaten-Abbildsicherung die Metadaten des Dateisystems sichert, um ein Zeitpunkt-Abbild des HSM-Dateisystems zu erzeugen; gleichzeitig mit dem Durchführen der Metadaten-Abbildsicherung des HSM-Dateisystems Identifizieren einer Gruppe von residenten Dateien, die nicht offline in dem HSM-Dateisystem gespeichert sind; Auswählen von Dateien aus der Gruppe von residenten Dateien auf der Grundlage festgelegter Kriterien, um eine optimierte Gruppe von residenten Dateien zu bilden; und Weiterleiten der optimierten Gruppe von residenten Dateien zu einem Sicherungssystem, wobei das Sicherungssystem Dateidaten für die optimierte Gruppe von residenten Dateien sichert.
DE102013204972.2A 2012-04-04 2013-03-21 Hybride Sicherung und Wiederherstellung eines sehr grossen Dateisystems unter Verwendung von Metadaten-Abbildsicherung und herkömmlicher Sicherung Active DE102013204972B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/439,535 US8639665B2 (en) 2012-04-04 2012-04-04 Hybrid backup and restore of very large file system using metadata image backup and traditional backup
US13/439,535 2012-04-04

Publications (2)

Publication Number Publication Date
DE102013204972A1 true DE102013204972A1 (de) 2013-10-10
DE102013204972B4 DE102013204972B4 (de) 2019-01-24

Family

ID=48048640

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102013204972.2A Active DE102013204972B4 (de) 2012-04-04 2013-03-21 Hybride Sicherung und Wiederherstellung eines sehr grossen Dateisystems unter Verwendung von Metadaten-Abbildsicherung und herkömmlicher Sicherung

Country Status (4)

Country Link
US (1) US8639665B2 (de)
CN (1) CN103365744B (de)
DE (1) DE102013204972B4 (de)
GB (1) GB2502403B (de)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101472016B1 (ko) * 2013-02-25 2014-12-15 삼성전자주식회사 이미지 파일에 추가 데이터가 삽입된 복합파일 생성방법 및 상기 복합파일이 기록된 데이터 저장장치
US9262313B2 (en) 2013-03-14 2016-02-16 Microsoft Technology Licensing, Llc Provisioning in heterogenic volume of multiple tiers
US9141626B2 (en) 2013-03-14 2015-09-22 Microsoft Technology Licensing, Llc Volume having tiers of different storage traits
US9524300B2 (en) * 2013-03-14 2016-12-20 Microsoft Technology Licensing, Llc Heterogenic volume generation and use system
US9116904B2 (en) * 2013-03-14 2015-08-25 Microsoft Technology Licensing, Llc File system operation on multi-tiered volume
US10091293B2 (en) * 2013-11-07 2018-10-02 Vmware, Inc. Rapid cloud-based image centralization
US10169164B1 (en) * 2013-12-27 2019-01-01 EMC IP Holding Company LLC Backups using application maps
GB2527296A (en) 2014-06-16 2015-12-23 Ibm A method for restoring data in a HSM system
GB2529436B (en) 2014-08-20 2016-05-18 Ibm Grouping file system events to perform continuous file system monitoring and backup
GB2531295A (en) 2014-10-15 2016-04-20 Ibm A data block based backup method
US9733866B2 (en) 2015-01-28 2017-08-15 International Business Machines Corporation Dynamic drive selection for migration of files based on file size for a data storage system
CN104731905A (zh) * 2015-03-24 2015-06-24 浪潮集团有限公司 一种精简存储池缩容方法
US10802928B2 (en) * 2015-09-10 2020-10-13 International Business Machines Corporation Backup and restoration of file system
US9965361B2 (en) 2015-10-29 2018-05-08 International Business Machines Corporation Avoiding inode number conflict during metadata restoration
US10713215B2 (en) 2015-11-13 2020-07-14 International Business Machines Corporation Allocating non-conflicting inode numbers
US10133761B2 (en) * 2015-12-02 2018-11-20 Quantum Corporation Metadump spatial database system
EP3198493A4 (de) 2015-12-03 2017-08-09 Huawei Technologies Co., Ltd. Verfahren einer quellspeichervorrichtung zum senden einer quelldatei und einer klondatei der quelldatei zur einer backupspeichervorrichtung, quellspeichervorrichtung und backupspeichervorrichtung
US10114702B2 (en) * 2016-01-06 2018-10-30 International Business Machines Corporation Method and system to discover and manage distributed applications in virtualization environments
US9858427B2 (en) * 2016-02-26 2018-01-02 International Business Machines Corporation End-to-end encryption and backup in data protection environments
US9501364B1 (en) * 2016-03-18 2016-11-22 Storagecraft Technology Corporation Hybrid image backup of a source storage
CN108733507B (zh) * 2017-04-17 2021-10-08 伊姆西Ip控股有限责任公司 文件备份和恢复的方法和设备
US10545913B1 (en) 2017-04-30 2020-01-28 EMC IP Holding Company LLC Data storage system with on-demand recovery of file import metadata during file system migration
US10896156B2 (en) 2017-07-26 2021-01-19 Quantum Corporation Flexible synchronous file system replication
US10417215B2 (en) 2017-09-29 2019-09-17 Hewlett Packard Enterprise Development Lp Data storage over immutable and mutable data stages
US11150992B2 (en) 2018-08-21 2021-10-19 International Business Machines Corporation File entity relationship management and source product backup
CN111104377B (zh) * 2018-10-26 2023-09-12 伊姆西Ip控股有限责任公司 文件管理的方法、电子设备和计算机可读存储介质
CN110209527B (zh) * 2018-11-30 2023-05-05 腾讯科技(深圳)有限公司 数据恢复方法、装置、服务器以及存储介质
US11204892B2 (en) * 2019-03-21 2021-12-21 Microsoft Technology Licensing, Llc Techniques for snapshotting scalable multitier storage structures
US11423151B2 (en) 2019-05-31 2022-08-23 Microsoft Technology Licensing, Llc Systems and methods for managing data storage cluster synchronization
CN110795284B (zh) * 2019-10-25 2022-03-22 浪潮电子信息产业股份有限公司 一种数据恢复方法、装置、设备及可读存储介质
CN112052118B (zh) * 2020-08-20 2022-08-23 厦门市美亚柏科信息股份有限公司 一种GlobalFs删除文件恢复方法和系统
US11620198B2 (en) * 2021-06-03 2023-04-04 International Business Machines Corporation Exchanging extended attributes between different cluster sites in a clustered filesystem environment
CN113342751B (zh) * 2021-07-30 2021-11-09 联想凌拓科技有限公司 元数据处理方法、装置、设备和可读存储介质
CN115292051B (zh) * 2022-09-26 2023-01-03 城云科技(中国)有限公司 一种gpu资源pod的热迁移方法、装置及应用

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6000020A (en) 1997-04-01 1999-12-07 Gadzoox Networks, Inc. Hierarchical storage management from a mirrored file system on a storage network segmented by a bridge
US6154852A (en) 1998-06-10 2000-11-28 International Business Machines Corporation Method and apparatus for data backup and recovery
US6505216B1 (en) 1999-10-01 2003-01-07 Emc Corporation Methods and apparatus for backing-up and restoring files using multiple trails
US6981005B1 (en) * 2000-08-24 2005-12-27 Microsoft Corporation Partial migration of an object to another storage location in a computer system
US6804719B1 (en) * 2000-08-24 2004-10-12 Microsoft Corporation Method and system for relocating files that are partially stored in remote storage
US20040139125A1 (en) 2001-06-05 2004-07-15 Roger Strassburg Snapshot copy of data volume during data access
US20030177149A1 (en) 2002-03-18 2003-09-18 Coombs David Lawrence System and method for data backup
CA2384020A1 (en) 2002-05-09 2003-11-09 Jacek Misztal Apparatus and method for fast backup and restore or large file systems
US7234077B2 (en) 2003-06-24 2007-06-19 International Business Machines Corporation Rapid restoration of file system usage in very large file systems
CA2433254A1 (en) 2003-06-25 2004-12-25 Ibm Canada Limited - Ibm Canada Limitee System and method for warm shutdown and restart of a buffer pool
US7165059B1 (en) * 2003-12-23 2007-01-16 Veritas Operating Corporation Partial file migration mechanism
JP4426280B2 (ja) 2003-12-25 2010-03-03 株式会社日立製作所 バックアップ/リストアシステム及び方法
US7103740B1 (en) 2003-12-31 2006-09-05 Veritas Operating Corporation Backup mechanism for a multi-class file system
US8825591B1 (en) * 2003-12-31 2014-09-02 Symantec Operating Corporation Dynamic storage mechanism
US7197520B1 (en) * 2004-04-14 2007-03-27 Veritas Operating Corporation Two-tier backup mechanism
US8055622B1 (en) * 2004-11-30 2011-11-08 Symantec Operating Corporation Immutable data containers in tiered storage hierarchies
US7620843B2 (en) 2005-03-02 2009-11-17 International Business Machines Corporation Rebuilding a storage system
US7680830B1 (en) * 2005-05-31 2010-03-16 Symantec Operating Corporation System and method for policy-based data lifecycle management
CN102117233B (zh) 2005-06-24 2013-07-17 信科索尔特公司 用于高性能企业数据保护的系统和方法
US7398365B1 (en) 2005-07-13 2008-07-08 Symantec Corporation Restoring data with reduced suspension-of-access periods
US8229897B2 (en) * 2006-02-03 2012-07-24 International Business Machines Corporation Restoring a file to its proper storage tier in an information lifecycle management environment
US20070185936A1 (en) * 2006-02-07 2007-08-09 Derk David G Managing deletions in backup sets
WO2007103289A2 (en) 2006-03-03 2007-09-13 Computer Associates Think, Inc. System and method for data backup and recovery
US8065273B2 (en) 2006-05-10 2011-11-22 Emc Corporation Automated priority restores
US7992036B2 (en) 2007-01-22 2011-08-02 International Business Machines Corporation Apparatus, system, and method for volume-level restoration of cluster server data
US8055864B2 (en) 2007-08-06 2011-11-08 International Business Machines Corporation Efficient hierarchical storage management of a file system with snapshots
US7788234B2 (en) 2007-08-23 2010-08-31 Microsoft Corporation Staged, lightweight backup system
US7953945B2 (en) * 2008-03-27 2011-05-31 International Business Machines Corporation System and method for providing a backup/restore interface for third party HSM clients
US8392370B1 (en) * 2008-03-28 2013-03-05 Emc Corporation Managing data on data storage systems
US8200638B1 (en) * 2008-04-30 2012-06-12 Netapp, Inc. Individual file restore from block-level incremental backups by using client-server backup protocol
US8126847B1 (en) 2008-04-30 2012-02-28 Network Appliance, Inc. Single file restore from image backup by using an independent block list for each file
US8190836B1 (en) * 2008-04-30 2012-05-29 Network Appliance, Inc. Saving multiple snapshots without duplicating common blocks to protect the entire contents of a volume
US8170990B2 (en) * 2008-05-30 2012-05-01 Hitachi, Ltd. Integrated remote replication in hierarchical storage systems
CN101446966A (zh) * 2008-12-31 2009-06-03 中国建设银行股份有限公司 数据存储方法及系统
JP2010191647A (ja) 2009-02-18 2010-09-02 Hitachi Ltd ファイル共有システム、ファイルサーバ、ファイル管理方法
WO2010129921A1 (en) 2009-05-08 2010-11-11 Powerfile, Inc. Accessing, compressing, and tracking media stored in an optical disc storage system
CN102576293B (zh) * 2009-09-08 2015-08-26 国际商业机器公司 固态存储设备和分层存储系统中的数据管理
US8204863B2 (en) 2009-12-21 2012-06-19 International Business Machines Corporation Multi-phase file system restore with selective on-demand data availability
CA2783370C (en) 2009-12-31 2016-03-15 Commvault Systems, Inc. Systems and methods for performing data management operations using snapshots
WO2011145132A1 (en) * 2010-05-17 2011-11-24 Hitachi,Ltd. Computing system and data management method
US8856073B2 (en) * 2010-12-14 2014-10-07 Hitachi, Ltd. Data synchronization among file storages using stub files

Also Published As

Publication number Publication date
DE102013204972B4 (de) 2019-01-24
GB2502403A (en) 2013-11-27
CN103365744B (zh) 2015-12-23
GB2502403B (en) 2014-09-24
CN103365744A (zh) 2013-10-23
GB201302917D0 (en) 2013-04-03
US20130268493A1 (en) 2013-10-10
US8639665B2 (en) 2014-01-28

Similar Documents

Publication Publication Date Title
DE102013204972B4 (de) Hybride Sicherung und Wiederherstellung eines sehr grossen Dateisystems unter Verwendung von Metadaten-Abbildsicherung und herkömmlicher Sicherung
CN104040481B (zh) 用于融合、存储和检索增量式备份数据的方法和系统
DE60213867T2 (de) Vorrichtung zur verwaltung von datenreplikation
DE102018002899A1 (de) Verwalten von Digitalassets, die als Komponenten und gepackte Dateien gespeichert sind
DE102007015385A1 (de) Verfahren und Vorrichtung zur Wiedergewinnung von Speicherplatz in Speichern
WO2015090668A1 (de) Posix-kompatibles dateisystem, verfahren zum erzeugen einer dateiliste und speichervorrichtung
DE102018214013A1 (de) Automatische kontinuierliche Prüfpunktsetzung
DE202009019149U1 (de) Asynchron verteilte Speicherbereinigung für replizierte Speichercluster
DE112017000190T5 (de) Durchgehende Verschlüsselung und Backup in Datenschutzumgebungen
DE112011101793T5 (de) Gemeinsame Datennutzung bei Dateiklonen
DE112013000900B4 (de) Bewahren von Redundanz in Datendeduplizierungssystemen unter Verwendung eines Anzeigers
DE112017005868T5 (de) Verwaltung von e/a-abläufen für datenobjekte in einem speichersystem
DE112010003577T5 (de) Datenverwaltung in Halbleiterspeicher-Einheiten und mehrstufigen Speichersystemen
DE102016103769A1 (de) Inkrementelle Replikation eines Quellen-Datasets
DE10211606A1 (de) Datenverarbeitungseinrichtung
DE102012208141A1 (de) Ausgleich nachlassender Funktionsfähigkeit
DE112013003340T5 (de) Einfrieren von virtuellen Sofortkopien auf mehreren Datenträgern
DE602004007925T2 (de) Verwalten einer beziehung zwischen einem zielvolumen und einem quellenvolumen
DE112013000650T5 (de) Datenzwischenspeicherungsbereich
DE102014116393A1 (de) Verfahren und System für ein sicheres Archivieren von Daten
DE112015000222T5 (de) Zusammenführen von mehreren Zeitpunktkopien zu einer zusammengeführten Zeitpunktkopie
DE112018003585T5 (de) Deduplizierung eines bandlaufwerkspeichers
DE112019000849T5 (de) Hostorientierter Aktualisierungsschreibvorgang
DE102021102442A1 (de) Katalog der mit schnappschüssen verbundenen dateien
DE112019005311T5 (de) Serverlose lösung zur optimierung von objektversionierung

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R006 Appeal filed
R007 Decision rectified on appeal
R018 Grant decision by examination section/examining division
R084 Declaration of willingness to licence
R020 Patent grant now final