-
HINTERGRUND
-
Die vorliegende Anwendung bezieht sich allgemein auf eine verbesserte Datenverarbeitungsvorrichtung und ein verbessertes Datenverarbeitungsverfahren und insbesondere auf Mechanismen zur hybriden Sicherung und Wiederherstellung eines sehr großen Dateisystems unter Verwendung von Metadaten-Abbildsicherung und herkömmlicher Sicherung.
-
Ein Dateisystem ist eine Software-Komponente, die eine festgelegte Gruppe von Speichereinheiten verwaltet und auf eine Weise Zugriff auf Daten bereitstellt, die ein einheitliches Hinzufügen, Ändern und Löschen von Daten und Dateien erleichtert. Der Begriff wird auch verwendet, um den Daten- und Metadatensatz zu beschreiben, der in einer bestimmten Gruppe von Speichereinheiten enthalten ist. Eine Datei ist eine benannte Bitfolge, auf die eine Computeranwendung zugreifen kann. Eine Datei weist bestimmte Standardattribute wie beispielsweise Länge, Änderungszeitpunkt und Zeitpunkt des letzten Zugriffs auf. Metadaten sind Daten, die Informationen über einen oder mehrere Datenaspekte wie beispielsweise Zeitpunkt und Datum des Anlegens, Anleger oder Autor, Speicherort und Ähnliches bereitstellen.
-
Das Aufkommen von Speichernetzwerk(SAN)-Dateisystemen und kostengünstigen Speichern hat dazu geführt, dass sehr große Dateisysteme mit einer sehr großen Anzahl von Dateien möglich sind. Unglücklicherweise ist die Zeit, die zur vollständigen Wiederherstellung von Dateisystemen von einer Sicherungskopie benötigt wird, proportional zur Größe des Dateisystems. Der Kunde hat die Wahl, Dateien von besonderem Interesse zuerst manuell wiederherzustellen und den Zugriff auf das Dateisystem mit einem nur unvollständig wiederhergestellten Datensatz zu erlauben oder den Zugriff zu verzögern, bis alle Daten wiederhergestellt sind. Bei der ersten Option muss der Administrator genau die Daten angeben, auf die zugegriffen werden soll, da Anwendungen, die auf nicht wiederhergestellte Daten zugreifen, fehlschlagen. Bei der zweiten Option muss die Wiederaufnahme des Geschäftsbetriebs verschoben werden, bis alle Dateien wiederhergestellt sind.
-
KURZDARSTELLUNG
-
Bei einer veranschaulichenden Ausführungsform wird ein Verfahren zur hybriden Metadaten-Abbildsicherung und herkömmlichen Sicherung in einem Datenverarbeitungssystem bereitgestellt. Das Verfahren weist auf, dass eine Metadaten-Abbildsicherung eines Dateisystems durchgeführt wird, das durch hierarchisches Speichermanagement (HSM) gesteuert wird. Die Metadaten-Abbildsicherung sichert die Metadaten des Dateisystems, um ein Zeitpunkt-Abbild der Struktur des durch HSM gesteuerten Dateisystems zu erzeugen. Das Verfahren weist weiterhin auf, dass gleichzeitig mit dem Durchführen der Metadaten-Abbildsicherung des HSM-Dateisystems eine Gruppe von residenten Dateien identifiziert wird, die noch nicht offline in dem HSM-Dateisystem gespeichert sind. Das Verfahren weist ferner ein Identifizieren von unveränderlichen Dateien in der Gruppe von residenten Dateien auf, um eine optimierte Gruppe von residenten Dateien zu bilden, sowie ein Weiterleiten der optimierten Gruppe von residenten Dateien zu einem herkömmlichen Sicherungssystem, wobei das herkömmliche Sicherungssystem Dateidaten nur für die Gruppe von residenten Dateien sichert.
-
Bei anderen veranschaulichenden Ausführungsformen wird ein Computerprogrammprodukt bereitgestellt, das ein durch einen Computer nutzbares oder lesbares Medium mit einem computerlesbaren Programm aufweist. Wenn das computerlesbare Programm in einer Datenverarbeitungseinheit ausgeführt wird, veranlasst es die Datenverarbeitungseinheit, verschiedene einzelne und Kombinationen der oben genannten Operationen in Bezug auf das Verfahren der veranschaulichenden Ausführungsform durchzuführen.
-
Bei einer noch weiteren veranschaulichenden Ausführungsform wird ein System/eine Vorrichtung bereitgestellt. Das System/die Vorrichtung kann einen oder mehrere Prozessoren und einen Speicher aufweisen, der mit dem einen oder den mehreren Prozessoren verbunden ist. Der Speicher kann Befehle aufweisen, die, wenn sie von dem einen oder den mehreren Prozessoren ausgeführt werden, den einen oder die mehreren Prozessoren veranlassen, verschiedene einzelne und Kombinationen der oben genannten Operationen in Bezug auf das Verfahren der veranschaulichenden Ausführungsform durchzuführen.
-
Diese und andere Merkmale und Vorteile der vorliegenden Erfindung werden anhand der nachfolgenden ausführlichen Beschreibung der beispielhaften Ausführungsformen der vorliegenden Erfindung dargestellt oder erschließen sich dem Fachmann.
-
KURZE BESCHREIBUNG DER VERSCHIEDENEN ANSICHTEN DER ZEICHNUNGEN
-
Die Erfindung sowie ein bevorzugter Verwendungsmodus und weitere Ziele und Vorteile davon ergeben sich anhand der folgenden ausführlichen Beschreibung veranschaulichender Ausführungsformen, die in Verbindung mit den beigefügten Zeichnungen zu lesen sind, wobei:
-
1 ein Blockschaltbild eines Datenverarbeitungssystems zeigt, in dem veranschaulichende Ausführungsformen umgesetzt werden können;
-
2 grundlegende Elemente in einem Dateisystem gemäß einer veranschaulichenden Ausführungsform darstellt;
-
3 ein Blockschaubild ist, das ein hybrides Metadaten-Abbildsicherungs-/Wiederherstellungs- und herkömmliches Sicherungs-/Archivierungssystem gemäß einer veranschaulichenden Ausführungsform darstellt;
-
4 ein Ablaufplan ist, der die Funktionsweise eines hybriden Metadaten-Abbildsicherungs-/Wiederherstellungs- und herkömmlichen Sicherungs-/Archivierungssystems gemäß einer veranschaulichenden Ausführungsform darstellt; und
-
5 ein Ablaufplan ist, der die Funktionsweise eines hybriden Metadaten-Abbildwiederherstellungs- und herkömmlichen Wiederherstellungssystems gemäß einer veranschaulichenden Ausführungsform darstellt.
-
AUSFÜHRLICHE BESCHREIBUNG
-
Eine Metadaten-Abbildsicherung ist ein Mittel zum Erfassen der organisationsbezogenen Informationen eines Dateisystems wie diese in Metadaten in einem einheitlichen einzelnen Abbild gespeichert sind, das verwendet werden kann, um den gesamten Namensbereich des Dateisystems einschließlich Verzeichnisnamen und Dateinamen wiederherzustellen. Die Metadaten-Abbildsicherung kann Objektnamen, Zugriffssteuerungslisten, erweiterte Attribute, Eigentümer, Gruppe und Modus-Informationen über jedes Dateisystemobjekt enthalten. Die Metadaten-Abbildsicherung enthält nicht die jedem Objekt zugeordneten Daten. Es wird vielmehr erwartet, dass das HSM-System die meisten oder alle Daten für die Objekte des Dateisystems speichert und dafür verwendet werden kann, diese wieder abzurufen, nachdem zuerst das Abbild der Metadaten wiederhergestellt wurde.
-
Die veranschaulichenden Ausführungsformen stellen einen Mechanismus zum Verwenden einer Mischform einer Metadaten-Abbildsicherung und einer herkömmlichen Sicherung für Dateien bereit. Der Mechanismus kann die Gesamtheit der Dateien in einem großen und stark beanspruchten Dateisystem zum Schutz vor Datenverlust leistungsfähig sichern. Das Verwenden eines Änderungsüberwachungsprotokolls zum Erstellen einer Liste von unvollständigen Dateien und/oder gesicherten Abbildern ermöglicht es dem Mechanismus, spezielle Maßnahmen für diejenigen Dateien in dem Dateisystem zu ergreifen, die nicht für eine einfache Metadaten-Abbildsicherung in Frage gekommen sind. Es gibt einen Sonderfall zum Wiederherstellen von unveränderlichen Dateien, damit Daten durch einen herkömmlichen Sicherungs-/Archivierungswiederherstellungsprozess wiederhergestellt werden können.
-
Die veranschaulichenden Ausführungsformen können für viele verschiedene Arten von Datenverarbeitungsumgebungen verwendet werden. Um einen Kontext für die Beschreibung der spezifischen Elemente und der Funktionalität der veranschaulichenden Ausführungsformen bereitzustellen, wird im Folgenden 1 als eine beispielhafte Umgebung vorgestellt, in der Aspekte der veranschaulichenden Ausführungsformen umgesetzt werden können. Es ist offensichtlich, dass 1 nur ein Beispiel ist und keine Beschränkung der Umgebungen darstellen oder nahelegen soll, in denen Aspekte oder Ausführungsformen der vorliegenden Erfindung umgesetzt werden können. An den dargestellten Umgebungen können viele Änderungen vorgenommen werden, ohne vom Erfindungsgedanken und Schutzumfang der vorliegenden Erfindung abzuweichen.
-
1 zeigt ein Blockschaltbild eines Datenverarbeitungssystems, in dem veranschaulichende Ausführungsformen umgesetzt werden können. Das Datenverarbeitungssystem 100 ist ein Beispiel eines Computers, in dem durch einen Computer nutzbarer Code oder Befehle zum Ausführen der Prozesse für die veranschaulichenden Ausführungsformen enthalten sein können. In diesem veranschaulichenden Beispiel beinhaltet das Datenverarbeitungssystem 100 die Datenübertragungsstruktur 102, die Datenübertragungen zwischen der Verarbeitungseinheit 104, dem Speicher 106, dem permanenten Speicher 108, der Datenübertragungseinheit 110, der Eingabe/Ausgabe(E/A)-Einheit 112 und der Anzeige 114 bereitstellt.
-
Die Verarbeitungseinheit 104 dient dazu, Befehle für Software auszuführen, die in den Speicher 106 geladen werden kann. Bei der Verarbeitungseinheit 104 kann es sich je nach spezieller Ausführung um eine Gruppe von einem oder mehreren Prozessoren oder einen Multiprozessorkern handeln. Die Verarbeitungseinheit 104 kann des Weiteren unter Verwendung eines oder mehrerer heterogener Prozessorsysteme ausgeführt werden, in denen ein Hauptprozessor mit sekundären Prozessoren auf einem einzelnen Chip enthalten ist. Bei einem weiteren veranschaulichenden Beispiel kann die Verarbeitungseinheit 104 ein symmetrisches Multiprozessorsystem mit mehreren Prozessoren desselben Typs sein.
-
Der Speicher 106 und der permanente Speicher 108 sind Beispiele für die Speichereinheiten 116. Eine Speichereinheit ist ein beliebiges Hardware-Element, das Informationen wie beispielsweise Daten, Programmcode in funktionaler Form und/oder andere geeignete Informationen vorübergehend und/oder permanent speichern kann, ohne darauf beschränkt zu sein. Der Speicher 106 kann in diesen Beispielen zum Beispiel ein Direktzugriffsspeicher oder eine beliebige andere geeignete flüchtige oder nichtflüchtige Speichereinheit sein. Der permanente Speicher 108 kann je nach spezieller Ausführung verschiedene Formen aufweisen. Der permanente Speicher 108 kann zum Beispiel eine oder mehrere Komponenten oder Einheiten beinhalten. Der permanente Speicher 108 kann zum Beispiel eine Festplatte, ein Flash-Speicher, eine wiederbeschreibbare optische Platte, ein wiederbeschreibbares Magnetband oder eine Kombination des Vorgenannten sein. Die von dem permanenten Speicher 108 verwendeten Medien können auch austauschbar sein. Für den permanenten Speicher 108 kann zum Beispiel eine austauschbare Festplatte verwendet werden.
-
Die Datenübertragungseinheit 110 stellt in diesen Beispielen Datenübertragungen mit anderen Datenverarbeitungssystemen oder Einheiten bereit. In diesen Beispielen ist die Datenübertragungseinheit 110 eine Netzwerkschnittstellenkarte. Die Datenübertragungseinheit 110 kann Datenübertragungen über physische und/oder drahtlose Datenübertragungsverbindungen bereitstellen.
-
Die Eingabe/Ausgabe-Einheit 112 ermöglicht die Eingabe und Ausgabe von Daten im Zusammenhang mit anderen Einheiten, die mit dem Datenverarbeitungssystem 100 verbunden sein können. Die Eingabe/Ausgabe-Einheit 112 kann zum Beispiel eine Verbindung für eine Benutzereingabe über eine Tastatur, eine Maus und/oder eine andere geeignete Eingabeeinheit bereitstellen. Die Eingabe/Ausgabe-Einheit 112 kann des Weiteren eine Ausgabe an einen Drucker senden. Die Anzeige 114 stellt einen Mechanismus zum Anzeigen von Informationen für einen Benutzer bereit.
-
Befehle für das Betriebssystem, für Anwendungen und/oder Programme können in den Speichereinheiten 116 enthalten sein, die über die Datenübertragungsstruktur 102 mit der Verarbeitungseinheit 104 Daten austauschen. Bei diesen veranschaulichenden Beispielen liegen die Befehle in einer funktionalen Form in dem permanenten Speicher 108 vor. Diese Befehle können in den Speicher 106 geladen werden, um von der Verarbeitungseinheit 104 ausgeführt zu werden. Die Prozesse der verschiedenen Ausführungsformen können unter Verwendung von auf einem Computer ausgeführten Befehlen, die in einen Speicher wie beispielsweise den Speicher 106 geladen werden können, von der Verarbeitungseinheit 104 durchgeführt werden.
-
Diese Befehle werden als Programmcode, durch einen Computer nutzbarer Programmcode oder durch einen Computer lesbarer Programmcode bezeichnet, der von einem Prozessor in der Prozessoreinheit 104 gelesen und ausgeführt werden kann. Der Programmcode in den verschiedenen Ausführungsformen kann in unterschiedlichen physischen computerlesbaren Medien wie beispielsweise dem Speicher 106 oder dem permanenten Speicher 108 ausgeführt werden.
-
Der Programmcode 118 befindet sich in funktionaler Form in den computerlesbaren Medien 120, die selektiv austauschbar sind und in ein Datenverarbeitungssystem 110 geladen oder übertragen werden können, um von der Verarbeitungseinheit 104 ausgeführt zu werden. Der Programmcode 118 und die computerlesbaren Medien 120 bilden in diesen Beispielen das Computerprogrammprodukt 122. Bei einem Beispiel können die computerlesbaren Medien 120 in physischer Form vorliegen, beispielsweise als eine optische oder magnetische Platte, die in ein Laufwerk oder eine andere Einheit eingelegt oder eingesetzt wird, das bzw. die Teil des permanenten Speichers 108 ist, um in eine Speichereinheit wie beispielsweise eine Festplatte übertragen zu werden, die Teil des permanenten Speichers 108 ist. In physischer Form können die computerlesbaren Medien 120 auch die Form eines permanenten Speichers wie beispielsweise einer Festplatte, eines Thumbdrive oder eines Flash-Speichers aufweisen, der mit dem Datenverarbeitungssystem 100 verbunden ist. Die physische Form der computerlesbaren Medien 120 wird auch als computerbeschreibbare Speichermedien bezeichnet. In einigen Fällen sind die computerlesbaren Medien 120 unter Umständen nicht austauschbar.
-
Alternativ kann der Programmcode 118 von den computerlesbaren Medien 120 über eine Datenübertragungsverbindung zu der Datenübertragungseinheit 110 und/oder durch eine Verbindung mit der Eingabe/Ausgabe-Einheit 112 zum Datenverarbeitungssystem 100 übertragen werden. Die Datenübertragungsverbindung und/oder die Verbindung kann bzw. können in den veranschaulichenden Beispielen physisch oder drahtlos sein. Die computerlesbaren Medien können auch die Form nichtphysischer Medien wie beispielsweise Datenübertragungsverbindungen oder drahtlose Übertragungen mit Programmcode aufweisen.
-
Bei einigen veranschaulichenden Ausführungsformen kann der Programmcode 118 über ein Netzwerk in den permanenten Speicher 108 von einer anderen Einheit oder einem anderen Datenverarbeitungssystem für die Nutzung in dem Datenverarbeitungssystem 100 heruntergeladen werden. In einem computerlesbaren Speichermedium in einem Server-Datenverarbeitungssystem gespeicherter Programmcode kann zum Beispiel über ein Netzwerk von dem Server in das Datenverarbeitungssystem 100 heruntergeladen werden. Bei dem Datenverarbeitungssystem, das den Programmcode 118 bereitstellt, kann es sich um einen Server-Computer, einen Client-Computer oder eine andere Einheit handeln, die den Programmcode 118 speichern und übermitteln kann.
-
Bei den verschiedenen für das Datenverarbeitungssystem 100 veranschaulichten Komponenten sind keine architektonischen Beschränkungen hinsichtlich der Art und Weise beabsichtigt, in der verschiedene Ausführungsformen umgesetzt werden können. Die verschiedenen veranschaulichenden Ausführungsformen können in einem Datenverarbeitungssystem umgesetzt werden, das Komponenten beinhaltet, die zusätzlich zu den für das Datenverarbeitungssystem 100 veranschaulichten Komponenten hinzukommen oder diese ersetzen. Andere in 1 gezeigte Komponenten können sich von den dargestellten veranschaulichenden Beispielen unterscheiden. Die verschiedenen Ausführungsformen können unter Verwendung einer beliebigen Hardware-Einheit oder eines beliebigen Hardware-Systems umgesetzt werden, die bzw. das Programmcode ausführen kann. Das Datenverarbeitungssystem kann zum Beispiel organische Komponenten beinhalten, die mit anorganischen Komponenten kombiniert sein können, und/oder das System kann vollständig aus organischen Komponenten bestehen, wobei menschliche organische Komponenten ausgeschlossen sind. Eine Speichereinheit kann zum Beispiel aus einem organischen Halbleiter bestehen.
-
In einem weiteren Beispiel handelt es sich bei der Speichereinheit in dem Datenverarbeitungssystem 100 um eine beliebige Hardware-Vorrichtung, die Daten speichern kann. Der Speicher 106, der permanente Speicher 108 und die computerlesbaren Medien 120 stellen Beispiele für Speichereinheiten in physischer Form dar.
-
In einem anderen Beispiel kann ein Bussystem zur Umsetzung der Datenübertragungsstruktur 102 verwendet werden und aus einem oder mehreren Bussen wie beispielsweise einem Systembus oder einem Eingabe/Ausgabe-Bus bestehen. Das Bussystem kann selbstverständlich unter Verwendung einer beliebigen geeigneten Architektur ausgeführt werden, die eine Übertragung von Daten zwischen verschiedenen mit dem Bussystem verbundenen Komponenten oder Einheiten bereitstellt. Eine Datenübertragungseinheit kann darüber hinaus eine oder mehrere Einheiten wie ein Modem oder ein Netzwerkadapter beinhalten, die zum Übertragen und Empfangen von Daten verwendet werden. Ein Speicher kann zum Beispiel weiterhin der Speicher 106 oder ein Cachespeicher sein, wie beispielsweise in einem Schnittstellen- und Speichercontroller-Hub, der in der Datenübertragungsstruktur 102 enthalten sein kann.
-
Bei dem Speicher 108 kann es sich um ein Dateisystem handeln, das durch hierarchisches Speichermanagement gesteuert wird. Das hierarchische Speichermanagement (HSM) ist eine Datenspeichertechnik, bei der automatisch Daten zwischen kostenintensiven und kostengünstigen Speichermedien verschoben werden. HSM-Systeme gibt es deshalb, weil schnelle Speichereinheiten wie Festplattenlaufwerk-Arrays und Halbleiterdatenträger teurer (pro gespeichertem Byte) sind als langsamere Einheiten wie optische Platten- und Magnetbandlaufwerke. Es wäre zwar ideal, wenn alle Daten jederzeit auf schnellen Einheiten zur Verfügung stünden, für viele Organisationen ist dies jedoch viel zu teuer. Stattdessen speichern HSM-Systeme den Großteil der Unternehmensdaten auf langsameren Einheiten und kopieren die Daten dann bei Bedarf automatisch auf schnellere Plattenlaufwerke oder sogar Halbleiterdatenträger. HSM macht aus den schnellen Plattenlaufwerken im Grunde Cachespeicher für die langsameren Massenspeichereinheiten. Das HSM-System überwacht die Art und Weise, wie die Daten verwendet werden und beurteilt, welche Daten sicher in langsamere Einheiten verschoben werden können und welche Daten auf den schnellen Einheiten bleiben sollten.
-
Bei einem typischen HSM-Szenario werden häufig verwendete Datendateien auf Plattenlaufwerken oder Halbleiterdatenträgern gespeichert, schließlich jedoch auf ein Bandmedium verlagert, wenn sie während eines bestimmten Zeitraums, üblicherweise ein paar Monate, nicht verwendet werden. Dateien in der schnellsten Stufe werden als ”residente” Dateien bezeichnet. Wenn ein Benutzer auf eine Datei zugreift, die sich nur auf einem Band befindet, wird die Datei automatisch zurück auf die schnellste Stufe oder den residenten Speicher verschoben. Der Vorteil dabei ist, dass die Gesamtmenge an gespeicherten Daten viel größer sein kann als die verfügbare Plattenspeicherkapazität, da sich jedoch nur selten benutzte Dateien auf Band befinden, bemerken die meisten Benutzer eine Verlangsamung nicht. HSM-Systeme können auch verfügbare Bandbreite verwenden, um Daten auf ein Band vorzuverlagern. Wenn Daten vorverlagert werden, gibt es Kopien der Daten sowohl in dem Speicher der schnellsten Stufe als auch auf dem Band. Der Vorteil der Vorverlagerung besteht darin, dass die verfügbare Speichernetzwerkbandbreite genutzt wird, um Daten auf die langsamere Stufe wie beispielsweise ein Band zu kopieren, bevor der dringende Bedarf nach mehr verfügbarem Platz entsteht. Dadurch sind Daten vor möglichem Verlust besser gesichert, und die zur vollständigen Verlagerung unveränderter, residenter Dateien benötigte Zeit wird verkürzt.
-
2 stellt grundlegende Elemente in einem Dateisystem gemäß einer veranschaulichenden Ausführungsform dar. Ein typisches Dateisystem wie das dargestellte System beinhaltet die Verzeichnisbaumstruktur 210, die Inode-Datei 220 und die Datendatei 240 mit dem Datenblock 242. Ein ”Verzeichnis” ist eine Steuerstruktur, die einen Namen einem Datensatz zuordnet, der durch einen Inode dargestellt wird. Ein ”Inode” ist eine Datenstruktur, die die Attribute der Datei sowie eine Reihe von Zeigern auf Bereiche einer Platte oder anderer Speichermedien beinhaltet, die die Daten enthalten, aus denen die Datei besteht. Indirekte Blöcke können den Inode mit zusätzlichen Zeigern versehen, zum Beispiel für sehr große Dateien.
-
Die Verzeichnisbaumstruktur, die Inode-Datei und die Daten sind üblicherweise selbst als Dateien in einem Dateisystem enthalten. Wie zum Beispiel in 2 gezeigt, weist die Inode-Datei 220 eine Ansammlung von einzelnen Datensätzen oder Einträgen 230 auf. In dem dargestellten Beispiel gibt es pro Dateisystem nur eine Inode-Datei; es sind jedoch Fälle denkbar, bei denen das Dateisystem mehrere Inode-Dateien aufweist. Die Einträge in die Verzeichnisbaumstruktur 210 beinhalten ein Namenfeld 216 und eine Inode-Nummer 217.
-
Um eine Datei als Verzeichnis zu kennzeichnen, können spezielle Einträge verwendet werden. Ein Verzeichnis ist eine spezielle Datei, in der die Namen der gespeicherten Dateien in einer beliebig tiefen Verzeichnisbaumstruktur verwaltet werden. Eine Verzeichnisbaumstruktur ist eine Verzeichnissammlung, die alle Verzeichnisse in dem Dateisystem enthält. Ein Verzeichnis ist ein spezifischer Dateityp, der ein Element in der Verzeichnisbaumstruktur ist. Ein Verzeichnis ist eine Ansammlung von Zeigern auf Knoten, die entweder Dateien oder Verzeichnisse sind, die eine niedrigere Position in der Verzeichnisbaumstruktur innehaben. Ein Verzeichniseintrag ist ein einzelner Datensatz in einem Verzeichnis, der auf eine Datendatei oder ein Verzeichnis zeigt.
-
In 2 enthält eine beispielhafte Verzeichnisbaumstruktur wie dargestellt Elemente der Form 215. 2 veranschaulicht zwar eine Hierarchie mit nur zwei Ebenen (aus Gründen der Zweckmäßigkeit), es versteht sich jedoch, dass die Tiefe der hierarchischen Baumstruktur eines Verzeichnisses nicht auf zwei Ebenen beschränkt ist. Tatsächlich können für sehr große Dateisysteme Dutzende oder sogar Hunderte von Ebenen in einer Verzeichnisbaumstruktur vorhanden sein. Die Tiefe der Verzeichnisbaumstruktur macht allerdings mehrere, sequenzielle Verzeichnisverweise erforderlich, wenn nur eine Datei identifiziert werden muss oder wenn nur auf eine Datei zugegriffen werden muss. Auf alle Fälle werden die ”Blätter” der Verzeichnisbaumstruktur verwendet, um einen Dateinamen 216 einem Eintrag 230 in der Inode-Datei 220 zuzuordnen. Der Verweis befindet sich bei ”mode-Nummer” 217, die einen Zeiger oder einen Hinweis in die Inode-Datei 220 bereitstellt.
-
Die Verzeichnisbaumstruktur 210 stellt einen hierarchischen Namensbereich für das Dateisystem dadurch bereit, dass es im Gegensatz zu einem Verweis durch eine Inode-Nummer einen Verweis auf einzelne Dateieinträge durch den Dateinamen und einen Pfad durch den Baum ermöglicht. Jeder Eintrag in einem Verzeichnis zeigt auf einen Inode. Dieser Inode kann selbst ein anderes Verzeichnis oder eine Datendatei sein. Der Eintrag in dem Feld 217 verweist auf den Inode-Eintrag 230. Der Inode-Dateieintrag 230 in der Inode-Datei 220 kann als eine lineare Liste ausgeführt werden. Jeder Eintrag in der Liste kann eine Vielzahl von Feldern beinhalten: die Inode-Nummer 231, die Erzeugungsnummer 232, die individuellen Dateiattribute 233, den Datenzeiger 234, das Datum der letzten Änderung 235, das Datum des letzten Zugriffs 236, das Datum der letzten Metadaten-Änderung 237, das Anzeigefeld zum Anzeigen, ob der Inode ein Verzeichnis oder eine Datendatei 238 darstellt, eine Anzeige, ob Attribute wiederhergestellt werden 239 und eine Anzeige, ob Daten wiederhergestellt werden 240.
-
Der Datenzeiger 234 zeigt auf den Datenblock 250, der die Daten 252 enthält. In einem durch hierarchisches Speichermanagement (HSM) verwalteten Dateisystem kann die Datendatei 252 auf der schnellsten Stufe wie beispielsweise dem Halbleiterspeicher oder dem Festplattenlaufwerkspeicher resident sein oder in eine langsamere Stufe wie beispielsweise ein Band in einem Bandspeicher verlagert oder dort archiviert werden. Wenn eine Datei daher von einer höheren Stufe zu einer niedrigeren Stufe oder umgekehrt verschoben wird, ändert das HSM-Dateisystem den Datenzeiger 234 und die Dateiattribute 233, um den Verlagerungsstatus anzuzeigen.
-
In einem HSM-Dateisystem können Daten, die zu Dateien gehören, auf die selten zugegriffen wird, von teuren Online-Plattenspeichern in weniger teure Nearline- oder Offline-Bandspeicher verlagert werden. Die Dateiattribute, die den Namen (Verzeichniseintrag), die Größe, die Zugriffssteuerung usw. beinhalten, bleiben immer online; nur die Daten oder ein Teil der Daten wird offline verschoben. In dem in 2 dargestellten Beispiel blieben die Verzeichnisbaumstruktur 210 und die Inode-Datei 220 demnach online, während der Datenblock 250 im Offline-Speicher sein kann.
-
Um Daten vor Verlust zu schützen, wird eine Sicherungskopie aller Dateidaten benötigt. Wenn Dateidaten offline verlagert wurden, ist es teuer, diese Daten für Sicherungszwecke wieder aufzurufen. Für durch HSM verwaltete Dateisysteme sind daher andere Techniken erforderlich. Eine Technik zum Sichern und Wiederherstellen eines HSM-Dateisystems besteht darin, Daten in diese weniger teuren Speicher der zweiten Stufe online vorzuverlagern und dann eine Metadaten-Abbildsicherung durchzuführen, die ein schnelles Wiederherstellen sehr großer Dateisysteme ermöglicht. Eine Metadaten-Abbildsicherung erfasst die Metadaten der Online-Datei (d. h. Verzeichnisbaumstruktur und Inode-Datei), einschließlich der Verweise auf die Offline-Dateidaten, die von dem HSM-Dateisystem verwaltet werden. Die entsprechende ”Metadaten-Abbildwiederherstellung” stellt die Datei-Metadaten schnell wieder her, wobei alle Dateidaten offline auf der zweiten Stufe des HSM-Dateisystems bleiben. Alle Online-Dateien in dem durch HSM verwalteten Dateisystem müssen für die sehr schnelle ”Metadaten-Abbildwiederherstellung” vorverlagert werden, damit die Dateidaten bei Bedarf wieder aufgerufen werden können. Der Vorverlagerungsschritt muss abgeschlossen sein, bevor die Metadaten-Abbildsicherung durchgeführt wird.
-
In einer Archivierungsspeichereinheit wie dem IBM Information Archive ist das Dateisystem ein durch HSM verwaltetes Dateisystem mit zwei Stufen. Während der Verwendung schreibt der Endbenutzer Dateien in die Einheit. Wenn das Schreiben abgeschlossen ist, hat der Benutzer die Wahl, die Daten ”festzuschreiben”, um sicherzustellen, dass die Daten zuverlässig gespeichert und als unveränderlich gekennzeichnet werden, wodurch weitere Änderungen an den Dateidaten selbst verhindert werden. Die Einheit verarbeitet später die ”festgeschriebenen” Dateien, indem sie sie auf die zweite Speicherstufe vorverlagert oder verlagert. Eine typische in einer solchen Einheit zur Wiederherstellung nach einem Absturz durchgeführte Datensicherung erzeugt zum Beispiel ein Zeitpunkt-Abbild des Dateisystems und muss alle Dateien beinhalten, in denen der Benutzer die Daten festgeschrieben hat.
-
Das System behält die Dateiinhalte bei, indem die Datei als ”unveränderlich” gekennzeichnet wird, wobei zu diesem Zweck ein Bit in den Inode wie beispielsweise in die Attribute 233 gesetzt wird. Sobald dieses Bit gesetzt ist, können die Dateidaten nicht mehr geändert oder gelöscht werden. Bei dem Ansatz der Metadaten-Abbildsicherung muss jede Datei, die geschützt werden muss, von einem HSM oder einer Datenverwaltungsprogrammierschnittstellen(DMAPI)-Anwendung verwaltet und vorverlagert oder vollständig verlagert werden; andernfalls sind die Dateidaten unter Umständen nicht mehr über das Metadaten-Abbildwiederherstellungsverfahren abrufbar. In großen und stark beanspruchten Dateisystemen sind einige als residente Dateien bekannte Dateien noch nicht vorverlagert oder verlagert und müssen durch ein alternatives Mittel gesichert werden, um einen Datenverlust zu verhindern. In einem solchen System kann es daher Dateien geben, die als unveränderlich gekennzeichnet sind, die aber immer noch in einem Speicher der ersten Stufe resident sind. Diese Dateien sind von dem HSM/DMAPI noch nicht verlagert worden. Bei diesen Dateien werden nur der Inode und die Metadaten mittels Metadaten-Abbildsicherung und Metadaten-Abbildwiederherstellung gesichert und wiederhergestellt, wobei die Dateidaten ungeschützt sind. Diese Dateien müssen somit durch einen anderen Mechanismus geschützt werden.
-
Gemäß veranschaulichenden Ausführungsformen wird ein Mechanismus zum Verwenden einer Mischform von Metadaten-Abbildsicherung und herkömmlicher Sicherung für teilweise aufgenommene Dateien bereitgestellt. Der Mechanismus sichert die gesamte Dateisammlung in einem großen und stark beanspruchten Dateisystem leistungsfähig zum Schutz vor Datenverlust. Der Mechanismus verwendet ein Änderungsüberwachungsprotokoll, um eine Liste von residenten Dateien festzulegen, die seit der letzten Sicherung hinzugefügt oder geändert worden sind, und ergreift spezielle Maßnahmen für diejenigen Dateien, die aufgrund ihres residenten Status nicht für eine einfache Metadaten-Abbildsicherung in Frage gekommen sind. Der Mechanismus ermöglicht es ferner, dass Daten für unveränderliche Dateien durch einen herkömmlichen Sicherungs-/Archiv-Wiederherstellungsprozess wiederhergestellt werden.
-
Der Mechanismus der veranschaulichenden Ausführungsformen erkennt unveränderliche, residente Dateien während der Metadaten-Abbildwiederherstellung und setzt ihr unveränderliches Bit in den Attributen 233 zurück, um eine Wiederherstellung der Datenblöcke dieser Datei zu ermöglichen. Zu dem Erkennungsmechanismus gehört ein Datenaustausch mit der HSM/DMAPI-Anwendung, um zu ermitteln, ob die Daten wirklich von der HSM-Anwendung verwaltet werden. Wenn die Daten nicht von der HSM-Anwendung verwaltet werden, setzt der Mechanismus das unveränderliche Bit zurück, um eine Wiederherstellung der Datenblöcke der Datei zu ermöglichen. Bei Dateigrößen von 0 Byte muss achtgegeben werden, da diese gegebenenfalls nicht von dem HSM bearbeitet werden, und nur die Metadaten-Abbildwiederherstellung eine gültige und vollständige Wiederherstellung dieser Dateien darstellt.
-
Ein externer Datenschutzmechanismus für unveränderliche residente Dateien bewirkt das Wiederherstellen der Daten und das Setzen des unveränderlichen Bits als Teil der Dateiattribute. Der externe Datenschutzmechanismus muss von dem Unveränderlichkeitsaspekt Kenntnis haben, um ein Wiederherstellen des unveränderlichen Bits vor den Daten zu vermeiden. Dies stellt auch ein Schlüsselelement dar, um sicherzustellen, dass der Wiederherstellungsprozess die Unveränderlichkeit der Daten beibehält, um die Einhaltung der Konformitätsregeln der Archivierungseinheit zu gewährleisten.
-
3 ist ein Blockschaubild, das ein hybrides Metadaten-Abbildsicherungs-/Wiederherstellungs- und herkömmliches Sicherungs/Archivierungssystem gemäß einer veranschaulichenden Ausführungsform darstellt. Der Client 310 für hierarchisches Speichermanagement (HSM) ist über eine direkte Verbindung, ein Netzwerk, ein Speicherbereichsnetzwerk (SAN) oder eine Struktur oder Ähnliches mit dem durch HSM verwalteten Dateisystem 320 verbunden. Der HSM-Client 310 greift auf Dateien in dem durch HSM verwalteten Dateisystem 320 zu, indem er Dateien anlegt, liest, ändert, schreibt und löscht.
-
Das durch HSM verwaltete Dateisystem 320 speichert die Dateien, auf die zuletzt und/oder am häufigsten zugegriffen wurde, auf der Stufe 1 332, die gewöhnlich der teurere, jedoch schnellere Speicher ist. Bei der Stufe 1 332 kann es sich zum Beispiel um einen Festplattenlaufwerkspeicher handeln, da diese Einheiten einen schnellen Zugriff auf die Dateidaten bereitstellen. Das durch HSM verwaltete Dateisystem 320 speichert die Metadaten der Datei wie die Verzeichnisbaumstruktur und die Inode-Datei im Speicher (nicht dargestellt) und/oder auf der Stufe 1 332.
-
Das durch HSM verwaltete Dateisystem verschiebt Daten, die zu Dateien gehören, auf die selten zugegriffen wird, von der Stufe 1 332 auf die Stufe 2 334, bei der es sich üblicherweise um den weniger teuren, jedoch langsameren Speicher handelt. Bei der Stufe 2 334 kann es sich zum Beispiel um einen Bandspeicher handeln. Allgemein werden Dateidaten auf der Stufe 1 332 als ”resident” oder ”online” bezeichnet, während Dateidaten auf der Stufe 2 334 als ”offline” bezeichnet werden.
-
Das in 3 dargestellte Beispiel zeigt zwar zwei Stufen, ein Dateisystem mit hierarchischem Speichermanagement kann jedoch mehr Stufen aufweisen. Die Stufe 1 332 kann zum Beispiel auf Speichermedien oder Halbleiterdatenträgern beruhend sein. Ein Halbleiterdatenträger (SSD, solid-state disk), manchmal auch als Halbleiterplatte oder elektronische Platte bezeichnet, ist eine Datenspeichereinheit, die einen Halbleiterspeicher verwendet, um permanente Daten mit der Absicht zu speichern, Zugriff auf dieselbe Weise wie bei einem herkömmlichen Block-E/A-Festplattenlaufwerk bereitzustellen. Halbleiterdatenträger unterscheiden sich von herkömmlichen Magnetplatten wie Festplattenlaufwerken (HDD, hard disk drive) oder Disketten, bei denen es sich um elektromechanische Einheiten mit sich drehenden Platten und beweglichen Lese/Schreib-Köpfen handelt. Halbleiterdatenträger dagegen verwenden Mikrochips, die Daten in nichtflüchtigen Speicherschaltungen speichern und keine beweglichen Teile beinhalten. Im Vergleich zu elektromechanischen Festplattenlaufwerken sind Halbleiterdatenträger üblicherweise weniger anfällig gegen physische Stöße, sie sind leise, weisen eine kürzere Zugriffszeit und Latenzzeit auf, sind jedoch pro Gigabyte (GB) teurer. Halbleiterdatenträger verwenden die gleiche Schnittstelle wie Festplattenlaufwerke und ersetzen diese dadurch problemlos in den meisten Anwendungen. Bei der Stufe 2 334 kann es sich um einen Festplattenspeicher und bei einer dritten Stufe um einen Band laufwerkspeicher handeln. Die oberste Stufe mit den schnellsten Speichereinheiten fungiert generell als Cachespeicher für die unteren Stufen. Alle Dateidaten in der obersten Stufe gelten als ”online”, während alle Dateidaten in den unteren Stufen als ”nearline” oder ”offline” gelten.
-
Die Stufe 2 334 weist einen ”Plattenpool” für die HSM-Daten auf, der als ”Nearline”-Speicher bezeichnet wird, da er nicht ”online” im Dateisystem ist, jedoch auch nicht ganz in den Bandspeicher verschoben wurde. Daten veralten gewöhnlich in einem Plattenpool, bevor sie in einem Bandspeicher festgeschrieben werden.
-
Die veranschaulichenden Ausführungsformen definieren das Sicherungs-Metadaten-Abbild als die Verzeichnisstruktur des Dateisystems (für den Namensbereich) und die Metadaten für die Dateien in dem Dateisystem wie Eigentümer, Zugriffszeit, Dateigröße usw. enthaltend. Jede Datei beinhaltet ferner ihre Berechtigungen, die häufig als ihre Zugriffssteuerungsliste (ACL, access control list) bezeichnet wird, sowie die erweiterten Attribute, die zum Lokalisieren der Dateidaten in der Offline-Sicherung erforderlich sind. Es handelt sich dabei um die Mindestmenge an Daten, die wiederhergestellt werden muss, um ein durch HSM verwaltetes Dateisystem wiederherzustellen.
-
Gemäß der veranschaulichenden Ausführungsform erzeugt der HSM-Client 310 eine Momentaufnahme des durch HSM verwalteten Dateisystems 320 und führt anschließend eine Metadaten-Abbildsicherung über das HSM-Sicherungssystem 325 aus, um die oben beschriebenen Metadaten zu sichern (z. B. die Verzeichnisstruktur und die Dateiattribute). Gleichzeitig mit der Metadaten-Abbildsicherung beginnt der HSM-Client 310 einen Prozess, um residente Dateien zu identifizieren, deren Daten noch nicht offline kopiert wurden und die daher nicht in der Metadaten-Abbildsicherung geschützt sind. Der HSM-Client 310 leitet diese Liste an ein herkömmliches Sicherungssystem 326 weiter, das die identifizierten residenten Dateien unter Verwendung einer herkömmlichen Sicherungs-/Archivierungstechnik sichert.
-
Um das durch HSM verwaltete Dateisystem 320 zum Beispiel nach einem katastrophalen Ausfall wiederherzustellen, führt der HSM-Client 310 eine Metadaten-Abbildwiederherstellung über das HSM-Sicherungssystem 325 durch, um das Dateisystembild (z. B. die Verzeichnisstruktur und die Dateiattribute) wiederherzustellen. Der Prozess der Metadaten-Abbildwiederherstellung erkennt, wenn er eine Datei nicht in dem richtigen durch DMAPI verlagerten Status wiederherstellen kann. Das Wiederherstellen einer Datei kann zum Beispiel fehlschlagen, wenn ihre erweiterten Attribute nicht eine eindeutige Kennung enthalten, die auf einen Offline-Speicher zeigt. Wenn ein solches Fehlschlagen erkannt wird, muss die Datei zum Zeitpunkt der Metadaten-Abbildsicherung resident gewesen sein und möglicherweise auch unveränderlich. Der Wiederherstellungsprozess für diese residenten Dateien muss das unveränderliche Bit in den Attributen der Datei ändern und damit dafür sorgen, dass die Dateidaten geschrieben werden können, um eine Wiederherstellung der Dateidaten zu ermöglichen. Das herkömmliche Sicherungssystem 326 stellt die Dateien wieder her, die als resident erkannt wurden.
-
Bei einer beispielhaften Ausführungsform ermöglicht der Sicherungs-/Wiederherstellungsmechanismus das Wiederherstellen unveränderlicher Dateien durch eine externe Datenschutzlösung, indem eine Programmierschnittstelle (API, application programming interface) bereitgestellt wird, die den Status des unveränderlichen Bits nicht wiederherstellt, wenn der Wiederherstellungsprozess den Rest der Attribute wiederherstellt, bis die Datei von dem Wiederherstellungsprozess geschlossen wird. Das unveränderliche Bit würde bei einem Prozess- oder Systemabsturz implizit zurückgesetzt werden.
-
Für den Fachmann ist ersichtlich, dass die vorliegende Erfindung als System, Verfahren oder Computerprogrammprodukt ausgeführt werden kann. Aspekte der vorliegenden Erfindung können daher die Form einer kompletten Hardware-Ausführung, einer kompletten Software-Ausführung (einschließlich Firmware, residenter Software, Mikrocode usw.) oder eine Ausführungsform haben, bei der Hardware- und Software-Aspekte kombiniert sind, die allgemein hier als ”Schaltung”, ”Modul” oder ”System” bezeichnet werden können. Aspekte der vorliegenden Erfindung können des Weiteren die Form eines Computerprogrammprodukts haben, das in einem oder mehreren computerlesbaren Medien ausgeführt ist, die über einen darin enthaltenen computerlesbaren Programmcode verfügen.
-
Eine beliebige Kombination von einem computerlesbaren Medium oder mehreren computerlesbaren Medien kann bzw. können verwendet werden. Das computerlesbare Medium kann ein computerlesbares Signalmedium oder ein computerlesbares Speichermedium sein. Bei einem computerlesbaren Speichermedium kann es sich zum Beispiel unter anderem um ein elektronisches, magnetisches, optisches, elektromagnetisches, Infrarot- oder Halbleitersystem, eine solche Vorrichtung oder Einheit oder eine geeignete Kombination davon handeln. Zu genaueren Beispielen (einer nicht vollständigen Liste) für das computerlesbare Speichermedium gehören wie folgt: eine elektrische Verbindung mit einer oder mehreren Leitungen, ein tragbarer Computer-Diskettenspeicher, eine Festplatte, ein Direktzugriffsspeicher (RAM), ein Nur-Lese-Speicher (ROM), ein löschbarer, programmierbarer Nur-Lese-Speicher (EPROM oder Flash-Speicher), ein Lichtwellenleiter, ein tragbarer Compact-Disc-Nur-Lese-Speicher (CD-ROM), eine optische Speichereinheit, eine magnetische Speichereinheit oder eine geeignete Kombination davon. Im Zusammenhang mit diesem Dokument kann ein computerlesbares Speichermedium ein physisches Medium sein, das ein Programm enthalten oder speichern kann, welches von oder in Verbindung mit einem System, einer Vorrichtung oder Einheit zum Ausführen von Befehlen verwendet wird.
-
Ein computerlesbares Signalmedium kann ein weitergeleitetes Datensignal mit darin enthaltenem computerlesbarem Programmcode aufweisen, zum Beispiel in einem Basisband oder als Teil einer Trägerwelle. Ein solches weitergeleitetes Signal kann eine Vielfalt von Formen haben, einschließlich elektromagnetische, optische Formen oder eine geeignete Kombination davon, ohne darauf beschränkt zu sein. Ein computerlesbares Signalmedium kann ein beliebiges computerlesbares Medium sein, das kein computerlesbares Speichermedium ist und das ein Programm zur Verwendung durch oder in Verbindung mit einem System, einer Vorrichtung oder Einheit zum Ausführen von Befehlen übertragen, weitergegeben oder transportieren kann.
-
In einem computerlesbaren Medium enthaltener Programmcode kann unter Verwendung eines geeigneten Mediums übermittelt werden, das unter anderem drahtlos, drahtgebunden, Lichtwellenleiterkabel, Hochfrequenz (HF) usw. oder eine geeignete Kombination davon sein kann.
-
Der Computerprogrammcode zum Ausführen der perationen in Verbindung mit Aspekten der vorliegenden Erfindung kann in einer beliebigen Kombination von einer oder mehreren Programmiersprachen geschrieben werden, zu denen eine objektorientierte Programmiersprache wie beispielsweise JavaTM SmalltalkTM, C++ oder ähnliche sowie herkömmliche prozedurale Programmiersprachen wie beispielsweise die Programmiersprache ”C” oder ähnliche Programmiersprachen gehören. Der Programmcode kann ganz auf dem Computer des Benutzers, teilweise auf dem Computer des Benutzers, als eigenständiges Software-Paket, teilweise auf dem Computer des Benutzers und teilweise auf einem entfernt angeordneten Computer oder ganz auf dem entfernt angeordneten Computer oder Server ausgeführt werden. Im letztgenannten Szenario kann der entfernt angeordnete Computer über ein beliebiges Netz mit dem Computer des Benutzers verbunden sein, zum Beispiel über ein lokales Netz (LAN) oder ein Weitverkehrsnetz (WAN), oder es kann die Verbindung zu einem externen Computer hergestellt werden (beispielsweise über das Internet durch einen Internetdienstanbieter).
-
Aspekte der vorliegenden Erfindung werden untenstehend unter Bezugnahme auf Ablaufplandarstellungen und/oder Blockschaubilder von Verfahren, Vorrichtungen (Systemen) und Computerprogrammprodukten gemäß bevorzugter Ausführungsformen der Erfindung beschrieben. Es versteht sich, dass jeder Block der Ablaufplandarstellungen und/oder Blockschaubilder sowie Kombinationen von Blöcken in den Ablaufplandarstellungen und/oder Blockschaubildern durch Computerprogrammbefehle umgesetzt werden können. Diese Computerprogrammbefehle können einem Prozessor eines Universalrechners, Spezialrechners oder einer anderen programmierbaren Datenverarbeitungsvorrichtung bereitgestellt werden, um eine Maschine zu bilden, so dass die Befehle, die über den Prozessor des Computers oder der anderen programmierbaren Datenverarbeitungsvorrichtung ausgeführt werden, ein Mittel erzeugen, um die in dem Block oder den Blöcken des Ablaufplans und/oder des Blockschaubilds festgelegten Funktionen/Maßnahmen umzusetzen.
-
Diese Computerprogrammbefehle können auch in einem computerlesbaren Medium gespeichert werden, das einen Computer, eine andere programmierbare Datenverarbeitungsvorrichtung oder andere Einheiten steuern kann, um auf eine bestimmte Weise zu funktionieren, so dass die in dem computerlesbaren Medium gespeicherten Befehle ein Herstellungsprodukt einschließlich der Befehle erzeugen, die die in dem Block oder den Blöcken des Ablaufplans und/oder des Blockschaubilds festgelegte Funktion/Maßnahme umsetzen.
-
Die Computerprogrammbefehle können ferner in einen Computer, eine andere programmierbare Datenverarbeitungsvorrichtung oder andere Einheiten geladen werden, um eine Reihe von Betriebsschritten auszulösen, die auf dem Computer, in der anderen programmierbaren Vorrichtung oder den anderen Einheiten durchgeführt werden, um einen auf einem Computer implementierten Prozess zu erzeugen, so dass die Befehle, die auf dem Computer oder in der anderen programmierbaren Vorrichtung ausgeführt werden, Prozesse bereitstellen, um die in dem Block oder den Blöcken des Ablaufplans und/oder des Blockschaubilds festgelegten Funktionen/Maßnahmen umzusetzen.
-
4 ist ein Ablaufplan, der die Funktionsweise eines hybriden Metadaten-Abbildsicherungs-/Wiederherstellungs- und herkömmlichen Sicherungs-/Archivierungssystems gemäß einer veranschaulichenden Ausführungsform darstellt. Die Operation beginnt in Block 400, und das System macht eine Momentaufnahme des Dateisystems, um ein übereinstimmendes Zeitpunkt-Abbild des Dateisystems sicherzustellen (Block 401), von dem eine Sicherung gemacht wird. Das System startet die Metadaten-Abbildsicherung des Dateisystems (Block 402), um Verzeichnis, Inode, Metadaten (Zugriffssteuerungslisten und erweiterte Attribute) zu erfassen. Es sei darauf hingewiesen, dass das System keine Datenblöcke erfasst, da davon ausgegangen wird, dass sich diese bereits in dem HSM-Pool befinden (Offline-Speicher).
-
Gleichzeitig mit der Metadaten-Abbildsicherung in den Blöcken 401 und 402 identifiziert das System eine Liste mit residenten Dateien (Block 403). Bei diesen Dateien werden die Daten nicht in den Offline-Speicher gespeichert. Zusätzlich kann bei einigen der residenten Dateien das unveränderliche Bit gesetzt sein, bei anderen jedoch nicht. Die genannte Liste kann durch leistungsstarkes Abtasten der Inodes des Dateisystems oder mit Hilfe eines Überprüfungssystems ermittelt werden, das Dateiaktualisierungsaktivitäten verfolgt. Das System optimiert die Liste, damit nur solche Daten gesichert werden, die vollständig in das Archivsystem übertragen wurden und abgeschlossen sind (Block 404). Wenn eine Datei zum Beispiel aktiv ist, wenn die Momentaufnahme in Block 401 gemacht wird, sichert das System sie nicht. Es kann ferner wünschenswert sein, nur residente Dateien zu sichern, bei denen ein unveränderliches Bit gesetzt ist. Bei einer beispielhaften Ausführungsform kann das System die Liste der residenten Dateien mit der Spezifizierung von Richtlinienattributen optimieren, um die Dateiauswahl zu unterstützen. Das System leitet die optimierte Liste der residenten Dateien zu einem herkömmlichen Sicherungssystem weiter, um einen vollständigen Schutz des gesamten Dateisystems und seiner Daten sicherzustellen (Block 405).
-
Wenn anschließend die gesamte Metadaten-Abbildsicherung und die Sicherung der residenten Dateien abgeschlossen sind, endet die Operation in Block 406.
-
5 ist ein Ablaufplan, der die Funktionsweise eines hybriden Metadaten-Abbildwiederherstellungs- und herkömmlichen Wiederherstellungssystems gemäß einer veranschaulichenden Ausführungsform darstellt. Die Operation beginnt in Block 500, und das System stellt das Metadaten-Abbild des Dateisystems wieder her (Block 501). Bei diesem Verfahren zur Metadaten-Abbildwiederherstellung werden die Metadaten der Datei für durch DMAPI verwaltete Dateien sowie residente Dateien wiederhergestellt.
-
Damit residente Dateien wiederhergestellt werden können, muss das System erkennen, wenn es eine solche Datei in einem verlagerten durch DMAPI verwalteten Status nicht wiederherstellen kann. Das System ermittelt in Block 502, ob eine solche Datei in dem residenten Status wiederhergestellt wurde. Das System erkennt diesen Fall, wenn die Metadaten der Datei keine eindeutige Kennung aufweisen, die auf ihren Offline-Speicher zeigen. Wenn dies nicht erkannt wird, ermittelt das System als Nächstes, ob die Wiederherstellung abgeschlossen ist (Block 503). Wenn die Wiederherstellung abgeschlossen ist, endet die Operation in Block 504. Wenn die Wiederherstellung nicht abgeschlossen ist, kehrt die Operation zu Block 501 zurück, um die Wiederherstellung des Metadaten-Abbildes des Dateisystems fortzusetzen.
-
Wenn das System erkennt, dass eine residente Datei in Block 502 wiederhergestellt wurde, prüft das System den Status des unveränderlichen Bits (Block 505) und ermittelt, ob das unveränderliche Bit gesetzt ist (Block 506). Wenn das unveränderliche Bit gesetzt ist, ändert das System das unveränderliche Bit (Block 507). Danach oder wenn das unveränderliche Bit in Block 506 nicht gesetzt wurde, stellt das System die residente Datei unter Verwendung eines herkömmlichen Sicherungs/Wiederherstellungssystems wieder her (Block 508). Wenn der vorherige Status des unveränderlichen Bits gesetzt war, setzt das System das unveränderliche Bit (Block 509). Die Operation geht zu Block 503 weiter, um zu ermitteln, ob die Wiederherstellung nun abgeschlossen ist. Die Metadaten-Abbildwiederherstellung und Wiederherstellung der unveränderlichen Dateidaten kann gleichzeitig mit dem Beginn der Datenwiederherstellung durchgeführt werden, wenn eine solche Datei in dem Metadaten-Abbildwiederherstellungsstrom erkannt wird.
-
Der Ablaufplan und die Blockschaubilder in den Figuren zeigen die Architektur, Funktionalität und den Betrieb möglicher Ausführungen von Systemen, Verfahren und Computerprogrammprodukten gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung. In dieser Hinsicht kann jeder Block in dem Ablaufplan oder den Blockschaubildern ein Modul, Segment oder einen Teil eines Codes darstellen, das/der einen oder mehrere ausführbare Befehle zur Umsetzung der festgelegten Logikfunktion(en) umfasst. Es ist ferner darauf hinzuweisen, dass die im Block angegebenen Funktionen bei einigen alternativen Ausführungen in einer anderen Reihenfolge als in den Figuren dargestellt ablaufen können. Zwei aufeinanderfolgend dargestellte Blöcke können zum Beispiel tatsächlich im Wesentlichen gleichzeitig ausgeführt werden, oder die Blöcke können je nach entsprechender Funktionalität manchmal in umgekehrter Reihenfolge ausgeführt werden. Des Weiteren ist darauf hinzuweisen, dass jeder Block der Blockschaubilder und/oder der Ablaufplandarstellung sowie Kombinationen von Blöcken in den Blockschaubildern und/oder der Ablaufplandarstellung durch spezielle auf Hardware beruhende Systeme umgesetzt werden können, die die angegebenen Funktionen oder Maßnahmen durchführen, oder durch Kombinationen von speziellen Hardware- und Computerbefehlen.
-
Die veranschaulichenden Ausführungsformen stellen somit einen Mechanismus zum Verwenden einer Mischform von Metadaten-Abbildsicherung und herkömmlicher Sicherung für teilweise aufgenommene Dateien bereit. Der Mechanismus kann die gesamte Dateisammlung in einem großen und stark beanspruchten Dateisystem zum Schutz vor Datenverlust leistungsfähig sichern, insbesondere im Fall von residenten und unveränderlichen Dateien.
-
Wie oben bereits aufgeführt, ist ersichtlich, dass die bevorzugten Ausführungsformen die Form einer kompletten Hardware-Ausführung, einer kompletten Software-Ausführung oder eine Ausführungsform haben können, bei der Hardware- und Software-Elemente enthalten sind. Bei einer beispielhaften Ausführungsform sind die Mechanismen der bevorzugten Ausführungsformen in Software- oder Programmcode umgesetzt, der Firmware, residente Software, Mikrocode usw. enthält, ohne darauf beschränkt zu sein.
-
Zu geeigneten Datenverarbeitungssystemen zum Speichern und/oder Ausführen von Programmcode gehört mindestens ein Prozessor, der direkt oder indirekt über einen Systembus mit Speicherelementen verbunden ist. Zu den Speicherelementen können ein lokaler Speicher, der während der eigentlichen Ausführung des Programmcodes verwendet wird, ein Massenspeicher und Cachespeicher gehören, die ein vorübergehendes Speichern von mindestens einem Teil des Programmcodes bereitstellen, um die Häufigkeit zu verringern, mit der Code während der Ausführung aus dem Massenspeicher abgerufen werden muss.
-
Eingabe/Ausgabe- oder E/A-Einheiten (einschließlich Tastaturen, Anzeigen, Zeigegeräte usw., ohne darauf beschränkt zu sein) können entweder direkt oder über zwischengeschaltete E/A-Steuereinheiten mit dem System verbunden sein. Netzwerkadapter können ebenfalls mit dem System verbunden sein, um es dem Datenverarbeitungssystem zu ermöglichen, mit anderen Datenverarbeitungssystemen oder entfernt angeordneten Druckern oder Speichereinheiten über zwischengeschaltete private oder öffentliche Netzwerke verbunden zu werden. Modems, Kabelmodems und Ethernet-Karten sind nur einige der derzeit erhältlichen Arten von Netzwerkadaptern.
-
Die Beschreibung der vorliegenden Erfindung wurde zum Zwecke der Veranschaulichung und Beschreibung vorgestellt, soll jedoch nicht erschöpfend oder auf die Erfindung in der offenbarten Form beschränkt sein. Fachleuten sind viele Änderungen und Abwandlungen ersichtlich. Die Ausführungsform wurde ausgewählt und beschrieben, um die Grundgedanken der Erfindung und die praktische Anwendung am besten zu erläutern und um anderen Fachleuten ein Verständnis der Erfindung für verschiedene Ausführungsformen mit verschiedenen Änderungen zu ermöglichen, wie sie für die jeweils beabsichtigte Verwendung geeignet sind.