DE112011103367T5 - Replizieren von Daten - Google Patents

Replizieren von Daten Download PDF

Info

Publication number
DE112011103367T5
DE112011103367T5 DE112011103367T DE112011103367T DE112011103367T5 DE 112011103367 T5 DE112011103367 T5 DE 112011103367T5 DE 112011103367 T DE112011103367 T DE 112011103367T DE 112011103367 T DE112011103367 T DE 112011103367T DE 112011103367 T5 DE112011103367 T5 DE 112011103367T5
Authority
DE
Germany
Prior art keywords
data
data server
new
server
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE112011103367T
Other languages
English (en)
Inventor
Howard Newton Martin
Colin Scott Dawson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE112011103367T5 publication Critical patent/DE112011103367T5/de
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1748De-duplication implemented within the file system, e.g. based on file segments
    • G06F16/1752De-duplication implemented within the file system, e.g. based on file segments based on file chunks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • G06F16/184Distributed file systems implemented as replicated file system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0613Improving I/O performance in relation to throughput
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes

Abstract

Verfahren, Computersysteme und Computerprogrammprodukte zum Replizieren von Daten werden bereitgestellt. Metadaten und zu den Metadaten zugehörige Daten werden an einem ersten Datenserver empfangen. Ein neuer Teil der Daten, der noch nicht auf dem ersten Datenserver gespeichert ist, wird identifiziert. Der neue Teil der Daten wird auf einem zweiten Datenserver gespeichert, bevor die Metadaten auf dem zweiten Datenserver gespeichert werden.

Description

  • GEBIET DER ERFINDUNG
  • Die vorliegende Erfindung betrifft im Allgemeinen Computer und insbesondere Verfahren, Computersysteme und Computerprogrammprodukte zum Replizieren von Daten, vor allem in einem Deduplizierungssystem.
  • HINTERGRUND DER ERFINDUNG
  • Replikationsmodelle sind normalerweise entweder synchron oder asynchron in Bezug darauf, wie und wann eine Replikation ausgeführt wird. In dem synchronen Modell werden Daten so bald wie möglich nach dem Speichern der Daten in der Quelle auf das Ziel repliziert. Einige Modelle können dies als Teil einer Transaktionsverarbeitung derart vornehmen, dass die Daten erst als erfolgreich betrachtet werden, wenn sie auf beide Sites geschrieben sind, während andere einen Abschluss von Transaktion/Operation an der Quelle zulassen können, wobei die Replikation unmittelbar danach erfolgt. In beiden Fällen ist dies synchron oder nahezu synchron in Bezug auf das, was bereitgestellt wird und die Erwartungen, die für den Endbenutzer erfüllt werden. Auf der anderen Seite werden asynchron einige Mechanismen zum Planen von Replikation ermöglicht. In diesem Fall wird erwartet, dass die geplante Replikation innerhalb eines gewissen angemessenen Zeitraums liegt, um Wiederherstellungspunktziele zu erfüllen, während gleichzeitig diejenigen mit für die Replikation verfügbarer Bandbreite/Kapazität abgeglichen werden.
  • In einigen Speicherverwaltungssystemen wird eine Replikation von Server zu Server als eine asynchrone Replikationsfunktion bereitgestellt, die über eine Verwaltungsaufsicht geplant und verwaltet wird. Eine Replikation hat zwar viele Vorteile, kann aber trotzdem ein Bandbreiten- und Kapazitätsproblem darstellen, wenn eine Replikation ausgeführt wird. Wenn zum Beispiel die Replikation Hunderttausende oder Millionen von Dateien innerhalb eines definierten Replikationsfensters verarbeiten muss, können beträchtliche System- und Netzwerkressourcen erforderlich sein.
  • Die veröffentlichte U.S.-Patentanmeldung 2008/0263109 A1 offenbart ein Verfahren zum Replizieren von neuen deduplizierten Segmenten in einem deduplizierenden Speichersystem und Referenzen auf die deduplizierten Segmente von einem deduplizierenden Speichersystem zu einem Replikatsystem. Die U.S.-Patenschrift 7,584,338 offenbart ein Verfahren zum Replizieren von deduplizierten Segmenten und Anweisungen zum Konstruieren von ursprünglichen Daten aus den deduplizierten Segmenten auf einem Replikatsystem.
  • OFFENBARUNG DER ERFINDUNG
  • In einer Ausführungsform wird ein Verfahren zum Replizieren von Daten bereitgestellt. Metadaten und zu den Metadaten zugehörige Daten werden an einem ersten Datenserver empfangen. Ein neuer Teil der Daten, der noch nicht auf dem ersten Datenserver gespeichert ist, wird identifiziert. Der neue Teil der Daten wird auf einem zweiten Datenserver gespeichert, bevor die Metadaten auf dem zweiten Datenserver gespeichert werden.
  • In einer weiteren Ausführungsform wird ein Computersystem bereitgestellt. Das Computersystem enthält mindestens ein computerlesbares Medium und mindestens einen Prozessor in betriebsfähiger Datenübertragung mit dem mindestens einen computerlesbaren Medium. Der mindestens eine Prozessor ist so angepasst, dass er Metadaten und zu den Metadaten zugehörige Daten an einem ersten Datenserver empfängt, einen neuen Teil der Daten, der noch nicht auf dem ersten Datenserver gespeichert ist, identifiziert und den neuen Teil der Daten auf einem zweiten Datenserver speichert, bevor die Metadaten auf dem zweiten Datenserver gespeichert werden.
  • In einer weiteren Ausführungsform wird ein Computerprogrammprodukt zum Replizieren von Daten in einer Datenverarbeitungsumgebung bereitgestellt. Das Computerprogrammprodukt weist darauf gespeicherte computerlesbare Programmcodeabschnitte auf. Die computerlesbaren Programmcodeabschnitte enthalten einen ersten ausführbaren Abschnitt, einen zweiten ausführbaren Abschnitt und einen dritten ausführbaren Abschnitt. Der erste ausführbare Abschnitt dient zum Empfangen von Metadaten und von den Metadaten zugehörigen Daten auf einem ersten Datenserver. Der zweite ausführbare Abschnitt dient zum Identifizieren eines neuen Teils der Daten, der noch nicht auf dem ersten Datenserver gespeichert ist. Der dritte ausführbare Abschnitt dient zum Speichern des neuen Teils der Daten auf einem zweiten Datenserver, bevor die Metadaten auf dem zweiten Datenserver gespeichert werden.
  • Dementsprechend sorgt die vorliegende Erfindung für das synchrone Kopieren von neuen Datenblöcken in einen Zielspeicher, wobei danach eine asynchrone Replikation von Metadaten-Referenzen auf die neu kopierten Datenblöcke aus dem Quellenspeicher in den Zielspeicher ausgeführt wird.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Damit die Vorteile der Erfindung leicht zu verstehen sind, wird unter Bezugnahme auf spezifische Ausführungsformen, die in den Zeichnungen im Anhang veranschaulicht sind, eine bestimmtere Beschreibung der oben kurz beschriebenen Erfindung vorgelegt. Das Verständnis vorausgesetzt, dass diese Zeichnungen Ausführungsformen der Erfindung veranschaulichen und daher nicht als deren Schutzumfang einschränkend zu betrachten sind, wird die Erfindung mit zusätzlicher Spezifität und Ausführlichkeit unter Verwendung der begleitenden Zeichnungen beschrieben und erklärt, wobei:
  • 1 ein Ablaufplan eines Verfahrens zum Replizieren von Daten in einer Computerumgebung gemäß einer Ausführungsform der vorliegenden Erfindung ist;
  • 2 ein Blockschaubild eines Computernetzwerks gemäß einer Ausführungsform der vorliegenden Erfindung ist;
  • 3 eine beispielhafte Datenverarbeitungsumgebung veranschaulicht, in der Aspekte der vorliegenden Erfindung umgesetzt werden können; und
  • 4 einen beispielhaften Teil eines Deduplizierungssystems veranschaulicht, wie vorher in 3 dargestellt, einschließlich einer Prozessoreinheit.
  • AUSFÜHRLICHE BESCHREIBUNG DER ZEICHNUNGEN
  • Ausführungsformen der vorliegenden Erfindung stellen Verfahren, Computersysteme und Computerprogrammprodukte zum Löschen von deduplizierten Daten in einer Computerumgebung bereit, wie beispielsweise einem Computersystem.
  • Eine Replikation umfasst zwei primäre Aufgaben in einer derartigen Replikationsumgebung von Server zu Server. Eine der Aufgaben ist ein Metadatenabgleich. Metadaten beziehen sich auf die Attribute der Daten, die zur Unterstützung der Daten gespeichert sind, wie beispielsweise der Name der Datei, wem sie gehört, wann sie gespeichert wurde und andere sinnvolle Attribute, die von dem System verwendet werden. Die andere primäre Aufgabe ist die Verschiebung von Daten entweder als Datenübertragung an sich für notwendige Datenblöcke oder andernfalls als Datenreferenzübertragung, um ein Objekt zu einem bestehenden Datenblock auf dem Zielserver in Beziehung zu setzen. In Anbetracht der mannigfaltigen zu bearbeitenden Datentypen und des Volumens (d. h. großen Anzahlen von Objekten und Datenblöcken), die in einer großen Umgebung bearbeitet werden müssen, ist eine Optimierung erforderlich, um die Replikationsoperation zu beschleunigen, während gleichzeitig die Ressourcenanforderungen abgeglichen werden, die auf eine vorgegebene Replikationsoperation angewendet werden.
  • Gemäß einer Ausführungsform wird ein hybrides Replikationsmodell vorgeschlagen, in dem neue und eindeutige Datenblöcke (oder Teile oder Bereiche) von deduplizierten Daten in einer nahezu synchronen Weise zu dem Zielserver gesendet werden, wenn sie in den Ursprungsserver kommen und identifiziert werden. Der Datenfluss in diesem asynchronen Modell kann durch Richtlinien eingeschränkt werden, die regeln, wie viel Bandbreite von der Operation verwendet werden darf. Dies kann eine asynchrone Replikation um ein Bootstrapping (Urladen) von erforderlichen Datenblöcken erweitern, wenn sie am Zielserver bereits verfügbar sind, sodass die Replikationsoperation primär auf den Metadatenabgleich ausgerichtet ist, da weniger Daten übertragen werden müssen, weil sie bereits auf dem Zielserver gespeichert sind. Im Wesentlichen wird der Datenblock als ein Deduplizierungsdatenblock ohne eine entsprechende Referenz auf eine abhängige Datei (d. h. Metadaten) auf dem Zielserver gespeichert. Eine zukünftige asynchrone Replikationsoperation von dem Quellenserver wird anschließend zum Erstellen der Metadaten verwendet, die auf diese Datenblöcke verweisen und verursachen, dass die Referenzwerte für die Datenblöcke von nicht verwendet (Null Referenzen) bis verwendet reichen, gleichgültig, wie viele Objekte darauf aufbauen.
  • Daher wird in einer Ausführungsform ein Verfahren zum Replizieren von Daten bereitgestellt. Metadaten und zu den Metadaten zugehörige Daten werden an einem ersten Datenserver empfangen. Ein neuer Teil der Daten, der noch nicht auf dem ersten Datenserver gespeichert ist, wird identifiziert. Der neue Teil der Daten wird auf einem zweiten Datenserver gespeichert, bevor die Metadaten auf dem zweiten Datenserver gespeichert werden.
  • 1 veranschaulicht ein Verfahren 10 zum Replizieren von Daten gemäß einer Ausführungsform der vorliegenden Erfindung. Das Verfahren 10 beginnt in Schritt 12 mit zum Beispiel einer Datei (z. B. Metadaten und zugehörige Daten oder Objekt), die durch einen (oder von einem) Client zu einem ersten Datenserver gesendet werden. In Schritt 14 werden die Metadaten-Daten auf dem ersten Datenserver empfangen (und/oder gespeichert). In Schritt 16 wird jeder neue Teil (oder Teile) der Daten, die auf dem ersten Datenserver neu sind (d. h. noch nicht auf dem ersten Datenserver gespeichert sind) identifiziert. Wegen der Replikationsbeziehung zwischen den Quellen- und Zielservern sind Daten, die für den Quellenserver neu und eindeutig sind, ein Kandidat, der ebenfalls zum Ziel zu senden ist. Wie allgemein verstanden wird, kann eine derartige Prozedur in einem Deduplizierungsprozess enthalten sein, wofür nachstehend ein Beispiel beschrieben wird. Danach wird in Schritt 18 der neue Teil der Daten auf einem zweiten Datenserver gespeichert (z. B. einem entfernt angeordneten Server, wie beispielsweise in einem anderen Ort), bevor die Metadaten auf dem zweiten Datenserver gespeichert werden (und/oder zu diesem gesendet werden).
  • Es sollte verstanden werden, dass der Zielserver das Ziel für eine Replikation von vielen verschiedenen Quellenservern sein kann. Daher kann der fragliche Datenteil (d. h. neu und eindeutig, der vorher auf dem Quellenserver nicht gesehen wurde) bereits auf dem Zielserver vorhanden sein, weil er von einem anderen Quellenserver aufgefüllt wurde. Das hierin beschriebene Verfahren/System kann die Tatsache berücksichtigen, dass ein Teil, der in der Quelle neu/eindeutig erscheint, möglicherweise eigentlich nicht gesendet werden muss, weil er bereits auf dem Zielserver gespeichert ist. In einem solchen Fall kann die Entscheidung getroffen werden, einen derartigen Teil von Daten nicht zu senden.
  • In Schritt 20 endet das Verfahren 10 zum Beispiel mit dem Abschluss des Speicherns sämtlicher neuer Daten von dem ersten Datenserver auf dem zweiten Datenserver. Es sollte jedoch verstanden werden, dass mindestens in einigen Ausführungsformen ein geplanter asynchroner Replikationsprozess das Verfahren 10 unterbrechen kann, bevor alle der neuen Teile auf dem zweiten Datenserver gespeichert sind. Wenn zum Beispiel die Bandbreite stark eingeschränkt ist, können nur 20 bis 30% der neuen Teile auf dem zweiten Server gespeichert werden, bevor die geplante asynchrone Replikation beginnt. In einem derartigen Fall kann das hierin beschriebene Verfahren jedoch die Arbeit vorteilhafterweise verringern, die dann während der asynchronen Replikation ausgeführt wird.
  • 2 veranschaulicht ein Computernetzwerk 40 gemäß einer Ausführungsform der vorliegenden Erfindung. Das Computernetzwerk 40 enthält einen Client 42, einen Quellenserver (oder ersten Datenserver) 44 und einen Zielserver (oder zweiten Datenserver) 46. Obwohl in 2 nicht speziell gezeigt, stehen der Client 42, der Quellenserver 44 und der Zielserver 46 über ein Netzwerk, wie beispielsweise ein Weitverkehrsnetz (WAN), in betriebsfähiger Datenübertragung. Der Client 42 kann ein Computersystem sein, wie beispielsweise ein Desktop- oder Laptop-Personal Computer (PC). Der Quellenserver 44 und der Zielserver 46 können zum Beispiel Datenspeicherserver sein, wie allgemein verstanden wird.
  • Wie oben vorgeschlagen, können Ausführungsformen der vorliegenden Erfindung initiiert werden, indem der Client 42 ein Paket 48 zu dem Quellenserver 44 sendet. Das Paket 48 enthält in einer Ausführungsform Metadaten und zu den Metadaten zugehörige Daten (oder ein Objekt). Nach dem Empfangen (und/oder Speichern) der Metadaten und Daten führt der Quellenserver 44 einen Deduplizierungsprozess aus, wie allgemein verstanden wird, um sicherzustellen, dass keine der Daten bereits darauf gespeichert sind. In einer Ausführungsform enthält der Deduplizierungsprozess das Aufteilen der Daten in eine Vielzahl von Teilen (oder Datenblöcken oder Bereichen), wobei ein Hash-Wert für jeden der Teile berechnet wird und die berechneten Hash-Werte mit Hash-Werten für Daten verglichen werden, die bereits auf dem Quellenserver gespeichert sind (d. h. „alten” Daten).
  • Wenn irgendwelche Teile der Daten, die von dem Client gesendet wurden (d. h. in dem Paket 48), Hash-Werte aufweisen, die mit keinem der Hash-Werte der Daten übereinstimmen, die bereits auf dem Quellenserver 44 gespeichert sind, darf angenommen werden, dass diese Teile neu oder eindeutig sind (d. h. nicht bereits auf dem Quellenserver gespeichert sind). In einer Ausführungsform werden neue Teile 50 von Daten automatisch zu dem Zielserver 46 gesendet und dort gespeichert (nachdem sie als für den Quellenserver 44 neu/eindeutig identifiziert worden sind).
  • Von besonderem Interesse ist, dass die neuen Teile 50 der Daten zu dem Zielserver 46 gesendet und dort gespeichert werden, bevor die zugehörigen Metadaten zu dem Zielserver 46 gesendet und dort gespeichert werden. Mit anderen Worten, die neuen Datenteile werden zu dem Zielserver 46 gesendet, bevor irgendeine Art von Replikations-(oder Sicherungs-)Prozess zwischen dem Quellenserver 44 und dem Zielserver 46 initiiert worden ist. Wie in 2 angegeben, werden die Metadaten 52 zu dem Zielserver 46 gesendet, aber erst, nachdem ein Replikationsprozess (d. h. ein asynchroner Replikationsprozess) initiiert worden ist. Wenn der Replikationsprozess initiiert wird, bevor sämtliche der neuen Teile von Daten auf dem Zielserver 46 gespeichert sind, werden die restlichen neuen Teile nach dem Beginn des Replikationsprozesses, wie oben angegeben, zu dem Zielserver 46 gesendet. (d. h. gemäß herkömmlichen Replikationsprozessen und der Synchronisation zwischen dieser Quelle und dem Ziel, die ausgeführt wird).
  • Somit setzt das hierin beschriebene Verfahren eine Art von „scheibchenweiser” Datenblockübertragung um, wobei neue/eindeutige Datenblöcke identifiziert werden, sie werden von dem Quellenserver 44 zu dem Zielserver 46 gesendet. Dieses scheibchenweise Senden der neuen/eindeutigen Datenblöcke optimiert die tatsächliche zukünftige Replikationsoperation dadurch, dass nur die entsprechenden Metadaten und alle restlichen nicht gesendeten Datenblöcke übertragen werden müssen und die Tatsache genutzt wird, dass viele der erforderlichen Datenblöcke bereits vor der eigentlichen Replikationsoperation bereits als Seed-Werte an den Zielserver übergeben worden sind.
  • Dieser Ansatz nutzt die Quellenserver-Datenbank und die Tatsache, dass, wenn Daten dedupliziert werden, die Daten, die für das System neu sind, die eine einzelne Metadaten-(Datei)-Referenz auf einen vorgegebenen Datenblock haben, neu und eindeutig und ein Kandidat sind, der an den Zielserver gesendet werden muss. Bei denjenigen Datenblöcken, die eine Referenz auf einen Datenblock ergeben, der mehr als eine einzelne Metadaten-(Datei)-Referenz hat, oder denjenigen, die auf einen Datenblock verweisen, der vor dem Zeitpunkt der letzten Replikation gespeichert wurde, sind diese keine neuen und eindeutigen Datenblöcke und wären keine Kandidaten für das unmittelbare scheibchenweise Senden. Es ist anzumerken, dass in einigen Ausführungsformen das Speicherverwaltungssystem auch eine Client-Deduplizierungsfunktion hat, wobei der Client nur eindeutige Datenblöcke zu dem Server sendet (d. h. diejenigen Datenblöcke, die der Server noch nicht hat). Dies kann ein anderer Mechanismus sein, durch den der Server die Kandidaten-Datenblöcke ermitteln kann, die an den Zielserver gesendet werden müssen.
  • Ein weiterer Vorteil für die nahezu unmittelbare Replikation von neuen Datenblöcken ist, dass sie eine Datenredundanz bereitstellt. In dem Fall, dass ein Datenblock auf dem Quellenserver als beschädigt erkannt wird (z. B. Ausfall einer Einheit, bevor eine Speicherpool-Sicherung ausgeführt worden ist), kann der Datenblock auf dem Zielserver 46 verwendet werden, um den beschädigten Datenblock wiederherzustellen, indem aus dem Datenblock auf dem Zielserver eine neue Kopie auf dem Quellenserver 44 erstellt wird. Das heißt, wenn ein neuer Datenblock, der auf dem ersten Datenserver gespeichert ist, als beschädigt erkannt wird, wird der entsprechende Datenblock, der jetzt auf dem Zielserver 46 gespeichert ist, an den Quellenserver 44 gesendet. Der beschädigte neue Datenblock auf dem Quellenserver 44 wird somit durch den neuen Teil von Daten ersetzt, der von dem Zielserver 46 gesendet wird.
  • 3 veranschaulicht eine beispielhafte Architektur 100 von Deduplizierungssystemen (und/oder Speicherverwaltungssystemen) und zugehörigen Komponenten in einer Datenverarbeitungs-Speicherumgebung. Die Architektur 100 stellt Speicherdienste für mehrere Sicherungs-Hosts 260 bereit. Die Replikation von deduplizierten Daten wird zwischen verschiedenen Deduplizierungssystemgruppen 120, 140, 160 und 180 bereitgestellt, wie durch die gestrichelten Linien 220 und 240 angegeben. Jede der Gruppen 120, 140, 160 und 180 enthält einen oder mehrere Hosts 260, die, wie angegeben, über Netzwerkkomponenten wie einen Switch 280 mit einem Deduplizierungssystem 300 verbunden sind. Die Deduplizierungssysteme 300 sind über Netzwerkkomponenten wie beispielsweise einen Router 320 miteinander verbunden, der eine Verbindungsnetz-Konnektivität zwischen den Gruppen 120, 140, 160 und 180 bereitstellt. Ein Netzwerk 200 verbindet derartige Deduplizierungssysteme 300 und Router 320. Das Netzwerk 200 kann in einer Ausführungsform ein Weitverkehrsnetz (WAN) enthalten. In weiteren Ausführungsformen kann das Netzwerk 200 lokale Netze (LANs), Speicherbereichsnetze (SANs) und andere Netzwerktopologien enthalten, die dem Fachmann bekannt sind. Während die Router 320 und Switche 280 gezeigt sind, wird der Fachmann auch anerkennen, dass Zusatz- und/oder Austausch-Netzwerkkomponenten in Betracht gezogen werden.
  • In einer Ausführungsform ist der Switch 280 konform mit einem Fibre-Channel-Netzwerkprotokoll, das den Switch 280 und miteinander verbundene Komponenten befähigt, Befehle auszuführen, wie beispielsweise Small Computer System Interface-(SCSI)Befehle. Solche Befehle können für verschiedene Speichereinheiten ausgeführt werden, wie der Fachmann wiederum anerkennen wird, wie beispielsweise Plattenlaufwerke, Bandeinheiten, Solid-State-Einheiten (SSDs) und dergleichen. Während die Architektur 100 ein Beispiel für Komponenten bereitstellt, die zum Umsetzen verschiedener Aspekte der vorliegenden Erfindung und des beanspruchten Erfindungsgegenstands verwendet werden können, wird der Fachmann anerkennen, dass weitere derartige Architekturen in Betracht gezogen werden.
  • Unter folgender Bezugnahme auf 4 wird ein beispielhafter Teil 500 eines Deduplizierungssystems 300, wie vorher in auch in 3 zu sehen, veranschaulicht. Der Teil 500 des Deduplizierungssystems 300 ist in einer Computerumgebung als Teil davon betriebsfähig, wobei Mechanismen der oben veranschaulichten Ausführungsformen umgesetzt werden können. Es sollte jedoch anerkannt werden, dass 4 nur zu Beispielzwecken dient und keinerlei Einschränkung feststellen oder implizieren soll in Bezug auf die bestimmten Architekturen, in denen die beispielhaften Aspekte der verschiedenen Ausführungsformen umgesetzt werden können.
  • Das Deduplizierungssystem 300 enthält einen Prozessor 520 und einen Speicher 540, wie beispielsweise einen Arbeitsspeicher (RAM). Das Deduplizierungssystem 300 kann betriebsfähig an mehrere Komponenten gekoppelt sein, die der Einfachheit halber nicht veranschaulicht sind, einschließlich eine Anzeige, die Bilder wie beispielsweise Fenster für den Benutzer auf einer grafischen Benutzeroberfläche darstellt, eine Tastatur, eine Maus, ein Drucker und dergleichen. Selbstverständlich erkennt der Fachmann, dass jede Kombination der vorgenannten Komponenten oder jede Anzahl von verschiedenen Komponenten, Peripherie-Einheiten und andere Einheiten mit dem Deduplizierungssystem 300 verwendet werden können. In der veranschaulichten Ausführungsform arbeitet das Deduplizierungssystem 300 unter der Steuerung eines Betriebssystems (OS) 560 (z. B. z/OS®, OS/2®, LINUX®, UNIX®, WINDOWS®, MAC OS®), das in dem Speicher 540 gespeichert ist und eine Schnittstelle zum Benutzer bildet, um Eingaben und Befehle anzunehmen und Ergebnisse zu präsentieren. In einer Ausführungsform der vorliegenden Erfindung unterstützt das Betriebssystem 560 Geschwindigkeitskontrollmechanismen gemäß der vorliegenden Erfindung. Zu diesem Zweck enthält das Betriebssystem 560 ein Geschwindigkeitskontrollmodul 660, das angepasst werden kann, um verschiedene Prozesse und Mechanismen in den beispielhaften Verfahren hierin auszuführen.
  • Das Deduplizierungssystem 300 kann einen Compiler 600 umsetzen, der es ermöglicht, ein Anwendungsprogramm 580, das in einer Programmiersprache wie COBOL®, PL/1®, C®, C++®, JAVA®, ADA®, BASIC®, VISUAL BASIC® oder irgendeiner anderen Programmiersprache geschrieben ist, in Code zu übersetzen, der durch den Prozessor 520 lesbar ist. Nach dem Abschluss greift das Anwendungsprogramm 580 auf die in dem Speicher 540 des Systems 300 gespeichert Daten zu und bearbeitet sie unter Verwendung der Beziehungen und der Logik, die unter Verwendung des Compilers 600 erzeugt wurde.
  • Zur weiteren Umsetzung und Ausführung von Mechanismen und Prozessen gemäß der vorliegenden Erfindung kann das Betriebssystem 560 in Verbindung mit dem Speicher 540, dem Prozessor 520, dem Anwendungsprogramm 580 und anderen Computerdatenverarbeitungs-, Netzwerk- und Speicherkomponenten Verarbeitungsfunktionen 640 umsetzen, um Datenblöcke von deduplizierten Daten zu verarbeiten. Wie der Fachmann anerkennen wird, können die Mechanismen der Verarbeitungsfunktionen 640 und die Datenblöcke 620 wie gegenwärtig veranschaulicht in verschiedenen Formen und Architekturen umgesetzt werden. Dementsprechend soll die Veranschaulichung der Verarbeitungsfunktionen 640 und der Datenblöcke 620 in der vorliegenden Figur wiederum logische Beziehungen zwischen möglichen Datenverarbeitungskomponenten in dem Deduplizierungssystem 300 aufzeigen und keine spezifische physische Struktur oder Beziehung implizieren.
  • In einer Ausführungsform sind Anweisungen, die das Betriebssystem 560, das Computerprogramm 580 und den Compiler 600 sowie die Verarbeitungsfunktionen 640 und Datenblöcke 620 umsetzen, konkret in einem computerlesbaren Medium eingebettet, zu dem eine oder mehrere feste oder entfernbare Datenspeichereinheiten gehören können, wie beispielsweise ein ZIP-Laufwerk, eine Diskette, eine Festplatte, eine DVD/CD-ROM, ein digitales Band, SSDs usw. Ferner enthalten das Betriebssystem 560 und das Anwendungsprogramm 580 Anweisungen (z. B. in ausführbaren Abschnitten), die, wenn sie von dem System 300 gelesen und ausgeführt werden, das System veranlassen, die Schritte auszuführen, die zum Umsetzen und/oder Verwenden der vorliegenden Erfindung erforderlich sind. Anweisungen des Anwendungsprogramms 580 und/oder des Betriebssystems 560 können auch konkret in dem Speicher 540 eingebettet sein und/oder über ein Netzwerk 200 über verschiedene Komponenten (z. B. Router 320, 3) übertragen werden oder auf sie kann von diesen zugegriffen werden. Daher sollen die Begriffe „Fertigungsartikel”, „Programmspeichereinheit” und „Computerprogrammprodukt”, wie sie hierin eventuell verwendet werden, ein Computerprogramm umfassen, auf das von jeder computerlesbaren Einheit oder jedem computerlesbaren Medium aus zugegriffen werden kann und von diesen aus betriebsfähig ist.
  • Ausführungsformen der vorliegenden Erfindung können ein oder mehrere zugehörige Software-Anwendungsprogramme 580 enthalten, die zum Beispiel Funktionen zum Verwalten eines verteilten Computersystems enthalten, das ein Netzwerk von Datenverarbeitungseinheiten aufweist, wie beispielsweise ein Speicherbereichsnetzwerk (SAN). Dementsprechend kann der Prozessor 520 einen oder mehrere Speicherverwaltungsprozessoren (SMP) aufweisen. Das Anwendungsprogramm 580 kann in einem einzelnen Computer und/oder Deduplizierungssystem 300 oder als Teil eines verteilten Computersystems arbeiten, das ein Netzwerk von Datenverarbeitungseinheiten aufweist. Das Netzwerk kann einen oder mehrere Computer umfassen, die über ein lokales Netzwerk und/oder eine Internetverbindung (die öffentlich oder sicher sein kann, z. B. über eine virtuelle private Netzwerk-(VPN)Verbindung) oder über einen Fibre Channel SAN oder andere bekannte Netzwerktypen verbunden sind, wie vom Fachmann verstanden wird. (Zu beachten ist, dass ein Fibre Channel SAN typischerweise nur für Computer zum Datenaustausch mit Speichersystemen und nicht untereinander verwendet wird.)
  • Es ist anzumerken, dass Ausführungsreihenfolgen von Prozessen, wie Operationen, Prozeduren, Schritte und Stufen in den Einheiten, Systemen, Programmen und Verfahren, die unter dem Schutzumfang von Ansprüchen, der Beschreibung und der Zeichnungen gezeigt sind, insbesondere durch die Verwendung von Ausdrücken wie „vor” und „bevor” nicht deutlich angegeben sind. Deshalb sind diese Prozesse in beliebigen Reihenfolgen ausführbar, es sei denn, eine Ausgabe von einem vorhergehenden Prozess wird in einem darauffolgenden Prozess verwendet. Selbst wenn irgendein betrieblicher Ablauf in dem Schutzumfang von Ansprüchen, in der Beschreibung oder in den Zeichnungen der Einfachheit halber unter Verwendung von Ausdrücken wie „zuerst” und „anschließend” beschrieben wurde, so bedeutet dies nicht notwendigerweise, dass der betriebliche Ablauf in einer Reihenfolge ausgeführt werden muss, die durch diese Ausdrücke angegeben wird.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • US 2008/0263109 A1 [0004]
    • US 7584338 [0004]

Claims (20)

  1. Verfahren zum Replizieren von Daten, aufweisend: Empfangen (14) von Metadaten und zu den Metadaten zugehörigen Daten an einem ersten Datenserver (44); Identifizieren (16) eines neuen Teils der Daten, der noch nicht auf dem ersten Datenserver gespeichert ist; und Speichern (18) des neuen Teils (50) der Daten auf einem zweiten Datenserver, bevor die Metadaten (52) auf dem zweiten Datenserver (46) gespeichert werden.
  2. Verfahren nach Anspruch 1, wobei das Identifizieren (16) des neuen Teils (50) von Daten aufweist: Aufteilen der Daten in eine Vielzahl von Teilen; Berechnen eines Hash-Werts für jeden der Vielzahl von Teilen; und Vergleichen der Hash-Werte der Vielzahl von Teilen mit Hash-Werten für Teile von Daten, die bereits auf dem ersten Datenserver (44) gespeichert sind.
  3. Verfahren nach Anspruch 2, ferner aufweisend das Speichern des neuen Teils (50) der Daten auf dem ersten Datenserver (44).
  4. Verfahren nach Anspruch 3, des Weiteren aufweisend: wenn der neue Teil (50) von Daten, der auf dem ersten Datenserver (44) gespeichert ist, als beschädigt erkannt wird, Senden des neuen Teils von Daten, der auf dem zweiten Datenserver (46) gespeichert ist, an den ersten Datenserver; und Ersetzen des beschädigten neuen Teils von Daten auf dem ersten Datenserver durch den neuen Teil von Daten, der von dem zweiten Datenserver gesendet wurde.
  5. Verfahren nach Anspruch 1, des Weiteren aufweisend: Initiieren eines Replikationsprozesses zwischen dem ersten Datenserver (44) und dem zweiten Datenserver (46); und Speichern der Metadaten (52) auf dem zweiten Datenserver, nachdem der neue Teil von Daten auf dem zweiten Datenserver gespeichert ist.
  6. Verfahren nach Anspruch 5, wobei der neue Teil (50) von Daten eine Vielzahl von Bereichen von neuen Daten aufweist, und ferner aufweisend, wenn der Replikationsprozess initiiert wird, bevor alle Bereiche von neuen Daten auf dem zweiten Datenserver (46) gespeichert sind, Speichern der restlichen Bereiche von neuen Daten auf dem zweiten Datenserver, nachdem die Metadaten (52) auf dem zweiten Datenserver gespeichert sind.
  7. Verfahren nach Anspruch 6, wobei der zweite Datenserver (46) von dem ersten Datenserver (44) entfernt angeordnet ist.
  8. Computersystem, aufweisend: mindestens ein computerlesbares Medium; und mindestens einen Prozessor (520) in betriebsfähiger Datenübertragung mit dem mindestens einen computerlesbaren Medium, wobei der mindestens eine Prozessor angepasst ist zum: Empfangen (14) von Metadaten (52) und zu den Metadaten zugehörigen Daten (50) an einem ersten Datenserver (44); Identifizieren (16) eines neuen Teils (50) der Daten, der noch nicht auf dem ersten Datenserver gespeichert ist; und Speichern (18) des neuen Teils der Daten auf einem zweiten Datenserver (46), bevor die Metadaten auf dem zweiten Datenserver (46) gespeichert werden.
  9. Computersystem nach Anspruch 8, wobei das Identifizieren (16) des neuen Teils (50) von Daten aufweist: Aufteilen der Daten in eine Vielzahl von Teilen; Berechnen eines Hash-Werts für jeden der Vielzahl von Teilen; und Vergleichen der Hash-Werte der Vielzahl von Teilen mit Hash-Werten für Teile von Daten, die bereits auf dem ersten Datenserver (44) gespeichert sind.
  10. Computersystem nach Anspruch 9, wobei der mindestens eine Prozessor (520) ferner angepasst ist, um den neuen Teil (50) der Daten auf dem ersten Datenserver (44) zu speichern.
  11. Computersystem nach Anspruch 10, wobei der mindestens eine Prozessor (520) ferner angepasst ist zum: wenn der neue Teil (50) von Daten, der auf dem ersten Datenserver (44) gespeichert ist, als beschädigt erkannt wird, Senden des neuen Teils von Daten, der auf dem zweiten Datenserver (46) gespeichert ist, an den ersten Datenserver; und Ersetzen des beschädigten neuen Teils von Daten auf dem ersten Datenserver durch den neuen Teil von Daten, der von dem zweiten Datenserver gesendet wurde.
  12. Computersystem nach Anspruch 8, wobei der mindestens eine Prozessor (520) ferner angepasst ist zum: Initiieren eines Replikationsprozesses zwischen dem ersten Datenserver (44) und dem zweiten Datenserver (46); und Speichern der Metadaten (52) auf dem zweiten Datenserver, nachdem der neue Teil von Daten auf dem zweiten Datenserver gespeichert ist.
  13. Computersystem nach Anspruch 12, wobei der neue Teil (50) von Daten eine Vielzahl von Bereichen von neuen Daten aufweist, und wobei der mindestens eine Prozessor (520) ferner angepasst ist zum: wenn der Replikationsprozess initiiert wird, bevor alle Bereiche von neuen Daten auf dem zweiten Datenserver (46) gespeichert sind, Speichern der restlichen Bereiche von neuen Daten auf dem zweiten Datenserver, nachdem die Metadaten (52) auf dem zweiten Datenserver gespeichert sind.
  14. Computersystem nach Anspruch 13, wobei der zweite Datenserver (46) von dem ersten Datenserver (44) entfernt angeordnet ist.
  15. Computerprogrammprodukt zum Replizieren von Daten in einer Datenverarbeitungsumgebung, wobei das Computerprogrammprodukt computerlesbare Programmcodeabschnitte hat, wobei die computerlesbaren Programmcodeabschnitte aufweisen: einen ersten ausführbaren Abschnitt zum Empfangen (14) von Metadaten und zu den Metadaten zugehörigen Daten an einem ersten Datenserver (44); einen zweiten ausführbaren Abschnitt zum Identifizieren (16) eines neuen Teils der Daten, der noch nicht auf dem ersten Datenserver gespeichert ist; und einen dritten ausführbaren Abschnitt zum Speichern (18) des neuen Teils (50) der Daten auf einem zweiten Datenserver, bevor die Metadaten (52) auf dem zweiten Datenserver (46) gespeichert werden.
  16. Computerprogrammprodukt nach Anspruch 15, wobei das Identifizieren (16) des neuen Teils (50) von Daten aufweist: Aufteilen der Daten in eine Vielzahl von Teilen; Berechnen eines Hash-Werts für jeden der Vielzahl von Teilen; und Vergleichen der Hash-Werte der Vielzahl von Teilen mit Hash-Werten für Teile von Daten, die bereits auf dem ersten Datenserver (44) gespeichert sind.
  17. Computerprogrammprodukt nach Anspruch 16, ferner aufweisend einen vierten ausführbaren Abschnitt zum Speichern des neuen Teils (50) der Daten auf dem ersten Datenserver (44).
  18. Computerprogrammprodukt nach Anspruch 17, ferner aufweisend: einen fünften ausführbaren Abschnitt zum Senden des neuen Teils (50) von Daten, der auf dem zweiten Datenserver (46) gespeichert ist, an den ersten Datenserver (44), wenn der neue Teil von Daten, der auf dem ersten Datenserver gespeichert ist, als beschädigt erkannt wird; und einen sechsten ausführbaren Abschnitt zum Ersetzen des beschädigten neuen Teils von Daten auf dem ersten Datenserver durch den neuen Teil von Daten, der von dem zweiten Datenserver gesendet wurde.
  19. Computerprogrammprodukt nach Anspruch 15, ferner aufweisend: einen vierten ausführbaren Abschnitt zum Initiieren eines Replikationsprozesses zwischen dem ersten Datenserver (44) und dem zweiten Datenserver (46); und einen fünften ausführbaren Abschnitt zum Speichern der Metadaten auf dem zweiten Datenserver, nachdem der neue Teil von Daten auf dem zweiten Datenserver gespeichert ist.
  20. Computerprogrammprodukt nach Anspruch 19, wobei der zweite Datenserver (46) von dem ersten Datenserver (44) entfernt angeordnet ist, und der neue Teil von Daten eine Vielzahl von Bereichen von neuen Daten aufweist, und ferner aufweisend: einen sechsten ausführbaren Abschnitt zum Speichern der restlichen Bereiche von neuen Daten auf dem zweiten Datenserver, nachdem die Metadaten (52) auf dem zweiten Datenserver gespeichert sind, wenn der Replikationsprozess initiiert wird, bevor alle Bereiche von neuen Daten auf dem zweiten Datenserver gespeichert sind.
DE112011103367T 2010-12-13 2011-11-28 Replizieren von Daten Ceased DE112011103367T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/966,649 US8438130B2 (en) 2010-12-13 2010-12-13 Method and system for replicating data
USUS-12/966,649 2010-12-13
PCT/EP2011/071209 WO2012079967A2 (en) 2010-12-13 2011-11-28 Replicating data

Publications (1)

Publication Number Publication Date
DE112011103367T5 true DE112011103367T5 (de) 2013-07-18

Family

ID=45063131

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112011103367T Ceased DE112011103367T5 (de) 2010-12-13 2011-11-28 Replizieren von Daten

Country Status (5)

Country Link
US (1) US8438130B2 (de)
CN (1) CN103229172B (de)
DE (1) DE112011103367T5 (de)
GB (1) GB2500160A (de)
WO (1) WO2012079967A2 (de)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8825792B1 (en) 2008-03-11 2014-09-02 United Services Automobile Association (Usaa) Systems and methods for online brand continuity
US9633022B2 (en) * 2012-12-28 2017-04-25 Commvault Systems, Inc. Backup and restoration for a deduplicated file system
WO2015081473A1 (zh) * 2013-12-02 2015-06-11 华为技术有限公司 异步复制方法、装置与系统
US9450879B2 (en) * 2014-05-09 2016-09-20 Nexgen Storage, Inc. Adaptive bandwidth throttling
US10387374B2 (en) 2015-02-27 2019-08-20 Exagrid Systems, Inc. Scalable grid deduplication
US10073855B2 (en) 2015-05-21 2018-09-11 Exagrid Systems, Inc. Dynamic and optimized management of grid system resources
US10303656B2 (en) 2015-08-13 2019-05-28 Exagrid Systems, Inc. Parallelizing and deduplicating backup data
US11150997B2 (en) * 2015-08-19 2021-10-19 Exagrid Systems, Inc. Adaptive bandwidth management of a replication process
CN105631042B (zh) * 2016-01-26 2019-02-22 北京京东尚科信息技术有限公司 一种数据验重的方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080263109A1 (en) 2007-04-19 2008-10-23 Data Domain, Inc. Seeding replication
US7584338B1 (en) 2005-09-27 2009-09-01 Data Domain, Inc. Replication of deduplicated storage system

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100831768B1 (ko) * 2000-02-04 2008-05-27 리슨.컴 .인크. 매체 데이터 획득 방법, 분산 매체 네트워크 및 메타 데이타 서버를 위한 시스템
CN101216869B (zh) * 2002-10-15 2011-08-24 三星电子株式会社 用于管理元数据的方法
US7440981B2 (en) 2003-07-31 2008-10-21 Microsoft Corporation Systems and methods for replicating data stores
US20050071391A1 (en) * 2003-09-29 2005-03-31 International Business Machines Corporation High availability data replication set up using external backup and restore
US7870409B2 (en) * 2007-09-26 2011-01-11 Hitachi, Ltd. Power efficient data storage with data de-duplication
CN101216791B (zh) * 2008-01-04 2010-07-07 华中科技大学 基于指纹的文件备份方法
US20100293147A1 (en) * 2009-05-12 2010-11-18 Harvey Snow System and method for providing automated electronic information backup, storage and recovery
US8356017B2 (en) 2009-08-11 2013-01-15 International Business Machines Corporation Replication of deduplicated data
US8700676B2 (en) * 2010-04-09 2014-04-15 Dell Products L.P. System and method for appending metadata to objects

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7584338B1 (en) 2005-09-27 2009-09-01 Data Domain, Inc. Replication of deduplicated storage system
US20080263109A1 (en) 2007-04-19 2008-10-23 Data Domain, Inc. Seeding replication

Also Published As

Publication number Publication date
US20120150798A1 (en) 2012-06-14
CN103229172B (zh) 2017-07-11
US8438130B2 (en) 2013-05-07
WO2012079967A3 (en) 2012-10-26
GB201312426D0 (en) 2013-08-28
GB2500160A (en) 2013-09-11
WO2012079967A2 (en) 2012-06-21
CN103229172A (zh) 2013-07-31

Similar Documents

Publication Publication Date Title
DE112011103367T5 (de) Replizieren von Daten
DE112018000193B4 (de) Daten sequenziell in Zonen in einem verstreuten Speichernetzwerk speichern
DE112012005037B4 (de) Verwalten von redundanten unveränderlichen Dateien unter Verwendung von Deduplizierungen in Speicher-Clouds
DE112016003120B4 (de) Umleiten einer Kopie beim Schreiben
DE112011100819B4 (de) Speicherplatzreservierung in einem Deduplizierungssystem
DE112010002938B4 (de) Eine integrierte Herangehensweise zur Deduplizierung von Daten in einer verteiltenUmgebung, die eine Quelle und ein Ziel umfasst
DE102008015662B4 (de) Beseitigung von Daten
DE112010003262B4 (de) Synchronisierung replizierter sequenzieller Zugriffsspeicherkomponenten
DE102013208930A1 (de) Zusammenfassen von Einträgen in einem Deduplizierungs-lndex
DE112018004008B4 (de) Auf dateisysteminhalten beruhende sicherheit
DE112012002762T5 (de) Replikationen von Datenobjekten von einem Quellserver auf einen Zielserver
DE112012004937T5 (de) Fingerabdruckbasierte Datendeduplizierung
DE102013209528A1 (de) Benutzergesteuerte Replikation in einem System für synchronisierte Objektreplikationen
DE102013215009A1 (de) Verfahren und System zur Optimierung der Datenübertragung
DE112010004931T5 (de) Mehrphasige Wiederherstellung von Dateisystemen mit SelektiverBedarfsweiser Verfügbarkeit von Daten(
DE112015000343T5 (de) Erstellen einer Wiederherstellungskopie von einer Quelldaten-Kopie in einem Repository, das Quelldaten an verschiedenen Zeitpunkten aufweist
DE102013201174A1 (de) Online-Überprüfung einer Standby-Datenbank in physischen Replikationsumgebungen mit Protokollversand
DE112012001267T5 (de) Verfahren, Systeme und Computerprogrammprodukte zur abgestimmten Notfallwiederherstellung
DE102014116369A1 (de) Verwaltung von sprachmarkern bei internationaler datenspeicherung
DE112015000222T5 (de) Zusammenführen von mehreren Zeitpunktkopien zu einer zusammengeführten Zeitpunktkopie
DE112017005588T5 (de) Speichern und abrufen von eingeschränkten datensätzen in und aus einem cloud-netzwerk mit nichteingeschränkten datensätzen
DE112018000227B4 (de) Verfahren zum teilweisen Aktualisieren von Dateninhalten in einem verteilten Speichernetzwerk
DE102021125630A1 (de) Datensynchronisation in einem datenanalysesystem
DE112010004530T5 (de) Transaktionsaktualisierung bei Dynamischen Verteilten Arbeitslasten
DE112019000849T5 (de) Hostorientierter Aktualisierungsschreibvorgang

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final
R003 Refusal decision now final

Effective date: 20141125