DE112013000881T5 - Systeme und Verfahren zum Verhindern von Datenverlust - Google Patents

Systeme und Verfahren zum Verhindern von Datenverlust Download PDF

Info

Publication number
DE112013000881T5
DE112013000881T5 DE112013000881.5T DE112013000881T DE112013000881T5 DE 112013000881 T5 DE112013000881 T5 DE 112013000881T5 DE 112013000881 T DE112013000881 T DE 112013000881T DE 112013000881 T5 DE112013000881 T5 DE 112013000881T5
Authority
DE
Germany
Prior art keywords
data
technique
storage
computer code
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE112013000881.5T
Other languages
English (en)
Inventor
Roah c/o IBM Corp. Jishi
David Ray c/o IBM Corp. Kahler
Keith Geoffrey c/o IBM Corp. Morrison
Allen c/o IBM Corp. Nielsen Karl
Xuedong c/o IBM Corp. Gao
Micah c/o IBM Corp. Robison
Jeremy Leigh c/o IBM Corp. Royall
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE112013000881T5 publication Critical patent/DE112013000881T5/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1092Rebuilding, e.g. when physically replacing a failing disk
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • G06F11/1662Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/10Indexing scheme relating to G06F11/10
    • G06F2211/1002Indexing scheme relating to G06F11/1076
    • G06F2211/1059Parity-single bit-RAID5, i.e. RAID 5 implementations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

Verfahren und Systeme zum Verhindern von Datenverlust in Speichersystemen werden bereitgestellt. Ein Verfahren enthält ein Erkennen, dass eine Speichereinheit in einer Vielzahl von Speichereinheiten eine Fehlfunktion aufweist, und ein Ermitteln des Typs der Fehlfunktion. Das Verfahren enthält des Weiteren ein Auswählen einer SMART-Wiederherstellungstechnik, einer normalen Wiederherstellungstechnik, einer Datenmigrationstechnik oder einer Benutzerdaten-Sicherungstechnik um die Daten in der Speichereinheit anhand des festgestellten Typs der Fehlfunktion zu erhalten und um die ausgewählte Technik an der Speichereinheit auszuführen. Ein System enthält eine Vielzahl von Speichereinheiten, die so konfiguriert sind, dass sie Daten in der Vielzahl von Datenadressen speichern, und einen Prozessor, der so eingerichtet ist, dass er das oben genannte Verfahren ausführt. Physische Computer-Speichermedien, die ein Verfahren in Form eines Computerprogrammprodukts zum Verhindern eines Verlusts von Daten in einem Speichersystem enthalten, werden außerdem bereitgestellt. Ein physisches Computer-Speichermedium enthält Computercode zum Ausführen des oben genannten Verfahrens.

Description

  • HINTERGRUND DER ERFINDUNG
  • Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich allgemein auf Datenverarbeitungssysteme und insbesondere auf Verfahren und Systeme zum Verhindern von Datenverlust in Speicher-Teilsystemen.
  • Beschreibung des Standes der Technik
  • Die RAID-Technologie wird bei Hochleistungsspeicher-Teilsystemen weitverbreitet verwendet. Jeder RAID-Typ kann eine begrenzte Anzahl von Plattenlaufwerkfehlern tolerieren. Bei einem RAID-5-Array darf beispielsweise höchstens ein Plattenlaufwerkfehler zu einem beliebigen Zeitpunkt auftreten, damit kein Datenverlust auftritt. Wenn während der Wiederherstellungsperiode ein weiteres Plattenlaufwerk einen Fehler aufweist, tritt ein Datenverlust auf.
  • Bestimmte RAID-Architekturen setzen prioritätsbehaftete Wiederherstellungs-Algorithmen um, so dass dann, wenn eine E/A-Aktivität auf Daten in dem RAID gerichtet ist, das nicht durch Redundanz geschützt ist, die E/A-Aktivität in Warteschlangen eingestellt oder blockiert wird, bis die Redundanz der Daten durch den anwendbaren RAID-Algorithmus wiederhergestellt ist. Wenn die Daten beispielsweise durch ein RAID-5-Paritäts-Redundanzschema geschützt sind und ein Host oder Client eine Leseoperation an das RAID-Array richtet, kann der RAID-5-Algorithmus zuerst angewendet werden, bevor die Host- oder Client-Leseanforderung bedient wird.
  • Auf der RAID-Ebene gibt es verschiedene Komponenten, und es gibt außerdem redundante Komponenten. Bei einer RAID-5-Konfiguration wird eine Paritätskomponente verwendet, so dass ein Datenverlustfehler von einer anderen Platte wiederhergestellt werden kann, was als behebbarer Fehler bezeichnet wird, der zum Verfolgen der Wiederherstellung einen Schwellenwert verwenden kann. Wenn weitere Fehler (d. h. nicht behebbare Fehler) auftreten, sollte die fehlerbehaftete Platte möglichst bald ersetzt werden.
  • Gegenwärtige Verfahren zum vorausschauenden Entfernen eines verdächtigen Elements einer Array-Komponente beruhen auf einem Zurückweisen des Plattenlaufwerks des Elements aus dem RAID-Array, als ob es ausgefallen wäre, um das Wiederherstellen des RAID aus der Parität auszulösen. Durch das lange ablaufende Wiederherstellen des Array ist die Array-Redundanz in Bezug auf einen sekundären Fehler ungeschützt, der zum Datenverlust führen kann. Anschließend erhöht die Array-Wiederherstellung die Wahrscheinlichkeit des Auftretens eines sekundären Fehlers, der einen einheitenübergreifenden Datenverlust bewirken kann. Obwohl RAID eine Redundanz bereitstellt, werden bei der Architektur vor einem Fehler keine gefährdeten Elemente vorhergesagt oder so aus dem System entfernt, dass eine Array-Wiederherstellung vermieden wird.
  • KURZDARSTELLUNG DER ERFINDUNG
  • Verschiedene Ausführungsformen stellen Systeme bereit, um einen Verlust von Daten in einem Speichersystem zu verhindern. Ein System weist eine Vielzahl von Speichereinheiten, die so eingerichtet sind, dass sie Daten an einer Vielzahl von Datenadressen speichern, und einen Prozessor auf, der mit der Vielzahl von Speichereinheiten verbunden ist. Der Prozessor ist so eingerichtet, dass er erkennt, dass eine Speichereinheit unter der Vielzahl von Speichereinheiten eine Fehlfunktion aufweist, und den Typ der Fehlfunktion ermittelt. Der Prozessor ist ferner so eingerichtet, dass er eine SMART-Wiederherstellungstechnik, eine normale Wiederherstellungstechnik, eine Daten-Migrationstechnik oder eine Benutzerdaten-Sicherungstechnik auswählt, um die Daten in der Speichereinheit auf der Grundlage des ermittelten Typs der Fehlfunktion zu erhalten und die ausgewählte SMART-Wiederherstellungstechnik, normale Wiederherstellungstechnik, Daten-Migrationstechnik oder Benutzerdaten-Sicherungstechnik an der Speichereinheit auszuführen.
  • Weitere Ausführungsformen stellen Verfahren bereit, um einen Verlust von Daten in einem Speichersystem zu verhindern, das eine Vielzahl von Speichereinheiten enthält, von denen jede Daten an einer Vielzahl von Datenadressen speichert. Ein Verfahren weist ein Erkennen auf, dass eine Speichereinheit aus der Vielzahl von Speichereinheiten eine Fehlfunktion aufweist, und ein Ermitteln des Typs der Fehlfunktion. Das Verfahren weist des Weiteren ein Auswählen einer SMART-Wiederherstellungstechnik, einer normale Wiederherstellungstechnik, einer Daten-Migrationstechnik oder einer Benutzerdaten-Sicherungstechnik auf, um die Daten in der Speichereinheit auf der Grundlage des ermittelten Typs der Fehlfunktion zu erhalten und die ausgewählte SMART-Wiederherstellungstechnik, normale Wiederherstellungstechnik, Daten-Migrationstechnik oder Benutzerdaten-Sicherungstechnik an der Speichereinheit auszuführen.
  • Verschiedene weitere Ausführungsformen stellen physische Computerspeichermedien bereit (z. B. eine elektrische Verbindung mit einer oder mehreren Leitungen, eine tragbare Computerdiskette, eine Festplatte, einen Direktzugriffsspeicher (RAM), einen Festwertspeicher (ROM), ein löschbarer programmierbarer Festwertspeicher (EPROM oder Flash-Speicher), ein Lichtwellenleiter, ein tragbarer Compactdisc-Festwertspeicher (CD-ROM), eine optische Speichereinheit, eine magnetische Speichereinheit oder jede geeignete Kombination des Vorhergehenden), die ein Verfahren in Form eines Computerprogrammprodukts zum Verhindern eines Verlusts von Daten in einem Speichersystem aufweisen, das eine Vielzahl von Speichereinheiten enthält, von denen jede Daten an einer Vielzahl von Datenadressen speichert. Ein physisches Computer-Speichermedium weist Computercode zum Erkennen, dass eine Speichereinheit von der Vielzahl von Speichereinheiten eine Fehlfunktion ausführt, und Computercode zum Ermitteln des Typs der Fehlfunktion auf. Das physische Computer-Speichermedium weist des Weiteren Computercode zum Auswählen einer SMART-Wiederherstellungstechnik, einer normale Wiederherstellungstechnik, einer Daten-Migrationstechnik oder einer Benutzerdaten-Sicherungstechnik, um die Daten in der Speichereinheit auf der Grundlage des ermittelten Typs der Fehlfunktion zu erhalten, und Computercode zum Ausführen der ausgewählten SMART-Wiederherstellungstechnik, der normalen Wiederherstellungstechnik, der Daten-Migrationstechnik oder der Benutzerdaten-Sicherungstechnik an der Speichereinheit auf.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • Damit die Vorteile der Erfindung leicht verständlich sind, wird eine speziellere Beschreibung der Erfindung, die oben kurz dargelegt wurde, unter Bezugnahme auf spezifische Ausführungsformen wiedergegeben, die in den beigefügten Zeichnungen veranschaulicht sind. Es ist klar, dass diese Zeichnungen lediglich typische Ausführungsformen der Erfindung darstellen und deshalb ihren Umfang nicht einschränken sollen, wobei die Erfindung durch die Verwendung der beigefügten Zeichnungen mit zusätzlicher Spezifität und Ausführlichkeit beschrieben und erläutert wird, in denen:
  • 1 ein Blockschaltplan einer Ausführungsform eines Systems zum Verhindern von Datenverlust in einem Speicher-Teilsystem ist; und
  • 2 ein Ablaufplan einer Ausführungsform eines Verfahrens zum Verhindern von Datenverlust in einem Speichersystem ist.
  • GENAUE BESCHREIBUNG DER ZEICHNUNGEN
  • Verschiedene Ausführungsformen stellen Systeme und Verfahren zum Verhindern von Datenverlust in Speicher-Teilsystemen bereit. Außerdem werden physische Computerspeichermedien bereitgestellt (z. B. eine elektrische Verbindung mit einer oder mehreren Leitungen, eine tragbare Computerdiskette, eine Festplatte, ein Direktzugriffsspeicher (RAM), ein Festwertspeicher (ROM), ein löschbarer programmierbarer Festwertspeicher (EPROM oder Flash-Speicher), ein Lichtwellenleiter, ein tragbarer Compactdisc-Festwertspeicher (CD-ROM), eine optische Speichereinheit, eine magnetische Speichereinheit oder jede geeignete Kombination des Vorhergehenden), die ein Verfahren in Form eines Computerprogrammprodukts zum Verhindern eines Verlusts von Daten in einem Speichersystem aufweisen.
  • In den Figuren handelt es sich bei 1 um einen Blockschaltplan einer Ausführungsform eines Systems 100 zum Verhindern von Datenverlust in einem Speicher-Teilsystem. Zumindest in der dargestellten Ausführungsform weist das System 100 ein Speicher-Teilsystem 110 eines redundanten Array unabhängiger Platten (RAID-Speicher-Teilsystem) auf, das mit einem Verwaltungsknoten 120 verbunden ist, der mit einem Netzwerk 130 (z. B. ein Weitverkehrsnetzwerk (WAN), ein lokales Netzwerk (LAN), ein Speicherbereich-Netzwerk (SAN), ein konvergentes Netzwerk, ein Intranet, das Internet und/oder ähnliche Netzwerke) Daten austauscht.
  • Das RAID-Speicher-Teilsystem 110 weist eine Vielzahl von Speichereinheiten auf (z. B. Platten 1110 bis 111n). Die Platten 1110 bis 111n können in einer beliebigen RAID-Konfiguration (z. B. RAID-0, RAID-1, RAID-2, RAID-3, RAID-4, RAID-5, RAID-6, RAID-10, usw.) angeordnet sein. Jede der Platten 1110 bis 111n ist so eingerichtet, dass sie Daten an einer Vielzahl von Datenadressen in den Platten 1110 bis 111n speichert. Zum Verhindern eines Verlusts von Daten in den Platten 1110 bis 111n weist das System 100 einen Verwaltungsknoten 120 auf.
  • Der Verwaltungsknoten 120 weist in einer Ausführungsform ein Datensicherungsmodul 1210 auf, das so eingerichtet ist, dass es einen Verlust von Daten in den Platten 1110 bis 111n verhindert. Bei dem Verwaltungsknoten 120 kann es sich um einen beliebigen Prozessor, eine Steuereinheit und/oder eine andere Einheit handeln, die in der Lage ist, den Computercode auszuführen, der das Datensicherungsmodul 1210 bildet.
  • Das Datensicherungsmodul 1210 ist so eingerichtet, dass es ermittelt, ob eine oder mehrere der Platten 1110 bis 111n einen Fehlerzustand aufweisen, und den Typ des Fehlerzustands ermittelt. Zu Beispielen von Fehlerzuständen gehören einfache oder Schwellenwertfehler (z. B. ein Medienfehler, ein Key-Code-Qualifier-(KCQ-)Fehler und ähnliche Fehler), eine oder mehrere fehlerbehaftete Platten, ein oder mehrere fehlerbehaftete RAID-Arrays und ähnliche Fehlerzustände, ohne darauf beschränkt zu sein.
  • Bei einer Ausführungsform ist das Datensicherungsmodul 1210 so eingerichtet, dass es eine SMART-Wiederherstellungstechnik einleitet, wenn das Datensicherungsmodul 1210 feststellt, dass eine oder mehrere der Platten 1110 bis 111n einen einfachen oder Schwellenwertfehler aufweisen. Der Ausdruck „SMART-Wiederherstellung” („SMART rebuild”) gilt für die Verwendung eines gespiegelten RAID-Paars als eine Komponente einer anderen RAID-Architektur.
  • Ein 3 + P RAID-5-Array enthält beispielsweise die Komponenten D1, D2, D3, P. Wenn bei diesem Array die Komponente D2 als Quelle einer SMART-Wiederherstellung verwendet wird, wird ein Spiegel-Array (RAID 1) über D2 eingerichtet, und ein RAID-Spiegel wird verwendet, um eine konsistente Spiegelung von D2 auszuführen. Dabei können die RAID-1-Spiegelkomponenten als D2s und D2t bezeichnet werden, wobei es sich bei D2s um die Komponente 2 des RAID-5-Array und bei D2t um das Ziel für den RAID-1-Spiegel handelt. Beim Wiederherstellen können Daten, die zu D2t geschrieben werden, aus D1, D3, P rekonstruiert oder von D2s gelesen werden.
  • Unter Fortsetzen des Beispiels kann die Komponente D2 als Quelle einer SMART-Wiederherstellung ausgewählt werden, ein flüchtiger RAID-1-Spiegel wird eingerichtet, und wenn D2t mit D2s konsistent wird, kann D2s aus dem RAID-5-Array logisch entfernt werden. Dabei wird D2T die Komponente 2 des RAID-5-Array.
  • Bei einer Ausführungsform ist das Datensicherungsmodul 1210 so eingerichtet, dass es erkennt, ob bei einer bestimmten Datenadresse und/oder einem Bereich von Adressen ein höheres Verlustrisiko besteht, und die SMART-Wiederherstellung priorisiert. Das heißt, das Datensicherungsmodul 1210 ist so eingerichtet, dass es die SMART-Wiederherstellung an der Datenadresse oder dem Bereich von Adressen ausführt, bevor die SMART-Wiederherstellung an anderen Adressen ausgeführt wird, bei denen kein Risiko des Datenverlusts ermittelt wurde.
  • Beispielsweise korreliert eine Komponente D3, bei der behebbare oder nichtbehebbare Fehler im LBA-Bereich Ma–Mb nach außen verlagert wurden, mit einem LBA-Bereich eines RAID-5-Array Xa–Xb. Eine andere Komponente D2, bei der behebbare oder nichtbehebbare Fehler im LBA-Bereich Na–Nb nach außen verlagert wurden, korreliert mit einem LBA-Bereich eines RAID-5-Array Ya–Yb. Eine SMART-Wiederherstellung wird gleichzeitig an den Komponenten D2 und D3 eingeleitet. Die RAID-5- und RAID-1-Topologie lautet D1 (D2s, D2t), (D3s, D3t) und P.
  • Die Client/Host-„Lesevorgänge” werden ausgelöst oder mit den RAID-LBAs Xa–Xb und den RAID-LBAs Na–Nb simuliert, die mit der Komponente D2s korrelieren. Gleichfalls werden „Lesevorgänge” ausgelöst und mit den RAID-LBAs Ya–Yb simuliert, die mit der Komponente D3s Ma–Mb korrelieren. Die RAID-Algorithmen wirken an D2t, indem von D2s gelesen wird oder mit RAID 5 von D1, D3s und P rekonstruiert wird, um LBAs Xa–Xb an D2t zu rekonstruieren. Die RAID-Algorithmen wirken an D3t, indem von D3s gelesen wird oder indem aus D1, D2s und P rekonstruiert wird, um LBAs Ma–Mb an D3t zu rekonstruieren. Das Ergebnis der Leseoperation besteht darin, dass in dem RAID-System zu einem frühen Zeitpunkt in dem Wiederherstellungszyklus für die LBA-Bereiche Xa–Xb und Ya–Yb des risikobehafteten Array Redundanz eingerichtet wird.
  • Die SMART-Wiederherstellung an D2t und D3t läuft normalerweise ab, bis für das Paar RAID 1-Redundanz eingerichtet wurde. Des Weiteren werden D2t und D3t die primären Komponenten des RAID-5-Array, und die flüchtigen RAID-1-Array-Beziehungen werden beendet. Durch Priorisieren von Lesevorgängen in dem RAID-Array auf der Grundlage der Vorgeschichte von ausfallenden oder fehlerbehafteten Array-Komponenten wird zu einem früheren Zeitpunkt in dem Wiederherstellungszyklus eine höhere Daten-Redundanz erreicht, und das Risiko eines einheitenübergreifenden Datenverlusts wird bei sich ausweitenden Fehlern geringer.
  • Der Ausdruck „einheitenübergreifender Datenverlust” („strip data loss”) gilt, wenn eine Array-Datenredundanz infolge des Fehlers von einer oder mehreren Komponenten ungeschützt ist und der RAID-Wiederherstellungs-Algorithmus auf einen nicht behebbaren Lesefehler während einer RAID-Wiederherstellungsoperation tritt, der eine korrekte Datenrekonstruktion verhindert. Diese Situation kann in einer Vielzahl von RAID-Algorithmen vorkommen: RAID 1 (Spiegeln), RAID 5 (Parität), RAID 6 und dergleichen.
  • Bei einer weiteren Ausführungsform ist das Datensicherungsmodul 1210 so eingerichtet, dass es eine „normale” Wiederherstellungstechnik ausführt, wenn das Datensicherungsmodul 1210 feststellt, dass eine oder mehrere der Platten 1110 bis 111n fehlerhaft oder ausgefallen sind. Die normale Wiederherstellungstechnik beinhaltet bei einer Ausführungsform Ersetzen der fehlerhaften oder ausgefallenen Platte(n) durch eine oder mehrere neue Platten und Wiederherstellen des RAID-Array aus der bzw. den nicht fehlerhaften oder korrekt funktionierenden Platte(n).
  • Das Datensicherungsmodul 1210 ist bei einer noch weiteren Ausführungsform so eingerichtet, dass es Daten von einem Array in der RAID-Architektur zu einem anderen Array in der RAID-Architektur verschiebt, wenn das Datensicherungsmodul 1210 feststellt, dass ein oder mehrere Arrays in der RAID-Architektur fehlerhaft ist bzw. sind und mehr als eine im Voraus festgelegte Zeitspanne verbleibt, bevor das Array oder die Arrays ausfallen. Bei der im Voraus festgelegten Zeitspanne handelt es sich um eine Zeitspanne, die ermöglicht, dass die Daten in dem bzw. den fehlerbehafteten Arrays zu einem oder mehreren anderen Arrays in der RAID-Architektur verschoben werden. Zu Beispielen der im Voraus festgelegten Zeitspanne gehören u. a. ein Tag, eine Woche, ein Monat oder jede andere Zeitspanne, die ermöglicht, dass die Daten in dem bzw. den fehlerbehafteten Arrays zu einem oder mehreren anderen Arrays in der RAID-Architektur verschoben werden. Wenn weniger Zeit als die im Voraus festgelegte Zeitspanne verbleibt, ist das Datensicherungsmodul 1210 so eingerichtet, dass es eine andere Datensicherungstechnik ausführt.
  • Wenn das Datensicherungsmodul 1210 feststellt, dass ein oder mehrere Arrays in der RAID-Architektur fehlerbehaftet sind und die Zeitspanne, die bis zum Ausfallen des Array oder der Arrays verbleibt, kleiner als die im Voraus festgelegte Zeitspanne oder gleich dieser ist, ist das Datensicherungsmodul 1210 so eingerichtet, dass es die Daten über ein Netzwerk 130 zu einer fernen Stelle zum Sichern überträgt. Bei einer Ausführungsform handelt es sich bei der fernen Stelle um ein anderes Speicher-Teilsystem in Bezug auf das System 100. Bei einer weiteren Ausführungsform handelt es sich bei der fernen Stelle um ein anderes Speicher-Teilsystem, das z. B. das Speicher-Teilsystem eines Kunden und/oder Client enthält.
  • Bei 2 handelt es sich um einen Ablaufplan einer Ausführungsform eines Verfahrens 200 zum Verhindern von Datenverlust in einem Speichersystem, das eine Vielzahl von Speichereinheiten (z. B. Platten 1110 bis 111n) aufweist, von denen jede Daten an einer Vielzahl von Datenadressen speichert. Das Verfahren 200 beginnt zumindest in der dargestellten Ausführungsform durch Feststellen und/oder Erkennen, dass eine oder mehrere Speichereinheiten einen Fehlerzustand aufweisen (Block 210) und Ermitteln des Typs des Fehlerzustands (Block 220).
  • Wenn es sich bei dem ermittelten Fehlerzustand um einen einfachen oder Schwellenwertfehler handelt (z. B. einen Medienfehler) (Block 225), beinhaltet das Verfahren Einleiten einer SMART-Wiederherstellung in der Speichereinheit bzw. den Speichereinheiten (Block 230). Nach dem Einleiten der SMART-Wiederherstellung beinhaltet das Verfahren Ermitteln, ob bei einer oder mehreren Datenadressen oder einem Bereich von Adressen ein größeres Risiko des Datenverlustes besteht (Block 235).
  • Wenn bei einer oder mehreren Datenadressen oder einem Bereich von Adressen ein größeres Risiko des Datenverlusts besteht als bei anderen Datenadressen, wird die SMART-Wiederherstellung zuerst an dieser bzw. diesen Datenadressen ausgeführt (Block 240), und die SMART-Wiederherstellung wird nacheinander an den Datenadressen ausgeführt (Block 245). Wenn bei einer oder mehreren Datenadressen oder einem Bereich von Adressen kein größeres Risiko des Datenverlusts besteht als bei anderen Datenadressen, wird die SMART-Wiederherstellung nacheinander an den Datenadressen ausgeführt (Block 145).
  • Wenn der ermittelte Fehlerzustand darin besteht, dass eine oder mehrere Speichereinheiten fehlerhaft oder ausgefallen sind (Block 250), beinhaltet das Verfahren 200 Ausführen einer normalen Wiederherstellung an der bzw. den Speichereinheiten (Block 255). Bei einer Ausführungsform beinhaltet das Ausführen der normalen Wiederherstellung Ersetzen der fehlerhaften oder ausgefallenen Speichereinheiten durch eine oder mehrere neue Speichereinheiten und Wiederherstellen des RAID-Array mittels der anderen nicht fehlerhaften oder korrekt funktionierenden Speichereinheiten.
  • Wenn der ermittelte Fehlerzustand darin besteht, dass ein oder mehrere RAID-Arrays fehlerhaft sind (Block 260), beinhaltet das Verfahren 200 Ermitteln, ob bis zum Ausfallen des RAID-Array eine Zeit verbleibt, die größer als eine im Voraus festgelegte Zeitspanne ist. Wenn bis zum Ausfallen des RAID-Array eine Zeit verbleibt, die größer als die im Voraus festgelegte Zeitspanne ist, beinhaltet das Verfahren 200 Verschieben von Daten von dem fehlerhaften Array in der RAID-Architektur zu einem anderen Array in der RAID-Architektur (Block 280). Bei der im Voraus festgelegten Zeitspanne handelt es sich um eine Zeitspanne, die ermöglicht, dass die Daten in den fehlerbehafteten Arrays zu einem oder mehreren anderen Arrays in der RAID-Architektur verschoben werden. Zu Beispielen der im Voraus festgelegten Zeitspanne gehören u. a. ein Tag, eine Woche, ein Monat oder jede andere Zeitspanne, die ermöglicht, dass die Daten in den fehlerbehafteten Arrays zu einem oder mehreren anderen Arrays in der RAID-Architektur verschoben werden.
  • Wenn bis zum Ausfallen des RAID-Array eine Zeit verbleibt, die kleiner als die im Voraus festgelegte Zeitspanne oder gleich dieser ist, beinhaltet das Verfahren 200 Übertragen der Daten in dem fehlerbehafteten RAID-Array zu einer fernen Stelle zum Sichern (Block 290). Bei einer Ausführungsform handelt es sich bei der fernen Stelle um ein anderes RAID-System. Bei einer weiteren Ausführungsform handelt es sich bei der fernen Stelle um ein anderes Speicher-Teilsystem, das z. B. das Speicher-Teilsystem eines Kunden und/oder Client enthält.
  • Zwar wurde wenigstens eine beispielhafte Ausführungsform in der vorhergehenden genauen Beschreibung der Erfindung dargestellt, jedoch sollte klar sein, dass es eine riesige Anzahl von Variationen gibt. Es sollte außerdem klar sein, dass es sich bei der beispielhaften Ausführungsform oder beispielhaften Ausführungsformen lediglich um Beispiele handelt, die nicht vorgesehen sind, um den Umfang, die Anwendbarkeit oder Konfiguration der Erfindung in irgendeiner Weise einzuschränken. Die vorhergehende genaue Beschreibung stellt stattdessen für einen Fachmann einen bequemen Fahrplan zum Umsetzen einer beispielhaften Ausführungsform der Erfindung bereit, wobei klar ist, dass an der Funktion und Anordnung der in einer beispielhaften Ausführungsform beschriebenen Elemente zahlreiche Änderungen ausgeführt werden können, ohne vom Umfang der Erfindung abzuweichen, der in den angefügten Ansprüchen und ihren rechtlichen Entsprechungen dargestellt ist.
  • Einem Fachmann ist klar, dass Aspekte der vorliegenden Erfindung als System, Verfahren oder Computerprogrammprodukt verkörpert werden können. Dementsprechend können Aspekte der vorliegenden Erfindung die Form einer reinen Hardware-Ausführungsform, einer reinen Software-Ausführungsform (darunter Firmware, residente Software, Mikrocode usw.) oder einer Ausführungsform, die Software- und Hardware-Aspekte kombiniert, annehmen, die hier alle als ”Schaltung”, ”Modul” oder ”System” bezeichnet werden können. Des Weiteren können Aspekte der vorliegenden Erfindung die Form eines Computerprogrammprodukts annehmen, das in einem oder mehreren computerlesbaren Medien verkörpert wird, die computerlesbaren Programmcode aufweisen, der darin ausgeführt wird.
  • Jede Kombination aus einem oder mehreren computerlesbaren Medien kann genutzt werden. Bei dem computerlesbaren Medium kann es sich um ein computerlesbares Signalmedium oder ein physisches computerlesbares Speichermedium handeln. Ein physisches computerlesbares Speichermedium kann z. B. ein elektronisches, magnetisches, optisches, kristallines, polymeres, elektromagnetisches, Infrarot- oder Halbleitersystem, -vorrichtung oder -einheit oder jede geeignete Kombination des Vorhergehenden sein, ist jedoch nicht darauf beschränkt. Zu Beispielen des physischen computerlesbaren Speichermediums gehören eine elektrische Verbindung mit einer oder mehreren Leitungen, eine tragbare Computerdiskette, eine Festplatte, ein RAM, ein ROM, ein EPROM, ein Flash-Speicher, ein Lichtwellenleiter, ein CD-ROM, eine optische Speichereinheit, eine magnetische Speichereinheit oder jede geeignete Kombination des Vorhergehenden. Im Kontext dieses Dokuments kann ein computerlesbares Speichermedium jedes materielle Medium sein, das ein Programm oder Daten zur Verwendung durch oder in Verbindung mit einem System, einer Vorrichtung oder einer Einheit zur Befehlsausführung enthalten oder speichern kann.
  • Computercode, der auf einem computerlesbaren Medium verkörpert ist, kann unter Verwendung jedes geeigneten Mediums übertragen werden, darunter drahtlose, leitungsgestützte, Lichtwellenleiterkabel-, Hochfrequenz-(HF-)Medien usw. oder jede geeignete Kombination aus dem Vorhergehenden, ohne darauf beschränkt zu sein. Computercode zum Ausführen von Operationen für Aspekte der vorliegenden Erfindung kann in einer beliebigen statischen Sprache geschrieben sein wie z. B. die Programmiersprache ”C” oder eine ähnliche Programmiersprache. Der Computercode kann nur auf dem Computer eines Benutzers, teilweise auf dem Computer eines Benutzers, als ein eigenständiges Software-Paket, teilweise auf dem Computer eines Benutzers und teilweise auf einem fernen Computer oder nur auf dem fernen Computer oder Server ausgeführt werden. In dem zuletzt genannten Szenario kann der ferne Computer mit dem Computer des Benutzers durch jeden Netzwerktyp verbunden sein, darunter ein lokales Netzwerk (LAN) oder ein Weitverkehrsnetz (WAN), ein konvergentes Netzwerk, ohne darauf beschränkt zu sein, oder die Verbindung kann zu einem externen Computer (z. B. über das Internet unter Verwendung eines Internet-Dienstanbieters) hergestellt werden.
  • Aspekte der vorliegenden Erfindung wurden oben unter Bezugnahme auf Ablaufplan-Darstellungen und/oder Blockschaltbilder von Verfahren, Vorrichtungen (Systemen) und Computerprogrammprodukten gemäß Ausführungsformen der Erfindung beschrieben. Es ist klar, dass jeder Block der Ablaufplan-Darstellungen und/oder Blockschaltbilder und Kombinationen von Blöcken in den Ablaufplan-Darstellungen und/oder Blockschaltbildern durch Computerprogrammbefehle umgesetzt werden können. Diese Computerprogrammbefehle können einem Prozessor eines Universalcomputers, eines Spezialcomputers oder einer anderen programmierbaren Datenverarbeitungsvorrichtung bereitgestellt werden, um eine Maschine zu bilden, so dass Befehle, die über den Prozessor des Computers oder der anderen programmierbaren Datenverarbeitungsvorrichtung ausgeführt werden, Mittel zum Umsetzen der Funktionen/Wirkungen, die in dem Block oder den Blöcken des Ablaufplans und/oder Blockschaltbilds spezifiziert sind, erzeugen.
  • Diese Computerprogrammbefehle können außerdem in einem computerlesbaren Medium gespeichert sein, das einen Computer, eine andere programmierbare Datenverarbeitungsvorrichtung oder andere Einheiten anweisen kann, in einer bestimmten Weise zu funktionieren, so dass die in dem computerlesbaren Medium gespeicherten Befehle einen Herstellungsgegenstand produzieren, der Befehle enthält, die die Funktion/Wirkung umsetzen, die in dem Block/den Blöcken des Ablaufplans und/oder Blockschaltbilds spezifiziert sind. Computerprogrammbefehle können außerdem in einen Computer, andere programmierbare Datenverarbeitungsvorrichtungen oder andere Einheiten geladen werden, um eine Reihe von Operationsschritten zu bewirken, die auf dem Computer, der anderen programmierbaren Datenverarbeitungsvorrichtung oder anderen Einheiten ausgeführt werden sollen, um einen durch einen Computer umgesetzten Prozess zu erzeugen, so dass die Befehle, die auf dem Computer oder der anderen programmierbaren Vorrichtung ausgeführt werden, Prozesse zum Umsetzen der Funktionen/Wirkungen, die in dem Block oder Blöcken des Ablaufplans und/oder Blockschaltbilds spezifiziert sind, bereitstellen.
  • Der Ablaufplan und die Blockschaltbilder in den Figuren veranschaulichen die Architektur, Funktionalität und Operation von möglichen Umsetzungen von Systemen, Verfahren und Computerprogrammprodukten gemäß verschiedener Ausführungsformen der vorliegenden Erfindung. In diesem Zusammenhang kann jeder Block in dem Ablaufplan oder Blockschaltbildern ein Modul, Segment oder Abschnitt von Code repräsentieren, der einen oder mehrere ausführbare Befehle zum Umsetzen der spezifizierten logischen Funktion(en) aufweist. Es sollte außerdem angemerkt werden, dass bei einigen alternativen Umsetzungen die in dem Block angegebenen Funktionen nicht in der in den Figuren angegebenen Reihenfolge auftreten. Zum Beispiel können zwei Blöcke, die nacheinander gezeigt sind, tatsächlich im Wesentlichen gleichzeitig ausgeführt werden oder die Blöcke können gelegentlich in Abhängigkeit von der beteiligten Funktionalität in der umgekehrten Reihenfolge ausgeführt werden. Es wird außerdem angemerkt, dass jeder Block in den Blockschaltbildern und/oder Ablaufplan-Darstellungen und Kombinationen von Blöcken in den Blockschaltbildern und/oder Ablaufplan-Darstellung durch Systeme, die auf spezieller Hardware beruhen, die die spezifizierten Funktionen oder Wirkungen ausführen, oder Kombinationen aus spezieller Hardware und Computerbefehlen umgesetzt werden können.
  • Zwar wurden eine oder mehrere Ausführungsformen der vorliegenden Erfindung genau erläutert, jedoch ist es für einen Fachmann klar, dass Modifikationen und Anpassungen an diese Ausführungsformen ausgeführt werden können, ohne vom Umfang der vorliegenden Erfindung abzuweichen, der in den nachfolgenden Ansprüchen dargestellt ist.

Claims (20)

  1. System zum Verhindern von Datenverlust in einem Speichersystem, wobei das System aufweist: eine Vielzahl von Speichereinheiten, die so eingerichtet sind, dass sie Daten an einer Vielzahl von Datenadressen speichern; und einen Prozessor, der mit der Vielzahl von Speichereinheiten verbunden ist, wobei der Prozessor eingerichtet ist zum: Feststellen, dass eine Speichereinheit von der Vielzahl von Speichereinheiten eine Fehlfunktion aufweist, Ermitteln eines Typs der Fehlfunktion, Auswählen einer SMART-Wiederherstellungstechnik, einer normalen Wiederherstellungstechnik, einer Datenmigrationstechnik oder einer Benutzerdaten-Sicherungstechnik, um die Daten in der Speichereinheit zu erhalten, wobei die Auswahl auf der Grundlage des ermittelten Typs der Fehlfunktion erfolgt, und Ausführen der ausgewählten Technik von SMART-Wiederherstellungstechnik, normaler Wiederherstellungstechnik, Datenmigrationstechnik und Benutzerdaten-Sicherungstechnik an der Speichereinheit.
  2. System nach Anspruch 1, wobei das Speichersystem eine RAID-5-Konfiguration aufweist, die eine Vielzahl von Datenadressen aufweist und wobei der Prozessor festgestellt hat, dass der Typ der Fehlfunktion darin besteht, dass die Speichereinheit einen Medienfehler aufweist, wobei der Prozessor eingerichtet ist zum: Auswählen der SMART-Wiederherstellungstechnik; und Ausführen der SMART-Wiederherstellungstechnik, wobei die SMART-Wiederherstellungstechnik beinhaltet: Priorisieren aller Datenadressen in der Speichereinheit, und Wiederherstellen eines ersten Bereichs von Datenadressen in der Speichereinheit auf der Grundlage der Priorität.
  3. System nach Anspruch 2, wobei beim Priorisieren jeder Datenadresse der Prozessor so eingerichtet ist, dass er feststellt, dass der erste Bereich von Datenadressen in stärkerem Maße auf einen Verlust anfällig ist als ein zweiter Bereich von Datenadressen.
  4. System nach Anspruch 3, wobei beim Wiederherstellen des ersten Bereichs von Datenadressen der Prozessor eingerichtet ist zum: anfänglichen Wiederherstellen des ersten Bereichs von Datenadressen; und Wiederherstellen des zweiten Bereichs von Datenadressen und aller verbleibenden Datenadressen in der Speichereinheit nach dem Wiederherstellen des ersten Bereichs von Datenadressen.
  5. System nach Anspruch 2, wobei der Prozessor festgestellt hat, dass der Typ der Fehlfunktion darin besteht, dass die Speichereinheit ausgefallen ist, wobei der Prozessor eingerichtet ist zum: Auswählen der normalen Wiederherstellungstechnik; und Ausführen der normalen Wiederherstellungstechnik, wobei die normale Wiederherstellungstechnik ein Ersetzen der Speichereinheit durch eine neue Speichereinheit beinhaltet.
  6. System nach Anspruch 5, wobei der Prozessor festgestellt hat, dass der Typ der Fehlfunktion darin besteht, dass die Vielzahl von Speichereinheiten nach einer im Voraus festgelegten Zeitspanne ausfallen werden, wobei der Prozessor eingerichtet ist zum: Auswählen der Datenmigrationstechnik; und Ausführen der Datenmigrationstechnik, wobei das Ausführen der Datenmigrationstechnik ein Verschieben der Daten in der Vielzahl von Speichereinheiten zu einer neuen Vielzahl von Speichereinheiten aufweist.
  7. System nach Anspruch 6, wobei der Prozessor festgestellt hat, dass der Typ der Fehlfunktion darin besteht, dass die Vielzahl von Speichereinheiten innerhalb einer im Voraus festgelegten Zeitspanne ausfallen werden, wobei der Prozessor eingerichtet ist zum Auswählen der Benutzerdaten-Sicherungstechnik; und Ausführen der Benutzerdaten-Sicherungstechnik, wobei das Ausführen der Benutzerdaten-Sicherungstechnik ein Verschieben der Daten in der Vielzahl von Speichereinheiten zu einem fernen Speichersystem beinhaltet.
  8. Verfahren zum Verhindern von Datenverlust in einem Speichersystem, das eine Vielzahl von Speichereinheiten enthält, wobei jede Daten an einer Vielzahl von Datenadressen speichert, wobei das Verfahren beinhaltet: Erkennen, dass eine Speichereinheit von der Vielzahl von Speichereinheiten eine Fehlfunktion aufweist; Ermitteln eines Typs der Fehlfunktion; Auswählen einer SMART-Wiederherstellungstechnik, einer normalen Wiederherstellungstechnik, einer Datenmigrationstechnik oder einer Benutzerdaten-Sicherungstechnik, um die Daten in der Speichereinheit zu erhalten, wobei die Auswahl auf der Grundlage des ermittelten Typs der Fehlfunktion erfolgt, und Ausführen der ausgewählten Technik von SMART-Wiederherstellungstechnik, normaler Wiederherstellungstechnik, Datenmigrationstechnik und Benutzerdaten-Sicherungstechnik an der Speichereinheit.
  9. Verfahren nach Anspruch 8, wobei: das Speichersystem eine RAID 5-Konfiguration aufweist, die die Vielzahl von Datenadressen aufweist; das Ermitteln des Typs der Fehlfunktion ein Feststellen beinhaltet, dass die Speichereinheit einen Medienfehler aufweist; das Auswählen ein Auswählen der SMART-Wiederherstellungstechnik beinhaltet; und das Ausführen der SMART-Wiederherstellungstechnik beinhaltet: Priorisieren aller Datenadressen in der Speichereinheit, und Wiederherstellen eines ersten Bereichs von Datenadressen in der Speichereinheit auf der Grundlage der Priorität.
  10. Verfahren nach Anspruch 9, wobei das Priorisieren jeder Datenadresse ein Feststellen beinhaltet, dass der erste Bereich von Datenadressen in stärkerem Maße auf einen Verlust anfällig ist als ein zweiter Bereich von Datenadressen.
  11. Verfahren nach Anspruch 10, wobei das Wiederherstellen des ersten Bereichs von Datenadressen beinhaltet: anfängliches Wiederherstellen des ersten Bereichs von Datenadressen; und Wiederherstellen des zweiten Bereichs von Datenadressen und aller verbleibenden Datenadressen in der Speichereinheit nach dem Wiederherstellen des ersten Bereichs von Datenadressen.
  12. Verfahren nach Anspruch 9, wobei: das Ermitteln des Typs der Fehlfunktion ein Feststellen beinhaltet, dass die Speichereinheit ausgefallen ist; das Auswählen ein Auswählen der normalen Wiederherstellungstechnik aufweist; und das Ausführen der normalen Wiederherstellungstechnik ein Ersetzen der Speichereinheit durch eine neue Speichereinheit aufweist.
  13. Verfahren nach Anspruch 12, wobei: das Ermitteln des Typs der Fehlfunktion ein Feststellen beinhaltet, dass die Vielzahl von Speichereinheiten nach einer im Voraus festgelegten Zeitspanne ausfallen werden; das Auswählen ein Auswählen der Datenmigrationstechnik beinhaltet; und das Ausführen der Datenmigrationstechnik ein Verschieben der Daten in der Vielzahl von Speichereinheiten zu einer neuen Vielzahl von Speichereinheiten beinhaltet.
  14. Verfahren nach Anspruch 13, wobei: das Ermitteln des Typs der Fehlfunktion ein Ermitteln aufweist, dass die Vielzahl von Speichereinheiten innerhalb der im Voraus festgelegten Zeitspanne ausfallen werden; das Auswählen ein Auswählen der Benutzerdaten-Sicherungstechnik aufweist; und das Ausführen der Benutzerdaten-Sicherungstechnik ein Verschieben der Daten in der Vielzahl von Speichereinheiten zu einem fernen Speichersystem aufweist.
  15. Physisches Computer-Speichermedium, das ein Verfahren in Form eines Computerprogrammprodukts aufweist zum Verhindern eines Datenverlusts in einem Speichersystem, das eine Vielzahl von Speichereinheiten enthält, von denen jede Daten an einer Vielzahl von Datenadressen speichert, wobei das physische Computer-Speichermedium aufweist: Computercode zum Erkennen, dass eine Speichereinheit in der Vielzahl von Speichereinheiten eine Fehlfunktion aufweist; Computercode zum Ermitteln eines Typs der Fehlfunktion; Computercode zum Auswählen einer Smart-Wiederherstellungstechnik, einer normalen Wiederherstellungstechnik, einer Datenmigrationstechnik oder einer Benutzerdaten-Sicherungstechnik, um die Daten in der Speichereinheit zu erhalten, wobei die Auswahl auf der Grundlage des ermittelten Typs der Fehlfunktion erfolgt; und Computercode zum Ausführen der ausgewählten Technik von Smart-Wiederherstellungstechnik, normale Wiederherstellungstechnik, Datenmigrationstechnik und Benutzerdaten-Sicherungstechnik an der Speichereinheit.
  16. Physisches Computer-Speichermedium nach Anspruch 15, wobei das Speichersystem eine RAID 5-Konfiguration aufweist, die die Vielzahl von Datenadressen aufweist und wobei: der Computercode zum Ermitteln des Typs der Fehlfunktion Computercode zum Ermitteln beinhaltet, dass die Speichereinheit einen Medienfehler aufweist; der Computercode zum Auswählen Computercode zum Auswählen der SMART-Wiederherstellungstechnik beinhaltet; und der Computercode zum Ausführen der SMART-Wiederherstellungstechnik beinhaltet: Computercode zum Priorisieren jeder Datenadresse in der Speichereinheit, und Computercode zum Wiederherstellen eines ersten Bereichs von Datenadressen in der Speichereinheit auf der Grundlage der Priorität.
  17. Physisches Speichermedium nach Anspruch 16, wobei: der Computercode zum Priorisieren jeder Datenadresse Computersystem zum Ermitteln beinhaltet, dass der erste Bereich von Datenadressen in stärkerem Maße auf einen Verlust anfällig ist als ein zweiter Bereich von Datenadressen; und der Computercode zum Wiederherstellen des ersten Bereichs von Datenadressen beinhaltet: Computercode, um anfangs den ersten Bereich von Datenadressen wiederherzustellen, und Computercode zum Wiederherstellen des zweiten Bereichs von Datenadressen und aller verbleibenden Datenadressen in der Speichereinheit nach dem Wiederherstellen des ersten Bereichs von Datenadressen.
  18. Physisches Computer-Speichermedium nach Anspruch 16, wobei: der Computercode zum Ermitteln des Typs der Fehlfunktion Computercode zum Ermitteln beinhaltet, dass die Speichereinheit ausgefallen ist; der Computercode zum Auswählen Computercode zum Auswählen der normalen Wiederherstellungstechnik beinhaltet; und der Computercode zum Ausführen der normalen Wiederherstellungstechnik Computercode zum Ersetzen der Speichereinheit durch eine neue Speichereinheit beinhaltet.
  19. Physisches Computer-Speichermedium nach Anspruch 18, wobei: der Computercode zum Ermitteln des Typs der Fehlfunktion Computercode zum Ermitteln beinhaltet, dass die Vielzahl von Speichereinheiten nach einer im Voraus festgelegten Zeitspanne ausfallen werden; der Computercode zum Auswählen Computercode zum Auswählen der Datenmigrationstechnik beinhaltet; und der Computercode zum Ausführen der Datenmigrationstechnik Computercode zum Verschieben der Daten in der Vielzahl von Speichereinheiten zu einer neuen Vielzahl von Speichereinheiten beinhaltet.
  20. Physisches Computer-Speichermedium nach Anspruch 19, wobei: der Computercode zum Ermitteln des Typs der Fehlfunktion Computercode zum Ermitteln beinhaltet, dass die Vielzahl von Speichereinheiten innerhalb einer im Voraus festgelegten Zeitspanne ausfallen werden; der Computercode zum Auswählen Computercode zum Auswählen der Benutzerdaten-Sicherungstechnik beinhaltet; und der Computercode zum Ausführen der Benutzerdaten-Sicherungstechnik Computercode zum Verschieben der Daten in der Vielzahl von Speichereinheiten zu einem fernen Speichersystem beinhaltet.
DE112013000881.5T 2012-04-02 2013-03-28 Systeme und Verfahren zum Verhindern von Datenverlust Pending DE112013000881T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
USUS-13/437,574 2012-04-02
US13/437,574 US8930749B2 (en) 2012-04-02 2012-04-02 Systems and methods for preventing data loss
PCT/CN2013/073302 WO2013149558A1 (en) 2012-04-02 2013-03-28 Systems and methods for preventing data loss

Publications (1)

Publication Number Publication Date
DE112013000881T5 true DE112013000881T5 (de) 2014-10-30

Family

ID=49236729

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112013000881.5T Pending DE112013000881T5 (de) 2012-04-02 2013-03-28 Systeme und Verfahren zum Verhindern von Datenverlust

Country Status (5)

Country Link
US (2) US8930749B2 (de)
CN (1) CN104094236B (de)
DE (1) DE112013000881T5 (de)
GB (1) GB2515709B (de)
WO (1) WO2013149558A1 (de)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013157032A1 (en) * 2012-04-16 2013-10-24 Hitachi, Ltd. Storage subsystem and data management method of storage subsystem
US8775861B1 (en) * 2012-06-28 2014-07-08 Emc Corporation Non-disruptive storage device migration in failover cluster environment
CN104346234B (zh) * 2013-08-09 2017-09-26 华为技术有限公司 一种内存访问的方法、设备及系统
JP6213130B2 (ja) * 2013-10-09 2017-10-18 富士通株式会社 ストレージ制御装置、ストレージ制御プログラム及びストレージ制御方法
US9575846B2 (en) 2014-07-24 2017-02-21 At&T Intellectual Property I, L.P. Distributed storage of data
US9563524B2 (en) * 2014-12-11 2017-02-07 International Business Machines Corporation Multi level data recovery in storage disk arrays
US10176065B2 (en) 2015-02-16 2019-01-08 Seagate Technology Llc Intelligent failure prediction and redundancy management in a data storage system
US9665446B1 (en) 2015-12-29 2017-05-30 International Business Machines Corporation Fully distributed intelligent rebuild
CN107203442B (zh) * 2016-03-16 2020-04-21 伊姆西Ip控股有限责任公司 独立磁盘冗余阵列的重建性能的评估方法和设备
US10255134B2 (en) * 2017-01-20 2019-04-09 Samsung Electronics Co., Ltd. Control plane method and apparatus for providing erasure code protection across multiple storage devices
CN107612719B (zh) * 2017-08-29 2021-03-19 深圳市盛路物联通讯技术有限公司 物联网接入点的数据备份方法及装置
CN110058785B (zh) * 2018-01-18 2022-07-05 伊姆西Ip控股有限责任公司 用于管理存储系统的方法和设备
US10901867B2 (en) * 2018-01-24 2021-01-26 Apple Inc. Distributed redundant storage system
CN110413216B (zh) * 2018-04-28 2023-07-18 伊姆西Ip控股有限责任公司 用于管理存储系统的方法、设备和计算机程序产品
US11249667B2 (en) 2019-09-05 2022-02-15 International Business Machines Corporation Storage performance enhancement
CN112685222A (zh) 2019-10-17 2021-04-20 伊姆西Ip控股有限责任公司 管理备份数据的方法、设备和计算机程序产品

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2923702B2 (ja) * 1991-04-01 1999-07-26 株式会社日立製作所 記憶装置及びそのデータ修復方法
US6415189B1 (en) 1999-07-23 2002-07-02 International Business Machines Corporation Method and system for predicting disk drive failures
US6687791B2 (en) 2002-01-07 2004-02-03 Sun Microsystems, Inc. Shared cache for data integrity operations
TW200302966A (en) * 2002-01-29 2003-08-16 Matsushita Electric Ind Co Ltd Memory device, data processing method and data processing program
US7058762B2 (en) * 2003-06-09 2006-06-06 Hewlett-Packard Development Company, L.P. Method and apparatus for selecting among multiple data reconstruction techniques
US7421537B2 (en) * 2004-03-22 2008-09-02 Intel Corporation Migrating data between storage volumes
US20080256397A1 (en) 2004-09-22 2008-10-16 Xyratex Technology Limited System and Method for Network Performance Monitoring and Predictive Failure Analysis
US7574623B1 (en) 2005-04-29 2009-08-11 Network Appliance, Inc. Method and system for rapidly recovering data from a “sick” disk in a RAID disk group
JP4472617B2 (ja) 2005-10-28 2010-06-02 富士通株式会社 Raidシステム、raidコントローラ及びそのリビルド/コピーバック処理方法
US20070150651A1 (en) * 2005-12-22 2007-06-28 Intel Corporation Method for dynamically exposing backup and restore volumes
US7721157B2 (en) 2006-03-08 2010-05-18 Omneon Video Networks Multi-node computer system component proactive monitoring and proactive repair
GB0612482D0 (en) * 2006-06-23 2006-08-02 Ibm Apparatus and method for controlling raid array rebuild
GB0622224D0 (en) 2006-11-08 2006-12-20 Ibm Apparatus and method for disk read checking
US7624300B2 (en) 2006-12-18 2009-11-24 Emc Corporation Managing storage stability
US8751862B2 (en) * 2007-08-10 2014-06-10 Dell Products L.P. System and method to support background initialization for controller that supports fast rebuild using in block data
US8074112B1 (en) 2007-12-27 2011-12-06 Marvell International Ltd. Memory backup used in a raid system
US7877626B2 (en) * 2007-12-31 2011-01-25 Datadirect Networks, Inc. Method and system for disk storage devices rebuild in a data storage system
CN101866271A (zh) * 2010-06-08 2010-10-20 华中科技大学 一种基于raid的安全预警系统和方法

Also Published As

Publication number Publication date
US8930750B2 (en) 2015-01-06
US20130262919A1 (en) 2013-10-03
GB201419385D0 (en) 2014-12-17
CN104094236B (zh) 2017-07-21
GB2515709A (en) 2014-12-31
GB2515709B (en) 2017-01-04
CN104094236A (zh) 2014-10-08
WO2013149558A1 (en) 2013-10-10
US20130262921A1 (en) 2013-10-03
US8930749B2 (en) 2015-01-06

Similar Documents

Publication Publication Date Title
DE112013000881T5 (de) Systeme und Verfahren zum Verhindern von Datenverlust
DE69434381T2 (de) Verfahren zur Paritätsdarstellung in einem Raid-Untersystem unter Verwendung eines nichtflüchtigen Speichers
DE112010003345T5 (de) Datenspeichersystem und Verfahren für das Betreiben eines Datenspeichersystems
DE102013210642A1 (de) Vorrichtung zum Wiederherstellen von Redundanz
DE112011103295B4 (de) Decodieren in Solid-State-Speichereinheiten
DE112011100371B4 (de) Verfahren, Vorrichtung und Computerprogrammprodukt zum Decodieren eines Codeworts
US20120096309A1 (en) Method and system for extra redundancy in a raid system
DE102012210232B4 (de) Vorbeugende Speicherreparatur auf der Grundlage der Analyse einer Vielzahl von Symbolen und Bereinigungszyklen
DE112016001295T5 (de) Neusynchronisieren auf ein erstes Speichersystem durch Spiegeln des ersten Speichersystems nach einem Failover zu einem zweiten Speichersystem
DE112019000213T5 (de) Speichersysteme mit Peer-Datenwiederherstellung
DE202008018572U1 (de) Speichersystem
DE112015000384B4 (de) Erhöhen der Zuverlässigkeit in einem verteilten Speichersystem
DE112015005211T5 (de) Systeme und verfahren für die speicherfehler-verwaltung
DE112010003645T5 (de) Festkörper-Speichersystem mit Parallelem Zugriff aus Mehreren Flash/PCM-Einrichtungen
DE112014005570T5 (de) Deaktivieren von Seiten in einem Nand-Flash-Speicher-System
DE112011100112T5 (de) Pufferspeicher-platte in blitzkopie-kaskade
DE112011100534T5 (de) Mehrstufiger Sicherungsprozess
DE112018004637T5 (de) Maschinelles lernen zum verbessern von wiederherstellungen von redundanten anordnungen von unabhängigen festplatten
DE102012215918A1 (de) Spiegeln virtueller Maschinen von einem primären auf einen sekundären Host
DE102013218341A1 (de) Ersatzweise Verlagerung von Threads (Thread-Sparing) zwischen Berechnungskernen in einem Multithread-Prozessor
WO2024103977A1 (zh) 一种元数据的配置方法、装置及非易失性可读存储介质
US10210062B2 (en) Data storage system comprising an array of drives
EP1358554A1 (de) Automatische inbetriebnahme eines clustersystems nach einem heilbaren fehler
DE112010004264T5 (de) Selektiver Schreibschutz für das Austesten der Wiederherstellung nach einem Absturz
CN111045858B (zh) 一种坏道处理方法及系统

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication