DE112019000215T5

DE112019000215T5 - Wiederherstellungshilfe mit ausgefallener Speichervorrichtung

Info

Publication number: DE112019000215T5
Application number: DE112019000215.5T
Authority: DE
Inventors: Anand Kulkarni; Vladislav Bolkhovitin; Brian Walter O`Krafka; Sanjay Subbarao
Original assignee: Western Digital Technologies Inc
Current assignee: Western Digital Technologies Inc
Priority date: 2018-08-03
Filing date: 2019-06-01
Publication date: 2020-08-06
Also published as: WO2020027912A1; US10831603B2; CN111433746B; CN111433746A; US20200042389A1

Abstract

Verfahren, Systeme und andere Gesichtspunkte zum Rekonstruieren von Daten und Wiederherstellen einer ausgefallenen Speichervorrichtung in einem Speichersystem unter Verwendung einer oder mehrerer funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung. Zum Beispiel kann ein Verfahren als Reaktion auf ein Erkennen einer ausgefallenen Speichervorrichtung in einem Speichersystem einschließen: Lokalisieren von Daten und Redundanzinformationen in einer oder mehreren funktionierenden Speichervorrichtungen in dem Speichersystem zum Rekonstruieren von Daten der ausgefallenen Speichervorrichtung; Ausgeben von Peer-to-Peer-Befehlen an die funktionierende(n) Speichervorrichtung(en), um die Daten und die Redundanzinformationen von der oder den funktionierenden Speichervorrichtungen zu erhalten; und Rekonstruieren der Daten der ausgefallenen Speichervorrichtung auf Basis der Daten und der Redundanzinformationen, die von der oder den funktionierenden Speichervorrichtungen erhalten wurden, wobei eine funktionierende Rechenressource der ausgefallenen Rechenvorrichtung mindestens teilweise eines oder mehrere von Lokalisieren, Ausgeben und Rekonstruieren ausführt.

Description

HINTERGRUND
Die vorliegende Offenbarung bezieht sich auf Speichersysteme. In einem spezielleren Beispiel bezieht sich die vorliegende Offenbarung auf Verfahren und Systeme zum Rekonstruieren von Daten und Wiederherstellen einer ausgefallenen Speichervorrichtung in einem Speichersystem unter Verwendung einer oder mehrerer funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung.
Speichersysteme mit einer Vielzahl von Speichervorrichtungen verwenden üblicherweise Datenredundanztechniken (z. B. Spiegelung oder Parität für Redundant Array of Independent Disks (RAID), Löschcodierung) um ein Rekonstruieren von Daten und ein Wiederherstellen einer ausgefallenen Speichervorrichtung zu ermöglichen. Doch herkömmliche Prozesse zum Rekonstruieren von Daten und Wiederherstellen für ausgefallene Speichervorrichtungen können zu einer erheblichen Beeinträchtigung der Systemleistung führen, da die verbleibenden funktionierenden Speichervorrichtungen im System möglicherweise zum Rekonstruieren der verlorenen Daten verwendet werden müssen, was erhebliche CPU-Zeit sowie Bandbreite der Speichersystemverbindung erfordern kann.
Wenn zum Beispiel eine Speichervorrichtung in einem RAID-Array ausgefallen ist, wird in herkömmlichen Systemen die ausgefallene Speichervorrichtung aus dem Array herausgeschoben und sendet die RAID-Steuerung (entweder eigenständig oder von der Host-CPU gehostet) zusätzliche Befehle an die verbleibenden funktionierenden Speichervorrichtungen, um die verlorenen Daten der ausgefallenen Speichervorrichtung zu rekonstruieren. Das Rekonstruieren der Daten wird üblicherweise von der RAID-Steuerung unter Verwendung von Exklusiv-ODER-Operationen (XOR) oder Galois Field-Operationen (GF) durchgeführt.
KU RZDARSTELLU NG
Die vorliegende Offenlegung bezieht sich auf Verfahren und Systeme zum Rekonstruieren von Daten und Wiederherstellen einer ausgefallenen Speichervorrichtung in einem Speichersystem unter Verwendung einer oder mehrerer funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung.
Wie oben erörtert, besteht ein Problem im Zusammenhang mit Prozessen zum herkömmlichen Rekonstruieren von Daten und Wiederherstellen für ausgefallene Speichervorrichtungen darin, dass sie während der Datenwiederherstellung zu einer erheblichen Verschlechterung der Systemleistung führen können. In Anbetracht dessen besteht ein Bedarf an einem verbesserten Verfahren zum Rekonstruieren von Daten und Wiederherstellen einer ausgefallenen Speichervorrichtung in einem Speichersystem.
Verschiedene Ausführungsformen der vorliegenden Offenbarung, wie hierin offenbart, können Daten rekonstruieren und/oder eine ausgefallene Speichervorrichtung in einem Speichersystem unter Verwendung einer oder mehrerer funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung wiederherstellen. Bei mindestens einigen Ausführungsformen kann die ausgefallene Speichervorrichtung selbst an dem Datenrekonstruktions- und/oder Wiederherstellungsprozess der ausgefallenen Speichervorrichtung teilnehmen, indem sie Peer-to-Peer (P2P) mit den verbleibenden funktionierenden Speichervorrichtungen im Speichersystem kommuniziert. Ferner kann, mindestens bei einigen Ausführungsformen, der tatsächliche Ausfallmechanismus der ausgefallenen Speichervorrichtung beim Durchführen der Vorrichtungswiederherstellung berücksichtigt werden. Zum Beispiel kann in Fällen, in denen bei der ausgefallenen Speichervorrichtung nur ein teilweiser Medienausfall vorliegt, die Durchführung der Datenrekonstruktion nur auf den ausgefallenen Medienabschnitt beschränkt sein.
Infolgedessen können eine oder mehrere Ausführungsformen der vorliegenden Offenbarung eine Reihe von technischen Merkmalen und Vorteilen bereitstellen, einschließlich eines oder mehrerer der Folgenden, ohne darauf beschränkt zu sein:

(1) Verbesserte Systemleistung während des Datenrekonstruktions- und/oder Wiederherstellungsprozesses der ausgefallenen Speichervorrichtung durch die Verwendung funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung zum Rekonstruieren von Daten der ausgefallenen Speichervorrichtung.
(2) Verbesserte Systemleistung während des Datenrekonstruktions- und/oder Wiederherstellungsprozesses der ausgefallenen Speichervorrichtung in Fällen eines teilweisen Datenverlusts in der ausgefallenen Speichervorrichtung, indem der Datenrekonstruktionsprozess speziell für den ausgefallenen Medienabschnitt durchgeführt wird. In diesen Fällen ist die Verschlechterung der Systemleistung möglicherweise nur proportional zu der tatsächlich verlorenen Datenmenge und nicht zu allen Daten der ausgefallenen Speichervorrichtung.

Die vorliegende Offenbarung schließt, ohne darauf beschränkt zu sein, die folgenden Gesichtspunkte ein:
Gemäß einem innovativen Gesichtspunkt ein Verfahren, das als Reaktion auf ein Erkennen einer ausgefallenen Speichervorrichtung in einem Speichersystem das Lokalisieren von Daten und Redundanzinformationen in einer oder mehreren funktionierenden Speichervorrichtungen in dem Speichersystem zum Rekonstruieren von Daten der ausgefallenen Speichervorrichtung; das Ausgeben eines oder mehrerer Peer-to-Peer-Befehle an das eine oder die mehreren funktionierenden Speichervorrichtungen, um die Daten und die Redundanzinformationen von dem einen oder den mehreren funktionierenden Speichervorrichtungen zu erhalten; und das Rekonstruieren der Daten der ausgefallenen Speichervorrichtung auf Basis der Daten und der Redundanzinformationen, die von der einen oder den mehreren funktionierenden Speichervorrichtungen erhalten wurden, einschließt, wobei eine funktionierende Rechenressource der ausgefallenen Rechenvorrichtung mindestens teilweise eines oder mehrere von Lokalisieren, Ausgeben und Rekonstruieren durchführt.
Gemäß einem weiteren innovativen Gesichtspunkt ein Gerät, das einen oder mehrere Prozessoren; und eine Logik einschließt, die von einem oder mehreren Prozessoren ausführbar ist, die dafür eingerichtet sind, Operationen durchzuführen, die einschließen: als Reaktion auf ein Erkennen einer ausgefallenen Speichervorrichtung in einem Speichersystem, Lokalisieren von Daten und Redundanzinformationen in einer oder mehreren funktionierenden Speichervorrichtungen in dem Speichersystem zum Rekonstruieren von Daten der ausgefallenen Speichervorrichtung; Ausgeben eines oder mehrerer Peer-to-Peer-Befehle an die eine oder die mehreren funktionierenden Speichervorrichtungen, um die Daten und die Redundanzinformationen von dem einen oder den mehreren funktionierenden Speichervorrichtungen zu erhalten; und das Rekonstruieren der Daten der ausgefallenen Speichervorrichtung auf Basis der Daten und der Redundanzinformationen, die von der einen oder den mehreren funktionierenden Speichervorrichtungen erhalten wurden, einschließt, wobei eine funktionierende Rechenressource der ausgefallenen Rechenvorrichtung mindestens teilweise eines oder mehrere von Lokalisieren, Ausgeben und Rekonstruieren durchführt.
Gemäß noch einem weiteren innovativen Gesichtspunkt ein Gerät, das einen oder mehrere Prozessoren; und ein Speicherarray einschließt, das mit der Steuerung gekoppelt ist, wobei das Speicherarray eine Vielzahl von Speichervorrichtungen einschließt, wobei die Steuerung und das Speicherarray dafür eingerichtet sind, Operationen durchzuführen, die einschließen: Erkennen einer ausgefallenen Speichervorrichtung in dem Speicherarray durch die Steuerung; Lokalisieren, durch die ausgefallene Speichervorrichtung, von Daten und Redundanzinformationen in einer oder mehreren funktionierenden Speichervorrichtungen in dem Speicherarray zum Rekonstruieren von Daten der ausgefallenen Speichervorrichtung; Ausgeben, durch die ausgefallene Speichervorrichtung, eines oder mehrerer Peer-to-Peer-Befehle an das eine oder die mehreren funktionierenden Speichervorrichtungen, um die Daten und die Redundanzinformationen von dem einen oder den mehreren funktionierenden Speichervorrichtungen zu erhalten; Rekonstruieren, durch die ausgefallene Speichervorrichtung, der Daten der ausgefallenen Speichervorrichtung auf Basis der Daten und der Redundanzinformationen, die von dem einen oder den mehreren funktionierenden Speichervorrichtungen erhalten wurden; und Schreiben, durch die Steuerung, der rekonstruierten Daten der ausgefallenen Speichervorrichtung an einen oder mehrere verfügbare Orte in dem Speicherarray.
Diese und andere Implementierungen können jeweils optional eines oder mehrere der folgenden Merkmale einschließen: dass das Verfahren oder die Operationen ferner das Schreiben der rekonstruierten Daten der ausgefallenen Speichervorrichtung an einen oder mehrere verfügbare Orte in dem Speichersystem einschließen; dass die funktionierende Rechenressource der ausgefallenen Speichervorrichtung eine Vorrichtungssteuerung ist; dass der eine oder die mehreren Peer-to-Peer-Befehle einen Lesebefehl einschließen, der von der ausgefallenen Speichervorrichtung ausgegeben und ausgeführt wird; dass das Verfahren ferner das Definieren eines Streifens in dem Speichersystem einschließt, wobei der Streifen den Daten der ausgefallenen Speichervorrichtung und den Daten und den Redundanzinformationen in dem einen oder den mehreren funktionierenden Speichervorrichtungen zugeordnet ist; dass das Verfahren oder die Operationen ferner das Identifizieren eines Medienabschnitts der ausgefallenen Speichervorrichtung mit wiederherstellbaren Daten und das Kopieren der wiederherstellbaren Daten von einem ersten Ort in dem Medienabschnitt der ausgefallenen Speichervorrichtung an einen zweiten Ort in dem Medienabschnitt der ausgefallenen Speichervorrichtung einschließen; und dass der Medienabschnitt der ausgefallenen Speichervorrichtung eine Speicherzelle ist.
Andere Implementierungen eines oder mehrerer dieser Gesichtspunkte schließen entsprechende Systeme, Geräte und Computerprogramme ein, die dafür eingerichtet sind, die Aktionen der Verfahren durchzuführen, die auf Computerspeichervorrichtungen codiert sind. Es sei klargestellt, dass die in der vorliegenden Offenbarung verwendete Ausdrucksweise hauptsächlich für Lesbarkeits- und Anweisungszwecke gewählt wurde und den Schutzumfang des hierin offenbarten Gegenstands nicht beschränken soll.
Figurenliste
Die hierin eingeführten Techniken sind beispielhaft und nicht einschränkend in den Figuren der beigefügten Zeichnungen veranschaulicht, in denen gleiche Bezugszeichen verwendet werden, um auf ähnliche Elemente Bezug zu nehmen.

1 stellt ein Blockdiagramm eines beispielhaften Rechensystems einschließlich eines Hosts und eines Speichersystems gemäß einer Ausführungsform dar.
2 stellt ein Blockdiagramm einer beispielhaften Systemsteuerung für das in 1 gezeigte Speichersystem gemäß einer Ausführungsform dar.
3 stellt ein Blockdiagramm einer beispielhaften Vorrichtungssteuerung für das in 1 gezeigte Speichersystem gemäß einer Ausführungsform dar.
4 stellt ein Flussdiagramm eines beispielhaften Verfahrens zum Rekonstruieren von Daten einer ausgefallenen Speichervorrichtung unter Verwendung einer oder mehrerer funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung über Peer-to-Peer-Kommunikation für das in 1 gezeigte Speichersystem gemäß einer Ausführungsform dar.
5 stellt ein Flussdiagramm eines beispielhaften Verfahrens zum Wiederherstellen einer ausgefallenen Speichervorrichtung unter Verwendung einer oder mehrerer funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung über Peer-to-Peer-Kommunikation für das in 1 gezeigte Speichersystem gemäß einer Ausführungsform dar.
6 stellt ein Blockdiagramm eines beispielhaften Speicherarrays für das in 1 gezeigte Speichersystem gemäß einer Ausführungsform dar.
7 stellt ein Flussdiagramm eines beispielhaften Verfahrens zum Wiederherstellen einer ausgefallenen Speichervorrichtung unter Verwendung einer oder mehrerer funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung über Peer-to-Peer-Kommunikation für das in 6 gezeigte Speicherarray gemäß einer Ausführungsform dar.
8 stellt ein Flussdiagramm eines beispielhaften Verfahrens zum Durchführen einer Datenverwaltungsanforderung (z. B. Leseanforderung) gemäß einem Datenverwaltungsschema einer verteilten globalen Flash-Übersetzungsschicht (Flash Translation Layer, FTL) für das in 1 gezeigte Rechensystem gemäß einer Ausführungsform dar.

DETAILLIERTE BESCHREIBUNG
Neuartige Datenverarbeitungstechnologien wie Systeme, Vorrichtungen und Verfahren zum Wiederherstellen einer ausgefallenen Speichervorrichtung in einem Speichersystem unter Verwendung einer oder mehrerer funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung, ohne darauf beschränkt zu sein, werden offenbart. Während diese Technologie nachfolgend im Zusammenhang mit einer bestimmten Systemarchitektur in verschiedenen Fällen beschrieben wird, versteht es sich, dass die Systeme und Verfahren auf andere Hardware-Architekturen und -Organisationen angewendet werden können. Genauer sei angemerkt, dass, während die folgende Beschreibung in Bezug auf bestimmte Ausführungsformen erfolgt, die vorliegende Offenbarung auf jedes Speichersystem angewendet werden kann, das eine bekannte oder in Betracht gezogene Datenredundanz implementiert.
1 stellt ein Blockdiagramm eines beispielhaften Rechensystems 100 einschließlich eines Hosts 101 und eines Speichersystems 110 gemäß einer Ausführungsform dar.
Der Host 101 kann eines oder mehrere von geeigneten Computervorrichtungen oder Systemen sein wie ein Servercomputer, ein Desktop-Computer, ein Laptop-Computer, ein Tablet-Computer, ein Mobiltelefon oder eine beliebige andere elektronische Vorrichtung, die dazu in der Lage ist, Anforderungen an das Speichersystem 110 zu stellen. In einigen Ausführungsformen kann der Host 101 einen oder mehrere Prozessoren, eine oder mehrere Speichervorrichtungen und beliebige andere geeignete Komponenten einschließen, um dem Host 101 Funktionalität hinzuzufügen.
Der Host 101 kann durch ein Netzwerk wie ein lokales Netzwerk (Local-Area Network, LAN), ein Weitverkehrsnetzwerk (Wide-Area Network, WAN), ein Switched-Fabric-Netzwerk, ein drahtgebundenes oder drahtloses Netzwerk, ein privates oder öffentliches Netzwerk usw. kommunikativ mit dem Speichersystem 110 gekoppelt sein.
Der Host 101 kann eine oder mehrere Anwendungen ausführen, die Speicheranforderungen (z. B. Lesen, Schreiben usw.) an das Speichersystem 110 stellen. In einigen Ausführungsformen können die eine oder die mehreren Anwendungen dedizierte Softwareanwendungen sein, die auf dem Host 101 ausgeführt werden, oder können sich alternativ auf anderen geeigneten Rechenvorrichtungen befinden und können entfernt durch den Host 101 ausgeführt werden.
Das Speichersystem 110 kann eine Systemsteuerung 120 und ein Speicherarray 130 aufweisen, die mit der Systemsteuerung über ein Transportmedium wie eine interne Struktur basierend auf Ethernet, InfiniBand, PCI Express (PCle), NVM Express Over Fabric (NVMeOF) usw. gekoppelt sind. Wie unter Bezugnahme auf 2 unten ausführlicher beschrieben, kann die Systemsteuerung 120 eine oder mehrere Computervorrichtungen und/oder Software (in der vorliegenden Offenbarung zusammen als „Logik“ bezeichnet) aufweisen, die zum Verwalten des Betriebs und zum Bereitstellen einer externen Schnittstelle (z. B. zur Kommunikation mit dem Host 101) des Speicherarrays 130 eingerichtet sind. Zum Beispiel kann die Systemsteuerung 120 verschiedene Operationen auf Speichervorrichtungen des Speicherarrays 130 einschließlich Datenredundanz und/oder -wiederherstellung, Speichervorrichtungswiederherstellung und/oder automatische Speicherbereinigung koordinieren und durchführen. Außerdem kann die Systemsteuerung 120 bei einigen Ausführungsformen Kommunikationen zwischen dem Host 101 und dem Speicherarray 130 koordinieren, einschließlich Weiterleiten von Lese- oder Schreibanforderungen von dem Host 101 an die entsprechende Speichervorrichtung (einschließlich Durchführen einer erforderlichen Adressübersetzung, wie weiter unten beschrieben) und Abrufen von Daten von den Speichervorrichtungen auf logische Weise (z. B. können Segmente in einen Streifen assembliert werden), bevor sie an den Host 101 zurückgegeben werden. Bei einigen Ausführungsformen kann die Systemsteuerung 120 eine Non-Volatile Memory Express-Steuerung (NVMe-Steuerung) sein.
Bei einigen Ausführungsformen kann die Systemsteuerung 120 ihre Aktionen mit den Aktionen der anderen Komponenten in dem Computersystem 100 wie dem Host 101 und/oder dem Speicherarray 130 beim Durchführen des Datenkonstruktions- und/oder Wiederherstellungsprozesses für eine ausgefallene Speichervorrichtung koordinieren, wie unten unter Bezugnahme auf 4, 5 und 7 beschrieben. Die Systemsteuerung 120 kann diese Aktionen in Verbindung mit dem Datenrekonstruktions- und/oder Wiederherstellungsprozess durchführen und koordinieren, zum Beispiel unter Verwendung eines Datenverwaltungsschemas einer verteilten globalen Flash-Übersetzungsschicht (Flash Translation Layer, FTL), wie weiter unten unter Bezugnahme auf 8 beschrieben. Bei einigen Ausführungsformen kann die Systemsteuerung 120 keine separate Komponente, wie in 1 gezeigt, sein, sondern kann stattdessen in den Host 101 oder in eine oder mehrere der Speichervorrichtungen 140a, 140b, ... , 140n integriert sein.
Das Speicherarray 130 kann eine Vielzahl von Speichervorrichtungen 140a, 140b, ... , 140n aufweise (jede Speichereinheit wird im Folgenden allgemein einzeln als Speichereinheit 140 bezeichnet), von denen jede eine flüchtige oder nichtflüchtige nicht-transitorische Speichervorrichtung mit geeigneten Eigenschaften wie Flash-Speicher (z. B. Solid-State-Laufwerk (SSD)), persistenter Speicher (PM) und/oder Festplattenmedien einschließlich SMR-Platten (Shiedled Magnetic Recording), hybride Speichervorrichtungen usw. aufweisen kann. Die Speichervorrichtungen 140a, 140b, ... , 140n in dem Speicherarray 130 können kommunikativ miteinander durch ein Transportmedium wie ein internes Gewebe auf Basis von Ethernet, InfiniBand, PCle, NVMeOF usw. gekoppelt sein.
Jede Speichervorrichtung 140 schließt eine Vorrichtungssteuerung 142 und ein Speichermedium 143 ein. Wie unten unter Bezugnahme auf 3 ausführlicher beschrieben, kann die Vorrichtungssteuerung 142 eine oder mehrere Rechenvorrichtungen und/oder Software (in der vorliegenden Offenbarung zusammen als „Logik“ bezeichnet) aufweisen, die eingerichtet sind, um den Betrieb des Speichermediums 143 zu verwalten und eine externe Schnittstelle zu der jeweiligen Speichervorrichtung 140 bereitzustellen. Bei einigen Ausführungsformen, wie unten unter Bezugnahme auf 4, 5 und 7 beschrieben, können diese Operationen ein Durchführen von Peer-to-Peer-Kommunikation (z. B. Datenübertragungen) mit anderen Speichervorrichtungen in dem Speicherarray 130 einschließen.
Das Speichermedium 143 kann eines oder mehrere flüchtige oder nicht-flüchtige Speichermedien umfassen, die einen oder mehrere Medienabschnitte 144 mit physischen oder logischen Abschnitten des Speichermediums zum Speichern von Daten wie Chips, Platten, Speicherzellen, Sektoren und/oder Seiten einschließen. Bei einigen Ausführungsformen können Daten im Speichermedium 143 jeder Speichervorrichtung 140 in Form von Segmenten organisiert sein, von denen jedes Segment aus einem oder mehreren Blöcken zusammengesetzt sein kann. Ferner können die Segmente in die Speichervorrichtungen 140a, 140b, ... , 140n in dem Speicherarray 130 in Form von Streifen unter Verwendung eines geeigneten Datenstrukturierungsverfahrens wie Log-Strukturierung geschrieben werden. Dies wird unten unter Bezugnahme auf 6 detaillierter gezeigt und beschrieben.
Wie weiter unten unter Bezugnahme auf 4, 5, und 7 erörtert, kann das Speichersystem 110 unter Verwendung eines geeigneten Redundanzschemas wie RAID- oder Löschcodierung dafür eingerichtet sein, dass bei Ausfall eines oder mehrerer der Speichervorrichtungen 140a, 140b, ... , 140n (nachfolgend als ausgefallene Speichervorrichtung 140' bezeichnet) ein Datenrekonstruktions- und/oder Wiederherstellungsprozess wie unten beschrieben durchgeführt werden kann, um die Daten von der oder den ausgefallenen Speichervorrichtungen wiederherzustellen.
In der vorliegenden Offenbarung kann sich eine „ausgefallene Speichervorrichtung“ auf jede Speichervorrichtung in dem Speicherarray beziehen, die in irgendeiner Hinsicht nicht richtig funktioniert, einschließlich: (1) einer Speichervorrichtung, die weiterhin betriebsfähig ist, aber basierend auf einem Frühwarnhinweis als „ausgefallen“ betrachtet werden kann, und (2) einer Speichervorrichtung, die nur teilweise ausgefallen ist. Zum Beispiel kann die ausgefallene Speichervorrichtung in einigen Ausführungsformen eine oder mehrere Speicherressourcen (z. B. das Speichermedium 143), die teilweise oder vollständig ausgefallen sind, und eine oder mehrere Rechenressourcen (z. B. die Vorrichtungssteuerung 142), die mindestens teilweise weiterhin funktionieren (z. B. in der Lage sind, mindestens einige ihrer vorgesehenen Funktionen durchzuführen), einschließen. Die eine oder die mehreren Speichervorrichtungen in dem Speicherarray, außer der ausgefallenen Speichervorrichtung, können als „funktionierende Speichervorrichtungen“ bezeichnet werden.
2 stellt ein Blockdiagramm einer beispielhaften Systemsteuerung 120 für das in 1 gezeigte Speichersystem 110 gemäß einer Ausführungsform dar. Wie bereits erwähnt, kann die Systemsteuerung 120 verwendet werden, um den Betrieb des Speicherarrays 130 zu verwalten und eine externe Schnittstelle zu diesem (z. B. zur Kommunikation mit dem Host 101) bereitzustellen. Die Systemsteuerung 120 kann ihre Aktionen mit den Aktionen der anderen Komponenten in dem Rechensystem 100 wie dem Host 101 und/oder dem Speicherarray 130 beim Durchführen des Datenrekonstruktions- und/oder Wiederherstellungsprozesses für eine ausgefallene Speichervorrichtung koordinieren, wie unten unter Bezugnahme auf 4, 5 und 7 beschrieben, zum Beispiel unter Verwendung des verteilten globalen FTL-Datenverwaltungsschemas, wie unter Bezugnahme auf 8 beschrieben.
Wie in 2 gezeigt, kann die Systemsteuerung 120 neben anderen Komponenten eine oder mehrere Schnittstelle(n) 205, einen Prozessor 210, einen Speicher 220 mit Software, Firmware und/oder Daten, einschließlich, ohne darauf beschränkt zu sein, einer Speicherverwaltungs-Engine 222, aufweisen. Ein Bus 250 kann verwendet werden, um die verschiedenen Komponenten der Systemsteuerung 120 kommunikativ zu koppeln. Es versteht sich, dass die Systemsteuerung 120 je nach der Konfiguration, wie Konfigurationen, die Elemente kombinieren, die Elemente in Hardware im Gegensatz zu Software implementieren usw., alternative, zusätzliche und/oder weniger Komponenten einschließen kann.
Die eine oder die mehreren Schnittstellen 205 können die Systemsteuerung 120 kommunikativ mit dem Host 101 und/oder dem Speicherarray 130 koppeln. Die eine oder die mehreren Schnittstellen 205 können, ohne darauf beschränkt zu sein, eine Eingabe/Ausgabe-Schnittstellenschaltung (E/A-Schnittstellenschaltung) einschließen, die (ein) geeignete(s) Kommunikationsprotokoll(e) zum Kommunizieren mit dem Host 101 und/oder dem Speicherarray 130 verwendet.
Der Prozessor 210, der eine oder mehrere Verarbeitungseinheiten einschließen kann, kann verwendet werden, um die Anweisungen verschiedener Softwareprogramme auszuführen, die in dem Speicher 220 enthalten sind. Der Prozessor 210 kann eine oder mehrere Verarbeitungseinheiten und/oder Kerne, programmierbare integrierte Schaltungen, wie anwendungsspezifische integrierte Schaltungen (Application-Specific Integrated Circuits, ASICs) oder feldprogrammierbare Gatteranordnungen (Field-Programmable Gate Arrays, FPGAs), oder eine Kombination davon einschließen. Der Prozessor 210 kann auf verschiedenen Rechenarchitekturen basieren, einschließlich einer Architektur für Computer mit komplexem Anweisungssatz (Complex Instruction Set Computer, CISC), einer Architektur für Computer mit reduziertem Anweisungssatz (Reduced Instruction Set Computer, RISC) oder einer Architektur, die eine Kombination von Anweisungssätzen implementiert. Es versteht sich, dass andere Konfigurationen des Prozessors 210 möglich sind.
Der Speicher 220, der eine oder mehrere nicht-transitorische Speichervorrichtungen einschließen kann, kann Softwareprogramme, Firmware und/oder Daten speichern, die durch den Prozessor 210 ausgeführt oder auf sonstige Weise verarbeitet werden. Der Speicher 220 kann zum Beispiel flüchtigen Speicher, wie (eine) Vorrichtung(en) mit dynamischem Speicher mit wahlfreiem Zugriff (Dynamic Random-Access Memory, DRAM), (eine) Vorrichtung(en) mit statischem Speicher mit wahlfreiem Zugriff (Static Random-Access Memory, SRAM), nichtflüchtigen Speicher, wie Vorrichtungen mit elektrisch löschbarem programmierbarem Festwertspeicher (Electrically Erasable Programmable Read-Only Memory, EEPROM) oder Flash-Speicher, eine Kombination des Vorgenannten und/oder einen anderen geeigneten Typ von Datenspeichermedium aufweisen.
Die in dem Speicher 220 enthaltene Speicherverwaltungs-Engine 222 kann Routinen und/oder Anweisungen einschließen, die bei Ausführung durch den Prozessor 210 eine oder mehrere der verschiedenen Speicherverwaltungsoperationen für das Speicherarray 130 einschließlich Operationen im Zusammenhang mit Adressübersetzung, Datenwiederherstellung und -rekonstruktion, Speichervorrichtungswiederherstellung und/oder automatischer Speicherbereinigung durchführen können.
Bei einigen Ausführungsformen kann die Speicherverwaltungs-Engine 222 eine Adressabbildung 225 mit Adressinformationen einschließen, die von der Speicherverwaltungs-Engine 222 verwendet werden, um logische Adressen oder Namensräume, die in Verbindung mit Lese- oder Schreibanforderungen des Hosts 101 empfangen werden, in physische Adressen für den Zugriff auf Speichervorrichtungen in dem Speicherarray 130 zu übersetzen, wie unten unter Bezugnahme auf 4, 5 und 7 beschrieben. Bei einigen Ausführungsformen kann die Speicherverwaltungs-Engine 222 eine Streifenabbildung 227 einschließen, die in Verbindung mit dem Schreiben oder Lesen von Daten auf einen Streifen in dem Speicherarray 130 verwendet wird, wie nachfolgend unter Bezugnahme auf 7 beschrieben.
Bei einigen Ausführungsformen können eines oder mehrere Hardwarelogikmodule 230 wie ASICs, FPGAs usw. anstelle oder ergänzend zu der Software und/oder Firmware in dem Speicher 220 eingesetzt werden, um eine oder mehrere der zuvor erwähnten Funktionen durchzuführen, die durch die Speicherverwaltungs-Engine 222, Adressabbildung 225 und/oder Streifenabbildung 227 bereitgestellt werden.
3 stellt ein Blockdiagramm einer beispielhaften Vorrichtungssteuerung 142 für das in 1 gezeigte Speichersystem 110 gemäß einer Ausführungsform dar. Wie bereits erwähnt, kann die Vorrichtungssteuerung 142 verwendet werden, um den Betrieb der jeweiligen Speichervorrichtung 140 zu verwalten und eine externe Schnittstelle zu dieser bereitzustellen.
Wie in 3 gezeigt, kann die Vorrichtungssteuerung 142 neben anderen Komponenten eine oder mehrere Schnittstellen 305, einen Prozessor 310, einen Speicher 320 mit Software, Firmware und/oder Daten einschließlich einer Medienverwaltungs-Engine 322, Redundanzcodierungs-Paritäts-Engine 323 und einer Peer-to-Peer-Datenübertragungs-Engine 324 umfassen. Ein Bus 350 kann verwendet werden, um die verschiedenen Komponenten der Vorrichtungssteuerung 142 kommunikativ zu koppeln. Es versteht sich, dass die Vorrichtungssteuerung 142 je nach der Konfiguration, wie Konfigurationen, die Elemente kombinieren, die Elemente in Hardware im Gegensatz zu Software implementieren usw., alternative, zusätzliche und/oder weniger Komponenten einschließen kann.
Die eine oder die mehreren Schnittstellen 305 können die Vorrichtungssteuerung 142 kommunikativ mit der Systemsteuerung 120 und/oder den Speichervorrichtungen in dem Speicherarray 130 koppeln. Die eine oder die mehreren Schnittstellen 305 können, ohne darauf beschränkt zu sein, eine Eingabe/Ausgabe-Schnittstellenschaltung (E/A-Schnittstellenschaltung) einschließen, die (ein) geeignete(s) Kommunikationsprotokoll(e) zum Kommunizieren mit der Systemsteuerung 120 und/oder den anderen Speichervorrichtungen verwendet.
Der Prozessor 310, der eine oder mehrere Verarbeitungseinheiten einschließen kann, kann verwendet werden, um die Anweisungen verschiedener Softwareprogramme auszuführen, die in dem Speicher 320 enthalten sind. Der Prozessor 310 kann eine oder mehrere Verarbeitungseinheiten und/oder Kerne, programmierbare integrierte Schaltungen wie anwendungsspezifische integrierte Schaltungen (ASICs) oder feldprogrammierbare Gate-Arrays (FPGAs) oder eine Kombination davon einschließen. Der Prozessor 310 kann auf verschiedenen Rechenarchitekturen basieren, einschließlich einer Architektur für Computer mit komplexem Anweisungssatz (CISC), einer Architektur für Computer mit reduziertem Anweisungssatz (RISC) oder einer Architektur, die eine Kombination von Anweisungssätzen implementiert. Es versteht sich, dass andere Konfigurationen des Prozessors 310 möglich sind.
Der Speicher 320, der eine oder mehrere nicht-transitorische Speichervorrichtungen einschließen kann, kann Softwareprogramme, Firmware und/oder Daten speichern, die durch den Prozessor 310 ausgeführt oder auf sonstige Weise verarbeitet werden. Der Speicher 320 kann zum Beispiel flüchtigen Speicher, wie (eine) Vorrichtung(en) mit dynamischem Speicher mit wahlfreiem Zugriff (Dynamic Random-Access Memory, DRAM), (eine) Vorrichtung(en) mit statischem Speicher mit wahlfreiem Zugriff (Static Random-Access Memory, SRAM), nichtflüchtigen Speicher, wie Vorrichtungen mit elektrisch löschbarem programmierbarem Festwertspeicher (Electrically Erasable Programmable Read-Only Memory, EEPROM) oder Flash-Speicher, eine Kombination des Vorgenannten und/oder einen anderen geeigneten Typ von Datenspeichermedium aufweisen.
Die in dem Speicher 320 enthaltene Medienverwaltungs-Engine 322 kann Routinen und/oder Anweisungen einschließen, die bei Ausführung durch den Prozessor 310 eine oder mehrere der verschiedenen Speicherverwaltungsoperationen für das Speichermedium 143 einschließlich Operationen im Zusammenhang mit Datenwiederherstellung und -rekonstruktion und automatischer Speicherbereinigung auf Vorrichtungsebene durchführen können.
Die in Speicher 320 enthaltene Redundanzcodierungs-Paritäts-Engine 323 kann Routinen und/oder Befehle einschließen, die bei Ausführung durch den Prozessor 310 eine oder mehrere Datenredundanzoperationen einschließlich des Erzeugens und Speicherns von Redundanzinformationen (z. B. Paritätsblöcke) für das Speichermedium 143 durchführen können.
Die im Speicher 320 enthaltene Peer-to-Peer-Datenübertragungs-Engine 324 kann Routinen und/oder Befehle einschließen, die bei Ausführung durch den Prozessor 310 eine oder mehrere Aktionen zum Durchführen von Peer-to-Peer-Kommunikation mit anderen Speichervorrichtungen in dem Speicherarray 130 ausführen können wie Ausgeben und Ausführen von Peer-to-Peer-Befehlen und Übertragen von Daten zu oder von den anderen Speichervorrichtungen, wie nachfolgend unter Bezugnahme auf 4, 5 und 7 beschrieben. Die Peer-to-Peer-Datenübertragungs-Engine 324 kann die Peer-to-Peer-Kommunikation auf verschiedene Weise durchführen. Zum Beispiel kann die Peer-to-Peer-Datenübertragungs-Engine 324 bei einigen Ausführungsformen im Vollinitiatormodus arbeiten, so dass eine Speichervorrichtung eine Verbindung herstellen, Befehle erzeugen und die Befehle an andere Speichervorrichtungen senden kann. Bei einigen anderen Ausführungsformen kann der Host 101 gemeinsame Speicherbereiche in jeder Speichervorrichtung 140 einrichten, einen oder mehrere Befehle an eine Quellspeichervorrichtung senden, um Daten in der Quellspeichervorrichtung in einen gemeinsamen Speicherbereich zu lesen, und dann das Senden von Daten aus dem gemeinsamen Speicherbereich an eine Zielspeichervorrichtung unter Verwendung von direktem Speicherzugriff (Direct Memory Access, DMA) einleiten.
Bei einigen Ausführungsformen können eines oder mehrere Hardwarelogikmodule 330 wie ASICs, FPGAs usw. anstelle oder ergänzend zu der Software und/oder Firmware in dem Speicher 320 eingesetzt werden, um eine oder mehrere der zuvor erwähnten Funktionen durchzuführen, die durch die Medienverwaltungs-Engine 322, Redundanzcodierungs-Paritäts-Engine 323 und/oder Peer-to-Peer-Datenübertragungs-Engine 324 bereitgestellt werden.
4 stellt ein Flussdiagramm eines beispielhaften Verfahrens 400 zum Rekonstruieren von Daten einer ausgefallenen Speichervorrichtung 140' unter Verwendung einer oder mehrerer funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung über Peer-to-Peer-Kommunikation (z. B. Datenübertragungen) für das in 1 gezeigte Speichersystem 110 gemäß einer Ausführungsform dar. Das Datenrekonstruktionsverfahren aus 4 kann zum Beispiel bei einem teilweisen Medienausfall einer Speichervorrichtung 140 durchgeführt werden. Es sei darauf hingewiesen, dass Block 430 und 440 in diesem Beispiel mindestens teilweise von einer funktionierenden Rechenressource (z. B. der Vorrichtungssteuerung 142) der ausgefallenen Speichervorrichtung 140' ausgeführt werden können. Die in 4 gezeigten verbleibenden Blöcke können zum Beispiel von einem oder mehreren von einer Speichervorrichtung 140 (einschließlich der ausgefallenen Speichervorrichtung 140') in dem Speichersystem 110, der Systemsteuerung 120 und dem Host 101 oder einer Kombination davon gemäß dem verteilten globalen FTL-Datenverwaltungsschema durchgeführt werden, wie nachfolgend unter Bezugnahme auf 8 beschrieben.
In Block 405 kann eine Leseanforderung oder ein anderer Befehl vom Host 101 empfangen werden. Block 405 kann während des normalen Betriebs des Speichersystems 110 auftreten.
In Block 410 kann ein Medienfehler einschließlich verlorener Daten in der ausgefallenen Speichervorrichtung 140' als Reaktion auf das Empfangen der Leseanforderung erkannt werden. Bei der vorliegenden Offenlegung können verlorene Daten als Daten betrachtet werden, die aufgrund eines Ausfalls eines oder mehrerer Medienabschnitte 144 des Speichermediums 143 nicht ordnungsgemäß aus der Speichervorrichtung gelesen werden können, und umgekehrt können wiederherstellbare Daten als Daten betrachtet werden, die ordnungsgemäß aus der Speichervorrichtung gelesen werden können.
Bei einigen Ausführungsformen kann Block 410 bei einem teilweisen Medienausfall das Identifizieren eines Medienabschnitts 144 des Speichermediums 143 in der ausgefallenen Speichervorrichtung 140', der ausgefallen ist (nachfolgend als ausgefallener Medienabschnitt 144' bezeichnet), der die verlorenen Daten enthält, und eines Medienabschnitts der ausgefallenen Speichervorrichtung, der nicht ausgefallen ist (nachfolgend als funktionierender Medienabschnitt 144" bezeichnet), der wiederherstellbare Daten enthält, einschließen. Bei einigen Ausführungsformen kann jeder Medienabschnitt 144 einen oder mehrere physische oder logische Abschnitte des Speichermediums 143 in der jeweiligen Speichervorrichtung 140 zum Speichern von Daten wie Chips, Platten, Speicherzellen, Sektoren und/oder Seiten aufweisen.
In Block 420 können sich Daten und Redundanzinformationen in einem oder mehreren der Speichervorrichtungen 140a, 140b, ... , 140n in dem Speichersystem 110 befinden, die nicht ausgefallen sind (nachfolgend als funktionierende Speichervorrichtungen 140" bezeichnet), um die verlorenen Daten der ausgefallenen Speichervorrichtung 140' zu rekonstruieren. Bei einigen Ausführungsformen können sich die Daten und die Redundanzinformationen in der einen oder den mehreren funktionierenden Speichervorrichtungen 140" befinden, wobei das verteilte globale FTL-Datenverwaltungsschema verwendet wird, wie unten unter Bezugnahme auf 8 beschrieben.
In Block 430 kann die ausgefallene Speichervorrichtung 140" in dem Speichersystem 110 einen oder mehrere Peer-to-Peer-Befehle an das eine oder die mehreren funktionierenden Speichervorrichtungen 140" in dem Speichersystem 110 ausgeben, um die Daten und die Redundanzinformationen von der oder den funktionierenden Speichervorrichtungen zu erhalten. Bei einigen Ausführungsformen kann der Peer-to-Peer-Befehl ein Lesebefehl sein. Bei einigen Ausführungsformen kann der Peer-to-Peer-Befehl von der Peer-to-Peer-Datenübertragungs-Engine 324 in der Vorrichtungssteuerung 142 der jeweiligen Speichervorrichtung ausgegeben und ausgeführt werden.
In Block 440 kann die ausgefallene Speichervorrichtung 140' in dem Speichersystem 110 die verlorenen Daten der ausgefallenen Speichervorrichtung 140' auf Basis der Daten und der Redundanzinformationen rekonstruieren, die von der einen oder den mehreren funktionierenden Speichervorrichtungen 140" in dem Speichersystem erhalten wurden 110. Bei einigen Ausführungsformen können die verlorenen Daten der ausgefallenen Speichervorrichtung durch die Medienverwaltungs-Engine 322 in der Vorrichtungssteuerung 142, wie oben unter Bezugnahme auf 3 beschrieben, der Speichervorrichtung rekonstruiert werden. Bei einigen Ausführungsformen können die verlorenen Daten rekonstruiert werden, indem eine oder mehrere XOR- oder GF-Operationen durchgeführt werden, die für die Daten und die Redundanzinformationen angemessen sind, wie im Stand der Technik bekannt.
In Block 450 können die rekonstruierten verlorenen Daten der ausgefallenen Speichervorrichtung 140' an den Host 101 zurückgesendet werden, z. B. als Reaktion auf die Leseanforderung von dem Host. Bei einigen Ausführungsformen kann Block 450 gemäß dem verteilten globalen FTL-Datenverwaltungsschema ausgeführt werden, wie nachfolgend unter Bezugnahme auf 8 beschrieben.
In Block 460 kann das Vorhandensein eines oder mehrerer verfügbarer Speicherorte in dem Speichersystem 110 bestimmt werden. Falls bestimmt wird, dass ein verfügbarer Speicherort vorhanden ist, kann das Verfahren mit Block 470 fortgesetzt werden. Falls nicht, kann die Datenrekonstruktion an diesem Punkt enden, da kein verfügbarer Speicherort zum Speichern der rekonstruierten verlorenen Daten vorhanden ist. Bei einigen Ausführungsformen können die verfügbaren Orte verfügbarer freier Speicherplatz in dem Speicherarray 630 sein.
In Block 470 können die rekonstruierten verlorenen Daten der ausgefallenen Speichervorrichtung 140' an den einen oder die mehreren verfügbaren Speicherorte in dem Speichersystem 110 geschrieben werden, die in Block 460 identifiziert wurden. Bei einigen Ausführungsformen können sich die verfügbaren Speicherorte, in welche die rekonstruierten verlorenen Daten geschrieben werden, in der ausgefallenen Speichervorrichtung 140' und/oder der funktionierenden Speichervorrichtung 140" in dem Speichersystem 110 befinden. Bei einigen Ausführungsformen kann Block 470 gemäß dem verteilten globalen FTL-Datenverwaltungsschema ausgeführt werden, wie nachfolgend unter Bezugnahme auf 8 beschrieben.
Bei einigen Ausführungsformen kann Block 470 bei einem teilweisen Medienausfall das Kopieren der in Block 410 identifizierten wiederherstellbaren Daten von einem ersten Ort in dem funktionierenden Medienabschnitt 144" der ausgefallenen Speichervorrichtung 140" an einen zweiten Ort in dem funktionierenden Medienabschnitt der ausgefallenen Speichervorrichtung einschließen. Bei einigen Ausführungsformen kann das Kopieren durch die ausgefallene Speichervorrichtung erfolgen, die einen XCOPY-Befehl ausgibt.
5 stellt ein Flussdiagramm eines beispielhaften Verfahrens 500 zum Wiederherstellen einer ausgefallenen Speichervorrichtung 140' unter Verwendung einer oder mehrerer funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung über Peer-to-Peer-Kommunikation für das in 1 gezeigte Speichersystem 110 gemäß einer Ausführungsform dar. Die Blöcke in dem Verfahren 500 können iterativ durchgeführt werden, zum Beispiel für jeden Streifen in dem Speicherarray 130, bis der Inhalt der ausgefallenen Speichervorrichtung 140' wiederhergestellt ist. Es sei darauf hingewiesen, dass Block 530 und 540 in diesem Beispiel mindestens teilweise von einer funktionierenden Rechenressource (z. B. der Vorrichtungssteuerung 142) der ausgefallenen Speichervorrichtung 140' durchgeführt werden können. Die in 5 gezeigten restlichen Blöcke können zum Beispiel von einem oder mehreren von einer Speichervorrichtung 140 (einschließlich der ausgefallenen Speichervorrichtung 140') in dem Speichersystem 110, der Systemsteuerung 120 und dem Host 101 oder einer Kombination davon gemäß dem verteilten globalen FTL-Datenverwaltungsschema ausgeführt werden, wie nachfolgend unter Bezugnahme auf 8 beschrieben.
In Block 510 kann ein Medienausfall in der ausgefallenen Speichervorrichtung 140' erkannt werden. Bei einigen Ausführungsformen kann Block 510 als Reaktion auf eine Leseanforderung oder einen anderen Befehl durchgeführt werden, der von der Systemsteuerung 120 bei normalem Betrieb des Speichersystems 110 empfangen wird.
In Block 515 kann ein zu rekonstruierender Abschnitt (z. B. ein oder mehrere Blöcke eines Streifens in dem Speicherarray 130) der ausgefallenen Speichervorrichtung 140' identifiziert werden.
In Block 520 können sich Daten und Redundanzinformationen in einer oder mehreren der funktionierenden Speichervorrichtungen 140" in dem Speichersystem 110 befinden, um Daten des identifizierten Abschnitts der ausgefallenen Speichervorrichtung 140' zu rekonstruieren.
In Block 530 kann die ausgefallene Speichervorrichtung 140" in dem Speichersystem 110 einen oder mehrere Peer-to-Peer-Befehle an das eine oder die mehreren funktionierenden Speichervorrichtungen 140" in dem Speichersystem 110 ausgeben, um die Daten und die Redundanzinformationen von der oder den funktionierenden Speichervorrichtungen zu erhalten. Bei einigen Ausführungsformen kann der Peer-to-Peer-Befehl ein Lesebefehl sein. Bei einigen Ausführungsformen kann der Peer-to-Peer-Befehl von der Peer-to-Peer-Datenübertragungs-Engine 324 in der Vorrichtungssteuerung 142 der jeweiligen Speichervorrichtung ausgegeben und ausgeführt werden.
In Block 540 kann die ausgefallene Speichervorrichtung 140' in dem Speichersystem 110 die Daten des identifizierten Abschnitts der ausgefallenen Speichervorrichtung 140' auf Basis der Daten und der Redundanzinformationen rekonstruieren, die von der einen oder den mehreren funktionierenden Speichervorrichtungen 140" in dem Speichersystem erhalten wurden 110. Bei einigen Ausführungsformen können die verlorenen Daten der ausgefallenen Speichervorrichtung durch die Medienverwaltungs-Engine 322 in der Vorrichtungssteuerung 142, wie oben unter Bezugnahme auf 3 beschrieben, der Speichervorrichtung rekonstruiert werden. Bei einigen Ausführungsformen können die verlorenen Daten rekonstruiert werden, indem eine oder mehrere XOR- oder GF-Operationen durchgeführt werden, die für die Daten und die Redundanzinformationen geeignet sind, wie aus dem Stand der Technik bekannt.
In Block 550 können die rekonstruierten Daten des identifizierten Abschnitts der ausgefallenen Speichervorrichtung 140' an einen oder mehrere verfügbare Speicherorte in dem Speichersystem 110 geschrieben werden. Bei einigen Ausführungsformen können sich die verfügbaren Speicherorte, an welche die rekonstruierten verlorenen Daten geschrieben werden, in der ausgefallenen Speichervorrichtung 140' und/oder den funktionierenden Speichervorrichtung 140" in dem Speichersystem 110 befinden.
In Block 560 wird bestimmt, ob alle Abschnitte der ausgefallenen Speichervorrichtung 140' rekonstruiert wurden. Falls dies der Fall ist, ist der Wiederherstellungsprozess abgeschlossen und kann enden. Doch falls dies nicht der Fall ist, können die Blöcke 515 bis 550 iterativ wiederholt werden, wie gerade für die übrigen Abschnitte der ausgefallenen Speichervorrichtung 140' beschrieben, bis der Inhalt der ausgefallenen Speichervorrichtung wiederhergestellt ist.
6 stellt ein Blockdiagramm eines beispielhaften Speicherarrays 630 für das in 1 gezeigte Speichersystem 110 gemäß einer Ausführungsform dar. Das Speicherarray 630 ist eine Ausführungsform des in 1 gezeigten Speicherarrays 130 mit vier Solid-State-Laufwerken (SSDs) 640a, 640b, 640c und 640d (nachfolgend jeweils auch als SSD1, SSD2, SSD3 und SSD4 bezeichnet) in einer 3+1-Konfiguration. Obwohl das Speichersystem 110 in 6 zur leichteren Veranschaulichung mit vier SSDs dargestellt ist, sei darauf hingewiesen, dass das Speichersystem in anderen Ausführungsformen auch andere Arten von Speichervorrichtungen wie Festplattenmedien oder hybride Speichervorrichtungen in jeder geeigneten Menge einsetzen kann.
Wie in der Figur gezeigt, können SSD1, SSD2, SSD3 und SSD4 in dem Speicherarray 630 jeweils eine Vielzahl von Segmenten 650 enthalten, wobei das Segment einen oder mehrere Blöcke 655 einschließen kann. Die Vielzahl von Segmenten 650, die in dem Speicherarray 630 enthalten ist, kann in einem oder mehreren Streifen 660 organisiert sein.
Der Streifen 660 kann eine Kombination von einem oder mehreren Datensegmenten und einem oder mehreren Fehlerkorrektursegmenten (z. B. Paritätssegmenten) aufweisen, wie für das in dem Speicherarray 630 verwendete Datenredundanzschema angemessen. Wie in 6 gezeigt, schließt der Streifen 660 vier Segmente 650 ein, von denen drei Segmente (mit „D1“, „D2“ und „D3“ angegebene) Daten enthalten und ein Segment (mit „P“ angegebene) Paritätsinformationen enthält. Die Daten D1, D2 und D3 können unter Verwendung einer geeigneten Datenstrukturierungsmethode wie Log-Strukturierung in den Streifen 660 geschrieben werden. Bei einer Log-strukturierten Datenorganisation können wahlfreie Datenschreibvorgänge zusammen gruppiert und nacheinander in den Streifen 660 geschrieben werden.
Bei dem nachfolgend unter Bezugnahme auf 7 beschriebenen Verfahren zum Wiederherstellen einer ausgefallenen Speichervorrichtung entspricht SSD2 der „ausgefallenen Speichervorrichtung“ und entsprechend SSD1, SSD3 und SSD4 den „funktionierenden Speichervorrichtungen“.
7 stellt ein Flussdiagramm eines beispielhaften Verfahrens 700 zum Wiederherstellen der ausgefallenen Speichervorrichtung SSD2 unter Verwendung einer oder mehrerer funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung über Peer-to-Peer-Kommunikation für das in 6 gezeigte Speicherarray 630 gemäß einer Ausführungsform dar. Es sei darauf hingewiesen, dass das in 7 veranschaulichte Verfahren dem oben unter Bezugnahme auf 5 beschriebenen Verfahren entspricht, wie auf das Speicherarray 630 angewendet. Die Blöcke in dem Verfahren 700 können iterativ ausgeführt werden, zum Beispiel für jeden Streifen in dem Speicherarray 630, bis der Inhalt der ausgefallenen Speichervorrichtung SSD2 wiederhergestellt ist. Es sei darauf hingewiesen, dass Block 730 und 740 in diesem Beispiel mindestens teilweise von einer funktionierenden Rechenressource (z. B. Vorrichtungssteuerung 142) der ausgefallenen Speichervorrichtung SSD2 ausgeführt werden können. Die verbleibenden Blöcke in 7 können zum Beispiel von einem oder mehreren von einem SSD (einschließlich der ausgefallenen Speichervorrichtung SSD2) in dem Speicherarray 630, der Systemsteuerung 120 und dem Host 101 oder einer Kombination davon gemäß dem verteilten globalen FTL-Datenverwaltungsschema ausgeführt werden, wie nachfolgend unter Bezugnahme auf 8 beschrieben.
In dem in 7 gezeigten Verfahren kann die ausgefallene Speichervorrichtung SSD2 als Initiatorvorrichtung betrachtet werden und können die funktionierenden Speichervorrichtungen SSD1, SSD3 und SSD4 als Zielvorrichtungen betrachtet werden.
In Block 710 kann ein Medienausfall in der ausgefallenen Speichervorrichtung SSD2 erkannt werden. Bei einigen Ausführungsformen kann Block 710 als Reaktion auf eine Leseanforderung durchgeführt werden, die von der Systemsteuerung 120 bei normalem Betrieb des Speichersystems 110 empfangen wird.
In Block 715 kann ein Datensegment D2 des Streifens 660 in der SSD2 zum Rekonstruieren identifiziert werden.
In Block 720 können sich die Datensegmente D1 und D3 und das Paritätssegment P in dem Streifen 660 in funktionierenden Speichervorrichtungen SSD1, SSD3 bzw. SSD4 befinden, um das Datensegment D2 von SSD2 zu rekonstruieren.
In Block 730 kann SSD2 einen oder mehrere Peer-to-Peer-Befehle an einen oder mehrere von SSD1, SSD3 und SSD4 ausgeben, um die Datensegmente D1 und D3 und das Paritätssegment P in dem Streifen 660 zu erhalten. Bei einigen Ausführungsformen kann der Peer-to-Peer-Befehl ein Lesebefehl sein. Bei einigen Ausführungsformen kann der Peer-to-Peer-Befehl von der Peer-to-Peer-Datenübertragungs-Engine 324 in der Vorrichtungssteuerung 142 von SSD2 ausgegeben und ausgeführt werden.
In Block 740 kann SSD2 das Datensegment D2 von SSD2 auf Basis der Datensegmente D1 und D3 und des Paritätssegments P, die von SSD1, SSD3 bzw. SSD4 erhalten werden, rekonstruieren. Bei einigen Ausführungsformen kann das Datensegment D2 durch die Medienverwaltungs-Engine 322 in der Vorrichtungssteuerung 142, wie oben unter Bezugnahme auf 3 beschrieben, von SSD2 rekonstruiert werden. Bei einigen Ausführungsformen kann das Datensegment D2 rekonstruiert werden, indem eine oder mehrere XOR- oder GF-Operationen durchgeführt werden, die für die Datensegmente D1 und D3 und das Paritätssegment P angemessen sind, wie aus dem Stand der Technik bekannt.
In Block 750 kann das rekonstruierte Datensegment D2 von SSD2 in einen oder mehrere verfügbare Speicherorte in dem Speicherarray 630 geschrieben werden. Bei einigen Ausführungsformen können sich der oder die verfügbaren Speicherorte, in welche die rekonstruierten Datensegmente D2 geschrieben werden, in der ausgefallenen Speichervorrichtung SSD2 und/oder den funktionierenden Speichervorrichtungen SSD1, SSD3 und SSD4 befinden.
In Block 760 wird bestimmt, ob alle Abschnitte der ausgefallenen Speichervorrichtung SSD2 rekonstruiert wurden. Falls dies der Fall ist, ist der Wiederherstellungsprozess abgeschlossen und kann enden. Doch falls dies nicht der Fall ist, können Block 715 bis 750 iterativ wiederholt werden, wie gerade für die übrigen Abschnitte von SSD2 beschrieben, bis der Inhalt von SSD2 wiederhergestellt ist.
8 stellt ein Flussdiagramm eines beispielhaften Verfahrens 800 zum Durchführen einer Datenverwaltungsanforderung (z. B. Leseanforderung) gemäß einem Datenverwaltungsschema einer verteilten globalen Flash-Übersetzungsschicht (FTL) für das in 1 gezeigte Rechensystem 100 gemäß einer Ausführungsform dar. In dem in 8 gezeigten Beispiel werden die meisten der Blöcke in dem Verfahren 800 durch die Systemsteuerung 120 durchgeführt, wenngleich in anderen Ausführungsformen einer oder mehrere der Blöcke in dem Verfahren durch andere Vorrichtungen (z. B. Host 101 oder Speichervorrichtung 140) in dem Speichersystem 110 durchgeführt werden können.
In Block 810 kann die Systemsteuerung 120 eine Datenverwaltungsanforderung (z. B. Leseanforderung) von dem Host 101 empfangen.
In Block 820 kann die Systemsteuerung 120 (z.B. unter Verwendung der Speicherverwaltungs-Engine 222) auf Basis der Datenverwaltungsanforderung eine oder mehrere Speichervorrichtungen 140 in dem Speichersystem 110 und eine oder mehrere Datenverwaltungsoperationen, die von der einen oder den mehreren Speichervorrichtungen 140 durchzuführen sind, bestimmen. In einigen Ausführungsformen, um die eine oder die mehreren Speichervorrichtungen 140 zu bestimmen, empfängt die Systemsteuerung 120 eine logische Eingabeadresse von dem Host 101 und indiziert die Adresskarte 225, die logische Adressen auf Speichervorrichtungen abbildet, unter Verwendung der logischen Eingabeadresse, um die eine oder die mehreren Speichervorrichtungen 140 zu identifizieren. In einigen solchen Ausführungsformen verwendet die Systemsteuerung 120 mindestens einen Abschnitt der logischen Eingabeadresse, um die eine oder die mehreren Speichervorrichtungen 140 zu identifizieren.
In Block 830 kann die Systemsteuerung 120 die Durchführung einer oder mehrerer Datenverwaltungsoperationen entsprechend der Datenverwaltungsanforderung einleiten. Bei einigen Ausführungsformen schließt Block 830 das Senden eines oder mehrerer Datenverwaltungsbefehle an die eine oder die mehreren Speichervorrichtungen 140 und das Einleiten einer oder mehrerer Datenübertragungen (entweder vor oder nach dem Senden des einen oder der mehreren Datenverwaltungsbefehle) ein. Die eine oder die mehreren Datenübertragungen können einen oder mehrere Vorgänge, wie einen Vorgang eines direkten Speicherzugriffs (Direct Memory Access, DMA), um Daten zwischen einem Speicherpuffer einer jeweiligen Speichervorrichtung 140 in dem Speichersystem 110 und einem Speicherpuffer des Hosts 101 zu übertragen, und/oder eine interne Datenübertragung zwischen zwei oder mehreren der Speichervorrichtungen 140 in dem Speichersystem 110 einschließen. In einigen Ausführungsformen schließen die eine oder die mehreren Datenübertragungen einen DMA-Vorgang, um Daten zwischen einem Speicherpuffer einer jeweiligen Speichervorrichtung 140 in dem Speichersystem 110 und einem Speicherpuffer des Hosts 101 zu übertragen, und/oder eine interne Datenübertragung zwischen zwei oder mehreren der Speichervorrichtungen 140 in dem Speichersystem 110 ein.
In Block 840 bestimmt die Systemsteuerung 120 im Fall einer Leseanforderung auf Basis der Adressabbildung 225 einen Satz von Blöcken, die sich in einer jeweiligen Speichervorrichtung 140 in dem Speichersystem 110, das die angeforderten Daten enthält, befinden. Bei einigen Ausführungsformen ordnet die Adressabbildung 225 eine oder mehrere globale logische Adressen, die durch die Leseanforderung (empfangen von dem Host 101) identifiziert wurden, einer oder mehreren Speichervorrichtungen 140 in dem Speicherarray 130 und optional einer oder mehreren lokalen logischen Adressen in jeder dieser Speichervorrichtungen zu. Die lokalen logischen Adressen werden durch die jeweilige Speichervorrichtung 140 unter Verwendung von Mechanismen für eine logisch-zu-physisch-Abbildung in der Speichervorrichtung auf physische Adressen in der Speichervorrichtung abgebildet. In einigen Ausführungsformen initiiert die Systemsteuerung 120 die Berechnung der Adresskarte 225. In einigen Ausführungsformen wird die Adresskarte durch eine oder mehrere Vorrichtungen außerhalb der Systemsteuerung 120 berechnet. In einigen Ausführungsformen wird die Adresskarte 225 in der jeweiligen Speichervorrichtung 140 gespeichert/befindet sich in dieser.
In Block 850 sendet die Systemsteuerung 120 einen oder mehrere Lesebefehle an die jeweilige Speichervorrichtung 140, um die Leseoperation auf dem Satz von Blöcken durchzuführen. In einigen Ausführungsformen übersetzt die Systemsteuerung 120 die von dem Host 101 empfangene Leseanforderung unter Verwendung eines vordefinierten Befehlsübersetzungsprozesses in den einen oder die mehreren Lesebefehle.
In Block 860 reagiert die Vorrichtungssteuerung 142 der jeweiligen Speichervorrichtung 140 auf den einen oder die mehreren Lesebefehle, indem sie die entsprechenden Daten aus dem Satz von Blöcken in der jeweiligen Speichervorrichtung liest.
In Block 870 empfängt die Systemsteuerung 120 eine Fertigstellungsbenachrichtigung von der jeweiligen Speichervorrichtung 140, die angibt, dass die Ausführung des an die jeweilige Speichervorrichtung gesendeten Lesebefehls abgeschlossen ist und dass die resultierenden Lesedaten in einem Speicherpuffer der Vorrichtungssteuerung 142 der jeweiligen Speichervorrichtung gespeichert werden.
In Block 880 leitet die Systemsteuerung 120 nach dem Empfangen der Fertigstellungsbenachrichtigung eine Datenübertragung unter Verwendung eines DMA-Vorgangs ein, um die Lesedaten an den Host 101, der die Leseanforderung gesendet hat, zu übertragen (z. B. zu senden). Bei einigen Ausführungsformen schließt Block 880 ein, dass die Systemsteuerung 120 einen Datenübertragungsbefehl an eine jeweilige Netzwerkschnittstellensteuerung (nicht gezeigt) in dem Speichersystem 110 sendet, um die Lesedaten aus einem Speicherpuffer der Systemsteuerung 120 an einen Speicherpuffer des Hosts 101 zu übertragen, wobei DMA oder ein entfernter direkter Speicherzugriff (Remote Direct Memory Access, RDMA) verwendet wird, um die Lesedaten zu übertragen.
Vorteile einer oder mehrerer Ausführungsformen der Verfahren zum Rekonstruieren von Daten und Wiederherstellen einer ausgefallenen Speichervorrichtung in einem Speichersystem unter Verwendung einer oder mehrerer funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung, wie oben beschrieben, schließen, ohne darauf beschränkt zu sein, eines oder mehrere von Folgenden ein:

(1) Verbesserte Systemleistung während (und kürzere erforderliche Zeit zum Abschließen) des Datenrekonstruktions- und/oder Wiederherstellungsprozesses durch die Verwendung funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung zum Rekonstruieren von Daten der ausgefallenen Speichervorrichtung. Dies basiert auf der Tatsache, dass die Vorrichtungssteuerung der ausgefallenen Speichervorrichtung nach einem Medienausfall möglicherweise inaktiv ist.
(2) Verbesserte Systemleistung während (und kürzere erforderliche Zeit zum Abschließen) des Datenrekonstruktions- und/oder Wiederherstellungsprozesses der ausgefallenen Speichervorrichtung unter Berücksichtigung des tatsächlichen Ausfallmechanismus der ausgefallenen Speichervorrichtung. Zum Beispiel erfolgt in Fällen eines teilweisen Datenverlusts in der ausgefallenen Speichervorrichtung der Datenrekonstruktionsprozess speziell für den ausgefallenen Medienabschnitt. Somit ist in diesen Fällen die Verschlechterung der Systemleistung möglicherweise nur proportional zu der tatsächlich verlorenen Datenmenge und nicht zu allen Daten der ausgefallenen Speichervorrichtung.

Verfahren und Systeme zum Rekonstruieren von Daten und Wiederherstellen einer ausgefallenen Speichervorrichtung in einem Speichersystem unter Verwendung einer oder mehrerer funktionierender Rechenressourcen und/oder Speicherressourcen der ausgefallenen Speichervorrichtung sind oben beschrieben. In der obigen Beschreibung wurden zu Erläuterungszwecken zahlreiche spezifische Details dargelegt. Es ist jedoch offensichtlich, dass die offenbarten Technologien ohne irgendeine gegebene Untermenge dieser spezifischen Details praktiziert werden können. In anderen Fällen sind Strukturen und Vorrichtungen in Blockdiagrammform gezeigt. Zum Beispiel werden die offenbarten Technologien in einigen Implementierungen oben unter Bezugnahme auf Benutzerschnittstellen und bestimmte Hardware beschrieben.
Eine Bezugnahme in der Patentschrift auf „eine einzelne Ausführungsform“ oder „eine Ausführungsform“ bedeutet, dass ein bestimmtes Merkmal, eine bestimmte Struktur oder eine bestimmte Eigenschaft, das bzw. die in Verbindung mit der Ausführungsform beschrieben wird, in mindestens einer Ausführungsform oder Implementierung der offenbarten Technologien eingeschlossen ist. Fälle des Auftretens des Ausdrucks „in einer Ausführungsform“ an verschiedenen Stellen in der Patentschrift nehmen nicht notwendigerweise alle auf dieselbe Ausführungsform oder Implementierung Bezug.
Einige Abschnitte der obigen ausführlichen Beschreibungen können in Form von Prozessen und symbolischen Darstellungen von Operationen mit Datenbits innerhalb eines Computerspeichers dargestellt werden. Ein Prozess kann im Allgemeinen als eine eigenständige Abfolge von Operationen, die zu einem Ergebnis führen, betrachtet werden. Die Operationen können physische Manipulationen physikalischer Größen einschließen. Diese Größen nehmen die Form von elektrischen oder magnetischen Signalen an, die gespeichert, übertragen, kombiniert, verglichen und anderweitig manipuliert werden können. Diese Signale können als in der Form von Bits, Werten, Elementen, Symbolen, Zeichen, Begriffen, Zahlen oder dergleichen befindlich bezeichnet werden.
Diese und ähnliche Ausdrücke können mit den geeigneten physikalischen Größen assoziiert werden und können als Markierungen betrachtet werden, die auf diese Größen angewendet werden. Sofern aus der vorherigen Erörterung nicht ausdrücklich etwas anderes hervorgeht, versteht es sich, dass sich in der gesamten Beschreibung Erörterungen, die Begriffe wie „Verarbeiten“ oder „Errechnen“ oder „Berechnen“ oder „Bestimmen“ oder „Anzeigen“ oder dergleichen verwenden, auf die Aktion und die Prozesse eines Computersystems oder einer ähnlichen elektronischen Datenverarbeitungsvorrichtung beziehen können, die Daten, die als physikalische (elektronische) Größen innerhalb der Register und Speicher des Computersystems dargestellt werden, manipuliert und in andere Daten umwandelt, die gleichermaßen als physikalische Größen innerhalb der Computersystemspeicher oder -register oder anderer derartiger Informationsspeicher-, Übertragungs- oder Anzeigevorrichtungen dargestellt werden.
Die offenbarten Technologien können sich auch auf ein Gerät zum Durchführen der Operationen hierin beziehen. Dieses Gerät kann speziell für die erforderlichen Zwecke konstruiert sein, oder es kann einen Universalcomputer einschließen, der selektiv durch ein Computerprogramm aktiviert oder umkonfiguriert wird, das in dem Computer gespeichert ist. Ein solches Computerprogramm kann in einem computerlesbaren Speichermedium gespeichert sein, zum Beispiel, ohne darauf beschränkt zu sein, einem beliebigen Typ von Festplatte, einschließlich Disketten, optischer Platten, CD-ROMs und Magnetplatten, Festwertspeicher (Read-Only Memories, ROMs), Speicher mit wahlfreiem Zugriff (Random Access Memories, RAMs), löschbarer programmierbarer Festwertspeicher (Erasable Programmable Read-Only Memory, EPROM), elektrisch löschbarer programmierbarer Festwertspeicher (Electrically Erasable Programmable Read-Only Memories, EEPROMs), magnetischer oder optischer Karten, Flash-Speichern, einschließlich USB-Sticks mit nicht-flüchtigem Speicher, oder eines beliebigen Typs von Medien, die zum Speichern elektronischer Anweisungen geeignet sind, jeweils gekoppelt an einen Computersystembus.
Die offenbarten Technologien können die Form einer vollständigen Hardware-Implementierung, einer vollständigen Software-Implementierung oder einer Implementierung annehmen, die sowohl Hardware- als auch Software-Elemente enthält. In einigen Implementierungen ist die Technologie in Software implementiert, die Firmware, residente Software, Mikrocode usw. einschließt, aber nicht darauf beschränkt ist.
Darüber hinaus können die offenbarten Technologien in Form eines Computerprogrammprodukts vorliegen, das von einem nicht vorübergehenden computerverwendbaren oder computerlesbaren Medium aus zugänglich ist und Programmcode zur Verwendung durch oder in Verbindung mit einem Computer oder einem beliebigen Anweisungsausführungssystem bereitstellt. Für die Zwecke dieser Beschreibung kann ein computerverwendbares oder computerlesbares Medium jedes Gerät sein, welches das Programm zur Verwendung durch oder in Verbindung mit dem Anweisungsausführungssystem, des Gerätes oder der Vorrichtung enthalten, speichern, kommunizieren, verbreiten oder transportieren kann.
Ein Computersystem oder Datenverarbeitungssystem, das zum Speichern und/oder Ausführen des Programmcodes geeignet ist, schließt mindestens einen Prozessor ein (z. B. einen Hardwareprozessor), der über einen Systembus direkt oder indirekt mit Speicherelementen gekoppelt ist. Die Speicherelemente können einen lokalen Speicher einschließen, der während der tatsächlichen Ausführung des Programmcodes verwendet wird, einen Massenspeicher und Cache-Speicher, die eine vorübergehende Speicherung mindestens eines Programmcodes bereitstellen, um die Häufigkeit zu reduzieren, mit der der Code während der Ausführung aus dem Massenspeicher abgerufen werden muss.
Ein-/Ausgabe- oder E/A-Vorrichtungen (einschließlich, aber nicht beschränkt auf Tastaturen, Anzeigen, Zeigevorrichtungen usw.) können entweder direkt oder über zwischengeschaltete E/A-Steuereinheiten mit dem System gekoppelt werden.
Netzwerkadapter können auch mit dem System gekoppelt sein, um zu ermöglichen, dass das Datenverarbeitungssystem mit anderen Datenverarbeitungssystemen oder entfernten Druckern oder Speichervorrichtungen über dazwischen liegende private oder öffentliche Netzwerke gekoppelt wird. Modems, Kabelmodems und Ethernet-Karten sind nur einige der gegenwärtig verfügbaren Arten von Netzwerkadaptern.
Die Begriffe Speichermedien, Speichervorrichtung und Datenblöcke werden in der vorliegenden Offenbarung austauschbar verwendet, um auf die physischen Medien Bezug zu nehmen, auf denen die Daten gespeichert sind.
Schließlich brauchen die hierin dargestellten Prozesse und Anzeigen nicht von Natur aus auf einen bestimmten Computer oder ein anderes Gerät bezogen sein. Verschiedene Universalsysteme können mit Programmen gemäß den Lehren hierin verwendet werden, oder es kann sich als zweckmäßig erweisen, Spezialgeräte zu konstruieren, um die erforderlichen Verfahrensoperationen durchzuführen. Die für eine Vielzahl dieser Systeme erforderliche Struktur wird aus der obigen Beschreibung ersichtlich. Außerdem wurden die offenbarten Technologien nicht mit Bezug auf irgendeine bestimmte Programmiersprache beschrieben. Es versteht sich, dass eine Vielzahl von Programmiersprachen verwendet werden kann, um die Lehren der hierin beschriebenen Technologien zu implementieren.
Die vorstehende Beschreibung der Implementierungen der vorliegenden Techniken und Technologien wurde zu Zwecken der Veranschaulichung und Beschreibung vorgelegt. Es ist nicht beabsichtigt, umfassend zu sein oder die vorliegenden Techniken und Technologien auf die genau offenbarte Form zu beschränken. Viele Modifikationen und Variationen sind unter Berücksichtigung der vorstehend genannten Lehre möglich. Es ist beabsichtigt, dass der Schutzumfang der vorliegenden Techniken und Technologien nicht durch diese ausführliche Beschreibung beschränkt wird. Die vorliegenden Techniken und Technologien können in anderen spezifischen Formen implementiert werden, ohne von ihrem Wesen oder ihren wesentlichen Eigenschaften abzuweichen. Gleichermaßen sind die spezielle Benennung und Aufteilung der Module, Routinen, Merkmale, Attribute, Methodologien und anderer Gesichtspunkte nicht zwingend oder signifikant, und die Mechanismen, die die vorliegenden Techniken und Technologien oder ihre Merkmale implementieren, können unterschiedliche Namen, Unterteilungen und/oder Formate aufweisen. Darüber hinaus können die Module, Routinen, Merkmale, Attribute, Methodologien und andere Gesichtspunkte der vorliegenden Technologie als Software, Hardware, Firmware oder irgendeine Kombination der drei implementiert werden. Ebenso kann die Komponente überall dort, wo eine Komponente, beispielsweise ein Modul, als Software implementiert ist, als eigenständiges Programm, als Teil eines größeren Programms, als eine Vielzahl separater Programme, als eine statisch oder dynamisch verknüpfte Bibliothek, als ein kernladbares Modul, als ein Vorrichtungstreiber und/oder zukünftig in der Computerprogrammierung implementiert sein. Zusätzlich sind die vorliegenden Techniken und Technologien in keiner Weise auf die Implementierung in irgendeiner spezifischen Programmiersprache oder für irgendein spezielles Betriebssystem oder eine bestimmte Umgebung beschränkt. Dementsprechend soll die Offenbarung der vorliegenden Techniken und Technologien veranschaulichend, aber nicht einschränkend sein.

Claims

Computerimplementiertes Verfahren, umfassend: als Reaktion auf ein Erkennen einer ausgefallenen Speichervorrichtung in einem Speichersystem, Lokalisieren von Daten und Redundanzinformationen in einer oder mehreren funktionierenden Speichervorrichtungen in dem Speichersystem zum Rekonstruieren von Daten der ausgefallenen Speichervorrichtung; Ausgeben eines oder mehrerer Peer-to-Peer-Befehle an die eine oder die mehreren funktionierenden Speichervorrichtungen, um die Daten und die Redundanzinformationen von der einen oder den mehreren funktionierenden Speichervorrichtungen zu erhalten; und Rekonstruieren der Daten der ausgefallenen Speichervorrichtung auf Basis der Daten und der Redundanzinformationen, die von dem einen oder den mehreren funktionierenden Speichervorrichtungen erhalten wurden, wobei eine funktionierende Rechenressource der ausgefallenen Rechenvorrichtung mindestens teilweise eines oder mehrere von Lokalisieren, Ausgeben und Rekonstruieren durchführt.
Computerimplementiertes Verfahren gemäß Anspruch 1, ferner umfassend: Schreiben der rekonstruierten Daten der ausgefallenen Speichervorrichtung an einen oder mehrere verfügbare Orte in dem Speichersystem.
Computerimplementiertes Verfahren gemäß Anspruch 1, wobei die funktionierende Rechenressource der ausgefallenen Speichervorrichtung eine Vorrichtungssteuerung ist.
Computerimplementiertes Verfahren gemäß Anspruch 1, wobei der eine oder die mehreren Peer-to-Peer-Befehle einen Lesebefehl einschließen, der von der ausgefallenen Speichervorrichtung ausgegeben und ausgeführt wird.
Computerimplementiertes Verfahren gemäß Anspruch 1, ferner umfassend: Definieren eines Streifens in dem Speichersystem, wobei der Streifen den Daten der ausgefallenen Speichervorrichtung und den Daten und den Redundanzinformationen in dem einen oder den mehreren funktionierenden Speichervorrichtungen zugeordnet ist.
Computerimplementiertes Verfahren gemäß Anspruch 1, ferner umfassend: Identifizieren eines Medienabschnitts der ausgefallenen Speichervorrichtung, der wiederherstellbare Daten enthält; und Kopieren der wiederherstellbaren Daten von einem ersten Ort in dem Medienabschnitt der ausgefallenen Speichervorrichtung an einen zweiten Ort in dem Medienabschnitt der ausgefallenen Speichervorrichtung.
Computerimplementiertes Verfahren gemäß Anspruch 6, wobei der Medienabschnitt der ausgefallenen Speichervorrichtung eine Speicherzelle ist.
Gerät, umfassend: einen oder mehrere Prozessoren; und Logik, die durch den einen oder die mehreren Prozessoren ausführbar ist, die eingerichtet sind, um Vorgänge durchzuführen, aufweisend: als Reaktion auf ein Erkennen einer ausgefallenen Speichervorrichtung in einem Speichersystem, Lokalisieren von Daten und Redundanzinformationen in einer oder mehreren funktionierenden Speichervorrichtungen in dem Speichersystem zum Rekonstruieren von Daten der ausgefallenen Speichervorrichtung; Ausgeben eines oder mehrerer Peer-to-Peer-Befehle an die eine oder die mehreren funktionierenden Speichervorrichtungen, um die Daten und die Redundanzinformationen von der einen oder den mehreren funktionierenden Speichervorrichtungen zu erhalten; und Rekonstruieren der Daten der ausgefallenen Speichervorrichtung auf Basis der Daten und der Redundanzinformationen, die von dem einen oder den mehreren funktionierenden Speichervorrichtungen erhalten wurden, wobei eine funktionierende Rechenressource der ausgefallenen Rechenvorrichtung mindestens teilweise eines oder mehrere von Lokalisieren, Ausgeben und Rekonstruieren durchführt.
Gerät gemäß Anspruch 8, wobei die Logik dafür eingerichtet ist, Operationen durchzuführen, ferner umfassend: Schreiben der rekonstruierten Daten der ausgefallenen Speichervorrichtung an einen oder mehrere verfügbare Orte in dem Speichersystem.
Gerät gemäß Anspruch 8, wobei die funktionierende Rechenressource der ausgefallenen Speichervorrichtung eine Vorrichtungssteuerung ist.
Gerät gemäß Anspruch 8, wobei der eine oder die mehreren Peer-to-Peer-Befehle einen Lesebefehl einschließen, der von der ausgefallenen Speichervorrichtung ausgegeben und ausgeführt wird.
Gerät gemäß Anspruch 8, wobei die Logik dafür eingerichtet ist, Operationen durchzuführen, ferner umfassend: Definieren eines Streifens in dem Speichersystem, wobei der Streifen den Daten der ausgefallenen Speichervorrichtung und den Daten und den Redundanzinformationen in dem einen oder den mehreren funktionierenden Speichervorrichtungen zugeordnet ist.
Gerät gemäß Anspruch 8, wobei die Logik dafür eingerichtet ist, Operationen durchzuführen, ferner umfassend: Identifizieren eines Medienabschnitts der ausgefallenen Speichervorrichtung, der wiederherstellbare Daten enthält; und Kopieren der wiederherstellbaren Daten von einem ersten Ort in dem Medienabschnitt der ausgefallenen Speichervorrichtung an einen zweiten Ort in dem Medienabschnitt der ausgefallenen Speichervorrichtung.
Gerät gemäß Anspruch 13, wobei der Medienabschnitt der ausgefallenen Speichervorrichtung eine Speicherzelle ist.
Gerät, umfassend: eine Steuerung mit einem oder mehreren Prozessoren; und ein Speicherarray, das mit der Steuerung gekoppelt ist, wobei das Speicherarray eine Vielzahl von Speichervorrichtungen umfasst, wobei die Steuerung und das Speicherarray dafür eingerichtet sind, um Operationen durchzuführen, die umfassen: Erkennen, durch die Steuereinheit, einer ausgefallenen Speichervorrichtung in dem Speicherarray; Lokalisieren, durch die ausgefallene Speichervorrichtung, von Daten und Redundanzinformationen in einer oder mehreren funktionierenden Speichervorrichtungen in dem Speicherarray zum Rekonstruieren von Daten der ausgefallenen Speichervorrichtung; Ausgeben, durch die ausgefallene Speichervorrichtung, eines oder mehrerer Peer-to-Peer-Befehle an das eine oder die mehreren funktionierenden Speichervorrichtungen, um die Daten und die Redundanzinformationen von dem einen oder den mehreren funktionierenden Speichervorrichtungen zu erhalten; Rekonstruieren, durch die ausgefallene Speichervorrichtung, der Daten der ausgefallenen Speichervorrichtung auf Basis der Daten und der Redundanzinformationen, die von dem einen oder den mehreren funktionierenden Speichervorrichtungen erhalten wurden; und Schreiben, durch die Steuerung, der rekonstruierten Daten der ausgefallenen Speichervorrichtung an einen oder mehrere verfügbare Orte in dem Speicherarray.
Gerät gemäß Anspruch 15, wobei eine Vorrichtungssteuerung der ausgefallenen Steuervorrichtung mindestens teilweise eines oder mehrere von Lokalisieren, Ausgeben und Rekonstruieren durchführt.
Gerät gemäß Anspruch 15, wobei der eine oder die mehreren Peer-to-Peer-Befehle einen Lesebefehl einschließen, der von der ausgefallenen Speichervorrichtung ausgegeben und ausgeführt wird.
Gerät gemäß Anspruch 15, wobei die Steuerung und das Speicherarray dafür eingerichtet sind, Operationen durchzuführen, die ferner umfassen: Definieren eines Streifens in dem Speicherarray, wobei der Streifen den Daten der ausgefallenen Speichervorrichtung und den Daten und den Redundanzinformationen in dem einen oder den mehreren funktionierenden Speichervorrichtungen zugeordnet ist.
Gerät gemäß Anspruch 15, wobei die Steuerung und das Speicherarray dafür eingerichtet sind, Operationen durchzuführen, die ferner umfassen: Identifizieren eines Medienabschnitts der ausgefallenen Speichervorrichtung, der wiederherstellbare Daten enthält; und Kopieren der wiederherstellbaren Daten von einem ersten Ort in dem Medienabschnitt der ausgefallenen Speichervorrichtung an einen zweiten Ort in dem Medienabschnitt der ausgefallenen Speichervorrichtung.
Gerät gemäß Anspruch 19, wobei der Medienabschnitt der ausgefallenen Speichervorrichtung eine Speicherzelle ist.