DE102012108103B4 - Arbeitsverfahren für ein Massenspeichersystem, Massenspeichersystem und Computerprogrammprodukt - Google Patents

Arbeitsverfahren für ein Massenspeichersystem, Massenspeichersystem und Computerprogrammprodukt Download PDF

Info

Publication number
DE102012108103B4
DE102012108103B4 DE102012108103.4A DE102012108103A DE102012108103B4 DE 102012108103 B4 DE102012108103 B4 DE 102012108103B4 DE 102012108103 A DE102012108103 A DE 102012108103A DE 102012108103 B4 DE102012108103 B4 DE 102012108103B4
Authority
DE
Germany
Prior art keywords
mass storage
mass
physical
files
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE102012108103.4A
Other languages
English (en)
Other versions
DE102012108103A1 (de
Inventor
Dieter Kasper
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Technology Solutions Intellectual Property GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Technology Solutions Intellectual Property GmbH filed Critical Fujitsu Technology Solutions Intellectual Property GmbH
Priority to DE102012108103.4A priority Critical patent/DE102012108103B4/de
Priority to PCT/EP2013/066399 priority patent/WO2014032910A1/de
Priority to US14/424,227 priority patent/US10055157B2/en
Publication of DE102012108103A1 publication Critical patent/DE102012108103A1/de
Application granted granted Critical
Publication of DE102012108103B4 publication Critical patent/DE102012108103B4/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0625Power saving in storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0605Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • G06F3/0649Lifecycle management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0685Hybrid storage combining heterogeneous device types, e.g. hierarchical storage, hybrid arrays
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

Die Erfindung betrifft ein Arbeitsverfahren für ein Massenspeichersystem (100, 600), insbesondere ein RAID-System (500). Das System umfasst den Schritt des Bereitstellens eines virtuellen Dateisystems (610) für wenigstens einen Benutzer des Massenspeichersystems (100, 600) sowie des Bestimmens einer Zugriffswahrscheinlichkeit für in dem virtuellen Dateisystem (610) logisch gespeicherte Daten (620, 630). Dateien (620), deren Zugriffswahrscheinlichkeit über einem vorbestimmten Grenzwert (TREF) liegt, werden verteilt in einer Mehrzahl von voneinander unabhängigen ersten physikalischen Massenspeichern (642, 644, 646) mit voneinander unabhängigen Schreib-/Leseeinheiten gespeichert. Dateien (630), deren Zugriffswahrscheinlichkeit unter dem vorbestimmten Grenzwert (TREF) liegt, werden gemeinsam in wenigstens einem zusammenhängenden Speicherbereich wenigstens eines zweiten physikalischen Massenspeichers (660) gespeichert. Die Erfindung betrifft darüber hinaus auch ein zur Durchführung des Verfahrens eingerichtetes Massenspeichersystem (100, 600) sowie ein zur Ausführung des Verfahrens geeignetes Computerprogrammprodukt.

Description

  • Die Erfindung betrifft ein Arbeitsverfahren für ein Massenspeichersystem, insbesondere ein RAID-System, das wenigstens ein virtuelles Dateisystem für wenigstens einen Benutzer des Massenspeichersystems bereitstellt. Die Erfindung betrifft des Weiteren ein zur Umsetzung des Verfahrens geeignetes Massenspeichersystem sowie ein Computerprogrammprodukt mit Programmanweisungen zum Ausführen auf einer Datenverarbeitungseinheit eines elektronischen Datenverarbeitungssystems.
  • Massenspeichersysteme, insbesondere RAID-Systeme, und zu ihrem Betrieb geeignete Arbeitsverfahren sind aus dem Stand der Technik bekannt. Insbesondere ist aus dem Artikel ”A Case For Redundant Arrays of Inexpensive Disks (RAID)” von David A. Patterson, Garth Gibson und Randy H. Cats, veröffentlicht in der International Conference an Management of Data, 1988, Chicago, der inzwischen allgemein als RAID-System bekannte Ansatz bekannt, Daten verteilt über mehrere Festplatten, die physikalisch unabhängig voneinander sind, zu speichern. Dabei nimmt ein Benutzer des Massenspeichersystems die physikalische Aufteilung der einzelnen eingesetzten Massenspeicher nicht mehr wahr, sondern speichert seine Daten in einem logischen oder virtuellen Dateisystem, dessen zugehörige Daten physisch auf einem oder einer Mehrzahl von Massenspeichern abgelegt sind.
  • Die Verwendung von RAID-Systemen bietet im Allgemeinen eine Anzahl von Vorteilen. Insbesondere können umfangreiche Daten über mehrere physikalische Festplattenlaufwerke verteilt werden. Dies besitzt unter anderem den Vorteil, dass Schreib-/Lese-Zugriffe beschleunigt werden können, da die Datentransferrate mehrerer physikalischer Massenspeichergeräte zur Verfügung steht. Des Weiteren kann auch eine Redundanz der Daten und somit eine Sicherheit gegenüber dem Ausfall eines einzigen Festplattenlaufwerks erreicht werden, indem Daten gleichzeitig auf mehreren physikalischen Massenspeichern abgelegt werden. Die genannten Vorteile lassen sich in unterschiedlichen Betriebsarten, die allgemein als RAID-Level bekannt sind, zumindest teilweise auch miteinander kombinieren.
  • Ein Nachteil, der mit dem oben genannten RAID-Ansatz einhergeht, liegt darin, dass durch die Vorsehung einer Vielzahl von voneinander unabhängig betriebenen Massenspeichern ein erhöhter Energiebedarf entsteht. Bereits bei der Vorsehung von nur wenigen Festplattenlaufwerken, beispielsweise vier Festplattenlaufwerken mit je 250 GB Kapazität, gegenüber der Vorsehung eines einzigen Festplattenlaufwerks mit beispielsweise 1 TB Kapazität entsteht durch die zusätzlich erforderliche Steuerelektronik und den Antrieb der jeweils vorhandenen Plattenstapel ein nicht unerheblicher Mehrbedarf an elektrischer Energie. Dieser zusätzliche Energiebedarf erhöht sich weiter, wenn, wie oben beschrieben, redundante Datenhaltung gewünscht ist und somit weitere, zusätzliche Festplattenlaufwerke eingesetzt werden. Insbesondere im gewerblichen Umfeld, in dem heutzutage sehr große Datenmengen in zentralen Rechenzentren vorgehalten werden, erhöht sich das Problem noch weiter. Denn bei einem Einsatz von einigen hundert oder gegebenenfalls sogar etlichen tausend Festplattenlaufwerken fällt zusätzlich zu deren Betriebsenergie ein weiterer Aufwand zu deren Kühlung im Betrieb an.
  • Aus dem Stand der Technik sind Maßnahmen bekannt, die Energieaufnahme einzelner Plattenlaufwerke zu reduzieren. Beispielsweise ist es bekannt, durch ein Betriebssystem oder einen internen Festplatten-Controller den Antrieb für einen Stapel mit rotierenden Speichermedien vorübergehend zu deaktivieren, wenn aktuell keine Zugriffe auf ein Laufwerk erfolgen. Die an sich bekannte Abschaltung birgt jedoch eine Reihe von Nachteilen. Zum einen muss bei einem erneuten Zugriff auf einen derartig deaktivierten Massenspeicher der Plattenstapel zunächst wieder beschleunigt werden, bevor der gewünschte Zugriff ausgeführt werden kann, was zu längeren Zugriffszeiten führt. Zum anderen führt das wiederholte Abschalten und erneute Beschleunigen der Plattenstapel zu einem erhöhten mechanischen Verschleiß und somit einer geringeren Lebensdauer des Massenspeichers. Somit werden derartige Energiesparoptionen zumindest in Rechenzentren, bei denen eine Vielzahl von Dateien für eine Vielzahl von Nutzern in umfangreichen Massenspeichersystemen vorgehalten werden, in der Regel nicht oder nur selten verwendet.
  • Aus der US 2004/0111558 A1 ist ein Speichersystem mit einer Mehrzahl von Festplatten bekannt, das eine verringerte Leistungsaufnahme aufweist. Ein Festplattencontroller ist mit einer Menge von Festplatten eines Datenspeichersystems verbunden und dazu eingerichtet, eine erste Klasse von Daten auf mehreren Festplatten zu spiegeln, während eine zweite Klasse von Daten ohne Spiegelung gespeichert werden. Der Controller hält wenigstens eine der Festplatten, die die erste Klasse von Daten umfassen, in einem Betriebszustand, während wenigstens eine der übrigen Festplatten in einem Zustand mit verringerter Leistungsaufnahme gehalten wird. Dabei umfasst die erste Klasse von Daten beispielsweise besonders populäre Dateien, während die zweite Klasse von Daten unpopuläre Dateien umfasst. Wegen der Abschaltung der Platten steht beim Lesen oder Schreiben von Daten stets nur die Leistung einer Festplatte zur Verfügung.
  • Eine Aufgabe der vorliegenden Erfindung liegt darin, ein Massenspeichersystem zu beschreiben, das bei im Wesentlichen gleicher Leistung eine gegenüber bekannten Massenspeichersystemen reduzierte Energieaufnahme aufweist oder das bei gleichem Energiebedarf eine höhere Leistung zur Verfügung stellen kann. Bevorzugt soll sich das Massenspeichersystem aus Sicht seiner Benutzer wie ein konventionelles Massenspeichersystem verhalten.
  • Die genannte Aufgabe wird durch ein Massenspeichersystem gemäß Anspruch 1 gelöst.
  • Bevorzugt umfasst der wenigstens eine zweite physikalische Massenspeicher eine Antriebseinheit und wenigstens ein durch die Antriebseinheit rotatorisch antreibbares Speichermedium, wobei die Steuereinheit oder der wenigstens eine zweite physikalische Massenspeicher dazu eingerichtet ist, die Antriebseinheit abzuschalten, wenn über einen vorbestimmten Zeitraum kein Zugriff auf den wenigstens einen zweiten physikalischen Massenspeicher erfolgt. Durch das Abschalten der in konventionellen Festplatten enthaltenen Spindeln mit rotierenden Speichermedien kann deren Betriebsenergie in einem Bereitschaftszustand erheblich reduziert werden.
  • Gemäß vorteilhaften Ausgestaltungen werden die in dem Massenspeichersystem gespeicherten Daten redundant gespeichert, um eine Absicherung gegenüber dem Ausfall einzelner Massenspeicher zu schaffen. Zur redundanten Speicherung der Dateien mit niedriger Zugriffswahrscheinlichkeit umfasst das Massenspeichersystem wenigstens zwei zweite physikalische Massenspeicher, wobei auf einem ersten der wenigstens zwei zweiten physikalischen Massenspeicher gespeichert Daten auf wenigstens einem zweiten der wenigstens zwei zweiten physikalischen Massenspeicher redundant gespeichert werden. Dies entspricht im Wesentlichen der bekannten RAID-Betriebsart 1 und weist den zusätzlichen Vorteil auf, dass beim Lesen von Daten nur eines der wenigstens zwei zweiten Massenspeicher in einen normalen Betriebszustand versetzt werden muss. Zur redundanten Speicherung der Dateien mit hoher Zugriffswahrscheinlichkeit werden auf einem ersten der Mehrzahl von ersten physikalischen Massenspeichern gespeicherte Dateien oder Segmente von Dateien auf wenigstens einem zweiten der Mehrzahl von ersten Massenspeichern redundant gespeichert. Dies entspricht im Wesentlichen den bekannten RAID-Betriebsarten 1, 3, 4, 5 oder 6 oder RAID-Kombinationen hiervon, wie beispielsweise ein RAID-15-Verbund, und kombiniert die Vorteile hoher Zugriffsbandbreite mit denen einer hohen Datensicherheit.
  • Gemäß der beanspruchten Ausgestaltung ist bei dem Massenspeichersystem die Mehrzahl von ersten physikalischen Massenspeichern über eine erste, lokale Verbindungsstruktur mit einer ersten Bandbreite mit der wenigstens einen Schnittstellenvorrichtung verbunden und der wenigstens eine zweite physikalische Massenspeicher über eine zweite Verbindungsstruktur mit einer gegenüber der ersten Bandbreite geringeren zweiten Bandbreite mit der wenigstens einen Schnittstellenvorrichtung verbunden. Durch den Einsatz unterschiedlicher Verbindungsstrukturen für die ersten physikalischen Massenspeicher einerseits und den wenigstens einen zweiten physikalischen Massenspeicher andererseits kann auch auf Ebene der Verbindungsstrukturen eine leistungsgerechte Entkopplung zwischen Dateien mit einer hohen Zugriffswahrscheinlichkeit und Dateien mit einer niedrigen Zugriffswahrscheinlichkeit vorgenommen werden. Beispielsweise können die Dateien der ersten Gruppe bevorzugt gemäß dem Fibre Channel Protokoll oder einem Remote Direct Memory Acess (RDMA) Protokoll, insbesondere einem RDMA over Infiniband Protokoll, wie zum Beispiel dem SCSI RDMA Protokoll (SRP), dem Socket Direct Protokoll (SDP) oder dem nativen RDMA Protokoll, oder einem RDMA over Ethernet Protokoll, wie zum Beispiel dem RDMA over Converged Ethernet (RoCE) oder dem Internet Wide Area RDMA (iWARP) Protokoll, zum Zugriff auf lokale Massenspeicher mit einer besonders hohen Datenübertragungsrate gelesen und geschrieben werden, während Daten der zweiten Gruppe mit einem anderen, leistungsschwächeren Protokoll, beispielsweise einem TCP/IP-basierten Protokoll für den Zugriff auf entfernte Speichermedien, gelesen oder geschrieben werden können.
  • In einer bevorzugten Ausgestaltung wird die Mehrzahl von ersten physikalischen Massenspeichern von der Steuervorrichtung über ein gemeinsames, verteiltes erstes Dateisystem verwaltet und der wenigstens eine zweite physikalische Massenspeicher wird über ein für den Massenspeicher spezifisches zweites Dateisystem verwaltet. Die Vorsehung unterschiedlicher Dateisysteme ermöglicht eine einfache Implementierung und leistungsgerechte Verwaltung der unterschiedlichen Massenspeicher.
  • Gemäß einer weiteren vorteilhaften Ausgestaltung werden einzelne Untergruppen von Dateien des virtuellen Dateisystems unterschiedlichen physikalischen Massenspeichern zugeordnet, wobei die Zugriffsgeschwindigkeit der jeweils verwendeten Massenspeicher der Zugriffswahrscheinlichkeit der entsprechenden Gruppe angepasst ist. Beispielsweise ist es möglich, Dateien, auf die besonders häufig zugegriffen wird, auf besonders leistungsfähigen Halbleiter-Massenspeichern, insbesondere so genannte SSD-Laufwerken, abzulegen, während Dateien mit einer mittleren Zugriffswahrscheinlichkeit auf Massenspeicher mit rotierenden Speichermedien, wie insbesondere SCSI- und SATA-Festplattenlaufwerken abgelegt sind. Daten mit besonders niedriger Zugriffswahrscheinlichkeit können auf physikalisch extern angeordneten Massenspeichermedien, insbesondere so genannten Network Attached Storage (NAS) oder Direct Attached Storage (DAS) Speicherlaufwerken abgelegt werden.
  • Weitere vorteilhafte Ausgestaltungen der Erfindung sind in den abhängigen Ansprüchen sowie der nachfolgenden ausführlichen Beschreibung von Ausführungsbeispielen dargestellt.
  • Die Erfindung wird nachfolgend anhand von Ausführungsbeispielen unter Bezugnahme auf die angehängten Figuren im Detail beschrieben. In den Figuren zeigen:
  • 1 eine schematische Darstellung eines Massenspeichersystem gemäß einer Ausgestaltung der Erfindung,
  • 2 ein Ablaufdiagramm eines ersten Arbeitsverfahrens zum Betrieb eines Massenspeichersystems,
  • 3 ein Ablaufdiagramm eines zweiten Arbeitsverfahrens zum Betrieb eines Massenspeichersystems,
  • 4 ein Ablaufdiagramm eines Bestimmungsverfahrens für und eine schematische Darstellung von unterschiedlicher Zugriffswahrscheinlichkeiten,
  • 5 eine schematische Darstellung eines RAID-Systems gemäß einer Ausgestaltung der Erfindung und
  • 6 eine schematische Darstellung von Dateisystemen eines erfindungsgemäßen Massenspeichersystems.
  • 1 zeigt ein Massenspeichersystem 100 gemäß einer ersten Ausgestaltung der Erfindung. Das Massenspeichersystem 100 umfasst eine Netzwerkschnittstelle 110, eine Steuervorrichtung 120 und einen internen Speicher zum Ablegen von Steuerdaten, insbesondere von Metadaten über in dem Massenspeichersystem 100 gespeicherte Daten in Form einer Datenbank 130. Darüber hinaus umfasst das Massenspeichersystem 100 zwei erste physikalische Massenspeicher 142 und 144 sowie einen zweiten physikalischen Massenspeicher 150. Die ersten physikalischen Massenspeicher 142 und 144 bilden zusammen einen primären Speicherverbund 140 und sind über eine lokale primäre Verbindungsstruktur 160, insbesondere eine besonders leistungsfähige Fibre-Channel- oder RDMA-Verbindung, mit der Steuervorrichtung 120 verbunden. Der zweite physikalische Massenspeicher 150 ist über eine sekundäre Verbindungsstruktur 170, insbesondere eine verhältnismäßig preisgünstige Internet-Protokoll-Verbindung, z. B. eine TCP/IP-Verbindung über 1 GBit/s Ethernet, mit der Steuervorrichtung 120 verbunden. Des Weiteren ist die Steuervorrichtung 120 funktionsfähig mit der Netzwerkschnittstelle 110 verbunden, die das Massenspeichersystem 100 über ein Netzwerk 180 mit einem Client Computer 190 verbindet.
  • Im Betrieb greift der Client Computer 190 mittels eines geeigneten Netzwerkprotokolls über das Netzwerk 180 und die Netzwerkschnittstelle 110 auf die Daten des Massenspeichersystems 100 zu. Hierzu werden Schreib- und Leseanforderungen der Client Computer 190 durch die Steuervorrichtung 120 analysiert und entsprechend den angeforderten Daten an die Massenspeicher 142, 144 und/oder 150 weitergeleitet. Für die Ermittlung, welche Daten auf welchen der Massenspeicher 142, 144, 150 angeordnet sind, dienen neben eventueller Datei-Informationen der jeweiligen eingesetzten Dateisysteme der Massenspeicher 142, 144 und 150 im Ausführungsbeispiel zusätzlich oder alternativ die in der Datenbank 130 enthaltenen Metadaten. Dabei kann die Datenbank 130 selbst auf den Massenspeichern 142 und/oder 144 des primären Speicherverbunds 140 oder einem sonstigen internen Massenspeicher oder dem Hauptspeicher des Massenspeichersystems 100 gespeichert sein.
  • Aus Gründen einer einfacheren Darstellung wird im Folgenden stets von auf den Massenspeichern 142, 144 und 150 gespeicherten ”Dateien” gesprochen. Dabei kann es sich beispielsweise um in einem hierarchischen Dateisystem angeordnete und über einen vollständigen Pfad und Dateinamen identifizierbare Dateien handeln. An dieser Stelle wird jedoch darauf hingewiesen, dass sich das nachfolgend beschriebene System auch für andere Massenspeichersysteme eignet, die anstelle von Dateien andere Arten von Objekten und anstelle von Pfaden und Dateinamen andere Kennungen verwenden. Unter dem Begriff ”Datei” ist daher jede inhaltlich zusammengehörige Dateneinheit zu verstehen, die mittels einer geeigneten Kennung aus einem Massenspeichersystem abrufbar ist. Beispiele solcher Dateneinheiten sind auch Objekte eines Objektspeichersystems oder vordefinierter Bereiche eines Massenspeichersystems. Unter dem Begriff ”Dateisystem” ist entsprechend jede geeignete Zugriffsstruktur für derartige Dateneinheiten zu verstehen, also auch Tabellen oder andere Mechanismen zum Zuordnen einer Kennung zu einer Dateneinheit.
  • Im beschriebenen Ausführungsbeispiel werden sämtliche von dem Client Computer 190 empfangenen Schreibanforderungen über die Fibre-Channel- oder RDMA-Verbindung 150 auf die physikalischen Massenspeicher 142 und 144 verteilt. Dabei kann die Verteilung beispielsweise derart erfolgen, dass Schreibanforderungen abwechselnd an den physikalischen Massenspeicher 142 und an den physikalischen Massenspeicher 144 weitergeleitet werden, sodass eine erste Schreibanforderung für den physikalische Massenspeicher 142 eine nachfolgende Schreibanforderung für den weiteren physikalischen Massenspeicher 144 nicht blockiert.
  • Alternativ ist es jedoch auch möglich, die Bearbeitung einer einzigen Anfrage über die beiden physikalischen Massenspeicher 142 und 144 des primären Speicherverbunds zu verteilen. Dies bietet sich insbesondere beim Speichern von besonders umfangreichen Dateien an. Bei diesem so genannten ”Data Slicing” werden in der Regel gleich große Blöcke von Daten einer umfangreichen Datei über physikalische Speichersektoren von mehreren Massenspeichern, in diesem Fall den physikalischen Massenspeichern 142 und 144, verteilt, sodass auch der Datendurchsatz beim Bearbeiten einer einzelnen Schreibanforderung erhöht wird.
  • Selbstverständlich können dieselben Daten oder die Daten und zugehörige Redundanzinformationen wie etwa Paritätswerte, auch auf mehreren physikalischen Massenspeichern 142 und 144 oder redundant an unterschiedlichen Stellen der physikalischen Massenspeicher 142 oder 144 des primären Speicherverbunds 140 gespeichert werden, um die gespeicherten Daten gegen den Ausfall eines gesamten Massenspeichers 142 oder 144 oder einzelner Sektoren des Massenspeichers 142 oder 144 zu schützen. Derartige Verfahren zur redundanten Datenspeicherung sind aus dem Stand der Technik bekannt und werden daher hier nicht im Detail beschrieben.
  • Leseanforderungen an das Massenspeichersystem 100 werden im Ausführungsbeispiel in Abhängigkeit des Speicherortes der angeforderten Datei durchgeführt. Hierzu greift die Steuervorrichtung 120 zunächst auf die Datenbank 130 zu, in der im Ausführungsbeispiel für jede gespeicherte Datei-Ressource hinterlegt ist, ob sie in dem primären Speicherverbund 140 gespeichert ist oder auf dem zweiten physikalischen Massenspeicher 150 gespeichert ist. Die Datenbank 130 ermittelt eine logische oder physikalische Speicheradresse der angeforderten Daten in dem primären Speicherverbund 140 bzw. dem zweiten Massenspeicher 150 und liefert diese an die Steuervorrichtung 120 zurück.
  • Die Verteilung der Dateien über die Massenspeicher 142, 144, 150 wird nachfolgend anhand der 3 und 4 im Detail beschrieben. Zum Verständnis des hier dargestellten Massenspeichersystems 100 genügt es zunächst, dass Dateien, auf die besonders häufig zugegriffen wird, auf den physikalischen Massenspeichern 142, 144 abgelegt sind und weitere Dateien, auf die seltener zugegriffen wird, auf dem zweiten physikalischen Massenspeicher 150 abgelegt sind. Je nach ermitteltem Speicherort ruft die Steuervorrichtung 120 die entsprechenden gespeicherten Daten von den ersten physikalischen Massenspeichern 142 und 144 oder dem zweiten physikalischen Massenspeicher 150 ab. Beim Abrufen von Daten von den ersten physikalischen Massenspeichern 142, 144 kann dabei, wie oben bezüglich des Schreibens beschrieben, ein so genanntes ”Data Slicing” Anwendung finden, sodass beispielsweise Datenblöcke abwechselnd von dem ersten physikalischen Massenspeicher 142 und dem ersten physikalischen Massenspeicher 144 gelesen werden, um die zum Lesen zur Verfügung stehende Bandbreite über die Bandbreite eines einzelnen Massenspeichers 142 oder 144 zu erhöhen. Dateien, die auf dem zweiten physikalischen Massenspeicher 150 abgelegt sind, sind dagegen zusammenhängend gespeichert und werden von der Steuervorrichtung 120 unabhängig von ihrem Umfang als eine komplette Datei eingelesen und über die Netzwerkschnittstelle 110 an den anfragenden Client Computer 190 weitergeleitet.
  • Die Verarbeitung von Schreib- oder Leseanfragen des Client Computers 190 durch ein Arbeitsverfahren 200 für das Massenspeichersystem 100 ist im Ablaufdiagramm nach 2 schematisch dargestellt.
  • In einem ersten Schritt 210 wird eine Anfrage bezüglich einer Datei durch die Steuervorrichtung 120 empfangen. Beispielsweise kann es sich um eine Anfrage gemäß einem Netzwerkspeicherprotokoll wie beispielsweise dem Server Message Block (SMB) Protokoll, dem Network File System (NFS) Protokoll, dem Amazon S3 (Simple Storage Service) Protokoll oder einem lokalen Dateizugriffsprotokoll handeln, die über die Netzwerkschnittstelle 110 von dem logischen oder physikalischen Client Computer 190 empfangen wird.
  • In einem nachfolgenden Schritt 220 überprüft die Steuervorrichtung 120 zunächst, ob es sich um eine Schreibanfrage oder Leseanfrage handelt, was sich in der Regel unmittelbar aus dem zur Kommunikation mit dem Client Computer 190 eingesetzten Protokoll ergibt.
  • Aktuell geschriebene Daten besitzen statistisch gesehen eine besonders hohe Zugriffswahrscheinlichkeit für einen nachfolgenden Lese- oder (Über-)Schreibvorgang, sodass die Daten eines Schreibzugriffs im Ausführungsbeispiel ohne weitere Überprüfung in dem primären Speicherverbund 140 gespeichert werden. Hierzu erfolgt in einem optionalen Schritt 230 zunächst eine Aufteilung der von dem Client Computer 190 übertragenen Daten in gleich große Dateisegmente, die in nachfolgenden Schritten 232 und 234 auf den Massenspeicher 142 bzw. den Massenspeicher 144 geschrieben werden.
  • Nachfolgend werden in einem Schritt 236 Metadaten der durchgeführten Schreibvorgänge in der Datenbank 130 gespeichert, um nachfolgende Leseanfragen auf die gespeicherten Daten zu ermöglichen. Beispielsweise kann eine physikalische Blockadresse der gespeicherten Dateisegmente auf den physikalischen Massenspeichern 142 und 144 oder eine logische Adresse der Datei in einem Clusterdateisystems des primären Speicherverbunds 140 insgesamt in der Datenbank 130 erfasst werden. Zusätzlich werden statistische Daten wie etwa der Zeitpunkt des Schreibvorgangs in der Datenbank 130 erfasst.
  • Mit einer optionalen Replizierung der Daten im Schritt 238 auf denselben oder weiteren Massenspeichern des primären Speicherverbunds 140 wird die Bearbeitung der Schreibanfrage beendet.
  • Wurde im Schritt 220 jedoch festgestellt, dass es sich bei der Anfrage um eine Leseanfrage handelt, werden in einem nachfolgenden Schritt 250 Metadaten zur Bestimmung einer Position der gespeicherten Daten innerhalb des Massenspeichersystems 100 von der Datenbank 130 angefordert.
  • Zur Positionsbestimmung wird in einer Entscheidung 260 anhand der Daten der Datenbank 130 zunächst überprüft, ob die angeforderte Datei auf dem primären Speicherverbund 140 oder dem Massenspeicher 150 gespeichert ist. Dies kann entweder unmittelbar anhand von in der Datenbank 130 abgelegten Adressdaten oder mittelbar anhand der Ermittlung einer Zugriffswahrscheinlichkeit anhand von gespeicherten Metadaten erfolgen.
  • Handelt es sich um eine Datei mit einer hohen Zugriffswahrscheinlichkeit, wird eine Leseanforderung an die physikalischen Massenspeicher 142 und 144 weitergeleitet. Im optionalen Schritt 270 erfolgt dabei gegebenenfalls eine Aufteilung der Anfragen in Teilanfragen bezüglich einzelner über die physikalischen Massenspeicher 142 und 144 verteilt gespeicherte Dateisegmente. Diese werden in nachfolgenden Schritte 272 bzw. 274 von den physikalischen Massenspeichern 142 bzw. 144 eingelesen. Mit dem Übermitteln einer gegebenenfalls kombinierten Rückantwort in Schritt 276 endet die Leseanforderung.
  • Wurde in Schritt 260 dagegen festgestellt, dass die Anforderung auf eine Datei mit einer geringen Zugriffswahrscheinlichkeit gerichtet ist, die auf dem zweiten physikalischen Massenspeicher 150 abgelegt ist, wird die Datei in einem Schritt 280 von dem zweiten physikalischen Massenspeicher 150 angefordert. Sofern der Massenspeicher sich zu diesem Zeitpunkt in einem Energiesparzustand befindet, wird der Massenspeicher beispielsweise durch Hochfahren eines Antriebs für einen Speicherplattenstapel zunächst in einen normalen Betriebszustand versetzt. Nachfolgend kann die angeforderte Datei in der Regel aus einem zusammenhängen Speicherbereich des Massenspeichers 150 eingelesen und zurück an den Client Computer 190 übermittelt werden.
  • In einem nachfolgenden, optionalen Schritt 290 erfolgt gegebenenfalls eine Reorganisation der in dem Massenspeichersystem 100 gespeicherten Daten. Grund dafür ist, dass durch den Zugriff auf die zuvor als Datei mit niedriger Zugriffswahrscheinlichkeit eingeordnete Datei die Wahrscheinlichkeit für einen weiteren Zugriff statistisch erhöht wird, sodass zumindest bezüglich der zugegriffenen Datei gegebenenfalls eine Reorganisation des Massenspeichersystems 100 erforderlich sein könnte.
  • In der 3 ist schematisch ein mögliches Verfahren 300 zur Reorganisation der Daten des Massenspeichersystems 100 dargestellt.
  • In einem Schritt 310 wird zunächst überprüft, ob ein Anlass zur Reorganisation der in dem Massenspeichersystem 100 gespeicherten Dateien gegeben ist. Beispielsweise kann im Schritt 310 basierend auf einem Zeitgeber regelmäßig eine Reorganisation nach Ablauf einer vorbestimmten Zeitspanne ausgelöst werden. Beispielsweise kann eine Reorganisation zu einer festen Tageszeit, beispielsweise nachts wenn besonders wenige Zugriffe auf die in dem System 100 gespeicherten Daten zu erwarten sind, vorgenommen werden. Alternativ ist es auch möglich, die Reorganisation beim Eintreten eines vorbestimmten Ereignisses, beispielsweise beim Lesen einer Datei von dem zweiten physikalischen Massenspeicher 150 oder beim Erreichen einer vorbestimmten Speicherkapazitätsgrenze eines der Massenspeicher 144, 142 oder 150, auszulösen. Ebenfalls kann eine Regorganisation nach einer bestimmten Anzahl von Zugriffen auf das Massenspeichersystem 100 insgesamt oder den zweiten physikalischen Massenspeicher 150 ausgelöst oder manuell von einem Administrator des Systems 100 angefordert werden. Der Schritt 310 wird zyklisch wiederholt, bis ein entsprechender Anlass gegeben ist.
  • Wenn eine Reorganisation des Massenspeichersystems 100 gewünscht oder erforderlich ist, wird in einem nachfolgenden Schritt 320 zunächst überprüft, ob weitere Daten zur Reorganisation zur Verfügung stehen. Das Verfahren 300 zur Reorganisation kann sich grundsätzlich auf alle in dem Massenspeichersystem 100 gespeicherte Dateien, Dateien einzelner Massenspeicher 142, 144 und/oder 150 oder auch nur ausgewählte oder einzelne Dateien beziehen. Beispielsweise ist es möglich, die Zugriffswahrscheinlichkeit für eine einzelne Datei anlassbezogen, dass heißt bei einem bezüglich der 2 beschriebenen Zugriff im Schritt 290 zu überprüfen.
  • Steht eine Datei zur Reorganisation an, wird in einem nachfolgenden Schritt 330 die Zugriffswahrscheinlichkeit für die in dem Massenspeichersystem 100 gespeicherte Datei bestimmt. Die Zugriffswahrscheinlichkeit wird in der weiteren Beschreibung anschaulich auch als ”Temperatur” T der zu analysierenden Datei bezeichnet. Dabei steht eine ”hohe Dateitemperatur” anschaulich für eine hohe Zugriffswahrscheinlichkeit, also für Dateien, auf die besonders häufig zugegriffen wird. Umgekehrt steht eine ”niedrige Dateitemperatur” für solche Dateien, die nur selten oder überhaupt nicht mehr von dem Massenspeichersystem 100 abgerufen werden.
  • Zur Bestimmung der Temperatur T einer Datei sind unterschiedliche Mechanismen denkbar. Einer davon wird nachfolgend unter Bezugnahme auf die 4 im Detail beschrieben. Allgemein gilt, dass die Wahrscheinlichkeit eines Zugriffs auf eine Datei höher ist, wenn auf die Datei bereits in der Vergangenheit häufig zugegriffen wurde oder der letzte Schreib- oder Lesezugriff nur eine verhältnismäßig kurze Zeitspanne zurückliegt. Umgekehrt gilt für Dateien, die in der Vergangenheit nicht oder in einem jüngeren Zeitraum nur sehr selten angefordert wurden, dass sie auch in der voraussehbaren Zukunft wahrscheinlich nicht angefordert werden und daher eine niedrigere Dateitemperatur aufweisen.
  • Ist die Temperatur T einer Datei bestimmt, wird das Verfahren in Schritt 320 mit der Ermittlung fortgesetzt, ob die Temperatur für weitere Dateien bestimmt werden muss.
  • In einem nachfolgenden oder parallel ausgeführten Schritt 340 wird ein Grenzwert TREF bezüglich der Abgrenzung zwischen Dateien mit hoher Zugriffswahrscheinlichkeit bzw. -temperatur und Dateien mit geringer Zugriffswahrscheinlichkeit bzw. -temperatur festgelegt. Dabei kann der Grenzwert TREF entweder fest vorgegeben oder durch einen Systemadministrator frei wählbar sein.
  • Alternativ ist es auch möglich, den Grenzwert TREF in Schritt 340 dynamisch, insbesondere anhand der Auslastung der Speicherkapazität der Massenspeicher 142, 144 und 150 festzulegen. Beispielsweise kann in Schritt 340 der Grenzwert TREF so gewählt werden, dass jeweils die 20% der gespeicherten ”heißen” Daten auf dem ersten Massenspeicher 142 oder dem zweiten Massenspeicher 144 abgelegt sind, während die verbleibenden 80% ”kälterer” Daten auf dem zweiten physikalischen Massenspeicher 150 abgelegt sind. Neben einem festen Verhältnis kann das Verhältnis selbstverständlich auch dynamisch, insbesondere in Abhängigkeit der absoluten Speicherkapazität oder einer verbleibenden Speicherkapazität der Massenspeicher 142, 144 und/oder 150 gewählt werden.
  • Umgekehrt werden Dateien, deren in Schritt 330 bestimmte Temperatur unterhalb der in Schritt 340 bestimmten Grenztemperatur liegt, die jedoch in dem primären Speicherverbund 140 gespeichert sind, von dort im optionalen Schritt 360 auf den zweiten physikalischen Massenspeicher 150 verschoben.
  • In einem nachfolgenden Schritt 350 werden dann die Dateien, deren in Schritt 330 bestimmte Temperatur T über der in Schritt 340 bestimmten Grenztemperatur TREF liegt, die jedoch auf dem zweiten physikalischen Massenspeicher 150 gespeichert sind, im Schritt 350 auf den ersten physikalischen Massenspeicher 142 und/oder 144 des Speicherverbunds 140 verschoben. Bezüglich des Schreibens der Daten wird auf die obigen Ausführungen zu den Schritten 230 bis 238 der 2 verwiesen.
  • Ist die Reorganisation abgeschlossen, endet das Verfahren 300, wobei gegebenenfalls nicht mehr benötigte Speicherbereiche der Massenspeicher 142, 144 und 150 zur neuerlichen Verwendung freigegeben werden.
  • 4 zeigt schematisch ein vereinfachtes Verfahren 400 zur Festlegung einer Temperatur einer Datei in vier unterschiedliche, vorgegebene Temperaturbereiche, die jeweils einer Gruppe von Dateien mit einer ähnlichen Zugriffswahrscheinlichkeit zugeordnet sind.
  • Gemäß dem Verfahren 400 wird in einem ersten Schritt 410 überprüft, ob auf die in Frage stehende Datei innerhalb eines vorbestimmten Zeitraums t1 schreibend zugegriffen wurde. Wurde die Datei beispielsweise innerhalb der letzten Minute erst angelegt oder überschrieben, handelt es sich um eine aktiv in Bearbeitung stehende Datei, die einer ersten Gruppe 420 mit ”am heißesten” Dateien zugeordnet wird.
  • Wurde die Datei nicht aktuell geschrieben, wird in einem nachfolgenden Schritt 430 überprüft, wann der letzte Lesezugriff auf die Datei erfolgt ist. Erfolgte der letzte Lesezugriff innerhalb eines Zeitraums t2, beispielsweise innerhalb der letzten Stunde, wird sie einer weiteren Gruppe 440 mit ”heißen Dateien” zugeordnet.
  • Ist auch dies nicht der Fall, wird in einer weiteren Überprüfung 450 festgestellt, wie oft insgesamt auf die Datei zugegriffen wurde. Liegt die festgestellte Anzahl von Zugriffen über einem vorbestimmten Grenzwert N, beispielsweise drei Lesezugriffen seit dem letzten Schreibzugriff, wird sie einer Gruppe 460 mit ”warmen Dateien” zugeordnet. Anderenfalls wird sie einer letzten Gruppe 470 mit ”kalten Dateien” zugeordnet.
  • Die Aufteilung gemäß dem Verfahren nach 4 kann selbstverständlich in vielfältiger Weise abgewandelt oder verfeinert werden. Insbesondere können die für eine Datei in einem Dateisystem typischerweise erfassten Metadaten in vielfältiger Weise miteinander kombiniert werden, um eine mehr oder weniger kontinuierliche Verteilung von Dateitemperaturen bzw. Zugriffswahrscheinlichkeiten zu bestimmen.
  • Durch die pyramidenförmige Darstellung der Gruppen wird die übliche Verteilung von Zugriffswahrscheinlichkeiten angedeutet. Empirischen Studien zu Folge machen die am häufigsten verwendeten Dateien nur einen kleinen Teil der gesamten Speicherkapazität aus und umgekehrt. In der 4 ist zusätzlich auch der Schwellwert TREF angedeutet, der zur oben beschriebenen Ungleichbehandlung des oberen und unteren Teils der Pyramide führt.
  • 5 zeigt eine mögliche Implementierung eines Massenspeichersystems in Form eines RAID-Systems 500 zum Abspeichern von Dateien, die vier unterschiedlichen Gruppen mit unterschiedlichen Zugriffswahrscheinlichkeiten zugeordnet sind.
  • Das RAID-System 500 umfasst eine Mehrzahl von so genannten NAS-Heads 510, die die in dem RAID-System 500 gespeicherten Dateien gemäß einem allgemein bekannten Protokoll, beispielsweise dem vom UNIX her bekannten Dateisystem NFS, über ein IP-Netzwerk 515 einer Mehrzahl von Clients 520 anbieten. Intern sind die NAS-Heads 510 im dargestellten Ausführungsbeispiel über eine so genannte Fibre Channel over Ethernet (FCoE) Interconnect-Struktur 530 mit einer Vielzahl von primären Massenspeichern 542, 544 und 546 eines primären Speicherverbunds 540 verbunden. Alternativ könnte die Interconnect-Struktur 530 auch als Infiniband und/oder Ethernet-Verbindung ausgestaltet sein.
  • Die primären Massenspeicher 542, 544 und 546 sind im Ausführungsbeispiel gemäß 5 in drei Gruppen mit jeweils unterschiedlicher Leistungsfähigkeit aufgeteilt. Die erste Gruppe umfasst physikalische Massenspeicher 542 in Form von so genannten SSD-Halbleiter-Speicherlaufwerken. Die zweite Gruppe umfasst physikalische Massenspeicher 544 in Form von Massenspeicher mit rotierenden Speichermedien, die mit einer Schnittstelle gemäß dem Serial Attached SCSI (SAS) Standard ausgestattet sind. Die dritte Gruppe umfasst physikalische Massenspeicher 546 in Form von Massenspeichern mit rotierenden Speichermedien mit verhältnismäßig einfachen seriellen ATA (SATA) Schnittstellen. Die Massenspeicher 542, 544 und 546 weisen unterschiedliche Zugriffsgeschwindigkeiten auf, die beispielsweise den Gruppen 420, 440 und 460 von am heißesten, heißen und warmen Dateien zugeordnet sind. Auf diese Weise kann für jede Art von Dateien ein bezüglich der Kosten und der Zugriffsleistung optimierter Ausgleich gefunden werden.
  • Das RAID-System 500 ist des Weiteren über eine so genannte IP-Interconnect-Schicht 560 mit einer Mehrzahl von externen Massenspeichern 550 verbunden. Bei den externen Massenspeichern 550 handelt es sich im Ausführungsbeispiel um so genannte Direct Attached Storage (DAS) Laufwerke, die jeweils mindestens eine Recheneinheit 570 aufweisen, die dem primären Speicherverbund 540 eine NAS-Schnittstelle anbieten. Optional sind die Recheneinheiten 570 auch dazu eingerichtet, die an die DAS-Laufwerke gerichteten Daten zu komprimieren und/oder zu deduplizieren und entsprechend zu speichern. Die externen Massenspeicher 550 sind zwar räumlich benachbart zu dem RAID-System 500 in demselben Rack angeordnet, werden jedoch davon unabhängig betrieben und über die IP-Interconnect-Schicht 560 angesprochen. Wegen der dazwischen liegenden IP-Verbindung ist die Übertragungsbandbreite zwischen den NAS-Heads 510 und den externen Massenspeichern 550 deutlich geringer als die Bandbreite zwischen den NAS-Heads 510 und den internen Massenspeichern 542, 544 oder 546. Dennoch können die in den externen Massenspeichern 550 abgelegten Daten innerhalb einer für den Benutzer kaum wahrnehmbaren Zeit über die NAS-Heads 510 bereitgestellt werden. Insbesondere erfolgt die Bereitstellung deutlich schneller als bei bekannten Archivsystemen, bei denen nicht länger in einem internen Massenspeicher zwischengespeicherte Daten erst über ein Bandlaufwerk von einem Magnetband oder von einem sonstigen Wechselspeichermedium eingelesen werden müssen.
  • Im beschriebnen Beispiel sind die einzelnen Komponenten des RAID-System 500 am selben Ort aufgestellt. Je nach eingesetzten Interconnect-Strukturen 530 und/oder 560 können dessen Komponenten jedoch auch über mehrere Standorte verteilt werden, um eine geografische Redundanz und damit einen verbesserten Schutz gegenüber katastrophalen Ereignissen wie Bränden, Erdbeben etc. zu erreichen.
  • Da auf die externen Massenspeicher 550 nur sehr selten zugegriffen wird, werden diese Massenspeicher 550 bevorzugt in einen Energiesparzustand versetzt, wenn über einen vorbestimmten Zeitraum von beispielsweise mehreren Minuten oder Stunden kein Zugriff auf den jeweiligen Massenspeicher 550 mehr stattgefunden hat. Da statistisch gesehen die meisten Daten, die von einem Massenspeichersystem 100 vorgehalten werden, der Gruppe 470 von kalten Dateien zugeordnet werden können, empfiehlt es sich weiterhin, diese Daten gegebenenfalls in einem deduplizierten und komprimierten oder zumindest komprimierten Zustand vorzuhalten. Zu diesem Zweck sind zwischen der IP-Interconnect-Schicht 560 und den eigentlichen physikalischen Massenspeichern 550 die Recheneinheiten 570 vorgesehen, die für eine Deduplizierung der Daten vor deren Speicherung auf den externen Massenspeichern 550 sorgen. Der mit der Duplizierung einhergehende zusätzliche Aufwand muss nur einmal oder zumindest nur verhältnismäßig selten erbracht werden, sofern die Daten erwartungsgemäß nicht wieder von dem RAID-System 500 abgerufen oder geändert werden.
  • Das RAID-System 500 gemäß der 5 verteilt die in ihm gespeicherten Daten wie zuvor unter Bezugnahme auf die 1 bis 4 beschrieben, basierend auf einer statistisch zu erwartenden Zugriffswahrscheinlichkeit. Dabei werden besonders heiße Dateien durch den Einsatz besonders leistungsfähiger Hardware schnell verfügbar vorgehalten. Kalte Dateien können dagegen besonderes energiesparend auf einfacher Hardware vorgehalten werden, ohne dass die geschilderten Nachteile bekannter Archivlösungen für den Benutzer spürbar werden. Für den Betreiber des Systems ergibt sich der weitere Vorteil, dass sich mit moderatem wirtschaftlichem bzw. technischem Aufwand ein RAID-System mit einer aus Benutzersicht sehr hohen Gesamtleistung aufbauen lässt.
  • 6 zeigt eine logische Ansicht von in einem Massenspeichersystem 600, beispielsweise dem Massenspeichersystem 100 oder dem RAID-System 500, abgelegten Daten. Darin ist insbesondere das Zusammenwirken unterschiedlicher Dateisysteme zu erkennen.
  • Für einen Benutzer des Massenspeichersystems 600 ist nach außen nur ein einziges Dateisystem 610 sichtbar. Bei dem Dateisystem 610 handelt es sich im technischen Sinne um ein virtuelles oder logisches Dateisystem, da in dem Massenspeichersystem 600 kein physikalischer Datenträger existiert, auf dem sämtliche in dem Dateisystem 610 erfassten Dateien abgelegt sind. Der Zugriff auf das Dateisystem 610 erfolgt in an sich bekannter Weise, beispielsweise über das NFS-Protokoll.
  • In der 6 ist angedeutet, dass in dem Dateisystem 610 zwei Dateien 620 und 630 gespeichert sind. Die Dateien 620 bzw. 630 umfassen dabei neben ihrem eigentlichen Inhalt 622 bzw. 632 zusätzliche Metainformationen. Beispielsweise sind in dem virtuellen Dateisystem 610 für die Dateien 620 und 630 ein Zeitpunkt des letzten Zugriffs 624 bzw. 634 sowie ein Zeitpunkt des letzten Schreibens 626 bzw. 636 festgehalten. Darüber hinaus können weitere, in der 6 nicht dargestellte Metainformationen wie Zugriffsrechte und Zugriffshäufigkeiten und weitere Attribute zu jeder Datei gespeichert werden. Die Metadateien müssen dabei nicht vollständig über das virtuelle Dateisystem 610 für einen Benutzer zugänglich sein, sondern können auch nur der internen Organisation innerhalb des Massenspeichersystems 600 dienen.
  • Weiter ist in 6 dargestellt, dass die eigentlichen Inhalte 622 bzw. 632 der ersten Datei 620 bzw. der zweiten Datei 630 logisch und physisch in mehrere Datensegmente 628 bzw. 638 mit Inhalten D1, D2, D3 und D4 bzw. D5, D6 und D7 aufgeteilt werden können. Bei den Dateisegmenten 628 und 638 kann es sich um Datenblöcke einer festen Größe, beispielsweise einer üblichen Blockgröße von 512 Byte, 4 kByte oder eine sonstige an die Struktur der verwendeten Massenspeicher angepasste Blockgröße handeln. Selbstverständlich können auch von einem Systemadministrator vorgegebene Blockgrößen oder relative Blockgrößen, beispielsweise jeweils ein bestimmter Bruchteil der Gesamtgröße einer Datei, gewählt werden.
  • Im in der 6 dargestellten Zustand ergibt sich aus den Zeitpunkten 624 und 626 der ersten Datei 620, dass es sich um eine so genannte heiße Datei mit einer hohen Zugriffswahrscheinlichkeit handelt. Bildlich dargestellt liegt die Temperatur T1 der ersten Datei 620 über einer vorgegebenen Referenztemperatur TREF. Deshalb wird die Datei 620 durch das Massenspeichersystem 600 auf ein verteiltes Clusterdateisystem 650 abgebildet, über das physikalische Massenspeicher 642, 644 und 646 eines primären Speicherverbunds 640 angesprochen werden.
  • Auch bei dem Cluster-Dateisystem 650 handelt es sich um ein logisches oder virtuelles Dateisystem, weil die darüber adressierbaren Daten nicht physikalisch auf einem einzigen Massenspeicher existieren, sondern über die zwei physikalischen Massenspeicher 642 und 644 verteilt gespeichert werden. Beispielsweise kann ein erstes Dateisegment 628 mit Inhalt D1 der ersten Datei 620 auf dem Massenspeicher 642 und ein zweites Dateisegment 628 mit dem Inhalt D2 der Datei 620 auf dem physikalischen Massenspeicher 644 gespeichert werden. Weitere Dateisegmente 628 der Datei 620 werden in ähnlicher Weise ebenfalls abwechselnd über die physikalischen Massenspeicher 642 und 644 des primären Speicherverbunds 640 verteilt.
  • Zusätzlich ist in der 6 angedeutet, dass weitere zugehörige Daten der Datei 620, insbesondere der mit den auf den Massenspeichern 642 und 644 gespeicherten Datensegmente 628 verknüpfte Paritätsdaten D12 und D34 auf einem weiteren Massenspeicher 646 des primären Speicherverbunds 140 abgelegt werden können. Alternativ können auch weitere Kopien der Segmente selbst in einem weiteren Massenspeicher gespeichert werden. Durch die zusätzlichen Daten auf dem zusätzlichen Massenspeicher 646 kann eine Redundanz der gespeicherten Datei 620 und somit eine Sicherheit gegen einen Ausfall eines der Massenspeicher 642 oder 644 geschaffen werden. Die dabei eingesetzten Verfahren zum redundanten Speichern von Daten und deren Wiederherstellung bei Ausfall eines oder mehrerer Massenspeicher sind aus dem Stand der Technik bekannt und werden daher hier nicht im Detail beschrieben.
  • In der 6 ist weiter ersichtlich, dass basierend auf dem Lesezeitraum 634 und dem Schreibzeitraum 636 für die zweite Datei 630 ermittelt wurde, dass es sich um eine so genannte kalte Datei handelt, die höchstwahrscheinlich nicht oder nur noch sehr selten von dem Massenspeichersystem 600 abgerufen wird. Diese Datei 630 ist zusammenhängend auf einem sekundären Massenspeicher 660 gespeichert.
  • Zusammenhängend heißt in diesem Fall in erster Linie, dass sämtliche Dateisegmente 638 der zweiten Datei in einer gemeinsamen Partition des sekundären Massenspeichers 660 abgelegt sind und/oder über ein gemeinsames, für den Massenspeicher 660 spezifisches Dateisystem 662 abrufbar sind. Bevorzugt sind diese Dateisegmente in logisch aufeinander abfolgenden Blöcken gespeichert, wobei diese entsprechend dem Steueralgorithmus des Massenspeichers 660 durchaus über räumlich getrennte Speichersektoren verteilt sein können.
  • Um auch bezüglich der in dem Massenspeicher 660 gespeicherten Daten eine Redundanz und somit eine Sicherheit gegenüber dem Ausfall des Massenspeichers 660 sicherstellen zu können, sind die darin gespeicherten Daten auf einem zweiten sekundären Massenspeicher 670 mit einem dafür spezifischen Dateisystem 672 gespiegelt. Somit sind die Daten der zweiten Datei 630 auch auf dem zweiten Massenspeichers 670 zusammenhängend gespeichert, der beim Ausfall des ersten sekundären Massenspeichers 660 dessen Funktion übernehmen kann.
  • Anstelle der oben beschriebenen Spiegelung auf einem zweiten sekundären Massenspeicher 670 kann diese auch auf ein an sich aus der Archivierung bekanntes, relativ langsames tertiäres Speichermedium wie ein Magnetband oder mittels Cloud-Storage erfolgen. Der zum Wiedereinlesen des Speichermediums erforderliche Zeitaufwand ist dabei fast ohne praktische Bedeutung, da auf die Dateien des sekundären Massenspeichers 660 ohnehin nur sehr selten zugegriffen wird und selbst dann das Rücksichern vom Band beim ohnehin nur unwahrscheinlichen Ausfall des sekundären Massenspeichers 660 zur selben Zeit erforderlich wäre. Statistisch gesehen ist ein Aufeinandertreffen dieser unkorrelierten Ereignisse sehr unwahrscheinlich, so dass es keine spürbare Auswirkung auf den Normalbetrieb des Massenspeichersystems 600 hat.
  • Zusammengefasst können die Massenspeichersysteme 100 und 600 bzw. das RAID-System 500 umfangreiche Daten zentral auf besonders energieeffiziente und leistungsfähige Weise speichern. Dabei dient eine Gruppierung von Dateien gemäß gleicher oder ähnlicher Zugriffswahrscheinlichkeit bzw. Dateitemperatur dazu, dass Dateien, auf die besonders häufig zugegriffen wird, in besonders schnellen, leistungsfähigen und damit teuren Datenspeichern abgelegt werden können. Umgekehrt werden solche Dateien, auf die nie oder nur selten zugegriffen wird, in verhältnismäßig großen und kostengünstigen, daher jedoch auch verhältnismäßig leistungsschwachen Massenspeichern abgelegt. Neben der bereits dadurch erreichten Performance-Verbesserung dient die Gruppierung von Daten auch dazu, dass Dateien mit besonders niedriger Dateitemperatur, also Dateien, auf die wahrscheinlich nie wieder zugegriffen wird, auf einem gemeinsamen physikalischen Massenspeicher gespeichert werden. Für diesen physikalischen Massenspeicher führt eine zumindest vorübergehende Abschaltung somit zu einer signifikanten Energieeinsparung, ohne dass dadurch die Leistung des Gesamtsystems für einen Benutzer erkennbar einbricht.
  • Bezugszeichenliste
  • 100
    Massenspeichersystem
    110
    Netzwerkschnittstelle
    120
    Steuervorrichtung
    130
    Datenbank
    140
    primärer Speicherverbund
    142
    physikalischer Massenspeicher
    144
    physikalischer Massenspeicher
    150
    physikalischer Massenspeicher
    160
    primäre Verbindungsstruktur
    170
    sekundäre Verbindungsstruktur
    180
    Netzwerk
    190
    Client Computer
    200
    Verfahren
    210–290
    Verfahrensschritte
    300
    Verfahren
    310–360
    Verfahrensschritte
    400
    Verfahren
    410
    Verfahrensschritt
    420
    Gruppe
    430
    Verfahrensschritt
    440
    Gruppe
    450
    Verfahrensschritt
    460
    Gruppe
    470
    Gruppe
    500
    RAID-System
    510
    NAS-Head
    515
    IP-Netzwerk
    520
    Client
    530
    Interconnect-Struktur
    540
    primärer Speicherverbund
    542
    primärer Massenspeicher
    544
    primärer Massenspeicher
    546
    primärer Massenspeicher
    550
    externer Massenspeicher
    560
    IP-Interconnect-Schicht
    570
    Recheneinheit
    600
    Massenspeichersystem
    610
    virtuelles Dateisystem
    620
    erste Datei
    622
    Dateninhalt
    624
    Lesedatum
    626
    Schreibdatum
    628
    Dateisegment
    630
    zweite Datei
    632
    Dateiinhalt
    634
    Lesedatum
    636
    Schreibdatum
    638
    Dateisegment
    640
    primärer Speicherverbund
    642
    physikalischer Massenspeicher
    644
    physikalischer Massenspeicher
    646
    physikalischer Massenspeicher
    650
    Clusterdateisystem
    660
    Massenspeicher
    662
    Dateisystem
    670
    Massenspeicher
    672
    Dateisystem

Claims (7)

  1. Massenspeichersystem (100, 600), umfassend: – wenigstens eine Steuervorrichtung (120); – eine Mehrzahl von voneinander unabhängigen ersten physikalischen Massenspeichern (642, 644, 646) mit voneinander unabhängigen Schreib-/Leseeinheiten, die zusammen einen primären Speicherverbund (140) bilden, der über eine lokale primäre Verbindungsstruktur (160) mit der Steuervorrichtung (120) verbunden ist; – wenigstens ein Direct Attached Storage Laufwerk als zweiten physikalischen Massenspeicher (660), der über eine sekundäre Verbindungsstruktur (170) mit der Steuervorrichtung (120) verbunden ist; und – wenigstens eine Schnittstellenvorrichtung zum Bereitstellen eines virtuellen Dateisystems (610) für wenigstens einen Benutzer des Massenspeichersystems (100, 600); – wobei die wenigstens eine Steuervorrichtung (120) dazu eingerichtet ist, – die in dem virtuellen Dateisystem (610) logisch gespeicherten Dateien (620, 630) wahlweise auf den ersten physikalischen Massenspeichern (642, 644, 646) oder dem wenigstens einen zweiten physikalischen Massenspeicher (660) zu speichern, – für die in dem virtuellen Dateisystem (610) logisch gespeicherten Dateien eine Zugriffswahrscheinlichkeit zu bestimmen, – in dem virtuellen Dateisystem (610) logisch gespeicherten Dateien (620, 630) in wenigstens zwei Gruppen (420, 470) mit unterschiedlichen Zugriffswahrscheinlichkeitsbereichen aufzuteilen, – Dateien (620), deren Zugriffswahrscheinlichkeit über einem ersten vorbestimmten Grenzwert (TREF) liegt und die einer ersten Gruppe (420) zugeordnet wurden, in einer Mehrzahl von voneinander unabhängigen ersten physikalischen Massenspeichern (642, 644, 646) mit voneinander unabhängigen Schreib-/Leseeinheiten verteilt zu speichern, wobei die Dateien (620) der ersten Gruppe in Segmente (628) einer vorbestimmten Größe aufgeteilt werden und Segmente (628) einer Datei (620) mit mehr als einem Segment (628) verteilt auf der Mehrzahl von voneinander unabhängigen ersten physikalischen Massenspeichern (642, 644, 646) gespeichert werden, um die Schreib-/Leseleistung der beteiligten physikalischen Massenspeicher (642, 644, 646) zu kombinieren, und – Dateien (630), deren Zugriffswahrscheinlichkeit unter dem ersten vorbestimmten Grenzwert (TREF) liegt und die einer zweiten Gruppe (470) zugeordnet wurden, in wenigstens einem zusammenhängenden Speicherbereich des wenigstens einen zweiten physikalischen Massenspeichers (660) gemeinsam zu speichern; und – wobei das Massenspeichersystem dazu eingerichtet ist, den wenigstens einen zweiten physikalischen Massenspeichers (660) in einen Betriebszustand mit gegenüber einem normalen Betriebszustand reduzierter Energieaufnahme zu schalten, wenn über einen vorbestimmten Zeitraum kein Zugriff auf den wenigstens einen zweiten physikalischen Massenspeicher (660) durchgeführt wurde; und den wenigstens einen zweiten physikalischen Massenspeichers (660) in den normalen Betriebszustand zu schalten, wenn eine Zugriffsanforderung für wenigstens eine auf dem wenigstens einen zweiten physikalischen Massenspeicher (660) gespeicherte Datei (630) über das virtuelle Dateisystem (610) erfasst wird; – wobei die erste, lokale Verbindungsstruktur (160) eine erste Bandbreite aufweist und die zweite Verbindungsstruktur (170) als IP-Interconnect-Schicht ausgestaltet ist, die eine gegenüber der ersten Bandbreite geringere zweite Bandbreite aufweist.
  2. Massenspeichersystem (100, 600) nach Anspruch 1, bei dem der wenigstens eine zweite physikalische Massenspeicher (660) eine Antriebseinheit und wenigstens ein durch die Antriebseinheit rotatorisch antreibbares Speichermedium umfasst, wobei die Steuervorrichtung (120) oder der wenigstens eine zweite physikalische Massenspeicher (660) dazu eingerichtet ist, die Antriebseinheit abzuschalten, wenn über den vorbestimmten Zeitraum kein Zugriff auf den wenigstens einen zweiten physikalischen Massenspeicher (660) erfolgt.
  3. Massenspeichersystem (100, 600) nach Anspruch 1 oder 2, umfassend wenigstens zwei zweite physikalische Massenspeicher (660, 670), wobei auf einem ersten der wenigstens zwei zweiten physikalischen Massenspeicher (660) gespeicherte Dateien (630) auf wenigstens einem zweiten der wenigstens zwei zweiten physikalischen Massenspeicher (670) redundant gespeichert werden.
  4. Massenspeichersystem (100, 600) nach einem der Ansprüche 1 bis 3, bei dem auf einem ersten der Mehrzahl von ersten physikalischen Massenspeichern (642) gespeicherte Dateien (620) oder Segmente (628) von Dateien (620) auf wenigstens einem zweiten der Mehrzahl von ersten Massenspeichern (642, 644, 646) redundant gespeichert werden.
  5. Massenspeichersystem (100, 600) nach einem der Ansprüche 1 bis 4, bei dem das Massenspeichersystem als ein RAID-System (500) ausgebildet ist.
  6. Massenspeichersystem (100, 600) nach einem der Ansprüche 1 bis 5, bei dem die Mehrzahl von ersten physikalischen Massenspeichern (642, 644, 646) von der Steuervorrichtung (120) über ein gemeinsames, verteiltes erstes Dateisystem (650) verwaltet wird und der wenigstens eine zweite physikalische Massenspeicher (660) über ein für den Massenspeicher spezifisches zweites Dateisystem (662) verwaltet wird.
  7. Massenspeichersystem (100, 600) nach einem der Ansprüche 1 bis 6, bei dem die Mehrzahl von ersten physikalischen Massenspeichern (542, 544, 546) wenigstens eine erste Untergruppe von Massenspeichern (542) mit einer ersten Zugriffsgeschwindigkeit, insbesondere Massenspeicher (542) mit wenigstens einem Halbleiter-Massenspeichermedium, und eine zweite Untergruppe von Massenspeichern (544, 546) mit einer gegenüber der ersten Zugriffsgeschwindigkeit geringeren zweiten Zugriffsgeschwindigkeit, insbesondere Massenspeicher (544, 546) mit wenigstens einem rotierenden Massenspeichermedium, umfasst; und bei dem die Steuervorrichtung (120) dazu eingerichtet ist, Dateien, deren Zugriffswahrscheinlichkeit über einem gegenüber dem ersten vorbestimmten Grenzwert (TREF) größeren zweiten vorbestimmten Grenzwert liegt, in einer Mehrzahl von Massenspeichern (542) der ersten Untergruppe verteilt zu speichern und Dateien, deren Zugriffswahrscheinlichkeit unter dem zweiten vorbestimmten Grenzwert und über dem ersten vorbestimmten Grenzwert (TREF) liegt, in einer Mehrzahl von Massenspeichern (544, 546) der zweiten Untergruppe verteilt zu speichern.
DE102012108103.4A 2012-08-31 2012-08-31 Arbeitsverfahren für ein Massenspeichersystem, Massenspeichersystem und Computerprogrammprodukt Expired - Fee Related DE102012108103B4 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE102012108103.4A DE102012108103B4 (de) 2012-08-31 2012-08-31 Arbeitsverfahren für ein Massenspeichersystem, Massenspeichersystem und Computerprogrammprodukt
PCT/EP2013/066399 WO2014032910A1 (de) 2012-08-31 2013-08-05 Arbeitsverfahren für ein massenspeichersystem, massenspeichersystem und computerprogrammprodukt
US14/424,227 US10055157B2 (en) 2012-08-31 2013-08-05 Working method for a mass storage system, mass storage system and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102012108103.4A DE102012108103B4 (de) 2012-08-31 2012-08-31 Arbeitsverfahren für ein Massenspeichersystem, Massenspeichersystem und Computerprogrammprodukt

Publications (2)

Publication Number Publication Date
DE102012108103A1 DE102012108103A1 (de) 2014-03-06
DE102012108103B4 true DE102012108103B4 (de) 2014-12-04

Family

ID=48917548

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102012108103.4A Expired - Fee Related DE102012108103B4 (de) 2012-08-31 2012-08-31 Arbeitsverfahren für ein Massenspeichersystem, Massenspeichersystem und Computerprogrammprodukt

Country Status (3)

Country Link
US (1) US10055157B2 (de)
DE (1) DE102012108103B4 (de)
WO (1) WO2014032910A1 (de)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3349418B1 (de) * 2014-05-29 2019-07-24 Huawei Technologies Co., Ltd. Dienstverarbeitungsverfahren, zugehörige vorrichtung und system
US11016937B2 (en) * 2017-07-17 2021-05-25 Microsoft Technology Licensing, Llc Updateable distributed file framework
US10318176B2 (en) * 2017-09-06 2019-06-11 Western Digital Technologies Real-time, self-learning automated object classification and storage tier assignment
US11561860B2 (en) * 2017-11-13 2023-01-24 Weka.IO Ltd. Methods and systems for power failure resistance for a distributed storage system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040111558A1 (en) * 2002-12-05 2004-06-10 International Business Machines Corporation Multiple disk data storage system for reducing power consumption
US20090254702A1 (en) * 2007-12-26 2009-10-08 Fujitsu Limited Recording medium storing data allocation control program, data allocation control device, data allocation control method, and multi-node storage-system

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6490666B1 (en) 1999-08-20 2002-12-03 Microsoft Corporation Buffering data in a hierarchical data storage environment
US7092977B2 (en) 2001-08-31 2006-08-15 Arkivio, Inc. Techniques for storing data based upon storage policies
US20040083202A1 (en) * 2002-08-30 2004-04-29 Arkivio, Inc. Techniques to control recalls in storage management applications
JP4322031B2 (ja) 2003-03-27 2009-08-26 株式会社日立製作所 記憶装置
US8006111B1 (en) * 2007-09-21 2011-08-23 Emc Corporation Intelligent file system based power management for shared storage that migrates groups of files based on inactivity threshold
US9471240B2 (en) * 2010-06-24 2016-10-18 International Business Machines Corporation Performing read and write operations with respect to at least one solid state disk and at least one non-solid state disk

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040111558A1 (en) * 2002-12-05 2004-06-10 International Business Machines Corporation Multiple disk data storage system for reducing power consumption
US20090254702A1 (en) * 2007-12-26 2009-10-08 Fujitsu Limited Recording medium storing data allocation control program, data allocation control device, data allocation control method, and multi-node storage-system

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RAID - Wikipedia, 22.08.2012 *
RAID - Wikipedia, 22.08.2012<http://de.wikipedia.org/w/index.php?title=RAID&oldid=107119246>

Also Published As

Publication number Publication date
DE102012108103A1 (de) 2014-03-06
WO2014032910A1 (de) 2014-03-06
US10055157B2 (en) 2018-08-21
US20150212754A1 (en) 2015-07-30

Similar Documents

Publication Publication Date Title
DE112018004178B4 (de) Mehrstufige speicherung in einem verteilten dateisystem
DE112018000193B4 (de) Daten sequenziell in Zonen in einem verstreuten Speichernetzwerk speichern
DE112017002941B4 (de) Arbeitslastoptimierte Datendeduplizierung mittels Phantomfingerabdrücken
US9400828B2 (en) Hierarchical chunking of objects in a distributed storage system
DE112012005271B4 (de) Bandlaufwerksystem-Server
DE102013215535B4 (de) Sicherung oder wiederherstellung von daten mit hilfe eines hauptspeichers und nichtflüchtiger speichermedien
DE102012216022B4 (de) Verwaltung einer Zeitpunktkopie-Beziehung für platzsparende Datenträger
DE112017005868T5 (de) Verwaltung von e/a-abläufen für datenobjekte in einem speichersystem
DE112014000254T5 (de) Merhrstufiges Zwischenspeichern und migrieren in unterschiedlichen Granularitäten
DE112005001050T5 (de) Liefern eines alternativen Cachespeicherungsschemas auf der Speicherbereichnetzwerkebene
DE112010003794B4 (de) Datenspeicherung unter Verwendung von Bitmaps
DE112015000710T5 (de) Verteiltes Speichersystem
DE102012218269B4 (de) Schnittstelle zur Verwaltung von Datenverschiebung in einem Speichersystem mit thin provisioning
DE112017000629T5 (de) Multi-Tenant-Arbeitsspeicherdienst für Architekturen mit Arbeitsspeicher-Pools
DE102020120553A1 (de) Virtuell persistente volumes für containerisierte anwendungen
DE10348326A1 (de) Permanentspeichervorrichtung, die an eine Kommunikationsverbindung angeschlossen ist
WO2008061897A2 (de) Verfahren und vorrichtung zur datenarchivierung durch vergleich von hash-werten
DE112011103290B4 (de) Intelligente Schreibcacheoperationen für sequenzielle Datenspuren
DE102009031923A1 (de) Verfahren zum Verwalten von Datenobjekten
DE112011101317T5 (de) Optimieren eines Dateisystems für unterschiedliche Typen von Anwendungen in einem Datenverarbeitungs-Cluster unter Verwendung von dynamischer Blockgrössen-Granularität
DE102013101863A1 (de) Hochverfügbares Hauptspeicher-Datenbanksystem, Arbeitsverfahren und deren Verwendungen
DE102012108103B4 (de) Arbeitsverfahren für ein Massenspeichersystem, Massenspeichersystem und Computerprogrammprodukt
EP2880534B1 (de) Hochverfügbares rechnersystem, arbeitsverfahren und dessen verwendung
US10838830B1 (en) Distributed log collector and report generation
DE112019000992T5 (de) Verwaltung virtueller Speicherlaufwerke in einem Datenspeichersystem

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0012000000

Ipc: G06F0012080000

R016 Response to examination communication
R084 Declaration of willingness to licence
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final
R081 Change of applicant/patentee

Owner name: FUJITSU LTD., KAWASAKI-SHI, JP

Free format text: FORMER OWNER: FUJITSU TECHNOLOGY SOLUTIONS INTELLECTUAL PROPERTY GMBH, 80807 MUENCHEN, DE

R082 Change of representative

Representative=s name: EPPING HERMANN FISCHER, PATENTANWALTSGESELLSCH, DE

Representative=s name: EPPING HERMANN FISCHER PATENTANWALTSGESELLSCHA, DE

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee