WO1997012366A2 - Ersatplatte für speichersystem mit gekoppelten festplatten - Google Patents

Ersatplatte für speichersystem mit gekoppelten festplatten Download PDF

Info

Publication number
WO1997012366A2
WO1997012366A2 PCT/DE1996/001846 DE9601846W WO9712366A2 WO 1997012366 A2 WO1997012366 A2 WO 1997012366A2 DE 9601846 W DE9601846 W DE 9601846W WO 9712366 A2 WO9712366 A2 WO 9712366A2
Authority
WO
WIPO (PCT)
Prior art keywords
hard disk
storage system
disk storage
disks
raid
Prior art date
Application number
PCT/DE1996/001846
Other languages
English (en)
French (fr)
Other versions
WO1997012366A3 (de
Inventor
Udo Fuhrmann
Original Assignee
Siemens Nixdorf Informationssysteme Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Nixdorf Informationssysteme Ag filed Critical Siemens Nixdorf Informationssysteme Ag
Publication of WO1997012366A2 publication Critical patent/WO1997012366A2/de
Publication of WO1997012366A3 publication Critical patent/WO1997012366A3/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/70Masking faults in memories by using spares or by reconfiguring
    • G11C29/74Masking faults in memories by using spares or by reconfiguring using duplex memories, i.e. using dual copies

Definitions

  • the invention relates to a hard disk storage system according to the preamble of claim 1.
  • Coupled hard disk storage systems with a plurality of exchangeable hard disks offer multiple advantages in terms of data security, permanent data availability and performance increase compared to non-coupled single hard disks.
  • RAID systems Redundant Array of Inexpensive Discs
  • the data to be stored is created in such a way that the RAID controller receives the data in the event of a disk defect (a disk of two, three, five, depending on the RAID level) can be reconstructed if necessary, with the result that the operation can be continued without interruption.
  • a disk defect a disk of two, three, five, depending on the RAID level
  • a defective hard disk can also be replaced during operation.
  • Another elegant backup option is provided by an additional hard disk as a so-called "hot spare", which is also constantly in operation as a spare disk and is virtually waiting for one of the hard disks intended for data storage to fail, in order to be able to jump in for them immediately, see for example Weekly & Technology weekly newspaper for electronics No. 50, December 9, 1994, pages 72 to 74.
  • the object of the invention is to further increase operational reliability in a hard disk storage system of the type mentioned at the beginning with replacement disks. This is achieved by the characterizing features of claim 1. After that, the drives for the replacement disks are not constantly in operation, which significantly reduces the probability of failure. In addition, the risk is reduced that the read / write heads which move only slightly during operation could stick. Instead, the functionality of the replacement disk is checked at predetermined intervals, so that, in an emergency, after the drive has started, it can be switched over to a functional and not already aged replacement disk.
  • the first functional test is expediently triggered when the storage system is activated and then repeated according to the predetermined time intervals.
  • the size of the time intervals is freely selectable.
  • the time intervals can be specified by operating elements of the computer arrangement, which are then transmitted to the higher-level control. Information about the drives and the respective test status can also be queried from the computer arrangement.
  • FIG. 1 shows a block diagram of a hard disk storage system
  • FIG. 2 shows a flow chart to explain the method of operation according to the invention.
  • FIG. 1 shows in the form of a block diagram the typical configuration of a hard disk arrangement according to RAID level 5 with the drives RAID-LW and the hard disks D-HD for data storage, all of which are connected to the bus system SCSI, which in turn is connected to the higher-level controller RAID-CTL is connected.
  • This higher-level control in turn forms an input / output control in a HOST computer arrangement the PC bus system PCI.
  • the mode of operation of such an arrangement in particular the control of the RAID-LW drives forming a logical unit with the coupled hard disks D-HD by the higher-level control RAID-CTL, is generally known.
  • This "RAID Level 5" configuration chosen as an example is supplemented by an additional drive HS-LW for a replacement disk E-HD.
  • this drive is not always in operation as a so-called "hot spare", but rather, as the flowchart in FIG. 2 shows, when the hard disk storage system is activated as a result of the supply voltage being applied the higher-level controller RAID-CTL started.
  • the HS-LW drive is then checked for functionality by executing predetermined positioning processes and writing and reading test data to the associated hard disk E-HD. If the test is positive, the drive HS-LW is switched off again and the expiry of the predetermined time interval until the next function test is monitored.
  • the adjustable time intervals for the functional tests can be, for example, between one hour and one month.
  • the setting can be made as part of the configuration software for the higher-level controller RAID-CTL. However, it is more advantageous to be able to make settings using the operating elements of the HOST computer arrangement. It is also expedient if information about the drives ...- LW and the respective test status can be queried from the computer arrangement, for example in order to be able to check which time interval has been set or when the last function test took place, etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

Bei RAID-Systeme bildenden Festplatten-Speichersystemen mit gekoppelten Festplatten und zusätzlichen Ersatzplatten, sind letztere nicht wie sogenannte 'Hot Spare' ständig in Betrieb, sondern sie werden in vorgegebenen Zeitabständen jeweils vorübergehend gestartet, um die Funktionsfähigkeit zu überprüfen. Im Fehlerfall stehen dann weniger abgenutzte Festplatten zur Verfügung, was die Betriebssicherheit erhöht.

Description

Beschreibung
Festplatten-Speichersystem mit gekoppelten Platten
Die Erfindung betrifft ein Festplatten-Speichersystem ent¬ sprechend dem Oberbegriff des Anspruches 1.
Gekoppelte Festplatten-Speichersysteme mit mehreren aus¬ tauschbaren Festplatten bieten hinsichtlich der Datensicher- heit, der permanenten Datenverfügbarkeit und der Leistungs¬ steigerung gegenüber nicht gekoppelten Einzelfestplatten vielfache Vorteile. Bei den sogenannten RAID-Systemen (Redundant Array of Inexpensive Discs) werden die zu spei¬ chernden Daten so angelegt, daß der RAID-Controller im Falle eines Plattendefekts (eine Platte von zwei, drei, fünf, je nach RAID-Level) die Daten bei Bedarf wieder rekonstruieren kann mit der Folge, daß der Betrieb unterbrechungsfrei wei¬ tergeführt werden kann. Sobald die defekte Platte gegen eine voll funktionsfähige Platte ausgetauscht wird, ist die volle Redundanz und Betriebssicherheit wieder hergestellt.
Der Austausch einer defekten Festplatte kann bei entsprechen¬ den Vorkehrungen auch im laufenden Betrieb erfolgen. Eine an¬ dere elegante Möglichkeit der Sicherung bietet eine zusätzli- ehe Festplatte als sogenannte "Hot Spare", die als Ersatz¬ platte ebenfalls ständig in Betrieb ist und quasi darauf war¬ tet, daß eine der für die Datenspeicherung vorgesehene Fest¬ platte ausfällt, um dann für diese sofort einspringen zu kön¬ nen, man siehe z.B. Markt & Technik-Wochenzeitung für Elek- tronik Nr. 50, 9.12.1994, Seiten 72 bis 74.
Aufgabe der Erfindung ist es, bei einem Festplatten- Speichersystem der eingangs genannten Art mit Ersatzplatten die Betriebssicherheit weiter zu erhöhen. Dies wird durch die kennzeichnenden Merkmale des Anspruches 1 erreicht. Danach sind die Laufwerke für die Ersatzplatten nicht ständig in Betrieb, wodurch die Ausfallwahrscheinlichkeit wesentlich verringert wird. Außerdem wird die Gefahr verringert, daß die bei laufendem Betrieb nur wenig bewegten Schreib-/Leseköpfe kleben könnten. Stattdessen wird die Ersatzplatte in vorgege¬ benen Abständen auf ihre Funktionsfähigkeit überprüft, so daß im Ernstfall nach Start des Laufwerkes auf eine funktionsfä¬ hige und nicht bereits gealterte Ersatzplatte umgesteuert werden kann.
Die erste Funktionsprüfung wird zweckmäßig beim Wirksamschal¬ ten des Speichersystems ausgelöst und dann entsprechend den vorgegebenen Zeitabständen wiederholt. Die Größe der Zeitab¬ stände ist dabei frei wählbar.
Die Vorgabe der Zeitabstände kann durch Bedienelemente der Rechneranordnung erfolgen, die dann an die übergeordnete Steuerung übertragen werden. Ebenso können Informationen über die Laufwerke und den jeweiligen Testzustand von der Rech- neranordnung aus abgefragt werden.
In der Zeichnung ist ein Ausführungsbeispiel der Erfindung dargestellt. Im einzelnen zeigen
FIG 1 ein Blockschaltbild eines Festplatten-Speichersystems und
FIG 2 ein Flußdiagramm zur Erläuterung der Arbeitsweise ge¬ mäß der Erfindung.
FIG 1 zeigt in Form eines Blockschaltbildes die typische Kon¬ figuration einer Festplattenanordnung nach RAID-Level-5 mit den Laufwerken RAID-LW und den Festplatten D-HD für die Da¬ tenspeicherung, die alle an das Bussystem SCSI angeschlossen sind, das wiederum mit der übergeordneten Steuerung RAID-CTL verbunden ist. Diese übergeordnete Steuerung bildet wiederum eine Ein-/AusgäbeSteuerung in einer Rechneranordnung HOST mit dem PC-Bussystem PCI. Die Arbeitsweise einer solchen Anord¬ nung, insbesondere die Steuerung der eine logische Einheit bildenden Laufwerke RAID-LW mit den gekoppelten Festplatten D-HD durch die übergeordnete Steuerung RAID-CTL, ist allge- mein bekannt.
Ergänzt wird diese lediglich als Beispiel gewählte "RAID- Level-5"-Konfiguration durch ein zusätzliches Laufwerk HS-LW für eine Ersatzplatte E-HD.
Dieses Laufwerk ist aber im Gegensatz zu den bekannten Anord¬ nungen nicht ständig als sogenannte "Hot Spare" im Betrieb, sondern es wird, wie das Flußdiagramm von FIG 2 zeigt, beim Wirksams-chalten des Festplatten-Speichersystems infolge Anle- gen der Versorgungsspannung durch die übergeordnete Steuerung RAID-CTL jeweils gestartet. Anschließend wird das Laufwerk HS-LW auf seine Funktionsfahigkeit überprüft, indem vorgege¬ bene Positioniervorgänge ausgeführt und Testdaten auf die zu¬ gehörige Festplatte E-HD geschrieben und wieder gelesen wer- den. Verläuft der Test positiv, wird das Laufwerk HS-LW wie¬ der ausgeschaltet und der Ablauf des vorgegebenen Zeitabstan¬ des bis zum nächsten Funktionstest überwacht.
Anstelle einer einzigen Ersatzplatte E-HD können auch mehrere Ersatzplatten mit ihren Laufwerken vorgesehen sein, die dann entweder alle gleichzeitig oder aber nacheinander gestartet und einem Funktionstest unterzogen werden.
Die einstellbaren Zeitabstände für die Funktionsprüfungen können beispielsweise eine Größe zwischen einer Stunde und einem Monat aufweisen. Die Einstellung kann im Rahmen der Konfigurationssoftware für die übergeordnete Steuerung RAID- CTL vorgenommen werden. Vorteilhafter ist aber eine Einstell- möglichkeit durch die Bedienelemente der Rechneranordnung HOST. Auch ist es zweckmäßig, wenn Informationen über die Laufwerke ...-LW und den jeweiligen Testzustand von der Rechneranord¬ nung aus abfragbar sind, beispielsweise um prüfen zu können, welcher Zeitabstand eingestellt ist, oder wann die letzte Funktionsprüfung stattgefunden hat usw.
Im Rahmen dieser Steuerungs- und Abfragemöglichkeiten kann dann ohne weiteres auch die Möglichkeit der Umschaltung zwi¬ schen den beiden möglichen Betriebsweisen für die Ersatzplat- ten geschaffen werden, nämlich als ständig mitlaufende "Hot Spare" oder als ruhende Reserve mit wiederholten Funkti¬ onsprüfungen.

Claims

Patentansprüche
1. Festplatten-Speichersystem (RAID) mit mehreren, eine logi¬ sche Einheit bildenden Laufwerken (..-LW) für gekoppelte Festplatten (..-HD), die über ein Bussystem (SCSI) an eine übergeordnete Steuerung (RAID-CTL) einer Rechneranordnung (HOST) angeschlossen sind, wobei neben den für die Datenspei¬ cherung benötigten Festplatten (D-HD) wenigstens eine zusätz¬ liche Festplatte als Ersatzplatte (E-HD) vorgesehen ist, die bei Ausfall einer der für die Datenspeicherung vorgesehenen Festplatten (D-HD) deren Speicherfunktion übernimmt, dadurch gekennzeichnet , daß Laufwerke (HS-LW) für Ersatzplatten (E-HD) im Gegensatz zu denen (RAID-LW) für die zur Datenspeicherung benötigten Festplatten (D-HD) nicht ständig in Betrieb sind, so daß sie im Fehlerfall erst von der übergeordneten Steuerung (RAID-CTL) zu starten sind, da¬ mit Daten gespeichert werden können, und daß bei fehlerfreiem Betrieb des Festplatten-Speichersystems die Laufwerke (RAID- LW) für Ersatzplatten (E-HD) lediglich in vorgegebenen Zeit- abständen zur Prüfung ihrer Funktionsfähigkeit gestartet wer¬ den, wobei bei festgestellter Funktionsunfähigkeit eine Feh¬ lermeldung erfolgt.
2. Festplatten-Speichersystem nach Anspruch 1, dadurch gekennzeichnet , daß die Prüfung auf Funkti¬ onsfähigkeit jeweils mit dem Wirksamschalten des Festplatten- Speichersystems ausgelöst und danach entsprechend den vorge¬ gebenen Zeitabständen wiederholt wird.
3. Festplatten-Speichersystem nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die Größe der Zeitab¬ stände frei wählbar ist.
4. Festplatten-Speichersystem nach einem der Ansprüche l bis 3, dadurch gekennzeichnet , daß die Größe für die Zeit- abstände von der Rechneranordnung (HOST) aus in der überge¬ ordneten Steuerung (RAID-CTL) einstellbar ist.
5. Festplatten-Speichersystem nach einem der Ansprüche l bis 4, dadurch gekennzeichnet, daß Informationen über die Laufwerke ( .. -LW) und den jeweiligen Testzustand von der Rechneranordnung (HOST) aus abfragbar sind.
PCT/DE1996/001846 1995-09-28 1996-09-26 Ersatplatte für speichersystem mit gekoppelten festplatten WO1997012366A2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19536232.2 1995-09-28
DE1995136232 DE19536232C1 (de) 1995-09-28 1995-09-28 Festplatten-Speichersystem mit gekoppelten Platten

Publications (2)

Publication Number Publication Date
WO1997012366A2 true WO1997012366A2 (de) 1997-04-03
WO1997012366A3 WO1997012366A3 (de) 2001-09-13

Family

ID=7773518

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/DE1996/001846 WO1997012366A2 (de) 1995-09-28 1996-09-26 Ersatplatte für speichersystem mit gekoppelten festplatten

Country Status (2)

Country Link
DE (1) DE19536232C1 (de)
WO (1) WO1997012366A2 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6609219B1 (en) * 2000-01-24 2003-08-19 Hewlett-Packard Development Company, L.P. Data corruption testing technique for a hierarchical storage system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0689146A (ja) * 1992-09-08 1994-03-29 Fujitsu Ltd ディスクアレイ装置のスタンバイディスク制御方法
US5423046A (en) * 1992-12-17 1995-06-06 International Business Machines Corporation High capacity data storage system using disk array

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0689146A (ja) * 1992-09-08 1994-03-29 Fujitsu Ltd ディスクアレイ装置のスタンバイディスク制御方法
US5423046A (en) * 1992-12-17 1995-06-06 International Business Machines Corporation High capacity data storage system using disk array

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JOURNAL OF PARALLEL AND DISTRIBUTED COMPUTING, Bd. 17, Nr. 1 / 02, 1.Januar 1993, Seiten 146-151, XP000343151 MANISH MALHOTRA ET AL: "RELIABILITY ANALYSIS OF REDUNDANT ARRAYS OF INEXPENSIVE DISKS" *
PATENT ABSTRACTS OF JAPAN vol. 018, no. 349 (P-1763), 30.Juni 1994 & JP 06 089146 A (FUJITSU LTD), 29.März 1994, *

Also Published As

Publication number Publication date
WO1997012366A3 (de) 2001-09-13
DE19536232C1 (de) 1996-10-24

Similar Documents

Publication Publication Date Title
DE4341510C2 (de) Vorrichtungen und Verfahren zum Beheben von Fehlern für ein Subsystem mit Verwendung von Magnetbandeinheiten
DE69631106T2 (de) On-line-Rekonfiguration einer Speicherplattenanordnung
US5862406A (en) Array recording system reporting completion of writing data operation prior to the completion of writing redundancy data in alternative recording units
DE69434381T2 (de) Verfahren zur Paritätsdarstellung in einem Raid-Untersystem unter Verwendung eines nichtflüchtigen Speichers
DE60304194T2 (de) Verfahren und vorrichtung zur tolerierung von mehreren abhängigen oder zwei beliebigen fehlern in einer speicherplattenanordnung
DE69937768T2 (de) Externe Speichervorrichtung und Verfahren zur Datensicherung
DE69738091T2 (de) Speicherplattenanordnung und Verfahren zu deren Steuerung
DE102005012448B4 (de) System und Verfahren zur Wiederherstellung eines Laufwerks nach einem Ausfall eines Laufwerks
DE19723909A1 (de) Verfahren zum Erzielen einer geteilten Paritätsersatzplatte in einem RAID-Untersystem
DE69934665T2 (de) Vorrichtung und verfahren zum gesicherten schreiben in einem plattencachespeicher für festplatten eines massenspeichersubsystems
EP0104635A2 (de) Verfahren und Anordnung zum Prüfen eines digitalen Rechners
DE102005012358A1 (de) Datenschutz unter Verwendung von Daten, die in Schnappschüsse verteilt sind
DE2450468C2 (de) Fehlerkorrekturanordnung für einen Speicher
DE3514079A1 (de) Ausfallsicherungskreis fuer ein steuerungssystem
DE19536232C1 (de) Festplatten-Speichersystem mit gekoppelten Platten
DE60008872T2 (de) Verfahren und vorrichtung zur automatischen reintegration eines moduls in ein rechnersystem
EP0141161A2 (de) Schaltungsanordnung zum Erkennen von statischen und dynamischen Fehlern in Schaltungsbaugruppen
DE4005321C2 (de)
DE19541651C1 (de) Schnelleinschaltungsverfahren
DE10225472A1 (de) Verfahren und Chipeinheit zum Überwachen des Betriebs einer Mikrocontrollereinheit
DE10051610B4 (de) Datenspeichersystem und Verfahren zum Testen desselben
DE2023117B2 (de) Ausfallsicheres Steuersystem zur UEbertragung von digitalen Informationen
DE19729579C2 (de) Verfahren zum Aktivieren einer redundanten Wortleitung bei Inter-Segment-Redundanz bei einem Halbleiterspeicher mit in Segmenten organisierten Wortleitungen
EP1861772B1 (de) Verfahren zum entfernen eines massenspeichersystems aus einem rechnerverbund sowie computerprogramm-produkt und rechnerverbund zur durchführung des verfahrens
WO1994022083A1 (de) Intelligente speicherplattenanordnung mit verringertem i/o transfer

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): US

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): AT BE CH DE DK ES FI FR GB GR IE IT LU MC NL PT SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase
AK Designated states

Kind code of ref document: A3

Designated state(s): US

AL Designated countries for regional patents

Kind code of ref document: A3

Designated state(s): AT BE CH DE DK ES FI FR GB GR IE IT LU MC NL PT SE