DE102016103451A1 - Verfahren für ein Computersystem und Computersystem - Google Patents

Verfahren für ein Computersystem und Computersystem Download PDF

Info

Publication number
DE102016103451A1
DE102016103451A1 DE102016103451.7A DE102016103451A DE102016103451A1 DE 102016103451 A1 DE102016103451 A1 DE 102016103451A1 DE 102016103451 A DE102016103451 A DE 102016103451A DE 102016103451 A1 DE102016103451 A1 DE 102016103451A1
Authority
DE
Germany
Prior art keywords
firmware
system components
redundant
computer system
system component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102016103451.7A
Other languages
English (en)
Inventor
Marco Paulsen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to DE102016103451.7A priority Critical patent/DE102016103451A1/de
Priority to GB1702813.5A priority patent/GB2559967A/en
Publication of DE102016103451A1 publication Critical patent/DE102016103451A1/de
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • G06F8/654Updates using techniques specially adapted for alterable solid state memories, e.g. for EEPROM or flash memories
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • G06F8/66Updates of program code stored in read-only memory [ROM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Quality & Reliability (AREA)
  • Hardware Redundancy (AREA)
  • Stored Programmes (AREA)

Abstract

Die Erfindung betrifft ein Verfahren für ein Computersystem (100) mit redundanten Systemkomponenten (101, 102) und einer Steuereinheit(103). Hierbei werden redundante Systemkomponenten (101, 102) erfasst. Es wird überprüft, ob eine Firmware der erfassten redundanten Systemkomponenten (101, 102) aktuell ist. Des Weiteren wird eine Systemkomponente (101, 102) aus den erfassten redundanten Systemkomponenten (101, 102) durch die Steuereinheit (103) zum Aktualisieren der Firmware der Systemkomponente (101, 102) ausgewählt, wenn der Schritt des Überprüfens für die ausgewählte Systemkomponente (101, 102) eine veraltete Firmware der Systemkomponente (101, 102) ergab. Die Firmware der Systemkomponente (101, 102) wird aktualisiert. Die Schritte des Auswählens und Aktualisierens werden für weitere der erfassten redundanten Systemkomponenten (101, 102) wiederholt. Die Erfindung betrifft des Weiteren ein Computersystem (100).

Description

  • Die Erfindung betrifft ein Verfahren für ein Computersystem mit redundanten Systemkomponenten und ein Computersystem mit redundanten Systemkomponenten.
  • Computersysteme, wie beispielsweise Server oder andere Computersysteme, die besonders ausfallsicher sein sollen, weisen häufig wichtige Systemkomponenten mehrfach auf. Mehrfach vorhandene Systemkomponenten werden als redundant bezeichnet. Weist ein Computersystem beispielsweise zwei Netzteile auf, so ist im Falle eines Ausfalls eines Netzteils das zweite Netzteil einsatzbereit und übernimmt die Leistungsversorgung des Computersystems.
  • Zum Betrieb von Systemkomponenten weisen Systemkomponenten in der Regel eine Firmware auf. Eine Firmware wird häufig auch noch von einem Hersteller weiter entwickelt, wenn bereits Computersysteme mit Systemkomponenten mit dieser Firmware ausgeliefert sind. Hierbei werden beispielsweise Fehler in der Firmware behoben oder die Firmware wird an neue Komponenten angepasst. Um eine Fehlerbehebung in bereits in Betrieb genommenen Computersystemen durchführen zu können, kann die Firmware der Systemkomponenten aktualisiert werden.
  • Eine Aktualisierung der Firmware in Computersystemen, die in Betrieb genommen sind, ist problematisch. Treten hierbei Fehler auf, so kann es zu Datenverlust kommen. Um dies zu vermeiden kann ein Techniker das Computersystem bzw. die Systemkomponenten, die zu aktualisieren sind, überwachen oder für die Dauer der Aktualisierung außer Betrieb nehmen. Dies ist jedoch nachteilig, weil entweder eine Überwachung durch den Techniker stattfinden muss oder das Computersystem für die Dauer der Aktualisierung der Firmware nicht verfügbar ist. Gerade in Rechenzentren kann dies problematisch sein.
  • Es ist Aufgabe der Erfindung, ein Verfahren für ein Computersystem und ein Computersystem aufzuzeigen, mit denen eine Aktualisierung der Firmware von Systemkomponenten verbessert wird.
  • Die Aufgabe wird gemäß einem ersten Aspekt durch ein Verfahren für ein Computersystem mit redundanten Systemkomponenten und einer Steuereinheit gelöst. Es werden redundante Systemkomponenten erfasst. Anschließend wird überprüft, ob eine Firmware der erfassten redundanten Systemkomponenten aktuell ist. Des Weiteren wird eine Systemkomponente aus den erfassten redundanten Systemkomponenten durch die Steuereinheit zum Aktualisieren der Firmware der Systemkomponente ausgewählt, wenn der Schritt des Überprüfens für die ausgewählte Systemkomponente eine veraltete Firmware der Systemkomponente ergab. Die Firmware der Systemkomponente wird aktualisiert. Die Schritte des Auswählens und Aktualisierens werden für weitere der erfassten redundanten Systemkomponenten wiederholt.
  • Die Steuereinheit übernimmt Funktionen bei der Aktualisierung der Firmware der Systemkomponenten. Die Steuereinheit kann eine Komponente zum Überwachen bzw. Steuern von Systemkomponenten des Computersystems sein, insbesondere ein sogenannter „baseboard management controller“, kurz BMC. Hierdurch wird das Anwesendsein eines Technikers überflüssig. Das Erfassen der redundanten Systemkomponenten kann beispielsweise durch die Steuereinheit durchgeführt werden, aber auch von einem Benutzer initialisiert sein. Das Auswählen der Systemkomponente wird während eines laufenden Betriebs des Computersystems ausgeführt. Hierbei wird die Redundanz der Systemkomponenten ausgenutzt, wodurch das Computersystem den laufenden Betrieb fortsetzen kann, obwohl eine Systemkomponente aktualisiert wird.
  • Dabei wird die gleichzeitige Aktualisierung aller redundanten Komponenten des gleichen Typs vermieden, wodurch das Ausfallrisiko des Gesamtsystems reduziert wird. Bei Auftreten eines Fehlers während der Aktualisierung der gewählten Komponente kann die nicht beeinflusste parallele redundante Komponente des gleichen Typs den Weiterbetrieb des Computersystems sicherstellen.
  • Das Auswählen der Systemkomponente umfasst hierbei das Bestimmen einer Systemkomponente, für die eine Aktualisierung der Firmware durchgeführt werden soll, aber zum Beispiel auch das Vorbereiten der Systemkomponente auf die Aktualisierung der Firmware. Dies kann ein außer Betrieb nehmen der Systemkomponente umfassen. Dies kann ebenso das Aktivieren einer anderen redundanten Systemkomponente als aktive Systemkomponente umfassen, so dass die Systemkomponente, deren Firmware aktualisiert werden soll, nicht mehr die aktive Systemkomponente ist.
  • Durch das Wiederholen der Schritte des Auswählens und Aktualisierens für weitere der erfassten redundanten Systemkomponenten werden automatisch mehrere, insbesondere alle, redundanten Systemkomponenten des Computersystems aktualisiert. Zusätzlich zu dem Wiederholen der Schritte des Auswählens und des Aktualisierens können auch der Schritt des Überprüfens und/oder der Schritt des Erfassens wiederholt werden.
  • Gemäß einer vorteilhaften Ausgestaltung umfasst der Schritt des Erfassens ein Erfassen aller redundanten Systemkomponenten eines vorbestimmten Typs. Der vorbestimmte Typ bezieht sich hierbei auf die Art der Systemkomponente. Beispielsweise ist ein Typ ein Netzteil, wie beispielsweise eine Leistungsversorgungseinheit (engl.: „power supply unit“, kurz: „PSU“). Weitere Typen können Festplatten, andere Speicherlaufwerke, Lüfter und andere Komponenten sein, die mehrfach im Computersystem verbaut sind. Das Erfassen bezieht sich hierbei beispielsweise auf das Erfassen aller Netzteile in dem Computersystem.
  • Gemäß einer alternativen Ausgestaltung umfasst der Schritt des Erfassens ein Erfassen aller redundanten Systemkomponenten mehrerer vorbestimmter Typen. Hierbei können durch Starten des Verfahrens mehr als ein Typ von Systemkomponenten erfasst werden. So werden beispielsweise alle PSU, alle Speicherlaufwerke und alle Lüfter in den erläuterten Schritt des Erfassens einbezogen.
  • Gemäß einer vorteilhaften Ausgestaltung wird der folgende Schritt vor dem Schritt des Aktualisierens der Firmware durchgeführt:
    • – Durchführen einer Fehlererfassung von Fehlern des Computersystems und Abbrechen des Verfahrens, wenn kritische Fehler erfasst sind.
  • Eine Überprüfung und eine Erkennung von Fehlern des Computersystems vor der Aktualisierung der Firmware einer erfassten redundanten Systemkomponente erhöht die Sicherheit, insbesondere die Ausfallsicherheit des Verfahrens. So kann das Computersystem beispielsweise vor einem Datenverlust im Falle eines Absturzes bewahrt werden.
  • Gemäß einer weiteren vorteilhaften Ausgestaltung umfasst der Schritt des Wiederholens ein Wiederholen des Schritts des Durchführens der Fehlererfassung. Werden mehrere redundante Systemkomponenten aktualisiert, indem Schritte des Verfahrens wiederholt ausgeführt werden, so bietet das Durchführen der Fehlerfassung vor jeder Aktualisierung einer redundanten Systemkomponente die oben beschriebene Sicherheit für alle Wiederholungen. Insbesondere kann dadurch erkannt werden, ob eine zuvor durchgeführte Aktualisierung fehlerfrei durchgeführt worden ist.
  • Gemäß einer weiteren vorteilhaften Ausgestaltung wird der folgende Schritt nach dem Schritt des Aktualisierens durchgeführt:
    • – Ausführen einer Abschlussverifikation der Aktualisierung der Firmware, umfassend ein Erzeugen einer Bestätigung des Aktualisierens durch die Systemkomponente und/oder ein Neustarten der redundanten Systemkomponente oder des Computersystems.
  • Je nach Art der Aktualisierung der Firmware kann es nötig sein, dass die aktualisierte Systemkomponente oder das Computersystemen neu gestartet werden müssen. In anderen Fällen kann es sein dass das Setzen einer Bestätigungsflagge in einem Speicher oder der Steuereinheit ausreichen, wodurch eine Bestätigung des Aktualisierens erzeugt wird. Vorteilhaft kann ein Neustart des Computerystems auch über mehrere Zyklen der Aktualisierung von redundanten Systemkomponenten verzögert werden.
  • Gemäß einer weiteren vorteilhaften Ausgestaltung umfasst der Schritt des Erfassens ein Erzeugen einer Liste von redundanten Systemkomponenten oder ein Auslesen einer Liste von redundanten Systemkomponenten aus einem Speicherbaustein. Das Auswählen der Systemkomponente umfasst hierbei ein Auswählen einer Systemkomponente aus dieser Liste.
  • Eine Liste kann in einem Speicherbaustein abgespeichert werden, sodass die Steuereinheit anschließend einzelne Inhalte der Liste abarbeiten kann. Die Liste kann hierbei Steuerdaten und/oder Gerätedaten der redundanten Systemkomponenten umfassen, die nötig sind, um eine Systemkomponente anzusprechen. Die Liste kann im laufenden Betrieb des Computersystems von der Steuereinheit gespeichert werden.
  • Gemäß einer weiteren vorteilhaften Ausgestaltung umfasst das Erzeugen der Liste ein Erstellen einer Reihenfolge der redundanten Systemkomponenten, die auf einer Auslastung der erfassten redundanten Systemkomponenten basiert. Werden beispielsweise zwei Netzteile (PSU) gleichzeitig betrieben, und ein Netzteil wird mehr ausgelastet als das andere Netzteil, so kann beispielsweise das weniger ausgelastete Netzteil zur Aktualisierung der Firmware ausgewählt werden. Das stärker ausgelastete Netzteil kann seine Arbeit fortsetzen.
  • Gemäß einem zweiten Aspekt Erfindung wird die Aufgabe durch ein Computersystem mit redundanten Systemkomponenten und einer Steuereinheit gelöst. Das Computersystem ist dazu eingerichtet, ein Verfahren der oben erläuterten Art auszuführen.
  • Sämtliche maßnahmen, Aspekte und Vorteile des oben beschriebenen Verfahrens können sich in strukturellen Merkmalen, Aspekten und Vorteilen des hier erläuterten Computersystems äußern und umgekehrt.
  • Gemäß einer vorteilhaften Ausgestaltung umfasst das Computersystem einen Speicherbaustein und einen Datennetzwerkanschluss. Die Steuereinheit ist dazu eingerichtet, über den Datennetzwerkanschluss Firmwaredaten für das Aktualisieren der Firmware in den Speicher herunterzuladen.
  • Die Erfindung wird im Folgenden anhand von Ausführungsbeispielen und den Figuren näher erläutert. In den Figuren zeigen:
  • 1 ein Computersystem gemäß einer Ausgestaltung der Erfindung und
  • 2 ein Flussdiagramm für ein Verfahren gemäß Ausgestaltungen der Erfindung.
  • 1 zeigt ein Computersystem 100. Im Ausführungsbeispiel ist das Computersystem 100 ein Server, wie beispielsweise ein Einschubserver. Solche Computersysteme sollen eine hohe Ausfallsicherheit aufweisen. Hierfür werden Systemkomponenten mehrfach, d.h. redundant in das Computersystem 100 eingebaut. Beispielsweise sind in dem Computersystem 100 zwei Leistungsversorgungseinheiten, d.h. Netzteile, sogenannte „PSU“, als redundante Systemkomponenten 101 eingebaut. Die Leistungsversorgungseinheiten sichern sich gegenseitig ab. Im Ausführungsbeispiel sind des Weiteren vier Festplatten als redundante Systemkomponenten 102 eingebaut. Die redundanten Systemkomponenten 102 sind beispielsweise als RAID (ein RAID ist eine redundante Anordnung unabhängiger Festplatten, engl.: “redundant array of independent disks“) verschaltet. Hierbei sind Daten auf unterschiedliche Festplatten aufgeteilt. Fällt nun eine redundante Systemkomponente 101, 102 aus, so kann eine andere redundante Systemkomponente 101, 102 die Funktionen der ausgefallenen redundanten Systemkomponente 101, 102 vollständig übernehmen.
  • Die redundanten Systemkomponenten 101, 102 werden mit einer Firmware betrieben. Hierfür ist jeweils in den Systemkomponenten 101 eine erste Firmware 106 gespeichert. In den Systemkomponenten 102 ist eine zweite Firmware 107 gespeichert. Im Betrieb der redundanten Systemkomponenten 101, 102 wird die jeweilige Firmware 106, 107 durch die redundanten Systemkomponenten 101, 102 ausgeführt. Ebenso können die Firmwares in einem oder mehreren Speicherbausteinen gespeichert sein, die nicht in den Systemkomponenten 101, 102 angeordnet sind und die Systemkomponeten 101, 102 über eine Datenleitung, wie eine Busleitung betreiben.
  • Das Computersystem 100 weist eine Steuereinheit 103 auf. Die Steuereinheit 103 ist im Ausführungsbeispiel ein Managementcontroller, insbesondere ein sogenannter „baseboard management controller“, kurz BMC, wie ein „integrated remote management controller“, kurz iRMC. Die Steuereinheit 103 ist mit den Systemkomponenten 101, 102 durch Busleitungen 104 verbunden. Über die Busleitungen 104 kann die Steuereinheit 103 mit den Systemkomponenten 101, 102 kommunizieren. Beispielsweise kann die Steuereinheit 103 einzelne Systemkomponenten 101, 102 erkennen und steuern.
  • Das Computersystem 100 weist einen Speicherbaustein 105 auf. Der Speicherbaustein 105 ist mit der Steuereinheit 103 verbunden. Die Steuereinheit 103 kann Daten in den Speicherbaustein 105 schreiben und aus dem Speicherbaustein 105 auslesen. In dem Speicherbaustein 105 sind die erste Firmware 106 und die zweite Firmware 107 gespeichert. Die gespeicherten Firmwares 106, 107 dienen als Back-up und als Referenz bei einer Aktualisierung der Firmwares der redundanten Systemkomponenten 101, 102. In einer alternativen Ausgestaltung sind in dem Speicherbaustein 105 anstatt der ersten Firmware 106 und der zweiten Firmware 107 lediglich Informationen über die erste Firmware 106 und die zweite Firmware 107 gespeichert. Die Informationen umfassen hierbei Daten, die auf die Aktualität der jeweiligen Firmware schließen lassen. Beispielsweise ist ein Erstellungsdatum der Firmware hinterlegt. In dieser Ausgestaltung sind zusätzlich die erste Firmware 106 und die zweite Firmware 107 in einem separaten Speicherbaustein (nicht dargestellt) jeweils in den Systemkomponenten 101 und in den Systemkomponenten 102 gespeichert und bestimmen deren Betrieb.
  • Das Computersystem 100 weist eine Datennetzwerkschnittstelle 108 auf. Über die Datennetzwerkschnittstelle 108 kann das Computersystem 100 eine Verbindung zu einem Datennetzwerk aufbauen. Beispielsweise kann das Computersystem 100 so über das Internet mit einem weiteren Server oder einem PC kommuniziert. Die Steuereinheit 103 ist mit der Datennetzwerkschnittstelle 108 verbunden. Die Steuereinheit 103 kann so über das Datennetzwerk kommunizieren, zum Beispiel um eine aktualisierte Firmware herunterzuladen oder Aktualisierungsbefehle zu empfangen.
  • In 2 ist ein Flussdiagramm 200 für ein Verfahren für das oben beschriebene Computersystem 100 dargestellt.
  • In einem ersten Schritt 201 wird eine Aktualisierungsaufforderung von der Steuereinheit 103 empfangen. Die Aktualisierungsaufforderung wird hierbei über die Datennetzwerkschnittstelle 108 empfangen. In einer weiteren Ausgestaltung wird die Aktualisierungsaufforderung lokal durch eine Benutzereingabe oder ein zeitgesteuertes Ereignis empfangen.
  • Die Steuereinheit 103 erfasst im Schritt 202 redundante Systemkomponenten 101, 102 des Computersystems 100. Im Ausführungsbeispiel erfasst die Steuereinheit 103 die Systemkomponenten 101, 102 über die Busleitungen 104. Die erfassten Systemkomponenten 101, 102 werden von der Steuereinheit 103 in einer Liste gespeichert. Beispielsweise wird die Liste in dem Speicherbaustein 105 gespeichert. Alternativ kann die Liste auch in einem anderen Speicherbaustein gespeichert werden. In einer alternativen Ausgestaltung erfasst der Steuereinheit 103 die Systemkomponenten 101, 102 durch Auslesen einer Liste aus einem Speicherbaustein. Der Speicherbaustein kann hierbei der Speicherbaustein 105 sein, aber ebenso ein anderer Speicherbaustein, wie beispielsweise ein BIOS-Speicherbaustein. Die Liste, die von der Steuereinheit 103 ausgelesen wird, kann eine benutzergenerierte Liste oder eine durch ein BIOS oder ein anderes Computerprogramm erstellte Liste sein. In einer weiteren alternativen Ausgestaltung empfängt die Steuereinheit 103 eine Liste der redundanten Systemkomponenten 101, 102 über die Datennetzwerkschnittstelle 108.
  • In einer weiteren Ausgestaltung erfasst die Steuereinheit 103 alle Systemkomponenten des Computersystems 100, also auch nichtredundante. Durch eine Abgleich von Gerätedaten jeder einzelnen Systemkomponente erkennt die Steuereinheit 103 welche Systemkomponenten redundant vorhanden sind.
  • Nach dem Schritt 202, dem Erfassen der redundanten Systemkomponenten 101, 102, liegt eine Liste von redundanten Systemkomponenten 101, 102 vor, die von der Steuereinheit 103 ausgelesen und abgearbeitet werden kann.
  • In einem Schritt 203 wird ein Status der Systemkomponenten 101, 102 überprüft. Hierbei wird überprüft, ob die jeweilige Systemkomponente 101, 102 aktiv ist oder sich beispielsweise in einem Ruhezustand befindet oder ausgeschaltet ist. Ebenso kann überprüft werden, ob und, falls ja, wie sehr die Systemkomponente 101, 102 ausgelastet ist. Die Auslastung bezieht sich hierbei auf ein charakteristisches Merkmal der jeweiligen Systemkomponente 101, 102. Eine Leistungsversorgungseinheit, wie eine PSU, wird beispielsweise auf eine Leistungsabgabe hin überprüft. Eine Festplatte wird beispielsweise auf Schreib- und/oder Lesezugriffe hin überprüft. Bei einem Lüfter wird beispielsweise eine Anzahl der Umdrehungen pro Minute überprüft.
  • In einer alternativen Ausgestaltung wird die Auslastung jeder Systemkomponente 101, 102 im Schritt 202 beim Erfassen der Systemkomponenten 101, 102 überprüft. Das Erstellen der Liste kann dann auf der Auslastung der Systemkomponenten 101, 102 basieren. Beispielsweise werden weniger ausgelastete Systemkomponenten 101, 102 vor stärker ausgelasteten Systemkomponenten 101, 102 aufgeführt, was zu einer priorisierten Abarbeitung der weniger ausgelasteten Systemkomponenten 101, 102 führt. Hierbei kann auch eine Ordnung des Typs der Systemkomponenten 101, 102 beibehalten werden. Beispielsweise werden Netzteile untereinander sortiert und Festplatten werden separat untereinander sortiert.
  • In Schritt 204 wird das Computersystem 100 auf vorhandene Fehler hin überprüft. Die Überprüfung umfasst hierbei beispielsweise Softwarefehler, wie nicht reagierende Programme, insbesondere ein nicht reagierendes Betriebssystem oder nicht ansprechbare Systemkomponenten 101, 102. Wird ein Fehler erkannt, der einer Aktualisierung einer Firmware entgegensteht, so wird das Verfahren in Schritt 210 abgebrochen und beispielsweise eine Fehlermeldung ausgegeben. Die Fehlermeldung kann hierbei auf einem mit dem Computersystem 100 verbunden Monitor und auch über die Datennetzwerkschnittstelle 108 ausgegeben werden. Werden keine Fehler in dem Computersystem 100 erkannt, die einer Aktualisierung der Firmware der erfassten redundanten Systemkomponenten 101, 102 entgegenstehen, so wird das Verfahren in Schritt 205 fortgesetzt.
  • Im Schritt 205 wird überprüft, ob eine Firmware der erfassten redundanten Systemkomponenten 101, 102 aktuell ist. Hierfür wird die Versionsnummer der Firmware der Systemkomponenten 101, 102 mit einer Versionsnummer einer neuen Firmware verglichen. Die neue Firmware wird hierfür entweder auf einem externen Server überprüft und nur heruntergeladen, wenn eine Aktualisierung notwendig ist oder erst heruntergeladen und dann überprüft. Im beschriebenen Ausführungsbeispiel wird jeweils eine Firmware eines Typs von Systemkomponenten 101, 102 mit einer neuen Firmware verglichen. Beispielsweise wird eine gespeicherte Firmware von Festplatten mit einer neuen Firmware für Festplatten verglichen. In einer alternativen Ausgestaltung wird jeweils die Firmware einer einzelnen Systemkomponente 101, 102 mit einer neuen Firmware verglichen. Beispielsweise wird für eine erste Festplatte ein Vergleich durchgeführt, anschließend wird für eine zweite Festplatte ein Vergleich durchgeführt, usw. Wird im Schritt 205 festgestellt, dass keine Aktualisierung einer Firmware nötig ist, wird das Verfahren in Schritt 210 beendet. Hierbei kann eine Benachrichtigung erzeugt werden. Die Benachrichtigung kann über die Datennetzwerkschnittstelle 108 gesendet werden. Ebenso kann die Benachrichtigung auf einem Monitor angezeigt werden oder in einem BIOS eingetragen werden.
  • Ergibt die Überprüfung im Schritt 205, dass eine Aktualisierung einer Firmware nötig ist, so wird anschließend im Schritt 206 überprüft, ob eine Aktualisierung der Firmware für die redundante Systemkomponente 101, 102, bzw. den Typ der Systemkomponente 101, 102 möglich ist. Diese Überprüfung umfasst beispielsweise eine Auslastung der Systemkomponente 101, 102, die aktualisiert werden soll. Ebenso kann überprüft werden, ob die Systemkomponente 101, 102, die aktualisiert werden soll, ausgeschaltet bzw. inaktiv werden kann. Ist die Überprüfung negativ, d.h. wenn eine Aktualisierung der Firmware der entsprechenden Systemkomponente 101, 102 zu einem Fehler im Computersystem 100 oder einem Ausfall des Computersystems 100 führen würde, so wird das Verfahren in Schritt 210 abgebrochen. Optional kann ebenso eine Benachrichtigung hierüber erzeugt werden, wie im Schritt 205. In einer alternativen Ausgestaltung, in der die redundanten Systemkomponenten 101, 102 typweise zusammengefasst werden, wird statt einem Abbruch des Verfahrens in Schritt 210 der nächste Typ von Systemkomponenten 101, 102 ausgewählt und das Verfahren fortgesetzt.
  • Ergab die Überprüfung im Schritt 206, dass eine Aktualisierung der Firmware der entsprechenden Systemkomponenten 101, 102 möglich ist, so wird im Schritt 207 eine Systemkomponente 101, 102 zur Aktualisierung der Firmware ausgewählt. Anders ausgedrückt wird eine Firmware einer Systemkomponente 101, 102 zur Aktualisierung ausgewählt. Die Auswahl folgt hierbei gemäß der erzeugten Liste der erfassten redundanten Systemkomponenten 101, 102, wie oben erläutert. Die Auswahl basiert somit auf der Grundlage eines oder mehrerer zuvor festgelegter Kriterien, beispielsweise der Auslastung oder der physikalischen Reihenfolge der redundanten Systemkomponenten 101, 102 im Computersystem 100. Die Auswahl wird durch die Steuereinheit 103 durchgeführt. Die Steuereinheit 103 ergreift bei der Auswahl der Systemkomponente 101, 102, die aktualisiert werden soll, alle notwendigen Schritte, die eine Aktualisierung der Firmware für diese Systemkomponente 101, 102 erfordern. Beispielsweise wird eine Funktionalität der Systemkomponente 101, 102, die aktualisiert werden soll, zuvor auf die redundante Systemkomponente 101, 102 übertragen, welche nicht aktualisiert werden soll.
  • Das Computersystem 100 kann so den laufenden Betrieb uneingeschränkt fortführen. Aufgrund der Redundanz der Systemkomponenten 101, 102 fällt während der Aktualisierung der Firmware der jeweiligen Systemkomponente 101, 102 keine Funktion, die für den Betrieb des Computersystems 100 notwendig ist aus.
  • Im Schritt 208 wird die Firmware der im Schritt 207 ausgewählten Systemkomponente 101, 102 aktualisiert. Die Aktualisierung wird hierbei von der Steuereinheit 103 initialisiert. Die Durchführung der Aktualisierung der Firmware wird von der Steuereinheit 103 über eine Schnittstelle der ausgewählten redundanten Systemkomponente 101, 102, insbesondere über deren Komponenteninterface, ausgeführt. In einer alternativen Ausgestaltung wird nach einer Initialisierung der Aktualisierung durch die Steuereinheit 103 die Aktualisierung der Firmware durch die Systemkomponente 101, 102 selbst durchgeführt.
  • In Schritt 209 wird eine Abschlussverifikation der Aktualisierung der Firmware durchgeführt. Die Abschlussverifikation umfasst hierbei die notwendigen Schritte, um die Systemkomponente 101, 102, die aktualisiert wurde, wieder voll funktionsfähig zu machen. Im Ausführungsbeispiel wird zur Abschlussverifikation eine Bestätigung erzeugt, die in einem BIOS eingetragen wird. In weiteren Ausgestaltungen kann die Bestätigung des Aktualisierens zusätzlich oder alternativ über die Datennetzwerkschnittstelle 108 gesendet werden. In weiteren Ausgestaltungen umfasst die Abschlussverifikation zusätzlich oder alternativ das Neustarten der aktualisierten, ausgewählten, redundanten Systemkomponente 101, 102 oder des gesamten Computersystems 100.
  • Das Verfahren wird so lange wiederholt, bis alle redundanten Systemkomponenten 101, 102, für die eine aktualisierte Firmware bereitsteht, aktualisiert worden sind, falls das Verfahren nicht vorher (beispielsweise in den Schritten 204, 205 oder 206) beendet oder abgebrochen wurde.
  • Für die Wiederholung des Verfahrens werden wenigstens die Schritte 207, 208 und 209 wiederholt ausgeführt. In alternativen Ausgestaltungen werden zusätzlich weitere Schritte wiederholt. Eine Wiederholung kann nach jedem der Schritte 201 bis 206 beginnen. Aufgrund der automatischen Ausführung der Verfahrensschritte durch die Steuereinheit 103 kann das Verfahren vollautomatisch durchlaufen werden. Wurde einmal eine Aufforderung für eine Aktualisierung in Schritt 201 empfangen, so ist ein Start einer Wiederholung des Verfahrens mit jedem der folgenden Schritte 202 bis 207 denkbar. Beispielsweise erhöht die Wiederholung einer Fehlererkennung im Schritt 204 die Ausfallsicherheit des Computersystems 100 weiter.
  • In einer weiteren Ausgestaltung wird der Schritt 207 vor dem Schritt 205 ausgeführt. Hierbei wird zuerst eine Systemkomponente 101, 102 ausgewählt, die aktualisierbar ist. Im Anschluss hieran wird dann überprüft, ob für diese Systemkomponente 101, 102 eine aktualisierte Firmware bereit steht. Die Firmwares werden wie oben beschrieben beispielsweise anhand einer Firmwareversion abgeglichen. Ist bei der ausgewählten Systemkomponente 101, 102 keine Aktualisierung nötig, so wird das Verfahren mit der nächsten Systemkomponente 101, 102 fortgesetzt und wiederholt, wie oben beschrieben. Die Reihenfolge der Schritte wird bei den Wiederholungen entsprechend dieser Ausgestaltung beibehalten, sodass das Auswählen vor dem Überprüfen vorgenommen wird,
  • Bezugszeichenliste
  • 100
    Computersystem
    101, 102
    Systemkomponente
    103
    Steuereinheit
    104
    Busleitung
    105
    Speicherbaustein
    106
    erste Firmware
    107
    zweite Firmware
    108
    Datennetzwerkschnittstelle
    200
    Flussdiagramm
    201 bis 210
    Verfahrensschritte

Claims (10)

  1. Verfahren für ein Computersystem (100) mit redundanten Systemkomponenten (101, 102) und einer Steuereinheit(103), wobei die folgenden Schritte ausgeführt werden: – Erfassen redundanter Systemkomponenten (101, 102); – Überprüfen, ob eine Firmware der erfassten redundanten Systemkomponenten (101, 102) aktuell ist; – Auswählen einer Systemkomponente (101, 102) aus den erfassten redundanten Systemkomponenten (101, 102) durch die Steuereinheit (103) zum Aktualisieren der Firmware der Systemkomponente (101, 102), wenn der Schritt des Überprüfens für die ausgewählte Systemkomponente (101, 102) eine veraltete Firmware der Systemkomponente (101, 102) ergab; – Aktualisieren der Firmware der Systemkomponente (101, 102); – Wiederholen der Schritte des Auswählens und Aktualisierens für weitere der erfassten redundanten Systemkomponenten (101, 102).
  2. Verfahren nach Anspruch 1, wobei der Schritt des Erfassens ein Erfassen aller redundanten Systemkomponenten (101, 102) eines vorbestimmten Typs umfasst.
  3. Verfahren nach Anspruch 1, wobei der Schritt des Erfassens ein Erfassen aller redundanten Systemkomponenten (101, 102) mehrerer vorbestimmter Typen umfasst.
  4. Verfahren nach einem der Ansprüche 1 bis 3, wobei der folgende Schritt vor dem Schritt des Aktualisierens der Firmware durchgeführt wird: – Durchführen einer Fehlererfassung von Fehlern des Computersystems (100) und Abbrechen des Verfahrens, wenn kritische Fehler erfasst sind.
  5. Verfahren nach Anspruch 4, wobei der Schritt des Wiederholens ein Wiederholen des Schritts des Durchführens der Fehlererfassung umfasst.
  6. Verfahren nach einem der Ansprüche 1 bis 5, wobei der folgende Schritt nach dem Schritt des Aktualisierens durchgeführt wird: – Ausführen einer Abschlussverifikation der Aktualisierung der Firmware, umfassend ein Erzeugen einer Bestätigung des Aktualisierens durch die Systemkomponente (101, 102) und/oder ein Neustarten der Systemkomponente (101, 102) oder des Computersystems (100).
  7. Verfahren nach einem der Ansprüche 1 bis 6, wobei der Schritt des Erfassens ein Erzeugen einer Liste von Systemkomponenten (101, 102) oder ein Auslesen einer Liste von Systemkomponenten (101, 102) aus einem Speicherbaustein (105) umfasst und wobei das Auswählen der Systemkomponente (101, 102) ein Auswählen einer Systemkomponente (101, 102) aus dieser Liste umfasst.
  8. Verfahren nach Anspruch 7, wobei das Erzeugen der Liste ein Erstellen einer Reihenfolge umfasst, die auf einer Auslastung der erfassten redundanten Systemkomponenten (101, 102) basiert.
  9. Computersystem (100) mit redundanten Systemkomponenten (101, 102) und einer Steuereinheit (103), wobei das Computersystem (100) dazu eingerichtet ist, ein Verfahren nach einem der Ansprüche 1 bis 8 auszuführen.
  10. Computersystem (100) nach Anspruch 9, wobei das Computersystem (100) einen Speicherbaustein (105) und einen Datennetzwerkanschluss (108) umfasst, und wobei die Steuereinheit (103) dazu eingerichtet ist, über den Datennetzwerkanschluss (108) Firmwaredaten für das Aktualisieren der Firmware in den Speicherbaustein (105) herunterzuladen.
DE102016103451.7A 2016-02-26 2016-02-26 Verfahren für ein Computersystem und Computersystem Ceased DE102016103451A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102016103451.7A DE102016103451A1 (de) 2016-02-26 2016-02-26 Verfahren für ein Computersystem und Computersystem
GB1702813.5A GB2559967A (en) 2016-02-26 2017-02-21 Method for a computer system and computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102016103451.7A DE102016103451A1 (de) 2016-02-26 2016-02-26 Verfahren für ein Computersystem und Computersystem

Publications (1)

Publication Number Publication Date
DE102016103451A1 true DE102016103451A1 (de) 2017-09-14

Family

ID=58486843

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102016103451.7A Ceased DE102016103451A1 (de) 2016-02-26 2016-02-26 Verfahren für ein Computersystem und Computersystem

Country Status (2)

Country Link
DE (1) DE102016103451A1 (de)
GB (1) GB2559967A (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4198712A1 (de) * 2022-12-16 2023-06-21 Pfeiffer Vacuum Technology AG Vakuumsystem und verfahren zum betreiben eines solchen

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100199272A1 (en) * 2009-02-05 2010-08-05 International Business Machines Corporation Updating firmware without disrupting service
US20150331687A1 (en) * 2014-05-19 2015-11-19 International Business Machines Corporation Reducing storage facility code load suspend rate by redundancy check

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6836859B2 (en) * 2001-08-15 2004-12-28 Sun Microsystems, Inc. Method and system for version control in a fault tolerant system
US7231493B2 (en) * 2004-01-09 2007-06-12 Dell Products L.P. System and method for updating firmware of a storage drive in a storage network
US8108853B2 (en) * 2006-05-05 2012-01-31 Honeywell International Inc. Apparatus and method for allowing a fail-back to a prior software release in a process control system
JP2008217201A (ja) * 2007-03-01 2008-09-18 Nec Corp 自動アップデート方法
US9098376B2 (en) * 2009-10-30 2015-08-04 Cleversafe, Inc. Distributed storage network for modification of a data object
US8726261B2 (en) * 2011-04-06 2014-05-13 Hewlett-Packard Development Company, L.P. Zero downtime hard disk firmware update

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100199272A1 (en) * 2009-02-05 2010-08-05 International Business Machines Corporation Updating firmware without disrupting service
US20150331687A1 (en) * 2014-05-19 2015-11-19 International Business Machines Corporation Reducing storage facility code load suspend rate by redundancy check

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4198712A1 (de) * 2022-12-16 2023-06-21 Pfeiffer Vacuum Technology AG Vakuumsystem und verfahren zum betreiben eines solchen

Also Published As

Publication number Publication date
GB2559967A (en) 2018-08-29
GB201702813D0 (en) 2017-04-05

Similar Documents

Publication Publication Date Title
DE102006048115B4 (de) System und Verfahren zum Aufzeichnen von behebbaren Fehlern
DE69435090T2 (de) Rechnersystem mit Steuereinheiten und Rechnerelementen
DE112011100112B4 (de) Pufferspeicher-platte in blitzkopie-kaskade
EP1903436B1 (de) Computersystem und Verfahren zum Aktualisieren von Programmcode
DE10255111A1 (de) System und Verfahren zum Laden von Firmware mit hoher Verfügbarkeit
EP2466466B1 (de) Verfahren zur Fehlererkennung bei der Ausführung eines Echtzeit-Betriebssystems
DE102012109614A1 (de) Fehlerbehebung bei Stapel-Korruption in eingebetteten Softwaresystemen
DE102011075776A1 (de) Verfahren und System zum Aktualisieren eines gemeinsam genutzten Speichers
DE102010043011A1 (de) Parallele Programmierung und Aktualisierung von Gebäudetechnik-Busteilnehmern
DE102015107671A1 (de) Steuerung und Diagnose einer Steuerungs-Wakeup-Funktionalität
DE102011102425A1 (de) Simultanes Softwareupdate
DE112017000210T5 (de) Selbstdiagnose von gerätetreiberdetektierten Fehlern und automatische Diagnosedatensammlung
DE68922440T2 (de) Gerät und Verfahren zur gleichzeitigen Einreichung von Fehlerunterbrechung und Fehlerdaten zu einem Unterstützungsprozessor.
DE10254410A1 (de) System und Verfahren für ein Laden einer Hochverfügbarkeits-Firmware
DE112013000330T5 (de) In-Situ-Neubewertung von Prozessoren
DE112013007469B4 (de) Kommunikationssystem, Standby-Vorrichtung, Kommunikationsverfahren, und Standby-Programm
DE112006003504T5 (de) Detektion von Cachespeicher-Disassoziierung
DE112019007432T5 (de) Elektronische steuereinheit und programm
EP2732369B1 (de) Computersystem, verfahren zum starten eines server-computers, server-computer, managementstation und verwendung
DE60319548T2 (de) Handhabung eines knotenadressenausfalls in einem verteilten knotensystem von prozessoren
EP3353650A1 (de) System und verfahren zur verteilung und/oder aktualisierung von software in vernetzten steuereinrichtungen eines fahrzeugs
DE102012217312B4 (de) Verfahren und System zur Aktualisierung von Code in Verarbeitungssystemen
DE102018211730A1 (de) Technologien für kopflose Serververwaltbarkeit und autonomes Logging
DE102016103451A1 (de) Verfahren für ein Computersystem und Computersystem
DE60008872T2 (de) Verfahren und vorrichtung zur automatischen reintegration eines moduls in ein rechnersystem

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R082 Change of representative

Representative=s name: EPPING HERMANN FISCHER, PATENTANWALTSGESELLSCH, DE

Representative=s name: EPPING HERMANN FISCHER PATENTANWALTSGESELLSCHA, DE

R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final