DE102012220713A1 - Verhindern von durch Störungen verursachte Ausfällen in einem Computersystem - Google Patents

Verhindern von durch Störungen verursachte Ausfällen in einem Computersystem Download PDF

Info

Publication number
DE102012220713A1
DE102012220713A1 DE102012220713A DE102012220713A DE102012220713A1 DE 102012220713 A1 DE102012220713 A1 DE 102012220713A1 DE 102012220713 A DE102012220713 A DE 102012220713A DE 102012220713 A DE102012220713 A DE 102012220713A DE 102012220713 A1 DE102012220713 A1 DE 102012220713A1
Authority
DE
Germany
Prior art keywords
computer
acceleration data
data
component
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102012220713A
Other languages
English (en)
Inventor
Budy D. Notohardjono
Arkadiy Tsfasman
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE102012220713A1 publication Critical patent/DE102012220713A1/de
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Abstract

Ein Verfahren zum Verhindern von Ausfällen auf einem Servercomputer auf Grund von interner und/oder externer Verursachung von Stoß und/oder Schwingung. Das Verfahren weist das Erlangen von analogen Beschleunigungsdaten von Komponenten in einem Servercomputer durch mindestens einen Sensor auf. Die Daten werden dann in digitales Format umgewandelt und in einer Prozessorspeichereinheit einer Motorantriebsbaugruppe gespeichert. Der Prozessor analysiert die gespeicherten Daten auf das Vorhandensein einer Maschinenverschlechterung. In Reaktion auf das Erkennen des Vorhandenseins einer Maschinenverschlechterung leitet der Prozessor der Motorantriebsbaugruppe Abhilfeprozeduren ein. Zu den Abhilfeprozeduren gehört das Steuern der Drehgeschwindigkeit von sich bewegenden Geräten oder das Ausführen einer kompletten Abschaltung. Ein System und ein Computerprogrammprodukt zum Ausführen des Verfahrens werden ebenfalls bereitgestellt.

Description

  • ALLGEMEINER STAND DER TECHNIK
  • Gebiet der Erfindung
  • Diese Erfindung betrifft allgemein das Überwachen von Servercomputern und insbesondere das Verhindern eines Ausfalls in einem Servercomputer auf Grund einer Störung wie beispielsweise Stoß, Schwingung und/oder seismisches Ereignis.
  • Beschreibung der verwandten Technik
  • Mit dem Fortschritt der Technologie haben sich auch die Komplexität und die Anzahl von elektronischen Komponenten in Computerumgebungen sowie das Vertrauen auf die Verfügbarkeit dieser Computerumgebungen für Benutzer erhöht. Computerausfallzeiten oder Ausfälle können für Endbenutzer katastrophale Verluste verursachen. Mechanische und strukturelle Unversehrtheit dieser Computerumgebungen ist für das Aufrechterhalten der Verfügbarkeit wichtig. Umwelt- und Katastrophenereignisse in der letzten Zeit haben Designer von Computersystemumgebungen darin bestärkt, strukturell verbesserte Anordnungen zu entwickeln und zu implementieren, die plötzlichem abnormen Stößen und Schwingungen wie denjenigen bei seismischen Ereignissen standhalten können. Bei einem Computersystem kann es zu einem Datenverlust und Systemzusammenbruch kommen, wodurch Leben und Infrastruktur Schaden nehmen können. Während einige Infrastrukturen einer plötzlichen auftretenden Störung wie beispielsweise Stoß und Schwingung standhalten können, kann die Störung eines Computersystems über einen längeren Zeitraum durch einen Ausfall von sich bewegenden Teilen in der Computerumgebung auftreten.
  • Ein Lagerschaden in drehenden Maschinen, wie beispielsweise ein Gebläse eines Servercomputers, kann starke Schwingung verursachen. Diese Schwingung verursacht potenziell Ausfälle an anderen Serverkomponenten, wie beispielsweise kritischen Karten, oder verursacht Verschleiß der Anschlusselemente. Normalerweise handelt es sich bei einem derartiger Lagerschaden um eine allmähliche Verschlechterung im Lauf der Zeit. Es ist daher wünschenswert, eine Lösung zu präsentieren, die eine Online-Überwachung und Analysen von Stoß und Schwingung in einem Computersystem und anschließende Abhilfemaßnahmen bereitstellt. Ein Stoß kann bei einem Servercomputer zur Beschädigung von Teilen und zum Maschinenausfall führen.
  • Kurzdarstellung der Erfindung
  • Gemäß einem Aspekt der Erfindung wird ein Verfahren bereitgestellt, um einen Ausfall auf einem Servercomputer auf Grund einer Störung zu verhindern. Das Verfahren weist auf: Erlangen von analogen Beschleunigungsdaten von Komponenten in einem Servercomputer durch mindestens einen Sensor; Umwandeln der analogen Beschleunigungsdaten in eine digitale Form durch einen Computerprozessor; Speichern der umgewandelten Daten in einer Prozessorspeichereinheit einer Motorantriebsbaugruppe; Analysieren der gespeicherten Daten auf das Vorhandensein einer Maschinenverschlechterung; und in Reaktion auf das Erkennen des Vorhandenseins einer Maschinenverschlechterung Einleiten von Abhilfeprozeduren durch den Prozessor der Motorantriebsbaugruppe.
  • Gemäß einem anderen Aspekt der Erfindung wird ein Computerprogrammprodukt bereitgestellt, um einen Ausfall auf einem Servercomputer auf Grund einer Störung zu verhindern. Das Computerprogrammprodukt weist auf: ein dauerhaftes computerlesbares Speichermedium mit einem darin enthaltenen computerlesbaren Programmcode, wobei der computerlesbare Programmcode zum Ausführen der Schritte eines Verfahrens konfiguriert ist.
  • Das Verfahren weist auf: Erlangen von analogen Beschleunigungsdaten von Komponenten in einem Servercomputer durch mindestens einen Sensor; Umwandeln der analogen Beschleunigungsdaten in digitale Form durch einen Computerprozessor; Speichern der umgewandelten Daten in einer Prozessorspeichereinheit einer Motorantriebsbaugruppe; Analysieren der gespeicherten Daten auf das Vorhandensein einer Maschinenverschlechterung; und in Reaktion auf das Erkennen des Vorhandenseins einer Maschinenverschlechterung Einleiten von Abhilfeprozeduren durch den Prozessor der Motorantriebsbaugruppe.
  • Gemäß einem weiteren Aspekt der Erfindung wird ein System bereitgestellt, um einen Ausfall auf einem Servercomputer auf Grund einer Störung zu verhindern. Das System weist auf: einen Speicher; und einen Prozessor, der so konfiguriert ist, dass er mit dem Speicher Daten austauscht, wobei das Computersystem so konfiguriert ist, dass es ein Verfahren ausführt. Das Verfahren weist auf: Erlangen von analogen Beschleunigungsdaten von Komponenten in einem Servercomputer durch mindestens einen Sensor; Umwandeln der analogen Beschleunigungsdaten in digitale Form durch einen Computerprozessor; Speichern der umgewandelten Daten in einer Prozessorspeichereinheit einer Motorantriebsbaugruppe; Analysieren der gespeicherten Daten auf das Vorhandensein einer Maschinenverschlechterung; und in Reaktion auf das Erkennen des Vorhandenseins einer Maschinenverschlechterung Einleiten von Abhilfeprozeduren durch den Prozessor der Motorantriebsbaugruppe.
  • Kurze Beschreibung der Zeichnungen
  • 1 stellt ein integriertes System gemäß einer Ausführungsform der vorliegenden Erfindung dar.
  • 2 stellt eine Ausführungsform des Shake & Vibration Monitoring Tool (Rüttel- und Schwingungsüberwachungs-Tool) dar.
  • Ausführliche Beschreibung der bevorzugten Ausführungsformen
  • Eine Ausführungsform der Erfindung weist die Integration von Sensoren auf, die eine Störung erkennen können, einen Prozessor in einer Motorantriebsbaugruppe zum Sammeln und Verarbeiten digitaler Daten und einen Computer (Computersystem-Controller) zur Online-Überwachung des Zustands einer drehenden Maschine. Bei der Störung kann es sich um einen Stoß, eine Schwingung, ein seismisches Ereignis oder irgendeine Kombination davon handeln. Außerdem kann die Störung intern oder extern verursacht werden. Der Prozessor in der Motorantriebsbaugruppe kann auch Abhilfemaßnahmen implementieren, wenn ein Problem erkannt wird. Zu den Abhilfemaßnahmen können ein Ändern der Drehgeschwindigkeit einer Drehzahl einer drehenden Maschine oder anderer Drehzahlen, z. B. ein Verringern der Lüftergeschwindigkeit, gehören, um ein Mitschwingen zu vermeiden, oder komplexere, nichttriviale Steuerungen, die auf der Funktionalität des Gesamtsystems beruhen. Unter gewissen Bedingungen, wenn beispielweise Stoß und/oder Schwingung gleichzeitig auf mehreren rotierenden Geräten im Servercomputer erkannt werden, kann eine vollständige Abschaltung des gesamten Servers ausgeführt werden.
  • Das integrierte System kann die folgenden Hauptkomponenten aufweisen: Sensoren – dreiaxiale Beschleunigungsmesser, die in einen Motorantrieb einer drehenden Maschine eingebettet sind; Datenerfassung und -umwandlung über einen verfügbaren Mikroprozessor und ein TCP/IP-Servicenetzwerk; ein Verfahren zum Erkennen von Ausfällen, wie beispielsweise Kurtosis; periodisches Überwachen und Speichern der Schwingungsdaten; Datenanalyse; und im Fall eine Problems das Ausführen von Abhilfemaßnahmen wie beispielsweise Meldung/Call-Horne an einen Laptop oder direktes Steuern von einem oder mehreren Motoren, um eine Beschädigung des Servercomputers zu verhindern. Im gesamten Servercomputer können mehrere Sensoren verwendet werden, um mehr als ein Gerät zu überwachen. Zum Beispiel können mehrere Axialventilatoren gleichzeitig überwacht werden. Sensoren können in den Motorantriebsbaugruppen der drehenden Maschine positioniert werden oder im gesamten Server positioniert werden. Wie des Weiteren im Folgenden beschrieben, wird ein intelligentes integriertes System bereitgestellt, das einen Ausfall auf Grund intern oder extern verursachter Störung, wie beispielsweise Stoß und/oder Schwingung, im eigenen System verhindert.
  • 1 stellt eine Ausführungsform der Erfindung dar, die im Servercomputer 101 implementiert ist. Beim Einschalten des Systems wird ein Auto-Code Download (Herunterladen von Auto-Code) (ACDL) durch einen Systemtreiber 113 im Supportelement (SE) 108 eingeleitet. Der Auto-Code Download (ACDL) ist ein Quellcode, der Code für Stromversorgungs-Firmware in Mikrochips von Stromversorgungs-Hardware lädt. Das Supportelement (SE) 108 kann ein physischer Laptop sein, der sich wie eine Steuer-Workstation für den Servercomputer verhält. Der gesamte Systemtreiber ist auf dem SE 108 geladen. Wenn das System den SE-Code hochfährt, der auf dem SE ausgeführt wird, leitet das SE diverse Hochfahrsequenzen für das System ein. Der Code wird in den Hauptstromversorgungscontroller (Bulk Power Controller) H8 Micro (BCP) 106 über den Anschluss des Stromversorgungs-Servicesteuerungsnetzwerks (Power Service Control Network) (PCSN) 107 geladen. Das PCSN ist ein internes Servicenetzwerk, das alle der großen Komponenten des Servercomputers vereinigt.
  • Der BCP dient als ein Hauptcontroller für die Stromversorgung und Kühlung des Computerservers. Die RP422-COMM-Verbindung 110 stellt eine bidirektionale Kommunikationsverbindung zwischen dem BCP und der Motorantriebsbaugruppe (Motor Drive Assembly) (MDA) 102 bereit. Die MDA 102 ist Teil der Baugruppe des drehenden Geräts 111. In dieser Ausführungsform ist die Baugruppe des drehenden Geräts ein Käfigaxialventilator. Der Hauptstromversorgungscontroller H8 Micro (BCP) 106 enthält den flexiblen Serviceprozessor, der Teil des Servicenetzwerks ist, das das gesamte Stromversorgungsuntersystem steuert und die Drehzahl des drehenden Geräts steuert. Der BCP 106 kann auch eine komplette Abschaltung 112 des Servers einleiten. Ein logisches Ausschalten (ein sanftes Herunterfahren), das Datentransaktionen stoppt, um einen Datenverlust zu vermeiden, kann ebenfalls ausgeführt werden, während die Maschine eingeschaltet bleibt. 1 zeigt die Details der Motorantriebsbaugruppe. Das Supportelement 108 lädt Code in den BCP 106. Der BCP 106 lädt anschließend Code in die MDA 102 unter Verwendung der RS422-Verbindung wie angegeben n 10. Insbesondere wird Code in den H8 Micro 103 geladen, der in der MDA 102 resident ist.
  • Während das System in Betrieb ist, steuert der Code in der MDA Ventilatorvorgänge und führt eine Sammlung/Analyse von Sensordaten unter Verwendung von Sensoren von mikroelektromechanischen Systemen (MEMS) 104 aus. Die in dieser Ausführungsform verwendeten MEMS sind dreiaxiale Beschleunigungsmesser; es können jedoch andere Typen von Sensoren zum Erfassen von Beschleunigungsdaten verwendet werden. Die MEMS 104 können überall in oder auf dem Servercomputer positioniert werden. In der Ausführungsform sind die MEMS 104 auf dem drehenden Gerät und in der MDA selbst positioniert. Die MEMS sammeln Daten in analoger Form, und der ND-Wandler 105 führt die Umwandlung der analogen in digitale Daten aus. Die digitalen Daten werden dann an den H8 Micro 103 übergeben, der Analysen zum Maschinenausfall ausführt. Der Code im H8-Mikrochip 103 ermittelt auf Basis der Sensordatenanalyse unter Verwendung von später erörterten Prozeduren, ob ein bestimmter Ventilator abgeschaltet, verlangsamt oder beschleunigt werden muss. 115 zeigt den H8 Micro in der MDA 102, der eine derartige Abschaltung oder Geschwindigkeitskontrolle steuert.
  • Die MDA 102 überträgt unter Verwendung der RS422-Verbindung 110 über die bestehenden Kommunikationspfade auch zurück zum Supportprotokoll 113 des Supportelements, um den BCP 106 zu erreichen, und unter anschließender Nutzung der PCSN-Verbindung 107, um das Supportelement 108 zu erreichen. Unter Verwendung einer Referenzcodestruktur im Treiber des Supportelements (SE) 108 ist der SE-Code auch fähig, eine Serviceanfrage (109) einzuleiten, um diverse Ausfallbedingungen zur Reparatur zu melden und Aktionen zu überprüfen. Die Serviceanfrage kann die Form einer E-Mail oder einer Pager-Benachrichtigung annehmen. Die Sensoren können intern verursachte Lagerschäden von drehenden Maschinen oder extern verursachte Stöße und Schwingungen erkennen.
  • Es gibt verschiedene Verfahren zum Überwachen einer Maschinenverschlechterung durch Analysieren von Beschleunigungsreaktionen von Maschinen. Zu derartigen Verfahren gehören ein periodisches Überwachen und Vergleichen der Spitzenbeschleunigungsdaten mit der Spitze einer „Known Good”-(erwiesenermaßen fehlerfreien) Komponentenbeschleunigung; ein periodisches Überwachen und Vergleichen von FFT-(Fast Fourier Transform/schnelle Fourier-Transformation)Beschleunigungsdaten mit der FFT von „Known Good”-Komponentenbeschleunigung; und ein periodisches Überwachen und Vergleichen der Kurtosis von Beschleunigungsdaten. Eine hohe Kurtosis-Verteilung besitzt eine schärfere Spitze und längere, breitere Impulsschwänze, während eine niedrige Kurtosis-Verteilung eine abgerundetere Spitze und kürzere, dünnere Impulsschwänze besitzt. Die Kurtosis-Verwendung in der statistischen Analyse ist in der Technik bekannt.
  • In einer Ausführungsform der Erfindung ermöglicht ein Befehlszeilen-Tool (wie beispielsweise SVMT: Shake & Vibration Monitoring Tool/Rüttel- und Schwingungsüberwachungs-Tool), das auf der Server-Workstation läuft, dem Benutzer das Überwachen von Daten von diversen Sensoren, die in der und um die Computersystemumgebung positioniert sind. Das SVMT-Tool erlangt diese Daten über einen Servicemikroprozessor in der MDA unter Verwendung des internen Servicesteuerungsnetzwerks des Systems. 2 zeigt eine derartige Implementierung des Befehlszeilen-Tools des Rüttel- und Schwingungsüberwachungs-Tools (SVMT). Wie vorher erörtert, enthält der Servercomputer 101 die Motorantriebsbaugruppe (MDA) 102. Die MDA enthält den H8 Mikroprozessor 103 und einen MEMS-Beschleunigungsmessersensor. Die MDA steht in Verbindung mit dem Hauptstromversorgungscontroller (BPC) 106. Die Daten werden von der MDA 102 zum BPC 106 übertragen. Dann werden die Daten durch das interne Servicesteuerungsnetzwerk des Stromversorgungssystems PSCN 107 an das Supportelement 108 übergeben. In dieser Ausführungsform führt das Supportelement 108 das Befehlszeilen-Tool des Rüttel- und Schwingungsüberwachungs-Tools (SVMT) 201 aus. Das SVMT ermöglicht Systembenutzern die Abfrage von Schwingungsdaten und die Live-Anzeige auf dem Bildschirm der Server-Workstation 202 mit einigen eingerichteten Zeitintervallen. Live-Sensordaten können auf dem SE-Bildschirm über das SVMT-Tool angezeigt werden oder können unter Verwendung des Systemprotokolls angezeigt werden. Das Tool ermöglicht die Protokollierung der Daten und die Übertragung der Daten zum Endbenutzer 203 zur weiteren Analyse über einen angegebenen eMail-Account. Protokollierte Sensordaten können lokal auf dem SE-Speicher gespeichert und/oder über eine angegebene E-Mail gesendet werden. Die Sensordaten können auch im Systemprotokoll gespeichert werden.
  • Zu zusätzlichen Funktionen des Tools kann gehören, einem Benutzer die Fähigkeit zum Ausführen diverser Befehle zu erteilen, um Live-Daten auf den Bildschirm zu ziehen, um eine effiziente Überwachung auf Abruf bereitzustellen. Benutzer können des Weiteren Kontaktinformationen eingeben, wie beispielsweise E-Mail-Adressen oder Telefonnummern, um Noffallbenachrichtigungen zu erhalten, und Benutzer können auch einen Zeitplan aufstellen (Zeitintervalle für Datenabfrage und Datensammlung), um Daten aus dem System abrufen und zu ihrer E-Mail-Adresse (unter Verwendung von SMTP: Simple Mail Transfer Protocol) senden zu lassen.
  • Dateien mit protokollierten Daten können unter Verwendung des CSV-Formats formatiert werden, und Sensordaten für Stoß und Schwingung können Teil des Wärmecode-Untersystems der Stromversorgung im Systemhauptprotokoll werden. Außerdem kann der Systemstromversorgungscode des internen Systems ebenfalls Schwingungsdaten analysieren und Maschinen durch Ändern der Drehgeschwindigkeit steuern, um Mitschwingen zu vermeiden und Komponentenausfall zu verhindern, wie beispielsweise, wenn sich der Kurtosis-Wert beträchtlich ändert oder die Amplitude der Beschleunigung das Doppelte der ursprünglichen Werte ist. Wenn zum Beispiel ein Lagerschaden oder ein anderer abnormer Zustand erkannt wird, kann der Motorcontroller die Drehgeschwindigkeit der Drehzahl der drehenden Maschine ändern, um Mitschwingen zu vermeiden und Ausfälle vor Ort zu verhindern.
  • Die hierin verwendete Terminologie dient nur zum Zweck der Beschreibung von bestimmten Ausführungsformen und ist nicht dazu bestimmt, die Erfindung zu beschränken. Die hierin verwendeten Singularformen „ein/eine” und „der/die/das” sollen auch die Pluralformen einschließen, es sei denn, durch den Kontext ist eindeutig anderes angegeben. Des Weiteren ist klar, dass die Begriffe „aufweisen” (und alle Formen von „aufweisen”, wie beispielsweise „weist auf” und „aufweisend”), „besitzen” (und alle Formen von „besitzen”, wie beispielsweise „besitzt” und „besitzend”), „umfassen” (und alle Formen von „umfassen”, wie beispielsweise „umfasst” und „umfassend”) und „enthalten” (und alle Formen von „enthalten”, wie beispielsweise „enthält” und „enthaltend”) verbindende Verben mit offenem Ende sind. Demzufolge besitzt ein Verfahren oder ein Gerät, das einen oder mehrere Schritte oder Elemente „aufweist”, „besitzt”, „umfasst” oder „enthält”, diesen einen oder mehrere Schritte oder Elemente, ist aber nicht darauf beschränkt, nur diesen einen oder mehrere Schritte oder Elemente zu besitzen. Desgleichen besitzt ein Schritt eines Verfahrens oder ein Element eines Geräts, der bzw. das eine oder mehrere Funktionen „aufweist”, „besitzt”, „umfasst” oder „enthält”, diese eine oder mehrere Funktionen, ist aber nicht darauf beschränkt, nur diese eine oder mehrere Funktionen zu besitzen. Des Weiteren ist ein Gerät oder eine Struktur, das bzw. die auf eine bestimmte Weise konfiguriert ist, zumindest auf diese Weise konfiguriert, kann aber auch auf Weisen konfiguriert sein, die nicht aufgelistet sind.
  • Die entsprechenden Strukturen, Materialien, Handlungen und Entsprechungen aller Mittel oder Schritt-plus-Funktion-Elemente in den folgenden Ansprüchen sollen, sofern vorhanden, jede Struktur, jedes Material oder jede Handlung zum Durchführen der Funktion in Kombination mit anderen beanspruchten Elementen, wie speziell beansprucht, aufweisen. Die Beschreibung der vorliegenden Erfindung wurde zum Zweck der Veranschaulichung und Beschreibung erstellt, sie soll aber für die Erfindung in der offenbarten Form weder erschöpfend noch einschränkend sein. Für den Fachmann sind viele Modifizierungen und Variationen offenkundig, ohne den Umfang und den Geist der Erfindung zu verlassen. Die Ausführungsform wurde ausgewählt und beschrieben, um die Prinzipien der Erfindung und die praktische Anwendung zu erklären und andere Fachleute zu befähigen, die Erfindung durch diverse Ausführungsformen und die diversen Modifizierungen daran zu verstehen, die von der betrachteten bestimmten Verwendung abhängen.

Claims (14)

  1. Verfahren zum Verhindern von Ausfällen auf einem Servercomputer auf Grund von Störungen, wobei das Verfahren aufweist: Erlangen von analogen Beschleunigungsdaten von mindestens einer Komponente in einem Servercomputer durch mindestens einen Sensor; Umwandeln der analogen Beschleunigungsdaten in digitale Form; Speichern der umgewandelten Daten in einer Prozessorspeichereinheit einer Motorantriebsbaugruppe; Analysieren der gespeicherten Daten auf das Vorhandensein einer Maschinenverschlechterung; und, in Reaktion auf ein Erkennen des Vorhandenseins einer Maschinenverschlechterung, Einleiten von Abhilfeprozeduren durch den Prozessor der Motorantriebsbaugruppe und/oder wobei der mindestens eine Sensor vorzugsweise dreiaxiale Beschleunigungsmesser aufweist, die in Motorantriebsbaugruppen von drehenden Komponenten im Computer eingebettet sind.
  2. Verfahren nach Anspruch 1, wobei das Analysieren eine Aktion aufweist, die aus der Gruppe ausgewählt wird, die aufweist: periodisches Überwachen und Vergleichen von Spitzenbeschleunigungsdatenpunkten mit der Spitze einer „Known Good”-Komponentenbeschleunigung, periodisches Überwachen und Vergleichen von FFT-Beschleunigungsdaten mit der FFT von einer „Known Good”-Komponentenbeschleunigung und ein periodisches Überwachen und Vergleichen einer Kurtosis von Beschleunigungsdaten.
  3. Verfahren nach Anspruch 1, wobei das Einleiten von Abhilfemaßnahmen eine Aktion aufweist, die aus der Gruppe ausgewählt wird, die aufweist: Verlangsamen von mindestens einer sich bewegenden Komponente, das Beschleunigen von mindestens einer sich bewegenden Komponente, Abschalten von mindestens einer sich bewegenden Komponente, Senden einer Maschinenstatus-Benachrichtigung an einen Empfänger und Ausführen einer kompletten Abschaltung des gesamten Systems.
  4. Verfahren nach Anspruch 1, wobei es sich bei der Störung um einen Stoß und/oder eine Schwingung und/oder ein seismisches Ereignis handelt.
  5. Computerprogrammprodukt zum Verhindern von Ausfällen auf einem Servercomputer auf Grund von Störung, wobei das Computerprogrammprodukt aufweist: ein dauerhaftes computerlesbares Speichermedium mit einem darin enthaltenen computerlesbaren Programmcode, wobei der computerlesbare Programmcode zum Ausführen der Schritte eines Verfahrens konfiguriert ist, das die Schritte aufweist: Erlangen von analogen Beschleunigungsdaten von mindestens einer Komponente in einem Servercomputer durch mindestens einen Sensor; Umwandeln der analogen Beschleunigungsdaten in digitale Form durch einen Computerprozessor; Speichern der umgewandelten Daten in einer Prozessorspeichereinheit einer Motorantriebsbaugruppe; Analysieren der gespeicherten Daten auf das Vorhandensein einer Maschinenverschlechterung; und, in Reaktion auf das Erkennen des Vorhandenseins einer Maschinenverschlechterung, Einleiten von Abhilfeprozeduren durch den Prozessor der Motorantriebsbaugruppe.
  6. Computerprogrammprodukt nach Anspruch 5, wobei die Sensoren dreiaxiale Beschleunigungsmesser aufweisen, die in Motorantriebsbaugruppen von drehenden Komponenten im Computer eingebettet sind.
  7. Computerprogrammprodukt nach Anspruch 5, wobei das Analysieren eine Aktion aufweist, die aus der Gruppe ausgewählt wird, die periodisches Überwachen und Vergleichen von Spitzenbeschleunigungsdatenpunkten mit der Spitze einer „Known Good”-Komponentenbeschleunigung, periodisches Überwachen und Vergleichen von FFT-Beschleunigungsdaten mit der FFT von einer „Known Good”-Komponentenbeschleunigung und periodisches Überwachen und Vergleichen einer Kurtosis von Beschleunigungsdaten aufweist.
  8. Computerprogrammprodukt nach Anspruch 5, wobei das Einleiten von Abhilfemaßnahmen eine Aktion aufweist, die aus der Gruppe ausgewählt wird, die aufweist: Verlangsamen von mindestens einer sich bewegenden Komponente, Beschleunigen von mindestens einer sich bewegenden Komponente, Abschalten von mindestens einer sich bewegenden Komponente, Senden einer Maschinenstatus-Benachrichtigung an einen Empfänger und Ausführen einer kompletten Abschaltung des gesamten Systems.
  9. Computerprogrammprodukt nach Anspruch 5, wobei es sich bei der Störung um einen Stoß und/oder eine Schwingung und/oder ein seismisches Ereignis handelt.
  10. System zum Verhindern von Ausfällen auf einem Servercomputer auf Grund von Störungen, wobei das System aufweist: einen Speicher; und einen Prozessor, der so konfiguriert ist, dass er mit dem Speicher Daten austauscht, wobei das Computersystem so konfiguriert ist, dass es ein Verfahren ausführt, wobei das Verfahren aufweist: Erlangen von analogen Beschleunigungsdaten von mindestens einer Komponente in einem Servercomputer durch mindestens einen Sensor; Umwandeln der analogen Beschleunigungsdaten in digitale Form durch einen Computerprozessor; Speichern der umgewandelten Daten in einer Prozessorspeichereinheit einer Motorantriebsbaugruppe; Analysieren der gespeicherten Daten auf das Vorhandensein einer Maschinenverschlechterung; und, in Reaktion auf das Erkennen des Vorhandenseins einer Maschinenverschlechterung, Einleiten von Abhilfeprozeduren durch den Prozessor der Motorantriebsbaugruppe.
  11. System nach Anspruch 10, wobei die Sensoren dreiaxiale Beschleunigungsmesser aufweisen, die in Motorantriebsbaugruppen von drehenden Komponenten im Computer eingebettet sind.
  12. System nach Anspruch 10, wobei das Analysieren eine Aktion aufweist, die aus der Gruppe ausgewählt wird, die periodisches Überwachen und Vergleichen von Spitzenbeschleunigungsdatenpunkten mit einer Spitze einer „Known Good”-Komponentenbeschleunigung, periodisches Überwachen und Vergleichen von FFT-Beschleunigungsdaten mit der FFT von einer „Known Good”-Komponentenbeschleunigung und periodisches Überwachen und Vergleichen einer Kurtosis von Beschleunigungsdaten aufweist.
  13. System nach Anspruch 10, wobei das Einleiten von Abhilfemaßnahmen eine Aktion aufweist, die aus der Gruppe ausgewählt wird, die aufweist: das Verlangsamen von mindestens einer sich bewegenden Komponente, Beschleunigen von mindestens einer sich bewegenden Komponente, Abschalten von mindestens einer sich bewegenden Komponente, das Senden einer Maschinenstatus-Benachrichtigung an einen Empfänger und Ausführen einer kompletten Abschaltung des gesamten Systems.
  14. System nach Anspruch 10, wobei es sich bei der Störung um einen ein Stoß und/oder eine Schwingung und/oder ein seismisches Ereignis handelt.
DE102012220713A 2011-11-28 2012-11-14 Verhindern von durch Störungen verursachte Ausfällen in einem Computersystem Ceased DE102012220713A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/304,906 US8930775B2 (en) 2011-11-28 2011-11-28 Preventing disturbance induced failure in a computer system
US13/304,906 2011-11-28

Publications (1)

Publication Number Publication Date
DE102012220713A1 true DE102012220713A1 (de) 2013-05-29

Family

ID=47560535

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102012220713A Ceased DE102012220713A1 (de) 2011-11-28 2012-11-14 Verhindern von durch Störungen verursachte Ausfällen in einem Computersystem

Country Status (3)

Country Link
US (2) US8930775B2 (de)
DE (1) DE102012220713A1 (de)
GB (1) GB2498427A (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111896260A (zh) * 2020-08-01 2020-11-06 华东交通大学 NGAs同步优化小波滤波器与MCKD的轴承故障诊断方法
CN112747926A (zh) * 2020-12-22 2021-05-04 电子科技大学 一种基于二阶参数匹配随机共振的电机滚动轴承故障诊断方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013124878A1 (ja) * 2012-02-20 2013-08-29 富士通株式会社 通信装置、システム、制御プログラム、および制御方法
HUE037145T2 (hu) * 2013-02-15 2018-08-28 Praetors Ag Jelszó-ellenõrzési rendszer
GB2514833A (en) * 2013-06-07 2014-12-10 Ibm Portable computer monitoring
US9373345B1 (en) * 2014-12-11 2016-06-21 International Business Machines Corporation Pro-active protection of communication devices that are senstive to vibration or shock
EP3465253B1 (de) 2016-06-01 2022-04-13 Nokia Technologies Oy Seismische bestimmung einer position
US10365372B2 (en) 2016-06-08 2019-07-30 International Business Machines Corporation Surveying physical environments and monitoring physical events
US11068333B2 (en) 2019-06-24 2021-07-20 Bank Of America Corporation Defect analysis and remediation tool
CN111651937B (zh) * 2020-06-03 2023-07-25 苏州大学 变工况下类内自适应轴承故障诊断方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4862298A (en) * 1988-03-11 1989-08-29 Magnetic Peripherals Inc. Shock load detection device
US5251151A (en) 1988-05-27 1993-10-05 Research Foundation Of State Univ. Of N.Y. Method and apparatus for diagnosing the state of a machine
US5566092A (en) * 1993-12-30 1996-10-15 Caterpillar Inc. Machine fault diagnostics system and method
JP3609982B2 (ja) 2000-04-20 2005-01-12 リオン株式会社 故障診断方法及びその装置
TW579424B (en) 2001-07-09 2004-03-11 Shell Int Research Vibration analysis for predictive maintenance in machinery
US6771440B2 (en) 2001-12-18 2004-08-03 International Business Machines Corporation Adaptive event-based predictive failure analysis measurements in a hard disk drive
US7487401B2 (en) 2002-08-16 2009-02-03 Sun Microsystems, Inc. Method and apparatus for detecting the onset of hard disk failures
US20080186194A1 (en) * 2006-09-29 2008-08-07 Rockwell Automation Technologies, Inc. Dynamic condition monitoring system employing a multi-core processor
US7694188B2 (en) * 2007-02-05 2010-04-06 Microsoft Corporation Disk failure prevention and error correction
US7693663B2 (en) * 2007-04-27 2010-04-06 International Business Machines Corporation System and method for detection of earthquakes and tsunamis, and hierarchical analysis, threat classification, and interface to warning systems
US7756678B2 (en) * 2008-05-29 2010-07-13 General Electric Company System and method for advanced condition monitoring of an asset system
US9618037B2 (en) 2008-08-01 2017-04-11 Honeywell International Inc. Apparatus and method for identifying health indicators for rolling element bearings
US8489343B2 (en) 2008-09-12 2013-07-16 Oracle America, Inc. Detecting constrained motion of a component in a computer system
KR101100832B1 (ko) 2009-01-13 2012-01-02 장정훈 먼지제거팬
US8648690B2 (en) 2010-07-22 2014-02-11 Oracle International Corporation System and method for monitoring computer servers and network appliances

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111896260A (zh) * 2020-08-01 2020-11-06 华东交通大学 NGAs同步优化小波滤波器与MCKD的轴承故障诊断方法
CN111896260B (zh) * 2020-08-01 2022-05-13 华东交通大学 NGAs同步优化小波滤波器与MCKD的轴承故障诊断方法
CN112747926A (zh) * 2020-12-22 2021-05-04 电子科技大学 一种基于二阶参数匹配随机共振的电机滚动轴承故障诊断方法
CN112747926B (zh) * 2020-12-22 2022-04-15 电子科技大学 一种基于二阶参数匹配随机共振的电机滚动轴承故障诊断方法

Also Published As

Publication number Publication date
GB2498427A (en) 2013-07-17
US20130138994A1 (en) 2013-05-30
US9043657B2 (en) 2015-05-26
US8930775B2 (en) 2015-01-06
GB201221071D0 (en) 2013-01-09
US20130138992A1 (en) 2013-05-30

Similar Documents

Publication Publication Date Title
DE102012220713A1 (de) Verhindern von durch Störungen verursachte Ausfällen in einem Computersystem
DE102016105877B4 (de) Verfahren und Vorrichtung zur Überwachung einer Maschine
WO2005124488A1 (de) Intelligenter antrieb
WO2018087316A1 (de) Verfahren zum betrieb eines zustandsüberwachungssystems einer schwingmaschine und zustandsüberwachungssystem
DE102018206440A1 (de) Abnormalitätenbeurteilungssystem, Datensende- und Empfangsvorrichtung, Motorsteuervorrichtung und Abnormalitätenbeurteilungsverfahren
DE102017103507A1 (de) Vorrichtung und Verfahren zum Erfassen von Daten, die auf ein Ereignis bezogen sind, das eine anomale Funktion einer Maschine angibt
EP1920299B1 (de) Verfahren und vorrichtung zur überwachung einer technischen einrichtung
DE102016221761A1 (de) Verfahren und Vorrichtung zum Handhaben von dynamischen Eigenschaften eines schwingenden Maschinenbauteils
DE102018201975A1 (de) Diagnosedaten-erfassungssystem, diagnosesystem und diagnosedaten-erfassungsprogramm
DE102016119358A1 (de) Fehlerdiagnosesystem
DE102018007905A1 (de) Arbeitsspindel mit Sensoren und Verfahren zur Erfassung und Überwachung ihrer Historie
EP2098929B1 (de) Betriebsverfahren für eine mittels eines elektrischen Antriebs angetriebene Maschine mit Zustandserkennung durch Frequenzanalyse
DE102018100813A1 (de) System und verfahren zum erkennen von eindringen in eine kommunikationsumgebung
DE102018206179B4 (de) Servomotor-Steuereinrichtung und Servomotor-Steuersystem
EP0909374A1 (de) Vorrichtung zur erfassung von analogen messsignalen für die akustische diagnose von prüflingen
DE102016214957A1 (de) Elektronisches Betriebsgerät und Auslesegerät
DE102018215216A1 (de) Datensammelvorrichtung, Datentransfervorrichtung, Datensammelsystem und Datentransferprogramm
DE102019208603A1 (de) Datensammlungssystem, datensammlungsverfahren und steuerung
WO2023020698A1 (de) Verfahren und vorrichtung zur überwachung einer elektrischen maschine
DE102021117415A1 (de) Verfahren zur Ermittlung eines Maschinenzustandes, insbesondere zur Zustandsüberwachung einer Maschine, System
DE102016001641A1 (de) Verlegungsdetektor zum Detektieren der Verlegung einer Vorrichtung
EP3388810B1 (de) Verfahren sowie eine vorrichtung zur unwuchterkennung
EP3144654A1 (de) Bremstestverfahren zur funktionsprüfung einer haltebremse für einen elektromotor in einem elektrischen antriebsystem
DE102018213370A1 (de) Verfahren zum Ermitteln einer Temperatur eines Elektromotors einer Werkzeugmaschine und Werkzeugmaschine
EP2158527B1 (de) Aktionsmodule für zustandsabhängige wartungsarbeiten

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: H01L0025075000

Ipc: G06F0011070000

R016 Response to examination communication
R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final