DE102021122077A1 - Programmatisches erkennen von leistungsanomalien - Google Patents

Programmatisches erkennen von leistungsanomalien Download PDF

Info

Publication number
DE102021122077A1
DE102021122077A1 DE102021122077.7A DE102021122077A DE102021122077A1 DE 102021122077 A1 DE102021122077 A1 DE 102021122077A1 DE 102021122077 A DE102021122077 A DE 102021122077A DE 102021122077 A1 DE102021122077 A1 DE 102021122077A1
Authority
DE
Germany
Prior art keywords
speed value
data
computer
expected
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE102021122077.7A
Other languages
English (en)
Inventor
Robert M. Abrams
Karla Arndt
Friedrich Matthias Gubitz
Dieter Wellerdiek
Nicholas C. Matsakis
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE102021122077A1 publication Critical patent/DE102021122077A1/de
Granted legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

Es werden ein Verfahren, ein System und ein Computerprogrammprodukt zum Erkennen von Leistungsanomalien bereitgestellt. Von einer Arbeitslastverwaltung werden in regelmäßigen Abständen Geschwindigkeitsdaten für einen oder mehrere Adressräume empfangen. Für jeden der ein oder mehreren Adressräume wird ein erwarteter Geschwindigkeitswert erstellt. Ein Faktor des erwarteten Geschwindigkeitswertes wird mit einem aktuellen Geschwindigkeitswert aus den Geschwindigkeitsdaten verglichen. Wenn der aktuelle Geschwindigkeitswert niedriger als der Faktor ist, wird eine Abhilfemaßnahme erzeugt, wodurch eine Anomalie angezeigt wird.

Description

  • HINTERGRUND
  • Ausführungsformen der Erfindung beziehen sich grundsätzlich auf Computersysteme und insbesondere auf ein Erkennen von Leistungsanomalien.
  • Das programmatische Erkennen von Leistungsanomalien bezieht sich auf die Analyse des Systemverhaltens, um Messbereiche zu ermitteln, die ein normales Verhalten anzeigen, und solche, die ein anormales Verhalten anzeigen. Dabei dient das Erfassen von Belegen für anomales Verhalten der weiteren Eingrenzung von Problemsymptomen, um die Wahrscheinlichkeit falsch-positiver Informationen zu verringern. Die Identifizierung solcher Beweise erfordert jedoch häufig, dass das System in einem anomalen Modus arbeitet, um nützliche Daten zu erfassen.
  • KURZDARSTELLUNG
  • Unter anderem wird ein Verfahren zum Erkennen von Leistungsanomalien bereitgestellt. Von einer Arbeitslastverwaltung werden in regelmäßigen Abständen Geschwindigkeitsdaten für einen oder mehrere Adressräume empfangen. Für jeden der ein oder mehreren Adressräume wird ein erwarteter Geschwindigkeitswert erstellt. Ein Faktor des erwarteten Geschwindigkeitswertes wird mit einem aktuellen Geschwindigkeitswert aus den Geschwindigkeitsdaten verglichen. Wenn der aktuelle Geschwindigkeitswert niedriger als der Faktor ist, wird eine Abhilfemaßnahme erzeugt, wodurch eine Anomalie angezeigt wird.
  • Weitere Ausführungsformen beziehen sich auf Computersysteme und Computerprogrammprodukte, die im Wesentlichen die gleichen Funktionen aufweisen wie das oben beschriebene computerimplementierte Verfahren.
  • Zusätzliche Funktionen und Vorteile werden durch die hier beschriebenen Techniken realisiert. Andere Ausführungsformen und Aspekte werden hier im Detail beschrieben. Zum besseren Verständnis sei auf die Beschreibung und auf die Zeichnungen verwiesen.
  • Figurenliste
  • Der Gegenstand, der als die vorliegende Erfindung angesehen wird, ist in den Ansprüchen am Ende der Beschreibung besonders hervorgehoben und eindeutig beansprucht. Die vorgenannten und andere Funktionen und Vorteile sind aus der folgenden detaillierten Beschreibung in Verbindung mit den beigefügten Zeichnungen ersichtlich, in denen:
    • 1 ein Funktionsblockschaltbild eines beispielhaften Systems gemäß einer Ausführungsform der vorliegenden Erfindung zeigt;
    • 2 ein Prädiktives Fehleranalysesystem (Predictive-Failure-Analysis-System) gemäß den Ausführungsformen der vorliegenden Erfindung darstellt;
    • 3 einen Arbeitsablauf eines Prädiktiven Fehleranalysesystems darstellt; und
    • 4 ein beispielhaftes Funktionsblockschaltbild einer Datenverarbeitungseinheit zur Umsetzung von Aspekten der vorliegenden Erfindung gemäß einer Ausführungsform der Erfindung zeigt.
  • AUSFÜHRLICHE BESCHREIBUNG
  • Die vorliegende Offenbarung bezieht sich grundsätzlich auf den Bereich des programmatischen Erkennens von Leistungsanomalien. Das Erkennen von Programm- und Systemanomalien analysiert das normale Programm- und Systemverhalten und entdeckt abweichende Ausführungen, die durch Angriffe, Fehlkonfigurationen, Programmfehler und ungewöhnliche Nutzungsmuster verursacht werden.
  • Das Erkennen von Anomalien umfasst ein Identifizieren unerwarteter Elemente oder Ereignisse in Datensätzen, die von der Norm abweichen. Bei dem Erkennen von Anomalien wird davon ausgegangen, dass Anomalien selten in den Daten vorkommen und sich die Merkmale der Anomalien deutlich von den normalen Fällen unterscheiden.
  • Ein von IT-Betriebspersonal verwendeter gängiger Ansatz ist die Annahme, dass alles gut funktioniert, bis ein Leistungsproblem auftritt. In der derzeitigen Praxis werden mehrere Silos von Verwaltungswerkzeugen verwendet, die das Systemverhalten überwachen und Drilldowns anbieten, um die zugrunde liegenden Symptome zu ermitteln. Die Art und Komplexität der Problemermittlung kann je nach Kenntnisstand und Erfahrung des Benutzers variieren. Zum Beispiel kann ein erfahrener Administrator über das Wissen verfügen, um ein Werkzeug einem anderen vorziehen oder eine bestimmte Reihe von Befehlen auszuführen, was ein weniger erfahrener Administrator möglicherweise nicht kann. Mittels Operator-Befehlen kann auf ungewöhnliches Verhalten geachtet werden. In sehr schnellen Rechenumgebungen ist es jedoch von Vorteil, das Erkennen von Leistungseinbußen in den Prozess zu integrieren, um automatisch eine weitere Analyse der möglichen zugrunde liegenden Anomalien auszulösen.
  • Eine WLM-Komponente (Workload-Manager, Arbeitslastverwaltung) eines Betriebssystems ermöglicht es einem Systemadministrator derzeit, Leistungsziele in Dienstklassen zu definieren. Eine Dienstklasse ist eine benannte Gruppe von Arbeiten innerhalb einer Arbeitslast mit ähnlichen Leistungsmerkmalen hinsichtlich Leistungszielen, Ressourcenanforderungen und geschäftlicher Bedeutung für das Unternehmen.
  • Dies umfasst Kennzahlen, die die durchschnittliche Antwortzeit, die Antwortzeit innerhalb eines bestimmten Perzentils, Geschwindigkeitsziele und Ziele für beliebige Arbeitslasten anzeigen. Geschwindigkeit ist ein Maß dafür, wie schnell die Arbeit ausgeführt werden sollte, wenn sie bereit ist, ohne dass es zu Verzögerungen durch Systemressourcen kommt. Sie ist definiert als ein Maß für die Prozessoraktivität, die zur Verarbeitung einer Arbeitslast über einen bestimmten Zeitraum benötigt wird, zusammen mit den Verzögerungen, die bei der Verarbeitung der Arbeitslast auftreten. Die Verzögerungen umfassen Betriebssystemprozesse im Zusammenhang mit dem Prozessor, dem Speicher und der E/A, einschließlich Speicher-Paging, Page Swapping, Verzögerungen bei der Aufgabenerstellung und Initialisierung usw.
  • Prädiktive Fehleranalyse (Predictive Failure Analysis - PFA) ist eine Betriebssystemkomponente, die Daten erfasst, die erfassten Daten modelliert, um erwartete Werte oder Raten zu erstellen, und die aktuelle metrische Nutzung mit einem Faktor des erwarteten Wertes oder der Rate vergleicht, um zu ermitteln, ob ein abnormales Verhalten auftritt. Die Funktionalität der PFA erkennt präventiv Schäden in Adressräumen, die zu Systemausfällen führen können.
  • In der derzeitigen Praxis sind die Ausgabe des WLM und die Ausgabe der PFA voneinander unabhängig. Die PFA kann historische Daten auf der Grundlage von einzelnen Adressräumen, Gruppen von Adressräumen oder dem gesamten System erfassen. Die PFA erfasst jedoch weder Leistungsdaten noch Daten aus dem WLM zur Leistungsüberwachung.
  • Ausführungsformen der vorliegenden Erfindung verknüpfen die Verarbeitung von WLM und PFA, indem sie es der PFA ermöglichen, WLM-Geschwindigkeitsdaten über die Granularität einer Adressraumbasis zu erfassen, erwartete Werte auf der Grundlage der historischen Daten zu modellieren und die aktuelle Geschwindigkeit mit einem Faktor des erwarteten Wertes zu vergleichen. Anhand dieser modellierten Daten wird ermittelt, ob ein Adressraum normal arbeitet oder ein unterdurchschnittliches Verhalten aufweist und somit beeinträchtigt ist. Mittels der daraus resultierenden Auswertung wird dann ermittelt, ob im System eine Leistungsanomalie vorliegt. Eine Ermittlung einer Leistungsanomalie wird dazu verwendet, einen Prozess auszulösen, der direkt das Automatisierungsprodukt der Anlage und/oder einen Systemadministrator alarmieren kann, um die Leistungsanomalie sofort zu beheben. Zum Beispiel kann das Automatisierungsprodukt der Anlage einen Bericht und/oder ein Problemticket erzeugen und das Erfassen relevanter Diagnosedaten auslösen, um weitere Problemsymptome zu ermitteln.
  • Ausführungsformen der vorliegenden Erfindung werden nun im Zusammenhang mit den Figuren näher beschrieben.
  • 1 ist ein Funktionsblockschaltbild eines Computersystems 100. Das Datenverarbeitungssystem umfasst ein Computersystem/einen Server (Server) 12 gemäß einer Ausführungsform der Erfindung. Computersystem 100 kann mehr als einen Server 12 umfassen. Server 12 kann jeden Computer umfassen, der in der Lage ist, die Funktionen des Hosting und der Ausführung eines WLM und einer PFA auszuführen; große Mengen an Protokoll- und ähnlichen Daten (zum Beispiel Terabytes oder mehr) von der Hardware, dem Betriebssystem und den Anwendungen zu empfangen; eine statistische Analyse der Protokoll- und ähnlichen Daten durchzuführen; und die erfassten Daten zu modellieren, um zu ermitteln, ob bei einer oder mehreren Arbeitslasten eine Anomalie vorliegt.
  • Die Funktionen und Prozesse des Servers 12 können im Zusammenhang mit von einem Computersystem ausführbaren Befehlen beschrieben werden, wie zum Beispiel Programmmodule, Routinen, Objekte, Datenstrukturen und Logik usw., die bestimmte Aufgaben ausführen oder bestimmte abstrakte Datentypen umsetzen. Server 12 kann Teil einer verteilten Cloud-Computing-Umgebung sein, in der ein oder mehrere Server 12 Aufgaben ausführen, die über ein Verkehrsnetz verbunden sind, wie zum Beispiel ein Netzwerk 13.
  • Wie in 1 dargestellt, kann der Server 12 einen oder mehrere Prozessoren oder Verarbeitungseinheiten 16, einen Systemspeicher 28 und einen Bus 18 umfassen, der verschiedene Systemkomponenten einschließlich des Systemspeichers 28 mit der Verarbeitungseinheit 16 verbindet.
  • Bus 18 repräsentiert eine oder mehrere von mehreren Arten von Busstrukturen, unter anderem einen Speicherbus oder eine Speichersteuerung, einen Peripheriebus, einen beschleunigten Grafikanschluss und einen Prozessor oder lokalen Bus, der eine von verschiedenen Busarchitekturen verwendet.
  • Server 12 umfasst in der Regel eine Vielfalt von durch ein Computersystem lesbaren Medien. Bei diesen Medien kann es sich um alle verfügbaren Medien handeln, auf die über Computersystem/Server 12 zugegriffen werden kann, und sie umfassen sowohl flüchtige als auch nichtflüchtige Medien, Wechselmedien und nicht wechselbare Medien.
  • Systemspeicher 28 kann durch ein Computersystem lesbare Medien in Form eines flüchtigen Speichers umfassen, z.B. RAM (Random Access Memory) 30 und/oder Cache 32. Server 12 kann außerdem andere wechselbare/nicht wechselbare, flüchtige/nichtflüchtige Speichermedien für Computersysteme umfassen. Zum Beispiel kann das Speichersystem 34 ein nicht wechselbares, nichtflüchtiges magnetisches Medium, zum Beispiel eine „Festplatte“, und ein optisches Plattenlaufwerk zum Lesen von oder Schreiben auf eine wechselbare, nichtflüchtige optische Platte wie eine CD-ROM, DVD-ROM oder andere optische Medien umfassen. Jede Einheit des Speichersystems 34 kann über eine oder mehrere Datenträgerschnittstellen, wie zum Beispiel die E/A-Schnittstelle 22, mit dem Bus 18 verbunden werden.
  • Jedes Programm 40 ist eines von einer Mehrzahl von Programmen, die im Speichersystem 34 gespeichert sind und zur Ausführung in den Speicher 28 geladen werden. Ein Programm 40 umfasst eine Instanz eines Betriebssystems, eine Anwendung, ein Systemdienstprogramm oder Ähnliches. Jedes Programm 40 umfasst ein oder mehrere Module 42. In der vorliegenden Erfindung sind sowohl WLM als auch PFA Beispiele für das Programm 40. Es sind verschiedene Konfigurationen des WLM und der PFA möglich. Zum Beispiel können sich WLM und PFA auf demselben Server 12 befinden.
  • Server 12 kann auch mit einer oder mehreren externen Einheiten 14 Daten austauschen wie einer Tastatur, einer Zeigeeinheit, einer Anzeige 24 usw.; einer oder mehreren Einheiten, anhand derer ein Benutzer mit Server 12 interagieren kann; und/oder allen Einheiten (z.B. Netzwerkkarte, Modem usw.), anhand derer Server 12 mit einer oder mehreren anderen Computereinheiten Daten austauschen kann. Eine solche Datenübertragung kann über Eingabe/Ausgabe- (E/A-) Schnittstellen 22 erfolgen. Server 12 kann über den Netzwerkadapter 20 mit einem oder mehreren Netzwerken Daten austauschen, wie zum Beispiel dem Netzwerk 13. Wie dargestellt, tauscht der Netzwerkadapter 20 über den Bus 18 Daten mit den anderen Komponenten des Servers 12 aus. Andere Hardware- und/oder Softwarekomponenten können, auch wenn sie nicht dargestellt sind, in Verbindung mit Server 12 verwendet werden. Zu Beispielen gehören, ohne auf diese beschränkt zu sein: Mikrocode, Einheitentreiber, redundante Verarbeitungseinheiten, externe Plattenlaufwerkarrays, RAID-Systeme, Bandlaufwerke und Speichersysteme zur Datenarchivierung usw.
  • 2 zeigt ein Prädiktives Fehleranalysesystem (PFA-System) 200, das auf dem Computersystem 100 von 1 implementiert werden kann gemäß Ausführungsformen der vorliegenden Erfindung.
  • Der Adressraum für die Prädiktive Fehleranalyse (PFA-Adressraum) 215 des PFA-Systems 200 empfängt Leistungsrohdaten 250 vom WLM in Echtzeit oder nahezu in Echtzeit oder als Stapel. Die Häufigkeit des Erfassens der Leistungsrohdaten 250 kann konfiguriert werden. Zum Beispiel erfolgt das Erfassen standardmäßig jede Minute, kann aber auch anders konfiguriert werden. Die empfangenen Leistungsdaten 250 werden in der Datensammlung 220 zur weiteren Verarbeitung gespeichert.
  • Weitere konfigurierbare Parameter umfassen eine Mindestanzahl von Minuten, für die ein Adressraum aktiviert sein muss (Betriebszeit), bevor die PFA historische Daten erfasst. Dadurch wird vermieden, dass Daten für Adressräume erfasst werden, die nur vorübergehend oder kurz ausgeführt werden. Die Standardeinstellung beträgt sechzig Minuten. Wenn ein Adressraum endet und neu gestartet wird, gilt der Adressraum als neue Aufgabe, und die Mindestbetriebszeit muss eingehalten werden. Die Daten aus dem gleichnamigen Adressraum werden nicht bei der Modellierung des erneut aktivierten Adressraums verwendet. Mehrere Adressräume mit demselben Namen werden mittels des Schlüssels Name/Adressraumkennung/Startzeit getrennt erfasst. Ein Adressraum, der innerhalb der ersten Stunde nach dem einleitenden Programmladen (Initial Program Load - IPL) des Servers beginnt, braucht nicht zu warten, bevor er erfasst wird. Dieser Adressraum muss jedoch ein vollständiges Erfassungsintervall lang aktiv sein, bevor er erfasst wird.
  • Mittels eines konfigurierbaren Parameters „Kategorien“ kann festgelegt werden, welche Kategorien von Adressräumen erfasst werden sollen. Die Angabe einer niedrigeren Kategorie umfasst automatisch auch die höhere Kategorie. Wird zum Beispiel WICHTIG festgelegt, wird sowohl die Kategorie KRITISCH als auch die Kategorie WICHTIG erfasst.
  • Ein KRITISCHER Adressraum ist ein Adressraum, der kritische Systemarbeit und - infrastruktur kennzeichnet, zum Beispiel Systemaufgaben. Ein WICHTIGER Adressraum umfasst KRITISCHE Adressräume sowie kritische Middleware-Server, die als sehr wichtig definiert sind. Eine NORMALE Adresse umfasst die Adressräume KRITISCH und WICHTIG sowie normale Arbeit. Normale Arbeit umfasst Anwendungen und Dienste, die keine Server sind. Mittels der Standardeinstellung WICHTIG werden serverbasierte Adressräume in die Sammlung aufgenommen, sofern sie die Anforderungen an die Betriebszeit erfüllen und nicht ausdrücklich durch einen Konfigurationsparameter von dem Erfassen ausgeschlossen sind. Beliebige Arbeit ist keine zulässige Kategorie.
  • Der PFA-Adressraum 215 kann eine oder mehrere Schnittstellen bereitstellen wie zum Beispiel eine grafische Benutzeroberfläche, eine Befehlszeile und eine Parameterdatei, um Verwaltungsbefehle zur Durchführung von Aktionen in der Datensammlung 220 zu empfangen. Aktionen können bestimmen, welche Arbeitslast-, Adressraum- und/oder Aufgabendaten in die WLM-Datensammlung aufgenommen oder davon ausgeschlossen werden sollen. Die verschiedenen Aktionen können ferner bestimmen, welche der Datensammlungen 220 in der Modellierung der Prädiktiven Fehleranalyse (PFA-Modellierung) 225 enthalten sein sollen. Zusätzliche Parameter zur Steuerung des Betriebs des PFA-Adressraums 215 umfassen Parameter zum Stoppen/Starten/Ändern der Erfassung bestimmter Datenklassen, zum Hinzufügen/Löschen von Arbeitslasten und Adressräumen für die Erfassung und zum Ausschließen bestimmter Aufgaben von der Erfassung. Ein zusätzlicher Parameter kann bestimmen, wie oft die Datensammlung 220 analysiert und modelliert werden soll. Die Datensammlung 220 kann nach Adressraumquelle, Datum, Datensatztyp oder anderen Kriterien sortiert werden. Die Datensammlung 220 wird in die PFA-Modellierung 225 eingegeben und wird zu historischen Daten 230, um das Modell zu aktualisieren. Der PFA-Adressraum 215 speichert die vorangegangenen Rohdatensammlungen von einer Stunde, vierundzwanzig Stunden und sieben Tagen als historische Daten 230. Diese Zeiträume können konfigurierbar sein. Frühere Modelle können in den historischen Daten 230 gespeichert werden. Die PFA-Modellierung 225 kann maschinelles Lernen verwenden, das kundenspezifische Algorithmen aufweist, die von dem das PFA-System 200 ausführende Unternehmen entwickelt wurden. Die PFA-Modellierung 225 kann die Vorteile von APIs für den Export von Anwendungsprogrammierschnittstellen aus einem oder mehreren Softwarepaketen zur statistischen Modellierung nutzen, wie zum Beispiel IBM Watson ® Machine Learning, um das Modell zu erstellen.
  • 3 zeigt einen Arbeitsablauf eines PFA-Systems 200 gemäß den Ausführungsformen der vorliegenden Erfindung.
  • Bei 310 empfängt der PFA-Adressraum 215 Geschwindigkeitsdaten vom WLM. Die Geschwindigkeit kann berechnet werden als (Verwendungsproben * 100) / (Verwendungsproben + Verzögerungsproben), wobei Verwendungsproben alle Arten von Verwendungsproben von Prozessoren umfasst (zum Beispiel CPU, Speicher, Cache) sowie E/A-Verwendungsproben. Verzögerungsproben umfassen alle Arten von Prozessorverzögerungen, E/A-Verzögerungen, Speicherverzögerungen und Warteschlangenverzögerungen. Auf der Grundlage von diesen sogenannten „Verwendungs“- und „Verzögerungs“-Proben wird die WLM-Adressraumgeschwindigkeit berechnet, die ein Maß dafür ist, wie schnell die Arbeit ausgeführt werden sollte, wenn sie bereit ist, ohne dass es zu Verzögerungen durch WLM-verwaltete Ressourcen kommt. Die Geschwindigkeit ist ein Prozentwert zwischen „0“ und „100“. Ein niedriger Geschwindigkeitswert zeigt an, dass ein Adressraum nur über wenige der von ihm benötigten Ressourcen verfügt und mit anderen Adressräumen um Ressourcen konkurriert. Ein hoher Geschwindigkeitswert zeigt an, dass ein Adressraum über alle Ressourcen verfügt, die er zur Ausführung benötigt. Zum Beispiel zeigt „100“ an, dass in dem untersuchten Adressraum keine Verzögerungen bei den vom WLM verwalteten Prozessor- oder E/A-Ressourcen aufgetreten sind.
  • Bei 320 weist der PFA-Adressraum 215 die PFA-Modellierung 225 an, die Geschwindigkeitsdaten zu modellieren. Die Modellierung führt zu einem erwarteten Geschwindigkeitswert für jeden überwachten Adressraum. Der Geschwindigkeitswert wird für jeden Adressraum standardmäßig alle zwölf Stunden berechnet. Der erwartete Geschwindigkeitswert wird für eine Stunde historischer Daten, vierundzwanzig Stunden historischer Daten und sieben Tage historischer Daten berechnet. Diese Zeiträume können konfigurierbar sein.
  • Bei 330 wird die aktuelle Geschwindigkeit mit einem Faktor, d. h. einem Prozentsatz, des erwarteten Geschwindigkeitswerts verglichen.
  • Wenn der Vergleich bei 340 anzeigt, dass die aktuelle Geschwindigkeit im Vergleich zum Faktor des erwarteten Geschwindigkeitswerts zu niedrig ist, meldet der PFA-Adressraum 215 bei 350 die Anomalie und die Auswirkungen auf der Grundlage der WLM-Einstellungen für die Wichtigkeitsstufe. Es wird eine Warnmeldung erzeugt, die in ein Automatisierungssystem eingegeben werden kann, um Problemtickets zu erzeugen und IT-Personal zu benachrichtigen. Die Anomalie kann auch an eine Betriebssystemkomponente gemeldet werden, die Laufzeitdiagnosen durchführt. Die Warnmeldung kann eine Anwendungskennung, wie zum Beispiel den Namen oder die Aufgabennummer, eine Serverkennung, einen Indikator für die Art des Problems, zum Beispiel Systemmeldungen, umfassen. Die Wichtigkeitsstufe zeigt an, wie wichtig es ist, dass die Arbeitslast ihr Leistungsziel erreicht. Zum Beispiel wird nach einer Phase der Datenmodellierung, um die Grenzen der Normalität festzulegen, ein Leistungsproblem in einem Adressraum erkannt und gemeldet, selbst wenn dessen WLM-Serviceklasse die Ziele erfüllt, noch bevor es von einem Administrator bemerkt werden kann.
  • 4 zeigt eine beispielhafte Datenverarbeitungseinheit 400, die für die Ausführung des Algorithmus von 3 geeignet ist. Datenverarbeitungseinheit 400 kann entsprechende Sätze interner Komponenten 800 und externer Komponenten 900 umfassen, die zusammen eine Umgebung für eine Softwareanwendung bereitstellen können. Jeder der Sätze interner Komponenten 800 umfasst einen oder mehrere Prozessoren 820; einen oder mehrere durch einen Computer lesbare RAMs 822; einen oder mehrere durch einen Computer lesbare ROMs 824 an einem oder mehreren Bussen 826; ein oder mehrere Betriebssysteme 828, die den Algorithmus von 3 ausführen, und eine oder mehrere durch einen Computer lesbare physische Speichereinheiten 830. Das eine oder die mehreren Betriebssysteme 828 werden auf einer oder mehreren der jeweiligen durch einen Computer lesbaren physischen Speichereinheiten 830 gespeichert, um durch einen oder mehrere der jeweiligen Prozessoren 820 über einen oder mehrere der jeweiligen RAMs 822 (die für gewöhnlich einen Cache umfassen) ausgeführt zu werden. In der in 4 gezeigten Ausführungsform ist jede der durch einen Computer lesbaren physischen Speichereinheiten 830 eine Magnetplatten-Speichereinheit einer internen Festplatte. Alternativ ist jede der durch einen Computer lesbaren physischen Speichereinheiten 830 eine Halbleiterspeichereinheit wie ROM 824, EPROM, Flash-Speicher oder eine andere durch einen Computer lesbare physische Speichereinheit, die ein Computerprogramm und digitale Informationen speichern kann.
  • Jeder der Sätze interner Komponenten 800 umfasst auch ein Schreib/Lese-Laufwerk oder eine Schnittstelle 832, um von einer oder mehreren durch einen Computer lesbaren physischen Speichereinheiten 936 wie CD-ROM, DVD, SSD, USB-Speicherstick und Magnetplatte zu lesen und darauf zu schreiben.
  • Jeder der Sätze interner Komponenten 800 kann auch Netzwerkadapter (oder Switchport-Karten) oder Schnittstellen 836 umfassen, wie zum Beispiel TCP/IP-Adapterkarten, drahtlose WLAN-Schnittstellenkarten oder 3G- oder 4G-Mobilfunkschnittstellenkarten oder andere drahtgebundene oder drahtlose Datenübertragungen. Das Betriebssystem 828, das der Datenverarbeitungseinheit 400 zugehörig ist, kann von einem externen Computer (z.B. Server) über ein Netzwerk (zum Beispiel das Internet, ein lokales Netzwerk oder ein anderes Weitverkehrsnetzwerk) und entsprechende Netzwerkadapter oder Schnittstellen 836 auf die Datenverarbeitungseinheit 400 heruntergeladen werden. Aus dem Netzwerk werden Adapter (oder Switchport-Adapter) oder Schnittstellen 836 und das der Datenverarbeitungseinheit 400 zugehörige Betriebssystem 828 auf die jeweilige Festplatte 830 und den Netzwerkadapter 836 geladen.
  • Die externen Komponenten 900 können auch einen Berührungsbildschirm 920, eine Tastatur 930 und eine Zeigeeinheit 934 umfassen. Einheitentreiber 840, Schreib/Lese-Laufwerk oder Schnittstelle 832 und Netzwerkadapter oder Schnittstelle 836 weisen Hardware und Software auf (gespeichert in der Speichereinheit 830 und/oder im ROM 824).
  • Verschiedene Ausführungsformen der Erfindung können in einem Datenverarbeitungssystem umgesetzt werden, das für das Speichern und/oder Ausführen von Programmcode geeignet ist und mindestens einen Prozessor umfasst, der direkt oder indirekt mit Speicherelementen über einen Systembus verbunden ist. Die Speicherelemente umfassen zum Beispiel lokalen Speicher, der während der tatsächlichen Ausführung des Programmcodes verwendet wird, Massenspeicher und Cache, die eine temporäre Speicherung zumindest eines Teils des Programmcodes bereitstellen, um die Anzahl der Abrufe von Code aus dem Massenspeicher während der Ausführung zu verringern.
  • Eingabe/Ausgabe- oder E/A-Einheiten (darunter, ohne auf diese beschränkt zu sein, Tastaturen, Bildschirme, Zeigeeinheiten, DASD, Bänder, CDs, DVDs, USB-Sticks und andere Speichermedien usw.) können entweder direkt oder über zwischengeschaltete E/A-Steuerungen mit dem System verbunden werden. Netzwerkadapter können ebenfalls mit dem System verbunden werden, damit das Datenverarbeitungssystem mit anderen Datenverarbeitungssystemen oder entfernten Druckern oder Speichereinheiten über zwischengeschaltete private oder öffentliche Netzwerke verbunden werden kann. Modems, Kabelmodems und Ethernet-Karten sind nur einige der verfügbaren Arten von Netzwerkadaptern.
  • Bei der vorliegenden Erfindung kann es sich um ein System, ein Verfahren und/oder ein Computerprogrammprodukt auf jeder möglichen technischen Detailstufe der Integration handeln. Das Computerprogrammprodukt kann (ein) durch einen Computer lesbare(s) Speichermedium (oder -medien) umfassen, auf dem/denen durch einen Computer lesbare Programmanweisungen gespeichert ist/sind, um einen Prozessor dazu zu veranlassen, Aspekte der vorliegenden Erfindung auszuführen.
  • Bei dem durch einen Computer lesbaren Speichermedium kann es sich um eine physische Einheit handeln, die Anweisungen zur Verwendung durch ein System zur Ausführung von Anweisungen behalten und speichern kann. Bei dem durch einen Computer lesbaren Speichermedium kann es sich zum Beispiel um eine elektronische Speichereinheit, eine magnetische Speichereinheit, eine optische Speichereinheit, eine elektromagnetische Speichereinheit, eine Halbleiterspeichereinheit oder jede geeignete Kombination daraus handeln, ohne auf diese beschränkt zu sein. Zu einer nicht erschöpfenden Liste spezifischerer Beispiele des durch einen Computer lesbaren Speichermediums gehören die folgenden: eine tragbare Computerdiskette, eine Festplatte, ein Direktzugriffsspeicher (RAM), ein Nur-Lese-Speicher (ROM), ein löschbarer programmierbarer Nur-Lese-Speicher (EPROM bzw. Flash-Speicher), ein statischer Direktzugriffsspeicher (SRAM), ein tragbarer Kompaktspeicherplatte-Nur-Lese-Speicher (CD-ROM), eine DVD (digital versatile disc), ein Speicher-Stick, eine Diskette, eine mechanisch codierte Einheit wie zum Beispiel Lochkarten oder erhabene Strukturen in einer Rille, auf denen Anweisungen gespeichert sind, und jede geeignete Kombination daraus. Ein durch einen Computer lesbares Speichermedium soll in der Verwendung hierin nicht als flüchtige Signale an sich aufgefasst werden, wie zum Beispiel Funkwellen oder andere sich frei ausbreitende elektromagnetische Wellen, elektromagnetische Wellen, die sich durch einen Wellenleiter oder ein anderes Übertragungsmedium ausbreiten (z.B. ein Lichtwellenleiterkabel durchlaufende Lichtimpulse) oder durch einen Draht übertragene elektrische Signale.
  • Hierin beschriebene, durch einen Computer lesbare Programmanweisungen können von einem durch einen Computer lesbaren Speichermedium auf jeweilige Datenverarbeitungs/Verarbeitungs-Einheiten oder über ein Netzwerk wie zum Beispiel das Internet, ein lokales Netzwerk, ein Weitverkehrsnetz und/oder ein drahtloses Netzwerk auf einen externen Computer oder eine externe Speichereinheit heruntergeladen werden. Das Netzwerk kann Kupferübertragungskabel, Lichtwellenübertragungsleiter, drahtlose Übertragung, Leitwegrechner, Firewalls, Vermittlungseinheiten, Gateway-Computer und/oder Edge-Server aufweisen. Eine Netzwerkadapterkarte oder Netzwerkschnittstelle in jeder Datenverarbeitungs/Verarbeitungs-Einheit empfängt durch einen Computer lesbare Programmanweisungen aus dem Netzwerk und leitet die durch einen Computer lesbaren Programmanweisungen zur Speicherung in einem durch einen Computer lesbaren Speichermedium innerhalb der entsprechenden Datenverarbeitungs/Verarbeitungs-Einheit weiter.
  • Bei durch einen Computer lesbaren Programmanweisungen zum Ausführen von Arbeitsschritten der vorliegenden Erfindung kann es sich um Assembler-Anweisungen, ISA-Anweisungen (Instruction-Set-Architecture), Maschinenanweisungen, maschinenabhängige Anweisungen, Mikrocode, Firmware-Anweisungen, zustandssetzende Daten, Konfigurationsdaten für integrierte Schaltungen oder entweder Quellcode oder Objektcode handeln, die in einer beliebigen Kombination aus einer oder mehreren Programmiersprachen geschrieben werden, darunter objektorientierte Programmiersprachen wie Smalltalk, C++ o.ä. sowie herkömmliche prozedurale Programmiersprachen wie die Programmiersprache „C“ oder ähnliche Programmiersprachen. Die durch einen Computer lesbaren Programmanweisungen können vollständig auf dem Computer des Benutzers, teilweise auf dem Computer des Benutzers, als eigenständiges Software-Paket, teilweise auf dem Computer des Benutzers und teilweise auf einem fernen Computer oder vollständig auf dem fernen Computer oder Server ausgeführt werden. In letzterem Fall kann der entfernt angeordnete Computer mit dem Computer des Benutzers durch eine beliebige Art Netzwerk verbunden sein, darunter ein lokales Netzwerk (LAN) oder ein Weitverkehrsnetz (WAN), oder die Verbindung kann mit einem externen Computer hergestellt werden (zum Beispiel über das Internet unter Verwendung eines Internet-Dienstanbieters). In einigen Ausführungsformen können elektronische Schaltungen, darunter zum Beispiel programmierbare Logikschaltungen, vor Ort programmierbare Gatter-Anordnungen (FPGA, field programmable gate arrays) oder programmierbare Logikanordnungen (PLA, programmable logic arrays) die durch einen Computer lesbaren Programmanweisungen ausführen, indem sie Zustandsinformationen der durch einen Computer lesbaren Programmanweisungen nutzen, um die elektronischen Schaltungen zu personalisieren, um Aspekte der vorliegenden Erfindung durchzuführen.
  • Aspekte der vorliegenden Erfindung sind hierin unter Bezugnahme auf Ablaufpläne und/oder Blockschaltbilder bzw. Schaubilder von Verfahren, Vorrichtungen (Systemen) und Computerprogrammprodukten gemäß Ausführungsformen der Erfindung beschrieben. Es wird darauf hingewiesen, dass jeder Block der Flussdiagramm-Darstellungen und/oder der Blockschaubilder sowie Kombinationen von Blöcken in den Flussdiagramm-Darstellungen und/oder den Blockschaubildern mittels durch einen Computer lesbare Programmanweisungen ausgeführt werden können.
  • Diese durch einen Computer lesbaren Programmanweisungen können einem Prozessor eines Computers oder einer anderen programmierbaren Datenverarbeitungsvorrichtung bereitgestellt werden, um eine Maschine zu erzeugen, so dass die über den Prozessor des Computers bzw. der anderen programmierbaren Datenverarbeitungsvorrichtung ausgeführten Anweisungen ein Mittel zur Umsetzung der in dem Block bzw. den Blöcken der Ablaufpläne und/oder der Blockschaltbilder bzw. Schaubilder festgelegten Funktionen/Schritte erzeugen. Diese durch einen Computer lesbaren Programmanweisungen können auch auf einem durch einen Computer lesbaren Speichermedium gespeichert sein, das einen Computer, eine programmierbare Datenverarbeitungsvorrichtung und/oder andere Einheiten so steuern kann, dass sie auf eine bestimmte Art funktionieren, so dass das durch einen Computer lesbare Speichermedium, auf dem Anweisungen gespeichert sind, ein Herstellungsprodukt aufweist, darunter Anweisungen, welche Aspekte der/des in dem Block bzw. den Blöcken des Ablaufplans und/oder der Blockschaltbilder bzw. Schaubilder angegebenen Funktion/Schritts umsetzen.
  • Die durch einen Computer lesbaren Programmanweisungen können auch auf einen Computer, eine andere programmierbare Datenverarbeitungsvorrichtung oder eine andere Einheit geladen werden, um das Ausführen einer Reihe von Prozessschritten auf dem Computer bzw. der anderen programmierbaren Vorrichtung oder anderen Einheit zu verursachen, um einen auf einem Computer ausgeführten Prozess zu erzeugen, so dass die auf dem Computer, einer anderen programmierbaren Vorrichtung oder einer anderen Einheit ausgeführten Anweisungen die in dem Block bzw. den Blöcken des Flussdiagramms und/oder des Blockschaubilds festgelegten Funktionen/Schritte umsetzen.
  • Die Ablaufpläne und die Blockschaltbilder bzw. Schaubilder in den Figuren veranschaulichen die Architektur, die Funktionalität und den Betrieb möglicher Ausführungen von Systemen, Verfahren und Computerprogrammprodukten gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung. In diesem Zusammenhang kann jeder Block in den Ablaufplänen oder Blockschaltbildern bzw. Schaubildern ein Modul, ein Segment oder einen Teil von Anweisungen darstellen, die eine oder mehrere ausführbare Anweisungen zur Ausführung der bestimmten logischen Funktion(en) aufweisen. In einigen alternativen Ausführungen können die in den Blöcken angegebenen Funktionen in einer anderen Reihenfolge als in den Figuren gezeigt stattfinden. Zwei nacheinander gezeigte Blöcke können zum Beispiel in Wirklichkeit in einem Schritt gleichzeitig, im Wesentlichen gleichzeitig, teilweise oder vollständig zeitlich überlappend ausgeführt werden, oder die Blöcke können manchmal je nach entsprechender Funktionalität in umgekehrter Reihenfolge ausgeführt werden. Es ist ferner anzumerken, dass jeder Block der Blockschaltbilder bzw. Schaubilder und/oder der Ablaufpläne sowie Kombinationen aus Blöcken in den Blockschaltbildern bzw. Schaubildern und/oder den Ablaufplänen durch spezielle auf Hardware beruhende Systeme umgesetzt werden können, welche die festgelegten Funktionen oder Schritte durchführen, oder Kombinationen aus Spezial-Hardware und Computeranweisungen ausführen.
  • Auch wenn hier bevorzugte Ausführungsformen im Detail dargestellt und beschrieben wurden, wird es für den Fachmann offensichtlich sein, dass verschiedene Änderungen, Ergänzungen, Ersetzungen und dergleichen vorgenommen werden können, ohne vom Geist der Offenbarung abzuweichen, und diese werden daher als im Rahmen der Offenbarung liegend betrachtet, wie in den folgenden Ansprüchen definiert.

Claims (9)

  1. Verfahren zum programmatischen Erkennen von Leistungsanomalien, wobei das Verfahren aufweist: Periodisches Empfangen von Geschwindigkeitsdaten von einer Arbeitslastverwaltung für einen oder mehrere Adressräume; Erstellen eines erwarteten Geschwindigkeitswerts für jeden der ein oder mehreren Adressräume; Vergleichen eines Faktors des erwarteten Geschwindigkeitswertes mit einem aktuellen Geschwindigkeitswert aus den Geschwindigkeitsdaten; und Erzeugen einer Abhilfemaßnahme, wenn der aktuelle Geschwindigkeitswert niedriger als der Faktor ist, wodurch eine Anomalie angezeigt wird.
  2. Verfahren nach Anspruch 1, wobei die Geschwindigkeitsdaten nahezu in Echtzeit, in Echtzeit oder als Stapel empfangen werden.
  3. Verfahren nach Anspruch 1, wobei der aktuelle Geschwindigkeitswert berechnet wird als Verwendungsproben mal hundert geteilt durch eine Summe aus Verwendungsproben und Verzögerungsproben.
  4. Verfahren nach Anspruch 1, wobei das Erzeugen des erwarteten Geschwindigkeitswerts ferner aufweist: Eingeben der empfangenen Geschwindigkeits- und historischen Daten in ein Softwarepaket zur statistischen Modellierung; und Ausgeben des erwarteten Geschwindigkeitswertes.
  5. Verfahren nach Anspruch 3, wobei Verwendungsproben alle Arten der Prozessornutzung umfassen und wobei Verzögerungsproben alle Arten von Prozessorverzögerungen, E/A-Verzögerungen, Speicherverzögerungen und Warteschlangenverzögerungen umfassen.
  6. Verfahren nach Anspruch 1, wobei die Abhilfemaßnahme ein Erzeugen einer Warnmeldung für ein automatisches Problemberichterstattungssystem umfasst, wobei die Warnmeldung eine Anwendungskennung wie zum Beispiel den Namen oder die Aufgabennummer, eine Serverkennung, einen Indikator für die Art des Problems und alle Systemmeldungen umfasst.
  7. Verfahren nach Anspruch 1, wobei der Faktor der erwarteten Geschwindigkeit und der Zeitraum des Erfassens der Geschwindigkeitsdaten konfigurierbar sind.
  8. Computerprogrammprodukt zum programmatischen Erkennen von Leistungsanomalien, wobei das Computerprogrammprodukt eine nichtflüchtige, physische Speichereinheit mit darin eingebettetem Programmcode aufweist, wobei der Programmcode durch einen Prozessor eines Computers ausführbar ist, um ein Verfahren durchzuführen, wobei das Verfahren aufweist: Periodisches Empfangen von Geschwindigkeitsdaten von einer Arbeitslastverwaltung für einen oder mehrere Adressräume; Erstellen eines erwarteten Geschwindigkeitswerts für jeden der ein oder mehreren Adressräume; Vergleichen eines Faktors des erwarteten Geschwindigkeitswertes mit einem aktuellen Geschwindigkeitswert aus den Geschwindigkeitsdaten; und Erzeugen einer Abhilfemaßnahme, wenn der aktuelle Geschwindigkeitswert niedriger als der Faktor ist, wodurch eine Anomalie angezeigt wird.
  9. Computersystem zum programmatischen Erkennen von Leistungsanomalien, wobei das Verfahren aufweist: Periodisches Empfangen von Geschwindigkeitsdaten von einer Arbeitslastverwaltung für einen oder mehrere Adressräume; Erstellen eines erwarteten Geschwindigkeitswerts für jeden der ein oder mehreren Adressräume; Vergleichen eines Faktors des erwarteten Geschwindigkeitswertes mit einem aktuellen Geschwindigkeitswert aus den Geschwindigkeitsdaten; und Erzeugen einer Abhilfemaßnahme, wenn der aktuelle Geschwindigkeitswert niedriger als der Faktor ist, wodurch eine Anomalie angezeigt wird.
DE102021122077.7A 2020-09-25 2021-08-26 Programmatisches erkennen von leistungsanomalien Granted DE102021122077A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/032,121 US11556446B2 (en) 2020-09-25 2020-09-25 Programmatic performance anomaly detection
US17/032,121 2020-09-25

Publications (1)

Publication Number Publication Date
DE102021122077A1 true DE102021122077A1 (de) 2022-03-31

Family

ID=78149375

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102021122077.7A Granted DE102021122077A1 (de) 2020-09-25 2021-08-26 Programmatisches erkennen von leistungsanomalien

Country Status (5)

Country Link
US (1) US11556446B2 (de)
JP (1) JP2022054456A (de)
CN (1) CN114253751A (de)
DE (1) DE102021122077A1 (de)
GB (1) GB2600813B (de)

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5675739A (en) 1995-02-03 1997-10-07 International Business Machines Corporation Apparatus and method for managing a distributed data processing system workload according to a plurality of distinct processing goal types
US6230183B1 (en) * 1998-03-11 2001-05-08 International Business Machines Corporation Method and apparatus for controlling the number of servers in a multisystem cluster
US7587453B2 (en) * 2006-01-05 2009-09-08 International Business Machines Corporation Method and system for determining application availability
US8356306B2 (en) * 2007-07-31 2013-01-15 Hewlett-Packard Development Company, L.P. Workload management controller using dynamic statistical control
US8250581B1 (en) * 2007-10-28 2012-08-21 Hewlett-Packard Development Company, L.P. Allocating computer resources to candidate recipient computer workloads according to expected marginal utilities
US7487506B1 (en) * 2008-01-16 2009-02-03 International Business Machines Corporation Autonomous management of system throughput
US8214693B2 (en) 2009-01-08 2012-07-03 International Business Machines Corporation Damaged software system detection
US9280436B2 (en) 2009-06-17 2016-03-08 Hewlett Packard Enterprise Development Lp Modeling a computing entity
US8321362B2 (en) * 2009-12-22 2012-11-27 Intel Corporation Methods and apparatus to dynamically optimize platforms
US8849910B2 (en) * 2011-06-03 2014-09-30 Oracle International Corporation System and method for using quality of service with workload management in an application server environment
US10454843B2 (en) 2013-10-09 2019-10-22 Salesforce.Com, Inc. Extensible mechanisms for workload shaping and anomaly mitigation
US10938655B2 (en) * 2016-01-26 2021-03-02 International Business Machines Corporation Enterprise cloud garbage collector
US11184247B2 (en) 2018-06-19 2021-11-23 International Business Machines Corporation Workload management for computing cluster
US11061740B2 (en) * 2018-08-13 2021-07-13 International Business Machines Corporation Computer system workload manager
US11815984B2 (en) * 2020-02-07 2023-11-14 Intel Corporation Error handling in an interconnect

Also Published As

Publication number Publication date
GB2600813B (en) 2023-02-08
US11556446B2 (en) 2023-01-17
US20220100628A1 (en) 2022-03-31
GB2600813A (en) 2022-05-11
GB202113147D0 (en) 2021-10-27
JP2022054456A (ja) 2022-04-06
CN114253751A (zh) 2022-03-29

Similar Documents

Publication Publication Date Title
DE112012000797B4 (de) Mehrfach-Modellierungsparadigma für eine Vorhersageanalytik
DE69923435T2 (de) System und verfahren zur optimierung der leistungskontrolle von komplexen informationstechnologiesystemen
DE102014116367A1 (de) Verwaltung von leistungsstufen von informationstechnologiesystemen
DE102018113625A1 (de) Fehlerinjektionstestvorrichtung und -verfahren
DE60017457T2 (de) Verfahren zur isolierung eines fehlers in fehlernachrichten
DE112019003288T5 (de) Verwenden eines moduls mit maschinellem lernen, um zu ermitteln, wann eine fehlerprüfung eines speicherelements durchzuführen ist
DE102019218138A1 (de) Ein proaktives und automatisiertes System und Verfahren davon zum Reparieren eines suboptimalen Betriebs einer Maschine
DE202017106569U1 (de) Analyse grossangelegter Datenverarbeitungsaufträge
DE112017000210T5 (de) Selbstdiagnose von gerätetreiberdetektierten Fehlern und automatische Diagnosedatensammlung
DE102004015503A1 (de) Verfahren und Vorrichtung zum Korrigieren diagnostischer Analysekonzepte in komplexen Systemen
DE112017001376T5 (de) Erkennen und Vorhersagen von Engpässen in komplexen Systemen
DE112020004116T5 (de) Dynamisches abändern der parallelität einer aufgabe in einer pipeline
DE112013006588T5 (de) Verwaltungssystem zum Verwalten eines Computersystems und Verwaltungsverfahren hierfür
DE112011100168T5 (de) Erfassen von Diagnosedaten in einer Datenverarbeitungsumgebung
DE112019005558T5 (de) Verwendung einer auf fehlerkorrektur basierenden metrik zur identifizierung schlecht funktionierender datenspeichervorrichtungen
DE112015003759B4 (de) Bearbeiten mehrerer Zähler auf der Grundlage einer einzigen Zugangsprüfung
DE102021104735A1 (de) Log-Daten Analyse
DE112020004572T5 (de) Identifizierung von teilereignissen in einem ereignissturm in einer operationsverwaltung
DE102021122077A1 (de) Programmatisches erkennen von leistungsanomalien
DE112015004557T5 (de) Anforderungsüberwachen
EP2752724A1 (de) Verfahren zur Kontrolle von Feldgeräten, Steuergerät, Programmelement und computerlesbares Medium
DE102016203828A1 (de) Auf Zugriffsrechten beruhender Speicherfixierungsmechanismus
DE112018001444T5 (de) Verbesserte E/A-Fehlerdiagnose
DE112021003147T5 (de) Verfahren für proaktive fehlersuche bei bereitstellungs-workflows für effizienten cloud-betrieb
DE102021125859A1 (de) Konfidenzberechnungen auf datenqualitätsgrundlage für aus zeitreihendaten abgeleitete kpis

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R084 Declaration of willingness to licence