DE102008002964A1

DE102008002964A1 - Anomalieaggregationsverfahren

Info

Publication number: DE102008002964A1
Application number: DE102008002964A
Authority: DE
Inventors: Deniz Danbury Senturk-Doganaksoy; Christina Ann Lacomb; Richard J. Rucigay; Peter T. Skowronek; Andrew J. Travaly
Original assignee: General Electric Co
Current assignee: General Electric Co
Priority date: 2007-07-27
Filing date: 2008-07-24
Publication date: 2009-01-29
Also published as: US20090030753A1; CH697716A2; JP2009076056A; CN101354317A; CH697716B1

Abstract

Es ist ein Verfahren zur Aggregation anomaler Werte geschaffen. Das Verfahren weist eine Erfassung von Betriebsdaten von wenigstens einer Maschine und eine Berechnung wenigstens eines Ausnahmeanomaliewertes anhand der Betriebsdaten auf. Der Ausnahmeanomaliewert kann anschließend aggregiert werden, um akute oder chronische anomale Werte zu identifizieren.

Description

HINTERGRUND ZU DER ERFINDUNG
Die hier beschriebenen Systeme und Verfahren betreffen allgemein die Aggregation anomaler Werte. Insbesondere betreffen die Systeme und Verfahren statistische Techniken zur Aggregation ausreißender (d. h. anomaler) technischer oder betrieblicher Daten im Vergleich zu kleinen Sätzen von damit in Beziehung stehenden technischen oder betrieblichen Daten.
Im Betrieb und bei der Instandhaltung von Energieerzeugungseinrichtungen (z. B. Turbinen, Verdichtern, Generatoren, etc.) werden Sensormesswerte, die verschiedenen Eigenschaften der Maschine entsprechen, empfangen und gespeichert. Diese Sensormesswerte werden häufig als „Marken" („Tags") bezeichnet, wobei es viele Arten von Marken (z. B. Schwingungsmarken, Effizienzmarken, Temperaturmarken, Druckmarken, etc.) gibt.
Eine gründliche Überwachung dieser Marken im Laufe der Zeit ergibt viele Vorteile bei der Erfassung von beeinträchtigten Maschinenverhalten (z. B. einer internen Beschädigung an Einheiten, Verdichterereignissen, geplanten Auslösern im Vergleich zu ungeplanten). Beispielsweise können (im Zeitablauf) steigende Werte der Rotorschwingung in einem Verdichter ein Anzeichen für ein ernstes Problem darstellen. Eine bessere Kenntnis einer Beeinträchtigung in Maschinen verbessert auch Fehlerdiagnosemöglichkeiten über einen Satz von eingebauten Regeln oder Alarmen, die als Frühindikatoren für Maschinenereignisse dienen. Eine gleichzeitige Anzeige aller Markenanomalien gemeinsam mit den spezifischen Regeln/Alarmen macht eine Maschinenüberwachung und Diagnose sowie die Erzeugung neuer Regeln/Alarme äußerst effizient und effektiv. Die sofortige Aufmerksamkeit von für eine Überwachung und Diagnose verantwortlichen Personen kann unmittelbar auf kritische Abweichungen gelenkt werden.
Jedoch ist in Sensordaten eine erhebliche Menge an Rauschen enthalten. Um Rauschen zu entfernen und Beobachtungen im Zeitablauf oder zwischen Maschinen vergleichbar zu machen, müssen verschiedene Korrekturen vorgenommen und viele unterschiedliche Einflussfaktoren genutzt werden. Selbst dann ist es immer noch sehr schwierig, viele Marken gleichzeitig zu überwachen (es kann mehrere hundert oder tausende Marken geben) und die Anomalien in den Daten zu erkennen.
Das Entfernen von Rauschen aus Daten und die Erfassung oder Identifikation von Anomalien in einem nutzbaren Format (z. B. Größe und Richtung) und eine anschließende Nutzung dieser Anomalieinformation beim Regel- oder Modellaufbau stellt in vielen unterschiedlichen Wirtschaftszweigen, Technologien und Gebieten einen erforderlichen Prozess dar. In technischen Anwendungen befassen sich Überwachungs- und Diagnoseteams gewöhnlich mit dem Problem in einer routinemäßigen Weise und adhoc mit Hilfe von Kontrollkarten, Histogrammen und Streudiagrammen. Jedoch fordert diese Vorgehensweise eine subjektive Beurteilung in Bezug darauf, ob eine gegebene Marke anomal hoch oder niedrig ist.
Es sind statistische Methoden, einschließlich der sog. z-Werte (z-scores), bekannt um zu beurteilen, in welchem Maße ein bestimmter Wert in einer Gruppe einen Ausreißer darstellt, d. h. anomal ist. Typische z-Werte beruhen auf einer Berechnung des Mittelwerts und der Standardabweichung einer Gruppe. Während ein z-Wert bei der Beurteilung, in welchem Maße eine einzelne Beobachtung in einer gut besetzten Gruppe anomal ist, effektiv sein kann, hat es sich erwiesen, dass z-Werte ihre Effektivität als ein Anzeichen für die Abnormität verlieren, wenn sie auf Datensätze angewandt werden, die lediglich eine geringe Anzahl von Werten enthalten.
Bei der Berechnung von Anomaliewerten tritt häufig der Fall auf, dass es nur wenige Werte gibt, mit denen gearbeitet werden kann. Wenn beispielsweise eine Maschine (z. B. eine Turbine) mit einem Satz von sogenannten Peer-Maschinen (z. B. ähnlichen Turbinen) verglichen wird, liegt häufig der Fall vor, dass es schwierig ist, mehr als eine Hand voll Maschinen zu identifizieren, die berechtigterweise als Peers (gleichrangig) der Zielmaschine angesehen werden können. Außerdem ist es häufig erwünscht, das Leistungsverhalten von Maschinen zu beurteilen, die bei der momentanen Konfiguration nur für eine begrenzte Zeitdauer in Betrieb gewesen sein können. Infolgedessen ist es oft nicht wünschenswert oder nicht richtig, standardgemäße z-Werte als ein Maß für Anomalietreffer zu verwenden, weil standardgemäße z-Werte bei kleinen Datensätzen nicht robust bzw. aussagekräftig sind.
Demgemäß besteht ein Bedarf in der Technik nach einem Prozess, Verfahren und/oder Werkzeug, der bzw. das Anomalien, die von verschiedenen Arten von Energieerzeugungseinrichtungen erfahren werden, auf einfache Weise identifizieren, quantifizieren, aggregieren und anzeigen kann. Dieser Prozess, dieses Verfahren und/oder dieses Werkzeug sollte es ferner ermöglichen, eine Anomalieinformation in eine sinnvolle Erkenntnis, wie beispielsweise in Frühindikatoren für interessierende Ereignisse, umzuwandeln.
KURZBESCHREIBUNG DER ERFINDUNG
Es ist ein Verfahren zur Identifikation eines anomalen Wertes geschaffen. Das Verfahren weist ein Gewinnen von Betriebsdaten von wenigstens einer Maschine und ein Berechnen wenigstens eines außergewöhnlichen Anomaliewertes (nachfolgend als Ausnahmeanomaliewert bezeichnet) aus den Betriebsdaten. Die Ausnahmeanomaliewerte können anschließend aggregiert werden, um anomale Werte zu identifizieren.
Es ist ein Verfahren zur Aggregation anomaler Werte geschaffen. Das Verfahren weist ein Erfassen von Betriebsdaten von wenigstens einer Maschine und ein Berechnen wenigstens eines Ausnahmeanomaliewertes aus den Betriebsdaten auf. Die Ausnahmeanomaliewerte können aggregiert werden, indem wenigstens ein Anomaliegrößenmaß berechnet wird. Das Anomaliegrößenmaß kennzeichnet den Mittelwert der Ausnahmeanomaliewerte in einem vorbestimmten Zeitraum. Die Ausnahmeanomaliewerte können ferner aggregiert werden, indem wenigstens ein Anomaliefrequenzmaß berechnet wird. Das Anomaliefrequenzmaß kennzeichnet einen prozentualen Anteil eines vorbestimmten Zeitraums mit anomalen Werten.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
1 zeigt eine Grenzwert(Cutoff)-Tabelle für außergewöhnliche Anomaliewerte.
2 veranschaulicht die deskriptive Statistik in Bezug auf außergewöhnliche Anomaliewerte.
3 zeigt eine Kurve unter Veranschaulichung der Umrechnung zwischen den Cutoff-Werten und dem Prozentanteil der Anomalieverteilung auf der Basis der empirischen Ergebnisse für die Z-Innerhalb-Werte.
4 veranschaulicht die Verteilung der Z-Innerhalb-Werte.
5 veranschaulicht die Verteilung der Z-Zwischen-Werte.
6 veranschaulicht den Z-Innerhalb-Wert im Zeitablauf für zwei gesonderte Maschinen.
7 veranschaulicht den Z-Innerhalb-Wert im Zeitablauf für 31 gesonderte Maschinen.
8 veranschaulicht die Werte des absoluten Tagesdurchschnitts und prozentuale Anomaliewerte im Zeitablauf.
9 veranschaulicht eine Kurve eines Satzes von Daten maximaler Z-Zwischen-Perzentilwerte und maximaler Z-Innerhalb-Perzentilwerte.
10 veranschaulicht eine Tabelle mit täglichen Anomaliegrößenwerten und Anomaliefrequenzwerten sowie täglichen Perzentilen für Z-Zwischen-Werte und Z-Innerhalb-Werte.
11 veranschaulicht eine Heatmap (Warm-/Kaltdarstellung) mit mehreren Reihen und Spalten. Die Spalten der Heatmap repräsentieren Zeiträume, während die Reihen interessierende Metriken, wie beispielsweise Schwingungs- und Leistungsmesswerte, kennzeichnen.
12 veranschaulicht eine weitere Heatmap, die ein Speicherprotokoll für eine beispielhafte Maschine über einen Zeitraum von 24 Stunden liefert.
DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
Bei der Überwachung und Diagnostik (M&D, Monitoring and Diagnostics) stellt die Beseitigung von Rauschen aus Daten ein Schlüsselkonzept dar. Dieses wird nicht trivial, wenn viele Variablen gleichzeitig pro Sekunde überwacht werden müssen, und dies umso mehr, wenn eine Anpassung des Zustands (z. B. Temperatur, Betriebsmodus, Druck, etc.) erforderlich ist. Es ist hier ein Anomaliedetektions- und Aggregationsprozess- und Heatmapwerkzeug beschrieben, das bei der Überwachung und Diagnose äußerst nützlich und revolutionär ist. Der Prozess, das Verfahren und das Werkzeug, wie sie die vorliegende Erfindung verkörpert, sind besonders nützlich, wenn sie auf Energieerzeugungseinrichtungen, wie beispielsweise Verdichter, Generatoren und Turbinen, angewandt werden. Jedoch können der Prozess, das Verfahren und das Werkzeug auf eine beliebige Maschine oder ein beliebiges System angewandt werden, die bzw. das überwacht werden muss. Beispielsweise gehören zu weiteren Maschinen, die im Zusammenhang mit der vorliegenden Erfindung eingesetzt werden können, Gasturbinen, hydroelektrische Turbinen, Dampfturbinen, Biokraftstoff befeuerte Turbinen, Windenergieanlagen, Triebwerke, Generatormaschinensätze und Lokomotiven. Der Prozess, das Verfahren und das Werkzeug weisen fünf Hauptmerkmale auf:

(1) Berechnung von außergewöhnlichen bzw. Ausnahmeanomaliewerten (EAS, Exceptional Anomaly Scores) für technische Daten (z. B. Sensorbetriebsdaten). Ausnahmeanomaliewerte quantifizieren Ausreißerdaten im Vergleich zu kleinen Sätzen von damit im Zusammenhang stehenden, verwandten Daten. EAS übertrifft Z-Wert- und Kontrollkartenstatistiken hinsichtlich der Identifizierung anomaler Beobachtungen.
(2) Erzeugung mehrerer Empfindlichkeitseinstellungen für die Ausnahmeanomaliewerte, so dass Benutzer festlegen können, welchen Prozentsatz der Daten sie in einem gegebenen Satz von Marken (Tags) und Zeitpunkten effektiv und effizient überwachen können. Außerdem können diese unterschiedlichen Empfindlichkeitseinstellungen verwendet werden, um eine Diagnostik (z. B. Alarmerzeugung) hinzuzufügen.
(3) Bereitstellung von Methodiken zur Aggregation verschiedener anomaler Beobachtungen bei unterschiedlichen Datengranularitäten (z. B. stündlichen gegenüber täglichen anomalen Beobachtungen). Diese unterschiedlichen anomalen Beobachtungen können miteinander verkettet bzw. verlinkt werden und ineinander transformierbar sein. Eine stündliche anomale Beobachtung kann sich bis zu einer täglichen anomalen Beobachtung fortpflanzen.
(4) Erzeugung von Alarmen. Diese Alarme sind regelbasierte Auslöser, die durch den Endanwender definiert oder auf der Basis analytischer Mittel zur Identifikation von Ereignissen (z. B. Verdichterereignissen) mit Vorlaufzeit bereitgestellt werden können. Alarme beruhen auf Ausnahmeanomaliewerten und Sensorrohdaten. Alarme können ferner Anpassungen der Empfindlichkeitseinstellung und Aggregationseigenschaften von Ausnahmeanomaliewerten nutzen.
(5) Erzeugung von Heatmaps, die Daten in Wissen umwandeln. Eine Heatmap (Warm-/Kaltdarstellung) ist ein Ausreißer-Detektions-Visualisierungswerkzeug, das auf jede spezifizierte Maschineneinheit für eine große Anzahl ausgewählter Marken in vielen unterschiedlichen Zeitpunkten ausgeübt werden kann. Eine Heatmap veranschaulicht die Anomaliestärke und die Richtung einer „Zielbeobachtung". Eine Heatmap kann ferner eine visuelle Darstellung von Alarmen enthalten, und sie lenkt die sofor tige Aufmerksamkeit auf kritische Hot-Spot-Sensorwerte für eine gegebene Maschine. Heatmaps können ferner einen Vergleich zur Peers-Analyse liefern, der dem Betriebsteam ermöglicht, Vorläufer und Nachläufer sowie Absatzmöglichkeiten fliegend, im Betrieb mit großer Genauigkeit in unterschiedlichen Zeitmaßstäben (z. B. pro Sekunde, Minute, Stunde, Tag, etc.) zu identifizieren.

Berechnung von Ausnahmeanomaliewerten
Um Einheits-/Maschinen- und umgebungsbedingte Schwankungen zu berücksichtigen und festzustellen, ob ein gegebener Wert für eine Marke (Tag) für eine Zieleinheit außerhalb eines erwarteten Bereiches liegt (d. h. anomal ist) oder nicht, kann eine Kontextinformation genutzt werden, um eine Basis für die Analyse der Markendaten der Zieleinheit zu bilden. Diese Kontextinformation kann von zwei primären Quellen entnommen werden: dem vergangenen Verhalten der Zieleinheit und dem Verhalten von identischen Zieleinheiten (Zieleinheit-Peers). Durch Verwendung einer derartigen Kontextinformation zur Quantifizierung der typischen Größe einer innerhalb der Gruppe oder in dem eigenen Verhalten der Einheit vorliegenden Streuung bzw. Toleranz ist es möglich, momentane Markendaten mit Kontextdaten systematisch und rigoros zu vergleichen und das Niveau von anomalen Daten in den Markenwerten der Zieleinheit genau zu beurteilen.
Wie vorstehend erwähnt, wird eine Kontextinformation dazu verwendet, den Grad des Ausmaßes richtig zu beurteilen, in dem eine gegebene Marke anomal ist. Um eine effektive Bewertung zu erhalten, müssen die Kontextdaten richtig ausgewählt werden. Bei der Auswahl der geeigneten Kontextdaten in dem Zeitbereich ist es im Allgemeinen wünschenswert, die nächsten Daten, die für den interessierenden Zeitraum verfügbar sind, zu betrach ten. Da der interessierende Zeitraum gewöhnlich die letzten verfügbaren Daten umfasst, ist der geeignete Zeitrahmen, der betrachtet werden sollte, eine Folge der letzten Daten, die für die Einheit verfügbar sind – beispielsweise die den letzten zwei Kalenderwochen entsprechenden Daten. Dies verringert den Einfluss von saison- bzw. zeitabhängigen Faktoren.
Die richtigen Kontextdaten zur Berücksichtigung des Verhaltens der Gruppe und der Gesamtumgebung werden gefunden, indem eine geeignete Gruppe von gleichrangigen „Peer"-Einheiten für die Zieleinheit verwendet wird. Zum Beispiel wird eine Gruppe von Turbinen mit derselben Rahmengröße und in derselben geografischen Region ausgewählt, damit sie als die geeignete Peer-Gruppe für die Zielturbine dient.
Zusätzlich zu den vorstehend erwähnten kontextbezogenen Aspekten enthalten Kontextdaten ferner vergleichbare Betriebsbedingungen. Für diese Realisierung, und um lediglich ein Beispiel anzugeben, können vergleichbare Betriebsbedingungen derart definiert werden, dass sie einen beliebigen Zeitraum in der Vergangenheit bedeuten, in dem die Einheit innerhalb eines Fensters von 10 diegleichen OPMODE-, DWATT- und CTIM-Werte aufweist. OPMODE kann als der Betriebsmodus (z. B. langsam laufend, Spitzenausgangsleistung, 50%ige Leistungsabgabe, etc.) definiert werden. DWATT kann eine Metrik für die Leistung (z. B. die Ausgangsleistung in Megawatt) darstellen. CTIM kann als eine Temperaturmetrik (z. B. Einlasstemperatur) definiert werden. Wenn beispielsweise der Zielbeobachtungswert von OPMODE gleich 1 ist und von DWATT gleich 95 ist, könnten nur die historischen Zeiträume genutzt werden, in denen OPMODE = 1 und DWATT zwischen 90 und 100 betrug. Diese miteinander vergleichbaren Betriebsbedingungen werden als ein Teil der Systemkonfiguration definiert.
Durch Festlegung des geeigneten Kontext sowohl hinsichtlich der Zeit, der Geografie, der Rahmengröße und der Betriebsbedingungen kann die Notwendigkeit einer subjektiven Beurteilung, ob eine gegebene Marke anomal hoch oder niedrig ist, vermieden werden, und es können objektive und automatische Berechnungen durchgeführt werden, um Anomalien zu detektieren und zu quantifizieren. Zur Berechnung der Z-Innerhalb-Ausnahmeanomaliewerte (im Vergleich zur Vergangenheit) können 10–15 historische Beobachtungen verwendet werden, bei denen die Einheit unter vergleichbaren Bedingungen (wie vorstehend definiert) betrieben worden ist. Diese historischen Beobachtungen können verwendet werden, um einen Mittelwert und eine Standardabweichung zu berechnen. Anschließend kann der z-Wert der Zielbeobachtung unter Verwendung des Mittelwertes und der Standardabweichung der historischen Beobachtungen berechnet werden. Die minimale und die maximale Anzahl von Beobachtungen, die für die Berechnung des Z-Innerhalb-Ausnahmeanomaliewertes verwendet werden, ist als Teil der Systemkonfiguration definiert. Der Z-Innerhalb-Wert liefert einen Vergleich eines momentanen Betriebszustands einer speziellen Maschine mit einem früheren Betriebszustand der Maschine. Die zur Berechnung des Z-Innerhalb-Wertes verwendete Gleichung kann allgemein in der Form angegeben werden:
Für jede Einheit können bis zu acht oder mehr weitere Einheiten mit dergleichen Rahmengröße, mit ähnlichen Konfigurationen und in derselben geografischen Region als Peer-Einheiten identifiziert werden. Der Z-Zwischen-Ausnahmeanomaliewert ist ein Kennzeichen darüber, wie weit sich eine spezielle Einheit oder Maschine von ihren Peers unterscheidet. Beispielsweise eine F-Rahmen-Gasturbine verglichen mit anderen ähnlichen F-Rahmen-Gasturbinen. Zur Berechnung der Z-Zwischen-Ausnahmeanomaliewerte (im Vergleich zu Peers) kann die einzelne letzte Beobachtung von jedem der Peers, bei der der Peer unter vergleichbaren Bedingungen (wie oben definiert) betrieben wird, gewählt werden. Dies ergibt bis zu acht oder mehr Peer-Beobachtungen, mit denen ein Mittelwert und eine Standardabweichung berechnet werden. Unter Verwendung des Mittelwertes und der Standardabweichung der Peer-Gruppe kann anschließend der z-Wert der Zieleinheit berechnet werden. Die minimale und die maximale Anzahl von Beobachtungen, die für die Berechnung des Z-Zwischen-Ausnahmeanomaliewertes verwendet werden, ist als Teil der Systemkonfiguration definiert. Die zur Berechnung des Z-Zwischen-Wertes verwendete Gleichung kann allgemein in der Form angegeben werden:
Es ist zu beachten, dass der Fall vorkommt, in dem ein Wert entweder anomal hoch oder anomal niedrig sein kann. Während es im Allgemeinen eine bestimmte Richtung gibt, die als die bevorzugte Tendenz hinsichtlich eines Wertes erkannt wird (z. B. ist es allgemein besser, geringe Schwingungen zu haben als hohe Schwingungen), sollte erwähnt werden, dass diese Methode dazu vorgesehen ist, Anomalien unabhängig von ihrer Polarität zu identifizieren und zu quantifizieren. In dieser Implementierung kennzeichnet die Richtung keine „Gutigkeit" oder „Schlechtigkeit" des Wertes. Stattdessen repräsentiert sie die Richtung der Anomalie. Wenn der Ausnahmeanomaliewert im Vergleich zu der Vergangenheit eine hohe negative Zahl dar stellt, bedeutet dies, dass der Wert im Vergleich zu der Vergangenheit der Einheit außergewöhnlich niedrig ist. Wenn der Ausnahmeanomaliewert eine hohe positive Zahl darstellt, bedeutet er, dass der Wert verglichen mit der Vergangenheit der Einheit außergewöhnlich hoch ist. Die Interpretation ist für Peer bezogene Anomaliewerte ähnlich. Die Anomalierichtung der einzelnen Marken kann als Teil der Systemkonfiguration definiert werden.
Unter Verwendung dieser Techniken zur Detektion von Anomalien können Alarme erzeugt werden. Ein Alarm kann eine regelbasierte Kombination von Markenwerten im Vergleich zu anpassbaren Schwellenwerten darstellen.
Erzeugung mehrerer Empfindlichkeitseinstellungen
Für Ausnahmeanomaliewerte kann eine Umsetzung zwischen den Werten und den Prozentrestberechnungen vorgenommen werden. Insbesondere entspricht ein Bereich von Größen der Ausnahmeanomaliewerte einem Bereich von Prozentsätzen der Anomalieverteilung bei der gegebenen Verteilung der Rohmetrik. Über diese Umsetzung bzw. Umrechnung kann ein Analytiker die Ausnahmeanomaliewert-Cutoff-Werte herausgreifen, die „Alarme" oder „Red Flags" für die Rohmetriken kennzeichnen. Zusätzlich ermöglicht sie eine einfache Benutzung für den Endanwender, der frei entscheiden kann, welcher Prozentsatz hinreichend hoch ist, um als eine „Anomalie" bezeichnet zu werden. Außerdem kann über diese Umsetzung die Definition der „Anomalie" von Anwendung zu Anwendung, von Geschäftszweig zu Geschäftszweig oder von einer Metrik zur anderen ja nach Bedarf leicht verändert werden.
1 (Grenzwert(Cutoff)-Tabelle für Ausnahmeanomaliewerte) stellt eine Umrechnungstabelle dar, die verwendet werden kann, wenn die Rohmetrik normal verteilt ist und die Anomalie definition zweiseitig ist (d. h. sowohl hohe als auch niedrige Größenwerte der Rohmetrik würden anomale Bereiche haben, für die sich der Endanwender interessiert). Wenn beispielsweise der Stichprobenumfang 8 beträgt (Reihe 110) und die Rohmetrik annahmegemäß normal verteilt ist, wird erwartet, dass 0,15% (Zelle 130) der Fälle unter einen Ausnahmeanomaliewert von –6 und oberhalb von 6 (Spalte 120) fallen. In anderen Worten, wenn das Überwachungs- und Diagnostikteam gewillt ist, die oberen 0,15% Beobachtungen als „außerhalb der Norm" innerhalb einer Metrik zu erkunden, sollte es 6 als die Cutoff-Grenze auswählen, wenn vorausgesetzt ist, dass ihr Stichprobenumfang 8 beträgt und eine Normalverteilung angenommen wird. Diese Tabelle veranschaulicht ferner die Beziehung zwischen den z-Werten und den Ausnahmeanomaliewerten. Wenn der Stichprobenumfang steigt und wenn eine Normalverteilung angenommen wird, werden die z-Werte und die Ausnahmeanomaliewerte annähernd gleich.
In einer Turbine oder einem Verdichter können die Sensordaten beispielsweise über 300 unterschiedliche Marken mit vielen unterschiedlichen Formen der Verteilungen aufweisen. Es ist eine Empfindlichkeitsanalyse erforderlich um zu sehen, ob dieselben Cutoff-Werte in den allen Marken verwendet werden können oder ob unterschiedliche Cutoff-Werte für unterschiedliche Marken benötigt werden. In anderen Worten muss bei den gegebenen hochdimensionalen Sensordaten ein Test durchgeführt werden, wie robust die Umrechnungstabellen über unterschiedliche Verteilungen hinweg sind. Obwohl unterschiedliche Marken unterschiedliche Formen und Maßstäbe von Verteilungen aufweisen können, können die Z-Innerhalb- und Z-Zwischen-Werte bei diesen Marken eine geringere Vielfalt an Formen und hinsichtlich der Größenauslegung aufweisen. In all den Z-Innerhalb- und Z-Zwischen-Verteilungen sind natürliche Cutoff-Grenzen bei Ausnahmeanomaliewerten von 2, 6, 17, 50 und 150 ermittelt worden. Jedoch muss eine zusätzliche systematische empirische Un tersuchung durchgeführt werden, um die Cutoff-Grenzen und die zugehörigen Prozentsätze der Anomalieverteilung zu bestimmen.
Die Ausnahmeanomaliewerte werden in 11 „Eimer" (Buckets) klassifiziert (d. h. (–2, 2) = Eimer0, (2, 6) = Eimer1, (6, 17) = Eimer2, (17, 50) = Eimer3, (50, 150) = Eimer4, (150 und mehr) = Eimer5, (–6, –2) = Eimer–1, (–17, –6) = Eimer–2, (–50, –17) = Eimer–3, (–150, –50) = Eimer–4, (–150 und darunter) = Eimer-5). Für jede Marke wird der Prozentsatz der in jeden Eimer fallenden z-Innerhalb-Werte berechnet. Anschließend wird die Verteilung für diejenigen Prozentsätze in den Marken für jeden Eimer aufgezeichnet, und es werden sowohl die Quartilen als auch das 95%-Konfidenzintervall für den Medianwert berechnet.
2 veranschaulicht die deskriptive Statistik für den Anomaliewert und zeigt ein Beispiel für diese Berechnungen an dem Eimer5. Der Bereich 210 stellt ein Histogramm dar und zeigt die Verteilung der Wahrscheinlichkeit oder Prozentwerte. Dies sind die Wahrscheinlichkeiten dafür, dass ein Anomalietreffer bei oder oberhalb des Cutoff-Wertes von 150 für Z-Innerhalb-Werte erhalten wird. Der Bereich 220 zeigt ein Boxendiagramm, das wiederum die Verteilungen der Wahrscheinlichkeit oder Prozentwerte für einen Anomaliewert bei oder oberhalb von 150 zeigt. Bereich 230 veranschaulicht das 95%-Konfidenzintervall für den Verteilungsmittelwert der Wahrscheinlichkeit oder Prozentwerte. Die vertikale Linie in der Box kennzeichnet den Mittelwert, während die Begrenzungen der Box den minimalen und den maximalen Wert für das Konfidenzintervall kennzeichnen. Ein weiteres Boxendiagramm ist bei 240 angezeigt, und dieses veranschaulicht das 95%-Konfidenzintervall für den Verteilungsmedianwert der Wahrscheinlichkeit oder Prozentwerte. Die Linie in dieser Box kennzeichnet den Medianwert, und die Begrenzungen der Box kennzeichnen den minimalen und den maxi malen Wert für das Konfidenzintervall. Die in dem Bereich 250 aufgelistete Statistik repräsentiert einen Test auf Normalverteilung für die veranschaulichte Verteilung, wobei die zugrundeliegende Statistik, wie der Mittelwert und der Medianwert sowie die Konfidenzintervalle für die Grundstatistik angezeigt werden. Der Medianwert für die Eimer5-Verteilung beträgt ungefähr 0,1%, was kennzeichnet, dass etwa 0,1% der Z-Innerhalb-Treffer bei oder oberhalb des Cutoff-Wertes von 150 liegen. Das 95%-Konfidenzintervall für den Medianwert liegt bei 0,07%–1,3%.
Berechnungen, die denjenigen in 2 ähnlich sind, werden für alle Eimer gesondert, somit für alle Cutoff-Werte für Z-Innerhalb- und Z-Zwischen-Werte durchgeführt. Die Ergebnisse der Analyse zeigen, dass für die gegebenen Sensordaten ähnliche Cutoff-Werte über die Marken hinweg verwendet werden können und dass somit die Umrechnungstabellen sowie die im Voraus festgelegten Cutoff-Werte hinsichtlich der Rohmarken-Verteilungsunterschiede robust sind.
3 zeigt die Umrechnung zwischen den Cutoff-Werten und den Prozentsätzen der Anomalieverteilung, die auf den empirischen Ergebnissen für die Z-Innerhalb-Werte basiert. Auf der Basis der empirischen Untersuchung wird erwartet, dass ungefähr 6% der Anomalietreffer Ausnahmeanomalietrefferwerte zwischen 2 und 6 aufweisen. Es sollte erwähnt werden, dass diese erwarteten Anomalieprozentsätze, die auf einem realen Datensatz beruhen, den Prozentsätzen, die auf der in 1 dargestellten Simulationsuntersuchung beruhen, sehr ähnlich sind. Im Einzelnen wird erwartet, dass 6,7% der Treffer oberhalb des Cutoff-Wertes von 2 liegen, während 13,4% der Treffer bei diesem gegebenen Datensatz erwartungsgemäß oberhalb des Cutoff-Wertes von 2 und unterhalb des Cutoff-Wertes von –2 liegen.
Wenn der Stichprobenumfang 6 bis 7 beträgt, zeigt 1 in ähnlicher Weise den Wechsel von 12,31% zu 14,31% für die Cutoff-Werte oberhalb von 2 und unterhalb von –2.
Die obigen Ergebnisse bestätigen die erwarteten Umrechnungen für die Ausnahmeanomalietreffer-Cutoff-Werte, wenn echte Daten von Sensordaten einer Energieerzeugungseinrichtung vorausgesetzt werden. Ein zweiter Analysesatz wurde durchgeführt um zu bestätigen, dass die vorgeschlagenen Cutoff-Werte und zugehörigen Prozentsätze nicht nur für alle Z-Innerhalb-Werte über alle Marken hinweg sondern auch in jeder Marke gültig sind, wenn der Stichprobenumfang im Vergleich zu den Gesamtdaten relativ klein ist. Kontinuierliche Z-Innerhalb-Werte wurden in einen Ordinalwert mit 11 Kategorien mit den vordefinierten 11 Eimern umgewandelt. Die Verteilung des Ordinalwertes wurde anschließend für jede Marke gesondert aufgezeichnet (siehe 4). Wie aus der Kurve nach 4 ersichtlich, haben die meisten der Marken eine ähnliche Formverteilung für die ordinalen Z-Innerhalb-Werte.
5 veranschaulicht die Verteilungen an den ordinalen Z-Zwischen-Werten für jede Marke ähnlich wie in 4. Obwohl es einige Marken mit etwas anderen Formen für die Eimer 2, 3, –2 oder –3 gibt, sind die Formen für die Z-Zwischen-Werte allgemein nicht allzu anders als die Formen für die Z-Innerhalb-Werte. Somit wird gefolgert, dass dieselben Cutoff-Werte über die Marken hinweg sowohl für die Z-Innerhalb- als auch die Z-Zwischen-Werte innerhalb dieses Datensatzes verwendet werden können. Außerdem können die Anomalieprozentsätze zur Umrechnung für die vorgeschlagenen Cutoff-Werte (d. h. 2, 6, 17, 50, 150, –2, –6, –17, –50, –150) entweder auf der Basis der empirischen Ergebnisse (siehe 3) oder auf der Basis der Simulationsuntersuchung (siehe 1) festgelegt werden, weil sie ähnliche Zahlen vorschlagen.
Aggregation verschiedener anomaler Beobachtungen
Vielen Anwendern von Einrichtungen (z. B. Kraftwerk-, Turbinenbetreiber, etc.) steht eine Fülle von Daten zur Überwachung und Diagnose zur Verfügung. Entscheidender ist, dass diese Daten häufig in kleinen Zeiteinheiten (z. B. für jede Sekunde oder jede Minute) vorliegen. Obwohl eine Datenfülle ein Vorteil ist, sollte ihre Aggregation in effektiver Weise durchgeführt werden, so dass die Datenspeicherung und Datenüberwachung nicht problematisch werden und die Daten weiterhin ihr nützliches Wissen behalten.
Obwohl eine Aggregation sehr erwünscht ist, bürgt sie für einige Aufgaben eine Gefahr. Eine Anomalieaggregation ist in sich und von sich aus ein Oxymoron. Alle Anomalien implizieren eine Spezifität und eine Konzentration auf jeden einzelnen Datenpunkt, während eine Aggregation eine Zusammenfassung über das Ausschließen der Spezifika und der Anomalien impliziert. Jedoch wird eine Anomalieaggregation unabhängig von ihrer sich widersprechenden Natur benötigt, weil pro Sekunde oder pro Stunde akquirierte Daten nicht für viele Marken in vielen Zeiträumen gespeichert werden können und es, was wichtiger ist, für bestimmte Arten von Ereignissen zu viele Daten geben kann, um jede Sekunde oder sogar jede Stunde zu überwachen. Insbesondere sind die meisten Einrichtungsbetreiber daran interessiert, „akute" Anomalien im Vergleich zu „chronischen" Anomalien für ihre Maschineneinheiten zu erfassen. Akute Anomalien sind die selten vorkommenden Anomalien hoher Amplitude bzw. Größe. Chronische Anomalien treten in unterschiedlichen Einheiten und Zeiten für eine spezielle Metrik häufig auf.
6 veranschaulicht Z-Innerhalb-Messwerte von zwei Einheiten im Verlauf der Zeit. Die X-Achse stellt die Zeit für jede Einheit dar. Die vertikale Strichlinie 630 trennt die Da ten der beiden Einheiten voneinander. Die Daten der ersten Einheit liegen auf der linken Seite der Strichlinie 630 und sind mit 610 bezeichnet. Die Daten der zweiten Einheit liegen auf der rechten Seite der Strichlinie 630 und sind durch 620 gekennzeichnet. Wie aus der Kurve ersehen werden kann, hat die zweite Einheit (Bereich 620) zwei Ausreißer, die unterhalb bzw. oberhalb von –100 bzw. 100 liegen. Da das Auftreten dieser Bereiche für diese Metrik und für diese Einheiten ein seltenes Ereignis darstellt, werden diese beiden Ausreißer als „akut" bezeichnet. Die Kurve in 7 kann ähnlich wie die Kurve nach 6 gelesen werden und zeigt das Konzept der „chronischen Anomalien". Chronische Anomalien sind definitionsgemäß Einfanganomalien (d. h. Größen oberhalb von 2 oder unterhalb von –2 auf den Ausnahmeanomaliewerten), die in unterschiedlichen Einheiten und im Zeitablauf für eine spezielle Metrik häufig auftreten.
Wie vorstehend erwähnt, gibt es viele unterschiedliche Möglichkeiten, Daten zu aggregieren. Eine Statistik enthält per Definition eine Aggregation. Eine Darstellung der Daten mit Hilfe einer Hand voll Zahlen, z. B. des Mittelwertes, des Medianwertes, der Standardabweichung, der Varianz, etc., ist die simpelste Definition der „Statistik" oder „Analytik". Jedoch liefert keine dieser seit langem existierendenden Methoden eine Lösung für die Anomalieaggregation. Ein Tagesdurchschnitt kann eine stündliche Anomalie nicht lückenlos veranschaulichen. Die Aggregation von „Ausnahmeanomaliewerten" stellt ein neues Verfahren dar, wie es die vorliegende Erfindung verkörpert. Früher war die Überwachung von stündlichen Daten die einzige Methode, um stündliche Anomalien zu identifizieren. Eine Datenüberwachung musste auf der Ebene der Granularität vorgenommen werden, in der die Anomalien detektiert werden sollten. In anderen Worten musste dies bei den höchsten Granularitäten, z. B. pro Sekunde oder pro Stunde, vorgenommen werden. Bei dieser Granularität ist es schwierig, Langzeittendenzen zu erkennen oder die Einheiten effektiv miteinander zu vergleichen und einander gegenüberzustellen.
Es sind zwei Maße gemäß Ausführungsformen der vorliegenden Erfindung beschrieben, die verwendet werden können, um die Ausnahmeanomaliewerte zu aggregieren: Anomaliegrößenmaß und Anomaliefrequenzmaß. Ein Anomaliegrößenmaß nutzt Maße der zentralen Tendenz bzw. Lagemaße, wie beispielsweise den Mittelwert. Ein Anomaliefrequenzmaß nutzt Verhältnisse oder prozentuale Anteile.
Ein Anomaliegrößenmaß kann akute Anomalien identifizieren und Maße der zentralen Tendenz nutzen. Ein absoluter Tagesdurchschnitt (wie er auf der linken Seite der 8 veranschaulicht ist) stellt ein Beispiel für ein Anomaliegrößenmaß dar. Ein absoluter Durchschnitt kann veranschaulichen, ob in einem vorbestimmten Zeitraum (z. B. Sekunde, Minute, Stunde, Tag, Woche, Monat oder Jahr) eine oder mehrere Anomalien hoher Größe entweder in der negativen oder in der positiven Richtung vorliegen. Beispielsweise würde ein absoluter Tagesdurchschnitt veranschaulichen, ob innerhalb eines Tages eine oder mehrere hohe Anomalien entweder in der negativen oder in der positiven Richtung vorhanden sind.
Ein Anomaliefrequenzmaß kann verwendet werden, um chronische Anomalien zu identifizieren, und es kann Verhältnisse oder Prozentsätze verwenden. Eine tägliche prozentuale Anomalie (wie sie auf der rechten Seite in 8 veranschaulicht ist) stellt ein Beispiel für ein Anomaliefrequenzmaß dar. Eine tägliche prozentuale Anomalie würde den absoluten Tagesdurchschnitt in dem Sinne ergänzen, als sie die Anzahl von anomalen Stunden innerhalb eines Tages oder die Anzahl von anomalen Tagen innerhalb eines Monats veranschaulichen könnte. Im Allge meinen kann das Anomaliefrequenzmaß dazu verwendet werden, die Anzahl von anomalen Zeiträumen (z. B. Sekunden, Minuten, Stunden, etc.) innerhalb einer längeren Zeitdauer (z. B. Minuten, Stunden, Tagen, ect.) zu veranschaulichen.
Wenn diese zwei Werte (d. h. der absolute Tagesdurchschnitt und die tägliche prozentuale Anomalie) gleichzeitig genutzt werden, würden sie Tage mit anomalen Stunden aufzeigen sowie zwischen akuten und chronischen Anomalien unterscheiden. Akute Anomalien (die selten auftreten) würden hohe absolute Tagesdurchschnitte und geringe tägliche prozentuale Anomaliewerte aufweisen. Akute Anomalien könnten durch eine oder zwei Anomalien hoher Größe veranschaulicht werden. Andererseits würden chronische Anomalien (die häufig auftreten) geringe oder hohe absolute Tagesdurchschnitte und hohe tägliche prozentuale Anomaliewerte aufweisen. Chronische Anomalien könnten durch ein paar wenige bis zu einer Reihe von Anomalien innerhalb eines Tages veranschaulicht werden. Jedoch brauchen chronische Anomalien nicht unbedingt hohe Größen der Ausnahmeanomaliewerte zu haben.
8 zeigt ein Beispiel für die Verwendung der Anomaliegrößen- und Anomaliefrequenzmaße. Die Kurve auf der linken Seite der 8 zeigt ein Anomaliegrößenmaß mit einem absoluten Tagesdurchschnitt. Die Kurve auf der rechten Seite zeigt ein Anomaliefrequenzmaß mit einer prozentualen Anomalie. Diese Anomaliegrößen- und Anomaliefrequenzwerte können sowohl für die Z-Zwischen-Werte als auch für die Z-Innerhalb-Werte berechnet werden. Außerdem können in jeder Dimension sowohl Größen- als auch Frequenzwerte gesondert Marken, Zeiträumen und Maschineneinheiten zugeordnet werden. Anschließend können diese Einteilungen bzw. Zuordnungen in Perzentile gewandelt werden, wodurch sich ein Perzentil für den Anomaliegrößenwert im Vergleich zu einem Perzentil für den Anomaliefrequenzwert er gibt. Zusätzlich können diese Perzentile für jeden Wert über die „Maximum"-Funktion für Z-Zwischen-Werte und Z-Innerhalb-Werte gesondert miteinander kombiniert werden. Insbesondere würde ein maximales Perzentil für entweder einen Z-Zwischen- oder Z-Innerhalb-Anomaliewert entweder eine akute oder eine chronische Anomalie oder beides kennzeichnen.
9 veranschaulicht eine grafische Darstellung und einen Satz von Daten über maximale Z-Zwischen-Perzentile und maximale Z-Innerhalb-Perzentile. Beispielsweise repräsentieren die Punkte in der gestrichelten Box in der oberen rechten Ecke der Darstellung dieselbe Turbine an vier aufeinanderfolgenden Tagen, an denen Anomalien in Bezug auf die „CSGV"-Marke ausgelöst werden. Die CSGV-Marke kann eine Metrik sein, die den IGV(Inlet Guide Vane, Einlassleitschaufel)-Winkel betrifft. Diese vier Datenpunkte (die Dateneingaben 92, 93, 94, 95 in 10 entsprechen) sind sowohl in Bezug auf die Vergangenheit als auch auf die Peer-Einheiten der Einheit anomal. Wenn diese vier Tage für diese Einheit auf der CSGV-Marke weiter untersucht werden, kann ersehen werden, dass viele Stunden innerhalb dieser Tage Anomalien in Bezug auf die Peer-Einheiten haben. Andererseits sind stündliche Z-Innerhalb-Anomalien rar an der Zahl im Vergleich zu stündlichen Z-Zwischen-Anomalien, wobei jedoch ihre Größe hoch ist. All diese Folgerungen können aus der Datentabelle nach 10 abgelesen werden, die die täglichen Anomaliegrößen- und Anomaliefrequenzwerte und täglichen Perzentile für Z-Zwischen-Werte und Z-Innerhalb-Werte enthält.
Erzeugung von Alarmen und Erzeugung von Heatmaps
Das Anomaliedetektionsprozess- und Heatmap-Werkzeug kann gemäß einer Ausführungsform der vorliegenden Erfindung in Software mit zwei Java-Programmen implementiert werden, die als die Berechnungsmaschine und als das Visualisierungswerkzeug bezeichnet werden. Die Berechnungsmaschine berechnet Ausnahmeanomaliewerte, aggregiert Anomaliewerte, aktualisiert eine Oracle-Datenbank und sendet Alarme aus, wenn Regeln ausgelöst werden. Die Berechnungsmaschine kann von einem Befehlszeilen-Stapelverarbeitungsprozess, der jede Stunde abläuft, periodisch aufgerufen werden. Das Visualisierungswerkzeug zeigt auf Anforderung hin Anomaliewerte in einer Heatmap an (siehe 11) und ermöglicht einem Benutzer, Regeln zu erzeugen. Das Visualisierungswerkzeug könnte als eine Web-Anwendung ablaufen. Diese Programme können auf einem Linux, Windows oder sonstigen Betriebssystem basierten Anwendungsprozessor ablaufen.
Ein Beispiel für einen Befehlszeilenaufruf für die Berechnungsmaschine ist:
Java -Xmx2700m -jar populate.jar --update t7 n
Dies weist die Berechnungsmaschine an, die periodische Aktualisierung durchzuführen, bis zu sieben oder mehr gleichzeitige Threads zu verwenden und vor der Verarbeitung alle neuen Sensordaten in der Datenbank zu identifizieren. Das Programm beginnt mit der Berechnung von Regeln für alle neuen kundenspezifischen Alarme und alle neuen kundenspezifischen Peer-Einheiten der Maschineneinheiten, die durch die Benutzer des Visualisierungswerkzeugs erzeugt worden sind. Es ruft anschließend neu angekommene Sensorrohdaten von einem Server ab, speichert die neuen Daten in der Oracle-Datenbank und berechnet Ausnahmeanomaliewerte und kundenspezifische Alarme für die neu hinzugefügten Daten. Es speichert Ergebnisse all dieser Berechnungen in einer Datenbank und ermöglicht dem Visualisierungswerkzeug, eine Heatmap der Ausnahmeanomaliewerte und Kundenalarme anzuzeigen. Wenn die Berechnungen einen kundenspezi fischen Alarm mit einer Regel auslösen, die eine gute Möglichkeit der Erfassung eines eine Maschine beeinträchtigenden Ereignisses mit Vorlaufzeit aufweist, kann die Berechnungsmaschine konfiguriert sein, um ein Warnsignal zu den Mitgliedern des Überwachungs- und Diagnoseteams auszusenden. Die Alarme könnten Audiosignale und/oder optische Signale, die von den Teamcomputern/-notebooks angezeigt werden, oder Signale sein, die zu den Kommunikationsgeräten des Teams (z. B. Mobiltelefone, Pager, PDAs, etc.) übertragen werden.
Die primäre Aufgabe des Visualisierungswerkzeugs bzw. -hilfsprogramms besteht darin, Mitgliedern des Überwachungs- und Diagnoseteams Heatmaps für spezielle Maschineneinheiten anzuzeigen. Benutzer des Visualisierungstools können den Datenbereich verändern, die Peer-Gruppe verändern und in den Zeitreihengraphen der einzelnen Markendaten „bohren". Das Visualisierungswerkzeug kann Java Server Pages für seine Präsentationsebene und Benutzerschnittstelle verwenden. Die Java Server Pages sind die Ansichten in der MVC-Architektur und enthalten keine Business-Logik. Die einzigen Anforderungen an den Server und die Client-Maschinen sind für die Ausführungsform gemäß diesem Beispiel ein Java kompatibler Servlet-Container und ein Webbrowser.
Das Visualisierungswerkzeug unterstützt auch einige andere Nutzungsfälle. Benutzer des Visualisierungswerkzeugs können Peer-Heatmaps sichten, Maschinen mit ähnlichen Alarmen auffinden, kundenspezifische Peer-Gruppen kreieren, kundenspezifische Alarme erzeugen und verschiedene Arten von Berichten ansehen. Peer-Heatmaps vereinigen alle Maschinenheatmaps zu einer einzelnen Heatmap, bei der benachbarte Spalten Heatmapzellen von Peermaschinen zum gleichen Zeitpunkt zeigen, anstatt die eigenen Heatmapzellen der Maschine in früheren und späteren Zeitpunkten zu zeigen. Benutzer können das Datum verän dern, in den Zeitreihengraphen unter Vergleich von Peer-Daten für spezielle Marken herumstochern und sich durch die Maschinenheatmaps hindurcharbeiten. Auf anderen Seiten können Benutzer ferner Kundenalarme spezifizieren und nach Maschinen suchen, die diese Alarme ausgelöst haben. Benutzer können Regeln für kundenspezifische Alarme erzeugen, modifizieren und löschen. Berichte fassen Informationen über überwachte Einheiten, die Latenzzeit von Sensorrohdaten von Einheiten (die sich zwischen den Einheiten unterscheidet) und die Genauigkeit der soweit ausgelösten Alarme zusammen.
Beispielsweise wurde die Anomaliedetektionsmethode, wie sie durch die vorliegende Erfindung verkörpert ist, auf einen Satz Turbinen angewandt, bei denen ein wesentliches Fehlerereignis auftrat. Das Fehlerereignis war selten und trat während des viermonatigen Zeitraums, für den historische Sensordaten verfügbar waren, nur in zehn Turbinen auf. Für jede Turbine, die dieses Ereignis erfahren hat (Ereigniseinheiten) wurden bis zu zwei Monate historischer Daten gesammelt. Für die Zwecke des Vergleichs wurden vier Monate historischer Daten für 200 Turbinen, die das Ereignis nicht erfahren haben (Nicht-Ereigniseinheiten), erfasst.
Für jede Ereignis-Einheit wurde eine Peer-Gruppe erzeugt, die 6–8 weitere Turbinen mit ähnlicher Einrichtung aufwies, die in derselben geografischen Region arbeiteten. Die Z-Innerhalb- und Z-Zwischen-Ausnahmeanomaliewerte wurden anschließend für die Ereignis- und die Nicht-Ereignis-Einheiten berechnet. Die Z-Innerhalb-Werte kennzeichneten, wie unterschiedlich eine Einheit war im Vergleich zu früheren Beobachtungen, wenn die Einheit unter ähnlichen Bedingungen betrieben worden ist, wie dies anhand des Betriebsmodus, der Wattausgangsleistung und der Umgebungstemperatur gemessen worden ist. Die Z-Zwischen-Werte kennzeichneten, wie unterschiedlich eine Einheit war im Vergleich zu ihren Peer-Einheiten, wenn sie unter ähnlichen Bedingungen betrieben worden sind. Diese Abweichungen wurden anschließend mit Hilfe einer Heatmap, wie in 11 veranschaulicht, visualisiert.
Die Spalten der Heatmap, wie sie in 11 veranschaulicht ist, kennzeichnen Zeiträume. Die Zeiträume könnten Tage, Stunden, Minuten, Sekunden oder längere oder kürzere Zeitdauern sein. Die Zeilen der Reihen repräsentieren interessierende Metriken, wie beispielsweise Schwingungs- und Leistungsmessungen. Für jede Metrik kann es zwei oder mehrere Reihen mit gefärbten Zellen geben, wobei in 11 lediglich eine einzelne Reihe veranschaulicht ist und die Zellen der Übersichtlichkeit wegen mit unterschiedlichen Mustern schraffiert sind. Weiße Zellen können als normal oder nicht anomal angesehen werden. Die mit dünnen bzw. schwachen vertikalen Linien gefüllten Zellen in der AFPAP-Reihe könnten als kleine negative Werte angesehen werden, während die mit dicken bzw. starken vertikalen Linien gefüllten Reihen in der GRS PWR COR(Corrected Gross Power, korrigierte Bruttoleistung)-Reihe als große negative Werte angesehen werden könnten. Die dünnen horizontalen Linien in der CSGV-Reihe könnten als kleine positive Werte angesehen werden, während die dicken horizontalen Linien in derselben Reihe als hohe positive Werte angesehen werden könnten. Die Reihe „Kleiner Alarm" weist ein gekreuztes Schraffurmuster in bestimmten Zellen auf. Jedoch stellt dies nur ein einzelnes Beispiel für eine visuelle Unterscheidung zwischen kleinen, hohen und normalen Werten dar, so dass viele verschiedene Muster, Farben und/oder Farbstärken verwendet werden könnten.
Die Zellen der Heatmap können unterschiedliche Farben oder unterschiedliche Schattierungen oder Muster anzeigen, um zwischen unterschiedlichen Werten oder Größen und/oder Richtungen/Polaritäten von Daten zu unterscheiden. In Zweireihen-Aus führungsformen könnte die obere Reihe die Größe der Z-Zwischen-Ausnahmeanomaliewerte darstellen, während die untere Reihe die Größe der Z-Innerhalb-Ausnahmeanomaliewerte darstellen könnte. Wenn der Anomaliewert negativ ist (somit einen Wert kennzeichnet, der ungewöhnlich niedrig ist), könnte die Zelle blau gefärbt werden. Kleinere negative Werte könnten hellblau und größere negative Werte könnten dunkelblau sein. Wenn der Anomaliewert positiv ist (somit einen Wert kennzeichnet, der ungewöhnlich hoch ist), könnte die Zelle orange gefärbt werden. Kleinere positive Werte könnten hellorange sein, während größere positive Werte dunkelorange sein könnten. Der Benutzer kann den Betrag, der erforderlich ist, um bestimmte Farbintensitäten zu erreichen, spezifizieren. Es kann so viele Farbstufen, die angezeigt werden, geben, wie dies erwünscht ist, so dass beispielsweise anstelle der drei Farbstufen 1, 2 oder 4 oder mehrere Farbintensitätsstufen angezeigt werden könnten. In diesem Beispiel wurden die Cutoff-Grenzwerte anhand der Empfindlichkeitsanalyse bestimmt.
Die in 12 veranschaulichte Heatmap liefert eine einzelne Momentaufnahme oder ein Protokoll über den gesamten Systemzustand für den Zeitraum der letzten 24 Stunden. Die Zellen identifizieren diejenigen Metriken, die im Vergleich zu der Turbinenvergangenheit oder ihren Peer-Einheiten außergewöhnlich sind. Die Heatmap ermöglicht einem Mitglied des Überwachungsteams, den Systemzustand schnell zu überprüfen und kritische „Hot-Spot"-Sensorwerte schnell zu identifizieren. In dem Fall der Fehlerereigniseinheiten zeigt die Heatmap, dass die Turbine einen deutlichen Abfall von vielen Leistungsmesswerten, wie beispielsweise GRS PWR COR (korrigierte Bruttoleistung), erfahren hat, während sie zur gleichen Zeit eine deutliche Schwingungssteigerung (wie durch die BB- und BR-Metriken gemessen) erfahren hat. Eine Überprüfung der Ereignis- im Vergleich zu der Nicht-Ereignis-Turbinen-Heatmap zeig te, dass dieses Charakteristikum in vier der zehn Ereignis-Einheiten für mehrere Stunden vor dem Ereignis vorhanden war, jedoch in keiner der Nicht-Ereignis-Einheiten vorhanden war. Durch visuelle Überprüfung der Heatmap der Ereignis-Einheiten im Vergleich zu Nicht-Ereignis-Einheiten kann das Überwachungsteam Regeln entwickeln, die als Warnhinweise auf diesen Fehlerzustand dienen werden. Diese Regeln können anschließend in das System in Form von regelbasierten „Red Flags" einprogrammiert werden. Das System wird dann Turbinen überwachen und das Überwachungsteam warnen oder alarmieren, wenn diese Red Flags ausgelöst werden.
Die obere Reihe der in 12 veranschaulichten Heatmap kann verschiedene Muster, Farben und Farbintensitäten anzeigen, um in visueller Weise zwischen unterschiedlichen Wertebereichen zu unterscheiden. In diesem Beispiel können große negative Werte durch dicke horizontale Linien, mittlere negative Werte durch mittlere horizontale Linien und geringe negative Werte durch dünne horizontale Linien angezeigt werden. In ähnlicher Weise können große positive Werte durch dicke vertikale Linien, mittlere positive Werte durch mittlere vertikale Linien und kleine positive Werte durch dünne vertikale Linien angezeigt werden. In Ausführungsformen, die Farbe verwenden, könnten die Rechtecke in der oberen Reihe der in 12 veranschaulichten Heatmap verschiedene Farben und Intensitäten anzeigen. Beispielsweise könnte die mit dicken horizontalen Linien gefüllte Box durch eine durchgehend dunkelblaue Farbe ersetzt werden, während die mit mittelstarken horizontalen Linien gefüllte Box durch eine durchgehend blaue Farbe ersetzt werden könnte und die mit hellen horizontalen Linien gefüllte Box durch eine durchgehend hellblaue Farbe ersetzt werden könnte. Die mit dicken vertikalen Linien gefüllte Box könnte durch eine durchgehend dunkelorange Farbe ersetzt werden, während die mit mittelstarken vertikalen Linien gefüllte Box durch eine durchgehend orange Farbe ersetzt werden könnte und die mit dünnen vertikalen Linien gefüllte Box durch eine durchgehend hellorange Farbe ersetzt werden könnte. Dies sind lediglich ein paar wenige Beispiele für die vielen Farben, Muster und Intensitäten, die verwendet werden könnten, um zwischen verschiedenen anomalen Werten oder Treffern zu unterscheiden.
Während hier verschiedene Ausführungsformen beschrieben sind, ist es aus der Beschreibung offensichtlich, dass verschiedene Kombinationen der Elemente gebildet, Veränderungen oder Verbesserungen an diesen vorgenommen werden können und in dem Rahmen der Erfindung liegen.
Es ist ein Verfahren zur Aggregation anomaler Werte geschaffen. Das Verfahren weist eine Erfassung von Betriebsdaten von wenigstens einer Maschine und eine Berechnung wenigstens eines Ausnahmeanomaliewertes anhand der Betriebsdaten auf. Der Ausnahmeanomaliewert kann anschließend aggregiert werden, um akute oder chronische anomale Werte zu identifizieren.

110: Reihe des Stichprobenumfangs
120: Ausnahmeanomaliewert-Spalte
130: Zelle in der Tabelle
210: Histogramm
220: Boxendiagramm
230: Boxendiagramm
240: Boxendiagramm
250: Statistik des Tests auf Normalverteilung
610: Daten der ersten Einheit
620: Daten der zweiten Einheit
630: Strichlinie

Claims

Verfahren zur Identifikation eines anomalen Wertes, wobei das Verfahren aufweist: Gewinnung von Betriebsdaten von wenigstens einer Maschine; Berechnung wenigstens eines Ausnahmeanomaliewertes aus den Betriebsdaten; Aggregation des wenigstens einen Ausnahmeanomaliewertes.
Verfahren nach Anspruch 1, das ferner den Schritt aufweist: Berechnung wenigstens eines Anomaliegrößenmaßes, wobei das wenigstens eine Anomaliegrößenmaß den Mittelwert der Betriebsdaten oder den wenigstens einen Ausnahmeanomaliewert in einem vorbestimmten Zeitraum identifiziert.
Verfahren nach einem beliebigen der vorhergehenden Ansprüche, das ferner den Schritt aufweist: Berechnung wenigstens eines Anomaliefrequenzmaßes, das irgendeinen vorbestimmten Zeitraum mit anomalen Werten kennzeichnet.
Verfahren nach Anspruch 2 oder 3, wobei der vorbestimmte Zeitraum aus der Gruppe ausgewählt ist, zu der gehören: Sekunden, Minuten, Stunden, Tage, Wochen, Monate und Jahre.
Verfahren nach einem beliebigen der vorhergehenden Ansprüche, wobei der Aggregationsschritt ferner aufweist: Berechnung wenigstens eines Anomaliefrequenzmaßes, wobei das wenigstens eine Anomaliefrequenzmaß die Anzahl vorbestimmter Zeiträume mit anomalen Werten identifiziert; wobei der vorbestimmte Zeitraum aus der Gruppe ausgewählt ist, die wenigstens eine der Größen aufweist: Sekunden, Minuten, Stunden, Tage, Wochen, Monate und/oder Jahre.
Verfahren nach einem beliebigen der vorhergehenden Ansprüche, wobei die wenigstens eine Maschine eine Turbomaschine ist, die aus der Gruppe ausgewählt ist, zu der gehören: ein Verdichter, eine Gasturbine, eine hydroelektrische Turbine, eine Dampfturbine, eine Windenergieanlage, ein Triebwerk, ein Generatormaschinensatz, eine Lokomotive und ein Generator.
Verfahren nach einem beliebigen der vorhergehenden Ansprüche, wobei der Schritt der Gewinnung von Betriebsdaten ferner aufweist: Erfassung von Betriebsdaten von mehreren Maschinen, wobei alle diese Maschinen hinsichtlich wenigstens entweder der Konfiguration und/oder der Kapazität bzw. des Leistungsvermögens und/oder der Größe und/oder der Ausgangsleistung und/oder der geografischen Lage ähnlich sind.
Verfahren nach einem beliebigen der Ansprüche 2 bis 8, das ferner aufweist: Kombination des wenigstens einen Anomaliegrößenmaßes mit dem wenigstens einen Anomaliefrequenzmaß in wenigstens entweder einer graphischen Form und/oder einer Tabellenform, wobei die Kombination anzeigt, ob in dem wenigstens einen Ausnahmeanomaliewert irgendwelche akute oder chronische Anomalien vorhanden sind.
Verfahren nach einem beliebigen der Ansprüche 2 bis 9, wobei akute Anomalien durch wenigstens eines der Folgenden gekennzeichnet sind: hohe Werte des wenigstens einen Anomaliegrößenmaßes, geringe Werte des wenigstens einen Anomaliefrequenzmaßes und/oder selten auftretende Anomaliewerte.
Verfahren nach einem beliebigen der Ansprüche 2 bis 9, wobei chronische Anomalien gekennzeichnet sind durch: niedrige oder hohe Werte des wenigstens einen Anomaliegrößenmaßes und hohe Werte des wenigstens einen Anomaliefrequenzmaßes.