-
HINTERGRUND ZU DER ERFINDUNG
-
Die
hier beschriebenen Systeme und Verfahren betreffen allgemein die
Aggregation anomaler Werte. Insbesondere betreffen die Systeme und
Verfahren statistische Techniken zur Aggregation ausreißender (d.
h. anomaler) technischer oder betrieblicher Daten im Vergleich zu
kleinen Sätzen
von damit in Beziehung stehenden technischen oder betrieblichen
Daten.
-
Im
Betrieb und bei der Instandhaltung von Energieerzeugungseinrichtungen
(z. B. Turbinen, Verdichtern, Generatoren, etc.) werden Sensormesswerte,
die verschiedenen Eigenschaften der Maschine entsprechen, empfangen
und gespeichert. Diese Sensormesswerte werden häufig als „Marken" („Tags") bezeichnet, wobei
es viele Arten von Marken (z. B. Schwingungsmarken, Effizienzmarken,
Temperaturmarken, Druckmarken, etc.) gibt.
-
Eine
gründliche Überwachung
dieser Marken im Laufe der Zeit ergibt viele Vorteile bei der Erfassung von
beeinträchtigten
Maschinenverhalten (z. B. einer internen Beschädigung an Einheiten, Verdichterereignissen,
geplanten Auslösern
im Vergleich zu ungeplanten). Beispielsweise können (im Zeitablauf) steigende
Werte der Rotorschwingung in einem Verdichter ein Anzeichen für ein ernstes
Problem darstellen. Eine bessere Kenntnis einer Beeinträchtigung
in Maschinen verbessert auch Fehlerdiagnosemöglichkeiten über einen
Satz von eingebauten Regeln oder Alarmen, die als Frühindikatoren
für Maschinenereignisse
dienen. Eine gleichzeitige Anzeige aller Markenanomalien gemeinsam
mit den spezifischen Regeln/Alarmen macht eine Maschinenüberwachung
und Diagnose sowie die Erzeugung neuer Regeln/Alarme äußerst effizient
und effektiv. Die sofortige Aufmerksamkeit von für eine Überwachung und Diagnose verantwortlichen
Personen kann unmittelbar auf kritische Abweichungen gelenkt werden.
-
Jedoch
ist in Sensordaten eine erhebliche Menge an Rauschen enthalten.
Um Rauschen zu entfernen und Beobachtungen im Zeitablauf oder zwischen
Maschinen vergleichbar zu machen, müssen verschiedene Korrekturen
vorgenommen und viele unterschiedliche Einflussfaktoren genutzt
werden. Selbst dann ist es immer noch sehr schwierig, viele Marken
gleichzeitig zu überwachen
(es kann mehrere hundert oder tausende Marken geben) und die Anomalien
in den Daten zu erkennen.
-
Das
Entfernen von Rauschen aus Daten und die Erfassung oder Identifikation
von Anomalien in einem nutzbaren Format (z. B. Größe und Richtung)
und eine anschließende
Nutzung dieser Anomalieinformation beim Regel- oder Modellaufbau
stellt in vielen unterschiedlichen Wirtschaftszweigen, Technologien
und Gebieten einen erforderlichen Prozess dar. In technischen Anwendungen
befassen sich Überwachungs-
und Diagnoseteams gewöhnlich
mit dem Problem in einer routinemäßigen Weise und adhoc mit Hilfe
von Kontrollkarten, Histogrammen und Streudiagrammen. Jedoch fordert
diese Vorgehensweise eine subjektive Beurteilung in Bezug darauf,
ob eine gegebene Marke anomal hoch oder niedrig ist.
-
Es
sind statistische Methoden, einschließlich der sog. z-Werte (z-scores),
bekannt um zu beurteilen, in welchem Maße ein bestimmter Wert in einer
Gruppe einen Ausreißer
darstellt, d. h. anomal ist. Typische z-Werte beruhen auf einer
Berechnung des Mittelwerts und der Standardabweichung einer Gruppe.
Während ein
z-Wert bei der Beurteilung, in welchem Maße eine einzelne Beobachtung
in einer gut besetzten Gruppe anomal ist, effektiv sein kann, hat
es sich erwiesen, dass z-Werte ihre Effektivität als ein Anzeichen für die Abnormität verlieren,
wenn sie auf Datensätze
angewandt werden, die lediglich eine geringe Anzahl von Werten enthalten.
-
Bei
der Berechnung von Anomaliewerten tritt häufig der Fall auf, dass es
nur wenige Werte gibt, mit denen gearbeitet werden kann. Wenn beispielsweise
eine Maschine (z. B. eine Turbine) mit einem Satz von sogenannten
Peer-Maschinen (z. B. ähnlichen
Turbinen) verglichen wird, liegt häufig der Fall vor, dass es schwierig
ist, mehr als eine Hand voll Maschinen zu identifizieren, die berechtigterweise
als Peers (gleichrangig) der Zielmaschine angesehen werden können. Außerdem ist
es häufig
erwünscht,
das Leistungsverhalten von Maschinen zu beurteilen, die bei der
momentanen Konfiguration nur für
eine begrenzte Zeitdauer in Betrieb gewesen sein können. Infolgedessen
ist es oft nicht wünschenswert
oder nicht richtig, standardgemäße z-Werte
als ein Maß für Anomalietreffer
zu verwenden, weil standardgemäße z-Werte
bei kleinen Datensätzen nicht
robust bzw. aussagekräftig
sind.
-
Demgemäß besteht
ein Bedarf in der Technik nach einem Prozess, Verfahren und/oder
Werkzeug, der bzw. das Anomalien, die von verschiedenen Arten von
Energieerzeugungseinrichtungen erfahren werden, auf einfache Weise
identifizieren, quantifizieren, aggregieren und anzeigen kann. Dieser
Prozess, dieses Verfahren und/oder dieses Werkzeug sollte es ferner
ermöglichen,
eine Anomalieinformation in eine sinnvolle Erkenntnis, wie beispielsweise
in Frühindikatoren
für interessierende
Ereignisse, umzuwandeln.
-
KURZBESCHREIBUNG DER ERFINDUNG
-
Es
ist ein Verfahren zur Identifikation eines anomalen Wertes geschaffen.
Das Verfahren weist ein Gewinnen von Betriebsdaten von wenigstens
einer Maschine und ein Berechnen wenigstens eines außergewöhnlichen
Anomaliewertes (nachfolgend als Ausnahmeanomaliewert bezeichnet)
aus den Betriebsdaten. Die Ausnahmeanomaliewerte können anschließend aggregiert
werden, um anomale Werte zu identifizieren.
-
Es
ist ein Verfahren zur Aggregation anomaler Werte geschaffen. Das
Verfahren weist ein Erfassen von Betriebsdaten von wenigstens einer
Maschine und ein Berechnen wenigstens eines Ausnahmeanomaliewertes
aus den Betriebsdaten auf. Die Ausnahmeanomaliewerte können aggregiert
werden, indem wenigstens ein Anomaliegrößenmaß berechnet wird. Das Anomaliegrößenmaß kennzeichnet
den Mittelwert der Ausnahmeanomaliewerte in einem vorbestimmten
Zeitraum. Die Ausnahmeanomaliewerte können ferner aggregiert werden,
indem wenigstens ein Anomaliefrequenzmaß berechnet wird. Das Anomaliefrequenzmaß kennzeichnet
einen prozentualen Anteil eines vorbestimmten Zeitraums mit anomalen
Werten.
-
KURZE BESCHREIBUNG DER ZEICHNUNGEN
-
1 zeigt
eine Grenzwert(Cutoff)-Tabelle für
außergewöhnliche
Anomaliewerte.
-
2 veranschaulicht
die deskriptive Statistik in Bezug auf außergewöhnliche Anomaliewerte.
-
3 zeigt
eine Kurve unter Veranschaulichung der Umrechnung zwischen den Cutoff-Werten
und dem Prozentanteil der Anomalieverteilung auf der Basis der empirischen
Ergebnisse für
die Z-Innerhalb-Werte.
-
4 veranschaulicht
die Verteilung der Z-Innerhalb-Werte.
-
5 veranschaulicht
die Verteilung der Z-Zwischen-Werte.
-
6 veranschaulicht
den Z-Innerhalb-Wert im Zeitablauf für zwei gesonderte Maschinen.
-
7 veranschaulicht
den Z-Innerhalb-Wert im Zeitablauf für 31 gesonderte Maschinen.
-
8 veranschaulicht
die Werte des absoluten Tagesdurchschnitts und prozentuale Anomaliewerte im
Zeitablauf.
-
9 veranschaulicht
eine Kurve eines Satzes von Daten maximaler Z-Zwischen-Perzentilwerte
und maximaler Z-Innerhalb-Perzentilwerte.
-
10 veranschaulicht
eine Tabelle mit täglichen
Anomaliegrößenwerten
und Anomaliefrequenzwerten sowie täglichen Perzentilen für Z-Zwischen-Werte
und Z-Innerhalb-Werte.
-
11 veranschaulicht
eine Heatmap (Warm-/Kaltdarstellung) mit mehreren Reihen und Spalten.
Die Spalten der Heatmap repräsentieren
Zeiträume,
während
die Reihen interessierende Metriken, wie beispielsweise Schwingungs-
und Leistungsmesswerte, kennzeichnen.
-
12 veranschaulicht
eine weitere Heatmap, die ein Speicherprotokoll für eine beispielhafte
Maschine über
einen Zeitraum von 24 Stunden liefert.
-
DETAILLIERTE BESCHREIBUNG
DER ERFINDUNG
-
Bei
der Überwachung
und Diagnostik (M&D,
Monitoring and Diagnostics) stellt die Beseitigung von Rauschen
aus Daten ein Schlüsselkonzept
dar. Dieses wird nicht trivial, wenn viele Variablen gleichzeitig
pro Sekunde überwacht
werden müssen,
und dies umso mehr, wenn eine Anpassung des Zustands (z. B. Temperatur,
Betriebsmodus, Druck, etc.) erforderlich ist. Es ist hier ein Anomaliedetektions-
und Aggregationsprozess- und Heatmapwerkzeug beschrieben, das bei
der Überwachung
und Diagnose äußerst nützlich und
revolutionär
ist. Der Prozess, das Verfahren und das Werkzeug, wie sie die vorliegende
Erfindung verkörpert, sind
besonders nützlich,
wenn sie auf Energieerzeugungseinrichtungen, wie beispielsweise
Verdichter, Generatoren und Turbinen, angewandt werden. Jedoch können der
Prozess, das Verfahren und das Werkzeug auf eine beliebige Maschine
oder ein beliebiges System angewandt werden, die bzw. das überwacht
werden muss. Beispielsweise gehören
zu weiteren Maschinen, die im Zusammenhang mit der vorliegenden
Erfindung eingesetzt werden können,
Gasturbinen, hydroelektrische Turbinen, Dampfturbinen, Biokraftstoff
befeuerte Turbinen, Windenergieanlagen, Triebwerke, Generatormaschinensätze und
Lokomotiven. Der Prozess, das Verfahren und das Werkzeug weisen
fünf Hauptmerkmale
auf:
- (1) Berechnung von außergewöhnlichen bzw. Ausnahmeanomaliewerten
(EAS, Exceptional Anomaly Scores) für technische Daten (z. B. Sensorbetriebsdaten).
Ausnahmeanomaliewerte quantifizieren Ausreißerdaten im Vergleich zu kleinen
Sätzen
von damit im Zusammenhang stehenden, verwandten Daten. EAS übertrifft
Z-Wert- und Kontrollkartenstatistiken hinsichtlich der Identifizierung
anomaler Beobachtungen.
- (2) Erzeugung mehrerer Empfindlichkeitseinstellungen für die Ausnahmeanomaliewerte,
so dass Benutzer festlegen können,
welchen Prozentsatz der Daten sie in einem gegebenen Satz von Marken
(Tags) und Zeitpunkten effektiv und effizient überwachen können. Außerdem können diese unterschiedlichen
Empfindlichkeitseinstellungen verwendet werden, um eine Diagnostik
(z. B. Alarmerzeugung) hinzuzufügen.
- (3) Bereitstellung von Methodiken zur Aggregation verschiedener
anomaler Beobachtungen bei unterschiedlichen Datengranularitäten (z.
B. stündlichen
gegenüber
täglichen
anomalen Beobachtungen). Diese unterschiedlichen anomalen Beobachtungen
können
miteinander verkettet bzw. verlinkt werden und ineinander transformierbar
sein. Eine stündliche
anomale Beobachtung kann sich bis zu einer täglichen anomalen Beobachtung
fortpflanzen.
- (4) Erzeugung von Alarmen. Diese Alarme sind regelbasierte Auslöser, die
durch den Endanwender definiert oder auf der Basis analytischer
Mittel zur Identifikation von Ereignissen (z. B. Verdichterereignissen) mit
Vorlaufzeit bereitgestellt werden können. Alarme beruhen auf Ausnahmeanomaliewerten
und Sensorrohdaten. Alarme können
ferner Anpassungen der Empfindlichkeitseinstellung und Aggregationseigenschaften
von Ausnahmeanomaliewerten nutzen.
- (5) Erzeugung von Heatmaps, die Daten in Wissen umwandeln. Eine
Heatmap (Warm-/Kaltdarstellung) ist ein Ausreißer-Detektions-Visualisierungswerkzeug,
das auf jede spezifizierte Maschineneinheit für eine große Anzahl ausgewählter Marken
in vielen unterschiedlichen Zeitpunkten ausgeübt werden kann. Eine Heatmap
veranschaulicht die Anomaliestärke
und die Richtung einer „Zielbeobachtung". Eine Heatmap kann
ferner eine visuelle Darstellung von Alarmen enthalten, und sie
lenkt die sofor tige Aufmerksamkeit auf kritische Hot-Spot-Sensorwerte
für eine
gegebene Maschine. Heatmaps können
ferner einen Vergleich zur Peers-Analyse liefern, der dem Betriebsteam
ermöglicht,
Vorläufer
und Nachläufer
sowie Absatzmöglichkeiten
fliegend, im Betrieb mit großer
Genauigkeit in unterschiedlichen Zeitmaßstäben (z. B. pro Sekunde, Minute,
Stunde, Tag, etc.) zu identifizieren.
-
Berechnung von Ausnahmeanomaliewerten
-
Um
Einheits-/Maschinen- und umgebungsbedingte Schwankungen zu berücksichtigen
und festzustellen, ob ein gegebener Wert für eine Marke (Tag) für eine Zieleinheit
außerhalb
eines erwarteten Bereiches liegt (d. h. anomal ist) oder nicht,
kann eine Kontextinformation genutzt werden, um eine Basis für die Analyse
der Markendaten der Zieleinheit zu bilden. Diese Kontextinformation
kann von zwei primären
Quellen entnommen werden: dem vergangenen Verhalten der Zieleinheit
und dem Verhalten von identischen Zieleinheiten (Zieleinheit-Peers).
Durch Verwendung einer derartigen Kontextinformation zur Quantifizierung
der typischen Größe einer
innerhalb der Gruppe oder in dem eigenen Verhalten der Einheit vorliegenden
Streuung bzw. Toleranz ist es möglich,
momentane Markendaten mit Kontextdaten systematisch und rigoros
zu vergleichen und das Niveau von anomalen Daten in den Markenwerten
der Zieleinheit genau zu beurteilen.
-
Wie
vorstehend erwähnt,
wird eine Kontextinformation dazu verwendet, den Grad des Ausmaßes richtig
zu beurteilen, in dem eine gegebene Marke anomal ist. Um eine effektive
Bewertung zu erhalten, müssen die
Kontextdaten richtig ausgewählt
werden. Bei der Auswahl der geeigneten Kontextdaten in dem Zeitbereich ist
es im Allgemeinen wünschenswert,
die nächsten
Daten, die für
den interessierenden Zeitraum verfügbar sind, zu betrach ten.
Da der interessierende Zeitraum gewöhnlich die letzten verfügbaren Daten
umfasst, ist der geeignete Zeitrahmen, der betrachtet werden sollte,
eine Folge der letzten Daten, die für die Einheit verfügbar sind – beispielsweise
die den letzten zwei Kalenderwochen entsprechenden Daten. Dies verringert
den Einfluss von saison- bzw. zeitabhängigen Faktoren.
-
Die
richtigen Kontextdaten zur Berücksichtigung
des Verhaltens der Gruppe und der Gesamtumgebung werden gefunden,
indem eine geeignete Gruppe von gleichrangigen „Peer"-Einheiten für die Zieleinheit verwendet
wird. Zum Beispiel wird eine Gruppe von Turbinen mit derselben Rahmengröße und in
derselben geografischen Region ausgewählt, damit sie als die geeignete
Peer-Gruppe für
die Zielturbine dient.
-
Zusätzlich zu
den vorstehend erwähnten
kontextbezogenen Aspekten enthalten Kontextdaten ferner vergleichbare
Betriebsbedingungen. Für
diese Realisierung, und um lediglich ein Beispiel anzugeben, können vergleichbare
Betriebsbedingungen derart definiert werden, dass sie einen beliebigen
Zeitraum in der Vergangenheit bedeuten, in dem die Einheit innerhalb
eines Fensters von 10 diegleichen OPMODE-, DWATT- und CTIM-Werte
aufweist. OPMODE kann als der Betriebsmodus (z. B. langsam laufend,
Spitzenausgangsleistung, 50%ige Leistungsabgabe, etc.) definiert
werden. DWATT kann eine Metrik für
die Leistung (z. B. die Ausgangsleistung in Megawatt) darstellen.
CTIM kann als eine Temperaturmetrik (z. B. Einlasstemperatur) definiert
werden. Wenn beispielsweise der Zielbeobachtungswert von OPMODE
gleich 1 ist und von DWATT gleich 95 ist, könnten nur die historischen
Zeiträume
genutzt werden, in denen OPMODE = 1 und DWATT zwischen 90 und 100
betrug. Diese miteinander vergleichbaren Betriebsbedingungen werden
als ein Teil der Systemkonfiguration definiert.
-
Durch
Festlegung des geeigneten Kontext sowohl hinsichtlich der Zeit,
der Geografie, der Rahmengröße und der
Betriebsbedingungen kann die Notwendigkeit einer subjektiven Beurteilung,
ob eine gegebene Marke anomal hoch oder niedrig ist, vermieden werden,
und es können
objektive und automatische Berechnungen durchgeführt werden, um Anomalien zu
detektieren und zu quantifizieren. Zur Berechnung der Z-Innerhalb-Ausnahmeanomaliewerte
(im Vergleich zur Vergangenheit) können 10–15 historische Beobachtungen verwendet
werden, bei denen die Einheit unter vergleichbaren Bedingungen (wie
vorstehend definiert) betrieben worden ist. Diese historischen Beobachtungen
können
verwendet werden, um einen Mittelwert und eine Standardabweichung
zu berechnen. Anschließend
kann der z-Wert der Zielbeobachtung unter Verwendung des Mittelwertes
und der Standardabweichung der historischen Beobachtungen berechnet
werden. Die minimale und die maximale Anzahl von Beobachtungen,
die für
die Berechnung des Z-Innerhalb-Ausnahmeanomaliewertes verwendet
werden, ist als Teil der Systemkonfiguration definiert. Der Z-Innerhalb-Wert
liefert einen Vergleich eines momentanen Betriebszustands einer
speziellen Maschine mit einem früheren
Betriebszustand der Maschine. Die zur Berechnung des Z-Innerhalb-Wertes
verwendete Gleichung kann allgemein in der Form angegeben werden:
-
Für jede Einheit
können
bis zu acht oder mehr weitere Einheiten mit dergleichen Rahmengröße, mit ähnlichen
Konfigurationen und in derselben geografischen Region als Peer-Einheiten
identifiziert werden. Der Z-Zwischen-Ausnahmeanomaliewert ist ein
Kennzeichen darüber,
wie weit sich eine spezielle Einheit oder Maschine von ihren Peers
unterscheidet. Beispielsweise eine F-Rahmen-Gasturbine verglichen
mit anderen ähnlichen
F-Rahmen-Gasturbinen.
Zur Berechnung der Z-Zwischen-Ausnahmeanomaliewerte (im Vergleich
zu Peers) kann die einzelne letzte Beobachtung von jedem der Peers,
bei der der Peer unter vergleichbaren Bedingungen (wie oben definiert)
betrieben wird, gewählt
werden. Dies ergibt bis zu acht oder mehr Peer-Beobachtungen, mit
denen ein Mittelwert und eine Standardabweichung berechnet werden.
Unter Verwendung des Mittelwertes und der Standardabweichung der
Peer-Gruppe kann anschließend
der z-Wert der Zieleinheit berechnet werden. Die minimale und die
maximale Anzahl von Beobachtungen, die für die Berechnung des Z-Zwischen-Ausnahmeanomaliewertes
verwendet werden, ist als Teil der Systemkonfiguration definiert.
Die zur Berechnung des Z-Zwischen-Wertes verwendete Gleichung kann
allgemein in der Form angegeben werden:
-
Es
ist zu beachten, dass der Fall vorkommt, in dem ein Wert entweder
anomal hoch oder anomal niedrig sein kann. Während es im Allgemeinen eine
bestimmte Richtung gibt, die als die bevorzugte Tendenz hinsichtlich
eines Wertes erkannt wird (z. B. ist es allgemein besser, geringe
Schwingungen zu haben als hohe Schwingungen), sollte erwähnt werden,
dass diese Methode dazu vorgesehen ist, Anomalien unabhängig von ihrer
Polarität
zu identifizieren und zu quantifizieren. In dieser Implementierung
kennzeichnet die Richtung keine „Gutigkeit" oder „Schlechtigkeit" des Wertes. Stattdessen
repräsentiert
sie die Richtung der Anomalie. Wenn der Ausnahmeanomaliewert im
Vergleich zu der Vergangenheit eine hohe negative Zahl dar stellt,
bedeutet dies, dass der Wert im Vergleich zu der Vergangenheit der
Einheit außergewöhnlich niedrig
ist. Wenn der Ausnahmeanomaliewert eine hohe positive Zahl darstellt,
bedeutet er, dass der Wert verglichen mit der Vergangenheit der
Einheit außergewöhnlich hoch
ist. Die Interpretation ist für
Peer bezogene Anomaliewerte ähnlich.
Die Anomalierichtung der einzelnen Marken kann als Teil der Systemkonfiguration
definiert werden.
-
Unter
Verwendung dieser Techniken zur Detektion von Anomalien können Alarme
erzeugt werden. Ein Alarm kann eine regelbasierte Kombination von
Markenwerten im Vergleich zu anpassbaren Schwellenwerten darstellen.
-
Erzeugung mehrerer Empfindlichkeitseinstellungen
-
Für Ausnahmeanomaliewerte
kann eine Umsetzung zwischen den Werten und den Prozentrestberechnungen
vorgenommen werden. Insbesondere entspricht ein Bereich von Größen der
Ausnahmeanomaliewerte einem Bereich von Prozentsätzen der Anomalieverteilung
bei der gegebenen Verteilung der Rohmetrik. Über diese Umsetzung bzw. Umrechnung
kann ein Analytiker die Ausnahmeanomaliewert-Cutoff-Werte herausgreifen,
die „Alarme" oder „Red Flags" für die Rohmetriken
kennzeichnen. Zusätzlich
ermöglicht
sie eine einfache Benutzung für
den Endanwender, der frei entscheiden kann, welcher Prozentsatz
hinreichend hoch ist, um als eine „Anomalie" bezeichnet zu werden. Außerdem kann über diese
Umsetzung die Definition der „Anomalie" von Anwendung zu
Anwendung, von Geschäftszweig
zu Geschäftszweig
oder von einer Metrik zur anderen ja nach Bedarf leicht verändert werden.
-
1 (Grenzwert(Cutoff)-Tabelle
für Ausnahmeanomaliewerte)
stellt eine Umrechnungstabelle dar, die verwendet werden kann, wenn
die Rohmetrik normal verteilt ist und die Anomalie definition zweiseitig
ist (d. h. sowohl hohe als auch niedrige Größenwerte der Rohmetrik würden anomale
Bereiche haben, für
die sich der Endanwender interessiert). Wenn beispielsweise der
Stichprobenumfang 8 beträgt
(Reihe 110) und die Rohmetrik annahmegemäß normal verteilt ist, wird
erwartet, dass 0,15% (Zelle 130) der Fälle unter einen Ausnahmeanomaliewert
von –6
und oberhalb von 6 (Spalte 120) fallen. In anderen Worten, wenn
das Überwachungs-
und Diagnostikteam gewillt ist, die oberen 0,15% Beobachtungen als „außerhalb
der Norm" innerhalb einer
Metrik zu erkunden, sollte es 6 als die Cutoff-Grenze auswählen, wenn
vorausgesetzt ist, dass ihr Stichprobenumfang 8 beträgt und eine
Normalverteilung angenommen wird. Diese Tabelle veranschaulicht
ferner die Beziehung zwischen den z-Werten und den Ausnahmeanomaliewerten.
Wenn der Stichprobenumfang steigt und wenn eine Normalverteilung
angenommen wird, werden die z-Werte und die Ausnahmeanomaliewerte
annähernd
gleich.
-
In
einer Turbine oder einem Verdichter können die Sensordaten beispielsweise über 300
unterschiedliche Marken mit vielen unterschiedlichen Formen der
Verteilungen aufweisen. Es ist eine Empfindlichkeitsanalyse erforderlich
um zu sehen, ob dieselben Cutoff-Werte in den allen Marken verwendet
werden können oder
ob unterschiedliche Cutoff-Werte für unterschiedliche Marken benötigt werden.
In anderen Worten muss bei den gegebenen hochdimensionalen Sensordaten
ein Test durchgeführt
werden, wie robust die Umrechnungstabellen über unterschiedliche Verteilungen
hinweg sind. Obwohl unterschiedliche Marken unterschiedliche Formen
und Maßstäbe von Verteilungen
aufweisen können,
können
die Z-Innerhalb- und Z-Zwischen-Werte bei diesen Marken eine geringere
Vielfalt an Formen und hinsichtlich der Größenauslegung aufweisen. In
all den Z-Innerhalb- und
Z-Zwischen-Verteilungen sind natürliche
Cutoff-Grenzen bei Ausnahmeanomaliewerten von 2, 6, 17, 50 und 150
ermittelt worden. Jedoch muss eine zusätzliche systematische empirische
Un tersuchung durchgeführt
werden, um die Cutoff-Grenzen und die zugehörigen Prozentsätze der
Anomalieverteilung zu bestimmen.
-
Die
Ausnahmeanomaliewerte werden in 11 „Eimer" (Buckets) klassifiziert (d. h. (–2, 2) =
Eimer0, (2, 6) = Eimer1, (6, 17) = Eimer2, (17, 50) = Eimer3, (50,
150) = Eimer4, (150 und mehr) = Eimer5, (–6, –2) = Eimer–1, (–17, –6) = Eimer–2, (–50, –17) = Eimer–3, (–150, –50) = Eimer–4, (–150 und
darunter) = Eimer-5). Für
jede Marke wird der Prozentsatz der in jeden Eimer fallenden z-Innerhalb-Werte
berechnet. Anschließend
wird die Verteilung für
diejenigen Prozentsätze
in den Marken für
jeden Eimer aufgezeichnet, und es werden sowohl die Quartilen als
auch das 95%-Konfidenzintervall für den Medianwert berechnet.
-
2 veranschaulicht
die deskriptive Statistik für
den Anomaliewert und zeigt ein Beispiel für diese Berechnungen an dem
Eimer5. Der Bereich 210 stellt ein Histogramm dar und zeigt
die Verteilung der Wahrscheinlichkeit oder Prozentwerte. Dies sind
die Wahrscheinlichkeiten dafür,
dass ein Anomalietreffer bei oder oberhalb des Cutoff-Wertes von
150 für
Z-Innerhalb-Werte erhalten wird. Der Bereich 220 zeigt
ein Boxendiagramm, das wiederum die Verteilungen der Wahrscheinlichkeit
oder Prozentwerte für
einen Anomaliewert bei oder oberhalb von 150 zeigt. Bereich 230 veranschaulicht
das 95%-Konfidenzintervall für
den Verteilungsmittelwert der Wahrscheinlichkeit oder Prozentwerte.
Die vertikale Linie in der Box kennzeichnet den Mittelwert, während die
Begrenzungen der Box den minimalen und den maximalen Wert für das Konfidenzintervall
kennzeichnen. Ein weiteres Boxendiagramm ist bei 240 angezeigt,
und dieses veranschaulicht das 95%-Konfidenzintervall für den Verteilungsmedianwert
der Wahrscheinlichkeit oder Prozentwerte. Die Linie in dieser Box kennzeichnet
den Medianwert, und die Begrenzungen der Box kennzeichnen den minimalen
und den maxi malen Wert für
das Konfidenzintervall. Die in dem Bereich 250 aufgelistete
Statistik repräsentiert
einen Test auf Normalverteilung für die veranschaulichte Verteilung,
wobei die zugrundeliegende Statistik, wie der Mittelwert und der
Medianwert sowie die Konfidenzintervalle für die Grundstatistik angezeigt
werden. Der Medianwert für die
Eimer5-Verteilung beträgt
ungefähr
0,1%, was kennzeichnet, dass etwa 0,1% der Z-Innerhalb-Treffer bei oder
oberhalb des Cutoff-Wertes von 150 liegen. Das 95%-Konfidenzintervall
für den
Medianwert liegt bei 0,07%–1,3%.
-
Berechnungen,
die denjenigen in 2 ähnlich sind, werden für alle Eimer
gesondert, somit für
alle Cutoff-Werte für
Z-Innerhalb- und Z-Zwischen-Werte durchgeführt. Die Ergebnisse der Analyse
zeigen, dass für
die gegebenen Sensordaten ähnliche
Cutoff-Werte über
die Marken hinweg verwendet werden können und dass somit die Umrechnungstabellen
sowie die im Voraus festgelegten Cutoff-Werte hinsichtlich der Rohmarken-Verteilungsunterschiede
robust sind.
-
3 zeigt
die Umrechnung zwischen den Cutoff-Werten und den Prozentsätzen der
Anomalieverteilung, die auf den empirischen Ergebnissen für die Z-Innerhalb-Werte
basiert. Auf der Basis der empirischen Untersuchung wird erwartet,
dass ungefähr
6% der Anomalietreffer Ausnahmeanomalietrefferwerte zwischen 2 und
6 aufweisen. Es sollte erwähnt
werden, dass diese erwarteten Anomalieprozentsätze, die auf einem realen Datensatz
beruhen, den Prozentsätzen,
die auf der in 1 dargestellten Simulationsuntersuchung
beruhen, sehr ähnlich
sind. Im Einzelnen wird erwartet, dass 6,7% der Treffer oberhalb
des Cutoff-Wertes von 2 liegen, während 13,4% der Treffer bei
diesem gegebenen Datensatz erwartungsgemäß oberhalb des Cutoff-Wertes von 2 und
unterhalb des Cutoff-Wertes von –2 liegen.
-
Wenn
der Stichprobenumfang 6 bis 7 beträgt, zeigt 1 in ähnlicher
Weise den Wechsel von 12,31% zu 14,31% für die Cutoff-Werte oberhalb
von 2 und unterhalb von –2.
-
Die
obigen Ergebnisse bestätigen
die erwarteten Umrechnungen für
die Ausnahmeanomalietreffer-Cutoff-Werte, wenn echte Daten von Sensordaten
einer Energieerzeugungseinrichtung vorausgesetzt werden. Ein zweiter
Analysesatz wurde durchgeführt
um zu bestätigen,
dass die vorgeschlagenen Cutoff-Werte und zugehörigen Prozentsätze nicht
nur für
alle Z-Innerhalb-Werte über
alle Marken hinweg sondern auch in jeder Marke gültig sind, wenn der Stichprobenumfang
im Vergleich zu den Gesamtdaten relativ klein ist. Kontinuierliche
Z-Innerhalb-Werte wurden in einen Ordinalwert mit 11 Kategorien
mit den vordefinierten 11 Eimern umgewandelt. Die Verteilung des
Ordinalwertes wurde anschließend
für jede
Marke gesondert aufgezeichnet (siehe 4). Wie
aus der Kurve nach 4 ersichtlich, haben die meisten
der Marken eine ähnliche
Formverteilung für
die ordinalen Z-Innerhalb-Werte.
-
5 veranschaulicht
die Verteilungen an den ordinalen Z-Zwischen-Werten für jede Marke ähnlich wie
in 4. Obwohl es einige Marken mit etwas anderen Formen
für die
Eimer 2, 3, –2
oder –3
gibt, sind die Formen für
die Z-Zwischen-Werte allgemein nicht allzu anders als die Formen
für die
Z-Innerhalb-Werte.
Somit wird gefolgert, dass dieselben Cutoff-Werte über die
Marken hinweg sowohl für
die Z-Innerhalb- als auch die Z-Zwischen-Werte
innerhalb dieses Datensatzes verwendet werden können. Außerdem können die Anomalieprozentsätze zur
Umrechnung für
die vorgeschlagenen Cutoff-Werte (d. h. 2, 6, 17, 50, 150, –2, –6, –17, –50, –150) entweder
auf der Basis der empirischen Ergebnisse (siehe 3)
oder auf der Basis der Simulationsuntersuchung (siehe 1)
festgelegt werden, weil sie ähnliche
Zahlen vorschlagen.
-
Aggregation verschiedener
anomaler Beobachtungen
-
Vielen
Anwendern von Einrichtungen (z. B. Kraftwerk-, Turbinenbetreiber,
etc.) steht eine Fülle
von Daten zur Überwachung
und Diagnose zur Verfügung.
Entscheidender ist, dass diese Daten häufig in kleinen Zeiteinheiten
(z. B. für
jede Sekunde oder jede Minute) vorliegen. Obwohl eine Datenfülle ein
Vorteil ist, sollte ihre Aggregation in effektiver Weise durchgeführt werden,
so dass die Datenspeicherung und Datenüberwachung nicht problematisch
werden und die Daten weiterhin ihr nützliches Wissen behalten.
-
Obwohl
eine Aggregation sehr erwünscht
ist, bürgt
sie für
einige Aufgaben eine Gefahr. Eine Anomalieaggregation ist in sich
und von sich aus ein Oxymoron. Alle Anomalien implizieren eine Spezifität und eine Konzentration
auf jeden einzelnen Datenpunkt, während eine Aggregation eine
Zusammenfassung über
das Ausschließen
der Spezifika und der Anomalien impliziert. Jedoch wird eine Anomalieaggregation
unabhängig von
ihrer sich widersprechenden Natur benötigt, weil pro Sekunde oder
pro Stunde akquirierte Daten nicht für viele Marken in vielen Zeiträumen gespeichert
werden können
und es, was wichtiger ist, für
bestimmte Arten von Ereignissen zu viele Daten geben kann, um jede
Sekunde oder sogar jede Stunde zu überwachen. Insbesondere sind
die meisten Einrichtungsbetreiber daran interessiert, „akute" Anomalien im Vergleich
zu „chronischen" Anomalien für ihre Maschineneinheiten
zu erfassen. Akute Anomalien sind die selten vorkommenden Anomalien
hoher Amplitude bzw. Größe. Chronische
Anomalien treten in unterschiedlichen Einheiten und Zeiten für eine spezielle
Metrik häufig
auf.
-
6 veranschaulicht
Z-Innerhalb-Messwerte von zwei Einheiten im Verlauf der Zeit. Die
X-Achse stellt die Zeit für
jede Einheit dar. Die vertikale Strichlinie 630 trennt
die Da ten der beiden Einheiten voneinander. Die Daten der ersten
Einheit liegen auf der linken Seite der Strichlinie 630 und
sind mit 610 bezeichnet. Die Daten der zweiten Einheit
liegen auf der rechten Seite der Strichlinie 630 und sind
durch 620 gekennzeichnet. Wie aus der Kurve ersehen werden
kann, hat die zweite Einheit (Bereich 620) zwei Ausreißer, die
unterhalb bzw. oberhalb von –100
bzw. 100 liegen. Da das Auftreten dieser Bereiche für diese
Metrik und für
diese Einheiten ein seltenes Ereignis darstellt, werden diese beiden
Ausreißer
als „akut" bezeichnet. Die
Kurve in 7 kann ähnlich wie die Kurve nach 6 gelesen
werden und zeigt das Konzept der „chronischen Anomalien". Chronische Anomalien
sind definitionsgemäß Einfanganomalien
(d. h. Größen oberhalb
von 2 oder unterhalb von –2
auf den Ausnahmeanomaliewerten), die in unterschiedlichen Einheiten
und im Zeitablauf für eine
spezielle Metrik häufig
auftreten.
-
Wie
vorstehend erwähnt,
gibt es viele unterschiedliche Möglichkeiten,
Daten zu aggregieren. Eine Statistik enthält per Definition eine Aggregation.
Eine Darstellung der Daten mit Hilfe einer Hand voll Zahlen, z.
B. des Mittelwertes, des Medianwertes, der Standardabweichung, der
Varianz, etc., ist die simpelste Definition der „Statistik" oder „Analytik". Jedoch liefert keine dieser seit langem
existierendenden Methoden eine Lösung für die Anomalieaggregation.
Ein Tagesdurchschnitt kann eine stündliche Anomalie nicht lückenlos
veranschaulichen. Die Aggregation von „Ausnahmeanomaliewerten" stellt ein neues
Verfahren dar, wie es die vorliegende Erfindung verkörpert. Früher war
die Überwachung
von stündlichen
Daten die einzige Methode, um stündliche
Anomalien zu identifizieren. Eine Datenüberwachung musste auf der Ebene
der Granularität
vorgenommen werden, in der die Anomalien detektiert werden sollten.
In anderen Worten musste dies bei den höchsten Granularitäten, z.
B. pro Sekunde oder pro Stunde, vorgenommen werden. Bei dieser Granularität ist es
schwierig, Langzeittendenzen zu erkennen oder die Einheiten effektiv
miteinander zu vergleichen und einander gegenüberzustellen.
-
Es
sind zwei Maße
gemäß Ausführungsformen
der vorliegenden Erfindung beschrieben, die verwendet werden können, um
die Ausnahmeanomaliewerte zu aggregieren: Anomaliegrößenmaß und Anomaliefrequenzmaß. Ein Anomaliegrößenmaß nutzt
Maße der
zentralen Tendenz bzw. Lagemaße,
wie beispielsweise den Mittelwert. Ein Anomaliefrequenzmaß nutzt
Verhältnisse
oder prozentuale Anteile.
-
Ein
Anomaliegrößenmaß kann akute
Anomalien identifizieren und Maße
der zentralen Tendenz nutzen. Ein absoluter Tagesdurchschnitt (wie
er auf der linken Seite der 8 veranschaulicht
ist) stellt ein Beispiel für
ein Anomaliegrößenmaß dar. Ein
absoluter Durchschnitt kann veranschaulichen, ob in einem vorbestimmten
Zeitraum (z. B. Sekunde, Minute, Stunde, Tag, Woche, Monat oder
Jahr) eine oder mehrere Anomalien hoher Größe entweder in der negativen
oder in der positiven Richtung vorliegen. Beispielsweise würde ein absoluter
Tagesdurchschnitt veranschaulichen, ob innerhalb eines Tages eine
oder mehrere hohe Anomalien entweder in der negativen oder in der
positiven Richtung vorhanden sind.
-
Ein
Anomaliefrequenzmaß kann
verwendet werden, um chronische Anomalien zu identifizieren, und es
kann Verhältnisse
oder Prozentsätze
verwenden. Eine tägliche
prozentuale Anomalie (wie sie auf der rechten Seite in 8 veranschaulicht
ist) stellt ein Beispiel für
ein Anomaliefrequenzmaß dar.
Eine tägliche
prozentuale Anomalie würde
den absoluten Tagesdurchschnitt in dem Sinne ergänzen, als sie die Anzahl von
anomalen Stunden innerhalb eines Tages oder die Anzahl von anomalen
Tagen innerhalb eines Monats veranschaulichen könnte. Im Allge meinen kann das
Anomaliefrequenzmaß dazu
verwendet werden, die Anzahl von anomalen Zeiträumen (z. B. Sekunden, Minuten,
Stunden, etc.) innerhalb einer längeren
Zeitdauer (z. B. Minuten, Stunden, Tagen, ect.) zu veranschaulichen.
-
Wenn
diese zwei Werte (d. h. der absolute Tagesdurchschnitt und die tägliche prozentuale
Anomalie) gleichzeitig genutzt werden, würden sie Tage mit anomalen
Stunden aufzeigen sowie zwischen akuten und chronischen Anomalien
unterscheiden. Akute Anomalien (die selten auftreten) würden hohe
absolute Tagesdurchschnitte und geringe tägliche prozentuale Anomaliewerte
aufweisen. Akute Anomalien könnten
durch eine oder zwei Anomalien hoher Größe veranschaulicht werden.
Andererseits würden
chronische Anomalien (die häufig
auftreten) geringe oder hohe absolute Tagesdurchschnitte und hohe
tägliche
prozentuale Anomaliewerte aufweisen. Chronische Anomalien könnten durch
ein paar wenige bis zu einer Reihe von Anomalien innerhalb eines
Tages veranschaulicht werden. Jedoch brauchen chronische Anomalien
nicht unbedingt hohe Größen der
Ausnahmeanomaliewerte zu haben.
-
8 zeigt
ein Beispiel für
die Verwendung der Anomaliegrößen- und
Anomaliefrequenzmaße.
Die Kurve auf der linken Seite der 8 zeigt
ein Anomaliegrößenmaß mit einem
absoluten Tagesdurchschnitt. Die Kurve auf der rechten Seite zeigt
ein Anomaliefrequenzmaß mit
einer prozentualen Anomalie. Diese Anomaliegrößen- und Anomaliefrequenzwerte
können
sowohl für
die Z-Zwischen-Werte als auch für
die Z-Innerhalb-Werte berechnet werden. Außerdem können in jeder Dimension sowohl
Größen- als
auch Frequenzwerte gesondert Marken, Zeiträumen und Maschineneinheiten
zugeordnet werden. Anschließend
können
diese Einteilungen bzw. Zuordnungen in Perzentile gewandelt werden,
wodurch sich ein Perzentil für
den Anomaliegrößenwert
im Vergleich zu einem Perzentil für den Anomaliefrequenzwert
er gibt. Zusätzlich
können
diese Perzentile für
jeden Wert über
die „Maximum"-Funktion für Z-Zwischen-Werte
und Z-Innerhalb-Werte
gesondert miteinander kombiniert werden. Insbesondere würde ein
maximales Perzentil für
entweder einen Z-Zwischen- oder
Z-Innerhalb-Anomaliewert entweder eine akute oder eine chronische
Anomalie oder beides kennzeichnen.
-
9 veranschaulicht
eine grafische Darstellung und einen Satz von Daten über maximale
Z-Zwischen-Perzentile und maximale Z-Innerhalb-Perzentile. Beispielsweise
repräsentieren
die Punkte in der gestrichelten Box in der oberen rechten Ecke der
Darstellung dieselbe Turbine an vier aufeinanderfolgenden Tagen, an
denen Anomalien in Bezug auf die „CSGV"-Marke ausgelöst werden. Die CSGV-Marke kann
eine Metrik sein, die den IGV(Inlet Guide Vane, Einlassleitschaufel)-Winkel
betrifft. Diese vier Datenpunkte (die Dateneingaben 92, 93, 94,
95 in 10 entsprechen) sind sowohl
in Bezug auf die Vergangenheit als auch auf die Peer-Einheiten der
Einheit anomal. Wenn diese vier Tage für diese Einheit auf der CSGV-Marke
weiter untersucht werden, kann ersehen werden, dass viele Stunden
innerhalb dieser Tage Anomalien in Bezug auf die Peer-Einheiten
haben. Andererseits sind stündliche
Z-Innerhalb-Anomalien rar an der Zahl im Vergleich zu stündlichen
Z-Zwischen-Anomalien, wobei jedoch ihre Größe hoch ist. All diese Folgerungen
können
aus der Datentabelle nach 10 abgelesen
werden, die die täglichen
Anomaliegrößen- und
Anomaliefrequenzwerte und täglichen
Perzentile für
Z-Zwischen-Werte und Z-Innerhalb-Werte enthält.
-
Erzeugung von Alarmen und
Erzeugung von Heatmaps
-
Das
Anomaliedetektionsprozess- und Heatmap-Werkzeug kann gemäß einer
Ausführungsform
der vorliegenden Erfindung in Software mit zwei Java-Programmen
implementiert werden, die als die Berechnungsmaschine und als das
Visualisierungswerkzeug bezeichnet werden. Die Berechnungsmaschine
berechnet Ausnahmeanomaliewerte, aggregiert Anomaliewerte, aktualisiert
eine Oracle-Datenbank und sendet Alarme aus, wenn Regeln ausgelöst werden.
Die Berechnungsmaschine kann von einem Befehlszeilen-Stapelverarbeitungsprozess,
der jede Stunde abläuft,
periodisch aufgerufen werden. Das Visualisierungswerkzeug zeigt auf
Anforderung hin Anomaliewerte in einer Heatmap an (siehe 11)
und ermöglicht
einem Benutzer, Regeln zu erzeugen. Das Visualisierungswerkzeug
könnte
als eine Web-Anwendung
ablaufen. Diese Programme können
auf einem Linux, Windows oder sonstigen Betriebssystem basierten
Anwendungsprozessor ablaufen.
-
Ein
Beispiel für
einen Befehlszeilenaufruf für
die Berechnungsmaschine ist:
Java -Xmx2700m -jar populate.jar
--update t7 n
-
Dies
weist die Berechnungsmaschine an, die periodische Aktualisierung
durchzuführen,
bis zu sieben oder mehr gleichzeitige Threads zu verwenden und vor
der Verarbeitung alle neuen Sensordaten in der Datenbank zu identifizieren.
Das Programm beginnt mit der Berechnung von Regeln für alle neuen
kundenspezifischen Alarme und alle neuen kundenspezifischen Peer-Einheiten der Maschineneinheiten,
die durch die Benutzer des Visualisierungswerkzeugs erzeugt worden
sind. Es ruft anschließend
neu angekommene Sensorrohdaten von einem Server ab, speichert die
neuen Daten in der Oracle-Datenbank und berechnet Ausnahmeanomaliewerte
und kundenspezifische Alarme für
die neu hinzugefügten
Daten. Es speichert Ergebnisse all dieser Berechnungen in einer
Datenbank und ermöglicht
dem Visualisierungswerkzeug, eine Heatmap der Ausnahmeanomaliewerte
und Kundenalarme anzuzeigen. Wenn die Berechnungen einen kundenspezi fischen Alarm
mit einer Regel auslösen,
die eine gute Möglichkeit
der Erfassung eines eine Maschine beeinträchtigenden Ereignisses mit
Vorlaufzeit aufweist, kann die Berechnungsmaschine konfiguriert
sein, um ein Warnsignal zu den Mitgliedern des Überwachungs- und Diagnoseteams
auszusenden. Die Alarme könnten
Audiosignale und/oder optische Signale, die von den Teamcomputern/-notebooks
angezeigt werden, oder Signale sein, die zu den Kommunikationsgeräten des
Teams (z. B. Mobiltelefone, Pager, PDAs, etc.) übertragen werden.
-
Die
primäre
Aufgabe des Visualisierungswerkzeugs bzw. -hilfsprogramms besteht
darin, Mitgliedern des Überwachungs- und Diagnoseteams
Heatmaps für
spezielle Maschineneinheiten anzuzeigen. Benutzer des Visualisierungstools
können
den Datenbereich verändern,
die Peer-Gruppe verändern
und in den Zeitreihengraphen der einzelnen Markendaten „bohren". Das Visualisierungswerkzeug
kann Java Server Pages für seine
Präsentationsebene
und Benutzerschnittstelle verwenden. Die Java Server Pages sind
die Ansichten in der MVC-Architektur und enthalten keine Business-Logik.
Die einzigen Anforderungen an den Server und die Client-Maschinen
sind für
die Ausführungsform
gemäß diesem
Beispiel ein Java kompatibler Servlet-Container und ein Webbrowser.
-
Das
Visualisierungswerkzeug unterstützt
auch einige andere Nutzungsfälle.
Benutzer des Visualisierungswerkzeugs können Peer-Heatmaps sichten,
Maschinen mit ähnlichen
Alarmen auffinden, kundenspezifische Peer-Gruppen kreieren, kundenspezifische
Alarme erzeugen und verschiedene Arten von Berichten ansehen. Peer-Heatmaps
vereinigen alle Maschinenheatmaps zu einer einzelnen Heatmap, bei
der benachbarte Spalten Heatmapzellen von Peermaschinen zum gleichen
Zeitpunkt zeigen, anstatt die eigenen Heatmapzellen der Maschine
in früheren
und späteren
Zeitpunkten zu zeigen. Benutzer können das Datum verän dern, in den
Zeitreihengraphen unter Vergleich von Peer-Daten für spezielle
Marken herumstochern und sich durch die Maschinenheatmaps hindurcharbeiten.
Auf anderen Seiten können
Benutzer ferner Kundenalarme spezifizieren und nach Maschinen suchen,
die diese Alarme ausgelöst
haben. Benutzer können
Regeln für
kundenspezifische Alarme erzeugen, modifizieren und löschen. Berichte
fassen Informationen über überwachte
Einheiten, die Latenzzeit von Sensorrohdaten von Einheiten (die
sich zwischen den Einheiten unterscheidet) und die Genauigkeit der
soweit ausgelösten
Alarme zusammen.
-
Beispielsweise
wurde die Anomaliedetektionsmethode, wie sie durch die vorliegende
Erfindung verkörpert
ist, auf einen Satz Turbinen angewandt, bei denen ein wesentliches
Fehlerereignis auftrat. Das Fehlerereignis war selten und trat während des
viermonatigen Zeitraums, für
den historische Sensordaten verfügbar waren,
nur in zehn Turbinen auf. Für
jede Turbine, die dieses Ereignis erfahren hat (Ereigniseinheiten)
wurden bis zu zwei Monate historischer Daten gesammelt. Für die Zwecke
des Vergleichs wurden vier Monate historischer Daten für 200 Turbinen,
die das Ereignis nicht erfahren haben (Nicht-Ereigniseinheiten), erfasst.
-
Für jede Ereignis-Einheit
wurde eine Peer-Gruppe erzeugt, die 6–8 weitere Turbinen mit ähnlicher
Einrichtung aufwies, die in derselben geografischen Region arbeiteten.
Die Z-Innerhalb- und Z-Zwischen-Ausnahmeanomaliewerte wurden anschließend für die Ereignis-
und die Nicht-Ereignis-Einheiten berechnet. Die Z-Innerhalb-Werte
kennzeichneten, wie unterschiedlich eine Einheit war im Vergleich
zu früheren
Beobachtungen, wenn die Einheit unter ähnlichen Bedingungen betrieben
worden ist, wie dies anhand des Betriebsmodus, der Wattausgangsleistung
und der Umgebungstemperatur gemessen worden ist. Die Z-Zwischen-Werte kennzeichneten,
wie unterschiedlich eine Einheit war im Vergleich zu ihren Peer-Einheiten,
wenn sie unter ähnlichen
Bedingungen betrieben worden sind. Diese Abweichungen wurden anschließend mit
Hilfe einer Heatmap, wie in 11 veranschaulicht,
visualisiert.
-
Die
Spalten der Heatmap, wie sie in 11 veranschaulicht
ist, kennzeichnen Zeiträume.
Die Zeiträume
könnten
Tage, Stunden, Minuten, Sekunden oder längere oder kürzere Zeitdauern
sein. Die Zeilen der Reihen repräsentieren
interessierende Metriken, wie beispielsweise Schwingungs- und Leistungsmessungen.
Für jede
Metrik kann es zwei oder mehrere Reihen mit gefärbten Zellen geben, wobei in 11 lediglich
eine einzelne Reihe veranschaulicht ist und die Zellen der Übersichtlichkeit
wegen mit unterschiedlichen Mustern schraffiert sind. Weiße Zellen
können
als normal oder nicht anomal angesehen werden. Die mit dünnen bzw. schwachen
vertikalen Linien gefüllten
Zellen in der AFPAP-Reihe könnten
als kleine negative Werte angesehen werden, während die mit dicken bzw. starken
vertikalen Linien gefüllten
Reihen in der GRS PWR COR(Corrected Gross Power, korrigierte Bruttoleistung)-Reihe
als große
negative Werte angesehen werden könnten. Die dünnen horizontalen
Linien in der CSGV-Reihe könnten
als kleine positive Werte angesehen werden, während die dicken horizontalen
Linien in derselben Reihe als hohe positive Werte angesehen werden könnten. Die
Reihe „Kleiner
Alarm" weist ein
gekreuztes Schraffurmuster in bestimmten Zellen auf. Jedoch stellt
dies nur ein einzelnes Beispiel für eine visuelle Unterscheidung
zwischen kleinen, hohen und normalen Werten dar, so dass viele verschiedene
Muster, Farben und/oder Farbstärken
verwendet werden könnten.
-
Die
Zellen der Heatmap können
unterschiedliche Farben oder unterschiedliche Schattierungen oder Muster
anzeigen, um zwischen unterschiedlichen Werten oder Größen und/oder
Richtungen/Polaritäten
von Daten zu unterscheiden. In Zweireihen-Aus führungsformen könnte die
obere Reihe die Größe der Z-Zwischen-Ausnahmeanomaliewerte
darstellen, während
die untere Reihe die Größe der Z-Innerhalb-Ausnahmeanomaliewerte
darstellen könnte.
Wenn der Anomaliewert negativ ist (somit einen Wert kennzeichnet,
der ungewöhnlich
niedrig ist), könnte
die Zelle blau gefärbt
werden. Kleinere negative Werte könnten hellblau und größere negative
Werte könnten
dunkelblau sein. Wenn der Anomaliewert positiv ist (somit einen
Wert kennzeichnet, der ungewöhnlich
hoch ist), könnte
die Zelle orange gefärbt
werden. Kleinere positive Werte könnten hellorange sein, während größere positive
Werte dunkelorange sein könnten.
Der Benutzer kann den Betrag, der erforderlich ist, um bestimmte
Farbintensitäten
zu erreichen, spezifizieren. Es kann so viele Farbstufen, die angezeigt
werden, geben, wie dies erwünscht
ist, so dass beispielsweise anstelle der drei Farbstufen 1, 2 oder 4
oder mehrere Farbintensitätsstufen
angezeigt werden könnten.
In diesem Beispiel wurden die Cutoff-Grenzwerte anhand der Empfindlichkeitsanalyse
bestimmt.
-
Die
in 12 veranschaulichte Heatmap liefert eine einzelne
Momentaufnahme oder ein Protokoll über den gesamten Systemzustand
für den
Zeitraum der letzten 24 Stunden. Die Zellen identifizieren diejenigen
Metriken, die im Vergleich zu der Turbinenvergangenheit oder ihren
Peer-Einheiten außergewöhnlich sind. Die
Heatmap ermöglicht
einem Mitglied des Überwachungsteams,
den Systemzustand schnell zu überprüfen und
kritische „Hot-Spot"-Sensorwerte schnell
zu identifizieren. In dem Fall der Fehlerereigniseinheiten zeigt
die Heatmap, dass die Turbine einen deutlichen Abfall von vielen
Leistungsmesswerten, wie beispielsweise GRS PWR COR (korrigierte
Bruttoleistung), erfahren hat, während
sie zur gleichen Zeit eine deutliche Schwingungssteigerung (wie
durch die BB- und BR-Metriken
gemessen) erfahren hat. Eine Überprüfung der
Ereignis- im Vergleich zu der Nicht-Ereignis-Turbinen-Heatmap zeig te,
dass dieses Charakteristikum in vier der zehn Ereignis-Einheiten für mehrere
Stunden vor dem Ereignis vorhanden war, jedoch in keiner der Nicht-Ereignis-Einheiten
vorhanden war. Durch visuelle Überprüfung der
Heatmap der Ereignis-Einheiten im Vergleich zu Nicht-Ereignis-Einheiten
kann das Überwachungsteam
Regeln entwickeln, die als Warnhinweise auf diesen Fehlerzustand
dienen werden. Diese Regeln können
anschließend
in das System in Form von regelbasierten „Red Flags" einprogrammiert werden. Das System
wird dann Turbinen überwachen
und das Überwachungsteam
warnen oder alarmieren, wenn diese Red Flags ausgelöst werden.
-
Die
obere Reihe der in 12 veranschaulichten Heatmap
kann verschiedene Muster, Farben und Farbintensitäten anzeigen,
um in visueller Weise zwischen unterschiedlichen Wertebereichen
zu unterscheiden. In diesem Beispiel können große negative Werte durch dicke
horizontale Linien, mittlere negative Werte durch mittlere horizontale
Linien und geringe negative Werte durch dünne horizontale Linien angezeigt
werden. In ähnlicher
Weise können
große
positive Werte durch dicke vertikale Linien, mittlere positive Werte
durch mittlere vertikale Linien und kleine positive Werte durch
dünne vertikale
Linien angezeigt werden. In Ausführungsformen,
die Farbe verwenden, könnten
die Rechtecke in der oberen Reihe der in 12 veranschaulichten Heatmap
verschiedene Farben und Intensitäten
anzeigen. Beispielsweise könnte
die mit dicken horizontalen Linien gefüllte Box durch eine durchgehend
dunkelblaue Farbe ersetzt werden, während die mit mittelstarken horizontalen
Linien gefüllte
Box durch eine durchgehend blaue Farbe ersetzt werden könnte und
die mit hellen horizontalen Linien gefüllte Box durch eine durchgehend
hellblaue Farbe ersetzt werden könnte.
Die mit dicken vertikalen Linien gefüllte Box könnte durch eine durchgehend
dunkelorange Farbe ersetzt werden, während die mit mittelstarken
vertikalen Linien gefüllte
Box durch eine durchgehend orange Farbe ersetzt werden könnte und
die mit dünnen
vertikalen Linien gefüllte
Box durch eine durchgehend hellorange Farbe ersetzt werden könnte. Dies
sind lediglich ein paar wenige Beispiele für die vielen Farben, Muster
und Intensitäten,
die verwendet werden könnten,
um zwischen verschiedenen anomalen Werten oder Treffern zu unterscheiden.
-
Während hier
verschiedene Ausführungsformen
beschrieben sind, ist es aus der Beschreibung offensichtlich, dass
verschiedene Kombinationen der Elemente gebildet, Veränderungen
oder Verbesserungen an diesen vorgenommen werden können und
in dem Rahmen der Erfindung liegen.
-
Es
ist ein Verfahren zur Aggregation anomaler Werte geschaffen. Das
Verfahren weist eine Erfassung von Betriebsdaten von wenigstens
einer Maschine und eine Berechnung wenigstens eines Ausnahmeanomaliewertes
anhand der Betriebsdaten auf. Der Ausnahmeanomaliewert kann anschließend aggregiert
werden, um akute oder chronische anomale Werte zu identifizieren.
-
- 110
- Reihe
des Stichprobenumfangs
- 120
- Ausnahmeanomaliewert-Spalte
- 130
- Zelle
in der Tabelle
- 210
- Histogramm
- 220
- Boxendiagramm
- 230
- Boxendiagramm
- 240
- Boxendiagramm
- 250
- Statistik
des Tests auf Normalverteilung
- 610
- Daten
der ersten Einheit
- 620
- Daten
der zweiten Einheit
- 630
- Strichlinie