DE112021002699T5 - Vorhersage von leistungsverschlechterung mit nicht linearen merkmalen - Google Patents

Vorhersage von leistungsverschlechterung mit nicht linearen merkmalen Download PDF

Info

Publication number
DE112021002699T5
DE112021002699T5 DE112021002699.2T DE112021002699T DE112021002699T5 DE 112021002699 T5 DE112021002699 T5 DE 112021002699T5 DE 112021002699 T DE112021002699 T DE 112021002699T DE 112021002699 T5 DE112021002699 T5 DE 112021002699T5
Authority
DE
Germany
Prior art keywords
data
clusters
score
cluster
anomaly score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE112021002699.2T
Other languages
English (en)
Inventor
Neda Kordjazi
Moshood Omolade Saliu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE112021002699T5 publication Critical patent/DE112021002699T5/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/04Billing or invoicing

Abstract

Beschrieben werden Techniken zum Vorhersagen einer allmählichen Leistungsverschlechterung mit nicht linearen Merkmalen. Die Techniken umfassen ein Verfahren, das ein Eingeben eines neuen Datenbeispiels in ein Ausfallvorhersagemodell aufweist, wobei das Ausfallvorhersagemodell durch Verwenden eines markierten historischen Datensatzes geschult wird, wobei jeweilige Datenpunkte einem Rückblickfenster und einem Vorhersagehorizont zugehörig sind, um jeweilige Schulungsbeispiele zu erstellen, wobei die jeweiligen Schulungsbeispiele zu Clustern in einer Mehrzahl von Clustern zusammengefasst werden, und wobei die Mehrzahl von Clustern jeweils einer Normalitätsbewertung und einer Anomaliebewertung zugehörig ist. Das Verfahren weist ferner ein Ausgeben einer Klassifizierung, die dem neuen Datenbeispiel zugehörig ist, auf Grundlage eines Vergleichens einer ersten Anomaliebewertung eines ersten Clusters von der Mehrzahl von Clustern, der das neue Datenbeispiel aufweist, mit einer durchschnittlichen Anomaliebewertung von Clustern von der Mehrzahl von Clustern auf, deren Normalitätsbewertung größer als die Anomaliebewertung ist.

Description

  • HINTERGRUND
  • Die vorliegende Offenbarung betrifft Vorhersagemodellierung und insbesondere die Vorhersage von Leistungsverschlechterung mit nicht linearen Merkmalen.
  • Eine nicht lineare Leistungsverschlechterung kann Phänomene umfassen, die sich auf die allmähliche Schädigung von einem oder mehreren mechanischen Systemen oder Elementen beziehen, wobei die allmähliche Schädigung letztendlich zu einem Ausfall oder einer permanenten suboptimalen Leistung des einen oder der mehreren mechanischen Systeme oder Elemente führen kann. Derartige allmähliche Schädigungen im Zusammenhang mit einer nicht linearen Leistungsverschlechterung können sich auf jeden Typ von Abnutzung beziehen (z.B. Schwächung durch allmählichen Abbau oder Verformung einer Komponente auf Grundlage ihres Zusammenwirkens mit einer anderen Substanz), Ermüdung (z.B. Schwächung aufgrund zyklischer Belastung), Kriechdehnung (z.B. Verformung aufgrund anhaltender mechanischer Beanspruchungen) und/oder andere nicht lineare Phänomene. Die nicht lineare Leistungsverschlechterung kann durch mechanische, chemische, thermische oder andere Beanspruchungen herbeigeführt werden. Zum Beispiel können die Abnutzungsphänomene Abrasionsverschleiß, Erosionsverschleiß und andere Verschleißtypen umfassen.
  • Ein Vorhersagen einer nicht linearen Leistungsverschlechterung wie zum Beispiel eine abnutzungsbedingte Schädigung birgt jedoch viele Herausforderungen. Zum einen ist Abnutzung ein allmähliches Versagen, das über eine längere Zeitdauer immer stärker wird. Dementsprechend ist die Beziehung zwischen normalen und abgenutzten Zuständen nicht linear, was die Anwendung von linearen Modellen (z.B. Naïve Bayes, Support-Vektor-Maschinen (SVMs) usw.) ungeeignet macht. Des Weiteren ist das Fortschreiten des Abnutzungsfehlers zwischen ähnlichen Anlagen in hohem Maße unterschiedlich (z.B. versagen einige Anlagen in 50 Tagen, wogegen andere in 6 Monaten versagen), was zum Beispiel von Nutzungsmerkmalen abhängt. Zum Beispiel kann eine abnutzungsbedingte Leistungsverschlechterung in Exzenterschneckenpumpen (PCPs) von einer Anzahl von Faktoren abhängen, wie zum Beispiel dem Typ der unter der Oberfläche liegenden geologischen Formation, der Sandgranularität und/oder dem Betriebsprofil einer bestimmten PCP. Somit kann das Maß einer Leistungsverschlechterung in Abhängigkeit von der Zeit bis zum Ausfall zum selben Zeitpunkt über verschiedene Anlagen übergreifend auf Grundlage einer Vielfalt von Betriebsfaktoren variieren.
  • Eine weitere Herausforderung für ein Vorhersagen einer nicht linearen Leistungsverschlechterung betrifft das Ungleichgewicht zwischen den normalen und den fehlerhaften Betriebszuständen einer Anlage, die eine nicht lineare Leistungsverschlechterung wie zum Beispiel eine abnutzungsbedingte Leistungsverschlechterung erfährt. Mit anderen Worten, die Mehrheit (z.B. mehr als 90 %) eines Schulungsdatensatzes weist eine normale Leistung mit sehr wenigen Daten auf, die fehlerhafte Leistung zeigen. Akkurate Vorhersagen aus unausgewogenen Schulungsdaten zu treffen ist bekanntermaßen schwierig. Zum Beispiel ist ein Verwenden von hochgradig parametrisierten nicht linearen Verfahren (z.B. künstliche neuronale Netzwerke (Artificial Neural Networks) (ANNs)) insofern keine vernünftige Lösung, als zur Feinabstimmung und Optimierung der massiven Anzahl von Parametern in einem ANN eine Unmenge von Daten (mit ausreichend Beispielen von beiden Klassen) benötigt wird. In Fällen, in denen die Daten jedoch in hohem Maße unausgewogen sind, ist die Anzahl von Beispielen in dem Anomaliezustand unzureichend, um ein ANN effektiv zu schulen. Zum Beheben des Problems von unausgewogenen Daten können Überabtastungs- und/oder Unterabtastungsverfahren eingesetzt werden, wobei diese Verfahren jedoch letztlich die ursprüngliche Verteilung in den Daten verfälschen und die Lösung somit beeinflussen können (z.B. verminderte Genauigkeit aufgrund vermehrter falsch-positiver Angaben).
  • Eine weitere Herausforderung in Bezug auf ein genaues Vorhersagen einer nicht linearen Leistungsverschlechterung besteht darin, dass eine nicht lineare Leistungsverschlechterung wie beispielsweise eine abnutzungsbedingte Leistungsverschlechterung nicht notwendigerweise ein schwerwiegender Fehler ist. Unter erneuter Bezugnahme auf das Beispiel einer PCP wird eine abgenutzte PCP nicht notwendigerweise aufhören zu arbeiten, obwohl sie aufgrund der Abnutzung an den Rotorschaufeln suboptimal arbeiten wird. Dadurch unterliegt das „Ausfalldatum“ der Entscheidung des Bedieners, die Pumpe bei einem bestimmten Grad von Leistungsverschlechterung auszutauschen (im Gegensatz zu einem Datum eines schwerwiegenden Ausfalls). Dadurch wird die Datenmarkierung wiederum kompliziert (z.B. Entscheiden, wann Daten von einer PCP als fehlerhaft markiert werden sollen, wenn die PCP in Wirklichkeit weiterhin mit minderwertiger Leistung funktioniert).
  • Noch eine weitere Herausforderung, die einem Vorhersagen einer nicht linearen Leistungsverschlechterung in realen Anwendungen zugehörig ist, betrifft ein entsprechendes Identifizieren einer Ausfallsignatur. Dabei handelt es sich um eine zweifache Herausforderung. Zuerst müssen die verfügbaren Daten ausgewertet werden, um Ausfallsignaturen zu identifizieren. Dazu kann ein Ableiten von Informationen aus Daten gehören, die nicht notwendigerweise direkt mit der nicht linearen Leistungsverschlechterung in Beziehung stehen. Zum Beispiel sind Anlagen selten anfällig für eine abnutzungsbedingte Leistungsverschlechterung, die explizit instrumentiert ist, um Abnutzung direkt zu messen. Unter erneuter Bezugnahme auf das Beispiel der PCPs können Interaktionen zwischen Drehzahl, Produktionsleistung, Drehmoment und Gehäusedruck die einzig verfügbaren Informationen sein, aus denen eine Ausfallsignatur abgeleitet werden kann. Zweitens muss die Exklusivität der identifizierten Ausfallsignatur ausgewertet werden. Mit anderen Worten, die identifizierte Ausfallsignatur kann mit zwei oder mehreren Phänomenen korreliert sein, wodurch sich vermehrt falsche Positive ergeben. In Anbetracht der vorstehenden Ausführungen ist ersichtlich, dass eine nicht lineare Leistungsverschlechterung die weitere Herausforderung darstellt, (i) eine Ausfallsignatur aus verfügbaren Daten für eine nicht lineare Leistungsverschlechterung zu identifizieren, und (ii) zu bestimmen, ob die identifizierte Ausfallsignatur exklusiv (oder überwiegend) repräsentativ für die nicht lineare Leistungsverschlechterung ist.
  • Die Kombination der vorgenannten Probleme erschwert ein Lösen des Problems einer Vorhersagemodellierung einer nicht linearen Leistungsverschlechterung. Dementsprechend besteht ein Bedarf an Techniken, die eine Leistungsverschlechterung aufgrund nicht linearer Phänomene akkurat vorhersagen.
  • KURZDARSTELLUNG DER ERFINDUNG
  • Aspekte der vorliegenden Offenbarung betreffen ein durch einen Computer umgesetztes Verfahren, das ein Eingeben eines neuen Datenbeispiels in ein Ausfallvorhersagemodell aufweist. Das Ausfallvorhersagemodell wird durch Verwenden eines markierten historischen Datensatzes geschult. Jeweilige Datenpunkte sind einem Rückblickfenster und einem Vorhersagehorizont zugehörig, um jeweilige Schulungsbeispiele zu erstellen. Die jeweiligen Schulungsbeispiele sind zu Clustern in einer Mehrzahl von Clustern zusammengefasst, und die Mehrzahl von Clustern ist jeweils einer Normalitätsbewertung und einer Anomaliebewertung zugehörig. Das Verfahren weist ferner ein Ausgeben einer Klassifizierung, die dem neuen Datenbeispiel zugehörig ist, auf Grundlage eines Vergleichens einer ersten Anomaliebewertung eines ersten Clusters von der Mehrzahl von Clustern, der das neue Datenbeispiel umfasst, mit einer durchschnittlichen Anomaliebewertung von Clustern in der Mehrzahl von Clustern auf, deren Normalitätsbewertung größer als die Anomaliebewertung ist.
  • Vorteilhafterweise kann die vorliegende Erfindung bevorzugt eine nicht lineare Leistungsverschlechterung aus einem unausgewogenen Schulungsdatensatz genau vorhersagen. Ferner können die Normalitätsbewertung und die Anomaliebewertung bevorzugt vorteilhaft den Grad einer Abnormalität quantifizieren, die der Klassifizierung zugehörig ist. Ein weiterer Vorteil der vorliegenden Erfindung besteht darin, dass sie sich bevorzugt weder auf ANNs verlässt (die für eine Überparametrisierung von unausgewogenen Schulungsdaten anfällig sind), noch dass sie sich auf Überabtastungs- oder Unterabtastungs-Techniken der unausgewogenen Schulungsdaten verlässt (die für ein Beeinflussen von Klassifizierungen anfällig sind).
  • Gemäß einer bevorzugten Ausführungsform umfasst die vorliegende Offenbarung ferner, wonach das Rückblickfenster eine Menge von aufeinanderfolgenden vorherigen Datenpunkten definiert, die in jedes jeweilige Schulungsbeispiel aufzunehmen sind. Vorteilhafterweise kann das Rückblickfenster die Größe von Merkmalssignaturen abmildern, die für normale Operationen oder abnormale Operationen indikativ sind. Zum Beispiel kann ein kürzeres Rückblickfenster für einzelne Datenpunkte empfindlicher sein, wogegen ein längeres Rückblickfenster gegenüber einzelnen Datenpunkten weniger empfindlich sein kann.
  • Gemäß einer bevorzugten Ausführungsform umfasst das Verfahren ferner, wonach der Vorhersagehorizont einen vordefinierten Zeitraum in der Zukunft definiert, und wonach jeweilige Markierungen von jeweiligen Datenpunkten in dem vordefinierten Zeitraum in der Zukunft den jeweiligen Schulungsbeispielen zugehörig sind. Vorteilhafterweise kann der Vorhersagehorizont verschiedene Merkmalssignaturen, die durch das Rückblickfenster definiert werden, mit einem entsprechenden zukünftigen Resultat verknüpfen. Zum Beispiel kann ein kürzerer Vorhersagehorizont eine kürzere Warnung für eine bestimmte Vorhersage ausgeben (z.B. einen Tag vor einem abnutzungsbedingten Ausfall), wogegen ein längerer Vorhersagehorizont eine längere Warnung für eine bestimmte Vorhersage ausgeben kann (z.B. einen Monat bis zu einem abnutzungsbedingten Ausfall).
  • Gemäß einer bevorzugten Ausführungsform umfasst das Verfahren ferner, wonach die jeweiligen Schulungsbeispiele durch Verwenden von K-Means-Clustering zu Clustern zusammengefasst werden. Vorteilhafterweise ist K-Means-Clustering eine effiziente und skalierbare Clustering-Technik.
  • Gemäß einem Aspekt wird ein System bereitgestellt, das aufweist: einen oder mehrere Prozessoren; und ein oder mehrere durch einen Computer lesbare Speichermedien, die Programmanweisungen speichern, die bei Ausführung durch den einen oder die mehreren Prozessoren so konfiguriert sind, dass der eine oder die mehreren Prozessoren veranlasst wird bzw. werden, ein Verfahren durchzuführen, das aufweist: Eingeben eines neuen Datenbeispiels in ein Ausfallvorhersagemodell, wobei das Ausfallvorhersagemodell durch Verwenden eines markierten historischen Datensatzes geschult wird, wobei jeweilige Datenpunkte einem Rückblickfenster und einem Vorhersagehorizont zugehörig sind, um jeweilige Schulungsbeispiele zu erstellen, wobei die jeweiligen Schulungsbeispiele zu Clustern in einer Mehrzahl von Clustern zusammengefasst werden, und wobei die Mehrzahl von Clustern jeweils einer Normalitätsbewertung und einer Anomaliebewertung zugehörig ist; und Ausgeben einer Klassifizierung, die dem neuen Datenbeispiel zugehörig ist, auf Grundlage eines Vergleichens einer ersten Anomaliebewertung eines ersten Clusters von der Mehrzahl von Clustern, der das neue Datenbeispiel umfasst, mit einer durchschnittlichen Anomaliebewertung von Clustern in der Mehrzahl von Clustern, deren Normalitätsbewertung größer als die Anomaliebewertung ist.
  • Gemäß einem Aspekt wird ein Computerprogrammprodukt bereitgestellt, das ein oder mehrere durch einen Computer lesbare Speichermedien und Programmanweisungen aufweist, die gemeinsam auf dem einen oder den mehreren durch einen Computer lesbaren Speichermedien gespeichert sind, wobei die Programmanweisungen Anweisungen aufweisen, die so konfiguriert sind, dass ein oder mehrere Prozessoren veranlasst wird bzw. werden, ein Verfahren durchzuführen, das aufweist: Eingeben eines neuen Datenbeispiels in ein Ausfallvorhersagemodell, wobei das Ausfallvorhersagemodell durch Verwenden eines markierten historischen Datensatzes geschult wird, wobei jeweilige Datenpunkte einem Rückblickfenster und einem Vorhersagehorizont zugehörig sind, um jeweilige Schulungsbeispiele zu erstellen, wobei die jeweiligen Schulungsbeispiele zu Clustern in einer Mehrzahl von Clustern zusammengefasst werden, und wobei die Mehrzahl von Clustern jeweils einer Normalitätsbewertung und einer Anomaliebewertung zugehörig ist; und Ausgeben einer Klassifizierung, die dem neuen Datenbeispiel zugehörig ist, auf Grundlage eines Vergleichens einer ersten Anomaliebewertung eines ersten Clusters von der Mehrzahl von Clustern, der das neue Datenbeispiel umfasst, mit einer durchschnittlichen Anomaliebewertung von Clustern in der Mehrzahl von Clustern, deren Normalitätsbewertung größer als die Anomaliebewertung ist.
  • Weitere Aspekte der vorliegenden Offenbarung betreffen ein durch einen Computer umgesetztes Verfahren zum Vorhersagen einer abnutzungsbedingten Schädigung von Exzenterschneckenpumpen (PCPs), wobei das Verfahren ein Eingeben eines neuen Datenbeispiels einer PCP in ein Modell aufweist, das konfiguriert ist, um eine abnutzungsbedingte Schädigung der PCP vorherzusagen. Das Modell wird durch Verwenden eines markierten historischen PCP-Datensatzes geschult. Jeweilige Datenpunkte sind einem Rückblickfenster und einem Vorhersagehorizont zugehörig, um jeweilige Schulungsbeispiele zu erstellen. Die jeweiligen Schulungsbeispiele sind in einer Mehrzahl von Clustern zusammengefasst, und die Mehrzahl von Clustern ist jeweils einer Normalitätsbewertung und einer Anomaliebewertung zugehörig. Das Verfahren weist ferner ein Ausgeben einer Klassifizierung, die dem neuen Datenbeispiel zugehörig ist, auf Grundlage eines Vergleichens einer ersten Anomaliebewertung eines ersten Clusters von der Mehrzahl von Clustern, der das neue Datenbeispiel umfasst, mit einer durchschnittlichen Anomaliebewertung von Clustern in der Mehrzahl von Clustern auf, deren Normalitätsbewertung größer als die Anomaliebewertung ist, und in der die Klassifizierung für die abnutzungsbedingte Schädigung der PCP indikativ ist.
  • Vorteilhafterweise kann der vorgenannte Aspekt der vorliegenden Offenbarung bevorzugt die nicht lineare Leistungsverschlechterung einer abnutzungsbedingten Schädigung in PCPs aus einem unausgewogenen Schulungsdatensatz von PCP-bezogenen Daten genau vorhersagen. Ferner können die Normalitätsbewertung und die Anomaliebewertung vorteilhafterweise bevorzugt den Grad einer Abnormalität quantifizieren, die der Klassifizierung zugehörig ist.
  • Weitere Aspekte der vorliegenden Offenbarung betreffen ein durch einen Computer umgesetztes Verfahren zum Vorhersagen einer abnutzungsbedingten Schädigung von Exzenterschneckenpumpen (PCPs), wobei das Verfahren ein Generieren von markierten historischen Daten durch Durchführen einer binären Markierung von historischen Daten aufweist, die einer oder mehreren PCPs zugehörig sind. Das Verfahren weist ferner ein Generieren einer Mehrzahl von Schulungsdatenbeispielen durch Anwenden eines Rückblickfensters und eines Vorhersagehorizonts auf jeweilige Datenpunkte der markierten historischen Daten auf. Das Verfahren weist ferner ein Zusammenfassen der Mehrzahl von Schulungsdatenbeispielen in Clustern in eine Mehrzahl von Clustern auf. Das Verfahren weist ferner ein Berechnen von Cluster-Bewertungen für jeweilige Cluster der Mehrzahl von Clustern auf. Das Verfahren weist ferner ein Zuweisen eines neuen Datenbeispiels einer PCP zu einem ersten Cluster von der Mehrzahl von Clustern auf. Das Verfahren weist ferner ein Zuweisen einer Klassifizierung zu dem neuen Datenbeispiel auf Grundlage von Cluster-Bewertungen auf, die dem ersten Cluster zugehörig sind, wobei die Klassifizierung für eine Wahrscheinlichkeit einer zukünftigen abnutzungsbedingten Schädigung der PCP indikativ ist.
  • Vorteilhafterweise kann die vorliegende Offenbarung bevorzugt die nicht lineare Leistungsverschlechterung einer abnutzungsbedingten Schädigung in PCPs aus einem unausgewogenen Schulungsdatensatz von PCP-bezogenen Daten genau vorhersagen. Ferner können die Cluster-Bewertungen vorteilhafterweise bevorzugt den Grad einer Abnormalität quantifizieren, die der Klassifizierung zugehörig ist.
  • Gemäß einer bevorzugten Ausführungsform weist das Verfahren ferner auf, wonach die markierten historischen Daten als fehlerhaft für einen vorgegebenen Zeitraum markiert werden, der vor einem bekannten Pumpenaustauschdatum liegt. Vorteilhafterweise stellt diese Ausführungsform der vorliegenden Offenbarung eine klare Entscheidungsgrenze zwischen „normalen“ und „fehlerhaften“ Daten bereit, wogegen eine derartige deterministische Entscheidungsgrenze andernfalls aufgrund der nicht linearen und graduellen Natur von abnutzungsbedingten Schädigungen nicht notwendigerweise vorhanden ist.
  • Gemäß einer bevorzugten Ausführungsform umfasst das Verfahren ferner, wonach die markierten historischen Daten Pumpendrehzahldaten, Pumpendrehmomentdaten, Gehäusedruckdaten, Produktionsleistungsdaten und Wartungsprotokolle in Bezug auf die PCP aufweisen. Vorteilhafterweise stehen genau diese Daten für die PCPs zur Verfügung. Mit anderen Worten, durch Verwenden dieser Daten zum Vorhersagen von abnutzungsbedingten Verschlechterungen der PCP-Leistung wird keine zusätzliche Dateninstrumentierung benötigt.
  • Gemäß einer bevorzugten Ausführungsform umfasst das Verfahren ferner, wonach ein Berechnen der Cluster-Bewertungen für die jeweiligen Cluster ferner ein Berechnen einer Normalitätsbewertung für das erste Cluster aufweist, wobei die Normalitätsbewertung ein erster Teil von Schulungsdatenbeispielen, die einem Normalzustand in dem ersten Cluster zugehörig sind, geteilt durch einen zweiten Teil von Schulungsdatenbeispielen ist, die dem Normalzustand in der Mehrzahl von Schulungsdatenbeispielen zugehörig sind. Das Berechnen der Cluster-Bewertungen weist ferner ein Berechnen einer Anomaliebewertung für das erste Cluster auf, wobei die Anomaliebewertung ein dritter Teil von Schulungsdatenbeispielen, die einem verschlechterten Zustand in dem ersten Cluster zugehörig sind, geteilt durch einen vierten Teil von Schulungsdatenbeispielen ist, die dem verschlechterten Zustand in der Mehrzahl von Schulungsdatenbeispielen zugehörig sind. Vorteilhafterweise quantifiziert ein Berechnen von Normalitätsbewertungen und Anomaliebewertungen den Abnormalitätsgrad von vorhergesagten Klassifizierungen, was den Klassifizierungen zusätzliche Genauigkeit und Kontext verleiht.
  • Gemäß einer bevorzugten Ausführungsform umfasst das Verfahren ferner ein Generieren eines Ausfallsignals für das neue Datenbeispiel, wobei das Ausfallsignal eine durchschnittliche Anomaliebewertung für das neue Datenbeispiel über eine vorbestimmte Anzahl von vorherigen Datenpunkten aufweist. Vorteilhafterweise stellt das Ausfallsignal eine nachverarbeitete Glättung von Anomaliebewertungen für ein bestimmtes Datenbeispiel dar, wodurch falsche Positive und/oder Rauschen in aufeinander folgenden Anomaliebewertungen für einen Strom von Daten reduziert werden.
  • Weitere Aspekte der vorliegenden Offenbarung sind auf Systeme und Computerprogrammprodukte ausgerichtet, die konfiguriert sind, um die oben beschriebenen Verfahren auszuführen. Die vorliegende Kurzdarstellung ist nicht dazu gedacht, jeden Aspekt jeder Umsetzung und/oder jeder Ausführungsform der vorliegenden Offenbarung zu veranschaulichen.
  • Figurenliste
  • Nachstehend werden bevorzugte Ausführungsformen der vorliegenden Erfindung allein zu Beispielzwecken und unter Bezugnahme auf die folgenden Zeichnungen beschrieben:
    • 1 veranschaulicht ein Blockschaubild einer beispielhaften Rechenumgebung gemäß einigen Ausführungsformen der vorliegenden Offenbarung.
    • 2 veranschaulicht ein Blockschaubild eines beispielhaften Ausfallvorhersagemodells gemäß einigen Ausführungsformen der vorliegenden Offenbarung.
    • 3 veranschaulicht einen Ablaufplan eines beispielhaften Verfahrens zum Vorhersagen einer Leistungsverschlechterung mit nicht linearen Merkmalen gemäß einigen Ausführungsformen der vorliegenden Offenbarung.
    • 4 veranschaulicht einen Ablaufplan eines beispielhaften Verfahrens zum Schulen eines Ausfallvorhersagemodells gemäß einigen Ausführungsformen der vorliegenden Offenbarung.
    • 5A veranschaulicht einen Ablaufplan eines beispielhaften Verfahrens zum Generieren von Ergebnissen auf Grundlage einer Ausgabe von einem Ausfallvorhersagemodell gemäß einigen Ausführungsformen der vorliegenden Offenbarung.
    • 5B veranschaulicht einen Ablaufplan eines beispielhaften Verfahrens zum Berechnen eines Ausfallsignals gemäß einigen Ausführungsformen der vorliegenden Offenbarung.
    • 6A veranschaulicht Versuchsergebnisse einer Darstellung einer kumulativen Anomaliebewertung in Abhängigkeit von Tagen bis zum Ausfall gemäß einigen Ausführungsformen der vorliegenden Offenbarung.
    • 6B veranschaulicht Versuchsergebnisse einer Darstellung einer Intensität einer Ausfallmarkierung in Abhängigkeit von Tagen bis zum Ausfall gemäß einigen Ausführungsformen der vorliegenden Offenbarung.
    • 7 veranschaulicht Versuchsergebnisse von Konfusionsmatrizen für verschiedene Perioden vor dem Ausfall gemäß einigen Ausführungsformen der vorliegenden Offenbarung.
    • 8 veranschaulicht ein Blockschaubild eines beispielhaften Computers gemäß einigen Ausführungsformen der vorliegenden Offenbarung.
    • 9 stellt eine Cloud-Computing-Umgebung gemäß einigen Ausführungsformen der vorliegenden Offenbarung dar.
    • 10 stellt Abstraktionsmodellschichten gemäß einigen Ausführungsformen der vorliegenden Offenbarung dar.
  • Obwohl sich die vorliegende Offenbarung für verschiedene Modifizierungen und alternative Formen eignet, werden Besonderheiten davon als Beispiel in den Zeichnungen ausgewiesen und werden ausführlich beschrieben. Es sollte jedoch klar sein, dass die vorliegende Offenbarung keinesfalls auf die beschriebenen speziellen Ausführungsformen eingeschränkt werden soll. Die Erfindung soll im Gegenteil alle Modifizierungen, Entsprechungen und Alternativen abdecken, die unter den Erfindungsgedanken und Schutzumfang der vorliegenden Offenbarung fallen.
  • AUSFÜHRLICHE BESCHREIBUNG
  • Ausführungsformen der vorliegenden Offenbarung betreffen Vorhersagemodellierung und insbesondere die Vorhersage von Leistungsverschlechterung mit nicht linearen Merkmalen. Obwohl nicht auf derartige Anwendungen beschränkt, sind Ausführungsformen der vorliegenden Offenbarung im Zusammenhang mit dem vorgenannten Kontext besser verständlich.
  • Ausführungsformen der vorliegenden Offenbarung betreffen Techniken zum Erkennen einer Verschlechterung von Anlagen-Leistung während der frühen Stadien eines nicht linearen Ausfallmechanismus (z.B. Abnutzung, Ermüdung, Kriechdehnung usw.), um einen bevorstehenden Ausfall der Anlage vorherzusagen und vorbeugende Wartungsmaßnahmen für die Anlage vor deren Ausfall zu empfehlen. Ausführungsformen der vorliegenden Offenbarung nutzen ein halbüberwachtes Maschinenlernverfahren, das als Eingabe historische Daten der Anlage aufnimmt und als Ausgabe eine Anomaliebewertung, eine Klassifizierung und/oder ein Ausfallsignal generiert, das für eine Wahrscheinlichkeit eines zukünftigen Ausfalls oder einer zukünftigen Leistungsverschlechterung der Anlage indikativ ist.
  • Zum Bewältigen der vorher erörterten Herausforderungen bei der Vorhersagemodellierung von nicht linearen Phänomenen verwirklichen Ausführungsformen der vorliegenden Offenbarung Merkmale wie zum Beispiel, aber nicht darauf beschränkt: (i) eine nicht lineare Entscheidungsgrenze, die zwischen normalen und fehlerhaften Daten unterscheidet; (ii) eine rechnerisch unkomplizierte Umsetzung (z.B. ist sie trotz einer NichtLinearität nicht überparametrisiert, wie dies bei ANNs der Fall sein kann); (iii) keine Klassenausgewogenheit (und daher keine Verfälschung der ursprünglichen Verteilung in den Daten und anschließende Beeinflussung der Lösung); und/oder (iv) eine globale Lösung, die problemlos auf jede Familie von ähnlichen Anlagen angewendet werden kann.
  • Unter folgender Bezugnahme auf die Figuren veranschaulicht 1 eine beispielhafte Rechenumgebung 100 gemäß einigen Ausführungsformen der vorliegenden Offenbarung. Die Rechenumgebung 100 umfasst ein Ausfallvorhersagesystem 102, das in Datenaustausch mit einem Sensordaten-Aufzeichnungssystem 104 und einer Endpunktanwendung 106 über ein Netzwerk 108 verbunden ist. Das Ausfallvorhersagesystem 102 kann konfiguriert werden, um Daten von dem Sensordaten-Aufzeichnungssystem 104 zu empfangen und eine Vorhersage in Bezug auf eine zukünftige Leistungsbeeinträchtigung einer zugehörigen Anlage 110 aufgrund eines nicht linearen Phänomens zu treffen (z.B. eine Vorhersage einer abnutzungsbedingten Leistungsverschlechterung einer PCP in einem zukünftigen Zeitintervall). Das Ausfallvorhersagesystem 102 kann ferner konfiguriert werden, um mit der Endpunktanwendung 106 zusammenzuwirken. Zum Beispiel kann das Ausfallvorhersagesystem 102 eine Anforderung von der Endpunktanwendung 106 empfangen, um jede Angabe eines Ausfalls von dem Sensordaten-Aufzeichnungssystem 104 zu erkennen. Als weiteres Beispiel kann das Ausfallvorhersagesystem 102 Aktualisierungen für die Endpunktanwendung 106 in Bezug auf potenzielle Ausfallsignaturen durchsetzen, die aus dem Sensordaten-Aufzeichnungssystem 104 identifiziert wurden.
  • Das Sensordaten-Aufzeichnungssystem 104 kann ein oder mehrere Datenerfassungssysteme aufweisen, die so konfiguriert sind, dass sie Daten aufnehmen, die direkt oder indirekte in Zusammenhang mit der Funktionalität einer Anlage 110 stehen. In Fällen, in denen die Anlage 110 zum Beispiel eine PCP in einem Ölbohrproduktionssystem ist, kann das Sensordaten-Aufzeichnungssystem 104 derartige Daten wie zum Beispiel Drehzahl, Drehmoment, Gehäusedruck und/oder Produktionsleistung sammeln, es ist aber nicht auf diese beschränkt. In Fällen, in denen die Anlage 110 zum Beispiel eine mechanische Komponente (z.B. Kraftstoffpumpe, Radlager, Zylinderkopfdichtung usw.) eines Fahrzeugs ist, kann das Sensordaten-Aufzeichnungssystem 104 derartige Daten sammeln, wie beispielsweise Kilometerleistung, Geschwindigkeit, Motorfehlercodes und dergleichen). Wie aus diesen beiden nicht einschränkenden Beispielen ersichtlich ist, muss das Sensordaten-Aufzeichnungssystem 104 nicht notwendigerweise Daten sammeln, die der Anlage 110 direkt zugehörig sind. In einigen Ausführungsformen kann das Sensordaten-Aufzeichnungssystem 104 im Gegenteil Daten sammeln, die anderen Komponenten zugehörig sind, die der Anlage 110 zugehörig sind, wobei die gesammelten Daten aber trotzdem für ein Bereitstellen von indirekten Ableitungen in Bezug auf die Funktionalität der Anlage 110 nützlich sein können. Dies kann insofern nützlich sein, als ein Instrumentieren von spezifischen Komponenten eines Systems zum Sammeln von Daten zum Vorhersagen einer nicht linearen Leistungsverschlechterung entweder wirtschaftlich nicht machbar und/oder technisch undurchführbar sein kann. Somit umfasst eine Vorhersage einer nichtlinearen Leistungsverschlechterung in vielen realen Anwendungen die Herausforderungen, (i) eine Ausfallsignatur aus verfügbaren Daten für eine nicht lineare Leistungsverschlechterung zu identifizieren, und (ii) zu bestimmen, ob die identifizierte Ausfallsignatur exklusiv (oder überwiegend) repräsentativ für die nicht lineare Leistungsverschlechterung ist.
  • Die Endpunktanwendung 106 kann eine Anwendung sein, die auf einer Benutzer-Workstation ausgeführt wird, wie zum Beispiel einer Desktop-, Laptop-, Tablet-, Smartphone- oder anderen Endpunkteinheit. Die Endpunktanwendung 106 kann eine Schnittstelle für einen Benutzer für ein Zusammenwirken mit dem Ausfallvorhersagesystem 102 bereitstellen. Zum Beispiel kann ein Benutzer eine Vorhersage-Ausfallanalyse für eine Anlage 110 auf Grundlage von Daten aus dem Sensordaten-Aufzeichnungssystem 104 anfordern. Als weiteres Beispiel kann das Ausfallvorhersagesystem 102 Aktualisierungen, Benachrichtigungen oder Warnungen an die Endpunktanwendung 106 auf Grundlage einer Ausfallsignatur durchsetzen, die der Anlage 110 zugehörig ist und aus Daten von dem Sensordaten-Aufzeichnungssystem 104 erkannt wird. Ferner stellt die Endpunktanwendung 106 in einigen Ausführungsformen einen Mechanismus bereit, mit dem ein Benutzer ein bereits geschultes Ausfallvorhersagesystem 102 konfigurieren kann, Streaming-Daten zu empfangen, wobei die Streaming-Daten für eine ähnliche Anlage wie die Anlage 110 sein können, die zum Schulen des Ausfallvorhersagesystems 102 verwendet wurde (z.B. kann ein Betreiber von Ölquellen seine eigenen PCP-Daten zu dem Ausfallvorhersagesystem 102 streamen, das vorher mit ähnlichen PCP-Daten von einer oder mehreren anderen PCPs geschult worden ist.
  • Das Ausfallvorhersagesystem 102 kann in einigen Ausführungsformen virtuell in einer Cloud-Computing-Architektur bereitgestellt werden. In einigen Ausführungsformen kann sich das Ausfallvorhersagesystem 102 in einem Computer befinden, wie zum Beispiel einem Mainframe, einem Rechenknoten, einem Desktop, einem Laptop, einem Tablet oder einem anderen System, das einen oder mehrere Prozessoren und ein oder mehrere durch einen Computer lesbare Speichermedien umfasst.
  • Das Ausfallvorhersagesystem 102 kann ein Data Warehouse 112, einen Modell-Container 114 und eine Datenverarbeitungs-Engine 116 umfassen. Das Data Warehouse 112 kann aggregierte Sensordaten 118 umfassen, die Daten sein können, die aus dem Sensordaten-Aufzeichnungssystem 104 gesammelt werden, und kann ein oder mehrere Datenbeispiele aufweisen.
  • Der Modell-Container 114 kann Datenvorbereitungs-/-konstruktions-Dienstprogramme 126 umfassen, die auf den aggregierten Sensordaten 118 ausgeführt werden können, um zumindest teilweise die formatierten Sensordaten 120 zu generieren. Zum Beispiel können Datenvorbereitungs-/-konstruktions-Dienstprogramme 126 konfigurierte werden, um Ausreißer zu entfernen, Datenformatierungsprobleme zu korrigieren, Nullwerte aufzulösen und dergleichen, wenn die aggregierten Sensordaten 118 in formatierte Sensordaten 120 umgewandelt werden. In einigen Ausführungsformen können die formatierten Sensordaten 120 zum Beispiel ein Rückblickfenster umfassen, das auf die aggregierten Sensordaten 118 angewendet wird.
  • Die formatierten Sensordaten 120 können in das Ausfallvorhersagemodell 124 eingegeben werden. In einigen Ausführungsformen werden die formatierten Sensordaten 120 und das Ausfallvorhersagemodell 124 in Bereitstellungsressourcen 130 der Datenverarbeitungs-Engine 116 geladen. Nach einer Ausführung des Ausfallvorhersagemodells 124 durch Verwenden der formatierten Sensordaten 120 als Eingabe, kann die Datenverarbeitungs-Engine 116 Ergebnisse 122 generieren und die Ergebnisse 122 in dem Data Warehouse 112 speichern. Die Ergebnisse 122 können zum Beispiel eine Anomaliebewertung, eine Klassifizierung und/oder ein Ausfallsignal umfassen. Die Ergebnisse können für eine Wahrscheinlichkeit einer zukünftigen verschlechterten Leistung aufgrund einer nicht linearen Leistungsverschlechterung indikativ sein (z.B. eine Wahrscheinlichkeit einer abnutzungsbedingten Leistungsverschlechterung in einer PCP).
  • Die Datenverarbeitungs-Engine 116 kann ferner einen Vorhersagedienst 128 umfassen, wobei der Vorhersagedienst 128 konfiguriert werden kann, um Anforderungen von der Endpunktanwendung 106 zu empfangen oder Benachrichtigungen zu dieser durchzusetzen. Der Vorhersagedienst 128 kann das Funktionieren des Ausfallvorhersagesystems 102 organisieren. Zum Beispiel kann der Vorhersagedienst 128 in einigen Ausführungsformen die Datenvorbereitungs-/-konstruktions-Dienstprogramme 126 veranlassen, durch Verwenden der Bereitstellungsressourcen 130 zum Zweck einer Generierung der formatierten Sensordaten 120 auf den aggregierten Sensordaten 118 ausgeführt zu werden. Unter Fortsetzung des vorgenannten Beispiels kann der Vorhersagedienst 128 ferner konfiguriert werden, das Ausfallvorhersagemodell 124 auf den Bereitstellungsressourcen 130 zu nutzen und die formatierten Sensordaten 120 als Eingabe zu verwenden, um die Ergebnisse 122 zu generieren. Der Vorhersagedienst 128 kann ferner konfiguriert werden, um die Ergebnisse 122 an die Endpunktanwendung 106 zu übertragen.
  • Unter folgender Bezugnahme auf 2 wird ein Blockschaubild eines beispielhaften Computers 124 gemäß einigen Ausführungsformen der vorliegenden Offenbarung veranschaulicht. Das Ausfallvorhersagemodell 124 kann zum Beispiel einen Schulungsmodus 200 und einen Bereitstellungsmodus 228 umfassen. In dem Schulungsmodus 200 wird das Ausfallvorhersagemodell 124 geschult, um eine nicht lineare Leistungsverschlechterung wie zum Beispiel Ausfälle oder Verschlechterungen aufgrund von Abnutzung genau vorherzusagen. In dem Bereitstellungsmodus 228 ist das Ausfallvorhersagemodell 124 konfiguriert, um Eingabedaten zu empfangen, die eingegebenen Daten zu formatieren und eine Vorhersage in Bezug auf das nicht lineare Phänomen zu treffen, das den Daten zugehörig ist (z.B. wie eine Vorhersage einer zukünftigen suboptimalen Leistung aufgrund von Abnutzung in einer PCP).
  • In dem Schulungsmodus 200 kann das Ausfallvorhersagemodell 124 historische Daten 202 von einem oder mehreren Sensordaten-Aufzeichnungssystemen 104 empfangen, das bzw. die der einen oder den mehreren Anlagen 110 zugehörig ist bzw. sind, wobei die historischen Daten 202 in eine Schulungsuntergruppe 204-1 und eine Testuntergruppe 204-2 segmentiert sind. Die Schulungsuntergruppe 204-1 kann konfiguriert werden, um das Ausfallvorhersagemodell 124 zu schulen und zu validieren, und die Testuntergruppe 204-2 kann verwendet werden, um das Ausfallvorhersagemodell 124 zu testen, wobei das Testen verwendet werden kann, um Merkmale des Ausfallvorhersagemodells 124 zu quantifizieren, wie zum Beispiel Genauigkeit, Präzision, Abruf usw.
  • Der Schulungsmodus 200 kann ferner markierte historische Daten 206 umfassen, wobei die markierten historischen Daten 206 von zeitabgleichenden historischen Ausfalldatensätzen (z.B. Wartungsprotokolle, die PCP-Ersetzungen angeben) mit Sensor-Ablesewerten abgeleitet werden können (z.B. Drehzahl, Drehmoment, Produktionsleistung, Gehäusedruck usw.). Die markierten historischen Daten 206 umfassen Daten, die für einen normalen Zustand 208-1 indikativ sind, der einen normalen Betrieb der Anlage 110 angibt, und Daten, die für einen verschlechterten Zustand 208-2 indikativ sind, der eine suboptimale, verschlechterte oder fehlerhafte Leistung der Anlage 110 angibt (z.B. einen abgenutzten Zustand einer PCP). Die Entscheidungsgrenze zwischen Daten, die einen normalen Zustand 208-1 angeben, und Daten, die einen verschlechterten Zustand 208-2 angeben, kann subjektiv von einem Fachexperten (SMW), objektiv durch eine statistische Messung (z.B. außerhalb einer Standardabweichung eines Mittelwertes während eines normalen Betriebs) festgestellt werden, von Maschinenlernen abgeleitet oder durch Verwenden von anderen Strategien oder Techniken bestimmt werden. Wie vorher erörtert, müssen die Daten, die einen verschlechterten Zustand 208-2 angeben, nicht notwendigerweise Daten sein, die der nicht funktionierenden Anlage 110 zugehörig sind. Die Daten, die einen verschlechterten Zustand 208-2 angeben, geben vielmehr eine suboptimale Leistung der Anlage 110 an, selbst wenn die Anlage 110 weiterhin funktionsfähig bleibt. Wenn zum Beispiel in einigen Ausführungsformen bei einer Anlage 110 ein expliziter Ausfall vorliegt oder diese am Tag x anderweitig ersetzt wird, können Daten aus einem vorbestimmten Zeitraum vor dem Tag x automatisch als Daten markiert werden, die für einen verschlechterten Zustand 208-2 indikativ sind.
  • Der Schulungsmodus 200 kann ferner gefensterte historische Daten 210 umfassen. Die gefensterten historischen Daten 210 können ein Rückblickfenster 212 und einen Vorhersagehorizont 214 umfassen. Das Rückblickfenster 212 kann auf eine Reihe von Datenpunkten (z.B. Dx) vor dem aktuellen Datenpunkt verweisen, der in jedes Datenbeispiel aufgenommen werden soll. Der Vorhersagehorizont 214 kann auf eine Markierung eines Datenpunkts einer Anzahl von Datenpunkten in der Zukunft (z.B. Dy) ab dem aktuellen Datenpunkt verweisen. Das Rückblickfenster 212 und der Vorhersagehorizont 214 können verwendet werden, um jeweilige Datenpunkte in der Schulungsuntergruppe 204-1 in jeweilige Datenbeispiele, die einem normalen Zustand 216-1 zugehörig sind, und jeweilige Datenbeispiele umzuwandeln, die einem verschlechterten Zustand 216-2 zugehörig sind (die insgesamt als Datenbeispiele 216 bezeichnet werden). Mit anderen Worten, das Ausfallvorhersagemodell 124 wird geschult, um eine Leistungschronik einer Anlage 110 (entsprechend dem Rückblickfenster 212) zu verwenden, um Rückschlüsse auf den möglichen zukünftigen Zustand der Anlage 110 in Bezug auf einen Verschlechterungsgrad der Leistung zu ziehen. Jeweilige Datenbeispiele 216 können einen Vektor, eine Matrix oder einen Tensor von Datenpunkten aufweisen, die für jeden Datenstrom einem aktuellen Datenpunkt und mehreren vorherigen Datenpunkten entsprechen (auf Grundlage des Rückblickfensters 212), und die jeweiligen Datenbeispiele 216 können ferner einer Markierung eines Datenpunkts in der Zukunft durch den Vorhersagehorizont zugehörig sein (wobei die Markierung des Datenpunkts in der Zukunft einer vorbestimmten Position in dem Vektor, der Matrix oder dem Tensor hinzugefügt oder anderweitig mit dem Vektor, der Matrix oder dem Tensor verbunden werden kann). Mit anderen Worten, Datenbeispiele, die einem normalen Zustand 216-1 zugehörig sind, können durch einen Datenpunkt auf dem Vorhersagehorizont 214 identifiziert werden, bei dem es sich um Daten handelt, die für einen normalen Zustand 208-1 indikativ sind. Desgleichen können Datenbeispiele, die einem verschlechterten Zustand 216-2 zugehörig sind, diejenigen Datenbeispiele mit einem Datenpunkt auf dem Vorhersagehorizont 214 sein, bei dem es sich um Daten handelt, die für einen verschlechterten Zustand 208-2 indikativ sind.
  • Zum Beispiel kann das Rückblickfenster 212 zehn Tage betragen, und der Vorhersagehorizont 214 kann zwanzig Tage betragen. In diesem Szenario kann der Datenpunkt für einen Datenpunkt an einem ersten Zeitpunkt von einem einzelnen Strom von Daten in der Schulungsuntergruppe 204-1 in einen Vektor umgewandelt werden, der die vorherigen zehn Datenpunkte umfasst (z.B. das Rückblickfenster 212), und der Vektor kann der Markierung des Datenpunkts zwanzig Tage in der Zukunft zugehörig sein (z.B. dem Vorhersagehorizont 214, wobei die Markierung entweder Daten entspricht, die für einen normalen Zustand 208-1 indikativ sind, oder Daten, die für einen verschlechterten Zustand 208-2 indikativ sind). Wenn in diesem Beispiel die Markierung des Datenpunkts zwanzig Tage in der Zukunft Daten entspricht, die für einen verschlechterten Zustand 208-2 indikativ sind, können der Vektor von Datenpunkten des aktuellen Datenpunkts und die vorherigen zehn Datenpunkte als eine Vorhersage-Ausfallsignatur für Schulungszwecke betrachtet werden. Wenn in diesem Beispiel umgekehrt die Markierung des Datenpunkts zwanzig Tage in der Zukunft Daten entspricht, die für einen normalen Zustand 208-1 indikativ sind, können der Vektor von Datenpunkten des aktuellen Datenpunkts und die vorherigen zehn Datenpunkte als eine Vorhersage-Normalsignatur für Schulungszwecke angenommen werden.
  • Wie einem Fachmann klar sein dürfte, können das Rückblickfenster 212 und der Vorhersagehorizont 214 eine Vielfalt von Zahlen entsprechend einer Vielfalt von Größenordnungen sein. Zum Beispiel können in einigen Ausführungsformen das Rückblickfenster 212 und der Vorhersagehorizont 214 in Sekunden, Minuten, Tagen, Wochen, Monaten usw. gemessen werden. In verschiedenen Ausführungsformen ist das Rückblickfenster 212 kleiner, größer oder gleich dem Vorhersagehorizont. In einigen Ausführungsformen ist das Rückblickfenster 212 so bemessen, dass der Kompromiss zwischen Nutzen und Rechenaufwand verwaltet werden kann. Zum Beispiel stellt ein relativ größeres Rückblickfenster 212 mehr Informationen bereit, mit denen eine Ausfallsignatur genau erkannt werden kann, wobei auch die Umsetzung von zusätzlicher Rechenkapazität erforderlich wird. Umgekehrt stellt ein relativ kleineres Rückblickfenster 212 mehr Informationen bereit, mit denen eine Ausfallsignatur genau erkannt werden kann, wobei die Umsetzung von weniger Rechenkapazität erforderlich wird. In einigen Ausführungsformen wird der Vorhersagehorizont 214 auf Grundlage der Ausfallsignatur bemessen. Wenn eine Anlage 110 zum Beispiel einem Zwanzig-Tage-Fenster ab dem Zeitpunkt zugehörig ist, an dem die Angabe eines Ausfalls sich in den Daten zu zeigen beginnt, muss der Vorhersagehorizont 214 zwanzig Tage oder weniger betragen (mit anderen Worten, ein Vorhersagehorizont 214, der größer als zwanzig Tage ist, würde vermehrt falsche Positive ergeben. Ferner müssen in einigen Ausführungsformen das Rückblickfenster 212 und der Vorhersagehorizont 214 überhaupt nicht notwendigerweise in Schritten auf Zeitgrundlage gemessen werden, auf sie kann aber einfach durch eine Anzahl von vorherigen und nachfolgenden Datenpunkten verwiesen werden, wobei der Abstand der Datenpunkte auf nicht zeitbezogenen Merkmalen beruhen kann. Obwohl die im vorgenannten Beispiel erörterten Datenbeispiele 216 in einem Vektor-Format vorliegen, können ferner in anderen Ausführungsformen Matrizen oder Tensoren verwendet werden, um mehrdimensionale Daten oder multimodale Datenströme darzustellen. Zum Beispiel kann ein Datenbeispiel 216 für eine Anlage 110, die drei Datenströmen zugehörig ist, ein Eingabe-Ausgabe-Datenpaar umfassen, wobei der Eingabeabschnitt einen dreidimensionalen Tensor aufweist, der aus jeweiligen Beispielen des Rückblickfensters 212 für jeden der drei Datenströme besteht, und wobei der Ausgabeabschnitt eine binäre Angabe einer zukünftigen Leistung an dem Vorhersagehorizont 214 aufweist (z.B. 0 für normal und 1 für Ausfall).
  • Der Schulungsmodus 200 kann ferner ein Zusammenfassen der Daten 218 in Clustern umfassen. Eine Cluster-Bildung 218 kann die Datenbeispiele 216 durch Verwenden jeder derzeit bekannten oder zu einem späteren Zeitpunkt entwickelten testbaren Cluster-Bildungstechnik zu Clustern zusammenfassen. Mit anderen Worten, die zu Clustern zusammengefassten Daten 218 können eine Mehrzahl von Clustern 220 umfassen, wobei jedes Cluster mindestens ein Datenbeispiel 216 enthält. Insbesondere ist die Anzahl von Clustern 220 konfigurierbar, um den Datenbeispielen 216 genau zu entsprechen (ohne Überanpassung).
  • In einigen Ausführungsformen werden die Cluster 220 durch Verwenden von K-Means-Clustering bestimmt. Vorteilhafterweise ist K-Means-Clustering eine rechnerisch effiziente Cluster-Technik, die für große Gruppen von Daten skalierbar ist. Generell sind sowohl der Typ der verwendeten Cluster-Bildungstechnik, die verwendete Anzahl von Clustern als auch die verwendeten Parameter der Cluster (z.B. Form, Größe usw.) abstimmbare Parameter, die gegebenenfalls abgeschwächt werden können, um die Leistung des Ausfallvorhersagemodells 124 gemäß einigen Ausführungsformen der vorliegenden Offenbarung zu verbessern. Zum Beispiel kann es von Vorteil sein, über eine ausreichende Anzahl von Clustern zum Erfassen einer Vielfalt von normalen Betriebsprofilen und einer Vielfalt von sich verschlechternden Betriebsprofilen zu verfügen.
  • Die zu Clustern zusammengefassten Daten 218 können ferner Cluster-Bewertungen 222 umfassen, die jedem der Cluster 220 zugewiesen sind. Die Cluster-Bewertungen 222 umfassen Normalitätsbewertungen 224 und Anomaliebewertungen 226. In einigen Ausführungsformen können die Normalitätsbewertungen 224 gemäß Gleichung 1 berechnet werden: N S C i = N n C i / N C i N n / N   f o r   1 < i < N u m b e r   o f   c l u s t e r s
    Figure DE112021002699T5_0001
  • Dementsprechend können in einigen Ausführungsformen die Anomaliebewertungen 226 gemäß Gleichung 2 berechnet werden: A S C i = N ƒ C i / N C i N ƒ / N   f o r   1 < i < N u m b e r   o f   c l u s t e r s
    Figure DE112021002699T5_0002
  • In Bezug auf die Gleichung 1 kann N n C i
    Figure DE112021002699T5_0003
    auf die Anzahl von Datenbeispielen verweisen, die einem normalen Zustand 216-1 in einem bestimmten Cluster Ci der Cluster 220 zugehörig sind, wogegen Nn auf die Gesamtanzahl von Datenbeispielen verweisen kann, die einem normalen Zustand 216-1 in den gefensterten historischen Daten 210 zugehörig sind. Gleichermaßen kann in Bezug auf die Gleichung 2 der Ausdruck N ƒ C i
    Figure DE112021002699T5_0004
    auf die Anzahl von Datenbeispielen verweisen, die einem verschlechterten Zustand 216-2 in einem bestimmten Cluster Ci der Cluster 220 zugehörig sind, wogegen Nf auf die Gesamtanzahl von Datenbeispielen verweisen kann, die einem verschlechterten Zustand 216-2 in den gefensterten historischen Daten 210 zugehörig sind. Für die Gleichung 1 und die Gleichung 2 kann der Ausdruck NCi auf die Gesamtanzahl von Datenbeispielen 216 in einem bestimmten Cluster Ci der Cluster 220 verweisen, wogegen Nf auf die Gesamtanzahl von Datenbeispielen 216 in den gefensterten historischen Daten 206 verweisen kann.
  • Mit anderen Worten, die Normalitätsbewertung 224 kann der Anteil von Datenbeispielen sein, die einem normalen Zustand 216-1 in einem bestimmten Cluster zugehörig sind, geteilt durch den Anteil von Datenbeispielen, die einem normalen Zustand 216-1 in den gesamten gefensterten historischen Daten 210 zugehörig sind. Desgleichen kann die Anomaliebewertung 226 der Anteil von Datenbeispielen sein, die einem verschlechterten Zustand 216-2 in einem bestimmten Cluster zugehörig sind, geteilt durch den Anteil von Datenbeispielen, die dem verschlechterten Zustand 216-2 in den gesamten gefensterten historischen Daten 210 zugehörig sind.
  • Nach einem Erstellen der Cluster 220 und einem Generieren der Cluster-Bewertungen 222 kann das Ausfallvorhersagemodell 124 als geschult betrachtet werden. In einigen Ausführungsformen kann nach einem Schulen des Ausfallvorhersagemodells 124 durch Verwenden der Schulungsuntergruppe 204-1 das Ausfallvorhersagemodell 124 durch Verwenden der Testuntergruppe 204-2 und des Bereitstellungsmodus 228 getestet werden. Obwohl die Erörterung des Bereitstellungsmodus 228 in Bezug auf die Schulungsuntergruppe 204-1 erfolgt, ist die Erörterung des Bereitstellungsmodus 228 gleichermaßen auf ein Empfangen von Echtzeit-Streaming-Daten zum Zweck eines Vorhersagens eines zukünftigen nicht linearen Phänomens anwendbar (z.B. abnutzungsbedingte Leistungsverschlechterung in einer PCP), das den neuen Daten zugehörig ist.
  • Im Bereitstellungsmodus 228 kann das Ausfallvorhersagemodell 124 die Testuntergruppe 204-2 in gefensterte Datenbeispiele 230 formatieren. Die gefensterten Datenbeispiele 230 können den Datenbeispielen 216 ähnlich sein, jedoch ohne irgendeine Angabe eines normalen oder verschlechterten Zustands (soweit es sich dabei um die Informationen handelt, die durch das Ausfallvorhersagemodell 124 vorhergesagt werden sollen, und die daher vor dem Ausfallvorhersagemodell 124 verborgen sind, während die Leistung des Ausfallvorhersagemodells 124 getestet wird). Somit kann ein jeweiliges Beispiel in den gefensterten Datenbeispielen 230 einen Datenpunkt aus der Testuntergruppe 204-2 und eine vorherige Anzahl von Datenpunkten gemäß dem Rückblickfenster 212 umfassen. Wie vorher erörtert, kann diese Serie von Daten abhängig von der Komplexität, Dimensionalität und Modalität der Daten in der Testuntergruppe 204-2 in einem Vektor-, Matrix- oder Tensor-Format gespeichert werden. In einigen Ausführungsformen sind die gefensterten Datenbeispiele 230 mit den formatierten Sensordaten 120 konsistent.
  • Jeweilige Beispiele der gefensterten Datenbeispiele 230 können anschließend jeweiligen Clustern 220 zugeordnet werden. Eine Klassifizierung 232 kann anschließend jedem der gefensterten Datenbeispiele 230 auf Grundlage eines zugehörigen Clusters der Cluster 220 zugeordnet werden. Zum Beispiel kann für ein jeweiliges gefenstertes Datenbeispiel 230, das in ein jeweiliges Cluster 220 mit einer Normalitätsbewertung 224 gestellt wird, die größer als eine Anomaliebewertung 226 ist, dieses jeweilige gefensterte Datenbeispiel 230 als normal betrachtet werden (z.B. eine ,,0"-Bewertung). Umgekehrt, wenn dieses jeweilige gefensterte Datenbeispiel 230 in ein jeweiliges Cluster 220 mit einer Anomaliebewertung 226 gestellt wird, die größer als die Normalitätsbewertung 224 ist, kann dieses jeweilige gefensterte Datenbeispiel 230 als anomal oder als Vorhersage für einen zukünftigen Ausfall betrachtet werden (z.B. eine „1“-Bewertung). In einigen Ausführungsformen umfasst die Klassifizierung 232 ein Vergleichen einer Anomaliebewertung 226 eines Clusters 200, das ein gefenstertes Datenbeispiel 230 erfasst, mit einer durchschnittlichen Anomaliebewertung aller Cluster 220 mit einer Normalitätsbewertung 224, die größer als eine Anomaliebewertung 226 ist. Auf diese Weise kann die Anomaliebewertung 226 des Clusters 220, der das gefensterte Datenbeispiel 230 erfasst, mit einem Basisniveau von Abnormalität verglichen werden, die in anderen Clustern 220 zu sehen ist, die ansonsten als normal betrachtet werden.
  • Das Ausfallvorhersagemodell 124 kann ferner ein Ausfallsignal 234 umfassen. Das Ausfallsignal 234 kann konfiguriert werden, um die Anomaliebewertungen 226 oder Klassifizierungen durch Übernehmen eines Mittelwertes von Anomaliebewertungen für eine frühere vorherbestimmte Anzahl von Datenpunkten zu glätten. Zum Beispiel kann das Ausfallsignal 234 gemäß Gleichung 3 berechnet werden: F S t = n = t x t A S n x
    Figure DE112021002699T5_0005
  • In Gleichung 3 kann der Ausdruck x auf eine vorbestimmte Anzahl von aufeinander folgenden vorherigen Datenpunkten verweisen, über die die mittlere Anomaliebewertung für ein bestimmtes gefenstertes Datenbeispiel 230 bestimmt werden soll. In einigen Ausführungsformen kann x ein abstimmbarer Parameter gemäß konzeptionellen Überlegungen des Ausfallvorhersagemodells 124 sein. Zum Beispiel kann ein relativ größerer x-Wert die Empfindlichkeit des Ausfallvorhersagemodells 124 gegenüber jeder bestimmten Anomaliebewertung reduzieren, die einen Ausfall angibt (und dadurch falsche Positive reduziert), wogegen ein relativ kleinerer x-Wert die Empfindlichkeit des Ausfallvorhersagemodells 124 gegenüber einer Anomaliebewertung erhöhen kann, die einen Ausfall angibt (und dadurch falsche Negative reduziert). Ferner kann in Gleichung 3 der Ausdruck ASn auf die Anomaliebewertung 226 für ein Cluster von den Clustern 220 verweisen, das einen Datenpunkt n aufweist, obwohl in anderen Ausführungsformen auch die Klassifizierung 232 verwendet werden könnte. Das Ausfallsignal 234 wird ausführlicher unter Bezugnahme auf 5B erörtert.
  • Unter folgender Bezugnahme auf 3 wird ein Ablaufplan eines beispielhaften Verfahrens 300 zum Verwenden eines Ausfallvorhersagemodells 124 gemäß einigen Ausführungsformen der vorliegenden Offenbarung veranschaulicht. Das Verfahren 300 kann zum Beispiel durch das Ausfallvorhersagemodell 124, ein Ausfallvorhersagesystem 102, einen Computer, einen Rechenknoten, einen Prozessor oder eine andere Kombination von Hardware und/oder Software umgesetzt werden.
  • Eine Operation 302 umfasst ein Schulen eines Ausfallvorhersagemodells 124. Das Schulen eines Ausfallvorhersagemodells 124 kann Aspekte umfassen, die vorher unter Bezugnahme auf den Schulungsmodus 200 des Ausfallvorhersagemodells 124 erörtert wurden. Die Operation 302 wird hierin später ausführlicher unter Bezugnahme auf 4 erörtert.
  • Eine Operation 304 umfasst ein Formatieren von aggregierten Sensordaten 118 in formatierte Sensordaten 120. In einigen Ausführungsformen sind die formatierten Sensordaten 120 konsistent mit gefensterten Datenbeispielen 230. Die Operation 304 kann ein Anwenden eines Rückblickfensters 212 auf jeweilige Datenpunkte in den aggregierten Sensordaten 118 umfassen, um die formatierten Sensordaten 120 zu generieren. In einigen Ausführungsformen umfasst die Operation 304 ferner andere Datenbereinigungs- und/oder Datenformatierungsoperationen wie beispielsweise Entfernen von Ausreißern, Auflösen von Null-Werten usw.
  • Eine Operation 306 umfasst ein Eingeben der formatierten Sensordaten 120 in das Ausfallvorhersagemodell 124. Eine Operation 308 umfasst ein Generieren von Ergebnissen 122 auf Grundlage einer Ausgabe von dem Ausfallvorhersagemodell 124. In einigen Ausführungsformen umfassen die Ergebnisse 122 eine Klassifizierung 232 (z.B. normal oder indikativ für einen zukünftigen Ausfall) und/oder ein Ausfallsignal 234 (z.B. eine der Wahrscheinlichkeit eines zukünftigen Ausfalls zugehörige Quantifizierung).
  • Eine Operation 310 umfasst ein Ausführen einer Minderungsmaßnahme auf Grundlage der Ergebnisse. Zum Beispiel kann die Minderungsmaßnahme ein Übertragen der Ergebnisse 122 zu einer Endpunktanwendung 106 in der Form einer Benachrichtigung, einer Warnung, eines Berichts oder einer anderen Übertragung umfassen. In einigen Ausführungsformen umfasst die Operation 310 ein Auslösen eines Planungsereignisses in Bezug auf die Wartung einer Anlage 110, wie zum Beispiel ein Ersetzen, Erneuern oder anderweitiges Warten der Anlage 110. In einigen Ausführungsformen beruht das Planungsereignis auf den Ergebnissen 122. Zum Beispiel kann ein Ausfallsignal 234 über einem Schwellenwert die Planung eines Wartungsereignisses in einem Zeitfenster auslösen (z.B. innerhalb des Vorhersagehorizonts 214). In einigen Ausführungsformen kann die Minderungsmaßnahme mit logistischen Aktionen in Zusammenhang stehen, zum Beispiel Bestellen aller notwendigen Austauschteile und Versenden aller bestellten Austauschteile an einen Standort, der der Anlage 110 zugehörig ist.
  • Unter folgender Bezugnahme auf 4 wird ein Ablaufplan eines beispielhaften Verfahrens 400 zum Schulen eines Ausfallvorhersagemodells 124 gemäß einigen Ausführungsformen der vorliegenden Offenbarung veranschaulicht. In einigen Ausführungsformen ist das Verfahren ein Teilverfahren der Operation 302 von 3. In einigen Ausführungsformen kann das Verfahren 400 zum Beispiel durch das Ausfallvorhersagemodell 124, ein Ausfallvorhersagesystem 102, einen Computer, einen Rechenknoten, einen Prozessor oder eine andere Kombination von Hardware und/oder Software umgesetzt werden.
  • Eine Operation 402 umfasst ein Aggregieren von historischen Daten 202 in eine Schulungsuntergruppe 204-1 und eine Testuntergruppe 204-2. Eine Operation 404 umfasst ein Markieren der historischen Daten 202, um markierte historische Daten 202 mit Daten zu generieren, die für einen normalen Zustand 208-1 indikativ sind, und Daten, die für einen verschlechterten Zustand 208-2 indikativ sind. Eine Operation 406 umfasst ein Generieren von Datenbeispielen, die einem normalen Zustand 216-1 zugehörig sind, und Datenbeispielen, die einem verschlechterten Zustand 216-2 zugehörig sind, indem ein Rückblickfenster 212 und ein Vorhersagehorizont 214 auf jeweilige Datenpunkte in den historischen Daten 202 angewendet werden.
  • Eine Operation 408 umfasst ein Zusammenfassen der Datenbeispiele 216 in Clustern in eine Mehrzahl von Clustern 220. In einigen Ausführungsformen verwendet eine Operation 408 ein K-Means-Clustering. Eine Operation 410 umfasst ein Berechnen von Cluster-Bewertungen 222, die jedem der Cluster 220 zugehörig sind. Die Cluster-Bewertungen 222 können eine jeweilige Normalitätsbewertung 224 und eine jeweilige Anomaliebewertung 226 für jedes jeweilige Cluster in den Clustern 220 umfassen.
  • Eine Operation 412 umfasst ein Abstimmen eines Ausfallvorhersagemodells 124. Ein Abstimmen des Ausfallvorhersagemodells 124 kann zum Beispiel (i) ein Modifizieren der markierten historischen Daten 206 durch Ändern von Definitionen von Daten, die für einen normalen Zustand 208-1 indikativ sind, und Daten, die für einen verschlechterten Zustand 208-2 indikativ sind; (ii) ein Ändern der Größe des Rückblickfensters 212; (iii) ein Ändern der Größe des Vorhersagehorizonts 214; (iv) ein Ändern von Parametern, die den Clustern 220 zugehörig sind (z.B. Anzahl von Clustern, Formen von Clustern, Größen von Clustern usw.); und/oder andere Techniken und/oder Strategien zur Modellabstimmung umfassen. In einigen Ausführungsformen wird das Ausfallvorhersagemodell 124 auf Grundlage von Ergebnissen aus einem Testen der Testunteruntergruppe 204-2 abgestimmt.
  • Eine Operation 414 umfasst ein Ausgeben des geschulten Ausfallvorhersagemodells 124. In einigen Ausführungsformen umfasst ein Ausgeben des geschulten Ausfallvorhersagemodells 124 ein Speichern des geschulten Ausfallvorhersagemodells 124 in einem durch einen Computer lesbaren Speichermedium wie zum Beispiel einem virtuell bereitgestellten Modell-Container 114.
  • Unter folgender Bezugnahme auf 5A wird ein Ablaufplan eines beispielhaften Verfahrens 500 zum Generieren von Ergebnissen auf Grundlage einer Ausgabe von einem Ausfallvorhersagemodell 124 gemäß einigen Ausführungsformen der vorliegenden Offenbarung veranschaulicht. In einigen Ausführungsformen ist das Verfahren 500 ein Teilverfahren der Operation 308 von 3. In einigen Ausführungsformen kann das Verfahren 500 zum Beispiel durch das Ausfallvorhersagemodell 124, ein Ausfallvorhersagesystem 102, einen Computer, einen Rechenknoten, einen Prozessor oder eine andere Kombination von Hardware und/oder Software umgesetzt werden.
  • Eine Operation 502 umfasst ein Zuordnen eines binären Klassifizierungsresultats 233 zu jeweiligen Datenbeispielen (z.B. gefensterte Datenbeispiele 230), die vorher in das Ausfallvorhersagemodell 124 eingegeben wurden. In einigen Ausführungsformen ist die Klassifizierung 232 entweder „normal“ (z.B. 0) oder „anomal“, „fehlerhaft“ oder eine andere nicht normale Angabe (z.B. 1). Die Klassifizierung 232 kann auf der Normalitätsbewertung 224 und der Anomaliebewertung 226 des Clusters 220 beruhen, der ein jeweiliges gefenstertes Datenbeispiel 230 erfasst. Wenn insbesondere die Normalitätsbewertung 224 größer als die Anomaliebewertung 226 ist, wird das entsprechende gefensterte Datenbeispiel 230 als normal betrachtet. Wenn umgekehrt die Anomaliebewertung 226 größer als die Normalitätsbewertung 224 ist, wird das entsprechende gefensterte Datenbeispiel 230 als anomal oder andernfalls als indikativ für einen Ausfall betrachtet.
  • Eine Operation 504 umfasst ein Generieren eines Ausfallsignals 234 für jeweilige eingegebene Datenbeispiele (z.B. gefensterte Datenbeispiele 230). Das Ausfallsignal 234 kann auf den Normalitätsbewertungen 224, Anomaliebewertungen 226 und/oder Klassifizierungen 232 beruhen, die den gefensterten Datenbeispielen 230 zugehörig sind. In einigen Ausführungsformen stellt das Ausfallsignal einen zuverlässigeren Indikator von tatsächlich anomalen Daten dar (es reduziert z.B. falsche Positive). Das Ausfallsignal 234 wird hierin später ausführlicher unter Bezugnahme auf 5B erörtert.
  • Unter folgender Bezugnahme auf 5B wird ein Ablaufplan eines beispielhaften Verfahrens 510 zum Generieren eines Ausfallsignals 234 gemäß einigen Ausführungsformen der vorliegenden Offenbarung veranschaulicht. In einigen Ausführungsformen ist das Verfahren 510 ein Teilverfahren der Operation 504 von 5A. In einigen Ausführungsformen kann das Verfahren 510 zum Beispiel durch das Ausfallvorhersagemodell 124, ein Ausfallvorhersagesystem 102, einen Computer, einen Rechenknoten, einen Prozessor oder eine andere Kombination von Hardware und/oder Software umgesetzt werden.
  • Eine Operation 512 umfasst ein Berechnen einer mittleren Anomaliebewertung von Clustern 220, die als normal eingestuft sind. Ein Berechnen der mittleren Anomaliebewertung während normaler Operationen kann ein Mitteln der Anomaliebewertungen 226 für jedes Cluster von den Clustern 220 umfassen, wobei die Normalitätsbewertung 224 größer als die Anomaliebewertung 226 ist. Dies kann insofern von Nutzen sein, als dadurch ein Basis-Anomalieniveau erstellt wird, das zum Reduzieren von falschen Positiven fungieren kann.
  • Eine Operation 514 umfasst ein Zuweisen eines eingehenden gefensterten Datenbeispiels 230 zu einem Cluster 220, das einer Anomaliebewertung 226 und einer Normalitätsbewertung 224 zugehörig ist. Wenn die Anomaliebewertung des angegebenen Clusters größer als die durchschnittliche Anomaliebewertung während normaler Operationen ist (wie in der Operation 512 festgelegt), wird dieses Datenbeispiel als im Ausfallmodus befindlich klassifiziert (klassifiziert als 1), andernfalls wird das Datenbeispiel als im Normalmodus klassifiziert (klassifiziert als 0).
  • Eine Operation 516 umfasst ein Berechnen des Ausfallsignals 234 als den Durchschnitt der binären 0- oder 1-Klassifizierungsresultate für diese Anlage über eine vorbestimmte Zeitdauer (z.B. 10 Tage) oder eine vorbestimmte Anzahl von gefensterten Datenbeispielen 230. In einigen Ausführungsformen kann eine Operation 516 die Gleichung 3 verwenden.
  • Unter erneuter Bezugnahme auf 1 bis 5 betrifft eine bestimmte Anwendung von Aspekten der vorliegenden Offenbarung ein Erkennen von abnutzungsbedingter Leistungsverschlechterung von Rotoren in Exzenterschneckenpumpen (PCPs). Eine abnutzungsbedingte Leistungsverschlechterung von Rotoren in PCPs ist ein nicht lineares Phänomen, daher sind Aspekte der vorliegenden Offenbarung gut geeignet, um eine abnutzungsbedingte Rotorverschlechterung in PCPs vorherzusagen.
  • Künstliche Fördersysteme, die PCPs verwenden, ermöglichen verschiedene nicht thermische Öl- und Gas-Rückgewinnungsverfahren wie zum Beispiel kalte Schwerölproduktion mit Sand (CHOPS) (Cold Heavy Oil Production with Sand). PCPs sind fähig, viskose Mischungen aus Öl und Sand aus einem unterirdischen Reservoir mit verbesserten Förderkosten, verbesserten Wartungskosten, verbesserter Anwendungsflexibilität und verringerter Auswirkung auf die Umwelt im Vergleich mit anderen künstlichen Fördersystemen (z.B. elektrische Tauchpumpe (ESP)) an die Oberfläche zu fördern.
  • Trotz der Eignung von PCPs für eine Verarbeitung von höherem Schwerölgehalt in Sand ist ein Ausfall durch Abrasionsverschleiß ein Problem, das sich aus der konstanten Sandaufnahme ergibt. Abrasionsverschleiß kann auf die fortschreitende Verschlechterung der Pumpenleistung verweisen, wenn sich die Hartchrombeschichtung auf dem Rotor abnutzt, und dabei handelt es sich um den häufigsten Ausfalltyp in PCPs. Diese Abnutzung kann auf die Oberfläche der Chrombeschichtung auf dem Rotor begrenzt sein oder sich bis auf das Grundmetall erstrecken. In jedem Fall ändert sich das ursprüngliche Rotorprofil. Diese Änderung des Profils kann die Leistung der PCP insofern beeinflussen, als sich die Passung zwischen dem Rotor und dem Stator ändert. Ein akuter Abrasionsverschleiß, bei dem die Hartchrombeschichtung bis auf das Grundmetall abgenutzt wird, kann das Elastomer in dem Rotor dauerhaft beschädigen und einen Pumpenaustausch erfordern.
  • Pumpenausfälle in Ölquellen sind aufgrund verlorener Produktionszeit kostspielig. Somit reduziert die Fähigkeit, einen Ausfall durch Pumpenverschleiß vorherzusagen, diese Kosten durch Bereitstellen von proaktiver geplanter Wartung für PCPs vor einem Ausfall. Ferner kann eine verbesserte Wahrnehmung der Verschlechterung der Pumpenleistung während der frühen Abnutzungsphasen Bediener dabei unterstützen, bei betrieblichen Entscheidungen die richtigen Einstellungen vorzunehmen, um den Lebenszyklus zu verlängern.
  • Allerdings ist ein Vorhersagen von Ausfällen in PCPs aus ähnlichen Gründen schwierig wie ein Vorhersagen einer Leistungsverschlechterung mit nicht linearen Merkmalen. Zum einen verläuft der Ausfallmechanismus schrittweise, wodurch sich Probleme bei einem korrekten Markieren von historischen Daten als „normal“ oder „anomal“ ergeben, da eine PCP über längere Zeit mit suboptimaler Leistung funktionsfähig bleiben kann, während sich der Rotor zunehmend abnutzt. Eine weitere Herausforderung betrifft den unausgewogenen Satz von historischen Daten (z.B. im Wesentlichen mehr normale Daten als anomale Daten), die für PCPs zur Verfügung stehen. Noch eine weitere Herausforderung betrifft den variablen Ausfallmechanismus, der sich je nach Betriebsumgebung ändert (z.B. geologische Formationen mit höherem Sandgehalt im Vergleich zu geologischen Formationen mit geringerem Sandgehalt). Dementsprechend ist eine genaue Vorhersage eines PCP-Ausfalls schwierig. Dennoch können Aspekte der vorliegenden Offenbarung, wenn sie auf dem Gebiet einer Vorhersage-Überwachung für PCPs umgesetzt werden, PCP-Leistungsverschlechterungen aufgrund von abnutzungsbezogenen Mechanismen genau vorhersagen.
  • Unter erneuter Bezugnahme auf die Erörterung von 4, die sich auf ein Schulen eines Ausfallvorhersagemodells 124 für eine Anlage 110 wie beispielsweise eine PCP bezieht, kann eine Operation 402 zum Beispiel Sensordaten wie Pumpendrehzahl, Pumpendrehmoment, Gehäusedruck und Produktionsleistung aggregieren. Die aggregierten Sensordaten können in eine Schulungsuntergruppe 204-1 (z.B. ungefähr 80 % der Daten) und eine Testuntergruppe 204-2 (z.B. ungefähr 20 % der Daten) getrennt werden. Eine Operation 404 kann die historischen Daten als Daten markieren, die für einen normalen Zustand 208-1 (z.B. ungefähr 97 % der unausgewogenen Daten in der Schulungsuntergruppe 204-1) indikativ sind, oder Daten, die für einen verschlechterten Zustand 208-2 (z.B. ungefähr 3 % der unausgewogenen Daten in der Schulungsuntergruppe 204-1) indikativ sind. In einigen Ausführungsformen können die Daten, die für einen verschlechterten Zustand 208-2 indikativ sind, alle Daten zwischen 25 Tagen und 3 Tagen vor einem bekannten PCP-Austauschdatum sein (wie in den Wartungsprotokollen festgelegt), während Daten, die früher als 25 Tage vor einem bekannten PCP-Austauschdatum liegen, als Daten betrachtet werden können, die für einen normalen Zustand 208-1 indikativ sind.
  • Eine Operation 406 kann die Datenbeispiele 216 durch Anwenden eines Rückblickfensters 212 und eines Vorhersagehorizonts 214 auf jeweilige Datenpunkte generieren. Eine Operation 408 kann die Datenbeispiele 216 durch Verwenden von K-Means-Clustering zu Clustern zusammenfassen, und eine Operation 410 kann Normalitätsbewertungen 224 und Anomaliebewertungen 226 gemäß jeweils der Gleichung 1 und der Gleichung 2 berechnen. Eine Operation 412 kann das Ausfallvorhersagemodell 124 abstimmen, und eine Operation kann das geschulte Ausfallvorhersagemodell 124 ausgeben.
  • Ein Anwenden der Testuntergruppe 204-2 auf das geschulte Ausfallvorhersagemodell 124 der PCP-Anwendung zeigt den Nutzen von Aspekten der vorliegenden Offenbarung auf. 6A veranschaulicht Versuchsergebnisse einer Darstellung von kumulativen Anomaliebewertungen 226 (y-Achse) in Abhängigkeit von Tagen bis zu einem bekannten Pumpenaustauschdatum (x-Achse). Wie zu sehen ist, steigt die Trendkurve zwischen 25 Tagen vor Ausfall und dem bekannten Pumpenaustauschdatum steil an. Dementsprechend zeigt 6A auf, dass die Anomaliebewertungen 226 zum erfolgreichen Vorhersagen von PCP-Ausfällen verwendet werden können.
  • 6B veranschaulicht Versuchsergebnisse einer Darstellung der Intensität einer Klassifizierung 232, die einen Ausfall (y-Achse) in Abhängigkeit von Tagen bis zum Ausfall (x-Achse) angibt. Wie zu sehen ist, steigt die Intensität der Klassifizierung 232, die einen Ausfall angibt, zwischen ungefähr 25 Tagen vor Ausfall und dem bekannten Pumpenaustauschdatum signifikant an. Dementsprechend zeigt 6B auf, dass die Klassifizierungen 232 zum erfolgreichen Vorhersagen von PCP-Ausfällen verwendet werden können.
  • Insbesondere, obwohl in Bezug auf das Ausfallsignal 234 keine Darstellung bereitgestellt ist, ist dem Fachmann klar, dass das Ausfallsignal 234 eine ähnliche Vorhersagekraft mit verringertem Rauschen in Bezug auf die Ergebnisse aufzeigt, die in 6A und 6B veranschaulicht sind. Das liegt daran, dass das Ausfallsignal 234 eine Durchschnittsbewertung darstellt, wogegen 6A eine kumulative Bewertung veranschaulicht und 6B eine Intensitätsbewertung veranschaulicht.
  • 7 veranschaulicht Versuchsergebnisse in Bezug auf Konfusionsmatrizen für verschiedene Zeiträume vor einem bekannten Pumpenaustauschdatum durch Verwenden der Testuntergruppe 204-2 für ein PCP-Ausfallvorhersagemodell 124 wie oben erörtert. Wie in 7 gezeigt, liegt für das Feld normal (tatsächliche Markierung 702-1) bis normal (vorhergesagte Markierung 704-1) ein Wert von 0,76 vor, der Wert für das Feld fehlerhaft bis normal beträgt 0,38, der Wert für das Feld normal bis fehlerhaft beträgt 0,24, und der Wert für das Feld fehlerhaft bis fehlerhaft beträgt 0,62. Für 14 Tage vor einem Ausfall 700-2 liegt für das Feld normal (tatsächliche Markierung 702-2) bis normal (vorhergesagte Markierung 704-2) ein Wert von 0,76 vor, der Wert für das Feld fehlerhaft bis normal beträgt 0,26, der Wert für das Feld normal bis fehlerhaft beträgt 0,24, und der Wert für das Feld fehlerhaft bis fehlerhaft beträgt 0,74. Für 5 Tage vor einem Ausfall 700-3 liegt für das Feld normal (tatsächliche Markierung 702-3) bis normal (vorhergesagte Markierung 704-3) ein Wert von 0,76 vor, der Wert für das Feld fehlerhaft bis normal beträgt 0,12, der Wert für das Feld normal bis fehlerhaft beträgt 0,24, und der Wert für das Feld fehlerhaft bis fehlerhaft beträgt 0,88.
  • Im Allgemeinen veranschaulicht 7 ein Verbessern der Vorhersageleistung in Abhängigkeit von der Nähe zu einem tatsächlichen Pumpenaustauschdatum. Ferner veranschaulicht 7 einen Abruf (z.B. wahre Positive geteilt durch die Gesamtzahl von wahren Positiven und falschen Negativen) von ungefähr 88 % 5 Tage vor einem Ausfall 700-3, ungefähr 75 % 14 Tage vor einem Ausfall 700-2 und ungefähr 62 % 30 Tage vor einem Ausfall 700-1. Gleichzeitig verwirklichten Aspekte der vorliegenden Offenbarung eine Präzision (z.B. wahre Positive geteilt durch eine Gesamtzahl von wahren Positiven und falschen Negativen) von ungefähr 78 % (5 Tage vor dem Ausfall 700-3), 76 % (14 Tage vor dem Ausfall 700-2) und 72 % (30 Tage vor dem Ausfall 700-1). Dementsprechend zeigt 7 auf, dass Aspekte der vorliegenden Offenbarung ein robustes Ausfallvorhersagemodell 124 zum Vorhersagen einer PCP-Leistungsverschlechterung infolge von Rotorverschleiß verwirklichen.
  • 8 veranschaulicht ein Blockschaubild eines beispielhaften Computers 800 gemäß einigen Ausführungsformen der vorliegenden Offenbarung. In verschiedenen Ausführungsformen kann der Computer 800 ein bzw. alle der in 3 bis 5 beschriebenen Verfahren ausführen und/oder die Funktionalität umsetzen, die in einer von 1 bis 2 und/oder 6 bis 7 erörtert wird. In einigen Ausführungsformen empfängt der Computer 800 Anweisungen, die im Zusammenhang mit den vorgenannten Verfahren und Funktionalitäten stehen, indem durch einen Prozessor ausführbare Anweisungen von einem entfernt angeordneten Datenverarbeitungssystem über ein Netzwerk 850 heruntergeladen werden. In anderen Ausführungsformen stellt der Computer 800 einer Client-Maschine Anweisungen für die vorgenannten Verfahren und/oder Funktionalitäten bereit, sodass die Client-Maschine das Verfahren oder einen Teil des Verfahrens auf Grundlage der durch den Computer 800 bereitgestellten Anweisungen ausführt. In einigen Ausführungsformen ist der Computer 800 in das Ausfallvorhersagesystem 102 von 1 (oder es wird eine dem Computer 800 ähnliche Funktionalität virtuell dafür bereitgestellt), das Ausfallvorhersagemodell 124 von 1 oder einen anderen Aspekt der vorliegenden Offenbarung integriert.
  • Der Computer 800 umfasst einen Arbeitsspeicher 825, einen Speicher 830, eine Verbindung 820 (z.B. BUS), eine oder mehrere CPUs 805 (die hierin auch als Prozessoren bezeichnet werden), eine E/A-Einheitenschnittstelle 810, E/A-Einheiten 812 und eine Netzwerkschnittstelle 815.
  • Jede CPU 805 ruft Programmieranweisungen ab, die in dem Arbeitsspeicher 825 oder dem Speicher 830 gespeichert sind, und führt sie aus. Die Verbindung 820 wird zum Verschieben von Daten, wie zum Beispiel Programmieranweisungen, zwischen den CPUs 805, der E/A-Einheitenschnittstelle 810, dem Speicher 830, der Netzwerkschnittstelle 815 und dem Arbeitsspeicher 825 verwendet. Die Verbindung 820 kann durch Verwenden von einem oder mehreren Bussen umgesetzt werden. Die CPUs 805 können in verschiedenen Ausführungsformen eine einzelne CPU, mehrere CPUs oder eine einzelne CPU mit mehreren Verarbeitungskernen sein. In einigen Ausführungsformen kann die CPU 805 ein Digitalsignalprozessor (DSP) sein. In einigen Ausführungsformen umfasst die CPU 805 eine oder mehrere integrierte 3D-Schaltungen (3DICs) (z.B. 3D-Packaging (auf Wafer-Ebene (3DWLP), Integration auf 3D-Zwischenschaltungsgrundlage, gestapelte 3D-ICs (3D-SICs), monolithische 3D-ICs, heterogene 3D-Integration, 3D-System-in-Package- (3DSiP), und/oder Package-on-Package- (PoP) CPU-Konfigurationen). Der Arbeitsspeicher 825 ist im Allgemeinen als repräsentativ für einen Direktzugriffsspeicher (z.B. statischer Direktzugriffsspeicher (SRAM), dynamischer Direktzugriffsspeicher (DRAM) oder Flash-Speicher) aufgeführt. Der Speicher 830 ist im Allgemeinen als repräsentativ für einen nicht flüchtigen Arbeitsspeicher aufgeführt, wie zum Beispiel ein Festplattenlaufwerk, eine Solid-State-Einheit (SSD), austauschbare Speicherkarten, ein optischer Speicher oder Flash-Speichereinheiten. In einer alternativen Ausführungsform kann der Speicher 830 durch Speicherbereichsnetzwerk- (SAN) Einheiten, die Cloud oder andere Einheiten ersetzt werden, die mit dem Computer 800 über eine E/A-Einheitenschnittstelle 810 oder das Netzwerk 850 über die Netzwerkschnittstelle 815 verbunden sind.
  • In einigen Ausführungsformen speichert der Arbeitsspeicher 825 Anweisungen 860. In verschiedenen Ausführungsformen sind die Anweisungen 860 jedoch teilweise im Arbeitsspeicher 825 und teilweise im Speicher 830 gespeichert, oder sie sind vollständig im Arbeitsspeicher 825 oder vollständig im Speicher 830 gespeichert, oder auf sie wird über das Netzwerk 850 über die Netzwerkschnittstelle 815 zugegriffen.
  • Die Anweisungen 860 können durch einen Computer lesbare und durch einen Computer ausführbare Anweisungen zum Durchführen eines oder aller Abschnitte der Verfahren von 3 bis 5 und/oder zum Umsetzen der Funktionalität sein, die in 1 bis 2 und/oder 6 bis 7 erörtert wurde. In einigen Ausführungsformen können die Anweisungen 860 als Vorhersageprotokoll für nicht lineare Leistungsverschlechterung (oder -anweisungen, -mechanismus usw.) oder als Ausfallvorhersageprotokoll (oder -anweisungen, -mechanismus usw.) bezeichnet werden. Obwohl die Anweisungen 860 im Arbeitsspeicher 825 gezeigt sind, können die Anweisungen 860 Programmanweisungen umfassen, die insgesamt auf zahlreichen, durch einen Computer lesbaren Medien gespeichert und durch eine oder mehrere CPUs 802 ausführbar sind.
  • In verschiedenen Ausführungsformen umfassen die E/A-Einheiten 812 eine Schnittstelle, die fähig ist, Informationen darzustellen und Eingaben zu empfangen. Zum Beispiel können die E/A-Einheiten 812 Informationen für einen Benutzer darstellen, der mit dem Computer 800 interagiert, und Eingaben von dem Benutzer empfangen.
  • Der Computer 800 ist mit dem Netzwerk 850 über die Netzwerkschnittstelle 815 verbunden. Das Netzwerk 850 kann ein physisches, drahtloses, zellulares oder ein anderes Netzwerk aufweisen.
  • Obwohl diese Offenbarung eine ausführliche Beschreibung von Cloud Computing enthält, sollte klar sein, dass die Umsetzung der hierin angeführten Lehren nicht auf eine Cloud-Computing-Umgebung beschränkt ist. Stattdessen können Ausführungsformen der vorliegenden Erfindung gemeinsam mit jedem beliebigen Typ von jetzt bekannter oder später entwickelter Datenverarbeitungsumgebung umgesetzt werden.
  • Cloud Computing ist ein Dienstbereitstellungsmodell zum Ermöglichen eines problemlosen bedarfsgesteuerten Netzwerkzugriffs auf einen gemeinsam genutzten Pool von konfigurierbaren Datenverarbeitungsressourcen (z.B. Netzwerke, Netzwerkbandbreite, Server, Verarbeitung, Arbeitsspeicher, Speicher, Anwendungen, virtuelle Maschinen und Dienste), die mit minimalem Verwaltungsaufwand bzw. minimaler Interaktion mit einem Anbieter des Dienstes schnell bereitgestellt und freigegeben werden können. Dieses Cloud-Modell kann mindestens fünf Eigenschaften, mindestens drei Dienstmodelle und mindestens vier Nutzungsmodelle umfassen.
  • Die Eigenschaften sind wie folgt:
    • On-Demand Self-Service: Ein Cloud-Nutzer kann einseitig automatisch nach Bedarf für Datenverarbeitungsfunktionen wie Serverzeit und Netzwerkspeicher sorgen, ohne dass eine menschliche Interaktion mit dem Anbieter des Dienstes erforderlich ist.
    • Broad Network Access: Es sind Funktionen über ein Netzwerk verfügbar, auf die durch Standardmechanismen zugegriffen wird, welche die Verwendung durch heterogene Thin- oder Thick-Client-Plattformen (z.B. Mobiltelefone, Laptops und PDAs) unterstützen.
    • Resource-Pooling: Die Datenverarbeitungsressourcen des Anbieters werden zusammengeschlossen, um mehreren Nutzern unter Verwendung eines Multi-Tenant-Modells zu dienen, wobei verschiedene physische und virtuelle Ressourcen dynamisch nach Bedarf zugewiesen und neu zugewiesen werden. Es gibt eine gefühlte Standortunabhängigkeit, da der Nutzer allgemein keine Kontrolle bzw. Kenntnis über den genauen Standort der bereitgestellten Ressourcen hat, aber in der Lage sein kann, einen Standort auf einer höheren Abstraktionsebene festzulegen (z.B. Land, Staat oder Rechenzentrum).
  • Rapid Elasticity: Funktionen können für eine schnelle horizontale Skalierung (scale out) schnell und elastisch bereitgestellt werden, in einigen Fällen auch automatisch, und für ein schnelles Scale-in schnell freigegeben werden. Für den Nutzer erscheinen die für das Bereitstellen verfügbaren Funktionen häufig unbegrenzt, und sie können jederzeit in jeder beliebigen Menge gekauft werden.
  • Measured Service: Cloud-Systeme steuern und optimieren die Verwendung von Ressourcen automatisch, indem sie eine Messfunktion auf einer gewissen Abstraktionsebene nutzen, die für die Art von Dienst geeignet ist (z.B. Speicher, Verarbeitung, Bandbreite sowie aktive Benutzerkonten). Der Ressourcen-Verbrauch kann überwacht, gesteuert und gemeldet werden, wodurch sowohl für den Anbieter als auch für den Nutzer des verwendeten Dienstes Transparenz geschaffen wird.
  • Die Dienstmodelle sind wie folgt:
    • Software as a Service (SaaS): Die dem Nutzer bereitgestellte Funktion besteht darin, die in einer Cloud-Infrastruktur laufenden Anwendungen des Anbieters zu verwenden. Die Anwendungen sind über eine Thin-Client-Schnittstelle wie einen Web-Browser (z.B. eine auf dem Web beruhende eMail) von verschiedenen Client-Einheiten her zugänglich. Der Nutzer verwaltet bzw. steuert die zugrunde liegende Cloud-Infrastruktur nicht, darunter das Netzwerk, Server, Betriebssysteme, Speicher bzw. sogar einzelne Anwendungsfunktionen, mit der möglichen Ausnahme von eingeschränkten benutzerspezifischen Anwendungskonfigurationseinstellungen.
    • Platform as a Service (PaaS): Die dem Nutzer bereitgestellte Funktion besteht darin, durch einen Nutzer erstellte bzw. erhaltene Anwendungen, die unter Verwendung von durch den Anbieter unterstützten Programmiersprachen und Tools erstellt wurden, in der Cloud-Infrastruktur einzusetzen. Der Nutzer verwaltet bzw. steuert die zugrunde liegende Cloud-Infrastruktur nicht, darunter Netzwerke, Server, Betriebssysteme bzw. Speicher, hat aber die Kontrolle über die eingesetzten Anwendungen und möglicherweise über Konfigurationen des Application Hosting Environment.
    • Infrastructure as a Service (laaS): Die dem Nutzer bereitgestellte Funktion besteht darin, Verarbeitung, Speicher, Netzwerke und andere grundlegende Datenverarbeitungsressourcen bereitzustellen, wobei der Nutzer in der Lage ist, beliebige Software einzusetzen und auszuführen, zu der Betriebssysteme und Anwendungen gehören können. Der Nutzer verwaltet bzw. steuert die zugrunde liegende Cloud-Infrastruktur nicht, hat aber die Kontrolle über Betriebssysteme, Speicher, eingesetzte Anwendungen und möglicherweise eingeschränkte Kontrolle über ausgewählte Netzwerkkomponenten (z.B. Host-Firewalls).
  • Die Nutzungsmodelle sind wie folgt:
    • Private Cloud: Die Cloud-Infrastruktur wird ausschließlich für eine Organisation betrieben. Sie kann von der Organisation oder einer Drittpartei verwaltet werden und kann innerhalb oder außerhalb von Geschäftsräumen vorhanden sein.
    • Community Cloud: Die Cloud-Infrastruktur wird von mehreren Organisationen gemeinsam genutzt und unterstützt eine bestimmte Community, die gemeinsame Problemstellungen hat (z.B. Berücksichtigung von Zielsetzung, Sicherheitsanforderungen, Richtlinien und Konformität). Sie kann von den Organisationen oder einer Drittpartei verwaltet werden und kann innerhalb oder außerhalb der Geschäftsräume vorhanden sein.
    • Public Cloud: Die Cloud-Infrastruktur wird der allgemeinen Öffentlichkeit oder einer großen Industriegruppe zur Verfügung gestellt und gehört einer Organisation, die Cloud-Dienste verkauft.
    • Hybrid Cloud: Die Cloud-Infrastruktur ist eine Zusammensetzung aus zwei oder mehreren Clouds (privat, Benutzergemeinschaft oder öffentlich), die zwar einzelne Einheiten bleiben, aber durch eine standardisierte oder proprietäre Technologie miteinander verbunden sind, die eine Daten- und Anwendungsportierbarkeit ermöglicht (z.B. Cloud-Zielgruppenverteilung für den Lastausgleich zwischen Clouds).
  • Eine Cloud-Computing-Umgebung ist dienstorientiert, wobei der Schwerpunkt auf Statusunabhängigkeit, geringer Kopplung, Modularität und semantischer Interoperabilität liegt. Im Mittelpunkt von Cloud Computing steht eine Infrastruktur, die ein Netzwerk von miteinander verbundenen Knoten enthält.
  • Unter folgender Bezugnahme auf 9 wird eine veranschaulichende Cloud-Computing-Umgebung 50 dargestellt. Wie gezeigt, enthält die Cloud-Computing-Umgebung 50 einen oder mehrere Cloud-Computing-Knoten 10, mit denen lokale Datenverarbeitungseinheiten, die von Nutzern der Cloud verwendet werden, wie beispielsweise Personal Digital Assistant (PDA) oder Mobiltelefon 54A, Desktop-Computer 54B, Laptop-Computer 54C und/oder Fahrzeug-Computersystem 54N, Daten austauschen können. Die Knoten 10 können untereinander Daten austauschen. Sie können physisch oder virtuell in einem oder mehreren Netzwerken gruppiert sein (nicht gezeigt), wie beispielsweise Private, Community, Public oder Hybrid Cloud, wie hierin oben beschrieben, oder in einer Kombination davon. Damit hat die Cloud-Computing-Umgebung 50 die Möglichkeit, eine Infrastruktur, Plattformen und/oder Software als Dienste anzubieten, für die ein Cloud-Nutzer keinerlei Ressourcen auf einer lokalen Datenverarbeitungseinheit vorhalten muss. Es sollte klar sein, dass die in 9 gezeigten Typen von Datenverarbeitungseinheiten 54A bis N nur zur Veranschaulichung dienen sollen und dass die Datenverarbeitungsknoten 10 und die Cloud-Computing-Umgebung 50 mit jedem Typ einer computerisierten Einheit über jeden Typ von Netzwerk und/oder eine über ein Netzwerk adressierbare Verbindung (z.B. unter Verwendung eines Web-Browsers) Daten austauschen können.
  • Unter folgender Bezugnahme auf 10 wird eine Gruppe von funktionalen Abstraktionsschichten gezeigt, die durch die Cloud-Computing-Umgebung 50 (9) bereitgestellt werden. Dabei sollte von Anfang an klar sein, dass die in 10 gezeigten Komponenten, Schichten und Funktionen lediglich zur Veranschaulichung dienen sollen und Ausführungsformen der Erfindung nicht darauf beschränkt sind. Wie dargestellt, werden die folgenden Schichten und entsprechenden Funktionen bereitgestellt:
  • Eine Hardware- und Software-Schicht 60 enthält Hardware- und Software-Komponenten. Zu Beispielen für Hardware-Komponenten zählen: Mainframes 61; Server auf Grundlage einer RISC- (Reduced Instruction Set Computer) Architektur 62; Server 63; Blade-Server 64; Speichereinheiten 65; und Netzwerke und vernetzte Komponenten 66. In einigen Ausführungsformen enthalten Software-Komponenten Software für Netzwerkanwendungsserver 67 und Datenbank-Software 68.
  • Eine Virtualisierungsschicht 70 stellt eine Abstraktionsschicht bereit, von der aus die folgenden beispielhaften virtuellen Entitäten bereitgestellt werden können: virtuelle Server 71; virtueller Speicher 72; virtuelle Netzwerke 73, einschließlich virtuelle private Netzwerke; virtuelle Anwendungen und Betriebssysteme 74; und virtuelle Clients 75.
  • In einem Beispiel kann eine Verwaltungsschicht 80 die im Folgenden beschriebenen Funktionen bereitstellen. Eine Ressourcenbereitstellung 81 sorgt für eine dynamische Beschaffung von Datenverarbeitungsressourcen und weiteren Ressourcen, die zum Ausführen von Aufgaben innerhalb der Cloud-Computing-Umgebung eingesetzt werden. Messung und Preisbestimmung 82 ermöglichen beim Einsatz von Ressourcen innerhalb der Cloud-Computing-Umgebung eine Kostenverfolgung und eine Abrechnung oder Rechnungsstellung für die Inanspruchnahme dieser Ressourcen. In einem Beispiel können diese Ressourcen Lizenzen für Anwendungssoftware umfassen. Eine Sicherheitsfunktion stellt eine Identitätsprüfung für Cloud-Nutzer und -Aufgaben sowie einen Schutz für Daten und andere Ressourcen bereit. Ein Benutzerportal 83 stellt den Zugang zur Cloud-Computing-Umgebung für Nutzer und Systemadministratoren bereit. Eine Service-Level- (Dienstgüte) Verwaltung 84 sorgt für Zuweisung und Verwaltung von Cloud-Computing-Ressourcen, sodass erforderliche Service-Levels eingehalten werden. Planung und Vertragserfüllung des Service Level Agreement (SLA) (Dienstgütevereinbarung) 85 stellen eine Vorab-Vereinbarung für und Beschaffung von Cloud-Computing-Ressourcen bereit, für die gemäß eines SLA eine zukünftige Anforderung erwartet wird.
  • Eine Arbeitslastenschicht 90 stellt Beispiele für eine Funktionalität bereit, für welche die Cloud-Computing-Umgebung genutzt werden kann. Zu Beispielen von Arbeitslasten und Funktionen, die von dieser Schicht aus bereitgestellt werden können, zählen: Zuordnung und Navigation 91; Software-Entwicklung und Lifecycle-Management 92; Bereitstellung von virtuellen Schulungen 93; Datenanalyseverarbeitung 94; Transaktionsverarbeitung 95; und nicht lineare Vorhersage von Leistungsverschlechterung 96.
  • Bei Ausführungsformen der vorliegenden Erfindung kann es sich um ein System, ein Verfahren und/oder ein Computerprogrammprodukt auf jeder möglichen technischen Detailintegrationsebene handeln. Das Computerprogrammprodukt kann ein durch einen Computer lesbares Speichermedium (oder -medien) enthalten, auf dem durch einen Computer lesbare Programmanweisungen gespeichert sind, um einen Prozessor dazu zu veranlassen, Aspekte der vorliegenden Erfindung auszuführen.
  • Bei dem durch einen Computer lesbaren Speichermedium kann es sich um eine physische Einheit handeln, die Anweisungen zur Verwendung durch eine Einheit zum Ausführen von Anweisungen beibehalten und speichern kann. Das durch einen Computer lesbare Speichermedium kann zum Beispiel eine elektronische Speichereinheit, eine magnetische Speichereinheit, eine optische Speichereinheit, eine elektromagnetische Speichereinheit, eine Halbleiter-Speichereinheit oder jede geeignete Kombination aus dem Vorgenannten sein, es ist aber nicht darauf beschränkt. Zu einer nicht erschöpfenden Liste von spezifischeren Beispielen des durch einen Computer lesbaren Speichermediums gehören die Folgenden: eine tragbare Computerdiskette, eine Festplatte, ein Direktzugriffsspeicher (RAM), ein Nur-Lese-Speicher (ROM), ein löschbarer programmierbarer Nur-Lese-Speicher (EPROM bzw. Flash-Speicher), ein statischer Direktzugriffsspeicher (SRAM), ein tragbarer CD-ROM, eine DVD, ein Speicher-Stick, eine Diskette, eine mechanisch codierte Einheit wie zum Beispiel Lochkarten oder erhabene Strukturen in einer Rille, auf denen Anweisungen gespeichert sind, und jede geeignete Kombination des Vorgenannten. Ein durch einen Computer lesbares Speichermedium soll, wie hierin verwendet, nicht als flüchtige Signale an sich aufgefasst werden, wie zum Beispiel Funkwellen oder andere sich frei ausbreitende elektromagnetische Wellen, elektromagnetische Wellen, die sich durch einen Wellenleiter oder andere Übertragungsmedien ausbreiten (z.B. durch ein Lichtwellenleiterkabel geleitete Lichtimpulse) oder durch einen Draht übertragene elektrische Signale.
  • Hierin beschriebene durch einen Computer lesbare Programmanweisungen können von einem durch einen Computer lesbaren Speichermedium auf jeweilige Datenverarbeitungs-/Verarbeitungseinheiten oder über ein Netzwerk wie zum Beispiel das Internet, ein lokales Netzwerk, ein Weitverkehrsnetzwerk und/oder ein drahtloses Netzwerk auf einen externen Computer oder eine externe Speichereinheit heruntergeladen werden. Das Netzwerk kann Kupferübertragungskabel, Lichtwellenübertragungsleiter, drahtlose Übertragung, Leitwegrechner, Firewalls, Vermittlungseinheiten, Gateway-Computer und/oder Edge-Server aufweisen. Eine Netzwerkadapterkarte oder Netzwerkschnittstelle in jeder Datenverarbeitungs-/Verarbeitungseinheit empfängt durch einen Computer lesbare Programmanweisungen aus dem Netzwerk und leitet die durch einen Computer lesbaren Programmanweisungen zur Speicherung in einem durch einen Computer lesbaren Speichermedium innerhalb der entsprechenden Datenverarbeitungs-/Verarbeitungseinheit weiter.
  • Bei durch einen Computer lesbaren Programmanweisungen zum Ausführen von Arbeitsschritten der vorliegenden Erfindung kann es sich um Assembler-Anweisungen, ISA-Anweisungen (Instruction-Set-Architecture), Maschinenanweisungen, maschinenabhängige Anweisungen, Mikrocode, Firmware-Anweisungen, zustandssetzende Daten, Konfigurationsdaten für integrierte Schaltungen oder entweder Quellcode oder Objektcode handeln, die in einer beliebigen Kombination aus einer oder mehreren Programmiersprachen geschrieben sind, darunter objektorientierte Programmiersprachen wie Smalltalk, C++ o.ä. sowie prozedurale Programmiersprachen wie die Programmiersprache „C“ oder ähnliche Programmiersprachen. Die durch einen Computer lesbaren Programmanweisungen können vollständig auf dem Computer des Benutzers, teilweise auf dem Computer des Benutzers, als eigenständiges Software-Paket, teilweise auf dem Computer des Benutzers und teilweise auf einem entfernt angeordneten Computer oder vollständig auf dem entfernt angeordneten Computer oder Server ausgeführt werden. In dem letzteren Szenario kann der entfernt angeordnete Computer mit dem Computer des Benutzers über jeden Typ von Netzwerk verbunden werden, einschließlich ein lokales Netzwerk (LAN) oder ein Weitverkehrsnetzwerk (WAN), oder die Verbindung kann zu einem externen Computer hergestellt werden (zum Beispiel über das Internet unter Nutzung eines Internet-Dienstanbieters). In einigen Ausführungsformen können elektronische Schaltungen, darunter zum Beispiel programmierbare Logikschaltungen, feldprogrammierbare Gatter-Anordnungen (FPGA, field programmable gate arrays) oder programmierbare Logikanordnungen (PLA, programmable logic arrays) die computerlesbaren Programmanweisungen ausführen, indem sie Zustandsinformationen der computerlesbaren Programmanweisungen nutzen, um die elektronischen Schaltungen zu personalisieren, um Aspekte der vorliegenden Erfindung durchzuführen.
  • Aspekte der vorliegenden Erfindung werden hierin unter Bezugnahme auf Veranschaulichungen von Ablaufplänen und/oder Blockschaubildern von Verfahren, Vorrichtungen (Systemen) und Computerprogrammprodukten gemäß Ausführungsformen der Erfindung beschrieben. Es sollte klar sein, dass jeder Block der Ablaufplanveranschaulichungen und/oder der Blockschaubilder und Kombinationen von Blöcken in den Ablaufplanveranschaulichungen und/oder den Blockschaubildern mittels durch einen Computer lesbare Programmanweisungen umgesetzt werden können.
  • Diese durch einen Computer lesbaren Programmanweisungen können einem Prozessor eines Universalcomputers, eines Spezialcomputers oder einer anderen programmierbaren Datenverarbeitungsvorrichtung bereitgestellt werden, um eine Maschine zu erzeugen, sodass die über den Prozessor des Computers bzw. eine andere programmierbare Datenverarbeitungsvorrichtung ausgeführten Anweisungen ein Mittel zur Umsetzung der in dem Block bzw. den Blöcken der Ablaufpläne und/oder der Blockschaubilder angegebenen Funktionen/Schritte erzeugen. Diese durch einen Computer lesbaren Programmanweisungen können auch auf einem durch einen Computer lesbaren Speichermedium gespeichert sein, das einen Computer, eine programmierbare Datenverarbeitungsvorrichtung und/oder andere Einheiten so steuern kann, dass sie auf eine bestimmte Art funktionieren, sodass das durch einen Computer lesbare Speichermedium, auf dem Anweisungen gespeichert sind, ein Herstellungsprodukt aufweist, darunter Anweisungen, die Aspekte der/des in dem Block bzw. den Blöcken des Ablaufplans und/oder der Blockschaubilder angegebenen Funktion/Schritts umsetzen.
  • Die durch einen Computer lesbaren Programmanweisungen können auch auf einen Computer, eine andere programmierbare Datenverarbeitungsvorrichtung oder eine andere Einheit geladen werden, um das Ausführen einer Reihe von Operationsschritten auf dem Computer bzw. der anderen programmierbaren Vorrichtung oder anderen Einheit zu verursachen, um einen durch einen Computer umgesetzten Prozess zu erzeugen, sodass die auf dem Computer, einer anderen programmierbaren Vorrichtung oder einer anderen Einheit ausgeführten Anweisungen die in dem Block bzw. den Blöcken der Ablaufpläne und/oder der Blockschaubilder angegebenen Funktionen/Schritte umsetzen.
  • Die Ablaufpläne und Blockschaubilder in den Figuren veranschaulichen die Architektur, die Funktionalität und den Betrieb möglicher Ausführungen von Systemen, Verfahren und Computerprogrammprodukten gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung. In diesem Zusammenhang kann jeder Block in den Ablaufplänen oder den Blockschaubildern ein Modul, ein Segment oder einen Teil von Anweisungen darstellen, die eine oder mehrere ausführbare Anweisungen zum Umsetzen der bestimmten logischen Funktion(en) aufweisen. In einigen alternativen Umsetzungen können die in dem Block angegebenen Funktionen in einer anderen Reihenfolge als in den Figuren gezeigt auftreten. Zum Beispiel können zwei nacheinander gezeigte Blöcke tatsächlich im Wesentlichen parallel ausgeführt werden, oder die Blöcke können manchmal in der umgekehrten Reihenfolge ausgeführt werden, was von der beteiligten Funktionalität abhängt. Es ist ferner anzumerken, dass jeder Block der Blockschaubilder und/oder der Ablaufplandarstellungen sowie Kombinationen von Blöcken in den Blockschaubildern und/oder der Ablaufplandarstellung durch spezielle auf Hardware beruhende Systeme umgesetzt werden können, welche die angegebenen Funktionen oder Handlungen durchführen oder Kombinationen aus Spezial-Hardware und Computeranweisungen ausführen.
  • Während klar ist, dass die Prozess-Software (z.B. alle Anweisungen, die in den Anweisungen 860 von 8 gespeichert sind und/oder jede Software, die so konfiguriert ist, dass sie jeden Abschnitt des unter Bezugnahme auf 3 bis 5 beschriebenen Verfahrens durchführt und/oder jeden Abschnitt der in 1 bis 2 und/oder 6 bis 7 erörterten Funktionalität umsetzt) bereitgestellt werden kann, indem sie manuell direkt in den Client, einen Server und Proxy-Computer über ein Laden eines Speichermediums wie eine CD, DVD usw. geladen wird, kann die Prozess-Software auch automatisch oder halbautomatisch in einem Computersystem bereitgestellt werden, indem die Prozess-Software an einen zentralen Server oder eine Gruppe von zentralen Servern gesendet wird. Die Prozess-Software wird dann in die Client-Computer heruntergeladen, die die Prozess-Software ausführen. Alternativ wird die Prozess-Software per eMail direkt an das Client-System gesendet. Die Prozess-Software wird entweder in einem Verzeichnis abgelegt oder in ein Verzeichnis geladen, indem ein Satz von Programmanweisungen ausgeführt wird, der die Prozess-Software in einem Verzeichnis ablegt. Eine weitere Alternative ist, die Prozess-Software direkt zu einem Verzeichnis auf der Client-Computer-Festplatte zu senden. Wenn Proxy-Server vorhanden sind, wählt der Prozess den Proxy-Servercode, bestimmt, auf welche Computer der Code der Proxy-Server gestellt werden soll, sendet den Proxy-Servercode und installiert den Proxy-Servercode anschließend auf dem Proxy-Computer. Die Prozess-Software wird an den Proxy-Server gesendet und wird anschließend auf dem Proxy-Server gespeichert.
  • Ausführungsformen der vorliegenden Erfindung können auch als Teil einer Dienstvereinbarung mit einem Kundenunternehmen, einer gemeinnützigen Organisation, einer Regierungsbehörde, einer internen Organisationsstruktur oder dergleichen bereitgestellt werden. Diese Ausführungsformen können ein Konfigurieren eines Computersystems umfassen, um Software, Hardware und Web-Dienste auszuführen und bereitzustellen, die einige oder alle der hierin beschriebenen Verfahren umsetzen. Diese Ausführungsformen können auch ein Analysieren der Operation des Kunden, Erstellen von Empfehlungen in Reaktion auf die Analyse, Erstellen von Systemen, die Teilbereiche der Empfehlungen umsetzen, Integrieren der Systeme in vorhandene Prozesse und die Infrastruktur, Messen der Nutzung der Systeme, Zuweisen von Kosten zu Nutzern der Systeme, und Fakturieren, Rechnungsstellung (z.B. Generieren einer Rechnung) oder auf andere Weise Empfangen von Zahlungen für die Nutzung der Systeme umfassen.
  • Die hierin verwendete Terminologie dient nur zum Zweck der Beschreibung von bestimmten Ausführungsformen und soll die verschiedenen Ausführungsformen keinesfalls einschränken. Die hierin verwendeten Singularformen „ein“, „eine“ und „der/die/das“ sollen auch die Pluralformen mit einschließen, es sei denn, der Kontext gibt eindeutig anderes vor. Es versteht sich des Weiteren, dass die Begriffe „umfasst“ und/oder „umfassend“ bei Verwendung in dieser Patentschrift das Vorhandensein der ausgewiesenen Merkmale, Ganzzahlen, Schritte, Operationen, Elemente und/oder Komponenten angeben, das Vorhandensein oder die Hinzufügung von einem oder mehreren anderen Merkmalen, Ganzzahlen, Schritten, Vorgängen, Elementen, Komponenten und/oder Gruppen davon aber nicht ausschließen. In der vorhergehenden ausführlichen Beschreibung von beispielhaften Ausführungsformen der verschiedenen Ausführungsformen wird auf die begleitenden Zeichnungen Bezug genommen (in denen gleiche Bezugszeichen für gleiche Elemente stehen), die einen Bestandteil davon bilden und in denen spezifische beispielhafte Ausführungsformen, in denen die verschiedenen Ausführungsformen ausgeführt werden können, durch Veranschaulichung gezeigt werden. Diese Ausführungsformen wurden ausreichend detailliert beschrieben, um dem Fachmann ein Ausführen der Ausführungsformen zu ermöglichen, doch können auch andere Ausführungsformen verwendet werden, und logische, mechanische, elektrische und andere Änderungen können vorgenommen werden, ohne von dem Umfang der verschiedenen Ausführungsformen abzuweichen. In der vorhergehenden Beschreibung wurden zahlreiche spezifische Details dargelegt, um für ein umfassendes Verständnis der verschiedenen Ausführungsformen zu sorgen. Die verschiedenen Ausführungsformen können aber ohne diese spezifischen Details ausgeführt werden. In anderen Fällen wurden bekannte Schaltungen, Strukturen und Techniken nicht im Detail gezeigt, um die Ausführungsformen nicht unverständlich zu machen.
  • Verschiedene Fälle des Worts „Ausführungsform“, wie in dieser Patentschrift verwendet, müssen sich nicht notwendigerweise auf dieselbe Ausführungsform beziehen. Alle hierin veranschaulichten oder beschriebenen Daten und Datenstrukturen sind nur Beispiele, und in anderen Ausführungsformen können andere Datenmengen, Datentypen, Felder, Anzahlen und Typen von Feldern, Feldnamen, Anzahlen und Typen von Zeilen, Datensätze, Einträge oder Datenorganisationen verwendet werden, Außerdem können alle Daten mit Logik kombiniert werden, sodass eine separate Datenstruktur unter Umständen nicht notwendig ist. Die vorhergehende ausführliche Beschreibung ist daher nicht in einem einschränkenden Sinn aufzufassen.
  • Die Beschreibungen der verschiedenen Ausführungsformen der vorliegenden Offenbarung wurden zum Zweck der Veranschaulichung erstellt, sie sollen aber keineswegs erschöpfend oder auf die offenbarten Ausführungsformen eingeschränkt sein. Für Fachleute sind viele Modifizierungen und Variationen offenkundig, die nicht von dem Schutzumfang und Erfindungsgedanken der beschriebenen Ausführungsformen abweichen. Die hierin verwendete Terminologie wurde gewählt, um die Grundgedanken der Ausführungsformen, die praktische Anwendung oder technische Verbesserung gegenüber auf dem Markt gefundenen Technologien bestmöglich zu erklären oder es anderen Fachleuten zu ermöglichen, die hierin offenbarten Ausführungsformen zu verstehen.
  • Zwar wurde die vorliegende Offenbarung in Verbindung mit spezifischen Ausführungsformen davon beschrieben, doch wird davon ausgegangen, dass für den Fachmann Alternativen und Modifizierungen offensichtlich werden. Daher sollte klar sein, dass die folgenden Ansprüche so auszulegen sind, dass sie alle derartigen Alternativen und Modifizierungen abdecken, die unter den wahren Erfindungsgedanken und Schutzumfang der Offenbarung fallen.
  • Alle in der vorliegenden Offenbarung erörterten Vorteile sind Beispiele für Vorteile, und es können Ausführungsformen der vorliegenden Offenbarung vorhanden sein, die alle, einige oder keine der erörterten Vorteile verwirklichen, aber trotzdem innerhalb des Erfindungsgedankens und Schutzumfangs der vorliegenden Offenbarung verbleiben.
  • Eine nicht einschränkende Liste von Beispielen wird hierin im Folgenden bereitgestellt, um einige Aspekte der vorliegenden Offenbarung aufzuzeigen. Beispiel 1 ist ein durch einen Computer umgesetztes Verfahren. Das Verfahren weist ein Eingeben eines neuen Datenbeispiels in ein Ausfallvorhersagemodell auf, wobei das Ausfallvorhersagemodell durch Verwenden eines markierten historischen Datensatzes geschult wird, wobei jeweilige Datenpunkte einem Rückblickfenster und einem Vorhersagehorizont zugehörig sind, um jeweilige Schulungsbeispiele zu erstellen, wobei die jeweiligen Schulungsbeispiele zu Clustern in einer Mehrzahl von Clustern zusammengefasst werden, und wobei die Mehrzahl von Clustern jeweils einer Normalitätsbewertung und einer Anomaliebewertung zugehörig ist; und ein Ausgeben einer Klassifizierung, die dem neuen Datenbeispiel zugehörig ist auf Grundlage eines Vergleichens einer ersten Anomaliebewertung eines ersten Clusters der Mehrzahl von Clustern, der das neue Datenbeispiel umfasst, mit einer durchschnittlichen Anomaliebewertung von Clustern in der Mehrzahl von Clustern, deren Normalitätsbewertung größer als die Anomaliebewertung ist.
  • Beispiel 2 umfasst das Verfahren von Beispiel 1, das optionale Funktionen einschließt oder ausschließt. In diesem Beispiel ist die Klassifizierung für eine Wahrscheinlichkeit einer abnutzungsbedingten Leistungsverschlechterung einer Anlage indikativ, die dem neuen Datenbeispiel zugehörig ist.
  • Beispiel 3 umfasst das Verfahren von einem der Beispiele 1 bis 2, die optionale Funktionen einschließen oder ausschließen. In diesem Beispiel definiert das Rückblickfenster eine Menge von aufeinanderfolgenden vorherigen Datenpunkten, die in jedes jeweilige Schulungsbeispiel aufzunehmen sind.
  • Beispiel 4 umfasst das Verfahren von einem der Beispiele 1 bis 3, die optionale Funktionen einschließen oder ausschließen. In diesem Beispiel definiert der Vorhersagehorizont einen vorgegebenen Zeitraum in der Zukunft, und wobei jeweilige Markierungen von jeweiligen Datenpunkten in dem vorgegebenen Zeitraum in der Zukunft den jeweiligen Schulungsbeispielen zugehörig sind.
  • Beispiel 5 umfasst das Verfahren von einem der Beispiele 1 bis 4, die optionale Funktionen einschließen oder ausschließen. In diesem Beispiel werden die jeweiligen Schulungsbeispiele durch Verwenden von K-Means-Clustering zu Clustern zusammengefasst.
  • Beispiel 6 umfasst das Verfahren von einem der Beispiele 1 bis 5, die optionale Funktionen einschließen oder ausschließen. In diesem Beispiel wird das Verfahren durch ein Ausfallvorhersagesystem gemäß einer Software durchgeführt, die in das Ausfallvorhersagesystem aus einem entfernt angeordneten Datenverarbeitungssystem heruntergeladen wird. Optional weist das Verfahren ferner auf: Messen einer Nutzung der Software; und Generieren einer Rechnung auf Grundlage des Messens der Nutzung.
  • Beispiel 7 ist ein System. Das System umfasst einen oder mehrere Prozessoren; und ein oder mehrere durch einen Computer lesbare Speichermedien, die Programmanweisungen speichern, die bei Ausführung durch den einen oder die mehreren Prozessoren so konfiguriert sind, dass der eine oder die mehreren Prozessoren veranlasst wird bzw. werden, ein Verfahren auszuführen, das aufweist: Eingeben eines neuen Datenbeispiels in ein Ausfallvorhersagemodell, wobei das Ausfallvorhersagemodell durch Verwenden eines markierten historischen Datensatzes geschult wird, wobei jeweilige Datenpunkte einem Rückblickfenster und einem Vorhersagehorizont zugehörig sind, um jeweilige Schulungsbeispiele zu erstellen, wobei die jeweiligen Schulungsbeispiele in Clustern in einer Mehrzahl von Clustern zusammengefasst werden, und wobei die Mehrzahl von Clustern jeweils einer Normalitätsbewertung und einer Anomaliebewertung zugehörig ist; und Ausgeben einer Klassifizierung, die dem neuen Datenbeispiel zugehörig ist, auf Grundlage eines Vergleichens einer ersten Anomaliebewertung eines ersten Clusters von der Mehrzahl von Clustern, der das neue Datenbeispiel umfasst, mit einer durchschnittlichen Anomaliebewertung von Clustern in der Mehrzahl von Clustern, deren Normalitätsbewertung größer als die Anomaliebewertung ist.
  • Beispiel 8 umfasst das System von Beispiel 7, das optionale Funktionen einschließt oder ausschließt. In diesem Beispiel ist die Klassifizierung für eine Wahrscheinlichkeit einer abnutzungsbedingten Leistungsverschlechterung einer Anlage indikativ, die dem neuen Datenbeispiel zugehörig ist.
  • Beispiel 9 umfasst das System von einem der Beispiele 7 bis 8, die optionale Funktionen einschließen oder ausschließen. In diesem Beispiel definiert das Rückblickfenster eine Menge von aufeinanderfolgenden vorherigen Datenpunkten, die in jedes jeweilige Schulungsbeispiel aufzunehmen sind.
  • Beispiel 10 umfasst das System von einem der Beispiele 7 bis 9, die optionale Funktionen einschließen oder ausschließen. In diesem Beispiel definiert der Vorhersagehorizont einen vorgegebenen Zeitraum in der Zukunft, und wobei jeweilige Markierungen von jeweiligen Datenpunkten in dem vorgegebenen Zeitraum in der Zukunft den jeweiligen Schulungsbeispielen zugehörig sind.
  • Beispiel 11 umfasst das System von einem der Beispiele 7 bis 10, die optionale Funktionen einschließen oder ausschließen. In diesem Beispiel werden die jeweiligen Schulungsbeispiele durch Verwenden von K-Means-Clustering zu Clustern zusammengefasst.
  • Beispiel 12 ist ein Computerprogrammprodukt. Das Computerprogrammprodukt umfasst ein oder mehrere durch einen Computer lesbare Speichermedien und Programmanweisungen, die gemeinsam auf dem einen oder den mehreren durch einen Computer lesbaren Speichermedien gespeichert sind, wobei die Programmanweisungen Anweisungen aufweisen, die so konfiguriert sind, dass der eine oder die mehreren Prozessoren veranlasst wird bzw. werden, ein Verfahren durchzuführen, das ein Eingeben eines neuen Datenbeispiels in ein Ausfallvorhersagemodell umfasst, wobei das Ausfallvorhersagemodell durch Verwenden eines markierten historischen Datensatzes geschult wird, wobei jeweilige Datenpunkte einem Rückblickfenster und einem Vorhersagehorizont zugehörig sind, um jeweilige Schulungsbeispiele zu erstellen, wobei die jeweiligen Schulungsbeispiele in Clustern in einer Mehrzahl von Clustern zusammengefasst werden, und wobei die Mehrzahl von Clustern jeweils einer Normalitätsbewertung und einer Anomaliebewertung zugehörig ist; und ein Ausgeben einer Klassifizierung, die dem neuen Datenbeispiel zugehörig ist, auf Grundlage eines Vergleichens einer ersten Anomaliebewertung eines ersten Clusters der Mehrzahl von Clustern, der das neue Datenbeispiel umfasst, mit einer durchschnittlichen Anomaliebewertung von Clustern in der Mehrzahl von Clustern, deren Normalitätsbewertung größer als die Anomaliebewertung ist.
  • Beispiel 13 umfasst das Computerprogrammprodukt von Beispiel 12, das optionale Funktionen einschließt oder ausschließt. In diesem Beispiel ist die Klassifizierung für eine Wahrscheinlichkeit einer abnutzungsbedingten Leistungsverschlechterung einer Anlage indikativ, die dem neuen Datenbeispiel zugehörig ist.
  • Beispiel 14 umfasst das Computerprogrammprodukt eines der Beispiele 12 bis 13, die optionale Funktionen einschließen oder ausschließen. In diesem Beispiel definiert das Rückblickfenster eine Menge von aufeinanderfolgenden vorherigen Datenpunkten, die in jedes jeweilige Schulungsbeispiel aufzunehmen sind.
  • Beispiel 15 umfasst das Computerprogrammprodukt von einem der Beispiele 12 bis 14, die optionale Funktionen einschließen oder ausschließen. In diesem Beispiel definiert der Vorhersagehorizont einen vorgegebenen Zeitraum in der Zukunft, und wobei jeweilige Markierungen von jeweiligen Datenpunkten in dem vorgegebenen Zeitraum in der Zukunft den jeweiligen Schulungsbeispielen zugehörig sind.
  • Beispiel 16 umfasst das Computerprogrammprodukt von einem der Beispiele 12 bis 15, die optionale Funktionen einschließen oder ausschließen. In diesem Beispiel werden die jeweiligen Schulungsbeispiele durch Verwenden von K-Means-Clustering zu Clustern zusammengefasst.
  • Beispiel 17 ist ein durch einen Computer umgesetztes Verfahren zum Vorhersagen einer abnutzungsbedingten Schädigung von Exzenterschneckenpumpen (PCPs), wobei das Verfahren ein Eingeben eines neuen Datenbeispiels einer PCP in ein Modell aufweist, das konfiguriert ist, um eine abnutzungsbedingte Schädigung der PCP vorherzusagen, wobei das Modell durch Verwenden eines markierten historischen PCP-Datensatzes geschult wird, wobei jeweilige Datenpunkte einem Rückblickfenster und einem Vorhersagehorizont zugehörig sind, um jeweilige Schulungsbeispiele zu erstellen, wobei die jeweiligen Schulungsbeispiele zu Clustern in einer Mehrzahl von Clustern zusammengefasst werden, und wobei die Mehrzahl von Clustern jeweils einer Normalitätsbewertung und einer Anomaliebewertung zugehörig ist; und ein Ausgeben einer Klassifizierung, die dem neuen Datenbeispiel zugehörig ist, auf Grundlage eines Vergleichens einer ersten Anomaliebewertung eines ersten Clusters der Mehrzahl von Clustern, der das neue Datenbeispiel umfasst, mit einer durchschnittlichen Anomaliebewertung von Clustern in der Mehrzahl von Clustern, deren Normalitätsbewertung größer als die Anomaliebewertung ist, wobei die Klassifizierung für die abnutzungsbedingte Schädigung der PCP indikativ ist.
  • Beispiel 18 ist ein durch einen Computer umgesetztes Verfahren zum Vorhersagen einer abnutzungsbedingten Schädigung von Exzenterschneckenpumpen PCPs), wobei das Verfahren ein Generieren von markierten historischen Daten durch Durchführen einer binären Markierung von historischen Daten umfasst, die einer oder mehreren PCPs zugehörig sind; ein Generieren einer Mehrzahl von Schulungsdatenbeispielen durch Anwenden eines Rückblickfensters und eines Vorhersagehorizonts auf jeweilige Datenpunkte der markierten historischen Daten; ein Zusammenfassen der Mehrzahl von Schulungsdatenbeispielen zu einem Cluster in einer Mehrzahl von Clustern; ein Berechnen von Cluster-Bewertungen für jeweilige Cluster der Mehrzahl von Clustern; ein Zuweisen eines neuen Datenbeispiels einer PCP zu einem ersten Cluster der Mehrzahl von Clustern; und ein Zuweisen einer Klassifizierung zu dem neuen Datenbeispiel auf Grundlage von Cluster-Bewertungen, die dem ersten Cluster zugehörig sind, wobei die Klassifizierung für eine Wahrscheinlichkeit einer zukünftigen abnutzungsbedingten Schädigung der PCP indikativ ist.
  • Beispiel 19 umfasst das Verfahren von Beispiel 18, das optionale Funktionen einschließt oder ausschließt. In diesem Beispiel werden die markierten historischen Daten als fehlerhaft für einen vorgegebenen Zeitraum markiert, der vor einem bekannten Pumpenaustauschdatum liegt.
  • Beispiel 20 umfasst das Verfahren von einem der Beispiele 18 bis 19, die optionale Funktionen einschließen oder ausschließen. In diesem Beispiel weisen die markierten historischen Daten Pumpendrehzahldaten, Pumpendrehmomentdaten, Gehäusedruckdaten, Produktionsleistungsdaten und Instandhaltungsunterlagen auf.
  • Beispiel 21 umfasst das Verfahren von einem der Beispiele 18 bis 20, die optionale Funktionen einschließen oder ausschließen. In diesem Beispiel weist ein Berechnen der Cluster-Bewertungen für die jeweiligen Cluster ferner auf: Berechnen einer Normalitätsbewertung für das erste Cluster, wobei die Normalitätsbewertung ein erster Teil von Schulungsdatenbeispielen, die einem Normalzustand in dem ersten Cluster zugehörig sind, geteilt durch einen zweiten Teil von Schulungsdatenbeispielen ist, die dem Normalzustand in der Mehrzahl von Schulungsdatenbeispielen zugehörig sind; und Berechnen einer Anomaliebewertung für das erste Cluster, wobei die Anomaliebewertung ein dritter Teil von Schulungsdatenbeispielen, die einem verschlechterten Zustand in dem ersten Cluster zugehörig sind, geteilt durch einen vierten Teil von Schulungsdatenbeispielen ist, die dem verschlechterten Zustand in der Mehrzahl von Schulungsdatenbeispielen zugehörig sind. Optional beruht die Klassifizierung auf einem größeren Wert der Normalitätsbewertung oder der Anomaliebewertung für das erste Cluster.
  • Beispiel 22 umfasst das Verfahren von einem der Beispiele 18 bis 21, die optionale Funktionen einschließen oder ausschließen. In diesem Beispiel umfasst das Verfahren ein Generieren eines Ausfallsignals für das neue Datenbeispiel, wobei das Ausfallsignal eine durchschnittliche Anomaliebewertung für das neue Datenbeispiel über eine vorbestimmte Anzahl von vorherigen Datenpunkten aufweist. Optional weist ein Generieren des Ausfallsignals ferner auf: Berechnen einer mittleren Anomaliebewertung für Cluster der Mehrzahl von Clustern mit einer Normalitätsbewertung, die größer als eine Anomaliebewertung ist; für jeden der vorbestimmten Anzahl von vorherigen Datenpunkten Zuordnen eines Wertes Eins zu Datenpunkten mit einer Anomaliebewertung des ersten Clusters, die größer als die mittlere Anomaliebewertung ist, und Zuordnen eines Wertes Null zu Datenpunkten mit einer Anomaliebewertung des ersten Clusters, die kleiner als die mittlere Anomaliebewertung ist; und Berechnen des Ausfallsignals als einen Durchschnitt der Eins-Werte und Null-Werte, die jedem der vorbestimmten Anzahl von vorherigen Datenpunkten zugehörig sind.

Claims (34)

  1. Durch einen Computer umgesetztes Verfahren, das aufweist: Eingeben eines neuen Datenbeispiels in ein Ausfallvorhersagemodell, wobei das Ausfallvorhersagemodell durch Verwenden eines markierten historischen Datensatzes geschult wird, wobei jeweilige Datenpunkte einem Rückblickfenster und einem Vorhersagehorizont zugehörig sind, um jeweilige Schulungsbeispiele zu erstellen, wobei die jeweiligen Schulungsbeispiele zu einem Cluster in einer Mehrzahl von Clustern zusammengefasst werden, und wobei die Mehrzahl von Clustern jeweils einer Normalitätsbewertung und einer Anomaliebewertung zugehörig ist; und Ausgeben einer Klassifizierung, die dem neuen Datenbeispiel zugehörig ist, auf Grundlage eines Vergleichens einer ersten Anomaliebewertung eines ersten Clusters der Mehrzahl von Clustern, der das neue Datenbeispiel umfasst, mit einer durchschnittlichen Anomaliebewertung von Clustern der Mehrzahl von Clustern, deren Normalitätsbewertung größer als die Anomaliebewertung ist.
  2. Verfahren nach Anspruch 1, wobei die Klassifizierung für eine Wahrscheinlichkeit einer abnutzungsbedingten Leistungsverschlechterung einer Anlage indikativ ist, die dem neuen Datenbeispiel zugehörig ist.
  3. Verfahren nach Anspruch 1, wobei das Rückblickfenster eine Menge von aufeinanderfolgenden vorherigen Datenpunkten definiert, die in jedes jeweilige Schulungsbeispiel aufzunehmen sind.
  4. Verfahren nach Anspruch 1, wobei der Vorhersagehorizont einen vorgegebenen Zeitraum in der Zukunft definiert, und wobei jeweilige Markierungen von jeweiligen Datenpunkten in dem vorgegebenen Zeitraum in der Zukunft den jeweiligen Schulungsbeispielen zugehörig sind.
  5. Verfahren nach Anspruch 1, wobei die jeweiligen Schulungsbeispiele durch Verwenden von K-Means-Clustering zu Clustern zusammengefasst sind.
  6. Verfahren nach Anspruch 1, wobei das Verfahren durch ein Ausfallvorhersagesystem gemäß Software durchgeführt wird, die in das Ausfallvorhersagesystem aus einem entfernt angeordneten Datenverarbeitungssystem heruntergeladen wird.
  7. Verfahren nach Anspruch 6, wobei das Verfahren ferner aufweist: Messen einer Nutzung der Software; und Generieren einer Rechnung auf Grundlage eines Messens der Nutzung.
  8. Verfahren nach Anspruch 1, wobei das Verfahren zum Vorhersagen einer abnutzungsbedingten Schädigung von Exzenterschneckenpumpen (progressing cavity pumps) (PCPs) dient, wobei der Eingabeschritt ein Eingeben eines neuen Datenbeispiels einer PCP in ein Modell aufweist, das konfiguriert ist, um eine abnutzungsbedingte Schädigung der PCP vorherzusagen, wobei das Modell durch Verwenden eines markierten historischen PCP-Datensatzes geschult wird, und wobei die während des Ausgabeschritts ausgegebene Klassifizierung für die abnutzungsbedingte Schädigung der PCP indikativ ist.
  9. Verfahren nach Anspruch 8, das aufweist: Generieren der markierten historischen Daten durch Durchführen einer binären Markierung von historischen Daten, die einer oder mehreren PCPs zugehörig sind, wobei die Mehrzahl von Schulungsdatenbeispielen durch Anwenden eines Rückblickfensters und eines Vorhersagehorizonts auf jeweilige Datenpunkte der markierten historischen Daten erstellt wird, wobei das Verfahren aufweist: Berechnen von Cluster-Bewertungen, die für jeweilige Cluster der Mehrzahl von Clustern berechnet wurden, wobei es sich bei den Cluster-Bewertungen um die Normalitätsbewertung und die Anomaliebewertung handelt; Zuweisen der neuen Datenbeispiele einer PCP zu einem ersten Cluster der Mehrzahl von Clustern; und Zuweisen einer Klassifizierung zu dem neuen Datenbeispiel auf Grundlage von Cluster-Bewertungen, die dem ersten Cluster zugehörig sind.
  10. Verfahren nach Anspruch 9, wobei die markierten historischen Daten für einen vorgegebenen Zeitraum als fehlerhaft markiert werden, der vor einem bekannten Pumpenaustauschdatum liegt.
  11. Verfahren nach Anspruch 9, wobei die markierten historischen Daten Pumpendrehzahldaten, Pumpendrehmomentdaten, Gehäusedruckdaten, Produktionsleistungsdaten und Wartungsprotokolle aufweisen.
  12. Verfahren nach Anspruch 9, wobei das Berechnen der Cluster-Bewertungen für die jeweiligen Cluster ferner aufweist: Berechnen einer Normalitätsbewertung für das erste Cluster, wobei die Normalitätsbewertung ein erster Teil von Schulungsdatenbeispielen, die einem Normalzustand in dem ersten Cluster zugehörig sind, geteilt durch einen zweiten Teil von Schulungsdatenbeispielen ist, die dem Normalzustand in der Mehrzahl von Schulungsdatenbeispielen zugehörig sind; und Berechnen einer Anomaliebewertung für das erste Cluster, wobei die Anomaliebewertung ein dritter Teil von Schulungsdatenbeispielen, die einem verschlechterten Zustand in dem ersten Cluster zugehörig sind, geteilt durch einen vierten Teil von Schulungsdatenbeispielen ist, die dem verschlechterten Zustand in der Mehrzahl von Schulungsdatenbeispielen zugehörig sind.
  13. Verfahren nach Anspruch 12, wobei die Klassifizierung auf einem größeren Wert der Normalitätsbewertung oder der Anomaliebewertung für das erste Cluster beruht.
  14. Verfahren nach Anspruch 9, wobei das Verfahren ferner aufweist: Generieren eines Ausfallsignals für das neue Datenbeispiel, wobei das Ausfallsignal eine durchschnittliche Anomaliebewertung für das neue Datenbeispiel über eine vorbestimmte Anzahl von vorherigen Datenpunkten aufweist.
  15. Verfahren nach Anspruch 14, wobei das Generieren des Ausfallsignals ferner aufweist: Berechnen einer mittleren Anomaliebewertung für Cluster der Mehrzahl von Clustern mit einer Normalitätsbewertung, die größer als eine Anomaliebewertung ist; für jeden der vorbestimmten Anzahl von vorherigen Datenpunkten Zuordnen eines Wertes Eins zu Datenpunkten mit einer Anomaliebewertung des ersten Clusters, die größer als die mittlere Anomaliebewertung ist, und Zuordnen eines Wertes Null zu Datenpunkten mit einer Anomaliebewertung des ersten Clusters, die kleiner als die mittlere Anomaliebewertung ist; und Berechnen des Ausfallsignals als einen Durchschnitt der Eins-Werte und Null-Werte, die jedem von der vorbestimmten Anzahl von vorherigen Datenpunkten zugehörig ist.
  16. System, das aufweist: einen oder mehrere Prozessoren; und ein oder mehrere durch einen Computer lesbare Speichermedien, die Programmanweisungen speichern, die bei Ausführung durch den einen oder die mehreren Prozessoren so konfiguriert sind, dass der eine oder die mehreren Prozessoren veranlasst wird bzw. werden, ein Verfahren auszuführen, das aufweist: Eingeben eines neuen Datenbeispiels in ein Ausfallvorhersagemodell, wobei das Ausfallvorhersagemodell durch Verwenden eines markierten historischen Datensatzes geschult wird, wobei jeweilige Datenpunkte einem Rückblickfenster und einem Vorhersagehorizont zugehörig sind, um jeweilige Schulungsbeispiele zu erstellen, wobei die jeweiligen Schulungsbeispiele zu einem Cluster in einer Mehrzahl von Clustern zusammengefasst werden, und wobei die Mehrzahl von Clustern jeweils einer Normalitätsbewertung und einer Anomaliebewertung zugehörig sind; und Ausgeben einer Klassifizierung, die dem neuen Datenbeispiel zugehörig ist, auf Grundlage eines Vergleichens einer ersten Anomaliebewertung eines ersten Clusters von der Mehrzahl von Clustern, der das neue Datenbeispiel aufweist, mit einer durchschnittlichen Anomaliebewertung von Clustern in der Mehrzahl von Clustern, deren Normalitätsbewertung größer als die Anomaliebewertung ist.
  17. System nach Anspruch 16, wobei die Klassifizierung für eine Wahrscheinlichkeit einer abnutzungsbedingten Leistungsverschlechterung einer Anlage indikativ ist, die dem neuen Datenbeispiel zugehörig ist.
  18. System nach Anspruch 16, wobei das Rückblickfenster eine Menge von aufeinanderfolgenden vorherigen Datenpunkten definiert, die in jedes jeweilige Schulungsbeispiel aufzunehmen sind.
  19. System nach Anspruch 16, wobei der Vorhersagehorizont einen vorgegebenen Zeitraum in der Zukunft definiert, und wobei jeweilige Markierungen von jeweiligen Datenpunkten in dem vorgegebenen Zeitraum in der Zukunft den jeweiligen Schulungsbeispielen zugehörig sind.
  20. System nach Anspruch 16, wobei die jeweiligen Schulungsbeispiele durch Verwenden von K-Means-Clustering zu Clustern zusammengefasst werden.
  21. Computerprogrammprodukt, das ein oder mehrere durch einen Computer lesbare Speichermedien und Programmanweisungen aufweist, die gemeinsam auf dem einen oder den mehreren durch einen Computer lesbaren Speichermedien gespeichert sind, wobei die Programmanweisungen Anweisungen aufweisen, die so konfiguriert sind, dass sie einen oder mehrere Prozessoren veranlassen, ein Verfahren durchzuführen, das aufweist: Eingeben eines neuen Datenbeispiels in ein Ausfallvorhersagemodell, wobei das Ausfallvorhersagemodell durch Verwenden eines markierten historischen Datensatzes geschult wird, wobei jeweilige Datenpunkte einem Rückblickfenster und einem Vorhersagehorizont zugehörig sind, um jeweilige Schulungsbeispiele zu erstellen, wobei die jeweiligen Schulungsbeispiele zu einem Cluster in einer Mehrzahl von Clustern zusammengefasst werden, und wobei die Mehrzahl von Clustern jeweils einer Normalitätsbewertung und einer Anomaliebewertung zugehörig sind; und Ausgeben einer Klassifizierung, die dem neuen Datenbeispiel zugehörig ist, auf Grundlage eines Vergleichens einer ersten Anomaliebewertung eines ersten Clusters von der Mehrzahl von Clustern, der das neue Datenbeispiel aufweist, mit einer durchschnittlichen Anomaliebewertung von Clustern in der Mehrzahl von Clustern, deren Normalitätsbewertung größer als die Anomaliebewertung ist.
  22. Computerprogrammprodukt nach Anspruch 21, wobei die Klassifizierung für eine Wahrscheinlichkeit einer abnutzungsbedingten Leistungsverschlechterung einer Anlage indikativ ist, die dem neuen Datenbeispiel zugehörig ist.
  23. Computerprogrammprodukt nach Anspruch 21, wobei das Rückblickfenster eine Menge von aufeinanderfolgenden vorherigen Datenpunkten definiert, die in jedes jeweilige Schulungsbeispiel aufzunehmen sind.
  24. Computerprogrammprodukt nach Anspruch 21, wobei der Vorhersagehorizont einen vorgegebenen Zeitraum in der Zukunft definiert, und wobei jeweilige Markierungen von jeweiligen Datenpunkten in dem vorgegebenen Zeitraum in der Zukunft den jeweiligen Schulungsbeispielen zugehörig sind.
  25. Computerprogrammprodukt nach Anspruch 21, wobei die jeweiligen Schulungsbeispiele durch Verwenden von K-Means-Clustering zu Clustern zusammengefasst werden.
  26. Durch einen Computer umgesetztes Verfahren zum Vorhersagen einer abnutzungsbedingten Schädigung von Exzenterschneckenpumpen (PCPs), wobei das Verfahren aufweist: Eingeben eines neuen Datenbeispiels einer PCP in ein Modell, das konfiguriert ist, um eine abnutzungsbedingte Schädigung der PCP vorherzusagen, wobei das Modell durch Verwenden eines markierten historischen PCP-Datensatzes geschult wird, wobei jeweilige Datenpunkte einem Rückblickfenster und einem Vorhersagehorizont zugehörig sind, um jeweilige Schulungsbeispiele zu erstellen, wobei die jeweiligen Schulungsbeispiele zu Clustern in einer Mehrzahl von Clustern zusammengefasst werden, und wobei die Mehrzahl von Clustern jeweils einer Normalitätsbewertung und einer Anomaliebewertung zugehörig ist; und Ausgeben einer Klassifizierung, die dem neuen Datenbeispiel zugehörig ist, auf Grundlage eines Vergleichens einer ersten Anomaliebewertung eines ersten Clusters von der Mehrzahl von Clustern, der das neue Datenbeispiel aufweist, mit einer durchschnittlichen Anomaliebewertung von Clustern in der Mehrzahl von Clustern, deren Normalitätsbewertung größer als die Anomaliebewertung ist, wobei die Klassifizierung für die abnutzungsbedingte Schädigung der PCP indikativ ist.
  27. Durch einen Computer umgesetztes Verfahren zum Vorhersagen einer abnutzungsbedingten Schädigung von Exzenterschneckenpumpen (PCPs), wobei das Verfahren aufweist: Generieren von markierten historischen Daten durch Durchführen einer binären Markierung von historischen Daten, die einer oder mehreren PCPs zugehörig sind; Generieren einer Mehrzahl von Schulungsdatenbeispielen durch Anwenden eines Rückblickfensters und eines Vorhersagehorizonts auf jeweilige Datenpunkte der markierten historischen Daten; Zusammenfassen der Mehrzahl von Schulungsdatenbeispielen in Clustern in einer Mehrzahl von Clustern; Berechnen von Cluster-Bewertungen für jeweilige Cluster von der Mehrzahl von Clustern; Zuweisen eines neuen Datenbeispiels einer PCP zu einem ersten Cluster von der Mehrzahl von Clustern; und Zuweisen einer Klassifizierung zu dem neuen Datenbeispiel auf Grundlage von Cluster-Bewertungen, die dem ersten Cluster zugehörig sind, wobei die Klassifizierung für eine Wahrscheinlichkeit einer zukünftigen abnutzungsbedingten Schädigung der PCP indikativ ist.
  28. Verfahren nach Anspruch 27, wobei die markierten historischen Daten als fehlerhaft für einen vorgegebenen Zeitraum markiert werden, der vor einem bekannten Pumpenaustauschdatum liegt.
  29. Verfahren nach Anspruch 27, wobei die markierten historischen Daten Pumpendrehzahldaten, Pumpendrehmomentdaten, Gehäusedruckdaten, Produktionsleistungsdaten und Wartungsprotokolle aufweisen.
  30. Verfahren nach Anspruch 27, wobei ein Berechnen der Cluster-Bewertungen für die jeweiligen Cluster ferner aufweist: Berechnen einer Normalitätsbewertung für das erste Cluster, wobei die Normalitätsbewertung ein erster Teil von Schulungsdatenbeispielen, die einem Normalzustand in dem ersten Cluster zugehörig sind, geteilt durch einen zweiten Teil von Schulungsdatenbeispielen ist, die dem Normalzustand in der Mehrzahl von Schulungsdatenbeispielen zugehörig sind; und Berechnen einer Anomaliebewertung für das erste Cluster, wobei die Anomaliebewertung ein dritter Teil von Schulungsdatenbeispielen, die einem verschlechterten Zustand in dem ersten Cluster zugehörig sind, geteilt durch einen vierten Teil von Schulungsdatenbeispielen ist, die dem verschlechterten Zustand in der Mehrzahl von Schulungsdatenbeispielen zugehörig sind.
  31. Verfahren nach Anspruch 30, wobei die Klassifizierung auf einem größeren Wert der Normalitätsbewertung oder der Anomaliebewertung für das erste Cluster beruht.
  32. Verfahren nach Anspruch 27, wobei das Verfahren ferner aufweist: Generieren eines Ausfallsignals für das neue Datenbeispiel, wobei das Ausfallsignal eine durchschnittliche Anomaliebewertung für das neue Datenbeispiel über eine vorbestimmte Anzahl von vorherigen Datenpunkten aufweist.
  33. Verfahren nach Anspruch 32, wobei das Generieren des Ausfallsignals ferner aufweist: Berechnen einer mittleren Anomaliebewertung für Cluster der Mehrzahl von Clustern mit einer Normalitätsbewertung, die größer als eine Anomaliebewertung ist; für jeden der vorbestimmten Anzahl von vorherigen Datenpunkten Zuordnen eines Wertes Eins zu Datenpunkten mit einer Anomaliebewertung des ersten Clusters, die größer als die mittlere Anomaliebewertung ist, und Zuordnen eines Wertes Null zu Datenpunkten mit einer Anomaliebewertung des ersten Clusters, die kleiner als die mittlere Anomaliebewertung ist; und Berechnen des Ausfallsignals als einen Durchschnitt der Eins-Werte und Null-Werte, die jedem der vorbestimmten Anzahl von vorherigen Datenpunkten zugehörig sind.
  34. Computerprogramm, das Programmcodemittel aufweist, die angepasst sind, um das Verfahren nach einem der Ansprüche 1 bis 15 und einem der Ansprüche 26 bis 33 durchzuführen, wenn das Programm auf einem Computer ausgeführt wird.
DE112021002699.2T 2020-05-11 2021-05-05 Vorhersage von leistungsverschlechterung mit nicht linearen merkmalen Pending DE112021002699T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/871,359 2020-05-11
US16/871,359 US11175973B1 (en) 2020-05-11 2020-05-11 Prediction of performance degradation with non-linear characteristics
PCT/IB2021/053805 WO2021229371A1 (en) 2020-05-11 2021-05-05 Prediction of performance degradation with non-linear characteristics

Publications (1)

Publication Number Publication Date
DE112021002699T5 true DE112021002699T5 (de) 2023-03-02

Family

ID=78412675

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112021002699.2T Pending DE112021002699T5 (de) 2020-05-11 2021-05-05 Vorhersage von leistungsverschlechterung mit nicht linearen merkmalen

Country Status (10)

Country Link
US (1) US11175973B1 (de)
JP (1) JP2023525959A (de)
KR (1) KR20220154827A (de)
CN (1) CN115699037A (de)
AU (1) AU2021271205B2 (de)
CA (1) CA3175610A1 (de)
DE (1) DE112021002699T5 (de)
GB (1) GB2610965A (de)
IL (1) IL296764A (de)
WO (1) WO2021229371A1 (de)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11516096B2 (en) * 2020-06-17 2022-11-29 Red Hat, Inc. Automatically managing performance of software in a distributed computing environment
US11651254B2 (en) * 2020-07-07 2023-05-16 Intuit Inc. Inference-based incident detection and reporting
JP2022151193A (ja) * 2021-03-26 2022-10-07 横河電機株式会社 装置、方法およびプログラム
CN114389688B (zh) * 2022-01-04 2023-06-13 烽火通信科技股份有限公司 一种光模块性能预测的方法和装置
CN114697203B (zh) * 2022-03-31 2023-07-25 浙江省通信产业服务有限公司 一种网络故障的预判方法、装置、电子设备及存储介质
US11563487B1 (en) * 2022-08-19 2023-01-24 Frontier Communications Holdings, Llc Systems and methods for predicting times-to-failure of passive optical network components
CN117469152B (zh) * 2023-12-27 2024-04-12 宁德时代新能源科技股份有限公司 流体泵异常检测方法、装置、电子设备和存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8988236B2 (en) 2010-05-27 2015-03-24 University Of Southern California System and method for failure prediction for rod pump artificial lift systems
US9292799B2 (en) 2013-02-28 2016-03-22 Chevron U.S.A. Inc. Global model for failure prediction for artificial lift systems
CN104021264B (zh) 2013-02-28 2017-06-20 华为技术有限公司 一种缺陷预测方法及装置
US20170096889A1 (en) 2014-03-28 2017-04-06 Schlumberger Technology Corporation System and method for automation of detection of stress patterns and equipment failures in hydrocarbon extraction and production
TWI612433B (zh) 2016-11-17 2018-01-21 財團法人工業技術研究院 整體式學習預測裝置與方法、以及非暫存電腦可讀的儲存媒介
CA2991725A1 (en) 2018-01-10 2019-07-10 Psi Technologies Inc. Method and apparatus to predict failure and control vibrations in a subsurface artificial lift system
CN110276416B (zh) 2019-07-02 2023-04-28 广东省智能机器人研究院 一种滚动轴承故障预测方法
US10975841B2 (en) * 2019-08-02 2021-04-13 Uptake Technologies, Inc. Computer system and method for detecting rotor imbalance at a wind turbine
CN110570012B (zh) 2019-08-05 2022-05-20 华中科技大学 一种基于Storm的电厂生产设备故障预警方法及系统

Also Published As

Publication number Publication date
JP2023525959A (ja) 2023-06-20
US11175973B1 (en) 2021-11-16
WO2021229371A1 (en) 2021-11-18
AU2021271205B2 (en) 2024-01-04
CN115699037A (zh) 2023-02-03
GB202218236D0 (en) 2023-01-18
AU2021271205A1 (en) 2022-11-10
KR20220154827A (ko) 2022-11-22
GB2610965A (en) 2023-03-22
IL296764A (en) 2022-11-01
CA3175610A1 (en) 2021-11-18
US20210349772A1 (en) 2021-11-11

Similar Documents

Publication Publication Date Title
DE112021002699T5 (de) Vorhersage von leistungsverschlechterung mit nicht linearen merkmalen
CN105677538B (zh) 一种基于故障预测的云计算系统自适应监测方法
US9454855B2 (en) Monitoring and planning for failures of vehicular components
US9286735B1 (en) Generating cumulative wear-based indicators for vehicular components
US8988237B2 (en) System and method for failure prediction for artificial lift systems
US10235399B2 (en) Methods and systems for determining hardware sizing for storage array systems
US20210192586A1 (en) Systems and Methods for Detecting and Responding to Anomalous Traffic Conditions
CA2968229C (en) Statistically equivalent level of safety modeling
US8903757B2 (en) Proactive information technology infrastructure management
Pennel et al. Detecting failures and optimizing performance in artificial lift using machine learning models
CN105190564A (zh) 通过用线程强度分析进行季节性趋向和预报来对云服务中的sla违反进行预测性诊断
DE112010004420T5 (de) Verfahren und System zur Verbesserung der Ausführungszeit von Software durch Optimierung elnes Leistungsmodells
US11449798B2 (en) Automated problem detection for machine learning models
DE112020002987T5 (de) Bereitstellen von mikrodiensten über eine dienstinfrastruktur hinweg
DE102019218138A1 (de) Ein proaktives und automatisiertes System und Verfahren davon zum Reparieren eines suboptimalen Betriebs einer Maschine
Gupta et al. Big data analytics workflow to safeguard ESP operations in real-time
DE112021001566T5 (de) Ermitteln von abhängigkeiten multivariater zeitreihendaten
CN108255671A (zh) 计算机系统的应用的监视和警告机制
US11796991B2 (en) Context-awareness in preventative maintenance
US20210097432A1 (en) Gpu code injection to summarize machine learning training data
CN111369056A (zh) 地质灾害预测方法及电子设备
CN114202256A (zh) 架构升级预警方法、装置、智能终端及可读存储介质
WO2021067385A1 (en) Debugging and profiling of machine learning model training
US11227288B1 (en) Systems and methods for integration of disparate data feeds for unified data monitoring
US20230111036A1 (en) Integrated drilling dysfunction prediction

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R084 Declaration of willingness to licence