WO2009015655A2

WO2009015655A2 - Verfahren und vorrichtung zur automatischen mustererkennung

Info

Publication number: WO2009015655A2
Application number: PCT/DE2008/001256
Authority: WO
Inventors: Clemens GÜHMANN; Steffen KÜHN
Original assignee: Technische Universität Berlin
Priority date: 2007-07-31
Filing date: 2008-07-31
Publication date: 2009-02-05
Also published as: DE102007036277A1; US20100217572A1; WO2009015655A3; EP2174267A2

Abstract

Die Erfindung betrifft ein Verfahren zur automatischen Mustererkennung in einer Sequenz elektronischer Daten mittels elektronischer Datenverarbeitung in einem Datenverarbeitungssystem, bei dem in einer Analyse die Sequenz elektronischer Daten mit parametrisierten Modelldaten verglichen wird, die wenigstens eine Mustersequenz repräsentieren, und bei dem die wenigstens eine Mustersequenz erkannt wird, wenn bei der Analyse ermittelt wird, dass von den parametrisierten Modelldaten umfasste Modelldaten, welche der wenigstens einen Mustersequenz zugeordnet sind, mit einem eine Ähnlichkeitsmaßschwelle überschreitenden Ähnlichkeitsmaß auftreten, wobei beim Bilden der parametrisierten Modelldaten Trainingsdaten mittels eines Dynamic-Time-Warping-Verfahrens zu einem Satz von Merkmalsvektoren gleicher Länge und mit einem gleichen Informationsgehalt wie die Trainingsdaten verarbeitet werden, aus denen die parametrisierten Modelldaten abgeleitet werden. Ferner betrifft die Erfindung eine Vorrichtung zur automatischen Mustererkennung in einer Sequenz elektronischer Daten mittels elektronischer Datenverarbeitung mit einem Datenverarbeitungssystem.

Description

Verfahren und Vorrichtung zur automatischen Mustererkennung

Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur automatischen Mustererkennung in einer Sequenz elektronischer Daten mittels elektronischer Datenverarbeitung in einem Datenverarbeitungssystem.

Hintergrund der Erfindung

Allgemein ist es das Ziel solcher Mustererkennung, das Auftreten von Sequenzen oder Folgen von Eigenschaften in sequentiell gebildeten elektronischen Daten herauszufinden. In einer Vielzahl praktischer Anwendungen sind die zu findenden Muster nicht exakt definierbar, da sie in ihrer Form und in ihrer Ausdehnung variieren können. Als Beispiel ist das Problem der maschinellen Spracherkennung zu nennen, da wesentliche Standardverfahren aus dem Stand der Technik im Kontext dieser Aufgabenstellung entwickelt wurden. Eine weitere Anwen- düng betrifft das Auffinden von Fehlermustern in Maschinensignalen. Zum Beispiel gehört hierzu das Erkennen von klopfenden Verbrennungen in Otto-Motoren anhand von Körperschallsignalen, bei dem sich ein sehr ähnliches Problem stellt (Lachmann et al.: Erkennung klopfender Verbrennungen aus gestörten Klopfsensorsignalen mittels Signaltrennung, Senso- rik im Kraftfahrzeug, Expert Verlag, 114-123). Die entwickelten Verfahren werden aber zum Beispiel auch beim Durchsuchen von KfZ-CAN-Bus-Daten nach Fehlermustern erforderlich (Isernhagen et al.: Intelligent signal processing in an automated measurement data analysis System. In Proceedings of the 2007 IEEE Symposium on Computational Intelligence in Image and Signal Processing (CHSP 2007), Seiten 83-87, 2007) oder beim Vergleich von Ist- und Sollwertkurvenverläufen bei der Spezifikationsüberprüfung (Rebeschieß et al.: Automatisier- ter closed-loop-Softwaretest eingebetteter Motorsteuerfunktionen, 11. Software & Systems Quality Conferences 2006, 7. ICS Test, 2006).

Im Bereich der Spracherkennung haben sich als Lösung für das Problem der Sequenzklassifikation die so genannten Hidden-Markov-Modelle (HMM) etabliert und stellen den Stand der Technik dar (Gernot: Mustererkennung mit Markov-Modellen, Teubner, 2003). Die grundlegende Idee besteht hierbei darin, eine Sequenz oder Folge als das Ergebnis einer Kette von Wahrscheinlichkeitsdichteverteilungen zu beschreiben. Weiterhin wird auch der Übergang von einer Verteilung zu nachfolgenden Verteilungen statistisch modelliert. HMMs werden daher auch als zweistufige stochastische Prozesse im Rahmen der Mustererkennung bezeichnet. Sie sind recht leistungsfähig, haben aber auch Nachteile.

Die Klassifikation und das Erkennen von Sequenzen oder Folgen unterscheiden sich schein- bar grundsätzlich von konventionellen Mustererkennungsaufgaben, bei denen Merkmalsvektoren fester Dimension analysiert werden. Solche Verfahren und Geräte zur Musterkennung sind beispielsweise aus den Dokumenten DE 694 25 166 T2, DE 697 04 201 T2 und DE 10 2006 045 218 Al, und darüber hinaus umfassend aus der Fachliteratur bekannt (vgl. zum Beispiel Duda et al.: Pattern Classification_^ John Wiley & Sons, 2000). Sie alle haben ge- meinsam, dass sie auf der Schätzung einer Wahrscheinlichkeitsverteilung pro Klasse oder wenigstens auf der Schätzung von Klassengrenzen aufbauen. HMMs sind deutlich anders, was durch die Verschiedenheit der zu analysierenden Datenstruktur bedingt ist. HMMs analysieren Sequenzen, das heißt Folgen von Merkmalen, Zahlenwerten, Symbolen oder Vektoren. Ein Problem besteht hierbei darin, dass die Mustersequenzen oder -folgen in der Regel in ihrer Länge variieren, wobei zwei verschieden lange Mustersequenzen oder -folgen der gleichen Klasse angehören können. Sequenzen sind somit keine Vektoren, das heißt, es existiert kein Merkmalsraum und es kann keine Wahrscheinlichkeitsverteilung bestimmt werden. Der Einsatz merkmalsvektorbasierter Klassifikatoren wird so verhindert.

Der Lösungsansatz von HMMs besteht darin, dass eine beobachtete Sequenz O = {x_/, ..., X_n) - die im Fachterminus der HMMs Observationsfolge genannt wird - die Realisierung einer Folge von Zufallsvariablen Su S₂, ■■-, S_m darstellt. Das impliziert eine zusätzliche verborgene Stufe, denn eine deterministische Zuordnung einer konkreten Observation x_t mit t e [l,nj zu einer Zufallsvariablen S_τ mit τ e [l,m] ist nicht möglich. Aus diesem Grund wird sie durch einen stochastischen Prozess beschrieben, welcher den Übergang von einer Zustandsvariablen zu einer anderen durch Übergangswahrscheinlichkeiten modelliert. Der speziellen Form der Daten ist damit Rechnung getragen. Aus dieser Architektur folgen aber auch einige Nachteile, denn die Zweistufigkeit erhöht die Komplexität gegenüber merkmalsvektorbasierten Klassifikatoren deutlich. Die Modellparameter müssen daher numerisch optimiert werden, was einer- seits nicht immer zu guten Parameterwerten fuhren muss und auch aufwendig ist.

Eine weitere Einschränkung von HMMs besteht darin, dass es sich um parametrische Modelle handelt, das heißt, sie geben einen einschränkenden Rahmen vor, der nicht immer zu den Da- ten passen muss. Parametrische Modelle sind daher oft gleichzeitig von Unter- und Überanpassung an die Beispieldaten betroffen. Als Beispiel wird an dieser Stelle daraufhingewiesen, dass HMMs grundsätzlich voraussetzen, dass die Markov-Eigenschaft erfüllt ist. Ein anderes Beispiel ist die Annahme der zeitlichen Invarianz innerhalb eines Zustandes. Beide Annah- men sind in der Regel niemals vollständig erfüllt, was eine grundsätzliche strukturbedingte Unteranpassung zur Folge hat.

Ein Mustererkennungsverfahren, welches sich mit der Erkennung von Merkmalssequenzen - konkret mit der Erkennung von Sprache - beschäftigt, ist in DE 697 11 392 T2 beschrieben. Ein weiteres Anwendungsgebiet der Mustererkennung von Merkmalssequenzen oder -folgen betrifft die Klopferkennung im Zusammenhang mit Motoren. Hierauf wird im Folgenden näher eingegangen.

Bei klopfenden Verbrennungen handelt es sich um ungewollte Abweichungen von der Nor- malverbrennung. Normale Verbrennungen werden durch den Funken der Zündkerze ausgelöst und sind mit einem moderaten Druckanstieg im Zylinder verbunden. Klopfende Verbrennungen hingegen erzeugen hohe Druckspitzen und können so zu einer Beschädigung des Motors führen. Sie treten häufig dann auf, wenn die Zündung zu früh erfolgt. Eine spätere Zündung kann Abhilfe schaffen, führt jedoch zu einer Verringerung der Motorleistung, und damit zu einer Erhöhung des Kraftstoffverbrauches. Es ist daher sinnvoll, den Zündzeitpunkt so zu wählen, dass gerade noch kein Klopfen auftritt. Da die Klopfheigung eines Motors von äußeren Einflüssen abhängt, wird eine klopfabhängige Regelung des Zündzeitpunktes erforderlich. Eine sichere Erkennung klopfender Verbrennungen ist dafür unabdingbar.

Prinzipiell kann eine klopfende Verbrennung anhand des Druckverlaufes im Inneren des Zylinders festgestellt werden. Sensoren zum Erfassen dieser Messgröße sind jedoch teuer und verschleißen schnell, so dass für den Serienbetrieb andere Messgrößen verwendet werden müssen. Am Motorblock befestigte Körperschallsensoren sind preiswert und liefern indirekte Informationen über die Verbrennung, die im Inneren des Motors stattfindet. Insbesondere lassen sich klopfende Verbrennungen über Schallspitzen detektieren. Die Vorteile der Verwendung von Körperschall anstelle des Druckes werden mit einer komplizierteren und fehleranfälligeren Auswertung erkauft, denn auch andere Effekte können sich im Körperschall bemerkbar machen. Für die Detektierung klopfender Verbrennungen anhand von Körperschallsignalen sind digitale Filter zum Erkennen klopftypischer Frequenzen (vgl. DE 101 38 110 Al) oder einfache merkmalsvektorbasierte Klassifikatoren (vgl. DE 103 52 860 Al) auf Basis bestimmter Kennwerte oder Merkmale bekannt, die durch Mittelwertbildung, Integration oder dergleichen ge- wonnen werden (vgl. EP 1 309 841 Bl oder EP 1 184 651 A2). Solche Methoden sind prinzipbedingt fehleranfällig, da bei der Merkmalsbildung meist viel relevante Information verloren geht, insbesondere zeitliche Abhängigkeiten. In dem Dokument DE 103 00 204 Al soll mittels Bildung von Zeitfenstern dieser Nachteil abgemildert werden. Die dabei entstehende Struktur kann als ein einfacher Zustandsautomat interpretiert werden.

Andere Verfahren versuchen, mit Hilfe des Körperschallsignals ein virtuelles Drucksignal zu erzeugen. In dem Dokument DE 197 41 884 C2 wird dafür beispielsweise ein Neuronales Netz verwendet. Neuronale Netze sind allerdings schwierig in der Anwendung und führen nicht immer zu reproduzierbaren Ergebnissen, da viele Parameter (Netzstruktur, Transfer- funktionen) a-priori vorzugeben sind. Die Gewichte des Netzes müssen aufwendig numerisch optimiert werden, wobei oft nur Suboptima gefunden werden.

HMMs sind ein alternativer Ansatz. Hierbei wird anhand eines gegebenen Beispiel- oder Trainingsdatensatzes die zeitliche und die spektrale Variabilität der Signale in Form eines stochastischen Automaten beschrieben. Dazu werden die eigentlichen Körperschallsignale mittels STFT {„Short Time Fourier Transform ") in Zeitfolgen von Spektralvektoren gewandelt. Das zeitliche Muster der Spektralvektoren - die Merkmalssequenzen - lassen sich durch ein HMM modellieren.

Trotz der prinzipiellen Eignung von HMMs können diese nur bedingt für die Klopferkennung eingesetzt werden, da HMMs kurze Sequenzen, vorzugsweise kurze, nichtstochastische Sequenzen, aufgrund von Mittelungseigenschaften der Zustände nur verhältnismäßig schlecht modellieren können. Weiterhin weisen sie ähnliche Nachteile wie Neuronale Netze auf.

Zusammenfassung der Erfindung

Aufgabe der Erfindung ist es, ein Verfahren und eine Vorrichtung zur automatischen Mustererkennung in einer Sequenz elektronischer Daten mittels elektronischer Datenverarbeitung in einem Datenverarbeitungssystem anzugeben, mit denen auf vereinfachte Art und Weise eine zuverlässige Erkennung von Mustern in der Sequenz elektronischer Daten ausführbar ist.

Erfindungsgemäß wird die Aufgabe durch ein Verfahren zur automatischen Mustererkennung nach dem unabhängigen Anspruch 1 und eine Vorrichtung zur automatischen Mustererkennung nach dem unabhängigen Anspruch 5 gelöst.

Die Erfindung umfasst den Gedanken eines Verfahrens zur automatischen Mustererkennung in einer Sequenz elektronischer Daten mittels elektronischer Datenverarbeitung in einem Da- tenverarbeitungssystem, bei dem zur automatischen Mustererkennung in einer Sequenz elektronischer Daten mittels elektronischer Datenverarbeitung in einem Datenverarbeitungssystem, bei dem in einer Analyse die Sequenz elektronischer Daten mit parametrisierten Modelldaten verglichen wird, die wenigstens eine Mustersequenz repräsentieren, und bei dem die wenigstens eine Mustersequenz erkannt wird, wenn bei der Analyse ermittelt wird, dass von den parametrisierten Modelldaten umfasste Modelldaten, welche der wenigstens einen Mustersequenz zugeordnet sind, mit einem eine Ähnlichkeitsmaßschwelle überschreitenden Ähnlichkeitsmaß auftreten, wobei beim Bilden der parametrisierten Modelldaten Trainingsdaten mittels eines Dynamic-Time-Warping- Verfahrens zu einem Satz von Merkmalsvektoren gleicher Länge und mit einem gleichen Informationsgehalt wie die Trainingsdaten verarbeitet werden, aus denen die parametrisierten Modelldaten abgeleitet werden.

Nach einem weiteren Aspekt der Erfindung ist eine Vorrichtung zur automatischen Mustererkennung in einer Sequenz elektronischer Daten mittels elektronischer Datenverarbeitung, mit einem Datenverarbeitungssystem geschaffen, welches die folgenden Merkmale aufweist: - Mustererkennungsmittel, die konfiguriert sind, in einer Analyse die Sequenz elektronischer Daten mit parametrisierten Modelldaten zu vergleichen, die wenigstens eine Mustersequenz repräsentieren, und die wenigstens eine Mustersequenz zu erkennen, wenn bei der Analyse ermittelt wird, dass von den parametrisierten Modelldaten umfasste Modelldaten, welche der wenigstens einen Mustersequenz zugeordnet sind, mit einem eine Ähnlich- keitsmaßschwelle überschreitenden Ähnlichkeitsmaß auftreten, und

- Modeldatenerzeugungsmittel, die konfiguriert sind, die parametrisierten Modelldaten unter Verwendung der Trainingsdaten zu erzeugen und hierbei die Trainingsdaten mittels eines Dynamic-Time-Warping- Verfalirens zu einem Satz von Merkmalsvektoren gleicher Länge und mit einem gleichen Informationsgehalt wie die Trainingsdaten zu verarbeiten, aus denen die parametrisierten Modelldaten abgeleitet werden, und

- Bereitstellungsmittel, die konfiguriert sind, eine elektronisch auswertbare Erkennungsinformation über das Erkennen der wenigstens einen Mustersequenz für eine Ausgabe be- reitzustellen.

Mit Hilfe der Umwandlung der Trainings- oder Beispieldaten unter Anwendung eines Dyna- mic-Time-Warping- Verfahrens (Myers et al: A comparative study of several dynamic time- warping algorithms for connected word recognition. The Bell System Technical Journal, 60(7):1389-1409, September 1981) zu dem Satz von Merkmalsvektoren gleicher Länge und mit einem gleichen Informationsgehalt wie die Trainingsdaten wird erreicht, dass bei der Mustererkennung ein komponentenweiser Vergleich möglich ist. Sequenzen oder Folgen, die in ihrer Länge variieren, erlauben dieses nicht. Aus den Trainingsdaten entstehen so Merkmalsvektoren fester Dimension und zu den Trainings- oder Beispieldaten gleichen Informati- onsgehaltes. Die Umwandlung in Merkmalsvektoren gleichen Informationsgehaltes bedeutet, dass eine Rekonstruktion der Trainingsdaten aus dem Satz von Merkmalsvektoren ohne zusätzliche Informationen möglich ist. Insbesondere bleibt eine zeitliche Verzerrungsinformation erhalten, die den Trainingsdaten zu eigen ist. Es existiert dann ein Satz von Merkmalsvektoren, welcher anschließend mittels beliebiger klassischer merkmalsvektorbasierter Klassifi- katoren ausgewertet werden kann. Das Problem der Mustererkennung wird auf eine als solche bekannte Klassifikationsaufgabe zurückgeführt. Es werden keine zweistufigen stochastischen Prozesse benötigt, wie dieses bei den HMMs der Fall ist.

Eine bevorzugte Weiterbildung der Erfindung sieht vor, dass die parametrisierten Modell- daten aus dem Satz von Merkmalsvektoren abgeleitet werden, indem ein merkmalsvektorbasierter Klassifikator parametrisiert wird.

Bei einer zweckmäßigen Ausgestaltung der Erfindung kann vorgesehen sein, dass als merkmalsvektorbasierter Klassifikator ein Bayes-Klassifikator mit Kernel-Window-Dichte- Schätzung verwendet wird. Eine zweckmäßige Weiterbildung der Erfindung sieht vor, dass das Ähnlichkeitsmaß für eine zum Zeitpunkt j der Analyse untersuchte Teilsequenz elektronischer Daten aus der Sequenz elektronischer Daten wie folgt ermittelt wird:

L(J, j) := jnaxJzCz - 1, ; - a) + log(p_{t l} (α))}+ c \og(p_{e l} (_Xj ))

wobei X_j die Elemente der Sequenz elektronischer Daten, p_t , (•) und p_e , (•) die z-ten Elemente von insgesamt N Elementen der parametrisierten Modelldaten und c und a_m empirisch zu wählende Konstanten sind. Das gesuchte Ähnlichkeitsmaß zum Zeitpunkt y ist L(NJ).

Das Verfahren kann in Verbindung mit verschiedenen Technologien zur automatischen Mustererkennung genutzt werden, wozu insbesondere eine Maschinensignalanalyse wie zum Beispiel eine Klopfanalyse bei einem Motor, eine Signalanalyse von EKG-Signalen, einer Spracherkennung, eine Gensequenzanalyse, eine Bildanalyse und eine Auswertung von Wär- mebilddaten, beispielsweise für die Qualitätskontrolle bei maschinell geschmiedeten Bauelementen, gehören. Es liegen dann jeweils die zu analysierenden Daten und die Beispiel- und Trainingsdaten in elektronischer Form und entsprechende Mess- oder Analysegrößen repräsentierend vor.

Beschreibung bevorzugter Ausführungsbeispiele der Erfindung

Im Folgenden wird die Erfindung anhand von Ausführungsbeispielen unter Bezugnahme auf Figuren einer Zeichnung näher erläutert. Hierbei zeigen:

Fig. 1 eine schematische Darstellung eines Aufbaus einer Klopfregelung für einen Motor, Fig. 2 ein Beispiel für die bei der Klopfregelung zu verarbeitenden Daten und

Fig. 3 eine schematische Darstellung, welche den Zusammenhang zwischen gemessenen Körperschallsignalen und sequenziell angeordneten elektronischen Daten beschreibt.

Das Verfahren zur Mustererkennung umfasst drei Teilaspekte, die getrennt betrachtet werden können, nämlich (i) eine Datensatztransformation, (ii) eine Parameterbestimmung eines Modells und (iii) die Anwendung des parametrisierten Modells zum Erkennen von Sequenzen oder Folgen in sequenziell angeordneten elektronischen Daten, welche ihrerseits verschiedensten Informationsgehalt repräsentieren können. In einem ersten Schritt findet eine Transformation eines Beispiel- oder Trainingsdatensatzes in Merkmalsvektoren statt, wodurch versteckte Zufallsvariablen zugänglich werden und eine direkte Vergleichbarkeit ermöglicht wird. Es sei angenommen, dass drei Trainings- oder Bei- spielsequenzen für die Parameterbestimmung gegeben sind:

5₁ = {a,a,b,b,b,d,d,d,e,f,g}

5₂ = {a,a,a,b,b,c,c,d,d,e,e,f,f,f,g,g} (1) S₃= {a,b,b,b,c,d,d,e,f,f,g,g}.

Um die Erklärung einfach zu halten, wurden Symbolsequenzen verwendet. Anstelle von Symbolen können aber auch reelle Zahlen oder Vektoren verwendet werden. Für diese wird dann lediglich ein Vergleichskriterium benötigt: Bei reellen Zahlen beispielsweise der Absolutbetrag der Differenz und bei Vektoren ein Distanzmaß, wie der Euklidische Abstand. Bei Symbolen ist das Vergleichskriterium insofern entartet, als dass der Abstand Null ist, wenn zwei Symbole gleich sind, andernfalls ist der Abstand Eins.

In den verschiedenen Anwendungsfällen repräsentiert der Beispiel- oder Trainingsdatensatz jeweils elektronisch auswertbare Information über ein oder mehrere Muster einer messbaren Größe, welche später erkannt werden sollen.

Es ist zu erkennen, dass die drei Sequenzen (1) nichtlineare Verzerrungen enthalten. Diese können kompensiert werden. Eine Entzerrung ergibt:

S₁ = {a,a,*,b,b,b,*,*,d,d,d,e, *,£,*, *_rg,*}

5₂ = {a,a,a,b,b,* ,c,c,d,d,* ,e,e,f,f,f,g,g} (2)

5₃ = {a,* ,* ,b,b,b_rc_r* ,d,d_r* ,e_r* ,£,£,* ,g,g) .

Damit die Sequenzen gleich werden, wurden Sterne eingefügt, welche eine erforderliche Wiederholung des Vorgängersymbols kennzeichnen. Bei Sequenzen von reellen Zahlen oder Vektoren kann mittels einer Entzerrung keine vollständige Gleichheit erreicht werden. Hier lässt sich jedoch immer eine Entzerrung finden, die den Abstand zwischen den Sequenzen minimiert. Ein Verfahren, welches das leistet, ist das Dynamic-Time-Warping Verfahren. Die erforderlichen Dehnungen pro Beispielsequenz lassen sich mit Hilfe binärer Vektoren beschreiben

S₁ = {1,1,0,1,1,1,0,0,1,1,1,1,0,1,0,0,1,0} δ₂ = {1,1,1,1,1,0,1,1,1,1,0,1,1,1,1,1,1,1} (3) δ₃ = {1,0,0,1,1,1,1,0,1,1,0,1,0,1,1,0,1,1},

welche immer eine Eins enthalten, wenn in der ursprünglichen Sequenz an dieser Stelle ein Symbol vorhanden war. Ansonsten ist der Eintrag Null. Die entzerrten Sequenzen (2) und die Verzerrungsvektoren (3) werden zu

m'_± = {a,a_r*,b_fb,b_r*,*_rd,d,d_re_/*_ff_r*_r *,g,*, 1,1, 0,1, 1,1, 0,0, 1,1, 1,1, 0,1, 0,0, 1,0} m' ₂ = {a,a,a,b_rb,*,c,c,d,d, *, e_re,£, £, f,g,g, 1,1,1,1,1,0,1,1,1,1,0,1,1,1,1,1,1,1} m'₃ = {a,*,*,b_rb_rb,c,*,d,d, *,e, *,£,£, *,gr,g, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1}

kombiniert. Die Sternsymbole können dabei ohne Informationsverlust durch die Vorgängersymbole ersetzt werden, da immer eine Rücktransformation durch die angehängten binären Vektoren möglich wäre und es entstehen die Merkmalsvektoren

Ul₁ == {a_ra_ra,b_rb_rb,b_rb_rd,d_rd_re,e_r£_r£_r£_rg_rg, 1,1, 0,1, 1,1, 0,0, 1,1, 1,1, 0,1, 0,0, 1,0) iπ₂ == {{ aa,,aa,,aa,, bb,_rbb,,bb,,cc,,cc,,dd,,dd,,dd,,ee,,ee,,f£,, ££,, f£,,gg,,gg,, 1l,,11,,11,,11,, 11,,00,,11,,11,,11,,11,,00,,11,,11,,11,,11,,11,,11,,11}} (4) m₃ = {a,a,a,b,b,b,c_rc,d_rd,d,e,e,f,f,f ^^,1,0,0,1,1,1,1,0,1,1,0,1,0,1,1,0,1,1} .

Es wird angemerkt, dass die vorderen Hälften der Vektoren nahezu gleich sind. Dieser Effekt tritt jedoch nur bei Symbolsequenzen auf. Bei Sequenzen von reellen Zahlen oder Vektoren würden sich die Einträge lediglich ähneln. Der entscheidende Vorteil dieser Datensatztransformation besteht darin, dass die in den Trainingsdaten an sich versteckten Verzerrungen explizit werden und dass Merkmalsvektoren entstanden sind. Die Verzerrungsinformation ist im Übrigen jedoch gleich in den ursprünglichen Trainingsdaten und den erzeugten Merkmalsvek- toren. Als Folge dieser Anpassung ist nun ein komponentenweiser Vergleich möglich. Sequenzen, die in ihrer Länge variieren, erlauben das nicht.

Im nun folgenden Teilaspekt erfolgt die Parameterbestimmung des Modells. Mit Hilfe des Beispiel- oder Trainingsdatensatzes (4) lässt sich eine Wahrscheinlichkeitsdichte p(m) schätzen. Diese beschreibt Struktur und Zufälligkeit der Daten sowohl in der Zeit, als auch in der Amplitude. Für die Modellierung der Wahrscheinlichkeitsdichte lässt sich ein Kernel- Ansatz, beispielsweise ein Parzen- Ansatz, verwenden (Parzen: On estimation of a probability density andmode. Annais of Mathematical Statistics, VoI 33: 1065-1076, 1962):

p(m) _* - 1 ∑ " φ(iΑ- m_k,s) mit (5)

Hierbei ist n die Anzahl an Merkmalsvektoren, d die Dimension der Merkmalsvektoren, s = (si, ..., S_rJ^τ ein zu schätzender Glättungsparameter und m^ = (mu, ...,w^^r der k-te Merkmalsvektor des Datensatzes. Der einzige offene Parameter s kann mit Hilfe einer Fixpunktite- ration so bestimmt werden, sodass die Vorhersagefähigkeit der Dichteschätzung ^(m) maximal wird (Duin: On the choice ofthe smoothing parameters for parzen estimators of probability density functions. IEEE Transactions on Computers, Vol. C-25, No. 11: 1175-1179, 1976).

Zur Verringerung der Datenmenge, werden anschließend solche Gaußfunktionen 0(m - m,,s) und ^(m - m^s) mit i ≠ j zu einer einzigen Gaußfunktion α'^(m - m',sj) zusammengefasst, deren Ähnlichkeit groß genug ist. Dabei treten durch die Umformung die neuen Parameter

, s' und m'auf. Das resultierende Modell der Verteilung lautet nach der

Zusammenfassung

^(m) ^« -∑^αt^(^m - ^mt'^st) ' (⁶)

wobei q sehr viel kleiner als n sein kann. Die Formeln für die Parameter a[ , s[ und mj sind

Der Ausdruck (m, -mj² ist dabei komponentenweise zu verstehen, d.h. jede Komponente des Vektors m, - m, wird einzeln quadriert. Vor der Zusammenfassung gilt s, = s und a, = 1 für alle / = 1, ..., n. Als Kriterium für die Ähnlichkeit zweier Gaußfunktionen ^(m - m^s,) und φ(m - m_j,S_j) eignet sich

Das Modell p(m) der Wahrscheinlichkeitsverteilung besteht nach der Kompression aus einer Summe von q Gaußverteilungen ^(m - m^., s^.) gewichtet mit den Faktoren a_k' mit Jc = 1, ..., q. Die Vektordimension d kann anschließend auf die gleiche Weise verringert werden.

Jede der entstandenen q Gaußfunktionen φ{va. — va_k' ,%'_k) ist Spezialist für einen Teilbereich der Daten und besteht aus einem Produkt skalarer Gaußfunktionen. Die skalaren Gaußfunktionen modellieren dabei entweder eine lokale Wahrscheinlichkeitsdichte in der Zeit oder aber in der Amplitude, je nach der Komponente des Merkmalsvektors m, der aus einer Sequenz S und einem binären Verzerrungsvektor δ besteht. Jede der q Gaußfunktion

u φ(m-m'_k,s_k' ) = Y[- r exp K -O² (9)

24,

kann nach rückgängig machen der Merkmalsvektorcodierung als

φ(m-m_k' ,s'_k) = Ylp_e,(x) .p_υ(δ) (10)

/=1

interpretiert werden. Dabei bestimmen die Anteile von s_k' und m^, die aus den Verzerrungsvektoren δ herrühren, die Parameter für die Übergangsdichten p_n(δ) und die Anteile die direkt aus den Sequenzen 5 stammen die Parameter für die Emissionsdichten p_{e ι} (x) . Die

Emissionsdichten und die Übergangsdichten sind lediglich die Faktoren des Produktes (9) in umkodierter Form. Die Pararnetrisierungsphase ist damit beendet. Der folgende Teil beschreibt, wie das Modell effizient angewendet werden kann. Es folgt nun der Teilaspekt betreffend die Anwendung des Modells zur tatsächlichen Mustererkennung.

Während der Anwendungsphase wird eine Sequenz S dahingehend untersucht, ob irgendwo Muster auftreten, die zu den Sequenzen des Beispieldatensatzes ähnlich sind. Dabei muss die Transformation, die während der Parametrisierungsphase durchgeführt wurde, implizit auch für die beobachtete Sequenz S erfolgen. Das mit der nachfolgenden Formel (11) angegebene Verfahren ist hierzu in effizienter Weise in der Lage.

Prinzipiell arbeitet das Verfahren wie ein digitaler Filter, d.h. zu jedem Element der zu untersuchenden Sequenz S wird ein Maß ausgegeben, welches Auskunft über die momentane Ähnlichkeit gibt. Überschreitet dieses Ähnlichkeitsmaß eine gegebene Schwelle, so kann eine geeignet erscheinende Reaktion erfolgen. Die Auswertung der Sequenz S ist auch synchron zu einer Messung möglich, denn es wird immer nur der aktuelle Messwert benötigt.

Intern arbeitet der Filter folgendermaßen: Für jedes der q Modelle (Siehe Formel (6)) wird eine Matrix L angelegt und mit -∞ initialisiert. Sie wird pro Zeitschritt j für alle i = 1, ..., N mit Hilfe der Formel

L(i,j) - l,j - ά) + log(p_tJ(a))}+ clog(p_ej(x y) (11)

aktualisiert. Die Wahrscheinlichkeitsverteilungen p_{x ι}(-) und />, ,(•) ergeben sich aus der Beziehung (10). Der Parameter a_m ist dabei mindestens so groß zu wählen, so dass für alle p_n(a_m) « 0 gilt. Der Parameter c dient der Gewichtung und muss empirisch ermittelt werden. Im einfachsten Fall kann c = 1 gewählt werden. Der Wert L(N, j) ist das gesuchte Ähnlichkeitsmaß zum Zeitpunkt j, welches angibt, wie stark die momentan beobachtete Sequenz einer der Sequenzen aus der Parametrisierungsphase ähnelt. Insgesamt existieren q dieser Werte. Der größte davon ist relevant und wird mit der Erkennungsschwelle verglichen, um bei deren Überschreitung ein Erkennungsereignis zu signalisieren. Eine Implementierung von L(i, j) in Form eines Ringpuffers ist möglich. Das vorangehend beschriebene Verfahren beschreibt in allgemeiner Weise den vorgeschlagenen Prozess der Mustererkennung, wie es in verschiedenen Anwendungsfallen genutzt werden kann. Im Folgenden werden nun Anwendungsbeispiele für die Nutzung des Mustererkennungsverfahrens näher beschrieben.

Beispiel 1

Eine Anwendung des Mustererkennungsverfahrens ist die Klopferkennung bei Motoren, auf die im Folgenden noch näher eingegangen wird. Fig. 1 zeigt eine schematische Darstellung eines Aufbaus einer Klopfregelung für einen Motor.

Es wird davon ausgegangen, dass mit Hilfe eines geeigneten Sensors ein Körperschallsignal kontinuierlich aufgenommen und mittels einer Analog-Digital-Wandlung mit hinreichend hoher Abtastrate digitalisiert wird. Das Zeitsignal wird damit zu einer Sequenz von Skalaren. Im nächsten Schritt wird diese Sequenz mittels einer STFT in eine Sequenz von Spektralvektoren (Spektrogramm: Amplitudenspektrum oder Leistungsdichtespektrum) gewandelt, welche die Ausprägung bestimmter Frequenzanteile über die Zeit beschreiben. Die Spektralvektoren können anschließend logarithmiert und mittels einer Diskreten Kosinustransformation in Cepstralvektoren gewandelt werden. Dieser Schritt ist jedoch nicht zwingend erforderlich. Die Vektorsequenzen werden im Weiteren als Merkmalsvektorsequenzen bezeichnet, um von der konkreten Art der Vorverarbeitung zu abstrahieren, die damit abgeschlossen ist. Die eigentliche Erkennung erfolgt ausschließlich auf Basis dieser Merkmalsvektorsequenzen wie sie oben allgemein erläutert wurden.

Bevor die Klopferkennung eingesetzt werden kann, muss eine Parametrisierung stattfinden. Dazu müssen mit Hilfe eines Motorenteststandes Beispiel- oder Trainingsdaten aufgenommen werden. Hierbei wird der zu regelnde Motorentyp bei verschiedenen Drehzahlen und für jeden Zylinder in den klopfenden und nichtklopfenden Bereich gebracht. Zusätzlich wird neben den Körperschallsignalen mit geeigneten Sensoren der Zylinderinnendruck gemessen. Diese Da- ten sind erforderlich, um eindeutig beurteilen zu können, ob ein konkret gemessenes Körperschallsignal einer klopfenden oder einer nichtklopfenden Verbrennung entspricht (vgl. Fig. 2). Anschließend werden die aufgezeichneten Körperschalldaten aufbereitet, indem alle Bereiche ausgeschnitten werden, bei denen im gleichzeitig gemessenen Drucksignal ein Überdruck vorliegt. Zusätzlich wird anhand des Drucksignals die Klopfstärke eines jeden Körperschallfragmentes ermittelt und mit diesem verbunden (gelabelt). Die Drucksignale werden dazu bandpassgefiltert und gleichgerichtet. Die verbleibende Maximalamplitude stellt ein Maß für die aktuelle Stärke des Klopfens dar. Nach diesem Schritt steht ein Datensatz von Körperschallfragmenten zur Verfügung, mit dem die Klopferkennung parametrisiert werden kann. Die Drucksignale werden anschließend nicht länger benötigt.

Für die Klopferkennung werden zwei Modelle parametrisiert. Das erste Modell dient der Erkennung klopfender Verbrennungen, das zweite zur Erkennung nicht klopfender Verbrennungen. Auf diese Weise kann die Aufgabenstellung auf ein einfaches Klassifikationsproblem zurückgeführt werden. Ausgangspunkt für die Parametrisierung sind die aus dem kontinuierlichen Körperschallsignal ausgeschnittenen und mit der Klopfstärke gelabelten Körperschall- fragmente.

Das Modell für die nichtklopfenden Verbrennungen wird nur mit solchen Körperschallfragmenten parametrisiert, deren Klopfstärke unterhalb einer zuvor definierten Schwelle S₁ liegt. Entsprechend wird das Modell für die klopfenden Verbrennungen mit Hilfe eindeutig klop- fender Körperschallfragmente parametrisiert. Die Klopfstärke muss dazu eine Schwelle ε₂ überschreiten. Beide Schwellen S₁ und s₂ können gleich sein. Es ist jedoch praktisch sinnvoll S₂ etwas größer als S_x zu wählen. Bis auf die verwendete Datenbasis sind beide Modelle ansonsten vollkommen identisch. Ebenso unterscheidet sich die Parametrisierungsphase nicht voneinander, sodass es ausreichend ist, diese anhand eines einzigen Modells zu be- schreiben.

In aller Regel ist es für die Mustererkennung günstiger, nicht direkt die Körperschallsignale zu analysieren, sondern daraus abgeleitete Merkmalsvektorsequenzen, also Folgen von Merkmalsvektoren. Bei diesem konkreten Beispiel ist es, wie bereits beschrieben, sinnvoll, Körperschallsignale zunächst in kurze überlappende gleichlange Zeitfenster zu unterteilen und von diesen jeweils die Amplituden oder Leistungsdichtespektren zu berechnen. Jedes dieser Spektren kann als Merkmalsvektor fester Dimension aufgefasst werden. Ein Körperschallfragment wird so zu einer Merkmalsvektorsequenz (vgl. Fig. 3). Da sich die Körperschallfragmente in ihrer Länge unterscheiden, unterscheiden sich auch die durch die Vorverarbeitung erzeugten Merkmalsvektorsequenzen in ihrer Länge. Ein direkter Vergleich ist so nicht möglich. Ebenso ist eine Behandlung des Klassifikationsproblems mit klassischen merkmalsvektorbasierten Mustererkennungsverfahren unmöglich, da diese voraussetzen, dass ein in sich abgeschlossener Merkmalsraum existiert und somit eine implizite Schätzung der Wahrscheinlichkeitsverteilung des Beispieldatensatzes möglich ist.

Gemäß dem oben beschriebenen Verfahren werden nun Merkmalsvektoren gebildet, die an- schließend zur Parametrisierung des Modells genutzt werden, wie dieses oben erläutert ist. Anschließend kann das Modell zur Mustererkennung in der vorangehend erläuterten Art und Weise verwendet werden. Da während der Parametrisierungsphase zwei Modelle erzeugt wurden, nämlich einmal für klopfende und einmal für nichtklopfende Verbrennungen, existieren zwei dieser Werte. Je nachdem welcher dieser Werte größer ist, liegt entweder eine klop- fende oder eine nichtklopfende Verbrennung vor. Sind beide Werte niedrig, findet momentan entweder keine Verbrennung statt, oder der Sensor ist beschädigt. Das Motorsteuergerät hat damit die Möglichkeit, einen Ausfall der Klopferkennung zu detektieren, was wichtig ist, um eine Beschädigung des Motors zu vermeiden.

Das beschriebene Verfahren ermöglicht ein zeitkontinuierliches Suchen nach klopfenden Verbrennungen. Darunter ist zu verstehen, dass das Verfahren, ähnlich einem digitalen Filter, zu jedem Abtastzeitpunkt ein Kriterium für die momentane Klopfstärke zur Verfügung stellen kann. Überdies sind keine a-priori Vorgaben erforderlich und die Bestimmung der Parameter erfolgt weitgehend konstruktiv, d.h. ohne numerische Optimierung.

Wie vorangehend in Verbindung mit der Klopferkennung erläutert, können auch andere Problemstellungen in Verbindung mit einer Mustererkennung auf ein Sequenzerkennungsproblem zurückgeführt werden, was nachfolgend näher erläutert wird.

Beispiel 2

Einige der Anwendungen basieren auf Zeitsignalen. Bei diesen Anwendungen ist es relativ offensichtlich, an welcher Stelle das Verfahren zur Sequenzerkennung nutzbringend einge- setzt werden kann. Beispielsweise kann bei der Signalanalyse von EKG-Signalen (EKG - Elektrokardiogramm) direkt das Zeitsignal verwendet werden. Es handelt sich dann um eine Verwendung des oben beschriebenen Verfahrens für eine automatische Mustererkennung bei einer Signalanalyse von EKG-Signalen. Auf diese Weise können Sequenzen in den EKG- Signalen ermittelt werden, die gegebenenfalls auf Rhythmusstörungen hindeuten.

Beispiel 3

Auch die Anwendung der automatischen Mustererkennung in Verbindung mit Spracherken- nung basiert auf Zeitsignalen. Beim Erkennen von Sprache ist es jedoch sinnvoll, eine Vorverarbeitung der Zeitsignale, bei welchen es sich in diesem konkreten Fall um Audiosignale handelt, durchzuführen. Hierzu werden äquivalent zur oben beschriebenen Vorgehensweise bei der Klopferkennung die Schallsignale in Folgen von Spektralvektoren gewandelt. Der Vorteil dieser Transformation besteht darin, dass sich die aus physikalischen Gründen irrele- vanten Phasen aus den Signalen so leicht entfernen lassen. Fig. 3 trifft daher auch für den Anwendungsfall der maschinellen Spracherkennung zu.

Die einfachste Anwendung einer maschinellen Spracherkennung besteht darin, einzelne vor- definierte Kommandowörter zu erkennen. Dazu ist mindestens ein Mikrophon und ein Mikro- prozessor erforderlich, welcher zusätzlich in der Lage sein muss, die analogen Audiosignale digital einzulesen. Um zur Kommandoworterkennung das oben beschriebene Verfahren einzusetzen, ist es zunächst erforderlich, einen Beispieldatensatz mit dieser Messvorrichtung aufzunehmen. Für jedes Kommandowort müssen mindestens einige Beispiele aufgezeichnet werden. Anschließend werden diese aufbereitet und gelabelt, d.h. es wird maschinenlesbar gekennzeichnet, um welches Kommando wort es sich bei jedem konkreten Beispiel handelt.

Für jedes Kommando wort wird nun ein Modell erzeugt. Dazu werden die entsprechenden Beispiele vorverarbeitet und in Spektralvektorfolgen gewandelt. Dieses sind die eigentlichen Sequenzen, aus denen dann in der bereits beschriebenen Weise (Formeln (1) bis (4)) Merk- malsvektoren gleicher Länge erzeugt werden. Mit Hilfe der beschriebenen Parametrisierung (Formeln (5) bis (10)) werden anschließend die Modelle erzeugt. Die Beziehung (11) ermöglicht dann die Nutzung der erzeugten Modelle zur Analyse eines kontinuierlichen Audiosignals. Falls das für jedes Modell ständig berechnete Ähnlichkeitsmaß zu einem bestimmten Zeitpunkt die vordefinierte Schwelle überschreitet, kann davon ausgegangen werden, dass das kontinuierlich untersuchte Audiosignal aktuell eine Äußerung enthalten hat, welche zu den Kommandowörtern ähnlich war, welche bei der Parametrisierung des entsprechenden Modells verwendet wurden. Eine Meldung des damit verbundenen Labels erscheint dem Benutzer des Systems als Erkennung seiner gesprochenen Äußerung und kann zur Triggerung bestimmter nützlicher Aktionen genutzt werden.

Beispiel 4

Bei einem Virenscanner bestehen die zu suchenden Muster aus bestimmten signifikanten Codefragmenten, also Folgen oder Sequenzen von Bytes die das Verhalten des Codes beschreiben. Damit Viren nicht so leicht zu finden sind, werden häufig Variationen an bestimmten Teilen des Codes eingefügt, die zwar das eigentliche Verhalten nicht verändern, aber zu einer geänderten Bytefolge führen. Beispielsweise können an beliebigen Stellen des Codes NOP- Maschinenbefehle (No Operation) eingefügt werden. Auch andere Codesequenzen, die letztlich nichts bewirken, lassen sich einfügen.

Die Vorgehensweise zum Auffinden schädlichen Programmcodes mit Hilfe des oben beschriebenen Verfahrens besteht darin, die Bytefolgen verschiedener veränderter Versionen durch ein gemeinsames Modell zu beschreiben und mit diesem nach dem Auftreten des Virus zu suchen. Dazu werden die Bytefolgen den Formeln (1) bis (4) entsprechend in Merkmalsvektoren fester Länge transformiert. Darauf anschließend erfolgt die Parametrisierung des Modells. Es handelt sich dann um eine Verwendung des oben beschriebenen Verfahrens für eine automatische Mustererkennung beim Virenscannen.

Beispiel 5

Ein sehr ähnlicher Problemkreis ist die Suche nach Genen oder ähnlichen Genen in DNA- Sequenzen. Hierbei wird anstelle von Byte-Sequenzen nach Aminosäure-Sequenzen gesucht. Es handelt sich dann um eine Verwendung des oben beschriebenen Verfahrens für eine automatische Mustererkennung (Gensequenzen) bei der Gensequenzanalyse, wobei die Sequenz elektronischer Daten eine Gensequenz repräsentiert. Beispiel 6

Nicht ganz so offensichtlich ist die Anwendung in der Bildanalyse, da hier zweidimensionale Datenstrukturen vorliegen. Einige dieser Aufgabenstellungen lassen sich auf ein Sequenzanalyseproblem zurückführen. Ein handschriftlich geschriebener Text beispielsweise, kann als eine Sequenz oder Folge von X-Y-Koordinaten interpretiert werden. Infolge variabler Schreibgeschwindigkeiten können diese Sequenzen jedoch nicht direkt verglichen werden. Die Erfindung bietet jedoch eine direkte Möglichkeit zur Verarbeitung solcher Daten. Bei- spielsweise könnte die Aufgabenstellung darin bestehen, die Unterschrift oder Signatur einer Person zu überprüfen um z.B. eine Authentifizierung eines Laptops durchzuführen. Die notwendige Hardware, ein Touchpad und ein Computer für die Auswertung ist in den Geräten bereits enthalten.

Jede Sequenz beginnt, wenn eine Berührung auf dem Touchpad registriert wird und endet, wenn für eine gewisse Zeit keine Berührung mehr empfangen wurde. Damit die Position, an der die Unterschrift oder Signatur geschrieben wird, keinen Einfluss ausübt, kann die erste Koordinate der Sequenz von allen restlichen Koordinaten der Sequenz subtrahiert werden. Dadurch wird sichergestellt, dass jede Koordinatensequenz am Ursprung (0,0) beginnt.

Um nun die Unterschrift oder Signatur einer Person erkennen zu können, werden einige Beispiele benötigt, aus denen entsprechend den Formeln (1) bis (4) die Merkmalsvektoren fester Länge erzeugt werden. Darauf aufbauend wird anschließend das Modell parametrisiert (Formeln (5) bis (10)). Nachdem das Modell fertig parametrisiert ist, kann es dazu verwendet werden, alle empfangenen Koordinatensequenzen entweder ständig oder nur auf Anforderung mit dem gespeicherten Modell zu vergleichen. Hierzu kann die Formel (11) eingesetzt werden. Beispiel 7

Bei der Maschinensignalanalyse werden häufig Zeitsignale verwendet, die sich direkt als Sequenzen interpretieren lassen, nämlich Strom- oder Spannungsverläufe. Andere Sensordaten, bei denen eine Störung durch Übertragungsfunktionen stattfindet, können in Form von Spektrogrammen untersucht werden (vgl. Klopferkennung oben). In der Regel existieren beim Maschinen- und Anlagenbau ausgesprochen viele Anwendungen, bei denen sich die beschriebene Sequenzerkennung sinnvoll einsetzen lässt. Typisch hierbei ist jedoch, dass es sich fast immer um Detailprobleme handelt, zum Beispiel einen Teil einer Steuerung, einen Teil einer Prozessüberwachung oder dergleichen. Es handelt sich dann um eine Verwendung des oben beschriebenen Verfahrens für eine automatische Mustererkennung bei der Steuerung oder der Prozessüberwachung einer Maschine oder einer Anlage, wobei die Sequenz elektronischer Daten für die Steuerung oder die Prozessüberwachung erfasste Daten repräsentieren, wobei zuvor zugehörige Beispiel- oder Trainingsdaten erfasst wurden.

Beispiel 8

Eine weitere Anwendung des Mustererkennungsverfahrens ist die Auswertung von Wärmebilddaten für die Qualitätskontrolle bei maschinell hergestellten geschmiedeten Bauelemen- ten. Geschmiedete Bauelemente weisen gelegentlich Risse auf. Rein visuell lassen sich die Risse meist nicht gut erkennen. Allerdings weicht das jeweilige Abkühlverhalten von Bereichen mit Rissen und von Bereichen ohne Risse voneinander ab. Um solche Abweichungen erfassen zu können, werden für eine kurze Zeit Bilder der geschmiedeten Bauelemente mittels einer Wärmebildkamera aufgenommen. Die Abkühlung eines Bauelementes entspricht einer Veränderung eines mittels der Wärmebildkamera gebildeten Grauwertbildes G(x,y,t) über eine Zeit t. Da sich die Lage des Bauelementes gegenüber der Wärmebildkamera während der Aufnahme nicht verändert, sind die Bildkoordinaten x und y (Pixel) einem jeweiligen Bereich der Bauteiloberfläche zugeordnet. Das zeitliche Verhalten des Grauwertes lässt sich hierbei näherungsweise mittels einer abklingenden Exponentialfunktion beschreiben:

G(x, y, t) « G(x, y,0) ^■ exp(- l(x, y) ^■ t) Der Parameter l(x,y) lässt sich vorzugsweise mittels linearer Regression abschätzen. Weitere die Abkühlung beschreibende Parameter sind möglich. Für jede Bildkoordinate x und y wird so ein Parametervektor V(x,y) gebildet, welcher beispielsweise im einfachsten Fall nur eindimensional ist: V(x,y) = l(x,y).

Da jeder Bildkoordinate x und y genau ein Parametervektor V(x,y) zugeordnet ist, kann das Ergebnis dieser Vorverarbeitung als ein Grauwertbild (eindimensionaler Parametervektor) oder als ein Falschfarbenbild (mehrdimensionaler Parametervektor) dargestellt werden. Ein abweichendes Abkühlverhalten in solchen Sekundärbildern V(x,y) ist visuell sofort als eine ungewöhnliche Verfärbung erkennbar. Für eine maschinelle Auswertung ist es aber störend, dass die Lage und die Ausrichtung der Bauelemente im Sekundärbild von Fall zu Fall variiert. Diese Variation hat verfahrenstechnische Gründe und zeigt sich im Wesentlichen als eine horizontale Verschiebung beziehungsweise Verzerrung. Ein einfacher Vergleich mit einem Referenzbild ist daher nicht möglich

Es ist hingegen möglich, jede Spalte Sp (x) = (V(x,l), V(x,2), V(x,3),...) des Sekundärbildes V(x,y) als einen Vektor zu interpretieren. Die Abfolge der Spalten S(x) von links nach rechts bildet dann eine Folge von Vektoren S = Sp(I), Sp(2),Sp(3),... und somit eine Sequenz. Die Aufgabenstellung des Findens der Lage des Bauelementes und des Vergleichs mit einer Refe- renz wird somit auf ein Sequenzerkennungsproblem reduziert, welches sich mit dem erfindungsgemäßen Mustererkennungsverfahren lösen lässt. Das Referenzbild (Referenz) wird beispielsweise mittels des erfindungsgemäßen Verfahrens aus mehreren Beispielssequenzen von fehlerfreien Bauelementen gebildet

Insgesamt ist vorangehend ein Verfahren zur automatischen Mustererkennung beschrieben, welches in vielfältigen Anwendungen eingesetzt werden kann, indem entsprechende elektronische Daten, die eine dem jeweiligen Anwendungsfall zugeordnete Information umfassen, in der oben erläuterten Art und Weise analysiert werden. Ausgangspunkt des Verfahrens ist hierbei zunächst die Erzeugung eines Satzes von Merkmalsvektoren gleicher Länge oder Di- mension aus Trainings- oder Beispieldaten mittels eines Dynamic-Time-Warping-Verfahrens. Auf diese Weise werden Merkmalsvektoren erzeugt, die anschließend prinzipiell mit Hilfe beliebiger Klassifikatoren zur Mustererkennung untersucht werden können. Beispielsweise könnte auch ein Neuronales Netz (z.B. ein Multilagen-Perzeptron) Verwendung finden (Bis- hop: Neural networks für Pattern Recognition, Clarendon Press, Oxford, 1995). Zahlreiche andere Klassifikatoren wie Support- Vector-Machines, Polynomklassifikatoren oder Entscheidungsbaumverfahren sind ebenfalls möglich (Niemann: Klassifikation von Mustern, 1995). Allerdings müssen dazu alle Klassifikatoren das Problem lösen, die während der Anwen- dungsphase notwendige Entzerrung der beobachteten Sequenzen effizient durchzuführen. In ihrer Grundform ist keines der genannten Verfahren dazu in der Lage.

Unabhängig von der anschließenden Ausführung des Klassifikationsverfahrens stellt die Erzeugung des Satzes von Merkmalsvektoren einen selbstständigen Aspekt der Erfindung dar, welcher seine Vorteile unabhängig von der anschließenden Wahl des Klassifikators und somit im Zusammenhang mit verschiedensten Klassifikatoren entfaltet.

Das beschriebene Verfahren zur automatischen Mustererkennung kann vorteilhafter Weise insbesondere im Zusammenhang mit den folgenden Anwendungen genutzt werden: maschi- nelle Spracherkennung, Handschrifterkennung, Gensequenzanalyse, Suche nach schädlichem Programmcode (Virenscanner), Medizintechnikanwendungen wie Herzschrittmacher oder Elektrokardiogramm und maschinelle Diagnoseanwendungen wie Klopferkennung.

Die in der vorstehenden Beschreibung, den Ansprüchen und der Zeichnung offenbarten Merk- male der Erfindung können sowohl einzeln als auch in beliebiger Kombination für die Verwirklichung der Erfindung in ihren verschiedenen Ausführungsformen von Bedeutung sein.

Claims

Ansprüche

1. Verfahren zur automatischen Mustererkennung in einer Sequenz elektronischer Daten mittels elektronischer Datenverarbeitung in einem Datenverarbeitungssystem, bei dem in einer Analyse die Sequenz elektronischer Daten mit parametrisierten Modelldaten verglichen wird, die wenigstens eine Mustersequenz repräsentieren, und bei dem die wenigstens eine Mustersequenz erkannt wird, wenn bei der Analyse ermittelt wird, dass von den parametrisierten Modelldaten umfasste Modelldaten, welche der wenigstens einen Mustersequenz zugeordnet sind, mit einem eine Ähnlichkeitsmaßschwelle überschreitenden Ähnlichkeitsmaß auftreten, wobei beim Bilden der parametrisierten Modelldaten Trainingsdaten mittels eines Dynamic-Time-Warping- Verfahrens zu einem Satz von Merkmalsvektoren gleicher Länge und mit einem gleichen Informationsgehalt wie die Trainingsdaten verarbeitet werden, aus denen die parametrisierten Modelldaten abgeleitet werden.

2. Verfahren nach Anspruch 1, dadurch g ek e nn z e i c hn e t, dass die parametrisierten Modelldaten aus dem Satz von Merkmalsvektoren abgeleitet werden, indem ein merk- malsvektorbasierter Klassifϊkator parametrisiert wird.

3. Verfahren nach Anspruch 2, dadurch g ek e n n z e i c h n e t, dass als merkmalsvektorba- sierter Klassifϊkator ein Bayes-Klassifikator mit Parzen- Window-Dichteschätzung verwendet wird.

4. Verfahren nach mindestens einem der vorangehenden Ansprüche, dadurch g ek e nn - z e i c hn e t, dass das Ähnlichkeitsmaß L(NJ) für eine zum Zeitpunkt j der Analyse untersuchte Teilsequenz elektronischer Daten aus der Sequenz elektronischer Daten wie folgt ermittelt wird:

^L(i> ■/^{) :=} _β Jp^ J¹^^' - 1, 7 ^~ α⁾ + ^log⁽A,₍ ⁽⁰O⁾)+ ^{c 1}O^g(X, O, ⁾⁾ wobei X_j die Elemente der Sequenz elektronischer Daten, p_t , (•) und p_e , (•) die /-ten E- lemente von insgesamt N Elementen der parametrisierten Modelldaten und c und a_m empirisch zu wählende Konstanten sind.

Vorrichtung zur automatischen Mustererkennung in einer Sequenz elektronischer Daten mittels elektronischer Datenverarbeitung, mit einem Datenverarbeitungssystem, welches die folgenden Merkmale aufweist:

- Mustererkennungsmittel, die konfiguriert sind, in einer Analyse die Sequenz elektronischer Daten mit parametrisierten Modelldaten zu vergleichen, die wenigstens eine Mustersequenz repräsentieren, und die wenigstens eine Mustersequenz zu erkennen, wenn bei der Analyse ermittelt wird, dass von den parametrisierten Modelldaten um- fasste Modelldaten, welche der wenigstens einen Mustersequenz zugeordnet sind, mit einem eine Ähnlichkeitsmaßschwelle überschreitenden Ähnlichkeitsmaß auftreten, und - Modeldatenerzeugungsmittel, die konfiguriert sind, die parametrisierten Modelldaten unter Verwendung der Trainingsdaten zu erzeugen und hierbei die Trainingsdaten mittels eines Dynamic-Time-Warping- Verfahrens zu einem Satz von Merkmalsvektoren gleicher Länge und mit einem gleichen Informationsgehalt wie die Trainingsdaten zu verarbeiten, aus denen die parametrisierten Modelldaten abgeleitet werden, und - Bereitstellungsmittel, die konfiguriert sind, eine elektronisch auswertbare Erkennungsinformation über das Erkennen der wenigstens einen Mustersequenz für eine Ausgabe bereitzustellen.