-
Feld der Erfindung
-
Die vorliegende Erfindung bezieht
sich auf eine Vorrichtung zum Analysieren und Filtern von Schall.
Die Erfindung bezieht sich auch auf ein Verfahren zum Analysieren
und Filtern von Schall.
-
Hintergrund
der Erfindung
-
In vielen Bereichen ist es wichtig
Schall analysieren zu können,
um verschiedene Typen von Schall klassifizieren und identifizieren
zu können.
In der Automobil- und Luftfahrtindustrie ist es z. B. oft erforderlich,
Geräusche
von Maschinen und Motoren zu klassifizieren, um mögliche Probleme
wie Brüche oder
verschliessene Lager in der Maschine oder dem Motor zu diagnostizieren.
Die Spracherkennung ist ein weiteres Feld, wo eine zuverlässige Analyse
von Schall erforderlich ist. Heutzutage werden einige wenige Verfahren
zur Spracherkennung eingesetzt. In US-A-5.285.522 ist eine Vorrichtung
zur Spracherkennung beschrieben. Dort werden zur Erkennung verschiedener
Stimmmuster neuronale Netze benutzt. Die Eingangssignale für die neuronalen
Netze kommen von einer Gruppe von Bandpassfiltern, welche die Eingangsakustikmuster
in Frequenzbereiche trennen. Ein anderes System zur Spracherkennung ist
in US-A-5.377.302 offen gelegt. In diesem Fall wird auch ein neuronales
Netz verwendet, dessen Eingangssignal aus einem in mehrfachen Stufen
gefilterten Signal besteht. Das Ziel jenes Systems ist es, das Erkennen
von Erscheinungsformen aus der Sprache zu verbessern. Beide Systeme
haben Schwierigkeiten, Schallsignale zu analysieren, da sie nicht
die Signalstärken
unterscheiden können,
die für die
Schallanalyse relevant sind. Der Grund dafür ist hauptsächlich,
dass die Signalverarbeitung vor dem neuronalen Filter wichtige Information
herausschneidet und dass die Freiheitsgrade zu beschränkt sind. Daneben
gibt es Systeme, die allein mit neuronalen Netzen arbeiten. In solchen
Systemen jedoch können
die neuronalen Netze ihre Aufgabe nicht erfüllen, weil es zu viele Freiheitsgrade
gibt. Es ist offensichtlich geworden, dass ein bestimmter Grad von
Verarbeitung des Signals erforderlich ist, bevor es einem neuronalen
Netz zugeführt
wird. Folglich erzielen die neuronalen Netze in den bekannten Systemen
nicht die beabsichtigte Wirkung, da sie entweder zuviel oder zuwenig
Information über
das Signal erhalten. Dieselben Nachteile wie die mit der Spracherkennung
verbundenen würden
entstehen, wenn versucht würde,
die oben erwähnten
Systeme zur Klassifizierung von Maschinen- oder Motorengeräuschen zu benutzen.
-
Das heute gebräuchlichste Verfahren zur Klassifizierung
solcher Geräusche
besteht darin, die Maschinen einfach mittels eines Stethoskops abzuhören. Oft
hat sich ein erfahrenes und geübtes
Ohr als das zuverlässigste
Werkzeug zur Klassifizierung und Identifizierung verschiedener Störungsgeräusche und
Dissonanzen z. B. in einem Motor herausgestellt. Offensichtlich
hat dieses Verfahren der Klassifizierung eine Reihe von Nachteilen.
Sich auf das Gehör
einer Person zu verlassen, trägt
natürlich
ein Risiko in sich, weil sich zum einen unser Gehör über die
Zeit verändert.
Daneben erfordert es eine lange Zeit, bis eine Person ihre Fähigkeit
so weit entwickelt hat, dass sie Geräusche bis zu einen Niveau erkennt, wo
Fehlinterpretationen im größtmöglichen
Maß vermieden
werden. Es ist demzufolge offensichtlich, dass es einen Bedarf für eine Vorrichtung
gibt, die die oben erwähnten
Nachteile des Standes der Technik vermeidet und die Schall analysieren
und filtern kann, um verschiedene Schalltypen und -muster genau und
zuverlässig
zu identifizieren und klassifizieren.
-
Ziele der
Erfindung
-
Ein Ziel der vorliegenden Erfindung
ist es, eine Vorrichtung zur Analyse und zum Filtern von Schall
zur Verfügung
zu stellen, die anders als die Vorrichtungen des Stands der Technik
eine zuverlässige
Klassifizierung und Erkennung verschiedener Geräuschtypen und Geräuschmuster
gestattet.
-
Ein weiteres Ziel der Erfindung ist
es, ein zuverlässiges
Verfahren zum Analysieren und Filtern von Schall zur Verfügung zu
stellen.
-
Übersicht über die
Erfindung
-
Entsprechend der Erfindung sind eine
Vorrichtung und ein Verfahren nach Anspruch 1 und 7 zur Verfügung gestellt
worden, um die oben erwähnten
Ziele zu erreichen. Der Vorteil der Erfindung ist es, dass die zwei
verschiedenen Arten des Filterns vor der nichtlinea ren Gewichtung
die Information wie die Größenwerte
oder Eigenwerte herausziehen, die in einem Eingangssignal enthalten
sind, das für
die Analyse und Identifikation von Schall relevant ist und die besten
Bedingungen für
eine wirksame nichtlineare Gewichtung liefert.
-
Ein Faktor, der zu der Lösung gemäß der Erfindung
beigetragen hat, ist die Erkenntnis, dass ein System zur Analyse
von Schall die Art und Weise emulieren sollte, mit der unser Gehör Geräusche analysiert,
was unten weiter besprochen wird.
-
Nach einer bevorzugten Ausführungsform der
in Anspruch 2 definierten Vorrichtung besteht die Gewichtungseinrichtung
aus einem neuronalen Netz. Die Filterkombination ist besonders geeignet
für die Verwendung
mit einem neuronalen Netz, das dadurch mit einem Signal mit einer
geeigneten Anzahl von Freiheitsgraden versehen wird.
-
Wie oben erwähnt gibt es bis heute keine
bestehende Technik, die auch nur annähernd die Fähigkeit des menschlichen Ohres
erreicht, wenn es um das Analysieren des Geräusches von z. B. einem Motor
geht. Darüber
hinaus gibt es kein bekanntes System, das mit dem menschlichen Ohr
konkurrieren kann, wenn es um die Identifizierung einer bestimmten
Stimme geht. Jedoch ist es eine Anforderung einer Schallidentifizierung,
dass die hörende
Person den spezifischen Klang „erlernt" hat, d. h. das neuronale
System und das Gehirn müssen
in der Lage sein, das Geräusch
auf vorangegangene Erfahrung zu beziehen, um es zu erkennen. Folglich
gründet sich
die Erfindung auf der Einsicht, dass man ein optimales, durchtrainiertes
menschliches Ohr mit seinem angeschlossenen neuronalen System emulieren
muss, um Schall am besten zu analysieren. Um Schall auf zuverlässige Weise
zu analysieren, muss man vor allem feststellen, dass das neuronale
System, welches für
die Bewertung der dem Ohr zugeführten
Signale verantwortlich ist, nicht als linear anzusehen ist. Unser
Gehör reagiert
im Gegenteil auf eine nichtlineare Weise z. B. auf Frequenzwechsel. Folglich
basiert die vorliegende Erfindung auch auf der Einsicht, dass menschliches
Hören als
ein nichtlineares System zu betrachten ist.
-
Kurzbeschreibung
der Zeichnungen
-
1 zeigt
ein Blockdiagramm der Vorrichtung zum Analysieren und Filtern von
Schall nach einer bevorzugten Ausführungsform der vorliegenden Erfindung.
-
2 zeigt
ein Blockdiagramm der Vorrichtung zum Analysieren und Filtern von
Schall nach einer anderen bevorzugten Ausführungsform der vorliegenden
Erfindung.
-
3 zeigt
ein Ablaufdiagramm des Verfahrens zum Analysieren und Filtern von
Schall nach einer bevorzugten Ausführungsform der vorliegenden Erfindung.
-
Beschreibung
bevorzugter Ausführungsformen
-
Die Erfindung wird unten mit Bezug
zu den begleitenden Zeichnungen genauer beschrieben.
-
1 zeigt
ein Blockdiagramm der Vorrichtung 1 zum Analysieren und
Filtern von Schall nach einer bevorzugten Ausführungsform der vorliegenden
Erfindung. Die Vorrichtung 1 umfasst einen frequenzlinearen
Filter 2, einen frequenzlogarithmischen Filter 3 und
eine Gewichtungseinrichtung 4. In dieser Ausführungsform
besteht die Gewichtungseinrichtung 4 aus einem neuronalen
Filter. Der lineare Filter 2 besitzt 800 Linien und der
logarithmische Filter 3 hat 32 Ein-Drittel-Oktavbänder. Das
ergibt insgesamt 832 Zeitsignale, die mittels des neuronalen Netzes 4 kombiniert
und nichtlinear gewichtet werden.
-
Die Aufgabe der Filterbänke ist
es, ein Eingangssignal derart zu filtern, dass nur die Parameter, welche
für die
Analyse des Schalls von Interesse sind, durchgelassen werden. Ein
derartiges Aussortieren von relevanter Information ist wegen der
Charakteristiken der parallelen Filterbänke möglich. Wie wohl bekannt ist,
besitzen frequenzlineare Filter feste Filterbandweiten und folglich
feste Werte wie z. B. ein konstantes Integrationsintervall und eine
konstante Varianz, während
diese Werte in frequenzlogarithmischen Filtern variieren. Diese
parallele Kombination von linearen und logarithmischen Filtern ist
beim Filtern und Analysieren von Schall notwendig, weil Schall aus
nichtstationären
Signalen zusammengesetzt ist. Es ist natürlich sehr wichtig, die nichtstationären Charakteristiken
des Schalls zu berücksichtigen,
aber trotzdem hat der Stand der Technik diese Tatsache nicht vollständig als
seinen Startpunkt hergenommen, sondern hat stattdessen in einigen
Fällen
Schall mit einem stationären
Signal angenähert.
-
Einige mögliche Parameter des Signals
können
in dem nachfolgenden Gewichtungsprozess berücksichtigt werden. Einige davon
sind Niveaustärken,
Energiegehalt und Zeit dauer. Zusätzlich
werden Vergleiche zwischen den Ausgangssignalen vom logarithmischen
Filter und vom linearen Filter berücksichtigt. Zum Beispiel sehen
Signale, die Oberschwingungen enthalten, im Ein-Drittel-Oktavband ganz
anders aus als im Schmalband. Das bedeutet, es ist möglich Harmonien
und Disharmonien festzustellen, indem die Anwesenheit von Signalkomponenten
in den jeweiligen Bändern
der linearen und logarithmischen Filter verglichen wird. Das Ausführen dieser
Harmonieanalyse bedeutet, die Funktion des menschlichen Gehörs zu emulieren.
Um darüber
hinaus die Analogie mit dem menschlichen Gehör weiterzuführen, berücksichtigt die vorliegende
Erfindung die Tatsache, dass eine Person ein Geräusch früher gehört haben muss, um es identifizieren
zu können. Demzufolge
verwendet die Vorrichtung nach der vorliegenden Erfindung Lernfolgen
mit verschiedenen Schallmustern, wie die Stimme einer bestimmten Person,
das Geräusch
eines abgenutzten Lagers in einem Motor usw., um das System zu lehren,
diese Muster zu erkennen. Information bezüglich der Klassifizierung wie „verschlissenes
Lager" oder „gutes Lager" wird jedem neuen
Schall so hinzugefügt,
dass das System das Geräusch
identifizieren kann, wenn es dieses beim nächsten Mal hört. Das
Erlernen eines neuen Geräusches
bedeutet also, dass eine nichtlineare Gewichtung der Eingangssignale
von den Filterbänken
ausgeführt
wird, und diese nichtlineare Gewichtung dann zur nachfolgenden Identifikation ähnlicher
Geräusche
gespeichert und klassifiziert wird.
-
Die tatsächliche Entscheidung über die
Identifizierung entsteht in einer Entscheidungseinrichtung 5.
Nach dieser Ausführungsform
ist die Entscheidungseinrichtung 5 in der Gewichtungseinrichtung 4 untergebracht. 2 zeigt eine andere Ausführungsform,
bei der die Entscheidungseinrichtung 5 außerhalb
des neuronalen Netzes 4 angeordnet ist. Die Entscheidungseinrichtung 5 trifft
Entscheidungen auf der Grundlage der erlernten Sequenzen und Klassifizierungen.
Nach dem Filtern und nichtlinearen Gewichten wird ein Eingangssignal
für die
Vorrichtung 1 mit den früher erlernten Geräuschen verglichen
und die wahrscheinlichste Antwort wird in der Entscheidungseinrichtung 5 als
die Identität
des Signals ausgewählt.
-
3 zeigt
ein Ablaufdiagramm des Verfahrens zum Analysieren und Filtern von
Schall nach einer bevorzugten Ausführungsform der vorliegenden Erfindung.
Das Eingangssignal für
die Vorrichtung 1 wird in Schritt A parallel gefiltert,
nachdem es dem frequenzlinearen Filter 2 und dem frequenzlogarithmischen
Filter 3 parallel zugeführt
wurde. Im nachfolgenden Schritt B werden die sich aus den beiden
Filtern 2, 3 ergebenden Aus gangssignale zusammengeführt und
in dem neuronalen Netz 4 nach der obigen Beschreibung nichtlinear
gewichtet. Schließlich wird
in Schritt C das Signal vom neuronalen Netz 4 der Entscheidungseinrichtung 5 zugeführt, wo
im Hinblick auf die Identität
des Signals eine Entscheidung getroffen wird.
-
Entsprechend stellt die vorliegende
Erfindung eine zuverlässige
Schallanalyse durch Emulation des menschlichen Gehörs zur Verfügung. Die
parallelen Filterbänke
brechen ein Schallsignal auf seine Komponenten herunter, und die
Gewichtungseinrichtung gewichtet und kombiniert diese Komponenten
nichtlinear auf der Grundlage von Werten, die für das menschliche Gehör relevant
sind, wie Niveaus, Harmonien, usw. Die Gewichtung wird dann abgespeichert
und klassifiziert, um bei der Identifizierung eines Geräusches benutzt
zu werden, wobei die gespeicherte Gewichtung mit der Gewichtung
des zu identifizierenden Geräusches
verglichen wird.
-
Alternative
Ausführungsformen
-
Abänderungen der Vorrichtung und
des Verfahrens nach der Erfindung sind innerhalb des Umfangs der
Erfindung möglich.
Es folgen einige Beispiele solcher Abänderungen.
-
Die Vorrichtung und das Verfahren
nach der Erfindung können
auch eingesetzt werden, um ein besonderes Signal zu erzeugen. In
diesem Fall wird das System in einem wie oben erläuterten
Lernprozess trainiert, und dann benutzt es die gespeicherten Gewichtungen,
um eine Kopie des erlernten Signals zu erzeugen.
-
Nach einer bevorzugten Ausführungsform wird
die Anzahl der Linien des frequenzlinearen Filters mit 800 angegeben,
aber es sind auch in Abhängigkeit
von der Art der Anwendung andere Linienzahlen möglich. Das trifft auch auf
die Bänder
des frequenzlogarithmischen Filters zu, die durch nichts auf 32
Ein-Drittel-Oktavbänder
begrenzt sind, da in Abhängigkeit
von der Anwendung mehr oder weniger Bänder verschiedener Arten geeignet
sein können.
-
Ähnlich
können
sich auch die Parameter, welche beim Gewichten benutzt werden, auf
der Grundlage der gewünschten
Charakteristiken der Vorrichtung nach der Erfindung verändern.
-
Das nichtlineare Gewichten kann anstelle
eines neuronalen Netzes durch analoge oder digitale Systeme erreicht
werden. Diese Systeme können
abhängig
von der in Frage stehenden Anwendung mehr oder weniger feste Filterstrukturen
aufweisen.
-
Es kann möglich sein, den frequenzlogarithmischen
Filter mit Hilfe von Wellentransformationen zu erzielen.