DE10129720B4 - Lautverarbeitungsvorrichtung und -verfahren - Google Patents

Lautverarbeitungsvorrichtung und -verfahren Download PDF

Info

Publication number
DE10129720B4
DE10129720B4 DE2001129720 DE10129720A DE10129720B4 DE 10129720 B4 DE10129720 B4 DE 10129720B4 DE 2001129720 DE2001129720 DE 2001129720 DE 10129720 A DE10129720 A DE 10129720A DE 10129720 B4 DE10129720 B4 DE 10129720B4
Authority
DE
Germany
Prior art keywords
signal
unit
classification
feature vectors
input side
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE2001129720
Other languages
English (en)
Other versions
DE10129720A1 (de
Inventor
Gerhard Manteuffel
Peter-Christian Schön
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FORSCHUNGSINSTITUT fur DIE BIOLOGIE LANDWIRTSCHAFTLICHER NUTZTIERE
Original Assignee
FORSCHUNGSINSTITUT fur DIE BIOLOGIE LANDWIRTSCHAFTLICHER NUTZTIERE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FORSCHUNGSINSTITUT fur DIE BIOLOGIE LANDWIRTSCHAFTLICHER NUTZTIERE filed Critical FORSCHUNGSINSTITUT fur DIE BIOLOGIE LANDWIRTSCHAFTLICHER NUTZTIERE
Priority to DE2001129720 priority Critical patent/DE10129720B4/de
Publication of DE10129720A1 publication Critical patent/DE10129720A1/de
Application granted granted Critical
Publication of DE10129720B4 publication Critical patent/DE10129720B4/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices

Abstract

Lautverarbeitungsvorrichtung (10) zur Analyse nichtsprachlicher Lautäußerungen mit
– zumindest einem Mikrofon (12) zur Bereitstellung eines analogen Eingangssignals,
– einer eingangsseitig mit dem Mikrofon (12) verbundenen Soundkarte (14) zur Digitalisierung des analogen Eingangssignals,
– einer eingangsseitig mit der Soundkarte (14) verbundenen Signalaufbereitungseinheit (16), welche das Digitalsignal nach einem Fensteralgorithmus in Zeitfenster einteilt (Signalfenster),
– einer eingangsseitig mit der Signalaufbereitungseinheit (16) verbundenen Analyseeinrichtung (20), ausgebildet zur Bestimmung linearer Vorhersagekoeffizienten aus dem Signalfenster, die zu einem Merkmalsvektor zusammengefasst werden,
– einer eingangsseitig mit der Analyseeinrichtung (20) verbundenen Klassifikationseinheit (24), die ausgebildet ist, den Grad einer Ähnlichkeit eingehender Merkmalsvektoren mit zuvor aufgenommenen Merkmalsvektoren, die ihrerseits bestimmten Klassen zugehörig sind, zu bestimmen und
– einer eingangsseitig mit der Klassifikationseinheit (24) verbundenen Klassifikationsschwellwerteeinheit (26), die ausgebildet ist, anhand des Grades der Ähnlichkeit eine Zuordnung der eingehenden Merkmalsvektoren zu den zuvor aufgenommenen Merkmalsvektoren vorzunehmen und in Abhängigkeit von der Zugehörigkeit der zugeordneten zuvor aufgenommenen Merkmalsvektoren Klassifikationssignale auszugeben.

Description

  • Die Erfindung betrifft eine Vorrichtung und ein Verfahren zum Verarbeiten von Lauten, insbesondere von Tierlauten.
  • Ein System zur automatischen Verarbeitung von Wildtieren stammender akustischer Daten ist aus der Europäischen Patentanmeldung EP 0 629 996 A2 bekannt. Dieses System umfasst hintereinander geschaltete Module zur Digitalisierung von Daten, zur Segmentation von Daten, zur Merkmalsextraktion, zur Verarbeitung und zur Klassifikation. Das Merkmalsextraktionsmodul bestimmt beispielsweise Cepstrum-Koeffizienten, lineare Vorhersage-Koeffizienten oder Korreletions-Koeffizienten. Das Klassifikationsmodul basiert auf einem mehrschichtigen, vollvernetzten feedforward Perzeptron, also einem neuronalen Netz. Aufgabe dieses Systems ist es, Laute unterschiedlicher Tiere voneinander zu unterscheiden, indem aufgenommene Laute bestimmten Tierarten zugeordnet werden. Entsprechend wird das neuronale Netz trainiert.
  • Im Unterschied zum Stand der Technik liegt der Erfindung die Aufgabe zu Grunde, Laute einer Spezies, insbesondere Laute von Nutztieren, dahingehend zu analysieren, dass Aufschlüsse über das Befinden oder den Gesundheitszustand des lautgebenden Wesens gewonnen werden. Es geht also nicht darum, Laute nach ihrer Herkunft zu unterscheiden, sondern Lautäußerungen einer Spezies bzw. eines Wesens hinsichtlich der Befindlichkeit des lautgebenden Wesens zu differenzieren, beispielsweise dahingehend, ob sich das lautgebende Wesen gerade in einer Stresssituation befindet, oder in einem entspannten Zustand.
  • Aus der DE 195 33 541 C1 ist ein Verfahren zur automatischen Steuerung eines oder mehrer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und eine dazugehörige Vorrichtung zur Ausführung des Verfahrens bekannt. Eine Analyse nichtsprachlicher Lautäußerungen erfolgt nicht.
  • Ein wesentlicher Beitrag zur Lösung dieser Aufgabe besteht in der der Erfindung zu Grunde liegenden Erkenntnis, dass aus den Lautäußerungen insbesondere einer Tierart auf das Befinden des Tieres oder einer Mehrzahl von Tieren geschlossen werden kann. Basierend auf dieser Erkenntnis besteht die Lösung der Aufgabe weiterhin in einer Lautverarbeitungsvorrichtung zur Analyse nichtsprachlicher Lautäußerungen mit
    • – zumindest einem Mikrofon zur Bereitstellung eines analogen Eingangssignals,
    • – einer eingangsseitig mit dem Mikrofon verbundenen Soundkarte zur Digitalisierung des analogen Eingangssignals,
    • – einer eingangsseitig mit der Soundkarte verbundenen Signalaufbereitungseinheit, welche das Digitalsignal nach einem Fensteralgorithmus in Zeitfenster einteilt (Signalfenster),
    • – einer eingangsseitig mit der Signalaufbereitungseinheit verbundenen Analyseeinrichtung, ausgebildet zur Bestimmung linearer Vorhersagekoeffizienten aus dem Signalfenster, die zu einem Merkmalsvektor zusammengefasst werden,
    • – einer eingangsseitig mit der Analyseeinrichtung verbundenen Klassifikationseinheit, die ausgebildet ist, den Grad einer Ähnlichkeit eingehender Merkmalsvektoren mit zuvor aufgenommenen Merkmalsvektoren, die ihrerseits bestimmten Klassen zugehörig sind, zu bestimmen und
    • – einer eingangsseitig mit der Klassifikationseinheit verbundenen Klassifikationsschwellwerteeinheit, die ausgebildet ist, anhand des Grades der Ähnlichkeit eine Zuordnung der eingehenden Merkmalsvektoren zu den zuvor aufgenommenen Merkmalsvektoren vorzunehmen und in Abhängigkeit von der Zugehörigkeit der zugeordneten zuvor aufgenommenen Merkmalsvektoren Klassifikationssignale auszugeben.
  • Im Gegensatz zu dem aus der EP 0 629 996 A2 bekannten Stand der Technik werden bei der vorliegenden Erfindung also nicht Lautäußerungen verschiedener Spezies für jede Spezies einzeln gezählt, sondern jeder Laut wird unmittelbar und sofort einer Befindlichkeits-Kategorie für eine jeweilige Spezies zugeordnet, beispielsweise "Stress" oder "Nicht-Stress" und die entsprechende Kategorie durch ein Klassifika tionssignal unmittelbar angezeigt. Das Anzeigen des Klassifikationssignals kann beispielsweise darin bestehen, dass eine Leuchtanzeige immer dann zum Leuchten angesteuert wird, wenn ein Laut der Kategorie "Stress" zugeordnet wird, während die Anzeige ausgeschaltet bleibt, wenn Lautäußerungen der Kategorie "Nicht-Stress" zugeordnet werden.
  • Die Klassifikationseinheit oder Zuordnungseinheit ist somit ausgebildet, Lautäußerungen nicht nach ihrer Herkunft zu klassifizieren, sondern nach ihrer Qualität, z. B. nach Befindlichkeitskategorien insbesondere für eine Spezies. Dieser qualitative Unterschied gegenüber dem Stand der Technik beruht auf der erfindungswesentlichen Erkenntnis, dass eine solche Klassifikation oder Kategorisierung möglich ist.
  • Um Laute einer Mehrzahl von Lebewesen derart auswerten zu können, dass die Befindlichkeit einer Gruppe von Wesen unmittelbar zur Anzeige gebracht werden kann, wird eine Lautverarbeitungsvorrichtung bevorzugt, die eine Auswerteeinheit umfasst, welche mit der Klassifikationseinheit verbunden und ausgebildet ist, das Verhältnis von Lauten einer Klasse zu Lauten einer anderen Klasse für eine jeweils vorgegebene Zeiteinheit oder zu jedem Zeitpunkt zu bilden und ein entsprechendes Quotientensignal auszugeben. Das Quotientensignal ist dabei von der Art, dass der Anteil von Stress-Lauten zu Nicht-Stress-Lauten beispielsweise in Form von "60 % Stress" oder "40 % Nicht-Stress" angegeben wird. Bei dieser Lautverarbeitungsvorrichtung wird für jeden Laut eine eindeutige Zuordnung zu den Kategorien "Stress" oder "Nicht-Stress" getroffen, sodass sich der genannte Quotient entweder auf Lautäußerungen mehrerer Tiere zu einem Zeitpunkt oder über einen Zeitraum bezieht, oder auf verschiedene Lautäußerungen, die ein Tier zu verschiedenen Zeitpunkten abgibt.
  • Weiterhin wird eine Lautverarbeitungsvorrichtung bevorzugt, die einen Speicher umfasst, der mit der Klassifikationseinheit und/oder der Auswerteeinheit verbunden und ausgebildet ist, die Klassifikationssignale bzw. die Quotientensignale chronologisch zu speichern. Damit ist die Lautverarbeitungsvorrichtung insbesondere geeignet, beispielsweise zur Überwachung von Tiertransporten eingesetzt zu werden, um nach Ende des Tiertransportes durch Auslesen des Speichers festzustellen, ob die Tiere gelitten haben oder nicht. Gleiches gilt für die Überwachung der Stallhaltung von Tieren, oder die Stressbelastung der Tiere bei der Schlachtung.
  • Die Klassifikationseinheit ist vorzugsweise als neuronales Netz ausgebildet und zwar besonders bevorzugt als Kohonennetzwerk, welches die aus den linearen Vorhersagekoeffizienten gebildeten Merkmalsvektoren als Eingabevektoren verarbeitet. Ein solches Kohonennetzwerk aber auch andere neuronale Netzwerke, wie beispielsweise ein alternativ in Frage kommendes Perzeptoren-Netzwerk, werden mit Trainingslauten trainiert, die den zu ermittelnden Kategorien wie beispielsweise "Stress" oder "Nicht-Stress" zugeordnet sind. Das bei der erfindungsgemäßen Lautverarbeitungsvorrichtung eingesetzte neuronale Netzwerk unterscheidet sich somit von dem aus der EP 0 629 996 A2 bekannten neuronalen Netzwerk schon allein dadurch, dass das neuronale Netzwerk bei der erfindungsgemäßen Lautverarbeitungsvorrichtung mit Trainingslauten trainiert ist, welche sich in ihrer Qualität unterscheiden, während das aus der EP 0 629 996 A2 bekannte neuronale Netzwerk mit solchen Signalen trainiert ist, welche ihrer Herkunft nach unterschiedlich sind.
  • Vorzugsweiseumfasst die Lautverarbeitungsvorrichtung mehrere Tonsignaleingänge. Jedem dieser Tonsignaleingänge ist vorzugsweise ein Eingangsverstärker und ein Eingangsfilter nachgeschaltet, mit dem jedes Tonsignal für eine Analyse durch die Analysevorrichtung durch verstärken und filtern aufbereitet wird und als aufbereitetes Tonsignal an die Analyseeinrichtung weitergegeben wird.
  • Insbesondere für die bereits erwähnte Überwachung von Tiertransporten oder der Tierhaltung in Ställen oder zu anderen Zwecken ist die Lautverarbeitungsvorrichtung vorzugsweise als autarke Einheit mit integrierter Energieversorgung und einem festen, gegen unbefugten Zugriff zu sicherndem Gehäuse ausgebildet. Dabei ist vorzugsweise in die als autarke Einheit ausgebildete Lautverarbeitungsvorrichtung ein Mikrofon integriert oder zumindest ein Mikrofoneingang. Eine solche autarke Einheit ist geeignet, über einen längeren Zeitraum das Auftreten von Stresslauten zu registrieren, ggf. in einer dem vorgenannten Quotientensignal entsprechend aufbereiteten Form um so die Kontrolle der Qualität der Tierhaltung zu ermöglichen. Damit ist es erstmals möglich, auch solche bisher nicht zu kontrollierenden Einflussfaktoren auf die Tierproduktion, wie beispielsweise das Wohlbefinden der Tiere, zu kontrollieren. Diese Einflussgröße ist bekanntermaßen beispielsweise für die Fleischqualität höchst relevant, da diese durch Stresshormone beeinträchtigt wird. Die Erfindung ermöglicht es somit, dem Verbraucher die von ihm gewünschte Sicherheit bezüglich der Fleischqualität und der Qualität der Tierhaltung zu geben.
  • Die der Erfindung zu Grunde liegende Aufgabe, insbesondere die Echtzeit-Analyse von Tierlauten hinsichtlich ihrer Qualität, wird auch durch ein Lautverarbeitungsverfahren gelöst, bei dem
    • – über zumindest ein Mikrofon ein analogen Eingangssignal aufgenommen wird,
    • – das analoge Eingangssignal in einer eingangsseitig mit dem Mikrofon verbundenen Soundkarte digitalisiert wird,
    • – das Digitalsignal in einer eingangsseitig mit der Soundkarte verbundenen Signalaufbereitungseinheit nach einem Fensteralgorithmus in Zeitfenster eingeteilt wird (Signalfenster),
    • – aus dem Signalfenster in einer eingangsseitig mit der Signalaufbereitungseinheit verbundenen Analyseeinrichtung lineare Vorhersagekoeffizienten bestimmt und zu einem Merkmalsvektor zusammengefasst werden,
    • – in einer eingangsseitig mit der Analyseeinrichtung verbundenen Klassifikationseinheit der Grad einer Ähnlichkeit eingehender Merkmalsvektoren mit zuvor aufgenommenen Merkmalsvektoren, die ihrerseits bestimmten Klassen zugehörig sind, bestimmt wird und
    • – anhand des Grades der Ähnlichkeit in einer eingangsseitig mit der Klassifikationseinheit verbundenen Klassifikationsschwellwerteeinheit eine Zuordnung der eingehenden Merkmalsvektoren zu den zuvor aufgenommenen Merkmalsvektoren vorgenommen wird und in Abhängigkeit von der Zugehörigkeit der zugeordneten zuvor aufgenommenen Merkmalsvektoren Klassifikationssignale ausgegeben werden.
  • Das Klassifizieren erfolgt vorzugsweise unter Anwendung eines neuronalen Netzes, insbesondere unter Anwendung eines Perzeptrons oder Kohonen-Verfahrens. Das entsprechende neuronale Netz wird dazu vorzugsweise mit vorgegebenen Trainingslauten unterschiedlicher Qualität trainiert.
  • Weitere bevorzugte Verfahrensschritte betreffen einen Auswertungsschritt, bei dem das Verhältnis von einer Klasse von Lauten zu einer anderen Klasse von Lauten gebildet und ein entsprechendes Quotientensignal erzeugt wird sowie zusätzlich oder alternativ einen Schritt des chronologischen Speicherns von Klassifikations- und/oder Quotientensignalen.
  • Die Erfindung soll nun an einem Ausführungsbeispiel anhand der Figuren näher erläutert werden. Von den Figuren zeigen
  • 1 ein Blockschaltbild einer erfindungsgemäßen Lautverarbeitungsvorrichtung und
  • 2 eine diagrammatische Darstellung eines Verfahrens zum Betreiben der Vorrichtung aus 1.
  • 1 zeigt die Komponenten einer Lautverarbeitungsvorrichtung, die sich vorzugsweise in einem Gehäuse befinden, welches gegen Zugriff gesichert werden kann. Damit die Lautverarbeitungseinrichtung autark operieren kann, befindet sich in dem Gehäuse eine in 1 nicht dargestellte Energieversorgungseinheit, beispielsweise eine Batterie.
  • Die Komponenten der in 1 dargestellten Lautverarbeitungsvorrichtung 10 sind ein Mikrofon 12, welches ein analoges Eingangssignal liefert, das an eine Soundkarte 14 weitergeleitet wird, in der das analoge Eingangssignal digitalisiert wird, sodass ein Digitalsignal mit einer Samplingfrequenz von in dem Ausführungsbeispiel 22.050 Hz mit 16 Bit Auflösung entsteht.
  • Ausgangsseitig ist die Soundkarte mit einer Signalaufbereitungseinheit 16 verbunden, welche das Digitalsignal empfängt und nach einem Fensterungsalgorithmus in Zeitfenster von in dem Ausführungsbeispiel 46,4 ms Dauer einteilt. Ausgangsseitig gibt die Aufbereitungseinheit 16 jedes Signalfenster auf eine Aufnahmeschwellwerteinheit 18, die ausgebildet ist, solche Signalfenster, in denen das Signal eine unter einem Schwellwert liegende Amplitude hat, von der weiteren Verarbeitung auszunehmen. Signalfenster, in denen das Signal eine größere als durch den Schwellwert vorgegebene Amplitude hat, werden ausgangsseitig normiert und auf eine LPC-Modellierungseinheit 20 gegeben. Mit der Normierung der Signalfenster wird erreicht, dass vom Mikrofon weit entfernte Laute genauso behandelt werden, wie Laute dicht am Mikrofon. Gleichzeitig wird eine Leuchtanzeige 22, beispielsweise eine LED so angesteuert, dass diese leuchtet, wenn Signalfenster an die LPC-Modellierungseinheit 20 weitergeleitet werden, und dass die Anzeige erlischt, wenn Signalfenster von der Weiterverarbeitung ausgeblendet werden. Diese Leuchtanzeige 22 zeigt somit an, ob Lautsignale für die Weiterverarbeitung aufgenommen werden, oder ob keine Tonsignalverarbeitung und damit – aufnahme erfolgt.
  • Die LPC-Modellierungseinheit 20 ist eine Analyseeinrichtung, welche einen Algorithmus zur Bestimmung linearer Vorhersagekoeffizienten auf das entsprechende Signalfenster anwendet und auf diese Weise einen Satz linearer Vorhersagekoeffizienten für dieses Signalfenster bildet (LPC: Linear Prediction Coding = lineare Vorhersagenkodierung). Die LPC-Modellierungseinheit oder Analyseeinrichtung 20 bildet aus den linearen Vorhersagekoeffizienten für jedes Signalfenster einen Merkmalsvektor, der ausgangsseitig an eine Klassifikationseinheit 24 weitergeleitet wird.
  • Die Klassifikationseinheit 24 wird im Wesentlichen von einem neuronalen Netz gebildet, welches als Kohonen-Netz oder auch als Perzeptron ausgebildet sein kann. Bei einem derartigen neuronalen Netz wird auf an sich bekannte Art und Weise jeder eingehende Merkmalsvektor so verarbeitet, dass sich über den Grad seiner Ähnlichkeit mit zuvor aufgenommenen Merkmalsvektoren eine Zuordnung zu diesen zuvor aufgenommenen Merkmalsvektoren und damit eine Klassifikation des jeweils aktuellen Merkmalsvektor erzielen lässt.
  • Je nach Ausbildung des neuronalen Netzes ergibt sich eine den Grad der Ähnlichkeit des aktuellen Merkmalsvektors mit dem oder den Vergleichsvektoren kennzeichnende Größe. Für diese Größe kann ein Schwellwert vorgesehen sein, mit dem die Zugehörigkeit eines aktuellen Merkmalsvektors zu einer durch die Vergleichsvektoren oder durch den Vergleichsvektor definierten Klasse eindeutig definiert ist. Dies ist in 1 durch eine Klassifikationsschwellwerteinheit 26 dargestellt, die durchaus als Unterbestandteil der Klassifikationseinheit 24 betrachtet werden kann.
  • Die Klassifikationsschwellwerteeinheit 26 gibt ein der eindeutigen Klassifikation des jeweiligen Signalfensters und damit des entsprechenden Lautes zugeordnetes Klassifikationssignal aus. Wenn die Klassifikationseinheit 24 mit Merkmalsvektoren trainiert wurde, die solchen Lauten entsprechen, wie sie bei Stress eines Tieres ausgestoßen werden, zeigt das Klassifikationssignal, ob ein aktueller Laut der Klasse "Stress" oder "Nicht-Stress" zuzuordnen ist. Das Klassifikationssignal wird einerseits in einem Speicher 28 gespeichert, der vorzugsweise als LIFO-Speicher ausgebildet ist, also ein last in – first out Speicher, in dem eine Folge von Klassifikationssignalen entsprechend einer Folge von Signalfenstern abgelegt ist und ein jeweils aktuelles Klassifikationssignal zur Folge hat, dass das jeweils älteste Klassifikationssignal aus dem Speicher fällt, falls der Speicher gefüllt ist. Der Speicher 28 ist mit einer Anzeige 30 verbunden, die anzeigt, bis zu welchem Grad der Speicher 28 mit Klassifikationssignalen der Klasse "Stress" gefüllt ist. Die Anzeige 30 fungiert als Quotientenanzeige und kann auch durch einen Quotienten- und/oder Klassifikationsspeicher ersetzt werden, sodass der prozentuale Anteil der Zeit mit Stresslautgebung bezogen auf ein vorgegebenes Messzeitfenster protokolliert wird.
  • Außerdem ist die Klassifikationseinheit 24 mit der Schwellwerteinheit 26 auch mit einer zweiten Leuchtanzeige 34 verbunden, die eingeschaltet wird, wenn ein aktueller Laut einer jeweils interessierenden Klasse, beispielsweise der Klasse "Stress" zugeordnet wird und ansonsten ausgeschaltet bleibt. Die Ansteuerung der zweiten Leuchtanzeige 34 erfolgt somit in Abhängigkeit des Klassifikationssignals, welches von der aus Schwellwerteinheit 26 und neuronalen Netz 24 bestehenden Klassifikationseinheit stammt.
  • In 2 ist ein Verfahren zum Betreiben der Vorrichtung aus 1 diagrammhaft dargestellt.
  • 2 ist insbesondere zu entnehmen, dass sich das Verfahren zum Betreiben der Vorrichtung aus 1 in zwei wesentliche Phasen gliedert, nämlich in eine Trainingsphase und in eine anschließende Klassifikationsphase.
  • In der Traininsgphase wird die Vorrichtung aus 1 mit bekannten Lauten beaufschlagt, die mit bekannten Verhaltenssituationen einer interessierenden Spezies, beispielsweise mit Stressverhalten einhergehen. Für die bekannten Laute wird nach entsprechender Signalaufbereitung wie sie zuvor beschrieben wurde, eine LPC-Analyse durchgeführt, die für jeden Laut zu einem Satz linearer Vorhersagekoeffizienten führt, die als Merkmalsvektoren, insbesondere als Referenzvektoren auf ein neuronales Netz gegeben werden und dieses trainieren. Das neuronale Netz kann r. B. als Perzeptron oder als Kohonen-Netz ausgebildet sein. Durch die von den linearen Vorhersagekoeffizienten bestimmten Vergleichsvektoren bilden sich in der Representation z. B. eines Kohonen-Netzes bestimmte Bereiche aus, die für be stimmte Verhaltenssituationen charakteristischen Lauten zugeordnet sind. Zur eindeutigen Zuordnung dieser Bereiche z. B. in der Kohonen-Representation wird dem Kohonen-Netz mit jedem Trainingslaut auch die dazugehörige Verhaltenssituation, beispielsweise "Stress" oder "Nicht-Stress" aufgegeben, sodass jede für bestimmte Laute charakteristische Region in der Kohonen-Darstellung mit dem dazugehörigen Verhalten verknüpft ist. Dies ist in 2 als "Labeln des Netzes" bezeichnet.
  • Das Ergebnis dieser Trainingsphase ist ein gelabeltes Netz, in dem Regionen z. B. in der Kohonen-Darstellung durch Referenzvektoren definiert und bestimmten Verhaltenssituationen zugeordnet sind. Nach Abschluss der Trainingsphase kann die Vorrichtung aus 1 beispielsweise in einem Stall oder in einem Tiertransportfahrzeug zur Klassifikation bis dahin unbekannter Laute eingesetzt werden.
  • Dies geschieht in der Klassifikationsphase. In dieser werden der Vorrichtung unbekannte Laute zugeführt und auf gleiche Weise wie zuvor die bekannten Laute einer LPC-Analyse unterzogen um so einen Vektor linearer Vorhersagekoeffizienten für jeden Laut zu erhalten. Ein solcher Merkmalsvektor wird zur Klassifikation auf das gelabeltes Netz gegeben. Das Netz ordnet den Merkmalsvektor des unbekannten Lautes in an sich bekannter Weise einer der zuvor in der Trainingsphase definierten Region zu und liefert als Ausgangswert die Verhaltenssituation, die dieser Region zugeordnet ist, beispielsweise "Stress" oder "Nicht-Stress". Auf diese Weise wird ein eindeutiges Klassifikationssignal für die unbekannten Laute geliefert und kann in der zuvor geschilderten Weise angezeigt oder gespeichert werden (1).

Claims (13)

  1. Lautverarbeitungsvorrichtung (10) zur Analyse nichtsprachlicher Lautäußerungen mit – zumindest einem Mikrofon (12) zur Bereitstellung eines analogen Eingangssignals, – einer eingangsseitig mit dem Mikrofon (12) verbundenen Soundkarte (14) zur Digitalisierung des analogen Eingangssignals, – einer eingangsseitig mit der Soundkarte (14) verbundenen Signalaufbereitungseinheit (16), welche das Digitalsignal nach einem Fensteralgorithmus in Zeitfenster einteilt (Signalfenster), – einer eingangsseitig mit der Signalaufbereitungseinheit (16) verbundenen Analyseeinrichtung (20), ausgebildet zur Bestimmung linearer Vorhersagekoeffizienten aus dem Signalfenster, die zu einem Merkmalsvektor zusammengefasst werden, – einer eingangsseitig mit der Analyseeinrichtung (20) verbundenen Klassifikationseinheit (24), die ausgebildet ist, den Grad einer Ähnlichkeit eingehender Merkmalsvektoren mit zuvor aufgenommenen Merkmalsvektoren, die ihrerseits bestimmten Klassen zugehörig sind, zu bestimmen und – einer eingangsseitig mit der Klassifikationseinheit (24) verbundenen Klassifikationsschwellwerteeinheit (26), die ausgebildet ist, anhand des Grades der Ähnlichkeit eine Zuordnung der eingehenden Merkmalsvektoren zu den zuvor aufgenommenen Merkmalsvektoren vorzunehmen und in Abhängigkeit von der Zugehörigkeit der zugeordneten zuvor aufgenommenen Merkmalsvektoren Klassifikationssignale auszugeben.
  2. Lautverarbeitungsvorrichtung (10) nach Anspruch 1, gekennzeichnet durch eine Auswerteeinheit, die mit der Klassifikationseinheit (24) verbunden und ausgebildet ist, das Verhältnis von Lauten einer Klasse zu Lauten einer anderen Klasse für eine vorgegebene Zeiteinheit oder zu jedem Zeitpunkt zu bilden und ein entsprechendes Quotientensignal auszugeben.
  3. Lautverarbeitungsvorrichtung (10) nach Anspruch 1 oder 2, gekennzeichnet durch einen Speicher (28), der mit der Klassifikationseinheit (24) und/oder Auswerteeinheit verbunden und ausgebildet ist, die Klassifikationssignale und/oder die Quotientensignale chronologisch zu speichern.
  4. Lautverarbeitungsvorrichtung (10) nach einem der Ansprüche 1 bis 3 dadurch gekennzeichnet, dass die Klassifikationseinheit (24) als neuronales Netzwerk ausgebildet ist.
  5. Lautverarbeitungsvorrichtung (10) nach Anspruch, dadurch gekennzeichnet, dass das neuronale Netzwerk als Kohonen-Netzwerk ausgebildet ist.
  6. Lautverarbeitungsvorrichtung (10) nach einem der Ansprüche 1 bis 5, gekennzeichnet durch mehrere Tonsignaleingänge.
  7. Lautverarbeitungsvorrichtung (10) nach einem der Ansprüche 1 bis 6, gekennzeichnet durch eine Ausbildung als autarke Einheit mit integrierter Energieversorgung und einem festen, gegen unbefugten Zugriff gesicherten Gehäuse.
  8. Lautverarbeitungsverfahren zur Analyse nichtsprachlicher Lautäußerungen, gekennzeichnet durch die Schritte, daß – über zumindest ein Mikrofon (12) ein analogen Eingangssignal aufgenommen wird, – das analoge Eingangssignal in einer eingangsseitig mit dem Mikrofon (12) verbundenen Soundkarte (14) digitalisiert wird, – das Digitalsignal in einer eingangsseitig mit der Soundkarte (14) verbundenen Signalaufbereitungseinheit (16) nach einem Fensteralgorithmus in Zeitfenster eingeteilt wird (Signalfenster), – aus dem Signalfenster in einer eingangsseitig mit der Signalaufbereitungseinheit (16) verbundenen Analyseeinrichtung (20) lineare Vorhersagekoeffizienten bestimmt und zu einem Merkmalsvektor zusammengefasst werden, – in einer eingangsseitig mit der Analyseeinrichtung (20) verbundenen Klassifikationseinheit (24) der Grad einer Ähnlichkeit eingehender Merkmalsvektoren mit zuvor aufgenommenen Merkmalsvektoren, die ihrerseits bestimmten Klassen zugehörig sind, bestimmt wird und – anhand des Grades der Ähnlichkeit in einer eingangsseitig mit der Klassifikationseinheit (24) verbundenen Klassifikationsschwellwerteeinheit (26) eine Zuordnung der eingehenden Merkmalsvektoren zu den zuvor aufgenommenen Merkmalsvektoren vorgenommen wird und in Abhängigkeit von der Zugehörigkeit der zugeordneten zuvor aufgenommenen Merkmalsvektoren Klassifikationssignale ausgegeben werden.
  9. Lautverarbeitungsverfahren nach Anspruch 8 dadurch gekennzeichnet, dass das Klassifizieren unter Anwendung eines neuronalen Netzes erfolgt.
  10. Lautverarbeitungsverfahren nach Anspruch 9 gekennzeichnet durch einen Schritt des Trainierens des neuronalen Netzes mittels vorgegebener Trainingslaute.
  11. Lautverarbeitungsverfahren nach Anspruch 9 oder 10, dadurch gekennzeichnet, dass das Klassifizieren unter Anwendung eines Kohonen-Verfahrens erfolgt.
  12. Lautverarbeitungsverfahren nach einem der Ansprüche 8 bis 11, gekennzeichnet durch einen Auswertungsschritt, bei dem das Verhältnis von einer Klasse von Lauten zu einer anderen Klasse von Lauten gebildet und ein entsprechendes Quotientensignal erzeugt wird.
  13. Lautverarbeitungsverfahren nach einem der Ansprüche 8 bis 12, gekennzeichnet durch einen Schritt des chronologischen Speicherns von Klassifikations- und/oder Quotientensignalen.
DE2001129720 2001-06-15 2001-06-15 Lautverarbeitungsvorrichtung und -verfahren Expired - Lifetime DE10129720B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE2001129720 DE10129720B4 (de) 2001-06-15 2001-06-15 Lautverarbeitungsvorrichtung und -verfahren

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2001129720 DE10129720B4 (de) 2001-06-15 2001-06-15 Lautverarbeitungsvorrichtung und -verfahren

Publications (2)

Publication Number Publication Date
DE10129720A1 DE10129720A1 (de) 2003-01-02
DE10129720B4 true DE10129720B4 (de) 2004-02-19

Family

ID=7688821

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2001129720 Expired - Lifetime DE10129720B4 (de) 2001-06-15 2001-06-15 Lautverarbeitungsvorrichtung und -verfahren

Country Status (1)

Country Link
DE (1) DE10129720B4 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE202012010238U1 (de) 2012-10-26 2014-01-29 Big Dutchman Pig Equipment Gmbh Anordnung zur Überwachung und Steuerung der Haltung von Sauen und deren Ferkel, Abferkelbox und Aktoreinheit

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0629996A2 (de) * 1993-06-15 1994-12-21 Ontario Hydro Automatisches intelligentes Überwachungssystem
DE19533541C1 (de) * 1995-09-11 1997-03-27 Daimler Benz Aerospace Ag Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0629996A2 (de) * 1993-06-15 1994-12-21 Ontario Hydro Automatisches intelligentes Überwachungssystem
DE19533541C1 (de) * 1995-09-11 1997-03-27 Daimler Benz Aerospace Ag Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens

Also Published As

Publication number Publication date
DE10129720A1 (de) 2003-01-02

Similar Documents

Publication Publication Date Title
DE60023517T2 (de) Klassifizierung von schallquellen
DE60108373T2 (de) Verfahren zur Detektion von Emotionen in Sprachsignalen unter Verwendung von Sprecheridentifikation
DE69938374T2 (de) Verfahren und Vorrichtung zur Spracherkennung mittels sowohl eines neuralen Netzwerks als auch verborgener Markov-Modelle
DE60313706T2 (de) Spracherkennungs- und -antwortsystem, Spracherkennungs- und -antwortprogramm und zugehöriges Aufzeichnungsmedium
WO2005111598A1 (de) Vorrichtung und verfahren zur beurteilung einer güteklasse eines zu prüfenden objekts
EP0862161A2 (de) Verfahren zur Spracherkennung mit Sprachmodellanpassung
DE2524804A1 (de) Verfahren und vorrichtung zur automatischen spracherkennung
DE19824354A1 (de) Vorrichtung zur Verifizierung von Signalen
DE102017006155A1 (de) Verfahren zum Betreiben eines Sensorsystems eines Fahrzeugs
DE60018690T2 (de) Verfahren und Vorrichtung zur Stimmhaft-/Stimmlos-Entscheidung
DE2021126A1 (de) Spracherkennungsvorrichtung
DE10129720B4 (de) Lautverarbeitungsvorrichtung und -verfahren
EP1519301A2 (de) Vorrichtung zur klassifikation physiologischer Ereignisse
DE10311581A1 (de) Verfahren und System zum automatisierten Erstellen von Sprachwortschätzen
DE4325404C2 (de) Verfahren zum Ermitteln und Klassifizieren von Störgeräuschtypen
DE102020202795A1 (de) Verfahren und Vorrichtung zum Komprimieren eines Neuronalen Netzes
EP1345208A2 (de) Automatische Detektion von Sprecherwechseln in sprecheradaptiven Spracherkennungssystemen
DE102020200847A1 (de) Verfahren und Vorrichtung zur Objektidentifikation basierend auf Sensordaten
EP2068305B1 (de) Verfahren zur Spracherkennung
DE10305369B4 (de) Benutzeradaptives Verfahren zur Geräuschmodellierung
DE19824353A1 (de) Vorrichtung zur Verifizierung von Signalen
WO2008095827A1 (de) Digitales verfahren zur authentifizierung einer person und anordnung zu dessen durchführung
DE102019205895A1 (de) Verfahren zum Analysieren eines zeitlich veränderlichen Signals
EP1406244B1 (de) Voice Activity Detection auf Basis von unüberwacht trainierten Clusterverfahren
DE10012145C2 (de) Verfahren und Vorrichtung zur akustischen Erkennung erkrankungsbedingter physikalischer Veränderungen des Stimmbildapparates

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R071 Expiry of right