DE60122893T2 - Verfahren, vorrichtung und programm zur sprecherkennung - Google Patents

Verfahren, vorrichtung und programm zur sprecherkennung Download PDF

Info

Publication number
DE60122893T2
DE60122893T2 DE60122893T DE60122893T DE60122893T2 DE 60122893 T2 DE60122893 T2 DE 60122893T2 DE 60122893 T DE60122893 T DE 60122893T DE 60122893 T DE60122893 T DE 60122893T DE 60122893 T2 DE60122893 T2 DE 60122893T2
Authority
DE
Germany
Prior art keywords
sound
level
sound level
speech recognition
digital
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60122893T
Other languages
English (en)
Other versions
DE60122893D1 (de
Inventor
Tomoe Nishinomiya-shi Kawane
Takeo Hirakata-shi KANAMORI
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Application granted granted Critical
Publication of DE60122893D1 publication Critical patent/DE60122893D1/de
Publication of DE60122893T2 publication Critical patent/DE60122893T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • Navigation (AREA)

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung betrifft eine Spracherkennungsvorrichtung zum Erkennen von Sprache, die von einer Person produziert wird, sowie ein Spracherkennungsverfahren und ein Spracherkennungsprogramm.
  • Hintergrund der Erfindung
  • In den letzten Jahren wurden in den mit der Spracherkennung verwandten Technologien bedeutende Fortschritte erzielt. Die Spracherkennung betrifft die automatische Erkennung menschlicher Sprache durch einen Computer oder eine Maschine. So kann der Computer oder die Maschine beispielsweise unter Verwendung des Spracherkennungsverfahrens durch menschliche Sprache bedient werden oder die menschliche Sprache kann in Text umgewandelt werden.
  • In Übereinstimmung mit einem vor allem in der Spracherkennung verwendeten Verfahren, werden natürliche Merkmale, wie etwa das Frequenzspektrum gesprochener Sprache extrahiert und mit zuvor gespeicherten Arten natürlicher Merkmale von Vokalen, Konsonanten und Wörtern verglichen. Wenn die Sprache einer Reihe nicht spezifizierter Sprecher erkannt wird, können jedoch die individuellen Unterschiede in den natürlichen Merkmale der Sprecher die akkurate Spracherkennung beeinträchtigen. Wenn die Sprache eines spezifischen Sprechers erkannt wurde, können Geräusche, die von der Umgebung verursachten werden, wie etwa die Unterschiede zwischen Tages- und Nachtgeräuschen, oder Veränderungen der natürlichen Merkmale der Sprache, die vom Gesundheitszustand des Sprechers abhängen, das Spracherkennungsverhältnis senken; also mit anderen Worten, die akkurate Spracherkennung kann nicht durchgeführt werden.
  • In 13 ist ein schematisches Diagramm zu sehen, welches ein Beispiel für die Beziehung zwischen dem Schallpegel und dem Erkennungsverhältnis der Spracherkennung zeigt. Im in 13 dargestellten Diagramm steht die Ordinate für die Erkennungsrate (%), während die Abszisse den Schallpegel (dB) repräsentiert.
  • Hierin bezeichnet der Schallpegel den Pegel der Sprechleistung. Bei 0 dB beträgt etwa der Belastungswiderstand 600 Ω, die Klemmenspannung 0,775 V und der Leistungsverbrauch 1 mW.
  • Wie in 13 zu sehen, wird das Erkennungsrate, in Übereinstimmung mit herkömmlichen Spracherkennungsverfahren, gesenkt, wenn der Schallpegel unter –19 dB Marke fällt oder auf mehr als –2 dB steigt.
  • Gemäß herkömmlicher Spracherkennungsverfahren ist die Erkennungsrate im Bereich des vorgespeicherten Schallpegels, der die Art der natürlichen Merkmale von Vokalen, Konsonanten oder Wörtern darstellt, hoch. Besonders der vorgespeicherte Schallpegel und ein Eingangs-Schallpegel werden zur Spracherkennung miteinander verglichen und daher ergeben sich für hohe und niedrige Schallpegel keine gleich hohen Erkennungsraten.
  • Das im offengelegten, japanischen Patent Nr. 59-60700 offenbarte Gebrauchsmuster ist eine Spracherkennungsvorrichtung, die den eingegebenen Schallpegel im Wesentlichen konstant hält und zwar mithilfe einer AGC-Schaltung (Automatische Verstärkungsregelung) in einem zum Eingeben des Schalls verwendeten Mikroverstärker. Im offengelegten, japanischen Gebrauchsmuster Nr. 01-137497 und im offengelegten, japanischen Patent Nr. 63-014200 wird jeweils eine Spracherkennungsvorrichtung offenbart, die dem Sprecher den Schallpegel mithilfe entsprechender Mittel mitteilt und den Sprecher dazu auffordert, mit optimalem Schallpegel zu sprechen.
  • Durch die im japanischen Gebrauchsmuster Nr. 59-60700 offenbarte Spracherkennungsvorrichtung werden jedoch unerwünschte, nicht sprachliche Geräusche durch die AGC-Schaltung verstärkt und diese verstärkten Geräusche können die Erkennungsrate mindern. Außerdem weist die eingegebene Sprache akzentuierte Teile auf, die durch die Betonung der Wörter auf Wort-Basis entstehen. Wenn daher der eingegebene Schallpegel oft oder nicht mithilfe der AGC-Schaltung verstärkt wird, ergeben sich Verzerrungen in der Wellenform der im Wesentlichen auf einen festgelegten Pegel verstärkten Sprache. Die Wellenformverzerrungen der Sprache verzerren den akzentuierten Teil jedes Wortes, welches die Betonung des Wortes darstellt, wodurch die Erkennungsrate sinkt.
  • Durch die im japanischen Gebrauchsmuster Nr. 01-137497 und im japanischen Patent Nr. 63-014200 offenbarten Spracherkennungsvorrichtungen, könnte der durch den Sprecher eingegebene Schallpegel einen vorgeschriebenen Wert wegen Veränderungen in der Umgebung oder eines schlechten Gesundheitszustands des Sprechers nicht erreichen. Wenn der Sprecher mit dem vorbestimmten Schallpegel spricht, könnte die Spracherkennungssoftware die Sprache nicht erkennen. Der durch den Sprecher bestimmte Sprachpegel ist beispielsweise ein dem Individuum innewohnendes, natürliches Merkmal und wenn der Sprecher dazu gezwungen wird, in einer anderen Art und Weise zu sprechen, würde das detektierte, natürliche Merkmal vom Original abweichen, wodurch die Erkennungsrate der Spracherkennung weiter sinken könnte.
  • Die JP-A-11-212595 offenbart eine Sprachverarbeitungsvorrichtung, in der ein durchschnittlicher Schallpegel für den Schallteil eines eingegebenen Signals bestimmt wird und Verstärkungsberechnungs-Verarbeitung zum Einstellen des eingegebenen Signals auf einen für die Spracherkennung passenden Pegel auf der Basis des festgesetzten Durchschnittsschallpegels durchgeführt werden.
  • Die JP-A-06-337697 offenbart eine Spracherkennungsvorrichtung, in der die Verstärkung angehoben wird, wenn die Spracherkennung fehlschlägt.
  • Offenbarung der Erfindung
  • Ein Ziel der vorliegenden Erfindung ist die Bereitstellung einer Spracherkennungsvorrichtung, eines Spracherkennungsverfahrens und eines Spracherkennungsprogramms, welche die Spracherkennungsrate ungeachtet des Schallpegels des Sprechers steigern.
  • Gemäß eines Aspekts stellt die vorliegende Erfindung eine Spracherkennungsvorrichtung bereit, umfassend:
    Eingabemittel, die zum Eingeben eines digitalen Schallsignals angeordnet sind;
    ein Schallpegel-Schätzmittel, das zum Schätzen des Schallpegels einer Schallperiode auf der Grundlage des digitalen Schallsignals in einem Teil der von den Eingabemitteln eingegebenen Schallperiode angeordnet ist;
    ein Schallpegel-Einstellungsmittel, das zum Einstellen des Pegels des digitalen Schallsignals in der von den Eingabemitteln eingegebenen Schallperiode auf der Grundlage des vom Schallpegel-Schätzmittel geschätzten Schallpegels und eines vorbestimmten Zielpegels angeordnet ist;
    ein Spracherkennungsmittel, das zur Durchführung der Spracherkennung auf der Grundlage des vom Schallpegel-Einstellungsmittel eingestellten digitalen Schallsignals angeordnet ist; und
    einen nichtlinearen Prozessor, der zum
    Deaktivieren des Schallpegel-Einstellungsmittel, wenn der vom Schallpegel-Schätzmittel geschätzte Schallpegel innerhalb eines vorbestimmten Bereichs liegt; und
    wenn der vom Schallpegel-Schätzmittel geschätzte Schallpegel nicht innerhalb des vorbestimmten Bereichs liegt, zum Aktivieren des Schallpegel-Einstellungsmittel und zum Ändern des vom Schallpegel-Schätzmittel geschätzten Schallpegels auf einen vorbestimmten Schallpegel, der innerhalb des vorbestimmten Bereichs liegt, um diesen an das Schallpegel-Einstellungsmittel anzulegen, ausgebildet ist.
  • In der erfindungsgemäßen Spracherkennungsvorrichtung wird ein digitales Schallsignal durch die Eingabemittel eingegeben und der Schallpegel einer Schallperiode wird durch das Schallpegel-Schätzmittel auf der Grundlage des digitalen Schallsignals in einem vorgeschriebenen Zeitraum geschätzt. Der Pegel des digitalen Schallsignals, das in der Schallperiode durch die Eingabemittel eingegeben wird, wird auf der Grundlage des durch das Schallpegel-Schätzmittel und eines vorbestimmten Zielpegels geschätzten Schallpegels eingestellt und die Spracherkennung wird auf der Grundlage des durch das Schallpegel-Einstellungsmittel eingestellten, digitalen Schallsignals durchgeführt.
  • In diesem Fall wird der Schallpegel für die gesamte Schallperiode auf der Grundlage des digitalen Schallsignals in einem Teil der Schallperiode geschätzt und der Pegel des digitalen Schallsignals der Schallperiode wird auf der Grundlage des geschätzten Schallpegels und des vorbestimmten Zielpegels einheitlich eingestellt. Daraus ergibt sich, dass der akzentuierte Teil der Sprache, der die Betonung der durch den Sprecher produzierten Wörter darstellt, durch die Spracherkennung nicht verzerrt wird, was die Spracherkennungsrate verbessert.
  • Das Schallpegel-Einstellungsmittel kann den Schallpegel der Schallperiode auf der Grundlage des digitalen Schallsignals in einer vorbestimmten Zeitperiode am Anfang der eingegebenen Schallperiode durch die Eingabemittel bestimmen.
  • In diesem Fall kann üblicherweise der Schallpegel der gesamten Schallperiode auf der Grundlage eines Schallpegel-Anhebungsteils in einer vorbestimmten Zeitperiode am Anfang der Schallperiode bestimmt werden. Daher wird der Schallpegel auf der Grundlage des digitalen Schallsignals in der vorbestimmten Zeitperiode am Anfang der Schallperiode geschätzt, so dass der Schallpegel der Schallperiode innerhalb einer kurzen Zeitperiode sicher geschätzt werden kann.
  • Das Schallpegel-Schätzmittel kann den Mittelwert des digitalen Schallsignals in einer vorbestimmten Zeitperiode am Anfang der eingegebenen Schallperiode durch die Eingabemittel als den Schallpegel der Schallperiode schätzen.
  • In diesem Fall kann der Schallpegel der Schallperiode durch Berechnen des Mittelwerts des digitalen Schallsignals in der vorbestimmten Zeitperiode am Anfang der Schallperiode sicher geschätzt werden.
  • Das Schallpegel-Einstellungsmittel kann den Pegel des digitalen Schallsignals in der eingegebenen Schallperiode durch die Eingabemittel verstärken oder dämpfen und zwar um einen vom Verhältnis zwischen dem vorbestimmten Zielpegel und dem vom Schallpegel-Schätzmittel geschätzten Schallpegel bestimmten Verstärkungsfaktor.
  • In diesem Fall kann der Schallpegel der Schallperiode auf einen Zielpegel durch Anheben oder Dämpfen des Pegels des digitalen Schallsignals in der Schallperiode um einen Verstärkungsfaktor, der durch das Verhältnis zwischen dem Zielpegel und dem geschätzten Schallpegel bestimmt wird, festgesetzt werden.
  • Die Spracherkennungsvorrichtung kann ferner eine Verzögerungsschaltung umfassen, die das durch die Eingabemittel eingegebene, digitale Schallsignal verzögert, so dass das durch die Eingabemittel eingegebene, digitale Schallsignal gemeinsam und synchron mit dem vom Schallpegel-Schätzmittel geschätzten Schallpegel an das Schallpegel-Einstellungsmittel angelegt wird.
  • In diesem Fall kann der dem digitalen Schallsignal entsprechende Schallpegel-Schätzwert für die Einstellung herangezogen werden. Der Schallpegel der Schallperiode kann daher sicher eingestellt werden.
  • Das Schallpegel-Schätzmittel kann einen Schalldetektor umfassen, der den Anfangspunkt der durch die Eingabemittel eingegebenen Schallperiode detektiert, einen Schallpegelschätzer, der den Schallpegel der auf der Grundlage des digitalen Schallsignals in einer vorbestimmten Zeitperiode am Anfang durch die Eingabemittel eingegebenen Schallperiode schätzt, eine Halteschaltung, die den durch den Schallpegelschätzer geschätzten Schallpegel hält, und eine Speicherschaltung, die das digitale Schallsignal in der durch die Eingabemittel eingegebenen Schallperiode als Reaktion auf die Detektion des Schalldetektors speichert und das gespeicherte, digitale Schallsignal in der Schallperiode synchron mit dem in der Haltevorrichtung gehaltenen Schallpegel an Schallpegel-Einstellungsmittel ausgibt.
  • In diesem Fall wird der Anfangspunkt des digitalen Schallsignals in der durch die Eingabemittel eingegebenen Schallperiode durch den Schalldetektor detektiert und der Schallpegel der Schallperiode wird durch den Schallpegelschätzer auf der Grundlage des digitalen Schallsignals in der vorbestimmten Zeitperiode am Anfang der durch die Eingabemittel eingegebenen Schallperiode geschätzt. Der durch den Schallpegelschätzer geschätzte Schallpegel wird in der Halteschaltung gehalten, das in der Schallperiode durch die Eingabemittel eingegebene, digitale Schallsignal wird in der Speicherschaltung als Reaktion auf die Detektion durch den Schalldetektor gespeichert und das in der Schallperiode gespeicherte, digitale Schallsignal wird am Schallpegel-Einstellungsmittel synchron mit dem in der Halteschaltung gehaltenen Schallpegel ausgegeben.
  • In diesem Fall wird das digitale Schallsignal in der Speicherschaltung vom Anfangspunkt der Schallperiode gespeichert und der dem gespeicherten digitalen Schallsignal entsprechende Schallpegel-Schätzwert wird zum Einstellen des Schallpegels verwendet. Daher kann das digitale Schallsignal auf einen akkuraten Schallpegel eingestellt und die Spracherkennungsrate verbessert werden.
  • Die Speicherschaltung kann einen ersten und einen zweiten Puffer umfassen, die alternativ das digitale Schallsignal in der von den Eingabemitteln eingegebenen Schallperiode speichern und das gespeicherte, digitale Schallsignal in der Schallperiode an das Schallpegel-Einstellungsmittel alternierend ausgeben.
  • In diesem Fall wird das digitale Schallsignal, wenn eine lange Rede mit vielen Wörtern eingegeben wird, alternativ in/aus dem ersten und dem zweiten Puffer gespeichert/ausgegeben. Daher kann eine lange, eine Vielzahl an Wörtern umfassende Rede mithilfe des ersten oder des zweiten Puffers, die eine kleine Kapazität aufweisen, erkannt werden.
  • Das Spracherkennungsmittel kann ein Ergebnis der Spracherkennung an das Schallpegel-Einstellungsmittel rückkoppeln und das Schallpegel-Einstellungsmittel kann den Grad der Einstellung des Schallpegels auf der Grundlage des vom Spracherkennungsmittel rückgekoppelten Spracherkennungsergebnisses ändern.
  • In diesem Fall kann ein unpassender Schallpegel-Einstellungsgrad durch Einstellen des Schallpegels und Ändern des Grads der Einstellung des Schallpegels besser optimiert werden.
  • Das Schallpegel-Einstellungsmittel kann den Verstärkungsfaktor für den Schallpegel anheben, wenn die Spracherkennung durch das Spracherkennungsmittel nicht möglich ist.
  • In diesem Fall kann der Sprachpegel, der die Spracherkennung nicht zulässt, auf einen Schallpegel eingestellt werden, der die Spracherkennung durch Anheben des Verstärkungsfaktors ermöglicht.
  • Die Spracherkennungsvorrichtung umfasst einen nichtlinearen Prozessor, der das Schallpegel-Einstellungsmittel deaktiviert, wenn der vom Schallpegel-Schätzmittel geschätzte Schallpegel innerhalb eines vorbestimmten Bereichs liegt, und der das Schallpegel-Schätzmittel aktiviert, wenn der vom Schallpegel-Schätzmittel geschätzte Schallpegel nicht innerhalb eines vorbestimmten Bereichs liegt, und den vom Schallpegel-Schätzmittel geschätzten Schallpegel auf einen innerhalb des vorbestimmten Bereichs liegenden Schallpegel ändert, um diesen auf das Schallpegel-Einstellungsmittel anzulegen.
  • In diesem Fall kann der Schallpegel auf einen innerhalb des vorbestimmten Bereichs liegenden Schallpegel geändert und somit nur eingestellt werden, wenn der Schallpegel nicht innerhalb des vorbestimmten Bereichs liegt. Daher kann die unerwünschte Verzerrung des akzentuierten Teils der Sprache, der die Betonung der vom Sprecher ausgegebenen Worte darstellt, vermieden werden.
  • Gemäß eines weiteren Aspekts der vorliegende Erfindung wird ein Spracherkennungsverfahren bereitgestellt, welches die folgenden Schritte umfasst:
    das Eingeben eines digitalen Schallsignals;
    das Schätzen des Schallpegels einer Schallperiode auf der Grundlage des eingegebenen, digitalen Schallsignals in einem Teil der Schallperiode;
    das Einstellen des Pegels des digitalen Schallsignals in der Schallperiode auf der Grundlage des geschätzten Schallpegels und eines vorbestimmten Zielpegels;
    das Durchführen der Spracherkennung auf der Grundlage des eingestellten digitalen Schallsignals; und
    das Deaktivieren des Schritts des Einstellens des Pegels des digitalen Schallsignals, wenn der geschätzte Schallpegel innerhalb eines vorbestimmten Bereichs liegt; und
    wenn der geschätzte Schallpegel nicht innerhalb des vorbestimmten Bereichs liegt, das Aktivieren des Einstellungsschritts und das Ändern des geschätzten Schallpegels auf einen Schallpegel, der innerhalb des vorbestimmten Bereichs liegt, zur Verwendung beim Einstellen des Pegels des digitalen Schallsignals.
  • In dem Spracherkennungsverfahren gemäß der vorliegenden Erfindung, wird ein digitales Schallsignal eingegeben und der Schallpegel einer Schallperiode wird auf der Grundlage des digitalen Schallsignals in einem Teil der Schallperiode geschätzt. Der Pegel des digitalen Schallsignals in der Schallperiode wird auf der Grundlage des geschätzten Schallpegels und eines vorbestimmten Zielpegels eingestellt und die Spracherkennung wird auf der Grundlage des eingestellten digitalen Schallsignals durchgeführt.
  • In diesem Fall wird der Schallpegel für die gesamte Schallperiode auf der Grundlage des Schallsignals in einem Teil der Schallperiode geschätzt und der Pegel des digitalen Schallsignals in der Schallperiode wird auf der Grundlage des geschätzten Schallpegels und eines vorbestimmten Zielpegels einheitlich eingestellt. Daraus ergibt sich, dass der durch den Sprecher akzentuierte Teil, welcher die Betonung der durch den Sprecher produzierten Wörter wiedergibt, in der Spracherkennung nicht verzerrt wird, was das Spracherkennungsverhältnis verbessert.
  • Der Schritt des Schätzens des Schallpegels kann das Schätzen des Schallpegels der Schallperiode auf der Grundlage des digitalen Schallsignals innerhalb des einer vorbestimmten Zeitperiode am Anfang der Schallperiode umfassen.
  • In diesem Fall kann üblicherweise der Schallpegel der gesamten Schallperiode auf der Grundlage des ansteigenden Teils des Schallpegels in einem vorbestimmten Teil am Anfang der Schallperiode bestimmt werden. Daher kann der Schallpegel einer Schallperiode mit Sicherheit in einer kurzen Periode bestimmt werden und zwar durch Schätzen des auf der Grundlage des digitalen Schallsignals in der vorgeschriebenen Zeitperiode am Anfang der Schallperiode geschätzten Schallpegels.
  • Der Schritt des Schätzens des Schallpegels kann das Schätzen des Mittelwertes des digitalen Schallsignals in der vorgeschriebenen Zeitperiode am Anfang der Schallperiode als Schallpegel der Schallperiode umfassen.
  • In diesem Fall kann der Schallpegel der Schallperiode mit größerer Sicherheit durch Berechnen der Mittelwerts des digitalen Schallsignals in der vorgeschriebenen Zeitperiode am Anfang der Schallperiode geschätzt werden.
  • Der Schritt des Einstellens des Pegels des digitalen Schallsignals kann das Verstärken oder Dämpfen des Pegels des digitalen Schallsignals in der Schallperiode durch den Verstärkungsfaktor umfassen, der durch das Verhältnis zwischen dem vorbestimmten Zielpegel und dem geschätzten Schallpegel bestimmt wird.
  • In diesem Fall kann der Schallpegel der Schallperiode auf einem Zielpegel durch Anheben oder Dämpfen des Pegels des digitalen Schallsignals in der Schallperiode durch einen Verstärkungsfaktor eingestellt werden, welcher durch das Verhältnis zwischen dem Zielpegel und dem geschätzten Schallpegel bestimmt wird.
  • Das Spracherkennungsverfahren umfasst ferner den Schritt des Verzögerns des digitalen Schallsignals in der Schallperiode, so dass das digitale Schallsignal gemeinsam oder synchron mit dem geschätzten Schallpegel am Einstellungsschritt des Pegels des digitalen Schallsignals angewendet wird.
  • In diesem Fall kann der dem digitalen Schallsignal entsprechende Schallpegel-Schätzwert zum Einstellen des Schallpegels verwendet werden. Dadurch kann der Schallpegel der Schallperiode besser eingestellt werden.
  • Der Schritt des Schätzens des Schallpegels umfasst den Schritt des Detektierens des Anfangspunkts des digitalen Schallsignals in der Schallperiode, das Schätzen des Schallpegels der Schallperiode, welcher auf der Grundlage des digitalen Schallsignals in einer vorgeschriebenen Zeitperiode am Anfang der Schallperiode beruht, das Halten des geschätzten Schallpegels und das Speichern des digitalen Schallsignals in der Schallperiode als Reaktion auf die Detektion des Anfangspunkts des digitalen Schallsignals und das Ausgeben der gespeicherten Schallsignals in der Schallperiode synchron mit dem gehaltenen Schallpegel.
  • In diesem Fall wird der Anfangspunkt des digitalen Schallsignals in der Schallperiode detektiert und der Schallpegel der Schallperiode wird auf der Grundlage des digitalen Schallsignals in einer vorgeschriebenen Zeitperiode am Anfang der Schallperiode geschätzt. Der geschätzte Schallpegel wird gehalten, das digitale Schallsignal in der Schallperiode wird als Reaktion auf die Detektion des Anfangspunkts des digitalen Schallsignals in der Schallperiode gespeichert und das gespeicherte, digitale Schallsignal in der Schallperiode wird synchron mit dem gehaltenen Schallsignal ausgegeben.
  • In diesem Fall wird das digitale Schallsignal in der Speicherschaltung vom Anfangspunkt der Schallperiode gespeichert und der Schallpegel wird mithilfe des Schallpegel-Schätzwertes eingestellt, welcher dem gespeicherten digitalen Schallsignal entspricht. Der Schallpegel kann daher auf einen akkuraten Schallpegel eingestellt werden, welcher das Spracherkennungsverhältnis verbessert.
  • Der Schritt des Speicherns umfasst den Schritt des Speicherns des digitalen Schallsignals in der Schallperiode alternierend in einem ersten und einem zweiten Puffer und das Ausgeben des gespeicherten digitalen Schallsignals in der Schallperiode alternativ aus dem ersten und dem zweiten Puffer.
  • In diesem Fall, wenn eine lange Rede mit vielen Wörtern eingegeben wird, wird das digitale Schallsignal gespeichert/ausgegeben und zwar alternierend in/von dem ersten und dem zweiten Puffer. Daher kann eine lange Rede mit vielen Wörtern mithilfe des ersten oder des zweiten Puffers, die eine kleine Kapazität aufweisen, erkannt werden.
  • Der Schritt des Durchführens der Spracherkennung kann den Schritt des Rückkoppelns eines Ergebnisses der Spracherkennung während des Einstellungsschritts des Pegels des digitalen Schallsignals umfassen und der Schritt des Einstellens des Pegels des digitalen Schaltsignals kann die Veränderung des Grads der Einstellung des Schallpegels auf der Grundlage des rückgekoppelten Ergebnisses der Spracherkennung umfassen.
  • In diesem Fall kann ein unpassender Schallpegel-Einstellungsgrad lediglich durch das nochmalige Verwenden des Ergebnisses der Spracherkennung zur Einstellung des Schallsignals und dem Ändern des Grads der Einstellung des Schallpegels noch besser optimiert werden.
  • Der Schritt des Einstellens des Pegels des digitalen Schallsignals kann das Anheben des Verstärkungsfaktors des Schallpegels umfassen, wenn die Spracherkennung nicht durchführbar ist.
  • In diesem Fall kann der die Spracherkennung nicht zulassende Schallpegel auf einen Schallpegel eingestellt werden, der die Spracherkennung durch Anheben des Verstärkungsfaktors des Schallpegels ermöglicht.
  • Das Spracherkennungsverfahren umfasst den Schritt des Deaktivierens des Schritts des Einstellens des Pegels des digitalen Schallsignals, wenn der geschätzte Schallpegel innerhalb des vorbestimmten Bereichs liegt, während der Einstellungsschritt aktiviert wird, wenn der geschätzte Schallpegel nicht innerhalb des vorbestimmten Bereichs liegt, und der geschätzte Schallpegel auf einen Schallpegel geändert wird, der innerhalb des vorbestimmten Bereichs zur Verwendung des Einstellens des Pegels des digitalen Schallsignals liegt.
  • In diesem Fall kann der Schallpegel auf einen innerhalb des vorbestimmten Bereichs liegenden Schallpegel geändert werden und kann daher lediglich dann eingestellt werden, wenn der Schallpegel sich nicht im vorbestimmten Bereich befindet. Dadurch können unerwünschte Verzerrungen des akzentuierten Teils der Rede, welcher die Betonung der durch den Sprecher produzierten Wörter repräsentiert, verhindert werden.
  • Gemäß eines weiteren Aspekts stellt die vorliegende Erfindung ein computerlesbares Spracherkennungsprogramm zur Verfügung, das einem Computer die Ausführung der folgenden Schritte ermöglicht:
    das Eingeben eines digitalen Schallsignals;
    das Schätzen des Schallpegels einer Schallperiode auf der Grundlage des eingegebenen, digitalen Schallsignals in einem Teil der Schallperiode;
    das Einstellen des Pegels des eingegebenen, digitalen Schallsignals in der Schallperiode auf der Grundlage des geschätzten Schallpegels und eines vorbestimmten Zielpegels;
    das Durchführen der Spracherkennung auf der Grundlage des eingestellten digitalen Schallsignals; und
    das Deaktivieren des Schritts des Einstellens des Schallpegels des digitalen Schallsignals, wenn der geschätzte Schallpegel innerhalb eines vorbestimmten Bereichs liegt; und
    wenn der geschätzte Schallpegel nicht innerhalb des vorbestimmten Bereichs liegt, das Aktivieren des Einstellungsschritts und das Ändern des geschätzten Schallpegels auf einen Schallpegel, der innerhalb des vorbestimmten Bereichs liegt, zur Verwendung beim Einstellen des Pegels des digitalen Schallsignals.
  • Im Spracherkennungsprogramm gemäß der vorliegenden Erfindung wird ein digitales Schallsignal eingegeben und der Schallpegel einer Schallperiode wird auf der Grundlage des eingegebenen Schallsignals in einer vorbestimmten Zeitperiode der Schallperiode geschätzt. Der Pegel des eingegebenen, digitalen Schallsignals in der Schallperiode wird auf der Grundlage des geschätzten Schallsignals und eines vorbestimmten Zielpegels eingestellt und die Spracherkennung wird auf der Grundlage des eingestellten digitalen Schallsignals durchgeführt.
  • In diesem Fall wird der Schallpegel der gesamten Schallperiode auf der Grundlage des digitalen Schallsignals in einem Teil der Schallperiode geschätzt und der Pegel des digitalen Schallsignals in einem Teil der Schallperiode wird auf der Grundlage des geschätzten Schallpegels und des vorbestimmten Zielpegels einheitlich eingestellt. Daraus ergibt sich, dass der akzentuierte Teil der Sprache, welcher die Betonung der vom Sprecher gesprochenen Wörter darstellt, in der Spracherkennung nicht verzerrt wird. Dies steigert die Spracherkennungsrate.
  • Gemäß der vorliegenden Erfindung wird der Schallpegel der gesamten Schallperiode auf der Grundlage des digitalen Schallsignals in einem Teil der Schallperiode geschätzt und der Pegel des digitalen Schallsignals in der Schallperiode wird auf der Grundlage des geschätzten Schallpegels und eines vorbestimmten Zielpegels einheitlich eingestellt. Daraus ergibt sich, dass der akzentuierte Teil der Sprache, der die Betonung der vom Sprecher produzierten Wörter darstellt, in der Spracherkennung nicht verzerrt wird. Wodurch die Spracherkennungsrate gesteigert wird.
  • Kurzbeschreibung der Erfindung
  • 1 ist ein Blockdiagramm einer ersten Spracherkennungsvorrichtung, mit der die vorliegende Erfindung angewendet werden kann;
  • 2 ist ein Blockdiagramm zur Konfiguration eines Computers zur Ausführung eines Spracherkennungsprogramms;
  • 3 ist ein Wellenformdiagramm, welches das Sprachspektrum des vom Sprecher gesprochenen Wortes „ragubi" zeigt;
  • 4 ist ein Blockdiagramm einer zweiten Spracherkennungsvorrichtung, mit der die vorliegende Erfindung angewendet werden kann;
  • 5(a) ist ein Wellenformdiagramm, das die Ausgabe eines Mikrophons von 4 zeigt, während 5(b) eine graphische Darstellung ist, die die Rate des Schallsignals (Signalkomponente) zur Geräuschkomponente abbildet;
  • 6 ist ein Flussdiagramm, das die Arbeitsabläufe eines Schalldetektors, wie in 4 zu sehen, darstellt;
  • 7 ist ein schematisches Diagramm, welches die Eingabe/Ausgabe eines digitalen Schallsignals in/aus den Puffern darstellt, wenn ein Sprecher zwei Wörter spricht;
  • 8 ist ein Blockdiagramm, das ein drittes Beispiel für eine Spracherkennungsvorrichtung darstellt, mit dem die vorliegende Erfindung angewendet werden könnte;
  • 9 ist ein Flussdiagramm zur Veranschaulichung der Arbeitsabläufe der Schallpegeleinstellungs-Rückkopplungseinheit, wie in 8 abgebildet, wenn der Schallpegel eingestellt wird;
  • 10 ist ein Blockdiagramm, welches ein Beispiel einer Spracherkennungsvorrichtung gemäß einer Ausführungsform der vorliegenden Erfindung zeigt;
  • 11 ist ein Diagramm zur Veranschaulichung der Beziehung zwischen einem an einem nichtlinearen Signalprozessor eingegebenen Schallpegel-Schätzwert und der Erkennungsrate der in 10 dargestellten Spracherkennungseinheit;
  • 12 ist ein Flussdiagramm zur Darstellung des Prozessablaufs des nichtlinearen Signalprozessors; und
  • 13 ist eine schematische Darstellung eines Beispiels des Verhältnisses zwischen dem Schallpegel und der Erkennungsrate der Spracherkennung.
  • 1 ist ein Blockdiagramm eines Beispiels einer Spracherkennungsvorrichtung, auf welche die vorliegende Erfindung angewendet werden kann.
  • Wie in 1 zu sehen, umfasst die Spracherkennungsvorrichtung ein Mikrophon 1, einen Analog-Digital-Wandler (A/D-Wandler) 2, eine Signalverzögerungseinheit 3, einen Schallpegelschätzer 4, eine Schallpegel-Einstelleinrichtung 5 und eine Spracherkennungseinheit 6.
  • Wie in 1 abgebildet, wird die durch den Sprecher ausgegebene Sprache von einem Mikrophon 1 aufgenommen. Die aufgenommene Sprache wird dann in ein analoges Schallsignal SA durch das Mikrophon 1 zur Ausgabe an einen A/D-Wandler 2 umgewandelt. Der A/D-Wandler 2 wandelt das angelegte analoge Signal SA in ein digitales Schallsignal DS zur Ausgabe an der Signalverzögerungseinheit 3 und dem Schallpegelschätzer 4 um. Der Schallpegelschätzer 4 berechnet auf der Grundlage des angelegten digitalen Schallsignals DS einen Schallpegel-Schätzwert LVL. Hierin bezieht sich der Schallpegel auf den Pegel der Schallleistung (Schallenergie). Wie der Schallpegel-Schätzwert LVL berechnet wird, wird später erläutert.
  • Die Signalverzögerungseinheit 3 wendet das digitale Schallsignal DS an, welches durch eine einer vorgeschriebenen Schallpegel-Anstiegszeit TL, die bei der Schallpegel-Einstelleinrichtung 5 beschrieben wird ?, entsprechenden Periode verzögert wird. Die Schallpegel-Einstelleinrichtung 5 stellt den Schallpegel des digitalen Schallsignals DS ein, welches von der Signalverzögerungseinheit 3 angelegt synchron mit dem Schallpegel-Schätzwert LVL wurde, welcher wieder vom Schallpegelschätzer 4 angelegt wurde. Die Schallpegel-Einstelleinrichtung 5 wendet eine Ausgabe CTRL_OUT nach der Einstellung des Schallpegels an der Spracherkennungseinheit 6 an. Die Spracherkennungseinheit 6 führt Spracherkennung auf der Grundlage der Ausgabe CTRL_OUT durch, nachdem die Einstellung des von der Schallpegel-Einstelleinrichtung 5 angelegten Schallpegels erfolgte.
  • In der in 1 abgebildeten Spracherkennungsvorrichtung entsprechen das Mikrophon 1 und der Wandler 2 den Eingabemitteln, die Signalverzögerungseinheit 3 der Verzögerungsschaltung, der Schallpegelschätzer 4 dem Schallpegel-Schätzmittel, die Schallpegel-Einstelleinrichtung 5 dem Schallpegel-Einstellungsmittel und die Spracherkennungseinheit 6 dem Spracherkennungsmittel.
  • Hierbei ist anzumerken, dass die Signalverzögerungseinheit 3, der Schallpegelschätzer 4, die Schallpegel-Einstelleinrichtung 5 und die Spracherkennungseinheit 6 durch die Signalverzögerungsschaltung, die Schallpegel-Schätzschaltung, die Schallpegel-Einstellungsschaltung bzw. die Spracherkennungsschaltung implementiert werden können. Währenddessen können die Signalverzögerungseinheit 3, der Schallpegelschätzer 4, die Schallpegel-Einstelleinrichtung und die Spracherkennungseinheit 6 durch einen Computer und ein Spracherkennungsprogramm implementiert werden.
  • Ein derartiges Computerprogramm zur Ausführung des Spracherkennungsprogramms wird nun näher beschrieben. 2 ist ein Blockdiagramm zur Veranschaulichung der Konfiguration des Computers zur Ausführung des Spracherkennungsprogramms
  • Der Computer umfasst eine CPU (zentrale Rechnereinheit) 500, eine Eingabe/Ausgabe-Vorrichtung 501, einen ROM (Nur-Lese-Speicher) 502, einen RAM (Schreib-/Lesespeicher) 503, ein Aufzeichnungsmedium 504, ein Aufzeichnungsmedium-Laufwerk 505 und einen externen Speicher 506.
  • Die Eingabe/Ausgabe-Vorrichtung 501 sendet/empfängt Informationen zu/von anderen Vorrichtungen. Das digitale Schallsignal DS aus dem A/D-Wandler 2 von 1 wird in die Eingabe/Ausgabe-Vorrichtung 501 gemäß der Ausführungsform eingegeben. Der ROM 502 wird mit Systemprogrammen beschrieben. Das Laufwerk 505 des Aufzeichnungsmediums ist ein CD-ROM-Laufwerk, ein Diskettenlaufwerk oder Ähnliches und liest/schreibt Daten von/auf einem) Aufzeichnungsmedium 504, wie etwa einer CD-ROM oder einer Diskette. Das Aufzeichnungsmedium 504 wird mittels Spracherkennungsprogrammen aufgenommen. Der externe Speicher 506 ist eine Festplatte oder Ähnliches und wird mit einem Spracherkennungsprogramm vom Aufzeichnungsmedium 504 mithilfe des Laufwerks 505 des Aufzeichnungsmediums gelesen. Die CPU 500 führt das im externen Speicher 506 auf dem RAM 503 gespeicherte Spracherkennungsprogramm aus. Somit werden die Funktionen der Signalverzögerungseinheit 3, des Schallpegelschätzers 4, der Schallpegel-Einstelleinrichtung 5 und der Spracherkennungseinheit 6 von 1 ausgeführt.
  • Im Folgenden wird nun ein Verfahren zur Berechnung des Schallpegel-Schätzwertes LVL durch den Schallpegelschätzer 4 von 1 und ein Verfahren zur Einstellung des Schallpegels durch die Schallpegel-Einstelleinrichtung 5 näher beschrieben.
  • Das Verfahren zur Berechung des Schallpegel-Schätzwertes LVL durch den Schallpegelschätzer 4 wird nun zuerst erläutert. Das am Schallpegelschätzer 4 eingegebene, digitale Schallsignal DS wird als DS(x)(x = 1, 2, ..., Q), wobei x die Q Zeitpunkte in der Anstiegszeit TL für einen vorbestimmten Schallpegel und DS(x) den Wert des digitalen Schallsignals DS an den Q Zeitpunkten angibt. In diesem Fall wird der Schallpegel-Schätzwert LVL wie folgt ausgedrückt: LVL = (Σ|DS(x)|)/Q (1)
  • Im Ausdruck (1) entspricht der Schallpegel-Schätzwert LVL dem Mittelwert, der durch die Teilung der Gesamtsumme der absoluten Werte des digitalen Schallsignals DS (x) an den Q Zeitpunkten der Anstiegszeit TL eines durch Q vorbestimmten Schallpegels. Daher wird der Schallpegel-Schätzwert LVL im Schallpegelschätzer 4 berechnet.
  • Im Folgenden wird nun das Verfahren zur Einstellung des Schallpegels durch eine Schallpegel-Einstelleinrichtung 5 näher erläutert. In der Schallpegel-Einstelleinrichtung 5 wird ein Zielwert für einen vorbestimmten Schallpegel als TRG_LVL angegeben. In diesem Fall wird der eingestellte Wert für den Schallpegel LVL_CTRL wie folgt ausgedrückt: LVL_CTRL = TGR_LVL/LVL (2)
  • Im Ausdruck (2) wird der eingestellte Wert LVL_CTRL für den Schallpegel durch Teilen des Zielwerts TRG_LVL für den vom Schallpegel-Schätzwert LVL vorbestimmten Schallpegel berechnet.
  • Die Ausgabe CTRL_OUT nach der Einstellung des Schallpegels wird unter Verwendung des eingestellten Werts LVL_CTRL für den Schallpegel wie folgt ausgedrückt, CTRL_OUT(X) = DS(X) × LVL_CTRL (3)wobei X für die Zeit steht. Im Ausdruck (3) wird die Ausgabe CTRL_OUT(X) nach der Einstellung des Schallpegels durch Multiplizieren des digitalen Schallsignals DS(X) an einer vorbestimmten Schallpegel-Anstiegszeit TL durch den eingestellten Wert LVL_CTRL für den Schallpegel erzeugt. Daher stellt die Schallpegel-Einstelleinrichtung 5 den Schallpegel ein und legt die daraus resultierende Ausgabe CTRL_OUT(X) an der Spracherkennungseinheit 6 an.
  • Die vorbestimmte Anstiegszeit TL für den Schallpegel in der Signalverzögerungseinheit 3, wie in 1 dargestellt, wird nun unter Bezug auf die Zeichnungen näher erläutert.
  • 3 ist ein Wellenformdiagramm, welches das Sprachspektrum eines Wortes „ragubi" zeigt, das von einem Sprecher erzeugt wurde. In 3 steht die Ordinate für den Schallpegel, während die Abszisse die Zeit repräsentiert.
  • Wie in 3 zu sehen, ist im Sprachspektrum des Wortes „ragubi" der Schallpegel des „ra"-Teils hoch. Im Besonderen entspricht der Höhepunkt im Schallpegel dem Teil, wo der die Betonung repräsentierende Akzent jedes Wortes liegt, Hier, wie in 3 dargestellt, ist die Zeit vom Anfangspunkt TS, wenn ein Wort vom Sprecher ausgegeben wird, bis zum Zeitpunkt, wenn der Spitzenwert P des Schallpegels erreicht wird, die Schallpegel-Anstiegszeit TL. Im Allgemeinen bewegt sich die Schallpegel-Anstiegszeit TL im Bereich von 0 sec bis 100 ms und die Schallpegel-Anstiegszeit gemäß der Ausführungsform der Erfindung beträgt beispielsweise 100 ms.
  • Wenn etwa die Schallpegel-Anstiegszeit TL für eine kürzere Periode eingesetzt wird, wird das Spracherkennungsverhältnis niedriger. Wie in 3 zu sehen, wird angenommen, dass der Sprecher das Wort „ragubi" ausspricht und eine kürzere Schallpegel-Anstiegszeit, durch TL' bezeichnet, wird eingestellt. In diesem Fall erlaubt ein einfaches Verzögern des eingegebenen, digitalen Schallsignals DS an der Signalverzögerungseinheit 3, wie in 1 abgebildet, durch die Anstiegszeit TL' nicht, dass ein entsprechender Schallpegel-Schätzwert LVL durch den Schallpegelschätzer 4 berechnet wird. Dann wird der Schallpegel-Schätzwert erzeugt, der niedrigerer als der beabsichtigte Schallpegel-Schätzwert LVL ist, an der Schallpegel-Einstelleinrichtung 5 bereitgestellt und der Schallpegelwert des digitalen Schallsignals DS wird durch die Schallpegel-Einstelleinrichtung 5 nicht korrekt eingestellt. Das nicht korrekte digitale Schallsignal DS wird dann in die Spracherkennungseinheit 6 eingegeben, was die Spracherkennungsrate verringert.
  • Wie oben beschrieben, wird die Schallpegel-Anstiegszeit TL am Anfang einer Schallperiode auf 100 ms an der Signalverzögerungseinheit 3 festgesetzt, so dass der Schallpegel der gesamten Schallperiode durch den Schallpegelschätzer 4 berechnet werden kann. Der Pegel des digitalen Schallsignals DS der Schallperiode wird dadurch einheitlich eingestellt. Daraus ergibt sich, dass der akzentuierte Teil der Rede, der die Betonung der durch den Sprecher erzeugten Wörter darstellt, in der Spracherkennung nicht verzerrt auftritt, was das Spracherkennungsverhältnis steigert.
  • 4 ist ein Blockdiagramm einer zweiten Spracherkennungsvorrichtung, die auf die vorliegende Erfindung angewendet werden kann.
  • Wie in 4 dargestellt, umfasst die Spracherkennungsvorrichtung ein Mikrophon 1, einen (A/D-Wandler) 2, einen Schallpegelschätzer 4, eine Schallpegel-Einstelleinrichtung 5, eine Spracherkennungseinheit 6, einen Schalldetektor 7, eine Schallpegel-Haltevorrichtung 8, Selektoren 11 und 12 sowie die Puffer 21 und 22.
  • Wie in 1 abgebildet, wird die durch den Sprecher ausgegebene Sprache von einem Mikrophon 1 aufgenommen. Die aufgenommene Sprache wird dann in ein analoges Schallsignal SA durch das Mikrophon 1 zur Ausgabe an einen A/D-Wandler 2 umgewandelt. Der A/D-Wandler 2 wandelt das angelegte analoge Signal SA in ein digitales Schallsignal DS zur Anwendung am Schallpegelschätzer 4, dem Schalldetektor 7 und dem Selektor 11 um. Der Schallpegelschätzer 4 berechnet auf der Grundlage des angelegten digitalen Schallsignals DS einen Schallpegel-Schätzwert LVL. Das Verfahren zur Berechnung des Schallpegel-Schätzwerts LVL durch den in 4 abgebildeten Schallpegelschätzer 4 entspricht dem Verfahren zur Berechnung des Schallpegel-Schätzwerts LVL durch den in 1 abgebildeten Schallpegelschätzer 4.
  • Der Schallpegelschätzer 4 berechnet einen Schallpegel-Schätzwert LVL für jedes Wort auf der Grundlage des digitalen Schallsignals DS, welches von A/D-Wandler 2 angelegt wird, und legt nacheinander den daraus resultierenden Schallpegel-Schätzwert LVL an der Schallpegel-Haltevorrichtung 8 an. Hier hält die Schallpegel-Haltevorrichtung 8 den vorherigen Schallpegel-Schätzwert LVL in einem Halteregister, welches in der Schall-Haltevorrichtung 8 bereitgestellt ist, bis der nächste, durch den Schallpegelschätzer 4 berechnete Schallpegel-Schätzwert LVL angelegt wird und jeden neuen Schallpegel-Schätzwert LVL überschreibt, der vom Schallpegelschätzer 4 im Halteregister, welches den vorherigen Schallpegel-Schätzwert LVL hält, angelegt wird. Das Halteregister weist eine Datenkapazität M auf.
  • Währenddessen detektiert der Schalldetektor 7 den Anfangspunkt TS des Schalls in 3 auf der Grundlage des digitalen Schallsignals DS, welches vom A/D-Wandler 2 angelegt wird und legt ein Steuersignal CIS1 am Selektor 11 an, so dass das digitale Schallsignal DS am Puffer 21 und ein Steuersignal CB1 am Puffer 21 angelegt werden, so dass das vom Selektor 11 angelegte, digitale Schallsignal DS darin gespeichert wird. Die Puffer 21 und 22 weisen beide eine Kapazität L auf.
  • Der Selektor 11 legt ein vom A/D-Wandler 2 angelegtes digitales Schallsignal DS am Puffer 21 an und zwar als Reaktion auf das vom Schalldetektor 7 angelegte Steuersignal CIS1. Der Puffer 21 speichert das digitale Schallsignal DS, welches durch den Selektor 11 als Reaktion auf das vom Schalldetektor 7 angelegte Steuersignal CB1 angewendet wird. Der Puffer 21 legt ein Vollsignal F1 am Schalldetektor 7 an, wenn er das digitale Schallsignal DS ebenso wie die speicherfähige Kapazität L gespeichert hat. Der Schalldetektor 7 legt ein Steuersignal SL1 an, um die Schallpegel-Haltevorrichtung 8 zum Ausgeben des Schallpegel-Schätzwerts LVL durch den Puffer 21 zu veranlassen.
  • Der Schalldetektor 7 legt ein Steuersignal CIS2 am Selektor 11 als Reaktion auf das Vollsignal F1 an, welches vom Puffer 21 angelegt wurde, so dass das vom A/D-Wandler 2 angelegte, digitale Schallsignal DS am Puffer 22 und ein Steuersignal CB2 am 22 angelegt werden, so dass das vom Selektor 11 angelegte, digitale Schallsignal DS darin gespeichert wird. Außerdem legt der Schalldetektor 7 ein Steuersignal CBO1 am Puffer 21 und ein Steuersignal COS1 am Selektor 12 an.
  • Der Selektor 11 legt das digitale Schallsignal DS, welches vom A/D-Wandler angelegt wurde, am Puffer 22 als Reaktion auf das Steuersignal CIS2 an, welches vom Schalldetektor 7 angelegt wurde. Der Puffer 22 speichert das durch den Selektor 11 angelegte, digitale Schallsignal DS als Reaktion auf das vom Schalldetektor 7 angelegte Steuersignal CB2.
  • Währenddessen legt der Puffer 21 das im Puffer 21 gespeicherte, digitale Schallsignal DS an der Schallpegel-Einstelleinrichtung 5 durch den Selektor 12 als Reaktion auf das vom Schalldetektor 7 angelegte Steuersignal CBO1 an.
  • Der Puffer 22 speichert das durch den Selektor 21 angelegte, digitale Schallsignal DS als Reaktion auf das Steuersignal CB2, welches vom Schalldetektor 7 angelegt wurde. Der Puffer 22 legt das Vollsignal F2 am Schalldetektor 7 an, wenn er das digitale Schallsignal DS ebenso wie dessen speicherfähige Kapazität L gespeichert hat. Der Schalldetektor 7 legt dadurch ein Steuersignal SL2 durch den Puffer 22 an, um die Schallpegel-Haltevorrichtung 8 zur Ausgabe des Schallpegel-Schätzwerts LVL zu veranlassen.
  • Der Schalldetektor 7 legt das Steuersignal CIS1 am Selektor 11 als Reaktion auf das Vollsignal F2 an, welches vom Puffer 22 angelegt wurde, so dass das durch den A/D-Wandler 2 angelegte, digitale Schallsignal DS am Puffer 21 angelegt wird. Der Schalldetektor 7 legt ein Steuersignal CBO2 am Puffer 22 und ein Steuersignal COS2 am Selektor 12 an.
  • Währenddessen legt der Puffer 22 das digitale Schallsignal DS, welches im Puffer 22 gespeichert ist, an der Schallpegel-Einstelleinrichtung 5 durch den Selektor 12 als Reaktion auf das Steuersignal CBO2 an, welches vom Schalldetektor 7 angelegt wurde.
  • Die Schallpegel-Halter 8 legt den Schallpegel-Schätzwert LVL, der durch das Halteregister gehalten wird, an die Schallpegel-Einstelleinrichtung 5 als Reaktion auf das Steuersignal SL1 an, welches vom Puffer 21 angelegt wurde, oder auf das Steuersignal SL2, welches vom Puffer 22 angelegt wurde. Hier sind die Kapazität M des Halteregisters, welches im Schallpegel-Halter 8 zur Verfügung steht, und die Kapazität L der Puffer 21 und 22 im Wesentlichen gleich und daher wird der Schallpegel-Schätzwert LVL, welcher dem durch den Selektor 12 angelegten, digitalen Schallsignal DS entspricht, vom Schallpegel-Halter 8 ausgegeben.
  • Die Schallpegel-Einstelleinrichtung 5 stellt das digitale Schallsignal DS ein, welches durch den Selektor 12 auf der Grundlage des durch den Schallpegel-Halter 8 angelegten Schallpegel-Schätzwerts LVL erhalten wird. Das Verfahren zur Einstellung des digitalen Schallsignals DS durch die Schallpegel-Einstelleinrichtung 5 von 4 entspricht dem Verfahren zur Einstellung des digitalen Schallsignals DS durch die Schallpegel-Einstelleinrichtung von 1. Die Schallpegel-Einstellvorrichtung 5 legt den Schallpegel-eingestellten Ausgang CTRL-OUT an die Spracherkennungs-Einheit 6 an. Die Spracherkennungseinheit 6 führt die Spracherkennung auf der Grundlage der eingestellten Schallpegelausgabe CTRL_OUT durch, welche von der Schallpegel-Einstelleinrichtung 5 angelegt wurde.
  • In der Spracherkennungsvorrichtung von 4 entsprechen das Mikrophon 1 und der Analog-Digital-Wandler (A/D-Wandler) 2 den Eingabemitteln, der Schallpegelschätzer 4 dem Schallpegel-Schätzmittel, die Schallpegel-Einstelleinrichtung 5 dem Schallpegel-Einstellungsmittel, die Spracherkennungseinheit 6 dem Spracherkennungsmittel, der Sprachdetektor 7 dem Schalldetektor, die Schallpegel-Haltevorrichtung 8 der Halteschaltung und die Puffer 21 und 22 der Speicherschaltung.
  • 5(a) zeigt ein Wellenformdiagramm der Ausgabe des Mikrophons 1 von 4, während 5(b) ein Diagramm ist, welches das Verhältnis des Schallsignals (Signalkomponente) S zur Geräuschkomponente N(S/N) darstellt.
  • Wie in 5(a) abgebildet, besteht die ausgegebene Wellenform des Mikrophons 1 aus der Geräuschkomponente und dem Schallsignal. Die das Schallsignal umfassende Schallperiode weist einen hohen Schallpegelwert in der ausgegebenen Wellenform auf.
  • Wie in 5(b) dargestellt, erfasst der Schalldetektor 7 von 4 jede Periode mit geringem S/N-Verhältnis, also dem Verhältnis des Schallsignals (Sprachkomponente) zur Geräuschkomponente, als Geräuschperiode, während der Detektor jede Periode mit einem hohen S/N-Verhältnis als Schallperiode ermittelt.
  • 6 ist ein Flussdiagramm zur Veranschaulichung der Arbeitsabläufe des in 4 abgebildeten Schalldetektors 7.
  • Wie in 6 zu sehen, bestimmt der Schalldetektor 7, ob das eingegebene, digitale Schallsignal DS ein Schallsignal (Schritt S61) ist oder nicht. Wenn das eingegebene, digitale Schallsignal DS kein Schallsignal ist, bleibt der Schalldetektor 7 in Bereitschaft bis das nächste eingegebene, digitale Schallsignal DS als Schallsignal erkannt wurde. Währenddessen legt der Schalldektektor 7, wenn das eingegebene, digitale Schallsignal DS als Schallsignal erfasst wurde, das Steuersignal CIS1 am Selektor 11 von 4 an, so dass das am Selektor 11 angewendete, digitale Schallsignal DS am Puffer 21 (Schritt S62) angelegt wird. Der Schalldetektor 7 legt das Steuersignal CB1 am Puffer 21 an, so dass das digitale Schallsignal DS im Puffer 21 gespeichert wird (Schritt S63).
  • Der Schalldetektor 7 bestimmt dann, ob das Vollsignal F1, welches ausgegeben wird, wenn das digitale Schallsignal DS sowie die speicherfähige Kapazität L vom Puffer 21 gespeichert wurde, empfangen wurde oder nicht (Schritt S64). Der Schalldetektor 7 wiederholt den Schritt S63 bevor das Vollsignal F1 nicht vom Puffer 21 empfangen wurde. Währenddessen legt der Schalldetektor 7 das Steuersignal CIS2 am Selektor 11 von 4 als Reaktion auf das Vollsignal F1 an, welches von Puffer 21 empfangen wurde, so dass das digitale, am Selektor 11 angelegte Schallsignal DS am Puffer 22 angelegt wird (Schritt S65). Der Schalldetektor 7 wendet das Steuersignal CB2 am Puffer 22 an, so dass der Puffer 22 das digitale Schallsignal DS speichert (Schritt S66). Der Schalldetektor 7 gibt die Steuersignale CIS2 und CB2 aus und legt dann das Steuersignal COS1 am Selektor 12 an, so dass das gespeicherte, digitale und vom Puffer 21 angelegte Schallsignal DS an der Schallpegel-Einstelleinrichtung 5 angelegt wird (Schritt S68). Der Schallpegel-Halter 8 wendet an der Schallpegel-Einstelleinrichtung 5 den wiederholt im Halteregister des Schallpegel-Halters 8 gespeicherten Schallpegel-Schätzwert LVL als Reaktion auf das Steuersignal SL1 an, welches durch Puffer 21 angelegt wurde.
  • Dann wendet der Schalldetektor 7 das Steuersignal CBO1 am Puffer 21 an, so dass das gespeicherte, digitale Schallsignal DS an der Schallpegel-Einstelleinrichtung 5 ausgegeben wird (Schritt S69). Der Schalldetektor 7 bestimmt dann, ob das digitale, im Puffer 21 gespeicherte Schallsignal DS gänzlich an die Schallpegel-Einstelleinrichtung 5 ausgegeben wird (Schritt S70). Hierin wird das Steuersignal CBO1, wenn das digitale Schallsignal DS nicht gänzlich vom Puffer 21 ausgegeben wird, noch einmal am Puffer 21 angelegt, so dass das gespeicherte, digitale Schallsignal DS an der Schallpegel-Einstelleinrichtung 5 ausgegeben werden kann. Währenddessen legt der Schalldetektor 7, wenn das digitale, in Puffer 21 gespeicherte Schallsignal DS gänzlich ausgegeben wird, ein Steuersignal CR am Puffer 21 an, so dass die Daten im Puffer getilgt (gelöscht) werden (Schritt S71).
  • 7 ist ein schematisches Diagramm, welches die Eingabe/Ausgabe eines digitalen Schallsignals in/aus den Puffern 21 und 22 darstellt, wenn ein Sprecher zwei Wörter spricht.
  • Wie in 7 abgebildet, wird der Puffer 21 mit dem Steuersignal CB1 bereitgestellt, welches vom Schalldetektor 7 am Anfang eines Wortes W1 in einer Schallperiode S stammt, so dass das digitale Schallsignal DS damit beginnt in den Puffer 21 eingegeben zu werden. Hierin sind die Puffer 21 und 22 Speicher vom FIFO-Typ (First In First Out) und haben im Wesentlichen die gleiche Speicherkapazität wie L.
  • Das digitale Schallsignal DS wird am Puffer 21 für fast das gesamte eine Wort W1 eingegeben und sobald das digitale Schallsignal sowie die Kapazität L, die im Puffer 21 speicherfähig sind, gespeichert wurden, gibt der Puffer 21 das Vollsignal F1 am Schalldetektor 7 aus. Der Puffer 21 gibt das Vollsignal F1 aus und gibt dann das im Puffer 21 gespeicherte, digitale Schallsignal DS als Reaktion auf das vom Schalldetektor 7 angewendete Steuersignal CBO1 aus. Währenddessen beginnt der Puffer 21 mit der Speicherung des digitalen Schallsignals als Reaktion auf das vom Schalldetektor 7 angelegte Steuersignal CB2.
  • Der Puffer 22 gibt das Vollsignal F2 am Schalldetektor 7 aus, wenn das digitale Schallsignal DS sowie dessen speicherfähige Kapazität L gespeichert wurden. Währenddessen wird das im Puffer 21 während der Speicherung des Signals in Puffer 22 gespeicherte, digitale Schallsignal DS gänzlich an die Schallpegel-Einstelleinrichtung 5 ausgegeben und dann werden alle Daten im Puffer 21 als Reaktion auf das Steuersignal CR, welches vom Schalldetektor 7 angewendet wurde, getilgt (gelöscht). Dadurch wird das Steuersignal CB1, welches die nochmalige Speicherung des digitalen Schallsignals DS bewirkt, am Puffer 21 vom Schalldetektor 7 angelegt.
  • Wie oben beschrieben, wird das digitale Schallsignal vom Anfangspunkt einer Schallperiode an gespeichert und ein dem gespeicherten, digitalen Schallsignal entsprechender Schallpegel-Schätzwert kann zum akkuraten Einstellen des Schallpegels verwendet werden. Daraus ergibt sich, dass die Spracherkennung auf der Grundlage eines akkuraten Schallpegels eingestellt werden kann, so dass das Spracherkennungsverhältnis verbessert wird.
  • Wenn ein digitales Schallsignal DS für einen längere Periode mit einer Vielzahl an Wörtern eingegeben wird, können die Speicher- und Ausgabevorgänge alternierend durchgeführt werden. Auf diese Weise kann die Spracherkennung mithilfe eines Puffers mit geringer Kapazität durchgeführt werden.
  • Hierbei ist anzumerken, dass, während die Puffer gemäß der vorliegenden Erfindung verwendet werden, auch andere Arten von Speicherschaltungen eingesetzt werden können. Außerdem können die Puffer in ihrem Inneren einen Zähler aufweisen, der Zähler im Puffer kann vom Schalldetektor 7 überwacht werden und das Vollsignal F1 oder F2 oder das Steuersignal CR können ausgegeben werden.
  • 8 zeigt eine Spracherkennungsvorrichtung, welche ein Mikrophon 1, einen Analog-Digital-Wandler (A/D-Wandler) 2, eine Signalverzögerungseinheit 3, einen Schallpegelschätzer 4, eine Schallpegeleinstellungs-Rückkopplungseinheit 9 und eine Spracherkennungs-Rückkopplungseinheit 10 umfasst.
  • Wie in 8 zu sehen, wird die vom Sprecher ausgegebene Sprache vom Mikrophon 1 aufgenommen. Die aufgenommene Sprache wird in ein analoges Schallsignal SA durch das Mikrophon 1 als Ausgabe an den A/D-Wandler 2 umgewandelt. Der A/D-Wandler 2 wandelt das analoge Schallsignal SA in ein digitales Schallsignal DS zur Anwendung an der Signalverzögerungseinheit 3 und dem Schallpegelschätzer 4 um. Der Schallpegelschätzer 4 berechnet einen Schallpegel-Schätzwert LVL auf der Grundlage des angelegten, digitalen Schallsignals DS. Hierin entspricht das Verfahren zur Berechnung des Schallpegel-Schätzwerts LVL durch den in 8 abgebildeten Schallpegelschätzer 4 dem Verfahren zur Berechung des Schallpegel-Schätzwerts LVL durch den in 1 dargestellten Schallpegelschätzer 4.
  • Der Schallpegelschätzer 4 berechnet den Schallpegel-Schätzwert LVL zum Anlegen an der Schallpegeleinstellungs-Rückkopplungseinheit 9. Die Schallpegeleinstellungs-Rückkopplungseinheit 9 stellt den Pegel des digitalen Schallsignals DS ein, welches von der Signalverzögerungseinheit 3 auf der Grundlage und synchron mit dem vom Schallpegelschätzer 4 angelegten Schallpegel-Schätzwert LVL angelegt wurde. Die Schallpegeleinstellungs-Rückkopplungseinheit 9 legt an der Spracherkennungs-Rückkopplungseinheit 10 eine Ausgabe CTRL_OUT nach der Einstellung des Schallpegels an. Die Spracherkennungs-Rückkopplungseinheit 10 führt die Spracherkennung auf der Grundlage der eingestellten Ausgabe CTRL-OUT durch, welche von der Schallpegeleinstellungs-Rückkopplungseinheit 9 angelegt wurde, und wendet das Schallpegel-Steuersignal RC an der Schallpegeleinstellungs-Rückkopplungseinheit 9 an, wenn die Spracherkennung nicht erfolgreich war. Die Arbeitsabläufe der Schallpegeleinstellungs-Rückkopplungseinheit 9 und der Spracherkennungs-Rückkopplungseinheit 10 werden später näher erläutert.
  • In der Spracherkennungsvorrichtung von 8 entsprechen das Mikrophon 1 und der A/D-Wandler (Analog-Digital-Wandler) 2 den Eingabemitteln, die Signalverzögerungseinheit 3 der Verzögerungsschaltung, der Schallpegelschätzer 4 dem Schallpegel-Schätzmittel, die Schallpegeleinstellungs-Rückkopplungseinheit 9 dem Schallpegel-Einstellungsmittel und die Spracherkennungs-Rückkopplungseinheit 10 dem Spracherkennungsmittel.
  • 9 ist ein Flussdiagramm zur Veranschaulichung der Arbeitsabläufe der Schallpegeleinstellungs-Rückkopplungseinheit, wie in 8 abgebildet, wenn der Schallpegel eingestellt wird.
  • Wie in 9 abgebildet, bestimmt die Schallpegeleinstellungs-Rückkopplungseinheit 9, ob das Schallpegel-Steuersignal RC durch die Spracherkennungs-Rückkopplungseinheit 10 eingegeben wird oder nicht (Schritt S91). Wenn das Schallpegel-Steuersignal RC nicht durch Spracherkennungs-Rückkopplungseinheit 10 eingegeben wird, bleibt die Schallpegeleinstellungs-Rückkopplungseinheit 9 in Bereitschaft bis bestimmt wird, dass das Schallpegel-Steuersignal RC von der Schallpegeleinstellungs-Rückkopplungseinheit 9 eingegeben wird. Wenn währenddessen bestimmt wurde, dass das Schallpegel-Steuersignal RC von der Spracherkennungs-Rückkopplungseinheit 10 eingegeben wird, fügt die Schallpegeleinstellungs-Rückkopplungseinheit 9 „1" zur Variablen K hinzu (Schritt S92).
  • Hierin werden die Schallpegel-Zielwerte in einer Vielzahl an Pegeln vorbestimmt und die Variabl K steht für die Anzahl der Pegel. Gemäß der dritten Ausführungsform, weist die Variable K einen Wert im Bereich von 1 bis R auf und der Schallpegel-Zielwert TRG_LVL(K) kann TRG_LVL(1), TRG_LVL(2), ... oder TRG_LVL(R) sein.
  • Die Schallpegeleinstellungs-Rückkopplungseinheit 9 bestimmt dann, ob die Variable K größer als der Maximalwert R ist oder nicht (Schritt S93). Hierin bestimmt die Schallpegeleinstellungs-Rückkopplungseinheit 9, dass die Variable K größer als der Maximalwert R ist, die Schallpegeleinstellungs-Rückkopplungseinheit 9 bringt die Variable K auf den Minimalwert 1 zurück (Schritt S94) und stellt den Schallpegel-Zielwert TRG_LVL auf TRG_LVL(1) ein (Schritt S95).
  • Wenn die Schallpegeleinstellungs-Rückkopplungseinheit 9 bestimmt, dass die Variable K den Maximalwert R oder weniger beträgt, stellt die Schallpegeleinstellungs-Rückkopplungseinheit 9 inzwischen den Schallpegel-Zielwert TRG_LVL auf TRG_LVL(K) ein (Schritt S95).
  • Es wird angenommen, dass der den Schallpegel-Zielwert TRG_LVL ursprünglich beispielsweise auf TRG_LVL(2) eingestellt wurde. Wenn dann von der Spracherkennungs-Rückkopplungseinheit 10 die Sprache nicht erkannt wurde oder die Spracherkennung fehlschlug, wird das Steuersignal RC an der Schallpegeleinstellungs-Rückkopplungseinheit 9 ausgegeben. Die Schallpegeleinstellungs-Rückkopplungseinheit 9 ändert den Schallpegel-Zielwert TRG_LVL(2) in den Schallpegel-Zielwert TRG_LVL(3) um und wartet darauf, dass die Eingabe der Sprache durch den Sprecher nochmals erfolgt.
  • Auf diese Weise erfolgt nacheinander die Veränderung des Schallpegel-Zielwerts TRG_LVL zum Schallpegel-Zielwert TRG_LVL(2), TRG_LVL(3) und TRG_LVL(4) und wenn die Spracherkennung erfolgreich durchgeführt wurde, wird der Schallpegel-Zielwert TRG_LVL dieses Zeitpunkts festgelegt. Wenn der Schallpegel-Zielwert TRG_LVL auf den Maximalwert TRG_LVL(R) eingestellt wird und die Spracherkennung immer noch nicht erfolgreich ist, kehrt der Schallpegel-Zielwert TRG_LVL auf den Minimalwert TRG_LVL(1) zurück und es wird auf die Spracheingabe durch den Sprecher gewartet.
  • Dadurch wird der Schallpegel-Zielwert TRG_LVL auf einen für die Spracherkennung optimalen Wert eingestellt.
  • Wie oben beschrieben, kann der Grad der Schallpegel-Einstellung nacheinander durch die Schallpegeleinstellungs-Rückkopplungseinheit 9 wieder angehoben werden, wenn die Spracherkennung nicht erfolgreich durchgeführt werden konnte. Wenn der Schallpegel auf den Grad des vorbestimmten Maximal-Schallpegelwerts eingestellt wird, kann der Schallpegel wieder auf den Minimalpegel zurück gebracht werden und der Einstellungsgrad kann wieder nacheinander angehoben werden. Wenn die Spracherkennung nicht erfolgreich aufgrund eines unpassenden Grads der Schallpegeleinstellung war, kann daher der Grad wiederholt und aufeinanderfolgend so verändert werden, dass das Spracherkennungsverhältnis verbessert wird.
  • Hierbei ist anzumerken, dass, gemäß der oben erwähnten Beschreibung, nach einer nicht erfolgreich durchgeführten Spracherkennung, der Zielwert TRG_LVL(K) für den Schallpegel nacheinander auf der Grundlage der wiederholten Spracheingaben durch den Sprecher verändert wird. Währenddessen beschränkt sich die Erfindung nicht ausschließlich darauf und Mittel zum Halten der Spracheingabe können bereitgestellt werden und nach einer nicht erfolgreichen Spracherkennung kann die von den Spracheingabe-Haltemitteln gehaltene Spracheingabe zum Verändern des Schallpegelziels TRG_LVL(K) der Reihe nach verwendet werden.
  • 10 ist ein Blockdiagramm, welches ein Beispiel einer Spracherkennungsvorrichtung gemäß einer Ausführungsform der vorliegenden Erfindung zeigt.
  • Wie in 10 dargestellt, umfasst die Spracherkennungsvorrichtung ein Mikrophon 1, einen Analog-Digital-Wandler (A/D-Wandler) 2, eine Signalverzögerungseinheit 3, einen Schallpegelschätzer 4, eine Schallpegel-Einstelleinrichtung 5, eine Schallpegel-Erkennungseinheit 6 und einen nichtlinearen Signalprozessor 11.
  • Wie in 10 abgebildet, wird das vom Sprecher kommende Sprachsignal vom Mikrophon 1 aufgenommen. Die aufgenommene Sprache wird in ein analoges Schallsignal SA durch das Mikrophon 1 als Ausgabe an den A/D-Wandler 2 umgewandelt. Der A/D-Wandler 2 wandelt das analoge Schallsignal SA in ein digitales Schallsignal DS zum Anlegen an der Signalverzögerungseinheit 3 und dem Schallpegelschätzer 4 um. Der Schallpegelschätzer 4 berechnet einen Schallpegel-Schätzwert LVL auf der Grundlage des angelegten, digitalen Schallsignals DS. Hierin entspricht das Verfahren zur Berechnung des Schallpegel-Schätzwerts LVL durch den Schallpegelschätzer 4 gemäß der Ausführungsform dem Verfahren zur Berechung des Schallpegel-Schätzwerts LVL durch den in 1 dargestellten Schallpegelschätzer 4. Der Schallpegelschätzer legt das digitale Schallsignal DS und den Schallpegel-Schätzwert LVL am nicht linearen Signalprozessor an. Der nichtlineare Signalprozessor 11 führt einen nichtlinearen Prozess durch, wie er auf der Grundlage des vom Schallpegelschätzer 4 angewendeten Schallpegel-Schätzwerts LVL beschrieben wird und legt den Schallpegel-Schätzwert LVL nach dem linearen Prozess an der Schallpegel-Einstelleinrichtung 5 an.
  • Währenddessen legt die Signalverzögerungseinheit 3 das digitale Schallsignal, welches durch eine der Schallpegel-Anstiegszeit TL entsprechende Periode verzögert wurde, an der Schallpegel-Einstelleinrichtung 5 an. Hierin beträgt die der Schallpegel-Anstiegszeit TL entsprechende Verzögerung gemäß der Ausführungsform 100 ms. Die Schallpegel-Einstelleinrichtung 5 führt die Schallpegeleinstellung des digitalen Schallsignals DS durch, welches von der Signaleinheit 3 auf der Grundlage des vom nichtlinearen Signalprozessor angewendeten Schallpegel-Schätzwerts LVL angelegt wird. Die Schallpegel-Einstelleinrichtung 5 legt die eingestellte Schallpegelausgabe CTRL_OUT an der Spracherkennungseinheit 6 an. Die Spracherkennungseinheit 6 führt die Spracherkennung auf der Grundlage der eingestellten Schallpegelausgabe CTRL_OUT durch, welche von der Schallpegel-Einstelleinrichtung 5 angelegt wird.
  • In der Spracherkennungsvorrichtung gemäß der Ausführungsform entsprechen das Mikrophon 1 und der A/D-Wandler (Analog-Digital-Wandler) 2 den Eingabemitteln, die Signalverzögerungseinheit 3 der Verzögerungsschaltung, der Schallpegelschätzer 4 dem Schallpegel-Schätzmittel, die Schallpegel-Einstelleinrichtung 5 dem Schallpegel-Einstellungsmittel, die Spracherkennungseinheit 6 dem Spracherkennungsmittel und der nichtlineare Signalprozessor 11 dem nichtlinearen Prozessor.
  • 11 ist ein Diagramm zur Veranschaulichung der Beziehung zwischen dem am nichtlinearen, in 10 dargestellten Signalprozessor 11 eingegebenen Schallpegel-Schätzwert LVL und dem Erkennungsverhältnis der in 10 dargestellten Spracherkennungseinheit.
  • Wie in 11 dargestellt, hängt das Spracherkennungsverhältnis der Spracherkennungseinheit 6 von 10 vom Schallpegel-Schätzwert LVL ab. Wenn sich der Schallpegel-Schätzwert LVL im Bereich von –19 dB bis –2 dB bewegt, beträgt das Erkennungsverhältnis 80 % und mehr. Wenn der Schallpegel-Schätzwert LVL besonders niedrig (zumeist bei –19 dB) oder sehr hoch (mindestens –2 dB) ist, nimmt die Spracherkennungsrate rasch ab.
  • Deshalb wird im nichtlinearen Signalprozessor 11 gemäß der Ausführungsform der Erfindung der Schallpegel-Schätzwert LVL so eingestellt, dass er sich im Bereich von –19 dB bis –2 dB befindet.
  • 12 ist ein Flussdiagramm zur Darstellung des Prozessablaufs des nichtlinearen Signalprozessors 11.
  • Wie in 12 zu sehen, bestimmt der nichtlineare Signalprozessor 11, ob der vom Schallpegelschätzer 4 eingegebene Schallpegel-Schätzwert LVL sich im Bereich von –19 dB bis –2 dB befindet oder nicht (Schritt S101).
  • Wenn der nichtlineare Signalprozessor 11 bestimmt, dass der eingegebene Schallpegel-Schätzwert LVL sich im Bereich von –19 dB bis –2 dB bewegt, wird die Schallpegel-Einstelleinrichtung 5 deaktiviert. Besonders in diesem Fall ist der in der Schallpegel-Einstelleinrichtung 5 eingestellte Schallpegelwert LVL_CTRL im Ausdruck (2) gleich 1.
  • Wenn inzwischen der nichtlineare Signalprozessor 11 bestimmt, dass sich der eingegebene Schallpegel-Schätzwert LVL nicht im Bereich von 19 dB bis –2 dB bewegt, wird der Schallpegel-Schätzwert LVL auf –10 dB festgesetzt (Schritt 102).
  • Wie beschrieben, setzt der nichtlineare Signalprozessor 11 den Schallpegel-Schätzwert LVL fest, damit eine Erkennungsrate von mindestens 80% zustande kommt und dadurch kann die Erkennungsverhältnisrate des eingegebenen, digitalen Schallsignals DS in der Spracherkennungseinheit 6 verbessert werden. Besonders nur dann, wenn der Schallpegel-Schätzwert LVL sich nicht im vorbestimmten Bereich bewegt, wird der Schallpegel-Schätzwert zu einem Schallpegel-Schätzwert innerhalb des vorbestimmten Bereichs zur Einstellung des Schallpegels umgeändert. Wenn währenddessen der Schallpegel-Schätzwert sich innerhalb des vorbestimmten Bereichs befindet, wird der Verstärkungsfaktor auf 1 in der Schallpegel-Einstelleinrichtung 5 festgesetzt, um die Schallpegel-Einstelleinrichtung 5 zu deaktivieren, so dass der Schallpegel nicht eingestellt wird. Die Spracherkennung kann somit einfach ohne unerwünschte Verzerrungen des akzentuierten Teils der Sprache, welcher die Betonung der durch den Sprecher gesprochenen Worte darstellt, durchgeführt werden, so dass das Spracherkennungsverhältnis verbessert wird.
  • Hierbei ist anzumerken, dass in der oben erwähnten Ausführungsform der Schallpegel-Schätzwert innerhalb des Bereichs von –19 dB bis –2 dB eingestellt wird, während die Erfindung nicht darauf beschränkt ist und der Wert auf einen vorbestimmten Schallpegel-Schätzwert in der Spracherkennung oder einen Schallpegel-Schätzwert, der höhere Erkennungsverhältnisse zulässt, eingestellt werden kann.

Claims (19)

  1. Spracherkennungsvorrichtung, umfassend: Eingabemittel (1, 2), die zum Eingeben eines digitalen Schallsignals angeordnet sind; ein Schallpegel-Schätzmittel (4), das zum Schätzen des Schallpegels einer Schallperiode auf der Grundlage des digitalen Schallsignals in einem Teil der von den Eingabemitteln (1, 2) eingegebenen Schallperiode angeordnet ist; ein Schallpegel-Einstellungsmittel (5), das zum Einstellen des Pegels des digitalen Schallsignals in der von den Eingabemitteln (1, 2) eingegebenen Schallperiode auf der Grundlage des vom Schallpegel-Schätzmittel (4) geschätzten Schallpegels und eines vorbestimmten Zielpegels angeordnet ist; ein Spracherkennungsmittel (6), das zur Durchführung der Spracherkennung auf der Grundlage des vom Schallpegel-Einstellungsmittel (5) eingestellten digitalen Schallsignals angeordnet ist; und gekennzeichnet durch einen nichtlinearen Prozessor (11), der zum Deaktivieren des Schallpegel-Einstellungsmittel (5), wenn der vom Schallpegel-Schätzmittel (4) geschätzte Schallpegel innerhalb eines vorbestimmten Bereichs liegt; und wenn der vom Schallpegel-Schätzmittel (4) geschätzte Schallpegel nicht innerhalb des vorbestimmten Bereichs liegt, zum Aktivieren des Schallpegel-Einstellungsmittel (5) und zum Ändern des vom Schallpegel-Schätzmittel (4) geschätzten Schallpegels auf einen vorbestimmten Schallpegel, der innerhalb des vorbestimmten Bereichs liegt, um diesen an das Schallpegel-Einstellungsmittel (5) anzulegen, angeordnet ist.
  2. Spracherkennungsvorrichtung nach Anspruch 1, worin das Schallpegel-Schätzmittel (4) zum Schätzen des Schallpegels der Schallperiode auf der Grundlage des digitalen Schallsignals in einem vorgeschriebenen Zeitraum zu Beginn der von den Eingabemitteln (1, 2) eingegebenen Schallperiode angeordnet ist.
  3. Spracherkennungsvorrichtung nach Anspruch 2, worin das Schallpegel-Schätzmittel (4) zum Schätzen des Mittelwerts des digitalen Schallsignals im vorgeschriebenen Zeitraum zu Beginn der von den Eingabemitteln (1, 2) eingegebenen Schallperiode als den Schallpegel der Schallperiode angeordnet ist.
  4. Spracherkennungsvorrichtung nach einem der vorangegangenen Ansprüche, worin das Schallpegel-Einstellungsmittel (5) zum Verstärken oder Dämpfen des Pegels des digitalen Schallsignals in der von den Eingabemitteln (1, 2) eingegebenen Schallperiode um einen Verstärkungsfaktor, der durch das Verhältnis zwischen einem vorbestimmten Zielpegel und dem vom Schallpegel-Schätzmittel (4) geschätzten Schallpegel bestimmt wird, angeordnet ist.
  5. Spracherkennungsvorrichtung nach einem der vorangegangenen Ansprüche, weiters umfassend eine Verzögerungsschaltung (3), die das von den Eingabemitteln (1, 2) eingegebene digitale Schallsignal verzögert, sodass das digitale Schallsignal in der Schallperiode gemeinsam und synchron mit dem vom Schallpegel-Schätzmittel (4) geschätzten Schallpegel an das Schallpegel-Einstellungsmittel (5) angelegt wird.
  6. Spracherkennungsvorrichtung nach einem der vorangegangenen Ansprüche, worin das Schallpegel-Schätzmittel (4) Folgendes umfasst: einen Schalldetektor (7), der den Anfangspunkt des digitalen Schallsignals in der von den Eingabemitteln (1, 2) eingegebenen Schallperiode detektiert; einen Schallpegelschätzer (4), der den Schallpegel der Schallperiode auf der Grundlage des digitalen Schallsignals in einem vorgeschriebenen Zeitraum zu Beginn der von den Eingabemitteln (1, 2) eingegebenen Schallperiode schätzt; eine Halteschaltung (8), die den vom Schallpegelschätzer (4) geschätzten Schallpegel hält; und eine Speicherschaltung, die das digitale Schallsignal in der von den Eingabemitteln (1, 2) eingegebenen Schallperiode als Reaktion auf die Detektion des Schalldetektors speichert und das gespeicherte digitale Schallsignal in der Schallperiode synchron mit dem in der Halteschaltung gehaltenen Schallpegel an das Schallpegel-Einstellungsmittel ausgibt.
  7. Spracherkennungsvorrichtung nach Anspruch 6, worin die Speicherschaltung einen ersten und einen zweiten Puffer (21, 22) umfasst, die zum alternativen Speichern des digitalen Schallsignals in der von den Eingabemitteln (1, 2) eingegebenen Schallperiode und zum alternierenden Ausgeben des gespeicherten digitalen Schallsignals in der Schallperiode an das Schallpegel-Einstellungsmittel (5) angeordnet sind.
  8. Spracherkennungsvorrichtung nach einem der vorangegangenen Ansprüche, worin das Spracherkennungsmittel (6) zum Rückkoppeln eines Ergebnisses der Spracherkennung zum Schallpegel-Einstellungsmittel (5) angeordnet ist, und das Schallpegel-Einstellungsmittel (5) zum Ändern des Grads der Einstellung auf den Schallpegel auf der Grundlage des vom Spracherkennungsmittel (6) rückgekoppelten Ergebnisses der Spracherkennung angeordnet ist.
  9. Spracherkennungsvorrichtung nach Anspruch 8, worin das Schallpegel-Einstellungsmittel (5) zum Anheben des Verstärkungsfaktors für den Schallpegel, wenn die Spracherkennung durch das Spracherkennungsmittel (6) nicht möglich ist, angeordnet ist.
  10. Spracherkennungsverfahren, umfassend die folgenden Schritte: das Eingeben eines digitalen Schallsignals; das Schätzen des Schallpegels einer Schallperiode auf der Grundlage des eingegebenen digitalen Schallsignals in einem Teil der Schallperiode; das Einstellen des Pegels des digitalen Schallsignals in der Schallperiode auf der Grundlage des geschätzten Schallpegels und eines vorbestimmten Zielpegels; das Durchführen der Spracherkennung auf der Grundlage des eingestellten digitalen Schallsignals; und gekennzeichnet durch das Deaktivieren des Schritts des Einstellens des Pegels des digitalen Schallsignals, wenn der geschätzte Schallpegel innerhalb eines vorbestimmten Bereichs liegt; und wenn der geschätzte Schallpegel nicht innerhalb des vorbestimmten Bereichs liegt, das Aktivieren des Einstellungsschritts und das Ändern des geschätzten Schallpegels auf einen Schallpegel, der innerhalb des vorbestimmten Bereichs liegt, zur Verwendung beim Einstellen des Pegels des digitalen Schallsignals.
  11. Spracherkennungsverfahren nach Anspruch 10, worin der Schritt des Schätzens des Schallpegels das Schätzen des Schallpegels der Schallperiode auf der Grundlage des digitalen Schallsignals in einem vorgeschriebenen Zeitraum zu Beginn der Schallperiode umfasst.
  12. Spracherkennungsverfahren nach Anspruch 11, worin der Schritt des Schätzens des Schallpegels das Schätzen des Mittelwerts des digitalen Schallsignals im vorgeschriebenen Zeitraum zu Beginn der Schallperiode als den Schallpegel der Schallperiode umfasst.
  13. Spracherkennungsverfahren nach einem der Ansprüche 10 bis 12, worin der Schritt des Einstellens des Pegels des digitalen Schallsignals das Verstärken oder Dämpfen des Pegels des digitalen Schallsignals in der Schallperiode um einen Ver stärkungsfaktor, der durch das Verhältnis zwischen dem vorbestimmten Zielpegel und dem geschätzten Schallpegel bestimmt wird, umfasst.
  14. Spracherkennungsverfahren nach einem der Ansprüche 10 bis 13, weiters umfassend den Schritt des Verzögerns des digitalen Schallsignals, sodass das digitale Schallsignal in der Schallperiode gemeinsam und synchron mit dem geschätzten Schallpegel auf den Schritt des Einstellens des Pegels des digitalen Schallsignals angewendet wird.
  15. Spracherkennungsverfahren nach einem der Ansprüche 10 bis 14, worin der Schritt des Schätzens des Schallpegels die folgenden Schritte umfasst: das Detektieren des Anfangspunkts des digitalen Schallsignals in der Schallperiode; das Schätzen des Schallpegels der Schallperiode auf der Grundlage des digitalen Schallsignals in einem vorgeschriebenen Zeitraum zu Beginn der Schallperiode; das Speichern des digitalen Schallsignals in der Schallperiode als Reaktion auf die Detektion des Anfangspunkts des digitalen Schallsignals und das Ausgeben des gespeicherten digitalen Schallsignals in der Schallperiode synchron mit dem gehaltenen Schallpegel.
  16. Spracherkennungsverfahren nach Anspruch 15, worin der Schritt des Speicherns den Schritt des Speicherns des digitalen Schallsignals in der Schallperiode alternierend in einem ersten und einem zweiten Puffer und das Ausgeben des gespeicherten digitalen Schallsignals in der Schallperiode alternativ aus dem ersten und dem zweiten Puffer umfasst.
  17. Spracherkennungsverfahren nach einem der Ansprüche 10 bis 16, worin der Schritt des Durchführens der Spracherkennung den Schritt des Rückkoppelns eines Ergebnisses der Spracherkennung während des Schritts des Einstellens des Pegels des digitalen Schallsignals umfasst, und der Schritt des Einstellens des Pegels des digitalen Schallsignals das Ändern des Grads der Einstellung des Schallpegels auf der Grundlage des rückgekoppelten Ergebnisses der Spracherkennung umfasst.
  18. Spracherkennungsverfahren nach Anspruch 17, worin der Schritt des Einstellens des Pegels des digitalen Schallsignals das Anheben des Verstärkungsfaktors für den Schallpegel umfasst, wenn die Spracherkennung nicht möglich ist.
  19. Computerlesbares Spracherkennungsprogramm, das einen Computer die Ausführung der folgenden Schritte ermöglicht: das Eingeben eines digitalen Schallsignals; das Schätzen des Schallpegels einer Schallperiode auf der Grundlage des eingegebenen digitalen Schallsignals in einem Teil der Schallperiode; das Einstellen des Pegels des eingegebenen digitalen Schallsignals in der Schallperiode auf der Grundlage des geschätzten Schallpegels und eines vorbestimmten Zielpegels; das Durchführen der Spracherkennung auf der Grundlage des eingestellten digitalen Schallsignals; und das Deaktivieren des Schritts des Einstellens des Schallpegels des digitalen Schallsignals, wenn der geschätzte Schallpegel innerhalb eines vorbestimmten Bereichs liegt; und wenn der geschätzte Schallpegel nicht innerhalb des vorbestimmten Bereichs liegt, das Aktivieren des Einstellungsschritts und das Ändern des geschätzten Schallpegels auf einen Schallpegel, der innerhalb des vorbestimmten Bereichs liegt, zur Verwendung beim Einstellen des Pegels des digitalen Schallsignals.
DE60122893T 2000-07-10 2001-07-09 Verfahren, vorrichtung und programm zur sprecherkennung Expired - Lifetime DE60122893T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2000208083 2000-07-10
JP2000208083 2000-07-10
JP2001203754A JP4880136B2 (ja) 2000-07-10 2001-07-04 音声認識装置および音声認識方法
JP2001203754 2001-07-04
PCT/JP2001/005950 WO2002005266A1 (fr) 2000-07-10 2001-07-09 Systeme de reconnaissance de la parole, procede de reconnaissance de la parole et programme de reconnaissance de la parole

Publications (2)

Publication Number Publication Date
DE60122893D1 DE60122893D1 (de) 2006-10-19
DE60122893T2 true DE60122893T2 (de) 2007-03-15

Family

ID=26595685

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60122893T Expired - Lifetime DE60122893T2 (de) 2000-07-10 2001-07-09 Verfahren, vorrichtung und programm zur sprecherkennung

Country Status (7)

Country Link
US (1) US20020173957A1 (de)
EP (1) EP1300832B1 (de)
JP (1) JP4880136B2 (de)
KR (1) KR100482477B1 (de)
CN (1) CN1227647C (de)
DE (1) DE60122893T2 (de)
WO (1) WO2002005266A1 (de)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100406307B1 (ko) * 2001-08-09 2003-11-19 삼성전자주식회사 음성등록방법 및 음성등록시스템과 이에 기초한음성인식방법 및 음성인식시스템
JP3815388B2 (ja) * 2002-06-25 2006-08-30 株式会社デンソー 音声認識システムおよび端末
JP4552064B2 (ja) * 2003-10-15 2010-09-29 独立行政法人情報通信研究機構 音声レベル自動補正装置
US7925510B2 (en) * 2004-04-28 2011-04-12 Nuance Communications, Inc. Componentized voice server with selectable internal and external speech detectors
KR100705563B1 (ko) * 2004-12-07 2007-04-10 삼성전자주식회사 입력 레벨 자동 조절을 위한 음성 인식 시스템 및 이를이용한 음성 인식 방법
JP4667082B2 (ja) 2005-03-09 2011-04-06 キヤノン株式会社 音声認識方法
KR100720337B1 (ko) 2005-09-06 2007-05-22 한국과학기술연구원 비선형 증폭기를 이용한 음성처리 시스템
US20080015104A1 (en) 2006-07-13 2008-01-17 Unimin Corporation Ultrafine nepheline syenite
KR20080078458A (ko) * 2007-02-23 2008-08-27 이선일 음성 인식 회로
US8249269B2 (en) * 2007-12-10 2012-08-21 Panasonic Corporation Sound collecting device, sound collecting method, and collecting program, and integrated circuit
KR20160132574A (ko) 2015-05-11 2016-11-21 현대자동차주식회사 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59223499A (ja) * 1983-06-02 1984-12-15 松下電器産業株式会社 音素認識装置
JPS6016200A (ja) * 1983-07-08 1985-01-26 池田 栄子 栄養群別カロリ−表示販売システム
JPS6016200U (ja) * 1983-07-12 1985-02-02 カシオ計算機株式会社 音声認識装置に於けるリミツタアンプ
JPS6262399A (ja) * 1985-09-13 1987-03-19 株式会社日立製作所 音声高能率符号化方式
JPS63316097A (ja) * 1987-06-19 1988-12-23 日本電気株式会社 連続音声認識装置
JP2969862B2 (ja) * 1989-10-04 1999-11-02 松下電器産業株式会社 音声認識装置
JP2975808B2 (ja) * 1993-05-31 1999-11-10 三洋電機株式会社 音声認識装置
JP2500761Y2 (ja) * 1994-03-30 1996-06-12 株式会社アルファ 音声認識装置
JPH08115098A (ja) * 1994-10-18 1996-05-07 Hitachi Microcomput Syst Ltd 音声編集方法および装置
JPH10198397A (ja) * 1997-01-08 1998-07-31 Meidensha Corp 音声認識処理装置および音声認識処理方法
JPH11212595A (ja) * 1998-01-23 1999-08-06 Olympus Optical Co Ltd 音声処理装置、音声認識プログラムを記録した記録媒体、処理プログラムを記録した記録媒体
JPH11126093A (ja) * 1997-10-24 1999-05-11 Hitachi Eng & Service Co Ltd 音声入力調整方法および音声入力システム
US6353671B1 (en) * 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility

Also Published As

Publication number Publication date
EP1300832A1 (de) 2003-04-09
DE60122893D1 (de) 2006-10-19
CN1227647C (zh) 2005-11-16
CN1386265A (zh) 2002-12-18
JP2002091487A (ja) 2002-03-27
EP1300832B1 (de) 2006-09-06
KR100482477B1 (ko) 2005-04-14
KR20020033791A (ko) 2002-05-07
WO2002005266A1 (fr) 2002-01-17
EP1300832A4 (de) 2005-07-20
JP4880136B2 (ja) 2012-02-22
US20020173957A1 (en) 2002-11-21

Similar Documents

Publication Publication Date Title
DE69816221T2 (de) Sprachschnellheitsveränderungsverfahren und vorrichtung
DE60302407T2 (de) Umgebungs- und sprecheradaptierte Spracherkennung
DE69926851T2 (de) Verfahren und Vorrichtung zur Sprachaktivitätsdetektion
DE60122893T2 (de) Verfahren, vorrichtung und programm zur sprecherkennung
DE3752288T2 (de) Sprachprozessor
DE69831991T2 (de) Verfahren und Vorrichtung zur Sprachdetektion
DE69636985T2 (de) Sprachanwesenheitdetektor für halbduplex-audiokommunikationssystem
DE69712801T2 (de) Dynamische automatische verstärkungssteuerung in einem hörhilfegerät
DE60111329T2 (de) Anpassung des phonetischen Kontextes zur Verbesserung der Spracherkennung
DE3871711T2 (de) Verfahren und geraet zur verbesserung der verstaendlichkeit von stimmen in hoher geraeuschumgebung.
DE60204504T2 (de) Schlüsselworterkennung in einem verrauschten Signal
EP1453194A2 (de) Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
DE69918635T2 (de) Vorrichtung und Verfahren zur Sprachverarbeitung
DE3229457C2 (de) Hörhilfegerät
EP1802171A1 (de) Signalverarbeitung für Hörgeräte mit mehreren Kompressionsalgorithmen
DE112018003662T5 (de) Sprachsignalnivellierung
EP2026607A1 (de) Individuell einstellbares Hörgerät und Verfahren zu seinem Betrieb
EP1152527B1 (de) Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
DE60033636T2 (de) Pausendetektion für die Spracherkennung
WO2000005923A1 (de) Hörhilfe mit verbesserter sprachverständlichkeit durch frequenzselektive signalverarbeitung sowie verfahren zum betrieb einer derartigen hörhilfe
DE69922769T2 (de) Vorrichtung und Verfahren zur Sprachverarbeitung
DE60016144T2 (de) Hörhilfegerät
EP3588498B1 (de) Verfahren zur unterdrückung eines akustischen nachhalls in einem audiosignal
DE19624092B4 (de) Verstärkungsschaltung, vorzugsweise für analoge oder digitale Hörgeräte sowie Hörgeräte unter Verwendung einer entsprechenden Verstärkungsschaltung bzw. eines entsprechenden Signalverarbeitungs-Algorithmus
DE602004006912T2 (de) Verfahren zur Verarbeitung eines akustischen Signals und ein Hörgerät

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: PANASONIC CORP., KADOMA, OSAKA, JP

8320 Willingness to grant licences declared (paragraph 23)