DE102006007779B4 - Filterbank-Anordnung und Signalverarbeitungs-Vorrichtung - Google Patents

Filterbank-Anordnung und Signalverarbeitungs-Vorrichtung Download PDF

Info

Publication number
DE102006007779B4
DE102006007779B4 DE102006007779A DE102006007779A DE102006007779B4 DE 102006007779 B4 DE102006007779 B4 DE 102006007779B4 DE 102006007779 A DE102006007779 A DE 102006007779A DE 102006007779 A DE102006007779 A DE 102006007779A DE 102006007779 B4 DE102006007779 B4 DE 102006007779B4
Authority
DE
Germany
Prior art keywords
resonator
filter bank
circuit
filter
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE102006007779A
Other languages
English (en)
Other versions
DE102006007779A1 (de
Inventor
Werner Dr. Hemmert
Marcus Holmberg
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Infineon Technologies AG
Original Assignee
Infineon Technologies AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Infineon Technologies AG filed Critical Infineon Technologies AG
Priority to DE102006007779A priority Critical patent/DE102006007779B4/de
Publication of DE102006007779A1 publication Critical patent/DE102006007779A1/de
Application granted granted Critical
Publication of DE102006007779B4 publication Critical patent/DE102006007779B4/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • G10L2021/065Aids for the handicapped in understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Networks Using Active Elements (AREA)

Abstract

Filterbank-Anordnung, aufweisend:
• eine Filterbank mit einer Mehrzahl von Filterstufen, wobei jede Filterstufe einen Filterbank-Ausgang aufweist, und mindestens einem Filterbank-Eingang, welchem ein Eingabesignal zuführbar ist,
• mit einer Mehrzahl von Verstärker-Pfaden, wobei jeder Verstärker-Pfad mit einem zugehörigen Filterbank-Ausgang gekoppelt ist und wobei jeder Verstärker-Pfad aufweist:
• eine mit dem jeweiligen Filterbank-Ausgang gekoppelte Verstärkereinheit,
• eine der Verstärkereinheit nachgeschaltete Synaptische-Modell-Einheit, welche eingerichtet ist gemäß einem synaptischen Mechanismus-Modell eines Innenohrs eines Säugetiers,
• wobei zumindest das Ausgangssignal der Synaptische-Modell-Einheit rückgekoppelt ist zu der Verstärkereinheit oder/und der Synaptische-Modell-Einheit,
• eine Einstelleinheit zum Einstellen zumindest eines Teils der Parameter der Verstärkereinheit oder/und der Synaptische-Modell-Einheit abhängig von dem Ausgangssignal der Synaptische-Modell-Einheit.

Description

  • Die Erfindung betrifft eine Schaltkreis-Anordnung sowie eine Signalverarbeitungs-Vorrichtung.
  • Die Erkennungsrate eines Spracherkennungssystems im Rahmen einer automatischen Spracherkennung verschlechtert sich rapide mit ansteigendem Hintergrundrauschen.
  • In [1] sind eine Schaltkreis-Anordnung sowie eine Signalverarbeitungs-Vorrichtung beschrieben, bei der eine Filterbank mit einer Mehrzahl von Filterstufen vorgesehen ist, wobei jeder Filterstufe -ein Resonator-Schaltkreis zugeordnet ist und jeder Resonator-Schaltkreis eine Kapazität und eine Induktivität aufweist. Ferner ist mindestens ein Resonator-Steuer-Schaltkreis zum Steuern oder Regeln der Güte mindestens eines Resonator-Schaltkreises vorgesehen, wobei der mindestens eine Resonator-Steuer-Schaltkreis derart eingerichtet ist, dass er die Güte des Resonator-Schaltkreises abhängig von dem Zeitverlauf der Signalamplitude des Eingabesignals und/oder des Teil-Ausgabesignals des Resonator-Schaltkreises steuert oder regelt. Die dort beschriebene Kombination der Frequenzanalyse mit nichtlinearer Dynamikkompression ermöglicht eine automatische Spracherkennung, welche hinsichtlich Hintergrundrauschens relativ robust ist.
  • Weiterhin ist es im Rahmen einer automatischen Spracherkennung üblich, auf ein dediziertes Eingangs-Sprachsignal eine Fast Fourier Transformation (FFT) zur spektralen Analyse des Eingangs-Sprachsignals anzuwenden. Im Rahmen der automatischen Spracherkennung verwendete Merkmale werden aus dem mittels der Fast Fourier Transformation gebildeten Leistungsspektrum abgebildet (vergleiche [2]).
  • Bei einer solchen Fast Fourier Transformation wird üblicherweise ein Zeitfenster einer vorgegebenen Länge verwendet, wobei jeweils ein Teil-Signal, welches durch das jeweilige Zeitfenster repräsentiert wird, einer Fast Fourier Transformation unterzogen wird. Dies führt zu einer beschränkten Frequenzauflösung und Zeitauflösung.
  • Wird, wie in der Spracherkennung üblich, nur das Leistungsspektrum und damit das Betragsspektrum des jeweiligen Teil-Signals verwendet, so ist die Zeitauflösung durch die Länge des verwendeten Zeitfensters limitiert. Diese Limitation der Zeitauflösung ist ein Faktor der zu einer Begrenzung der Leistungsfähigkeit bisher bekannter Spracherkennungssysteme führt. Problematisch bei Schallverarbeitungssystemen und der Verwendung eines solchen Zeitfensters fest vorgegebener Größe ist, dass bei einer Veränderung des Leistungsspektrums nach einer Rücktransformation in eine Zeitdarstellung ein Fehler gebildet wird, der auf der Endlichkeit des Zeitfensters beruht.
  • Gemäß alternativen Ansätzen zur automatischen Spracherkennung werden, wie in [3], [4] und [5] beschrieben, Filterbanken verwendet. Diese Filterbanken sollen Eigenschaften des Innenohres eines Menschen nachbilden.
  • Ferner ist in [6] ein Modell von inneren Haarzellen (IHZ) und dem auditorischen Nerven beschrieben, wobei die Basilarmembran nachgebildet wird unter Verwendung von unterschiedlichen Filtern und einer Kompressionseinheit sowie einer Verstärkungseinheit. Weiterhin ist in [6] ein Modell eines Vesikel-Pools beschrieben.
  • Ferner ist in [7] ein Modell der Signalverarbeitung im menschlichen Gehör beschrieben, wobei gemäß diesem Modell ein akustisches Schallsignal als Eingangssignal verwendet wird. Das Eingangssignal wird analog zur Frequenz-Ort-Transformation im Innenohr in mehrere Frequenzkanäle verlegt, wobei für jeden Kanal eine Halbwellen-Gleichrichtung sowie eine Tiefpassfilterung und eine Adaption zur Verstärkung plötzlicher Änderungen im Eingangssignal und zur Dämpfung zeitlich im Wesentlichen konstanter Komponenten des Eingangssignals vorgesehen sind.
  • In [8] ist das als „Recruitment" bezeichnete Phänomen beschrieben sowie die so genannte Dynamikkompression zum Ausgleich des Recruitment-Phänomens. Gemäß der Dynamikkompression wird ein großer Schallpegel-Wertebereich, der in der akustischen Umwelt auftritt, auf einen für den Menschen wahrnehmbaren Bereich „zusammengedrückt".
  • In [9] ist eine digitale Simulation eines eindimensionalen Langwellenmodells der Basilarmembran eines Menschen beschrieben unter Verwendung einer Wellendigitalfilter-Struktur.
  • [10] beschreibt eine Wachstumsfunktion, in der die Schwingung der Basilarmembran bezogen auf den Schalldruck, gemessen vor dem Trommelfell eines Versuchstieres, dargestellt ist.
  • Ferner ist in [11] der biologische Aufbau der inneren Haarzellen beschrieben.
  • [12] beschreibt ein Verfahren zur automatischen Verstärkungsregelung in einem Hörgerät mit wenigstens einem Eingangssignal-Wandler, einem Signalprozessor einschließlich wenigstens eines Verarbeitungskanals und einem Ausgangssignal-Wandler, wobei das Verfahren die Schritte zum Erfassen eines Eingangssignals vom Eingangssignal-Wandler und/oder eines Ausgangssignals vom Signalprozessor und zum Anpassen, innerhalb eines Betriebsbereichs der automatischen Verstärkungsregelung, des durch den Ausgangssignal-Wandler zugeführten Ausgangsklangpegels in Reaktion auf den erfassten Klangpegel durch Regeln der Verstärkung des Signalprozessors in Richtung zu einem tatsächlichen erwünschten Wert des Ausgangsklangpegels aufweist, wobei die Verstärkungsregelung bei einem Größerwerden bzw. einem Kleinerwerden des Eingangsklangpegels durch Einstellen der Verstärkung in Richtung zum tatsächlichen erwünschten Wert mit einer Ansprechzeit bzw. einer Ausklingzeit bewirkt wird, wobei die Ausklingzeit in Reaktion auf Änderungen beim empfangenen Klangpegel variabel ist.
  • [13] beschreibt ein Verfahren zum Betrieb eines digitalen programmierbaren Hörgerätes mit wenigstens einem Eingangswandler zur Aufnahme eines Eingangssignals und Wandlung in ein Audiosignal, einer Signalverarbeitungseinheit zur Verarbeitung und frequenzabhängigen Verstärkung des Audiosignals und einem Ausgangswandler, dadurch gekennzeichnet, dass eine Übertragungskennlinie einer maximalen Verstärkung des Audiosignals über der Frequenz einstellbar ist und wenigstens in einem Frequenzbereich aus einem durch den Hörgeräteträger einstellbaren Parameter und/oder einem von der Signalverarbeitungseinheit automatisch generierten Parameter wenigstens ein Verstärkungsänderungswert ermittelt wird, wobei bei der jeweiligen Frequenz zu einem Verstärkungsausgangswert unter Berücksichtigung des Verstärkungsänderungswertes ein Verstärkungsendwert ermittelt wird und dieser auf die maximale Verstärkung begrenzt wird, so dass eine wirksame Systemverstärkung für die jeweilige Frequenz resultiert.
  • [14] beschreibt eine Schaltkreis-Anordnung, die eine Mehrzahl von Filterstufen einer Filterbank sowie eine Mehrzahl von Resonator-Schaltkreisen aufweist. Ferner enthält die Schaltkreis-Anordnung einen Resonator-Steuer-Schaltkreis zum Steuern oder Regeln der Güte der Resonator-Schaltkreise, wobei der Resonator-Steuer-Schaltkreis derart eingerichtet ist, dass er die Güte mindestens eines Resonator-Schaltkreises abhängig von der Amplitude des Eingabesignals und/oder des Ausgabesignals des Resonator-Schaltkreises steuert oder regelt.
  • [15] beschreibt ein System zur automatischen Spracherkennung basierend auf Merkmalsinformationen, die an einem akustischen Eingang ankommen. Das System ist mit einer Eingangseinrichtung versehen, die zum Empfangen eines analogen akustischen Spracheingangs angepasst ist und zum Bereitstellen von analogen elektrischen Ausgangssignalen, die repräsentativ für den Spracheingang sind, geeignet ist. Eine Analog-zu-Digital-Umwandlungseinrichtung wird bereitgestellt, die zur Umwandlung der analogen elektrischen Ausgangssignale in äquivalente digitale elektrische Ausgangssignale angepasst ist. Ferner wird eine Herleitungseinrichtung bereitgestellt, die zur Herleitung und zum Bereitstellen der Merkmalsinformationen aus den digitalen elektrischen Ausgangssignalen angepasst ist. Die Eingangseinrichtung ist mit einer Mehrzahl von Vibrationsempfangselementen versehen, wobei jedes dieser Elemente eingerichtet ist, auf bestimmte Vibrations- bzw. akustische Eigenschaften zu reagieren.
  • [16] beschreibt ein neuronales Modell zur Verarbeitung von Schallsignalen. Das Periodizitäts-Analyse-Netzwerk (PAN) ist ein bioinspiriertes neuronales Netzwerk spikender Neurone. Das PAN besteht aus komplexen neuronalen Modellen, die für die Untersuchung der Dynamik von einzelnen Neuronen und neuronalen Netzen benutzt werden können. Das Netzwerk kann Eigenschaften der Grundfrequenz von harmonischen Schallsignalen verarbeiten. Daher kann das PAN-Modell in klassischen schallverarbeitenden Anwendungen eingesetzt werden, wie z. B. zur Trennung von Schallquellen, zur Periodizitätsanalyse und zur Lösung des Cocktail-Party-Problems.
  • Gemäß einem Ausführungsbeispiel der Erfindung weist eine Filterbank-Anordnung eine Filterbank mit einer Mehrzahl von Filterstufen auf, wobei jede Filterstufe einen Filterbank-Ausgang aufweist sowie mindestens einen Filterbank-Eingang, welchem ein Eingabesignal zuführbar ist. Ferner weist die Filterbank-Anordnung eine Mehrzahl von Verstärker-Pfaden auf, wobei jeder Verstärker-Pfad mit einem zugehörigen Filterbank-Ausgang gekoppelt ist und wobei jeder Verstärker-Pfad aufweist:
    • • eine mit dem jeweiligen Filterbank-Ausgang gekoppelte Verstärkereinheit,
    • • eine der Verstärkereinheit nachgeschaltete Synaptische-Modell-Einheit, welche eingerichtet ist gemäß einem Synaptischen Modell eines Innenohrs eines Säugetieres,
    • • wobei zumindest das Ausgangssignal der Synaptische-Modell-Einheit rückgekoppelt ist zu der Verstärkereinheit oder/und der Synaptische-Modell-Einheit,
    • • eine Einstelleinheit zum Einstellen zumindest eines Teils der Parameter der Verstärkereinheit oder/und der Synaptische-Modell-Einheit abhängig von dem Ausgangssignal der Synaptische-Modell-Einheit.
  • Eine Signalverarbeitungs-Vorrichtung weist eine oben beschriebene Filterbank-Anordnung auf sowie eine Weiterverarbeitungs-Einheit zum Weiterverarbeiten des von der Filterbank-Anordnung bereitgestellten Signals.
  • Durch die Filterbank-Anordnung gemäß dem oben geschriebenen Ausführungsbeispiel der Erfindung wird die Verstärkung oder/und der Synaptische Mechanismus der Synaptische-Modell-Einheit adaptiv ausgestaltet und kann somit an beispielsweise das Ausgangssignal der Synaptische-Modell-Einheit, welche sich zeitlich relativ langsam ändert und üblicherweise ein breitbandiges Signal darstellt, angepasst werden und damit beispielsweise die Verstärkung einer Kompressionsstufe in einer Verstärkereinheit, wenn sie gemäß einem Ausführungsbeispiel der Erfindung vorgesehen ist, anpassen kann, beispielsweise reduzieren kann. Auf diese Weise wird beispielsweise der Dynamikbereich der Filterbank-Anordnung vergrößert.
  • Die Filterbank-Anordnung kann beispielsweise in der neuronalen Verarbeitung von Schaltsignalen verwendet werden, in welchem Anwendungsgebiet eine hohe Kompression der Schaltsignale erforderlich ist.
  • Beispielhafte Ausgestaltungen der Erfindung ergeben sich aus den abhängigen Ansprüchen.
  • Gemäß einer beispielhaften Ausführungsform der Filterbank-Anordnung weist jeder Verstärker, alternativ zumindest ein Teil der Verstärker, einen Resonator-Schaltkreis auf, wobei jeder Resonator-Schaltkreis eine Kapazität und eine Induktivität aufweisen kann.
  • Ferner kann gemäß einem Ausführungsbeispiel der Erfindung mindestens ein Resonator-Steuer-Schaltkreis vorgesehen sein zum Steuern oder Regeln der Güte mindestens eines Resonator-Schaltkreises, wobei der mindestens eine Resonator-Steuer-Schaltkreis derart eingerichtet, dass er die Güte des Resonator-Schaltkreises abhängig von dem Zeitverlauf der Signalamplitude des Eingabesignals und/oder eines Teil-Ausgabesignals des Resonator-Schaltkreises steuert oder regelt.
  • Die Kombination einer Filterbank, vorzugsweise einer linearen Filterbank mit den Resonator-Schaltkreisen, welche anschaulich nichtlineare Kompressionsstufen bilden, bildet beispielsweise das nichtlineare Schwingungsverhalten des Innenohres von Säugetieren sehr gut nach. Anschaulich werden als Ausgabesignal jedes Resonator-Schaltkreises Merkmale im Rahmen einer Merkmalsextraktion eines eingegebenen Sprachsignals bereitgestellt, welche robuster sind gegen Störgeräusche und beispielsweise im Rahmen eines Spracherkennungssystems oder eines Hörgeräts zu einer verbesserten Wortfehlerrate eines mittels eines bereitgestellten Merkmalsextraktions-Systems, welches beispielsweise gebildet wird von der Filterbank-Anordnung, führt. Beispielsweise nimmt bei zunehmenden Störgeräuschen die Wortfehlerrate langsamer zu als im Rahmen der klassischen Signal-Vorverarbeitung unter Verwendung einer Fast Fourier Transformation, angewendet auf Zeitfenster-aufgeteilten Leistungsspektren.
  • Ein weiterer Vorteil ist in der weitgehenden Erhaltung der feinen Zeitstruktur des eingesprochenen Sprachsignals, allgemein des der Filterbank-Anordnung zugeführten analogen Eingabesignals, zu sehen, während bei dem Leistungsspektrum unter Verwendung einer Fast Fourier Transformation nur eine Zeitauflösung der Merkmale im Bereich der Fensterlänge des jeweils verwendeten Fensters erreicht wird.
  • Damit werden anschaulich im Rahmen der Merkmalsextraktion von Merkmalen in einem akustischen Signal der biologische Aufbau, beispielsweise die essentiellen Eigenschaften des menschlichen Hörsystems, verbessert nachgebildet. Dies führt beispielsweise zu einem robusteren Spracherkennungssystem. Somit kann gemäß einem Ausführungsbeispiel der Erfindung ein Aspekt anschaulich in der Extraktion von Merkmalen für beispielsweise eine automatische Spracherkennung, d. h. für ein automatisches Spracherkennungssystem, gesehen werden. Beispielsweise werden Merkmale aus einem der Filterbank-Anordnung zugeführten Eingabesignal bereitgestellt, welche eine höhere Robustheit gegen Störgeräusche ermöglichen als dies bisher möglich war.
  • Alternativ kann ein Ausführungsbeispiel der Erfindung für eine Hörhilfe, beispielsweise für ein Cochlea-Implantat, beispielsweise bei Patienten mit Innenohr-bedingter Schwerhörigkeit, sehr vorteilhaft eingesetzt werden.
  • Die Güte des jeweiligen Resonator-Schaltkreises kann basierend auf der Amplitude des Eingabe- oder Teil-Ausgabesignals eingestellt werden. Weist eines dieser Signale eine sehr hohe Amplitude auf, so kann mittels des Resonator-Steuer-Schaltkreises die Güte des mindestens einen Resonator-Schaltkreises derart stark verringert werden, dass das Signal stark gedämpft wird. Dagegen kann bei einem Signal einer geringen Signalamplitude die Güte des mindestens einen Resonator-Schaltkreises derart erhöht werden, dass die Amplitude des Signals an dem Ausgang des jeweiligen Resonator-Schaltkreises verstärkt wird.
  • Anschaulich wird gemäß einem Ausführungsbeispiel der Erfindung zum Durchführen einer Dynamikkompression die Tatsache verwendet, dass ein Resonator-Schaltkreis nahe seiner Resonanzfrequenz als stabiler Verstärker wirkt (Resonanzüberhöhung).
  • Unter der Güte des beispielhaft verwendeten Resonator-Schaltkreises wird das Verhältnis der Amplitude des Ausgabesignals bei der Resonanzfrequenz des Resonator-Schaltkreises zu der entsprechenden Amplitude des Eingangssignals verstanden. Die Güte eines Resonator-Schaltkreises hängt von dessen ohmschen Widerstand ab, so dass die Güte beispielsweise mittels Steuerns oder Regelns des ohmschen Widerstands des Resonator-Schaltkreises einstellbar ist. In einem Szenario, in dem die Güte des Resonator-Schaltkreises basierend auf der Amplitude des in dem Resonator-Schaltkreis eingeführten Eingabesignals eingestellt wird, kann die Funktionalität des Steuer-Schaltkreises als ein "Steuern" bezeichnet werden. Wird dagegen die Güte des Resonator-Schaltkreises basierend auf der Amplitude des Ausgabesignals eingestellt, so erfüllt der Resonator-Steuer-Schaltkreis eine "Regelungs"-Funktionalität, da er ein rückgekoppeltes Anpassen der Güte durchführt.
  • Mit der Filterbank-Anordnung ist eine sichere und effektive Dynamikkompression gemäß einem Ausführungsbeispiel der Erfindung eines Eingabesignals im Zeitbereich ermöglicht, ohne dass die Nachteile einer Fourier-Transformation auftreten. Beispielsweise entfallen die bei einer Fourier-Transformation auftretenden Probleme mit einem endlichen Zeitfenster. Darüber hinaus wird beispielsweise ein Dynamikkomprimiertes Ausgangssignal erzeugt, dass beispielsweise im Vergleich zu der Rücktransformation des logarithmierten Fourierspektrums eine deutlich geringere störende Signalverzerrung aufweist.
  • Eine ausreichend starke und intensitätselektive (beispielsweise nichtlinearer) Dämpfung eines Eingabesignals kann mittels selektiven Verringerns der Güte des Resonator-Schaltkreises ermöglicht werden.
  • Anschaulich weist die Filterbank-Anordnung gemäß einem Ausführungsbeispiel einen Filter-Schaltkreis auf, wobei basierend auf dem Wert der Induktivität L und der Kapazität C des Resonator-Schaltkreises der Frequenzbereich festgelegt ist, für welchen der Resonator-Schaltkreis durchlässig ist. Somit ist mittels Einstellens der Werte L, C eine einfache Möglichkeit geschaffen, den Frequenz-Schwerpunkt des transmittierbaren Intervalls des Resonator-Schaltkreises einzustellen. Die Breite der Resonanzkurve des Resonator-Schaltkreises ist insbesondere mittels Einstellens seiner Güte justierbar. Der Resonator-Schaltkreis kann als Filter mit nichtlinearer Dämpfung angesehen werden, mit dem eine im Prinzip beliebig hohe Dynamikkompression erreicht werden kann. Aufgrund einer ausreichend schmalbandigen Verarbeitung können auch Verzerrungen, die durch eine zu starke Nichtlinearität entstehen können, ausreichend gering gehalten werden.
  • Die Filterbank-Anordnung kann einen Resonator-Schaltkreis zweiter Ordnung enthalten, wobei die Dämpfung nichtlinear mit steigendem Schallpegel ansteigt. Bei einer passiven Realisierung der Schaltkreis-Anordnung, das heißt bei einer Verwendung passiver Bauelemente (Spule L, Kondensator C, ohmscher Widerstand R) kann eine stabile Schaltung erhalten werden (im Gegensatz zu Systemen, die einen aktiven, rückgekoppelten Verstärker benötigen).
  • Die Resonator-Schaltkreise können einen mittels des Resonator-Steuer-Schaltkreises steuerbaren (bzw. regelbaren) ohmschen Widerstand aufweisen. Ein solcher steuerbarer oder regelbarer ohmscher Widerstand ist eine einfache Schaltkreis-Komponente, mittels welcher die Funktionalität des Regelns der Güte des Resonator-Schaltkreises mit geringem Aufwand und genau und stabil erfüllt werden kann.
  • Es ist anzumerken, dass der Resonator-Steuer-Schaltkreis gebildet werden kann aus einer Mehrzahl von Teil-Resonator-Steuer-Schaltkreisen, wobei jeweils ein Teil-Resonator-Steuer-Schaltkreis jeweils die Güte eines ihm zugeordneten Resonator-Schaltkreises steuert oder regelt.
  • Das Eingabesignal kann zwischen einem ersten Anschluss des ohmschen Widerstands und einem ersten Anschluss der Kapazität bereitgestellt sein. Das Ausgabesignal kann zwischen dem ersten Anschluss der Kapazität und einem zweiten Anschluss der Kapazität bereitgestellt sein. Ein zweiter Anschluss des ohmschen Widerstands kann mit einem ersten Anschluss der Induktivität und ein zweiter Anschluss der Induktivität kann mit einem zweiten Anschluss der Kapazität gekoppelt sein.
  • Der Resonator-Steuer-Schaltkreis kann derart eingerichtet sein, dass er die Güte des mindestens einen Resonator-Schaltkreises basierend auf einer Boltzmann-Funktion steuert, in welcher die Amplitude des Ausgabesignals als Parameter enthalten ist. Eine Boltzmann-Funktion ist bei geeigneter Wahl der darin enthaltenen Parameter gut geeignet, die Empfindlichkeitskurve der äußeren Haarsinneszellen im menschlichen Innenohr anzunähern. Eine besonders gute Beschreibung dieser biologischen Abhängigkeit kann durch eine Boltzmann-Funktion zweiter Ordnung beschrieben werden. Dadurch ist es möglich, die Empfindlichkeitskurve im menschlichen Ohr anzunähern, was für Anwendungen der Schaltkreis-Anordnung im medizinischen Bereich (beispielsweise für ein Hörgerät) vorteilhaft ist.
  • Der Resonator-Steuer-Schaltkreis kann derart eingerichtet sein, dass er die Güte des mindestens einen Resonator-Schaltkreises in Abhängigkeit von der Amplitude des Ausgabesignals basierend auf einer für ein Ohr eines Menschen ermittelten Empfindlichkeitscharakteristik einstellt. Um die Empfindlichkeitscharakteristik im Innenohr eines Menschen besonders gut mittels einer Schaltkreis-Anordnung nachzubilden, kann eine beispielsweise experimentell oder theoretisch ermittelte Empfindlichkeitscharakteristik des menschlichen Ohrs in der Form einer Datei oder Tabelle für den Steuer-Schaltkreis zugänglich abgelegt sein. In diesem Fall kann der Resonator-Steuer-Schaltkreis die Güte des mindestens einen Resonator-Schaltkreises derart steuern oder regeln, dass die darin abgelegte biologische Empfindlichkeitscharakteristik angenähert wird.
  • Der Resonator-Steuer-Schaltkreis kann derart eingerichtet sein, dass er die Güte des mindestens einen Resonator-Schaltkreises umso geringer einstellt, je höher die Amplitude des jeweiligen Teil-Ausgabesignals des jeweiligen Resonator-Schaltkreises ist.
  • Der Resonator-Steuer-Schaltkreis kann ferner derart eingerichtet sein, dass er die Güte des mindestens einen Resonator-Schaltkreises in einer nichtlinearen Abhängigkeit von der Amplitude des jeweiligen Teil-Ausgabesignals einstellt. D. h., dass Signalbereiche großer Amplitude überproportional stark gegenüber Signalbereichen kleiner Amplitude gedämpft werden. Somit kann auch bei einem extrem hohen Bereich von Schallpegeln in einem Eingabesignal eine Komprimierung auf einen ausreichend schmalen Bereich bei dem Ausgabesignal erreicht werden.
  • Der Resonator-Steuer-Schaltkreis kann derart eingerichtet sein, dass er die Güte des mindestens einen Resonator-Schaltkreises derart einstellt, dass die Amplitude des jeweiligen Teil-Ausgabesignals innerhalb eines vorbestimmten Intervalls ist. Für bestimmte Anwendungen kann es vorteilhaft sein, die Amplitude eines Teil-Ausgabesignals auf jeden Fall innerhalb eines vorbestimmten Intervalls zu halten. Dies kann beispielsweise im Rahmen der Datenkomprimierung wichtig sein, wenn ein Signal mit einer hohen Intensitätsschwankung mit möglichst wenig Quantisierungsstufen erfasst werden soll. In diesem Fall kann der Resonator-Steuer-Schaltkreis derart eingerichtet sein, dass er die Güte des Resonator-Schaltkreises derart steuert oder regelt, dass das jeweilige Teil-Ausgabesignal innerhalb des vorbestimmten Intervalls liegt.
  • Die Schaltkreis-Anordnung kann eine Mehrzahl von in Serie geschalteten Resonator-Schaltkreisen aufweisen, wobei ein Ausgabesignal eines jeweils vorgeschalteten Resonator-Schaltkreises den ihm jeweils nachgeschalteten Resonator-Schaltkreis als Eingabesignal bereitstellbar ist.
  • Gemäß dieser Ausgestaltung ist anschaulich eine Filterbank mit einer Hintereinander-Schaltung aus mehreren Resonator-Schaltkreisen geschaffen, wodurch die Dynamikkompression auf einen noch größeren Dynamikbereich ausgeweitet werden kann. Im Prinzip kann eine ausreichend starke Dynamikkompression (z. B. 60 dB) bereits mit einer Filterstufe (d. h. mit einem Resonator-Schaltkreis) mit einer sehr hohen Güte Q (z. B. Q = 1000, die bei hohen Pegeln auf eine Güte von Q = 1 reduziert wird) erfolgen. Eine solche Schaltkreis-Anordnung ist allerdings sehr schmalbandig (beispielsweise 0.1% der Resonanzfrequenz des Resonator-Schaltkreises). Mittels Kaskadierens mehrerer Filterstufen (z. B. drei hintereinander geschaltete Filterstufen) mit einer relativ geringen Güte Q (z. B. Q = 10, so dass Q3 = 1000) lässt sich ebenfalls eine ausreichend starke Dynamikkompression (z. B. von 60 dB) realisieren. Die nicht zu hohe Einzel-Güte von jedem dieser Filter bringt den vorteilhaften Effekt mit sich, dass aufgrund der aus der geringeren Güte resultierenden erhöhten Bandbreite der einzelnen Filter ein größerer Frequenzbereich der Filter abgedeckt wird und gleichzeitig das Impulsverhalten der Filter verbessert wird, d. h. die Ein- und Ausschwingzeit des Systems ist wesentlich geringer.
  • Die hintereinander geschalteten Resonator-Schaltkreise können anschaulich miteinander direkt gekoppelt sein derart, dass die Ausgabespannung eines vorgeschalteten Resonator-Schaltkreises gleich der Eingabespannung des ihm nachgeschalteten Resonator-Schaltkreises ist und dass der (im Betrieb in der Regel von Null verschiedene) Ausgabestrom eines vorgeschalteten Resonator-Schaltkreises gleich dem Eingabestrom des ihm nachgeschalteten Resonator-Schaltkreises ist. Hierfür ist die Schaltkreis-Anordnung in der Regel von einem Zwischenelement zwischen vor- und nachgeschaltetem Resonator-Schaltkreisen frei. Dies ist mittels einer Schaltkreis-Anordnung realisierbar, bei welcher der zweite Anschluss der Spule eines vorgeschalteten Resonator-Schaltkreises mit dem ersten Anschluss des ohmschen Widerstands des dem vorgeschalteten Resonator-Schaltkreis nachgeschalteten Resonator-Schaltkreises gekoppelt ist.
  • Alternativ können die hintereinander geschalteten Resonator-Schaltkreise anschaulich von einer unmittelbaren Kopplung frei sein, d. h. voneinander in gewisser Weise entkoppelt sein, insbesondere unter Zwischenschalten eines Zwischenelements zwischen Ausgabe eines vorgeschalteten und Eingabe eines nachgeschalteten Resonator-Schaltkreises. Dies ist vorzugsweise derart realisiert, dass die Ausgabespannung eines vorgeschalteten Resonator-Schaltkreises gleich der Eingabespannung des ihm nachgeschalteten Resonator-Schaltkreises ist und dass der Ausgabestrom eines vorgeschalteten Resonator-Schaltkreises gleich Null ist. Der Eingabestrom des nachgeschalteten Resonator-Schaltkreises ergibt sich im Wesentlichen nur aus der Impedanz dieses Resonator-Schaltkreises. Bei einer derartigen Schaltkreis-Anordnung ist als Zwischenelement vorzugsweise ein Operationsverstärker (als Impedanzwandler) zwischen einem vorgeschalteten Resonator-Schaltkreis und dem ihm nachgeschalteten Resonator-Schaltkreis vorgesehen. Ein erster Eingang des Operationsverstärkers ist mit dem zweiten Anschluss der Spule des vorgeschalteten Resonator-Schaltkreises gekoppelt. Einzweiter Eingang des Operationsverstärkers ist mit einem Ausgang des Operationsverstärkers rückgekoppelt und ist mit dem ersten Anschluss des ohmschen Widerstands des dem vorgeschalteten Resonator-Schaltkreis nachgeschalteten Resonator-Schaltkreises gekoppelt.
  • Zur Reduktion der Rechenleistung kann die Güte aller in Serie geschalteter Resonator-Schaltkreise identisch eingestellt sein. In diesem Fall ist die von dem Resonator-Steuer-Schaltkreis beanspruchte Rechenleistung besonders gering gehalten, da für alle Resonator-Schaltkreise eine gemeinsame Güte ermittelt und eingestellt wird, d. h. alle Filterparameter identisch sind. Wird eine Schaltkreis-Anordnung mit einer besonders hohen Qualitätsanforderung benötigt, so kann alternativ die Güte von unterschiedlichen in Serie geschalteten Resonator-Schaltkreisen zum Zwecke einer Optimierung unterschiedlich eingestellt werden. Bei einer solchen Schaltkreis-Anordnung ist somit die Güte von jedem der in Serie geschalteten Resonator-Schaltkreise individuell eingestellt.
  • Die Schaltkreis-Anordnung weist vorzugsweise eine Mehrzahl von parallel geschalteten Zweigen auf, wobei jeder Zweig einen Resonator-Schaltkreis oder mehrere in Serie geschaltete Resonator-Schaltkreise aufweist. In diesem Fall ist die Güte eines jeweiligen Resonator-Schaltkreises mittels des jeweiligen Resonator-Steuer-Schaltkreises steuerbar bzw. regelbar.
  • Gemäß dieser Weiterbildung der Erfindung sind anschaulich mehrere parallel geschaltete Zweige von Resonator-Schaltkreisen vorgesehen, wobei in jedem Zweig eine Mehrzahl von Resonator-Schaltkreisen hintereinandergeschaltet sein kann.
  • Beispielsweise ist der mindestens eine Resonator-Schaltkreis eines jeweiligen Zweigs derart eingerichtet, dass er für einen jeweiligen Frequenzbereich des Eingabesignals durchlässig ist derart, dass die Zweige gemeinsam für ein zusammenhängendes Frequenzintervall durchlässig sind. Der Frequenzbereich, für den das menschliche Gehör sensitiv ist, liegt ungefähr zwischen 20 Hz und 20 kHz. Um diesen Hörfrequenzbereich abzudecken, sind in der parallelen Anordnung von Resonator-Schaltkreisen in unterschiedlichen Kanälen die Frequenzbereiche transmittierbarer Signale in der Regel unterschiedlich. Der Frequenzbereich transmittierbarer Signale in einem Resonator-Schaltkreis ist eine Verteilungskurve um die Resonanzfrequenz herum mit einer gewissen Halbwertsbreite. Die Resonanzfrequenz ist anschaulich mittels Einstellens der Werte L, C des Resonator-Schaltkreises möglich, die Halbwertsbreite ist mittels Einstellens der jeweiligen Güte justierbar. Setzt man die unterschiedlichen Frequenz-Durchlassbereiche der unterschiedlichen Zweige von Resonator-Schaltkreisen zusammen, so ergibt sich ein vorzugsweise zusammenhängendes Frequenzintervall, mittels welchem der Sensitivitätsbereich des menschlichen Gehörs oder ein sonstiger Frequenzbereich von Interesse erfassbar ist.
  • Beispielsweise sind die Frequenzbereiche, für die unterschiedliche Zweige durchlässig sind, zumindest teilweise einander überlappend. In diesem Fall ist sichergestellt, dass alle Frequenzen erfasst werden, und es ist ein Zusammensetzen der Signalkomponenten einzelner Zweige möglich.
  • Beispielsweise ist der Frequenzbereich, für den ein jeweiliger Zweig durchlässig ist, mittels Einstellens des Werts der Kapazität und/oder der Induktivität des mindestens einen Resonator-Schaltkreises des Zweigs vorgebbar. Dies beruht darauf, dass die Resonanzfrequenz eines Resonator-Schaltkreises von den Werten der Induktivität und der Kapazität abhängt.
  • Beispielsweise ist die Schaltkreis-Anordnung der Erfindung zum Verarbeiten eines akustischen Signals als Eingabesignal eingerichtet. In diesem Fall eignet sich die Schaltkreis-Anordnung der Erfindung für einen Einsatz in einem Sprachverarbeitungs-System. Ein solches kann beispielsweise auf pulsenden neuronalen Netzwerken beruhen, welche auf eine Reduktion des Dynamikbereichs angewiesen sind. Weitere Anwendungsgebiete sind Systeme zur Schallverarbeitung und (Audio-)Datenkomprimierung, wenn Signale mit hohen Amplituden mit möglichst wenig Quantisierungsstufen erfasst werden sollen. Darüber hinaus gibt es Anwendungen im medizinischen Bereich, insbesondere als Hörhilfe bei Patienten mit Lärm-Schwerhrigkeit.
  • Die Filterbank-Anordnung kann in digitaler oder analoger Schaltungstechnik realisiert sein.
  • Zumindest ein Teil der Filterbank-Anordnung, insbesondere die Filter, die Steuer- oder Regelungs-Funktionalität des Resonator-Steuer-Schaltkreises, kann als Computerprogramm realisiert sein. Die Filterbank-Anordnug kann sowohl mittels eines Computerprogramms, d. h. einer Software, als auch mittels einer oder mehrerer spezieller elektrischer Schaltungen, d. h. in Hardware oder in beliebig hybrider Form, d. h. mittels Software-Komponenten und Hardware-Komponenten, realisiert werden.
  • Eine Software-Realisierung insbesondere des Steuer-Schaltkreises kann beispielsweise in "C++" erfolgen. Eine Realisierung kann auf einem beliebigen Prozessor oder DSP (digitaler Signalprozessor) erfolgen, ebenso auf einem FPGA-Baustein. Ein FPGA ("Field Programmable Gate Array") ist ein integrierter programmierbarer Schaltkreis, der in der Regel eine Vielzahl programmierbarer Zellen auf einem Chip aufweist.
  • Gemäß einer anderen Ausgestaltung der Erfindung ist es vorgesehen, dass die, vorzugsweise lineare, Filterbank als lineares Wellendigitalfilter ausgestaltet ist.
  • Ferner kann eine Mehrzahl von Hochpassfiltern vorgesehen sein, wobei jeder Filterstufe mindestens ein Hochpassfilter zugeordnet ist, wobei jeweils ein Hochpassfilter an den Ausgang eines jeweiligen Resonator-Schaltkreises gekoppelt ist. Diese Hochpassfilter bilden die Flüssigkeitsankopplung der Haarbündel der sensorischen Zellen im Innenohr an die Schwingung der Basilarmembran nach.
  • Mit mindestens einem Hochpassfilter pro Filterstufe, gekoppelt an den Ausgang des jeweiligen Resonator-Schaltkreises, wird erreicht, dass die ansonsten relativ flache hochfrequente Filterflanke der Filterbank verschärft wird. Beispielsweise ist zumindest ein Teil der Hochpassfilter, vorzugsweise alle Hochpassfilter, als Hochpassfilter erster Ordnung ausgestaltet. Gemäß einer Weiterbildung der Erfindung ist die Eckfrequenz zumindest eines Teils der Hochpassfilter erster Ordnung derart gewählt, dass sie der Frequenz der maximalen Empfindlichkeit einer Basilarmembranschwingung eines Innenohrs eines Säugetiers entspricht.
  • Gemäß einer anderen Ausgestaltung der Erfindung ist eine Mehrzahl von Gleichrichter-Schaltungen, wobei jeweils eine Gleichrichter-Schaltung einer der Filterstufen und einem Hochpassfilter zugeordnet ist und mit einem Ausgang eines jeweiligen Hochpassfilters gekoppelt ist, sowie vorzugsweise eine Mehrzahl von Tiefpassfiltern, wobei jeweils ein Tiefpassfilter einer Gleichrichter-Schaltung zugeordnet und mit einem Ausgang einer jeweiligen Gleichrichter-Schaltung gekoppelt ist. Gemäß diesen Ausgestaltungen wird eine sehr gute Annäherung der Bildung des Rezeptorpotentials UM im menschlichen Hörsystem erreicht.
  • Weiterhin kann eine Mehrzahl von Aktivierungs-Schaltungen vorgesehen sein, wobei jeweils eine Aktivierungs-Schaltung einer der Filterstufen zugeordnet ist, wobei jede Aktivierungs-Schaltung eingerichtet ist zum Verstärken einer zeitlichen Veränderung eines der Aktivierungs-Schaltung zugeführten Signals und zum Dämpfen von zeitlich im Wesentlichen konstanten Komponenten des der Aktivierungs-Schaltung zugeführten Signals.
  • Weiterhin weist jede Aktivierungs-Schaltung beispielsweise eine Vesikel-Pool-Schaltung auf mit einer Vielzahl von Vesikel-Schaltungen.
  • Gemäß einer anderen Ausgestaltung der Erfindung ist ein Summations-Element in einem, jeweils in mehreren oder jeweils in allen der Verstärker-Pfade vorgesehen, welches mittels eines ersten Eingangs mit einem Ausgang der Synaptische-Modell-Einheit und mittels mindestens eines zweiten Eingangs mit mindestens einem Element eines anderen Verstärker-Pfads gekoppelt ist. Weiterhin kann die Einstelleinheit eingerichtet sein zum Einstellen zumindest eines Teils der Parameter der Verstärkereinheit oder/und der Synaptische-Modell-Einheit abhängig von dem Ausgangssignal des Summations-Elements.
  • Weiterhin kann ein mit dem Ausgang des Summations-Elements gekoppeltes Tiefpassfilter vorgesehen sein, wobei die Einstelleinheit eingerichtet ist zum Einstellen zumindest eines Teils der Parameter der Verstärkereinheit oder/und der Synaptische-Modell-Einheit abhängig von dem Ausgangssignal des Tiefpassfilters.
  • Das Tiefpassfilter kann ein Tiefpassfilter zweiter Ordnung sein, wobei das Tiefpassfilter eine Zeitkonstante zwischen 50 ms und 1 s aufweisen kann.
  • Gemäß einer anderen Ausgestaltung der Erfindung kann zumindest in einer Rückkopplung, anders ausgedrückt in zumindest einem Rückkopplungs-Pfad, ein Integrator geschaltet ist.
  • Im Weiteren wird die Signalverarbeitungs-Vorrichtung, die eine Filterbank-Anordnung aufweist, näher beschrieben. Ausgestaltungen der Signalverarbeitungs-Vorrichtung gelten auch für die Filterbank-Anordnung und umgekehrt.
  • Bei der Signalverarbeitungs-Vorrichtung kann die Weiterverarbeitungs-Einheit eine Spracherkennungs-Einrichtung oder ein Hörgerät sein.
  • Bei einer Realisierung der Weiterverarbeitungs-Einheit als Hörgerät kommt beispielsweise eine Anwendung in Frage, bei der eine Dynamikkompression zum Ausgleich von Störungen der Lautstärke-Wahrnehmung von Schwerhörigen durchgeführt wird. Im gestörten Gehör können die äußeren Haarzellen in Mitleidenschaft gezogen sein, wodurch die Erhöhung der Empfindlichkeit bei niedrigen Schallpegeln ausfällt. Das Gehör arbeitet dann anschaulich stets mit der für hohe Schallpegel vorgesehenen Empfindlichkeit. Dieses führt dazu, dass der nutzbare Bereich an Schallpegeln zwischen der Hörschwelle (sehr leise) und der Unannehmlichkeits-Schwelle (sehr laut) kleiner wird (Recruitment). Zum Ausgleich dieses Phänomens kann mittels der erfindungsgemäßen Schaltkreis-Anordnung der Signalverarbeitungs-Vorrichtung eine Dynamikkompression durchgeführt werden, die den großen Schallpegelbereich der akustischen Umwelt auf den wahrzunehmenden Bereich des Patienten anschaulich zusammendrückt.
  • Die Signalverarbeitungs-Vorrichtung kann auch den Eingang für ein Spracherkennungssystem bilden, insbesondere in pulsender neuronaler Netzwerk Architektur.
  • Die Signalverarbeitungs-Vorrichtung kann als analoge- oder digitale Filterbank eingerichtet sein.
  • Gemäß einem Ausführungsbeispiel der Erfindung ist anschaulich jeweils in jedem Verstärker-Pfad eine Rückkopplungs-Schleife vorgesehen, welche genutzt wird zum Anpassen beispielsweise der Dynamikkompression eines Schallsignals.
  • Die Dynamikkompression, wie sie beispielsweise an sich in [1] beschrieben ist, arbeitet gemäß den Ausführungsbeispielen der Erfindung auf einer Zyklus-zu-Zyklus-Basis und auf einer (Frequenz-)Kanal-zu-Kanal-Basis.
  • Es ist beispielsweise eine Rückkopplungs-Schleife vorgesehen, die es ermöglicht, die Kompression adaptiv auf einer längeren Zeitskala anpassbar zu gestalten und weist beispielsweise einen Spektralbereich von ungefähr einer Oktave auf.
  • Als Ergebnis wird der Dynamikbereich, welcher mittels der Filterbank-Anordnung kodiert wird, erheblich erweitert, wie im Folgenden noch mehr erläutert wird.
  • Weiterhin wird durch eine starke Aktivität in einem Frequenzkanal (beispielsweise hervorgerufen durch einen Ton) die Verstärkung in benachbarten Kanälen reduziert, womit die Peaks in der Spektraldarstellung erhöht werden.
  • Gemäß einer Ausführungsform der Erfindung wird die Spracherkennungsrate verbessert, wobei beispielsweise eine hohe temporale Auflösung erreicht wird.
  • Ausführungsbeispiele der Erfindung sind in den Figuren dargestellt und werden im Folgenden näher erläutert.
  • Es zeigen
  • 1 ein Blockdiagramm eines Spracherkennungssystems gemäß einem Ausführungsbeispiel der Erfindung,
  • 2 ein Schaltungsdiagramm einer linearen Filterbank und einer Mehrzahl einzelnen Filterstufen der Filterbank zugeordneter Resonator-Schaltkreise gemäß einem Ausführungsbeispiel der Erfindung,
  • 3 einen Resonator-Schaltkreis gemäß einem Ausführungsbeispiel der Erfindung,
  • 4 einen Resonator-Schaltkreis gemäß einem Ausführungsbeispiel der Erfindung,
  • 5 eine Realisierung des in 4 gezeigten Resonator-Schaltkreises als Wellendigitalfilter,
  • 6a eine Teil-Schaltkreis-Anordnung gemäß einem anderen Ausführungsbeispiel der Erfindung,
  • 6b eine Realisierung der in 6a gezeigten Resonator-Schaltkreise als Wellendigitalfilter,
  • 7a eine Teil-Schaltkreis-Anordnung gemäß einem anderen Ausführungsbeispiel der Erfindung,
  • 7b eine Realisierung der in 7a gezeigten Resonator-Schaltkreise als Wellendigitalfilter,
  • 8 ein Schaltungsdiagramm eines Teil-Schaltkreises, welcher jeweils in Serie geschaltet ist mit einem jeweiligen Resonator-Schaltkreis zum Ausbilden der Schaltkreis-Anordnung gemäß einem Ausführungsbeispiel der Erfindung,
  • 9 eine Darstellung modellierter Nerven-Aktionspotentiale,
  • 10 eine Filterbank-Anordnung gemäß einem Ausführungsbeispiel der Erfindung in größerem Detail, und
  • 11 ein Diagramm, in welchem die Feuerraten für eine Faser mit einer charakteristischen Frequenz von 5 kHz mit und ohne Rückkopplung dargestellt sind.
  • 1 zeigt ein Spracherkennungssystem 100 gemäß einem Ausführungsbeispiel der Erfindung.
  • Im Rahmen des Spracherkennungssystems 100 wird ein Merkmalsextraktions-System 101 verwendet, welche die im Rahmen der eigentlichen automatischen Spracherkennung (in 1 dargestellt durch einen Spracherkennungs-Block 102) verwendeten Merkmale aus einem zugeführten analogen Sprachsignal extrahiert.
  • Das Merkmalsextraktions-System 101 weist insbesondere Komponenten zur Vorfilterung, eine Filterbank und Komponenten zur nichtlinearen Merkmalsextraktion auf.
  • Anschaulich bildet das Merkmalsextraktions-System 101 die Signalverarbeitungs-Strategie und den Signalverarbeitungs-Aufbau des menschlichen Hörsystems nach. Es ist analog zu dem Signalverarbeitungs-System des menschlichen Hörsystems in physikalische Einheiten skaliert.
  • Dem Merkmalsextraktions-System 101 wird ein Eingabesignal 103 (Eingangssignal) in analoger Form als Schalldrucksignal (gemessen In Pascal) zugeführt.
  • Eine erste Komponente 104 des Merkmalsextraktions-Systems 101 bildet ein Modell des Gehörgangs, welches jedoch optional ist und in der bevorzugten Realisierung vernachlässigt wird.
  • Das von dem Modell des Gehörgangs 104 aus dem Eingabesignal 103 gebildete Signal 105 wird einer Mittelohrmodell-Komponente 106 zugeführt.
  • Die Mittelohrmodell-Komponente 106 weist, wie in 2 dargestellt, eine Parallelschaltung einer idealen Federkomponente 201 und einer idealen Dämpfungskomponente 202 (realisiert in Form einer elektrischen Spule, das heißt Induktivität, für die ideale Feder bzw. in Form eines ohmschen Widerstands als Dämpfungskomponente). Die Mittelohrmodell-Komponente 206 ist derart eingerichtet, dass der sprachrelevante Bereich des Spektrums des Eingabesignals betont, das heißt verstärkt wird. In Analogie zu dem menschlichen Hörsystem wird das von der Mittelohrmodell-Komponente 106 bereitgestellte Signal 107 einer Innenohrmodell-Komponente 108 zugeführt.
  • Die von der Innenohrmodell-Komponente 108 gebildeten Signale 109 können optional unmittelbar zur Spracherkennung als extrahierte Spracherkennungs-Merkmale verwendet werden oder einer Sensorzellenmodell-Komponente 110 zugeführt werden, die im Weiteren noch näher beschrieben wird. Die von der Sensorzellenmodell-Komponente 110 erzeugten Signale 111 können ebenfalls direkt als Merkmalskomponenten im Rahmen der automatischen Spracherkennung verwendet werden oder weiterverarbeitet werden und im Rahmen dieser Weiterverarbeitung einer Synaptische-Modell-Komponente 112, welche den synaptischen Mechanismus des Hörsystems des Menschen nachbildet, zugeführt werden. Die von der Synaptische-Modell-Komponente 112 gebildeten Signale 113 werden ebenfalls als Merkmale im Rahmen der automatischen Spracherkennung eingesetzt.
  • Es ist in diesem Zusammenhang anzumerken, dass gemäß alternativen Ausgestaltungen der Erfindung eine, zwei oder alle drei der oben beschriebenen Merkmalssignale 109, 111, 113 im Rahmen der Spracherkennung optional eingesetzt werden können.
  • Im Rahmen des menschlichen Hörsystems wird der am Trommelfell auftreffende Schalldruck (das Trommelfell hat eine Oberfläche Aed = 55 × 10–6 m2) in eine mechanische Auslenkung der Mittelohrknochen (angegeben in m) umgesetzt.
  • Die Mittelohrmodell-Komponente 106 weist, wie oben beschrieben wurde, einen Tiefpassfilter auf, gemäß diesem Ausführungsbeispiel ein Tiefpassfilter erster Ordnung, beispielsweise mit einer Tiefpassfilter-Eckfrequenz von 1 KHz.
  • Die mittels der Induktivität 201 nachgebildete Federkonstante beträgt etwa 1500 N/m und die mittels des ohmschen Widerstandes 202 dargestellte Dämpfungs-Komponente ist zu 0,25 Ns/m dimensioniert.
  • Das von der Mittelohrmodell-Komponente 106 erzeugte Signal 107 wird in die Innenohrmodell-Komponente 108 eingekoppelt, welche in 2 im Detail dargestellt ist. Die Innenohrmodell-Komponente 108 ist als eine Filterbank 203 ausgebildet, gemäß diesem Ausführungsbeispiel in Form eines linearen Wellendigitalfilter-Modells.
  • Die Filterbank 203 weist eine Vielzahl von Filterstufen 204, 205, 206 auf, sowie einen ohmschen Abschlusswiderstand 207.
  • Jede Filterstufe 204, 205, 206 wird gebildet von einer Reihenschaltung einer Induktivität 204a, 205a, 206a, einem ohmschen Widerstand 204b, 205b, 206b und einer Kapazität 204c, 205c, 206c.
  • Die Geschwindigkeit der Basilarmembranschwingung im Innenohr eines Menschen entspricht jeweils der Strom in einer Filterstufe 204, 205, 206. Die Auslenkung der Basilarmembran kann also durch eine Integration der Geschwindigkeit berechnet werden. Um numerische Probleme bei der Integration zu umgehen, wird die Auslenkung jedoch sinnvollerweise auf eine andere Art berechnet:
    Bei einer Feder, die durch die Kapazitäten 204c, 205c, 206c repräsentiert sind, kann die instantane Auslenkung x berechnet werden als das Produkt der Federkraft und der Federkonstante. Diese Auslenkung x bildet den Eingang, d. h. das Eingangssignal für die Dynamikkompressionsstufen 301, gemäß diesem Ausführungsbeispiel der Erfindung jeweils eine Serienschaltung zweier Resonator-Schaltkreise 301, wie sie im Folgenden noch näher erläutert werden.
  • Die Resonator-Schaltkreise 301 bilden anschaulich, wie im Folgenden näher erläutert werden, Kompressionsstufen unter Verwendung von Resonatoren zweiter Ordnung.
  • In einer alternativen bevorzugten Ausführungsform sind vier Resonator-Schaltkreise 301 für jede Filterstufe 204, 205, 206 in einer Serienschaltung vorgesehen.
  • Wie im Folgenden ebenfalls näher erläutert wird, wird die Güte der Resonator-Schaltkreise 301 jeweils in einem Bereich von 1 bis zu einem maximalen Gütewert Qmax (abhängig von der Position im Innenohr des Menschen) instantan als Funktion des Ausgangssignals jeder Filterstufe 204, 205, 206 moduliert.
  • Im Folgenden wird bezugnehmend auf 3 der Aufbau der Resonator-Schaltkreise 301 näher erläutert.
  • Eine Schaltkreis-Anordnung 300 enthält eine Vielzahl von Resonator-Schaltkreisen 301, von denen jeder eine Kapazität und eine Induktivität aufweist (nicht gezeigt in 3), sowie einen Eingang, an dem ein Eingabesignal bereitstellbar ist und einen Ausgang, an dem ein Ausgabesignal bereitstellbar ist. Jeweils drei der Resonator-Schaltkreise 301 sind entlang einer jeweiligen Zeile der matrixförmigen Anordnung hintereinander geschaltet, so dass ein jeweiliger Ausgang eines vorgeschalteten Resonator-Schaltkreises 301 mit einem jeweiligen Eingang eines ihm nachgeschalteten Resonator-Schaltkreises 301 gekoppelt ist. Die Werte der Induktivität und der Kapazität der Resonator-Schaltkreise 301 einer Zeile sind jeweils derart gewählt, dass die jeweilige Zeile ein Signal eines entsprechenden Frequenzintervalls in einem Umgebungsbereich der Resonanzfrequenz der Resonator-Schaltkreise 301 der Zeile transmittieren kann. Die Resonator-Schaltkreise 301 unterschiedlicher Zeilen weisen jeweils unterschiedliche Werte für L, C auf, so dass zusammengenommen die einzelnen Zeilen oder Zweige von Resonator-Schaltkreisen 301 ein zusammenhängendes Frequenz-Intervall abdecken, welches dem Empfindlichkeitsbereich des menschlichen Gehörs entspricht (ungefähr 20 Hz bis 20 kHz).
  • Ein Resonator-Steuer-Schaltkreis 310 steht mit allen Resonator-Schaltkreisen 301 in einer Kommunikationsverbindung, d. h. der Steuer-Schaltkreis 310 ist mit allen Resonator-Schaltkreisen gekoppelt. Die Güte von jedem einzelnen der Resonator-Schaltkreise 301 ist mittels des Steuer-Schaltkreises 310 zum Steuern oder Regeln der Güte der Resonator-Schaltkreise 301 einstellbar, wobei der Steuer-Schaltkreis 310 derart eingerichtet ist, dass er die Güte der Resonator-Schaltkreise 301 abhängig von der Amplitude eines Ausgabesignals des letzten Resonator-Schaltkreises 301 einer jeweiligen Zeile einstellt. Beispielsweise wird die Güte der Resonator-Schaltkreise R11, R12, R13 mittels des Resonator-Steuer-Schaltkreises 310 basierend auf der Amplitude eines Signals am Ausgang des Resonator-Schaltkreises R13 eingestellt.
  • In 3 ist ferner eine Schallquelle 303 gezeigt, welche ein akustisches Signal als globales Eingabesignal 302 emittiert. Dieses wird den Eingängen der Resonator-Schaltkreise 301 (R11, R21, ..., Rk1, ..., Rn1) der ersten Spalte von Resonator-Schaltkreisen 301 bereitgestellt.
  • Im Weiteren wird der in der ersten Zeile und der ersten Spalte von Resonator-Schaltkreisen angeordnete Resonator-Schaltkreis 301 R11 betrachtet. Diesem wird an einem Eingang das globale Eingabesignal 302 der Schallquelle 303 bereitgestellt. Der Resonator-Schaltkreis 301 R11 lässt eine von den ihm zugeordneten Werten L und C abhängige Frequenzkomponente des globalen Eingabesignals 302 hindurch, welche an einem Ausgang des Resonator-Schaltkreises R11 als erstes lokales Ausgabesignal 304 bereitgestellt ist. Ferner wird aufgrund der Funktionalität des Resonator-Schaltkreises 301 R11 abhängig von seiner (gegenwärtigen) Güte Q das globale Eingabesignal 302 in seiner Amplitude verändert. Die Güte Q des Resonator-Schaltkreises 301 R11 wird mittels eines ohmschen Widerstands (nicht gezeigt in 3) des Resonator-Schaltkreises 301 R11 geregelt, wobei der Steuer-Schaltkreis 310 diesem regelbaren ohmschen Widerstand ein entsprechendes Steuersignal bereitstellt, wodurch der Widerstand auf einen vorbestimmten Wert eingestellt wird. Dadurch wird die Güte des Resonator-Schaltkreises 301 eingestellt, so dass in einem nachfolgenden Verarbeitungs-Zyklus gemäß diesem Wert der Güte ein Eingabesignal stärker oder schwächer gedämpft wird. Da die Schaltkreis-Anordnung 300 zur Dynamikkompression des globalen Eingabesignals 302 eingerichtet ist, werden anschaulich Signalbereiche hoher Amplitude stärker geschwächt als Signalbereiche geringer Amplitude.
  • Das erste lokale Ausgabesignal 304 wird dem dem Resonator-Schaltkreis 301 R11 nachgeschalteten Resonator-Schaltkreis 301 R12 als erstes lokales Eingabesignal 305 bereitgestellt. Das erste lokale Eingabesignal 305 durchläuft den Resonator- Schaltkreis 301 R12, wobei an einem Ausgang das zweite lokale Ausgabesignal 306 bereitgestellt wird. Das zweite lokale Ausgabesignal 306 dient als zweites lokales Eingabesignal 307 des dem Resonator-Schaltkreis 301 R12 nachgeschalteten Resonator-Schaltkreises 301 R13. An dessen Ausgang 308 ist ein drittes lokales Ausgabesignal 308 bereitgestellt. Dieses wird gemeinsam mit den jeweils auf ein separates Frequenzintervall bezogenen Ausgabesignalen der jeweils letzten in einer Zeile angeordneten Resonator-Schaltkreisen 301 (R13, R23, ..., Rk3, ..., Rn3) zu einem globalen Ausgabesignal 309 zusammengesetzt (addiert).
  • Bei jedem der Resonator-Schaltkreise 301 einer jeweiligen Zeile von Resonator-Schaltkreisen (Rk1, Rk2, Rk3) wird die Güte aller Resonator-Schaltkreise 301 der Zeile basierend auf der Amplitude des Ausgabesignals an dem Ausgang des jeweils letzten Resonator-Schaltkreises (in der k-ten Zeile Resonator-Schaltkreis Rk3) mittels des Resonator-Steuer-Schaltkreises 310 geregelt.
  • Das zusammengesetzte globale Ausgabesignal 309 ist somit gegenüber dem globalen Eingabesignal 302 einer Dynamikkompression unterzogen.
  • Im Weiteren wird bezugnehmend auf 4 der Resonator-Schaltkreis 301 aus 3 beschrieben.
  • In 4 ist ein Eingabesignal 400 als Spannungsquelle U symbolisiert. Ferner ist ein Ausgabesignal 404 als Spannung UC symbolisiert. Das Eingabesignal 400 ist zwischen einem ersten Anschluss eines ohmschen Widerstands 403 und einem ersten Anschluss einer Kapazität 401 bereitgestellt. Das Ausgabesignal 404 ist zwischen dem ersten Anschluss der Kapazität 401 und einem zweiten Anschluss der Kapazität 401 bereitgestellt. Ferner ist ein zweiter Anschluss des regelbaren ohmschen Widerstands 403 mit einem ersten Anschluss einer Induktivität 402 gekoppelt, und ein zweiter Anschluss der Induktivität 402 ist mit dem zweiten Anschluss der Kapazität 401 gekoppelt.
  • Der Wert des ohmschen Widerstands R 403 ist mittels des Steuer-Schaltkreises 310 einstellbar. Der Resonator-Schaltkreis 301 aus 4 stellt somit anschaulich einen Filter mit regelbarer Dämpfung dar.
  • Bei der Schältkreis-Anordnung 300 sind in jeder Zeile drei (oder allgemein N) Resonator-Schaltkreise 301 als Filterelemente rückkopplungsfrei hintereinander geschaltet. Das zeitabhängige Ausgabesignal UC(t), wobei t die Zeit ist, eines vorgeschalteten Filters definiert jeweils das Eingabesignal U 400 des dem vorgeschalteten Filter nachgeschalteten Filters.
  • Der Widerstand R 403 kann in nichtlinearer Abhängigkeit von der Ausgangsspannung UC(t) verändert werden (Regelung), in Abhängigkeit von UC(t) des jeweils vorangeschalteten Filters (Steuerung), oder auch in für alle Filter gleichzeitig in Abhängigkeit von UC(t) der letzten Filterstufe einer Reihe.
  • Im Weiteren wird beschrieben, auf Basis welcher Rechenvorschrift gemäß dem beschriebenen Ausführungsbeispiel der Wert R eines jeweiligen ohmschen Widerstands R 403 eingestellt wird.
  • Hierfür wird zunächst eine einzustellende Güte Q berechnet.
  • Gemäß dem beschriebenen Ausführungsbeispiel wird die Güte Q des Filters gemäß einer Boltzmann-Funktion gedämpft:
    Figure 00310001
  • In Gleichung (1) ist Q(t) die Abhängigkeit der Güte Q von der Zeit t. Q0 ist eine vorgebbare Maximalgüte des Resonator-Schaltkreises 301 (z. B. Q0 = 10). Qmin ist eine vorgebbare minimale Güte des Resonator-Schaltkreises (z. B. Qmin = 1). SAT ist eine vorgebbare Sättigungsschwelle, das heißt ein Parameter, mit dem anschaulich die Zeitabhängigkeit der Güte eingestellt werden kann (z. B. SAT = 1).
  • Die Boltzmann-Funktion (1) nähert die Empfindlichkeitskurve der äußeren Haarsinneszellen im Innenohr an. Die Funktion kann bei Bedarf durch eine Boltzmann-Funktion zweiter Ordnung ersetzt werden, die unter Einführung eines weiteren Parameters eine noch genauere Anpassung ermöglicht. In Gleichung (1) ist eine einfache Boltzmann-Funktion erster Ordnung verwendet, da sie nur einen freien Parameter (nämlich SAT) aufweist und somit mit geringem numerischen Aufwand verarbeitet werden kann.
  • Aus der Güte Q des Filters berechnet sich der einzustellende Wert des nichtlinearen Widerstands R zu:
    Figure 00320001
  • Somit hängt der zeitabhängige Wert des ohmschen Widerstands R(t) von dem Wert der Induktivität L und der Kapazität C sowie der zeitabhängigen Güte Q(t) ab.
  • Anschaulich bilden Gleichungen (1) und (2) die Regelungsvorschrift für das Einstellen des Werts R des ohmschen Widerstands 403 mittels des Steuer-Schaltkreises 310.
  • Der von dem in 4 gezeigten Resonator-Schaltkreis 301 gebildete Filter ist bei sehr geringen Amplituden UC(t) linear (mit Q → Q0 für UC(t) → 0). Ebenso ist er bei sehr großen Amplituden UC(t) näherungsweise linear (Q → Qmin für UC (t) → ∞). Die Dynamikkompression K erfolgt im Bereich der Sättigungsschwelle (SAT) und beträgt K = Q0/Qmin. Im Falle von N = 4 hintereinander geschalteten Filterstufen (in 3 sind allerdings nur drei Filterstufen mittels dreier Resonator-Schaltkreise in einer Zeile vorgesehen) und den Werten Q0 = 10 und Qmin = 1 ist eine starke Kompression um 80 dB (KN = (Q0/Qmin)N) realisierbar.
  • Um den gesamten Hörbereich des Menschen abzudecken, wird eine Filterbank mit Resonanzfrequenzen im Bereich von ungefähr 20 Hz bis ungefähr 20 kHz realisiert, was durch typischerweise fünfzig bis hundert Zeilen von Resonator-Schaltkreisen 301 (d. h. n = 50 bis n = 100) realisiert wird. Gemäß dem beschriebenen Ausführungsbeispiel wird der Wert der Induktivität auf L = 1 H festgelegt. Der jeweilige Wert C wird dann für jede Zeile von Resonator-Schaltkreisen 301 gemäß der von dieser Zeile abgedeckten Filterfrequenz f0 aus der Resonanzfrequenz des entsprechenden LC-Glieds berechnet: C = (4π2f2L)–1. (3)
  • Es ist anzumerken, dass die nichtlineare Güte Q für jede Filterfrequenz f0, d. h. für jede Zeile von Resonator-Schaltkreisen 301, unabhängig berechnet wird. Bezugnehmend auf 3 bedeutet dies, dass jeder Zeile von Oszillator-Schaltkreisen 301 eine entsprechende Filterfrequenz f0 zugeordnet ist, für welche der Wert der Güte Q(t) berechnet wird.
  • Im Weiteren wird bezugnehmend auf 5 ein Wellendigitalfilter 500 als Realisierung der in 4 gezeigten Resonatorstufe 301 beschrieben.
  • Ein Wellendigitalfilter stellt eine Klasse von Digitalfiltern mit besonders günstigen Eigenschaften dar. Sie sind traditionellen Filtern aus den klassischen Bauelementen der Nachrichtentechnik nachgebildet und werden mit Hilfe moderner integrierter Digitalschaltungen betrieben. Gemäß der Technologie eines Wellendigitalfilters kann anschaulich ein analoges Modell digital realisiert werden (beispielsweise unter Verwendung eines Computers).
  • Im Weiteren werden anschaulich die Komponenten des Wellendigitalfilters 500 aus 5 den Komponenten des Resonator-Schaltkreises 301 aus 4 anschaulich zugeordnet und die entsprechenden Größen definiert.
  • Ein erster Block 501 des Wellendigitalfilters 500 enthält einen reflexionsfreien seriellen Koppler mit den Impedanzen R11 und R13. Anschaulich repräsentiert R11 den regelbaren ohmschen Widerstand R 403, bezogen auf einen Referenzwiderstand. R12 repräsentiert einen korrigierten Widerstand (Impedanz) der Spule L 402 bezogen auf eine Basisfrequenz.
  • Ein zweiter Block 502 enthält einen parallelen Koppler, der die parallele Verschaltung der Kapazität 401 wiedergibt, wobei in dem zweiten Block die Leitwerte G21, G22, G23 dargestellt sind. G21 ist ein Eingangs-Leitwert des zweiten Blocks (G12 = 1/R13) 502, G23 ist ein Ausgangs-Leitwert des zweiten Blocks 502. Mittels des Leitwerts G22 wird der Widerstand der Kapazität C 401 modelliert.
  • Ein dritter Block 503 repräsentiert einen Speicher bzw. ein Filterregister für die Kapazität 401 und ein vierter Block 504 repräsentiert einen Speicher bzw. ein Filterregister für die Spule 402.
  • Im Weiteren werden die in 5 gezeigten Variablen definiert. Es ergeben sich die Parameter für ein Wellendigitalfilter jede Filterfrequenz zu: R11 = R/R_B; (4) R12 = 2π F_B L/(R_B tan[π F_B/f_s]); (5) R13 = R11 + R12; (6) G21 = R13–1; (7) G22 = 2π F_B C R_B/tan(π F_B/f_s); (8) G23 = G21 + G22. (9)
  • Hierbei ist R der ohmsche Widerstand 403 und R_B ein vorgebbarer Bezugswiderstand. F_B ist eine vorgebbare Bezugsfrequenz. Die Werte R_B und F_B dienen zum Skalieren. Da die Realisation gemäß dem beschriebenen Ausführungsbeispiel mit Double Precision Float-Variablen realisiert ist, ist diese Normierung nicht relevant, wohl aber, wenn Integer-Arithmetik verwendet wird. L ist die Induktivität der Spule 402. Der Wert f_s ist eine Sampling-Frequenz des abgetasteten Zeitsignals. Die Größen R11, R12, R13 sind ohmsche Widerstände, wohingegen die Größen G21, G22 und G23 Leitwerte, das heißt inverse ohmsche Widerstände sind.
  • Filter-Koeffizienten g1, g2 ergeben sich zu: g1 = R11/R13; (10) g2 = G21/G23. (11)
  • Die Anfangswerte der Filterregister Z1 (vierter Block 504) und Z2 (dritter Block 503) werden zu Null initialisiert.
  • Die Signale an den einzelnen Ports lassen sich sukzessive berechnen. Für die "Vorwärtswelle" des Signals, das heißt anschaulich die Koeffizienten an den gemäß 3 nach rechts orientierten Pfeile, ergibt sich: b13 = –(U + Z1); (12) b20 = –g2(Z2 – b13); (13) b23 = b20 + Z2. (14)
  • Die Größe U in Gleichung (12) ist das Eingabesignal 400.
  • Für die "Rückwärtswelle", das heißt anschaulich die gemäß 5 nach links orientierten Pfeile, ergeben sich die Koeffizienten: b22 = b20 + b23; (15) b21 = b22 + Z2 – b13; (16) a0 = b21 – b13; (17) b11 = U – g1 a0; (18) b12 = –(b11 + b21). (19)
  • Das Ausgabesignal UC 404 berechnet sich dann zu: UC = (b22 + Z2[sec])/2. (20)
  • Die Filterregister (Blöcke 503, 504) werden wie folgt aktualisiert: Z1 = –b12; (21) Z2 = b22. (22)
  • Das Ausgabesignal UC 404 wird als Eingabesignal U 400 an die der betrachteten Filterstufe 301 nachgeschaltete Filterstufe 301 übergeben. Basierend auf dem Ausgabesignal UC 404 der letzten Filterstufe 301 einer Zeile von Filterstufen 301 wird die einzustellende Güte der hintereinander geschalteten Filter 301 gemäß Gleichung (1) neu ermittelt. Aus dem so ermittelten Wert für die Güte Q wird der Wert des die Dämpfung bestimmenden Widerstands R gemäß Gleichung (2) berechnet. Mit dem veränderten Wert des ohmschen Widerstands R 403 werden die Filterwiderstände (R11, R12, R13, G21, G22, G23) und Filterkoeffizienten (g1, g2) gemäß Gleichungen (4) bis (11) neu berechnet. Nach diesem Schritt wird das Ausgabesignal für eine nächste Zeitscheibe berechnet. Mit anderen Worten kann das Zeitspektrum in mehrere Zeitscheiben zergliedert werden, die sukzessive numerisch berechnet werden.
  • Im Weiteren wird bezugnehmend auf 6A eine Schaltkreis-Anordnung 600 gemäß einem anderen Ausführungsbeispiel der Erfindung beschrieben.
  • Die Schaltkreis-Anordnung 600 ist gebildet aus einem ersten Resonator-Schaltkreis 601 und einem zweiten Resonator-Schaltkreis 602, von denen jeder aufgebaut ist wie der in 4 gezeigte Resonator-Schaltkreis 301. Der zweite Resonator-Schaltkreis 602 ist dem ersten Resonator-Schaltkreis 601 nachgeschaltet.
  • Anschaulich kann die Schaltkreis-Anordnung 600 als direkt gekoppelte Realisierung von zwei (N = 2) hintereinander geschalteten Resonator-Schaltkreisen 601, 602 angesehen werden.
  • Wie in 6A gezeigt ist der zweite Anschluss der Spule 202 des vorgeschalteten Resonator-Schaltkreises 601 mit dem ersten Anschluss des ohmschen Widerstandes 403 des nachgeschalteten zweiten Resonator-Schaltkreises 602 gekoppelt.
  • Gemäß dem in 6A gezeigten Ausführungsbeispiel miteinander unmittelbar verkoppelter Resonator-Schaltkreise 601, 602 ist die Ausgabespannung UC1 des vorgeschalteten Resonator-Schaltkreises 601 gleich der Eingabespannung des folgenden Resonator-Schaltkreises 602. Ferner ist der Ausgabestrom des ersten Resonator-Schaltkreises 601 gleich dem Eingabestrom des zweiten Resonator-Schaltkreises 602.
  • Es ist anzumerken, dass die Werte der Widerstände R1 bzw. R2, der Induktivitäten L1 bzw. L2 sowie der Kapazitäten C1 bzw. C2 der Resonator-Schaltkreise 601, 602 voneinander unterschiedlich sein können bzw. unterschiedlich eingestellt/geregelt werden können.
  • Im Weiteren wird bezugnehmend auf 6B eine Realisierung der in 6A gezeigten Resonator-Schaltkreise 601, 602 als Wellendigitalfilter 650 beschrieben.
  • Anschaulich ist das Wellendigitalfilter 650 gebildet aus einer ersten Komponente 651, welche den ersten Resonator-Schaltkreis 601 repräsentiert, und aus einer zweiten Komponente 652, welche den zweiten Resonator-Schaltkreis 602 repräsentiert. Entsprechend der verkoppelten Konfiguration der Resonator-Schaltkreise 601, 602 gemäß 6A sind die beiden Komponenten 651, 652 in der 6B gezeigten Weise direkt miteinander gekoppelt. Der interne Aufbau jeder der Komponenten 651, 652 entspricht im Wesentlichen jener des Wellendigitalfilters 500 aus 5.
  • Im Weiteren wird bezugnehmend auf 7A eine Schaltkreis-Anordnung 700 gemäß noch einem anderen Ausführungsbeispiel der Erfindung beschrieben.
  • Die Schaltkreis-Anordnung 700 ist gebildet aus einem ersten Resonator-Schaltkreis 701 und einem zweiten Resonator-Schaltkreis 702, welche in Serie geschaltet sind. Anschaulich sind die Resonator-Schaltkreise 701, 702 in einer voneinander entkoppelten Konfiguration hintereinander geschaltet, d. h., dass zwischen die Resonator-Schaltkreise 701 und 702 ein Zwischenelement geschaltet ist.
  • Jeder der Resonator-Schaltkreise 701, 702 ist im Wesentlichen aufgebaut wie der in 4 gezeigte Resonator-Schaltkreis 301. Ferner ist zwischen dem ersten Resonator-Schaltkreis 701 und dem zweiten Resonator-Schaltkreis 702 ein Operationsverstärker 703 vorgesehen, wobei ein nichtinvertierender Eingang 703a des Operationsverstärkers 703 mit dem zweiten Anschluss der Spule 402 des vorgeschalteten ersten Resonator-Schaltkreises 701 gekoppelt ist. Ferner ist ein invertierender Eingang 703b des Operationsverstärkers 703 mit dessen Ausgang 703c rückgekoppelt und mit dem ersten Anschluss des ohmschen Widerstands 403 des, dem ersten Resonator-Schaltkreis 701 nachgeschalteten zweiten Resonator-Schaltkreises 702 gekoppelt.
  • Gemäß dieser Konfiguration ist die Ausgabespannung des vorgeschalteten Resonator-Schaltkreises 701 UC1 404 gleich der Eingabespannung des dem ersten Resonator-Schaltkreis 701. nachgeschalteten zweiten Resonator-Schaltkreises 702. Der Ausgabestrom eines jeweiligen Resonator-Schaltkreises ist Null. Der Eingabestrom des dem vorgeschalteten ersten Resonator-Schaltkreis 701 nachgeschalteten zweiten Resonator-Schaltkreises 702 beruht lediglich auf der Impedanz des nachgeschalteten zweiten Resonator-Schaltkreises 702. Wie in 7A gezeigt, ist in Analogtechnik eine Realisation dieser Umstände mittels eines Impedanzwandlers realisierbar, der die Ausgabespannung des vorgeschalteten Resonator-Schaltkreises 701 dem Eingang des nachgeschalteten Resonator-Schaltkreises 702 einprägt.
  • Im Weiteren wird bezugnehmend auf 7B ein Wellendigitalfilter 750 als Realisierung der Schaltkreis-Anordnung 700 aus 7A beschrieben.
  • Das Wellendigitalfilter 750 ist in eine erste Komponente 751 und in eine zweite Komponente 752 aufgeteilt, wobei die erste Komponente 751 den ersten Resonator-Schaltkreis 701 repräsentiert, und wobei die zweite Komponente 752 den zweiten Resonator-Schaltkreis 702 repräsentiert. Aufgrund der Funktionalität des Operationsverstärkers 703 sind die beiden Komponenten 751, 752 voneinander anschaulich entkoppelt. Der interne Aufbau jeder der Komponenten 751, 752 entspricht im Wesentlichen der in 5 gezeigten Konfiguration. Das Eingabesignal der ersten Komponente 751 ist U, das Eingabesignal der zweiten Komponente 752 ist UC1.
  • Die Kombination der linearen Filterbank 108 mit den nichtlinearen Kompressionsstufen 301 bildet das nichtlineare Schwingungsverhalten des Innenohrs der Säugetiere sehr gut nach.
  • Beispielsweise wird eine große Dynamikkompression von Schallpegeln im Bereich von 0 dBSPL bis 120 dBSPL auf einen Bereich von 1 nm bis 100 nm (dies entspricht ungefähr 40 dB) erreicht, was für die Weiterverarbeitung im Rahmen der Merkmalsextraktion und der Spracherkennung von sehr großer Bedeutung ist.
  • Das von den jeweiligen Resonator-Schaltkreisen 301 am Ende einer jeweiligen Serienschaltung bereitgestellte Basilarmembran-Signal xBM1 wird jeweils einer in 8 dargestellten jeweiligen Filterausgangs-Schaltung 800 zugeführt.
  • Jede Filterausgangs-Schaltung 800 weist einen Hochpassfilter 801, eine dazu ausgangsseitig nachfolgend gekoppelte Gleichrichter-Schaltung 802, einen in Signalflussrichtung nachfolgend gekoppelten Tiefpassfilter 803, eine in Signalflussrichtung nachfolgend gekoppelte Aktivierungs- Schaltung 804 sowie eine Vesikel-Pool-Schaltung 805 und eine Neurotransmitter-Schaltung 806 auf.
  • Das jeweilige Basilarmembran-Signal xBM1, xBMi, xBMn wird mittels des eine Kapazität 807 und einen ohmschen Widerstand 808 aufweisenden Hochpassfilters 801 hochpassgefiltert und skaliert, so dass mittels einer Boltzmann-Funktion zweiter Ordnung nur der sprachrelevante jeweilige Dynamikbereich extrahiert wird. Mittels des Hochpassfilters 801 erster Ordnung wird die noch relativ flache Flanke der Filterkurven des Innenohres etwas verschärft.
  • Gemäß diesem Ausführungsbeispiel der Erfindung entspricht die Eckfrequenz des Hochpassfilters 801 der Frequenz der maximalen Empfindlichkeit der Basilarmembran-Schwingung.
  • Die Asymmetrie der verwendeten Boltzmann-Funktion bewirkt eine Gleichrichtung des Signals (realisiert gemäß diese Ausführungsbeispiel mittels der Gleichrichter-Schaltung 802, das in der nächsten Stufe mittels des Tiefpassfilters 803 tiefpassgefiltert wird, so dass am Ausgang des Tiefpassfilters 803 ein Rezeptorpotential-Signal UM bereitgestellt wird.
  • Gemäß diesem Ausführungsbeispiel der Erfindung weist der ohmsche Widerstand 809 des Tiefpassfilters 803 in Analogie zu der Zellmembran einen Leitwert gM = 60 nS auf und die Kapazität 810 des Tiefpassfilters 803 weist eine die Zellmembran nachbildende Kapazität von CM = 12 pF auf.
  • Die Aktivierung der jeweiligen Zelle, erfindungsgemäß nachgebildet durch die Vesikel-Pool-Schaltung 805 und der Neurotransmitter-Schaltung 806 wird aus dem Rezeptorpotential UM mit einer Boltzmann-Funktion erster Ordnung berechnet.
  • Die Tiefpassfilterung und die Gleichrichtung, wie oben beschrieben, haben mehrere Effekte:
    • a) Bei niedrigen Signalfrequenzen erfolgt pro Zyklus der akustischen Anregung genau eine maximale Erregung der sensorischen Zellen,
    • b) akustische Signale im Frequenzbereich oberhalb der Grenzfrequenz der inneren Haarzellen führen zu einer Aktivierung entsprechend ihrer Hüllkurve, und
    • c) die Sensitivität und Sättigung der Boltzmann-Funktion bewirken eine Fokussierung der Schallverarbeitung auf sprachrelevante Information.
  • Die Weiterverarbeitung des Rezeptorpotential-Signals UM erfolgt derart, anders ausgedrückt, die Vesikel-Pool-Schaltung 805 und die Neurotransmitter-Schaltung 806 sind derart eingerichtet, dass zeitliche Veränderungen des Schallsignals (das heißt des Eingabesignals) betont werden und gleich bleibende, im Wesentliche zeitlich konstante Signalanteile des Eingabesignals werden vernachlässigt (adaptiert).
  • Auf diese Weise werden stationäre Signale (beispielsweise Störgeräusche) wirkungsvoll unterdrückt.
  • Die Adaption wird gemäß diesem Ausführungsbeispiel der Erfindung modelliert mittels der Vesikel-Pool-Schaltung 805, wobei der nachgebildete Vesikel-Pool stetig (aber langsam) auf seinen Sollwert aufgefüllt wird. Von der Vesikel-Pool-Schaltung 805 erfolgt, relativ zur aktuellen Vesikel-Pool-Größe und einer Wahrscheinlichkeit, die mit einer Boltzmann-Funktion vom Membranpotential der inneren Haarzelle abgeleitet wird, ein Neurotransmitter-Strom (gemäß diesem Ausführungsbeispiel der Erfindung mit einer Rate von 28.000/s).
  • Bei Schallsignalen mit großer Amplitude wird ein Großteil des Vesikel-Pools abgebaut, spätere Signalanteile generieren daher nur ein kleines Signal, das heißt ein Signal mit kleiner Amplitude.
  • In Phasen mit anliegendem Eingabesignal geringer Amplitude regeneriert sich der Vesikel-Pool wieder. Anders ausgedrückt bedeutet dies, dass die Vesikel-Pool-Schaltung 805 die oben beschriebene Funktionalität nachbildet, wobei diese derart eingerichtet ist, dass zwei Zeitkonstanten realisiert sind, nämlich eine erste Zeitkonstante von τ1 = 140 ms und einer zweiten Zeitkonstanten τ2 = 3 ms).
  • Der Neurotransmitter-Strom fließt in den „synaptischen Spalt", wo er mit in der von dem Neurotransmitter, erfindungsgemäß nachgebildet mittels der Neurotransmitter-Schaltung 1106, mit einer Zeitkonstanten τ3 = 1 ms abgebaut wird.
  • Neben der Vesikel-Funktion aus dem Vesikel-Pool entsteht ein weiterer Neurotransmitter-Strom, der nur von dem Membranpotential der inneren Haarzelle abhängt, weshalb in dem gewählten Modell von einer unendlichen Vesikel-Pool-Größe ausgegangen wird und von einer Rate von 9.000/s.
  • Die beiden Neurotransmitter-Ströme erlauben eine adäquate Codierung von stationären und transienten Schallsignalen, d. h. eine adäquate Codierung von Nervenaktions-Potentialen.
  • Der Vesikel-Pool 805 kann sowohl kontinuierlich als auch aus diskreten Vesikeln bestehend modelliert werden. Bei einer diskreten Modellierung ergibt sich der Neurotransmitter-Strom als stochastischer Prozess. Dieses Vorgehen wird gewählt, um das Schaltsignal in diskrete Nervenaktions-Potentiale zu codieren.
  • Ein Nervenaktions-Potential ist in 9 in einem Nervenaktions-Potential-Diagramm 900 dargestellt und wird ausgelöst, wenn die Konzentration des jeweiligen Neurotransmitters in dem synaptischen Spalt einen vorgegebenen Schwellwert, gemäß diesem Ausführungsbeispiel 1,0 Vesikel, übersteigt.
  • 9 zeigt die erzeugte modellierten Nervenaktions-Potentiale bei Anregung mit einem künstlichen Vokal „e".
  • Es ergeben sich bei beiden Formantfrequenzen des Vokals „e" Erregungen. Ferner ist auf die zeitliche Struktur (insbesondere beim zweiten Formanten) die mit der Sprach-Grundfrequenz (100 Hz entsprechen 10 ms) moduliert ist, erreicht.
  • Eine sehr vorteilhafte Eigenschaft der erfindungsgemäßen Merkmalsextraktions-Einheit 801 ist, dass sie anhand der erreichbaren Erkennungsleistung im Rahmen eines Spracherkennungsverfahrens eines automatischen Spracherkennungssystems evaluiert und optimiert werden kann.
  • 10 zeigt einen Teil des Spracherkennungssystems 100 gemäß einem Ausführungsbeispiel der Erfindung im größeren Detail.
  • Dem linearen Basilarmembran-Modell 203, wobei in der Innenohrmodell-Komponente für jeden Frequenzkanal jeweils eine Verstärkerkomponente vorgesehen ist, wie in 1 dargestellt, sind eine Sensorzellenmodell-Komponente 110 und eine Synaptische-Modell-Komponente 112 nachgeschaltet.
  • In jedem Verstärker-Pfad, anders ausgedrückt für jeden Frequenzkanal, ist der Synaptische-Modell-Komponente 112 jeweils eine Summations-Einheit, beispielsweise realisiert mittels eines jeweiligen Addierers 1001, nachgeschaltet. Ein jeweiliger erster Eingang des Addierers 1002 ist mit dem jeweiligen Ausgang der Synaptische-Modell-Komponente 112 des jeweiligen Frequenzkanals gekoppelt, weitere Addierer-Eingänge (in 10 jeweils mittels weiterer Pfeile 1003 symbolisiert) sind mit jeweiligen Ausgängen von Synaptische-Modell-Komponenten anderer Frequenzkanäle gekoppelt, wobei die jeweiligen Ausgangssignale der Synaptische-Modell-Komponenten der anderen Frequenzkanäle jeweils gewichtet sind und als gewichtete Signale dem Addierer 1001 zugeführt werden, wie im Folgenden noch näher erläutert wird. Ein Ausgang 1004 des jeweiligen Addierers 1001 ist mit einem, beispielsweise adaptiven, Tiefpassfilter 1005 gekoppelt. Der Ausgang eines jeden Tiefpassfilters 1005 ist rückgekoppelt an einen Eingang des Verstärkers 1006, symbolisiert mittels eines Rückkopplungspfades 1007, wobei aufgrund der Rückkopplung ein Verstärkungsparameter, beispielsweise die jeweilige Güte des Verstärkers 1006 eingestellt werden kann und damit verändert werden kann.
  • Alternativ oder zusätzlich kann die Rückkopplung zu der Sensorzellenmodell-Komponente 110 erfolgen, so dass gemäß unterschiedlichen Ausführungsbeispielen der Erfindung die Güte und/oder andere Parameter des Verstärkers 1006 und/oder geeignete Parameter der Sensorzellenmodell-Komponente 110 abhängig von dem Ausgangssignal des Tiefpassfilters 1005 verändert werden können.
  • Wie oben beschrieben wurde, bewirkt die nichtlineare, zeitvariante Verstärkung der Verstärkereinheit 1006 jeweils eine Kompression des Dynamikbereichs, welches gemäß dem jeweiligen Basilarmembran-Modell 203 encodiert ist.
  • Die Rückkopplungs-Schleife 1007 wird gemäß diesen Ausführungsbeispielen der Erfindung eingeführt, um beispielsweise den Verstärker-Schaltkreis 1006 zu steuern oder zu regeln.
  • Die Rückkopplungs-Schleifen 1007, anders ausgedrückt die Rückkopplungs-Kanäle (ein Kanal beispielsweise für jeden Bereich des Basilarmembran-Modells 203, wobei in 10 der Rückkopplungs-Kanal für den Basilarmembran-Bereich n durch Fettdruck hervorgehoben ist) steuern die Grenzwerte der Basilarmembran-Modell-Verstärkung, beispielsweise den Güte-Wert Qmax. Auf diese Weise steuert die Rückkopplungs-Schleife 1007 die maximale Verstärkung für jeden Bereich, d. h. für jeden Frequenzkanal des Basilarmembran-Modells 203, unabhängig. Gemäß diesem Ausführungsbeispiel der Erfindung ist es vorgesehen, dass der initiale maximale Güte-Wert Qmax, 0 eingestellt wird abhängig von dem Ort entlang der Basilarmembran.
  • Jeder Rückkopplungs-Kanal ergibt sich als eine gewichtete Summe mehrerer Frequenzkanäle, wie mittels der Eingangs-Pfeile 1003 für jeden Addierer 1001 in dem jeweiligen Verstärker-Pfad und damit für jeden Frequenzbereich dargestellt ist.
  • Gemäß einem Ausführungsbeispiel der Erfindung wird eine Gaussianische Gewichtung angesetzt, wobei andere Fenster-Funktionen, beispielsweise ein Hamming-Fenster, ebenfalls möglich sind. Die Breite der Frequenz-Integrationsbereiche beträgt ungefähr eine Oktave und somit hängt die Anzahl von hinzugefügten bzw. addierten Kanälen für einen jeweiligen Addierer 1001 (in 10 mittels des Buchstabens m symbolisiert) von der Wahl der Basilarmembran-Resonator-Frequenzen ab.
  • Jeder Rückkopplungs-Kanal wird anschließend tiefpassgefiltert, wobei darauf hinzuweisen ist, dass die Tiefpassfilterung auch vor dem Addieren verfolgen kann aufgrund der Linearität der beiden Funktionen "Addition" und "Tiefpassfilterung". Das Tiefpassfilter 1005, gemäß diesem Ausführungsbeispiel der Erfindung ein Filter zweiter Ordnung mit einer Zeitkonstante τ ∈ [50 ms, 10 s], beispielsweise τ = ∈ [50 ms, 400 ms], beispielsweise τ = 150 ms.
  • Die Anpassung bzw. Einstellung des jeweiligen Verstärkungsfaktors bzw. des Gütewerts in dem Verstärker 1006 wird durchgeführt unter Verwendung und mittels des Parameters Qmax.
  • In dem Rückkopplungspfad 1007 kann jeweils ein Integrator (nicht gezeigt) vorgesehen sein, welcher beispielsweise dieselbe Zeitkonstante aufweist wie das jeweilige Tiefpassfilter 1005.
  • Im Folgenden wird das Ausgangssignal des jeweiligen. Tiefpassfilters mit af bezeichnet, wobei ohne Einschränkung der Allgemeingültigkeit angenommen wird, dass dieses in dem Wertebereich [0, 1] normalisiert ist.
  • Der Dynamikbereich des Verstärkerblocks D (in dB), d. h. die maximal erreichbare Kompression wird beschrieben gemäß:
    Figure 00470001
    wobei mit m die Anzahl von Verstärkerelementen (gemäß einem Ausführungsbeispiel der Erfindung 4) bezeichnet wird.
  • Ferner wird angenommen, dass der maximale Einfluss im der Rückkopplungsschleife auf die Kompression auf einen Bereich zwischen 0,2 bis 0,5, beispielsweise auf 0,25 eingestellt wird.
  • Somit ergibt sich für den neuen Dynamikbereich der Kompression: Df = (1 – af·im)·D. (24)
  • Schließlich wird der maximale Gütewert Qmax berechnet derart, dass der erforderliche Dynamikbereich angepasst wird gemäß folgender Vorschrift:
    Figure 00480001
  • Die resultierende Wachstumsfunktion (normalisierte Spike-Rate als eine Funktion des Schallpegels für einen reinen Ton) mit und ohne Rückkopplung ist in einem Diagramm 1100 in 11 beschrieben, wobei in einer ersten Kurve 1101 die resultierende Wachstumsfunktion ohne Rückkopplung dargestellt ist und mittels einer zweiten Kurve 1102 die resultierende Wachstumsfunktion mit Rückkopplung.
  • Aus 11 wird somit ersichtlich, dass die Rückkopplungs-Schleife den Dynamikbereich der auditorischen Nervenfasern erweitert. Eine zweite Funktionalität der Rückkopplung ist das Anpassen an das Rauschen. Die Rückkopplung reduziert die Verstärkung von stationären Signalen (oder zeitlich lange andauernden Signalen), welche ein breites Frequenzspektrum aufweisen, was für viele Arten von Rauschen üblicherweise der Fall ist, beispielsweise bei Fahrzeugrauschen.
  • In diesem Dokument sind folgende Veröffentlichungen zitiert:
    • [1] DE 10 2004 013 952 A1 ;
    • [2] E. G. Schukat-Talamazzini, Automatische Spracherkennung, Friedrich Vieweg & Sohn Verlagsgesellschaft, Braunschweig-Wiesbaden, ISBN 3-528-05492-1, Kapitel 1 bis 3, 1995;
    • [3] S. Seneff, A Computational Model for the Perforal Auditory System: Application to Speech Recognition Research, Proceedings of IEEE ICASSP 1986, Tokyo, Seiten 1983 bis 1986, Tokyo, 1986;
    • [4] M. Hunke und T. Holton, Training Machine Classifiers to Match the Performance of Human L-isteners in a Natural Vowel Classification Task, ICSSLP, Seiten 574 bis 577, 1996;
    • [5] S. Sandhu und O. Ghitza, A Comparative Study of MEL Cepstra and EIH for Phone Classification under Adverse Conditions, IEEE, Seiten 409 bis 412, 1995;
    • [6] C. Sumner et al., A Revised Model of the Inner-Hair-Cell and Auditory Nerve Complex, Journal of Acoustic Society of America, Vol. 111, Seiten 2178 bis 2188, Mai 2002;
    • [7] T. Dau, Modell der effektiven Signalverarbeitung im Gehör, Einblicke, Nr. 29, Seiten 16 bis 18, April 1999;
    • [8] V. Hohmann, Signalverarbeitung in digitalen Hörgeräten, Einblicke, Nr. 33, Seiten 24 bis 26, Juni 2001;
    • [9] H. W. Strube, A Computationally Efficient Basilar-Membrane-Model, Acoustica, Vol. 58, Seiten 207 bis 214, 1985;
    • [10] M. A. Ruggero et al., Mechanical Basis of Frequency Tuning and Neural Exitation at the Base of the Cochlea: Comparison of Basilar-Membrane-Vibration and Auditory Nerve-Fibre-Responses in Chinchilla, Proceedings of National Academy of Science USA, Vol. 97, Nr. 22, Seiten 11744 bis 11750, October 2000;
    • [11] P. Dallos et al., The Cochlea, ISBN 0387944494, Springer-Verlag, Kapitel 6, Seiten 318 bis 385, 1998.
    • [12] DE 697 12 801 T2 ;
    • [13] DE 101 31 964 B4 ;
    • [14] DE 10 2004 013 952 A1 ;
    • [15] EP 1 067 514 A1 ;
    • [16] K. Voutsas et. al.: Ein bionisches neuronales Netz zur Periodizitätsanalyse. In: Rossmann, Torsten; Tropea, Cameron [Hrsg.]: Bionik. Berlin [u. a.]: Springer, 2005, S. 159–187. ISBN: 978-3-540-21890-6
  • 100
    Spracherkennungs-System
    101
    Merkmalsextraktions-System
    102
    Spracherkennungs-Einrichtung
    103
    Eingabesignal
    104
    Gehörgangsmodell-Komponente
    105
    Signal
    106
    Mittelohrmodell-Komponente
    107
    Signal
    108
    Innenohrmodell-Komponente
    109
    Signal
    110
    Sensorzellenmodell-Komponente
    111
    Signal
    112
    Synaptische-Modell-Komponente
    113
    Signal
    201
    Induktivität
    202
    Ohmscher Widerstand
    203
    Filterbank
    204a
    Induktivität Filterstufe
    204b
    Ohmscher Widerstand Filterstufe
    204c
    Kapazität Filterstufe
    205
    Filterstufe
    205a
    Induktivität Filterstufe
    205b
    Ohmscher Widerstand Filterstufe
    205c
    Kapazität Filterstufe
    206
    Filterstufe
    206a
    Induktivität Filterstufe
    206b
    Ohmscher Widerstand Filterstufe
    206c
    Kapazität Filterstufe
    207
    Ohmscher Abschluss-Widerstand
    xBM
    Basilarmembran-Signal
    300
    Schaltkreis-Anordnung
    301
    Resonator-Schaltkreise
    302
    globales Eingabesignal
    303
    (Schall-)Signalquelle
    304
    erstes lokales Ausgabesignal
    305
    erstes lokales Eingabesignal
    306
    zweites lokales Ausgabesignal
    307
    zweites lokales Eingabesignal
    308
    drittes lokales Ausgabesignal
    309
    globales Ausgabesignal
    310
    Steuer-Schaltkreis
    400
    Eingabesignal
    401
    Kapazität
    402
    Induktivität
    403
    regelbarer ohmscher Widerstand
    404
    Ausgabesignal
    500
    Wellendigitalfilter
    501
    erster Block (serieller Koppler)
    502
    zweiter Block (paralleler Koppler)
    503
    dritter Block (Speicherelement für Kapazität)
    504
    vierter Block (Speicherelement für Induktivität)
    600
    Schaltkreis-Anordnung
    601
    erster Resonator-Schaltkreis
    602
    zweiter Resonator-Schaltkreis
    650
    Wellendigitalfilter
    651
    erste Komponente
    652
    zweite Komponente
    700
    Schaltkreis-Anordnung
    701
    erster Resonator-Schaltkreis
    702
    zweiter Resonator-Schaltkreis
    703
    Operationsverstärker
    703a
    nichtinvertierender Eingang
    703b
    invertierender Eingang
    703c
    Ausgang
    750
    Wellendigitalfilter
    751
    erste Komponente
    752
    zweite Komponente
    800
    Filterausgangs-Verarbeitungs-Schaltung
    801
    Hochpass
    802
    Gleichrichter-Schaltung
    803
    Tiefpass-Filter
    804
    Aktivierungs-Schaltung
    805
    Vesikel-Schaltung
    806
    Neurotransmitter-Schaltung
    807
    Kapazität Hochpassfilter
    808
    Ohmscher Widerstand Hochpassfilter
    809
    Ohmscher Widerstand Tiefpassfilter
    810
    Kapazität Tiefpassfilter
    900
    Diagramm
    1001
    Addierer
    1002
    erster Eingang Addierer
    1003
    Pfeil
    1004
    Ausgang Addierer
    1005
    Tiefpassfilter
    1006
    Verstärker
    1007
    Rückkopplungspfad
    1100
    Diagramm
    1101
    erste Kurve
    1102
    zweite Kurve

Claims (19)

  1. Filterbank-Anordnung, aufweisend: • eine Filterbank mit einer Mehrzahl von Filterstufen, wobei jede Filterstufe einen Filterbank-Ausgang aufweist, und mindestens einem Filterbank-Eingang, welchem ein Eingabesignal zuführbar ist, • mit einer Mehrzahl von Verstärker-Pfaden, wobei jeder Verstärker-Pfad mit einem zugehörigen Filterbank-Ausgang gekoppelt ist und wobei jeder Verstärker-Pfad aufweist: • eine mit dem jeweiligen Filterbank-Ausgang gekoppelte Verstärkereinheit, • eine der Verstärkereinheit nachgeschaltete Synaptische-Modell-Einheit, welche eingerichtet ist gemäß einem synaptischen Mechanismus-Modell eines Innenohrs eines Säugetiers, • wobei zumindest das Ausgangssignal der Synaptische-Modell-Einheit rückgekoppelt ist zu der Verstärkereinheit oder/und der Synaptische-Modell-Einheit, • eine Einstelleinheit zum Einstellen zumindest eines Teils der Parameter der Verstärkereinheit oder/und der Synaptische-Modell-Einheit abhängig von dem Ausgangssignal der Synaptische-Modell-Einheit.
  2. Filterbank-Anordnung gemäß Anspruch 1, wobei jeder Verstärker einen Resonator-Schaltkreis aufweist.
  3. Filterbank-Anordnung gemäß Anspruch 2, wobei jeder Resonator-Schaltkreis eine Kapazität und eine Induktivität aufweist.
  4. Filterbank-Anordnung gemäß Anspruch 3, ferner aufweisend mindestens einen Resonator-Steuer-Schaltkreis zum Steuern oder Regeln der Güte mindestens eines Resonator-Schaltkreises, wobei der mindestens eine Resonator-Steuer-Schaltkreis derart eingerichtet ist, dass er die Güte des Resonator-Schaltkreises abhängig von dem Zeitverlauf der Signalamplitude des Eingabesignals und/oder eines Teil-Ausgabesignals des Resonator-Schaltkreises steuert oder regelt.
  5. Filterbank-Anordnung gemäß einem der Ansprüche 1 bis 4, • bei der jeder Resonator-Schaltkreis eine Mehrzahl von in Serie miteinander gekoppelten Teil-Resonator-Schaltkreisen aufweist, und • wobei zumindest einer der Teil-Resonator-Schaltkreise mit einem Ausgang des Resonator-Schaltkreises gekoppelt ist.
  6. Filterbank-Anordnung gemäß einem der Ansprüche 1 bis 5, wobei die Filterbank als lineares Willendigitalfilter ausgestaltet ist.
  7. Filterbank-Anordnung gemäß einem der Ansprüche 1 bis 6, ferner aufweisend: eine Mehrzahl von Aktivierungs-Einheiten, wobei jeweils eine Aktivierungs-Einheit einer der Filterstufen zugeordnet ist, wobei jede Aktivierungs-Schaltung eingerichtet ist zum Verstärken einer zeitlichen Veränderung eines der Aktivierungs-Schaltung zugeführten Signals und zum Dämpfen von zeitlich im Wesentlichen konstanten Komponenten des der Aktivierungs-Schaltung zugeführten Signals.
  8. Filterbank-Anordnung gemäß Anspruch 7, wobei jede Aktivierungs-Einheit eine Vesikel-Pool-Einheit aufweist mit einer Vielzahl von Vesikel-Einheiten.
  9. Filterbank-Anordnung gemäß einem der Ansprüche 4 bis 8, wobei der Resonator-Steuer-Schaltkreis derart eingerichtet ist, dass er die Güte des mindestens einen Resonator-Schaltkreises basierend auf einer Boltzmann-Funktion und/oder deren Ableitung steuert, wobei die Boltzmann-Funktion die Amplitude des jeweiligen Teil-Ausgabesignals als Parameter enthält.
  10. Filterbank-Anordnung gemäß Anspruch 9, wobei der Resonator-Steuer-Schaltkreis derart eingerichtet ist, dass er die Güte des mindestens einen Resonator-Schaltkreises in Abhängigkeit von der Amplitude des jeweiligen Teil-Ausgabesignals basierend auf einer für ein Ohr eines Menschen ermittelten Empfindlichkeitscharakteristik einstellt.
  11. Filterbank-Anordnung gemäß einem der Ansprüche 4 bis 10, wobei der Resonator-Steuer-Schaltkreis derart eingerichtet ist, dass er die Güte des mindestens einen Resonator-Schaltkreises um so geringer einstellt, je höher die Amplitude des jeweiligen Teil-Ausgabesignals ist.
  12. Filterbank-Anordnung gemäß einem der Ansprüche 1 bis 11, jeder Verstärker-Pfad ferner aufweisend: • ein Summations-Element, welches mittels eines ersten Eingangs mit einem Ausgang der Synaptische-Modell-Einheit und mittels mindestens eines zweiten Eingangs mit mindestens einem Element eines anderen Verstärker-Pfads gekoppelt ist, • wobei die Einstelleinheit eingerichtet ist zum Einstellen zumindest eines Teils der Parameter der Verstärkereinheit oder/und der Synaptische-Modell-Einheit abhängig von dem Ausgangssignal des Summations-Elements.
  13. Filterbank-Anordnung gemäß Anspruch 12, jeder Verstärker-Pfad ferner aufweisend: • ein mit dem Ausgang des Summations-Elements gekoppeltes Tiefpassfilter, • wobei die Einstelleinheit eingerichtet ist zum Einstellen zumindest eines Teils der Parameter der Verstärkereinheit oder/und der Synaptische-Modell-Einheit abhängig von dem Ausgangssignal des Tiefpassfilters.
  14. Filterbank-Anordnung gemäß Anspruch 13, wobei das Tiefpassfilter ein Tiefpassfilter zweiter Ordnung ist.
  15. Filterbank-Anordnung gemäß Anspruch 14, wobei das Tiefpassfilter eine Zeitkonstante zwischen 50 ms und 1 s aufweist.
  16. Filterbank-Anordnung gemäß einem der Ansprüche 1 bis 15, wobei zumindest in einer Rückkopplung ein Integrator geschaltet ist.
  17. Filterbank-Anordnung gemäß einem der Ansprüche 1 bis 16, eingerichtet zum Verarbeiten eines akustischen Signals als Eingabesignal der Filterbank.
  18. Signalverarbeitungs-Vorrichtung • mit einer Filterbank-Anordnung gemäß einem der Ansprüche 1 bis 17, und • mit einer Weiterverarbeitungs-Einheit zum Weiterverarbeiten des von der Filterbank-Anordnung bereitgestellten Signals.
  19. Signalverarbeitungs-Vorrichtung gemäß Anspruch 18, wobei die Weiterverarbeitungs-Einheit eine Spracherkennungs-Einrichtung oder ein Hörgerät ist.
DE102006007779A 2006-02-20 2006-02-20 Filterbank-Anordnung und Signalverarbeitungs-Vorrichtung Expired - Fee Related DE102006007779B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102006007779A DE102006007779B4 (de) 2006-02-20 2006-02-20 Filterbank-Anordnung und Signalverarbeitungs-Vorrichtung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102006007779A DE102006007779B4 (de) 2006-02-20 2006-02-20 Filterbank-Anordnung und Signalverarbeitungs-Vorrichtung

Publications (2)

Publication Number Publication Date
DE102006007779A1 DE102006007779A1 (de) 2007-08-30
DE102006007779B4 true DE102006007779B4 (de) 2008-07-10

Family

ID=38319689

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102006007779A Expired - Fee Related DE102006007779B4 (de) 2006-02-20 2006-02-20 Filterbank-Anordnung und Signalverarbeitungs-Vorrichtung

Country Status (1)

Country Link
DE (1) DE102006007779B4 (de)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1067514A1 (de) * 1999-07-08 2001-01-10 Sony International (Europe) GmbH System zur automatischen Spracherkennung
DE69712801T2 (de) * 1997-12-23 2002-11-07 Widex As Vaerloese Dynamische automatische verstärkungssteuerung in einem hörhilfegerät
DE102004013952A1 (de) * 2004-03-22 2005-10-20 Infineon Technologies Ag Schaltkreis-Anordnung und Signalverarbeitungs-Vorrichtung
DE10131964B4 (de) * 2001-07-02 2005-11-03 Siemens Audiologische Technik Gmbh Verfahren zum Betrieb eines digitalen programmierbaren Hörgerätes sowie digitales programmierbares Hörgerät

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69712801T2 (de) * 1997-12-23 2002-11-07 Widex As Vaerloese Dynamische automatische verstärkungssteuerung in einem hörhilfegerät
EP1067514A1 (de) * 1999-07-08 2001-01-10 Sony International (Europe) GmbH System zur automatischen Spracherkennung
DE10131964B4 (de) * 2001-07-02 2005-11-03 Siemens Audiologische Technik Gmbh Verfahren zum Betrieb eines digitalen programmierbaren Hörgerätes sowie digitales programmierbares Hörgerät
DE102004013952A1 (de) * 2004-03-22 2005-10-20 Infineon Technologies Ag Schaltkreis-Anordnung und Signalverarbeitungs-Vorrichtung

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KYRIAKOS V. et al.: Ein bionisches neurales Netz zur Periodizitätsanalyse. In: ROSSMANN, TORSTEN *
TROPEA, CAMERON (Hrsg.): Bionik, Berlin (u.a): Springer, 2005,S. 159-187,ISBN: 978-3-540-21890-6 *

Also Published As

Publication number Publication date
DE102006007779A1 (de) 2007-08-30

Similar Documents

Publication Publication Date Title
EP0661905B1 (de) Verfahren zur Anpassung eines Hörgerätes, Vorrichtung hierzu und Hörgerät
EP2180726B2 (de) Richtungshören bei binauraler Hörgeräteversorgung
DE69933627T2 (de) Vorrichtung und Verfahren zur Anpassung des Phasen- und Amplitudenfrequenzgangs eines Mikrofons
DE69906560T2 (de) Cochlea-kompression modellbasiertes hörhilfegerät
EP0656737B1 (de) Hörhilfegerät mit Unterdrückung der akustischen Rückkopplung
EP3520441B1 (de) Aktive unterdrückung des okklusionseffektes in hörhilfen
DE102016003133B4 (de) Verfahren zur automatischen Bestimmung einer individuellen Funktion einer DPOAE-Pegelkarte eines menschlichen oder tierischen Gehörs
EP3454572A1 (de) Verfahren zum erkennen eines defektes in einem hörinstrument
EP2981099B1 (de) Verfahren und vorrichtung zur rückkopplungsunterdrückung
EP1728322A1 (de) Schaltkreis-anordnung und signalverarbeitungs-vorrichtung
EP3818727B1 (de) Vorrichtung und verfahren zur modifizierung eines lautsprechersignals zur vermeidung einer membranüberauslenkung
EP1489882A2 (de) Verfahren zum Betrieb eines Hörhilfegerätes, sowie Hörhilfegerät mit einem Mikrofonsystem, bei dem unterschiedliche Richtcharakteristiken einstellbar sind
DE602004006912T2 (de) Verfahren zur Verarbeitung eines akustischen Signals und ein Hörgerät
EP1453355B1 (de) Signalverarbeitung in einem Hörgerät
DE102006007779B4 (de) Filterbank-Anordnung und Signalverarbeitungs-Vorrichtung
EP2584795A2 (de) Verfahren zum Ermitteln einer Kompressionskennlinie
DE60310084T2 (de) Vorrichtung und verfahren zur verteilten verstärkungsregelung zur spektralen verbesserung
EP1540818B1 (de) Schaltkreis-anordnung und signalverarbeitungs-vorrichtung
EP1458216A2 (de) Vorrichtung und Verfahren zur Adaption von Hörgerätemikrofonen
DE102020200553B3 (de) Verfahren zur Abstimmung der jeweiligen Phasengänge eines ersten Mikrofones und eines zweiten Mikrofons
EP1309225B1 (de) Verfahren zur Bestimmung einer Rückkopplungsschwelle in einem Hörgerät
DE2417146A1 (de) Geraet fuer kompensatorische verstaerkung fuer gehoergeschaedigte personen und verfahren zu dessen anpassung an patienten
DE10361954B4 (de) Hörsystem und Verfahren zur Einstellung eines solchen, Verfahren zur Erkennung von charakteristischen Schallspektren, sowie entsprechende Computerprogramme und entsprechende computerlesbare Speichermedien
WO2021180583A1 (de) Mikrofonschaltung zur linearisierung des proximity-effekts bei einem dynamischen richtmikrofon
EP4002871A1 (de) Verfahren zur adaption von anc-kopfhörern

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8339 Ceased/non-payment of the annual fee