DE102011004338B3 - Verfahren und Vorrichtung zum Schätzen eines Störgeräusches - Google Patents

Verfahren und Vorrichtung zum Schätzen eines Störgeräusches Download PDF

Info

Publication number
DE102011004338B3
DE102011004338B3 DE102011004338A DE102011004338A DE102011004338B3 DE 102011004338 B3 DE102011004338 B3 DE 102011004338B3 DE 102011004338 A DE102011004338 A DE 102011004338A DE 102011004338 A DE102011004338 A DE 102011004338A DE 102011004338 B3 DE102011004338 B3 DE 102011004338B3
Authority
DE
Germany
Prior art keywords
noise
time window
estimate
value
current time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE102011004338A
Other languages
English (en)
Inventor
Tobias Rosenkranz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sivantos Pte Ltd
Original Assignee
Siemens Medical Instruments Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Medical Instruments Pte Ltd filed Critical Siemens Medical Instruments Pte Ltd
Priority to DE102011004338A priority Critical patent/DE102011004338B3/de
Priority to EP12154134.6A priority patent/EP2495724B1/de
Priority to DK12154134.6T priority patent/DK2495724T3/da
Priority to US13/397,859 priority patent/US8634581B2/en
Application granted granted Critical
Publication of DE102011004338B3 publication Critical patent/DE102011004338B3/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02163Only one microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • G10L2021/065Aids for the handicapped in understanding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Otolaryngology (AREA)
  • Neurosurgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Noise Elimination (AREA)

Abstract

Dynamische Störgeräusche sollen besser geschätzt werden können. Hierzu wird eine Vorrichtung und ein Verfahren zum Schätzen eines Störgeräusches durch Bereitstellen eines Werts (X(ejΩ)) für die Leistungsdichte eines Gesamtsignals, das ein Nutzsignal und das zu schätzende Störgeräusch enthält, in einem aktuellen Zeitfenster, Vergleichen des Werts des Gesamtsignals mit einem mit einem Verstärkungsfaktor (1 + ε) multiplizierten Schätzwert eines Störgeräusches aus einem dem aktuellen Zeitfenster vorausgehenden Zeitfenster (19) und Verwenden des kleineren (17) der beiden Werte des Vergleichs als Vorschätzwert für das Störgeräusch in dem aktuellen Zeitfenster. Außerdem wird ein Codebuchschätzwert (ŜnnCB(ejΩ)) für das Störgeräusch in dem aktuellen Zeitfenster bereitgestellt. Schließlich wird der größere Wert (27) von dem Vorschätzwert und dem Codebuchschätzwert als Schätzwert (Ŝnn(ejΩ)) für das Störgeräusch in dem aktuellen Zeitfenster verwendet.

Description

  • Die vorliegende Erfindung betrifft ein Verfahren zum Schätzen eines Störgeräusches durch Bereitstellen eines Werts für die Leistungsdichte eines Gesamtsignals, das ein Nutzsignal und das zu schätzende Störgeräusch enthält, in einem aktuellen Zeitfenster, Vergleichen des Werts des Gesamtsignals mit einem mit einem Verstärkungsfaktor multiplizierten Schätzwert eines Störgeräusches aus einem dem aktuellen Zeitfenster vorausgehenden Zeitfenster und Verwenden des kleineren der beiden Werte des Vergleichs als Vorschätzwert für das Störgeräusch in dem aktuellen Zeitfenster. Darüber hinaus betrifft die vorliegende Erfindung eine Vorrichtung zum Schätzen eines Störgeräusches einer Eingangseinrichtung zum Bereitstellen des Werts für die Leistungsdichte des Gesamtsignals und einer rekursiven Minimumschätzeinrichtung zum Vergleichen des Werts des Gesamtsignals mit dem Schätzwert des vorausgehenden Zeitfensters. Des Weiteren betrifft die vorliegende Erfindung auch eine Hörvorrichtung mit einer solchen Vorrichtung zum Schätzen eines Störgeräusches. Unter einer Hörvorrichtung wird hier jedes im oder am Ohr tragbare, schallausgebende Gerät, insbesondere ein Hörgerät, ein Headset, Köpfhörer und dergleichen verstanden.
  • Hörgeräte sind tragbare Hörvorrichtungen, die zur Versorgung von Schwerhörenden dienen. Um den zahlreichen individuellen Bedürfnissen entgegenzukommen, werden unterschiedliche Bauformen von Hörgeräten wie Hinter-dem-Ohr-Hörgeräte (HdO), Hörgerät mit externem Hörer (RIC: receiver in the canal) und In-dem-Ohr-Hörgeräte (IdO), z. B. auch Concha-Hörgeräte oder Kanal-Hörgeräte (ITE, CIC), bereitgestellt. Die beispielhaft aufgeführten Hörgeräte werden am Außenohr oder im Gehörgang getragen. Darüber hinaus stehen auf dem Markt aber auch Knochenleitungshörhilfen, implantierbare oder vibrotaktile Hörhilfen zur Verfügung. Dabei erfolgt die Stimulation des geschädigten Gehörs entweder mechanisch oder elektrisch.
  • Hörgeräte besitzen prinzipiell als wesentliche Komponenten einen Eingangswandler, einen Verstärker und einen Ausgangswandler. Der Eingangswandler ist in der Regel ein Schallempfänger, z. B. ein Mikrofon, und/oder ein elektromagnetischer Empfänger, z. B. eine Induktionsspule. Der Ausgangswandler ist meist als elektroakustischer Wandler, z. B. Miniaturlautsprecher, oder als elektromechanischer Wandler, z. B. Knochenleitungshörer, realisiert. Der Verstärker ist üblicherweise in eine Signalverarbeitungseinheit integriert. Dieser prinzipielle Aufbau ist in 1 am Beispiel eines Hinter-dem-Ohr-Hörgeräts dargestellt. In ein Hörgerätegehäuse 1 zum Tragen hinter dem Ohr sind ein oder mehrere Mikrofone 2 zur Aufnahme des Schalls aus der Umgebung eingebaut. Eine Signalverarbeitungseinheit 3, die ebenfalls in das Hörgerätegehäuse 1 integriert ist, verarbeitet die Mikrofonsignale und verstärkt sie. Das Ausgangssignal der Signalverarbeitungseinheit 3 wird an einen Lautsprecher bzw. Hörer 4 übertragen, der ein akustisches Signal ausgibt. Der Schall wird gegebenenfalls über einen Schallschlauch, der mit einer Otoplastik im Gehörgang fixiert ist, zum Trommelfell des Geräteträgers übertragen. Die Energieversorgung des Hörgeräts und insbesondere die der Signalverarbeitungseinheit 3 erfolgt durch eine ebenfalls ins Hörgerätegehäuse 1 integrierte Batterie 5.
  • Bei vielen Anwendungen, insbesondere bei Hörgeräten und Mobiltelefonen, ist das Nutzsignal, bei dem es sich meist um Sprache handelt, oft durch Störgeräusche gestört. Während stationäre Störgeräusche in der Regel für Sprachverbesserungssysteme bekannter Art kein größeres Problem darstellen, sind nicht stationäre Störgeräusche meist eine größere Herausforderung. Besonders betroffen sind einkanalige (d. h. es wird ein einziges Mikrofon benutzt), modellbasierte Sprachverbesserungssysteme, die auch sehr instationäre Störgeräusche unterdrücken sollen. Derartige einkanalige Sprachverbesserungssysteme können den Hörer entlasten, indem sie Störgeräusche entsprechend dämpfen.
  • Einkanalige Störgeräuschereduktion wird typischerweise durch so genannte „Wiener-Filter” durchgeführt. Beim Erstellen eines Wiener-Filters ist es notwendig, zumindest die spektrale Störleistungsdichte (PSD) zu schätzen. Konventionelle Sprachverbesserungssysteme setzen üblicherweise voraus, dass die Störgeräusche eher stationär sind, d. h. die Charakteristik des Störgeräuschs ändert sich nur langsam in Abhängigkeit von der Zeit. So können die Störgeräuschcharakteristiken während Sprachpausen geschätzt werden, was jedoch eine robuste Sprachaktivitätsdetektion (VAD) erfordert.
  • Weiterentwickelte Verfahren arbeiten nach dem Prinzip der „Minimum-Statistik” bzw. des „Minimum Tracking”. Sie sind in der Lage, die Störgeräuschschätzung auch während einer Sprachaktivität zu aktualisieren und benötigen somit keine VAD. Bei dem Minimum-Statistik-Verfahren wird verrauschte Sprache in Unterbänder zerlegt, und es wird in einem bestimmten Zeitintervall nach Minima in diesen Unterbändern gesucht. Wegen der hohen Dynamik des Sprachsignals sollten die Minima der spektralen Rauschleistungsdichte entsprechen, wenn das Rauschen beziehungsweise das Störgeräusch hinreichend stationär ist. Die Minima werden als Eingangsgrößen für die Einstellung eines Verstärkungsfaktor im jeweiligen Frequenzband verwendet. Das Verfahren scheitert jedoch, wenn das Störgeräusch einen gewissen Grad an Unstationarität überschreitet. Dies bedeutet, dass seine Leistungsfähigkeit in sehr instationären Umgebungen (z. B. Geplapper in einer Cafeteria) zusammenbricht. Hinsichtlich der Störgeräuschreduktion mit so genanntem „Recursive Minimum Tracking” bzw. „Minimum Statistik” wird auf das Buch von Eberhard Hänsler und Gerhard Schmidt: „Acoustic Echo and Noise Control: A Practial Approach”, Wiley-Interscience-Verlag, 2004 und auf den Artikel von R. Martin: ”Noise Power Spectral Density Estimation Based on Optimal Smoothing and Minimum Statistics”, IEEE Transactions on Speech and Audio Processing, 2001, 9 (5), Seiten 504 bis 512 verwiesen.
  • In jüngster Zeit wurden so genannte „Codbuch-basierte” Sprachverbesserungstechniken entwickelt. Diese nutzen ein Vorabwissen über Sprache und Störgeräusch. Die Hauptidee besteht darin, die spektralen Einhüllenden und die Breitbandsignalleistungen (Verstärkungsfaktoren) von Sprache und Störgeräusch aus dem gestörten Signal zu schätzen. Typische spektrale Einhüllende von Sprache und unterschiedlichen Störgeräuschklassen werden in Codebüchern gespeichert. Für die Schätzung wird zunächst ein Paar (ein Spracheintrag und ein Störgeräuscheintrag) von spektralen Einhüllenden aus den entsprechenden Codebüchern genommen. Die optimalen Verstärkungsfaktoren (d. h. die breitbandige Sprachleistung und die breitbandige Störgeräuschleistung) werden durch Maximieren eines gewissen Optimierungskriteriums geschätzt. Als Kriterium gilt beispielsweise, dass die Summe der Sprach- und Störgeräusch-Codebuch-Einträge dem aktuellen gestörten Signal soweit wie möglich entspricht. In einem zweiten Schritt wird entweder das Paar (zusammen mit den zugehörigen, geschätzten Verstärkungsfaktoren), das mit höchster Wahrscheinlichkeit dem aktuellen gestörten Spektrum entspricht, ausgewählt, oder es wird jedes Paar mit der Wahrscheinlichkeit gewichtet, dass es dem aktuellen gestörten Schallspektrum entspricht, und alle so gewichteten Paare werden aufsummiert. Hierdurch werden Schätzwerte für die Sprach- und Störgeräuschkomponenten des gestörten Schallspektrums erhalten. Diese Schätzwerte werden als Eingangsgrößen für eine nachfolgende Störgeräuschereduktion, beispielsweise durch einen ”Wiener-Filter”, verwendet. Dieses Schätzverfahren wird in kurzen Zeitfenstern (z. B. 8 ms) durchgeführt, sodass schnellen Änderungen der Störgeräuschcharakteristik nahezu unverzögert gefolgt werden kann. Ein Minimum-Statistik-Schätzer kann derartigen Änderungen nur mit einer Verzögerung im Bereich von einigen wenigen Sekunden folgen.
  • Ein derartiger Codebuch-basierter Algorithmus ist aus dem Artikel von T. Rosenkranz, „Noise Codebook Adaptation for Codebook-Based Noise Reduction, in Proceedings of International Workshop on Acoustic Echo and Noise Control (IWAENC), Tel Aviv, August 2010 bekannt.
  • Es bestehen jedoch auch drei gravierende Nachteile bei dem Codebuch-basierten Ansatz. Zum Ersten ist die Störgeräuschschätzung auf einen vordefinierten Satz an Codebucheinträgen beschränkt. Da diese Einträge spektrale Einhüllende repräsentieren, sind sie entlang der Frequenzachse geglättet. Dies bedeutet, dass beispielsweise scharfe spektrale Spitzen nicht modelliert sind. Zum zweiten bedeutet die Fähigkeit des Codebuch-basierten Ansatzes, unverzögert auf Störgeräuschänderungen zu reagieren, dass die Schätzung stark schwankt. Da die Schätzung des Breitbandpegels naturgemäß nicht perfekt ist und deshalb relativ stark um den wahren Wert schwankt, kommt es zu unangenehmen Artefakten im störgeräusch-befreiten Signal. Zum Dritten kann dieser Codebuch-basierte Ansatz keine Geräuschklassen handhaben, die nicht trainiert wurden.
  • Aus der Druckschrift DE 10 2008 017 550 A1 ist ein mehrstufiges Schätzverfahren zur Störgeräuschreduktion und eine entsprechende Hörvorrichtung bekannt. Die Hörvorrichtung ist mit einer ersten Schätzeinrichtung zum Schätzen eines ersten Werts eines Eingangssignals mit einem ersten Schätzalgorithmus und einer Störgeräuschreduktionseinrichtung zum Reduzieren eines Störgeräuschs in dem Eingangssignal ausgestattet. Eine zweite Schätzeinrichtung, die mit dem geschätzten ersten Wert parametriert ist, dient zum Schätzen eines zweiten Werts des Eingangssignals mit einem zweiten Schätzalgorithmus. Die Störgeräuschreduktionseinrichtung erhält den geschätzten zweiten Wert von der zweiten Schätzeinrichtung zum Reduzieren des Störgeräuschs, Durch das zweistufige Schätzverfahren kann eine adaptive Schätzung durchgeführt werden, die stets aktuell einem Eingangssignal angepasst ist.
  • Die Aufgabe der vorliegenden Erfindung besteht somit darin, ein verfahren und eine Vorrichtung vorzuschlagen, mit denen es möglich ist, auch unbekannte Störgeräusche möglichst rasch schätzen zu können.
  • Erfindungsgemäß wird diese Aufgabe gelöst durch ein Verfahren zum Schätzen eines Störgeräusches durch
    • – Bereitstellen eines Werts für die Leistungsdichte eines Gesamtsignals, das ein Nutzsignal und das zu schätzende Störgeräusch enthält, in einem aktuellen Zeitfenster,
    • – Vergleichen des Werts des Gesamtsignals mit einem mit einem Verstärkungsfaktor multiplizierten Schätzwert eines Störgeräusches aus einem dem aktuellen Zeitfenster vorausgehenden Zeitfenster und
    • – Verwenden des kleineren der beiden Werte des Vergleichs als Vorschätzwert für das Störgeräusch in dem aktuellen Zeitfenster, sowie
    • – Bereitstellen eines Codebuchschätzwerts für das Störgeräusch in dem aktuellen Zeitfenster und
    • – Verwenden des größeren Werts von dem Vorschätzwert und dem Codebuchschätzwert als Schätzwert für das Störgeräusch in dem aktuellen Zeitfenster.
  • Darüber hinaus wird erfindungsgemäß bereitgestellt eine Vorrichtung zum Schätzen eines Störgeräusches mit
    • – einer Eingangseinrichtung zum Bereitstellen eines Werts für die Leistungsdichte eines Gesamtsignals, das ein Nutzsignal und das zu schätzende Störgeräusch enthält, in einem aktuellen Zeitfenster,
    • – einer rekursiven Minimumschätzeinrichtung zum Vergleichen des Werts des Gesamtsignals mit einem mit einem Verstärkungsfaktor multiplizierten Schätzwert eines Störgeräusches aus einem dem aktuellen Zeitfenster vorausgehenden Zeitfenster und zum Ausgeben des kleineren der beiden Werte des Vergleichs als Vorschätzwert für das Störgeräusch in dem aktuellen Zeitfenster, sowie mit
    • – einer Codebuchschätzeinrichtung zum Bereitstellen eines Codebuchschätzwerts für das Störgeräusch in dem aktuellen Zeitfenster und
    • – einer Logikeinrichtung zum Ermitteln des größeren Werts von dem Vorschätzwert und dem Codebuchschätzwert als Schätzwert für das Störgeräusch in dem aktuellen Zeitfenster.
  • In vorteilhafter Weise wird also erfindungsgemäß das „rekursive Minimumtracking” mit der „Codebuch-basierten Störgeräuschschätzung” kombiniert, um eine verbesserte Reduktion nicht stationärer Störgeräusche zu erreichen. Dadurch werden die oben genannten Nachteile der rekursiven Minimumsuche als auch die Nachteile der Codebuch-basierten Schätzung für sich genommen im Wesentlichen eliminiert.
  • Vorzugsweise handelt es sich bei dem Wert des Gesamtsignals und dem Schätzwert für ein Störgeräusch jeweils um spektrale Werte. Die Signalverarbeitung in dem erfindungsgemäßen Verfahren wird dann im Spektralbereich durchgeführt.
  • Insbesondere ist es günstig, wenn das Verfahren in mehreren Frequenzkanälen parallel angewendet wird. Das Eingangssignal wird hierzu günstiger Weise in einer Filterbank in die einzelnen Spektralanteile zerlegt.
  • Ferner ist es von Vorteil, wenn der Schätzwert für das Störgeräusch in dem aktuellen Zeitfenster mit dem Schätzwert aus dem vorausgehenden Zeitfenster geglättet wird. Dies ist insofern günstig, als dann keine übermäßigen Sprünge bei der Geräuschreduktion auftreten.
  • Besonders vorteilhaft ist auch, wenn der Codebuchschätzwert vorübergehend auf Null gesetzt werden kann. Äquivalent hierzu ist, wenn die Codebuchschätzeinrichtung abgeschaltet wird. Dadurch wird der gesamte Algorithmus unempfindlicher gegenüber der Tatsache, ob das Störgeräusch bekannt ist oder nicht.
  • In einer vorteilhaften Anwendung wird das oben geschilderte Verfahren zum Schätzen eines Störgeräuschs für das Reduzieren von Störgeräuschen verwendet. Hier wiederum ist es von besonderem Vorteil, wenn ein derartiges Verfahren zum Reduzieren von Störgeräuschen zum Betrieb eines Hörgeräts genutzt wird beziehungsweise in einem Hörgerät implementiert wird. Dadurch können insbesondere Hörgeräteträger von dem verbesserten, kombinierten Störgeräuschreduktionsverfahren profitieren.
  • Die oben genannte Vorrichtung zum Schätzen eines Störgeräuschs kann in eine Hörvorrichtung integriert werden. Speziell kann diese Hörvorrichtung als Hörgerät ausgebildet sein.
  • Die vorliegende Erfindung wird nun anhand der beigefügten Zeichnungen näher erläutert, in denen zeigen:
  • 1 eine Prinzipskizze eines Hörgeräts gemäß dem Stand der Technik;
  • 2 ein Schaltbild einer Signalverarbeitung in einem Hörgerät;
  • 3 ein Schaltbild eines rekursiven Störgeräuschschätzers gemäß dem Stand der Technik;
  • 4 ein Schaltbild eines kombinierten Störgeräuschschätzers gemäß der vorliegenden Erfindung und
  • 5 Signalverläufe von Störgeräuschen und Störgeräuschschätzungen nach unterschiedlichen Algorithmen.
  • Die nachfolgend näher geschilderten Ausführungsbeispiele stellen bevorzugte Ausführungsformen der vorliegenden Erfindung dar.
  • In einem beispielhaften Hörgerät findet eine Signalverarbeitung gemäß der Skizze von 2 statt. Ein Mikrofon 10 des Hörgeräts liefert ein verrauschtes beziehungsweise gestörtes Signal x(k). Dieses Signal wird mithilfe einer Filterbank 11 spektral in einzelne Frequenzbänder zerlegt. Damit steht ein spektrales Signal X(e) bereit. Dieses spektrale Signal wird einer Geräuschschätzeinheit 12 zugeführt, die daraus einen Schätzwert Ŝnn(e) für die Geräuschleitungsdichte gewinnt. Ein Geräuschreduktionsfilter 13 ermittelt daraus spektrale Gewichte Ĝ(e) In einem Multiplizierer 14 werden dann die Gewichte Ĝ(e) mit dem Spektrum X(e) des Gesamtsignals multipliziert, woraus ein Schätzwert Ŝ(e) für das Nutzsignal (z. B. reines Sprachsignal) entsteht. Durch eine inverse Filterbank 15 entsteht eine Schätzung ŝ(k) des Nutzsignals im Zeitbereich.
  • Erfindungsgemäß wird nun die Geräuschschätzung in der Geräuschschätzungseinheit 12 optimiert. Erfindungsgemäß wird hierzu ein Geräuschschätzalgorithmus basierend auf rekursiver Minimumstatistik und ein Algorithmus basierend auf einem oder mehreren Codebüchern kombiniert. Es entsteht somit ein Geräuschschätzverfahren, welches die entsprechenden Vorteile kombiniert. Beispielsweise wird ein Codebuch-basierter Algorithmus verwendet, wie er in dem eingangs geschilderten Artikel von T. Rosenkranz beschrieben ist. Die Störgeräuschschätzung des Codebuch-basierten Algorithmus wird in den rekursiven Schätzalgorithmus basierend auf der Minimumstatistik ähnlich dem eingangs erwähnten Algorithmus von Eberhard Hänsler und Gerhard Schmidt integriert.
  • Zum besseren Verständnis der Erfindung wird nachfolgend anhand von 3 ein Modell eines rekursiven Störgeräuschschätzers dargelegt. Das dort dargestellte Verfahren findet in mehreren Frequenz(unter)bändern unabhängig voneinander statt. Die einzelnen Frequenzbänder werden beispielsweise mit der in 2 dargestellten Filterbank 11 gewonnen. Bei dem Eingangssignal X(e) beziehungsweise |X|2 handelt es sich beispielsweise um ein Periodogramm verrauschter Sprache. Das Ausgangssignal Ŝnn(e) entspricht einer Schätzung des Störgeräuschleistungsspektrums. Das Eingangssignals wird in einer Glättungseinheit 16 geglättet. Das geglättete Eingangsspektrum wird in einem Vergleicher 17 mit dem geschätzten Störgeräuschspektrum eines vorhergehenden Fensters verglichen. Hierzu wird das geschätzte Störleistungsspektrum des vorhergehenden Zeitfensters vorab mit einer konstanten „Störgeräuschschätzverstärkung” multipliziert, die dem Wert 1 + ε entspricht, wobei ε < < 1 ist. Für diese Multiplikation ist der Verstärker 18 vorgesehen. Er erhält sein Eingangssignal von einem Verzögerungselement 19, welches seinerseits von dem Störschätzwert Ŝnn) des aktuellen Zeitfensters gespeist wird. Zur Glättung des Ausgangssignals wird der Schätzwert des vorhergehenden Zeitfensters (Signal nach der Verzögerungseinheit 19) von dem Ausgangssignal des Vergleichers 17 in einem Subtrahierer 20 subtrahiert. Das Differenzsignal wird in einem weiteren Verstärker 21 mit einer Konstante multipliziert. Das resultierende Signal wird schließlich in einem Addierer 22 mit dem Schätzwert des vorhergehenden Zeitfensters addiert, woraus schließlich der geglättete Schätzwert Ŝnn) resultiert.
  • Mit den Elementen 19, 20, 21 und 22 wird somit eine IIR-Glättung (Infinite Impulse Response) erster Ordnung des geschätzten Störgeräuschspektrums durchgeführt.
  • In dem Vergleicher 17 wird das Minimum der beiden Signale (im aktuellen Zeitfenster und im vorhergehenden Zeitfenster) verwendet. Es handelt sich somit um eine Art effiziente Implementierung des Minimum-Statistik-Algorithmus entsprechend dem Artikel von R. Martin.
  • Das Verhalten dieses bekannten Schätzers geht aus der Grafik von 5 hervor. Die Kurve 23 zeigt das tatsächlich vorliegende Störgeräusch. Beispielsweise handelt es sich um Straßenlärm mit schnell vorbeifahrenden Autos. Die Schätzwerte werden aus einer Mischung dieses Störgeräuschs mit einem Sprachsignal bei einem Abstand (SNR) von 0 dB ermittelt. Die Kurve 24 zeigt die Schätzung des rekursiven Minimum-Tracking-Algorithmus. Wie beispielsweise aus den ersten beiden Sekunden der Schätzung gesehen werden kann, kann der Schätzer dem raschen Anstieg des Störgeräuschs nicht folgen. Der Anstieg des Schätzers wird durch die Konstante ε limitiert. Diese Konstante ε muss klein sein, denn anderenfalls würde die Schätzung dem verrauschten Eingangsspektrum zu rasch folgen und Sprachanteile werden fälschlicherweise in die Störgeräuschschätzung aufgenommen.
  • Erfindungsgemäß erfolgt nun entsprechend dem Beispiel von 4 eine Verbesserung der Störgeräuschschätzung dadurch, dass die rekursive Schätzung mit einer Codebuch-basierten Schätzung kombiniert wird, wobei der kombinierte Algorithmus in der Lage ist, schnellen Störgeräuschfluktuationen rasch zu folgen. Das ist 4 dargestellte Signalflussdiagramm entspricht im Wesentlichen dem von 3. Daher wird auf die Beschreibung von 3 Bezug genommen. Eine Codebuch-basierte Störgeräuschschätzung wird mithilfe einer Maximum-Operation in einer zweiten Vergleichereinheit 27 (Logikeinrichtung) unmittelbar hinter der Vergleichereinheit 17 mit der Minimum-Operation in die Schätzvorrichtung integriert. Die Vergleichseinheit 27 erhält eine Codebuch-Schätzung ŜnnCB von einer in 4 nicht näher dargestellten Codebuch-Schätzeinrichtung. Wenn folglich das tatsächliche Störgeräusch deutlich unterschätzt wird (der Schätzwert des rekursiven Minimum-Tracking-Algorithmus liegt unterhalb demjenigen des Codebuch-basierten Algorithmus), so wird der Codebuch-basierte Schätzwert genommen. Der rekursive Teil des Algorithmus ist dann in der Lage, dem Störgeräusch von einem höheren Pegel aus nachzugehen. Der erfindungsgemäße, kombinierte Algorithmus kann daher auf Änderungen des Störgeräuschpegels genauso schnell reagieren wie Codebuch-Schätzungen.
  • 5 zeigt dieses Verhalten der kombinierten Schätzung. Die Codebuchschätzung ist mit Kurve 25 dargestellt. Die Schätzung des kombinierten Algorithmus ist mit Kurve 26 wiedergegeben. Verglichen mit der Codebuchschätzung 25 folgt die kombinierte Schätzung 26 der Erhöhung des Störgeräuschpegels mit einer sehr geringen Verzögerung, die auf den Glättungsteil 20, 21, 22 des Algorithmus zurückzuführen ist. Es ist jedoch ersichtlich, dass der kombinierte Algorithmus dem Anstieg des Störgeräuschpegels viel schneller folgt als der rekursive Algorithmus 24 allein. Außerdem kann erkannt werden, dass der erfindungsgemäße, kombinierte Algorithmus eine bessere Schätzung liefert, wenn die Codebuch-basierte Schätzung 25 das tatsächliche Störgeräusch 23 unterschätzt. Im Zeitbereich zwischen 4 und 6 Sekunden nämlich ist die Codebuch-Schätzung 25 deutlich geringer als das tatsächliche Störgeräusch. Da aber der rekursive Teil des Algorithmus dem Störgeräusch folgen kann, liegt die kombinierte Schätzung 26 wesentlich näher an dem realen Störgeräusch als die Codebuch-basierte Schätzung 25 oder die rekursive Schätzung 24 allein.
  • In vorteilhafter Weise wird also eine Codebuch-basierte Störgeräuschschätzung mit einer rekursiven Störgeräuschschätzung kombiniert. Die Vorteile jeder einzelnen dieser Schätzungen werden dabei für die Kombination gewonnen, während die Nachteile minimiert werden.
  • Die Vorteile der Kombination liegen darin, dass der kombinierte Algorithmus schnellen Störgeräuschfluktuationen wesentlich rascher folgen kann als konventionelle rekursive Störgeräuschschätzer. Ein weiterer Vorteil liegt darin, dass durch das Einkoppeln des Codebuch-basierten Schätzalgorithmus auf die vorgeschlagene Art und Weise der Schätzer zu einem konventionellen rekursiven Schätzer wird, wenn die Codebuch-basierte Schätzung abgeschaltet beziehungsweise auf Null gesetzt wird. Dies wiederum verbessert die Robustheit des Algorithmus. Ferner liegt ein Vorteil der vorgeschlagenen Kombination darin, dass der Algorithmus dem Störgeräusch weiter folgen kann, wenn der Codebuch-basierte Algorithmus den tatsächlichen Störgeräuschpegel unterschätzt. Der kombinierte Algorithmus kann daher Bereiche überbrücken, in denen die Codebuch-basierte Schätzung entweder das Störgeräusch unterschätzt oder abgeschaltet ist. Außerdem schwankt die Geräuschschätzung wesentlich weniger als die Codebuch-basierte Schätzung allein, was zu einer wesentlich angenehmeren Schallwiedergabe mit verminderten Artefakten führt. Zudem kann der vorgeschlagene Schätzer Störgeräusche handhaben, für die der Codebuch-basierte Algorithmus nicht trainiert wurde. Dies liegt an dem rekursiven Teil des Algorithmus, der von der Codebuch-basierten Schätzung unabhängig ist.

Claims (10)

  1. Verfahren zum Schätzen eines Störgeräusches durch – Bereitstellen eines Werts für die Leistungsdichte eines Gesamtsignals, das ein Nutzsignal und das zu schätzende Störgeräusch enthält, in einem aktuellen Zeitfenster, – Vergleichen des Werts des Gesamtsignals mit einem mit einem Verstärkungsfaktor multiplizierten (18) Schätzwert eines Störgeräusches aus einem dem aktuellen Zeitfenster vorausgehenden Zeitfenster und – Verwenden des kleineren (17) der beiden Werte des Vergleichs als Vorschätzwert für das Störgeräusch in dem aktuellen Zeitfenster, gekennzeichnet durch – Bereitstellen eines Codebuchschätzwerts für das Störgeräusch in dem aktuellen Zeitfenster und – Verwenden des größeren Werts (27) von dem Vorschätzwert und dem Codebuchschätzwert als Schätzwert für das Störgeräusch in dem aktuellen Zeitfenster.
  2. Verfahren nach Anspruch 1, wobei der Wert des Gesamtsignals und der Schätzwert für ein Störgeräusch jeweils spektrale Werte sind.
  3. Verfahren nach Anspruch 1 oder 2, wobei der Schätzwert für das Störgeräusch in dem aktuellen Zeitfenster mit dem Schätzwert aus dem vorausgehenden Zeitfenster geglättet (20, 21, 22) wird.
  4. Verfahren nach einem der vorhergehenden Ansprüche, wobei der Codebuchschätzwert vorübergehend auf Null gesetzt wird.
  5. Verfahren nach einem der vorhergehenden Ansprüche, das in mehreren Frequenzkanälen parallel angewendet wird.
  6. Verfahren zum Reduzieren von Störgeräusch durch Schätzen des Störgeräuschs entsprechend einem der vorausgehenden Ansprüche und Reduzieren des Störgeräusches gemäß dem Schätzwert.
  7. Verfahren zum Betreiben eines Hörgeräts, bei dem Störgeräusch gemäß Anspruch 6 reduziert wird.
  8. Vorrichtung zum Schätzen eines Störgeräusches mit – einer Eingangseinrichtung (11) zum Bereitstellen eines Werts für die Leistungsdichte eines Gesamtsignals, das ein Nutzsignal und das zu schätzende Störgeräusch enthält, in einem aktuellen Zeitfenster, – einer rekursiven Minimumschätzeinrichtung (17, 18, 19) zum Vergleichen des Werts des Gesamtsignals mit einem mit einem Verstärkungsfaktor multiplizierten Schätzwert eines Störgeräusches aus einem dem aktuellen Zeitfenster vorausgehenden Zeitfenster und zum Ausgeben des kleineren der beiden Werte des Vergleichs als Vorschätzwert für das Störgeräusch in dem aktuellen Zeitfenster, gekennzeichnet durch – eine Codebuchschätzeinrichtung zum Bereitstellen eines Codebuchschätzwerts für das Störgeräusch in dem aktuellen Zeitfenster und – eine Logikeinrichtung (27) zum Ermitteln des größeren Werts von dem Vorschätzwert und dem Codebuchschätzwert als Schätzwert für das Störgeräusch in dem aktuellen Zeitfenster.
  9. Hörvorrichtung, in die eine Vorrichtung nach Anspruch 8 zur Schätzung eines Störgeräuschs integriert ist.
  10. Hörvorrichtung nach Anspruch 9, die als Hörgerät ausgebildet ist.
DE102011004338A 2011-02-17 2011-02-17 Verfahren und Vorrichtung zum Schätzen eines Störgeräusches Active DE102011004338B3 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE102011004338A DE102011004338B3 (de) 2011-02-17 2011-02-17 Verfahren und Vorrichtung zum Schätzen eines Störgeräusches
EP12154134.6A EP2495724B1 (de) 2011-02-17 2012-02-07 Verfahren und Vorrichtung zum Schätzen eines Störgeräusches
DK12154134.6T DK2495724T3 (da) 2011-02-17 2012-02-07 Fremgangsmåde og apparat til vurdering af baggrundsstøj
US13/397,859 US8634581B2 (en) 2011-02-17 2012-02-16 Method and device for estimating interference noise, hearing device and hearing aid

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102011004338A DE102011004338B3 (de) 2011-02-17 2011-02-17 Verfahren und Vorrichtung zum Schätzen eines Störgeräusches

Publications (1)

Publication Number Publication Date
DE102011004338B3 true DE102011004338B3 (de) 2012-07-12

Family

ID=45655398

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102011004338A Active DE102011004338B3 (de) 2011-02-17 2011-02-17 Verfahren und Vorrichtung zum Schätzen eines Störgeräusches

Country Status (4)

Country Link
US (1) US8634581B2 (de)
EP (1) EP2495724B1 (de)
DE (1) DE102011004338B3 (de)
DK (1) DK2495724T3 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015201073A1 (de) * 2015-01-22 2016-07-28 Sivantos Pte. Ltd. Verfahren und Vorrichtung zur Rauschunterdrückung basierend auf Inter-Subband-Korrelation
EP3469586A4 (de) * 2016-06-13 2019-06-26 Med-El Elektromedizinische Geraete GmbH Rekursive rauschleistungsschätzung mit rauschmodellanpassung

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9763016B2 (en) * 2014-07-31 2017-09-12 Starkey Laboratories, Inc. Automatic directional switching algorithm for hearing aids
EP4362500A3 (de) * 2017-02-09 2024-07-03 Oticon A/s Hörgerät mit drahtloser kommunikation
CN113008361B (zh) * 2021-02-04 2023-08-15 国网湖南省电力有限公司 一种变电站站界噪声抗环境干扰检测方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008017550A1 (de) * 2008-04-07 2009-10-08 Siemens Medical Instruments Pte. Ltd. Mehrstufiges Schätzverfahren zur Störgeräuschreduktion und Hörvorrichtung

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602006005684D1 (de) * 2006-10-31 2009-04-23 Harman Becker Automotive Sys Modellbasierte Verbesserung von Sprachsignalen
US8385572B2 (en) * 2007-03-12 2013-02-26 Siemens Audiologische Technik Gmbh Method for reducing noise using trainable models
DE112007003674T5 (de) * 2007-10-02 2010-08-12 Akg Acoustics Gmbh Methode und Apparat zur Einkanal-Sprachverbesserung basierend auf einem latenzzeitreduzierten Gehörmodell

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008017550A1 (de) * 2008-04-07 2009-10-08 Siemens Medical Instruments Pte. Ltd. Mehrstufiges Schätzverfahren zur Störgeräuschreduktion und Hörvorrichtung

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Martin, R.: noise power spectral density estimation based on optimal smoothing and minimum statistics. In: IEEE Transactions on speech and audio processing, Band 9, 2001, Heft 5, 504 - 512. *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015201073A1 (de) * 2015-01-22 2016-07-28 Sivantos Pte. Ltd. Verfahren und Vorrichtung zur Rauschunterdrückung basierend auf Inter-Subband-Korrelation
US10051382B2 (en) 2015-01-22 2018-08-14 Sivantos Pte. Ltd. Method and apparatus for noise suppression based on inter-subband correlation
EP3469586A4 (de) * 2016-06-13 2019-06-26 Med-El Elektromedizinische Geraete GmbH Rekursive rauschleistungsschätzung mit rauschmodellanpassung
US10785581B2 (en) 2016-06-13 2020-09-22 Med-El Elektromedizinische Geraete Gmbh Recursive noise power estimation with noise model adaptation

Also Published As

Publication number Publication date
EP2495724A1 (de) 2012-09-05
DK2495724T3 (da) 2014-02-10
US8634581B2 (en) 2014-01-21
US20120213395A1 (en) 2012-08-23
EP2495724B1 (de) 2013-11-20

Similar Documents

Publication Publication Date Title
DE112009002617B4 (de) Wahlweises Schalten zwischen mehreren Mikrofonen
EP3451705B1 (de) Verfahren und vorrichtung zum schnellen erkennen der eigenen stimme
EP2372700A1 (de) Sprachverständlichkeitsprädikator und Anwendungen dafür
DE102008031150B3 (de) Verfahren zur Störgeräuschunterdrückung und zugehöriges Hörgerät
EP2603018A1 (de) Hörvorrichtung mit Sprecheraktivitätserkennung und Verfahren zum Betreiben einer Hörvorrichtung
DE102010026884B4 (de) Verfahren zum Betreiben einer Hörvorrichtung mit zweistufiger Transformation
DE102011004338B3 (de) Verfahren und Vorrichtung zum Schätzen eines Störgeräusches
EP2620940A1 (de) Verfahren und Hörvorrichtung zum Schätzen eines Bestandteils der eigenen Stimme
EP2797344B1 (de) Verfahren zur Steuerung einer Adaptionsschrittweite und Hörvorrichtung
CN106331969B (zh) 有噪声语音的增强方法、系统及助听器
DE102008017550A1 (de) Mehrstufiges Schätzverfahren zur Störgeräuschreduktion und Hörvorrichtung
EP3926982A2 (de) Verfahren zur richtungsabhängigen rauschunterdrückung für ein hörsystem, welches eine hörvorrichtung umfasst
EP1926087A1 (de) Anpassung einer Hörvorrichtung an ein Sprachsignal
EP2584795B1 (de) Verfahren zum Ermitteln einer Kompressionskennlinie
DE102010041435A1 (de) Verfahren zum Rekonstruieren eines Sprachsignals und Hörvorrichtung
EP2219389B1 (de) Vorrichtung und Verfahren zur Störgeräuschschätzung bei einer binauralen Hörgeräteversorgung
DE102013205790B4 (de) Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung
EP2635048B1 (de) Verstärken eines Sprachsignals in Abhängigkeit vom Eingangspegel
EP3048813B1 (de) Verfahren und vorrichtung zur rauschunterdrückung basierend auf inter-subband-korrelation
EP3534624B1 (de) Verfahren zum betrieb eines hörgerätes
Shanmugapriya et al. A thorough investigation on speech enhancement techniques for hearing aids
Martin Noise Reduction for Hearing Aids
EP1971186A2 (de) Verfahren zur Reduzierung von Störgeräuschen mit trainierbaren Modellen

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final

Effective date: 20121013

R082 Change of representative

Representative=s name: FDST PATENTANWAELTE FREIER DOERR STAMMLER TSCH, DE

R082 Change of representative

Representative=s name: FDST PATENTANWAELTE FREIER DOERR STAMMLER TSCH, DE

R081 Change of applicant/patentee

Owner name: SIVANTOS PTE. LTD., SG

Free format text: FORMER OWNER: SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SINGAPORE, SG

R082 Change of representative

Representative=s name: FDST PATENTANWAELTE FREIER DOERR STAMMLER TSCH, DE