DE102013205790B4 - Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung - Google Patents
Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung Download PDFInfo
- Publication number
- DE102013205790B4 DE102013205790B4 DE102013205790.3A DE102013205790A DE102013205790B4 DE 102013205790 B4 DE102013205790 B4 DE 102013205790B4 DE 102013205790 A DE102013205790 A DE 102013205790A DE 102013205790 B4 DE102013205790 B4 DE 102013205790B4
- Authority
- DE
- Germany
- Prior art keywords
- microphone
- signal
- signal vector
- vector
- coherence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 239000013598 vector Substances 0.000 claims abstract description 66
- 230000005236 sound signal Effects 0.000 claims abstract description 9
- 238000001914 filtration Methods 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims description 20
- 230000000903 blocking effect Effects 0.000 claims description 9
- 238000000926 separation method Methods 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 2
- 230000009467 reduction Effects 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 3
- 210000000988 bone and bone Anatomy 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 210000000613 ear canal Anatomy 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 208000032041 Hearing impaired Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 210000003454 tympanic membrane Anatomy 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/43—Electronic input selection or mixing based on input signal analysis, e.g. mixing or selection between microphone and telecoil or between microphones with different directivity characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/40—Arrangements for obtaining a desired directivity characteristic
- H04R25/407—Circuits for combining signals of a plurality of transducers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2460/00—Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
- H04R2460/01—Hearing devices using active noise cancellation
Landscapes
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Neurosurgery (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
- Die vorliegende Erfindung betrifft ein Verfahren zum Schätzen eines Nutzsignals einer Hörvorrichtung durch Gewinnen von mindestens zwei Mikrofonsignalen aus einem Schallsignal, Gewinnen eines Restsignals aus den Mikrofonsignalen, bei dem ein Anteil der Mikrofonsignale aus einer vorgebbaren Richtung blockiert ist, und Filtern der Mikrofonsignale mit einem Filter, wodurch eine Schätzung für das Nutzsignal erhalten wird. Darüber hinaus betrifft die vorliegende Erfindung eine Hörvorrichtung mit einer entsprechenden Mikrofoneinrichtung, Blockiereinrichtung und einem Filter. Unter einer Hörvorrichtung wird hier jedes im oder am Ohr tragbare, einen Schallreiz produzierende Gerät verstanden, insbesondere ein Hörgerät, ein Headset, Kopfhörer und dergleichen.
- Hörgeräte sind tragbare Hörvorrichtungen, die zur Versorgung von Schwerhörenden dienen. Um den zahlreichen individuellen Bedürfnissen entgegenzukommen, werden unterschiedliche Bauformen von Hörgeräten wie Hinter-dem-Ohr-Hörgeräte (HdO), Hörgerät mit externem Hörer (RIC: receiver in the canal) und In-dem-Ohr-Hörgeräte (IdO), z. B. auch Concha-Hörgeräte oder Kanal-Hörgeräte (ITE, CIC), bereitgestellt. Die beispielhaft aufgeführten Hörgeräte werden am Außenohr oder im Gehörgang getragen. Darüber hinaus stehen auf dem Markt aber auch Knochenleitungshörhilfen, implantierbare oder vibrotaktile Hörhilfen zur Verfügung. Dabei erfolgt die Stimulation des geschädigten Gehörs entweder mechanisch oder elektrisch.
- Hörgeräte besitzen prinzipiell als wesentliche Komponenten einen Eingangswandler, einen Verstärker und einen Ausgangswandler. Der Eingangswandler ist in der Regel ein Schallempfänger, z. B. ein Mikrofon, und/oder ein elektromagnetischer Empfänger, z. B. eine Induktionsspule. Der Ausgangswandler ist meist als elektroakustischer Wandler, z. B. Miniaturlautsprecher, oder als elektromechanischer Wandler, z. B. Knochenleitungshörer, realisiert. Der Verstärker ist üblicherweise in eine Signalverarbeitungseinheit integriert. Dieser prinzipielle Aufbau ist in
1 am Beispiel eines Hinter-dem-Ohr-Hörgeräts dargestellt. In ein Hörgerätegehäuse1 zum Tragen hinter dem Ohr sind ein oder mehrere Mikrofone2 zur Aufnahme des Schalls aus der Umgebung eingebaut. Eine Signalverarbeitungseinheit3 , die ebenfalls in das Hörgerätegehäuse1 integriert ist, verarbeitet die Mikrofonsignale und verstärkt sie. Das Ausgangssignal der Signalverarbeitungseinheit3 wird an einen Lautsprecher bzw. Hörer4 übertragen, der ein akustisches Signal ausgibt. Der Schall wird gegebenenfalls über einen Schallschlauch, der mit einer Otoplastik im Gehörgang fixiert ist, zum Trommelfell des Geräteträgers übertragen. Die Energieversorgung des Hörgeräts und insbesondere die der Signalverarbeitungseinheit3 erfolgt durch eine ebenfalls ins Hörgerätegehäuse1 integrierte Batterie5 . - Eine besondere Herausforderung bei der Nutzung eines Hörgeräts oder einer anderen Hörvorrichtung besteht in ihrem Einsatz in einem sogenannten Cafeteria-Szenario. Dabei unterhält sich der Träger des Hörgeräts oder der Hörvorrichtung mit einem Gesprächspartner. Die akustische Umgebung ist weiterhin geprägt durch andere sprechende Personen sowie durch undefiniertes Hintergrundgeräusch. In einem solchen Szenario ist es besonders schwierig, die Sprache des Gesprächspartners aus dem gesamten Schallsignal zu extrahieren, d. h. das tatsächliche Nutzsignal zu ermitteln bzw. zu schätzen. Das Störsignal bzw. Störgeräusch besteht hierbei in der Regel also aus Hintergrundrauschen und/oder Störsprachanteilen bzw. Interferenzen.
- Um mehrkanalige Störreduktionstechniken zu realisieren, müssen Statistikgrößen zweiter Ordnung (insbesondere spektrale Leistungsdichte PSD; Power Spectral Density) der Störgeräuschkomponenten geschätzt werden. Typischerweise werden diese Komponenten während der Zielsprachpausen geschätzt. Damit verlässliche Schätzungen nur während der Zielsprachpausen durchgeführt werden, müssen die Störkomponenten zeitlich ausreichend stationär sein, sodass die erhaltene Schätzung auch dann gültig ist, wenn der Zielsprecher nach einer gewissen Pause wieder aktiv ist. In der Realität sind die Störsignale jedoch nicht immer stationär. Daher sind wirkungsvolle Mehrkanal-Störreduktionstechniken in ihrer Anwendung begrenzt, da sie in Szenarien mit nicht stationären Signalen (z. B. sprachähnlichen Interferenzen) kaum ausführbar sind.
- Die Schätzung von Störgeräuschstatistikgrößen für mehrkanalige Störreduktionstechniken basiert typischerweise auf einer sogenannten Ziel-Sprachaktivitätsdetektion (VAD; Voice Activity Detection). Dies bedeutet, dass eine Schätzung der gesamten Störgeräusch-PSD-Matrix nur in Perioden möglich ist, in denen der Zielsprecher inaktiv ist. Wenn die Störgeräusch-PSD-Matrix nur während der Zielsprachpausen geschätzt werden kann, ist es wichtig, dass die PSD der Störgeräuschkomponenten sich über der Zeit nicht stark ändert, d. h. die Störgeräuschsignale müssen (zeitlich) hinreichend stationär sein. Der größte Nachteil dieser Strategie besteht daher darin, dass für (zeitlich) sehr instationäre Signale (z. B. sprachähnliche Interferenzen) die Schätzungen der Störgeräusch-PSD-Matrix, die nur während der Zielsprachpausen erhalten werden können, nicht verlässlich sind, da nicht angenommen werden kann, dass die während einer Sprachpause erhaltene Schätzung auch noch gültig ist, nachdem der Zielsprecher bereits wieder eine Zeit lang aktiv ist.
- Aus der Druckschrift
EP 2 395 506 B1 ist ein Verfahren zur Bestimmung einer Rausch- und Störsignalabschätzung in binauralen Mikrofonanordnungen bekannt, welches zur Separation zeitlich nicht-stationärer Signale, beispielsweise Sprache, dient. Bei der Abschätzung wir ein systematischer Fehler sowohl bei einem aktiven als auch bei einem inaktiven Sprachquellsignal reduziert. - Die Aufgabe der vorliegenden Erfindung besteht somit darin, ein Verfahren zum Schätzen eines Nutzsignals einer Hörvorrichtung bereitzustellen, das auch bei zeitlich nichtstationären Signalen, wie etwa bei Sprache, eingesetzt werden kann. Darüber hinaus soll eine entsprechende Hörvorrichtung bereitgestellt werden.
- Erfindungsgemäß wird diese Aufgabe gelöst durch ein Verfahren zum Schätzen eines Nutzsignals einer Hörvorrichtung durch
- – Gewinnen von mindestens zwei Mikrofonsignalen aus jeweils einem Schallsignal, wobei die Mikrofonsignale einen Mikrofonsignalvektor bilden,
- – Gewinnen eines Referenzsignalvektors aus dem Mikrofonsignalvektor, bei welchem Referenzsignalvektor ein Anteil der Mikrofonsignale aus einer vorgebbaren Richtung blockiert ist, und
- – Filtern des Mikrofonsignalvektors mit einem Filter, wodurch ein Schätzsignal für das Nutzsignal erhalten wird, sowie
- – Ermitteln einer Kohärenzgröße aus dem Referenzsignalvektor und dem Mikrofonsignalvektor,
- – Ermitteln einer Leistungsdichtegröße aus der Kohärenzgröße und
- – Parametrieren des Filters anhand der Leistungsdichtegröße.
- Darüber hinaus wird erfindungsgemäß bereitgestellt eine Hörvorrichtung mit
- – einer Mikrofoneinrichtung zum Gewinnen von mindestens zwei Mikrofonsignalen aus jeweils einem Schallsignal, wobei die Mikrofonsignale einen Mikrofonsignalvektor bilden,
- – einer Blockiereinrichtung zum Gewinnen eines Referenzsignalvektors aus dem Mikrofonsignalvektor, bei welchem Referenzsignalvektor ein Anteil der Mikrofonsignale aus einer vorgebbaren Richtung blockiert ist, und
- – einem Filter zum Filtern des Mikrofonsignalvektors, wodurch ein Schätzsignal für das Nutzsignal erhalten wird, sowie mit
- – einer Recheneinrichtung zum Ermitteln einer Kohärenzgröße aus dem Referenzsignalvektor und dem Mikrofonsignalvektor und zum Ermitteln einer Leistungsdichtegröße aus der Kohärenzgröße sowie zum Parametrieren des Filters anhand der Leistungsdichtegröße.
- Der Referenzsignalvektor kann auch eindimensional sein, d. h. aus einem einzigen Referenzsignal bestehen. In der Regel wird er aber aus mehreren Referenzsignalen bestehen.
- In vorteilhafter Weise wird also aus dem Referenzsignalvektor, d. h. aus Anteilen des Restsignals eine Kohärenzgröße und insbesondere eine Kohärenzmatrix gewonnen, aus der sich eine Leistungsdichtegröße, und insbesondere eine Leistungsdichtematrix, des Restsignals (d. h. der Störgeräuschanteile) ermitteln lässt. Mit dieser Leistungsdichtegröße wird das Filter parametrisiert, sodass aus den Mikrofonsignalen bzw. dem Mikrofonsignalvektor eine spezifische Nutzsignalquelle herausgefiltert bzw. geschätzt werden kann. Mit dem vorgeschlagenen Konzept können also auch spektrale Leistungsdichten von Störgeräuschkomponenten für zeitlich nicht stationäre Signale (z. B. Sprache) geschätzt werden, sodass mehrkanalige Störgeräuschreduktionstechniken in praktisch beliebigen Szenarien angewendet bzw. realisiert werden können.
- Vorzugsweise wird zum Gewinnen des Referenzsignalvektors die vorgebbare Richtung des Nutzsignals aus dem Mikrofonsignalvektor geschätzt. Damit ist es möglich, aus dem gesamten Einfallsraum des Schalls das Nutzsignal auszublenden.
- Insbesondere ist es von Vorteil, zum Gewinnen des Referenzsignalvektors einen direktionalen Blinde-Quellentrennungs-Algorithmus zu verwenden. Ein derartiger Blinde-Quellentrennung-Algorithmus hat sich in der Störgeräuschunterdrückung bewährt, und er ist aufgrund einer zuvor durchgeführten Quellenlokalisation sehr leistungsstark.
- Zum Gewinnen des Referenzsignalvektors können jeweils eine Nutzsignalkomponente jedes Mikrofonsignals untereinander angeglichen und anschließend voneinander subtrahiert werden. Dadurch lassen sich die Signalkanäle (je ein Kanal für ein Mikrofon bzw. ein Mikrofonsignal) wirksam von Ziel- bzw. Nutzsignalkomponenten befreien. Dabei ist es besonders günstig, wenn die Nutzsignalkomponenten sowohl hinsichtlich der Verzögerung als auch hinsichtlich ihrer Spektren aneinander angeglichen werden. Somit können die Nutzsignalkomponenten nahezu restlos aus den Signalkanälen entfernt werden.
- Zum Ermitteln der Leistungsdichtegröße und insbesondere der Leistungsdichtematrix des (mehrkanaligen) Restsignalvektors kann neben der Kohärenzgröße auch der Restsignalvektor selbst herangezogen werden. Damit kann für das Filter auf der Basis der Kohärenzgröße und des Referenzsignalvektors eine Steuerung anhand der Leistungsdichte bereitgestellt werden.
- Das Nutzsignal kann insbesondere ein Sprachsignal sein. Damit lässt sich das erfindungsgemäße Verfahren bzw. die erfindungsgemäße Hörvorrichtung insbesondere dafür nutzen, die Sprachverständlichkeit zu erhöhen.
- Des Weiteren kann der Referenzsignalvektor Sprachsignalanteile umfassen, die nicht Teil des Nutzsignals sind. Der Referenzsignalvektor beinhaltet beispielsweise Sprachanteile von Sprechern, die von dem Zielsprecher verschieden sind.
- Die oben geschilderten Verfahrensmerkmale können auch in den Einrichtungen der Hörvorrichtung umgesetzt werden, wodurch diese Einrichtungen die jeweilige Funktionalität erhalten.
- Die vorliegende Erfindung wird anhand der beigefügten Zeichnungen näher erläutert, in denen zeigen:
-
1 den prinzipiellen Aufbau einer Hörvorrichtung gemäß dem Stand der Technik und -
2 ein Blockschaltdiagramm zum erfindungsgemäßen Schätzen eines Nutzsignals. - Die nachfolgend näher geschilderten Ausführungsbeispiele stellen bevorzugte Ausführungsformen der vorliegenden Erfindung dar.
- Das in
2 dargestellte Blockdiagramm stellt zum einen ein Verfahren dar, welches in einem Hörgerät gemäß1 oder in einer anderen Hörvorrichtung implementiert werden kann. Zum anderen können die in2 dargestellten Blöcke entsprechende Einrichtungen einer Hörvorrichtung darstellen. - Eine beispielhafte Hörvorrichtung bzw. ein beispielhaftes Hörgerät umfasst eine Sensor- bzw. Mikrofonanordnung mit mindestens zwei Sensoren bzw. zwei Mikrofonen M1, Mp. Nachfolgend wird stellvertretend immer von Mikrofonen gesprochen.
- Jedes Mikrofon M1, Mp wandelt das jeweils anliegende Schallsignal in ein korrespondierendes Mikrofonsignal. Die Schallsignale sind Komponenten eines Schallfelds, welches die akustische Situation beispielsweise eines Hörgeräteträgers repräsentiert. Eine solche typische Situation wäre die eines „Cafeteria-Szenarios”, in welcher der Hörgeräteträger mit einem Gesprächspartner spricht, im Hintergrund eine oder mehrere andere Personen sprechen und sonstiges Hintergrundrauschen vorliegt. Es kann aber auch eine andere akustische Situation vorliegen, in der nichtstationäre Störgeräusche gegeben sind.
- Die Mikrofonsignale, die zusammen einen Mikrofonsignalvektor x bilden, werden jeweils in eigenen Kanälen weiterverarbeitet, d. h. in jedem Kanal wird ein Mikrofonsignal verarbeitet. In
2 ist diese mehrkanalige Verarbeitung durch dicke Pfeile dargestellt. Der Mikrofonsignalvektor x wird in dem mehrkanaligem System10 einer Quellenlokalisationseinheit LOC (source localisation) zugeführt. Diese gewinnt aus dem Mikrofonsignalvektor x Positionsdaten Φq einer Quelle Sq. Insbesondere wird die Positionsinformation Φq der Nutzsignalquelle Sq im dreidimensionalen Raum oder einfach nur als Winkel bzw. Winkel und Entfernung ermittelt. Diese Positionsinformation Φq wird als grobe Referenzinformation zum Erstellen einer Blockiermatrix BM genutzt. Mit Hilfe der Blockiermatrix BM werden aus den Mikrofonsignalen bzw. dem Mikrofonsignalvektor x diejenigen Anteile räumlich ausgeblendet, die aus dem räumlichen Bereich der Nutzsignalquelle stammen. Eine derartige Blockiermatrix BM kann beispielsweise auf einem direktionalen Blinde-Quellentrennungs-Algorithmus beruhen, wie er in Y. Zheng, K. Reindl, and W. Kellermann „BSS for improved interference estimation for blind speech signal extraction with two microphones,” in IEEE International Workshop an Computational Advances in Multi-Sensor Adaptive Processing (CAMSAP) Aruba, Dutch Antilles, Dez. 2009 beschrieben ist. Es können aber auch beliebige andere Algorithmen zur Ermittlung der Blockiermatrix BM eingesetzt werden. - Aus dem Mikrofonsignalvektor x ergibt sich durch Anwendung der Blockiermatrix BM damit ein mehrkanaliges Referenzsignal bzw. ein Referenzsignalvektor n. Werden die Signale beispielsweise paarweise in der Blockiermatrix subtrahiert, so kann die Anzahl der Signale des mehrdimensionalen Referenzsignalvektors n der Hälfte der Anzahl der Mikrofonsignale bzw. -kanäle entsprechen. Bei ungerader Anzahl der Mikrofonsignale wird vorzugsweise aufgerundet. Der Referenzsignalvektor ist also in der Regel ein mehrdimensionaler Vektor aus mehreren Einzelsignalen.
- Der Referenzsignalvektor n wird zusammen mit dem Mikrofonsignalvektor x, der aus den einzelnen Mikrofonsignalen besteht, einer Kohärenzschätzeinheit COH zugeführt. Diese schätzt aus den beiden Vektoren n und x eine Kohärenzmatrix P. Die Kohärenzmatrix P wird einer PSD-Schätzeinheit PSD zugeführt. Die PSD-Schätzeinheit schätzt aus der Kohärenzmatrix P und dem Referenzvektor n eine mehrdimensionale Leistungsdichteschätzgröße S wie beispielsweise beschrieben in I. McCowan and H. Bourlard, „Microphone array post-filter for diffuse noise field,” in IEEE Int. conf. Acoustics, Speech, Signal Processing (ICASSP), 2002, Seiten 905–908 oder in K. Reindl., Y. Zheng, A. Schwarz, S. Meier, R. Maas, A. Sehr, and W. Kellermann, „A stereophonic acoustic signal extraction scheme for noise and reverberant environments,” Computer Speech and Language, 2012.
- Ein mehrkanaliges Filter FILT schätzt aus der Leistungsdichteschätzgröße S Filterparameter. Diese werden im Filter FILT auf die Mikrofonsignale bzw. auf den Mikrofonsignalvektor x angewandt, wodurch sich das Schätzsignal
s ~q - Somit kann vor allem eine Schätzung einer Störkomponenten betreffenden nichtstationären Statistikgröße zweiter Ordnung mittels PSD erreicht werden, indem die Kohärenz der entsprechenden Störkomponenten genutzt wird. Dabei können insbesondere die Zielsprachkomponenten zunächst in allen Kanälen gleichgesetzt werden (Verzögerungskompensation sowie spektrale Angleichung), sodass nahezu identische Zielsprachkomponenten in den verfügbaren Kanälen enthalten sind. Zu dieser Angleichung kann ein direktionaler Blinde-Quellentrennungs-Algorithmus der oben genannten Art verwendet werden. Aus den resultierenden Signalen können, wie oben im Detail dargstellt wurde, die Störsignalkohärenzmatrix geschätzt werden, welche ihrerseits zur Schätzung der Stör-PSD-Matrix S eingesetzt wird. Zur Schätzung des Nutzsignals bedarf es erfindungsgemäß also keiner Einschränkungen der zeitlichen Signalcharakteristiken. Im Gegensatz zu bekannten und typischerweise eingesetzten Konzepten, die nur bei hinreichend (zeitlich) stationären Störgeräuschsignalen anwendbar sind, nutzt die vorliegende Erfindung, dass das jeweilige akustische Szenario räumlich stationär ist, um die Störgeräusch-PSD-Matrix zu schätzen. Dabei kann angenommen werden, dass die räumliche Domäne für beliebige Szenarien hinreichend stationär ist im Gegensatz zur zeitlichen Domäne. Dies liegt daran, dass die Änderungen der Kohärenzfunktion hauptsächlich von den räumlichen Eigenschaften abhängen, d. h. von der geometrischen Anordnung der Quellen und Objekte in der akustischen Szene. Die Änderungen der Kohärenzfunktion hängen hingegen nur wenig von den zeitlichen Eigenschaften der Signale ab.
- Zusammenfassend bedeutet dies also, dass das erfindungsgemäße Verfahren bzw. die erfindungsgemäße Hörvorrichtung nicht auf spezielle Szenarien beschränkt ist, die sich auf zeitlich stationäre Störgeräusche beziehen. Dementsprechend macht das erfindungsgemäße Konzept leistungsstarke, mehrkanalige Störreduktionstechniken für beliebige Szenarien, in denen Störgeräuschunterdrückung notwendig ist, einsetzbar oder realisierbar. Ein wesentlicher Bestandteil der Erfindung basiert also auf der Erkenntnis, die Schätzung der räumlichen Kohärenz von Störsignalen von der Schätzung der zeitlichen Statistikgrößen zweiter Ordnung (PSD der Störgeräuschkomponenten) zu trennen. Dabei können die Raum-Zeit-Kohärenzmatrizen auch für Szenarien mit (zeitlich) instationären Sprachsignalen kontinuierlich geschätzt werden.
- In einem konkreten Beispiel kann als Filter ein mehrkanaliges Wiener-Filter eingesetzt werden. Prinzipiell kann aber auch ein einkanaliges Filter Verwendung finden. Ein derartiges Filtern lässt sich beispielsweise bei der Störgeräuschunterdrückung in einem binauralen Hörgerät einsetzen.
- Die PSD-Störgeräuschschätzung zusammen mit dem mehrkanaligen Wiener-Filter kann im Verbund mit einer Polyphasenfilterbank implementiert werden, wie sie typischerweise in Hörgeräten eingesetzt wird. Das erfindungsgemäße Konzept kann auf der Grundlage einer in SIR/SINR-Verstärkung (signal to interference ratio/signal to interference and noise ratio) realisiert werden. Darüber hinaus wird für die Berechnung beispielsweise ein ideales Blinde-Quellentrennung-Schema angenommen, d. h. die Zielsprachkomponenten sind in allen verfügbaren Kanälen in etwa die gleichen. Darüber hinaus kann im konkreten Fall eine ideale blockbasierte Sprachaktivitätsdetektion (VAD) verwendet werden, um die Störgeräuschkohärenzmatrix zu schätzen.
- In Experimenten konnte gezeigt werden, dass gegebenenfalls mehrere Interferenz- bzw. Sprachsignale deutlich reduziert werden können (SIR mindestens 10 dB). Auch wenn zusätzliches (diffuses) Hintergrundgeplapper vorhanden war, konnte ein SINR von 8 dB erreicht werden. Dabei waren Verarbeitungsartefakte (Störung der einzelnen Signale) nicht hörbar.
Claims (10)
- Verfahren zum Schätzen eines Nutzsignals einer Hörvorrichtung durch – Gewinnen von mindestens zwei Mikrofonsignalen aus jeweils einem Schallsignal, wobei die Mikrofonsignale einen Mikrofonsignalvektor (x) bilden, – Gewinnen eines Referenzsignalvektors (n) aus dem Mikrofonsignalvektor (x), bei welchem Referenzsignalvektor (n) ein Anteil der Mikrofonsignale aus einer vorgebbaren Richtung blockiert ist, und – Filtern des Mikrofonsignalvektors (x) mit einem Filter (FILT), wodurch ein Schätzsignal
(s ~q) - Verfahren nach Anspruch 1, wobei zum Gewinnen des Referenzsignalvektors (n) die vorgebbare Richtung des Nutzsignals aus dem Mikrofonsignalvektor (x) geschätzt wird.
- Verfahren nach Anspruch 2, wobei das Gewinnen des Referenzsignalvektors (n) durch einen direktionalen Blinde-Quellentrennungs-Algorithmus erfolgt.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei zum Gewinnen des Referenzsignalvektors (n) jeweils eine Nutzsignalkomponente jedes Mikrofonsignals untereinander angeglichen und anschließend voneinander subtrahiert werden.
- Verfahren nach Anspruch 4, wobei die Nutzsignalkomponenten sowohl hinsichtlich der Verzögerung als auch hinsichtlich ihrer Spektren aneinander angeglichen werden.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei die Kohärenzgröße (Γ) eine Kohärenzmatrix ist.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei zum Ermitteln der Leistungsdichtegröße (S) auch der Referenzsignalvektor (n) herangezogen wird.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei das Nutzsignal ein Sprachsignal ist.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei der Referenzsignalvektor (n) Sprachsignalanteile umfasst, die nicht Teil des Nutzsignals sind.
- Hörvorrichtung mit – einer Mikrofoneinrichtung (M1, ..., Mp) zum Gewinnen von mindestens zwei Mikrofonsignalen aus jeweils einem Schallsignal, wobei die Mikrofonsignale einen Mikrofonsignalvektor (x) bilden. – einer Blockiereinrichtung zum Gewinnen eines Referenzsignalvektors (n) aus dem Mikrofonsignalvektor (x), bei dem ein Anteil der Mikrofonsignale aus einer vorgebbaren Richtung blockiert ist, und – einem Filter (FILT) zum Filtern des Mikrofonsignalvektors (x), wodurch ein Schätzsignal
(s ~q)
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102013205790.3A DE102013205790B4 (de) | 2013-04-02 | 2013-04-02 | Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung |
PCT/IB2014/059290 WO2014162214A1 (de) | 2013-04-02 | 2014-02-27 | Verfahren zum schätzen eines nutzsignals und hörvorrichtung |
EP14710644.7A EP2982136B1 (de) | 2013-04-02 | 2014-02-27 | Verfahren zum schätzen eines nutzsignals und hörvorrichtung |
DK14710644.7T DK2982136T3 (da) | 2013-04-02 | 2014-02-27 | Fremgangsmåde til evaluering af et ønsket signal og høreindretning |
US14/873,396 US9736599B2 (en) | 2013-04-02 | 2015-10-02 | Method for evaluating a useful signal and audio device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102013205790.3A DE102013205790B4 (de) | 2013-04-02 | 2013-04-02 | Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung |
Publications (2)
Publication Number | Publication Date |
---|---|
DE102013205790A1 DE102013205790A1 (de) | 2014-10-02 |
DE102013205790B4 true DE102013205790B4 (de) | 2017-07-06 |
Family
ID=50288202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102013205790.3A Active DE102013205790B4 (de) | 2013-04-02 | 2013-04-02 | Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung |
Country Status (5)
Country | Link |
---|---|
US (1) | US9736599B2 (de) |
EP (1) | EP2982136B1 (de) |
DE (1) | DE102013205790B4 (de) |
DK (1) | DK2982136T3 (de) |
WO (1) | WO2014162214A1 (de) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102013205790B4 (de) | 2013-04-02 | 2017-07-06 | Sivantos Pte. Ltd. | Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung |
CN113380266B (zh) * | 2021-05-28 | 2022-06-28 | 中国电子科技集团公司第三研究所 | 一种微型双麦克风语音增强方法及微型双麦克风 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2395506B1 (de) * | 2010-06-09 | 2012-08-22 | Siemens Medical Instruments Pte. Ltd. | Verfahren und Schallsignalverarbeitungssystem zur Unterdrückung von Interferenzen und Rauschen in binauralen Mikrofonkonfigurationen |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100856246B1 (ko) * | 2007-02-07 | 2008-09-03 | 삼성전자주식회사 | 실제 잡음 환경의 특성을 반영한 빔포밍 장치 및 방법 |
DE602008002695D1 (de) * | 2008-01-17 | 2010-11-04 | Harman Becker Automotive Sys | Postfilter für einen Strahlformer in der Sprachverarbeitung |
EP2196988B1 (de) * | 2008-12-12 | 2012-09-05 | Nuance Communications, Inc. | Bestimmung der Kohärenz von Audiosignalen |
DK3190587T3 (en) | 2012-08-24 | 2019-01-21 | Oticon As | Noise estimation for noise reduction and echo suppression in personal communication |
DE102013205790B4 (de) | 2013-04-02 | 2017-07-06 | Sivantos Pte. Ltd. | Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung |
-
2013
- 2013-04-02 DE DE102013205790.3A patent/DE102013205790B4/de active Active
-
2014
- 2014-02-27 EP EP14710644.7A patent/EP2982136B1/de not_active Revoked
- 2014-02-27 WO PCT/IB2014/059290 patent/WO2014162214A1/de active Application Filing
- 2014-02-27 DK DK14710644.7T patent/DK2982136T3/da active
-
2015
- 2015-10-02 US US14/873,396 patent/US9736599B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2395506B1 (de) * | 2010-06-09 | 2012-08-22 | Siemens Medical Instruments Pte. Ltd. | Verfahren und Schallsignalverarbeitungssystem zur Unterdrückung von Interferenzen und Rauschen in binauralen Mikrofonkonfigurationen |
Non-Patent Citations (3)
Title |
---|
McCowan, I. A.; Bourlard, H.: Microphone array post-filter for diffuse noise field. In: IEEE Int. conf. Acoustics, Speech, Signal Processing (ICASSP), 2002, S. 905-908. * |
Reindl, K. [et al.]: A stereophonic acoustic signal extraction scheme for noise and reverberant environments. In: Computer Speech and Language, 2012, S. 727-745. * |
Zheng, Y.; Reindl, K; Kellermann, W.: BSS for improved interference estimation for blind speech signal extraction with two microphones. In: IEEE International Workshop on Computational Advances in Multi-Sensor Adaptive Processing (CAMSAP) Aruba, Dutch Antilles, Dez. 2009, S. 253-256. * |
Also Published As
Publication number | Publication date |
---|---|
EP2982136A1 (de) | 2016-02-10 |
DE102013205790A1 (de) | 2014-10-02 |
US9736599B2 (en) | 2017-08-15 |
EP2982136B1 (de) | 2018-06-13 |
DK2982136T3 (da) | 2018-09-24 |
WO2014162214A1 (de) | 2014-10-09 |
US20160029130A1 (en) | 2016-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3451705B1 (de) | Verfahren und vorrichtung zum schnellen erkennen der eigenen stimme | |
EP2603018B1 (de) | Hörvorrichtung mit Sprecheraktivitätserkennung und Verfahren zum Betreiben einer Hörvorrichtung | |
DE102012200745B4 (de) | Verfahren und Hörvorrichtung zum Schätzen eines Bestandteils der eigenen Stimme | |
EP2537351B1 (de) | Verfahren zur binauralen seitenwahrnehmung für hörinstrumente | |
EP2645743B1 (de) | Hörvorrichtung für eine binaurale Versorgung und Verfahren zum Bereitstellen einer binauralen Versorgung | |
DE102010026884B4 (de) | Verfahren zum Betreiben einer Hörvorrichtung mit zweistufiger Transformation | |
EP2545717A1 (de) | Enthallen von signalen einer binauralen hörvorrichtung | |
DE102010026381A1 (de) | Verfahren zum Lokalisieren einer Audioquelle und mehrkanaliges Hörsystem | |
EP3926982A2 (de) | Verfahren zur richtungsabhängigen rauschunterdrückung für ein hörsystem, welches eine hörvorrichtung umfasst | |
EP2226795A1 (de) | Hörvorrichtung und Verfahren zum Reduzieren eines Störgeräuschs für eine Hörvorrichtung | |
EP2595414B1 (de) | Hörvorrichtung mit einer Einrichtung zum Verringern eines Mikrofonrauschens und Verfahren zum Verringern eines Mikrofonrauschens | |
EP2981099B1 (de) | Verfahren und vorrichtung zur rückkopplungsunterdrückung | |
DE102008017550A1 (de) | Mehrstufiges Schätzverfahren zur Störgeräuschreduktion und Hörvorrichtung | |
EP2495724B1 (de) | Verfahren und Vorrichtung zum Schätzen eines Störgeräusches | |
DE102008046040B4 (de) | Verfahren zum Betrieb einer Hörvorrichtung mit Richtwirkung und zugehörige Hörvorrichtung | |
DE102013205790B4 (de) | Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung | |
DE102007008739A1 (de) | Hörvorrichtung mit Störsignaltrennung und entsprechendes Verfahren | |
DE102014218672B3 (de) | Verfahren und Vorrichtung zur Rückkopplungsunterdrückung | |
EP1926087A1 (de) | Anpassung einer Hörvorrichtung an ein Sprachsignal | |
EP2658289B1 (de) | Verfahren zum Steuern einer Richtcharakteristik und Hörsystem | |
DE102013207161B4 (de) | Verfahren zur Nutzsignalanpassung in binauralen Hörhilfesystemen | |
DE102010011729A1 (de) | Hörvorrichtung und Verfahren zum Einstellen derselben für einen rückkopplungsfreien Betrieb | |
EP2219389B1 (de) | Vorrichtung und Verfahren zur Störgeräuschschätzung bei einer binauralen Hörgeräteversorgung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R012 | Request for examination validly filed | ||
R016 | Response to examination communication | ||
R082 | Change of representative |
Representative=s name: MAIER, DANIEL OLIVER, DIPL.-ING. UNIV., DE |
|
R081 | Change of applicant/patentee |
Owner name: SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SG Free format text: FORMER OWNER: SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SINGAPORE, SG Effective date: 20130507 Owner name: SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SG Free format text: FORMER OWNER: FRIEDRICH-ALEXANDER-UNIVERSITAET, SIEMENS MEDICAL INSTRUMENTS PTE, , SG Effective date: 20141119 Owner name: SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SG Free format text: FORMER OWNERS: FRIEDRICH-ALEXANDER-UNIVERSITAET ERLANGEN - NUERNBERG, 91054 ERLANGEN, DE; SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SINGAPORE, SG Effective date: 20141119 Owner name: SIVANTOS PTE. LTD., SG Free format text: FORMER OWNERS: FRIEDRICH-ALEXANDER-UNIVERSITAET ERLANGEN - NUERNBERG, 91054 ERLANGEN, DE; SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SINGAPORE, SG Effective date: 20141119 Owner name: SIVANTOS PTE. LTD., SG Free format text: FORMER OWNER: SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SINGAPORE, SG Effective date: 20130507 |
|
R082 | Change of representative |
Representative=s name: MAIER, DANIEL OLIVER, DIPL.-ING. UNIV., DE Effective date: 20141119 Representative=s name: FDST PATENTANWAELTE FREIER DOERR STAMMLER TSCH, DE Effective date: 20141119 |
|
R082 | Change of representative |
Representative=s name: FDST PATENTANWAELTE FREIER DOERR STAMMLER TSCH, DE |
|
R082 | Change of representative |
Representative=s name: FDST PATENTANWAELTE FREIER DOERR STAMMLER TSCH, DE |
|
R081 | Change of applicant/patentee |
Owner name: SIVANTOS PTE. LTD., SG Free format text: FORMER OWNER: SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SINGAPORE, SG |
|
R082 | Change of representative |
Representative=s name: FDST PATENTANWAELTE FREIER DOERR STAMMLER TSCH, DE |
|
R018 | Grant decision by examination section/examining division | ||
R020 | Patent grant now final |