EP4158901B1 - Verfahren, vorrichtung, kopfhörer und computerprogramm zur aktiven unterdrückung des okklusionseffektes bei der wiedergabe von audiosignalen - Google Patents
Verfahren, vorrichtung, kopfhörer und computerprogramm zur aktiven unterdrückung des okklusionseffektes bei der wiedergabe von audiosignalenInfo
- Publication number
- EP4158901B1 EP4158901B1 EP21729292.9A EP21729292A EP4158901B1 EP 4158901 B1 EP4158901 B1 EP 4158901B1 EP 21729292 A EP21729292 A EP 21729292A EP 4158901 B1 EP4158901 B1 EP 4158901B1
- Authority
- EP
- European Patent Office
- Prior art keywords
- voice
- microphone
- component
- captured
- voice signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1091—Details not provided for in groups H04R1/1008 - H04R1/1083
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1781—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
- G10K11/17821—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
- G10K11/17827—Desired external signals, e.g. pass-through audio such as music or speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1785—Methods, e.g. algorithms; Devices
- G10K11/17853—Methods, e.g. algorithms; Devices of the filter
- G10K11/17854—Methods, e.g. algorithms; Devices of the filter the filter being an adaptive filter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1016—Earpieces of the intra-aural type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers
- H04R3/005—Circuits for transducers for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/10—Applications
- G10K2210/108—Communication systems, e.g. where useful sound is kept and noise is cancelled
- G10K2210/1081—Earphones, e.g. for telephones, ear protectors or headsets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R2460/00—Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
- H04R2460/05—Electronic compensation of the occlusion effect
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Electric hearing aids
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
- H04R25/505—Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
Definitions
- various in-ear headphones and headsets already feature a "sidetone” or “hear-through” function.
- sidetone With the “sidetone” technology, it is possible to hear your own voice, for example, during a telephone call conducted with such headphones or headsets.
- a microphone records a voice signal that allows clear speech reproduction, but spatial and binaural information is lost.
- the "hear-through” technology makes it possible to perceive your surroundings and, for example, to have a conversation without having to remove the headphones.
- One or more external microphones are used for each side of the headphones, which preserves spatial information from your own voice; however, the signal contains unwanted ambient noise.
- the EP 3 213 527 B1 as well as the US 2014/126 735 A1 specify systems for reducing the occlusion effect in ANC headphones and headsets.
- external sound in the form of an externally occurring sound signal is detected using at least one external microphone of the headphones or hearing aid.
- a voice signal is detected using at least one additional microphone.
- the dry portion of the detected voice signal is estimated, wherein the dry portion of the detected voice signal is the portion of the detected voice signal without reverberation or ambient noise caused by the surrounding space.
- the binaural voice signals are filtered before being output via a loudspeaker for a left and right pair of headphones or a left and right hearing aid.
- the dry voice component at the outer microphone is estimated by filtering with the respective relative impulse response between the mouth microphone or microphone array and the outer microphone and then averaging.
- the filter for extracting or generating the voice component based on the detected external sound and the estimated dry voice is preferably a Wiener filter, an adaptive filter or a filter that simulates a room impulse response.
- the estimated dry portion of the detected voice signal and the extracted or generated voice portion are linearly weighted and then added.
- a digital filter is additionally provided to which the extracted or generated voice component is fed before being output via the loudspeaker.
- the invention also relates to a headset which is configured to carry out the method according to the invention or has a device according to the invention.
- the invention can be used to suppress the occlusion effect when playing audio signals with any headphones or hearing aids, such as telephony or communication with communication headsets/hearables, so-called in-ear monitoring for checking one's own voice during a live performance, augmented/virtual reality applications or use with hearing aids.
- any headphones or hearing aids such as telephony or communication with communication headsets/hearables, so-called in-ear monitoring for checking one's own voice during a live performance, augmented/virtual reality applications or use with hearing aids.
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Otolaryngology (AREA)
- Neurosurgery (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Headphones And Earphones (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
- Die vorliegende Erfindung betrifft ein Verfahren zur aktiven Unterdrückung des Okklusionseffektes bei der Wiedergabe von Audiosignalen mit einem Kopfhörer oder Hörgerät. Die vorliegende Erfindung betrifft weiterhin eine Vorrichtung zur Durchführung des Verfahrens. Ferner betrifft die Erfindung einen Kopfhörer, der eingerichtet ist, ein erfindungsgemäßes Verfahren auszuführen oder eine erfindungsgemäße Vorrichtung aufweist sowie ein Computerprogramm mit Instruktionen, die einen Computer zur Ausführung der Schritte des Verfahrens veranlassen.
- Die dumpfe und unnatürliche Wahrnehmung der eigenen Stimme beim Tragen von Kopfhörern, Hörgeräten oder Headsets wird von den Trägern solcher Geräte als störend empfunden. Dieser Effekt, bekannt als Verschlusseffekt oder Okklusionseffekt, tritt auf, wenn der Ohrkanal des Trägers eines solchen Kopfhörers oder Hörgerätes durch das Gerät teilweise oder vollständig verschlossen wird. Besonders ausgeprägt ist der Okklusionseffekt daher auch bei sogenannten Im-Ohr-("In-Ear") -Geräten, bei denen der Kopfhörer oder die Hörhilfe in den Öffnungsbereich des Gehörgangs eingeführt ist und an dessen Innenwand anliegt. Die dumpfe Wahrnehmung der eigenen Stimme beruht hierbei einerseits darauf, dass die hochfrequenten Anteile der durch den Luftschall übertragenen eigenen Stimme aufgrund des den Ohrkanal verschließenden Kopfhörers oder Hörgerätes deutlich abgeschwächt werden. Andererseits werden vornehmlich die tieffrequenten Anteile der eigenen Stimme auch durch Körperschall, insbesondere über eine Schallübertragung der Knorpel oder Knochen des Kopfes, in den Gehörgang übertragen und können aufgrund des Verschlusses dem Gehörkanal nicht oder nur teilweise entweichen, sodass es sogar zu einer Verstärkung der tieffrequenten Anteile kommt
- Verfahren zur Kompensation des Okklusionseffekts durch eine Korrektur der Luft- und der Körperschall-Anteile in leisen Umgebungen sind bekannt. Diese beinhalten eine Dämpfung der Körperschallanteile über einen rückgekoppelten Regelkreis basierend auf einem Mikrofon-Signal, das Schallsignale aus dem Gehörgang wiederspiegelt und mit einem inneren Mikrofon aufgenommen wird. Die Luftschallanteile werden durch ein äußeres Mikrofon aufgezeichnet, gefiltert und über einen inneren Lautsprecher wiedergegeben, um eine akustisch transparente Empfindung der von außen auftreffenden Schallsignale zu erzeugen.
- Der Luftschallanteil beinhaltet jedoch neben der eigenen Stimme auch Störschall aus der Umgebung. Da aktuelle technische Lösungen in Umgebungen mit einem hohen Störgeräuschpegel bisher versagen, sind Maßnahmen, die eine möglichst natürliche Wahrnehmung der eigenen Stimme auch unter solchen Bedingungen ermöglichen, Gegenstand aktueller Forschung.
- Weiterhin verfügen verschiedene In-Ear-Kopfhörer und Headsets bereits über eine "Sidetone"- oder "Hear-through"-Funktion. Beim "Sidetone"-Verfahren ist es möglich, die eigene Stimme beispielsweise während eines Telefonanrufs, welcher mit einem solchen Kopfhörer bzw. Headset durchgeführt wird, zu hören. Hierzu wird mit einem Mikrofon ein Sprachsignal aufgezeichnet, dass zwar eine klare Sprachwiedergabe ermöglicht, allerdings gehen dabei räumliche und binaurale Informationen verloren. Das "Hear-through"-Verfahren ermöglicht, die Umgebung wahrzunehmen und sich beispielsweise unterhalten zu können, ohne die Kopfhörer entfernen zu müssen. Es werden hierfür pro Kopfhörerseite ein oder mehrere äußere Mikrofone verwendet, wodurch räumliche Informationen der eigenen Stimme erhalten bleiben, das Signal enthält in diesem Fall jedoch ungewünschte Umgebungsgeräusche.
- Die
EP 2 920 980 A1 offenbart ein System zur Verbesserung der Wahrnehmung der eigenen Stimme welches ein Ohrkanalmikrofon und ein äußeres Mikrofon umfasst. Aus den Mikrofonsignalen werden eine Schätzung des Umgebungsschalls sowie eine Schätzung der eigenen Stimme gewonnen, welche mit variablen Verstärkungsfaktoren addiert werden. - Die
EP 3 213 527 B1 sowie dieUS 2014/126 735 A1 geben Systeme zur Reduzierung des Okklusionseffekts in ANC Kopfhörern und Headsets an. - Ein Kopfhörer, der zunächst in einem "Noise Cancelling"-Modus arbeitet und dann auf einen "Hear-through"-Modus umschaltet, sobald eine Sprechaktivitätserkennung feststellt, dass sich der Benutzer in einem Anruf befindet, wird in der
EP 3 188 495 A1 beschrieben. Ähnlich beschreibt auch dieEP 2 362 678 A1 ein Kommunikationsheadset mit einer Umschaltfunktion zwischen einem Transparenz- und einem Kommunikationsmodus. Weiterhin werden in der digitale Audiosignalverarbeitungstechniken beschrieben, die verwendet werden, um eine akustische Transparenzfunktion in einem Kopfhörer bereitzustellen. Hierbei wird eine Mehrzahl akustischer Pfade, für verschiedene Nutzer oder Kunstköpfe berücksichtigt, um ein Transparenzfilter zu bestimmen, welches für die meisten Nutzer gute Ergebnisse liefert.US 10,034,092 B1 - Es ist eine Aufgabe der Erfindung, ein Verfahren und eine Vorrichtung zur aktiven Unterdrückung des Okklusionseffektes bei der Wiedergabe von Audiosignalen mit einem Kopfhörer oder Hörgerät in Umgebungen mit einem hohen Störgeräuschpegel, sowie einen entsprechenden Kopfhörer und ein Computerprogramm zur Ausführung des Verfahrens zur Verfügung zu stellen.
- Diese Aufgabe wird durch ein Verfahren mit den Merkmalen des Anspruchs 1, eine entsprechende Vorrichtung gemäß Anspruch 8, sowie einen entsprechenden Kopfhörer gemäß Anspruch 10 gelöst. Bevorzugte Ausgestaltungen der Erfindung sind Gegenstand der abhängigen Ansprüche.
- Bei dem erfindungsgemäßen Verfahren zur aktiven Unterdrückung des Okklusionseffektes bei der Wiedergabe von Audiosignalen mit einem Kopfhörer oder Hörgerät wird mit mindestens einem äußeren Mikrofon des Kopfhörers oder Hörgeräts Außenschall in Form eines von außen auftretendes Schallsignal erfasst. Ein Stimmsignal wird mit mindestens einem zusätzlichen Mikrofon erfasst. Der trockene Anteil des erfassten Stimmsignals wird geschätzt, wobei der trockene Anteil des erfassten Stimmsignals der Anteil des erfassten Stimmsignals ohne durch den umgebenden Raum verursachten Nachhall oder Umgebungsgeräusche ist. Aus dem mit dem mindestens einen äußeren Mikrofon erfassten Außenschall wird ein Stimmanteil durch ein Filter extrahiert, wobei Filterkoeffizienten des Filters basierend auf dem geschätzten trockenen Anteil des erfassten Stimmsignals ermittelt werden, oder der geschätzte trockene Anteil des erfassten Stimmsignals wird so gefiltert, dass ein Stimmanteil erzeugt wird, der eine vergleichbare Räumlichkeit zu dem Stimmanteil an den äußeren Mikrofonen aufweist. Der extrahierte oder erzeugte Stimmanteil wird über einen Lautsprecher des Kopfhörers oder Hörgeräts ausgegeben.
- Auf diese Weise erfolgt eine natürlichere und ungestörte Wahrnehmung der eigenen Stimme. Dieses führt zu einem signifikanten Komfortgewinn, der nicht nur zu einer erhöhten Akzeptanz von solchen Kopfhörern bzw. Hörgeräten führt, sondern auch die Möglichkeit für neuartige Nutzererfahrungen bei der Verwendung dieser Produkte eröffnet.
- Gemäß einer Ausführungsform der Erfindung wird das Stimmsignal mit mindestens einem auf den Mund des Nutzers gerichtetem Mikrofon oder Mikrofonarray und/oder einem inneren Mikrofon des Kopfhörers oder Hörgeräts erfasst Sowohl ein solches Mundmikrofon als auch die inneren Mikrofone bieten, entweder durch ihre Richtcharakteristik, durch ihre räumliche Nähe oder durch die Abschirmung, ein sehr gutes Signal-zu-Rausch-Verhältnis. Insbesondere wird ein monauraler trockener Anteil aus dem erfassten Stimmsignal geschätzt, wobei basierend darauf binaurale Stimmsignale aus den Signalen mindestens zweier äußerer Mikrofone eines linken und rechten Kopfhörers oder linken und rechten Hörgeräts extrahiert werden. Alternativ kann der geschätzte monaurale trockene Stimmanteil auch so gefiltert werden, dass binaurale Stimmsignale mit einer vergleichbaren Räumlichkeit zu dem Stimmanteil an den äußeren Mikrofonen erzeugt werden.
- Damit werden die Vorteile des "Sidetone"- sowie des "Hearthrough"-Verfahrens kombiniert, so dass räumliche und binaurale Informationen bei der Wiedergabe der Schallsignale erhalten bleiben und gleichzeitig ungewünschte Umgebungsgeräusche unterdrückt werden.
- Gemäß einer Ausführungsform der Erfindung werden die binauralen Stimmsignale vor der jeweiligen Ausgabe über einen Lautsprecher für einen linken und rechten Kopfhörer oder ein linkes und rechtes Hörgerät gefiltert.
- Vorteilhafterweise erfolgt die Schätzung des trockenen Stimmanteils am äußeren Mikrofon durch eine Filterung mit der jeweiligen relativen Impulsantwort zwischen dem Mundmikrofon oder Mikrofonarray und dem äußeren Mikrofon und einer anschließenden Durchschnittsbildung.
- Weiterhin ist das Filter zur Extraktion oder Erzeugung des Stimmanteils basierend auf dem erfassten Außenschall und der geschätzten trockenen Stimme vorzugsweise ein Wiener-Filter, ein adaptives Filter oder ein Filter, welches eine Raumimpulsantwort nachbildet.
- Gemäß einer weiteren Ausführungsform der Erfindung werden der geschätzte trockene Anteil des erfassten Stimmsignals und der extrahierte oder erzeugte Stimmanteil linear gewichtet und dann addiert.
- Entsprechend umfasst eine erfindungsgemäße Vorrichtung zur aktiven Unterdrückung des Okklusionseffektes bei der Wiedergabe von Audiosignalen über einen Lautsprecher eines mit mindestens einem äußeren Mikrofon versehenen Kopfhörers oder Hörgeräts,
- mindestens ein zusätzliches Mikrofon zur Erfassung eines Stimmsignals eines Nutzers;
- einen digitalen Signalprozessor, der eingerichtet ist, um
- den trockenen Anteil eines mit dem mindestens einen zusätzlichen Mikrofon erfassten Stimmsignals zu schätzen, wobei der trockene Anteil des erfassten Stimmsignals der Anteil des erfassten Stimmsignals ohne durch den umgebenden Raum verursachten Nachhall oder Umgebungsgeräusche ist;
- aus dem mit dem mindestens einen äußeren Mikrofon erfassten Außenschall den Stimmanteil mit einem Filter zu extrahieren, wobei Filterkoeffizienten des Filters basierend auf dem geschätzten trockenen Anteil des erfassten Stimmsignals ermittelt werden, oder den geschätzten trockenen Anteil des erfassten Stimmsignals so filtert, dass ein Stimmanteil erzeugt wird, der eine vergleichbare Räumlichkeit zu dem Stimmanteil an den äußeren Mikrofonen aufweist; und
- den extrahierten oder erzeugten Stimmanteil über den Lautsprecher auszugeben.
- Gemäß einer Ausführungsform der Erfindung ist zusätzlich ein digitales Filter vorgesehen, dem der extrahierte oder erzeugte Stimmanteil vor der Ausgabe über den Lautsprecher zugeführt wird.
- Die Erfindung betrifft auch einen Kopfhörer, der eingerichtet ist, das erfindungsgemäße Verfahren auszuführen oder eine erfindungsgemäße Vorrichtung aufweist.
- Weitere Merkmale der vorliegenden Erfindung werden aus der nachfolgenden Beschreibung und den Ansprüchen in Verbindung mit den Figuren ersichtlich.
- Fig. 1
- zeigt schematisch einen In-Ohr-Kopfhörer mit Verschluss des Ohrkanals eines Nutzers;
- Fig. 2
- zeigt ein Ablaufdiagramm des erfindungsgemäßen Verfahrens zur aktiven Unterdrückung des Okklusionseffektes;
- Fig. 3
- zeigt ein Blockdiagramm einer ersten Ausführungsform eines erfindungsgemäßen Kopfhörers;
- Fig. 4
- zeigt ein Blockdiagramm einer zweiten Ausführungsform eines erfindungsgemäßen Kopfhörers; und
- Fig. 5
- zeigt schematisch ein Kommunikationsheadset zur Durchführung des erfindungsgemäßen Verfahrens.
- Zum besseren Verständnis der Prinzipien der vorliegenden Erfindung werden nachfolgend Ausführungsformen der Erfindung anhand der Figuren detaillierter erläutert. Es versteht sich, dass sich die Erfindung nicht auf diese Ausführungsformen beschränkt und dass die beschriebenen Merkmale auch kombiniert oder modifiziert werden können, ohne den Schutzbereich der Erfindung, wie er in den Ansprüchen definiert ist, zu verlassen.
- Das erfindungsgemäße Verfahren kann beispielsweise zur Reduzierung des Okklusionseffektes bei In-Ohr-Kopfhörern, wie in
Figur 1 schematisch dargestellt, eingesetzt werden. Der In-Ohr-Kopfhörer 10 befindet sich hierbei am Ohr eines Nutzers, wobei ein Ohreinsatz 14 des In-Ohr-Kopfhörers im äußeren Gehörgang 15 eingebracht ist, um diesen an Ort und Stelle zu halten. Durch den Ohreinsatz wird, je nach individuellem Sitz im Gehörgang und Material, der Gehörgang zu einem gewissen Grad abgedichtet. Dieses führt dazu, dass äußere Störgeräusche zumindest teilweise abgeschirmt werden, sodass diese Störgeräusche dann nur mit einem verringerten Pegel zum Trommelfell 16 des Nutzers gelangen. Damit wird einerseits eine Musikwiedergabe über den Kopfhörer oder die Wiedergabe der Stimme eines Anrufers bei einem mittels des Kopfhörers erfolgenden Telefonat weniger gestört. Andererseits wird durch den Ohreinsatz aber auch die Stimme des Nutzers gedämpft und führt so zu dem bereits oben erwähnten Okklusionseffekt. - Ein aus der Umgebung auf den Kopfhörer eintreffendes Störschallsignal x(t), das insbesondere die Stimme des Nutzers, aber ebenso auch Umgebungsgeräusche enthalten kann, wird mit einem äußeren Mikrofon 11, das vom Gehörgang weg in Richtung des Kopfhörerumfelds gerichtet ist, erfasst. Weiterhin weist der In-Ohr-Kopfhörer 10 ein inneres Mikrofon 12, das auf den Gehörgang 15 in Richtung des Ohrkanals bzw. Trommelfells des Nutzers gerichtet ist und einen Lautsprecher 13, der sich in der Nähe des inneren Mikrofons 12 befindet, auf. Mittels des Lautsprechers 13 kann ein Kompensationssignal u(t) ausgegeben werden, mit dem der Okklusionseffekt möglichst umfassend unterdrückt, zumindest aber reduziert, wird, so dass dem Nutzer idealerweise der Eindruck vermittelt wird, dass er keinen Kopfhörer tragen würde.
- Mit Hilfe des äußeren Mikrofons 11 werden hierbei die Luftschallanteile des Störschallsignals erfasst und hierfür ein Kompensationssignal erzeugt. Zusätzlich erfasst das innere Mikrofon 12 ein Restsignal e(t) nach einer Überlagerung von dem durch den Sekundärpfad S(s) gefilterten Kompensationssignal u(t) mit dem durch den Primärpfad P(s) gefilterten Störschallsignal x(t) und ermöglicht insbesondere, auch einen Körperschallanteil zu erfassen und bei dem Kompensationssignal zu berücksichtigen. Der akustische Primärpfad P (s) beschreibt hierbei die Übertragungsfunktion für die akustische Übertragung vom äußeren Mikrofon 11 zum inneren Mikrofon 12, und kann beispielsweise mit einem externen Lautsprecheraufbau gemessen werden. Der akustische Sekundärpfad S (s) beschreibt die Übertragungsfunktion von dem internen Lautsprecher 13 zum inneren Mikrofon 12 und kann unter Verwendung dieses Lautsprechers und inneren Mikrofons gemessen werden.
- Der dargestellte In-Ohr-Kopfhörer weist lediglich ein äußeres Mikrofon auf, ebenso können aber auch mehrere Mikrofone, die in einem Mikrofon-Array angeordnet sind, zum Einsatz kommen. Weiterhin kann der Okklusionseffekt auch bei anderen Kopfhörern, wie beispielsweise Bügelkopfhörern mit ohrumschließenden Ohrpolstern, die durch eine geschlossene Bauweise den Gehörgang verschließen, oder Hörgeräten auftreten und, wie im Folgenden beschrieben, kompensiert werden.
-
Figur 2 zeigt schematisch das Grundkonzept für ein Verfahren zur aktiven Unterdrückung des Okklusionseffektes, wie es beispielsweise bei der Wiedergabe von Audiosignalen mit einem In-Ohr-Kopfhörer ausFigur 1 durchgeführt werden kann. Hierbei wird in einem ersten Schritt 20 mit mindestens einem äußeren Mikrofon 11 des Kopfhörers oder Hörgeräts der Außenschall erfasst. Dieser erfasste Außenschall umfasst auch einen akustischen Stimmanteil, der von einer Sprachausgabe des Nutzers, welcher den Kopfhörer trägt, herrührt In einem darauffolgenden Schritt 21 wird ein Stimmsignal, das der Sprachausgabe des Nutzers entspricht, mit mindestens einem zusätzlichen Mikrofon, beispielsweise mit einem auf den Mund des Nutzers gerichtetes Mikrofon eines Kommunikationsheadsets, im Folgenden auch kurz als Mundmikrofon bezeichnet, erfasst. - Daraufhin wird in Schritt 22 der trockene Anteil des mit dem zusätzlichen Mikrofon erfassten Stimmsignals geschätzt. Wie dem Fachmann bekannt ist, wird unter einem trocken aufgenommenen Audiosignal ein reines Schallsignal verstanden, wie es ursprünglich bei der Erzeugung vorliegt, das heißt mit keinerlei Nachhall durch Reflexionen der erzeugten Schallwellen in einem geschlossenen Raum oder in einem natürlich begrenzten Bereich sowie frei von ambienten, akustischen Störungen. Es wird in diesem Schritt also das Stimmsignal geschätzt, wie es unmittelbar durch den Vokaltrakt des Nutzers erzeugt worden ist.
- Basierend auf dem geschätzten trockenen Anteil des erfassten Stimmsignals wird im darauffolgenden Schritt 23 für das Mikrofonsignal des jeweiligen äußeren Mikrofons das enthaltene binaurale Stimmsignal geschätzt und mit einem Filter extrahiert, wobei Filterkoeffizienten des Filters basierend auf dem geschätzten trockenen Anteil des erfassten Stimmsignals ermittelt werden. Alternativ kann das geschätzte trockene Stimmsignal auch so gefiltert werden, dass es eine vergleichbare Räumlichkeit zu dem Stimmanteil an den äußeren Mikrofonen aufweist. Der extrahierte oder erzeugte binaurale Stimmanteil wird dann in Schritt 24 über den entsprechenden Lautsprecher des Kopfhörers oder Hörgeräts ausgegeben, wobei zuvor mittels eines Vorwärts- ("Feedforward") -Filters das Signal so angepasst wird, dass eine akustisch möglichst transparente Wiedergabe der Stimmsignale möglich ist
-
Figur 3 zeigt ein Blockdiagramm einer erfindungsgemäßen Vorrichtung, die insbesondere in einem Kopfhörer, ebenso aber auch in einem Hörgerät, implementiert sein kann. Obwohl üblicherweise bei Kopfhörern oder Hörgeräten Schallwandler für beide Ohren des Nutzers vorgesehen sind, ist in der Figur zur Erhöhung der Übersichtlichkeit lediglich der konzeptuelle Aufbau bezogen auf ein Ohr dargestellt. Ebenso sind für eine digitale Signalverarbeitung zwar Analog-Digital-Wandler zur Digitalisierung der mit den Mikrofonen erfassten Schallsignale und Digital-Analog-Wandler zur Wandlung der verarbeiteten Signale für eine Ausgabe über den Lautsprecher erforderlich, zur Vereinfachung in der Figur aber nicht wiedergegeben. Aufgrund der digitalen Signalverarbeitung werden die Signale im Folgenden im Zeitbereich mit einem diskreten Zeitindex n betrachtet, der Index z steht entsprechend für eine Frequenzbereichsdarstellung der zeitdiskreten Signale und Filter. - Wie bereits im Zusammenhang mit
Figur 1 erwähnt, ist neben dem Lautsprecher 13 ein äußeres Mikrofon 11 sowie ein inneres Mikrofon 12 vorgesehen, die jeweils in einem Ohrhörer oder einer Kopfhörermuschel angeordnet sein können. Das äußere Mikrofon 11, welches das Signal x(n) liefert, ist hierbei an der Außenseite des Kopfhörers angebracht Der Lautsprecher 13 und das innere Mikrofon 12 dagegen sind im Inneren des Kopfhörers angeordnet und in Richtung Trommelfell gerichtet. - Weiterhin ist ein Mundmikrofon 17 vorgesehen. Dieses kann beispielsweise Teil eines Kommunikationsheadsets sein und an einem schwenkbaren Bügel angebracht sein, um vor dem Mund des Nutzers angeordnet und auf den Mund ausgerichtet zu werden. Ebenso kann aber auch ein aus mehreren Mikrofonen bestehendes Mikrofon-Array vorgesehen sein, dass an der Außenseite des Kopfhörers bzw. Hörgerätes angeordnet ist und beispielsweise durch ein Beam-Forming-Verfahren auf den Mund ausgerichtet wird. Neben dem Primärpfad P(z), der die akustische Übertragung vom äußeren Mikrofon zum inneren Mikrofon bezeichnet und dem Sekundärpfad S(z) für die Übertragung vom Lautsprecher zum inneren Mikrofon ist hierbei auch der Übertragungspfad B(z) zwischen dem Mundmikrofon und dem externen Referenzmikrofon vermerkt, der beispielsweise bei einem Kommunikationsheadset durch die vordefinierte Position des Schwenkmikrofons vor dem Mund relativ zur Position des äußeren Mikrofons gegeben ist. Die Übertragungspfade enthalten hierbei auch den Einfluss weiterer Komponenten, wie beispielsweise der nicht dargestellten Analog-Digital-Wandler und Digital-Analog-Wandler.
- Erfolgt durch den Nutzer des Kopfhörers bzw. Hörgerätes eine Sprachausgabe, so wird ein dieser Sprachausgabe entsprechendes Stimmsignal xv(n) durch das äußere Mikrofon 11 erfasst Das erfasste Stimmsignal xv(n) beinhaltet hierbei die Raumimpulsantwort, die alle relevante Informationen über die aktuellen akustischen Raumeigenschaften enthält Zusätzlich zu diesem Stimmsignal wird durch das äußere Mikrofon 11 jedoch auch ein durch Umgebungsgeräusche verursachtes Störsignal xa(n) erfasst, da das äußere Mikrofon 11 an der Außenseite des Kopfhörers angebracht ist Das aus diesen beiden Signalanteilen bestehende Audiosignal x(n) wird dann wie im Folgenden beschrieben basierend auf einer Schätzung des trockenen Stimmsignals verarbeitet, um durch eine Ausgabe der verarbeiteten Sprachsignale u(n) über den Lautsprecher 13 des Kopfhörers oder Hörgerätes eine akustische Transparenz für die eigene Stimme zu erzielen. Hierbei wird das Stimmsignal, das von außen auf den Kopfhörer trifft, sowohl über den Primärpfad P (z) vom äußeren zum inneren Mikrofon als auch über den Sekundärpfad S(z) in Form des Signals übertragen, das aktiv über den Lautsprecher 13 ausgegeben wird. Auf diese Weise wird der fehlende Luftschall-Anteil der eigenen Stimme wieder hinzugefügt. Eine akustische Interferenz der über diese beiden Pfade übertragenen Schallsignale führt dann zu der akustischen Transparenz für das Stimmsignal.
- In dem dargestellten Ausführungsbeispiel wird sowohl das durch das Mundmikrofon 17 gemessene Stimmsignal v(n) als auch das Fehlersignal e(n) des inneren Mikrofons einer Schätzeinheit 30 zugeführt, in der das reine, trockene Stimmsignal ṽ(n), wie es im Vokaltrakt erzeugt wird und ohne durch den umgebenden Raum verursachten Nachhall sowie frei von ambienten akustischen Störungen vorliegen würde; geschätzt wird. Anhand dieser monauralen Schätzung v̂(n) wird durch eine zweite Schätzeinheit 31 das binaurale Stimmsignal aus dem mit dem äußeren Mikrofon des linken bzw. rechten Kopfhörers erfassten Signal extrahiert. Alternativ kann das geschätzte trockene Stimmsignal auch so gefiltert werden, dass es eine vergleichbare Räumlichkeit zu dem Stimmanteil an den äußeren Mikrofonen aufweist. Die binauralen Stimmsignale xv(n) werden dann durch eine digitale Filtereinheit 32 mit negierter Übertragungsfunktion gefiltert und schließlich als Lautsprechersignal u(n) einem Schallwandler zur Ausgabe über den Kopfhörer zugeführt. Die digitale Filtereinheit 32 ist hierbei insbesondere als Vorwärtsfilter ("Feed-Forward-Filter") ausgestaltet.
- Für die Schätzung des trockenen Stimmsignals ṽ(n) in der Schätzeinheit 30 kann durch ein Mundmikrofon 17, das Stimmsignal v(n) gemessen und dann als Sprachreferenz genutzt werden. Die Schätzung des trockenen Stimmanteils am äußeren Mikrofon kann beispielsweise durch eine Filterung der zusätzlichen Signale mit der jeweiligen relativen Impulsantwort zwischen dem zusätzlichen Mikrofon und dem äußeren Mikrofon und einer anschließenden Durchschnittsbildung erfolgen. Hierfür kann das Mundmikrofonsignal v(n) beispielsweise durch eine Schätzung B̂(n) des relativen Übertragungspfades B(z) zwischen dem Mundmikrofon und den äußeren Mikrofonen gefiltert werden. Das Stimmsignal v(n) wird dabei als monaurale Quelle betrachtet, welches dann aber für beide Kopfhörer bzw. Ohren genutzt wird.
- Ebenso kann durch das innere Mikrofon 12 ein Fehlersignal e(n) erfasst werden, dass ebenfalls für die Schätzung des trockenen Stimmsignals ṽ(n) genutzt und hierfür der Schätzeinheit 30 zugeführt werden kann. Da das Ohr durch den Kopfhörer verschlossen ist, koppelt die eigene Stimme über den Körper stark in den Gehörgang ein, so dass mittels der Mikrofonsignale des inneren Mikrofons ebenfalls Informationen über die eigene Stimme gewonnen werden können. Das Fehlersignal e(n) umfasst eine auf dem Stimmsignal beruhende Fehlerkomponente ev(n) und eine weitere Fehlerkomponente eb(n), die auf weiteren Störungen wie beispielsweise über den Körper des Nutzers in den Gehörgang übertragenen Trittschall beruht. Hierbei werden für jedes der beiden Kopfhörer bzw. Ohren separate Fehlersignale erzeugt. Diese können sich beispielsweise dann unterscheiden, wenn sich die Passung der Kopfhörer unterscheidet. Die separaten Fehlersignale können aber gegebenenfalls auch gemittelt werden, um wieder ein monaurales Signal zu erhalten.
- Die Signale des Mundmikrofons sowie der inneren Mikrofone lassen sich beispielsweise durch eine digitale Filterung angleichen und durch eine anschließende Mittelung kombinieren, um das Signal-zu-Rausch-Verhältnis weiter zu verbessern. Dabei gilt es zu beachten, dass die über die Kopfhörerlautsprecher abgespielten Signale jeweils mit einer Schätzung des jeweiligen Sekundärpfades gefaltet und von dem jeweiligen inneren Mikrofonsignal abgezogen werden, um eine Signalrückkopplung zu unterbinden.
- Da die inneren Mikrofone hauptsächlich den Körperschallanteil der eigenen Stimme aufzeichnen, welcher keine Aufschlüsselung beispielsweise von Frikativen erlaubt, ist weiterhin eine Bandbreitenerweiterung der Signale der inneren Mikrofone denkbar.
- Da sowohl das Mundmikrofon als auch die inneren Mikrofone ein gutes Signal-zu-Rausch-Verhältnis bieten, kann es auch vorgesehen werden, anstatt einer Schätzung basierend auf einer Kombination von Signalen der beiden Mikrofone eine Schätzung lediglich basierend auf den mit dem Mundmikrofon gemessenen Signal oder dem Signal des inneren Mikrofons durchzuführen. Schließlich können diese bei besonders günstigen Verhältnissen bereits eine trockene Referenz der Stimme liefern, ohne dass eine zusätzliche Schätzung erfolgen muss.
- In der zweiten Schätzeinheit 31 wird das binaurale Stimmsignal geschätzt, indem basierend auf der Schätzung der trockenen Stimme die binaurale Stimme aus den, durch ambiente Geräusche gestörten, Signalen der äußeren Mikrofonsignale extrahiert, oder ein Stimmsignal, welches eine vergleichbare Räumlichkeit zu dem Stimmanteil an den äußeren Mikrofonen aufweisen, erzeugt werden kann. Wichtig dabei ist, dass die Prozessierung eine kurze und konstante Verzögerung aufweist, sodass die Verzögerung für die Berechnung des Vorwärtsfilters W(z) berücksichtigt werden kann.
- Hierfür kann beispielsweise auf ein Wiener-Filter oder andere Algorithmen zur Störgeräuschunterdrückung zurückgegriffen werden. Bei dem Wiener-Filter werden die Magnituden-Spektren der erfassten Signale ausgewertet, um mit einer Schätzung des Sprachsignals und einer Schätzung des vorliegenden Störsignals einen Filter zu berechnen, mit dem das Sprachsignal optimal extrahiert werden kann. So kann zum Beispiel das Magnituden-Spektrum des Mundmikrofons mit dem Magnituden-Spektrum der inneren Mikrofone kombiniert werden, um damit das Magnituden-Spektrum des trockenen Stimmsignals zu schätzen und dann den Sprachanteil aus den Signalen der äußeren Mikrofone zu extrahieren. Hierbei kann die Übertragungsfunktion B(z) genutzt werden, um zu schätzen, wie die trockene Stimme vom Mundmikrofon am äußeren Mikrofon ankommt, um damit dann die Laufzeiten des Direktschalls zu kompensieren.
- Da bei einem Kommunikationsheadset die Übertragungsfunktion B(z) auch für verschiedene Personen sehr ähnlich ist, kann die Impulsantwort beispielsweise durch eine Messreihe für ein bestimmtes Headset bestimmt werden und dann im Anschluss für Anwendungen von Headsets dieser Bauform genutzt werden.
- Eine Möglichkeit bietet eine Wiener-Filterung in einer "Filterbank-Equalizer" Struktur. Diese Struktur setzt ein Prototyptiefpassfilter voraus, welches eine konstante Gruppenlaufzeit besitzt. Die Spektralen gewichte des Wiener-Filters setzen eine Schätzung des Nutz- und des Störsignals voraus. Für die Schätzung des Nutzsignalanteils kann die Schätzung der trockenen Stimme benutzt werden.
- Alternativ lässt sich ein adaptives Filter a(n) zur Schätzung der binauralen Stimme nutzen. Unter der Annahme, dass sich das äußere Mikrofonsignal x(n)=xa(n)+xv(n) zusammensetzt aus ambienten Geräuschen xa (n) und einem Stimmanteil xv(n), welcher kohärent zu der Schätzung v̂(n) der trockenen Stimme ist, kann ein adaptives Filter genutzt werden um den Stimmanteil xv(n) in x(n) basierend auf v̂(n) zu reproduzieren. Mit dem Ausgang
des adaptiven Filters lässt sich eine Vorschrift zur Anpassung des adaptiven Filters basierend auf der folgenden Kostenfunktion finden: - Des Weiteren, kann die Schätzeinheit 31 den akustischen Einfluss des Raumes auf die eigene Stimme analysieren und basierend darauf ein Filter auswählen oder entwerfen, welches auf das geschätzte trockene Stimmsignal angewandt werden kann, um ein Stimmsignal zu erzeugen, welches eine vergleichbare Räumlichkeit zu dem Stimmanteil an den äußeren Mikrofonen aufweist.
- Das Vorwärtsfilter W(z) kann beispielsweise durch das Lösen der Wiener-Hopf Gleichung
bestimmt werden. Dazu werden eine oder mehrere Messungen des Primärpfades P(z) und des Sekundärpfades S(z) benötigt. Diese Messungen können z.B. an einem Kunstkopf oder an Probanden durchgeführt werden. Wichtig hierbei ist, dass jegliche Verzögerung durch die Prozessierung in dem Zweig zwischen dem jeweiligen äußeren Mikrofon und dem Kopfhörerlautsprecher durch den, für die Berechnung des Vorwärtsfilters benutzten, Sekundärpfad berücksichtigt wird. Werden also beispielsweise das Signal x(n) oder jegliche daraus abgeleiteten Signale, welche anschließend über den Lautsprecher abgespielt werden, bei der Schätzung der binauralen Stimme verzögert, so muss diese Verzögerung durch den Sekundärpfad berücksichtigt werden. Dies wird in der obenstehenden Wiener-Hopf Gleichung durch einen Apostroph gekennzeichnet. - Das gewünschte Übertragungsverhalten vom äußeren zum inneren Mikrofon, welches sich für die natürliche Wahrnehmung der eigenen Stimme üblicherweise durch einen flachen Magnitudengang auszeichnet, wird durch H(z) im z-Bereich oder durch die Impulsantwort h(n) beschrieben und wird ebenfalls für die Wiener-Hopf Gleichung benötigt.
-
Figur 4 zeigt ein Blockdiagramm einer weiteren erfindungsgemäßen Vorrichtung. Zusätzlich zu den Einheiten der erfindungsgemäßen Vorrichtung ausFigur 3 sind hier noch eine Steuerungseinheit 40 zur Ansteuerung zweier Gewichtungseinheiten 41 und 42 vorgesehen. Da in dem dargestellten Fall v̂(n) und xv(n) kohärent sind, d.h. im Zeitbereich nicht oder zumindest nicht merklich gegeneinander verschoben sind, können beide Signale mit linearen Gewichtungsfaktoren α und 1-α, mit 0≤α≤1 gewichtet werden und dann addiert werden. Die Gewichtungseinheiten 41 und 42 ermöglichen hiermit dem Nutzer eine Personalisierung der Mischung aus trockener und binauraler Stimme. Der Nutzer kann damit selbst entscheiden und einstellen, wie er seine Stimme wahrnimmt, beispielsweise in welchem Verhältnis die Lautstärke des Nachhalls zur Lautstärke seiner eigenen Stimme sein soll. Ebenso kann die Steuerung aber auch automatisch erfolgen. - Wie oben beschrieben, ist eine Folge des Okklusionseffekts, dass die tiefen Frequenzanteile der eigenen Stimme verstärkt werden. Um dieses zu kompensieren, kann zusätzlich mit einem rückgekoppelten Regler das innere Mikrofonsignal so gefiltert werden, dass die tiefen Frequenzanteile der eigenen Stimme reduziert werden. Auf diese Weise erscheint die Wahrnehmung der eigenen Stimme bei Tragen eines Kopfhörers dann noch natürlicher.
- Die Schätzeinheiten 30 und 31 sowie die Steuerungseinheit 40 können hierbei Teil einer Prozessoreinheit sein, die einen oder mehrere digitale Signalprozessoren aufweist, aber auch anders geartete Prozessoren oder Kombinationen daraus beinhalten kann. Weiterhin können durch den digitalen Signalprozessor die Filterkoeffizienten des digitalen Filters 32 angepasst werden. Das Filter kann als zeitinvariantes Filter implementiert werden, das einmalig berechnet, auf die Firmware des Kopfhörers aufgespielt und in dieser Form genutzt wird, ohne dass zur Laufzeit Änderungen vorgenommen werden. Ein adaptives Filter, welches sich zur Laufzeit ändert und den aktuell vorliegenden Umständen anpasst, kann ebenfalls eingesetzt werden.
- Die erfindungsgemäße Vorrichtung ist vorzugsweise vollständig in einem Kopfhörer integriert, da die Latenz aufgrund der Übertragung der eigenen Stimme durch den Körperschall sehr gering ist. Hierbei kann auch das Mundmikrofon Teil des Kopfhörers sein, beispielsweise bei einem sogenannten Kommunikations-Headset befestigt an einem vor dem Mund anzubringen Bügel oder als Mikrofon-Array mit Richtcharakteristik integriert in einer Kopfmuschel. Ebenso kann aber auch ein separates Mikrofon als Mundmikrofon dienen. Grundsätzlich können Teile der Vorrichtung aber auch Bestandteil eines externen Gerätes, wie z.B. eines Smartphones, sein.
-
Figur 5 zeigt schematisch die Verwendung eines Kommunikationsheadset, in dem das erfindungsgemäße Verfahren durchgeführt werden kann und welches hierfür die oben beschriebene Vorrichtung aufweist. Für die beiden Ohren des Nutzers ist hierbei jeweils ein Kopfhörer 10 vorgesehen, in den jeweils ein äußeres Mikrofon 11, ein inneres Mikrofon 12 und ein Lautsprecher 13 integriert sind. Weiterhin ist ein Mundmikrofon 17 vorgesehen, dass an einem schwenkbaren Bügel angebracht ist Weiterhin ist eine Prozessoreinheit 50 in einem der beiden Kopfhörer angeordnet, durch den die Schätzeinheiten sowie ggfs. die Steuerungseinheit 40 umgesetzt werden. Die einzelnen Komponenten sind hierbei mit der Prozessoreinheit 50 verbunden, dieses ist in der Figur zur Erhöhung der Übersichtlichkeit aber nicht dargestellt. - Die Erfindung kann für eine Unterdrückung des Okklusionseffektes bei der Wiedergabe von Audiosignalen mit beliebigen Kopfhörern oder Hörhilfen eingesetzt werden, wie beispielsweise der Telefonie bzw. Kommunikation mit Kommunikationsheadsets/Hearables, dem sogenannten In-Ear-Monitoring zur Überprüfung der eigenen Stimme bei einem Live-Auftritt, Augmented/Virtual Reality-Anwendungen oder dem Einsatz bei Hörgeräten.
-
- 10
- Einzelner Kopfhörer, Einzelnes Hörgerät
- 11
- Äußeres Mikrofon
- 12
- Inneres Mikrofon
- 13
- Lautsprecher
- 14
- Ohreinsatz
- 15
- Gehörgang,
- 16
- Trommelfell
- 17
- Mundmikrofon
- 20 - 24
- Verfahrensschritte
- 30
- Erste Schätzeinheit
- 31
- Zweite Schätzeinheit
- 32
- digitales Vorwärtsfilter
- 40
- Steuerungseinheit
- 41, 42
- Gewichtungseinheit
- 50
- Prozessoreinheit
Claims (10)
- Verfahren zur aktiven Unterdrückung des Okklusionseffektes bei der Wiedergabe von Audiosignalen mit einem Kopfhörer (10) oder Hörgerät, bei dem- mit mindestens einem äußeren Mikrofon (11) des Kopfhörers oder Hörgeräts Außenschall in Form eines von außen auftretenden Schallsignals erfasst (20) wird;- ein Stimmsignal mit mindestens einem zusätzlichen Mikrofon (12, 17) erfasst (21) wird;- der trockene Anteil des erfassten Stimmsignals geschätzt (22) wird, wobei der trockene Anteil des erfassten Stimmsignals der Anteil des erfassten Stimmsignals ist, welcher weder einen durch den umgebenden Raum verursachten Nachhall noch Umgebungsgeräusche aufweist;- aus dem mit dem mindestens einen äußeren Mikrofon erfassten Außenschall ein Stimmanteil durch ein Filter extrahiert wird, wobei Filterkoeffizienten des Filters basierend auf dem geschätzten trockenen Anteil des erfassten Stimmsignals ermittelt (23) werden, oder der akustische Einfluss des Raumes auf die eigene Stimme basierend auf dem trockenen Anteil des erfassten Stimmsignals und dem mit dem mindestens einen äußeren Mikrofon erfassten Außenschall analysiert wird und basierend darauf der geschätzte trockene Anteil des erfassten Stimmsignals so gefiltert wird, dass ein Stimmanteil erzeugt (23) wird, der eine vergleichbare Räumlichkeit zu dem Stimmanteil an dem mindestens einen äußeren Mikrofon aufweist; und- der extrahierte oder erzeugte Stimmanteil über einen Lautsprecher des Kopfhörers oder Hörgeräts ausgegeben (24) wird.
- Verfahren nach Anspruch 1, wobei das mindestens eine zusätzliche Mikrofon, mit dem das Stimmsignal erfasst (21) wird, mindestens ein auf den Mund des Nutzers gerichtetes Mikrofon oder Mikrofonarray (17) und/oder ein inneres Mikrofon des Kopfhörers oder Hörgeräts umfasst.
- Verfahren nach Anspruch 2, wobei ein monauraler trockener Anteil aus dem erfassten Stimmsignal geschätzt wird und basierend darauf binaurale Stimmsignale aus den Signalen mindestens zweier äußerer Mikrofone eines linken und rechten Kopfhörers oder linken und rechten Hörgeräts extrahiert werden, oder der geschätzte monaurale trockene Stimmanteil so gefiltert wird, dass binaurale Stimmsignale mit einer vergleichbaren Räumlichkeit zu dem Stimmanteil an den äußeren Mikrofonen erzeugt werden.
- Verfahren nach Anspruch 3, wobei die binauralen Stimmsignale vor der jeweiligen Ausgabe über einen Lautsprecher (13) für einen linken und rechten Kopfhörer oder ein linkes und rechtes Hörgerät gefiltert werden.
- Verfahren nach einem der Ansprüche 2 bis 4, wobei der trockene Anteil des erfassten Stimmsignals geschätzt (22) wird, indem eine Filterung mit der jeweiligen relativen Impulsantwort zwischen dem mindestens einen Mundmikrofon oder Mikrofonarray (17) und dem äußeren Mikrofon (11) und einer anschließenden Durchschnittsbildung erfolgt.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei das Filter zur Extraktion oder Erzeugung des Stimmanteils basierend auf dem erfassten Außenschall und der geschätzten trockenen Stimme ein Wiener-Filter, ein adaptives Filter oder ein Filter, welches eine Raumimpulsantwort nachbildet, ist.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei der geschätzte trockene Anteil des erfassten Stimmsignals und der extrahierte oder erzeugte Stimmanteil linear gewichtet und addiert und dann über einen Lautsprecher des Kopfhörers oder Hörgeräts ausgegeben werden.
- Vorrichtung zur aktiven Unterdrückung des Okklusionseffektes bei der Wiedergabe von Audiosignalen über einen Lautsprecher (13) eines mit mindestens einem äußeren Mikrofon (11) versehenen Kopfhörers (10) oder Hörgeräts, mit- mindestens einem zusätzlichen Mikrofon (17) zur Erfassung eines Stimmsignals eines Nutzers;- einem digitalen Signalprozessor (50), der eingerichtet ist, um- den trockenen Anteil eines mit dem mindestens einen zusätzlichen Mikrofon (17) erfassten Stimmsignals zu schätzen, wobei der trockene Anteil des erfassten Stimmsignals der Anteil des erfassten Stimmsignals ist, welcher weder einen durch den umgebenden Raum verursachten Nachhall noch Umgebungsgeräusche aufweist;- aus dem mit dem mindestens einen äußeren Mikrofon (11) erfassten Außenschall den Stimmanteil mit einem Filter zu extrahieren, wobei Filterkoeffizienten des Filters basierend auf dem geschätzten trockenen Anteil des erfassten Stimmsignals ermittelt werden, oder den akustischen Einfluss des Raumes auf die eigene Stimme basierend auf dem trockenen Anteil des erfassten Stimmsignals und dem mit dem mindestens einen äußeren Mikrofon erfassten Außenschall zu analysieren und basierend darauf den geschätzten trockenen Anteil des erfassten Stimmsignals so zu filtern, dass ein Stimmanteil erzeugt wird, der eine vergleichbare Räumlichkeit zu dem Stimmanteil an dem mindestens einen äußeren Mikrofon aufweist; und- den extrahierten oder erzeugten Stimmanteil über den Lautsprecher (13) auszugeben.
- Vorrichtung nach Anspruch 8, wobei zusätzlich ein digitales Filter (32) vorgesehen ist, dem der extrahierte oder erzeugte Stimmanteil vor der Ausgabe über den Lautsprecher (13) zugeführt wird.
- Kopfhörer (10), der eine Vorrichtung gemäß Anspruch 8 oder 9 aufweist.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102020114429.6A DE102020114429A1 (de) | 2020-05-29 | 2020-05-29 | Verfahren, vorrichtung, kopfhörer und computerprogramm zur aktiven unterdrückung des okklusionseffektes bei der wiedergabe von audiosignalen |
| PCT/EP2021/064168 WO2021239864A1 (de) | 2020-05-29 | 2021-05-27 | Verfahren, vorrichtung, kopfhörer und computerprogramm zur aktiven unterdrückung des okklusionseffektes bei der wiedergabe von audiosignalen |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| EP4158901A1 EP4158901A1 (de) | 2023-04-05 |
| EP4158901B1 true EP4158901B1 (de) | 2025-07-16 |
| EP4158901C0 EP4158901C0 (de) | 2025-07-16 |
Family
ID=76217864
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| EP21729292.9A Active EP4158901B1 (de) | 2020-05-29 | 2021-05-27 | Verfahren, vorrichtung, kopfhörer und computerprogramm zur aktiven unterdrückung des okklusionseffektes bei der wiedergabe von audiosignalen |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US12284486B2 (de) |
| EP (1) | EP4158901B1 (de) |
| DE (1) | DE102020114429A1 (de) |
| WO (1) | WO2021239864A1 (de) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP4338155A1 (de) * | 2021-06-30 | 2024-03-20 | Huawei Technologies Co., Ltd. | Kopfhörer und verfahren zur aktiven rauschverminderung |
| DE102022111300A1 (de) | 2022-05-06 | 2023-11-09 | Elevear GmbH | Vorrichtung zur Reduzierung des Rauschens bei der Wiedergabe eines Audiosignals mit einem Kopfhörer oder Hörgerät und entsprechendes Verfahren |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2010093913A1 (en) | 2009-02-12 | 2010-08-19 | Brock Seiler | Multi-channel audio vibratory entertainment system |
| AU2010346387B2 (en) * | 2010-02-19 | 2014-01-16 | Sivantos Pte. Ltd. | Device and method for direction dependent spatial noise reduction |
| EP2362678B1 (de) | 2010-02-24 | 2017-07-26 | GN Audio A/S | Headset-System mit Mikrofon für Umgebungsgeräusche |
| US9020160B2 (en) * | 2012-11-02 | 2015-04-28 | Bose Corporation | Reducing occlusion effect in ANR headphones |
| WO2014075195A1 (en) * | 2012-11-15 | 2014-05-22 | Phonak Ag | Own voice shaping in a hearing instrument |
| DK3008920T3 (da) | 2013-06-12 | 2020-11-09 | Sonova Ag | Metode til anvendelse af et høreapparat med aktiv okklusionskontrol og et høreapparat med brugerjusteret aktiv okklusionskontrol |
| US9654855B2 (en) * | 2014-10-30 | 2017-05-16 | Bose Corporation | Self-voice occlusion mitigation in headsets |
| EP3188495B1 (de) | 2015-12-30 | 2020-11-18 | GN Audio A/S | Headset mit durchhörmodus |
| WO2017147428A1 (en) * | 2016-02-25 | 2017-08-31 | Dolby Laboratories Licensing Corporation | Capture and extraction of own voice signal |
| US10034092B1 (en) | 2016-09-22 | 2018-07-24 | Apple Inc. | Spatial headphone transparency |
| US10595151B1 (en) * | 2019-03-18 | 2020-03-17 | Cirrus Logic, Inc. | Compensation of own voice occlusion |
-
2020
- 2020-05-29 DE DE102020114429.6A patent/DE102020114429A1/de active Pending
-
2021
- 2021-05-27 WO PCT/EP2021/064168 patent/WO2021239864A1/de not_active Ceased
- 2021-05-27 EP EP21729292.9A patent/EP4158901B1/de active Active
- 2021-05-27 US US17/927,183 patent/US12284486B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| EP4158901A1 (de) | 2023-04-05 |
| CN115398934A (zh) | 2022-11-25 |
| EP4158901C0 (de) | 2025-07-16 |
| US12284486B2 (en) | 2025-04-22 |
| US20230328462A1 (en) | 2023-10-12 |
| DE102020114429A1 (de) | 2021-12-02 |
| WO2021239864A1 (de) | 2021-12-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE102015216822B4 (de) | Verfahren zur Unterdrückung einer Rückkopplung in einem Hörgerät | |
| EP3104627B1 (de) | Verfahren zur verbesserung eines aufnahmesignals in einem hörsystem | |
| EP2224752B1 (de) | Vorrichtung und Verfahren zur Reduzierung von Trittschallwirkungen bei Hörvorrichtungen mit aktiver Okklusionsreduktion | |
| EP2229010B1 (de) | Hörgerät und Verfahren zur Störschallkompensation bei einem Hörgerät | |
| DE102006047965A1 (de) | Hörhilfsgerät mit einer Okklusionsreduktionseinrichtung und Verfahren zur Okklusionsreduktion | |
| EP3275211B1 (de) | Verfahren zum betreiben eines elektroakustischen systems und ein elektroakustisches system | |
| EP4133476A1 (de) | Verfahren, vorrichtung, kopfhörer und computerprogramm zur aktiven störgeräuschunterdrückung | |
| EP4158901B1 (de) | Verfahren, vorrichtung, kopfhörer und computerprogramm zur aktiven unterdrückung des okklusionseffektes bei der wiedergabe von audiosignalen | |
| DE102020207579A1 (de) | Verfahren zur richtungsabhängigen Rauschunterdrückung für ein Hörsystem, welches eine Hörvorrichtung umfasst | |
| EP2503795A2 (de) | Hörvorrichtung mit Rückkopplungsunterdrückungseinrichtung und Verfahren zum Betreiben der Hörvorrichtung | |
| EP3373599B1 (de) | Verfahren zur frequenzverzerrung eines audiosignals und nach diesem verfahren arbeitende hörvorrichtung | |
| EP1931172A1 (de) | Hörgerät mit Störschallunterdrückung und entsprechendes Verfahren | |
| DE102019213810B3 (de) | Verfahren zum Betrieb eines Hörgeräts und Hörgerät | |
| WO2023214020A1 (de) | Vorrichtung zur reduzierung des rauschens bei der wiedergabe eines audiosignals mit einem kopfhörer oder hörgerät und entsprechendes verfahren | |
| EP4247007B1 (de) | Verfahren zum betrieb eines binauralen hörsystems | |
| EP4236371B1 (de) | Verfahren zur reduktion von echo in einem hörinstrument | |
| EP2590437B1 (de) | Periodisches Adaptieren einer Rückkopplungsunterdrückungseinrichtung | |
| EP3913618A1 (de) | Verfahren zum betrieb eines hörgeräts und hörgerät | |
| WO2025045956A1 (de) | Verfahren zur verarbeitung von umgebungsschall, welcher mit einem am oder im ohr tragbaren audiogerät erfasst wird, und entsprechende vorrichtung | |
| WO2023104865A1 (de) | Vorrichtung zur aktiven störgeräusch- und/oder okklusionsunterdrückung, entsprechendes verfahren und computerprogramm | |
| EP4356622B1 (de) | Active noise control klassifikationssystem | |
| EP4686227A1 (de) | Verfahren zum betrieb eines hörgeräts | |
| DE102024111845A1 (de) | Am Ohr getragenes Hörgerät mit aktiver Okklusionsreduzierung | |
| JPS60263598A (ja) | ハウリング抑圧装置 | |
| DE102006062246A1 (de) | Hörer |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: UNKNOWN |
|
| STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE |
|
| PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
| STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE |
|
| 17P | Request for examination filed |
Effective date: 20221220 |
|
| AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR |
|
| DAV | Request for validation of the european patent (deleted) | ||
| DAX | Request for extension of the european patent (deleted) | ||
| GRAP | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOSNIGR1 |
|
| STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: GRANT OF PATENT IS INTENDED |
|
| INTG | Intention to grant announced |
Effective date: 20250220 |
|
| GRAS | Grant fee paid |
Free format text: ORIGINAL CODE: EPIDOSNIGR3 |
|
| GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
| STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE PATENT HAS BEEN GRANTED |
|
| AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR |
|
| REG | Reference to a national code |
Ref country code: GB Ref legal event code: FG4D Free format text: NOT ENGLISH |
|
| REG | Reference to a national code |
Ref country code: CH Ref legal event code: EP |
|
| REG | Reference to a national code |
Ref country code: IE Ref legal event code: FG4D Free format text: LANGUAGE OF EP DOCUMENT: GERMAN |
|
| U01 | Request for unitary effect filed |
Effective date: 20250722 |
|
| U07 | Unitary effect registered |
Designated state(s): AT BE BG DE DK EE FI FR IT LT LU LV MT NL PT RO SE SI Effective date: 20250728 |
|
| PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: IS Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20251116 |
|
| PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: NO Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20251016 |
|
| PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: HR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20250716 |
|
| PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: GR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20251017 |
|
| PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: PL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20250716 |
|
| PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: RS Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20251016 |
|
| PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: ES Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20250716 |