-
Die Erfindung bezieht sich auf ein Verfahren nach dem Oberbegriff des Anspruchs 1 und eine Vorrichtung nach dem Oberbegriff des Anspruchs 10 zur Verarbeitung eines (Eingangs-)Audiosignals. Ein solches Verfahren und eine solche Vorrichtung sind aus
EP 2 124 335 B1 bekannt. Bei der Vorrichtung handelt es sich insbesondere um ein Hörinstrument.
-
Als „Hörinstrument“ oder „Hörvorrichtung“ wird allgemein ein elektronisches Gerät bezeichnet, das das Hörvermögen einer das Hörinstrument tragenden Person (die nachfolgend als „Träger“ oder „Nutzer“ bezeichnet ist) unterstützt. Insbesondere bezieht sich die Erfindung auf Hörinstrumente, die dazu eingerichtet sind, einen Hörverlust eines hörgeschädigten Nutzers ganz oder teilweise zu kompensieren. Ein solches Hörinstrument wird auch als „Hörgerät“ bezeichnet. Daneben gibt es Hörinstrumente, die das Hörvermögen von normalhörenden Nutzern schützen oder verbessern, zum Beispiel in komplexen Hörsituationen ein verbessertes Sprachverständnis ermöglichen sollen. Zu den Hörinstrumenten zählen ferner auch Kopfhörer oder andere Schallwiedergabegeräte, die ein Umgebungsgeräusch in ein anderes Audiosignal (z.B. Musik oder ein Telefongespräch) einblenden oder die Wahrnehmbarkeit des Umgebungsgeräuschs durch aktive Geräuschunterdrückung reduzieren.
-
Hörinstrumente im Allgemeinen, und Hörgeräte im Speziellen, sind meist dazu ausgebildet, am Kopf und hier insbesondere ihn oder an einem Ohr des Nutzers getragen zu werden, insbesondere als Hinter-dem-Ohr-Geräte (nach dem englischen Begriff „behind the ear“ auch als BTE-Geräte bezeichnet) oder In-dem-Ohr-Geräte (nach dem englischen Begriff „in the ear“ auch als ITE-Geräte bezeichnet). Im Hinblick auf ihre interne Struktur weisen Hörinstrumente regelmäßig mindestens einen (akusto-elektrischen) Eingangswandler, einen Signalprozessor und einen Ausgangswandler auf. Im Betrieb des Hörinstruments nimmt der oder jeder Eingangswandler einen Luftschall aus der Umgebung des Hörinstruments auf und wandelt diesen Luftschall in ein Eingangs-Audiosignal (d. h. ein elektrisches Signal, dass eine Information über den Umgebungsschall transportiert) um. In dem Signalprozessor wird das oder jedes Eingangs-Audiosignal verarbeitet (d. h. hinsichtlich seiner Schallinformation modifiziert), um das Hörvermögen des Nutzers zu unterstützen, insbesondere um einen Hörverlust des Nutzers auszugleichen. Die Signalverarbeitungseinheit gibt ein entsprechend verarbeitetes Audiosignal (auch als „Ausgangs-Audiosignal“ oder „modifiziertes Schallsignal“ bezeichnet) an den Ausgangswandler aus.
-
In den meisten Fällen ist der Ausgangswandler als elektro-akustischer Wandler ausgebildet, der das (elektrische) Ausgangs-Audiosignal wieder in einen Luftschall umwandelt, wobei dieser - gegenüber dem Umgebungsschall modifizierte - Luftschall in den Gehörgang des Nutzers abgegeben wird. Bei einem hinter dem Ohr getragenen Hörinstrument ist der auch als „Hörer“ („Receiver“) bezeichnete Ausgangswandler meist außerhalb des Ohrs in einem Gehäuse des Hörinstruments integriert. Der von dem Ausgangswandler ausgegebene Schall wird in diesem Fall mittels eines Schallschlauchs in den Gehörgang des Nutzers geleitet. Alternativ hierzu kann der Ausgangswandler auch in dem Gehörgang, und somit außerhalb des hinter dem Ohr getragenen Gehäuses, angeordnet sein. Solche Hörinstrumente werden (nach dem englischen Begriff „receiver in canal“) auch als RIC-Geräte bezeichnet. Im Ohr getragene Hörinstrumente, die so klein dimensioniert sind, dass sie nach außen über den Gehörgang nicht hinausstehen, werden (nach dem englischen Begriff „completely in canal“) auch als CIC-Geräte bezeichnet.
-
In weiteren Bauformen kann der Ausgangswandler auch als elektro-mechanischer Wandler ausgebildet sein, der das Ausgangs-Audiosignal in Körperschall (Vibrationen) umwandelt, wobei dieser Körperschall zum Beispiel in den Schädelknochen des Nutzers abgegeben wird. Ferner gibt es implantierbare Hörinstrumente, insbesondere Cochlear-Implantate, und Hörinstrumente, deren Ausgangswandler den Hörnerv des Nutzers direkt stimulieren.
-
Zum Zweck der Signalverarbeitung wird das Eingangs-Audiosignal in einem Hörinstrument regelmäßig mittels einer Analyse-Filterbank in eine Mehrzahl von Frequenzbändern aufgeteilt. Mit anderen Worten wird das Eingangs-Audiosignal in eine Mehrzahl von Teilbandsignalen überführt, die getrennt voneinander in Frequenzkanälen geführt und in jeweils spezifischer Weise verarbeitet, insbesondere verstärkt werden. Mittels einer Synthese-Filterbank werden die verarbeiteten Teilbandsignale dann wieder zu dem - alle Frequenzanteile umfassenden - Ausgangs-Audiosignal zusammengeführt.
-
Ein wichtiger Aspekt bei der Verarbeitung eines Audiosignals, insbesondere in einem Hörinstrument, ist einerseits die Latenz, d.h. die durch die Verarbeitung verursachte zeitliche Verzögerung des Audiosignals. Sinnvollerweise sollte die Latenz kleiner als 10 Millisekunden (ms) sein, da eine größere Latenz das Hörerlebnis eines menschlichen Nutzers des Hörinstruments spürbar beeinträchtigen würde. Andererseits ist für einige gebräuchliche Signalverarbeitungsfunktionen wie z.B. Geräuschreduktion oder dynamische Kompression, eine hohe Frequenzauflösung sinnvoll, also eine Aufteilung des Audiosignals in eine große Anzahl von Frequenzbändern mit jeweils nur geringer Bandbreite.
-
Diese beiden Anforderungen stehen allerdings in Konkurrenz miteinander, da das Produkt aus Zeit- und Frequenzauflösung konstant ist (Küpfmüllersche Unschärferelation). In der Praxis wird die minimale, technisch sinnvolle Bandbreite somit limitiert durch die maximal tolerable Latenz, wodurch in einigen Fällen eine zufriedenstellende Signalverarbeitung erschwert oder verhindert wird.
-
So wäre beispielsweise für eine gute Geräuschreduktion von stimmhafter Sprache ein Frequenzabstand zwischen benachbarten Frequenzbändern wünschenswert, der maximal der Hälfte der Fundamentalfrequenz entspricht. Selbst für weibliche Stimmen, bei denen die Fundamentalfrequenz stimmhafter Laute typischerweise zwischen 200 Hertz (Hz) und 300 Hz liegt, kann aber der wünschenswerte Frequenzabstand von 100 Hz bis 150 Hz nicht erreicht werden, da er mit einer zu großen Latenz verbunden wäre. In gängigen Hörinstrumenten wird daher typischerweise als akzeptabler, aber nicht völlig zufriedenstellender Kompromiss zwischen einer möglichst hohen Frequenzauflösung und einer möglichst geringen Latenz eine Frequenzauflösung von 200 Hz bis 500 Hz realisiert.
-
Um dieses Problem zu lösen, werden mitunter Filterbänke eingesetzt, bei denen die Frequenzbänder einen ungleichmäßigen, nämlich mit steigender Frequenz kontinuierlich oder sprunghaft zunehmenden Frequenzabstand haben. So ist aus
EP 2 124 335 B1 eine zweistufige Analyse-Filterbank-Einrichtung für eine Hörvorrichtung offenbart, bei der das zu verarbeitende Audiosignal durch eine erste Filterbank in vier erste Frequenzbänder und dann durch eine zweite Filterbank weiter in 24 zweite Frequenzbänder aufgeteilt wird. Von den 24 zweiten Frequenzbändern haben die unteren zwölf Frequenzbänder einen wesentlich geringeren Frequenzabstand und eine geringere Bandbreite als die oberen zwölf Frequenzbänder.
-
Durch die ungleichmäßige Frequenzauflösung der bekannten Analyse-Filterbank-einrichtung werden die aus der hohen Frequenzaufspaltung resultierenden Nachteile reduziert, da eine erhöhte Latenz nur in einem Teilbereich des Schallspektrums auftritt. Dieser Vorteil wird aber mit einer verschlechterten Klangqualität erkauft, da das Ausgangs-Audiosignal infolge verschieden großer Latenzen und unterschiedlicher Gruppenlaufzeiten in den niederfrequenten und hochfrequenten Frequenzkanälen verzerrt wird. Zudem hat bei nicht-gleichförmigen Filterbänken typischerweise jedes Teilband eine andere Bandbreite. Eine mögliche Unterabtastung muss sich aber an dem Band mit der höchsten Bandbreite orientieren. Hieraus ergibt sich eine vergleichsweise ineffektive Signalverarbeitung.
-
In
EP 3 197 181 A1 sind andererseits ein Verfahren und eine Vorrichtung zur Verarbeitung eines Audiosignals in einem Hörinstrument beschrieben, wobei aus dem Eingangs-Audiosignal eine Vielzahl von Signal-Blöcken in der Zeitdomäne gebildet werden. Zur Reduzierung der Latenz werden diese Zeitblöcke zumindest teilweise prädiziert; d.h. der Signalverlauf dieser Zeitblöcke wird in die Zukunft extrapoliert. Die prädizierten Zeit-Blöcke werden dann durch die Filterbank in Frequenzbänder aufgeteilt und somit in die Frequenzdomäne transformiert. Das bekannte Verfahren führt allerdings ebenfalls infolge der Prädiktion zu einer spürbaren Beeinträchtigung der Klangqualität.
-
Der Erfindung liegt die Aufgabe zugrunde, eine frequenzselektive Verarbeitung eines Audiosignals mit geringer Latenz und hoher (Klang-)Qualität zu ermöglichen. Dabei soll insbesondere in einem Teilbereich des hörbaren Schallspektrums eine hohe Frequenzauflösung ermöglicht werden.
-
Bezüglich eines Verfahrens zur (frequenzspezifischen) Verarbeitung eines Audiosignals wird diese Aufgabe erfindungsgemäß gelöst durch die Merkmale des Anspruchs 1. Bezüglich einer Vorrichtung zur (frequenzspezifischen) Verarbeitung eines Audiosignals wird die obige Aufgabe erfindungsgemäß gelöst durch die Merkmale des Anspruchs 9. Vorteilhafte und teils für sich gesehen erfinderische Ausgestaltungen und Weiterentwicklungen der Erfindung sind in den Unteransprüchen und der nachfolgenden Beschreibung dargelegt.
-
Im Zuge des Verfahrens wird zur Verarbeitung eines Eingangs-Audiosignals, insbesondere in einem Hörinstrument, das Eingangs-Audiosignal zunächst mittels einer ersten Analyse-Filterbank spektral in eine Mehrzahl von ersten Frequenzbändern aufgeteilt (erste Frequenzaufspaltung). Eine erste Untergruppe (Teilmenge) der ersten Frequenzbänder wird in mindestens einer weiteren Frequenzaufspaltung mittels mindestens einer weiteren Analyse-Filterbank in (gegenüber den ersten Frequenzbändern schmalbandigere) Unter-Frequenzbänder aufgeteilt. Das in die ersten Frequenzbänder und ggf. in die Unter-Frequenzbänder aufgeteilte Eingangs-Audiosignal wird frequenzselektiv verarbeitet, insbesondere verstärkt. Das in die ersten Frequenzbänder und ggf. in die Unter-Frequenzbänder aufgeteilte und frequenzselektiv verarbeitete Eingangs-Audiosignal wird dann wieder zu einem Ausgangs-Audiosignal zusammengeführt.
-
Erfindungsgemäß wird nun auf den feiner aufgespalteten Teil des Eingangs-Audiosignals (und bevorzugt nur auf diesen Teil des Eingangs-Audiosignals) eine Prädiktion angewendet, die eine durch die oder jede weitere Frequenzaufspaltung verursachte Latenz kompensiert, also vollständig eliminiert oder zumindest verringert. Durch die Prädiktion werden mit anderen Worten Latenzunterschiede zwischen den Frequenzbändern und Unter-Frequenzbändern infolge der oder jeder weiteren Frequenzaufspaltung kompensiert. Insbesondere wird die Latenz des feiner frequenzaufgeteilten Teils des Eingangs-Audiosignals an die geringere Latenz eines gröber frequenzaufgeteilten Teils des Eingangs-Audiosignals angeglichen.
-
Im Gegensatz zu dem aus
EP 3 197 181 A1 bekannten Verfahren wird die Prädiktion hierbei in der Frequenzdomäne angewendet. Für den Zeitpunkt oder Ort, an dem die Prädiktion innerhalb der Frequenzdomäne angewendet wird, gibt es im Rahmen der Erfindung mehrere Ausführungsvarianten. So wird die Prädiktion entweder direkt auf die Unter-Frequenzbänder angewendet und/oder auf diejenigen ersten Frequenzbänder, aus denen die Unter-Frequenzbänder abgeleitet wurden. Die Prädiktion kann dabei jeweils vor oder nach der Signalverarbeitung oder auch zwischen zwei von ggf. mehreren Verarbeitungsschritten vorgenommen werden. Die Prädiktion kann schließlich im Rahmen der Erfindung auch in mehreren einander nachgeschalteten Prädiktionsschritten erfolgen.
-
Durch das vorstehend beschriebene Verfahren wird in einem Teilbereich des Schallspektrums eine besondere feine Frequenzaufspaltung ermöglicht, wobei gleichzeitig durch die Prädiktion die mit einer ungleichmäßigen Frequenzaufspaltung normalerweise einhergehende Verzerrung des Ausgangssignals vermieden oder zumindest reduziert wird. Im Vergleich zu dem aus
EP 3 197 181 A1 bekannten Verfahren wird aber auch die nachteilige Auswirkung der Prädiktion auf die Klangqualität reduziert, da die Prädiktion nur auf einen Teilbereich des Schallspektrums angewendet wird. Somit werden insgesamt eine hohe Frequenzauflösung in einem Teilbereich des Schallspektrums in Kombination mit einer besonders guten Klangqualität erreicht.
-
In einer bevorzugten Ausführung des Verfahrens ist die Frequenzaufspaltung zweistufig ausgeführt. Dabei wird eine erste Untergruppe (Teilmenge) der ersten Frequenzbänder zweite Frequenzaufspaltung mittels einer zweiten Analyse-Filterbank feiner in zweite Frequenzbänder (d.h. Unter-Frequenzbänder der zweiten Stufe) aufgespaltet. Jedes erste Frequenzband der ersten Untergruppe wird also wiederum in eine Mehrzahl dieser zweiten Frequenzbänder aufgeteilt. Die Prädiktion wird hierbei auf die zweiten Frequenzbänder oder die ersten Frequenzbänder der ersten Untergruppe angewendet, um die durch die zweite Frequenzaufspaltung verursachte Latenz zu kompensieren.
-
Die Grundidee des erfindungsgemäßen Verfahrens, nämlich die feinere Frequenzaufspaltung eines spektralen Teils des Eingangs-Audiosignals, verbunden mit einer Prädiktion dieses feiner aufgespalteten spektralen Bereichs zur Kompensation der durch die feinere Frequenzaufspaltung verursachten Latenz, wird optional auf n-stufige Frequenzaufspaltungen (mit n = 3,4,5,...) erweitert. Dabei wird allgemein eine Untergruppe der i-ten Frequenzbänder (mit i = 2,3,4,...) in noch schmalbandigere (i+1)-te Frequenzbänder aufgeteilt. Der mehrfach frequenzaufgeteilte Teil des Eingangs-Audiosignals wird hierbei in der Frequenzdomäne jeweils derart prädiziert, dass die durch die mehrfache Frequenzaufteilung verursachte Latenz jeweils kompensiert wird.
-
So wird in einer dreistufigen Ausführung dieses Verfahrensprinzips jedes der zweiten Frequenzbänder einer Untergruppe der zweiten Frequenzbänder in einer dritten Frequenzaufspaltung mittels einer dritten Analyse-Filterbank in eine Mehrzahl von dritten Frequenzbändern (d.h. Unter-Frequenzbändern der 3. Stufe) aufgeteilt. Auf die dritten Frequenzbänder und/oder auf die zweiten Frequenzbänder, aus denen die dritten Frequenzbänder abgeleitet wurden, und/oder auf die ersten Frequenzbänder, aus denen die dritten Frequenzbänder abgeleitet wurden, wird dabei die Prädiktion derart angewendet, dass die durch die zweite und dritte Frequenzaufspaltung verursachte Latenz kompensiert wird.
-
Die erste Untergruppe der ersten Frequenzbänder wird vorzugsweise derart gewählt, dass sie einen zusammenhängenden niederfrequenten Bereich des Schallspektrums, insbesondere die unteren 2 bis 3 KHz des Schallspektrums, abdeckt. Die erste Untergruppe der ersten Frequenzbänder wird mit anderen Worten vorzugsweise aus einer Mehrzahl der ersten Frequenzbänder gebildet, die hinsichtlich ihrer jeweiligen Mittenfrequenz unmittelbar benachbart sind und das unterste erste Frequenzband umfassen. Dies ist insbesondere für die Verarbeitung von Audiosignalen, die menschliche Sprache enthalten, besonders vorteilhaft. Denn einerseits dominieren die Schallanteile von Sprachgeräuschen, insbesondere bei stimmhaften Lauten, in diesem niederfrequenten Bereich, und andererseits ist auch die Frequenzauflösung des menschlichen Gehörs bei niedrigen Frequenzen besonders hoch.
-
Grundsätzlich kann das Verfahren bei einer gewöhnlichen mehrstufigen Filterbank eingesetzt werden, wie sie beispielsweise aus
EP 2 124 335 B1 bekannt ist. Vorzugweise wirkt die oder jede weitere Analyse-Filterbank aber nur auf die erste Untergruppe der ersten Frequenzbänder. Eine zweite Untergruppe der ersten Frequenzbänder wird dagegen bevorzugt ohne weitere Frequenzaufspaltung der frequenzselektiven Verarbeitung, insbesondere Verstärkung, unterzogen. Hierdurch wird insgesamt eine besonders geringe Latenz erzielt.
-
Eine besonders effiziente Frequenzaufspaltung und Verarbeitung des Eingangs-Audiosignals wird in einer vorteilhaften Ausgestaltung der Erfindung dadurch erzielt, dass die ersten Frequenzbänder eine einheitliche, d.h. für alle ersten Frequenzbänder gleiche, erste Bandbreite haben. Aus dem gleichen Grund sind - zusätzlich der alternativ - auch die i-ten (mit i = 2,3,...) Frequenzbänder vorzugsweise derart gestaltet, dass diese i-ten Frequenzbänder jeweils eine einheitliche, d.h. für alle i-ten Frequenzbänder gleiche, i-te Bandbreite haben. Die erste Bandbreite ist dabei insbesondere ein ganzzahliges Vielfaches der zweiten Bandbreite; die zweite Bandbreite ggf. ein ganzzahliges Vielfaches der dritten Bandbreite, etc.
-
Grundsätzlich kann der feiner frequenzaufgeteilte Teil des Eingangs-Audiosignals im Rahmen der Erfindung linear prädiziert werden. Vorzugsweise handelt es sich bei der auf die ersten Frequenzbänder der ersten Untergruppe oder die daraus abgeleiteten Unter-Frequenzbänder angewendeten Prädiktion aber um eine nichtlineare Prädiktion.
-
In einer besonders vorteilhaften Ausführungsvariante der Erfindung werden ein oder mehrere Prädiktionsalgorithmen eingesetzt, die zur Laufzeit des Verfahrens, d.h. während der Signalverarbeitung, adaptiv sind. Im Gegensatz zu vorab konfigurierten oder trainierten Prädiktionsalgorithmen, die während der Laufzeit des Verfahrens nicht-adaptiv (statisch) sind, sind adaptive Prädiktionsalgorithmen einerseits sehr flexibel und andererseits ressourcen-sparend und deshalb insbesondere für den Einsatz in einem Hörinstrument besonders geeignet.
-
In geeigneten Ausführungen der Erfindung werden für die Durchführung der Prädiktion insbesondere mindestens ein Hammerstein-Modell, ein rekurrentes neuronales Netzwerk und/oder ein Echo-State-Netzwerk eingesetzt.
-
Um den negativen Einfluss der ungleichmäßigen Frequenzaufspaltung des Eingangs-Audiosignals und der Prädiktion auf die Klangqualität des Ausgangssignals insgesamt noch weiter zu reduzieren, wird das vorstehend beschriebene Verfahren in einer Weiterbildung der Erfindung nur zeitweise in Situationen eingesetzt, in denen es besondere Vorteile bringt, nämlich insbesondere bei der Verarbeitung von Schall, der stimmhafte Sprache enthält. Hierzu wird das Eingangs-Audiosignal - frequenzbandübergreifend oder bandspezifisch - auf die Anwesenheit von stimmhafter Sprache analysiert. Auf dem zu dem Ausgabe-Audiosignal führenden Signalpfad werden die oder jede weitere Frequenzaufspaltung und damit auch die Prädiktion dabei in mindestens einem der ersten Frequenzbänder oder Unter-Frequenzbänder nur dann vorgenommen, wenn dort die Anwesenheit von stimmhafter Sprache im Eingangs-Audiosignal erkannt wird. Die oder jede weitere Frequenzaufspaltung und/oder die Prädiktion können optional aber auch bei Abwesenheit von stimmhafter Sprache im Hintergrund der Signalverarbeitung weiterlaufen, ohne eine Auswirkung auf das Ausgangs-Audiosignal zu haben.
-
Zusätzlich oder alternativ hierzu wird zu dem gleichen Zweck - frequenzbandübergreifend oder bandspezifisch - die Genauigkeit (Zuverlässigkeit) der Prädiktion ermittelt. Auf dem zu dem Ausgabe-Audiosignal führenden Signalpfad werden die feinere Frequenzaufspaltung eines Teils des Eingangs-Audiosignals (also die Ableitung der Unter-Frequenzbänder) und damit auch die Prädiktion dabei wiederum in mindestens einem der ersten Frequenzbänder oder Unter-Frequenzbänder nur dann vorgenommen, wenn dort die Genauigkeit der Prädiktion ein vorgegebenes Kriterium erfüllt, insbesondere einen vorgegeben Schwellwert überschreitet. Die oder jede weitere Frequenzaufspaltung und/oder die Prädiktion können optional aber auch bei ungenügender Genauigkeit der Prädiktion im Hintergrund der Signalverarbeitung weiterlaufen, ohne eine Auswirkung auf das Ausgangs-Audiosignal zu haben.
-
Bei der erfindungsgemäßen Vorrichtung handelt es sich insbesondere um ein Hörinstrument, vorzugsweise ein Hörgerät, in einer der eingangs beschriebenen Bauformen.
-
Die Vorrichtung umfasst eine Analyse-Filterbank-Einrichtung mit einer ersten Analyse-Filterbank und mindestens einer weiteren Analyse-Filterbank. Die erste Analyse-Filterbank ist dazu eingerichtet, das Eingangs-Audiosignal in eine Mehrzahl von ersten Frequenzbändern aufzuteilen. Die mindestens eine weitere Analyse-Filterbank ist der ersten Analyse-Filterbank nachgeschaltet und dazu eingerichtet, jedes erste Frequenzband einer ersten Untergruppe der ersten Frequenzbänder in eine Mehrzahl von Unter-Frequenzbändern aufzuteilen. Wie vorstehend beschrieben umfasst die Analyse-Filterbank-Einrichtung optional zusätzlich zu einer zweiten Analyse-Filterbank eine wiederum nachgeschaltete dritte Analyse-Filterbank, die eine Untergruppe der zweiten Frequenzbänder noch feiner in dritte Frequenzbänder aufspaltet, sowie ggf. noch eine oder mehrere weitere nachgeschaltete Analyse-Filterbänke.
-
Die Vorrichtung umfasst weiterhin eine Signalverarbeitungseinheit zur frequenzselektiven Verarbeitung, insbesondere Verstärkung des in die ersten Frequenzbänder bzw. die Unter-Frequenzbänder aufgeteilten Eingangs-Audiosignals, sowie eine der Signalverarbeitungseinheit nachgeschaltete Synthese-Filterbank-Einrichtung, die dazu eingerichtet ist, das in die ersten Frequenzbänder und ggf. die Unter-Frequenzbänder aufgeteilte und frequenzselektiv verarbeitete Eingangs-Audiosignal zu einem Ausgangs-Audiosignal zusammenzuführen.
-
Erfindungsgemäß umfasst die Vorrichtung mindestens einen Prädiktor, der dazu eingerichtet ist, auf die ersten Frequenzbänder der ersten Untergruppe und/oder die daraus abgeleiteten Unter-Frequenzbänder eine Prädiktion anzuwenden, um Latenzunterschiede zwischen den ersten Frequenzbändern und Unter-Frequenzbändern infolge der oder jeder weiteren Frequenzaufspaltung zu kompensieren.
-
Die Signalverarbeitungseinheit ist vorzugsweise in einem digitalen Signalprozessor des Hörinstruments implementiert. Die Signalverarbeitungseinheit kann im Rahmen der Erfindung in Form von (nicht-programmierbaren) elektronischen Schaltkreisen realisiert sein. Der Signalprozessor ist hierbei beispielsweise als ASIC ausgebildet oder umfasst einen solchen. Alternativ ist die Signalverarbeitungseinheit in Form von Software realisiert. In diesem Fall ist der Signalprozessor durch ein programmierbares elektronisches Bauteil gebildet. Wiederum alternativ hierzu ist die Signalverarbeitungseinheit durch eine Kombination von nicht-programmierbaren Schaltkreisen und Software gebildet. Der Signalprozessor ist dabei durch einen Hybrid-Chip gebildet, der mindestens eine programmierbare Komponente und mindestens eine nicht-programmierbare Komponente umfasst.
-
Die Synthese-Filterbank-Einrichtung ist vorzugsweise spiegelsymmetrisch zu der Analyse-Filterbank-Einrichtung ausgebildet und umfasst somit zu jeder Analyse-Filterbank ein entsprechendes Gegenstück. Die Synthese-Filterbank-Einrichtung umfasst insbesondere eine zweite Synthese-Filterbank, die die zweiten Frequenzbänder nach der Signalverarbeitung wieder in erste Frequenzbänder vereint, sowie eine erste Synthese-Filterbank, die die ersten Frequenzbänder zu dem Ausgangssignal zusammenfasst. In Ausführungsformen, in denen die Analyse-Filterbank-Einrichtung mehr als zwei Analyse-Filterbänke umfasst, umfasst auch die Synthese-Filterbank vorzugsweise eine entsprechende Mehrzahl an Synthese-Filterbänken.
-
Die erfindungsgemäße Vorrichtung ist allgemein zur automatischen Durchführung des vorstehend beschriebenen erfindungsgemäßen Verfahrens vorgesehen und eingerichtet. Die vorstehend beschriebenen Ausgestaltungen und Fortbildungen des Verfahrens korrespondieren dabei mit entsprechenden Ausgestaltungen und Fortbildungen der Vorrichtung. Die Ausführungen zu notwendigen und optionalen Merkmalen des Verfahrens und deren jeweiligen Wirkungen und Vorteile sind daher auf die Vorrichtung übertragbar, und umgekehrt.
-
Die Vorrichtung ist somit in bevorzugten Ausgestaltungen derart ausgebildet,
- • dass die erste Untergruppe der ersten Frequenzbänder aus einer Mehrzahl der ersten Frequenzbänder gebildet ist, die hinsichtlich ihrer jeweiligen Mittenfrequenz unmittelbar benachbart sind und das unterste erste Frequenzband umfassen,
- • dass eine zweite Untergruppe der ersten Frequenzbänder der Signalverarbeitungseinheit direkt zugeführt ist, um die zweite Untergruppe der ersten Frequenzbänder ohne weitere Frequenzaufspaltung der frequenzselektiven Verarbeitung zu unterziehen,
- • dass die ersten Frequenzbänder und/oder die Unter-Frequenzbänder i-ter Stufe (mit i = 2,3,4,...) eine einheitliche erste bzw. i-te Bandbreite haben, wobei die erste Bandbreite insbesondere ein ganzzahliges Vielfaches der zweiten Bandbreite beträgt, etc.,
- • dass der mindestens eine Prädiktor nicht-linear ist, und/oder
- • dass der mindestens eine Prädiktor zur Laufzeit, also während der Signalverarbeitung, adaptiv ist.
-
Optional umfasst die Vorrichtung ein Spracherkennungsmodul, das dazu eingerichtet ist, das Eingangs-Audiosignal auf die Anwesenheit von stimmhafter Sprache zu analysieren, und eine auch als „Signalweiche“ bezeichnete Schalteinrichtung, die dazu eingerichtet ist, die oder jede weitere Analyse-Filterbank nur dann zu aktivieren, wenn das Spracherkennungsmodul die Anwesenheit von stimmhafter Sprache im Eingangs-Audiosignal erkennt.
-
Alternativ oder zusätzlich umfasst die Vorrichtung eine mit der vorstehend beschriebenen Schalteinrichtung identische oder von dieser verschiedene Schalteinrichtung (Signalweiche), die dazu eingerichtet ist, die oder jede weitere Analyse-Filterbank in Abhängigkeit der Genauigkeit (Zuverlässigkeit) der Prädiktion zu aktivieren und zu deaktivieren. Die Genauigkeit der Prädiktion kann grundsätzlich im Rahmen der Erfindung von der Schalteinrichtung selbst durch Analyse der in den ersten Frequenzbändern der ersten Untergruppe jeweils geführten Teilbandsignale ermittelt werden. Vorzugsweise wird aber von dem oder jedem Prädiktor eine für die Genauigkeit der Prädiktion charakteristische Kenngröße ermittelt und an die Schalteinrichtung ausgegeben, die in Abhängigkeit von dieser Kenngröße die zweite Analyse-Filterbank aktiviert und deaktiviert. Als Kenngröße für die Genauigkeit der Prädiktion wird insbesondere der sogenannte „Prediction Gain“ herangezogen.
-
Die Analyse-Filterbank-Einrichtung, die Synthese-Filterbank-Einrichtung, der oder jeder Prädiktor sowie - falls vorhanden - das Spracherkennungsmodul und/oder die oder jede Schalteinrichtung sind vorzugsweise - in Form von (nicht-programmierbarer Hardware) und/oder Software - in dem Signalprozessor der Vorrichtung integriert. Insbesondere kann es sich bei der oder jeder Schalteinrichtung im Rahmen der Erfindung auch um ein Softwaremodul handeln.
-
Nachfolgend werden Ausführungsbeispiele der Erfindung anhand einer Zeichnung näher erläutert. Darin zeigen:
- 1 in einer schematischen Darstellung ein Hörinstrument in Form eines hinter einem Ohr eines Nutzers tragbaren Hörgeräts,
- 2 in einem schematischen Blockschaltbild den Aufbau einer Signalverarbeitung des Hörinstruments aus 1, und
- 3 und 4 jeweils in Darstellung gemäß 2 zwei alternative Ausführungsformen des Hörinstruments.
-
Einander entsprechende Teile und Größen sind in allen Figuren stets mit gleichen Bezugszeichen versehen.
-
1 zeigt als Beispiel für eine erfindungsgemäße Vorrichtung zur Verarbeitung eines Audiosignals ein Hörgerät 2, d.h. ein zur Unterstützung des Hörvermögens eines hörgeschädigten Nutzers eingerichtetes Hörinstrument. Bei dem Hörgerät 2 handelt es sich in dem hier dargestellten Beispiel um ein hinter einem Ohr eines Nutzers tragbares BTE-Hörgerät.
-
Das Hörgerät 2 umfasst innerhalb eines Gehäuses 4 mindestens ein Mikrofon 6 als Eingangswandler sowie einen Hörer 8 als Ausgangswandler. Das Hörgerät 2 umfasst weiterhin eine Batterie 10 und einen (insbesondere digitalen) Signalprozessor 12. Vorzugsweise umfasst der Signalprozessor 12 sowohl eine programmierbare Untereinheit (zum Beispiel einen Mikroprozessor) als auch eine nicht-programmierbare Untereinheit (zum Beispiel einen ASIC).
-
Der Signalprozessor 12 wird aus der Batterie 10 mit einer elektrischen Versorgungsspannung U versorgt.
-
Im Normalbetrieb des Hörgeräts 2 nimmt das Mikrofon 6 einen Luftschall aus der Umgebung des Hörgeräts 2 auf. Das Mikrofon 6 wandelt den Schall in ein (Eingangs-)Audiosignal I um, das eine Information über den aufgenommenen Schall enthält. Das Eingangs-Audiosignal I wird innerhalb des Hörgeräts 2 dem Signalprozessor 12 zugeführt, der dieses Eingangs-Audiosignal I zur Unterstützung des Hörvermögens des Nutzers modifiziert.
-
Der Signalprozessor 12 gibt ein Ausgangs-Audiosignal O, das eine Information über den verarbeiteten und somit modifizierten Schall enthält, an den Hörer 8 aus.
-
Der Hörer 8 wandelt das Ausgangs-Schallsignal O in einen modifizierten Luftschall um. Dieser modifizierte Luftschall wird über einen Schallkanal 14, der den Hörer 8 mit einer Spitze 16 des Gehäuses 4 verbindet, sowie über einen (nicht explizit gezeigten) flexiblen Schallschlauch, der die Spitze 16 mit einem in den Gehörgang des Nutzers eingesetzten Ohrstück verbindet, in den Gehörgang des Nutzers übertragen.
-
Der funktionelle Aufbau des Signalprozessors 12 ist in 2 in näherem Detail dargestellt.
-
In nicht näher dargestellter Weise wird das von dem Mikrofon 6 aufgenommene Eingangs-Audiosignal I zunächst durch einen in den Signalprozessor 12 integrierten oder dem Signalprozessor 12 vorgeschalteten Analog-Digital-Wandler digitalisiert. Das digitalisierte Eingangs-Audiosignal I wird innerhalb des Signalprozessors 12 zunächst einer Analyse-Filterbank-Einrichtung 20 zugeführt, die in dem in 2 dargestellten Beispiel eine erste Analyse-Filterbank 22 und eine dieser nachgeschaltete zweite Analyse-Filterbank 24 umfasst.
-
Mittels der ersten Analyse-Filterbank 22 wird das Eingangs-Audiosignal I in einer ersten Frequenzaufspaltung in eine Mehrzahl von ersten Frequenzbändern 26, also ersten Frequenzkanälen, die jeweils ein Teilbandsignal des Eingangs-Audiosignals I führen, aufgeteilt. In 2 sind vereinfachend lediglich vier erste Frequenzbänder 26 dargestellt. In einer sinnvollen praktischen Umsetzung der Erfindung teilt die erste Analyse-Filterbank 22 das Eingangs-Audiosignal I beispielsweise in 32 erste Frequenzbänder 26 auf. Die Frequenzbänder 26 haben eine einheitliche (erste) Bandbreite von beispielsweise 500 Hz und einen einheitlichen spektralen Abstand von 250 Hz.
-
Die zweite Analyse-Filterbank 24 wirkt nur auf eine (erste) Untergruppe 28 der Frequenzbänder 26, die einen Bereich von 2 bis 3 kHz an dem niederfrequenten Rand des Schallspektrums abdeckt. Die Untergruppe 28 umfasst dabei eine Anzahl von benachbarten Frequenzbändern 26, die das unterste (d.h. niederfrequenteste) erste Frequenzband 26 beinhaltet. In dem in 2 dargestellten Beispiel umfasst die Untergruppe 28 beispielhaft die unteren zwei der insgesamt vier Frequenzbänder 26; in der praktischen Umsetzung umfasst die Untergruppe 28 beispielweise die unteren 12 von insgesamt 32 ersten Frequenzbändern 26.
-
Durch die zweite Analyse-Filterbank 24 wird jedes erste Frequenzband 26 der Untergruppe 28 in einer zweiten Frequenzaufspaltung in mehrere (gemäß 2 beispielhaft in zwei) zweite Frequenzbändern 30 aufgespaltet. Die Frequenzbänder 30 haben eine einheitliche (zweite) Bandbreite von beispielsweise 125 Hz und einen einheitlichen spektralen Abstand von 62,5 Hz.
-
Eine zweite Untergruppe 32 der Frequenzbänder 26, die die nicht zu der Untergruppe 28 gehörenden hochfrequenten Frequenzbänder 26 umfasst, wird an der zweiten Analyse-Filterbank 24 vorbeigeführt und somit keiner zweiten (und feineren) Frequenzaufspaltung unterzogen.
-
Die jeweiligen Teilbandsignale der hochfrequenten Frequenzbänder 26 der Untergruppe 32 sowie der Frequenzbänder 30 werden in einer Signalverarbeitungseinheit 34 verarbeitet (d.h. signaltechnisch modifiziert). Im Zuge dieser Verarbeitung wird insbesondere das jeweilige Teilbandsignal eines jeden Frequenzbandes 26 der Untergruppe 32 sowie eines jeden Frequenzbandes 30 gemäß einem individuellen (d.h. frequenzspezifisch vorgegebenen) Verstärkungsfaktor verstärkt. Im Sinne einer effizienten Signalverarbeitung umfasst die Signalverarbeitungseinheit 34 im Beispiel gemäß 2 zwei Untereinheiten 36 und 38 für die hochfrequenten Frequenzbänder 26 der Untergruppe 32 bzw. für die Frequenzbänder 30, wobei die Untereinheiten 36 und 38 jeweils spezifisch auf die unterschiedliche Bandbreite der zugeführten Frequenzbänder 26 bzw. 30 ausgelegt sind.
-
Durch eine Synthese-Filterbank-Einrichtung 40 werden die verarbeiteten Teilbandsignale der hochfrequenten Frequenzbänder 26 der Untergruppe 32 und der Frequenzbänder 30 zu dem Ausgangs-Audiosignal O kombiniert. Die Synthese-Filterbank-Einrichtung 40 ist spiegelsymmetrisch zu der Analyse-Filterbank-Einrichtung 20 gestaltet. Sie umfasst demnach eine zweite Synthese-Filterbank 42, die die zweiten Frequenzbänder 30 wieder zu den ersten Frequenzbändern 26 der Untergruppe 28 zusammenführt, sowie eine erste Synthese-Filterbank 44, die die ersten Frequenzkanäle 26 der ersten Untergruppe 28 und der Untergruppe 32 zu dem Ausgangs-Audiosignal O zusammenführt.
-
Durch die mittels der Analyse-Filterbank 24 vorgenommene feinere Frequenzaufspaltung wird ein Latenzunterschied der niederfrequenten Teilbandsignale der Frequenzbänder 26 der Untergruppe 28 im Vergleich zu den hochfrequenten Teilbandsignalen der Frequenzbänder 26 der Untergruppe 32 hervorgerufen, der in Abwesenheit weiterer Maßnahmen zu einer Verzerrung des Ausgang-Audiosignals O führen würde.
-
Um diesen Latenzunterschied zu kompensieren (d.h. gänzlich zu eliminieren oder zumindest zu reduzieren), ist in den Signalpfad der Frequenzbänder 30 ein Prädiktor 46 geschaltet. Der Prädiktor 46 ist vorzugsweise als nicht-linearer und im Betrieb des Hörgeräts 2 fortlaufend adaptierender Prädiktor, insbesondere als Hammerstein-Modell, ausgebildet. Der Prädiktor 46 hat für jedes zugeführte Frequenzband 30 spezifisch adaptierte Parameter.
-
Im Gegensatz zu dem aus
EP 3 197 181 A1 bekannten Verfahren erfolgt die Prädiktion bei dem Hörgerät 2 in der Frequenzdomäne und wird ausschließlich auf den feiner frequenzgeteilten niederfrequenten Teil des Schallspektrums angewendet. Innerhalb der Frequenzdomäne, also zwischen der ersten Analyse-Filterbank 22 und der ersten Synthese-Filterbank 44 kann der Prädiktor 46 allerdings an verschiedenen Positionen angeordnet werden. In dem Beispiel gemäß
2 ist der Prädiktor 46 der zweiten Analyse-Filterbank 24 und der Untereinheit 38 der Signalverarbeitungseinheit 34 zwischengeschaltet. In
2 sind weiterhin drei alternative Positionen für den (hier mit dem Bezugszeichen 46' gekennzeichneten) Prädiktor angegeben, nämlich
- • zwischen der ersten Analyse-Filterbank 22 und der zweiten Analyse-Filterbank 24,
- • zwischen der Untereinheit 38 der Signalverarbeitungseinheit 34 und der zweiten Synthese-Filterbank 42 und
- • zwischen der zweiten Synthese-Filterbank 42 und der ersten Synthese-Filterbank 44.
-
In einer möglichen Abwandlung der in 2 dargestellten Ausführungsform enthält das Hörgerät 2 mehrere hintereinandergeschaltete Prädiktoren 46, 46', die insbesondere an mehreren der in 2 angegebenen Positionen angeordnet sind und jeweils einen Teil des vorstehend beschriebenen Latenzunterschieds kompensieren.
-
Das von der ersten Synthese-Filterbank 44 ausgegebene Ausgangs-Audiosignal O wird durch einen (nicht näher dargestellten) Digital-Analog-Wandler, der in den Signalprozessor 12 integriert oder dem Signalprozessor 12 nachgeschaltet ist, in ein Analogsignal zurückgewandelt und zur Ausgabe an den Nutzer des Hörgeräts 2 dem Hörer 8 zugeleitet.
-
In 3 ist eine alternative Ausführungsform des Hörgeräts 2 dargestellt, in der die Analyse-Filterbank-Einrichtung 20 und die Synthese-Filterbank-Einrichtung 40 jeweils dreistufig aufgebaut sind. Zusätzlich zu der ersten Analyse-Filterbank 22 und der zweiten Analyse-Filterbank 24 umfasst die Analyse-Filterbank-Einrichtung 20 in dieser Ausführungsform eine dritte Analyse-Filterbank 50 auf eine (erste) Untergruppe 52 der Frequenzbänder 30 wirkt. Die Untergruppe 52 deckt wiederum einen niederfrequenten Teil des von den Frequenzbändern 30 insgesamt überspannten Teils des Schallspektrums ab. Beispielsweise umfasst die Untergruppe 52, insbesondere - im Beispiel gemäß 3 - die unteren zwei der insgesamt vier Frequenzbänder 30; in der praktischen Umsetzung umfasst die Untergruppe 52 zum Beispiel die unteren sechs von insgesamt 12 zweiten Frequenzbändern 30.
-
Durch die dritte Analyse-Filterbank 50 wird jedes zweite Frequenzband 30 der Untergruppe 52 noch feiner in mehrere (gemäß 3 beispielhaft in zwei) dritte Frequenzbändern 54 aufgespaltet (dritte Frequenzaufspaltung). Die Frequenzbänder 54 haben eine einheitliche (dritte) Bandbreite von beispielsweise 62,5 Hz und einen einheitlichen spektralen Abstand von 31,25 Hz.
-
Eine zweite Untergruppe 56 der Frequenzbänder 30, die die nicht zu der Untergruppe 52 gehörenden hochfrequenten Frequenzbänder 30 umfasst, wird an der dritten Analyse-Filterbank 50 vorbeigeführt und somit keiner dritten Frequenzaufspaltung unterzogen.
-
In der Ausführungsform des Hörgeräts 2 gemäß 3 verarbeitet die Untereinheit 38 der Signalverarbeitungseinheit 34 nur die jeweiligen Teilbandsignale der hochfrequenten Frequenzbänder 30 der zweiten Untergruppe 56. Zur Verarbeitung, insbesondere frequenzselektiven Verstärkung, der Teilbandsignale der Frequenzbänder 54 umfasst die Signalverarbeitungseinheit 34 gemäß 3 zusätzlich eine weitere Untereinheit 58, die auf die Bandbreite der Frequenzbänder 54 ausgelegt ist.
-
Die Synthese-Filterbank-Einrichtung 40 ist auch in der Ausführungsform gemäß 3 spiegelsymmetrisch zu der Analyse-Filterbank-Einrichtung 20 eingerichtet. Sie umfasst daher zusätzlich zu der ersten Synthese-Filterbank 44 und der zweiten Synthese-Filterbank 42 eine dritte Synthese-Filterbank 60, die die dritten Frequenzbänder 54 nach der Signalverarbeitung wieder zu den zweiten Frequenzbändern 30 der Untergruppe 52 zusammenführt.
-
In der Ausführungsform des Hörgeräts 2 gemäß 3 wirkt auch der Prädiktor 46 nur auf die jeweiligen Teilbandsignale der hochfrequenten zweiten Frequenzbänder 30 der zweiten Untergruppe 56. Zur Prädiktion der Teilbandsignale der niederfrequenten zweiten Frequenzbänder 30 der ersten Untergruppe 52 und der dritten Frequenzbänder 54 umfasst das Hörgerät 2 gemäß 3 einen weiteren Prädiktor 62. Der Prädiktor 62 ist vorzugsweise vom gleichen Typ wie der Prädiktor 46, aber derart ausgelegt, dass er den durch die zweite und dritte Frequenzaufspaltung verursachten Latenzunterschied zu den Teilbandsignalen der hochfrequenten ersten Frequenzbändern 26 der Untergruppe 32 kompensiert.
-
Auch der Prädiktor 62 kann an verschiedenen Positionen zwischen der zweiten Analyse-Filterbank 24 und der zweiten Synthese-Filterbank 42 angeordnet sein. Weiterhin können auch bei Varianten der Ausführungsform gemäß 3 mehrere Prädiktoren 62 hintereinandergeschaltet sein, die jeweils einen Teil des Latenzunterschieds kompensieren. In einer weiteren Ausführungsvariante sind die Prädiktoren 46 und 62 hintereinandergeschaltet. Der Prädiktor 46 ist hierbei zwischen der ersten Analyse-Filterbank 22 und der zweiten Analyse-Filterbank 24 oder zwischen der zweiten Synthese-Filterbank 42 und der ersten Synthese-Filterbank 44 angeordnet. In diesen Fällen ist der Prädiktor 62 derart ausgelegt, dass er nur den durch die dritte Frequenzaufspaltung verursachten Latenzunterschied kompensiert.
-
4 zeigt eine weitere Ausführungsform des Hörgeräts 2, die im Wesentlichen der Ausführungsform gemäß 2 entspricht. Im Unterschied zu der Ausführung gemäß 2 erfolgt die zweite Frequenzaufspaltung der niederfrequenten ersten Frequenzbänder 26 der Untergruppe 28 hier aber nur dann, wenn das Eingangs-Audiosignal I stimmhafte Sprache (also stimmhafte gesprochene oder gesungene Laute) enthält.
-
In dem Signalprozessor 12 ist hierzu ein Spracherkennungsmodul 64 implementiert. Das Spracherkennungsmodul 64 erkennt die Anwesenheit von stimmhafter Sprache durch Analyse des in die ersten Frequenzbänder 26 zerlegten Eingangs-Audiosignals I, und hiervon insbesondere des niederfrequenten Anteils. In dem dargestellten Beispiel werden dem Spracherkennungsmodul 64 die Frequenzbänder 26 der Untergruppe 28 als Eingangsgröße zugeführt. Das Spracherkennungsmodul 64 erkennt die Anwesenheit von stimmhafter Sprache dabei insbesondere an dem Vorhandensein einer ausgeprägten Grundfrequenz und/oder dem Auftreten der für stimmhafte Laute charakteristischen dominanten Frequenzen (Formanten). Bei Erkennung von stimmhafter Sprache in dem Eingangs-Audiosignal I gibt das Spracherkennungsmodul 64 ein Steuersignal S1 aus.
-
Um die zweite Frequenzaufspaltung nur bei Erkennung von stimmhafter Sprache vorzunehmen, ist in den Signalpfad der Frequenzbänder 26 der Untergruppe 28 eine Signalweiche 66 geschaltet, die in Abhängigkeit von dem Steuersignal S1 die Teilbandsignale der Frequenzbänder 26 der Untergruppe 28 entweder der zweiten Analyse-Filterbank 24 oder der Untereinheit 36 der Datenverarbeitungseinheit 34 zuleitet. Bei Anliegen des Steuersignals S1 (und somit bei Erkennung von stimmhafter Sprache in dem Eingangs-Audiosignal I) leitet die Signalweiche 66 die Teilbandsignale der Frequenzbänder 26 der Untergruppe 28 der zweiten Analyse-Filterbank 24 zu. In diesem Fall entspricht die Funktion des Hörgeräts 2 aus 4 der in 2 gezeigten Ausführungsform. Wenn das Steuersignal S1 dagegen nicht an der Signalweiche 66 anliegt (und somit von dem Spracherkennungsmodul 64 keine stimmhafte Sprache in dem Eingangs-Audiosignal I erkannt wird, leitet die Signalweiche 66 die Teilbandsignale der Frequenzbänder 26 der Untergruppe 28 dagegen direkt der Untereinheit 36 der Datenverarbeitungseinheit 34 zu. In diesem Fall werden die Teilbandsignale aller ersten Frequenzbänder 26 ohne weitere Frequenzaufspaltung verarbeitet, insbesondere frequenzspezifisch verstärkt. Es findet dann auch keine Prädiktion statt.
-
In einer alternativen Ausführungsvariante des Hörgeräts 2 aus
4 wird die zweite Frequenzaufspaltung nicht in Abhängigkeit von der Erkennung von stimmhafter Sprache aktiviert, sondern in Abhängigkeit von der Genauigkeit (Zuverlässigkeit) der Prädiktion. Der Prädiktor 46 gibt hierbei eine für die Genauigkeit der Prädiktion charakteristische Kenngröße Q aus, insbesondere den sogenannten „Predictor Gain“, der durch die Varianz σ
x 2 des Eingangssignals des Prädiktors 46 in Relation zu der Varianz des Prädiktionsfehlers σ
e 2, angegeben in Decibel, gegeben ist:
-
Wenn dem Prädiktor - wie in 4 dargestellt - mehrere Teilbandsignale als Eingangssignal zugeführt werden, wird die Kenngröße Q beispielsweise aus dem Mittelwert, dem Minimalwert oder dem Maximalwert der einzelnen bandspezifischen Predictor Gains berechnet. Alternativ wird der Predictor Gain eines als Referenz ausgewählten Teilbandsignals als Kenngröße Q herangezogen. Die Kenngröße Q hat in allen diesen Fällen einen umso höheren Wert, je genauer der Prädiktor 46 den Verlauf der zugeführten Teilbandsignale voraussagen kann.
-
Durch ein in dem Signalprozessor 12 implementiertes (und in 4 mit gestrichelten Linien eingetragenes) Bewertungsmodul 68 wird die Kenngröße Q mit einem vorgegebenen Schwellwert vergleichen. Solange die Kenngröße Q den Schwellwert überschreitet, gibt das Bewertungsmodul 68 ein Steuersignal S2 aus, das der Signalweiche 66 anstelle des Steuersignals S1 zugeführt wird.
-
Bei Anliegen des Steuersignals S2 (und somit bei hinreichender Genauigkeit der Prädiktion) leitet die Signalweiche 66 die Teilbandsignale der Frequenzbänder 26 der Untergruppe 28 der zweiten Analyse-Filterbank 24 zu. In diesem Fall entspricht die Funktion des Hörgeräts 2 aus 4 wiederum der in 2 gezeigten Ausführungsform. Wenn das Steuersignal S2 dagegen nicht an der Signalweiche 66 anliegt (und somit die Prädiktion keine hinreichende Genauigkeit aufweist), leitet die Signalweiche 66 die Teilbandsignale der Frequenzbänder 26 der Untergruppe 28 dagegen für eine vorgegebene Zeitspanne direkt der Untereinheit 36 der Datenverarbeitungseinheit 34 zu. In diesem Fall werden die Teilbandsignale aller ersten Frequenzbänder 26 wiederum ohne weitere Frequenzaufspaltung verarbeitet, insbesondere frequenzspezifisch verstärkt. Es findet dann auch keine Prädiktion statt. Nach Ablauf der vorgegebenen Zeitspanne werden die zweite Frequenzaufspaltung und somit auch die Prädiktion wieder aktiviert, um die Genauigkeit der Prädiktion mittels des Bewertungsmoduls 68 erneut zu überprüfen.
-
In der vorstehend beschriebenen Ausführungsvariante ist das Spracherkennungsmodul 64 nicht vorgesehen. Entsprechend wird die Signalweiche 66 ausschließlich über das Steuersignal S2 gesteuert.
-
In einer weiteren Ausführungsvariante des Hörgeräts 2 gemäß 4 sind sowohl das Spracherkennungsmodul 64 als auch das Bewertungsmodul 68 vorgesehen. Die Signalweiche 66 wird hier sowohl durch das Steuersignal S1 als auch durch das Steuersignal S2 angesteuert. Die Steuersignale S1 und S2 sind dabei vorzugsweise UND-verknüpft, so dass die zweite Frequenzaufspaltung nur dann durch die Signalweiche 66 aktiviert wird, wenn sowohl das Steuersignal S1 als auch das Steuersignal S2 anliegt, wenn also sowohl die Anwesenheit von stimmhafter Sprache in dem Eingangs-Audiosignal I erkannt wurde als auch die Prädiktion eine hinreichende Genauigkeit hat.
-
In einer weiteren, nicht näher dargestellten Variante des Hörgeräts 2 gemäß 4 wird die Kenngröße Q für jedes Frequenzband 26 der ersten Untergruppe 28 separat berechnet, insbesondere durch Bestimmung des jeweils bandspezifischen Predictor Gains, und mit einem jeweils bandspezifischen Schwellwert verglichen. Dabei gibt das Bewertungsmodul 68 das Steuersignal S2 bandspezifisch nur für das Frequenzband 26 oder die Frequenzbänder 26 aus, für das bzw. die der bandspezifische Predictor Gain den jeweils zugeordneten Schwellwert überschreitet. Entsprechend aktiviert die Signalweiche 66 die zweite Frequenzaufspaltung selektiv nur für das betroffene Frequenzband 26 oder die betroffenen Frequenzbänder 26. In dieser Variante des Hörgeräts ist der Prädiktor 46 vorzugweise zwischen der Signalweiche 66 und der zweiten Analyse-Filterbank 24 angeordnet.
-
In einer weiteren, nicht näher dargestellten Variante des Hörgeräts 2 gemäß 4 wird das Steuersignal S1 bandspezifisch erzeugt, wenn durch das Spracherkennungsmodul 64 in dem jeweiligen Frequenzband 26 die Anwesenheit von stimmhafter Sprache erkannt wird. Entsprechend aktiviert die Signalweiche 66 auch in diesem Fall die zweite Frequenzaufspaltung selektiv nur für das betroffene Frequenzband 26 oder die betroffenen Frequenzbänder 26.
-
In einer weiteren, nicht näher dargestellten Variante des Hörgeräts 2 gemäß 4 wird der Prädiktor 46 bei einem den Schwellwert unterschreitenden Wert der Kenngröße Q nur aus dem das Mikrofon 6 mit dem Hörer 8 verbindenden Signalpfad geschaltet, läuft aber im Hintergrund der Signalverarbeitung weiter (ohne dass die Prädiktion dabei eine Auswirkung auf das Ausgangs-Audiosignal O hätte). Dies wird beispielsweise dadurch erreicht, dass die Signalweiche 66 spiegelsymmetrisch zu der Darstellung gemäß 4 zwischen die zweite Synthese-Filterbank 42 und die erste Synthese-Filterbank 44 geschaltet wird. In diesem Fall gibt der Prädiktor 46 die Kenngröße Q auch dann ununterbrochen aus, wenn die Kenngröße Q den Schwellwert nicht überschreitet. Das bei dem Ausführungsbeispiel gemäß 4 beschriebene Rückschalten der Signalweiche 66 nach Ablauf der vorgegebenen Zeitspanne zur erneuten Überprüfung der Genauigkeit der Prädiktion ist hier nicht erforderlich und daher auch nicht vorgesehen.
-
Die in den 2 bis 4 dargestellten Komponenten des Signalprozessors 12, nämlich die Analyse-Filterbank-Einrichtung 20 mit den Analyse-Filterbänken 22,24 und ggf. 50, die Datenverarbeitungseinheit 34 mit den Untereinheiten 36,38 und ggf. 58, die Synthese-Filterbank-Einrichtung 40 mit den Synthese-Filterbänken 42, 44 und ggf. 60, der Prädiktor 46 und ggf. der Prädiktor 62, sowie ggf. das Spracherkennungsmodul 64, die Signalweiche 66 und das Bewertungsmodul 68 sind vorzugsweise als Softwaremodule ausgeführt, die im Betrieb des Hörgeräts 2 in dem Signalprozessor 12 ablaufen. Alternativ sind eine oder mehrere dieser Komponenten oder durch nicht-programmierbare elektronische Schaltkreise gebildet.
-
Die Erfindung wird an den vorstehend beschriebenen Ausführungsbeispielen besonders deutlich, ist auf diese Ausführungsbeispiele aber nicht beschränkt. Vielmehr können weitere Ausführungsformen der Erfindung aus den Ansprüchen und der vorstehenden Beschreibung abgeleitet werden. Insbesondere können die anhand der Ausführungsbeispiele beschriebenen Einzelmerkmale der Erfindung im Rahmen der Ansprüche auch in anderer Weise kombiniert werden, ohne den Gegenstand der Erfindung zu verlassen.
-
Bezugszeichenliste
-
- 2
- Hörgerät
- 4
- Gehäuse
- 6
- Mikrofon
- 8
- Hörer
- 10
- Batterie
- 12
- Signalprozessor
- 14
- Schallkanal
- 16
- Spitze
- 20
- Analyse-Filterbank-Einrichtung
- 22
- (erste) Analyse-Filterbank
- 24
- (zweite) Analyse-Filterbank
- 26
- (erstes) Frequenzband
- 28
- (erste) Untergruppe
- 30
- (zweites) Frequenzband
- 32
- (zweite) Untergruppe
- 34
- Datenverarbeitungseinheit
- 36
- Untereinheit
- 38
- Untereinheit
- 40
- Synthese-Filterbank-Einrichtung
- 42
- (zweite) Synthese-Filterbank
- 44
- (erste) Synthese-Filterbank
- 46
- Prädiktor
- 46'
- Prädiktor (alternative Position)
- 50
- (dritte) Analyse-Filterbank
- 52
- (erste) Untergruppe
- 54
- (drittes) Frequenzband
- 56
- (zweite) Untergruppe
- 58
- Untereinheit
- 60
- (dritte) Synthese-Filterbank
- 62
- Prädiktor
- 64
- Spracherkennungsmodul
- 66
- Signalweiche
- 68
- Bewertungsmodul
- I
- Eingangs-Audiosignal
- F
- Fehler
- O
- Ausgangs-Audiosignal
- S1
- Steuersignal
- S2
- Steuersignal
- U
- Versorgungsspannung
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- EP 2124335 B1 [0001, 0010, 0023]
- EP 3197181 A1 [0012, 0017, 0018, 0059]