DE102021205251A1 - Verfahren und Vorrichtung zur frequenzselektiven Verarbeitung eines Audiosignals mit geringer Latenz - Google Patents

Verfahren und Vorrichtung zur frequenzselektiven Verarbeitung eines Audiosignals mit geringer Latenz Download PDF

Info

Publication number
DE102021205251A1
DE102021205251A1 DE102021205251.7A DE102021205251A DE102021205251A1 DE 102021205251 A1 DE102021205251 A1 DE 102021205251A1 DE 102021205251 A DE102021205251 A DE 102021205251A DE 102021205251 A1 DE102021205251 A1 DE 102021205251A1
Authority
DE
Germany
Prior art keywords
frequency bands
frequency
audio signal
sub
filter bank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE102021205251.7A
Other languages
English (en)
Other versions
DE102021205251B4 (de
Inventor
Tobias Daniel Rosenkranz
Henning Puder
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sivantos Pte Ltd
Original Assignee
Sivantos Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sivantos Pte Ltd filed Critical Sivantos Pte Ltd
Priority to DE102021205251.7A priority Critical patent/DE102021205251B4/de
Priority to EP22168308.9A priority patent/EP4093052A1/de
Priority to CN202210538122.0A priority patent/CN115379366A/zh
Priority to US17/748,550 priority patent/US11910162B2/en
Publication of DE102021205251A1 publication Critical patent/DE102021205251A1/de
Application granted granted Critical
Publication of DE102021205251B4 publication Critical patent/DE102021205251B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/35Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using translation techniques
    • H04R25/353Frequency, e.g. frequency shift or compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • H04R25/505Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Otolaryngology (AREA)
  • Neurosurgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

Es wird ein Verfahren zur Verarbeitung eines Eingangs-Audiosignals (I) angegeben. Dabei wird das Eingangs-Audiosignal (I) in einer ersten Frequenzaufspaltung mittels einer ersten Analyse-Filterbank (22) in eine Mehrzahl von ersten Frequenzbändern (26) aufgeteilt. Die ersten Frequenzbänder (26) einer ersten Untergruppe (28) der ersten Frequenzbänder (26) werden in mindestens einer weiteren Frequenzaufspaltung mittels mindestens einer weiteren Analyse-Filterbank (24,50) in eine Mehrzahl von Unter-Frequenzbändern (30,54) aufgeteilt. Das in die ersten Frequenzbänder (26) bzw. die Unter-Frequenzbänder (30,54) aufgeteilte Eingangs-Audiosignal (I) wird frequenzselektiv verarbeitet, insbesondere verstärkt. Das in die ersten Frequenzbänder (26) bzw. die Unter-Frequenzbänder (30,54) aufgeteilte und frequenzselektiv verarbeitete Eingangs-Audiosignal (I) wird zu einem Ausgangs-Audiosignal (O) zusammengeführt. Verfahrensgemäß wird auf die ersten Frequenzbänder (26) der ersten Untergruppe (28) und/oder auf die daraus abgeleiteten Unter-Frequenzbänder (30,54) eine Prädiktion angewendet, um Latenzunterschiede zwischen den ersten Frequenzbändern (26) und Unter-Frequenzbändern (30,54) infolge der oder jeder weiteren Frequenzaufspaltung zu kompensieren. Eine zur Durchführung des Verfahrens ausgebildete Vorrichtung ist insbesondere durch ein Hörinstrument gebildet.

Description

  • Die Erfindung bezieht sich auf ein Verfahren nach dem Oberbegriff des Anspruchs 1 und eine Vorrichtung nach dem Oberbegriff des Anspruchs 10 zur Verarbeitung eines (Eingangs-)Audiosignals. Ein solches Verfahren und eine solche Vorrichtung sind aus EP 2 124 335 B1 bekannt. Bei der Vorrichtung handelt es sich insbesondere um ein Hörinstrument.
  • Als „Hörinstrument“ oder „Hörvorrichtung“ wird allgemein ein elektronisches Gerät bezeichnet, das das Hörvermögen einer das Hörinstrument tragenden Person (die nachfolgend als „Träger“ oder „Nutzer“ bezeichnet ist) unterstützt. Insbesondere bezieht sich die Erfindung auf Hörinstrumente, die dazu eingerichtet sind, einen Hörverlust eines hörgeschädigten Nutzers ganz oder teilweise zu kompensieren. Ein solches Hörinstrument wird auch als „Hörgerät“ bezeichnet. Daneben gibt es Hörinstrumente, die das Hörvermögen von normalhörenden Nutzern schützen oder verbessern, zum Beispiel in komplexen Hörsituationen ein verbessertes Sprachverständnis ermöglichen sollen. Zu den Hörinstrumenten zählen ferner auch Kopfhörer oder andere Schallwiedergabegeräte, die ein Umgebungsgeräusch in ein anderes Audiosignal (z.B. Musik oder ein Telefongespräch) einblenden oder die Wahrnehmbarkeit des Umgebungsgeräuschs durch aktive Geräuschunterdrückung reduzieren.
  • Hörinstrumente im Allgemeinen, und Hörgeräte im Speziellen, sind meist dazu ausgebildet, am Kopf und hier insbesondere ihn oder an einem Ohr des Nutzers getragen zu werden, insbesondere als Hinter-dem-Ohr-Geräte (nach dem englischen Begriff „behind the ear“ auch als BTE-Geräte bezeichnet) oder In-dem-Ohr-Geräte (nach dem englischen Begriff „in the ear“ auch als ITE-Geräte bezeichnet). Im Hinblick auf ihre interne Struktur weisen Hörinstrumente regelmäßig mindestens einen (akusto-elektrischen) Eingangswandler, einen Signalprozessor und einen Ausgangswandler auf. Im Betrieb des Hörinstruments nimmt der oder jeder Eingangswandler einen Luftschall aus der Umgebung des Hörinstruments auf und wandelt diesen Luftschall in ein Eingangs-Audiosignal (d. h. ein elektrisches Signal, dass eine Information über den Umgebungsschall transportiert) um. In dem Signalprozessor wird das oder jedes Eingangs-Audiosignal verarbeitet (d. h. hinsichtlich seiner Schallinformation modifiziert), um das Hörvermögen des Nutzers zu unterstützen, insbesondere um einen Hörverlust des Nutzers auszugleichen. Die Signalverarbeitungseinheit gibt ein entsprechend verarbeitetes Audiosignal (auch als „Ausgangs-Audiosignal“ oder „modifiziertes Schallsignal“ bezeichnet) an den Ausgangswandler aus.
  • In den meisten Fällen ist der Ausgangswandler als elektro-akustischer Wandler ausgebildet, der das (elektrische) Ausgangs-Audiosignal wieder in einen Luftschall umwandelt, wobei dieser - gegenüber dem Umgebungsschall modifizierte - Luftschall in den Gehörgang des Nutzers abgegeben wird. Bei einem hinter dem Ohr getragenen Hörinstrument ist der auch als „Hörer“ („Receiver“) bezeichnete Ausgangswandler meist außerhalb des Ohrs in einem Gehäuse des Hörinstruments integriert. Der von dem Ausgangswandler ausgegebene Schall wird in diesem Fall mittels eines Schallschlauchs in den Gehörgang des Nutzers geleitet. Alternativ hierzu kann der Ausgangswandler auch in dem Gehörgang, und somit außerhalb des hinter dem Ohr getragenen Gehäuses, angeordnet sein. Solche Hörinstrumente werden (nach dem englischen Begriff „receiver in canal“) auch als RIC-Geräte bezeichnet. Im Ohr getragene Hörinstrumente, die so klein dimensioniert sind, dass sie nach außen über den Gehörgang nicht hinausstehen, werden (nach dem englischen Begriff „completely in canal“) auch als CIC-Geräte bezeichnet.
  • In weiteren Bauformen kann der Ausgangswandler auch als elektro-mechanischer Wandler ausgebildet sein, der das Ausgangs-Audiosignal in Körperschall (Vibrationen) umwandelt, wobei dieser Körperschall zum Beispiel in den Schädelknochen des Nutzers abgegeben wird. Ferner gibt es implantierbare Hörinstrumente, insbesondere Cochlear-Implantate, und Hörinstrumente, deren Ausgangswandler den Hörnerv des Nutzers direkt stimulieren.
  • Zum Zweck der Signalverarbeitung wird das Eingangs-Audiosignal in einem Hörinstrument regelmäßig mittels einer Analyse-Filterbank in eine Mehrzahl von Frequenzbändern aufgeteilt. Mit anderen Worten wird das Eingangs-Audiosignal in eine Mehrzahl von Teilbandsignalen überführt, die getrennt voneinander in Frequenzkanälen geführt und in jeweils spezifischer Weise verarbeitet, insbesondere verstärkt werden. Mittels einer Synthese-Filterbank werden die verarbeiteten Teilbandsignale dann wieder zu dem - alle Frequenzanteile umfassenden - Ausgangs-Audiosignal zusammengeführt.
  • Ein wichtiger Aspekt bei der Verarbeitung eines Audiosignals, insbesondere in einem Hörinstrument, ist einerseits die Latenz, d.h. die durch die Verarbeitung verursachte zeitliche Verzögerung des Audiosignals. Sinnvollerweise sollte die Latenz kleiner als 10 Millisekunden (ms) sein, da eine größere Latenz das Hörerlebnis eines menschlichen Nutzers des Hörinstruments spürbar beeinträchtigen würde. Andererseits ist für einige gebräuchliche Signalverarbeitungsfunktionen wie z.B. Geräuschreduktion oder dynamische Kompression, eine hohe Frequenzauflösung sinnvoll, also eine Aufteilung des Audiosignals in eine große Anzahl von Frequenzbändern mit jeweils nur geringer Bandbreite.
  • Diese beiden Anforderungen stehen allerdings in Konkurrenz miteinander, da das Produkt aus Zeit- und Frequenzauflösung konstant ist (Küpfmüllersche Unschärferelation). In der Praxis wird die minimale, technisch sinnvolle Bandbreite somit limitiert durch die maximal tolerable Latenz, wodurch in einigen Fällen eine zufriedenstellende Signalverarbeitung erschwert oder verhindert wird.
  • So wäre beispielsweise für eine gute Geräuschreduktion von stimmhafter Sprache ein Frequenzabstand zwischen benachbarten Frequenzbändern wünschenswert, der maximal der Hälfte der Fundamentalfrequenz entspricht. Selbst für weibliche Stimmen, bei denen die Fundamentalfrequenz stimmhafter Laute typischerweise zwischen 200 Hertz (Hz) und 300 Hz liegt, kann aber der wünschenswerte Frequenzabstand von 100 Hz bis 150 Hz nicht erreicht werden, da er mit einer zu großen Latenz verbunden wäre. In gängigen Hörinstrumenten wird daher typischerweise als akzeptabler, aber nicht völlig zufriedenstellender Kompromiss zwischen einer möglichst hohen Frequenzauflösung und einer möglichst geringen Latenz eine Frequenzauflösung von 200 Hz bis 500 Hz realisiert.
  • Um dieses Problem zu lösen, werden mitunter Filterbänke eingesetzt, bei denen die Frequenzbänder einen ungleichmäßigen, nämlich mit steigender Frequenz kontinuierlich oder sprunghaft zunehmenden Frequenzabstand haben. So ist aus EP 2 124 335 B1 eine zweistufige Analyse-Filterbank-Einrichtung für eine Hörvorrichtung offenbart, bei der das zu verarbeitende Audiosignal durch eine erste Filterbank in vier erste Frequenzbänder und dann durch eine zweite Filterbank weiter in 24 zweite Frequenzbänder aufgeteilt wird. Von den 24 zweiten Frequenzbändern haben die unteren zwölf Frequenzbänder einen wesentlich geringeren Frequenzabstand und eine geringere Bandbreite als die oberen zwölf Frequenzbänder.
  • Durch die ungleichmäßige Frequenzauflösung der bekannten Analyse-Filterbank-einrichtung werden die aus der hohen Frequenzaufspaltung resultierenden Nachteile reduziert, da eine erhöhte Latenz nur in einem Teilbereich des Schallspektrums auftritt. Dieser Vorteil wird aber mit einer verschlechterten Klangqualität erkauft, da das Ausgangs-Audiosignal infolge verschieden großer Latenzen und unterschiedlicher Gruppenlaufzeiten in den niederfrequenten und hochfrequenten Frequenzkanälen verzerrt wird. Zudem hat bei nicht-gleichförmigen Filterbänken typischerweise jedes Teilband eine andere Bandbreite. Eine mögliche Unterabtastung muss sich aber an dem Band mit der höchsten Bandbreite orientieren. Hieraus ergibt sich eine vergleichsweise ineffektive Signalverarbeitung.
  • In EP 3 197 181 A1 sind andererseits ein Verfahren und eine Vorrichtung zur Verarbeitung eines Audiosignals in einem Hörinstrument beschrieben, wobei aus dem Eingangs-Audiosignal eine Vielzahl von Signal-Blöcken in der Zeitdomäne gebildet werden. Zur Reduzierung der Latenz werden diese Zeitblöcke zumindest teilweise prädiziert; d.h. der Signalverlauf dieser Zeitblöcke wird in die Zukunft extrapoliert. Die prädizierten Zeit-Blöcke werden dann durch die Filterbank in Frequenzbänder aufgeteilt und somit in die Frequenzdomäne transformiert. Das bekannte Verfahren führt allerdings ebenfalls infolge der Prädiktion zu einer spürbaren Beeinträchtigung der Klangqualität.
  • Der Erfindung liegt die Aufgabe zugrunde, eine frequenzselektive Verarbeitung eines Audiosignals mit geringer Latenz und hoher (Klang-)Qualität zu ermöglichen. Dabei soll insbesondere in einem Teilbereich des hörbaren Schallspektrums eine hohe Frequenzauflösung ermöglicht werden.
  • Bezüglich eines Verfahrens zur (frequenzspezifischen) Verarbeitung eines Audiosignals wird diese Aufgabe erfindungsgemäß gelöst durch die Merkmale des Anspruchs 1. Bezüglich einer Vorrichtung zur (frequenzspezifischen) Verarbeitung eines Audiosignals wird die obige Aufgabe erfindungsgemäß gelöst durch die Merkmale des Anspruchs 9. Vorteilhafte und teils für sich gesehen erfinderische Ausgestaltungen und Weiterentwicklungen der Erfindung sind in den Unteransprüchen und der nachfolgenden Beschreibung dargelegt.
  • Im Zuge des Verfahrens wird zur Verarbeitung eines Eingangs-Audiosignals, insbesondere in einem Hörinstrument, das Eingangs-Audiosignal zunächst mittels einer ersten Analyse-Filterbank spektral in eine Mehrzahl von ersten Frequenzbändern aufgeteilt (erste Frequenzaufspaltung). Eine erste Untergruppe (Teilmenge) der ersten Frequenzbänder wird in mindestens einer weiteren Frequenzaufspaltung mittels mindestens einer weiteren Analyse-Filterbank in (gegenüber den ersten Frequenzbändern schmalbandigere) Unter-Frequenzbänder aufgeteilt. Das in die ersten Frequenzbänder und ggf. in die Unter-Frequenzbänder aufgeteilte Eingangs-Audiosignal wird frequenzselektiv verarbeitet, insbesondere verstärkt. Das in die ersten Frequenzbänder und ggf. in die Unter-Frequenzbänder aufgeteilte und frequenzselektiv verarbeitete Eingangs-Audiosignal wird dann wieder zu einem Ausgangs-Audiosignal zusammengeführt.
  • Erfindungsgemäß wird nun auf den feiner aufgespalteten Teil des Eingangs-Audiosignals (und bevorzugt nur auf diesen Teil des Eingangs-Audiosignals) eine Prädiktion angewendet, die eine durch die oder jede weitere Frequenzaufspaltung verursachte Latenz kompensiert, also vollständig eliminiert oder zumindest verringert. Durch die Prädiktion werden mit anderen Worten Latenzunterschiede zwischen den Frequenzbändern und Unter-Frequenzbändern infolge der oder jeder weiteren Frequenzaufspaltung kompensiert. Insbesondere wird die Latenz des feiner frequenzaufgeteilten Teils des Eingangs-Audiosignals an die geringere Latenz eines gröber frequenzaufgeteilten Teils des Eingangs-Audiosignals angeglichen.
  • Im Gegensatz zu dem aus EP 3 197 181 A1 bekannten Verfahren wird die Prädiktion hierbei in der Frequenzdomäne angewendet. Für den Zeitpunkt oder Ort, an dem die Prädiktion innerhalb der Frequenzdomäne angewendet wird, gibt es im Rahmen der Erfindung mehrere Ausführungsvarianten. So wird die Prädiktion entweder direkt auf die Unter-Frequenzbänder angewendet und/oder auf diejenigen ersten Frequenzbänder, aus denen die Unter-Frequenzbänder abgeleitet wurden. Die Prädiktion kann dabei jeweils vor oder nach der Signalverarbeitung oder auch zwischen zwei von ggf. mehreren Verarbeitungsschritten vorgenommen werden. Die Prädiktion kann schließlich im Rahmen der Erfindung auch in mehreren einander nachgeschalteten Prädiktionsschritten erfolgen.
  • Durch das vorstehend beschriebene Verfahren wird in einem Teilbereich des Schallspektrums eine besondere feine Frequenzaufspaltung ermöglicht, wobei gleichzeitig durch die Prädiktion die mit einer ungleichmäßigen Frequenzaufspaltung normalerweise einhergehende Verzerrung des Ausgangssignals vermieden oder zumindest reduziert wird. Im Vergleich zu dem aus EP 3 197 181 A1 bekannten Verfahren wird aber auch die nachteilige Auswirkung der Prädiktion auf die Klangqualität reduziert, da die Prädiktion nur auf einen Teilbereich des Schallspektrums angewendet wird. Somit werden insgesamt eine hohe Frequenzauflösung in einem Teilbereich des Schallspektrums in Kombination mit einer besonders guten Klangqualität erreicht.
  • In einer bevorzugten Ausführung des Verfahrens ist die Frequenzaufspaltung zweistufig ausgeführt. Dabei wird eine erste Untergruppe (Teilmenge) der ersten Frequenzbänder zweite Frequenzaufspaltung mittels einer zweiten Analyse-Filterbank feiner in zweite Frequenzbänder (d.h. Unter-Frequenzbänder der zweiten Stufe) aufgespaltet. Jedes erste Frequenzband der ersten Untergruppe wird also wiederum in eine Mehrzahl dieser zweiten Frequenzbänder aufgeteilt. Die Prädiktion wird hierbei auf die zweiten Frequenzbänder oder die ersten Frequenzbänder der ersten Untergruppe angewendet, um die durch die zweite Frequenzaufspaltung verursachte Latenz zu kompensieren.
  • Die Grundidee des erfindungsgemäßen Verfahrens, nämlich die feinere Frequenzaufspaltung eines spektralen Teils des Eingangs-Audiosignals, verbunden mit einer Prädiktion dieses feiner aufgespalteten spektralen Bereichs zur Kompensation der durch die feinere Frequenzaufspaltung verursachten Latenz, wird optional auf n-stufige Frequenzaufspaltungen (mit n = 3,4,5,...) erweitert. Dabei wird allgemein eine Untergruppe der i-ten Frequenzbänder (mit i = 2,3,4,...) in noch schmalbandigere (i+1)-te Frequenzbänder aufgeteilt. Der mehrfach frequenzaufgeteilte Teil des Eingangs-Audiosignals wird hierbei in der Frequenzdomäne jeweils derart prädiziert, dass die durch die mehrfache Frequenzaufteilung verursachte Latenz jeweils kompensiert wird.
  • So wird in einer dreistufigen Ausführung dieses Verfahrensprinzips jedes der zweiten Frequenzbänder einer Untergruppe der zweiten Frequenzbänder in einer dritten Frequenzaufspaltung mittels einer dritten Analyse-Filterbank in eine Mehrzahl von dritten Frequenzbändern (d.h. Unter-Frequenzbändern der 3. Stufe) aufgeteilt. Auf die dritten Frequenzbänder und/oder auf die zweiten Frequenzbänder, aus denen die dritten Frequenzbänder abgeleitet wurden, und/oder auf die ersten Frequenzbänder, aus denen die dritten Frequenzbänder abgeleitet wurden, wird dabei die Prädiktion derart angewendet, dass die durch die zweite und dritte Frequenzaufspaltung verursachte Latenz kompensiert wird.
  • Die erste Untergruppe der ersten Frequenzbänder wird vorzugsweise derart gewählt, dass sie einen zusammenhängenden niederfrequenten Bereich des Schallspektrums, insbesondere die unteren 2 bis 3 KHz des Schallspektrums, abdeckt. Die erste Untergruppe der ersten Frequenzbänder wird mit anderen Worten vorzugsweise aus einer Mehrzahl der ersten Frequenzbänder gebildet, die hinsichtlich ihrer jeweiligen Mittenfrequenz unmittelbar benachbart sind und das unterste erste Frequenzband umfassen. Dies ist insbesondere für die Verarbeitung von Audiosignalen, die menschliche Sprache enthalten, besonders vorteilhaft. Denn einerseits dominieren die Schallanteile von Sprachgeräuschen, insbesondere bei stimmhaften Lauten, in diesem niederfrequenten Bereich, und andererseits ist auch die Frequenzauflösung des menschlichen Gehörs bei niedrigen Frequenzen besonders hoch.
  • Grundsätzlich kann das Verfahren bei einer gewöhnlichen mehrstufigen Filterbank eingesetzt werden, wie sie beispielsweise aus EP 2 124 335 B1 bekannt ist. Vorzugweise wirkt die oder jede weitere Analyse-Filterbank aber nur auf die erste Untergruppe der ersten Frequenzbänder. Eine zweite Untergruppe der ersten Frequenzbänder wird dagegen bevorzugt ohne weitere Frequenzaufspaltung der frequenzselektiven Verarbeitung, insbesondere Verstärkung, unterzogen. Hierdurch wird insgesamt eine besonders geringe Latenz erzielt.
  • Eine besonders effiziente Frequenzaufspaltung und Verarbeitung des Eingangs-Audiosignals wird in einer vorteilhaften Ausgestaltung der Erfindung dadurch erzielt, dass die ersten Frequenzbänder eine einheitliche, d.h. für alle ersten Frequenzbänder gleiche, erste Bandbreite haben. Aus dem gleichen Grund sind - zusätzlich der alternativ - auch die i-ten (mit i = 2,3,...) Frequenzbänder vorzugsweise derart gestaltet, dass diese i-ten Frequenzbänder jeweils eine einheitliche, d.h. für alle i-ten Frequenzbänder gleiche, i-te Bandbreite haben. Die erste Bandbreite ist dabei insbesondere ein ganzzahliges Vielfaches der zweiten Bandbreite; die zweite Bandbreite ggf. ein ganzzahliges Vielfaches der dritten Bandbreite, etc.
  • Grundsätzlich kann der feiner frequenzaufgeteilte Teil des Eingangs-Audiosignals im Rahmen der Erfindung linear prädiziert werden. Vorzugsweise handelt es sich bei der auf die ersten Frequenzbänder der ersten Untergruppe oder die daraus abgeleiteten Unter-Frequenzbänder angewendeten Prädiktion aber um eine nichtlineare Prädiktion.
  • In einer besonders vorteilhaften Ausführungsvariante der Erfindung werden ein oder mehrere Prädiktionsalgorithmen eingesetzt, die zur Laufzeit des Verfahrens, d.h. während der Signalverarbeitung, adaptiv sind. Im Gegensatz zu vorab konfigurierten oder trainierten Prädiktionsalgorithmen, die während der Laufzeit des Verfahrens nicht-adaptiv (statisch) sind, sind adaptive Prädiktionsalgorithmen einerseits sehr flexibel und andererseits ressourcen-sparend und deshalb insbesondere für den Einsatz in einem Hörinstrument besonders geeignet.
  • In geeigneten Ausführungen der Erfindung werden für die Durchführung der Prädiktion insbesondere mindestens ein Hammerstein-Modell, ein rekurrentes neuronales Netzwerk und/oder ein Echo-State-Netzwerk eingesetzt.
  • Um den negativen Einfluss der ungleichmäßigen Frequenzaufspaltung des Eingangs-Audiosignals und der Prädiktion auf die Klangqualität des Ausgangssignals insgesamt noch weiter zu reduzieren, wird das vorstehend beschriebene Verfahren in einer Weiterbildung der Erfindung nur zeitweise in Situationen eingesetzt, in denen es besondere Vorteile bringt, nämlich insbesondere bei der Verarbeitung von Schall, der stimmhafte Sprache enthält. Hierzu wird das Eingangs-Audiosignal - frequenzbandübergreifend oder bandspezifisch - auf die Anwesenheit von stimmhafter Sprache analysiert. Auf dem zu dem Ausgabe-Audiosignal führenden Signalpfad werden die oder jede weitere Frequenzaufspaltung und damit auch die Prädiktion dabei in mindestens einem der ersten Frequenzbänder oder Unter-Frequenzbänder nur dann vorgenommen, wenn dort die Anwesenheit von stimmhafter Sprache im Eingangs-Audiosignal erkannt wird. Die oder jede weitere Frequenzaufspaltung und/oder die Prädiktion können optional aber auch bei Abwesenheit von stimmhafter Sprache im Hintergrund der Signalverarbeitung weiterlaufen, ohne eine Auswirkung auf das Ausgangs-Audiosignal zu haben.
  • Zusätzlich oder alternativ hierzu wird zu dem gleichen Zweck - frequenzbandübergreifend oder bandspezifisch - die Genauigkeit (Zuverlässigkeit) der Prädiktion ermittelt. Auf dem zu dem Ausgabe-Audiosignal führenden Signalpfad werden die feinere Frequenzaufspaltung eines Teils des Eingangs-Audiosignals (also die Ableitung der Unter-Frequenzbänder) und damit auch die Prädiktion dabei wiederum in mindestens einem der ersten Frequenzbänder oder Unter-Frequenzbänder nur dann vorgenommen, wenn dort die Genauigkeit der Prädiktion ein vorgegebenes Kriterium erfüllt, insbesondere einen vorgegeben Schwellwert überschreitet. Die oder jede weitere Frequenzaufspaltung und/oder die Prädiktion können optional aber auch bei ungenügender Genauigkeit der Prädiktion im Hintergrund der Signalverarbeitung weiterlaufen, ohne eine Auswirkung auf das Ausgangs-Audiosignal zu haben.
  • Bei der erfindungsgemäßen Vorrichtung handelt es sich insbesondere um ein Hörinstrument, vorzugsweise ein Hörgerät, in einer der eingangs beschriebenen Bauformen.
  • Die Vorrichtung umfasst eine Analyse-Filterbank-Einrichtung mit einer ersten Analyse-Filterbank und mindestens einer weiteren Analyse-Filterbank. Die erste Analyse-Filterbank ist dazu eingerichtet, das Eingangs-Audiosignal in eine Mehrzahl von ersten Frequenzbändern aufzuteilen. Die mindestens eine weitere Analyse-Filterbank ist der ersten Analyse-Filterbank nachgeschaltet und dazu eingerichtet, jedes erste Frequenzband einer ersten Untergruppe der ersten Frequenzbänder in eine Mehrzahl von Unter-Frequenzbändern aufzuteilen. Wie vorstehend beschrieben umfasst die Analyse-Filterbank-Einrichtung optional zusätzlich zu einer zweiten Analyse-Filterbank eine wiederum nachgeschaltete dritte Analyse-Filterbank, die eine Untergruppe der zweiten Frequenzbänder noch feiner in dritte Frequenzbänder aufspaltet, sowie ggf. noch eine oder mehrere weitere nachgeschaltete Analyse-Filterbänke.
  • Die Vorrichtung umfasst weiterhin eine Signalverarbeitungseinheit zur frequenzselektiven Verarbeitung, insbesondere Verstärkung des in die ersten Frequenzbänder bzw. die Unter-Frequenzbänder aufgeteilten Eingangs-Audiosignals, sowie eine der Signalverarbeitungseinheit nachgeschaltete Synthese-Filterbank-Einrichtung, die dazu eingerichtet ist, das in die ersten Frequenzbänder und ggf. die Unter-Frequenzbänder aufgeteilte und frequenzselektiv verarbeitete Eingangs-Audiosignal zu einem Ausgangs-Audiosignal zusammenzuführen.
  • Erfindungsgemäß umfasst die Vorrichtung mindestens einen Prädiktor, der dazu eingerichtet ist, auf die ersten Frequenzbänder der ersten Untergruppe und/oder die daraus abgeleiteten Unter-Frequenzbänder eine Prädiktion anzuwenden, um Latenzunterschiede zwischen den ersten Frequenzbändern und Unter-Frequenzbändern infolge der oder jeder weiteren Frequenzaufspaltung zu kompensieren.
  • Die Signalverarbeitungseinheit ist vorzugsweise in einem digitalen Signalprozessor des Hörinstruments implementiert. Die Signalverarbeitungseinheit kann im Rahmen der Erfindung in Form von (nicht-programmierbaren) elektronischen Schaltkreisen realisiert sein. Der Signalprozessor ist hierbei beispielsweise als ASIC ausgebildet oder umfasst einen solchen. Alternativ ist die Signalverarbeitungseinheit in Form von Software realisiert. In diesem Fall ist der Signalprozessor durch ein programmierbares elektronisches Bauteil gebildet. Wiederum alternativ hierzu ist die Signalverarbeitungseinheit durch eine Kombination von nicht-programmierbaren Schaltkreisen und Software gebildet. Der Signalprozessor ist dabei durch einen Hybrid-Chip gebildet, der mindestens eine programmierbare Komponente und mindestens eine nicht-programmierbare Komponente umfasst.
  • Die Synthese-Filterbank-Einrichtung ist vorzugsweise spiegelsymmetrisch zu der Analyse-Filterbank-Einrichtung ausgebildet und umfasst somit zu jeder Analyse-Filterbank ein entsprechendes Gegenstück. Die Synthese-Filterbank-Einrichtung umfasst insbesondere eine zweite Synthese-Filterbank, die die zweiten Frequenzbänder nach der Signalverarbeitung wieder in erste Frequenzbänder vereint, sowie eine erste Synthese-Filterbank, die die ersten Frequenzbänder zu dem Ausgangssignal zusammenfasst. In Ausführungsformen, in denen die Analyse-Filterbank-Einrichtung mehr als zwei Analyse-Filterbänke umfasst, umfasst auch die Synthese-Filterbank vorzugsweise eine entsprechende Mehrzahl an Synthese-Filterbänken.
  • Die erfindungsgemäße Vorrichtung ist allgemein zur automatischen Durchführung des vorstehend beschriebenen erfindungsgemäßen Verfahrens vorgesehen und eingerichtet. Die vorstehend beschriebenen Ausgestaltungen und Fortbildungen des Verfahrens korrespondieren dabei mit entsprechenden Ausgestaltungen und Fortbildungen der Vorrichtung. Die Ausführungen zu notwendigen und optionalen Merkmalen des Verfahrens und deren jeweiligen Wirkungen und Vorteile sind daher auf die Vorrichtung übertragbar, und umgekehrt.
  • Die Vorrichtung ist somit in bevorzugten Ausgestaltungen derart ausgebildet,
    • • dass die erste Untergruppe der ersten Frequenzbänder aus einer Mehrzahl der ersten Frequenzbänder gebildet ist, die hinsichtlich ihrer jeweiligen Mittenfrequenz unmittelbar benachbart sind und das unterste erste Frequenzband umfassen,
    • • dass eine zweite Untergruppe der ersten Frequenzbänder der Signalverarbeitungseinheit direkt zugeführt ist, um die zweite Untergruppe der ersten Frequenzbänder ohne weitere Frequenzaufspaltung der frequenzselektiven Verarbeitung zu unterziehen,
    • • dass die ersten Frequenzbänder und/oder die Unter-Frequenzbänder i-ter Stufe (mit i = 2,3,4,...) eine einheitliche erste bzw. i-te Bandbreite haben, wobei die erste Bandbreite insbesondere ein ganzzahliges Vielfaches der zweiten Bandbreite beträgt, etc.,
    • • dass der mindestens eine Prädiktor nicht-linear ist, und/oder
    • • dass der mindestens eine Prädiktor zur Laufzeit, also während der Signalverarbeitung, adaptiv ist.
  • Optional umfasst die Vorrichtung ein Spracherkennungsmodul, das dazu eingerichtet ist, das Eingangs-Audiosignal auf die Anwesenheit von stimmhafter Sprache zu analysieren, und eine auch als „Signalweiche“ bezeichnete Schalteinrichtung, die dazu eingerichtet ist, die oder jede weitere Analyse-Filterbank nur dann zu aktivieren, wenn das Spracherkennungsmodul die Anwesenheit von stimmhafter Sprache im Eingangs-Audiosignal erkennt.
  • Alternativ oder zusätzlich umfasst die Vorrichtung eine mit der vorstehend beschriebenen Schalteinrichtung identische oder von dieser verschiedene Schalteinrichtung (Signalweiche), die dazu eingerichtet ist, die oder jede weitere Analyse-Filterbank in Abhängigkeit der Genauigkeit (Zuverlässigkeit) der Prädiktion zu aktivieren und zu deaktivieren. Die Genauigkeit der Prädiktion kann grundsätzlich im Rahmen der Erfindung von der Schalteinrichtung selbst durch Analyse der in den ersten Frequenzbändern der ersten Untergruppe jeweils geführten Teilbandsignale ermittelt werden. Vorzugsweise wird aber von dem oder jedem Prädiktor eine für die Genauigkeit der Prädiktion charakteristische Kenngröße ermittelt und an die Schalteinrichtung ausgegeben, die in Abhängigkeit von dieser Kenngröße die zweite Analyse-Filterbank aktiviert und deaktiviert. Als Kenngröße für die Genauigkeit der Prädiktion wird insbesondere der sogenannte „Prediction Gain“ herangezogen.
  • Die Analyse-Filterbank-Einrichtung, die Synthese-Filterbank-Einrichtung, der oder jeder Prädiktor sowie - falls vorhanden - das Spracherkennungsmodul und/oder die oder jede Schalteinrichtung sind vorzugsweise - in Form von (nicht-programmierbarer Hardware) und/oder Software - in dem Signalprozessor der Vorrichtung integriert. Insbesondere kann es sich bei der oder jeder Schalteinrichtung im Rahmen der Erfindung auch um ein Softwaremodul handeln.
  • Nachfolgend werden Ausführungsbeispiele der Erfindung anhand einer Zeichnung näher erläutert. Darin zeigen:
    • 1 in einer schematischen Darstellung ein Hörinstrument in Form eines hinter einem Ohr eines Nutzers tragbaren Hörgeräts,
    • 2 in einem schematischen Blockschaltbild den Aufbau einer Signalverarbeitung des Hörinstruments aus 1, und
    • 3 und 4 jeweils in Darstellung gemäß 2 zwei alternative Ausführungsformen des Hörinstruments.
  • Einander entsprechende Teile und Größen sind in allen Figuren stets mit gleichen Bezugszeichen versehen.
  • 1 zeigt als Beispiel für eine erfindungsgemäße Vorrichtung zur Verarbeitung eines Audiosignals ein Hörgerät 2, d.h. ein zur Unterstützung des Hörvermögens eines hörgeschädigten Nutzers eingerichtetes Hörinstrument. Bei dem Hörgerät 2 handelt es sich in dem hier dargestellten Beispiel um ein hinter einem Ohr eines Nutzers tragbares BTE-Hörgerät.
  • Das Hörgerät 2 umfasst innerhalb eines Gehäuses 4 mindestens ein Mikrofon 6 als Eingangswandler sowie einen Hörer 8 als Ausgangswandler. Das Hörgerät 2 umfasst weiterhin eine Batterie 10 und einen (insbesondere digitalen) Signalprozessor 12. Vorzugsweise umfasst der Signalprozessor 12 sowohl eine programmierbare Untereinheit (zum Beispiel einen Mikroprozessor) als auch eine nicht-programmierbare Untereinheit (zum Beispiel einen ASIC).
  • Der Signalprozessor 12 wird aus der Batterie 10 mit einer elektrischen Versorgungsspannung U versorgt.
  • Im Normalbetrieb des Hörgeräts 2 nimmt das Mikrofon 6 einen Luftschall aus der Umgebung des Hörgeräts 2 auf. Das Mikrofon 6 wandelt den Schall in ein (Eingangs-)Audiosignal I um, das eine Information über den aufgenommenen Schall enthält. Das Eingangs-Audiosignal I wird innerhalb des Hörgeräts 2 dem Signalprozessor 12 zugeführt, der dieses Eingangs-Audiosignal I zur Unterstützung des Hörvermögens des Nutzers modifiziert.
  • Der Signalprozessor 12 gibt ein Ausgangs-Audiosignal O, das eine Information über den verarbeiteten und somit modifizierten Schall enthält, an den Hörer 8 aus.
  • Der Hörer 8 wandelt das Ausgangs-Schallsignal O in einen modifizierten Luftschall um. Dieser modifizierte Luftschall wird über einen Schallkanal 14, der den Hörer 8 mit einer Spitze 16 des Gehäuses 4 verbindet, sowie über einen (nicht explizit gezeigten) flexiblen Schallschlauch, der die Spitze 16 mit einem in den Gehörgang des Nutzers eingesetzten Ohrstück verbindet, in den Gehörgang des Nutzers übertragen.
  • Der funktionelle Aufbau des Signalprozessors 12 ist in 2 in näherem Detail dargestellt.
  • In nicht näher dargestellter Weise wird das von dem Mikrofon 6 aufgenommene Eingangs-Audiosignal I zunächst durch einen in den Signalprozessor 12 integrierten oder dem Signalprozessor 12 vorgeschalteten Analog-Digital-Wandler digitalisiert. Das digitalisierte Eingangs-Audiosignal I wird innerhalb des Signalprozessors 12 zunächst einer Analyse-Filterbank-Einrichtung 20 zugeführt, die in dem in 2 dargestellten Beispiel eine erste Analyse-Filterbank 22 und eine dieser nachgeschaltete zweite Analyse-Filterbank 24 umfasst.
  • Mittels der ersten Analyse-Filterbank 22 wird das Eingangs-Audiosignal I in einer ersten Frequenzaufspaltung in eine Mehrzahl von ersten Frequenzbändern 26, also ersten Frequenzkanälen, die jeweils ein Teilbandsignal des Eingangs-Audiosignals I führen, aufgeteilt. In 2 sind vereinfachend lediglich vier erste Frequenzbänder 26 dargestellt. In einer sinnvollen praktischen Umsetzung der Erfindung teilt die erste Analyse-Filterbank 22 das Eingangs-Audiosignal I beispielsweise in 32 erste Frequenzbänder 26 auf. Die Frequenzbänder 26 haben eine einheitliche (erste) Bandbreite von beispielsweise 500 Hz und einen einheitlichen spektralen Abstand von 250 Hz.
  • Die zweite Analyse-Filterbank 24 wirkt nur auf eine (erste) Untergruppe 28 der Frequenzbänder 26, die einen Bereich von 2 bis 3 kHz an dem niederfrequenten Rand des Schallspektrums abdeckt. Die Untergruppe 28 umfasst dabei eine Anzahl von benachbarten Frequenzbändern 26, die das unterste (d.h. niederfrequenteste) erste Frequenzband 26 beinhaltet. In dem in 2 dargestellten Beispiel umfasst die Untergruppe 28 beispielhaft die unteren zwei der insgesamt vier Frequenzbänder 26; in der praktischen Umsetzung umfasst die Untergruppe 28 beispielweise die unteren 12 von insgesamt 32 ersten Frequenzbändern 26.
  • Durch die zweite Analyse-Filterbank 24 wird jedes erste Frequenzband 26 der Untergruppe 28 in einer zweiten Frequenzaufspaltung in mehrere (gemäß 2 beispielhaft in zwei) zweite Frequenzbändern 30 aufgespaltet. Die Frequenzbänder 30 haben eine einheitliche (zweite) Bandbreite von beispielsweise 125 Hz und einen einheitlichen spektralen Abstand von 62,5 Hz.
  • Eine zweite Untergruppe 32 der Frequenzbänder 26, die die nicht zu der Untergruppe 28 gehörenden hochfrequenten Frequenzbänder 26 umfasst, wird an der zweiten Analyse-Filterbank 24 vorbeigeführt und somit keiner zweiten (und feineren) Frequenzaufspaltung unterzogen.
  • Die jeweiligen Teilbandsignale der hochfrequenten Frequenzbänder 26 der Untergruppe 32 sowie der Frequenzbänder 30 werden in einer Signalverarbeitungseinheit 34 verarbeitet (d.h. signaltechnisch modifiziert). Im Zuge dieser Verarbeitung wird insbesondere das jeweilige Teilbandsignal eines jeden Frequenzbandes 26 der Untergruppe 32 sowie eines jeden Frequenzbandes 30 gemäß einem individuellen (d.h. frequenzspezifisch vorgegebenen) Verstärkungsfaktor verstärkt. Im Sinne einer effizienten Signalverarbeitung umfasst die Signalverarbeitungseinheit 34 im Beispiel gemäß 2 zwei Untereinheiten 36 und 38 für die hochfrequenten Frequenzbänder 26 der Untergruppe 32 bzw. für die Frequenzbänder 30, wobei die Untereinheiten 36 und 38 jeweils spezifisch auf die unterschiedliche Bandbreite der zugeführten Frequenzbänder 26 bzw. 30 ausgelegt sind.
  • Durch eine Synthese-Filterbank-Einrichtung 40 werden die verarbeiteten Teilbandsignale der hochfrequenten Frequenzbänder 26 der Untergruppe 32 und der Frequenzbänder 30 zu dem Ausgangs-Audiosignal O kombiniert. Die Synthese-Filterbank-Einrichtung 40 ist spiegelsymmetrisch zu der Analyse-Filterbank-Einrichtung 20 gestaltet. Sie umfasst demnach eine zweite Synthese-Filterbank 42, die die zweiten Frequenzbänder 30 wieder zu den ersten Frequenzbändern 26 der Untergruppe 28 zusammenführt, sowie eine erste Synthese-Filterbank 44, die die ersten Frequenzkanäle 26 der ersten Untergruppe 28 und der Untergruppe 32 zu dem Ausgangs-Audiosignal O zusammenführt.
  • Durch die mittels der Analyse-Filterbank 24 vorgenommene feinere Frequenzaufspaltung wird ein Latenzunterschied der niederfrequenten Teilbandsignale der Frequenzbänder 26 der Untergruppe 28 im Vergleich zu den hochfrequenten Teilbandsignalen der Frequenzbänder 26 der Untergruppe 32 hervorgerufen, der in Abwesenheit weiterer Maßnahmen zu einer Verzerrung des Ausgang-Audiosignals O führen würde.
  • Um diesen Latenzunterschied zu kompensieren (d.h. gänzlich zu eliminieren oder zumindest zu reduzieren), ist in den Signalpfad der Frequenzbänder 30 ein Prädiktor 46 geschaltet. Der Prädiktor 46 ist vorzugsweise als nicht-linearer und im Betrieb des Hörgeräts 2 fortlaufend adaptierender Prädiktor, insbesondere als Hammerstein-Modell, ausgebildet. Der Prädiktor 46 hat für jedes zugeführte Frequenzband 30 spezifisch adaptierte Parameter.
  • Im Gegensatz zu dem aus EP 3 197 181 A1 bekannten Verfahren erfolgt die Prädiktion bei dem Hörgerät 2 in der Frequenzdomäne und wird ausschließlich auf den feiner frequenzgeteilten niederfrequenten Teil des Schallspektrums angewendet. Innerhalb der Frequenzdomäne, also zwischen der ersten Analyse-Filterbank 22 und der ersten Synthese-Filterbank 44 kann der Prädiktor 46 allerdings an verschiedenen Positionen angeordnet werden. In dem Beispiel gemäß 2 ist der Prädiktor 46 der zweiten Analyse-Filterbank 24 und der Untereinheit 38 der Signalverarbeitungseinheit 34 zwischengeschaltet. In 2 sind weiterhin drei alternative Positionen für den (hier mit dem Bezugszeichen 46' gekennzeichneten) Prädiktor angegeben, nämlich
    • • zwischen der ersten Analyse-Filterbank 22 und der zweiten Analyse-Filterbank 24,
    • • zwischen der Untereinheit 38 der Signalverarbeitungseinheit 34 und der zweiten Synthese-Filterbank 42 und
    • • zwischen der zweiten Synthese-Filterbank 42 und der ersten Synthese-Filterbank 44.
  • In einer möglichen Abwandlung der in 2 dargestellten Ausführungsform enthält das Hörgerät 2 mehrere hintereinandergeschaltete Prädiktoren 46, 46', die insbesondere an mehreren der in 2 angegebenen Positionen angeordnet sind und jeweils einen Teil des vorstehend beschriebenen Latenzunterschieds kompensieren.
  • Das von der ersten Synthese-Filterbank 44 ausgegebene Ausgangs-Audiosignal O wird durch einen (nicht näher dargestellten) Digital-Analog-Wandler, der in den Signalprozessor 12 integriert oder dem Signalprozessor 12 nachgeschaltet ist, in ein Analogsignal zurückgewandelt und zur Ausgabe an den Nutzer des Hörgeräts 2 dem Hörer 8 zugeleitet.
  • In 3 ist eine alternative Ausführungsform des Hörgeräts 2 dargestellt, in der die Analyse-Filterbank-Einrichtung 20 und die Synthese-Filterbank-Einrichtung 40 jeweils dreistufig aufgebaut sind. Zusätzlich zu der ersten Analyse-Filterbank 22 und der zweiten Analyse-Filterbank 24 umfasst die Analyse-Filterbank-Einrichtung 20 in dieser Ausführungsform eine dritte Analyse-Filterbank 50 auf eine (erste) Untergruppe 52 der Frequenzbänder 30 wirkt. Die Untergruppe 52 deckt wiederum einen niederfrequenten Teil des von den Frequenzbändern 30 insgesamt überspannten Teils des Schallspektrums ab. Beispielsweise umfasst die Untergruppe 52, insbesondere - im Beispiel gemäß 3 - die unteren zwei der insgesamt vier Frequenzbänder 30; in der praktischen Umsetzung umfasst die Untergruppe 52 zum Beispiel die unteren sechs von insgesamt 12 zweiten Frequenzbändern 30.
  • Durch die dritte Analyse-Filterbank 50 wird jedes zweite Frequenzband 30 der Untergruppe 52 noch feiner in mehrere (gemäß 3 beispielhaft in zwei) dritte Frequenzbändern 54 aufgespaltet (dritte Frequenzaufspaltung). Die Frequenzbänder 54 haben eine einheitliche (dritte) Bandbreite von beispielsweise 62,5 Hz und einen einheitlichen spektralen Abstand von 31,25 Hz.
  • Eine zweite Untergruppe 56 der Frequenzbänder 30, die die nicht zu der Untergruppe 52 gehörenden hochfrequenten Frequenzbänder 30 umfasst, wird an der dritten Analyse-Filterbank 50 vorbeigeführt und somit keiner dritten Frequenzaufspaltung unterzogen.
  • In der Ausführungsform des Hörgeräts 2 gemäß 3 verarbeitet die Untereinheit 38 der Signalverarbeitungseinheit 34 nur die jeweiligen Teilbandsignale der hochfrequenten Frequenzbänder 30 der zweiten Untergruppe 56. Zur Verarbeitung, insbesondere frequenzselektiven Verstärkung, der Teilbandsignale der Frequenzbänder 54 umfasst die Signalverarbeitungseinheit 34 gemäß 3 zusätzlich eine weitere Untereinheit 58, die auf die Bandbreite der Frequenzbänder 54 ausgelegt ist.
  • Die Synthese-Filterbank-Einrichtung 40 ist auch in der Ausführungsform gemäß 3 spiegelsymmetrisch zu der Analyse-Filterbank-Einrichtung 20 eingerichtet. Sie umfasst daher zusätzlich zu der ersten Synthese-Filterbank 44 und der zweiten Synthese-Filterbank 42 eine dritte Synthese-Filterbank 60, die die dritten Frequenzbänder 54 nach der Signalverarbeitung wieder zu den zweiten Frequenzbändern 30 der Untergruppe 52 zusammenführt.
  • In der Ausführungsform des Hörgeräts 2 gemäß 3 wirkt auch der Prädiktor 46 nur auf die jeweiligen Teilbandsignale der hochfrequenten zweiten Frequenzbänder 30 der zweiten Untergruppe 56. Zur Prädiktion der Teilbandsignale der niederfrequenten zweiten Frequenzbänder 30 der ersten Untergruppe 52 und der dritten Frequenzbänder 54 umfasst das Hörgerät 2 gemäß 3 einen weiteren Prädiktor 62. Der Prädiktor 62 ist vorzugsweise vom gleichen Typ wie der Prädiktor 46, aber derart ausgelegt, dass er den durch die zweite und dritte Frequenzaufspaltung verursachten Latenzunterschied zu den Teilbandsignalen der hochfrequenten ersten Frequenzbändern 26 der Untergruppe 32 kompensiert.
  • Auch der Prädiktor 62 kann an verschiedenen Positionen zwischen der zweiten Analyse-Filterbank 24 und der zweiten Synthese-Filterbank 42 angeordnet sein. Weiterhin können auch bei Varianten der Ausführungsform gemäß 3 mehrere Prädiktoren 62 hintereinandergeschaltet sein, die jeweils einen Teil des Latenzunterschieds kompensieren. In einer weiteren Ausführungsvariante sind die Prädiktoren 46 und 62 hintereinandergeschaltet. Der Prädiktor 46 ist hierbei zwischen der ersten Analyse-Filterbank 22 und der zweiten Analyse-Filterbank 24 oder zwischen der zweiten Synthese-Filterbank 42 und der ersten Synthese-Filterbank 44 angeordnet. In diesen Fällen ist der Prädiktor 62 derart ausgelegt, dass er nur den durch die dritte Frequenzaufspaltung verursachten Latenzunterschied kompensiert.
  • 4 zeigt eine weitere Ausführungsform des Hörgeräts 2, die im Wesentlichen der Ausführungsform gemäß 2 entspricht. Im Unterschied zu der Ausführung gemäß 2 erfolgt die zweite Frequenzaufspaltung der niederfrequenten ersten Frequenzbänder 26 der Untergruppe 28 hier aber nur dann, wenn das Eingangs-Audiosignal I stimmhafte Sprache (also stimmhafte gesprochene oder gesungene Laute) enthält.
  • In dem Signalprozessor 12 ist hierzu ein Spracherkennungsmodul 64 implementiert. Das Spracherkennungsmodul 64 erkennt die Anwesenheit von stimmhafter Sprache durch Analyse des in die ersten Frequenzbänder 26 zerlegten Eingangs-Audiosignals I, und hiervon insbesondere des niederfrequenten Anteils. In dem dargestellten Beispiel werden dem Spracherkennungsmodul 64 die Frequenzbänder 26 der Untergruppe 28 als Eingangsgröße zugeführt. Das Spracherkennungsmodul 64 erkennt die Anwesenheit von stimmhafter Sprache dabei insbesondere an dem Vorhandensein einer ausgeprägten Grundfrequenz und/oder dem Auftreten der für stimmhafte Laute charakteristischen dominanten Frequenzen (Formanten). Bei Erkennung von stimmhafter Sprache in dem Eingangs-Audiosignal I gibt das Spracherkennungsmodul 64 ein Steuersignal S1 aus.
  • Um die zweite Frequenzaufspaltung nur bei Erkennung von stimmhafter Sprache vorzunehmen, ist in den Signalpfad der Frequenzbänder 26 der Untergruppe 28 eine Signalweiche 66 geschaltet, die in Abhängigkeit von dem Steuersignal S1 die Teilbandsignale der Frequenzbänder 26 der Untergruppe 28 entweder der zweiten Analyse-Filterbank 24 oder der Untereinheit 36 der Datenverarbeitungseinheit 34 zuleitet. Bei Anliegen des Steuersignals S1 (und somit bei Erkennung von stimmhafter Sprache in dem Eingangs-Audiosignal I) leitet die Signalweiche 66 die Teilbandsignale der Frequenzbänder 26 der Untergruppe 28 der zweiten Analyse-Filterbank 24 zu. In diesem Fall entspricht die Funktion des Hörgeräts 2 aus 4 der in 2 gezeigten Ausführungsform. Wenn das Steuersignal S1 dagegen nicht an der Signalweiche 66 anliegt (und somit von dem Spracherkennungsmodul 64 keine stimmhafte Sprache in dem Eingangs-Audiosignal I erkannt wird, leitet die Signalweiche 66 die Teilbandsignale der Frequenzbänder 26 der Untergruppe 28 dagegen direkt der Untereinheit 36 der Datenverarbeitungseinheit 34 zu. In diesem Fall werden die Teilbandsignale aller ersten Frequenzbänder 26 ohne weitere Frequenzaufspaltung verarbeitet, insbesondere frequenzspezifisch verstärkt. Es findet dann auch keine Prädiktion statt.
  • In einer alternativen Ausführungsvariante des Hörgeräts 2 aus 4 wird die zweite Frequenzaufspaltung nicht in Abhängigkeit von der Erkennung von stimmhafter Sprache aktiviert, sondern in Abhängigkeit von der Genauigkeit (Zuverlässigkeit) der Prädiktion. Der Prädiktor 46 gibt hierbei eine für die Genauigkeit der Prädiktion charakteristische Kenngröße Q aus, insbesondere den sogenannten „Predictor Gain“, der durch die Varianz σx 2 des Eingangssignals des Prädiktors 46 in Relation zu der Varianz des Prädiktionsfehlers σe 2, angegeben in Decibel, gegeben ist: Q [ d B ] = 10 l o g 10 ( σ x 2 σ e 2 )
    Figure DE102021205251A1_0001
  • Wenn dem Prädiktor - wie in 4 dargestellt - mehrere Teilbandsignale als Eingangssignal zugeführt werden, wird die Kenngröße Q beispielsweise aus dem Mittelwert, dem Minimalwert oder dem Maximalwert der einzelnen bandspezifischen Predictor Gains berechnet. Alternativ wird der Predictor Gain eines als Referenz ausgewählten Teilbandsignals als Kenngröße Q herangezogen. Die Kenngröße Q hat in allen diesen Fällen einen umso höheren Wert, je genauer der Prädiktor 46 den Verlauf der zugeführten Teilbandsignale voraussagen kann.
  • Durch ein in dem Signalprozessor 12 implementiertes (und in 4 mit gestrichelten Linien eingetragenes) Bewertungsmodul 68 wird die Kenngröße Q mit einem vorgegebenen Schwellwert vergleichen. Solange die Kenngröße Q den Schwellwert überschreitet, gibt das Bewertungsmodul 68 ein Steuersignal S2 aus, das der Signalweiche 66 anstelle des Steuersignals S1 zugeführt wird.
  • Bei Anliegen des Steuersignals S2 (und somit bei hinreichender Genauigkeit der Prädiktion) leitet die Signalweiche 66 die Teilbandsignale der Frequenzbänder 26 der Untergruppe 28 der zweiten Analyse-Filterbank 24 zu. In diesem Fall entspricht die Funktion des Hörgeräts 2 aus 4 wiederum der in 2 gezeigten Ausführungsform. Wenn das Steuersignal S2 dagegen nicht an der Signalweiche 66 anliegt (und somit die Prädiktion keine hinreichende Genauigkeit aufweist), leitet die Signalweiche 66 die Teilbandsignale der Frequenzbänder 26 der Untergruppe 28 dagegen für eine vorgegebene Zeitspanne direkt der Untereinheit 36 der Datenverarbeitungseinheit 34 zu. In diesem Fall werden die Teilbandsignale aller ersten Frequenzbänder 26 wiederum ohne weitere Frequenzaufspaltung verarbeitet, insbesondere frequenzspezifisch verstärkt. Es findet dann auch keine Prädiktion statt. Nach Ablauf der vorgegebenen Zeitspanne werden die zweite Frequenzaufspaltung und somit auch die Prädiktion wieder aktiviert, um die Genauigkeit der Prädiktion mittels des Bewertungsmoduls 68 erneut zu überprüfen.
  • In der vorstehend beschriebenen Ausführungsvariante ist das Spracherkennungsmodul 64 nicht vorgesehen. Entsprechend wird die Signalweiche 66 ausschließlich über das Steuersignal S2 gesteuert.
  • In einer weiteren Ausführungsvariante des Hörgeräts 2 gemäß 4 sind sowohl das Spracherkennungsmodul 64 als auch das Bewertungsmodul 68 vorgesehen. Die Signalweiche 66 wird hier sowohl durch das Steuersignal S1 als auch durch das Steuersignal S2 angesteuert. Die Steuersignale S1 und S2 sind dabei vorzugsweise UND-verknüpft, so dass die zweite Frequenzaufspaltung nur dann durch die Signalweiche 66 aktiviert wird, wenn sowohl das Steuersignal S1 als auch das Steuersignal S2 anliegt, wenn also sowohl die Anwesenheit von stimmhafter Sprache in dem Eingangs-Audiosignal I erkannt wurde als auch die Prädiktion eine hinreichende Genauigkeit hat.
  • In einer weiteren, nicht näher dargestellten Variante des Hörgeräts 2 gemäß 4 wird die Kenngröße Q für jedes Frequenzband 26 der ersten Untergruppe 28 separat berechnet, insbesondere durch Bestimmung des jeweils bandspezifischen Predictor Gains, und mit einem jeweils bandspezifischen Schwellwert verglichen. Dabei gibt das Bewertungsmodul 68 das Steuersignal S2 bandspezifisch nur für das Frequenzband 26 oder die Frequenzbänder 26 aus, für das bzw. die der bandspezifische Predictor Gain den jeweils zugeordneten Schwellwert überschreitet. Entsprechend aktiviert die Signalweiche 66 die zweite Frequenzaufspaltung selektiv nur für das betroffene Frequenzband 26 oder die betroffenen Frequenzbänder 26. In dieser Variante des Hörgeräts ist der Prädiktor 46 vorzugweise zwischen der Signalweiche 66 und der zweiten Analyse-Filterbank 24 angeordnet.
  • In einer weiteren, nicht näher dargestellten Variante des Hörgeräts 2 gemäß 4 wird das Steuersignal S1 bandspezifisch erzeugt, wenn durch das Spracherkennungsmodul 64 in dem jeweiligen Frequenzband 26 die Anwesenheit von stimmhafter Sprache erkannt wird. Entsprechend aktiviert die Signalweiche 66 auch in diesem Fall die zweite Frequenzaufspaltung selektiv nur für das betroffene Frequenzband 26 oder die betroffenen Frequenzbänder 26.
  • In einer weiteren, nicht näher dargestellten Variante des Hörgeräts 2 gemäß 4 wird der Prädiktor 46 bei einem den Schwellwert unterschreitenden Wert der Kenngröße Q nur aus dem das Mikrofon 6 mit dem Hörer 8 verbindenden Signalpfad geschaltet, läuft aber im Hintergrund der Signalverarbeitung weiter (ohne dass die Prädiktion dabei eine Auswirkung auf das Ausgangs-Audiosignal O hätte). Dies wird beispielsweise dadurch erreicht, dass die Signalweiche 66 spiegelsymmetrisch zu der Darstellung gemäß 4 zwischen die zweite Synthese-Filterbank 42 und die erste Synthese-Filterbank 44 geschaltet wird. In diesem Fall gibt der Prädiktor 46 die Kenngröße Q auch dann ununterbrochen aus, wenn die Kenngröße Q den Schwellwert nicht überschreitet. Das bei dem Ausführungsbeispiel gemäß 4 beschriebene Rückschalten der Signalweiche 66 nach Ablauf der vorgegebenen Zeitspanne zur erneuten Überprüfung der Genauigkeit der Prädiktion ist hier nicht erforderlich und daher auch nicht vorgesehen.
  • Die in den 2 bis 4 dargestellten Komponenten des Signalprozessors 12, nämlich die Analyse-Filterbank-Einrichtung 20 mit den Analyse-Filterbänken 22,24 und ggf. 50, die Datenverarbeitungseinheit 34 mit den Untereinheiten 36,38 und ggf. 58, die Synthese-Filterbank-Einrichtung 40 mit den Synthese-Filterbänken 42, 44 und ggf. 60, der Prädiktor 46 und ggf. der Prädiktor 62, sowie ggf. das Spracherkennungsmodul 64, die Signalweiche 66 und das Bewertungsmodul 68 sind vorzugsweise als Softwaremodule ausgeführt, die im Betrieb des Hörgeräts 2 in dem Signalprozessor 12 ablaufen. Alternativ sind eine oder mehrere dieser Komponenten oder durch nicht-programmierbare elektronische Schaltkreise gebildet.
  • Die Erfindung wird an den vorstehend beschriebenen Ausführungsbeispielen besonders deutlich, ist auf diese Ausführungsbeispiele aber nicht beschränkt. Vielmehr können weitere Ausführungsformen der Erfindung aus den Ansprüchen und der vorstehenden Beschreibung abgeleitet werden. Insbesondere können die anhand der Ausführungsbeispiele beschriebenen Einzelmerkmale der Erfindung im Rahmen der Ansprüche auch in anderer Weise kombiniert werden, ohne den Gegenstand der Erfindung zu verlassen.
  • Bezugszeichenliste
  • 2
    Hörgerät
    4
    Gehäuse
    6
    Mikrofon
    8
    Hörer
    10
    Batterie
    12
    Signalprozessor
    14
    Schallkanal
    16
    Spitze
    20
    Analyse-Filterbank-Einrichtung
    22
    (erste) Analyse-Filterbank
    24
    (zweite) Analyse-Filterbank
    26
    (erstes) Frequenzband
    28
    (erste) Untergruppe
    30
    (zweites) Frequenzband
    32
    (zweite) Untergruppe
    34
    Datenverarbeitungseinheit
    36
    Untereinheit
    38
    Untereinheit
    40
    Synthese-Filterbank-Einrichtung
    42
    (zweite) Synthese-Filterbank
    44
    (erste) Synthese-Filterbank
    46
    Prädiktor
    46'
    Prädiktor (alternative Position)
    50
    (dritte) Analyse-Filterbank
    52
    (erste) Untergruppe
    54
    (drittes) Frequenzband
    56
    (zweite) Untergruppe
    58
    Untereinheit
    60
    (dritte) Synthese-Filterbank
    62
    Prädiktor
    64
    Spracherkennungsmodul
    66
    Signalweiche
    68
    Bewertungsmodul
    I
    Eingangs-Audiosignal
    F
    Fehler
    O
    Ausgangs-Audiosignal
    S1
    Steuersignal
    S2
    Steuersignal
    U
    Versorgungsspannung
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • EP 2124335 B1 [0001, 0010, 0023]
    • EP 3197181 A1 [0012, 0017, 0018, 0059]

Claims (16)

  1. Verfahren zur Verarbeitung eines Eingangs-Audiosignals (I), insbesondere in einem Hörinstrument (4), - wobei das Eingangs-Audiosignal (I) in einer ersten Frequenzaufspaltung mittels einer ersten Analyse-Filterbank (22) in eine Mehrzahl von ersten Frequenzbändern (26) aufgeteilt wird, - wobei die ersten Frequenzbänder (26) einer ersten Untergruppe (28) der ersten Frequenzbänder (26) in mindestens einer weiteren Frequenzaufspaltung mittels mindestens einer weiteren Analyse-Filterbank (24) in eine Mehrzahl von Unter-Frequenzbändern (30,54) aufgeteilt werden, - wobei das in die ersten Frequenzbänder (26) bzw. die Unter-Frequenzbänder (30,54) aufgeteilte Eingangs-Audiosignal (I) frequenzselektiv verarbeitet, insbesondere verstärkt, wird, und - wobei das in die ersten Frequenzbänder (26) bzw. die Unter-Frequenzbänder (30,54) aufgeteilte und frequenzselektiv verarbeitete Eingangs-Audiosignal (I) zu einem Ausgangs-Audiosignal (O) zusammengeführt wird, dadurch gekennzeichnet, dass auf die ersten Frequenzbänder (26) der ersten Untergruppe (28) und/oder auf die daraus abgeleiteten Unter-Frequenzbänder (30,54) eine Prädiktion angewendet wird, um Latenzunterschiede zwischen den ersten Frequenzbändern (26) und Unter-Frequenzbändern (30) infolge der oder jeder weiteren Frequenzaufspaltung zu kompensieren.
  2. Verfahren nach Anspruch 1, wobei die erste Untergruppe (28) der ersten Frequenzbänder (26) aus einer Mehrzahl der ersten Frequenzbänder (26) gebildet wird, die hinsichtlich ihrer jeweiligen Mittenfrequenz unmittelbar benachbart sind und das unterste erste Frequenzband (26) umfassen.
  3. Verfahren nach Anspruch 1 oder 2, wobei eine zweite Untergruppe (32) der ersten Frequenzbänder (26) ohne weitere Frequenzaufspaltung der frequenzselektiven Verarbeitung unterzogen wird.
  4. Verfahren nach einem der Ansprüche 1 bis 3, wobei die ersten Frequenzbänder (26) eine einheitliche erste Bandbreite haben.
  5. Verfahren nach einem der Ansprüche 1 bis 4, wobei die auf die ersten Frequenzbänder (26) der ersten Untergruppe (28) oder auf die Unter-Frequenzbänder (30,54) angewendete Prädiktion nicht-linear ist.
  6. Verfahren nach einem der Ansprüche 1 bis 5, wobei die auf die ersten Frequenzbänder (26) der ersten Untergruppe (28) oder auf die Unter-Frequenzbänder (30, 54) angewendete Prädiktion während der Signalverarbeitung adaptiv ist.
  7. Verfahren nach einem der Ansprüche 1 bis 6, wobei das Eingangs-Audiosignal (I) in mindestens einem der ersten Frequenzbänder (26) oder Unter-Frequenzbänder (30,54) auf die Anwesenheit von stimmhafter Sprache analysiert wird, und wobei die oder jede weitere Frequenzaufspaltung nur dann vorgenommen wird, wenn die Anwesenheit von stimmhafter Sprache in dem Eingangs-Audiosignal (I) erkannt wird.
  8. Verfahren nach einem der Ansprüche 1 bis 7, wobei die Genauigkeit der Prädiktion ermittelt wird, und wobei in mindestens einem der ersten Frequenzbänder (26) oder Unter-Frequenzbänder (30,54) die oder jede weitere Frequenzaufspaltung nur dann vorgenommen wird, wenn die Genauigkeit der Prädiktion ein vorgegebenes Kriterium erfüllt.
  9. Vorrichtung zur Verarbeitung eines Eingangs-Audiosignals (I), insbesondere Hörinstrument (4), - mit einer ersten Analyse-Filterbank (22), die dazu eingerichtet ist, das Eingangs-Audiosignal (I) in einer ersten Frequenzaufspaltung in eine Mehrzahl von ersten Frequenzbändern (26) aufzuteilen, - mit mindestens einer der ersten Analyse-Filterbank (22) nachgeschalteten weiteren Analyse-Filterbank (24,50), die dazu eingerichtet ist, die ersten Frequenzbänder (26) einer ersten Untergruppe (28) der ersten Frequenzbänder (26) in mindestens einer weiteren Frequenzaufspaltung in eine Mehrzahl von Unter-Frequenzbändern (30,54) aufzuteilen, - mit einer Signalverarbeitungseinheit (34) zur frequenzselektiven Verarbeitung, insbesondere Verstärkung, des in die ersten Frequenzbänder (26) bzw. die Unter-Frequenzbänder (30,54) aufgeteilten Eingangs-Audiosignals (I), und - mit einer der Signalverarbeitungseinheit (34) nachgeschalteten Synthese-Filterbank-Einrichtung (40), die dazu eingerichtet ist, das in die ersten Frequenzbänder (26) bzw. die Unter-Frequenzbänder (30,54) aufgeteilte und frequenzselektiv verarbeitete Eingangs-Audiosignal (I) zu einem Ausgangs-Audiosignal (O) zusammenzuführen, gekennzeichnet durch mindestens einen Prädiktor (46, 62), der dazu eingerichtet ist, auf die ersten Frequenzbänder (26) der ersten Untergruppe (28) und/oder auf die daraus abgeleiteten Unter-Frequenzbänder (30,54) eine Prädiktion anzuwenden, um Latenzunterschiede zwischen den ersten Frequenzbändern (26) und Unter-Frequenzbändern (30,54) infolge der oder jeder weiteren Frequenzaufspaltung zu kompensieren.
  10. Vorrichtung nach Anspruch 9, wobei die erste Untergruppe (28) der ersten Frequenzbänder (26) aus einer Mehrzahl der ersten Frequenzbänder (26) gebildet ist, die hinsichtlich ihrer jeweiligen Mittenfrequenz unmittelbar benachbart sind und das unterste erste Frequenzband (26) umfassen.
  11. Vorrichtung nach Anspruch 9 oder 10, wobei eine zweite Untergruppe (32) der ersten Frequenzbänder (26) der Signalverarbeitungseinheit (34) direkt zugeführt sind, um die zweite Untergruppe (32) der ersten Frequenzbänder (26) ohne weitere Frequenzaufspaltung der frequenzselektiven Verarbeitung zu unterziehen.
  12. Vorrichtung nach einem der Ansprüche 9 bis 11, wobei die ersten Frequenzbänder (26) eine einheitliche erste Bandbreite haben.
  13. Vorrichtung nach einem der Ansprüche 9 bis 12, wobei der mindestens eine Prädiktor (46, 62) ein nicht-linearer Prädiktor ist.
  14. Vorrichtung nach einem der Ansprüche 9 bis 13, wobei der mindestens eine Prädiktor (46, 62) ein während der Signalverarbeitung adaptiver Prädiktor ist.
  15. Vorrichtung nach einem der Ansprüche 9 bis 14, mit einem Spracherkennungsmodul (64), das dazu eingerichtet ist, das Eingangs-Audiosignal (I) auf die Anwesenheit von stimmhafter Sprache zu analysieren, und mit einer Schalteinrichtung (66), die dazu eingerichtet ist, die mindestens eine weitere Analyse-Filterbank (24,50) nur dann zu aktivieren, wenn das Spracherkennungsmodul (64) die Anwesenheit von stimmhafter Sprache in dem Eingangs-Audiosignal (I) erkennt.
  16. Vorrichtung nach einem der Ansprüche 9 bis 15, mit einer Schalteinrichtung (66), die dazu eingerichtet ist, die mindestens eine weitere Analyse-Filterbank (24,50) in Abhängigkeit von der Genauigkeit der Prädiktion zu aktivieren und zu deaktivieren.
DE102021205251.7A 2021-05-21 2021-05-21 Verfahren und Vorrichtung zur frequenzselektiven Verarbeitung eines Audiosignals mit geringer Latenz Active DE102021205251B4 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE102021205251.7A DE102021205251B4 (de) 2021-05-21 2021-05-21 Verfahren und Vorrichtung zur frequenzselektiven Verarbeitung eines Audiosignals mit geringer Latenz
EP22168308.9A EP4093052A1 (de) 2021-05-21 2022-04-14 Verfahren und vorrichtung zur frequenzselektiven verarbeitung eines audio-signals mit geringer latenz
CN202210538122.0A CN115379366A (zh) 2021-05-21 2022-05-17 以低延迟对音频信号以选频的方式进行处理的方法和设备
US17/748,550 US11910162B2 (en) 2021-05-21 2022-05-19 Method and device for frequency-selective processing of an audio signal with low latency

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102021205251.7A DE102021205251B4 (de) 2021-05-21 2021-05-21 Verfahren und Vorrichtung zur frequenzselektiven Verarbeitung eines Audiosignals mit geringer Latenz

Publications (2)

Publication Number Publication Date
DE102021205251A1 true DE102021205251A1 (de) 2022-11-24
DE102021205251B4 DE102021205251B4 (de) 2024-08-08

Family

ID=81448592

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102021205251.7A Active DE102021205251B4 (de) 2021-05-21 2021-05-21 Verfahren und Vorrichtung zur frequenzselektiven Verarbeitung eines Audiosignals mit geringer Latenz

Country Status (4)

Country Link
US (1) US11910162B2 (de)
EP (1) EP4093052A1 (de)
CN (1) CN115379366A (de)
DE (1) DE102021205251B4 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102023200405A1 (de) 2023-01-19 2024-07-25 Sivantos Pte. Ltd. Binaurales Hörsystem mit zwei Hörinstrumenten sowie Verfahren zum Betrieb eines solchen Hörsystems

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3197181A1 (de) 2016-01-19 2017-07-26 Sivantos Pte. Ltd. Verfahren zur reduktion der latenzzeit einer filterbank zur filterung eines audiosignals sowie verfahren zum latenzarmen betrieb eines hörsystems
EP2124335B1 (de) 2008-05-21 2018-03-28 Sivantos Pte. Ltd. Verfahren zum Optimieren einer mehrstufigen Filterbank sowie entsprechende Filterbank und Hörvorrichtung

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4852175A (en) * 1988-02-03 1989-07-25 Siemens Hearing Instr Inc Hearing aid signal-processing system
US6996198B2 (en) * 2000-10-27 2006-02-07 At&T Corp. Nonuniform oversampled filter banks for audio signal processing
US8934641B2 (en) * 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
DE102008024534A1 (de) * 2008-05-21 2009-12-03 Siemens Medical Instruments Pte. Ltd. Hörvorrichtung mit einem Entzerrungsfilter im Filterbank-System
DE102008024490B4 (de) * 2008-05-21 2011-09-22 Siemens Medical Instruments Pte. Ltd. Filterbanksystem für Hörgeräte
DE102010026884B4 (de) 2010-07-12 2013-11-07 Siemens Medical Instruments Pte. Ltd. Verfahren zum Betreiben einer Hörvorrichtung mit zweistufiger Transformation
DE102014204557A1 (de) * 2014-03-12 2015-09-17 Siemens Medical Instruments Pte. Ltd. Übertragung eines windreduzierten Signals mit verminderter Latenzzeit
DE102017203630B3 (de) * 2017-03-06 2018-04-26 Sivantos Pte. Ltd. Verfahren zur Frequenzverzerrung eines Audiosignals und nach diesem Verfahren arbeitende Hörvorrichtung
DE102018206689A1 (de) * 2018-04-30 2019-10-31 Sivantos Pte. Ltd. Verfahren zur Rauschunterdrückung in einem Audiosignal
CN111128174A (zh) * 2019-12-31 2020-05-08 北京猎户星空科技有限公司 一种语音信息的处理方法、装置、设备及介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2124335B1 (de) 2008-05-21 2018-03-28 Sivantos Pte. Ltd. Verfahren zum Optimieren einer mehrstufigen Filterbank sowie entsprechende Filterbank und Hörvorrichtung
EP3197181A1 (de) 2016-01-19 2017-07-26 Sivantos Pte. Ltd. Verfahren zur reduktion der latenzzeit einer filterbank zur filterung eines audiosignals sowie verfahren zum latenzarmen betrieb eines hörsystems

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SCHUIJERS, E. [et al.]: Low Complexity Parametric Stereo Coding. In: Audio Engineering Society Convention 116, Mai 2004.

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102023200405A1 (de) 2023-01-19 2024-07-25 Sivantos Pte. Ltd. Binaurales Hörsystem mit zwei Hörinstrumenten sowie Verfahren zum Betrieb eines solchen Hörsystems

Also Published As

Publication number Publication date
EP4093052A1 (de) 2022-11-23
CN115379366A (zh) 2022-11-22
US20220386042A1 (en) 2022-12-01
US11910162B2 (en) 2024-02-20
DE102021205251B4 (de) 2024-08-08

Similar Documents

Publication Publication Date Title
DE10228632B3 (de) Richtungshören bei binauraler Hörgeräteversorgung
DE102006051071B4 (de) Pegelabhängige Geräuschreduktion
CH692884A5 (de) Verfahren zur Verstärkung von Eingangssignalen eines Hörgerätes sowie Schaltung zur Durchführung des Verfahrens.
EP1489885A2 (de) Verfahren zum Betrieb eines Hörhilfegerätes sowie Hörhilfegerät mit einem Mikrofonsystem, bei dem unterschiedliche Richtcharakteristiken einstellbar sind
EP2421282B1 (de) Hörhilfe- und/oder Tinnitus-Therapie-Gerät
EP3454572B1 (de) Verfahren zum erkennen eines defektes in einem hörinstrument
DE10327890A1 (de) Verfahren zum Betrieb eines Hörhilfegerätes sowie Hörhilfegerät mit einem Mikrofonsystem, bei dem unterschiedliche Richtcharakteristiken einstellbar sind
DE60016144T2 (de) Hörhilfegerät
EP2276272B1 (de) Hörvorrichtung und Verfahren zur Unterdrückung von Rückkopplungen
EP1489882A2 (de) Verfahren zum Betrieb eines Hörhilfegerätes, sowie Hörhilfegerät mit einem Mikrofonsystem, bei dem unterschiedliche Richtcharakteristiken einstellbar sind
EP4093052A1 (de) Verfahren und vorrichtung zur frequenzselektiven verarbeitung eines audio-signals mit geringer latenz
EP1503612B1 (de) Hörhilfegerät sowie Verfahren zum Betrieb eines Hörhilfegerätes mit einem Mikrofonsystem, bei dem unterschiedliche Richtcharakteristiken einstellbar sind
EP3373599B1 (de) Verfahren zur frequenzverzerrung eines audiosignals und nach diesem verfahren arbeitende hörvorrichtung
DE102008046040A1 (de) Verfahren zum Betrieb einer Hörvorrichtung mit Richtwirkung und zugehörige Hörvorrichtung
EP2129167B1 (de) Verfahren zum Betrieb eines Hörgeräts und Mikrofonsystem für ein Hörgerät
DE10114101A1 (de) Verfahren zum Verarbeiten eines Eingangssignals in einer Signalverarbeitungseinheit eines Hörgerätes sowie Schaltung zur Durchführung des Verfahrens
EP2822300A1 (de) Erkennen von Hörsituationen mit unterschiedlichen Signalquellen
EP2434781A1 (de) Verfahren zum Rekonstruieren eines Sprachsignals und Hörvorrichtung
EP1351550B1 (de) Verfahren zur Anpassung einer Signalverstärkung in einem Hörgerät sowie ein Hörgerät
AT507844B1 (de) Methode zur trennung von signalpfaden und anwendung auf die verbesserung von sprache mit elektro-larynx
DE3027953A1 (de) Elektro-akustisches hoergeraet mit adaptiver filterschaltung
EP3913618A1 (de) Verfahren zum betrieb eines hörgeräts und hörgerät
DE102020201615B3 (de) Hörsystem mit mindestens einem im oder am Ohr des Nutzers getragenen Hörinstrument sowie Verfahren zum Betrieb eines solchen Hörsystems
DE102023202437B4 (de) Verfahren zur Lokalisierung einer Schallquelle für ein binaurales Hörsystem
DE102021103769B4 (de) Verfahren zur Signalverarbeitung

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R018 Grant decision by examination section/examining division