DE102008031150B3 - Verfahren zur Störgeräuschunterdrückung und zugehöriges Hörgerät - Google Patents

Verfahren zur Störgeräuschunterdrückung und zugehöriges Hörgerät Download PDF

Info

Publication number
DE102008031150B3
DE102008031150B3 DE102008031150A DE102008031150A DE102008031150B3 DE 102008031150 B3 DE102008031150 B3 DE 102008031150B3 DE 102008031150 A DE102008031150 A DE 102008031150A DE 102008031150 A DE102008031150 A DE 102008031150A DE 102008031150 B3 DE102008031150 B3 DE 102008031150B3
Authority
DE
Germany
Prior art keywords
input signal
noise
signal
cepstrum
modified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE102008031150A
Other languages
English (en)
Inventor
Timo Gerkmann
Rainer Prof. Martin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sivantos Pte Ltd
Original Assignee
Siemens Medical Instruments Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Medical Instruments Pte Ltd filed Critical Siemens Medical Instruments Pte Ltd
Priority to DE102008031150A priority Critical patent/DE102008031150B3/de
Priority to EP09159848.2A priority patent/EP2141941A3/de
Priority to US12/489,910 priority patent/US20090257609A1/en
Application granted granted Critical
Publication of DE102008031150B3 publication Critical patent/DE102008031150B3/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Neurosurgery (AREA)
  • Otolaryngology (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Die Erfindung gibt ein Verfahren zur Störgeräuschreduktion eines Eingangssignals (S) an, wobei die Koeffizienten des Cepstrum des Eingangssignals (LSC), des veränderten Eingangssignals und/oder mindestens eines aus dem Eingangssignal gewonnenen Parameters (RLC, SLC) modifiziert werden, und die modifizierten cepstralen Koeffizienten (mRLC, mSLC, mALC) zur Bildung eines Ausgangsignals (SR, aSR) aus dem Eingangssignal (S) verwendet werden, wobei das Ausgangssignal (SR, aSR) gegenüber dem Eingangssignal (S) störgeräuschreduziert wird. Insbesondere bei instationären Geräuschen wird eine Schätzung verbessert und eine verbesserte auditive Qualität bei Hörgeräten erreicht.

Description

  • Die Erfindung betrifft ein im Patentanspruch 1 angegebenes Verfahren zur Störgeräuschunterdrückung und ein im Patentanspruch 6 angegebenes Hörgerät mit Störgeräuschunterdrückung.
  • Hörgeräte sind tragbare Hörvorrichtungen, die zur Versorgung von Schwerhörenden dienen. Um den zahlreichen individuellen Bedürfnissen entgegenzukommen, werden unterschiedliche Bauformen von Hörgeräten wie Hinter-dem-Ohr Hörgeräte, Hörgerät mit externem Hörer und In-dem-Ohr Hörgeräte, z. B. auch Concha-Hörgeräte oder Kanal-Hörgeräte bereitgestellt. Die beispielhaft aufgeführten Hörgeräte werden am Außenohr oder im Gehörgang getragen. Darüber hinaus stehen auf dem Markt aber auch Knochenleitungshörhilfen, implantierbare oder vibrotaktile Hörhilfen zur Verfügung. Dabei erfolgt die Stimulation des geschädigten Gehörs entweder mechanisch oder elektrisch.
  • Hörgeräte besitzen prinzipiell als wesentliche Komponenten einen Eingangswandler, einen Verstärker und einen Ausgangswandler. Der Eingangswandler ist in der Regel ein Schallempfänger, z. B. ein Mikrofon, und/oder ein elektromagnetischer Empfänger, z. B. eine Induktionsspule. Der Ausgangswandler ist meist als elektroakustischer Wandler, z. B. Miniaturlautsprecher, oder als elektromechanischer Wandler, z. B. Knochenleitungshörer, realisiert. Der Verstärker ist üblicherweise in eine Signalverarbeitungseinheit integriert. Dieser prinzipielle Aufbau ist in 1 am Beispiel eines Hinterdem-Ohr Hörgeräts dargestellt. In ein Hörgerätegehäuse 1 zum Tragen hinter dem Ohr sind ein oder mehrere Mikrofone 2 zur Aufnahme des Schalls aus der Umgebung eingebaut. Eine Signalverarbeitungseinheit 3, die ebenfalls in das Hörgerätegehäuse 1 integriert ist, verarbeitet die Mikrofonsignale und verstärkt sie. Das Ausgangssignal der Signalverarbeitungseinheit 3 wird an einen Lautsprecher bzw. Hörer 4 übertragen, der ein akustisches Signal ausgibt. Der Schall wird gegebenenfalls über einen Schallschlauch, der mit einer Otoplastik im Gehörgang fixiert ist, zum Trommelfell des Geräteträgers übertragen. Die Energieversorgung des Hörgeräts und insbesondere die der Signalverarbeitungseinheit 3 erfolgt durch eine ebenfalls ins Hörgerätegehäuse 1 integrierte Batterie 5.
  • Bei der Verarbeitung digitaler Sprachaufnahmen, z. B. mit digitalen Hörgeräten, ist es oft wünschenswert, störende Hintergrundgeräusche zu unterdrücken, ohne dabei das Nutzsignal (Sprache) zu beeinflussen. Hierfür sind Filterverfahren, welche das Kurzzeitspektrum des Signals beeinflussen, wie das Wiener-Filter, bekannt und geeignet. Allerdings setzen diese Verfahren eine genaue Schätzung der frequenzabhängigen Leistung des zu unterdrückenden Störgeräuschs aus einem Eingangssignal voraus. Ist diese Schätzung ungenau, wird entweder eine nicht zufriedenstellende Störgeräuschunterdrückung erreicht, das Wunschsignal wird angegriffen oder es entstehen zusätzliche künstlich erzeugte Störsignale, auch ”musical tones” bzw. „musical noise” genannt. Methoden zur Störgeräuschschätzung, welche diese Probleme vollständig und effizient lösen, stehen noch nicht zur Verfügung.
  • Bislang kann die Störgeräuschleistung prinzipiell durch zwei Ansätze geschätzt werden. Beide Methoden können entweder breitbandig oder bevorzugt in einer Frequenzbereichszerlegung mittels Filterbank oder Kurzzeit-Fourier-Transformation stattfinden:
  • 1. Sprachaktivitätserkennung:
  • Solange keine Sprachaktivität festgestellt wird, betrachtet man die komplette (zeitveränderliche) Eingangssignalleistung als Störgeräusch. Sofern Sprachaktivität detektiert wird, hält man die Störgeräuschschätzung auf dem vor dem Einsetzen der Sprachaktivität geschätzten Wert konstant.
  • 2. Störleistungsschätzung während einer Sprachaktivität (so genanntes ”Minimum-Tracking-Verfahren”):
  • Es ist bekannt, dass auch während einer Sprachaktivität die Sprachsignalleistung in einzelnen Frequenzbereichen immer wieder kurzfristig nahezu Null ist. Liegt nun eine Mischung aus Sprache und vergleichsweise langsam zeitveränderlichem Störgeräusch zugrunde, so entsprechen die Minima der zeitlich betrachteten spektralen Signalleistung der Störgeräuschleistung zu diesen Zeitpunkten. Zwischen den festgestellten Minima muss die Störsignalleistung liegen (”Minimum-Tracking”). Ein derartiges Minimum-Tracking kann beispielsweise mit Hilfe eines Glättungsfilters durchgeführt werden, das beispielsweise in R. Martin, ”Noise power spectral density estimation based an optimal smoothing and minimum statistics”, IEEE Trans. Speech Audio Processing, Vol. 9, Nr. 5, Juli 2001, Seiten 504–512 beschrieben ist. Die Ermittlung der Störgeräuschleistung erfolgt typischerweise getrennt für verschiedene Frequenzbereiche des Eingangssignals. Hierzu wird das Eingangssignal zunächst mittels einer Filterbank oder einer Fourier-Transformation in einzelne Frequenzkomponenten aufgespaltet. Diese Komponenten werden dann getrennt voneinander verarbeitet.
  • Bei der oben genannten 1. Methode, stellt einerseits die zuverlässige Erkennung von Sprachaktivität ein Problem dar, andererseits ist es nicht möglich, zeitlich veränderliche Störgeräusche während gleichzeitiger Sprachaktivität zu verfolgen.
  • Bei der oben beschriebenen 2. Methode sind grundsätzliche Widersprüche in der Einstellung des Algorithmus zu lösen: Wenn Sprache vorliegt, sollte die Störgeräuschschätzung nur langsam angepasst werden, um nicht durch schnelle Adaption Sprachanteile als Störgeräusche zu klassifizieren und hierdurch die Sprachqualität anzugreifen. Liegt keine Sprache vor, so sollte die Störleistungsschätzung ohne Verzögerung der temporalen Feinstruktur des Eingangssignals folgen. Hier aus ergeben sich für die Einstellparameter des Verfahrens, wie z. B. Glättungszeitkonstanten, Fensterlänge für eine Minimumsuche oder Gewichtungsfaktoren widersprüchliche Anforderungen, die bislang nur im Mittel optimal gelöst werden konnten. Außerdem ist diese Methode nicht in der Lage, schnellen Änderungen des Störsignals zu folgen.
  • Eine weitere Möglichkeit zur Sprachverbesserung und der Unterdrückung von „Musical Tones” verspricht die „Cepstrale Glättung” der Gewichtung von spektralen Filtern. In C. Breithaupt et al., „Cepstral Smooting of Spectral Filter Gains for Speech Enhancement Without Musical Noise”, IEEE Signal Processing Letters, Vol. 14, Nr. 12, Dezember 2007, Seiten 1036 bis 1039 wird beschrieben, dass eine rekursive, temporäre Glättung im Wesentlichen auf höhere cepstrale Koeffizienten angewandt wird, wobei jene Koeffizienten ausgenommen sind, welche die Tonhöheninformation repräsentieren. Dieses Verfahren ist auch bei nicht stationären Geräuschen wirksam.
  • Die Aufgabe der vorliegenden Erfindung besteht nun darin, ein weiteres Verfahren und ein Hörgerät für eine verbesserte Störgeräuschunterdrückung anzugeben, wobei insbesondere Sprache weniger angegriffen wird und störende Artefakte effektiver vermieden werden.
  • Gemäß der Erfindung wird die gestellte Aufgabe mit dem Verfahren des unabhängigen Patentanspruchs 1 und dem Hörgerät des unabhängigen Patentanspruchs 6 gelöst.
  • Erfindungsgemäß umfasst das Verfahren zur Störgeräuschreduktion eines Eingangssignals eine Modifikation der Koeffizienten des Cepstrum des Eingangssignals, des veränderten Eingangssignals und/oder mindestens eines aus dem Eingangssignal gewonnenen Parameters, wobei zeitpunktabhängig („Segment zu Segment” = Blockverarbeitung) cepstrale Koeffizienten eines Ersetzungssignals oder eines aus dem Ersetzungssignal gewonnenen Parameters übernommen werden (das entspricht einer von Zeitpunkt zu Zeitpunkt variierenden Übernahme), sowie eine Verwendung der modifizierten cepstralen Koeffizienten zur Bildung eines Ausgangssignals aus dem Eingangssignal, wobei das Ausgangssignal gegenüber dem Eingangssignal störgeräuschreduziert ist.
  • In einer Weiterbildung kann das Eingangssignal aus einem von einem Hörgerät aufgenommenen akustischen Signal gewonnen werden.
  • In einer weiteren Ausführungsform kann das Verfahren folgende Schritte umfassen:
    • – Bildung eines Rauschleistungsspektrums durch eine Störgeräuschabschätzung des Eingangssignals und/oder
    • – Bildung eines Sprachleistungsspektrums durch eine Störgeräuschabschätzung des Eingangssignals,
    • – Ermittlung des Cepstrum des Rauschleistungsspektrums und/oder
    • – Ermittlung des Cepstrum des Sprachleistungsspektrums,
    • – Ermittlung modifizierter cepstraler Koeffizienten für die ermittelten Cepstren des Rauschleistungsspektrums und/oder des Sprachleistungsspektrums mit Hilfe einer ersten Ersetzungsstrategie,
    • – Ermittlung der modifizierten Spektren der Rauschleistung und/oder der Sprachleistung aus den modifizierten Cepstren und
    • – Bildung des störgeräuschreduzierten Ausgangssignals durch Modifikation der spektralen Koeffizienten des Eingangssignals mittels der modifizierten Spektren der Rauschleistung und/oder der Sprachleistung.
  • Des Weiteren kann das Verfahren folgende Schritte umfassen:
    • – Bildung des Cepstrum des Eingangssignals,
    • – Ermittlung modifizierter cepstraler Koeffizienten für das ermittelte Cepstrum des Eingangssignals mit Hilfe einer zweiten Ersetzungsstrategie und
    • – Bildung eines störgeräuschreduzierten Ausgangssignals aus dem modifizierten Cepstrum des Eingangssignals.
  • In einer Weiterbildung kann das Verfahren folgende zusätzliche Schritte umfassen:
    • – Bildung des Cepstrum des störgeräuschreduzierten Ausgangssignals,
    • – Ermittlung modifizierter cepstraler Koeffizienten für das ermittelte Cepstrum des störgeräuschreduzierten Ausgangssignals mit Hilfe der zweiten Ersetzungsstrategie und
    • – Bildung eines weiteren Ausgangssignals aus dem modifizierten Cepstrum des störgeräuschreduzierten Ausgangssignals, welches gegenüber dem Ausgangssignal Artefaktreduziert ist.
  • Der Vorteil einer Verarbeitung im Cepstralbereich liegt darin, dass sich Koeffizienten robust bestimmen lassen, die vorwiegend durch Sprache dominiert sind. Dadurch lassen sich die übrigen Koeffizienten dem Rauschen/Störgeräuschen zuordnen. Sprache kann im Cepstralbereich in die Übertragungsfunktion des Vokaltrakts und die Anregungsfunktion zerlegt werden. Die Information über die Übertragungsfunktion des Vokaltrakts bildet sich auf die unteren cepstralen Koeffizienten ab. Bei stimmhaften Lauten wird sich die Information über die Anregungsfunktion im Wesentlichen in einem cepstralen Maximum im oberen Cepstralbereich wiederfinden. Die Kenntnis der cepstralen Koeffizienten die durch Sprache dominiert sind, kann als a priori Wissen für eine robuste Geräuschreduktion oder zur Rekonstruktion eines natürlich klingenden Restgeräuschs verwendet werden. Insbesondere ist für den Fall instationärer Geräusche eine verbesserte Schätzung und somit eine verbesserte auditive Qualität möglich.
  • Erfindungsgemäß wird auch ein Hörgerät mit Störgeräuschunterdrückung nach einem erfindungsgemäßen Verfahren angegeben. Es umfasst eine Signalverarbeitungseinheit mit einem Rauschleistungsschätzer, einen Sprachleistungsschätzer und eine erste und/oder zweite Ersetzungseinheit zur Modifikation von cepstralen Koeffizienten.
  • Weitere Besonderheiten und Vorteile der Erfindung werden aus den nachfolgenden Erläuterungen mehrerer Ausführungsbeispiele anhand von schematischen Zeichnungen ersichtlich.
  • Es zeigen:
  • 1: einen prinzipiellen Aufbau eines Hörgeräts gemäß Stand der Technik,
  • 2: ein Ablaufdiagramm einer erfindungsgemäßen cepstralen Modifikation und
  • 3: ein Ablaufdiagramm einer weiteren erfindungsgemäßen cepstralen Modifikation.
  • Im Folgenden wird zuerst ein allgemeiner Überblick des erfindungsgemäßen Verfahrens zur Störgeräuschunterdrückung gegeben, ehe auf spezielle Ausführungsformen anhand der 2 und 3 eingegangen wird.
  • Das Cepstrum eines mit Geräuschen überlagerten Eingangssprachsignals s(t) lässt sich wie folgt ermitteln. Gegeben sei ein mit der Abtastrate fs abgetastetes, diskretes Zeitsignal s(t). Dieses Zeitsignal wird in Segmente der Länge M unterteilt. Die Segmente sind mit einem Vorschub von R zueinander versetzt und werden mit einem Analysefenster gewichtet. Die diskrete Fouriertransformierte der Segmente, Sk(l), ist indiziert durch den Frequenzindex k und den Segmentindex l. Das Cepstrum berechnet sich aus der inversen Fourier-Transformation des logarithmierten Betragsspektrums zu sq(l) = IDFT{log(|Sk(l)|}, wobei q den cepstralen Koeffizientenindex, den sogenannten Quefrenzindex, und IDFT{} die inverse diskrete Fourier-Transformation bezeichnet.
  • Der nullte (q = 0) cepstrale Koeffizient gibt Auskunft über den Gleichanteil des logarithmierten Betragsspektrums. Die unteren cepstralen Koeffizienten enthalten die Information über die Einhüllende des Sprachsignals, und somit auch über die für die Verständlichkeit wichtigen Formanten. Als Formanten bezeichnet man Maxima der spektralen Einhüllenden, die aus Resonanzen des Vokaltrakts resultieren. Bei stimmhaften Lauten finden sich im Spektrum Maxima an Vielfachen der Sprachgrundfrequenz. Diese Maxima werden im Cepstrum im Wesentlichen auf ein starkes Maximum abgebildet. Demnach enthalten die unteren cepstralen Koeffizienten und ein Maximum im oberen Cepstralbereich die Informationen über Sprache, während die übrigen cepstralen Koeffizienten mit hoher Wahrscheinlichkeit nicht von Sprache stammen.
  • Die Ausgangssignale spektraler Geräuschreduktionsalgorithmen enthalten zum Teil unnatürliche Artefakte, beispielweise Überhöhungen im Spektralbereich die zu dem sogenanntem ”Musical Noise” führen. Diese lokalen spektralen Maxima verändern die Feinstruktur des Spektrums, welche sich in den oberen cepstralen Bins wieder findet. Da im cepstralen Bereich bekannt ist, welche Koeffizienten mit hoher Wahrscheinlichkeit nicht von der Sprache stammen, lässt sich diese Information nutzen, um spektrale Ausreißer im Ausgangssignal zu vermeiden. Dazu werden die cepstralen Koeffizienten gewisser Parameter des Geräuschreduktionsalgorithmus modifiziert. Die Modifikation kann zum Beispiel durch eine Ersetzung der cepstralen Koeffizienten, die mit hoher Wahrscheinlichkeit nicht von Sprache stammen, durch die entsprechenden Koeffizienten des verrauschten Signals erfolgen.
  • Die folgenden drei Parameter eignen sich für eine cepstrale Modifikation:
    • • die Rauschschätzung, und/oder
    • • die Sprachleistungsschätzung, und/oder
    • • das geräuschreduzierte Ausgangssignal.
  • Das in 2 dargestellte Ablaufdiagramm des erfindungsgemäßen Verfahrens zur Störgeräuschunterdrückung könnte beispielsweise in einer Signalverarbeitungseinheit eines Hörgeräts umgesetzt werden. Über einen breitbandigen Signaleingang gelangt ein elektrisches Signal S, das zum Beispiel aus einem akustischen Umgebungssignal gewonnen wurde, in die Signalverarbeitungseinheit. Das Eingangssignal S wird zunächst einer Diskreten Fourier-Transformation DFT unterzogen, die das Eingangssignal S in seine spektralen Komponenten mit den spektralen Koeffizienten LS zerlegt. Mittels einer Rauschleistungsschätzung RL und einer Sprachleistungsschätzung SL werden die spektralen Koeffizienten RLS, SLS der Störgeräuschleistung bzw. der Sprachleistung abgeschätzt.
  • Aus den so gewonnenen spektralen Koeffizienten RLS, SLS werden mittels inverser Fouriertransformation SCR, SCS des logarithmierten Betragsspektrums die Cepstren der geschätzten Rauschleistung und Sprachleistung gebildet. Es werden somit die cepstralen Koeffizienten RLC, SLC ermittelt. Aus dem Spektrum des Eingangssignals LS wird ebenfalls das Cepstrum mit den cepstralen Koeffizienten LSC ermittelt.
  • Alle drei Cepstren RLC, SLC, LSC werden im Rahmen einer ersten Ersetzungsstrategie ES1 ausgewertet und für eine Modifikation der cepstralen Koeffizienten RLC, SLC der Rauschleistung bzw. der Sprachleistung derart verwendet, dass eine möglichst optimale Störgeräuschunterdrückung des Eingangssignals S und hohe Natürlichkeit des Ausgangssignals SR oder aSR erzielt werden kann. Als Ergebnis der ersten Ersetzungsstrategie ES1 werden die modifizierten cepstralen Koeffizienten mRLS, mSLS der Rauschleistung und der Sprachleistung ermittelt.
  • Aus den modifizierten cepstralen Koeffizienten mRLS, mSLS werden anschließend durch Rücktransformationen CSR, CSS modi fizierte spektrale Koeffizienten mRLS, mSLS der Rauschleistung bzw. der Sprachleistung erzeugt. Mittels eines Gewichtungsverfahrens werden aus den modifizierten Spektren mRLS, mSLS der Rauschleistung und der Sprachleistung unter Berücksichtigung des Spektrums LS des Eingangssignals die Gewichtungsfaktoren GF für die Gewichtung der spektralen Koeffizienten LS des Eingangssignals ermittelt. Bei einer anschließenden Multiplikation MP wird das Spektrum LS des Eingangssignals mit den Gewichtungsfaktoren multipliziert. Die dadurch gebildeten modifizierten spektralen Koeffizienten mLS werden anschließend durch eine inverse diskrete Fourier-Transformation in ein störgeräuschreduziertes Ausgangssignal SR umgewandelt.
  • In 3 ist der Ablauf einer weiteren Ausführungsform des erfindungsgemäßen Verfahrens dargestellt. Bis zur Generierung von modifizierten spektralen Koeffizienten mLS aus einem Eingangssignal S ist das Verfahren identisch dem in 2 beschriebenen.
  • Vor einer Rücktransformation in den Zeitbereich wird aber aus dem störgeräuschreduzierten Spektrum mLS mittels inverser Fourier-Transformation SCA des logarithmierten Betragsspektrums das Cepstrum mit den cepstralen Koeffizienten ALS gebildet. Mit Hilfe einer zweiten Ersetzungsstrategie ES2, welche Artefakte unterdrücken soll, sowie unter Berücksichtigung des Cepstrum LSC des Eingangssignals S werden modifizierte cepstrale Koeffizienten mALC des störgeräuschreduzierten Ausgangssignals mLS erzeugt. Durch eine Spektrumsbildung CSA werden daraus modifizierte spektrale Koeffizienten mALS ermittelt, die anschließend durch eine inverse diskrete Fourier-Transformation IDFT in ein Artefakt-reduziertes Ausgangssignal aSR umgewandelt werden.
  • Die dargestellten Verfahrensschritte können erfindungsgemäß in einen digitalen Signalprozessor eines Hörgeräts implementiert werden. Dadurch kann eine hohe Natürlichkeit eines verstärkten Schallsignals bei gleichzeitiger Störgeräuschunter drückung erzielt werden. Die cepstrale Modifikation überträgt die im ursprünglichen, verrauschten Signal vorhandenen Feinstrukturen in das verbesserte Ausgangssignal und/oder in die Schätzung der Sprachleistung und/oder in die Schätzung der Rauschleistung, so dass eine erhöhte Natürlichkeit erreicht wird und/oder nicht-stationäre Geräusche besser abgebildet werden. Die Möglichkeit, schnell veränderliche Geräusche zu schätzen, macht dieses Verfahren außerordentlich interessant. Bisher bekannte Verfahren erzielen lediglich eine Reduktion der spektralen Fluktuationen, vermindern aber gleichzeitig die zeitliche Feinstruktur.
  • 1
    Hörgerätegehäuse
    2
    Mikrofon
    3
    Signalverarbeitungseinheit
    4
    Hörer
    5
    Batterie
    aSR
    Artefakt-reduziertes Ausgangssignal
    CSA
    Spektrumbildung
    CSR
    Spektrumbildung des modifizierten Cepstrum der Rauschleistung
    CSS
    Spektrumbildung des modifizierten Cepstrum der Sprachleistung
    DFT
    Diskrete Fourier-Transformation
    ES1
    erste Ersetzungsstrategie
    ES2
    zweite Ersetzungsstrategie
    GF
    Gewichtungsfaktoren
    GW
    Ermittlung der Gewichtung der spektralen Koeffizienten
    IDFT
    inverse Diskrete Fourier-Transformation
    LS
    spektrale Koeffizienten des Eingangssignals S
    LSC
    cepstrale Koeffizienten des Eingangssignals S
    MP
    Multiplikation
    mALC
    modifizierte cepstrale Koeffizienten des störgeräuschreduzierten Ausgangssignals mLS
    mALS
    modifizierte spektrale Koeffizienten
    mLS
    spektrale Koeffizienten des störgeräuschreduzierten Eingangssignals S
    mRLC
    modifizierte cepstrale Koeffizienten der Rauschleistung
    mRLS
    modifizierte spektrale Koeffizienten der Rauschleistung
    mSLC
    modifizierte cepstrale Koeffizienten der Sprachleistung
    mSLS
    modifizierte spektrale Koeffizienten der Sprachleistung
    RL
    Rauschleistungsschätzung
    RLC
    cepstrale Koeffizienten der Rauschleistung
    RLS
    spektrale Koeffizienten der Rauschleistung
    S
    Eingangssignal
    SL
    Signalleistungsschätzung
    SLC
    cepstrale Koeffizienten der Sprachleistung
    SLS
    spektrale Koeffizienten der Sprachleistung
    SCR
    Cepstrumbildung aus dem Spektrum der Rauschleistung
    SCS
    Cepstrumbildung aus dem Spektrum der Signalleistung
    SCE
    Cepstrumbildung aus dem Spektrum des Eingangssignals
    SR
    geräuschreduziertes Ausgangssignal

Claims (6)

  1. Verfahren zur Störgeräuschreduktion eines Eingangssignals (S) gekennzeichnet durch: – eine Modifikation der Koeffizienten des Cepstrum des Eingangssignals (LSC), des veränderten Eingangssignals und/oder mindestens eines aus dem Eingangssignal gewonnenen Parameters (RLC, SLC), wobei zeitpunktabhängig cepstrale Koeffizienten eines Ersetzungssignals oder eines aus dem Ersetzungssignal gewonnenen Parameters übernommen werden, und – eine Verwendung der modifizierten cepstralen Koeffizienten (mRLC, mSLC, mALC) zur Bildung eines Ausgangssignals (SR, aSR) aus dem Eingangssignal (S), wobei das Ausgangssignal (SR, aSR) gegenüber dem Eingangssignal (S) störgeräuschreduziert ist.
  2. Verfahren nach Anspruch 1, wobei das Eingangssignal (S) aus einem von einem Hörgerät aufgenommenen akustischen Signal gewonnen wird.
  3. Verfahren nach Anspruch 1 oder 2 gekennzeichnet durch: – Bildung eines Rauschleistungsspektrums (RLS) durch eine Störgeräuschabschätzung (RL) des Eingangssignals (S, LS) und/oder – Bildung eines Sprachleistungsspektrums (SLS) durch eine Sprachleistungsabschätzung (SL) des Eingangssignals (S, SL), – Ermittlung (SCR) des Cepstrum (RLC) des Rauschleistungsspektrums (RLS) und/oder – Ermittlung (SCS) des Cepstrum (SLC) des Sprachleistungsspektrums (SLS), – Ermittlung modifizierter cepstraler Koeffizienten (mRLC, mSLC) für die ermittelten Cepstren (RLC, SLC) des Rauschleistungsspektrums (RLS) und/oder des Sprachleistungsspektrums (SLS) mit Hilfe einer ersten Ersetzungsstrategie (ES1), – Ermittlung (CSR, CSS) der modifizierten Spektren (mRLS, mSLS) der Rauschleistung und/oder der Sprachleistung aus den modifizierten Cepstren (mRLC, mSLC) und – Bildung (GW, MP, IDFT) des störgeräuschreduzierten Ausgangssignals (SR, mLS) durch Modifikation der spektralen Koeffizienten (LS) des Eingangssignals (S) mittels der modifizierten Spektren (mRLS, mSLS) der Rauschleistung und/oder der Sprachleistung.
  4. Verfahren nach Anspruch 1 oder 2 gekennzeichnet durch: – Bildung (SCE) des Cepstrum (LSC) des Eingangssignals )S, LS), – Ermittlung modifizierter cepstraler Koeffizienten für das ermittelte Cepstrum (LSC) des Eingangssignals (S, LS) mit Hilfe einer zweiten Ersetzungsstrategie (ES2) und – Bildung (GW; MP) eines störgeräuschreduzierten Ausgangssignals (SR) aus dem modifizierten Cepstrum (mLS) des Eingangssignals (S).
  5. Verfahren nach Anspruch 3 gekennzeichnet durch: – Bildung (SCA) des Cepstrum (ALC) des störgeräuschreduzierten Ausgangssignals (SR, mLS), – Ermittlung modifizierter cepstraler Koeffizienten (mALC) für das ermittelte Cepstrum (ALC) des störgeräuschreduzierten Ausgangssignals (SR, mLS) mit Hilfe der zweiten Ersetzungsstrategie (ES2) und – Bildung (CSA, IDFT) eines weiteren Ausgangssignals (aSR) aus dem modifizierten Cepstrum (mALC) des störgeräuschreduzierten Ausgangssignals (SR, mLS), welches gegenüber dem Ausgangssignal (SR, mLS) Artefakt-reduziert ist.
  6. Hörgerät mit Störgeräuschunterdrückung nach einem Verfahren der Ansprüche 1 bis 5 gekennzeichnet durch: eine Signalverarbeitungseinheit mit einem Rauschleistungsschätzer und mit einem Sprachleistungsschätzer sowie mit einer ersten und/oder zweiten Ersetzungseinheit zur Modifikation von cepstralen Koeffizienten.
DE102008031150A 2008-01-07 2008-07-01 Verfahren zur Störgeräuschunterdrückung und zugehöriges Hörgerät Expired - Fee Related DE102008031150B3 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE102008031150A DE102008031150B3 (de) 2008-07-01 2008-07-01 Verfahren zur Störgeräuschunterdrückung und zugehöriges Hörgerät
EP09159848.2A EP2141941A3 (de) 2008-07-01 2009-05-11 Verfahren zur Störgeräuschunterdrückung und zugehöriges Hörgerät
US12/489,910 US20090257609A1 (en) 2008-01-07 2009-06-23 Method for Noise Reduction and Associated Hearing Device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102008031150A DE102008031150B3 (de) 2008-07-01 2008-07-01 Verfahren zur Störgeräuschunterdrückung und zugehöriges Hörgerät

Publications (1)

Publication Number Publication Date
DE102008031150B3 true DE102008031150B3 (de) 2009-11-19

Family

ID=41164008

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102008031150A Expired - Fee Related DE102008031150B3 (de) 2008-01-07 2008-07-01 Verfahren zur Störgeräuschunterdrückung und zugehöriges Hörgerät

Country Status (3)

Country Link
US (1) US20090257609A1 (de)
EP (1) EP2141941A3 (de)
DE (1) DE102008031150B3 (de)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100661313B1 (ko) * 2003-12-03 2006-12-27 한국전자통신연구원 평생 번호를 사용한 이동성 제공이 가능한 sip 기반의멀티미디어 통신 시스템 및 이동성 제공 방법
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8880396B1 (en) * 2010-04-28 2014-11-04 Audience, Inc. Spectrum reconstruction for automatic speech recognition
CN102930870B (zh) * 2012-09-27 2014-04-09 福州大学 利用抗噪幂归一化倒谱系数的鸟类声音识别方法
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9978388B2 (en) 2014-09-12 2018-05-22 Knowles Electronics, Llc Systems and methods for restoration of speech components
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
DK3582514T3 (da) * 2018-06-14 2023-03-06 Oticon As Lydbehandlingsapparat
US20220417677A1 (en) * 2021-06-24 2022-12-29 Orcam Technologies Ltd. Audio feedback for correcting sound degradation

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6990447B2 (en) * 2001-11-15 2006-01-24 Microsoft Corportion Method and apparatus for denoising and deverberation using variational inference and strong speech models
US20030187637A1 (en) * 2002-03-29 2003-10-02 At&T Automatic feature compensation based on decomposition of speech and noise
US7013272B2 (en) * 2002-08-14 2006-03-14 Motorola, Inc. Amplitude masking of spectra for speech recognition method and apparatus
ES2294506T3 (es) * 2004-05-14 2008-04-01 Loquendo S.P.A. Reduccion de ruido para el reconocimiento automatico del habla.
US8150044B2 (en) * 2006-12-31 2012-04-03 Personics Holdings Inc. Method and device configured for sound signature detection

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GERKMANN, T.: Cepstral Smoothing od Spectral Filter Gains for Speech Enhancement Without Musical Noise. In: IEEE Signal Processing Letters, Vol. 14, NO. 12, December 2007, S. 1036-1039 *
GERKMANN, T.: Cepstral Smoothing od Spectral Filter Gains for Speech Enhancement Without Musical Noise. In: IEEE Signal Processing Letters, Vol. 14, NO. 12, December 2007, S. 1036-1039 MARTIN, R.: Noise Power Spectral Density Estimation Based on Optimal Smoothing and Minimum Statistics. In: IEEE Transactions on Speech and Audio Processing, Vol. 9, NO. 5, July 2001, S. 504-512
MARTIN, R.: Noise Power Spectral Density Estimation Based on Optimal Smoothing and Minimum Statistics. In: IEEE Transactions on Speech and Audio Processing, Vol. 9, NO. 5, July 2001, S. 504-512 *

Also Published As

Publication number Publication date
EP2141941A2 (de) 2010-01-06
EP2141941A3 (de) 2014-01-01
US20090257609A1 (en) 2009-10-15

Similar Documents

Publication Publication Date Title
DE102008031150B3 (de) Verfahren zur Störgeräuschunterdrückung und zugehöriges Hörgerät
DE602004004242T2 (de) System und Verfahren zur Verbesserung eines Audiosignals
DE60037034T2 (de) Hörhilfegerät mit signalverarbeitungstechniken
DE10041512B4 (de) Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
DE60116255T2 (de) Rauschunterdückungsvorrichtung und -verfahren
US9060231B2 (en) Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
EP2099235A2 (de) Frequenzumsetzung mittels Warping der hochfrequenten spektralen Hüllkurve bei Hörgeräten
EP1143416A2 (de) Geräuschunterdrückung im Zeitbereich
EP2109329A2 (de) Mehrstufiges Schätzverfahren zur Störgeräuschreduktion und Hörvorrichtung
WO2011110239A1 (de) Enthallen von signalen einer binauralen hörvorrichtung
EP2495724B1 (de) Verfahren und Vorrichtung zum Schätzen eines Störgeräusches
DE102006047694B4 (de) Verfahren zur Dynamikkompression eines Audiosignals und entsprechende Hörvorrichtung
US8787605B2 (en) Frequency translation in hearing assistance devices using additive spectral synthesis
EP2584795B1 (de) Verfahren zum Ermitteln einer Kompressionskennlinie
DE60033039T2 (de) Vorrichtung und verfahren zur unterdrückung von zischlauten unter verwendung von adaptiven filteralgorithmen
EP1926087A1 (de) Anpassung einer Hörvorrichtung an ein Sprachsignal
EP2394271B1 (de) Methode zur trennung von signalpfaden und anwendung auf die verbesserung von sprache mit elektro-larynx
EP2219389B1 (de) Vorrichtung und Verfahren zur Störgeräuschschätzung bei einer binauralen Hörgeräteversorgung
EP3961624B1 (de) Verfahren zum betrieb einer hörvorrichtung in abhängigkeit eines sprachsignals
Madhavi et al. A Thorough Investigation on Designs of Digital Hearing Aid.
DE102022111300A1 (de) Vorrichtung zur Reduzierung des Rauschens bei der Wiedergabe eines Audiosignals mit einem Kopfhörer oder Hörgerät und entsprechendes Verfahren
EP2622879B1 (de) Verfahren und vorrichtung zur frequenzkompression
DE102020210918A1 (de) Verfahren zum Betrieb einer Hörvorrichtung in Abhängigkeit eines Sprachsignals
Monjizade et al. Proposing a New Speech Enhancement Method based on Spectral Subtraction and Binary Masking With a Bank of 128 Gamma-tone Filters
Girisha et al. STFT ALGORITHM FOR IMPLEMENTATION OF AUDITORY COMPENSATION IN HEARING AIDS

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20140201