DE60033826T2 - Verstärkungsregelung von audiosignalen in lärmender umgebung mit hilfe einer filterbank - Google Patents

Verstärkungsregelung von audiosignalen in lärmender umgebung mit hilfe einer filterbank Download PDF

Info

Publication number
DE60033826T2
DE60033826T2 DE60033826T DE60033826T DE60033826T2 DE 60033826 T2 DE60033826 T2 DE 60033826T2 DE 60033826 T DE60033826 T DE 60033826T DE 60033826 T DE60033826 T DE 60033826T DE 60033826 T2 DE60033826 T2 DE 60033826T2
Authority
DE
Germany
Prior art keywords
signal
noise
subband
power
subbands
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60033826T
Other languages
English (en)
Other versions
DE60033826D1 (de
Inventor
Tsvika Licht
Mark M. Friedman
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Clear Audio Ltd
Original Assignee
Clear Audio Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Clear Audio Ltd filed Critical Clear Audio Ltd
Publication of DE60033826D1 publication Critical patent/DE60033826D1/de
Application granted granted Critical
Publication of DE60033826T2 publication Critical patent/DE60033826T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/16Automatic control
    • H03G5/165Equalizers; Volume or gain control in limited frequency bands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Noise Elimination (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stereophonic System (AREA)

Description

  • GEBIET UND ALLGEMEINER STAND DER TECHNIK
  • Die vorliegende Erfindung betrifft Sprachkommunikation und Einrichtungen dafür und insbesondere ein Verfahren und ein System zum Klären von akustischer Sprache und von akustischem Ton in geräuschvollen Umgebungen.
  • Kommunikationseinrichtungen werden häufig in geräuschvollen Umgebungen benutzt. Ein übliches Beispiel der Benutzung einer solchen Einrichtung ist die Benutzung eines Mobiltelefons im Innern eines Fahrzeugs, wie etwa einem Automobil. Die Lärmgeräusche in dieser Umgebung umfassen sowohl das Lärmgeräusch des Fahrzeugs selbst, zum Beispiel das Lärmgeräusch des Motors des Fahrzeugs, als auch Lärmgeräusch, wie etwa Windlärmgeräusch, das von der Bewegung des Fahrzeugs herrührt, und Lärmgeräusch, das von anderen Fahrzeugen empfangen wird.
  • Im Falle von rhythmischem Lärmgeräusch ist bekannt, dass ein Aufhebungssignal erzeugt wird, das ungefähr gleich in der Amplitude und gegenläufig zu der Phase des Lärmgeräusches ist. Dieses Aufhebungssignal wird zu dem Lärmgeräusch addiert, um das Lärmgeräusch weitgehend aufzuheben.
  • Im Falle einer einseitigen Kommunikationseinrichtung, wie etwa einem Autoradio, ist der einfachste Weg, das Umgebungslärmgeräusch zu übertönen, einfach die Lautstärke zu erhöhen, d.h. die Leistung des empfangenen Signals derart zu erhöhen, dass das empfangene Signal das Lärmgeräusch überdeckt. Eine Vielzahl von Verfahren ist bekannt, die dies automatisch tun. Tokumo et al. lehren in der U.S.-Patentschrift 4,476,571 ein automatisches Geräuschsteuerungsgerät für ein Autoradio. Umgebungslärmgeräusch wird tiefpass- und bandpassgefiltert, bevor es als ein Steuerungssignal für eine automatische Lautstärkensteuerung benutzt wird, um sicherzustellen, dass das „Lärmgeräusch" in dem Sprachfrequenzband derart ausgelassen wird, dass das Gerät das Sprechen nicht zusammen mit dem echten Umgebungsgeräusch übertönt. Zwicker et al. lehren in der U.S.-Patentschrift 4,868,881 die spektrale Zerlegung von sowohl einem Autoradiosignal als auch einem Umgebungsgeräuschsignal in drei Frequenz-Teilbänder. Die Tonumfänge der Signale in den drei Teilbändern werden verzögert, geglättet und verglichen. Auf der Basis des Vergleichs wird jedes Teilband des Radiosignals verstärkt, um das zugehörige Lärmgeräusch-Teilband zu übertönen.
  • Diese Verfahren des Stands der Technik übergehen bestimmte psycho-akustische Erscheinungen, die mit der menschlichen Empfindung von hörbaren Signalen verbunden sind, wie zum Beispiel in E. Zwicker und H. Fastl, Psychoacoustics, Facts and Models, Springer, zweite aktualisierte Ausgabe (1999), Seiten 74 bis 84, beschrieben.
  • Eine solche Erscheinung ist Frequenzmaskierung. Wenn ein akustisches Signal zwei ähnliche Frequenzkomponenten aufweist und die Amplitude einer Frequenzkomponente beträchtlich höher als die Amplitude der anderen Frequenzkomponente ist, dann empfindet der Hörer nur die stärkere der zwei Frequenzkomponenten.
  • Eine weitere solche Erscheinung ist Zeitmaskierung. Diese Erscheinung wird in 1 dargestellt, die die Amplituden-Wellenform 12 und die Amplitudeneinhüllende 14 eines kurzen, hochfrequenten Pfeifens 10 als eine Funktion der Zeit zeigt. Ebenfalls in 1 werden eine vordere Zeitmaskierungserweiterung 16, eine hintere Zeitmaskierungserweiterung 18 der Einhüllenden 14 und ein Amplitudenpegel 20 von Umgebungsgeräusch, das weißes Rauschen sein kann, oder das ein Lärmgeräusch mit Monofrequenz bei einer Frequenz nahe der Frequenz des Pfeifens 10 sein kann. Ein Zuhörer, der auf das Pfeifen 10 achtet, wird ebenfalls ein nachfolgendes Pfeifen mit ähnlichen spektralen Eigenschaften empfinden, bis die vordere Zeitmaskierungserweiterung 16 unterhalb eines Pegels 20 des Umgebungsgeräusches fällt, selbst wenn die Amplitudeneinhüllende des nachfolgenden Pfeifens unterhalb des Pegels 20 des Umgebungsgeräusches ist. Ferner empfindet der Zuhörer ebenfalls den gesamten Vorläufer 22 des Pfeifens 10, obwohl die Einhüllende 14 für den größten Teil der Dauer von Vorläufer 22 unterhalb dem Amplitudenpegel 20 des Umgebungsgeräusches ist, weil die hintere Maskierungserweiterung 18 über dem Amplitudenpegel 20 des Umgebungsgeräusches für die Dauer des Vorläufers 22 ist. Von der Rückwärtszeitmaskierung wird angenommen, dass sie die rückwirkende Weiterverarbeitung des Signals, das von dem Zuhörer empfangen wird, zurückwirft, um den Vorläufer 22 von dem Umgebungsgeräusch zu entziehen. Die Dauer der Vorwärtszeitmaskierung ist in der Größenordnung von ungefähr 200 Millisekunden. Die Dauer der Rückwärtszeitmaskierung ist in der Größenordnung von ungefähr 5 bis 50 Millisekunden.
  • Eine dritte solche Erscheinung ist Breitbandmaskierung, in der eine Signalanhäufung vorübergehend das Umgebungsgeräusch maskiert.
  • Viele Kommunikationseinrichtungen, wie etwa Mobiltelefone, sind klein und leichtgewichtig und setzen deshalb einen Zuschlag auf den Kleinleistungsverbrauch. Deshalb gibt es eine weitgehend erkannte Notwendigkeit für, und es wäre höchst vorteilhaft, diese zu haben, Verfahren und zugehörige Kommunikationseinrichtungen, die die psycho-akustischen Erscheinungen ausnutzt, um den Leistungsverbrauch beim Verstärken eines eingehenden Signals über ein Umgebungslärmgeräusch zu reduzieren.
  • KURZDARSTELLUNG DER ERFINDUNG
  • Gemäß der vorliegenden Erfindung wird ein Verfahren zum Verstärken eines Eingangssignals, um ein Lärmgeräusch zu übertönen, bereitgestellt, das folgende Schritte aufweist: (a) Schätzen des Lärmgeräusches, wodurch ein geschätztes Lärmgeräusch gebildet wird; (b) Banddurchlassen des Eingangssignals in mehreren benachbarten Durchlassbändern, um eine entsprechende Mehrzahl von Signal-Teilbändern zu erhalten; (c) Banddurchlassen des geschätzten Lärmgeräusches in den mehreren benachbarten Durchlassbändern, um eine entsprechende Mehrzahl von Lärmgeräusch-Teilbändern zu erhalten; und (d) für jedes Signal-Teilband: (i) Erhalten einer Leistungsmessgröße eines jeden Signal-Teilbandes, (ii) Vergleichen der Leistungsmessgröße eines jeden Signalteilbandes mit der Leistungsmessgröße von mindestens einem anderen Signal-Teilband, (iii) Nullsetzen eines jeden Signal-Teilbandes, wenn die Leistungsmessgröße des mindestens einen anderen Signal-Teilbandes die Leistungsmessgröße eines jeden Signal-Teilbandes um eine Signalmaskierungsschwelle übersteigt, (iv) ansonsten Justieren eines jeden Signal-Teilbandes derart, dass jedes Signal-Teilband ein entsprechendes Lärmgeräusch-Teilband maskiert.
  • Gemäß der vorliegenden Erfindung wird eine Vorrichtung bereitgestellt zum Umwandeln eines Eingangssignals zu einem Ausgangssignal, das von einem Lärmgeräusch unterscheidbar ist, umfassend: (a) einen Mechanismus zum Schätzen des Lärmgeräusches, wodurch ein geschätztes Lärmgeräusch gebildet wird; (b) mehrere Signalbandpassfilter zum Zerlegen des Eingangssignals in mehrere benachbarte Signal-Teilbänder; (c) für jeden Signalbandpassfilter einen entsprechenden Lärmgeräuschbandpassfilter, wobei die Lärmgeräuschbandpassfilter zum Zerlegen des geschätzten Lärmgeräusches in mehrere benachbarte Lärmgeräusch-Teilbänder, die den Signal-Teilbändern entsprechen, dienen; (d) einen Mechanismus zum Erhalten einer Leistungsmessgröße eines jeden Signal-Teilbandes, zum Vergleichen der Leistungsmessgröße eines jeden Signal-Teilbandes mit der Leistungsmessgröße von mindestens einem anderen Signal-Teilband, und zum Nullsetzen eines jeden Signal-Teilbandes, wenn die Leistungsmessgröße von mindestens einem anderen Signal-Teilband die Leistungsmessgröße eines jeden Signal-Teilbandes um eine Signalmaskierungsschwelle übersteigt; und (e) für jedes Signal-Teilband, einen Mechanismus zum Justieren jedes Signal-Teilbandes, um ein entsprechendes Signal-Teilband zu maskieren.
  • Gemäß der vorliegenden Erfindung wird in einem Kommunikationssystem, in welchem ein Benutzer abwechselnd ein empfangenes Signal in einer geräuschvollen Umgebung empfängt und ein gesendetes Signal sendet, ein Verfahren zum Verstärken des empfangenen Signals, um das Lärmgeräusch zu übertönen, bereitgestellt, folgende Schritte umfassend: (a) Schätzen des Lärmgeräusches, wodurch ein geschätztes Lärmgeräusch gebildet wird; (b) Banddurchlassen des Eingangssignals in mehreren benachbarten Durchlassbändern, um eine entsprechende Mehrzahl von Signal-Teilbändern zu erhalten; (c) Banddurchlassen des geschätzten Lärmgeräusches in den mehreren benachbarten Durchlassbändern, um eine entsprechende Mehrzahl von Lärmgeräusch-Teilbändern zu erhalten; und (d) für jedes Signal-Teilband: (i) Erhalten einer Leistungsmessgröße eines jeden Signal-Teilbandes, (ii) Vergleichen der Leistungsmessgröße eines jeden Signalteilbandes mit der Leistungsmessgröße von mindestens einem anderen Signal-Teilband, (iii) Nullsetzen eines jeden Signal-Teilbandes, wenn die Leistungsmessgröße des mindestens einen anderen Signal-Teilbandes die Leistungsmessgröße eines jeden Signal-Teilbandes um eine Signalmaskierungsschwelle übersteigt, (iv) ansonsten Justieren eines jeden Signal-Teilbandes derart, dass jedes Signal-Teilband ein entsprechendes Lärmgeräusch-Teilband maskiert.
  • Gemäß der vorliegenden Erfindung wird eine Kommunikationseinrichtung bereitgestellt, um einem Benutzer zu ermöglichen, abwechselnd ein empfangenes Signal in einer geräuschvollen Umgebung zu empfangen und ein gesendetes Signal zu senden, Folgendes umfassend: (a) einen Mechanismus zum Schätzen des Lärmgeräusches, wodurch ein geschätztes Lärmgeräusch gebildet wird; (b) mehrere Signalbandpassfilter zum Zerlegen des Eingangssignals in mehrere benachbarte Signal-Teilbänder; (c) für jeden Signalbandpassfilter einen entsprechenden Lärmgeräuschbandpassfilter, wobei die Lärmgeräuschbandpassfilter zum Zerlegen des geschätzten Lärmgeräusches in mehrere benachbarte Lärmgeräusch-Teilbänder, die den Signal-Teilbändern entsprechen, dienen; (d) einen Mechanismus zum Erhalten einer Leistungsmessgröße eines jeden Signal-Teilbandes, zum Vergleichen der Leistungsmessgröße eines jeden Signal-Teilbandes mit der Leistungsmessgröße von mindestens einem anderen Signal-Teilband, und zum Nullsetzen eines jeden Signal-Teilbandes, wenn die Leistungsmessgröße von mindestens einem anderen Signal-Teilband die Leistungsmessgröße eines jeden Signal-Teilbandes um eine Signalmaskierungsschwelle übersteigt; und (e) für jedes Signal-Teilband, einen Mechanismus zum Justieren jedes Signal-Teilbandes, um ein entsprechendes Signal-Teilband zu maskieren.
  • Die hauptsächlich beabsichtigte Anwendung der vorliegenden Erfindung gilt der Mobilfunktelefonie, in der ein empfangenes elektronisches Signal verstärkt wird, um ein akustisches Umgebungslärmgeräusch zu übertönen, bevor es in ein akustisches Signal umgewandelt wird. Dennoch umfasst der Umfang der vorliegenden Erfindung alle Umgebungen, in denen ein empfangenes Signal verstärkt wird, um ein Umgebungslärmgeräusch zu übertönen.
  • Gemäß der vorliegenden Erfindung wird das empfangene Signal relativ zu einer Schätzung des Umgebungslärmgeräusches verzögert, um eine Rückwärtszeitmaskierung zu erlauben. Dann werden sowohl das empfangene Signal, als auch eine Schätzung des Umgebungslärmgeräusches in mehrere Teilbänder zerlegt, die den Frequenzspektralbereich von Interesse umfassen. Die Amplitudeneinhüllenden der Signal-Teilbänder werden in Maskierungsfunktionen umgewandelt, die die Erscheinungen von Vorwärtszeitmaskierung und Rückwärtszeitmaskierung in ihren entsprechenden Teilbändern berücksichtigen. Jede Maskierungsfunktion wird verglichen mit den Maskierungsfunktionen von benachbarten Teilbändern. Wenn eine Maskierungsfunktion um mindestens einen vorbestimmten Signalmaskierungsschwellwert kleiner ist als eine benachbarte Maskierungsfunktion, dann wird diese Maskierungsfunktion auf Null gesetzt. Auf ähnliche Weise, wenn die Leistungsamplitudeneinhüllende eines Lärmgeräusch-Teilbandes unter der Leistungsamplitudeneinhüllenden eines benachbarten Lärmgeräusch-Teilbandes um mindestens einen vorbestimmten Lärmgeräusch-Maskierungsschwellwert ist, wird dieses Lärmgeräusch-Teilband auf Null gesetzt. Für Teilbänder, die nicht auf Null gesetzt wurden, wird der Faktor, um den das Signal-Teilband verstärkt werden muss, um das entsprechende Lärmgeräusch-Teilband zu übertönen, durch Teilen der entsprechenden Leistungsamplitudeneinhüllenden des Lärmgeräusch-Teilbands durch einen Nenner, bezogen auf den Wert der entsprechenden Maskierungsfunktion, und Ziehen der Quadratwurzel, um die Signalleistung in Signalamplitude umzuwandeln, bestimmt. Die Signal-Teilbänder werden verstärkt durch diese Faktoren und summiert, um das Ausgangssignal bereitzustellen.
  • Vorzugsweise ist der Nenner der Wert der Maskierungsfunktion selbst. Noch vorteilhafter ist der Nenner der Wert der Maskierungsfunktion, verzögert durch eine Verzögerung, die mindestens so groß ist wie die Verarbeitungszeit, und höchstens so groß wie eine Summe der Verarbeitungszeit und einer geschätzten maximalen Umlaufzeit.
  • Vorzugsweise werden in akustischen Anwendungen die verstärkten Signal-Teilbänder justiert, um die psycho-akustische Frequenzmaskierung auszugleichen.
  • In akustischen Anwendungen wird das Ausgangssignal in ein akustisches Signal umgewandelt, welches, zusammen mit dem akustischen Umgebungslärmgeräusch, Teil des gesamten örtlichen akustischen Feldes ist. Deshalb ist das bevorzugte Verfahren zum Schätzen des Umgebungslärmgeräusches, ein Umgebungssignal zu erzeugen, das das gesamte örtliche akustische Feld wiedergibt, und das Eingangssignal von diesem Umgebungssignal abzuziehen.
  • Um den Leistungsverbrauch zu minimieren, wird dieses Verarbeiten durch Teilbänder nur dann ausgelöst, wenn das Eingangssignal eine Leistungsschwelle übersteigt. Wenn erwartet wird, dass das Eingangssignal ein Sprachsignal ist, wird dieses Verarbeiten durch Teilbänder nur dann ausgelöst, wenn die Leistungseinhüllende des Eingangssignals ebenfalls mit einer Rate ansteigt, die eine Ratenschwelle übersteigt.
  • In der Anwendung der vorliegenden Erfindung in wechselseitigen Kommunikationseinrichtungen, wie etwa Mobilfunktelefonen, wird, um sicherzustellen, dass das Eingangssignal das eigene Sprechen des Benutzers nicht übertönt, das Verarbeiten durch Teilbänder gesperrt, während der Benutzer spricht. Die Sprache des Benutzers wird in ein gesendetes Signal umgewandelt. Von dem Anstieg der Leistung von einem vernachlässigbaren Wert auf oberhalb einer Übertragungsbeginn-Amplitudenschwelle bei einer Rate, die die Übertragungsbeginnrate übersteigt, wird angenommen, dass er den Beginn der Zeitdauer anzeigt, in welcher dem Verarbeiten durch Teilbänder gegengewirkt wird, weil der Benutzer spricht. Die Sperrung des Verarbeitens durch Teilbänder läuft weiter für eine minimale Sperrzeit, oder bis die Leistungseinhüllende des gesendeten Signals unter eine Übertragungsende-Amplitudenschwelle bei einer Rate fällt, die eine Übertragungsende-Ratenschwelle übersteigt, je nachdem, was später auftritt. Die Übertragungsbeginn-Amplitudenschwelle wird anpassungsfähig mit Bezug auf das Umgebungslärmgeräusch justiert, wie in dem Umgebungssignal wiedergegeben.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die Erfindung wird hier lediglich durch Beispiel mit Bezug auf die beigefügten Zeichnungen beschrieben, wobei:
  • 1 stellt Zeitmaskierung dar;
  • 2A ist ein Übersichts-Blockschaltbild einer Einrichtung der vorliegenden Erfindung;
  • 2B ist ein Übersichts-Blockschaltbild einer weiteren Einrichtung der vorliegenden Erfindung;
  • 3 ist ein Übersichts-Blockschaltbild der Steuerung der Einrichtung der 2A und 2B;
  • 4 ist ein Übersichts-Blockschaltbild des Signalwandlers der Steuerung von 3;
  • 5 stellt die Umwandlung einer Signalleistungseinhüllenden in eine Signalmaskierungsfunktion dar;
  • 6 ist ein Übersichts-Blockschaltbild des Benutzer-Sprachdetektors der Steuerung von 3.
  • BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • Die vorliegende Erfindung ist ein Verfahren und eine Einrichtung zum geeigneten Verstärken eines Signals, um Umgebungslärmgeräusch zu übertönen. Insbesondere kann die vorliegende Erfindung benutzt werden, um sicherzustellen, dass ein Eingangssignal in ein System, wie etwa ein Mobilfunk-Telefoniesystem, für den Benutzer hörbar ist.
  • Die Grundsätze und der Ablauf von anpassungsfähiger Signalverstärkung gemäß der vorliegenden Erfindung kann besser mit Bezug auf die Zeichnungen und die begleitende Beschreibung verstanden werden. In den Zeichnungen wird die Einrichtung der vorliegenden Erfindung in Form von funktionalen Blöcken beschrieben. In einer analogen Ausführung der vorliegenden Erfindung, stellen diese Blöcke im Allgemeinen Schaltkreisläufe dar, die die Funktionalität ihrer entsprechenden Blöcke ausführen. In einer digitalen Ausführung der vorliegenden Erfindung stellen diese Blöcke im Allgemeinen Algorithmen zum Ausführen der Funktionalität ihrer entsprechenden Blöcke dar, die durch einen oder mehrere Mehrzweckprozessoren, einen oder mehrere Spezialprozessoren für digitale Signale, oder einer Kombination davon durchgeführt werden. Es wird einem Fachmann von der nachfolgenden Beschreibung genau klar werden, wie die Funktionalität dieser funktionalen Blöcke in jeder bestimmten Durchführung der vorliegenden Erfindung ausgeführt wird.
  • Wieder mit Bezug auf die Zeichnungen ist 2A ein Übersichts-Blockschaltbild einer Einrichtung 30 der vorliegenden Erfindung. Die Eingänge an die Einrichtung 30 sind ein elektronisches Signal S(t), das eine Funktion der Zeit t ist und ein äußeres akustisches Feld, über ein Mikrofon 34. Der Ausgang von Einrichtung 30 ist eine akustische Darstellung eines modifizierten Signals S'(t), über einen Lautsprecher 32. Das Mikrofon 34 stellt einen Umformer zum Umwandeln von akustischer Energie in elektrische Energie dar. Der Lautsprecher 32 stellt einen Umformer zum Umwandeln von elektrischer Energie in akustische Energie dar.
  • Der Lautsprecher 32 ist ausreichend nahe am Mikrofon 34, derart, dass das akustische Feld, das von dem Benutzer der Einrichtung 30 wahrgenommen wird, und das die akustische Energie von Lautsprecher 32 umfasst, im Wesentlichen identisch mit dem akustischen Feld am Mikrofon 34 ist. Zum Beispiel können Lautsprecher 32 und Mikrofon 34 in einem Mobilfunktelefon benachbart sein. Deshalb ist, wenn der Benutzer von der Einrichtung 30 ruhig ist, der Ausgang von Mikrofon 34 eine Summe eines Umgebungslärmgeräusches in der Nähe des Lautsprechers 32 und die Umsetzung von Signal S'(t) in akustische Energie durch den Lautsprecher 32. Dieser kombinierte Ausgang wird hier ebenfalls als ein „Umgebungssignal" bezeichnet. Dieser kombinierte Ausgang wird in einem Verstärker 36 verstärkt. Das modifizierte Signal S'(t) wird von diesem verstärkten Ausgang in eine Fehlerlöscheinrichtung 38 verschoben, um eine Schätzung <N(t)> des Umgebungslärmgeräusches in der Nähe des Lautsprechers 32 bereitzustellen. Der Verstärkungspegel des Verstärkers 36 wird in einem Abgleichverfahren derart justiert, dass die Signalkomponente des Ausgangs des Verstärkers 36 im Wesentlichen gleich dem modifizierten Signal S'(t) ist. Die zwei Eingänge der Steuerung 40 sind das Signal S(t) und die Lärmgeräuschschätzung <N(t)>. Das Signal S'(t), der Ausgang der Steuerung 40, ist das Signal S(t), modifiziert und verstärkt relativ zu der Lärmgeräuschschätzung <N(t)> gemäß den Grundsätzen der vorliegenden Erfindung, um das Umgebungslärmgeräusch in der Nähe des Lautsprechers zu übertönen. Wie nachfolgend gesehen werden kann, umfasst die an Signal S(t) ausgeführte Modifikation, um S'(t) zu erzeugen, eine Zeitverzögerung dt.
  • Eine Variante von Einrichtung 30 umfasst zwei Mikrofone 34, ein Mikrofon 34, das das Sprechen des Benutzers in elektrische Energie umwandelt, und ein weiteres Mikrofon 34, das sich in der Nähe des Lautsprechers 32 befindet und das das akustische Feld in der Nähe des Lautsprechers in elektrische Energie umwandelt. Bei dieser Variante müssen die Lautsprecher 32 in der Nähe des Benutzers der Einrichtung angeordnet sein.
  • 2B ist ein Übersichts-Blockschaltbild einer einfacheren Einrichtung 30' der vorliegenden Erfindung für die Benutzung in einer Umgebung, die eine einzelne, vorherrschende Lärmgeräuschquelle, wie etwa den Motor eines Automobils, aufweist. Die Eingänge an die Einrichtung 30' sind, über ein Mikrofon 34', das elektronische Signal S(t) und das akustische Feld in der Nähe der Lärmgeräuschquelle, das in der Nähe der Lärmgeräuschquelle angeordnet ist. Wie in der Einrichtung 30 ist der Ausgang von Einrichtung 30' eine akustische Darstellung eines modifizierten Signals S'(t) über Lautsprecher 32. Der Ausgang von Mikrofon 34' wird verstärkt durch einen Verstärker 36', um die Lärmgeräuschschätzung <N(t)> bereitzustellen. Der Verstärkungspegel von Verstärker 36' wird in einem Abgleichverfahren derart justiert, dass die Amplitude der Lärmgeräuschschätzung <N(t)> das Energieniveau des Umgebungslärmgeräusches am Lautsprecher 32 wiedergibt.
  • 3 ist ein Übersichtsblockschaltbild von Steuerung 40. Durchgezogene Pfeile in 3 zeigen den Signalfluss an. Gestrichelte Pfeile in 3 zeigen Ansteuerung an. Signal S(t) wird in einem Verzögerungsblock 44 um eine Zeitverzögerung dt verzögert, um basierend auf Rückwärtszeitmaskierung die Ausführung der Verarbeitung des Signals S(t) zu erlauben, wie nachfolgend beschrieben. Das verzögerte Signal S(t – dt) wird zu einem Signaldetektor 46 und zu einem Schalter 48, der durch den Signaldetektor 46 gesteuert wird, gesandt. Der Signaldetektor 46 hält den Schalter 48 offen, bis der Signaldetektor 46 ein Leistungsniveau des Eingangssignals über einer bestimmten Leistungsschwelle erkennt. Nur wenn die Leistung des Signals S(t) diese Schwelle übersteigt, schließt der Signaldetektor 46 den Schalter 48. Wenn der Schalter 48 geschlossen ist, werden das verzögerte Signal S(t – dt) zusammen mit dem unverzögerten Signal S(t) und der Lärmgeräuschschätzung <N(t)> zum Eingang für einen Signalwandler 60, der ferner das verzögerte Signal S(t – dt) modifiziert, um das modifizierte Signal S'(t) zu erzeugen. Der Zweck des Signaldetektors 46 ist, Leistung zu sparen: der Signalwandler 60 wird nur dann eingeschalten, um ein modifiziertes Signal S'(t) zu erzeugen, wenn ein echtes Signal S(t) empfangen wird.
  • Die Ausführungsform der Steuerung 40, die in 3 dargestellt wird, ist darauf gerichtet, Signale S(t) zu empfangen, die Sprechen darstellen. Deshalb umfasst diese Ausführungsform der Steuerung 40 einen Übergangsdetektor 54, um „Breitbandmaskierung" auszuführen: beim Einsetzen der Sprache verursacht der schnelle Anstieg der Signalleistung, dass das entsprechende akustische Signal trotz des Umgebungslärmgeräusches durch den Benutzer wahrgenommen wird, und das durch den Signalwandler 60 ausgeführte aufwendige Verarbeiten wird unnötig. Der Übergangsdetektor 54 steuert zwei Schalter 50 und 58. Zunächst sind beide Schalter 50 und 58 offen. Wenn der Übergangsdetektor 54 einen ausreichend schnellen Anstieg an Signalleistung erkennt, schließt der Übergangsdetektor 54 den Schalter 50 und öffnet Schalter 58, um zu ermöglichen, dass das verzögerte Signal S(t – dt) durch einen Verstärker 52 verstärkt wird und als hörbare Sprache durch den Lautsprecher 32 wiedergegeben wird. Eine übliche Ratenschwelle für diese Tätigkeit des Übergangsdetektors 54 ist ein Wechsel der Eingangsleistung um die Hälfte des vollen Leistungsbereichs des Übergangsdetektors 54 innerhalb von 50 Millisekunden. Wenn der Übergangsdetektor 54 ein örtliches Maximum an Eingangsleistung als eine Funktion der Zeit erkennt, öffnet der Übergangsdetektor 54 den Schalter 50 und schließt den Schalter 58, um zu ermöglichen, dass das modifizierte Signal S'(t) durch den Verstärker 52 verstärkt wird und als hörbare Sprache durch den Lautsprecher 32 wiedergegeben wird. Wenn, mit geöffneten Schaltern 50 und 58, die Signalleistung um eine Rate ansteigt, die niedriger als die Ratenschwelle ist, dann schließt der Übergangsdetektor 54 lediglich Schalter 58. Wenn die Signalleistung unter eine weitere Leistungsschwelle abfällt, öffnet Signaldetektor 46 den Schalter 48 und der Übergangsdetektor 54 öffnet die Schalter 50 und 58.
  • Die Steuerung 40 umfasst einen Benutzersprachdetektor 56, dessen Funktion es ist, die Schalter 50 und 58 zu schließen, während der Benutzer spricht. Daher hört der Benutzer, während der Benutzer spricht, das unmodifizierte (mit Ausnahme der Verzögerung) Signal S(t – dt). Ohne diese Funktionalität des Benutzersprachdetektors 56 würde die Sprache des Benutzers durch den Signalwandler 60 als Teil des Umgebungslärmgeräuschfeldes behandelt werden, und das modifizierte Signal S'(t) würde sowohl die Sprache des Benutzers, als auch das echte Umgebungslärmgeräusch maskieren. Die Arbeitsweise des Benutzersprachdetektors 56 wird nachfolgend ausführlicher beschrieben.
  • 4 ist ein Übersichts-Blockschaltbild des Signalwandlers 60. Das verzögerte Eingangssignal S(t – dt) wird zu einer Bank von Bandpassfiltern 62 geleitet. Das unverzögerte Eingangssignal wird an eine ähnliche Bank von Bandpassfiltern 63 geleitet und die Lärmgeräuschschätzung <N(t)> wird an eine ähnliche Bank von Bandpassfiltern 64 geleitet. Für eine darstellende Deutlichkeit werden nur drei verzögerte Signalbandpassfilter 62, nur drei unverzögerte Signalbandpassfilter 63 und nur drei Lärmgeräuschbandpassfilter in 4 gezeigt. Es ist üblicher 8, 14, 24 oder sogar mehr Bandpassfilter 62, 63 oder 64 in jeder Bank zu haben. Die Passbänder von Bandpassfiltern in derselben Bank sind benachbart und die Passbänder von entsprechenden Filtern in den zwei Banken sind identisch. Zum Beispiel, um den Bereich von Audiofrequenzen von 20 Hz bis 20 KHz zu umfassen, könnten die Passbänder der Filter 62a, 63a und 64a von 20 Hz bis 200 Hz reichen, und die Passbänder der Filter 62c, 63c und 64c könnten von 2 KHz bis 20 KHz reichen. Es ist anzumerken, dass der Frequenzabstand in diesem Beispiel logarithmisch ist, was dem linearen Abstand vorzuziehen ist. Die Ausgänge der verzögerten Signalbandpassfilter 63 sind die verzögerten Signale Teilbänder Si(t – dt), i ∊ [1, n], wobei n die Anzahl von Bandpassfiltern in jeder Bank ist. Die Ausgänge der unverzögerten Signalbandpassfilter 63 sind die entsprechenden unverzögerten Signal-Teilbänder Si(t). Die Ausgänge des Lärmgeräusch-Bandpassfilters 64 sind die entsprechenden Lärmgeräusch-Teilbänder Ni(t).
  • Die verzögerten Signal-Teilbänder Si(t – dt) sind Eingang in eine Bank von Funktionsblöcken 66 der Einhüllenden des verzögerten Signals. Der Ausgang eines jeden Funktionsblocks 66i der Einhüllenden des verzögerten Signals ist eine Funktion Se i(t – dt) der Einhüllenden der verzögerten Signalleistung, die die Leistungseinhüllende des Signal-Teilbands Si(t – dt) des verzögerten Eingangssignals ist. Gleichermaßen sind die Teilbänder Si(t) des unverzögerten Signals Eingang in eine Bank von Funktionsblöcken 67 der Einhüllenden des unverzögerten Signals, und die Lärmgeräusch-Teilbänder Ni(t) sind Eingang in eine Bank von Funktionsblöcken 68 von Lärmgeräuscheinhüllenden. Der Ausgang von jedem Funktionsblock 67i der Einhüllenden des unverzögerten Signals ist eine Funktion Se i(t) der Einhüllenden der unverzögerten Signalleistung, die die Leistungseinhüllende des Teilbands Si(t) des unverzögerten Eingangssignals ist. Der Ausgang eines jeden Funktionsblocks 68i der Lärmgeräuscheinhüllenden ist eine Funktion Ne i(t) der Einhüllenden der Lärmgeräuschleistung, die die Leistungseinhüllende des Eingangslärmgeräusch-Teilbands Ni(t) ist. Zum Beispiel sind in einer digitalen Ausführung der vorliegenden Erfindung die Abfragewerte der Funktion Se i(t – dt) der verzögerten Signalleistungseinhüllenden die Quadrate der entsprechenden Abfragewerte der Teilbänder Si(t – dt) des verzögerten Signals, die Abfragewerte der Funktion Se i(t) der unverzögerten Signalleistungseinhüllenden sind die Quadrate der entsprechenden Abfragewerte der Teilbänder Si(t) des unverzögerten Signals, und die Abfragewerte der Funktionen Ne i(t) sind die Quadrate der entsprechenden Werte des Lärmgeräusch-Teilbands Nt(t). Vorzugsweise werden die Funktionen Se i(t), Se i(t – dt) und Ne i(t) der Leistungseinhüllenden nochmals durch zusätzliche Tiefpassfilter gefiltert (nicht gezeigt).
  • Um das Vorwärts- und Rückwärtszeitmaskieren einzuführen, werden die Funktionen Se i(t – dt) der Signalleistungseinhüllenden in Signalmaskierungsfunktionen Mi(t – dt) in den Maskierungs-Funktionsblöcken 70 umgewandelt.
  • Wie dies ausgeführt wird, wird in 5 dargestellt. 5A zeigt eine Funktion der Signalleistungseinhüllenden Se(t – dt) als eine Funktion der Zeit. Eine Gruppe von Linienabschnitten 82 der Vorwärtszeitmaskierung wird auf die Scheitelpunkte der Funktion Se(t – dt) der Signalleistungseinhüllenden angelegt, wie gezeigt. Die Steigungen der Linienabschnitte 82 der Vorwärtszeitmaskierung sind flach und negativ, entsprechend der vorangehend beschriebenen Vorwärtszeitmaskierung. Eine Gruppe von Linienabschnitten 84 der Rückwärtszeitmaskierung wird ebenfalls auf die Scheitelpunkte der Funktion Se(t – dt) der Signalleistungseinhüllenden angelegt, wie gezeigt. Die Steigungen der Linienabschnitte 84 der Rückwärtszeitmaskierung sind steil und positiv, entsprechend der vorangehend beschriebenen Rückwärtszeitmaskierung. Die Steigungen erhöhen sich mit der Frequenz und erhöhen sich ebenfalls mit dem Amplitudenscheitelpunkt. Jeder Maskierungsfunktionsblock 70 weist eine tabellierte Amplitudenfunktion von Steigung zu Scheitelpunkt auf. Die kombinierte Einhüllende der Funktion Se(t – dt) der Signalleistungseinhüllenden und der Linienabschnitte 82 und 84 ist die gewünschte Maskierungsfunktion M(t – dt), gezeigt in 5B. Mit anderen Worten, der in 5 dargestellte Vorgang wandelt die Funktion Se(t – dt) der Signalleistungseinhüllenden in die Funktion M(t – dt) der Wirkleistungseinhüllenden um, die tatsächlich von dem Benutzer der Einrichtung 30 wahrgenommen wird. Die Funktionen Se i(t) der Leistungseinhüllenden des unverzögerten Signals sind Eingang in die Maskierungsfunktionsblöcke 70, um den Maskierungsfunktionsblöcken 70 zu ermöglichen, vorzeitig die Zeiten und Amplituden der Scheitelpunkte der Funktionen Se i(t – dt) der Einhüllenden des verzögerten Signals zu kennen, und um so zu wissen, wo die Linienabschnitte 84 anzusetzen sind, bevor die entsprechenden Scheitelpunkte der Funktionen Se i(t – dt) der Einhüllenden der verzögerten Signalleistungen an den Maskierungsfunktionsblöcken 70 ankommen.
  • Benachbarte Frequenzmaskierung der Signalmaskierungsfunktionen Mi(t – dt) wird im Frequenzmaskierungsblock 72 ausgeführt. Jede Signalmaskierungsfunktion Mi(t – dt) wird mindestens mit ihren nächsten Nachbarn Mi+1(t – dt) (für i < n) und Mi-1(t – dt) (für i > 1) verglichen. Wenn einer der beiden Nachbarn Mi±1(t – dt) Mi(t – dt) um mehr als eine bestimmte zusätzliche Schwelle übersteigt, wird Mi(t – dt) genullt, d.h. gleich Null gesetzt. Diese Schwelle ist im Allgemeinen eine Funktion der Frequenzgrenzen von Teilband i und kann ebenfalls eine Funktion von Mi(t – dt) selbst sein. Zum Beispiel wird eine bevorzugte Gruppe von Schwellen durch das Abfallen von der Mittenfrequenz eines jeden Bandpassfilters 62 zu den Mittenfrequenzen der benachbarten Bandpassfilter 62 bei einer Steigung von –20 dB/Dekade erhalten. Optional können die Nachbarn Mi±2(t – dt), Mi±3(t – dt) etc., die nicht am nächsten sind, in diese benachbarte Frequenzmaskierung mit aufgenommen werden, mit Schwellen, die entsprechend höher sind als die Schwellen, die für die nächsten Nachbarn Mi±1(t – dt) benutzt werden, obwohl es am vorteilhaftesten ist, nur die nächsten Nachbarn zu benutzen. In einer analogen Ausführungsform der vorliegenden Erfindung, in der die Signalmaskierungsfunktionen Mi(t – dt) stetige Funktionen der Zeit sind, wird dieser Vergleich „augenblicklich" durchgeführt. In einer digitalen Ausführung der vorliegenden Erfindung, in der die Signalmaskierungsfunktionen Mi(t – dt) zu getrennten Abfragezeiten tj abgefragt werden, wird dieser Vergleich getrennt zu jeder Abfragezeit durchgeführt.
  • Ähnliche benachbarte Frequenzmaskierung der Lärmgeräuschleistungseinhüllenden Ne i(t) wird in dem Frequenzmaskierungsblock 74 ausgeführt. Die Schwellen, die für die Frequenzmaskierung der Signalmaskierungsfunktionen („Signalfrequenzmaskierung") benutzt werden, sind nicht notwendigerweise dieselben wie die Schwellen, die für die Frequenzmaskierung der Lärmgeräuschleistungseinhüllenden („Lärmgeräuschfrequenzmaskierung") benutzt werden.
  • Die fortbestehenden Maskierungsfunktionen und Lärmgeräuschleistungseinhüllenden werden Teilband für Teilband in den Vergleichsblöcken 76 verglichen, um für die Verstärker 78 den Verstärkungsfaktor zu bestimmen, durch den die entsprechenden Teilbänder der verzögerten Signale verstärkt werden müssen, um die entsprechenden Lärmgeräusch-Teilbänder zu maskieren. Am einfachsten ist es, wenn der Verstärkungsfaktor für ein Signal, das weniger Leistung aufweist als das entsprechende Lärmgeräusch-Teilband, die Quadratwurzel des Verhältnisses von Lärmgeräuscheinhüllender zu der Signalmaskierungsfunktion ist: der Verstärkungsfaktor von Verstärker 78i zur Zeit t ist
    Figure 00180001
    Die verstärkten Signal-Teilbänder werden summiert in einem Addierer 80, um das modifizierte Ausgangssignal S'(t) auszugeben.
  • Der oben beschriebene Algorithmus geht davon aus, dass die Steuerung 40 augenblickliches Verarbeiten des Signals S(t) und der Lärmgeräuschschätzung <N(t)> bewirken kann. Tatsächlich benötigt diese Verarbeitung eine endliche Zeit tp, die bis zu ungefähr 5 Millisekunden lang sein kann. Als Folge davon eilt der Verstärkungsfaktor
    Figure 00190001
    dem Lärmgeräusch hinterher, das der Benutzer tatsächlich mit mindestens einer Verzögerungszeit von tp hört.
  • In einigen Einrichtungen 30 der vorliegenden Erfindung sind der Lautsprecher 32 und das Mikrofon 34 nicht benachbart zu dem Benutzer. Ein Beispiel einer solchen Einrichtung 30 ist eine Stereoanlage eines Automobils, wobei Lautsprecher 32 und Mikrofon 34 in Richtung des hinteren Raums einer Insassenkabine eines Automobils angeordnet sind. In einer solchen Umgebung kommt Lärmgeräusch von einer zeitweiligen Lärmgeräuschquelle in der Nähe des Fahrers des Automobils (der der Benutzer der Einrichtung 30 ist) bei dem Benutzer an, bevor es am Mikrofon 34 ankommt, und der Verstärkungsfaktor eilt dem Lärmgeräusch hinterher, das der Benutzer tatsächlich mit einer Verzögerungszeit größer als tp hört.
  • Um dies auszugleichen, ist es vorzuziehen, in dem Nenner unter der Quadratwurzel des Verstärkungsfaktors, nicht Mi(t – dt), sondern zu jeder Zeit t, das Minimum einer Gruppe von n + 1 Maskierungsfunktionen Mi(t – dt – tp), Mi(t – dt – tp – tmax/n), Mi(t – dt – tp – 2tmax/n), ... Mi(t – dt – tp – tmax,) zu benutzen, wobei tmax die zweifache geschätzte, maximale Zeitverzögerung zwischen der Ankunft des Lärmgeräusches beim Benutzer und der Ankunft am Mikrofon 34 ist. Es ist anzumerken, dass tmax die zweifache geschätzte maximale Zeitverzögerung sein muss, um die sowohl die akustische Laufzeit von der Lärmgeräuschquelle zum Mikrofon 34, als auch die akustische Laufzeit vom Lautsprecher 32 zu dem Benutzer zu berücksichtigen. Aus diesem Grunde wird tmax hier auch als „eine geschätzte maximale Umlaufzeit" bezeichnet. In der oben beschriebenen Fahrzeugumgebung ist die maximale einfache Laufzeit in der Größenordnung von 5 Millisekunden. Mit einer Verarbeitungszeit tp von 5 Millisekunden beträgt die maximale zusätzliche Verzögerung tp + tmax der Maskierungsfunktionen des verzögerten Signals 25 Millisekunden.
  • Am vorteilhaftesten wird dieser Ausgleich nur für die Bereiche von Mi(t – dt) durchgeführt, die den Linienabschnitten 84 der Rückwärtszeitmaskierung entsprechen, das es diese Bereiche von Mi(t – dt) sind, die an der Rückwärtszeitmaskierung teilnehmen.
  • Außerdem ist es vorteilhaft, eine abschließende Justierung der Amplituden der fortbestehenden Teilbänder des verzögerten Signals vor der Addierung dieser Teilbänder im Addierer 80 vorzunehmen. Aus diesem Grund zeigt 4 einen weiteren Vergleichsblock 77, der zwischen den Vergleichsblöcken 76 und Addierer 80 eingeschoben ist. Die vorangehende Justierung der Amplitude eines Signal-Teilbandes, um das entsprechende Lärmgeräusch-Teilband zu übertönen, kann das Teilband so laut machen, dass psycho-akustische Frequenzmaskierung durch den Benutzer das benachbarte Signal-Teilband unhörbar wiedergibt. Daher werden die Amplituden der benachbarten fortbestehenden Signal-Teilbänder im Vergleichsblock 77 verglichen, und relativ schwache Signal-Teilbänder werden dementsprechend verstärkt.
  • 6 ist ein Übersichts-Blockschaltbild einer Ausführungsform des Benutzersprachdetektors 56. Wie in 3 zeigen durchgezogene Pfeile in 6 den Signalfluss an, und gestrichelte Pfeile in 6 zeigen Ansteuerung an. Zusätzlich dazu, dass es zu der Partei gesendet wird, mit der der Benutzer sprechen möchte, ist das Signal (optional verstärkt) von dem Mikrofon 34 Eingang in einen Scheitelpunktdetektor 82 und einem Steigungsdetektor 84. Ähnlich wie der Signaldetektor 46 erkennt der Scheitelpunktdetektor 82 den Anstieg der Eingangssignalleistung über eine Schwelle, die anpassungsfähig bestimmt wird, wie nachfolgend beschrieben. Ähnlich wie Übergangsdetektor 54, erkennt der Steigungsdetektor den Anstieg der Eingangssignalleistung bei einer Rate, die eine voreingestellte Schwelle übersteigt. Wenn beide Bedingungen herrschen, d.h. dass die Signalleistung von Mikrofon 34 mit einer Rate ansteigt, die die voreingestellte Ratenschwelle übersteigt und über die anpassungsfähig eingestellte Signalschwelle steigt, schließt der Logikblock 86 daraus, dass das Sprechen des Benutzers eingesetzt hat. Der Logikblock 86 schließt dann den Schalter 50 der Steuerung 40 und öffnet den Schalter 58 der Steuerung 40, wie oben beschrieben. Es ist anzumerken, dass der Scheitelpunktdetektor 82 nur eine von mehreren Arten von Einsatz-Detektoren ist, die im Stand der Technik bekannt sind und die geeignet sind, das Einsetzen eines Signals von dem Mikrofon 34 zu erkennen.
  • Wenn das Sprechen des Benutzers pausiert, erkennt der Scheitelpunktdetektor 82 den Abfall der Eingangssignalleistung unter die Signalschwelle, und der Steigungsdetektor erkennt den Abfall der Eingangssignalleistung mit einer Rate, die die voreingestellte Schwelle übersteigt. Wenn beide Bedingungen herrschen, d.h. dass die Signalleistung von dem Mikrofon 34 mit einer Rate abnimmt, die die voreingestellte Schwelle übersteigt und unter die anpassungsfähig eingestellte Signalschwelle abgefallen ist, und wenn eine voreingestellte Zeit seit Beginn des Sprechens des Benutzers vergangen ist, schließt der Logikblock 86 daraus, dass das Sprechen des Benutzers beendet ist. Der Logikblock 86 öffnet dann den Schalter 50 der Steuerung 40 und schließt den Schalter 58 der Steuerung 40.
  • Die anpassungsfähige Schwelle für den Scheitelpunktdetektor 82 wird durch einen Schwellenspeicher 90 bereitgestellt, der das Signal vom Mikrofon 34 mittelt und speichert, während der Benutzer nicht spricht, und das Signal von Mikrofon 34 stellt deshalb Umgebungslärmgeräusch dar. Zu diesem Zwecke öffnet der Logikblock 86 ebenfalls einen Schalter 88 zusammen mit dem Schalter 58, wenn der Logikblock 86 das Einsetzen des Sprechens des Benutzers erkennt und der Logikblock 86 schließt den Schalter 88 zusammen mit dem Schalter 58, wenn der Logikblock das Ende des Sprechens des Benutzers erkennt.
  • Obwohl die Erfindung mit Bezug auf eine beschränkte Anzahl von Ausführungsformen beschrieben wurde, wird verstanden werden, dass viele Abweichungen, Abänderungen und andere Anwendungen der Erfindung gemacht werden können.

Claims (31)

  1. Verfahren zum Verstärken eines Eingangssignals zum Übertönen eines Lärmgeräuschs, umfassend: (a) Schätzen des Lärmgeräuschs, wodurch ein geschätztes Lärmgeräusch gebildet wird; (b) Banddurchlassen des Eingangssignals in mehreren benachbarten Durchlassbändern, um eine entsprechende Mehrzahl von Signal-Teilbändern zu erhalten; (c) Banddurchlassen des geschätzten Lärmgeräuschs in den mehreren benachbarten Durchlassbändern, um eine entsprechende Mehrzahl von Lärmgeräusch-Teilbändern zu erhalten; und (d) für jedes Signal-Teilband: (i) Erhalten einer Leistungsmessgröße eines jeden Signal-Teilbandes, (ii) Vergleichen der Leistungsmessgröße eines jeden Signal-Teilbandes mit der Leistungsmessgröße wenigstens eines anderen Signal-Teilbandes, (iii) Nullsetzen eines jeden Signal-Teilbandes, wenn die Leistungsmessgröße des wenigstens einen anderen Signal-Teilbandes die Leistungsmessgröße eines jeden Signal-Teilbandes um eine Signalmaskierungsschwelle übersteigt, (iv) ansonsten Justieren eines jeden Signal-Teilbandes dergestalt, dass jedes Signal-Teilband ein entsprechendes Lärmgeräusch-Teilband maskiert.
  2. Verfahren nach Anspruch 1, des Weiteren umfassend das Verzögern des Eingangssignals vor dem Banddurchlassen.
  3. Verfahren nach Anspruch 1 oder Anspruch 2, des Weiteren umfassend das Summieren der justierten Signal-Teilbänder, um ein Ausgangssignal bereitzustellen.
  4. Verfahren nach Anspruch 3, des Weiteren umfassend – vor dem Summieren der justierten Signal-Teilbänder – das Verstärken der justierten Signal-Teilbänder, um psycho-akustische Frequenzmaskierung zu kompensieren.
  5. Verfahren nach einem der Ansprüche 1–4, des Weiteren umfassend für jedes Lärmgeräusch-Teilband: (i) Vergleichen einer Leistung eines jeden Lärmgeräusch-Teilbandes mit der Leistung wenigstens eines anderen Lärmgeräusch-Teilbandes, und (ii) Nullsetzen eines jeden Lärmgeräusch-Teilbandes, wenn die Leistung des wenigstens einen anderen Lärmgeräusch-Teilbandes die Leistung eines jeden Lärmgeräusch-Teilbandes um eine Lärmgeräuschmaskierungsschwelle übersteigt.
  6. Verfahren nach einem der Ansprüche 1–5, wobei das wenigstens eine andere Signal-Teilband, mit dem jedes Signal-Teilband verglichen wird, ein Teilband ist, das neben dem Signal-Teilband liegt.
  7. Verfahren nach einem der Ansprüche 1–6, wobei das Schätzen des Lärmgeräuschs durch Schritte erfolgt wird, die Folgendes beinhalten: (i) Messen eines Umgebungssignals; und (ii) Entfernen des Eingangssignals aus dem Umgebungssignal.
  8. Verfahren nach Anspruch 7, wobei das Entfernen mittels einer Fehlerlöschvorrichtung erfolgt.
  9. Verfahren nach einem der Ansprüche 1–8, des Weiteren umfassend das Messen einer Leistung des Eingangssignals; wobei das Banddurchlassen des Eingangssignals in Abhängigkeit davon erfolgt, dass die Leistung des Eingangssignals von einem vernachlässigbaren Wert auf wenigstens eine Leistungsschwelle ansteigt.
  10. Verfahren nach Anspruch 9, des Weiteren umfassend das Messen einer Rate der Änderung der Leistung des Eingangssignals; wobei das Banddurchlassen des Eingangssignals des Weiteren in Abhängigkeit davon erfolgt, dass die Rate der Änderung der Leistung des Eingangssignals eine Ratenschwelle übersteigt.
  11. Verfahren nach einem der Ansprüche 1–10, wobei die Leistungsmessgröße des Signal-Teilbandes eine Maskierungsfunktion ist.
  12. Verfahren nach Anspruch 11, wobei die Maskierungsfunktion durch Justieren des Signal- Teilbandes sowohl im Hinblick auf Vorwärtsmaskierung als auch auf Rückwärtsmaskierung erhalten wird.
  13. Verfahren nach Anspruch 11 oder Anspruch 12, wobei das Justieren jedes Signal-Teilbandes durch Verstärken jedes Signal-Teilbandes um eine Quadratwurzel eines Verhältnisses einer Leistung des entsprechenden Lärmgeräusch-Teilbandes zu einem Nenner, der zu der Maskierungsfunktion in Beziehung steht, erfolgt.
  14. Verfahren nach Anspruch 13, wobei der Nenner ein Wert der Maskierungsfunktion ist.
  15. Verfahren nach Anspruch 13, wobei der Nenner ein Wert der Maskierungsfunktion ist, der um eine Verzögerung verzögert ist, die mindestens so lang ist wie eine Verarbeitungszeit.
  16. Verfahren nach Anspruch 13 oder Anspruch 15, wobei der Nenner ein Wert der Maskierungsfunktion ist, der um eine Verzögerung verzögert ist, die höchstens so lang ist wie eine Summe einer Verarbeitungszeit und einer geschätzten maximalen Umlaufzeit.
  17. Verfahren nach einem der Ansprüche 1–16, des Weiteren umfassend das Senden eines gesendeten Signals, Erkennen des Einsetzens des gesendeten Signals; und – bei Erkennen des Einsetzens – Sperren des Banddurchlassen des Eingangssignals.
  18. Verfahren nach Anspruch 17, wobei das Sperren für wenigstens die Dauer einer Mindestsperrzeit fortgesetzt wird.
  19. Verfahren nach Anspruch 17 oder Anspruch 18, wobei das Sperren so lange fortgesetzt wird, bis die Leistung des Eingangssignals unter eine Übertragungsende- Leistungsschwelle mit einer Rate absinkt, die eine Übertragungsende-Ratenschwelle übersteigt.
  20. Verfahren nach einem der Ansprüche 17–19, wobei das Erkennen des Einsetzens durch Messen einer Leistung des gesendeten Signals geschieht, wobei das Einsetzen als erfolgt angesehen wird, wenn die Leistung des gesendeten Signals von einem vernachlässigbaren Wert zu wenigstens einer Übertragungsbeginn-Leistungsschwelle mit einer Rate ansteigt, die eine Übertragungsbeginn-Ratenschwelle übersteigt.
  21. Verfahren nach Anspruch 20, wobei die Übertragungsbeginn-Leistungsschwelle relativ zu dem Lärmgeräusch ist.
  22. Vorrichtung zum Umwandeln eines Eingangssignals zu einem Ausgangssignal, das von einem Lärmgeräusch unterscheidbar ist, umfassend: (a) einen Mechanismus zum Schätzen des Lärmgeräuschs, wodurch ein geschätztes Lärmgeräusch gebildet wird; (b) mehrere Signalbandpassfilter zum Zerlegen des Eingangssignals in mehrere benachbarte Signal-Teilbänder; (c) für jedes der Signalbandpassfilter ein entsprechendes Lärmgeräuschbandpassfilter, wobei die Lärmgeräuschbandpassfilter zum Zerlegen des geschätzten Lärmgeräuschs in mehrere benachbarte Lärmgeräusch-Teilbänder, die den Signal-Teilbändern entsprechen, dienen; (d) einen Mechanismus zum Erhalten einer Leistungsmessgröße eines jeden Signal-Teilbandes, zum Vergleichen der Leistungsmessgröße eines jeden Signal-Teilbandes mit der Leistungsmessgröße wenigstens eines anderen Signal-Teilbandes, und zum Nullsetzen eines jeden Signal-Teilbandes, wenn die Leistungsmessgröße des wenigstens einen anderen Signal-Teilbandes die Leistungsmessgröße eines jeden Signal-Teilbandes um eine Signalmaskierungsschwelle übersteigt; und (e) ansonsten – für jedes Signal-Teilband – einen Mechanismus zum Justieren jedes Signal-Teilbandes zum Maskieren eines entsprechenden Lärmgeräusch-Teilbandes.
  23. Vorrichtung nach Anspruch 22, des Weiteren umfassend: (f) einen Mechanismus zum Verzögern des Eingangssignals vor dem Zerlegen des Eingangssignals in mehrere benachbarte Signal-Teilbänder.
  24. Vorrichtung nach Anspruch 22 oder Anspruch 23, des Weiteren umfassend: (f) einen Mechanismus zum Summieren der justierten Signal-Teilbänder zu einem Ausgangssignal.
  25. Vorrichtung nach Anspruch 24, des Weiteren umfassend: (g) einen Mechanismus zum Austauschen des empfangenen Signals gegen das Ausgangssignal, während eine Leistung des Eingangssignals mit einer Rate ansteigt, die eine Ratenschwelle übersteigt.
  26. Vorrichtung nach einem der Ansprüche 22–25, des Weiteren umfassend: (f) einen Mechanismus zum weiteren Justieren der Signal-Teilbänder, um psycho-akustische Frequenzmaskierung zu kompensieren.
  27. Vorrichtung nach einem der Ansprüche 22–26, des Weiteren umfassend: (f) einen Mechanismus zum Erhalten einer Leistung jedes Lärmgeräusch-Teilbandes, zum Vergleichen der Leistung jedes Lärmgeräusch-Teilbandes mit der Leistung wenigstens eines anderen Lärmgeräusch-Teilbandes, und zum Nullsetzen eines jeden Lärmgeräusch-Teilbandes, wenn die Leistung des wenigstens einen anderen Lärmgeräusch-Teilbandes die Leistung eines jeden Lärmgeräusch-Teilbandes um eine Lärmgeräuschmaskierungsschwelle übersteigt.
  28. Vorrichtung nach einem der Ansprüche 22–27, des Weiteren umfassend: (f) einen Auslöser zum Leiten des Eingangssignals zu den Signalbandpassfiltern, nachdem eine Leistung des Eingangssignals von einem vernachlässigbaren Wert auf wenigstens eine Leistungsschwelle ansteigt.
  29. Vorrichtung nach einem der Ansprüche 22–28, des Weiteren umfassend: einen Sender, der zum Senden eines gesendeten Signals geeignet ist; und eine Sperrvorrichtung zum Blockieren des empfangenen Signals von den Signalbandpassfiltern bei Erkennen eines Einsetzens des gesendeten Signals.
  30. Vorrichtung nach Anspruch 29, wobei das Einsetzen durch einen Anstieg einer Leistung des gesendeten Signals von einem vernachlässigbaren Wert auf wenigstens eine Übertragungsbeginn-Leistungsschwelle mit einer Rate, die eine Übertragungsbeginn-Ratenschwelle übersteigt, angezeigt wird.
  31. Vorrichtung nach Anspruch 30, des Weiteren umfassend: einen Mechanismus zum Anpassen der Übertragungsbeginn-Leistungsschwelle an das Lärmgeräusch.
DE60033826T 1999-07-28 2000-07-27 Verstärkungsregelung von audiosignalen in lärmender umgebung mit hilfe einer filterbank Expired - Fee Related DE60033826T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14593699P 1999-07-28 1999-07-28
US145936P 1999-07-28
PCT/US2000/020395 WO2001010020A1 (en) 1999-07-28 2000-07-27 Filter banked gain control of audio in a noisy environment

Publications (2)

Publication Number Publication Date
DE60033826D1 DE60033826D1 (de) 2007-04-19
DE60033826T2 true DE60033826T2 (de) 2007-11-08

Family

ID=22515208

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60033826T Expired - Fee Related DE60033826T2 (de) 1999-07-28 2000-07-27 Verstärkungsregelung von audiosignalen in lärmender umgebung mit hilfe einer filterbank

Country Status (7)

Country Link
US (1) US7120579B1 (de)
EP (1) EP1210765B1 (de)
AT (1) ATE356469T1 (de)
AU (1) AU6748600A (de)
DE (1) DE60033826T2 (de)
IL (1) IL147856A0 (de)
WO (1) WO2001010020A1 (de)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001282454A1 (en) * 2000-08-14 2002-02-25 Clear Audio Ltd. Voice enhancement system
AUPS102902A0 (en) * 2002-03-13 2002-04-11 Hearworks Pty Ltd A method and system for reducing potentially harmful noise in a signal arranged to convey speech
JP2005175674A (ja) * 2003-12-09 2005-06-30 Nec Corp 信号圧縮伸張装置および携帯通信端末装置
JP2008052117A (ja) * 2006-08-25 2008-03-06 Oki Electric Ind Co Ltd 雑音除去装置、方法及びプログラム
US20080161064A1 (en) * 2006-12-29 2008-07-03 Motorola, Inc. Methods and devices for adaptive ringtone generation
US8995683B2 (en) * 2006-12-29 2015-03-31 Google Technology Holdings LLC Methods and devices for adaptive ringtone generation
US7804922B2 (en) * 2007-03-02 2010-09-28 Skyworks Solutions, Inc. System and method for adjacent channel power detection and dynamic bandwidth filter control
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US8538749B2 (en) * 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
GB2463231B (en) * 2008-09-01 2012-05-30 Sony Corp Audio watermarking apparatus and method
US9202456B2 (en) * 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
ES2526761T3 (es) * 2010-04-22 2015-01-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para modificar una señal de audio de entrada
US9053697B2 (en) * 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
GB2519361B (en) 2013-10-21 2015-09-16 Nujira Ltd Reduced bandwidth of signal in an envelope path for envelope tracking system
US9847093B2 (en) 2015-06-19 2017-12-19 Samsung Electronics Co., Ltd. Method and apparatus for processing speech signal
CN111726730A (zh) * 2019-03-18 2020-09-29 塞舌尔商元鼎音讯股份有限公司 声音播放装置及其调整输出声音的方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4381488A (en) 1981-02-18 1983-04-26 Fricke Jobst P Dynamic volume expander varying as a function of ambient noise level
US4476571A (en) 1981-06-15 1984-10-09 Pioneer Electronic Corporation Automatic sound volume control device
US4468804A (en) 1982-02-26 1984-08-28 Signatron, Inc. Speech enhancement techniques
US4630302A (en) 1985-08-02 1986-12-16 Acousis Company Hearing aid method and apparatus
DE3730763A1 (de) 1987-09-12 1989-03-30 Blaupunkt Werke Gmbh Schaltung zur stoergeraeuschkompensation
US4829565A (en) 1987-10-20 1989-05-09 Goldberg Robert M Telephone with background volume control
JP3306600B2 (ja) 1992-08-05 2002-07-24 三菱電機株式会社 自動音量調整装置
US5434922A (en) * 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
WO1995002288A1 (en) * 1993-07-07 1995-01-19 Picturetel Corporation Reduction of background noise for speech enhancement
JP3309008B2 (ja) * 1993-08-24 2002-07-29 アルパイン株式会社 オーディオ装置
US5526419A (en) 1993-12-29 1996-06-11 At&T Corp. Background noise compensation in a telephone set
US5485515A (en) 1993-12-29 1996-01-16 At&T Corp. Background noise compensation in a telephone network
JP3322479B2 (ja) 1994-05-13 2002-09-09 アルパイン株式会社 オーディオ装置
KR970011727B1 (en) * 1994-11-09 1997-07-14 Daewoo Electronics Co Ltd Apparatus for encoding of the audio signal
US5636272A (en) 1995-05-30 1997-06-03 Ericsson Inc. Apparatus amd method for increasing the intelligibility of a loudspeaker output and for echo cancellation in telephones
JPH09116362A (ja) 1995-10-19 1997-05-02 Matsushita Electric Ind Co Ltd 自動音量制御装置
US6141415A (en) 1996-10-11 2000-10-31 Texas Instruments Incorporated Method and apparatus for detecting speech at a near-end of a communications system, a speaker-phone system, or the like
JP2874679B2 (ja) 1997-01-29 1999-03-24 日本電気株式会社 雑音消去方法及びその装置
US6035048A (en) * 1997-06-18 2000-03-07 Lucent Technologies Inc. Method and apparatus for reducing noise in speech and audio signals
GB9714001D0 (en) 1997-07-02 1997-09-10 Simoco Europ Limited Method and apparatus for speech enhancement in a speech communication system
US6766292B1 (en) 2000-03-28 2004-07-20 Tellabs Operations, Inc. Relative noise ratio weighting techniques for adaptive noise cancellation

Also Published As

Publication number Publication date
EP1210765B1 (de) 2007-03-07
DE60033826D1 (de) 2007-04-19
EP1210765A4 (de) 2005-04-06
US7120579B1 (en) 2006-10-10
IL147856A0 (en) 2002-08-14
AU6748600A (en) 2001-02-19
ATE356469T1 (de) 2007-03-15
EP1210765A1 (de) 2002-06-05
WO2001010020A1 (en) 2001-02-08

Similar Documents

Publication Publication Date Title
DE60033826T2 (de) Verstärkungsregelung von audiosignalen in lärmender umgebung mit hilfe einer filterbank
DE60108401T2 (de) System zur erhöhung der sprachqualität
DE60116255T2 (de) Rauschunterdückungsvorrichtung und -verfahren
EP0290952B1 (de) Schaltungsanordnung zur Sprachsteuerung für ein Endgerät der Nachrichtentechnik
DE60209161T2 (de) Mehrkanal Hörgerät mit Übertragungsmöglichkeiten zwischen den Kanälen
DE69933141T2 (de) Tonprozessor zur adaptiven dynamikbereichsverbesserung
DE69922940T2 (de) Vorrichtung und verfahren zur kombinierung von audiokompression und rückkopplungsunterdrückung in einem hörgerät
DE60125553T2 (de) Verfahren zur interferenzunterdrückung
EP0668007B1 (de) Mobilfunkgerät mit freisprecheinrichtung
DE69814142T2 (de) Vorrichtung und verfahren zur rückkopplungsunterdrückung
DE102010023615B4 (de) Signalverarbeitungsvorrichtung und Signalverarbeitungsverfahren
DE60004888T2 (de) Sprachsverteilungssystem
DE69731573T2 (de) Geräuschverminderungsanordnung
EP1091349A2 (de) Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung
DE102005000818A1 (de) Rauschunterdrückungssystem, Spracherkennungssystem und Fahrzeug-Navigationssystem
DE19640132A1 (de) Verfahren zur automatischen Begrenzung von Verzerrungen an Audio-Geräten und Schaltungsanordnung zur Durchführung des Verfahrens
EP1189419B1 (de) Verfahren und Vorrichtung zur Elimination Lautsprecherinterferenzen aus Mikrofonsignalen
EP1152527B1 (de) Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
EP1155561B1 (de) Vorrichtung und verfahren zur geräuschunterdrückung in fernsprecheinrichtungen
EP2595414B1 (de) Hörvorrichtung mit einer Einrichtung zum Verringern eines Mikrofonrauschens und Verfahren zum Verringern eines Mikrofonrauschens
EP1489882A2 (de) Verfahren zum Betrieb eines Hörhilfegerätes, sowie Hörhilfegerät mit einem Mikrofonsystem, bei dem unterschiedliche Richtcharakteristiken einstellbar sind
EP0592787B1 (de) Verfahren zum Verbessern der akustischen Rückhördämpfung von elektroakustischen Anlagen
EP1432282B1 (de) Verfahren zum Anpassen eines Hörgerätes an eine momentane akustische Umgebungssituation und Hörgerätesystem
DE69930109T2 (de) Sprachgesteuerter schalter zur verwendung bei hohem umgebungsgeräusch
DE3207412A1 (de) Hoergeraet mit einer batteriegespeisten verstaerkerschaltung und mit mitteln zur lautstaerkeeinstellung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee