-
GEBIET UND
ALLGEMEINER STAND DER TECHNIK
-
Die
vorliegende Erfindung betrifft Sprachkommunikation und Einrichtungen
dafür und
insbesondere ein Verfahren und ein System zum Klären von akustischer Sprache
und von akustischem Ton in geräuschvollen
Umgebungen.
-
Kommunikationseinrichtungen
werden häufig
in geräuschvollen
Umgebungen benutzt. Ein übliches
Beispiel der Benutzung einer solchen Einrichtung ist die Benutzung
eines Mobiltelefons im Innern eines Fahrzeugs, wie etwa einem Automobil.
Die Lärmgeräusche in
dieser Umgebung umfassen sowohl das Lärmgeräusch des Fahrzeugs selbst,
zum Beispiel das Lärmgeräusch des
Motors des Fahrzeugs, als auch Lärmgeräusch, wie
etwa Windlärmgeräusch, das
von der Bewegung des Fahrzeugs herrührt, und Lärmgeräusch, das von anderen Fahrzeugen
empfangen wird.
-
Im
Falle von rhythmischem Lärmgeräusch ist bekannt,
dass ein Aufhebungssignal erzeugt wird, das ungefähr gleich
in der Amplitude und gegenläufig zu
der Phase des Lärmgeräusches ist.
Dieses Aufhebungssignal wird zu dem Lärmgeräusch addiert, um das Lärmgeräusch weitgehend
aufzuheben.
-
Im
Falle einer einseitigen Kommunikationseinrichtung, wie etwa einem
Autoradio, ist der einfachste Weg, das Umgebungslärmgeräusch zu übertönen, einfach
die Lautstärke
zu erhöhen,
d.h. die Leistung des empfangenen Signals derart zu erhöhen, dass
das empfangene Signal das Lärmgeräusch überdeckt.
Eine Vielzahl von Verfahren ist bekannt, die dies automatisch tun.
Tokumo et al. lehren in der U.S.-Patentschrift 4,476,571 ein automatisches
Geräuschsteuerungsgerät für ein Autoradio. Umgebungslärmgeräusch wird
tiefpass- und bandpassgefiltert, bevor es als ein Steuerungssignal
für eine
automatische Lautstärkensteuerung
benutzt wird, um sicherzustellen, dass das „Lärmgeräusch" in dem Sprachfrequenzband derart ausgelassen
wird, dass das Gerät
das Sprechen nicht zusammen mit dem echten Umgebungsgeräusch übertönt. Zwicker et
al. lehren in der U.S.-Patentschrift 4,868,881 die spektrale Zerlegung
von sowohl einem Autoradiosignal als auch einem Umgebungsgeräuschsignal
in drei Frequenz-Teilbänder. Die
Tonumfänge
der Signale in den drei Teilbändern
werden verzögert,
geglättet
und verglichen. Auf der Basis des Vergleichs wird jedes Teilband
des Radiosignals verstärkt,
um das zugehörige
Lärmgeräusch-Teilband zu übertönen.
-
Diese
Verfahren des Stands der Technik übergehen bestimmte psycho-akustische
Erscheinungen, die mit der menschlichen Empfindung von hörbaren Signalen
verbunden sind, wie zum Beispiel in E. Zwicker und H. Fastl, Psychoacoustics,
Facts and Models, Springer, zweite aktualisierte Ausgabe (1999),
Seiten 74 bis 84, beschrieben.
-
Eine
solche Erscheinung ist Frequenzmaskierung. Wenn ein akustisches
Signal zwei ähnliche Frequenzkomponenten
aufweist und die Amplitude einer Frequenzkomponente beträchtlich
höher als die
Amplitude der anderen Frequenzkomponente ist, dann empfindet der
Hörer nur
die stärkere
der zwei Frequenzkomponenten.
-
Eine
weitere solche Erscheinung ist Zeitmaskierung. Diese Erscheinung
wird in 1 dargestellt, die die Amplituden-Wellenform 12 und
die Amplitudeneinhüllende 14 eines
kurzen, hochfrequenten Pfeifens 10 als eine Funktion der
Zeit zeigt. Ebenfalls in 1 werden eine vordere Zeitmaskierungserweiterung 16,
eine hintere Zeitmaskierungserweiterung 18 der Einhüllenden 14 und
ein Amplitudenpegel 20 von Umgebungsgeräusch, das weißes Rauschen
sein kann, oder das ein Lärmgeräusch mit
Monofrequenz bei einer Frequenz nahe der Frequenz des Pfeifens 10 sein
kann. Ein Zuhörer,
der auf das Pfeifen 10 achtet, wird ebenfalls ein nachfolgendes
Pfeifen mit ähnlichen
spektralen Eigenschaften empfinden, bis die vordere Zeitmaskierungserweiterung 16 unterhalb
eines Pegels 20 des Umgebungsgeräusches fällt, selbst wenn die Amplitudeneinhüllende des nachfolgenden
Pfeifens unterhalb des Pegels 20 des Umgebungsgeräusches ist.
Ferner empfindet der Zuhörer
ebenfalls den gesamten Vorläufer 22 des
Pfeifens 10, obwohl die Einhüllende 14 für den größten Teil
der Dauer von Vorläufer 22 unterhalb
dem Amplitudenpegel 20 des Umgebungsgeräusches ist, weil die hintere
Maskierungserweiterung 18 über dem Amplitudenpegel 20 des
Umgebungsgeräusches
für die
Dauer des Vorläufers 22 ist.
Von der Rückwärtszeitmaskierung
wird angenommen, dass sie die rückwirkende
Weiterverarbeitung des Signals, das von dem Zuhörer empfangen wird, zurückwirft,
um den Vorläufer 22 von
dem Umgebungsgeräusch
zu entziehen. Die Dauer der Vorwärtszeitmaskierung
ist in der Größenordnung
von ungefähr
200 Millisekunden. Die Dauer der Rückwärtszeitmaskierung ist in der Größenordnung
von ungefähr
5 bis 50 Millisekunden.
-
Eine
dritte solche Erscheinung ist Breitbandmaskierung, in der eine Signalanhäufung vorübergehend
das Umgebungsgeräusch
maskiert.
-
Viele
Kommunikationseinrichtungen, wie etwa Mobiltelefone, sind klein
und leichtgewichtig und setzen deshalb einen Zuschlag auf den Kleinleistungsverbrauch.
Deshalb gibt es eine weitgehend erkannte Notwendigkeit für, und es
wäre höchst vorteilhaft,
diese zu haben, Verfahren und zugehörige Kommunikationseinrichtungen,
die die psycho-akustischen
Erscheinungen ausnutzt, um den Leistungsverbrauch beim Verstärken eines
eingehenden Signals über
ein Umgebungslärmgeräusch zu
reduzieren.
-
KURZDARSTELLUNG
DER ERFINDUNG
-
Gemäß der vorliegenden
Erfindung wird ein Verfahren zum Verstärken eines Eingangssignals, um
ein Lärmgeräusch zu übertönen, bereitgestellt, das
folgende Schritte aufweist: (a) Schätzen des Lärmgeräusches, wodurch ein geschätztes Lärmgeräusch gebildet
wird; (b) Banddurchlassen des Eingangssignals in mehreren benachbarten
Durchlassbändern,
um eine entsprechende Mehrzahl von Signal-Teilbändern zu erhalten; (c) Banddurchlassen des
geschätzten
Lärmgeräusches in
den mehreren benachbarten Durchlassbändern, um eine entsprechende
Mehrzahl von Lärmgeräusch-Teilbändern zu erhalten;
und (d) für
jedes Signal-Teilband: (i) Erhalten einer Leistungsmessgröße eines
jeden Signal-Teilbandes, (ii) Vergleichen der Leistungsmessgröße eines
jeden Signalteilbandes mit der Leistungsmessgröße von mindestens einem anderen
Signal-Teilband,
(iii) Nullsetzen eines jeden Signal-Teilbandes, wenn die Leistungsmessgröße des mindestens
einen anderen Signal-Teilbandes die Leistungsmessgröße eines
jeden Signal-Teilbandes um eine Signalmaskierungsschwelle übersteigt,
(iv) ansonsten Justieren eines jeden Signal-Teilbandes derart, dass jedes Signal-Teilband
ein entsprechendes Lärmgeräusch-Teilband
maskiert.
-
Gemäß der vorliegenden
Erfindung wird eine Vorrichtung bereitgestellt zum Umwandeln eines
Eingangssignals zu einem Ausgangssignal, das von einem Lärmgeräusch unterscheidbar
ist, umfassend: (a) einen Mechanismus zum Schätzen des Lärmgeräusches, wodurch ein geschätztes Lärmgeräusch gebildet
wird; (b) mehrere Signalbandpassfilter zum Zerlegen des Eingangssignals
in mehrere benachbarte Signal-Teilbänder; (c)
für jeden
Signalbandpassfilter einen entsprechenden Lärmgeräuschbandpassfilter, wobei die
Lärmgeräuschbandpassfilter zum
Zerlegen des geschätzten
Lärmgeräusches in mehrere
benachbarte Lärmgeräusch-Teilbänder, die den
Signal-Teilbändern
entsprechen, dienen; (d) einen Mechanismus zum Erhalten einer Leistungsmessgröße eines
jeden Signal-Teilbandes, zum Vergleichen der Leistungsmessgröße eines
jeden Signal-Teilbandes mit der Leistungsmessgröße von mindestens einem anderen
Signal-Teilband,
und zum Nullsetzen eines jeden Signal-Teilbandes, wenn die Leistungsmessgröße von mindestens
einem anderen Signal-Teilband die Leistungsmessgröße eines
jeden Signal-Teilbandes
um eine Signalmaskierungsschwelle übersteigt; und (e) für jedes
Signal-Teilband, einen Mechanismus zum Justieren jedes Signal-Teilbandes,
um ein entsprechendes Signal-Teilband zu maskieren.
-
Gemäß der vorliegenden
Erfindung wird in einem Kommunikationssystem, in welchem ein Benutzer
abwechselnd ein empfangenes Signal in einer geräuschvollen Umgebung empfängt und
ein gesendetes Signal sendet, ein Verfahren zum Verstärken des
empfangenen Signals, um das Lärmgeräusch zu übertönen, bereitgestellt,
folgende Schritte umfassend: (a) Schätzen des Lärmgeräusches, wodurch ein geschätztes Lärmgeräusch gebildet
wird; (b) Banddurchlassen des Eingangssignals in mehreren benachbarten
Durchlassbändern,
um eine entsprechende Mehrzahl von Signal-Teilbändern zu erhalten; (c) Banddurchlassen
des geschätzten
Lärmgeräusches in
den mehreren benachbarten Durchlassbändern, um eine entsprechende
Mehrzahl von Lärmgeräusch-Teilbändern zu
erhalten; und (d) für jedes
Signal-Teilband: (i) Erhalten einer Leistungsmessgröße eines
jeden Signal-Teilbandes, (ii) Vergleichen der Leistungsmessgröße eines
jeden Signalteilbandes mit der Leistungsmessgröße von mindestens einem anderen
Signal-Teilband,
(iii) Nullsetzen eines jeden Signal-Teilbandes, wenn die Leistungsmessgröße des mindestens
einen anderen Signal-Teilbandes die Leistungsmessgröße eines
jeden Signal-Teilbandes um eine Signalmaskierungsschwelle übersteigt,
(iv) ansonsten Justieren eines jeden Signal-Teilbandes derart, dass jedes Signal-Teilband
ein entsprechendes Lärmgeräusch-Teilband
maskiert.
-
Gemäß der vorliegenden
Erfindung wird eine Kommunikationseinrichtung bereitgestellt, um
einem Benutzer zu ermöglichen,
abwechselnd ein empfangenes Signal in einer geräuschvollen Umgebung zu empfangen
und ein gesendetes Signal zu senden, Folgendes umfassend: (a) einen
Mechanismus zum Schätzen
des Lärmgeräusches,
wodurch ein geschätztes
Lärmgeräusch gebildet
wird; (b) mehrere Signalbandpassfilter zum Zerlegen des Eingangssignals
in mehrere benachbarte Signal-Teilbänder; (c) für jeden Signalbandpassfilter
einen entsprechenden Lärmgeräuschbandpassfilter,
wobei die Lärmgeräuschbandpassfilter
zum Zerlegen des geschätzten Lärmgeräusches in
mehrere benachbarte Lärmgeräusch-Teilbänder, die
den Signal-Teilbändern
entsprechen, dienen; (d) einen Mechanismus zum Erhalten einer Leistungsmessgröße eines
jeden Signal-Teilbandes, zum Vergleichen der Leistungsmessgröße eines
jeden Signal-Teilbandes mit der Leistungsmessgröße von mindestens einem anderen
Signal-Teilband,
und zum Nullsetzen eines jeden Signal-Teilbandes, wenn die Leistungsmessgröße von mindestens
einem anderen Signal-Teilband die Leistungsmessgröße eines
jeden Signal-Teilbandes
um eine Signalmaskierungsschwelle übersteigt; und (e) für jedes
Signal-Teilband, einen Mechanismus zum Justieren jedes Signal-Teilbandes,
um ein entsprechendes Signal-Teilband zu maskieren.
-
Die
hauptsächlich
beabsichtigte Anwendung der vorliegenden Erfindung gilt der Mobilfunktelefonie,
in der ein empfangenes elektronisches Signal verstärkt wird,
um ein akustisches Umgebungslärmgeräusch zu übertönen, bevor
es in ein akustisches Signal umgewandelt wird. Dennoch umfasst der
Umfang der vorliegenden Erfindung alle Umgebungen, in denen ein
empfangenes Signal verstärkt
wird, um ein Umgebungslärmgeräusch zu übertönen.
-
Gemäß der vorliegenden
Erfindung wird das empfangene Signal relativ zu einer Schätzung des Umgebungslärmgeräusches verzögert, um
eine Rückwärtszeitmaskierung
zu erlauben. Dann werden sowohl das empfangene Signal, als auch
eine Schätzung
des Umgebungslärmgeräusches in
mehrere Teilbänder
zerlegt, die den Frequenzspektralbereich von Interesse umfassen.
Die Amplitudeneinhüllenden
der Signal-Teilbänder
werden in Maskierungsfunktionen umgewandelt, die die Erscheinungen
von Vorwärtszeitmaskierung
und Rückwärtszeitmaskierung
in ihren entsprechenden Teilbändern
berücksichtigen.
Jede Maskierungsfunktion wird verglichen mit den Maskierungsfunktionen
von benachbarten Teilbändern.
Wenn eine Maskierungsfunktion um mindestens einen vorbestimmten
Signalmaskierungsschwellwert kleiner ist als eine benachbarte Maskierungsfunktion,
dann wird diese Maskierungsfunktion auf Null gesetzt. Auf ähnliche
Weise, wenn die Leistungsamplitudeneinhüllende eines Lärmgeräusch-Teilbandes unter
der Leistungsamplitudeneinhüllenden
eines benachbarten Lärmgeräusch-Teilbandes
um mindestens einen vorbestimmten Lärmgeräusch-Maskierungsschwellwert ist,
wird dieses Lärmgeräusch-Teilband
auf Null gesetzt. Für
Teilbänder,
die nicht auf Null gesetzt wurden, wird der Faktor, um den das Signal-Teilband
verstärkt
werden muss, um das entsprechende Lärmgeräusch-Teilband zu übertönen, durch
Teilen der entsprechenden Leistungsamplitudeneinhüllenden
des Lärmgeräusch-Teilbands
durch einen Nenner, bezogen auf den Wert der entsprechenden Maskierungsfunktion,
und Ziehen der Quadratwurzel, um die Signalleistung in Signalamplitude
umzuwandeln, bestimmt. Die Signal-Teilbänder werden verstärkt durch diese
Faktoren und summiert, um das Ausgangssignal bereitzustellen.
-
Vorzugsweise
ist der Nenner der Wert der Maskierungsfunktion selbst. Noch vorteilhafter
ist der Nenner der Wert der Maskierungsfunktion, verzögert durch
eine Verzögerung,
die mindestens so groß ist wie
die Verarbeitungszeit, und höchstens
so groß wie eine
Summe der Verarbeitungszeit und einer geschätzten maximalen Umlaufzeit.
-
Vorzugsweise
werden in akustischen Anwendungen die verstärkten Signal-Teilbänder justiert, um
die psycho-akustische
Frequenzmaskierung auszugleichen.
-
In
akustischen Anwendungen wird das Ausgangssignal in ein akustisches
Signal umgewandelt, welches, zusammen mit dem akustischen Umgebungslärmgeräusch, Teil
des gesamten örtlichen akustischen
Feldes ist. Deshalb ist das bevorzugte Verfahren zum Schätzen des
Umgebungslärmgeräusches,
ein Umgebungssignal zu erzeugen, das das gesamte örtliche
akustische Feld wiedergibt, und das Eingangssignal von diesem Umgebungssignal
abzuziehen.
-
Um
den Leistungsverbrauch zu minimieren, wird dieses Verarbeiten durch
Teilbänder
nur dann ausgelöst,
wenn das Eingangssignal eine Leistungsschwelle übersteigt. Wenn erwartet wird,
dass das Eingangssignal ein Sprachsignal ist, wird dieses Verarbeiten
durch Teilbänder
nur dann ausgelöst,
wenn die Leistungseinhüllende
des Eingangssignals ebenfalls mit einer Rate ansteigt, die eine
Ratenschwelle übersteigt.
-
In
der Anwendung der vorliegenden Erfindung in wechselseitigen Kommunikationseinrichtungen,
wie etwa Mobilfunktelefonen, wird, um sicherzustellen, dass das
Eingangssignal das eigene Sprechen des Benutzers nicht übertönt, das
Verarbeiten durch Teilbänder
gesperrt, während
der Benutzer spricht. Die Sprache des Benutzers wird in ein gesendetes
Signal umgewandelt. Von dem Anstieg der Leistung von einem vernachlässigbaren
Wert auf oberhalb einer Übertragungsbeginn-Amplitudenschwelle
bei einer Rate, die die Übertragungsbeginnrate übersteigt,
wird angenommen, dass er den Beginn der Zeitdauer anzeigt, in welcher
dem Verarbeiten durch Teilbänder
gegengewirkt wird, weil der Benutzer spricht. Die Sperrung des Verarbeitens
durch Teilbänder
läuft weiter
für eine
minimale Sperrzeit, oder bis die Leistungseinhüllende des gesendeten Signals
unter eine Übertragungsende-Amplitudenschwelle
bei einer Rate fällt,
die eine Übertragungsende-Ratenschwelle übersteigt,
je nachdem, was später
auftritt. Die Übertragungsbeginn-Amplitudenschwelle
wird anpassungsfähig
mit Bezug auf das Umgebungslärmgeräusch justiert,
wie in dem Umgebungssignal wiedergegeben.
-
KURZE BESCHREIBUNG
DER ZEICHNUNGEN
-
Die
Erfindung wird hier lediglich durch Beispiel mit Bezug auf die beigefügten Zeichnungen
beschrieben, wobei:
-
1 stellt
Zeitmaskierung dar;
-
2A ist
ein Übersichts-Blockschaltbild
einer Einrichtung der vorliegenden Erfindung;
-
2B ist
ein Übersichts-Blockschaltbild
einer weiteren Einrichtung der vorliegenden Erfindung;
-
3 ist
ein Übersichts-Blockschaltbild
der Steuerung der Einrichtung der 2A und 2B;
-
4 ist
ein Übersichts-Blockschaltbild
des Signalwandlers der Steuerung von 3;
-
5 stellt die Umwandlung einer Signalleistungseinhüllenden
in eine Signalmaskierungsfunktion dar;
-
6 ist
ein Übersichts-Blockschaltbild
des Benutzer-Sprachdetektors
der Steuerung von 3.
-
BESCHREIBUNG DER BEVORZUGTEN
AUSFÜHRUNGSFORMEN
-
Die
vorliegende Erfindung ist ein Verfahren und eine Einrichtung zum
geeigneten Verstärken
eines Signals, um Umgebungslärmgeräusch zu übertönen. Insbesondere
kann die vorliegende Erfindung benutzt werden, um sicherzustellen,
dass ein Eingangssignal in ein System, wie etwa ein Mobilfunk-Telefoniesystem,
für den
Benutzer hörbar
ist.
-
Die
Grundsätze
und der Ablauf von anpassungsfähiger
Signalverstärkung
gemäß der vorliegenden
Erfindung kann besser mit Bezug auf die Zeichnungen und die begleitende
Beschreibung verstanden werden. In den Zeichnungen wird die Einrichtung
der vorliegenden Erfindung in Form von funktionalen Blöcken beschrieben.
In einer analogen Ausführung
der vorliegenden Erfindung, stellen diese Blöcke im Allgemeinen Schaltkreisläufe dar,
die die Funktionalität
ihrer entsprechenden Blöcke
ausführen.
In einer digitalen Ausführung
der vorliegenden Erfindung stellen diese Blöcke im Allgemeinen Algorithmen
zum Ausführen
der Funktionalität
ihrer entsprechenden Blöcke
dar, die durch einen oder mehrere Mehrzweckprozessoren, einen oder
mehrere Spezialprozessoren für
digitale Signale, oder einer Kombination davon durchgeführt werden.
Es wird einem Fachmann von der nachfolgenden Beschreibung genau
klar werden, wie die Funktionalität dieser funktionalen Blöcke in jeder
bestimmten Durchführung
der vorliegenden Erfindung ausgeführt wird.
-
Wieder
mit Bezug auf die Zeichnungen ist 2A ein Übersichts-Blockschaltbild
einer Einrichtung 30 der vorliegenden Erfindung. Die Eingänge an die
Einrichtung 30 sind ein elektronisches Signal S(t), das
eine Funktion der Zeit t ist und ein äußeres akustisches Feld, über ein
Mikrofon 34. Der Ausgang von Einrichtung 30 ist
eine akustische Darstellung eines modifizierten Signals S'(t), über einen
Lautsprecher 32. Das Mikrofon 34 stellt einen
Umformer zum Umwandeln von akustischer Energie in elektrische Energie
dar. Der Lautsprecher 32 stellt einen Umformer zum Umwandeln
von elektrischer Energie in akustische Energie dar.
-
Der
Lautsprecher 32 ist ausreichend nahe am Mikrofon 34,
derart, dass das akustische Feld, das von dem Benutzer der Einrichtung 30 wahrgenommen
wird, und das die akustische Energie von Lautsprecher 32 umfasst,
im Wesentlichen identisch mit dem akustischen Feld am Mikrofon 34 ist.
Zum Beispiel können
Lautsprecher 32 und Mikrofon 34 in einem Mobilfunktelefon
benachbart sein. Deshalb ist, wenn der Benutzer von der Einrichtung 30 ruhig
ist, der Ausgang von Mikrofon 34 eine Summe eines Umgebungslärmgeräusches in
der Nähe
des Lautsprechers 32 und die Umsetzung von Signal S'(t) in akustische
Energie durch den Lautsprecher 32. Dieser kombinierte Ausgang
wird hier ebenfalls als ein „Umgebungssignal" bezeichnet. Dieser
kombinierte Ausgang wird in einem Verstärker 36 verstärkt. Das
modifizierte Signal S'(t)
wird von diesem verstärkten Ausgang
in eine Fehlerlöscheinrichtung 38 verschoben,
um eine Schätzung <N(t)> des Umgebungslärmgeräusches in
der Nähe
des Lautsprechers 32 bereitzustellen. Der Verstärkungspegel
des Verstärkers 36 wird
in einem Abgleichverfahren derart justiert, dass die Signalkomponente
des Ausgangs des Verstärkers 36 im
Wesentlichen gleich dem modifizierten Signal S'(t) ist. Die zwei Eingänge der
Steuerung 40 sind das Signal S(t) und die Lärmgeräuschschätzung <N(t)>. Das Signal S'(t), der Ausgang
der Steuerung 40, ist das Signal S(t), modifiziert und
verstärkt
relativ zu der Lärmgeräuschschätzung <N(t)> gemäß den Grundsätzen der
vorliegenden Erfindung, um das Umgebungslärmgeräusch in der Nähe des Lautsprechers
zu übertönen. Wie
nachfolgend gesehen werden kann, umfasst die an Signal S(t) ausgeführte Modifikation,
um S'(t) zu erzeugen,
eine Zeitverzögerung
dt.
-
Eine
Variante von Einrichtung 30 umfasst zwei Mikrofone 34,
ein Mikrofon 34, das das Sprechen des Benutzers in elektrische
Energie umwandelt, und ein weiteres Mikrofon 34, das sich
in der Nähe
des Lautsprechers 32 befindet und das das akustische Feld
in der Nähe
des Lautsprechers in elektrische Energie umwandelt. Bei dieser Variante müssen die
Lautsprecher 32 in der Nähe des Benutzers der Einrichtung
angeordnet sein.
-
2B ist
ein Übersichts-Blockschaltbild
einer einfacheren Einrichtung 30' der vorliegenden Erfindung für die Benutzung
in einer Umgebung, die eine einzelne, vorherrschende Lärmgeräuschquelle, wie
etwa den Motor eines Automobils, aufweist. Die Eingänge an die
Einrichtung 30' sind, über ein
Mikrofon 34',
das elektronische Signal S(t) und das akustische Feld in der Nähe der Lärmgeräuschquelle,
das in der Nähe
der Lärmgeräuschquelle
angeordnet ist. Wie in der Einrichtung 30 ist der Ausgang
von Einrichtung 30' eine
akustische Darstellung eines modifizierten Signals S'(t) über Lautsprecher 32.
Der Ausgang von Mikrofon 34' wird
verstärkt
durch einen Verstärker 36', um die Lärmgeräuschschätzung <N(t)> bereitzustellen. Der
Verstärkungspegel
von Verstärker 36' wird in einem
Abgleichverfahren derart justiert, dass die Amplitude der Lärmgeräuschschätzung <N(t)> das Energieniveau
des Umgebungslärmgeräusches am
Lautsprecher 32 wiedergibt.
-
3 ist
ein Übersichtsblockschaltbild
von Steuerung 40. Durchgezogene Pfeile in 3 zeigen den
Signalfluss an. Gestrichelte Pfeile in 3 zeigen
Ansteuerung an. Signal S(t) wird in einem Verzögerungsblock 44 um
eine Zeitverzögerung
dt verzögert,
um basierend auf Rückwärtszeitmaskierung
die Ausführung
der Verarbeitung des Signals S(t) zu erlauben, wie nachfolgend beschrieben.
Das verzögerte
Signal S(t – dt)
wird zu einem Signaldetektor 46 und zu einem Schalter 48,
der durch den Signaldetektor 46 gesteuert wird, gesandt.
Der Signaldetektor 46 hält
den Schalter 48 offen, bis der Signaldetektor 46 ein
Leistungsniveau des Eingangssignals über einer bestimmten Leistungsschwelle
erkennt. Nur wenn die Leistung des Signals S(t) diese Schwelle übersteigt,
schließt
der Signaldetektor 46 den Schalter 48. Wenn der
Schalter 48 geschlossen ist, werden das verzögerte Signal
S(t – dt)
zusammen mit dem unverzögerten
Signal S(t) und der Lärmgeräuschschätzung <N(t)> zum Eingang für einen
Signalwandler 60, der ferner das verzögerte Signal S(t – dt) modifiziert,
um das modifizierte Signal S'(t)
zu erzeugen. Der Zweck des Signaldetektors 46 ist, Leistung zu
sparen: der Signalwandler 60 wird nur dann eingeschalten,
um ein modifiziertes Signal S'(t)
zu erzeugen, wenn ein echtes Signal S(t) empfangen wird.
-
Die
Ausführungsform
der Steuerung 40, die in 3 dargestellt
wird, ist darauf gerichtet, Signale S(t) zu empfangen, die Sprechen
darstellen. Deshalb umfasst diese Ausführungsform der Steuerung 40 einen Übergangsdetektor 54,
um „Breitbandmaskierung" auszuführen: beim
Einsetzen der Sprache verursacht der schnelle Anstieg der Signalleistung,
dass das entsprechende akustische Signal trotz des Umgebungslärmgeräusches durch
den Benutzer wahrgenommen wird, und das durch den Signalwandler 60 ausgeführte aufwendige
Verarbeiten wird unnötig. Der Übergangsdetektor 54 steuert
zwei Schalter 50 und 58. Zunächst sind beide Schalter 50 und 58 offen.
Wenn der Übergangsdetektor 54 einen
ausreichend schnellen Anstieg an Signalleistung erkennt, schließt der Übergangsdetektor 54 den
Schalter 50 und öffnet
Schalter 58, um zu ermöglichen,
dass das verzögerte
Signal S(t – dt)
durch einen Verstärker 52 verstärkt wird
und als hörbare
Sprache durch den Lautsprecher 32 wiedergegeben wird. Eine übliche Ratenschwelle
für diese
Tätigkeit
des Übergangsdetektors 54 ist
ein Wechsel der Eingangsleistung um die Hälfte des vollen Leistungsbereichs
des Übergangsdetektors 54 innerhalb
von 50 Millisekunden. Wenn der Übergangsdetektor 54 ein örtliches
Maximum an Eingangsleistung als eine Funktion der Zeit erkennt, öffnet der Übergangsdetektor 54 den
Schalter 50 und schließt
den Schalter 58, um zu ermöglichen, dass das modifizierte
Signal S'(t) durch
den Verstärker 52 verstärkt wird
und als hörbare
Sprache durch den Lautsprecher 32 wiedergegeben wird. Wenn,
mit geöffneten
Schaltern 50 und 58, die Signalleistung um eine
Rate ansteigt, die niedriger als die Ratenschwelle ist, dann schließt der Übergangsdetektor 54 lediglich
Schalter 58. Wenn die Signalleistung unter eine weitere
Leistungsschwelle abfällt, öffnet Signaldetektor 46 den
Schalter 48 und der Übergangsdetektor 54 öffnet die
Schalter 50 und 58.
-
Die
Steuerung 40 umfasst einen Benutzersprachdetektor 56,
dessen Funktion es ist, die Schalter 50 und 58 zu
schließen,
während
der Benutzer spricht. Daher hört
der Benutzer, während
der Benutzer spricht, das unmodifizierte (mit Ausnahme der Verzögerung)
Signal S(t – dt).
Ohne diese Funktionalität
des Benutzersprachdetektors 56 würde die Sprache des Benutzers
durch den Signalwandler 60 als Teil des Umgebungslärmgeräuschfeldes
behandelt werden, und das modifizierte Signal S'(t) würde sowohl die Sprache des
Benutzers, als auch das echte Umgebungslärmgeräusch maskieren. Die Arbeitsweise
des Benutzersprachdetektors 56 wird nachfolgend ausführlicher
beschrieben.
-
4 ist
ein Übersichts-Blockschaltbild
des Signalwandlers 60. Das verzögerte Eingangssignal S(t – dt) wird
zu einer Bank von Bandpassfiltern 62 geleitet. Das unverzögerte Eingangssignal
wird an eine ähnliche
Bank von Bandpassfiltern 63 geleitet und die Lärmgeräuschschätzung <N(t)> wird an eine ähnliche
Bank von Bandpassfiltern 64 geleitet. Für eine darstellende Deutlichkeit
werden nur drei verzögerte
Signalbandpassfilter 62, nur drei unverzögerte Signalbandpassfilter 63 und
nur drei Lärmgeräuschbandpassfilter
in 4 gezeigt. Es ist üblicher 8, 14, 24 oder sogar
mehr Bandpassfilter 62, 63 oder 64 in jeder
Bank zu haben. Die Passbänder
von Bandpassfiltern in derselben Bank sind benachbart und die Passbänder von
entsprechenden Filtern in den zwei Banken sind identisch. Zum Beispiel,
um den Bereich von Audiofrequenzen von 20 Hz bis 20 KHz zu umfassen,
könnten
die Passbänder
der Filter 62a, 63a und 64a von 20 Hz
bis 200 Hz reichen, und die Passbänder der Filter 62c, 63c und 64c könnten von 2
KHz bis 20 KHz reichen. Es ist anzumerken, dass der Frequenzabstand
in diesem Beispiel logarithmisch ist, was dem linearen Abstand vorzuziehen
ist. Die Ausgänge
der verzögerten
Signalbandpassfilter 63 sind die verzögerten Signale Teilbänder Si(t – dt), i ∊ [1,
n], wobei n die Anzahl von Bandpassfiltern in jeder Bank ist. Die
Ausgänge
der unverzögerten
Signalbandpassfilter 63 sind die entsprechenden unverzögerten Signal-Teilbänder Si(t). Die Ausgänge des Lärmgeräusch-Bandpassfilters 64 sind
die entsprechenden Lärmgeräusch-Teilbänder Ni(t).
-
Die
verzögerten
Signal-Teilbänder
Si(t – dt) sind
Eingang in eine Bank von Funktionsblöcken 66 der Einhüllenden
des verzögerten
Signals. Der Ausgang eines jeden Funktionsblocks 66i der
Einhüllenden
des verzögerten
Signals ist eine Funktion Se i(t – dt) der
Einhüllenden
der verzögerten
Signalleistung, die die Leistungseinhüllende des Signal-Teilbands Si(t – dt)
des verzögerten
Eingangssignals ist. Gleichermaßen
sind die Teilbänder
Si(t) des unverzögerten Signals Eingang in eine
Bank von Funktionsblöcken 67 der
Einhüllenden
des unverzögerten
Signals, und die Lärmgeräusch-Teilbänder Ni(t) sind Eingang in eine Bank von Funktionsblöcken 68 von Lärmgeräuscheinhüllenden.
Der Ausgang von jedem Funktionsblock 67i der Einhüllenden
des unverzögerten
Signals ist eine Funktion Se i(t)
der Einhüllenden
der unverzögerten
Signalleistung, die die Leistungseinhüllende des Teilbands Si(t) des unverzögerten Eingangssignals ist.
Der Ausgang eines jeden Funktionsblocks 68i der Lärmgeräuscheinhüllenden ist
eine Funktion Ne i(t)
der Einhüllenden
der Lärmgeräuschleistung,
die die Leistungseinhüllende
des Eingangslärmgeräusch-Teilbands Ni(t) ist. Zum Beispiel sind in einer digitalen
Ausführung
der vorliegenden Erfindung die Abfragewerte der Funktion Se i(t – dt) der
verzögerten
Signalleistungseinhüllenden
die Quadrate der entsprechenden Abfragewerte der Teilbänder Si(t – dt)
des verzögerten
Signals, die Abfragewerte der Funktion Se i(t) der unverzögerten Signalleistungseinhüllenden
sind die Quadrate der entsprechenden Abfragewerte der Teilbänder Si(t) des unverzögerten Signals, und die Abfragewerte
der Funktionen Ne i(t)
sind die Quadrate der entsprechenden Werte des Lärmgeräusch-Teilbands Nt(t).
Vorzugsweise werden die Funktionen Se i(t), Se i(t – dt) und Ne i(t) der Leistungseinhüllenden
nochmals durch zusätzliche
Tiefpassfilter gefiltert (nicht gezeigt).
-
Um
das Vorwärts-
und Rückwärtszeitmaskieren
einzuführen,
werden die Funktionen Se i(t – dt) der Signalleistungseinhüllenden
in Signalmaskierungsfunktionen Mi(t – dt) in
den Maskierungs-Funktionsblöcken 70 umgewandelt.
-
Wie
dies ausgeführt
wird, wird in 5 dargestellt. 5A zeigt
eine Funktion der Signalleistungseinhüllenden Se(t – dt) als
eine Funktion der Zeit. Eine Gruppe von Linienabschnitten 82 der
Vorwärtszeitmaskierung
wird auf die Scheitelpunkte der Funktion Se(t – dt) der
Signalleistungseinhüllenden angelegt,
wie gezeigt. Die Steigungen der Linienabschnitte 82 der
Vorwärtszeitmaskierung
sind flach und negativ, entsprechend der vorangehend beschriebenen
Vorwärtszeitmaskierung.
Eine Gruppe von Linienabschnitten 84 der Rückwärtszeitmaskierung
wird ebenfalls auf die Scheitelpunkte der Funktion Se(t – dt) der
Signalleistungseinhüllenden
angelegt, wie gezeigt. Die Steigungen der Linienabschnitte 84 der
Rückwärtszeitmaskierung
sind steil und positiv, entsprechend der vorangehend beschriebenen Rückwärtszeitmaskierung.
Die Steigungen erhöhen sich
mit der Frequenz und erhöhen
sich ebenfalls mit dem Amplitudenscheitelpunkt. Jeder Maskierungsfunktionsblock 70 weist
eine tabellierte Amplitudenfunktion von Steigung zu Scheitelpunkt
auf. Die kombinierte Einhüllende
der Funktion Se(t – dt) der Signalleistungseinhüllenden
und der Linienabschnitte 82 und 84 ist die gewünschte Maskierungsfunktion
M(t – dt),
gezeigt in 5B. Mit anderen Worten, der
in 5 dargestellte Vorgang wandelt
die Funktion Se(t – dt) der Signalleistungseinhüllenden
in die Funktion M(t – dt)
der Wirkleistungseinhüllenden
um, die tatsächlich
von dem Benutzer der Einrichtung 30 wahrgenommen wird.
Die Funktionen Se i(t)
der Leistungseinhüllenden
des unverzögerten
Signals sind Eingang in die Maskierungsfunktionsblöcke 70,
um den Maskierungsfunktionsblöcken 70 zu
ermöglichen, vorzeitig
die Zeiten und Amplituden der Scheitelpunkte der Funktionen Se i(t – dt) der
Einhüllenden des
verzögerten
Signals zu kennen, und um so zu wissen, wo die Linienabschnitte 84 anzusetzen
sind, bevor die entsprechenden Scheitelpunkte der Funktionen Se i(t – dt) der
Einhüllenden
der verzögerten
Signalleistungen an den Maskierungsfunktionsblöcken 70 ankommen.
-
Benachbarte
Frequenzmaskierung der Signalmaskierungsfunktionen Mi(t – dt) wird
im Frequenzmaskierungsblock 72 ausgeführt. Jede Signalmaskierungsfunktion
Mi(t – dt)
wird mindestens mit ihren nächsten
Nachbarn Mi+1(t – dt) (für i < n) und Mi-1(t – dt) (für i > 1) verglichen. Wenn
einer der beiden Nachbarn Mi±1(t – dt) Mi(t – dt)
um mehr als eine bestimmte zusätzliche
Schwelle übersteigt,
wird Mi(t – dt) genullt, d.h. gleich
Null gesetzt. Diese Schwelle ist im Allgemeinen eine Funktion der
Frequenzgrenzen von Teilband i und kann ebenfalls eine Funktion von
Mi(t – dt)
selbst sein. Zum Beispiel wird eine bevorzugte Gruppe von Schwellen
durch das Abfallen von der Mittenfrequenz eines jeden Bandpassfilters 62 zu
den Mittenfrequenzen der benachbarten Bandpassfilter 62 bei
einer Steigung von –20
dB/Dekade erhalten. Optional können
die Nachbarn Mi±2(t – dt), Mi±3(t – dt) etc.,
die nicht am nächsten
sind, in diese benachbarte Frequenzmaskierung mit aufgenommen werden,
mit Schwellen, die entsprechend höher sind als die Schwellen,
die für
die nächsten
Nachbarn Mi±1(t – dt) benutzt
werden, obwohl es am vorteilhaftesten ist, nur die nächsten Nachbarn
zu benutzen. In einer analogen Ausführungsform der vorliegenden Erfindung,
in der die Signalmaskierungsfunktionen Mi(t – dt) stetige
Funktionen der Zeit sind, wird dieser Vergleich „augenblicklich" durchgeführt. In
einer digitalen Ausführung
der vorliegenden Erfindung, in der die Signalmaskierungsfunktionen
Mi(t – dt)
zu getrennten Abfragezeiten tj abgefragt
werden, wird dieser Vergleich getrennt zu jeder Abfragezeit durchgeführt.
-
Ähnliche
benachbarte Frequenzmaskierung der Lärmgeräuschleistungseinhüllenden
Ne i(t) wird in dem
Frequenzmaskierungsblock 74 ausgeführt. Die Schwellen, die für die Frequenzmaskierung
der Signalmaskierungsfunktionen („Signalfrequenzmaskierung") benutzt werden,
sind nicht notwendigerweise dieselben wie die Schwellen, die für die Frequenzmaskierung
der Lärmgeräuschleistungseinhüllenden („Lärmgeräuschfrequenzmaskierung") benutzt werden.
-
Die
fortbestehenden Maskierungsfunktionen und Lärmgeräuschleistungseinhüllenden
werden Teilband für
Teilband in den Vergleichsblöcken
76 verglichen,
um für
die Verstärker
78 den
Verstärkungsfaktor
zu bestimmen, durch den die entsprechenden Teilbänder der verzögerten Signale
verstärkt
werden müssen,
um die entsprechenden Lärmgeräusch-Teilbänder zu
maskieren. Am einfachsten ist es, wenn der Verstärkungsfaktor für ein Signal,
das weniger Leistung aufweist als das entsprechende Lärmgeräusch-Teilband, die Quadratwurzel
des Verhältnisses
von Lärmgeräuscheinhüllender
zu der Signalmaskierungsfunktion ist: der Verstärkungsfaktor von Verstärker
78i zur
Zeit t ist
Die verstärkten Signal-Teilbänder werden
summiert in einem Addierer
80, um das modifizierte Ausgangssignal
S'(t) auszugeben.
-
Der
oben beschriebene Algorithmus geht davon aus, dass die Steuerung
40 augenblickliches Verarbeiten
des Signals S(t) und der Lärmgeräuschschätzung <N(t)> bewirken kann. Tatsächlich benötigt diese
Verarbeitung eine endliche Zeit t
p, die
bis zu ungefähr
5 Millisekunden lang sein kann. Als Folge davon eilt der Verstärkungsfaktor
dem Lärmgeräusch hinterher, das der Benutzer
tatsächlich
mit mindestens einer Verzögerungszeit
von t
p hört.
-
In
einigen Einrichtungen 30 der vorliegenden Erfindung sind
der Lautsprecher 32 und das Mikrofon 34 nicht
benachbart zu dem Benutzer. Ein Beispiel einer solchen Einrichtung 30 ist
eine Stereoanlage eines Automobils, wobei Lautsprecher 32 und
Mikrofon 34 in Richtung des hinteren Raums einer Insassenkabine
eines Automobils angeordnet sind. In einer solchen Umgebung kommt
Lärmgeräusch von
einer zeitweiligen Lärmgeräuschquelle
in der Nähe
des Fahrers des Automobils (der der Benutzer der Einrichtung 30 ist)
bei dem Benutzer an, bevor es am Mikrofon 34 ankommt, und
der Verstärkungsfaktor
eilt dem Lärmgeräusch hinterher,
das der Benutzer tatsächlich
mit einer Verzögerungszeit
größer als
tp hört.
-
Um
dies auszugleichen, ist es vorzuziehen, in dem Nenner unter der
Quadratwurzel des Verstärkungsfaktors,
nicht Mi(t – dt), sondern zu jeder Zeit
t, das Minimum einer Gruppe von n + 1 Maskierungsfunktionen Mi(t – dt – tp), Mi(t – dt – tp – tmax/n), Mi(t – dt – tp – 2tmax/n), ... Mi(t – dt – tp – tmax,) zu benutzen, wobei tmax die
zweifache geschätzte,
maximale Zeitverzögerung
zwischen der Ankunft des Lärmgeräusches beim
Benutzer und der Ankunft am Mikrofon 34 ist. Es ist anzumerken,
dass tmax die zweifache geschätzte maximale
Zeitverzögerung
sein muss, um die sowohl die akustische Laufzeit von der Lärmgeräuschquelle
zum Mikrofon 34, als auch die akustische Laufzeit vom Lautsprecher 32 zu
dem Benutzer zu berücksichtigen.
Aus diesem Grunde wird tmax hier auch als „eine geschätzte maximale
Umlaufzeit" bezeichnet.
In der oben beschriebenen Fahrzeugumgebung ist die maximale einfache
Laufzeit in der Größenordnung
von 5 Millisekunden. Mit einer Verarbeitungszeit tp von
5 Millisekunden beträgt
die maximale zusätzliche
Verzögerung
tp + tmax der Maskierungsfunktionen
des verzögerten
Signals 25 Millisekunden.
-
Am
vorteilhaftesten wird dieser Ausgleich nur für die Bereiche von Mi(t – dt)
durchgeführt,
die den Linienabschnitten 84 der Rückwärtszeitmaskierung entsprechen,
das es diese Bereiche von Mi(t – dt) sind,
die an der Rückwärtszeitmaskierung
teilnehmen.
-
Außerdem ist
es vorteilhaft, eine abschließende
Justierung der Amplituden der fortbestehenden Teilbänder des
verzögerten
Signals vor der Addierung dieser Teilbänder im Addierer 80 vorzunehmen.
Aus diesem Grund zeigt 4 einen weiteren Vergleichsblock 77,
der zwischen den Vergleichsblöcken 76 und
Addierer 80 eingeschoben ist. Die vorangehende Justierung
der Amplitude eines Signal-Teilbandes,
um das entsprechende Lärmgeräusch-Teilband
zu übertönen, kann
das Teilband so laut machen, dass psycho-akustische Frequenzmaskierung durch
den Benutzer das benachbarte Signal-Teilband unhörbar wiedergibt. Daher werden
die Amplituden der benachbarten fortbestehenden Signal-Teilbänder im
Vergleichsblock 77 verglichen, und relativ schwache Signal-Teilbänder werden
dementsprechend verstärkt.
-
6 ist
ein Übersichts-Blockschaltbild
einer Ausführungsform
des Benutzersprachdetektors 56. Wie in 3 zeigen
durchgezogene Pfeile in 6 den Signalfluss an, und gestrichelte
Pfeile in 6 zeigen Ansteuerung an. Zusätzlich dazu,
dass es zu der Partei gesendet wird, mit der der Benutzer sprechen
möchte,
ist das Signal (optional verstärkt) von
dem Mikrofon 34 Eingang in einen Scheitelpunktdetektor 82 und
einem Steigungsdetektor 84. Ähnlich wie der Signaldetektor 46 erkennt
der Scheitelpunktdetektor 82 den Anstieg der Eingangssignalleistung über eine
Schwelle, die anpassungsfähig
bestimmt wird, wie nachfolgend beschrieben. Ähnlich wie Übergangsdetektor 54,
erkennt der Steigungsdetektor den Anstieg der Eingangssignalleistung
bei einer Rate, die eine voreingestellte Schwelle übersteigt. Wenn
beide Bedingungen herrschen, d.h. dass die Signalleistung von Mikrofon 34 mit
einer Rate ansteigt, die die voreingestellte Ratenschwelle übersteigt
und über
die anpassungsfähig
eingestellte Signalschwelle steigt, schließt der Logikblock 86 daraus, dass
das Sprechen des Benutzers eingesetzt hat. Der Logikblock 86 schließt dann
den Schalter 50 der Steuerung 40 und öffnet den
Schalter 58 der Steuerung 40, wie oben beschrieben.
Es ist anzumerken, dass der Scheitelpunktdetektor 82 nur
eine von mehreren Arten von Einsatz-Detektoren ist, die im Stand der
Technik bekannt sind und die geeignet sind, das Einsetzen eines
Signals von dem Mikrofon 34 zu erkennen.
-
Wenn
das Sprechen des Benutzers pausiert, erkennt der Scheitelpunktdetektor 82 den
Abfall der Eingangssignalleistung unter die Signalschwelle, und der
Steigungsdetektor erkennt den Abfall der Eingangssignalleistung
mit einer Rate, die die voreingestellte Schwelle übersteigt.
Wenn beide Bedingungen herrschen, d.h. dass die Signalleistung von
dem Mikrofon 34 mit einer Rate abnimmt, die die voreingestellte
Schwelle übersteigt
und unter die anpassungsfähig
eingestellte Signalschwelle abgefallen ist, und wenn eine voreingestellte
Zeit seit Beginn des Sprechens des Benutzers vergangen ist, schließt der Logikblock 86 daraus,
dass das Sprechen des Benutzers beendet ist. Der Logikblock 86 öffnet dann
den Schalter 50 der Steuerung 40 und schließt den Schalter 58 der
Steuerung 40.
-
Die
anpassungsfähige
Schwelle für
den Scheitelpunktdetektor 82 wird durch einen Schwellenspeicher 90 bereitgestellt,
der das Signal vom Mikrofon 34 mittelt und speichert, während der
Benutzer nicht spricht, und das Signal von Mikrofon 34 stellt
deshalb Umgebungslärmgeräusch dar.
Zu diesem Zwecke öffnet
der Logikblock 86 ebenfalls einen Schalter 88 zusammen
mit dem Schalter 58, wenn der Logikblock 86 das
Einsetzen des Sprechens des Benutzers erkennt und der Logikblock 86 schließt den Schalter 88 zusammen
mit dem Schalter 58, wenn der Logikblock das Ende des Sprechens
des Benutzers erkennt.
-
Obwohl
die Erfindung mit Bezug auf eine beschränkte Anzahl von Ausführungsformen
beschrieben wurde, wird verstanden werden, dass viele Abweichungen,
Abänderungen
und andere Anwendungen der Erfindung gemacht werden können.