-
HINTERGRUND DER ERFINDUNG
-
1. Gebiet der Erfindung
-
Die
vorliegende Erfindung bezieht sich auf einen Eingangstonprozessor
zum Bestimmen der Tonleistung an einem bestimmten Punkt, insbesondere
auf einen Eingangstonprozessor zum Abschätzen der Leistung einer Führungsstimme
an einem Mikrophon.
-
2. Beschreibung der in Verbindung
stehenden Technik
-
Ein
typischer Navigationsstimmenkorrektor für die Verwendung in einem Navigationssystem ändert den
Tondruckpegel einer Führungsstimme
in Abhängigkeit
von dem Umgebungsgeräuschpegel,
um eine verständliche
Führungsstimme
sogar in lauten Umgebungen zu schaffen (siehe zum Beispiel die
japanische ungeprüfte Patentanmeldung
mit der Veröffentlichungsnummer
11-166835 (Seiten 3 bis 6,
1 bis
10)). In diesem Navigationsstimmenkorrektor
korrigiert eine auf Lautstärkenkompensation
basierende Verstärkungsbestimmungseinheit
die Verstärkung
einer von einem Lautsprecher ausgegebenen Führungsstimme auf der Basis
der Tondruckpegel von Umgebungsgeräusch und der Führungsstimme
an der Position eines Mikrophons, von der angenommen wird, dass
sie ein Hörpunkt
der Führungsstimme
ist. Der Tondruckpegel des Umgebungsgeräuschs und der Führungsstimme,
die in die auf Lautstärkenkompensation
basierende Verstärkungsbestimmungseinheit
eingegeben werden, werden durch die Gesamttonleistung dargestellt,
die durch das Summieren der Leistungen an allen einer Mehrzahl von
Frequenzkomponenten bestimmt wird.
-
Die
Führungsstimme
und das Umgebungsgeräusch
erreichen das Mikrophon tatsächlich gleichzeitig
und es ist nicht möglich,
nur die Führungsstimme
aus dem von dem Mikrophon aufgenommenen Ton zu extrahieren.
-
Eine
typische Technik für
das Extrahieren einer Führungsstimme
ist das Abschätzen
der Führungsstimme
an dem Mikrophon auf der Basis der Transfercharakteristik von dem
Lautsprecher zu dem Mikrophon und des in den Lautsprecher eingegebenen
Führungsstimmensignals.
Die Gesamtleistung der Führungsstimme
am Mikrophon wird durch das getrennte Bestimmen der Leistung an
jeder Frequenzkomponente der Führungsstimme
und einer Quadratamplitude der Transfercharakteristik an jeder Frequenzkomponente
und das Ausführen
einer Produkt-Summen-Operation an jeder Frequenzkomponente (siehe
zum Beispiel die japanische ungeprüfte Patentanmeldung mit der
Veröffentlichungsnummer 2002–23790 (Seiten
3 bis 4, 1 bis 2)) bestimmt.
-
Letztere
Veröffentlichung
offenbart, dass die an jeder Frequenzkomponente einer eingegebenen Stimme
bestimmte Leistung mit der Quadratamplitude jedes Abgriff-Koeffizienten
multipliziert wird, der die Transfercharakteristik anzeigt, und
dann eine Summe der Produkte berechnet wird. Es ist deshalb notwendig,
eine Produkt-Summen-Operation an allen Frequenzkomponenten auszuführen, was
zu einem großen
Verarbeitungsaufwand führt.
Es ist deshalb ein Hochleistungsprozessor erforderlich, was kostenaufwendig
ist.
-
ZUSAMMENFASSUNG DER ERFINDUNG
-
Dementsprechend
ist es eine Aufgabe der vorliegenden Erfindung, einen kostengünstigen
Eingangstonprozessor mit einem kleinen Verarbeitungsaufwand zu schaffen.
-
In
einem Aspekt der vorliegenden Erfindung weist ein Eingangstonprozessor
zum Abschätzen
der Gesamtleistung eines von einem Lautsprecher ausgegebenen Eingangstons
an einem Mikrophon eine erste Frequenzanalyseeinheit, die ein in
den Lautsprecher eingegebenes Eingangstonsignal in eine Mehrzahl
von Frequenzkomponenten aufteilt, eine erste Leistungsberechnungseinheit,
die Leistung an jeder der von der ersten Frequenzanalyseeinheit
aufgeteilten Frequenzkomponenten bestimmt, eine Quadratamplituden-Berechnungseinheit,
die eine Quadratamplitude eines Filterkoeffizienten an jeder der
Frequenzkomponenten bestimmt, wobei der Filterkoeffizient eine Filtercharakteristik
ent sprechend einer Transfercharakteristik in einem akustischen Raum
von dem Lautsprecher zu dem Mikrophon ist, eine Leistungsvergleichseinheit,
die die von der ersten Leistungsberechnungseinheit bestimmte Leistung
an jeder der Frequenzkomponenten mit einem Referenzwert vergleicht,
eine Multiplikationspunkt-Einstellungseinheit, die Multiplikationspunkte, die
Frequenzkomponenten anzeigen, an denen die Gesamtleistung des Eingangstons
zu bestimmen ist, auf der Basis eines Vergleichsergebnisses der
Leistungsvergleichseinheit einstellt, und eine Produkt-Summen-Betriebseinheit,
die eine Produkt-Summen-Operation an den von der Multiplikationspunkt-Einstellungseinheit
eingestellten Multiplikationspunkten unter Verwendung der von der
ersten Leistungsberechnungseinheit bestimmten Leistung an jeder
der Frequenzkomponenten und der von der Quadratamplituden-Berechnungseinheit
bestimmten Quadratamplitude des Filterkoeffizienten an jeder der
Frequenzkomponenten durchführt.
Folglich wird eine Produkt-Summen-Operation nicht an einer Frequenzkomponente
ausgeführt,
die im Wesentlichen keine Leistung hat. Deshalb kann der Verarbeitungsaufwand
reduziert werden und kann ein preisgünstiger Prozessor verwendet
werden, was zu Kostenersparnissen führt.
-
Vorzugsweise
stellt die Multiplikationspunkt-Einstellungseinheit Frequenzkomponenten
bis auf jene mit einer Leistung, die gleich oder geringer ist als
der Referenzwert, als die Multiplikationspunkte ein. Dies stellt
sicher, dass eine Frequenzkomponente mit einem kleinen Produkt aus
der Leistung und der Quadratamplitude jedes Filterkoeffizienten,
die die Gesamt-Produkt-Summen-Operation folglich nicht beeinflusst,
extrahiert werden kann.
-
Vorzugsweise
vergleicht die Leistungsvergleichseinheit die von der ersten Leistungsberechnungseinheit
bestimmte Leistung an jeder der Frequenzkomponenten mit dem Referenzwert
und vergleicht die Quadratamplitude des Filterkoeffizienten mit
dem Referenzwert. Vorzugsweise stellt die Multiplikationspunkt-Einstellungseinheit
Frequenzkomponenten bis auf jene, bei denen mindestens die Leistung
oder die Quadratamplitude gleich oder geringer ist als der Referenzwert,
als die Multiplikationspunkte ein. In Anbetracht der Transfercharakteristik
in dem akustischen Raum von dem Lautsprecher zu dem Mikrophon, insbesondere
der Transfercharakteristik in dem Raum einer Fahrzeugkabine, kann
ein Ton mit einem bestimmten Frequenzband absorbiert werden und
ist die Quadratamplitude der Filtercharakteristik an diesem Frequenzband
sehr gering. Folglich hat das Produkt der Quadratamplitude und der
Leistung einen kleinen Wert. Eine Produkt-Summen-Operation wird
in diesem Frequenzband nicht ausgeführt, wodurch der Verarbeitungsaufwand
der Gesamt-Produkt-Summen-Operation
reduziert wird.
-
In
einem anderen Aspekt der vorliegenden Erfindung ist ein Eingangstonprozessor
für das
Abschätzen
der Gesamtleistung eines von einem Lautsprecher ausgegebenen Eingangstons
an einem Mikrophon nach Anspruch 4 vorgesehen.
-
Wenn
der Eingangston eine Stimme ist, hat die Stimme große Schwankungen
in den Werten von Frequenzkomponenten abhängig davon, ob es sich um einen
Konsonanten oder einen Vokal handelt. Genauer haben, wenn die Stimme
aus einem Konsonanten gebildet ist, die konsonantenspezifischen Frequenzkomponenten
Werte, während
die anderen Frequenzkomponenten einen Wert von im Wesentlichen Null
haben. Wenn die Stimme aus einem Vokal gebildet ist, haben die vokalspezifischen
Frequenzkomponenten Werte, während
die anderen Frequenzkomponenten einen Wert von im Wesentlichen Null
haben. Durch das Bestimmen, ob der Eingangston aus einem Vokal oder
einem Konsonanten gebildet ist, kann eine Frequenzkomponente, die
im Wesentlichen keine Leistung hat, identifiziert werden und kann
eine Produkt-Summen-Operation
an dieser Frequenzkomponente weggelassen werden. Deshalb kann der
Verarbeitungsaufwand reduziert werden und kann ein preisgünstiger
Prozessor verwendet werden, was zu Kostenersparnis führt.
-
Vorzugsweise
vergleicht die Bestimmungseinrichtung für Konsonanten oder Vokal die
Leistung in einem Vokalfrequenzbereich mit der Leistung in einem
Konsonantenfrequenzbereich, um zu bestimmen, ob der Eingangston
einen Konsonanten oder einen Vokal aufweist. Es kann deshalb leicht
bestimmt werden, ob der Eingangston aus einem Konsonanten oder einem
Vokal gebildet ist.
-
Vorzugsweise
ist der Vokalfrequenzbereich 100 Hz bis 1 kHz und ist der Konsonantenfrequenzbereich
1 kHz bis 8 kHz. Da der Vokalfrequenzbereich und der Konsonantenfrequenzbereich
einander nicht überlappen,
kann die Konsonanten-oder-Vokal-Bestimmung leichter ausgeführt werden.
-
Vorzugsweise
weist der Eingangstonprozessor ferner eine Konsonantenbereichsieistungs-Bestimmungseinheit
auf, die die Leistung in dem Konsonantenfrequenzbereich durch das
Summieren der von der ersten Leistungsberechnungseinheit bestimmten
Leistungen an Frequenzkomponenten bestimmt, wobei die Frequenzkomponenten
in dem Konsonantenfrequenzbereich enthalten sind, und eine Vokalbereichsleistungs-Bestimmungseinheit, die
die Leistung in dem Vokalfrequenzbereich durch das Summieren der
von der ersten Leistungsberechnungseinheit bestimmten Leistungen
an Frequenzkomponenten bestimmt, wobei die Frequenzkomponenten in
dem Vokalfrequenzbereich enthalten sind, auf. Folglich können die
Leistung in dem Konsonantenfrequenzbereich und die Leistung in dem
Vokalfrequenzbereich leicht bestimmt werden.
-
Vorzugsweise
weist der Eingangtonprozessor ferner einen adaptiven Filter auf,
der den Filterkoeffizienten bestimmt. Vorzugsweise weist der Eingangstonprozessor
ferner eine zweite Frequenzanalyseeinheit auf, die ein von dem Mikrophon
ausgegebenes Signal in eine Mehrzahl von Frequenzkomponenten aufteilt,
wobei der adaptive Filter den Filterkoeffizienten an jeder der von
der ersten Frequenzanalyseeinheit erhaltenen Frequenzkomponenten
und durch die von der zweiten Frequenzanalyseeinheit erhaltenen
Frequenzkomponenten bestimmt. Folglich kann der Filterkoeffizient,
der dem tatsächlichen akustischen
Raum entspricht, korrekt bestimmt werden.
-
Vorzugsweise
nimmt das Mikrophon Ton auf, der den von dem Lautsprecher ausgegebenen
Eingangston und Umgebungsgeräusch
enthält.
Wenn Umgebungsgeräusch
an der Mikrophonposition vorhanden ist, kann die Gesamtleistung
des Eingangstons ohne Auswirkungen des Umgebungsgeräuschs bestimmt
werden.
-
Vorzugsweise
weist der Eingangstonprozessor ferner eine Gesamtleistungs-Bestimmungseinheit,
die die Gesamtleistung des von dem Mikrophon aufgenommenen Tons
bestimmt, und eine Subtraktionseinheit, die die von der Produkt-Summen-Betriebseinheit
unter Verwendung der Produkt-Summen-Operation bestimmte Gesamtleistung
an dem Eingangston am Mikrophon von der von der Gesamtleistungs-Bestimmungseinheit
bestimmten Gesamtleistung subtrahiert, um die Gesamtleistung des
Umgebungsgeräusches
zu bestimmen. Folglich kann nicht nur die Gesamtleistung eines Eingangstons
an der Mikrophonposition, sondern auch die Gesamtleistung des Umgebungsgeräuschs, das
den Eingangston nicht enthält,
bestimmt werden.
-
Der
Eingangston ist vorzugsweise eine von einer sich in einem Fahrzeug
befindlichen Vorrichtung ausgegebene Führungsstimme. Die Gesamtleistung
der von der sich in einem Fahrzeug befindlichen Vorrichtung ausgegebenen
Führungsstimme kann
bestimmt werden, wodurch eine Verstärkungssteuerung der Führungsstimme
in einer Fahrzeugkabine mit relativ hohem Umgebungsgeräusch ermöglicht wird.
-
KURZE BESCHREIBUNG DER ZEICHNUNGEN
-
1 ist
ein Blockdiagramm eines Eingangstonprozessors gemäß einer
ersten Ausführungsform
der vorliegenden Erfindung; und
-
2 ist
ein Blockdiagramm eines Eingangstonprozessors gemäß einer
zweiten Ausführungsform
der vorliegenden Erfindung.
-
BESCHREIBUNG DER BEVORZUGTEN
AUSFÜHRUNGSFORMEN
-
Ein
Eingangstonprozessor gemäß Ausführungsformen
der vorliegenden Erfindung wird jetzt mit Bezug auf die Zeichnungen
beschrieben.
-
Erste Ausführungsform
-
1 ist
ein Blockdiagramm eines Eingangstonprozessors gemäß einer
ersten Ausführungsform
der vorliegenden Erfindung. Der in 1 gezeigte
Eingangstonprozessor, der in einem Fahrzeug installiert ist, schätzt die
Leistung einer Führungsstimme
an der Position eines Mikrophons 100 und extrahiert andere
Umgebungsgeräusche
außer der
Führungsstimme
aus dem von dem Mikro phon 100 aufgenommenem Ton, um die
Leistung des Geräuschs
zu bestimmen.
-
Der
Eingangstonprozessor gemäß der ersten
Ausführungsform
weist das Mikrophon 100, Diskrete-Fourier-Transformations(DFT)-Berechnungseinheiten 10 und 12,
Leistungsberechnungseinheiten 14 und 16, eine
Gesamtleistungs-Bestimmungseinheit 18, einen adaptiven
Filter 20, eine Quadratamplituden-Berechnungseinheit 22,
eine Produkt-Summen-Betriebseinheit 24, eine Leistungsvergleichseinheit 26,
eine Multiplikationspunkt-Einstellungseinheit 28 und eine
Addiereinrichtung 30 auf.
-
Die
DFT-Berechnungseinheit 10 führt DFT auf einem von dem Mikrophon 100 ausgegeben
Signal aus, um den Signalpegel an jeder Frequenzkomponente zu extrahieren.
Der Eingangstonprozessor weist ferner einen Analog-Digital-Wandler vor der DFT-Berechnungseinheit 10 für das Umwandeln
des Ausgabesignals von dem Mikrophon 100 in digitale Daten
auf und die digitalen Daten werden in die DFT-Berechnungseinheit 10 eingegeben.
Zum Beispiel bestimmt die DFT-Berechnungseinheit 10 die Signalpegel
an 1024 Punkten, in die die akustische Frequenzbandbreite aufgeteilt
ist. Das Mikrophon 100 befindet sich in einer vorherbestimmten
Position in der Fahrzeugkabine, von der angenommen wird, dass sie
der Hörpunkt
eines Benutzers ist, z.B. ein gewisser Punkt auf dem Lenkrad.
-
Die
Leistungsberechnungseinheit 14 bestimmt die Leistung des
Signalpegels an jeder von der DFT-Berechnungseinheit 10 bestimmten
Frequenzkomponente. Genauer wird das Quadrat sowohl des echten Teils
als auch des imaginären
Teils des von der DFT-Berechnungseinheit 10 ausgegebenen
Signals berechnet und werden die Quadrate summiert, um die Tonleistung
an jeder Frequenzkomponente zu bestimmen. Die Gesamtleistungs-Bestimmungseinheit 18 bestimmt
die Gesamtleistung des von dem Mikrophon 100 aufgenommenen
Tons durch das Summieren der von der Leistungsberechnungseinheit 14 bestimmten
Leistungen an den Frequenzkomponenten.
-
Die
DFT-Berechnungseinheit 12 führt DFT auf einem von einer
Führungsstimmenquelle 200 eingegebenen
Führungsstimmensignal
aus, um den Signalpe gel an jeder Frequenzkomponente zu extrahieren.
Der Eingangstonprozessor weist ferner einen Analog-Digital-Wandler
vor der DFT-Berechnungseinheit 12, wie bei der DFT-Berechnungseinheit 10, für das Umwandeln
des von der Führungsstimmenquelle 200 ausgegebenen
Führungsstimmensignals in
digitale Daten auf, die dann in die DFT-Berechnungseinheit 12 eingegeben
werden. Die DFT-Berechnungseinheit 12 bestimmt die Signalpegel
an der gleichen Anzahl (z.B. 1024) von Frequenzkomponenten wie die
der von der DFT-Berechnungseinheit 10 behandelten Frequenzkomponenten.
Die Führungsstimmenquelle 200 ist
zum Beispiel eine Navigationsvorrichtung, die ein einer Führungsstimme entsprechendes
Signal, z.B. Kreuzungsführung
während
einer Streckenführung,
ausgibt. Diese Führungsstimme
wird von einem (nicht gezeigten) Lautsprecher in die Fahrzeugkabine
ausgegeben und erreicht das Mikrophon 100. Das Mikrophon 100 nimmt den
Ton auf, der die Führungsstimme
und verschiedene Typen von Umgebungsgeräusch, wie z.B. Audiotöne und Straßengeräusch, enthält.
-
Die
Leistungsberechnungseinheit 16 bestimmt die Leistung des
von der DFT-Berechnungseinheit 12 bestimmten
Signalpegels an jeder Frequenzkomponenten. Der adaptive Filter 20 identifiziert
die Transfercharakteristik in der Fahrzeugkabine von dem Lautsprecher,
von dem die Führungsstimme ausgegeben
wird, zu dem Mikrophon 100 auf der Basis der Ausgabesignale
der DFT-Berechnungseinheiten 10 und 12.
-
Wie
obenstehend beschrieben, hat die von der Führungsstimmenquelle 200 ausgegebene
Führungsstimme
einen ersten und einen zweiten Pfad. In dem ersten Pfad wird die
Führungsstimme über den akustischen
Raum der Fahrzeugkabine von dem Lautsprecher an das Mikrophon 100 ausgegeben und
wird das entsprechende Signal an die DFT-Berechnungseinheit 10 eingegeben.
In dem zweiten Pfad wird das Führungsstimmensignal
direkt in die DFT-Berechnungseinheit 12 eingegeben. Der
erste Pfad weist den akustischen Raum der Fahrzeugkabine auf und
der zweite Pfad weist den akustischen Raum der Fahrzeugkabine nicht
auf. Deshalb erlaubt eine auf der Basis der Ausgabesignale der DFT-Berechnungseinheiten 10 und 12 ausgeführte adaptive Entzerrung
das Abschätzen
der Transfercharakteristik in dem akustischen Raum der Fahrzeugkabine. Der
adaptive Filter 20 gibt die Transfercharakteristik in Form
eines Fil terkoeffizienten (Tab-Koeffizienten) aus, der jeder Frequenzkomponente
zugewiesen ist. Die Quadratamplituden-Berechnungseinheit 22 bestimmt
einen Quadratamplitudenwert durch das Berechnen des Quadrats sowohl
des echten Teils als auch des imaginären Teils jedes Filterkoeffizienten des
adaptiven Filters 20 und dann das Berechnen einer Summe
der Quadrate.
-
Die
Leistungsvergleichseinheit 26 empfängt die Leistung (P) an jeder
Frequenzkomponente der Führungsstimme
von der Leistungsberechnungseinheit 16 und empfängt auch
den Quadratamplitudenwert (C) des adaptiven Filters 20 an
jeder Frequenzkomponente von der Quadratamplituden-Berechnungseinheit 22.
Die Leistungsvergleichseinheit 26 vergleicht die Werte
P und C mit einem Referenzwert R. Bei der Ausführung einer Produkt-Summen-Operation
an einer Frequenzkomponente wird, wenn mindestens einer der Werte
P und C geringer als der Referenzwert R oder null ist, das Produkt
der Werte P und C klein. In diesem Fall beeinflusst solch ein geringer
Wert die Bestimmung der Gesamtleistung der Führungsstimme nicht, selbst
wenn eine Produkt-Summen-Operation nicht auf diesem Wert ausgeführt wird.
Die Leistungsvergleichseinheit 26 bestimmt, ob die Werte
P und C gleich oder geringer als der Referenzwert R sind oder nicht.
-
Allgemein
sind Stimmen, die eine Führungsstimme
enthalten, aus Vokalen und Konsonanten gebildet. Ein Vokal enthält Frequenzkomponenten
im Bereich von 100 Hz bis zu 1 kHz und ein Konsonant enthält Frequenzkomponenten
im Bereich von 1 kHz bis 8 kHz. Der Vokalfrequenzbereich und der
Konsonantenfrequenzbereich unterscheiden sich voneinander. Wenn
eine Führungsstimme
aus einem Vokal gebildet ist, ist der Signalpegel in dem Konsonantenfrequenzbereich
im Wesentlichen null und ist die durch den quadrierten Signalpegel
bestimmte Leistung deshalb im Wesentlichen null. Wenn eine Führungsstimme
aus einem Konsonanten gebildet ist, ist der Signalpegel in dem Vokalfrequenzbereich
im Wesentlichen null und ist die Leistung P deshalb im Wesentlichen
null.
-
In
Anbetracht der Transfercharakteristik in dem Raum der Fahrzeugkabine
sind, wenn der Signalpegel in einem bestimmten Frequenzband stark gedämpft wird,
z.B. wenn sich ein Ton mit einer bestimmten Frequenz nicht ausreichend ausbreitet, weil
er in Abhängigkeit
von der Form der Fahrzeugkabine oder dem Material der Sitze in der
Fahrzeugkabine absorbiert werden kann, der Wert des Filterkoeffizienten
des adaptiven Filters 20 an diesem Frequenzband und sein
Quadratamplitudenwert C im Wesentlichen Null. Folglich wird, wenn
mindestens einer der Werte P und C im Wesentlichen Null (gleich oder
geringer als der Referenzwert R) ist, keine Produkt-Summen-Operation
in diesem Frequenzband ausgeführt.
-
Auf
der Basis des Ergebnisses der Leistungsvergleichseinheit 26 stellt
die Multiplikationspunkt-Einsteileinheit 28 die Frequenzkomponenten bis
auf die Frequenzkomponenten, bei denen mindestens einer der Werte
P und C im Wesentlichen Null sind (gleich oder geringer als der
Referenzwert R), als Multiplikationspunkte ein, an denen eine Produkt-Summen-Operation
ausgeführt
werden soll.
-
Die
Produkt-Summen-Betriebseinheit 24 führt eine Produkt-Summen-Operation
aus. Das heißt,
die von der Leistungsberechnungseinheit 16 bestimmte Leistung
P an jeder Frequenzkomponente der Führungsstimme wird mit dem von
der Quadratamplituden-Berechnungseinheit 22 an derselben Frequenzkomponente
bestimmten Quadratamplitudenwert C jedes Filterkoeffizienten des
adaptiven Filters 20 multipliziert und eine Summe der Produkte wird
an den von der Multiplikationspunkt-Einstellungseinheit 28 eingestellten
Multiplikationspunkten berechnet. Folglich wird die Führungsstimme
an der Position des Mikrophons 100 unter Verwendung des adaptiven
Filters 20 geschätzt
und wird die Gesamtleistung der geschätzten Führungsstimme von der Produkt-Summen-Betriebseinheit 24 bestimmt.
-
Die
Addiereinrichtung 30 subtrahiert die von der Produkt-Summen-Betriebseinheit 24 ausgegebene
Gesamtleistung der geschätzten
Führungsstimme an
dem Mikrophon 100 von der von der Gesamtleistungs-Bestimmungseinheit 18 bestimmten
Gesamtleistung des von dem Mikrophon 100 aufgenommenen
Tons, der die Führungsstimme
und das Umgebungsgeräusch
enthält.
Folglich wird nur die Gesamtleistung des von dem Mikrophon 100 aufgenommenen
Umgebungsgeräuschs
von der Addiereinrichtung 30 ausgegeben.
-
Der
Referenzwert R wird so bestimmt, dass die von der Produkt-Summen-Betriebseinheit 24 ausgegebene
Gesamtleistung der geschätzten
Führungsstimme
einen Fehler hat, der geringer ist als ein vorherbestimmter Wert.
Zum Beispiel wird der Referenzwert R so bestimmt, dass der Fehler
gleich oder geringer ist als 5 dB, wenn die von der Leistungsberechnungseinheit 16 ausgegebene
Maximalleistung an jeder Frequenzkomponente der Führungsstimme oder
die von der Quadratamplituden-Berechnungseinheit 22 ausgegebene
Maximalquadratamplitude jedes Filterkoeffizienten des adaptiven
Filters 20 2M ist. Zum Beispiel erhält man,
wenn M = 16, R = 398.
-
Die
DFT-Berechnungseinheit 12 dient als eine erste Frequenzanalyseeinheit,
die Leistungsberechnungseinheit 16 dient als eine erste
Leistungsberechnungseinheit, die Quadratamplituden-Berechnungseinheit 22 dient
als eine Quadratamplituden-Berechnungseinheit, die Leistungsvergleichseinheit 26 dient
als eine Leistungsvergleichseinheit, die Multiplikationspunkt-Einstellungseinheit 28 dient als
eine Multiplikationspunkt-Einstellungseinheit, die Produkt-Summen-Betriebseinheit 24 dient
als eine Produkt-Summen-Betriebseinheit und die DFT-Berechnungseinheit 10 dient
als eine zweite Frequenzanalyseeinheit. Die DFT-Berechnungseinheit 10, die Leistungsberechnungseinheit 14 und
die Gesamtleistungs-Bestimmungseinheit 18 dienen als eine Gesamtleistungs-Bestimmungseinheit
und die Addiereinrichtung 30 dient als eine Subtraktionseinheit.
-
Dementsprechend
wird eine Produkt-Summen-Operation nicht an allen Frequenzkomponenten ausgeführt, sondern
nur an der Frequenzkomponente mit einem Effektivwert ausgeführt. Das
heißt,
eine Produkt-Summen-Operation soll nicht an der Frequenzkomponente
ausgeführt
werden, die im Wesentlichen keine Leistung hat. Deshalb wird der
Verarbeitungsaufwand reduziert und kann ein preisgünstiger
Prozessor verwendet werden, was zu Kostenersparnis führt.
-
In
Anbetracht der Transfercharakteristik in dem akustischen Raum von
dem Lautsprecher zu dem Mikrophon 100, insbesondere der
Transfercharakteristik in dem Raum der Fahrzeugkabine, kann ein
Ton mit einem bestimmten Frequenzband absorbiert werden und ist
die Quadratamplitude der Filtercharakteristik in diesem Frequenzband
sehr gering. Folglich hat das Produkt der Quadratamplitude und der
Leistung einen kleinen Wert. Eine Produkt-Summen- Operation wird in diesem Frequenzband
nicht ausgeführt,
wodurch der Verarbeitungsaufwand der Gesamt-Produkt-Summen-Operation
reduziert wird.
-
Der
Filterkoeffizient wird unter Verwendung des adaptiven Filters 20 bestimmt.
Folglich kann der Filterkoeffizient, der dem tatsächlichen
akustischen Raum entspricht, korrekt bestimmt werden.
-
Die
Addiereinrichtung 30 subtrahiert die Gesamtleistung der
Führungsstimme
an dem Mikrophon 100 von der Gesamtleistung des von dem
Mikrophon 100 ausgegebenen Signals, um die Gesamtleistung
des Umgebungsgeräuschs
zu bestimmen, das die Führungsstimme
nicht enthält.
Folglich kann die Verstärkung
der Führungsstimme
unter Verwendung von Lautstärkenkompensation
bestimmt werden, wodurch eine verständliche Führungsstimme in einer Fahrzeugkabine
mit einem relativ starken Umgebungsgeräusch geschaffen wird.
-
Zweite Ausführungsform
-
2 ist
ein Blockdiagramm eines Eingangstonprozessors gemäß einer
zweiten Ausführungsform
der vorliegenden Erfindung. Der in 2 gezeigte
Eingangstonprozessor weist ein Mikrophon 100, DFT-Berechnungseinheiten 10 und 12,
Leistungsberechnungseinheiten 14 und 16, eine
Gesamtleistungs-Bestimmungseinheit 18, einen adaptiven Filter 20,
eine Quadratamplituden-Berechnungseinheit 22, eine Produkt-Summen-Betriebseinheit 24, eine
Vokalbereichs-Leistungsberechnungseinheit 40, eine Konsonantenbereichs-Leistungsberechnungseinheit 42,
eine Bestimmungseinheit für
Konsonanten oder Vokal 44, eine Multiplikationspunkt-Einstellungseinheit 46 und
eine Addiereinrichtung 30 auf. Anstatt der Leistungsvergleichseinheit 26 und
der Multiplikationspunkt-Einstellungseinheit 28 des
in 1 gezeigten Eingangstonprozessors ist der in 2 gezeigte
Eingangstonprozessor mit der Vokalbereichs-Leistungsberechnungseinheit 40,
der Konsonantenbereichs-Leistungsberechnungseinheit 42,
der Bestimmungseinheit für
Konsonanten oder Vokal 44 und der Multiplikationspunkt-Einstellungseinheit 46 versehen.
-
Die
Vokalbereichs-Leistungsberechnungseinheit 40 bestimmt die
Leistung in dem Vokalfrequenzbereich (nachstehend als Vokalbereichsleistung
bezeichnet) durch das Summieren von Leistungen an in dem Vokalfrequenzbereich
enthaltenen Frequenzkomponenten. Die Konsonantenbereichs-Leistungsberechnungseinheit 42 bestimmt
die Leistung an dem Konsonantenfrequenzbereich (nachstehend als
Konsonantenbereichsleistung bezeichnet) durch das Summieren von
Leistungen in in dem Konsonantenfrequenzbereich enthaltenen Frequenzkomponenten.
Die Vokalbereichsleistung und die Konsonantenbereichsleistung können nicht
in allen der entsprechenden Frequenzbereiche bestimmt werden. Die
Vokalbereichsleistung kann durch das Summieren von Leistungen in
einem Teil des Vokalfrequenzbereichs bestimmt werden und die Konsonantenbereichsleistung
kann durch das Summieren von Leistungen in einem Teil des Konsonantenfrequenzbereichs
bestimmt werden.
-
Die
Bestimmungseinheit für
Konsonanten oder Vokal 44 vergleicht die von der Vokalbereichs-Leistungsberechnungseinheit 40 bestimmte Vokalbereichsleistung
mit der von der Konsonantenbereichs-Leistungsberechnungseinheit 42 bestimmten
Konsonantenbereichsleistung, um zu bestimmen, ob die von der Führungsstimmenquelle 200 eingegebene
Führungsstimme
aus einem Vokal oder einem Konsonanten gebildet ist. Wie oben beschrieben,
ist die Führungsstimme
ausschließlich
aus einem Vokal oder einem Konsonanten gebildet und kann durch das
Vergleichen der Vokalbereichsleistung mit der Konsonantenbereichsleistung
leicht bestimmt werden, ob die Führungsstimme
zum gegenwärtigen Zeitpunkt
aus einem Vokal oder einem Konsonanten gebildet ist.
-
Wenn
die Bestimmungseinheit für
Konsonanten oder Vokal 44 bestimmt, dass die Führungsstimme
aus einem Vokal gebildet ist, stellt die Multiplikationspunkt-Einstellungseinheit 46 die
in dem Vokalfrequenzbereich enthaltenen Frequenzkomponenten als
Multiplikationspunkte ein, an denen eine Produkt-Summen-Operation
ausgeführt
werden soll. Wenn die Bestimmungseinheit für Konsonanten oder Vokal 44 bestimmt,
dass die Führungsstimme
aus einem Konsonanten gebildet ist, stellt die Multiplikationspunkt-Einstellungseinheit 46 die
in dem Konsonantenfrequenzbereich enthaltenen Frequenzkomponenten
als Multiplikationspunkte ein, an denen eine Produkt-Summen-Operation
ausgeführt
werden soll.
-
Die
Produkt-Summen-Betriebseinheit 24 führt eine Produkt-Summen-Operation aus.
Das heißt,
die von der Leistungsberechnungseinheit 16 bestimmte Leistung
an jeder Frequenzkomponente der Führungsstimme wird mit der von
der Quadratamplituden-Berechnungseinheit 22 bestimmten Quadratamplitude
jedes Filterkoeffizienten des adaptiven Filters 20 an der
gleichen Frequenzkomponente multipliziert und eine Summe der Produkte
wird an den von der Multiplikationspunkt-Einstellungseinheit 46 eingestellten
Multiplikationspunkten berechnet. Folglich wird die Führungsstimme
an der Position des Mikrophons 100 unter Verwendung des
adaptiven Filters 20 geschätzt und wird die Gesamtleistung
der geschätzten
Führungsstimme
von der Produkt-Summen-Betriebseinheit 24 bestimmt.
-
Die
Multiplikationspunkt-Einstellungseinheit 46 dient als eine
Multiplikationspunkt-Einstellungseinheit, die Bestimmungseinheit
für Konsonanten oder
Vokal 44 dient als eine Bestimmungseinheit für Konsonanten
oder Vokal, die Vokalbereichs-Leistungsberechnungseinheit 40 dient
als eine Vokalbereichs-Leistungsberechnungseinheit und die Konsonantenbereichs-Leistungsberechnungseinheit 42 dient
als eine Konsonantenbereichs-Leistungsberechnungseinheit.
-
Die
Führungsstimme
hat große
Schwankungen in den Werten von Frequenzkomponenten abhängig davon,
ob es sich um einen Konsonanten oder einen Vokal handelt. Genauer
haben, wenn die Führungsstimme
aus einem Konsonanten gebildet ist, die konsonantenspezifischen
Frequenzkomponenten Werte, während
die anderen Frequenzkomponenten einen Wert von im Wesentlichen Null
haben. Wenn die Führungsstimme
aus einem Vokal gebildet ist, haben die vokalspezifischen Frequenzkomponenten
Werte, während
die anderen Frequenzkomponenten einen Wert von im Wesentlichen Null haben.
Durch das Bestimmen, ob die Führungsstimme
aus einem Vokal oder einem Konsonanten gebildet ist, kann eine Frequenzkomponente,
die im Wesentlichen keine Leistung hat, identifiziert werden und
kann eine Produkt-Summen-Operation an dieser Frequenzkomponente
weggelassen werden. Deshalb kann der Verarbeitungsaufwand reduziert
werden und kann ein preisgünstiger
Prozessor verwendet werden, was zu Kostenersparnis führt.
-
Die
vorliegende Erfindung ist nicht auf die erläuternden Ausführungsformen
beschränkt
und eine Vielfalt von Modifikationen kann gemacht werden, ohne von
dem Umfang der vorliegenden Erfindung abzuweichen, der nur durch
die anhängenden
Ansprüche
beschränkt
ist. Während
in den erläuterten Ausführungsformen
die Leistung einer von der Führungsstimmenquelle 200 ausgegebenen
Führungsstimme
geschätzt
wird, kann die Gesamtleistung jedes anderen Tons an der Mikrophonposition
geschätzt
werden. Die vorliegende Erfindung kann auf das Abschätzen von
Tonleistung für
eine von einem Radioempfänger
oder Ähnlichem
ausgegebene Ausstrahlung angewendet werden.
-
In
der ersten Ausführungsform
kann eine Audiovorrichtung statt der Führungsstimmenquelle 200 verwendet
werden und kann die Gesamtleistung von dem Audioton oder Ähnlichem
an dem Mikrophon 100 geschätzt werden.
-
In
den erläuterten
Ausführungsformen
werden die DFT-Berechnungseinheiten 10 und 12 verwendet,
um ein Eingangssignal in Frequenzkomponenten aufzuteilen. Alternativ
kann jedes andere Verfahren, wie z.B. ein Filterbankverfahren, verwendet werden,
um ein Eingangssignal in Frequenzkomponenten aufzuteilen.