DE602005000897T2

DE602005000897T2 - Eingangsschallprozessor

Info

Publication number: DE602005000897T2
Application number: DE602005000897T
Authority: DE
Inventors: Shingo Kiuchi
Original assignee: Alpine Electronics Inc
Current assignee: Alpine Electronics Inc
Priority date: 2004-03-08
Filing date: 2005-03-03
Publication date: 2008-01-17
Anticipated expiration: 2025-03-04
Also published as: CN1667702A; DE602005000897D1; JP2005252904A; CN100370516C; EP1575034B1; EP1575034A1; JP4235128B2; US20050195992A1; US7542577B2

Description

HINTERGRUND DER ERFINDUNG
1. Gebiet der Erfindung
Die vorliegende Erfindung bezieht sich auf einen Eingangstonprozessor zum Bestimmen der Tonleistung an einem bestimmten Punkt, insbesondere auf einen Eingangstonprozessor zum Abschätzen der Leistung einer Führungsstimme an einem Mikrophon.
2. Beschreibung der in Verbindung stehenden Technik
Ein typischer Navigationsstimmenkorrektor für die Verwendung in einem Navigationssystem ändert den Tondruckpegel einer Führungsstimme in Abhängigkeit von dem Umgebungsgeräuschpegel, um eine verständliche Führungsstimme sogar in lauten Umgebungen zu schaffen (siehe zum Beispiel die japanische ungeprüfte Patentanmeldung mit der Veröffentlichungsnummer 11-166835 (Seiten 3 bis 6, 1 bis 10)). In diesem Navigationsstimmenkorrektor korrigiert eine auf Lautstärkenkompensation basierende Verstärkungsbestimmungseinheit die Verstärkung einer von einem Lautsprecher ausgegebenen Führungsstimme auf der Basis der Tondruckpegel von Umgebungsgeräusch und der Führungsstimme an der Position eines Mikrophons, von der angenommen wird, dass sie ein Hörpunkt der Führungsstimme ist. Der Tondruckpegel des Umgebungsgeräuschs und der Führungsstimme, die in die auf Lautstärkenkompensation basierende Verstärkungsbestimmungseinheit eingegeben werden, werden durch die Gesamttonleistung dargestellt, die durch das Summieren der Leistungen an allen einer Mehrzahl von Frequenzkomponenten bestimmt wird.
Die Führungsstimme und das Umgebungsgeräusch erreichen das Mikrophon tatsächlich gleichzeitig und es ist nicht möglich, nur die Führungsstimme aus dem von dem Mikrophon aufgenommenen Ton zu extrahieren.
Eine typische Technik für das Extrahieren einer Führungsstimme ist das Abschätzen der Führungsstimme an dem Mikrophon auf der Basis der Transfercharakteristik von dem Lautsprecher zu dem Mikrophon und des in den Lautsprecher eingegebenen Führungsstimmensignals. Die Gesamtleistung der Führungsstimme am Mikrophon wird durch das getrennte Bestimmen der Leistung an jeder Frequenzkomponente der Führungsstimme und einer Quadratamplitude der Transfercharakteristik an jeder Frequenzkomponente und das Ausführen einer Produkt-Summen-Operation an jeder Frequenzkomponente (siehe zum Beispiel die japanische ungeprüfte Patentanmeldung mit der Veröffentlichungsnummer 2002–23790 (Seiten 3 bis 4, 1 bis 2)) bestimmt.
Letztere Veröffentlichung offenbart, dass die an jeder Frequenzkomponente einer eingegebenen Stimme bestimmte Leistung mit der Quadratamplitude jedes Abgriff-Koeffizienten multipliziert wird, der die Transfercharakteristik anzeigt, und dann eine Summe der Produkte berechnet wird. Es ist deshalb notwendig, eine Produkt-Summen-Operation an allen Frequenzkomponenten auszuführen, was zu einem großen Verarbeitungsaufwand führt. Es ist deshalb ein Hochleistungsprozessor erforderlich, was kostenaufwendig ist.
ZUSAMMENFASSUNG DER ERFINDUNG
Dementsprechend ist es eine Aufgabe der vorliegenden Erfindung, einen kostengünstigen Eingangstonprozessor mit einem kleinen Verarbeitungsaufwand zu schaffen.
In einem Aspekt der vorliegenden Erfindung weist ein Eingangstonprozessor zum Abschätzen der Gesamtleistung eines von einem Lautsprecher ausgegebenen Eingangstons an einem Mikrophon eine erste Frequenzanalyseeinheit, die ein in den Lautsprecher eingegebenes Eingangstonsignal in eine Mehrzahl von Frequenzkomponenten aufteilt, eine erste Leistungsberechnungseinheit, die Leistung an jeder der von der ersten Frequenzanalyseeinheit aufgeteilten Frequenzkomponenten bestimmt, eine Quadratamplituden-Berechnungseinheit, die eine Quadratamplitude eines Filterkoeffizienten an jeder der Frequenzkomponenten bestimmt, wobei der Filterkoeffizient eine Filtercharakteristik ent sprechend einer Transfercharakteristik in einem akustischen Raum von dem Lautsprecher zu dem Mikrophon ist, eine Leistungsvergleichseinheit, die die von der ersten Leistungsberechnungseinheit bestimmte Leistung an jeder der Frequenzkomponenten mit einem Referenzwert vergleicht, eine Multiplikationspunkt-Einstellungseinheit, die Multiplikationspunkte, die Frequenzkomponenten anzeigen, an denen die Gesamtleistung des Eingangstons zu bestimmen ist, auf der Basis eines Vergleichsergebnisses der Leistungsvergleichseinheit einstellt, und eine Produkt-Summen-Betriebseinheit, die eine Produkt-Summen-Operation an den von der Multiplikationspunkt-Einstellungseinheit eingestellten Multiplikationspunkten unter Verwendung der von der ersten Leistungsberechnungseinheit bestimmten Leistung an jeder der Frequenzkomponenten und der von der Quadratamplituden-Berechnungseinheit bestimmten Quadratamplitude des Filterkoeffizienten an jeder der Frequenzkomponenten durchführt. Folglich wird eine Produkt-Summen-Operation nicht an einer Frequenzkomponente ausgeführt, die im Wesentlichen keine Leistung hat. Deshalb kann der Verarbeitungsaufwand reduziert werden und kann ein preisgünstiger Prozessor verwendet werden, was zu Kostenersparnissen führt.
Vorzugsweise stellt die Multiplikationspunkt-Einstellungseinheit Frequenzkomponenten bis auf jene mit einer Leistung, die gleich oder geringer ist als der Referenzwert, als die Multiplikationspunkte ein. Dies stellt sicher, dass eine Frequenzkomponente mit einem kleinen Produkt aus der Leistung und der Quadratamplitude jedes Filterkoeffizienten, die die Gesamt-Produkt-Summen-Operation folglich nicht beeinflusst, extrahiert werden kann.
Vorzugsweise vergleicht die Leistungsvergleichseinheit die von der ersten Leistungsberechnungseinheit bestimmte Leistung an jeder der Frequenzkomponenten mit dem Referenzwert und vergleicht die Quadratamplitude des Filterkoeffizienten mit dem Referenzwert. Vorzugsweise stellt die Multiplikationspunkt-Einstellungseinheit Frequenzkomponenten bis auf jene, bei denen mindestens die Leistung oder die Quadratamplitude gleich oder geringer ist als der Referenzwert, als die Multiplikationspunkte ein. In Anbetracht der Transfercharakteristik in dem akustischen Raum von dem Lautsprecher zu dem Mikrophon, insbesondere der Transfercharakteristik in dem Raum einer Fahrzeugkabine, kann ein Ton mit einem bestimmten Frequenzband absorbiert werden und ist die Quadratamplitude der Filtercharakteristik an diesem Frequenzband sehr gering. Folglich hat das Produkt der Quadratamplitude und der Leistung einen kleinen Wert. Eine Produkt-Summen-Operation wird in diesem Frequenzband nicht ausgeführt, wodurch der Verarbeitungsaufwand der Gesamt-Produkt-Summen-Operation reduziert wird.
In einem anderen Aspekt der vorliegenden Erfindung ist ein Eingangstonprozessor für das Abschätzen der Gesamtleistung eines von einem Lautsprecher ausgegebenen Eingangstons an einem Mikrophon nach Anspruch 4 vorgesehen.
Wenn der Eingangston eine Stimme ist, hat die Stimme große Schwankungen in den Werten von Frequenzkomponenten abhängig davon, ob es sich um einen Konsonanten oder einen Vokal handelt. Genauer haben, wenn die Stimme aus einem Konsonanten gebildet ist, die konsonantenspezifischen Frequenzkomponenten Werte, während die anderen Frequenzkomponenten einen Wert von im Wesentlichen Null haben. Wenn die Stimme aus einem Vokal gebildet ist, haben die vokalspezifischen Frequenzkomponenten Werte, während die anderen Frequenzkomponenten einen Wert von im Wesentlichen Null haben. Durch das Bestimmen, ob der Eingangston aus einem Vokal oder einem Konsonanten gebildet ist, kann eine Frequenzkomponente, die im Wesentlichen keine Leistung hat, identifiziert werden und kann eine Produkt-Summen-Operation an dieser Frequenzkomponente weggelassen werden. Deshalb kann der Verarbeitungsaufwand reduziert werden und kann ein preisgünstiger Prozessor verwendet werden, was zu Kostenersparnis führt.
Vorzugsweise vergleicht die Bestimmungseinrichtung für Konsonanten oder Vokal die Leistung in einem Vokalfrequenzbereich mit der Leistung in einem Konsonantenfrequenzbereich, um zu bestimmen, ob der Eingangston einen Konsonanten oder einen Vokal aufweist. Es kann deshalb leicht bestimmt werden, ob der Eingangston aus einem Konsonanten oder einem Vokal gebildet ist.
Vorzugsweise ist der Vokalfrequenzbereich 100 Hz bis 1 kHz und ist der Konsonantenfrequenzbereich 1 kHz bis 8 kHz. Da der Vokalfrequenzbereich und der Konsonantenfrequenzbereich einander nicht überlappen, kann die Konsonanten-oder-Vokal-Bestimmung leichter ausgeführt werden.
Vorzugsweise weist der Eingangstonprozessor ferner eine Konsonantenbereichsieistungs-Bestimmungseinheit auf, die die Leistung in dem Konsonantenfrequenzbereich durch das Summieren der von der ersten Leistungsberechnungseinheit bestimmten Leistungen an Frequenzkomponenten bestimmt, wobei die Frequenzkomponenten in dem Konsonantenfrequenzbereich enthalten sind, und eine Vokalbereichsleistungs-Bestimmungseinheit, die die Leistung in dem Vokalfrequenzbereich durch das Summieren der von der ersten Leistungsberechnungseinheit bestimmten Leistungen an Frequenzkomponenten bestimmt, wobei die Frequenzkomponenten in dem Vokalfrequenzbereich enthalten sind, auf. Folglich können die Leistung in dem Konsonantenfrequenzbereich und die Leistung in dem Vokalfrequenzbereich leicht bestimmt werden.
Vorzugsweise weist der Eingangtonprozessor ferner einen adaptiven Filter auf, der den Filterkoeffizienten bestimmt. Vorzugsweise weist der Eingangstonprozessor ferner eine zweite Frequenzanalyseeinheit auf, die ein von dem Mikrophon ausgegebenes Signal in eine Mehrzahl von Frequenzkomponenten aufteilt, wobei der adaptive Filter den Filterkoeffizienten an jeder der von der ersten Frequenzanalyseeinheit erhaltenen Frequenzkomponenten und durch die von der zweiten Frequenzanalyseeinheit erhaltenen Frequenzkomponenten bestimmt. Folglich kann der Filterkoeffizient, der dem tatsächlichen akustischen Raum entspricht, korrekt bestimmt werden.
Vorzugsweise nimmt das Mikrophon Ton auf, der den von dem Lautsprecher ausgegebenen Eingangston und Umgebungsgeräusch enthält. Wenn Umgebungsgeräusch an der Mikrophonposition vorhanden ist, kann die Gesamtleistung des Eingangstons ohne Auswirkungen des Umgebungsgeräuschs bestimmt werden.
Vorzugsweise weist der Eingangstonprozessor ferner eine Gesamtleistungs-Bestimmungseinheit, die die Gesamtleistung des von dem Mikrophon aufgenommenen Tons bestimmt, und eine Subtraktionseinheit, die die von der Produkt-Summen-Betriebseinheit unter Verwendung der Produkt-Summen-Operation bestimmte Gesamtleistung an dem Eingangston am Mikrophon von der von der Gesamtleistungs-Bestimmungseinheit bestimmten Gesamtleistung subtrahiert, um die Gesamtleistung des Umgebungsgeräusches zu bestimmen. Folglich kann nicht nur die Gesamtleistung eines Eingangstons an der Mikrophonposition, sondern auch die Gesamtleistung des Umgebungsgeräuschs, das den Eingangston nicht enthält, bestimmt werden.
Der Eingangston ist vorzugsweise eine von einer sich in einem Fahrzeug befindlichen Vorrichtung ausgegebene Führungsstimme. Die Gesamtleistung der von der sich in einem Fahrzeug befindlichen Vorrichtung ausgegebenen Führungsstimme kann bestimmt werden, wodurch eine Verstärkungssteuerung der Führungsstimme in einer Fahrzeugkabine mit relativ hohem Umgebungsgeräusch ermöglicht wird.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
1 ist ein Blockdiagramm eines Eingangstonprozessors gemäß einer ersten Ausführungsform der vorliegenden Erfindung; und
2 ist ein Blockdiagramm eines Eingangstonprozessors gemäß einer zweiten Ausführungsform der vorliegenden Erfindung.
BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
Ein Eingangstonprozessor gemäß Ausführungsformen der vorliegenden Erfindung wird jetzt mit Bezug auf die Zeichnungen beschrieben.
Erste Ausführungsform
1 ist ein Blockdiagramm eines Eingangstonprozessors gemäß einer ersten Ausführungsform der vorliegenden Erfindung. Der in 1 gezeigte Eingangstonprozessor, der in einem Fahrzeug installiert ist, schätzt die Leistung einer Führungsstimme an der Position eines Mikrophons 100 und extrahiert andere Umgebungsgeräusche außer der Führungsstimme aus dem von dem Mikro phon 100 aufgenommenem Ton, um die Leistung des Geräuschs zu bestimmen.
Der Eingangstonprozessor gemäß der ersten Ausführungsform weist das Mikrophon 100, Diskrete-Fourier-Transformations(DFT)-Berechnungseinheiten 10 und 12, Leistungsberechnungseinheiten 14 und 16, eine Gesamtleistungs-Bestimmungseinheit 18, einen adaptiven Filter 20, eine Quadratamplituden-Berechnungseinheit 22, eine Produkt-Summen-Betriebseinheit 24, eine Leistungsvergleichseinheit 26, eine Multiplikationspunkt-Einstellungseinheit 28 und eine Addiereinrichtung 30 auf.
Die DFT-Berechnungseinheit 10 führt DFT auf einem von dem Mikrophon 100 ausgegeben Signal aus, um den Signalpegel an jeder Frequenzkomponente zu extrahieren. Der Eingangstonprozessor weist ferner einen Analog-Digital-Wandler vor der DFT-Berechnungseinheit 10 für das Umwandeln des Ausgabesignals von dem Mikrophon 100 in digitale Daten auf und die digitalen Daten werden in die DFT-Berechnungseinheit 10 eingegeben. Zum Beispiel bestimmt die DFT-Berechnungseinheit 10 die Signalpegel an 1024 Punkten, in die die akustische Frequenzbandbreite aufgeteilt ist. Das Mikrophon 100 befindet sich in einer vorherbestimmten Position in der Fahrzeugkabine, von der angenommen wird, dass sie der Hörpunkt eines Benutzers ist, z.B. ein gewisser Punkt auf dem Lenkrad.
Die Leistungsberechnungseinheit 14 bestimmt die Leistung des Signalpegels an jeder von der DFT-Berechnungseinheit 10 bestimmten Frequenzkomponente. Genauer wird das Quadrat sowohl des echten Teils als auch des imaginären Teils des von der DFT-Berechnungseinheit 10 ausgegebenen Signals berechnet und werden die Quadrate summiert, um die Tonleistung an jeder Frequenzkomponente zu bestimmen. Die Gesamtleistungs-Bestimmungseinheit 18 bestimmt die Gesamtleistung des von dem Mikrophon 100 aufgenommenen Tons durch das Summieren der von der Leistungsberechnungseinheit 14 bestimmten Leistungen an den Frequenzkomponenten.
Die DFT-Berechnungseinheit 12 führt DFT auf einem von einer Führungsstimmenquelle 200 eingegebenen Führungsstimmensignal aus, um den Signalpe gel an jeder Frequenzkomponente zu extrahieren. Der Eingangstonprozessor weist ferner einen Analog-Digital-Wandler vor der DFT-Berechnungseinheit 12, wie bei der DFT-Berechnungseinheit 10, für das Umwandeln des von der Führungsstimmenquelle 200 ausgegebenen Führungsstimmensignals in digitale Daten auf, die dann in die DFT-Berechnungseinheit 12 eingegeben werden. Die DFT-Berechnungseinheit 12 bestimmt die Signalpegel an der gleichen Anzahl (z.B. 1024) von Frequenzkomponenten wie die der von der DFT-Berechnungseinheit 10 behandelten Frequenzkomponenten. Die Führungsstimmenquelle 200 ist zum Beispiel eine Navigationsvorrichtung, die ein einer Führungsstimme entsprechendes Signal, z.B. Kreuzungsführung während einer Streckenführung, ausgibt. Diese Führungsstimme wird von einem (nicht gezeigten) Lautsprecher in die Fahrzeugkabine ausgegeben und erreicht das Mikrophon 100. Das Mikrophon 100 nimmt den Ton auf, der die Führungsstimme und verschiedene Typen von Umgebungsgeräusch, wie z.B. Audiotöne und Straßengeräusch, enthält.
Die Leistungsberechnungseinheit 16 bestimmt die Leistung des von der DFT-Berechnungseinheit 12 bestimmten Signalpegels an jeder Frequenzkomponenten. Der adaptive Filter 20 identifiziert die Transfercharakteristik in der Fahrzeugkabine von dem Lautsprecher, von dem die Führungsstimme ausgegeben wird, zu dem Mikrophon 100 auf der Basis der Ausgabesignale der DFT-Berechnungseinheiten 10 und 12.
Wie obenstehend beschrieben, hat die von der Führungsstimmenquelle 200 ausgegebene Führungsstimme einen ersten und einen zweiten Pfad. In dem ersten Pfad wird die Führungsstimme über den akustischen Raum der Fahrzeugkabine von dem Lautsprecher an das Mikrophon 100 ausgegeben und wird das entsprechende Signal an die DFT-Berechnungseinheit 10 eingegeben. In dem zweiten Pfad wird das Führungsstimmensignal direkt in die DFT-Berechnungseinheit 12 eingegeben. Der erste Pfad weist den akustischen Raum der Fahrzeugkabine auf und der zweite Pfad weist den akustischen Raum der Fahrzeugkabine nicht auf. Deshalb erlaubt eine auf der Basis der Ausgabesignale der DFT-Berechnungseinheiten 10 und 12 ausgeführte adaptive Entzerrung das Abschätzen der Transfercharakteristik in dem akustischen Raum der Fahrzeugkabine. Der adaptive Filter 20 gibt die Transfercharakteristik in Form eines Fil terkoeffizienten (Tab-Koeffizienten) aus, der jeder Frequenzkomponente zugewiesen ist. Die Quadratamplituden-Berechnungseinheit 22 bestimmt einen Quadratamplitudenwert durch das Berechnen des Quadrats sowohl des echten Teils als auch des imaginären Teils jedes Filterkoeffizienten des adaptiven Filters 20 und dann das Berechnen einer Summe der Quadrate.
Die Leistungsvergleichseinheit 26 empfängt die Leistung (P) an jeder Frequenzkomponente der Führungsstimme von der Leistungsberechnungseinheit 16 und empfängt auch den Quadratamplitudenwert (C) des adaptiven Filters 20 an jeder Frequenzkomponente von der Quadratamplituden-Berechnungseinheit 22. Die Leistungsvergleichseinheit 26 vergleicht die Werte P und C mit einem Referenzwert R. Bei der Ausführung einer Produkt-Summen-Operation an einer Frequenzkomponente wird, wenn mindestens einer der Werte P und C geringer als der Referenzwert R oder null ist, das Produkt der Werte P und C klein. In diesem Fall beeinflusst solch ein geringer Wert die Bestimmung der Gesamtleistung der Führungsstimme nicht, selbst wenn eine Produkt-Summen-Operation nicht auf diesem Wert ausgeführt wird. Die Leistungsvergleichseinheit 26 bestimmt, ob die Werte P und C gleich oder geringer als der Referenzwert R sind oder nicht.
Allgemein sind Stimmen, die eine Führungsstimme enthalten, aus Vokalen und Konsonanten gebildet. Ein Vokal enthält Frequenzkomponenten im Bereich von 100 Hz bis zu 1 kHz und ein Konsonant enthält Frequenzkomponenten im Bereich von 1 kHz bis 8 kHz. Der Vokalfrequenzbereich und der Konsonantenfrequenzbereich unterscheiden sich voneinander. Wenn eine Führungsstimme aus einem Vokal gebildet ist, ist der Signalpegel in dem Konsonantenfrequenzbereich im Wesentlichen null und ist die durch den quadrierten Signalpegel bestimmte Leistung deshalb im Wesentlichen null. Wenn eine Führungsstimme aus einem Konsonanten gebildet ist, ist der Signalpegel in dem Vokalfrequenzbereich im Wesentlichen null und ist die Leistung P deshalb im Wesentlichen null.
In Anbetracht der Transfercharakteristik in dem Raum der Fahrzeugkabine sind, wenn der Signalpegel in einem bestimmten Frequenzband stark gedämpft wird, z.B. wenn sich ein Ton mit einer bestimmten Frequenz nicht ausreichend ausbreitet, weil er in Abhängigkeit von der Form der Fahrzeugkabine oder dem Material der Sitze in der Fahrzeugkabine absorbiert werden kann, der Wert des Filterkoeffizienten des adaptiven Filters 20 an diesem Frequenzband und sein Quadratamplitudenwert C im Wesentlichen Null. Folglich wird, wenn mindestens einer der Werte P und C im Wesentlichen Null (gleich oder geringer als der Referenzwert R) ist, keine Produkt-Summen-Operation in diesem Frequenzband ausgeführt.
Auf der Basis des Ergebnisses der Leistungsvergleichseinheit 26 stellt die Multiplikationspunkt-Einsteileinheit 28 die Frequenzkomponenten bis auf die Frequenzkomponenten, bei denen mindestens einer der Werte P und C im Wesentlichen Null sind (gleich oder geringer als der Referenzwert R), als Multiplikationspunkte ein, an denen eine Produkt-Summen-Operation ausgeführt werden soll.
Die Produkt-Summen-Betriebseinheit 24 führt eine Produkt-Summen-Operation aus. Das heißt, die von der Leistungsberechnungseinheit 16 bestimmte Leistung P an jeder Frequenzkomponente der Führungsstimme wird mit dem von der Quadratamplituden-Berechnungseinheit 22 an derselben Frequenzkomponente bestimmten Quadratamplitudenwert C jedes Filterkoeffizienten des adaptiven Filters 20 multipliziert und eine Summe der Produkte wird an den von der Multiplikationspunkt-Einstellungseinheit 28 eingestellten Multiplikationspunkten berechnet. Folglich wird die Führungsstimme an der Position des Mikrophons 100 unter Verwendung des adaptiven Filters 20 geschätzt und wird die Gesamtleistung der geschätzten Führungsstimme von der Produkt-Summen-Betriebseinheit 24 bestimmt.
Die Addiereinrichtung 30 subtrahiert die von der Produkt-Summen-Betriebseinheit 24 ausgegebene Gesamtleistung der geschätzten Führungsstimme an dem Mikrophon 100 von der von der Gesamtleistungs-Bestimmungseinheit 18 bestimmten Gesamtleistung des von dem Mikrophon 100 aufgenommenen Tons, der die Führungsstimme und das Umgebungsgeräusch enthält. Folglich wird nur die Gesamtleistung des von dem Mikrophon 100 aufgenommenen Umgebungsgeräuschs von der Addiereinrichtung 30 ausgegeben.
Der Referenzwert R wird so bestimmt, dass die von der Produkt-Summen-Betriebseinheit 24 ausgegebene Gesamtleistung der geschätzten Führungsstimme einen Fehler hat, der geringer ist als ein vorherbestimmter Wert. Zum Beispiel wird der Referenzwert R so bestimmt, dass der Fehler gleich oder geringer ist als 5 dB, wenn die von der Leistungsberechnungseinheit 16 ausgegebene Maximalleistung an jeder Frequenzkomponente der Führungsstimme oder die von der Quadratamplituden-Berechnungseinheit 22 ausgegebene Maximalquadratamplitude jedes Filterkoeffizienten des adaptiven Filters 20 2^M ist. Zum Beispiel erhält man, wenn M = 16, R = 398.
Die DFT-Berechnungseinheit 12 dient als eine erste Frequenzanalyseeinheit, die Leistungsberechnungseinheit 16 dient als eine erste Leistungsberechnungseinheit, die Quadratamplituden-Berechnungseinheit 22 dient als eine Quadratamplituden-Berechnungseinheit, die Leistungsvergleichseinheit 26 dient als eine Leistungsvergleichseinheit, die Multiplikationspunkt-Einstellungseinheit 28 dient als eine Multiplikationspunkt-Einstellungseinheit, die Produkt-Summen-Betriebseinheit 24 dient als eine Produkt-Summen-Betriebseinheit und die DFT-Berechnungseinheit 10 dient als eine zweite Frequenzanalyseeinheit. Die DFT-Berechnungseinheit 10, die Leistungsberechnungseinheit 14 und die Gesamtleistungs-Bestimmungseinheit 18 dienen als eine Gesamtleistungs-Bestimmungseinheit und die Addiereinrichtung 30 dient als eine Subtraktionseinheit.
Dementsprechend wird eine Produkt-Summen-Operation nicht an allen Frequenzkomponenten ausgeführt, sondern nur an der Frequenzkomponente mit einem Effektivwert ausgeführt. Das heißt, eine Produkt-Summen-Operation soll nicht an der Frequenzkomponente ausgeführt werden, die im Wesentlichen keine Leistung hat. Deshalb wird der Verarbeitungsaufwand reduziert und kann ein preisgünstiger Prozessor verwendet werden, was zu Kostenersparnis führt.
In Anbetracht der Transfercharakteristik in dem akustischen Raum von dem Lautsprecher zu dem Mikrophon 100, insbesondere der Transfercharakteristik in dem Raum der Fahrzeugkabine, kann ein Ton mit einem bestimmten Frequenzband absorbiert werden und ist die Quadratamplitude der Filtercharakteristik in diesem Frequenzband sehr gering. Folglich hat das Produkt der Quadratamplitude und der Leistung einen kleinen Wert. Eine Produkt-Summen- Operation wird in diesem Frequenzband nicht ausgeführt, wodurch der Verarbeitungsaufwand der Gesamt-Produkt-Summen-Operation reduziert wird.
Der Filterkoeffizient wird unter Verwendung des adaptiven Filters 20 bestimmt. Folglich kann der Filterkoeffizient, der dem tatsächlichen akustischen Raum entspricht, korrekt bestimmt werden.
Die Addiereinrichtung 30 subtrahiert die Gesamtleistung der Führungsstimme an dem Mikrophon 100 von der Gesamtleistung des von dem Mikrophon 100 ausgegebenen Signals, um die Gesamtleistung des Umgebungsgeräuschs zu bestimmen, das die Führungsstimme nicht enthält. Folglich kann die Verstärkung der Führungsstimme unter Verwendung von Lautstärkenkompensation bestimmt werden, wodurch eine verständliche Führungsstimme in einer Fahrzeugkabine mit einem relativ starken Umgebungsgeräusch geschaffen wird.
Zweite Ausführungsform
2 ist ein Blockdiagramm eines Eingangstonprozessors gemäß einer zweiten Ausführungsform der vorliegenden Erfindung. Der in 2 gezeigte Eingangstonprozessor weist ein Mikrophon 100, DFT-Berechnungseinheiten 10 und 12, Leistungsberechnungseinheiten 14 und 16, eine Gesamtleistungs-Bestimmungseinheit 18, einen adaptiven Filter 20, eine Quadratamplituden-Berechnungseinheit 22, eine Produkt-Summen-Betriebseinheit 24, eine Vokalbereichs-Leistungsberechnungseinheit 40, eine Konsonantenbereichs-Leistungsberechnungseinheit 42, eine Bestimmungseinheit für Konsonanten oder Vokal 44, eine Multiplikationspunkt-Einstellungseinheit 46 und eine Addiereinrichtung 30 auf. Anstatt der Leistungsvergleichseinheit 26 und der Multiplikationspunkt-Einstellungseinheit 28 des in 1 gezeigten Eingangstonprozessors ist der in 2 gezeigte Eingangstonprozessor mit der Vokalbereichs-Leistungsberechnungseinheit 40, der Konsonantenbereichs-Leistungsberechnungseinheit 42, der Bestimmungseinheit für Konsonanten oder Vokal 44 und der Multiplikationspunkt-Einstellungseinheit 46 versehen.
Die Vokalbereichs-Leistungsberechnungseinheit 40 bestimmt die Leistung in dem Vokalfrequenzbereich (nachstehend als Vokalbereichsleistung bezeichnet) durch das Summieren von Leistungen an in dem Vokalfrequenzbereich enthaltenen Frequenzkomponenten. Die Konsonantenbereichs-Leistungsberechnungseinheit 42 bestimmt die Leistung an dem Konsonantenfrequenzbereich (nachstehend als Konsonantenbereichsleistung bezeichnet) durch das Summieren von Leistungen in in dem Konsonantenfrequenzbereich enthaltenen Frequenzkomponenten. Die Vokalbereichsleistung und die Konsonantenbereichsleistung können nicht in allen der entsprechenden Frequenzbereiche bestimmt werden. Die Vokalbereichsleistung kann durch das Summieren von Leistungen in einem Teil des Vokalfrequenzbereichs bestimmt werden und die Konsonantenbereichsleistung kann durch das Summieren von Leistungen in einem Teil des Konsonantenfrequenzbereichs bestimmt werden.
Die Bestimmungseinheit für Konsonanten oder Vokal 44 vergleicht die von der Vokalbereichs-Leistungsberechnungseinheit 40 bestimmte Vokalbereichsleistung mit der von der Konsonantenbereichs-Leistungsberechnungseinheit 42 bestimmten Konsonantenbereichsleistung, um zu bestimmen, ob die von der Führungsstimmenquelle 200 eingegebene Führungsstimme aus einem Vokal oder einem Konsonanten gebildet ist. Wie oben beschrieben, ist die Führungsstimme ausschließlich aus einem Vokal oder einem Konsonanten gebildet und kann durch das Vergleichen der Vokalbereichsleistung mit der Konsonantenbereichsleistung leicht bestimmt werden, ob die Führungsstimme zum gegenwärtigen Zeitpunkt aus einem Vokal oder einem Konsonanten gebildet ist.
Wenn die Bestimmungseinheit für Konsonanten oder Vokal 44 bestimmt, dass die Führungsstimme aus einem Vokal gebildet ist, stellt die Multiplikationspunkt-Einstellungseinheit 46 die in dem Vokalfrequenzbereich enthaltenen Frequenzkomponenten als Multiplikationspunkte ein, an denen eine Produkt-Summen-Operation ausgeführt werden soll. Wenn die Bestimmungseinheit für Konsonanten oder Vokal 44 bestimmt, dass die Führungsstimme aus einem Konsonanten gebildet ist, stellt die Multiplikationspunkt-Einstellungseinheit 46 die in dem Konsonantenfrequenzbereich enthaltenen Frequenzkomponenten als Multiplikationspunkte ein, an denen eine Produkt-Summen-Operation ausgeführt werden soll.
Die Produkt-Summen-Betriebseinheit 24 führt eine Produkt-Summen-Operation aus. Das heißt, die von der Leistungsberechnungseinheit 16 bestimmte Leistung an jeder Frequenzkomponente der Führungsstimme wird mit der von der Quadratamplituden-Berechnungseinheit 22 bestimmten Quadratamplitude jedes Filterkoeffizienten des adaptiven Filters 20 an der gleichen Frequenzkomponente multipliziert und eine Summe der Produkte wird an den von der Multiplikationspunkt-Einstellungseinheit 46 eingestellten Multiplikationspunkten berechnet. Folglich wird die Führungsstimme an der Position des Mikrophons 100 unter Verwendung des adaptiven Filters 20 geschätzt und wird die Gesamtleistung der geschätzten Führungsstimme von der Produkt-Summen-Betriebseinheit 24 bestimmt.
Die Multiplikationspunkt-Einstellungseinheit 46 dient als eine Multiplikationspunkt-Einstellungseinheit, die Bestimmungseinheit für Konsonanten oder Vokal 44 dient als eine Bestimmungseinheit für Konsonanten oder Vokal, die Vokalbereichs-Leistungsberechnungseinheit 40 dient als eine Vokalbereichs-Leistungsberechnungseinheit und die Konsonantenbereichs-Leistungsberechnungseinheit 42 dient als eine Konsonantenbereichs-Leistungsberechnungseinheit.
Die Führungsstimme hat große Schwankungen in den Werten von Frequenzkomponenten abhängig davon, ob es sich um einen Konsonanten oder einen Vokal handelt. Genauer haben, wenn die Führungsstimme aus einem Konsonanten gebildet ist, die konsonantenspezifischen Frequenzkomponenten Werte, während die anderen Frequenzkomponenten einen Wert von im Wesentlichen Null haben. Wenn die Führungsstimme aus einem Vokal gebildet ist, haben die vokalspezifischen Frequenzkomponenten Werte, während die anderen Frequenzkomponenten einen Wert von im Wesentlichen Null haben. Durch das Bestimmen, ob die Führungsstimme aus einem Vokal oder einem Konsonanten gebildet ist, kann eine Frequenzkomponente, die im Wesentlichen keine Leistung hat, identifiziert werden und kann eine Produkt-Summen-Operation an dieser Frequenzkomponente weggelassen werden. Deshalb kann der Verarbeitungsaufwand reduziert werden und kann ein preisgünstiger Prozessor verwendet werden, was zu Kostenersparnis führt.
Die vorliegende Erfindung ist nicht auf die erläuternden Ausführungsformen beschränkt und eine Vielfalt von Modifikationen kann gemacht werden, ohne von dem Umfang der vorliegenden Erfindung abzuweichen, der nur durch die anhängenden Ansprüche beschränkt ist. Während in den erläuterten Ausführungsformen die Leistung einer von der Führungsstimmenquelle 200 ausgegebenen Führungsstimme geschätzt wird, kann die Gesamtleistung jedes anderen Tons an der Mikrophonposition geschätzt werden. Die vorliegende Erfindung kann auf das Abschätzen von Tonleistung für eine von einem Radioempfänger oder Ähnlichem ausgegebene Ausstrahlung angewendet werden.
In der ersten Ausführungsform kann eine Audiovorrichtung statt der Führungsstimmenquelle 200 verwendet werden und kann die Gesamtleistung von dem Audioton oder Ähnlichem an dem Mikrophon 100 geschätzt werden.
In den erläuterten Ausführungsformen werden die DFT-Berechnungseinheiten 10 und 12 verwendet, um ein Eingangssignal in Frequenzkomponenten aufzuteilen. Alternativ kann jedes andere Verfahren, wie z.B. ein Filterbankverfahren, verwendet werden, um ein Eingangssignal in Frequenzkomponenten aufzuteilen.

Claims

Eingangstonprozessor zur Abschätzung einer Gesamtleistung eines Eingangstons, der von einem Lautsprecher ausgegeben wird, an einem Mikrophon (100), umfassend: eine erste Frequenzanalyseeinrichtung (12) zur Aufteilung eines Eingangstonsignals, das in den Lautsprecher eingegeben wird, in eine Mehrzahl von Frequenzkomponenten; eine erste Leistungsberechnungseinrichtung (16) zur Bestimmung von Leistung an jeder der Frequenzkomponenten, die durch die erste Frequenzanalyseeinrichtung aufgeteilt werden; eine Quadratamplituden-Berechnungseinrichtung (22) zur Bestimmung einer Quadratamplitude eines Filterkoeffizienten an jeder der Frequenzkomponenten, wobei der Filterkoeffizient eine Filtercharakteristik entsprechend einer Transfercharakteristik eines akustischen Raums von dem Lautsprecher zu dem Mikrophon aufweist; eine Leistungsvergleichseinrichtung (26) zum Vergleich der Leistung an jeder der Frequenzkomponenten, die durch die erste Leistungsberechnungseinrichtung bestimmt wurde, mit einem Referenzwert; eine Multiplikationspunkt-Einstellungseinrichtung (28) zur Einstellung von Multiplikationspunkten, die Frequenzkomponenten anzeigen, an welchen die gesamte Leistung des Eingangstons zu bestimmen ist, basierend auf einem Vergleichsergebnis der Leistungsvergleichseinrichtung; und eine Produkt-Summen-Betriebseinrichtung (24) zur Durchführung einer Produkt-Summen-Operation an den Multiplikationspunkten, die durch die Multiplikationspunkt-Einstellungseinrichtung eingestellt werden, unter Verwendung der Leistung an jeder der Frequenzkomponenten, die durch die erste Leistungsberechnungseinrichtung bestimmt wird, und der Quadratamplitude des Filterkoeffizienten an jeder der Frequenzkomponenten, die durch die Quadratamplituden-Berechnungseinrichtung bestimmt wird.
Eingangstonprozessor nach Anspruch 1, wobei die Multiplikationspunkt-Einstellungseinrichtung Frequenzkomponenten bis auf jene mit einer Leistung, die gleich oder geringer als der Referenzwert ist, als die Multiplikationspunkte einstellt.
Eingangstonprozessor nach Anspruch 1, wobei die Leistungsvergleichseinrichtung die Leistung an jeder der Frequenzkomponenten, bestimmt durch die erste Leistungsberechnungseinrichtung, mit dem Referenzwert vergleicht, und die Quadratamplitude des Filterkoeffizienten mit dem Referenzwert vergleicht, und die Multiplikationspunkt-Einstellungseinrichtung Frequenzkomponenten bis auf jene als die Multiplikationspunkte einstellt, bei denen wenigstens die Leistung oder die Quadratamplitude gleich oder geringer ist als der Referenzwert.
Eingangstonprozessor zur Abschätzung einer Gesamtleistung eines Eingangstons, der von einem Lautsprecher ausgegeben wird, an einem Mikrophon (100), umfassend: eine erste Frequenzanalyseeinrichtung (12) zur Aufteilung eines Eingangstonsignals, das in den Lautsprecher eingegeben wird, in eine Mehrzahl von Frequenzkomponenten; eine erste Leistungsberechungseinrichtung (16) zur Bestimmung von Leistung an jeder der Frequenzkomponenten, die durch die erste Frequenzanalyseeinrichtung aufgeteilt werden; eine Quadratamplituden-Berechnungseinrichtung (22) zur Bestimmung einer Quadratamplitude eines Filterkoeffizienten an jeder der Frequenzkomponenten, wobei der Filterkoeffizient eine Filtercharakteristik entsprechend einer Transfercharakteristik eines akustischen Raums von dem Lautsprecher zu dem Mikrophon aufweist; eine Bestimmungseinrichtung für Konsonanten oder Vokal (44) zur Bestimmung, ob der Eingangston einen Konsonanten oder einen Vokal aufweist; eine Multiplikationspunkt-Einstellungseinrichtung (46) zur Einstellung von Multiplikationspunkten, die Frequenzkomponenten anzeigen, an welchen die Gesamtleistung des Eingangstons zu bestimmen ist, basierend auf ei nem Bestimmungsergebnis der Bestimmungseinrichtung für Konsonanten oder Vokal; und eine Produkt-Summen-Betriebseinrichtung (24) zur Durchführung einer Produkt-Summen-Operation an den Multiplikationspunkten, die durch die Multiplikationspunkt-Einstellungseinrichtung eingestellt werden, unter Verwendung der Leistung an jeder der Frequenzkomponenten, die durch die erste Leistungsberechnungseinrichtung bestimmt wird, und der Quadratamplitude des Filterkoeffizienten an jeder der Frequenzkomponenten, die durch die Quadratamplituden-Berechnungseinrichtung bestimmt wird.
Eingangstonprozessor nach Anspruch 4, wobei die Bestimmungseinrichtung für Konsonanten oder Vokal Leistung an einem Vokalfrequenzbereich mit Leistung an einem Konsonantenfrequenzbereich vergleicht, um zu bestimmen, ob der Eingangston einen Konsonanten oder einen Vokal aufweist.
Eingangstonprozessor nach Anspruch 5, wobei der Vokalfrequenzbereich 100 Hz bis 1 kHz ist, und der Konsonantenfrequenzbereich 1 kHz bis 8 kHz ist.
Eingangstonprozessor nach Anspruch 5 oder 6, weiterhin umfassend: eine Konsonantenbereichs-Leistungsbestimmungseinrichtung (42) zur Bestimmung der Leistung an dem Konsonantenfrequenzbereich durch Summierung von Leistungen an Frequenzkomponenten, die durch die erste Leistungsberechnungseinrichtung bestimmt werden, wobei die Frequenzkomponenten in dem Konsonantenfrequenzbereich enthalten sind; und eine Vokalbereichs-Leistungsbestimmungseinrichtung (40) zur Bestimmung der Leistung an dem Vokalfrequenzbereich durch Summierung von Leistungen an Frequenzkomponenten, die durch die erste Leistungsberechnungseinrichtung bestimmt werden, wobei die Frequenzkomponenten in dem Vokalfrequenzbereich enthalten sind.
Eingangstonprozessor nach einem der Ansprüche 1 bis 7, weiterhin aufweisend einen adaptiven Filter (20), welcher den Filterkoeffizienten bestimmt.
Eingangstonprozessor nach Anspruch 8, weiterhin aufweisend eine zweite Frequenzanalyseeinrichtung (10) zur Aufteilung eines Signals, das von dem Mikrophon ausgegeben wird, in eine Mehrzahl von Frequenzkomponenten; wobei der adaptive Filter den Filterkoeffizienten an jeder der Frequenzkomponenten bestimmt, die von der ersten Frequenzanalyseeinrichtung erhalten werden, und an den Frequenzkomponenten, die von der zweiten Frequenzanalyseeinrichtung erhalten werden.
Eingangstonprozessor nach Anspruch 9, wobei das Mikrophon Ton aufnimmt, der den Eingangston, der von dem Lautsprecher ausgegeben wird, und Umgebungsgeräusch enthält.
Eingangstonprozessor nach Anspruch 10, weiterhin umfassend: eine Gesamtleistungs-Bestimmungseinrichtung (10, 14, 18) zur Bestimmung einer Gesamtleistung des Tons, der durch das Mikrophon aufgenommen wird; und eine Subtraktionseinrichtung (30) zur Subtraktion der Gesamttonleistung des Eingangstons an dem Mikrophon, bestimmt durch die Produkt-Summen-Betriebseinrichtung unter Verwendung der Produkt-Summen-Operation, von der gesamten Leistung, bestimmt durch die Gesamtleistungs-Bestimmungseinrichtung, um eine gesamte Leistung des Umgebungsgeräusches zu bestimmen.
Eingangstonprozessor nach einem der Ansprüche 1 bis 11, wobei der Eingangston eine Führungsstimme aufweist, die von einer in einem Fahrzeug befindlichen Vorrichtung ausgegeben wird.