DE69131095T2 - Verständlichkeitsverbesserungsanordnung für eine Beschallungsanlage - Google Patents

Verständlichkeitsverbesserungsanordnung für eine Beschallungsanlage

Info

Publication number
DE69131095T2
DE69131095T2 DE69131095T DE69131095T DE69131095T2 DE 69131095 T2 DE69131095 T2 DE 69131095T2 DE 69131095 T DE69131095 T DE 69131095T DE 69131095 T DE69131095 T DE 69131095T DE 69131095 T2 DE69131095 T2 DE 69131095T2
Authority
DE
Germany
Prior art keywords
signal
channels
output
amplifiers
gain control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69131095T
Other languages
English (en)
Other versions
DE69131095D1 (de
Inventor
Arnold I. Klayman
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DTS LLC
Original Assignee
SRS Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SRS Labs Inc filed Critical SRS Labs Inc
Application granted granted Critical
Publication of DE69131095D1 publication Critical patent/DE69131095D1/de
Publication of DE69131095T2 publication Critical patent/DE69131095T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)

Description

    HINTERGRUND DER ERFINDUNG 1. Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft mündliche Kommunikation und insbesondere betrifft sie die Verständlichkeit der menschlichen Sprache bei hohem Umgebungslärm.
  • 2. Beschreibung des betreffenden Standes der Technik
  • Beschallungssysteme werden in großen Arealen eingesetzt, um Ankündigungen zu machen oder andernfalls mit einer großen Personengruppe an dem gleichen allgemeinen Platz mündlich zu kommunizieren. Häufig ist das Areal, in denen die Zuhörer sind, einem sehr großen Hintergrundlärm bzw. Hintergrundgeräusch ausgesetzt, häufig mit einem solchen Pegel, daß die Verständlichkeit der gewünschten gesprochenen Kommunikation von dem Beschallungs-Lautsprechersystem stark herabgesetzt ist. Es gibt eine Vielzahl von derartigen Umgebungen, wo Kommunikation verloren oder zumindest teilweise verloren geht, weil ein großer Umgebungslärmpegel die Stimme der ankündigenden Person maskiert oder verzerrt, wenn sie vom Zuhörer aufgenommen wird. Diese Umgebungen umfassen Flughäfen, U-Bahnen, Bus- und Zug-Bahnhöfe, Flugzeuge und Züge, Flugzeugträger, Landungsboote, Hubschrauber, Hafeneinrichtungen und andere lärmbeaufschlagte Plätze. Keiner, der versucht hat, die öffentliche Ankündigung der Ankunft oder der Abfahrt bzw. des Abflugs eines Flugzeugs oder eines Zugs zu verstehen, kommt umhin, die Schwierigkeiten beim Herausziehen nützlicher Information bei einem solchen vorhandenen Hintergrundlärm festzustellen.
  • Versuche, den Verlust an Verständlichkeit bei einem vorhandenen hohen Hintergrundlärm zu minimieren, haben den Einsatz von Equalizern, Begrenzungsschaltungen oder eine einfache Erhöhung der Lautstärke der öffentlichen Ankündigung umfaßt. Equalizer und Begrenzungsschaltungen können ihrerseits den Hintergrundlärm erhöhen und die Lösung des Problems verfehlen. Eine Erhöhung des Gesamtpegels des Tons oder der Lautstärke des Beschallungssystems verbessert nicht wesentlich die Verständlichkeit und führt häufig zu anderen Problemen, wie Rückkopplung oder Unbehagen bei den Zuhörern.
  • Trotz der weit verbreiteten und lang bestehenden Kenntnis dieses Problems gab es keine Lösung. Tatsächlich gibt es kein früher bekanntes Verfahren zur signifikanten Verbesserung der Verständlichkeit öffentlicher Kommunikation, wie bspw. öffentlichen Anspracheankündigungen und ähnlichem, die durch hohe Umgebungsgeräuschbedingungen überdeckt ist.
  • Entsprechend ist es eine Aufgabe der vorliegenden Erfindung, eine verbesserte Verständlichkeit der Sprachkommunikation zu erreichen, die andernfalls durch Hintergrundlärm verschlechtert würde.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • In der vorliegenden Erfindung, wie sie in den Ansprüchen nachfolgend angegeben ist, werden stimmhafte Formanten selektiv verstärkt und kombiniert, um ein Stimmsignal verbesserter Verständlichkeit zu schaffen. Ein selektives Anheben der Formanten sowohl stimmhafter Töne als auch stimmloser Töne, zusammen mit dem selektiven Gewichten und Kombinieren der angehobenen Formanten, um ein kombiniertes Ausgangssignal zu erhalten, liefern ein Stimmsignal stark erhöhter Verständlichkeit, selbst in Gegenwart eines sehr hohen Umgebungsgeräusches.
  • Die Verarbeitung von geräusch- bzw. lärmgestörter Sprache ist bekannt. Siehe bspw. US-A-3 180 936 und "Evaluation of a technique involving processing ... noise-corrupted speech" von R. J. Conway et al., IECON 1990, Seiten 28-33. Allerdings betreffen die letzten zwei Dokumente die elektrische Verarbeitung eines Stimmsignals, nachdem die Sprache durch Lärm verfälscht bzw. verschlechtert wurde. Im Gegensatz dazu wird in der vorliegenden Erfindung das Stimmsignal verarbeitet (vergrößert bzw. angehoben), bevor es in eine geräuschbehaftete Umgebung gebracht wird.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • In den begleitenden Zeichnungen:
  • Fig. 1 ist ein vereinfachtes Blockdiagramm, das die Verbindung eines Stimmprozessors in einem typischen Lautsprecher oder einem Aufnahmesystem darstellt;
  • Fig. 2 ist ein Diagramm, das bestimmte typische Formanten darstellt, die in der menschlichen Sprache vorhanden sind;
  • Fig. 3 ist ein Blockdiagramm eines Verarbeitungssystems zur Erhöhung der Sprachverständlichkeit;
  • Fig. 4 ist ein Blockdiagramm einer modifizierten Form des Verarbeitungssystems zur Sprachverständlichkeitsverbesserung;
  • Fig. 5 ist ein Blockdiagramm eines Spektrumanalysators, der in dem System von Fig. 4 nützlich ist; und
  • Fig. 6 stellt einen typischen spannungsgesteuerten Verstärker zur Verwendung in dem Verarbeitungssystem von Fig. 4 dar.
  • BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORM
  • Fig. 1 zeigt in einer sehr vereinfachten Form die Basiskomponenten eines öffentlichen Beschallungssystems mit einer Stimmverständlichkeitsverarbeitung. Eine Stimmquelle 10, die ein Live-Mikrofon oder ein Aufnahmen-Abspielgerät sein kann, wie bspw. einem Kassetten-, einem Disk-Abspielgerät oder ähnlichem, die eine aufgenommene gesprochene Ankündigung enthalten, liefert ein elektronisches Stimmsignal an ein Verstärkungssystem 12, das ein Ausgangssignal auf einer Leitung 10 liefert, die bisher direkt einem Lautsprechersystem, allgemein mit 16 gekennzeichnet, zugeführt wurde. Das Lautsprechersystem 16 umfaßt üblicherweise eine Anzahl von Lautsprechern, die in verschiedenen Positionen um ein Areal bzw. ein Gebiet plaziert sind, in dem eine Beschallung gehört werden soll. Wie zuvor erwähnt, besitzt ein solches Areal üblicherweise einen großen Hintergrundlärm, der die Verständlichkeit Beschallung signifikant verschlechtert. Große Sorgfalt und besondere Aufmerksamkeit werden von dem Zuhörer verlangt, der alle Worte in einer öffentlichen Ansprache bzw. Ankündigung in einem Flughafenterminal, einem Bahnhof oder einer ähnlichen mit großem Hintergrundlärm behafteten Umgebung verstehen will. Selbst dann kann es an einem vollständigen Erkennen des gesamten Inhalts der An kündigung mangeln, und in einigen Fällen bleibt die Beschallung beinahe vollständig unverständlich.
  • Erfindungsgemäß ist zwischen dem Systemverstärker 12 und dem Lautsprechersystem 16 ein Stimmverarbeitungssystem 18 eingebracht, das dafür sorgt, daß der Klang der Stimme, der von dem Lautsprechersystem 16 abgegeben wird, eine stark verbesserte Verständlichkeit selbst in der Gegenwart eines sehr hohen Hintergrundlärms und ohne eine signifikante Erhöhung des Schallpegels aufweist, der von den Lautsprechern 16 produziert wird. Das System von Fig. 1 mit der alleinigen Substitution einer Aufnahmeeinrichtung für die Einrichtung, die als Lautsprechersystem 16 gezeigt ist, kann verwendet werden, um Aufnahmen mit verbesserter Verständlichkeit zu machen, entweder um in einer lärmbehafteten Umgebung abgespielt zu werden, oder um anfänglich in einer lärmbehafteten Umgebung gesprochene Stimmen aufzunehmen. Solche Systeme werden nachfolgend detaillierter beschrieben.
  • Der Stimmprozessor 18 ist ein aktives selbstanpassendes System, das einen Vorteil aus der Art und Weise zieht, wie menschliche Sprache erzeugt, gehört und durch das individuelle menschliche Ohr und das Gehirn verarbeitet wird. Kurz gesagt, identifiziert das Verarbeitungssystem 18 Stimmformanten von Vokalen, Konsonanten, Reiblauten und Verschlußlauten, verstärkt selektiv und gewichtet sie, und kombiniert sie, um ein Stimmsignal von stark verbesserter Verständlichkeit zu liefern.
  • Eine kurz Beschreibung der Mechanismen der Spracherzeugung und des Verstehens der Sprache wird dabei helfen, den Betrieb bzw. die Funktionsweise der vorliegenden Erfindung zu verste hen. Menschliche Sprache wird durch das Generieren von Lauten bzw. Tönen in dem Stimmsystem erzeugt, das dafür sorgt, daß diese Töne mit unterschiedlichen Frequenzen schwingen. Vokale werden durch einen Luftstrom erzeugt, der aus den Lungen ausgeworfen wird und eine Vibration der menschlichen Stimmfalten, allgemein als Stimmbänder bekannt, verursacht. Der durch Vibration der Stimmbänder erzeugte Ton setzt sich aus einer Grundfrequenz oder einem Basisband und vielen harmonischen Teiltönen oder Übertönen mit aufeinanderfolgenden höheren Frequenzen zusammen. Amplituden der Harmonischen vermindern sich mit zunehmender Frequenz mit einer Rate von etwa 12 Decibel pro Oktave. Das Basisband oder die Grundfrequenz und deren Obertöne passieren das Stimmsystem, das verschiedene Höhlen innerhalb des Rachens, des Kopfs und des Mundes umfaßt, die eine Vielzahl von individuellen Resonanzen liefern. Das Stimmsystem besitzt eine Vielzahl von charakteristischen Resonanzmodi und in gewissem Umfang handelt es sich um eine Vielzahl von Resonatoren, die mit dem Basisband oder der Grundfrequenz und deren Obertönen arbeiten. Aufgrund des selektiven Resonanzmechanismus des Stimmsystems sinken die Amplituden der verschiedenen Teiltöne der Grundfrequenz der Stimmbänder nicht in einer Kurve mit zunehmender Frequenz, sondern zeigen scharfe Spitzen bei Frequenzen, die den bestimmten Resonanzen des Stimmsystems entsprechen. Diese Spitzen oder Resonanzen werden als "Formanten" bezeichnet.
  • Fig. 2 zeigt ein Diagramm eines stimmhaften Tons (bspw. eines Vokals), wobei die Amplitude über der Frequenz einer Anzahl von Harmonischen aufgetragen ist. An der linken Seite des Diagramms an der untersten Frequenz liegt die Grundfrequenz oder das Basisband, das durch Vibration der Stimmbänder erzeugt wird. Diese Basisbandfrequenz liegt zwischen 60 und 250 Hertz für eine typische Erwachsenenmännerstimme. Die vielen Harmonischen der Grundfrequenz sind durch individuelle Komponenten gekennzeichnet, wie bspw. 22a, 22b, 22c etc. Es zeigt sich, daß das gesamte Stimmsignal aus einem Basisband und einer großen Anzahl von individuellen Harmonischen über das gesamte Frequenzband aufgebaut ist. Das interessierende Frequenzband in den Stimmsignalen liegt allgemein zwischen 60 und etwa 7500 Hertz. Fig. 2 zeigt an, daß die individuellen Harmonischen, die Amplituden besitzen, die naturgemäß mit zunehmender Frequenz sinken, bezüglich ihrer Amplitude nicht in einer glatten Kurve abnehmen, sondern vielmehr gewisse Spitzen zeigen, wie jene, die mit 26, 28 und 30 gekennzeichnet sind. Diese Spitzen stellen die individuellen Resonanzen des Stimmsystems dar und sind · zum Zwecke der Darstellung in einer Anzahl von drei gezeigt, obwohl es bis zu vier, fünf oder mehr in einem gewöhnlichen menschlichen Stimmsystem geben kann. Diese Spitzen, oder Stimmsystemresonanzen sind die Formanten der gesprochenen Stimme. Bei einem männlichen Erwachsenen sind die ersten vier (untere Frequenz) Formanten nahe bei 500, 1500, 2500 bzw. 3500 Hertz. Eine Bewegung der verschiedenen Artikulationsorgane (einschließlich des Kiefers, des Zungenkörpers, der Zungenspitze) verändert die Frequenz der verschiedenen Formanten über einen breiten Bereich. Unterschiedliche Formantfrequenzen haben unterschiedliche Empfindlichkeiten auf Form und Position der individuellen Artikulationsorgane. Es ist eine ausgewählte Bewegung dieser Organe, die jeder menschliche Sprecher verwendet, um einen ausgewählten Vokal auszusprechen. Umgekehrt kann jeder Vokal anhand seiner einzigartigen Anzahl an Formanten erkannt werden, wenn gesprochene Wörter gehört werden.
  • Die zuvor ausgeführte Diskussion mit Bezug auf stimmhafte Töne und die Formanten von Fig. 2 ist in gleicher Weise anwendbar für stimmlose Töne, die ebenfalls durch Resonanzhöhlen des Stimmsystems verursachte Formanten besitzen. Stimmhafte Töne sind jene, die durch Vibration der Stimmbänder in dem Luftstrom verursacht werden, der durch die Lungen erzeugt wurde, und die Vokale des gesprochenen Wortes umfassen. Stimmlose Töne sind jene, die durch das Stimmsystem bei fehlender Vibration der Stimmbänder erzeugt werden. Stimmlose Töne umfassen Konsonanten, Verschlußlaute und Reiblaute. Diese Töne sind jene, die durch die Tätigkeit der Zunge, der Zähne und des Munds erzeugt werden, die das Auslassen von Luft aus den Lungen steuern, aber ohne eine Vibration der Stimmbänder. Diese umfassen Töne verschiedener Konsonanten. Stimmlose Töne umfassen Töne der gesprochenen Worte, die die Buchstaben m, n, l, z, g (wie in frigid), DG (wie in judge), etc. beinhalten. Diese Verschlußlaute, Reibelaute und Konsonanten, obgleich die Stimmbandvibration nicht beteiligt ist, haben nichtsdestotrotz charakteristische Frequenzen, allgemein höher als die Grundfrequenz der Stimmbandvibration, und sehr häufig im Bereich von 2000 bis 3000 Hertz. Unabhängig davon, ob der in dem Stimmsystem erzeugte Ton durch Vibration der Stimmbänder (stimmhafte Töne) erzeugt ist oder ohne Vibration der Stimmbänder (Konsonanten, Verschlußlaute und Reibelaute) erzeugt ist, dienen die Stimmsystemresonanzen dazu, Formanten zu erzeugen, die Resonanzspitzen in unterschiedlichen der Harmonischen der erzeugten Grundfrequenz sind.
  • Es wurde herausgefunden, daß die Formanten in der menschlichen Sprache einen großen Beitrag zur Verständlichkeit der Sprache bei dem Zuhörer liefern. Das heißt, daß der menschliche Zuhörer spezifische Vokale oder Konsonanten, Verschlußlaute oder Reibelaute durch das besondere Muster dieser Formanten erkennen wird. Dies ist das Muster relativer Frequenzen der verschiedenen Formanten. Das Formantmuster kann auf den Grundfrequenzen höherer oder niederer Tonhöhe, wie bspw. der höheren Tonlage der Stimme einer Frau oder eines Kindes, oder der niederen Tonlage der Stimme eines Manns, basieren. Nichtsdestotrotz liefert das Muster der Formanten, die relative Frequenzen der Resonanzspitzen, dem Zuhörer die Natur des gesprochenen Tons. Eine Diskussion der Akustik der menschlichen Stimme findet sich in dem Artikel mit dem Titel "The Acoustics of the Singing Voice" von J. Sunberg, in Readings from Scientific American, The Physics of Music, mit einer Einführung von C. Hutchins, veröffentlicht durch W. H. Freeman and Company im Jahre 1948.
  • Die Verständlichkeit eines Tons für das menschliche Ohr ist zum Teil beschrieben in dem "Handbook for Sound Engineers - The New Audio Cyclopedia", herausgegeben von Glen Ballou, veröffentlicht von Howard W. Sams and Company im Jahre 1987. Seite 162 dieses Handbuchs enthält eine Beschreibung über die Erkenntnis, daß unterschiedliche Frequenzen, die in der gesprochenen Stimme enthalten sind, in unterschiedlichem Maße zu der Verständlichkeit des gesprochenen Worts beitragen. Somit tragen Mittelbandfrequenzen im Bereich von 1,5 bis 3,5 Kilohertz zu einem stärkeren Prozentsatz zu der Verständlichkeit bei. Wenn bspw. der Frequenzbereich von etwa 250 Hertz bis 5 Kilohertz und darüber in Oktaven aufgebrochen wird, trägt die bei 250 Hertz zentrierte Oktave 7,2% zu der Verständlichkeit der gesprochenen Stimme bei, die von einem menschlichen Zuhörer gehört wird, die bei 500 Hertz zentrierte Oktave trägt 14,4% bei, und die bei 1 Kilohertz zentrierte Oktave trägt 22,2% bei. Die bei 2 Kilohertz zentrierte Oktave trägt mit einem Maximum von 32,8% bei, und die bei 4 Kilohertz zentrierte Oktave trägt 23,4% bei.
  • Die vorliegende Erfindung benutzt das Wissen über die Art und Weise, wie Sprache erzeugt wird und wie die verschiedenen stimmhaften und stimmlosen Töne gebildet werden, und verwendet auch eine einzigartige Gewichtung selektiv verstärkter Sprachformanten, um ein Gesamtsprachsignal zu liefern, das eine Verständlichkeit aufweist, die stark verbessert ist, selbst in der Gegenwart von großem Hintergrundlärm. Im wesentlichen wird entsprechend den hier offenbarten Ausführungsformen die Stimmverständlichkeit durch die selektive Verstärkung der Sprachformanten und durch Kombinieren der hervorgehobenen Formanten verbessert.
  • In Fig. 3 ist ein Blockdiagramm einer Ausführungsform der vorliegenden Erfindung dargestellt. Ein elektrisches Eingangssignal auf einer Leitung 40, das von einem Mikrofon oder einem Aufzeichnungsabspielmedium oder einer ähnlichen Tonquelle erhalten werden kann, wird einem Spektrumanalysator 42 zugeführt, der das eingehende Signal in eine Vielzahl von, bspw. 30, unterschiedlichen Frequenzkomponenten aufbricht, die auf getrennten Ausgangsleitungen oder Frequenzkanälen erscheinen, die mit 44 und 46 bezeichnet sind. Es versteht sich, daß die Leitungen 44 und 46 dreißig unterschiedliche Ausgangsleitungen, jeweils in einem unterschiedlichen schmalen Frequenzband, vom Ausgang des Spektrumanalysators repräsentieren. Die Verarbeitung des Signals in jedem individuellen Frequenzkanal ist identisch zu der Verarbeitung des Signals in jedem der anderen Kanäle in dieser Anordnung, so daß eine Beschreibung der Verarbeitung des Signals im Kanal 44 des Ausgangssignals des Spektrumanalysators ausreichen wird, um die Verarbeitung in jedem der anderen Kanäle zu beschreiben. Das Signal in Kanal 44 wird dem Signaleingang eines spannungsgesteuerten Verstärkers (VCA) 50 zugeführt, der einen Signaleingang auf Leitung 52 und einen Verstärkungssteuerungseingang auf Leitung 54 besitzt. Das Verstärkungssteuerungs-Eingangssignal auf Leitung 54 wird von der Eingangsleitung 52 über einen einstellbaren Widerstand 56 erhalten. Die Gruppe der 30 Kanäle 44 bis 46 und deren spannungsgesteuerten Verstärker 50 bis 58 haben Ausgangssignale auf den Leitungen 60 und 62 (durch 30 individuelle Leitungen dargestellt), die in einem Summiernetzwerk 64 kombiniert werden. Kanäle 44 bis 46 behandeln stimmhafte Signale oder Vokaltöne.
  • Die Ausgangssignale des Spektrumanalysators in den gleichen 30 Kanälen werden Konsonanten- und Reiblaut-Kanälen 70 bis 72 zugeführt, wobei es sich wiederum versteht, daß es 30 oder mehr dieser Kanäle in 1/3-Oktaven-Schritten beabstandet zueinander geben kann, wobei jeder außer der Frequenz gleich zu den anderen ist. Bei den Konsonanten- und Reiblaut-Kanälen kann jedoch eine geringere Anzahl, bspw. fünf bis zehn Kanäle, adäquat sein. Die Konsonanten- und Reiblaut-Kanäle 70 bis 72 sind ähnlich den Vokal- (stimmhaften) Kanälen 44 bis 46, und jeder umfaßt einen spannungsgesteuerten Verstärker, wie Verstärker 64 für Kanal 70, der das Signal in Kanal 70 als sein Eingangssignal bekannt und ein spannungsgesteuertes Eingangssignal 76 aufweist, das aus dessen Eingang über einen einstellbaren Widerstand 78 geliefert wird. So umfaßt der Kanal 72 auch einen spannungsgesteuerten Verstärker 80, der einen Steuerungseingang von seinem Eingangssignal über einen einstellbaren Widerstand 80 hat. Wie mit den stimmhaften Kanälen werden die Ausgangs signale der Konsonanten- und Reiblaut-Kanäle in einer Kombinationsschaltung 84 kombiniert.
  • Eingangssignal 40 wird auch einem Stimmhaft/Stimmlos- Schalter 90 zugeführt, der Auswahlsignale auf Ausgangsleitungen 92, 94 bereitstellt, die anzeigen, ob ein stimmhaftes Signal existiert oder nicht. Der Stimmhaft/Stimmlos- Signalauswahlschalter kann einfach ein Tiefpaßfilter umfassen, das eine Frequenz von 300 Hertz oder weniger durchläßt. Mit anderen Worten läßt dieser Schalter die Grundfrequenz eines Vokals selektiv passieren. Allgemein liegt die Grundfrequenz des gesprochenen Vokals (der stimmhaften Töne) zwischen 60 und 250 Hertz, so daß, falls ein Signal in diesem Tiefpaßband existiert, es bekannt ist, daß ein stimmhaftes Signal existiert, wohingegen, falls das Tiefpaßfilter kein Ausgangssignal liefert, es bekannt ist, daß das Eingangssignal nur stimmlose Töne umfaßt. Wenn ein stimmhaftes Signal vorhanden ist, liefert Leitung 92 ein Steuerungssignal, das die spannungsgesteuerten Verstärker 50 und 58 der stimmhaften Kanäle einschaltet, wohingegen ein Signal auf Leitung 94 bei Vorhandensein eines stimmhaften Signals die spannungsgesteuerten Verstärker 74, 80 der stimmlosen Kanäle abschaltet. Alternativ wird bei nicht vorhandenen stimmhaften Komponenten (bspw. keinem Vokalton) das Signal auf Leitung 92 die stimmhaften Kanalverstärker 50 bis 58 abschalten, und wird das Signal auf Leitung 94 die stimmlosen Kanalverstärker 74 bis 80 einschalten.
  • Es ist erwünscht, die stimmhaften und stimmlosen Töne nach der Verarbeitung mit dem ursprünglichen unverarbeiteten Ton und insbesondere mit dem Basisband oder der Grundfrequenz der Stimme zu kombinieren. Da der Spektrumanalysator und dessen ver schiedene Filter jedoch in bestimmtem Maße die Ausgangssignale mit einer Phasenverschiebung beaufschlagen, wird das unverarbeitete Stimmsignal, das mit den verarbeiteten stimmhaften und stimmlosen Signalen kombiniert werden soll, aus den Ausgangssignalen des Spektrumanalysators gewonnen, so daß das kombinierte Signal die gleiche Phasenverschiebung erfährt. Bis dahin werden alle Ausgangsleitungen des Spektrumanalysators, einschließlich der Kanäle 44 bis 46 über Leitungen 100 und 102 einem Summier- oder Kombinier-Netzwerk 104 zugeführt, das an seine Ausgangsleitung 106 ein wieder hergestelltes kombiniertes Stimmsignal liefert, das alle durch den Spektrumanalysator auferlegten Phasenverschiebungen aufweist, das somit passend in einem Mixer 108 mit den kombinierten stimmhaften Signalen des Kombinierers 64 und den kombinierten stimmlosen Signalen des Kombinierers 84 über Pegeleinstellpotentiometer 110, 112 und 114 kombiniert werden kann. Der Ausgang des Mixers 108 auf Leitung 116 liefert das Stimmsignal mit erhöhter Verständlichkeit. Um die verschiedenen Komponenten der Signale in den verschiedenen Kanäle 44 bis 46 und 70 bis 72 entsprechend den jeweiligen Verteilungen der Verständlichkeit richtig zu gewichten, werden die variablen Widerstände 56, 57, 78 und 82 an den Steuerungseingängen der spannungsgesteuerten Verstärker eingesetzt, um die Verstärkung der verschiedenen Komponenten des Ausgangs des Spektrumanalysators zu gewichten.
  • Die nachfolgende Tabelle 1 zeigt die Verteilung in Prozent der Verständlichkeit unterschiedlicher Frequenzkomponenten der menschlichen Stimmsignale an, die in Eindrittel-Oktaven- Frequenzbänder oder ganze Oktaven-Frequenzbänder unterteilt sind. Spannungssteuerungs-Einstellwiderstände 56, 57, 78, 82, etc. werden entsprechend dieser Tabelle eingestellt. Jene Formanten in den Frequenzbändern, die mehr zu der Verständlichkeit beitragen, werden entsprechend der Tabelle 1 in einem proportional größeren Maße verstärkt. Bei einem Ein-Oktavenband für den Spektrumanalysator wird bspw. der Verstärkungssteuerungswiderstand des bei 2 Kilohertz zentrierten Kanals eingestellt, um ein Verstärkungssteuerungssignal eines relativen Werts von 32,8 zu liefern, wohingegen der Verstärkungssteuerungswiderstand des bei 500 Hertz zentrierten Kanals eingestellt wird, um ein Verstärkungssteuerungssignal eines relativen Werts von 14,4 zu liefern, etc. TABELLE 1
  • Im Grunde genommen wählt das in Fig. 3 gezeigte System automatisch jeden individuellen Stimmformanten anhand dessen Amplitude aus. Wie in Fig. 2 zu sehen ist, haben Formanten aufgrund der Resonanzspitzen des Stimmsystems erhöhte Amplituden, und somit werden die verschiedenen spannungsgesteuerten Verstärker in jedem der Kanäle die höchste Amplitudenfrequenzkomponente in dem individuellen Frequenzband auswählen und deren Amplitude mit der dargestellten quadratischen Verstärkung (der Verstärkereingang wird verwendet, um die Verstärkung zu steuern) erhöhen. Falls die Amplitude des Eingangs des individuellen spannungsgesteuerten Verstärkers unterhalb eines vorbestimmten Pegels ist, wird der Signalpegel von dem Verstärker eher reduziert als verstärkt. Für jene Frequenzbänder am Ausgang des Spektrumanalysators, die einen Formant relativ hoher Amplitude umfassen, wird deshalb ein solcher Formant durch den individuellen spannungsgesteuerten Verstärker verstärkt, dessen Verstärkung durch das Eingangssignal selbst gesteuert wird, da durch die Gewichtungspotentiometer 56 oder 57 eingestellt. Der gleiche Ablauf tritt bezüglich der Konsonantlaute und Reiblaute in Kanälen 70 bis 72 auf. Im Grunde genommen identifiziert das System selektiv Formanten in der - Sprache, verstärkt diese Formanten mit einer quadratischen Verstärkung und kombiniert diese Formanten nach der selektiven Gewichtung der Verstärkung (bspw. des Verstärkungsfaktors) der Formanten mit dem Originalsignal, um ein Ausgangssignal mit erhöhter Verständlichkeit bereitzustellen.
  • In Fig. 4 ist eine modifizierte und vereinfachte Version des Prozessor von Fig. 3 dargestellt. Dieser Prozessor, wie der von Fig. 3, wird den Prozessor 18 der Fig. 1 bilden, wenn er in ein Standard-Beschallungs- oder Aufzeichnungssystem eingebaut ist.
  • In dem System von Fig. 4 wird das Signal weder in stimmhafte und stimmlose Komponenten aufgetrennt, noch wird jeder spannungsgesteuerte Verstärker durch sein eigenes Eingangssignal gesteuert. Somit ist diese Anordnung stark vereinfacht und liefert dennoch eine gleiche oder verbesserte Leistung. In der Anordnung von Fig. 4 wird darüber hinaus keine vorbestimmte oder vorberechnete und verallgemeinerte Gewichtung der individuellen Formantenverstärkung verwendet. Vielmehr folgt eine einfache Kalibrierungsprozedur, um den Pegel jedes Formanten auf den Pegel des Basisbandsignals zu bringen.
  • Ein Eingangsstimmsignal auf Leitung 120 der Fig. 4 wird über einen Pufferverstärker 122 einem Spektrumanalysator 124 zugeführt, der jede gewünschte Anzahl von Kanälen aufweisen kann. Der Spektrumanalysator kann in Oktaven oder Drittel- Oktaven oder ähnlichen Teilungen aufgeteilt sein. In einem typischen System, wie nachfolgend noch ausführlicher beschrieben wird, ist der Spektrumanalysator mit 30 separaten Kanälen versehen, um 30 unterschiedliche Ausgangsfrequenzbänder aufeinanderfolgender hoher Frequenzen zu liefern, wobei jedes Hand an ein Nachbarband angrenzt. Ein unterstes Ausgangsband des Spektrumanalysators ist auf der Leitung 130 vorgesehen und umfaßt all jene Signalkomponenten in dem unteren Frequenzband unterhalb von 300 Hz. Dies ist der Basisband- oder Grundfrequenz- Bereich der Stimmbänder. Eine Vielzahl (die eine Anzahl von 29 sein kann) von zusätzlichen Bändern sind mit 132, 134, 136 und 138 gekennzeichnet. Jedes dieser Bänder versorgt seinen eigenen individuellen spannungsgesteuerten Verstärker 140, 142, 144 und 146. Alle Signale an allen Ausgängen des Spektrumanalysators werden den Eingängen eines Mischer- oder Kombinations-Netzwerks 150 zugeführt, an dessen Ausgang ein kombiniertes Signal auf einer Leitung 154 erscheint, das über einen Summier-Widerstand 156 dem invertierenden Eingang eines Operationsverstärkers 158 zugeführt wird, dessen nicht invertierender Eingang geerdet ist, und der als ein Summier-Verstärker verwendet wird.
  • Der Ausgang des Kombinations-Netzwerks 150 wird ebenfalls einem Verstärker 160 und von dort über einen Einstellpotentiometer 162 einem Pufferverstärker 164 zugeführt. Der Ausgang des Pufferverstärkers 164 liefert ein gemeinsames Verstärkungssteuerungseingangssignal auf der Leitung 166 für jeden der spannungsgesteuerten Verstärker 140 bis 146, etc. der verschiedenen Kanäle des Prozessors. Das Steuerungssignal auf Leitung · 166 am Pufferverstärker 144 wird bezüglich seiner Größe individuell (wie nachfolgend beschrieben wird) an jedem spannungsgesteuerten Verstärker eingestellt, um die zuvor beschriebene Gewichtung vorzusehen. Somit umfaßt jeder der spannungsgesteuerten Verstärker 140 bis 146 einen einstellbaren Potentiometer (in Fig. 4 nicht gezeigt), der eingestellt wird, um eine geeignete Gewichtung des individuellen Kanals zu liefern. Diese Gewichtung wird auf einer empirischen Basis erreicht, indem zunächst alle Kanäle des Spektrumanalysators mit Ausnahme des Basisbandes und des einzustellenden Kanals getrennt werden. Dann werden die Amplituden des Basisbandsignals und derjenigen am Ausgang des spannungsgesteuerten Verstärkers (bspw. VCA 140) verglichen. Der Potentiometer, der die Höhe des diesem VCA zugeführten Steuerungssignals variiert, wird dann eingestellt, um die Verstärker-Verstärkungssteuerung einzustellen, um die Amplitude des Ausgangssignals des individuellen VCA, der einge stellt wird, auf den Pegel der Amplitude des Signals in dem Basisbandkanal zu bringen. Nachdem ein Kanal eingestellt ist, wird dieser Kanal abgeschaltet, und alleine der nächste Kanal wird eingeschaltet. Das Ausgangssignal des spannungsgesteuerten Verstärkers wird dann verglichen und so eingestellt, daß es der Amplitude des Basisbandes entspricht. Diese Prozedur wird der Reihe nach mit jedem der Kanäle des Spektrumanalysators einzeln durchgeführt, bis alle Kanäle des Analysators individuell eingestellt wurden, wobei die Amplituden der Ausgangssignale für jedes VCA somit individuell auf die Amplitude des Signals in dem Basisbandkanal gebracht wurde. Somit wird eine Einstellung mit einem Kalibrierungssignal am Eingang 120 in der Form jedes geeigneten Stimmen- oder simulierten Stimmensignals durchgeführt. Das Testsignal kann ein Signal umfassen, das das Basisbandsignal mit all seinen Harmonischen darstellt, aber frei ist von den Resonanzspitzen, die die Formanten umfassen.
  • Verstärker 160 kann eine Verstärkung von etwa +5 besitzen, die wirksam durch Einstellung des Potentiometers 162 gedämpft wird. Der Pufferverstärker 164 hat eine Einheitsverstärkung. Das Summiernetzwerk, durch das die Eingänge aller Kanäle am invertierenden Eingang des Operationsverstärkers 158 summiert werden, einschließlich der Summierwiderstände 170, 172, 174, 176, 178 und 156, wird ausgeführt, um alle Eingangssignale in gleicher Weise zu summieren. Somit entspricht der Rückkopplungswiderstand 180 des Operationsverstärkers 158 jedem der Summierwiderstände 170 bis 178 und 156, die alle zueinander gleich sind.
  • Es zeigt sich, daß in der Ausführungsform von Fig. 4 alle Formanten, ob aus stimmhaften oder stimmlosen Tönen erhalten, in der gleichen Weise und mit der gleichen empirisch bestimmten Gewichtung verarbeitet werden. Jeder der Formanten wird individuell ausgewählt und angehoben, da die individuellen spannungsgesteuerten Verstärker alleine auf die größten Amplitudenkomponenten innerhalb der individuellen Frequenzbänder am Ausgang des Spektrumanalysators arbeiten und nur dann, wenn die Signalausgänge oberhalb eines bestimmten Schwellenwerts liegen. Die verschiedenen VCA verwerfen wirkungsvoll jene Signale unterhalb dieses Schwellenwerts und verstärken selektiv die höheren Amplituden. Im Grunde werden die verschiedenen spannungsgesteuerten Verstärker durch das Basisbandsignal selbst gesteuert. Obgleich das Basisbandsignal mit den anderen und höheren Frequenzen kombiniert wird, die die Harmonischen des Basisbandes sind, hat das letztere eine wesentlich größere Amplitude als deren Harmonische, und eine höhere Amplitude als die Konsonanten, Reib- und Verschlußlaute, und liefert somit die größte Komponente des Steuerungssignals auf Leitung 166, das allen Steuerungseingängen der individuellen Spannungssteuerungsverstärker zugeführt wird. Somit werden in der Anordnung von Fig. 4 verschiedene Formanten wirksam unter Steuerung des Basisbandsignals verstärkt, wohingegen in der. Anordnung von Fig. 3 jeder individuelle Formant wirksam unter eigener Steuerung verstärkt wird.
  • In Fig. 5 ist ein beispielhafter Spektrumanalysator dargestellt, der auf einer Verbindung einer Vielzahl von Zähl- oder Dividier-Chips des Modells 120 TPQ der Firma National Semiconductor basiert. Folglich sind jeweils zehn der unterschiedlichen Chips 200, 202, 204, 206, 208, 210, 212, 214, 216 und 218 wie in Fig. 5 dargestellt miteinander verbunden, wobei der Ausgang auf Leitung 220 des Chips 200 mit dem Eingang auf Leitung 222 des nächsten Chips 222 in dieser Folge verbunden ist, etc. Alle Chips sind in der gleichen Weise verbunden, mit der einzigen Ausnahme, daß der erste in der Reihe, Chip 200, mit einer Frequenzreferenz in Form eines 1 Megahertz-Kristalls 224 versorgt wird, das über Kapazitäten 226 und 227 mit Masse verbunden ist. Der Ausgang jedes Chips liefert die Eingangsfrequenzreferenz für den nächsten Chip in dieser Reihe, mit der Ausnahme, daß ein Schalt-Kondensator-Filterchip 230, der einen Takteingang auf einer Leitung 232 von dem Ausgang des Chips 200 hat, ein Filter liefert, das höhere Signalfrequenzen von der Taktfrequenz separiert. Der Taktausgang des Filters 230 auf Leitung 233 wird den Eingängen der Chips 210 und 212 und dem Eingang eines zweiten Schalt-Kondensator-Filters 234 über eine Leitung 236 zugeführt. Das Filter 234 hat Ausgänge, die zur Steuerung der Eingänge des Chips 214, 216 und 218 verbunden sind. Der Filterchip 230 steuert die Eingänge der Chips 210 und 212 und der Chips 206 und 208. Der Eingang von Leitung 120 der Fig. 4 wird direkt zu den Chips 200, 202 und 204 und zu dem Schalt-Kondensator-Filterchip 230 geführt. Die 30 unterschiedlichen Frequenzausgänge dieses Spektrumanalysators erscheinen auf den 30 Leitungen, die mit C1 bis C30 bezeichnet sind, wobei C30 der Kanal mit der höchsten Frequenz und C1 der Kanal mit der niedersten Frequenz ist. Die Ausgänge C1, C2 und C3 können bspw. Frequenz von etwa 20, 32 bzw. 40 Hertz besitzen, wohingegen die höchste Frequenz auf Kanal C30 eine Ausgangsfrequenz von etwa 20 Kilohertz besitzt. Das System verwendet nur 1/3- Oktavenfrequenzen zwischen 60 und 8000 Hertz. Der Chip 200 besitzt einen eingebauten Oszillator, dessen Frequenz durch das Kristall 224 und die Kapazität 226 gesteuert wird. Die Frequenz wird durch die verschiedenen Chips untergeteilt, um die 30 unterschiedlichen Frequenzen, die zuvor erwähnt wurden, zu erhal ten. Die geschalteten Filter 230, 234 können Chips "LMF, 60- 100" von der Firma National Semiconductor sein.
  • In Fig. 6 ist ein Beispiel eines der spannungsgesteuerten Verstärker (VCA) dargestellt, die für alle Kanäle des Prozessors von Fig. 4 identisch sind. Jeder spannungsgesteuerte Verstärkerchip 300 ist in erster Linie ein Signetics NE/SA 572 "Programmed Analog Compandor", der eine Dualkanalverstärkungssteuerungsschaltung hoher Leistung ist, mit einer modifizierten Eingangs- und Ausgangsschaltung, wie in Fig. 6 gezeigt. Der VCA-Chip 300 hat einen Eingang auf einer Leitung 302 über eine Kapazität 304 von einer Leitung 306 (entsprechend den Leitungen 132, 134, 136, 138) des Spektrumanalysators 124 (Fig. 4). Der Spannungssteuerungseingang für diesen Verstärker, der am Ausgang des Puffers 164 auf Leitung 166 (Fig. 4) geliefert wird, wird über einen Kalibrierungs- und Gewichtungs-Potentiometer 308 (entsprechend den Potentiometern 56, 57, 78, 82 der Fig. 3) und danach von dem Potentiometerkontaktarm über eine Kapazität 170 und einen Eingangswiderstand 172 dem Steuerungseingang des Verstärkungssteuerungs-VCA-Chips 300 zugeführt. Der Ausgang des Spannungssteuerungsverstärkers zu dem Summier-Netzwerk 172, 174, 176, 178, 156 (Fig. 4) wird von einem Ausgangsanschluß 320 geliefert, der über einen Restwiderstand 322 und einen spannungseinstellbaren Potentiometer 324 von einer festen Spannungsquelle vorgespannt wird. Der Ausgang des Spannungssteuerungsverstärkers wird dem invertierenden Eingang eines Operationsverstärkers 326 zugeführt, dessen nicht invertierender Eingang geerdet ist, um auf einer Leitung 328 den Ausgang zu dem Summier-Netzwerk 170 bis 178 und 156 der Fig. 4 zu liefern. Es ist das Potentiometer 308, das die individuelle Gewichtung des individuellen spannungsgesteuerten Verstärkers steuert. Dies ist der Widerstand, der auf einer Kanal-nach-Kanal Basis durch die Kanalbasis eingestellt wird, um die Amplitude jedes Kanals individuell auf die Amplitude des Basisbandsignal zu bringen. Wenn einmal die geeignete Größe des Widerstands des Potentiometers 308 bestimmt ist, kann der letztere selbstverständlich als ein Festwiderstand vorgesehen werden, der um einen kleinen Betrag verstellt werden kann.
  • Wie zuvor beschrieben, stellt Fig. 1 die Verwendung von Stimmverarbeitungsverfahren und einer Vorrichtung der vorliegenden Erfindung dar, die in Echtzeit auf ein Stimmkommunikationssystem angewendet wurden. Es ist leicht zu erkennen, daß die gleiche Stimmverarbeitung auch bei der Herstellung jeder geeigneten Aufzeichnung verwendet werden kann, die später und wiederholt als Toneingang für ein herkömmliches Beschallungssystem verwendet wird. Wenn eine solche Aufzeichnung bei Verwendung der Stimmverarbeitung und Verständlichkeits- Verbesserungstechniken, die hier beschrieben sind, erstellt wird, umfaßt die sich ergebende Aufzeichnung in sich die Verständlichkeits-Verbesserung, die durch die Verarbeitungsschaltung geliefert wird. Deshalb ist keine weitere Verständlichkeits-Verbesserungs-Verarbeitung notwendig, wenn eine solche Aufzeichnung über ein herkömmliches Beschallungs- oder anderes Lautsprechersystem wiedergegeben wird.
  • Um eine solche Aufzeichnung zu erstellen, wird ein System verwendet, das im wesentlichen das gleiche wie in Fig. 1 darstellt. Der einzige Unterschied liegt darin, daß der Lautsprecher 16 durch eine Aufzeichnungsvorrichtung, wie bspw. einen Kassettenrecorder oder ähnliches, ersetzt ist, so daß der auf dem Band oder einem anderen Aufzeichnungsmedium aufgezeichnete Ton die angehobenen und kombinierten Formanten umfaßt, die durch die Schaltung 18, wie zuvor beschrieben, verarbeitet wurden.
  • Wenn das als Lautsprecher 16 in der Anordnung von Fig. 1 identifizierte Element tatsächlich eine Aufzeichnungsvorrichtung anstelle eines Lautsprechersystems ist, so daß eine verständlichkeitsverbesserte Aufzeichnung durch eine solche Aufzeichnungsvorrichtung erstellt werden kann, kann das Eingangssignal von der Quelle 10 ein klares und sauberes Stimmsignal, wie bspw. ein in einem Soundstudio oder in einer anderen hintergrundgeräuschfreien Umgebung gesprochenes Signal sein. Die beschriebene Verarbeitung wird jedoch auch eine verständlichkeitsverbesserte Aufzeichnung liefern, wenn der Eingangston eine gesprochene Stimme umfaßt, die aus einer Umgebung mit Hintergrundgeräuschen stammt. Eine solche Bedingung existiert in vielen Situationen, so bspw. im Falle eines Cockpit- Stimmrecorders (CVR), der eine Aufzeichnungsvorrichtung ist, die in einem Cockpit eines kommerziellen Flugzeugs untergebracht ist, um eine Aufzeichnung von Ereignissen und Gesprächen des Personals in dem Flugzeugcockpit aufzuzeichnen. Die Cockpitumgebung ist in hohem Maße lärmbehaftet, so daß in der Vergangenheit von dem Cockpitstimmrecorder gemachte Aufzeichnungen aufgrund ihrer verschlechterten Verständlichkeit schwer zu verstehen waren. Die vorliegende Erfindung ist auf solche Cockpitstimmrecorder anwendbar, um die Verständlichkeit des aufgezeichneten Tons zu verbessern, wenn dieser mit herkömmlichen Wiedergabegeräten abgespielt wird. Ein Cockpitstimmrecorder mit der Verständlichkeitsverbesserung entsprechend der vorliegenden Erfindung entspricht etwa dem System, wie es in Fig. 1 dargestellt ist, wobei die Quelle 10 ein Mikrofon umfaßt, um den Klang zur Aufnahme in einem bekannten Stimmrecorder (der durch Lautsprecher 16 der Fig. 1 ersetzt ist) verwendet wird. Der Ausgang des Mikrofons 10 (die Stimmquelle) wird einem passenden Verstärker, wie bspw. Verstärker 12, zugeführt. Der Ausgang des Verstärkers wird der Verständlichkeits-Verbesserungs- Stimmverarbeitungsschaltung 14, wie zuvor beschrieben, zugeführt. Die Schaltung 14 identifiziert selektiv und verstärkt Formanten des Stimmsignals, obgleich das letztgenannte zunächst bei einem relativ hohen vorhandenen Hintergrund-Geräuschpegel existiert. Deshalb wird die Formant-Verarbeitung, wie zuvor beschrieben, zu einer Aufzeichnung mit verbesserter Verständlichkeit führen, obwohl die Aufzeichnung auch die aufgezeichneten Geräusche enthält.

Claims (10)

1. Sprachverständlichkeitsverbesserungsanordnung, welche umfaßt
einen Spektrum-Analysator (42; 124), welcher geeignet ist, ein elektrisches Stimmsignal zu empfangen, dessen Verständlichkeit verbessert werden soll, und individuelle Frequenzbandsignale in einer Vielzahl von individuellen Frequenzbandausgangskanälen (52-72; 132-138) mit voneinander unterschiedlichen Frequenzbändern hat;
eine Vielzahl von spannungsgesteuerten Verstärkern (50-80; 140-146), jeweils einzeln für jeden einzelnen der Kanäle, wobei jeder einen Eingang von einem Signalkanal her und einen Verstärkungssteuerungseingang hat;
steuerungserzeugende Mittel (56-82; 150, 160, 162, 164, 166), welche auf Signale in mindestens einem der Kanäle reagieren, um ein Verstärkungssteuerungssignal dem Verstärkungs-Steuerungseingang mindestens eines der Verstärker zuzuführen,
eine Kombinierschaltung (104; 150), die einen Eingang von einem jeden der Vielzahl einzelner Frequenzbandkanäle hat und für einen kombinierten Ausgang sorgt (106; 154), und Mittel (64, 84, 108; 158) zum Kombinieren von Ausgängen der Verstärker und des kombinierten Ausgangs, um ein verbessertes Stimmsignal vorzusehen.
2. Anordnung nach Anspruch 1, bei welcher die steuerungserzeugenden Mittel solche Mittel umfassen (56-82), welche auf das Signal in einem der Kanäle zur Zuführung eines Verstärkungssteuerungssignals zum Verstärkungssteuerungseingang des Verstärkers in diesem einen Kanal reagieren.
3. Anordnung nach Anspruch 1, bei welcher die steuerungserzeugenden Mittel solche Mittel umfassen (150, 160, 162, 164, 166), welche auf den kombinierten Ausgang zur Zuführung eines Verstärkungssteuerungssignals zu den Verstärkungssteuerungseingängen einer Vielzahl von Verstärkern reagieren.
4. Anordnung nach Anspruch 1, bei welcher die Mittel zum Kombinieren des kombinierten Ausgangs und der Ausgänge der Verstärker Mittel umfassen (130, 170), um das Signal, das von dem Spektrum-Analysator in einer niedrigsten Frequenz eines der Kanäle geliefert wird, mit den Ausgängen der Verstärker und dem kombinierten Signal zu kombinieren, um den verbesserten Ausgang zu bewirken.
5. Anordnung nach Anspruch 4, welche Mittel (56-82) zur Anpassung des Steuerungspegels enthält, um den Grad der von · jedem der Spannungssteuerungsverstärker erzeugten Verstärkung anzupassen, so daß das Niveau des Ausgangs des Einzelverstärkers auf ein Niveau verändert wird, das im wesentlichen dem Niveau des Signals in dem Kanal mit der niedrigsten Frequenz gleicht.
6. Anordnung nach Anspruch 1, bei welcher einer der Frequenzbandkanäle 20 ein Basisbandkanal für den Durchlaß eines Bandes niedriger Frequenzen ist, welche im wesentlichen gleich aber nicht größer als die natürliche Frequenz der menschlichen Stimmbänder sind.
7. Anordnung nach Anspruch 1, bei welcher einer der Kanäle ein Band von Frequenzen durchläßt, welche etwa 300 Hertz nicht übersteigen.
8. Verfahren zur Verständlichkeitsverbesserung von gesprochenen Worten, die in einen Bereich mit Umgebungslärm von einem Lautsprechersystem abgegeben werden, das ein Eingangssignal empfängt, das von einem elektrischen, Sprache darstellenden Stimmsignal abgeleitet ist wobei dieses Verfahren umfaßt:
Spektrum-Analyse (42; 124) des elektrischen Stimmsignals, um individuelle Frequenzbandsignale in einer Vielzahl von individuellen Frequenzbandausgangskanälen (52-72; 132-138) mit voneinander unterschiedlichen Frequenzbändern zu liefern,
Verstärkung in einer Vielzahl von verstärkungsgesteuerten Verstärkern (5080; 140-146) von einzelnen der individuellen Frequenzbandsignale, wobei jeder Verstärker einen Eingang empfängt von einem unterschiedlichen Ausgangskanal empfängt,
Erzeugung (56-82; 150, 160, 162, 164, 166) eines Verstärkungssteuerungssignals aus Signalen in mindestens einem der Ausgangskanäle und Lieferung dieses Verstärkungssteuerungssignals an mindestens einen der Verstärker, um dessen Verstärkung zu steuern;
Kombination (104; 150) einer Vielzahl von einzelnen dieser individuellen Frequenzbandsignale, um ein kombiniertes Ausgangssignal zu erzielen, und
Kombination (64, 84, 108; 158) von Ausgangssignalen der Verstärker und des kombinierten Ausgangssignals, um ein verbessertes Stimmsignal für die Verwendung im Lautsprechersystem zu liefern.
9. Verfahren nach Anspruch 8, bei welchem der Erzeugungsschritt die Erzeugung (56-82) des Verstärkungssteuerungssignals für jeden Verstärker aus dem individuellen Frequenzbandsignal umfaßt, das diesem Verstärker zugeführt wird.
10. Verfahren nach Anspruch 8, welches die Verwendung (150, 160, 162, 164, 25166) des kombinierten Ausgangssignals für das Verstärkungssteuerungssignal einer Vielzahl von Verstärkern umfaßt.
DE69131095T 1991-03-27 1991-12-12 Verständlichkeitsverbesserungsanordnung für eine Beschallungsanlage Expired - Lifetime DE69131095T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US67603791A 1991-03-27 1991-03-27

Publications (2)

Publication Number Publication Date
DE69131095D1 DE69131095D1 (de) 1999-05-12
DE69131095T2 true DE69131095T2 (de) 1999-09-23

Family

ID=24712968

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69131095T Expired - Lifetime DE69131095T2 (de) 1991-03-27 1991-12-12 Verständlichkeitsverbesserungsanordnung für eine Beschallungsanlage

Country Status (11)

Country Link
US (1) US5459813A (de)
EP (1) EP0505645B1 (de)
JP (1) JP3151459B2 (de)
KR (1) KR950013557B1 (de)
CN (1) CN1041266C (de)
CA (1) CA2056110C (de)
DE (1) DE69131095T2 (de)
ES (1) ES2133281T3 (de)
HK (1) HK1003305A1 (de)
IL (1) IL100174A (de)
MX (1) MX9102610A (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10124699C1 (de) * 2001-05-18 2002-12-19 Micronas Gmbh Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen
DE102004013952A1 (de) * 2004-03-22 2005-10-20 Infineon Technologies Ag Schaltkreis-Anordnung und Signalverarbeitungs-Vorrichtung
DE112012006876B4 (de) * 2012-09-04 2021-06-10 Cerence Operating Company Verfahren und Sprachsignal-Verarbeitungssystem zur formantabhängigen Sprachsignalverstärkung

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5710862A (en) * 1993-06-30 1998-01-20 Motorola, Inc. Method and apparatus for reducing an undesirable characteristic of a spectral estimate of a noise signal between occurrences of voice signals
JPH07104788A (ja) * 1993-10-06 1995-04-21 Technol Res Assoc Of Medical & Welfare Apparatus 音声強調処理装置
US5467393A (en) * 1993-11-24 1995-11-14 Ericsson Inc. Method and apparatus for volume and intelligibility control for a loudspeaker
JP3321971B2 (ja) * 1994-03-10 2002-09-09 ソニー株式会社 音声信号処理方法
DE69629986T2 (de) * 1995-07-27 2004-07-15 Victor Company of Japan, Ltd., Yokohama Verfahren und Gerät zum Kodieren digitaler akustischer Signale
GB2306088A (en) * 1995-10-09 1997-04-23 London Regional Transport Public address system speech training
US5966438A (en) * 1996-03-05 1999-10-12 Ericsson Inc. Method and apparatus for adaptive volume control for a radiotelephone
US5790671A (en) * 1996-04-04 1998-08-04 Ericsson Inc. Method for automatically adjusting audio response for improved intelligibility
GB9714001D0 (en) * 1997-07-02 1997-09-10 Simoco Europ Limited Method and apparatus for speech enhancement in a speech communication system
US6353671B1 (en) * 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
US6285767B1 (en) 1998-09-04 2001-09-04 Srs Labs, Inc. Low-frequency audio enhancement system
US6590983B1 (en) * 1998-10-13 2003-07-08 Srs Labs, Inc. Apparatus and method for synthesizing pseudo-stereophonic outputs from a monophonic input
US6993480B1 (en) 1998-11-03 2006-01-31 Srs Labs, Inc. Voice intelligibility enhancement system
US7031474B1 (en) 1999-10-04 2006-04-18 Srs Labs, Inc. Acoustic correction apparatus
US7277767B2 (en) 1999-12-10 2007-10-02 Srs Labs, Inc. System and method for enhanced streaming audio
US20030220801A1 (en) * 2002-05-22 2003-11-27 Spurrier Thomas E. Audio compression method and apparatus
KR20050049103A (ko) * 2003-11-21 2005-05-25 삼성전자주식회사 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치
US7522733B2 (en) * 2003-12-12 2009-04-21 Srs Labs, Inc. Systems and methods of spatial image enhancement of a sound source
US8170879B2 (en) * 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US7949520B2 (en) * 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US8543390B2 (en) 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US8306821B2 (en) * 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
TW200627999A (en) 2005-01-05 2006-08-01 Srs Labs Inc Phase compensation techniques to adjust for speaker deficiencies
KR100657948B1 (ko) 2005-02-03 2006-12-14 삼성전자주식회사 음성향상장치 및 방법
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US8050434B1 (en) 2006-12-21 2011-11-01 Srs Labs, Inc. Multi-channel audio enhancement system
WO2009004718A1 (ja) * 2007-07-03 2009-01-08 Pioneer Corporation 楽音強調装置、楽音強調方法、楽音強調プログラムおよび記録媒体
TWI376925B (en) 2007-08-28 2012-11-11 Micro Star Int Co Ltd Adjusting device and method of notification sound according to the environment
US8904400B2 (en) 2007-09-11 2014-12-02 2236008 Ontario Inc. Processing system having a partitioning component for resource partitioning
US8850154B2 (en) * 2007-09-11 2014-09-30 2236008 Ontario Inc. Processing system having memory partitioning
US8209514B2 (en) 2008-02-04 2012-06-26 Qnx Software Systems Limited Media processing system having resource partitioning
JP4968147B2 (ja) 2008-03-31 2012-07-04 富士通株式会社 通信端末、通信端末の音声出力調整方法
EP2478444B1 (de) 2009-09-14 2018-12-12 DTS, Inc. System zur adaptiven verarbeitung von sprachverständlichkeit
US9324337B2 (en) * 2009-11-17 2016-04-26 Dolby Laboratories Licensing Corporation Method and system for dialog enhancement
KR101690252B1 (ko) 2009-12-23 2016-12-27 삼성전자주식회사 신호 처리 방법 및 장치
CN103181191B (zh) 2010-10-20 2016-03-09 Dts有限责任公司 立体声像加宽系统
WO2012152323A1 (en) * 2011-05-11 2012-11-15 Robert Bosch Gmbh System and method for emitting and especially controlling an audio signal in an environment using an objective intelligibility measure
US9117455B2 (en) 2011-07-29 2015-08-25 Dts Llc Adaptive voice intelligibility processor
US9823892B2 (en) 2011-08-26 2017-11-21 Dts Llc Audio adjustment system
WO2013101605A1 (en) 2011-12-27 2013-07-04 Dts Llc Bass enhancement system
JP5590021B2 (ja) * 2011-12-28 2014-09-17 ヤマハ株式会社 音声明瞭化装置
US9026439B2 (en) * 2012-03-28 2015-05-05 Tyco Fire & Security Gmbh Verbal intelligibility analyzer for audio announcement systems
US9208767B2 (en) 2012-09-02 2015-12-08 QoSound, Inc. Method for adaptive audio signal shaping for improved playback in a noisy environment
CN104078050A (zh) 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
US9258664B2 (en) 2013-05-23 2016-02-09 Comhear, Inc. Headphone audio enhancement system
CN104575515A (zh) * 2013-10-23 2015-04-29 中兴通讯股份有限公司 一种提高语音质量的方法及装置
US9531333B2 (en) * 2014-03-10 2016-12-27 Lenovo (Singapore) Pte. Ltd. Formant amplifier
EP3107097B1 (de) * 2015-06-17 2017-11-15 Nxp B.V. Verbesserte sprachverständlichkeit
US9847093B2 (en) * 2015-06-19 2017-12-19 Samsung Electronics Co., Ltd. Method and apparatus for processing speech signal
WO2017025107A2 (en) * 2015-11-22 2017-02-16 Al-Shalash Taha Kais Taha Talker language, gender and age specific hearing device
JP6177480B1 (ja) * 2016-12-08 2017-08-09 三菱電機株式会社 音声強調装置、音声強調方法、及び音声処理プログラム
TWI662545B (zh) * 2018-06-22 2019-06-11 塞席爾商元鼎音訊股份有限公司 調整語音頻率之方法及其聲音播放裝置
CN109658952B (zh) * 2018-12-13 2020-10-09 歌尔科技有限公司 一种音频信号处理方法、设备及存储介质
CN109671422B (zh) * 2019-01-09 2022-06-17 浙江工业大学 一种获取纯净语音的录音方法
US12060148B2 (en) 2022-08-16 2024-08-13 Honeywell International Inc. Ground resonance detection and warning system and method

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3180936A (en) * 1960-12-01 1965-04-27 Bell Telephone Labor Inc Apparatus for suppressing noise and distortion in communication signals
US3368039A (en) * 1965-01-22 1968-02-06 Ibm Speech analyzer for speech recognition system
DE2555263B1 (de) * 1975-12-09 1977-02-10 Westfaelische Metall Industrie Kg, Hueck & Co, 4780 Lippstadt Verkehrsdurchsagesystem
DE2618973B2 (de) * 1976-04-29 1981-05-07 CMB Colonia Management- und Beratungsgesellschaft mbH & Co KG, 5000 Köln Verfahren zum Auffrischen älterer Tonaufzeichnungen
US4166926A (en) * 1978-06-07 1979-09-04 Seiler George J Portable lectern and voice amplifier
DE3070698D1 (en) * 1979-05-28 1985-07-04 Univ Melbourne Speech processor
US4287391A (en) * 1979-06-21 1981-09-01 Rhr Industries, Ltd. Microphone assembly for speech recording using noise-adaptive output level control
US4506379A (en) * 1980-04-21 1985-03-19 Bodysonic Kabushiki Kaisha Method and system for discriminating human voice signal
FI66268C (fi) * 1980-12-16 1984-09-10 Euroka Oy Moenster och filterkoppling foer aotergivning av akustisk ljudvaeg anvaendningar av moenstret och moenstret tillaempandetalsyntetisator
JPS5842096A (ja) * 1981-09-04 1983-03-11 富士通テン株式会社 音声信号の雑音抑圧方式
US4661981A (en) * 1983-01-03 1987-04-28 Henrickson Larry K Method and means for processing speech
US4641343A (en) * 1983-02-22 1987-02-03 Iowa State University Research Foundation, Inc. Real time speech formant analyzer and display
US4707858A (en) * 1983-05-02 1987-11-17 Motorola, Inc. Utilizing word-to-digital conversion
US4703505A (en) * 1983-08-24 1987-10-27 Harris Corporation Speech data encoding scheme
US4696040A (en) * 1983-10-13 1987-09-22 Texas Instruments Incorporated Speech analysis/synthesis system with energy normalization and silence suppression
US4686693A (en) * 1985-05-17 1987-08-11 Sound Mist, Inc. Remotely controlled sound mask
US4689821A (en) * 1985-09-23 1987-08-25 Lockheed Corporation Active noise control system
NL8600405A (nl) * 1986-02-18 1987-09-16 Philips Nv Versterker met automatische regeling van de versterking.
JPS62235996A (ja) * 1986-04-07 1987-10-16 東洋通信機株式会社 合成音質変化方法
US4882758A (en) * 1986-10-23 1989-11-21 Matsushita Electric Industrial Co., Ltd. Method for extracting formant frequencies
US4802228A (en) * 1986-10-24 1989-01-31 Bernard Silverstein Amplifier filter system for speech therapy
US5175793A (en) * 1989-02-01 1992-12-29 Sharp Kabushiki Kaisha Recognition apparatus using articulation positions for recognizing a voice
US4979216A (en) * 1989-02-17 1990-12-18 Malsheen Bathsheba J Text to speech synthesis system and method using context dependent vowel allophones
JP2705201B2 (ja) * 1989-03-29 1998-01-28 富士通株式会社 適応後置フイルタ制御方法
JP2573352B2 (ja) * 1989-04-10 1997-01-22 富士通株式会社 音声検出装置
US5280543A (en) * 1989-12-26 1994-01-18 Yamaha Corporation Acoustic apparatus and driving apparatus constituting the same
EP0438662A2 (de) * 1990-01-23 1991-07-31 International Business Machines Corporation Einrichtung und Verfahren zur Gruppierung von Äusserungen eines Phonemen in von Kontexten abhängigen Kategorien, die auf Tonähnlichkeit basiert sind für automatische Spracherkennung
EP0477591B1 (de) * 1990-09-27 1995-06-28 STUDER Professional Audio AG Verstärkereinheit
JPH04250710A (ja) * 1991-01-09 1992-09-07 Sony Corp オーディオ回路

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10124699C1 (de) * 2001-05-18 2002-12-19 Micronas Gmbh Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen
DE102004013952A1 (de) * 2004-03-22 2005-10-20 Infineon Technologies Ag Schaltkreis-Anordnung und Signalverarbeitungs-Vorrichtung
DE112012006876B4 (de) * 2012-09-04 2021-06-10 Cerence Operating Company Verfahren und Sprachsignal-Verarbeitungssystem zur formantabhängigen Sprachsignalverstärkung

Also Published As

Publication number Publication date
IL100174A (en) 1997-09-30
JP3151459B2 (ja) 2001-04-03
KR920018650A (ko) 1992-10-22
HK1003305A1 (en) 1998-10-23
CN1041266C (zh) 1998-12-16
JPH04328798A (ja) 1992-11-17
US5459813A (en) 1995-10-17
EP0505645B1 (de) 1999-04-07
EP0505645A1 (de) 1992-09-30
MX9102610A (es) 1994-06-30
ES2133281T3 (es) 1999-09-16
KR950013557B1 (ko) 1995-11-08
IL100174A0 (en) 1992-08-18
CN1065370A (zh) 1992-10-14
DE69131095D1 (de) 1999-05-12
CA2056110C (en) 1997-02-04
CA2056110A1 (en) 1992-09-28

Similar Documents

Publication Publication Date Title
DE69131095T2 (de) Verständlichkeitsverbesserungsanordnung für eine Beschallungsanlage
DE69509555T2 (de) Verfahren zur veränderung eines sprachsignales mittels grundfrequenzmanipulation
DE69816221T2 (de) Sprachschnellheitsveränderungsverfahren und vorrichtung
Gordon‐Salant Recognition of natural and time/intensity altered CVs by young and elderly subjects with normal hearing
DE68913139T2 (de) Störunterdrückung.
DE60305712T2 (de) Lautstärkeregelung von sprache in signalen, die sprache oder andere arten von audiosignalen enthalten
DE69417445T2 (de) Verfahren und system zur detektion und erzeugung von übergangsbedingungen in tonsignalen
DE2526034A1 (de) Hoerhilfeverfahren und vorrichtung zur durchfuehrung des verfahrens
DE69317802T2 (de) Verfahren und Vorrichtung für Tonverbesserung unter Verwendung von Hüllung von multibandpassfiltrierten Signalen in Kammfiltern
EP1808853A1 (de) Beschallungsanlage, Verfahren zur Verbesserung der Sprachqualität und/oder Verständlichkeit von Sprachdurchsagen sowie Computerprogramm
WO2001047335A2 (de) Verfahren zur elimination von störsignalanteilen in einem eingangssignal eines auditorischen systems, anwendung des verfahrens und ein hörgerät
DE60033039T2 (de) Vorrichtung und verfahren zur unterdrückung von zischlauten unter verwendung von adaptiven filteralgorithmen
WO2010078938A2 (de) Verfahren und vorrichtung zum verarbeiten von akustischen sprachsignalen
DE102021205251B4 (de) Verfahren und Vorrichtung zur frequenzselektiven Verarbeitung eines Audiosignals mit geringer Latenz
AT507844B1 (de) Methode zur trennung von signalpfaden und anwendung auf die verbesserung von sprache mit elektro-larynx
DE2613513A1 (de) Hoerhilfe insbesondere hoergeraet
DE1940384C3 (de) Elektrisches Verfahren zum Harmonisieren des Grundtonverlaufs bei der Sprachsynthese und Schaltungsanordnung
EP3961624B1 (de) Verfahren zum betrieb einer hörvorrichtung in abhängigkeit eines sprachsignals
DE1079118B (de) Verfahren zur elektrischen Nachrichtenuebertragung unter Frequenzbandpressung
EP3962115A1 (de) Verfahren zur bewertung der sprachqualität eines sprachsignals mittels einer hörvorrichtung
DE102020210918A1 (de) Verfahren zum Betrieb einer Hörvorrichtung in Abhängigkeit eines Sprachsignals
DE3146556A1 (de) Verfahren und anordnung zur sprechverbesserung
DE2217006C3 (de) Verfahren zur Bestimmung einer Frequenzgangkurve für von gehörbehinderten Personen verwendete Audioverstärker
EP1380028A2 (de) Verfahren zur elimination von störsignalanteilen in einem eingangssignal eines auditorischen systems, anwendung des verfahrens und ein hörgerät
DE9212439U1 (de) Signalverarbeitungssystem zur Reduzierung von Rauschanteilen in einem Sprachsignal

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8328 Change in the person/name/address of the agent

Representative=s name: WITTE, WELLER & PARTNER, 70178 STUTTGART