DE69631318T2 - Verfahren und Vorrichtung zur Erzeugung von Hintergrundrauschen in einem digitalen Übertragungssystem - Google Patents

Verfahren und Vorrichtung zur Erzeugung von Hintergrundrauschen in einem digitalen Übertragungssystem Download PDF

Info

Publication number
DE69631318T2
DE69631318T2 DE1996631318 DE69631318T DE69631318T2 DE 69631318 T2 DE69631318 T2 DE 69631318T2 DE 1996631318 DE1996631318 DE 1996631318 DE 69631318 T DE69631318 T DE 69631318T DE 69631318 T2 DE69631318 T2 DE 69631318T2
Authority
DE
Germany
Prior art keywords
frame
signal
frequency spectrum
inactive
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE1996631318
Other languages
English (en)
Other versions
DE69631318D1 (de
Inventor
Dominique Massaloux
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of DE69631318D1 publication Critical patent/DE69631318D1/de
Application granted granted Critical
Publication of DE69631318T2 publication Critical patent/DE69631318T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/17Time-division multiplex systems in which the transmission channel allotted to a first user may be taken away and re-allotted to a second user if the first user becomes inactive, e.g. TASI
    • H04J3/175Speech activity or inactivity detectors
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Description

  • Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur Erzeugung eines Hintergrundrauschens in einem digitalen unterbrochenen Sprachübertragungssystem.
  • Im Allgemeinen enthalten unterbrochene Sprachübertragungssysteme ein Sprechaktivitätssignal, welches es ermöglicht, eine Information bezüglich des Vorhandenseins oder des Nicht-Vorhandenseins des Sprachsignals zu liefern. Das von den vorgenannten Systemen gelieferte Sprachsignal umfasst so das vorgenannte eigentliche Sprachsignal, dem Geräuschlosigkeit folgt und/oder dem Geräuschlosigkeit vorausgeht. Wenn eine Geräuschlosigkeit oder eine Inaktivität erfasst wird, wird das Übertragungssystem so geregelt/gesteuert, dass entweder die Signalübertragungsleistung verringert wird oder dass die Übertragung einfach unterbrochen wird.
  • Wenn bei dem Gespräch die Umgebungsgeräusche erhöht sind, führt die plötzliche Unterdrückung oder Modifikation von deren Eigenschaften während den inaktiven Zeitintervallen zu einer äußerst unangenehmen Wirkung für den Hörer, wobei diese Wirkung den Eindruck eines Gesprächsabbruchs hervorrufen kann. Außerdem erreicht das Sprachsignal manchmal die Grenzen der Unleserlichkeit.
  • Um die vorgenannten Nachteile zu beheben, wurde in neuerer Zeit vorgeschlagen, während der nichtaktiven Zeitintervalle ein synthetisches Signal einzufügen, das das Hintergrundrauschen, das vor der Übertragungsunterbrechung herrscht, reproduziert. Hierzu kann die im Rahmen der Erstellung des Leistungsverzeichnisses des europäischen mobilen Vollraten- und Halbratennetzes geleistete Arbeit angeführt werden.
  • Das europäische mobile Vollratensystem war Gegenstand der Empfehlung ETSI GSM 06.12. Dieses System umfasst eine Vorrichtung zur Erzeugung von Hintergrundrauschen CNG (auf Englisch: Comfort Noise Generator). Es umfasst weiterhin einen Sprachcodierer, der alle 20 ms Datenübertragungsblöcke mit auf 260 Bit codierten Parametern herstellt. Ein Sprechaktivitätsdetektor liefert jedem Datenübertragungsblock eine Information bezüglich der Aktivität oder Inaktivität des Datenübertragungsblocks. Die Amplitudenparameter der Auslöseblöcke und Log Area Ratios (LAR), die aus der LPC-Analyse des Codierers hervorgehen, liefern Informationen über den Pegel oder Amplitude und die Umhüllende des Frequenzspektrums (LAR) der Umgebungsgeräusche. Der Generator von Hintergrundrauschen ermittelt den Durchschnitt dieser Parameter bei einer bestimmten Anzahl von aufeinanderfolgenden Datenübertragungsblöcken, quantifiziert sie entsprechend des vom Sprachcodierer verwendeten Quantifizierungsverfahrens und erzeugt einen Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung, den SID-Datenübertragungsblock (auf Englisch: Silence Inscription Descriptor). Ein solcher Datenübertragungsblock wird am Ende eines aktiven Zeitintervalls und alle 480 ms bei jedem inaktiven Zeitintervall erzeugt. Die SID-Datenübertragungsblöcke werden codiert, mit einem SID-Codewort zur Markierung dieser Datenübertragungsblöcke ausgestattet und dann zum Empfang durch einen Decoder übertragen. Das Hintergrundrauschen wird beim Decoder durch aleatorisches Strecken der Codes der Auslöseparameter synthetisiert, der Verstärkungscode des langfristigen Vorhersagers wird auf Null gestellt, die entsprechenden Codes werden bei der LPC-Analyse und bei der Amplitude der Auslöseblocks durch die Codes des SID-Datenübertragungsblocks ersetzt. Die inaktiven Datenübertragungsblöcke werden anschließend wie die Sprachdatenübertragungsblöcke decodiert.
  • Bei einer solchen Vorrichtung sind die Module des Generators von Hintergrundrauschen außerhalb des Sprachcodierers und des Sprach-Decoders, was den Vorteil einer größeren Modularität des Systems auf Kosten einer gesteigerten Komplexität der Verarbeitung der inaktiven Datenübertragungsblöcke hat: Die Verarbeitung der SID-Datenübertragungsblöcke beim Codierer und die aleatorische Bildung der Auslösecodes kommen zur normalen Verarbeitung der Sprachdatenübertragungsblöcke hinzu. Außerdem sind der lokale Decoder des Sprach-Codierers beim Senden und der entfernte Decoder beim Empfang nach einem inaktiven Zeitintervall nicht mehr synchron, da der Codierer unabhängig vom System arbeitet.
  • Das europäische mobile Halbratensystem verfügt ebenfalls über einen Generator von Hintergrundrauschen, dessen Aufbau dem des Vollratensystems ähnelt, vergleiche Empfehlung ETSI GSM 06.22 und GSM 06.20. Äquivalent zum durch den CNG-Generator des Vollratensystems eingesetzten Verfahren verwendet der CNG-Generator die Autokorrelationen des Sprachsignals, Eingangssignals, bei 8 aufeinanderfolgenden Datenübertragungsblöcken, um das Spektrum der Umgebungsgeräusche abzuschätzen. Was die Energie betrifft, berücksichtigt er die Energie der 8 Datenübertragungsblöcke und fährt weiter mit der Quantifizierung des Parameters des Bezugs zwischen der geschätzten Energie und der tatsächlichen Energie, Parameter GS, vergleiche Empfehlung ETSI GSM 06.20.
  • Außerdem wurde der Sprachcodierer so angepasst, dass er während der inaktiven Zeitintervalle synchron zum entfernten Decoder arbeitet, wobei der aleatorische Generator bei jedem Beginn des inaktiven Bereichs wieder initialisiert wird.
  • Schließlich wurden Systeme, die Multiraten-Codierer einsetzen, vorgeschlagen, deren Arbeitsweise bei einer besonderen Arbeitsmethode mit der eines CNG verwandt ist. Unter diesen kann der Multiraten-Codierer anführen, der in dem von A. De JACO, W. GARDNER, P. JACOBS und CHONG LEE veröffentlichten Artikel mit dem Titel „QCELP: The North American CDMA Digital Cellular Variable Rate Speech Coding Standard", Proc. IEEE Workshop on Speech Coding for Telecomm, Quebec, Okt. 1993, Seiten 5–6, beschrieben wird. Bei einem solchen System bestimmt eine Sprachaktivitätserfassungsvorrichtung die zur Übertragung notwendige Rate. Vier Raten sind möglich: 1, ½, ¼ oder 1/8 Bit pro Muster. Die Übertragung wird nicht unterbrochen und die übertragenen Parameter sind über die Koeffizienten LPC und eine Angabe bezüglich der Anregungsenergie die Umhüllende des Spektrums. Diese Parameter werden auf jeden Datenübertragungsblock übertragen und das System mit der geringsten Rate weist eine zur Funktion eines CNG-Generators ähnliche Funktion auf.
  • Weiterhin kann auch das von A. GROSSMAN in der Veröffentlichung mit dem Titel „A High performance Audio Codec for Videoconferencing" ICSPAT, Santa Clara, Okt. 93, Seiten 1039 –1042, beschriebene System angeführt werden. Bei einem solchen Breitbandsystem mit variabler Rate wird ein Verfahren verwendet, bei dem die durch die Störungscodes umgewandelten Koeffizienten ersetzt werden. Jedoch wird auch immer die spektrale Umhüllende des Signals übertragen, wobei eine Glättung zwischen den Datenübertragungsblöcken stattfindet.
  • Ziel des Verfahrens und der Vorrichtung zur Erzeugung eines Hintergrundrauschens in einem digitalen Sprachübertragungssystem der vorliegenden Erfindung ist es, eine Qualität der Synthese zu erreichen, die mit der von Hochratensystemen vergleichbar ist und dabei Übertragungsraten ermöglicht, die mit der von stark leistungsreduzierten Systemen vergleichbar sind.
  • Ein weiteres Ziel der Erfindung ist es außerdem die Erzeugung eines Hintergrundrauschens von guter Qualität, das die Umgebung wiedergibt und dabei die Menge und die Rate der zu übertragenden Daten minimiert, um diese Erzeugung zu gewährleisten.
  • Das Verfahren und die Vorrichtung, die Gegenstand der vorliegenden Erfindung sind, zur Erzeugung eines Hintergrundrauschens in einem digitalen Sprachübertragungssystem, bei dem das codierte Sprachsignal während eines aktiven Zeitintervalls übertragen wird, während dem aktive Datenübertragungsblöcke übertragen werden, wobei auf jedes aktive Zeitintervall ein inaktives Zeitintervall folgt, während dem mindestens inaktive Datenübertragungsblöcke übertragen werden, sind bemerkenswert, weil sie darin bestehen beziehungsweise erlauben, beim Senden nach Erfassung eines inaktiven Zeitintervalls:
    • – einen Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung zu erzeugen und zu übertragen, welcher aus einer Gruppe von codierten, das Hintergrundrauschen beschreibenden Parametern besteht, wobei dieser Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung den ersten Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung des inaktiven Zeitintervalls, das auf dieses aktive Zeitintervall folgt, darstellt; und für jeden laufenden inaktiven Datenübertragungsblock, der auf dieses inaktive Zeitintervall folgt:
    • – das Frequenzspektrum dieses laufenden inaktiven Datenübertragungsblocks zu analysieren und zu speichern;
    • – das Frequenzspektrum dieses laufenden inaktiven Datenübertragungsblocks mit einem Bezugsfrequenzspektrum zu vergleichen, und bei Gleichheit des Frequenzspektrums des laufenden Datenübertragungsblocks und des Bezugsfrequenzspektrums:
    • – Aussetzen jeder Übertragung, insbesondere der eines neuen Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung während dieses laufenden inaktiven Datenübertragungsblocks, und wenn das Frequenzspektrum des laufenden Datenübertragungsblocks und das Bezugsfrequenzspektrum nicht gleich sind:
    • – Erzeugung und Übertragung eines neuen Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung während dieses laufenden inaktiven Datenübertragungsblocks, was es gestattet, die Übertragungsleistung des Hintergrundrauschens auf die allein der Datenübertragungsblöcke zur Geräuschlosigkeitsbeschreibung zu verringern, deren Frequenzspektrum sich vom Bezugsfrequenzspektrum unterscheidet, das während des vorhergehenden Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung geschätzt wurde.
  • Das Verfahren und die Vorrichtung, die Gegenstand der vorliegenden Erfindung sind, sind ebenfalls dahingehend bemerkenswert, dass sie beim Empfang in Verbindung mit einem Sprach-Decoder darin bestehen beziehungsweise es erlauben:
    • – die Gruppe der codierten, das Hintergrundrauschen beschreibenden Parameter für jeden aufeinanderfolgenden Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung zu decodieren, um decodierte Parameter zu erzeugen;
    • – das entsprechende Hintergrundrauschen nach Verarbeitung der decodierten Parameter im Bereich des Sprach-Decoders zu synthetisieren.
  • Sie werden beim Lesen der Beschreibung und beim Betrachten der angehängten Zeichnungen besser verstanden werden, bei denen außer 1, die sich auf den Stand der Technik bezieht:
  • 2a erfindungsgemäß anschaulich die Aufeinanderfolge der wesentlichen Schritte darstellt, die den Einsatz des Verfahrens zur Erzeugung eines Hintergrundrauschens beim Senden erlauben;
  • 2b eine bevorzugte Weise zur Erzeugung von Datenübertragungsblöcken zur Geräuschlosigkeitsbeschreibung in Form eines Organigramms darstellt;
  • 2c erfindungsgemäß anschaulich die Aufeinanderfolge der wesentlichen Schritte darstellt, die den Einsatz des Verfahrens zur Erzeugung eines Hintergrundrauschens beim Empfang erlauben;
  • 2d anschaulich die Aufeinanderfolge der wesentlichen Schritte darstellt, die den Einsatz des Verfahrens zur Erzeugung eines Hintergrundrauschens erlauben, für den Fall, dass der Sprachcodierer vom prädiktiven Typ ist, der einen LPC-Filter einsetzt;
  • 2e in Form von funktionellen Blöcken anschaulich das Schema einer Vorrichtung, die beim Senden entsprechend dem Verfahren, das Gegenstand der vorliegenden Erfindung ist, ein Hintergrundrauschen erzeugt;
  • 3a erfindungsgemäß anschaulich ein Schema der Vorrichtung, die beim Senden ein Hintergrundrauschen erzeugt, darstellt, für den spezifischeren Fall, dass der Sprachcodierer vom prädiktiven Typ ist;
  • 3b ein Ausführungsdetail eines Generators von Hintergrundrauschen darstellt, der bei der in 3a dargestellten Vorrichtung zum Einsatz kommt;
  • 3c in Form einen Funktionsorganigramms alle aufeinanderfolgenden Schritte darstellt, die es gestatten, ein Signal mit dem Befehl zum Senden oder ein Signal mit dem Befehl zum Nicht-Senden eines Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung zu erzeugen;
  • 3d in Form einen Funktionsorganigramms alle aufeinanderfolgenden Schritte darstellt, die es gestatten, einen Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung zu erzeugen, zu codieren und zu übertragen;
  • 3e in Form einen Funktionsorganigramms alle aufeinanderfolgenden Schritte darstellt, die es gestatten, ein Auslösesignal entsprechend einer bevorzugen Ausführungsform zu erzeugen;
  • 4a dem Gegenstand der Erfindung entsprechend ein Schema der Vonrrichtung in Form einen Funktionsorganigramms darstellt, die beim Empfang ein Hintergrundrauschen erzeugt;
  • 4b ein Ausführungsdetail des Generators von Hintergrundrauschen darstellt, der bei der in 4a dargestellten Vorrichtung zum Einsatz kommt.
  • Eine genauere Beschreibung des Verfahrens zur Erzeugung eines Hintergrundrauschens entsprechend dem Gegenstand der vorliegenden Erfindung wird nun in Verbindung mit den vorher erwähnten Figuren gegeben.
  • Zuerst und vor der Beschreibung des eigentlichen Verfahrens wird in Verbindung mit 1, die sich auf den Stand der Technik bezieht, daran erinnert, dass eine herkömmliche Vorrichtung zur Erzeugung eines Hintergrundrauschens in einem digitalen Sprachübertragungssystem beim Senden neben einem Sprachcodierer und einem Sprechaktivitätsdetektor DAV einen CNG-Generator umfasst. Die Gruppe ermöglicht es, nach einer der vorher in der Beschreibung beschriebenen Methoden beim Senden periodisch Datenübertragungsblöcke zur Geräuschlosigkeitsbeschreibung oder SID-Datenübertragungsblöcke eigentlich auf einen Übertragungskanal zu übertragen.
  • Beim Empfang ermöglicht es ein Sprach-Decoder, welcher ein prädiktiver Decoder ist, wenn der Sprachcodierer beim Senden ebenfalls ein prädiktiver Codierer ist, die Sprachsignale beziehungsweise SID-Datenübertragungsblöcke zu decodieren, wenn diese übertragen werden, und ermöglicht dank eines CNG-Generators beim Empfang eines entsprechenden Hintergrundrauschens die Erzeugung.
  • Wie unter anderem in 2a dargestellt wurde, wird die digitale Sprachübertragung im diskontinuierlichen Modus gewährleistet, wobei diese Übertragung folglich aus aufeinanderfolgenden aktiven Zeitintervallen besteht, während denen codierte Sprachsignaldatenübertragungsblöcke übertragen werden, die mit inaktiven Zeitintervallen durchsetzt sind, während denen kein Sprachsignaldatenübertragungsblock übertragen wird. Die jeweilige Dauer dieser Zeitintervalle ist beliebig, da die Übertragung asynchron ist.
  • Wie man unter anderen in der vorgenannten 2a beobachten kann, kommt das Verfahren zur Erzeugung eines Hintergrundrauschens, das Gegenstand der vorliegenden Erfindung ist, beim Senden nach Erfassung eines inaktiven Zeitintervalls zum Einsatz. Ein inaktives Zeitintervall kann beispielsweise ausgehend vom Signal, das von einem Sprechaktivitätsdetektor DAV gesendet wird, erfasst werden, welcher mit einer Verweildauer versehen ist, damit der effektive Durchgang während des inaktiven Zeitintervalls sichergestellt ist. Diese Verweildauer kann auch eingestellt werden, um die Dauer des Detektierzeitintervalls, dargestellt in 2a zu berücksichtigen, um den korrekten Einsatz des erfindungsgemäßen Verfahrens zu gewährleisten. In der vorgenannten 2a ist das Detektierzeitintervall durch ein Zeitintervall dargestellt, das durch Punkte entsprechend dem betreffenden aktiven Zeitintervall begrenzt ist.
  • Nach der Erfassung jedes aktiven Zeitintervalls besteht das erfindungsgemäße Verfahren darin, bei Schritt 100 in 2a, ab dem Ende des vorgenannten Detektierzeitintervalls, einen SID-Datenübertragungsblock oder Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung zu erzeugen und zu übertragen. Dieser Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung besteht aus einer Gruppe von Parametern, die codiert sind und das Hintergrundrauschen beschreiben. Dieser Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung stellt in Wirklichkeit den ersten inaktiven Datenübertragungsblock des inaktiven Zeitintervalls dar, das auf das vorher angeführte aktive Zeitintervall und das Detektierzeitintervall folgt.
  • Wie man unter anderem in 2a beobachtet, besteht das erfindungsgemäße Verfahren dann darin, in einem Schritt 101 für jeden laufenden inaktiven Datenübertragungsblock, der auf dieses inaktive Zeitintervall folgt, das Frequenzspektrum dieses betreffenden laufenden inaktiven Datenübertragungsblocks zu analysieren und zu speichern. Das Frequenzspektrum des vorgenannten laufenden inaktiven Datenübertragungsblocks wird dann in einem Schritt 102 mit einem Bezugsfrequenzspektrum verglichen, dessen Erhalt später in der Beschreibung beschrieben werden wird.
  • Bei Gleichheit des Frequenzspektrums und des Bezugsfrequenzspektrums des laufenden Datenübertragungsblocks, wie im vorgenannten Schritt 102 dargestellt, besteht das erfindungsgemäße Verfahren dann darin, entweder jegliche Übertragung auszusetzen, insbesondere die eines neuen Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung, SID-Datenübertragungsblock, oder bei Nicht-Gleichheit des Frequenzspektrums und des Bezugsfrequenzspektrums des laufenden Datenübertragungsblocks in einem Schritt 100, wenn dieser Schritt 100 vollzogen ist, für jeden SID-Datenübertragungsblock nach der gleichen Technik, die für den ersten SID-Datenübertragungsblock benutzt wurde, während dieses laufenden inaktiven Datenübertragungsblocks einen neuen Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung zu erzeugen und zu übertragen. In 2a sei darauf hingewiesen, dass das Übertragungsaussetzen jedes neuen Datenübertragungsblocks bei Gleichheit des Frequenzspektrums und des Bezugsfrequenzspektrums des laufenden Datenübertragungsblocks das Bezugszeichen 104 hat.
  • Allgemein sei darauf hingewiesen, dass das Verfahren, das Gegenstand der vorliegenden Erfindung ist, es ermöglicht, die Übertragungsrate des Hintergrundrauschens auf die allein der Datenübertragungsblöcke zur Geräuschlosigkeitsbeschreibung zu verringern, deren Frequenzspektrum sich von dem des vorhergehenden Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung unterscheidet.
  • Bei einer besonderen Ausführungsform des Verfahrens zur Erzeugung eines Hintergrundrauschens, das Gegenstand der vorliegenden Erfindung ist, sei darauf hingewiesen, dass das Bezugsfrequenzspektrum ausgehend vom Frequenzspektrum der Umgebungsgeräusche erstellt werden kann, das während der Erzeugung jedes Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung erhalten wurde. So ist verständlich, dass das Verfahren, das Gegenstand der vorliegenden Erfindung ist, wie in 2a dargestellt einen Schritt 103 zum Speichern der Umgebungsgeräusche umfassen kann, was es erlaubt, das Bezugsfrequenzspektrum für jeden SID-Datenübertragungsblock zu erhalten.
  • Was die Initialisierung des Verfahrens, das Gegenstand der vorliegenden Erfindung ist, betrifft, sei darauf hingewiesen, dass die Verwendung des Bezugsspektrums für den ersten inaktiven Datenübertragungsblock eines inaktiven Zeitintervalls unnötig ist, da die Beantwortung der Frage über die Entscheidung über das Senden eines Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung in diesem Fall beim Vergleich des Frequenzspektrums des laufenden Datenübertragungsblocks und des Bezugsfrequenzspektrums liegt. Während dieses ersten SID-Datenübertragungsblocks wird das Bezugsspektrum Sfr entweder geschätzt oder vorteilhafter direkt ausgehend vom Bezugsspektrum erhalten, das berechnet wird, um den SID-Datenübertragungsblock zu entwerfen, und wird zur Verarbeitung der folgenden inaktiven Datenübemagungsblöcke gespeichert. Dieses Bezugsspektrum wird bei jedem neuen gesendeten Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung nach der gleichen Methode, wie sie zur Initialisierung des ersten SID-Datenübertragungsblocks während eines inaktiven Zeitintervalls verwendet wird, aktualisert.
  • Das Frequenzspektrum, das für jeden SID-Datenübertragungsblock berechnet wird, und das auch das Bezugsfrequenzspektrum darstellen kann, kann nach der bevorzugten Ausführungform, die nun in Verbindung mit 2b beschrieben wird, geschätzt werden.
  • In der Ausführungsform von 2b besteht das Verfahren, das Gegenstand der vorliegenden Erfindung ist, darin, jeden Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung, SID-Datenübertragungsblock, nach einem besonderen Vorgang zu erstellen, das gewissermaßen erlaubt, jeden SID-Datenübertragungsblock an die Entwicklung der Umgebungsgeräusche anzupassen und somit bestimmte spezifische Elemente dieser Entwicklung für die Erzeugung des Spektrums des SID-Datenübertragungsblocks zu berücksichtigen.
  • Wie in 2b dargestellt wurde, kann der Vorgang zur Erstellung jedes Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung den Schritt umfassen, der darin besteht, das mittlere Frequenzspektrum der aufeinanderfolgenden inaktiven Datenübertragungsblöcke zu bestimmen, um ein mittleres Frequenzspektrum der Vergangenheit SFmp zu bestimmen, wobei dieser Schritt in 2b das Bezugszeichen 1041 hat.
  • In diesem Fall erfüllt das mittlere Frequenzspektrum der Vergangenheit die Gleichung (1):
  • Figure 00090001
  • Bei dieser Gleichung sei darauf hingewiesen, dass für eine Vielzahl von inaktiven aufeinanderfolgenden Datenübertragungsblöcke SF1, Sfi, SFn, die dem inaktiven Datenübertragungsblock, dessen Frequenzspektrum mit SFc bezeichnet ist, vorausgingen, das mittlere Frequenzspektrum der Vergangenheit dem arithmetischen Durchschnitt von den n Frequenzspektren der vorgenannten n aufeinanderfolgenden inaktiven Datenübertragungsblöcke entspricht.
  • Die eigentliche Erzeugung des SID-Datenübertragungsblocks findet dann beim folgenden Schritt 1042 statt.
  • Der vorgenannte Schritt 1042 besteht aus einer Prüfung der Gleichheit des mittleren Frequenzspektrums der Vergangenheit und dem Frequenzspektrum des laufenden inaktiven Datenübertragungsblocks, der durch die Gleichung (2): SFc ≡ SFmp symbolisiert wird.
  • Es sei darauf hingewiesen, dass das Kriterium der Gleichheit nicht einer strengen Gleichheit der verglichenen Frequenzspektren entspricht, wobei ein Gesetz oder ein Kriterium über die Übereinstimmung aufgestellt werden kann. Dieser Schritt erlaubt in Wirklichkeit, eine Messung der lokalen Stationarität des Frequenzspektrums vorzunehmen.
  • Bei Gleichheit der vorgenannten Frequenzspektren besteht das erfindungsgemäße Verfahren darin, bei 1043 das mittlere Spektrum der Vergangenheit als Datenübertragungsblock zu Geräuschlosigkeitsbeschreibung SID auszuwählen, und bei Nicht-Gleichheit der vorher angeführten Frequenzspektren bei einem Schritt 1044 das Frequenzspektrum des entsprechenden laufenden inaktiven Datenübertragungsblocks auszuwählen.
  • Diese Arbeitsweise ermöglicht dann auf besonders vorteilhafte Weise, das Ruhespektrum jedes laufenden inaktiven Datenübertragungsblocks zu schätzen, je nachdem ob ein solcher Datenübertragungsblock entweder zu einem lokal stationären Spektralbereich oder zu einem nicht-stationären Spektralbereich gehört.
  • Natürlich ist die Anzahl n der aufeinanderfolgenden inaktiven Datenübertragungsblöcke, bei denen die Berechnung des mittleren Spektrums der Vergangenheit ..., willkürlich, dieses kann zum Beispiel als gleich genommen werden, um ein Zeitintervall in der Größenordnung von 100 ms zu erhalten. Es sei außerdem darauf hingewiesen, das der so aufgebaute Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung SID vor seiner Übertragung einer Quantifizierung unterzogen wird.
  • Eine genauere Beschreibung des Verfahrens zur Erzeugung eines Hintergrundrauschens in einem digitalen unterbrochenen Sprachübertragungssystem entsprechend dem Gegenstand der vorliegenden Erfindung beim Empfang erfolgt nun in Verbindung mit 2c.
  • Natürlich sei darauf hingewiesen, dass das erfindungsgemäße Verfahren beim Empfang das Senden der SID-Datenübertragungsblöcke entsprechend dem vorher beschriebenen Verfahren erfordert.
  • Mit Bezug auf 2c sei darauf hingewiesen, dass das erfindungsgemäße Verfahren dann darin besteht, für jeden aufeinanderfolgenden Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung die Gruppe der codierten, das Hintergrundrauschen beschreibenden Parameter zu decodieren, um bei einem Schritt 200 decodierte Parameter zu erzeugen, dann im Bereich des Sprach-Decoders nach Verarbeitung der decodierten Parameter die Parameter zu synthetisieren, die dem Sprach-Decoder ermöglichen, bei einem Schritt 201 das entsprechende Hintergrundrauschen zu synthetisieren. Es sei insbesondere darauf hingewiesen, dass die Verarbeitung der decodierten Parameter aus einer zweckentsprechenden spezifischen Recodierung bestehen kann.
  • Allgemein sei darauf hingewiesen, dass das Verfahren zur Erzeugung eines Hintergrundrauschens, das Gegenstand der vorliegenden Erfindung ist, vorteilhafterweise zum Einsatz kommen kann, wenn der beim Senden bzw. beim Empfang verwendete Sprachcodierer und Sprach-Decoder vom prädiktiven Typ sind.
  • In einem solchen Fall wird das decodierte Signal erhalten, indem ein Auslösesignal gefiltert wird, wobei dieses Signal aus Innovationsverzeichnissen stammt und möglicherweise aus einer Langzeitauslösung durch einen LPC-Synthesefilter, der nachher mit LPC-Filter bezeichnet wird.
  • Das Verfahren, das Gegenstand der vorliegenden Erfindung ist, kann dann darin bestehen, ein Auslösesignal zu erzeugen, dessen Spektrum Kennzeichen hat, die denen eines weißen Rauschens ähneln, um einen LPC-Filter anzuregen, der es in Wirklichkeit ermöglicht, das Signal zur Erzeugung des Hintergrundrauschens zu synthetisieren.
  • In einem solchen Fall werden die Parameter, die das Spektrum der Umgebungsgeräusche darstellen, dann für die Umhüllende des Spektrums durch die Koeffizienten des LPC-Filters angegeben und für den Bereich des vorgenannten Spektrums durch die Energie des Auslösesignals.
  • Das Verfahren, das Gegenstand der vorliegenden Erfindung ist, durchläuft beim Senden die wesentlichen Schritte, die bereits in Verbindung mit 2a beschrieben wurden.
  • Ein solches Verfahren wird in Verbindung mit 2d beschrieben und dargestellt, wobei dieselben Schritte dieselben Bezugszeichen umfassen, denen ein Index ' zugewiesen ist, was die Arbeitsschritte betrifft, die sich auf die Übertragung eines Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung beziehen.
  • Der Art des besonderen Einsatzes des erfindungsgemäßen, in 2d dargestellten Verfahrens entsprechend, stellt man fest, dass das eingesetzte Verfahren dann die Entscheidung über Übertragung eines SID-Datenübertragungsblocks oder Nicht-Übertragung eines solchen Datenübertragungsblocks einerseits anhand des Stationaritätskennzeichens des LPC Filters begründet und andererseits anhand des Stationaritätskennzeichens der Auslöseenergie.
  • Nach Übertragung des ersten SID-Datenübertragungsblocks bei Schrit 100' besteht das Verfahren wie in 2d eingesetzt und beschrieben dann darin, den LPC-Filter des laufenden Datenübertragungsblocks Fc durch Speichern des laufenden Filters Fc bei 101' zu vergleichen, dann Vergleich des laufenden Filters Fc mit dem Bezugsfilter Fr bei 102', der während des vorhergehenden SlI-Datenüberrtagungsblocks entsprechend Schritt 103' erhalten und gespeichert wurde.
  • Bei Nicht-Gleichheit der vorgenannten Filter bei Schritt 102' wird bei Schritt 100' ein neuer SID-Datenübertragungsblock übertragen. Die Schritte 100', 101', 102' und 103' sind in Bezug auf die Schritte 100, 101, 102 und 103 von 2a im Wesentlichen unverändert.
  • Wenn im Gegenteil dazu die Filter Fc, die sich auf die laufenden Filter beziehen und die Filter Fr, die sich auf die Bezugsfilter beziehen, identisch sind, besteht das eingesetzte, in 2d dargestellte Verfahren dann darin, die Auslöseenergie des laufenden Datenübertragungsblocks Ec in einem Schritt 104'a zu schätzen und in einem Schritt 104'c die vorgenannte Auslöseenergie Ec des laufenden Datenübertragungsblocks mit der Bezugsenergie Er zu vergleichen, die während des vorhergehenden SID-Datenübertragungsblocks geschätzt wurde. Diese Schätzung wird in 2d in einem Schritt 104'b dargestellt.
  • Für den Fall, dass in Antwort auf die Prüfung bei Schritt 104'c der Vergleich der Auslöseenergie des laufenden Datenübertragungsblocks mit der Bezugsenergie bezeichnend ist, wobei dieser Vergleich aus einem Vergleich der Unterschiedlichkeit dieser Energien bezüglich eines Schwellenwerts E0 bestehen kann, besteht das Verfahren dann darin, einen neuen SID-Datenübertragungsblock durch Rückkehr zum vorher beschriebenen Schritt 100' zu erzeugen und zu übertragen. Wenn im Gegenteil dazu in Antwort auf die Prüfung bei Schritt 104'c der Unterschied zwischen den vorgenannten Auslöseenergien nicht bezeichnend ist, besteht das Verfahren dann darin, jegliche Übertragung eines Datenübertragungsblocks bei Schritt 104'd analog zum Schritt 104d in 2a auszusetzen.
  • Im Rahmen des Einsatzes des Verfahrens wie in 2d dargestellt, das Gegenstand der vorliegenden Erfindung ist, sei darauf hingewiesen, da s zur Gewährleistung des Vergleichs der LPC-Filter Distanzkriterien verwendet werden können, die insbesondere bei den Methoden zur vektoriellen Quantifizierung der LPC-Filter zum Einsatz kommen. Die vorgenannten Distanzen können die ITAKURA-SAITO-Distanz der höchsten Wahrscheinlichkeit sein oder euklidische Distanzen, die anhand von Parametern, die aus den LPC-Koeffizienten hervorgehen, berechnet werden, zum Beispiel Spektrallinienpaare oder log area ratios.
  • Was das Energiestationaritätskennzeichen des Auslösesignals betrifft, wird die Nicht-Linearität der Empfindlichkeit des menschlichen Hörsystems in den Verstärkungsquantifikatoren ausgewertet, die in den Codierern verwendet werden. Daher vergleicht der vorher beschriebene Codiervorgang ausgehend von Indizes zur Quantifizierung dieser Energien bevorzugt die Auslöseenergie des laufenden Datenübertragungsblocks Ec mit der Bezugsenergie Er. Um das Verfahren zu vereinfachen, ist der verwendete Quantifikator derjenige, der zur Berechnung der in den SID-Datenübertragungsblöcken gespeicherten Energie dient.
  • Der Vorgang der Schätzung des LPC-Filters und der Schätzung der Auslöseenergie für die SID-Datenübertragungsblöcke zur Geräuschlosigkeitsbeschreibung werden später in der Beschreibung im Rahmen einer besonderen Ausführungsform einer entsprechenden Vorrichtung zur Erzeugung von Hintergrundrauschen beschrieben werden.
  • Was die Berechnung der Auslösesignale betrifft, kann eine einfache Methode zur Synthese dieses Auslösesignals darin bestehen, aleatorisch ein Signal über die einheitliche Wahrscheinlichkeitsdichte und die gegebene Stärke, die zum Beispiel ausgehend von der übertragenen Energie berechnet wird, zu strecken, da das Verfahren, das Gegenstand der vorliegenden Erfindung ist, ein Auslösesignal erzeugen muss, dessen Spektrum Kennzeichen hat, die denen eines weißen Rauschens ähneln und dessen mittlere Energie diejenige ist, die auf den Decoder übertragen wird.
  • Eine weitere Methode kann darin bestehen, durch aleatorisches Strecken eine Anregung des gleichen Typs wie durch den Sprachcodierer verwendet zu synthetisieren, wobei der Vorteil dieser zweiten Methode in der Möglichkeit besteht, im Empfangsteil ein Modul, das außerhalb des Decoders liegt, zu verwirklichen.
  • Andererseits ist aus einem subjektiven Standpunkt betrachtet das Risiko eines Abbruchs bei den vorhergehenden decodierten Datenübertragungsblock geringer, da die Anregung nicht plötzlich den Typ ändert. Eine originale Ausführungsform der vorgenannten zweiten Methode wird später in der Beschreibung im Rahmen einer besonderen Ausführungsform einer entsprechenden Vorrichtung beschrieben werden.
  • Eine genauere Beschreibung einer Vorrichtung zur Erzeugung eines Hintergrundrauschens in einem digitalen unterbrochenen Sprachübertragungssystem entsprechend dem Gegenstand der vorliegenden Erfindung wird nun in Verbindung mit 2e gegeben, wobei die Vorrichtung natürlich das Verfahren zur Erzeugung eines solchen Hintergrundrauschens wie vorher in der Beschreibung erwähnt einsetzt.
  • Wie in 2e im Besonderen dargestellt, umfasst die vorgenannte Vorrichtung ein Modul 2 zur Erfassung des Endes jedes aktiven Zeitintervalls während eines Erfassungszeitintervalls, das auf jedes aktive Zeitintervall folgt, welches Modul 2 einem Sprachcodierer mit dem Bezugszeichen 1 zugeordnet ist. Es versteht sich zum Beispiel, dass das Modul 2 von einem herkömmlichen Sprechaktivitätsdetektor gebildet sein kann, der mit dem Sprachcodierer 1 zusammengeschaltet ist und ein Logik-Signal VADin liefert, das das Dasein eines aktiven Zeitintervalls repräsentiert, während dem codierte Sprachdatenübertragungsblock übertragen werden, beziehungsweise das Dasein eines nicht-aktiven Zeitintervalls repräsentiert, während dem Datenübertragungsblöcke zur Geräuschlosigkeitsbeschreibung übertragen werden müssen oder es wird im Gegenteil dazu kein Datenübertragungsblock übertragen.
  • Wie in derselben 2e dargestellt, ist außerdem ein CNG-Generator mit dem Bezugszeichen 3 einerseits einem Sprachcodierer 1 und andererseits einem Sprechaktivitätsmodul 2 zugeordnet. Ein Multiplexer 4 empfängt einerseits die codierten Sprachdatenübertragungsblöcke, die vom Sprachcodierer 1 geliefert wurden, und die Signale, die von den Datenübertragungsblöcken zur Geräuschlosigkeitsbeschreibung oder codierten SID-Datenübertragungsblöcken gebildet sind, die vom CNG-Generator 3 geliefert werden, beziehungsweise ein Signal, das repräsentatif für die Art der zu gewährleistenden Übertragung, und das von diesem selben CNG-Generator 3 geliefert wird und das Bezugszeichen VADout hat.
  • Allgemein sei darauf hingewiesen, dass die Vorrichtung wie in 2e dargestellt, die Gegenstand der vorliegenden Erfindung ist, die Grundsätze des in Verbindung mit dem erfindungsgemäßen Verfahren beschriebenen Vorgangs übernimmt. Der CNG-Generator 3 umfasst ein Modul 3a zur Erzeugung und bedingten Übertragung eines Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung während den inaktiven Zeitintervallen, welcher Datenübertragungsblock von einer Gruppe von codierten, das Hintergrundrauschen beschreibenden Parametern gebildet ist, ein Modul 3b zum Analysieren und Speichern des Frequenzspektrums jedes laufenden inaktiven Datenübertragungsblocks, ein Modul 3c zum Vergleichen des Frequenzspektrums des laufenden inaktiven Datenübertragungsblocks mit einem Bezugsfrequenzspektrum, das bei Gleichheit oder Nicht-Gleichheit des Frequenzspektrums des laufenden Datenübertragungsblocks und des Bezugsfrequenzspektrums ein bestimmtes Steuersignal liefert, ein Modul 3d zur Schätzung des Übertragungstyps für den laufenden Datenübertragungsblock, das für jeden Datenübertragungsblock ein dreiwertiges Signal VADout liefert, das die Information aktiver Datenübertragungsblock, nicht-übertragener Datenübertragungsblock beziehungsweise Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung codiert.
  • Dieses Modul 3d empfängt einerseits das vom Modul 2 zur Erfassung der Sprechaktivität produzierte Signal und andererseits das Vergleichssignal, das wie nachher angeführt durch das Modul 3c produziert wird. Wenn der laufende Datenübertragungsblock aktiv ist, sendet das Modul 3d diese Information im Signal VADout wieder. Andernfalls, wenn der laufende Datenübertragungsblock der erste inaktive Datenübertragungsblock des aktiven Zeitintervalls ist, weist das Modul 3d dem Signal VADout den der Information Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung entsprechenden Wert zu und autorisiert so die Übertragung eines neuen Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung. Wenn der laufende Datenübertragungsblock ein inaktiver Datenübertragungsblock ist, aber nicht den ersten inaktiven Datenübertragungsblock eines inaktiven Bereichs bildet, vergleicht das Modul 3c das Frequenzspektrum des laufenden Datenübertragungsblocks mit dem Bezugsfrequenzspektrum, und liefert bei Gleichheit und Nicht-Gleichheit dieser Spektren das Signal CMP, das repräsentatif für die Information nicht-übertragener Datenübertragungsblock beziehungsweise Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung ist. In diesem Fall stellt das Modul 3d im Signal VADout ausgehend vom Signal CMP die Codierung der Information über die Übertragung sicher, die es gestattet, jegliche Übertragung bei Gleichheit des Frequenzspektrums des laufenden Datenübertragungsblocks und des Bezugsfrequenzspektrums auszusetzen und einen neuen Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung bei Nicht-Gleichheit dieser Spektren zu übertragen.
  • Die Module 3a und 3b tauschen mit dem Sprachcodierer eine gewisse Anzahl an Signalen zur Verwaltung des Sprachcodierers Sg aus: eingangs empfangen diese Module die Daten, die die Auswertung der Frequenzspektren des laufenden Datenübertragungsblocks, Modul 3b, und einer gewissen Anzahl von Datenübertragungsblöcken vor dem laufenden Datenübertragungsblock, Modul 3a, erlauben, am Ende überträgt das Modul 3a dem Sprachcodierer gegebenenfalls die Signale, die die Wiederaktualisierung seiner Speicher ermöglicht, um eine Desynchronisation mit dem Sprach-Decoder, der sich beim Empfang befindet, zu vermeiden.
  • Eingangs empfängt das Modul 3a auch das Frequenzspektrum des laufenden Datenübertragungsblocks, das durch das Modul 3b erzeugt wurde, Signal SFc.
  • Eine genauere Beschreibung einer Vorrichtung zur Erzeugung eines Hintergrundrauschens wird nun in Verbindung mit 3a für den besonders vorteilhaften Fall gegeben, dass der Sprachcodierer 1 ein prädiktiver Sprachcodierer ist, der für jeden Sprachdatenübertragungsblock ein Analysiermodul LPC mit der Analysierordnung M umfasst, wobei die Analysierordnung ausgehend von der Anzahl der Koeffizienten des LPC-Filters festgelegt wird, der insbesondere die (M + 1) Koeffizienten der Autokorrelationsfunktion Acf des Sprachsignals produziert, wobei die M Parameter, die für den LPC-Filter des Datenübertragungsblocks Lpc repräsentativ sind, mittels einer prädiktiven Codiermethode codiert werden, die für jeden Datenübertragungsblock die Parameter Lpc der vorhergehenden Datenübertragungsblock benutzt. Die prädiktive Codierung der Parameter Lpc ist für die Arbeitsweise der vorliegenden Erfindung nicht notwendig, hat jedoch Auswirkungen auf deren Aufbau. Für den Fall, dass ein Codierer die prädiktive Codierung der Parameter Lpc nicht verwendet, kann die Vorrichtung einfach vereinfacht werden.
  • Der Sprachcodierer 1 erstellt und speichert mit Hilfe von Techniken der Analyse durch Synthese ein Auslösesignal, im Folgenden Exc bezeichnet, das identisch mit dem vom Decoder berechneten ist, um den Synthesefilter LPC anzuregen.
  • 3a übernimmt die allgemeine Bauart der vorher in 2e dargestellten Vorrichtung. Der CNG-Generator 3 empfängt vom Sprachcodierer 1 vom prädiktiven Typ die Autokorrelationsfuntion Acf des Sprachsignals, die Parameter Lpc des vorhergehenden Datenübertragungsblocks und gegebenenfalls eine gewisse Anzahl von Mustern des Auslösesignals Exc (n), die teilweise das Auslösesignal Exc ausmachen, die von den vorhergehenden Datenübertragungsblock abgeleitet wurden. Es sei darauf hingewiesen, dass die Einführung der vorgenannten Muster abhängig von der Verwendung der Langzeitanregung des prädiktiven Codierers für die Synthese des Hintergrundrauschens ist.
  • Eine genauere Beschreibung des CNG-Generators 3, der entsprechend dem Gegenstand der vorliegenden Erfindung eingesetzt wird, wird nun in Zusammenhang mit 3b gegeben. Diese Ausführungsart entspricht dem Fall, dass der Sprachcodierer ein Sprachcodierer des prädiktiven Typs ist.
  • Wie in 3b zu beobachteten ist, umfassen die Vorrichtung, die Gegenstand der vorliegenden Erfindung ist, und der CNG-Generator 3 ein Modul 30 zur Berechnung für die Parameter bezüglich des laufenden Datenübertragungsblocks Pc, welches das Autokorrelationssignal des Sprachsignals Acf empfängt und ausgangs die Signale produziert, die den Paramtern des laufenden Datenübertragungsblocks Pc entsprechen. Diese Parameter umfassen den laufenden Filter Fc und die laufende Auslöseenergie Ec.
  • Der CNG-Generator 3 umfasst auch wie in 3b dargestellt, ein Modul 31 zur Entscheidung über das Senden oder das Nicht-Senden eines codierten Sprachdatenübertragungsblocks oder eines Datenübertragungsblocks zu Geräuschlosigkeitsbeschreibung oder über das Nicht-Senden, welches das Sprechaktivitätssignal VADin und die Parameter bezüglich des laufenden Datenübertragungsblocks Pc als auch die Bezugsparameter Pr empfängt, die von einem Modul 32 geliefert werden, das später beschrieben werden wird. Dieses Modul 31 liefert ein dreiwertiges Übertragungssignal, das mit VADout bezeichnet ist, wobei ein erster Wert VADout = 0 einem absoluten Nichtvorhandensein eines Sendens während einem laufenden inaktiven Datenübertragungsblock entspricht, das heißt für das Signal VADout = 0, welches vom Spreachaktivitätserfassungsmodul 2 geliefert wird, ein zweiter Wert VADout = 1 dem Senden eines codierten Sprachdatenübertragungsblocks bei einem aktiven Datenübertragungsblock entspricht, das heißt für VADin = 1, und ein dritter Wert VADout = 2 dem Senden eines SID-Datenübertragungsblocks bei einem inaktiven Datenübertragungsblock, das heißt für VADin = 0.
  • Der CNG-Generator 3 umfasst auch ein Modul 32, das für das Eingangssignal VADout bedingt die Signale berechnet, die den Bezugsparametern Pr entsprechen, die für jeden SID-Datenübertragungsblock berechnet werden. Diese Parameter umfassen den Bezugsfilter Fr und die Bezugsauslöseenergie Er. Dieses Modul empfängt eingangs die Autokorrelationssignale Acf und die Parameter des laufenden Datenübertragungsblocks Pc.
  • Der CNG-Generator 3 umfasst weiter ein Modul 33 zur Erzeugung von codierten Datenübertragungsblöcken zur Geräuschlosigkeitsbeschreibung, das das Übertragungssignal VADout, die Signale, die den Bezugsparametern Pr entsprechen, empfängt, und das bedingt ein codiertes Signal des Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung liefert.
  • Der CNG-Generator 3 umfasst weiter ein Modul 34 zur Erzeugung eines Auslösesignals Exc, das das Übertragungssignal VADout, die den Bezugsparametern Pr entsprechenden Signale und gegebenenfalls der gewählten Methode entsprechend eine gewisse Anzahl von vergangenen Mustern Expas des Auslösesignals empfängt, die von dem Sprachcodierer geliefert werden. Dieses Modul liefert dem Signal VADout bedingt ein Auslösesignal für den laufenden Datenübertragungsblock Exc.
  • Der CNG-Generator 3 umfasst schließlich ein Modul 35 zur Erzeugung eines die wieder aktualisierten Filterparameter Lpc beschreibenden Signals, welches Modul das Übertragungssignal VADout, die den Bezugsparametern Pr entsprechenden Signale und das die Parameter Lpc der vorhergehenden Datenübertragungsblöcke beschreibende Signal empfängt, das von dem Sprachcodierer 1 geliefert wird, und das VADout bedingt dieses Signal für den laufenden Datenübertragungsblock Lpcr wieder aktualisiert.
  • Das CNG-Generatormodul 3 arbeitet wie folgt:
    Eingangs empfängt der CNG-Generator 3 die Information VADin inaktiver Datenübertragungsblock 0, aktiver Datenübertragungsblock 1, die vom Sprechaktivitätserfassungsmodul 2 geliefert werden. Es empfängt auch das Sprachcodiermodul 1 und für jeden Datenübertragungsblock:
    • – das Autokorrelationssignal des Sprachsignals des laufenden Datenübertragungsblocks Acf,
    • – das die Parameter Lpc beschreibende Signal, welche Parameter sich mindestens auf den vorhergehenden Datenübertragungsblock beziehen, wobei dieses Signal das Bezugszeichen Lpc hat und den Parametern Lpc wenigstens des vorhergehenden Datenübertragungsblocks des Codieren 1 entspricht, welche Parameter vom prädiktiven Quantifikator des Sprachcodierers verwendet werden,
    • – gegebenenfalls das Auslösesignal der Vergangenheit.
  • Das CNG-Generatormodul 3 produziert am Ende für jeden Datenübertragungsblock das vorher erwähnte dreiwertige Übertragungssignal VADout.
  • Für die SID-Datenübertragungsblöcke zur Geräuschlosigkeitsbeschreibung produziert der CNG-Generator 3 außerdem die Parameter zur Zwischenschaltung von codierten Ruhen, die Bestandteile der SID-Datenübertragungsblöcke sind.
  • Für die inaktiven Datenübertragungsblöcke, das heißt wie das Aktivitätssignal, das vom Sprechaktivitätsmodul geliefert wird, wenn dieses gleich 0 ist, liefert der CNG-Generator 3 gegebenenfalls weiterhin ein Signal zur Anregung des laufenden Datenübertragungsblocks Exc und das Signal Lpcr der wieder aktualisierten Parameter Lpc.
  • Die gesamte Arbeitsweise des CNG-Generators 3 kann auf folgende Weise zusammengefasst werden:
    • – wenn das Signal VADin gleich 1 ist, ist der Datenübertragungsblock aktiv und der CNG-Generator 3 schließt diese Information lediglich in VADout = 1 ein;
    • – andernfalls wertet das Modul 30 zunächst die ersten Parameter bezüglich des laufenden Datenübertragungsblocks Pc aus.
  • Anschließend entscheidet das Modul 31, ob der Datenübertragungsblock nicht übertragen werden darf oder ob er einen zu übertragenden SID-Datenübertragungsblock bildet:
    • – wenn der laufende Datenübertragungsblock der erste inaktive Datenübertragungsblock nach einem aktiven Zeitintervall ist, dann ist es ein SID-Datenübertragungsblock,
    • – andernfalls verwendet das Modul 31 die Bezugsparameter Pr, die von dem Modul 32 zur Berechnung der Bezugsparameter beim vorhergehenden SID-Datenübertragungsblock erzeugt wurden und legt fest, ob der laufende Datenübertragungsblock ein SID-Datenübertragungsblock ist.
  • Wenn der laufende Datenübertragungsblock ein SID-Datenübertragungsblock ist, dann gilt VADout = 2, andernfalls VADout = 0.
  • Wenn der laufende Datenübertragungsblock ein SID-Datenübertragungsblock ist, codiert das Modul 33 die Parameter des SID-Datenübertragungsblocks.
  • Bei den beiden vorausgehenden Fällen, das heißt für VADout = 0 oder 2, erzeugt das Modul 34 das Auslösesignal bezüglich des laufenden Datenübertragungsblocks Exc und aktualisiert es dann, und das Modul 35 aktualisiert das die Parameter Lpc repräsentierende Signal.
  • Eine genauere Beschreibung der Arbeitsweise des Moduls 31 zur Entscheidung über das Senden oder das Nicht-Senden eines codierten Sprachdatenübertragungsblocks oder eines SID-Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung wird nun in Verbindung mit 3c gegeben.
  • Eine Prüfung 1020 des Signals VADin bezüglich des vorausgehenden Datenübertragungsblocks, indiziert t – 1, um zu bestimmen, ob der laufende Datenübertragungsblock der erste inaktive Datenübertragungsblock, nämlich VADin(t – 1) = 1 für VADin(t) = 0, ist, führt bei 1021 zur Erzeugung eines Signals VADout = 2, das heißt die Entscheidung für das Senden eines SID-Datenübertragungsblocks.
  • Im Gegensatz dazu bei negativer Antwort auf die Prüfung 1020, nämlich wenn VADin(t – 1) = 0, wobei der vorhergehende Datenübertragungsblock inaktiv ist, wird der LPC-Filter bezüglich des laufenden Datenübertragungsblocks bei Schritt 1022 ausgehend von der Gleichung (3) berechnet:
  • Figure 00200001
  • Bei dieser Gleichung sei darauf hingewiesen, dass die Koeffizienten at(i) die Koeffizienten des LPC-Filters bezeichnen, die ausgehend von den Autokorrelationskoeffizienten des vorher erwähnten Autokorrelationssignals Acf berechnet werden, wobei i den Index für jeden Koeffizienten bezeichnet.
  • Der Wert des Filters wird mit einem Bezugsfilter der Übertragungsfunktion Aref(z) verglichen, der während eines vorhergehenden SID-Datenübertragungsblocks gespeichert wurde, wie vorher in der Beschreibung mit Bezug auf den Einsatz des erfindungsgemäßen Verfahrens beschrieben wurde. Dieser Vergleich kann mit Hilfe der vorgenannten Itakuro-Saito-Distanz vorgenommen werden. Diese Distanz wird mit einem Schwellenwert verglichen, was es erlaubt, die Notwendigkeit der Berechnung eines Logarithmus' zu vermeiden und was es erlaubt, keine Division durchführen zu müssen, wobei der Vergleich mit dem Schwellenwert entsprechend der folgenden Gleichung (4) geschieht:
    Figure 00210001
    (Seuill = Schwellenwert, Anm. d. Übs) In der vorgenannten Gleichung bezeichnet Errt die LPC-Abfallenergie für den laufenden Datenübertragungsblock, Summe der Quadrate des LPCRestsignals, wobei diese Abfallenergie in dem Verfahren zur Berechnung des Filters durch die Levinson/Durbin-Methode erhalten werden kann, RAref bezeichnet eine von der Autokorrelation der Koeffizienten des Bezugsfilters Aref (z) abgeleitete Funktion, die die Gleichung (5) erfüllt:
  • Figure 00210002
  • Wenn die Gleichung (4) nicht gleich ist, wird der LPC-Filter nicht als dem Bezugsfilter ähnlich betrachtet, der laufende Datenübertragungsblock wird dann als neuer SID-Datenübertragungsblock festgelegt, VADout = 2.
  • Andernfalls: beim gleichen Schritt 1022 wird die Auslöseenergie des laufenden Datenübertragungsblocks ausgehend von der LPC-Abfallenergie Errt geschätzt. Um mit der Schätzung der laufenden Auslöseenergie Et fortzufahren, wird die LPC-Abfallenergie Errt mit einem Faktor CE multipliziert, der durch Lernen geschätzt wird. Anschließend wird das Mittel dieser Energien von m Datenübertragungsblöcken berechnet, wobei m zum Beispiel ein Ganzes ist, das einem Zeitintervall von 100 bis 200 ms entspricht, und es wird mit einer Quantifizierungsoperation Q(.), entsprechend der Gleichung (6) fortgefahren:
    Figure 00220001
    bei der i(t) den Quantifizierungsindex der mittleren Energie der m aufeinanderfolgenden Datenübertragungsblöcke bezeichnet, die den laufenden Datenübertragungsblock umfassen, wobei diese Operation in einem Schritt 1023 in 3c durchgeführt wird.
  • Es sei darauf hingewiesen, dass die Anzahl m der vorgenannten Datenübertragungsblöcke am Beginn jedes inaktiven Bereichs mit 1 initialisiert wird, dann kann sie bei jedem Datenübertragungsblock bis zu einem bestimmten Maximalwert inkrementiert werden.
  • Auf die vorgenannte Operation 1023 folgt dann eine Operation 1024, die darin besteht, den LPC-Filter des laufenden Datenübertragungsblocks mit dem Bezugsfilter Aref(z) wie vorher erwähnt zu vergleichen. Bei positiver Antwort auf die vorgenannte Prüfung 1024, wird das Signal VADout bei Schritt 1027 bei 2 positioniert und so die Übertragung eines SID-Datenübertragungsblocks autorisiert. Bei negativer Antwort auf die Prüfung 1024 wird eine Prüfung 1025 vorgenommen, wobei diese Prüfung 1025 aus einer Prüfung der quantifizierten Werte des Mittels der bei der vorhergehenden Gleichung (6) erhaltenen Energien besteht, wobei der Quantifizierungsindex für den laufenden Datenübertragungsblock i(t) mit dem des Bezugsdatenübertragungsblocks verglichen wird, der beim vorhergehenden SID-Datenübertragungsblock iref erhalten wird, entsprechend der Gleichung (7): |i(t) – iref| > Schwellenwert 2.
  • Bei positiver Antwort auf die Prüfung 1025, wobei die Nicht-Gleichheit überprüft wird, hat sich der Wert der Auslöseenergie verändert und der laufende Datenübertragungsblock wird dann als SID-Datenübertragungsblock festgelegt.
  • Bei negativer Antwort auf die Prüfung 1025 wird der laufende Datenübertragungsblock als nicht übertragener Ruhedatenübertragungsblock 1026 festgelegt, wobei das Signal VADout gleich 0 ist.
  • Eine genauere Beschreibung der Arbeitsweise des Moduls 31 zur Erzeugung des Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung, codierter SID-Datenübertragungsblock, wird nun in Verbindung mit 3d gegeben.
  • Allgemein sei darauf hingewiesen, dass bei der Codierung eines SID-Datenübertragungsblocks ein neuer Bezugsfilter Aref(z) berechnet wird.
  • An erster Stelle wird zur Ausführung dieses Arbeitsschrittes ein mittlerer LPC-Filter der Vergangenheit, dessen Übertragungsfunktion mit Apast(z) bezeichnet ist, bei Schritt 110 entsprechend der Gleichung (8) ausgewertet:
  • Figure 00230001
  • Dieser Filter wird ausgehend von der Summe der Autokorrelationen des Signals, vorher Acf genannt, der p1 den laufenden Datenübertragungsblock vorausgehenden Datenübertragungsblock berechnet. Die Autokorrelation RApast der Koeffizienten dieses Filters wird dann entsprechend der Methode, die durch die vorgenannte Gleichung (5) gegeben wird, berechnet.
  • Eine Prüfung der Messung der lokalen Stationarität wird dann bei 1101 auf ähnliche Weise wie die Prüfung 1024 vorgenommen, die in Bezug auf 3c entsprechend der vorher erwähnten Gleichung (2) beschrieben wird. Der Schwellenwert für die Prüfung 1101 ist ein besonderer Wert gleich dem Schwellenwert. Bei positiver Antwort auf die vorgenannte Prüfung 1101 erlaubt es der Schritt 1103, den laufenden Filter als Bezugsfilter entsprechend der Gleichung Aref(z) = At(z) auszuwählen, und die neue Autokorrelationsfunktion des Bezugsfilters RAref wird dann berechnet.
  • Bei negativer Antwort auf die Prüfung 1101, wird der mittlere Filter der Vergangenheit als Bezugsfilter entsprechend der Gleichung Aref(z) = Apast(z), und die Autokorrelationsfunktion der Koeffizienten des Bezugsfilters wird entsprechend der Gleichung (9) wieder aktualisiert: RAref(i) = RApast(i), i = 0 → M
  • Ein Quantifizierungsschritt 1104 wird dann bei den Parametern ausgeführt, die den vorher ausgewählten Bezugsfilter 1104 darstellen, wobei die Quantifizierung entsprechend dem vom Codierer verwendeten Verfahren erfolgt, und wobei der so erhaltene Code in den codierten SID-Datenübertragungsblock zwischengeschaltet wird.
  • In einem Schritt 1105 wird die bei 1023 bereits berechnete und quantifizierte Auslöseenergie i(t) in den entsprechenden SID-Datenübertragungsblock zwischengeschaltet und als Bezugsenergie iref gespeichert.
  • Was die Synthese des Auslösesignals betrifft, so sei darauf hingewiesen, dass, während iref den Quantifizierungsindex der Bezugsenergie bezeichnet, gref die zurückkgegebene Verstärkung bezeichnet, die gleich der Quadratwurzel der mittleren Energie pro Muster ist, erhalten durch die Gleichung:
    Figure 00240001
    wobei Q–1 die inverse Quantifizierung darstellt.
  • Die Verstärkung gt des laufenden Datenübertragungsblocks wird dann gegeben durch:
    • – gt = gref am Anfang eines inaktiven Zeitintervalls,
    • – gt = α × gt–1 + (1 – α) × gref bei einem inaktiven Zeitintervall.
  • In dieser Gleichung ist α ein echter Koeffizient zwischen 0 und 1.
  • Bei einer ersten, vorher in der Beschreibung erwähnten Methode bezüglich des Einsatzes des Verfahrens, das Gegenstand der vorliegenden Erfindung ist, kann das Auslösesignal durch aleatorisches Strecken von Mustern synthetisiert werden. In diesem Fall sei darauf hingewiesen, dass die N Muster zur Anregung eines Datenübertragungsblocks mit Hilfe eines aleatorischen Generators mit einheitlichem Gesetz im Intervall [–gt × √3, gt × √3] gestreckt werden können.
  • Eine zweite Methode zur Synthese des Auslösesignals besteht darin, aleatorisch die Codes der Parameter zu strecken, die kennzeichnend für das Auslösesignal Exc sind, und diese Codes direkt zum Decoder zu schicken. Diese Methode weist den Vorteil auf, eine autonome Anordnung des Generators von Hintergrundrauschen beim Decoder zu erlauben und vermeidet mögliche Unterbrechungen beim Auslösesignal während des Umschaltens zwischen den aktiven Datenübertragungsblöcken und dem Hintergrundrauschen. Die Codes der Anregungsparameter müssen abgestimmt werden, damit die decodierte Auslöseenergie für den laufenden Datenübertragungsblock der gewünschten Energie entspricht, nämlich Ngt 2, wobei gt 2 der mittleren Energie pro Muster entspricht und Ngt 2 die für die Muster, die Bestandteile dieses Datenübertragungsblocks sind, zu erhaltende Energie bezeichnet.
  • Wenn die Sprachcodierer eine Langzeitvorhersage benutzen oder auf ähnliche Weise ein adaptives Verzeichnis, das die Muster der vergangenen Anregung verwendet, ist es am einfachsten, diese Anregung zu unterdrücken, indem die kleinste quantifizierte Verstärkung der LTP-Anregung, langfristig prädiktive Anregung, ausgewählt wird, wobei die Verstärkung im Allgemeinen Null oder fast Null ist. Die hervorgerufene Anregung wird dann praktisch auf die Innovation reduziert, deren Energie leicht kontrollierbar ist. Bei vielen Sprachcodierern jedoch führt die Unterdrückung der langfristigen Anregung zu einer spektral armen Anregung, deren Kennzeichen nicht die eines weißen Rauschens sind, und die Qualität des Hintergrundrauschens, das vom Decoder synthetisiert wird, ist davon geprägt.
  • Eine besonders vorteilhafte Methode, die es erlaubt, die LTP-Anregung zu verwenden und die Verstärkung der Gesamtanregung, die erhalten wird durch Addition der LTP-Anregung und einer Innovation, zu kontrollieren, wird nun in Verbindung mit 3b beschrieben.
  • Zunächst sei festgehalten, dass nach dieser Methode der Sprachcodierer dem CNG-Modul 3 eine gewisse Anzahl von Mustern des Auslösesignals Excpas, die von den vergangenen Datenübertragungsblöcken hervorgebracht werden, senden muss, welches Signal in 3b punktiert dargestellt ist.
  • Bei dieser Ausführungsform, wird der Datenübertragungsblock mit N Mustern in N/L Blöcke zu L Mustern geteilt, anhand derer die Auslöseparameter berechnet und codiert werden. Entsprechend den Anforderungen des Sprachcodierers können diese Blöcke unterteilt werden, wobei das Zeitintervall zur Berechnung der Codes nicht unbedingt dem der Innovation entspricht.
  • In 3e erlaubt es der Schritt 1201, die Zählvariable j bezüglich der Vollständigkeit eines Blocks mit N/L Mustern bei 0 zu initialisieren.
  • Das Auslösesignal Exc, das von den Mustern Exc(n) mit n = 0 bis N – 1 gebildet ist, wird für den laufenden Datenübertragungsblock als lineare Kombination einer Anregung mit langfristiger Vorhersagung eLTP(n) und einer innovativen Anregung β u(n) festgelegt, wobei u(n) die Form der innovativen Welle und β ihre Verstärkung nach der Dequantifizierung bezeichnet, welche Verstärkung man versucht, für jeden Block anzupassen, um die so erzeugte Auslöseenergie zu kontrollieren.
  • Für jeden Indexblock j werden die Codes der Parameter der langfristigen Anregung in einem Schritt 1202 aleatorisch gestreckt. Eine Bedingung für den Code über die langfristige Verstärkung der Anregung ist zu bevorzugen, um deren Energie zu begrenzen. Man erhält dann L Muster des Signals eLTP(n) mit n = jL + k, wobei k zwischen 0 bis L – 1 variiert, anhand des Blocks, indem man die Muster des Signals der Vergangenheit Excpas verwendet, das vom Sprachcodierer geliefert wurde.
  • Das Auslösesignal der Innovation wird dann in einem Schritt 1203 durch aleatorisches Strecken des Codes über die Form der Welle der Innovation erhalten. Man erhält dann die L Muster der Wellenform u(n) mit n = jL + k, wobei k zwischen 0 bis L – 1 variiert, anhand des Blocks.
  • Der Schritt 1204 erlaubt es, den Quantifizierungsindex ind der Verstärkung der Anregung der Innovation zu suchen und somit durch Dequantifizierung die zugeordnete Verstärkung β. Man wählt den Index aus, der es erlaubt, anhand des Blocks die mittlere Energie pro Muster zu erhalten, die dem gewünschten Wert gt 2 am nähesten kommt, nach der Gleichung (10):
    Figure 00260001
    wobei die Verstärkung β die Gruppe der Werte zur Wiederherstellung des Verstärkungsquantifikators der Anregung der Innovation durchläuft.
  • Eine Variante der vorliegenden Methode für den Fall, dass die Verstärkungen der langfristigen Anregung und der Anregung der Innovation gemeinsam durch einen vektoriellen Quantifikator quantifiziert werden, ist die Folgende: bei Schritt 1202 wird die Anregung eLTP(n) durch aleatorisches Strecken der Codes, die die LTP-Verzögerung darstellen vor eine Verstärkung gleich 1 erhalten. Die Gleichung (10) wird dann in (11) geändert:
    Figure 00270001
    wobei die dequantifizierten Verstärkungen β1, β2 zusammen durch Abfrage des Verzeichnisses des vektoriellen Quantifikators ausgewählt werden.
  • Auf den Schritt 1204 folgt ein Schritt 1205, bei dem das Auslösesignal Exc durch Berechnung von Exc für die Muster des laufenden Blocks auktualisiert wird.
  • Eine Inkrementierung der Zählvariablen j in einem Schritt 1206 gefolgt von einer Prüfung des Wertes dieser Variablen bei 1207 erlaubt es, das Auslösesignal für alle Muster eines Datenübertragungsblocks komplettierend zu erhalten.
  • Eine genauere Beschreibung der Vorrichtung zur Erzeugung eines Hintergrundrauschens in einem digitalen unterbrochenen Sprachübertragungssystem im Bereich des Empfanges wird nun in Verbindung mit den 4a und 4b gegeben.
  • Wie in 4a dargestellt wurde, sei darauf hingewiesen, dass die Empfangsvorrichtung ein Modul 5 zur Decodierung des Hintergrundrauschens oder, besonders, der Gruppe der codierten, dieses Hintergrundrauschen beschreibenden Parametern in jedem aufeinanderfolgenden Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung.
  • Das Modul 5 ist einem eigentlichen Sprach-Decoder zugeordnet und es empfängt die mit VAD bezeichnete Informationen bezüglich des Typs des durch dieses Modul 5 verarbeiteten laufenden Datenübertragungsblocks, wobei diese Information die Information des dreiwertigen, beim Senden erzeugten Signals VADout reproduziert, sowie natürlich die Datenübertragungsblöcke zur Geräuschlosigkeitsbeschreibung oder SID-Datenübertragungsblöcke. Es empfängt außerdem ein Verwaltungssignal Sg vom Sprach-Decoder, das die Synchronisation mit dem Decoder sicherstellt.
  • Das Modul 5 erlaubt es, das Hintergrundrauschen beschreibende Parameter PBc bezüglich des laufenden Datenübertragungsblocks zu erzeugen.
  • Der Sprachsignal-Decoder empfängt einerseits die codierten Sprachdatenübertragungsblöcke und andererseits das die Parameter des Hintergrundrauschens PBc beschreibende Signal bezüglich des laufenden Datenübertragungsblocks. Es liefert durch Synthese ein synthetisiertes Sprachsignal, das in der vorgenannten Figur mit dem Begriff decodiertes Signal bezeichnet wurde.
  • Das in 4a dargestellte Modul 5 wird nun genauer in Verbindung mit 4b für den Fall beschrieben, in dem der Sprachsignal-Decoder von einem prädiktiven Decoder gebildet ist. Das Decodiermodul 5 umfasst wenigstens einen Demultiplexer 50, der das übertragene Signal des codierten Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung empfängt und ein codiertes, die LPC-Parameter beschreibendes Signal liefert, wobei dieses Signal bezüglich des laufenden Datenübertragungsblocks in 4b mit Lpc bezeichnet ist, sowie ein Signal iref über den quantifizierten Verstärkungsindex, welches das synthetisierte Auslösesignal beschreibt. Diese Parameter werden bis zum nächsten Datenübertragungsblock verwendet.
  • Außerdem ist ein Dequantifikatormodul 51 vorgesehen, welches ein Signal über den vorgenannten quantifizierten Verstärkungsindex empfängt und ein dequantifiziertes Verstärkungssignal gref sendet.
  • Ein Rechenmodul 52 ist vorgesehen, welches das codierte, die LPC-Filterparameter bezüglich des laufenden Datenübertragungsblocks Lpcc beschreibende Signal empfängt, das die LPC-Filterparameter bezüglich mindestens des vorausgehenden Datenübertragungsblocks Lpc beschreibende Signal und die Datenübertragungsblockübertragungsinformation VAD. Das Rechenmodul 52 liefert dann das aktualisierte LPC-Signal mit den LPC-Parametern des laufenden Datenübertragungsblocks.
  • Schließlich ist ein Auslöseerzeugungsmodul vorgesehen, welches das dequantifizierte Verstärkungssignal gref empfängt, gegebenenfalls das Auslösesignal der Vergangenheit und die Datenübertragungsblockinformation VAD, und das Auslösesignal bezüglich des laufenden Datenübertragungsblocks Exc liefert.
  • Das Decodiermodul 5 funktioniert nur, wenn die Datenübertragungsblöcke nicht aktiv sind.
  • Eingangs empfängt es die von dem Signal VAD 0 gegebene Information 0:
    Datenübertragungsblock nicht übertragen, 2: SID-Datenübertragungsblock und im Falle eines SID-Datenübertragungsblocks die codierten Parameter des Datenübertragungsblocks. Der Sprachdecoder liefert andererseits die folgenden Daten:
    • – die LPC-Parameter bezüglich wenigstens des vorhergehenden Datenübertragungsblock , die von dem prädiktiven Quantifikator verwendet werden, wobei das Signal bezüglich dieser LPC-Parameter des vorhergehenden Datenübertragungsblocks mit Lpc bezeichnet werden;
    • – das Auslösesignal der Vergangenheit Expas, Speicher des langfristigen Voraussagers.
  • Am Ende produziert das Decodermodul 5 für jeden Datenübertragungsblock die N neuen Muster des Auslösesignals Exc und nach Dequantifizierung neue LPC-Parameter, genannt Lpc.
  • Der Sprach-Decoder verwendet diese Daten, um die inaktiven Datenübertragungsblöcke zu synthetisieren.
  • Wenn das Signal VAD = 2 ist, werden die Parameter des SID-Datenübertragungsblocks, Lpc und iref für die quantifizierte Energie, decodiert und gespeichert. Mit Lpcref und gref werden die in diesem Schritt gespeicherten Parameter genannt.
  • Wenn VAD = 0 ist, berechnet das Rechenmodul 52 eine neue Gruppe von LPC-Parametern, indem Lpcref quantifiziert und dequantifiziert wird, indem die Parameter Lpc der Vergangenheit verwendet werden, die vom Decoder geliefert werden, wobei sich die dequantifizierte Verstärkung gref nicht verändert und die relative Verstärkung bezüglich des laufenden Datenübertragungsblocks gt nach der vorher in der Beschreibung erwähnten Gleichung aktualisiert wird.
  • In den beiden Fällen berechnet das Rechenmodul 53 die neue Anregung Exc bezüglich des laufenden Datenübertragungsblocks nach einer der vorher in der Beschreibung beschriebenen Methoden und überträgt sie auf den Sprach-Decoder, welcher das decodierte Signal der inaktiven Datenübertragungsblöcke synthetisiert.
  • Es sei angemerkt, dass das Modul 5 zum Decodieren des Hintergrundrauschens völlig autonom gemacht werden kann und von außerhalb in den Decoder eingesetzt werden kann. In diesem Fall sind die verwendeten Vorgänge die gleichen, die eine Übertragung gewisser elementarer Funktionen des Decoders in diesem Modul einsetzen.
  • Schließlich waren in einer besonderen Ausführungsform die bevorzugten Werte der vorher in der Beschreibung erwähnten Parameter für einen Datenübertragungsblock N = 240 Muster, die bei einer Frequenz von 8 kHz entnommen wurden, die folgenden:
  • Figure 00300001
  • Der Korrekturfaktor CE und die vorhergehenden Werte wurden für den prädiktiven Codierer G 723 angepasst, der durch die ITU (Internationale Fernmeldeunion, Anm d. Übs.) genormt wurde, und ein prädiktiver Codierer für das Bildfernsprechen RTC ist.
  • Es wurde somit ein Verfahren und eine Vorrichtung zur Erzeugung eines Hintergrundrauschens in einem besonders leistungsfähigen digitalen unterbrochenen Sprachübertragungssystem beschrieben.
  • Das Verfahren und die Vorrichtung, die Gegenstand der Erfindung sind, sind insoweit besonders vorteilhaft, als ein Vorgang zur Aktualisierung der Parameter, die zur Reproduktion des Rauschens verwendet werden, wenn sich dessen Kennzeichen geändert haben, verwirklicht wurde, der sich auf eine Analyse des Signals während den inaktiven Zeitintervallen stützt. Das Senden von SID-Datenübertragungsblöcken ist nicht auf den ersten inaktiven Datenübertragungsblock begrenzt, und reproduziert nicht periodisch, sondern geregelt/gesteuert von der Vorrichtung selbst, was es erlaubt, eine gute Qualität des Hintergrundrauschens zu gewährleisten, während das Volumen der zu übertragenden Daten minimiert wird.
  • Sie sind bemerkenswert, da sie zur Bestimmung der Parameter, die es erlauben, die SID-Datenübertragungsblöcke zu bilden, eine effiziente Methode einsetzen, die die Stationarität oder die Nicht-Stationarität der Umgebungsgeräusche berücksichtigt, was eine Entwicklung dieser Umgebungsgeräusche herstellt.
  • In dem besonderen Fall, dass eine Vorrichtung einem prädiktiven Sprachcodierer zugeordnet ist, um die Energiestationarität zu schätzen, vergleicht das Verfahren, das Gegenstand der vorliegenden Erfindung ist, die Energien des quantifizierten Auslösesignals, was es erlaubt, auf einfache Weise einen Teil der Wahrnehmungseigenschaften des Quantifikators zu strecken.
  • In dem Fall des Einsatzes der zweiten Methode zur Synthese der auslösenden Welle schließlich schlägt das Verfahren, das Gegenstand der vorliegenden Erfindung ist, ein Mittel zur Verwendung eines adaptiven LTP-Verzeichnisses zusätzlich zum Innovationsverzeichnis vor, welche Methode es erlaubt, die Verstärkung an die übertragene entwickelte Energie anzupassen. Die so erzeugten auslösenden Wellenformen besitzen im Allgemeinen einen größeren Spektralreichtum als diejenigen, die nur die Innovationsverzeichnisse benutzen.
  • Schließlich erlaubt die Gruppe den Einsatz und die Erzeugung eines Rauschens von guter Qualität, welches sogar synthetisiert wird, wenn die mittlere Übertragungsrate gering ist und das auf Kosten einer gemäßigten Berechnungskomplexität.

Claims (8)

  1. Verfahren zur Erzeugung eines Hintergrundrauschens in einem digitalen unterbrochenen Sprachübertragungssystem, bei dem das codierte Sprachsignal während eines aktiven Zeitintervalls übertragen wird, bei dem aktive Datenübertragungsblöcke übertragen werden, wobei auf jedes aktive Zeitintervall ein inaktives Zeitintervall folgt, bei dem mindestens inaktive Datenübertragungsblöcke übertragen werden, wobei dieses Verfahren beim Senden nach Erfassung eines inaktiven Zeitintervalls darin besteht: – einen Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung zu erzeugen und zu übertragen, welcher aus einer Gruppe von codierten, das Hintergrundrauschen beschreibenden Parametern besteht, wobei dieser Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung den ersten Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung des inaktiven Zeitintervalls, das auf dieses aktive Zeitintervall folgt, darstellt; wobei dieses Verfahren dadurch gekennzeichnet ist, dass es darin besteht, bei jedem auf dieses inaktive Zeitintervall folgenden, allgemeinen Datenübertragungsblock: – das Frequenzspektrum dieses momentanen inaktiven Datenübertragungsblocks zu analysieren und zu speichern, – das Frequenzspektrum dieses allgemeinen inaktiven Datenübertragungsblocks mit einem Bezugsfrequenzspektrum zu vergleichen, und bei Gleichheit des Frequenzspektrums des allgemeinen Datenübertragungsblocks und des Bezugsfrequenzspektrums: – Aussetzen jeglicher Übertragung, insbesondere der eines neuen Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung bei diesem allgemeinen inaktiven Datenübertragungsblock, und wenn das Frequenzspektrum des allgemeinen Datenübertragungsblocks und das Bezugsfrequenzspektrum nicht gleich sind: – Erzeugung und Übertragung eines neuen Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung während dieses allgemeinen inaktiven Datenübertragungsblocks, was es gestattet, die Übertragungsleistung des Hintergrundrauschens auf die der Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung zu verringern, deren Frequenzspektrum sich vom Bezugsfrequenzspektrum unterscheidet, das während des vorhergehenden Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung geschätzt wurde.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das Bezugsfrequenzspektrum ausgehend vom Frequenzspektrum der geschätzten Umgebungsgeräusche gebildet wird und bei der Erzeugung jedes Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung gespeichert wird.
  3. Verfahren zur Erzeugung eines Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung zur Erzeugung eines Hintergrundrauschens nach dem Verfahren eines der Ansprüche 1 oder 2, dadurch gekennzeichnet, dass es die Schritte umfasst, welche darin bestehen: – eine Messung der lokalen Stationarität des Frequenzspektrums einer Vielzahl von dem allgemeinen inaktiven Datenübertragungsblock vorausgehenden, aufeinanderfolgenden inaktiven Datenübertragungsblöcke vorzunehmen; – das mittlere Frequenzspektrum der aufeinanderfolgenden inaktiven Datenübertragungsblöcke zu bestimmen, um ein mittleres Frequenzspektrum der Vergangenheit zu bestimmen; – und bei Gleichheit oder Nicht-Gleichheit des mittleren Frequenzspektrums der Vergangenheit und des Frequenzspektrums des allgemeinen inaktiven Datenübertragungsblocks entweder das mittlere Frequenzspektrum der Vergangenheit oder das Frequenzspektrum des allgemeinen inaktiven Datenübertragungsblocks zur Erstellung des Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung auszuwählen, was es erlaubt, das Geräuschlosigkeitsspektrum für jeden Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung zu schätzen, unter Berücksichtigung der Tatsache, dass der allgemeine inaktive Datenübertragungsblock entweder zu einem lokal stationären Spektralbereich oder zu einem nicht-stationären Spektralbereich gehört.
  4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass dieses darin besteht, bei Empfang der Datenübertragungsblöcke zur Geräuschlosigkeitsbeschreibung, die beim Senden übertragen wurden, in Verbindung mit einem Sprach-Decoder: – die Gruppe der codierten, das Hintergrundrauschen beschreibenden Parameter für jeden Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung zu entcodieren, um entcodierte Parameter zu erzeugen; – das entsprechende Hintergrundrauschen nach Verarbeitung der entcodierten Parameter im Bereich des Sprach-Decoders zu synthetisieren.
  5. Vorrichtung zur Erzeugung eines Hintergrundrauschens in einem digitalen unterbrochenen Sprachübertragungssystem, bei dem das codierte Sprachsignal während eines aktiven Zeitintervalls übertragen wird, bei dem aktive Datenübertragungsblöcke übertragen werden, wobei auf jedes aktive Zeitintervall ein inaktives Zeitintervall folgt, bei dem mindestens inaktive Datenübertragungsblöcke übertragen werden, wobei diese Vorrichtung zum Senden der Datenübertragungsblöcke zur Geräuschlosigkeitsbeschreibung geeignet ist und einen Erzeuger von Hintergrundrauschen darstellt, welcher umfasst: – Mittel zur Erzeugung und bedingten Übertragung eines Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung, welcher von einer Gruppe von codierten, das Hintergrundrauschen beschreibenden Parametern gebildet ist, bei Erfassung eines inaktiven Zeitintervalls, wobei dieser Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung den ersten Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung des inaktiven Zeitintervalls darstellt, welches auf dieses aktive Zeitintervall folgt; wobei die Vorrichtung dadurch gekennzeichnet ist, dass sie umfasst: – Mittel zum Analysieren und Speichern des Frequenzspektrums jedes allgemeinen inaktiven Datenübertragungsblocks, der auf dieses inaktive Zeitintervall folgt; – Mittel zum Vergleichen des Frequenzspektrums dieses allgemeinen inaktiven Datenübertragungsblocks mit einem Bezugsfrequenzspektrum, die bei Gleichheit und Nicht-Gleichheit des Frequenzspektrums des allgemeinen Datenübertragungsblocks und des Bezugsfrequenzspektrums ein bestimmtes Steuersignal liefern; – Steuerungsmittel zum Verhindern bzw. Zulassen der Übertragung eines neuen Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung bei diesem allgemeinen inaktiven Datenübertragungsblock, welche das bestimmte, von den Vergleichsmitteln gelieferte Steuersignal empfangen, was es ermöglicht, jegliche Übertragung, insbesondere die Übertragung eines neuen Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung, bei Gleichheit des Frequenzspektrums des allgemeinen Datenübertragungsblocks und des Bezugsfrequenzspektrums auszusetzen und einen neuen Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung bei Nicht-Gleichheit des Frequenzspektrums des allgemeinen Datenübertragungsblocks und des Bezugsfrequenzspektrums zu übertragen, wobei die Übertragungsleistung des Hintergrundrauschens so auf die der Datenübertragungsblöcke zur Geräuschlosigkeitsbeschreibung verringert wird, deren Frequenzspektrum sich vom Bezugsfrequenzspektrum unterscheidet, das während des vorhergehenden Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung geschätzt wurde.
  6. Vorrichtung nach Anspruch 5, dadurch gekennzeichnet, dass das Übertragungssystem eine Sprechaktivitätsvorrrichtung umfasst, die ein Sprechaktivitätssignal liefert, einen prädiktiven Sprachcodierer, wobei dieser Codierer das Sprachsignal mittels eines LPC-Filters zerlegt, welcher ein Autokorrelationssignal des Sprachsignals, ein Signal, das die LPC-Filterparameter bezüglich des vorausgehenden Datenübertragungsblocks beschreibt, und bedingt ein Auslösesignal wenigstens eines vorausgehenden Datenübertragungsblocks liefert, wobei die Vorrichtung, die den Erzeuger von Hintergrundrauschen darstellt, umfasst: – ein Rechenmodul für die Parameter bezüglich des allgemeinen Datenübertragungsblocks, welches das Autokorrelationssignal des Sprachsignals empfängt und geeignet ist, die den Parametern des allgemeinen Datenübertragungsblocks entsprechenden Signale zu erzeugen; – ein Modul, das über das Senden eines Datenübertragungsblocks eines codierten Sprachratenübertragungsblocks eines Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung oder über das Nicht-Senden entscheidet, wobei dieses Entscheidungsmodul geeignet ist, das Sprechaktivitätssignal und die den Parametern des allgemeinen Datenübertragungsblocks und den Bezugsparametern entsprechenden Signale zu empfangen und ein Signal des Typs zur Übertragung von dreiwertigen Datenübertragungsblöcken zu liefern, wobei ein erster Wert dem absoluten Nichtvorhandensein eines Sendens bei einem allgemeinen inaktiven Datenübertragungsblock entspricht, ein zweiter Wert dem Senden eines kodierten Sprachdatenübertragungsblocks bei einem aktiven Datenübertragungsblock entspricht und ein dritter Wert dem Senden eines Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung bei einem inaktiven Datenübertragungsblock beschreibt; – ein Modul zum bedingten Berechnen von Bezugsparametern, wobei dieses Modul geeignet ist, eingangs das Autokorrelationssignal des Sprachsignals und die den Parametern des allgemeinen Datenübertragungsblocks entsprechenden Signale zu empfangen, und ein Signal mit den Bezugsparametern zu tiefem; – ein Modul zur Erzeugung eines codierten Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung, welches geeignet ist, das Übertragungssignal, die den Bezugsparametern entsprechenden Signale zu empfangen und bedingt ein codiertes Signal des Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung zu liefern; – ein Modul zur Erzeugung eines Auslösesignals, welches geeignet ist, das Übertragungssignal und bedingt das von dem Sprachcodierer gelieferte Auslösesignal zu empfangen und welches geeignet ist, bedingt dem Datenübertragungsblockübertragungssignal ein Auslösesignal für den allgemeinen Datenübertragungsblock zu liefern; – ein Modul zur Erzeugung eines die wieder aktualisierten LPC-Filterparameter beschreibenden Signals, welches geeignet ist, das Datenübertragungsblockübertragungssignal, ein von dem Sprachcodierer geliefertes, die LPC-Parameter der vorausgehenden Datenübertragungsblöcke beschreibendes Signal zu empfangen, und bedingt dem Datenübertragungsblockübertragungssignal ein wieder aktualisiertes, die LPC-Parameter beschreibendes Signal für den allgemeinen Datenübertragungsblock zu liefern.
  7. Vorrichtung nach Anspruch 5, dadurch gekennzeichnet, dass diese Vorrichtung für den Empfang von Datenübertragungsblöcken zur Geräuschlosigkeitsbeschreibung, die beim Senden übertragen werden, geeignet ist, und auf die Gruppe der codierten, das Hintergrundrauschen beschreibenden Parameter folgend in jedem Datenübertragungsblock zur Geräuschlosigkeitseschreibung Decodiermittel umfasst, wobei die Mittel geeignet sind, eine auf den Typ des allgemeinen verarbeiteten Datenübertragungsblocks bezogene Information zu empfangen, ein codiertes Signal über den Datenübertragungsblock zur Geräuschlosigkeitsbeschreibung und von einem Sprach-Decoder ein Verwaltungssignal, das eine zum Sprach-Decoder synchron verlaufende Arbeitsweise sicherstellt, um decodierte Parameter zu erzeugen, die ein das Hintergrundrauschen beschreibendes Signal bezüglich des allgemeinen Datenübertragungsblocks umfassen, wobei die mit einem Sprachsignal-Decoder zusammengeschalteten Decodiermittel geeignet sind, einerseits die codierten Sprachdatenübertragungsblöcke und andererseits das das Hintergrundrauschen beschreibende Signal bezüglich des allgemeinen Datenübertragungsblocks zu empfangen, wobei der Sprach-Decoder geeignet ist, durch Synthese ein Sprachsignal bzw. ein synthetisiertes Hintergrundrauschen zu liefern.
  8. Vorrichtung nach Anspruch 7, dadurch gekennzeichnet, dass für den Fall, dass der Sprachsignal-Decoder von einem prädiktiven Decoder gebildet ist, die Decodiermittel mindestens umfassen: – einen Demultiplexer, der geeignet ist, das übertragene Signal des codierten Datenübertragungsblocks zur Geräuschlosigkeitsbeschreibung zu empfangen und ein codiertes, die LPC-Parameter bezüglich des allgemeinen Datenübertragungsblocks beschreibendes Signal und ein Signal über den quantifizierten Verstärkungsindex zu liefern, welches das synthetisierte Auslösesignal beschreibt; – ein Dequantifikatormodul, das geeignet ist, das Signal über den quantifizierten Verstärkungsindex zu empfangen und ein dequantifiziertes Verstärkungssignal zu liefern; – ein Rechenmodul, das geeignet ist, das codierte, die LPC-Filterparameter bezüglich des allgemeinen Datenübertragungsblocks beschreibende Signal zu empfangen, das die LPC-Filterparameter bezüglich mindestens des vorausgehenden Datenübertragungsblocks beschreibende Signal und die Datenübertragungsblock-Übertragungsinformation zu empfangen, und das geeignet ist, das aktualisierte Signal mit den LPC-Parametern bezüglich des allgemeinen Datenübertragungsblocks zu liefern; –ein Auslöseerzeugungsmodul, das geeignet ist, das dequantifizierte Verstärkungssignal, bedingt das Auslösesignal und die Datenübertragungsblock-Übertragungsinformation zu empfangen, und das Auslösesignal bezüglich des allgemeinen Datenübertragungsblocks zu liefern.
DE1996631318 1995-10-13 1996-10-10 Verfahren und Vorrichtung zur Erzeugung von Hintergrundrauschen in einem digitalen Übertragungssystem Expired - Lifetime DE69631318T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9512039A FR2739995B1 (fr) 1995-10-13 1995-10-13 Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
FR9512039 1995-10-13

Publications (2)

Publication Number Publication Date
DE69631318D1 DE69631318D1 (de) 2004-02-19
DE69631318T2 true DE69631318T2 (de) 2004-11-18

Family

ID=9483505

Family Applications (3)

Application Number Title Priority Date Filing Date
DE69637612T Expired - Lifetime DE69637612D1 (de) 1995-10-13 1996-10-10 Erzeugung einer Rahmenbeschreibung der Stille zur Erzeugung eines angenehmen Hintergrundrauschens
DE69637565T Expired - Lifetime DE69637565D1 (de) 1995-10-13 1996-10-10 Synthese eines Anregungssignales zur Verwendung in einem Generator von Komfortrauschen
DE1996631318 Expired - Lifetime DE69631318T2 (de) 1995-10-13 1996-10-10 Verfahren und Vorrichtung zur Erzeugung von Hintergrundrauschen in einem digitalen Übertragungssystem

Family Applications Before (2)

Application Number Title Priority Date Filing Date
DE69637612T Expired - Lifetime DE69637612D1 (de) 1995-10-13 1996-10-10 Erzeugung einer Rahmenbeschreibung der Stille zur Erzeugung eines angenehmen Hintergrundrauschens
DE69637565T Expired - Lifetime DE69637565D1 (de) 1995-10-13 1996-10-10 Synthese eines Anregungssignales zur Verwendung in einem Generator von Komfortrauschen

Country Status (8)

Country Link
US (1) US5812965A (de)
EP (3) EP0768770B1 (de)
JP (2) JP3781495B2 (de)
KR (1) KR100357254B1 (de)
CN (1) CN1104710C (de)
DE (3) DE69637612D1 (de)
FR (1) FR2739995B1 (de)
HK (2) HK1057939A1 (de)

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5978756A (en) * 1996-03-28 1999-11-02 Intel Corporation Encoding audio signals using precomputed silence
SE507370C2 (sv) * 1996-09-13 1998-05-18 Ericsson Telefon Ab L M Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JP3575967B2 (ja) * 1996-12-02 2004-10-13 沖電気工業株式会社 音声通信システムおよび音声通信方法
KR100205251B1 (ko) * 1996-12-09 1999-07-01 정선종 코드분할 다중접속 기지국에서의 음성 부호화 장치 및 방법
FR2758676A1 (fr) * 1997-01-21 1998-07-24 Philips Electronics Nv Methode de reduction des clics dans un systeme de transmission de donnees
ES2190578T3 (es) * 1997-06-23 2003-08-01 Liechti Ag Metodo para la compresion de grabaciones de ruido ambiental, metodo para la deteccion de los elementos de programa de las mismas, dispositivo y programa de ordenador para su aplicacion.
US6347081B1 (en) * 1997-08-25 2002-02-12 Telefonaktiebolaget L M Ericsson (Publ) Method for power reduced transmission of speech inactivity
US6023674A (en) * 1998-01-23 2000-02-08 Telefonaktiebolaget L M Ericsson Non-parametric voice activity detection
US6122611A (en) * 1998-05-11 2000-09-19 Conexant Systems, Inc. Adding noise during LPC coded voice activity periods to improve the quality of coded speech coexisting with background noise
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6192335B1 (en) * 1998-09-01 2001-02-20 Telefonaktieboiaget Lm Ericsson (Publ) Adaptive combining of multi-mode coding for voiced speech and noise-like signals
US6256606B1 (en) * 1998-11-30 2001-07-03 Conexant Systems, Inc. Silence description coding for multi-rate speech codecs
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6519260B1 (en) 1999-03-17 2003-02-11 Telefonaktiebolaget Lm Ericsson (Publ) Reduced delay priority for comfort noise
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
US6381568B1 (en) 1999-05-05 2002-04-30 The United States Of America As Represented By The National Security Agency Method of transmitting speech using discontinuous transmission and comfort noise
GB2350532B (en) * 1999-05-28 2001-08-08 Mitel Corp Method to generate telephone comfort noise during silence in a packetized voice communication system
JP3451998B2 (ja) * 1999-05-31 2003-09-29 日本電気株式会社 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
US7161931B1 (en) * 1999-09-20 2007-01-09 Broadcom Corporation Voice and data exchange over a packet based network
FR1094446T (fr) * 1999-10-18 2007-01-05 Lucent Technologies Inc Enregistrement de la parole avec compression du silence et génération de bruit de confort pour appareil de communication digitale
GB2356538A (en) * 1999-11-22 2001-05-23 Mitel Corp Comfort noise generation for open discontinuous transmission systems
US6615170B1 (en) * 2000-03-07 2003-09-02 International Business Machines Corporation Model-based voice activity detection system and method using a log-likelihood ratio and pitch
GB0007655D0 (en) * 2000-03-29 2000-05-17 Simoco Int Ltd Digital transmission
WO2001084536A1 (de) * 2000-04-28 2001-11-08 Deutsche Telekom Ag Verfahren zur berechnung einer sprachaktivitätsentscheidung (voice activity detector)
US6898195B1 (en) * 2000-05-09 2005-05-24 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for sustaining conversational services in a packet switched radio access network
SE518941C2 (sv) * 2000-05-31 2002-12-10 Ericsson Telefon Ab L M Anordning och förfarande relaterande till kommunikation av tal
EP1179819A1 (de) * 2000-08-11 2002-02-13 Lucent Technologies Inc. Effiziente Übertragung von Komfortgeräuschen
US6807525B1 (en) * 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
EP1204093A1 (de) * 2000-11-02 2002-05-08 Lucent Technologies Inc. Diskontinuierliche Übertragung von Hintergrundrauschen
US6662155B2 (en) * 2000-11-27 2003-12-09 Nokia Corporation Method and system for comfort noise generation in speech communication
GB2370206A (en) * 2000-12-15 2002-06-19 Ericsson Telefon Ab L M Storing a speech signal, e.g. in a mobile telephone
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
US20030120484A1 (en) * 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
US20030212550A1 (en) * 2002-05-10 2003-11-13 Ubale Anil W. Method, apparatus, and system for improving speech quality of voice-over-packets (VOP) systems
US7746797B2 (en) * 2002-10-09 2010-06-29 Nortel Networks Limited Non-intrusive monitoring of quality levels for voice communications over a packet-based network
EP1414024A1 (de) * 2002-10-21 2004-04-28 Alcatel Realistisches Hintergrundrauschen für Sprachverbindungen über Paketnetzwerke
US7406096B2 (en) * 2002-12-06 2008-07-29 Qualcomm Incorporated Tandem-free intersystem voice communication
ATE408318T1 (de) * 2002-12-16 2008-09-15 Research In Motion Ltd Verfahren und vorrichtung zur senkung des energieverbrauches in einem cdma- kommunikationsgerät
US7436786B2 (en) * 2003-12-09 2008-10-14 International Business Machines Corporation Telecommunications system for minimizing the effect of white noise data packets for the generation of required white noise on transmission channel utilization
US20060149536A1 (en) * 2004-12-30 2006-07-06 Dunling Li SID frame update using SID prediction error
ES2629727T3 (es) * 2005-06-18 2017-08-14 Nokia Technologies Oy Sistema y método para la transmisión adaptativa de parámetros de ruido de confort durante la transmisión de habla discontinua
KR100785471B1 (ko) 2006-01-06 2007-12-13 와이더댄 주식회사 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
CN101087319B (zh) * 2006-06-05 2012-01-04 华为技术有限公司 一种发送和接收背景噪声的方法和装置及静音压缩系统
US20080059161A1 (en) * 2006-09-06 2008-03-06 Microsoft Corporation Adaptive Comfort Noise Generation
CN101303855B (zh) * 2007-05-11 2011-06-22 华为技术有限公司 一种舒适噪声参数产生方法和装置
CN101483042B (zh) 2008-03-20 2011-03-30 华为技术有限公司 一种噪声生成方法以及噪声生成装置
CN101309487B (zh) * 2008-07-15 2011-05-11 华为技术有限公司 一种语音帧的处理方法、系统和基站
US8913512B2 (en) * 2008-10-16 2014-12-16 Telefonaktiebolaget Lm Ericsson (Publ) Telecommunication apparatus, method, and computer program controlling sporadic data transmissions
US20100260273A1 (en) * 2009-04-13 2010-10-14 Dsp Group Limited Method and apparatus for smooth convergence during audio discontinuous transmission
CN102034476B (zh) * 2009-09-30 2013-09-11 华为技术有限公司 语音帧错误检测的方法及装置
AU2011240024B2 (en) * 2010-04-13 2014-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and encoder and decoder for gap - less playback of an audio signal
US20110273213A1 (en) * 2010-05-06 2011-11-10 Qualcomm Incorporated Method and apparatus to dynamically adjust a clock rate in a mobile device
CN106169297B (zh) 2013-05-30 2019-04-19 华为技术有限公司 信号编码方法及设备
US9185506B1 (en) * 2013-12-16 2015-11-10 Amazon Technologies, Inc. Comfort noise generation based on noise estimation
EP2980801A1 (de) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur Schätzung des Rauschens in einem Audiosignal, Rauschschätzer, Audiocodierer, Audiodecodierer und System zur Übertragung von Audiosignalen
GB2532041B (en) 2014-11-06 2019-05-29 Imagination Tech Ltd Comfort noise generation
US10978096B2 (en) * 2017-04-25 2021-04-13 Qualcomm Incorporated Optimized uplink operation for voice over long-term evolution (VoLte) and voice over new radio (VoNR) listen or silent periods

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5276765A (en) * 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
EP0335521B1 (de) * 1988-03-11 1993-11-24 BRITISH TELECOMMUNICATIONS public limited company Detektion für die Anwesenheit eines Sprachsignals
JPH0236628A (ja) * 1988-07-27 1990-02-06 Toshiba Corp 音声信号の送信方式及び送受信方式
US5537509A (en) * 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
JPH04312048A (ja) * 1991-04-11 1992-11-04 Matsushita Electric Ind Co Ltd 音声パケットシステム
JP2518765B2 (ja) * 1991-05-31 1996-07-31 国際電気株式会社 音声符号化通信方式及びその装置
JP2897551B2 (ja) * 1992-10-12 1999-05-31 日本電気株式会社 音声復号化装置
JPH06282297A (ja) * 1993-03-26 1994-10-07 Idou Tsushin Syst Kaihatsu Kk 音声符号化方式
JPH0750631A (ja) * 1993-08-05 1995-02-21 Toshiba Corp 擬似背景雑音発生機能を備えたディジタル無線通信装置
SE501981C2 (sv) * 1993-11-02 1995-07-03 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
JP3182032B2 (ja) * 1993-12-10 2001-07-03 株式会社日立国際電気 音声符号化通信方式及びその装置
JPH08254997A (ja) * 1995-03-16 1996-10-01 Fujitsu Ltd 音声符号化・復号化方法

Also Published As

Publication number Publication date
EP1320087A2 (de) 2003-06-18
US5812965A (en) 1998-09-22
JP2004177978A (ja) 2004-06-24
EP1320087A3 (de) 2006-05-17
CN1155801A (zh) 1997-07-30
FR2739995B1 (fr) 1997-12-12
EP1372289A3 (de) 2006-05-17
EP0768770B1 (de) 2004-01-14
EP1372289B1 (de) 2008-07-23
HK1057939A1 (en) 2004-04-23
EP1320087B1 (de) 2008-06-11
DE69631318D1 (de) 2004-02-19
JP4422500B2 (ja) 2010-02-24
EP0768770A1 (de) 1997-04-16
FR2739995A1 (fr) 1997-04-18
DE69637565D1 (de) 2008-07-24
KR100357254B1 (ko) 2003-01-10
HK1062506A1 (en) 2004-11-05
DE69637612D1 (de) 2008-09-04
JPH09179590A (ja) 1997-07-11
JP3781495B2 (ja) 2006-05-31
EP1372289A2 (de) 2003-12-17
CN1104710C (zh) 2003-04-02

Similar Documents

Publication Publication Date Title
DE69631318T2 (de) Verfahren und Vorrichtung zur Erzeugung von Hintergrundrauschen in einem digitalen Übertragungssystem
DE19617630B4 (de) Verfahren zum Herleiten der Nachwirkperiode in einem Sprachdecodierer bei diskontinuierlicher Übertragung, sowie Sprachcodierer und Sender-Empfänger
DE69910240T2 (de) Vorrichtung und verfahren zur wiederherstellung des hochfrequenzanteils eines überabgetasteten synthetisierten breitbandsignals
DE69721349T2 (de) Sprachkodierung
DE60122203T2 (de) Verfahren und system zur erzeugung von behaglichkeitsrauschen bei der sprachkommunikation
DE60034484T2 (de) Verfahren und vorrichtung in einem kommunikationssystem
DE69917677T2 (de) SPRACHKODIERUNG MIT VERäNDERBAREM KOMFORT-RAUSCHEN FüR VERBESSERTER WIEDERGABEQUALITäT
DE69915830T2 (de) Verbesserte verfahren zur rückgewinnung verlorener datenrahmen für ein lpc-basiertes, parametrisches sprachkodierungsystem.
DE69724739T2 (de) Verfahren zur Erzeugung von Hintergrundrauschen während einer diskontinuierlichen Übertragung
DE69814517T2 (de) Sprachkodierung
DE69533734T2 (de) Durch Sprachaktivitätsdetektion gesteuerte Rauschunterdrückung
EP1869671B1 (de) Verfahren und vorrichtung zur geräuschunterdrückung
DE60118631T2 (de) Verfahren zum ersetzen verfälschter audiodaten
EP0978172B1 (de) Verfahren zum verschleiern von fehlern in einem audiodatenstrom
DE69911169T2 (de) Verfahren zur dekodierung eines audiosignals mit korrektur von übertragungsfehlern
DE69730721T2 (de) Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form
DE69530665T2 (de) Verfahren und gerät zur sprachübertragung in einem mobilen kommunikationssystem
DE69820362T2 (de) Nichtlinearer Filter zur Geräuschunterdrückung in linearen Prädiktions-Sprachkodierungs-Vorrichtungen
DE60224005T2 (de) Verfahren und vorrichtung zur verarbeitung von mehreren audiobitströmen
DE19715126A1 (de) Sprachsignal-Codiervorrichtung
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE69827545T2 (de) Vorrichtung zur Erzeugung von Hintergrundrauschen
DE69837296T2 (de) Verfahren und Vorrichtung zur Audiokodierung mittels einer mehrstufigen Mehrimpulsanregung
DE4211945C1 (de)
WO2009103610A1 (de) Verfahren und mittel zur enkodierung von hintergrundrauschinformationen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition