DE69721349T2

DE69721349T2 - Sprachkodierung

Info

Publication number: DE69721349T2
Application number: DE69721349T
Authority: DE
Inventors: Ajit V. Rao; Wilfrid P. Leblanc
Original assignee: Texas Instruments Inc
Current assignee: Texas Instruments Inc
Priority date: 1996-01-29
Filing date: 1997-01-29
Publication date: 2004-04-01
Anticipated expiration: 2017-01-30
Also published as: EP0786760A3; JPH1097292A; US6101466A; EP0786760B1; EP0786760A2; US5794199A; US5978760A; DE69721349D1

Description

TECHNISCHES GEBIET DER ERFINDUNG
Diese Erfindung bezieht sich allgemein auf die Sprachverarbeitung und insbesondere auf ein Verfahren und auf ein System zum Liefern einer verbesserten diskontinuierlichen Sprachübertragung.
HINTERGRUND DER ERFINDUNG
Die digitale Übertragung von Sprache tritt in vielen Anwendungen einschließlich zahleichen Telephonanwendungen auf. In Telephonanwendungen wie etwa in Mobilkommunikationssystemen ist ein niedriger Leistungsverbrauch für eine längere Batterielebensdauer und folglich für eine bessere Leistung wesentlich. Beispielsweise kann in Funktelephonen durch Ausschalten des Senders zwischen Sprachimpulsen Leistung gespart werden. In einer durchgehenden Telephonkonversation spricht jeder Nutzer typischerweise etwa 40–60% der Zeit. Zwischen diesen Sprachimpulsen wird der Sender einfach dazu verwendet, ein Hintergrundgeräusch an den Empfänger zu senden.
Durch effizientes Erfassen der Stimmaktivität, Ausschalten des Senders, wenn keine Stimme vorhanden ist, und Verwenden eines hinsichtlich der Wahrnehmung akzeptablen Verfahrens zum Füllen der Zwischenräume zwischen den Sprachimpulsen kann die Lebensdauer der Batterie mit wenig zusätzlichem Aufwand etwa verdoppelt werden. Diese als diskontinuierliches Senden bekannte Technik entlastet auch den Paketverkehr in typischen Kommunikationssystemen mit Code-Division Multiple Access (CDMA) und Time Division Multiple Access (TDMA), was ermöglicht, daß mehr Teilnehmer das Netz mit weniger Störung nutzen. 1 zeigt einen beispielhaften Vocoder 10, der in solchen Kommunikationssystemen verwendet wird. Der Vocoder 10 enthält einen Codieren 12, der Daten für die Übertragung über den Ausgangskanal 16 verarbeitet, und einen Decoder 14, der ankommende Kommunikationen vom Eingangskanal 18 verarbeitet.
Der Codierer 12 ist in 2 ausführlicher gezeigt. Der in 2 gezeigte beispielhafte Codierer 12 enthält ein Steuermodul 20, eine Sprachaktivitäts-Auswerteschaltung (VAD) 22, einen Sprachparametergenerator 24 und einen Geräuschparametergenerator 26. Der Decoder 14 ist in 3 ausführlicher gezeigt und enthalt ein Steuermodul 30, eine Sprachparameter-Auswerteschaltung 32, einen Sprachgenerator 34 und einen Komfortgeräuschgenerator 36.
Eine wichtige Komponente in dem Codierer 12 eines Systems für die diskontinuierliche Übertragung ist die VAD 22, die Pausen in der Sprache erfaßt, so daß während Zeitdauern ohne Sprachaktivität keine Übertragung von Daten stattfindet. Die VAD 22 muß die Abwesenheit von Sprache in einem Signal soviel wie möglich erfassen können, ohne selbst unter schlechten Signal-Rausch-Bedingungen (SNR-Bedingungen) Sprache falsch als Geräusch zu klassifizieren. Ein primäres Problem bei Systemen, die die VAD 22 verwenden, ist aber das Abschneiden der Anfangsteile der erfaßten Sprache. Dies geschieht teilweise, da die Sprachübertragung nicht fortgesetzt wird, bis die Sprachaktivität erfaßt worden ist. Ein weiteres Problem ist das Fehlen von Hintergrundgeräusch während der Inaktivität, das in einem System mit diskontinuierlicher Übertragung normalerweise stattfindet.
In einem Versuch, die Qualität der durch den Sprachgenerator 34 erzeugten synthetischen Sprache in Systemen, die die VAD 22 zum Verringern der Datenübertragungen verwenden, zu verbessern, wird während des durch den Decoder 18 ausgeführten Decodierungsprozesses durch den Komfortgeräuschgenerator 36 erzeugtes synthetisches Komfortgeräusch hinzugefügt, um die Lücken zwischen den Sprachimpulsen auszufüllen. Allerdings modelliert das synthetische Komfortgeräusch nicht das tatsächliche Hintergrundgeräusch, das in dem Codierer 12 erfahren wird, so daß irgendwelche Qualitätsverbesserungen minimal sind.
Im Stand der Technik wurden einige Techniken vorgeschlagen, um das tatsächliche Wesen des Hintergrundgeräuschs zu erfassen und den Sprachdecoder 18 darüber zu informieren.
In typischen Sprachkompressionsschemata wie Code-Excited Linear Prediction (CELP) [siehe M. R. Schroeder und B. S. Atal, "Code-excited linear prediction (CELP): High quality speech at very low bit rates", Proc. Inter. Conf. Acoust., Speech, Signal Processing, 1985, S. 937–940, Bd. 1] wird die über den Eingangskanal 16 empfangene digital abgetastete Eingangssprache für die Analysezwecke in nicht überschneidende Rahmen unterteilt. Daraufhin klassifiziert die VAD 22 jeden Rahmen als Sprache oder als Geräusch.
Ein üblicher Lösungsansatz, um synthetisch ein Geräusch zu erzeugen, das ähnlich dem Hintergrundgeräusch ist, besteht in solchen Systemen darin, daraufhin die Statistik dieses Geräuschs zu erfassen und in dem Decoder 30 ein statistisch ähnliches Pseudozufallsgeräusch zu erzeugen. Ein übliches Modell für das Hintergrundgeräusch ist ein autoregressiver Prozeß niedriger Ordnung. Ein Vorteil dieses Modells ist seine Ähnlichkeit mit dem Modell, das häufig für reguläre Sprache verwendet wird. Diese Ähnlichkeit ermöglicht die Verwendung ähnlicher Quantisierungsschemata zum Komprimieren der Kurzzeitparameter sowohl von Geräusch als auch von Sprache in dem Geräuschparametergenerator 26 bzw. in dem Sprachparametergenerator 24. Darauflhin kann aus den Kurzzeit-Autokorrelationswerten des Geräuschprozesses das autoregressive Modell abgeleitet werden.
In vielen Schemata mit diskontinuierlicher Übertragung werden die ersten wenigen als Geräusch klassifizierten Rahmen als "Geräuschanalyse-Rahmen" neu klassifiziert. Während dieser Rahmen wird das Geräusch als reguläre Sprache codiert, wobei aber die während der Analyse dieser Rahmen berechneten Autokorrelationswerte gemittelt werden, um die Autokorrelation des Geräuschs zu berechnen. Falls auf die Geräuschanalyse-Rahmen weitere Geräuschrahmen folgen, werden diese Autokorrelationswerte dazu verwendet, den Decoder 18 zu folgern, bevor der Sender ausgeschaltet wird.
Dieser Zugang wird von der Groupe Speciale Mobile (GSM) des European Telecommunications Standards Institute (ESTI) sowohl bei der Vollratennorm [siehe European Telecommunications Standards Institute (ESTI), European Digital Cellular Telecommunication System (Phase 2)" Voice Activity Detection (VAD) (GSM 06.32)] als auch bei der Halbratennorm [siehe European Telecommunications Standards Institute (ESTI), European Digital Cellular Telecommunication System; Half-rate Speech, Teil 6: Voice Activity Detection (VAD) for half rate speech traffic channels (GSM 06.42)] verwendet.
Allerdings ist die VAD 22, die Geräusch von Sprache unterscheidet, üblicherweise ungenau, wobei es außerdem sinnvoll ist zu erwarten, daß die ersten wenigen Geräuschanalyse-Rahmen wenige Millisekunden Sprache enthalten. Somit repräsentieren die erhaltenen Autokorrelationsparameter durch die gleichmäßige Mittelung nicht genau die Statistik des tatsächlichen Hintergrundgeräuschs. Das Ergebnis ist häufig ein störendes Geräusch zwischen den Sprachimpulsen.
Ferner füllt der Decoder 14 in typischen Schemata mit diskontinuierlicher Übertragung die Zwischenräume zwischen den Sprachimpulsen durch einfaches Erzeugen eines autoregressiven Geräuschs aus, dessen Statistik an die des Hintergrundgeräuschs angepaßt ist. Dieser Zugang wird sowohl in der GSM Vollratennorm [siehe European Telecommunications Standards Institute (ESTI), European Digital Cellular Telecommunication System; (Phase 2) Teil 4: Comfort Noise aspects for the full rate speech traffic channel (GSM 06.12)] als auch in der Halbratennorm [siehe European Telecommunications Standards Institute (ESTI), European Digital Cellular Telecommunication System; Comfort Noise aspects for the half rate speech traffic channels (GSM 06.22)] verwendet. Dies führt zu Geräuschimpulsen, die nicht glatt in das Hintergrundgeräusch übergehen, welches vorhanden ist, wenn die Sprecher aktiv sind.
ZUSAMMENFASSUNG DER ERFINDUNG
Typische Sprachkompressionsschemata werden dadurch effizienter gemacht, daß weniger Bits verwendet werden, wenn der Sprecher leise ist und lediglich ein Hintergrundgeräusch vorhanden ist. Anstelle eines Decoders, der lediglich ein Pseudozufalls-"Komfortgeräusch" mit der gleichen Statistik wie das Hintergrundgeräusch erzeugt, schafft die vorliegende Erfindung einen Decoder, der während dieser Intervalle ein neues Verfahren mit gewichtetem Mittelwert verwendet, um die Statistik des Hintergrundgeräuschs abzuschätzen. Dieses Verfahren repräsentiert das tatsächliche Hintergrundgeräusch besser als ein ungewichteter Zugang. Ferner wird eine neue Technik des "glatten Übergangs" dargestellt, die das Komfortgeräusch zwischen den Sprachimpulsen allmählich einführt. Der glattere Übergang zwischen Sprache und Komfortgeräusch führt zu Sprache, die hinsichtlich der Wahrnehmung angenehmer ist als die von den bestehenden Verfahren erzeugte.
KURZBESCHREIBUNG DER ZEICHNUNG
Für ein besseres Verständnis der vorliegenden Erfindung kann auf die beigefiigte Zeichnung Bezug genommen werden, in der:
1 ein beispielhafter Vocoder ist, der in Übertragungssystemen des Standes der Technik verwendet wird;
2 ein beispielhafter Codierer ist, der in Kommunikationssystemen des Standes der Technik verwendet wird;
3 einen beispielhaften Decoder zeigt, der in Kommunikationssystemen des Standes der Technik verwendet wird;
4 einen Rauschparametergenerator in Übereinstimmung mit der vorliegenden Erfindung zeigt; und
5 einen Komfortgeräuschgenerator in Ubereinstimmung mit der vorliegenden Erfindung zeigt.
AUSFÜHRLICHE BESCHREIBUNG DER ERFINDUNG
Um das Problem der schlechten Darstellung des Hintergrundgeräuschs zu überwinden, zeigt 4 einen Geräuschparametergenerator 40 in Übereinstimmung mit der vorliegenden Erfindung, der einen gewichteten Mittelwert der Autokorrelationswerte des Eingangssignals verwendet, welcher während der Geräuschanalysephase erzeugt wurde. Eine gute Wichtungsfunktion gibt den Auto korrelationen während der ersten wenigen Rahmen (da sie Sprache enthalten können) wenig Gewicht, während sie den Rahmen zum Ende dieser Phase mehr Gewicht gibt.
Außerdem zeigt 5 zur Überwindung des diskontinuierlichen Wesens des Komfortgeräuschs einen Komfortgeräuschgenerator 50 in Übereinstimmung mit der vorliegenden Erfindung, der das Wesen des Signals nach dem Spracheimpuls allmählich von Sprache in ein Pseudozufallsgeräusch ändert. Der in dem Komfortgeräuschgenerator 50 der vorliegenden Erfindung verwendete Zugang regt das autoregressive Filter entsprechend dem Geräuschmodell mit einer gewichteten Kombination der vorausgegangenen Anregung und des Pseudozufallsgeräuschs an. Dieser Zugang ändert allmählich die Energie und das Wesen des Komfortgeräuschs und macht es dadurch hinsichtlich der Wahrnehmung angenehm.
Obgleich beabsichtigt ist, daß auch andere Codierer verwendet werden können, wird in der vorliegenden Erfindung ein Sprachcodierer verwendet, der den verbesserten GSM-Vollratenstandard realisiert. In dem in der vorliegenden Erfindung verwendeten Sprachcodierer wird die Sprache in nicht überschneidende Rahmen von jeweils 10 ms (80 Abtastwerte) segmentiert. Zum Klassifizieren von Sprache und Geräusch wird ein Sprachaktivitäts-Erfassungsschema (VAD-Schema) angewendet, das ähnlich dem in der GSM-Halbratennorm verwendeten ist.
In Übereinstimmung mit dem Geräuschparametergenerator 40 der vorliegenden Erfindung werden die ersten sechzehn (16) Geräuschrahmen in einem Geräuschimpuls in der Geräuschanalyserahmen-Auswahleinrichtung 42 als "Geräuschanalyse"-Rahmen neu klassifiziert. Das Autokorrelationsmodul 44 verwendet in jedem solchen Rahmen i die Sprachproben s_i(0), s_i(1),... s_i(79) wie folgt zum Berechnen der Autokorrelationswerte r_i[j]:
wobei j = 0,..., 8 und i = 1,..., 16 ist.
Daraufhin berechnet das Modul 46 für den gewichteten Mittelwert in Übereinstimmung mit der Gleichung
wobei j = 0,..., 8 ist, die Autokorrelation des Hintergrundgeräuschs R[j] als gewichtete Mittelwerte der Autokorrelationswerte der Rauschanalyserahmen, welche durch das Autokorrelationsmodu144 berechnet wurden. In der Praxis wird die exponentielle Wichtungsfunktion ω_j mit ω_j = 0,8^j verwendet. Daraufhin werden die in dem Modul 46 für den gewichteten Mittelwert berechneten gewichteten Mittelwerte als Rauschparameter über den Ausgangskommunikationskanal 18 übertragen, woraufhin der Sender ausgeschaltet wird.
Die Sprachparameter und die Geräuschparameter werden von dem Decoder empfangen, der ebenfalls an den Ausgangskommunikationskanal 16 angeschlossen ist. Die Sprachparameter werden in einem Sprachmodell in dem empfangenden Decoder zum Synthetisieren der dargestellten Sprache verwendet. Ein Geräuschmodell in dem empfangenden Decoder verwendet die durch den sendenden Codierer erzeugten Geräuschparameter, um ein Komfortgeräusch zu erzeugen, das das Hintergrundgeräusch, das zu dem Zeitpunkt vorhanden ist, zu dem die Sprache aufgetreten ist, näher darstellt.
In dem Decoder fügt der Komfortgeräuschgenerator 40 gemäß der vorliegenden Erfindung das Pseudozufallsgeräusch sorgfältiger zwischen die Sprachimpulse ein. In der GSM-Voll- und -Halbratennorm des Standes der Technik wird das Komfortgeräusch dadurch erzeugt, daß ein lineares autoregressives Filter B. Ordnung mit weißem Rauschen mit einer besonderen Energie angeregt wird. Wie oben erwähnt wurde, neigt diese Technik allerdings dazu, Geräuschimpulse zu erzeugen, die nicht gut in das Hintergrundgeräusch übergehen, das vorhanden ist, wenn der Sprecher aktiv ist. Dies liegt an zwei Gründen. Zunächst ändert sich das Wesen des Erregungssignals plötzlich zu weißem Gauß'schem Rauschen. Zweitens ändert sich die Energie der Erregungssignale plötzlich zu der Rauschanregungsenergie.
Statt dessen ändert der Komfortgeräuschgenerator 40 gemäß der vorliegenden Erfindung die Energie und das Wesen des Erregungssignals allmählich zu denen des Pseudozufallsrauschens. Dies erfolgt dadurch, daß ein Erregungssignal verwendet wird, das sowohl eine weiße Gauß'sche Pseudozufalls-Rauschkomponente enthält, die durch den Generator 52 für die Komponente des Gauß'schen Rauschens erzeugt wird, als auch eine Komponente enthält, die von der Filteranregung während der Rahmensegmente abhängt, die dem durch den Codebuchkomponentengenerator 54 erzeugen Geräusch vorausgehen. Da vorausgegangene Anregungen üblicherweise als ein adaptives Codebuch gespeichert werden, umfaßt diese Lösung in CELP-gestützten Sprachcodierungssystemen keinen zusätzlichen Speicher.
Die durch den Codebuchkomponentengenerator 54 erzeugte Komponente der Rauschanregung, die von den vorausgegangenen Anregungen abhängt, ist einfach ein zufällig verzögertes adaptives Codebuchsegment oder allgemeiner ein zufällig verzögertes Segment vorausgegangener Anregungen. Das zufällige Verzögern des Beitrags des adaptiven Codebuchs in jedem Unterrahmen der Rauschanregung ist wichtig, um eine Klangtönung für das Komfortgeräusch zu vermeiden. Ferner wird die Wichtung, die dem Beitrag des adaptiven Codebuchs der Rauschanregung gegeben wird, wie im folgenden diskutiert wird, allmählich über die Zeit reduziert. Dies stellt noch weniger Klangtönung sicher, wobei die Rauschanregung im Ergebnis innerhalb weniger Unterrahmen fast vollständig weiß ist.
Als Beispiel wird angenommen, daß am Ende eines typischen Sprachimpulses das Rauschanalyse-Rahmenende im Rahmen k und in den Rahmen k + 1, k + 2, k + N als geräuschbehaftete Rahmen klassifiziert wurde. Ferner wird angenommen, daß jeder geräuschbehaftete Rahmen i in zwei Unterrahmen unterteilt wird, die durch die Paare (i, 1) und (i, 2) repräsentiert werden.
Die synthetische Sprache ŝ_(i,j)[n] in jedem geräuschbehafteten Unterrahmen (i, j) wird dadurch erzeugt, daß in ein autoregressives Filter B. Ordnung mit den Koeffizienten a[0] = 1,0, a[1],..., a[8] ein Erregungssignal e_ij(n) eingespeist wird. Das Filter führt die folgende Operation aus:
wobei n = 1, 2,..., 40; i = ( k + 1),..., N; und wobei j = 1, 2 ist.
In der GSM-Norm ist die Anregung e(n) das weiße Gauß'sche Rauschen
In der vorliegenden Erfindung ist das durch den Generator 52 für die Komponente des weißen Rauschens und durch den Codebuchkomponentengenerator 54 erzeugte e(n) die gewichtete Summe e_ij(n) = (1 - f_i )N(0,σ²) + f, d(n-l_(ij)).
Hier ist l_(ij) einfach eine gleichmäßig verteilte Zufallszahl, deren Bereich vom Speicher des verwendeten adaptiven Codebuchs abhängt. Ferner wird der Wichtungsfaktor f allmählich reduziert, während i steigt. In Simulationen unter Verwendung der vorliegenden Erfindung hat f = 0,951 gut funktioniert.
Die Kombination sowohl des Aspekts der Rauschabschätzung durch gewichtete Mittelung als auch des Aspekts der Rauschrekonstruktion der vorliegenden Erfindung hat die Qualität des getesteten Sprachcodierers stark verbessert.
Obgleich die vorliegende Erfindung ausführlich beschrieben wurde, können daran selbstverständlich verschiedene Änderungen, Ersetzungen und Abänderungen vorgenommen werden, ohne von dem Umfang der vorliegenden Erfindung abzuweichen.

Claims

Verfahren zur Übertragung von Sprachsignalen, mit folgenden Schritten: Segmentierung der Sprachsignale in Rahmen; Erfassung von Sprachaktivität in jedem dieser Rahmen; Klassifizierung jedes dieser Rahmen entweder als Sprache oder als Geräusch in Abhängigkeit von dem Erfassungsschritt; wenn die Sprachaktivität als Sprache klassifiziert ist, werden Parameter, welche die klassifizierten Rahmen repräsentieren, berechnet und übertragen; und wenn die Sprachaktivität als Geräusch klassifiziert ist, wird ein Teil der Rahmen, die als Geräusch klassifiziert sind, als Geräuschanalyse-Rahmen neu klassifiziert; Berechnung von Autokorrelationswerten für die Geräuschanalyse-Rahmen; Berechnen eines gewichteten Mittelwertes der Autokorrelationswerte, um die Geräuschanalyse-Rahmen zu repräsentieren; und Übertragen der gewichteten Mittelwerte als Geräuschparameter für die Verwendung zur Erzeugung von Komfortgeräusch.
Verfahren nach Anspruch 1, bei welchem der Klassifizierungsschritt die Klassifizierung von wenigstens 16 aneinander anschließenden Rahmen dieser Rahmen als Geräusch einschließt, der Neuklassifizierungsschritt den Schritt der Neuklassifizierung der ersten sechszehn von diesen wenigstens sechszehn aneinander anschließenden Rahmen als Geräuschanalyse-Rahmen einschließt.
Verfahren nach Anspruch 1 oder Anspruch 2, ferner umfassend die Berechnung jedes dieser Geräuschanalyse-Rahmen, i, einschließlich von Sprachpro ben s_i(0), s_i(1), s_i(79), die zur Berechnung der Autokorrelationswerte r_i[j] verwendet werden, als
worin j = 0,..., 8 und worin i = 1,..., 16.
Verfahren nach Anspruch 3, bei welchem der Berechnungsschritt die Berechnung der gewichteten Mittelwerte R[j] der Autokorrelationswerte r_i[j] gemäß
umfaßt, worin ω_j eine exponentielle Wichtungsfunktion ist.
Verfahren nach Anspruch 4, bei welchem der Berechnungsschritt die Berechnung der exponentiellen Wichtungsfunktion ω_j gemäß ω_j = 0,8^j umfaßt.
Verfahren zur Erzeugung von Komfortgeräusch zur Einfügung zwischen Sprachimpulsen in einer Sprachsyntheseeinrichtung, mit dem Schritt der Verwendung eines Erregungssignals, das eine gewichtete Summe einer Pseudozufalls-Geräuschkomponente und eine Komponente umfaßt, die von vergangenen Filteranregungen während Rahmen segmenten abhängt, die dem Geräusch vorausgegangen sind.
Verfahren nach Anspruch 6, ferner umfassend den Empfang einer Pseudozufalls-Geräuschkomponente, die weißes Gauss'sches Rauschen enthält.
Verfahren nach Anspruch 6 oder Anspruch 7, ferner umfassend den Empfang einer Komponente, die von vergangenen Anregungen abhängt, einschließlich einer synthetischen Sprachkomponente.
Verfahren nach Anspruch 8, ferner umfassend den Empfang der synthetischen Sprachkomponente in Form eines zufällig verzögerten Segments eines adaptiven Codebuches.
Verfahren nach Anspruch 8 oder Anspruch 9, ferner umfassend die Zuordnung eines Wichtungswertes zu der synthetischen Sprachkomponente, wobei die Wichtung über die Zeit reduziert wird.
Verfahren nach einem der Ansprüche 8 bis 10, ferner umfassend die Erzeugung der synthetischen Sprachkomponentes ŝ(i, j)[n] in jedem geräuschbehafteten Unterrahmen (i, j) durch Zuführung eines Anregungssignals e_ij(n) zu einem autoregressiven Filter B. Ordnung mit den Koeffizienten a[0] = 1,0, a[1],..., a[8].
Verfahren nach Anspruch 11, ferner umfassend die Bereitstellung des autoregressiven Filters in der Form:
worin n = 1, 2,..., 40; i = (k + 1),..., N; und worin j = 1, 2,..., 40.
Verfahren nach Anspruch 12, bei welchem der Schritt der Bereitstellung des autoregressiven Filters die Einspeisung des Anregungssignals e(n) in der Form einer gewichteten Sunune umfaßt, enthaltend: eij(n) = (1 – fi)N(0,σ2) + fid(n -l(ij)) worin l_(ij) eine gleichmäßig verteilte Zufallszahl ist, deren Bereich von dem Speicher des adaptiven Codebuches abhängt, worin f ein Wichtungsfaktor ist.
Verfahren nach Anspruch 13, ferner umfassend die Bereitstellung eines Wichtungsfaktors f mit f; = 0,95¹.
Diskontinuierliches Übertragungssystem umfassend: einen Codierer zur Erzeugung und Übertragung von Sprachparametern, die übertragene Sprache darstellen, und zur Erzeugung und Übertragung von Geräuschparametern, die dieses Geräusch an dem Codierer darstellen, unter Verwendung eines gewichteten Mittelwertes der Autokorrelationswerte der übertragenen Sprache, der während einer Geräuschanalysephase erzeugt wurde; und einen Decoder zum Empfangen der Sprachparameter und der Geräuschparameter und zur Erzeugung von synthetischer Sprache unter Verwendung der Sprachparameter.
System nach Anspruch 15, bei welchem die Technik der gewichteten Mittelung weniger Gewicht auf die Autokorrelationswerte während eines ersten Teils der übertragenen Sprache und mehr Gewicht auf einen zweiten Teil der übertragenen Sprache legt, wobei der erste Teil der übertragenen Sprache vor dem zweiten Teil der übertragenen Sprache auftritt.
Sprachsyntheseeinrichtung, die zur Erzeugung von Komfortgeräusch betrieben werden kann, unter Verwendung eines Anregungssignals, das eine gewichtete Summe einer Geräuschkomponente sowie eine Komponente enthält, die mit vorausgegangenen Filteranregungen während Rahmensegmenten erhalten wurde, die dem Geräusch vorausgegangen sind.
System nach Anspruch 17, bei welchem die Geräuschkomponente weißes Gauss'sches Rauschen ist.
System nach Anspruch 17 oder Anspruch 18, bei welchem die mit vorausgegangenen Anregungen erzeugte Komponente ein zufällig verzögertes adaptives Codebuchsegment ist.