DE3710664C2

DE3710664C2 -

Info

Publication number: DE3710664C2
Application number: DE3710664A
Authority: DE
Inventors: Yohtaro Tokio/Tokyo Jp Yatsuzuka
Original assignee: Kokusai Denshin Denwa KK
Current assignee: KDDI Corp
Priority date: 1986-04-04
Filing date: 1987-03-31
Publication date: 1988-09-15
Also published as: GB2188820A; GB8707741D0; GB2188820B; DE3710664A1; JPS62234435A; US4757517A; FR2596936A1; FR2596936B1

Description

Die Erfindung betrifft ein Sprachsignal-Übertragungssystem, insbesondere ein Sprachsignal-Übertragungssystem, das von besonderer Nützlichkeit ist, wenn es in einem Nachrichtenübertragungssystem angewendet wird, das einen hohen Ausnutzungswirkungsgrad des Übertragungsweges erfordert, oder angewandt wird in einem Nachrichtenübertragungssystem, das starken Begrenzungen auf dem Übertragungs-Frequenzband und bezüglich der verwendeten Übertragungsleistung unterworfen ist.

Es ist bekannt (Zedler, Günther "Bitratenreduktion bei Sprache: Stand der Anwendung in Fernmeldenetzen" in "ntz", 1985, Bd. 38, Heft 11, Seiten 762 bis 767), das Restsignal eines Sprachsignals mit Hilfe der Pulscodemodulation bzw. der adaptiven Differenzpulscodemodulation zu codieren.

Bisher ist für die digitale Übertragung von Sprachsignalen als grundlegender Übertragungsweg ein 64 Kb/s PCM oder ein 32 Kb/s APCM (anpassungsfähige PCM) verwendet worden. In diesem Fall würde eine Codierung der Sprachsignale mit einer geringen Geschwindigkeit von 4,8 bis 9,6 Kb/s ohne merkliche Verschlechterung ihrer Qualität den Benutzungswirkungsgrad des grundlegenden Übertragungsweges merklich verbessern und die Nachrichtenübertragungskosten verringern.

Für die wirtschaftliche Konstruktion von Systemen, die bezüglich des Übertragungsfrequenzbandes, der Übertragungsleistung und anderen Übertragungseigenschaften stark begrenzt sind, wie ein digitales Schiffahrts-Satelliten-Nachrichtenübertragungssystem, ein Luftfahrt-Satelliten-Nachrichtenübertragungssystem, ein digitales Geschäfts-Satelliten-Nachrichtenübertragungssystem für geschäftliche Nachrichtenübertragungen und ein digitales bewegliches Funk-Nachrichtenübertragungssystem für Automobile, besteht eine Forderung nach einem Sprachsignal-Codiersystem, welches eine ausgezeichnete codierte Sprachsignalqualität und eine Codiergeschwindigkeit von etwa 4,8 bis 9,6 Kb/s erreicht und das unempfindlich ist für den Einfluß von Fehlern auf dem Übertragungsweg. Die Verwirklichung eines solchen Sprachsignal-Codiersystems macht es auch möglich, eine notwendige Speicherkapazität nicht nur in den oben genannten technischen Bereichen, sondern auch in einem Falle zu reduzieren, in welchem Sprachsignale in codierter Form gespeichert werden.

Bisher hat man ein remanent erregtes lineares Vorhersage- Codiersystem (im folgendes als "RELP-System") bezeichnet, als typisches Codiersystem vorgeschlagen, welches die Codiergeschwindigkeit von 4,8 bis 9,6 Kb/s verwendet.

Das RELP-System besitzt die Eigenschaft, daß durch Eingabe eines eingegebenen Sprachsignals in ein Umkehrfilter mit einer gegenüber der Korrelations-Charakteristik des Amplitudenwertes des Eingangs-Sprachsignals umgekehrten Charakteristik ein Restsignal mit einer abgeflachten Kurzzeit- Spektrum-Einhüllenden erhalten wird und dann die Niederfrequenz- Komponente des Restsignals übertragen wird, nachdem sie durch PCM oder anpassungsfähige Delta-Modulation (ADM) codiert worden ist. Auf der Empfangsseite wird ein Hochfrequenz-Restsignal durch ein nichtlineares Erzeugungsverfahren, wie eine Gleichrichtung oder ein Spektrum-Halteverfahren eines Spektrum-Faltprinzips auf der Grundlage des durch Wellenform-Decodierung erhaltenen Restsignals erzeugt. Die Niederfrequenz- und Hochfrequenz-Restsignale werden miteinander addiert, um das Restsignal wiederherzustellen. Das Restsignal wird als Erregersignal einem Kurzzeit-Spektrum- Synthesefilter zugeführt, wodurch ein Sprachsignal erzeugt wird, das eine Spektrum-Einhüllende aufweist, die ähnlich derjenigen des originalen Sprachsignals ist.

Mit anderen Worten, das RELP-System verwirklicht die Verringerung der Codiergeschwindigkeit durch Ausblendung der Niederfrequenz- Komponente des Restsignals und deren Übertragung in Form eines Wellenform-Codes.

Übrigens ist es für die Verbesserung der Qualität des synthetischen Sprachsignals in dem RELP-System wichtig, wie genau die die Oberwellenstruktur beibehaltenden Hochfrequenz-Komponenten auf der Syntheseseite hergestellt werden. Nach dem Stand der Technik jedoch, welcher das Frequenzband des Niederfrequenz- Restsignals zur Herabsetzung der Codiergeschwindigkeit verengt, wie es oben beschrieben ist, wird das Frequenzband der herzustellenden Hochfrequenzkomponenten auf der Syntheseseite verbreitert, und es ist eine genaue Reproduktion solcher Hochfrequenzkomponenten schwierig, wodurch eine Begrenzung der Erhöhung der Sprachsignalqualität erfolgt.

Wie oben im einzelnen beschrieben, ist der Nachteil des bekannten RELP-Systems zurückführbar auf die Grundanordnung, welche ein Restsignal eines Sprachsignals durch Umkehrfilterung erhält, daraus ein Niederfrequenz-Restsignal ableitet und dieses nach Codierung in eine Wellenform durch die anpassungsfähige PCM (APCM) oder anpassungfähige Delta-Modulation (ADM) überträgt.

Es ist ein Sprach-Codiersystem bekannt (GB 21 50 377 A), bei welchem ein Wellenform-Codierer und ein Wellenformdecodierer vorgesehen sind und bei welchem das APC-System verwendet wird. Für ein synthetisches Sprachsignal ist hier eine vergleichsweise hohe Codiergeschwindigkeit erforderlich.

Im Hinblick auf den oben erwähnten Nachteil des bekannten Standes der Technik besteht ein Ziel der Erfindung darin, ein Übertragungssystem zu schaffen, mit dem es möglich ist, ein synthetisches Sprachsignal ausgezeichneter Qualität auch dann zu erhalten, wenn eine niedrige Codiergeschwindigkeit angewendet wird.

Um das obengenannte Ziel zu erreichen besteht das Übertragungssystem nach der Erfindung darin, daß ein eingegebenes Sprachsignal aufgeteilt wird in Niederfrequenz- und Hochfrequenz- Restsignale, daß das Niederfrequenz-Restsignal in Form eines Wellenform-Codes mit höherer möglicher Genauigkeit und geringerer möglicher Qualitätsverschlechterung durch Verwendung des anpassungsfähigen Vorhersage-Codier (APC)-Systems oder Mehrimpuls-angeregte-Codierung (MPEC)-Systems übertragen wird, während die Information auf dem Kurzzeit-Hochfrequenz-Spektrum aus dem Hochfrequenz-Restsignal ausgeblendet und als Information für die Verwendung bei der Reproduktion des Sprachsignals auf der Empfangsseite übertragen wird.

Die Erfindung wird im folgenden anhand der Zeichnung an Ausführungsbeispielen näher erläutert. In der Zeichnung zeigen

Fig. 1A, 1B und 2 Blockschaltbilder, welche ein Beispiel eines bekannten RELP-Systems zeigen,

Fig. 3 ein Blockschaltbild, welches eine Ausführung nach der vorliegenden Erfindung zeigt,

Fig. 4A ein Blockschaltbild, welches ein besonderes Beispiel eines in der Ausführung nach Fig. 3 verwendeten Wellenform-Codierers zeigt,

Fig. 4B ein Blockschaltbild, welches ein Beispiel eines Wellenform-Decodierers zur Erzeugung eines nach der vorliegenden Erfindung übertragenen Signals zeigt,

Fig. 5 ein Schaltbild zur Erläuterung der Grundlagen der vorliegenden Erfindung,

Fig. 6 ein Blockschaltbild, welches eine Vorrichtung zur Erzeugung einer höher harmonischen Welle zur Erzeugung eines empfangenen Signals, das nach der vorliegenden Erfindung übertragen worden ist, zeigt,

Fig. 7A, 7B, 7C und 7D Zeittafeln, welche die Arbeitsweise der Vorrichtung nach Fig. 6 erläutern,

Fig. 8, 9 und 10 Blockschaltbilder, welche besondere Beispiele eines Hochfrequenz-Ton-Synthese- Filters, eines Kurzzeit-Hochfrequenz- Synthese-Filters und eines Hochfrequenz- Spektrum-Form-Filters zeigen, die verwendet werden, um ein nach der vorliegenden Erfindung übertragenes, empfangenes Signal zu reproduzieren, und

Fig. 11 und 12 Blockschaltbilder zur Erläuterung von Vorrichtungen und deren Operation für die Verbesserung der reproduzierten Eigenschaften des nach der Erfindung übertragenen Signals und

Fig. 13A und 13B Diagramme zur Erläuterung der Arbeitsweise der Vorrichtungen nach den Fig. 11 und 12.

Zur Erläuterung des Unterschiedes zwischen dem Stand der Technik und der vorliegenden Erfindung soll zunächst ein Beispiel einer bekannten Vorrichtung beschrieben werden.

Fig. 1A zeigt ein besonderes Beispiel. Ein eingegebenes analoges Sprachsignal an einer Eingangsklemme 1 wird beispielsweise durch ein Analogfilter 2 im Frequenzband auf 0,3 bis 3,5 KHz begrenzt, und es wird durch einen A/D-Wandler 3 in ein digitales Sprachsignal 4 umgewandelt, das z. B. mit 8 KHz abgetastet wird.

Ein Umkehrfilter 6 eliminiert die Korrelation der Amplitude der Abtastproben des digitalen Sprachsignals 4, wodurch deren Spektrum-Einhüllende abgeflacht wird. Der in dem Umkehrfilter 6 festgelegte Filterkoeffizient wird erhalten durch Analysieren der Kurzzeit-Spektrum-Hüllkurve des digitalen Sprachsignals 4 in dem Umkehrfilter 6, und zwar beispielsweise an jedem Rahmen von 20 ms durch ein Auto-Korrelationsverfahren oder dergleichen. Der Filterkoeffizient wird durch einen LPC-Koeffizienten- Codierer 7 für jeden Rahmen codiert und in dem Umkehrfilter 6 über einen LPC-Koeffizienten-Decodierer 8 eingestellt, und er wird gleichzeitig zur Empfangsseite übertragen, wie es später beschrieben wird. Durch den Umkehrfilter 6 wird ein Signal 35 mit abgeflachtem Spektrum erzeugt, welches ein Restsignal genannt wird. Damit nur die Niederfrequenz-Komponente des Restsignals 35 übertragen wird, wird das Niederfrequenz- Restsignal durch ein Tiefpaßfilter 9 ausgeblendet, dessen Durchlaß-Frequenzband von 0 bis 1000 Hz reicht. Die Abtastgeschwindigkeit dieses Signals wird durch einen Abtastgeschwindigkeits- Wandler 10 gemäß dem Frequenzband des Signals von 8 KHz auf 2 KHz in diesem Beispiel umgewandelt. Das Signal einer so niedrigen Abtastgeschwindigkeit wird durch einen Wellenform-Codierer 11 wellenform-codiert. Wie oben erwähnt, wird die anpassungsfähige PCM (APCM) oder die anpassungsfähige Delta-Modulation (ADM) für die Wellenformcodierung verwendet.

Um ferner bei der Reproduktion der Hochfrequenz-Komponenten des Restsignals auf der Empfangsseite eine Pegeljustierung zu ermöglichen, mißt die Sendeseite das Leistungsverhältnis zwischen dem Restsignal 35 und dem Niederfrequenz-Restsignal durch einen Leistungskomparator 12 und codiert es durch einen Codierer 13. Die Ausgangssignale vom Wellenform-Codierer 11, vom Codierer 13 und vom Koeffizienten-Codierer 7 werden einem Multiplexer 15 zugeführt, in dem sie zusammen mit einem Rahmen-Synchronisationssignal von einem Rahmen-Synchronisationssignalgenerator 14 bei einer erforderlichen Codiergeschwindigkeit mehrfach ausgenutzt werden. Das mehrfach ausgenutzte Ausgangssignal wird dem Übertragungsweg über eine Ausgangsklemme 16 zugeführt.

Es wird nun der Betrieb auf der Empfangsseite unter Bezugnahme auf Fig. 1B beschrieben.

Das Signal vom Übertragungsweg wird über eine Klemme 17 einem Demultiplexer 18 zugeführt, durch den es getrennt wird in das Wellenform-codierte-Niederfrequenz-Restsignal, die Leistungsverhältnis- Information und die Filter-Koeffizienten- Information jedes Rahmens, und zwar in Synchronismus mit dem Rahmen-Synchronisationssignal, welches durch einen Rahmen- Synchronisationssignal-Detektor 19 festgestellt wird. Das Niederfrequenz-Restsignal, das durch einen Wellenform-Decodierer 20 decodiert wird, wird in ein Signal einer 8-KHz-Abtastgeschwindigkeit durch Abtast-Interpolation durch einen Abtastgeschwindigkeits- Wandler 21 übertragen. Das so erhaltene Signal wird durch einen Tiefpaßfilter 22 im Frequenzband begrenzt, wodurch das Niederfrequenz-Restsignal reproduziert wird. Ein Generator 23 für höhere harmonische Wellen erzeugt höhere harmonische Wellen durch eine nicht-lineare Schaltung oder ein Spektrum-Halteverfahren auf der Grundlage des Niederfrequenz- Restsignals. Die höher harmonischen Wellen werden einem Hochpaßfilter 24 mit beispielsweise einem Durchlaßfrequenzband von 1 bis 4,0 KHz zugeführt, indem es in ein Hochfrequenz-Restsignal übertragen wird. Eine Pegel-Einstellvorrichtung 25 justiert den Pegel des Hochfrequenz-Restsignals, so daß seine Beziehung zum Pegel des Niederfrequenz-Restsignals derart wird, wie es durch die Leistungsverhältnis-Information, die dem Decodierer 26 geliefert wird, angezeigt wird. Danach werden die Hochfrequenz- und Niederfrequenz-Restsignale zusammen durch einen Addierer 27 in ein Restsignal eines 4-KHz-Frequenzbandes addiert, das als ein Erregersignal 36 einem Spektral-Synthesefilter 29 für das Kurzzeit-Spektrum zugeführt. Da der mit einem LPC-Koeffizientendecodierer 28 erhaltene Filterkoeffizient in das Synthesefilter 29 eingesetzt wird, ergibt das Erregersignal 36 eine Frequenzcharakteristik, die ein digitales Sprachsignal 39 erzeugt. Das Signal 39 wird einem D/A-Wandler 30 und einem Analogfilter 31 zugeführt, wodurch es an einer Klemme 32 als ein im Frequenzband begrenztes analoges Sprachsignal auftritt.

Das oben beschriebene RELP-System ist grundsätzlich fehlerhaft für die Übertragung von Signalen mit einer niedrigen Codiergeschwindigkeit und für die Verbesserung der Qualität decodierter Sprachsignale. Dieser Fehler wird unten im einzelnen beschrieben.

Nach dem oben erwähnten RELP-System ist die Grundanordnung für das Niederfrequenz-Restsignal, das in eine Wellenform codiert ist, derart, wie es in Fig. 2 gezeigt ist. D. h., es sind eine Abtastgeschwindigkeits-Wandlervorrichtung und eine Codier/Decodier-Vorrichtung zwischen dem Umkehrfilter 6 und dem Synthesefilter 29 vorgesehen, und es wird durch die Codiervorrichtung ein quantisierendes Rauschen N(z) dem Niederfrequenz- Restsignal zugesetzt. Das Umkehrfilter 6 enthält einen Kurzzeit-Prädiktor 33 und einen Subtrahierer 34, während das Synthesefilter 29 einen Kurzzeit-Prädiktor 37 der gleichen Charakteristik wie diejenige des Prädiktors 33 und einen Addierer 38 enthält. Es sei nun die Übertragungsfunktion des Prädiktors 37 durch eine Z-Umwandlung ausgedrückt, und es sei das Niederfrequenz-Restsignal jeweils durch P(z) und durch S(z) ausgedrückt, so daß das reproduzierte Niederfrequenz- Restsignal R(z) folgendermaßen ausgedrückt werden kann:

Wie sich aus Gleichung (1) ergibt, wird in dem reproduzierten Niederfrequenz-Restsignal R(z) eine quantisierende Rauschkomponente N(z) eingemischt, welche das Synthesefilter 29 durchsetzt hat. Zusätzlich sei angenommen, daß die quantisierende Rauschkomponente N(z) ein flaches Spektrum hat und die gleiche Spektraleinhüllende wie diejenige des Sprachsignals erzeugt wird, was zu einer schwerwiegenden Verschlechterung der subjektiven Tonqualität des Niederfrequenz-Restsignals führt. Dies ist die gleiche Erscheinung, wie sie oft in der Wellenform-Codierung durch ein anpassungsfähiges Voraussage- Codiersystem (im folgenden als "APC-System" bezeichnet) erwähnt ist. Aus diesem Grunde ist es üblich, in der Wellenform- Codierung durch das bekannte RELP-System das Auftreten des quantisierenden Rauschens N(z) durch die Verwendung von drei oder mehr quantisierenden Bits möglichst klein zu halten und das Frequenzband des Niederfrequenz-Restsignals einzuengen, um die Codiergeschwindigkeit zu reduzieren.

Beispielsweise nach einem bekannten 9,6-Kb/s-RELP-System hat das Niederfrequenz-Restsignal ein 1-KHz-Frequenzband, und es wird abgetastet mit einer Geschwindigkeit von 2 KHz und es wird eine Abtastprobe in vier Bits quantisiert. Die hierfür notwendige Zahl sind 8 K/Bits, und es werden die restlichen 1,6 K/Bits für die Übertragung anderer Informationen verwendet. In einem 7,2-Kb/s-RELP-System besitzt das Niederfrequenz-Restsignal ein 0,8-KHz-Frequenzband, und es wird mit 1,6 KHz abgetastet, und es ist eine Abtastprobe in drei Bits quantisiert. Die hierfür erforderliche Anzahl Bits sind 4,8 K/Bits, und es werden die verbleibenden 3,4 K/Bits für die Übertragung anderer Informationen zugeteilt. Ferner kann in einem 4,8-Kb/s-RELP-System das Frequenzband des Niederfrequenz-Signals nicht unter 800 Hz liegen, und zwar mit Rücksicht auf die Verteilungscharakteristik der Grundfrequenz des Sprachsignals, und es liegt die untere Grenze der Abtastfrequenz bei 1,6 KHz als niedrigste Frequenz. Aus diesem Grund ist die 3-Bit-Quantisierung unmöglich, und es wird die Qualität des synthetischen Sprachsignals beeinträchtigt.

Aufgrund der obengenannten Konstruktion weist die Vorrichtung nach dem Stand der Technik die oben erwähnten Nachteile auf.

Fig. 3 zeigt eine Ausführung nach der Erfindung. Die folgende Beschreibung erfolgt unter der Annahme, daß das analoge Sprachsignalband 4 KHz beträgt.

Das analoge Sprachsignal von der Eingangsklemme 1 wird einer Frequenzbandbeschränkung durch das Analogfilter 2 unterworfen, und es wird darauf durch den A/D-Wandler 3 in das Digitalsignal 4 umgewandelt, das mit einer Geschwindigkeit von 8 KHz abgetastet wird. Das Digitalsignal 4 wird aufgeteilt in Niederfrequenz- und Hochfrequenz-Sprachsignale, und zwar durch einen Tiefpaßfilter 40 und einen Hochpaßfilter 41. Die Abtastgeschwindigkeit des Niederfrequenz-Sprachsignals wird durch einen Abtastgeschwindigkeits-Wandler 42 von einer 8-KHz-Abtastgeschwindigkeit auf eine Abtastgeschwindigkeit umgewandelt, die zweimal höher ist als das Frequenzband dieses Signals, und es wird danach durch einen Wellenform-Codierer 43 genau in geeignete Wellenform-Codes codiert. Andererseits wird das Hochfrequenz-Sprachsignal durch einen Kurzzeit- Spektralanalysator 45 spektral analysiert. Die als Ergebnis der Analyse erhaltene Koeffizienten-Information wird durch einen LPC-Koeffizienten-Codierer 47 codiert. Ferner werden die Ausgangsleistungen des Tiefpaßfilters 40 und des Hochpaßfilters 41 durch einen Leistungs-Komparator 48 verglichen, und es wird das Vergleichsergebnis durch einen Codierer 49 codiert, und zwar als einer von Parametern für die Reproduktion des Hochfrequenz-Sprachsignals auf der Synthese-Seite. Die Ausgangssignale von dem Wellenform-Codierer 43, dem LPC- Koeffizienten-Codierer 47 und dem Codierer 49, wie sie oben beschrieben sind, werden durch einen Multiplexer 44 zusammen mit dem Rahmen-Synchronisationssignal vom Rahmen-Synchronisationssignal- Generator 14 gemultiplext, und es wird das gemultiplexte Ausgangssignal auf dem Übertragungsweg über die Klemme 16 erhalten. Die abgeschnittenen Frequenzen der Tiefpaß- und Hochpaß-Filter 40 und 41 werden später zusammen mit der Charakteristik des Wellenform-Codierers 43 beschrieben. Im folgenden wird die Arbeitsweise der Empfangs- und Synthese- Seite beschrieben.

Das Signal vom Übertragungswert wird über die Klemme 17 einem Demultiplexer 50 zugeführt, indem es in das Rahmen-Synchronisationssignal, das codierte Niederfrequenz-Sprachsignal, die codierte Koeffizienten-Information und die codierte Leistungsverhältnis-Information aufgeteilt wird. Das codierte Niederfrequenz-Sprachsignal wird durch einen Wellenform- Decodierer 51 decodiert, durch einen Abtastgeschwindigkeits- Wandler 52 auf die Abtastgeschwindigkeit von 8 KHz interpoliert und dann durch einen Tiefpaßfilter 53 geschickt, wodurch es als Niederfrequenz-Sprachsignal erzeugt wird. Andererseits wird das Hochfrequenz-Sprachsignal in folgender Weise reproduziert: Ein Erregersignal oder ein Restsignal eines Niederfrequenz-Spektral-Synthesefilters in dem Wellenform- Decodierer 51, wie er später beschrieben wird, wird von einer Klemme 54 abgenommen und in einen Generator 55 für eine höher harmonische Welle eingeführt. Als Erzeugungsvorrichtung für eine höher harmonische Welle kann irgendeines der bekannten Verfahren, wie ein Gleichrichterverfahren, ein Spektral-Faltverfahren oder ein Polaritäts-Impulsverfahren verwendet werden, jedoch werden später Erzeugungsvorrichtungen für höher harmonische Wellen beschrieben, die wirksam den subjektiven Beurteilungswert verbessern. Ein durch den Generator 55 für eine höher harmonische Welle erzeugtes höher harmonisches Wellensignal 69 wird aus dem Niederfrequenz-Sprachsignal abgeleitet, dessen harmonische Struktur und Frequenzcharakteristik diejenigen des Original-Sprachsignals nicht genau wiederspiegelt. Deshalb wird das höher harmonische Wellensignal 69 weiter der folgenden Verarbeitung unterworfen. Das Signal wird einem Hochfrequenz-Tonhöhen-Synthesefilter 56 zugeführt, in welchem eine der Tonhöhenperiode des Niederfrequenz-Sprachsignals folgende Spektralstruktur erzeugt wird, und es wird dann eine Kurzzeit-Hochfrequenz-Spektraleinhüllende erzeugt, und zwar durch ein Kurzzeit-Hochfrequenz-Synthesefilter 46. Die Tonhöhenperiode und der Filterkoeffizient des Hochfrequenz- Tonhöhen-Synthesefilters 56 werden erhalten durch Abnahme der Tonhöhenperiode und des Filterkoeffizienten eines Niederfrequenz- Tonhöhen-Synthesefilters im Wellenform-Decodierer 51, und sie werden, wie erforderlich, unter Berücksichtigung der Abtastgeschwindigkeit des Niederfrequenz-Sprachsignals und der Abtastgeschwindigkeit des höher harmonischen Wellensignals bewertet. Wenn beispielsweise die Abtastgeschwindigkeiten des Niederfrequenz-Sprachsignals und des harmonischen Wellensignals 2 und 8 KHz betragen, wird eine Tonhöhenperiode eingestellt, die viermal länger ist als diejenige, die dem Wellenform-Decodierer 51 entnommen worden ist, und es wird der Filterkoeffizient so verwendet wie er ist, oder er wird als bewerteter Wert verwendet. Die Filterkoeffizient des Kurzzeit-Hochfrequenz-Synthesefilters 46 wird von der Übertragungsseite übertragen und durch einen LPC-Koeffizienten-Decodierer 58 decodiert.

Der Parameter des Hochfrequenz-Tonhöhen-Synthesefilters 56 kann auch auf der Übertragungsseite gemessen und dann von da zur Empfangsseite übertragen werden, wenn die Übertragungs- Bit-Kapazität ausreichend groß ist.

Das Ausgangssignal 63 vom Kurzzeit-Hochfrequenz-Spektral- Synthesefilter 46 wird ferner einem Hochfrequenz-Spektral- Formfilter 59 zugeführt, in welchem dessen Spektrum so geformt wird, daß die Qualität des zu erzeugenden Hochfrequenz- Sprachsignals so nahe wie möglich an der subjektiven Qualität des originalen Hochfrequenz-Sprachsignals liegt. Als Filterkoeffizient wird zu dieser Zeit ein Wert verwendet, der auf den Filterkoeffizienten, die für den Hochfrequenz- Tonhöhen-Synthesefilter 56 und den Kurzzeit-Hochfrequenz- Synthesefilter 46 bewertet ist.

Auf diese Weise wird das höher harmonische Wellensignal 69, das durch den Generator 55 für höher harmonische Wellen erzeugt worden ist, geformt, indem es mit der Tonhöhenstruktur und der Spektralstruktur des originalen Hochfrequenz-Sprachsignals versorgt wird, wodurch die subjektive Auswertung des erzeugten Hochfrequenz-Sprachsignals deutlich verbessert werden kann.

Besonders bei Verwendung des Spektral-Faltverfahrens als Vorrichtung zur Erzeugung von höher harmonischen Wellen kann ein der Faltperiode zuschreibbares Einzelfrequenz-Rauschen, das sogenannte Totalrauschen, das bisher ein Problem gewesen ist, beträchtlich reduziert werden.

Das so erzeugte Hochfrequenz-Sprachsignal wird durch einen Pegeljustierer 61 in seinem Leistungsverhältnis zum Niederfrequenz- Sprachsignal auf der Basis der Ausgangsinformation von einem Decodierer 60 justiert. Dann wird das Hochfrequenz- Sprachsignal einem Addierer 62 zugeführt, in welchem es dem Niederfrequenz-Sprachsignal hinzugefügt wird, um das digitale Sprachsignal 39 des 4-KHz-Bandes zu erzeugen. Das digitale Sprachsignal wird dem D/A-Wandler 30 und dem Analogfilter 31 zugeführt, worauf es von der Klemme 32 ausgegeben wird.

Es erfolgt nun eine Beschreibung von Beispielen der Anordnungen des Wellenform-Codierers 43 und des Wellenform-Decodierers 51, die nach diesen Ausführungen verwendet werden, und zwar zusammen mit dem Verhältnis zwischen dem Niederfrequenz-Sprachsignal- Frequenzband und der Codiergeschwindigkeit.

Die Fig. 4A und 4B zeigen Beispiele der Anordnungen des Wellenform-Codierers 43 und des Wellenform-Decodierers 51. Diese Beispiele verwenden das APC-System, und sie sind in dem japanischen Patentblatt Nr. 1 16 000/85 veröffentlicht.

Die Operation des in Fig. 4A gezeigten Wellenform-Codierers 43 wird zuerst beschrieben.

Ein digitales Eingangssignal S _j wird über eine Codierer- Eingangsklemme 70 einem LPC-Spektralanalysator 71 zugeführt, in welchem es einer Kurzzeit-Spektralanalyse (einer LPC-Analyse) für jeden Rahmen unterworfen wird. Der sich ergebende LPC-Parameter wird durch einen LPC-Parameter-Codierer 72 codiert und wird darauf über einen Multiplexer 98 zur Übertragungsseite übertragen.

Ferner wird das Ausgangssignal des LPC-Parameter-Codierers 72 durch einen LPC-Parameter-Decodierer 73 decodiert, wodurch ein Vorhersage-Koeffizient erhalten wird. Der Vorhersage- Koeffizient wird zu verschiedenen Werten für entsprechende Anzapfungen eines digitalen Filters bewertet, die einen Kurzzeit-Prädiktor 74 bilden, wodurch erneut ein Vorhersagekoeffizient erzeugt wird. Angenommen nun, daß die Z- umgewandelte Übertragungsfunktion des Kurzzeit-Prädiktors 74 folgendermaßen ist:

wobei
a _i = α _i β ⁱ .

In der obigen Gleichung ist N die Anzahl an Anzapfungen. a _i ist ein Vorhersage-Koeffizient einer i-ten Anzapfung. α _i ist ein Vorhersage-Koeffizient, der durch Decodierung des Ergebnisses der LPC-Analyse erhalten worden ist. β ist eine feste Konstante, welche den Bewertungswert darstellt und die einen Wert innerhalb des Bereiches von 0 ≦ωτ β ≦ωτ 1 besitzt. Der Vorhersage-Koeffizient a _i wird für ein Rauschen-Formungs- Filter 87 und für einen Kurzzeit (Spektrum)-Prädiktor 93 für eine lokale Decodierung verwendet. Der Vorhersage-Ausgang vom Kurzzeit-Prädiktor 74, welcher den Vorhersage- Koeffizienten a _i (wobei i = 1 bis N) verwendet, wird durch einen Subtrahierer 75 von einem Eingangssignal subtrahiert, wodurch ein Kurzzeit-Spektral-Restsignal erhalten wird. Das Restsignal hat in diesem Augenblick keine Korrelation in einer kurzen Zeit außer der Tonhöhen-Periode. Ausgehend von diesem Signal erhält ein Tonhöhen-Parameter-Codierer 77, der über einen Tonhöhen-Analysator 76 mit dem oben erwähnten Subtrahierer 75 verbunden ist, eine Korrelation zwischen dem Sprachsignal und der Tonhöhenperiode N _p und errechnet einen Vorhersage-Koeffizienten für einen Langzeit (Spektrum)- Prädiktor 79. Der Langzeit (Spektrum)-Prädiktor 79 errechnet einen Vorhersagewert unter Verwendung der Tonhöhen-Periode, des Vorhersage-Koeffizienten und des Ausgangssignals vom Subtrahierer 75, und zwar unter Verwendung einer Tatsache, daß das Sprachsignal im wesentlichen in der gleichen Wellenform entsprechend der Tonhöhen-Periode wiederholt wird. Durch Subtrahieren des obengenannten Kurzzeit-Vorhersagewertes und des Langzeit-Vorhersagewertes vom Eingangssignal kann das Restsignal am Ausgangsrauschen eines Subtrahierers 80 im wesentlichen in idealer Weise ausgelöscht werden. Die Tonhöhen- Periode und der durch den Tonhöhen-Parameter-Codierer 77 codierte Vorhersagekoeffizient werden über den Multiplexer 98 zur Empfangsseite übertragen.

Von dem so ausgelöschten (whitened) Ausgangssignal des Subtrahierers 80 wird das Ausgangssignal des Rausch-Form- Filters 87 durch einen Subtrahierer 88 subtrahiert, dessen Ausgangssignal mit Hilfe eines anpassungsfähigen Quantisierers 84 als das endgültige Restsignal quantisiert und codiert wird. Der anpassungsfähige Quantisierer 84 hat als seine Grund- Schrittgröße eine quantisierende Schrittgröße, welche einen optimalen Wert erzeugt, d. h., das quantisierende Rauschen so klein wie möglich macht, wenn die Varianz des endgültigen Restsignals 1 ist. Wenn also die Varianz des endgültigen Restsignals nicht 1 ist, wird die quantisierende Charakteristik verschlechtert. Es ist ein RMS-Rechner 81, welcher diese Verschlechterung kompensiert. Durch Multiplikation der Grund- Schrittgröße mit dem in dem RMS-Rechner 81 errechneten RMS- Wert kann ein quantisierendes Schrittoptimum für den RMS-Wert erreicht werden, und es kann auch das endgültige Restsignal gesteuert werden durch Zurückführen auf den RMS-Wert, so daß die Varianz 1 wird. Für die Vergrößerung der Signalqualität ist es erwünscht, mehrere Arten von Grundschrittgrößen vorzubereiten, wobei die Art der Amplitudenverteilung des endgültigen Restsignals, wie die Gauß'sche oder Laplace'sche Verteilung in Betracht gezogen wird. Jedoch hat das endgültige Restsignal am Ausgang des Subtrahierers 88 keine ideale Verteilung, weil es durch Subtraktion von dem ausgelöschten Signal des Ausgangssignals des Rausch-Form-Filters 87 erzeugt ist, welches Filter 87 eine Frequenzabschneidecharakteristik besitzt. Deshalb ist eine Reihe von Prozeßschritten, wie sie unten beschrieben ist, erforderlich, um eine optimale Quantisierungsschrittgröße zu erhalten.

Es sei angenommen, daß die quantisierende Schrittgröße für jeden Teilrahmen geändert wird.

Der RMS-Wert des Restsignals wird durch den RMS-Wert-Rechner 81 für jeden Teilrahmen erhalten, und er wird ferner einem RMS-Wert-Codierer 82 und einem RMS-Wert-Decodierer 83 zugeführt, wodurch ein quantisierter RMS-Wert erhalten wird. Der Ausgangspegel des RMS-Wert-Codierers 82 wird zu dieser Zeit als ein Bezugspegel angesehen, und er wird entlang den angrenzenden Stufen in dem Codierer 82 gespeichert. Zuerst wird die Schrittgröße des anpassungsfähigen Quantisierers 84 bestimmt, und zwar unter Verwendung eines quantisierten RMS-Wertes entsprechend dem Bezugspegel bzw. Bezugswert als Bezugs-RMS-Wert. Dann wird das Ausgangssignal des Rausch- Form-Filters 87 durch den Subtrahierer 88 vom Restsignal subtrahiert, und es wird das subtrahierte Ausgangssignal als das endgültige Restsignal quantisiert und codiert. Ferner wird das codierte Signal einem anpassungsfähigen Entquantisierer 85 zugeführt, um ein quantisiertes endgültiges Restsignal zu erhalten, von dem durch einen Subtrahierer 86 das nicht-quantisierte endgültige Restsignal subtrahiert wird, wodurch ein quantisiertes Rauschen erhalten wird. Das so erhaltene quantisierte Rauschen wird dem Rausch-Form-Filter 87 zugeführt. Gleichzeitig wird das quantisierte endgültige Restsignal einem Addierer 90 zugeführt, indem es mit dem Ausgangssignal von einem Langzeit (Spektrum)-Prädiktor 89 zur lokalen Decodierung addiert wird. Ferner wird das addierte Ausgangssignal durch einen Addierer 91 mit dem Ausgangssignal des Kurzzeit (Spektrum)-Prädiktors 93 zur lokalen Decodierung addiert. Infolgedessen wird ein lokal decodiertes Eingangssignal S _j an einer lokal decodierten Signalklemme 92 erhalten. Eine Differenz zwischen dem lokal decodierten Eingangssignal und dem Eingangssignal wird durch einen Subtrahierer 97 als Fehlersignal erhalten. Die Leistung des Fehlersignals wird in einem Minimum-Fehler- Leistungsdetektor 96 über den Teilrahmen berechnet. Für alle die grundlegenden Stufengrößen, die für je eine Reihe von Operationen, ähnlich denjenigen, die oben beschrieben sind, ausgeführt worden sind, wird die Leistung des jedem entsprechenden Fehlersignals durch den Minimum-Fehler-Leistungsdetektor 96 errechnet und darin gespeichert. Ferner werden entsprechende Schrittgrößen für alle einer vorbestimmten Nummer von RMS-Pegeln nahe dem Bezugs-RMS-Pegel erhalten, und sie werden in den anpassungsfähigen Quantisierer 84 eingesetzt. Wie bei der grundlegenden Schrittgröße werden die vorgenannten Prozeßschritte ausgeführt, durch die die Fehlersignal- Leistung für jeden RMS-Pegel errechnet und gespeichert wird. Diejenige Kombination eines vorbestimmten Bezugs-RMS-Wertes und benachbarter RMS-Werte und der vorbereiteten grundlegenden Schrittgröße, die das Minimum einer der Fehlersignal-Leistungen bewirken, erhalten entsprechend allen oben genannten Kombinationen, wird als Optimum-Quantisierungs-Parameter angesehen, welche durch einen Schrittgrößen-Codierer 94 codiert werden und dann über den Multiplexer 98 zur Empfangsseite übertragen werden. Für die grundlegende Schrittgröße wird durch den Schrittgrößen-Codierer 94 ein entsprechendes Code-Wort erzeugt und über den Multiplexer 98 zur Empfangsseite übertragen.

Als nächstes wird in Verbindung mit Fig. 4B die Arbeitsweise der Empfangsseite beschrieben. Das über eine Decoder-Eingangs- Klemme 100 erhaltene Signal wird durch einen Demultiplexer 101 in ein das endgültige Restsignal betreffendes Signal, ein den RMS-Wert betreffendes Signal, ein die grundlegende Schrittgröße betreffendes Signal und ein den Tonhöhen-Parameter betreffendes Signal aufgeteilt. Der RMS-Wert wird durch einen RMS-Wert-Decodierer 103 decodiert. Dieser Wert und die durch einen Schrittgrößen-Decodierer 102 erhaltene grundlegende Schrittgröße werden in einen Dequantisierer 104 eingegeben. Auf diesen basierend, wird das das empfangene endgültige Restsignal betreffende Signal I _j durch den Dequantisierer 104 decodiert, und es wird ein quantisiertes endgültiges Restsignal E _j erhalten. Andererseits wird der über einen LPC-Parameter-Decodierer 107 erhaltene Vorhersage-Koeffizient in einen Kurzzeit-Prädiktor 110 eingegeben.

Das den Tonhöhen-Parameter betreffende Signal wird einem Tonhöhen-Parameter-Decodierer 106 zugeführt, durch den die Tonhöhenperiode und der Vorhersage-Koeffizient erhalten werden, und sie werden in einen Langzeit-Prädiktor 108 eingegeben. Der Vorhersageausgang vom Langzeit-Prädiktor 108 wird durch einen Addierer 105 mit dem Ausgang vom Dequantisierer 104 addiert, und es wird der addierte Ausgang dem Langzeit- Prädiktor 108 zugeführt. Gleichzeitig wird der addierte Ausgang dem Vorhersageausgang vom Kurzzeit-Prädiktor 110 mit Hilfe eines Addierers 109 hinzuaddiert, wodurch ein decodiertes Sprachbandsignal S _j erhalten wird.

Das endgültige Restsignal E _j oder das Ausgangssignal vom Addierer 105 wird als ein hochfrequenzerzeugendes Signal an eine Klemme 54 ausgegeben. Der Ausgang vom Tonhöhen- Parameter-Decodierer 106 ist an einer Klemme 57 vorgesehen.

Die grundlegende Bearbeitung für das Niederfrequenz-Sprachsignal in der Anordnung nach Fig. 3 unter Verwendung des oben beschriebenen APC-Systems für die Übertragung des Niederfrequenz- Sprachsignals erfolgt nach Fig. 5. In diesem Fall erfolgt eine Beschreibung nur in Verbindung mit einem Fall unter Verwendung eines Kurzzeit-Prädiktors. Das Bezugszeichen 100 bezeichnet einen Kurzzeit-Prädiktor auf der Sendeseite und 101 einen Kurzzeit-Prädiktor auf der Empfangsseite. In diesem Falle sei angenommen, daß die Übertragungsfunktion des Prädiktors 101, die Übertragungsfunktion des Rausch-Form- Filters 87 im Wellenform-Codierer 43, das Niederfrequenz- Sprachsignal und das quantisierende Rauschen dargestellt wird durch P(z), F(z), S(z) und N(z), in welchem Falle das reproduzierte Niederfrequenz-Sprachsignal R(z) folgendermaßen ausgedrückt werden kann:

In Gleichung (2) kann unter einer Bedingung, in welcher F(z) = P/(Z/ δ) und indem der Wert von w kleiner als 1 gemacht wird, der Einfluß des quantisierenden Rauschens merklich hörbar verringert werden im Vergleich mit dem Falle der vorher erwähnten Gleichung (1).

In einer aktuellen Simulation konnte ein reproduziertes Sprachsignal guter Qualität erhalten werden, obwohl durch den adaptiven Quantisierer 84 eine Ein-Bit-Quantisierung bewirkt wurde.

Die Fähigkeit der Übertragung des Niederfrequenzsignals durch die Ein-Bit-Quantisierung bringt in dem RELP-System die folgenden Vorteile mit sich.

In einem Übertragungssystem mit 4,8 Kb/s beträgt das Niederfrequenz- Sprachsignal-Band 1 KHz und es wird abgetastet bei einer Geschwindigkeit von 2 KHz, und es werden Übertragungs- Bits von 2 Kb/s für die Übertragung des Signals zugeteilt, während die Übertragungs-Bits von 2,8 Kb/s der Übertragung der anderen Information zugeteilt werden, wodurch eine Signalübertragung mit hoher Qualität ermöglicht wird. Die Übertragungsgeschwindigkeit von 4,8 Kb/s ist die untere Grenze für die Übertragung eines Sprachsignals hoher Qualität.

In einem 7,2- oder 9,6-Kb/s-Übertragungssystem kann das Niederfrequenz-Sprachsignal-Band erweitert werden. Wenn beispielsweise in dem 7,2-Kb/s-Übertragungssystem Übertragungs- Bits von 4 Kb/s der Übertragung des Niederfrequenz- Sprachsignals zugeteilt werden und 3,2 Kb/s der Übertragung der anderen Information zugeteilt werden, kann das Niederfrequenz- Sprachsignal-Band auf 2 KHz ausgedehnt werden.

Dies bedeutet, daß das Band des auf der Empfangsseite zu reproduzierende Bands des Hochfrequenz-Sprachsignals auf 2 KHz reduziert wird und infolgedessen die Qualität des zu reproduzierenden Sprachsignals beträchtlich verbessert werden kann.

In dem 9,6-Kb/s-Übertragungssystem werden Übertragungs-Bits von etwa 7 Kb/s der Übertragung des Niederfrequenz-Sprachsignals zugeteilt, wobei in diesem Falle das Niederfrequenz- Sprachsignal-Band 3,5 KHz beträgt, während das Band des auf der Empfangsseite reproduzierenden Hochfrequenz-Sprachsignals weniger als 1 KHz beträgt. Auch wenn also die das Hochfrequenz-Sprachsignal reproduzierende Vorrichtung nicht von so hoher Leistung ist, kann ein Sprachsignal mit extrem hoher Qualität erhalten werden.

Aus den oben angegebenen Gründen werden die Grenzfrequenzen des Tiefpaßfilters 40 und des Hochpaßfilters 41 in Beziehung zu der Codiergeschwindigkeit bestimmt.

Es wird nunmehr die eine höher harmonische Welle erzeugende Vorrichtung beschrieben. In diesem Falle kann die übliche Vorrichtung zur Erzeugung einer höher harmonischen Welle wie vorher beschrieben verwendet werden, jedoch wird ein Vorschlag für eine Vorrichtung gemacht, die eine weitere Verbesserung der Signalqualität bewirkt.

Fig. 6 zeigt ein Beispiel der Anordnung hierfür, und es zeigen die Fig. 7A bis 7D Wellenformen, die an entsprechenden Teilen der Anordnung auftreten. In diesem Falle ist das Eingangssignal ein Niederfrequenz-Sprachsignal, das bei 2 KHz abgetastet wird, wie es in Fig. 7A gezeigt ist. Ein Spektrum- Halter 203 interpoliert Null-Abtastwerte zwischen Abtastungen des in Fig. 7A gezeigten Signals, wodurch ein 8-KHz-abgetastetes Signal erhalten wird, wie es in Fig. 7B gezeigt ist.

Bei diesem Signal ist das Niederfrequenz-Sprachsignalband, gesehen auf der Frequenzachse, wiederholt gefaltet, was ein Ton-Rauschen bewirkt. Um dieses zu verhindern, wird bei diesem Beispiel durch einen Addierer F208 die Wellenform nach Fig. 7B mit einem Pseudo-Rauschen, das durch einen Rausch-Generator 205 erzeugt wird, hinzuaddiert. Es ist auch möglich, die Null-Abtast-Werte durch ein Pseudo-Rauschen durch andere Vorrichtungen zu ersetzen. Da der Pseudo-Rausch- Pegel proportional dem Eingangssignal-Pegel sein muß, wird der Rauschpegel durch einen Leistungsrechner 204 kontrolliert. In Fig. 7C ist das Eingangssignal durch ausgezogene Linien dargestellt, während das addierte Pseudo-Rauschen durch unterbrochene Linien dargestellt ist. Ein Mittel-Spitzenbegrenzer 206 begrenzt das Signal nach Fig. 7C auf einen Pegel Lt, der durch eine strichpunktierte Linie dargestellt ist. Der Grund hierfür liegt darin, daß Abtastungen von kleinen Werten unnötige hochfrequente Rauschspannungen erzeugen.

Der Begrenzungspegel Lt wird auch von dem Leistungsrechner 204 unter Kontrolle gehalten, da er sich anpassungsfähig mit dem Eingangssignalpegel verändern muß. Infolgedessen ist das höher harmonische Wellensignal, das von dem Mittel-Spitzenbegrenzer 206 zur Verfügung gestellt wird, so wie es in Fig. 7D gezeigt ist. Dieses Signal enthält die harmonische Wellenstruktur, ist aber im Ton-Rauschen unterdrückt, was der Spektrum-Haltetechnik eigentümlich ist, und es hat ein flaches Spektrum. Ein Bandpaß-Filter 207 wird verwendet, um ein gewünschtes Band auszublenden.

Das so erhaltene höher harmonische Wellensignal wird synthetisiert als eine Hochfrequenz-Sprachsignal-Steuerquelle unter Verwendung der Tonhöhen-Information und der Spektrum-Information, wie es vorher erwähnt ist, und sein Spektrum wird weiter geformt, wodurch ein Hochfrequenz-Sprachsignal hoher Qualität erzeugt werden kann.

Die Fig. 8 bis 10 zeigen beispielsweise die Anordnungen des Hochfrequenz-Tonhöhen-Synthesefilters 56, des Kurzzeit- Hochfrequenz-Synthesefilters 46 und des Hochfrequenz- Spektrum-Formfilters 59, die in der Ausführung nach Fig. 3 verwendet werden. Die Prädiktoren 215 und 217 in Fig. 10 verwenden die Koeffizienten der entsprechenden Prädiktoren 211 und 213 in den Fig. 8 und 9 oder deren geeignet bewertete Werte.

Wie oben beschrieben, ermöglicht die Ausführung nach Fig. 3 die Reproduktion eines Sprachsignals, das genauer dem Original- Sprachsignal entspricht. Das menschliche Hörempfinden beurteilt aber die Qualität des Sprachsignals nicht allein aufgrund der Güte seiner Wellenform. Manchmal wird der subjektive Beurteilungswert des Sprachsignals aufgrund der Eigenschaft des Rauschens, das in ihm enthalten ist, herabgesetzt.

Im folgenden wird eine Vorrichtung beschrieben, die wirksam ist, den subjektiven Beurteilungswert zu verbessern, obwohl sie die Wiedergabetreue der Wellenform in gewissem Ausmaße beeinträchtigt. Diese Vorrichtung ist wirksam für alle Sprachsignal-Übertragungssysteme, wie das bekannte RELP- System, das APC-System usw., und zwar unabhängig von der in Fig. 3 gezeigten Ausführung.

Im Falle der Wellenform-Codierung, wie in dem APC-System, ist das in dem reproduzierten Sprachsignal enthaltene Rauschen das quantisierende Rauschen N(z), das in bezug auf die Frequenz ein verhältnismäßig flaches Spektrum aufweist. Im Falle der Reproduktion der höher harmonischen Wellen, wie in dem RELP-System, hat das Rauschen ein von demjenigen des Sprachsignals völlig anderes Spektrum. Ein solcher Unterschied in der Natur des Spektrums zwischen dem Sprachsignal und dem Rauschen beeinträchtigt stark den subjektiven Beurteilungswert. Mit Rücksicht hierauf betont die vorliegende Erfindung die Natur des Sprachsignals und verleiht dem Rauschen eine Natur ähnlich derjenigen des Sprachsignals, und bewirkt dadurch eine erhöhte Beurteilung im Hörempfinden.

Fig. 11 zeigt ein Beispiel einer Anordnung hierfür, die ein Nach-Rauschen-Formfilter 218 und einen Pegel-Justierer 219 enthält. In der Ausführung nach Fig. 1 sind diese Elemente zwischen das Synthese-Filter 29 und den D/A-Wandler 30 eingeschaltet, durch die das reproduzierte Sprachsignal verarbeitet wird. Das Nach-Rauschen-Formfilter 218 ist in der Konstruktion identisch mit dem Synthese-Filter 29, und es verwendet als seinen Koeffizienten einen bewerteten Wert des Koeffizienten des Synthese-Filters 29.

In der in Fig. 3 gezeigten Ausführung sind das Nach-Rauschen- Formfilter 218 und der Pegel-Justierer 219 an den Ausgang des Wellenform-Decodierers 51 angeschaltet. Das Nach-Rauschen- Formfilter 218 ist zusammengesetzt aus einem Tonhöhen-Synthese- Filter 220 und einem Kurzzeit-Spektrum-Synthesefilter 223, wie es in Fig. 12 gezeigt ist. Ein Langzeit-Prädiktor 222 und ein Kurzzeit-Prädiktor 225, die in diesen Filtern vorgesehen sind, sind in der Konstruktion identisch mit dem Langzeit- Prädiktor 108 und dem Kurzzeit-Prädiktor 110, die vorher in Verbindung mit Fig. 4B erwähnt sind, und ihre Koeffizienten sind bewertete Werte der Koeffizienten der letzteren.

Angenommen, daß die Übertragungsfunktionen der Langzeit- und Kurzzeit-Prädiktoren 222 und 225 in dem Z-Umwandlungsbereich durch P _PNL(z) und P _PNS(z) dargestellt sind, können sie folgendermaßen ausgedrückt werden:

wobei γ _L und q _S Koeffizienten für Formzwecke sind, wobei C der Koeffizient des Langzeit-Prädiktors 222 ist, wobei N _p die Zahl der Anzapfungen (entsprechend der Tonhöhen-Periode) des Langzeit-Prädiktors 222 ist, wobei α _i der Koeffizient einer i-ten Anzapfung des Kurzzeit-Prädiktors 225 ist und wobei N die Zahl der Anzapfungen des Kurzzeit-Prädiktors 225 ist. Wenn in Gleichung (3) die Koeffizienten γ _L und q _S auf 1 eingestellt werden, werden die Übertragungsfunktionen der Langzeit- und Kurzzeit-Prädiktoren 79 und 74 in Fig. 4 einander gleich.

Obwohl in Fig. 12 nicht gezeigt, werden die Koeffizienten der Prädiktoren 222 und 225 von den Prädiktoren 108 und 110 in dem Wellenform-Decodierer 51 geliefert, und ihre Koeffizienten werden verwendet, nachdem sie durch γ _L und γ _S bewertet worden sind. Diese Werte von q _L und γ _S werden in den Bereichen von 0 ≦ωτγ _L und γ _S ≦ 1 auf der Basis der subjektiven Beurteilung ausgewählt.

Experimentell wurden gute Ergebnisse unter den Werten des Bereiches von 0,4 bis 0,2 erhalten. Durch die Operation eines solchen Nach-Rauschen-Formfilters 218 mit einem Eingang, wie er in Fig. 13A gezeigt ist, wird die Eigenschaft des Sprachsignals weiter hervorgehoben, während das Rauschen, wie es in Fig. 13A gezeigt ist, auch eine Charakteristik ähnlich derjenigen des Sprachsignals erhält, wie es in Fig. 13B gezeigt ist.

Der Pegel-Justierer 219 in Fig. 11 ist vorgesehen für die gleiche Justierung der Eingangsleistung und der Signalleistung des Nach-Rauschen-Formfilters 218, da sich der Pegel des Signals verändert.

Wie oben im einzelnen beschrieben, wird nach der Erfindung das Niederfrequenz-Sprachsignal als eine genaue Wellenform übertragen, und zwar durch Verwendung des APC-Systems, und es wird das Hochfrequenz-Sprachsignal als ein Vorhersage- Koeffizient eines Kurzzeit-Spektrums übertragen. Auf der Empfangsseite wird das genaue Niederfrequenz-Sprachsignal decodiert, und es werden die Spektrum-Einhüllende und die Tonhöhen-Struktur für die reproduzierten höher harmonischen Wellen rekonstruiert, durch die ein Hochfrequenz-Sprachsignal hoher Qualität erzeugt werden kann, und es kann die Sprachsignal-Qualität merklich verbessert werden. Insbesondere die Anwendbarkeit des APC-Systems der Ein-Bit-Quantisierung auf die Übertragung des Niederfrequenz-Sprachsignals ermöglicht die Sprachsignal-Übertragung guter Qualität in dem Falle einer Codierungsgeschwindigkeit von 4,8 Kb/s und die Reduktion des Hochfrequenz-Sprachsignalbandes im Falle der Codierungsgeschwindigkeit von 7,2 auf 9,6 Kb/s, wodurch eine verbesserte Sprachsignalqualität hervorgerufen wird.

Außerdem bietet die Erfindung Vorrichtungen zur Erzeugung einer qualitativ hochwertigen höher harmonischen Welle und Vorrichtungen zur Verbesserung des subjektiven Beurteilungswertes eines Sprachsignals.

Bezugszeichen-Liste Fig. 1A:
2 = Analogfilter
3 = A/D-Wandler
5 = Kurzzeit-Spektralanalysator
6 = Umkehrfilter
7 = LPC-Koeffizienten-Codierer
8 = LPC-Koeffizienten-Decodierer
9 = Tiefpaßfilter
10 = Abtast-Geschwindigkeitswandler
11 = Wellenform-Codierer
12 = Leistungs-Komparator
13 = Codierer
14 = Rahmen-Synchronisationssignal-Generator
15 = Multiplexer
16 = Übertragungsweg
Fig. 1B:
17 = Übertragungsweg
18 = Demultiplexer
19 = Rahmen-Synchronisationssignal-Detektor
20 = Wellenform-Decodierer
21 = Abtastgeschwindigkeits-Wandler
22 = Tiefpaß-Filter
23 = Generator für höher harmonische Wellen
24 = Hochpaß-Filter
25 = Pegel-Einstellvorrichtung
26 = Decodierer
28 = LPC-Koeffizienten-Decodierer
29 = Synthese-Filter
30 = D/A-Wandler
31 = Analogfilter
Fig. 2:
siehe Zeichnungseintragungen
Fig. 3:
2 = Analogfilter
3 = A/D-Wandler
14 = Rahmen-Synchronisationssignal-Generator
"Transmission Path" = Übertragungsweg
19 = Rahmen-Synchronisationssignal-Generator
30 = D/A-Wandler
31 = Analogfilter
40 = Tiefpaß-Filter
41 = Hochpaß-Filter
42 = Abtastgeschwindigkeits-Wandler
43 = Wellenform-Codierer
44 = Multiplexer
45 = Kurzzeit-Spektral-Analysator
46 = Kurzzeit-Hochfrequenz-Synthesefilter
47 = LPC-Koeffizienten-Codierer
48 = Leistungs-Komparator
49 = Codierer
50 = Demultiplexer
51 = Wellenform-Decodierer
52 = Abtastgeschwindigkeits-Wandler
53 = Tiefpaß-Filter
55 = Generator für höher harmonische Wellen
56 = Hochfrequenz-Tonhöhen-Synthesefilter
58 = LPC-Koeffizienten-Decodierer
59 = Hochfrequenz-Spektrum-Formfilter
60 = Decodierer
61 = Pegel-Einstellvorrichtung
Fig. 4A:
71 = LPC-Spektrum-Analysator
72 = LPC-Parameter-Codierer
73 = LPC-Parameter-Decodierer
74 = Kurzzeit-Prädiktor
76 = Tonhöhen-Analysator
77 = Tonhöhen-Parameter-Codierer
78 = Tonhöhen-Parameter-Decodierer
79 = Langzeit-Prädiktor
81 = RMS-Rechner
82 = RMS-Wert-Codierer
83 = RMS-Wert-Decodierer
84 = Anpassungsfähiger Quantisierer
85 = Entquantisierer
87 = Rausch-Form-Filter
89 = Langzeit-Prädiktor
93 = Kurzzeit-Prädiktor
94 = Schrittgrößen-Codierer
95 = RMS-Wert-Schrittgrößen-Selektor
96 = Minimum-Fehler-Leistungs-Detektor
98 = Multiplexer
Fig. 4B:
101 = Demultiplexer
102 = Schrittgrößen-Decodierer
103 = RMS-Wert-Decodierer
104 = Dequantisierer
106 = Tonhöhen-Parameter-Decodierer
107 = LPC-Parameter-Decodierer
108 = Langzeit-Prädiktor
110 = Kurzzeit-Prädiktor
Fig. 5:
siehe Zeichnungseintragungen
Fig. 6:
siehe Zeichnungseintragungen
Fig. 7A, 7B, 7C, 7D:
keine Eintragungen
Fig. 8:
siehe Zeichnungseintragungen
Fig. 9:
siehe Zeichnungseintragungen
Fig. 10:
siehe Zeichnungseintragungen
Fig. 11:
siehe Zeichnungseintragungen
Fig. 12:
siehe Zeichnungseintragungen
Fig. 13A:
siehe Zeichnungseintragungen
Fig. 13B:
siehe Zeichnungseintragungen

Claims

1. System zum Übertragen eines Sprachsignals, dadurch gekennzeichnet, daß ein eingegebenes Sprachsignal in ein Niederfrequenz-Sprachsignal und ein Hochfrequenz-Sprachsignal aufgeteilt wird, daß ein vorhersagendes Restsignal des Niederfrequenz-Sprachsignals übertragen wird, nachdem es in einem Wellenform-Codierer (43) codiert worden ist, um so die Verschlechterung seiner Qualität soweit wie möglich klein zu halten, und daß eine für ein Kurzzeit-Hochfrequenz-Spektrum des Hochfrequenz-Sprachsignals bezeichnende Information aus diesem ausgeblendet und nach Codierung übertragen wird.

2. System nach Anspruch 1, dadurch gekennzeichnet, daß der Wellenform-Codierer (43) einen anpassungsfähigen Quantisierer (84) zur Gewinnung eines zu übertragenden codierten Niederfrequenz-Sprachsignals, einen Kurzzeit-Prädiktor (74) zur Gewinnung eines Voraussagewertes aus dem Niederfrequenz- Sprachsignal, einen Langzeit-Prädiktor zur Gewinnung eines Laufzeit-Voraussagewertes aus dem Niederfrequenz-Sprachsignal, eine erste Subtrahiervorrichtung (75, 80) zum Subtrahieren des Kurzzeit-Voraussagewertes und des Laufzeit-Voraussagewertes von dem Niederfrequenz-Sprachsignal zur Erzielung eines Restsignals, einen Dequantisierer (85) zum Entquantisieren des codierten Niederfrequenz-Sprachsignals, um ein endgültiges quantisiertes Restsignal zu erhalten, eine zweite Subtrahiervorrichtung (86) zum Subtrahieren des quantisierten endgültigen Sprachsignals von einem Eingangssignal des anpassungsfähigen Quantisierers, um ein quantisiertes Rauschen zu erhalten, ein Rauschen-Formungs-Filter (87) zur Erzielung eines geformten Rauschens und eine dritte Subtrahiervorrichtung (88) zum Subtrahieren des geformten Rauschens von dem Restsignal, um ein endgültiges Restsignal zur Verwendung als Eingangssignal des anpassungsfähigen Quantisierers (84) zu erhalten.

3. System nach Anspruch 1, dadurch gekennzeichnet, daß die für das Hochfrequenz-Sprachsignal bezeichnende Information eine Koeffizienten-Information und eine Leistungsverhältnis- Information ist, wobei die Koeffizienten-Information aus dem Hochfrequenz-Sprachsignal durch einen Kurzzeit-Spektrum- Analysator und codiert durch einen LPC-Koeffizienten-Codierer erhalten wird und wobei die Leistungsverhältnis-Information durch Vergleich des Hochfrequenz-Sprachsignals mit dem Niederfrequenz- Sprachsignal und codiert durch einen Codierer erhalten wird.