DE3710664C2 - - Google Patents
Info
- Publication number
- DE3710664C2 DE3710664C2 DE3710664A DE3710664A DE3710664C2 DE 3710664 C2 DE3710664 C2 DE 3710664C2 DE 3710664 A DE3710664 A DE 3710664A DE 3710664 A DE3710664 A DE 3710664A DE 3710664 C2 DE3710664 C2 DE 3710664C2
- Authority
- DE
- Germany
- Prior art keywords
- signal
- speech signal
- frequency
- low
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000001228 spectrum Methods 0.000 claims description 35
- 230000007774 longterm Effects 0.000 claims description 17
- 230000006866 deterioration Effects 0.000 claims description 5
- 238000007493 shaping process Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 description 44
- 238000003786 synthesis reaction Methods 0.000 description 32
- 230000015572 biosynthetic process Effects 0.000 description 31
- 101001096074 Homo sapiens Regenerating islet-derived protein 4 Proteins 0.000 description 15
- 102100037889 Regenerating islet-derived protein 4 Human genes 0.000 description 15
- 230000003595 spectral effect Effects 0.000 description 15
- 238000005070 sampling Methods 0.000 description 14
- 238000000034 method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000012546 transfer Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 230000008054 signal transmission Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 230000005284 excitation Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
Die Erfindung betrifft ein Sprachsignal-Übertragungssystem,
insbesondere ein Sprachsignal-Übertragungssystem, das von
besonderer Nützlichkeit ist, wenn es in einem Nachrichtenübertragungssystem
angewendet wird, das einen hohen Ausnutzungswirkungsgrad
des Übertragungsweges erfordert, oder
angewandt wird in einem Nachrichtenübertragungssystem, das
starken Begrenzungen auf dem Übertragungs-Frequenzband und
bezüglich der verwendeten Übertragungsleistung unterworfen
ist.
Es ist bekannt (Zedler, Günther "Bitratenreduktion bei
Sprache: Stand der Anwendung in Fernmeldenetzen" in
"ntz", 1985, Bd. 38, Heft 11, Seiten 762 bis 767), das
Restsignal eines Sprachsignals mit Hilfe der Pulscodemodulation
bzw. der adaptiven Differenzpulscodemodulation
zu codieren.
Bisher ist für die digitale Übertragung von Sprachsignalen
als grundlegender Übertragungsweg ein 64 Kb/s PCM oder ein
32 Kb/s APCM (anpassungsfähige PCM) verwendet worden. In diesem
Fall würde eine Codierung der Sprachsignale mit einer
geringen Geschwindigkeit von 4,8 bis 9,6 Kb/s ohne merkliche
Verschlechterung ihrer Qualität den Benutzungswirkungsgrad
des grundlegenden Übertragungsweges merklich verbessern und
die Nachrichtenübertragungskosten verringern.
Für die wirtschaftliche Konstruktion von Systemen, die bezüglich
des Übertragungsfrequenzbandes, der Übertragungsleistung
und anderen Übertragungseigenschaften stark begrenzt
sind, wie ein digitales Schiffahrts-Satelliten-Nachrichtenübertragungssystem,
ein Luftfahrt-Satelliten-Nachrichtenübertragungssystem,
ein digitales Geschäfts-Satelliten-Nachrichtenübertragungssystem
für geschäftliche Nachrichtenübertragungen
und ein digitales bewegliches Funk-Nachrichtenübertragungssystem
für Automobile, besteht eine Forderung nach einem
Sprachsignal-Codiersystem, welches eine ausgezeichnete codierte
Sprachsignalqualität und eine Codiergeschwindigkeit
von etwa 4,8 bis 9,6 Kb/s erreicht und das unempfindlich ist
für den Einfluß von Fehlern auf dem Übertragungsweg. Die
Verwirklichung eines solchen Sprachsignal-Codiersystems
macht es auch möglich, eine notwendige Speicherkapazität
nicht nur in den oben genannten technischen Bereichen, sondern
auch in einem Falle zu reduzieren, in welchem Sprachsignale
in codierter Form gespeichert werden.
Bisher hat man ein remanent erregtes lineares Vorhersage-
Codiersystem (im folgendes als "RELP-System") bezeichnet,
als typisches Codiersystem vorgeschlagen, welches die Codiergeschwindigkeit
von 4,8 bis 9,6 Kb/s verwendet.
Das RELP-System besitzt die Eigenschaft, daß durch Eingabe
eines eingegebenen Sprachsignals in ein Umkehrfilter mit
einer gegenüber der Korrelations-Charakteristik des Amplitudenwertes
des Eingangs-Sprachsignals umgekehrten Charakteristik
ein Restsignal mit einer abgeflachten Kurzzeit-
Spektrum-Einhüllenden erhalten wird und dann die Niederfrequenz-
Komponente des Restsignals übertragen wird, nachdem
sie durch PCM oder anpassungsfähige Delta-Modulation
(ADM) codiert worden ist. Auf der Empfangsseite wird ein
Hochfrequenz-Restsignal durch ein nichtlineares Erzeugungsverfahren,
wie eine Gleichrichtung oder ein Spektrum-Halteverfahren
eines Spektrum-Faltprinzips auf der Grundlage des
durch Wellenform-Decodierung erhaltenen Restsignals erzeugt.
Die Niederfrequenz- und Hochfrequenz-Restsignale werden miteinander
addiert, um das Restsignal wiederherzustellen. Das
Restsignal wird als Erregersignal einem Kurzzeit-Spektrum-
Synthesefilter zugeführt, wodurch ein Sprachsignal erzeugt
wird, das eine Spektrum-Einhüllende aufweist, die ähnlich
derjenigen des originalen Sprachsignals ist.
Mit anderen Worten, das RELP-System verwirklicht die Verringerung
der Codiergeschwindigkeit durch Ausblendung der Niederfrequenz-
Komponente des Restsignals und deren Übertragung in Form eines
Wellenform-Codes.
Übrigens ist es für die Verbesserung der Qualität des synthetischen
Sprachsignals in dem RELP-System wichtig, wie genau
die die Oberwellenstruktur beibehaltenden Hochfrequenz-Komponenten
auf der Syntheseseite hergestellt werden. Nach dem
Stand der Technik jedoch, welcher das Frequenzband des Niederfrequenz-
Restsignals zur Herabsetzung der Codiergeschwindigkeit
verengt, wie es oben beschrieben ist, wird das Frequenzband
der herzustellenden Hochfrequenzkomponenten auf der Syntheseseite
verbreitert, und es ist eine genaue Reproduktion solcher
Hochfrequenzkomponenten schwierig, wodurch eine Begrenzung
der Erhöhung der Sprachsignalqualität erfolgt.
Wie oben im einzelnen beschrieben, ist der Nachteil des bekannten
RELP-Systems zurückführbar auf die Grundanordnung,
welche ein Restsignal eines Sprachsignals durch Umkehrfilterung
erhält, daraus ein Niederfrequenz-Restsignal ableitet
und dieses nach Codierung in eine Wellenform durch die anpassungsfähige
PCM (APCM) oder anpassungfähige Delta-Modulation
(ADM) überträgt.
Es ist ein Sprach-Codiersystem bekannt (GB 21 50 377 A), bei
welchem ein Wellenform-Codierer und ein Wellenformdecodierer
vorgesehen sind und bei welchem das APC-System verwendet
wird. Für ein synthetisches Sprachsignal ist hier eine
vergleichsweise hohe Codiergeschwindigkeit erforderlich.
Im Hinblick auf den oben erwähnten Nachteil des bekannten
Standes der Technik besteht ein Ziel der Erfindung darin,
ein Übertragungssystem zu schaffen, mit dem es möglich ist,
ein synthetisches Sprachsignal ausgezeichneter Qualität auch
dann zu erhalten, wenn eine niedrige Codiergeschwindigkeit
angewendet wird.
Um das obengenannte Ziel zu erreichen besteht das Übertragungssystem
nach der Erfindung darin, daß ein eingegebenes Sprachsignal
aufgeteilt wird in Niederfrequenz- und Hochfrequenz-
Restsignale, daß das Niederfrequenz-Restsignal in Form eines
Wellenform-Codes mit höherer möglicher Genauigkeit und geringerer
möglicher Qualitätsverschlechterung durch Verwendung
des anpassungsfähigen Vorhersage-Codier (APC)-Systems oder
Mehrimpuls-angeregte-Codierung (MPEC)-Systems übertragen wird,
während die Information auf dem Kurzzeit-Hochfrequenz-Spektrum
aus dem Hochfrequenz-Restsignal ausgeblendet und als Information
für die Verwendung bei der Reproduktion des Sprachsignals auf
der Empfangsseite übertragen wird.
Die Erfindung wird im folgenden anhand der Zeichnung an Ausführungsbeispielen
näher erläutert. In der Zeichnung zeigen
Fig. 1A,
1B und 2 Blockschaltbilder, welche ein Beispiel
eines bekannten RELP-Systems zeigen,
Fig. 3 ein Blockschaltbild, welches eine Ausführung
nach der vorliegenden Erfindung
zeigt,
Fig. 4A ein Blockschaltbild, welches ein besonderes
Beispiel eines in der Ausführung
nach Fig. 3 verwendeten Wellenform-Codierers
zeigt,
Fig. 4B ein Blockschaltbild, welches ein Beispiel
eines Wellenform-Decodierers zur
Erzeugung eines nach der vorliegenden
Erfindung übertragenen Signals zeigt,
Fig. 5 ein Schaltbild zur Erläuterung der Grundlagen
der vorliegenden Erfindung,
Fig. 6 ein Blockschaltbild, welches eine Vorrichtung
zur Erzeugung einer höher harmonischen
Welle zur Erzeugung eines empfangenen Signals,
das nach der vorliegenden Erfindung
übertragen worden ist, zeigt,
Fig. 7A, 7B, 7C und 7D Zeittafeln, welche die Arbeitsweise der
Vorrichtung nach Fig. 6 erläutern,
Fig. 8, 9 und 10 Blockschaltbilder, welche besondere Beispiele
eines Hochfrequenz-Ton-Synthese-
Filters, eines Kurzzeit-Hochfrequenz-
Synthese-Filters und eines Hochfrequenz-
Spektrum-Form-Filters zeigen,
die verwendet werden, um ein nach der
vorliegenden Erfindung übertragenes,
empfangenes Signal zu reproduzieren,
und
Fig. 11 und 12 Blockschaltbilder zur Erläuterung von
Vorrichtungen und deren Operation für
die Verbesserung der reproduzierten
Eigenschaften des nach der Erfindung
übertragenen Signals und
Fig. 13A und 13B Diagramme zur Erläuterung der Arbeitsweise
der Vorrichtungen nach den Fig. 11 und 12.
Zur Erläuterung des Unterschiedes zwischen dem Stand der Technik
und der vorliegenden Erfindung soll zunächst ein Beispiel einer
bekannten Vorrichtung beschrieben werden.
Fig. 1A zeigt ein besonderes Beispiel. Ein eingegebenes analoges
Sprachsignal an einer Eingangsklemme 1 wird beispielsweise durch
ein Analogfilter 2 im Frequenzband auf 0,3 bis 3,5 KHz begrenzt,
und es wird durch einen A/D-Wandler 3 in ein digitales Sprachsignal
4 umgewandelt, das z. B. mit 8 KHz abgetastet wird.
Ein Umkehrfilter 6 eliminiert die Korrelation der Amplitude
der Abtastproben des digitalen Sprachsignals 4, wodurch deren
Spektrum-Einhüllende abgeflacht wird. Der in dem Umkehrfilter
6 festgelegte Filterkoeffizient wird erhalten durch Analysieren
der Kurzzeit-Spektrum-Hüllkurve des digitalen Sprachsignals 4
in dem Umkehrfilter 6, und zwar beispielsweise an jedem Rahmen
von 20 ms durch ein Auto-Korrelationsverfahren oder dergleichen.
Der Filterkoeffizient wird durch einen LPC-Koeffizienten-
Codierer 7 für jeden Rahmen codiert und in dem Umkehrfilter 6
über einen LPC-Koeffizienten-Decodierer 8 eingestellt, und
er wird gleichzeitig zur Empfangsseite übertragen, wie es später
beschrieben wird. Durch den Umkehrfilter 6 wird ein Signal
35 mit abgeflachtem Spektrum erzeugt, welches ein Restsignal
genannt wird. Damit nur die Niederfrequenz-Komponente des
Restsignals 35 übertragen wird, wird das Niederfrequenz-
Restsignal durch ein Tiefpaßfilter 9 ausgeblendet, dessen
Durchlaß-Frequenzband von 0 bis 1000 Hz reicht. Die Abtastgeschwindigkeit
dieses Signals wird durch einen Abtastgeschwindigkeits-
Wandler 10 gemäß dem Frequenzband des
Signals von 8 KHz auf 2 KHz in diesem Beispiel umgewandelt.
Das Signal einer so niedrigen Abtastgeschwindigkeit wird durch
einen Wellenform-Codierer 11 wellenform-codiert. Wie oben erwähnt,
wird die anpassungsfähige PCM (APCM) oder die anpassungsfähige
Delta-Modulation (ADM) für die Wellenformcodierung verwendet.
Um ferner bei der Reproduktion der Hochfrequenz-Komponenten
des Restsignals auf der Empfangsseite eine Pegeljustierung
zu ermöglichen, mißt die Sendeseite das Leistungsverhältnis
zwischen dem Restsignal 35 und dem Niederfrequenz-Restsignal
durch einen Leistungskomparator 12 und codiert es durch
einen Codierer 13. Die Ausgangssignale vom Wellenform-Codierer
11, vom Codierer 13 und vom Koeffizienten-Codierer 7 werden
einem Multiplexer 15 zugeführt, in dem sie zusammen mit einem
Rahmen-Synchronisationssignal von einem Rahmen-Synchronisationssignalgenerator
14 bei einer erforderlichen Codiergeschwindigkeit
mehrfach ausgenutzt werden. Das mehrfach ausgenutzte
Ausgangssignal wird dem Übertragungsweg über eine
Ausgangsklemme 16 zugeführt.
Es wird nun der Betrieb auf der Empfangsseite unter Bezugnahme
auf Fig. 1B beschrieben.
Das Signal vom Übertragungsweg wird über eine Klemme 17 einem
Demultiplexer 18 zugeführt, durch den es getrennt wird in
das Wellenform-codierte-Niederfrequenz-Restsignal, die Leistungsverhältnis-
Information und die Filter-Koeffizienten-
Information jedes Rahmens, und zwar in Synchronismus mit
dem Rahmen-Synchronisationssignal, welches durch einen Rahmen-
Synchronisationssignal-Detektor 19 festgestellt wird. Das
Niederfrequenz-Restsignal, das durch einen Wellenform-Decodierer
20 decodiert wird, wird in ein Signal einer 8-KHz-Abtastgeschwindigkeit
durch Abtast-Interpolation durch einen Abtastgeschwindigkeits-
Wandler 21 übertragen. Das so erhaltene Signal
wird durch einen Tiefpaßfilter 22 im Frequenzband begrenzt,
wodurch das Niederfrequenz-Restsignal reproduziert wird. Ein
Generator 23 für höhere harmonische Wellen erzeugt höhere harmonische
Wellen durch eine nicht-lineare Schaltung oder ein
Spektrum-Halteverfahren auf der Grundlage des Niederfrequenz-
Restsignals. Die höher harmonischen Wellen werden einem Hochpaßfilter
24 mit beispielsweise einem Durchlaßfrequenzband von
1 bis 4,0 KHz zugeführt, indem es in ein Hochfrequenz-Restsignal
übertragen wird. Eine Pegel-Einstellvorrichtung 25
justiert den Pegel des Hochfrequenz-Restsignals, so daß seine
Beziehung zum Pegel des Niederfrequenz-Restsignals derart wird,
wie es durch die Leistungsverhältnis-Information, die dem Decodierer
26 geliefert wird, angezeigt wird. Danach werden die
Hochfrequenz- und Niederfrequenz-Restsignale zusammen durch einen
Addierer 27 in ein Restsignal eines 4-KHz-Frequenzbandes addiert,
das als ein Erregersignal 36 einem Spektral-Synthesefilter 29
für das Kurzzeit-Spektrum zugeführt. Da der mit einem
LPC-Koeffizientendecodierer 28 erhaltene Filterkoeffizient
in das Synthesefilter 29 eingesetzt wird, ergibt das Erregersignal
36 eine Frequenzcharakteristik, die ein digitales Sprachsignal
39 erzeugt. Das Signal 39 wird einem D/A-Wandler 30
und einem Analogfilter 31 zugeführt, wodurch es an einer Klemme
32 als ein im Frequenzband begrenztes analoges Sprachsignal
auftritt.
Das oben beschriebene RELP-System ist grundsätzlich fehlerhaft
für die Übertragung von Signalen mit einer niedrigen Codiergeschwindigkeit
und für die Verbesserung der Qualität decodierter
Sprachsignale. Dieser Fehler wird unten im einzelnen
beschrieben.
Nach dem oben erwähnten RELP-System ist die Grundanordnung für
das Niederfrequenz-Restsignal, das in eine Wellenform codiert
ist, derart, wie es in Fig. 2 gezeigt ist. D. h., es sind eine
Abtastgeschwindigkeits-Wandlervorrichtung und eine
Codier/Decodier-Vorrichtung zwischen dem Umkehrfilter 6 und dem
Synthesefilter 29 vorgesehen, und es wird durch die Codiervorrichtung
ein quantisierendes Rauschen N(z) dem Niederfrequenz-
Restsignal zugesetzt. Das Umkehrfilter 6 enthält einen
Kurzzeit-Prädiktor 33 und einen Subtrahierer 34, während das
Synthesefilter 29 einen Kurzzeit-Prädiktor 37 der gleichen
Charakteristik wie diejenige des Prädiktors 33 und einen
Addierer 38 enthält. Es sei nun die Übertragungsfunktion
des Prädiktors 37 durch eine Z-Umwandlung ausgedrückt, und
es sei das Niederfrequenz-Restsignal jeweils durch P(z) und
durch S(z) ausgedrückt, so daß das reproduzierte Niederfrequenz-
Restsignal R(z) folgendermaßen ausgedrückt werden kann:
Wie sich aus Gleichung (1) ergibt, wird in dem reproduzierten
Niederfrequenz-Restsignal R(z) eine quantisierende Rauschkomponente
N(z) eingemischt, welche das Synthesefilter 29
durchsetzt hat. Zusätzlich sei angenommen, daß die quantisierende
Rauschkomponente N(z) ein flaches Spektrum hat und
die gleiche Spektraleinhüllende wie diejenige des Sprachsignals
erzeugt wird, was zu einer schwerwiegenden Verschlechterung
der subjektiven Tonqualität des Niederfrequenz-Restsignals
führt. Dies ist die gleiche Erscheinung, wie sie oft in der
Wellenform-Codierung durch ein anpassungsfähiges Voraussage-
Codiersystem (im folgenden als "APC-System" bezeichnet) erwähnt
ist. Aus diesem Grunde ist es üblich, in der Wellenform-
Codierung durch das bekannte RELP-System das Auftreten
des quantisierenden Rauschens N(z) durch die Verwendung von
drei oder mehr quantisierenden Bits möglichst klein zu halten
und das Frequenzband des Niederfrequenz-Restsignals einzuengen,
um die Codiergeschwindigkeit zu reduzieren.
Beispielsweise nach einem bekannten 9,6-Kb/s-RELP-System
hat das Niederfrequenz-Restsignal ein 1-KHz-Frequenzband,
und es wird abgetastet mit einer Geschwindigkeit von 2 KHz
und es wird eine Abtastprobe in vier Bits quantisiert. Die
hierfür notwendige Zahl sind 8 K/Bits, und es werden die
restlichen 1,6 K/Bits für die Übertragung anderer Informationen
verwendet. In einem 7,2-Kb/s-RELP-System besitzt
das Niederfrequenz-Restsignal ein 0,8-KHz-Frequenzband,
und es wird mit 1,6 KHz abgetastet, und es ist eine
Abtastprobe in drei Bits quantisiert. Die hierfür erforderliche
Anzahl Bits sind 4,8 K/Bits, und es werden die verbleibenden
3,4 K/Bits für die Übertragung anderer Informationen
zugeteilt. Ferner kann in einem 4,8-Kb/s-RELP-System das
Frequenzband des Niederfrequenz-Signals nicht unter 800 Hz liegen,
und zwar mit Rücksicht auf die Verteilungscharakteristik
der Grundfrequenz des Sprachsignals, und es liegt die
untere Grenze der Abtastfrequenz bei 1,6 KHz als niedrigste
Frequenz. Aus diesem Grund ist die 3-Bit-Quantisierung unmöglich,
und es wird die Qualität des synthetischen Sprachsignals
beeinträchtigt.
Aufgrund der obengenannten Konstruktion weist die Vorrichtung
nach dem Stand der Technik die oben erwähnten Nachteile
auf.
Fig. 3 zeigt eine Ausführung nach der Erfindung. Die folgende
Beschreibung erfolgt unter der Annahme, daß das analoge
Sprachsignalband 4 KHz beträgt.
Das analoge Sprachsignal von der Eingangsklemme 1 wird einer
Frequenzbandbeschränkung durch das Analogfilter 2 unterworfen,
und es wird darauf durch den A/D-Wandler 3 in das Digitalsignal
4 umgewandelt, das mit einer Geschwindigkeit von
8 KHz abgetastet wird. Das Digitalsignal 4 wird aufgeteilt
in Niederfrequenz- und Hochfrequenz-Sprachsignale, und
zwar durch einen Tiefpaßfilter 40 und einen Hochpaßfilter 41.
Die Abtastgeschwindigkeit des Niederfrequenz-Sprachsignals
wird durch einen Abtastgeschwindigkeits-Wandler 42 von einer
8-KHz-Abtastgeschwindigkeit auf eine Abtastgeschwindigkeit
umgewandelt, die zweimal höher ist als das Frequenzband dieses
Signals, und es wird danach durch einen Wellenform-Codierer
43 genau in geeignete Wellenform-Codes codiert. Andererseits
wird das Hochfrequenz-Sprachsignal durch einen Kurzzeit-
Spektralanalysator 45 spektral analysiert. Die als Ergebnis
der Analyse erhaltene Koeffizienten-Information wird durch
einen LPC-Koeffizienten-Codierer 47 codiert. Ferner werden
die Ausgangsleistungen des Tiefpaßfilters 40 und des Hochpaßfilters
41 durch einen Leistungs-Komparator 48 verglichen,
und es wird das Vergleichsergebnis durch einen Codierer 49
codiert, und zwar als einer von Parametern für die Reproduktion
des Hochfrequenz-Sprachsignals auf der Synthese-Seite. Die
Ausgangssignale von dem Wellenform-Codierer 43, dem LPC-
Koeffizienten-Codierer 47 und dem Codierer 49, wie sie oben
beschrieben sind, werden durch einen Multiplexer 44 zusammen
mit dem Rahmen-Synchronisationssignal vom Rahmen-Synchronisationssignal-
Generator 14 gemultiplext, und es wird das gemultiplexte
Ausgangssignal auf dem Übertragungsweg über die
Klemme
16 erhalten. Die abgeschnittenen Frequenzen der Tiefpaß- und
Hochpaß-Filter 40 und 41 werden später zusammen mit der
Charakteristik des Wellenform-Codierers 43 beschrieben. Im
folgenden wird die Arbeitsweise der Empfangs- und Synthese-
Seite beschrieben.
Das Signal vom Übertragungswert wird über die Klemme 17 einem
Demultiplexer 50 zugeführt, indem es in das Rahmen-Synchronisationssignal,
das codierte Niederfrequenz-Sprachsignal,
die codierte Koeffizienten-Information und die codierte
Leistungsverhältnis-Information aufgeteilt wird. Das codierte
Niederfrequenz-Sprachsignal wird durch einen Wellenform-
Decodierer 51 decodiert, durch einen Abtastgeschwindigkeits-
Wandler 52 auf die Abtastgeschwindigkeit von 8 KHz interpoliert
und dann durch einen Tiefpaßfilter 53 geschickt, wodurch es
als Niederfrequenz-Sprachsignal erzeugt wird. Andererseits
wird das Hochfrequenz-Sprachsignal in folgender Weise reproduziert:
Ein Erregersignal oder ein Restsignal eines
Niederfrequenz-Spektral-Synthesefilters in dem Wellenform-
Decodierer 51, wie er später beschrieben wird, wird von einer
Klemme 54 abgenommen und in einen Generator 55 für eine höher
harmonische Welle eingeführt. Als Erzeugungsvorrichtung für
eine höher harmonische Welle kann irgendeines der bekannten
Verfahren, wie ein Gleichrichterverfahren, ein Spektral-Faltverfahren
oder ein Polaritäts-Impulsverfahren verwendet werden,
jedoch werden später Erzeugungsvorrichtungen für höher
harmonische Wellen beschrieben, die wirksam den subjektiven
Beurteilungswert verbessern. Ein durch den Generator 55 für
eine höher harmonische Welle erzeugtes höher harmonisches
Wellensignal 69 wird aus dem Niederfrequenz-Sprachsignal abgeleitet,
dessen harmonische Struktur und Frequenzcharakteristik
diejenigen des Original-Sprachsignals nicht genau wiederspiegelt.
Deshalb wird das höher harmonische Wellensignal
69 weiter der folgenden Verarbeitung unterworfen. Das Signal
wird einem Hochfrequenz-Tonhöhen-Synthesefilter 56 zugeführt,
in welchem eine der Tonhöhenperiode des Niederfrequenz-Sprachsignals
folgende Spektralstruktur erzeugt wird, und es wird
dann eine Kurzzeit-Hochfrequenz-Spektraleinhüllende erzeugt,
und zwar durch ein Kurzzeit-Hochfrequenz-Synthesefilter 46.
Die Tonhöhenperiode und der Filterkoeffizient des Hochfrequenz-
Tonhöhen-Synthesefilters 56 werden erhalten durch Abnahme
der Tonhöhenperiode und des Filterkoeffizienten eines Niederfrequenz-
Tonhöhen-Synthesefilters im Wellenform-Decodierer
51, und sie werden, wie erforderlich, unter Berücksichtigung
der Abtastgeschwindigkeit des Niederfrequenz-Sprachsignals
und der Abtastgeschwindigkeit des höher harmonischen Wellensignals
bewertet. Wenn beispielsweise die Abtastgeschwindigkeiten
des Niederfrequenz-Sprachsignals und des harmonischen
Wellensignals 2 und 8 KHz betragen, wird eine Tonhöhenperiode
eingestellt, die viermal länger ist als diejenige, die dem
Wellenform-Decodierer 51 entnommen worden ist, und es wird
der Filterkoeffizient so verwendet wie er ist, oder er wird
als bewerteter Wert verwendet. Die Filterkoeffizient des
Kurzzeit-Hochfrequenz-Synthesefilters 46 wird von der Übertragungsseite
übertragen und durch einen LPC-Koeffizienten-Decodierer
58 decodiert.
Der Parameter des Hochfrequenz-Tonhöhen-Synthesefilters 56
kann auch auf der Übertragungsseite gemessen und dann von
da zur Empfangsseite übertragen werden, wenn die Übertragungs-
Bit-Kapazität ausreichend groß ist.
Das Ausgangssignal 63 vom Kurzzeit-Hochfrequenz-Spektral-
Synthesefilter 46 wird ferner einem Hochfrequenz-Spektral-
Formfilter 59 zugeführt, in welchem dessen Spektrum so geformt
wird, daß die Qualität des zu erzeugenden Hochfrequenz-
Sprachsignals so nahe wie möglich an der subjektiven
Qualität des originalen Hochfrequenz-Sprachsignals liegt.
Als Filterkoeffizient wird zu dieser Zeit ein Wert verwendet,
der auf den Filterkoeffizienten, die für den Hochfrequenz-
Tonhöhen-Synthesefilter 56 und den Kurzzeit-Hochfrequenz-
Synthesefilter 46 bewertet ist.
Auf diese Weise wird das höher harmonische Wellensignal 69,
das durch den Generator 55 für höher harmonische Wellen erzeugt
worden ist, geformt, indem es mit der Tonhöhenstruktur
und der Spektralstruktur des originalen Hochfrequenz-Sprachsignals
versorgt wird, wodurch die subjektive Auswertung des
erzeugten Hochfrequenz-Sprachsignals deutlich verbessert werden
kann.
Besonders bei Verwendung des Spektral-Faltverfahrens als Vorrichtung
zur Erzeugung von höher harmonischen Wellen kann ein
der Faltperiode zuschreibbares Einzelfrequenz-Rauschen, das
sogenannte Totalrauschen, das bisher ein Problem gewesen ist,
beträchtlich reduziert werden.
Das so erzeugte Hochfrequenz-Sprachsignal wird durch einen
Pegeljustierer 61 in seinem Leistungsverhältnis zum Niederfrequenz-
Sprachsignal auf der Basis der Ausgangsinformation
von einem Decodierer 60 justiert. Dann wird das Hochfrequenz-
Sprachsignal einem Addierer 62 zugeführt, in welchem es dem
Niederfrequenz-Sprachsignal hinzugefügt wird, um das digitale
Sprachsignal 39 des 4-KHz-Bandes zu erzeugen. Das digitale
Sprachsignal wird dem D/A-Wandler 30 und dem Analogfilter 31
zugeführt, worauf es von der Klemme 32 ausgegeben wird.
Es erfolgt nun eine Beschreibung von Beispielen der Anordnungen
des Wellenform-Codierers 43 und des Wellenform-Decodierers 51,
die nach diesen Ausführungen verwendet werden, und zwar zusammen
mit dem Verhältnis zwischen dem Niederfrequenz-Sprachsignal-
Frequenzband und der Codiergeschwindigkeit.
Die Fig. 4A und 4B zeigen Beispiele der Anordnungen des
Wellenform-Codierers 43 und des Wellenform-Decodierers 51.
Diese Beispiele verwenden das APC-System, und sie sind in dem
japanischen Patentblatt Nr. 1 16 000/85 veröffentlicht.
Die Operation des in Fig. 4A gezeigten Wellenform-Codierers
43 wird zuerst beschrieben.
Ein digitales Eingangssignal S j wird über eine Codierer-
Eingangsklemme 70 einem LPC-Spektralanalysator 71 zugeführt,
in welchem es einer Kurzzeit-Spektralanalyse (einer LPC-Analyse)
für jeden Rahmen unterworfen wird. Der sich ergebende
LPC-Parameter wird durch einen LPC-Parameter-Codierer 72 codiert
und wird darauf über einen Multiplexer 98 zur Übertragungsseite
übertragen.
Ferner wird das Ausgangssignal des LPC-Parameter-Codierers
72 durch einen LPC-Parameter-Decodierer 73 decodiert, wodurch
ein Vorhersage-Koeffizient erhalten wird. Der Vorhersage-
Koeffizient wird zu verschiedenen Werten für entsprechende
Anzapfungen eines digitalen Filters bewertet, die einen
Kurzzeit-Prädiktor 74 bilden, wodurch erneut ein Vorhersagekoeffizient
erzeugt wird. Angenommen nun, daß die Z-
umgewandelte Übertragungsfunktion des Kurzzeit-Prädiktors
74 folgendermaßen ist:
wobei
a i = α i β i .
a i = α i β i .
In der obigen Gleichung ist N die Anzahl an Anzapfungen.
a i ist ein Vorhersage-Koeffizient einer i-ten Anzapfung.
α i ist ein Vorhersage-Koeffizient, der durch Decodierung
des Ergebnisses der LPC-Analyse erhalten worden ist. β ist
eine feste Konstante, welche den Bewertungswert darstellt und
die einen Wert innerhalb des Bereiches von 0 ≦ωτ β ≦ωτ 1 besitzt.
Der Vorhersage-Koeffizient a i wird für ein Rauschen-Formungs-
Filter 87 und für einen Kurzzeit (Spektrum)-Prädiktor 93
für eine lokale Decodierung verwendet. Der Vorhersage-Ausgang
vom Kurzzeit-Prädiktor 74, welcher den Vorhersage-
Koeffizienten a i (wobei i = 1 bis N) verwendet, wird durch
einen Subtrahierer 75 von einem Eingangssignal subtrahiert,
wodurch ein Kurzzeit-Spektral-Restsignal erhalten wird. Das
Restsignal hat in diesem Augenblick keine Korrelation in
einer kurzen Zeit außer der Tonhöhen-Periode. Ausgehend von
diesem Signal erhält ein Tonhöhen-Parameter-Codierer 77, der
über einen Tonhöhen-Analysator 76 mit dem oben erwähnten
Subtrahierer 75 verbunden ist, eine Korrelation zwischen dem
Sprachsignal und der Tonhöhenperiode N p und errechnet einen
Vorhersage-Koeffizienten für einen Langzeit (Spektrum)-
Prädiktor 79. Der Langzeit (Spektrum)-Prädiktor 79 errechnet
einen Vorhersagewert unter Verwendung der Tonhöhen-Periode,
des Vorhersage-Koeffizienten und des Ausgangssignals vom
Subtrahierer 75, und zwar unter Verwendung einer Tatsache,
daß das Sprachsignal im wesentlichen in der gleichen Wellenform
entsprechend der Tonhöhen-Periode wiederholt wird. Durch
Subtrahieren des obengenannten Kurzzeit-Vorhersagewertes und
des Langzeit-Vorhersagewertes vom Eingangssignal kann das
Restsignal am Ausgangsrauschen eines Subtrahierers 80 im
wesentlichen in idealer Weise ausgelöscht werden. Die Tonhöhen-
Periode und der durch den Tonhöhen-Parameter-Codierer
77 codierte Vorhersagekoeffizient werden über den Multiplexer
98 zur Empfangsseite übertragen.
Von dem so ausgelöschten (whitened) Ausgangssignal des
Subtrahierers 80 wird das Ausgangssignal des Rausch-Form-
Filters 87 durch einen Subtrahierer 88 subtrahiert, dessen
Ausgangssignal mit Hilfe eines anpassungsfähigen Quantisierers
84 als das endgültige Restsignal quantisiert und codiert wird.
Der anpassungsfähige Quantisierer 84 hat als seine Grund-
Schrittgröße eine quantisierende Schrittgröße, welche einen
optimalen Wert erzeugt, d. h., das quantisierende Rauschen so
klein wie möglich macht, wenn die Varianz des endgültigen
Restsignals 1 ist. Wenn also die Varianz des endgültigen
Restsignals nicht 1 ist, wird die quantisierende Charakteristik
verschlechtert. Es ist ein RMS-Rechner 81, welcher diese Verschlechterung
kompensiert. Durch Multiplikation der Grund-
Schrittgröße mit dem in dem RMS-Rechner 81 errechneten RMS-
Wert kann ein quantisierendes Schrittoptimum für den RMS-Wert
erreicht werden, und es kann auch das endgültige Restsignal
gesteuert werden durch Zurückführen auf den RMS-Wert, so daß
die Varianz 1 wird. Für die Vergrößerung der Signalqualität
ist es erwünscht, mehrere Arten von Grundschrittgrößen vorzubereiten,
wobei die Art der Amplitudenverteilung des endgültigen
Restsignals, wie die Gauß'sche oder Laplace'sche Verteilung
in Betracht gezogen wird. Jedoch hat das endgültige
Restsignal am Ausgang des Subtrahierers 88 keine ideale Verteilung,
weil es durch Subtraktion von dem ausgelöschten Signal
des Ausgangssignals des Rausch-Form-Filters 87 erzeugt
ist, welches Filter 87 eine Frequenzabschneidecharakteristik
besitzt. Deshalb ist eine Reihe von Prozeßschritten, wie sie
unten beschrieben ist, erforderlich, um eine optimale Quantisierungsschrittgröße
zu erhalten.
Es sei angenommen, daß die quantisierende Schrittgröße für
jeden Teilrahmen geändert wird.
Der RMS-Wert des Restsignals wird durch den RMS-Wert-Rechner
81 für jeden Teilrahmen erhalten, und er wird ferner einem
RMS-Wert-Codierer 82 und einem RMS-Wert-Decodierer 83 zugeführt,
wodurch ein quantisierter RMS-Wert erhalten wird.
Der Ausgangspegel des RMS-Wert-Codierers 82 wird zu dieser
Zeit als ein Bezugspegel angesehen, und er wird entlang den
angrenzenden Stufen in dem Codierer 82 gespeichert. Zuerst
wird die Schrittgröße des anpassungsfähigen Quantisierers
84 bestimmt, und zwar unter Verwendung eines quantisierten
RMS-Wertes entsprechend dem Bezugspegel bzw. Bezugswert als
Bezugs-RMS-Wert. Dann wird das Ausgangssignal des Rausch-
Form-Filters 87 durch den Subtrahierer 88 vom Restsignal
subtrahiert, und es wird das subtrahierte Ausgangssignal
als das endgültige Restsignal quantisiert und codiert. Ferner
wird das codierte Signal einem anpassungsfähigen Entquantisierer
85 zugeführt, um ein quantisiertes endgültiges Restsignal
zu erhalten, von dem durch einen Subtrahierer 86 das
nicht-quantisierte endgültige Restsignal subtrahiert wird,
wodurch ein quantisiertes Rauschen erhalten wird. Das so
erhaltene quantisierte Rauschen wird dem Rausch-Form-Filter
87 zugeführt. Gleichzeitig wird das quantisierte endgültige
Restsignal einem Addierer 90 zugeführt, indem es mit dem
Ausgangssignal von einem Langzeit (Spektrum)-Prädiktor
89 zur lokalen Decodierung addiert wird. Ferner wird das
addierte Ausgangssignal durch einen Addierer 91 mit dem
Ausgangssignal des Kurzzeit (Spektrum)-Prädiktors 93
zur lokalen Decodierung addiert. Infolgedessen wird ein
lokal decodiertes Eingangssignal S j an einer lokal decodierten
Signalklemme 92 erhalten. Eine Differenz zwischen
dem lokal decodierten Eingangssignal und dem Eingangssignal
wird durch einen Subtrahierer 97 als Fehlersignal erhalten.
Die Leistung des Fehlersignals wird in einem Minimum-Fehler-
Leistungsdetektor 96 über den Teilrahmen berechnet. Für alle
die grundlegenden Stufengrößen, die für je eine Reihe von
Operationen, ähnlich denjenigen, die oben beschrieben sind,
ausgeführt worden sind, wird die Leistung des jedem entsprechenden
Fehlersignals durch den Minimum-Fehler-Leistungsdetektor
96 errechnet und darin gespeichert. Ferner werden
entsprechende Schrittgrößen für alle einer vorbestimmten Nummer
von RMS-Pegeln nahe dem Bezugs-RMS-Pegel erhalten, und
sie werden in den anpassungsfähigen Quantisierer 84 eingesetzt.
Wie bei der grundlegenden Schrittgröße werden die vorgenannten
Prozeßschritte ausgeführt, durch die die Fehlersignal-
Leistung für jeden RMS-Pegel errechnet und gespeichert wird.
Diejenige Kombination eines vorbestimmten Bezugs-RMS-Wertes
und benachbarter RMS-Werte und der vorbereiteten grundlegenden
Schrittgröße, die das Minimum einer der Fehlersignal-Leistungen
bewirken, erhalten entsprechend allen oben genannten Kombinationen,
wird
als Optimum-Quantisierungs-Parameter angesehen,
welche durch einen Schrittgrößen-Codierer 94 codiert werden
und dann über den Multiplexer 98 zur Empfangsseite übertragen
werden. Für die grundlegende Schrittgröße wird durch den
Schrittgrößen-Codierer 94 ein entsprechendes Code-Wort erzeugt
und über den Multiplexer 98 zur Empfangsseite übertragen.
Als nächstes wird in Verbindung mit Fig. 4B die Arbeitsweise der
Empfangsseite beschrieben. Das über eine Decoder-Eingangs-
Klemme 100 erhaltene Signal wird durch einen Demultiplexer
101 in ein das endgültige Restsignal betreffendes Signal,
ein den RMS-Wert betreffendes Signal, ein die grundlegende
Schrittgröße betreffendes Signal und ein den Tonhöhen-Parameter
betreffendes Signal aufgeteilt. Der RMS-Wert wird durch
einen RMS-Wert-Decodierer 103 decodiert. Dieser Wert und die
durch einen Schrittgrößen-Decodierer 102 erhaltene grundlegende
Schrittgröße werden in einen Dequantisierer 104 eingegeben.
Auf diesen basierend, wird das das empfangene endgültige
Restsignal betreffende Signal I j durch den Dequantisierer
104 decodiert, und es wird ein quantisiertes endgültiges
Restsignal E j erhalten. Andererseits wird der über einen
LPC-Parameter-Decodierer 107 erhaltene Vorhersage-Koeffizient
in einen Kurzzeit-Prädiktor 110 eingegeben.
Das den Tonhöhen-Parameter betreffende Signal wird einem
Tonhöhen-Parameter-Decodierer 106 zugeführt, durch den die
Tonhöhenperiode und der Vorhersage-Koeffizient erhalten werden,
und sie werden in einen Langzeit-Prädiktor 108 eingegeben.
Der Vorhersageausgang vom Langzeit-Prädiktor 108 wird durch
einen Addierer 105 mit dem Ausgang vom Dequantisierer 104
addiert, und es wird der addierte Ausgang dem Langzeit-
Prädiktor 108 zugeführt. Gleichzeitig wird der addierte
Ausgang dem Vorhersageausgang vom Kurzzeit-Prädiktor 110
mit Hilfe eines Addierers 109 hinzuaddiert, wodurch ein decodiertes
Sprachbandsignal S j erhalten wird.
Das endgültige Restsignal E j oder das Ausgangssignal vom
Addierer 105 wird als ein hochfrequenzerzeugendes Signal
an eine Klemme 54 ausgegeben. Der Ausgang vom Tonhöhen-
Parameter-Decodierer 106 ist an einer Klemme 57 vorgesehen.
Die grundlegende Bearbeitung für das Niederfrequenz-Sprachsignal
in der Anordnung nach Fig. 3 unter Verwendung des
oben beschriebenen APC-Systems für die Übertragung des Niederfrequenz-
Sprachsignals erfolgt nach Fig. 5. In diesem Fall
erfolgt eine Beschreibung nur in Verbindung mit einem Fall
unter Verwendung eines Kurzzeit-Prädiktors. Das Bezugszeichen
100 bezeichnet einen Kurzzeit-Prädiktor auf der Sendeseite
und 101 einen Kurzzeit-Prädiktor auf der Empfangsseite. In
diesem Falle sei angenommen, daß die Übertragungsfunktion des
Prädiktors 101, die Übertragungsfunktion des Rausch-Form-
Filters 87 im Wellenform-Codierer 43, das Niederfrequenz-
Sprachsignal und das quantisierende Rauschen dargestellt
wird durch P(z), F(z), S(z) und N(z), in welchem Falle
das reproduzierte Niederfrequenz-Sprachsignal R(z) folgendermaßen
ausgedrückt werden kann:
In Gleichung (2) kann unter einer Bedingung, in welcher F(z) =
P/(Z/ δ) und indem der Wert von w kleiner als 1 gemacht wird,
der Einfluß des quantisierenden Rauschens merklich hörbar
verringert werden im Vergleich mit dem Falle der vorher erwähnten
Gleichung (1).
In einer aktuellen Simulation konnte ein reproduziertes
Sprachsignal guter Qualität erhalten werden, obwohl durch
den adaptiven Quantisierer 84 eine Ein-Bit-Quantisierung
bewirkt wurde.
Die Fähigkeit der Übertragung des Niederfrequenzsignals durch
die Ein-Bit-Quantisierung bringt in dem RELP-System die
folgenden Vorteile mit sich.
In einem Übertragungssystem mit 4,8 Kb/s beträgt das Niederfrequenz-
Sprachsignal-Band 1 KHz und es wird abgetastet
bei einer Geschwindigkeit von 2 KHz, und es werden Übertragungs-
Bits von 2 Kb/s für die Übertragung des Signals zugeteilt,
während die Übertragungs-Bits von 2,8 Kb/s der Übertragung
der anderen Information zugeteilt werden, wodurch eine
Signalübertragung mit hoher Qualität ermöglicht wird. Die Übertragungsgeschwindigkeit
von 4,8 Kb/s ist die untere Grenze
für die Übertragung eines Sprachsignals hoher Qualität.
In einem 7,2- oder 9,6-Kb/s-Übertragungssystem kann das
Niederfrequenz-Sprachsignal-Band erweitert werden. Wenn
beispielsweise in dem 7,2-Kb/s-Übertragungssystem Übertragungs-
Bits von 4 Kb/s der Übertragung des Niederfrequenz-
Sprachsignals zugeteilt werden und 3,2 Kb/s der Übertragung
der anderen Information zugeteilt werden, kann das Niederfrequenz-
Sprachsignal-Band auf 2 KHz ausgedehnt werden.
Dies bedeutet, daß das Band des auf der Empfangsseite zu
reproduzierende Bands des Hochfrequenz-Sprachsignals auf
2 KHz reduziert wird und infolgedessen die Qualität des
zu reproduzierenden Sprachsignals beträchtlich verbessert
werden kann.
In dem 9,6-Kb/s-Übertragungssystem werden Übertragungs-Bits
von etwa 7 Kb/s der Übertragung des Niederfrequenz-Sprachsignals
zugeteilt, wobei in diesem Falle das Niederfrequenz-
Sprachsignal-Band 3,5 KHz beträgt, während das Band des
auf der Empfangsseite reproduzierenden Hochfrequenz-Sprachsignals
weniger als 1 KHz beträgt. Auch wenn also die
das Hochfrequenz-Sprachsignal reproduzierende Vorrichtung
nicht von so hoher Leistung ist, kann ein Sprachsignal
mit extrem hoher Qualität erhalten werden.
Aus den oben angegebenen Gründen werden die Grenzfrequenzen
des Tiefpaßfilters 40 und des Hochpaßfilters 41 in Beziehung
zu der Codiergeschwindigkeit bestimmt.
Es wird nunmehr die eine höher harmonische Welle erzeugende
Vorrichtung beschrieben. In diesem Falle kann die übliche
Vorrichtung zur Erzeugung einer höher harmonischen Welle
wie vorher beschrieben verwendet werden, jedoch wird ein
Vorschlag für eine Vorrichtung gemacht, die eine weitere
Verbesserung der Signalqualität bewirkt.
Fig. 6 zeigt ein Beispiel der Anordnung hierfür, und es zeigen
die Fig. 7A bis 7D Wellenformen, die an entsprechenden Teilen
der Anordnung auftreten. In diesem Falle ist das Eingangssignal
ein Niederfrequenz-Sprachsignal, das bei 2 KHz abgetastet
wird, wie es in Fig. 7A gezeigt ist. Ein Spektrum-
Halter 203 interpoliert Null-Abtastwerte zwischen Abtastungen
des in Fig. 7A gezeigten Signals, wodurch ein 8-KHz-abgetastetes
Signal erhalten wird, wie es in Fig. 7B gezeigt ist.
Bei diesem Signal ist das Niederfrequenz-Sprachsignalband,
gesehen auf der Frequenzachse, wiederholt gefaltet, was ein
Ton-Rauschen bewirkt. Um dieses zu verhindern, wird bei
diesem Beispiel durch einen Addierer
F208 die Wellenform
nach Fig. 7B mit einem Pseudo-Rauschen, das durch einen
Rausch-Generator 205 erzeugt wird, hinzuaddiert. Es ist
auch möglich, die Null-Abtast-Werte durch ein Pseudo-Rauschen
durch andere Vorrichtungen zu ersetzen. Da der Pseudo-Rausch-
Pegel proportional dem Eingangssignal-Pegel sein muß, wird
der Rauschpegel durch einen Leistungsrechner 204 kontrolliert.
In Fig. 7C ist das Eingangssignal durch ausgezogene Linien
dargestellt, während das addierte Pseudo-Rauschen durch unterbrochene
Linien dargestellt ist. Ein Mittel-Spitzenbegrenzer
206 begrenzt das Signal nach Fig. 7C auf einen
Pegel Lt, der durch eine strichpunktierte Linie dargestellt
ist. Der Grund hierfür liegt darin, daß Abtastungen von
kleinen Werten unnötige hochfrequente Rauschspannungen erzeugen.
Der Begrenzungspegel Lt wird auch von dem Leistungsrechner
204 unter Kontrolle gehalten, da er sich anpassungsfähig mit
dem Eingangssignalpegel verändern muß. Infolgedessen ist
das höher harmonische Wellensignal, das von dem Mittel-Spitzenbegrenzer
206 zur Verfügung gestellt wird, so wie es in Fig. 7D
gezeigt ist. Dieses Signal enthält die harmonische Wellenstruktur,
ist aber im Ton-Rauschen unterdrückt, was der
Spektrum-Haltetechnik eigentümlich ist, und es hat ein flaches
Spektrum. Ein Bandpaß-Filter 207 wird verwendet, um ein gewünschtes
Band auszublenden.
Das so erhaltene höher harmonische Wellensignal wird synthetisiert
als eine Hochfrequenz-Sprachsignal-Steuerquelle unter
Verwendung der Tonhöhen-Information und der Spektrum-Information,
wie es vorher erwähnt ist, und sein Spektrum wird
weiter geformt, wodurch ein Hochfrequenz-Sprachsignal hoher
Qualität erzeugt werden kann.
Die Fig. 8 bis 10 zeigen beispielsweise die Anordnungen
des Hochfrequenz-Tonhöhen-Synthesefilters 56, des Kurzzeit-
Hochfrequenz-Synthesefilters 46 und des Hochfrequenz-
Spektrum-Formfilters 59, die in der Ausführung nach Fig. 3
verwendet werden. Die Prädiktoren 215 und 217 in Fig. 10
verwenden die Koeffizienten der entsprechenden Prädiktoren
211 und 213 in den Fig. 8 und 9 oder deren geeignet bewertete
Werte.
Wie oben beschrieben, ermöglicht die Ausführung nach Fig. 3
die Reproduktion eines Sprachsignals, das genauer dem Original-
Sprachsignal entspricht. Das menschliche Hörempfinden
beurteilt aber die Qualität des Sprachsignals nicht allein
aufgrund der Güte seiner Wellenform. Manchmal wird der subjektive
Beurteilungswert des Sprachsignals aufgrund der Eigenschaft
des Rauschens, das in ihm enthalten ist, herabgesetzt.
Im folgenden wird eine Vorrichtung beschrieben, die wirksam
ist, den subjektiven Beurteilungswert zu verbessern, obwohl
sie die Wiedergabetreue der Wellenform in gewissem Ausmaße
beeinträchtigt. Diese Vorrichtung ist wirksam für alle
Sprachsignal-Übertragungssysteme, wie das bekannte RELP-
System, das APC-System usw., und zwar unabhängig von der
in Fig. 3 gezeigten Ausführung.
Im Falle der Wellenform-Codierung, wie in dem APC-System,
ist das in dem reproduzierten Sprachsignal enthaltene
Rauschen das quantisierende Rauschen N(z), das in bezug
auf die Frequenz ein verhältnismäßig flaches Spektrum aufweist.
Im Falle der Reproduktion der höher harmonischen
Wellen, wie in dem RELP-System, hat das Rauschen ein von
demjenigen des Sprachsignals völlig anderes Spektrum. Ein
solcher Unterschied in der Natur des Spektrums zwischen
dem Sprachsignal und dem Rauschen beeinträchtigt stark den
subjektiven Beurteilungswert. Mit Rücksicht hierauf betont
die vorliegende Erfindung die Natur des Sprachsignals und
verleiht dem Rauschen eine Natur ähnlich derjenigen des
Sprachsignals, und bewirkt dadurch eine erhöhte Beurteilung
im Hörempfinden.
Fig. 11 zeigt ein Beispiel einer Anordnung hierfür, die
ein Nach-Rauschen-Formfilter 218 und einen Pegel-Justierer
219 enthält. In der Ausführung nach Fig. 1 sind diese Elemente
zwischen das Synthese-Filter 29 und den D/A-Wandler
30 eingeschaltet, durch die das reproduzierte Sprachsignal
verarbeitet wird. Das Nach-Rauschen-Formfilter 218 ist
in der Konstruktion identisch mit dem Synthese-Filter 29,
und es verwendet als seinen Koeffizienten einen bewerteten
Wert des Koeffizienten des Synthese-Filters 29.
In der in Fig. 3 gezeigten Ausführung sind das Nach-Rauschen-
Formfilter 218 und der Pegel-Justierer 219 an den Ausgang
des Wellenform-Decodierers 51 angeschaltet. Das Nach-Rauschen-
Formfilter 218 ist zusammengesetzt aus einem Tonhöhen-Synthese-
Filter 220 und einem Kurzzeit-Spektrum-Synthesefilter 223,
wie es in Fig. 12 gezeigt ist. Ein Langzeit-Prädiktor 222
und ein Kurzzeit-Prädiktor 225, die in diesen Filtern vorgesehen
sind, sind in der Konstruktion identisch mit dem Langzeit-
Prädiktor 108 und dem Kurzzeit-Prädiktor 110, die vorher
in Verbindung mit Fig. 4B erwähnt sind, und ihre Koeffizienten
sind bewertete Werte der Koeffizienten der letzteren.
Angenommen, daß die Übertragungsfunktionen der Langzeit- und
Kurzzeit-Prädiktoren 222 und 225 in dem Z-Umwandlungsbereich
durch P PNL (z) und P PNS (z) dargestellt sind, können sie folgendermaßen ausgedrückt werden:
wobei γ L und q S Koeffizienten für Formzwecke sind, wobei C
der Koeffizient des Langzeit-Prädiktors 222 ist, wobei N p
die Zahl der Anzapfungen (entsprechend der Tonhöhen-Periode)
des Langzeit-Prädiktors 222 ist, wobei α i der Koeffizient
einer i-ten Anzapfung des Kurzzeit-Prädiktors 225 ist und
wobei N die Zahl der Anzapfungen des Kurzzeit-Prädiktors
225 ist. Wenn in Gleichung (3) die Koeffizienten γ L und q S
auf 1 eingestellt werden, werden die Übertragungsfunktionen
der Langzeit- und Kurzzeit-Prädiktoren 79 und 74 in Fig. 4
einander gleich.
Obwohl in Fig. 12 nicht gezeigt, werden die Koeffizienten
der Prädiktoren 222 und 225 von den Prädiktoren 108 und 110
in dem Wellenform-Decodierer 51 geliefert, und ihre Koeffizienten
werden verwendet, nachdem sie durch γ L und γ S bewertet
worden sind. Diese Werte von q L und γ S werden in den Bereichen
von 0 ≦ωτγ L und γ S ≦ 1 auf der Basis der subjektiven Beurteilung
ausgewählt.
Experimentell wurden gute Ergebnisse unter den Werten des
Bereiches von 0,4 bis 0,2 erhalten. Durch die Operation
eines solchen Nach-Rauschen-Formfilters 218 mit einem Eingang,
wie er in Fig. 13A gezeigt ist, wird die Eigenschaft des
Sprachsignals weiter hervorgehoben, während das Rauschen,
wie es in Fig. 13A gezeigt ist, auch eine Charakteristik
ähnlich derjenigen des Sprachsignals erhält, wie es in Fig. 13B
gezeigt ist.
Der Pegel-Justierer 219 in Fig. 11 ist vorgesehen für die
gleiche Justierung der Eingangsleistung und der Signalleistung
des Nach-Rauschen-Formfilters 218, da
sich der
Pegel des Signals verändert.
Wie oben im einzelnen beschrieben, wird nach der Erfindung
das Niederfrequenz-Sprachsignal als eine genaue Wellenform
übertragen, und zwar durch Verwendung des APC-Systems, und
es wird das Hochfrequenz-Sprachsignal als ein Vorhersage-
Koeffizient eines Kurzzeit-Spektrums übertragen. Auf der
Empfangsseite wird das genaue Niederfrequenz-Sprachsignal
decodiert, und es werden die Spektrum-Einhüllende und die
Tonhöhen-Struktur für die reproduzierten höher harmonischen
Wellen rekonstruiert, durch die ein Hochfrequenz-Sprachsignal
hoher Qualität erzeugt werden kann, und es kann die
Sprachsignal-Qualität merklich verbessert werden. Insbesondere
die Anwendbarkeit des APC-Systems der Ein-Bit-Quantisierung
auf die Übertragung des Niederfrequenz-Sprachsignals
ermöglicht die Sprachsignal-Übertragung guter Qualität in
dem Falle einer Codierungsgeschwindigkeit von 4,8 Kb/s und
die Reduktion des Hochfrequenz-Sprachsignalbandes im Falle
der Codierungsgeschwindigkeit von 7,2 auf 9,6 Kb/s, wodurch
eine verbesserte Sprachsignalqualität hervorgerufen wird.
Außerdem bietet die Erfindung Vorrichtungen zur Erzeugung
einer qualitativ hochwertigen höher harmonischen Welle und
Vorrichtungen zur Verbesserung des subjektiven Beurteilungswertes
eines Sprachsignals.
- Bezugszeichen-Liste
Fig. 1A:
2 = Analogfilter
3 = A/D-Wandler
5 = Kurzzeit-Spektralanalysator
6 = Umkehrfilter
7 = LPC-Koeffizienten-Codierer
8 = LPC-Koeffizienten-Decodierer
9 = Tiefpaßfilter
10 = Abtast-Geschwindigkeitswandler
11 = Wellenform-Codierer
12 = Leistungs-Komparator
13 = Codierer
14 = Rahmen-Synchronisationssignal-Generator
15 = Multiplexer
16 = Übertragungsweg
Fig. 1B:
17 = Übertragungsweg
18 = Demultiplexer
19 = Rahmen-Synchronisationssignal-Detektor
20 = Wellenform-Decodierer
21 = Abtastgeschwindigkeits-Wandler
22 = Tiefpaß-Filter
23 = Generator für höher harmonische Wellen
24 = Hochpaß-Filter
25 = Pegel-Einstellvorrichtung
26 = Decodierer
28 = LPC-Koeffizienten-Decodierer
29 = Synthese-Filter
30 = D/A-Wandler
31 = Analogfilter
Fig. 2:
siehe Zeichnungseintragungen
Fig. 3:
2 = Analogfilter
3 = A/D-Wandler
14 = Rahmen-Synchronisationssignal-Generator
"Transmission Path" = Übertragungsweg
19 = Rahmen-Synchronisationssignal-Generator
30 = D/A-Wandler
31 = Analogfilter
40 = Tiefpaß-Filter
41 = Hochpaß-Filter
42 = Abtastgeschwindigkeits-Wandler
43 = Wellenform-Codierer
44 = Multiplexer
45 = Kurzzeit-Spektral-Analysator
46 = Kurzzeit-Hochfrequenz-Synthesefilter
47 = LPC-Koeffizienten-Codierer
48 = Leistungs-Komparator
49 = Codierer
50 = Demultiplexer
51 = Wellenform-Decodierer
52 = Abtastgeschwindigkeits-Wandler
53 = Tiefpaß-Filter
55 = Generator für höher harmonische Wellen
56 = Hochfrequenz-Tonhöhen-Synthesefilter
58 = LPC-Koeffizienten-Decodierer
59 = Hochfrequenz-Spektrum-Formfilter
60 = Decodierer
61 = Pegel-Einstellvorrichtung
Fig. 4A:
71 = LPC-Spektrum-Analysator
72 = LPC-Parameter-Codierer
73 = LPC-Parameter-Decodierer
74 = Kurzzeit-Prädiktor
76 = Tonhöhen-Analysator
77 = Tonhöhen-Parameter-Codierer
78 = Tonhöhen-Parameter-Decodierer
79 = Langzeit-Prädiktor
81 = RMS-Rechner
82 = RMS-Wert-Codierer
83 = RMS-Wert-Decodierer
84 = Anpassungsfähiger Quantisierer
85 = Entquantisierer
87 = Rausch-Form-Filter
89 = Langzeit-Prädiktor
93 = Kurzzeit-Prädiktor
94 = Schrittgrößen-Codierer
95 = RMS-Wert-Schrittgrößen-Selektor
96 = Minimum-Fehler-Leistungs-Detektor
98 = Multiplexer
Fig. 4B:
101 = Demultiplexer
102 = Schrittgrößen-Decodierer
103 = RMS-Wert-Decodierer
104 = Dequantisierer
106 = Tonhöhen-Parameter-Decodierer
107 = LPC-Parameter-Decodierer
108 = Langzeit-Prädiktor
110 = Kurzzeit-Prädiktor
Fig. 5:
siehe Zeichnungseintragungen
Fig. 6:
siehe Zeichnungseintragungen
Fig. 7A, 7B, 7C, 7D:
keine Eintragungen
Fig. 8:
siehe Zeichnungseintragungen
Fig. 9:
siehe Zeichnungseintragungen
Fig. 10:
siehe Zeichnungseintragungen
Fig. 11:
siehe Zeichnungseintragungen
Fig. 12:
siehe Zeichnungseintragungen
Fig. 13A:
siehe Zeichnungseintragungen
Fig. 13B:
siehe Zeichnungseintragungen
Claims (3)
1. System zum Übertragen eines Sprachsignals, dadurch
gekennzeichnet, daß ein eingegebenes Sprachsignal
in ein Niederfrequenz-Sprachsignal und ein Hochfrequenz-Sprachsignal
aufgeteilt wird, daß ein vorhersagendes Restsignal
des Niederfrequenz-Sprachsignals übertragen wird,
nachdem es in einem Wellenform-Codierer (43) codiert worden
ist, um so die Verschlechterung seiner Qualität soweit wie
möglich klein zu halten, und daß eine für ein Kurzzeit-Hochfrequenz-Spektrum
des Hochfrequenz-Sprachsignals bezeichnende
Information aus diesem ausgeblendet
und nach Codierung übertragen wird.
2. System nach Anspruch 1, dadurch gekennzeichnet, daß
der Wellenform-Codierer (43) einen anpassungsfähigen Quantisierer
(84) zur Gewinnung eines zu übertragenden codierten
Niederfrequenz-Sprachsignals, einen Kurzzeit-Prädiktor (74)
zur Gewinnung eines Voraussagewertes aus dem Niederfrequenz-
Sprachsignal, einen Langzeit-Prädiktor zur Gewinnung eines
Laufzeit-Voraussagewertes aus dem Niederfrequenz-Sprachsignal,
eine erste Subtrahiervorrichtung (75, 80) zum Subtrahieren
des Kurzzeit-Voraussagewertes und des Laufzeit-Voraussagewertes
von dem Niederfrequenz-Sprachsignal zur Erzielung
eines Restsignals, einen Dequantisierer (85) zum Entquantisieren
des codierten Niederfrequenz-Sprachsignals, um ein
endgültiges quantisiertes Restsignal zu erhalten, eine zweite
Subtrahiervorrichtung (86) zum Subtrahieren des quantisierten
endgültigen Sprachsignals von einem Eingangssignal des
anpassungsfähigen Quantisierers, um ein quantisiertes Rauschen
zu erhalten, ein Rauschen-Formungs-Filter (87) zur Erzielung
eines geformten Rauschens und eine dritte Subtrahiervorrichtung
(88) zum Subtrahieren des geformten Rauschens von dem
Restsignal, um ein endgültiges Restsignal zur Verwendung als
Eingangssignal des anpassungsfähigen Quantisierers (84) zu
erhalten.
3. System nach Anspruch 1, dadurch gekennzeichnet, daß
die für das Hochfrequenz-Sprachsignal bezeichnende Information
eine Koeffizienten-Information und eine Leistungsverhältnis-
Information ist, wobei die Koeffizienten-Information
aus dem Hochfrequenz-Sprachsignal durch einen Kurzzeit-Spektrum-
Analysator und codiert durch einen LPC-Koeffizienten-Codierer
erhalten wird und wobei die Leistungsverhältnis-Information
durch Vergleich des Hochfrequenz-Sprachsignals mit dem Niederfrequenz-
Sprachsignal und codiert durch einen Codierer
erhalten wird.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61076788A JPS62234435A (ja) | 1986-04-04 | 1986-04-04 | 符号化音声の復号化方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3710664A1 DE3710664A1 (de) | 1987-10-15 |
DE3710664C2 true DE3710664C2 (de) | 1988-09-15 |
Family
ID=13615354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19873710664 Granted DE3710664A1 (de) | 1986-04-04 | 1987-03-31 | System zum uebertragen eines sprachsignals |
Country Status (5)
Country | Link |
---|---|
US (1) | US4757517A (de) |
JP (1) | JPS62234435A (de) |
DE (1) | DE3710664A1 (de) |
FR (1) | FR2596936B1 (de) |
GB (1) | GB2188820B (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4203436A1 (de) * | 1991-02-06 | 1992-08-13 | Koenig Florian | Datenreduzierte sprachkommunikation |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4933883A (en) * | 1985-12-04 | 1990-06-12 | International Business Machines Corporation | Probability adaptation for arithmetic coders |
EP0280827B1 (de) * | 1987-03-05 | 1993-01-27 | International Business Machines Corporation | Verfahren zur Grundfrequenzbestimmung und Sprachkodierer unter Verwendung dieses Verfahrens |
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US5125030A (en) * | 1987-04-13 | 1992-06-23 | Kokusai Denshin Denwa Co., Ltd. | Speech signal coding/decoding system based on the type of speech signal |
JP3033060B2 (ja) * | 1988-12-22 | 2000-04-17 | 国際電信電話株式会社 | 音声予測符号化・復号化方式 |
GB2229342A (en) * | 1989-03-15 | 1990-09-19 | Marconi Gec Ltd | Data reduction of digitised speech signals |
EP0401452B1 (de) * | 1989-06-07 | 1994-03-23 | International Business Machines Corporation | Sprachcodierer mit niedriger Datenrate und niedriger Verzögerung |
US5206884A (en) * | 1990-10-25 | 1993-04-27 | Comsat | Transform domain quantization technique for adaptive predictive coding |
BE1007617A3 (nl) * | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5802109A (en) * | 1996-03-28 | 1998-09-01 | Nec Corporation | Speech encoding communication system |
DE19643900C1 (de) * | 1996-10-30 | 1998-02-12 | Ericsson Telefon Ab L M | Nachfiltern von Hörsignalen, speziell von Sprachsignalen |
FR2761848B1 (fr) * | 1997-04-04 | 2004-09-17 | Parrot Sa | Dispositif de commande vocale pour radiotelephone, notamment pour utilisation dans un vehicule automobile |
EP1168734A1 (de) * | 2000-06-26 | 2002-01-02 | BRITISH TELECOMMUNICATIONS public limited company | Verfahren zur Reduzierung der Verzerrung in einer Sprachübertragung über Datennetze |
AUPR433901A0 (en) | 2001-04-10 | 2001-05-17 | Lake Technology Limited | High frequency signal construction method |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7318027B2 (en) * | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
WO2004097796A1 (ja) * | 2003-04-30 | 2004-11-11 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置、音声復号化装置及びこれらの方法 |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
EP1513137A1 (de) * | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Sprachverarbeitungssystem und -verfahren mit Multipuls-Anregung |
EP1736965B1 (de) * | 2004-04-28 | 2008-07-30 | Matsushita Electric Industrial Co., Ltd. | Hierarchische kodierungsanordnung und hierarchisches kodierungsverfahren |
CN102280109B (zh) | 2004-05-19 | 2016-04-27 | 松下电器(美国)知识产权公司 | 编码装置、解码装置及它们的方法 |
JPWO2006025313A1 (ja) * | 2004-08-31 | 2008-05-08 | 松下電器産業株式会社 | 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法 |
JP4551817B2 (ja) * | 2005-05-20 | 2010-09-29 | Okiセミコンダクタ株式会社 | ノイズレベル推定方法及びその装置 |
JP4556866B2 (ja) * | 2005-12-27 | 2010-10-06 | 日本ビクター株式会社 | 高能率符号化プログラム及び高能率符号化装置 |
FR2911031B1 (fr) * | 2006-12-28 | 2009-04-10 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
FR2911020B1 (fr) * | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
EP2830064A1 (de) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Decodierung und Codierung eines Audiosignals unter Verwendung adaptiver Spektralabschnittsauswahl |
US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
CN112885363A (zh) * | 2019-11-29 | 2021-06-01 | 北京三星通信技术研究有限公司 | 语音发送方法和装置以及语音接收方法和装置、电子设备 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3914554A (en) * | 1973-05-18 | 1975-10-21 | Bell Telephone Labor Inc | Communication system employing spectrum folding |
US4048443A (en) * | 1975-12-12 | 1977-09-13 | Bell Telephone Laboratories, Incorporated | Digital speech communication system for minimizing quantizing noise |
FR2412987A1 (fr) * | 1977-12-23 | 1979-07-20 | Ibm France | Procede de compression de donnees relatives au signal vocal et dispositif mettant en oeuvre ledit procede |
DE3171990D1 (en) * | 1981-04-30 | 1985-10-03 | Ibm | Speech coding methods and apparatus for carrying out the method |
JPS594718B2 (ja) * | 1981-05-06 | 1984-01-31 | 日本電信電話株式会社 | 音声符号化方式 |
JPS6011360B2 (ja) * | 1981-12-15 | 1985-03-25 | ケイディディ株式会社 | 音声符号化方式 |
US4498173A (en) * | 1982-06-17 | 1985-02-05 | At&T Bell Laboratories | Technique for digital split-channel transmission using interpolative coders and decoders |
DE3235804A1 (de) * | 1982-09-28 | 1984-03-29 | Robert Bosch Gmbh, 7000 Stuttgart | Verfahren und schaltungsanordnung zur bandbreitenreduzierten sprachuebertragung |
DE3276651D1 (en) * | 1982-11-26 | 1987-07-30 | Ibm | Speech signal coding method and apparatus |
JPS60116000A (ja) * | 1983-11-28 | 1985-06-22 | ケイディディ株式会社 | 音声符号化装置 |
US4622680A (en) * | 1984-10-17 | 1986-11-11 | General Electric Company | Hybrid subband coder/decoder method and apparatus |
-
1986
- 1986-04-04 JP JP61076788A patent/JPS62234435A/ja not_active Withdrawn
-
1987
- 1987-03-27 US US07/031,393 patent/US4757517A/en not_active Expired - Lifetime
- 1987-03-31 DE DE19873710664 patent/DE3710664A1/de active Granted
- 1987-04-01 GB GB8707741A patent/GB2188820B/en not_active Expired
- 1987-04-02 FR FR8704637A patent/FR2596936B1/fr not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4203436A1 (de) * | 1991-02-06 | 1992-08-13 | Koenig Florian | Datenreduzierte sprachkommunikation |
Also Published As
Publication number | Publication date |
---|---|
GB2188820A (en) | 1987-10-07 |
GB8707741D0 (en) | 1987-05-07 |
GB2188820B (en) | 1989-11-29 |
DE3710664A1 (de) | 1987-10-15 |
JPS62234435A (ja) | 1987-10-14 |
US4757517A (en) | 1988-07-12 |
FR2596936A1 (fr) | 1987-10-09 |
FR2596936B1 (fr) | 1993-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3710664C2 (de) | ||
EP1979901B1 (de) | Verfahren und anordnungen zur audiosignalkodierung | |
DE2818052C2 (de) | Quantisierung eines Signals mit einem sich über ein gegebenes Frequenzband erstreckendem Spetkrum | |
DE69721349T2 (de) | Sprachkodierung | |
DE69219718T2 (de) | Digitales Datenkodierungs-und Dekodierungsgerät mit hoher Wirksamkeit | |
DE69121606T2 (de) | Gerät zur Kodierung digitaler Signale | |
DE69116476T2 (de) | Digitaler Signalverschlüssler | |
DE60310716T2 (de) | System für die audiokodierung mit füllung von spektralen lücken | |
DE69122648T2 (de) | Digitale Teilbandkodierungsvorrichtung | |
DE69029232T2 (de) | System und Methode zur Sprachkodierung | |
EP0290581A1 (de) | Verfahren zum übertragen digitalisierter tonsignale. | |
DE69017074T2 (de) | Verfahren und Einrichtung zur Codierung von Audio-Signalen. | |
DE3115859A1 (de) | Codierverfahren und -vorrichtung fuer adpcm | |
EP0414838A1 (de) | Verfahren zur übertragung eines signals. | |
DE69820362T2 (de) | Nichtlinearer Filter zur Geräuschunterdrückung in linearen Prädiktions-Sprachkodierungs-Vorrichtungen | |
EP1953739A2 (de) | Verfahren und Vorrichtung zur Geräuschunterdrückung | |
DE68913691T2 (de) | System zur Sprachcodierung und -decodierung. | |
EP1023777B1 (de) | Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms | |
EP1979899A1 (de) | Verfahren und anordnungen zur audiosignalkodierung | |
EP0494918B1 (de) | Verfahren zur übertragung eines signals | |
DE3884839T2 (de) | Codierung von akustischen Wellenformen. | |
DE69028434T2 (de) | System zur Codierung von Breitbandaudiosignalen | |
EP0464534B1 (de) | Transformationskodierer mit adaptiver Fensterfunktion | |
DE60016305T2 (de) | Verfahren zum Betrieb eines Sprachkodierers | |
DE4211945C1 (de) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |