DE1114851B - Einrichtung zur UEbertragung von Sprache unter Frequenzbandpressung nach Art eines Vocoders - Google Patents
Einrichtung zur UEbertragung von Sprache unter Frequenzbandpressung nach Art eines VocodersInfo
- Publication number
- DE1114851B DE1114851B DEW26608A DEW0026608A DE1114851B DE 1114851 B DE1114851 B DE 1114851B DE W26608 A DEW26608 A DE W26608A DE W0026608 A DEW0026608 A DE W0026608A DE 1114851 B DE1114851 B DE 1114851B
- Authority
- DE
- Germany
- Prior art keywords
- signal
- speech
- frequency
- spectrum
- low frequencies
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Amplitude Modulation (AREA)
Description
DEUTSCHES
PATENTAMT
kl. 21 a2 36/22
INTERNATIONALE KL.
H 04j; m
W26608Vma/21a2
BEKANNTMACHUNG
DER ANMELDUNG
UND AUSGABE DER
AUSLEGESCHRIFT: 12. OKTOBER 1961
DER ANMELDUNG
UND AUSGABE DER
AUSLEGESCHRIFT: 12. OKTOBER 1961
Die Erfindung betrifft eine Einrichtung zur Übertragung von Sprache über Übertragungsmittel begrenzter
Frequenzbandbreite nach Art eines Vocoders. Die Erfindung bezweckt, die für eine solche Übertragung
benötigte Kanalbandbreite zu verringern und den Analyse-Teil und den Synthese-Teil eines
Vocoders zu vereinfachen und zu verbessern. Ferner soll die Natürlichkeit und die Wiedergabetreue, mit
der Sprache künstlich wiederhergestellt werden kann, verbessert werden.
Es sind bereits verschiedene Einrichtungen zur Herabsetzung der für die Übertragung von Sprache
benötigten Frequenzbandbreite bekannt, in denen die Sprechströme auf verschiedene Weise modifiziert
werden. Unter anderem ist ein Kanal-Vocoder bekannt, bei dem ein Eingangssprachsignal auf eine
Anzahl parallel geschalteter verschiedener Filter gegeben wird, um die Grundfrequenz oder Sprachgrundschwingung
und die Amplitudenverteilung in einer Anzahl von Frequenzteilbändern, in welche der
Sprachfrequenzbereich aufgeteilt wird, zu bestimmen. Das Ergebnis dieser Analyse wird in eine Anzahl
Steuerströme umgesetzt, die jeweils den Energieinhalt eines Teilbandes repräsentieren. Außerdem repräsentiert
eines dieser Steuersignale den Grundton der Stimme. Die Steuerströme werden an einen Empfänger
übertragen und dazu benutzt, mit Hilfe dort vorhandener Signalquellen in einem Sprachsynthese-Teil
eine künstliche Sprache aufzubauen, die den charakteristischen Grundton und die Amplituden-Frequenz-Verteilung
der ursprünglichen Sprache aufweist. Der Synthese-Teil im Empfänger enthält eine
»Summ«-Quelle und eine »Zisch«-Quelle, um eine Quelle für stimmhafte bzw. stimmlose Laute zu erhalten.
Die ankommenden Steuersignale, die auf der Sendeseite vom Grundton abgeleitet wurden, schalten
die beiden Quellen je nach den Erfordernissen abwechselnd ein und steuern auch die Frequenz der
Summ-Quelle, d. h. stimmen diese ab. Die Spannung der jeweils eingeschalteten Quelle wird an ein Synthese-Netzwerk
angelegt, das wiederum kontinuierlich durch die anderen Steuersignale eingestellt wird.
Obgleich der Kanal-Vocoder eine bedeutende Pressung der Frequenzbandbreite des Sprachsignals
ermöglicht und eine im ganzen verständliche Sprache erzeugt, hat die Vocodersprache keinen natürlichen
Klang in der Hinsicht, daß individuelle Spracheigenschaften, durch die man einen bestimmten Sprecher
erkennt, im Vocoder verlorengehen. Es wurde gefunden, daß die Erzeugung einer natürlich klingenden
Vocodersprache durch die Schwierigkeit, zwei wichtige Sprachparameter genau zu bestimmen, beEinrichtung
zur Übertragung von Sprache unter Frequenzbandpressung nach Art
eines Vocoders
Anmelder:
Western Electric Company, Incorporated, New York, N. Y. (V. St. A.)
Vertreter: Dipl.-Ing. H. Fecht, Patentanwalt, Wiesbaden, Hohenlohestr. 21
Beanspruchte Priorität: V. St. v. Amerika vom 17. November 1958 (Nr. 774 173)
Manfred Robert Schroeder, Murray Hill, N. J.
(V. St. A.),
ist als Erfinder genannt worden
ist als Erfinder genannt worden
hindert wird: Nämlich durch die Feststellung, ob in einem bestimmten Augenblick ein Sprachsignal einen
stimmhaften, periodischen Laut oder einen stimmlosen, aperiodischen Laut darstellt, und, wenn ein
Klang stimmhaft ist, durch die Bestimmung der Frequenz des Grundtons oder des Reziprokwerts, d.h.
der Periode des Grundtons. Eine genaue Bestimmung der Frequenz oder Periode des Grundtons ist besonders
schwierig, weil aufeinanderfolgende Abschnitte einzelner stimmhafter Laute kleine Unregelmäßigkeiten
enthalten, die für die individuelle Stimme eines bestimmten Sprechers wichtig sind, und weil
die Frequenz des Grundtons sich während des Überganges von einem Klang zum anderen plötzlich
ändert. Trotz mancher früherer Fortschritte ist kein Auswertgerät bekannt, das einen Kanal-Vocoder mit
ausreichend genauen Informationen hinsichtlich der Bestimmung der Parameter für stimmhafte und
stimmlose Laute und für den Grundton versorgt, um einen natürlichen Klang der Vocodersprache zu erreichen.
Es sind daher verschiedene Systeme geschaffen worden, bei denen Informationen hinsichtlich
stimmhaft-stimmlos und des Grundtons ohne Messung dieser Parameter erhalten werden, wodurch
die Fehler, die für den unnatürlichen Klang der Vocodersprache verantwortlich sind, vermindert
werden.
109 708/260
Eines dieser Systeme zur Verbesserung der Natürlichkeit der Vocodersprache ist in der deutschen
Patentschrift 722 607 beschrieben. Bei diesem System wird das Sprachsignal sendeseitig verzerrt und von dem
verzerrten Signal ein schmales Band tieffrequenter Anteile abgeleitet, das während stimmhafter Abschnitte
des Sprachsignals einen Differenzfrequenzanteil enthält, der die Frequenz des Grundtons darstellt,
und während stimmloser Abschnitte des Sprachsignals irreguläre Frequenzanteile mit rauschähnlichem
Charakter enthält. Gleichzeitig wird bei diesem System die Bandbreite des Sprachsignals nach
der typischen Art und Weise eines Kanal-Vocoders reduziert, indem eine Gruppe frequenzkomprimierter
Steuersignale, die den Energieeinhalt der verschiedenen Frequenzteilbänder des Sprachsignals repräsentieren,
abgeleitet wird. Das Band der tieffrequenten Anteile und die Gruppe komprimierter
Steuersignale werden an eine Empfangsstation übertragen, wo an Stelle getrennter Summ- und Zischquellen
ein einziger Frequenzvervielfacherkreis ein einziges Erregungssignal aus dem schmalen Band
der tieffrequenten Anteile ableitet und die Steuersignale das Erregungssignal modulieren, um sowohl
die stimmhaften als auch die stimmlosen Anteile des künstlichen Sprachsignals zu gewinnen.
Trotz der Ausschaltung der Messung der Parameter für stimmhaft-stimmlos und den Grundton sowohl
in der Sende- als auch in der Empfangsstation löst dieses System das Problem der Natürlichkeit
nicht ausreichend, weil die Differenzfrequenzkomponente, die in dem schmalen Band der tieffrequenten
Anteile enthalten ist, den Grundton-Parameter nicht mit genügender Genauigkeit wiedergibt. Während
stetiger Klänge zeigt die Differenzfrequenzkomponente, die durch den genannten, nichtlinearen Verzerrungsvorgang
erzeugt wird, den Grundton genau an, aber im Verlaufe des Überganges von Klang zu
Klang enthalten die Frequenzanteile, die durch den nichtlinearen Verzerrungsvorgang erzeugt werden, unzulässige
Veränderungen, die die Genauigkeit der Differenzfrequenzkomponente als Anzeige für den
Grundtonparameter der entsprechenden Sprachklänge schwerwiegend beeinträchtigen. Das trägt dazu bei,
die kleinen Unregelmäßigkeiten bei aufeinanderfolgenden Perioden einzelner stimmhafter Laute, die
für die Natürlichkeit sehr wichtig sind, vollständig zu überdecken. Als Schlußfolgerung ergibt sich, daß das
Erregungssignal, das entsprechend der zitierten deutschen Patentschrift aus dem schmalen Band der
tieffrequenten Anteile gewonnen wird, nicht genau die Eigentümlichkeiten des ursprünglichen Sprachsignals
beinhaltet und daher die künstliche Sprache, die aus dem Erregungssignal gewonnen wird, einen
unnatürlichen Klang hat.
Ein anderes System zur Verbesserung der Natürlichkeit der Vocodersprache ist in der USA.-Patentschrift
2 817711 beschrieben. Nach diesem System wird ein verhältnismäßig breites Band der tieffrequenten
Anteile des ursprünglichen Sprachsignals direkt So und unverändert an die Empfangsstation übertragen,
während die verbleibenden höherfrequenten Anteile des Sprachsignals in herkömmlicher Vocoderart als
eine Gruppe frequenzkomprimierter Steuersignale übertragen werden. In der Empfangsstation sieht das
System eine Zischzelle vor, die entweder selektiv oder kontinuierlich ein Erregungssignal zur Wiederherstellung
der höherfrequenten Anteile abgibt. Die direkt übertragenen niederfrequenten Anteile des ursprünglichen
Signals werden nur dazu benutzt, mit den wiederhergestellten höherfrequenten Anteilen zusammengesetzt
zu werden, um die künstliche Sprache zu gewinnen. Obwohl bei diesem System die Natürlichkeit
verbessert wird, indem die Grundtoninformation ohne Verzerrung in Form eines Teiles des ursprünglichen
Sprachsignals übertragen wird, ist diese Lösung des Problems der Verbesserung der Natürlichkeit
unvollständig, weil weder bei selektiver noch bei kontinuierlicher Arbeitsweise der Zischquelle die
Grundtoninfonnation in den tieffrequenten Anteilen enthalten ist. Weiterhin wird bei der kontinuierlichen
Anschaltung der Zischquelle sowohl die Verständlichkeit als auch die Natürlichkeit der wichtigen
stimmhaften Laute durch ein hörbares Hintergrundzischen beeinträchtigt.
Es ist eine besonderer Vorzug der Erfindung, daß ein bisher unerreichter Grad von Natürlichkeit bei
der Vocodersprache erreicht wird. Das Wesentliche der Erfindung ist, einen ausgewählten tieffrequenten
Anteil des ursprünglichen Signals, das Grundband, das direkt ohne Verzerrung an die Empfangsstation
übertragen wird, für zwei Zwecke auszunutzen: Einmal, um unter Spreizung auf das ursprüngliche
Spektrum der höherfrequenten Anteile ein kontinuierliches Erregungssignal für die Wiederherstellung
der höherfrequenten Anteile des künstlichen Sprachsignals bereitzustellen, wobei die höherfrequenten Anteile
der ursprünglichen Sprache in typischer Vocoderform als Gruppe frequenz komprimierter Steuersignale
übertragen werden; zum anderen, um kombiniert mit den wiederhergestellten höherfrequenten
Anteilen die tieffrequenten Teile des künstlichen Sprachsignals zu ergeben. Durch diese neue Einrichtung
werden die genauen Eigentümlichkeiten des ursprünglichen Sprachsignals, insbesondere die kleinen
Unregelmäßigkeiten bei aufeinanderfolgenden stimmhaften Lauten und der plötzliche Übergang von Laut
zu Laut, erhalten, und zwar ohne Fehler sowohl bei den höherfrequenten als auch bei den tieffrequenten
Anteilen des Sprachsignals. Dadurch ergibt sich ein außerordentlicher Grad von Natürlichkeit.
Im Unterschied zu dem System nach der genannten deutschen Patentschrift, bei dem sowohl die Anzeige
des Stimmhaft-Stimmlos- als auch des Grundton-Parameters von dem verzerrten, ursprünglichen Sprachsignals
abgeleitet wird, sieht die Erfindung eine fehlerfreie Quelle für die Information stimmhaft-stimmlos
und den Grundton vor, indem ein unverzerrter, unveränderter Teil des ursprünglichen Sprachsignals
selbst übertragen wird. Im Unterschied zu dem System nach der genannten USA.-Patentschrift, bei
dem die Grundtoninfonnation, die in dem unveränderten Teil des ursprünglichen Signals enthalten ist,
an die Empfängerstation übertragen, aber nicht ausgenutzt wird zur Wiederherstellung der höherfrequenten
Anteile, benutzt die Erfindung den direkt übertragenen Teil des ursprünglichen Signals, um sowohl
die Information für stimmhaft-stimmlos als auch den Grundton bei der Wiederherstellung der höherfrequenten
Anteile zu liefern. Dadurch wird eine genaue Übereinstimmung der Struktur der wiederhergestellten
höherfrequenten Anteile und der Struktur des ursprünglichen Sprachsignals erreicht.
Ein spezielles Merkmal der Erfindung ist ein neues, nichtlineares Verzerrungsnetzwerk, das aus dem direkt
übertragenen tieffrequenten Teil des Ursprung-
5 6
lichen Signals ein breitbandiges Erregungssignal, das Frequenzbänder ausgelegt sind. Im allgemeinen ist
aus Frequenzanteilen mit verhältnismäßig gleichförmi- eine Unterteilung in Form einer geometrischen Reihe
gen Amplituden zusammengesetzt ist, herstellt. Wäh- zu bevorzugen, bei der das Verhältnis der Bandbreite
rend stimmhafter, periodischer Abschnitte des ur- zur Mittelfrequenz stets konstant bleibt,
sprünglichen Signals ist das Erregungssignal peri- 5 Die Kompression des Sprachfrequenzteilbandes
odisch mit der gleichen Periode wie der entsprechende zwischen 3000 und 10 000 Hertz auf wenige hundert
stimmhafte Laut, und während stimmloser, aperi- Hertz mittels der Vocodertechnik ist deshalb möglich,
odischer Abschnitte des ursprünglichen Signals ist das weil das Hörorgan oberhalb etwa 3000 Hertz eine
Erregungssignal aperiodisch mit demselben Grad geringe Informationsrate aufweist. Dementsprechend
von Aperiodizität wie der entsprechende stimmlose io werden meist Steuersignale mit einer Bandbreite von
Laut. Die außergewöhnliche Natürlichkeit der künst- 15 bis 25 Hertz benutzt, um die Energieverteilung in
liehen Sprache, die mit der Einrichtung nach der Er- den höherfrequenten Teilbändern anzugeben. Bei der
findung erzeugt wird, ist größtenteils der genauen Einrichtung nach der Erfindung werden jedoch diesen
Übereinstimmung zwischen der Periodizität und Steuersignalen in an sich bekannter Weise Bänder
Aperiodizität des Erregungssignals und der Periodizi- 15 von 30 bis 50 Hertz Bandbreite zugeteilt. Diese Er-
tät bzw. Aperiodizität des ursprünglichen Sprach- höhung der Bandbreite der Steuersignale ergibt eine
signals zuzuschreiben. Verbesserung der Wiedergabe, die den Nachteil der
Die Erfindung soll an Hand eines in der Zeichnung vergrößerten Bandbreite bei weitem überwiegt, da
dargestellten Ausführungsbeispiels näher erläutert diese Bandbreitenerhöhung die Wiedergabe von kurwerden;
in der Zeichnung zeigt 20 zem Anhallen, wie sie in den Knacklauten »t« und
Fig. 1 ein schematisches Blockschaltbild einer »p« und in dem Hochlaut »ch« auftreten, erheblich
Sprachübertragungsanlage, verbessert. Die breiteren Steuerbänder verringern
Fig. 2 die Frequenzverteilung der Teilbänder für auch die Laufzeitverzögerung im Vocoder auf weniger
kodierte und unkodierte Signale, als 10 Millisekunden. Eine Phasenverzerrung dieser
Fig. 3 ein Blockschaltbild mit näheren Einzelheiten 25 Größe zwischen dem kodierten und dem unkodierten
eines Erregungsgenerators, Band ist unhörbar, und deshalb braucht keine Phasen-
Fig. 4 eine Darstellung von Frequenzspektren, entzerrung vorgesehen zu werden.
Fig. 5 die Übertragungskennlinie einer nichtlinearen Die drei oder mehr auf diese Weise abgeleiteten
Verzerrungsschaltung für den Erregungsgenerator Steuersignale werden gemeinsam mit dem durch das
nach Fig. 3, 30 Filter 10 durchgelassene Signal des unteren Teil-
Fig. 6 eine besonders vorteilhafte Kennlinie einer bandes mittels üblicher Überlagerungstechnik syste-
Verzerrungsschaltung, matisch nebeneinander auf der Frequenzskala ange-
Fig. 7 ein Schaltbild einer Verzerrungsschaltung ordnet, und zwar mittels der Modulatoren 20, 21, 22
mit der Kennlinie nach Fig. 6 und und 23 und der dazugehörigen Oszillatoren 24, 25
Fig. 8 ein Schaltbild, teilweise in Blockdarstellung, 35 26 und 27. Die Modulatoren können gleichartig und
eines erfindungsgemäßen Sprachsynthese-Teils. wie alle anderen Bauelemente im Analyse-Teil in bein
Fig. 1 ist ein Analyse-Teil auf der Sendeseite kannter Weise aufgebaut sein. Die Frequenzen der
und ein Synthese-Teil auf der Empfangsseite gezeigt, Oszillatoren werden so eingestellt, daß die einzelnen
die durch einen Übertragungskanal C miteinander ver- Signale an die gewünschte Stelle im Frequenzspekbunden
sind. Im Analyse-Teil wird ein Sprechstrom, 40 trum verlagert werden.
der z. B. aus einem Mikrophon T kommt, an eine Vorzugsweise werden das im unteren Teil des
Anzahl parallel liegender Bandpässe 10, 11, 12 und Sprachfrequenzbereichs liegende unkodierte Sprach-13
gelegt. Die verschiedenen Bandpaßfilter lassen be- signal und die drei schmalbandigen Steuersignale in
nachbarte Frequenzbänder durch, die insgesamt ein der in Fig. 2 gezeigten Weise auf der Frequenzskala
Band von etwa 80 bis 9000 Hertz umfasen. Der 45 nebeneinander angeordnet. Das Sprachband von 80
Bandpaß 10, der in der ersten der parallelen Strom- bis 2400 Hertz wird um 370 Hertz nach oben verpfade
eingeschaltet ist und zum Durchlaß des Fre- schoben, so daß es das Band zwischen 450 und
quenzbandes von 80 bis 2400 Hertz ausgelegt ist, 2770 Hertz einnimmt. In gleicher Weise werden die
überträgt den unteren Teil des Sprachfrequenzbereichs Steuersignale für die Sprachsignalkomponenten in den
direkt und ohne weitere Modifizierung, d. h. unko- 50 Bändern 2,4 bis 3,7 Kilohertz, 3,7 bis 5,7 Kilohertz
diert, an einen Modulator 20. Die Bandpässe It, 12 und 5,7 bis 9 Kilohertz nach unten verlagert, so daß
und 13, die in den anderen parallelen Strompfader* sie den Teil des Spektrums zwischen 300 und
liegen und z. B. für die Bänder von 2400 bis 450 Hertz einnehmen. Durch die Transponierung der
3700 Hertz, 3700 bis 5700 Hertz und 5700 bis Signale auf diese Weise werden die Signale am un-9000
Hertz ausgelegt sind, geben den Energieinhalt in 55 teren und am oberen Ende des Eingangssignaldiesen
höherfrequenten Bändern an signalverarbei- bereiches inmitten des übertragenen Bereiches angetende
kodierende Vorrichtungen, die in den ent- ordnet, so daß Rauschstörungen u. dgl., die während
sprechenden Kanälen liegen. Der Ausgang jedes der der Übertragung auf das Signal einwirken, diese Si-Bandfilter
11, 12 und 13 liegt an einem Doppelweg- gnale nicht in schwerwiegender Weise beeinflussen,
gleichrichter 14, 15 bzw. 16, dem ein Tiefpaß 17, 60 Ein Verlust am unteren Ende des Übertragungs-18
bzw. 19 nachgeschaltet ist, dessen Ausgangssignal bandes ergibt also nur eine leichte Verengung des
ein sich langsam änderndes Steuersignal ist, dessen Frequenzbereiches an der oberen Grenze.
Augenblicksamplitude der Augenblicksamplitude des Obwohl eine Frequenzverlagerung der in Fig. 2 zugeordneten Teilfrequenzbands entspricht. Ge- dargestellten Art wesentliche Übertragungsvorteile wünschtenfalls können in nicht dargestellter Weise 65 bietet, ist es natürlich möglich, beliebige andere bezusätzliche Unterbänder vorgesehen werden, indem kannte Signalübertragungsverfahren zu benutzen, zusätzliche Parallelstrompfade vorgesehen werden, die Zum Beispiel kann Einseitenband-Frequenzmoduladen dargestellten ähnlich und für die gewünschten tion, Einseitenband-Amplitudenmodulation oder Zwei-
Augenblicksamplitude der Augenblicksamplitude des Obwohl eine Frequenzverlagerung der in Fig. 2 zugeordneten Teilfrequenzbands entspricht. Ge- dargestellten Art wesentliche Übertragungsvorteile wünschtenfalls können in nicht dargestellter Weise 65 bietet, ist es natürlich möglich, beliebige andere bezusätzliche Unterbänder vorgesehen werden, indem kannte Signalübertragungsverfahren zu benutzen, zusätzliche Parallelstrompfade vorgesehen werden, die Zum Beispiel kann Einseitenband-Frequenzmoduladen dargestellten ähnlich und für die gewünschten tion, Einseitenband-Amplitudenmodulation oder Zwei-
seitenband-Amplitudenmodulation zur Multiplexübertragung
der einzelnen Signalkomponenten benutzt werden. Gewünschtenfalls können natürlich auch getrennte
Kanäle vorgesehen werden. Bei all diesen Verfahren ist ein Gesamtdurchlaßband von etwa
2500 Hertz ausreichend, um die gesamte Information des Eingangssignals zu übertragen. Die tatsächliche
Kompression der höheren Frequenzen in dem Beispiel nach Fig. 2 ist von etwa 6600 (9000 —
2400 Hertz) auf 150 Hertz oder von 44 auf 1. Die Gesamtkompression für das gesamte Übertragungsband beträgt 8920 auf 2470 Hertz oder 3,6 auf 1.
Vom Analyse-Teil in Fig. 1 können die in der beschriebenen Weise umgeformten Sprachsignale nun
über einen Kanal C zur Empfangsseite übertragen werden, wo sie zur Steuerung einer künstlichen
Sprachsynthesevorrichtung benutzt werden können.
Im Synthese-Teil wird das vom Kanal C kommende Signal zunächst in die entsprechenden Komponenten
aufgeteilt, die im Analyse-Teil abgeleitet wurden, und diese Komponenten dann in ihre ursprüngliche Frequenzlage
zurücktransportiert. Das unkodierte untere Band wird mittels des Modulators 30 und des Oszillators
34 also auf der Frequenzskala wieder nach unten in seinen ursprünglichen Bereich von 80 bis
2400 Hertz verlagert. Die Ausgangsspannung des Modulators 30 wird unmittelbar ohne weitere Modifizierung
an einen Addierer 38 gegeben. Sie wird außerdem als Eingangssignal an einen Erregungsgenerator 45 gegeben, in welchem ein Signal erzeugt
wird, das in der Wirkungsweise sowohl dem Zischais auch dem Summsignal im üblichen Vocoder entspricht.
Die verschiedenen vom Analyse-Teil empfangenen Steuersignale werden auf der Frequenzskala nach
unten in ihre ursprüngliche Lage verschoben, und zwar mittels der Modulatoren 31, 32 und 33 und der
Oszillatoren 35, 36 und 37. Die Ausgangsspannungen dieser Modulatoren werden gemeinsam mit den vom
Generator 45 gelieferten Erregungssignalen an die Gattermodulatoren 39, 40 bzw. 41 gegeben. In diesen
Modulatoren dienen die Steuersignale dazu, die Amplitude der angelegten Erregungssignale einzustellen.
Die Ausgangsspannungen dieser Gatter werden durch Bandpässe 42, 43 und 44 geleitet, die denen im
Analyse-Teil gleichen, und dann additiv zusammengefaßt, so daß ein zusammengesetztes Ausgangssignal
im Frequenzband von 2400 bis 9000 Hertz entsteht. Dieses Signal ist dem auf der Sendeseite an die Bandpässe
11, 12 und 13 angelegten höherfrequenten Signal sehr ähnlich. Es wird dann dem Signal des unteren
Bandes im Frequenzbereich von 80 bis 2400 Hertz im Addierer 38 zugemischt, so daß eine
Nachbildung des Sprechstroms des Mikrophons T erhalten wird. Dieses Signal wird an ein geeignetes
Wiedergabegerät R gegeben.
Der Grad der Natürlichkeit und Wirklichkeitsnähe, der mit künstlicher Sprache erreicht werden kann,
hängt zum großen Teil von der Natur des bei der Synthese benutzten Erregungssignals ab. Im Idealfall
benötigt eine Sprachsynthesevorrichtung ein Erregungssignal, das durch ein glattes Spektrum mit
konstanter Leistungsdichte gekennzeichnet ist und die jeweils richtige Art hat, d. h. wahlweise diskret oder
kontinuierlich ist. In üblichen Vocodern der obengenannten Art werden zwei getrennte Erregungssignale benutzt; eines, das Summsignal, hat periodischen
Aufbau, und das andere, das Zischsignal, ist aperiodisch. Ein Hilfssteuersignal dient dazu, zwischen
der Summspannung und der Zischspannung zu wählen, und ein Grundtonsignal stellt die Grundfrequenz
des Summsignals ein. Ein Entscheidungselement, das notwendigerweise Fehlern ausgesetzt ist,
ist zu dieser Wahl erforderlich. Die Aufgabe, diese Signale empfangsseitig herzustellen, ist bei der Erfindung
dadurch vermieden, daß ein einziges Erregungssignal benutzt wird, das allgemeiner der Idealform
ίο eines Erregungssignals entspricht als eine vollständig
statistische Rauschquelle, sei es Zischen oder Summen. Ein solches Erregungssignal, das mit den vom
Mikrophon T gelieferten Sprechströmen eng korreliert ist, gibt an die wiederhergestellte Sprache viel von der
Klangfarbe des Sprechers weiter, wodurch die künstliche Sprache sehr gut wieder erkennbar ist. Ein
wesentlicher Teil der Unnatürlichkeit der Vocodersprache wird so ausgeschaltet. Da in der Empfangsschaltung
keine Entscheidung irgendwelcher Art getroffen zu werden braucht, sind auch die Fehlermöglichkeiten
herabgesetzt, und damit wird sowohl die Genauigkeit in der Synthesevorrichtung verbessert als
auch ihr Aufbau vereinfacht.
Das zur Wiederherstellung der Sprache benutzte Stimmerregungssignal wird erfindungsgemäß von dem übertragenen Sprachsignal im unkodierten Band abgeleitet, d. h. in dem beschriebenen Beispiel werden die Spracherregungssignale von den unkodierten Signalen im Bereich zwischen etwa 80 und 2400 Hertz abgeleitet. Diese Signale stehen an der Ausgangsklemme des Modulators 30 zur Verfügung.
Das zur Wiederherstellung der Sprache benutzte Stimmerregungssignal wird erfindungsgemäß von dem übertragenen Sprachsignal im unkodierten Band abgeleitet, d. h. in dem beschriebenen Beispiel werden die Spracherregungssignale von den unkodierten Signalen im Bereich zwischen etwa 80 und 2400 Hertz abgeleitet. Diese Signale stehen an der Ausgangsklemme des Modulators 30 zur Verfügung.
Ehe der Aufbau eines geeigneten Erregungsgenerators näher betrachtet werden soll, erscheint es zweckmäßig,
den Aufbau der Spektra der verschiedenen im Empfänger verfügbaren Signale zu betrachten. Die
unkodierte Sprache im Frequenzband von 80 bis 2400 Hertz besitzt ein schmales Zeit-Leistungs-Spektrum,
das entweder kontinuierlich (stimmlos) oder quasidiskret (stimmhaft) ist, je nachdem, wie der
Sprecher es geformt hat, um die beabsichtigte Klangfarbe oder den phonetischen Wert auszudrücken. Auf
der anderen Seite sind die Spektra der Sprachlaute oberhalb 3000 Hertz, besonders die der Zischlaute,
Hauchlaute und Verschlußlaute, die die wichtigsten Laute mit Komponenten oberhalb 3000 Hertz sind,
sehr breit. Das Ohr ist für spektrale Veränderungen dieser Laute nicht sehr empfindlich. So ist es z. B.
bekannt, daß ein breites Resonanzband bei etwa 3000 Hertz, das durch Rauschen angeregt ist, einen
annehmbaren »sch«-Laut darstellt, obwohl das eine drastische Vereinfachung des vom Menschen erzeugten
Spektrums eines »sch« ist. Weiter hängt die subjektive Aufnahme eines »sch« innerhalb weiter Grenzen
nicht von der Breite dieses Resonanzspektrums ab. Das »sch« kann also durch einen einzelnen Parameter
ausreichend beschrieben werden. Das gleiche gilt für das »s«, das synthetisch durch ein Rauschband
um 7000 Hertz dargestellt werden kann. Andere Zischlaute erfordern ein etwas kompliziertes Synthesespektrum,
können jedoch in der Zusammensetzung ihrer Spektra ebenfalls erheblich abgewandelt
werden.
Erfindungsgemäß wird eine geeignete Kombination von nichtlinearen Verzerrungen und schneller, automatischer
Verstärkungssteuerung wirksam dazu ausgenutzt, um das Spektrum des geformten und im
Band begrenzten unkodierten Sprachsignals in ein im wesentlichen geradliniges Breitbandspektram konstan-
ter Leistungsdichte zu spreizen, das zur Synthese von
Sprache im Frequenzbereich von etwa 3000 bis 10 000 Hertz geeignet ist. Der Generator 45 transformiert
also unkodierte Grundbandsignale in ein Signal, das jederzeit die richtige Feinstruktur hat, d. h. kontinuierlich
für aperiodische Eingangssignale und quasidiskret für periodische Eingangssignale ist, und eine
ausreichend unveränderliche Umhüllende im Bereich der höheren Frequenzen hat, so daß eine befriedigende
Synthese durchgeführt werden kann. Da das Signal dank seiner Korrelation mit der ursprünglichen
Sprache automatisch jederzeit die richtige Form hat, kann es durchgehend an den Synthesemodulator angelegt
werden. Es werden deshalb keinerlei Entscheidungselemente benötigt.
Fig. 3 veranschaulicht in Blockdarstellung eine Anordnung, die zur Erzeugung des benötigten Erregungssignals geeignet ist. In der Darstellung umfaßt der
Erregungsgenerator 45 eine nichtlineare Verzerrungsschaltung 47, die mit dem unkodierten Grundband-
sprachsignal vom Modulator 30 beaufschlagt wird. Da Gattermodulatoren in dem Synthese-Teil benutzt
werden, werden Binärimpulse konstante Amplitude und veränderlicher Breite zu deren Betätigung benötigt.
Dementsprechend wird die Erregungsfunktion, die von der nichtlinearen Verzerrungsschaltung 47 erzeugt
wird, mittels eines Konverters 48 in ein impulsbreitenmoduliertes Signal umgewandelt. Für den
Impulsbreitenkonverter ist eine periodische Sägezahnspannung erforderlich, die z. B. im Generator 49
erzeugt werden kann. Eine Sägezahnfrequenz von 30 Kilohertz ist geeignet. Die umgeformten Verzerrungssignale
werden durchgehend an jeden der Gattermodulatoren 39, 40 und 41 angelegt, die denen im
Synthese-Teil nach Fig. 1 dargestellten entsprechen. Die Gatter werden also entsprechend der Dauer der
angelegten Erregungssignalimpulse geöffnet. Die Steuerimpulse von den Modulatoren 31, 32 und 33
werden an die Steuereingänge der Gatter 39, 40 und 41 angelegt, um die Amplituden der von den Gattern
durchgelassenen Erregungssignale einzustellen.
Vor einer ins einzelne gehenden Beschreibung der einzelnen Elemente des Erregungsgenerators 45 sollen
die Spektren in Fig. 4 betrachtet werden. Auf der obersten Zeile ist ein typisches Sprachspektrum im
Bereich bis über 10 Kilohertz dargestellt. Es ist zu erkennen, daß es sehr breit ist. Das Grundband dieses
Spektrums von etwa 80 Hertz bis 2,4 Kilohertz, in der zweiten Zeile dargestellt, bildet das Eingangssignal
des Erregungsgenerators 45. Die Ausgangs-Spannung des Erregungsgenerators ist in der dritten
Zeile veranschaulicht. Es ist ein im wesentlichen geradliniges Spektrum mit kontinuierlicher Leistungsdichte
und eignet sich zur Synthese einer großen Anzahl von Sprachlauten. Der Teil zwischen 3 und
10 Kilohertz wird vorzugsweise für die Sprachsynthese herangezogen.
Das zur Herstellung eines geradlinigen Spektrums der in Fig. 4, dritte Zeile, veranschaulichten Art benötigte
Netzwerk kann auf verschiedene Weise aufgebaut werden. Beispielsweise kann das unkodierte
Sprachsignal gleichgerichtet oder begrenzt werden, so daß ein breiteres Spektrum erhalten wird. Die im
Sinne der Erfindung wirksamste Verzerrungsvorrichtung erhöht jedoch in erster Linie die Anzahl der
Nullstellen pro Sekunde des an die Eingangsklemme angelegten Signals. Dementsprechend braucht die
Schaltung zur Erzeugung des Erregungssignals nur Mittel zu enthalten, durch die die mittlere Zahl der
Vorzeichenwechsel erhöht wird, wodurch das Spektrum sehr stark verbreitert wird. Diese Erhöhung
kann einfach durch Begrenzen verschiedener Ableitungen des Sprachsignals erfolgen, d. h. nachdem die
Sprache integriert, differenziert oder ähnlich umgeformt ist, und es können vier oder mehr von auf diese
Weise erhaltenen Rechteckwellen miteinander multipliziert werden. Im Prinzip kann diese Multiplikation
durch Triggern eines Flip-Flops mit Vorzeichenwechsel von allen Rechteckwellen durchgeführt werden.
Wegen der Erholungszeit im Flip-Flop können jedoch Vorzeichenwechsel gelegentlich übergangen
werden. Selbstverständlich muß die Multiplikation fehlerfrei und zeitunabhängig erfolgen.
Eine Ausführungsform eines derartigen Vorzeichenwechsel-Vervielfachers
umfaßt ein Netzwerk mit einer Eingangs-Ausgangs-Kennlinie aus geradlinigen Segmenten.
Eine solche Kennlinie ist in Fig. 5 dargestellt. Bei dieser Kennlinie ist eine Ausgangsspannung
von +1 vorhanden, wenn am Eingang die Spannung 0 oder +4 steht, und ein Ausgangssignal von
— 1 für Eingangssignale von ±2. Wenn also vier Rechteckwellen der Amplitude +1 addiert und dann
an den Eingang eines Netzwerks mit dieser Kennlinie gelegt werden, ergibt sich als Ausgangssignal das Produkt
dieser vier Rechteckwellen. Wenn eine Sinusspannung mit einer Amplitude größer als drei an das
Netzwerk angelegt wird, so werden vier Nulldurchgänge am Ausgang für jeden Nulldurchgang am Eingang
erhalten. Diese Art von Vorzeichenwechselvervielfacher kann zur Erzeugung einer großen Anzahl
von Nulldurchgängen benutzt werden, wodurch Verzerrungskomponenten bis zu 10 000 Hertz und
darüber gewonnen werden können. Diese Erhöhung wird erreicht, ohne daß immer wieder erneut begrenzt
werden muß. Darüber hinaus ist jeder Vervielfacher praktisch unabhängig von der speziellen Form des
Eingangssignals. Im allgemeinen braucht die Netzwerkkennlinie nicht linear zu sein. Eine befriedigende
Multiplikation wird so lange erhalten, wie eine ausreichende Anzahl von Steigungsumkehrungen enthalten
ist.
Eine Schaltung mit der Kennlinie nach Fig. 5 hat genau die gewünschten Eigenschaften; es ist eine
durchgehende Eingangs-Ausgangs-Kennlinie vorhanden, und durch den Einsatz einer ausreichenden Anzahl
von Steigungsumkehrungen kann das Spektrum praktisch beliebig gespreizt werden. Darüber hinaus
wird bei dieser nichtlinearen Schaltung eine gewisse Schwelle gewährleistet, oberhalb der die Ausgangsspannungsspitze
konstant ist. Während die Spitzenausgangsspannung der Schaltung konstant ist und das
gleiche auch für die effektive Ausgangsspannung gilt, hängt die spektrale Leistungsdichte jedoch etwas von
der Eingangsamplitude ab. Unter Umständen kann sie mit größer werdender Eingangsamplitude abfallen.
Für Zwecke der Sprachsynthese muß die Leistungsdichte jedoch konstant gehalten werden. Zu diesem
Zweck wird zusätzlich zu der Schaltung mit Zick-Zack-Kennlinie eine logarithmische Kompression eingesetzt.
Die Kennlinie einer geeigneten Verzerrungsschaltung ist in Fig. 6 dargestellt. Sie stellt nur ein
Beispiel dar, da die Schaltung wesentlich mehr Steigungsumkehrungen haben kann, als dargestellt ist.
Fig. 7 veranschaulicht eine Verzerrungsschaltung, die in einem begrenzten Eingangsspannungsbereich
die in Fig. 6 dargestellte Kennlinie aufweist. Sie be-
109 708/260
steht aus einem Diodennetzwerk, dem mittels eines Transformators 63 das vom Modulator 30 gelieferte
Sprachsignal des Grundbandes aufgedrückt wird. Die Dioden 71, 72, 73 und 74 ergeben zusammen die
W-förmige Kennlinie oder etwa zwei vollständige Sinuswellen (vgl. Fig. 6). Die Dioden 66, 67, 68 und
69 bewirken in Verbindung mit den Widerständen 64, 65 und 70 die gewünschte logarithmische Kompression
der Eingangsamplitude. Die beiden Verzerrungssignale, die durch diese Diodenanordnungen hervor-
gerufen werden, liegen an den Widerständen 75 bzw. 76 und werden zu einem zusammengesetzten Verzerrungssignal
vereinigt, das zur Sprachsynthese als Erregungssignal benutzt werden kann. Mittels eines
Kondensators 77 wird es an die Basis eines Transistor 78 zwecks Verstärkung auf einen brauchbaren
Pegel gekoppelt. Die Widerstände für die Einstellung des Arbeitspunktes des Transistors 78 sind mit 79,
80 und 81 bezeichnet. Das verstärkte Verzerrungssignal wird über einen Kondensator 82 zum Impuls-
breitenkonverter 48 übertragen.
In Fig. 8 ist der Synthese-Teil der Empfangsstation
im beschriebenen System schematisch dargestellt. Die Blockteile des Synthese-Teils nach Fig. 8, die den in
Fig. 1 gezeigten entsprechen, tragen das gleiche Bezugszeichen. Der Sägezahngenerator 49 ist mit einer
Doppelbasisdiode 83 mit Widerständen 84, 85 und 86 sowie i?C-Glied 87, 88 und 89 ausgestattet, die
ähnlich wie eine Gastriode arbeitet, und mit einem Transistor 91 in normaler Schaltung mit den Widerständen
90, 92 und 93. Die Ausgangsspannung des Oszillators, die durch das Potentiometer 86 in der
Frequenz und durch das Vorspannungspotentiometer 94 in der Amplitude eingestellt ist, wird an die Basis
des Transistors 95 mit dem Widerstand 96 gelegt, der einen Teil des Impulsbreitenkonverters 48 bildet. Dieser
Konverter umfaßt Transistor 95 und Transistor 99 mit Widerstand 100, die durch eine i?C-Paraüelschaltung97,
98 gekoppelt sind. Die Zeitkonstante der Schaltung ist so eingestellt, daß ein binäres Ausgangssignal
erzeugt wird.
Die von der Verzerrungsschaltung 47, die die in Fig. 7 gezeigte Schaltung haben kann, abgeleiteten
Verzerrungssignale werden an die Basis des Transistors 99 gelegt. Der Transistor 99 ist zwischen Sperrbereich
und Sättigung so eingestellt, daß die an seinem Kollektor liegende Spannung eine 30-Kilohertz-Rechteckwelle
ist, von der eine Flanke durch die Ausgangsspannung der Verzerrungsschaltung 47 moduliert ist. Diese Spannung wird an die Basis jedes
der Transistoren 101, 102 und 103 angelegt, die die Gattermodulatoren 39, 40 und 41 in Fig. 1 darstellen.
Die betreffenden Gatter werden für jeweils solche Intervalle geöffnet, die der variablen Impulsbreite der
Rechteckwelle entsprechen, wobei während dieser Intervalle die angelegten Verzerrungssignale durchgelassen
werden. Die verschiedenen Steuersignale für die höheren Teilfrequenzbänder, die von den Modulatoren
31, 32 und 33 abgeleitet sind und den Energieinhalt der einzelnen Teilfrequenzbänder darstellen,
werden über die Widerstände 104, 105 bzw. 106 an die Kollektoren der einzelnen Transistorengatter gelegt
und modulieren die Amplitude der an die Basen dieser Transistoren angelegten Verzerrungssignale.
Die modulierten Ausgangssignale liegen über Kondensatoren 107, 108 bzw. 109 an den Potentiometern
110,111 und 112 und werden an deren Abgriffen auf den richtigen Kanalpegel eingestellt. Die eingepegelten
Signale laufen durch Bandpässe 42, 43 und 44 und werden dann additativ zusammengefaßt, so daß
ein zusammengesetztes Ausgangssignal entsteht, das die höherfrequenten Komponenten des an die Steuerkanäle
im Analyse-Teil angelegten Signals gut nachbildet. Es repräsentiert also das Sprachband von etwa
bis 9000 Hertz. In einem Addierer 38 wird es dem Grundbandsignal vom Modulator 30 zugemischt.
Das sich ergebende Ausgangssignal entspricht dem im Mikrophon T erzeugten Sprachsignal und wird an ein
Wiedergabegerät R angelegt.
Claims (7)
1. Einrichtung zur Übertragung von Sprache unter Frequenzbandpressung nach Art eines Vocoders,
bei der die tiefen Frequenzen der Sprachsignale unmittelbar und die höherfrequenten Anteile
des Sprachspektrums in Form mehrerer in der Frequenz komprimierter Steuersignale an die
Empfangsstation übertragen werden, dadurch ge kennzeichnet, daß in der Empfangsstation das
Spektrum der unmittelbar übertragenen tiefen Frequenzen auf das ursprüngliche Spektrum der
höherfrequenten Anteile gespreizt wird, wobei die Periodizität in jedem Augenblick der Periodizität
des ursprünglichen Sprachsignals genau entspricht, und daß das gespreizte Spektrum unter Steuerung
in den einzelnen höherfrequenten Teilfrequenzbereichen durch die Steuersignale einer Addiereinrichtung
zugeführt wird, der gleichzeitig die unmittelbar übertragenen tiefen Frequenzen zugeführt
werden und deren Ausgang mit einer Wiedergabevorrichtung verbunden ist.
2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß für das Spreizen des Spektrums
der tiefen Frequenzen eine nichtlineare Verzerrungsschaltung (47) vorgesehen ist (Fig. 3 und 7).
3. Einrichtung nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die Schaltung zum
Spreizen des Spektrums der tiefen Frequenzen eine beispielsweise zickzackförmige Eingangs-Ausgangs-Kennlinie
mit einer Anzahl von Steigungsumkehrungen aufweist (Fig. 5 und 6).
4. Einrichtung nach Anspruch 1, 2 oder 3, dadurch gekennzeichnet, daß die Schaltung zum
Spreizen des Spektrums der tiefen Frequenzen ein von diesen Frequenzen gespeistes Netzwerk aus
Dioden (71, 72, 73, 74), welches eine W-förmige, zwei vollständige Sinuswellen approximierende
Kennlinie aufweist und ein weiteres vorgeschaltetes Netzwerk mit Dioden (66, 67, 68 und 69),
welches eine logarithmische Kompressionskennlinie aufweist, enthält und daß Mittel, z.B. Widerstände
(75, 76), vorgesehen sind, um die Spannungen an den Ausgängen der beiden Diodennetzwerke
zu einem zusammengesetzten, verzerrten Breitbandsignal zu vereinigen (Fig. 7).
5. Einrichtung nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, daß die
Hüllkurve des gespreizten Spektrums der tiefen Frequenzen im wesentlichen unveränderlich und
die Feinstruktur mit den sendeseitigen Mikrophonspannungen korreliert ist (Fig. 4).
6. Einrichtung nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, daß
das gespreizte Spektrum der tiefen Frequenzen als Spracherrregungsspannung an den Eingangs-
Memmen einer Anzahl Gatter (39, 40 bzw. 41) zum selektiven Durchlaß von an den Eingangsklemmen stehenden Signalen an entsprechende
Ausgangsklemmen liegt, daß die Amplitude der von den einzelnen Gattern durchgelassenen Erregungssignale
durch die empfangenen Steuersignale moduliert wird und daß die von den Gattern durchgelassenen modulierten Signale mit
den tiefen Frequenzen des Sprachspektrums zwecks Wiederherstellung der Sprache vereinigt
■werden (Fig. 1).
7. Einrichtung nach Anspruch 6, dadurch gekennzeichnet, daß der nichtlinearen Verzerrungsschaltung (47) zur Erzeugung eines relativ breit-
bandigen Verzerrungssignals als Erregungssignal eine Quelle für periodische hochfrequente Wellen,
z. B. ein Sägezahngenerator (49), zugeordnet ist, deren Ausgangsspannung gemeinsam mit dem
Erregungssignal einer Schaltung zur Erzeugung einer Folge von Rechteckimpulsen, deren
Flanken durch ihre Lage die Momentamplituden des Verzerrungssignals angeben, z. B. einem
Impulsbreitenkonverter (48), zugeführt wird (Fig. 3).
In Betracht gezogene Druckschriften:
Deutsche Patentschrift Nr. 722 607;
USA.-Patentschrift Nr. 2 817 711.
Deutsche Patentschrift Nr. 722 607;
USA.-Patentschrift Nr. 2 817 711.
Hierzu 1 Blatt Zeichnungen
© 109 708/260 10.61
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US774173A US3030450A (en) | 1958-11-17 | 1958-11-17 | Band compression system |
Publications (1)
Publication Number | Publication Date |
---|---|
DE1114851B true DE1114851B (de) | 1961-10-12 |
Family
ID=25100462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DEW26608A Pending DE1114851B (de) | 1958-11-17 | 1959-10-26 | Einrichtung zur UEbertragung von Sprache unter Frequenzbandpressung nach Art eines Vocoders |
Country Status (6)
Country | Link |
---|---|
US (1) | US3030450A (de) |
BE (1) | BE584353A (de) |
DE (1) | DE1114851B (de) |
FR (1) | FR1239222A (de) |
GB (1) | GB937404A (de) |
NL (2) | NL127390C (de) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL272110A (nl) * | 1960-12-08 | 1964-08-25 | Jean Albert Dreyfus | Drukaandrijving |
NL272809A (de) * | 1960-12-27 | |||
US3167710A (en) * | 1961-02-01 | 1965-01-26 | Jersey Prod Res Co | System for analysis of electrical signals including parallel filter channels |
US3165734A (en) * | 1961-11-02 | 1965-01-12 | Grodzinsky Samuel | Screw noise simulation technique |
US3411089A (en) * | 1962-06-28 | 1968-11-12 | Raytheon Co | Communication system |
US3431356A (en) * | 1965-06-04 | 1969-03-04 | Integrated Electronic Corp | Apparatus and method for reconstructing speech |
US3420955A (en) * | 1965-11-19 | 1969-01-07 | Bell Telephone Labor Inc | Automatic peak selector |
US3431362A (en) * | 1966-04-22 | 1969-03-04 | Bell Telephone Labor Inc | Voice-excited,bandwidth reduction system employing pitch frequency pulses generated by unencoded baseband signal |
US3471644A (en) * | 1966-05-02 | 1969-10-07 | Massachusetts Inst Technology | Voice vocoding and transmitting system |
US3448216A (en) * | 1966-08-03 | 1969-06-03 | Bell Telephone Labor Inc | Vocoder system |
DE1537596B1 (de) * | 1967-11-14 | 1970-09-03 | Michel Copel | Verfahren und Schaltungsanordnung zum Verbessern der Verstaendlichkeit frequenzverzerrter Sprache |
US3541266A (en) * | 1968-09-30 | 1970-11-17 | Octronix Inc | Bandwidth compressor and expander |
US3622714A (en) * | 1969-09-02 | 1971-11-23 | Bell Telephone Labor Inc | Telephonic transmission using complementary comb filters |
US3743787A (en) * | 1969-09-02 | 1973-07-03 | H Fujisaki | Speech signal transmission systems utilizing a non-linear circuit in the base band channel |
US3875341A (en) * | 1972-02-24 | 1975-04-01 | Int Standard Electric Corp | System for transferring wideband sound signals |
US3914554A (en) * | 1973-05-18 | 1975-10-21 | Bell Telephone Labor Inc | Communication system employing spectrum folding |
US3946162A (en) * | 1973-06-04 | 1976-03-23 | International Standard Electric Corporation | System for transferring wideband sound signals |
FR2238412A5 (de) * | 1973-07-20 | 1975-02-14 | Trt Telecom Radio Electr | |
US3988546A (en) * | 1974-09-13 | 1976-10-26 | General Signal Corporation | System for audibly recognizing an aurally unclassifiable signal |
GB1559897A (en) * | 1977-03-15 | 1980-01-30 | Post Office | Multiplexing speech |
US4181822A (en) * | 1978-03-07 | 1980-01-01 | Bell & Howell Company | Bandsplitter systems |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE722607C (de) * | 1939-01-14 | 1942-07-22 | Karl Otto Schmidt Dr | Verfahren zur besseren Ausnutzung des UEbertragungsweges |
US2817711A (en) * | 1954-05-10 | 1957-12-24 | Bell Telephone Labor Inc | Band compression system |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2640880A (en) * | 1953-06-02 | Speech communication system | ||
US2151091A (en) * | 1935-10-30 | 1939-03-21 | Bell Telephone Labor Inc | Signal transmission |
-
0
- NL NL245178D patent/NL245178A/xx unknown
- NL NL127390D patent/NL127390C/xx active
-
1958
- 1958-11-17 US US774173A patent/US3030450A/en not_active Expired - Lifetime
-
1959
- 1959-10-26 DE DEW26608A patent/DE1114851B/de active Pending
- 1959-10-29 FR FR808833A patent/FR1239222A/fr not_active Expired
- 1959-11-05 BE BE584353A patent/BE584353A/fr unknown
- 1959-11-10 GB GB38054/59A patent/GB937404A/en not_active Expired
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE722607C (de) * | 1939-01-14 | 1942-07-22 | Karl Otto Schmidt Dr | Verfahren zur besseren Ausnutzung des UEbertragungsweges |
US2817711A (en) * | 1954-05-10 | 1957-12-24 | Bell Telephone Labor Inc | Band compression system |
Also Published As
Publication number | Publication date |
---|---|
BE584353A (fr) | 1960-03-01 |
GB937404A (en) | 1963-09-18 |
FR1239222A (fr) | 1960-08-19 |
US3030450A (en) | 1962-04-17 |
NL245178A (de) | |
NL127390C (de) |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE1114851B (de) | Einrichtung zur UEbertragung von Sprache unter Frequenzbandpressung nach Art eines Vocoders | |
DE69024017T2 (de) | Digitalsignalkodierungseinrichtung. | |
DE69401512T2 (de) | Hybride adaptive bitzuteilung für audiokoder und -dekoder | |
DE60310716T2 (de) | System für die audiokodierung mit füllung von spektralen lücken | |
DE69401514T2 (de) | Vom rechenaufwand her effiziente adaptive bitzuteilung für kodierverfahren und kodiereinrichtung | |
DE4316297C1 (de) | Frequenzanalyseverfahren | |
DE2818052C2 (de) | Quantisierung eines Signals mit einem sich über ein gegebenes Frequenzband erstreckendem Spetkrum | |
DE60103086T2 (de) | Verbesserung von quellcodierungssystemen durch adaptive transposition | |
AT398670B (de) | Verfahren zur verschiebung der frequenz von signalen | |
DE4120537A1 (de) | Niederfrequenzkompensationsschaltung fuer tonsignale | |
DE3315519A1 (de) | Analog/digitale signaluebertragung | |
EP0251028B1 (de) | Verfahren zur Übertragung eines Audiosignales | |
DE69533259T2 (de) | Nichtlineares quantisieren eines informationssignales | |
DE69317802T2 (de) | Verfahren und Vorrichtung für Tonverbesserung unter Verwendung von Hüllung von multibandpassfiltrierten Signalen in Kammfiltern | |
DE2609297C3 (de) | Übertragungssystem für Gesprächssignale | |
DE4001747A1 (de) | Anpassbares hochpassfilter mit steuerbarer abschneidefrequenz in abhaengigkeit vom eingangssignal und betriebsverfahren hierfuer | |
DE2701814A1 (de) | Bandkompressionssystem | |
DE1151285B (de) | Nachrichtenuebertragungssystem fuer Sprache mit Herabsetzung der Bandbreite | |
DE2826818A1 (de) | Verfahren und vorrichtung zum erzeugen eines kuenstlichen sprechsignals | |
DE1524876A1 (de) | Verfahren und Einrichtung zur Kompensierung von Verzerrungen von Signalen | |
DE722607C (de) | Verfahren zur besseren Ausnutzung des UEbertragungsweges | |
EP1130577B1 (de) | Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen | |
DE3115801C2 (de) | ||
DE2119000C3 (de) | Impulsdeltamodulator | |
DE3621513A1 (de) | Verfahren zur uebertragung eines audiosignales |