DE1114851B - Einrichtung zur UEbertragung von Sprache unter Frequenzbandpressung nach Art eines Vocoders - Google Patents

Einrichtung zur UEbertragung von Sprache unter Frequenzbandpressung nach Art eines Vocoders

Info

Publication number
DE1114851B
DE1114851B DEW26608A DEW0026608A DE1114851B DE 1114851 B DE1114851 B DE 1114851B DE W26608 A DEW26608 A DE W26608A DE W0026608 A DEW0026608 A DE W0026608A DE 1114851 B DE1114851 B DE 1114851B
Authority
DE
Germany
Prior art keywords
signal
speech
frequency
spectrum
low frequencies
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DEW26608A
Other languages
English (en)
Inventor
Manfred Robert Schroeder
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
Western Electric Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Western Electric Co Inc filed Critical Western Electric Co Inc
Publication of DE1114851B publication Critical patent/DE1114851B/de
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Amplitude Modulation (AREA)

Description

DEUTSCHES
PATENTAMT
kl. 21 a2 36/22
INTERNATIONALE KL.
H 04j; m
W26608Vma/21a2
ANMELDETAG: 26. OKTOBER 1959
BEKANNTMACHUNG
DER ANMELDUNG
UND AUSGABE DER
AUSLEGESCHRIFT: 12. OKTOBER 1961
Die Erfindung betrifft eine Einrichtung zur Übertragung von Sprache über Übertragungsmittel begrenzter Frequenzbandbreite nach Art eines Vocoders. Die Erfindung bezweckt, die für eine solche Übertragung benötigte Kanalbandbreite zu verringern und den Analyse-Teil und den Synthese-Teil eines Vocoders zu vereinfachen und zu verbessern. Ferner soll die Natürlichkeit und die Wiedergabetreue, mit der Sprache künstlich wiederhergestellt werden kann, verbessert werden.
Es sind bereits verschiedene Einrichtungen zur Herabsetzung der für die Übertragung von Sprache benötigten Frequenzbandbreite bekannt, in denen die Sprechströme auf verschiedene Weise modifiziert werden. Unter anderem ist ein Kanal-Vocoder bekannt, bei dem ein Eingangssprachsignal auf eine Anzahl parallel geschalteter verschiedener Filter gegeben wird, um die Grundfrequenz oder Sprachgrundschwingung und die Amplitudenverteilung in einer Anzahl von Frequenzteilbändern, in welche der Sprachfrequenzbereich aufgeteilt wird, zu bestimmen. Das Ergebnis dieser Analyse wird in eine Anzahl Steuerströme umgesetzt, die jeweils den Energieinhalt eines Teilbandes repräsentieren. Außerdem repräsentiert eines dieser Steuersignale den Grundton der Stimme. Die Steuerströme werden an einen Empfänger übertragen und dazu benutzt, mit Hilfe dort vorhandener Signalquellen in einem Sprachsynthese-Teil eine künstliche Sprache aufzubauen, die den charakteristischen Grundton und die Amplituden-Frequenz-Verteilung der ursprünglichen Sprache aufweist. Der Synthese-Teil im Empfänger enthält eine »Summ«-Quelle und eine »Zisch«-Quelle, um eine Quelle für stimmhafte bzw. stimmlose Laute zu erhalten. Die ankommenden Steuersignale, die auf der Sendeseite vom Grundton abgeleitet wurden, schalten die beiden Quellen je nach den Erfordernissen abwechselnd ein und steuern auch die Frequenz der Summ-Quelle, d. h. stimmen diese ab. Die Spannung der jeweils eingeschalteten Quelle wird an ein Synthese-Netzwerk angelegt, das wiederum kontinuierlich durch die anderen Steuersignale eingestellt wird.
Obgleich der Kanal-Vocoder eine bedeutende Pressung der Frequenzbandbreite des Sprachsignals ermöglicht und eine im ganzen verständliche Sprache erzeugt, hat die Vocodersprache keinen natürlichen Klang in der Hinsicht, daß individuelle Spracheigenschaften, durch die man einen bestimmten Sprecher erkennt, im Vocoder verlorengehen. Es wurde gefunden, daß die Erzeugung einer natürlich klingenden Vocodersprache durch die Schwierigkeit, zwei wichtige Sprachparameter genau zu bestimmen, beEinrichtung zur Übertragung von Sprache unter Frequenzbandpressung nach Art
eines Vocoders
Anmelder:
Western Electric Company, Incorporated, New York, N. Y. (V. St. A.)
Vertreter: Dipl.-Ing. H. Fecht, Patentanwalt, Wiesbaden, Hohenlohestr. 21
Beanspruchte Priorität: V. St. v. Amerika vom 17. November 1958 (Nr. 774 173)
Manfred Robert Schroeder, Murray Hill, N. J.
(V. St. A.),
ist als Erfinder genannt worden
hindert wird: Nämlich durch die Feststellung, ob in einem bestimmten Augenblick ein Sprachsignal einen stimmhaften, periodischen Laut oder einen stimmlosen, aperiodischen Laut darstellt, und, wenn ein Klang stimmhaft ist, durch die Bestimmung der Frequenz des Grundtons oder des Reziprokwerts, d.h. der Periode des Grundtons. Eine genaue Bestimmung der Frequenz oder Periode des Grundtons ist besonders schwierig, weil aufeinanderfolgende Abschnitte einzelner stimmhafter Laute kleine Unregelmäßigkeiten enthalten, die für die individuelle Stimme eines bestimmten Sprechers wichtig sind, und weil die Frequenz des Grundtons sich während des Überganges von einem Klang zum anderen plötzlich ändert. Trotz mancher früherer Fortschritte ist kein Auswertgerät bekannt, das einen Kanal-Vocoder mit ausreichend genauen Informationen hinsichtlich der Bestimmung der Parameter für stimmhafte und stimmlose Laute und für den Grundton versorgt, um einen natürlichen Klang der Vocodersprache zu erreichen. Es sind daher verschiedene Systeme geschaffen worden, bei denen Informationen hinsichtlich stimmhaft-stimmlos und des Grundtons ohne Messung dieser Parameter erhalten werden, wodurch die Fehler, die für den unnatürlichen Klang der Vocodersprache verantwortlich sind, vermindert werden.
109 708/260
Eines dieser Systeme zur Verbesserung der Natürlichkeit der Vocodersprache ist in der deutschen Patentschrift 722 607 beschrieben. Bei diesem System wird das Sprachsignal sendeseitig verzerrt und von dem verzerrten Signal ein schmales Band tieffrequenter Anteile abgeleitet, das während stimmhafter Abschnitte des Sprachsignals einen Differenzfrequenzanteil enthält, der die Frequenz des Grundtons darstellt, und während stimmloser Abschnitte des Sprachsignals irreguläre Frequenzanteile mit rauschähnlichem Charakter enthält. Gleichzeitig wird bei diesem System die Bandbreite des Sprachsignals nach der typischen Art und Weise eines Kanal-Vocoders reduziert, indem eine Gruppe frequenzkomprimierter Steuersignale, die den Energieeinhalt der verschiedenen Frequenzteilbänder des Sprachsignals repräsentieren, abgeleitet wird. Das Band der tieffrequenten Anteile und die Gruppe komprimierter Steuersignale werden an eine Empfangsstation übertragen, wo an Stelle getrennter Summ- und Zischquellen ein einziger Frequenzvervielfacherkreis ein einziges Erregungssignal aus dem schmalen Band der tieffrequenten Anteile ableitet und die Steuersignale das Erregungssignal modulieren, um sowohl die stimmhaften als auch die stimmlosen Anteile des künstlichen Sprachsignals zu gewinnen.
Trotz der Ausschaltung der Messung der Parameter für stimmhaft-stimmlos und den Grundton sowohl in der Sende- als auch in der Empfangsstation löst dieses System das Problem der Natürlichkeit nicht ausreichend, weil die Differenzfrequenzkomponente, die in dem schmalen Band der tieffrequenten Anteile enthalten ist, den Grundton-Parameter nicht mit genügender Genauigkeit wiedergibt. Während stetiger Klänge zeigt die Differenzfrequenzkomponente, die durch den genannten, nichtlinearen Verzerrungsvorgang erzeugt wird, den Grundton genau an, aber im Verlaufe des Überganges von Klang zu Klang enthalten die Frequenzanteile, die durch den nichtlinearen Verzerrungsvorgang erzeugt werden, unzulässige Veränderungen, die die Genauigkeit der Differenzfrequenzkomponente als Anzeige für den Grundtonparameter der entsprechenden Sprachklänge schwerwiegend beeinträchtigen. Das trägt dazu bei, die kleinen Unregelmäßigkeiten bei aufeinanderfolgenden Perioden einzelner stimmhafter Laute, die für die Natürlichkeit sehr wichtig sind, vollständig zu überdecken. Als Schlußfolgerung ergibt sich, daß das Erregungssignal, das entsprechend der zitierten deutschen Patentschrift aus dem schmalen Band der tieffrequenten Anteile gewonnen wird, nicht genau die Eigentümlichkeiten des ursprünglichen Sprachsignals beinhaltet und daher die künstliche Sprache, die aus dem Erregungssignal gewonnen wird, einen unnatürlichen Klang hat.
Ein anderes System zur Verbesserung der Natürlichkeit der Vocodersprache ist in der USA.-Patentschrift 2 817711 beschrieben. Nach diesem System wird ein verhältnismäßig breites Band der tieffrequenten Anteile des ursprünglichen Sprachsignals direkt So und unverändert an die Empfangsstation übertragen, während die verbleibenden höherfrequenten Anteile des Sprachsignals in herkömmlicher Vocoderart als eine Gruppe frequenzkomprimierter Steuersignale übertragen werden. In der Empfangsstation sieht das System eine Zischzelle vor, die entweder selektiv oder kontinuierlich ein Erregungssignal zur Wiederherstellung der höherfrequenten Anteile abgibt. Die direkt übertragenen niederfrequenten Anteile des ursprünglichen Signals werden nur dazu benutzt, mit den wiederhergestellten höherfrequenten Anteilen zusammengesetzt zu werden, um die künstliche Sprache zu gewinnen. Obwohl bei diesem System die Natürlichkeit verbessert wird, indem die Grundtoninformation ohne Verzerrung in Form eines Teiles des ursprünglichen Sprachsignals übertragen wird, ist diese Lösung des Problems der Verbesserung der Natürlichkeit unvollständig, weil weder bei selektiver noch bei kontinuierlicher Arbeitsweise der Zischquelle die Grundtoninfonnation in den tieffrequenten Anteilen enthalten ist. Weiterhin wird bei der kontinuierlichen Anschaltung der Zischquelle sowohl die Verständlichkeit als auch die Natürlichkeit der wichtigen stimmhaften Laute durch ein hörbares Hintergrundzischen beeinträchtigt.
Es ist eine besonderer Vorzug der Erfindung, daß ein bisher unerreichter Grad von Natürlichkeit bei der Vocodersprache erreicht wird. Das Wesentliche der Erfindung ist, einen ausgewählten tieffrequenten Anteil des ursprünglichen Signals, das Grundband, das direkt ohne Verzerrung an die Empfangsstation übertragen wird, für zwei Zwecke auszunutzen: Einmal, um unter Spreizung auf das ursprüngliche Spektrum der höherfrequenten Anteile ein kontinuierliches Erregungssignal für die Wiederherstellung der höherfrequenten Anteile des künstlichen Sprachsignals bereitzustellen, wobei die höherfrequenten Anteile der ursprünglichen Sprache in typischer Vocoderform als Gruppe frequenz komprimierter Steuersignale übertragen werden; zum anderen, um kombiniert mit den wiederhergestellten höherfrequenten Anteilen die tieffrequenten Teile des künstlichen Sprachsignals zu ergeben. Durch diese neue Einrichtung werden die genauen Eigentümlichkeiten des ursprünglichen Sprachsignals, insbesondere die kleinen Unregelmäßigkeiten bei aufeinanderfolgenden stimmhaften Lauten und der plötzliche Übergang von Laut zu Laut, erhalten, und zwar ohne Fehler sowohl bei den höherfrequenten als auch bei den tieffrequenten Anteilen des Sprachsignals. Dadurch ergibt sich ein außerordentlicher Grad von Natürlichkeit.
Im Unterschied zu dem System nach der genannten deutschen Patentschrift, bei dem sowohl die Anzeige des Stimmhaft-Stimmlos- als auch des Grundton-Parameters von dem verzerrten, ursprünglichen Sprachsignals abgeleitet wird, sieht die Erfindung eine fehlerfreie Quelle für die Information stimmhaft-stimmlos und den Grundton vor, indem ein unverzerrter, unveränderter Teil des ursprünglichen Sprachsignals selbst übertragen wird. Im Unterschied zu dem System nach der genannten USA.-Patentschrift, bei dem die Grundtoninfonnation, die in dem unveränderten Teil des ursprünglichen Signals enthalten ist, an die Empfängerstation übertragen, aber nicht ausgenutzt wird zur Wiederherstellung der höherfrequenten Anteile, benutzt die Erfindung den direkt übertragenen Teil des ursprünglichen Signals, um sowohl die Information für stimmhaft-stimmlos als auch den Grundton bei der Wiederherstellung der höherfrequenten Anteile zu liefern. Dadurch wird eine genaue Übereinstimmung der Struktur der wiederhergestellten höherfrequenten Anteile und der Struktur des ursprünglichen Sprachsignals erreicht.
Ein spezielles Merkmal der Erfindung ist ein neues, nichtlineares Verzerrungsnetzwerk, das aus dem direkt übertragenen tieffrequenten Teil des Ursprung-
5 6
lichen Signals ein breitbandiges Erregungssignal, das Frequenzbänder ausgelegt sind. Im allgemeinen ist
aus Frequenzanteilen mit verhältnismäßig gleichförmi- eine Unterteilung in Form einer geometrischen Reihe
gen Amplituden zusammengesetzt ist, herstellt. Wäh- zu bevorzugen, bei der das Verhältnis der Bandbreite
rend stimmhafter, periodischer Abschnitte des ur- zur Mittelfrequenz stets konstant bleibt,
sprünglichen Signals ist das Erregungssignal peri- 5 Die Kompression des Sprachfrequenzteilbandes
odisch mit der gleichen Periode wie der entsprechende zwischen 3000 und 10 000 Hertz auf wenige hundert
stimmhafte Laut, und während stimmloser, aperi- Hertz mittels der Vocodertechnik ist deshalb möglich,
odischer Abschnitte des ursprünglichen Signals ist das weil das Hörorgan oberhalb etwa 3000 Hertz eine
Erregungssignal aperiodisch mit demselben Grad geringe Informationsrate aufweist. Dementsprechend
von Aperiodizität wie der entsprechende stimmlose io werden meist Steuersignale mit einer Bandbreite von
Laut. Die außergewöhnliche Natürlichkeit der künst- 15 bis 25 Hertz benutzt, um die Energieverteilung in
liehen Sprache, die mit der Einrichtung nach der Er- den höherfrequenten Teilbändern anzugeben. Bei der
findung erzeugt wird, ist größtenteils der genauen Einrichtung nach der Erfindung werden jedoch diesen
Übereinstimmung zwischen der Periodizität und Steuersignalen in an sich bekannter Weise Bänder
Aperiodizität des Erregungssignals und der Periodizi- 15 von 30 bis 50 Hertz Bandbreite zugeteilt. Diese Er-
tät bzw. Aperiodizität des ursprünglichen Sprach- höhung der Bandbreite der Steuersignale ergibt eine
signals zuzuschreiben. Verbesserung der Wiedergabe, die den Nachteil der
Die Erfindung soll an Hand eines in der Zeichnung vergrößerten Bandbreite bei weitem überwiegt, da dargestellten Ausführungsbeispiels näher erläutert diese Bandbreitenerhöhung die Wiedergabe von kurwerden; in der Zeichnung zeigt 20 zem Anhallen, wie sie in den Knacklauten »t« und
Fig. 1 ein schematisches Blockschaltbild einer »p« und in dem Hochlaut »ch« auftreten, erheblich
Sprachübertragungsanlage, verbessert. Die breiteren Steuerbänder verringern
Fig. 2 die Frequenzverteilung der Teilbänder für auch die Laufzeitverzögerung im Vocoder auf weniger
kodierte und unkodierte Signale, als 10 Millisekunden. Eine Phasenverzerrung dieser
Fig. 3 ein Blockschaltbild mit näheren Einzelheiten 25 Größe zwischen dem kodierten und dem unkodierten
eines Erregungsgenerators, Band ist unhörbar, und deshalb braucht keine Phasen-
Fig. 4 eine Darstellung von Frequenzspektren, entzerrung vorgesehen zu werden.
Fig. 5 die Übertragungskennlinie einer nichtlinearen Die drei oder mehr auf diese Weise abgeleiteten
Verzerrungsschaltung für den Erregungsgenerator Steuersignale werden gemeinsam mit dem durch das
nach Fig. 3, 30 Filter 10 durchgelassene Signal des unteren Teil-
Fig. 6 eine besonders vorteilhafte Kennlinie einer bandes mittels üblicher Überlagerungstechnik syste-
Verzerrungsschaltung, matisch nebeneinander auf der Frequenzskala ange-
Fig. 7 ein Schaltbild einer Verzerrungsschaltung ordnet, und zwar mittels der Modulatoren 20, 21, 22
mit der Kennlinie nach Fig. 6 und und 23 und der dazugehörigen Oszillatoren 24, 25
Fig. 8 ein Schaltbild, teilweise in Blockdarstellung, 35 26 und 27. Die Modulatoren können gleichartig und eines erfindungsgemäßen Sprachsynthese-Teils. wie alle anderen Bauelemente im Analyse-Teil in bein Fig. 1 ist ein Analyse-Teil auf der Sendeseite kannter Weise aufgebaut sein. Die Frequenzen der und ein Synthese-Teil auf der Empfangsseite gezeigt, Oszillatoren werden so eingestellt, daß die einzelnen die durch einen Übertragungskanal C miteinander ver- Signale an die gewünschte Stelle im Frequenzspekbunden sind. Im Analyse-Teil wird ein Sprechstrom, 40 trum verlagert werden.
der z. B. aus einem Mikrophon T kommt, an eine Vorzugsweise werden das im unteren Teil des Anzahl parallel liegender Bandpässe 10, 11, 12 und Sprachfrequenzbereichs liegende unkodierte Sprach-13 gelegt. Die verschiedenen Bandpaßfilter lassen be- signal und die drei schmalbandigen Steuersignale in nachbarte Frequenzbänder durch, die insgesamt ein der in Fig. 2 gezeigten Weise auf der Frequenzskala Band von etwa 80 bis 9000 Hertz umfasen. Der 45 nebeneinander angeordnet. Das Sprachband von 80 Bandpaß 10, der in der ersten der parallelen Strom- bis 2400 Hertz wird um 370 Hertz nach oben verpfade eingeschaltet ist und zum Durchlaß des Fre- schoben, so daß es das Band zwischen 450 und quenzbandes von 80 bis 2400 Hertz ausgelegt ist, 2770 Hertz einnimmt. In gleicher Weise werden die überträgt den unteren Teil des Sprachfrequenzbereichs Steuersignale für die Sprachsignalkomponenten in den direkt und ohne weitere Modifizierung, d. h. unko- 50 Bändern 2,4 bis 3,7 Kilohertz, 3,7 bis 5,7 Kilohertz diert, an einen Modulator 20. Die Bandpässe It, 12 und 5,7 bis 9 Kilohertz nach unten verlagert, so daß und 13, die in den anderen parallelen Strompfader* sie den Teil des Spektrums zwischen 300 und liegen und z. B. für die Bänder von 2400 bis 450 Hertz einnehmen. Durch die Transponierung der 3700 Hertz, 3700 bis 5700 Hertz und 5700 bis Signale auf diese Weise werden die Signale am un-9000 Hertz ausgelegt sind, geben den Energieinhalt in 55 teren und am oberen Ende des Eingangssignaldiesen höherfrequenten Bändern an signalverarbei- bereiches inmitten des übertragenen Bereiches angetende kodierende Vorrichtungen, die in den ent- ordnet, so daß Rauschstörungen u. dgl., die während sprechenden Kanälen liegen. Der Ausgang jedes der der Übertragung auf das Signal einwirken, diese Si-Bandfilter 11, 12 und 13 liegt an einem Doppelweg- gnale nicht in schwerwiegender Weise beeinflussen, gleichrichter 14, 15 bzw. 16, dem ein Tiefpaß 17, 60 Ein Verlust am unteren Ende des Übertragungs-18 bzw. 19 nachgeschaltet ist, dessen Ausgangssignal bandes ergibt also nur eine leichte Verengung des ein sich langsam änderndes Steuersignal ist, dessen Frequenzbereiches an der oberen Grenze.
Augenblicksamplitude der Augenblicksamplitude des Obwohl eine Frequenzverlagerung der in Fig. 2 zugeordneten Teilfrequenzbands entspricht. Ge- dargestellten Art wesentliche Übertragungsvorteile wünschtenfalls können in nicht dargestellter Weise 65 bietet, ist es natürlich möglich, beliebige andere bezusätzliche Unterbänder vorgesehen werden, indem kannte Signalübertragungsverfahren zu benutzen, zusätzliche Parallelstrompfade vorgesehen werden, die Zum Beispiel kann Einseitenband-Frequenzmoduladen dargestellten ähnlich und für die gewünschten tion, Einseitenband-Amplitudenmodulation oder Zwei-
seitenband-Amplitudenmodulation zur Multiplexübertragung der einzelnen Signalkomponenten benutzt werden. Gewünschtenfalls können natürlich auch getrennte Kanäle vorgesehen werden. Bei all diesen Verfahren ist ein Gesamtdurchlaßband von etwa 2500 Hertz ausreichend, um die gesamte Information des Eingangssignals zu übertragen. Die tatsächliche Kompression der höheren Frequenzen in dem Beispiel nach Fig. 2 ist von etwa 6600 (9000 — 2400 Hertz) auf 150 Hertz oder von 44 auf 1. Die Gesamtkompression für das gesamte Übertragungsband beträgt 8920 auf 2470 Hertz oder 3,6 auf 1.
Vom Analyse-Teil in Fig. 1 können die in der beschriebenen Weise umgeformten Sprachsignale nun über einen Kanal C zur Empfangsseite übertragen werden, wo sie zur Steuerung einer künstlichen Sprachsynthesevorrichtung benutzt werden können.
Im Synthese-Teil wird das vom Kanal C kommende Signal zunächst in die entsprechenden Komponenten aufgeteilt, die im Analyse-Teil abgeleitet wurden, und diese Komponenten dann in ihre ursprüngliche Frequenzlage zurücktransportiert. Das unkodierte untere Band wird mittels des Modulators 30 und des Oszillators 34 also auf der Frequenzskala wieder nach unten in seinen ursprünglichen Bereich von 80 bis 2400 Hertz verlagert. Die Ausgangsspannung des Modulators 30 wird unmittelbar ohne weitere Modifizierung an einen Addierer 38 gegeben. Sie wird außerdem als Eingangssignal an einen Erregungsgenerator 45 gegeben, in welchem ein Signal erzeugt wird, das in der Wirkungsweise sowohl dem Zischais auch dem Summsignal im üblichen Vocoder entspricht.
Die verschiedenen vom Analyse-Teil empfangenen Steuersignale werden auf der Frequenzskala nach unten in ihre ursprüngliche Lage verschoben, und zwar mittels der Modulatoren 31, 32 und 33 und der Oszillatoren 35, 36 und 37. Die Ausgangsspannungen dieser Modulatoren werden gemeinsam mit den vom Generator 45 gelieferten Erregungssignalen an die Gattermodulatoren 39, 40 bzw. 41 gegeben. In diesen Modulatoren dienen die Steuersignale dazu, die Amplitude der angelegten Erregungssignale einzustellen. Die Ausgangsspannungen dieser Gatter werden durch Bandpässe 42, 43 und 44 geleitet, die denen im Analyse-Teil gleichen, und dann additiv zusammengefaßt, so daß ein zusammengesetztes Ausgangssignal im Frequenzband von 2400 bis 9000 Hertz entsteht. Dieses Signal ist dem auf der Sendeseite an die Bandpässe 11, 12 und 13 angelegten höherfrequenten Signal sehr ähnlich. Es wird dann dem Signal des unteren Bandes im Frequenzbereich von 80 bis 2400 Hertz im Addierer 38 zugemischt, so daß eine Nachbildung des Sprechstroms des Mikrophons T erhalten wird. Dieses Signal wird an ein geeignetes Wiedergabegerät R gegeben.
Der Grad der Natürlichkeit und Wirklichkeitsnähe, der mit künstlicher Sprache erreicht werden kann, hängt zum großen Teil von der Natur des bei der Synthese benutzten Erregungssignals ab. Im Idealfall benötigt eine Sprachsynthesevorrichtung ein Erregungssignal, das durch ein glattes Spektrum mit konstanter Leistungsdichte gekennzeichnet ist und die jeweils richtige Art hat, d. h. wahlweise diskret oder kontinuierlich ist. In üblichen Vocodern der obengenannten Art werden zwei getrennte Erregungssignale benutzt; eines, das Summsignal, hat periodischen Aufbau, und das andere, das Zischsignal, ist aperiodisch. Ein Hilfssteuersignal dient dazu, zwischen der Summspannung und der Zischspannung zu wählen, und ein Grundtonsignal stellt die Grundfrequenz des Summsignals ein. Ein Entscheidungselement, das notwendigerweise Fehlern ausgesetzt ist, ist zu dieser Wahl erforderlich. Die Aufgabe, diese Signale empfangsseitig herzustellen, ist bei der Erfindung dadurch vermieden, daß ein einziges Erregungssignal benutzt wird, das allgemeiner der Idealform
ίο eines Erregungssignals entspricht als eine vollständig statistische Rauschquelle, sei es Zischen oder Summen. Ein solches Erregungssignal, das mit den vom Mikrophon T gelieferten Sprechströmen eng korreliert ist, gibt an die wiederhergestellte Sprache viel von der Klangfarbe des Sprechers weiter, wodurch die künstliche Sprache sehr gut wieder erkennbar ist. Ein wesentlicher Teil der Unnatürlichkeit der Vocodersprache wird so ausgeschaltet. Da in der Empfangsschaltung keine Entscheidung irgendwelcher Art getroffen zu werden braucht, sind auch die Fehlermöglichkeiten herabgesetzt, und damit wird sowohl die Genauigkeit in der Synthesevorrichtung verbessert als auch ihr Aufbau vereinfacht.
Das zur Wiederherstellung der Sprache benutzte Stimmerregungssignal wird erfindungsgemäß von dem übertragenen Sprachsignal im unkodierten Band abgeleitet, d. h. in dem beschriebenen Beispiel werden die Spracherregungssignale von den unkodierten Signalen im Bereich zwischen etwa 80 und 2400 Hertz abgeleitet. Diese Signale stehen an der Ausgangsklemme des Modulators 30 zur Verfügung.
Ehe der Aufbau eines geeigneten Erregungsgenerators näher betrachtet werden soll, erscheint es zweckmäßig, den Aufbau der Spektra der verschiedenen im Empfänger verfügbaren Signale zu betrachten. Die unkodierte Sprache im Frequenzband von 80 bis 2400 Hertz besitzt ein schmales Zeit-Leistungs-Spektrum, das entweder kontinuierlich (stimmlos) oder quasidiskret (stimmhaft) ist, je nachdem, wie der Sprecher es geformt hat, um die beabsichtigte Klangfarbe oder den phonetischen Wert auszudrücken. Auf der anderen Seite sind die Spektra der Sprachlaute oberhalb 3000 Hertz, besonders die der Zischlaute, Hauchlaute und Verschlußlaute, die die wichtigsten Laute mit Komponenten oberhalb 3000 Hertz sind, sehr breit. Das Ohr ist für spektrale Veränderungen dieser Laute nicht sehr empfindlich. So ist es z. B. bekannt, daß ein breites Resonanzband bei etwa 3000 Hertz, das durch Rauschen angeregt ist, einen annehmbaren »sch«-Laut darstellt, obwohl das eine drastische Vereinfachung des vom Menschen erzeugten Spektrums eines »sch« ist. Weiter hängt die subjektive Aufnahme eines »sch« innerhalb weiter Grenzen nicht von der Breite dieses Resonanzspektrums ab. Das »sch« kann also durch einen einzelnen Parameter ausreichend beschrieben werden. Das gleiche gilt für das »s«, das synthetisch durch ein Rauschband um 7000 Hertz dargestellt werden kann. Andere Zischlaute erfordern ein etwas kompliziertes Synthesespektrum, können jedoch in der Zusammensetzung ihrer Spektra ebenfalls erheblich abgewandelt werden.
Erfindungsgemäß wird eine geeignete Kombination von nichtlinearen Verzerrungen und schneller, automatischer Verstärkungssteuerung wirksam dazu ausgenutzt, um das Spektrum des geformten und im Band begrenzten unkodierten Sprachsignals in ein im wesentlichen geradliniges Breitbandspektram konstan-
ter Leistungsdichte zu spreizen, das zur Synthese von Sprache im Frequenzbereich von etwa 3000 bis 10 000 Hertz geeignet ist. Der Generator 45 transformiert also unkodierte Grundbandsignale in ein Signal, das jederzeit die richtige Feinstruktur hat, d. h. kontinuierlich für aperiodische Eingangssignale und quasidiskret für periodische Eingangssignale ist, und eine ausreichend unveränderliche Umhüllende im Bereich der höheren Frequenzen hat, so daß eine befriedigende Synthese durchgeführt werden kann. Da das Signal dank seiner Korrelation mit der ursprünglichen Sprache automatisch jederzeit die richtige Form hat, kann es durchgehend an den Synthesemodulator angelegt werden. Es werden deshalb keinerlei Entscheidungselemente benötigt.
Fig. 3 veranschaulicht in Blockdarstellung eine Anordnung, die zur Erzeugung des benötigten Erregungssignals geeignet ist. In der Darstellung umfaßt der Erregungsgenerator 45 eine nichtlineare Verzerrungsschaltung 47, die mit dem unkodierten Grundband- sprachsignal vom Modulator 30 beaufschlagt wird. Da Gattermodulatoren in dem Synthese-Teil benutzt werden, werden Binärimpulse konstante Amplitude und veränderlicher Breite zu deren Betätigung benötigt. Dementsprechend wird die Erregungsfunktion, die von der nichtlinearen Verzerrungsschaltung 47 erzeugt wird, mittels eines Konverters 48 in ein impulsbreitenmoduliertes Signal umgewandelt. Für den Impulsbreitenkonverter ist eine periodische Sägezahnspannung erforderlich, die z. B. im Generator 49 erzeugt werden kann. Eine Sägezahnfrequenz von 30 Kilohertz ist geeignet. Die umgeformten Verzerrungssignale werden durchgehend an jeden der Gattermodulatoren 39, 40 und 41 angelegt, die denen im Synthese-Teil nach Fig. 1 dargestellten entsprechen. Die Gatter werden also entsprechend der Dauer der angelegten Erregungssignalimpulse geöffnet. Die Steuerimpulse von den Modulatoren 31, 32 und 33 werden an die Steuereingänge der Gatter 39, 40 und 41 angelegt, um die Amplituden der von den Gattern durchgelassenen Erregungssignale einzustellen.
Vor einer ins einzelne gehenden Beschreibung der einzelnen Elemente des Erregungsgenerators 45 sollen die Spektren in Fig. 4 betrachtet werden. Auf der obersten Zeile ist ein typisches Sprachspektrum im Bereich bis über 10 Kilohertz dargestellt. Es ist zu erkennen, daß es sehr breit ist. Das Grundband dieses Spektrums von etwa 80 Hertz bis 2,4 Kilohertz, in der zweiten Zeile dargestellt, bildet das Eingangssignal des Erregungsgenerators 45. Die Ausgangs-Spannung des Erregungsgenerators ist in der dritten Zeile veranschaulicht. Es ist ein im wesentlichen geradliniges Spektrum mit kontinuierlicher Leistungsdichte und eignet sich zur Synthese einer großen Anzahl von Sprachlauten. Der Teil zwischen 3 und 10 Kilohertz wird vorzugsweise für die Sprachsynthese herangezogen.
Das zur Herstellung eines geradlinigen Spektrums der in Fig. 4, dritte Zeile, veranschaulichten Art benötigte Netzwerk kann auf verschiedene Weise aufgebaut werden. Beispielsweise kann das unkodierte Sprachsignal gleichgerichtet oder begrenzt werden, so daß ein breiteres Spektrum erhalten wird. Die im Sinne der Erfindung wirksamste Verzerrungsvorrichtung erhöht jedoch in erster Linie die Anzahl der Nullstellen pro Sekunde des an die Eingangsklemme angelegten Signals. Dementsprechend braucht die Schaltung zur Erzeugung des Erregungssignals nur Mittel zu enthalten, durch die die mittlere Zahl der Vorzeichenwechsel erhöht wird, wodurch das Spektrum sehr stark verbreitert wird. Diese Erhöhung kann einfach durch Begrenzen verschiedener Ableitungen des Sprachsignals erfolgen, d. h. nachdem die Sprache integriert, differenziert oder ähnlich umgeformt ist, und es können vier oder mehr von auf diese Weise erhaltenen Rechteckwellen miteinander multipliziert werden. Im Prinzip kann diese Multiplikation durch Triggern eines Flip-Flops mit Vorzeichenwechsel von allen Rechteckwellen durchgeführt werden. Wegen der Erholungszeit im Flip-Flop können jedoch Vorzeichenwechsel gelegentlich übergangen werden. Selbstverständlich muß die Multiplikation fehlerfrei und zeitunabhängig erfolgen.
Eine Ausführungsform eines derartigen Vorzeichenwechsel-Vervielfachers umfaßt ein Netzwerk mit einer Eingangs-Ausgangs-Kennlinie aus geradlinigen Segmenten. Eine solche Kennlinie ist in Fig. 5 dargestellt. Bei dieser Kennlinie ist eine Ausgangsspannung von +1 vorhanden, wenn am Eingang die Spannung 0 oder +4 steht, und ein Ausgangssignal von — 1 für Eingangssignale von ±2. Wenn also vier Rechteckwellen der Amplitude +1 addiert und dann an den Eingang eines Netzwerks mit dieser Kennlinie gelegt werden, ergibt sich als Ausgangssignal das Produkt dieser vier Rechteckwellen. Wenn eine Sinusspannung mit einer Amplitude größer als drei an das Netzwerk angelegt wird, so werden vier Nulldurchgänge am Ausgang für jeden Nulldurchgang am Eingang erhalten. Diese Art von Vorzeichenwechselvervielfacher kann zur Erzeugung einer großen Anzahl von Nulldurchgängen benutzt werden, wodurch Verzerrungskomponenten bis zu 10 000 Hertz und darüber gewonnen werden können. Diese Erhöhung wird erreicht, ohne daß immer wieder erneut begrenzt werden muß. Darüber hinaus ist jeder Vervielfacher praktisch unabhängig von der speziellen Form des Eingangssignals. Im allgemeinen braucht die Netzwerkkennlinie nicht linear zu sein. Eine befriedigende Multiplikation wird so lange erhalten, wie eine ausreichende Anzahl von Steigungsumkehrungen enthalten ist.
Eine Schaltung mit der Kennlinie nach Fig. 5 hat genau die gewünschten Eigenschaften; es ist eine durchgehende Eingangs-Ausgangs-Kennlinie vorhanden, und durch den Einsatz einer ausreichenden Anzahl von Steigungsumkehrungen kann das Spektrum praktisch beliebig gespreizt werden. Darüber hinaus wird bei dieser nichtlinearen Schaltung eine gewisse Schwelle gewährleistet, oberhalb der die Ausgangsspannungsspitze konstant ist. Während die Spitzenausgangsspannung der Schaltung konstant ist und das gleiche auch für die effektive Ausgangsspannung gilt, hängt die spektrale Leistungsdichte jedoch etwas von der Eingangsamplitude ab. Unter Umständen kann sie mit größer werdender Eingangsamplitude abfallen. Für Zwecke der Sprachsynthese muß die Leistungsdichte jedoch konstant gehalten werden. Zu diesem Zweck wird zusätzlich zu der Schaltung mit Zick-Zack-Kennlinie eine logarithmische Kompression eingesetzt. Die Kennlinie einer geeigneten Verzerrungsschaltung ist in Fig. 6 dargestellt. Sie stellt nur ein Beispiel dar, da die Schaltung wesentlich mehr Steigungsumkehrungen haben kann, als dargestellt ist.
Fig. 7 veranschaulicht eine Verzerrungsschaltung, die in einem begrenzten Eingangsspannungsbereich die in Fig. 6 dargestellte Kennlinie aufweist. Sie be-
109 708/260
steht aus einem Diodennetzwerk, dem mittels eines Transformators 63 das vom Modulator 30 gelieferte Sprachsignal des Grundbandes aufgedrückt wird. Die Dioden 71, 72, 73 und 74 ergeben zusammen die W-förmige Kennlinie oder etwa zwei vollständige Sinuswellen (vgl. Fig. 6). Die Dioden 66, 67, 68 und 69 bewirken in Verbindung mit den Widerständen 64, 65 und 70 die gewünschte logarithmische Kompression der Eingangsamplitude. Die beiden Verzerrungssignale, die durch diese Diodenanordnungen hervor- gerufen werden, liegen an den Widerständen 75 bzw. 76 und werden zu einem zusammengesetzten Verzerrungssignal vereinigt, das zur Sprachsynthese als Erregungssignal benutzt werden kann. Mittels eines Kondensators 77 wird es an die Basis eines Transistor 78 zwecks Verstärkung auf einen brauchbaren Pegel gekoppelt. Die Widerstände für die Einstellung des Arbeitspunktes des Transistors 78 sind mit 79, 80 und 81 bezeichnet. Das verstärkte Verzerrungssignal wird über einen Kondensator 82 zum Impuls- breitenkonverter 48 übertragen.
In Fig. 8 ist der Synthese-Teil der Empfangsstation im beschriebenen System schematisch dargestellt. Die Blockteile des Synthese-Teils nach Fig. 8, die den in Fig. 1 gezeigten entsprechen, tragen das gleiche Bezugszeichen. Der Sägezahngenerator 49 ist mit einer Doppelbasisdiode 83 mit Widerständen 84, 85 und 86 sowie i?C-Glied 87, 88 und 89 ausgestattet, die ähnlich wie eine Gastriode arbeitet, und mit einem Transistor 91 in normaler Schaltung mit den Widerständen 90, 92 und 93. Die Ausgangsspannung des Oszillators, die durch das Potentiometer 86 in der Frequenz und durch das Vorspannungspotentiometer 94 in der Amplitude eingestellt ist, wird an die Basis des Transistors 95 mit dem Widerstand 96 gelegt, der einen Teil des Impulsbreitenkonverters 48 bildet. Dieser Konverter umfaßt Transistor 95 und Transistor 99 mit Widerstand 100, die durch eine i?C-Paraüelschaltung97, 98 gekoppelt sind. Die Zeitkonstante der Schaltung ist so eingestellt, daß ein binäres Ausgangssignal erzeugt wird.
Die von der Verzerrungsschaltung 47, die die in Fig. 7 gezeigte Schaltung haben kann, abgeleiteten Verzerrungssignale werden an die Basis des Transistors 99 gelegt. Der Transistor 99 ist zwischen Sperrbereich und Sättigung so eingestellt, daß die an seinem Kollektor liegende Spannung eine 30-Kilohertz-Rechteckwelle ist, von der eine Flanke durch die Ausgangsspannung der Verzerrungsschaltung 47 moduliert ist. Diese Spannung wird an die Basis jedes der Transistoren 101, 102 und 103 angelegt, die die Gattermodulatoren 39, 40 und 41 in Fig. 1 darstellen.
Die betreffenden Gatter werden für jeweils solche Intervalle geöffnet, die der variablen Impulsbreite der Rechteckwelle entsprechen, wobei während dieser Intervalle die angelegten Verzerrungssignale durchgelassen werden. Die verschiedenen Steuersignale für die höheren Teilfrequenzbänder, die von den Modulatoren 31, 32 und 33 abgeleitet sind und den Energieinhalt der einzelnen Teilfrequenzbänder darstellen, werden über die Widerstände 104, 105 bzw. 106 an die Kollektoren der einzelnen Transistorengatter gelegt und modulieren die Amplitude der an die Basen dieser Transistoren angelegten Verzerrungssignale. Die modulierten Ausgangssignale liegen über Kondensatoren 107, 108 bzw. 109 an den Potentiometern 110,111 und 112 und werden an deren Abgriffen auf den richtigen Kanalpegel eingestellt. Die eingepegelten Signale laufen durch Bandpässe 42, 43 und 44 und werden dann additativ zusammengefaßt, so daß ein zusammengesetztes Ausgangssignal entsteht, das die höherfrequenten Komponenten des an die Steuerkanäle im Analyse-Teil angelegten Signals gut nachbildet. Es repräsentiert also das Sprachband von etwa bis 9000 Hertz. In einem Addierer 38 wird es dem Grundbandsignal vom Modulator 30 zugemischt. Das sich ergebende Ausgangssignal entspricht dem im Mikrophon T erzeugten Sprachsignal und wird an ein Wiedergabegerät R angelegt.

Claims (7)

PATENTANSPRÜCHE:
1. Einrichtung zur Übertragung von Sprache unter Frequenzbandpressung nach Art eines Vocoders, bei der die tiefen Frequenzen der Sprachsignale unmittelbar und die höherfrequenten Anteile des Sprachspektrums in Form mehrerer in der Frequenz komprimierter Steuersignale an die Empfangsstation übertragen werden, dadurch ge kennzeichnet, daß in der Empfangsstation das Spektrum der unmittelbar übertragenen tiefen Frequenzen auf das ursprüngliche Spektrum der höherfrequenten Anteile gespreizt wird, wobei die Periodizität in jedem Augenblick der Periodizität des ursprünglichen Sprachsignals genau entspricht, und daß das gespreizte Spektrum unter Steuerung in den einzelnen höherfrequenten Teilfrequenzbereichen durch die Steuersignale einer Addiereinrichtung zugeführt wird, der gleichzeitig die unmittelbar übertragenen tiefen Frequenzen zugeführt werden und deren Ausgang mit einer Wiedergabevorrichtung verbunden ist.
2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß für das Spreizen des Spektrums der tiefen Frequenzen eine nichtlineare Verzerrungsschaltung (47) vorgesehen ist (Fig. 3 und 7).
3. Einrichtung nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die Schaltung zum Spreizen des Spektrums der tiefen Frequenzen eine beispielsweise zickzackförmige Eingangs-Ausgangs-Kennlinie mit einer Anzahl von Steigungsumkehrungen aufweist (Fig. 5 und 6).
4. Einrichtung nach Anspruch 1, 2 oder 3, dadurch gekennzeichnet, daß die Schaltung zum Spreizen des Spektrums der tiefen Frequenzen ein von diesen Frequenzen gespeistes Netzwerk aus Dioden (71, 72, 73, 74), welches eine W-förmige, zwei vollständige Sinuswellen approximierende Kennlinie aufweist und ein weiteres vorgeschaltetes Netzwerk mit Dioden (66, 67, 68 und 69), welches eine logarithmische Kompressionskennlinie aufweist, enthält und daß Mittel, z.B. Widerstände (75, 76), vorgesehen sind, um die Spannungen an den Ausgängen der beiden Diodennetzwerke zu einem zusammengesetzten, verzerrten Breitbandsignal zu vereinigen (Fig. 7).
5. Einrichtung nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, daß die Hüllkurve des gespreizten Spektrums der tiefen Frequenzen im wesentlichen unveränderlich und die Feinstruktur mit den sendeseitigen Mikrophonspannungen korreliert ist (Fig. 4).
6. Einrichtung nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, daß das gespreizte Spektrum der tiefen Frequenzen als Spracherrregungsspannung an den Eingangs-
Memmen einer Anzahl Gatter (39, 40 bzw. 41) zum selektiven Durchlaß von an den Eingangsklemmen stehenden Signalen an entsprechende Ausgangsklemmen liegt, daß die Amplitude der von den einzelnen Gattern durchgelassenen Erregungssignale durch die empfangenen Steuersignale moduliert wird und daß die von den Gattern durchgelassenen modulierten Signale mit den tiefen Frequenzen des Sprachspektrums zwecks Wiederherstellung der Sprache vereinigt ■werden (Fig. 1).
7. Einrichtung nach Anspruch 6, dadurch gekennzeichnet, daß der nichtlinearen Verzerrungsschaltung (47) zur Erzeugung eines relativ breit-
bandigen Verzerrungssignals als Erregungssignal eine Quelle für periodische hochfrequente Wellen, z. B. ein Sägezahngenerator (49), zugeordnet ist, deren Ausgangsspannung gemeinsam mit dem Erregungssignal einer Schaltung zur Erzeugung einer Folge von Rechteckimpulsen, deren Flanken durch ihre Lage die Momentamplituden des Verzerrungssignals angeben, z. B. einem Impulsbreitenkonverter (48), zugeführt wird (Fig. 3).
In Betracht gezogene Druckschriften:
Deutsche Patentschrift Nr. 722 607;
USA.-Patentschrift Nr. 2 817 711.
Hierzu 1 Blatt Zeichnungen
© 109 708/260 10.61
DEW26608A 1958-11-17 1959-10-26 Einrichtung zur UEbertragung von Sprache unter Frequenzbandpressung nach Art eines Vocoders Pending DE1114851B (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US774173A US3030450A (en) 1958-11-17 1958-11-17 Band compression system

Publications (1)

Publication Number Publication Date
DE1114851B true DE1114851B (de) 1961-10-12

Family

ID=25100462

Family Applications (1)

Application Number Title Priority Date Filing Date
DEW26608A Pending DE1114851B (de) 1958-11-17 1959-10-26 Einrichtung zur UEbertragung von Sprache unter Frequenzbandpressung nach Art eines Vocoders

Country Status (6)

Country Link
US (1) US3030450A (de)
BE (1) BE584353A (de)
DE (1) DE1114851B (de)
FR (1) FR1239222A (de)
GB (1) GB937404A (de)
NL (2) NL127390C (de)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL272110A (nl) * 1960-12-08 1964-08-25 Jean Albert Dreyfus Drukaandrijving
NL272809A (de) * 1960-12-27
US3167710A (en) * 1961-02-01 1965-01-26 Jersey Prod Res Co System for analysis of electrical signals including parallel filter channels
US3165734A (en) * 1961-11-02 1965-01-12 Grodzinsky Samuel Screw noise simulation technique
US3411089A (en) * 1962-06-28 1968-11-12 Raytheon Co Communication system
US3431356A (en) * 1965-06-04 1969-03-04 Integrated Electronic Corp Apparatus and method for reconstructing speech
US3420955A (en) * 1965-11-19 1969-01-07 Bell Telephone Labor Inc Automatic peak selector
US3431362A (en) * 1966-04-22 1969-03-04 Bell Telephone Labor Inc Voice-excited,bandwidth reduction system employing pitch frequency pulses generated by unencoded baseband signal
US3471644A (en) * 1966-05-02 1969-10-07 Massachusetts Inst Technology Voice vocoding and transmitting system
US3448216A (en) * 1966-08-03 1969-06-03 Bell Telephone Labor Inc Vocoder system
DE1537596B1 (de) * 1967-11-14 1970-09-03 Michel Copel Verfahren und Schaltungsanordnung zum Verbessern der Verstaendlichkeit frequenzverzerrter Sprache
US3541266A (en) * 1968-09-30 1970-11-17 Octronix Inc Bandwidth compressor and expander
US3622714A (en) * 1969-09-02 1971-11-23 Bell Telephone Labor Inc Telephonic transmission using complementary comb filters
US3743787A (en) * 1969-09-02 1973-07-03 H Fujisaki Speech signal transmission systems utilizing a non-linear circuit in the base band channel
US3875341A (en) * 1972-02-24 1975-04-01 Int Standard Electric Corp System for transferring wideband sound signals
US3914554A (en) * 1973-05-18 1975-10-21 Bell Telephone Labor Inc Communication system employing spectrum folding
US3946162A (en) * 1973-06-04 1976-03-23 International Standard Electric Corporation System for transferring wideband sound signals
FR2238412A5 (de) * 1973-07-20 1975-02-14 Trt Telecom Radio Electr
US3988546A (en) * 1974-09-13 1976-10-26 General Signal Corporation System for audibly recognizing an aurally unclassifiable signal
GB1559897A (en) * 1977-03-15 1980-01-30 Post Office Multiplexing speech
US4181822A (en) * 1978-03-07 1980-01-01 Bell & Howell Company Bandsplitter systems

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE722607C (de) * 1939-01-14 1942-07-22 Karl Otto Schmidt Dr Verfahren zur besseren Ausnutzung des UEbertragungsweges
US2817711A (en) * 1954-05-10 1957-12-24 Bell Telephone Labor Inc Band compression system

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2640880A (en) * 1953-06-02 Speech communication system
US2151091A (en) * 1935-10-30 1939-03-21 Bell Telephone Labor Inc Signal transmission

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE722607C (de) * 1939-01-14 1942-07-22 Karl Otto Schmidt Dr Verfahren zur besseren Ausnutzung des UEbertragungsweges
US2817711A (en) * 1954-05-10 1957-12-24 Bell Telephone Labor Inc Band compression system

Also Published As

Publication number Publication date
BE584353A (fr) 1960-03-01
GB937404A (en) 1963-09-18
FR1239222A (fr) 1960-08-19
US3030450A (en) 1962-04-17
NL245178A (de)
NL127390C (de)

Similar Documents

Publication Publication Date Title
DE1114851B (de) Einrichtung zur UEbertragung von Sprache unter Frequenzbandpressung nach Art eines Vocoders
DE69024017T2 (de) Digitalsignalkodierungseinrichtung.
DE69401512T2 (de) Hybride adaptive bitzuteilung für audiokoder und -dekoder
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE69401514T2 (de) Vom rechenaufwand her effiziente adaptive bitzuteilung für kodierverfahren und kodiereinrichtung
DE4316297C1 (de) Frequenzanalyseverfahren
DE2818052C2 (de) Quantisierung eines Signals mit einem sich über ein gegebenes Frequenzband erstreckendem Spetkrum
DE60103086T2 (de) Verbesserung von quellcodierungssystemen durch adaptive transposition
AT398670B (de) Verfahren zur verschiebung der frequenz von signalen
DE4120537A1 (de) Niederfrequenzkompensationsschaltung fuer tonsignale
DE3315519A1 (de) Analog/digitale signaluebertragung
EP0251028B1 (de) Verfahren zur Übertragung eines Audiosignales
DE69533259T2 (de) Nichtlineares quantisieren eines informationssignales
DE69317802T2 (de) Verfahren und Vorrichtung für Tonverbesserung unter Verwendung von Hüllung von multibandpassfiltrierten Signalen in Kammfiltern
DE2609297C3 (de) Übertragungssystem für Gesprächssignale
DE4001747A1 (de) Anpassbares hochpassfilter mit steuerbarer abschneidefrequenz in abhaengigkeit vom eingangssignal und betriebsverfahren hierfuer
DE2701814A1 (de) Bandkompressionssystem
DE1151285B (de) Nachrichtenuebertragungssystem fuer Sprache mit Herabsetzung der Bandbreite
DE2826818A1 (de) Verfahren und vorrichtung zum erzeugen eines kuenstlichen sprechsignals
DE1524876A1 (de) Verfahren und Einrichtung zur Kompensierung von Verzerrungen von Signalen
DE722607C (de) Verfahren zur besseren Ausnutzung des UEbertragungsweges
EP1130577B1 (de) Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen
DE3115801C2 (de)
DE2119000C3 (de) Impulsdeltamodulator
DE3621513A1 (de) Verfahren zur uebertragung eines audiosignales