DE2659674C3 - Verfahren und Anordnung zum Synchronisieren eines Semi-Formantvocoders - Google Patents

Verfahren und Anordnung zum Synchronisieren eines Semi-Formantvocoders

Info

Publication number
DE2659674C3
DE2659674C3 DE19762659674 DE2659674A DE2659674C3 DE 2659674 C3 DE2659674 C3 DE 2659674C3 DE 19762659674 DE19762659674 DE 19762659674 DE 2659674 A DE2659674 A DE 2659674A DE 2659674 C3 DE2659674 C3 DE 2659674C3
Authority
DE
Germany
Prior art keywords
input
output
synchronization
formant
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE19762659674
Other languages
English (en)
Other versions
DE2659674B2 (de
DE2659674A1 (de
Inventor
Karl Heinz Dipl.-Ing. Moehrmann
Siegfried Ing.(Grad.) Obermeier
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE19762659674 priority Critical patent/DE2659674C3/de
Publication of DE2659674A1 publication Critical patent/DE2659674A1/de
Publication of DE2659674B2 publication Critical patent/DE2659674B2/de
Application granted granted Critical
Publication of DE2659674C3 publication Critical patent/DE2659674C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

Die Erfindung betrifft ein Verfahren und eine Anordnung zum Synchronisieren eines Semi-Formantvocoders, bei dem das Multiplexsignal in Rahmen zusammengefaßte digitale Informationen über das Sprachsignal mit seinen Formanten enthält
Insbesondere aus Gründen der einfachen Verschlüsselungsmöglichkeit besteht großes Interesse an der Übertragung von Sprachsignalen in digitalisierter, insbesondere pulscodemodulierter Form. Zur Übertragung von Sprachsignalen in digitalisierter Form mit niedriger Bitrate über bandbegrenzte Kanäle werden Vocoder verwendet Die Prinzipien der wichtigsten Vocoder sind beispielsweise in den »Proceedings of the IEEE«. Band 54, Nr. 5, Mai 1966, Seiten 702 bis 734 beschrieben.
Die älteste Methode zum Analysieren und Synthetisieren von Sprache zum Zweck der Reduktion der erforderlichen Bandbreite der zu übertragenden Sprache bzw. zum Zweck der Digitalisierung des Sprachsignals mit niedriger Bitrate ist im sogenannten Kanalvocoder verwirklicht Während die direkte Digitalisierung des Sprachsignals auf sehr hohe Bitraten, bei kompandierter Pulscodemodulation (PCM) beispielsweise auf 64 kbit/s, führt, ermöglicht ein Kanalvocoder die Übertragung des Sprachsignals mit wenigen kbit/s. Der Kanalvocoder nutzt die Eigenschaften des menschlichen Gehörs aus, welches eine Kurzzeit-Spektralanalyse des empfangenen Sprachsignals durchführt, aber sehr unempfindlich gegen Phasenverzerrungen ist. Für die Spracherzeugung läßt sich ü^her ein Ersatzbild angeben, in welchem der Sprechtakt durch ein zeitvariables Filter dargestellt wird, welches bei stimmhaften Lauten durch einen Impulsgenerator mit einer Impulsfolge der Sprachgrundfrequenz (»pitch«) und bei stimmlosen Lauten durch einen Rauschgenerator angeregt wird.
Das den Sprechtakt darstellende Filter kann durch eine Anzahl von parallel geschalteten Bandpässen dargestellt werdenderen Durchlaßbereiche aneinander anstoßen und deren Ausgangssignale addiert werden. Mit Hilfe variabler Dämpfungsglieder am Eingang oder Ausgang jedes Bandpasses kann ein bestimmtes Übertragungsverhalten, eine bestimmte spektrale Hüllkurve, eingestellt und durch Änderung der Dämpfungsglieder auch zeitvariabel gestaltet werden. Durch Anregung dieses Systems mit einer Impulsfolge oder Rauschen läßt sich, wenn die Einstellung der Dämpfungsglieder laufend, beispielsweise alle 20 ms, entsprechend geändert wird, auf der Empfangsseite synthetische Sprache erzeugen.
Mit einer gleichartigen Filteranordnung auf der Sendeseite läßt sich die Sprache analysieren, indem die Signalleitungen an den Ausgängen der Filter gemessen werden. Diese sich nur langsam ändernden Meßwerte können laufend übertragen und zur Einstellung der Dämpfungsglieder im Syntheseteil verwendet werden.
Zusätzlich muß im sendeseitigen Analyseteil fortlaufend ermittelt werden, ob die Sprachleute stimmhaft oder stimmlos sind und bei stimmhaften Lauten muß die
Sprachgrundfreqiienz gemessen werden. Diese Informationen werden ebenfalls zum empfangsseitigen Analyseteil übertragen.
Auf die Verfahren zur Ermittlung der Information über die Anregung soll hier nicht näher eingegangen werden, da dies nicht Gegenstand der Erfindung ist. Hierzu sei auf die bereits genannte Literaturstelle sowie auf das Buch »Speech Analysis, Synthesis and Perception«, j Flanagan, Springer-Verlag, Berlin, Heidelber, New York, 1972, Seiten 184 bis 186 und Seite 324 verwiesen.
Eine Reduktion des Aufwandes ergibt sich beim sogenannten »Formantvocoder«. Dieser ist ebenfalls in den bereits genannten »Proceedings of the IEEE«, Seiten 725 und 726, insbesondere Fig.7, sowie im genannten Buch »Speech Analysis, Synthesis and Perception« auf 'den Seiten 339 bis 348, insbesondere Figur 8.9, beschrieben. Die spektrale Einhüllende eines Sprachsignals ist durch mehrere Maxima gekennzeichnet Diese entstehen aufgrund von Resonanzen des Sprechtaktes, welche als Forrnanten bezeichnet werden. In der Sprache Erwachsener finden sich unterhalb von 3 kHz in der Regel drei Formanten. 'p. einem Formantvocoder hat der Analyseteil die Aufgabe, die Frequenzlagen der einzelnen Formanten sowie die Amplituden der spektralen Einhüllenden bei diesen Frequenzen zu ermitteln. Diese Informationen werden, zusammen mit der Information über die Anregung (Sprachgrundfrequenz, Entscheidung stimmhaft/stimmlos) digitalisiert und zum empfangsseitigen Syntheseteil übertragen.
Im Syntheseteil werden die Durchlaßbereiche durchstimmbarer Bandpässe auf die Formantfrequenzen eingestellt. Diese Bandpässe werden beispielsweise gleichartig angeregt wie beim Kanalvocoder (mit Impulsen bei stimmhaften Lauten, mit Rauschen bei stimmlosen Lauten). Die Ausgangssignale der Bandpässe werden durch Dämpfungsglieder entsprechend der ebenfalls übertragenen Information über die Spektralamplituden bei den jeweiligen Formantfrequenzen gewichtet und ergeben addiert das synthetische Sprachsignal.
Der Formantvocoder hat gegenüber dem Kanalvocoder den Vorteil, daß weniger Information übertragen werden muß, da nur die Information über die Lage und Amplitude der Formanten zu ermitteln ist und somit nur eine geringere Bitrate für die Übertragung notwendig wird, daß aber andererseits eine bessere und natürliche Sprachwiedergabe erwartet werden kann, da der Formantvocoder sich besser an die Struktur des Sprechtrakts angleicht als der Kanalvocoder. Die Messung der Formanten ist allerdings problematisch, da sich die Frequenzbereiche der einzelnen Frequenzen nicht gegenseitig ausschließen, so daß beispielsweise zwei Formanten zusammenfallen können oder daß einzelne Formanten ganz verschwinden. Daher ergeben sich für einen reinen Formantvocoder beträchtliche Realisierungsschwierigkeiten.
Dazu kommt, daß bei allen Vocodern mit Sprachgrundfrequenziindung und synthetischer Anregung auf der Empfangsseite die erreichbare Sprachqualität begrenzt ist. Diese Schwierigkeit ist in den bereits genannten Literaturstellen eingehend diskutiert. Insbesondere ergeben sich Probleme bei der Sprachgrundfrequenzfindung aus bandbegrenzter Telefonsprache mit einer unteren Grenzfrequenz von ca. 300 Hz, in welcher die Sprachgrundfrequenj selbst gar nicht mehr enthalten ist. sondern nur noch deren Harmonische, und bei Hintergrundgeräuschen.
Zur Umgehung dieser Schwierigkeit wurde verschiedentlich der Einsatz von Vocodern mit Sprachanregung (»voice excited vocoder«) vorgeschlagen, so beispielsweise im bereits genannten Buch, »Speech Analysis, Synthesis and Perception«, auf den Seiten 333 bis 337 und den Seiten 347 bis 348. Hierbei wird, auf Kosten einer höheren Bitrate bei der Übertragung, ein Teil des Sprachbandes, zum Beispiel von 300 bis 800 Hz, direkt
ίο übertragen und hieraus wird im Syntheseteil durch geeignete Maßnahmen das Anregungssignal für die höherfrequenten Kanäle gewonnen. Ein derartiger Vocoder, bei welchem ein Teil des Sprachbandes direkt übertragen wird und nur der restliche Teil des Sprachbandes dem vocodergemäßen Analyse-Synthese-Verfahren unterzogen wird, wird auch ais »Semi-Vocoder« bezeichnet Hierzu sei beispielsweise auf die bereits genannten »Proceedings of the IEEE«, Seite 730, verwiesen sowie auf die DE-OS 24 33 741.
Auch Formantvocoder mit unir::telbarer Übertragung eines Teils des Sprachbandes nnö, beispielsweise aus dem bereits genannten Buch, »Speech Analysis, Synthesis and Perception«, Seiten 347 bis 348, bekannt. Diese Vocoder sollen im folgenden als »Semi-Fü.-mantvocoder« bezeichnet werden. Der direkt übertragene Teil des Sprachbandes wird im folgenden als »Grundband« bezeichnet
Derartige Vocoder ermöglichen eine sehr gute Qualität der übertragenen und synthetisierten Sprache
so auch bei unvollkommener Nachbildung der Struktur der höheren Formanten (der erste Formant ist in der Regel bereits im übertragenen Grundband enthalten), da das direkt übertragene Grundband eine sehr wirkungsvolle Maskierung dieser Unvollkommenheiten bewirkt. Das Grundband allein würde bereits eine, wegen der geringen Bandbreite allerdings nur bedingt verständliche, Sprachwiedergabe ermöglichen. Die zugesetzten höheren Formanten erhöhen die Verständlichi-.eit und Natürlichkeit der Sprache und erleichtern die Sprecheridentifikation (die bei Vocodern mit synthetischer A'ordnung im Syntheseteil nur sehr bedingt möglicht ist).
Die Ausgangssignale des Analyseteils des Vocoders werden zunächst digitalisiert und anschließend in einem
■i) Multiplexer in einem seriellen Strom binärer Daten umgeformt. Der Einsatz des Multiplexers ist beispielsweise aus den erwähnten »Proceedings of the IEEE«, Bild 6 und 7 auf den Seiten 724 und 725, ersichtlich. Der resultierende digitale Bitstrom (PCM) wird zum
Empfänger übertragen. Hierzu ist bei der Übertragung über einen Telefonkanal sende- und empfangsseitig ein »Modem« (Abkürzung für »Modulator-Demodulator«) erforderlich, um das zu übertragende PCM-Signal anzupassen. Die eigentliche Übertragung erfolgt beispielsweise in Form eines frequenz- oder phasenuinge· tasteten Signals. Einzelheiten hierzu können beispielsweise dem Buch »Principles of Data Communication«. R. W. Lucky, J.Salz und E. J. Weldon, Mc Graw-Hill Book Company, New York, San Francisco,
M) Toronto, London, Sidney, 1968, entnommen werden. Auf der Empfangsseite erfolgt im Modem die Rück'imwandlung in das binäre Datensignal und die Serien-Parallel-Wandlung mittels eines Demultiplexers, bevor die einzelnen Teilsignale den entsprechenden Stellen im
bi Syntheseteil zugeführt werden.
Der Erfindung liegt die Aufgabe zugrunde, bei einem Semi-Formantvocoder das Problem der Synchronisierung zu lösen.
Diese Aufgabe wird bei einem Verfahren zum Synchronisieren eines Semi-Formantvocodeni, bei dem das Multiplexsignal in Rahmen zusammengefaßte digitale Informationen über das Sprachsignal mit seinen Formanten enthält, erfindungsgemäß dadurch gelöst, daß aus mehreren Rahmen ein Überrahmen gebildet wird, bei dem in einem Rahmen sendeseitig die Information über den Formanten mit der höchsten Frequenz durch ein Synchronisiersignal ersetzt wird und bei dem empfangsseitig dieses Synchronisiersignal ausgewertet und durch die gespeicherte Information über den Formanten mit der höchsten Frequenz aus dem vorhergehenden Rahmen ersetzt wird.
Das digitale binäre Signal muß eine Rahmenstruktur aufweisen, um die Teilinformationen über die einzelnen Formanten und über das Grundband auf der Empfangsseile wieder trennen zu können. Beginn und Elnde eines Pulsrahmens müssen eindeutig erkennbar sein. Hierzu ist eine Rahmensynchronisation notwendig. Werden dem Pulsstrom zusätzliche Synchronisierbits zugesetzt, so steigt die Bitratc an. was aus Gründen der verfügbaren begrenzten Übertragungsbandbreite unerwünscht ist. Wird andererseits die Bitrate nicht erhöht, so muß ein Teil der verfügbaren bit/s für Synchronisierzwecke verwendet werden; dieser Anteil steht für die Übertragung der Analysesignale dann nicht mehr zur Verfügung, was ebenfalls nachieilig ist. Wird dagegen .i'ä dritte Möglichkeit laufend in bestimmten Abständen ein Teil der dem zu übertragenen <■ pracnsignal zugeordneten Bits einfach durch Synchronisierbits ersetzt, so sind diese Bits und damit die betroffenen zu übertragenden Abtastwerte der Sprachinformation verfälscht, was sich im allgemeinen als Qualitätsverminderung im Sprachsignal am Ausgang des empfangsseitigen Syntheseteils des Semi-Formantvocoders auswirkt.
Bei der Erfindung wird von der Erkenntnis ausgegangen, daß zum einen die Wegnahme von Informationsbits beim Formanten mit der höchsten Frequenz die Qualität des Sprachsignals am wenigsten beeinträchtigt und daß zum anderen der Ersatz der zeitweise ausbleibenden Information über den Formanten mit der höchsten Frequenz durch die Information über den Formanten mit der höchsten Frequenz aus dem vorhergehenden Rahmen den Qualitätsverlust der Sprache weitgehendst ausgleicht.
Wie bereits erläutert wurde und auch aus dem schon genannten Buch »Speech Analysis. Syathesis and Perception«. Seite 348, ersichtlich ist, genügt es bei einem Semi-Formantvocoder bereits eine unvollkommene Nachbildung der Sprache im Bereich der höheren Formanten im Syntheseteil, um ein natürlich klingendes Sprachsignal guter Verständlichkeit erzeugen zu können. Dabei wird, wie Versuche zeigen, die Qualität der Nachbildung mit wachsender Ordnung des Formanten unkritischer. Dies hängt teilweise auch damit zusammen, daß bei den höherfrequenten Formanten eine nennenswerte Energie im Spektrum vorwiegend nur noch bei stimmlosen Lauten (mit rauschartiger Anregung) auftritt. Diese Eigenschaft der Sprache ist beispielsweise auch dem bereits genannten Buch »Speech Analysis, Synthesis and Perception«, Seite 175, Figur 5.27, zu entnehmen.
Wird daher die Nachbildung nur des höchsten übertragenen Formanten, und auch diese nur gelegentlich, nämlich so oft wie zu Synchronisationszwecken not!17, verfälsch* so wird die ^usthtät des svnthet!S!erten Sprachsignals nicht unerträglich beeinflußt. Da sich die Formantfrequenzen und -amplituden ferner zeitlich nur langsam ändern (das .Sprachsignal ist ein 'quasistationärer' Vorgang) ist eine weitere Verbesserung dadurch erzielbar, daß zur Synthese des Sprachsignals die durch die Synchronisierinformation verfä|<:rhtpn Rits Hurrh die entsprechenden, dem höchsten übertragenen Formanten zugeordneten, Bits der vorhergehenden Rahmens ersetzt werden, welche zu diesem Zweck über die Dauer eines Rahmens zwischcngespcichert wurden. Da sich über die Dauer eines Rahmens das Sprachsignal nur wenig ändert, wird sich auch die Frequenz und Amplitude des höchsten Formanten nur wenig peil "der! haben, so daß auch die Synthese des nöchstcn Formanten noch nahezu richtig ist. Diese Ersatz wirkt sich näherungsweise so aus, als ob bezüglich des höchsten Formanten die Dauer des Analyst intervals (beispielsweise 20 ms) gelegentlich verdoppelt wird (aul beispielsweise 40 ms), aber nur bei Auftreten der Synchronisierbits.
Eine Anordnung zur Durchfuhr'.mg des erfindung.>6c mäßen Verfahrens, die sendeseitig aus einem Analyseteil, einem Multiplexer und einem Modulator und empfarv^eitig aus einem Demodulator, einem Demultiplexer und einem Syntheseteil besteht, ist vorteilhafterweise dadurch gekennzeichnet, daß sendeseitig eir Sychronisierwortgenerator mit einem an einen Steuer ausgang des Multiplexers angeschlossenen Steuerein gang vorgesehen ist, daß sendeseitig ein erstei I Ί ischalter vorgesehen ist. dessen einer Fir,gang mil dem Ausgang des Multiplexers, dessen anderer Eingang mit dem Ausgang des Synchronisierwortgenerators unc dessen Ausgang mit dem Eingang des Modulator; verbunden sind, da3 sendeseitig ei'".· < ischaltersteue rung vorgesehen ist, deren Eingang mit einerr Steuerausgang des Multiplexers und deren Ausgang mil dem Steuereingang des ersten Umschalters verbunder sind, daß empfangsseitig eine Synchronisierwort-Erken nungsschaltung vorgesehen ist, deren Eingang mit derr Ausgang des Demodulators und deren Ausgang mil einem Synchronisiereingang des Demultiplexers ver bunden sind, daß empfangsseitig ein zweiter Umschalter vorgesehen ist. dessen einer Eingang über eir Verzögerungsglied mit dem Ausgang des Demodula tors, dessen Ausgang mit dem Eingang des Demultiplexers und dessen Steuereingang mit einem Umschalter Steuerausgang der Synchronisierwort-Erkennungs schaltung verbunden sind, und daß empfangsseitig eir Speicher vorgesehen ist, dessen Eingang einerr Ausgang des Syntheseteils für die digitale Informatior über den Formanten mit der höchsten Frequenz unc dessen Ausgang mit dem anderen Eingang des zweiter Umschalters verbunden sind.
Vorteilhaft ist es dabei, wenn als Umschalter eine Gatterschaltung vorgesehen ist
Eine Verschlüsselung des Multiplexsignals ist möglich wenn zwischen dem Ausgang des ersten Umschalten und dem Eingang des Modulators eine Verschlüsse iungseinrichtung und wenn zwischen dem Ausgang de; Demodulators und dem Eingang der Synchronisierwort Erkennungsschakung sowie dem Eingang des Verzöge rungsgliedes eine Entschlüsselungseinrichtung vorgese hen sind.
Vorteilhaft ist es dabei, wenn eine Verschlüsselungs einrichtung mit einem Synchronisiereingang vorgese hen ist, der zur Vorwärtssynchronisation mit den Ausgang des Synchronisierwortgenerators verbunder ist und wenn eine Entschlüsselungseinrichtung mi einem Synchronisiereingang vorgesehen ist, der mi einem Ausgang der Synchronisier-Erkennungsschaltunj
verbunden ist.
Anhand von Ausführungsbeispielen wird die Erfindung näher erläutert.
Fig.! zeigt ein Ausführur.gsbeispäe! eines Scrrsi-Formantvocoders,
F i g. 2 zeigt die Rahmenstruktur des Multiplexsignals und
Fi?, 3 zeigt einen mit Gattern realisierten Umschalter.
Der Semi-Formantvocoder nach Fig. 1 enthält ein Mikrofon 1, einen Analyseteil 2, einen Multiplexer 3 mit Steuerausgang 4, Takteingänge 5 und 5', einen Synchronisierwortgenerator 6, einen Umschalter 7, eine Umschaltersteuerung 8, einen Modulator 9, einen Hbertragungskanal 10, einen Demodulator 11, ein i"> Verzögerungsglied 12, einen Umschalter 13, einen Speicher 14, eine Synchronisierwort-Erkennungsschaltung 15, einen Demultiplexer 16 mit Synchronisiereingang 17, einen Syntheseteil 18 mit einem Ausgang 19 für die digitale Information über den Formanten mit der röchsten Frequenz und einen Hörer 20. Wahlweise kann nnc'i one Verschlüsselungseinrichtung 21 und eine Entschiüsselungseinrichtung 22 vorgesehen sein.
F i g. 2 zeigt ein Beispiel für zwei Multiplexsignale im selben Zeitabschnitt, wie sie an den Punkten a'und c'in Fig. 1 auftreten. Die Multiplexsignale sind in Rahmen R und Überrahmen OR gegliedert. Arabische Indices beziehen sich auf die Rahmen und römische Indices auf die Überrahmen. Jeder Rahmen R ist in diesem Beispiel in Bits für das Grundband G, einen zweiten Formanten F2 und einen dritten Formanten F3 untergliedert.
Der Semi-Formantvocoder nach Fig. 1 wirkt wie folgt:
Das zu analysierende Sprachsignal gelangt vom Mikrofon 1 zum sendeseitigen Analys°teil 2, welcher nach einem der verschiedenartigen in der bereits genannten Literatur angegebenen Prinzipien aufgebaut sein kann. Der Analyseteil 2 führt bereits die Analog-Digital-Umsetzung der ermittelten Teilsignale (Frequenzen und Amplituden der Formanten, Grundband) durch und gibt im vorliegenden Ausführungsbeispiel diese Informationen auf mehreren Leitungen parallel an den Multiplexer 3 ab. Die Informationen über die Formanten brauchen nur in größeren Abständen, ca. alle 20 ms, übertragen zu werden. Im vorliegenden Beispiel ist angenommen, daß außer dem Grundband nur Frequenz und Amplitude des zweiten und dritten Formanten übertragen werden. Dies ermöglicht die Übertragung eines auf ca. 3 kHz bandbegrenzten Sprachsignals. Bei einem breitbandigeren Signal muß- so ten mehr Formanten übertragen werden. Der Multiplexer liefert ein binäres serielles PCM-Signal an den einen Eingang a des ersten Umschalters 7. Es wäre auch ein Vertauschen der Reihenfolge von Multiplexer und Analog-Digitalumsetzung möglich.
Die Taktrate des abgegebenen PCM-Signals wird durch den Takt Γ bestimmt, der dem Mulitplexer 3 am Eingang 5 zugeführt wird. Das abgegebene PCM-Signal gelangt über den ersten Umschalter 7 an den Eingang des Modulators 9. Der Synchronisierwortgenerator 6, dem ebenfalls der Takt Γ vom Eingang 5 her zugeführt wird, gibt das Synchronisiersignal ab. Dieses Signal wird mit dem Umschalter 7 lediglich in ganz bestimmten, durch die Umschaltersteuerung 8 festgelegten, Zeiträumen in das PCM-Signal vom Multiplexer 7 eingefügt und ersetzt dort einen Teil derjenigen Bits, die die Information über die Frequenz und/oder Amplitude des höchsten Formanten tragen. Die richtige zeitliche Zuordnung wird dadurch erzwungen, daß der Synchronisierwortgenerator 6 mit einem Steuerausgang 4 des Multiplexers 3 verbunden ist, über welchen dem Synchronisierwortgenerator 6 mitgeteilt wird, wann am Multiplexerausgang die Information über den höchsten Formanten auftritt. Diese Triggerinformation vom Ausgang 4 wird gleichzeitig der Umschaltersteuerung 8 zugeführt, welche in vorbestimmten synchronen Zeiträumen veranlaßt, daß der erste Umschalter 7 von a nach b umschaltet, so daß am Punkt cdas PCM-Signal mit der gewünschten Rahmenstruktur zur Verfügung steht. Die Struktur dieses Signals ist in Fig. 2 in der oberen Zeile dargestellt.
In den mit G], G2, G\... bezeichneten Zeiträumen werden die Bits überti agen, die die Information über das Grundband enthalten. In den Zeiträumen F2 wird die Information über den zweiten Formanten, in den Zeiträumen F3 die Information über den dritten Formanten übertragen. Die hier gewählte Signalstruktur stellt lediglich eines von vielen möglichen Beispielen dar. Es könnten auch mehr Formanten übertragen werden. Auch könnte die Reihenfolge sowie die Art der Ineinanderschachtelung beim Multiplexen anders gewählt sein. Es ist beispielsweise auch eine bitweise Verschachtelung anstatt der gewählten blockweisen Verschachtelung möglich. Gi, F2i und F3) bilden den Rahmen R\, entsprechend werden die folgenden Rahmen gebildet.
Zum Zeitpunkt des Auftretens von F3? wird der erste Umschalter 7 von Position a nach Position b umgeschaltet und F3i durch das vom Synchronisierwortgenerator 6 abgegebene Synchronisiersignal S\ ersetzt. Entsprechend wird F3s durch Sw ersetzt. Damit ergeben sich die im gewählten Beispiel jeweils drei Rahmen umfassenden Überrahmen ÜR\, OR», ÜR\\\.
Das PCM-Signal gelangt vom ersten Umschalter 7 zum Eingang des Modulators 9, welcher das modulierte Signal auf den Übertragungskanal 10 gibt.
Auf der Empfangsseite gelangt das übertragene Signal auf den Eingang des Demodulators 11, der an seinem Ausgang wiederum das PCM-Signal mit der ir. Fig.2, obere Zeile, dargestellten Struktur an den Eingang des Verzögerungsgliedes 12, sowie an den Eingang der Synchronisierwort-Erkennungsschaltung 15 abgibt. Beim Eintreffen des Synchronisierwortes (S], Sw, ... in Fig. 2) veranlaßt die Schaltung 15, welcher vom Anschluß 5' der Bittakt T zugeführt wird, das Umschalten des zweiten Umschalters 13 von Position a' nach Position b'. In diesem Zeitraum erhält der Umschalter 13 vom Speicher 14 die zwischengespeicherte digitale Information über den höchsten Formanten aus dem vorhergehenden Rahmen. Diese Information wurde dem Speicher 14 vorher vom Ausgang 19 des Syntheseteils 18 zugeführt. Am Punkt c'des Umschalters 13 erscheint daher das in der unteren Zeile von F i g. 2 dargestellte Signal, in welchem letztlich F3i durch F3| und F3s durch F34 ersetzt ist Dieses Signal wird dem Demultiplexer 16 zugeführt Die Synchronisierwort-Erkennungsschaltung 15 synchronisiert den Demultiplexer 16 über den Eingang 17. Der Demultiplexer 16 erhält ebenfalls den Bittakt T vom Anschluß 5'. Das Verzögerungsglied 12 hat die Aufgabe, der Synchronisierwort-Erkennungsschaltung 15 rechtzeitig die Erkennung der Synchronisierinformation zu ermöglichen, aufgrund welcher der Umschalter 13 betätigt wird.
An den Ausgängen des Demultiplexers erscheinen wiederum die das Grundband und die Formaten, im
gewählten Beispiel den zweiten und dritten Formanten, beschreibenden digitalen Teilsignale. Diese werden zum Syntheseteil 18 geleitet, der das synthetisierte Sprachsignal dem Hörer 20 zuführt.
Bei Einsatz einer sendeseitigen Verschlüsselungseinrichtung, in Fig. i mit 21 bezeichnet, zwischen dem Ausgang cdes ersten Umschalters 7 und dem Eingang des Modulators 9, sowie einer empfangsseitigen Entschlüsselungseinrichtung, in F i g. 1 mit 22 bezeichnet, zwischen dem Ausgang des Demodulators Il und dem Eingang des Verzögerungsgliedes 12, besteht die Möglichkeit, das im PCM-Signal enthaltene Synchronisiersignal gleichzeitig sendeseitig zur Vorwärtssynchronistaion der Verschlüsselungseinrichtung 21 und emp-
10
fangsseitig zur Synchronisation der zugehörigen Entschlüsselungseinrichtung 22 mit zu benutzen. Hierzu wird der Verschlüsselungseinrichtung 21 das Synchronisiersignal vom Synchronisierwortgenerator 6 zugeführt, der Entschlüsselungseinrichtung 22 wird dieses Signal von der Synchronisierwort-Erkennungsschaltung 15 zugeführt. Dieser Fall ist in Fig. 1 gestrichelt eingezeichnet.
Fig.3 zeigt eine als Umschalter wirkende Gatterschaltung. Sie enthält zwei UND-Gatter 23 und 24, einen Inverter 25 und ein ODER-Gatter 26. Diese Anordnung wirkt wie einer der Umschalter 7 und 13 und kann diese ersetzen.
Hierzu 2 Blatt Zeichnungen

Claims (5)

Patentansprüche:
1. Verfahren zum Synchronisieren eines Semi-Formantvocoders, bei dem das Multiplexsignal in Rahmen zusammengefaßte digitale Informationen über das Sprachsignal mit seinen Formanten enthält, dadurch gekennzeichnet, daß aus mehreren Rahmen ein Überrahmen gebildet wird, bei dem in einem Rahmen sendeseitig die Information über den Formanten mit der höchsten Frequenz durch ein Synchronisiersignal ersetzt wird und bei dem empfangsseitig dieses Synchronisiersignal ausgewertet und durch die gespeicherte Information über den Formanten mit der höchsten Frequenz aus dem vorhergehenden Rahmen ersetzt wird.
2. Anordnung zur Durchführung des Verfahrens nach Anspruch 1, die sendeseitig aus einem Analyseteil, einem Multiplexer und einem Modulator und empfangsseitig aus einem Demodulator, einem Demultiplexer und einem Syntheseteil besteht, dadurch gekennzeichnet, daß sendeseitig ein Synchronisierwortgenerator (6) mit einem an einen Steuerausgang (4) des Multiplexers (3) angeschlossenen Steuereingang vorgesehen ist, daß sendeseitig ein erster Umschalter (7) vorgesehen ist, dessen einer Eingang (a)mh dem Ausgang des Multiplexers (3), dessen anderer Eingang (b) mit dem Ausgang des Synchronisierwortgenerators (6) und dessen Ausgang (c) mit dem Eingang des Modulators (9) verbunden sind, daß sendeseitig eine Umschaltersteuerung {%,) vorgesehen ist, deren Eingang mit einem Steuerausgang /4) des Multiplexers (3) und deren Ausgang mit dem Steuereingang (u)des ersten Umschalters (7) verbunden sind, 'iaß empfangsseitig eine Synchronisierwort-Erkennungsschaltung (15) vorgesehen ist, deren Eingang mit dem Ausgang des Demodulators (11) und deren Ausgang mit einem Synchronisiereingang (17) des Demultiplexers (16) verbunden sind, daß empfangsseitig ein zweiter Umschalter (13) vorgesehen ist, dessen einer Eingang (a') über ein Verzögerungsglied (12) mit dem Ausgang des Demodulators (11), dessen Ausgang (c') mit dem Eingang des Demultiplexers (16) und dessen Steuereingang (u') mit einem Umschaltersteuerausgang der Synchronisierwort-Erkennungsschaltung (15) verbunden sind, und dsiß empfangsseitig ein Speicher (14) vorgesehen tut, dessen Eingang mit einem Ausgang (19) des Syntheseteils (18) für die digitale information über den Formanten mit der höchsten Frequenz und dessen Ausgang mit dem anderen Eingang (b') des zweiten Umschalters (13) verbunden sind (Fi g. I).
3. Anordnung nach Anspruch 2, dadurch gekennzeichnet, daß als Umschalter eine Gatterschaltung vorgesehen ist (F i g. 3). «
4. Anordnung nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß zwischen dem Ausgang (c)des ersten Umschalters (7) und dem Eingang des Modulators (9) eine Verschlüsselungseinrichtung (21) und zwischen dem Ausgang des Demodulators (11) und dem Eingang der Synchronisierwort-Erkennungsschaltung (15) sowie dem Eingang di:s Verzögerungsgliedes (12) eine Entschlüsselungseinrichtung (22) vorgesehen sind (F i g. 1).
5. Anordnung nach Anspruch 4, dadurch gekennzeichnet, daß die Verschlüsselungseinrichtung (21) einen Synchronisiereingang aufweist, der zur Vorwärtssynchronisation mit dem Ausgang des Synchronisierwortgenerators (6) verbunden ist, und daß die Entschlüsselungseinrichtung (22) einen Synchronisiereingang besitzt, der mit einem Ausgang der Synchronisierwort-Erkennungsschaltung (15) verbunden ist (F ig. 1).
DE19762659674 1976-12-30 1976-12-30 Verfahren und Anordnung zum Synchronisieren eines Semi-Formantvocoders Expired DE2659674C3 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19762659674 DE2659674C3 (de) 1976-12-30 1976-12-30 Verfahren und Anordnung zum Synchronisieren eines Semi-Formantvocoders

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19762659674 DE2659674C3 (de) 1976-12-30 1976-12-30 Verfahren und Anordnung zum Synchronisieren eines Semi-Formantvocoders

Publications (3)

Publication Number Publication Date
DE2659674A1 DE2659674A1 (de) 1978-07-20
DE2659674B2 DE2659674B2 (de) 1978-10-26
DE2659674C3 true DE2659674C3 (de) 1979-07-12

Family

ID=5997101

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19762659674 Expired DE2659674C3 (de) 1976-12-30 1976-12-30 Verfahren und Anordnung zum Synchronisieren eines Semi-Formantvocoders

Country Status (1)

Country Link
DE (1) DE2659674C3 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6208959B1 (en) 1997-12-15 2001-03-27 Telefonaktibolaget Lm Ericsson (Publ) Mapping of digital data symbols onto one or more formant frequencies for transmission over a coded voice channel

Also Published As

Publication number Publication date
DE2659674B2 (de) 1978-10-26
DE2659674A1 (de) 1978-07-20

Similar Documents

Publication Publication Date Title
EP0290581B1 (de) Verfahren zum übertragen digitalisierter tonsignale
DE3023375C1 (de)
DE3041423C1 (de) Verfahren und Vorrichtung zur Verarbeitung eines Sprachsignals
EP0193143B1 (de) Verfahren zur Übertragung eines Audiosignals
DE69910240T2 (de) Vorrichtung und verfahren zur wiederherstellung des hochfrequenzanteils eines überabgetasteten synthetisierten breitbandsignals
DE69916756T2 (de) Tonverarbeitungverfahren und Vorrichtung zur Anpassung eines Hörgerätes für Hörbehinderte
EP1386307B2 (de) Verfahren und vorrichtung zur bestimmung eines qualitätsmasses eines audiosignals
EP2245621B1 (de) Verfahren und mittel zur enkodierung von hintergrundrauschinformationen
EP0251028B1 (de) Verfahren zur Übertragung eines Audiosignales
DE2626793A1 (de) Verfahren zur bewertung stimmhafter und stimmloser zustaende eines sprachsignals
EP0464534B1 (de) Transformationskodierer mit adaptiver Fensterfunktion
DE2609297C3 (de) Übertragungssystem für Gesprächssignale
DE4343366C2 (de) Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen
EP0370277A2 (de) Subband-Übertragungssystem
DE2659674C3 (de) Verfahren und Anordnung zum Synchronisieren eines Semi-Formantvocoders
DE3138523A1 (de) Verfahren zur abhoersicheren frequenzbandkomprimierten uebertragung von sprachsignalen
DE1151285B (de) Nachrichtenuebertragungssystem fuer Sprache mit Herabsetzung der Bandbreite
DE2826818C2 (de) Verfahren und Vorrichtung zum Erzeugen eines künstlichen Durchschnitts-Sprechsignals
DE2855395C2 (de) Nachrichtenübertragungssystem
DE60210766T2 (de) Adpcm sprachkodiersystem mit phasenfaltungs und -entfaltungsfiltern
DE3102822A1 (de) Verfahren zur frequenzbandkomprimierten sprachuebertragung
DE102013005844B3 (de) Verfahren und Vorrichtung zum Messen der Qualität eines Sprachsignals
DE2152280C3 (de) Sprach-Multiplex-Vorrichtung zur Mehrfachnutzung von Fernsprechkanälen
DE1926362C (de) Einrichtung zur Sprachanalyse und synthe se nach dem Vocoderpnnzip
DE2834349C2 (de) Formantvocoder

Legal Events

Date Code Title Description
OAP Request for examination filed
OD Request for examination
C3 Grant after two publication steps (3rd publication)
8339 Ceased/non-payment of the annual fee