EP1181685A1 - Method and arrangement for speech coding, using phonetic decoding and the transmission of speech characteristics - Google Patents

Method and arrangement for speech coding, using phonetic decoding and the transmission of speech characteristics

Info

Publication number
EP1181685A1
EP1181685A1 EP00941925A EP00941925A EP1181685A1 EP 1181685 A1 EP1181685 A1 EP 1181685A1 EP 00941925 A EP00941925 A EP 00941925A EP 00941925 A EP00941925 A EP 00941925A EP 1181685 A1 EP1181685 A1 EP 1181685A1
Authority
EP
European Patent Office
Prior art keywords
data
data signals
transmitter
receiver
transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP00941925A
Other languages
German (de)
French (fr)
Inventor
Christoph Rohe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of EP1181685A1 publication Critical patent/EP1181685A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0018Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis

Definitions

  • the invention relates to a method for transmitting data signals with individual features, in particular voice signals, according to the preamble of claim 1, and to an arrangement for transmitting data signals with individual features, in particular voice signals, according to the preamble of claim 7.
  • Voice transmission is one of the most important, if not the most important, telecommunications service.
  • voice transmission is one of the most important, if not the most important, telecommunications service.
  • due to the limited resources there is the requirement, on the one hand, to manage with the lowest possible transmission rates, and, on the other hand, the relatively poorer and strongly changing transmission properties, as compared to wired transmission, generally result in relatively high error rates.
  • redundancy reduction eliminates redundant signal contents before transmission, the identification of which is based on prior knowledge of certain (for example statistical) parameters of the signal. If these redundant signal components are re-imprinted on the signal after transmission, there is no transmission-related loss of quality. With the irrelevance reduction, signal components are eliminated before the transmission, which is assumed to be for the receiver are irrelevant. If one chooses the option of not re-impressing these signal components after transmission, there are objective differences between the speech signal generated on the receiver side and the original speech signal, but these are accepted or (at best) cannot be heard.
  • Waveform encoding in which the analog speech signal is digitized on the transmitter side and an error-free conversion of an analog signal on the receiver side, and in which bit rates of approximately 16 kbit / s up to 64 kbit / s an acceptable speech quality is achieved, or on the principle of parametric representation (vocoder principle), with which the bit rate is reduced (to 400 bit / s to 5 kbit / s), which is generally only of limited satisfaction is achieved.
  • the speech signal is segmented into small sections during which the speech signal changes only insignificantly and can be characterized by certain excitation or filter parameters. It is not the actual signal that is transmitted, but rather the sequence of the excitation or filter parameters. Individual characteristics of the language (emphasis, accents and sentence melody) can only be transferred to a very limited extent with this method.
  • the invention includes the basic technical idea of separating individual features from the overall data signals on the transmitter side and separately transmitting the remaining, standardized (and compressed) data signals on the one hand and the individualization data corresponding to the individual features on the other. Depending on the specific application, this separate transmission can also take place at different times or essentially simultaneously.
  • a knowledge base regarding the individual features can be built up in advance on the receiver side, from which a re-impression of the individual features is then disputed after the transmission of the standardized data signals.
  • an e-recipient knowledge base with respect to the individual characteristics in the course of the transmission successively built up, in particular in access to a corresponding transmitter knowledge base.
  • this access to the transmitter-side knowledge base is controlled in such a way that the prioritized transmission of the standardized, compressed data signals as the main information carrier is not disturbed - ie in the case of speech transmission, in particular m speech pauses or sections of pronounced word stretching or m times, m those a higher channel bandwidth is available.
  • the individual features are separated from the overall data signal m in a coder / decoder unit, the decoder part of which corresponds to the decoder provided on the receiver side for the data signal coded on the transmitter side, a delay stage connected in parallel with this unit and one with the Outputs of both components connected unit for obtaining a suitably structured difference signal between the total data signal present at the transmitter input and the normalized data signal after passing the codec.
  • a coder / decoder unit the decoder part of which corresponds to the decoder provided on the receiver side for the data signal coded on the transmitter side
  • a delay stage connected in parallel with this unit and one with the Outputs of both components connected unit for obtaining a suitably structured difference signal between the total data signal present at the transmitter input and the normalized data signal after passing the codec.
  • the transmitter has speech recognition means known per se for converting speech m, the data signals m in the form of characters and the receiver speech synthesis means for synthesizing acoustically outputable speech from the signs.
  • speech recognition means known per se for converting speech m
  • the data signals m in the form of characters
  • the receiver speech synthesis means for synthesizing acoustically outputable speech from the signs.
  • the proposed arrangement is not only suitable for voice communication, but in principle for any transmission averaging of signals with individual characteristics, for example also for the compressed transmission of manuscripts or images with artistic "handwriting" (paintings, graphics etc.).
  • the delay stage provided in the preferred embodiment of the separation means is m adaptation to the signal processing by the transmitter, i.e. the coding / decoding and, if necessary, speech analysis, conditional current running time preferably controllable in its delay time. This can result in a considerable saving of time in signal processing as a whole, since the assumption of a fixed signal transit time for the processing operations associated with the separation of the individual features had to be adapted to the "worst case" of a data signal sequence which requires a maximally time-consuming processing.
  • Receivers an individual feature knowledge base connected on the input side to the separating means and on the output side at least indirectly with an input of the speech synthesis means for storing individual features in association with the associated characters as a representation of the standardized data signals.
  • the transmitter contains a first such knowledge base and the receiver contains a second such knowledge base, and control means are provided for the transmission of new data sets to supplement the memory content of the second knowledge base from the inventory of the first, which enable efficient and secure transmission of the ensure appropriate individualization data via the separate channel.
  • Their transmission takes place, in particular, with a lower priority than the standardized data signals, especially during breaks in the transmission of the latter.
  • the figure only shows the components essential for the explanation of the invention, while the usual components of a mobile radio transmission or reception part are omitted here for the sake of clarity.
  • the sound waves recorded with a microphone 7 are - if necessary after preprocessing, which are used for amplification and / or filtering
  • False suppression includes - digitized in an A / D converter 9, and at the output of the A / D converter 9 the signal path in a node 11 m splits two partial paths.
  • a first partial path 13a the digitized speech signal is first subjected to a speech recognition algorithm (known per se) and a speech recognition stage 15, the received speech signals being converted into m characters, and then subjected to coding m in an encoder 17.
  • the specific code used for each of the previously formed characters depends on its predecessor, since the probability of a syllable or a word and also its emphasis is dependent on the preceding one.
  • the coded characters are prepared in a transmission stage which is known per se and therefore not shown in the figure, and is sent to the receiver via a first logical channel CH1, where it is initially transmitted in a reception stage which is likewise known and is therefore omitted here HF-preprocessed and possibly also in accordance with the regulations of a special mobile radio protocol by despreading, descrambling or the like and then fed to a speech decoder 19.
  • the further signal processing on the egg chip side is described below.
  • the coded speech data available at the output of the transmitter-side encoder 17 are not only transmitted to the receiver, but are also immediately decoded again in a transmitter-side speech decoder 21 that corresponds functionally to the receiver-side speech decoder 19.
  • a transformation into an n-dimensional state space then takes place in a first transformation stage 23a using algorithms known per se.
  • the signal branched off in the node 11 in the second partial signal path 13b is also subjected to a corresponding transformation in a second transformation stage 23b after it has undergone a delay in a delay stage 25 which is synchronized with the signal propagation time in the first partial signal path 13a.
  • the data signal present at the input of the first transformation stage is a standardized speech signal reduced by the process of coding and subsequent decoding in stages 17, 21, while it is the data signal present at the input of the second transformation stage 23 is still the - only suitably delayed - total data signal.
  • the delay time impressed by the delay stage 25 is controlled in adaptation to the running time in the processing chain of stages 15, 17 and 21; in the figure is (somewhat simplified) a control depending on the result of the speech recognition, i.e. that is, starting from speech recognition level 15.
  • Signal paths 13a, 13b can uniquely assign these individual features to the characters obtained in the result of the speech recognition and can be stored in this assignment m in an individual feature knowledge base 29 on the transmitter side.
  • the individualization data presenting the individual features are transmitted to the receiver 5 via a separate, second logical channel CH2, at the beginning and end of which there is a codec 31, 33.
  • This data is initially received in the receiver using a special control channel
  • CH3 in a comparator and memory control stage (not shown in the figure) is checked as to whether or not they are already contained in a receiver-side individual feature knowledge base 35. If this is not the case, they are stored in the knowledge base 35 on the receiver side - again m assignment to the corresponding characters of the standardized speech signals (transmitted separately to the receiver 5).
  • the receiver-side knowledge base 35 is thus “tracked” in its data stock of the transmitter-side knowledge base 29, so that only information regarding the individual characteristics that does not already exist in the receiver-side knowledge base 35 has to be transmitted via the separate channel. The amount of data to be transmitted here can therefore be kept comparatively small.
  • the individualization data Since the individualization data also have practically no indispensable information value, they are transmitted with lower priority than the standardized speech signals. This data can be transmitted, for example, only during the speech pauses or m word intervals with strong word stretching.
  • the proposed solution therefore requires a separate logical data channel, but no additional channel resources.
  • the transmission of the individualization data separate from the standardized speech data in connection with the provision of a "learning" knowledge base for the individualization data at least in the receiver (preferably m transmitter and receiver) is even achieved 9 a strong reduction in the required transmission bandwidth despite achieving a relatively high voice quality (which of course depends on the effort involved in processing the individualization features).
  • the individualization data available in the receiver-side individual feature knowledge base 35 - again synchronized with the normalized speech signal data leaving the decoder 19 - are fed to a speech synthesis unit ("voice generator") 37, where the standardized speech signals are linked with the individualization data and with their output an acoustic output unit 39 is connected for sound conversion.
  • voice generator speech synthesis unit
  • the mode of operation of the speech synthesis unit 37 and the output unit 39 are known per se and are therefore not explained further here;
  • a special feature of the speech synthesis unit 37 is the additional input for the individualization data and the implementation of an algorithm suitable for linking this individualization data with the standardized speech signals.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

The invention relates to a method and arrangement (1) for transmitting data signals containing individual characteristics, in particular speech signals. Said method and arrangement comprise a transmitter (3) and a receiver (5). The transmitter has compartmentation elements (15 to 27) for separating the individual characteristics from the data signals, in addition to elements for separately transmitting both the data signals which have been stripped from the individual characteristics and have been normed and compressed and the individualisation data, using separate logical channels (CH1, CH2).

Description

Beschreibung description
VERFAHREN UND ANORDNUNG ZUR SPRACHKODIERUNG MITTELS PHONETISCHE DEKODIERUNG UND ÜBERTRAGUNG VON SPRECHERMERKMALEN UILKUUU unuMETHOD AND ARRANGEMENT FOR SPEECH CODING BY PHONETIC DECODING AND TRANSMISSION OF SPEAKER CHARACTERISTICS UILKUUU unu
Die Erfindung betrifft ein Verfahren zur Übertragung von mit Individualmerkmalen behafteten Datensignalen, insbesondere von Sprachsignalen, nach dem Oberbegriff des Anspruches 1 so- wie eine Anordnung zur Übertragung von mit Individualmerkmalen behafteten Datensigalen, insbesondere von Sprachsignalen, nach dem Oberbegriff des Anspruches 7.The invention relates to a method for transmitting data signals with individual features, in particular voice signals, according to the preamble of claim 1, and to an arrangement for transmitting data signals with individual features, in particular voice signals, according to the preamble of claim 7.
Die Sprachübertragung ist einer der wichtigsten - wenn nicht noch immer der wichtigste - Telekommunikationsdienst. Speziell bei der mobilen Kommunikation besteht aufgrund der begrenzten Ressourcen zum einen die Forderung, mit möglichst geringen Übertragungsraten auszukommen, und zum anderen bedingen die im Vergleich zu einer leitungsgebundenen Übertra- gung in der Regel wesentlich schlechteren und stark wechselnden Übertragungseigenschaften relativ hohe Fehlerraten.Voice transmission is one of the most important, if not the most important, telecommunications service. In the case of mobile communication in particular, due to the limited resources, there is the requirement, on the one hand, to manage with the lowest possible transmission rates, and, on the other hand, the relatively poorer and strongly changing transmission properties, as compared to wired transmission, generally result in relatively high error rates.
Im Zuge der Entwicklung der mobilen Sprachkommunikation hat daher von Anfang an die Reduktion der Datenrate bei gleich- zeitig weitgehender Resistenz gegenüber den relativ hohen Fehlerraten ein wesentliches Entwicklungsziel dargestellt. Eine Datenreduktion kann, allgemein betrachtet, aufgrund zweier unterschiedlicher Herangehensweisen erfolgen: der Redundanzreduktion und der Irrelevanzreduktion. Die Redundanz- reduktion beseitigt vor der Übertragung redundante Signalinhalte, deren Identifizierung aufgrund der Vorkenntnis von bestimmten (beispielsweise statistischen) Parametern des Signals beruht. Wenn diese redundanten Signalanteile dem Signal nach der Übertragung wieder aufgeprägt werden, gibt es kei- nerlei übertragungsbedingten Qualitätsverlust . Bei der Irrelevanzreduktion werden vor der Übertragung Signalanteile beseitigt, von denen man unterstellt, daß sie für den Empfänger irrelevant sind. Wählt man hierbei die Möglichkeit, auf eine Wiederaufpragung dieser Signalanteile nach der Übertragung zu verzichten, ergeben sich objektiv Unterschiede des auf der Empfangerseite erzeugten Sprachsignals zum ursprünglichen Sprachsignal, diese werden aber hingenommen oder sind (bestenfalls) vom Gehör nicht wahrzunehmen.In the course of the development of mobile voice communication, reducing the data rate while at the same time being largely resistant to the relatively high error rates has been an essential development goal. Generally speaking, data reduction can take place on the basis of two different approaches: the redundancy reduction and the irrelevance reduction. The redundancy reduction eliminates redundant signal contents before transmission, the identification of which is based on prior knowledge of certain (for example statistical) parameters of the signal. If these redundant signal components are re-imprinted on the signal after transmission, there is no transmission-related loss of quality. With the irrelevance reduction, signal components are eliminated before the transmission, which is assumed to be for the receiver are irrelevant. If one chooses the option of not re-impressing these signal components after transmission, there are objective differences between the speech signal generated on the receiver side and the original speech signal, but these are accepted or (at best) cannot be heard.
Im Zuge der explosionsartigen Verbreitung der mobilen Kommunikation erhohen sich auch die Ansprüche an die Qualität der Sprachübertragung. Gleichlaufend verschärft sich andererseits grundsätzlich das Problem der Begrenztheit der Kanalressourcen. Die Entwicklung immer besserer Verfahren und Anordnungen zur Datenreduktion bzw. -kompression bei der Sprachubertra- gung ist daher eine nach wie vor hochaktuelle Entwicklungs- aufgäbe.In the course of the explosion of mobile communication, the demands placed on the quality of voice transmission are increasing. Simultaneously, on the other hand, the problem of the limitation of channel resources is fundamentally exacerbated. The development of ever better methods and arrangements for data reduction or compression in voice transmission is therefore still a highly topical development task.
Bekannte digitale Sprachcoder beruhen entweder auf dem Prinzip der Signalformcodierung ("Waveform Encodmg"), bei dem das analoge Sprachsignal auf der Senderseite digitalisiert und auf der Empfangerseite möglichst fehlerfrei m ein analoges Signal umgewandelt wird und bei dem mit Bitraten von ca. 16 kbit/s bis 64 kbit/s eine akzeptable Sprachqualitat erreicht wird, oder auf dem Prinzip der parametrischen Darstellung (Vocoder-Prinzip) , bei dem mit deutlich (auf 400 bit/s bis 5 kbit/s) reduzierter Bitrate eine in der Regel nur bedingt zufriedenstellende Sprachqualitat erreicht wird. Beim letzteren Verfahren erfolgt eine Segmentierung des Sprachsignals in kleine Abschnitte, während derer sich das Sprachsignal nur unwesentlich ändert und durch bestimmte Anregungs- bzw. Filterparameter charakterisiert werden kann. Hierbei wird nicht das eigentliche Signal, sondern die Folge der An- regungs- bzw. Filterparameter übertragen. Individuelle Merkmale der Sprache (Betonung, Akzente und Satzmelodie) sind mit diesem Verfahren nur sehr bedingt übertragbar.Known digital speech encoders are based either on the principle of waveform encoding ("waveform encoding"), in which the analog speech signal is digitized on the transmitter side and an error-free conversion of an analog signal on the receiver side, and in which bit rates of approximately 16 kbit / s up to 64 kbit / s an acceptable speech quality is achieved, or on the principle of parametric representation (vocoder principle), with which the bit rate is reduced (to 400 bit / s to 5 kbit / s), which is generally only of limited satisfaction is achieved. In the latter method, the speech signal is segmented into small sections during which the speech signal changes only insignificantly and can be characterized by certain excitation or filter parameters. It is not the actual signal that is transmitted, but rather the sequence of the excitation or filter parameters. Individual characteristics of the language (emphasis, accents and sentence melody) can only be transferred to a very limited extent with this method.
Die relativ schlechte, unnaturlich klingende Sprachubertra- gung mit Vocodern hat Anlaß zur Entwicklung sogenannter hy- 3 brider Codierer gegeben, bei denen ein Teilbereich des Sprachfrequenzbandes (bevorzugt der Tieftonbereich) mittels Signalformcodierung und der verbleibende Bereich aufgrund des Vocoder-Prinzips übertragen wird. Hiermit wird eine etwas verbesserte Sprachqualität auf Kosten einer deutlich höheren Übertragungsrate möglich.The relatively poor, unnaturally sounding voice transmission with vocoders has given rise to the development of so-called hy 3 brider coders are given, in which a partial area of the speech frequency band (preferably the low-frequency area) is transmitted by means of signal form coding and the remaining area on the basis of the vocoder principle. This enables a somewhat improved voice quality at the expense of a significantly higher transmission rate.
Es ist daher Aufgabe der Erfindung, ein verbessertes gattungsgemäßes Verfahren sowie eine entsprechende Anordnung an- zugeben, mit denen eine qualitativ hochwertige, individuelle Eigenart der Sprache weitgehend berücksichtigende Sprachübertragung möglich ist, wobei eine besonders niedrige Übertragungsrate erreicht werden soll.It is therefore an object of the invention to provide an improved generic method and a corresponding arrangement with which a high-quality, individual characteristic of the language largely taking into account voice transmission is possible, with a particularly low transmission rate being achieved.
Diese Aufgabe wird durch ein Verfahren mit den Merkmalen des Anspruchs 1 bzw. - hinsichtlich ihres Vorrichtungsaspekts - durch eine Anordnung mit den Merkmalen des Anspruchs 7 gelöst.This object is achieved by a method with the features of claim 1 or - with regard to its device aspect - by an arrangement with the features of claim 7.
Die Erfindung schließt den grundlegenden technischen Gedanken ein, senderseitig eine Abtrennung von Individualmerkmalen aus den Gesamt-Datensignalen sowie eine separate Übertragung der verbleibenden, normierten (und komprimierten) Datensignale einerseits und der den Individualmerkmalen entsprechenden In- dividualisierungsdaten andererseits vorzunehmen. In Abhängigkeit vom konkreten Anwendungsfall kann diese separate Übertragung auch zu unterschiedlichen Zeitpunkten oder aber im wesentlichen gleichzeitig erfolgen. Im ersteren Fall kann auf der Empfängerseite eine Wissensbasis bezüglich der Indivi- dualmerkmale vorab aufgebaut werden, aus der nach der Übertragung der normierten Datensignale dann eine Wiederaufprä- gung der Individualmerkmale bestritten wird. Im letzteren Fall kann unter Umständen auf eine empfängerseitige Wissens- basis bezüglich der Individualmerkmale verzichtet werden.The invention includes the basic technical idea of separating individual features from the overall data signals on the transmitter side and separately transmitting the remaining, standardized (and compressed) data signals on the one hand and the individualization data corresponding to the individual features on the other. Depending on the specific application, this separate transmission can also take place at different times or essentially simultaneously. In the former case, a knowledge base regarding the individual features can be built up in advance on the receiver side, from which a re-impression of the individual features is then disputed after the transmission of the standardized data signals. In the latter case, it may be possible to dispense with a receiver-based knowledge base regarding the individual characteristics.
In einer bevorzugten Lösung, die gewissermaßen zwischen diesen beiden Extremfällen angesiedelt ist, wird eine e pfänger- seitige Wissensbasis bezuglich der Individualmerkmale im Zuge der Übertragung sukzessive aufgebaut, und zwar insbesondere im Zugriff auf eine entsprechende senderseitige Wissensbasis. Dieser Zugriff auf die senderseitige Wissensbasis wird in ei- ner bevorzugten Ausfuhrung so gesteuert, daß die priorisierte Übertragung der normierten, komprimierten Datensignale als Haupt-Informationstrager nicht gestört wird - d.h. bei einer Sprachubertragung insbesondere m Sprechpausen oder Abschnitten ausgeprägter Wortdehnung oder m Zeiten, m denen eine höhere Kanalbandbreite zur Verfugung steht. In einer zweckmäßigen Ausfuhrung erfolgt die Separierung der Individualmerkmale vom Gesamt-Datensignal m einer Codierer/Decoder-Em- heit, deren Decoderteil dem e pfangerseitig vorgesehenen Decoder für das senderseitig codierte Datensignal entspricht, einer zu dieser Einheit parallel geschalteten Verzogerungs- stufe und einer mit den Ausgangen beider Komponenten verbundenen Einheit zur Gewinnung eines geeignet strukturierten Differenzsignals zwischen dem am Sendereingang anliegenden Gesamt-Datensignal und dem normierten Datensignal nach Pas- sieren des Codec. In einer sehr einfachen Ausfuhrung, die jedoch naturgemäß nur m gewisser Näherung zu einer Reproduktion der individuellen Sprache fuhren kann, können dabei wenige einzelne Individualmerkmale als relativ unabhängig voneinander angesehen und bei einer Differenzbildung isoliert be- trachtet werden. Bevorzugt ist aber eine Transformation des Signals in einen n-dimensionalen Zustandsrau (Vektorraum) , in dem n Individualmerkmale vektoriell aufgelost analysiert werden können.In a preferred solution, which is to a certain extent located between these two extreme cases, an e-recipient knowledge base with respect to the individual characteristics in the course of the transmission successively built up, in particular in access to a corresponding transmitter knowledge base. In a preferred embodiment, this access to the transmitter-side knowledge base is controlled in such a way that the prioritized transmission of the standardized, compressed data signals as the main information carrier is not disturbed - ie in the case of speech transmission, in particular m speech pauses or sections of pronounced word stretching or m times, m those a higher channel bandwidth is available. In an expedient embodiment, the individual features are separated from the overall data signal m in a coder / decoder unit, the decoder part of which corresponds to the decoder provided on the receiver side for the data signal coded on the transmitter side, a delay stage connected in parallel with this unit and one with the Outputs of both components connected unit for obtaining a suitably structured difference signal between the total data signal present at the transmitter input and the normalized data signal after passing the codec. In a very simple embodiment, which, of course, can only lead to a reproduction of the individual language with a certain approximation, a few individual individual features can be regarded as relatively independent of one another and can be viewed in isolation when a difference is formed. However, a transformation of the signal into an n-dimensional state roughness (vector space) is preferred, in which n individual features can be analyzed in a vectorially resolved manner.
In dem - hier schwerpunktmäßig betrachteten - Fall eines als Sprachsignal vorliegenden Datensignals weist der Sender an sich bekannte Spracherkennungsmittel zur Umsetzung von Sprache m die Datensignale m Form von Zeichen und der Empfanger Sprachsynthesemittel zur Synthese von akustisch ausgebbarer Sprache aus den Zeichen auf. Es ist aber darauf hinzuweisen, daß die vorgeschlagene Anordnung nicht nur für die Sprachkommunikation geeignet ist, sondern grundsatzlich für jede Über- mittlung von mit Individualmerkmalen behafteten Signalen, beispielsweise auch für die komprimierte Übertragung von Handschriften oder von Bildern mit künstlerischer "Handschrift" (Gemälden, Graphiken etc.).In the case of a data signal present as a speech signal, which is considered here as the focus, the transmitter has speech recognition means known per se for converting speech m, the data signals m in the form of characters and the receiver speech synthesis means for synthesizing acoustically outputable speech from the signs. However, it should be pointed out that the proposed arrangement is not only suitable for voice communication, but in principle for any transmission averaging of signals with individual characteristics, for example also for the compressed transmission of manuscripts or images with artistic "handwriting" (paintings, graphics etc.).
Die bei der bevorzugten Ausfuhrung der Sepaπerungsmittel vorgesehene Verzogerungsstufe ist m Anpassung an die durch die senderseitige Signalverarbeitung, d.h. die Codierung/De- codierung und gegebenenfalls Sprachanalyse, bedingte aktuelle Laufzeit bevorzugt m ihrer Verzogerungszeit steuerbar. Dies kann einen erheblichen Zeitgewinn bei der Signalverarbeitung insgesamt erbringen, da die -Annahme einer festen Signallaufzeit für die mit der Separierung der Individualmerkmale verbundenen Verarbeitungsvorgange auf den "worst case" einer Da- tensignalfolge angepaßt sein mußte, die eine maximal zeitaufwendige Verarbeitung erfordert.The delay stage provided in the preferred embodiment of the separation means is m adaptation to the signal processing by the transmitter, i.e. the coding / decoding and, if necessary, speech analysis, conditional current running time preferably controllable in its delay time. This can result in a considerable saving of time in signal processing as a whole, since the assumption of a fixed signal transit time for the processing operations associated with the separation of the individual features had to be adapted to the "worst case" of a data signal sequence which requires a maximally time-consuming processing.
In Abhängigkeit vom konkreten Anwendungsfall, speziell auch von den sender- bzw. empfangerseitig verfugbaren Speicher- und Verarbeitungskapazitaten, weist der Sender und/oder derDepending on the specific application, especially also on the storage and processing capacities available on the transmitter or receiver side, the transmitter and / or the
Empfanger eine emgangsseitig mit den Separierungsmitteln und ausgangsseitig mindestens mittelbar mit einem Eingang der Sprachsynthesemittel verbundene Individualmerkmal-Wissensba- sis zur Speicherung von Individualmerkmalen in Zuordnung zu den zugehörigen Zeichen als Repräsentation der normierten Datensignale auf. In einer besonders vorteilhaften Ausführung enthalt dabei der Sender eine erste und der Empfanger eine zweite solche Wissensbasis, und es sind Steuermittel zur Übertragung neuer Datensatze zur Ergänzung des Speicherinhal- tes der zweiten Wissensbasis aus dem Bestand der ersten vorgesehen, die eine effiziente und sichere Übertragung der entsprechenden Individualisierunsdaten über den separaten Kanal gewährleisten. Deren Übertragung erfolgt insbesondere mit geringerer Priorität gegenüber den normierten Datensignalen, speziell in Pausen der Übertragung der letzteren. Vorteile und Zweckmäßigkeiten der Erfindung ergeben sich im brigen aus den Unteranspruchen sowie der nachfolgenden Beschreibung einer bevorzugten Ausfuhrungsform anhand der Figur. Diese zeigt eine Ubertragungsanordnung 1 mit einem Sen- der 3 und einem Empfanger 5, die beispielsweise als Sendebzw, ein Empfangsteil einer Mobilfunk-Ubertragungsstrecke ausgebildet sein können. Die Figur zeigt lediglich die für die Erläuterung der Erfindung wesentlichen Komponenten, wahrend die üblichen Komponenten eines Mobilfunk-Sende- bzw. -Empfangsteils hier der besseren Übersichtlichkeit halber weggelassen sind.Receivers an individual feature knowledge base connected on the input side to the separating means and on the output side at least indirectly with an input of the speech synthesis means for storing individual features in association with the associated characters as a representation of the standardized data signals. In a particularly advantageous embodiment, the transmitter contains a first such knowledge base and the receiver contains a second such knowledge base, and control means are provided for the transmission of new data sets to supplement the memory content of the second knowledge base from the inventory of the first, which enable efficient and secure transmission of the ensure appropriate individualization data via the separate channel. Their transmission takes place, in particular, with a lower priority than the standardized data signals, especially during breaks in the transmission of the latter. Advantages and expediencies of the invention also result from the subclaims and the following description of a preferred embodiment with reference to the figure. This shows a transmission arrangement 1 with a transmitter 3 and a receiver 5, which can be designed, for example, as a transmitting or receiving part of a mobile radio transmission link. The figure only shows the components essential for the explanation of the invention, while the usual components of a mobile radio transmission or reception part are omitted here for the sake of clarity.
Die mit einem Mikrofon 7 aufgenommenen Schallwellen (Ein- gangs-Sprachsignale) werden - gegebenenfalls nach einer Vor- Verarbeitung, die eine Verstärkung und/oder Filterung zurThe sound waves recorded with a microphone 7 (input speech signals) are - if necessary after preprocessing, which are used for amplification and / or filtering
Storunterdruckung einschließt - m einem A/D-Wandler 9 digitalisiert, und am Ausgang des A/D-Wandlers 9 spaltet sich der Signalweg in einem Knoten 11 m zwei Teilwege auf. In einem ersten Teilweg 13a wird das digitalisierte Sprachsignal zu- nächst einem (an sich bekannten) Spracherkennungsalgorithmus und einer Spracherkennungsstufe 15, wobei die Emgangs- Sprachsignale m Zeichen umgesetzt werden, und anschließend einer Codierung m einem Codierer 17 unterzogen. Die m der Spracherkennungsstufe erzeugten Zeichen können Buchstaben, beispielsweise im ASCII-Code oder auch Nummern für Worte oder Silben, sein. Diese Zeichen werden entsprechend ihrer Auftre- tenswahrschemlichkeit nach dem Prinzip hoher Wahrscheinlichkeit = kurzer Code, geringe Wahrscheinlichkeit = langer Code m Codes unterschiedlicher Lange umgesetzt. Der konkret ver- wendete Code hangt für jedes der vorher gebildeten Zeichen von dessen Vorgangern ab, da die Wahrscheinlichkeit einer Silbe oder eines Wortes und auch deren/dessen Betonung vor- gangerabhangig ist. Die codierten Zeichen werden m einer an sich bekannten und daher m der Figur nicht dargestellten Sendestufe aufbereitet und über einen ersten logischen Kanal CH1 an den Empfanger gesandt, wo sie m einer ebenfalls bekannten und daher hier weggelassenen Empfangsstufe zunächst HF-mäßig und gegebenenfalls auch gemäß den Vorschriften eines speziellen Mobilfunk-Protokolls durch Entspreizung, Descramb- ling o.a. vorverarbeitet und dann einem Sprachdecoder 19 zugeführt werden. Die weitere eiripfängerseitige Signalverarbei- tung wird weiter unten beschrieben.False suppression includes - digitized in an A / D converter 9, and at the output of the A / D converter 9 the signal path in a node 11 m splits two partial paths. In a first partial path 13a, the digitized speech signal is first subjected to a speech recognition algorithm (known per se) and a speech recognition stage 15, the received speech signals being converted into m characters, and then subjected to coding m in an encoder 17. The characters generated in the speech recognition level can be letters, for example in ASCII code or numbers for words or syllables. These characters are converted according to their probability of occurrence according to the principle of high probability = short code, low probability = long code m codes of different lengths. The specific code used for each of the previously formed characters depends on its predecessor, since the probability of a syllable or a word and also its emphasis is dependent on the preceding one. The coded characters are prepared in a transmission stage which is known per se and therefore not shown in the figure, and is sent to the receiver via a first logical channel CH1, where it is initially transmitted in a reception stage which is likewise known and is therefore omitted here HF-preprocessed and possibly also in accordance with the regulations of a special mobile radio protocol by despreading, descrambling or the like and then fed to a speech decoder 19. The further signal processing on the egg chip side is described below.
Die am Ausgang des senderseitgen Codierers 17 bereitstehenden codierten Sprachdaten werden nicht nur an den Empfänger übertragen, sondern auch in einem funktioneil dem empfängerseiti- gen Sprachdecoder 19 völlig entsprechenden senderseitigen Sprachdecoder 21 sogleich wieder einer Decodierung unterzogen. Anschließend erfolgt in einer ersten Transformationsstufe 23a anhand an sich bekannter Algorithmen eine Transformation in einen n-dimensionalen Zustandsraum. Einer entspre- chenden Transformation wird auch das im Knoten 11 abgezweigte Signal im zweiten Teil-Signalweg 13b in einer zweiten Transformationsstufe 23b unterzogen, nachdem dieses einer auf die Signallaufzeit im ersten Teil-Signalweg 13a synchronisierten Verzögerung in einer Verzögerungsstufe 25 unterzogen wurde. Es ist hier zu beachten, daß das am Eingang der ersten Transformationsstufe anliegende Datensignal ein durch den Vorgang der Codierung und anschließenden Decodierung in den Stufen 17, 21 reduziertes, normiertes Sprachsignal ist, während es sich bei dem am Eingang der zweiten Transfor ationsstufe 23 anliegenden Datensignal noch um das - lediglich geeignet verzögerte - Gesamt-Datensignal handelt. Die durch die Verzögerungsstufe 25 aufgeprägte Verzögerungszeit wird in Anpassung an die Laufzeit in der Verarbeitungskette der Stufen 15, 17 und 21 gesteuert; in der Figur ist (etwas vereinfachend) von einer Steuerung in Abhängigkeit vom Ergebnis der Spracherkennung, d.h. also ausgehend von der Spracherkennungsstufe 15, ausgegangen.The coded speech data available at the output of the transmitter-side encoder 17 are not only transmitted to the receiver, but are also immediately decoded again in a transmitter-side speech decoder 21 that corresponds functionally to the receiver-side speech decoder 19. A transformation into an n-dimensional state space then takes place in a first transformation stage 23a using algorithms known per se. The signal branched off in the node 11 in the second partial signal path 13b is also subjected to a corresponding transformation in a second transformation stage 23b after it has undergone a delay in a delay stage 25 which is synchronized with the signal propagation time in the first partial signal path 13a. It should be noted here that the data signal present at the input of the first transformation stage is a standardized speech signal reduced by the process of coding and subsequent decoding in stages 17, 21, while it is the data signal present at the input of the second transformation stage 23 is still the - only suitably delayed - total data signal. The delay time impressed by the delay stage 25 is controlled in adaptation to the running time in the processing chain of stages 15, 17 and 21; in the figure is (somewhat simplified) a control depending on the result of the speech recognition, i.e. that is, starting from speech recognition level 15.
Die Beschreibung im n-dimensionalen Zustandsraum ermöglicht es, daß im Ergebnis der Differenzbildung in der Subtraktionsstufe 27 isoliert die Individualmerkmale der Sprache erhalten werden. Infolge der präzisen Synchronisation der beiden Teil- Signalwege 13a, 13b können diese Individualmerkmale eindeutig den im Ergebnis der Spracherkennung erhaltenen Zeichen zugeordnet und m dieser Zuordnung m einer senderseitigen Indi- vidualmerkmal-Wissensbasis 29 abgelegt werden.The description in the n-dimensional state space enables the individual features of the language to be obtained in isolation as a result of the difference formation in the subtraction stage 27. As a result of the precise synchronization of the two parts Signal paths 13a, 13b can uniquely assign these individual features to the characters obtained in the result of the speech recognition and can be stored in this assignment m in an individual feature knowledge base 29 on the transmitter side.
über einen separaten, zweiten logischen Kanal CH2, an dessen Beginn und Ende jeweils ein Codec 31, 33 steht, werden die die Individualmerkmale präsentierenden Individualisierungsda- ten zum Empfanger 5 übermittelt. Im Empfanger werden diese Daten zunächst unter Einsatz eines speziellen SteuerkanalsThe individualization data presenting the individual features are transmitted to the receiver 5 via a separate, second logical channel CH2, at the beginning and end of which there is a codec 31, 33. This data is initially received in the receiver using a special control channel
CH3 m einer (m der Figur nicht gezeigten) Vergleicher- und Speichersteuerstufe daraufhin geprüft, ob sie m einer emp- fangerseitigen Individuaimerkmal-Wissensbasis 35 bereits enthalten sind oder nicht. Falls dies nicht der Fall ist, werden sie - wiederum m Zuordnung zu den entsprechenden Zeichen der (separat zum Empfanger 5 übertragenen) normierten Sprachsignale - m der empfangerseitigen Wissensbasis 35 abgelegt. Die empfangerseitige Wissensbasis 35 wird somit m gewisser Weise in ihrem Datenbestand der senderseitigen Wissensbasis 29 "nachgefuhrt", so daß nur solche Information hinsichtlich der Individualmerkmale über den separaten Kanal bertragen werden muß, die nicht bereits m der empfangerseitigen Wissensbasis 35 vorhanden ist. Die hier zu übertragende Datenmenge kann also vergleichsweise klein gehalten werden.CH3 in a comparator and memory control stage (not shown in the figure) is checked as to whether or not they are already contained in a receiver-side individual feature knowledge base 35. If this is not the case, they are stored in the knowledge base 35 on the receiver side - again m assignment to the corresponding characters of the standardized speech signals (transmitted separately to the receiver 5). The receiver-side knowledge base 35 is thus “tracked” in its data stock of the transmitter-side knowledge base 29, so that only information regarding the individual characteristics that does not already exist in the receiver-side knowledge base 35 has to be transmitted via the separate channel. The amount of data to be transmitted here can therefore be kept comparatively small.
Da die Individualisierungsdaten zudem praktisch keinen unverzichtbaren Informationswert haben, werden sie gegenüber den normierten Sprachsignalen mit geringerer Priorität übertragen. So kann eine Übertragung dieser Daten beispielsweise le- diglich in den Sprachpausen oder m Zeitintervallen starker Wortdehnung durchgeführt werden. Damit erfordert die vorgeschlagene Losung zwar einen separaten logischen Datenkanal, aber keine zusatzlichen Kanalressourcen. Die von den normierten Sprachdaten getrennte Übertragung der Individualisie- rungsdaten im Zusammenhang mit dem Vorsehen einer "mitlernenden" Wissensbasis für die Individualisierungsdaten mindestens im Empfanger (bevorzugt m Sender und Empfanger) wird sogar 9 eine starke Reduzierung der benötigten Übertragungsbandbreite trotz Erreichung einer relativ hohen Sprachqualität (die natürlich abhängig von dem bei der Verarbeitung der Individualisierungsmerkmale betriebenen Aufwand ist) möglich.Since the individualization data also have practically no indispensable information value, they are transmitted with lower priority than the standardized speech signals. This data can be transmitted, for example, only during the speech pauses or m word intervals with strong word stretching. The proposed solution therefore requires a separate logical data channel, but no additional channel resources. The transmission of the individualization data separate from the standardized speech data in connection with the provision of a "learning" knowledge base for the individualization data at least in the receiver (preferably m transmitter and receiver) is even achieved 9 a strong reduction in the required transmission bandwidth despite achieving a relatively high voice quality (which of course depends on the effort involved in processing the individualization features).
Die in der empfangerseitigen Individualmerkmal-Wissensbasis 35 verfügbaren Individualisierungsdaten werden - wiederum synchronisiert zu den den Decoder 19 verlassenden normierten Sprachsignaldaten - einer Sprachsyntheseeinheit ("Stimmgene- rator") 37 zugeführt, wo eine Verknüpfung der normierten Sprachsignale mit den Individualisierungsdaten ausgeführt wird und mit deren Ausgang eine akustische Ausgabeeinheit 39 zur Schallwandlung verbunden ist. Die Funktionsweise der Sprachsyntheseeinheit 37 und der Ausgabeeinheit 39 sind an sich bekannt und werden daher hier nicht weiter erläutert; eine Besonderheit der Sprachsyntheseeinheit 37 besteht aber im zusätzlichen Eingang für die Indvidualisierungsdaten und der Implementierung eines zur Verknüpfung dieser Individualisierungsdaten mit den normierten Sprachsignalen geeigneten Algorithmus.The individualization data available in the receiver-side individual feature knowledge base 35 - again synchronized with the normalized speech signal data leaving the decoder 19 - are fed to a speech synthesis unit ("voice generator") 37, where the standardized speech signals are linked with the individualization data and with their output an acoustic output unit 39 is connected for sound conversion. The mode of operation of the speech synthesis unit 37 and the output unit 39 are known per se and are therefore not explained further here; A special feature of the speech synthesis unit 37, however, is the additional input for the individualization data and the implementation of an algorithm suitable for linking this individualization data with the standardized speech signals.
Die Ausführung der Erfindung ist nicht auf das hier skizzenhaft erläuterte Beispiel beschränkt, sondern auch in einer Vielzahl von Abwandlungen und speziellen Anwendungen möglich, von denen einige weiter oben bereits genannt sind. The embodiment of the invention is not limited to the example outlined here, but is also possible in a large number of modifications and special applications, some of which have already been mentioned above.

Claims

10 Patentansprüche 10 claims
1. Verfahren zur Übertragung von mit Individualmerkmalen behafteten Datensignalen, insbesondere von Sprachsignalen, von einem Sender (3) , der Komprimierungsmittel (17) zur Komprimierung der Datensignale aufweist, zu einem Empfanger (5) , der Dekomprimierungsmittel (19) zur Dekomprimierung der senderseitig komprimierten Datensignale aufweist, d a d u r c h g e k e n n z e i c h n e t, daß senderseitig die Individualmerkmale aus den Datensignalen zur Gewinnung von Individualisierungsdaten separiert und die von den Individualmerkmalen befreiten, normierten und komprimierten Datensignale einerseits und die Individualisierungsdaten andererseits separat über getrennte logische Kanäle (CH1, CH2) übertragen und empfangerseitig die separat empfangenen normierten Datensignale und Individualisierungsdaten zur Wiedergewinnung der mit den Individualmerkmalen behafteten Datensignale verarbeitet werden.1. Method for transmitting data signals with individual characteristics, in particular voice signals, from a transmitter (3) which has compression means (17) for compressing the data signals to a receiver (5) which has decompression means (19) for decompressing those compressed on the transmitter side Has data signals, characterized in that the transmitter separates the individual features from the data signals to obtain individualization data and the data signals, which are freed from the individual features, standardized and compressed, on the one hand, and the individualization data, on the other hand, are transmitted separately via separate logical channels (CH1, CH2) and the receiver receives the separately received standardized ones Data signals and individualization data for the recovery of the data signals with the individual characteristics are processed.
2. Verfahren nach Anspruch 1, d a d u r c h g e k e n n z e i c h n e t, daß senderseitig eine Umsetzung von Sprache m Datensignale in Form von Zeichen und empfangerseitig eine Sprachsynthese aus den Zeichen ausgeführt wird.2. The method of claim 1, d a d u r c h g e k e n n z e i c h n e t that on the transmitter side a conversion of speech m data signals in the form of characters and on the receiver side a speech synthesis from the characters is carried out.
3. Verfahren nach Anspruch 1 oder 2, d a d u r c h g e k e n z e i c h n e t, daß die empfängerseitige Verarbeitung unter Nutzung von Daten aus einer Individualmerkmal-Wissensbasis (29, 35) erfolgt, in der Individualisierungsdaten m Zuordnung zu den Zeichen gespeichert sind.3. The method according to claim 1 or 2, d a d u r c h g e k e n z e i c h n e t that the receiver-side processing takes place using data from an individual feature knowledge base (29, 35) in which individualization data m assignment to the characters are stored.
4. Verfahren nach Anspruch 3, d a d u r c h g e k e n n z e i c h n e t, daß zwischen Sender (3) und Empfanger (5) Datensatze zur Ergänzung der empfangerseitigen Individualmerkmal-Wissensbasis (35) übertragen werden. 4. The method according to claim 3, characterized in that between the transmitter (3) and receiver (5) data records to complement the receiver-side individual feature knowledge base (35) are transmitted.
5. Verfahren nach Ansprucn 4, d a d u r c h g e k e n z e i c h n e t, daß die Übertragung der Datens tze mit geringerer Priorität ge- genuber der Übertragung αer normierten Datensignale, insbesondere m Pausen von derer- Übertragung, gesteuert wird.5. Method according to claim 4, so that the transmission of the data records with a lower priority is controlled compared to the transmission of the standardized data signals, in particular m pauses from the transmission thereof.
6. Verfahren nach einem αer vorangehenden Ansprüche, d a d u r c h g e k e n z e i c h n e t, daß senderseitig zur Separierung der Individualisierungsdaten von den normierten Datensignalen eine Transformation in einen n-dimensionalen Zustandsraum vorgenommen wird.6. The method according to one of the preceding claims, d a d u r c h g e k e n z e i c h n e t that a transformation into an n-dimensional state space is carried out on the transmitter side to separate the individualization data from the standardized data signals.
7. Anordnung (1) zur Übertragung von mit Individualmerkmalen behafteten Datensignalen, insbesondere von Sprachsignalen, mit einem Sender (3), der Komprimierungsmittel (17) zur Komprimierung der Datensignale aufweist, und einem Empfanger (5), der Dekomprimierungsmittel (19) zur Dekomprimierung der senderseitig komprimierten Datensignale aufweist, d a d u r c h g e k e n n z e i c h n e t, daß der Sender Separierungsmittel (15 bis 27) zur Separierung der Individualmerkmale aus den Datensignalen zur Gewinnung von Individualisierungsdaten sowie Mittel zur getrennten Übertragung der von den Indiviαualmerkmalen befreiten, normierten und komprimierten Datensignale einerseits und der Individualisierungsdaten andererseits über getrennte logische Kanäle (CH1, CH2) und der Empfanger Mittel (19, 35, 37) zur Verarbeitung der separat empfangenen normierten Datensignale und Individualisie- rungsdaten zur Wiedergewinnung der mit den Individualmerkmalen behafteten Datensignale aufweist.7. Arrangement (1) for the transmission of data signals with individual characteristics, in particular voice signals, with a transmitter (3) which has compression means (17) for compressing the data signals, and a receiver (5), the decompression means (19) for decompression which has compressed data signals on the transmitter side, characterized in that the transmitter separating means (15 to 27) for separating the individual features from the data signals for obtaining individualization data and means for separate transmission of the standardized, compressed data signals freed from the individual features on the one hand and the individualization data on the other hand via separate ones logical channels (CH1, CH2) and the receiver means (19, 35, 37) for processing the separately received standardized data signals and individualization data for the recovery of the data signals with the individual features.
8. Anordnung nach Anspruch 7, d a d u r c h g e k e n n z e i c h n e t, daß die Separierungsmittel (15 bis 27) eine Codierer/Decoder-Em- heit (17, 21) und eine zu dieser parallel geschaltete Verzo- gerungsstufe (25) sowie eine mit den Ausgangen der Codierer/ 12 Decoder-Einheit und der Verzogerungsstufe verbundene Diffe- renzsignal-Gewmnungsemhe t (23a, 23b, 27) umfassen.8. Arrangement according to claim 7, characterized in that the separating means (15 to 27) an encoder / decoder unit (17, 21) and a delay stage (25) connected in parallel thereto and one with the outputs of the encoder / 12 Decoder unit and the delay stage connected difference signal gain level (23a, 23b, 27) comprise.
9. Anordnung nach Anspruch ~ oder 8, d a d u r c h g e k e n z e i c h n e t, daß der Sender (3) Spracherkeπr-angsmittel (15) zur Umsetzung von Sprache m die Datensignale m Form von Zeichen und der Empfanger (5) Sprachsynthesenttel (37) zur Synthese von Sprache aus den Zeichen aufweist.9. Arrangement according to claim ~ or 8, characterized in that the transmitter (3) Spracherkeπr-angsmittel (15) for converting language m the data signals m in the form of characters and the receiver (5) Speech Synthesenttel (37) for the synthesis of speech from Has characters.
10. Anordnung nach Anspruch 8 oder 9, d a d u r c h g e k e n z e i c h n e t, daß die senderseitige Codierer/Decoder-Emheit (17, 21) einen Decoder (21) aufweist, der eine zu einem empfangerseitigen De- coder (19) identische Funktion hat.10. Arrangement according to claim 8 or 9, so that the transmitter-side encoder / decoder unit (17, 21) has a decoder (21) which has an identical function to a receiver-side decoder (19).
11. Anordnung nach einem αer Ansprüche 8 bis 10, d a d u r c h g e k e n n z e i c h n e t, daß eine Verzogerungszeit der Verzogerungsstufe (25) m Echtzeit in Anpassung an die aktuelle senderseitige Signalverarbei- tungs-Laufzeit steuerbar ist.11. Arrangement according to one of the claims 8 to 10, that a delay of the delay stage (25) m can be controlled in real time in adaptation to the current transmitter signal processing time.
12. Anordnung nach einem αer Ansprüche 9 bis 11, d a d u r c h g e k e n n z e i c h n e t, daß der Sender (3) und/oder der Empfanger (5) eine mit dem Ausgang der Separierungsmittel (15 bis 27) sowie mit einem Eingang der Sprachsynthesemittel (37) mindestens mittelbar verbundene Individualmerkmal-Wissensbasis (29, 35) zur Speicherung von Individualisierungsdaten m Zuordnung zu den Zeichen aufweist.12. Arrangement according to an αer claims 9 to 11, characterized in that the transmitter (3) and / or the receiver (5) at least indirectly connected to the output of the separating means (15 to 27) and to an input of the speech synthesis means (37) Individual feature knowledge base (29, 35) for storing individualization data m assignment to the characters.
13. Anordnung nach Anspruch 12, d a d u r c h g e k e n n z e i c h n e t, daß der Sender (3) eine erste Individualisierungs-Wissensbasis (29) und der Empfanger (5) eine zweite Individualisierungs- Wissensbasis (35) aufweist und Steuermittel (31, 33, CH3) zur Übertragung neuer Datensatze aus der ersten Individualisie- rungs-Wissensbasis zur Ergänzung des Speicheπnhalts der zweiten Individualisierungs-Wissensbasis vorgesehen sind.13. The arrangement according to claim 12, characterized in that the transmitter (3) has a first individualization knowledge base (29) and the receiver (5) has a second individualization knowledge base (35) and control means (31, 33, CH3) for the transmission of new ones Records from the first individualization tion knowledge base to supplement the spoke content of the second individualization knowledge base are provided.
14. Anordnung nach Anspruch 13, d a d u r c h g e k e n n z e i c h n e t, daß die Steuermittel zur Steuerung der Übertragung neuer Datensatze mit geringerer Priorität gegenüber der Übertragung der normierten Datensignale, insbesondere m Pausen von deren Übertragung, ausgebildet sind.14. Arrangement according to claim 13, so that the control means are designed to control the transmission of new data records with a lower priority than the transmission of the standardized data signals, in particular m pauses from their transmission.
15. Anordnung nach einem der Ansprüche 8 bis 14, d a d u r c h g e k e n n z e i c h n e t, daß die Differenzsignal-Gewinnungsemheit (23a, 23b, 27) Mittel zur Transformation der normierten Datensignale bzw. des Ge- samtdatensignals m einen n-dimensionalen Zustandsraum aufweisen. 15. Arrangement according to one of claims 8 to 14, so that the difference signal extraction unit (23a, 23b, 27) has means for transforming the standardized data signals or the total data signal m an n-dimensional state space.
EP00941925A 1999-06-01 2000-05-24 Method and arrangement for speech coding, using phonetic decoding and the transmission of speech characteristics Withdrawn EP1181685A1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE1999125264 DE19925264A1 (en) 1999-06-01 1999-06-01 Method and arrangement for the transmission of data signals with individual characteristics, in particular voice signals
DE19925264 1999-06-01
PCT/DE2000/001662 WO2000074035A1 (en) 1999-06-01 2000-05-24 Method and arrangement for speech coding, using phonetic decoding and the transmission of speech characteristics

Publications (1)

Publication Number Publication Date
EP1181685A1 true EP1181685A1 (en) 2002-02-27

Family

ID=7910007

Family Applications (1)

Application Number Title Priority Date Filing Date
EP00941925A Withdrawn EP1181685A1 (en) 1999-06-01 2000-05-24 Method and arrangement for speech coding, using phonetic decoding and the transmission of speech characteristics

Country Status (3)

Country Link
EP (1) EP1181685A1 (en)
DE (1) DE19925264A1 (en)
WO (1) WO2000074035A1 (en)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0706172A1 (en) * 1994-10-04 1996-04-10 Hughes Aircraft Company Low bit rate speech encoder and decoder
FR2771544B1 (en) * 1997-11-21 2000-12-29 Sagem SPEECH CODING METHOD AND TERMINALS FOR IMPLEMENTING THE METHOD

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO0074035A1 *

Also Published As

Publication number Publication date
WO2000074035A1 (en) 2000-12-07
DE19925264A1 (en) 2000-12-14

Similar Documents

Publication Publication Date Title
DE69735097T2 (en) METHOD AND DEVICE FOR IMPROVING LANGUAGE QUALITY IN TANDEM LANGUAGE CODERS
DE69631318T2 (en) Method and device for generating background noise in a digital transmission system
DE69634645T2 (en) Method and apparatus for speech coding
EP0954909B1 (en) Method for coding an audio signal
DE60214358T2 (en) TIME CALENDAR MODIFICATION OF SIGNALS WITH SPECIFIC PROCEDURE ACCORDING TO DETERMINED SIGNAL TYPE
DE69927505T2 (en) METHOD FOR INSERTING ADDITIONAL DATA INTO AN AUDIO DATA STREAM
DE60034484T2 (en) METHOD AND DEVICE IN A COMMUNICATION SYSTEM
DE602004005784T2 (en) Improved excitation for higher-band coding in a codec based on frequency band separation coding method
EP1869671B1 (en) Noise suppression process and device
EP1388147B1 (en) Method for enlarging the band width of a narrow-band filtered voice signal, especially a voice signal emitted by a telecommunication appliance
DE69911723T2 (en) Automatic voice / speaker recognition via digital wireless channels
DE60128121T2 (en) PERCEPTIONALLY IMPROVED IMPROVEMENT OF CODED AUDIBLE SIGNALS
DE2626793A1 (en) METHOD OF EVALUATING VOICE AND VOICELESS CONDITIONS OF A VOICE SIGNAL
EP2245621B1 (en) Method and means for encoding background noise information
DE102006049154A1 (en) Coding of an information signal
EP1051701B1 (en) Method for voice data transmission
EP1023777B1 (en) Method and device for limiting a stream of audio data with a scaleable bit rate
EP0508547B1 (en) Circuit for speech recognition
EP1282897A1 (en) Method for creating a speech database for a target vocabulary in order to train a speech recognition system
EP1327243A1 (en) Method and device for the generation of a scalable data stream and method and device for decoding a scalable data stream
EP0658874A1 (en) Process and circuit for producing from a speech signal with small bandwidth a speech signal with great bandwidth
EP1181685A1 (en) Method and arrangement for speech coding, using phonetic decoding and the transmission of speech characteristics
DE60304237T2 (en) Speech coding device and method with TFO (Tandem Free Operation) function
DE69534799T2 (en) TRANSMISSION SYSTEM USING VARIOUS CODING PRINCIPLES
DE19806927A1 (en) Method of communicating natural speech

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20011119

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

AX Request for extension of the european patent

Free format text: AL;LT;LV;MK;RO;SI

17Q First examination report despatched

Effective date: 20030221

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20030702

RBV Designated contracting states (corrected)

Designated state(s): DE FR GB