DE2811454A1 - Reproduction method improving quality of frequency band limited speech - by adding stored spectral signals derived from full range prototype - Google Patents

Reproduction method improving quality of frequency band limited speech - by adding stored spectral signals derived from full range prototype

Info

Publication number
DE2811454A1
DE2811454A1 DE19782811454 DE2811454A DE2811454A1 DE 2811454 A1 DE2811454 A1 DE 2811454A1 DE 19782811454 DE19782811454 DE 19782811454 DE 2811454 A DE2811454 A DE 2811454A DE 2811454 A1 DE2811454 A1 DE 2811454A1
Authority
DE
Germany
Prior art keywords
parameters
speech
available
signal
prototype
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE19782811454
Other languages
German (de)
Inventor
Hans Dietrich Dr Ing Hoehne
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Institut fuer Nachrichtentechnik Heinrich Hertz Institute HHI
Original Assignee
Fraunhofer Institut fuer Nachrichtentechnik Heinrich Hertz Institute HHI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Institut fuer Nachrichtentechnik Heinrich Hertz Institute HHI filed Critical Fraunhofer Institut fuer Nachrichtentechnik Heinrich Hertz Institute HHI
Priority to DE19782811454 priority Critical patent/DE2811454A1/en
Publication of DE2811454A1 publication Critical patent/DE2811454A1/en
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

The speech frequency band is limited but additional signals are used, derived from available signals, to improve the quality of reproduction. Parameters (X) are derived from the patterns of available speech signals. Distances (alpha k) to other parameters (AK) are derived from these parameters (X). The parameters (Ak) are stored from a prototype characterising an equivalence class of sounds with limited frequency band. Parameters (BK) corresponding to parameters (Ak) are recalled. They are also stored from a prototype, but with a speech with the required frequency spectrum, and used for addition of spectral signals missing in the available speech signals.

Description

Verfahren zur Verbesserung der Wiedergabequalität bandbegrenzt verfügbarerMethod for improving the playback quality of limited-band available

Sprache Die Erfindung bezieht sich auf ein Verfahren zur Verbesserung der Wiedergabequalität bandbegrenzt verfügbarer Sprache unter Verwendung von Zusatzinformation, die mit Hilfe des verfügbaren Signals bestimmt wird. Mit fortschreitender technischer Entwicklung wachsen die Qualitätsanforderungen, so auch an Medien, mit denen übertragene Sprache wiedergegeben wird. Darüberhinaus ist es wirtschaftlich bedeutsam, wenn Bandbreite bei der fibertragung von Sprache ohne wesentlichen Qualitätsverlust bei der Wiedergabe eingespart werden kann, weil sich bei gegebener Breite eines Dbertragungsbandes die dort unterzubringende Kanalzahl entsprechend erhöhen läßt. In manchen Fällen, z.B. beim beweglichen Landfunk, liegt hierin eine vorteilhafte Möglichkeit für eine Kapazitätsausweitung.Language The invention relates to a method of improvement the playback quality of band-limited available speech using additional information, which is determined with the help of the available signal. With advancing technical Development, the quality requirements grow, so also on the media with which transmitted Language is reproduced. In addition, it is economically important if Bandwidth in the transmission of speech without significant loss of quality the reproduction can be saved because with a given width of a transmission band the number of channels to be accommodated there can be increased accordingly. In some cases, e.g. in mobile land radio, this is an advantageous possibility for one Capacity expansion.

Die Einsparung von Bandbreite ohne wesentliche Minderung der Wiedergabequalität wird allgemein durch jeweils gegensinnig wirkende Maßnahmen auf der Sende-und auf der Empfangsseite herbeigeführt. Dazu wird senderseitig die Redundanz reduziert und z.B. mit Vocoderverfahren, mit adaptiver Differenz-Puls-Code-Modulation (ADPCM), mit Subbandcodierung oder auch mit Modulationsverfahren im analogen Bereich gearbeitet. Voraussetzung hierbei ist der Zugriff auf den Sender, so daß derartige Verfahren - falls nicht ein ausgewähltes Verfahren in sehr großem Umfang Einführung findet - auf regional und/oder anwendungstechnisch eng begrenzte Gebiete beschränkt bleiben müssen.Saving bandwidth without significantly reducing playback quality is generally due to measures acting in opposite directions on the transmit and on the receiving side brought about. For this purpose, the redundancy is reduced on the transmitter side and e.g. with vocoder method, with adaptive differential pulse code modulation (ADPCM), worked with subband coding or with modulation methods in the analog area. The prerequisite for this is access to the transmitter, so that such procedures - unless a selected procedure is introduced on a very large scale - remain restricted to regions and / or areas that are narrowly limited in terms of application technology have to.

Bei der der Erfindung zugrundeliegenden Aufgabenstellung wird davon ausgegangen, daß ein solcher Zugriff zur Sendeseite nicht besteht, die Verbesserung der Wiedergabequalität bandbegrenzt verfügbarer Sprache also allein empfangsseitig erfolgen muß. Das bedeutet, die Grenzen des Bandes beim empfangenen Signal können in weiten Bereichenvariieren, die für die Verbesserung der Wiedergabequalität zu treffenden Maßnahmen also in mehr oder weniger großem Umfang erforderlich sein, um insgesamt einen möglichst geringen Verlust an Silbenverständlichkeit und auch an Natürlichkeit zu erzielen.In the case of the problem on which the invention is based assumed that there is no such access to the transmission side, the improvement the reproduction quality of band-limited available speech so only on the receiving side must be done. This means that the band can limit the received signal vary widely, which increases the quality of reproduction appropriate measures may be required to a greater or lesser extent, to the lowest possible loss of syllable intelligibility and also to achieve naturalness.

Ein Teil dieser Problemstellungen ist bekannt (RLE Progress Report Nr. 119 (MIT, 1977),Seiten 100, 101). Der dort angegebene Weg sieht vor, tiefpaßgefilterte Sprache zu verbessern, indem fehlende spektrale Information allein empfangsseitig wieder eingesetzt wird. Wenn nur der niedrigfrequente Teil des Signals verfügbar ist, soll es danach möglich sein, einen großen Teil des fehlenden höherfrequenten Anteils aus der verfügbaren spektralen Energie zu bestimmen und damit die natürliche Sprache zu rekonstruieren. Ein wesentlicher Vorbehalt besteht darin, daß dieses bekannte Verfahren insbesondere für stimmhafte Sprache befriedigend arbeitet, bei der diskrete Frequenzen und Amplituden von Formanten gut ausgebildet sind. Ein den Frequenzgang formendes Filter soll dazu mit Harmonischen der aus dem verfügbaren Signal gewonnenen Grundfrequenz angeregt werden. Das erhaltene Signal mag zwar im Langzeitspektrum einem nicht bandbegrenzten Signal entsprechen; da jedoch der Vokal trakt für jeden Menschen individuell ist und sich zudem bei jedem Laut ändert, sind überzeugende Ergebnisse dann nicht zu erwarten, wenn höhere zu ergänzende Formanten laut- und sprecherunabhängig zuzufügen sind.Some of these problems are known (RLE Progress Report No. 119 (MIT, 1977), pages 100, 101). The path indicated there provides for low-pass filtered To improve speech by adding missing spectral information on the receiving end alone is reinstated. When only the low frequency part of the signal is available is, it should then be possible to make up a large part of the missing higher frequency To determine the proportion from the available spectral energy and thus the natural Reconstruct language. A major caveat is that this known method works satisfactorily in particular for voiced speech the discrete frequencies and amplitudes of formants are well developed. A den The frequency response shaping filter is intended to use harmonics from the available Signal obtained base frequency are excited. The received signal may be im Long-term spectrum corresponds to a non-band-limited signal; but there is the vowel tract is individual for each person and also changes with each sound convincing results are not to be expected if higher formants have to be added are to be added independently of the loudspeaker and speaker.

Das Verfahren gemäß der Erfindung ist durch folgende Verfahrensabschnitte gekennzeichnet: - aus Mustern des verfügbaren Sprachsignals werden Parameter X gewonnen; - von diesen Parametern X werden Abständeqkzu ParametennAk bestimmt - die Parameter Ak liegen von jeweils einem eine Aquivalenzklasse von Lauten bandbegrenzter Sprache charakterisierenden Prototyp abgespeichert vor; - den Parametern Ak entsprechende Parameter Bk werden abgerufen - auch die Parameter Bk liegen von jeweils einem eine Squivalenzklasse von Lauten charakterisierenden Prototyp abgespeichert vor, jedoch von Sprache mit dem für die vorgesehene Wiedergabe erforderlichen Spektrum; - unter Berücksichtigung der Abstände k zwischen den Parametern X und den Paramtern Ak werden die Parameter Bk zur Bildung der im verfügbaren Sprachsignal fehlenden spektralen Information herangezogen.The method according to the invention is through the following process steps characterized: - parameters X are obtained from samples of the available speech signal; - these parameters X are used to determine distances qk to parametennAk - the parameters Ak each have an equivalence class of sounds of band-limited language characterizing prototype stored before; - corresponding to the parameters Ak Parameters Bk are called up - the parameters Bk are also one of each Prototype characterizing equivalence class of sounds stored before, however of speech with the spectrum necessary for the intended reproduction; - under Taking into account the distances k between the parameters X and the parameters Ak the parameters Bk for forming the spectral missing in the available speech signal Information used.

Diese Verfahrensabschnitte können auch als ein Erkennungs- und ein Syntheseabschnitt angesehen werden, bei denen auf abgespeicherte Information zurückgegriffen wird. Die Speichertechniken, die in engem Zusammenhang mit der Art des Syntheseverfahrens stehen, insbesondere jedoch die Informationsinhalte sind flach folgenden Gesichtspunkte zu bestimmen. = Die Verwendung abgespeichert vorliegender Information, passend zum verfügbaren Sprachsignal, kommt mit einer Filterung gemäß der Langzeitstatistik des Sprachsignals vieler Sprecher nicht aus. Deshalb wird - ähnlich wie bei der Spracherkennung, obwohl bei der Erfindung kein Spracherkennungsproblem im eigentlichen Sinne vorliegt - für die charakteristischen Laute und Lautgruppen der Sprache eine Klassifizierung vorgenommen. Prototypen solcher Aquivalenzklassen lassen sich als Vektoren genügend genau festlegen, also speichern. An sich wären technisch unrealistisch viele Squivalenzklassen vorzusehen, um bei der Erkennungsphase die jeweils zutreffenden abgespeicherten Parameter bestimmen zu können.These procedural sections can also be used as a detection and a Synthesis section can be viewed in which the stored information is accessed will. The storage techniques that are closely related to the type of synthesis process stand, in particular, however, the information contents are flat following points of view to determine. = The use of stored information, matching the available speech signal, comes with a filter according to the long-term statistics the speech signal of many speakers does not stop. Therefore - similar to the Speech recognition, although in the invention there is no real speech recognition problem Sense is present - one for the characteristic sounds and groups of sounds in language Classification made. Prototypes of such equivalence classes can be described as Define vectors with sufficient precision, i.e. save them. In themselves, it would be technically unrealistic many equivalence classes are to be provided in order to find the appropriate ones during the recognition phase to be able to determine stored parameters.

Das ist jedoch nicht erforderlich, d.h. die Zahl der Aquivalenzklassen kann auf weniger als 20, evtl. weniger als 10, beschränkt bleiben, weil die für das erfindungsgemäße Verfahren kennzeichnende Abstandsbestimmung der Parameter des Sprachmusters von den abgespeicherten Parametern von Prototypen einer Zerlegung in Parameter-Komponenten gleichkommt bzw. als Erkennung resultierender abgespeicherter Parameter anzusehen ist. Sodann ergibt sich die Synthese vom Grundsatz her aus einer Assoziation aufgrund der Erkennung, bei der die verwendeten abgespeicherten Parameter durch eine fesX Zuordnung zu den erkannten vorgegeben werden und die Qualität der wiederzugebenden Sprache verbessern, weil von ihnen Laute bzw. Lautgruppen charakterisiert werden, die das für die vorgesehene Wiedergabe erforderliche Spektrum besitzen.However, this is not required, i.e. the number of equivalence classes can remain limited to less than 20, possibly less than 10, because the for the method according to the invention characterizing distance determination of the parameters of the Speech samples from the stored parameters of prototypes of a decomposition in parameter components equals or as recognition of resulting stored Parameter is to be viewed. Then the synthesis results in principle from one Association based on the recognition in which the saved parameters used can be specified by a fesX assignment to the recognized and the quality of the improve the language to be reproduced, because they characterize sounds or groups of sounds that have the spectrum required for the intended reproduction.

Sowohl für den Abschnitt der Erkennung als auch den der Synthese ist eine einfache Minimum-Maximum-Entscheidung denkbar. Der technische Aufwand für eine entsprechende Schaltung ist verhältnismäßig gering, erfordert jedoch - wie uben bereits erwähnt - bei hohen Qualitätsanforderungen an die wiederzugebende Sprache eine große Zahl von Squivalenzklassen und damit große Speicher. Bevorzugte Ausführungsformen der Erfindung beruhen dagegen auf einem Mischen der durch die Erkennung bestimmten Anteile, aus denen sich die zur Qualitätsverbesserung verwendete Zusatzinformation zusammensetzt. Diese Zusatzinformation kann sowohl bezüglich der Quantität ihrer Anteile als auch im Verhältnis zum Anteil des in die Wiedergabe einbezogenen ursprünglich verfügbaren Sprachsignals bestimmt werden. Ein Fehlersignal, das bei der Gewinnung der Parameter aus dem Muster des verfügbaren Sprachsignals gebildet wird, ermöglicht eine einfache und wirkungsvolle Synthese der Zusatzinformation.For both the recognition and the synthesis section a simple minimum-maximum decision is conceivable. The technical effort for a corresponding circuit is relatively small, but requires - as practiced already mentioned - with high quality requirements for the language to be reproduced a large number of equivalence classes and thus large memories. Preferred Embodiments the invention are based on the other hand on a mixing of the determined by the detection Proportions that make up the additional information used to improve quality composed. This additional information can both with regard to the quantity of their Shares as well as in relation to the share of the originally included in the reproduction available speech signal can be determined. An error signal that occurs when extracting the parameter is formed from the pattern of the available speech signal a simple and effective synthesis of the additional information.

Von ebenfalls wesentlicher Bedeutung für Ausführungsformen der Erfindung ist die Möglichkeit, den Anteil von Zusatzinformation in der wiederzugebenden Sprache in Abhängigkeit von der Qualität des verfügbaren Sprachsignals bestimmen zu können. Sofern nämlich im verfügbaren Sprachsignal bereits spektrale Anteile enthalten sind, die durch abgespeicherte Parameter von Squivalenzklassen von Lauten bandbegrenzter Sprache nicht oder nicht genügend Berücksichtigung finden würden, kann abhängig vom Verhältnis der Energien des verfügbaren Sprachsignals die wiederzugebende Sprache zusammengesetzt werden.Also of essential importance for embodiments of the invention is the possibility of the share of additional information in the language to be reproduced to be able to determine depending on the quality of the available speech signal. If the available speech signal already contains spectral components, which are band-limited by stored parameters of equivalence classes of sounds Language not or not enough consideration can be dependent the speech to be reproduced from the ratio of the energies of the available speech signal be put together.

Die Mischungsverhältnisse, mit denen die abgespeicherten Prototypen zur Bildung der Zusatzinformation herangezogen werden, richten sich nicht nur schlechthin nach den Abständen zwischen den in der Erkennungsphase miteinander verglichenen Parametern, es ist vorteilhaft, wenn mit wachsenden Abständen die zur Bildung der Zusatzinformation heranzuziehenden Anteile überproportional abnehmen. Diese Maßnahme wirkt sich qualitativ in Richtung einer Minimum-Maximum-Entscheidung aus, ohne jedoch wirklich eine solche Entscheidung zu sein.The mixing ratios with which the saved prototypes are used to form the additional information, are not just aimed at according to the distances between those compared with each other in the recognition phase Parameters, it is advantageous if, with increasing intervals, the formation of the Additional information, the proportions to be used decrease disproportionately. This measure has a qualitative effect in the direction of a minimum-maximum decision, but without really to be such a decision.

Insbesondere im Hinblick auf neue Technologien elektronischer Bauelemente (VLSI = Very Large Scale Integration) sind die wirtschaftlich-technischen Randbedingungen für Ausführungsformen der Erfindung günstig. Das Verfahren zur Verbesserung der Wiedergabequalität bandbegrenzt verfügbarer Sprache kann dann nicht nur z.B. bei Rundfunksendern o.ä. erfolgen, bei denen über Telefon empfangene Sprache aufgenommen, in ihrer Qualität verbessert und sodann ausgesendet wird, es kann vor allem in Echtzeit und am Ort des Teilnehmers erfolgen.Especially with regard to new technologies of electronic components (VLSI = Very Large Scale Integration) are the economic and technical boundary conditions favorable for embodiments of the invention. The process of improving the The playback quality of band-limited available speech can then not only e.g. Radio stations or similar where the voice received via telephone is recorded, Improved in quality and then sent out, especially in real time and at the location of the participant.

Im Zusammenhang mit dem in der Zeichnung dargestellten Blockschaltbild wird schematisch der Ablauf des Verfahrens gemäß der Erfindung näher erläutert: Das verfügbare bandbegrenzte Sprachsignal ist mit s1(t) bezeichnet. Es wird außer zu einem Addierer (10) zu einem Filter (1) geführt. Dort erfolgt eine Parameterabschätzung, wobei es sich bei diesen - und den noch folgenden - Parametern jeweils um Energien in spektralen Kanälen oder um Prädiktorkoeffizienten handelt. Diese Parameter X, die aus Mustern des verfügbaren bandbegrenzten Signals s1(t) gewonnen wurden, werden in einem Abstandsbildner (2) mit Paramtern A kverglichen, die aus einem Speicher (3a) über einen Datenbus (4) zugeführt werden. Für die einzelnen Abstände der Parameter X zu den Prototypen von Aquivalenzklassen ergeben sich damit Werte fflk9 von denen abhängig ein betreffender Multiplizierer (5) mit den aus einem Speicher (3b) abgerufenen Parametern Bk, die bezüglich der Squivalenzklassen, nicht jedoch hinsichtlich ihrer Vektorkomponenten übereinstimmen, die einzelnen Anteile für die an einem Addierer (6) passend gebildete Zusatzinformation bestimmt wird. In einem Synthetisator (7) wird aus dieser Zusatzinformation ein Analogsignal gebildet, das entweder (- nicht dargestellt -) direkt oder über einen Regel verstärker (9) zum oben bereits erwähnten Addierer (10) gelangt, an dessen Ausgang das in der Qualität verbesserte wiederzugebende Signal s2(t) vorliegt.In connection with the block diagram shown in the drawing the sequence of the method according to the invention is explained in more detail schematically: The available band-limited speech signal is denoted by s1 (t). It will save led to an adder (10) to a filter (1). A parameter estimation is carried out there, whereby these - and the following - parameters are energies in spectral channels or predictor coefficients. These parameters X, obtained from samples of the available band-limited signal s1 (t) in a spacer (2) with parameters A k compared from a memory (3a) can be supplied via a data bus (4). For the individual distances between the parameters X to the prototypes This results in values from equivalence classes fflk9 on which a relevant multiplier (5) with the from a memory depends (3b) retrieved parameters Bk relating to the equivalence classes, but not agree with regard to their vector components, the individual shares for the additional information suitably formed at an adder (6) is determined. In one An analog signal is formed from this additional information, the synthesizer (7) either (- not shown -) directly or via a rule amplifier (9) to Above mentioned adder (10) arrives, at the output of which the quality improved signal s2 (t) to be reproduced is present.

Ist ein Regelverstärker (9) vorgesehen, wird in einem Mittelwertbestimmer (8) vom Signal s1(t) z.B. das Verhältnis der Energien im "Restband" zur Gesamtenergie bestimmt und der Regelverstärker (9) entsprechend eingestellt. Unter "Restband" werden die spektralen Anteile verstanden, die nach der Dimensionierung der Squivalenzklassen wiederzugebender und bandbegrenzter Sprache im ungünstigsten Fall zuzufügen sind.If a control amplifier (9) is provided, a mean value determiner is used (8) of the signal s1 (t) e.g. the ratio of the energies in the "remaining band" to the total energy determined and the control amplifier (9) adjusted accordingly. Under "remaining tape" the spectral components are understood, which according to the dimensioning of the equivalence classes reproduced and band-limited language are added in the worst case.

Im Blockschaltbild ist außerdem eine Verbindung zwischen dem Fitler (1) und dem Synthetisator (7) eingezeichnet. Diese Verbindung dient zur Obertragung eines Fehlersignals, das zur Erzeugung der Zusatzinformation benötigt wird.The block diagram also shows a connection between the fitler (1) and the synthesizer (7). This connection is used for transmission an error signal that is required to generate the additional information.

Begnügt man sich mit Zusatzinformation, die nicht völlig sprecherunabhängig ist, kann noch eine zusätzliche grobe Klassifizierung - männliche/weibliche Stimme - vorgesehen werden.Are you satisfied with additional information that is not completely independent of the speaker? there can be an additional rough classification - male / female voice - be provided.

Handelt es sich bei den Parametern X, Ak und Bk um Pakorkoeffizienten, werden diese mit dem Eintreffen des Signals s1(t) z.B. blockweise berechnet. Das kann sukzessiv aus den Korrelationskoeffizienten der Fehl erfol gen bei Vorwärts- und Rückwärtsprädiktion mit einem Prädiktionsfehlerfilter in Kaskadenform durchgeführt werden. Sodann werden die Abstände als Shnlichkeitsmaß des empfangenen Signals zu den vorhandenen Squivalenzklassen ermittelt. Aus den wird dann gemäß ein Parkorkoeffizientensatz für das Restbandsignal erstellt, der dem Synthetisator zugeführt wird. Im Falle der Benützung eines Prädiktionsverfahrens empfiehlt sich die Verwendung der Parkorkoeffizienten, weil sich hierbei die Stabilität der Synthese leicht gewährleisten läßt. Der Synthetisator wird ebenfalls als Filter in Kaskadenform aufgebaut. Die Anregung erfolgt mit dem im Prädiktionsfehlerfilter gewonnenen Fehlersignal. Dieses Beispiel zeigt eine Verwertung der bei der Erkennung gewonnenen Abstandsmaße zur Berechnung der Parameter für die Synthese von Zusatzinformation.If the parameters X, Ak and Bk are Pakor coefficients, they are calculated, for example in blocks, when the signal s1 (t) arrives. This can be done successively from the correlation coefficients of the errors in the forward and backward prediction with a prediction error filter in cascade form. Then the distances determined as a measure of similarity between the received signal and the existing equivalence classes. From the is then according to creates a parking coefficient set for the remaining band signal which is fed to the synthesizer. If a prediction method is used, the use of the Parkor coefficients is recommended, because the stability of the synthesis can easily be ensured here. The synthesizer is also constructed as a filter in cascade form. The excitation takes place with the error signal obtained in the prediction error filter. This example shows a utilization of the distance measurements obtained during the detection for the calculation of the parameters for the synthesis of additional information.

Bei einer Parametergewinnung im Frequenzbereich wird das Sprachsignal durch Bandpässe in z.B. 10 Unterbänder aufgeteilt und die Energie in diesen Kanälen wird nach Gleichrichten und weiterer Tiefpaßtfilterung z.B. mit 25 Hz als Parameter betrachtet. Als Fehlersignal ist (wie beim Voice-Excited-Vocoder) das Basisband z.B. bis ca. 1000 Hz verwendbar. Zur Synthese werden Bandpaßfilter mit dem Restbandsignal angeregt und nach Spitzenbegrenzung zur Vermeidung von Amplitudenschwankungen mit den Vocoder-Kanal-Signalen moduliert. Der Unterschied zum reinen Voice-Excited-Vocoder besteht darin, daß die Vocoder-Kanal-Signale nicht übertragen werden, sondern als Parameter im folgenden Mustererkennungsprozeß dienen. Dabei werden wiederum Abstände cel ... °*k zu gespeicherten Parametern für Lautprototypen in bandbegrenztem Signal berechnet und daraus und aus gespeicherten Prototypen des breitbandigen oder des Restbandsignals neue Vocoder-Kanal-Signale entwickelt.When parameters are obtained in the frequency domain, the speech signal divided into e.g. 10 sub-bands by bandpasses and the energy in these channels after rectification and further low-pass filtering, e.g. with 25 Hz as a parameter considered. As with the Voice Excited Vocoder, the baseband is the error signal e.g. usable up to approx. 1000 Hz. Bandpass filters are used for synthesis with the remaining band signal stimulated and after peak limitation to avoid amplitude fluctuations modulated the vocoder channel signals. The difference to the pure voice excited vocoder is that the vocoder channel signals are not transmitted, but as Parameters are used in the following pattern recognition process. Again, there are distances cel ... ° * k to stored parameters for sound prototypes in band-limited signal calculated and from this and from stored prototypes of the broadband or the Residual band signal developed new vocoder channel signals.

Claims (7)

HEINRICH-HERTZ-INSTITUT FUR NACHRICHTENTECHNIK BERLIN GMBH Patentansprüche 1.) Verfahren zur Verbesserung der Wiedergabequalität bandbegrenzt verfügbarer Sprache unter Verwendung von Zusatzinformation, die mit Hilfe des verfügbaren Signals bestimmt wird, gekennzeichnet durch folgende Verfahrensabschnitte: - aus Mustern des verfügbaren Sprachsignals werden Parameter X gewonnen; - von diesen Parametern X werden Abstände wk zu Parametern Ak bestimmt - die Parameter Ak liegen von jeweils einem eine .4quivalenzklasse von Lauten bandbegrenzter Sprache charakterisierenden Prototyp abgespeichert vor; - den Parametern Ak entsprechende Parameter Bk werden abgerufen - auch die Parameter Bk liegen von jeweils einem eine Aquivalenzklasse von Lauten charakterisierenden Prototyp abgespeichert vor, jedoch von Sprache mit dem für die vorgesehene Wiedergabe erforderlichen Spektrum; - unter Berücksichtigung der Abstände zk zwischen den Parametern X und den Parametern Ak werden die Parameter Bk zur Bildung der im verfügbaren Sprachsignal fehlenden spektralen Information herangezogen.HEINRICH-HERTZ-INSTITUT FUR NACHRICHTENTECHNIK BERLIN GMBH Patent claims 1.) Method for improving the reproduction quality of speech available in a band-limited manner using additional information determined with the help of the available signal is characterized by the following procedural steps: - from samples of the available Speech signal, parameters X are obtained; - from these parameters X are distances wk determined to parameters Ak - the parameters Ak each have an equivalence class of sounds of band-limited speech characterizing prototype stored before; - the parameters Bk corresponding to the parameters Ak are called up - the parameters too Bk are each of one characterizing an equivalence class of sounds Prototype saved before, but by speech with the one for the intended reproduction required spectrum; - taking into account the distances zk between the parameters X and the parameters Ak are the parameters Bk for forming the speech signal available in the missing spectral information. 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß bei der Gewinnung der Parameter X ein zusätzliches Fehlersignal gebildet und dieses Fehlersignal bei der Bildung der im verfügbaren Sprachsignal fehlenden spektralen Information mitherangezogen wird. 2. The method according to claim 1, characterized in that in the Obtaining the parameters X an additional error signal is formed and this error signal in the formation of the missing spectral information in the available speech signal is also used. 3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß abhängig von dem Verhältnis der Energien in Spektralbereichen des verfügbaren Sprachsignals die gebildete spektrale Information und das verfügbare Sprachsignal für die wiederzugebende Sprache zusammengefaßt werden. 3. The method according to claim 1 or 2, characterized in that depending on the ratio of the energies in the spectral ranges of the available speech signal the generated spectral information and the available speech signal for the one to be reproduced Language can be summarized. 4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die Parameter X, Ak und Bk der Sprachsignale Energien in spektralen Kanälen sind.4. The method according to any one of claims 1 to 3, characterized in that that the parameters X, Ak and Bk of the speech signals energies in spectral channels are. 5. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die Parameter X, Ak und Bk der Sprachsignale Prädiktor- oder Reflexionskoeffizienten sind.5. The method according to any one of claims 1 to 3, characterized in, that the parameters X, Ak and Bk of the speech signals are predictor or reflection coefficients are. 6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die abgerufenen Parameter Bk mit zunehmenden Abständen « für die Bildung der im verfügbaren Sprachsignal fehlenden spektralen Information mit überproportional abnehmenden Anteilen herangezogen werden.6. The method according to any one of claims 1 to 5, characterized in that that the retrieved parameters Bk with increasing intervals «for the formation of the Missing spectral information in the available speech signal with disproportionately high decreasing proportions are used. 7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß die Verbesserung der Wiedergabequalität der bandbegrenzt verfügbaren Sprache in Echtzeit erfolgt.7. The method according to any one of claims 1 to 6, characterized in that that the improvement of the reproduction quality of the speech available in a band-limited manner takes place in real time.
DE19782811454 1978-03-14 1978-03-14 Reproduction method improving quality of frequency band limited speech - by adding stored spectral signals derived from full range prototype Ceased DE2811454A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19782811454 DE2811454A1 (en) 1978-03-14 1978-03-14 Reproduction method improving quality of frequency band limited speech - by adding stored spectral signals derived from full range prototype

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19782811454 DE2811454A1 (en) 1978-03-14 1978-03-14 Reproduction method improving quality of frequency band limited speech - by adding stored spectral signals derived from full range prototype

Publications (1)

Publication Number Publication Date
DE2811454A1 true DE2811454A1 (en) 1979-09-20

Family

ID=6034624

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19782811454 Ceased DE2811454A1 (en) 1978-03-14 1978-03-14 Reproduction method improving quality of frequency band limited speech - by adding stored spectral signals derived from full range prototype

Country Status (1)

Country Link
DE (1) DE2811454A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4343366A1 (en) * 1993-12-18 1995-06-22 Grundig Emv Method and circuit arrangement for increasing the bandwidth of narrowband speech signals
WO2001047335A3 (en) * 2001-04-11 2002-01-31 Phonak Ag Method for the elimination of noise signal components in an input signal for an auditory system, use of said method and a hearing aid

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2605306A1 (en) * 1976-02-11 1977-08-18 Standard Elektrik Lorenz Ag PROCEDURE AND CIRCUIT ARRANGEMENT FOR ERROR-FREE RECEPTION OF THE BASE BAND OF A BASE BAND VOCODER
DE2608244A1 (en) * 1976-02-28 1977-09-15 Licentia Gmbh Prediction vocoder system analyser and synthesiser - processes difference signals to give voice signals at low bit rate
DE2303497C2 (en) * 1973-01-25 1981-12-03 Licentia Patent-Verwaltungs-Gmbh, 6000 Frankfurt Method for the transmission of speech signals

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2303497C2 (en) * 1973-01-25 1981-12-03 Licentia Patent-Verwaltungs-Gmbh, 6000 Frankfurt Method for the transmission of speech signals
DE2605306A1 (en) * 1976-02-11 1977-08-18 Standard Elektrik Lorenz Ag PROCEDURE AND CIRCUIT ARRANGEMENT FOR ERROR-FREE RECEPTION OF THE BASE BAND OF A BASE BAND VOCODER
DE2608244A1 (en) * 1976-02-28 1977-09-15 Licentia Gmbh Prediction vocoder system analyser and synthesiser - processes difference signals to give voice signals at low bit rate

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4343366A1 (en) * 1993-12-18 1995-06-22 Grundig Emv Method and circuit arrangement for increasing the bandwidth of narrowband speech signals
WO2001047335A3 (en) * 2001-04-11 2002-01-31 Phonak Ag Method for the elimination of noise signal components in an input signal for an auditory system, use of said method and a hearing aid

Similar Documents

Publication Publication Date Title
DE19604273C2 (en) Method and device for performing a search in a code book with regard to the coding of a sound signal, cell communication system, cell network element and mobile cell transmitter / receiver unit
DE19609170B4 (en) Method for carrying out a "depth first" search in a code book for coding a sound or sound signal, device for carrying out this method and cellular communication system with such a device
DE69432538T2 (en) Digital signal coding device, associated decoding device and recording medium
DE602004005784T2 (en) Improved excitation for higher-band coding in a codec based on frequency band separation coding method
DE602005002256T2 (en) MULTI-CHANNEL RECONSTRUCTION BASED ON MULTIPARPARAMETRIZATION
EP1979901B1 (en) Method and arrangements for audio signal encoding
DE69533577T2 (en) Coding and / or decoding method of a digital audio signal
DE60214358T2 (en) TIME CALENDAR MODIFICATION OF SIGNALS WITH SPECIFIC PROCEDURE ACCORDING TO DETERMINED SIGNAL TYPE
EP0750811B1 (en) Process for coding a plurality of audio signals
DE19647298C2 (en) Coding system
DE10041512B4 (en) Method and device for artificially expanding the bandwidth of speech signals
DE69533500T2 (en) METHOD AND DEVICE FOR CODING AND DECODING MESSAGES
DE60103086T2 (en) IMPROVEMENT OF SOURCE DELIVERY SYSTEMS BY ADAPTIVE TRANSPOSITION
EP0076234B1 (en) Method and apparatus for reduced redundancy digital speech processing
DE2622423C3 (en) Electrical arrangement for the transmission or storage of a speech or sound signal in coded form
DE2551632C2 (en) Method for composing voice messages
DE3736193C2 (en)
DE19742655C2 (en) Method and device for coding a discrete-time stereo signal
DE2626793A1 (en) METHOD OF EVALUATING VOICE AND VOICELESS CONDITIONS OF A VOICE SIGNAL
EP0414838A1 (en) Process for transmitting a signal.
DE1114851B (en) Device for the transmission of speech under frequency band compression in the manner of a vocoder
DE60016305T2 (en) Method for operating a speech coder
DE69830816T2 (en) Multi-level audio decoding
EP0658874B1 (en) Process and circuit for producing from a speech signal with small bandwidth a speech signal with great bandwidth
DE2811454A1 (en) Reproduction method improving quality of frequency band limited speech - by adding stored spectral signals derived from full range prototype

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8131 Rejection