DE2223973A1 - METHOD FOR CONVERTING AND EQUALIZING VOICE SIGNALS - Google Patents

METHOD FOR CONVERTING AND EQUALIZING VOICE SIGNALS

Info

Publication number
DE2223973A1
DE2223973A1 DE19722223973 DE2223973A DE2223973A1 DE 2223973 A1 DE2223973 A1 DE 2223973A1 DE 19722223973 DE19722223973 DE 19722223973 DE 2223973 A DE2223973 A DE 2223973A DE 2223973 A1 DE2223973 A1 DE 2223973A1
Authority
DE
Germany
Prior art keywords
memory
pitch
speech
register
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19722223973
Other languages
German (de)
Inventor
Helmut Dipl Ing Mangold
Helmut Schunk
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Licentia Patent Verwaltungs GmbH
Original Assignee
Licentia Patent Verwaltungs GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Licentia Patent Verwaltungs GmbH filed Critical Licentia Patent Verwaltungs GmbH
Priority to DE19722223973 priority Critical patent/DE2223973A1/en
Priority to AU55740/73A priority patent/AU472235B2/en
Publication of DE2223973A1 publication Critical patent/DE2223973A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

Verfahren zur Umsetzung und Entzerrung von Sprachsignalen Bei Unterwassereinsatz atmet der Mensch Luft, die je nach Tauchtiefe entsprechend der Zunahme des Wasserdrucksunter gesteigerten Ausgleichsdruck gesetzt wird; dies, ob er nun unter Atemmaske oder in einem Unterwasserlaboratorium tätig ist. Diese Druckluftatmung führt aber für den Menschen bei gewohnter Luftzusammensetzung und ständigem Druckwechsel zu Krankheit und wird lebensgefährlich, falls plötzlicher Druckabfall auftritt. Ursache dieser Druckluftkrankheit ist der Anteil des Stickstoffes in der Atemluft, der in Blut und Geweben druckabhängig gebunden ist, bei starker Konzentration narkotisierend wirkt und bei zu schnellem Druckabfall in Form von Gasbläschen frei wird. Die Folgen sind Kämpfe, Gasembolien und Störungen des Nervensystems bis zur Lähmung des Atemzentrums. Procedure for converting and equalizing speech signals for underwater use man breathes air, which, depending on the diving depth, decreases according to the increase in water pressure increased equalizing pressure is set; this, whether he is under a breathing mask or works in an underwater laboratory. However, this compressed air breathing leads for people with the usual air composition and constant pressure changes to illness and becomes life-threatening if a sudden drop in pressure occurs. Cause this Compressed air sickness is the amount of nitrogen in the air that is in the blood and tissue is bound in a pressure-dependent manner, narcotic at high concentrations acts and is released in the form of gas bubbles if the pressure drop is too rapid. The consequences are fights, gas embolisms and disorders of the nervous system up to paralysis of the respiratory center.

Um die Ursache dieses Effektes weitgehend zu beseitigen, hat man neuerdings den Stickstoffanteil der Atemluft teile sie oder ganz durch ein leichteres Gas ersetzt, Helium; man spricht von Heliumatmosphäre. Dieses Heliumoxygengemisch hat aber für die menschliche Sprache wegen seiner erhöhten Schallgeschwindigkeit eine zu Ver Verschiebung der Resonanzfrequenzen des Vokaltraktes zur Folge, die Formantbereiche werden je nach Gemischzusammensetzung entsprechend einer bestimmten Tauchtiefe um den Faktor 1,5 ... 2,5 nach oben versetzt. Die Stimmbandschwingungen als biomechanischer Vorgang sind davon nicht betroffen und der Sprachgrundton als Erregungsfolge des Vokaltraktes mit seinem harmoniscnen Spektrum bleibt praktisch erhalten. Die menschliche Verständigung wird durch diese Verschiebung erheblich erschwert, die Sprache klingt gequetscht.In order to largely eliminate the cause of this effect, has man Recently, they have divided the nitrogen content of the air they breathe or entirely by a lighter one Gas replaces, helium; one speaks of a helium atmosphere. This helium-oxygen mixture but has for human speech because of its increased speed of sound a shift in the resonance frequencies of the vocal tract to the consequence that Formant areas are determined according to the mixture composition Immersion depth offset upwards by a factor of 1.5 ... 2.5. The vocal cord vibrations as a biomechanical process are not affected and the basic tone of speech as The excitation sequence of the vocal tract with its harmonic spectrum remains practical obtain. Human communication becomes significant through this shift difficult, the language sounds squashed.

Durch Umsetzverfahren kann die Natürlichkeit der Sprache zum Teil zurückgewonnen werden.The naturalness of the language can be partially reduced by conversion processes to be recovered.

Eines dieser Umsetzverfahren wird beschrieben in der DT-OS 2 122 261. Dort wird die verzerrte Sprachfunktion von Analogen ins Digitale umgewandelt. Dann wird in einem ersten Register die digitalisierte Sprachfunktion während eines ersten Zeitabschnittes gespeichert und mit verminderter Geschwindigkeit während eines zweiten Zeitabschnittes ausgelesen. Während dieses zweiten Zeitabschnittes wird die digitalisierte Sprache in einem zweiten Register gespeichert, das wiederum während des ersten Zeitabschnittes mit verminderter Geschwindigkeit ausgelesen wird. Dadurch wird eine husdannung und Dehnung der Sprachfunktion erreicht. Die ZU'tabschnitte, mit denen das Signal aus den Registern ausgelesen wird, sind konstant. Wenn die Grundperioden der übertragenen Sprache zu diesen Zeitabschnitten asynchron sind, entstehen entsprechend grosse Verzerrungen.One of these conversion methods is described in DT-OS 2 122 261. There the distorted speech function is converted from analog to digital. then the digitized speech function is stored in a first register during a first Period of time and at a reduced speed during a second Read out period of time. During this second period of time, the digitized Language stored in a second register, that in turn during of the first time segment is read out at reduced speed. Through this a tension and stretching of the speech function is achieved. The TO 'sections, with which the signal is read from the registers are constant. If the Basic periods of the transmitted speech are asynchronous to these time segments, correspondingly large distortions arise.

Die Aufgabe der Erfindung besteht darin, diese Verzerrungen stark zu reduzieren.The object of the invention is to make these distortions strong to reduce.

Das Verfahren der Signalwandlung basiert auf dem Prinzip der Sprachausdünnung. Bei diesem Prinzip wird Redundanz der Sprache für verringerte Übertragungsbandbreite in der Form aufgegeben, dass man eine oder mehrere Pitchperioden weglässt und die erste dafür dehnt; am Empfangsort wird erstere wieder entsprechend schneller reproduziert und entsprechend den nun fehlanden Pitchperioden, dem Ausdünnungsfaktor, wiederholt.The signal conversion process is based on the principle of speech thinning. With this principle, redundancy of the language is used for reduced transmission bandwidth given up in the form that one or more pitch periods are omitted and the first for stretching; At the receiving point, the former is reproduced again correspondingly faster and repeated according to the now incorrect pitch periods, the thinning factor.

Man kann, wie hier, auch innerhalb der Pitchperiode einen Teil weglassen, den vorderen dehnen und analog dann wiederholen.As here, you can also omit a part within the pitch period, stretch the front and then repeat in the same way.

Ausgehend von bekannten Umsetzverfahren besteht die erfindungsgemässe Lösung der vorgenannten Aufgabe darin, dass der Start und die Umschaltung der beiden Register von Speichern zu Auslesen und umgekehrt mit Hilfe von Impulsen erfolgt, die aus der Pitchfrequenz abgeleitet sind und dass bei stimmlosen Sprachabschnitten, d.h. bei Fehlen der Pitchimpulse, automatisch eine Folge von Ersatzimpulsen eingeschaltet wird.Based on known conversion processes, there is the one according to the invention The solution to the aforementioned problem is that the start and switchover of the two Register from storage to readout and vice versa with the help of pulses, the are derived from the pitch frequency and that in the case of unvoiced Speech sections, i.e. in the absence of pitch impulses, automatically a sequence of Replacement pulses is switched on.

Die Funktionsweise des vorgeschlagenen Verfahrens zur Signalwandlung ist in Fig. i dargestellt. Hierbei ist das Originalsignal f1, die Heliumsprache, und das gewandelte Signal f21 die normale Sprache, in Form einiger Pitchperioden stilisiert dargestellt. Die Frequenzen f1 werden gewandelt um den Faktor m zu f2, die Pitchperiodendauer T bleibt dabei unverändert.How the proposed method for signal conversion works is shown in Fig. i. Here the original signal is f1, the helium language, and the converted signal f21 normal speech, in the form of a few pitch periods shown in stylized form. The frequencies f1 are converted by the factor m to f2, the pitch period T remains unchanged.

p Zur Durchführung der Wandelung wird mit zwei Registern gearbeitet, Register I und Register II, deren zeitliche Länge gleich der kürzest möglichen Pitchperiode T gewählt ist. p Two registers are used to carry out the conversion, Register I and Register II, the length of which is equal to the shortest possible pitch period T is selected.

Zu jedem Erregungszeitpunkt der Pitchfrequenz f wird abwechp selnd ein Register serieil mit der Taktgeschwindigkeit fTakt gefüllt. Ist die letzte Stelle des Registers besetzt, so wird auf reduzierte Taktfrequenz m f Takt umgeschaltet und seriell ausgelesen, und zwar so lange, bis das nächste Register voll ist und auf reduzierte Taktfrequenz schaltet. So erscheint am Ausgang des Wandlers der gedehnte Registerinhalt von Register I + II; die Register immer abwechselnd nacheinander. Wird, ausgehend von m der höchsten Pitchfrequenz, die Pitchperiode länger, so entstehen Lücken, wird sie kürzer, so wird Inhalt abgeschnitten. Bis zur Entstehung von Lücken wird immer m der m ursprünglichen Pitchperiode gedehnt wiedergegeben, danach nimmt der Anteil proportional ab.At each excitation time the pitch frequency f is alternating a register is filled with the clock speed fTakt. Is the last place of the register occupied, it is switched to reduced clock frequency m f clock and read out serially until the next register is full and switches to reduced clock frequency. The stretched one appears at the output of the converter Register content of register I + II; the registers always alternate one after the other. If, starting from m the highest pitch frequency, the pitch period becomes longer, then arise Gaps, if it gets shorter, the content is cut off. Until there are gaps is always played back expanded in the m original pitch period, then takes the proportion decreases proportionally.

Die Fig. 2 zeigt die Signalwandlung in analoger Darstellung für einen praktischen Entzerrungsfaktor von m = 2. Die Pitchperiode T ist der günstigen Darstellung wegen doppelt so p lang als die Registerlänge mit Tpmin gewählt; die gedehnten Abschnitte von Register 1 und II passen daher stossfrei aneinander. Unter Beibehaltung der festen Registerlängé entsprechend einer Zeit von Tpmin ergeben sic'h nun bei veränderlicher Pitchfrequenz die vorher geschilderten zwei Fälle; Wird die Pitchperiode länger als die doppelte feste zeitliche Registerlänge, so entstehen Lücken im gewandelten Signal, weil die gesamte Information bereits mit der halben Taktfrequenz ausgelesen wurde und das Register nun leer ist. Wird die Pitchperiode nun aber kürzer, so war ja bereits mehr als die Hälfte der Periode mit schnellem Takt in das Register eingelesen und bei Auslesung mit halber Taktfrequenz kann nur immer die Hälfte der Periode wiedergegeben werden, weil dann bereits wieder das andere Register voll ist und Umschaltung erzwingt. Für den praktischen Fall mit einer festen zeitlichen Registerlänge von 5 ms wird also für alle Pitchfrequenzen über 100 Hz genau die halbe Periode gedehnt wiedergegeben und für Frequenzen kleiner 100 Hz würden informationslose Abschnitte, Lücken, für die Zeit nach Auslesung des Inhalts eines Registers bis zur nächsten Umschaltung entstehen.Fig. 2 shows the signal conversion in an analog representation for a practical equalization factor of m = 2. The pitch period T is the most favorable representation because p is twice as long as the register length with Tpmin; the stretched sections from registers 1 and II therefore fit together seamlessly. While maintaining the fixed register length corresponding to a time of Tpmin result in variable Pitch frequency the two cases described above; The pitch period becomes longer than twice the fixed temporal register length, there are gaps in the converted Signal, because all of the information has already been read out at half the clock frequency and the register is now empty. But if the pitch period is now shorter, then it was yes, more than half of the period has already been read into the register at a fast rate and when reading out at half the clock frequency, only half of the period can be used because then the other register is full again and Force switchover. For the practical case with a fixed temporal register length of 5 ms is therefore exactly half the period for all pitch frequencies above 100 Hz reproduced stretched and for frequencies below 100 Hz would be informationless Sections, gaps, for the time after the contents of a register have been read out for the next switchover.

Die zeitliche Länge jedes Registers gleich der kürzesten Pitchperiode zu machen, verhindert den Ausfall einer Pitchperiode im funktionellen Ablauf dadurch, dass immer eine Füllung jedes Registers stattfindet und diese Füllung immer beendet ist, bevor die neue, auchdie kürzest mögliche Pitchperiode beginnt. Dieser Ausfall träfe bei Uberschneidung jede zweite Pitchperiode und bewirkte sehr störende Sprünge der Sprachmelodie in die erste Subharmonische, verbunden mit entsprechend grossen Informationslücken.The temporal length of each register is equal to the shortest Pitch period prevent the failure of a pitch period in the functional process by that there is always a filling of each register and that filling always ends before the new, even the shortest possible pitch period begins. This failure If they overlap, it would hit every second pitch period and cause very annoying jumps of the speech melody in the first subharmonic, connected with correspondingly large ones Information gaps.

Die kürzest mögliche Pitchperiode Tpmi wurde statistisch ermittelt. Sie liegt für Männerstimmen bei 5 ... 8 ms entsprechend einer Pitch- oder Intonationsfrequenz von 200 bis 250 Hz.The shortest possible pitch period Tpmi was determined statistically. For male voices it is 5 ... 8 ms corresponding to a pitch or intonation frequency from 200 to 250 Hz.

Ein Pseudopitch kann künstlich durch einen Sinus- oder Impulsgenerator erzeugt werden und zum Zwecke der Aufrechterhaltung der Registerumschaltungen während stimmloser Sprachabschnitte anstelle des dann ausfallenden normalen Pitches eingeblendet werden.A pseudopitch can be created artificially by a sine or pulse generator and for the purpose of maintaining register switchings during unvoiced speech sections are displayed instead of the normal pitch that then fails will.

Beim Auslesen der Register werden für die Lückenzeiten "Nullen" nachgeschoben. Diese "Nullen" bestehen aber je nach der Funktionsweise des Pulsmodulators aus einer Folge, durch welche die Nullinie des Demodulators, beziehungsweise dessen informationsioser Zustand bestimmt ist und die als Pausen-Information PI bezeichnet wird.When reading out the registers, "zeros" are added for the gap times. However, these "zeros" consist of one, depending on the mode of operation of the pulse modulator Result, through which the zero line of the demodulator, or its informationioser State is determined and which is referred to as pause information PI.

Ein Blockschaltbild, Fig. 3, zeigt eine ausgeführte Anordnung zur Umsetzung von Heliumsprache. Am Eingang E wird die verzerrte Heliumsprache aufbereitet in einem Vierpol SE, der eine Volumenregelung, eine Ubersteuerungsbegrenzung und eine Frequenzbandbegrenzung enthält. Aus diesem Signal wird durch eine Pitch-Extraktion PE eine Impulsfolge gewonnen, deren Frequenz gleich der Pitchfrequenz ist. Nach einer Pulsmodulation in PM wird das Signal mit Hilfe der Pitchimpulse in der Stufe SW, wie oben beschrieben, gewandelt, um dann wieder demoduliert und hörbar gemacht zu werden.A block diagram, Fig. 3, shows an implemented arrangement for Implementation of helium language. The distorted helium speech is processed at input E. in a quadrupole SE, which has a volume control, an override limiter and contains a frequency band limitation. This signal is obtained by means of a pitch extraction PE obtained a pulse train whose frequency is equal to the pitch frequency. To A pulse modulation in PM is the signal with the help of the pitch pulses in the stage SW, as described above, converted, then demodulated again and made audible to become.

Eine ausführlichere Schaltung zum Durchführen der Signalwandlung zeigt Fig. 4. Die zentrale Taktversorgung G steuert von hier aus den Modulator. Die rückgelieferten Signal- oder Codeimpulse werden über Umschaltglieder dem jeweiligen Register RI, RII seriell zugeführt. Jedes Register besitzt n Stellen. Über eine Teilerstufe T wird die Taktfolge 1 weiterhin auf unterm setzt. Das ergibt einmal den langsamen AuSlesetakt für die Register, der die Signaiwandlung bewirkt und gleichzeitig Sendetakt ist, zum anderen kann daraus eine Synchronisier-Folge für die Auffüllung der Register mit Pauseninformation Pl abgeleitet werden. Gesteuert wird der funktionelle Ablauf des Wandlers von einem n-Bit-Zähler Z, der genau nach n Takteingangsimpulsen einen'Ausgangsimpuls liefert. Diesem Zähler nachfolgend ist wieder eine Teilerstufe, mit der die wechselnde Umschaltung von Register I auf Register II erfolgt, verbunden mit dem Wech=*l vom schnellen Einlese- auf den langsamen Auslesetakt. Der Zähler Z läuft aber nicht sofort wieder los, wenn er einen Ausgangsimpuls geliefert hat, sondern erst dann, wenn ein neuer Pitchimpuls den Takteingang des Zählers wieder freigibt; eine Pitcheingangsstufe PE wird lediglich vom jeweiligen Zählerausgangsimpuls vorbereitet. Für die Zeiten stimmloser Anteile im Sprachfluss wird der natürliche Pitchimpuls durch einen Pseudopitch abgelöst. Bei Ausblendung jedes zweiten Pitchimpulses am eingang, z.B. durch eine Teilerschaltung, können auch ganze Pitchperioden gedehnt werden. Die wechselweise auf den Ausgang geschalteten Registercodes und der verlangsamte Takt von 1 . fT werden nun der Demodulation zugem leitet, so sich die entzerrte analoge Sprache gewinnen lässt.A more detailed circuit for performing the signal conversion is shown Fig. 4. The central clock supply G controls the modulator from here. The returned Signal or code pulses are transferred to the respective register RI, RII supplied in series. Each register has n places. Via a divider T the cycle sequence 1 continues to be set to unterm. That makes the slow one Read clock for the registers, which effects the signal conversion and at the same time send clock on the other hand, it can be used to create a synchronization sequence for filling up the registers can be derived with pause information Pl. The functional process is controlled of the converter from an n-bit counter Z, which generates an output pulse exactly after n clock input pulses supplies. This counter is followed by a divider level with which the changing Switchover from register I to register II takes place, combined with the change = * l from the fast read-in on the slow read-out cycle. The counter Z is not running immediately starts again when it has delivered an output pulse, but only then, when a new pitch pulse enables the clock input of the counter again; a pitch entry stage PE is only prepared by the respective counter output pulse. For the times Voiceless parts in the flow of speech become the natural pitch impulse through a pseudopitch replaced. If every second pitch pulse is faded out at the input, e.g. by a Divider circuit, entire pitch periods can also be stretched. The alternately register codes switched to the output and the slowed cycle of 1. fT if the demodulation is now fed, the equalized analogue speech lets win.

Bei Vorgegebener maximaler Pitchfrequenz fmax und einer meist max durch das Abtasttheorem bestimmten Taktfrequenz fTl ergibt sich für eine Registerlänge n folgende Beziehung: fT1 = n . fpmax Mit dem Verschiebungsfaktor von Heliumsprache m gilt für fT2, den verlangsamten Takt: fT2 = m T1 Taktfrequenz fTi' Teilungsfaktor m, Stellenzahl des Registers n als auch die Art der Pauseninformation können veränderlich gehalten werden Das Entstehen von Sicken ebenso, wie Begrenzung durch eine gewählte maximale Pitchfrequenz, wie es oben geschildert wurde, wird vermieden durch ständige Anpassung der zeitlichen Registerlänge an die Pitchfrequenz. Dadurch ergibt sich eine automatische Adaption an den jeweiligen Sprecher und somit immer optimale Registerlänge. Gemäss der Beziehung TR =n fT kann man durch Verändern der Taktsrequenz fett, die in dem in Fig. 4 geschilderten Beispiel durch den Taktgeber G geliefert wird, bei konstanter Stellenzahl n des Registers die zeitliche Registerlänge TR steuern, und zwar in der Art, dass mit fallender Pitchfrequenz die Taktfrequenz fT ebenfalls erniedrigt wird. Diese Steuerung der Registerlänge ist allgemein auch für andere Verfahren der Zeitausdünnung von Sprachsignalen anwendbar.With a specified maximum pitch frequency fmax and a mostly max The clock frequency fTl determined by the sampling theorem results for one register length n has the following relationship: fT1 = n. fpmax With the shift factor of helium language m applies to fT2, the slowed down cycle: fT2 = m T1 cycle frequency fTi 'division factor m, the number of digits in the register n and the type of pause information can be changed The emergence of beads as well as limitation by a elected maximum pitch frequency, as it was described above, is avoided by constant Adaptation of the temporal register length to the pitch frequency. This results in an automatic adaptation to the respective speaker and thus always optimal register length. According to the relationship TR = n fT, by changing the clock frequency, the in the example shown in Fig. 4 is supplied by the clock G, at constant number of digits n of the register control the temporal register length TR, and in such a way that, with falling pitch frequency, the clock frequency fT also is humiliated. This control of register length is common to others as well Method of time thinning of speech signals applicable.

Eine Weiterbildung der Erfindung sieht vor, nach der Aufbereitung die Heliumsprache durch ein Differenzverfahren, bezeichnet als Deltomodulation, in digitale Werte zu überführen. Das erbringt den Vorteil der Einbitigkeit pro Informationsschritt gegenüber der PC-M (Pulscodemodulation) oder dén Analogspeichern bei PAM (Pulsamplitudenmodulation), vereinfacht alle Operationen wesentlich und ermöglicht relativ kurze Register bei der Signalwandlung.A further development of the invention provides after processing the helium language through a differential process called delta modulation, to translate into digital values. This has the advantage of being one-bit per information step compared to PC-M (pulse code modulation) or analog memories with PAM (pulse amplitude modulation), simplifies all operations considerably and enables relatively short registers at the signal conversion.

Deltamodulation ist ein digitales Modulationswerfahren, das.Delta modulation is a digital modulation method that.

die Richtung der zeitlichen Amplitudendifferenz eines Eingangssignals bei schrittweisem Vergleich mit einem künstlich erzeugten, dem approximierten Signal, durch Rückwärtsregelung ermittelt. Das Vorzeichen der knplitudenrichtung wird durch Impulse übertragen und ist das digitale Sendesignal, In regelmässigen Intervallen, Bu Taktzeitpunkten, werden Impulse summiert und mit dem Absolutwert der Signalspannung durch einen Komparator verglichen. Ist bei diesem Vergleich der Homentanwert des Signales grösser als der vorhergehende Summenwert des Integrators, so wird ein Impuls addiert, ist er kleiner, subtrahiert. Das digitale Sendesignal, die codierte Folge, besteht nur aus zeitquantisierten, amplitudenkonstanten Ja-Nein-Schritten, die diese Summationsvorschrift übertragen.the direction of the temporal amplitude difference of an input signal at step-by-step comparison with an artificially generated, the approximated signal, determined by reverse control. The sign of the direction of the amplitude is given by Pulses are transmitted and is the digital transmission signal, at regular intervals, Bu cycle times, pulses are summed and with the absolute value of the signal voltage compared by a comparator. In this comparison, if the current value of the If the signal is greater than the previous total value of the integrator, it becomes a pulse added, it is smaller, subtracted. The digital broadcast signal, the coded sequence, consists only of time-quantized, amplitude-constant yes-no steps that these Transfer summation rule.

Ausser dem Verfahren der Deltamodulation wäre noch als weitere Möglichkeit der Digitalisierung die Umwandlung in Zweistufensprache zu erwägen. Diese Signalwandlung in einbitige, begrenzte Sprache erhöht durch die Begrenzung der Sprache auf ihre Nulldurchgänge die Störanfälligkeit und man kann Stör- und Rauschanteile während der Sprechpausen, da sie auf gleiche Amplitudenhöhe wie die Signalwerte selbst angehoben werden, durch eine zusätzliche zweite Kanalinformation, die Hullkurve , unterdriicken.In addition to the delta modulation method, there is another possibility of digitization to consider converting it into two-stage language. This signal conversion in one-bit, limited language heightened by limiting the language to theirs Zero crossings reduce the susceptibility to interference and you can get interference and noise during the speaking pauses, as they are raised to the same amplitude level as the signal values themselves are suppressed by an additional second channel information, the envelope curve.

Ein anderer knwendungsbereich des Verfahrens lieg-t in der Verzerrung natürlicher Sprache zur Verbesserung des Hörvermögens in Fällen starker Altersschwerhörigkeit. Mit zunehmendem Alter sinkt die Hörempfindlichkeit für hohe Frequenzen stark ab. So liegt im Mittel bei einem Alter von 60 Jahren die obere Frequenzgrenze bei ca. 6 kHz. In krankhaften Fällen kann diese Grenze bis auf 1 kHz und darunter absinken. Die Sprachverständlichkeit ist dadurch stark eingeschränkt. So liegt die Silbenverständlichkeit bei einer oberen Frequenzgrenze von 1 kHz nur noch bei etwa 10 bis 20 Prozent. Durch Transformation des natürlichen Sprachsprechtons in den Resthörbereich mit Hilfe des vorbeschriebenen Verfahrens kann die Sprachverständlichkeit wesentlich verbessert werden. Hier erfolgt wegen der dauernden Benutzung des Hörgerätes eine subjektive Gesöhnung an die veränderte Sprachqualität.Another area of application of the procedure lies in distortion natural language to improve hearing in cases of severe age-related hearing loss. With increasing age, hearing sensitivity for high frequencies decreases sharply. For example, at an age of 60 years, the upper frequency limit is approx. 6 kHz. In pathological cases, this limit can drop to 1 kHz and below. The speech intelligibility is severely restricted as a result. This is how syllable intelligibility lies with an upper frequency limit of 1 kHz only about 10 to 20 percent. By Transformation of the natural speech speech into the remaining hearing area with help the above-described method can significantly improve speech intelligibility will. Because of the constant use of the hearing aid, a subjective one takes place here Reconciliation to the changed language quality.

Die Benutzung normaler, lediglich verstärkender Hörgeräte hat in solchen Fällen keinen Sinn, da diese nervos bedingte Altersschwerhörigkeit sch lediglich auf die hohen Frequenzen bezieht, das Hörvermcgen für tiefe Frequenzen jedoch nicht vermindert ist. Bei Yerstärkwng würden deshalb die tiefen Frequenzen unangenehm laut werden, was zu Kopfachmerz und ähnlichen Belästigungen führt.The use of normal, only amplifying hearing aids has in such In this case, it makes no sense, as this nervous age-related hearing loss is only refers to the high frequencies, but not the hearing for the low frequencies is decreased. With Yerstärkwng, the low frequencies would therefore be uncomfortable get loud, leading to headache and similar annoyances.

Claims (6)

Patentansprüche Claims Verfahren zur Umsetzung und Entzerrung von Sprachsignalen, bei der das Sprachsignal während eines ersten Zeitabschnittes in einem ersten Speicher, während eines zweiten Zeitabschnittes in einem zweiten Speicher mit einer bestimmten Geschwindigkeit gespeichert und während des ersten Zeitabschnittes aus dem zweiten Speicher und während des zweiten Zeitabschnittes aus dem ersten Speicher mit einer anderen Geschwindigkeit ausgelesen wird, dadurch gekennzeichnet, dass der Start und die Umschaltung der beiden Speicher von Speichern zu Auslesen und umgekehrt mit Hilfe von-Impulsen erfolgt, die aus der Pitchfrequenz abgeleitet sind und dass bei stimmlosen Sprachabschnitten, das heisst bei Fehlen der Pitchimpulse, automatisch eine Folge von Ersatzimpulsen eingeschaltet wird.Method for the conversion and equalization of speech signals in which the speech signal during a first time segment in a first memory, during a second period of time in a second memory with a specific Speed stored and during the first time segment from the second Memory and during the second period of time from the first memory with a other speed is read out, characterized in that the start and the switching of the two memories from memory to readout and vice versa takes place with the help of pulses that are derived from the pitch frequency and that in the case of voiceless speech sections, i.e. in the absence of pitch impulses, automatically a sequence of substitute pulses is switched on. 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Geschwindigkeit, mit der das Sprachsignal in die Speicher eingebracht wird, von der Pitchfrequenz abhängig ist.2. The method according to claim 1, characterized in that the speed, with which the speech signal is introduced into the memory, from the pitch frequency is dependent. 3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, dass von den aus der Pitchfrequenz abgeleiteten Impulsen nur bestimmte zum Umschalten der Speicher benutzt werden.3. The method according to claim 1 and 2, characterized in that of the pulses derived from the pitch frequency are only used to switch the Memory can be used. 4. Verfahren nach Anspruch 1, 2 und 3, dadurch gekennzeichnet, dass das analoge Spracsignal vor der Umsetzung in ein digitales Signal umgewandelt wird.4. The method according to claim 1, 2 and 3, characterized in that that the analog voice signal is converted into a digital signal before the conversion. 5. Verfahren-nach Anspruch 41 dadurch gekennzeichnet, dass die Umwandlung in ein digitales Signal durch eine Deltamodulation erfolgt.5. The method-according to claim 41, characterized in that the conversion into a digital signal by means of a delta modulation. 6. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass das analoge Signal in eine Zweistufensprache umgewandelt wird.6. The method according to claim 4, characterized in that the analog Signal is converted into a two-level language. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass für mögliche Pausenzeiten die Register mit definierter Pauseninformation gefüllt werden. Method according to claim 4, characterized in that for possible Pause times the registers are filled with defined pause information.
DE19722223973 1972-05-17 1972-05-17 METHOD FOR CONVERTING AND EQUALIZING VOICE SIGNALS Withdrawn DE2223973A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE19722223973 DE2223973A1 (en) 1972-05-17 1972-05-17 METHOD FOR CONVERTING AND EQUALIZING VOICE SIGNALS
AU55740/73A AU472235B2 (en) 1972-05-17 1973-05-16 Method of converting and equalising speech signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19722223973 DE2223973A1 (en) 1972-05-17 1972-05-17 METHOD FOR CONVERTING AND EQUALIZING VOICE SIGNALS

Publications (1)

Publication Number Publication Date
DE2223973A1 true DE2223973A1 (en) 1973-12-06

Family

ID=5845085

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19722223973 Withdrawn DE2223973A1 (en) 1972-05-17 1972-05-17 METHOD FOR CONVERTING AND EQUALIZING VOICE SIGNALS

Country Status (2)

Country Link
AU (1) AU472235B2 (en)
DE (1) DE2223973A1 (en)

Also Published As

Publication number Publication date
AU472235B2 (en) 1976-05-20
AU5574073A (en) 1974-11-21

Similar Documents

Publication Publication Date Title
DE3041423C1 (en) Method and device for processing a speech signal
DE3302503C2 (en)
DE2945414C2 (en) Speech signal prediction processor and method of processing a speech power signal
DE1472004C3 (en) Method and arrangement for processing stored speech signals
DE2134931A1 (en) System and method for displaying signals, in particular by means of a cathode ray tube
DE2736082A1 (en) ELECTRONIC DEVICE FOR PHONETIC SYNTHESIS OF HUMAN LANGUAGE (SPEECH SYNTHESIZER)
DE1965480A1 (en) Device for the artificial generation of words by converting a text printed in letters into pronunciation
DE2530380A1 (en) VOICE SYNTHETIZER SYSTEM
DE2519483A1 (en) Extra compact coded digital storage - is for short word list for synthesized speech read-out from a calculator
DE3226538C2 (en) LSP voice synthesizer
DE2223973A1 (en) METHOD FOR CONVERTING AND EQUALIZING VOICE SIGNALS
DE2357949A1 (en) PROCEDURE FOR DETERMINING THE INTERVAL CORRESPONDING TO THE PERIOD OF THE EXCITATION FREQUENCY OF THE VOICE RANGES
DE2051589A1 (en) Arrangement for the synthesis of a signal
DE3101590A1 (en) METHOD AND ARRANGEMENT FOR GENERATING A VOICE SIGNAL
DE4441906C2 (en) Arrangement and method for speech synthesis
DE3037276A1 (en) TONSYNTHESIZER
DE2650101C2 (en) Method for speech synthesis according to the formant vocoder principle
CH668520A5 (en) EQUIPMENT FOR TESTING CHANNELS OF A PCM / FDM TRANSMULTIPLEXER.
AT311077B (en) Device for synthesizing audio information
DE1296212B (en) Method for the transmission of speech signals with reduced bandwidth
DE2659674C3 (en) Method and arrangement for synchronizing a semi-formant vocoder
DE2752245A1 (en) Correction or distortion of speech signals - has speech band which is modulated, limited, divided and transposed to required frequency position
DE1293235B (en) Process to improve the naturalness of synthetic sounds
AT247018B (en) Arrangement for obtaining a digitized representation of natural language
CH680030A5 (en)

Legal Events

Date Code Title Description
OD Request for examination
OF Willingness to grant licences before publication of examined application
8130 Withdrawal