DE2312356A1 - METHOD AND DEVICE FOR DETERMINING THE BASIC FREQUENCY OF VOICE SIGNALS - Google Patents

METHOD AND DEVICE FOR DETERMINING THE BASIC FREQUENCY OF VOICE SIGNALS

Info

Publication number
DE2312356A1
DE2312356A1 DE19732312356 DE2312356A DE2312356A1 DE 2312356 A1 DE2312356 A1 DE 2312356A1 DE 19732312356 DE19732312356 DE 19732312356 DE 2312356 A DE2312356 A DE 2312356A DE 2312356 A1 DE2312356 A1 DE 2312356A1
Authority
DE
Germany
Prior art keywords
difference
signal
value
excitation
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE19732312356
Other languages
German (de)
Inventor
Augustin Nemeth
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE2312356A1 publication Critical patent/DE2312356A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

1383621 Excitation frequency detector INTERNATIONAL BUSINESS MACHINES CORP 6 March 1973 [28 March 1972] 10914/73 Heading H4R Fundamental frequency of a speech signal is determined by sampling the speech signal and generating digital values representative of each sample, determining the absolute value of the difference between each successive pair of sample values, continuously summing the absolute differences to obtain for each sample "i" a function "S(i)" and detecting variations in the slope of that function to indicate the time at which the mouth cavities are excited, i.e. the time at which differences between successive sample values start to increase after a period in which they have been decreasing. As described speech is sampled at 100 Ásec intervals and digitally coded in pcm coder 1. Differences between successive samples are provided by subtractor 7 fed directly from coder 2 on one input and via a one sample period delay 4 on the other input. The absolute value of the difference is provided by unit 10. Adder 11 and register 13 enable a running total to be provided for the absolute differences, while shift registers 17 and 19, both of which provide twenty sample periods delay, allow the comparison, in subtractors 20 and 21, of the running totals at three sampling points spaced twenty sampling periods apart, to give an indication of the slopes before and after the middle sampling point. The slopes are compared in subtractor 23 to provide on line 26 the magnitude of the difference in slopes, and on line 27 the sign of the difference in slopes. When line 27 is positive, corresponding to an increase in slope of the sum of the difference signals which occurs at the commencement of the excitation period, AND gate 28 is enabled passing the signal on line 26 to line 29. The slope difference signal is filtered in digital filter 30, to remove small high frequency variations, and applied to comparator 44 and register 42, via AND gate 43 which is enabled only when the comparator 44, which compares current slope and the slope stored in register 42, provides an output indicating that the current slope is larger than the stored slope. When the opposite condition occurs the value then stored in register 42 is held and the comparator 44 output signal is fed through inverter 47, and gate 48 to bi-stable circuits 52, 53, to produce a short pulse on the output of AND gate 57 indicating the start of the excitation period. When the sign of the slope difference signal on line 49 first goes positive, prior to the commencement of an excitation period, the register 42 and bi-stable 52, 53, are reset ready to detect the following maximum slope difference indicating start of the excitation period. The units shown dotted are provided to give a variable threshold to the maximum slope difference value detector by enabling and gate 48 only when the maximum detected by the comparator 44 bears a predetermined relation, e.g. more than half, the previous maximum detected.

Description

Verfahren und Vorrichtung zur Bestimmung der Grundfrequenz von Sprachsignalen Method and device for determining the fundamental frequency of speech signals

Die Erfindung betrifft ein Verfahren zur Ermittlung der Sprachgrundfrequenz durch Bestimmung der AnregungsZeitpunkte der Mundhöhlungen bei stimmhaften Lauten, sowie eine Vorrichtung zur Durchführung dieses Verfahrens.The invention relates to a method for determining the basic speech frequency by determining the times of excitation of the oral cavities in the case of voiced sounds, as well as a device to carry out this procedure.

Die Probleme, die im Zusammenhang mit der Bestimmung von Sprachgrundfrequenzen auftreten, haben sich als äußerst diffizil erwiesen, was z.T. daran liegen mag, daß schon die Definition des Begriffes Sprachgrundfrequenz Schwierigkeiten macht. Das Hauptproblem liegt in der großen Anzahl einflußreicher Parameter, als da sind: zeitliche Änderungen der Anregungskurve und quasiperiodische Anregung der Mundhöhlungen, zeitliche Änderungen der Amplituden der Grundfrequenz oder Festlegung der Anlegungszeitpunkte der Mundhöhlungen. Der letzte dieser Parameter ist deswegen von besonderer Bedeutung, weil er in einer Anzahl von Vorrichtungen zur Messung der Grundfrequenz benutzt wird. Dieser Gebrauch ist nicht wenig überraschend, wenn man feststellt, daß die präzise Bestimmung der genauen Anregungszeitpunkte bisher noch keiner zufriedenstellenden Lösung zuge- The problems associated with the determination of fundamental speech frequencies occur, have proven to be extremely difficult, which may partly be due to the fact that the definition of the Concept of basic speech frequency causes difficulties. The main problem lies in the large number of influential parameters than there are: temporal changes in the excitation curve and quasi-periodic excitation of the oral cavities, temporal changes the amplitudes of the basic frequency or determination of the times of application of the oral cavities. The last of these parameters is of particular importance because it is used in a number of devices for measuring the fundamental frequency will. This use is not unsurprisingly when it is found that the precise determination of the exact times of excitation has not yet yielded a satisfactory solution.

309842/0790309842/0790

führt werden konnte. Tatsächlich wurde diese Schwierigkeit bisher dadurch umgangen, daß die Hypothese aufgestellt .wurde, daß die Maximalamplituden des zeitabhängig dargestellten Sprachsignals den Beginn stimmhafter Klangabschnitte markieren und damit auch denjenigen Zeitpunkt festlegen, zu dem die Mundhöhlungen angeregt werden.leads could be. In fact, this difficulty has hitherto been circumvented by making the hypothesis that that the maximum amplitudes of the speech signal shown as a function of time mark the beginning of voiced sound segments and thus also determine the point in time at which the oral cavities are stimulated.

Aufgrund dieser Hypothese gehen die bisher bekannt gewordenen Vorrichtungen zur Bestimmung von Sprachgrundfrequenzen von einer Analogdarstellung des Sprachsignals aus. Ein Maximumdetektor lokalisiert die Amplitudenmaxima des analogen Signals oder eine Anordnung zur Ermittlung schneller Spektrumsänderungen bestimmt diese Änderungen. Die Grundfrequenz wird dann durch Messung der Zeitabstände zwischen den Amplitudenmaxima oder den festgestellten spektralen Änderungen ermittelt. Jedoch ist die Relation zwischen einem auf diese Art festgestellten Zeitintervall und dem wirklichen Wert der Grundfrequenz wegen der Instabilität und der Variationen des Anregungssignals der Mundhöhlungen, wie es vom Sprechapparat der Versuchsperson erzeugt wird, niemals korrekt. Zu dieser Instabilität gesellt sich noch die aus der genannten Hypothese resultierende üngenauigkeit, nämlich die mangelhafte Korrelation zwischen den AnregungsZeitpunkten der Mundhöhlungen und den Maxima der Sprachschwingung.Based on this hypothesis, the previously known Devices for determining fundamental speech frequencies from an analog representation of the speech signal. A maximum detector localizes the amplitude maxima of the analog signal or an arrangement for determining rapid spectrum changes determined these changes. The fundamental frequency is then determined by measuring the time intervals between the amplitude maxima or determined the observed spectral changes. However, the relation between one is established in this way Time interval and the real value of the fundamental frequency because of the instability and variations of the excitation signal Oral cavities, as produced by the subject's speaking apparatus, are never correct. Added to this instability The inaccuracy resulting from the hypothesis mentioned, namely the poor correlation between the Excitation times of the oral cavities and the maxima of the Speech vibration.

Demnach besteht die wohl wichtigste Aufgabe der Erfindung darin, die tatsächlichen AnregungsZeitpunkte der Mundhöhlenschwingungen zu ermitteln. Des weiteren soll ein Verfahren angegeben werden, das mittels digitaler, und nicht analoger Berechnungen mit großer Genauigkeit die Bestimmung der Anregungszeitpunkte gestattet. Daß die dazu notwendige Anordnung möglichst einfach aufgebaut sein soll, damit sie sowohl wirtschaftlich ausnutzbar arbeitet als auch ausreichende Betriebssicherheit besitzt, versteht sich am Rande.Accordingly, the most important object of the invention is to determine the actual excitation times of the oral cavity vibrations. Furthermore, a method can be specified, the determination of the excitation times with great accuracy by means of digital, and not analogue calculations allowed. That the arrangement necessary for this should be as simple as possible so that it is both economical exploitable works as well as sufficient operational safety owns, of course.

Das Verfahren, welches die gestellte Aufgabe löst,, zeichnetThe procedure that solves the task is drawn

309842/0790309842/0790

FR 9 71 002FR 9 71 002

sich dadurch aus, daß ein die Sprachschwingung darstellendes Analogsignal abschnittweise abgetastet und der abgetastete Wert digitalisiert wird, daß für jede Abtastung der Betrag der Differenz d(i) zwischen dem für diese Abtastung und dem für die vorhergehende Abtastung ermittelten Wert bestimmt wird, daß die Beträge der Differenzen d(i) zwischen aufeinanderfolgenden Abtastungen entsprechend der Formelis characterized in that an analog signal representing the speech oscillation is sampled in sections and the sampled Value is digitized that for each sample the amount of the difference d (i) between that for this sample and the for the previous sample determined value is determined that the magnitudes of the differences d (i) between successive Samples according to the formula

i - 1i - 1

I d(i-l) 1 I d (il) 1

zu einer Summe S<i) aufaddiert werden, die den Betrag der bis zu dieser Abtastung aufgetretenen Differenzen angibt, um ein Signal zu erhalten, dessen Mittelwertkurve der sukzessiven Summen S(i) der Beträge plötzliche Änderungen des Verlaufs zu den Zeitpunkten der Anregung der Mundhöhlungen zeigt, und daß diese AnregungsZeitpunkte aus dem KurvenverlaufermitteIt werden.be added to a sum S <i), which is the amount of up to indicates the differences that have occurred during this sampling in order to obtain a signal whose mean value curve corresponds to the successive Sums S (i) of the amounts of sudden changes in the course shows the points in time of the excitation of the oral cavities, and that these points in time of excitation from the center of the curve will.

Eine vorteilhafte Vorrichtung zur Durchführung eben dieses Verfahrens, die die oben gestellten Forderungen bezüglich Wirtschaftlichkeit und Einfachheit erfüllt, ist gekennzeichnet durch einen das Sprachsignal aufnehmenden und in eine Folge digitaler Werte umformenden Codierer, eine Subtraktionsschaltung zur Berechnung der Differenz aufeinanderfolgender Abtastergebnisse, eine Einrichtung zur Bestimmung des Betrags der Differenz aufeinanderfolgender Abtastergebnisse, eine Addierschaltung, die die berechneten Differenzwerte jeweils der Summe der vorher berechneten Differenzwerte hinzufügt, wobei die sukzessiven Summen über eine Rückkopplung zwischen Ausgang und Eingang der Addierschaltung umlaufen, und einen Krümmungsdetektor, der die sukzessiven Summen der Beträge aufnimmt und jeweils dann ein Signal abgibt, wenn bei ausreichend hohen Summenwerten eine positive Krümmung auftritt.An advantageous device for carrying out this process that meets the above requirements Fulfilled economy and simplicity, is characterized by a voice signal picking up and in a sequence digital value converting encoder, a subtraction circuit for calculating the difference between successive scanning results, means for determining the amount the difference in successive sampling results, an adding circuit which the calculated difference values respectively to the sum of the previously calculated difference values, the successive sums via a feedback between The output and input of the adder circulate, and a curvature detector that the successive sums of the amounts picks up and emits a signal whenever a positive curvature occurs with sufficiently high sum values.

Weitere vorteilhafte Ausgestaltungen sowohl des Verfahrens alsFurther advantageous embodiments of both the method and

309842/0790309842/0790

FR 971 022FR 971 022

auch der Vorrichtung nach der Erfindung können den Patentansprüchen entnommen werden. Einzelheiten des Verfahrens, sowie der Wirkungsweise der Vorrichtung können der nachfolgenden Beschreibung zusammen mit den Zeichnungen entnommen werden.the device according to the invention can also meet the claims can be removed. Details of the method and the mode of operation of the device can be found in the description below taken together with the drawings.

Auf den Zeichnungen zeigt:On the drawings shows:

Fig. 1 eine graphische Darstellung der Schallschwingungen der Silbe "an" in französischer Sprache, beispielsweise aus dem Wort "chant", in Puls-Code-Modulation (PCM) ;Fig. 1 is a graphical representation of the sound vibrations the syllable "an" in French, for example from the word "chant", in pulse code modulation (PCM);

Fig. 2 eine ebensolche Darstellung des Lautes "i",2 shows a similar representation of the sound "i",

beispielsweise aus dem Wort "cigale";for example from the word "cigale";

Fig. 3 einen Ausschnitt einer Analogdarstellung des3 shows a section of an analog representation of the

durch eine menschliche Stimme hervorgerufenen Schalles;sound produced by a human voice;

Fig. 4 als Zeitfunktion den Wert der sukzessiven4 shows the value of the successive as a function of time

Summen der Absolutwerte der Differenzen aufeinanderfolgender Muster für jedes Muster;Sums of the absolute values of the differences in successive patterns for each pattern;

Fig. 5 ein Diagramm, das in Abhängigkeit von der ZeitFig. 5 is a diagram that as a function of time

die Konkavität der in Fig. 4 dargestellten Kurve zeigt;shows the concavity of the curve shown in Figure 4;

Fig. 6 einen Detektor zur Ausführung des erfindungsgemäßen Verfahrens.6 shows a detector for carrying out the method according to the invention.

Fig. 1 zeigt, wie oben bereits erwähnt, das zeitabhängige Amplitudenprogramm des Stimmschalles, der bei der französischen Aussprache der Silbe "an" aus dem Wort "chant" auftritt. Eine solche Darstellung wird erzielt durch Abtastung der AnalogschwingungAs already mentioned above, FIG. 1 shows the time-dependent amplitude program of the vocal sound that occurs during the French pronunciation the syllable "an" occurs from the word "chant". Such a representation is achieved by sampling the analog oscillation

309 84 2/07 90309 84 2/07 90

FR 971 022FR 971 022

und Codierung des Abtastergebnisses in PCM (Puls-Code-Modulation) - Jedes der auf der Kurve angebrachten Kreuze entspricht einem Abtastpunkt, wobei der zeitliche Abstand zwischen zwei Abtastpunkten 100 MikroSekunden beträgt. Eine durchgezogene. Linie verbindet die Kreuzmarkierungen, die den codierten Abtastergebnissen des Stimmsignals entsprechen, um die Veränderung dieses Signals in einer der analogen Darstellung entsprechenden Form zu zeigen. Der Vergleich eines Signals, wie es in Fig. 1 dargestellt ist, mit einem analogen Schallsignal, wie es in Fig. 3 gezeigt ist, zeigt sowohl Verwandtschaft als auch Unterschiede der verschiedenen Darstellungsweisen. Fig. zeigt die generelle Form eines Signals, das aus Anregungs- und Dämpfungsperioden,besteht. Der eigentliche Zweck solch einer digitalen Darstellung besteht in der Sichtbarmachung der Tatsache, daß das gezeigte Signal aus hohen und niedrigen Frequenzen besteht. Der Stand der Technik zeigt die Feststellung, daß die Schwingungen der Stimmbänder die Höhlungen sowohl im hinteren Mundraum als auch nahe der Lippen anregt. Die3e Höhlungen besitzen verschiedene Größen; während die ersteren relativ ausgedehnt sind, handelt es sich bei den nahe der Lippen gelegenen Höhlungen um solche geringerer Größe. Demzufolge sind auch die Resonanzfrequenzen relativ niedrig für die im hinteren Mundraum gelegenen Bereiche und entsprechend hoch für lippennahe Gebiete. Zum Zeitpunkt der Anregung der Stimmbänder werden die verschiedenen Höhlungen angeregt; ihre Schwingungen können als in Phase mit der Anregungsschwingung angesehen werden. Die Amplituden der verschiedenen Frequenzen werden addiert und die Maxima Ml, M2, M3, M4 des Schallsignals werden auf diese Art erzeugt. Sofort nach der Anregung erfolgt jedoch eine Dämpfung der Schwingungen mit verschiedenen Dämpfungskoeffizienten, die niedrigen Frequenzen werden schwächer als die hohen gedämpft. Die Dämpfung wird in Fig. 1 mittels einer durchgezogenen Linie sichtbar gemacht, die auch die wesentlich schneilere Dämpfung der hohen Frequenzen verdeutlicht. Der gesamte Kurvenverlauf hinter Punkt P zeigt, daß die hohen Frequenzen aufgrund derand coding of the scanning result in PCM (Pulse Code Modulation) - each of the crosses on the curve corresponds a sampling point, the time interval between two sampling points being 100 microseconds. A solid one. Line connects the cross marks, which correspond to the encoded sampling results of the voice signal, to indicate the change to show this signal in a form corresponding to the analog representation. Comparing a signal like it shown in Fig. 1, with an analog sound signal as shown in Fig. 3, shows both kinship and also differences in the different modes of representation. Fig. Shows the general form of a signal that consists of excitation and Damping periods. The real purpose of such a digital representation is to make visible the fact that the signal shown consists of high and low frequencies. The prior art shows that The vibrations of the vocal cords stimulate the cavities both in the back of the mouth and near the lips. The three cavities have different sizes; while the former are relatively extensive the cavities near the lips are of smaller size. So are the Resonance frequencies relatively low for the areas in the back of the mouth and correspondingly high for areas near the lips. At the time the vocal cords are stimulated, the various cavities are stimulated; their vibrations can be considered in phase can be viewed with the excitation oscillation. The amplitudes of the different frequencies are added and the maxima Ml, M2, M3, M4 of the sound signal are generated in this way. Immediately after the excitation, however, the vibrations are damped with different damping coefficients, the low frequencies are attenuated weaker than high frequencies. The attenuation is shown in Fig. 1 by means of a solid line made visible, which also illustrates the much faster attenuation of the high frequencies. The entire curve after point P shows that the high frequencies are due to the

971 O22 309842/0790971 O 22 309842/0790

bereits erfolgten starken Dämpfung praktisch keiner AmpIitudenänderung mehr unterliegen.There has already been strong damping, practically no change in amplitude more subject.

Diesen Bemerkungen, die dem Fachmann auf dem Gebiet der Erfindung vertraut sind, wird jedoch ein neuer wesentlicher Punkt hinzugefügt werden, der weiter unten im Hinblick auf zwei bereits benutzte Techniken zur Messung der Stimmgrundfrequenz erläutert werden wird. Zur Erklärung sei noch auf die in Fig. 2 gezeigte Darstellung hingewiesen, die die PCM-Darstellung des Lautes "i", wie er in französischer Sprache im Wort , "cigale" auftaucht. Hingewiesen sein ferner auf die oben bereits erwähnte analoge Darstellung einer Sprachschwingung in Fig. 3.However, these remarks, which are familiar to those skilled in the art, become a new point of concern should be added below with regard to two techniques already used to measure the fundamental vocal frequency will be explained. For explanation, reference should also be made to the representation shown in FIG. 2, which is the PCM representation of the sound "i", as it is in the French language in the word, "cigale" shows up. Please also refer to the above-mentioned analog representation of a speech oscillation in Fig. 3.

Die erste, dem Stand der Technik zuzuordnende Methode besteht darin, die Zeitpunkte des Auftretens von Maxima den Anregungszeitpunkten der Höhlungen gleichzusetzen und diese Maxima zu messen. Die genannte Gleichsetzung ist jedoch nur eine Approximation. Tatsächlich bewegt sich zum Zeitpunkt der Erregung der Mundhöhlungen das Schallsignal in der Nähe der Null-Linie, wie man es im Punkt A in Fig. 2 erkennen kann, und es erreicht sein höchstes Maximum nur im Punkt F innerhalb der beiden dargestellten Anregungsmethoden. Man ersieht klar, daß zwischen den Punkten A und F der Anregungsperioden Pl und P2 1,4 bzw. 1,7 Millisekunden Abstand liegen, d.h., daß unter der Voraussetzung einer Abtastung je 100 Millisekunden insgesamt 14 bzw. 17 Abtastungen des Signals stattfinden. Unter dieser Voraussetzung wird zur Zeit der Messung der Grundfrequenz ein Fehler eingeführt, der aus den jeder Anregungsperiode anhaftenden Unkorrektheiten resultiert. Sie beruhen auf der Tatsache, daß man jede Anregungsperiode zu dem Zeitpunkt beginnen läßt, zu dem die Mundhöhlungen ihr Anregungs maximum erreichen, anstatt sie dort beginnen zu lassen, wo die Mundhöhlungen anfangen, erregt zu werden. Mit Hilfe derartiger Vorrichtungen können demnach die tatsächlichen AnregungsZeitpunkte der Mundhöhlungen niemals ermittelt werden.The first method, which can be assigned to the prior art, consists in equating the times of occurrence of maxima with the times of excitation of the cavities and assigning these maxima measure up. However, the equation mentioned is only an approximation. Indeed, at the time of the Excitation of the oral cavities the sound signal in the vicinity of the zero line, as can be seen at point A in Fig. 2, and it only reaches its highest maximum at point F within the two illustrated excitation methods. You can see clearly that between the points A and F of the excitation periods Pl and P2 are 1.4 and 1.7 milliseconds apart, i.e. that below assuming one sampling per 100 milliseconds, a total of 14 or 17 samples of the signal take place. Under According to this requirement, an error is introduced at the time of the measurement of the fundamental frequency, which results from each excitation period inherent inaccuracies. They rely on the fact that you can start each excitation period at the time at which the oral cavities reach their maximum stimulation instead of having them begin where the oral cavities begin, getting excited. With the help of such devices, the actual stimulation times of the oral cavities can accordingly never be determined.

309842/0790309842/0790

FR 971 022FR 971 022

Hinzu kommt noch, daß Fig. 2 unter Eenutzung der PCM-Darstellung nicht nur ein, sondern sogar mehrere Maxima der Sprachschwingung deutlich macht. Demgegenüber zeigt Fig. 3 nur ein einziges Maximum, das sich klar aus einem Zeitraum maximaler Anregung der Mundhöhlungen heraushebt. Die in Fig. 2 dargestellten Maxima korrespondieren sämtlich zu einer bedeutenden Anregung der Mundhöhlungen. Demzufolge kann ein dem Stand der Technik zugehöriger Maximumdetektor beispielsweise eines der Maxima D, E oder F auswählen, wobei das während der Anregungsperiode Pl ausgewählte verschieden von dem während der nachfolgenden Periode P2 ermittelten sein kann; hierbei sollen die Perioden zum Zeitpunkt der Stimmbandanregung beginnen. Dieses Vorgehen wird demnach einen zusätzlichen Fehler zur Messung der Grundfrequenz hinzufügen, der eine Erklärung für die Instabilität und die Variationen abgeben könnte, die dem Anregungssignal der Mundhöhlungen zugeschrieben werden.In addition, FIG. 2 utilizes the PCM representation makes clear not only one, but even several maxima of the speech oscillation. In contrast, Fig. 3 shows only a single one Maximum that clearly stands out from a period of maximum stimulation of the oral cavities. Those shown in FIG Maxima all correspond to a significant stimulation of the oral cavities. As a result, one of the prior art associated maximum detector, for example, select one of the maxima D, E or F, this being done during the excitation period P1 selected can be different from that determined during the subsequent period P2; here should be the periods begin at the time of vocal cord stimulation. This procedure therefore becomes an additional error for measuring the fundamental frequency which might explain the instability and variations that the excitation signal has attributed to the oral cavities.

Die zweite, ebenfalls dem Stand der Technik zugehörige Methode besteht darin, die sprunghaften Änderungen der Sprachschwingungen in bezug auf die Zeit zu ermitteln. Hierzu benutzt man im allgemeinen einen Schwellwertdetektor, der durch die Maximalamplituden des Sprachsignals zum Zeitpunkt der maximalen Anregung der Mundhöhlungen erregt wird. Auch hier wird deutlich, daß, da jede Anregungsperiode Pl und P2 mehrere abrupte Amplitudenänderungen aufweist, der Schwellwertdetektor sowohl durch die erste dieser plötzlichen Änderungen (D) - falls dieses Maximum über dem Schwellwert liegt - eingeschaltet werden kann, als auch durch eine der nachfolgenden Maximalamplituden (E oder F), abhängig von der Einstellung des Schwellwertes im Detektor. Daraus resultiert im Endeffekt der gleiche typische Fehler wie oben bereits erläutert. Hinzu kommt noch, daß, ganz gleich welche plötzliche Amplitudenänderung für jede Anregungsperiode festgehalten wird, der dieser Änderung entsprechende Zeitpunkt niemals mit dem Zeitpunkt der Anregung der Mundhöhlungen übereinstimmt. Man könnte annehmen, daß durch Festlegung eines sehr niedrigen Schwellwertes es möglich sein müßte, beispielsweiseThe second method, also belonging to the state of the art, consists in the sudden changes in the speech vibrations to be determined in relation to time. For this purpose, a threshold value detector is generally used, which is determined by the maximum amplitudes of the speech signal is excited at the time of maximum excitation of the oral cavities. Here, too, it becomes clear that, since each excitation period Pl and P2 has several abrupt amplitude changes, the threshold detector both by the first of these sudden changes (D) - if this maximum is above the threshold value - can be switched on, as well as one of the following maximum amplitudes (E or F), depending on the setting of the threshold value in the detector. In the end, this results in the same typical error as already explained above. On top of that, it doesn't matter which sudden amplitude change is recorded for each excitation period, the point in time corresponding to this change never coincides with the moment of stimulation of the oral cavities. One might assume that by defining a very low threshold it should be possible, for example

309842/07 90309842/07 90

FR 9 71 022FR 9 71 022

in der Anregungsperiode P2 die plötzliche Änderung des Sprachsignals, die dem Maximum B entspricht, zu erkennen. In Wirklichkeit ist dies jedoch unmöglich, da man hierdurch riskierte, Maxima zu bestimmen, die mit der Auslösung der Anregung der Mundhöhlungen nichts zu tun haben". Ebenso würden bei einer Festlegung des Detektor&chwellwerts unterhalb der Amplitude des Punktes B in der Periode P2 auch Kurvenpunkte wie der Punkt X zur Auslösung des Detektors führen. Konsequenterweise legt man demzufolge den Schwellwert auf ein ausreichend hohes / Niveau, um eine Unsicherheit bezüglich des bestimmten Maximums auszuschließen.in the excitation period P2 the sudden change in the speech signal, which corresponds to the maximum B to recognize. In reality, however, this is impossible, as it risked To determine maxima that have nothing to do with triggering the excitation of the oral cavities " Definition of the detector threshold value below the amplitude of point B in period P2 also includes curve points such as the point X trigger the detector. Consequently, the threshold is set to a sufficiently high / Level in order to rule out any uncertainty regarding the determined maximum.

Daraus ergibt sich, daß keine der nach dem Stand der Technik bekannten Anordnungen überhaupt die Messung des Zeitpunkts der Anregung der Mundhöhlungen erlaubt. Alle bisher realisierten Meßmethoden sind fehlerbehaftet und im Prinzip nur Näherungsmethoden. Ein Vorgehen gemäß der Erfindung erlaubt mit der durch die elektronischen Möglichkeiten gegebenen Präzision die Bestimmung des tatsächlichen AnregungsZeitpunktes der Mundhöhlungen. Um dies durchzuführen, wird das Sprachsignal, das ja ursprünglich in analoger Form vorliegt, PCM-codiert, wie es in den Fign. 1 und 2 durch die Kreuzmarkierungen dargestellt ist. Es. wurde bereits gesagt, daß die zum Stande der Technik gehörenden Vorrichtungen charakteristische Aussagen (Maximalamplitude oder Überschreitung eines gegebenen Schwellwerts) aus dem Sprachsignal in analoger Form geschlossen haben. Das erfindungsgemäße Verfahren sowie die seine Durchführung erlaubenden Vorrichtungen ermitteln Charakteristika des Sprachsignals, nachdem man letzteres einer speziellen Behandlung unterworfen hat. Es sei beispielsweise eine Reihe von Abtastergebnissen in PCM-Modulation des Sprachsignals gegeben, dessen Einzelwerte mit einem Vorzeichen (+) oder (-) versehen sind, je nachdem, ob das Sprachsignal positiv oder negativ zum Zeitpunkt der entsprechenden Abtastung ist. In der nachfolgenden Tabelle, die sich auf Fig. 1 bezieht, seiIt follows that none of the prior art known arrangements allow the measurement of the time of excitation of the oral cavities at all. All realized so far Measurement methods are flawed and in principle only approximate methods. A procedure according to the invention allows with the precision given by the electronic possibilities the determination of the actual time of excitation the oral cavities. To do this, the voice signal, which is originally in analog form, is PCM-coded, as shown in FIGS. 1 and 2 is represented by the cross marks. It. has already been said that the State-of-the-art devices characteristic Statements (maximum amplitude or exceeding a given threshold value) from the speech signal in analog form to have. The method according to the invention and the devices that allow it to be carried out determine characteristics of the speech signal after the latter has been subjected to a special treatment. For example, let it be a series of sampling results in PCM modulation of the speech signal given, whose individual values are preceded by a sign (+) or (-) are provided, depending on whether the speech signal is positive or negative at the time of the corresponding sampling. In the table below, which relates to FIG. 1, is

FR 971 °22 309842/07 9Ö FR 971 ° 22 309842/07 9Ö

dieses Beispiel weitergeführt.continued this example.

Abtastung Nr.
Wert
Scan no.
value

1
+al
1
+ al

2 +a22 + a2

3 +a33 + a3

4 +a44 + a4

5 +a55 + a5

7
+a7
7th
+ a7

8 +a88 + a8

9 +a99 + a9

10 -alO10 -alO

11 +all11 + all

Indem man für jede Abtastung die Differenz zwischen dem ihr zugeordneten Wert und dem der vorhergehenden bestimmt und den Absolutwert der aufeinanderfolgenden Differenzen ermittelt, gewinnt man die Absolutwerte der Amplitudendifferenzen des Sprachsignals zwischen zwei aufeinanderfolgenden Abtastungen.By determining, for each sample, the difference between the value assigned to it and that of the previous one, and determines the absolute value of the successive differences, one obtains the absolute values of the amplitude differences of the Speech signal between two consecutive samples.

Für die in Fig. 1 dargestellte Kurve gewinnt man demnach die in der vorstehenden Tabelle angegebenen Werte.The values given in the table above are accordingly obtained for the curve shown in FIG. 1.

Bei Betrachtung von Fig. 1 wird man feststellen, daß die Werte dl...dlO in der Umgebung des Beginns der Anregungsperiode ebenso wie in der Umgebung des Anregungsmaximums der Mundhöhlungen ansteigen und einen höheren Wert behalten, während sie jenseits des Zeitpunktes der maximalen Anregung abnehmen und einen niedrigen Wert aufweisen. Man konstatiert demnach am Anfang einer stimmhaften Periode:Looking at FIG. 1, it will be found that the values d1 ... d10 are in the vicinity of the start of the excitation period as well as in the vicinity of the excitation maximum of the oral cavities increase and maintain a higher value while they decrease beyond the time of maximum excitation and have a low value. One states accordingly at the beginning of a voiced period:

dldl

d2 < d3 < d5 < d7d2 <d3 <d5 <d7

d8d8

etc..Etc..

Demgegenüber bilden die Werte d(i) am Ende der gleichen stimmhaften Periode eine abnehmende Reihe oder bleiben gleich. Eini ge werden sogar zu Null:In contrast, the values d (i) at the end of the same form voiced Period a decreasing series or stay the same. Some even go to zero:

d(n-7)>d(n-4)>d<n-3)>d(n--l)>d(n+3)>d(n+5) ■ 0d (n-7)> d (n-4)> d <n-3)> d (n - l)> d (n + 3)> d (n + 5) ■ 0

Dazwischen befinden sich Werte d(i), die dem Anstieg oder Abfall der Werteserien nicht folgen, z.B. d4 und d6, d(n-6) , d(n-5), d(n-2), etc. Jedenfalls wird man feststellen, daß die allgemeine Tendenz auf ein Ansteigen der Werte sofortIn between there are values d (i) that increase or decrease do not follow the series of values, e.g. d4 and d6, d (n-6), d (n-5), d (n-2), etc. In any case, one will find that the general tendency for values to rise immediately

309842/0790309842/0790

FR 971 022FR 971 022

nach dem Zeitpunkt der Anregung der Mundhöhlen und einen Abfall im weiteren Verlauf einer stimmhaften Periode hinausläuft. Dies stimmt mit der oben gemachten Feststellung bezüglich der Anregung der Stimmbänder und dem Abbau der durch die Mundhöhlungen erzeugten Frequenzen überein.after the time of stimulation of the oral cavities and a drop in the further course of a voiced period. this agrees with the statement made above regarding the stimulation of the vocal cords and the breakdown of those caused by the oral cavities generated frequencies match.

Der zweite Schritt des erfindungsgemäßen Verfahrens besteht darin, jeder Differenz d(i) zur Summe der Absolutwerte der vorhergehenden Differenzen zu addieren. Dadurch erhält man die folgenden Werte S(i):The second step of the method according to the invention consists in adding each difference d (i) to the sum of the absolute values of the previous differences. This gives you the following values S (i):

51 = dl51 = dl

52 = dl + d252 = dl + d2

53 = dl + d2 + d353 = dl + d2 + d3

54 = dl + d2 + d3 + d454 = dl + d2 + d3 + d4

I
Sx = dl + d2 + d3 + d4 + d5 + .' + dx
I.
Sx = dl + d2 + d3 + d4 + d5 +. ' + dx

Stellt man diese verschiedenen Werte S(i) als Zeitfunktion graphisch dar, so erhält man einen Punkthaufen, dessen Mittelwertkurve in Fig. 4 dargestellt ist. Die Beziehungen dieser Signalform zu der Funktion der Mundhöhlungen sind die folgenden:If one puts these different values S (i) as a function of time graphically, a cluster of points is obtained, the mean value curve of which is shown in FIG. The relationships of this Signal shape related to the function of the oral cavities are the following:

3 0-9 842/07903 0-9 842/0790

FR 971 022FR 971 022

DIFFERENZDIFFERENCE WERTVALUE ABSOLUTER WERTABSOLUTE VALUE Abtastung 1Sampling 1 +al+ al Abtastung 2
Abtastung 1
Sampling 2
Sampling 1
+a2 - al+ a2 - al dldl
Abtastung 3
Abtastung 2
Scanning 3
Sampling 2
+a3 - a2+ a3 - a2 d2d2
Abtastung 4
Abtastung 3
Sampling 4
Scanning 3
+a4 - a3+ a4 - a3 d3d3
Abtastung 5
Abtastung 4
Sampling 5
Sampling 4
+a5 - a4+ a5 - a4 d4d4
Abtastung 6
Abtastung 5
Sampling 6
Sampling 5
-a6 - a5-a6 - a5 d5d5
Abtastung 7
Abtastung 6
Sampling 7
Sampling 6
+a7 + a6+ a7 + a6 d6d6
Abtastung 8
Abtastung 7
Sampling 8
Sampling 7
+a8 - a7+ a8 - a7 d7d7
Abtastung 9
Abtastung 8
Scanning 9
Sampling 8
+a9 - a8+ a9 - a8 d8d8
Abtastung 10
Abtastung 9
Sampling 10
Scanning 9
-alO - a9-alO - a9 d9d9
Abtastung 11
Abtastung 10
Sampling 11
Sampling 10
+all - alO+ all - alO dlOdlO

309842/0790309842/0790

FR 971 G22FR 971 G22

Diejenigen Abschnitte der Kurve., die einen kräftigen Anstieg aufweisen - beispielsweise der Abschnitt A - korrespondieren mit den Zeitpunkten, die auf den Zeitpunkt der maximalen Anregung der Mundhöhlungen folgen; aufgetragen sind in Ordinatenrichtung die sukzessiven Summen S(i) als Funktion der Differenzenwerte d(i), deren Betrag.sofort nach dem Zeitpunkt der Anregung der Mundhöhlen ansteigt.Those sections of the curve which have a sharp rise - for example section A - correspond with the times following the time of maximum excitation of the oral cavities; are plotted in the ordinate direction the successive sums S (i) as a function of the difference values d (i), their amount immediately after the point in time the stimulation of the oral cavity increases.

Die Teile der Kurve, die - wie der Abschnitt B - eine geringere Steigung aufweisen, entsprechen den jeweiligen Enden der Anregungsperioden; während dieser Zeiten sind die Werte d(i) niedrig oder sogar Null.The parts of the curve which - like section B - are less Have slope correspond to the respective ends of the excitation periods; during these times the values d (i) are low or even zero.

Die Punkte C kennzeichnen eine plötzliche Steigungsänderung der Kurve ebenso wie eine Änderung der Krümmung; die Wendepunkte C treten jeweils beim Übergang von einem Abschnitt B in einen Abschnitt A auf, diese Punkte entsprechen den Zeitpunkten der Anregung der Stimmbänder zu Beginn jeder stimmhaften Periode. Tatsächlich befinden sich die Punkte C auf der Kurve zwischen den Punkten, die das Ende einer Periode B der Anregung charakterisieren und denjenigen Punkten, die den Beginn einer Anregungsperiode (Abschnitt A) bezeichnen.The points C indicate a sudden change in slope the curve as well as a change in curvature; the turning points C occur at the transition from a section B. in a section A on, these points correspond to the times of stimulation of the vocal cords at the beginning of each voiced Period. In fact, the points C on the curve are between the points that mark the end of a period Characterize B of the excitation and those points that denote the beginning of an excitation period (section A).

Sowohl die Steigungsänderung der Kurve als auch das Auftreten des Wendepunktes wird herangezogen, um die AnregungsZeitpunkte der Mundhöhlen zu charakterisieren. Diese Zeitpunkte sind aus^· gehend von den Kurvenpunkten einfach zu bestimmen, vorausgesetzt, daß zwischen der Zeitachse und diesen Punkten eine lineare Relation besteht.Both the change in the slope of the curve and the occurrence of the turning point is used to determine the excitation times to characterize the oral cavity. These times are from ^ easy to determine going from the curve points, provided that there is a linear axis between the time axis and these points Relation exists.

Die Information, daß es sich um eine plötzliche Änderung der Steigung und der Krümmung handelt, wird erhalten, indem in jedem Punkt der Kurve die Summen der Differenzen aus Fig. 4 gebildet werden, eine Messung der Differenz zwischen zwei Steigungen, die hier als inferiore Steigung PI und superiore Steigung PS bezeichnet werden soll. Führt man diese Operation für jeden Punkt der Kurve aus, so erhält man eine InformationThe information that there is a sudden change in slope and curvature is obtained by adding in at each point on the curve the sums of the differences from FIG. 4 are formed, a measurement of the difference between two Slopes, which are to be referred to here as inferior slope PI and superior slope PS. Do you perform this operation information is obtained for each point on the curve

PR 971 022 309842/0790P R 971 022 309842/0790

nicht allein bezüglich der plötzlichen Änderung der Steigung, sondern ebenso bezüglich der Krümmung der Kurve in jedem ihrer Punkte. Wird festgestellt, daß die Krümmung der in Fig. dargestellten Funktion generell negativ ist, ausgenommen die Zeitpunkte der öffnung der Stimmbänder, so bemerkt man eine rapide Änderung der Krümmung in den Punkten C. Diese Krümmungsänderung tritt näherungsweise zum gleichen Zeitpunkt auf wie die abrupte Steigungsänderung und wird in der Vorrichtung gemäß der Erfindung benutzt.not only in terms of the sudden change in slope, but also in terms of the curvature of the curve in each of them Points. If it is found that the curvature of the function shown in Fig. Is generally negative, except for the When the vocal cords open, one notices a rapid change in curvature in points C. This change in curvature occurs approximately at the same time as the abrupt change in slope and is in the device used according to the invention.

Es wurde bereits erwähnt, daß die in Fig. 4 dargestellte Kurve eine Hittelwertkurve darstellt, wobei der Mittelwert aus den Werten S(i) gebildet wird, die zum Anfang einer stimmhaften Periode eine Reihe mit ansteigenden Werten und für den Rest der Periode eine Folge abfallender Werte darstellt. Es wurde weiterhin festgestellt, daß bestimmte Werte der Folge, die hier als irreguläre Werte bezeichnet werden sollen, dieses Verhalten von Anstieg oder Abfall nicht zeigen. Folglich wird man, um das Auftreten von Fehlern zu verhindern, die durch diese irregulären Werte eingeführt werden könnten, die Operationen der Bestimmung von erprobter Krümmungs-.und Steigungsänderung durch Auswertung - für jeden Punkt der Kurve in Fig. 4 - der Werte der Steigungen PI und der Steigungen PS auf eine gleiche Anzahl N der Werte S(i) , die vorhergehen oder nachfolgen, wobei der Wert S(i) dem Berechnungspunkt der Kurve entspricht. Es soll bemerkt werden, daß die Zahl N derart ausgewählt werden soll, daß sie den Zeitpunkt der Stimmbänderöffnung für jeden Sprecher zu ermitteln gestattet. Konsequenterweise muß man denjenigen Sprecher in Betracht ziehen, dessen Zeitpunkte der Stimmbänderöffnung am nächsten beieinanderliegen. Diese Bedingung wird durch die höchsten bzw. spitzesten Frauenstimmen erfüllt, wobei sich die Stimmbänder im Durchschnitt alle drei Millisekunden öffnen. Daher muß man die Zahlenwerte von N unterhalb von ungefähr 3 Millisekunden wählen, derart, daß für jeden Punkt der Kurve in Fig. 4 zur Berechnung der Krümmung eine Sektion A großerIt has already been mentioned that the curve shown in FIG. 4 represents a mean value curve, the mean value from the Values S (i) is formed, which at the beginning of a voiced period a series with increasing values and for the remainder the period is a series of falling values. It was also found that certain values of the sequence that are to be referred to here as irregular values, do not show this behavior of rise or fall. Consequently will in order to prevent the occurrence of errors that could be introduced by these irregular values, the operations the determination of proven changes in curvature and slope through evaluation - for each point of the curve in Fig. 4 - the values of the slopes PI and the slopes PS to an equal number N of the previous values S (i) or follow, where the value S (i) corresponds to the calculation point of the curve. It should be noted that the number N is such should be selected so that it allows the timing of the opening of the vocal cords to be determined for each speaker. Consequently, one must take into account the speaker whose point in time is closest to the opening of the vocal cords lying together. This condition is fulfilled by the highest or sharpest female voices, whereby the vocal cords open every three milliseconds on average. Hence, the numerical values of N must be below approximately 3 milliseconds choose such that for each point of the curve in FIG. 4 for calculating the curvature a section A is larger

fr 971 022 309842/07 90fr 971 022 309842/07 90

Steigung und eine solche B kleiner Steigung zur Berechnung zur Verfügung steht. Bei anderer Auslegung, d.h., wenn N größer als 3 Millisekunden gewählt wird, wird die Anzahl der Punkte der Kurve, die zur Berechnung der Steigung PS und der Steigung PI dient, auch alle Punkte einer stimmhaften Periode Pl oder P2 aus Fig. 2 beinhalten. Werden in die Berechnung alle diese Punkte einbezogen, so erweist sich die Bestimmung der Krümmung in den Punkten C der in Fig. 4 dargestellten Kurve als unmöglich. Ein günstiger Wert für N ist die Zahl 20. Dieser Wert entspricht einem 2 Millisekunden dauernden Sprachsignal unter der Voraussetzung, daß die in Fig. 4 dargestellten Werte S(i) einen Abstand von 100 Mikrosekunden voneinander haben.Slope and such a B small slope is available for calculation. In the case of a different design, i.e. if N is greater is chosen as 3 milliseconds, the number of points on the curve used to calculate the slope PS and the slope PI also includes all points of a voiced period Pl or P2 from FIG. Include all of these in the calculation If points are included, the determination of the curvature at points C of the curve shown in FIG. 4 proves to be impossible. A favorable value for N is the number 20. This value corresponds to a speech signal lasting 2 milliseconds provided that the values S (i) shown in FIG. 4 are 100 microseconds apart.

Nachfolgend sollen die einzelnen Stufen der Bestimmung der Zeitpunkte beschrieben werden, zu denen plötzliche Änderungen der Kurvensteigungen vorliegen. Die Bestimmung wird realisiert für jeden Punkt i der Kurve in Fig. 4, in dem .einerseits die Differenz zwischen dem Wert S(i) in diesem Punkt und dem Wert S(i-20) im Punkt i-20 zur Bestimmung von PI(i) gebildet wird, und andererseits zur Bestimmung von PS(i) die Differenz zwischen den Werten S(i+20) und S(i) bestimmt wird. Danach wird PS(i) von PI(i) abgezogen. Für jeden Punkt i wird demnach folgende Rechnung durchgeführt:The following describes the individual stages in determining the points in time at which sudden changes occur the curve gradients are available. The determination is made for each point i of the curve in FIG. 4, in which .on the one hand the Difference between the value S (i) at this point and the value S (i-20) at point i-20 is formed to determine PI (i), and on the other hand, to determine PS (i), the difference between the values S (i + 20) and S (i) is determined. After that, will PS (i) subtracted from PI (i). The following calculation is carried out for each point i:

PI (i) - PS(i) = [S(i) - S(i-20)] - [S (i+20) - S(i)]=D(i)PI (i) - PS (i) = [S (i) - S (i-20)] - [S (i + 20) - S (i)] = D (i)

Für einige Punkte der Kurve ist die Differenz PI(i)-PS(i) positiv, für andere negativ. Ebenso ist auf Fig. 4 zu erkennen:For some points on the curve the difference PI (i) -PS (i) is positive, negative for others. It can also be seen in Fig. 4:

PIl - PSl < 0
PI2 - PS2 > 0
PIl - PSl <0
PI2 - PS2> 0

Die durchgeführten Experimente zeigen, daß die Folge der Differenzen PI(i)-PS(i) vor der den Punkt C umgebenden Zone positiver Krümmung abnimmt, einige positive oder negative und nahe Null gelegene Werte durchläuft und sodann sehr stark ansteigt.The experiments carried out show that the consequence of the differences PI (i) -PS (i) decreases in front of the zone of positive curvature surrounding point C, some positive or negative and close Runs through zero values and then increases very sharply.

309842/0 7^9 0309842/0 7 ^ 9 0

FR 971 022FR 971 022

Die Sektion der Kurven, in die Zunahme der Differenzenfolgen PI(i)-PS(i) sehr schnell erfolgt, besitzt ebenso positive Krümmung. In Fig. 5 ist der Verlauf der Mittelwerte, dargestellt, gewonnen aus den den Werten D(I)=PI(i)-PS(i) entsprechenden Punkten, außerdem ist in dieser Darstellung der relative verlauf der in Fig. 4 dargestellten Kurve mit Angabe des positiven oder negativen Vorzeichens eingetragen. In dieser Darstellung sieht man klar die plötzlichen Variationen des Wertes D(i). Die verschiedenen Punkte, die die Kurve in Fig. 5 bilden, wurden ermittelt aus den Punkten der Kurve in Fig. 4, die wie bereits erläutert wurde, zeitabhängig aufsteigende Folge aufweisen; so wurden sie korrespondierend zu Werten S(i), die jeweils teilweise unter oder über den die Punkte der Fig. 4 bildenden Mittelwerten liegen.The section of the curves in which the increase in the difference sequences PI (i) -PS (i) takes place very quickly also has positive ones Curvature. In FIG. 5, the course of the mean values is shown, obtained from the values corresponding to the values D (I) = PI (i) -PS (i) Points, in addition, this representation shows the relative course of the curve shown in FIG. 4 with indication of the positive or entered with a negative sign. In this illustration one can clearly see the sudden variations in the value D (i). The different Points forming the curve in FIG. 5 were determined from the points on the curve in FIG has been explained, have time-dependent ascending order; so they became corresponding to values S (i), each partial are below or above the mean values forming the points in FIG. 4.

Stellt man nun nicht mehr die Mittelwertkurve, sonder die Kurve der exakten Werte D(i) für einen Teil der Fig. 5 dar, wie es in der Vergrößerung einer Sektion dieser Figur gezeigt ist, so bemerkt man, daß die Serie positiver Werte der Differenz PI (i)-PS (i) sich nicht dadurch auszeichnet, daß systematisch jeder Wert größer als die ihm zeitlich vorausgehenden ist. Demnach kann man, wenn man bl...b6..etc. als die positiven Werte von PI(i)-PS(i) zu den Zeitpunkten ti...t6...etc. bezeichnet, ausgehend von Fig. 5 folgende Verhältnisse ablesen:If one no longer presents the mean value curve, but rather the curve of the exact values D (i) for a part of FIG. 5, as it is is shown in the enlargement of a section of this figure, it is noted that the series of positive values of the difference PI (i) -PS (i) is not characterized by the fact that every value is systematically greater than the one that precedes it in time. Therefore you can, if you bl ... b6..etc. than the positive values of PI (i) -PS (i) at times ti ... t6 ... etc. referred to, starting read the following relationships from Fig. 5:

bl < b2 < b3 < b5 < b6 < b4...etc.bl <b2 <b3 <b5 <b6 <b4 ... etc.

um unter diesen Werten diejenigen festzustellen, die den größten Betrag aufweisen, d.h., die der stärksten positiven Krümmung der Hittelwertkurve in Fig. 5 entsprechen, wird man eine Glättung der Kurve durchführen, vorzugsweise in digitaler Form, z.B. durch digitale Filterung der sukzessiven Werte D(i)=PI(i)-PS(i) und danach den Wert bestimmen, der den großen Betrag aufweist. Diese Stufen des erfindungsgemäßen Verfahrens sind in detaillierter Form im Rahmen der Beschreibung einer Realisierung der vorliegenden Erfindung, wie sie in Fig. 6 dargestellt ist, erläu-to identify those among these values that are the greatest Have magnitude, i.e., which correspond to the strongest positive curvature of the mean value curve in Fig. 5, one becomes a smoothing perform the curve, preferably in digital form, e.g. by digital filtering of the successive values D (i) = PI (i) -PS (i) and then determine the value that has the large amount. These steps of the process of the invention are more detailed Form in the context of the description of an implementation of the present invention, as shown in Fig. 6, explain

309842/0790309842/0790

FR 971 O22FR 971 O22

FIg. 6a zeigt die Schaltkreise zur Berechnung der Werte SCi)' der in Fig. 4 dargestellten Kurve und der Werte DCi)=PICi)-PSCi) der in Flg. 5 dargestellten Kurve; Fig. 6 stellt die Kreise zur Glättung der in Fig. 5 dargestellten Kurve sowie die Detektorkreise zur Ermittlung plötzlicher Steigungsänderungen und maximaler Krümmungen dar.FIg. 6a shows the circuits for calculating the values SCi) ' the curve shown in Fig. 4 and the values DCi) = PICi) -PSCi) the one in Flg. 5 curve shown; Fig. 6 represents the circles Smoothing of the curve shown in FIG. 5 and the detector circles to determine sudden changes in incline and maximum Curvatures.

Das vom Sprecher herrührende Signal, dessen AnregungsZeitpunkte der Mundhöhlungen bestimmt werden sollten/ wird über Leitung 1 auf die Schaltung 2 gegebenen, die einen das einlaufende Analogsignal in einen PCM-moduliertes umformenden Codierer enthält. Die Ausgangssignale des Codierers 2 werden über Leitung 3 sukzessive in das Register 4 über die Torschaltung 5 und gleichzeitig über Leitung 6 in die Subtraktionsschaltung 7 eingegeben. Das Register 4 ist so groß, daß es gerade eine Abtastung in PCM-Modu1ation des Sprachsignals aufnehmen kann. Die Subtraktionsschaltung 7 empfängt über Leitung 8 vom Ausgang des Registers 4 ein weiteres Eingangssignal. Jede in das Register 4 eingegebene Abtastung wird ihr dann wieder entnommen, wenn das nachfolgende Äbtastergebnis in die Schaltung 7 eingegeben wird. Das Weiterschieben des Abtastergebnisses in das bzw. aus dem Register 4 erfolgt unter Steuerung der Torschaltung, die durch ein Kommandosignal CSl angesteuert wird. Die Eingabe eines neuen Abtastergebnisses bewirkt gleichzeitiges Weiterschieben des vorhergehenden In die Subtraktionsschaltung 7» Demnach befinden sich in der Subtraktionsschaltung 7 zur jedem Zeltpunkt t(I) das Abtastergebnis aCD und das nachfolgende Abtastergebnis a(i+I). Ober Leitung 9 wird die durch die Subtraktionsschaltung 7 gebildete Differenz auf dem übertrager 10 gegebenen, dessen Ausgangsleitung 15 nunmehr den absoluten Wert - oder den Betrag id(i)i des Eingangssignals führt.The signal originating from the speaker, its stimulation times The oral cavities should / will be determined via line 1 given to circuit 2, one of which is the incoming analog signal in a PCM modulated transforming encoder. The output signals of the encoder 2 are successively via line 3 entered into register 4 via gate circuit 5 and at the same time via line 6 into subtraction circuit 7. Register 4 is so large that there is just one sample in PCM modulation of the speech signal can accommodate. The subtraction circuit 7 receives from the output of the register 4 via line 8 another input signal. Each scan entered in register 4 is then removed from it again when the following The scanning result is entered into the circuit 7. Moving on the scanning result into or out of register 4 takes place under control of the gate circuit, which is activated by a command signal CSl. Entering a new scan result causes the previous one to move on at the same time In the subtraction circuit 7 »are accordingly the sampling result in the subtraction circuit 7 for each time point t (I) aCD and the subsequent scanning result a (i + I). The line 9 formed by the subtraction circuit 7 is used Difference given on the transmitter 10, its output line 15 now the absolute value - or the amount id (i) i of the input signal.

Die Schleife aus Additionsschaltung 11, Leitung 12, Register 13 und Leitung 14, die vom Ausgang des Registers 13 zu einemThe loop of adder circuit 11, line 12, register 13 and line 14, from the output of the register 13 to a

309842/0790309842/0790

FR 971 022FR 971 022

Eingang der Additionsschaltung 11 zurückführt, erlaubt die Berechnung der sukzessiven Summen S(i), die erhalten werden durch Bildung der Summe der Differenz d(i) zum Zeitpunkt t(i) auf Leitung 15 und der Gesamtsumme der Differenzen vorhergehender Zeiträume^ Input of the addition circuit 11 returns, allows the calculation of the successive sums S (i) obtained by taking the sum of the difference d (i) at time t (i) on line 15 and the total of the differences from previous periods ^

= |a(i+l) - a(i)| + I |a(i) - a(i-l)= | a (i + l) - a (i) | + I | a (i) - a (il)

1 ·1 ·

Die Additionsschaltung 11 empfängt über einen ihrer Eingänge die Absolutwerte d(l)=|a(i+l)-a(i)I, die ihr über Leitung 15 vom übertrager 10 zugeführt wird. Außerdem empfängt sie die SummeThe addition circuit 11 receives the absolute values d (l) = | a (i + l) -a (i) I via one of its inputs, which it receives via line 15 from the transmitter 10 is supplied. She also receives the sum

Diese Summe erhält sie über ihren zweiten Eingang durch die Leitung 14. Die Größe des Register reicht gerade aus um diesen Wert S(i), der der oben bezeichneten Summen entspricht, aufzunehmen. Der Ausgang des Registers 13 führt demnach zu jedem Zeitpunkt die entsprechende Summe S(i), die diesem Zeitpunkt entspricht. Die in zeitlicher Abhängigkeit auftretende Wertfolge am Ausgang des Registers 13 ist in Fig. 4 dargestellt.She receives this sum via her second input through the Line 14. The size of the register is just sufficient to accommodate this value S (i), which corresponds to the sums indicated above. The output of the register 13 therefore carries the corresponding sum S (i) at each point in time, which corresponds to this point in time is equivalent to. The sequence of values occurring as a function of time at the output of register 13 is shown in FIG.

Die Werte S(i) vom Ausgang des Registers 13 werden über Leitung 16 in das Schieberegister 17 übertragen, dessen Ausgang wiederum über Leitung 18 mit dem Schieberegister 19 verbunden ist. Die Subtraktionsschaltung 20 empfängt ein Eingangssignal von Leitung 14, die ja den Ausgang des Registers 13 bildet. Der Ausgang des Registers 17 ist über Leitung 18 mit jeder der Subtraktionsschaltungen 20 und 21 verbunden. Die letztere empfängt über Leitung 22 auch die Ausgangssignale des Schieberegisters 19. Schließlich sind die Ausgangsleitungen der Subtraktionsschaltungen 20 und 21 über die Leitungen 24 und 25 mit der Subtraktionsschaltung 23 verbunden. Die Gesamtschaltung erlaubt daher die Ermittlung plötzlicher SteigungsVariationen der in Fig. 4 dargestelltenThe values S (i) from the output of the register 13 are transmitted via line 16 to the shift register 17, the output of which in turn is connected to the shift register 19 via line 18. The subtraction circuit 20 receives an input signal from line 14, which forms the output of register 13. The output of the register 17 is connected to each of the subtraction circuits 20 and 21 via line 18. The latter receives over a line 22 also the output signals of the shift register 19. Finally, the output lines of the subtraction circuits 20 are and 21 are connected to the subtraction circuit 23 via lines 24 and 25. The overall circuit therefore allows the determination sudden slope variations of that shown in FIG

309842/0790309842/0790

FR 971 022FR 971 022

Kurve ebenso wie die Ermittlung der Krümmung dieser Kurve. Die Schieberegister 17 und 19 weisen eine Kapazität auf/ die zur Speicherung von 20 Werten S(i) ausreicht. Sie arbeiten dergestalt, daß, sobald ein neuer Wert vom Register 13 ins Register 17 geschoben wird, dieser innerhalb des letzteren weiter transportiert wird und, wenn beispielsweise der Wert S(40) eingeführt wurde, der Wert S(20) auf Leitung 18 ausgegeben wird. Dieser Wert wird dann dem Schieberegister 19 zugeführt, das daraufhin den Wert S(I) auf Leitung 22 abgibt. Demzufolge befinden sich zu jedem Zeitpunkt t(i) auf den Leitungen 14, 18 und 22 die Werte S(i+20), S(i) und S(i-20). Mittels der Subtaktionsschaltungen 20, 21 und 2 3 bewirkt man demzufolge die Berechnung folgender Differenzen:Curve as well as the determination of the curvature of this curve. the Shift registers 17 and 19 have a capacity / which is sufficient to store 20 values S (i). They work in such a way that as soon as a new value is shifted from register 13 into register 17, it is transported further within the latter and, if, for example, the value S (40) has been introduced, the value S (20) is output on line 18. This The value is then fed to the shift register 19, which then outputs the value S (I) on line 22. As a result, there are too at each instant t (i) on lines 14, 18 and 22 the values S (i + 20), S (i) and S (i-20). By means of the subaction circuits 20, 21 and 2 3 the following differences are calculated:

PS(i) = S (i+20) - S(i)
PKi) = S(i) - S(i-20) D (i) = PI(I) - PS(I)
PS (i) = S (i + 20) - S (i)
PKi) = S (i) - S (i-20) D (i) = PI (I) - PS (I)

Das Resultat der sukzessiven Differenzen D(i) wird auf Leitung 26 ausgegeben, während das Vorzeichen jeder Differenz D(i) auf Leitung 2 7 verfügbar ist. Die Information bezüglich des Vorzeichens der Differenzen D(i) erlaubt, plötzliche Steigungsänderungen der Kurve in Fig. 4 festzustellen, ebenso wie die Krümmung dieser Kurve, wie es bereits im Zusammenhang mit der Beschreibung zur Fig. 5 erläutert wurde.The result of the successive differences D (i) is output on line 26, while the sign of each difference D (i) is output on line 2 7 is available. The information on the sign of the differences D (i) allows sudden changes in slope the curve in Fig. 4, as well as the curvature of this curve, as it was already in connection with the description for Fig. 5 was explained.

Demnach befinden sich auf den Leitungen 26 und 2 7 die beiden für die Bestimmung der AnregungsZeitpunkt der Mundhöhlen entscheidenden Informationen. Wenn das Niveau auf Leitung 27 einem positiven Vorzeichen der Differenz D(i) entspricht, so bedeutet dies, daß. ein plötzlicher Steigungswechsel und positive Krümmung der in Fig. 4 gezeigten Kurve und in den Maxima der in Fig. 5 gezeigten Kurve vorliegen. Die Torschaltung 28 läßt in diesem Falle die von der Subtraktionsschaltung 23 ermittelten Werte D(i) hindurch. Es seien beispielsweise bl, b2, b3 ..., die das erste Maxium der in Fig. 5 dargestellten Kurve entsprechenden Werte D(i). Wie eben-Accordingly, the two decisive factors for determining the stimulation time of the oral cavity are located on lines 26 and 2 7 Information. If the level on line 27 corresponds to a positive sign of the difference D (i), this means that. a sudden change in slope and positive curvature of the curve shown in FIG. 4 and in the maxima of that shown in FIG Curve present. In this case, the gate circuit 28 lets the values D (i) determined by the subtraction circuit 23 through. It for example, let bl, b2, b3 ..., which are the first maxium of the in The curve shown in FIG. 5 corresponds to values D (i). Just like before-

971 022 309842/0790......971 022 309842/0790 ......

falls in Fig. 5 gezeigt, ist das Vorzeichen von D(i) positiv und demzufolge wird die Wertreihe hl, b2r b3 ... über Leitung 29 auf das digitale Filter 3O übertragen, welch letzteres die Richtungskoeffizienten beinhaltet. Das Filter 30 ist in bekannter Weise aus vier Schieberegistern 31, 32, 33 und 34 sowie einer Summierschaltung 35 zusammengesetzt, welch letztere durch die Leitungen 36, 37, 3V8 und 39 mit den Schieberegistereingängen verbunden und durch die Leitung 40 an den Ausgang des Schieberegisters 34 angeschlossen ist. Die Ausgangsleitung 41 der Summierschaltung 35 überträgt die durch Glättung aus den Werten D(i) entstandenen Werte D1Ci). Man erhält demnach aus der Wertfolge bl, b2, b3 ..., die dem Filter '30 zugeführt werden, auf Leitung 41 Ausgangswerte b'l, b'2, b'3 ... . Die aus der Gesamtheit der Punkte b'l, b'2, b'3 ... durch Verbindung erhaltene Kurve ist strichpunktiert in Fig. 5 dargestellt» Diese Kurve bzw. Gerade ist durch Glättung der durchgezogenen Linie entstanden.if shown in FIG. 5, the sign of D (i) is positive and consequently the series of values hl, b2 r b3 ... is transmitted via line 29 to the digital filter 3O, the latter containing the directional coefficients. The filter 30 is composed in a known manner of four shift registers 31, 32, 33 and 34 as well as a summing circuit 35, which the latter is connected to the shift register inputs via lines 36, 37, 3 V 8 and 39 and to the output of the via line 40 Shift register 34 is connected. The output line 41 of the summing circuit 35 transmits the values D 1 Ci) produced by smoothing from the values D (i). Accordingly, from the sequence of values bl, b2, b3 ... which are fed to the filter '30, output values b'1, b'2, b'3 ... are obtained on line 41. The curve obtained from the entirety of the points b'1, b'2, b'3 ... by connection is shown in dash-dotted lines in FIG. 5. This curve or straight line was created by smoothing the solid line.

Die Viertfolge b'l, b'2, b'3 ..* wird danach untersucht, um den größten der Werte zu bestimmen, der ja - wie es bei der Beschreibung des Verfahrens bereits erläutert worden ist - als Mittel zur Bestimmung des Anregungszeitpunktes der Mundhöhlungen dient. Die Bestimmung des Maximalwertes wird realisiert mit Hilfe einer Gesamtschaltung, die nachfolgend näher beschrieben werden soll. Das Register 42 empfängt sukzessive über di"e Torschaltung 43 die Werte b'l, br2, b'3 ..., die über Leitung 41 abgegeben werden. Die Subtraktion^- und Vergleichsschaltung 44 empfängt an einem ihrer Eingänge die genannten Werte, während sie am anderen Eingang die über Leitung 45 vom Register 42 ausgegebenen Ausgangswerte aufnimmt. Die Ausgangsleitung der Schaltung 44 führt eine Information, die, was das Vorzeichen des Vergleichs betrifft, über Leitung 46 der Torschaltung 43 und dem Inverter 47 zugeführt wird. Der Ausgang 50 des Inverters 47 bildet einen Eingang der Torschaltung 48. Diese Torschaltung empfängt außerdem über Leitung 49 ein Eingangssignal, das vom Ausgang 27 der Subtraktionsschaltung 23 herstammt. Dieses Signal ist die DifferenzThe fourth sequence b'l, b'2, b'3 .. * is then examined in order to determine the largest of the values, which - as has already been explained in the description of the method - is used as a means for determining the point in time of excitation Serves oral cavities. The maximum value is determined with the aid of an overall circuit, which will be described in more detail below. The register 42 successively receives the values b'1, b r 2, b'3 ... via the gate circuit 43, which are output via line 41. The subtraction and comparison circuit 44 receives the values mentioned at one of its inputs , while at the other input it receives the output values output by the register 42 via line 45. The output line of the circuit 44 carries information which, as regards the sign of the comparison, is fed via line 46 to the gate circuit 43 and to the inverter 47. The output 50 of the inverter 47 forms an input of the gate circuit 48. This gate circuit also receives an input signal via line 49 which originates from the output 27 of the subtraction circuit 23. This signal is the difference

fr 971 O22 309 8 42/07 9 0fr 971 O22 309 8 42/07 9 0

PI(i) - PS(i). Während des Betriebs werden die Werte in das Register 42 und den Vergleicher 44 eingegeben. Zuerst wird b'l in das Register 42 eingegeben, sobald sich b'2 einstellt/ wird es in den Vergleicher 44 eingeführt. Gleichzeitig erfolgt seine Eingabe in das Register 42, aus dem es den Xtfert b'l über Leitung 45 in den Vergleicher 44 überträgt. Ist b'2 größer als b'l, so führt die Ausgangsleitung 46 der Schaltung 44 hohes Niveau. Demzufolge läßt die Torschaltung 43 den Wert b'3 hindurch, worauf dieser in das Register 42 aufgenommen wird. Dadurch wird wiederum der Wert b'2 auf Leitung 45 in den Vergleicher 44 übertragen, der zum gleichen Zeitpunkt über Leitung 41 den Wert b'3 empfängt. Es wird eine neue Vorzeichenbestimmung durch Vergleich (b'3 - b'2) durchgeführt und dieser Vorgang wird wiederholt, bis die Differenz zwischen sukzessiven Werten negativ wird. Betrachtet man dazu Fig. 5, so stellt man fest, daß die Bedingung "niedriges Niveau" auf Leitung 46 für den Wert b'6 gegeben ist/ da b'6 - b'5 kleiner als Null ist. Zu diesem Zeitpunkt ist die Torschaltung 43 nicht mehr offen, so daß das Register 42 keine weiteren Werte aufnehmen kann. Damit ist der Zeitpunkt des Auftretens einer plötzlichen Steigungsänderung bestimmt. Herrscht auf Leitung 46 ein niedriges Niveau, so führt Leitung 50 aufgrund des Inverters 47 ein hohes Niveau. Demzufolge ist auch ein Eingang der Torschaltung 48 auf entsprechend hohem Niveau. Der zweite Eingang der Torschaltung 48, an den die Leitung 49 angeschlossen ist, liegt ebenfalls auf hohem Niveau, vorausgesetzt, daß ein Kurvenbereich abgetastet wird (Fig. 4), der positive Krümmung (Fig. 5) besitzt und demzufolge auf Leitung 27, die den Ausgang der Subtraktionsschaltung 23 bildet, ebenfalls hohes Niveau herrscht. Bis hierher ist die gesamte gestrichelt angedeutete Zeichnung in Fig. 6b in der Beschreibung noch nicht erwähnt worden, so daß auch der dritte Eingang der Torschaltung 48 bislang unberücksichtigt bleiben kann. Da gerade gesehen wurde, daß im Augenblick der Bestimmung der ersten negativen Differenz - im gewählten Beispiel b'6 - b'5 - die Leitungen 50 und 49 beide auf hohemPI (i) - PS (i). During operation, the values are in the register 42 and the comparator 44 entered. First, b'l entered into register 42 as soon as b'2 is established / becomes it is introduced into the comparator 44. At the same time, it is entered into register 42, from which Xtfert b'l transmits to the comparator 44 via line 45. If b'2 is greater than b'l, the output line 46 leads the circuit 44 high level. As a result, the gate circuit 43 lets the value b'3 through, whereupon this is recorded in the register 42. As a result, the value b'2 on line 45 is again fed into the comparator 44, which at the same time receives the value b'3 via line 41. There will be a new sign determination carried out by comparison (b'3 - b'2) and this The process is repeated until the difference between successive values becomes negative. If one considers Fig. 5, it is found that the condition "low level" is given on line 46 for the value b'6 / since b'6 - b'5 are smaller than is zero. At this point in time the gate circuit 43 is no longer open, so that the register 42 does not have any further values can accommodate. This determines the point in time when a sudden change in gradient occurs. Reigns on the line 46 is low, line 50 is high due to inverter 47. Hence there is also an entrance the gate circuit 48 at a correspondingly high level. The second input of the gate circuit 48 to which the line 49 is connected is also at a high level, provided that a curve area is scanned (Fig. 4), the positive curvature (Fig. 5) and consequently on line 27, which forms the output of the subtraction circuit 23, there is also a high level. Up to this point, the entire drawing indicated by dashed lines in FIG. 6b is in the description has not yet been mentioned, so that the third input of the gate circuit 48 has not yet been taken into account can. Since it has just been seen that at the moment of determining the first negative difference - in the example chosen b'6 - b'5 - lines 50 and 49 both on high

FR971022 309842/0790FR 971022 309842/0790

Niveau liegen, wird sich die Ausgangsleitung 51 der Torschaltung 48 ebenfalls auf hohem Niveau befinden. Der auf dieser LeitungLevel, the output line 51 of the gate circuit will be 48 are also at a high level. The one on this line

51 eingetretene Wechsel von tiefem auf hohes Niveau wird auf die beiden in Kaskade geschalteten bistabilen MuItivibratorenA change from low to high level that has occurred is caused by the two bistable multivibrators connected in cascade

52 und 53 übertragen. Der Ausgang der Schaltung 52 wird mittels Leitung 54 auch der Schaltung 53 zugeführt. Die Leitung 54 ist außerdem mit einem Eingang der Torschaltung 55 verbunden, deren zweiter Eingang an den Ausgang des Multivibrators 53 über Leitung 56 angeschlossen ist. Diese Schaltung vermeidet ein kontinuierliches hohes Niveau auf Leitung 57, die den Ausgang der Torschaltung 55 bildet, solange auf den Leitungen 27 und 49 (Bedingung: positive Krümmung) ebenfalls hohes Niveau herrscht; tatsächlich bewirkt der Multivibrator 53 einen sehr schnellen Abfall der Leitung 57 auf niedrigem Niveau. Mann kann demnach am Ausgang der erfindungsgemäßerb Schaltung jeweils zum Zeitpunkt der Anregung der Mundhöhlen einen kurzen rechteckigen Impuls abnehmen. Eine Leitung 58 verbindet den Ausgang eines Inverters 59 mit dem Register 42 und den bistabilen Multivibratoren 52 und 53. Diese Leitung befindet sich auf niedrigem Niveau, solange die Differenzwerte PI(i) - PS(i) positiv sind. Sobald diese Differenz negativ wird, erhöht sich das Niveau der Leitung 49, worauf Leitung 58 wiederum niedriges Niveau führt, wodurch die Multivibratoren 52 und 5 3 sowie das Register 42 zurückgestellt werden und daher für die nächste stimmhafte Periode bereit sind.52 and 53 transferred. The output of circuit 52 is also fed to circuit 53 via line 54. The line 54 is also connected to one input of the gate circuit 55, the second input to the output of the multivibrator 53 via line 56 is connected. This circuit avoids a continuous high level on line 57, which is the output of the Gate circuit 55 forms as long as there is also a high level on lines 27 and 49 (condition: positive curvature); in fact, the multivibrator 53 causes the line 57 to drop very rapidly at a low level. So you can at the output of the circuit according to the invention in each case at the point in time take a short rectangular pulse from the stimulation of the oral cavity. A line 58 connects the output of an inverter 59 with the register 42 and the bistable multivibrators 52 and 53. This line is at a low level as long as the difference values PI (i) - PS (i) are positive. As soon as this difference becomes negative, the level of conduction increases 49, whereupon line 58 again leads to a low level, whereby the multivibrators 52 and 5 3 as well as the register 42 deferred and therefore ready for the next voiced period.

Die eben in Zusammenhang mit Fig. 6 beschriebene Schaltung zur Durchführung des erfindungsgemäßen Verfahrens kann noch durch die gestrichelt gezeichneten Schaltungsteile perfektioniert werden. Durch diese Schaltungsteile soll eine variable Detektorschwelle vorgesehen werden. Daß eine solche variable Schwelle sinnvoll ist, ergibt sich bei näherer Betrachtung der Fig. 5. Die Gesamtheit der Werte D(i), die in dieser Figur dargestellt ist, ist nicht nur dann positiv, wenn in Fig. 4 plötzliche Steigungsänderungen auftreten. Man sieht auch, daß Fig. 4 Sektionen positiver Krümmung von kurzer Dauer aufweist,The circuit just described in connection with FIG. 6 for carrying out the method according to the invention can also be carried out the circuit parts shown in dashed lines are perfected. These circuit parts are intended to create a variable detector threshold are provided. That such a variable threshold is useful becomes apparent on closer inspection of Fig. 5. The totality of the values D (i) shown in this figure is not only positive when suddenly in FIG Incline changes occur. It can also be seen that Fig. 4 has sections of positive curvature of short duration,

FR971 022 309842/0790FR 971 022 309842/0790

die aufgrund schwacher Steigungsänderungen auftreten. Dieser Variationstyp ist nur aleatorisch und darf das in Fig. 6 dargestellte System keine falschen, das Auftreten von Anregungszeitpunkten anzeigende Signale abgeben lassen. which occur due to weak slope changes. This type of variation is only random and may be that shown in FIG Do not allow the system to emit any false signals indicating the occurrence of excitation times.

Die Schaltung zur Schv/ellenvariation besteht grundsätzlich aus einem Schwellenregister 60, welches Eingangssignale von einer Torschaltung 61 empfängt, und einer Subtraktions-Vergleichsschaltung 62, deren einer Eingang mit dem Ausgang des Registers 60 und deren anderer Eingang mit dem Ausgang des Registers 42 über die Leitung 45a verbunden ist. Der Ausgang des Vergleichers 62 liefert seine Signale über Leitung 6 3 auf die Torschaltung 48 und über Leitung 63a auf die Torschaltung 61. Letztere hat einen zweiten Eingang, der über Leitung 46b, den Inverter 64, Leitung 46a und Leitung 46 mit dem Ausgang der Vergleichsschaltung 44 verbunden ist. Ein dritter Eingang der Torschaltung ist über Leitung 45b an den Ausgang des Registers 42 angeschlossen. The circuit for the threshold variation basically consists of a threshold register 60, which receives input signals from a Gate circuit 61 receives, and a subtraction comparison circuit 62, one input with the output of the register 60 and the other input with the output of the register 42 is connected via line 45a. The output of the comparator 62 delivers its signals via line 6 3 to the gate circuit 48 and via line 63a to the gate circuit 61.The latter has a second input, which via line 46b, the inverter 64, Line 46a and line 46 are connected to the output of the comparison circuit 44. A third input of the gate circuit is connected to the output of register 42 via line 45b.

Im Betrieb wird dem Register 60 eine Schwelle des Wertes S(FIg. 5) zugeführt. Dieser Wert ist so ausgewählt, daß die Sektionen positiver Krümmung der Kurve in Fig. 4 nicht berücksichtigt und über Leitung 51 (Fig. 6b), sobald sie entdeckt werden, übertragen werden. Sobald die Wertreihe b' 1, b · 2 , b'3 ... aus dem Register 42 in die Vergleichsschaltung 44 übertragen wird, werden diese Werte sukzessive über Leitung 45a dem Vergleicher 62 z.ugeleitet. So wird im Fall des Auftretens einer unechten positiven Krümmung beim Vergleich des Wertes b'l in der Schaltung 62 über Leitung 6 3a ein niedriges Niveau ausgegeben, da b'l - S kleiner als Null ist. Demzufolge ist dann das Niveau des ersten Eingangs der Torschaltung 61 niedrig. Daher wird der Inhalt des Registers 60 nicht geändert. Gleichzeitig ist auch das Niveau auf Leitung 6 3 niedrig, so daß demzufolge, sobald das Niveau auf Leitung 56 absinkt, keinerlei Informa- . tion über die Torschaltung laufen kann, da der zweite Eingang dieser Torschaltung niedriges Niveau, der dritte Eingang (Lei-In operation, the register 60 is a threshold of the value S (Fig. 5) fed. This value is selected so that the sections of positive curvature of the curve in FIG. 4 are not taken into account and via line 51 (Fig. 6b) as soon as they are detected. As soon as the series of values b '1, b · 2, b'3 ... from the Register 42 is transferred to the comparison circuit 44, these values are successively fed to the comparator 62 z via line 45a. So in the event of a spurious occurrence positive curvature when comparing the value b'l in the circuit 62 via line 6 3a output a low level because b'l - S is less than zero. As a result, the level of the first input of the gate circuit 61 is then low. Hence will the content of register 60 is not changed. At the same time, the level on line 6 3 is also low, so that, as a result, as soon as the level drops on line 56, no information whatsoever. tion can run via the gate circuit as the second input this gate circuit low level, the third input (line

FR 97X022 . 309842/0790., FR 97X022. 309842/0790.,

tung 49) hohes Niveau hat. Durch diese Maßnahme wird keine Sektion positiver Krümmung, die niedriger als die Schwelle S liegt, bestimmt und über Leitung 51 übertragen werden. Im Falle eines Anregungszeitpunktes werden die Werte des Abschnitts der positiven Krümmung oberhalb der Schwelle S liegen, so daß, beispielsweise für den Wert b'l, die Linie 6 3a sich auf hohem Niveau befindet, da b'l - S größer als Null ist. Während des gesamten Anstiegs der geglätteten Kurve in Fig. 5 wird sich das Niveau auf Leitung 46a oben und auf 46b unten befinden. Demzufolge kann keinerlei Wert vom Register 42 über Leitung 45b und Torschaltung 61 in das Register 6O übertragen werden. Sobald jedoch der erste Wert (b'6 z.B. auf Fig. 5) niedriger als der vorhergehende Wert liegt, wird der Vergleicher 44 wegen b'5 - b'6 kleiner als KuIl das Niveau von Leitung 46 absinken. Daraufhin kann in das Register 42 nichts mehr übertragen werden. Ebenso wird sich Leitung 46a auf niedrigem Niveau befinden, so daß Leitung 46b hohes Niveau aufweist und der Wert b'6 vom Register 42 in das Schwellwertregister 60 über die Torschaltung 61 gebracht werden kann. Dieser neue Wert b'6 wird wie für die Bestimmung des nachfolgenden AnregungsZeitpunkts maßgebende Schwelle sein. Besteht die Gefahr, daß die Änderungen der Grundfrequenz derart groß ist, daß sich eine solche Schwelle als zu hoch erweist, genügt es beispielsweise, zwischen die Register 42 und 60 einen den Schwellwert halbierenden Teiler zu setzen. Der im Register 60 enthaltene Schwellwert wird sich zu jedem Anregungszeitpunkt der Hundhöhlungen ändern, da sich zu jeder Erregung das Maximum der in Fig. 5 dargestellten Kurve ändert.tung 49) has a high level. As a result of this measure, no section of positive curvature that is lower than the threshold S is determined and transmitted via line 51. In the case of an excitation time, the values of the section of the positive curvature will be above the threshold S, so that, for example for the value b'l, the line 6 3a is at a high level, since b'l-S is greater than zero. Throughout the rise of the smoothed curve in FIG. 5, the level on line 46a will be at the top and on 46b at the bottom. As a result, no value whatsoever can be transferred from register 42 via line 45b and gate circuit 61 into register 60. However, as soon as the first value (b'6, for example on FIG. 5) is lower than the previous value, the comparator 44 will drop the level of line 46 because b'5-b'6 is less than KuIl. Thereupon nothing more can be transferred to the register 42. Likewise, line 46a will be at a low level , so that line 46b is at a high level and the value b'6 can be brought from register 42 into threshold value register 60 via gate circuit 61. This new value b'6 will be the decisive threshold for determining the subsequent excitation time. If there is a risk that the changes in the fundamental frequency are so great that such a threshold turns out to be too high, it is sufficient, for example, to place a divider between registers 42 and 60 that halves the threshold value. The threshold value contained in register 60 will change at each point in time of excitation of the dog cavities, since the maximum of the curve shown in FIG. 5 changes with each excitation.

Daher wird zum Zeitpunkt der Erregung der Mundhöhlungen Leitung 50 hohes Niveau führen, sobald das erste negative Resultat des Vergleichers 44 erscheint (z.B. b'6 - b'5 in Fig. 5); Leitung 49 wird hohes Niveau führen, da das Resultat der Differenz PI(i) - PS(i) in der Subtraktionsschaltung 23 positiv ist, ebenso wird Leitung 63 hohes Niveau führen, da das ResultatTherefore, at the time of excitation of the oral cavities, conduction 50 will have a high level as soon as the first negative result of comparator 44 appears (e.g., b'6-b'5 in Figure 5); management 49 will lead to a high level, since the result of the difference PI (i) - PS (i) in the subtraction circuit 23 is positive, likewise, lead 63 will lead high level as the result

fr 9 71 022 309842/07 90fr 9 71 022 309842/07 90

des Vergleichs zwischen den Werten aus dem Register 42 und der Schwelle positiv ist. Demzufolge ist auch - wie oben gezeigt wurde - Leitung 52 erregt.of the comparison between the values from register 42 and the threshold is positive. As a result, as shown above was energized - line 52.

Auch auf der Ausgangsleitung 5 7 der Gesamtschaltung, wie sie in Fig. 6 dargestellt ist, wird demnach die die AnregungsZeitpunkte der Mundhöhlungen charakterisierende Information auftreten. Bei jeder Anregung tritt ein Rechteck-Impuls auf, der zur Messung der Grundfrequenz der Sprachschwingungen benutzt werden kann, z.B., indem man das Zeitintervall zwischen zwei aufeinanderfolgenden Impulsen bestimmt. Geeignete Schaltungen zum Messen derartiger Zeitabstände sind aus dem Stande der Technik bekannt.Also on the output line 5 7 of the overall circuit like them is shown in Fig. 6, is accordingly the excitation times information characterizing the oral cavities occur. With every excitation a square-wave pulse occurs which leads to Measurement of the fundamental frequency of speech vibrations can be used, e.g. by measuring the time interval between two successive pulses determined. Suitable circuits for measuring such time intervals are known in the art Technology known.

309842/0790309842/0790

FR 9 71 022FR 9 71 022

Claims (8)

PATENTANSPRÜCHEPATENT CLAIMS 1. j Verfahren zur Ermittlung der Sprachgrundfrequenz durch ' Bestimmung der AnregungsZeitpunkte der Mundhöhlungen bei stimmhaften Lauten, dadurch gekennzeichnet, daß ein die Sprachschwingung darstellendes Analogsignal abschnittweise abgetastet und der abgetastete Wert digitalisiert wird,1. j Method for determining the basic speech frequency by determining the times of excitation of the oral cavities for voiced sounds, characterized in that an analog signal representing the speech oscillation is sampled in sections and the sampled value is digitized, daß für jede Abtastung der Betrag der Differenz d(i) zwischen dem für diese Abtastung und dem für die vorhergehende Abtastung ermittelten Wert bestimmt wird, daß die Beträge der Differenzen d(i) zwischen aufeinanderfolgenden Abtastungen entsprechend der Formelthat for each scan the magnitude of the difference d (i) between that for this scan and that for the previous one Sampling determined value is determined that the amounts of the differences d (i) between successive Samples according to the formula i - 1i - 1 Σ d(i-l)Σ d (i-l) zu einer Summe S(i) aufaddiert werden, die den Betrag der bis zu dieser Abtastung aufgetretenen Differenzen angibt, um ein Signal zu erhalten, dessen Mittelwertkurve der sukzessiven Summen S(i) der Beträge plötzliche Änderungen des Verlaufs zu den Zeitpunkten der Anregung der Mundhöhlungen zeigt, undbe added to a sum S (i), which is the amount of indicates the differences that have occurred up to this sampling in order to obtain a signal whose mean value curve of the successive sums S (i) of the amounts sudden changes in the course at the times of the excitation showing the oral cavities, and daß diese AnregungsZeitpunkte aus dem Kurvenverlauf ermittelt werden.that these excitation times are determined from the course of the curve. 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die digitalisierten Abtastsignale PCM-moduliert werden.2. The method according to claim 1, characterized in that the digitized scanning signals are PCM-modulated. 3. Verfahren nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, daß die Ermittlung der AnregungsZeitpunkte aus dem Kurvenverlauf folgende Verfahrensschritte einschließt:3. The method according to any one of claims 1 or 2, characterized in that the determination of the excitation times from the course of the curve includes the following process steps: a) aus den Summen S(i) der Beträge wird die Steigungsänderung der Mittelwertkurve dieser Summen ermittelt, indem für jede Summe berechnet wird:a) the change in slope of the mean value curve of these sums is determined from the sums S (i) of the amounts, by calculating for each sum: FR 972 022 309842/07 90FR 972 022 309842/07 90 eine erste Differenz zwischem dem Wert der Summe S(i) und dem der Summe S (i- η) , · eine zweite Differenz zwischen dem Wert der Summe S (i+n) und dem der Summe S(i),a first difference between the value of the sum S (i) and that of the sum S (i- η), a second difference between the value of the sum S (i + n) and that of the sum S (i), eine dritte Differenz zwischen den Resultaten der ersten und zweiten Differenzbildung, wobei das Ergebnis dieser dritten Differenzbildung die Information bezüglich plötzlicher Steigungsänderung in Form eines Vorzeichenwechsels vom Negativen zum Positiven in sich trägt;a third difference between the results of the first and second difference formation, where the The result of this third difference formation is the information relating to a sudden change in gradient in the form of a sign change from negative to positive; b) innerhalb der Gruppe positiver Resultate der dritten Differenzbildung wird das Resultat bestimmt, welches den größten Wert aufweist;b) within the group of positive results of the third subtraction, the result is determined which has the greatest value; c) abhängig vom Resultat der dritten Differenzbildung, welches positives Vorzeichen und innerhalb einer vorgebbaren Gruppe maximale Größe aufweist, wird ein die Anregung der Mundhöhlungen anzeigendes Signal generiert.c) depending on the result of the third difference formation, which positive sign and within a predeterminable one Group has maximum size, a signal indicating the excitation of the oral cavities is generated. 4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß die Zahl "n;: = 20 gewählt wird.4. The method according to claim 3, characterized in that the number "n ;: = 20 is selected. 5. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß ein die Anregung der Mundhöhlungen charakterisierendes Signal nur dann erzeugt wird, wenn der Betrag der dritten Differenzbildung einen in Abhängigkeit vom Sprachsignal einstellbaren Schwellwert überschreitet.5. The method according to claim 3, characterized in that a stimulation of the oral cavities characterizing Signal is only generated when the amount of the third subtraction is a function of the speech signal the adjustable threshold. 6. Vorrichtung zur Durchführung des Verfahrens nach mindestens einem der Ansprüche 1 bis 5, gekennzeichnet durch einen das Sprachsignal aufnehmenden und in einer Folge digitaler Werte umformenden Codierer, eine Subtraktionsschaltung zur Berechnung der Differenz aufeinanderfolgender Abtastergebnisse, eine Einrichtung zur Bestimmung des Betrags der Differenz aufeinanderfolgender Abtastergebnisse, eine Addierschaltung, die die berechneten Differenz-6. Device for performing the method according to at least one of claims 1 to 5, characterized by an encoder that picks up the speech signal and transforms it into a sequence of digital values, a subtraction circuit for calculating the difference between successive sampling results, a device for determining the amount of the difference between successive scanning results, an adder circuit that calculates the difference fr 971 022 3098 427 07 90fr 971 022 3098 427 07 90 werte jeweils der Summe der vorher berechneten Differenzwerte hinzufügt, wobei die sukzessiven Summen über eine Rückkopplung zwischen Ausgang und Eingang der Addierschaltung umlaufen, undvalues each to the sum of the previously calculated difference values, whereby the successive sums over a feedback circuit between the output and input of the adder circuit, and einen Krümmungsdetektor, der die sukzessiven Summen der Beträge aufnimmt und jeweils dann ein Signal abgibt, wenn bei ausreichend hohen Summenwerten eine positive Krümmung auftritt.a curvature detector that sums the successive amounts which picks up amounts and emits a signal whenever a positive curvature occurs. 7. Vorrichtung nach Anspruch 6, gekennzeichnet durch einen Maximumdetektor, dem die Summen eingegeben werden, die positiver Krümmung entsprechen, und der aus der Gruppe eingegebener Summen diejenige mit dem größten Wert bestimmt, worauf ein für eine Gruppe nur einmal abgegebenes Signal generiert wird.7. Apparatus according to claim 6, characterized by a maximum detector to which the sums are entered correspond to positive curvature, and the sum entered from the group determines the one with the greatest value, whereupon a signal that is only issued once for a group is generated. 8. Vorrichtung nach Anspruch 7, gekennzeichnet durch einen Schwellwertdetektor, der die sukzessiven Summen der Beträge empfängt und für jede über einer vorgebbaren Schwelle liegende Summe ein Signal abgibt, welches die übertragung dieser über der Schwelle liegenden Summe in den Maximumdetektor ermöglicht.8. The device according to claim 7, characterized by a threshold value detector, which the successive sums of the amounts receives and emits a signal for each sum lying above a predeterminable threshold, which the transfer of this amount above the threshold in the maximum detector. FR 971 022 309842/0790 FR 971 022 309842/0790 LeerseiteBlank page
DE19732312356 1972-03-28 1973-03-13 METHOD AND DEVICE FOR DETERMINING THE BASIC FREQUENCY OF VOICE SIGNALS Pending DE2312356A1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR7211396A FR2178410A5 (en) 1972-03-28 1972-03-28

Publications (1)

Publication Number Publication Date
DE2312356A1 true DE2312356A1 (en) 1973-10-18

Family

ID=9096125

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19732312356 Pending DE2312356A1 (en) 1972-03-28 1973-03-13 METHOD AND DEVICE FOR DETERMINING THE BASIC FREQUENCY OF VOICE SIGNALS

Country Status (4)

Country Link
JP (1) JPS551597B2 (en)
DE (1) DE2312356A1 (en)
FR (1) FR2178410A5 (en)
GB (1) GB1383621A (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2147413A5 (en) * 1971-07-27 1973-03-09 Escher Wyss France Pneumatic drier for powders and granules - fed by fluidised bed using hot air
JPS5323783U (en) * 1976-08-05 1978-02-28
JPH01178191U (en) * 1988-06-07 1989-12-20
WO1993009531A1 (en) * 1991-10-30 1993-05-13 Peter John Charles Spurgeon Processing of electrical and audio signals
JPH0576993U (en) * 1992-03-25 1993-10-19 菊夫 今井 Bicycle accelerator that reuses energy consumption
DE102008043201A1 (en) 2008-10-27 2010-04-29 Robert Bosch Gmbh Device for detecting a change of a generator output signal of a vehicle generator
CN111145044B (en) * 2020-01-09 2023-07-11 三峡大学 Power distribution network power quality disturbance detection method based on EWT and MFDE

Also Published As

Publication number Publication date
JPS551597B2 (en) 1980-01-16
GB1383621A (en) 1974-02-12
JPS4916308A (en) 1974-02-13
FR2178410A5 (en) 1973-11-09

Similar Documents

Publication Publication Date Title
DE4126902C2 (en) Speech interval - detection unit
DE3645118C2 (en)
DE3837066A1 (en) NOISE REDUCTION DEVICE
DE4031638C2 (en)
DE2626793B2 (en) Electrical circuitry for determining the voiced or unvoiced state of a speech signal
DE2524804A1 (en) METHOD AND DEVICE FOR AUTOMATIC SPEECH RECOGNITION
EP0285221A2 (en) Method for detecting continually pronounced words
DE3043516C2 (en) Method and device for speech recognition
DE2636032C3 (en) Electrical circuit arrangement for extracting the fundamental oscillation period from a speech signal
DE3128172A1 (en) Period measuring device
DE2312356A1 (en) METHOD AND DEVICE FOR DETERMINING THE BASIC FREQUENCY OF VOICE SIGNALS
DE60016305T2 (en) Method for operating a speech coder
DE3733983A1 (en) Method for damping interfering (wind) noise in sound signals transmitted by hearing aids
DE1937464B2 (en) VOICE ANALYZER
WO2000013173A1 (en) Method for instrumental voice quality evaluation
DE2720666A1 (en) PROCEDURE AND ARRANGEMENT FOR NOISE ANALYSIS
EP1043590A1 (en) Method and device for determining the rotational speed of a DC commutator motor
DE3246712C2 (en)
DE1189745B (en) Method for identifying sound events
DE2357949A1 (en) PROCEDURE FOR DETERMINING THE INTERVAL CORRESPONDING TO THE PERIOD OF THE EXCITATION FREQUENCY OF THE VOICE RANGES
DE19825070C1 (en) Method for determining a value representing a variation between a measurable quantity and a measurable reference quantity
DE3335026C2 (en)
DE2062589C3 (en) Method for determining the fundamental frequency of an at least temporarily periodic signal
EP1279168B1 (en) Method for improving speech quality in speech transmission tasks
DE2739609A1 (en) Pigeon training and re-training scheme - employs coding of acoustic signal having frequency spectrum with blanketing curve possessing certain number of peak values (NL 7.3.78)

Legal Events

Date Code Title Description
OHJ Non-payment of the annual fee