DE3043516C2

DE3043516C2 - Method and device for speech recognition

Info

Publication number: DE3043516C2
Application number: DE3043516A
Authority: DE
Inventors: Nobuo Hachiouji Tokio/Tokyo Hataoka; Akira Musashino Tokio/Tokyo Ichikawa; Yoshiaki Sayama Saitama Kitazume; Akio Hachiouji Tokio/Tokyo Komatsu; Kazuhiro Yokohama Kanagawa Umemura
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1979-11-19
Filing date: 1980-11-18
Publication date: 1984-10-11
Also published as: US4426551A; JPS6128998B2; DE3043516A1; JPS5672499A

Abstract

Speech sound recognition is made using a reduced number of speech parameter elements, e.g., five correlation coefficients rather than sixteen spectral coefficients. The five correlation coefficients are derived from comparison of the spectral coefficients of unknown or standard sounds against the spectral coefficients of five highly-separable vowel-like sounds. Then, unknown-sound correlation coefficients are compared with standard-sound coefficients for recognition.

Description

a) Berechnen von ρ ersten charakteristischen Parametern aus einem Spracheingangssignal zu einzelnen Zeitpunkten, wobei ρ eine positve. ganze Zahl > 2 ist, isa) Calculating ρ first characteristic parameters from a speech input signal at individual points in time, where ρ is a positive. integer> 2, is

b) Durchführen einer Vergleichsoperation zwischen den im ersten Schritt a) berechneten ersten charakteristischen Parametern und einer Anzahl von ρ ersten charakteristischen Parametern von η spezifischen Sprachmustern hoher Unterscheidfearkeit zu einzelnen Zeitpunkten zur Bestimmung einer Anzahl von η zweiten charakteristischen Parametern, die den Abstand der Korrelation zwischen den ersten, charakteristischen Parametern des Sprachcingangssignals und den ersten charakteristischen Parametern der spezifischen Sprachmusler darstellen, wobei η eine positive ganze Zahl mit 1 <n<p ist,b) Carrying out a comparison operation between the first characteristic parameters calculated in the first step a) and a number of ρ first characteristic parameters of η-specific speech patterns of high distinctiveness at individual points in time to determine a number of η second characteristic parameters that determine the distance of the correlation between the represent the first characteristic parameters of the speech input signal and the first characteristic parameters of the specific speech musician, where η is a positive integer with 1 <n <p ,

c) Ermitteln einer Koinzidenz zwischen den erhaltenen zweiten charakteristischen Parametern des Mt Spracheingangssignalcs und den η zweiten charakteristischen Parametern einer jeder Standardsprache, die entsprechend Jem Verfahrensschrittc) Determination of a coincidence between the obtained second characteristic parameters of the Mt speech input signal cs and the η second characteristic parameters of each standard language corresponding to Jem method step

b) aus den ersten charakteristischen Parametern einer jeden Standardsprari -■ berechnet und abgespeichert wurden, bevor das Spracheingangssignal zugeführt wird.b) calculated from the first characteristic parameters of each standard prari - ■ and stored before the speech input signal is supplied.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß beim ersten Schritt a) eine Normierung der ersten charakteristischen Parameter durchgeführt wird.2. The method according to claim 1, characterized in that that in the first step a) a normalization of the first characteristic parameters is carried out will.

3. Verfahren nach einem der Ansprikhc 1 oder 2, dadurch gekennzeichnet, daß für die spezifischen Sprachsignale beliebige Vokale. Rcib-Konsonanten und/oder Nasal-Konsonanten verwendet werden.3. The method according to any one of claims 1 or 2, characterized in that for the specific Speech signals any vowels. Rcib consonants and / or nasal consonants are used.

4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß beim zweiten Schritt eine Glättung der Zeitfolgcdatcn der zweiten charakteristischen Parameter durchgeführt und diese Daten4. The method according to any one of claims 1 to 3, characterized in that in the second step a smoothing of the time sequence data of the second characteristic parameters is carried out and these data

in vorgegebenen Intervallen abgetastet werden. ;iibe sampled at predetermined intervals. ; ii

5. Vorrichtung zur Durchführung eines Verfahrens nach einem der Ansprüche 1 bis 4. gekennzeichnet durch eine erste Einrichtung (21-26) zum Berechnen von ρ ersten charakteristischen Parametern aus Spracheingangssignalen (1) zu entsprechenden Zeitpunkten, wobei ρ eine positive ganze Zahl größer oder gleich 2 ist, eine Mustcranpassungscinheit (3). die die von der ersten Einrichtung (21 -26) berechneten ersten charakteristischen Parameter mit ρ ersten charakteristischen Parametern von η vorgegebenen, ni spezifischen Spraclinuisiern hoher Untefseheklbm'-keil y.u einzelnen Zeitpunkten vergleicht und /weile charakteristische Parameter liefert, wobei η eine positive ganze Zahl mit 1 </; <:/> ist. durch eine Hntscheiuunpseinheii (4), die eine Koinzidenz zwischen <■< den von der Miistcranpassungscinhcit (3) erhaltenen, /weiten charakteristischen Parametern des Spracheingangssignals und den zuvor aus jeder Standardsprache ermittelten zweiten charakteristischen Parametern bestimmt.5. Device for performing a method according to one of claims 1 to 4, characterized by a first device (21-26) for calculating ρ first characteristic parameters from speech input signals (1) at corresponding times, where ρ is a positive integer greater than or equal to 2 is a must-crane fitting unit (3). which compares the first characteristic parameters calculated by the first device (21-26) with ρ first characteristic parameters of η given, ni-specific Spraclinuisiern high Undefseheklbm'-wedge yu individual points in time and / while supplies characteristic parameters, where η is a positive whole number 1 </;<:/> is. by a determination unit (4) which determines a coincidence between the wide characteristic parameters of the speech input signal obtained from the misalignment unit (3) and the second characteristic parameters previously determined from each standard language.

6. Vorrichtung nach Anspruch 5. dadurch gekennzeichnet, daß die erste Hinrichtung (21-26) eine Normicrungseinrichtung (26) zum Normieren der ersten charakteristischen Parameter aufweist.6. Apparatus according to claim 5, characterized in that that the first execution (21-26) is a standardization facility (26) for normalizing the first characteristic parameters.

7. Vorrichtung nach Anspruch 5 oder 6, dadurch gekennzeichnet, daß die Musteranpassungseinhcii (3) eine Einrichtung (242-1. 242-16) zum Glätten der Zcitfolgedaten der zweiten charakteristischen Parameter und Abtasten dieser Daten in vorgegebenen Intervallen aufweist.7. Apparatus according to claim 5 or 6, characterized in that the pattern adaptation unit (3) means (242-1,242-16) for smoothing the sequence data of the second characteristic parameters and sampling this data at predetermined intervals.

Die Erfindung betrifft ein Verfahren zur Spracherkennung gemäß dem Oberbegriff des Patentanspruches 1 sowie eine Vorrichtung zu seiner Durchführung.The invention relates to a method for speech recognition according to the preamble of claim 1 as well as a device for its implementation.

Allgemein kann eine Vorrichtung zur Spracherkennung konstruktiv aufgeteilt werden in (1) eine Recheneinheit zur Berechnung von charakteristischen Parametern der Sprache und (2) eine Entschcidungsschaltung zur Anpassung der charakteristischen Parameter an Siandardparameter und zur Bestimmung und Erkennung der Sprache. Als charakteristische Parameter der Sprache sind bislang ein linearer Vorhersagekoeffizient, ein Teil-Autokorrelations-Koeffizient und ein Filterbankausgangssignai verwendet worden. Wenn irgendeiner dieser Parameter verwendet wird, wird das Sprachmuster im allgemeinen als Zeitfolge von Parametern einiger Ordnungen ausgedrückt. Wenn ein AutokorrelationskoelTizient achter Ordnung, der alle 10 Millisekunden abgetastet wird, zu berücksichtigen ist. sind beispielsweise 800 Parameter erforderlich, um die Sprache einer Sekunde auszudrücken, so daß eine große Zunahme bei der Verarbeitung erforderlich ist, um eine Vcrgleichsopcration mit den zur Erkennung erforderlichen Parametern der Standardraster durchzuttihren. Außerdem ist eine große Speicherkapazität erforderlich, um die Standardmustcr zu speichern. Dementsprechend ist ss erforderlich, effektive charakteristische Parametern zu erhalten, die in der Lage sind, die Sprachmuster mit einer möulichsi hohen Wiedergabetreue zu repräsentieren. In general, a device for speech recognition can be structurally divided into (1) a computing unit for calculating characteristic parameters of speech and (2) a decision circuit for adapting the characteristic parameters to standard parameters and for determining and recognizing the language. So far, a linear prediction coefficient, a partial autocorrelation coefficient, have been the characteristic parameters of language and a filter bank output signal has been used. If any of these parameters are used, the speech pattern in the generally expressed as a time sequence of parameters of some orders. If an autocorrelation coefficient eighth order, which is sampled every 10 milliseconds, must be taken into account. are for example 800 parameters are required to express the language of a second, so that a large increase in processing is necessary to make a comparison operation with the parameters required for recognition through the standard grid. aside from that a large amount of memory is required to store the standard patterns. Accordingly, ss required to obtain effective characteristic parameters capable of communicating the speech pattern with to represent a possible high fidelity.

Aus der DLi-OS 23 47 738 ist ein Verfahren zur Spracherkennung bekannt, bei dem aus besonderen Lehr- und Übungsworten ein Mcrkmalsauszug gewonnen wird. Für jedes einzelne I ehr- oder Übungswort wird ein solcher Mcrkmalsausz.ug abgespeichert. Bei der Spracherkennung wird nach den gleichen Regeln, nach denen für die Übungsworte der Merkmalsauszug erzielt wurde, auch für die Sprachcingangssignale ein Merkmalsauszug angefertigt. Der Mcrkmalsauszug des aktuellen Spracheingangssignals wird dann mit den gespeicherten Mcrkmalsauszügcn der Übungsworte verglichen, und das Vergleichsergebnis wird durch eine Korrelationsziffer dargestellt. Anhand der Korrelationsziffer wird dann ermittelt, mil welcher Wahrscheinlichkeit das Sprachoinunniissipiiiil mit dein jeweiligen (Ib'ingswort übercinstitnn'.i. dessen Mcrkmalsausz.ug abgespeichert isi.From the DLi-OS 23 47 738 is a method for speech recognition known, in which an excerpt from special doctrinal and exercise words is obtained. For Such a feature extract is stored for each individual phrase or practice word. In speech recognition is based on the same rules that were used to obtain the extract of characteristics for the exercise words, a feature excerpt also prepared for the voice input signals. The extract of features of the current one Speech input signal is then compared with the stored feature extracts of the exercise words, and the comparison result is represented by a correlation number. Using the correlation number, then it is determined with what probability the language inuniissipiiiil with your respective (Ib'ingwort aboutcinstitnn'.i. its characteristic extract is saved isi.

Auch bei diesem bekannten Vcrl'ahicn muß innerhalb kurzer /eil eine große Menge von Vcrglcichsopcraiionen durchgeführt werden, so daß die insgesamt für die Spracherkennuni; benötigte Verarbeiuingsz.eil groß wird.In this known method, too, must be within in short, a large number of comparative options be carried out so that the total for the Spracherkennuni; The processing time required becomes large.

Aufnähe der hrfindunu is' daher, ein Verfahren undClosing the hrfindunu is' therefore, a procedure and

:inc Vorrichtung zur Spracherkennung anzugeben, bei Jem die Zahl der Parameter, die in einer Vergleiehsiperation mit Parametern von Standardmusiern versuchen werden, komprimiert wird, um dadurch die für die Vergleichsoperation und damit für die Spracherkennung erforderliche Verarbeitungszeit zu reduzieren und zugleich die für das Abspeichern der Parameter der Standardmuster erforderliche Speicherkapazität zu verringern.: inc device for speech recognition to indicate with Jem the number of parameters in a comparison siperation are attempted with parameters from standard musicians, in order to save the for to reduce the comparison operation and thus the processing time required for speech recognition and at the same time the storage capacity required for storing the parameters of the standard pattern to decrease.

Diese Aufgabe wird mit einem Verfahren gemäß dem Oberbegriff des Patentanspruches 1 gelöst, das erfindungsgemäß nach der im kennzeichnenden Teil dieses Anspruches angegebenen Weise ausgestaltet ist.This object is achieved with a method according to the preamble of claim 1, which according to the invention is designed according to the manner specified in the characterizing part of this claim.

Vorteilhafte Ausgestaltungen des erfindungsgemäßcn Verfahrens sowie eine bevorzugte Vorrichtung zu seiner Durchführung sind in den Unteransprüchen angegeben.Advantageous embodiments of the method according to the invention and a preferred device for it Implementation are specified in the subclaims.

Gemäß der Erfindung werden aus den Spracheingangssignalen errechnete ρ charakteristische Parameter jeweils mit ρ charakteristischen Parametern von η spezifischen Sprachen verglichen, wobei ihr gegenseitiger Abstand bzw. die Wahrscheinlichkeit ihrer Übereinstimmung bestimmt wird. Die so erhaltenen Daten werden «1s charakteristische Parameter der Eingangssprachm -5ter verwendet und mit charakteristischen Parametern von Standardmustern verglichen, die in gleicher Weise bestimmt wurden. Auf diese Weise wird die Spracherkennung durchgeführt.According to the invention, ρ characteristic parameters calculated from the speech input signals are each compared with ρ characteristic parameters of η specific languages, their mutual distance or the probability of their correspondence being determined. The data obtained in this way are used for 15 seconds characteristic parameters of the input languages and compared with characteristic parameters of standard samples which were determined in the same way. In this way the speech recognition is carried out.

Als die η charakteristischen Parameter der spezifischen Sprache können z.B. die charakteristischen Parameter derjenigen Vokale, die klar voneinander unterschieden werden können und die eine hohe Trennbarkeit besitzen, verwendet werden.As the η characteristic parameters of the specific language, for example, the characteristic parameters of those vowels which can be clearly distinguished from one another and which have a high degree of separability can be used.

Die Erfindung wird nachstehend anhand der Beschreibung von Ausführungsbeispielen und unter Bezugnahme auf die beiliegende Zeichnung näher erläutert. Die Zeichnung zeigt inThe invention is explained below on the basis of the description of exemplary embodiments and with reference explained in more detail on the accompanying drawing. The drawing shows in

Fig. 1 ein Blockschaltbild zur Erläuterung des grundsätzlichen Aufbaus einer erfindungsgemäßen Vorrichtung zur Spracherkennung;1 shows a block diagram to explain the basic structure of a device according to the invention for speech recognition;

Fig. 2 ein Blockschaltbild zur Erläuterung der wesentlichen Teile der erfindungsgemäßen Vorrichtung:2 shows a block diagram to explain the essential parts of the device according to the invention:

Fig. 3 ein Blockschaltbild eines Ausführungsbeispiels für eine Filterbank gemäß Fig. 2;3 shows a block diagram of an exemplary embodiment for a filter bank according to FIG. 2;

Fig. 4 ein Diagramm zur Erläuterung der charakteristischen Parameter von Vokalen: und inFig. 4 is a diagram for explaining the characteristic Parameters of vowels: and in

Fig. 5 ein Blockschaltbild zur Erläuterung von Normierungssenaitung, Musierpufferspeicher und Abstandsrechenschaltunggemäß Fig. 2.Fig. 5 is a block diagram for explaining the normalization process, Music buffer and distance calculation circuit according to Fig. 2.

Fig. 1 zeigt den grundsätzlichen Aufbau der neuartigen Vorrichtung zu Sprchcrkcnnung, wobei das Bezugszeichen I ein Spracneingangssignal, das Bezugszeichen 2 eine Analysiereinheit, das Bczugszeichen 3 eine Musteranpassungscinheit, das Bezugszeichen 4 eine Entscheidungseinheit und das Bezugszeichen 5 ein Ausgangssignal des Erkennungsergebnisses bezeichnen.Fig. 1 shows the basic structure of the novel device for speech, where the reference number I a speech input signal, the reference number 2 an analysis unit, the reference number 3 a pattern matching unit, reference numeral 4 a decision unit, and reference numeral 5 an output signal of the recognition result.

Bei einem derartigen Aufbau berechnet die Analysiereinheit 2 aus dem Spracheingangssignal Xp charakteristische Parameter, vergleicht die se berechneten charakteristischen Parameter mit den jcweiligci ρ charakteristischen Parametern von η spezifischen Sprachen und bestimmt solche charakteristischen Parameter, die den Abstand oder die Wahrscheinlichkeit zwischen den beiden Arten von Parametern repräsentieren. Die so bestimmten charakteristischen Parameter werden dann in gleicher Weise mit charakteristischen Parametern des Standardmusters verglichen, die in gleicher Weise durch Vergleich mit charakteristischen Parametern von spezifischen Sprachen bestimmt worden sind, in der Musteranpassungseinheit 3, und die Entscheidungseinheii 4 erkennt das Spracheingangssignal und liefen das Ergebnis der F.rkennung als Ausgangssignal 5With such a structure, the analyzing unit 2 calculates characteristic parameters from the speech input signal Xp , compares these calculated characteristic parameters with the jcweiligci ρ characteristic parameters of η specific languages and determines such characteristic parameters which represent the distance or the probability between the two types of parameters . The characteristic parameters determined in this way are then compared in the same way with characteristic parameters of the standard pattern, which have been determined in the same way by comparison with characteristic parameters of specific languages, in the pattern adaptation unit 3, and the decision unit 4 recognizes the speech input signal and runs the result of the Detection as output signal 5

Kitt. 2 zemi ein Blockschaltbild eines Ausführiings-Putty. 2 zemi a block diagram of an implementation

> beispicls für den Aufbau der wesentlichen Teile der neuartigen Vorrichtung zur Spracherkennung, wobei die wesentlichen Teile der Analysiereinheit 2 in Fig. 1 entsprechen.
In Fig. 2 bezeichnet das Bezugszeichen 21 eine Steuer-> examples for the construction of the essential parts of the novel device for speech recognition, the essential parts corresponding to the analysis unit 2 in FIG.
In Fig. 2, the reference numeral 21 denotes a control

U) Schaltung, bestehend aus Arbeitsfolgereglern oder dergleichen, die verschiedene Anen von Steuersignalen erzeugen. Das Bezugszeichen 22 bezeichnet einen Analog-Digital-Wandler, das Bezugszeichen 23 einen Eingangspufferspeicher. das Bezugszeichen 24 eine Filterbank, das Bezugszeichen 25 einen Zwischenpufferspeicher, das Bezugszeichen 26 eine Normierschaltung, das Bezugszeichen 27 einen Musterpufferspeicher, das Bezugszeichen 28 einen Mikromuster-Puffenpeicher. das Bezugszeichen 29 eine Abstandsrechenschaltung und dasU) circuit, consisting of sequence controllers or the like, which generate various types of control signals. The reference number 22 denotes an analog-to-digital converter, numeral 23 an input buffer memory. the reference number 24 a filter bank, reference numeral 25 an intermediate buffer memory, reference numeral 26 a normalizing circuit, reference numeral 27 a pattern buffer memory, reference numeral 28 a micro-pattern buffer memory. the reference number 29 a distance calculation circuit and the

:n Bezugszeichen 30 einen Parameterpufferspeicher.: n reference numeral 30, a parameter buffer memory.

Diese Ausführungsform ist so aufj??haut, daß sie die Aüsgar.gssigruile der Filterbank als charakteristische Parameter verwendet, welche das Spracheingangssignal repräsentieren. This embodiment is so blown that it the Aüsgar.gssigruile of the filter bank as characteristic parameters which represent the speech input signal.

Das an die Analysiereinheit 2 angelegte Spracheingangssignal wird mit dem Analog-Digital-Wandler 22 in digitale Signale umgewandelt und an den Eingangspufferspeicher 23 angelegt, wobei eine Steuerung durch die Steuerschaltung 21 erfolgt. Die an den Eingangspuffer-The speech input signal applied to the analysis unit 2 is converted into digital signals with the analog-to-digital converter 22 and sent to the input buffer memory 23 is applied, a control being carried out by the control circuit 21. The data sent to the input buffer

Xi speicher 23 angelegten digitalen Signale werden in gleicher Weise der Steuerung der Steuerschaltung 21 unterworfen und an die Filterbank 24 angelegt. Wie in Fig. 3 dargestellt, besteht diese Filterbank 24 beispielsweise aus Bandpaßfiltern 241-1 bis 241-16, die den Frequenzbereich im Telefonsystem, d.h. 300 bis 3600 Hz in 16 äquidistantc Kanäle logarithmisch unterteilen, sowie Glättungs- und Abtastschaltungen 242-1 bis 242-16 zum Cilätten und erneuten Abtasten dieser Ausgangssignale der Bandpaßfiltcr. Die 16 geglätteten Teile von Daten.Xi memory 23 applied digital signals are in the same Manner subject to the control of the control circuit 21 and applied to the filter bank 24. As in Fig. 3 Shown, this filter bank 24 consists for example of bandpass filters 241-1 to 241-16, the frequency range in the telephone system, i.e. dividing 300 to 3600 Hz logarithmically into 16 equidistant channels, as well as Smoothing and sampling circuits 242-1 through 242-16 for smoothing and re-sampling these output signals the bandpass filter. The 16 smoothed pieces of data.

die z.B. in lO-Sekundeniniervallen abgetastet werden, werden dem ZwischenpuiTerspeicher 25 als Vektor der charakteristischen Parameter u, zu den Zeiten / übermittelt. Die Zeitfolge dieses Vektors von charakteristischen Parametern a, wird sequentiell im Zwischenpufferspeicher 25 angeordnet. Hierbei wird angenommen, daß S₁ =',«,,. </,,... .</_16ι} und α_μ das Ausgangssignal des /-ten Filters zum Zeitpunkt ι angibt. Im allgemeinen ändert sich die Größe von Uj, mit dem Eingangspcgcl des Sprachcingangssignales 1 und mit einerwhich are scanned, for example, at 10 second intervals, are transmitted to the intermediate buffer memory 25 as a vector of the characteristic parameters u at the times /. The time sequence of this vector of characteristic parameters a is arranged sequentially in the intermediate buffer memory 25. It is assumed here that S ₁ = ', «,,. </ ,, .... </ _16ι } and α _μ indicates the output signal of the / th filter at time ι. In general, the size of Uj changes with the input pcgcl of the speech input signal 1 and with a

5(i Sprachumgebung, so daß der Vergleich von Absolutwerten schwierig ist. Dementsprechend wird der Vektor von charakteristischer! Parametern u,. der aus dem ZwischenpuiTerspeicher 25 durch die Steuerv/irkung der Sieiip'schiiltung 21 ausgelesen wird, an die Normierschaltung 26 angelegt, um einen normierten Vektor von charakteristischen '»nramciern a', zu erhalten. Das /te F.lemcni dieses Vektors a\ wird gemäß der folgenden Gleichung erhallen:5 (i language environment, so that the comparison of absolute values is difficult. Correspondingly, the vector of characteristic parameters u, which is read out from the buffer memory 25 by the control action of the filter circuit 21, is applied to the normalization circuit 26 in order to to obtain a normalized vector of characteristic 'nramciern a' . The / te F.lemcni of this vector a \ is obtained according to the following equation:

ldld

Σ",, r ι Σ ",, r ι

Hierbei sind feine Konstante und α ein Koeffizient. Die Zeitfolge der normierten Vektoren u\ von charak- <>5 teristischen Parame'ern, die auf diese Weise erhalten werden, wird unter der Steuerwirkung der Steuerschaltung 21 in den Musterpufferspeicher 27 eingespeichert. Im Mikromusler-Pufferspeicher28gcmäß Fig. 2 ist einHere, fine constant and α are a coefficient. The time sequence of the normalized vectors u \ of characteristic parameters, which are obtained in this way, is stored in the sample buffer memory 27 under the control of the control circuit 21. In the micromusler buffer memory 28gc of FIG

Vektor von charakteristischen Parametern V_k(k: = 1 ->n) von η normierten Sprachen gespeichert, sog. Mikromustern. wie z.B. Vokalen, die '.harakteristische Merkmale besitzen und mit der gleichen Verarbeitung wie oben erhalten worden sind. Hierbei braucht l\ keine Zeitfolge von charakteristischen Parametern des Vektors zu sein. Mit anderen Worten, da das Aussprechen von Vokalen z.B. beträchtlich stabil ist. kann der Vektor der charakteristischen Parameter zu einem Zeitpunkt innerhalb dieser stabilen Periode ausreichend repräsentativ sein. Fig. 4 zeigt die Vektoren der normierten charakteristischen Parameter von 5 Vokalen, die von einem erwachsenen Mann ausgesprochen worden sind. Bei dieser Ausführungsform werden fünf Mikromuster verwendet, die den fünf Vokalen entsprechen.Vector of characteristic parameters V _k (k : = 1 -> n) of η normalized languages stored, so-called micro-patterns. such as vowels which have characteristic features and have been obtained with the same processing as above. Here l \ need not be a time sequence of characteristic parameters of the vector. In other words, since the pronunciation of vowels, for example, is considerably stable. the vector of the characteristic parameters can be sufficiently representative at a point in time within this stable period. Fig. 4 shows the vectors of the normalized characteristic parameters of 5 vowels uttered by an adult male. In this embodiment, five micro-patterns corresponding to the five vowels are used.

Die Abstandsrechenschaltung 29 liest die Vektoren der charakteristischen Parameter, die in den Musterpufferspeichcr 27 und den Mikromusterpuflcrspcicher 28 durch die Steuerwirkung der Steuerschaltung 21 eingespeichert worden sind, und berechnet die Abstände zwischen den Vektoren der 16 normierten charakteristischen Parameter u'_t. die im Musterpufferspeicher 27 gespeichert sind, und den Vektoren der 16 normierten charakteristischen Parameter Y\(k = 1^5) der fünf Mikromuster. wobei schließlich fünf Abstandsparametcr v*(A = 1^5 und ι ein bestimmter Zeitpunkt) in den Parameterpufferspeicher 30 eingespeichert werden. In diesem Falle wird der Abstandsparameter .vf durch die normale Abstandsberechnung erhalten, die sich durch die nachstehende Gleichung ausdrücken läßt:The distance calculating circuit 29 reads the vectors of the characteristic parameters stored in the pattern buffer memory 27 and the micro-pattern buffer memory 28 by the control action of the control circuit 21, and calculates the distances between the vectors of the 16 normalized characteristic parameters u ' _t . which are stored in the pattern buffer memory 27, and the vectors of the 16 normalized characteristic parameters Y \ (k = 1 ^ 5) of the five micro-patterns. Finally, five distance parameters v * (A = 1 ^ 5 and ι a specific point in time) are stored in the parameter buffer memory 30. In this case, the distance parameter .vf is obtained by the normal distance calculation, which can be expressed by the following equation:

vf= Σ K-l",^k>². it= 1-5).vf = Σ Kl ", ^k > ^2. it = 1-5).

Somit wird die Zeitfolge von fünf Abstandsparametern .*J in den Parameierpufferspcicher 30 eingespeichert. Diese Zeitfolge von Parametern wird der in Fig. 1 dargestellten Mustcranpassungscinhcit 3 übermittelt und einer Anpassungsoperation mit den Parametern des Staiidardmusters unterworfen, bei dem die Daten bereits komprimiert und im gleichen Mikromuster registriert sind. Somit wird das Resultat der Erkennung als Ausgangssigna! der Enischcidungseinheit 4 in Fig. I erzeugt.Thus, the time sequence becomes five distance parameters . * J stored in the parameterization buffer memory 30. This time sequence of parameters is transmitted to the must-adapting unit 3 shown in FIG subjected to an adjustment operation with the parameters of the standard pattern for which the data already are compressed and registered in the same micro-pattern. Thus, the result of the recognition is used as the output signal! the isolation unit 4 in FIG.

Bei dem System von herkömmlichen Vorrichtungen zur Spracherkennung ist die im Zwischenpuftcrspeichcr 25 gespeicherte Zeitfolge von 16 Parametern für die an die Musteranpassungscinheit 3 zu liefernden charakteristischen Parameter verwendet worden, während bei dem erfindungsgemäßen Verfahren die Zeitfolge von nur fünf Parametern verwendet werden kann.In the system of conventional speech recognition devices, the data in the buffer memory is stored 25 stored time sequence of 16 parameters for the characteristic to be supplied to the pattern adaptation unit 3 Parameters have been used, while in the method according to the invention the time sequence of only five parameters can be used.

Im allgemeinen bestehen die Vektoren von charakteristischen Parametern u\ oder \'^k aus derselben Anzahl von Bits. z.B. 16 Bits als Bitanzahl der Abstandsparameter vf. Dementsprechend kann gemäß der Erfindung die Anzahl von Bits der charakteristischen Parameter, die für die Musteranpassung in der Musteranpassungseinheit 3 erforderlich sind, auf 5 16 verglichen mit den herkömmlichen Verfahren verringert werden, und somit läßt sich die erforderliche Zeit für die Vergleichsoperation mit den charakteristischen Parametern der Standardmuster im gleichen Maße verkürzen. Somit läßt sich die Speicherkapazität zum Speichern von Standardmustern verringern.In general, the vectors of characteristic parameters u \ or \ ' ^k consist of the same number of bits. eg 16 bits as the number of bits of the distance parameter vf. Accordingly, according to the invention, the number of bits of the characteristic parameters required for the pattern matching in the pattern matching unit 3 can be reduced to 5 16 compared with the conventional method, and thus the time required for the comparison operation with the characteristic parameters of the Shorten standard samples by the same amount. Thus, the memory capacity for storing standard patterns can be reduced.

Beim erfindungsgemäßen Verfahren ist es erforderlich, die Vergleichsoperationen mit den charakteristischen Parametern der Mikromuster separat durchzuführen, jedoch beträgt die Anzahl von Mikromusiern höchstens etwa 5 und ist viel kleiner im Vergleich zu der Anzahl von Standardmusterii. /.U. K). Somit kann die Verglcichsopcration bezüglich der Mikromusier virtuell vernachlässigt werden. Außerdem wurden experimentelleIn the method according to the invention, it is necessary carry out the comparison operations with the characteristic parameters of the micro-patterns separately, however, the number of micro-musicians is at most about 5 and is much smaller compared to the number of standard pattern ii. /.U. K). Thus, the comparison option can be virtually neglected with regard to the micromusier. In addition, experimental

■; Daten erhalten, die zeigen, daß auch dann, wenn die Anzahl von Bits der charakteristischen Parameter für die obige Musteranpassung verringert wird, eine Verschlechterung des Erkennungsverhältnisses kaum zu beobachten ist.■; Received data showing that even if the Number of bits of the characteristic parameters for the above pattern matching is decreased, deterioration of the recognition ratio can hardly be observed.

in Fig. 5 zeigt ein Blockschaltbild eines Ausführungsbeispiels für den Aufbau von Normierungsschaltung 26. Mnsterpuflerspeichern 27 und 28 sowie Abstandsrechenschallung 29gemäß Fig. 2.FIG. 5 shows a block diagram of an exemplary embodiment for the structure of normalization circuit 26. Mnster buffer stores 27 and 28 as well as distance calculation sound 29 according to FIG. 2.

In der Normicrungssehaluing 26 bezeichnet das Be-In the Normicrungssehaluing 26 denotes the loading

i< /ugszeichen 261 einen Addierer mit parallelen Eingängen, während die lJezugszcichcn 262-1 bis 262-16 Teiler bezeichnen. Der Mikromusterpuffcrspeicher 28 besteht aus fünf Mikromusterspeichern 281 bis 285. während die Abstandsrechenschaltung 29 aus fünf Mikromuster-i </ ugszeichen 261 an adder with parallel inputs, while the reference characters 262-1 to 262-16 denote divisors. The micro-pattern buffer 28 consists of five micro-pattern memories 281 to 285 Distance calculation circuit 29 from five micro-pattern

;ii Komparatorcn 291 bis 295 besteht.; ii Comparators 291 to 295 exist.

Wenn bei einem derartigen Aufbau ρ charakteristische Parameter zu einer vorgegebenen Zeit parallel aus dem Zwischenpufferspeicher 25 ausgelesen und an die Normierungsschaltung 26 angelegt werden, werden dieseIf, with such a structure ρ, characteristic parameters are read out in parallel from the intermediate buffer memory 25 at a predetermined time and applied to the normalization circuit 26, these will be

:< Eingangssignal vom Addierer 261 der Normierungs-: <Input signal from adder 261 of the normalization

|f>| f>

schaltung 26addiert, was V (/„ergibt.circuit 26 adds, which results in V (/ ".

Die so erhaltenen Additionsergebnisse werden an die Teiler 2o2-l bis 262-16 angelegt, mit denen eine DivisionThe addition results obtained in this way are applied to the divisors 2o2-1 to 262-16, with which a division

<i) gemäß der obigen Gleichung (1) zwischen diesen Eingangssignalen bzw. den als Eingangssignalen angelegten charakteristischen Parametern u„ (_/=1~16) durchgeführt wird. Nach der Normierung wird das Ergebnis zeitweilig in den MusterpufTcrspeicher 27eingespeichert.<i) is carried out according to the above equation (1) between these input signals or the characteristic parameters u " (_ / = 1 ~ 16) applied as input signals. After the normalization, the result is temporarily stored in the sample buffer memory 27.

Als nächstes werden die aus dem Musterpufferspeichcr 27 ausgclcscnen. normierten ρ charakteristischen Parameter parallel zueinander an die Mikromuster-Komparatoren 29i bis 295 angclogi. Da andererseits dse aus den Komparatoren entsprechenden Mikromusterspei-Next, they will be excluded from the pattern buffer memory 27. normalized ρ characteristic parameters parallel to one another to the micro-pattern comparators 29i to 295 angclogi. On the other hand, since the micro-pattern stores corresponding to the comparators

4Ii ehern 281 bis 285 ausgelcsenen 16 charakteristischen Parameter an die Komparatoren 291 bis 295 angelegt werden, werden beide charakteristischen Parameter von Eingangssignalen miteinander verglichen und ihre Abstände in diesen Komparatoren berechnet. Dement-There are 281 to 285 extracted 16 characteristic Parameters are applied to the comparators 291 to 295, both of the characteristic parameters of Input signals are compared with each other and their distances are calculated in these comparators. Demented

J> sprechend werden die Ausgangssignaleder Mikromuster-Komparatoren 291 bis 295 zu einer Zeitfolge von 5 Parametern und im ParameterpiilTerspeicher 30 gespeichert. Unter Verwendung der auf diese Weise im ParameterpiilTerspeicher 30 gespeicherten Parameter wird eine Anpassung an die Standardmuster in der Musteranpassungseinheit 3 gemäß Fig. I durchgeführt, u-d das Erkennungsergebnis wird als Ausgangssignal der Entscheidungscinheit 4 erzeugt.The outputs of the micro-pattern comparators become J> speaking 291 to 295 at a time sequence of 5 parameters and stored in the parameter memory 30. Using the parameters stored in this way in the parameter register memory 30, a Adaptation to the standard pattern carried out in the pattern adaptation unit 3 according to FIG The recognition result is used as the output of the decision unit 4 generated.

Der Vollständigkeit halber darf darauf hingewiesenFor the sake of completeness, this may be pointed out

<5 werden, daß die Schaltungsanordnung gemäß Fig. 5 ebenfalls von der Steuerschaltung 21 in Fig. 2 gesteuert ist.<5, that the circuit arrangement according to FIG is also controlled by the control circuit 21 in FIG.

Obwohl 16 Teiler 262-1 bis 262-16 in Fig. 5 dargestellt sind, ist es auch möglich, nur einen Teuer vorzusehen undAlthough 16 dividers 262-1 through 262-16 are shown in FIG are, it is also possible to provide only one expensive and

») jeden charakteristischen Parameter auf einer Zeitteilerbasis unter Verwendung des einen Teilers zu normieren. Außerdem können die Mikromustcr-Speicher 281 bis 285gemeinsam mit den Mikromuster-Komparatoren291 bis 295 verwendet werden. ») Normalize each characteristic parameter on a time divider basis using the one divider. In addition, the micro-pattern memories 281-285 can be used in common with the micro-pattern comparators 291-295.

Außerdem ist es möglich, eine solche Schaltung vorzusehen, weiche die Zeitfolge der aus den angegebenen Mikromuster-Komparatorcn erhaltenen fünf charakteristischen Parameter glättet und die Parameter erneutIt is also possible to provide such a circuit, soft the time sequence of the five characteristic ones obtained from the specified micro-pattern comparators Parameter smooths and the parameters again

aile ein oder zwei Intervalle abtastet, um die charakteristischen Parameter in Richtung ihrer Zeil achse weitet auf I 2 oder 13 zu komprimieren. Entsprechend den Versuchsergebnissen ist kaum eine Beeinträchtigung des Erkennungsverhältnisses /u beobachten, wenn diese komprimierten Parameter verwendet werden.aile samples one or two intervals to get the characteristic Parameter in the direction of your Zeil axis expands to compress I 2 or 13. According to the test results, there is hardly any impairment of the recognition ratio / u when using these compressed parameters.

Des weiteren ist es auch möglich, eine Abtastung an einem P"nkt als einen repräsentativen Punkt vorzunehmen, wo iine Änderung mit der Zeit maximal wird, nachdem die Zeitfolge von 5 charakteristischen Parametern geglättet ist.Furthermore, it is also possible to carry out a scan at a point as a representative point, where i a change with time becomes maximum after the time series of 5 characteristic parameters is smoothed.

Bei der Ausführungsform nach Fig. 2 sind verschiedene Speicher 23, 25, 27, 28 und 30 separat angeordnet, wobei diese Speicher durch einen gemeinsamen Speicher ersetzt werden können. υIn the embodiment of Fig. 2 are different Memories 23, 25, 27, 28 and 30 are arranged separately, these memories being shared by a common memory can be replaced. υ

Obwohl bei der oben beschriebenen Ausführungsforni die Ausgangssignale der Filterbank als die die Charakteristika des Spracheingangssignales repräsentierenden Parameter verwendet werden, kann die Erkennung des Spracheingangssignales auch mittels anderer Parameter m realisiert werden, z. B. mit linearen Vorhersagekocffizienten, Teil-AutokorrelationskoeiTizicnten oder dergleichen. Although the output signals of the filter bank are used as the parameters representing the characteristics of the speech input signal in the embodiment described above, the recognition of the speech input signal can also be realized by means of other parameters m , e.g. B. with linear prediction coefficients, partial autocorrelation coefficients or the like.

Neben den charakteristischen Parametern der Vokale können auch andere charakteristische Parameter, wie :5 z.B. Reibkonsonanten (z.B. »S« oder dergleichen) oder Nasal-Konsonanten (z.B. »N« oder »M«) als Mikromuster entweder allein oder in Kombination mit den Vokalen verwendet werden. Ferner ist es möglich, solche Parameter zu verwenden, die künstlich vorgegeben sind jo und absichtlich betonte Charakteristika aufweisen.In addition to the characteristic parameters of the vowels, other characteristic parameters such as: 5 eg frictional consonants (eg "S" or the like) or nasal consonants (eg "N" or "M") can be used as micro-patterns either alone or in combination with the vowels will. It is also possible to use parameters that are artificially specified and have intentionally emphasized characteristics.

Bei der obigen Ausführungsform berechnet die Mikromuster-Betriebsschaltung den Abstand, jedoch kann auch die Wahrscheinlichkeit berechnet werden. In jedem Falle kann eine beliebige Methode solange verwendet werden, wie Vergleichsergebnisse von zwei Mustern dargestellt werden.In the above embodiment, the micro-pattern driving circuit calculates the distance, but the probability can also be calculated. In each Trap, any method can be used as long as comparison results of two samples are shown will.

Obwohl bei der vorstehend beschriebenen Ausführungsform fünf Mikromuster verwendet werden, läßt sich das Ziel der Erfindung auch unter Verwendung «1 von mindestens einem Mikromuster erreichen, ohne daß eine spezielle Beschränkung auf die obige Ausführungsform vorliegt.Although five micro-patterns are used in the embodiment described above, can The aim of the invention can also be found using «1 of at least one micro-pattern without being specifically limited to the above embodiment is present.

Aus der vorstehenden Beschreibung ergibt sich bei der Durchführung des Vergleiches zwischen ρ charakteristischen Parametern des Spracheingangssignals und jeweils ρ charakteristischen Parametern von η Mikromustern bei dem erfindungsgemäßen Verfahren die Zahl der in der Anpassungseinheit miteinander zu vergleichenden charakteristischen Parameter im Vergleich zum 5« Stand der Technik auf n/p (mit der Maßgabe, daß n<p gilt), komprimiert ist. Da damit die Verarbeitungszeit bei der Musteranpassungseinheit sowie der Entscheidungseinheit erheblich verkürzt werden kann, ist es möglich, eine schnelle Erkennung zu realisieren, und zwar die Erkennung in einer Realzeitanordnung oder aber die Anzahl von zu erkennenden Worten zu erhöhen. Die Speicherkapazität zum Speichern der Standardmuster kann ebenfalls in hohem Maße verringert werden. From the above description, when carrying out the comparison between ρ characteristic parameters of the speech input signal and ρ characteristic parameters of η micro-patterns in the method according to the invention, the number of characteristic parameters to be compared with one another in the adaptation unit compared to the prior art is n / p (with the proviso that n <p ) is compressed. Since the processing time in the pattern matching unit and the decision unit can be shortened considerably in this way, it is possible to realize rapid recognition, namely recognition in a real-time arrangement or else to increase the number of words to be recognized. The memory capacity for storing the standard patterns can also be greatly reduced.

Somit können beim erfindungsgemäßen Verfahren die charakteristischen Parameter des Spracheingangssignales in wirksamer Weise komprimiert und damit die Erkennungsgeschwindigkeit verbessert sowie die Erkennungs-Verarbeitungsmenge erhöht werden.Thus, in the method according to the invention, the characteristic parameters of the speech input signal effectively compressed to improve the recognition speed and the recognition processing amount increase.

Das oben beschriebene Verfahren zur Spracherkennung zeichnet sich somit dadurch aus, daß die Vergleichsoperationen zwischen ρ charakteristischen Parametern. The method for speech recognition described above is thus characterized in that the comparison operations between ρ characteristic parameters.

die durch Berechnung der Sprachcingangssignale zu entsprechenden /eilpunkten berechnet sind, und den jeweiligen /) charakteristischen Parameter von /1 vorgegebenen, spezifischen Sprachen, durchgeführt werden, um charakteristische Parameter /u erhalten. Dann erfolgt eine Sortierung hinsichtlich der Koinzidenz, zwischen den resultierenden charakteristischen Parametern und charakteristischen Parametern von Standardsprache, die in gleicher Weise durch Vornahme von Vergleichsoperationen mit charakteristischen Parametern von spezifischen Sprachen erhalten worden sind, um auf diese Weise die Spracherkennung vorzunehmen.which are calculated by calculating the voice input signals to corresponding / express points, and the respective /) characteristic parameters of / 1 given, specific languages, carried out to obtain characteristic parameters / u. Then it takes place a sort in terms of coincidence, between the resulting characteristic parameters and characteristic parameters of standard language, in the same way by performing comparison operations with characteristic parameters of specific languages have been obtained in order to do the speech recognition in this way.

Hierzu 4 Blatt ZeichnungenFor this purpose 4 sheets of drawings

Claims

Patent claims:

1. Procedure for speech recognition in which from Speech input signals are determined with characteristic parameters s and with characteristic parameters are compared to those for given standard languages have been determined and saved, characterized by the following process steps: n>