DE3882400T2 - Anordnung zur Mustererkennung. - Google Patents
Anordnung zur Mustererkennung.Info
- Publication number
- DE3882400T2 DE3882400T2 DE88102646T DE3882400T DE3882400T2 DE 3882400 T2 DE3882400 T2 DE 3882400T2 DE 88102646 T DE88102646 T DE 88102646T DE 3882400 T DE3882400 T DE 3882400T DE 3882400 T2 DE3882400 T2 DE 3882400T2
- Authority
- DE
- Germany
- Prior art keywords
- data
- pattern
- feature data
- storage device
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003909 pattern recognition Methods 0.000 title claims description 12
- 238000004364 calculation method Methods 0.000 claims description 34
- 238000012952 Resampling Methods 0.000 claims description 8
- 230000015654 memory Effects 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims 4
- 238000001514 detection method Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000010606 normalization Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013479 data entry Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66C—CRANES; LOAD-ENGAGING ELEMENTS OR DEVICES FOR CRANES, CAPSTANS, WINCHES, OR TACKLES
- B66C15/00—Safety gear
- B66C15/04—Safety gear for preventing collisions, e.g. between cranes or trolleys operating on the same track
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Mechanical Engineering (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Description
- Die vorliegende Erfindung betrifft eine Anordnung zur Mustererkennung zum Erkennen eines Eingangssignals und insbesondere eine Anordnung zur Mustererkennung, die zur Implementierung in einem integrierten Schaltkreis geeignet ist.
- Fig. 1 ist ein Blockdiagramm, welches eine herkömmliche Anordnung einer Anordnung zur Spracherkennung als ein Typ von Anordnungen zur Mustererkennung zeigt. Ein Sprachsignal, welches durch eine Sprachsignaleingabeeinrichtung wie z.B. ein Mikrophon 10 eingegeben wird, wird einem akustischen Analyseabschnitt 11 zugeführt. In dem Abschnitt 11 werden Sprachmerkmale wie z.B. Frequenzspektren in Einheiten von vorbestimmten Rahmenlängen analysiert (normalerweise einige ms bis einige zehn ms), und die Merkmalsdaten zeitseriell extrahiert bzw. herausgezogen. Nachdem oder während die zeitseriellen Daten in einem Speichergerät 12 gespeichert sind, wird eine Wortgrenze, d.h. Start- und Endpunkte einer nutzbaren Stimme bzw. Sprache durch einen Wort-Grenz-Detektionsabschnitt 13 detektiert. Die Start- und Endpunkte des nutzbaren Wortes, welches durch den Abschnitt 13 detektiert wird, wird einer Adreßtabelle 14 des Speichergeräts 12 zugeführt. Eine Datenfolge, welche auf einer Ausgangsadresse von der Adressentabelle 14 basiert, in einer spezifischen gesprochenen Periode oder in Wortgrenzen wird von dem Speichergerät 12 als Erkennungsdaten geholt und einem ähnlichkeitsberechnenden Abschnitt 15 zugeführt.
- Ein Referenzmusterspeichergerät 16 speichert eine große Anzahl von Referenzmusterdaten. Der ähnlichkeitsberechnende Abschnitt 15 führt die Ähnlichkeitsberechnung zwischen diesen Referenzmusterdaten und den Datenfolgen durch, die von dem Speichergerät 12 geholt werden. Das Berechnungsergebnis wird einem bestimmenden Abschnitt 17 zugeführt und die Sprachdaten entsprechend dem Referenzmuster, welche die maximale Ähnlichkeit besitzen, werden als ein Erkennungsergebnis ausgegeben.
- Eine Wortperiodendauer tritt nicht oft zusammen mit einer Eingangswortperiodendauer, die zu erkennen ist, auf, denn die Referenzmusterdaten in dem Speichergerät 12 gespeichert werden. Aus diesem Grund werden, wenn die zu erkennenden Daten von dem Speichergerät 12 geholt werden, die geholten Daten zeitseriell entsprechend der Dauer der Referenzmusterdaten normiert, und dann muß die Ähnlichkeitsberechnung durchgeführt werden.
- Das zum Stand der Technik gehörende Dokument von M.F. Dapron et al.: "Ein System für gesprochene Eingangssignale von Labordaten", Proceedings of the National Electronics Conference", Vol. 34, Oktober 1980, Seiten 346 bis 350, Brook, Illinois, US; offenbart ein vom Sprecher abhängiges wortisoliertes Erkennungssystem, das dazu entworfen wurde, eine nahezu Echtzeitantwort auf einen gesprochenen numerischen Dateneintrag zu geben. Die Erkennung basiert auf einem einfachen Summe- von-Differenzen-Algorithmus, der das beste Zusammenpassen zwischen dem Anwendereingangssignal und einem Satz von Wortschablonenmustern findet, die während einer Anwendertrainingssitzung erzeugt wurden. Das System selbst kann in einen Merkmals-Extraktor und einen Musterprozessor aufgeteilt werden. Der Merkmals-Extraktor trennt das Spracheingangssignal in acht Parameter: sechs Spektralbandenergien, Gesamtenergie und Nulldurchgänge. Diese Parameter werden sequentiell abgetastet und durch einen Mikrocomputer gespeichert, der als der Musterprozessor verwendet wird.
- Ferner wird in diesem bekannten System die Zeitnormierung verwendet, weil die Leute nicht übereinstimmend bzw. durchweg ihre Aussprachen eines Wortes nach der Zeit bemessen. Um diese Zeitänderungen zu entfernen, extrahiert das System 16 gleichmäßig beabstandete Musterbeispiele von den gespeicherten Sprachdaten. Die Beabstandung wird durch das Teilen der Anzahl der Eingangssignalmusterbeispiele durch 16 berechnet und dann der Quotient als ein Index-Inkrement verwendet. Falls die Anzahl der Musterbeispiele kein Vielfaches von 16 ist, wird das Index-Inkrement während der ersten Übersprünge um 1 vergrößert, wobei r der Nenner ist, der sich aus dieser Division ergibt. Nachdem die Zeitnormierung beendet worden ist, bleibt ein 128-Byte-Arraymuster von 16 Beispielen durch 8 Bänder zurück. Dieses normierte Eingangssignal wird dann entweder in einem Schablonenflächenbereich gespeichert oder es wird mit jeder Schablone in dem Wortschatz verglichen, um das weitestgehende Zusammenpassen zu finden. In anderen Worten wird der Erkenner mit einer einzelnen frei zu wählenden Repräsentation des zu erkennenden Wortes gespeist, so daß Wortgrenz-Detektionsfehler auftreten können.
- Schließlich offenbart das zum Stand der Technik gehörende Dokument US -A-3 943 295 eine Anordnung und ein Verfahren zum Wörtererkennen aus der fortlaufenden Sprache. Diese bekannte Anordnung besteht aus einer Vielzahl von Modulen, ein Modul für jedes der Wortschatzwörter des Systems. Jedes Modul besteht aus einem sequentiellen Logikschaltkreis in Verbindung mit Zählspeicherregistern und Komparatoren. In einer derartigen Verarbeitung der fortlaufenden Sprache wird natürlich eine Parallelverarbeitung benötigt, da eine fortlaufende Sprache geschnitten werden sollte, bevor die Verarbeitungsoperationen durchgeführt werden.
- Zahlreiche zeitserielle Normierungsverfahren von Eingangsmusterdaten sind vorgeschlagen worden. Jedoch müssen diese Verfahren komplizierte Anordnungen verwenden und es kann keine hohe Erkennungsgenauigkeit erreicht werden.
- Es ist Aufgabe der vorliegenden Erfindung, eine Anordnung zur Mustererkennung bereitzustellen, welche auf einfache Weise zeitserielle Eingangsmusterdaten mit einer relativ einfachen Anordnung normieren kann und eine hohe Erkennungsgenauigkeit realisieren kann.
- Um diese Aufgabe zu lösen, stellt die vorliegende Erfindung eine Anordnung zur Musterkennung, wie sie in Anspruch 1 oder 8 spezifiziert ist, bereit.
- In der Anordnung zur Mustererkennung wird der zweite Speicherabschnitt, auf welchen nur durch den erkennungsberechnenden Abschnitt zugegriffen werden kann, vorbereitet, und die zu erkennenden Daten, die durch den Daten-Holabschnitt geholt werden, werden zeitseriell normiert und in dem zweiten Speicherabschnitt gespeichert. Die Merkmalsdaten, die von dem Eingangssignal erhalten werden, werden in dem ersten Speicherabschnitt gespeichert. Daher kann auf den ersten Speicherabschnitt unabhängig von der Erkennungsberechnung zugegriffen werden.
- Diese Erfindung kann in Verbindung mit den beiliegenden Abbildungen aus der folgenden ausführlichen Beschreibung besser verstanden werden, in welchen:
- Fig. 1 ein Blockdiagramm ist, welches eine Anordnung einer konventionellen Anordnung zur Mustererkennung zeigt;
- Fig. 2 ein Blockdiagramm ist, welches Funktionen einer Anordnung zur Mustererkennung entsprechend einem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
- Fig. 3 ein Blockdiagramm ist, weiches die Anordnung des Ausführungsbeispiels, welches in Fig. 2 gezeigt ist, zeigt;
- Fig. 4 und 5 Graphen sind, die Funktionen einer Filterbank in einem akustischen Analyseabschnitt, der in Fig. 3 gezeigt ist, zeigen;
- Fig. 6 ein Datenformat in einem Rahmen zeigt;
- Fig. 7 ein Datenformat in einem ersten Speichergerät zeigt;
- Fig. 8 ein Datenformat in einem zweiten Speichergerät zeigt;
- Fig. 9 bis 12 Flußdiagramme sind, die die Arbeitsweise des Ausführungsbeispiels, das in Fig. 3 gezeigt ist, zeigen;
- Fig. 13 ein Blockdiagramm ist, welches eine Anordnung entsprechend einem zweiten Ausführungsbeispiel der vorliegenden Erfindung zeigt; und
- Fig. 14 ein Blockdiagramm ist, welches eine Anordnung entsprechend einem dritten Ausführungsbeispiel der vorliegenden Erfindung zeigt.
- Die Ausführungsbeispiele der vorliegenden Erfindung werden mit Bezug auf die beiliegenden Abbildungen beschrieben.
- Fig. 2 ist eine Ansicht zum Erklären von Funktionen eines Ausführungsbeispiels einer Anordnung zur Spracherkennung, auf welche die vorliegende Erfindung angewendet wird. In Fig. 2 wird ein analoges Spracheingangssignal von einem Mikrophon 20 einem akustischen Analyseabschnitt 21 zugeführt. Der akustische Analyseabschnitt 21 extrahiert digitale Merkmalsdaten von dem Eingangssprachsignal mittels einer Kombination aus einer Filterbank, die einen seriell verbundenen Gleichrichter beinhaltet, einem analogen Bandpaßfilter und einem Tiefpaßfilter und einem Analog/Digital (A/D)-Umsetzer zum Umsetzen des Ausgangssignals von der Filterbank in digitale Daten. Eine Wortgrenze einer Eingangssignalsprachperiode wird von den extrahierten Merkmalsdaten durch einen Grenzdetektionsabschnitt 22 detektiert und wird in einem ersten Speichergerät 23 gespeichert.
- Das folgende Verfahren ist als ein Detektionsverfahren in dem Wortgrenzdetektionsabschnitt 22 bekannt. Energiekomponenten der Eingangssignalsprachdaten werden durch den akustischen Analyseabschnitt 2l extrahiert, wobei ein Breitband-Bandpaßfilter verwendet wird. Wenn die Energiekomponenten einen vorherbestimmten Schwellwert für eine vorherbestimte Zeitspanne überschreiten, wird eine Position, bei der die Energiekomponenten zuerst den Schwellenwert überschreiten, als ein Startpunkt oder ein Startrahmen bestimmt. Wenn die Energiekomponenten unter den Schwellwert für eine vorbestimmte Zeitspanne absinken, wird eine Position, bei der die Energiekomponenten zuerst unter den Schwellwert absinken, als ein Endpunkt oder ein Endrahmen eines Wortes bestimmt. In anderen Detektionsverfahren werden die hohen und tiefen Schwellwerte bestimmt, und wenn Energiekomponenten den hohen Schwellwert von dem niedrigen Schwellwert aus innerhalb einer vorbestimmten Zeitspanne erreichen, wird der Rahmen entsprechend dem niedrigen Schwellwert als ein Startrahmen eines Wortes bestimmt.
- Die Merkmalsdaten der Eingangssprachdaten, welche durch die Detektion der Wortgrenze erhalten werden, werden normalerweise bei einer gegebenen Abtastfrequenz zeitseriell abgetastet. Unter der Annahme, daß die Anzahl der Abtastungen durch N Rahmen gegeben ist, ändert sich N abhängig von der Wortgrenze. Die N Rahmendaten werden entlang der Zeitbasis normiert, um M Rahmendaten, welche eine feste Zeitdauer besitzen, zu erhalten. Als ein Verfahren wird das Wieder- bzw. wiederholte Abtasten durchgeführt. Zum Beispiel wird eine Abtastprobe des (1+i(N-1)/(M-1))-ten Rahmens geholt bzw. abgerufen (wobei i = 0 bis M-1). Die Merkmalsdaten, die in dem ersten Speichergerät 23 gespeichert sind, werden durch den wiederabtastenden Abschnitt 24 noch einmal abgetastet und entlang der Zeitbasis normiert. Dann werden die normierten Daten in den zweiten Speicherabschnitt 25 übertragen und darin gespeichert.
- Die Datenfolge, die in dem zweiten Speicherabschnitt 25 gespeichert ist, wird als zu erkennendes Datum geholt und dem ähnlichkeitsberechnenden Abschnitt 26 zugeführt. Die Ähnlichkeitsberechnung kann durch ein bekanntes Verfahren, welches z.B. in U.S. 4 624 011 offenbart ist, ausgeführt werden.
- Ein Referenzmusterspeichergerät 27 speichert eine große Anzahl von Referenzmusterdaten. Der ähnlichkeitsberechnende Abschnitt 26 führt die Ähnlichkeitsberechnung zwischen diesen Referenzmusterdaten und der Datenfolge, die von dem zweiten Speichergerät 25 geholt wurde, durch. Das Berechnungsergebnis oder die Ähnlichkeitsdaten werden dem bestimmenden Abschnitt 28 zugeführt, und es wird eine Wortnummer entsprechend dem Referenzmuster, welches die maximale Ähnlichkeit besitzt, bestimmt. Die bestimmte Nummer wird als Erkennungsergebnis ausgegeben.
- In der Anordnung dieses Ausführungsbeispiels wird auf das zweite Speichergerät 25, welches von dem ersten Speichergerät zum Speichern der zu erkennenden Daten getrennt ist, zugegriffen, um die Daten für die Ähnlichkeitsberechnung auszulesen. Daher ist keine komplizierte Adreßberechnung erforderlich, und die Daten können bereits durch ein sequentielles Adressieren des zweiten Speichergeräts 25 geholt werden. Wenn der ähnlichkeitsberechnende Abschnitt 26 auf zu erkennende Daten zugreift, dann sind nur ein Lesesteuerungssignal und ein Adreß-Aufwärtszähl-Signal erforderlich. Aus diesem Grund kann die Anordnung einer Steuerungsschaltung vereinfacht werden, und die Anzahl der Hardwarekomponenten für einen integrierten Schaltkreis kann reduziert werden.
- Die wiederabgetasteten Daten, die in dem zweiten Speichergerät 25 gespeichert sind, erfordern eine Kapazität von 1/10 oder weniger der Merkmalsdaten, die in dem ersten Speichergerät 23 gespeichert sind. Aus diesem Grund braucht nur ein erstes Speichergerät 23 vorbereitet zu werden, auch wenn eine Vielzahl von ähnlichkeitsberechnenden Abschnitten in dem Fall erforderlich ist, bei dem die Wortgrenzdetektion durchgeführt wird, welche auf einer Vielzahl von Algorithmen basiert, um eine Vielzahl von Wortgrenzen zu detektieren, oder bei dem eine Vielzahl von Perioden detektiert wird, um eine Vielzahl von Kandidaten zu erhalten, die auf einem spezifischen Algorithmus basieren.
- Tatsächlich beträgt im Hinblick auf einen belegten Flächenbereich auf einem Chip, wenn die Anordnung dieses Ausführungsbeispiels auf dem Chip integriert wird, der Flächenbereich des zweiten Speichergeräts 25 0,1 und der des ähnlichkeitsberechnenden Abschnitts 26 0,3, wenn der Flächenbereich des ersten Speichergeräts 23 zu 1 angenommen wird. Daher braucht, auch wenn eine Vielzahl von ähnlichkeitsberechnenden Abschnitten auf dem Chip vorbereitet werden muß, nur ein erstes Speichergerät 23, welches einen großen Flächenbereich belegt, vorbereitet werden, wobei auf diese Weise ein Chipflächenbereich auf vorteilhafte Weise reduziert wird.
- Fig. 3 ist ein Blockdiagramm, welches eine Anordnung der Anordnung des Ausführungsbeispiels zum Realisieren der Funktionen, die in Fig. 2 gezeigt sind, zeigt.
- In Fig. 3 bezeichnen die gleichen Referenzziffern die entsprechenden Teilbereiche in Fig. 2. Der akustische Analyseabschnitt 21 kann aus einem analogen Prozessor für die Analyse der Frequenzkomponenten, Energiekomponenten usw. in einem Sprachsignal aufgebaut werden, welches durch ein Mikrophon 20 eingegeben wird. Der Analogprozessor 21 beinhaltet eine Filterbank 21A und einen A/D-Umsetzer 21B, und extrahiert vorherbestimmte akustische Merkmale von dem Eingangssprachsignal auf Anweisung von einer CPU 30 über einen Bus B.
- Die Referenzziffer 31 bezeichnet einen Digitalprozessor, welcher das erste Speichergerät 23, einen Erkennungsberechnungsabschnitt 32 und einen externen Schnittstellenabschnitt (I/F) 33 beinhaltet.
- Der Erkennungsberechnungsabschnitt 32 beinhaltet den ähnlichkeitsberechnenden Abschnitt 26, das zweite Speichergerät 25 und das Referenzmusterspeichergerät 27. Von den Funktionen, welche in Fig. 2 gezeigt sind, werden jene entsprechend dem Wortgrenzdetektionsabschnitt 22, dem wiederabtastenden Abschnitt 24 und dem bestimmenden Abschnitt 28 durch die CPU 30 realisiert.
- Die Filterbank 21A in dem akustischen Analyseabschnitt 21 umfaßt 7-Kanal-Bandpaßfilter. Die Bandpaßfilter- Gleichrichter und die Tiefpaßfilter besitzen Charakteristiken, wie sie in Fig. 4 und 5 gezeigt sind. Der Gleichrichter richtet die Ausgangssignale des Bandpaßfilters gleich und liefert das gleichgerichtete Signal zu dem nachfolgenden Tiefpaßfilter, welches ein Signal von weniger als 50 Hz passieren läßt. Die Frequenzkomponenten, welche in einer menschlichen Stimme beinhaltet sind, werden extrahiert, wobei 6-Kanal (CH1 bis CH6)-Bandpaßfilter verwendet werden, wie in Fig. 4 gezeigt ist, und die extrahierten Daten werden für die Ähnlichkeitsberechnung als Eingangssprachmerkmalsdaten verwendet. Der 7-te Bandpaßfilter läßt ein Signal durch, welches einen Hauptfrequenzbereich, z.B. 50 Hz bis 5000 Hz besitzt, welcher in der menschlichen Stimme beinhaltet ist. Ein Ausgangssignal, welches durch das 7-te-Kanal (CH7)-Bandpaßfilter extrahiert wird, wird zur Detektion der Energiekomponenten der Eingangssignalsprachdaten bei dem Wortgrenzdetektionsabschnitt 22, wie in Fig. 2 gezeigt ist, verwendet.
- Die Filterausgangssignale des ersten bis siebten Kanals, welche durch die Filterbank 21A extrahiert werden, werden dem A/D-Umsetzer 21B zugeführt und einer nichtlinearen Umsetzung, wie z.B. einer log-Umsetzung, unterworfen. Danach werden die resultierenden Daten als 8-Bit-Digital-Merkmalsdaten für jeden Kanal ausgegeben. Ein 1-Byte-Dummy- bzw. Scheindatum wird zu den 7-Kanal 8-Bit Merkmalsdaten (8 (bit) x 7 (Kanal)) addiert und die resultierenden 8-Byte Daten werden als Ein-Rahmendaten behandelt.
- Jede Rahmendaten, die von dem akustischen Analyseabschnitt 21 ausgegeben werden, werden durch die CPU 30 alle 20 ms abgetastet und sequentiell in dem ersten Speichergerät 23 über den Bus B gespeichert. Fig. 6 zeigt das 8-Byte-Datenformat für einen Rahmen. Ein derartiger Rahmen wird in dem ersten Speichergerät gespeichert, welches eine Speicherkapazität entsprechend einem Maximum von 100 Rahmen besitzt, wie in Fig. 7 gezeigt ist. Die gespeicherten Daten, die in Fig. 7 gezeigt sind, repräsentieren einen Zustand nach der Wortgrenzdetektion. Der erste Rahmen dient als Sprachstartdatum und der 80-te Rahmen dient als Sprachenddatum. Das erste Speichergerät 23 besitzt eine Ringstruktur und die Adreßreihenfolge der Start- und Endpunkte wird oft umgedreht. Im Fall von Fig. 7 wird der 69-te Rahmen, der durch * angezeigt ist, von dem 70-ten Rahmen, der durch ** angezeigt ist, gefolgt. Aus diesem Grund können die Daten von den Start- zu den Endrahmen theoretisch als fortlaufende Daten behandelt werden.
- Die Anzahl der Rahmen der Merkmalsdaten, die in dem ersten Speichergerät 23 gespeichert sind, variiert abhängig von einer Zeitdauer der Sprachdaten. Die Rahmendaten, die in einer Wortperiode in dem ersten Speichergerät 23 beinhaltet sind, werden in einem vorbestimmten Zyklus (Abtastfrequenz) unter der Steuerung der CPU 30 ausgelesen und sequentiell in einem 60-Byte zweiten Speichergerät 25 von dem ersten Rahmen gespeichert. In diesem Fall der Rahmendaten werden die 6-Byte Daten (CH1 bis CH6-Daten) in dem zweiten Speichergerät 25 als Merkmalsdaten für die Ähnlichkeitsberechnung gespeichert. Das Speichergerät 25 speichert immer 60-Byte Daten und führt die Normierung entlang der Zeitbasis durch.
- Die Arbeitsweise des Ausführungsbeispiels, welches in Fig. 3 gezeigt ist, wird mit Bezug auf die Flußdiagramme in den Fig. 9 bis 12 beschrieben.
- Mit der obigen Anordnung verursacht die CPU 30, daß das erste Speichergerät 23 im digitalen Prozessor 31 Merkmalsdaten speichert, die durch den analogen Prozessor 21 im Schritt A1 erhalten werden, wie in Fig. 9 gezeigt ist. Die CPU 30 führt ferner die Wortgrenzendetektionssteuerung durch, wobei die Energiedaten von CH7, wie in Fig. 5 gezeigt ist, im Schritt A2 verwendet werden. Zum Beispiel vergleicht die CPU 30 den Ausgangssignalpegel des CH7-Bandpaßfilters mit einem vorbestimmten Wert und detektiert eine Wortgrenze, die durch Start- und Endpunkte, welche erhalten werden, wenn der Ausgangspegel den vorherbestimmten Wert überschreitet oder unterschreitet, definiert ist. Nachdem die Spracheingabe beendet ist, wird im Schritt A3 JA erhalten, und die Wiederabtastungssteuerung wird im Schritt A4 durchgeführt. Die CPU 30 überträgt die wiederabgetasteten Daten zu dem zweiten Speichergerät 25.
- CPU 30 führt eine Berechnungsstartanordnung einem erkennungsberechnenden Abschnitt 32 des Digitalprozessors 31 zu. Der erkennungsberechnende Abschnitt 32 führt eine Ähnlichkeitsberechnung für alle Sprachmuster, z.B. Silbenmuster, die in dem Referenzmusterspeichergerät 27 gespeichert sind, im Schritt A5 durch, wobei der ähnlichkeitsberechnende Abschnitt 26 verwendet wird. Immer wenn eine Berechnung für jedes Wort beendet ist, führt der Abschnitt 32 ein Lese-Anfragesignal der CPU 30 im Schritt A6 zu, um die CPU 30 aufzufordern, die Ähnlichkeitsberechnungsergebnisse auszulesen.
- Wenn die CPU 30 die Ähnlichkeitsberechnungsergebnisse für alle Wörter holt, sendet die CPU 30 die Wortnummer, welche die maximale Ähnlichkeit besitzt, an ein externes Gastrechnersystem über den externen Schnittstellenabschnitt 33.
- Der Wortgrenzendetektionsprozeß (A2), der in Fig. 9 gezeigt ist, wird mit Bezug auf Fig. 10 beschrieben. In Fig. 10 wird im Schritt B1 überprüft, ob ein Startkandidat schon gefunden ist. Falls NEIN im Schritt B1, geht der Ablauf mit Schritt B2 weiter, um zu überprüfen, ob ein Sprachdetektions(Energie)-Pegel von dem Bandpaßfilter CH7, welches die in Fig. 5 gezeigten Charakteristik besitzt, größer ist als ein vorherbestimmter Wert X. Falls JA im Schritt B2, geht der Ablauf mit Schritt B3 weiter und ein Flag- bzw. Kennzeichenbit, welches anzeigt, daß der Startkandidat gefunden ist, wird gesetzt.
- Der Ablauf geht weiter mit Schritt B4, um zu überprüfen, ob der Startkandidat, der im Schritt B3 erhalten wird, als ein Start bestimmt wird. Falls NEIN im Schritt B4 geht der Ablauf mit dem Schritt B5 weiter, um in der gleichen Art wie im Schritt B2 zu überprüfen, ob der Energiepegel größer ist als der vorherbestimmte Wert X. Falls JA im Schritt B5, geht der Ablauf mit Schritt B6 weiter, um zu überprüfen, ob Z oder mehr Rahmen (z.B. Z = 5), welche größere Energiepegel besitzen, fortgesetzt werden. Falls JA im Schritt B6, wird im Schritt B7 ein Flag gesetzt, welches anzeigt, daß der Start bestimmt ist. Falls es im Schritt B5 bestimmt wird, daß der Energiepegel kleiner ist als X, geht der Ablauf im Schritt B8 weiter, und der Startkandidat wird annuliert.
- Falls der Start im Schritt B7 bestimmt ist, geht der Ablauf von B4 zu B9 weiter, um einen End-Kandidaten zu finden. Falls NEIN im Schritt B9, wird im Schritt B10 überprüft, ob der erhaltene Energiepegel kleiner ist als ein vorherbestimmter Wert Y (X = Y ist erlaubt). Falls JA im Schritt B10, geht der Ablauf mit Schritt B11 weiter. Im Schritt B11 wird ein Flag gesetzt, welches anzeigt, daß der End-Kandidat gefunden ist.
- Falls der End-Kandidat gefunden ist, geht der Ablauf vom Schritt B9 zum Schritt B12 weiter, um zu überprüfen, ob das Ende bestimmt ist. Falls NEIN im Schritt B12, wird im Schritt B13 überprüft, ob der Energiepegel kleiner ist als Y (X = Y ist ebenso erlaubt). Falls JA im Schritt B13, geht der Ablauf im Schritt B14 weiter. Es wird im Schritt B14 überprüft, ob V Rahmen (V = 10), welche einen Pegel niedriger als Y besitzen, fortgesetzt werden. Falls JA im Schritt B14, geht der Ablauf mit Schritt B15 weiter und ein Ende der Eingangswortgrenze wird bestimmt. Falls im Schritt B13 bestimmt wird, daß der Energiepegel größer ist als Y, geht der Ablauf mit Schritt B16 weiter und der End-Kandidat wird annuliert.
- Falls das Ende im Schritt B15 bestimmt wird, wird im Schritt B12 JA erhalten und der Ablauf endet.
- Der Wiederabtastungs-Schritt A4 in Fig. 9 wird ausführlicher mit Bezug auf Fig. 11 beschrieben. Im Schritt C1 wird die Wortgrenzperiode l durch das Durchführen einer Berechnung l = Sprachendrahmen - Sprachstartrahmen erhalten. Die resultierende gesprochene Periode l wird in zehn Abschnitte im Schritt C2 geteilt und der Wert l/10 wird als Wiederabtastungs-Weite d erhalten. Im Schritt C3 wird i = 0 in den Inhalt eines Zählers geschrieben.
- Im Schritt C4 werden Merkmalsdaten eines (i.d.)-ten Rahmens (i = 1) von der Rahmennummer des Starts von dem ersten Speichergerät 23 ausgelesen und in dem zweiten Speichergerät 25 gespeichert. Der Ablauf geht mit Schritt C5 weiter und der Wert i wird um +1 vergrößert. Der inkrementierte Wert wird in ein i-Register geschrieben. Es wird im Schritt C6 überprüft, ob i kleiner ist als 10. Falls JA im Schritt C6, kehrt der Ablauf zum Schritt C4 zurück, und das Merkmal des nächsten Rahmens wird in dem zweiten Speichergerät 25 gespeichert. Auf ähnliche Weise werden die Rahmendaten in dem zweiten Speichergerät 25 sequentiell gespeichert. Wenn i = 10 ist, wird im Schritt C6 NEIN erhalten und das Wiederabtasten ist beendet.
- Fig. 12 ist ein Flußdiagramm, welches den Inhalt des Sortierungsschrittes A6 in Fig. 9 ausführlich zeigt. Im Schritt D1 wird 0 als eine maximale Ähnlichkeit für ein zu erkennendes Wort gesetzt, und die Zahl "1" des Referenzwortmusters wird gesetzt. Der berechnende Abschnitt 26 führt die Ähnlichkeitsberechnung der Musterdaten, die von dem zweiten Speichergerät 25 und dem Referenzmusterspeichergerät 27 ausgelesen sind, unter der Steuerung der CPU 30 durch. Im Schritt D2 holt die CPU 30 die resultierenden Ähnlichkeiten. Die berechnete Ähnlichkeit wird mit dem voreingestellten bzw. Soll-Maximalwert im Schritt D3 verglichen. Falls die berechnete Ähnlichkeit größer ist als ein Soll-Maximalwert, wird im Schritt D3 NEIN erhalten und der Ablauf geht mit Schritt D4 weiter. Die Ähnlichkeit, welche größer ist als der Soll-Maximalwert, wird als der letzte Maximalwert geholt und die entsprechende Wortnummer wird in der CPU 30 als ein Erkennungsergebnis gespeichert.
- Im Schritt D5 wird eine Wortnummer um +1 vergrößert und es wird dann im Schritt D6 überprüft, ob die Operationen in den Schritten D2 bis D5 für alle Referenzwörter beendet sind. Daher wird, wenn die Operation, die in Fig. 12 gezeigt ist, für alle Wörter beendet ist, die Wortnummer, die die maximale Ähnlichkeit aufweist, als Erkennungsergebnisse von I/F 33 ausgegeben.
- Insbesondere dient in der Anordnung dieses Ausführungsbeispiels die CPU 30 sowohl als Steuerungsschaltung für die Steuerung der gesamten Arbeitsweise als auch für den Bestimmungsabschnitt 28 in Fig. 2.
- Fig. 13 ist ein Blockdiagramm, welches eine Anordnung einer Anordnung entsprechend einem zweiten Ausführungsbeispiel der vorliegenden Erfindung zeigt.
- In diesem zweiten Ausführungsbeispiel wird die vorliegende Erfindung auf eine Spracherkennungsanordnung angewendet, die zwei erkennungsberechnende Abschnitte besitzt. Die Referenzziffer 21 bezeichnet einen analogen Prozessor, welcher eine Filterbank und einen A/D-Umsetzer beinhaltet, zum Analysieren eines Sprachsignaleingangssignals durch eine Sprachsignaleingangseinrichtung, wie z.B. ein Mikrophon 20. Die Referenzziffer 30 bezeichnet eine CPU; die Referenzziffer 23 ein erstes Speichergerät; die Referenzziffern 26A und 26B ähnlichkeitsberechnende Abschnitte; die Referenzziffern 25A und 25B zweite Speichergeräte; die Referenzziffern 27A und 27B Referenzmusterspeichergeräte; und die Referenzziffer 33 einen externen Schnittstellenabschnitt.
- Die CPU 30 wählt eine Vielzahl von (in diesem Fall 2) Start- und Endpunkten, wenn eine Wortgrenzperiode von den Merkmalsdaten detektiert wird, welche in der ersten Speichereinrichtung 23 gespeichert sind, und tastet diese wieder ab und überträgt die Daten zu den zweiten Speichergeräten 25A und 25B. Nachdem die Übertragungs-Operation beendet ist, führt die CPU 30 eine Erkennungsberechnungsstartanweisung den ähnlichkeitsberechnenden Abschnitten 26A und 26B zu, und bleibt dann betriebsbereit, bis eine Berechnung für ein Wort beendet ist. Die Ähnlichkeitsberechnung für ein Wort ist normalerweise in ungefähr 3 ms beendet. Da jedoch die Anweisungsausführungsgeschwindigkeit der CPU 30 schnell ist, z.B. 2 us, werden die Ähnlichkeitsberechnungen parallel in den zwei ähnlichkeitsberechnenden Abschnitten 26A und 26B durchgeführt, und alle Daten können ohne den Verlust eines Berechnungsergebnisses verarbeitet werden.
- Wenn die Referenzmusterspeichergeräte 27A und 27B den identischen Inhalt speichern, wird das maximale Ergebnis einer Vielzahl von Ähnlichkeitsberechnungsergebnissen, welche für eine Vielzahl von Wortgrenzen erhalten werden, als eine Ähnlichkeit für ein Wort bestimmt. Daher ist ein Wortgrenzdetektionsfehler eliminiert und eine hohe Erkennungsgenauigkeit wird erhalten.
- Wenn die Referenzmusterspeichergeräte 27A und 27B verschiedene Inhalte speichern, ist die Referenzmusterdatennummer doppelt so groß wie in einem Fall, bei dem nur ein Referenzmusterspeichergerät bereitgestellt ist, und eine Ähnlichkeit eines Eingangssprachsignals, welches eine große Anzahl von Wörtern besitzt, kann mit einer Geschwindigkeit, die doppelt so groß ist wie die der Anordnung, welche in Fig. 3 gezeigt ist, erhalten werden.
- In der Anordnung dieses Ausführungsbeispiels wird die Ähnlichkeitsberechnung in zwei ähnlichkeitsberechnenden Abschnitten 26A und 263 durchgeführt. Drei oder mehr ähnlichkeitsberechnende Abschnitte können vorbereitet werden, um eine höhere Erkennungseffizienz zu erhalten, oder um eine Ähnlichkeit bei einer höheren Geschwindigkeit zu erhalten.
- Fig. 14 ist ein Blockdiagramm, welches eine Anordnung einer Anordnung entsprechend einem dritten Ausführungsbeispiel der vorliegenden Erfindung zeigt.
- In der Anordnung dieses Ausführungsbeispiel ist, wenn zwei ähnlichkeitsberechnende Abschnitte 26A und 26B bereitgestellt sind, ein Referenzmusterspeichergerät 27 bereitgestellt, und dieses wird gemeinsam durch verschiedene ähnlichkeitsberechnende Abschnitte verwendet. In diesem Ausführungsbeispiel können Eingangsstimmen bzw. -sprachen, die eine größere Anzahl Wörter besitzen, nicht bei einer Hochgeschwindigkeit erkannt werden. Jedoch kann die Wortgrenzdetektionsgenauigkeit mit einer geringen Anzahl von Hardwarekomponenten verbessert werden, und es kann eine hohe Erkennungseffizienz erhalten werden.
- Entsprechend der vorliegenden Erfindung, wie oben beschrieben ist, kann eine Anordnung zur Mustererkennung, welche eine hohe Erkennungseffizienz bereitstellen kann und welche mit einer kleineren Anzahl von Hardwarekomponenten aufgebaut werden kann, bereitgestellt werden.
Claims (15)
1. Anordnung zur Mustererkennung mit:
einer Einrichtung (21) zum Extrahieren von
Mustermerkmalsdaten, die ein Mustermerkmal eines
Eingangssignals repräsentieren, welches Zeitdauern
beinhaltet, die effektive Signalperioden
bezeichnen;
einer ersten Speichereinrichtung (23) zum
Speichern der extrahierten Mustermerkmalsdaten;
einer Einrichtung (24, 30) zum Wiederabtasten
definierter Mustermerkmalsdaten, welche in den
Mustermerkmalsdaten beinhaltet sind, die in der ersten
Speichereinrichtung (23) gespeichert sind, wobei
die wiederabtastende Einrichtung (24, 30) eine
Einrichtung zum Definieren einer Vielzahl von
Zeitdauern beinhaltet, die eine Vielzahl von
verschiedenen effektiven Signalperioden der
Mustermerkmalsdaten bezeichnen, die in der ersten
Speichereinrichtung (23) gespeichert sind;
einer zweiten Speichereinrichtung (25), die eine
Vielzahl von Speichereinheiten (25A, 25B) zum
Speichern der definierten Bildmusterdaten besitzt, die
durch die wiederabtastende Einrichtung (24, 30)
ausgelesen werden;
einer Einrichtung (27) zum Speichern von
Referenzmusterdaten;
einer ähnlichkeitsberechnenden Einrichtung (26),
die ähnlichkeitsberechnende Abschnitte (26A, 26B)
beinhaltet, die in der Anzahl der Vielzahl von
Speichereinheiten (25A, 25B) entsprechen, wobei jede
der berechnenden Abschnitte Ähnlichkeiten zwischen
den definierten Mustermerkmalsdaten, die von der
zweiten Speichereinrichtung (25) ausgelesen werden,
und den Referenzmusterdaten, die von der
Referenzmusterdaten speichernden Einrichtung ausgelesen
werden, berechnet; und
einer Einrichtung (28) zum Bestimmen der
Mustermerkmale der Eingangssignale, welche auf den
berechneten Ähnlichkeiten basieren.
2. Anordnung entsprechend Anspruch 1, dadurch
gekennzeichnet, daß:
die Mustermerkmalsdaten extrahierende
Einrichtung (21) eine erste Filtereinrichtung (21A) zum
Extrahieren der Frequenzspektrumsdaten des
Eingangssignals und eine zweite Filtereinrichtung (21A) zum
Extrahieren von Energiepegeldaten des
Eingangssignals beinhaltet;
die erste Speichereinrichtung (23) die
Frequenzspektrumsdaten der ersten Filtereinrichtung (21A)
speichert; und
die wiederholt abtastende Einrichtung (24, 30)
eine Einrichtung zum Bestimmen der verschiedenen
effektiven Signalperioden entsprechend den
Energiepegeldaten von der zweiten Filtereinrichtung (21A)
beinhaltet.
3. Anordnung nach Anspruch 2, dadurch gekennzeichnet,
daß:
das Eingangssignal ein Sprachsignal ist;
die Referenzmusterdaten eine Vielzahl von
Referenzsprachmustern repräsentieren; und
die Muster bestimmende Einrichtung eine
Einrichtung zum Bestimmen des Eingangssprachsignals
beinhaltet,
welches auf den berechneten Ähnlichkeiten
basiert.
4. Anordnung nach Anspruch 1, dadurch gekennzeichnet,
daß die Mustermerkmalsdaten extrahierende
Einrichtung (21) beinhaltet:
eine Filterbank (21A) zum Filtern, wobei eine
Vielzahl von Frequenzkanälen verwendet wird, des
abgetasteten Eingangssignals, welches durch das
Abtasten des Eingangssignals in dem vorbestimmten
Rahmenzyklus erhalten wird; und
eine Einrichtung (21B) zum
Analog/Digital-Umsetzen des Ausgangssignals von der Filterbank (21A)
und zum Bilden der Rahmendaten.
5. Anordnung nach Anspruch 1, dadurch gekennzeichnet,
daß die erste Speichereinrichtung (23) eine
Ringstruktur besitzt.
6. Anordnung nach Anspruch 1, dadurch gekennzeichnet,
daß die Referenzmusterdaten von einer Vielzahl von
Referenzmusterspeichern (27A, 27B) ausgegeben
werden, die entsprechend der Vielzahl von
ähnlichkeitsberechneten Abschnitten (26A, 26B) bereitgestellt
sind.
7. Anordnung nach Anspruch 1, dadurch gekennzeichnet,
daß die Referenzmusterdaten von einem einzelnen
Referenzmusterspeicher (27) ausgegeben werden, der
der Vielzahl der Speichereinheiten gemeinsam zur
Verfügung steht.
8. Anordnung zur Mustererkennung zum Bestimmen eines
Musters eines Eingangssignals, mit:
einer extrahierenden Einrichtung (21) zum
Extrahieren von Mustermerkmalsdaten, die repräsentativ
für die Muster von dem Eingangssignal sind;
einer ersten Speichereinrichtung (23), die im
Betrieb mit der extrahierenden Einrichtung (21) zum
Speichern der extrahierenden Mustermerkmalsdaten
gekoppelt ist;
einer potentiell verwendbaren Auswähleinrichtung
(30), die im Betrieb mit der ersten
Speichereinrichtung (23) zum Auswählen einer Vielzahl von
potentiell verwendbaren Mustermerkmalsdaten entsprechend
einer Vielzahl von Zeitdauern der extrahierten
Mustermerkmalsdaten gekoppelt ist, wobei jede der
potentiell verwendbaren Mustermerkmalsdaten wieder
für eine ausgewählte einzigartige Zeitdauer
abgetastet werden;
einer zweiten Speichereinrichtung (25), die im
Betrieb mit der potentiell verwendbaren
Auswähleinrichtung (30) zum Speichern der Vielzahl von
potentiell verwendbaren Mustermerkmalsdaten und
Referenzmerkmalsdaten gekoppelt ist;
einer ähnlichkeitsberechnenden Einrichtung (26),
die im Betrieb mit der zweiten Speichereinrichtung
(25) zum Berechnen von Ähnlichkeiten zwischen den
potentiell verwendbaren Mustermerkmalsdaten und der
Referenzmusterdaten gekoppelt ist, und
eine bestimmende Einrichtung, die im Betrieb mit
der ähnlichkeitsberechnenden Einrichtung (26) zum
Bestimmen der Muster des Eingangssignals, welches
auf der berechneten Ähnlichkeit basiert, gekoppelt
ist.
9. Anordnung nach Anspruch 8, dadurch gekennzeichnet,
daß:
das Eingangssignal Frequenzspektrumsdaten und
Energiepegeldaten beinhaltet;
die extrahierende Einrichtung (21) eine erste
Filtereinrichtung (21A) zum Extrahieren der
Frequenzspektrumsdaten und eine zweite
Filtereinrichtung (21A) zum Extrahieren der Energiepegeldaten
beinhaltet;
die erste Speichereinrichtung (23) die
Frequenzspektrumsdaten speichert; und
die potentiell verwendbare Auswähleinrichtung
eine Einrichtung zum Bestimmen der Zeitdauern für
die potentiell verwendbaren Mustermerkmalsdaten
entsprechend den Energiepegeldaten beinhaltet.
10. Anordnung nach Anspruch 9, dadurch gekennzeichnet,
daß:
das Eingangssignal ein Sprachsignal umfaßt,
welches ein Sprachmuster besitzt;
die Referenzmusterdaten eine Vielzahl von
Referenzsprachmustern repräsentieren; und
die bestimmende Einrichtung eine Einrichtung zum
Anpassen der Sprachmuster an ein bestimmtes
ausgewähltes Referenzsprachmuster beinhaltet, welches
auf der berechneten Ähnlichkeit basiert.
11. Anordnung nach Anspruch 8, dadurch gekennzeichnet,
daß die extrahierende Einrichtung (21) beinhaltet:
eine Filterbank (21A), welche eine Vielzahl von
Frequenzkanälen zum Filtern beinhaltet und welche
das Eingangssignal in einem vorbestimmten
Rahmenzyklus abtastet, um ein gefilteres Eingangssignal
zu erzeugen; und
eine Analog/Digital-Umsetzer-Einrichtung (21B),
die im Betrieb mit der Filterbank (21A) zum
Digitalisieren des gefilterten Eingangssignals gekoppelt
ist, um Rahmendaten zu bilden.
12. Anordnung nach Anspruch 8, dadurch gekennzeichnet,
daß die erste Speichereinrichtung (23) eine
Ringstruktur besitzt.
13. Anordnung nach Anspruch 8, dadurch gekennzeichnet,
daß:
die zweite Speichereinrichtung (25) eine
Vielzahl von Speichereinheiten (25A, 25B) beinhaltet,
wobei jede der Speichereinheiten (25A, 25B)
ausgewählte Rahmendaten der potentiell verwendbaren
Mustermerkmalsdaten speichert; und
die ähnlichkeitsberechnende Einrichtung (26)
eine Vielzahl von ähnlichkeitsberechnende
Abschnitte (26A, 26B) beinhaltet, die im Betrieb mit den
jeweiligen und entsprechenden Speichereinheiten
(25a, 25B) gekoppelt sind, wobei jeder der
ähnlichkeitsberechnenden Abschnitte (26A, 26B) eine
Ähnlichkeit zwischen den Rahmendaten der potentiell
verwendbaren Mustermerkmalsdaten einer
entsprechenden Speicherelnheit und den Referenzmusterdaten
berechnet.
14. Anordnung nach Anspruch 13, dadurch gekennzeichnet,
daß die zweite Speichereinrichtung (25) eine
Vielzahl von Referenzmusterspeichern (27A, 27B)
beinhaltet, die im Betrieb mit den jeweiligen und
entsprechenden ähnlichkeitsberechnenden Abschnitten (26A,
26B) gekoppelt sind, wobei jeder der
ähnlichkeitsberechnenden Abschnitte (26A, 26B) eine Ähnlichkeit
zwischen den Rahmendaten der potentiell
verwendbaren Merkmalsdaten einer entsprechenden
Speichereinheit (25A, 25B) und den Referenzmusterdaten eines
entsprechenden Referenzmusterspeichers berechnet.
15. Anordnung nach Anspruch 13, dadurch gekennzeichnet,
daß die zweite Speichereinrichtung (25) ferner
einen einzelnen Referenzmusterspeicher (27)
beinhaltet, der im Betrieb mit den Speichereinheiten zum
Speichern der Referenzmusterdaten und zum Mitteilen
der Referenzmusterdaten an die Speichereinheiten
beinhaltet.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62037787A JPH067343B2 (ja) | 1987-02-23 | 1987-02-23 | パタ−ン識別装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3882400D1 DE3882400D1 (de) | 1993-08-26 |
DE3882400T2 true DE3882400T2 (de) | 1993-11-11 |
Family
ID=12507197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE88102646T Expired - Fee Related DE3882400T2 (de) | 1987-02-23 | 1988-02-23 | Anordnung zur Mustererkennung. |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP0283743B1 (de) |
JP (1) | JPH067343B2 (de) |
KR (2) | KR890013577A (de) |
DE (1) | DE3882400T2 (de) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1013525B (zh) * | 1988-11-16 | 1991-08-14 | 中国科学院声学研究所 | 认人与不认人实时语音识别的方法和装置 |
US5210820A (en) * | 1990-05-02 | 1993-05-11 | Broadcast Data Systems Limited Partnership | Signal recognition system and method |
US6471420B1 (en) | 1994-05-13 | 2002-10-29 | Matsushita Electric Industrial Co., Ltd. | Voice selection apparatus voice response apparatus, and game apparatus using word tables from which selected words are output as voice selections |
DE4417557A1 (de) * | 1994-05-19 | 1995-11-23 | Daimler Benz Aerospace Ag | Verfahren zur Erkennung von Sprachsignalen und Anordnung zum Durchführen des Verfahrens |
KR100396748B1 (ko) * | 1996-12-23 | 2003-11-28 | 엘지전자 주식회사 | 유음구간추출처리장치및방법 |
KR102343620B1 (ko) * | 2019-12-03 | 2021-12-24 | 세메스 주식회사 | 캐리어 이송 장치를 구비하는 캐리어 이송 시스템 |
KR102516414B1 (ko) * | 2020-10-07 | 2023-03-31 | 유기석 | 외부 선택 개폐형 마스크 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3710323A (en) * | 1971-12-13 | 1973-01-09 | Ibm | Pattern-size normalizing for recognition apparatus |
US3943295A (en) * | 1974-07-17 | 1976-03-09 | Threshold Technology, Inc. | Apparatus and method for recognizing words from among continuous speech |
DE3008830A1 (de) * | 1980-03-07 | 1981-10-01 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zum betrieb eines spracherkennungsgeraetes |
JPS59131999A (ja) * | 1983-01-19 | 1984-07-28 | 松下電器産業株式会社 | 音声認識装置 |
JPS59223499A (ja) * | 1983-06-02 | 1984-12-15 | 松下電器産業株式会社 | 音素認識装置 |
-
1987
- 1987-02-23 JP JP62037787A patent/JPH067343B2/ja not_active Expired - Fee Related
-
1988
- 1988-02-22 KR KR1019880001822A patent/KR890013577A/ko not_active IP Right Cessation
- 1988-02-22 KR KR1019880001822A patent/KR910001117B1/ko not_active Application Discontinuation
- 1988-02-23 EP EP88102646A patent/EP0283743B1/de not_active Expired - Lifetime
- 1988-02-23 DE DE88102646T patent/DE3882400T2/de not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH067343B2 (ja) | 1994-01-26 |
KR910001117B1 (ko) | 1991-02-23 |
EP0283743B1 (de) | 1993-07-21 |
KR880011006A (ko) | 1988-10-25 |
EP0283743A1 (de) | 1988-09-28 |
DE3882400D1 (de) | 1993-08-26 |
JPS63205698A (ja) | 1988-08-25 |
KR890013577A (ko) | 1989-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2953262C2 (de) | ||
DE3878001T2 (de) | Spracherkennungseinrichtung unter anwendung von phonemermittlung. | |
DE69925479T2 (de) | Dynamisch konfigurierbares akustisches modell für spracherkennungssysteme | |
DE4397106B4 (de) | Schnelles auf einer Baumstruktur basierendes Verfahren zur Vektorquantisierung | |
DE69615667T2 (de) | Spracherkennung | |
DE3337353C2 (de) | Sprachanalysator auf der Grundlage eines verborgenen Markov-Modells | |
DE3878852T2 (de) | Spracherkennung. | |
DE3884880T2 (de) | Billige Spracherkennungseinrichtung und Verfahren. | |
DE4031638C2 (de) | ||
DE2347738A1 (de) | Spracherkennungsverfahren und vorrichtung zur durchfuehrung desselben | |
DE69930961T2 (de) | Vorrichtung und verfahren zur sprachsegmentierung | |
DE3819178A1 (de) | Spracherkennungsverfahren und -einrichtung | |
DE2753707A1 (de) | Einrichtung zur erkennung des auftretens eines kommandowortes aus einer eingangssprache | |
DE69720134T2 (de) | Spracherkenner unter Verwendung von Grundfrequenzintensitätsdaten | |
EP0533260A2 (de) | Verfahren und Anordnung zum Erkennen der gesprochenen Wörter in einem Sprachsignal | |
DE3043516C2 (de) | Verfahren und Vorrichtung zur Spracherkennung | |
DE69118118T2 (de) | Methode und System zur Spracherkennung ohne Rauschbeeinflussung | |
DE69614937T2 (de) | Verfahren und System zur Spracherkennung mit verringerter Erkennungszeit unter Berücksichtigung von Veränderungen der Hintergrundgeräusche | |
US5027407A (en) | Pattern recognition apparatus using a plurality of candidates | |
DE4031421C2 (de) | Musteranpassungssystem für eine Spracherkennungseinrichtung | |
DE3750365T2 (de) | Sprecheridentifizierung. | |
DE3882400T2 (de) | Anordnung zur Mustererkennung. | |
EP0285222B1 (de) | Verfahren zum Erkennen zusammenhängend gesprochener Wörter | |
EP0836175A2 (de) | Verfahren und Anordnung zum Ableiten wenigstens einer Folge von Wörtern aus einem Sprachsignal | |
DE69128582T2 (de) | Methode zur Phonemunterscheidung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |