JPS6269298A - Voice recognition equipment - Google Patents

Voice recognition equipment

Info

Publication number
JPS6269298A
JPS6269298A JP60209369A JP20936985A JPS6269298A JP S6269298 A JPS6269298 A JP S6269298A JP 60209369 A JP60209369 A JP 60209369A JP 20936985 A JP20936985 A JP 20936985A JP S6269298 A JPS6269298 A JP S6269298A
Authority
JP
Japan
Prior art keywords
state
state transition
recognized
identification
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60209369A
Other languages
Japanese (ja)
Other versions
JPH0562998B2 (en
Inventor
正典 宮武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP60209369A priority Critical patent/JPS6269298A/en
Publication of JPS6269298A publication Critical patent/JPS6269298A/en
Publication of JPH0562998B2 publication Critical patent/JPH0562998B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 (イ)産業上の利用分野 本発明は、音声認識の結果によって次回の認識処理に於
ける識別対象の状態が遷移する音声認識装置に関する。
DETAILED DESCRIPTION OF THE INVENTION (A) Field of Industrial Application The present invention relates to a speech recognition device in which the state of an identification target in the next recognition process changes depending on the result of speech recognition.

(ロ)従来の技術 一般に音声認識装置は、特開昭59−219798号公
報に示されている如く、認識語数が増えるほど認識率が
低下する。従来よりこれをふせぐために、認識語をいく
つかのグループに分け、音声認識の結果に応じてその次
に認はする時の認識対象語を限定することにより、認識
率を向上させていた。例えば、電化製品を音声認識によ
って制御する場合、まず「ライト」というf声が認識さ
れれば、次は「オン」、「オフ」または「取り消し」の
3語の音声のみを認識対象とすることができる。第2図
はこのような状態遷移規則情報の例を示したもので、各
状態(状態1、状態2、状態6、・・・・・・)におけ
る認&ik対未語と認識結果に対する状暢遷移の情報が
gd憶されている。例えばいま、ライトとクーラー、お
よびクーラーに付属したタイマーを音声認識により制御
するとする。便用する単語は数字の「イチ」から「キュ
ウ」、「ライト」、「クーラー」、「タイマー」、「オ
ン」、「オフ」、「トリケシ」の15語である。図中の
Xは認識対象外であることを意味し、また数字はそれぞ
れの単語が認識された時に遷移する1次の状7俵番号を
示している。
(B) Prior Art Generally speaking, the recognition rate of speech recognition apparatuses decreases as the number of recognized words increases, as shown in Japanese Patent Application Laid-Open No. 59-219798. Conventionally, in order to prevent this, the recognition rate was improved by dividing the recognition words into several groups and limiting the words to be recognized the next time according to the result of speech recognition. For example, when controlling electrical appliances using voice recognition, first the voice ``light'' is recognized, then only the three words ``on'', ``off'', or ``cancel'' are recognized. I can do it. Figure 2 shows an example of such state transition rule information, and shows the state transition rule information for each state (state 1, state 2, state 6, etc.) and the state transition rule information for recognition &ik vs. unspoken and recognition results. Transition information is stored in gd. For example, let's say you want to control a light, a cooler, and a timer attached to the cooler using voice recognition. The 15 words used are the numbers ``ichi'' to ``kyu'', ``light'', ``cooler'', ``timer'', ``on'', ``off'', and ``trikeshi''. The symbol X in the figure means that the words are not recognized, and the numbers indicate the number of the seven bales in the first order that changes when each word is recognized.

現在、クーラーが停止しているものとし、これを状態1
とする。状、四1においては認識対象語は「ライト」と
「クーラー」のみである。まず音声「ライト」が入力さ
れ認識されたとすると、状態2に遷移する。状態2では
「オン」、「オフ」、「トリケシ」のいずれかが認識さ
れ、状態1に戻る。「オン」または「オフ」が認識され
たときには前記出力部においては、所定の信号が出力さ
れる。ここではライトが点灯しているときと消灯してい
るときを同じ状!Itとしたが、ライトが点灯している
ときにライト点灯を意味する信号が出力されては不都合
なときには、別の状態を定義すればよい。
Assume that the cooler is currently stopped, and this is set to state 1.
shall be. In Case 41, the only words to be recognized are ``light'' and ``cooler.'' First, if the voice "light" is input and recognized, a transition is made to state 2. In state 2, any one of "on", "off", and "trigger" is recognized, and the state returns to state 1. When "on" or "off" is recognized, a predetermined signal is output from the output section. Here, the state is the same when the light is on and when it is off! However, if it is inconvenient for a signal indicating that the light is on to be output when the light is on, another state may be defined.

一方、状態1のときに「クーラー」と認識されたら、状
態6に遷移する。ここでは「オン」と「トリケシ」のみ
が認識対象であり、「オン」と認識されたとすると、さ
らに状7擦4に這移し、クーラーは始動する。クーラー
が始動するとタイマーの設定が可能になり、認識対象語
は「ライト」、「クーラー」、「タイマー」の3語とな
る。
On the other hand, if it is recognized as a "cooler" in state 1, the state transitions to state 6. Here, only "ON" and "TRIKESH" are to be recognized, and if "ON" is recognized, the process moves further to step 7 and the cooler starts. Once the cooler starts, the timer can be set, and the three words to be recognized are "light,""cooler," and "timer."

状H4において「タイマー」と認識されたとすると状態
7に4移し、認識対象語は「イチ」から「キュウ」まで
の数字と「オフ」および「トリク」となる。数字が認識
されたときにはクーラー停止までの時間を設定するため
の信号が出力され、「オフ」が認識されたときにはタイ
マーの設定を解除する信号を出力L、また「トリケシ」
が認−されたときには例もしないで、1ii171.の
場合も状態4に戻る。
If "timer" is recognized in state H4, the state moves to state 7 and the words to be recognized are numbers from "ichi" to "kyu", "off" and "trick". When the number is recognized, a signal is output to set the time until the cooler stops, and when "off" is recognized, a signal is output to cancel the timer setting.
1ii171. In this case, the state returns to state 4 as well.

従来はこのような状態遷移の規則を記憶し制御するため
に、音声認識装置をホストコンピュータによって制御し
、音声認識装置から出力される認識結果によって次の認
識対象語を音声認識装置に知らせる方法が用いられてき
た。しかしこの方法では、ホストコンピュータを必要と
するためシステムがな雑で大きなものになりやすい。
Conventionally, in order to memorize and control such state transition rules, the speech recognition device is controlled by a host computer, and the next recognition target word is notified to the speech recognition device based on the recognition result output from the speech recognition device. has been used. However, since this method requires a host computer, the system tends to be complicated and large.

一方、音声認識装置に状態遷移規則を記憶させ、音声認
識装置自らが状態遷移を監視して認識対象語を判定する
ことによシ、システムを簡略化できるO 第5図はこのようなシステムの構成例を示したブロック
図であり、il+はマイクロホン、(2)は入力音声の
特徴を抽出する特徴抽出部、(3)は前記特徴抽出部(
21で得られる入力音声の特@を用いて入カバターンを
作成するパターン作成部である。(4)は予め登録され
ている員数の標準パターンを格納する標準パターン記憶
部、(5)は前記入カバターンと標準パターン記憶部(
4)内の標準パターンとを比較するパターンマツチング
部、(61はパターンマツチングの拮果に応じて所定の
信号を外部に出力する出力部である。(71は第2図図
示の如き状態、S規則則を格納するための状J4移規則
記憶部、(8)は該状jfA逼移規則記憶部!71のf
J′Miを用いて前記標準パターン記憶部(4)内の標
準パターンを選択する標準パターン指定部、(91は該
標蘭パターン指定部(8)からの出力に応じてパターン
マツチング部(5)へ送る標準パターンを選択するゲー
トである。
On the other hand, the system can be simplified by storing the state transition rules in the speech recognition device and having the speech recognition device itself monitor the state transitions and determine the recognition target words. Figure 5 shows a diagram of such a system. It is a block diagram showing a configuration example, where il+ is a microphone, (2) is a feature extraction unit that extracts features of input audio, and (3) is the feature extraction unit (
This is a pattern creation section that creates an input pattern using the special @ of the input voice obtained in step 21. (4) is a standard pattern storage section that stores a pre-registered number of standard patterns; (5) is a standard pattern storage section (
4) is a pattern matching section that compares the pattern with the standard pattern (61 is an output section that outputs a predetermined signal to the outside according to the result of pattern matching. (71 is a state as shown in FIG. 2) , the state J4 transfer rule storage unit for storing the S rule, (8) is the state jfA transfer rule storage unit!71 f
A standard pattern specifying section (91) selects a standard pattern in the standard pattern storage section (4) using J'Mi; ) is a gate that selects the standard pattern to be sent to.

しかし従来は、状態遷移の規則が音声認識装置を制御す
るマイクロプロセッサのプロクラムノ一部として組み込
まれていたため音声認識装置が専用化されてしまい、用
途に応じて音声認識装置のプログラムを作り変えなけれ
ばならない不都合があった〇 (ハ)発明が解決しようとする問題点 本発明は、上IQの不都合全解決するためのものであ7
て、内部に記憶されている状態遷移規則を簡単な手段で
変史することのできる音声認識装置を提供することを目
的とする。
However, in the past, the state transition rules were incorporated as part of the program of the microprocessor that controlled the speech recognition device, which meant that the speech recognition device was specialized, and the program for the speech recognition device had to be rewritten depending on the purpose. (c) Problems to be solved by the invention The present invention is intended to solve all the disadvantages of upper IQ.
It is an object of the present invention to provide a speech recognition device that can change the state transition rules stored therein by simple means.

(ロ)問題点を解決するための手段 入力された音声から特@槌を抽出する特徴抽出部と、抽
出された特徴をもとに入力された音声を識別しその結果
に応じて所定の信号を出力する識別部と、前dピ識別部
の識別結果に応じて遷移する識別対象に関する段数の状
態の間の遷移規則を記憶する状、憧遷移規則記憶部と、
から構成され、かつ前記状態遷移規則記憶部は前記識別
部に対して着脱可能な構造全盲していることを特徴とす
る。
(b) Means for solving the problem A feature extraction unit that extracts special@tsuchi from the input voice, identifies the input voice based on the extracted features, and generates a predetermined signal according to the result. an identification unit that outputs a dpi identification unit; and a desired transition rule storage unit that stores a transition rule between states of the number of stages related to an identification target that transitions according to the identification result of the previous dpi identification unit;
The state transition rule storage section is characterized in that the state transition rule storage section has a completely blind structure that is removable from the identification section.

さらに、曲呂己状態遷#規則記憶部は、ICソケット士
に装備されたROM(リード・オンリーメモリー)によ
り構成されることを特徴とする〇(ホ)作 用 本発明は、F記のように構成されているので、前記識別
部は前記状態遷移規則記1]は部の規則に従って識別対
象全判定することにより、状態遷規則μ(j記憶部例え
ば’FICM’i交換するだけで、簡単に目的に応じた
状態遷移規則を音声認識装置に付加することができる。
Furthermore, the present invention is characterized in that the state transition #rule storage unit is constituted by a ROM (read only memory) installed in the IC socket operator. Since the identification unit is configured as follows, the state transition rule 1] can be easily changed by simply exchanging the state transition rule μ(j memory unit, for example, 'FICM'i) by determining all the objects to be identified according to the rules of the It is possible to add state transition rules to the speech recognition device according to the purpose.

(へ)実施例 第1図は本発明の実施例で第2図を具体化するためにパ
ターン作成部(3)、パターンマツチング1M1(51
、積重パターン指定部(8)およびゲート(9)をマイ
クロプロセッサと演算回路によりて置き変えて実現した
ものであり、第2霞と同じ機能を持つものには同じ番号
を付1−である。マイクロホン+11で入力された音声
はアンプ8(101,1で増幅され、BPF(バント・
パス・フィルタ)(IIJで周et数帯mに分割され、
ADO(アナログ−デジタル・コンバータ)(121に
よってデジタル化され、マイクログロセパターンを作成
する。音声登録時fi該大入カバターン標準バター・ン
として標準パターン記憶部(4)に特定数格納し、音声
認識時には該入カバターンと前記標準パターン記憶部(
4)に格納されている各標準パター・ンとをマイクログ
0セツサ(131が演算回路α41を用いながら比較し
、その結果は出力部(6)を通して外部に出力される。
(v) Embodiment FIG. 1 shows an example of the present invention, and in order to embody FIG.
, was realized by replacing the stacking pattern specifying section (8) and gate (9) with a microprocessor and arithmetic circuit, and those having the same function as the second haze are given the same number as 1-. . The audio input through microphone +11 is amplified by amplifier 8 (101,1), and then passed through BPF (Bant filter).
pass filter) (divided into et number bands m by IIJ,
It is digitized by an ADO (Analog-Digital Converter) (121) to create a microgrosse pattern. When registering a voice, a specific number of patterns are stored in the standard pattern storage unit (4) as the standard pattern for the large input cover, and the voice During recognition, the input cover pattern and the standard pattern storage section (
The microlog setter (131) compares each standard pattern stored in the microlog setter (4) using the arithmetic circuit α41, and the result is outputted to the outside through the output unit (6).

そのぬ、マイクログ0セツサ(13は状態遷移規則記憶
部(7)に格納されている状B遷移規則を前回の音PJ
fi結果に基づいて参照しながら認識対象語を判断・ノ
る。
On the other hand, the microlog 0 setter (13 is the state B transition rule stored in the state transition rule storage section (7)) is stored in the previous sound PJ.
The target word to be recognized is judged while referring to the fi result.

本発明実施例装置が従来装置と異なる所は状態遷移規則
記憶部(71にある。即ち、状態遷移規則記憶部(7)
は状態遷移規則が記憶されているROM(711とそれ
を装着するためのICソケットσ2から構成されており
、簡単にROMの交換ができる。
The difference between the device according to the embodiment of the present invention and the conventional device is in the state transition rule storage section (71).
consists of a ROM (711) in which state transition rules are stored and an IC socket σ2 for mounting the ROM, and the ROM can be easily replaced.

このように、状態遷移規則記憶部(7)の’ROMケ1
]がプログラム記憶部σ9とはハード的に分離さt1斯
る装置の用途と対応し、こ状態4秘規則テーブルを格納
した他のROMに交換可能であるので、プログラムを修
正する串なく斯る装置の用途を大巾に増大せしめる事が
できる。
In this way, the 'ROM key 1 of the state transition rule storage section (7)
] is hardware-separated from the program storage section σ9, and corresponds to the purpose of the device, and can be replaced with another ROM that stores the 4-secret rule table in this state, so there is no need to modify the program. The uses of the device can be greatly increased.

(ト1 発明の効果 以上の説明で明らかなように、本発明によれば、ホスト
コンピュータを必要とせずかつ簡単な溝造÷状態這移規
則を用いることができ、しかも状態遷移規則を容易に変
更することができるので、認識率が高く多くの用途に対
応できる優れた音声認識装置を提供することができる0
(G1) Effects of the Invention As is clear from the above explanation, according to the present invention, the simple Mizukuri/state transition rule can be used without the need for a host computer, and the state transition rule can be easily created. Since it can be changed, it is possible to provide an excellent speech recognition device that has a high recognition rate and can be used for many applications.

【図面の簡単な説明】[Brief explanation of drawings]

第1印は本発明の音声認、?a装置の一実施例ブロック
図、第2図は状態遷移規則の4体例模式図、第5図は状
態遷移規則を用いた′tIr声m識装置のブロック図で
ある。 +11−・・マイクロフォン、(4)−・標準パターン
記憶部、(7i’・・・状態遷移規則記憶部、(131
・−マイクロプロセッサ、 ■・・・演算部、 ヴト・
・ROM。 びり・・・ソケット
The first mark is the voice recognition of the present invention, ? FIG. 2 is a schematic diagram of a four-body example of state transition rules, and FIG. 5 is a block diagram of a voice recognition device using state transition rules. +11-...Microphone, (4)--Standard pattern storage unit, (7i'...State transition rule storage unit, (131
-Microprocessor, ■...Arithmetic section, Vt.
・ROM. Blink...Socket

Claims (2)

【特許請求の範囲】[Claims] (1)入力された音声から特徴量を抽出する特徴抽出部
と、抽出された特徴をもとに入力された音声を多数の識
別対象の中から識別しその結果に応じて所定の信号を出
力する識別部と、前記識別部の識別結果に応じて遷移す
る識別対象に関する複数の状態の間の遷移規則を記憶す
る状態遷移規則記憶部と、から成り、 前記識別部はこれとは着脱可能な状態で連なった前記状
態遷移規則記憶部の規則に従って識別対象を判定した上
で識別処理を行なう事を特徴とする音声認識装置。
(1) A feature extraction unit that extracts features from input audio, and identifies the input audio from among many recognition targets based on the extracted features, and outputs a predetermined signal according to the result. and a state transition rule storage unit that stores transition rules between a plurality of states regarding an identification target that changes according to the identification result of the identification unit, and the identification unit is detachable from this. A speech recognition device characterized in that a recognition target is determined according to a rule in the state transition rule storage unit that is connected in a series of states, and then a recognition process is performed.
(2)前記状態遷移規則記憶部はICソケット上に着脱
自在に装備されたROM(リード・オンリー・メモリー
)からなる事を特徴とした特許請求の範囲第1項記載の
音声認識装置。
(2) The voice recognition device according to claim 1, wherein the state transition rule storage unit is comprised of a ROM (read-only memory) that is removably installed on an IC socket.
JP60209369A 1985-09-20 1985-09-20 Voice recognition equipment Granted JPS6269298A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60209369A JPS6269298A (en) 1985-09-20 1985-09-20 Voice recognition equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60209369A JPS6269298A (en) 1985-09-20 1985-09-20 Voice recognition equipment

Publications (2)

Publication Number Publication Date
JPS6269298A true JPS6269298A (en) 1987-03-30
JPH0562998B2 JPH0562998B2 (en) 1993-09-09

Family

ID=16571791

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60209369A Granted JPS6269298A (en) 1985-09-20 1985-09-20 Voice recognition equipment

Country Status (1)

Country Link
JP (1) JPS6269298A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62234198A (en) * 1986-04-04 1987-10-14 シチズン時計株式会社 Voice recognition equipment
JPH01142798A (en) * 1987-11-30 1989-06-05 Toshiba Corp Voice recognition equipment
JPH01260493A (en) * 1988-04-12 1989-10-17 Matsushita Electric Ind Co Ltd Voice recognizing method
JP2004005481A (en) * 2002-03-15 2004-01-08 Samsung Electronics Co Ltd Method and device for controlling electric appliance connected to home network

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62234198A (en) * 1986-04-04 1987-10-14 シチズン時計株式会社 Voice recognition equipment
JPH01142798A (en) * 1987-11-30 1989-06-05 Toshiba Corp Voice recognition equipment
JPH01260493A (en) * 1988-04-12 1989-10-17 Matsushita Electric Ind Co Ltd Voice recognizing method
JP2004005481A (en) * 2002-03-15 2004-01-08 Samsung Electronics Co Ltd Method and device for controlling electric appliance connected to home network

Also Published As

Publication number Publication date
JPH0562998B2 (en) 1993-09-09

Similar Documents

Publication Publication Date Title
JP3015377B2 (en) IC card
KR900003751A (en) Portable Electronic Device
US4141268A (en) Keyboard apparatus for an electronic musical instrument
US4815032A (en) Portable electronic memorandum device with password accessible memory
GB2110856A (en) Range recognizer
KR880010374A (en) Portable electronics
JP2003114864A5 (en)
KR970059943A (en) Communication
KR960038583A (en) Output control device
JPS6269298A (en) Voice recognition equipment
CA1232382A (en) Input device of character data
JPS58181108A (en) Numerical control system
US4761750A (en) Electronic calculator with a program calculation function
SU962902A1 (en) Information input device
JP2974144B2 (en) Portable electronic devices
JP3209994B2 (en) Portable electronic devices
JPS6368990A (en) Method for discriminating ic card
JPS62187399A (en) Reference pattern generation circuit
JPS6175395A (en) Reference pattern input system
JPH04195513A (en) Keyboard
SU822186A1 (en) Microprogramme control device
JPS5816681B2 (en) Top digit holding device
JPS63116199A (en) Voice dictionary storing system for voice input/output unit
JPS63186318A (en) Function selecting device for electronic apparatus
JPS62257555A (en) Ic card

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees