JPS59133599A - Voice recognition equipment - Google Patents

Voice recognition equipment

Info

Publication number
JPS59133599A
JPS59133599A JP58008214A JP821483A JPS59133599A JP S59133599 A JPS59133599 A JP S59133599A JP 58008214 A JP58008214 A JP 58008214A JP 821483 A JP821483 A JP 821483A JP S59133599 A JPS59133599 A JP S59133599A
Authority
JP
Japan
Prior art keywords
voice
pattern
registered
speech
voice pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58008214A
Other languages
Japanese (ja)
Other versions
JPH041915B2 (en
Inventor
正典 宮武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Sanyo Denki Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Sanyo Denki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd, Sanyo Denki Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP58008214A priority Critical patent/JPS59133599A/en
Publication of JPS59133599A publication Critical patent/JPS59133599A/en
Publication of JPH041915B2 publication Critical patent/JPH041915B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 (イ)産業上の利用分野 本発明は音声を認識する音声認識装置に関する。[Detailed description of the invention] (b) Industrial application field The present invention relates to a speech recognition device that recognizes speech.

1口)従来技術 第1図に従来の音声認識装置の構成を示す。同図に於い
て、+13は音声を電気的な音声信号に変換するマイク
ロフォン、(2)は該マイクロフォン(1)にて得られ
る音声信号から音声の特徴を示す音声パターンを抽出す
る音声パターン抽出回路、(3)は該音声パターン抽出
回路(21にて得られる音声を貯える入力音声パターン
メモリ、(4)は認識すべきit音声の音声パターンを
番号付けして予じめ貯えて旧く登録音声パターンメモリ
である。(5)はパターン認識を行なう認識処理部であ
り、上記入力音声パターンメモ1ハ3)の音声パターン
と上記登録音声パターンメモ1月4)の各音声パターン
とを夫々比較し、最も類似の登録パターンメモ1月4)
の音声パターンの番号が出力される。即ち、上記マイク
ロフオン(1)〜認識処理部(5)からなる基本構成に
依ってマイクロフォン(1)に入力された音声の認識処
理が行なわれる。さらに、16)は比較回路、17)は
カクンタ、(8)は表示器、(9)は修正部である。こ
れ等比較回路16)〜修正部+91に依って上記登録音
声パターンメモリ(4)の各音声パターンをより正確な
パターンに修正する為の処理が行なわれる。
1) Prior Art Figure 1 shows the configuration of a conventional speech recognition device. In the figure, +13 is a microphone that converts voice into an electrical voice signal, and (2) is a voice pattern extraction circuit that extracts a voice pattern indicating voice characteristics from the voice signal obtained by the microphone (1). , (3) is an input voice pattern memory that stores the voice obtained in the voice pattern extraction circuit (21), and (4) is an input voice pattern memory that stores the voice patterns of the IT voice to be recognized in numbered form and stores them in advance as previously registered voice patterns. (5) is a recognition processing unit that performs pattern recognition, which compares the voice pattern of the input voice pattern memo 1c3) with each voice pattern of the registered voice pattern memo 4), respectively; Most similar registered pattern memo January 4)
The number of the voice pattern is output. That is, the recognition process of the voice input to the microphone (1) is performed by the basic configuration consisting of the microphone (1) to the recognition processing section (5). Further, 16) is a comparison circuit, 17) is a kakunta, (8) is a display, and (9) is a correction section. The comparison circuit 16) to the correction unit +91 perform processing for correcting each voice pattern in the registered voice pattern memory (4) to a more accurate pattern.

次に上述の如き従来の音声認識装置を用いて地名音声を
認識せしめる場合を例に挙げ、その動作を述べる。
Next, the operation will be described by taking as an example a case where the conventional speech recognition device as described above is used to recognize a place name speech.

先ず登録モードに於いて、話者は、マイクロフォン(1
)に地名音声を順次発声入力せしめる。この時、カクン
タ回路(7)は表示器(8)の数字表示を1″から順次
歩進せしめ、Zの数字表示が1”の時に話者は「トクキ
ヨク」なる音声をマイクロフォン(1)に入力する。こ
の時、パターン抽出回路(2)にて抽出された「トクキ
ヨク」なる音声パターンが入カバターンメモ1月3)に
一時的に貯えられた後、この音声パターンを登録音声パ
ターンメモ1月4]に番号゛1″と対応づけして格納す
る。次に表示器(8)の数字表示が′2#に歩進された
時に話者は「ナゴヤ」なる音声全マイクロフォン(ll
に入力し、−上述の「トクキヨク」の場合と同様に「ナ
ゴヤ」なる音声パターンを登録音声パターンメモ1月4
)に番号”2#と対応つけて格納する。以下同様に、話
者が発声する事に依り、登録音声パターンメモ1月4)
に「キヨクト」、「オオサ々」、「オカヘ′マ」、「ヒ
ロシマ」、「・・カタ」なる音声パターンを、II]@
次#号″3″′、“4″、”5#、II 6I+、パフ
″′と対応づけて格納する。
First, in the registration mode, the speaker uses the microphone (1
) to input place name sounds sequentially. At this time, the kakunta circuit (7) sequentially increments the numerical display on the display (8) from 1", and when the Z numerical display is 1", the speaker inputs the voice "tokukiyoku" into the microphone (1). do. At this time, the voice pattern "Tokukiyoku" extracted by the pattern extraction circuit (2) is temporarily stored in the input cover turn memo (January 3), and then this voice pattern is registered in the voice pattern memo (January 4). is stored in association with the number ``1''.Next, when the number display on the display (8) is incremented to ``2#'', the speaker uses the full voice microphone (ll) called ``Nagoya''.
- Register the voice pattern "Nagoya" as in the case of "Tokukiyoku" mentioned above Voice pattern memo January 4
) is stored in association with the number "2#".In the same way, depending on the speaker's utterance, the registered voice pattern memo is stored (January 4).
II]@
It is stored in association with the next # numbers "3"', "4", "5#, II 6I+, and puff"'.

しかしながら、上述の登録モードの際に、話者が正確な
発音及びアクセントで発音でさるとは限らず、誤”止っ
た音声パターンが登録音声パターンメモ1月4)に格納
される供れがあるので、この誤1つだ音声パターンを修
正する為の修正モードが設けられている。祈る修正モー
ドに於いて、カクンこの数字表示が1″の時に話者は「
トウキヨク」なる音声をマイクロフォン(1)に入力す
る。この時、パターン抽出回路(2)にて抽出された「
トクキヨク」なる音声パターンが入力音声パターツメモ
リ(3)に一時的に貯えられる。ぞしC,認識処理都市
)は入力音声パターンメモ1月31の1トクキヨク」な
る音声パターンを登録音声パターンメモ1月4)の各7
個の音声パターンに基づいてパターン認識する。これに
依って、登録音声パターンメモ1月4)の番号パ1#に
対応づけられた「トクキヨク」なる音声パターンである
と正確に認識された場合には、該認識処理部(5)から
出力される番号”1″と上記カクンタ回路(力のカウン
ト値″1#とが一致する事を比較回路16)が検知し一
致信号Sを出力する。
However, when using the registration mode described above, it is not always possible for the speaker to pronounce the sound with accurate pronunciation and accent, and there is a possibility that erroneously "stopped" speech patterns may be stored in the registered speech pattern memo (January 4). Therefore, a correction mode is provided to correct this erroneous voice pattern.In the prayer correction mode, when the number displayed is 1'', the speaker says ``
The voice "Tokiyoku" is input into the microphone (1). At this time, the pattern extraction circuit (2) extracts "
The voice pattern "Tokukiyoku" is temporarily stored in the input voice pattern memory (3). Zoshi C, recognition processing city) is the input voice pattern memo January 31, 1 special key yoku'' registered voice pattern voice pattern memo January 4) each 7
Pattern recognition based on individual speech patterns. As a result, if it is accurately recognized as the voice pattern "Tokukiyoku" associated with the number Pa1# of the registered voice pattern memo January 4), the recognition processing unit (5) outputs the voice pattern. The comparator circuit 16 detects that the number "1" and the above-mentioned kakunta circuit (force count value "1#" match) and outputs a match signal S.

コノ一致信号Sは上記カクンタ回路(7)のカウント値
を歩進せしめ、表示器(8)の数字表示をQ 271に
変更する。以下同様に表示器(8)の数字表示に従って
、その番号に対応した地名をマイクロフォン(1)に順
次入力せしめる事となるが、例えば、表示器(8)の数
字表示がパ4”であり、「オオサカ」なる音声をマイク
ロフォンtl)に入力した時に、認識処理部(5)がこ
の時の入力音声パターンが登録音声パターンが登録音声
パターンメモ1月4)の番号″5”に対応した1オカヤ
マ」なる音声パターンに最も類似であると判定して番号
II 5 IIを出力した場合、この番号°゛5′″と
上記カクンタ回路(7)のカウント値”4″とを比較す
る比較回路16)は不一致信号Sを出力する。この不一
致信号Sはカクンタ回路1力を歩進せしめる事なく、修
正部+91を動作せしめる。
The concordance signal S increments the count value of the kakunta circuit (7) and changes the numeric display on the display (8) to Q271. Thereafter, in the same way, according to the numerical display on the display (8), place names corresponding to the numbers are inputted into the microphone (1) one after another. When the voice "Osaka" is input into the microphone tl), the recognition processing unit (5) recognizes that the input voice pattern at this time is 1 Okayama corresponding to the number "5" in the registered voice pattern memo January 4). '', and outputs the number II 5 II, the comparison circuit 16) compares this number ゛5''' with the count value ``4'' of the kakunta circuit (7). outputs a discrepancy signal S. This discrepancy signal S operates the correction section +91 without causing the kakunta circuit 1 to step forward.

この時、修正部(9)は入力音声パターンメモリ(3)
に貯えられたこの時の「オオサカ」なる音声パターンと
登録音声パターンメモ1月4)の番号“4″に対応づけ
られた「オオサカ」なる音声パターンとを平均化せしめ
てなる折だな「オオザカ」なる平均化音声パターンを得
て、登録音声パターンメモリ(4)の「オオサカ」なる
音声パターンをこの新たな平均化音声パターンに変更す
る。この時、表示器(8)の数字表示は′4″の1まと
なっており、話者は、再び「オオサカ」なる音声をマイ
クロフォン(1)に入力し、認識処理部(5)が正確に
「オオサカ」なる音声と認識し、番号゛4#を出力する
迄、上述の如き登録音声パターンメモリ(4)の[オオ
サヵ」なる音声パターンの(+5正の為の動作がくり返
し実行される。そしてこの修正が完了した時点で次の登
録f声パターンメモ1月4)の1オカヤマ」なる音声に
ついての上述の如き修正処理に移行し、この処理が最後
の音声「・・カタ」についてまで順次行なわれる。
At this time, the correction section (9) is connected to the input voice pattern memory (3).
The voice pattern ``Osaka'' from this time stored in ``Osaka'' and the voice pattern ``Osaka'' associated with the number ``4'' in the registered voice pattern memo January 4) are averaged. '' is obtained, and the voice pattern "Osaka" in the registered voice pattern memory (4) is changed to this new averaged voice pattern. At this time, the number displayed on the display (8) is '4'', and the speaker again inputs the voice "Osaka" into the microphone (1), and the recognition processing unit (5) accurately The operation for adding (+5) to the voice pattern "Osaka" in the registered voice pattern memory (4) as described above is repeated until the voice is recognized as "Osaka" and the number "4#" is output. When this correction is completed, the process moves on to the above-mentioned correction process for the voice ``Okayama'' in the next registered f voice pattern memo January 4), and this process continues sequentially until the last voice ``...kata''. It is done.

認識モードにpいては、マイクロフォン111に入力さ
れた音声パターンが抽出;2)されて入力音声パターン
メモ順3)に貯えられ、登録音声パターンメモ1月4)
の各音声パターンに基つき、認識処理部(5)にてパタ
ーン認識される。即ち、認識処理部15)が番号°′4
”を出力したとしたら、この時、話者が発声した音声は
「オオサカ」であった事となる。
In the recognition mode, the voice pattern input to the microphone 111 is extracted; 2) and stored in the input voice pattern memo order 3), and registered voice pattern memo January 4)
The recognition processing unit (5) performs pattern recognition based on each voice pattern. That is, the recognition processing unit 15) has the number °'4.
”, the voice uttered by the speaker at this time was “Osaka”.

しかしながら、新様な従来の音声認識装置に庚いては、
登録モード時に例えば「オカヤマ」なる音声の発音並び
にアクセントが不正確であったり、この音声の発声時に
雑音が混入する事に依って、登録音声パターンメモ1月
4)の香り”5′″に対応するこの「オカヤマ」なる音
声パターンがその番号”4″′に対応する「オオサカ」
なる音声パターンに類似したものになってしまう場合が
ある。この場合修正モード時には、対応づけられた番号
順に従がい、先に登録音声パターンメモリ14)の「オ
オサカ」なる音声パターンの16正が行なわれる事とな
るが、この番号u4″に対応する「オオサカ」なる音声
パターンがかなり正確なものであったとしても、話者が
発声した「オオサカ」なるf声パターンがむしろ番号”
5″に対応する不正確な「オカヤマ」なる音声パターン
に類似してしまう事がある。この時には、認識処理部1
5)は番号″5”を出力して、登録音声パターン(4)
の「オオサカ」なる音声パターンを修正する事になるが
、「オオサカ」なる音声パターンを、これに誤まって類
似した「オカヤマ」なる音声パターンと充分区別できる
修正処理は行なえない。従っC1登録音声パターンメモ
1月4)の「オオサカ」なる音声パターンの修正処理が
完了できなくなるばかりか、これ以後の音声パターンの
修正処理もできなくなる欠点かあった。
However, when it comes to new and conventional speech recognition devices,
For example, if the pronunciation and accent of the voice "Okayama" is incorrect in the registration mode, or if noise is mixed in when pronouncing this voice, it may correspond to the scent "5'" of the registered voice pattern memo January 4). This sound pattern of “Okayama” is “Osaka” which corresponds to the number “4″′.
In some cases, the voice pattern becomes similar to that of the other person. In this case, in the correction mode, the corresponding numerical order is followed, and the 16th correction of the voice pattern "Osaka" in the registered voice pattern memory 14) is performed first. Even if the voice pattern of ``Osaka'' is quite accurate, the f-voice pattern of ``Osaka'' uttered by the speaker is more likely to be a number.''
The sound pattern may resemble the inaccurate "okayama" sound pattern that corresponds to 5". At this time, the recognition processing unit 1
5) outputs the number "5" and registers the voice pattern (4)
However, it is not possible to perform a modification process that can sufficiently distinguish the voice pattern ``Osaka'' from the erroneously similar voice pattern ``Okayama.'' Therefore, not only was it impossible to complete the correction process for the voice pattern "Osaka" in the C1 registered voice pattern memo (January 4), but it also became impossible to correct the voice pattern thereafter.

(ハ)発明の目的 本発明は上述の欠点を解消する事を目的とし、登録音声
パターンメモリの音声パターンの修正を確実に実行でき
る音声認識装置を提供するものである。
(C) Object of the Invention The present invention aims to eliminate the above-mentioned drawbacks and provides a speech recognition device that can reliably modify speech patterns in a registered speech pattern memory.

に)発明の構成 本発明の音声認識装置は登録音声パターンメモリの各音
声パターンを修正する為の修正手段と、この修正手段が
修正を行なう登録音声の発声を話者に指示する指示手段
とを設け、修正モードに放いて、上記指示手段に従って
話者が指示した登録した登録音声に変更すると共に、上
記指示手段は修正手段にて変更された新たな登録音声を
話者に指示するものである。
B) Structure of the Invention The speech recognition device of the present invention comprises a modification means for modifying each speech pattern in the registered speech pattern memory, and an instruction means for instructing the speaker to utter the registered speech to be modified by the modification means. The user sets the registered voice to the registered voice specified by the speaker in accordance with the instruction means, and the instruction means instructs the speaker to use the new registered voice changed by the correction means. .

(ホ)実施例 第2図に本発明の音声認識装置の一実施例を示す。同図
に於いて、第1図の従来装置と同一機能をなすものには
第1図と同一図番を付している。
(e) Embodiment FIG. 2 shows an embodiment of the speech recognition device of the present invention. In this figure, parts having the same functions as those of the conventional device shown in FIG. 1 are given the same numbers as in FIG.

尚、+69、(8)及び(9)は、従来装置と同様に比
較回路、表示器、及び修正部を示しているが、後述する
如く、その比較対象、表示対象、及び修正対象が従来装
置と異なる。+10)はカクンタ回路(7)のカウント
値と認識処理部15)の出力番号とを選択出力し、この
出力値を比較回路+(3j、表示器18)、及び修正部
(9)に伝送する選択回路であり、比較回路16)から
の一致信号Sを受けた時には、カクンタ回路(力のカウ
ント値が出力される。また逆に比較口lF1+e’+か
ら不一致信号Sを受けた時には、認識処理部15)から
の出力番号が出力され、この次に比較回路16)から一
致償号S又は不一致信号Sのいずれかの信号を受けた時
点で、この出力値がカタンク回路(7)のカウント値に
復帰される。Uυはカクンタ回路(7)とこのカクンタ
回路(7)の歩進を行なわしめる一致信号S線との接続
の開閉をする開閉回路であり、上記選択回路(1(Iと
同期した開閉動作を行ない、選択回路叫がカクンタ回路
(力のカウント値を出力する時のみ一致信号Sがカタン
ク回路(力に接続される。従って、比較口[165は認
識処理部(5)からの出力番号と、選択回路+1(lか
らの出力値とが一致した時、−問 立回路(llを接続状態とし、これに依って、カウンタ
回路(7)を歩進ぜしめ、不一致信号Sにて修正部(9
)の修正動作を実行せしめ、さらにはこれ等両イ目号S
、Sにて選択回路11O)を選択11作せしめる。また
表示部(8jけ選択回路l(υからのカクンタ回1@ 
171のカウント値或いは認識処理部+51での出力番
号を表示する。さらに修正部+95は上記比較回路+6
5からの不一致信号Sを受けた時、選択回路叫から得ら
れる認識処理部(5)の出力番号に対応する登録音声パ
ターンメモ1月4)の音声パターンの修正を行なう事に
なる。
Note that +69, (8), and (9) indicate a comparison circuit, a display, and a correction unit as in the conventional device, but as will be described later, the comparison target, display target, and correction target are the same as in the conventional device. different from. +10) selectively outputs the count value of the kakunta circuit (7) and the output number of the recognition processing section 15), and transmits this output value to the comparison circuit + (3j, display 18) and the correction section (9). It is a selection circuit, and when it receives a match signal S from the comparator circuit 16), it outputs the count value of the force from the kakunta circuit (force count value).On the other hand, when it receives a mismatch signal S from the comparison port 1F1+e'+, it performs recognition processing. The output number from the circuit 15) is output, and then, at the time when either the coincidence signal S or the disagreement signal S is received from the comparator circuit 16), this output value becomes the count value of the catank circuit (7). will be reinstated. Uυ is an opening/closing circuit that opens and closes the connection between the Kakunta circuit (7) and the coincidence signal S line that causes the Kakunta circuit (7) to step; , the coincidence signal S is connected to the Katank circuit (force) only when the selection circuit outputs the count value of the Kakunta circuit (force).Therefore, the comparison port [165 is the output number from the recognition processing section (5) and the selection When the output value from the circuit +1 (l) matches, the -interrogation circuit (ll) is connected, thereby incrementing the counter circuit (7), and using the mismatch signal S to change the correction unit (9).
), and furthermore, these two
, S causes the selection circuit 11O) to make the selection 11. In addition, the display section (8j selection circuit l (kakunta times 1 from υ)
The count value of 171 or the output number of the recognition processing section +51 is displayed. Furthermore, the correction section +95 is the above comparison circuit +6
When the discrepancy signal S from 5 is received, the voice pattern of the registered voice pattern memo 1/4) corresponding to the output number of the recognition processing section (5) obtained from the selection circuit is corrected.

斯様な構成の本発明の音声認識装置にて地名音声を認識
せしめる際の動作を述べる。尚、登録モード、及び認識
モードは従来装置と同様に動作するものであるので説明
は省略する。
The operation when the speech recognition device of the present invention having such a configuration is used to recognize a place name speech will be described. Note that the registration mode and the recognition mode operate in the same manner as the conventional device, so their explanation will be omitted.

従ッて、登録音声パターンメモリー4)に従来例での説
明と同様に、「トクキヨク」、〜、「ノ・カタ」なる音
声が番号″1”、〜“′7″に対応づけられて格納され
ζいるものとし、以下にイll正モードについて説明す
る。
Therefore, similar to the explanation in the conventional example, the sounds "Tokukiyoku", ~, and "No Kata" are stored in the registered voice pattern memory 4) in association with the numbers "1" and "'7". The positive mode will be explained below.

先ず、初期状聾に於いて、カウンタ回路(力のカクント
IMB” i ”は強制的に選択回路QO)を介して表
示器(6)に入力され、この表示器(8)は番号°゛1
″を表示する。話者はこれに従って、番号u 1 #に
対応つけられた「トクキヨク」なる音声をマイクロフォ
ン(1)に入力すると、この音声パターンはノ櫂ターン
抽出(2)されて入力音声パターンメモ1月3)に一時
的に貯えられ、認識処理都市)でパターン認識される。
First, in the initial state of deafness, input is made to the display (6) via the counter circuit (the power kakunt IMB "i" is forcibly selected by the selection circuit QO), and this display (8) shows the number °゛1.
'' is displayed.The speaker follows this and inputs the voice "tokukiyoku" associated with the number u 1 # into the microphone (1), and this voice pattern is extracted as a nokai turn (2) and becomes the input voice pattern. The memo is temporarily stored in January 3) and pattern recognized in the recognition processing city).

この時、認識処理部(5)が登録音声バクーンメモIハ
4)の番号u I 11に対応つけられた「トクキヨク
」なる音声パターンと正しく判定したなら、番号111
 IIを出力する事になり、比較回路(6)は一致伯り
Sを開成状聾の開閉回路Uυを介してカウンタ回路(力
に入力すると共に選択回路11tllに伝送する。
At this time, if the recognition processing unit (5) correctly determines that the voice pattern is "tokukiyoku" which is associated with the number uI11 of the registered voice Bakun memo Iha4), then the number 111
The comparator circuit (6) inputs the coincidence signal S to the counter circuit (force) via the open/close switch circuit Uυ and transmits it to the selection circuit 11tll.

従って、修正部19)は修正動作を行なわず、選択回路
Ut)は歩進したカウンタ回路(7)のカウント値パ2
′″を選択して表示器18)に表示せしめる。所して比
較回路16)′から不一致イ8号Sが得られる迄、対応
する番号順に表示器(8)の数字表示が順次変更され、
これに従って話者が地名音声をマイクロフォン(1)に
順次入力する。
Therefore, the correction unit 19) does not perform any correction operation, and the selection circuit Ut) increments the count value of the counter circuit (7).
'' is selected and displayed on the display 18).Then, the numerical display on the display 18) is sequentially changed in the order of the corresponding numbers until the discrepancy No. 8 S is obtained from the comparator circuit 16)'.
According to this, the speaker sequentially inputs the place name sounds into the microphone (1).

一方、例えば、表示器(8)の数字表示が”4″′であ
り、これに対応する「オオサカ」なる音声をマイクロフ
ォン(1)に入力した時、認識処理部(5)がこの時の
音声パターンが登録音声パターンメモ1月4)の番号“
5″に対応した何等かの原因で不正確とkつだ[オカヤ
マ]なる音声パターンに最も類似であると判定して番号
″5#を出力した場合、比較回路16)は不一致信ち−
1を出力する。この場合、この不一致信号Sに依って開
閉回路t11)は開成され、カクンタ回b@1.7)は
カウント値II 478を保持した状態となる。一方、
選択回路(llはこの時の認識処理部(5)からの番号
“5″を選択して表示器(8)に表示せしめ、さらには
、修正部(9jは修正動作を行う事になる。即ち、イ6
正部191は選択回路+llからの出力が番号゛5″に
変更される直Afrの番号、即ちカウンタ回路17)が
保持[7ているカウント値°°4#に対応づけられた登
録音声パターンメモリの[オオサカ」なる音声パターン
を、第1図の従来装置の修正部(9)と同様に、平均化
音声パターンに変更した後、この修正部1sJ>は、選
択回路(10)から得られる番号“5”に対応づけられ
た登録音声パターンメモリの1オカヤマ」なる音声パタ
ーンが新たな修正の対象となる。
On the other hand, for example, when the number displayed on the display (8) is "4"' and the corresponding voice "Osaka" is input into the microphone (1), the recognition processing unit (5) Pattern registered voice pattern memo January 4) number “
If the number "5#" is determined to be most similar to the voice pattern "Okayama" which is inaccurate due to some reason corresponding to "5", the comparison circuit 16) will output a mismatch signal.
Outputs 1. In this case, the opening/closing circuit t11) is opened by this discrepancy signal S, and the count value II 478 is maintained at the kakunta cycle b@1.7). on the other hand,
The selection circuit (11) selects the number "5" from the recognition processing section (5) at this time and displays it on the display (8), and the modification section (9j) performs a modification operation. , i6
The main part 191 is the registered voice pattern memory corresponding to the count value °°4# held by the counter circuit 17), which is the number of the direct Afr whose output from the selection circuit +ll is changed to the number "5". After changing the sound pattern "Osaka" into an averaged sound pattern in the same way as the correction unit (9) of the conventional device shown in FIG. The voice pattern "1 OKAYAMA" in the registered voice pattern memory associated with "5" becomes a new target for correction.

所して、話者が表示器(8)の数字表示パ5″′に従っ
て、「オカヤマ」なる音声をマイクロフォン(1)に入
力すると、修正部(9)の動作に依って、登録音声パタ
ーンメモ1月4)の「オカヤマ」なる音声パターンはそ
の平均化パターンに修正されるが、この時、認識処理部
(5)の認識結果としての出力番号は5”となるとは限
らない。即ち、登録音声パターンメモ1月4)の「オカ
ヤマ」なる音声パターンが不正確である為に出力番号は
“5″とはならない場合が多い。従って、比較回路田)
からは、一致信号Sか又は不一致信号Sのいずれかが得
られ、この信号S十Sに依って、開閉回路Uυは閉成す
ると共に選択回路+lQlはカウンタ回路(7)にこれ
まで保持されていたカウント値“4″を再び出力する。
Then, when the speaker inputs the voice "Okayama" into the microphone (1) according to the numerical display pattern 5'' on the display (8), the registered voice pattern memo is created by the operation of the correction unit (9). The voice pattern "Okayama" from January 4) is corrected to the averaged pattern, but at this time, the output number as the recognition result of the recognition processing unit (5) is not necessarily 5". In other words, the registration Because the voice pattern "Okayama" in voice pattern memo January 4) is inaccurate, the output number is often not "5". Therefore, the comparison circuit
Either a match signal S or a mismatch signal S is obtained from the signal S, and depending on this signal S and S, the switching circuit Uυ is closed and the selection circuit +lQl that has been held in the counter circuit (7) is The count value "4" is output again.

これに依って、修正部(9jの修正対象が「オオサカ」
なる音声に復9f&すると共に、表示器(81の数字表
示は5#から“4″に変更され、話者に1−オオサカ」
なる音声を再度マイクロフォン(11に入力する事を指
示する。
Due to this, the correction department (9j's correction target is "Osaka")
9f&, and the display (the number display of 81 was changed from 5# to "4", indicating 1-Osaka to the speaker)
Instructs to input the voice into the microphone (11) again.

所して、「オオサカ」なる音声に対して誤認識の対象と
なる登録音声パターンメモ1月4)の不正確な「オカヤ
マ」なる音声の音声パターンが先に一担修正され、その
後再び「オオサカ」なる音声パターンについての修正処
理が開始される。然るに、この時の修正処理は、登録音
声パターンメモ1月4)の1オカヤマ」なる音声パター
ンが、すでに「オオサカ」なる音声パターンと充分に区
別できる程度に修正されている為に、さらにはこの「オ
オサカ」なる音声パターンも−K(IS正されているの
で、この修正処理が多くとも2回か3回くり返えされれ
ば、「オオサカ」なる音声パターン以外の不正確な音声
パターンの影響がなくなり、「オオサカ」なる音声パタ
ーンの修正を完了する事ができる。
However, the incorrect voice pattern for the voice "Okayama" in the registered voice pattern memo January 4), which was subject to misrecognition for the voice "Osaka", was first corrected, and then again for the voice "Osaka". ” correction processing is started for the voice pattern. However, the modification process at this time is difficult because the voice pattern "1 Okayama" in the registered voice pattern memo January 4) has already been modified to the extent that it can be sufficiently distinguished from the voice pattern "Osaka". The voice pattern "Osaka" has also been corrected by -K (IS), so if this correction process is repeated at most two or three times, the effect of inaccurate voice patterns other than the voice pattern "Osaka" will be disappears, and the modification of the "Osaka" voice pattern can be completed.

従って、比較回路+65からは、一致信号Sが出力され
、次のl“5”の「オカヤマ」なる音声に対する修正処
理に速やかに移行でき、同じくして順次最後の番号”7
”の「ハカタ」なる音声に至るまでの修正処理が順次行
なわれる。
Therefore, the comparison circuit +65 outputs the matching signal S, and it is possible to quickly move on to the correction process for the next l "5" voice "Okayama", and in the same way, the last number "7" can be corrected.
The correction process is performed sequentially until the ``Hakata'' sound is reached.

以上の説明に渋いては、登録音声パターンメモ1月4)
の登録音声パターンを修正する為の修正手段として、平
均化パターンにて登録音声パターンを修正する修正部(
9)を示したが、この登録音声パターンを入力音声パタ
ーンに変更するだけの修正手段としても良い。
If you are reluctant to read the above explanation, please take a look at the registered voice pattern memo (January 4).
As a correction means for correcting the registered voice pattern of , a correction unit (
9) has been shown, but it may also be a modification means that simply changes this registered voice pattern to the input voice pattern.

丑だ、話者に発声すべき音声を指示する為の指示手段と
して、音声に対応づけた#号を表示する表示器(8)を
用いたが、その音声をその1ま表示するものであっても
良いし、音声合成回路を設け、この回路にて音声出力す
る事も可能である。
Unfortunately, as a means of instructing the speaker which voice to utter, I used a display (8) that displays a # symbol associated with the voice, but it does not display the voice at all. Alternatively, it is also possible to provide a voice synthesis circuit and output the voice using this circuit.

(へ)発明の効果 本発明の音声認識装置は、以上の説明から明らかな如く
、登録音声パターンメモリの各音声パターンを修正する
為の修正手段と、この修正手段が修正を行々う登録音声
の発声を話者に指示する指示手段とを設け、修正モード
に放いて、上記指示手段に従って話者が指示した登録音
声を入力した時に他の登録音声と誤認識した場合には、
上記修正手段は修正すべき登録音声の対象を誤認識した
登録音声に変更すると共に、上記指示手段は修正手段に
て変更された新たな登録音声を話者に指示するものであ
るので、先の修正対象である音声パターンが比較的正確
であり、他の音声パターンが何らかの原因で先の音声パ
ターンに誤まって類似していたとしても、この不正確な
他の音声パターンを一担修正した後に、先の音声パター
ンを修正する事ができる。従って、先の音声パターンを
他の音声パターンと充分区別できる程度に正確に修正す
る事が可能となり、祈る修正処理を確実にしかも速やか
に完了する事ができ、この種音声認識装置の操作性の大
巾な向上が望めるばかりか、認識モード時での誤認識の
低減にも寄与する。
(F) Effects of the Invention As is clear from the above description, the speech recognition device of the present invention includes a modification means for modifying each speech pattern in the registered speech pattern memory, and a registered speech that is modified by the modification means. If the user inputs the registered voice instructed by the speaker according to the instruction means by setting it in the correction mode and misrecognizing it as another registered voice,
The correction means changes the target of the registered voice to be corrected to the registered voice that has been misrecognized, and the instruction means instructs the speaker to use the new registered voice changed by the correction means. Even if the speech pattern to be corrected is relatively accurate, and other speech patterns are erroneously similar to the previous speech pattern for some reason, after correcting this other inaccurate speech pattern, , the previous voice pattern can be modified. Therefore, it is possible to correct the previous speech pattern accurately to the extent that it can be sufficiently distinguished from other speech patterns, and the correction process can be completed reliably and quickly, improving the operability of this type of speech recognition device. Not only can this be a significant improvement, but it also contributes to reducing misrecognition in recognition mode.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は従来の音声認識装置の構成図、第2図は本発明
の音声認識装置の一実施例の構成図であす、IIJはマ
イクロフォン、(2)は音声パターン抽出回路、13)
は入力音声パターンメモ1ハ14)は登録音声パターン
メモ1ハ1filは認識処理部、+6++6Jは比較回
路、(力はカクンタ回路、+5)(sjけ表示器、+5
)t9jは修正部、Cl0)は選択回路、Q、])は開
開回路を夫々示している。
Fig. 1 is a block diagram of a conventional speech recognition device, and Fig. 2 is a block diagram of an embodiment of the speech recognition device of the present invention. IIJ is a microphone, (2) is a speech pattern extraction circuit, and 13)
is the input voice pattern memo 1c14) is the registered voice pattern memo 1c1fil is the recognition processing unit, +6++6J is the comparison circuit, (power is the kakunta circuit, +5) (sj ke display, +5
)t9j is a modification section, Cl0) is a selection circuit, and Q, ]) are open/open circuits, respectively.

Claims (1)

【特許請求の範囲】[Claims] 1)音声をマイクロフォンに入力して得られる音声信号
からパターン抽出回路に依って得られる音声パターンを
、登録音声パターンメモリの複数の音声パターンに基づ
いて、認識処理部でパターン認識を行なう音声認識装置
に於いて、上記登録音声パターンメモリの各音声パター
ンを順次修正する為の修正手段と共に、該修正手段が修
正を行なう対象となる登録音声の発声を話者に指示する
指示手段を設は登録音声パターンメモリの音声パターン
を修正するに際して、話者は上記指示手段に依って指示
される登録音声を上記マイクロフォンに入力し、この時
入力した登録音声が上記認識処理部に依って他の登録音
声と誤認識した場合には、上記修正手段は、修正すべき
登録音声の対象を上記認識処理部が誤認識した登録音声
に変更すると共に、上記指示手段は修正手段にて変更さ
れた新たな登録音声を話者に指示する事を特徴とする音
声認識装置。
1) A speech recognition device in which a recognition processing unit performs pattern recognition on a speech pattern obtained by a pattern extraction circuit from a speech signal obtained by inputting speech into a microphone, based on a plurality of speech patterns in a registered speech pattern memory. In addition to a modification means for sequentially modifying each voice pattern in the registered voice pattern memory, an instruction means for instructing a speaker to utter the registered voice to be modified by the modification means is provided. When modifying the voice pattern in the pattern memory, the speaker inputs the registered voice instructed by the instruction means into the microphone, and the registered voice input at this time is distinguished from other registered voices by the recognition processing section. In the case of erroneous recognition, the correction means changes the target of the registered voice to be corrected to the registered voice that has been erroneously recognized by the recognition processing section, and the instruction means changes the target of the registered voice to be corrected to the registered voice that has been erroneously recognized by the recognition processing section, and the instruction means changes the target of the registered voice to be corrected to the registered voice that has been erroneously recognized by the recognition processing section. A speech recognition device characterized by instructing a speaker.
JP58008214A 1983-01-20 1983-01-20 Voice recognition equipment Granted JPS59133599A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58008214A JPS59133599A (en) 1983-01-20 1983-01-20 Voice recognition equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58008214A JPS59133599A (en) 1983-01-20 1983-01-20 Voice recognition equipment

Publications (2)

Publication Number Publication Date
JPS59133599A true JPS59133599A (en) 1984-07-31
JPH041915B2 JPH041915B2 (en) 1992-01-14

Family

ID=11686973

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58008214A Granted JPS59133599A (en) 1983-01-20 1983-01-20 Voice recognition equipment

Country Status (1)

Country Link
JP (1) JPS59133599A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6060696A (en) * 1983-09-13 1985-04-08 富士通株式会社 Additional correction processing system for voice registration pattern
JPS60107192A (en) * 1983-11-16 1985-06-12 Toshiba Corp Pattern recognizing device

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57210400A (en) * 1981-06-19 1982-12-23 Nippon Electric Co Monosyllable voice recognition unit

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57210400A (en) * 1981-06-19 1982-12-23 Nippon Electric Co Monosyllable voice recognition unit

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6060696A (en) * 1983-09-13 1985-04-08 富士通株式会社 Additional correction processing system for voice registration pattern
JPH0331274B2 (en) * 1983-09-13 1991-05-02 Fujitsu Ltd
JPS60107192A (en) * 1983-11-16 1985-06-12 Toshiba Corp Pattern recognizing device

Also Published As

Publication number Publication date
JPH041915B2 (en) 1992-01-14

Similar Documents

Publication Publication Date Title
US4432096A (en) Arrangement for recognizing sounds
US3742143A (en) Limited vocabulary speech recognition circuit for machine and telephone control
JPS58134700A (en) Improvement in continuous voice recognition
JPS58102299A (en) Partial unit voice pattern generator
JPS6147440B2 (en)
JPS58134699A (en) Continuous word string recognition method and apparatus
JPS59133599A (en) Voice recognition equipment
De Mori A descriptive technique for automatic speech recognition
JPS6126677B2 (en)
WO2022236111A1 (en) Real-time accent conversion model
JPS60173595A (en) Conversation responder
JPS645320B2 (en)
JP2656234B2 (en) Conversation voice understanding method
JPH0194398A (en) Generation of voice reference pattern
JPS6120880B2 (en)
JPS5923400A (en) Voice recognition equipment
JPH05300213A (en) Voice dialer
JPH0556519B2 (en)
JPS63229496A (en) Pattern updating system for voice recognition
JPH0197044A (en) Voice dialing device
JPS60169900A (en) Word registration system
JPH06324696A (en) Device and method for speech recognition
JPS58209795A (en) Voice message identification system
JPS58198786A (en) Alarm clock
JPS61231600A (en) Voice recognition equipment