JPH04136900A - Voice recognition processing method for voice input/ output device - Google Patents

Voice recognition processing method for voice input/ output device

Info

Publication number
JPH04136900A
JPH04136900A JP2257282A JP25728290A JPH04136900A JP H04136900 A JPH04136900 A JP H04136900A JP 2257282 A JP2257282 A JP 2257282A JP 25728290 A JP25728290 A JP 25728290A JP H04136900 A JPH04136900 A JP H04136900A
Authority
JP
Japan
Prior art keywords
voice
recognition
speech
input
recognition code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2257282A
Other languages
Japanese (ja)
Inventor
Toru Miyamae
徹 宮前
Waichiro Tsujita
辻田 和一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2257282A priority Critical patent/JPH04136900A/en
Publication of JPH04136900A publication Critical patent/JPH04136900A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To select a recognized word matching an input voice without re- inputting a voice by adding +1 to the contents of a misrecognition frequency memory corresponding to a recognized code number when the recognized number is selected and determined as a 2nd or succeeding candidate. CONSTITUTION:A voice input person confirms that his or her voice is displayed on a display 8 as a 2nd candidate, and then presses a cursor key 9b once. A CPU 1 reads the contents of a register R2 and moves a cursor to below the 2nd candidate. When a confirmation key 9a is depressed after the movement of the cursor to the 2nd candidate is confirmed, +1 is added to the contents of the misrecognition frequency memory M1 corresponding to the recognized code number. When there is no matching word among displayed recognized words, the recognized words are displayed on the display 8 in the decreasing order of frequencies of misrecognition. Consequently, the recognized word matching the input voice can be selected without re-inputting a voice.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声入出力装置に係り、特に音声認識処理方法
に関する。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a voice input/output device, and particularly to a voice recognition processing method.

(従来の技術) 一般に、音声入出力装置は大きく分けて、入力された音
声信号の認識処理を行う音声認識処理手段、認識処理さ
れた結果による出力処理手段、音声認識処理手段及び出
力処理手段を制御する制御処理手段からなる。音声認識
処理手段は入力された音声信号を公知技術である線形予
測符号化分析法等を用いて音声パターン化し、予め標準
音声パターンメモリに登録しておいたN個の標準音声パ
ターンと公知技術であるダイナミ・クジログラミング法
等を用いてマツチングを行い、類似度の高い標準音声・
母ターンに対応する認識コード番号を選択する。制御処
理手段は選択された認識コード番号に基づいて出力処理
手段、例えばワードグロセッサ、音声プリンタ、音声合
成翻訳装置、ガイダンス、電気機器の制御等にデータ、
制御信号を出力する。出力処理手段は入力したデータ、
制御信号に基づいて文字を表示したり、印字したり、音
声を出したり、工作機械を動かしたり、電気をつけたり
する。
(Prior Art) In general, a voice input/output device can be roughly divided into a voice recognition processing means for recognizing an input voice signal, an output processing means for outputting the result of the recognition process, a voice recognition processing means, and an output processing means. It consists of a control processing means for controlling. The speech recognition processing means converts the input speech signal into a speech pattern using a known technique such as linear predictive coding analysis method, and converts the input speech signal into a speech pattern using a known technique and N standard speech patterns registered in a standard speech pattern memory in advance. Matching is performed using a certain dynamic whale programming method, etc., and standard speech and speech with a high degree of similarity are
Select the recognition code number corresponding to the mother turn. The control processing means transmits data to an output processing means, such as a word processor, a speech printer, a speech synthesis translation device, guidance, control of electrical equipment, etc., based on the selected recognition code number.
Outputs a control signal. The output processing means input data,
Displaying characters, printing, producing sounds, operating machine tools, and turning on electricity based on control signals.

ところで、音声は不安定要素を含むので、音声認識処理
手段は常に入力された音声信号に対して正しい認識コー
ド番号を選択するとは限らず、誤った認識コード番号を
選択することがある。そのために選択された認識コード
番号が正しいか否かを音声入力者がチエツクしなければ
ならない。チエツクする方法としては入力した音声信号
に対して類似度の高い順にn (n(N )個の認識コ
ード番号を選択させ、それらの認識コード番号に対応す
る認識単語を表示手段に表示させ、音声入力者に決定さ
せていた。
By the way, since speech includes unstable elements, the speech recognition processing means does not always select the correct recognition code number for the input speech signal, and may select an incorrect recognition code number. Therefore, the voice input person must check whether the selected recognition code number is correct. The checking method is to select n (N) recognition code numbers in descending order of similarity to the input audio signal, display the recognition words corresponding to these recognition code numbers on the display means, and then It was left to the person who entered the information to decide.

(発明が解決しようとする課題) 従来の音声入出力装置の音声認識処理方法にあっては、
入力した音声に対する認識単語が類似度の高い順に選択
されたn個の認識単語の中に候補として選択されない場
合は、再び音声入力を行ない、候補として選択されるま
で繰返さなければならず、音声入力者にとって使用しづ
らいという問題点があった。
(Problems to be Solved by the Invention) In the conventional speech recognition processing method for a speech input/output device,
If the recognition word for the input voice is not selected as a candidate among the n recognition words selected in order of similarity, the voice input must be performed again and the process must be repeated until it is selected as a candidate. The problem was that it was difficult for people to use it.

本発明は音声認識処理された結果、入力した音声に対す
る認識単語がn個の認識単語の候補の中に選択されない
とき、音声を再入力せずとも入力した音声に合致する認
識単語を選択できる音声入出力装置の音声認識処理方法
を提供することを目的とする。
The present invention provides a voice that allows you to select a recognized word that matches the inputted voice without re-inputting the voice when the recognized word for the inputted voice is not selected among the n recognition word candidates as a result of voice recognition processing. The purpose of this invention is to provide a voice recognition processing method for an input/output device.

(課題を解決するための手段) 上記目的を達成するために、本発明の音声入出力装置の
音声認識処理方法においては、N個の標準音声パターン
に付与してある認識コード番号に対応させて誤認識回数
メモリを設け、入力した音声信号に対応する標準音声パ
ターンの認識コード番号がn個の中の第1候補に決定さ
れないで、残りの第2候補以降に選択されて決定された
とき、又は選択されたn個の認識コード番号を除く(N
−n)個の認識コード番号の中から誤認識回数の多い順
に認識コード番号が候補として選択されて決定されたと
きは、入力した音声信号に対応する誤認識回数メモリの
内容に+1加算するようにしたものである。
(Means for Solving the Problems) In order to achieve the above object, in the speech recognition processing method for a speech input/output device of the present invention, N standard speech patterns are made to correspond to recognition code numbers assigned to them. A memory for the number of times of recognition errors is provided, and when the recognition code number of the standard voice pattern corresponding to the input voice signal is not determined as the first candidate among n, but is selected and determined as the remaining second and subsequent candidates, Or exclude selected n recognition code numbers (N
-n) When recognition code numbers are selected and determined as candidates in order of the number of misrecognitions from among the recognition code numbers, +1 is added to the content of the number of misrecognitions memory corresponding to the input audio signal. This is what I did.

(作 用) 上記のように構成された音声入出力装置の音声認識処理
方法においては入力した音声が音声バタン化され、N個
の標準音声パターンと順々に比較されると、類似度の高
い順にn個の標準音声パターンに対応する認識コード番
号が候補として選択される。そして表示手段にn個の認
識単語が表示される。音声入力者は表示されたn個の認
識単語を見て、入力した音声と合致する認識単語が第2
候補以下にあるときは、選択処理を行って決定する。選
択及び決定により、入力した音声の認識コード番号に対
応する誤認識回数メモリの内容に+1を加算する。又、
表示されたn個の認識単語の中に合致するものがないと
きは、すでに候補として選択されたn個認識単語を除く
、(N−n)個認識単語の中から誤認識回数の多い順に
認識単語が候補として選択され、表示される。選択及び
決定により、入力した音声の認識コード番号に対する誤
認識回数メモリの内容に+1を加算する。
(Function) In the speech recognition processing method of the speech input/output device configured as described above, the input speech is converted into a speech pattern, and when it is sequentially compared with N standard speech patterns, Recognition code numbers corresponding to n standard voice patterns are sequentially selected as candidates. Then, n recognized words are displayed on the display means. The voice inputter looks at the displayed n recognition words and selects the second recognition word that matches the input voice.
If it is below the candidates, a selection process is performed to determine it. Upon selection and decision, +1 is added to the contents of the erroneous recognition count memory corresponding to the input voice recognition code number. or,
If there is no match among the n recognized words displayed, recognition is performed in order of the number of misrecognitions from among the (N-n) recognized words, excluding the n recognized words already selected as candidates. Words are selected and displayed as candidates. By selection and decision, +1 is added to the contents of the erroneous recognition count memory for the recognition code number of the input voice.

従って、入力した音声に対する認識単語がn個の認識単
語の中に選択されないとき、音声を再入力せずとも、入
力した音声に合致する認識単語を選択できるのである。
Therefore, when the recognition word corresponding to the input speech is not selected from among the n recognition words, the recognition word matching the input speech can be selected without re-inputting the speech.

(実施例) 本発明の一実施例について図面を参照しながら説明する
。なお、各図面に共通な要素には同一符号を付す。
(Example) An example of the present invention will be described with reference to the drawings. Note that elements common to each drawing are given the same reference numerals.

第1図は本発明の一実施例の構成ブロック図である。中
央処理装置1(以後CPU 1と記す)にはメインメモ
リ2(以後メモリ2と記す)、誤認識回数処理手段3が
それぞれパスライン12.13で接続してある。又、C
PU 1には音声認識用LSI6、標準音声A’ターン
メモリ7、デイスプレィ8、操作部9、音声合成処理部
10、音声合成データメモリ11がパスライン14で接
続してある。誤認識回数処理手段3はMlからMNN1
6、個。誤認識回数メモリと加算器4とからなり、各誤
認識回数メモリと加算器4との間をパスライン15で接
続してある。又、各誤認識回数メモリと加算器4とはC
PU 1と前述したパスライン13で接続してある。音
声認識用LSI6とマイクロフォン5とはライン16で
接続してある。メモリ2には音声入出力装置を制御する
制御プログラムと(1〜N)個の認識コード番号に対応
させたN個の認識単語の表示データとを記憶しておく。
FIG. 1 is a block diagram of an embodiment of the present invention. A main memory 2 (hereinafter referred to as memory 2) and a false recognition number processing means 3 are connected to the central processing unit 1 (hereinafter referred to as CPU 1) through path lines 12 and 13, respectively. Also, C
A speech recognition LSI 6, a standard speech A' turn memory 7, a display 8, an operation section 9, a speech synthesis processing section 10, and a speech synthesis data memory 11 are connected to the PU 1 via a pass line 14. The misrecognition number processing means 3 processes M1 to MNN1.
6, pieces. It consists of a memory for the number of misrecognitions and an adder 4, and each memory for the number of misrecognitions and the adder 4 are connected by a path line 15. Also, each misrecognition number memory and adder 4 are C
It is connected to PU 1 by the aforementioned pass line 13. The voice recognition LSI 6 and the microphone 5 are connected by a line 16. The memory 2 stores a control program for controlling the voice input/output device and display data of N recognized words corresponding to (1 to N) recognition code numbers.

例えば、1単語当り16バイト使用し、64単語の表示
データを記憶するとすれば、 16X64=1024バイト−1kB のデータ記憶エリアを割り当てる。そしてそのデータ記
憶エリアに認識コード番号1〜64に対応させて、認識
単語“コーヒー  ′°コーチャ観コココア 6コーラ
”ビール” “ウィスキー”の表示データを記憶する。誤認識回数メ
モリMl−M64は認識コード番号1〜64に一定の数
値Xを加えたアドレスを付与する。よって、例えば誤認
識回数メモリM1はアドレスが” X + 1 ”で認
識単語゛°ココーー”の誤認識回数を記憶する。標章音
声・母ターンメモリ7には音声入力者の音声で64個の
認識単語を標準音声パターンとして記憶しておく。認識
単語を入力する順序ハ“コーヒー  ″コーチャ  “
ココア”軸コーラ”     I′ビール” IIウィ
スキーの順で入力する。このときCPU Iは標準音声
・やターンに対して順に認識コード番号を付与しながら
標準音声パターンメモリ7に登録していく。音声合成デ
ータメモリ11には認識コード番号に対応して、例えば
英会話文の音声合成データが記憶しておく。操作部9に
は確認キー9aとカーソルキー9bとがある。
For example, if 16 bytes are used per word and 64 words of display data are to be stored, a data storage area of 16×64=1024 bytes−1 kB is allocated. Then, the display data of the recognized words "Coffee '° Kocha Kan Coco Coa 6 Cola" Beer "Whisky" is stored in the data storage area in association with the recognition code numbers 1 to 64. An address is given by adding a fixed value X to the code numbers 1 to 64. Therefore, for example, the misrecognition number memory M1 stores the number of misrecognitions of the recognized word "°Koko" at the address "X+1". The mark voice/main turn memory 7 stores 64 recognized words in the voice of a voice input person as a standard voice pattern. The order of entering recognition words is “coffee” kocha “
The inputs are in the following order: Cocoa, "Axis Cola,"I' Beer, and II Whiskey. At this time, the CPU I assigns recognition code numbers to the standard voices and turns in order and registers them in the standard voice pattern memory 7.Voice The synthesis data memory 11 stores, for example, speech synthesis data of an English conversation sentence in correspondence with the recognition code number.The operation unit 9 has a confirmation key 9a and a cursor key 9b.

次に動作について第2図をも加えて説明する。Next, the operation will be explained with reference to FIG. 2.

第2図は一実施例の動作フローチャートである。FIG. 2 is an operational flowchart of one embodiment.

今、音声入力者は外国のカフェでコーヒーをウェイター
に注文するため、ステップSlで゛コーヒ”とマイクロ
フォン5から音声入力する。ステップS2で音声認識処
理が行なわれる。音声認識用LSI6は”コーヒー”の
音声信号を音声パターン化し、標準音声パターンメモリ
7に記憶してある64個の標準音声パターンと順々に比
較して類似度の高い順にn個、例えば3個の認識単語゛
コーヒー  “コーラ” °゛コーチヤに対する認識コ
ード番号゛1”、°゛4″、“2#を選択する。ステッ
プS3でデイスプレィ8に認識単語゛コーヒー”コーラ
”コーチャ”を表示する。即ち、CPU 1は選択され
た認識コード番号のうち最も類似度の高い認識コード番
号を音声認識用LSI 6から読み出し、メモリ2に記
憶してある認識コード番号1〜64と比較して、一致し
た認識単語の表示データ“コーヒー”を第1候補として
デイスプレィ8に表示する。同様にしてパコーラ”コー
チャ”を第2候補、第3侯補として表示する。
Now, in order to order coffee from a waiter at a cafe in a foreign country, the voice input user inputs "coffee" through the microphone 5 in step Sl.Speech recognition processing is performed in step S2.The voice recognition LSI 6 inputs "coffee". The speech signal is converted into a speech pattern, and compared with the 64 standard speech patterns stored in the standard speech pattern memory 7, n words, for example, 3 recognized words "coffee" and "cola" are selected in descending order of similarity. Select the recognition code numbers "1", "4", and "2#" for the "cochia". In step S3, the recognition words "coffee", "cola", and "cocha" are displayed on the display 8. That is, the CPU 1 reads out the recognition code number with the highest similarity among the selected recognition code numbers from the voice recognition LSI 6, and stores it in the memory. The recognition code numbers 1 to 64 stored in 2 are compared, and the display data of the matching recognition word "coffee" is displayed on the display 8 as the first candidate.Similarly, pakola "kocha" is displayed as the second candidate. Displayed as the 3rd Marquis.

このときCPU Jは各候補の認識コード番号″1′″
”4″、“2”を所定のアドレスに記憶しておく。又、
表示された各認識単語の先頭の文字の下の位置データを
カーソル表示位置としてCPU l内のレジスタR1+
 R2+ R3に記憶しておく。即ち、第1候補の“コ
ーヒー”のコの字の下のカーソル表示位置データをレジ
スタR1に記憶し、゛コーラ″“コーチャ”の各コの字
の下のカーソル表示位置データをレジスタR2+ R3
に記憶する。又、カーソルの位置データをレジスタR4
に記憶する。
At this time, CPU J receives the recognition code number "1'" of each candidate.
"4" and "2" are stored at predetermined addresses. or,
The position data under the first character of each recognized word displayed is set as the cursor display position and is stored in register R1+ in CPU l.
Store it in R2+R3. That is, the cursor display position data under the U-shape of the first candidate "coffee" is stored in register R1, and the cursor display position data under each U-shape of "Cola" and "Kocha" is stored in registers R2+R3.
to be memorized. Also, the cursor position data is stored in register R4.
to be memorized.

ステップS4で音声入力者は発声した音声“コーヒー″
が第1候補としてデイスプレィ8に表示すれたことを確
認し、ステップS5で操作部9の確認キー9aを押す。
In step S4, the voice inputter utters the voice "coffee".
is displayed on the display 8 as the first candidate, and presses the confirmation key 9a of the operation section 9 in step S5.

CPU JはレジスタR4とレジスタR1との内容を比
較して、一致することから第1候補が選択されたことを
検知して、メモリ2の所定のアドレスに記憶してある第
1候補の認識コード番号゛′1′を音声合成処理部1o
に出力する。
CPU J compares the contents of register R4 and register R1, detects that the first candidate has been selected since they match, and reads the recognition code of the first candidate stored at a predetermined address in memory 2. The number ``'1'' is sent to the speech synthesis processing unit 1o.
Output to.

ここでメモリ2の所定のアドレスとレジスタR1゜R2
+ R3+ R4との関係を述べると、レジスタR4の
内容とレジスタR,,R2、R3の内容とヲ順々に比較
して、レジスタR4の内容がレジスタR1+ R2+ 
R3のそれぞれの内容と一致したとき、メモリ2の所定
のアドレスから第1候補、第2候補、第3候補の認識コ
ード番号が読み出される。ステップS6+87で音声合
成処理部1゜は入力した認識コード番号′°1”に対す
る音声合成データを音声合成データメモリ11から読み
出して音声合成し、例えば” A cup of co
ffee pleaseとスぎ一力等から出力する。と
ころで、ステップS2の音声認識処理で入力音声゛コー
ヒー″に対して、類似度の高い順に°゛コーラ″″コー
ヒー°°コーチヤ′認識コード番号”4” 、 ”1”
 、 ”2”が選択されたとすると、ステップS3でデ
イスプレィ8には第1候補、第2候補、第3候補として
“コーラ”コーヒー  ” コ−チャ”f 表示する。
Here, the predetermined address of memory 2 and register R1゜R2
+ To describe the relationship between R3+ and R4, the contents of register R4 are compared with the contents of registers R, R2, and R3 in order, and the contents of register R4 are compared to registers R1+ R2+
When the respective contents of R3 match, the recognition code numbers of the first candidate, second candidate, and third candidate are read from a predetermined address in the memory 2. In step S6+87, the speech synthesis processing unit 1° reads out the speech synthesis data for the input recognition code number '°1' from the speech synthesis data memory 11 and synthesizes the speech, for example, "A cup of co".
Output ffee please from Sugi Ichiriki, etc. By the way, in the speech recognition process of step S2, for the input voice "coffee", the recognition code numbers "4", "1" are given in descending order of similarity.
, "2" is selected, the display 8 displays "cola", "coffee", and "cocha"f as the first, second, and third candidates in step S3.

ステップS4で音声入力者は発声した音声゛コーヒー”
が第2候補としてデイスプレィ8に表示されたことを確
認し、ステップS8で操作部のカーソルキー9bを1回
押す。CPU 11dレノスタR2の内容を読み出し、
レジスタR4に移動するとともにカーソルを第2候補で
ある“コーヒーのコの字の下に移動する。ステップS9
で音声入力者はカーソルが第2候補に移ったことを確認
し、ステップSIOで確認キー9aを押す。ステップS
1、でCPU 1は誤認識回数処理を行う。即ち、CP
U 1はレジスタR4の内容とレジスタR2との内容が
一致することからメモリ2の所定のレジスタから認識コ
ード番号′”1″を読み出し、一定の数値“′X″を加
えてアドレスとする。そしてアドレス°’X+1 ”番
地に対応する誤認識回数メモIJM1の内容を加算器4
に読み出し、+1を加算して再び誤認識回数メモ’JM
+に書き込む。最後に認識コード番号パ1″′を音声合
成処理部10に出力する。以下ステップS6 、S7を
経て終了する。入力音声が第3候補として音声認識処理
された場合は、上述したステップ内容にステップS1□
、S13が追加される。
In step S4, the voice inputter utters the voice "coffee".
is displayed on the display 8 as the second candidate, and in step S8, the cursor key 9b of the operation section is pressed once. Read the contents of CPU 11d Renostar R2,
Move to register R4 and move the cursor under the second candidate "coffee". Step S9
The voice input user confirms that the cursor has moved to the second candidate and presses the confirmation key 9a in step SIO. Step S
1, the CPU 1 processes the number of misrecognitions. That is, C.P.
Since the contents of register R4 and register R2 match, U1 reads the recognition code number ``1'' from a predetermined register in the memory 2, and adds a certain value ``X'' to the address. Then, adder 4 adds the contents of erroneous recognition count memo IJM1 corresponding to address °'X+1''.
, add +1 and record the number of misrecognitions again.
Write in +. Finally, the recognition code number Pa1''' is output to the speech synthesis processing section 10.The process is then completed through steps S6 and S7.When the input speech is subjected to speech recognition processing as the third candidate, the above-mentioned step contents are repeated. S1□
, S13 are added.

ところで、入力音声パコーヒー″に対する音声認識処理
の結果、ステップS4で候補として“コーラ″″コーチ
ャ  “ココア”の順テティスプレイ8に表示された場
合はカーソルキー9bを3回押す。CPU 1は1回目
のカーソルキー9bの押下でステップS8 、S9を終
り、2回目の押下でステップS12 r staを経て
、3回目の押下でステップSI5に移る。ステップSI
5で認識単語°′コーラ”゛コーチャ  “ココア″を
除いた認識単語の中で最も誤認識回数の多い順に認識単
語をデイスプレィ8に表示する。即ち、誤認識回数メモ
リの内容を読み出し、レジスタR1を用いて誤認識回数
値の大きい順にソーティングを行い、メモリ2のデータ
エリアに記憶する。そしてさらに同じ誤認識回数値は比
較処理を用いて除去して、メモリ2のデータエリアに誤
認識回数値配列を作る。
By the way, as a result of the speech recognition process for the input voice "Pacoffee", if "Cola""Cocoa" are displayed as candidates in the order text play 8 in step S4, the cursor key 9b is pressed three times. The CPU 1 completes steps S8 and S9 when the cursor key 9b is pressed for the first time, passes through step S12 r sta when the cursor key 9b is pressed for the second time, and proceeds to step SI5 when the cursor key is pressed for the third time. Step SI
In step 5, the recognized words are displayed on the display 8 in the order of the number of misrecognitions that is the highest among the recognized words excluding the recognized word °'cola""cocoa". That is, the contents of the memory for the number of misrecognitions are read out and Sorting is performed in descending order of the number of misrecognitions using Create an array.

次に最も大きい誤認識回数値をレジスタR1に転送し、
誤認識回数メモIJM1〜M64の内容と比較する。こ
のときレジスタR2をカウンタとして使用し、初期値“
0″を格納しておく。そして比較処理を行う毎に+1加
算していく。このカウンタ値が認識コード番号に対応す
る。この比較処理でレジスタR1の内容と、誤認識回数
メモIJ Ml−M64の内容とが一致したときの認識
コード番号を求める。求めた認識コード番号とメモリ2
の所定のアドレスに記憶してある”コーラ″゛コーチャ
゛ココア”の認識コード番号”4” 、 ”2” 、 
”3”と比較して一致するものを除いた認識コード番号
をメモリ2のデータエリアに記憶しておく。同様に誤認
識回数値配列から次に大きい誤認識回数値をレジスタR
1に転送し、その誤認識回数値に対応する認識コード番
号を求める。求めた認識コード番号とメモリ2の所定の
アドレスに記憶してある認識コード番号パ4”、°“2
 II 、 II3′Iと比較して一致するものを除き
、残った認識コード番号をメモリ2に転送して最も大き
い誤認識回数値に対応する認識コード番号に続けて記憶
する。以下同様にしてメモリ2に誤認識回数値配列に対
応する認識コード番号配列を作る。CPU 1は認識コ
ード番号配列の最も配列番号の若い認識コード番号に対
応する認識単語の表示データをメモリ2から読み出して
デイスプレィ8に表示する。ステップS16で正解であ
れば、ステップSIOに移る。父、ステップS16で正
解でなければ、ステップS14に戻る。ステップS14
でカーソルキー9bを押すと、ステップ815でCPU
1は認識コード番号配列から次に配列番号の若い認識コ
ード番号に対応する認識単語の表示データをメモリ2か
ら読み出してディスプレイ8に表示する。以下上述した
ステップを経て終了する。
Next, transfer the largest misrecognition count value to register R1,
Compare with the contents of the erroneous recognition count memos IJM1 to IJM64. At this time, register R2 is used as a counter, and the initial value "
0" is stored. Then, +1 is added each time a comparison process is performed. This counter value corresponds to the recognition code number. In this comparison process, the contents of register R1 and the number of misrecognitions memo IJ Ml-M64 are stored. Find the recognition code number when the contents match.The found recognition code number and memory 2
The recognition code numbers "4", "2",
The recognition code numbers are compared with "3" and the recognition code numbers excluding those that match are stored in the data area of the memory 2. Similarly, from the misrecognition number array, set the next largest misrecognition number value to register R.
1, and obtain the recognition code number corresponding to the number of misrecognitions. The obtained recognition code number and the recognition code number stored at a predetermined address in memory 2 are
II and II3'I, excluding those that match, the remaining recognition code numbers are transferred to the memory 2 and stored following the recognition code number corresponding to the largest number of misrecognitions. Thereafter, in the same manner, a recognition code number array corresponding to the erroneous recognition frequency value array is created in the memory 2. The CPU 1 reads the display data of the recognition word corresponding to the recognition code number having the smallest sequence number in the recognition code number array from the memory 2 and displays it on the display 8. If the answer is correct in step S16, the process moves to step SIO. If the answer is not correct in step S16, the process returns to step S14. Step S14
When cursor key 9b is pressed in step 815, the CPU
1 reads the display data of the recognition word corresponding to the recognition code number with the next smallest array number from the recognition code number array from the memory 2 and displays it on the display 8. The process is then completed through the steps described above.

本実施例では音声認識処理後の出力処理手段として音声
合成処理部を設けたが、ワードプロセノザ、音声プリン
タ、電気機器の制御部等を設けてもよい。又、本実施例
では、誤認識回数処理手段として誤認識回数メモリと加
算器とを設けたが、CPUを加算器として使用し、メイ
ンメモリのデータエリアを誤認識回数メモリとして使用
してもよい。
In this embodiment, a speech synthesis processing section is provided as an output processing means after speech recognition processing, but a word processor, a speech printer, a control section for electrical equipment, etc. may also be provided. Further, in this embodiment, a memory for the number of false recognitions and an adder are provided as the means for processing the number of false recognitions, but the CPU may be used as the adder and the data area of the main memory may be used as the memory for the number of false recognitions. .

(発明の効果) 本発明は以上説明したように構成されているので、以下
に記載される効果を奏する。
(Effects of the Invention) Since the present invention is configured as described above, it produces the effects described below.

N個の標準音声パターンに付与してある認識コード番号
に対応させて誤認識回数メモリを設け、入力した音声信
号に対応する標準音声パターンの認識コード番号がn個
の中の第1侯補に決定されないで、残りの第2候補以降
に選択されて決定されたとき、又は選択されたn個の認
識コード番号を除((N=n)個の認識コード番号の中
から誤認識回数の多い順に認識コード番号が候補として
選定されて決定されたときは、入力した音声信号に対応
する誤認識回数メモリの内容に+1加算するようにした
ので、入力した音声に対する認識単語がn個の認識単語
の中に選択されないとき、音声を再入力せずとも、入力
した音声に合致する認識単語を選択できる。
A memory for the number of incorrect recognitions is provided in correspondence with the recognition code numbers assigned to N standard voice patterns, and the recognition code number of the standard voice pattern corresponding to the input voice signal is the first candidate among the n pieces. When the recognition code number is not determined and is selected and determined after the remaining second candidate, or when the selected n recognition code numbers are excluded ((N=n) recognition code numbers have the highest number of misrecognitions) When recognition code numbers are sequentially selected and determined as candidates, +1 is added to the contents of the incorrect recognition count memory corresponding to the input audio signal, so that the number of recognition words for the input audio is n recognition words. If it is not selected in the list, you can select a recognized word that matches the input voice without having to re-enter the voice.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例の構成ブロック図、第2図は
一実施例の動作フローチャートである。 1・・・CPU、2・・・メモリ、3・・・誤認識回数
処理手段、4・・・加算器、6・・・音声認識用LSI
、7・・・標準音声パターンメモリ、8・・・デイスプ
レィ、9・・操作部、9a・・・確認キー 9b・・・
カーソルキー、 10・・・音声合成処理部、1ノ・・
・音声合成データメモリ。
FIG. 1 is a block diagram of the configuration of an embodiment of the present invention, and FIG. 2 is an operational flowchart of the embodiment. DESCRIPTION OF SYMBOLS 1... CPU, 2... Memory, 3... Misrecognition number processing means, 4... Adder, 6... LSI for speech recognition
, 7...Standard audio pattern memory, 8...Display, 9...Operation unit, 9a...Confirmation key 9b...
Cursor key, 10...Speech synthesis processing section, 1no...
・Speech synthesis data memory.

Claims (1)

【特許請求の範囲】  入力した音声信号を音声パターン化し、予め記憶して
おいたN個の標準音声パターンと比較して類似度の高い
順に標準音声パターンに付与してある認識コード番号を
n(n<N)個選択し、そのうち1個に決定する音声入
出力装置の音声認識処理方法において、 上記N個の標準音声パターンに付与してある認識コード
番号に対応させて誤認識回数メモリを設け、上記入力し
た音声信号に対応する標準音声パターンの認識コード番
号が上記n個の中の第1候補に決定されないで残りの第
2候補以降に選択されて決定されたとき、又は選択され
たn個の認識コード番号を除く(N−n)個の認識コー
ド番号の中から誤認識回数の多い順に認識コード番号が
候補として選定されて決定されたときは、上記入力した
音声信号は対応する誤認識回数メモリの内容に+1加算
することを特徴とした音声入出力装置の音声認識処理方
法。
[Claims] The input speech signal is converted into speech patterns, and the recognition code numbers assigned to the standard speech patterns are n( In a voice recognition processing method for a voice input/output device that selects (n<N) standard voice patterns and determines one among them, a memory for the number of false recognitions is provided corresponding to the recognition code numbers assigned to the N standard voice patterns. , when the recognition code number of the standard voice pattern corresponding to the input voice signal is not determined as the first candidate among the above n, but is selected and determined as the remaining second or subsequent candidates, or when the selected n When the recognition code numbers are selected and determined as candidates in order of the number of misrecognitions from among (N-n) recognition code numbers excluding the recognition code numbers, the input audio signal is A speech recognition processing method for a speech input/output device, characterized by adding +1 to the contents of a recognition number memory.
JP2257282A 1990-09-28 1990-09-28 Voice recognition processing method for voice input/ output device Pending JPH04136900A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2257282A JPH04136900A (en) 1990-09-28 1990-09-28 Voice recognition processing method for voice input/ output device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2257282A JPH04136900A (en) 1990-09-28 1990-09-28 Voice recognition processing method for voice input/ output device

Publications (1)

Publication Number Publication Date
JPH04136900A true JPH04136900A (en) 1992-05-11

Family

ID=17304212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2257282A Pending JPH04136900A (en) 1990-09-28 1990-09-28 Voice recognition processing method for voice input/ output device

Country Status (1)

Country Link
JP (1) JPH04136900A (en)

Similar Documents

Publication Publication Date Title
US5794204A (en) Interactive speech recognition combining speaker-independent and speaker-specific word recognition, and having a response-creation capability
US5842168A (en) Cartridge-based, interactive speech recognition device with response-creation capability
US7143033B2 (en) Automatic multi-language phonetic transcribing system
JP3542026B2 (en) Speech recognition system, speech recognition method, and computer-readable recording medium
CN103714048B (en) Method and system for correcting text
EP1619661A2 (en) System and method for spelled text input recognition using speech and non-speech input
JPH0916602A (en) Translation system and its method
JP3825526B2 (en) Voice recognition device
JP2021064110A (en) Voice authentication device, voice authentication system and voice authentication method
JP3911178B2 (en) Speech recognition dictionary creation device and speech recognition dictionary creation method, speech recognition device, portable terminal, speech recognition system, speech recognition dictionary creation program, and program recording medium
JP2820093B2 (en) Monosyllable recognition device
JPH04136900A (en) Voice recognition processing method for voice input/ output device
JP3340163B2 (en) Voice recognition device
Juola Isolated-word confusion metrics and the PGPfone alphabet
Abbott et al. Identifying an aurally distinct phrase set for text entry techniques
JPH09230889A (en) Speech recognition and response device
EP1187431B1 (en) Portable terminal with voice dialing minimizing memory usage
JP2000181490A (en) Method and device for user collation
JPS61175696A (en) Voice recognition responder
JPH0863185A (en) Speech recognition device
JP2002189490A (en) Method of pinyin speech input
JPH05119793A (en) Method and device for speech recognition
US20210407501A1 (en) Phonetic keyboard and system to facilitate communication in english
JP4797307B2 (en) Speech recognition apparatus and speech recognition method
JPS6126133A (en) Voice recognition input device