JPH04181299A - Speech recognition and correction device - Google Patents

Speech recognition and correction device

Info

Publication number
JPH04181299A
JPH04181299A JP2310443A JP31044390A JPH04181299A JP H04181299 A JPH04181299 A JP H04181299A JP 2310443 A JP2310443 A JP 2310443A JP 31044390 A JP31044390 A JP 31044390A JP H04181299 A JPH04181299 A JP H04181299A
Authority
JP
Japan
Prior art keywords
input
speech
misrecognized
speech recognition
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2310443A
Other languages
Japanese (ja)
Inventor
Kikumi Kaburagi
鏑木 喜久美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2310443A priority Critical patent/JPH04181299A/en
Publication of JPH04181299A publication Critical patent/JPH04181299A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To correct a misrecognized part speedily by specifying and correcting the misrecognized part with a voice indication without indicating the misrecognized part by cursor movement. CONSTITUTION:An input speech in sampled as a 8kHz, 12-bit digital signal by the speech input part 21 consisting of a microphone, a high-frequency-band emphasizing filter, and an AD converter as constituent elements of an acoustic analytic part 11. A feature extraction part 22 as a constituent element of the acoustic analytic part 11 performs the frame-by-frame frequency conversion of the speech signal converted into the digital signal in its 16ms section to extract feature parameters in the frequency range, thereby obtaining a sequence of the feature parameters of a voiced document. The feature parameter sequence of the voiced document which is extracted by the feature parameter extraction part 22 is stored in a feature parameter sequence storage circuit 27. The misrecognized part of the speech is reinputted to specify and correct the misrecognized part speedily.

Description

【発明の詳細な説明】 「産業上の利用分野」 単語毎に区切らずに連続して発声した音声を認識する連
続音声認識装置に係わる。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a continuous speech recognition device that recognizes speech that is continuously uttered without dividing each word.

「従来の技術」 従来の音声認識装置について第6図を用いて説明する。"Conventional technology" A conventional speech recognition device will be explained using FIG. 6.

従来の音声認識装置においては、音響分析部1で入力さ
れた音声の成分の分析を行ない、音響分析部1からの出
力に基づいて、文章音声認識部2においそ入力音声の認
識を行ない、その結果を表示部4に表示する。表示され
た結果は操作者によって確認され、認識結果に誤りがな
い場合には、速やかに次音声入力の操作に移行する。し
がし、入力音声が誤って認識されていた場合には、カー
ソル指示部3を操作し認識結果に誤りがあった部分の先
頭部分と同じく誤認識部分の終了部にカーソルを移動さ
せてマークし、誤認識部分の指定を行なっている。従来
の音声認識装置では、操作者がカーソル指示部3を操作
して、音声認識結果に誤りが生じた部分を指示するので
ある。カーソル指示部3の操作によって指定された訂正
箇所を正すため、操作者は再び訂正箇所の音声人力等の
操作を行なうのである。この訂正操作において、いくつ
かの認識結果を表示できるような音声認識装置では、候
補として挙げられているものの中に正しい認識結果があ
れば、そこから選ぶことになる。
In a conventional speech recognition device, an acoustic analysis section 1 analyzes the components of the input speech, and based on the output from the acoustic analysis section 1, a text speech recognition section 2 recognizes the input speech. The results are displayed on the display section 4. The displayed results are checked by the operator, and if there are no errors in the recognition results, the operator immediately moves on to the next voice input operation. However, if the input voice is incorrectly recognized, use the cursor indicator 3 to move the cursor to the beginning of the part where the recognition result was incorrect and to the end of the incorrectly recognized part and mark it. Then, the misrecognized parts are specified. In conventional speech recognition devices, the operator operates the cursor pointing section 3 to indicate the portion where an error has occurred in the speech recognition result. In order to correct the correction point specified by the operation of the cursor instruction section 3, the operator again operates the correction point manually, such as by voice. In this correction operation, in a speech recognition device that can display several recognition results, if there is a correct recognition result among the candidates, the correct recognition result is selected.

「発明が解決しようとする課題」 音声による入力は、キー入力操作をすることなくデータ
入力を行なうことが出来、キー人力装置のキー配置位置
、キー操作方法等を知る必要がなく、誰でもが簡便に使
用できる入力方法である。
``Problem to be solved by the invention'' With voice input, data can be entered without performing key input operations, and there is no need to know the key layout positions or key operation methods on a human-powered device, so anyone can use voice input. This is an easy-to-use input method.

しかし、音声入力方法は、キー操作による人力方法と異
なり、入力データが正確に認識される確率はやや低くな
る傾向がある。そこで、音響学会誌中の文章について、
1文を構成している音素の個数を調べたところ、1文肖
たりの平均音素数は約47音素であった。ここで、音素
認識率が9596以上である音声認識装置を用いても、
1文の千に2〜3音素の認識誤りは避けられないことに
なる。
However, unlike manual methods using key operations, voice input methods tend to have a slightly lower probability of accurately recognizing input data. Therefore, regarding the text in the journal of the Acoustical Society,
When we investigated the number of phonemes that make up one sentence, we found that the average number of phonemes per sentence was approximately 47 phonemes. Here, even if a speech recognition device with a phoneme recognition rate of 9596 or higher is used,
Misrecognition of 2 to 3 phonemes in every 1,000 sentences is unavoidable.

また、音素認識率が98%以上である音声認識装置を考
えた場合でも、−文中に1音素の認識誤ハが発生するこ
とは充分考えられるのである。以上の事実から見ても、
入力された音声の認識結果を訂正する必要が生じるのは
、そう稀なことではないことが分かる。音声認識装置を
考えた場合には、音声認識の誤り訂正装置の役割は極め
て大きいと思われる。
Furthermore, even when considering a speech recognition device that has a phoneme recognition rate of 98% or more, it is quite possible that one phoneme in a - sentence may be misrecognized. Considering the above facts,
It can be seen that it is not uncommon for it to be necessary to correct the recognition results of input speech. When considering speech recognition devices, the role of speech recognition error correction devices is considered to be extremely important.

しかし、前述の従来技術を用いた音声認識誤り訂正装置
では、音声認識結果に誤りが生じた場合には、操作者が
自ら第6図カーソル指示部3を操作し、認識誤りが発生
した区間の指定をしなければならない。このような訂正
操作を頻繁にしなければならないことは、操作者にとっ
て非常に負担である。また、音声による入力と言う優れ
た入力方法を用いておきながら、訂正部分の指定を手動
でカーソルを移動することによってする従来技術では、
音声認識装置の特徴である、「誰にでも操作が簡便に出
来る。」、「キー人力やその他の方法に比べ、データ入
力スピードが速い。」という利点を充分に発揮すること
が出来ないのである。
However, in the speech recognition error correction device using the above-mentioned conventional technology, when an error occurs in the speech recognition result, the operator manually operates the cursor indicator 3 in FIG. Must be specified. It is very burdensome for the operator to have to perform such correction operations frequently. In addition, while using an excellent input method called voice input, the conventional technology specifies the correction part by manually moving the cursor.
It is not possible to fully utilize the advantages of voice recognition devices, such as ``easy operation by anyone'' and ``fast data input speed compared to manual input or other methods.'' .

つまり、データ人力操作は速やかに行なえたとしても、
従来技術を用いた音声認識訂正装置は、誰でもが簡単に
迅速に訂正操作を行なうことは難しいのである。このよ
うに従来技術を用いた音声認識訂正装置では、訂正操作
に非常に時間がががり、極めて作業効率が悪いのである
。従来技術には、以上述べてきたような問題点があった
In other words, even if data can be manipulated quickly,
It is difficult for anyone to easily and quickly perform a correction operation using a speech recognition correction device using the conventional technology. As described above, in the speech recognition correction apparatus using the conventional technology, the correction operation takes a very long time, and the work efficiency is extremely low. The conventional technology has the problems described above.

本発明の目的はかかる欠点を除去し、カーソル移動によ
る誤認識部分の指示をすることなく、音声による指示に
よって誤認識部分を指定し訂正することができる音声認
識訂正装置を提供する点にある。
SUMMARY OF THE INVENTION An object of the present invention is to eliminate such drawbacks and to provide a speech recognition and correction device that can specify and correct a misrecognized portion by voice instructions without instructing the misrecognized portion by moving a cursor.

ri!i題を解決するための手段」 本発明の音声認識訂正装置は、入力音声の成分を分析す
る音響分析部と、前記音響分析部がら出力された最初の
入力音声を第一の候補に基づいて認識する音声認識部と
、前記音声認識部の出力を表示する手段と、前記音響分
析部から出力された、最初の人力音声を記憶するととも
に、次に誤認識された部分だけの音声が再人力されたと
きに、前記最初の入力音声のうちのどの部分であるかを
判定し、誤認識された部分について次の候補を前記音声
認識部に出力する文章音声スポツティング部と前記表示
部で表示された前記次の候補が前記入力音声に合致して
いる場合に、前記入力音声の認識を確定する手段とから
なることを特徴する。
ri! The speech recognition and correction device of the present invention includes an acoustic analysis section that analyzes the components of input speech, and an acoustic analysis section that analyzes the first input speech outputted from the acoustic analysis section based on the first candidate. A speech recognition section for recognizing, a means for displaying the output of the speech recognition section, and a means for displaying the output of the speech recognition section, and storing the first human-powered speech output from the acoustic analysis section, and then re-human-generating only the parts of the misrecognized speech. a sentence/speech spotting unit that determines which part of the first input speech is the erroneously recognized part, and outputs the next candidate to the speech recognition unit for the misrecognized part, and displays it on the display unit. and means for determining recognition of the input voice when the next candidate selected matches the input voice.

「実施例」 以下、本発明について実施例に基づいて詳細に説明する
"Examples" The present invention will be described in detail below based on Examples.

第1図は本発明の音声認識訂正装置の原理ブロック図、
第2図は本発明の一実施例のブロック図である。人力さ
れた音声は、11の音響分析部の構成要素であるマイク
、高域強調フィルタ、AD変換器より構成される21音
声入力部によって8KHz、12bitsのデジタル信
号としてサンプリングされる。更に同しく音響分析部1
1の構成要素である特徴抽出部22において、デジタル
信号に変換された音声信号を16m5区間を1フレーム
として1フレームごとに周波数変換し、周波数領域での
特徴パラメータを抽出し、発話された文章の特徴パラメ
ータ列として表わされる。特徴抽出部22で抽出された
発話文章の特徴パラメータ列は、特徴パラメータ列記憶
回路27に記憶される。
FIG. 1 is a block diagram of the principle of the speech recognition correction device of the present invention.
FIG. 2 is a block diagram of one embodiment of the present invention. The human-generated voice is sampled as an 8 KHz, 12-bit digital signal by a 21 voice input unit composed of 11 components of the acoustic analysis unit, such as a microphone, a high-frequency emphasis filter, and an AD converter. Furthermore, the acoustic analysis section 1
1, the feature extraction unit 22 converts the frequency of the audio signal converted into a digital signal frame by frame, with a 16m5 section as one frame, extracts feature parameters in the frequency domain, and calculates the frequency of the uttered sentence. It is expressed as a feature parameter sequence. The feature parameter string of the spoken sentence extracted by the feature extractor 22 is stored in the feature parameter string storage circuit 27.

音響分析部11で抽出された特徴パラメータ列は、文章
音声認識部12を構成する連続DPマツチング回路23
において、単語辞書24と発話された文章の特徴パラメ
ータ列とがマツチングされる。この連続DPマツチング
回路23において認識判定された単語ラティスは、単語
ラティス記憶回路32に記憶され、表示部制御回路25
の制御によって表示部26に表示される。表示部26に
表示された入力文章の認識結果に誤りがあった場合には
、操作者は訂正キーに触れる或いは押す等の行為によっ
て認識結果訂正の必要を知らせる。
The feature parameter string extracted by the acoustic analysis section 11 is passed through a continuous DP matching circuit 23 that constitutes the text speech recognition section 12.
In the step, the word dictionary 24 and the feature parameter string of the uttered sentence are matched. The word lattice recognized and determined in the continuous DP matching circuit 23 is stored in the word lattice storage circuit 32, and is stored in the display unit control circuit 25.
is displayed on the display section 26 under the control of. If there is an error in the recognition result of the input sentence displayed on the display unit 26, the operator notifies the user of the need to correct the recognition result by touching or pressing the correction key.

訂正キーは訂正キー制御回路28によって制御されてお
り、訂正キー制御回路28は、直ちに誤認識単語の入力
を求める体制に入るよう指示する。
The correction key is controlled by a correction key control circuit 28, and the correction key control circuit 28 instructs the user to immediately enter a system for requesting input of the incorrectly recognized word.

再人力された単語は、最初に入力された文章と同様に、
音声認識部21、特徴抽出部22を経て特徴パラメータ
列に変換される。誤認識単語の特徴パラメータ列は、特
徴パラメータ列記憶回路27に記憶されていた最初の入
力音声の特徴パラメータ列と、連続DPマツチング回路
29でワードスポツティングされる。誤って認識されて
しまった誤認識部分を再入力することによって、認識結
果の訂正箇所を確実にスポツティングしているのである
。単語ラティス記憶回路32の中に、正しい単語が存在
していれば、単語ラティス入れ換え回路30によって、
第二候補、第三候補とされていた単語に訂正し、確定キ
ー制御回路31によって制御されている確定キーを用い
て、認識結果を確定する。第二、第三の候補の中に正し
い単語が存在しなければ、改めて正しい単語の入力を行
ない、最初に文章を入力した際と同様な経路を経て、単
語認識を行なう。
The re-entered words will appear in the same way as the originally entered sentences.
The voice recognition section 21 and the feature extraction section 22 convert it into a feature parameter string. The feature parameter string of the misrecognized word is word-spotted with the feature parameter string of the first input voice stored in the feature parameter string storage circuit 27 in the continuous DP matching circuit 29. By re-inputting the erroneously recognized portions that have been erroneously recognized, the corrected portions of the recognition results are reliably spotted. If the correct word exists in the word lattice storage circuit 32, the word lattice replacement circuit 30
The words selected as the second and third candidates are corrected, and the recognition result is confirmed using the confirmation key controlled by the confirmation key control circuit 31. If the correct word does not exist among the second and third candidates, the correct word is input again and word recognition is performed through the same route as when inputting the sentence for the first time.

本発明について実施例に基づいて、第3図、第4図を用
いて更に説明する。
The present invention will be further explained based on an example using FIGS. 3 and 4.

第3図は本発明の単語ラティス記憶回路における単語ラ
ティス構造を示す図である。
FIG. 3 is a diagram showing the word lattice structure in the word lattice storage circuit of the present invention.

今、操作者が「今日の天気は晴れでず。」という文章を
入力したと仮定する。この入力を受けた際の単語ラティ
ス記憶回路32における単語ラティス構造は第3図に示
したとおり、「天気は」の単語ラティス構造は第一候補
「天気は」、第二候補「天使は」である。また、「晴れ
」の単語ラティス構造は、第一候補「針」、第二候補「
晴れ」、第三候補「橋」である。同様に「です」につい
ての単語ラティス構造は、第一候補「です」、第二候補
「でぶ」である。この場合「晴れ」が「針」に誤認識さ
れてしまったことになる。操作者は認識結果に訂正の必
要があることを、訂正キーを用いて知らせる。訂正キー
制御回路28は認識結果に誤りがあったことを認識し、
直ちに誤認識結果そのものの入力を求める体制を整える
Now, assume that the operator inputs the sentence "Today's weather is not sunny." The word lattice structure in the word lattice storage circuit 32 when this input is received is shown in FIG. 3, as shown in FIG. be. In addition, the word lattice structure of "hare" has the first candidate "needle" and the second candidate "needle".
The third candidate is ``Hashi''. Similarly, the word lattice structure for "desu" is the first candidate "desu" and the second candidate "fat". In this case, "sunny" is mistakenly recognized as "needle". The operator uses the correction key to notify that the recognition result needs to be corrected. The correction key control circuit 28 recognizes that there is an error in the recognition result,
A system will be established to immediately request the input of the misrecognition results themselves.

第4図は本発明の単語認識の訂正を行なう順序を説明す
る図である。
FIG. 4 is a diagram illustrating the order of correcting word recognition according to the present invention.

操作者は誤って認識された単語そのもの、「針」を再度
入力する。これは、誤認識部分をスポツティングするた
めである。人力された「針」は、21音声入力部、22
特徴抽出部を経て特徴パラメータ列に変換され、29D
Pマツチング回路において27特徴パラメ一タ記憶回路
に記憶されている特徴パラメータ列とDrマツチングし
、誤認識単語をスポツティングする。第4図には、特徴
パラメータ列として、最初の入力の音声パワーと、誤認
識単語「針」を再入力した際の音声パワーを示している
。ここの示したように、−度認識した単語「針」をスポ
ツティングすることは、困難なことではない。このよう
にして、誤認識部分「針」が訂正必要な部分として検出
され、幸い第二候補に正しい単語「晴れ」が存在するの
で、確定キーを用いて30単語ラティス入れ換え回路の
制御によって、第二候補「晴れ」を選択し、認識結果を
確定する。以上の操作によって、誤認識結果訂正を終了
し、正しい文認識結果「今日の天気は晴れです。」を得
ることが8来る。
The operator re-enters the word "needle" that was incorrectly recognized. This is to spot erroneously recognized parts. The human-powered "needle" is 21 voice input section, 22
It is converted into a feature parameter string through the feature extraction unit, and the 29D
The P matching circuit performs Dr matching with the feature parameter string stored in the 27 feature parameter storage circuit, and spots misrecognized words. FIG. 4 shows, as a feature parameter sequence, the voice power of the first input and the voice power when the misrecognized word "needle" is input again. As shown here, it is not difficult to spot the word ``needle'' that has been recognized twice. In this way, the misrecognized part "needle" is detected as a part that requires correction, and fortunately the correct word "hare" exists in the second candidate, so the 30-word lattice exchange circuit is controlled using the confirmation key to Select the second candidate "sunny" and confirm the recognition result. Through the above operations, the correction of the incorrect recognition result is completed and the correct sentence recognition result ``Today's weather is sunny.'' is obtained.

第5図、第2図、第3図、第4図を参照しながら本発明
の処理過程を詳細に説明する。第5図は本発明の一実施
例の処理の一例を示したフローチャートである。
The process of the present invention will be explained in detail with reference to FIGS. 5, 2, 3, and 4. FIG. 5 is a flowchart showing an example of processing according to an embodiment of the present invention.

まず、操作者によって音声によるデータの入力が行なわ
れる。音声データの入力に係わるのは第2図21音声入
力部である。入力された音声は直ちに特徴抽出される。
First, the operator inputs data by voice. The audio input unit shown in FIG. 2 is involved in inputting audio data. Features of the input speech are immediately extracted.

この特徴抽出に係わるのは第2図22特徴抽出部である
。抽出された特徴は、第2図27特徴パラメータ列記憶
回路に記憶される。特徴抽出することによって得られた
何らかの形の特徴パラメータ列は、単語記憶辞書に記述
されている単語の標準特徴パラメータ列と連続DPマツ
チングが行なわれる。この連tEDPマツチングに係わ
るのは、第2図23連続DPマツチング回路である。ま
た、このとき標準バタンとして用いられる特徴パラメー
タ列は、第2図24単語記憶辞書のものである。連続D
Pマツチングされた結果に基づいて認識判定され、その
結果が表示される。この表示に係わるのは第2図25表
示制御部、及び第2図26表示部である。表示された結
果の例としては、第3図、第4図に示しである通りであ
る。表示された認識結果に誤りが存在′、た場合には、
訂正キーを用いて、認識訂正の必要があることを伝える
。ここで用いられた訂正キー(=、第2図28訂正キー
制御回路によって制御されているものである。訂正の必
要があった場合には、直ちに訂正部分を検出する必要が
ある。認識結果の中から、訂正部分をスポツティングす
るために、誤認識部分の誤認識結果の音声による入力を
操作者に求める。誤認識部分の人力は直ちに特徴抽出さ
れ特徴パラメータ列となり、第2図29連続DPマツチ
ング回路において、第2図27特徴パラメータ列記憶回
路に記憶されている最初の音声人力の特徴パラメータと
連続DPマツチングされる。
The feature extractor shown in FIG. 2 is involved in this feature extraction. The extracted features are stored in the feature parameter string storage circuit shown in FIG. 27. A feature parameter string of some type obtained by feature extraction is subjected to continuous DP matching with a standard feature parameter string of words described in a word storage dictionary. The continuous DP matching circuit 23 in FIG. 2 is involved in this continuous DP matching. Further, the characteristic parameter string used as the standard button at this time is that of the word memory dictionary 24 in FIG. Continuous D
Recognition is determined based on the P matching results, and the results are displayed. The display control section shown in FIG. 25 and the display section 26 shown in FIG. 2 are involved in this display. Examples of displayed results are as shown in FIGS. 3 and 4. If there is an error in the displayed recognition result,
Use the correction key to notify that recognition correction is necessary. The correction key used here (=, is controlled by the correction key control circuit shown in Fig. 2).If correction is necessary, it is necessary to immediately detect the corrected part. In order to spot the corrected part, the operator is asked to input the erroneous recognition result of the erroneously recognized part by voice.The human power of the erroneously recognized part is immediately extracted as a feature and becomes a feature parameter string. In the matching circuit, continuous DP matching is performed with the feature parameters of the first voice input stored in the feature parameter string storage circuit shown in FIG. 27.

この連続Drマツチングの結果により誤認識部分のスポ
ツティングが行なわれる。そのようすは、第4図に示す
とおりである。誤認識部分がスポツティングされ、訂正
箇所が明らかになった。ここで、使用者は、単語ラティ
ス中に正しい認識結果を認めたならば、単語ラティスの
優先順位を確定キーを用いて操作し、認識結果を確定す
る。単語ラティスの優先順位入れ換えと確定の操作に係
わるのは、第2図30単語ラティス入れ換え回路と、第
2図31確定キー制御回路であネ。しかし、もしも、単
語ラティス中に正しい認識結果が存在しなかった場合に
は、新たに音声入力をすることになる。
Misrecognized portions are spotted based on the results of this continuous Dr matching. The situation is as shown in Fig. 4. The misrecognized parts were spotted and the corrected parts became clear. Here, if the user recognizes a correct recognition result in the word lattice, he or she operates the priority order of the word lattice using the confirmation key to confirm the recognition result. The word lattice exchange circuit shown in FIG. 2, 30, and the confirmation key control circuit, shown in FIG. However, if there is no correct recognition result in the word lattice, a new voice input will be required.

尚、実施例では、第2図21音声入力部として、マイク
、高域強調フィルタ、AD変換器より構成し、8KHz
、12bitsのデジタル信号としてサンプリングした
ものを用いたが、迅速に入力音声をサンプリングできる
ものであれば、それ以外の構成であってもかまわない。
In the embodiment, the audio input section shown in FIG. 2 is composed of a microphone, a high-frequency emphasis filter, and an AD converter,
, 12-bit digital signals are used, but other configurations may be used as long as the input audio can be sampled quickly.

また、第2図22特徴抽出部では、デジタル信号に変換
された音声信号を16ms区間を1フレームとして、1
フレームごとに周波数変換し、周波数領域での特徴パラ
メータを抽出し、発話された文章の特徴パラメータ列と
して表わす方法を用いたが、これ以外の方法であっても
、特徴を適確に抽出できる方法であればかまわない。
In addition, the feature extraction unit in FIG.
Although we used a method of converting the frequency for each frame, extracting feature parameters in the frequency domain, and expressing them as a feature parameter sequence of the uttered sentence, other methods can also be used to accurately extract features. It doesn't matter if that's the case.

「発明の効果」 以上述べてきたように本発明の音声認識訂正装置は、入
力された音声認識結果の誤認識部分の訂正にあたって、
カーソルを移動操作して誤認識部分の指定をする必要が
なく、音声による誤認識部分を再人力操作することによ
って、極めて速やかに誤認識部分の指定を行ない訂正す
ることが出来る。そのため、音声認識装置の使用環境の
悪化や、音声認識装置に人力を行なう操作者の体調等に
より、音声認識結果に頻繁に誤認識が生じ得るような場
合にも、音声認識訂正のための特別な操作や知識を必要
とせず、操作者への負担が軽減され作業効率も著しく改
善された。
"Effects of the Invention" As described above, the speech recognition correction device of the present invention corrects the erroneously recognized part of the input speech recognition result.
There is no need to specify the erroneously recognized portion by moving the cursor, and by re-operating the erroneously recognized portion by voice, the erroneously recognized portion can be specified and corrected very quickly. Therefore, even in cases where voice recognition errors may occur frequently due to the deterioration of the usage environment of the voice recognition device or the physical condition of the operator who manually operates the voice recognition device, special measures are taken to correct the voice recognition. It does not require advanced operations or knowledge, reducing the burden on the operator and significantly improving work efficiency.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は、本発明の音声認識訂正装置の原理ブロック図
。 第2図は、本発明の一実施例のブロック図。 第3図は、本発明の単語ラティス記憶回路における単語
ラティス構造を示す図。 第4図は、本発明の単語認識の訂正を行なう順序を説明
する図。 第5図は、本発明の一実施例の処理の一例を示したフロ
ーチャート。 第6図は、従来の音声認識訂正装置のブロック図。 以上 出願人 セイコーエプソン株式会社 代理人 弁理士 鈴木喜三部 他1名 ↓ 5 第1図 第2図 第−候補   今日の     天気は     針 
    です第二候補           天使は 
    晴れ    でぶ第三候補         
            橋第4図 第5図
FIG. 1 is a block diagram of the principle of the speech recognition and correction device of the present invention. FIG. 2 is a block diagram of an embodiment of the present invention. FIG. 3 is a diagram showing a word lattice structure in the word lattice storage circuit of the present invention. FIG. 4 is a diagram illustrating the order of correcting word recognition according to the present invention. FIG. 5 is a flowchart showing an example of processing according to an embodiment of the present invention. FIG. 6 is a block diagram of a conventional speech recognition correction device. Applicant Seiko Epson Co., Ltd. agent Patent attorney Kizobe Suzuki and 1 other person ↓ 5 Figure 1 Figure 2 - Candidate Today's weather is needles
The second candidate is the angel.
Sunny fat third candidate
Bridge Figure 4 Figure 5

Claims (1)

【特許請求の範囲】[Claims] 入力音声の成分を分析する音響分析部と、前記音響分析
部から出力された最初の入力音声を第一の候補に基づい
て認識する音声認識部と、前記音声認識部の出力を表示
する手段と、前記音響分析部から出力された、最初の入
力音声を記憶するとともに、次に誤認識された部分だけ
の音声が再入力されたときに、前記最初の入力音声のう
ちのどの部分であるかを判定し、誤認識された部分につ
いて次の候補を前記音声認識部に出力する文章音声スポ
ッティング部と前記表示部で表示された前記次の候補が
前記入力音声に合致している場合に、前記入力音声の認
識を確定する手段とからなることを特徴とする音声認識
訂正装置。
an acoustic analysis section that analyzes components of input speech; a speech recognition section that recognizes the first input speech outputted from the acoustic analysis section based on a first candidate; and means for displaying the output of the speech recognition section. , the first input voice outputted from the acoustic analysis unit is memorized, and when only the misrecognized portion of the voice is input again, which part of the first input voice is the next input? and outputs the next candidate to the speech recognition unit for the erroneously recognized part; and if the next candidate displayed on the display unit matches the input speech, A speech recognition correction device comprising means for determining recognition of input speech.
JP2310443A 1990-11-16 1990-11-16 Speech recognition and correction device Pending JPH04181299A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2310443A JPH04181299A (en) 1990-11-16 1990-11-16 Speech recognition and correction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2310443A JPH04181299A (en) 1990-11-16 1990-11-16 Speech recognition and correction device

Publications (1)

Publication Number Publication Date
JPH04181299A true JPH04181299A (en) 1992-06-29

Family

ID=18005311

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2310443A Pending JPH04181299A (en) 1990-11-16 1990-11-16 Speech recognition and correction device

Country Status (1)

Country Link
JP (1) JPH04181299A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002287792A (en) * 2001-03-27 2002-10-04 Denso Corp Voice recognition device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002287792A (en) * 2001-03-27 2002-10-04 Denso Corp Voice recognition device
JP4604377B2 (en) * 2001-03-27 2011-01-05 株式会社デンソー Voice recognition device

Similar Documents

Publication Publication Date Title
US5220639A (en) Mandarin speech input method for Chinese computers and a mandarin speech recognition machine
EP2562746A1 (en) Apparatus and method for recognizing voice by using lip image
US20150081270A1 (en) Speech translation apparatus, speech translation method, and non-transitory computer readable medium thereof
JPS62239231A (en) Speech recognition method by inputting lip picture
JP2016090900A (en) Utterance evaluation device, utterance evaluation method, and program
JPH06110494A (en) Pronounciation learning device
JPH0713591A (en) Device and method for speech recognition
JPH04248596A (en) Speech recognition correcting device
JP5591428B2 (en) Automatic recording device
JP3682922B2 (en) Real-time character correction device and real-time character correction program
JPH04181299A (en) Speech recognition and correction device
JPH0830290A (en) Voice input possible information processing device and its malprocessing detection method
JPH04254896A (en) Speech recognition correction device
JP3254977B2 (en) Voice recognition method and voice recognition device
JP2000047683A (en) Segmentation support device and medium
JP2000200093A (en) Speech recognition device and method used therefor, and record medium where control program therefor is recorded
JP2014149490A (en) Voice recognition error correction device and program of the same
JP2007272123A (en) Voice operation system
JP3259734B2 (en) Voice recognition device
JP2017102320A (en) Voice recognition device
JPH04254898A (en) Voice recognition correction device
JPH10143503A (en) Speech word processor
JP2755792B2 (en) Voice recognition device
JPH11338493A (en) Information processor and processing method, and offering medium
JPS5961899A (en) Japanese language voice input unit