JP2755792B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2755792B2
JP2755792B2 JP2155849A JP15584990A JP2755792B2 JP 2755792 B2 JP2755792 B2 JP 2755792B2 JP 2155849 A JP2155849 A JP 2155849A JP 15584990 A JP15584990 A JP 15584990A JP 2755792 B2 JP2755792 B2 JP 2755792B2
Authority
JP
Japan
Prior art keywords
syllable
recognition
key
key operation
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2155849A
Other languages
English (en)
Other versions
JPH0446399A (ja
Inventor
充宏 斗谷
伸 神谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP2155849A priority Critical patent/JP2755792B2/ja
Publication of JPH0446399A publication Critical patent/JPH0446399A/ja
Application granted granted Critical
Publication of JP2755792B2 publication Critical patent/JP2755792B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 【産業上の利用分野】
この発明は、入力された音声を音韻単位で識別して文
節等の意味の有る単位で認識する音声認識装置であっ
て、キー操作方法を容易に習得できるようにユーザを支
援できる音声認識装置に関する。
【従来の技術】
従来、音声認識装置として、音節を単位として入力音
声を識別し、この識別結果に基づいて文節単位で文節認
識用辞書を照合して入力音声を文節単位で認識する音声
認識装置がある。この音節を識別単位として文節単位で
認識する音声認識装置においては、音節の識別結果を組
み合わせて音声の認識処理(ボトムアップ処理)を行う
ので、文節等のように活用を含む超大語彙の認識が可能
であり、文章入力に適していると言える。
【発明が解決しようとする課題】
しかしながら、ボトムアップ処理によって音声の認識
処理を行う音声認識装置においては、例えば音節の認識
結果(音節ラティス)から信頼度の高い順に音節候補を
読み出して組み合わせることによって文節候補を生成す
るので、入力音声の認識結果として正しい文節候補の累
積信頼度が必ずしも最も高いとは限らない。 したがって、文節認識等のように大語彙を扱う音声認
識装置においては、得られた複数の文節候補を累積信頼
度の高い順に表示部に表示し、この表示された複数の文
節候補の中から正しい文節候補をキー入力等によって選
択するという補助操作を必要とするのである。 また、認識困難な文節は何度発声しても認識されにく
い場合があり、文節を構成する音節のうち正しく認識さ
れていない音節のみを再発声する追加発声操作を実施す
る必要が生ずる場合がある。 上述のような補助操作や追加発声操作等の際における
キー操作は、音声認識と言う不確定な事象(同じように
発声しても同一結果が得られるとは限らない)において
は不可欠の操作である。そして、これらのキー操作は上
記不確定な事象の内容に応じて行なう必要があり、マニ
ュアル等の手段によって予め総ての場合をユーザに説明
することはできないのである。 したがって、身近にインストラクタのいない初心者
は、上記補助操作や追加発声操作等の際におけるキー操
作を経験によって習得しなければならず、音声認識装置
を使いこなすには時間が掛かるという問題がある。 そこで、この発明の目的は、認識候補に基づいて正し
い認識結果を得るための操作方法を容易に習得可能なよ
うに、ユーザを支援することができる音声認識装置を提
供することにある。
【課題を解決するための手段】
上記目的を達成するため、請求項1に係る発明は、入
力された音声信号を音響分析して特徴パラメータに変換
し、この特徴パラメータを所定の手法によって音韻単位
で識別し,この識別結果に基づいて音声を認識する音声
認識装置において、上記音韻単位の識別結果に基づい
て,入力音声を文節等の意味の有る認識単位で認識して
認識候補を得る認識部と、発声すべき音節の順序を表す
指示音節列を格納するメモリと、上記メモリに格納され
た上記指示音節列,上記認識部によって得られた認識候
補および各種メッセージを表示する表示手段と、上記表
示手段で表示された指示音節列に従って発声された音声
に係る識別結果に基づいて上記認識部によって得られた
認識候補と上記指示音節列とを比較/照合し,この比較
/照合の結果と上記指示音節列が表示されてから後のキ
ー操作回数とに基づいて,正しい認識結果を得るために
次に実施すべきキー操作を所定の手順によって判定する
キー操作判定手段と、上記キー操作判定手段による判定
結果に従って、この判定結果の内容を上記表示手段で表
示するためのキー操作メッセージを生成するキー操作メ
ッセージ生成手段を備えたことを特徴としている。
【作用】
請求項1に係る発明の音声認識装置では、メモリに格
納された発声すべき音節の順序を表す指示音節列が表示
手段によって表示され、その表示された指示音節列に従
って発声された音声に基づく音声信号が音響分析されて
特徴パラメータに変換される。そして、この特徴パラメ
ータが所定の手法によって音韻単位で識別され、この識
別結果に基づいて入力音声が文節等の意味のある単位で
認識部によって認識されて認識候補が得られる。そし
て、この得られた認識候補が上記表示手段によって表示
される。 一方、上記表示手段で表示された指示音節列に従って
発声された音声に係る上記識別結果に基づいて上記認識
部によって得られた認識候補と上記指示音節列とがキー
操作判定手段によって比較/照合される。そして、この
比較/照合結果と上記指示音節列が表示されてから後の
キー操作回数とに基づいて、正しい認識結果を得るため
に次に実施すべきキー操作が所定の手順によって判定さ
れる。そして、この判定結果に従って、上記判定結果の
内容を表すキー操作メッセージがキー操作メッセージ生
成手段によって生成され、生成されたキー操作メッセー
ジが上記表示手段で表示される。 したがって、ユーザは上記表示手段によって表示され
るキー操作メッセージに従って、正しい認識結果を得る
ためのキー操作方法を訓練することによって、上記表示
手段によって表示された認識候補に基づいて正しい認識
結果を得るためのキー操作方法を習得できる。
【実施例】
以下、この発明を図示の実施例により詳細に説明す
る。 この実施例においては、連続発声された音声を音節単
位にセグメテーションして識別し、得られた音節ラティ
スに基づいて文節単位で認識処理を実施し、得られた認
識結果を表示するような日本語用の音声認識装置を例と
して説明する。 第1図はこの発明の音声認識装置の一実施例を示すブ
ロック図である。 ユーザに発声すべき音節列を指示するための複数の指
示音節列がCPU(中央処理装置)メモリ4に格納されて
いる。そして、キーボード12からのキー入力によって処
理モードがユーザ支援モードに指定されると、CPUメモ
リ4に格納された指示音節列の一つが読み出されて表示
部11に表示され、ユーザ支援モードが開始される。 上記表示部11に表示された指示音節列に従って、ユー
ザによって発声された音声に基づくアナログ音声信号が
アナログ入力部1に入力される。そして、増幅器(AM
P)21によって増幅され、A/D変換器22によってディジタ
ル音声信号に変換されて音声分析部2に出力される。A/
D変換器22から音声分析部2に入力されたディジタル音
声信号は8msの周期で16msをフレームの単位としてスペ
クトル分析が行われ、音響的特徴パラメータが生成され
る。そして、この生成された特徴パラメータは音節区間
の抽出に必要な情報(パワーおよび零交差数等)と共に
音節区間抽出部3に出力される。 そうすると、音声分析部2から音節区間抽出部3に入
力された特徴パラメータは、音節区間の抽出に必要な情
報に基づいて音節単位に切り出される。そして、音節単
位に切り出された特徴パラメータ(以下、音節特徴パタ
ーンと言う)は、音節区間情報(音節長,直前/直後の
音節との間の無音時間長等)と共にパターンメモリ7の
特徴パターンメモリ71に格納される。上記パターンメモ
リ7は、上述のようにして音節区間抽出部3によって切
り出された1音節分の音節特徴パターンを1個だけ格納
する上記特徴パターンメモリ71と、予め作成された標準
となる音節の音響的特徴パラメータから成る標準パター
ンを複数個記憶している標準パターンメモリ72とから構
成されている。 上記特徴パターンメモリ71に格納された1音節の音節
特徴パターンと標準パターンメモリ72に記憶された標準
パターンとの間の類似度計算が単音節認識部6によって
行われ、音節区間抽出部3で切り出された単音節が演算
結果に基づいて識別される。そして、連続した音節認識
結果(音節ラティス)内の音節候補の組み合わせと文節
認識用辞書9の内容との照合が文節認識部8によって行
われ、入力音声が文節単位で認識される(文節認識処
理)。そして、文節認識部8による認識結果(文節候
補)が表示部11に表示される。 キー操作指示部10は、上記CPUメモリ4から読み出さ
れた当該指示音節列とその当該指示音節列に従って発声
された音声の認識結果である文節候補との比較/照合を
行なう。そして、その比較/照合の結果から、ユーザが
正しい認識結果を得るためには次にどのキーを操作すべ
きかを判定する。こうして、得られたキー操作指示のメ
ッセージが表示部11に表示される。その結果、ユーザ
は、表示部11に表示されたキー操作メッセージの内容に
従ってキーボード12のキー操作を行なうことによって、
正しい認識結果を得るためのキー操作を習得することが
できるのである。 上記キーボード12は、ユーザによるキー操作によっ
て、上述の処理モード(音声登録モード,認識モードお
よびユーザ支援モード等)の指定や正しい認識結果の選
択の他に、認識結果の漢字への変換や認識結果の取り消
し等を指示する。 上記CPU5は上記アナログ入力部1,音声分析部2,音節区
間抽出部3,単音節認識部6,パターンメモリ7,文節認識部
8,キー操作指示部10,表示部11およびキーボード12を制
御して、ユーザ支援処理動作を実行する。また、上記CP
Uメモリ4には、上記指示音節列の他にCPU5用の制御プ
ログラムおよび音声認識処理に必要な情報等が格納され
ている。 第2図は上記CPU5の制御に基づいて実施されるユーザ
支援処理動作のフローチャートである。以下、第2図に
従ってユーザ支援処理動作について詳細に説明する。 ステップS1で、上記CPUメモリ4に格納された複数の
指示音節列から一つの指示音節列が選択され、表示部11
に表示される。 ステップS2で、上記表示部11に表示された指示音節列
に従って発声された音声から得られたアナログ音声信号
に基づいて上記音声分析部2によって生成された特徴パ
ラメータが、音節区間抽出部3によって音節単位に切り
出される。(第3図)。 ステップS3で、上記ステップS2において切り出された
音節区間候補に基づいて音節区間列が生成される。そし
て、生成された音節区間列の一つの音節区間候補に対応
する特徴パターンが特徴パターンメモリ71に格納され、
上述のようにして単音節認識部6によって単音節認識が
行われて音節候補が出力される。こうして、入力音声が
各音節区間毎に識別されるのである。 ステップS4で、上記ステップS3における単音節認識の
認識結果として音節ラティスが生成される。その際に、
音節ラティスの各音節候補には標準パターンとの類似度
に基づく信頼度が付加され、その信頼度の高い順に音節
候補が配列されるのである(第4図)。 ステップS5で、上記ステップS4において生成された音
節ラティスが文節認識部8に送出される。それと同時に
文節認識処理の実行が指示される。 そうすると、文節認識部8においては、入力された音
節ラティスを構成する音節候補を組み合わせて文字列が
作成され、文節認識用辞書9の照合等の言語処理が行わ
れて、文法的に成立する文字列のみが認識結果(文節候
補)として累積信頼度と共に、累積信頼度の順に出力さ
れる(第5図)。 ステップS6で、上記ステップS5において出力された文
節候補に、現在選択されている文節候補を示すためのカ
ーソルが付加されて表示部11に表示される(第6図)。 ステップS7で、上記キー操作指示部10によって、当該
指示音節列,候補順位(累積信頼度)が付加された文節
候補,現在選択されている文節候補の候補順位,指示音
節列が呈示されてからの“取消”キーおよび“後退”キ
ーの操作回数に基づいて、次にどのキーを操作すべきか
を判定するための評価値Hが後に詳述するようにして算
出される(第7図および第8図)。 ステップS8で、上記ステップS7において算出された評
価値Hに基づいて、当該指示音節列を構成する音節のう
ち、認識されなかった音節のみを再発声する追加発声が
必要か否かが判別される。その結果追加発声が必要であ
ればステップS9に進み、そうでなければステップS10に
進む。 ステップS9で、追加発声を促すメッセージが表示部11
に表示されてステップS2に戻り、追加発声された音声の
認識処理が実施される。 ステップS10で、上記キー操作指示部10によって算出
された評価値Hに基づいて、次にどのキーを操作すべき
かのキー操作判定が実施される。 ここで、“変換”キーは現在選択されている文節候補
を正しい認識結果であると確定する際に操作される。ま
た、“↓”キーは現在選択されている文節候補の次の文
節候補を選択する際に操作される。また、“↑”キーは
現在選択されている文節候補の前の文節候補を選択する
際に操作される。また、“後退”キーは現在選択されて
いる文節候補における指示音節列との不一致音節を消去
する際に操作される。また、“取消”キーは音節ラティ
スを構成している全音節を消去する際に操作される。 ステップS11で、上記ステップS10における判定結果に
基づくキー操作メッセージが生成されて、表示部11に表
示される(第9図および第10図)。 ステップS12で、上記ステップS11において表示部11に
表示されたキー操作メッセージに従って、ユーザによっ
てキーボード12のキーが操作される。 ステップS13で、上記ステップS12において操作された
キーが何のキーであるかが判断される。 その結果、“変換”キーであると判断された場合には
ステップS14に進み、“↓”キーであると判断された場
合にはステップS15に進み、“↑”キーであると判断さ
れた場合にはステップS16に進み、“後退”キーである
と判断された場合にはステップS17に進み、“取消”キ
ーであると判断された場合にはステップS18に進む。 ステップS14で、現在選択されている文節候補が漢字
に変換されて正しい認識結果として確定され、ステップ
S1に戻って次の指示音節列に従って発声された音声の認
識処理が実施される。 ステップS15で、現在選択されている文節候補より
“↓”キーの操作回数だけ候補順位の低い文節候補が選
択される。そして、ステップS6に戻り、表示部11におい
て現在選択されている文節候補を指示するカーソルの位
置が“↓”キー操作回数だけ低順位側に移動される。 ステップS16で、現在選択されている文節候補より
“↑”キーの操作回数だけ候補順位の高い文節候補が選
択される。そして、ステップS6に戻り、表示部11におい
て現在選択されている文節候補を指示するカーソルの位
置が“↑”キーの操作回数だけ高順位側に移動される。 ステップS17で、現在選択されている文節候補におけ
る最後尾から“後退”キーの操作回数だけの数の音節が
消去されてステップS4に戻る。 そうすると、上記音節ラティスの対応する音節区間候
補における総ての音節候補が削除される。こうして、再
編成された音節ラティスに基づいて、再度文節認識処理
が実施されるのである。 ステップS18で、音節ラティスを構成している全音節
が消去される。そして、ユーザによって再発声された音
声の認識処理が実施されるのである。 こうして、次々に表示部11に表示される指示音節列に
従って発声が行われ、その際の認識結果に基づいてキー
操作メッセージが表示部11に表示される。ユーザは、こ
の表示されたキー操作メッセージに従って正しい認識結
果を得るためのキー操作方法を習得するのである。 その間に、“解除”キーが操作されたことがステップ
S13で判断されるとユーザ支援処理動作が終了する。 次に、キー操作指示部10において実施される評価値H
の算出と、その評価値Hに基づくキー操作判定について
詳細に説明する。 まず、指示音節列と第6図に示す各文節候補とが比較
され、各文節候補毎に評価値Hが次のようにして算出さ
れる。 ここで、 A:指示音節列の音節数 B:指示音節列と文節候補とにおいて先頭から連続して一
致する音節数 C:文節候補の音節数−B D:A−B(C=0の場合) 0(C≠0の場合) N:現在のカーソル位置からのずれ(候補順位数) X:“取消”キーを押した回数 Y:“後退”キーを押した回数 H:評価値 とする。 (a)A=Bであり、かつ、C=0,D=0である(すな
わち、指示音節列と文節候補との音節列が完全に一致す
る)場合 H=255−N (b)B=0の場合 H=0 (c)(a),(b)以外の場合 H={255−128×(A−B)/B}−16×C−4×D−16
×N+32×Z ここで、Z=X+Y/4 少数点以下は切り捨て Z>3の場合はZ=3 但し、 H≧240の場合はH=240とする。 さらにキー操作指示部10は、上述のようにして算出し
た総ての文節候補における評価値Hの値に基づいて、以
下のようなキー操作判定基準に従ってキー操作判定を実
施する。 ここで、 Hmax:総ての文節候補における評価値Hの最大値 i:Hmaxを与える文節候補の候補順位 j:現在選択されている文節候補の候補順位(現在のカー
ソル位置) とする。 (イ)Hmax=255の場合 この場合は、指示音節列と現在選択されている文節候
補との音節列が完全に一致していることを意味する。し
たがって、現在選択されている文節候補を正しい認識結
果として確定するために、次操作キーは“変換”キーで
あると判定する。 (ロ)Hmax<128の場合 この場合は、指示音節列と総ての文節候補との音節が
あまりにも一致していないことを意味する。したがっ
て、当該指示音節列の再発声を促すために、次操作キー
は“取消”キーであると判定する。 (ハ)(イ),(ロ)以外で、i=jの場合 i)C=0 この場合は、指示音節列と現在選択されている文節候
補との音節列が完全に一致していないが、C=0である
ため文節候補の後ろからD個分の音節が不足しているこ
とを意味する。したがって、この不足している音節の追
加発声を促すためのメッセージを表示部11に表示する。 (ii)C≠0 この場合は、指示音節列と現在選択されている文節候
補との音節列の後ろからC個分の音節が不一致であるこ
とを意味する。したがって、この不一致の音節を削除し
て追加発声するために、次操作キーは“後退”キーであ
り、その操作回数はC回であると判定する。 (ニ)(イ),(ロ)以外で、i≠jの場合 i)j>i この場合は、Hmaxを与える文節候補の位置よりもカー
ソルの位置が候補順位にして(j−i)だけ低順位側に
あることを意味する。したがって、Hmaxを与える文節候
補の位置にカーソルの位置を移動するために、次操作キ
ーは“↑”キーであり、その操作回数は(j−i)であ
ると判定する。 ii)j<i この場合は、Hmaxを与える文節候補の位置よりもカー
ソルの位置が候補順位にして(i−j)だけ高順位側に
あることを意味する。したがって、Hmaxを与える文節候
補の位置にカーソルの位置を移動するために、次操作キ
ーは“↓”キーであり、その操作回数は(i−j)であ
ると判定する。 こうして、評価値Hの算出とこれに基づくキー操作判
定が実施されるのである。 以下、例えば指示音節列「はいけい」が表示部11に表
示され、単語「はいけい」のアナログ音声信号がアナロ
グ入力部1に入力された場合を例に、第1図〜第10に従
って上述のユーザ支援処理動作をより具体的に説明す
る。 第3図は音節区間抽出部3において切り出された音節
区間候補を発声内容と音素記号とを併せて示す。上記音
素記号は音声の変化を分かり易く示すために添記したも
のであり、この発明とは直接関係はない。 …第2図のステップS2 第3図に示す各音節区間候補S0,S1,S2,S3が単音認識
部6で単音節認識され、その単音節認識結果に基づいて
第4図に示すような音節ラティスが生成される。 …第2図のステップS3,ステップS4 第4図に示す音節ラティスが文節認識部8に送出され
て、音節ラティスを構成する各音節区間候補S0,S1,S2,S
3に対応する音節候補が次のようにして選択されて文字
列が作成される。すなわち、まず各音節区間候補S0,S1,
S2,S3における信頼度が第1位の音節候補が選択されて
累積信頼度が最も高い文字列「はいてい」が作成され
る。以下、作成された文字列の各文字が順次他の音節候
補と取り替えられて文字列が作成されて、第5図に示す
ような文節候補が得られる。 ここで、第5図における候補順位は、その文節候補を
構成する音節候補列の累積信頼度の大きい順である。ま
た、第5図においては、累積信頼度が最も高い文字列
「はいてい」が文節認識用辞書9にはないので、文字列
「はいてい」における音節区間候補S0に対応する文字
「は」が信頼度が第2位の音節候補の文字「か」と取り
替えられて作成された文字列「かいてい」が、候補順位
1位の文節候補として得られている。 …第2図のステップS5 こうして得られた文節候補が表示部11に表示される。
第6図はその際における表示方法の一例を示し、表示画
面の最上部には指示音節列の内容が表示されている。 …第2図のステップS6 次に、キー操作指示部10によって、上述のようにして
第6図に示す文節候補に基づいて評価値Hを算出する。
第7図および第8図に、こうして算出された評価値H
を、他の変数A,B,C,D,N,X,Yと共に示す。 …第2図のステップS7 こうして、キー操作指示部10によって評価値Hが算出
された結果、第7図においては、最大評価値Hmax=254
であり、最大評価値Hmaxを与える文節候補「はいけい」
の候補順位よりもカーソル位置が“1位”だけ高順位に
あるため、上記キー操作判定基準(ニ)のii)に該当す
る。したがって、第9図に示すように「“↓”キーを一
回押して下さい。」のキー操作メッセージが表示され
る。 …第2図のステップS10,ステップS11 上記キー操作メッセージに従って“↓”キーが一回操
作される。そうすると、第10図に示すようにカーソルの
位置が最大評価値Hmaxを与える文節候補「はいけい」の
位置になり、文節候補「はいけい」が選択される。 …第2図のステップS13,ステップS15 そして、再度評価値Hの算出が実行されて、評価値H
の値が第8図に示すように更新される。その際に、各文
節候補における現在のカーソル位置からのずれの程度を
表す数Nの値が第8図に示すように変化するため、それ
に連れて評価値Hの値も変化する。その結果、最大評価
値Hmax=255になって、上記キー操作判定基準(イ)に
該当するようになる。したがって、第10図に示すように
「“変換”キーを押して下さい。」のキー操作メッセー
ジが表示される。 …第2図のステップS10,ステップS11 上記メッセージに従って“変換”キーが操作される。
そうすると、第10図のように現在選択されている文節候
補「はいけい」が漢字変換されて、文節候補「はいけ
い」が正しい認識結果として確定される。 …第2図のステップS13,ステップS14 こうして、評価値Hの値に基づいて、各種キーの操作
手順や追加発声のメッセージを表示部11に表示してユー
ザを指導する。そして、そのキー操作メッセージに従っ
たユーザのキー操作に連れて、評価値Hの内容を更新し
て次のメッセージを表示し、“変換”キーの操作による
認識結果の確定までユーザを指導するのである。 上述のようなユーザ支援処理に際して、“取消”キー
や“後退”キーが操作されるような認識困難な音声の認
識に際しては、以下の詳述するように評価値Hの値を順
次高めて、やがては追加発声によって正しい認識結果が
確定されるのである。 すなわち、例えば指示音節列「おすごし」に対する入
力音声に係る文節候補の評価値Hの値が第11図に示すよ
うに算出されたとする。この場合には、最大評価値Hmax
=111であるため、上記キー操作判定基準(ロ)に該当
する。したがって、“取消”キーを操作するようにキー
操作メッセージが表示される。 …第2図のステップS10,ステップS11 上記キー操作メッセージに従って“取消”キーが操作
される。そうすると、第12図に示すように“取消”キー
操作回数Xの値が“1"に変化するため、それに連れて評
価値Hの値も変化する。その結果、最大評価値Hmax=14
3になるため、上記キー操作判定基準(ニ)のii)に該
当するようになる。したがって、“↓”キーを3回操作
するようにメッセージが表示される。 …第2図のステップS10,ステップS11 上記メッセージに従って“↓”キーを3回操作してカ
ーソル位置を文節候補「おすうし」の位置に移動する。
そうすると、次には“後退”キーを2回操作するように
キー操作メッセージを表示して、文節候補の後ろ2音節
の削除と音節/ごし/の追加発声を指導するものであ
る。 上述のようにして、表示部11に表示されるキー操作メ
ッセージに従ってキー操作方法を訓練することによっ
て、やがて、ユーザはキー操作メッセージなしでも第11
図において文節候補「おすうし」の選択と文節候補「お
すうし」の後ろ2音節の削除と追加発声を実行して、正
しい認識結果「おすごし」が得られるようになるのであ
る。 このように、“取消”キーや“後退”キーの操作回数
を考慮して次のキー操作を判定することによって、通常
は何度発声しても正しく認識されないような音声であっ
ても追加発声によって正しく認識できるように指導でき
るのである。 上述のように、本実施例においては、指示音節列に従
って入力された音声のアナログ音声信号に基づいて、単
音節認識部6によって単音節認識を行って音節区間列に
対応する音節ラティスを生成する。その後、生成された
音節ラティス基づいて文節認識部8によって文節認識処
理を実行し、上記文節認識処理によって得られた文節候
補を表示部11に表示する。 そうすると、キー操作指示部10は、上記表示部11に表
示された文節候補と指示音節列とを比較/照合し、指示
音節列の音節数,指示音節列と文節候補とにおける連続
一致音節数,現在選択されている文節候補の候補順位,
“取消”キーおよび“後退”キーの操作回数等に基づい
て、所定の手順で評価値Hを各文節候補毎に算出する。
そして、この評価値Hに基づいて上述のキー操作判定基
準に従ってキー操作を判定し、キー操作メッセージを表
示部11に表示する。さらに、表示部11に表示されたキー
操作メッセージに従ってユーザによってキー操作が行わ
れると、そのキー操作に基づいた処理を実行した後、各
文節候補毎に評価値Hを再度算出してキー操作メッセー
ジを表示するのである。 こうして、ユーザがキー操作を実施する度に、正しい
認識結果を得るための次のキー操作をメッセージによっ
てユーザを指導するのである。 したがって、この音声認識装置によれば、身近にイン
ストラクタがいない初心者であっても、表示部11に表示
されるキー操作メッセージに従ってキー操作を実施する
だけで、正しい認識結果を得るための補助操作や追加発
声操作等の際におけるキー操作方法を習得できるのであ
る。 上記実施例においては、音節を音声識別の単位として
いる。しかしながら、この発明はこれに限定されるもの
ではなく、音素および半音節等であってもよい。すなわ
ち、音素,半音節および音節等を総称したいわゆる音韻
を識別単位とすればよいのである。 上記実施例においては、入力された音声を文節単位で
認識しているが単語単位で認識してもよい。要は、意味
のある認識単位であればよいのである。 この発明における上記補助操作および追加発声操作の
際におけるキー操作方法やキー操作メッセージの表示方
法は、上記実施例に限定されるものではない。 この発明における評価値Hの算出アルゴリズム,キー
操作判定アルゴリズムおよびユーザ支援処理動作アルゴ
リズムは、上記実施例に限定されるものではない。
【発明の効果】
以上より明らかなように、請求項1に係る発明の音声
認識装置は、表示手段で表示された指示音韻列に従って
発声された音声を音韻単位で識別し、この識別結果に基
づいて認識部によって文節等の意味のある認識単位で音
声を認識して認識候補を得、その認識候補を上記表示手
段に表示する。そして、上記認識候補と上記指示音韻列
とを比較/照合し、この比較/照合結果と上記指示音節
列が呈示されてから後のキー操作回数とに基づいて、正
しい認識結果を得るための次のキー操作をキー操作判定
手段によって判定する。そして、判定結果の内容を表す
キー操作メッセージをキー操作メッセージ生成手段によ
って生成して上記表示手段で表示するようにしたので、
ユーザは、上記キー操作メッセージに従ってキー操作を
実施することによって、上記認識候補に基づいて正しい
認識結果を得るようなキー操作方法を容易に習得でき
る。 すなわち、この発明の音声認識装置は、身近にインス
トラクタのいない初心者であっても、正しい認識結果を
得るためのキー操作方法を容易に習得可能なようにユー
ザを支援できるのである。
【図面の簡単な説明】
第1図はこの発明の音声認識装置における一実施例のブ
ロック図、第2図はユーザ支援処理動作のフローチャー
ト、第3図は切り出された音節区間候補の一例を示す
図、第4図は生成された音節ラティスの一例を示す図、
第5図は得られた文節候補の一例を示す図、第6図は認
識候補表示の一例を示す図、第7図および第8図は評価
値Hの算出例を示す図、第9図および第10図はキー操作
メッセージの表示例を示す図、第11図および第12図は第
7図および第8図とは異なる評価値Hの算出例を示す図
である。 1…アナログ入力部、2…音声分析部、3…音節区間抽
出部、4…CPUメモリ、5…CPU、6…単音節認識部、7
…パターンメモリ、8…文節認識部、9…文節認識用辞
書、10…キー操作指示部、11…表示部、12…キーボー
ド。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 521 - 571 G06F 3/14

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された音声信号を音響分析して特徴パ
    ラメータに変換し、この特徴パラメータを所定の手法に
    よって音韻単位で識別し、この識別結果に基づいて音声
    を認識する音声認識装置において、 上記音韻単位の識別結果に基づいて、入力音声を文節等
    の意味の有る認識単位で認識して認識候補を得る認識部
    と、 発声すべき音節の順序を表す指示音節列を格納するメモ
    リと、 上記メモリに格納された上記指示音節列,上記認識部に
    よって得られた認識候補および各種メッセージを表示す
    る表示手段と、 上記表示手段で表示された指示音節列に従って発声され
    た音声に係る識別結果に基づいて上記認識部によって得
    られた認識候補と上記指示音節列とを比較/照合し、こ
    の比較/照合の結果と上記指示音節列が表示されてから
    後のキー操作回数とに基づいて、正しい認識結果を得る
    ために次に実施すべきキー操作を所定の手順によって判
    定するキー操作判定手段と、 上記キー操作判定手段による判定結果に従って、この判
    定結果の内容を上記表示手段で表示するためのキー操作
    メッセージを生成するキー操作メッセージ生成手段を備
    えたことを特徴とする音声認識装置。
JP2155849A 1990-06-14 1990-06-14 音声認識装置 Expired - Fee Related JP2755792B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2155849A JP2755792B2 (ja) 1990-06-14 1990-06-14 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2155849A JP2755792B2 (ja) 1990-06-14 1990-06-14 音声認識装置

Publications (2)

Publication Number Publication Date
JPH0446399A JPH0446399A (ja) 1992-02-17
JP2755792B2 true JP2755792B2 (ja) 1998-05-25

Family

ID=15614849

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2155849A Expired - Fee Related JP2755792B2 (ja) 1990-06-14 1990-06-14 音声認識装置

Country Status (1)

Country Link
JP (1) JP2755792B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4983587B2 (ja) * 2007-12-19 2012-07-25 株式会社デンソー 単音節入力装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60205594A (ja) * 1984-03-30 1985-10-17 電子計算機基本技術研究組合 認識結果表示方式
JPH01191217A (ja) * 1988-01-26 1989-08-01 Canon Inc 情報処理装置
JPH01285997A (ja) * 1988-05-13 1989-11-16 Sharp Corp 音声認識装置

Also Published As

Publication number Publication date
JPH0446399A (ja) 1992-02-17

Similar Documents

Publication Publication Date Title
EP1701338B1 (en) Speech recognition method
JPS62239231A (ja) 口唇画像入力による音声認識方法
JP2008309856A (ja) 音声認識装置及び会議システム
JP2007047412A (ja) 認識文法モデル作成装置、認識文法モデル作成方法、および、音声認識装置
US20020091520A1 (en) Method and apparatus for text input utilizing speech recognition
JP5105943B2 (ja) 発話評価装置及び発話評価プログラム
JP2955297B2 (ja) 音声認識システム
JPH0352058A (ja) 音声入力の文書処理装置
JPH06110494A (ja) 発音学習装置
JP3948260B2 (ja) テキスト入力方法及びその装置
JP2755792B2 (ja) 音声認識装置
JP3378547B2 (ja) 音声認識方法及び装置
JP2647234B2 (ja) 音声認識装置
JPH0338699A (ja) 音声認識装置
JP2007071904A (ja) 地域別発音学習支援装置
KR100404852B1 (ko) 언어모델적응기능을가진음성인식장치및그제어방법
JP3522005B2 (ja) 音声合成装置
JP2014059330A (ja) 音調表示制御装置およびプログラム
JP2000276189A (ja) 日本語ディクテーションシステム
JP2000099084A (ja) 音声認識方法及びその装置
JP2000047683A (ja) セグメンテーション補助装置及び媒体
JP2664785B2 (ja) 音声認識装置
JPH0434499A (ja) 発声法指示装置
JPWO2009147745A1 (ja) 検索装置
JPH0632021B2 (ja) 日本語音声認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees