JP2000010588A - 音声認識方法及び装置 - Google Patents

音声認識方法及び装置

Info

Publication number
JP2000010588A
JP2000010588A JP10177317A JP17731798A JP2000010588A JP 2000010588 A JP2000010588 A JP 2000010588A JP 10177317 A JP10177317 A JP 10177317A JP 17731798 A JP17731798 A JP 17731798A JP 2000010588 A JP2000010588 A JP 2000010588A
Authority
JP
Japan
Prior art keywords
recognition
unit
connection information
candidate
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10177317A
Other languages
English (en)
Inventor
Hisayoshi Nagae
尚義 永江
Yukihiro Fukunaga
幸弘 福永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba AVE Co Ltd
Original Assignee
Toshiba Corp
Toshiba AVE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba AVE Co Ltd filed Critical Toshiba Corp
Priority to JP10177317A priority Critical patent/JP2000010588A/ja
Publication of JP2000010588A publication Critical patent/JP2000010588A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】N−グラム中の接続情報値を運用中にユーザが
自発的に適切な値に変更でき、誤認識しやすいパターン
に対する認識精度を向上させる。 【解決手段】単語系列接続確率変更ダイアグラムが表示
されている状態で、当該ダイアグラムの単語系列入力欄
にユーザ100が操作・表示部107により所望の単語
系列を入力すると、単語接続情報変更部106は入力さ
れた単語系列に対応してN−グラム105に登録されて
いる接続情報値を読み込んで上記ダイアグラムの接続情
報入力欄に表示する。この接続情報入力欄に表示された
接続情報値をユーザ100が操作・表示部107により
所望の値に変更し、実行を指示すると、単語接続情報変
更部106はその時点において単語系列入力欄に設定さ
れている単位系列に対応してN−グラム105に登録さ
れている接続情報値を接続情報入力欄に設定されている
接続情報値に変更する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力音声の音響的
な特徴とN個の言語単位の連鎖からなる種々の単位系列
についてのN−グラム中の接続情報をもとに認識を行う
音声認識方法及び装置に係り、特にユーザが自発的にあ
るいはユーザによる認識候補訂正操作の過程で自動的に
N−グラム中の接続情報を変更することが可能な音声認
識方法及び装置に関する。
【0002】
【従来の技術】従来より、入力音声の音響的な特徴を抽
出して音響モデルとのマッチングをとることで当該音声
を認識する音声認識装置が種々開発されている。この種
の音声認識装置を使って音声認識を行う際、音響マッチ
ングに使用する音響モデルやマッチングのアルゴリズム
の特性等の関係から、ある特定のパターンの音声入力に
対して誤認識しやすい、という現象が発生することがよ
くある。ところが、この誤認識しやすいパターンは、発
声する人の声質や使用しているマイクロホンの特性、シ
ステムを使用している周辺の環境等によっても変化する
ので、システム開発時に予め予測することはできない。
【0003】一方、システム運用開始後においては、あ
る特定のパターンの入力に対して誤認識しやすいという
現象を確認することはあり得る。しかし、システム運用
開始後に、そのような特定のパターンを正しく認識でき
るように音響モデルやマッチングのアルゴリズムを、ユ
ーザ側の設定により、あるいはシステム側で自動的に変
更することは極めて困難である。
【0004】
【発明が解決しようとする課題】上記したように従来の
音声認識装置では、システム運用中にある特定のパター
ンの入力に対して誤認識しやすいという現象が確認され
たとしても、改善することが困難であるという問題があ
った。
【0005】ところで、近年の音声認識装置には、N−
グラム(の単語接続情報値)を利用したものがある。音
声認識装置用のN−グラムは、図9(b)に示すよう
に、N個組(ここでは、N=2)の言語単位、例えばN
個組の単語の系列(単語系列)毎に、その単語系列の出
現頻度情報に基づいて計算された数値、いわゆる単語接
続情報値(多くの場合、接続確率が使用される)のテー
ブル形式のデータとして用意される(これをN−グラム
テーブルと呼ぶ)。このN−グラムは、音響的な認識処
理の結果の各単語系列に対して、当該N−グラムの単語
接続情報値を調べることで、認識結果の語の並びが日本
語の文章として適切かどうかを評価するのに使用され
る。
【0006】本発明者は、N−グラムの単語接続情報値
を操作することによって、誤認識しやすい入力音声パタ
ーンに対する認識精度を向上させることが可能になるは
ずであると確信するに至った。ところが、従来の音声認
識装置では、システムで予め用意されたN−グラムのテ
ーブルの内容(N−グラムの単語接続情報値)をシステ
ムの運用開始後にユーザやシステムが変更することはで
きなかった。その理由は、従来、N−グラムの単語接続
情報値をシステムの運用開始後に変更するという技術的
思想が存在しなかったことによる。このため従来は、シ
ステム運用中にある特定の入力パターンに対して誤認識
しやすいという現象が確認されても、改善することが困
難であるという問題があった。
【0007】本発明は上記事情を考慮してなされたもの
でその目的は、N−グラム中の接続情報値を運用中にユ
ーザが自発的に適切な値に変更でき、もって誤認識しや
すいパターンに対する認識精度の向上が図れる音声認識
方法及び装置を提供することにある。
【0008】本発明の更に他の目的は、ユーザによる候
補選択操作等に基づいてN−グラム中の接続情報値を自
動的に適切な値に変更でき、もってユーザに負担をかけ
ることなく、誤認識しやすいパターンに対する認識精度
の向上が図れる音声認識方法及び装置を提供することに
ある。
【0009】
【課題を解決するための手段】本発明は、入力音声から
音響的特徴を抽出して音響モデルとのマッチングをとる
ことで所定の認識単位で読みの候補を音響的尤度と共に
求めて、その音響的尤度が上位の複数個の読み候補につ
いて認識語彙辞書を参照することで該当する文字または
文字列からなる認識候補を取得し、N個(Nは2以上の
整数)の言語単位の連鎖からなる種々の単位系列毎にそ
の単位系列が出現する尤もらしさを表す接続情報値が登
録されたN−グラムを、上記取得した認識単位の各認識
候補と先行するN−1個の認識単位の各認識候補との連
鎖からなり、それぞれ当該取得した認識単位の各認識候
補を最終位置の言語単位とするN個の認識候補により構
成される各単位系列について参照することで、当該単位
系列の接続情報値を取得して、当該単位系列中の最終位
置の認識候補の音響的尤度と前記取得した接続情報値を
もとに最終的な認識候補を決定する音声認識方法におい
て、上記N−グラムに登録されている接続情報値を変更
するための変更モードが設定されている場合に、ユーザ
の指定する単位系列及び当該単位系列の接続情報値の入
力を受け付け、この受け付けた単位系列に対応して上記
N−グラムに登録されている接続情報値を、当該単位系
列と共に受け付けた接続情報値に変更するようにしたこ
とを特徴とする。
【0010】本発明によれば、特定の入力単位系列に対
して誤認識されやすいことが判明している場合、ユーザ
は変更モードを指定して、その単位系列とその単位系列
の変更後の接続情報値(例えば、その単位系列が出現す
る確率、つまり接続確率)を入力操作手段等を操作して
入力することで、その単位系列の接続情報値を所望の値
に変更することが可能となる。このようにして、誤認識
されやすい単位系列の接続情報値を下げるならば、音響
的認識処理を行う部分を何ら変更しなくても、N−グラ
ムを用いた言語処理の段階で、当該誤認識されやすい単
位系列を排除することが可能となり、音声認識率を向上
させることができる。
【0011】特に、接続情報値の変更モードにおいて、
ユーザ指定の単位系列の入力を受け付けて設定するため
の第1の入力欄及びユーザ指定の接続情報値の入力を受
け付けて設定するための第2の入力欄を有する入力画面
(ダイアグラム)を表示し、第1の入力欄にユーザ指定
の単位系列が設定された場合には、当該設定された単位
系列に対応して上記N−グラムに登録されている接続情
報値を取得して上記第2の入力欄にユーザからの指定に
応じて変更可能なように設定し、上記変更モードにおい
て、ユーザからの接続情報値変更の指示を受け付け、当
該指示を受け付けた場合には、その時点において上記第
1の入力欄に設定されている単位系列に対応して上記N
−グラムに登録されている接続情報値を、第2の入力欄
に設定されている接続情報値に変更する構成を適用する
ならば、上記の入力画面を介してユーザによる単位系列
及び当該単位系列の接続情報値の指定が容易に行える。
【0012】また本発明は、接続情報値(つまり文法的
尤度)と対応する音響的尤度とに基づく(言語処理で
の)総合的な判断で決定された認識候補の単位系列を表
示して、ユーザの入力操作に従う訂正の対象となる言語
単位の認識候補の指定を受け付けると共に、この受け付
けた認識候補を含む認識候補の一覧を表示して、ユーザ
の指定する当該認識候補に対する訂正後の認識候補の入
力を受け付け、この受け付けた認識候補を除く認識候補
一覧中の各認識候補を最終位置の言語単位とする単位系
列に対応して上記N−グラムにそれぞれ登録されている
接続情報値を現在値より値が小さくなる方向に自動的に
変更するようにしたことをも特徴とする。
【0013】本発明によれば、システム側で決定された
認識結果の単位系列が誤っていたために、その単位系列
中の誤り箇所をユーザが指定して、認識候補一覧中から
正しい認識候補を選択指定する、あるいは(認識候補一
覧中に正しい候補が存在しないなどの理由で)キーボー
ド等の入力操作手段から直接入力することで、正しい単
位系列に訂正するための操作を行った際に、訂正された
認識候補を除く認識候補一覧中の各認識候補(つまり非
選択候補)について、その候補を最終位置の言語単位と
する単位系列に対応してN−グラムにそれぞれ登録され
ている接続情報値が、システム側で自動的に下げられ
る。これにより、ユーザがわざわざ単位系列を指定して
接続情報値を下げる操作を実行しなくても済む。即ち、
ユーザが音声を発声し、その音声の認識過程で認識誤り
を指摘し認識候補の単位系列を訂正していくだけで、誤
認識されやすい単位系列に対する接続情報値を自動的に
下げることができ、次の発声時には、N−グラムを用い
た言語処理の段階で、当該誤認識されやすい単位系列を
排除することができる。なお、接続情報値を自動的に下
げる方法として、一定の係数n(但し0<n<1)と元
の接続情報値との乗算を行い、その乗算結果を変更後の
新たな接続情報値とするとか、一定値を減じる方法など
が適用可能である。
【0014】また本発明は、ユーザが明示的に単位系列
の接続情報値の変更を指示した結果、あるいはユーザが
認識誤りを指摘して単位系列を訂正した結果、N−グラ
ムに登録されている接続情報値をシステム側で変更した
場合に、当該接続情報値が予め定められた閾値を下回っ
ているか否かを調べ、下回っているときは、当該接続情
報値を含む対応する単位系列に関する登録情報をN−グ
ラムから自動的に削除するようにしたことをも特徴とす
る。
【0015】本発明によれば、ユーザが使用しない単位
系列に関するN−グラム中の項目の情報を自動的に削除
することができる。これにより、N−グラムのサイズを
小さくして、そのために必要な認識実行時に必要なメモ
リの消費量を低く抑えることが可能となり、更に処理量
が減るため処理の高速化も可能となる。
【0016】また本発明は、N−グラムから単位系列に
関する登録情報を削除した場合に、当該単位系列を構成
する各単位毎に、当該単位を含む単位系列がN−グラム
に少なくとも1つ登録されているか否かを調べ、当該N
−グラム中に存在しない単位を検出した場合には、その
検出した単位に関する認識語彙辞書内の情報を削除する
ようにしたことをも特徴とする。
【0017】本発明によれば、N−グラムから単位系列
に関する登録情報が削除された結果、当該単位系列を構
成する単位について、N−グラム中にその単位を使用し
ている単位系列が1つも存在しなくなった場合には、認
識語彙辞書からその単位が削除される。このように、使
用されることのない単位が認識語彙辞書から自動的に削
除されて不要な認識対象語彙を減らすことができるた
め、認識精度を向上させることが可能となる。
【0018】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。 [第1の実施形態]図1は本発明の第1の実施形態に係
る音声認識装置の概略構成を示すブロック図である。
【0019】同図において、音声入力装置101は、例
えばマイクロホンを内蔵し、ユーザ100が発声した音
声を電気信号に変換する。音響処理部102は、音声入
力装置101により入力される音声信号からユーザ10
0の発声した音声の音響的な特徴を抽出する。音響処理
部102はまた、抽出した音響的特徴と種々の単語の読
み毎に予め用意されている音響モデルとのマッチングを
とることで、各読み毎に一致度(尤もらしさ)を表す尤
度(以下、音響的尤度と称する)を求め、その読み(読
み候補)と音響的尤度の組を音響的認識結果として、例
えば音響的尤度の高い方から(予め定められた)一定数
だけ、図9(c)に示すような形式で言語処理部103
に出力する。このような音響処理部102での処理を実
現する方法については、例えば文献『「確率モデルによ
る音声認識」中川聖一著、電子情報通信学会』に紹介さ
れているいずれの方法であっても構わない。
【0020】言語処理部103は、音響処理部102で
の音響的な認識結果と、認識語彙辞書104及びN−グ
ラムテーブル105を利用して入力音声に対する認識を
行う。認識語彙辞書104は、図1の音声認識装置が認
識対象とする語彙を保持している辞書である。認識語彙
辞書104は、図9(a)に示すように、単語の読みと
見出し情報の組の形式で構成される。
【0021】N−グラムとは、一般にN個の単位の連鎖
が出現する確率を表現するモデルである。図1の音声認
識装置で適用されるN−グラム(N−グラムテーブル)
105には、N個組の言語単位、例えばN個組の単語に
関する接続情報(単語接続情報)がテーブル形式で保持
される。この接続情報は、単語系列とその単位系列が出
現する尤もらしさを表す接続情報値、例えばその単語系
列が出現する確率(接続確率)とからなる。
【0022】N−グラム105の一例を、N=2の場合
について図9(b)に示す。ここでは、N−グラム10
5は、単語「特許」の次に単語「出願」が出現する確率
が0.1、単語「特許」の次に単語「侵害」が出現する
確率が0.2といったテーブルデータ(形式の接続情
報)で構成されている。
【0023】言語処理部103は音響処理部102から
出力される図9(c)に示したような音響的な認識結
果、即ち読み(の候補)と音響的尤度の組の各々につい
て、その読みを持つ全ての単語(見出し)を認識語彙辞
書104から求め、求めた単語数分の単語(単語候補)
と音響的尤度の組を生成する。次に言語処理部103
は、音響的な認識結果をもとに取得した単語候補のうち
のいずれが言語的に尤もらしいかを表す評価値(以下、
文法的尤度と称する)を、N−グラム105中の単語接
続情報値をもとに算出し、その値(文法的尤度)及び対
応する単語候補の音響的尤度をもとに、最終的な認識結
果(認識候補)を生成する。
【0024】単語接続情報変更部106は、例えばキー
ボード、マウス、表示器等を備えて構成される操作・表
示部107をユーザ100が操作することで当該操作・
表示部107から単語接続情報変更指示が入力された場
合に、その指示に従ってN−グラム105の内容を書き
換える。この単語接続情報変更指示は、接続情報値の変
更対象となる単語系列と変更後の接続情報値の組を含
む。
【0025】次に、図1の構成の動作について、「特許
(とっきょ)」という単語の次の入力音声を判定する処
理を例に説明する。まずユーザ100が「特許」という
単語に続いて「しんがい(侵害)」と発声したとする。
ユーザ100が発声した音声は音声入力装置101にて
電気信号に変換され、音響処理部102に渡される。音
響処理部102は、音声入力装置101により入力され
た音声信号から入力音声「しんがい」の音響的特徴を抽
出し、その音響的特徴と種々の単語の読み毎に予め用意
されている音響モデルとのマッチングをとることで、各
読み毎に音響的尤度を求め、その読み(読み候補)と音
響的尤度の組を音響的認識結果として音響的尤度の高い
方から一定数だけ言語処理部103に出力する。ここで
は、「しんらい」が0.4の尤度、「しんがい」の尤度
が0.2という音響的な認識結果が出力されたとする。
【0026】言語処理部103は、音響処理部102か
ら出力された音響的な認識結果を受け取ると、各認識結
果の読みにより認識語彙辞書104を参照して、その読
みを持つ単語(の見出し)を、入力音声に対する音響的
認識結果を表す単語候補(認識候補)として全て取得す
る。これにより、「しんらい」に対して単語候補「信
頼」が取得され、「しんがい」に対して単語候補「侵
害」が取得されたものとする。この場合、単語候補「信
頼」、「侵害」の尤度には、その読み「しんらい」、
「しんがい」の尤度(音響的尤度)がそのまま用いられ
る。なお、認識語彙辞書104の構成によっては、「し
んがい」に対して例えば「心外」なども単語候補として
取得され得るが、ここでは説明を簡略化するために「侵
害」だけが取得されるものとする。
【0027】言語処理部103は、先の「特許」という
単語(単語候補)と次の入力音声に対する認識候補(単
語候補)とからなる各単語系列のうち、いずれの単語系
列が尤もらしいかを、N−グラム105に登録されてい
る単語接続情報を利用して次のように判定する。
【0028】まず図9(b)のN−グラム105の例で
は、「特許(とっきょ)」の次に「信頼(しんらい)」
が出現する文法的尤度(接続確率)が0.002で、
「侵害(しんがい)」が出現する文法的尤度が0.2で
あることがわかる。言語処理部103は、各単語候補
(「信頼(しんらい)」、「侵害(しんがい」)につい
て、先行する単語候補(「特許(とっきょ)」)の次に
出現する文法的尤度をN−グラム105から求めると、
その単語候補の音響的尤度と当該文法的尤度とで決まる
評価値、例えば音響的尤度と文法的尤度との乗算値を、
その単語候補の総合的な尤度(総合尤度)として算出す
る。
【0029】これにより上記の例では、「特許(とっき
ょ)」の次に「信頼(しんらい)」が出現する総合尤度
は0.0008(=0.4×0.002)となり、同様
に「侵害(しんがい)」が出現する総合尤度は0.04
(=0.2×0.2)となる。この結果、言語処理部1
03は、総合尤度が最も高い単語候補「侵害(しんが
い)」を選択する。つまり、「特許」の次の語が「侵
害」という単語になることが判定される。
【0030】言語処理部103は、以上の判定処理を単
語入力について連続的に行う。なお、以上の説明では、
N−グラム105が2つの単語(認識単位)の連鎖の場
合、つまりN=2の場合についての例を示したが、Nは
3以上の任意の値でもよい。また、以上の説明では認識
単位を単語としているが、これに限るものではなく、文
字や形態素、あるいは文節であっても構わない。
【0031】ここで、「特許(とっきょ)」という単語
の次にユーザ100が「ちょう( 庁)」と発声した結
果、単語候補として「賞(しょう)」、「庁(ちょ
う)」等が得られ、これらの単語候補について、図10
に示すような音響的尤度、文法的尤度、及び総合尤度が
得られたものとする。
【0032】図10の例は、ユーザ100が「ちょう」
と発声したにも拘わらず音響的に「しょう」と誤って高
い尤度で認識された場合を示してある。ここでは、「ち
ょう」の音響的尤度が0.1であるのに対し、「しょ
う」の音響的尤度はそれより高い0.6となっている。
この結果、単語候補「賞(しょう)」の総合尤度は、そ
の文法尤度が0.02と正解語である「庁(ちょう)」
の文法尤度0.1より著しく低いにも拘わらず、0.0
12(=0.6×0.02)のように「庁(ちょう)」
の総合尤度0.01(=0.1×0.1)よりも高い値
となり、「特許庁」という正解語ではなく、「特許賞」
という誤った認識結果が第1位の認識候補として得られ
てしまう。
【0033】このような誤った認識結果が得られる要因
は、ユーザ100の「ちょう」という発声に対して行わ
れる音響処理部102での音響的認識処理で、音響的に
「しょう」と高い尤度で誤認識されることにある。しか
しシステム開始後においては、誤認識されやすい特定の
パターンを音響処理部102にて正しく認識できるよう
に、音響モデルやマッチングのアルゴリズムを、ユーザ
側の設定により、あるいはシステム側で自動的に変更す
ることは極めて困難である。
【0034】そこで本実施形態では、音響処理部102
で適用する音響モデルやマッチングのアルゴリズムにつ
いては何も変更せず、N−グラム105に登録されてい
る単語接続情報値、つまり文法的尤度(接続確率)のみ
変更可能な構成とすることで、誤って高い音響的尤度で
認識された単語(上記の例では、「特許」の次に発声さ
れた「ちょう」に対して認識された「賞(しょう)」)
の総合尤度が低くなって、上位の認識候補として選択さ
れるのを防止できるようにしている。
【0035】以下、「特許/賞」という単語組の接続情
報値(接続確率)を変更(ここでは低下)させる場合の
単語接続情報変更部106を中心とする処理の流れにつ
いて、図5のフローチャートを参照して説明する。
【0036】まずユーザ100は、操作・表示部107
上のキーボード等を用いて所定のコマンドを入力する
か、あるいは単語接続情報変更部106により操作・表
示部107の表示画面に表示されるメニューから選択す
ることによって、N−グラム105中の単語接続情報値
(接続確率)を変更するための変更モードを指定する。
これにより単語接続情報変更部106は操作・表示部1
07の表示画面に図12に示すような単語系列接続確率
変更ダイアグラム1200を表示する(ステップ50
0)。
【0037】次にユーザ100は、単語接続情報値の変
更対象となる単語系列(今回の例では「特許」と「賞」
からなる単語組)を、単語系列接続確率変更ダイアグラ
ム1200上に設けられた単語系列入力欄1201に操
作・表示部107から入力する(ステップ501)。
【0038】すると単語接続情報変更部106は、単語
系列入力欄1201に入力された単語系列によりN−グ
ラム105を参照して当該単語系列の現在の接続情報値
(接続確率)を取得し、単語系列接続確率変更ダイアグ
ラム1200上に設けられた接続情報入力欄1202に
表示する(ステップ502,503)。
【0039】ユーザ100は、接続情報入力欄1202
に表示された現在の接続情報値を参考にして、変更後の
新たな接続情報値を当該接続情報入力欄1202に入力
する(ステップ504)。この入力操作には、ユーザ1
00が操作・表示部107上のキーボードを操作して接
続情報入力欄1202に直接数値を入力する方法、ある
いは接続情報入力欄1202の端部(図12の例では右
側部)に設けられた三角状の上下ボタンをマウス等でク
リックすることによって所望の数値を指定する方法のい
ずれも適用可能である。
【0040】ユーザ100は、接続情報値の変更の実行
を要求する場合には、単語系列接続確率変更ダイアグラ
ム1200上のOKボタン1203をクリックし、そう
でなければCancelボタン1204をクリックする
(ステップ505)。単語接続情報変更部106は、O
Kボタン1203がクリックされたことを検出すると
(ステップ506)、ユーザ操作により単語系列入力欄
1201に入力された単語系列についてN−グラム10
5に登録されている接続情報値(接続確率)を、接続情
報入力欄1202に入力されたユーザ指定の値に書き換
える(ステップ507)。
【0041】このようにして、N−グラム105におけ
る単語系列「特許/賞」の接続情報値が、0.02から
0.01に変更されたものとする。すると、図10に示
した場合と同様にユーザ100が「ちょう」と発声した
ときに音響的に「しょう」と誤って高い尤度で認識され
てしまっても、今回は図11に示すように単語系列「特
許/賞(しょう)」の文法的尤度(接続情報値)が図1
0の場合よりも小さく(0.02→0.01)設定され
たことにより、総合尤度では、前回と異なって「特許/
庁(ちょう)」の方が大きな値となるため、音声認識結
果の第1候補(第1位候補)として正解語である「特許
庁」が選択されて操作・表示部107の表示画面に表示
されることになる。
【0042】[第2の実施形態]図2は本発明の第2の
実施形態に係る音声認識装置の概略構成を示すブロック
図であり、図1と同一部分には同一符号を付してある。
【0043】図2の音声認識装置が図1の音声認識装置
と異なる点は、単語接続情報変更部106に代えて、単
語候補変更部108、及び非選択単語接続情報変更部1
09が設けられていることである。
【0044】単語候補変更部108は、N個組の単語系
列のうちユーザ100が指定した範囲にある単語を含む
認識候補(単語候補)一覧を表示し、ユーザ100によ
る入力あるいは選択操作によって現在表示している候補
とは別の単語候補が指定されたとき、その指定された単
語候補と選択されなかった単語候補の情報を非選択単語
接続情報変更部109へ通知する。
【0045】非選択単語接続情報変更部109は、単語
候補変更部108から通知された選択されなかった単語
候補に関する単語系列のN−グラム105中の接続情報
値(接続確率)を予め指定された計算法に従って再計算
し変更する。
【0046】ここで、図2の構成における単語候補変更
部108及び非選択単語接続情報変更部109の動作
を、図6のフローチャートを参照して説明する。今、ユ
ーザ100が「とっきょちょう」と発声した結果、言語
処理部103により「特許賞」という誤った認識結果が
第1位の認識候補として得られ、操作・表示部107の
表示画面上に図13に示すように表示されたとものとす
る。この状態でユーザ100は、誤認識された「賞」を
正しい単語「庁」に変更するために、変更の対象とする
単語候補「賞」の範囲1300を操作・表示部107上
のカーソルキーもしくはマウス等のポインティングデバ
イスで指定することによって選択する(ステップ60
0)。
【0047】次にユーザ100はコマンドの入力あるい
はメニュー等から選択することにより、単語候補変更部
108に対し、ステップ600で指定した範囲の単語候
補(「賞」)の直前のN−1個の単語候補の系列(ここ
では1個の単語)を取得させると共に、図13に示すよ
うに、当該指定範囲の単語候補(「賞」)を含む単語候
補の一覧1303、つまりユーザ100が発声した「ち
ょう」の部分に対する認識候補の一覧1303を含むダ
イアログ(認識候補一覧ダイアログ)1301を操作・
表示部107の表示画面上に表示させる(ステップ60
1,602)。この認識候補一覧1303では、各認識
候補は例えば候補順(音響的尤度の大きい順)に並べら
れている。
【0048】ユーザ100は、認識候補一覧ダイアログ
1301が表示されると、当該ダイアログ1301上の
認識候補一覧1303に正しい単語候補が存在するなら
ば、その候補(の候補番号)をマウス等で選択し、存在
しないならば認識候補一覧ダイアログ1301上に設け
られた単語候補入力欄1302にキーボード等により正
しい単語候補を直接入力する(ステップ603)。
【0049】このユーザ100による選択操作あるいは
入力操作を受けて単語候補変更部108は、選択された
候補(あるいは入力された候補)と選択されなかった候
補(非選択候補)の一覧を非選択単語接続情報変更部1
09へ通知する(ステップ604)。
【0050】すると非選択単語接続情報変更部109
は、選択されなかった単語候補を、誤認識された単語候
補であると判断し、例えばその上位M個(M≧1)の単
語候補(非選択単語候補)X[j] (j=1〜M)の各々
について、当該単語候補とステップ601で取得した先
行するN−1個の単語候補の系列W[-N+1]W[-N+2]…W
[-1]とからなるN個の単語候補の系列W[-N+1]W[-N+2]
…W[-1]X[j] の接続情報値を低下させる一連の処理
(ステップ605〜611)を行う。
【0051】ここでは非選択単語接続情報変更部109
は、N個の単語候補の系列W[-N+1]W[-N+2]…W[-1]X
[j] によりN−グラム105を参照して、当該単語候補
系列( 単語系列)の現在の接続情報値(接続確率)Pを
取得し(ステップ608)、その接続情報値Pに一定数
n(但し0<n<1)を乗じて現在値より小さな値の新
たな接続情報値P′(=P×n)を算出する(ステップ
609)。そしてN−グラム105内の元の接続情報値
Pを新たな接続情報値P′に書き換える(ステップ61
0)。非選択単語接続情報変更部109は、以上の動作
(ステップ608〜610)を、各非選択単語候補X
[1] 〜X[M] をN番目の単語とするM個の単語系列W[-
N+1]W[-N+2]…W[-1]X[1] 〜W[-N+1]W[-N+2]…W[-
1]X[M] について繰り返す(ステップ607)。
【0052】これにより、例えば図13の認識候補一覧
ダイアログ1301の認識候補一覧1303から3番目
の候補「庁」が正しい単語候補としてユーザ100によ
り選択された場合であれば、第1位候補の「賞」、第2
位候補の「料」など、認識候補一覧1303上の「庁」
以外の認識候補(非選択単語候補)と先行する単語系列
(ここでは、単語「特許」)とからなる単語系列につい
て、N−グラム105内の対応する接続情報値が変更
(低下)させられる。即ち、nとして0.5を適用する
場合であれば、例えば現在の第1位候補である「特許/
賞」の接続情報値は、図9(b)に示す0.02から
0.01(=0.02×0.5)に変更される。更に、
第2位以下の候補、例えば「特許/料」に対しても同じ
ように適用していく。
【0053】このように本実施形態においては、ユーザ
100が明示的に単語系列の接続情報値を操作しなくて
も、誤認識された単語候補を訂正する操作を行うだけ
で、即ち誤認識された単語候補を含む認識候補一覧13
03を表示させて、その一覧1303から正しい単語候
補を選択する、あるいは正しい単語候補を入力するだけ
で、N−グラム105上の非選択単語候補をN番目とす
る単語系列の接続情報値を適切に調整することができ
る。
【0054】なお、以上の説明では、接続情報値を低下
させるのに、現在値Pに1未満の一定値nを乗ずる方法
を適用したが、これに限るものではない。例えば、現在
値Pから一定値を減ずるようにしても構わない。
【0055】[第3の実施形態]図3は本発明の第3の
実施形態に係る音声認識装置の概略構成を示すブロック
図であり、図1または図2と同一部分には同一符号を付
してある。
【0056】図3の音声認識装置が図1の音声認識装置
と異なる点は、図2の音声認識装置で適用された単語候
補変更部108及び非選択単語接続情報変更部109に
加えて、単語系列項目削除部110が、新たに設けられ
ていることである。
【0057】単語系列項目削除部110は、単語接続情
報変更部106あるいは非選択単語接続情報変更部10
9によりN−グラム105内の接続情報値が変更された
場合に、例えばその変更通知を受けることで起動され
る。この場合、単語系列項目削除部110は、変更後の
単語系列の接続情報値を閾値と比較し、当該閾値を下回
っているときは、その単語系列に関する項目データ(エ
ントリデータ)をN−グラム105から削除する。この
閾値は、予めシステムで決められた値、ユーザが指定し
た値、あるいはN−グラム105中の接続情報値の分布
から算出された値のいずれであってもよい。
【0058】ここで、図3の構成における単語系列項目
削除部110を中心とする動作を、図7のフローチャー
トを参照して説明する。まず、単語系列項目削除部11
0での単語系列項目削除の基準となる接続情報値の閾値
Vthが、予めシステムで0.001であると定められて
いるとする。
【0059】このような状態で、前記第1の実施形態で
述べたように単語接続情報変更部106により、あるい
は前記第2の実施形態で述べたように非選択単語接続情
報変更部109により、例えば「特許/賞」という単語
系列の接続情報値(接続確率)が、図14(a)に示す
0.002から、同図(b)に示すように0.0005
に変更されたものとする(ステップ700)。この場
合、単語接続情報変更部106または非選択単語接続情
報変更部109から単語系列項目削除部110に対し
て、単語系列「特許/賞」の接続情報値が変更された旨
が通知される。
【0060】すると単語系列項目削除部110はN−グ
ラム105を参照して、通知された「特許/賞」という
単語系列の新たな接続情報値P(ここでは0.000
5)を取得し、その値Pが閾値Vth(=0.001)を
下回っているか否かをチェックする(ステップ70
1)。この例では、単語系列「特許/賞」の新たな接続
情報値P(=0.0005)は閾値Vth(=0.00
1)を下回っていることから、単語系列項目削除部11
0は、図14(b)に示すN−グラム105から「特許
/賞」という単語系列に関する項目データを削除する
(ステップ702)。これによりN−グラム105は、
図14(c)のようになる。
【0061】[第4の実施形態]図4は本発明の第4の
実施形態に係る音声認識装置の概略構成を示すブロック
図であり、図3と同一部分には同一符号を付してある。
【0062】図4の音声認識装置が図3の音声認識装置
と異なる点は、辞書単語削除部111が新たに設けられ
ていることである。辞書単語削除部111は、単語系列
項目削除部110によりN−グラム105中の単語系列
に関する項目データが削除された場合に、例えばその削
除通知を受けることで起動される。この場合、辞書単語
削除部111は、単語系列項目削除部110から通知さ
れた単語系列の情報をもとにN−グラム105全体を調
べ、当該単語系列中に含まれている各単語について、そ
の単語がN−グラム105中に1つもないときにその単
語を認識語彙辞書104から削除する。なお、辞書単語
削除部111が起動されるタイミングは非選択単語接続
情報変更部109から削除通知を受けた直後である必要
はなく、システム全体の終了時やシステムのアイドリン
グ時であっても構わない。
【0063】ここで、図4の構成における辞書単語削除
部111を中心とする動作を、図8のフローチャートを
参照して説明する。まず、前記第3の実施形態で述べた
ように、単語系列項目削除部110により図15(a)
に示すN−グラム105から例えば「特許/賞」という
単語系列の項目データが削除され、その結果、N−グラ
ム105の内容は図15(b)のようになったものとす
る(ステップ800)。この場合、単語系列項目削除部
110から辞書単語削除部111に対して、単語系列
「特許/賞」の項目データが削除された旨が通知され
る。
【0064】単語系列項目削除部110は、この項目デ
ータの削除通知を受け取ると直ちに、あるいはシステム
全体の終了時やシステムのアイドリング時に、N−グラ
ム105全体を調べ、単語系列項目削除部110から通
知された単語系列中に含まれている単語がN−グラム1
05中に1つもないときにその単語を認識語彙辞書10
4から削除する一連の処理(ステップ801〜808)
を行う。本実施形態のように、「特許/賞」という単語
系列に関する項目データが削除された場合であれば、そ
の結果として、N−グラム105中に「特許」または
「賞」という単語を含む単語系列が1つも存在しなくな
ったことが検出されたならば(ステップ804〜80
6)、辞書単語削除部111は認識語彙辞書104中の
当該単語「特許」または「賞」の項目データ(エントリ
データ)を削除する(ステップ808)。
【0065】図15(b)の例では、N−グラム105
中に「賞」という単語を含む単語系列が1つも存在しな
いものとすると、図15(c)に示す内容の認識語彙辞
書104から、「賞」という単語に関する項目データが
辞書単語削除部111によって削除される。これにより
認識語彙辞書104は、図15(d)のようになる。
【0066】なお、以上に述べた図1乃至図4の構成の
音声認識装置の処理手順、特に単語接続情報変更部10
6、単語候補変更部108、非選択単語接続情報変更部
109、単語系列項目削除部110、及び辞書単語削除
部111の処理手順は、当該処理手順をコンピュータに
実行させるためのプログラムを記録した、CD−RO
M、フロッピーディスク、メモリカード等の記録媒体を
当該コンピュータに装着して、当該記録媒体に記録され
ているプログラムをコンピュータで読み取り実行させる
ことによっても実現される。また、プログラムを記録し
た記録媒体の内容が、通信回線等を介してコンピュータ
にダウンロードされるものであっても構わない。
【0067】
【発明の効果】以上詳述したように本発明によれば、音
声認識処理で参照するN−グラム中の(接続確率等の)
接続情報値を、ユーザからの指示により変更することが
できるため、誤認識されやすい単位系列についての接続
情報値を変更させることで、認識率を向上させることが
できる。
【0068】また本発明によれば、ユーザによる認識候
補訂正操作の過程で、訂正後の正しい候補を除く各候補
を最終位置に持つN−グラム中の単位系列の接続情報値
を自動的に変更することができるため、ユーザに負担を
かけることなく認識率を向上させることができる。
【0069】また、本発明によれば、変更後の接続情報
値が閾値以下となった結果、ユーザが殆ど使用しないと
いう事実が判明した段階で、N−グラム中から該当する
単位系列に関する項目を自動的に削除することにより、
認識実行時のメモリ消費を低く抑えることができ、更に
処理も高速化することができる。
【0070】また、本発明によれば、N−グラム中から
単位系列を削除していく過程で、その単位系列を構成す
る単位が、N−グラム中のいずれの単位系列中にも含ま
れなくなった段階で、認識語彙辞書から該当する単位を
自動的に削除することにより、不要な認識対象語彙を減
らして認識精度を向上させることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る音声認識装置の
概略構成を示すブロック図。
【図2】本発明の第2の実施形態に係る音声認識装置の
概略構成を示すブロック図。
【図3】本発明の第3の実施形態に係る音声認識装置の
概略構成を示すブロック図。
【図4】本発明の第4の実施形態に係る音声認識装置の
概略構成を示すブロック図。
【図5】図1の構成における単語接続情報変更部106
を中心とする動作を説明するためのフローチャート。
【図6】図2の構成における単語候補変更部108及び
非選択単語接続情報変更部109の動作を説明するため
のフローチャート。
【図7】図3の構成における単語系列項目削除部110
を中心とする動作を説明するためのフローチャート。
【図8】図4中の単語系列項の構成における辞書単語削
除部111を中心とする動作を説明するためのフローチ
ャート。
【図9】認識語彙辞書104及びN−グラム105のデ
ータ登録内容例と音響的な認識結果の一例を示す図。
【図10】「とっきょちょう」と発声した場合の音声認
識結果の一例を示す図。
【図11】「特許/賞」の単語接続情報値を変更した後
において「とっきょちょう」と発声した場合の音声認識
結果の一例を示す図。
【図12】「特許/賞」という単語系列の接続情報値
(接続確率)を変更するために表示された単語系列接続
確率変更ダイアグラムの一例を示す図。
【図13】「特許/賞」という認識結果の「賞」の部分
を変更するために表示された認識候補一覧ダイアログの
一例を示す図。
【図14】「特許/賞」という単語系列の接続情報がN
−グラム105から削除される様子を示す図。
【図15】「特許/賞」という単語系列の接続情報がN
−グラム105から削除されることにより、「賞」とい
う単語の情報が認識語彙辞書104から削除される様子
を示す図。
【符号の説明】
101…音声入力装置 102…音響処理部 103…言語処理部 104…認識語彙辞書 105…N−グラム 106…単語接続情報変更部(単位接続情報変更手段) 107…操作・表示部(入力操作手段) 108…単語候補変更部(候補変更手段) 109…非選択単語接続情報変更部(非選択候補接続情
報変更手段) 110…単語系列項目削除部 111…辞書単語削除部 1200…単語系列接続確率変更ダイアグラム 1201…単語系列入力欄(第1の入力欄) 1202…接続情報入力欄(第2の入力欄) 1301…認識候補一覧ダイアログ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 福永 幸弘 東京都港区新橋3丁目3番9号 東芝エ ー・ブイ・イー株式会社内 Fターム(参考) 5D015 HH04 LL01

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 入力音声から音響的特徴を抽出して音響
    モデルとのマッチングをとることで所定の認識単位で読
    みの候補を当該読みの尤もらしさを表す音響的尤度と共
    に求めて、その音響的尤度が上位の複数個の読み候補に
    ついて認識語彙辞書を参照することで該当する文字また
    は文字列からなる認識候補を取得し、N個(Nは2以上
    の整数)の言語単位の連鎖からなる種々の単位系列毎に
    その単位系列が出現する尤もらしさを表す接続情報値が
    登録されたN−グラムを、前記取得した認識単位の各認
    識候補と先行するN−1個の認識単位の各認識候補との
    連鎖からなり、それぞれ当該取得した認識単位の各認識
    候補を最終位置の言語単位とするN個の認識候補により
    構成される各単位系列について参照することで、当該単
    位系列の接続情報値を取得して、当該単位系列中の最終
    位置の認識候補の音響的尤度と前記取得した接続情報値
    をもとに最終的な認識候補を決定する音声認識方法であ
    って、 前記N−グラムに登録されている接続情報値を変更する
    ための変更モードにおいて、ユーザの指定する単位系列
    及び当該単位系列の接続情報値の入力を受け付け、 受け付けた単位系列に対応して前記N−グラムに登録さ
    れている接続情報値を、当該単位系列と共に受け付けた
    接続情報値に変更するようにしたことを特徴とする音声
    認識方法。
  2. 【請求項2】 前記接続情報値の変更モードが指定され
    た場合、ユーザ指定の単位系列の入力を受け付けて設定
    するための第1の入力欄及びユーザ指定の接続情報値の
    入力を受け付けて設定するための第2の入力欄を有する
    入力画面を表示し、 前記第1の入力欄にユーザ指定の単位系列が設定された
    場合、当該設定された単位系列に対応して前記N−グラ
    ムに登録されている接続情報値を取得して前記第2の入
    力欄にユーザからの指定に応じて変更可能なように設定
    し、 前記変更モードにおいて、ユーザからの接続情報値変更
    の指示を受け付け、当該指示を受け付けた場合には、そ
    の時点において前記第1の入力欄に設定されている単位
    系列に対応して前記N−グラムに登録されている接続情
    報値を、前記第2の入力欄に設定されている接続情報値
    に変更するようにしたことを特徴とする請求項1載の音
    声認識方法。
  3. 【請求項3】 入力音声から音響的特徴を抽出して音響
    モデルとのマッチングをとることで所定の認識単位で読
    みの候補を当該読みの尤もらしさを表す音響的尤度と共
    に求めて、その音響的尤度が上位の複数個の読み候補に
    ついて認識語彙辞書を参照することで該当する文字また
    は文字列からなる認識候補を取得し、N個(Nは2以上
    の整数)の言語単位の連鎖からなる種々の単位系列毎に
    その単位系列が出現する尤もらしさを表す接続情報値が
    登録されたN−グラムを、前記取得した認識単位の各認
    識候補と先行するN−1個の認識単位の各認識候補との
    連鎖からなり、それぞれ当該取得した認識単位の各認識
    候補を最終位置の言語単位とするN個の認識候補により
    構成される各単位系列について参照することで、当該単
    位系列の接続情報値を取得して、当該単位系列中の最終
    位置の認識候補の音響的尤度と前記取得した接続情報値
    をもとに最終的な認識候補を決定する音声認識方法であ
    って、 前記決定した各認識単位毎の認識候補からなる単位系列
    を表示して、ユーザの入力操作に従う訂正の対象となる
    認識候補の指定を受け付け、 受け付けた認識候補を含む認識候補の一覧を表示して、
    ユーザの指定する当該認識候補に対する訂正後の認識候
    補の入力を受け付け、 受け付けた認識候補を除く前記認識候補一覧中の各認識
    候補を最終位置の言語単位とする単位系列に対応して前
    記N−グラムにそれぞれ登録されている接続情報値を現
    在値より値が小さくなる方向に自動的に変更するように
    したことを特徴とする音声認識方法。
  4. 【請求項4】 前記N−グラムに登録されている接続情
    報値を変更した場合に、当該接続情報値が予め定められ
    た閾値を下回っているか否かを調べ、 下回っているときは、当該接続情報値を含む対応する単
    位系列に関する登録情報を前記N−グラムから削除する
    ことを特徴とする請求項1または請求項3記載の音声認
    識方法。
  5. 【請求項5】 前記N−グラムから前記単位系列に関す
    る登録情報を削除した場合に、当該単位系列中の各単位
    毎に、当該単位を含む単位系列が前記N−グラムに少な
    くとも1つ登録されているか否かを調べ、 前記N−グラム中に存在しない単位を検出した場合に
    は、その検出した単位に関する前記認識語彙辞書内の情
    報を削除することを特徴とする請求項4記載の音声認識
    方法。
  6. 【請求項6】 ユーザの発声した音声を入力する音声入
    力手段と、前記音声入力手段により入力された音声の音
    響的特徴を抽出して音響モデルとのマッチングをとるこ
    とで所定の認識単位で読みの候補を当該読みの尤もらし
    さを表す音響的尤度と共に求める音響処理手段と、前記
    音響処理手段により求められた前記音響的尤度が上位の
    複数個の読み候補について認識語彙辞書を参照すること
    で該当する文字または文字列からなる認識候補を取得
    し、N個(Nは2以上の整数)の言語単位の連鎖からな
    る種々の単位系列毎にその単位系列が出現する尤もらし
    さを表す接続情報値が登録されたN−グラムを、前記取
    得した認識単位の各認識候補と先行するN−1個の認識
    単位の各認識候補との連鎖からなり、それぞれ当該取得
    した認識単位の各認識候補を最終位置の言語単位とする
    N個の認識候補により構成される各単位系列について参
    照することで、当該単位系列の接続情報値を取得して、
    当該単位系列中の最終位置の認識候補の音響的尤度と前
    記取得した接続情報値をもとに最終的な認識候補を決定
    する言語処理手段とを備えた音声認識装置において、 前記N−グラムに登録されている接続情報値を変更する
    ための変更モードにおける単位系列及び当該単位系列の
    接続情報値の入力を含む入力操作に用いられる入力操作
    手段と、 前記変更モードにおいて前記入力操作手段により前記単
    位系列及び接続情報値が入力された場合、当該入力され
    た単位系列に対応して前記N−グラムに登録されている
    接続情報値を、当該単位系列と共に入力された接続情報
    値に変更する単位接続情報変更手段とを具備することを
    特徴とする音声認識装置。
  7. 【請求項7】 ユーザの発声した音声を入力する音声入
    力手段と、前記音声入力手段により入力された音声の音
    響的特徴を抽出して音響モデルとのマッチングをとるこ
    とで所定の認識単位で読みの候補を当該読みの尤もらし
    さを表す音響的尤度と共に求める音響処理手段と、前記
    音響処理手段により求められた前記音響的尤度が上位の
    複数個の読み候補について認識語彙辞書を参照すること
    で該当する文字または文字列からなる認識候補を取得
    し、N個(Nは2以上の整数)の言語単位の連鎖からな
    る種々の単位系列毎にその単位系列が出現する尤もらし
    さを表す接続情報値が登録されたN−グラムを、前記取
    得した認識単位の各認識候補と先行するN−1個の認識
    単位の各認識候補との連鎖からなり、それぞれ当該取得
    した認識単位の各認識候補を最終位置の言語単位とする
    N個の認識候補により構成される各単位系列について参
    照することで、当該単位系列の接続情報値を取得して、
    当該単位系列中の最終位置の認識候補の音響的尤度と前
    記取得した接続情報値をもとに最終的な認識候補を決定
    する言語処理手段とを備えた音声認識装置において、 前記言語処理手段により決定された認識候補の単位系列
    を表示して、ユーザの入力操作に従う訂正の対象となる
    言語単位の認識候補の指定を受け付け、受け付けた認識
    候補を含む認識候補の一覧を表示して、ユーザの指定す
    る当該認識候補に対する訂正後の認識候補の入力を受け
    付けることで、前記決定した認識候補の単位系列中の指
    定候補を変更する候補変更手段と、 前記訂正の対象となる認識候補の指定及び訂正後の認識
    候補の入力を含む入力操作に用いられる入力操作手段
    と、 前記候補変更手段による認識候補変更に応じて、変更後
    の認識候補を除く前記認識候補一覧中の各認識候補を最
    終位置の言語単位とする単位系列に対応して前記N−グ
    ラムにそれぞれ登録されている接続情報値を現在値より
    値が小さくなる方向に変更する非選択候補接続情報変更
    手段とを具備することを特徴とする音声認識装置。
JP10177317A 1998-06-24 1998-06-24 音声認識方法及び装置 Pending JP2000010588A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10177317A JP2000010588A (ja) 1998-06-24 1998-06-24 音声認識方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10177317A JP2000010588A (ja) 1998-06-24 1998-06-24 音声認識方法及び装置

Publications (1)

Publication Number Publication Date
JP2000010588A true JP2000010588A (ja) 2000-01-14

Family

ID=16028879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10177317A Pending JP2000010588A (ja) 1998-06-24 1998-06-24 音声認識方法及び装置

Country Status (1)

Country Link
JP (1) JP2000010588A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002116854A (ja) * 2000-10-11 2002-04-19 Canon Inc 情報入力装置、情報入力方法及び記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002116854A (ja) * 2000-10-11 2002-04-19 Canon Inc 情報入力装置、情報入力方法及び記憶媒体

Similar Documents

Publication Publication Date Title
US6363347B1 (en) Method and system for displaying a variable number of alternative words during speech recognition
EP0840288B1 (en) Method and system for editing phrases during continuous speech recognition
KR101109265B1 (ko) 텍스트 입력 방법
EP0840289B1 (en) Method and system for selecting alternative words during speech recognition
EP0965979B1 (en) Position manipulation in speech recognition
US7848926B2 (en) System, method, and program for correcting misrecognized spoken words by selecting appropriate correction word from one or more competitive words
TWI266280B (en) Multimodal disambiguation of speech recognition
JP3414735B2 (ja) 複合ワードを有する言語のための音声認識装置
JP3333123B2 (ja) 音声認識中に認識されたワードをバッファする方法及びシステム
EP0965978A1 (en) Non-interactive enrollment in speech recognition
JP2002258890A (ja) 音声認識装置、コンピュータ・システム、音声認識方法、プログラムおよび記録媒体
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
JP2002116796A (ja) 音声処理装置、音声処理方法及び記憶媒体
JP2007041319A (ja) 音声認識装置および音声認識方法
US6963834B2 (en) Method of speech recognition using empirically determined word candidates
JP3104661B2 (ja) 日本語文章作成装置
JP3795692B2 (ja) 文字処理装置および方法
JP2006189730A (ja) 音声対話方法および音声対話装置
EP0840287A2 (en) Method and system for selecting recognized words when correcting recognized speech
KR101250897B1 (ko) 전자사전에서 음성인식을 이용한 단어 탐색 장치 및 그 방법
JP4220151B2 (ja) 音声対話装置
JP2000056795A (ja) 音声認識装置
JP2000010588A (ja) 音声認識方法及び装置
JP4012228B2 (ja) 情報入力方法、情報入力装置及び記憶媒体

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060303

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060526

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060815