JP3252815B2

JP3252815B2 - 連続音声認識装置及び方法

Info

Publication number: JP3252815B2
Application number: JP34515398A
Authority: JP
Inventors: 孝友枝
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1998-12-04
Filing date: 1998-12-04
Publication date: 2002-02-04
Anticipated expiration: 2018-12-04
Also published as: US6484141B1; JP2000172293A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、連続音声認識装置
及び方法に関し、特に認識の速度と精度の向上を図る連
続音声認識装置及び方法に関する。

【０００２】

【従来の技術】従来の連続音声認識装置の一例として、
アイシーエスエルピー１９９６(ICSLP1996)に掲載され
た、S・オルトマン(S.Ortmanns)による、ランゲージモ
デル・ルックアヘッド・フォー・ラージ・ボキャブラリ
ー・スピーチ・レコグニション(LANGUAGE-MODEL LOOK-
AHEAD FOR LARGE VOCABULARY SPEECH RECOGNITIO
N)と題された論文が参照される。

【０００３】図５を参照すると、従来の音声認識装置
は、仮説記憶部１と、仮説展開部３と、木構造辞書記憶
部４と、言語モデル部７と、音響モデル部８と、を備え
て構成されている。従来の音声認識装置は次のように動
作する。

【０００４】仮説記憶部１は、仮説を記憶し、木構造辞
書記憶部４は、認識対象となる単語を木構造辞書(図２
参照)として記憶し、音響モデル部８は、各フレ−ム毎
の音響モデルスコアを計算し、言語モデル部７は、言語
モデルスコアを計算する。

【０００５】仮説展開部３は、各フレ−ムで、音響モデ
ル部８からの音響モデルスコアと言語モデル部７からの
言語モデルスコアを考慮して、木構造辞書記憶部４から
ア−クの構造を取得し、ア−ク上にある仮説を後続ア−
クへと展開する。図２を参照すると、木構造辞書におい
ては、ルート（根）からツリー構造で分岐する各アーク
をリーフ（終端アーク）まで辿ることで単語に到る構造
とされている。

【０００６】認識対象となる音声を、所定期間の短時間
フレームに分割し、音声始端フレームから音声終端フレ
ームまで、上記の展開（すなわち木構造辞書のア−ク上
にある仮説を後続ア−クへの展開）を繰り返し、最終的
に最もスコアのよい仮説が過去に通った単語(木構造辞
書の終端)を、認識結果とする。

【０００７】ここで、仮説とは、木構造辞書上のアーク
の位置情報と、そこへ至るまでの履歴とスコアを有す
る。

【０００８】複数の単語を一つの木構造辞書(図２参照)
として表した連続音声認識方式では、終端アーク以外で
は、現在仮説が展開されている単語が何であるかを特定
できない。

【０００９】そのため、音響モデルスコアは毎フレーム
毎に計算されるが、本来、言語モデルスコアは、仮説が
木構造辞書の終端アークに到達した時にしかかけられな
い。

【００１０】そこで、なるべく早く言語モデルスコアを
加算するために、ユニグラム言語モデルスコアの先読み
と、バイグラム言語モデルスコアの先読みという方法
が、上記文献に記載されている。

【００１１】ユニグラム言語モデルスコアの先読みと
は、木構造辞書中の終端アークで確定する単語のユニグ
ラム言語モデルスコアのうち、最もスコアの良いものを
前のアークに付与し、該アーク上に存在する仮説の言語
モデルスコアとして、一時的に、該アークに付与された
ユニグラム言語モデルスコアを加算しておき、仮説が木
構造辞書の終端アークに到達して単語が確定した時に、
それまで使用していたユニグラム言語モデルスコアを捨
て、確定したバイグラム言語モデルスコアを加算する、
というものである。

【００１２】一方、バイグラム言語モデルスコアの先読
みとは、コンテクストが決定し、新しい木構造辞書が作
成される際に、コンテクストに対する全ての単語につい
てのバイグラム言語モデルスコアを計算し、最も良いス
コアを有する言語モデルスコアを木構造辞書中の前の方
のアークに付与して、あるアーク上に存在する仮説の言
語モデルスコアとして、該アーク上に付与されたバイグ
ラム言語モデルスコアを加算する、というものである。

【００１３】

【発明が解決しようとする課題】しかしながら、従来の
音声認識方式は、下記記載の問題点を有している。

【００１４】第一の問題点は、バイグラム言語モデルス
コアの先読みを行った場合、膨大なメモリと計算量が必
要とされる、ということである。

【００１５】その理由は、バイグラム言語モデルスコア
の先読みを行う場合、新しくコンテクストが発生して木
構造辞書が作成される際に、木構造辞書の一部ではな
く、木構造辞書の全体を作成し、コンテクストに対する
全てのバイグラム言語モデルスコアを計算し、単語の確
定する木構造辞書中の全ての終端アークの言語モデルス
コアを前のアークに付与する、という処理を繰り返し、
全ての前のアークに言語モデルスコアを伝播させなくて
はならないため、である。

【００１６】第二の問題点は、ユニグラム言語モデルス
コアの先読みを行った場合、無駄な計算を行ってしま
う、ということである。

【００１７】その理由は、ユニグラム言語モデルスコア
の先読みを行う場合、木構造辞書のアーク中には、コン
テクストに言語的に接続が許されない単語にしか発展し
ないものも存在し、仮説がそのようなアークにも展開さ
れてしまうため、無駄な計算を行ってしまうためであ
る。

【００１８】第三の問題点は以下の通りである。フレー
ム同期ビームサーチ(このフレーム同期ビームサーチに
ついては、例えばアイトリプルイー・トランザクション
ズ・オン・シグナル・プロセッシング１９９２年２月掲
載(IEEE TRANSACTIONS ON SIGNAL PROCESSING FEBRUARY
1992)の、ヘルマン・ネイ(Hermann Ney)による、「デ
ータドリブンサーチオーガナイゼーションフォー
コンティニュアススピーチリコグニション(Data Driv
en Search Organization for Continuous Speech Recog
nition)」と題する論文等の記載が参照される)を用い
て、厳密なバイグラム以上の言語モデルスコアの先読み
を行わなかった場合、すなわちコンテクストと木構造辞
書中の単語との言語的制約による接続可能性が先読みさ
れなかった場合、第二の問題点で説明したように、言語
的にコンテクストに接続が許されない単語に発展するア
ーク上にも仮説は展開される。

【００１９】そして、この仮説のスコアが他のものより
非常に良かった場合、言語的にコンテクストと接続が許
される単語に発展するアーク上の仮説が、全てビームか
ら外れて除去されてしまうということがある。

【００２０】この結果、コンテクストに言語的に接続が
許されない後続単語しか持たないアーク上（図２の１１
参照）にのみ仮説が存在し、これらの仮説が展開されて
単語が確定した際に、言語的にコンテクストとの接続が
許されないために、ビームから外れることとなる。

【００２１】このため、以後のフレームにおいて、決し
て次の単語に接続できず、これ以降に発声された音声に
対する認識処理が不可能となる。つまり、認識処理を行
うことができなくなり、認識結果を出力することができ
なくなってしまう。

【００２２】したがって本発明では、上記問題点に鑑み
てなされたものであって、その主たる目的は、連続音声
認識の認識速度と認識率を向上する連続音声認識装置及
び方法を提供することにある。

【００２３】

【課題を解決するための手段】前記目的を達成する本発
明の連続音声認識装置は、仮説を記憶する仮説記憶部
と、仮説を後続アークに展開してもよいか否かを判断す
る仮説展開判断手段と、仮説を展開し展開結果で前記仮
説記憶部に記憶させる仮説展開手段と、木構造辞書及び
その先行コンテクストを保持する木構造辞書記憶部と、
前記木構造辞書中の各ア−クにおいて、該アークよりも
後に存在する全ての後続単語について品詞の有無の情報
を記憶する後続単語品詞情報記憶部と、品詞同士の接続
情報を記憶する品詞接続情報記憶部と、仮説に言語モデ
ルスコアを付与する手段と、仮説に音響モデルスコアを
付与する手段とを備える。

【００２４】

【発明の実施の形態】本発明の実施の形態について以下
に説明する。本発明の連続音声認識装置は、その好まし
い実施の形態において、木構造辞書中の各アークに、該
アークの全ての後続単語の品詞情報を保持する後続単語
品詞情報記憶手段と、木構造辞書のコンテクストと各ア
−クの後続単語との接続が可能かどうかを判断し、判断
結果によって、仮説を展開するか否かを判断して仮説展
開手段に指示する仮説展開判断手段と、を備え、仮説展
開手段では、仮説展開判断手段からの展開指示を受け、
音響モデルスコアと言語モデルスコアを考慮して、木構
造辞書記憶部からア−クの構造を取得し、該ア−ク上に
ある仮説を後続ア−クへと展開し展開結果を仮説記憶部
に記憶させる。

【００２５】本発明の実施の形態においては、コンテク
ストと（言語的に）接続しない単語へのアークには仮説
が展開されないように抑制し、不必要に仮説数を増加さ
せないため、連続音声認識の速度を向上する。また言語
的に接続しない単語への仮説のスコアが他のスコアに比
べて良い、という状況を発生させないようにしたため、
連続音声認識の認識率を向上している。

【００２６】

【実施例】本発明の実施例について図面を参照して詳細
に説明する。図１は、本発明の一実施例の構成を示す図
であり、フレーム同期ビームサーチを用いた連続音声認
識装置の構成を示す図である。以下の説明では、フレ−
ム同期ビ−ムサ−チにおける１フレ−ム分の仮説の展開
の動作のみを示す。その他の動作はフレ−ム同期ビ−ム
サ−チに従うものとする。

【００２７】図１を参照すると、仮説記憶部１は、連続
音声認識のサ−チにおける仮説を記憶する。木構造辞書
記憶部４は、コンテクストと、認識対象とする全ての単
語を木構造辞書(図２参照)として記憶する。木構造辞書
は、コンテクスト毎に別々に記憶される。

【００２８】後続単語品詞情報記憶部５は、木構造辞書
の各ア−クの全ての後続単語の品詞情報を記憶する。品
詞情報の記憶の仕方として、例えば、品詞の出現頻度順
に、後続にその品詞が存在する(１)／存在しない(０)と
いうビット列として記憶するようにしてもよい。品詞が
256種類あるなら、各アークに対して256ビット記憶容量
が必要となる。なお、後続単語品詞情報は、全てのアー
クについて記憶する必要はない。

【００２９】後続単語品詞情報は、図２において１２で
示すような、分岐直後のアークについてのみ記憶すれば
よい。なぜなら、分岐直後でないアークは、その直前の
アークと全く同じ後続単語品詞情報をもつはずだからで
ある。

【００３０】このように、後続単語品詞情報記憶部５
に、分岐直後のアークについての後続単語品詞情報のみ
を記憶することによって、必要なメモリ量を削減するこ
とができる。

【００３１】木構造辞書の各アークの後続単語品詞情報
は、認識処理を実行する前に一度だけ作成して記憶して
おくだけでよい。なぜなら、認識処理実行時には、アー
クの後続単語が増加したり、減少したり、変化すること
はないからである。

【００３２】また、単語の追加登録を行い、木構造辞書
に単語が追加されたときにも、各アークの後続単語品詞
情報は、一度だけ作成し直して記憶しておくだけでよ
い。

【００３３】これに比べ、バイグラムの先読みをする場
合には、コンテクストが決まり木構造辞書が生成される
度に、コンテクストに対する全てのバイグラム言語モデ
ルの計算と前のアークへの言語モデルスコアの付与の伝
播を行なわなくてはならないため、膨大な計算量が必要
となる。

【００３４】後続単語品詞情報は、コンテクスト毎に別
々に記憶される木構造辞書とは異なり、各アークについ
て一つずつ記憶しておくだけでよい。

【００３５】木構造辞書上の各アークについての後続単
語品詞情報が必要となったときには、一つだけ記憶され
ている当該アークについての後続単語品詞情報を参照す
ればよいからである。

【００３６】バイグラムの先読みをする場合、全ての木
構造辞書に対して、各アークにバイグラム言語モデルス
コアを記憶することが必要とされているため、膨大な容
量のメモリが必要となるが、本発明の一実施例では、一
つ分の木構造辞書に対して、品詞の数だけのビット列を
記憶させるだけであるため、必要なメモリ容量が大幅に
削減される。

【００３７】品詞の出現頻度が、高い順に、“助詞”、
“名詞”、“動詞”、“形容詞”である場合、後続単語
の品詞情報の第１ビットが助詞がある(１)／ない(０)、
第２ビットが名詞がある(１)／ない(０)、・・・、等と
いう順序のビット列が記憶される。

【００３８】なお、後続単語品詞情報は、必ずしも品詞
の出現頻度順に記憶する必要はないが、以下では、出現
頻度順に記憶した場合について説明する。

【００３９】図３は、品詞の出現頻度が高い順に、助
詞、名詞、動詞、形容詞となる場合の、あるア−クの後
続単語に、“助詞”、“名詞”、“形容詞”があり、
“動詞”がないとしたときの、後続単語品詞情報のビッ
ト列の例を示す図である。

【００４０】品詞接続情報記憶部６は、各品詞毎にその
右側に接続が可能な全ての品詞の情報を記憶する。品詞
情報の記憶の仕方としては、例えば、後続単語品詞情報
記憶部５と同様に、品詞の出現頻度の高い順に、接続可
能(１)／接続不可能(０)というビット列として記憶す
る。

【００４１】図４は、品詞の出現頻度が、高い順に、
“助詞”、“名詞”、“動詞”、“形容詞”となる場合
の“助詞”の右側に、“助詞”、“動詞”が接続し、
“名詞”、“形容詞”が接続しないとしたときの、“助
詞”の品詞接続情報ビット列の例を示す図である。

【００４２】仮説展開判断部２は、木構造辞書記憶部４
から、ある仮説の存在する木構造辞書のコンテクストを
受け取り、後続単語品詞情報記憶部５から、該仮説を有
するア−クの直後のア−クの後続単語品詞情報を受け取
り、品詞接続情報記憶部６から、先に受け取ったコンテ
クストが属する品詞の右側に接続可能な品詞接続情報を
受け取り、後続単語品詞情報と品詞接続情報から、該仮
説を後続ア−クに展開してもよいかどうかを判断する。

【００４３】後続単語品詞情報と品詞接続情報が、それ
ぞれ図３、図４に示すようなものである場合、その仮説
を後続ア−クに展開しても良いかどうかの判断は、図３
に示すビット列と、図４に示すビット列とのビット単位
での論理積（ＡＮＤ）をとり、その演算結果が“０”で
あるかどうかを調べればよい。

【００４４】演算結果が“０”でなければ、これは、後
続ア−クへ仮説を展開してもよい、ということを意味
し、演算結果が“０”である場合、後続ア−クへ仮説を
展開してはならない、ということを意味する。

【００４５】その理由は、品詞接続情報のＮ番目(Ｎは
０以上の整数)のビットが“１”のとき、後続単語品詞
情報のＮ番目のビットが“１”のときにのみ、接続の許
された品詞の単語が、そのアークの後ろに存在するとい
うことを意味し、論理積が、“０”とならないからであ
る。

【００４６】例えば、品詞が全部で２５６個に分類され
ており、計算機が３２ビットのＣＰＵを持つなら、全て
の後続単語品詞情報と品詞接続情報の論理積をとるため
には、２５６／３２＝８回の演算が必要となる。

【００４７】これに対して、品詞の記憶する順序を、品
詞の出現頻度の高い順にしておくことによって、論理積
が“０”でない結果を得るための演算回数の期待値を、
８以下に抑えることができる。

【００４８】このように、品詞の出現頻度の高い順序
で、後続単語品詞情報と、品詞接続情報とを記憶してお
くことは高速化に寄与する。なお、品詞の出現頻度の高
い順序以外の順序で、後続単語品詞情報と品詞接続情報
を記憶しておき、互いに対応する品詞同士の接続チェッ
クを行うようにしてもよいことは勿論である。

【００４９】なお、仮説の属するア−クの直後のア−ク
に既に仮説が展開されている場合には、過去において接
続が可能と判断されたはずであるため、無条件にその後
続ア−クに仮説を展開してもよい。

【００５０】上記した判定基準により、仮説展開判断部
２は、後続ア−クへの仮説の展開の可／不可を仮説展開
部に指示する。

【００５１】仮説展開部３は、仮説展開判断部２から、
後続ア−クへの仮説の展開の指示を受け、言語モデル部
７及び音響モデル部８から与えられたスコアを考慮し
て、木構造辞書記憶部４から後続アークへのアークの構
造を取得し、仮説を展開してもよいア−クへのみ、フレ
−ム同期ビ−ムサ−チに従って仮説を展開する。なお、
自分自身のアークに対する仮説の展開は無条件に行なっ
てよい。

【００５２】何となれば、あるアークに仮説が存在する
ということは、過去においてそのアークへの仮説の展開
が許可されたということを意味するからである。

【００５３】以上説明したように、本発明の一実施例に
よれば、言語的なコンテクストと木構造辞書中の単語と
の接続可能性の先読みを行なう。

【００５４】コンテクストと木構造辞書中の単語との接
続可能性を先読みできる、バイグラム以上の厳密な言語
モデルスコアの先読みをしない限り、本発明は有効であ
り、バイグラム言語モデルスコアの先読みをするための
膨大な計算や、メモリ容量は必要ではない。

【００５５】図６は、フレ−ム同期ビ−ムサ−チの１フ
レ−ム分の仮説の展開の動作についてのフロ−チャ−ト
である。

【００５６】ステップＳ１では、あるフレ−ム時刻に存
在する全ての仮説についてのル−プ（繰り返し処理）を
開始する。

【００５７】ステップＳ２では、仮説の属する木構造辞
書のコンテクストを、木構造辞書記憶部４から取得す
る。

【００５８】ステップＳ３では、品詞接続情報記憶部６
からコンテクストの品詞の品詞接続情報を取得する。

【００５９】ステップＳ４では、仮説の属する木構造辞
書中のア−クを仮説記憶部１から取得する。このとき取
得したア−クを、“ア−ク１”とする。

【００６０】ステップＳ５では、“ア−ク１”の全ての
直後の後続ア−クについてのル−プを開始する。今選ば
れている直後の後続ア−クを、“ア−ク２”とする。

【００６１】ステップＳ６では、“ア−ク２”の後続単
語品詞情報を、後続単語品詞情報記憶部５から取得す
る。

【００６２】ステップＳ７では、ステップＳ３で取得し
た品詞接続情報と、ステップＳ６で取得した後続単語品
詞情報とから、仮説を“ア−ク１”から“ア−ク２”へ
展開しても良いか否か判断する。もし、品詞接続情報に
記されている接続可能な品詞が“ア−ク２”の後ろにな
い場合、仮説は、“ア−ク２”へ展開してはならないと
判断され、ステップＳ９に分岐する。そうでなければ、
仮説は“ア−ク２”へ展開してもよいと判断され、次の
ステップＳ８に移る。

【００６３】ステップＳ８(仮説展開部３の処理)では、
ステップＳ７の判断に従って、仮説が“ア−ク２”へ展
開される。

【００６４】ステップＳ９では、全ア−クについてル−
プが終了した場合、ステップＳ１０へ移り、そうでない
場合には、ステップＳ５へ行く。

【００６５】ステップＳ１０では、全仮説についてル−
プが終了した場合、フレ−ム同期ビ−ムサ−チにおける
このフレ−ムの仮説の展開処理を終える。全仮説につい
てループが終了していない場合はステップＳ１に戻る。
なお、図５を参照して説明した各処理ステップは、音声
認識装置を構成するコンピュータ（ＣＰＵ）のメモリ上
に格納された音声認識用プログラム（ソフトウェア）を
実行することで実現するようにしてもよい。この場合、
該プログラムをＦＤ、ＣＤ−ＲＯＭ、不揮発性メモリ等
の記憶媒体から読み出してメモリ上にロードしてＣＰＵ
で実行することで、本発明を実施することができる。

【００６６】

【発明の効果】以上説明したように、本発明によれば、
連続音声認識の認識率と速度とを向上する、という効果
を奏する。

【００６７】その理由は、本発明においては、言語的に
接続しない単語への仮説の展開を抑制し、不必要に仮説
数を増加させないためであり、また言語的に接続しない
単語への仮説のスコアが他のスコアに比べて良い、とい
う状況を発生させないようにしたためである。

【図面の簡単な説明】

【図１】本発明の一実施例の構成を示す図である。

【図２】木構造辞書の例を模式的に示す図である。

【図３】本発明の一実施例における続単語品詞情報の例
を示す図である。

【図４】本発明の一実施例における品詞接続情報の例
(助詞の場合)を示す図である。

【図５】本発明の一実施例の動作を説明するためのフロ
−チャ−トである。

【図６】従来のフレ−ム同期ビ−ムサ−チの構成を示す
図である。

【符号の説明】

１仮説記憶部２仮説展開判断部３仮説展開部４木構造辞書記憶部５後続単語品詞情報記憶部６品詞接続情報記憶部７言語モデル部８音響モデル部１１コンテクストに言語的に接続が許されない後続単
語のみを持つアークの例１２木構造辞書中の分岐直後のアークの例

Claims

(57)【特許請求の範囲】

【請求項１】木構造辞書及びその先行コンテクストを記
憶する第１の記憶部と、木構造辞書中の各アークについて、該アークの全ての後
続単語の品詞情報を保持する第２の記憶部と、品詞同士の接続情報を記憶する第３の記憶部と、仮説を展開中の木構造辞書のコンテクストの品詞情報を
前記第１の記憶部から受け取り、前記仮説を有するア−
クの直後のア−クの全ての後続単語の品詞情報を、前記
第２の記憶部から受け取り、これらの情報から前記コン
テクストと後続単語が接続可能か否かについて、前記第
３の記憶部を参照して判断し、後続単語の一つでも接続
可能である場合には該後続アークへ仮説を展開するよう
に指示を出し、前記アークの後続の全ての単語が接続不
可能であるなら該後続アークへ仮説の展開を行わずに、
仮説を展開しないように指示を出す仮説展開判断手段
と、前記仮説展開判断手段から展開の指示を受けて仮説の展
開を行なう仮説展開手段と、を備え、コンテクストと接続しない単語へのアークには仮説が展
開されないように制御することを特徴とする連続音声認
識装置。
【請求項２】仮説を記憶する仮説記憶部と、仮説を後続アークに展開してもよいか否かを判断する仮
説展開判断手段と、木構造辞書及びその先行コンテクストを保持する木構造
辞書記憶部と、前記木構造辞書中の各ア−クにおいて、該アークよりも
後に存在する全ての後続単語について品詞の有無の情報
を記憶する後続単語品詞情報記憶部と、品詞同士の接続情報を記憶する品詞接続情報記憶部と、仮説に言語モデルスコアを付与する手段と、仮説に音響モデルスコアを付与する手段と、前記仮説展開判断手段からの展開指示を受け、前記音響
モデルスコアと前記言語モデルスコアを考慮して、前記
木構造辞書記憶部からア−クの構造を取得し、該ア−ク
上にある仮説を後続ア−クへと展開し展開結果を前記仮
説記憶部に記憶させる仮説展開手段と、を備え、前記品詞接続情報記憶部が、品詞同士の接続情報を品詞
の出現頻度順に記憶することを特徴とする連続音声認識
装置。
【請求項３】仮説を記憶する仮説記憶部と、仮説を後続アークに展開してもよいか否かを判断する仮
説展開判断手段と、木構造辞書及びその先行コンテクストを保持する木構造
辞書記憶部と、前記木構造辞書中の各ア−クにおいて、該アークよりも
後に存在する全ての後続単語について品詞の有無の情報
を記憶する後続単語品詞情報記憶部と、品詞同士の接続情報を記憶する品詞接続情報記憶部と、仮説に言語モデルスコアを付与する手段と、仮説に音響モデルスコアを付与する手段と、前記仮説展開判断手段からの展開指示を受け、前記音響
モデルスコアと前記言語モデルスコアを考慮して、前記
木構造辞書記憶部からア−クの構造を取得し、該ア−ク
上にある仮説を後続ア−クへと展開し展開結果を前記仮
説記憶部に記憶させる仮説展開手段と、を備え、前記後続単語品詞情報記憶部が、前記木構造辞書中のア
ークにおいて、該アークより後に存在する全ての後続単
語について、各品詞の有無の情報を、品詞の出現頻度順
に記憶することを特徴とする連続音声認識装置。
【請求項４】仮説を記憶する仮説記憶部と、仮説を後続アークに展開してもよいか否かを判断する仮
説展開判断手段と、木構造辞書及びその先行コンテクストを保持する木構造
辞書記憶部と、前記木構造辞書中の各ア−クにおいて、該アークよりも
後に存在する全ての後続単語について品詞の有無の情報
を記憶する後続単語品詞情報記憶部と、品詞同士の接続情報を記憶する品詞接続情報記憶部と、仮説に言語モデルスコアを付与する手段と、仮説に音響モデルスコアを付与する手段と、前記仮説展開判断手段からの展開指示を受け、前記音響
モデルスコアと前記言語モデルスコアを考慮して、前記
木構造辞書記憶部からア−クの構造を取得し、該ア−ク
上にある仮説を後続ア−クへと展開し展開結果を前記仮
説記憶部に記憶させる仮説展開手段と、を備え、前記後続単語品詞情報記憶部が、前記木構造辞書中のア
ークにおいて、分岐直後のアークについての後続単語品
詞情報だけを記憶することを特徴とする連続音声認識装
置。
【請求項５】仮説を記憶する仮説記憶部と、仮説を後続アークに展開してもよいか否かを判断する仮
説展開判断手段と、木構造辞書及びその先行コンテクストを保持する木構造
辞書記憶部と、前記木構造辞書中の各ア−クにおいて、該アークよりも
後に存在する全ての後続単語について品詞の有無の情報
を記憶する後続単語品詞情報記憶部と、品詞同士の接続情報を記憶する品詞接続情報記憶部と、仮説に言語モデルスコアを付与する手段と、仮説に音響モデルスコアを付与する手段と、前記仮説展開判断手段からの展開指示を受け、前記音響
モデルスコアと前記言語モデルスコアを考慮して、前記
木構造辞書記憶部からア−クの構造を取得し、該ア−ク
上にある仮説を後続ア−クへと展開し展開結果を前記仮
説記憶部に記憶させる仮説展開手段と、を備え、前記仮説展開判断手段が、仮説を展開中の木構造辞書の
コンテクストの品詞情報を前記木構造辞書記憶部から受
け取り、前記仮説を有するア−クの直後のア−クの全て
の後続単語の品詞情報を、前記後続単語品詞情報記憶部
から受け取り、これらの情報から前記コンテクストと後
続単語が接続可能か否かについて、前記品詞接続情報記
憶部を参照して判断し、後続単語の一つでも接続可能で
ある場合には該後続アークへ仮説を展開するよう前記仮
説展開手段へ指示を出し、前記アークの後続の全ての単語が接続不可能であるなら
該後続アークへ仮説の展開を行わずに、仮説を展開しな
いよう前記仮説展開手段へ指示を出す、ことを特徴とす
る連続音声認識装置。
【請求項６】仮説を記憶する仮説記憶部と、仮説を後続アークに展開してもよいか否かを判断する仮
説展開判断手段と、木構造辞書及びその先行コンテクストを保持する木構造
辞書記憶部と、前記木構造辞書中の各ア−クにおいて、該アークよりも
後に存在する全ての後続単語について品詞の有無の情報
を記憶する後続単語品詞情報記憶部と、品詞同士の接続情報を記憶する品詞接続情報記憶部と、仮説に言語モデルスコアを付与する手段と、仮説に音響モデルスコアを付与する手段と、前記仮説展開判断手段からの展開指示を受け、前記音響
モデルスコアと前記言語モデルスコアを考慮して、前記
木構造辞書記憶部からア−クの構造を取得し、該ア−ク
上にある仮説を後続ア−クへと展開し展開結果を前記仮
説記憶部に記憶させる仮説展開手段と、を備え、前記仮説展開判断手段が、仮説が展開されようとしてい
る後続アークに、既に仮説が存在する場合には、品詞同
士の接続ルールを参照する処理を省略して、前記後続ア
ークに仮説を展開するように前記仮説展開手段に指示を
出す、ことを特徴とする連続音声認識装置。
【請求項７】木構造辞書及びその先行コンテクストを記
憶する第１の記憶部と、木構造辞書中の各アークについて、該アークの全ての後
続単語の品詞情報を保持する第２の記憶部と、品詞同士の接続情報を記憶する第３の記憶部と、を備え
た音声認識装置の連続音声認識方法であって、仮説を展開中の木構造辞書のコンテクストの品詞情報を
前記第１の記憶部から受け取り、前記仮説を有するア−
クの直後のア−クの全ての後続単語の品詞情報を、前記
第２の記憶部から受け取り、これらの情報から前記コン
テクストと後続単語が接続可能か否かについて、前記第
３の記憶部を参照して判断し、後続単語の一つでも接続
可能である場合には該後続アークへ仮説を展開するよう
に仮説展開処理に指示を出し、前記アークの後続の全ての単語が接続不可能であるなら
該後続アークへ仮説の展開を行わずに、仮説を展開しな
いように前記仮説展開処理に指示を出し、前記仮説展開処理では、前記展開の指示を受けて仮説の
展開を行い、コンテクストと接続しない単語へのアーク
には仮説が展開されないように制御することを特徴とす
る連続音声認識方法。
【請求項８】仮説を記憶する仮説記憶部と、木構造辞書及びその先行コンテクストを保持する木構造
辞書記憶部と、前記木構造辞書中の各ア−クにおいて、該アークよりも
後に存在する全ての後続単語について品詞の有無の情報
を記憶する後続単語品詞情報記憶部と、品詞同士の接続情報を品詞の出現頻度順に記憶する品詞
接続情報記憶部と、を備えた音声認識装置の連続音声認
識方法であって、あるフレ−ム時刻に存在する全ての仮説について以下の
（ａ）〜（ｇ）のステップを繰り返し、すなわち、（ａ）前記仮説の属する木構造辞書のコンテクストを前
記木構造辞書記憶部から取得するステップ、（ｂ）前記品詞接続情報記憶部からコンテクストの品詞
の品詞接続情報を取得するステップ、（ｃ）仮説の属する木構造辞書中のア−クを前記仮説記
憶部から取得するステップ、前記ア−クの全ての直後の後続ア−クについて以下の
（ｄ）〜（ｆ）のステップを繰り返し、すなわち、（ｄ）現在選択されている第１アークの直後の後続ア−
クを第２ア−クとし、第２ア−ク２の後続単語品詞情報
を前記後続単語品詞情報記憶部から取得するステップ、（ｅ）前記取得した品詞接続情報と、前記取得した後続
単語品詞情報とから、前記仮説を、第１ア−クから第２
ア−クへ展開しても良いか否か判断し、その際、前記品
詞接続情報に記されている接続可能な品詞が第２ア−ク
の後ろにない場合、前記仮説は前記第２ア−クへ展開し
てはならないと判断し、そうでなければ、前記仮説は第
２ア−クへ展開してもよいと判断するステップ、（ｆ）前記仮説が第２ア−クへ展開されるステップ、（ｇ）前記全ての仮説についてル−プが終了したか否か
判別し、終了した場合、フレ−ム同期ビ−ムサ−チにお
ける前記フレ−ムの仮説の展開処理を終えるように制御
するステップ、を含む、ことを特徴とする連続音声認識方法。
【請求項９】前記後続単語品詞情報記憶部が、前記木構
造辞書中のアークにおいて、該アークより後に存在する
全ての後続単語について、各品詞の有無の情報を、品詞
の出現頻度順に記憶することを特徴とする請求項８記載
の連続音声認識方法。
【請求項１０】仮説を記憶する仮説記憶部と、木構造辞書及びその先行コンテクストを保持する木構造
辞書記憶部と、前記木構造辞書中の各ア−クにおいて、該アークよりも
後に存在する全ての後続単語について品詞の有無の情報
を記憶する後続単語品詞情報記憶部と、品詞同士の接続情報を品詞の出現頻度順に記憶する品詞
接続情報記憶部と、を備えた音声認識装置において、あるフレ−ム時刻に存在する全ての仮説について以下の
（ａ）〜（ｇ）の処理を繰り返し、（ａ）前記仮説の属する木構造辞書のコンテクストを前
記木構造辞書記憶部から取得する処理、（ｂ）前記品詞接続情報記憶部からコンテクストの品詞
の品詞接続情報を取得する処理、（ｃ）仮説の属する木構造辞書中のア−クを前記仮説記
憶部から取得する処理、前記ア−クの全ての直後の後続ア−クについて以下の
（ｄ）〜（ｆ）の処理を行い、（ｄ）現在選択されている第１アークの直後の後続ア−
クを第２ア−クとし、第２ア−ク２の後続単語品詞情報
を前記後続単語品詞情報記憶部から取得する処理、（ｅ）前記取得した品詞接続情報と、前記取得した後続
単語品詞情報とから、前記仮説を、第１ア−クから第２
ア−クへ展開しても良いか否か判断し、その際、前記品
詞接続情報に記されている接続可能な品詞が第２ア−ク
の後ろにない場合、前記仮説は前記第２ア−クへ展開し
てはならないと判断し、そうでなければ、前記仮説は第
２ア−クへ展開してもよいと判断する処理、（ｆ）仮説展開処理では、前記仮説を第２ア−クへ展開
する処理、（ｇ）前記全ての仮説についてル−プが終了した場合、
フレ−ム同期ビ−ムサ−チにおけるこのフレ−ムの仮説
の展開処理を終えるように制御する処理、の上記（ａ）〜（ｇ）の各処理を前記音声認識装置を構
成するコンピュータで実行させるためのプログラムを記
録した記録媒体。