JPH0320800A

JPH0320800A - 音声認識方法および装置

Info

Publication number: JPH0320800A
Application number: JP2040889A
Authority: JP
Inventors: Charles T Hemphill; チャールズ　ティー．ヘムフィル; Joseph W Picone; ジョセフ　ダブリュ．ピコーン
Original assignee: Texas Instruments Inc
Current assignee: Texas Instruments Inc
Priority date: 1989-02-21
Filing date: 1990-02-21
Publication date: 1991-01-29
Also published as: DE69009522T2; EP0384584B1; EP0384584A2; EP0384584A3; US4984178A; DE69009522D1

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

（産業１の利用分野）本発明ｕ．活しことばインタノエイスに関するものであ
り、特に確率的−・体化（ユニファイケーシコン）文法
を用いて規則確率と観測確率を貝休化するチャート構文
解析法を含む、話しことばプロセッサに関するものであ
る。（従来の技術〉話しことば系と自然古語系とをしっかり結びつけること
により、機械に話しことばを理解させることが最近の仙
究の１１的であった。鉤者を結合することの困難性は統
計的な音声情報と自然言語文法とを統合しようとしたこ
とにある。更に、連続した音声を正確に認識ラ゛るため
に、ｒｊ声システムは文法に強く東縛されるようになっ
た。言語をモデル化することは高性能で、話者非依存性の連
続的合声システムにおいて必須の要素になった。最近ま
で、肖角認識システムは言語モデルとして有限状態オー
トマトン（ＦＳＡｓ）を主に川いていた。これらのモデ
ルは処理効率が良くて、観測確率を調整するのが容易で
、かつ簡単な訓練技術で遷移確率をつくることができる
。Ｆ　Ｓ　Ａ　Ｓを用いて話し言葉をモデル化しようと試
みた結果、パイグラムやトリグラムといった確率論的“
ｄ語モデルが生まれた。これらのモデルによれば、単純
な場合には良い認識結果が１！１られるが、意味論を無
視しているから、話し，１葉系を素直に支持することを
阻むものである。８語モデルが自然Ｓ語体系の中ぐ｛曲値があることは伝
統的に証明されてきたが、過去１０年間だけはコンピュ
ータ指向の断定的文法形式主義が広く利用されるように
なった。これらの形式主義は一・体化文法として一般に
知られてＪ３り、構文解析と生成の両方を処ｌＩＩ　Ｔ
ｌることに関してきわめて融通性にＸＪんでいる。一体
化文法によって、構文法と意味論と詔用論とをしっかり
と統合することが］可能となった。処理中に構文法と意
味論と語用論とに関する拘束を同時に適用しなければな
らないから、これらの文法は話し古莱にとって特に意義
深いものであった。話法と定翰域に関する拘束があるた
めに、侭いレベルで考慮すべき仮説の数を２ｉＩ１限す
ることができるから、性能が著しく改善される。文脈自由文法（ＣＦＧｓ）と一体化文法（ＵＧＳ）とを
統計的音声情報に結びつけようとする試みがいくつかな
されてきた。上界形システムや単語格子解析法のような
結合のゆるいシステムは、Ｅｉに時間整合問題のために
、あまり有効でなかった。ＣＦＱｓの中からＦ降形拘束
が」一ク◆ヤンガー●カサミ＜ＣＹＫ）アルゴリズムを
用いて音声と統合されたが、この／ルゴリズムは平均倍
率複雑性が悪い（３乗）。この複雑さは考慮すべき入力
仮説の数が大きい場合にノレーム同期構文解析法を用い
ると特に不利になる。例えば、１人の平均音声入力の良
さｕ４−５秒であり、こｔＬは４００−５００フレーム
に相当する。これを３乗つると、４００−５００フレー
ムの入力を認識するの１．：６４，０００．０００−１
２５．００ｏ，ｏｏｏステップの処理を必公と寸ること
になる。ＣＹＫアルゴリズムはＮ３倍複雑性を有する第１のアル
ゴリズムであった。自然角語体系で１１ＮＵ伝統的に単
語数゛Ｃある。しかし音声システムではＮはフレーム数
であり、フレームは音声認識に川いられる基本的な時間
単位である。このアルゴリズムは音ＴＡ認識に時間同Ｊ
ＷＪアルゴリズムを提供したという点で意義があった。プロセッサは単語と単語との連結適合性ということに係
わる必公がなかったので、正確性が改善された．ＣＹＫ
アルゴリズムはマトリックス乗法に似ているという点Ｃ
非常に単純である。正規文法を処理するときでさえ、Ｎ
倍ではなく常にＮ３倍の時間がかかるというのが欠点で
ある。史に、ＣＹＫアルゴリズムＵ浪費的である。この
アルゴリズムは必飲ぐあろうとなかろうとサベてをシス
デム的に拡張する。したがって非常に良い処理時間と非常に多くのメヒリ空
間を使う。アーりのアルゴリズム（Ｊ．Ｅａｒｌｅｙ著、１″＾ｎ
　ＥＨｉｃｉｅｎｔ　Ｃｏｎｔｅｘｔ−Ｆｒｅｅ　Ｐａ
ｒｓｉｎｇ＾Ｉｇｏｒｉｓｍ（効率的な文脈自由構文解
析アルゴリズム）”Ｃｏｍｍ．ｏｆ　ｔｈｅ　ＡＣＨ　
１Ｖｏｌ．１３、ＮＯ．２、ｒｅｂｒｕａｒｙ　　１９
７０、Ｅｌｆ）．９４−１０２）は文書入ノノに対する
最も効率的な構文解析アルゴリズムのひとつであり、正
規文法をＮ倍で処理することができる。これはチャート
として知られる中央データ構造を使った最初の構文解析
方法のひとつであった。中央データ構造は文章を構文解
析している途中の結果をすべて記憶つるものである。そ
れからは文摺入力に対する自然言語系Ｔ−↓よチャート
構文解析法が広く用いられた。音声入力信３は多様でかつあいまいさがあるので、アー
りのアルゴリズムを改良して話しことばの認識に使うた
めに、條正したアルゴリズムがつくられた。修正アルゴ
リズムの一例はベーセラによる次の文献に示されている
。＾．Ｐａｅｓｅｌｅｒ著、”　Ｍｏｄｉｆｉｃａｔｉ
ｏｎ　ｏｒ　ＥａｒｌｅＶ’ｓ　Ａｌｇｏｒｉｔｈｍ　
ｆｏｒＳＤｅ（！Ｃｈ　　Ｒｅｃｏｇｎｔｔｔｏｎ　　
（アーりのアルゴリズムの音声認識用修正）　”　Ｐｒ
ｏｃ．ｏｆ　ＮＡＴＯ＾８１，　ＢａｄＷｉｎｄｓｈｃ
ｉａ＋　．　１　９　８　７。ペーセラのアルゴリズム
はアーりのアルゴリズムに基づいて文脈白山文法に確立
を結合させているが、そのアルゴリズムにはある種の欠
陥があるためにそれほどうまくは働かない。ひとつの欠
陥は確率の計算に関することである。文脈自由文法の場
合、非終端記号が終端記号を経由することなく他の非終
端記号にぷき換えられる。したがって、確率は文法の多
くの方向から起こりつる。入力の構文解析を進めるため
に、続いて来るこれの記号も引き延ばさな◆ノればなら
ない。しかし、続いて来るこれらの記号を引ぎ延ば゜す
ためには、ベーセラのアルゴリズムによれば、最良の確
率を知らなければならない。さもないと、もしもっと良
い確率が現われたときに構文解析をやり直さなければな
らない。これは指数国数的な仕事損になるであろうから
、全然望ましくないことである。（発明の要釣）上述の問題に鑑み、本発明の目的は、確率論的一体化文
法を用いて規則確率と［１確率を具体化するチャート構
文分析法を提供し、それによって８狛ブ０セッサがすべ
ての知ａｍを同時に利用して話し言葉をより正確に理解
できるようにし、表現できる右菓を改良して音ｉｌｌ識
プロセッサの表現力を高めることである。本発明の他の目的は、記号を説明するための調査を下降
形と上胃形の両方から行うことによって、ＣＧＦ，と確
率論的一休化文法に対して効率的な方法で、仮説の確率
をｉＬ確に計算するチャート構文解析方法を提供するこ
と゛Ｃある。本発明の更に他の目的は、ＣＧＦ　　とＵＧ，とＳを効率的な方法で音声認識問題に正確に適用して、処理
時間とメモリ空間を節杓することのできるヂャート構文
解析法を提供することである。記号を１回だけ引き延ば
すことにより、時間とメモリ空間を節約する。したがっ
てプロセツリ・は入力を認Ｆ識１るのにしばしば線型または２乗のステップ数で処理
し、最悪の場合のみＮ３の処理ステップを必要とする。それに対してペーセラのアルゴリズムでの紅験によれば
、常時Ｎ３の処理ステップがあるいは指数閏数的な処理
ステッグが必要であった。これらはリアルタイムシステ
ムでは全く望ましくないことであった。本発明はアーりの基本的なＣＦＧ構文解析アルゴリズム
を拡張して、規則確率と観測確率を一体化立法に結合さ
じるものである。これはアーりの結果を音声入力の認識
に拡張したものであったから、アーりのアルゴリズムの
複雑さを含んでいる。１ｊなわちｉ［規文法には線型の、あいまいでないＣＦ
Ｇ，ＩＣは２乗の、一般的なｃＦＧ，ｋ−Ｌｔ３乗の処
理ステップを必要とする。複雑な結果は特徴の任意の集
合を含まない一休化文法にも適用される。この効果があ
るために、このアルゴリズムは話しことば系の複数の文
法レベルに適用ざれる。本発明によれば、一休化文法を規則確率と観測確率とに
結合させて、言語モデルのいくつかのレベルに対して音
声信号入力をプロセッψが認識できるようになる。本発
明では文法と参照データとをディスクまたは適用なメモ
リ空間から内部のデ−タ構造にロードし、構文解析時に
アクセスできるようにする。それから、チャートプロセ
ッサがすべての入力゛ノレームに対してすべての開始記
月を予測して構文解析づることか可能になる。構文解析
機能は、これ以上新しい状態を追加することができなく
なるまで、プロセッサが予測機能と完或機能とを交丸に
繰り返すことを要求する。もしプロセッサが最Ｆ層の文
法レベルにあれば、入力フレームにｒＭ′１ｊるどんな
終端記号も計算にいれる。もしＩロセッサがｆＩ１′Ｆ）ｌ１以外の文法レベルに
いれば、次の低いレベルにある終端記号を予測して、構
文解析を進める。プロセッサは観測結果を低い文法レベ
ルから現行の文法レベルへと詳細に調査する。新しい完
成状態が利用呵能になると、進行中の状態を完威して次
の高い文法レベルに戻り、現行の文法レベルの記号から
つくられる状態を完成する。本発明では次に開拓しようと思う仮説に確率を割り当て
る。また最も正しいと思われる回答（音声！ｉ！識〉を
決めるために、得点の計算に周知のビ−ムブルーニング
技術と遅延コミットメントとを採川している。遅延コミ
ットメントは最良の確率を常にｊｌ算し゜〔いるのでは
なく、代わりに特定の記￥−｛を必装どする前の状態に
催促ポインタを設定する。それは、ブ口センナが確率を
知りたいときに、後戻りをして、すべ−（の情報が手許
にあれば、どちらが実際に高い確率！ごったかを決定で
ることができるようにするためである。以１・図面と共に好ましい実施例を詳細に説明すること
により、本発明の特徴と利点を明らかにする。（実施例）本発明が開示するｈ法で使用されるアルゴリズム４、話
しことばプロセッサの中央データ構造に影響を及ぼす構
文解析サブアルゴリズムを含む。第１図にホ寸ように、入力装置１０（よ使用者からデー
タを受けて、入力を接続要素１２を介してブロヒッサ１
４に送る。プロセッサ１４ｕチＶ一ト２４（図ホせず〉
として知られている中央データ構造を含み、その中にア
ルゴリズムが入っている。そのアルゴリズムはグロセツサ１４に文法、辞書、確率
およびその他の適当な演算用データをプロセッナメモリ
１６から読込むように指示する。プロセッナ１４とプロ
セッサメモリ１６とは接続要素１８を介して通信する。プロセッサ１４がアルゴリズムを実打し終えて、入力装
ｉ！！１０から送られた入力を！ａし終えると、プロセ
ッサ１４は接続要素２０を経由して出力装−２２に出ノ
ノを送る。文法は、コンピュータ’ｉｉ　ｉｔｉ学の分野で使われ
てよく知られている適当な文法を規定する規則を含む。辞書は文法の終＃ｉｉ記号の定義を含む。これらの終端
文法記勾は、好ましくは、例えば動詞、名詞、冠詞のよ
うな単語の種類を記述するものであり、構文と狛義に関
する情報が付随している。辞塵という術語には、時制、
複数または定冠詞のような選定された特徴が割り当てら
れている。辞書の要素のうちいくつかは、ある環境で有
効である単語の種類を詳細に記述したものである．原子
とも呼ばれる実際の単語は知識へ＝スのような別の場所
で定ＩＩきれる。文法と辞書は共に、特定の領域を参照せずにコンパイル
することができる。その結果、話しことば基準がつくら
れるが、それはがなり複雑な言語サブセットとなろう。文法と辞書に関する規則は単語の種類だけにおよぶので
、規則の数は実行時でさえ比較的少ない。したがって高
速で実行される。「入力」には音声、手書き文用、タイプ文書などいろい
ろある。「入力ｊ＋Ａ′ｎＪは端末、マイクロフォン、
蓄音器などである。「出力」はスクリーンに描くための
プロセッサ応答、プロセッサにょる合声応答、７ＬＩセ
ッサに上る動作指令などである。「出力装置」多よスク
リーン、他のプロセッサ、Ｒ　ＩＩ？スビ一カ、ロボッ
トの腕などである。本発明の好ましい実施例では、入力
は音′ＦＮぐ、入力Ｖｉ置ＧよマイクＤフォンであり、
出力と出力装買はスクリーンに書くだめのプロセッサ応
答に関するものである。しかしこのことが本発明を限定
するものではない。本発明のアルゴリズムを説明する萌に、２個の定義をし
ておくことが必要である。まず第１に、確率論的一体化
文法を定義する。これは確率論的な文脈自由文法の定義
に基づいており、記号が原子記号に眼定されるのでな＜

【、特徴・値の対または特徴組のこともあると一般化す
ることにより記述される。具体的に言うと、「確率論的
一休化文法１は四つ組、Ｇ，＝（Ｎ，ｒ、Ｐｓ，Ｓ）で
ある。ここでＮと「は有限であって、非終端記月と終端
記号の組である。ＳＣＮは開始記号の組である。Ｐ，は
確率論的積の有限な組であり、各々はＡ，Ｄ→αの形を
とる。ここでＡεＮ１βｃ（Ｎｕ−ｒ）．★であり、ｐ
は規も１を適用する確率である。左側のＡと共にｐｓ！
Ｐ−おけるｋ個の確率論的積サベ１の確率の組を｛ＤＩ　　Ａ，Ｐｉ−◆βｉ，ｉ−１、・・・　ｋ｝と
する。それからＯ＜｝）ｉ　　≦１、かつΣ”　　　ｐ
＝ｉである。非終端記号と終端記号は１−１特徴・億の対“Ｃある。次に、「特徴組」を形式Ｆ：ｖの「特徴・埴対」の組と
して定ｆｉｌる。ここでｆば定数（Ｏに関する関数また
は原子記号）であり、■は定数、変数あるいは特徴組の
いずれかである。特徴組はｘ十「Ｓという表記を用いた
変数で索引を付けることができる。ここでＸは変数であ
り、Ｆｓは特徴組である。変数はｊｊｌじ特徴組の発生
を示すために、他の場所で使うことができる。本発明の好ましい実施例を示す。入力文法のベクトル、Ｇ，Ｇ　　、・・・、Ｇ　ｔｔ　．Ｏ終りのフレーム、ｎ．出力ｌ行ｎ列の状態組ＥのマトリックスＧｏのＳに対づる最良の得点方法１．ｉ−Ｑ、１−０．σｏ＝０．０　＜対数確率）とす
る。すべてのｌに対しＥ　　　を空にする。ｌｌ０２．各ＳεＳに対して、［１・一　Ｓ・一　−　　−　　−　　　ｏ　　　ｏσ
　．σ ］を予測する。３、もしｉ＝ｎかっ［ｏ，ｐ，ｓ，α　ｊ，ε，１．σ
　，σ］εεｌ．。０ここでＳεＳならば、Ｅとσに戻る。４．（ｉ，Ｅ．ｊ！）を構文解析する。５、（３）に行く。構文解析入力状態組Ｆのマトリックス、レベルｌ１フレームインデッ
クスｉ．出力Ｅの特別な状態組、Ｅ１，Ｉ＋１，方法１．新しい状態を加えることができなくなる迄、次の２
ステップを繰り返す。（ａ）予測寸る（ｂ）完成する２，仮説を設ける３．詳細に調べる４．ｉ＝ｉ＋１とする５．新しい状態を加えることができなくなる迄、次の２
ステップをくり２返す。（ａ）予ａｌ１る（ｂ）完成するこのアルゴリズムの実行に際して、プロセッサは文法レ
ベルの数を表わす文法のべクトノレを読む。第２図に文法レベルの例を，示す。最も高いレベノレは
文文法レベル０である。そのトに単語文法レベル１があ
り、その下にフオニーム文法レベル２がある。その下の
レベルは単音文法レベル３である。レベルが下がるにしたがって、各レベルは入力されたデ
ータのうち次第に狭い部分を含むようになり、やがて最
下層レベル、すなわち基準文法レベルｌに達する。基準フレームは音声開発者により設定される基本的な時
間単位である。例えば、基本となる時１ｍｌＮ１ＭＬは
２０ミリ秒である。このことは２０秒毎にプロセッサが
音声信号の持つ各種特性のうｔ５艮さ１８くらいの｝ｊ
１動小数点特性を持つベクトルでａ声データを特徴づけ
て、これらの特性を１！語にｉｔ応する１ｌｌＪ持デー
タまたは記号に合わせることを意味する。アルゴリズムの説明に戻る。プロセッサが入力し終えな
いうちに、状態組Ｅのマトリックスの出力を生或する。このマトリックスはレベル数に対応つるｌ行と、音声の
入力フレーム数に対応するＮ列から或る。更に、プロセ
ッサは文法レベルＯ（第２図）において最も良く文を説
明する得点を出力づる。文法レベルＯは文文法レベルで
ある。好ましい実施例では、文法のベクトルを読んだ後、プロ
ヒッサは最終フレーム指示子ｎを入力づる。このことは
必要ではないけれども、こうすることによりアルゴリズ
ムがより完璧になる。また、他の手段により終了時点を
プロセッサに知らせることもできる。この時点で、ブ［１セッサはすべての状態組を前期化し
て第１フレームのすべてのレベルで空にし、初期確率を
０．０（対数確率〉に設定する。プ口セッサはレベルを
０に設定し（文文法レベルでスタートづる）、フレーム
をＯに設定１る。これで前期化は完了する。各文法の開
始記号に対して、プロセッサは現行フレームの初期確率
と最終確率を０，Ｏと予測する。この時点で１ロセッナが入力終了に至るということ番よ
、プロセッサがアルゴリズムを初めて実行するときには
ありそうもないことであるが、もしそうなったならば、
そしてもしブロヒッザが完成１ノだ開始記号に対応する
状態を見つけたならば、プロセッＶは組入力全体を説明
して、その状態ど得点とを出力することができる。それ
から、開始フレームと、状態組と、レベルとが与えられ
れば、プロセッサは構文解析にかかる。構文解析アルゴリズムでは、プＬ］セッナは状態組と、
レベルｌと、インデックスフレームｌとを入力し、次の
入力フレーム要求ｉ＋１のための特別状態を出力する。この◆ナイクルは、新しいチ測状態と完成状態とが加え
られなくなるまで繰り返される。このサイクルにより次
の低い文法レベルで仮定されるいくつかの終端記号がつ
くられる。ブロセッナは次の下層の文法レベルにおける開始記号と
して、このレベルから終端３ａ号を仮定する。プロセッサは観測結果の組に戻り、それを待ち状態で詳
細に調べる。好ましい実施例では、完成した状態が次の
フレームではそうするから、それからフレームカウンタ
を進める。しかし、フレームカウンタを進めるのは、フ
レームをどのように追跡したいか次第で、アルゴリズム
を実行中の他の時間に行ってもよい。この時点では、状
態は完或しているか、または観測粘果として状態が次の
上の文法レベルに報告されるか、いずれかである。状態は依然として進行中であって《完或してない）、次
のサイクルの間に始理するための未決リストに載ってい
るかもしれない。再び第２図に戻る。ブ［１Ｉ？ツサは入力された文法を
見て、文に相当する記号、例えばＳがあることを知る。プロセッナは構文解析機能を進めて、予測と完戒とを行
い、文文法レベルで終端記月であるいくつかの単語を必
要とすることを発見する。それからプＯセッ１ノはその単語の組を用いて仮説を呼
び出す。そのＩＩＲはこの場合次の低いレベル一レベル
１に１３　ＧＪる開始記号でもある。それからプロセッ
サはフォニームから成る単語に対する文法規則を予測し
て完成させ、終端記号であるフォニームの組を見つける
と、文法レベル２でそれを呼び出１．それは開始記号と
してフォニーム記号を有する。このことは隠れたマルコ
ノモデル（　１−Ｉ　Ｍ　Ｍ　）文法を持つレベルまで
続く。Ｈ　Ｍ　Ｍ文法は終端記号として基準ベクトルに
相当する基準ベクトル記号を有する。それからプロセッ
サはこれらの基準ベクトルを計算して、そのフレームに
対する確率を得、これらを１１Ａ？ｌ！ｌ結果として次
の高いレベルに戻す。これらの観測結果Ｕ次の高いレベ
ルで詳細に調べられる。次の繰り返しを通じて、プロセ
ッサは進められたこれらの状態を予測して完成させる。このことはづべての入カが文文法レベルＯに進み、何倍
かのフレームにわたってＳを進めて、寸べての入力デー
タを包含する迄続く。この時点で、プロセッサは構文解析を完了して、音声入
力の仮説を出力する。本発明の好ましい実施例では、構文解析と計算の他に４
Ｍ４の基本的な機能がある。そのうちの３個は加算と呼
ばれる他の機能を使う。以下これらの各機能を説明する
。［ｆ，ｐ，Ａ，α．ｊ，β．ｉ．σ　．σ］という形
式のチャート状態を想定Ｏする。ここでｆば開始フレームであり、ｐは生成数であ
り、Ａは虜則の左手側（　Ｌ　Ｈ　Ｓ　”）であ・り、
αは完成した一連の記号であり、ｊはαの長さであり、
βは右手側（Ｒ｝−１８）記号の剰余であり、ｉはこの
状態の終了フレームであり、σ０は初期確率であり、σ
は累積確率である。更に、すべての記号はもし他に指示
してなければレベル１にあると仮定する。ｐｒｅｔｉｔｃｔｆｏｒ　ａｌｌ［ｆ，ｐ，Ａ，α．ｊ．Ｂ　　αｓｉｔσ　．σ］１０ａｎｄ　ｒｕｌｅｓｏ’：Ｂ．η→γ ２ａｎｄｕｎＨｙ（　Ｂ　　，　　Ｂ　　．　　Ｂ３　）１２ａｄｄｔｉ．ｐ’．Ｂ２．εｓｏｗγ＝ｉｅσ．σ＋η］一休
化文法を用いて記号を予測するには、プロセッサは記号
Ｂ１を捜している状態を少なくとも１１１１ａ有し、規
則ｐ′で始まるかまたはその左手側に記号Ｂ　　を有す
る。ここで８１と８２は−・体と２なって、新しく統一された記号Ｂ３となる。もしＢ　と
Ｂ２が文脈自由文法用の原子記号であるな１らば、不履行により一休化される。次に、記号の組が考
慮中の状態の組に加えられる。新しい状態が入力状態の
終了状態のときに始まる。このときフレームはｉであり
、規Ｏｌｌ　Ｔｔ　弓はｐ′であり、左手側に記号Ｂ３
を有づる。記号の数はＯとして処理され、規則の右手側
に右手側に相当する空の記号列が処理される。このこと
はプロセッサが８３を見たということを示すために、調
べる必要があることである。εは一連の終端ｔｔ！号と
非終端記号であり、Ｏまたはそれ以上である。この場合
、終了フレームもまた現行フレームである。なぜならば
プロセッサは何も処理してないからである。初期確率は
最終確率プラス記号８２の規則確率である。このことは
特に左回帰的規則にとつ（＠欝なことである。最終確率
から初則確率を引くとηになる。ＣＯｌｐｌｅｔｆ３ｆｏｒ　ａｌｌ［ｋ．ｏ’．Ｂ．γＩＪ”Ｉｉｌσ０．σ】１ａｎｄ　ｒｕｌｅｓ［ｆ．Ｄ．Ａ．α．ｊ．８　βＩｋｌρ　．ρ］２０ａｎｄｕｎｉｆｙ（Ｂ　　．　Ｂ２　．　Ｂ３　）１ａｄｄ記月を完威させるには、ある時間ｋに始まってあるＢｉ
Ｖ間ｉに終る状態がある。その状態は最終確率がσで初
期確率がσ。である記号■を含む。それから各状１ｌ！
毎に記号Ｂ２を捜し、それが記号Ｂ１と一体となって記
＠Ｂ３をつくると、プＬ＋　ｔ７ツナは新しい状態をつ
くりだす。新しい状態はＢ３を調べ終っており、完成し
た状態と同じ規則ｉｌ号を持ち、完成した状態と同じ間
始時間、すなわちｆを持っている。完成した記号の数は
ｊ＋１に増える。終ｒフレームは現行ノレーム１であり
、初１１１１ｆ率は完成した状態の初期確率ρ０であり
、最終確率は調べた記号Ｂ３の最終確率であり、各状態
毎の最終確率から初期確率を引いたσ−σ０で表わされ
る。ｈｙｐｏｔｈｅｓｔｚｅｆｏｒ　ａｌｌＩｆ，Ｄ．Ａ，α＝，ｂβｅｊｅρ０．ρ］ａｎｄｔｅｒｍｉｎａｌ　（　ｂ　．　１１　）　，　ｃｏｍ
ｐｕｔｅ（ρ．　Ｄ’　）ｐｒｅｄｉｃｔ　　　ａｔ　
　　　　１　　−ト　１［ｉ，ｂ，，，，，ρ′．ρ゛
　］ｆｉｎａｌｌｙ，ｃａｌｌ　ｌ）ａｒｓＱ　ａｔ　ｊｌ　＋　１仮説を設
＆Ｊるために、ブＯセッサは所定の状態もしくは状Ｂ組
を進めるのに必要な状態から、終端記号ｂを取る。所定
のレベルｌにある寸べ゛（の終端ゝ％　ｂ　ＩＩに対し
て、プロセッサは状態の最終確率ρに基づいて新しい確
率ρ′を計算する。これは遅延コミットメント・アルゴ
リズムの一部である。プロセッサは終端記号の段階にい
るから、このアルゴリズムを実行することができる。な
ぜならば、すべての状態が予測されつくして完成してい
るので、これ以上の状態を予測もしくは完或づるために
利用できる情報がないからである。プロセッサは次の下
のレベルであるレベルｌ＋１で予測するであろう。この
ことは初ｔＩＩＩ確率と最終確率ρ′を川いて現行フレ
ームにおける記号ｂによりボされる。それからプロセッ
サは底部に達するまで順番に下のレベルに打って、可能
な限り多くの状態を進め、それから構文解析に戻る。こ
のことは仮説と構文解析間の相万回帰的関係を示すもの
である。ｓｃａｎｍ　ａ　ｋ　ｅ　ＥＪ　，　ｉ　，　１ｅｍｐｔｙｆｏｒ　　ａｌｌ［ｆ．　ｐ，　Ａ，α．ｊ，ｂ１β，ｋ．ρ０，ρ］ｆ
ｏｒ　ａｌｌ　ｏｂｓｅｒｖａｔｉｏｎｓ　ａｔ　１　
＋１ａｎｄｕｎＮｙ（ｂ　　，　ｂ　　．　ｂ３　）ｒ　　　　　
　ａａｄｄ詳細な調査は本質的に完成と向じである。唯一の違いは
「完成」が非終端記号を扱うのに対して、「訂細なｍ査
」は終端記号を扱う点である．，最初にプロセッサｑレ
ベルｌ１フレームｉ←１にある状態組を空にづる。次の
低いレベルにおける観測結果がある。あるレベルでは例
えば左手側に記号ｂ１を有し、その終端記号を必要とす
る。この状態におけるある状態のある記号ｂ２とその記
弓ｂ１とがー・体化される。こうしたすべての観測結果
に対して、７Ｏセッナは一休化された記号ｂ３を、この
状態における完成された記号リストにのせる。プＯセッ
ナはこのことを完成しつつある状態の初期フレームで行
うことにより、状態を進める。その確率はρであり、こ
れはその状態の最終確率＋完成した状態の最終確率一完
或した状態の初期確率である。ａｄｄｇｉｖｅｎ［ｆ，ｐ，Ａ　　　．α　，ｊ，β　．ｉ，σ　．σ］
１　　　　１　　　　　　１　　　　　　０ｉｆ　　ｔ
ｈｅｒｅ　　ｅｘｔｓｔｓ［ｆ，Ｅｌ．Ａ　　　，α　＋−ｉ＋　　β　，ｉ，ρ
　．ρ］２　　　　ａ　　　　　２　　　　　０ａｎｄｓｕｂｓｕｇｉｅｓ　　（Ａ１　　．　　Ａ２　　＞ｒ
ｅｐｌａｃｅ，ｏ　　ｗｉｔｈ　ｗａｘ（，ｏ　，　　ａ　）　，　
　ｓｙｍｂｏｌｉｃａｌｌｙｏｔｈｅｒｗｉｓｅａｐｐｅｎｄ　ｔｈｅ　ｏｉｖｅｎ　ｓｔａｔｅ　ｔｏ
　Ｅ　１　，　Ｈ加算するには、状態組の中に現行の状
態と異なる状慝が与えられなければならない。更に、新
しい左手側記号Ａ１が現存する記号Ａ２を包含すると仮
定する。これはプロセッサが最初の仮説よりも一般的な
仮説を持つことを意味する。プロセッサは状態組におけ
る現存状態の存在確率をρの最大値と記号的に置き換え
て、σを所定の状態の最終確率として設定する。このこ
とはρまたはσを評価ずるものではなく、現存状態組に
終了を記すことによって、ブ０セッナが後で確率を調べ
て最大値を見つけることができるまで加え続けたことを
記録しておくものである。さもなくば、プ［Ｉｔ？ツサ
はフレームｉのレベルｌにある状態に所定の状態を付す
にとどめるであろう。なぜならば、他に包含する状態が
ないからである。アルゴリズムを効率的に実行するには、アーリ（Ｅａｒ
ｌＱＶ）の著述したものを利川しなければならない。披
は次のように述べている。ブロヒッサが予測スデップに
あるとき、各非終端記号に対する選択用の連結リストを
保有つれば、容易にそれらを見つけることができる。状
態組中の状態も連結リストに保存されていたら、それら
を順番に処理づることができる。状態が既に加えられた
否かを容易に判断できるように状態組の中の状態に指標
を付しておけば、プロセッサは同じことを二度はやらな
い。その記号は既に調べられたというしるしをつけるこ
とにより、無効な、すなわち空の結果を処理する。プロ
セッサが完全な記号を有するときそれらを効率的に見つ
（ノるこができるように、必要とする記号にしたがって
すべての状態を系統的に編制しておく。と、以上のよう
に記載されている。更に、プ口グラムの本来の仕事は計
′ｎ機能である。終端記号の確率を克つ１ノるとき、計
算ステップ以前に、サイクルを攬留めて所定の状態の確
率を効率的に見つけるようにする。第３図に確率を用いてフレーム同期構文解析を行う例を
示す。Ａの印を付けた部分では１個の規則から成る簡単
な文法が与えられている。すなわち文は名詞と動詞に書
き直す。１個の名詞”　ｂｏｙｓ’　（少年）と、２個
の動１　’　ｓｌｅｅｐ“（眠る）と″ｌｅａｐ’　（
はねる）とが与えられている。第３図の８の印を付けた部分はｉ語格子を表わしている
。これは（この例では）システムの入力であり、各単語
仮説の始めのフレームと終りのフレームとを示している
。格子は複数行から成り、各行は特定のデータ範囲中に
特定の単語を見つける対数確率を示しており、その確率
は負で与える。Ｂ部の単語格子によれば、フレーム０からフレーム２の
間に゛ゝｂｏｙｓ″を見つける確率は−０．０４であり
、フレームＯからフレーム３までに″’ｂｏｙｓ”を見
つける確率は−０．０３であり、フレーム２からフレー
ム５までに゛’ＳＩｅｅＥ）”を見つける確率は−０．
０５であり、フレーム３からフレーム５までに’　ｌｅ
ａｐ“を見つける確率は−０．０３である。次に、第３図でＣの印を付けた部分を説明する。ノレームｉ−Ｑで予測が行われて、「文Ｕ名詞と動詞に
寵き直す」という規則に基づいて状態が確立され、時ｌ
ｉ１０で開始される。このことはＳの前の添字Ｏと矢印
の後の添字０で表わされている。その上の点は規則中の場所を表わす。すなわち規則中の
どこまで進んだかを表わすものであり、この時点では何
もない。規則の後についている数字はそれぞれ初期確率
と最終確率を対数確率で表わしている。フレームｉ−０
では、構文解析はまだ同じ状態にあって何もしてないか
ら、確率はゼロである。開始記号Ｓを予測したため最初
の状態が生じた。フレームＯには規則Ｓに相当する状態
があって、構文解析に上り’ｂｏｙｓ”という名詞に書
直すという名詞に関する規則が予測された。これは前の
状ｎｏと向じｔｉ始＠間と終了時間を有し、前の状態と
同じ初期確率と最終確率０．０を有する。初期確率はこ
の仮説を開始するのに必要な確率を表わし、最終確率は
仮説を調べつくしたときの確率を表わ１。構文解析によってできるだけ多く予測がなされて完成し
たとき、これ以上進む前に調べることが必要な１組の終
端記号を有している。この組は’　ｂｏｙｓ“という１
Ｉｌの要素から成る。それからある入力に関するフレー
ム１を見るが、何も見つからない。それから次に進んで
、ある入力に対してフレーム２を見１、フレームＯから
フレーム２までに“ｂｏｙｓ’があるを見つける。この
初期確率はＯ．Ｏであり、終了確率は一〇．０４である
。それからその終端記号を前の名詞状態の中でよく調べ
て、”　ｂｏｙｓ“を通り越して点を進める。これは”
　ｂｏｙｓ“を見たという行為を表わし、その状態に終
了フレーム２を付して、状態の最終確率を＝０．０４に
：Ｊ１１する。いったんフレームＯからフレーム２まで
に完全な名詞を持ったならば、名詞を必要としてＯで終
った記号があったか、それを完成することができるかど
うかをチェックする。そして最初の状態にＳで始まるものが１１ＩＱあうたこ
とを発見でる。それから新しい状態をつくる。この状態はｎの後に点をつけることにより名詞を見つけ
たことを表わし、その名詞が最終確率と同じ確率−０．
０４を持ってフレーム２まで延びていることを表わす。可能な限りの予測と完成をすませると、■で表わされた
動詞を必要とすることに気づく。ｅ詞の規則は２Ｉ！あ
るから、それらを予測する。１似は’　ｓｌｅｅｐ　”
であり、もう１１＆ｌは’　ｌｅａｐ“である。共にフ
レーム２で始まり、初期確率と最終確率は共に−０．０
４である。それから構文解析部は入力に関するフレーム＝３を見る
。ここでは再び確率−０．０３を持つ”ｂｏｙｓ”が見
つかる。入力”ｂｏｙｓ”をフレーム０からフレーム３
まで調べて第３図の状態７で示した新しい状態をつくる
。これはフレームＯからフレーム３まで確率−０．０３
を有する名詞ｎ　ｂ　ｏ　ｙ　ｓ　＃である。それから
前と同様に名詞を必要として３で終った状態があったか
どうかをチェックする。ぞして同じ状態が名詞を必要と
１ることを発見するが、今回は名詞がフレーム３で終了
し、最終確率は−０．０３である。２個の名詞仮説（フ
レームＯからフレーム２までの゛’ｂｏｙｓ”と、フレ
ーム０からフレーム３までの’　ｂｏｙｓ”　）は交わ
らない仮説である。なぜならば両者の停止時間が異なる
ので、離れたままだからである。ここで構文解析部はフレーム３で状態８からはｖＪ詞が
必要であることに気付ぎ、動詞を予測して状態９と１０
とをつくる。これらは共にフレーム３で始まり、フレー
ム３で終る。新しくつくられた状態の一方は終端記号ゝ
’　ｓｌｅｅｐ“を必要とし、もう一方は終端記号゛ゞ
ｌｅａｐ”を必要とする。共に同じ初期確率と最終確率
−０．０３を有する。データのフレームｌ＝４を見るが
何も見つからないので、フレームｉ−５を見る。ここで
’　ｓｌｅｅｐ“と１ゝｌｅａｐ″の両者を見つけるが
、＋１　ｓｌｅｅｐ　１１はフレーム２で始まり、“ｌ
ｅａｐ’はフレーム３で始まっている。ここで２個の新
しい状態をつくる。状！！１１はフレーム２で始まった
“ｓｌｅｅｐ　”に対して初ｌＩＷＩ率−０．０４、最
終確率−０．０９である。状態１２はフレーム３で始ま
った’Ａ　ｌ　Ｏ　ａ　ｐ　／ｌに対して初期確率−０
．０３、最終確率−０．０６である。最終確率は初期確
率にその間始フレームから終了フレームまでに特定の単
語が見つかる確率を加えることにより計粋される。ここ
で構文解析部は２個の完全な動詞記号を有しているので
、フレーム２またはフレーム３のいずれかからスタート
し、動詞を必要とする状態をさがす。そして状態８と状
態４に戻ると共に、相当するＳがあることを発見する。今や構文解析部は状態１３の中に開始記号Ｓに相当する
完全な状態を有し、かつ状態１４の中にも開始記号Ｓに
相当する完全な状態を有する。両者の中間状態は異なっ
ているが、状態１３で−０．０９の確率を、状態１４で
０．０６の確率を有するから、最も良い確率である−０
．０６を選んで、構文解析状態をさかのぼってゝ’　ｂ
ｏｙｓ　ｌｆ３ａｌ）　＃を見つける。それから、この
旬は音声入力を音声ａＸプロセッサが最も良く説明する
ｂのとして出力されるであろう。所望の確率は最も正で
あるもの、すなわちこの例では最も小さい負数、である
。第４図は’ａｏｒｂｏｒｄ“のような結合と分裂の処理
を用いて１１４則確率を示す典型的な左回帰的規則の例
である。第４図の八の部分に承りように、この例では４
個のｌ端記号、ａ，ｂ，ｄと”ｏｒ“を有する。入力は
フレームＯでスタートし、ａ　ｏｒ　ｂ　ｏｒ　ｄの各
単語毎に１フレームを有し、フレーム５で終ることとす
る。Ｂの部分に示す木はこの構文解析の所望の結果を表
わしている。この木が示づところによれば、この入力を
認識するために構文解析部は左ＤＩ　％ｉ的規則を２回
使わなければならず、かつ底で１１！ｌｉｌｓがＣに行
くという非左回婦的Ｓ遺択を行わなければならない。こ
の木はまた規則確率をも示している。この入力を構文解
析づる確率は第４図のＣの部分に与えられたすべての規
則確率の積である。第４図のＤの部分には、このアルゴ
リズムが入力に関してこれらの規則確率を用いてどのよ
うに解析するかを示す。入力はＤの真中の部分（ａ　ｏ
ｒ　ｂ　ｏｒ　ｄ）に示され、これらが入力された後に
起る種々の状態は左に示されている。チャート解析部は
記号を１目だシノ解析するから、特に左回帰的規則を扱
うことができる．，確率を正確に加算するために非常に
重公なことは、予測機能は規則嫂率を状態の騒終確率に
加えることであり、それを状態の初ＩＩｌｌｉｉｆ率に
加えるのではないということである。したがって、状態
が使われる度に、前の状態を使って次の状態に規則確率
が加算ざれるであろう。図の最下部では１／３が正しい
回数（３）起り、０．４が２回起り、０．６が１回起き
ている。これらは左回帰的規則と非左回帰的規則が何回
適用されたかを正確に表わしている。第５図は本発明によるチャート解析の効果をブルーして
示したグラフである。このグラフは時間対仮説の対数確
率を示している。各点は時間ｔｉとｔｋにおける向じ仮
説記号を表わしている。一番上の線は解釈時の任意の記
号の最良の確率を表わしている。一番下の線は最良の確
率プラスあらかじめ定めたある対数確率、すなわちスレ
ッショルドを表わしている。他のアルゴリズムを用いで
もしも記号の確率が任意の点でスレッシ１ルドを下まわ
れば、それは捨てられる。本発明のチャート解析法を用
いると、所定のフレームで１［ｊ１だけ記号を解析する
。例え何回必要であっても、どんなに確率が悪くともそ
うであるから、プルーニング・スレッショルドを超えて
いる限り、この解析法ではその記弓の最良の確率を使う
。更に、最良の確率記号が完成したとき、この解析法で
はもっと低い確率の記号にそれらの開始状態を付随させ
る。それからそれらの状態を完成して、第５図に交叉線
で示すように、実際にはこの確率の低い方の記号がデー
タを最も良く解釈するものとざれる。そして他のアルゴリズムなら誤認識したかもしれない場
合でも、ブｒ１レッサは入力を正確に認識することがで
きるのである。以上本発明を特定の実施例について説明したが、当業者
なら多くの変形や代替実施例を考えつるであろう。した
がって本発明の範囲には、特許請求の範囲に記載したも
のが含まれる。以上の説明に関して更に以下の項を開示する。（１）［１］　複数個の文法レベルから成る所望の音声
を入力するステップと、 ■　許容できる文構造を規定するために終端記号と非終
端記号とを有する文法を入力するステップと、 ■　言語学−Ｅ１構文法上、あるいは急味土の特徴によ
って文法の終端記号を規定するために、それらを登録し
た辞書を入力するステップと、■　状態組のマトリック
スを生成するステップと、 ■　前記状態組を前期化するステップと、■　前記所望
の音声入力を読みとるステップと、 ■　文法の各開始記号に対して現行フレームの初期確率
と最終確率を予測するステップと、■　菌配合声入力と
文法とにしたがって＃Ｊ記開始記３を構文解析して、前
記予測ステップにおける遅延コミットメント計算に基づ
く前記記号の観測結果をつくるステップと、 ■　菌記構文解析ステップの観測結果に襲づいて前記音
′声入力を説明するステップと、から或ることを特徴と
する、複数個のｌｌ賭を表わす音声入力を認識する方法
。（２）　　第１項記載の方法において、更に、０　ステ
ップ■と■の間に終了フレーム指示子を読みとるステッ
プと、 ■　ステップ■の後に、フレームカウンタを進めるステ
ップと、を含むことを特徴とする、音声文の認識方法。（３）　　第１項記載の方法において、ステップ■の構
文解析ステップは、 ■　有効な次の非終端記号を予測し、それによって文法
にしたがって少くとも１個の対応する規則から少くとも
１個の状態をつくりだすステップと、 ■　記号の説明が可能になったときに、萌記少くとも１
個の状態を完成するステップと、０　各勅記完成した状
態に対する確率得点を生成するステップと、 ■　新しい状態をもはやつくりだすことができなくなる
まで、ステップＯから［相］までを繰り起すステップと
、［株］　もし最下層の文法レベルでなければ、次の下層
の文法レベルの開始記号として、現行文法レベルから終
端記号を構文解析するステップと、 ■　もし最下層の文法レベルであれば、前記音声入力の
特徴と予測した次の辞癩登録の特徴とを比較するステッ
プと、ｅ　　前記次の′ＦＪｉｌの文法レベルから得られた１
！Ｊ３１１結果を前記現行の文法レベルの持も状態の中
で詳しく調べるステップと、０　これ以上新しい状態を完成することができなくなる
まで、■から■までのステップを繰り返すステップと、＠　菊記現行レベルの開始記号に相当する完成状態を次
の上層の文法レベルに報告するステップと、０　音声入力と文法とにしたがって前記開始記号を構文
解析し、前記記号の観測結果をつくるステップと、０　前記構文解析ステップの結果に基づいて入力を説明
するステップと、を含むことを特徴とする、音声文を認識つる方法．（４
）　　第１項記載の方法において、前記状態組は文法レ
ベルの数に相当する１行と、音声の入力フレーム数に相
当するＮ列から成ることを特徴とずる、音声文の認識方
法。（５）　　第３項記載の方法において、前記完或状態に
対する前記確率得点は、状態組の中の既に完或した状態
を使って状態組中の状態を完成する確率であることを特
徴とする、音声文の認識方法。（６）　　第３項記載の方法において、進行中の状態の
最終確率に、完成状態の最終確率と初期確率との差を加
えることにより、前記得点が計棹され、進行中の状態は
完成状態が規定する＆ｉ号を必要とする状態であること
を特徴とする、音声文の認識方法。（７）　　第３項記載の方法において、完成状態は音声
入力の一区分を完全に説明する状態であることを特徴と
する、音声文の認識方法。（８）　　第３項記載の方法において、史に、■　ステ
ップ■と■との間で終了フレーム指示子を読みとるステ
ツ！と、［相］　ステップ■の後で、フレームカウンタを進める
ステップと、を含むことを特徴とする、音声文の認識方法。（９）　　第１項記載の方法において、前記文法は確率
論灼−・体化文法であることを特徴とする、音声文の認
識方法。（１０）第１項記載の方法において、前記文法は文脈自
由文法または正規文法であることを特徴とする、音声文
の認識方法。（１１）処理手段と、前記処理手段と結合して言語モデルの要素によって文を
規定する文法と、記号によって文法の要素を規定する辞書と、前記文法と
結合して、単語をつなぎ合わせて部分的な文をつくり、
状態の組を生成し、完或状態を決定する構文解析手段と
、前記文法および前記処理手段と結合して、前記構文解析
手段にまり生或された有効な次のＭｌｋの記号を予測号
る予測手段と、構文解析手段のつくった結果を説明する完成手段と、前記処理手段と結合して、前記完成手段によりつくられ
た説明を表現する出力手段と、から成ることを特徴とタ
る、複数個の単語を表わタ音声文の認識システム。（１２）第１１項記載のシステムにおいて、更にチャー
トを生成する手段を含み、チャートは前記構文分析手段
と、前記予測手段と前記完成手段とによりアクセスされ
、中間結果を記憶寸るためのものであることを特徴とす
る、音声文の認識シスアム。（１３）第１２項記載のシステムにおいて、チ１　一ト
Ｕ状態と状態組とを含み、前記状Ｒ味前記構文解析手段
と前記予測手段とにより処理されることを特徴とする、
音声文の認識システム。（１４）第１１項記載のシステムにおいて、史に、前記
構文分析手段と前記完了手段とに結合して、構文解析手
段から完或手段までの記号を読みとる調査手段を含むこ
とを特徴とする、合声文の認識システム。（１５）第１１ＴＩ４記載のシステムにおいて、更に、
記シＪを供給するための知識ベースを含み、ｒｆＸ記予
測手段が知識ベースと結合していることを特徴とする、
音声文のｉ！ｉ！識システム。（１６）第１１項記載のシステムにおいて、前記言語モ
デルは確率論的一体化文法を含むことを特徴とする、音
声文の認識シスデム。（１７）第１１項記載のシステムにおいて、前記言語モ
デルは文脈自由文法または正規文法を含むことを特徴と
する、音声文の認識システム。（１８）第１１項記載のシステムにおいて、前記処理手
段は、音声詔を記録するための入力手段と、音声語を前
記処理手段が読める媒体に変換する音１Ｍ＠とを含むこ
とを特徴とする、ｒ『声文の認識システム。（１９）第１１Ｉｎ記載のシステムにおいて、前記処理
手段は、音声入力を受けて前記入力を前記処理手段が読
める媒体に変換するようになっている変換手段と結合し
ていることを特徴とする、音声文の認識システム。（２０）確率論的一体化文法を用いて規則確率と観測Ｉ
ｌ確率を具体化するチャート構文解析法が聞示される。この構文分析法ではフレームを向ｍ処理して下降形仮説
をたて、それらが利川可能になったとき観測確率を具体
化する。古語モデルはフレーム（仁１、ｔＪ１ｔｋ）ｉ
ｌｌの音声データに関して複数の説明を行うので、規則
の予測と組合せにより、最良の得点を表ねづグラフに周
期がつくられる。得点の３１粋にはこれらの周期の検出
と、最良の得点が次のフレーム（ｔ　ｉ，ｔｊ．ｔｋ）
へ伝達されたことの検出とが含まれる。このアルゴリズ
ムは非蓋然性チャート構文解析方がつくる以外の状態を
つくらないから、正規文法に対しては線型で、Ｃ　Ｆ　
Ｇ　，の最悪の場合は３乗のままである。この構文解析法では統引的な音声情報と９ｎ学的拘束を
同じ否語モデルの中に直接的に統合することができる。 −・方、言語モデルはＨ　Ｍ　Ｍ一型モデルの一般化を
可能にする。この構文解析法の効果はそれを話しことば
系の複数のレベル（たとえば、文、Ｉｔ！語、フォー−
ムおよび単音レベル〉に適用可能にしたことである。

【図面の簡単な説明】

第１ｖＡは本発明を採用する音声認識プロセッサを示す
ブロック図である。第２ｌＸ！は本発明により使用する
ことが可能な文法レベル構造と位費とを示すスタック図
である。第３図は本発明により採用される確率を用いた
フレーム周期構文解析法を示す例の図面である。第４図
は本発明により正確に計算される規則確率を示す代表的
な左回帰的規則を表わす例を示す図である。第５図は本
発明により採用されるブルーニング時のチャート構文解
析法の効果を示すグラフ図である。図面の浄書（内容に変更なし）

Claims

【特許請求の範囲】

（１）［１］複数個の文法レベルから成る所望の音声を
入力するステップと、［２］許容できる文構造を規定するために、終端記号と
非終端記号とを有する文法を入力するステップと、［３］言語学上、構文法上、あるいは意味上の特徴によ
って文法の終端記号を規定するために、それらを登録し
た辞書を入力するステップと、［４］状態組のマトリッ
クスを生成するステップと、［５］前記状態組を前期化するステップと、［６］前記
所望の音声入力を読みとるステップと、［７］文法の各開始記号に対して現行フレームの初期確
率と最終確率を予測するステップと、［８］前記音声入
力と文法とにしたがって前記開始記号を構文解析して、
前記予測ステップにおける遅延コミットメント計算に基
づく前記記号の観測結果をつくるステップと、［９］前記構文解析ステップの観測結果に基づいて前記
音声入力を説明するステップと、から成ることを特徴とする、複数個の単語を表わす音声
入力を認識する方法。
（２）処理手段と、前記処理手段と結合して言語モデルの要素によって文を
規定する文法と、記号によつて文法の要素を規定する辞書と、前記文法と
結合して、単語をつなぎ合わせて部分的な文をつくり、
状態の組を生成し、完成状態を決定する構文解析手段と
、前記文法および前記処理手段と結合して、前記構文解析
手段により生成された有効な次の要素の記号を予測する
予測手段と、構文解析手段のつくった結果を説明する完成手段と、前記処理手段と結合して、前記完成手段によりつくられ
た説明を表現する出力手段と、から成ることを特徴とする、複数個の単語を表わす音声
文の認識システム。