JPH05289692A

JPH05289692A - ワードを予測する会話認識装置用言語生成装置及び方法

Info

Publication number: JPH05289692A
Application number: JP4350244A
Authority: JP
Inventors: Peter F Brown; ピーター・フィッジュー・ブラウン; Pietra Stephen A Della; ステフェン・アンドリュー・デラ・ピートラ; Pietra Vincent J Della; ビンセント・ジョセフ・デラ・ピートラ; Leroy Mercer Robert; ロバート・レロイ・マーサー; Philip S Resnik; フィリップ・エス・レズニク; Stanley S Chen; スタンレイ・エス・チェン
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1992-02-10
Filing date: 1992-12-04
Publication date: 1993-11-05
Anticipated expiration: 2010-11-15
Also published as: JPH07107640B2; US5267345A; EP0555545A1

Abstract

(57)【要約】【目的】相当少いパラメータを使用して予測確率が高
く且つ正確な言語モデルを推定すること。【構成】仮説の各ワードに対する個々の記録を組合せ
てワード列仮説記録を生成し１０、記録されているワー
ドではないワード列仮説のワードから成る文脈が発生し
た場合における記録ワードから成る第１のクラスのワー
ドに対する推定の条件付発生確率と、第１のクラスのワ
ードを発生し及び文脈が発生した場合における記録ワー
ドの推定による条件付発生確率との組合せから一単位の
仮説記録及びワード列仮説記録を生成し２０，２２、最
良のワード列仮説記録を有する１以上のワード列仮説の
最良候補を記録し２４、有効な仮説記録を得るため複数
のワード列を分類するようにしたことを特徴とする。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は会話認識機能、言語翻訳
機能、スペル・チェッカ、及びワード列の仮説（又はワ
ード列仮説）を発生し記録するその他の装置に関し、特
に、会話認識機能、言語翻訳機能、スペル・チェッカ、
及び他の装置において、一続きのワード、すなわち、ワ
ード列の仮説を記録する言語モデルを有する言語生成装
置に関する。（本発明は海軍研究所により授与された契
約第Ｎ０００１４−９１−Ｃ−０１３５号に基づく政府
支援により成されたもので、政府が特定の権利を有す
る。）

【０００２】

【従来の技術】ある自動会話認識装置、自動言語翻訳装
置、及び自動スペル修正装置は次のモデル又は操作型式
に従って操作することが知られている。

【０００３】このモデルにおいて、Ｗは、例えば、英語
のワードのような１ワード以上の列を表わす一続きのワ
ード（又はワードの列、もしくはワード列）の仮説であ
り、Ｐｒ（Ｗ）の項はワード列仮説の発生確率である。
変数Ｙは観察信号であり、Ｐｒ（Ｙ）は観察信号の発生
確率である。Ｐｒ（Ｗ｜Ｙ）は観察信号Ｙが発生した場
合におけるワード列Ｗの発生確率である。Ｐｒ（Ｙ｜
Ｗ）はワード列Ｗが発生した場合における観察信号Ｙの
発生確率である。

【０００４】自動会話認識に対するＹは音響信号であ
る。［例えば、エル・アール・バールほかによる“連続
会話認識に対する最高に可能性があるアプローチ”（パ
ターン認識及び機械知能に関するＩＥＥＥ会報；Ｖｏ
ｌ．ＰＡＭＩ−５，Ｎｏ．２，１９８３年３月、１７９
〜１９０頁）参照］。自動言語翻訳に対するＹはワード
列仮説による言語とは異なる他の言語のワード列であ
る。

【０００５】［例えば、ピー・エフ・ブラウンほかによ
る“機械翻訳に対する統計的アプローチ”（電子計算機
言語学；Ｖｏｌ．１６，Ｎｏ．２，１９９０年６月、７
９〜８５頁）参照］。自動スペル修正に対するＹは多分
不完全なタイピストによって作成された一続きの文字で
ある。［例えば、イー・メイスほかによる“文脈基底の
スペル修正”（情報処理及びマネージメント；Ｖｏｌ．
２７，Ｎｏ．５，１９９１年、５１７〜５２２頁）参
照］。

【０００６】これら３つの適用において、信号Ｙが指定
された場合の信号Ｙを発生させる基である英語列Ｗの判
別を求める。一般に、多くの異なるワード列は同じ信号
Ｙを発生させるかもしれない。そのモデルは観察信号Ｙ
が指定された場合の最大条件付確率を有するワード列Ｗ
を選択することによって誤りワード列を選出する確率を
最少にすることができる。

【０００７】方程式１に示すように、観察信号Ｙが指定
された場合のワード列Ｗの条件付確率は次の３項の組合
わせである。すなわち、（ｉ）ワード列Ｗの確率は、
（ii）ワード列Ｗを意図したときに観察信号Ｙが発生す
る確率と掛け合わされ、（iii)信号Ｙを観察する確率に
よって割算される。

【０００８】自動会話認識の場合、推定されたワード列
Ｗがある場合の音響信号Ｙの確率はワード列Ｗの音響モ
デルを使用して推定することができる。自動言語翻訳に
おいて、仮説された英語翻訳ワード列Ｗがある場合にお
ける場合に他の言語のワード列Ｙの発生確率はワード列
Ｗに対する翻訳モデルを使用することによって推定され
る。

【０００９】自動スペル修正の場合、仮説されたワード
列Ｗがある場合におけるたぶん不完全なタイピストによ
る文字列Ｙの作成確率はワード列Ｗに対するミスタイプ
・モデルを使用することによって推定される。

【００１０】上記３例の適用において、ワード列Ｗの確
率は次の方程式に従いモデル化することができる。Ｐｒ（Ｗ₁ ^k) ＝Ｐｒ（Ｗ₁)Ｐｒ（Ｗ₂｜Ｗ₁) ・・・・Ｐｒ（Ｗ_k｜Ｗ₁ ^k-1) …［２］ここで、Ｗ₁ ^kは一続きのワード（又はワード列）
Ｗ₁，Ｗ₂，…，Ｗ_kを表わす。

【００１１】条件付確率Ｐｒ（Ｗ_k｜Ｗ₁ ^k-1)におい
て、Ｗ₁ ^k-1の項は活動記録機能又は予測機能と呼ばれ
る。活動記録の各ワードは予測機能ワードである。Ｗ_k
の項は予測機能又は類別機能と呼ばれる。

【００１２】

【発明が解決しようとする課題】上記方程式２におい
て、条件付確率を推定するための機構は言語モデルと呼
ばれる。言語モデルはテキストにつき限定付トレーニン
グを行うことによって条件付確率を推定する。トレーニ
ング・テキストを多くすると、言語モデルのパラメータ
の数も多くなり、言語モデルからより正確且つ精密な予
測を行うことはできるが、パラメータが相当多くなると
いうことのほか、相当複雑となる。

【００１３】以上、３つのすべての適用例において、観
察信号Ｙの発生確率Ｐｒ（Ｙ）は、あるパラメータの関
数としてモデル化することができるか、又は見出される
べきワード列Ｗとは無関係であるものとみなすことがで
きるかのどちらかである。後者の場合、Ｐｒ（Ｙ）の項
は方程式１においては抜けている。

【００１４】従って、本発明の目的は、会話認識装置の
用に供するような、相当少いパラメータを使用して高度
に正確且つ詳細な言語モデルを有する言語生成装置及び
方法を提供することである。

【００１５】本発明の他の目的は、相当少量のトレーニ
ング・テキストからの条件付予測ワードの確率が高く且
つ正確な言語モデルの推定を行いうる言語生成装置及び
方法を提供することである。

【００１６】更に、本発明の目的は、２以上のワード列
のような観察事象の集合を分類して、正確且つ精密な言
語モデルを生成する装置及び方法を提供することであ
る。

【００１７】

【課題を解決するための手段】本発明は、上記の目的に
鑑みてなされたもので、２以上のワード列仮説信号を発
生する手段を含む言語生成装置を特徴とする。その各ワ
ード列仮説信号は一続きの言語単位（又は言語単位の
列）から成るワード列仮説を表わす。各言語単位は言語
から選ばれた１以上のワードから成る。

【００１８】言語生成装置は、更に、各ワード列仮説に
おける各言語単位に対する一単位の仮説記録信号を発生
する手段を含む。各一単位の仮説記録信号はワード列仮
説における個々の言語単位の発生確率の推定を含む一単
位の仮説記録を表わす。

【００１９】各ワード列仮説に対するワード列仮説記録
信号を発生する手段が設けられる。その各ワード列仮説
記録信号はワード列仮説の言語単位に対する一単位の仮
説記録の組合せから成る。

【００２０】言語生成装置は更に最良のワード列仮説記
録を有するワード列仮説の候補を表わす１以上のワード
列仮説信号の候補を記録する手段を含む。少くとも１つ
の最良のワード列仮説の候補の少くとも１ワードを表わ
す少くとも１ワードの信号を出力する出力手段を設け
る。

【００２１】本発明における言語生成装置における第１
の個々の言語単位に対する一単位の仮説記録信号を生成
する手段は該第１の個々の言語単位ではないワード列仮
説の言語単位から成る文脈（又は前後関係）が発生した
場合における該第１の個々の言語単位から成る第１のク
ラスの言語単位の条件付発生確率の推定手段を含む。

【００２２】第１のクラスの言語単位が発生し、文脈が
発生した場合における第１の個々の言語単位の条件付発
生確率を推定する手段が設けられる。第１の個々の言語
単位に対する一単位の仮説記録信号は、文脈が発生した
場合における第１の言語単位の推定による条件付発生確
率と、第１のクラスの言語単位及び文脈が発生した場合
における第１の個々の言語単位の推定による条件付発生
確率との結合から成る第１の構成要素記録を含む。

【００２３】本発明の一面における第１のクラスの言語
単位が発生した場合、及び文脈が発生した場合における
第１の個々の言語単位の条件付発生確率は第１のクラス
の言語単位が発生した場合における第１の個々の言語単
位の条件付発生確率によって推定される。

【００２４】文脈が発生した場合における第１のクラス
の言語単位の条件付発生確率は第１の個々の言語単位で
はないワード列仮説の１以上の言語単位を含む第１の文
脈集合が発生した場合における第１のクラスの言語単位
の条件付発生確率によって推定することができる。

【００２５】代替的に、文脈が発生した場合における第
１のクラスの言語単位の条件付発生確率は（イ）第１の
個々の言語単位ではないワード列仮説の１以上の言語単
位から成る第１の文脈集合が発生した場合における第１
のクラスの言語単位の条件付発生確率と、（ロ）第１の
個々の言語単位ではないワード列仮説の１以上の言語単
位から成る第２の文脈集合（第１の文脈集合とは異な
る）が発生した場合における第１のクラスの言語単位の
条件付発生確率との重み付け又は加重結合として推定す
ることができる。

【００２６】第１の個々の言語単位に対する一単位の仮
説記録信号を生成する手段は、更に、第１の個々の言語
単位ではないワード列仮説の言語単位から成る文脈が発
生した場合における、第１の言語単位から成る第２のク
ラスの言語単位の条件付発生確率を推定する手段を含む
ことができる。又、第２のクラスの言語単位及び文脈が
発生した場合における第１の個々の言語単位の条件付発
生確率を推定する手段が設けられる。

【００２７】第２の構成要素の記録は文脈が発生した場
合における第２のクラスの言語単位の推定による条件付
発生確率と、第２のクラスの言語単位が発生し及び文脈
が発生した場合における第１の個々の言語単位の推定に
よる条件付発生確率との結合を含むものから作成され
る。第１の個々の言語単位に対する一単位の仮説記録は
第１及び第２の構成要素記録の加重結合から成る。

【００２８】第２のクラスの言語単位が発生し及び文脈
が発生した場合における第１の個々の言語単位の条件付
発生確率は第２のクラスの言語単位が発生した場合にお
ける第１の個々の言語単位の条件付発生確率によって推
定することができる。

【００２９】文脈が発生した場合における第２のクラス
の言語単位の条件付発生確率は、第１の個々の言語単位
ではなく、ワード列仮説の１以上の言語単位から成る第
１の文脈集合が発生した場合における第２のクラスの言
語単位の条件付発生確率によって推定することができ
る。

【００３０】代替的に、文脈が発生した場合における第
２のクラスの言語単位の条件付発生確率は、第１の個々
の言語単位ではないワード列仮説の１以上の言語単位か
ら成る第２の文脈集合（第１の文脈集合とは異なる）が
発生した場合における第２のクラスの言語単位の条件付
発生確率と先行する量との加重結合として推定すること
ができる。

【００３１】２以上のワード列仮説信号を発生する手段
は、例えば、一続きの連続時間間隔の各々に対する発音
の少くとも１つの機能の値を測定してその機能値を表わ
す一続きの音響機能信号（又は音響機能信号の列）を作
成する音響プロセッサを含むことができる。

【００３２】又、複数のワード列仮説の各々に対する音
響一致記録を発生する手段が設けられる。各音響一致記
録はワード列仮説の音響モデルと音響機能信号の列との
間の一致の終結の推定を含む。最後に、最良の音響一致
記録を有するワード列仮説を表わす２以上のワード列仮
説信号を発生する手段を設ける。

【００３３】音響プロセッサはマイクロホンを含むこと
ができる。出力手段は、例えば、少くとも１つのワード
列仮説の最良候補の少くとも１ワードを表示する手段を
含むことができる。表示手段は、例えば、陰極線管又は
液晶表示装置でよい。

【００３４】代替的に、出力手段は少くとも１つのワー
ド列仮説の最良候補の少くとも１ワードの音響を発生す
る手段を含むことができる。音響発生手段は、例えば、
会話シンセサイザ及び（又は）ラウドスピーカを含むこ
とができる。又、ワード列仮説の候補を記録する記録手
段は電子読取書込メモリーを含むことができる。

【００３５】本発明は、又一組の観察事象又は観察事象
の集合を分類する装置及び方法を含む。各事象は予測機
能及び類別機能を有する。予測機能は２以上の異なる値
の１つを有する。類別機能は２以上の異なる可能値の１
つを有する。本発明による装置は事象集合の各事象の予
測機能値及び類別機能値を測定する手段を含む。

【００３６】１以上の異なる類別機能値の非補集合を選
択し、少くとも３以上の予測機能値の非補集合を選択す
る手段が設けられる。類別機能値の各集合は可能なすべ
てのものより少い類別機能値を含む。予測機能値の各集
合は可能なすべてのものより少い予測機能値を含む。

【００３７】分類装置は、更に、予測機能の値の各集合
に対し、及び類別機能値の各集合に対する一次予測記録
を発生する手段を含む。各一次予測記録は、予測機能値
の集合が如何に良く観察事象の集合の全事象に対する一
組の類別機能値（又は類別機能値の集合）の発生を予測
するかの推定を含む。事象の予測機能値が最良の一次予
測記録を有する予測機能値の集合の数の場合、その事象
は第１のクラスに分類される。

【００３８】又、最良の一次予測記録を有する予測機能
値の集合ではない予測機能値の各集合、及び類別機能値
の各集合に対する二次予測記録を発生する手段が設けら
れる。各二次予測記録は、予測機能値の集合が第１のク
ラスの観察事象の全事象に対する類別機能値の一集合の
発生を如何に良く予測するかの推定を含む。

【００３９】第１のクラスの事象は、該事象の予測機能
値が最良の二次予測記録を有する予測機能値の集合の数
である場合、第１のサブクラスに分類される。

【００４０】本発明による分類装置及び方法において、
各一次予測記録は、予測機能値の集合が予測機能値の集
合と関連する一次加重係数によって加重される観察事象
の集合における一組の類別機能値の発生を如何に良く予
測するかの推定を含む。

【００４１】各二次予測記録は予測機能値の集合がそれ
に関する二次加重係数によって加重された第１のクラス
の観察事象における一組の類別機能値の発生を如何によ
く予言するかの推定を含む。最良の一次予測記録を有す
る予測機能値の集合ではない、少くとも一組の予測機能
値は関連する二次加重係数に等しくない関連する一次加
重係数を保有する。

【００４２】本発明の一面によると、各事象は一続きの
２以上のワード又は２以上のワードからなるワード列を
含む。本発明による装置は、更に、事象の予測機能値が
最良の二次予測記録を有する予測機能値の集合の数では
ない場合、第１のクラスの第２のサブクラスの事象を分
類する手段を含むことができる。

【００４３】本発明は、又、認識されるべき発音の一続
きの符号化表示を出力する音響プロセッサを含む会話認
識装置を提供する。複数のワード列仮説の各々に対する
音響一致記録を発生する手段が設けられる。各音響一致
記録は、ワード列仮説の音響モデルと一続きの発音の符
号化表示との間の一致の終結の推定を含む。

【００４４】各ワード列仮説は２以上のワードから成
る。又、最良の音響一致記録を有するワード列仮説を表
わす２候補以上のワード列仮説信号を発生する手段が設
けられる。本発明による言語生成装置はワード列仮説の
候補を受けて、少くとも１つのワード列仮説の最良候補
の少くとも１ワードを表わす少くとも１ワードの信号を
出力する。

【００４５】本発明による言語生成装置及び方法と、会
話認識装置とは、言語モデルのワードを各クラスにグル
ープ化することによって、相当少ないパラメータにより
高度に正確な言語モデルを取得することができる。又、
多数の異なるクラス基底の言語モデルを結合することに
よって、相当少量のトレーニング・テキストであって
も、それによって高度に正確な言語モデルを取得するこ
とができる。

【００４６】本発明による一組の観察事象を分類する装
置及び方法においては、異なるレベルの分類に対する一
組の予測装置機能値に対し異なる加重係数を割当てるこ
とによって、分類された結果のワード順次を使用して改
良した言語モデルを発生させることができる。

【００４７】

【実施例】以下、添付図面に基づき本発明の好ましい実
施例を詳細に説明する。図１は本発明による言語生成装
置の例を示すブロック図である。言語生成装置は２以上
のワード列仮説信号を発生するワード列仮説生成装置１
０を含む。各ワード列仮説信号は一続きの言語単位から
成るワード列仮説を表わす。各言語単位はある言語から
選ばれた１以上のワードから成る。

【００４８】ワード列仮説生成装置１０の一例を図２の
ブロック図に示す。この例において、ワード列仮説生成
装置１０は、一続きの連続時間間隔の各々に対する発音
の少くとも１機能の値を測定して、機能値を表わす音響
機能信号の列を作成する音響プロセッサ１２を含む。

【００４９】音響一致記録生成装置１４は複数のワード
列仮説の各々に対する音響一致記録を発生する。各音響
一致記録はワード列仮説の音響モデル（音響モデル記憶
装置１６に記憶される）と、音響プロセッサ１２からの
音響機能信号の列との間の一致の終結の推定を含む。

【００５０】記憶装置１６に記憶されている音響モデル
は、例えば、マルコフ（Markov）モデルでよい。音響モ
デルのパラメータは、例えば、前方後方アルゴリズム
（Forward-Backward Algorithm) によって公知の発音の
トレーニング・テキストから推定することができる。音
響一致記録は、例えば、最も見込みのある推定によって
取得することができる。（例えば、エル・アール・バー
ルによる上記の文献（１９８３年３月）を参照）。

【００５１】最後に、ワード列仮説生成装置１０は、最
良の音響一致記録を有するワード列仮説を表わす２以上
のワード列仮説信号を発生する手段１８を含む。

【００５２】代替的に、ワード列仮説生成装置１０は自
動言語翻訳記録又は自動スペル修正記録に基づきワード
列仮説を発生することができる。（例えば、ピー・エフ
・ブラウンほか（１９９０年６月）、及びイー・メイス
ほか（１９９１年）による上記の文献参照）。

【００５３】図１に戻り、言語生成装置又は言語生成機
能は、更に各ワード列仮説の各言語単位に対する一単位
の仮説記録信号を発生する一単位の仮説記録生成装置２
０を含む。各一単位の仮説記録信号は、ワード列仮説の
個々の言語単位の発生確率の推定から成る一単位の仮説
記録を表わす。

【００５４】ワード列仮説記録生成装置２２は各ワード
列仮説に対するワード列仮説記録信号を発生する。各ワ
ード列仮説記録信号はワード列仮説の言語単位に対する
一単位の仮説記録の結合又は組合せの指示を含む。

【００５５】言語生成装置は、更に、最良のワード列仮
説記録を有するワード列仮説の候補を表わす１以上のワ
ード列仮説の候補を記録するワード列仮説の最良候補記
録装置２４を含む。ワードの出力２６は少くとも１つの
ワード列仮説の最良候補の少くとも１ワードを表わす少
くとも１ワードの信号を出力する。

【００５６】図３は一単位の仮説記録生成装置２０の例
を示すブロック図である。一単位の仮説記録生成装置２
０は、第１の個々の言語単位ではないワード列仮説の言
語単位から成る文脈が発生した場合における第１の個々
の言語単位から成る第１のクラスの言語単位の条件付発
生確率を推定する手段２８を含む。

【００５７】第１のクラスの言語単位が発生した場合、
及び文脈が発生した場合における第１の個々の言語単位
の条件付発生確率の推定手段３０が設けられる。

【００５８】文脈が発生した場合における第１のクラス
の言語単位の条件付発生確率は、選ばれた文脈を有する
第１のクラスの言語単位におけるワードのトレーニング
・テキストの発生数をカウントし、そのカウントを選ば
れた文脈を有するワードのトレーニング・テキスト３２
の発生数で割算することによって、トレーニング・テキ
スト３２から推定することができる。

【００５９】第１のクラスの言語単位が発生し、文脈が
発生した場合における第１の個々の言語単位の条件付発
生確率は、選ばれた文脈を有する個々の言語単位のトレ
ーニング・テキストの発生数をカウントし、選ばれた文
脈を有する第１のクラスの言語単位におけるワードのト
レーニング・テキストの発生数によってそのカウントを
割算することによって、トレーニング・テキスト３２か
ら推定することができる。

【００６０】一単位の仮説記録生成装置２０は、更に文
脈が発生した場合における第１のクラスの言語単位の推
定による条件付発生確率と、第１のクラスの発生及び文
脈が発生した場合における第１の個々の言語単位の推定
による条件付発生確率との結合から成る第１の構成要素
記録を含む第１の個々の言語単位に対する一単位の仮説
記録信号を発生する手段３４を有する。

【００６１】第１のクラスの言語単位が発生し、文脈が
発生した場合における第１の個々の言語単位の条件付発
生確率は第１のクラスの言語単位が発生した場合におけ
る第１の個々の言語単位条件付発生確率から推定するこ
とができる。

【００６２】この場合、第１のクラスの言語単位が発生
した場合における第１の個々の言語単位の条件付発生確
率は第１の個々の言語単位のトレーニング・テキストの
発生数をカウントし、そのカウントを第１のクラスの言
語単位の全ての言語単位のトレーニング・テキストの発
生数で割算することによってトレーニング・テキストか
ら推定することができる。

【００６３】文脈が発生した場合における第１のクラス
の言語単位の条件付発生確率は、第１の個々の言語単位
ではなく、ワード列仮説の１以上の言語単位から成る第
１の文脈集合が発生した場合における第１のクラスの言
語単位の条件付発生確率から推定することができる。

【００６４】代替的に、文脈が発生した場合における第
１のクラスの言語単位の条件付発生確率は２以上の構成
要素の加重結合と推定することができる。例えば、１つ
の構成要素は、第１の個々の言語単位ではなく、ワード
列仮説の１以上の言語単位から成る第１の文脈集合が発
生した場合における第１のクラスの言語単位の条件付発
生確率であることができる。

【００６５】第２の構成要素は、第１の個々の言語単位
ではないワード列仮説の１以上の言語単位から成る第２
の文脈集合（第１の文脈集合とは異る）が発生した場合
における第１のクラスの言語単位の条件付発生確率であ
ることができる。加重係数は、例えば、削除補間法によ
って得ることができる（例えば、エル・アール・バール
ほかによる前述の文献（１９８３年）参照）。

【００６６】図１及び図３に示す一単位の仮説生成装置
２０に代替する該装置２０においては、手段２８は第１
の個々の言語単位ではなく、ワード列仮説の言語単位を
構成する文脈が発生した場合における第１の個々の言語
単位を含む第２のクラスの言語単位の条件付発生確率を
推定することができる手段である。

【００６７】又、手段３０は、第２のクラスの言語単位
が発生し、文脈が発生した場合における第１の個々の言
語単位の条件付発生確率を推定することができる手段で
ある。両条件付確率共、前述のように、トレーニング・
テキトス３２から推定することができる。

【００６８】次に、手段３４は、文脈が発生した場合に
おける第２のクラスの言語単位の推定による条件付発生
確率と、第２のクラスの言語単位が発生し、文脈が発生
した場合における第１の個々の言語単位の推定による条
件付発生確率との結合から成る第２の構成要素記録を発
生する発生手段である。

【００６９】第１の個々の言語単位に対する一単位の仮
説記録は第１の構成要素記録と第２の構成要素記録との
加重結合を含む。加重係数は、例えば、削除補間法によ
って得ることができる。

【００７０】第２のクラスの言語単位が発生した場合、
及び文脈が発生した場合における第１の個々の言語単位
の条件付発生確率は、第２のクラスの言語単位が発生し
た場合における第１の個々の言語単位の条件付発生確率
から推定することができる。

【００７１】第２のクラスの言語単位が発生した場合に
おける第１の個々の言語単位の条件付発生確率は、第１
の個々の言語単位のトレーニング・テキストの発生数を
カウントし、そのカウントを第２のクラスの言語単位に
おけるトレーニング・テキストの言語単位の発生数で割
算することによってトレーニング・テキスト３２から推
定することができる。

【００７２】文脈が発生した場合における第２のクラス
の言語単位の条件付発生確率は、第１の個々の言語単位
ではなく、ワード列仮説の１以上の言語単位から成る第
１の文脈集合が発生した場合における第２のクラスの言
語単位の条件付発生確率と推定することができる。

【００７３】代替的に、文脈が発生した場合における第
２のクラスの言語単位の条件付確率は、下記２つの条件
付確率（イ），（ロ）のような２以上の項の加重結合と
推定することができる。

【００７４】すなわち、それらは（イ）第１の個々の言
語単位ではなく、ワード列仮説の１以上の言語単位から
成る第１の文脈集合が発生した場合における第２のクラ
スの言語単位の条件付発生確率、及び（ロ）第１の個々
の言語単位ではなく、ワード列仮説の１以上の言語単位
から成る第２の文脈集合（第１の文脈集合とは異なる）
が発生した場合における第２のクラスの言語単位の発生
確率である。

【００７５】本発明による言語生成装置及び方法の操作
は下記の仮説例のように例示することができる。下記テ
ーブル１は、各言語単位が単一ワードである場合の７ク
ラス（Ａ乃至Ｆ）の言語単位の仮説例を示すものであ
る。この仮説例において、各クラスは６ワードを含み、
それより多くはどの１クラスにも見られない。

【００７６】テーブル１クラスワードＡ速い、迅速な、空腹な、狩猟、怒り、致死のＢ列車、家、車、本、計算機、スキーＣ上に、の、に、として、近くに、対するＤ私の、彼の、１つの、その、何、あるＥしし、たか、さめ、狼、とら、くまＦ空気、森、空、山、公園、木

【００７７】下記テーブル２は、クラスＡ乃至Ｆに対
し、ワード列の先行ワードＷ（ｉ−１）のクラスから成
る文脈が発生した場合におけるワード列の第ｉワードの
クラスＷ（ｉ）の条件付発生確率の仮説値を示す。前述
のように、条件付確率トレーニング・テキストのワード
発生をカウントして得ることができる。

【００７８】テーブル２Ｗ(i−1) 確率［Ｗ（ｉ）のクラス｜Ｗ（ｉ−１）のクラス］のクラスＷ(i) ＡＢＣＤＥＦＡ 0.047 0.0208 0.025 0.0236 0.0869 0.0028 Ｂ 0.013 0.0005 0.026 0.0466 0.0147 0.0262 Ｃ 0.0588 0.0291 0.0043 0.0291 0.0269 0.0673 Ｄ 0.0224 0.0208 0.0499 0.0006 0.0159 0.0022 Ｅ 0.0093 0.0356 0.024 0.0651 0.0004 0.034 Ｆ 0.0084 0.0448 0.0448 0.0474 0.0397 0.0003

【００７９】図３はワード列仮説の第２先行ワードＷ
（ｉ−２）のクラスから成る文脈が発生した場合におけ
るワード列のワードＷ（ｉ）のクラスの条件付発生確率
の仮説値を示す。条件付確率はトレーニング・テキスト
のワード発生をカウントすることによって取得すること
ができる。

【００８０】テーブル３Ｗ(i−2) 確率［Ｗ（ｉ）のクラス｜Ｗ（ｉ−２）のクラス］のクラスＷ(i) ＡＢＣＤＥＦＡ 0.0016 0.0049 0.047 0.0038 0.0113 0.0513 Ｂ 0.0518 0.0432 0.0011 0.0313 0.0135 0.007 Ｃ 0.034 0.041 0.0318 0.0291 0.0405 0.0329 Ｄ 0.021 0.0324 0.0443 0.0076 0.0421 0.0518 Ｅ 0.0086 0.0232 0.0405 0.0383 0.0005 0.041 Ｆ 0.0194 0.0157 0.0318 0.0281 0.0291 0.0475

【００８１】テーブル４は、各クラスＡ乃至Ｆについ
て、ワードＷ（ｉ）を含むクラスＣ［Ｗ（ｉ）］が発生
した場合におけるワード列仮説のワードＷ（ｉ）の条件
付発生確率に対する仮説値を示す。

【００８２】テーブル４確率［Ｗ（ｉ）｜Ｗ（ｉ）のクラス］Ｗ（ｉ）速い迅速な空腹な狩猟怒り致死のＰ｛W(i)｜C[W(i)] ｝ 0.224 0.198 0.407 0.041 0.033 0.097 Ｗ（ｉ）列車家車本計算機スキーＰ｛W(i)｜C[W(i)] ｝ 0.336 0.179 0.294 0.01 0.006 0.175 Ｗ（ｉ）上にのにとして近くに対するＰ｛W(i)｜C[W(i)] ｝ 0.134 0.142 0.167 0.064 0.297 0.196 Ｗ（ｉ）私の彼の１つのその何あるＰ｛W(i)｜C[W(i)] ｝ 0.177 0.159 0.083 0.198 0.181 0.201 Ｗ（ｉ）ししたかさめ狼とらくまＰ｛W(i)｜C[W(i)] ｝ 0.184 0.212 0.241 0.071 0.027 0.265 Ｗ（ｉ）空気森空山公園木Ｐ｛W(i)｜C[W(i)] ｝ 0.249 0.123 0.145 0.055 0.257 0.17

【００８３】テーブル５は４つの異なるワード列仮説の
ワードＷｉに対する一単位の仮説記録を示す。一単位の
仮説記録はテーブル２，３、及び４の条件付確率値を使
用して得られたものである。この仮説例において、先行
ワードのクラスが指定され、第２番先行ワードのクラス
が指定された場合におけるＷ（ｉ）のクラスの条件付確
率がそれぞれ０．７５及び０．２５だけ重み付け又は加
重される。

【００８４】テーブル５一単位の仮説記録 P(C(W_i )｜ P(C(W_i )｜ P(C(W_i )｜構成構成加重Ｗ_i-2Ｗ_i-1Ｗ_i C(W_i-1)) C(W_i-2)) C(W_i)) 要素要素結合その怒りさめ 0.0869 0.0421 0.241 0.0209 0.0101 0.0182 その怒り公園 0.0028 0.0518 0.257 0.0007 0.0133 0.0039 近くそのスキー 0.0208 0.041 0.175 0.0036 0.0072 0.0045 近くその空 0.0022 0.0329 0.145 0.0003 0.0048 0.0014 重み＝0.75 0.25

【００８５】同様な方法に従い、各仮説の各他のワード
に対する一単位の仮説記録を得ることができる。その
後、各仮説に対するワード列仮説記録は仮説の全ワード
に対する一単位の仮説記録を結合することによって取得
することができる。一単位の記録が推定された確率を表
わしたときに、その記録は掛算により結合することがで
きる。一単位の記録が確率の推定されたアルゴリズムを
表わしたときに、その記録は加算により結合することが
できる。

【００８６】テーブル５の仮説例に戻り、ワード列“そ
の怒りさめ”と“その怒り公園”との間で、最初の２ワ
ードの一単位の仮説記録は両仮説とも同一である。故
に、“その怒りさめ”に対するワード列仮説記録は“そ
の怒り公園”に対するワード列仮説記録より良いであろ
う（この場合、より高いことはより良いことである）。
従って、ワード列“その怒りさめ”及び“その怒り公
園”間では、“その怒りさめ”が表示されるであろう。

【００８７】同様に、ワード列“近くそのスキー”及び
“近くその空”間において、最初の２ワードの一単位の
仮説記録は両仮説共同一である。故に、“近くそのスキ
ー”に対するワード列仮説記録は“近くその空”に対す
るワード列仮説記録より良いであろう（この場合、より
高いことはより良いことである）。従って、ワード列
“近くそのスキー”及び“近くその空”間では“近くそ
のスキー”が表示される。

【００８８】本発明による言語生成装置及び方法に対す
る１以上の言語単位から成る文脈集合と、言語単位のク
ラスとは、観察事象集合を分類する装置及び方法を使用
して得ることができる。その観察事象集合の各事象は予
測機能及び類別機能を有する。予測機能は２以上の異な
る可能値の１つを有し、類別機能は２以上の異なる可能
値の１つを有する。

【００８９】言語生成装置に対する言語モデルにおける
各事象は、例えば、一続きの２以上のワードＷ₁，
Ｗ₂，Ｗ₃，Ｗ₄，…，Ｗ_nを含むことができる。各ワ
ード列において、予測されるワードは類別機能であり、
残りのワードは予測機能である。

【００９０】例えば、３ワード列（一続きの３ワード、
又は３ワードからなるワード列）において、第１及び第
２のワードは予測機能であることができ、予測される第
３のワードは類別機能であってよい。かくして、文“会
話認識は最も見込みのあるある復号化の問題として明記
される”はテーブル６に示すような３ワード事象を含
む。

【００９１】テーブル６テキスト： “会話認識は最も見込みのあるある復号化の問題として明記される。” ３ワード事象予測機能類別機能１会話認識される２認識される明記３される明記として４明記としてある５としてある問題６ある問題の７問題の最も８の最も見込みのある９最も見込みのある復号化

【００９２】図４は本発明による一組の観察事象を分類
する装置の例を示すブロック図である。この分類装置は
その事象集合の各事象の予測機能値及び類別機能値を測
定する機能値測定機能３６を含む。トレーニング・テキ
ストは磁気又は他の媒体３８に機械読取可能形式で記録
する場合、機能値測定機能３６は媒体のデータを読取る
ために適当なハードウェア及びソフトウェアを含むこと
ができる。

【００９３】観察した事象を分類する装置は、更に類別
機能値の１以上の異なる非補集合を選択する類別機能値
集合選択機能４０を含む。各組の類別機能値はすべて可
能なものより少い類別機能値を含む。各事象が一続きの
ｎワードＷ₁，Ｗ₂，Ｗ₃，…，Ｗ_nから成る場合、事
象の類別機能値は、例えば、ワード列の最後のワードＷ
_nと一致することができる。そこで、各類別機能値の集
合はトレーニング・テキストのワードの全語彙の部分集
合を含む。

【００９４】予測機能値集合選択機能４２は予測機能値
の少くとも３つの異なる非補集合を選択する。各組の予
測機能値はすべて可能な値より少い予測機能値を含む。
各事象が一続きのｎワードＷ₁，Ｗ₂，Ｗ₃，…，Ｗ_n
から成る場合、その事象の予測機能値は、例えば、ワー
ド列の最初の（ｎ−１）ワードＷ₁，Ｗ₂，…，Ｗ_n-1
と一致することができる。各組の予測機能値は、例え
ば、ワード列のワードＷ_P（１＜ _P＜ｎ−１）がトレー
ニング・テキストのワードの全語彙の多数の部分集合で
ある場合、全てのワード列Ｗ₁，Ｗ₂，…，Ｗ_n-1を含
む。

【００９５】ワードＷ_nに対する類別機能値の集合及び
ワードＷ_Pに対する予測機能値の集合を判別する語彙部
分集合は、トレーニング・テキストの隣接ワード｛Ｗ
_i-1及びＷ₁｝の部分集合の平均相互情報が“ハイ”で
あるというように、Ｖワードの語彙を２つの相互に排他
的な部分集合Ｃ₁及びＣ₂に区分することによって取得
することができる。平均相互情報Ｉは下式３によって与
えられる。

【００９６】

【数１】

【００９７】上式で、Ｐ（Ｃ_m ¹，Ｃ_n ²）は２つの隣
接するワード列｛Ｗ₁，Ｗ₂｝において、最初のワード
がクラスＣ_mにあり、第２のワードがクラスＣ_nにある
確率である。下記のアルゴリズムは隣接ワードの部分集
合の平均相互情報がハイであるように、Ｖワードの語彙
を２つの部分集合の区分に使用することができる。まず
最初、語彙Ｖの各ワードを異なる部分集合に割当て、上
記方程式［３］から隣接するワードの部分集合間の平均
相互情報を得る。すべて可能な部分集合対に対し、その
１部分集合対が組合わされ、隣接ワードの部分集合間の
平均相互情報が計算される。平均相互情報の損失が最少
である部分集合対が組合わされて、（Ｖ−１）部分集合
のみが残る。

【００９８】その語彙の各ワードは（Ｖ−１）部分集合
から最大相互情報を有する区分を生ずる部分集合に移動
する。最大平均相互情報を有する区分に導くワードの再
割当てがない場合（Ｖ−１）部分集合は完成する。２以
上のワードを同時に再割当てすることによってより高い
平均相互情報を有する区分を見付けることが可能である
かもしれないが、そのような検索は実現するためにはあ
まりにもコストが高過ぎると思われる。

【００９９】その後、処理は、２つの部分集合が残るま
で、（Ｖ−１）部分集合を（Ｖ−２）部分集合に、以下
そのように、組合わせるよう繰返えされる。上記の組合
せアルゴリズムにおいて、クラスタが組合わされる順序
が２進ツリーを定義する。２進ツリーの根部はワードの
全語彙である。

【０１００】２進ツリーの葉はその語彙の個々のワード
である。２進ツリーの個々のノードは類別機能値の集合
及び予測機能値の集合の判別に使用することができる追
加の語彙部分集合を定義する。図４に戻り、一次予測記
録生成装置４４は予測機能値集合選択機能４２からの各
予測機能値集合、及び類別機能値集合選択機能４０から
の各類別機能値集合に対する一次予測記録を発生する。

【０１０１】各一次予測記録は、予測機能値の集合が観
察事象３８の集合の全事象に対する類別機能値の１集合
の発生を如何に良く予測するかの推定を含む。手段４６
は、事象の予測機能値が最良の一次予測記録を有する予
測機能値集合のメンバである場合、第１のクラスの観察
事象を分類する分類手段である。

【０１０２】第２の予測記録生成装置４８は、最良の一
次予測記録を有する予測機能値の集合ではない予測機能
値の各集合に対し、及び類別機能値の各集合に対する二
次予測記録を発生する。

【０１０３】各二次予測記録は予測機能値の集合が第１
のクラスの観察事象４６における第１のクラスの全事象
に対する類別機能値の１集合の発生を如何によく、又は
完全に予測するかの推定を含む。第１のクラスの観察事
象からの事象は、予測機能値が最良の二次予測記録を有
する予測機能値の集合のメンバーである場合、第１のサ
ブクラスの観察事象５０に分類される。

【０１０４】各一次予測記録は、予測機能値の集合が予
測機能値の集合に関する一次加重係数によって加重され
た観察事象の集合の類別機能値の集合が発生することを
如何によく、又は完全に予測するかの推定を含む。各二
次予測記録は、予測機能値の集合が予測機能値の集合に
関する二次加重係数によって加重された第１のクラスの
観察事象の類別機能値の集合が発生することを如何に良
く予測するかの推定を含む。

【０１０５】最良の一次予測記録を有する予測機能値の
集合ではない、少くとも１つの予測機能値の集合はその
関連する二次加重係数に等しくない関連する一次加重係
数を持つ。

【０１０６】一組の観察事象（観察事象の集合）を分類
する装置及び方法は、更にその事象の予測機能値が最良
の二次予測記録を有する予測機能値の集合のメンバーで
はない場合に、第２のサブクラスの第１のクラスの事象
からの事象を分類する手段を含むことができる。

【０１０７】予測機能値の集合Ｂに対し、及び類別機能
値の集合Ｙに対する予測記録は、例えば、予測機能値の
集合による事象の２進分割があった場合、類別機能値の
集合による事象の２進分割の条件付エントロピーＨ（Ｙ
｜Ｂ）であることができる。

【０１０８】

【数２】

【０１０９】

【数３】

【０１１０】上記方程式５において、Ｐは試験データか
ら推定した確率分布を表わし、Ｍはトレーニング・デー
タから得られた確率分布を表わす。１例においては、使
用可能なデータの全てが１トレーニング集合及び１試験
集合に分割することができる。Ｐ及びＭの確率分布はそ
れぞれ試験集合及びトレーニング集合の事象により判別
される。

【０１１１】代替的に、データの全集合はＬセグメント
に区分することができ、そして各事象はＬセグメントの
１つと共同する。クロス−エントロピーは試験データと
してそのセグメントを使用し、及びトレーニング・デー
タとして他のセグメントのすべてに所属する残るデータ
のすべてを使用して、各セグメントにつき計算される。
そこで、セグメントに対するクロス−エントロピーは総
和して合計クロス−エントロピーを得る。

【０１１２】他の代替として、予測機能値の集合Ｂに対
し、及び類別機能値の集合Ｙに対する予測記録は集合Ｂ
が指定され、予測機能値の他の集合Ｂ′が指定された場
合における集合Ｙの条件付エントロピーＨ（Ｙ｜Ｂ，
Ｂ′_n) を推定することによって次の分類レベルの方に
先見することができる。

【０１１３】

【数４】

【０１１４】類別機能値の集合Ｙ、及び予測機能値の集
合Ｂに対する予測記録は予測機能値の全集合Ｂ′_nに対
する方程式６から得られる最良の（この場合、最小の）
値のＨ（Ｙ｜Ｂ，Ｂ′_n）である。

【０１１５】本発明による言語生成装置及び方法、観察
事象の集合を分類する装置及び方法、及び会話認識装置
は適切にプログラムされたコンピュータシステムの形式
であるのが好ましい。

【０１１６】かかるシステムにおいて、ワード出力２６
は陰極線管又は液晶表示装置のような表示装置であるこ
とができる。代替的に、ワード出力２６はラウドスピー
カを有する会話シンセサイザのような音響発生器でもよ
い。ワード列仮説の候補を記録する手段及び他の記録手
段は電子読取書込メモリーを含むことができる。

【０１１７】次に、図５に基づき、音響プロセッサ１２
（図２）の１例について説明する。測定手段は発音に対
応するアナログ電気信号を発生するマイクロホン５２を
含む。マイクロホン５２から発生したアナログ電気信号
はアナログ−ディジタル変換装置５４によってディジタ
ル電気信号に変換される。アナログ−ディジタル変換装
置５４による変換のため、例えば、２０KHz の速度でア
ナログ信号を標本化することができる。

【０１１８】ウインドウ生成装置５６は、例えば、１０
ミリ秒（１センチ秒）ごとにアナログ−ディジタル変換
装置５４からディジタル信号の２０ミリ秒期間サンプル
を取得する。ディジタル信号の各２０ミリ秒サンプルは
スペクトル解析機能５８によって解析され、例えば、２
０周波数帯域の各々におけるディジタル信号サンプルの
振幅が得られる。

【０１１９】又、スペクトル解析機能５８は２０ミリ秒
ディジタル信号サンプルの合計振幅又は合計電力を表わ
す第２１次元信号を発生するものであることが望まし
い。スペクトル解析機能５８は、例えば、速いフーリエ
変換プロセッサでよい。代替的に、それは２０周波数帯
域通過フィルタ列でもよい。

【０１２０】スペクトル解析機能５８から生成された第
２１次元ベクトル信号は最適又は適応雑音消去プロセッ
サ６０による背景雑音の除去が適用される。適応雑音消
去プロセッサ６０は雑音消去プロセッサに入力された機
能ベクトルＦ（ｔ）から雑音ベクトルＮ（ｔ）を減算し
て出力機能ベクトルＦ′（ｔ）を生成する。雑音消去プ
ロセッサ６０は、先行機能ベクトルＦ（ｔ−１）が雑音
又は無音と識別されたときには、常に雑音ベクトルＮ
（ｔ）を周期的に更新することによって雑音レベルを変
更するよう適用することができる。

【０１２１】雑音ベクトルＮ（ｔ）は次の方程式７に従
い更新される。Ｎ（ｔ）＝Ｎ（ｔ−１）＋ｋ［Ｆ（ｔ−１）−Ｆｐ（ｔ−１）］ …［７］

【０１２２】上式において、Ｎ（ｔ）は時間ｔにおける
雑音ベクトル、Ｎ（ｔ−１）は時間（ｔ−１）における
雑音ベクトル、ｋは最適雑音消去モデルの固定パラメー
タ、Ｆ（ｔ−１）は時間（ｔ−１）において雑音消去プ
ロセッサ６０に入力され雑音か無音かを表わす機能ベク
トル、Ｆｐ（ｔ−１）は記録手段６２からの機能ベクト
ルＦ（ｔ−１）に最も近い１無音又は雑音原型ベクトル
である。

【０１２３】先行機能ベクトルＦ（ｔ−１）は、（イ）
ベクトルの合計エネルギがしきい値以下であるか、又は
（ロ）機能ベクトルに対する適応原型ベクトル記録機能
６４に適合する最近の原型ベクトルが雑音か無音を表わ
す原型であるか、のどちらかの場合、雑音又は無音と認
められる。機能ベクトルの合計エネルギの解析のため、
しきい値は、例えば、機能ベクトルが評価される２秒前
に発生した全機能ベクトル（会話及び無音の両方によ
る）の第５の１００分位数であることができる。

【０１２４】雑音消去の後、機能ベクトルＦ′（ｔ）は
短期平均正規化プロセッサ６６により、入力会話の大き
さの変化を調節するよう正規化される。正規化プロセッ
サ６６は第２１次元機能ベクトルＦ′（ｔ−１）を正規
化して第２０次元正規化機能ベクトルＸ（ｔ）を生成す
る。合計振幅又は合計電力を表わす第２１次元の機能ベ
クトルＦ′（ｔ）は廃棄される。

【０１２５】時間ｔにおける正規化された機能ベクトル
Ｘ（ｔ）の各成分ｉは、例えば、対数定義域において下
記方程式８により与えることができる。Ｘ_i（ｔ）＝Ｆ′_i（ｔ）−Ｚ（ｔ） …［８］

【０１２６】上式において、Ｆ′_i（ｔ）は時間ｔにお
ける非正規化ベクトルの第ｉ成分、Ｚ（ｔ）は、下記方
程式９及び１０によるＺ（ｔ−１）及びＦ′（ｔ）の成
分の重み付け又は加重手段である。

【０１２７】

【数５】

【０１２８】正規化された第２０次元機能ベクトルＸ
（ｔ）は会話音の発音の変化に適応することができるよ
う適応ラベラ６８によって更に処理することができる。
適合する第２０次元機能ベクトルＸ′（ｔ）は適応ラベ
ラ６８の入力に供給された第２０次元機能ベクトルＸ
（ｔ）から第２０次元適応ベクトルＡ（ｔ）を減算する
ことによって生成される。

【０１２９】時間ｔにおける適応ベクトルＡ（ｔ）は、
例えば、下記方程式11で与えることができる。Ａ（ｔ）＝Ａ（ｔ−１）＋ｋ［Ｘ（ｔ−１）−Ｘｐ（ｔ−１）］ …［11］上式において、ｋは適応ラベリング・モデルの固定パラ
メータ、Ｘ（ｔ−１）は時間（ｔ−１）において適応ラ
ベラ６８に入力された正規化第２０次元ベクトル、Ｘｐ
（ｔ−１）は時間（ｔ−１）において第２０次元機能ベ
クトルＸ（ｔ−１）に最近の適応原型ベクトル（適応原
型ベクトル記録装置６４からの）、Ａ（ｔ−１）は、時
間（ｔ−１）における適応ベクトルである。

【０１３０】適応ラベラ６８からの第２０次元適応機能
ベクトル信号Ｘ′（ｔ）は聴覚モデル７０に供給するこ
とができる。聴覚モデル７０は、例えば、人間の聴覚系
が如何に音信号を知覚するかのモデルを供給することが
できる。聴覚モデルの例としては、エル・アール・バー
ルほかによる“有効な記録機能及び音声学グラフの急速
アセンブリを有する会話認識システム”と称する米国特
許第４，９８０，９１８号に記述されている。

【０１３１】好ましくは、本発明によると、時間ｔにお
ける適応機能ベクトル信号Ｘ′（ｔ）の各周波数帯域ｉ
のため、聴覚モデル７０は下記方程式１２及び１３に従
い新パラメータＥ_i（ｔ）を計算する。Ｅ_i（ｔ）＝Ｋ₁＋Ｋ₂(Ｘ′_i（ｔ))（Ｎ_i（ｔ−１)) …［12］ここで、Ｎ_i（ｔ）＝Ｋ₃×Ｎ_i（ｔ−１）−Ｅ_i（ｔ−１） …［13］又、上式において、Ｋ₁Ｋ₂、及びＫ₃は聴覚モデルの
固定パラメータである。

【０１３２】聴覚モデル７０の出力は、各センチ（１／
１００）秒時間間隔に対する変更した第２０次元機能ベ
クトル信号である。この機能ベクトルは他の第２０次元
の値の平方の和の平方根に等しい値を有する第２１次元
だけ増加する。

【０１３３】連結機能７２は、好ましくは、各センチ秒
時間間隔の間に、１つの現行センチ秒時間間隔と、４つ
の先行センチ秒時間間隔と、４つの後続センチ秒時間間
隔とを表わす９個の２１次元機能ベクトルを連結して、
１８９次元の単一接合ベクトルを形成する。各１８９次
元接合ベクトルは、好ましくは、回転機能７４において
回転行列により乗算され、接合ベクトルを回転して、そ
れを５０次元に減少する。

【０１３４】回転機能７４で使用される回転マトリック
スは、例えば、トレーニング期間中に得られた１８９次
元接合ベクトルの集合をＭクラスに分類することによっ
て得ることができる。トレーニングした集合の全接合ベ
クトルに対する共分散マトリックスの逆元はＭクラスす
べての全接合ベクトルに対する内部サンプル共分散マト
リックスによって乗算される。

【０１３５】発生したマトリックスの最初の５０固有ベ
クトルは回転マトリックスを形成する。例えば、エル・
アール・バールほかによる“個別パラメータ音素基本マ
ルコフ・ワード・モデルを使用した会話認識システム用
ベクトル量子化手順”（ＩＢＭ技術開示技報、 Vol.34,
No.7, 1989 年12月、340 〜341 頁）を参照するとよ
い。

【０１３６】ウインドウ生成装置５６、スペクトル解析
機能５８、適応雑音消去プロセッサ６０、短期平均正規
化プロセッサ６６、適応ラベラ６８、聴覚モデル７０、
連結機能７２、及び回転機能７４は適当にプログラムさ
れた特殊目的又は汎用ディジタル信号プロセッサであっ
てよい。原型記録機能６２及び６４は電子コンピュータ
・メモリーでよい。

【０１３７】

【発明の効果】本発明は、上記のように構成したことに
より、簡単に、すなわち、相当少数のパラメータ及びト
レーニング・テキストを使用して、条件付予測ワードの
確率が高く且つ正確な言語モデルの推定を実行し、ワー
ド列のような観察事象の集合を分類して正確且つ精密な
言語モデルを生成することができる。

【図面の簡単な説明】

【図１】本発明の一実施例による言語生成装置を示すブ
ロック図

【図２】本発明の一実施例による言語生成装置用ワード
列仮説生成装置のブロック図

【図３】本発明の一実施例による言語生成装置用一単位
の仮説記録生成装置のブロック図

【図４】本発明の一実施例による観察事象の集合分類装
置のブロック図

【図５】本発明の一実施例によるワード列仮説生成装置
用音響プロセッサのブロック図

【符号の説明】

１０ワード列仮説生成装置１２音響プロセッサ１４音響一致記録生成装置１６音響モデル記憶装置２０一単位の仮説記録生成装置２２ワード列仮説記録生成装置２４ワード列仮説の最良候補記録装置２６ワードの出力

フロントページの続き (72)発明者ステフェン・アンドリュー・デラ・ピートラアメリカ合衆国10965、ニューヨーク州、パール・リバー、マイヤ・オバール、113 番地 (72)発明者ビンセント・ジョセフ・デラ・ピートラアメリカ合衆国10913、ニューヨーク州、ブローベルト、サンセット・ロード、129 番地 (72)発明者ロバート・レロイ・マーサーアメリカ合衆国10598、ニューヨーク州、ヨークタウン・ハイツ、ビューランド・ドライブ、669番地 (72)発明者フィリップ・エス・レズニクアメリカ合衆国19104、ペンシルベニア州、フィラデルフィア、ランキャスター・アベニュー、3514番地、アパート205 (72)発明者スタンレイ・エス・チェンアメリカ合衆国02138、マサチューセッツ州、ケンブリッジ、マートル・アベニュー、25番地

Claims

【特許請求の範囲】

【請求項１】ワード列仮説を表わす各ワード列仮説信
号が一続きの言語単位から成り、各言語単位が言語から
選ばれた１以上のワードから成る、２以上の前記ワード
列仮説信号を生成する手段と、一単位の仮説記録を表わす各一単位の仮説記録信号はワ
ード列仮説の個々の言語単位発生確率の推定から成り、
各前記ワード列仮説の各言語単位に対して前記一単位の
仮説記録信号を生成する手段と、各ワード列仮説記録信号はワード列仮説の前記言語単位
に対する一単位の仮説記録の組合せから成り、各前記ワ
ード列仮説に対して前記ワード列仮説記録信号を生成す
る手段と、最良のワード列仮説記録を有するワード列仮説の候補を
表わす１以上のワード列仮説候補信号を記録する手段
と、少くとも１つのワード列仮説の最良候補の少くとも１ワ
ードを表わす少くとも１ワード信号を出力する手段とを
含み、第１の個々の言語単位に対する前記一単位の仮説記録信
号を生成する手段は、第１の個々の言語単位ではないワード列仮説の言語単位
から成る文脈が発生した場における前記第１の個々の言
語単位から成る第１のクラスの言語単位の条件付発生確
率を推定する手段と、第１のクラスの言語単位が発生し、及び文脈が発生した
場合における第１の個々の言語単位の条件付発生確率を
推定する手段と、文脈が発生した場合における第１のクラスの言語単位の
推定による条件付発生確率と、第１のクラスが発生し、
及び文脈が発生した場合における第１の個々の言語単位
の推定による条件付発生確率との組合せから成る第１の
構成要素の記録を含む前記第１の個々の言語単位に対し
一単位の仮説記録信号を生成する手段とから成ることを
特徴とする言語生成装置。
【請求項２】前記第１のクラスの言語単位が発生し、
及び前記文脈が発生した場合における前記第１の個々の
言語単位の条件付発生確率は前記第１のクラスの言語単
位が発生した場合における前記第１の個々の言語単位の
条件付発生確率によって推定されることを特徴とする請
求項１記載の言語生成装置。
【請求項３】前記文脈が発生した場合における前記第
１のクラスの言語単位の条件付発生確率は、前記第１の
個々の言語単位ではないワード列仮説の１以上の言語単
位から成る第１の文脈集合が発生した場合における前記
第１のクラスの言語単位の条件付発生確率によって推定
されることを特徴とする請求項１記載の言語生成装置。
【請求項４】前記文脈が発生した場合における前記第
１のクラスの言語単位の条件付発生確率は、前記第１の個々の言語単位ではない前記ワード列仮説の
１以上の言語単位から成る第１の文脈集合が発生した場
合における前記第１のクラスの言語単位の条件付発生確
率と、前記第１の文脈集合とは異なる第２の文脈集合が発生し
た場合における前記第１の個々の言語単位ではないワー
ド列仮説の１以上の言語単位から成る第１のクラスの言
語単位の条件付発生確率との加重組合せとして推定する
ことを特徴とする請求項１記載の言語生成装置。
【請求項５】前記第１の個々の言語単位に対する一単
位の仮説記録信号を生成する手段は、更に、前記第１の個々の言語単位ではないワード列仮説の言語
単位から成る文脈が発生した場合における前記第１の個
々の言語単位から成る第２のクラスの言語単位の条件付
発生確率を推定する手段と、前記第２のクラスの言語単位が発生し、及び前記文脈が
発生した場合における第１の個々の言語単位の条件付発
生確率を推定する手段と、前記文脈が発生した場合における前記第２のクラスの言
語単位の推定条件付発生確率と、前記第２のクラスの言
語単位が発生し、及び前記文脈が発生した場合における
前記第１の個々の言語単位の推定による条件付発生確率
との組合せから成る第２の構成要素の記録を生成する手
段と、前記第１の構成要素の記録と前記第２の構成要素の記録
との加重組合せから成る第１の個々の言語単位に対する
一単位の仮説記録を生成する手段とから成ることを特徴
とする請求項１記載の言語生成装置。
【請求項６】前記２以上のワード列仮説信号を生成す
る手段は、一続きの連続時間間隔の各々に対する発音の少くとも１
機能値を測定して、該機能値を表わす一続きの音響機能
信号を作成する音響プロセッサと、各音響一致記録がワード列仮説の音響モデルと前記一続
きの音響機能信号との間の一致の接近の推定から成り、
複数のワード列仮説の各々に対する前記音響一致記録を
生成する手段と、前記最良の音響一致記録を有するワード列仮説を表わす
２以上のワード列仮説信号を生成する手段とから成るこ
とを特徴とする請求項１記載の言語生成装置。
【請求項７】ワード列仮説を表わす各ワード列仮説信
号は一続きの言語単位から成り、各言語単位は言語から
選ばれた１以上のワードから成る２以上の前記ワード列
仮説信号を生成し、一単位の仮説記録を表わす各一単位の仮説記録信号はワ
ード列仮説の個々の言語単位発生確率の推定から成り、
各前記ワード列仮説の各言語単位に対し前記一単位の仮
説記録信号を生成し、各ワード列仮説記録信号はワード列仮説の前記言語単位
に対する一単位の仮説記録の組合せから成り、各前記ワ
ード列仮説に対し前記ワード列仮説記録信号を生成し、最良のワード列仮説記録を有するワード列仮説の候補を
表わす１以上のワード列仮説候補信号を記録し、少くとも１つのワード列仮説の最良候補の少くとも１ワ
ードを表わす少くとも１ワード信号を出力する各工程を
含み、第１の個々の言語単位に対する前記一単位の仮説記録信
号を生成する工程は、第１の個々の言語単位ではないワード列仮説の言語単位
から成る文脈が発生した場合における前記第１の個々の
言語単位から成る第１のクラスの言語単位の条件付発生
確率を推定し、第１のクラスの言語単位が発生し、及び文脈が発生した
場合における第１の個々の言語単位の条件付発生確率を
推定し、文脈が発生した場合における第１のクラスの言語単位の
推定による条件付発生確率と、第１のクラスが発生し、
文脈が発生した場合における第１の個々の言語単位の推
定による条件付発生確率との組合せから成る前記第１の
個々の言語単位に対する一単位の仮説記録信号を生成す
る各工程から成ることを特徴とする言語生成方法。
【請求項８】前記第１の個々の言語単位に対する一単
位の仮説記録信号を生成する工程は、更に、前記第１の個々の言語単位ではないワード列仮説の言語
単位から成る文脈が発生した場合における前記第１の個
々の言語単位から成る第２のクラスの言語単位の条件付
発生確率を推定し、前記第２のクラスの言語単位が発生し、及び前記文脈が
発生した場合における第１の個々の言語単位の条件付発
生確率を推定し、前記文脈が発生した場合における前記第２のクラスの言
語単位の推定による条件付発生確率と、前記第２のクラ
スの言語単位が発生し、及び前記文脈が発生した場合に
おける前記第１の個々の言語単位の推定による条件付発
生確率との組合せから成る第２の構成要素の記録を生成
し、前記第１の構成要素の記録と前記第２の構成要素の記録
との加重組合せから成る第１の個々の言語単位に対する
一単位の仮説記録を生成する各工程から成ることを特徴
とする請求項７記載の言語生成方法。
【請求項９】各事象が２以上の異なる可能値の１を有
する予測機能と２以上の異なる可能値の１を有する類別
機能とを有する観察事象の集合を分類する装置であっ
て、前記事象の集合における各事象の予測機能値及び類別機
能値を測定する手段と、各集合がすべての可能な類別機能値より少い値を含む１
以上の異なる類別機能値の非補集合を選択する手段と、各予測機能値の集合がすべての可能な予測機能値より少
い値を含む少くとも３つの異なる予測機能値の非補集合
を選択する手段と、各一次予測記録は前記予測機能値の集合が前記観察事象
の集合の全事象に対する１類別機能値集合の発生を如何
に完全に予測するかの推定を含み、予測機能値の各集合
及び類別機能値の各集合に対し前記一次予測記録を生成
する手段と、事象の予測機能値が最良の一次予測記録を有する予測機
能値集合のメンバである場合に第１のクラスの事象を分
類する手段と、各二次予測記録は前記予測機能値の集合が前記観察事象
の集合の全事象に対する１類別機能値集合の発生を如何
に完全に予測するかの推定を含み、前記最良の一次予測
記録を有する予測機能値の集合ではない予測機能値の各
集合に対し、及び類別機能値の各集合に対し、前記二次
予測記録を生成する手段と、前記事象の予測機能値が最良の二次予測記録を有する予
測機能値の集合のメンバである場合、第１のサブクラス
の第１のクラスの事象からの事象を分類する手段とから
成り、各前記一次予測記録は前記予測機能値の集合が該予測機
能値の集合に対する一次加重係数によって加重された観
察事象の集合における類別機能値集合の発生を如何に完
全に予測するかの推定を含み、各前記二次予測記録は前記予測機能値の集合が該予測機
能値の集合に対する二次加重係数によって加重された第
１のクラスの観察事象における類別機能値集合の発生を
如何に完全に予測するかの推定を含み、最良の一次予測記録を有する予測機能値の集合ではない
少くとも１集合の予測機能値は関連する二次加重係数に
等しくない関連する一次加重係数を有することを特徴と
する観察事象集合分類装置。
【請求項１０】各事象が２以上の異なる可能値の１を
有する予測機能と、２以上の異なる可能値の１を有する
類別機能とを有する観察事象の集合を分類する方法であ
って、前記事象の集合における各事象の予測機能値及び類別機
能値を測定し、各集合がすべての可能な類別機能値より少い値を含む１
以上の異なる類別機能値の非補集合を選択し、各予測機能値の集合がすべての可能な予測機能値より少
い値を含む少くとも３つの異なる予測機能値の非補集合
を選択し、各一次予測記録は前記予測機能値の集合が前記観察事象
の集合の全事象に対する１類別機能値集合の発生を如何
に完全に予測するかの推定を含み、予測機能値の各集合
及び類別機能値の各集合に対し前記一次予測記録を生成
し、事象の予測機能値が最良の一次予測記録を有する予測機
能値集合のメンバである場合に第１のクラスの事象を分
類し、各二次予測記録は前記予測機能値の集合が前記観察事象
の集合の全事象に対する１類別機能値集合の発生を如何
に完全に予測するかの推定を含み、前記最良の一次予測
記録を有する予測機能値の集合ではない予測機能値の各
集合に対し、及び類別機能値の各集合に対し前記二次予
測記録を生成し、前記事象の予測機能値が最良の二次予測記録を有する予
測機能値の集合のメンバである場合、第１のサブクラス
の第１のクラスの事象からの事象を分類する各工程から
成り、各前記一次予測記録は前記予測機能値の集合が該予測機
能値の集合に対する一次加重係数によって加重された観
察事象の集合における類別機能値集合の発生を如何に完
全に予測するかの推定を含み、各前記二次予測記録は前記予測機能値の集合が該予測機
能値の集合に対する二次加重係数によって加重された第
１のクラスの観察事象における類別機能値集合の発生を
如何に完全に予測するかの推定を含み、最良の一次予測記録を有する予測機能値の集合ではない
少くとも１集合の予測機能値は関連する二次加重係数に
等しくない関連する一次加重係数を有することを特徴と
する観察事象集合分類方法。
【請求項１１】認識されるべき発音の符号化表示列を
出力する音響プロセッサと、各音響一致記録はワード列仮説のモデルと前記発音の符
号化表示列との間の一致の接近の推定から成り、各ワー
ド列仮説は２以上のワードから成る、複数のワード列仮
説の各々に対し前記音響一致記録を生成する手段と、最良の音響一致記録を有するワード列仮説を表わす２以
上のワード列仮説候補信号を生成する手段と、各単一ワード文脈記録は第１の個々のワードではないワ
ード列仮説の１以上のワードから成る文脈集合が発生し
た場合における前記第１の個々のワードの条件付発生確
率の推定を含み、各ワード列仮説の候補の各ワードに対
し前記単一ワード文脈記録を生成する手段と、各ワード列文脈記録はワード列仮説の各ワードに対する
単一ワード文脈記録の組合せから成り、各前記ワード列
仮説に対し前記ワード列文脈記録を生成する手段と、最良に組合された音響一致記録及び文脈記録を有するワ
ード列仮説の候補を表わす１以上のワード列仮説の最良
候補信号を記録する手段と、少くとも１つのワード列仮説の最良候補の少くとも１ワ
ードを出力する手段とから成り、前記文脈の集合は、各ワード列が少くとも１つの予測ワードと類別ワードと
を有する２以上のワードの列の集合を供給し、類別ワードの各集合はすべての可能な類別ワードより少
いワードを含む、前記類別ワードの１以上の異なる非補
集合を選択し、予測ワードの各集合は第１の個々のワードではないワー
ド列仮説の１以上のワードを含み、予測ワードの各集合
はすべての可能な予測ワードより少いワードを含む、前
記予測ワードの少くとも３つの異なる非補集合を選択
し、各一次予測記録は前記予測ワードの集合が前記ワード列
の集合におけるすべてのワード列に対する類別ワードの
１集合の発生を如何に完全に予測するかの推定を含み、
予測記録の各集合に対し、及び類別ワードの各集合に対
して前記一次予測記録を生成し、前記ワード列の予測ワードが最良の一次予測記録を有す
る予測ワード集合のメンバである場合ワード列を第１の
クラスに分類し、各二次予測記録は前記予測ワードの集合が第１のクラス
のワード列におけるすべてのワード列に対する類別ワー
ドの１集合の発生を如何に完全に予測するかの推定を含
み、類別ワードの各集合に対し、及び最良の一次予測記
録を有する前記予測ワードの集合ではない予測ワードの
各集合に対して前記二次予測記録を生成し、前記ワード列の予測ワードが最良の二次予測記録を有す
る予測ワードの集合のメンバである場合、第１のサブク
ラスにおける第１のクラスのワード列からワード列を分
類する各工程によって生成され、各一次予測記録は前記予測ワードの集合が該予測ワード
の集合に対する一次加重係数によって加重されたワード
列の集合における類別ワードの集合の発生を如何に完全
に予測するかの推定を含み、各二次予測記録は前記予測ワードの集合が該予測ワード
の集合に対する二次加重係数によって加重された前記第
１のクラスのワード列における類別ワードの集合の発生
を如何に完全に予測するかの推定を含み、最良の一次予測記録を有する予測ワードの集合ではない
予測ワードの少くとも１集合が関連する二次加重係数に
等しくない関連する一次加重係数を有することを特徴と
する会話認識装置。