JP2009163109A

JP2009163109A - 言語モデル生成装置及び音声認識装置

Info

Publication number: JP2009163109A
Application number: JP2008002194A
Authority: JP
Inventors: Hirotaka Goi; 啓恭伍井; Toshiyuki Hanazawa; 利行花沢; Tomohiro Iwasaki; 知弘岩崎
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2008-01-09
Filing date: 2008-01-09
Publication date: 2009-07-23
Anticipated expiration: 2028-01-09
Also published as: JP5137588B2

Abstract

【課題】学習データ量の少ない単語列の言語尤度精度の低さの解決に形態素列をクラス化する手法があるが、単語Ｎグラムと比較すると言語制約が弱い。また、クラスＮグラムを上位階層とし、下位階層に単語Ｎグラムを適用する方法は、下位階層の単語Ｎグラムが上位階層ではクラスＮグラムとして統合され、下位階層の単語と上位階層の単語の連鎖統計量が信頼度よく推定できない。
【解決手段】コーパスから形態素とクラスによるＮグラム言語モデルを生成するＮグラム言語モデル生成装置において、部分的に形態素とクラスにより系列化された第１のコーパスと、クラスに属する形態素集合の連鎖例を形態素列で記述した第２のコーパスと、第１のコーパスのクラス化列に、第２のコーパスの形態素列を埋め込み展開する単語系列展開手段とを備える。
【選択図】図２

Description

本発明は、言語モデル生成装置、音声認識装置等に関し、特に、統計的言語モデルを用いた言語モデル生成装置及びその言語モデルを用いた音声認識装置等に関するものである。

自然言語の統計量を用いた解析技術は多くの文書処理に応用されている。例えば、コールセンターにおけるオペレータ通話音声を音声認識によりテキスト化する手段として有用であり、より認識精度の向上が望まれる。以下用いる専門用語は、従来技術文献１：鹿野清宏、伊藤克亘、河原達也、武田一哉、山本幹雄著：「音声認識システム」株式会社オーム社，平成１３年５月１５日（以下教科書１）、または従来技術文献２：北研二、辻井潤一著：「確率的言語モデル」,東京大学出版会、1999年11月25日（以下教科書２）、または従来技術文献３：中川聖一著：「確率モデルによる音声認識」社団法人電子情報通信学会，昭和６３年７月１日（以下教科書３）、または従来技術文献４：長尾真著,「自然言語処理」,岩波書店，1996年4月26日（以下教科書４）に著される用語を用いるものとする。

音声を精度よく認識するために、言語モデルとしてＮグラムを用いる方式が注目されている。（教科書１〜４参照）しかし、信頼性のある統計量を得るためには大量のコーパスからＮグラムの表を作成するため、表の増加を解決する方法として、Ｎグラムの圧縮方式が提案されている。逆に、Ｎグラムはコーパスから学習するため、十分な量のコーパスが得られないと信頼性のある統計量が得られないという課題がある。

言語モデルとしては、基本的な単語２グラム又は単語３グラムの単語Ｎグラムモデルが広く用いられている。ここで、単語Ｎグラムを用いた言語尤度の計算について説明する。まず、単語列Ｗ１，Ｗ２，・・・，ＷＬの言語尤度ｌｏｇＰ（Ｗ１，Ｗ２，・・・，ＷＬ）は、条件付き確率を用いて下記に示される式（１）で表される。

式（１）右辺の条件付き確率Ｐ｛Ｗｉ｜Ｗ１，Ｗ２，・・・，Ｗ（ｉ−１）｝は、先行単語列Ｗ１，Ｗ２，・・・，Ｗ（ｉ−１）の後に当該単語Ｗｉが生起する確率であり、この先行単語列をＮ−１個で近似するのが単語Ｎグラムモデルである。そして、先行単語列を１個で近似する単語２グラムでは、下記に示される式（２）の近似式で表される。

同様に、先行単語列を２個で近似する単語３グラムでは、下記に示される式（３）の近似式で表される。

音声認識の際には、認識途中の単語列候補に対して、単語音声の確率モデルであるＨＭＭ（ＨｉｄｄｅＮＭａｒｋｏｖＭｏｄｅｌ）等の音響モデルを用いて音響尤度を求め、さらに上記のようにして言語尤度を求め、それらを重み付き加算した総合尤度で単語列候補に序列をつけて、音声認識を行う。
ところで、Ｎグラムモデルには多種のバリエーションがあるが、ここでは、特に本件と関連性のある２つの従来技術を以下に説明する。

Ｎグラムモデルの第１バリエーションとして、単語集団の中で、共通の性質を持つものをクラス化して確率を計算するものがある（例えば、特許文献１参照）。なお、この技術を、以下「第１の従来例」とも記す。この第１の従来例のクラスＮグラムモデルでは、単語Ｎグラムがクラスを用いて式（４）のように近似される（Ｎ＝２の場合）。ここで、Ｃｉはクラス化した単語を示す。

クラスを介して言語尤度を求めることで、学習データの少ない単語列に対して言語尤度の精度が悪いというデータ量が不十分の問題に対して効果がある。しかし、このクラスＮグラムモデルでは、コーパスのデータ量不足に対する効果はあるものの、言語制約としては、単語Ｎグラムと比較すると弱くなってしまうという課題がある。

このような課題を解決するために、クラスＮグラムを上位階層とし、下位階層に単語Ｎグラムを適用するものがある。この技術を、以下「第２の従来例」とも記す。（特許文献２参照）

この第２の従来例では、例えば、テレビ番組名である「太陽を撃て」が「明日の太陽を撃てを録画」という文に含まれている場合に式（５）のように近似する。こうすることにより、テレビ番組名（＜ｔｉｔｌｅ＞とする）の前後の文脈が、Ｐ（＜ｔｉｔｌｅ＞｜の）と、Ｐ（を｜＜ｔｉｔｌｅ＞）とで表されるために、データ量が不十分による問題に対処できて、かつ、テレビ番組名が単語列で表されるために認識辞書も小さく、しかも、テレビ番組名を単語列で表すために、高い認識性能を確保できるとしている。

特開２０００−２５９１７５号公報国際公開番号ＷＯ２００４／０３４３７８号公報

学習データ量の少ない単語列に対して言語尤度の精度が悪いというデータ量が不十分の問題（単語連鎖のスパースネスの問題）を解決するために氏名、住所、製品名などの形態素列をクラス化する手法が用いられる。クラス化は、例えば「三菱太郎様のご住所は神奈川県鎌倉市大船の」という例文表現を、「＜姓＞＜名＞様のご住所は＜県＞＜市＞＜町＞の」というように、人手で意味毎の＜＞で括られた特殊表現文字列に置き換え、＜＞で括られた特殊表現文字列を個々のクラスとして扱うことで実現できる。この部分をクラスとするＮグラムモデルを構成すれば、可能性のある単語をカバーできるが、前述のとおり、単語Ｎグラムと比較すると言語制約が弱くなってしまうという課題がある。

これについて例をあげて説明する。図１に都道府県クラスと市区郡クラスのＮグラムの連鎖の例を示す。都道府県クラスとして、「神奈川県」、「東京都」の都道府県名の形態素が含まれており、市区郡クラスとして「横浜市」や「新宿区」などの市区郡名の形態素が登録されている。しかし、このクラスＮグラム連鎖を用いると、正しい住所名以外に、「神奈川県／新宿区」や「東京都／横浜市」などの正しくない形態素連鎖を許してしまうため、形態素Ｎグラムと比べてクラスＮグラムは言語制約が弱くなってしまう。

また、クラスＮグラムを上位階層とし、下位階層に単語Ｎグラムを適用する方法では、下位階層の単語Ｎグラムは上位階層ではクラスＮグラムとして統合されてしまうため、下位階層の単語と上位階層の単語の連鎖統計量を信頼度よく推定することができないという課題がある。

これについて実例をあげて説明する。例えば、住所表現である「鎌倉市の大船」が「県内鎌倉市の大船です」という文に含まれている場合を考える。文脈から県内の県は神奈川県であることがわかるが、第２の従来では式（６）のように近似される。

このため、＜住所＞で現される住所表現の前後の文脈が、Ｐ（＜住所＞｜県内）と、Ｐ（です｜＜住所＞）とで分離されるため、県内-鎌倉市以外の連接（例えば県内-新宿区）も同一の確率が与えられてしまうという課題がある。
本発明は、このような課題を解決するためになされたものである。

本発明に係る言語モデル生成装置は、
コーパスから形態素とクラスによるＮグラム言語モデルを生成するＮグラム言語モデル生成装置であって、
言語モデル生成目的の例文が部分的に形態素とクラスにより系列化された第１のコーパスと、
予め作成されたクラスに属する形態素集合の連鎖例を形態素列で記述した第２のコーパスと、
第１のコーパスのクラス化列に、第２のコーパスの形態素列を埋め込み展開する単語系列展開手段とを備える。

また、本発明に係る音声認識装置は、
言語モデル生成目的の例文が部分的に形態素とクラスにより系列化された第１のコーパスと、
予め作成されたクラスに属する形態素集合の連鎖例を形態素列で記述した第２のコーパスと、
第１のコーパスのクラス化列に、第２のコーパスの形態素列を埋め込み展開する単語系列展開手段と、
単語系列展開手段の処理結果を格納する統合コーパスと、
統合コーパスを入力し、前接続と後接続の形態素が特殊表現または非特殊表現の同じ表現の接続の場合と異なる表現の接続の場合の異なる２つのバックオフ係数を格納する単語Ｎグラムを出力するＮグラム辞書生成部と、
音声入力部でとり込まれた音声の認識を行うとき、前接の形態素により単語Ｎグラムに格納されたバックオフ係数を選択して認識する音声認識部と、音声認識結果を出力するデータ出力部を備える。

本発明に係る言語モデル生成装置によれば、単語系列展開手段により、言語モデル生成目的の例文が部分的に形態素とクラスにより系列化された第１のコーパスのクラス化列に、予め作成されたクラスに属する形態素集合の連鎖例を形態素列で記述した第２のコーパスの形態素列を埋め込み展開することにより、学習データ量の少ない単語列の言語尤度の精度の低さを防ぐことができ、かつ、単語Ｎグラムと比較し言語制約が弱くなるという問題も防ぐことができる。

また、他の発明に係る音声認識装置によれば、言語モデル生成目的の例文が部分的に形態素とクラスにより系列化された第１のコーパスのクラス化列に、予め作成されたクラスに属する形態素集合の連鎖例を形態素列で記述した第２のコーパスの形態素列を埋め込み展開する単語系列展開手段の処理結果である統合コーパスから、前接続と後接続の形態素が特殊表現または非特殊表現の同じ表現の接続の場合と異なる表現の接続の場合の異なる２つのバックオフ係数を格納する単語Ｎグラムを生成し、
音声認識部で、音声入力部によりとり込まれた音声の認識を行うとき、前接の形態素により単語Ｎグラムに格納されたバックオフ係数を選択して認識するので、学習データ量の少ない単語列の言語尤度精度の低さを防ぐことができ、かつ、単語Ｎグラムと比較して言語制約が弱くなるということも防げ、さらに、特殊表現の形態素連鎖の中に一般の形態素が混合することを低減できる。

実施の形態１．
図２は、本発明の実施の形態１における言語モデル作成装置の構成図を示し、以下に説明する。第１コーパス１０１と第２コーパス１０２を特殊表現展開部１０３に入力する。特殊表現展開部１０３は、第１コーパス中にあるクラス化部分を別途入力した第２コーパス１０２の対応する部分に展開し、これを統合コーパス１０４に記録する。Ｎグラム辞書生成部１０５は統合コーパス１０４を入力し、単語Ｎグラム１０６を出力するものである。

上記のように構成された言語モデル生成装置の動作について説明する。
第１コーパス１０１は、通話書き起こし作業者が作成した例文が格納されている記憶装置である。例文の格納形態は、各文をあらかじめ単語に相当する単位（以下、形態素）に分割をしておくことが望ましいが、例文をそのままで格納しておくことも可能であり、第１コーパス１０１から出力する際は、形態素解析などのフィルタを使用し、形態素に分割すれば良い。図３に１例を示す。発声の区切りごとに形態素の連鎖を構成する単位として格納されている。形態素は、表記、読み、品詞の３つ組から構成されている。クラス化部分が形態素連鎖に存在する場合は、３つ組みともクラス化文字列が記憶されており、部分的に形態素とクラスにより系列化されている。

第２コーパス１０２は、システム開発者や利用者などによってあらかじめ例文が格納されている記憶装置である。例文の格納形態は、各文をあらかじめ単語に相当する単位（以下、形態素）に分割をしておくことが望ましいが、例文をそのままで格納しておくことも可能であり、第２コーパス１０２から出力する際は、形態素解析などのフィルタを使用し、形態素に分割すれば良い。図４に住所名コーパスの１例を示す。各住所名は、都道府県名、市区郡名、および町村名の３連鎖で構成され、それぞれの形態素は、第１コーパスと同様、表記、読み、品詞の３つ組から構成されており、クラスに属する形態素集合の連鎖例を形態素列で記述されている。

特殊表現展開部１０３は、第１コーパス１０１と第２コーパス１０２を読み込み、第１コーパス１０１に含まれる形態素のうちのクラス化の品詞が合致する一連の形態素を第２コーパス１０２の一連の形態素に置き換え、個々のすべてのパターンを出力する。ただし、このとき、「県内、けんない、名詞」や「県内、けんない、名詞、の、の、助詞」など特定の形態素連鎖がマッチする場合は、県名を神奈川県に限定して一連の形態素に置き換え、統合コーパス１０４に出力する。置き換えを行った個数分の数で除算した値を出現回数として同じく統合コーパス１０４に出力する。また、クラス化形態素間に連鎖するクラス化形態素外の形態素は、品詞を＜＞で括って特殊表現の形態素とする。図５にこの例を示す。図５の場合、「県内」を「神奈川県」に置き換えたので、出現回数は１／３となる。

この限定を行う規則は、特定の形態素連鎖「」内の表現を第１コーパスが含む場合に、展開すべき表現が第2コーパスの制限として制限「」内の表現を含まなければならないことを示すルールとして例えば以下の式（７）を用いる。（）内は省略可能な形態素連鎖を表す。

ここで、特殊表現展開部１０３の処理を詳細に説明する。図６にフローチャートを示す。特殊表現展開部１０３は、第１コーパス１０１から１列ずつ形態素列を読み出し、第１形態素列として記憶する。（ＳＴ１００２）、一方、統合コーパス１０４への展開した形態素列の出力数をカウントするため、形態素列出力数を０クリアし記憶する（ＳＴ１００３）。次に、第２コーパス１０２から１列ずつ形態素列を読み込み、第２形態素列として記憶する（ＳＴ１００４）。次に、第１形態素列にクラス形態素連鎖（＜＞で括られた形態素の連鎖）があるかチェックする。ＹＥＳの場合は処理をＳＴ１００６にすすめ、ＮＯの場合には、処理をＳＴ１０１４にすすめる（ＳＴ１００５）。

次に、ＳＴ１０１４では、クラスの展開がなかったので、形態素出力数を１とし、第１形態素列を統合コーパスに出力し、処理をＳＴ１０１２にすすめる（ＳＴ１０１４）。次に、ＳＴ１００６では、第１形態素列に規定連鎖があるかチェックする。ここで規定連鎖とは、特定の形態素連鎖のことで、この実施の形態の場合、形態素「県内,けんない,名詞」とする。チェックの結果、ＹＥＳの場合は、処理をＳＴ１００７にすすめ、ＮＯの場合は処理をＳＴ１００８にすすめる（ＳＴ１００６）。次に、第２形態素列に該当連鎖があるかチェックする。ここで、該当連鎖とは、形態素「神奈川県,かながわけん,＜県＞」である。また、ＹＥＳであればＳＴ１００８にすすめ、また、ＮＯであれば、処理をＳＴ１００４にすすめる（ＳＴ１００７）。
このように構成することで、第１形態素列に「県内,けんない,名詞」がある場合は、第２形態素列として形態素「神奈川県,かながわけん,＜県＞」を含む形態素列のみ対象とすることができる。

次に、第１形態素のクラス化形態素を第２形態素列内の同一クラス品詞の形態素に置き換えた展開形態素列を生成する。例えば、第１形態素列「＜県＞,＜県＞,＜県＞＜市＞, ＜市＞, ＜市＞の,の,助詞＜町＞,＜町＞,＜町＞です,です,助動詞」に第２形態素列「神奈川県,かながわけん,＜県＞愛甲郡,あいこうぐん,＜市＞愛川町,あいかわまち,＜町＞」を適用した場合、展開形態素列は「神奈川県,かながわけん,＜県＞愛甲郡,あいこうぐん,＜市＞の,の,助詞愛川町,あいかわまち,＜町＞」となる。

次に、展開形態素列のクラス化形態素列間の一般形態素の品詞をクラス化し、統合コーパス１０４に出力する。前述の例では、「の,の,助詞」が一般形態素となる。この形態素が、「＜市＞」および「＜町＞」に連接しているので、間の「の,の,助詞」は「の,の,＜助詞＞」というようにクラス化し、統合コーパス１０４に出力する（ＳＴ１００９）。次に、統合コーパス１０４に展開出力した形態素列数を計数するため、形態素列出力数に１を加えて記憶する（ＳＴ１０１０）。次に、すべての第２コーパス１０２の形態素列を処理したかチェックする。ＹＥＳであれば、処理をＳＴ１０１２へすすめる。ＮＯの場合は処理をＳＴ１００４へ戻す（ＳＴ１０１１）。次に、展開した形態素列出力数を個々の展開形態素列に割り振るため、形態素列出力数の逆数を形態素列の出現回数として記憶する（ＳＴ１０１２）。次に、すべての第１コーパス１０１の形態素列について処理したかチェックする。ＹＥＳであれば処理をＳＴ１０１５にすすめ終了する。ＮＯであれば処理をＳＴ１００２にもどす（ＳＴ１０１３）。

Ｎグラム辞書生成部１０５は、統合コーパス１０４を入力し、単語Ｎグラム１０６を出力する。このとき、Ｎグラムの出現カウントは出現回数をもとに行う。

実施の形態２．
図７は、本発明の実施の形態２における言語モデル作成装置の構成図を示し、以下に説明する。実施の形態１との違いは、第２コーパス１０２を構造判定部７０１に入力し、特定の形態素パターンのみ特殊表現展開部１０３に入力することにより、展開する形態素列を適切なパターンのみにするものである。

上記のように構成された言語モデル生成装置の動作について実施の形態１と異なる部分のみ説明する。
構造判定部７０１は、第２コーパス１０２に格納された形態素列をすべて探索し、連接する形態素の親子関係を調べる。（ここで形態素の親子関係とは、例えば、「神奈川県」の形態素に後接する市名形態素は「鎌倉市」と「藤沢市」の２つ以上が存在し、「鎌倉市」と「藤沢市」に前接する県名の形態素は「神奈川県」しかない場合に、この２つの連接する形態素は親子であるとする。）親子関係がないクラス化品詞をＮＧ品詞ペアとしてピックアップし、ＮＧ品詞ペアカウントが全体の品詞ペアの一定割合を超える場合は、それらの品詞ペアを含む形態素列は除去する。このように構成することで、階層構造の強い形態素列のみを特殊表現展開部１０３に入力することができるため、不要な形態素列を展開しないためメモリ効率が良い。

次に、構造判定部７０１の親子判定アルゴリズムを図８のフローチャートに従って詳細を説明する。構造判定部７０１は第２コーパス１０２を読み込みすべての形態素列を記憶する（ＳＴ２００２）。次に、記憶した形態素列の隣り合うすべての形態素ペアを記憶する（ＳＴ２００３）。次に、形態素ペアのうち１つを取り出す（ＳＴ２００４）。次に、取り出した形態素ペアの前接形態素をキーとして後接形態素以外の後接形態素を持つ形態素ペアがあるかすべて探索する（ＳＴ２００５）。次に、ペアが存在した場合は親子関係が成り立つ可能性があるので、ＳＴ２００７で親子フラグを１にセットする（ＳＴ２００６，ＳＴ２００７）。

次に、同様に後接形態素をキーとして前接形態素以外の前接形態素を持つ形態素ペアがあるかすべて探索する（ＳＴ２００８）。次に、ペアが存在した場合は逆向きの親子関係（子親関係）が成り立つ可能性があるので、ＳＴ２０１０で子親フラグを１にセットする（ＳＴ２０１０，ＳＴ２０１１）。次に、親子フラグと子親フラグの双方が１かチェックする（ＳＴ２０１１）。次に、親子フラグと子親フラグの双方が１の場合は階層関係が成立しないから、形態素ペア前接、後接品詞をＮＧ品詞ペアに記憶するとともにＮＧ品詞ペアカウントをインクリメントする（ＳＴ２０１２）。次に、すべての形態素ペアを処理したかチェックする。ＹＥＳの場合は処理を終える。ＮＯ場合は処理をＳＴ２００４に戻す（ＳＴ２０１３）。このように構成することで、親子関係がないクラス化品詞をＮＧ品詞ペアとしてピックアップすることができる。

実施の形態３．
図９は、本発明の実施の形態３における音声認識装置の構成図を示し、以下にその説明をする。言語モデル生成部分における実施の形態１との違いは、本発明の実施の形態３においては前接続と後接続の形態素が特殊表現または非特殊表現の同じ表現の接続の場合と異なる表現の接続の場合の２つのバックオフ係数を格納することである。音声認識時に、上記教科書では３グラムが存在しない場合は２グラムに、２グラムが存在しない場合は１グラムにバックオフする技術が紹介されている。一般的には上記教科書にあるようなバックオフスムージングのためのバックオフ係数を、より低位のＮグラムの項目に格納しているが、Ｎグラム辞書生成部１０５において、これを、前接続と後接続の形態素が特殊表現または非特殊表現の同じ表現の接続の場合と異なる表現の接続の場合の２つのバックオフ係数を格納することが大きく異なる。これにより、前接形態素が同種である場合はバックオフ係数を大きく、異種である場合にはバックオフ係数を小さくすることで、混合誤りを低減できる。

単語Ｎグラム１０６をもとに、音声認識部１０８では、音声入力部１０７でとり込まれた音声の認識を行う。このとき、前接の形態素によりバックオフ係数を選択して認識する。音声認識結果はデータ出力部１０９に送ることで、データ出力部１０９で出力される。出力の方法は、ディスプレイを用いて利用者に提示しても良いし、出力部の先にアプリケーションをつなげることで、音声認識の結果を他のアプリケーションで利用することも可能である。

本実施の形態では、特殊表現連鎖と非特殊表現連鎖の２つの連鎖種別により言語モデルに２つのバックオフ係数を格納して選択したが、複数種類の連鎖種別において、同種、異種の連鎖の区別で２つのバックオフ係数を格納してもよい。また、連鎖種別の組み合わせに応じて複数のバックオフ係数を格納しても良い。さらに、言語モデルに２つのバックオフ係数を格納して選択したが、これを格納せず、音声認識処理の中で、前接と後接の形態素種別により前接形態素が同種である場合はバックオフ係数を大きく、異種である場合にはバックオフ係数を小さく一定の比率で増減するようにしてもよい。このようにすることで、前述の制御より荒い制御になるが、メモリ効率を向上することができる。こうすることにより、特殊表現の形態素連鎖の中に一般の形態素が混合することを低減できる。例えば、「東京都／西東京市／ひばりが丘」が「東京都／に／死闘／教師／ひばりが丘」のように誤ることを少なくできる。

本発明の言語モデル生成装置及びその言語モデル生成装置を用いた音声認識装置は、音声認識率の向上が図れ、例えば、通話録音装置向け音声認識システムに利用可能である。

都道府県クラスと市区郡クラスのＮグラムの連鎖例の説明図である。本発明の実施の形態１における言語モデル作成装置の構成図である。第１コーパスから出力される例文の形態素解析例の説明図である。第２コーパスから出力される例文の形態素解析例の説明図である。特殊表現展開部から出力される展開形態素列例の説明図である。特殊表現展開部の処理動作を示すフローチャートである。本発明の実施の形態２における言語モデル作成装置の構成図である。構造判定部の親子判定アルゴリズムを示すフローチャートである。本発明の実施の形態３における音声認識装置の構成図である。

符号の説明

１０１；第１コーパス、１０２；第２コーパス、１０３；特殊表現展開部、１０４；統合コーパス、１０５；Ｎグラム辞書生成部、１０６；単語Ｎグラム、１０７；音声入力部、１０８；音声認識部、１０９；データ出力部、７０１；構造判定部。

Claims

コーパスから形態素とクラスによるＮグラム言語モデルを生成するＮグラム言語モデル生成装置であって、
言語モデル生成目的の例文が部分的に形態素とクラスにより系列化された第１のコーパスと、
予め作成されたクラスに属する形態素集合の連鎖例を形態素列で記述した第２のコーパスと、
第１のコーパスのクラス化列に、第２のコーパスの形態素列を埋め込み展開する単語系列展開手段と、
を備えることを特徴とする言語モデル生成装置。
第２のコーパスの形態素の階層構造を判定する構造判定手段を備え、
単語系列展開手段が形態素列の展開を行う際に、第１のコーパスのクラス化列を、構造判定手段からの階層構造の含有比率に基づき、第２のコーパスの形態素列に展開することを特徴とする前記請求項１に記載の言語モデル生成装置。
単語系列展開手段の処理結果を格納する統合コーパスと、
統合コーパスを入力し、単語Ｎグラムを出力するＮグラム辞書生成部を備え、
Ｎグラム辞書生成部は、単語系列展開手段が第１のコーパスのクラス化列に、第２のコーパスの形態素列を埋め込み展開した結果の単語Ｎグラムに前接続と後接続の形態素が特殊表現または非特殊表現の同じ表現の接続の場合と異なる表現の接続の場合の異なる２つのバックオフ係数を格納することを特徴とする請求項１または２に記載の言語モデル生成装置。
言語モデル生成目的の例文が部分的に形態素とクラスにより系列化された第１のコーパスと、
予め作成されたクラスに属する形態素集合の連鎖例を形態素列で記述した第２のコーパスと、
第１のコーパスのクラス化列に、第２のコーパスの形態素列を埋め込み展開する単語系列展開手段と、
単語系列展開手段の処理結果を格納する統合コーパスと、
統合コーパスを入力し、前接続と後接続の形態素が特殊表現または非特殊表現の同じ表現の接続の場合と異なる表現の接続の場合の異なる２つのバックオフ係数を格納する単語Ｎグラムを出力するＮグラム辞書生成部と、
音声入力部でとり込まれた音声の認識を行うとき、前接の形態素により単語Ｎグラムに格納されたバックオフ係数を選択して認識する音声認識部と、音声認識結果を出力するデータ出力部を備える音声認識装置。