JP5480844B2

JP5480844B2 - 単語追加装置、単語追加方法及びそのプログラム

Info

Publication number: JP5480844B2
Application number: JP2011109005A
Authority: JP
Inventors: 祥子山畠; 義和山口; 浩和政瀧
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2011-05-16
Filing date: 2011-05-16
Publication date: 2014-04-23
Anticipated expiration: 2031-05-16
Also published as: JP2012242421A

Description

この発明は音声認識システムに用いる言語モデルに単語を追加する単語追加装置、単語追加方法及びそのプログラムに関する。

言語モデルに単語を追加する場合、その単語が適切な場所で正しく認識され、それ以外の場所では出現しないように確率を調整する必要がある。

誤認識が起こる理由の一つに、発音の類似した単語との置換誤りが挙げられる。追加単語が発話されたとき、発音の類似した別の単語として認識されてしまう、もしくは追加単語と発音の類似した単語が発話されたとき、それが追加単語として認識されてしまう、という問題である。

特に、新規に追加される単語においては、追加後の使用頻度が高くなると見込まれるため、発音の類似した別の単語として認識される現象を防ぐことが重要となる。

追加単語の確率付与に関する技術が特許文献１に記載されている。特許文献１では追加単語のクラス内単語出現確率の初期値を定め、その初期値を用いて音声認識を実施し、その認識結果における追加単語の湧き出し数をもとに追加単語のクラス内単語出現確率を調整するものとなっており、具体的には以下のような方法を採用している。

即ち、音声認識の認識結果と書き起こしデータを比較し、追加単語の湧き出し頻度を誤り値として、誤り値が所定の閾値より小さければ適当に定めたクラス内単語出現確率の初期値以上の値を追加単語のクラス内単語出現確率とする。また、誤り値が閾値より大きい場合は、クラス内単語出現確率を初期値より小さくし、再び誤り値の評価を行う。誤り値が１回目に比べ、小さくなり、閾値以下となれば、小さくしたクラス内単語出現確率をもとに追加単語のクラス内単語出現確率を定める。

一方、誤り値が十分に小さくならない場合には、クラス内単語出現確率をさらに小さくすると、単語が出現しなくなってしまうため、１回目及び２回目の単語の正解値をもとに追加単語のクラス内単語出現確率を決定するものとなっている。ここで、正解値とは追加単語が出現すべき場所で正しく認識されている頻度である。

特開２００９−２７１４６５号公報

上述した特許文献１に記載されている従来の方法では、言語モデルに単語を追加する際に必要な追加単語のクラス内単語出現確率を決定するために、追加単語を多く含む例えば数時間程度の評価音声データベースを用意しなければならない。しかしながら、既存の評価音声データベースにこれから使う追加単語が多く含まれているとは一般に考えにくいため、そのような追加単語を多く含む評価音声データベースを用意しなければならず、その点で手間がかかり、また単語を追加する都度、その追加単語を多く含む評価音声データベースが必要になることから、汎用性の点で劣るものとなっていた。

この発明の目的はこのような問題に鑑み、追加単語を多く含む評価音声データベースのような追加のリソースを必要とすることなく、追加単語のクラス内単語出現確率を適切に決定することができ、よって従来に比し、簡易で汎用性が高い単語追加装置及び単語追加方法を提供することにある。

請求項１の発明によれば、単語追加装置は、追加単語の音素列と単語辞書に登録されている既存単語の音素列の発音類似距離を、単語辞書に登録されている全ての既存単語についてＤＰマッチングにより計算する発音類似距離計算部と、発音類似距離計算部で計算された発音類似距離が閾値以下か否かを判定する判定部と、判定部で発音類似距離が閾値以下と判定された既存単語から、発音類似距離が小さい上位Ｎ個の既存単語を抽出するＮ-best発音類似単語抽出部と、言語モデルを参照して、前記Ｎ個の既存単語のユニグラム出現確率を求め、求めた中で最大のユニグラム出現確率を追加単語のユニグラム出現確率として、そのユニグラム出現確率と追加単語に対して指定されたクラスのクラスユニグラム出現確率とから追加単語のクラス内単語出現確率を求め、求めたクラス内単語出現確率を言語モデルに追加し、追加単語を単語辞書に追加するクラス内単語出現確率付与部とを備え、判定部における判定において発音類似距離が閾値以下の既存単語が存在しなかった場合、クラス内単語出現確率付与部は追加単語に対して指定されたクラスにおけるクラス内単語出現確率が最大の既存単語と同じクラス内単語出現確率を追加単語に付与する。

請求項２の発明によれば、単語追加装置は、追加単語の音素列と単語辞書に登録されている既存単語の音素列の発音類似距離を、単語辞書に登録されている全ての既存単語についてＤＰマッチングにより計算する発音類似距離計算部と、発音類似距離計算部で計算された発音類似距離が閾値以下か否かを判定する判定部と、判定部で発音類似距離が閾値以下と判定された既存単語から、発音類似距離が小さい上位Ｎ個の既存単語を抽出するＮ-best発音類似単語抽出部と、言語モデルを参照して、前記Ｎ個の既存単語のユニグラム出現確率を求め、それらユニグラム出現確率の発音類似距離に応じた重み付き平均を計算し、その重み付き平均を追加単語のユニグラム出現確率として、そのユニグラム出現確率と追加単語に対して指定されたクラスのクラスユニグラム出現確率とから追加単語のクラス内単語出現確率を求め、求めたクラス内単語出現確率を言語モデルに追加し、追加単語を単語辞書に追加するクラス内単語出現確率付与部とを備え、判定部における判定において発音類似距離が閾値以下の既存単語が存在しなかった場合、クラス内単語出現確率付与部は追加単語に対して指定されたクラスにおけるクラス内単語出現確率が最大の既存単語と同じクラス内単語出現確率を追加単語に付与する。

請求項３の発明では請求項１又は２の発明において、発音類似距離計算部はＤＰマッチングのコストの決定にConfusion Matrixを用いる。

請求項４の発明では請求項１乃至３のいずれかの発明において、発音類似距離計算部は発音類似距離の計算に用いる既存単語から機能語を除外する。

請求項５の発明によれば、単語追加方法は、追加単語の音素列と単語辞書に登録されている既存単語の音素列の発音類似距離を、単語辞書に登録されている全ての既存単語についてＤＰマッチングにより計算する発音類似距離計算過程と、発音類似距離計算過程で計算された発音類似距離が閾値以下か否かを判定する判定過程と、判定過程で発音類似距離が閾値以下と判定された既存単語から、発音類似距離が小さい上位Ｎ個の既存単語を抽出するＮ-best発音類似単語抽出過程と、言語モデルを参照して、前記Ｎ個の既存単語のユニグラム出現確率を求め、求めた中で最大のユニグラム出現確率を追加単語のユニグラム出現確率として、そのユニグラム出現確率と追加単語に対して指定されたクラスのクラスユニグラム出現確率とから追加単語のクラス内単語出現確率を求め、求めたクラス内単語出現確率を言語モデルに追加し、追加単語を単語辞書に追加するクラス内単語出現確率付与過程とを含み、判定過程における判定において発音類似距離が閾値以下の既存単語が存在しなかった場合、追加単語に対して指定されたクラスにおけるクラス内単語出現確率が最大の既存単語と同じクラス内単語出現確率を追加単語に付与する。

この発明によれば、追加する単語のクラス内単語出現確率を、既存の発音が類似する単語の出現確率をもとに計算するものとなっており、これにより追加単語のクラス内単語出現確率を適切に決定することができ、誤認識を防ぐことができる。

また、追加単語を多く含む評価音声データベースのような追加のリソースを必要とする従来例と異なり、追加のリソースを必要としないため、その点で従来例に比し、簡易で汎用性が高い単語追加装置及び方法を提供することができる。

この発明による単語追加装置の実施例１の機能構成を示すブロック図。図１に示した単語追加装置の処理フローを示すフローチャート。この発明による単語追加装置の実施例２におけるＤＰマッチングのコストの決定方法を説明するための図。この発明による単語追加装置の実施例３における処理フローを示すフローチャート。

以下、この発明の実施形態を図面を参照して実施例により説明する。

図１はこの発明による単語追加装置の実施例１の機能構成を示したものであり、図２はその処理フローを示したものである。

単語追加装置１００はこの例では追加単語記憶部１０と発音類似距離計算部２０と判定部３０と発音類似単語記憶部４０とＮ-best発音類似単語抽出部５０とＮ-best発音類似単語記憶部６０とクラス内単語出現確率付与部７０と制御部８０とを備えている。制御部８０は単語追加装置１００全体の動作を制御する。なお、図１では単語辞書を記憶する単語辞書記憶部２００と言語モデルを記憶する言語モデル記憶部３００を併せて示している。既存単語は単語クラス毎に単語辞書に登録されている。

単語追加装置１００には言語モデルに新規に追加する追加単語Ａとその音素列ａが入力される。また、この際、追加単語Ａを登録するクラスＣ_Ａも入力される。クラスＣ_Ａは単語辞書に予め存在するクラス（例えば、未知語クラスなど）から選ぶものとする。入力された追加単語Ａとその音素列ａ，クラスＣ_Ａは追加単語記憶部１０に記憶される。

追加単語記憶部１０に記憶されている追加単語Ａとその音素列ａは発音類似距離計算部２０に入力される。発音類似距離計算部２０は追加単語Ａが単語辞書に登録されている既存単語と、発音がどれくらい類似しているかを計算する。即ち、発音類似距離計算部２０は追加単語Ａの音素列ａと、単語辞書に登録されている既存単語Ｗ_ｉ（Ｗ_ｉは単語辞書に登録されているｉ番目の単語を示す）の音素列ｂ_ｉの距離を、単語辞書に登録されている全ての既存単語について計算する（ステップＳ１）。

距離の計算はＤＰマッチングにより行われ、ＤＰマッチングのコストはこの例では下記文献１に記載されている編集距離を用いて決定する。ここでは、編集距離における置換・削除・挿入それぞれのコストを１として計算する。計算された距離を発音類似距離Ｄ_Ｗｉとする。
文献１：Daniel Jurafsky and James H.Martin,「Speech and Language Processing
（2nd Edition）」，Prentice Hall；２版，2008年５月，p.73-77

既存単語Ｗ_ｉと発音類似距離Ｄ_Ｗｉは判定部３０に入力され、判定部３０は発音類似距離Ｄ_Ｗｉが閾値θ以下か否かを判定する（ステップＳ２）。閾値θの値は３〜４程度が適切であるが、音素列ａの長さによって適宜調整する。

発音類似距離Ｄ_Ｗｉが閾値θ以下と判定された既存単語（以下、発音類似単語と言う）Ｗ_ｉとその発音類似距離Ｄ_Ｗｉは判定部３０から発音類似単語記憶部４０に入力され、発音類似単語記憶部４０は判定部３０から入力された発音類似単語Ｗ_ｉとその発音類似距離Ｄ_Ｗｉを記憶する（ステップＳ３）。

Ｎ-best発音類似単語抽出部５０は発音類似単語記憶部４０に発音類似距離Ｄ_Ｗｉが閾値θ以下の発音類似単語Ｗ_ｉが存在する（記憶されている）か否かを調べ（ステップＳ４）、存在していれば、発音類似距離Ｄ_Ｗｉが小さい上位Ｎ個の発音類似単語を抽出する（ステップＳ５）。抽出されたＮ個の発音類似単語（Ｎ-best発音類似単語）はＮ-best発音類似単語記憶部６０に記憶される（ステップＳ６）。

クラス内単語出現確率付与部７０はＮ-best発音類似単語記憶部６０に記憶されているＮ-best発音類似単語をもとに、追加単語Ａのクラス内単語出現確率を計算する。

まず、言語モデルを参照して、Ｎ-best発音類似単語群として抽出された単語Ｗ_ｉのユニグラム出現確率Ｐ（Ｗ_ｉ）を求める（ステップＳ７）。ユニグラム出現確率Ｐ（Ｗ_ｉ）は、
Ｐ（Ｗ_ｉ）＝Ｐ（Ｗ_ｉ｜Ｃ_ｉ）Ｐ（Ｃ_ｉ）
と表される。Ｃ_ｉはＷ_ｉの属するクラスである。

クラス内単語出現確率Ｐ（Ｗ_ｉ｜Ｃ_ｉ）やクラスユニグラム出現確率Ｐ（Ｃ_ｉ）は言語モデルに保存されているので、ユニグラム出現確率Ｐ（Ｗ_ｉ）を求めることができる。

求めた中で最大のユニグラム出現確率を追加単語Ａのユニグラム出現確率Ｐ（Ａ）とする。Ｎ-best発音類似単語群の中でユニグラム出現確率が最大となった単語をＷ_ｍａｘとすれば、
Ｐ（Ａ）＝Ｐ（Ｗ_ｍａｘ）＝Ｐ（Ａ｜Ｃ_Ａ）Ｐ（Ｃ_Ａ）
となる。クラスユニグラム出現確率Ｐ（Ｃ_Ａ）は言語モデルに保存されており、追加単語ＡのクラスＣ_Ａは予め指定されて追加単語記憶部１０に記憶されている。従って、
Ｐ（Ａ｜Ｃ_Ａ）＝Ｐ（Ｗ_ｍａｘ）／Ｐ（Ｃ_Ａ）
を計算することができ、これにより、追加単語Ａのクラス内単語出現確率Ｐ（Ａ｜Ｃ_Ａ）を求めることができる（ステップＳ８）。

このように、Ｎ-best発音類似単語群の中からユニグラム出現確率が最大の単語Ｗ_ｍａｘを選び、その単語Ｗ_ｍａｘのユニグラム出現確率Ｐ（Ｗ_ｍａｘ）を追加単語Ａのユニグラム出現確率Ｐ（Ａ）としてクラス内単語出現確率Ｐ（Ａ｜Ｃ_Ａ）を求めることにより、追加単語Ａが類似した発音をもつ別の単語として認識されることを防ぐことができる。

一方、判定部３０における判定において、発音類似距離Ｄ_Ｗｉが閾値θ以下の既存単語Ｗ_ｉが存在しなかった場合、発音類似単語記憶部４０には発音類似単語Ｗ_ｉが存在せず（ステップＳ４）、よってＮ-best発音類似単語抽出部５０はＮ-best発音類似単語を発音類似単語記憶部４０から抽出することができない。この場合、Ｎ-best発音類似単語抽出部５０は発音類似単語が存在しないことをクラス内単語出現確率付与部７０に通知する。

発音類似距離Ｄ_Ｗｉが閾値θ以下の発音類似単語が存在しない場合、クラス内単語出現確率付与部７０は追加単語Ａに対して指定されたクラスＣ_Ａにおけるクラス内単語出現確率が最大の既存単語と同じクラス内単語出現確率を追加単語Ａに付与する（ステップＳ９）。

このように、発音類似距離Ｄ_Ｗｉが閾値θ以下の発音類似単語が存在しないときは、発音が類似した単語が少数であり、誤認識が起こりにくいと考えられるため、クラス内単語出現確率が最大の既存単語と同じ確率を付与することで、音声認識において追加単語Ａが十分に出現するようにすることができる。

クラス内単語出現確率付与部７０は上記のようにして求めた追加単語Ａのクラス内単語出現確率Ｐ（Ａ｜Ｃ_Ａ）を言語モデル記憶部３００に記憶されている言語モデルに追加し（ステップＳ１０）、また追加単語Ａとその音素列ａを単語辞書記憶部２００に記憶されている単語辞書に追加する。

上述した単語追加装置１００及びその単語追加方法によれば、使用するデータは従来用いてきた単語辞書及び言語モデルのみであって、追加のリソースを必要とせず、その点で汎用性に優れ、また簡易に単語を追加することができる。

実施例１では発音類似距離計算部２０におけるＤＰマッチングによる発音類似距離の計算において、ＤＰマッチングのコストを編集距離を用いて決定するものとなっていたが、実施例２では音素間のConfusion Matrixを用いてＤＰマッチングのコストを決定する。

Confusion Matrixとは下記文献２に記載されているように、任意の音素ｘとして発音された音声が、任意の音素ｙとして出力される確率ｐ_ｘ，ｙの推定値を行列の要素Ｃ（ｘ，ｙ）とし、全ての音素についてまとめた行列である。
文献２：Savitha Srinivasan and Dragutin Petkovic,「Phonetic Confusion Matrix
Based Spoken Document Retrieval」，Proceedings of SIGIR 2000，2000年
７月，p.81-87

要素Ｃ（ｘ，ｙ）は評価音声データの書き起こし文及びその評価音声データに対して音声認識を行った音声テキストデータを用いて計算される。書き起こし文中に出現する任意の音素ｘに対応して、音声テキストデータ中に出現する音素ｙ_ｎの出現回数をカウントする。対応する音素が欠落している場合には、空音素φとしてカウントする。音声テキストデータ中に出現する音素ｙ_ｎの出現回数を書き起こし文中に出現する音素ｘの総出現回数で割り、これをｐ_ｘ，ｙｎとする。同様にして、全ての音素についてｐ_ｘ，ｙを求め、これを表にまとめる。

Confusion Matrixを用いたＤＰマッチングによる発音類似距離算出の例を図３に示す。ここでは、「kao」及び「kigo」という２つの音素列を例にとる。ＤＰマッチングでは図３（Ｂ）のＤＰマッチングの図に示すように、比較する記号列を縦、横に並べ、ラティスを構成し、各アークに重み付けする。ここから、重み（コスト）が最小になるように経路を選択する。

各アークの重み付け（コスト決定）の方法について説明する。Confusion Matrixでは２つの音素ｘ，ｙが類似していればしている程、その要素Ｃ（ｘ，ｙ）の値が大きくなる。一方、発音類似距離は音素ｘ，ｙが類似していれば、その値は小さくなる。従って、Confusion Matrixの要素Ｃ（ｘ，ｙ）の逆数をとった値Ｉ（ｘ，ｙ）をコストとして用いる。

図３（Ｂ）に示したように、startから伸びるアークのコストは０である。斜めに向くアークは、アークの始点ノードに対応する音素ペアが等しい場合は０を、それ以外の場合はＩ（ｘ，ｙ）＋Ｉ（ｙ，ｘ）をコストとする。これは、異なる音素ペアから斜めに進む場合、音素の置換を意味するためである。縦向きのアークには、縦軸に並べた音素列におけるアークの始点となる音素ｘに対応する空音素の要素の逆数Ｉ（ｘ，φ）を用いる。また、横向きのアークには、横軸に並べた音素列におけるアークの始点となる音素ｘに対応する空音素の要素の逆数Ｉ（ｘ，φ）を用いる。これは、例えば図３（Ｂ）のＤＰマッチングの図において、ノード５からノード８への移動は、横軸に並べられた音素列に対して縦軸の音素ｉの削除を意味するためである。

以上のようにコストを付加したラティスに対して最適経路探索を行い、そのコストを発音類似距離とする。

実施例２では上述したように、発音類似距離計算部２０はＤＰマッチングのコストをConfusion Matrixを用いて決定し、追加単語Ａの音素列ａと既存単語Ｗ_ｉの音素列ｂ_ｉの発音類似距離Ｄ_Ｗｉを計算するものとなっており、他の構成及び処理フローは実施例１と同じである。

上述したような実施例２のＤＰマッチングのコストの決定方法によれば、発音類似距離が音素ごとの類似度を含んだものになるため、より信頼性の高い発音類似距離を算出することができる。なお、Confusion Matrixの作成には音声データベースが必要となるが、音素の認識間違いを検出できればよいため、既存の音声データベースを用いればよく、よって追加のリソースは必要としない。

実施例１ではクラス内単語出現確率付与部７０はＮ-best発音類似単語のユニグラム出現確率を求め、求めた中で最大のユニグラム出現確率を追加単語のユニグラム出現確率として、追加単語のクラス内単語出現確率を求めていたが、実施例３ではＮ-best発音類似単語のユニグラム出現確率の発音類似距離に応じた重み付き平均を求め、その重み付き平均を追加単語Ａのユニグラム出現確率Ｐ（Ａ）として、追加単語Ａのクラス内単語出現確率Ｐ（Ａ｜Ｃ_Ａ）を求める。追加単語Ａのユニグラム出現確率Ｐ（Ａ）は、

となる。

図４は実施例３の処理フローを示したものであり、前述の図２に示した実施例１の処理フローのステップＳ６〜Ｓ８に替えてステップＳ１１〜Ｓ１３を実行する。

即ち、この例ではＮ-best発音類似単語抽出部５０で抽出されたＮ-best発音類似単語とその発音類似距離がＮ-best発音類似単語記憶部６０に記憶され（ステップＳ１１）、クラス内単語出現確率付与部７０はＮ-best発音類似単語群として抽出された単語Ｗ_ｉのユニグラム出現確率Ｐ（Ｗ_ｉ）を言語モデルを参照して求め、それら求めたユニグラム出現確率Ｐ（Ｗ_ｉ）の発音類似距離Ｄ_Ｗｉに応じた重み付き平均を求める（ステップＳ１２）。そして、求めた重み付き平均を式（１）に示すように追加単語Ａのユニグラム出現確率Ｐ（Ａ）として、
Ｐ（Ａ｜Ｃ_Ａ）＝Ｐ（Ａ）／Ｐ（Ｃ_Ａ）
より、追加単語Ａのクラス内単語出現確率Ｐ（Ａ｜Ｃ_Ａ）を求める（ステップＳ１３）。なお、他の処理ステップＳ１〜Ｓ５及びＳ９，Ｓ１０では実施例１と同じ処理が実行される。

この実施例３と実施例１とを比較すると、実施例１では、Ｎ-best発音類似単語群の中で最大のユニグラム出現確率を有する単語Ｗ_ｍａｘの発音類似距離がＮ-best発音類似単語群の中でも特に小さく、かつユニグラム出現確率Ｐ（Ｗ_ｍａｘ）が他のＮ-best発音類似単語のユニグラム出現確率と比較して著しく大きい場合（例えば、１０〜１００倍程度）、追加単語Ａのユニグラム出現確率Ｐ（Ａ）は他の発音類似単語群と比べて大きいものになる。従って、湧き出しが多くなり、音声認識における認識精度が下がってしまうおそれがある。

これに対し、実施例３では、発音が類似している既存単語の確率をより強く反映させたユニグラム出現確率を追加単語のユニグラム出現確率とすることで、過度に大きいクラス内単語出現確率を追加単語に付与することを防ぐことができ、よって湧き出しを実施例１に比し、少なくすることができる。

なお、発音類似距離が閾値θ以下の発音類似単語が存在しなければ、追加単語Ａの誤認識は起こりにくく、よって実施例１と同様にステップＳ９が実行され、追加単語ＡのクラスＣ_Ａにおけるクラス内単語出現確率の最大値を追加単語Ａのクラス内単語出現確率Ｐ（Ａ｜Ｃ_Ａ）とする。

実施例１では追加単語Ａの音素列ａと、単語辞書に登録されている既存単語Ｗ_ｉの音素列ｂ_ｉの発音類似距離を、単語辞書に登録されている全ての既存単語について計算し、発音類似距離が閾値θ以下となった既存単語からＮ-best発音類似単語を抽出して、それらのユニグラム出現確率を求め、求めた中で最大のユニグラム出現確率を追加単語Ａのユニグラム出現確率Ｐ（Ａ）とするものとなっている。

また、実施例３では実施例１と同様に抽出したＮ-best発音類似単語群のユニグラム出現確率の発音類似距離に応じた重み付き平均を求め、その重み付き平均を追加単語Ａのユニグラム出現確率Ｐ（Ａ）とするものとなっている。

この場合、単語辞書に登録されている既存単語群には、助詞や助動詞といった主に文の構成に関わる（文法的な役割を持つ）機能語と、それ以外の一般的な意味を持つ内容語が混在しているため、Ｎ-best発音類似単語群に機能語と内容語が混在することが考えられ、このようなＮ-best発音類似単語群をもとに追加単語Ａのユニグラム出現確率Ｐ（Ａ）を求めると、内容語に比べて出現確率の高い機能語にユニグラム出現確率Ｐ（Ａ）の値が引きずられてしまい、湧き出しが頻出するといった状況が起こりうる。

これを防ぐため、実施例４では発音類似距離計算部２０は発音類似距離の計算に用いる既存単語から機能語を除外するものとする。追加単語Ａは一般に固有名詞のような内容語と考えられ、このようにＮ-best発音類似単語群に機能語が含まれないようにすることにより、追加単語Ａの湧き出しを防ぐことができる。

なお、単語辞書は一般に登録単語の品詞情報を保有しているため、これをもとに機能語を除外することができる。また、例えば単語辞書に品詞情報がない場合には形態素解析を行うことにより品詞を決定することができる。

以上説明したように、この発明によれば、追加単語Ａのクラス内単語出現確率Ｐ（Ａ｜Ｃ_Ａ）を適切に決定することができ、その点で音声認識精度の向上に寄与することができる。Ｐ（Ｃ_Ａ）などのクラスユニグラム出現確率やＰ（Ｃ_Ａ｜Ｃ_ｉ）などのクラスバイグラム出現確率のようなクラスＮ-gram出現確率は言語モデルに保存されているので、クラス内単語出現確率Ｐ（Ａ｜Ｃ_Ａ）を決定することで、追加単語ＡのＮ-gramを求めることができる。

上述した単語追加装置、単語追加方法はコンピュータと、コンピュータにインストールされた単語追加プログラムによって実現することができる。コンピュータにインストールされた単語追加プログラムはコンピュータのＣＰＵによって解読されてコンピュータに上述した単語追加方法を実行させる。

Claims

追加単語の音素列と単語辞書に登録されている既存単語の音素列の発音類似距離を、単語辞書に登録されている全ての既存単語についてＤＰマッチングにより計算する発音類似距離計算部と、
前記発音類似距離計算部で計算された発音類似距離が閾値以下か否かを判定する判定部と、
前記判定部で発音類似距離が閾値以下と判定された既存単語から、発音類似距離が小さい上位Ｎ個の既存単語を抽出するＮ-best発音類似単語抽出部と、
言語モデルを参照して、前記Ｎ個の既存単語のユニグラム出現確率を求め、求めた中で最大のユニグラム出現確率を追加単語のユニグラム出現確率として、そのユニグラム出現確率と追加単語に対して指定されたクラスのクラスユニグラム出現確率とから追加単語のクラス内単語出現確率を求め、求めたクラス内単語出現確率を前記言語モデルに追加し、追加単語を前記単語辞書に追加するクラス内単語出現確率付与部とを備え、
前記判定部における判定において発音類似距離が閾値以下の既存単語が存在しなかった場合、前記クラス内単語出現確率付与部は追加単語に対して指定されたクラスにおけるクラス内単語出現確率が最大の既存単語と同じクラス内単語出現確率を追加単語に付与することを特徴とする単語追加装置。
追加単語の音素列と単語辞書に登録されている既存単語の音素列の発音類似距離を、単語辞書に登録されている全ての既存単語についてＤＰマッチングにより計算する発音類似距離計算部と、
前記発音類似距離計算部で計算された発音類似距離が閾値以下か否かを判定する判定部と、
前記判定部で発音類似距離が閾値以下と判定された既存単語から、発音類似距離が小さい上位Ｎ個の既存単語を抽出するＮ-best発音類似単語抽出部と、
言語モデルを参照して、前記Ｎ個の既存単語のユニグラム出現確率を求め、それらユニグラム出現確率の発音類似距離に応じた重み付き平均を計算し、その重み付き平均を追加単語のユニグラム出現確率として、そのユニグラム出現確率と追加単語に対して指定されたクラスのクラスユニグラム出現確率とから追加単語のクラス内単語出現確率を求め、求めたクラス内単語出現確率を前記言語モデルに追加し、追加単語を前記単語辞書に追加するクラス内単語出現確率付与部とを備え、
前記判定部における判定において発音類似距離が閾値以下の既存単語が存在しなかった場合、前記クラス内単語出現確率付与部は追加単語に対して指定されたクラスにおけるクラス内単語出現確率が最大の既存単語と同じクラス内単語出現確率を追加単語に付与することを特徴とする単語追加装置。
請求項１又は２記載の単語追加装置において、
前記発音類似距離計算部は前記ＤＰマッチングのコストの決定にConfusion Matrixを用いることを特徴とする単語追加装置。
請求項１乃至３記載のいずれかの単語追加装置において、
前記発音類似距離計算部は発音類似距離の計算に用いる既存単語から機能語を除外することを特徴とする単語追加装置。
追加単語の音素列と単語辞書に登録されている既存単語の音素列の発音類似距離を、単語辞書に登録されている全ての既存単語についてＤＰマッチングにより計算する発音類似距離計算過程と、
前記発音類似距離計算過程で計算された発音類似距離が閾値以下か否かを判定する判定過程と、
前記判定過程で発音類似距離が閾値以下と判定された既存単語から、発音類似距離が小さい上位Ｎ個の既存単語を抽出するＮ-best発音類似単語抽出過程と、
言語モデルを参照して、前記Ｎ個の既存単語のユニグラム出現確率を求め、求めた中で最大のユニグラム出現確率を追加単語のユニグラム出現確率として、そのユニグラム出現確率と追加単語に対して指定されたクラスのクラスユニグラム出現確率とから追加単語のクラス内単語出現確率を求め、求めたクラス内単語出現確率を前記言語モデルに追加し、追加単語を前記単語辞書に追加するクラス内単語出現確率付与過程とを含み、
前記判定過程における判定において発音類似距離が閾値以下の既存単語が存在しなかった場合、追加単語に対して指定されたクラスにおけるクラス内単語出現確率が最大の既存単語と同じクラス内単語出現確率を追加単語に付与することを特徴とする単語追加方法。
請求項１乃至４記載のいずれかの単語追加装置としてコンピュータを動作させるためのプログラム。