WO2010125736A1

WO2010125736A1 - 言語モデル作成装置、言語モデル作成方法、およびコンピュータ読み取り可能な記録媒体

Info

Publication number: WO2010125736A1
Application number: PCT/JP2010/001858
Authority: WO
Inventors: 北出祐; 越仲孝文; 大西祥史
Original assignee: 日本電気株式会社
Priority date: 2009-04-30
Filing date: 2010-03-16
Publication date: 2010-11-04
Also published as: JPWO2010125736A1; JP5413622B2; US20120035915A1; US8788266B2

Abstract

　標準語のテキストから作成された標準語言語モデルを用いて新たな言語モデルを作成する言語モデル作成装置２００を用いる。言語モデル作成装置２００は、方言を含む単語列を標準語の単語列に変換するための変換ルールを記憶する変換ルール記憶部２０１と、標準語言語モデル中の単語ｎグラムに変換ルールを適用して、方言を含むｎグラムを作成し、更に、作成した方言を含むｎグラムを単語ｎグラムに追加して、新たな言語モデル（方言言語モデル）を作成する方言言語モデル作成部２０３とを備えている。

Description

言語モデル作成装置、言語モデル作成方法、およびコンピュータ読み取り可能な記録媒体

　本発明は、言語モデル作成装置、言語モデル作成方法、及びコンピュータ読み取り可能な記録媒体に関し、特には、方言を含む音声の音声認識を可能にする言語モデル作成装置、言語モデル作成方法、及びコンピュータ読み取り可能な記録媒体に関する。

　音声認識とは、人間の音声をテキストに変換する処理のことであり、近年では音声認識システムに統計的なモデルを用いるのが一般的である。すなわち、入力の音声をＸ、出力の文字列をＷとすると、音声認識は、入力Ｘに対する事後確率Ｐ（Ｗ｜Ｘ）が最大となる単語列Ｗを出力する処理となる。事後確率Ｐ（Ｗ｜Ｘ）は定式化でき、具体的には、ベイズ則を用いて下記の（数１）によって表される。

　ここで、上記（数１）において、Ｐ（Ｘ｜Ｗ）、Ｐ（Ｗ）を与える確率モデルは、それぞれ音響モデル、言語モデルと呼ばれ、コーパスと呼ばれる大規模な電子的な音声・言語データを用いて学習される。このうち、言語モデルとしては、直前のｎ－１単語から後続単語の出現確率を予測するｎグラムモデルが広く用いられており、頑健に認識するためには大量のテキストが必要となる。

　また、音声認識において高い認識精度を実現するためには、入力音声の環境と同じ環境で録取したデータによって、音声認識用の音響モデル及び言語モデルを学習することが望ましい。入力音声の環境と同じ環境から録取したデータとしては、音響モデルにおいては、同一話者の音声データや、同じ種類の音（雑音等）のデータが挙げられる。また、言語モデルにおいては、入力音声と、話し方のスタイル及び話題の点で同一となるデータが挙げられる。

　話し方に関して、例えば、新聞などの書き言葉と人間が日常に話す言葉（話し言葉）とは異なっている。よって、入力音声がニュースの読み上げである場合には、同種の（書き言葉に比較的近い）読み上げのデータを用いて言語モデルの学習を行うと、高い認識精度を実現できる。また、入力音声が会話文である場合には、話し言葉のコーパスを使用して言語モデルの学習を行うことで、高い認識精度を実現できる。

　話し言葉の研究は様々な企業、研究機関で盛んに行われている。なお、従来では話し言葉のコーパスを収集するのが困難であったため書き言葉がコーパスとして用いられていたが、近年では日本語話し言葉コーパス（ＣＳＪ）等に代表される話し言葉を中心とした大規模なコーパスが収集され、これらが言語モデルの学習に広く用いられている。

　ところで、上述の書き言葉、話し言葉のコーパスというのはいずれも標準語で記述されたものであり、現状では整備された方言のコーパスはほとんど存在していない。そのため、これまで、方言を対象とした言語モデルの作成は行われておらず、その作成方法は一般的には知られていなかった。

　但し、方言は、標準語の語彙と、当該方言が使われる地方独自の語彙とから構成されている。また、地方独自の語彙の多くは、標準語の語彙を用いて言い換えることが可能である。つまり、標準語の語彙（及び言い回し）を、別の、方言を含む語彙（及び言い回し）に変換することができる。

　よって、対象となるタスク（対象タスク）の言語モデルを作成できない場合に、対象タスク以外の一般的なタスクに関するテキストデータを用いて、対象タスクの言語モデルを作成する方法（例えば、特許文献１参照。）を利用することが考えられる。具体的には、標準語を一般的なタスクとみなし、方言を対象タスクとみなして、特許文献１に開示の言語モデル作成方法を実施することで、方言を対象とした言語モデルを作成できると考えられる。

　ここで、図１７を用いて、特許文献１に開示の言語モデル作成方法を実施する言語モデル学習装置（言語モデル作成装置）について説明する。図１７は、従来の言語モデル学習装置の構成を示すブロック図である。図１７に示す言語モデル学習装置は、特許文献１に開示されている言語モデル学習装置である。

　図１７に示すように、言語モデル学習装置は、対象タスク言語データ記憶部１０１と、一般タスク言語データ記憶部１０２と、類似単語対抽出手段１０３と、類似単語列合成手段１０４と、言語モデル生成手段１０５とから構成されている。対象タスク言語データ記憶部１０１は、対象タスクのテキストデータを保持している。一般タスク言語データ記憶部１０２は、対象タスク以外のタスクを含む一般タスクのテキストデータを保持している。

　このような構成を有する、図１７に示す従来の言語モデル学習装置は、次のように動作する。先ず、類似単語対抽出手段１０３、類似単語列合成手段１０４、及び言語モデル生成手段１０５は、対象タスク言語データ記憶部１０１と、一般タスク言語データ記憶部１０２とから、それぞれの保持する言語モデル学習用のデータを読み込む。

　次に、類似単語対抽出手段１０３は、それぞれから読み込んだデータに含まれる単語の任意の組み合わせについて、予め定義された距離尺度に基づいて単語間距離を計算する。単語間距離としては、ｎ－ｇｒａｍ出現確率のユークリッド距離、又はクロスエントロピーを用いることができる。そして、類似単語抽出手段１０３は、この単語間距離の算出値が予め設定された値よりも小さい場合に、その類似単語対を類似単語列合成手段１０４に送る。なお、以降において、類似単語対のうち、対象タスクのテキストデータに含まれる単語をｗ_Ｔ、一般タスクのテキストデータに含まれる単語をＷ_Ｇと記す。

　次に、類似単語列合成手段１０４は、対象タスク言語データ記憶部１０１及び一般タスク言語データ記憶部１０２に記憶されている任意の長さの単語列をそれぞれから取り出す。そして、類似単語列合成手段１０４は、類似単語対抽出手段１０３から読み込んだ類似単語対Ｗ（Ｗ_Ｔ、Ｗ_Ｇ）を参照し、対象タスクの各単語列について、一般タスク内の単語Ｗ_Ｇが含まれているか否かを判定する。

　そして、類似単語列合成手段１０４は、対象タスクの単語列に一般タスク内の単語Ｗ_Ｇが含まれていた場合は、その単語列において、一般タスク内の単語Ｗ_Ｇを対象タスク内の単語Ｗ_Ｔに置き換える。更に、類似単語合成手段１０４は、置き換えが行われた単語列が一般タスクまたは対象タスクの言語データに存在するかどうかを判定し、存在しない場合に、置き換えが行われた単語列を言語モデル生成手段１０５に送る。

　最後に、言語モデル生成手段１０５は、対象タスク言語データ記憶部１０１に含まれるテキストデータと、一般タスク言語データ記憶部１０２に含まれるテキストデータと、類似単語列合成手段１０４より送られてきた単語列のデータとを用いて言語モデルを作成する。

　図１７に示す言語モデル学習装置によれば、対象タスク言語データ記憶部１０１に、方言のテキストデータを保持させ、一般タスク言語データ記憶部１０２に標準語のテキストデータを保持させておくことで、方言を対象とした言語モデルの作成が可能になると考えられる。

特開２００２－３４２３２３号公報（第１３－１４頁、第１図）

　しかしながら、上記特許文献１に開示の言語モデル学習装置では、単語連鎖と確率分布との類似性を元に単語対が抽出されるが、抽出された単語対の関係性は保証されていない。よって、対象タスクの単語（方言）に対して適切な出現確率が与えられず、方言を対象とした言語モデルを適切に作成することは困難である。

　つまり、上記特許文献１に開示の言語モデル学習装置は、一般タスクのテキストデータ及び対象タスクのテキストデータそれぞれに対して確率分布を求め、一般タスクと対象タスクとを比較し、類似する確率分布及び単語連鎖を有する単語対を抽出する。このとき、方言に対応する対象タスクのテキストデータが少量であると、一般タスクと比較される対象タスクにおいて、そのテキストデータから学習された確率分布は、頑健ではなくなる。また、ｎグラムの総数及び種類数ともに限られてしまう。

　よって、上記特許文献１に開示の言語モデル学習装置では、適切な単語対を抽出することができない場合があり、その単語対を元に作成された方言を含むｎグラムに対して適切な出現確率が付与することは極めて困難である。この結果、入力音声に方言が含まれている場合に本方式で作成された言語モデルを用いて音声認識を行っても正しく結果を出力させることは困難となる。

　本発明の目的は、上記問題を解消し、入力音声に方言が含まれている場合であっても頑健な認識を可能にする言語モデルを作成し得る、言語モデル作成装置、言語モデル作成方法、及びコンピュータ読み取り可能な記録媒体を提供することにある。

　上記目的を達成するため、本発明における言語モデル作成装置は、標準語のテキストから作成された標準語言語モデルを用いて新たな言語モデルを作成する言語モデル作成装置であって、
　方言を含む単語列を標準語の単語列に変換するための変換ルールを記憶する変換ルール記憶部と、
　前記標準語言語モデル中の単語ｎグラムに前記変換ルールを適用して、前記方言を含むｎグラムを作成し、更に、作成した前記方言を含むｎグラムを前記単語ｎグラムに追加して、前記新たな言語モデルを作成する方言言語モデル作成部と、
を備えていることを特徴とする。

　また、上記目的を達成するため、本発明における言語モデル作成方法は、標準語のテキストから作成された標準語言語モデルを用いて新たな言語モデルを作成するための方法であって、
（ａ）方言を含む単語列を標準語の単語列に変換するための変換ルールを設定する、ステップと、
（ｂ）前記標準語言語モデル中の単語ｎグラムに前記変換ルールを適用して、前記方言を含むｎグラムを作成し、更に、作成した前記方言を含むｎグラムを前記単語ｎグラムに追加して、前記新たな言語モデルを作成する、ステップと、
を有することを特徴とする。

　上記目的を達成するため、本発明におけるコンピュータ読み取り可能な記録媒体は、標準語のテキストから作成された標準語言語モデルを用いる新たな言語モデルの作成をコンピュータによって実行するためのプログラムを記録した、コンピュータ読み取り可能な記録媒体であって、
前記コンピュータによって、
（ａ）方言を含む単語列を標準語の単語列に変換するための変換ルールを設定する、ステップと、
（ｂ）前記標準語言語モデル中の単語ｎグラムに前記変換ルールを適用して、前記方言を含むｎグラムを作成し、更に、作成した前記方言を含むｎグラムを前記単語ｎグラムに追加して、前記新たな言語モデルを作成する、ステップと、
を実行させる、命令を含むプログラムを記録していることを特徴とする。

　以上の特徴により、本発明における言語モデル作成装置、言語モデル作成方法、及びコンピュータ読み取り可能な記録媒体によれば、入力音声に方言が含まれている場合であっても頑健な認識を可能にする言語モデルを作成できる。

図１は、本発明の実施の形態１における言語モデル作成装置の構成を示すブロック図である。図２は、本発明の実施の形態で用いられる変換ルールの一例を示す図である。図３は、本発明の実施の形態１における言語モデル作成装置の動作を示すフロー図である。図４は、本発明の実施の形態２における言語モデル作成装置の構成を示すブロック図である。図５は、本発明の実施の形態２における言語モデル作成装置の動作を示すフロー図である。図６は、本発明の実施の形態３における言語モデル作成装置の構成を示すブロック図である。図７は、本発明の実施の形態３における言語モデル作成装置の動作を示すフロー図である。図８は、本発明の実施の形態４における言語モデル作成装置の動作を示すフロー図である。図９は、本発明の実施の形態５における言語モデル作成装置の構成を示すブロック図である。図１０は、本発明の実施の形態５における言語モデル作成装置の動作を示すフロー図である。図１１は、本発明の実施の形態６における言語モデル作成装置の動作を示すフロー図である。図１２は、本発明の実施の形態７における言語モデル作成装置の構成を示すブロック図である。図１３は、本発明の実施の形態７における言語モデル作成装置の動作を示すフロー図である。図１４は、本発明の実施の形態８における言語モデル作成装置の構成を示すブロック図である。図１５は、本発明の実施の形態８における言語モデル作成装置の動作を示すフロー図である。図１６は、本発明の実施の形態１～８における言語モデル作成装置を実現するコンピュータの一例を示すブロック図である。図１７は、従来の言語モデル作成装置の構成を示すブロック図である。

　（実施の形態１）
　以下、本発明の実施の形態１における言語モデル作成装置、言語モデル作成方法、及びプログラムについて、図１、図２、及び図３を参照しながら説明する。最初に、本実施の形態１における言語モデル作成装置について図１及び図２を用いて説明する。図１は、本発明の実施の形態１における言語モデル作成装置の構成を示すブロック図である。

　図１に示す本実施の形態１における言語モデル作成装置２００は、標準語のテキストから作成された標準語言語モデルを用いて新たな言語モデル（以下「方言言語モデル」という。）を作成する装置である。図１に示すように、言語モデル作成装置２００は、変換ルール記憶部２０１と、方言言語モデル作成部２０３とを備えている。本実施の形態１では、言語モデル作成装置２００は、更に、標準語言語モデルを記憶する標準語言語モデル記憶部２０２も備えている。

　変換ルール記憶部２０１は、方言を含む単語列を標準語の単語列に変換するための変換ルールを記憶している。また、方言言語モデル作成部２０３は、標準語言語モデル中の単語ｎグラムに変換ルールを適用して、方言を含むｎグラムを作成する。更に、方言言語モデル作成部２０３は、作成した方言を含む単語ｎグラムを既存の単語ｎグラムに追加して、方言言語モデルを作成する。

　このように、本実施の形態１では、方言と標準語との間の変換ルールに基づき、標準語言語モデルに含まれるｎグラムから、方言を含むｎグラムが作成される。また、標準語言語モデルは、大量の標準語のデータを用いて学習することによって作成された頑健な言語モデルである。つまり、本実施の形態１では、後述するように、膨大なテキストから学習され、且つ、信頼可能なｎグラムの出現確率を用いて、方言を含むｎグラムの確率値が計算される。このため、本実施の形態１によれば、入力音声に方言が含まれている場合であっても頑健な認識を可能にする言語モデルが作成される。

　次いで、図１に加え、図２を用いて、本実施の形態１における言語モデル作成装置２００の構成を更に具体的に説明する。図２は、本発明の実施の形態で用いられる変換ルールの一例を示す図である。

　本実施の形態１では、標準語言語モデル記憶部２０２によって記憶されている標準語言語モデルは、標準語のみからなるテキストによる学習によって作成された言語モデルである。変換ルール記憶部２０１は、変換ルールとして、方言を含む単語列と、この方言に対応する標準語のみからなる単語列との組を記憶している。また、本実施の形態１では、方言言語モデル作成部２０３は、標準語言語モデル記憶部２０２に記憶された標準語言語モデルを用いて方言の単語に適切な確率値を配分する。

　言い換えると、方言言語モデル作成部２０３は、変換ルールを用いて、方言を含むｎグラムを作成した後に、標準語言語モデルから、標準語を含む単語列の出現確率を取り出し、取り出した出現確率と、予め設定された分配確率とから、同じ組の方言を含む単語列の出現確率を算出（推定）する。そして、方言言語モデル作成部２０３は、算出した同じ組の方言を含む単語列及びその出現確率を標準語言語モデルに追加して方言言語モデルを作成する。

　ここで、変換ルール記憶部２０１によって記憶されている変換ルールと、方言言語モデル作成部２０３の動作とについて以下に説明する。変換ルール記憶部２０１は、上述したように、方言を含む単語列を標準語の単語列に変換するルールを記述した変換ルールを記憶する。変換ルールの例を図２に示す。図２に示すテーブルでは、１列目に、方言を含む単語列が記述され、２列目に、１列目の方言を含む単語列に対応する標準語の単語列が記述されている。即ち、１行目の例においては、単語列「言う／た」は方言の単語「言う」を含み、且つ、この方言を含む単語列に対応する、標準語のみからなる単語列が「言っ／た」であることを意味している。

　なお、本実施の形態１において、変換ルールは、人手によって与えられていても良いし、既存のデータから取得されたものであっても良い。また、図２は、語数が２の場合（ｎ＝２の場合）を例示しているが、語数（ｎ）は特に限定されるものではなく、可変である。

　方言言語モデル作成部２０３は、具体的には、以下の処理を行う。先ず、方言言語モデル作成部２０３は、変換ルールを参照し、方言を含む単語列（Ｗ_Ｄとする）と標準語のみからなる単語列（Ｗ_Ｇとする）との組を取り出す。このとき、Ｗ_ＤとＷ_Ｇとは同一の文脈、同一の意味を持った単語列であり、言い換え表現である。よって、Ｗ_ＧをＷ_Ｄに置き換えて得られた、方言を含む単語列は、使用可能な言い回しと考えられる。

　そこで、標準語の音声ではＷ_Ｇのみで話されていた言い回しが、方言を含む音声においては、一部の標準語が方言を含む言い回しに置き換わっていると仮定し、両者が属する１つの（上位）クラスを設定する。即ち、Ｗ_Ｄは単語列クラスＣ（”Ｗ_Ｇ”）に属しているとし、その構成要素は｛Ｗ_Ｇ，Ｗ_Ｄ｝とする。次いで、標準語のみからなる単語列の出現確率の一部を、方言を含む単語列に割り当てる。

　つまり、標準語言語モデル記憶部２０２に記憶されている標準語言語モデルにおいて、既に、ある単語列｛＊，Ｗ_Ｇ｝、｛Ｗ_Ｇ，＊｝の出現確率Ｐ（＊，Ｗ_Ｇ）、Ｐ（Ｗ_Ｇ，＊）が算出されているとする。この場合、上記の出現確率Ｐ（＊，Ｗ_Ｇ）、Ｐ（Ｗ_Ｇ，＊）は、方言言語モデル作成部２０３によって、それぞれＰ（＊，Ｃ（”Ｗ_Ｇ”））、Ｐ（Ｃ（”Ｗ_Ｇ”），＊）に置き換えられる。なお、「＊」は任意の文字列を表している。

　そして、方言言語モデル作成部２０３は、単語列クラスＣ（”Ｗ_Ｇ”）の要素｛Ｗ_Ｇ，Ｗ_Ｄ｝に、単語列クラスＣ（”Ｗ_Ｇ”）の出現確率を分配して、Ｐ´（＊，Ｗ_Ｇ）、Ｐ´（Ｗ_Ｇ，＊）、Ｐ´（＊，Ｗ_Ｄ）、Ｐ´（Ｗ_Ｄ，＊）を求める。このＰ´（＊，Ｗ_Ｇ）、Ｐ´（Ｗ_Ｇ，＊）、Ｐ´（＊，Ｗ_Ｄ）、及びＰ´（Ｗ_Ｄ，＊）それぞれは、方言を含む単語列の出現確率を表し、下記の（数２）～（数５）から求められる。また、上記の分配の際に用いられる分配率αを、以下「クラス内分配確率」又は単に「分配確率」と呼ぶ。クラス内分配確率αとしては、予め定められた値が用いられる。

　ここで、上記（数２）～（数５）において、Ｐ（＊，Ｃ（“Ｗ_＊”））、Ｐ（Ｃ（“Ｗ_＊”），＊）は、それぞれ標準語言語モデルで計算された単語列｛＊，Ｃ（“Ｗ_＊”）｝、｛Ｃ（“Ｗ_＊”），＊｝の出現確率である。よって、Ｐ´（＊，Ｃ（“Ｗ_＊”））及びＰ´（Ｃ（”Ｗ_＊”），＊）」は、方言を含むｎグラムが追加された状態で再計算することによって得られた、単語列｛＊，Ｃ（“Ｗ_＊”）｝及び｛Ｃ（“Ｗ_＊”），＊｝それぞれの出現確率となる。なお、上記において「Ｗ_＊」は、Ｗ_Ｇ又はＷ_Ｄであることを示している。

　また、上記（数２）～（数６）において、クラス内分配確率αとしては、一定の値を用いることができる。但し、αの値は、変換ルール毎に変化させても良いし、ルールの構成要素、例えば方言の単語の品詞の種類毎に変化させても良い。また、上記では、クラスＣ（“Ｗ_Ｇ”）の要素数が２の例を示したが、要素数が３以上の場合は、（数６）ではなく、以下の（数７）に示す制約条件が満たされている必要がある。

　次に、図２に示した「言う[動詞，連用形]／た[動詞，基本形]」を含むｎグラムの出現確率を求める場合について具体的に説明する。なお、以後の説明では、品詞情報は一致しているものとして、品詞についての説明は省略する。また、以下の例では、ｎ＝３とし、標準語言語モデル記憶部２０２に記憶されている標準語言語モデルには、「Ｗ_ｉ，言っ，た」の出現確率Ｐ（Ｗ_ｉ，言っ，た）が含まれている（又は求められている）とする。

　まず、方言言語モデル作成部２０３は、変換ルール記憶部２０１に記憶されている変換ルールを読み込む。例えば、標準語単語列「言っ／た」と方言を含む単語列「言う／た」との組が変換ルールに含まれていたとする。この場合、方言を含む単語列「言う／た」は、標準語単語列「言っ／た」と同一のある単語列クラスＣ（”言っ／た“）に属している。そして、単語列クラスＣ（”言っ／た“）のクラス要素には、標準語の単語列「言っ／た」と方言を含む単語列「言う／た」とが含まれていることとなる。

　よって、方言言語モデル作成部２０３においては、標準語言語モデルにおける「言っ／た」を含むｎグラムの出現確率は、単語列「言っ／た」の出現確率ではなく、単語列クラスＣ（”言っ／た”）の出現確率に相当する。

　そこで、改めて標準語単語列「言っ／た」を含むｎグラムの出現確率を求めるとともに、方言を含む単語列「言う／た」を含むｎグラムの出現確率を求める。単語列クラスＣ（“言っ／た”）に含まれる単語列の出現確率は、下記の（数８）～（数１０）を用いて求めることができる。

　上記（数８）及び（数９）において、Ｐ´（Ｗ_ｊ，言っ，た）、及びＰ´（Ｗｉ，言う，た）は、それぞれ再計算された方言言語モデルにおける単語列“Ｗ_ｊ　言っ　た”、”Ｗ_ｉ　言う　た“の出現確率である。また、α（言っ／た，Ｗ）は、単語列クラスＣ（”言っ／た”）の単語列Ｗへと変換するためのクラス内分配確率を表す。また、その構成要素の部分単語列のいずれもが変換ルールに記載されていないｎグラムについては、下記の（数１１）に示すように、標準語言語モデルで計算された出現確率値をそのまま用いる。

　次に、本発明の実施の形態１における言語モデル作成装置２００の全体の動作について図３を用いて説明する。図３は、本発明の実施の形態１における言語モデル作成装置の動作を示すフロー図である。

　なお、本実施の形態１では、言語モデル作成装置２００を動作させることによって、本実施の形態１における言語モデル作成方法が実施される。このため、本実施の形態１における言語モデル作成方法の説明は、以下の言語モデル作成装置２００の動作の説明に代える。また、以下の説明においては、適宜、図１及び図２を参酌する。

　図３に示すように、先ず、方言言語モデル作成部２０３は、変換ルール記憶部２０１から変換ルールを読み込み、変換ルールに従って、標準語のみからなる単語列と方言を含む単語列との組を抽出する（ステップＳ５０１）。

　次に、方言言語モデル作成部２０３は、標準語言語モデル記憶部２０２から標準語言語モデルを読み込み、変換ルールに記載されている標準語のみからなる単語列を１つのクラスとみなす（ステップＳ５０２）。ステップＳ５０２では、方言言語モデル作成部２０３は、更に、標準語のみからなる単語列の出現確率を、クラスを含む単語列の出現確率とする。また、方言言語モデル作成部２０３は、標準語のみからなる単語列と、それと対応する方言を含む単語列とをクラスの構成要素とする。

　最後に、方言言語モデル作成部２０３は、分配確率αを用いて、上記（数２）～（数６）に従い、クラスを含む単語列の出現確率を、その構成要素である、標準語のみからなる単語列とそれと対応する方言を含む単語列とに割り当て、方言言語モデルを作成する（ステップＳ５０３）。このステップＳ５０１～Ｓ５０３によって得られた方言言語モデルは、言語モデル作成装置２００から出力され、例えば、音声認識装置で利用される。

　また、本実施の形態１におけるプログラムは、コンピュータに、図３に示すステップＳ５０１～Ｓ５０３を実行させる命令を含むプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態１における言語モデル作成装置２００及び言語モデル作成方法を実現できる。この場合、コンピュータのＣＰＵ（central processing unit）が、方言言語モデル作成部２０３として機能し、処理を行なう。更に、本実施の形態１では、変換ルール記憶部２０１及び標準語言語モデル記憶部２０２は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって実現できる。

　以上のように、本実施の形態１では、言語モデル作成装置２００は、標準語言語モデルをベースとし、そして、変換ルールに基づいて方言を含むｎグラムを追加して、方言言語モデルを作成する。このため、本実施の形態１における言語モデル作成装置２００は、頑健な言語モデルを構築できる。すなわち、本実施の形態１では、上述したように、標準語のデータより求められた頑健な確率分布を元にして、方言を含むｎグラムの確率分布が求められている。このため、単純に標準語のデータに少量の方言データを加えて言語モデルを作成する方法では推定できなかった頑健な確率分布を求めることが可能となる。

　（実施の形態２）
　次に本発明の実施の形態２における言語モデル作成装置、言語モデル作成方法、及びプログラムについて、図４及び図５を参照しながら説明する。最初に、本実施の形態２における言語モデル作成装置について図４を用いて説明する。図４は、本発明の実施の形態２における言語モデル作成装置の構成を示すプロック図である。

　図４に示すように、本実施の形態２における言語モデル作成装置２１０は、外部から入力された方言データ、又は予め用意された方言データを記憶する方言データ記憶部２１３を備えている。方言データは、方言を含む音声データ及び方言を含むテキストデータを有するデータである。また、本実施の形態２においては、方言言語モデル作成部２１４は、実施の形態１において図１に示した方言言語モデル作成部２０３と異なり、方言データを用いて、クラス内分配確率αの値を設定する。

　上記の点以外については、言語モデル作成装置２１０は、実施の形態１において図１に示した言語モデル作成装置２００と同様に構成されている。つまり、変換ルール記憶部２１１は、実施の形態１において図１に示した変換ルール記憶部２０１と同様に構成され、更に、それと同じ動作をする。また、標準語言語モデル記憶部２１２は、実施の形態１において図１に示した標準語言語モデル記憶部２０２と同様に構成され、更に、それと同じ動作をする。以下に、実施の形態１との相違点について具体的に説明する。

　方言データ記憶部２１３は、記憶している方言データを、方言言語モデル作成部２１４に対して、その指示に従って送る。方言データとしては、具体的には、対象とする方言が話されている場面で収録された音声データや、音声から書き起こされたテキストデータ、更には、同方言で記述されたブログ等のウェブ上に存在する方言を含むテキストデータ等が該当する。但し、方言データに含まれるテキストデータは、概して方言のみで記述されているわけではなく、方言と標準語とが混在したテキストデータとなっている。

　また、本実施の形態２においても、方言言語モデル作成部２１４は、実施の形態１と同様に、標準語言語モデルから標準語を含む単語列の出現確率を取り出し、取り出した出現確率と、クラス内分配確率αとから、変換ルールにしたがって展開された方言を含む単語列の出現確率を算出（推定）する。但し、本実施の形態２においては、クラス内分配確率αの設定の仕方が、実施の形態１と異なっている。

　本実施の形態２においては、クラス内分配確率αは、上述したように、方言データ記憶部２１３に記憶された方言データを用いて設定される。また、クラス内分配確率αを設定するための方言データには、正解データが付加される。正解データは、人手によって作成された、音声データに対応するテキストデータである。

　方言言語モデル作成部２１４は、この正解データが付加された方言データを用いて、クラス内分配確率αの値の設定、方言を含むｎグラムの作成、及び方言言語モデルの作成を行う。そして、方言言語モデル作成部２１４は、新たに作成した方言言語モデルと方言データとを用いた外部の音声認識装置による音声認識の結果を取得し、取得した音声認識の結果と正解データとから、クラス内分配確率αの値を設定、更新する。また、方言言語モデル作成部２１４は、更新したクラス内分配確率αを用いて、方言言語モデルの更新、及び音声認識結果の取得を行い、再帰的にクラス内分配確率αを更新することができる。また、この場合、更新後の方言言語モデルを用いて音声認識装置が音声認識を実施するので、方言言語モデル作成部２１４は、その結果を取得する。

　具体的には、本実施の形態２では、先ず、方言言語モデル作成部２１４は、全変換ルール共通、変換ルール毎、又は、例えば方言の単語の品詞が異なるといった変換ルールの種類毎に、初期値α_０を設定する。次に、方言言語モデル作成部２１４は、その初期値α_０を用いて、方言を含むｎグラムも含めた全ｎグラムの出現確率を求めて、方言言語モデルを作成する。なお、この場合の方言言語モデルの作成は、下記の参考文献に記載の従来からの手法に準じて行われる。

（参考文献）
　鹿野　清宏、河原　達也、山本　幹雄、伊藤　克亘、武田　一哉著、「ＩＴ　Ｔｅｘｔ　音声認識システム」、オーム社、ｐ．５３－６５、ｐ．８０－９３、２００１年５月１５日発行

　次に、方言言語モデル作成部２１４は、方言データに含まれる音声データ及び正解のテキストデータを入力とした音声認識から得られる評価関数が収束するまで、又は一定回数、方言言語モデルの作成を繰り返し実行して、αを調整する。ここで、評価関数としては、Perplexity、及び音声認識時の方言単語の出現回数に基づく関数等が挙げられる。そして、以下に、評価関数として後者が用いられる場合のクラス内分配確率αの調整について更に詳細に説明する。

　αの調整においては、先ず、音声認識装置（図４において図示せず）によって、方言を含む音声データを入力として、作成された方言言語モデルを用いた音声認識が実行される。そして、方言言語モデル作成部２１４は、入力となった音声データに対応する正解データ（正解のテキストデータ）を参照し、単語単位で、音声認識結果との正誤を求める。その後、方言言語モデル作成部２１４は、変換ルールに含まれる方言を含む単語列Ｗ_Ｄについて、例えば以下の（数１２）及び（数１３）に基づいてクラス内分配確率αを更新する。

　上記（数１２）及び（数１３）において、α_ｊ（Ｗ_Ｄ）はｊ回繰り返し実行したのちの単語列Ｗ_Ｄについてのクラス内分配確率を示し、Ｌ_ｊ－１（Ｗ_Ｄ）はα_ｊ－１を用いて作成された言語モデルで音声認識した結果における単語列Ｗ_Ｄの正誤数に関する関数を表す。Ｌ_ｊ－１（Ｗ_Ｄ）としては、例えば（数１２）に対しては（数１４）が用いられ、（数１３）に対しては（数１５）が用いられる。

　また、上記（数１４）及び（数１５）において、ｃ_ｊ（Ｗ_Ｄ）、ｓ_ｊ ^１（Ｗ_Ｄ）、ｓ_ｊ ^２（Ｗ_Ｄ）、ｄ_ｊ（Ｗ_Ｄ）、ｉ_ｊ（Ｗ_Ｄ）はそれぞれ、α_ｊを用いて作成された言語モデルを用いて音声認識した結果における、単語列Ｗ_Ｄが正解であった回数、正解単語列Ｗ_Ｄを置換誤りした回数、Ｗ_Ｄに置換誤りされた回数、脱落誤りの回数、挿入誤りの回数を表す。なお、「正解単語列Ｗ_Ｄを置換誤りした回数」とは、正解の単語列Ｗ_Ｄが別の単語に誤認識され、置換誤りとなった回数をいう。「Ｗ_Ｄに置換誤りされた回数」とは、別の単語が正解であるにもかかわらずＷ_Ｄと誤認識され、置換誤りとなった回数をいう。また、β_１～β_５は、重みパラメータであり、正負の値を取り、Ｗ_Ｄに非依存である。γは、制御パラメータであり、上記（数１４）ではｊの値が増えるに従って値を小さくし、上記（数１５）では逆にｊの値が増えるに従って値を大きくする。

　また、本実施の形態２では、上記（数１２）及び（数１３）の代わりに、下記の（数１６）及び（数１７）を用いることもできる。下記の（数１６）及び（数１７）では、認識結果中の単語列Ｗ_Ｄの正誤数を求めるのではなく、単語列Ｗ_Ｄの代わりに、単語列Ｗ_Ｄの部分文字列Ｗ´_Ｄを用いる。なお、下記の（数１６）及び（数１７）においてｉは実行回数を示している。

　次に、本発明の実施の形態２における言語モデル作成装置２１０の全体の動作について図５を用いて説明する。図５は、本発明の実施の形態２における言語モデル作成装置の動作を示すフロー図である。

　なお、本実施の形態２においても、実施の形態１と同様に、言語モデル作成装置２１０を動作させることによって、本実施の形態２における言語モデル作成方法が実施される。このため、本実施の形態２における言語モデル作成方法の説明は、以下の言語モデル作成装置２１０の動作の説明に代える。また、以下の説明においては、適宜、図４を参酌する。

　図５に示すように、先ず、方言言語モデル作成部２１４は、変換ルール記憶部２１１から、変換ルールに従って、標準語のみからなる単語列と方言を含む単語列との組を抽出する（ステップＳ５１１）。次に、方言言語モデル作成部２１４は、標準語言語モデル記憶部２１２から標準語言語モデルを読み込み、単語列のクラス化を実行する（ステップＳ５１２）。この一連の動作であるステップＳ５１１及びＳ５１２は、実施の形態１において図３に示したＳ５０１およびＳ５０２と同様のステップである。

　次に、方言言語モデル作成部２１４は、変換ルールに従ってクラス内分配確率αの初期値α_０を設定し、設定した初期値α_０を用いて、方言言語モデルを作成する（ステップＳ５１３）。

　続いて、方言言語モデル作成部２１４は、上述した処理に従い、音声認識の結果から得られる評価関数の値が収束するまで、又は一定回数、方言言語モデルの作成を繰り返し実行して、クラス内分配確率αを更新する（ステップＳ５１４）。

　その後、方言言語モデル作成部２１４は、ステップＳ５１４による更新によって最終的に得られたクラス内分配確率αを用いて単語の出現確率を求め、方言言語モデルを更新する（ステップＳ５１５）。このステップＳ５１１～Ｓ５１５によって得られた方言言語モデルは、言語モデル作成装置２１０から出力され、例えば、音声認識装置で利用される。

　また、本実施の形態２におけるプログラムは、コンピュータに、図５に示すステップＳ５１１～Ｓ５１５を実行させる命令を含むプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態２における言語モデル作成装置２１０及び言語モデル作成方法を実現できる。この場合、コンピュータのＣＰＵ（central processing unit）が、方言言語モデル作成部２１４として機能し、処理を行なう。更に、本実施の形態２では、変換ルール記憶部２１１、標準語言語モデル記憶部２１２、及び方言データ記憶部２１３は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって実現できる。

　以上のように、本実施の形態２では、方言を含む方言データに対して、評価関数が最大となるように求められたクラス内分配確率が用いられ、そして、方言を含む単語列の出現確率が求められる。このため、本実施の形態２によれば、実施の形態１よりもいっそう、方言を含んだ実データに即した、方言を含むｎグラムの出現確率を求めることが可能となる。また、本実施の形態２では、クラス内分配確率を求める際に、繰り返し実行する回数を制限することで、少量の方言データからの学習によって引き起こされる過学習が抑制される。

　（実施の形態３）
　次に、本発明の実施の形態３における言語モデル作成装置、言語モデル作成方法、及びプログラムについて、図６及び図７を参照しながら説明する。最初に、本実施の形態３における言語モデル作成装置について図６を用いて説明する。図６は、本発明の実施の形態３における言語モデル作成装置の構成を示すプロック図である。

　図６に示すように、本実施の形態３における言語モデル作成装置３００は、外部から入力された方言データ又は予め用意された方言データを記憶する方言データ記憶部３０２を備えている。方言データ記憶部３０２は、方言を含むテキストデータである方言データを、変換ルール処理部３０３に送る。

　また、図６に示すように、本実施の形態３における言語モデル作成装置３００は、変換ルール処理部３０３を備えている。変換ルール処理部３０３は、方言データから方言を含む単語列を抽出し、抽出した方言を含む単語列に基づいて変換ルールを修正する。また、本実施の形態３では、変換ルール記憶部３０１は、既に記憶している変換ルールを、変換ルール処理部３０３によって修正された変換ルールを用いて更新する。

　上記の点以外については、言語モデル作成装置３００は、実施の形態１において図１に示した言語モデル作成装置２００と同様に構成されている。つまり、方言言語モデル作成部３０５は、実施の形態１において図１に示した方言言語モデル作成部２０３と同様に構成され、更にそれと同じ動作をする。変換ルール記憶部３０１が予め記憶している変換ルールは、実施の形態１において図１に示した変換ルール記憶部２０１に記憶されている変換ルールと同様のものである。また、標準語言語モデル記憶部３０４は、実施の形態１において図１に示した標準語言語モデル記憶部２０２と同様に構成され、更に、それと同じ動作をする。以下に、実施の形態１との相違点について具体的に説明する。

　本実施の形態３において、変換ルール記憶部３０１は、上述したように、変換ルール処理部３０３から送られてきた修正後の変換ルールを受け取ると、既に記憶されている変換ルールを修正後の変換ルールに差し替える。

　また、本実施の形態３では、方言データ記憶部３０２に記憶されている方言データは、変換ルール処理部３０３に送られる。方言データの詳細は、実施の形態２で述べた通りである。

　変換ルール処理部３０３は、変換ルールに記載の方言を含む単語列が、方言データ記憶部３０２に記憶された方言データに含まれているときに、方言データから、当該方言を含む単語列を一定の単語列長だけ抽出し、抽出された単語列をもとにして変換ルールを作成して変換ルール記憶部３０１に送り返す。なお、変換ルールは、抽出された単語列の部分単語列から構成されている。即ち、変換ルール処理部３０３は、初期の変換ルールから、実データである方言データに含まれている方言を含む単語列を抽出し、変換ルールの絞り込みを行っている。

　また、一定の単語列長分の単語列の抽出は次のように行われる。例えば、ｎグラム言語モデルが採用されている場合に、Ｍ個の単語で構成された単語列｛Ｗ_１，・・・，Ｗ_Ｍ｝が入力され、その中のｍ番目～ｍ＋ｉ（ｍ＋ｉ≦Ｍ）番目の単語｛Ｗ_ｍ，・・・，Ｗ_ｍ＋ｉ｝が方言であるとする。この場合、｛Ｗ_{ｍ－ｎ＋１}，・・・，Ｗ_{ｍ＋ｉ＋ｎ－１}｝が抽出される。但し、上記の場合においてｍ＋ｉ＞Ｍの時は、｛Ｗ_{ｍ－ｎ＋１}，・・・，Ｗ_Ｍ｝が抽出される。

　なお、初期の変換ルールは、人手によって与えられていても良いし、既存のデータから取得されたものであっても良い。また、初期の変換ルールが存在しない場合は、変換ルール処理部３０３は、入力された方言データの中から、標準語言語モデル記憶部３０４に記憶された標準語言語モデルに含まれないｎグラムを特定する。そして、変換ルール処理部３０３は、特定したｎグラムから、ある一定の条件、例えばｎ単語がすべて特定の品詞でなければならない等を満たしたものを抽出し、抽出したｎグラムを変換ルールとすることもできる。

　次に、本発明の実施の形態３における言語モデル作成装置３００の全体の動作について図７を用いて説明する。図７は、本発明の実施の形態３における言語モデル作成装置の動作を示すフロー図である。

　なお、本実施の形態３においても、実施の形態１と同様に、言語モデル作成装置３００を動作させることによって、本実施の形態３における言語モデル作成方法が実施される。このため、本実施の形態３における言語モデル作成方法の説明は、以下の言語モデル作成装置３００の動作の説明に代える。また、以下の説明においては、適宜、図６を参酌する。

　図７に示すように、先ず、変換ルール処理部３０３は、方言データ記憶部３０２に記憶された方言を含むテキストデータから、初期の変換ルールに記載の方言を含む単語列を、一定の単語列長だけ抽出する（ステップＳ６０１）。次に、変換ルール処理部３０３は、既存の変換ルールを抽出された単語列と差し替える（ステップＳ６０２）。ステップＳ６０２により、変換ルールは修正されたこととなる。

　次に、方言言語モデル作成部３０５は、修正後の変換ルールに従って、標準語のみからなる単語列と方言を含む単語列との組を抽出する（ステップＳ６０３）。続いて、方言言語モデル作成部３０５は、標準語言語モデル記憶部３０４から標準語言語モデルを読み込み、単語列のクラス化を実行する（ステップＳ６０４）。その後、方言言語モデル作成部３０５は、方言言語モデルを作成する（ステップＳ６０５）。このステップＳ６０１～Ｓ６０５によって得られた方言言語モデルは、言語モデル作成装置３００から出力され、例えば、音声認識装置で利用される。なお、ステップＳ６０３～Ｓ６０５は、実施の形態１において図３に示したＳ５０１～Ｓ５０３と同様のステップである。

　また、本実施の形態３におけるプログラムは、コンピュータに、図７に示すステップＳ６０１～Ｓ６０５を実行させる命令を含むプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態３における言語モデル作成装置３００及び言語モデル作成方法を実現できる。この場合、コンピュータのＣＰＵ（central processing unit）が、方言言語モデル作成部３０５及び変換ルール処理部３０３として機能し、処理を行なう。更に、本実施の形態３では、変換ルール記憶部３０１、標準語言語モデル記憶部３０４、及び方言データ記憶部３０２は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって実現できる。

　以上のように、本実施の形態３では、変換ルール処理部３０３は、変換ルールがより実例に沿うように、変換ルールの絞り込みを実行する。このため、本実施の形態３によれば、実例に基づいて方言を含むｎグラムが作成され、これが、方言言語モデルに追加されるので、実施の形態１よりも更に頑健な言語モデルが構築される。

　（実施の形態４）
　次に、本発明の実施の形態４における言語モデル作成装置、言語モデル作成方法、及びプログラムについて、図８を参照しながら説明する。本実施の形態４における言語モデル作成装置は、実施の形態３において図６に示した言語モデル作成装置３００と同様に構成されている。

　本実施の形態４における言語モデル作成装置は、変換ルール記憶部３０１と、変換ルール処理部３０３と、標準語言語モデル記憶部３０４と、方言言語モデル作成部３０５と、方言データ記憶部３０２とを備えている（図６参照）。

　但し、本実施の形態４においては、変換ルール処理部３０３は、入力された方言データから方言を含む単語列を抽出する。そして、変換ルール処理部３０３は、抽出した方言を含む単語列と、それと対応する標準語の単語列とを用いて、変換ルールとして利用可能な変換パターンを導出する。変換ルール記憶部３０１は、既に記憶している初期の変換ルールに、変換ルール処理部３０３によって導出された変換パターンを加え、初期の変換ルールを更新する。

　本実施の形態４において、変換ルール処理部３０３は、具体的には、以下に挙げる４つの処理を行う。先ず、変換ルール処理部３０３は、変換ルールに記載のルールの方言を含む単語列が、入力された方言データのテキストデータに含まれていたときに、当該方言を含む単語列を一定の単語列長だけ抽出する。なお、一定の単語列長の抽出は、実施の形態３の場合と同様にして行われる。

　次に、変換ルール処理部３０３は、抽出された方言を含む単語列から、方言を含む単語列パターンを抽出する。例えば、「・・・／言う（動詞「言う」・連用形）／て（動詞「てる」・連用形）／・・・」と「・・・／言う（動詞「言う」・連用形）／てる（動詞「てる」・基本形）／・・・」とが抽出された場合を例として説明する。この場合には、「言う（動詞「言う」・連用形）／＊（動詞「てる」・＊）」という単語列パターンが抽出される。なお、上記において、“＊”は任意のエントリを表し、前述の例では、動詞「てる」のいずれの活用語にも適用されることを意味する。

　更に、変換ルール処理部３０３は、抽出した方言を含む単語列パターンに対応する、標準語のみからなる標準語の単語列パターンを導出し、方言を含む変換パターンとそれと対応する標準語の単語列パターンの組である変換パターンを作成する。上述の例では、標準語の単語列パターンとしては、「言っ（動詞「言う」・連用形）／＊（動詞「てる」・＊）」）が導出される。また、この処理は、具体的には、方言を含む単語列と標準語のみからなる単語列との対応関係が規定された変換テーブル（変換テーブルは既存の変換ルールを用いても良い）を用意しておき、変換ルール処理部３０３がこのテーブルを参照することによって行われる。なお、この処理は、例えば、人手で行うこともできる。

　最後に、変換ルール処理部３０３は、導出した変換パターンを追加する変換ルールとして、変換ルール記憶部３０１に送る。これにより変換ルール記憶部３０１は、変換ルールを更新する。また、本実施の形態４では、変換ルール処理部３０３は、上記の一連の処理を、入力された方言データ全てに対して一度に行っても良いし、例えば、１ファイル（１音声データ、１テキストデータ）毎、又は１トピック毎に繰り返し実行しても良い。繰り返し行う場合には、変換ルール処理部３０３は、上記４つの処理を実行する度に変換パターンを変換ルール記憶部３０１に送って変換ルールを更新し、次のプロセスでは、更新された変換ルールを用いて４つの処理を実行する。

　なお、変換ルール処理部３０３による変換ルールの作成前に、変換ルール記憶部３０１が記憶している初期の変換ルールは、人手によって与えられていても良いし、既存のデータから取得されたものであっても良い。また、初期の変換ルールが存在しない場合は、変換ルール処理部３０３は、方言データの中から、標準語言語モデル記憶部３０４に記憶された標準語言語モデルに含まれないｎグラムであって、ある一定の条件を満たしたものを抽出し、抽出したｎグラムを変換ルールとすることもできる。ある一定の条件としては、例えばｎ単語がすべて特定の品詞でなければならない、等の条件が挙げられる。

　次に、本発明の実施の形態４における言語モデル作成装置の全体の動作について図８を用いて説明する。図８は、本発明の実施の形態４における言語モデル作成装置の動作を示すフロー図である。

　なお、本実施の形態４においても、実施の形態１と同様に、言語モデル作成装置を動作させることによって、本実施の形態４における言語モデル作成方法が実施される。このため、本実施の形態４における言語モデル作成方法の説明は、以下の言語モデル作成装置の動作の説明に代える。また、以下の説明においては、適宜、図６を参酌する。

　図８に示すように、先ず、変換ルール処理部３０３は、初期の変換ルール記載の方言を含む単語列を、方言を含むテキストデータから、一定の単語列長だけ抽出する（ステップＳ６１１）。次に、変換ルール処理部３０３は、抽出された単語列から方言を含む単語列のパターンを抽出する（ステップＳ６１２）。

　次に、変換ルール処理部３０３は、ステップＳ６１２で抽出された方言を含む単語列パターンに対応する、標準語のみからなる単語列のパターンを作成する（ステップＳ６１３）。そして、ステップＳ６１２で抽出された方言を含む単語列パターンと、ステップＳ６１３によって作成された標準語のみからなる単語列のパターンとは、１組の変換パターンとなる。

　次に、変換ルール抽出部３０３が、作成した変換パターンを変換ルール記憶部３０１に送り、これを既存の変換ルールに追加させると、変換ルール記憶部３０１は、変換ルールを更新する（ステップＳ６１４）。

　次に、方言言語モデル作成部３０５は、標準語言語モデル記憶部３１４から標準語言語モデルを読み込み、更新後の変換ルールに従って単語のクラス化を実行する（ステップＳ６１５）。その後、方言言語モデル作成部３０５は、方言言語モデルを作成する（ステップＳ６１６）。このステップＳ６１１～Ｓ６１６によって得られた方言言語モデルは、言語モデル作成装置から出力され、例えば、音声認識装置で利用される。なお、ステップＳ６１５及びＳ６１６は、それぞれ実施の形態１において図３に示したＳ５０２及びＳ５０３と同様のステップである。

　また、本実施の形態４におけるプログラムは、コンピュータに、図８に示すステップＳ６１１～Ｓ６１６を実行させる命令を含むプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態４における言語モデル作成装置及び言語モデル作成方法を実現できる。この場合、コンピュータのＣＰＵ（central processing unit）が、方言言語モデル作成部３０５及び変換ルール作成部３０３として機能し、処理を行なう。更に、本実施の形態４では、変換ルール記憶部３０１、標準語言語モデル記憶部３０４、及び方言データ記憶部３０２は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって実現できる。

　以上のように、本実施の形態４では、方言データから導出した方言を含む変換パターンが変換ルールに追加され、これにより、方言を含むｎグラムも追加されることとなる。このため、本実施の形態４によれば、少量の方言データからの学習を原因とする、方言を含む単語連鎖（ｎグラム）の過少性を解消できる。また、本実施の形態４による場合も、実施の形態１で述べた効果を得ることができる。

　（実施の形態５）
　次に、本発明の実施の形態５における言語モデル作成装置、言語モデル作成方法、及びプログラムについて説明する。最初に、本実施の形態５における言語モデル作成装置について図９を用いて説明する。図９は、本発明の実施の形態５における言語モデル作成装置の構成を示すブロック図である。

　図９に示すように、本実施の形態５における言語モデル作成装置３１０は、変換ルール記憶部３１１、方言データ記憶部３１２、変換ルール処理部３１３、標準語言語モデル記憶部３１４、及び方言言語モデル作成部３１５を備えている。このうち、方言データ記憶部３１２以外の各部は、実施の形態３において図６に示した、変換ルール記憶部３０１、変換ルール処理部３０３、標準語言語モデル記憶部３０４、及び方言言語モデル作成部３０５と同様に機能する。

　但し、本実施の形態５においては、方言言語モデル作成部３１５は、実施の形態２において図４に示した方言言語モデル作成部２１４と同様に動作し、クラス内分配確率αを更新することができる（図９参照）。方言データ記憶部３１２は、図６に示した方言データ記憶部３０２と異なり、変換ルール処理部３１３に加え、方言言語モデル作成部３１５にも方言データを送る。また、方言データ記憶部３１２は、変換ルール処理部３１３と方言言語モデル作成部３１５とに対して、同一の方言データを送ることも、異なる方言データを送ることもできる。本実施の形態５における言語モデル作成装置３１０は、これらの点で、実施の形態３において図６に示した言語モデル作成装置３００と異なっている。

　次に、本発明の実施の形態５における言語モデル作成装置３１０の全体の動作について図１０を用いて説明する。図１０は、本発明の実施の形態５における言語モデル作成装置の動作を示すフロー図である。

　なお、本実施の形態５においても、実施の形態１と同様に、言語モデル作成装置３１０を動作させることによって、本実施の形態５における言語モデル作成方法が実施される。このため、本実施の形態５における言語モデル作成方法の説明は、以下の言語モデル作成装置の動作の説明に代える。また、以下の説明においては、適宜、図９を参酌する。

　図１０に示すように、先ず、変換ルール処理部３１３は、初期の変換ルールに記載の方言を含む単語列を、方言を含むテキストデータから、一定の単語列長だけ抽出する（ステップＳ６２１）。

　次に、変換ルール処理部３１３は、既存の変換ルールを抽出された単語列と差し替え、変換ルールを修正する（ステップＳ６２２）。

　次に、方言言語モデル作成部３１５は、標準語言語モデル記憶部３１４から標準語言語モデルを読み込み、更新後の変換ルールに従って単語列のクラス化を実行する（ステップＳ６２３）。なお、上記ステップＳ６２１～Ｓ６２３は、実施の形態３において図７に示したステップＳ６０１、Ｓ６０２、及びＳ６０４と同様のステップである。

　次に、方言言語モデル作成部３１５は、本実施の形態５では、修正後の変換ルールに従ってクラス内分配確率αの初期値α_０を設定し、設定した初期値α_０を用いて、方言言語モデルを作成する（ステップＳ６２４）。

　続いて、方言言語モデル作成部３１５は、ステップＳ６２４で作成された方言言語モデルを用いた音声認識の結果を取得し、それから得られる評価関数の値が収束するまで、又は一定回数、方言言語モデルの作成を繰り返し実行して、クラス内分配確率αを更新する（ステップＳ６２５）。

　その後、方言言語モデル作成部３１５は、ステップＳ６２５による更新によって最終的に得られたクラス内分配確率αを用いて単語の出現確率を求めて、方言言語モデルを更新する（ステップＳ６２６）。なお、上記ステップＳ６２４～Ｓ６２６は、実施の形態２において図５に示したステップＳ５１３～ステップＳ５１５とそれぞれ同様のステップである。

　上述のステップＳ６２１～Ｓ６２６によって得られた方言言語モデルは、本実施の形態５における言語モデル作成装置から出力され、例えば、音声認識装置で利用される。

　また、本実施の形態５におけるプログラムは、コンピュータに、図１０に示すステップＳ６２１～Ｓ６２６を実行させる命令を含むプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態５における言語モデル作成装置及び言語モデル作成方法を実現できる。この場合、コンピュータのＣＰＵ（central processing unit）が、方言言語モデル作成部３１５及び変換ルール処理部３１３として機能し、処理を行なう。更に、本実施の形態５では、変換ルール記憶部３１１、標準語言語モデル記憶部３１４、及び方言データ記憶部３１２は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって実現できる。

　以上のように、本実施の形態５では、実施の形態３に示した処理に加え、実施の形態２に示した処理も行われる。即ち、本実施の形態５では、変換ルールの絞込みと、クラス内分配確率の最適化とが行われる。本実施の形態５によれば、実施の形態３で述べた効果に加え、実施の形態２で述べた効果を得ることもできる。

　（実施の形態６）
　次に、本発明の実施の形態６における言語モデル作成装置、言語モデル作成方法、及びプログラムについて説明する。本実施の形態６における言語モデル作成装置は、実施の形態５において図９に示した言語モデル作成装置３１０と同様に構成されている。

　但し、本実施の形態６においては、変換ルール処理部３１３は、実施の形態４に示した変換ルール処理部と同様に動作し、変換パターンを導出する。また、方言言語モデル作成部３１５は、実施の形態２において図４に示した方言言語モデル作成部２１４と同様に動作し、クラス内分配確率αを更新することができる。本実施の形態６における言語モデル作成装置は、この点で、実施の形態４における言語モデル作成装置と異なっている。

　次に、本発明の実施の形態６における言語モデル作成装置の全体の動作について図１１を用いて説明する。図１１は、本発明の実施の形態６における言語モデル作成装置の動作を示すフロー図である。

　なお、本実施の形態６においても、実施の形態１と同様に、言語モデル作成装置を動作させることによって、本実施の形態６における言語モデル作成方法が実施される。このため、本実施の形態６における言語モデル作成方法の説明は、以下の言語モデル作成装置の動作の説明に代える。また、以下の説明においては、適宜、図４及び図６を参酌する。

　図１１に示すように、先ず、変換ルール処理部３１３は、初期の変換ルール記載の方言を含む単語列を、方言を含むテキストデータから、一定の単語列長だけ抽出する（ステップＳ６３１）。次に、変換ルール処理部３１３は、抽出された単語列から方言を含む単語列のパターンを抽出する（ステップＳ６３２）。

　次に、変換ルール処理部３１３は、ステップＳ６３２で抽出された方言を含む単語列パターンに対応する、標準語のみからなる単語列のパターンを作成する（ステップＳ６３３）。そして、ステップＳ６３２で抽出された方言を含む単語列パターンと、ステップＳ６３３によって作成された標準語のみかなる単語列のパターンとは、１組の変換パターンとなる。

　次に、変換ルール処理部３１３が、作成した変換パターンを変換ルール記憶部３１１に送り、これを既存の変換ルールに追加させると、変換ルール記憶部３１１は、変換ルールを更新する（ステップＳ６３４）。

　次に、方言言語モデル作成部３１５は、標準語言語モデル記憶部３１４から標準語言語モデルを読み込み、更新後の変換ルールに従って単語列のクラス化を実行する（ステップＳ６３５）。なお、上記ステップＳ６３１～Ｓ６３５は、実施の形態４において図８に示したステップＳ６１１～Ｓ６１５とそれぞれ同様のステップである。

　次に、方言言語モデル作成部３１５は、本実施の形態６では、更新後の変換ルールに従ってクラス内分配確率αの初期値α_０を設定し、設定した初期値α_０を用いて、方言言語モデルを作成する（ステップＳ６３６）。

　続いて、方言言語モデル作成部３１５は、ステップＳ６３６で作成された方言言語モデルを用いた音声認識の結果を取得し、それから得られる評価関数の値が収束するまで、又は一定回数、方言言語モデルの作成を繰り返し実行して、クラス内分配確率αを更新する（ステップＳ６３７）。

　その後、方言言語モデル作成部３１５は、ステップＳ６３７による更新によって最終的に得られたクラス内分配確率αを用いて単語の出現確率を求め、更に得られた出現確率から方言言語モデルを更新する（ステップＳ６３８）。なお、上記ステップＳ６３６～Ｓ６３８は、実施の形態２において図５に示したステップＳ５１３～ステップＳ５１５とそれぞれ同様のステップである。

　上述のステップＳ６３１～Ｓ６３８によって得られた方言言語モデルは、本実施の形態６における言語モデル作成装置から出力され、例えば、音声認識装置で利用される。

　また、本実施の形態６におけるプログラムは、コンピュータに、図１１に示すステップＳ６３１～Ｓ６３８を実行させる命令を含むプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態６における言語モデル作成装置及び言語モデル作成方法を実現できる。この場合、コンピュータのＣＰＵ（central processing unit）が、方言言語モデル作成部３１５及び変換ルール作成部３１３として機能し、処理を行なう。更に、本実施の形態６では、変換ルール記憶部３１１、標準語言語モデル記憶部３１４、及び方言データ記憶部３１２は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって実現できる。

　以上のように、本実施の形態６では、実施の形態４に示した処理に加え、実施の形態２に示した処理も行われる。即ち、本実施の形態６では、変換ルールの追加と、クラス内分配確率の最適化とが行われる。本実施の形態６によれば、実施の形態４で述べた効果に加え、実施の形態２で述べた効果を得ることもできる。

　（実施の形態７）
　次に、本発明の実施の形態７における言語モデル作成装置、言語モデル作成方法、及びプログラムについて、図１２及び図１３を参照しながら説明する。最初に、本実施の形態７における言語モデル作成装置について図１２を用いて説明する。図１２は、本発明の実施の形態７における言語モデル作成装置の構成を示すブロック図である。

　図１２に示すように、本実施の形態７における言語モデル作成装置４００は、実施の形態１～実施の形態６に示された標準語言語モデル記憶部の代わりに、標準語言語モデル作成部４０６を備えている。また、言語モデル作成装置４００は、変換データ作成部４０３と、変換データ記憶部４０４と、標準語データ記憶部４０５とを備えている。

　変換データ作成部４０３は、方言データに含まれるテキストデータから方言を含む単語列を抽出し、変換ルールを用いて、抽出した方言を含む単語列を、標準語のみを含む単語列に変換する。本実施の形態７では、変換データ作成部４０３は、変換ルール処理部４０８内に構築されている。変換ルール処理部４０８は、実施の形態３又は４において図６に示した変換ルール処理部３０３と同様に機能することができる。

　変換データ記憶部４０４は、変換データ作成部４０３による変換によって得られた、標準語のみを含む単語列を、変換データとして記憶する。標準語データ記憶部４０５は、標準語のテキストデータを記憶している。

　また、標準語言語モデル作成部４０６は、変換データ記憶部４０４によって記憶されている変換データ、及び標準語データ記憶部４０５によって記憶されている標準語のテキストデータを用いて、標準語言語モデルを作成する。

　また、図１２に示すように、言語モデル作成装置４００は、方言データ記憶部４０２も備えている。方言データ記憶部４０２は、実施の形態３において図６に示した方言データ記憶部３０２と同様に機能する。

　なお、上記の点以外については、言語モデル作成装置４００は、実施の形態１において図１に示した言語モデル作成装置２００と同様に構成されている。つまり、方言言語モデル作成部４０７は、実施の形態１において図１に示した方言言語モデル作成部２０３と同様に構成され、更にそれと同じ動作をする。変換ルール記憶部４０１は、実施の形態３において図６に示した変換ルール記憶部３０１と同様に構成され、更に、それと同じ動作をする。以下に、実施の形態１～６との相違点について具体的に説明する。

　具体的には、変換データ作成部４０３（変換ルール処理部４０８）は、実施の形態３において図６に示した変換ルール処理部３０３と同様に、先ず、変換ルールに記載の方言を含む単語列が、入力された方言データに含まれていたときに、当該方言を含む単語列を一定の単語列長だけ抽出する。そして、変換データ作成部４０３は、抽出された単語列を変換ルール記憶部４０１に送り返す。

　更に、変換データ作成部４０３は、変換ルールに記載のルールに従って、方言データを標準語のみからなるテキストデータに変換して、変換データを作成し、これを変換データ記憶部４０４に送る。変換データ記憶部４０４は、変換データ作成部４０３によって作成された標準語のテキストデータを変換データとして記憶する。

　また、本実施の形態７において、標準語データ記憶部４０５が記憶している標準語のテキストデータは、標準語言語モデル作成部４０６による標準語言語モデルの作成の際に、その学習用に用いられるテキストデータである。

　標準語言語モデル作成部４０６は、変換データ記憶部４０４に記憶されている変換データと、標準語データ記憶部４０５に記憶されている標準語のテキストデータとから、単語ｎグラムの出現確率を計算し、標準語言語モデルを作成する。この標準語言語モデルの作成は、本実施の形態７においても、実施の形態２において説明した参考文献に記載の従来からの手法に準じて行うことができる。但し、本実施の形態７では、標準語言語モデルの作成には、複数のテキストデータが用いられるため、下記の（数１８）を用いた線形補間が行われる。

　上記（数１８）において、βは０から１の間の値を取るパラメータである。また、Ｐ_Ｇ（Ｗ_ｉ－２，Ｗ_ｉ－１，Ｗ_ｉ）は標準語データから計算された出現確率を示し、Ｐ_Ｄ（Ｗ_ｉ－２，Ｗ_ｉ－１，Ｗ_ｉ）は変換データから計算された出現確率を示す。Ｐ（Ｗ_ｉ－２，Ｗ_ｉ－１，Ｗ_ｉ）は、線形補間後の出現確率を示す。このように、標準語言語モデルは、標準語に変換された変換データと、標準語のテキストデータとを用いて作成されているため、方言の単語は一切含まない状態となる。

　次に、本発明の実施の形態７における言語モデル作成装置４００の全体の動作について図１３を用いて説明する。図１３は、本発明の実施の形態７における言語モデル作成装置の動作を示すフロー図である。

　なお、本実施の形態７においても、実施の形態１と同様に、言語モデル作成装置４００を動作させることによって、本実施の形態７における言語モデル作成方法が実施される。このため、本実施の形態７における言語モデル作成方法の説明は、以下の言語モデル作成装置４００の動作の説明に代える。また、以下の説明においては、適宜、図１２を参酌する。

　図１３に示すように、先ず、変換データ処理４０８に構築された変換データ作成部４０３は、変換ルールを読み込み、変換ルールに従って方言を標準語に変換し、変換データを作成する（ステップＳ７０１）。作成された変換データは、変換データ記憶部４０４に記憶される。

　次に、変換ルール処理部４０８は、変換ルールから、方言を含む単語列とそれと対応する標準語のみからなる単語列との組を抽出する（ステップＳ７０２）。更に、変換ルール処理部４０８は、抽出された方言を含む単語列と、それに対応する標準語のみからなる単語列との組を用いて、変換ルールを修正する（ステップＳ７０３）。これにより、変換ルール記憶部４０１に記憶されている変換ルールが更新される。なお、ステップＳ７０２及びＳ７０３は、実施の形態３において図７に示したステップＳ６０１及びＳ６０２と同様のステップである。

　続いて、標準語言語モデル作成部４０６は、変換データ記憶部４０４によって記憶されている変換データ、及び標準語データ記憶部４０５によって記憶されている標準語のテキストデータを用いて、標準語言語モデルを作成する（ステップＳ７０４）。なお、ステップＳ７０４は、上記のステップＳ７０２及びＳ７０３と平行して行われていても良い。

　次に、方言言語モデル作成部４０７は、標準語言語モデル作成部４０６が作成した標準語言語モデルを読み込み、更新後の変換ルールに従って単語列のクラス化を実行する（ステップＳ７０５）。

　その後、方言言語モデル作成部４０７は、方言言語モデルを作成する（ステップＳ７０６）。このステップＳ７０１～Ｓ７０６によって得られた方言言語モデルは、言語モデル作成装置４００から出力され、例えば、音声認識装置で利用される。なお、ステップＳ７０５及びＳ７０６は、実施の形態１において図３に示したＳ５０２及びＳ５０３と同様のステップである。

　また、本実施の形態７におけるプログラムは、コンピュータに、図１３に示すステップＳ７０１～Ｓ７０６を実行させる命令を含むプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態７における言語モデル作成装置４００及び言語モデル作成方法を実現できる。この場合、コンピュータのＣＰＵ（central processing unit）が、変換データ作成部４０３（変換ルール処理部４０８）、標準語言語モデル作成部４０６、及び方言言語モデル作成部４０７として機能し、処理を行なう。更に、本実施の形態７では、変換ルール記憶部４０１、変換データ記憶部４０４、標準語データ記憶部４０５、及び方言データ記憶部４０２は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって実現できる。

　以上のように、本実施の形態７では、方言データを標準語に変換して得られた変換データを用いて、標準語言語モデルが作成される。よって、標準語言語モデルは、それを用いて方言言語モデルを作成することが容易な構成となる。このため、元々方言が含まれていて標準語言語モデルの学習に用いることができなかった単語列のｎグラムも、標準語言語モデルの学習データに加えることができるようになる。

　この結果、本実施の形態７によれば、方言言語モデルの作成の際に、実際に方言データに含まれているｎグラムと同じｎグラムを学習することができる。また、方言を含むｎグラムを標準語に変換して得られた変換データのｎグラムは、標準語データ記憶部４０５に記憶された標準語テキストだけでは網羅できないｎグラムを含んでいる可能性がある。よって、本実施の形態７では、実施の形態１よりもいっそう頑健な言語モデルを構築できる。また、本実施の形態７を用いた場合も、実施の形態３と同様の効果を得ることができる。

　（実施の形態８）
　次に、本発明の実施の形態８における言語モデル作成装置、言語モデル作成方法、及びプログラムについて、図１４及び図１５を参照しながら説明する。最初に、本実施の形態８における言語モデル作成装置について図１４を用いて説明する。図１４は、本発明の実施の形態８における言語モデル作成装置の構成を示すブロック図である。

　図１４に示すように、本実施の形態８における言語モデル作成装置４１０は、変換ルール記憶部４１１と、変換ルール処理部４１８と、変換データ記憶部４１４と、標準語データ記憶部４１５と、標準語言語モデル作成部４１６とを備えている。また、言語モデル作成装置４１０は、方言言語モデル作成部４１７と、方言データ記憶部４１２も備えている。変換ルール処理部４１８内には、変換データ作成部４１３が構築されている。

　図１４に示す言語モデル作成装置４１０では、変換データ作成部４１３は、実施の形態７において図１２に示した変換データ作成部４０３と同様の変換ルールを作成する機能を備えている。また、図１４に示す言語モデル作成装置４１０では、方言言語モデル作成部４１７は、実施の形態５において図９に示した方言言語モデル作成部３１５と同様に動作し、クラス内分配確率αを更新することができる。

　上記以外の点では、言語モデル作成装置４１０は、実施の形態７において図１２に示した言語モデル作成装置４００と同様に構成されている。方言言語モデル作成部４１７及び方言データ記憶部４１２を除き、言語モデル作成装置４１０の各部は、言語モデル作成装置４００の各部と同様に動作する。

　次に、本発明の実施の形態８における言語モデル作成装置４１０の全体の動作について図１５を用いて説明する。図１５は、本発明の実施の形態８における言語モデル作成装置の動作を示すフロー図である。

　なお、本実施の形態８においても、実施の形態１と同様に、言語モデル作成装置４１０を動作させることによって、本実施の形態８における言語モデル作成方法が実施される。このため、本実施の形態８における言語モデル作成方法の説明は、以下の言語モデル作成装置４１０の動作の説明に代える。また、以下の説明においては、適宜、図１４を参酌する。

　図１５に示すように、先ず、変換データ作成部４１３は、変換ルールを読み込み、変換ルールに従って方言を、標準語のみからなるテキストに変換し、変換データを作成する（ステップＳ７１１）。ステップＳ７１１は、図１３に示したステップＳ７０１と同様のステップである。

　次に、変換データ作成部４１３は、変換ルールから、方言を含む単語列と、それと対応する標準語のみからなる単語列の組を抽出する（ステップＳ７１２）。ステップＳ７１２は、図１３に示したステップＳ７０２と同様のステップである。

　続いて、変換データ作成部４１３は、ステップＳ７１２で抽出された、標準語のみからなる単語列のパターンを作成する（ステップＳ７１３）。そして、ステップＳ７１１で抽出された方言を含む単語列と、ステップＳ７１３によって作成された標準語のみかなる単語列とは、１組の変換パターンとなる。

　次に、変換データ作成部４１３は、作成した変換パターンを変換ルール記憶部４１１に送り、これを既存の変換ルールに追加させると、変換ルール記憶部４１１は、変換ルールを更新する（ステップＳ７１４）。なお、ステップＳ７１３及びＳ７１４は、図８に示したステップＳ６１３及びＳ６１４と同様のステップである。

　続いて、標準語言語モデル作成部４１６は、変換データ記憶部４１４によって記憶されている変換データ、及び標準語データ記憶部４１５によって記憶されている標準語のテキストデータを用いて、標準語言語モデルを作成する（ステップＳ７１５）。なお、ステップＳ７１５は、上記のステップＳ７１２～Ｓ７１４と平行して行われていても良い。また、ステップＳ７１５は、図１３に示したステップＳ７０４と同様のステップである。

　次に、方言言語モデル作成部４１７は、標準語言語モデル作成部４１６が作成した標準語言語モデルを読み込み、単語列のクラス化を実行する（ステップＳ７１６）。

　次に、方言言語モデル作成部４１７は、本実施の形態８では、更新後の変換ルールに従ってクラス内分配確率αの初期値α_０を設定し、設定した初期値α_０を用いて、方言言語モデルを作成する（ステップＳ７１７）。

　続いて、方言言語モデル作成部４１７は、ステップＳ７１７で作成された方言言語モデルを用いた音声認識の結果を取得し、それから得られる評価関数の値が収束するまで、又は一定回数、方言言語モデルの作成を繰り返し実行して、クラス内分配確率αを更新する（ステップＳ７１８）。

　その後、方言言語モデル作成部４１７は、ステップＳ７１８による更新によって最終的に得られたクラス内分配確率αを用いて単語の出現確率を求め、更に得られた出現確率から方言言語モデルを更新する（ステップＳ７１９）。このステップＳ７１１～Ｓ７１９によって得られた方言言語モデルは、言語モデル作成装置４１０から出力され、例えば、音声認識装置で利用される。なお、上記ステップＳ７１６～Ｓ７１９は、実施の形態６において図１１に示したステップＳ６３５～ステップＳ６３８と同様のステップである。

　また、本実施の形態８におけるプログラムは、コンピュータに、図１５に示すステップＳ７１１～Ｓ７１９を実行させる命令を含むプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態８における言語モデル作成装置４１０及び言語モデル作成方法を実現できる。この場合、コンピュータのＣＰＵ（central processing unit）が、データ作成部４１３（変換ルール処理部４１８）、標準語言語モデル作成部４１６、及び方言言語モデル作成部４１７として機能し、処理を行なう。更に、本実施の形態８では、変換ルール記憶部４１１、変換データ記憶部４１４、標準語データ記憶部４１５、及び方言データ記憶部４１２は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって実現できる。

　以上のように、本実施の形態８においても、実施の形態７と同様に、方言データを標準語に変換して得られた変換データを用いて、標準語言語モデルが作成される。よって、本実施の形態８による場合も、方言言語モデルの作成の際に、実際に方言データに含まれているｎグラムと同じｎグラムによる学習を行うことができる。よって、実施の形態７で述べたように、本実施の形態８でも、実施の形態１よりもいっそう頑健な言語モデルを構築できる。また、本実施の形態８を用いた場合も、実施の形態２、４及び６と同様の効果を得ることができる。

　ここで、実施の形態１～８におけるプログラムを実行することによって、言語モデル作成装置を実現するコンピュータについて図１６を用いて説明する。図１６は、本発明の実施の形態１～８における言語モデル作成装置を実現するコンピュータの一例を示すブロック図である。

　図１６に示すように、コンピュータ１１０は、ＣＰＵ１１１と、メインメモリ１１２と、記憶装置１１３と、入力インターフェイス１１４と、表示コントローラ１１５と、データリーダ／ライタ１１６と、通信インターフェイス１１７とを備える。これらの各部は、バス１２１を介して、互いにデータ通信可能に接続される。

　ＣＰＵ１１０は、記憶装置１１３に格納された、本実施の形態におけるプログラム（コード）をメインメモリ１１２に展開し、これらを所定順序で実行することにより、各種の演算を実施する。メインメモリ１１２は、典型的には、ＤＲＡＭ（Dynamic Random Access Memory）等の揮発性の記憶装置である。また、本実施の形態におけるプログラムは、コンピュータ読み取り可能な記録媒体１２０に格納された状態で提供される。なお、本実施の形態におけるプログラムは、通信インターフェイス１１７を介して接続されたインターネット上で流通するものであっても良い。

　また、記憶装置１１３の具体例としては、ハードディスクの他、フラッシュメモリ等の半導体記憶装置が挙げられる。入力インターフェイス１１４は、ＣＰＵ１１１と、キーボード及びマウスといった入力機器１１８との間のデータ伝送を仲介する。表示コントローラ１１５は、ディスプレイ装置１１９と接続され、ディスプレイ装置１１９での表示を制御する。データリーダ／ライタ１１６は、ＣＰＵ１１１と記録媒体１２０との間のデータ伝送を仲介し、記録媒体１２０からのプログラムの読み出し、及びコンピュータ１１０における処理結果の記録媒体１２０への書き込みを実行する。通信インターフェイス１１７は、ＣＰＵ１１１と、他のコンピュータとの間のデータ伝送を仲介する。

　また、記録媒体１２０の具体例としては、ＣＦ（Compact Flash）及びＳＤ（Secure Digital）等の汎用的な半導体記憶デバイス、フレキシブルディスク（Flexible Disk）等の磁気記憶媒体、又はＣＤ－ＲＯＭ（Compact Disk
Read Only Memory）などの光学記憶媒体が挙げられる。

　以上、実施の形態を参照して本願発明を説明したが、本願発明は上記実施の形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　この出願は、２００９年４月３０日に出願された日本出願特願２００９－１１１０７５を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　本願発明における言語モデル作成装置、言語モデル作成方法、及びコンピュータ読み取り可能な記録媒体は以下の特徴を有する。

（１）標準語のテキストから作成された標準語言語モデルを用いて新たな言語モデルを作成する言語モデル作成装置であって、
　方言を含む単語列を標準語の単語列に変換するための変換ルールを記憶する変換ルール記憶部と、
　前記標準語言語モデル中の単語ｎグラムに前記変換ルールを適用して、前記方言を含むｎグラムを作成し、更に、作成した前記方言を含むｎグラムを前記単語ｎグラムに追加して、前記新たな言語モデルを作成する方言言語モデル作成部と、
を備えていることを特徴とする言語モデル作成装置。

（２）前記変換ルール記憶部は、前記変換ルールとして、前記方言を含む単語列と、前記方言に対応する標準語を含む単語列との組を記憶し、
　前記方言言語モデル作成部は、前記標準語言語モデルから、前記標準語を含む単語列の出現確率を取り出し、取り出した出現確率と、予め設定された分配確率とから、前記方言を含むｎグラムの出現確率を算出することを特徴とする上記（１）に記載の言語モデル作成装置。

（３）前記方言言語モデル作成部が、前記方言を含む音声データ及び前記方言を含むテキストデータを有する方言データを用いて、前記分配確率の値を設定する、上記（２）に記載の言語モデル作成装置。

（４）前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列に基づいて前記変換ルールを修正する、変換ルール処理部を更に備え、
　前記変換ルール記憶部が、既に記憶している前記変換ルールを、前記変換ルール処理部によって修正された変換ルールを用いて更新する、上記（２）に記載の言語モデル作成装置。

（５）前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列と、抽出した前記方言を含む単語列に対応する標準語の単語列とを用いて、前記変換ルールとして利用可能な変換パターンを導出する、変換ルール処理部を更に備えている、上記（２）に記載の言語モデル作成装置。

（６）前記変換ルール処理部が、前記変換ルール記憶部に前記変換ルールが記憶されていない場合に、前記方言データから、それに含まれる単語列のうち前記標準語言語モデルに含まれていない単語列を抽出し、抽出した前記単語列を用いて前記変換ルールを作成する、上記（４）に記載の言語モデル作成装置。

（７）前記方言言語モデル作成部が、前記分配確率の値の設定、前記方言を含むｎグラムの作成、及び前記新たな言語モデルの作成を行った後、
前記新たな言語モデルと前記方言データとを用いた外部の音声認識装置による音声認識の結果を取得し、取得した前記音声認識の結果と前記方言データの正解データとから、前記分配確率の値を更新する、上記（３）に記載の言語モデル作成装置。

（８）前記方言を含む音声データ及び前記方言を含むテキストデータを有する方言データから前記方言を含む単語列を抽出し、前記変換ルールを用いて、抽出した前記方言を含む単語列を、標準語のみを含む単語列に変換する、変換データ作成部と、
　前記変換データ作成部による変換によって得られた、前記標準語のみを含む単語列を、変換データとして記憶する、変換データ記憶部と、
　標準語のテキストデータを記憶している標準語データ記憶部と、
　前記変換データ記憶部によって記憶されている前記変換データ、及び前記標準語データ記憶部によって記憶されている前記標準語のテキストデータを用いて、前記標準語言語モデルを作成する、標準語言語モデル作成部と、
を更に備える上記（１）に記載の言語モデル作成装置。

（９）前記データ作成部が、前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列に基づいて前記変換ルールを修正し、
　前記変換ルール記憶部が、既に記憶している前記変換ルールを、前記変換ルール処理部によって修正された変換ルールを用いて更新する、
上記（８）に記載の言語モデル作成装置。

（１０）前記変換データ作成部が、前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列と、抽出した前記方言を含む単語列に対応する標準語の単語列とを用いて、前記変換ルールとして利用可能な変換パターンを導出する、上記（８）に記載の言語モデル作成装置。

（１１）前記変換データ生成部が、前記変換ルール記憶部に前記変換ルールが記憶されていない場合に、前記方言データから、それに含まれる単語列のうち前記標準語言語モデルに含まれていない単語列を抽出し、抽出した前記単語列を用いて前記変換ルールを作成する、上記（９）に記載の言語モデル作成装置。

（１２）標準語のテキストから作成された標準語言語モデルを用いて新たな言語モデルを作成するための方法であって、
（ａ）方言を含む単語列を標準語の単語列に変換するための変換ルールを設定する、ステップと、
（ｂ）前記標準語言語モデル中の単語ｎグラムに前記変換ルールを適用して、前記方言を含むｎグラムを作成し、更に、作成した前記方言を含むｎグラムを前記単語ｎグラムに追加して、前記新たな言語モデルを作成する、ステップと、
を有することを特徴とする言語モデル作成方法。

（１３）前記（ａ）のステップで、前記変換ルールとして、前記方言を含む単語列と、前記方言に対応する標準語を含む単語列との組が設定され、
　前記（ｂ）のステップで、
前記方言を含むｎグラムの作成後に、前記標準語言語モデルから、前記標準語を含む単語列の出現確率を取り出し、取り出した出現確率と、予め設定された分配確率とから、同じ組の前記追加する方言を含む単語列の出現確率を算出する、上記（１２）に記載の言語モデル作成方法。

（１４）前記（ｂ）のステップで、前記方言を含む音声データ及び前記方言を含むテキストデータを有する方言データを用いて、前記分配確率の値を設定する、上記（１３）に記載の言語モデル作成方法。

（１５）（ｃ）前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列に基づいて前記変換ルールを修正する、ステップと、
（ｄ）前記（ａ）のステップで既に設定されている前記変換ルールを、前記（ｃ）のステップで修正された変換ルールを用いて更新する、ステップと、を更に有する、上記（１３）に記載の言語モデル作成方法。

（１６）（ｅ）前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列に対応する標準語の単語列を前記標準語言語モデルから抽出し、そして、抽出した前記方言を含む単語列と、抽出した前記標準語の単語列とを用いて、前記変換ルールとして利用可能な変換パターンを導出する、ステップを更に有する、上記（１３）に記載の言語モデル作成方法。

（１７）（ｆ）前記（ｂ）のステップにおける、前記分配確率の値の設定、前記方言を含むｎグラムの作成、及び前記新たな言語モデルの作成の後に、前記新たな言語モデルと前記方言データとを用いた外部の音声認識装置による音声認識の結果を取得し、取得した前記音声認識の結果と前記方言データの正解データとから、前記（ｂ）のステップで用いる前記分配確率の値を更新する、ステップと、を更に有する、上記（１４）に記載の言語モデル作成方法。

（１８）（ｇ）前記方言を含む音声データ及び前記方言を含むテキストデータを有する方言データから前記方言を含む単語列を抽出し、前記変換ルールを用いて、抽出した前記方言を含む単語列を、標準語のみを含む単語列に変換する、ステップと、
（ｈ）前記（ｇ）のステップで変換された前記標準語のみを含む単語列、及び標準語のテキストデータを用いて、前記標準語言語モデルを作成する、ステップと、を更に有する、上記（１２）に記載の言語モデル作成方法。

（１９）標準語のテキストから作成された標準語言語モデルを用いる新たな言語モデルの作成をコンピュータによって実行するためのプログラムを記録した、コンピュータ読み取り可能な記録媒体であって、
前記コンピュータによって、
（ａ）方言を含む単語列を標準語の単語列に変換するための変換ルールを設定する、ステップと、
（ｂ）前記標準語言語モデル中の単語ｎグラムに前記変換ルールを適用して、前記方言を含むｎグラムを作成し、更に、作成した前記方言を含むｎグラムを前記単語ｎグラムに追加して、前記新たな言語モデルを作成する、ステップと、
を実行させる、命令を含むプログラムを記録していることを特徴とするコンピュータ読み取り可能な記録媒体。

（２０）前記（ａ）のステップで、前記変換ルールとして、前記方言を含む単語列と、前記方言に対応する標準語を含む単語列との組が設定され、
　前記（ｂ）のステップで、
前記方言を含むｎグラムの作成後に前記標準語言語モデルから、前記標準語を含む単語列の出現確率を取り出し、取り出した出現確率と、予め設定された分配確率とから、同じ組の前記追加する方言を含む単語列の出現確率を算出する、上記（１９）に記載のプログラム。

（２１）前記（ｂ）のステップで、前記方言を含む音声データ及び前記方言を含むテキストデータを有する方言データを用いて、前記分配確率の値を設定する、上記（２０）に記載のコンピュータ読み取り可能な記録媒体。

（２２）前記プログラムが、前記コンピュータに、
（ｃ）前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列に基づいて前記変換ルールを修正する、ステップと、
（ｄ）前記（ａ）のステップで既に設定されている前記変換ルールを、前記（ｃ）のステップで修正された変換ルールを用いて更新する、ステップと、を実行させる、命令を更に含む上記（２０）に記載のコンピュータ読み取り可能な記録媒体。

（２３）前記プログラムが、前記コンピュータに、
（ｅ）前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列に対応する標準語の単語列を前記標準語言語モデルから抽出し、そして、抽出した前記方言を含む単語列と、抽出した前記標準語の単語列とを用いて、前記変換ルールとして利用可能な変換パターンを導出する、ステップを実行させる、命令を更に含む上記（２０）に記載のコンピュータ読み取り可能な記録媒体。

（２４）前記プログラムが、前記コンピュータに、
（ｆ）前記（ｂ）のステップにおける、前記分配確率の値の設定、前記方言を含むｎグラムの作成、及び前記新たな言語モデルの作成の後に、前記新たな言語モデルと前記方言データとを用いた外部の音声認識装置による音声認識の結果を取得し、取得した前記音声認識の結果と前記方言データの正解データとから、前記（ｂ）のステップで用いる前記分配確率の値を更新する、ステップと、を実行させる、命令を更に含む上記（１９）に記載のコンピュータ読み取り可能な記録媒体。

（２５）前記プログラムが、前記コンピュータに、
（ｇ）前記方言を含む音声データ及び前記方言を含むテキストデータを有する方言データから前記方言を含む単語列を抽出し、前記変換ルールを用いて、抽出した前記方言を含む単語列を、標準語のみを含む単語列に変換する、ステップと、
（ｈ）前記（ｇ）のステップで変換された前記標準語のみを含む単語列、及び標準語のテキストデータを用いて、前記標準語言語モデルを作成する、ステップと、を実行させる、命令を更に含む上記（１９）に記載のコンピュータ読み取り可能な記録媒体。

　本発明は、テキストコーパスより言語モデルを作成する言語モデル作成装置、及び言語モデルをコンピュータによって実現するためのプログラムといった用途に適用できる。

　２００　言語モデル作成装置
　２０１　変換ルール記憶部
　２０２　標準語言語モデル記憶部
　２０３　方言言語モデル作成部
　２１０　言語モデル作成装置
　２１１　変換ルール記憶部
　２１２　標準語言語モデル記憶部
　２１３　方言データ記憶部
　２１４　方言言語モデル作成部
　３００　言語モデル作成装置
　３０１　変換ルール記憶部
　３０２　方言データ記憶部
　３０３　変換ルール処理部
　３０４　標準語言語モデル作成部
　３０５　クラス内確率推定部
　３１０　言語モデル作成装置
　３１１　変換ルール記憶部
　３１２　方言データ記憶部
　３１３　変換ルール処理部
　３１４　標準語言語モデル記憶部
　３１５　クラス内確率推定部
　４００　言語モデル作成装置
　４０１　変換ルール記憶部
　４０２　方言データ記憶部
　４０３　変換データ作成部
　４０４　変換データ記憶部
　４０５　標準語データ記憶部
　４０６　標準語言語モデル作成部
　４０７　方言言語モデル作成部
　４０８　変換ルール処理部
　４１０　言語モデル作成装置
　４１１　変換ルール記憶部
　４１２　方言データ記憶部
　４１３　変換データ作成部
　４１４　変換データ記憶部
　４１５　標準語データ記憶部
　４１６　標準語言語モデル作成部
　４１７　方言言語モデル作成部
　４１８　変換ルール処理部

Claims

　標準語のテキストから作成された標準語言語モデルを用いて新たな言語モデルを作成する言語モデル作成装置であって、
　方言を含む単語列を標準語の単語列に変換するための変換ルールを記憶する変換ルール記憶部と、
　前記標準語言語モデル中の単語ｎグラムに前記変換ルールを適用して、前記方言を含むｎグラムを作成し、更に、作成した前記方言を含むｎグラムを前記単語ｎグラムに追加して、前記新たな言語モデルを作成する方言言語モデル作成部と、
を備えていることを特徴とする言語モデル作成装置。
　前記変換ルール記憶部は、前記変換ルールとして、前記方言を含む単語列と、前記方言に対応する標準語を含む単語列との組を記憶し、
　前記方言言語モデル作成部は、前記標準語言語モデルから、前記標準語を含む単語列の出現確率を取り出し、取り出した出現確率と、予め設定された分配確率とから、前記方言を含むｎグラムの出現確率を算出することを特徴とする請求項１に記載の言語モデル作成装置。
　前記方言言語モデル作成部が、前記方言を含む音声データ及び前記方言を含むテキストデータを有する方言データを用いて、前記分配確率の値を設定する、請求項２に記載の言語モデル作成装置。
　前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列に基づいて前記変換ルールを修正する、変換ルール処理部を更に備え、
　前記変換ルール記憶部が、既に記憶している前記変換ルールを、前記変換ルール処理部によって修正された変換ルールを用いて更新する、
請求項２または３に記載の言語モデル作成装置。
　前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列と、抽出した前記方言を含む単語列に対応する標準語の単語列とを用いて、前記変換ルールとして利用可能な変換パターンを導出する、変換ルール処理部を更に備えている、請求項２または３に記載の言語モデル作成装置。
　前記変換ルール処理部が、前記変換ルール記憶部に前記変換ルールが記憶されていない場合に、前記方言データから、それに含まれる単語列のうち前記標準語言語モデルに含まれていない単語列を抽出し、抽出した前記単語列を用いて前記変換ルールを作成する、請求項４または５に記載の言語モデル作成装置。
　前記方言言語モデル作成部が、前記分配確率の値の設定、前記方言を含むｎグラムの作成、及び前記新たな言語モデルの作成を行った後、
前記新たな言語モデルと前記方言データとを用いた外部の音声認識装置による音声認識の結果を取得し、取得した前記音声認識の結果と前記方言データの正解データとから、前記分配確率の値を更新する、請求項３～６のいずれかに記載の言語モデル作成装置。
　前記方言を含む音声データ及び前記方言を含むテキストデータを有する方言データから前記方言を含む単語列を抽出し、前記変換ルールを用いて、抽出した前記方言を含む単語列を、標準語のみを含む単語列に変換する、変換データ作成部と、
　前記変換データ作成部による変換によって得られた、前記標準語のみを含む単語列を、変換データとして記憶する、変換データ記憶部と、
　標準語のテキストデータを記憶している標準語データ記憶部と、
　前記変換データ記憶部によって記憶されている前記変換データ、及び前記標準語データ記憶部によって記憶されている前記標準語のテキストデータを用いて、前記標準語言語モデルを作成する、標準語言語モデル作成部と、
を更に備える請求項１～３のいずれかに記載の言語モデル作成装置。
　前記データ作成部が、前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列に基づいて前記変換ルールを修正し、
　前記変換ルール記憶部が、既に記憶している前記変換ルールを、前記変換ルール処理部によって修正された変換ルールを用いて更新する、
請求項８に記載の言語モデル作成装置。
　前記変換データ作成部が、前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列と、抽出した前記方言を含む単語列に対応する標準語の単語列とを用いて、前記変換ルールとして利用可能な変換パターンを導出する、請求項８に記載の言語モデル作成装置。
　前記変換データ生成部が、前記変換ルール記憶部に前記変換ルールが記憶されていない場合に、前記方言データから、それに含まれる単語列のうち前記標準語言語モデルに含まれていない単語列を抽出し、抽出した前記単語列を用いて前記変換ルールを作成する、請求項９または１０に記載の言語モデル作成装置。
　標準語のテキストから作成された標準語言語モデルを用いて新たな言語モデルを作成するための方法であって、
（ａ）方言を含む単語列を標準語の単語列に変換するための変換ルールを設定する、ステップと、
（ｂ）前記標準語言語モデル中の単語ｎグラムに前記変換ルールを適用して、前記方言を含むｎグラムを作成し、更に、作成した前記方言を含むｎグラムを前記単語ｎグラムに追加して、前記新たな言語モデルを作成する、ステップと、
を有することを特徴とする言語モデル作成方法。
　前記（ａ）のステップで、前記変換ルールとして、前記方言を含む単語列と、前記方言に対応する標準語を含む単語列との組が設定され、
　前記（ｂ）のステップで、
前記方言を含むｎグラムの作成後に、前記標準語言語モデルから、前記標準語を含む単語列の出現確率を取り出し、取り出した出現確率と、予め設定された分配確率とから、同じ組の前記追加する方言を含む単語列の出現確率を算出する、請求項１２に記載の言語モデル作成方法。
　前記（ｂ）のステップで、前記方言を含む音声データ及び前記方言を含むテキストデータを有する方言データを用いて、前記分配確率の値を設定する、請求項１３に記載の言語モデル作成方法。
（ｃ）前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列に基づいて前記変換ルールを修正する、ステップと、
（ｄ）前記（ａ）のステップで既に設定されている前記変換ルールを、前記（ｃ）のステップで修正された変換ルールを用いて更新する、ステップと、を更に有する、請求項１３または１４に記載の言語モデル作成方法。
（ｅ）前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列に対応する標準語の単語列を前記標準語言語モデルから抽出し、そして、抽出した前記方言を含む単語列と、抽出した前記標準語の単語列とを用いて、前記変換ルールとして利用可能な変換パターンを導出する、ステップを更に有する、請求項１３または１４に記載の言語モデル作成方法。
（ｆ）前記（ｂ）のステップにおける、前記分配確率の値の設定、前記方言を含むｎグラムの作成、及び前記新たな言語モデルの作成の後に、前記新たな言語モデルと前記方言データとを用いた外部の音声認識装置による音声認識の結果を取得し、取得した前記音声認識の結果と前記方言データの正解データとから、前記（ｂ）のステップで用いる前記分配確率の値を更新する、ステップと、を更に有する、請求項１４～１６のいずれかに記載の言語モデル作成方法。
（ｇ）前記方言を含む音声データ及び前記方言を含むテキストデータを有する方言データから前記方言を含む単語列を抽出し、前記変換ルールを用いて、抽出した前記方言を含む単語列を、標準語のみを含む単語列に変換する、ステップと、
（ｈ）前記（ｇ）のステップで変換された前記標準語のみを含む単語列、及び標準語のテキストデータを用いて、前記標準語言語モデルを作成する、ステップと、を更に有する、請求項１２～１７のいずれかに記載の言語モデル作成方法。
　標準語のテキストから作成された標準語言語モデルを用いる新たな言語モデルの作成をコンピュータによって実行するためのプログラムを記録した、コンピュータ読み取り可能な記録媒体であって、
前記コンピュータによって、
（ａ）方言を含む単語列を標準語の単語列に変換するための変換ルールを設定する、ステップと、
（ｂ）前記標準語言語モデル中の単語ｎグラムに前記変換ルールを適用して、前記方言を含むｎグラムを作成し、更に、作成した前記方言を含むｎグラムを前記単語ｎグラムに追加して、前記新たな言語モデルを作成する、ステップと、
を実行させる、命令を含むプログラムを記録していることを特徴とするコンピュータ読み取り可能な記録媒体。
　前記（ａ）のステップで、前記変換ルールとして、前記方言を含む単語列と、前記方言に対応する標準語を含む単語列との組が設定され、
　前記（ｂ）のステップで、
前記方言を含むｎグラムの作成後に前記標準語言語モデルから、前記標準語を含む単語列の出現確率を取り出し、取り出した出現確率と、予め設定された分配確率とから、同じ組の前記追加する方言を含む単語列の出現確率を算出する、請求項１９に記載のプログラム。
　前記（ｂ）のステップで、前記方言を含む音声データ及び前記方言を含むテキストデータを有する方言データを用いて、前記分配確率の値を設定する、請求項２０に記載のコンピュータ読み取り可能な記録媒体。
　前記プログラムが、前記コンピュータに、
（ｃ）前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列に基づいて前記変換ルールを修正する、ステップと、
（ｄ）前記（ａ）のステップで既に設定されている前記変換ルールを、前記（ｃ）のステップで修正された変換ルールを用いて更新する、ステップと、を実行させる、命令を更に含む請求項２０または２１に記載のコンピュータ読み取り可能な記録媒体。
　前記プログラムが、前記コンピュータに、
（ｅ）前記方言データから方言を含む単語列を抽出し、抽出した前記方言を含む単語列に対応する標準語の単語列を前記標準語言語モデルから抽出し、そして、抽出した前記方言を含む単語列と、抽出した前記標準語の単語列とを用いて、前記変換ルールとして利用可能な変換パターンを導出する、ステップを実行させる、命令を更に含む請求項２０または２１に記載のコンピュータ読み取り可能な記録媒体。
　前記プログラムが、前記コンピュータに、
（ｆ）前記（ｂ）のステップにおける、前記分配確率の値の設定、前記方言を含むｎグラムの作成、及び前記新たな言語モデルの作成の後に、前記新たな言語モデルと前記方言データとを用いた外部の音声認識装置による音声認識の結果を取得し、取得した前記音声認識の結果と前記方言データの正解データとから、前記（ｂ）のステップで用いる前記分配確率の値を更新する、ステップと、を実行させる、命令を更に含む請求項１９～２１のいずれかに記載のコンピュータ読み取り可能な記録媒体。
　前記プログラムが、前記コンピュータに、
（ｇ）前記方言を含む音声データ及び前記方言を含むテキストデータを有する方言データから前記方言を含む単語列を抽出し、前記変換ルールを用いて、抽出した前記方言を含む単語列を、標準語のみを含む単語列に変換する、ステップと、
（ｈ）前記（ｇ）のステップで変換された前記標準語のみを含む単語列、及び標準語のテキストデータを用いて、前記標準語言語モデルを作成する、ステップと、を実行させる、命令を更に含む請求項１９～２４のいずれかに記載のコンピュータ読み取り可能な記録媒体。