JP5528213B2

JP5528213B2 - 単語のセットを対応するパーティクルのセットに変換する方法

Info

Publication number: JP5528213B2
Application number: JP2010121169A
Authority: JP
Inventors: トニー・イザット; エバンドロ・ビー・グーベア
Original assignee: Mitsubishi Electric Research Laboratories Inc
Current assignee: Mitsubishi Electric Research Laboratories Inc
Priority date: 2009-06-30
Filing date: 2010-05-27
Publication date: 2014-06-25
Anticipated expiration: 2030-05-27
Also published as: CN101937450B; US20090265162A1; US8055693B2; CN101937450A; EP2270685A1; JP2011014130A

Description

本発明は、包括的には情報検索に関し、特に、パーティクルによって表されるアイテムを検索することに関する。

情報検索（ＩＲ：ＩｎｆｏｒｍａｔｉｏｎＲｅｔｒｉｅｖａｌ）システムは、通常、地理的関心地点（ＰＯＩ：ＰｏｉｎｔｓＯｆＩｎｔｅｒｅｓｔ）又は音楽アルバムの題名のようなアイテムの大規模なリストを含む。リストは、インデックスによってアクセスされる。インデックスに対する入力は、ユーザによって供給されるクエリである。クエリに応答して、ＩＲシステムは、このクエリに最も一致した結果リストを検索する。この結果リストは、様々な要因に従って順序付けすることができる。リスト、インデックス、クエリ、及び結果リストは、通常、単語によって表される。入力リスト、クエリ、及び結果リストは、テキストによるものであってもよいし、又は発話によるものであってもよい。

発話によるクエリは、ユーザがキーボードを使用することができない環境、たとえば運転中、又はユーザインタフェースがマイクロフォンを備える環境において使用される。発話による文書検索は、検索されるアイテムが、ラジオ又はテレビ番組のような音声アイテムであるときに使用される。これらの環境では、自動音声認識装置（ＡＳＲ：ＡｕｔｏｍａｔｉｃＳｐｅｅｃｈＲｅｃｏｇｎｉｚｅｒ）を使用して発話を単語に変換する。

ＡＳＲは、２つの基本データ構造、すなわち単語の発音辞書及び単語の言語モデルを使用する。一般に、ＩＲシステムは、単語を音素として音声的に表す。たとえば、ＲＥＳＴＡＵＲＡＮＴは、「ＲＥＨＳＴＲＡＡＮＴ」として表される。音素は、特定の言語における音の基本単位を指す。音素は、強勢符号、音節境界、及び単語がどのように発音されるかを示す他の表記を含むことができる。

言語モデルは、語順の確率を記述し、ＡＳＲによって、正しい単語推測のための探索を制約するのに使用される。言語モデルは、ｎグラム（ｎ−ｇｒａｍ：ｎ文字単位）とすることができる。ｎグラムがバイグラム（ｂｉｇｒａｍ）である場合、バイグラムによってＰ（「ＢＥＬＬ」｜「ＴＡＣＯ」）のような確率がリストされる。これは、単語「ＴＡＣＯ」の後に単語「ＢＥＬＬ」が続く確率である。言語モデルは、有限状態文法とすることもでき、ここで、文法の状態は、各状態において現れる可能性がある単語を表し、状態間の遷移は、１つの状態から別の状態に向かう確率を表す。

単語ベースのＩＲには、２つの主な問題が存在する。

第１に、ＩＲに重要な単語は、通常、頻度の低い識別語である。たとえば、アイテムＰＯＩ「ＭＪ’ＳＲＥＳＴＡＵＲＡＮＴ」において、重要な識別語は、「ＭＪ’Ｓ」である。多くの場合、これらの識別語は、他の言語からの固有名詞である。たとえば、アイテム「ＡＡＳＨＩＡＮＩＲＥＳＴＡＵＲＡＮＴ」内の単語「ＡＡＳＨＩＡＮＩ」は、ヒンディー語からのものである。これらの識別語の別の現れ方は、「ＧＲＥＥＮＨＯＵＳＥ」のように、組み合わせを通じたものである。単語の語幹を変更することによって、語彙のサイズも増大する。通例、頻度が低いが重要である識別語の数は、非常に多い。

加えて、重要な識別語は、多くの場合、言語モデルによって誤って発音されるか、又は不十分に表現される。ｎグラムに関する正確な統計も通例入手可能でない。したがって、重要で頻度の低い単語を認識する確率が低く、単語配列が多くの場合に不正確である。これによって、ＩＲシステムによる再現性能が不十分なものとなる。

第２に、単語ベースのＩＲシステムに対する計算負荷は、リスト及びインデックスのサイズと共に増大し、システムの性能は、リアルタイム検索を許容できないものになる。

本発明の実施の形態は、パーティクルによって表される、情報検索（ＩＲ）データベース内のアイテムを検索する方法を提供する。一意のパーティクルの数は、一意の単語の数よりもはるかに小さく、たとえば１０分の１である。

これによって、自動音声認識（ＡＳＲ）システムの性能が改善し、認識時間が５０％減少することになる。驚くべきことに、単語数と比較してパーティクル数が劇的に減少し、スループットも同様に増大するにもかかわらず、再現率によって測定されるＩＲシステムの性能は、２％改善する。

本発明の実施の形態１による情報検索システムのブロック図である。単語の観点から書かれた関心アイテムのインデックスの表である。インデックスからの単語の発音辞書の表である。本発明の実施の形態１による単語からパーティクルへのマッピングの一例の表である。本発明の実施の形態１による、パーティクルの観点から書かれた関心アイテムのインデックスの一例の表である。パーティクルの発音辞書の表である。パーティクル生成プロセスの動作工程の図表である。単語をパーティクルにマッピングする方法の擬似コードである。単語をパーティクルにマッピングする方法の擬似コードである。パーティクル生成プロセスの動作工程の図表である。パーティクル生成プロセスの動作工程の図表である。入力インデックスから出力パーティクルインデックスを構築する方法のフロー図である。

実施の形態１．
図１に示すように、本発明の実施の形態は、情報検索（ＩＲ）システム１００において、データベースからアイテムを検索する方法を提供する。本方法のステップは、当該技術分野において既知のプロセッサにおいて動作する。プロセッサは、メモリ及びＩ／Ｏインタフェースを備える。

ＩＲシステムは、単語によって表されるアイテムリスト１０１を備える。単語ベースのリスト１０１から、パーティクルによって表されるアイテムリスト１０２を生成する（１１０）。単語ベースのリスト内のアイテム１０１とパーティクルベースのリスト１０２内のアイテムとの間の対応は、１対１、又は単語の代替的な発音が可能であるときには、１対多とすることができる。

パーティクルは、音声認識の分野において既知である。本明細書において定義されるように、「パーティクル」は、連結された音素配列を表す。一連のパーティクルは、単語の音素配列を表す。Whittaker他著「Particle-based language modelling」（International Conference on Speech and Language Processing (ICSLP), 2000）を参照されたい。

これまで、パーティクルは、自動音声認識（ＡＳＲ）システムにおいて、単語を認識するためにしか使用されてこなかった。対照的に、本発明は、パーティクルを使用して情報検索（ＩＲ）を実施する。

リスト１０２にインデクサ１２０を適用してパーティクルベースのインデックス１２１を作成する。アイテムを検索するために、ユーザ１０４からパーティクルベースのクエリ１０３が取得される。クエリ１０３は、ＡＳＲを使用してテキスト内の単語又は発話から導出することができる。

クエリ１０３を使用して、パーティクルベースのリスト１０２から構築されたインデックス１２１を調べる。クエリ１０３に応答する出力１３０は、パーティクルベースのリスト１０２内の最も一致するアイテムに対応する、単語ベースのリスト１０１からのアイテムの結果リスト１０５である。

パーティクルベースのリスト１０２を生成するために、前処理ステップにおいて、リスト１０１内の一意の単語のセット１４９を保持する。単語ベースのセット１４９を一意のパーティクルのセット１５１に変換する（１５０）。パーティクルベースのセット１５１を取得した後、リスト１０１内のアイテムに関する単語を、対応するパーティクルベースのアイテムに変換して、パーティクルベースのリスト１０２を生成する（１１０）ことができる。

図２Ａは、本発明の単語ベースのアイテムリスト１０１の詳細を示している。アイテムは、地理的関心地点であり、各ＩＤ２０１は、アイテム２０２を一意に識別する。

図２Ｂは、単語２１１及び対応する音素２１２を示している。幾つかの単語、たとえば「ＨＯＵＳＥＳ」は、代替的な発音を有し得る。図３は、単語３０１及び対応するパーティクル３０２を示している。

単語ベースのリスト内のアイテムが複数の発音を有する場合、全ての単語について、パーティクルへの全ての可能性のある分割のデカルト積が形成され、パーティクルベースのリスト内に列挙される。たとえば、ＡＡＳＨＩＡＮＩが「ＡＡ＿ＳＨ＿ＩＹＡＡ＿Ｎ＿ＩＹ」又は「ＡＡ＿ＳＨＹ＿ＡＥ＿Ｎ＿ＩＨ」としてパーティクルに分割され、ＲＥＳＴＡＵＲＡＮＴが「Ｒ＿Ｅ＿Ｓ＿Ｔ＿Ｒ＿ＡＡ＿Ｎ＿Ｔ」又は「Ｒ＿Ｅ＿Ｓ＿Ｔ＿ＥＲ＿Ｒ＿ＡＡ＿Ｎ＿Ｔ」としてパーティクルに分割される場合、全ての可能性のある分割：
ＡＡ＿ＳＨ＿ＩＹＡＡ＿Ｎ＿ＩＹＲ＿Ｅ＿Ｓ＿Ｔ＿Ｒ＿ＡＡ＿Ｎ＿Ｔ、
ＡＡ＿ＳＨ＿ＩＹＡＡ＿Ｎ＿ＩＹＲ＿Ｅ＿Ｓ＿Ｔ＿ＥＲ＿Ｒ＿ＡＡ＿Ｎ＿Ｔ、
ＡＡ＿ＳＨＹ＿ＡＥ＿Ｎ＿ＩＨＲ＿Ｅ＿Ｓ＿Ｔ＿Ｒ＿ＡＡ＿Ｎ＿Ｔ、及び
ＡＡ＿ＳＨＹ＿ＡＥ＿Ｎ＿ＩＨＲ＿Ｅ＿Ｓ＿Ｔ＿ＥＲ＿Ｒ＿ＡＡ＿Ｎ＿Ｔ
が、パーティクルベースのインデックス内に列挙される。

図４は、パーティクルベースのリスト１０２の詳細を示し、このリストは、アイテム４０２毎に一意のＩＤ４０１を含む。

図５は、ＡＳＲによって使用することができる発音辞書を示し、この発音辞書は、パーティクル５０１及び対応する音素５０２を含む。

本発明の言語モデルは、パーティクル、たとえばパーティクルｎグラムに対する統計を含むｎグラム言語モデルを含む。

方法
単語ベースのリスト１０１からパーティクルベースのリスト１０２を生成する方法は、以下の着想に従う。
トップダウン方法：本方法は、セット１４９内の一意の単語から開始し、単語をパーティクルに分割する；
頻度に基づく区分：本方法は、リスト１０１内の単語の頻度をカウントする。より頻繁に出現する単語は、無処置のままにされ、頻度の低い単語は、より頻繁に出現するパーティクルに分割される；及び
圧縮：パーティクルのセット１５１は、保持され、本方法は、より小さなセット１５１を生成して、異なるパーティクルの総数を異なる単語の総数よりもはるかに小さくするようにバイアスされる。

約１０倍のサイズ低減を達成し、これによって、ＩＲ検索スループットを約５０％改善し、同時に再現性能を２％増大させる。

図６は、単語１４９をパーティクル１５１に変換する（１５０）方法によって使用される表６００を示している。最初に、リスト１０１内の各一意の単語が１つのパーティクルであると見なされる。たとえば、単語「ＡＷＲＧＬＡＥＳ」は、パーティクル「ＡＷ＿Ｒ＿Ｇ＿Ｌ＿ＡＥ＿Ｓ」とみなされる。これらは、リスト１０１内の単語から直接取得されるため、これらを「初期パーティクル」として表す。

表は、初期パーティクル６０１毎に行６００で初期化される。この例では、表は、３つの初期パーティクル：ＡＷ＿Ｒ＿Ｇ＿Ｌ＿ＡＥ＿Ｓ、ＡＷ＿Ｒ、及びＧ＿Ｌ＿ＡＥ＿Ｓを含む。本方法は、元の各パーティクルをより小さなパーティクルに分割しようとする。

表は、元のパーティクル及び表に追加されたパーティクルを追跡するためのデータ構造を含む。加えて、表は、元のパーティクルがより小さなパーティクルにどのように分割されたかを示すデータ構造を含む。

元の単語？列６０２は、単語がリスト１０１内にあったか否かを示す。パーティクル？列６０３は、単語がパーティクルに分割されたか否かを示す。分割位置列６０４は、分割が行われた場所を示す。頻度列６０５は、パーティクルの発生頻度ｃを示す。長さ列６０６は、音素の観点からのパーティクルの長さｌを示す。

最初に、リスト１０１内の対応する単語の頻度から頻度ｃが取得される。元のパーティクルが分割されている場合、元のパーティクルの頻度カウントは、以下の方式で新たなパーティクルに伝達される。新たなパーティクルが表内に存在しない場合、このパーティクルの頻度は、親パーティクルの頻度に設定される。新たなパーティクルが既に表内に存在する場合、このパーティクルの頻度は、親の頻度によって増分される。

パーティクル１５１の現在のセットが、最小記述長（ＭＤＬ：ＭｉｎｉｍａｌＤｅｓｃｒｉｐｔｉｏｎＬｅｎｇｔｈ）コスト６０９を使用して評価される。ＭＤＬコスト６０９は、尤度コスト６０７と、目録作成（ｉｎｖｅｎｔｏｒｙ）コスト６０８との和である。目録作成コスト６０８は、パーティクルセットのサイズを表す。本方法の目的は、総ＭＤＬコストを低減する、単語のパーティクルへの分割を選択することである。本方法は、たとえばセット１５１が所望の数のパーティクルを含むようになった後、終了する。

尤度コスト６０７は、セット内のパーティクルの対数確率ｐの和である。

であり、ここで、

及びｃは、それぞれパーティクル頻度である。

尤度コスト６０７は、パーティクル出現の頻度が増大する場合、減少する。結果として、本方法は、重要で出現頻度が低い単語を、より出現頻度が高いパーティクルに分割することが好ましい。

目録作成コスト６０８は、セット１５１内の、音素の観点からの全てのパーティクルの長さの和であり、それらの音素は、各音素の対数確率によって重み付けされている。この実施の形態では、全ての音素の可能性が等しいと仮定する。

であり、ここでｐ_{ｐｈｏｎｅｍｅ}は、音素の対数確率である。

目録作成コスト６０８は、一意のパーティクルの数及びそれらの長さが減少するときに減少する。結果として、本発明のコストは、頻度の低い単語をより小さくより少ないパーティクルに分割することが好ましい。目録作成コスト６０８は、セット１５１内の一意のパーティクルの数がセット１４９内の一意の単語の数よりも、はるかに少ない量になるように、単語をパーティクルに分割するタスクを達成するための圧縮コストである。

本発明のサイズ低減は、約１０分の１であり、これによってスループットが５０％増大し、再現率の精度が２％増大する。

図７は、本方法の一般的な動作を示している。プロシージャに対する入力は、初期化テーブル及び生成するパーティクルの所望の数である。プロシージャは、リスト１０１内の全ての一意の単語にわたって反復する。全ての単語にわたる各反復の後、プロシージャは、これまでに作成した一意のパーティクルの数を求め、一意のパーティクルの所望の数が達成されている場合、終了する。

図８は、図７のｐａｒｔｉｃｌｉｚｅ（）プロシージャを示している。ｐａｒｔｉｃｌｉｚｅ（）プロシージャは、単語をパーティクルに分割する。各単語は、左から右へ走査され、接頭パーティクル（左接頭語）及び接尾パーティクル（右接頭語）に分割される。分割なしの選択を含む、接頭パーティクル及び接尾パーティクルへの可能性のある分割毎に、ＭＤＬコストが評価され格納される。ＭＤＬコストを最小にする分割が選択され、セット１５１に追加される。プロシージャは、接頭パーティクル及び接尾パーティクルを再帰呼び出しする（ｒｅｃｕｒｓｅ）。

図９は、単語ＡＷ＿Ｒ＿Ｇ＿Ｌ＿ＡＥ＿Ｓを接頭パーティクルＡＷ＿Ｒ及び接尾パーティクルＧ＿Ｌ＿ＡＥ＿Ｓに分割することを考えるときに、本方法がどのように動作するかの一例を示している。ＡＷ＿Ｒ＿Ｇ＿Ｌ＿ＡＥ＿Ｓは、３番目の音素において分割されるため、パーティクル？フラグ９０１がＮにセットされ、分割位置９０２が３にセットされる。ＡＷ＿Ｒ及びＧ＿Ｌ＿ＡＥ＿Ｓの双方が既に存在するため、それらの頻度９０３カウントは、１（単語ＡＷ＿Ｒ＿Ｇ＿Ｌ＿ＡＥ＿Ｓの頻度）だけ増分される。尤度コスト９０５、目録作成コスト９０６、及びＭＤＬコスト９０７が評価される。図６のＭＤＬコスト６０９に示される無処置のコスト６９．１１と比較して、ＡＷ＿Ｒ＿Ｇ＿Ｌ＿ＡＥ＿Ｓの、ＡＷ＿Ｒ及びＧ＿Ｌ＿ＡＥ＿Ｓへの分割によって、ＭＤＬコストが３３．９３まで低減する。

図１０は、セット１５１への新たなパーティクルの追加を示している。この例は、セット１４９が単語ＡＷ＿Ｒ＿Ｇ＿Ｌ＿ＡＥ＿Ｓ及びＧ＿Ｌ＿ＡＥ＿Ｓしか含まないと仮定する。したがって、ＡＷ＿Ｒは、初期段階においてテーブル内に存在しない。ＡＷ＿Ｒ＿Ｇ＿Ｌ＿ＡＥ＿Ｓを接頭パーティクルＡＷ＿Ｒ及びＧ＿Ｌ＿ＡＥ＿Ｓ接尾パーティクルに分割することを考えるときに、ＡＷ＿Ｒのためのエントリが生成される。パーティクルが元の単語ではないため、元の単語？フラグ１００１は、Ｎにセットされる。パーティクルは、無処置であるため、パーティクル？フラグ１００２は、単語が分割されていないことを示すＹにセットされ、分割位置１００３は、０にセットされ、頻度ｃは、１にセットされる。これは、頻度１００４が元の単語ＡＷ＿Ｒ＿Ｇ＿Ｌ＿ＡＥ＿Ｓから引き継がれるためである。最後に、長さ１００５が２にセットされる。前と同じように、尤度コスト、目録作成コスト、及びＭＤＬコストが全てこの分割に関して求められる。ＡＷ＿Ｒ＿Ｇ＿Ｌ＿ＡＥ＿Ｓの、ＡＷ＿Ｒ及びＧ＿Ｌ＿ＡＥ＿Ｓへの分割によって、ＭＤＬコスト１００８が３４．５７まで低減する。

拡張
本方法を以下のように拡張することができる。

分割評価：尤度コストは、単語のパーティクルへの可能性のある分割を効率的に評価する。単語は、より高い確率を有するパーティクルに変換される。通例、多数の異なる評価が可能である。たとえば、特定の分割を、以下の観点から評価することができる。
言語モデルパープレキシティ−言語及び発話の処理において、パープレキシティは、文法によって課される制約レベル又は文法を所与とした不確実性レベル、たとえば言語モデル内の所与の単語に続くことができる単語の平均数の基準である。
逆文献頻度（ＩＤＦ：ＩｎｖｅｒｓｅＤｏｃｕｍｅｎｔＦｒｅｑｕｅｎｃｙ）コスト−これは、パーティクルの個々のＩＤＦの和である。

目録作成評価：目録作成コストは、リスト１０２内のパーティクルを評価し、より少ないパーティクル又はより少ない音素を有するリストの構築をバイアスする。多数の代替的なインデックス評価プロシージャ、たとえば、パーティクルの頻度、長さ、類似度、又は単語インデックス内の逆文献頻度（ＩＤＦ）の観点からの、パーティクルの所望の分布を使用することができる。

ＭＤＬ評価：ＭＤＬコストは、尤度コストと目録作成コストとの和を評価する。尤度コスト及び目録作成コストの多数の代替的な組み合わせを使用することができる。代替的な組み合わせは、たとえば、尤度コストと目録作成コストとの重み付けされた和であり、ここで、重みによって一方のコストを他方のコストよりも強調する。

貪欲探索プロシージャ又は縦型探索（ＤＦＳ：Ｄｅｐｔｈ−ｆｉｒｓｔｓａｅｒｃｈ）を使用して、ＭＤＬコストを最小にする単語の分割を評価する。代替形態は、貪欲横型探索（ＢＦＳ：Ｂｒｅａｄｔｈ−ｆｉｒｓｔｓａｅｒｃｈ）と、ビタビ動的プログラミング探索とを含む。

図１１は、当該技術分野において既知であるプロセッサ１１００において実施される本方法のステップを示している。プロセッサは、様々なデータ構造を記憶するメモリと、入力インタフェース及び出力インタフェースとを備える。

入力は、セット１４９である。リスト１０１内の一意の単語毎に、コストを求めるために、元の単語パーティクル、頻度、及び（音素１１０２の観点からの）長さが供給される。

一意の単語毎に、パーティクル（接頭パーティクル１１１１及び接尾パーティクル１１１２）への全ての可能性のある分割１１１０が求められる。可能性のある分割１１１０毎に、目録作成コスト１１２０と尤度コスト１１３０との和１１４０が求められる。最小の和を有する、可能性のある分割１１１０のパーティクルを、セット１５１に加える（１１５０）。元の単語パーティクルの分割が実施されない場合、この元の単語パーティクルは、依然として無処置パーティクルと見なされる。

全ての単語が処理された後、終了、たとえば、セット１５１が所望の数のパーティクルを有することを検査する（１１６０）ことができ、真である場合、本方法は終了する（１１６１）。そうでなく、偽である場合、テーブル内の全ての元の単語を、新たなランダムな順序１１０３で、終了まで反復して再処理することによって続行する。

用途例は、情報検索システムに関して説明されているが、本発明の実施の形態は、データベースが単語を含み、且つ単語をパーティクルに変換することが意味を成す任意の用途に使用することができる。たとえば、自動音声認識（ＡＳＲ）システムは、良好な用途候補である。

特に、ＡＳＲシステムは、このＡＳＲシステムが発音辞書内に含まれるアイテムによって認識することができるものに制約される。発話される単語が辞書内にない場合、ＡＳＲシステムは、単語を認識することができない。ここでは、この語彙外（ＯＯＶ:Ｏｕｔ−Ｏｆ−Ｖｏｃａｂｕｌａｒｙ）単語を発音辞書内のパーティクルによって認識することができる。これは、ＡＳＲシステムが発話を発音辞書内のアイテムとマッチングさせる方法に関して、パーティクルがより高い柔軟性を提供するためである。

本発明は、入力がテキスト又は発話のいずれかであり、且つ検索されるアイテムがテキスト又は発話である、任意の単語ベースの探索エンジンと共に使用することもできる。

Claims

単語のセットを対応するパーティクルのセットに変換する方法であって、メモリと、入力インタフェース及び出力インタフェースとを備えるプロセッサによって実行され、前記単語及び前記パーティクルは、各前記セット内で一意であり、前記方法は、
前記単語毎に、前記単語の、パーティクルへの全ての可能性のある分割を求めるステップと、
前記単語毎に、前記可能性のある分割毎のコストを求めるステップと、
最小コストに関連付けられる前記可能性のある分割の前記パーティクルを前記パーティクルのセットに追加するステップと、を含み、
前記単語のセットは、単語ベースのアイテムリストから取得され、
前記単語のセット及び前記パーティクルのセットを使用して、前記単語ベースのアイテムリストから対応するパーティクルベースのアイテムリストを生成するステップをさらに含み、
前記パーティクルのセットを使用して、前記パーティクルベースのアイテムリストをインデックス付けすることであって、前記パーティクルベースのアイテムリストに対するパーティクルベースのインデックスを生成する、インデックス付けするステップをさらに含み、
ユーザからクエリを取得するステップと、
前記パーティクルベースのインデックスを使用して前記パーティクルベースのアイテムリストにアクセスすることであって、前記クエリに最も一致するパーティクルベースのアイテムを検索する、アクセスするステップと、
対応する単語ベースのアイテムを結果リストとして前記ユーザに出力するステップと、
をさらに含み、
前記コストは、尤度コスト

であり、ここで

及びｃは、前記パーティクルの頻度である、尤度コストと、目録作成コスト

であり、ここで、ｐ _{ｐｈｏｎｅｍｅ} は、前記パーティクルによって使用される音素の対数確率である、目録作成コストと、に基づく
単語のセットを対応するパーティクルのセットに変換する方法。
前記クエリは、テキストであり、前記テキストは、前記パーティクルのセットを使用してパーティクルベースのクエリに変換される請求項１に記載の単語のセットを対応するパーティクルのセットに変換する方法。
前記クエリは、発話であり、前記発話は、前記パーティクルのセットを使用してパーティクルベースのクエリに変換される請求項１に記載の単語のセットを対応するパーティクルのセットに変換する方法。
前記可能性のある分割のパーティクルは、前記単語の代替的な発音のためのものである請求項１に記載の単語のセットを対応するパーティクルのセットに変換する方法。
各前記パーティクルは、連結された音素配列を表し、一連のパーティクルは、対応する単語の音素配列を表す請求項１に記載の単語のセットを対応するパーティクルのセットに変換する方法。
頻度の高い単語は、無処置のままにされ、頻度の低い単語は、パーティクルに分割される請求項１に記載の単語のセットを対応するパーティクルのセットに変換する方法。
前記可能性のある分割は、前記単語の左から右への線形走査を使用して、前記単語を左接頭語及び右接頭語に分割する請求項１に記載の単語のセットを対応するパーティクルのセットに変換する方法。
前記可能性のある分割は、発音辞書内の追加情報によって導かれる前記単語の音節境界において作成される請求項１に記載の単語のセットを対応するパーティクルのセットに変換する方法。
前記単語セットは、ランダムな順序で配置され、前記セットは、終了条件に達するまで、異なるランダムな順序に関して反復して再処理する請求項１に記載の単語のセットを対応するパーティクルのセットに変換する方法。
前記コストは、ｎグラムパープレキシティに応じて決まる請求項１に記載の単語のセットを対応するパーティクルのセットに変換する方法。
前記コストは、有限状態文法に応じて決まる請求項１に記載の単語のセットを対応するパーティクルのセットに変換する方法。
前記単語ベースのアイテムからなるリストは、テキストから構築される請求項２に記載の単語のセットを対応するパーティクルのセットに変換する方法。
前記単語ベースのアイテムから成るリストは、発話から構築される請求項２に記載の単語のセットを対応するパーティクルのセットに変換する方法。
前記コストは、前記パーティクルセットのサイズと共に増大し、前記セット内の前記パーティクルの発現頻度の関数として減少する請求項１に記載の単語のセットを対応するパーティクルのセットに変換する方法。