JP5436685B2 - パーティクルのセットを変換するための方法、およびパーティクルの出力セットを生成する方法 - Google Patents

パーティクルのセットを変換するための方法、およびパーティクルの出力セットを生成する方法 Download PDF

Info

Publication number
JP5436685B2
JP5436685B2 JP2012533154A JP2012533154A JP5436685B2 JP 5436685 B2 JP5436685 B2 JP 5436685B2 JP 2012533154 A JP2012533154 A JP 2012533154A JP 2012533154 A JP2012533154 A JP 2012533154A JP 5436685 B2 JP5436685 B2 JP 5436685B2
Authority
JP
Japan
Prior art keywords
particles
particle
edit distance
words
items
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012533154A
Other languages
English (en)
Other versions
JP2013517540A (ja
Inventor
イザット、トニー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Research Laboratories Inc
Original Assignee
Mitsubishi Electric Research Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Research Laboratories Inc filed Critical Mitsubishi Electric Research Laboratories Inc
Publication of JP2013517540A publication Critical patent/JP2013517540A/ja
Application granted granted Critical
Publication of JP5436685B2 publication Critical patent/JP5436685B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

本発明は、包括的には情報検索に関し、特に、パーティクル間の編集距離の最大化を用いてパーティクルのセットを変換することに関する。
情報検索(IR)システムは、通常、地理的関心地点(points of interest:POI)、または音楽アルバムの題名のようなアイテムの大規模なリストを含む。リストは、インデックスによってアクセスされる。インデックスに対する入力は、ユーザーによって供給されるクエリである。クエリに応答して、IRシステムは、該クエリに最も一致した結果リストを生成する。この結果リストは、様々な要因に従って順序付けすることができる。結果リスト、インデックス、クエリ、および結果リストは、通常、単語によって表される。入力リスト、クエリ、および結果リストは、テキストによるものであるか、または発話によるものである。
発話によるクエリは、ユーザーがキーボードを使用することができない環境、例えば、運転中、またはユーザーインタフェースがマイクロフォンを含む環境において用いられる。これらの環境では、自動音声認識装置(ASR)を用いて発話を単語に変換する。
ASRは、2つの基本データ構造、単語の発音辞書および単語の言語モデルを用いる。一般に、IRシステムは、単語を音素として音声的に表す。例えば、RESTAURANTは「R EH S T R AA N T」として表される。音素は、特定の言語における音の基本単位を指す。音素は、強勢符号、音節境界、および単語がどのように発音されるかを示す他の表記を含むことができる。
言語モデルは、語順の確率を記述し、ASRによって、正しい単語仮説のための探索を制約するのに用いられる。言語モデルは、nグラム(n-gram)とすることができる。nグラムが二重字(bigram)である場合、二重字によってP(「BELL」|「TACO」)のような確率がリストされる。これは、単語「TACO」の後に単語「BELL」が続く確率である。言語モデルは、有限状態文法とすることもでき、ここで、文法の状態は、各状態において現れる可能性がある単語を表し、状態間の遷移は、1つの状態から別の状態に向かう確率を表す。
単語ベースのIRには、2つの主な問題が存在する。
第1に、IRに重要な単語は、通常、頻度の低い識別語である。例えば、アイテムPOI「MJ’S RESTAURANT」において、重要な識別語は「MJ’S」である。多くの場合、これらの識別語は、他の言語からの固有名詞である。例えば、アイテム「AASHIANI RESTAURANT」内の単語「AASHIANI」は、ヒンディー語からのものである。これらの識別語の別の現れ方は、「GREENHOUSE」のように、組み合わせを通じたものである。単語の語根を変更することによって、語彙のサイズも増大する。通例、頻度が低いが重要である識別語の数は、非常に多い。
加えて、重要な識別語は、多くの場合に、言語モデルによって誤って発音されるか、または不十分に表現される。nグラムに関する正確な統計も通例入手可能でない。したがって、重要で頻度の低い単語を認識する確率が低く、単語配列が多くの場合に不正確である。これによって、IRシステムによる再現性能が不十分なものとなる。
第2に、単語ベースのIRシステムに対する計算負荷は、リストおよびインデックスのサイズとともに増大し、システムの性能は、リアルタイム検索を許容できないものになる。
本発明の実施の形態は、パーティクルによって表される、情報検索(IR)データベース内のアイテムを検索する方法を提供する。一意のパーティクルの数は、一意の単語の数よりもはるかに小さく、例えば、少なくとも一桁小さい。これによって、自動音声認識(ASR)システムの性能が改善し、認識時間が50%程度減少することになる。驚くべきことに、単語数と比較して、パーティクル数が劇的に減少し、スループットも同様に増大するにもかかわらず、再現率によって測定されるIRシステムの性能は、2%程度改善する。
本発明の実施の形態は、情報検索(IR)システムの動作のために、単語のセットを、可能な限り互いに異なるパーティクルを用いて表すことが有利であるという認識に基づいている。例えば、可能な限り互いに異なるパーティクルを有することによって、ASR中の正確な認識が可能になる。さらに、実施の形態は、パーティクル間の差を、編集距離を用いて測定することができるという更なる認識に基づいている。
本発明の1つの実施の形態は、パーティクルの出力セットにおいて、アイテムのセットの少なくとも一部分によって形成されるパーティクルのセットを変換するための方法を開示する。アイテムのセットは、情報検索システムにおいて用いるのに適した単語のセットを表す。本方法は、パーティクルのセット内の各パーティクルについて、パーティクルの一部分の組合せを生成し、パーティクルのセット内のパーティクルを、該パーティクルのセットの総最小編集距離(MED)を最大にする組合せの部分と置き換える。例えば、本方法は、パーティクルのセット内の各パーティクルのMEDを求め、各パーティクルのMEDの和としてパーティクルのセットの総MEDを求め、次に、該パーティクルのセットの総MEDを最大にする組合せを求める。
別の実施の形態は、単語のセットを表すパーティクルの出力セットを生成する方法であって、単語のセットからパーティクルのセットを求めるステップと、パーティクルのセット内のパーティクルの一部分の組合せを生成するステップと、パーティクルのセット内のパーティクルを、該パーティクルのセットの総最小編集距離(MED)を最大にする組合せの一部分と置き換えるステップと、パーティクルのセット内の各パーティクルについて生成することと置き換えることとを反復して、パーティクルの出力セットを生成する、反復するステップと、を含み、本方法のステップは、プロセッサによって実行される、単語のセットを表すパーティクルの出力セットを生成する方法を開示する。
さらに別の実施の形態は、単語のセットを表すパーティクルの出力セットにおいてパーティクルのセットを変換するためのシステムであって、パーティクルのセット内の各パーティクルについて、該パーティクルのセットの総最小編集距離(MED)を最大にするパーティクルの一部分の組合せを求めるように構成された変換モジュールと、パーティクルのセット内のパーティクルを組合せの一部分と置き換えるように構成されたプロセッサと、を備える、単語のセットを表すパーティクルの出力セットにおいてパーティクルのセットを変換するためのシステムを開示する。
この実施の形態の1つの変形形態は、パーティクルのセット内の各パーティクルのMEDを求める手段と、パーティクルのセットの総MEDを求める手段と、パーティクルのセットの総MEDを最大にする組合せを求める手段と、を備える。
本発明の実施の形態による情報検索システムのブロック図である。 単語の観点から書かれた関心アイテムのインデックスの表である。 インデックスからの単語の発音辞書の表である。 本発明の実施の形態による単語からパーティクルへのマッピングの一例の表である。 本発明の実施の形態による、パーティクルの観点から書かれた関心アイテムのインデックスの一例の表である。 パーティクルの発音辞書の表である。 本発明の1つの実施の形態による、パーティクルの出力セットにおいてパーティクルのセットを変換するための方法のブロック図である。 本発明の1つの実施の形態による、パーティクルを、該パーティクルの接頭部および接尾部と置き換えるための方法のブロック図である。 パーティクルの変換を示す表である。 パーティクルの変換を示す表である。 パーティクルの変換を示す表である。 パーティクルの変換を示す表である。
図1に示すように、本発明の実施の形態は、情報検索(IR)システム100においてデータベースからアイテムを検索する方法を提供する。本方法のステップは、当該技術分野において既知のプロセッサにおいて動作する。プロセッサは、メモリおよびI/Oインタフェースを備える。
IRシステムは、単語によって表されるアイテムリスト101を備える。単語ベースのリスト101から、パーティクルによって表されるアイテムリスト102を生成する(110)。単語ベースのリスト内のアイテムとパーティクルベースのリスト内のアイテムとの間の対応は、1対1、または単語の代替的な発音が可能であるときには1対多とすることができる。
パーティクルは、音声認識の分野において既知である。本明細書において定義されるように、「パーティクル」は、連結された音素配列を表す。一連のパーティクルは、単語の音素配列を表す。Whittaker他著「Particle-based language modelling」(International Conference on Speech and Language Processing (ICSLP), 2000)を参照されたい。
これまで、パーティクルは、自動音声認識(ASR)システムにおいて単語を認識するためにしか用いられてこなかった。対照的に、本発明は、パーティクルを用いて情報検索(IR)を実行する。
リスト102にインデクサー120を適用してパーティクルベースのインデックス121を作成する。アイテムを検索するために、ユーザー104からパーティクルベースのクエリ103が取得される。クエリは、ASRを用いてテキスト内の単語または発話から導出することができる。
クエリ103を用いて、パーティクルベースのリスト102から構築されたインデックス121を調べる。クエリ103に応答する出力は、パーティクルベースのリスト102内の最も一致するアイテムに対応する、単語ベースのリスト101からのアイテムの結果リスト105である。
パーティクルベースのリスト102を生成するために、前処理ステップにおいて、リスト101内の一意の単語のセット149を保持する。単語ベースのセット149を一意のパーティクルのセット151に変換する。パーティクルベースのセット151を取得した後、リスト101内のアイテムに関する単語を対応するパーティクルベースのアイテムに変換して、パーティクルベースのリスト102を生成する(110)ことができる。
図2Aは、本発明の単語ベースのアイテムリスト101の詳細を示している。アイテムは、地理的関心地点であり、各ID201は、アイテム202を一意に識別する。
図2Bは、単語211および対応する音素212を示している。幾つかの単語、例えば「HOUSES」は、代替的な発音を有し得る。図3は、単語301および対応するパーティクル302を示している。
単語ベースのリスト内のアイテムが複数の発音を有する場合、全ての単語について、パーティクルへの全ての可能性のある分割のデカルト積が形成され、パーティクルベースのリスト内に列挙される。例えば、AASHIANIが「AA_SH_IY AA_N_IY」としてまたは「AA_SH Y_AE_N_IH」としてパーティクルに分割することができ、RESTAURANTが「R_E_S_T_R_AA_N_T」としてまたは「R_E_S_T_ER_R_AA_N_T」としてパーティクルに分割することができる場合、全ての可能性のある分割:
AA_SH_IY AA_N_IY R_E_S_T_R_AA_N_T、
AA_SH_IY AA_N_IY R_E_S_T_ER_R_AA_N_T、
AA_SH Y_AE_N_IH R_E_S_T_R_AA_N_T、および
AA_SH Y_AE_N_IH R_E_S_T_ER_AA_N_T
が、パーティクルベースのインデックス内に列挙される。
図4は、パーティクルベースのリスト102の詳細を示し、該リストは、アイテム402ごとに一意のID401を含む。
図5は、ASRによって使用することができる発音辞書を示し、該発音辞書は、パーティクル501および対応する音素502を含む。
本発明の言語モデルは、パーティクル、例えば、パーティクルnグラムに対する統計を含むnグラム言語モデルを含む。
パーティクルの変換
本発明の実施の形態は、情報検索(IR)システムの動作のために、単語のセットを、可能な限り互いに異なるパーティクルを用いて表すことが有利であるという認識に基づいている。例えば、可能な限り互いに異なるパーティクルを有することによって、ASR中の正確な認識が可能になる。さらに、実施の形態は、パーティクル間の差を編集距離を用いて測定することができるという更なる認識に基づいている。
したがって、実施の形態は、パーティクルの出力セットにおいて、アイテムのセット660を変換する。本発明の様々な実施の形態において、アイテムのセットは、IRシステムにおいて用いるのに適した単語のセットを表す。例えば、1つの実施の形態は、単語のセット内の各単語について、該単語の複数のパーティクルへの全ての可能な分割を求め、単語のセットから導出された一意のパーティクルからアイテムのセットを形成する。他の実施の形態では、アイテムのセット内のアイテムは、単語のセット、単語のセットから導出された音声ストリングのセット、単語のセットから導出されたパーティクルのセット、およびそれらの組合せのうちの少なくとも1つから選択される。
図8は、パーティクルのセットの一例を示している。セット内の各パーティクルについて、最小編集距離(MED)810が求められる。MEDは、全ての他のパーティクルに対するそのパーティクルの最も小さい編集距離である。また、パーティクルのセットの総MED820が各パーティクルのMEDの和として求められる。
図6は、パーティクルの出力セット615においてパーティクルのセット610を変換するための方法600のブロック図を示している。1つの実施の形態において、パーティクルのセットは、アイテムのセットの少なくとも一部分によって形成される。本方法のステップは、当該技術分野において既知のように、プロセッサ601によって実行される。
変換モジュール602は、パーティクルのセット内のパーティクル630の一部分の組合せ635を生成する(620)。例えば、1つの実施の形態では、組合せは、2つの部分、すなわち、パーティクルの接頭部および接尾部のみを含む。加えて、組合せ635は、パーティクルの全ての可能な組合せである。代替の実施の形態では、組合せは、3つ以上の部分を含む。
パーティクル630は、パーティクルのセット内で、該パーティクルのセットの総最小編集距離(MED)を最大にする(640)組合せの一部分645と置き換えられる(650)。変換は、パーティクルのセット内の全てのパーティクルについて反復され、これによって、パーティクルの出力セットにおいてパーティクルのセットを変換する。
図7は、パーティクル710を該パーティクルの接頭部および接尾部715と置き換える一例を示している。パーティクルは、パーティクルのセットから取り除かれ(720)、組合せの一部分、すなわち、接頭部および接尾部がパーティクルのセットに加えられる(730)。次に、パーティクルのセット内の各パーティクルについてMEDが求められ(740)、MEDが合算され、パーティクルのセットの総MED755が求められる(750)。
置き換えは、パーティクルの全ての組合せについて繰り返される。具体的には、組合せの一部分がパーティクルのセットから取り除かれ、パーティクルの別の組合せの一部分と置き換えられ、該別の組合せの一部分を用いてMEDおよび総MEDが求められる。最後に、総MEDの最大値に対応する組合せの一部分がパーティクルのセットに加えられる。
1つの実施の形態は、パーティクルのセット内の一意のパーティクルのみを保持する。組合せの一部分がパーティクルのセット内のパーティクルと同一である例では、この部分は、セットに加えられない。
変換中、パーティクルのセット、したがってパーティクルの出力セットは、単語のセットに従ってインデックス付けされる。例えば、1つの実施の形態は、アイテムのセットと単語のセットとの間でインデックスのインデックスマップを作成する。インデックスマップは、複数のパーティクルへの単語の分割を追跡する。変換中、インデックスマップは、パーティクルに置き換わるパーティクルの一部分をインデックス付けするツリーマップとなる。
図9〜図11は、図8に示すパーティクルのセット810からのパーティクル「abcd」830の変換の例を示している。パーティクル「abcd」の全ての可能な2つの部分の組合せは、図9に示すように「a」+「bcd」と、図10に示すように「ab」+「cd」と、図11に示すように「abc」+「d」とである。各組合せについて、変換モジュールは各パーティクルのMEDと、全体セットの総MED値とを求める。組合せの一部分「a」+「bcd」が総MEDを最大にするので、総MEDの値は7に等しく、その組合せの一部分がパーティクル「abcd」を置き換える。

Claims (17)

  1. パーティクルの出力セットにおいて、アイテムのセットの少なくとも一部分によって形成されるパーティクルのセットを変換するための方法であって、該アイテムのセットは、情報検索システムにおいて用いるのに適した単語のセットを表し、該方法は、前記パーティクルのセット内の各パーティクルについて、
    前処理ステップとして、一意の単語のセットをパーティクルのセットに変換するステップと、
    前記パーティクルのセット内のパーティクルの一部分の組合せを生成するステップと、
    前記パーティクルのセット内の前記パーティクルを、該パーティクルのセットの総最小編集距離を最大にする組合せの前記一部分と置き換え、前記パーティクルの出力セットにおいて前記パーティクルのセットを変換する、置き換えるステップと、
    単語のセットを前記パーティクルのセットに基づく対応するアイテムのセットに変換するステップと、
    前記アイテムのセットをインデックス付けするステップであって、パーティクルベースのインデックスを生成する、インデックス付けするステップと
    を含み、該方法の前記ステップは、プロセッサによって実行される、パーティクルの出力セットにおいて、アイテムのセットの少なくとも一部分によって形成されるパーティクルのセットを変換するための方法。
  2. 前記パーティクルのセットの前記総最小編集距離を最大にする前記組合せを求めるステップをさらに含む請求項1に記載の方法。
  3. 前記パーティクルのセット内の各パーティクルの最小編集距離を求めるステップと、
    各パーティクルの前記最小編集距離の和として前記パーティクルのセットの前記総最小編集距離を求めるステップと
    をさらに含む請求項1に記載の方法。
  4. 前記パーティクルと、前記パーティクルのセット内の全ての他のパーティクルとの間の編集距離を求めるステップと、
    前記パーティクルの前記最小編集距離として最も小さい編集距離を選択するステップと
    をさらに含む請求項3に記載の方法。
  5. 前記置き換えるステップは、
    前記パーティクルのセットから前記パーティクルを取り除くステップと、
    前記組合せの前記一部分を前記パーティクルのセットに加えるステップと、
    前記パーティクルのセット内の各パーティクルの最小編集距離を求めるステップと、
    前記パーティクルのセットの前記総最小編集距離を求めるステップと
    をさらに含む請求項1に記載の方法。
  6. 前記パーティクルのセットから前記組合せの前記一部分を取り除くステップ
    をさらに含む請求項1に記載の方法。
  7. 前記置き換えるステップは、
    前記パーティクルのセットから前記パーティクルを取り除くステップと、
    各組合せについて、該組合せの各部分の最小編集距離と、前記パーティクルのセットの前記総最小編集距離とを求めるステップであって、該総最小編集距離は前記組合せの前記一部分の前記最小編集距離を含む、求めるステップと、
    前記組合せの前記一部分を前記総最小編集距離の最大値に対応する前記パーティクルのセットに加えるステップと
    をさらに含む請求項1に記載の方法。
  8. 前記組合せは、前記パーティクルの接頭部および接尾部を含み、前記生成するステップは、
    接頭部および接尾部の全ての可能な組合せを生成するステップ、
    をさらに含む請求項1に記載の方法。
  9. 前記単語のセット内の各単語について、パーティクルが一意になるような該パーティクルへの前記単語の全ての可能な分割を求めるステップと、
    前記パーティクルから前記アイテムのセットを形成するステップと
    をさらに含む請求項1に記載の方法。
  10. アイテムのセットと単語のセットとの間をインデックス付けするインデックスマップを用いて、前記アイテムのセットに基づいて前記パーティクルの出力セットをインデックス付けするステップ
    をさらに含む請求項1に記載の方法。
  11. ユーザーからクエリを取得するステップと、
    前記パーティクルベースのインデックスを用いて前記アイテムのセットにアクセスするステップであって、前記クエリに最も一致する対応するアイテムを求める、アクセスするステップと、
    前記ユーザーに対し、結果リストとして前記対応するアイテムを出力するステップと
    をさらに含む請求項1に記載の方法。
  12. 前記アイテムのセット内のアイテムは、前記単語のセット、該単語のセットから導出された音声ストリングのセット、前記単語のセットから導出されたパーティクルのセット、およびそれらの組合せのうちの少なくとも1つから選択される請求項1に記載の方法。
  13. 単語のセットを表すパーティクルの出力セットを生成する方法であって、
    前処理ステップとして、前記単語のセットからパーティクルのセットを求めるステップと、
    前記パーティクルのセット内のパーティクルの一部分の組合せを生成するステップと、
    前記パーティクルのセット内の前記パーティクルを、該パーティクルのセットの総最小編集距離を最大にする組合せの前記一部分と置き換えるステップと、
    単語のセットを前記パーティクルのセットに基づく対応するアイテムのセットに変換するステップと、
    前記アイテムのセットをインデックス付けするステップであって、パーティクルベースのインデックスを生成する、インデックス付けするステップと、
    前記パーティクルのセット内の各パーティクルについて前記生成するステップと前記置き換えるステップとを反復して、前記パーティクルの出力セットを生成する、反復するステップと
    を含み、該方法の前記ステップは、プロセッサによって実行される、単語のセットを表すパーティクルの出力セットを生成する方法。
  14. 前記求めるステップは、
    前記単語のセット内の各単語を複数のパーティクルに分割するステップと、
    前記パーティクルのセット内の全てのパーティクルが一意となるように、該パーティクルのセットに入れる前記パーティクルを選択するステップと
    をさらに含む請求項13に記載の方法。
  15. 前記求めるステップは、
    前記単語のセット内の各単語の音声ストリングを求めるステップと、
    前記音声ストリングに基づいて前記パーティクルのセットを形成するステップと
    をさらに含む請求項13に記載の方法。
  16. 前記パーティクルのセット内の各パーティクルの最小編集距離を求めるステップと、
    各パーティクルの和として前記パーティクルのセットの前記総最小編集距離を求めるステップと
    をさらに含む請求項13に記載の方法。
  17. 前記パーティクルと、前記パーティクルのセット内の全ての他のパーティクルとの間の編集距離を求めるステップと、
    前記パーティクルの前記最小編集距離として最も小さい編集距離を選択するステップと
    をさらに含む請求項13に記載の方法。
JP2012533154A 2010-03-31 2011-03-22 パーティクルのセットを変換するための方法、およびパーティクルの出力セットを生成する方法 Active JP5436685B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/751,678 US8229965B2 (en) 2009-06-30 2010-03-31 System and method for maximizing edit distances between particles
US12/751,678 2010-03-31
PCT/JP2011/057520 WO2011122515A1 (en) 2010-03-31 2011-03-22 Method and system for transforming set of particles

Publications (2)

Publication Number Publication Date
JP2013517540A JP2013517540A (ja) 2013-05-16
JP5436685B2 true JP5436685B2 (ja) 2014-03-05

Family

ID=44070075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012533154A Active JP5436685B2 (ja) 2010-03-31 2011-03-22 パーティクルのセットを変換するための方法、およびパーティクルの出力セットを生成する方法

Country Status (5)

Country Link
US (1) US8229965B2 (ja)
EP (1) EP2553606A1 (ja)
JP (1) JP5436685B2 (ja)
CN (1) CN102822823B (ja)
WO (1) WO2011122515A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4871373B2 (ja) * 2009-06-19 2012-02-08 任天堂株式会社 情報処理システムおよび情報処理装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6073099A (en) * 1997-11-04 2000-06-06 Nortel Networks Corporation Predicting auditory confusions using a weighted Levinstein distance
US6529892B1 (en) * 1999-08-04 2003-03-04 Illinois, University Of Apparatus, method and product for multi-attribute drug comparison
KR100318762B1 (ko) * 1999-10-01 2002-01-04 윤덕용 외래어 음차표기의 음성적 거리 계산방법
US7219056B2 (en) * 2000-04-20 2007-05-15 International Business Machines Corporation Determining and using acoustic confusability, acoustic perplexity and synthetic acoustic word error rate
US7013276B2 (en) * 2001-10-05 2006-03-14 Comverse, Inc. Method of assessing degree of acoustic confusability, and system therefor
US7089188B2 (en) * 2002-03-27 2006-08-08 Hewlett-Packard Development Company, L.P. Method to expand inputs for word or document searching
US7181398B2 (en) * 2002-03-27 2007-02-20 Hewlett-Packard Development Company, L.P. Vocabulary independent speech recognition system and method using subword units
JP2003345372A (ja) * 2002-05-23 2003-12-03 Mitsubishi Electric Corp 音声合成装置及び音声合成方法
US7047193B1 (en) * 2002-09-13 2006-05-16 Apple Computer, Inc. Unsupervised data-driven pronunciation modeling
US20050071148A1 (en) * 2003-09-15 2005-03-31 Microsoft Corporation Chinese word segmentation
US7519621B2 (en) * 2004-05-04 2009-04-14 Pagebites, Inc. Extracting information from Web pages
US20070150279A1 (en) * 2005-12-27 2007-06-28 Oracle International Corporation Word matching with context sensitive character to sound correlating
US7831911B2 (en) * 2006-03-08 2010-11-09 Microsoft Corporation Spell checking system including a phonetic speller
US8027964B2 (en) * 2007-07-13 2011-09-27 Medio Systems, Inc. Personalized query completion suggestion
JP4839291B2 (ja) * 2007-09-28 2011-12-21 Kddi株式会社 音声認識装置およびコンピュータプログラム
US8229921B2 (en) * 2008-02-25 2012-07-24 Mitsubishi Electric Research Laboratories, Inc. Method for indexing for retrieving documents using particles

Also Published As

Publication number Publication date
CN102822823A (zh) 2012-12-12
EP2553606A1 (en) 2013-02-06
US8229965B2 (en) 2012-07-24
JP2013517540A (ja) 2013-05-16
WO2011122515A1 (en) 2011-10-06
CN102822823B (zh) 2016-04-06
US20100328342A1 (en) 2010-12-30

Similar Documents

Publication Publication Date Title
US20110238412A1 (en) Method for Constructing Pronunciation Dictionaries
Issar Estimation of language models for new spoken language applications
US5581655A (en) Method for recognizing speech using linguistically-motivated hidden Markov models
US5949961A (en) Word syllabification in speech synthesis system
JP5541035B2 (ja) 音声検索装置及び音声検索方法
EP2248051B1 (en) Computer implemented method for indexing and retrieving documents in database and information retrieval system
US7542966B2 (en) Method and system for retrieving documents with spoken queries
CN1112669C (zh) 采用连续密度隐藏式马尔克夫模型的语音识别方法和系统
JP4215418B2 (ja) 単語予測方法、音声認識方法、その方法を用いた音声認識装置及びプログラム
US7606710B2 (en) Method for text-to-pronunciation conversion
JP2003036093A (ja) 音声入力検索システム
CN111462748B (zh) 语音识别处理方法、装置、电子设备及存储介质
JP6095588B2 (ja) 音声認識用wfst作成装置、音声認識装置、音声認識用wfst作成方法、音声認識方法及びプログラム
WO2004027752A1 (en) Method and apparatus to facilitate correlating symbols to sounds
CN109785842A (zh) 语音识别纠错方法以及语音识别纠错系统
JP5528213B2 (ja) 単語のセットを対応するパーティクルのセットに変換する方法
Wang et al. A comparison of phone and grapheme-based spoken term detection
KR100542757B1 (ko) 음운변이 규칙을 이용한 외래어 음차표기 자동 확장 방법및 그 장치
JP5436685B2 (ja) パーティクルのセットを変換するための方法、およびパーティクルの出力セットを生成する方法
Chalamandaris et al. Rule-based grapheme-to-phoneme method for the Greek
JP2005250071A (ja) 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体
Safarik et al. Impact of phonetic annotation precision on automatic speech recognition systems
Wang Automatic Speech Recognition Model for Swedish Using Kaldi
Tatarinova et al. Building Test Speech Dataset on Russian Language for Spoken Document Retrieval Task
Thirion et al. Multilingual pronunciations of proper names in a Southern African corpus

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130910

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131009

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131210

R150 Certificate of patent or registration of utility model

Ref document number: 5436685

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250