JP5436685B2 - パーティクルのセットを変換するための方法、およびパーティクルの出力セットを生成する方法 - Google Patents
パーティクルのセットを変換するための方法、およびパーティクルの出力セットを生成する方法 Download PDFInfo
- Publication number
- JP5436685B2 JP5436685B2 JP2012533154A JP2012533154A JP5436685B2 JP 5436685 B2 JP5436685 B2 JP 5436685B2 JP 2012533154 A JP2012533154 A JP 2012533154A JP 2012533154 A JP2012533154 A JP 2012533154A JP 5436685 B2 JP5436685 B2 JP 5436685B2
- Authority
- JP
- Japan
- Prior art keywords
- particles
- particle
- edit distance
- words
- items
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000002245 particle Substances 0.000 title claims description 208
- 238000000034 method Methods 0.000 claims description 34
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
AA_SH_IY AA_N_IY R_E_S_T_R_AA_N_T、
AA_SH_IY AA_N_IY R_E_S_T_ER_R_AA_N_T、
AA_SH Y_AE_N_IH R_E_S_T_R_AA_N_T、および
AA_SH Y_AE_N_IH R_E_S_T_ER_AA_N_T
が、パーティクルベースのインデックス内に列挙される。
本発明の実施の形態は、情報検索(IR)システムの動作のために、単語のセットを、可能な限り互いに異なるパーティクルを用いて表すことが有利であるという認識に基づいている。例えば、可能な限り互いに異なるパーティクルを有することによって、ASR中の正確な認識が可能になる。さらに、実施の形態は、パーティクル間の差を編集距離を用いて測定することができるという更なる認識に基づいている。
Claims (17)
- パーティクルの出力セットにおいて、アイテムのセットの少なくとも一部分によって形成されるパーティクルのセットを変換するための方法であって、該アイテムのセットは、情報検索システムにおいて用いるのに適した単語のセットを表し、該方法は、前記パーティクルのセット内の各パーティクルについて、
前処理ステップとして、一意の単語のセットをパーティクルのセットに変換するステップと、
前記パーティクルのセット内のパーティクルの一部分の組合せを生成するステップと、
前記パーティクルのセット内の前記パーティクルを、該パーティクルのセットの総最小編集距離を最大にする組合せの前記一部分と置き換え、前記パーティクルの出力セットにおいて前記パーティクルのセットを変換する、置き換えるステップと、
単語のセットを前記パーティクルのセットに基づく対応するアイテムのセットに変換するステップと、
前記アイテムのセットをインデックス付けするステップであって、パーティクルベースのインデックスを生成する、インデックス付けするステップと
を含み、該方法の前記ステップは、プロセッサによって実行される、パーティクルの出力セットにおいて、アイテムのセットの少なくとも一部分によって形成されるパーティクルのセットを変換するための方法。 - 前記パーティクルのセットの前記総最小編集距離を最大にする前記組合せを求めるステップをさらに含む請求項1に記載の方法。
- 前記パーティクルのセット内の各パーティクルの最小編集距離を求めるステップと、
各パーティクルの前記最小編集距離の和として前記パーティクルのセットの前記総最小編集距離を求めるステップと
をさらに含む請求項1に記載の方法。 - 前記パーティクルと、前記パーティクルのセット内の全ての他のパーティクルとの間の編集距離を求めるステップと、
前記パーティクルの前記最小編集距離として最も小さい編集距離を選択するステップと
をさらに含む請求項3に記載の方法。 - 前記置き換えるステップは、
前記パーティクルのセットから前記パーティクルを取り除くステップと、
前記組合せの前記一部分を前記パーティクルのセットに加えるステップと、
前記パーティクルのセット内の各パーティクルの最小編集距離を求めるステップと、
前記パーティクルのセットの前記総最小編集距離を求めるステップと
をさらに含む請求項1に記載の方法。 - 前記パーティクルのセットから前記組合せの前記一部分を取り除くステップ
をさらに含む請求項1に記載の方法。 - 前記置き換えるステップは、
前記パーティクルのセットから前記パーティクルを取り除くステップと、
各組合せについて、該組合せの各部分の最小編集距離と、前記パーティクルのセットの前記総最小編集距離とを求めるステップであって、該総最小編集距離は前記組合せの前記一部分の前記最小編集距離を含む、求めるステップと、
前記組合せの前記一部分を前記総最小編集距離の最大値に対応する前記パーティクルのセットに加えるステップと
をさらに含む請求項1に記載の方法。 - 前記組合せは、前記パーティクルの接頭部および接尾部を含み、前記生成するステップは、
接頭部および接尾部の全ての可能な組合せを生成するステップ、
をさらに含む請求項1に記載の方法。 - 前記単語のセット内の各単語について、パーティクルが一意になるような該パーティクルへの前記単語の全ての可能な分割を求めるステップと、
前記パーティクルから前記アイテムのセットを形成するステップと
をさらに含む請求項1に記載の方法。 - アイテムのセットと単語のセットとの間をインデックス付けするインデックスマップを用いて、前記アイテムのセットに基づいて前記パーティクルの出力セットをインデックス付けするステップ
をさらに含む請求項1に記載の方法。 - ユーザーからクエリを取得するステップと、
前記パーティクルベースのインデックスを用いて前記アイテムのセットにアクセスするステップであって、前記クエリに最も一致する対応するアイテムを求める、アクセスするステップと、
前記ユーザーに対し、結果リストとして前記対応するアイテムを出力するステップと
をさらに含む請求項1に記載の方法。 - 前記アイテムのセット内のアイテムは、前記単語のセット、該単語のセットから導出された音声ストリングのセット、前記単語のセットから導出されたパーティクルのセット、およびそれらの組合せのうちの少なくとも1つから選択される請求項1に記載の方法。
- 単語のセットを表すパーティクルの出力セットを生成する方法であって、
前処理ステップとして、前記単語のセットからパーティクルのセットを求めるステップと、
前記パーティクルのセット内のパーティクルの一部分の組合せを生成するステップと、
前記パーティクルのセット内の前記パーティクルを、該パーティクルのセットの総最小編集距離を最大にする組合せの前記一部分と置き換えるステップと、
単語のセットを前記パーティクルのセットに基づく対応するアイテムのセットに変換するステップと、
前記アイテムのセットをインデックス付けするステップであって、パーティクルベースのインデックスを生成する、インデックス付けするステップと、
前記パーティクルのセット内の各パーティクルについて前記生成するステップと前記置き換えるステップとを反復して、前記パーティクルの出力セットを生成する、反復するステップと
を含み、該方法の前記ステップは、プロセッサによって実行される、単語のセットを表すパーティクルの出力セットを生成する方法。 - 前記求めるステップは、
前記単語のセット内の各単語を複数のパーティクルに分割するステップと、
前記パーティクルのセット内の全てのパーティクルが一意となるように、該パーティクルのセットに入れる前記パーティクルを選択するステップと
をさらに含む請求項13に記載の方法。 - 前記求めるステップは、
前記単語のセット内の各単語の音声ストリングを求めるステップと、
前記音声ストリングに基づいて前記パーティクルのセットを形成するステップと
をさらに含む請求項13に記載の方法。 - 前記パーティクルのセット内の各パーティクルの最小編集距離を求めるステップと、
各パーティクルの和として前記パーティクルのセットの前記総最小編集距離を求めるステップと
をさらに含む請求項13に記載の方法。 - 前記パーティクルと、前記パーティクルのセット内の全ての他のパーティクルとの間の編集距離を求めるステップと、
前記パーティクルの前記最小編集距離として最も小さい編集距離を選択するステップと
をさらに含む請求項13に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/751,678 US8229965B2 (en) | 2009-06-30 | 2010-03-31 | System and method for maximizing edit distances between particles |
US12/751,678 | 2010-03-31 | ||
PCT/JP2011/057520 WO2011122515A1 (en) | 2010-03-31 | 2011-03-22 | Method and system for transforming set of particles |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013517540A JP2013517540A (ja) | 2013-05-16 |
JP5436685B2 true JP5436685B2 (ja) | 2014-03-05 |
Family
ID=44070075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012533154A Active JP5436685B2 (ja) | 2010-03-31 | 2011-03-22 | パーティクルのセットを変換するための方法、およびパーティクルの出力セットを生成する方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8229965B2 (ja) |
EP (1) | EP2553606A1 (ja) |
JP (1) | JP5436685B2 (ja) |
CN (1) | CN102822823B (ja) |
WO (1) | WO2011122515A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4871373B2 (ja) * | 2009-06-19 | 2012-02-08 | 任天堂株式会社 | 情報処理システムおよび情報処理装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6073099A (en) * | 1997-11-04 | 2000-06-06 | Nortel Networks Corporation | Predicting auditory confusions using a weighted Levinstein distance |
US6529892B1 (en) * | 1999-08-04 | 2003-03-04 | Illinois, University Of | Apparatus, method and product for multi-attribute drug comparison |
KR100318762B1 (ko) * | 1999-10-01 | 2002-01-04 | 윤덕용 | 외래어 음차표기의 음성적 거리 계산방법 |
US7219056B2 (en) * | 2000-04-20 | 2007-05-15 | International Business Machines Corporation | Determining and using acoustic confusability, acoustic perplexity and synthetic acoustic word error rate |
US7013276B2 (en) * | 2001-10-05 | 2006-03-14 | Comverse, Inc. | Method of assessing degree of acoustic confusability, and system therefor |
US7089188B2 (en) * | 2002-03-27 | 2006-08-08 | Hewlett-Packard Development Company, L.P. | Method to expand inputs for word or document searching |
US7181398B2 (en) * | 2002-03-27 | 2007-02-20 | Hewlett-Packard Development Company, L.P. | Vocabulary independent speech recognition system and method using subword units |
JP2003345372A (ja) * | 2002-05-23 | 2003-12-03 | Mitsubishi Electric Corp | 音声合成装置及び音声合成方法 |
US7047193B1 (en) * | 2002-09-13 | 2006-05-16 | Apple Computer, Inc. | Unsupervised data-driven pronunciation modeling |
US20050071148A1 (en) * | 2003-09-15 | 2005-03-31 | Microsoft Corporation | Chinese word segmentation |
US7519621B2 (en) * | 2004-05-04 | 2009-04-14 | Pagebites, Inc. | Extracting information from Web pages |
US20070150279A1 (en) * | 2005-12-27 | 2007-06-28 | Oracle International Corporation | Word matching with context sensitive character to sound correlating |
US7831911B2 (en) * | 2006-03-08 | 2010-11-09 | Microsoft Corporation | Spell checking system including a phonetic speller |
US8027964B2 (en) * | 2007-07-13 | 2011-09-27 | Medio Systems, Inc. | Personalized query completion suggestion |
JP4839291B2 (ja) * | 2007-09-28 | 2011-12-21 | Kddi株式会社 | 音声認識装置およびコンピュータプログラム |
US8229921B2 (en) * | 2008-02-25 | 2012-07-24 | Mitsubishi Electric Research Laboratories, Inc. | Method for indexing for retrieving documents using particles |
-
2010
- 2010-03-31 US US12/751,678 patent/US8229965B2/en active Active
-
2011
- 2011-03-22 CN CN201180016193.4A patent/CN102822823B/zh active Active
- 2011-03-22 WO PCT/JP2011/057520 patent/WO2011122515A1/en active Application Filing
- 2011-03-22 JP JP2012533154A patent/JP5436685B2/ja active Active
- 2011-03-22 EP EP11713382A patent/EP2553606A1/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
CN102822823A (zh) | 2012-12-12 |
EP2553606A1 (en) | 2013-02-06 |
US8229965B2 (en) | 2012-07-24 |
JP2013517540A (ja) | 2013-05-16 |
WO2011122515A1 (en) | 2011-10-06 |
CN102822823B (zh) | 2016-04-06 |
US20100328342A1 (en) | 2010-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20110238412A1 (en) | Method for Constructing Pronunciation Dictionaries | |
Issar | Estimation of language models for new spoken language applications | |
US5581655A (en) | Method for recognizing speech using linguistically-motivated hidden Markov models | |
US5949961A (en) | Word syllabification in speech synthesis system | |
JP5541035B2 (ja) | 音声検索装置及び音声検索方法 | |
EP2248051B1 (en) | Computer implemented method for indexing and retrieving documents in database and information retrieval system | |
US7542966B2 (en) | Method and system for retrieving documents with spoken queries | |
CN1112669C (zh) | 采用连续密度隐藏式马尔克夫模型的语音识别方法和系统 | |
JP4215418B2 (ja) | 単語予測方法、音声認識方法、その方法を用いた音声認識装置及びプログラム | |
US7606710B2 (en) | Method for text-to-pronunciation conversion | |
JP2003036093A (ja) | 音声入力検索システム | |
CN111462748B (zh) | 语音识别处理方法、装置、电子设备及存储介质 | |
JP6095588B2 (ja) | 音声認識用wfst作成装置、音声認識装置、音声認識用wfst作成方法、音声認識方法及びプログラム | |
WO2004027752A1 (en) | Method and apparatus to facilitate correlating symbols to sounds | |
CN109785842A (zh) | 语音识别纠错方法以及语音识别纠错系统 | |
JP5528213B2 (ja) | 単語のセットを対応するパーティクルのセットに変換する方法 | |
Wang et al. | A comparison of phone and grapheme-based spoken term detection | |
KR100542757B1 (ko) | 음운변이 규칙을 이용한 외래어 음차표기 자동 확장 방법및 그 장치 | |
JP5436685B2 (ja) | パーティクルのセットを変換するための方法、およびパーティクルの出力セットを生成する方法 | |
Chalamandaris et al. | Rule-based grapheme-to-phoneme method for the Greek | |
JP2005250071A (ja) | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 | |
Safarik et al. | Impact of phonetic annotation precision on automatic speech recognition systems | |
Wang | Automatic Speech Recognition Model for Swedish Using Kaldi | |
Tatarinova et al. | Building Test Speech Dataset on Russian Language for Spoken Document Retrieval Task | |
Thirion et al. | Multilingual pronunciations of proper names in a Southern African corpus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130809 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130910 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131009 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5436685 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |