JP5528213B2 - 単語のセットを対応するパーティクルのセットに変換する方法 - Google Patents
単語のセットを対応するパーティクルのセットに変換する方法 Download PDFInfo
- Publication number
- JP5528213B2 JP5528213B2 JP2010121169A JP2010121169A JP5528213B2 JP 5528213 B2 JP5528213 B2 JP 5528213B2 JP 2010121169 A JP2010121169 A JP 2010121169A JP 2010121169 A JP2010121169 A JP 2010121169A JP 5528213 B2 JP5528213 B2 JP 5528213B2
- Authority
- JP
- Japan
- Prior art keywords
- particles
- word
- words
- particle
- cost
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000002245 particle Substances 0.000 title claims description 152
- 238000000034 method Methods 0.000 claims description 49
- 230000007423 decrease Effects 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000005549 size reduction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1に示すように、本発明の実施の形態は、情報検索(IR)システム100において、データベースからアイテムを検索する方法を提供する。本方法のステップは、当該技術分野において既知のプロセッサにおいて動作する。プロセッサは、メモリ及びI/Oインタフェースを備える。
AA_SH_IY AA_N_IY R_E_S_T_R_AA_N_T、
AA_SH_IY AA_N_IY R_E_S_T_ER_R_AA_N_T、
AA_SH Y_AE_N_IH R_E_S_T_R_AA_N_T、及び
AA_SH Y_AE_N_IH R_E_S_T_ER_R_AA_N_T
が、パーティクルベースのインデックス内に列挙される。
単語ベースのリスト101からパーティクルベースのリスト102を生成する方法は、以下の着想に従う。
トップダウン方法:本方法は、セット149内の一意の単語から開始し、単語をパーティクルに分割する;
頻度に基づく区分:本方法は、リスト101内の単語の頻度をカウントする。より頻繁に出現する単語は、無処置のままにされ、頻度の低い単語は、より頻繁に出現するパーティクルに分割される;及び
圧縮:パーティクルのセット151は、保持され、本方法は、より小さなセット151を生成して、異なるパーティクルの総数を異なる単語の総数よりもはるかに小さくするようにバイアスされる。
本方法を以下のように拡張することができる。
言語モデルパープレキシティ−言語及び発話の処理において、パープレキシティは、文法によって課される制約レベル又は文法を所与とした不確実性レベル、たとえば言語モデル内の所与の単語に続くことができる単語の平均数の基準である。
逆文献頻度(IDF:Inverse Document Frequency)コスト−これは、パーティクルの個々のIDFの和である。
Claims (14)
- 単語のセットを対応するパーティクルのセットに変換する方法であって、メモリと、入力インタフェース及び出力インタフェースとを備えるプロセッサによって実行され、前記単語及び前記パーティクルは、各前記セット内で一意であり、前記方法は、
前記単語毎に、前記単語の、パーティクルへの全ての可能性のある分割を求めるステップと、
前記単語毎に、前記可能性のある分割毎のコストを求めるステップと、
最小コストに関連付けられる前記可能性のある分割の前記パーティクルを前記パーティクルのセットに追加するステップと、を含み、
前記単語のセットは、単語ベースのアイテムリストから取得され、
前記単語のセット及び前記パーティクルのセットを使用して、前記単語ベースのアイテムリストから対応するパーティクルベースのアイテムリストを生成するステップをさらに含み、
前記パーティクルのセットを使用して、前記パーティクルベースのアイテムリストをインデックス付けすることであって、前記パーティクルベースのアイテムリストに対するパーティクルベースのインデックスを生成する、インデックス付けするステップをさらに含み、
ユーザからクエリを取得するステップと、
前記パーティクルベースのインデックスを使用して前記パーティクルベースのアイテムリストにアクセスすることであって、前記クエリに最も一致するパーティクルベースのアイテムを検索する、アクセスするステップと、
対応する単語ベースのアイテムを結果リストとして前記ユーザに出力するステップと、
をさらに含み、
前記コストは、尤度コスト
単語のセットを対応するパーティクルのセットに変換する方法。 - 前記クエリは、テキストであり、前記テキストは、前記パーティクルのセットを使用してパーティクルベースのクエリに変換される請求項1に記載の単語のセットを対応するパーティクルのセットに変換する方法。
- 前記クエリは、発話であり、前記発話は、前記パーティクルのセットを使用してパーティクルベースのクエリに変換される請求項1に記載の単語のセットを対応するパーティクルのセットに変換する方法。
- 前記可能性のある分割のパーティクルは、前記単語の代替的な発音のためのものである請求項1に記載の単語のセットを対応するパーティクルのセットに変換する方法。
- 各前記パーティクルは、連結された音素配列を表し、一連のパーティクルは、対応する単語の音素配列を表す請求項1に記載の単語のセットを対応するパーティクルのセットに変換する方法。
- 頻度の高い単語は、無処置のままにされ、頻度の低い単語は、パーティクルに分割される請求項1に記載の単語のセットを対応するパーティクルのセットに変換する方法。
- 前記可能性のある分割は、前記単語の左から右への線形走査を使用して、前記単語を左接頭語及び右接頭語に分割する請求項1に記載の単語のセットを対応するパーティクルのセットに変換する方法。
- 前記可能性のある分割は、発音辞書内の追加情報によって導かれる前記単語の音節境界において作成される請求項1に記載の単語のセットを対応するパーティクルのセットに変換する方法。
- 前記単語セットは、ランダムな順序で配置され、前記セットは、終了条件に達するまで、異なるランダムな順序に関して反復して再処理する請求項1に記載の単語のセットを対応するパーティクルのセットに変換する方法。
- 前記コストは、nグラムパープレキシティに応じて決まる請求項1に記載の単語のセットを対応するパーティクルのセットに変換する方法。
- 前記コストは、有限状態文法に応じて決まる請求項1に記載の単語のセットを対応するパーティクルのセットに変換する方法。
- 前記単語ベースのアイテムからなるリストは、テキストから構築される請求項2に記載の単語のセットを対応するパーティクルのセットに変換する方法。
- 前記単語ベースのアイテムから成るリストは、発話から構築される請求項2に記載の単語のセットを対応するパーティクルのセットに変換する方法。
- 前記コストは、前記パーティクルセットのサイズと共に増大し、前記セット内の前記パーティクルの発現頻度の関数として減少する請求項1に記載の単語のセットを対応するパーティクルのセットに変換する方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/495,540 US8055693B2 (en) | 2008-02-25 | 2009-06-30 | Method for retrieving items represented by particles from an information database |
US12/495,540 | 2009-06-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011014130A JP2011014130A (ja) | 2011-01-20 |
JP5528213B2 true JP5528213B2 (ja) | 2014-06-25 |
Family
ID=42831058
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010121169A Expired - Fee Related JP5528213B2 (ja) | 2009-06-30 | 2010-05-27 | 単語のセットを対応するパーティクルのセットに変換する方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8055693B2 (ja) |
EP (1) | EP2270685A1 (ja) |
JP (1) | JP5528213B2 (ja) |
CN (1) | CN101937450B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI488174B (zh) * | 2011-06-03 | 2015-06-11 | Apple Inc | 自動地建立文字資料與音訊資料間之映射 |
WO2013078401A2 (en) * | 2011-11-21 | 2013-05-30 | Liveweaver, Inc. | Engine for human language comprehension of intent and command execution |
US9961442B2 (en) | 2011-11-21 | 2018-05-01 | Zero Labs, Inc. | Engine for human language comprehension of intent and command execution |
US10249298B2 (en) | 2017-01-11 | 2019-04-02 | Here Global B.V. | Method and apparatus for providing global voice-based entry of geographic information in a device |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3668108A (en) | 1966-11-15 | 1972-06-06 | Hercules Inc | Solids arc reactor apparatus and method |
US6070140A (en) * | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
US6618699B1 (en) * | 1999-08-30 | 2003-09-09 | Lucent Technologies Inc. | Formant tracking based on phoneme information |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US7089188B2 (en) * | 2002-03-27 | 2006-08-08 | Hewlett-Packard Development Company, L.P. | Method to expand inputs for word or document searching |
JP3986531B2 (ja) * | 2005-09-21 | 2007-10-03 | 沖電気工業株式会社 | 形態素解析装置及び形態素解析プログラム |
CN100495405C (zh) * | 2007-01-10 | 2009-06-03 | 复旦大学 | 大规模文本逐次二分的层次聚类方法 |
KR101127267B1 (ko) * | 2007-05-01 | 2012-07-10 | 인터내셔널 비지네스 머신즈 코포레이션 | 유사 스트링 정합을 위한 방법 및 시스템 |
-
2009
- 2009-06-30 US US12/495,540 patent/US8055693B2/en not_active Expired - Fee Related
-
2010
- 2010-05-27 JP JP2010121169A patent/JP5528213B2/ja not_active Expired - Fee Related
- 2010-06-11 EP EP10006106A patent/EP2270685A1/en not_active Ceased
- 2010-06-30 CN CN201010220209.0A patent/CN101937450B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101937450B (zh) | 2014-03-12 |
US20090265162A1 (en) | 2009-10-22 |
US8055693B2 (en) | 2011-11-08 |
CN101937450A (zh) | 2011-01-05 |
EP2270685A1 (en) | 2011-01-05 |
JP2011014130A (ja) | 2011-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Issar | Estimation of language models for new spoken language applications | |
US6877001B2 (en) | Method and system for retrieving documents with spoken queries | |
JP5241840B2 (ja) | データベース内の文書をインデックス付け及び検索するための、コンピュータで実施される方法、及び情報検索システム | |
US8380505B2 (en) | System for recognizing speech for searching a database | |
JP5459214B2 (ja) | 言語モデル作成装置、言語モデル作成方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
US9418152B2 (en) | System and method for flexible speech to text search mechanism | |
JP4215418B2 (ja) | 単語予測方法、音声認識方法、その方法を用いた音声認識装置及びプログラム | |
KR101543992B1 (ko) | 언어-내 통계적 머신 번역 | |
US10019514B2 (en) | System and method for phonetic search over speech recordings | |
KR20080069990A (ko) | 음성 세그먼트 색인 및 검색 방법과 컴퓨터 실행 가능명령어를 갖는 컴퓨터 판독 가능 매체 | |
US20030204399A1 (en) | Key word and key phrase based speech recognizer for information retrieval systems | |
US20070179784A1 (en) | Dynamic match lattice spotting for indexing speech content | |
JP2008532099A (ja) | データベースに格納されている文書の索引付け及び検索のためにコンピュータにより実施される方法並びに文書の索引付け及び検索のためのシステム | |
JP2011209704A (ja) | 発音辞書を構築するための方法およびシステム | |
JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
US8306820B2 (en) | Method for speech recognition using partitioned vocabulary | |
JP5528213B2 (ja) | 単語のセットを対応するパーティクルのセットに変換する方法 | |
US20050187767A1 (en) | Dynamic N-best algorithm to reduce speech recognition errors | |
JP5360414B2 (ja) | キーワード抽出モデル学習システム、方法およびプログラム | |
KR20120052591A (ko) | 연속어 음성인식 시스템에서 오류수정 장치 및 방법 | |
KR100542757B1 (ko) | 음운변이 규칙을 이용한 외래어 음차표기 자동 확장 방법및 그 장치 | |
JP2011175046A (ja) | 音声検索装置および音声検索方法 | |
JP2011128903A (ja) | 系列信号検索装置および系列信号検索方法 | |
JP6078435B2 (ja) | 記号列変換方法、音声認識方法、それらの装置及びプログラム | |
JP5436685B2 (ja) | パーティクルのセットを変換するための方法、およびパーティクルの出力セットを生成する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130425 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140318 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140415 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5528213 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |