JP5300974B2 - 検索装置 - Google Patents
検索装置 Download PDFInfo
- Publication number
- JP5300974B2 JP5300974B2 JP2011508269A JP2011508269A JP5300974B2 JP 5300974 B2 JP5300974 B2 JP 5300974B2 JP 2011508269 A JP2011508269 A JP 2011508269A JP 2011508269 A JP2011508269 A JP 2011508269A JP 5300974 B2 JP5300974 B2 JP 5300974B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- narrowing
- candidates
- input
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 74
- 230000006978 adaptation Effects 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 230000002776 aggregation Effects 0.000 description 19
- 238000004220 aggregation Methods 0.000 description 19
- 238000004364 calculation method Methods 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 3
- 230000004044 response Effects 0.000 description 2
- 230000004043 responsiveness Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
しかし、一度、候補外となると、再び候補になることは無いため、候補が脱落しないようにする必要がある。例えば、東京都にある施設名を検索対象とした場合に、「東京」という入力に対しては膨大な数の候補が生じる。この場合、ユーザが全ての候補を確認することは困難であるにもかかわらず、検索履歴には多数候補が含まれ管理のコストが大きくなる問題がある。また、保持可能な候補数に上限がある場合、候補から脱落する場合が生じる。複数回の絞り込みや絞り込みのキャンセルを考慮すると、複数回分の検索履歴を格納しておく必要があり、管理コストも大きくなる。
ユーザ入力を受理し、検索要求を出力する入力手段と、
入力手段からの入力内容および候補リストを含む検索履歴を格納する検索履歴格納手段と、
検索要求により検索履歴格納手段に格納される検索履歴の内容に応じて、所定のしきい値以上のスコアを有する候補数が、提示する候補数の上限値以下である場合には、検索対象を上位の候補に限定する方式を選択し、前記所定のしきい値以上のスコアを有する候補数が、前記提示する候補数の上限値を越える場合には、過去入力に基づいて再検索する方式を選択することで、2方式から絞り込み方法を選択する絞り込み方式選択手段と、
選択した絞り込み方式に基づいて検索履歴から検索候補とそのスコアを設定し、入力手段より受理した文字列に基づき検索用索引を参照に候補スコアを更新する候補スコア更新手段と、
候補スコア更新手段により更新された候補数とスコアの分布に基づいて提示する候補を決定する候補決定手段と、
候補決定手段で決定された候補を名称情報データを参照してユーザに提示する候補提示手段からなる。
実施の形態1.
図1は、この発明が想定する検索装置の全体構成である。入力部10は、テキスト、音声等による入力を受理し、必要に応じて大語彙音声認識辞書103を参照して検索部20が受理可能な形式へ変換する。検索部20は検索用索引102を参照してあいまい検索を行う。提示部30は、名称情報辞書101を参照し検索部20による検索結果の名称や付帯情報をユーザへ提示する。
検索装置は、名称情報辞書101、検索用索引102、入力部10の構成手段の一例である入力手段201、検索履歴格納手段202、絞り込み方式選択手段203、候補スコア更新手段204、候補決定手段205、提示部30の構成手段の一例である候補提示手段206で構成されている。
図7は、実施の形態1に係る検索装置の検索処理動作を示すフローチャートである。ここでは、検索履歴格納手段202にh回の検索履歴S[i](i=1..h)が格納されているものとする。
図2の絞り込み方式選択手段203において絞り込み方法の選択基準を説明する。
図8は、ある入力(A)(B)に対する検索結果の候補を、X軸が順位、Y軸がスコアとして表したものである。候補の妥当性からしきい値が設定される。また、妥当な応答性を確保するため同時に提示する候補数の上限が設定される。
図9は、この発明の実施の形態2に係る検索装置の構成を示す機能ブロック図である。実施の形態2に係る検索装置は、実施の形態1の検索装置に絞り込み用認識辞書生成手段302が追加して設けられている。また、入力は音声であることを想定している。以下、実施の形態1と同一の構成には図2で使用した符号と同一の符号を付し、説明を省略または簡略化する。
非特許文献5:「SPOKEN LANGUAGE PROCESSING -A guide to Theory, Algorithm and System Development-」、Xuedong Huang, Alex Acero, Hsiao-Wuen Hon共著、Prentice Hall.
絞り込み用認識辞書生成手段302は、絞り込み方式選択手段203が選択した絞り込み方法が検索履歴格納手段202に格納された候補内に限定している場合、対象となっている名称IDと対応する名称情報を取得し、名称情報101から絞り込み用の辞書を生成する。
絞り込みかつ検索履歴格納手段202が保持する候補内限定の場合、絞り込み用認識辞書生成手段302は、名称情報辞書101、検索履歴格納手段202を参照し、対象となる候補で出現しうる表現を受理可能な認識辞書を生成し、音声入力手段301の認識辞書とする(ステップS2002)。
そうでない場合、音声入力手段301は、大語彙音声認識辞書103を読み込む(ステップS2003)。
候補スコア更新手段204は、検索要求に対して、まず検索履歴格納手段202に検索履歴があるか(履歴数hが1以上か)確認する(ステップS2005)。履歴数が0の場合、集計用テーブルの全ての候補について検索対象の集計フラグをセットし、スコアを0にクリアして、ステップS2012へ進む。
次に、候補スコア更新手段204は、履歴情報S[i]に含まれる入力文字列から検索用索引の部分文字列索引を読み出し、候補ごとのスコアを加算する(ステップS2008)。
参照履歴iが履歴数hより小さければ、iを1加算し、ステップS2008に戻る。そうでなければステップS2011に進む(ステップS2009)。この結果、集計用テーブルの全ての履歴を考慮したスコアが候補の名称IDに付与される。
候補スコア更新手段204は、入力手段301から取得した文字列に対応する検索用索引を参照するための部分文字列を取得し、検索用索引102を参照して部分文字列に基づくスコアを加算する(ステップS2011)。
検索履歴格納手段202は、候補決定手段205で抽出された入力文字列と、提示候補の名称ID、スコアを格納する(ステップS2013)。
候補提示手段206は、名称情報辞書101を参照し、候補決定手段205で抽出された提示する名称IDに対応する名称等の提示内容を取得し、ユーザへ提示する(ステップS1014)。
図13は、この発明の実施の形態3に係る検索装置の構成を示す機能ブロック図である。実施の形態3に係る検索装置は、実施の形態2の検索装置に絞り込み用認識辞書適応化手段401を追加して設けている。以下、実施の形態2と同一の構成には図9で使用した符号と同一の符号を付し、説明を省略または簡略化する。
絞り込み用認識辞書生成手段302は、検索履歴格納手段202および絞り込み方式選択手段203の状態を参照し、絞り込みかつ候補内限定処理となっているかどうか確認する(ステップS3001)。
そうでない場合、絞り込み用認識辞書適応化手段401は、大語彙認識辞書103を読み込み、検索履歴に記載された文字列に基づいて認識辞書の単語連鎖確率を絞り込み用に適応化し、音声入力手段301の適応化認識辞書とする(ステップS3003)。
候補スコア更新手段204は、検索要求に対して、まず検索履歴格納手段202に入力履歴があるか(履歴数hが1以上か)確認する(ステップS3005)。履歴数が0の場合、全ての候補について検索対象の集計フラグをセットし、スコアを0にクリアして、ステップS3012へ進む。
次に、候補スコア更新手段204は、履歴情報S[i]に含まれる入力文字列から部分文字列索引を読み出し、候補ごとのスコアを加算する(ステップS3008)。
参照履歴iが履歴数hより小さければ、iを1加算し、ステップS3008に戻る。そうでなければステップS3011に進む(ステップS3009)。この結果、集計用テーブルの全ての履歴を考慮したスコアが候補の名称IDに付与される。
候補スコア更新手段204は、入力手段201から取得した文字列に対応する検索用索引を参照するための部分文字列を取得し、検索用索引101を参照して部分文字列に基づくスコアを加算する(ステップS3011)。
検索履歴格納手段202は、候補決定手段205が抽出した入力文字列と、提示候補の名称ID、スコアを格納する(ステップS3013)。
Claims (3)
- ユーザ入力を受理し、検索要求を出力する入力手段と、
入力手段からの入力内容および候補リストを含む検索履歴を格納する検索履歴格納手段と、
検索要求により検索履歴格納手段に格納される検索履歴の内容に応じて、所定のしきい値以上のスコアを有する候補数が、提示する候補数の上限値以下である場合には、検索対象を上位の候補に限定する方式を選択し、前記所定のしきい値以上のスコアを有する候補数が、前記提示する候補数の上限値を越える場合には、過去入力に基づいて再検索する方式を選択することで、2方式から絞り込み方法を選択する絞り込み方式選択手段と、
選択した絞り込み方式に基づいて検索履歴から検索候補とそのスコアを設定し、入力手段より受理した文字列に基づき検索用索引を参照に候補スコアを更新する候補スコア更新手段と、
候補スコア更新手段により更新された候補数とスコアの分布に基づいて提示する候補を決定する候補決定手段と、
候補決定手段で決定された候補を名称情報データを参照してユーザに提示する候補提示手段からなる検索装置。 - 音声認識用の大語彙認識辞書と、
前記絞り込み方式選択手段が上位の候補に限定する方式を選択した場合に、対象候補の名称情報に基づいて絞り込み用認識辞書を生成する絞り込み用認識辞書生成手段を備え、
前記入力手段は音声を入力して、前記絞り込み方式選択手段が上位の候補に限定する方式を選択した場合は、絞り込み用認識辞書を用い、他の場合は大語彙認識辞書を用いて音声認識を行いテキストを出力する構成にされた請求項1記載の検索装置。 - 前記絞り込み方式選択手段が過去入力に基づく再検索が選択された場合に、検索履歴に基づいて大語彙認識辞書を、想定される絞り込み発話へ適応させるように修正して、適応化認識辞書とする絞り込み用認識辞書適応化手段を備え、
前記入力手段は音声を入力して、絞り込み方式選択手段に従い絞り込み用認識辞書または適応化認識辞書を読み込み、音声を認識してテキストを出力する構成にされた請求項2記載の検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011508269A JP5300974B2 (ja) | 2009-04-06 | 2010-02-09 | 検索装置 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009092138 | 2009-04-06 | ||
JP2009092138 | 2009-04-06 | ||
PCT/JP2010/051874 WO2010116785A1 (ja) | 2009-04-06 | 2010-02-09 | 検索装置 |
JP2011508269A JP5300974B2 (ja) | 2009-04-06 | 2010-02-09 | 検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2010116785A1 JPWO2010116785A1 (ja) | 2012-10-18 |
JP5300974B2 true JP5300974B2 (ja) | 2013-09-25 |
Family
ID=42936074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011508269A Expired - Fee Related JP5300974B2 (ja) | 2009-04-06 | 2010-02-09 | 検索装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20110320464A1 (ja) |
EP (1) | EP2418589A4 (ja) |
JP (1) | JP5300974B2 (ja) |
CN (1) | CN102365639B (ja) |
WO (1) | WO2010116785A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5083367B2 (ja) * | 2010-04-27 | 2012-11-28 | カシオ計算機株式会社 | 検索装置、検索方法、ならびに、コンピュータプログラム |
US8805828B1 (en) * | 2012-01-13 | 2014-08-12 | Google Inc. | Providing information regarding prior searches |
US8918408B2 (en) * | 2012-08-24 | 2014-12-23 | Microsoft Corporation | Candidate generation for predictive input using input history |
CN103077718B (zh) * | 2013-01-09 | 2015-11-25 | 华为终端有限公司 | 语音处理方法、系统和终端 |
JP6064629B2 (ja) * | 2013-01-30 | 2017-01-25 | 富士通株式会社 | 音声入出力データベース検索方法、プログラム、及び装置 |
WO2014136173A1 (ja) * | 2013-03-04 | 2014-09-12 | 三菱電機株式会社 | 検索装置 |
JP2014229272A (ja) * | 2013-05-27 | 2014-12-08 | 株式会社東芝 | 電子機器 |
US10452695B2 (en) * | 2017-09-22 | 2019-10-22 | Oracle International Corporation | Context-based virtual assistant implementation |
CN107731229B (zh) * | 2017-09-29 | 2021-06-08 | 百度在线网络技术(北京)有限公司 | 用于识别语音的方法和装置 |
CN109840062B (zh) * | 2017-11-28 | 2022-10-28 | 株式会社东芝 | 输入辅助装置以及记录介质 |
CN111274265B (zh) * | 2020-01-19 | 2023-09-19 | 支付宝(杭州)信息技术有限公司 | 基于多种检索方式融合检索的方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02189680A (ja) * | 1989-01-18 | 1990-07-25 | Nec Corp | 情報検索方式 |
JPH0528190A (ja) * | 1991-07-19 | 1993-02-05 | Hitachi Ltd | 情報検索用端末装置 |
JP2001282285A (ja) * | 2000-03-31 | 2001-10-12 | Matsushita Electric Ind Co Ltd | 音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置 |
JP2001357064A (ja) * | 2001-04-09 | 2001-12-26 | Toshiba Corp | 情報共有支援システム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5835667A (en) * | 1994-10-14 | 1998-11-10 | Carnegie Mellon University | Method and apparatus for creating a searchable digital video library and a system and method of using such a library |
JP3665112B2 (ja) | 1995-09-26 | 2005-06-29 | 新日鉄ソリューションズ株式会社 | 文字列検索方法及び装置 |
US6757718B1 (en) * | 1999-01-05 | 2004-06-29 | Sri International | Mobile navigation of network-based electronic information using spoken input |
DE102005030967B4 (de) * | 2005-06-30 | 2007-08-09 | Daimlerchrysler Ag | Verfahren und Vorrichtung zur Interaktion mit einem Spracherkennungssystem zur Auswahl von Elementen aus Listen |
JP5072415B2 (ja) | 2007-04-10 | 2012-11-14 | 三菱電機株式会社 | 音声検索装置 |
US8090738B2 (en) * | 2008-05-14 | 2012-01-03 | Microsoft Corporation | Multi-modal search wildcards |
-
2010
- 2010-02-09 CN CN201080015020.6A patent/CN102365639B/zh not_active Expired - Fee Related
- 2010-02-09 EP EP10761487A patent/EP2418589A4/en not_active Withdrawn
- 2010-02-09 US US13/255,517 patent/US20110320464A1/en not_active Abandoned
- 2010-02-09 JP JP2011508269A patent/JP5300974B2/ja not_active Expired - Fee Related
- 2010-02-09 WO PCT/JP2010/051874 patent/WO2010116785A1/ja active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02189680A (ja) * | 1989-01-18 | 1990-07-25 | Nec Corp | 情報検索方式 |
JPH0528190A (ja) * | 1991-07-19 | 1993-02-05 | Hitachi Ltd | 情報検索用端末装置 |
JP2001282285A (ja) * | 2000-03-31 | 2001-10-12 | Matsushita Electric Ind Co Ltd | 音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置 |
JP2001357064A (ja) * | 2001-04-09 | 2001-12-26 | Toshiba Corp | 情報共有支援システム |
Also Published As
Publication number | Publication date |
---|---|
US20110320464A1 (en) | 2011-12-29 |
EP2418589A4 (en) | 2012-09-12 |
WO2010116785A1 (ja) | 2010-10-14 |
EP2418589A1 (en) | 2012-02-15 |
CN102365639A (zh) | 2012-02-29 |
JPWO2010116785A1 (ja) | 2012-10-18 |
CN102365639B (zh) | 2014-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5300974B2 (ja) | 検索装置 | |
US8380505B2 (en) | System for recognizing speech for searching a database | |
US9418152B2 (en) | System and method for flexible speech to text search mechanism | |
JP5089955B2 (ja) | 音声対話装置 | |
JP4705023B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
KR101309042B1 (ko) | 다중 도메인 음성 대화 장치 및 이를 이용한 다중 도메인 음성 대화 방법 | |
JP4105841B2 (ja) | 音声認識方法、音声認識装置、コンピュータ・システムおよび記憶媒体 | |
US6823493B2 (en) | Word recognition consistency check and error correction system and method | |
US20080255841A1 (en) | Voice search device | |
JPWO2010100977A1 (ja) | 音声認識装置 | |
JPWO2006040971A1 (ja) | 対話支援装置 | |
JP2004133880A (ja) | インデックス付き文書のデータベースとで使用される音声認識器のための動的語彙を構成する方法 | |
JP2001249684A (ja) | 音声認識装置および音声認識方法、並びに記録媒体 | |
JP4755478B2 (ja) | 応答文生成装置、応答文生成方法、そのプログラムおよび記憶媒体 | |
Parlak et al. | Performance analysis and improvement of Turkish broadcast news retrieval | |
JP2013125144A (ja) | 音声認識装置およびそのプログラム | |
JP2007334429A (ja) | キーワード生成方法、文書検索方法、話題範囲推定方法、話題境界推定方法、及びこれらの装置とそのプログラム、その記録媒体 | |
Wang | Experiments in syllable-based retrieval of broadcast news speech in Mandarin Chinese | |
JP6718787B2 (ja) | 日本語音声認識モデル学習装置及びプログラム | |
JP5590549B2 (ja) | 音声検索装置および音声検索方法 | |
JP6126965B2 (ja) | 発話生成装置、方法、及びプログラム | |
Seide et al. | Towards an automated directory information system. | |
JP4987530B2 (ja) | 音声認識辞書作成装置および音声認識装置 | |
JP4733436B2 (ja) | 単語・意味表現組データベースの作成方法、音声理解方法、単語・意味表現組データベース作成装置、音声理解装置、プログラムおよび記憶媒体 | |
WO2009147745A1 (ja) | 検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130618 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5300974 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |