JP4287386B2 - 情報検索システム、方法及びプログラム - Google Patents
情報検索システム、方法及びプログラム Download PDFInfo
- Publication number
- JP4287386B2 JP4287386B2 JP2005024360A JP2005024360A JP4287386B2 JP 4287386 B2 JP4287386 B2 JP 4287386B2 JP 2005024360 A JP2005024360 A JP 2005024360A JP 2005024360 A JP2005024360 A JP 2005024360A JP 4287386 B2 JP4287386 B2 JP 4287386B2
- Authority
- JP
- Japan
- Prior art keywords
- text information
- word
- search
- information
- clue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 20
- 238000012937 correction Methods 0.000 claims description 26
- 230000014509 gene expression Effects 0.000 claims description 26
- 238000012545 processing Methods 0.000 description 22
- 230000004044 response Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 239000008267 milk Substances 0.000 description 5
- 210000004080 milk Anatomy 0.000 description 5
- 235000013336 milk Nutrition 0.000 description 5
- 238000010438 heat treatment Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 235000015241 bacon Nutrition 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 235000013550 pizza Nutrition 0.000 description 2
- 235000010724 Wisteria floribunda Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、本発明の第1実施形態に従う情報検索システムを示すブロック図である。図1に示す情報検索システムは、ユーザから音声入力された質問を音声認識してテキスト情報に変換し、変換したテキスト情報に基づいて質問に対する回答を検索し、検索結果をユーザに提供するシステムである。情報検索システムでは、予め、文書解析部101により、検索対象の文書が事前に登録された専用の文書データベース(以下DBと呼ぶ)10の文書データ中から、検索語になりうる語と回答になりうる候補の表現(回答候補)との共起関係が解析される。その後、文書解析部101は、前記回答候補を導くための手がかり語と検索語の間の共起情報を共起情報データベース(以下DBと呼ぶ)11に格納する。尚、「共起関係」とは、共起関係にある単語が近傍に同時に現れるという関係を示している。情報検索システムは、これらの手がかり語及び検索語の中から質問中に現れた語を用いて音声入力された質問に対する回答を検索する。
類似度S=1―(d/L)
で求める。
次に、第2実施形態の情報検索システムについて説明する。第2実施形態の情報検索システムが、第1の実施例の情報検索システムと大きく異なる点は、文書解析部101音声認識の次候補情報を用いて、次候補中にある手がかり語候補を音声認識の第1の候補と差し替える点である。即ち、第2実施形態の情報検索システムは、手がかり語や検索語などの共起情報を追加するのではなく、テキスト情報の一部を共起情報に基づき修正する点で第1実施形態の情報検索システムと異なる。
10・・・文書DB;
11、12・・・共起情報DB;
101・・・文書解析部;
102・・・音声認識部;
103・・・質問修正部;
104・・・検索部;
105・・・制御部;
106・・・表示部;
201・・・音声入力装置;
202・・・ポインティングデバイス;
203・・・表示装置;
204・・・CPU;
205・・・メモリ;
206・・・ディスク;
301・・・クライアント端末;
302・・・サーバ;
104・・・回答提示部;
Claims (7)
- 文書データベースに記憶されている各文書中の回答候補となる単位表現を含む文字列から検索語として抽出された予め定められた品詞の語と、前記単位表現の前に「何」を付けることにより生成された手がかり語とを対応付けた共起情報を記憶した共起情報記憶手段と、
音声として入力された質問に対して音声認識を行い、テキスト情報を生成する音声認識手段と、
前記テキスト情報から前記検索語を検出し、検出された検索語に対応する複数の手がかり語から前記テキスト情報中の語との類似度が閾値以上の手がかり語を選択し、当該選択された手がかり語を前記テキスト情報に付加することにより前記テキスト情報を修正する修正手段と、
前記修正されたテキスト情報を用いて前記文書データベースを検索し、検索結果として得られた各文書から、前記修正されたテキスト情報中の前記手がかり語に含まれる前記単位表現の種類と合致する語を回答として抽出する検索手段と、
を具備する情報検索システム。 - 前記共起情報記憶手段は、一つの手がかり語に対応付けて複数の検索語を記憶し、一つの検索語に対応付けて複数の手がかり語を記憶する請求項1記載の情報検索システム。
- 前記修正されたテキスト情報と前記回答とを併せて表示する表示手段をさらに具備する請求項1記載の情報検索システム。
- 前記表示手段は、前記回答を該回答が含まれる前記文書データベース内の文書データとリンクさせて表示する請求項3記載の情報検索システム。
- 文書データベースに記憶されている各文書中の回答候補となる単位表現を含む文字列から検索語として抽出された予め定められた品詞の語と、前記単位表現の前に「何」を付けることにより生成された手がかり語とを対応付けた共起情報を記憶した共起情報記憶手段と、
音声として入力された質問に対して音声認識を行い、テキスト情報を生成する音声認識手段と、
前記テキスト情報を構成する語について、前記音声認識手段で得られた音声認識の次候補の文字列を記憶する次候補記憶手段と、
前記テキスト情報から検出された前記検索語に対応する手がかり語を含まない前記テキスト情報に対し、前記検出された検索語に対応する複数の手がかり語から、前記テキスト情報中の語の前記次候補との類似度が閾値以上の手がかり語を選択するとともに、前記テキスト情報中の当該語を当該次候補で置き換えることにより前記テキスト情報を修正する修正手段と、
前記修正されたテキスト情報を用いて前記文書データベースを検索し、検索結果として得られた各文書から、当該テキスト情報中の前記手がかり語に含まれる前記単位表現の種類と合致する語を回答として抽出する検索手段と、
具備する情報検索システム。 - 文書データベースに記憶されている各文書中の回答候補となる単位表現を含む文字列から検索語として抽出された予め定められた品詞の語と、前記単位表現の前に「何」を付けることにより生成された手がかり語とを対応付けた共起情報を記憶した共起情報記憶手段と、
音声として入力された質問に対して音声認識を行い、テキスト情報を生成する音声認識手段と、
前記テキスト情報と前記共起情報とを用いて、前記音声認識手段で得られたテキスト情報を、前記入力された質問に対する回答を得るための手がかり語を含むテキスト情報に修正する修正手段と、
前記修正されたテキスト情報を用いて前記文書データベースを検索し、検索結果として得られた文書から、前記修正されたテキスト情報中の前記手がかり語を用いて、前記入力された質問に対する回答を求める検索手段と、
を備える情報検索システムにおける情報検索方法であって、
前記音声認識手段が、音声として入力された質問に対して音声認識を行い、テキスト情報を生成するステップと、
前記選択手段が、前記テキスト情報から前記検索語を検出するステップと、
前記選択手段が、検出された検索語に対応する複数の手がかり語から前記テキスト情報中の語との類似度が閾値以上の手がかり語を選択し、当該選択された手がかり語を前記テキスト情報に付加することにより前記テキスト情報を修正するステップと、
前記検索手段が、前記修正されたテキスト情報を用いて前記文書データベースを検索し、検索結果として得られた各文書から、前記修正されたテキスト情報中の前記手がかり語に含まれる前記単位表現の種類と合致する語を回答として抽出するステップと、
を含む情報検索方法。 - コンピュータを、
文書データベースに記憶されている各文書中の回答候補となる単位表現を含む文字列から検索語として抽出された予め定められた品詞の語と、前記単位表現の前に「何」を付けることにより生成された手がかり語とを対応付けた共起情報を記憶した共起情報記憶手段、
音声として入力された質問に対して音声認識を行い、テキスト情報を生成する音声認識手段、
前記テキスト情報から前記検索語を検出し、検出された検索語に対応する複数の手がかり語から前記テキスト情報中の語との類似度が閾値以上の手がかり語を選択し、当該選択された手がかり語を前記テキスト情報に付加することにより前記テキスト情報を修正する選択手段、
前記テキスト情報を用いて前記文書データベースを検索し、検索結果として得られた各文書から、前記修正されたテキスト情報中の前記手がかり語に含まれる前記単位表現の種類と合致する語を回答として抽出する検索手段、
として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005024360A JP4287386B2 (ja) | 2005-01-31 | 2005-01-31 | 情報検索システム、方法及びプログラム |
US11/230,540 US7818173B2 (en) | 2005-01-31 | 2005-09-21 | Information retrieval system, method, and program |
CNA2005101084823A CN1815471A (zh) | 2005-01-31 | 2005-09-30 | 信息检索系统、方法和程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005024360A JP4287386B2 (ja) | 2005-01-31 | 2005-01-31 | 情報検索システム、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006209022A JP2006209022A (ja) | 2006-08-10 |
JP4287386B2 true JP4287386B2 (ja) | 2009-07-01 |
Family
ID=36757746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005024360A Active JP4287386B2 (ja) | 2005-01-31 | 2005-01-31 | 情報検索システム、方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US7818173B2 (ja) |
JP (1) | JP4287386B2 (ja) |
CN (1) | CN1815471A (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102005005536A1 (de) * | 2005-02-07 | 2006-08-10 | Sick Ag | Codeleser |
JP2007219955A (ja) * | 2006-02-17 | 2007-08-30 | Fuji Xerox Co Ltd | 質問応答システム、質問応答処理方法及び質問応答プログラム |
US8098934B2 (en) * | 2006-06-29 | 2012-01-17 | Google Inc. | Using extracted image text |
JP4398966B2 (ja) * | 2006-09-26 | 2010-01-13 | 株式会社東芝 | 機械翻訳を行う装置、システム、方法およびプログラム |
JP2008140168A (ja) * | 2006-12-01 | 2008-06-19 | Nippon Telegr & Teleph Corp <Ntt> | シンボル列集合類似度算出方法及びメタデータ生成装置及びメタデータ付与装置及びプログラム |
US8116746B2 (en) | 2007-03-01 | 2012-02-14 | Microsoft Corporation | Technologies for finding ringtones that match a user's hummed rendition |
JP5697860B2 (ja) * | 2009-09-09 | 2015-04-08 | クラリオン株式会社 | 情報検索装置,情報検索方法及びナビゲーションシステム |
US20110208718A1 (en) * | 2010-02-23 | 2011-08-25 | Yahoo!, Inc., a Delaware corporation | Method and system for adding anchor identifiers to search results |
JP5139499B2 (ja) * | 2010-10-26 | 2013-02-06 | ヤフー株式会社 | 抽出装置、抽出方法、プログラム、及びプログラムを配信する情報処理装置 |
JP5574992B2 (ja) * | 2011-01-08 | 2014-08-20 | ヴイアールアイ株式会社 | 情報提供システム |
JP5636309B2 (ja) * | 2011-02-18 | 2014-12-03 | 株式会社東芝 | 音声対話装置および音声対話方法 |
JP5824829B2 (ja) * | 2011-03-15 | 2015-12-02 | 富士通株式会社 | 音声認識装置、音声認識方法及び音声認識プログラム |
US8650031B1 (en) | 2011-07-31 | 2014-02-11 | Nuance Communications, Inc. | Accuracy improvement of spoken queries transcription using co-occurrence information |
US9257115B2 (en) * | 2012-03-08 | 2016-02-09 | Facebook, Inc. | Device for extracting information from a dialog |
CN102650960B (zh) * | 2012-03-31 | 2015-04-15 | 北京奇虎科技有限公司 | 一种消除终端设备故障的方法及装置 |
CN102736959B (zh) * | 2012-06-07 | 2015-10-14 | 北京奇虎科技有限公司 | 确定终端故障解决方案的方法及装置 |
US10585568B1 (en) | 2013-02-22 | 2020-03-10 | The Directv Group, Inc. | Method and system of bookmarking content in a mobile device |
CN105550308B (zh) * | 2015-12-14 | 2019-07-26 | 联想(北京)有限公司 | 一种信息处理方法,检索方法及电子设备 |
CN106059895A (zh) * | 2016-04-25 | 2016-10-26 | 上海云睦网络科技有限公司 | 协同任务生成方法、装置和系统 |
CN108153801B (zh) * | 2016-12-06 | 2023-05-23 | 松下知识产权经营株式会社 | 信息处理方法、信息处理装置以及记录介质 |
CN107808007A (zh) * | 2017-11-16 | 2018-03-16 | 百度在线网络技术(北京)有限公司 | 信息处理方法和装置 |
CN110111793B (zh) * | 2018-02-01 | 2023-07-14 | 腾讯科技(深圳)有限公司 | 音频信息的处理方法、装置、存储介质及电子装置 |
JP7243106B2 (ja) * | 2018-09-27 | 2023-03-22 | 富士通株式会社 | 修正候補提示方法、修正候補提示プログラムおよび情報処理装置 |
US20230139831A1 (en) * | 2020-09-30 | 2023-05-04 | DataInfoCom USA, Inc. | Systems and methods for information retrieval and extraction |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3758241B2 (ja) * | 1996-08-01 | 2006-03-22 | 三菱電機株式会社 | 音声情報検索装置 |
JPH1055196A (ja) * | 1996-08-09 | 1998-02-24 | Ricoh Co Ltd | 音声認識装置および方法、情報記憶媒体 |
JPH10240739A (ja) * | 1997-02-27 | 1998-09-11 | Toshiba Corp | 情報検索装置および情報検索方法 |
JP2000276482A (ja) * | 1999-03-25 | 2000-10-06 | Matsushita Electric Ind Co Ltd | 文書検索装置及び文書検索方法 |
US20010039493A1 (en) * | 2000-04-13 | 2001-11-08 | Pustejovsky James D. | Answering verbal questions using a natural language system |
JP2002063209A (ja) | 2000-08-22 | 2002-02-28 | Sony Corp | 情報処理装置および方法、情報システム、並びに記録媒体 |
JP3682958B2 (ja) | 2000-10-13 | 2005-08-17 | 日本電信電話株式会社 | 音声入力された複合名詞の検索装置、検索方法およびデータベース |
JP2002366543A (ja) * | 2001-06-06 | 2002-12-20 | Matsushita Electric Ind Co Ltd | 文書作成システム |
US8666983B2 (en) * | 2003-06-13 | 2014-03-04 | Microsoft Corporation | Architecture for generating responses to search engine queries |
JP3944159B2 (ja) * | 2003-12-25 | 2007-07-11 | 株式会社東芝 | 質問応答システムおよびプログラム |
-
2005
- 2005-01-31 JP JP2005024360A patent/JP4287386B2/ja active Active
- 2005-09-21 US US11/230,540 patent/US7818173B2/en not_active Expired - Fee Related
- 2005-09-30 CN CNA2005101084823A patent/CN1815471A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20060173682A1 (en) | 2006-08-03 |
JP2006209022A (ja) | 2006-08-10 |
CN1815471A (zh) | 2006-08-09 |
US7818173B2 (en) | 2010-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4287386B2 (ja) | 情報検索システム、方法及びプログラム | |
RU2458391C2 (ru) | Проверка ошибок сочетаний слов на базе сети интернет | |
US7149970B1 (en) | Method and system for filtering and selecting from a candidate list generated by a stochastic input method | |
US9213758B2 (en) | Method and apparatus for responding to an inquiry | |
US8341520B2 (en) | Method and system for spell checking | |
US7729913B1 (en) | Generation and selection of voice recognition grammars for conducting database searches | |
JP3981734B2 (ja) | 質問応答システムおよび質問応答処理方法 | |
US20040093567A1 (en) | Spelling and grammar checking system | |
US20170270928A1 (en) | Query Rewrite Corrections | |
US20110270603A1 (en) | Method and Apparatus for Language Processing | |
JPWO2018221120A1 (ja) | 表示装置 | |
US10679609B2 (en) | Biasing voice correction suggestions | |
US20100070263A1 (en) | Speech data retrieving web site system | |
US20120109623A1 (en) | Stimulus Description Collections | |
JP6404511B2 (ja) | 翻訳支援システム、翻訳支援方法、および翻訳支援プログラム | |
US20200278971A1 (en) | Document retrieval apparatus and document retrieval method | |
JP6710007B1 (ja) | 対話管理サーバ、対話管理方法、及びプログラム | |
KR102552811B1 (ko) | 클라우드 기반 문법 교정 서비스 제공 시스템 | |
JP2006221532A (ja) | 異表記展開方法、辞書登録方法および言語解析方法ならびにプログラム | |
JPH0563831B2 (ja) | ||
JPH11272671A (ja) | 機械翻訳装置及び機械翻訳方法 | |
JP2002014751A (ja) | オンラインヘルプシステム | |
JP3501240B2 (ja) | 文書作成支援装置 | |
JP5032453B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP2003132059A (ja) | 言語文を用いた検索装置、検索システム、検索方法、プログラム、および記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080901 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080916 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090317 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090326 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120403 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4287386 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120403 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130403 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140403 Year of fee payment: 5 |