JP5688754B2 - 情報検索装置及びコンピュータプログラム - Google Patents
情報検索装置及びコンピュータプログラム Download PDFInfo
- Publication number
- JP5688754B2 JP5688754B2 JP2010224871A JP2010224871A JP5688754B2 JP 5688754 B2 JP5688754 B2 JP 5688754B2 JP 2010224871 A JP2010224871 A JP 2010224871A JP 2010224871 A JP2010224871 A JP 2010224871A JP 5688754 B2 JP5688754 B2 JP 5688754B2
- Authority
- JP
- Japan
- Prior art keywords
- word string
- word
- occurrence
- search
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004590 computer program Methods 0.000 title claims description 4
- 238000013507 mapping Methods 0.000 claims description 55
- 238000000605 extraction Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 5
- 238000000034 method Methods 0.000 description 28
- 238000012545 processing Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 21
- 230000014509 gene expression Effects 0.000 description 15
- 230000004913 activation Effects 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000013075 data extraction Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 241000102542 Kara Species 0.000 description 1
- 229920003266 Leaf® Polymers 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000013549 information retrieval technique Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Description
図1を参照して、本発明の1実施の形態に係る情報検索装置システム20は、インターネット上のWebサイトから多数の文を収集することにより構築されたWebコーパス32と、装置の設置されている位置の位置情報を出力するGPS(Global Positioning System)装置38と、Webコーパス32及びGPS装置38に接続され、利用者により入力される自然言語文のテキストから、その利用者が必要としている情報を的確に検索し、ブラウザ40にその検索結果を表示させる処理を行なう情報検索装置30とを含む。情報検索装置30に入力される自然言語文は、本実施の形態では、利用者の音声による発話34を、音声認識装置36が認識し自然言語の文字列として出力したテキストデータである。
以上、構成について詳細に説明した情報検索装置システム20は以下のように動作する。なお、この処理に先立ち、Webコーパス32にはWebから収集した大量の機械可読な文章が蓄積されているものとする。
図10に示す情報検索サーバコンピュータ330は、図1に示す情報検索装置システム20のうち、音声認識装置36を除いた構成を持つ。ハードウェア的には、情報検索サーバコンピュータ330は、コンピュータハードウェアと、そのコンピュータハードウェアにより実行されるプログラムと、コンピュータハードウェアに格納されるデータとにより実現できる。プログラムの主要な部分の制御構造については図5〜図9に示し、データの例は図2〜図4に示した。
30 情報検索装置
32 Webコーパス
34 発話
36 音声認識装置
38 GPS装置
40 ブラウザ
50 共起データ作成装置
52 共起DB
54 シソーラス
56 対象文フィルタ
58 共起データ検索部
60 関連共起データ検索部
62 サービス名/URL対照DB
64 サービス名推定部
66 マッピングコーパス記憶部
68 クエリ作成部
70 ブラウザ起動処理部
Claims (6)
- ある単語列と他の単語列とを含む単語列対と、当該単語列対が一定の構文構造を有する1つの文内で共起する頻度である共起頻度とを多数記憶する共起データベースと、
自然言語のテキストが入力されたことに応答して、入力されるテキストから1または複数の単語列を抽出するための単語列抽出手段と、
前記単語列抽出手段から出力される1または複数の単語列の各々について、前記共起データベースを参照して、当該単語列を起点とする共起チェーン内の単語列であって、構文構造に関する所定の条件を満たす単語列を抽出するための共起データ抽出手段と、
ネットワークを介して提供されるサービスのサービス名と、当該サービスにアクセスするためのクエリのテンプレートとを互いに関連付けて複数個記憶するためのサービス名データベースと、
前記共起データ抽出手段により抽出された単語列を含むサービス名と関連付けられたクエリのテンプレートを前記サービス名データベースから読出し、当該単語列の属する共起チェーンに基づいて当該サービスを利用するためのクエリを作成するためのクエリ作成手段と含む、情報検索装置。 - 請求項1に記載の情報検索装置であって、
前記共起データ抽出手段は、
前記単語列抽出手段から出力される1または複数の単語列の各々について、前記共起データベースを参照して、当該単語列を含む第1の単語列対を検索するための第1の検索手段と、
前記第1の検索手段により検索された1または複数個の前記第1の単語列対において、前記単語列抽出手段から出力された単語列と対になっている単語列を抽出し、当該抽出された単語列を含む第2の単語列対を前記共起データベースから検索するための第2の検索手段と、
前記第2の検索手段により検索された前記第2の単語列対において、前記第2の検索手段による検索で用いられた単語列と対を成す、特定の構文構造を形成する単語列を特定し、当該単語列内の名詞または名詞句を前記クエリ作成手段に前記単語列として与えるための単語列特定手段とを含む、情報検索装置。 - 請求項2に記載の情報検索装置であって、
前記単語列特定手段は、前記第2の検索手段により検索された前記第2の単語列対において、前記第2の検索手段による検索で用いられた単語列と対を成す単語列に含まれる、所定の単語列を伴う名詞または名詞句であって、前記特定の構文構造を形成し、かつ前記サービス名データベースに含まれるサービス名と一致するものを特定し、当該名詞または名詞句を前記クエリ作成手段に前記単語列として与えるための手段を含む、情報検索装置。 - 請求項1に記載の情報検索装置であって、
前記クエリのテンプレートの各々は、検索のための情報が入力される入力フィールドを持ち、
前記サービス名データベースは、ネットワークを介して提供されるサービスのサービス名と、当該サービスにアクセスするためのクエリのテンプレートと、当該テンプレートに対応する自然言語の文であって、前記テンプレートの入力フィールドにマッピングされる、変数フィールドを含むマッピング文とを互いに関連付けて複数個記憶するためのマッピング文コーパスデータベースを含み、
前記クエリ作成手段は、
前記共起データ抽出手段により抽出された単語列を含むサービス名をキーにしてマッピング文及びクエリテンプレートを前記マッピング文コーパスデータベースから読出すための読出手段と、
前記共起チェーンに含まれる単語列と、前記テンプレート読出手段により読出されたマッピング文との比較により、前記共起チェーンに含まれる単語のうち、マッピング文に含まれる変数フィールドに対応する単語列を特定し、さらに当該変数フィールドがマッピングされた入力フィールドに当該単語列を代入することにより、前記読出手段により読出されたサービス名によるサービスを利用するためのクエリを作成するための手段とを含む、情報検索装置。 - 請求項1に記載の情報検索装置であって、
前記共起データベースに含まれる単語列内の単語には、それぞれ単語クラスを表す単語クラス情報が付されており、
前記共起データ抽出手段は、
各単語の単語クラスを特定するための単語クラス辞書と、
前記単語列抽出手段から出力される1または複数の単語列の各々について、前記共起データベース及び前記単語クラス辞書を参照して、当該単語列を起点とする共起チェーン内の単語列であって、前記単語列に含まれる単語の単語クラスと共通する単語クラスの単語を含む単語列を抽出するための手段とを含む、情報検索装置。 - コンピュータを、
ある単語列と他の単語列とを含む単語列対と、当該単語列対が一定の構文構造を有する1つの文内で共起する頻度である共起頻度とを多数記憶する共起データベースと、
自然言語のテキストが入力されたことに応答して、入力されるテキストから1または複数の単語列を抽出するための単語列抽出手段と、
前記単語列抽出手段から出力される1または複数の単語列の各々について、前記共起データベースを参照して、当該単語列を起点とする共起チェーン内の単語列であって、構文構造に関する所定の条件を満たす単語列を抽出するための共起データ抽出手段と、
ネットワークを介して提供されるサービスのサービス名と、当該サービスにアクセスするためのURLとを互いに関連付けて複数個記憶するためのサービス名データベースと、
前記共起データ抽出手段により抽出された単語列を含むサービス名と関連付けられたURLを前記サービス名データベースから読出し、当該単語列の属する共起チェーンに基づいて当該URLで提供されるサービスを利用するためのクエリを作成するためのクエリ作成手段として機能させる、コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010224871A JP5688754B2 (ja) | 2010-10-04 | 2010-10-04 | 情報検索装置及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010224871A JP5688754B2 (ja) | 2010-10-04 | 2010-10-04 | 情報検索装置及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012079160A JP2012079160A (ja) | 2012-04-19 |
JP5688754B2 true JP5688754B2 (ja) | 2015-03-25 |
Family
ID=46239309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010224871A Active JP5688754B2 (ja) | 2010-10-04 | 2010-10-04 | 情報検索装置及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5688754B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019014272A1 (en) * | 2017-07-10 | 2019-01-17 | Findo, Inc. | AUTOMATED JOB STAFF ASSISTANT |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103425704B (zh) | 2012-05-24 | 2017-07-21 | 阿里巴巴集团控股有限公司 | 应用界面提供方法及装置 |
JP6027473B2 (ja) * | 2013-03-25 | 2016-11-16 | 株式会社Nttドコモ | コンテンツ検索結果提供装置、コンテンツ検索結果提供方法、及びコンテンツ検索結果提供システム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2850952B2 (ja) * | 1996-06-17 | 1999-01-27 | 日本電気株式会社 | 文書検索方法および装置 |
JP2894301B2 (ja) * | 1996-11-15 | 1999-05-24 | 日本電気株式会社 | 文脈情報を用いた文書検索方法および装置 |
JP3160265B2 (ja) * | 1998-06-10 | 2001-04-25 | 日本電信電話株式会社 | 半構造化文書情報統合検索装置および半構造化文書情報抽出装置、その方法、ならびにそのプログラムを格納する記録媒体 |
US6480843B2 (en) * | 1998-11-03 | 2002-11-12 | Nec Usa, Inc. | Supporting web-query expansion efficiently using multi-granularity indexing and query processing |
JP2003122754A (ja) * | 2001-10-15 | 2003-04-25 | Fujitsu Ltd | 検索支援装置 |
-
2010
- 2010-10-04 JP JP2010224871A patent/JP5688754B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019014272A1 (en) * | 2017-07-10 | 2019-01-17 | Findo, Inc. | AUTOMATED JOB STAFF ASSISTANT |
Also Published As
Publication number | Publication date |
---|---|
JP2012079160A (ja) | 2012-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11475319B2 (en) | Extracting facts from unstructured information | |
US10997370B2 (en) | Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time | |
KR101858206B1 (ko) | 지능형 챗봇 기반 대화형 현장 지원 서비스 제공 방법 | |
CN110309393B (zh) | 数据处理方法、装置、设备及可读存储介质 | |
US9448995B2 (en) | Method and device for performing natural language searches | |
US10878190B2 (en) | Structured dictionary population utilizing text analytics of unstructured language dictionary text | |
KR101646754B1 (ko) | 모바일 시멘틱 검색 장치 및 그 방법 | |
RU2488877C2 (ru) | Идентификация семантических взаимоотношений в косвенной речи | |
CA2774278C (en) | Methods and systems for extracting keyphrases from natural text for search engine indexing | |
US20110301941A1 (en) | Natural language processing method and system | |
JP2008529179A (ja) | 自然言語によってモバイル情報にアクセスするための方法及び装置 | |
US10606903B2 (en) | Multi-dimensional query based extraction of polarity-aware content | |
JP4967037B2 (ja) | 情報検索装置、情報検索方法、端末装置、およびプログラム | |
JP5688754B2 (ja) | 情報検索装置及びコンピュータプログラム | |
JP2007193697A (ja) | 情報収集装置,情報収集方法およびプログラム | |
KR101478016B1 (ko) | 공기 정보를 이용한 문장 클러스터 기반의 정보 검색 장치 및 방법 | |
WO2012091541A1 (en) | A semantic web constructor system and a method thereof | |
KR20080049428A (ko) | 질의어 분석을 이용한 유사 검색 서비스 제공 방법 및 장치 | |
JP2010266971A (ja) | 端末装置 | |
JP5187187B2 (ja) | 体験情報検索システム | |
JP2011086156A (ja) | 漏洩情報追跡システムおよび漏洩情報追跡プログラム | |
JP2005250693A (ja) | 文字情報分類プログラム | |
JP2001101184A (ja) | 構造化文書生成方法及び装置及び構造化文書生成プログラムを格納した記憶媒体 | |
JP5559725B2 (ja) | 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供方法 | |
CN110263341B (zh) | 一种从文本中挖掘和定位个人能力的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130927 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140401 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150122 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5688754 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |