JP5379627B2 - 検索制御装置、検索制御方法、及びプログラム - Google Patents
検索制御装置、検索制御方法、及びプログラム Download PDFInfo
- Publication number
- JP5379627B2 JP5379627B2 JP2009225459A JP2009225459A JP5379627B2 JP 5379627 B2 JP5379627 B2 JP 5379627B2 JP 2009225459 A JP2009225459 A JP 2009225459A JP 2009225459 A JP2009225459 A JP 2009225459A JP 5379627 B2 JP5379627 B2 JP 5379627B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- preliminary
- search result
- query
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 40
- 238000011156 evaluation Methods 0.000 claims description 45
- 239000013598 vector Substances 0.000 claims description 32
- 239000000284 extract Substances 0.000 claims description 7
- 238000012854 evaluation process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1に、本発明の実施の形態に係る検索システムの構成を示す。図1に示すとおり、本実施の形態に係る検索システムは、検索制御装置1、及び検索利用装置3を有する。検索制御装置1は、ウェブ検索サービスが提供されるインターネット等のネットワーク4に接続される。
次に、本実施の形態に係る検索システム(主に検索制御装置1)の処理動作を、図2に示す処理の流れに沿って詳細に説明する。なお、図2には、各ステップを実行する処理の主体と、処理に関わる情報を格納する各記憶部が示されている。
本実施の形態で説明した検索制御装置1によれば、ある検索語から、内容の集中度の高い検索結果を自動的に取得することができる。
3 検索利用装置
4 ネットワーク
11 入力部
12 検索語記憶部
13 検索クエリ生成部
14 検索クエリ記憶部
15 ウェブ検索部
16 予備検索実行部
17 予備検索結果記憶部
18 予備検索結果評価部
19 評価結果記憶部
20 出力部
21 制御部
Claims (14)
- ウェブ検索サービスが提供されるネットワークに接続される検索制御装置であって、
入力された検索語から生成された検索クエリに基づき、予備検索クエリを複数個生成し、各予備検索クエリを用いてウェブ検索を行い、当該ウェブ検索の検索結果を、予備検索結果として予備検索クエリ毎に予備検索結果記憶手段に格納する予備検索手段と、
前記予備検索結果記憶手段から予備検索結果を読み出し、当該予備検索結果の内容の集中度を評価する処理を予備検索クエリ毎に実行し、内容の集中度が最も高い予備検索結果に対応する予備検索クエリを、検索クエリとして検索クエリ記憶手段に格納する予備検索結果評価手段と、
前記検索クエリ記憶手段に格納された前記検索クエリを用いてウェブ検索を行い、当該ウェブ検索の検索結果が所定の条件を満たす場合に、当該検索結果を出力するウェブ検索手段と
を備えたことを特徴とする検索制御装置。 - 前記予備検索手段は、複数の単語を含む前記検索クエリから1つの単語を削除し、1つの単語を削除した当該検索クエリを前記予備検索クエリとすることを特徴とする請求項1に記載の検索制御装置。
- 前記予備検索手段は、前記予備検索クエリに基づく検索結果に含まれる所定数のコンテンツ情報の各々から要約文を抽出し、当該所定数の要約文を前記予備検索結果として前記予備検索結果記憶手段に格納することを特徴とする請求項1または2に記載の検索制御装置。
- 前記予備検索結果評価手段は、前記所定数の要約文の各々から単語ベクトルを抽出し、当該所定数の単語ベクトルをグループ化し、当該グループ化の結果を用いて前記集中度を評価することを特徴とする請求項3に記載の検索制御装置。
- 前記予備検索結果評価手段は、前記所定数に対する各グループ内の単語ベクトルの数の割合を単語ベクトルの出現確率とし、当該出現確率を用いて情報エントロピーを算出することにより前記集中度を評価することを特徴とする請求項4に記載の検索制御装置。
- 前記ウェブ検索手段において、前記所定の条件は、前記検索結果に含まれるコンテンツ情報の件数が所定の閾値以上であることであり、
前記検索結果が当該条件を満たさない場合に、前記ウェブ検索手段で用いた検索クエリに基づき、前記予備検索手段、前記予備検索結果評価手段、及び前記ウェブ検索手段による処理を再度実行することを特徴とする請求項1ないし5のうちいずれか1項に記載の検索制御装置。 - ウェブ検索サービスが提供されるネットワークに接続される検索制御装置が実行する検索制御方法であって、
入力された検索語から生成された検索クエリに基づき、予備検索クエリを複数個生成し、各予備検索クエリを用いてウェブ検索を行い、当該ウェブ検索の検索結果を、予備検索結果として予備検索クエリ毎に予備検索結果記憶手段に格納する予備検索ステップと、
前記予備検索結果記憶手段から予備検索結果を読み出し、当該予備検索結果の内容の集中度を評価する処理を予備検索クエリ毎に実行し、内容の集中度が最も高い予備検索結果に対応する予備検索クエリを、検索クエリとして検索クエリ記憶手段に格納する予備検索結果評価ステップと、
前記検索クエリ記憶手段に格納された前記検索クエリを用いてウェブ検索を行い、当該ウェブ検索の検索結果が所定の条件を満たす場合に、当該検索結果を出力するウェブ検索ステップと
を備えたことを特徴とする検索制御方法。 - 前記予備検索ステップにおいて、前記検索制御装置は、前記予備検索クエリに基づく検索結果に含まれる所定数のコンテンツ情報の各々から要約文を抽出し、当該所定数の要約文を前記予備検索結果として前記予備検索結果記憶手段に格納することを特徴とする請求項7に記載の検索制御方法。
- 前記予備検索結果評価ステップにおいて、前記検索制御装置は、前記所定数の要約文の各々から単語ベクトルを抽出し、当該所定数の単語ベクトルをグループ化し、当該グループ化の結果を用いて前記集中度を評価することを特徴とする請求項8に記載の検索制御方法。
- 前記予備検索結果評価ステップにおいて、前記検索制御装置は、前記所定数に対する各グループ内の単語ベクトルの数の割合を単語ベクトルの出現確率とし、当該出現確率を用いて情報エントロピーを算出することにより前記集中度を評価することを特徴とする請求項9に記載の検索制御方法。
- コンピュータを、ウェブ検索サービスが提供されるネットワークに接続される検索制御装置として機能させるプログラムであって、コンピュータを、
入力された検索語から生成された検索クエリに基づき、予備検索クエリを複数個生成し、各予備検索クエリを用いてウェブ検索を行い、当該ウェブ検索の検索結果を、予備検索結果として予備検索クエリ毎に予備検索結果記憶手段に格納する予備検索手段、
前記予備検索結果記憶手段から予備検索結果を読み出し、当該予備検索結果の内容の集中度を評価する処理を予備検索クエリ毎に実行し、内容の集中度が最も高い予備検索結果に対応する予備検索クエリを、検索クエリとして検索クエリ記憶手段に格納する予備検索結果評価手段、
前記検索クエリ記憶手段に格納された前記検索クエリを用いてウェブ検索を行い、当該ウェブ検索の検索結果が所定の条件を満たす場合に、当該検索結果を出力するウェブ検索手段、
として機能させるプログラム。 - 前記予備検索手段は、前記予備検索クエリに基づく検索結果に含まれる所定数のコンテンツ情報の各々から要約文を抽出し、当該所定数の要約文を前記予備検索結果として前記予備検索結果記憶手段に格納することを特徴とする請求項11に記載のプログラム。
- 前記予備検索結果評価手段は、前記所定数の要約文の各々から単語ベクトルを抽出し、当該所定数の単語ベクトルをグループ化し、当該グループ化の結果を用いて前記集中度を評価することを特徴とする請求項12に記載のプログラム。
- 前記予備検索結果評価手段は、前記所定数に対する各グループ内の単語ベクトルの数の割合を単語ベクトルの出現確率とし、当該出現確率を用いて情報エントロピーを算出することにより前記集中度を評価することを特徴とする請求項13に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009225459A JP5379627B2 (ja) | 2009-09-29 | 2009-09-29 | 検索制御装置、検索制御方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009225459A JP5379627B2 (ja) | 2009-09-29 | 2009-09-29 | 検索制御装置、検索制御方法、及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2011076264A JP2011076264A (ja) | 2011-04-14 |
JP2011076264A5 JP2011076264A5 (ja) | 2012-03-01 |
JP5379627B2 true JP5379627B2 (ja) | 2013-12-25 |
Family
ID=44020197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009225459A Active JP5379627B2 (ja) | 2009-09-29 | 2009-09-29 | 検索制御装置、検索制御方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5379627B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012234133A (ja) * | 2011-05-09 | 2012-11-29 | Mic Ware:Kk | 地図出力装置、地図出力方法、およびプログラム |
US9836452B2 (en) * | 2014-12-30 | 2017-12-05 | Microsoft Technology Licensing, Llc | Discriminating ambiguous expressions to enhance user experience |
KR101953839B1 (ko) * | 2016-12-29 | 2019-03-06 | 서울대학교산학협력단 | 추가 질의에 대한 쌍별 비교 데이터를 이용한 업데이트된 다중랭킹 추정 방법 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3527540B2 (ja) * | 1994-06-15 | 2004-05-17 | 株式会社アドイン研究所 | 情報検索装置 |
JP4092933B2 (ja) * | 2002-03-20 | 2008-05-28 | 富士ゼロックス株式会社 | 文書情報検索装置及び文書情報検索プログラム |
JP2005173847A (ja) * | 2003-12-10 | 2005-06-30 | Fujitsu Ltd | 情報検索装置、情報検索方法、プログラム及び該プログラムを記録した記録媒体 |
JP2007172179A (ja) * | 2005-12-20 | 2007-07-05 | Nec Corp | 意見抽出装置、意見抽出方法、および意見抽出プログラム |
JP4873739B2 (ja) * | 2007-07-09 | 2012-02-08 | 日本電信電話株式会社 | テキストの多重トピック抽出装置、テキストの多重トピック抽出方法、プログラム及び記録媒体 |
US7831610B2 (en) * | 2007-08-09 | 2010-11-09 | Panasonic Corporation | Contents retrieval device for retrieving contents that user wishes to view from among a plurality of contents |
-
2009
- 2009-09-29 JP JP2009225459A patent/JP5379627B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011076264A (ja) | 2011-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5384837B2 (ja) | 文書に注釈を付するシステムと方法 | |
CN109033358B (zh) | 新闻聚合与智能实体关联的方法 | |
US10235681B2 (en) | Text extraction module for contextual analysis engine | |
US9990422B2 (en) | Contextual analysis engine | |
US10430806B2 (en) | Input/output interface for contextual analysis engine | |
JP5222581B2 (ja) | 文書に注釈を付するシステムと方法 | |
US8402034B2 (en) | Using a dynamically-generated content-level newsworthiness rating to provide content recommendations | |
JP4878624B2 (ja) | 文書処理装置および文書処理方法 | |
JP2010501096A (ja) | ラッパー生成およびテンプレート検出の協同最適化 | |
CN108021598B (zh) | 页面抽取模板匹配方法、装置及服务器 | |
Sharma et al. | A systematic review on page ranking algorithms | |
CN103530339A (zh) | 移动应用信息推送方法和装置 | |
JP5103051B2 (ja) | 情報処理システム及び情報処理方法 | |
JP2020098596A (ja) | ウェブページから情報を抽出する方法、装置及び記憶媒体 | |
JP5379627B2 (ja) | 検索制御装置、検索制御方法、及びプログラム | |
JP2007193697A (ja) | 情報収集装置,情報収集方法およびプログラム | |
JPWO2018056299A1 (ja) | 情報収集システム、情報収集方法、及び、プログラム | |
JP5317638B2 (ja) | Web文書主要コンテンツ抽出装置及びプログラム | |
US9195940B2 (en) | Jabba-type override for correcting or improving output of a model | |
JP2006243861A (ja) | 履歴作成装置、活動履歴作成方法、及び活動履歴作成プログラム | |
Bharamagoudar et al. | Literature survey on web mining | |
US9530094B2 (en) | Jabba-type contextual tagger | |
CN112818279A (zh) | 网页相似度的确定方法及确定装置、计算机可读存储介质 | |
Adhiya et al. | AN EFFICIENT AND NOVEL APPROACH FOR WEB SEARCH PERSONALIZATION USING WEB USAGE MINING. | |
JP2010015394A (ja) | リンク先提示装置およびコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120111 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130527 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130805 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130927 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5379627 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |