JP4912384B2 - 文書検索装置、文書検索方法、および文書検索プログラム - Google Patents
文書検索装置、文書検索方法、および文書検索プログラム Download PDFInfo
- Publication number
- JP4912384B2 JP4912384B2 JP2008297847A JP2008297847A JP4912384B2 JP 4912384 B2 JP4912384 B2 JP 4912384B2 JP 2008297847 A JP2008297847 A JP 2008297847A JP 2008297847 A JP2008297847 A JP 2008297847A JP 4912384 B2 JP4912384 B2 JP 4912384B2
- Authority
- JP
- Japan
- Prior art keywords
- query
- search
- search result
- extended
- information storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
"Improving Mobile Web−IR Using Access Concentration Sites in Search Results."Masaya Murata,et al.Proc.of WISE2008,pp 221−234,2008.
前記文書検索装置1が実行する一連の処理は、主にオフラインで行われる情報要求生成フェーズと、オンラインで行われる検索実行フェーズから構成されている。以下、両フェーズの処理について、図4〜8に基づき説明する。
情報要求生成フェーズでは、クリックログを解析して、クエリの情報要求および該クエリの検索結果が満たす情報要求を生成する。この情報要求生成フェーズは通常、前記ユーザ端末13と接続されないオフライン状態で、ユーザからの検索要求を受け付ける前に行われる。
前記クエリ情報要求生成部114は、前記クエリqに対する検索結果集合113の各検索結果sri(search result)(i=1,…,k)において、そのタイトルとスニペットを形態素解析して内容語(キーワード)tを抽出し、このキーワード集合をベクトルV(sri)で表現する。
前記検索結果情報要求生成部115は、前記クリックログを解析することで、前記検索結果集合113のある検索結果srがクリックされたときに投入されたクエリの集合qj(j=1,…,m)を求める。また、該集合の各クエリから検索結果srに対するアクセス集中度合ACD(sr,qj)を求める。
検索実行フェーズでは、情報要求生成フェーズで生成したクエリおよび検索結果の情報要求を用いて、ユーザの投入したクエリを拡張するとともに、該拡張クエリに対する検索結果も拡張する。そして、拡張されたクエリと検索結果との間の関係性に基づき検索結果を並べ替え、最終検索結果を生成している。この検索実行フェーズは、前記ユーザ端末13と接続されたオンライン状態で行われる。
以上のように、文書検索システムに本発明の前記文書検索装置1を配置し、検索結果の精度評価を行った実験の結果を表1に示す。
13…ユーザ端末
100…検索エンジン
101…World Wide WebもしくはMobile Web
102…インデックスDB
110…ログDB
111…解析処理部
112…頻度上位クエリ
113…検索結果集合
114…クエリ情報要求生成部
115…検索結果情報要求生成部
116…検索結果情報要求DB
117…クエリ情報要求DB
118…クエリ
119…照合処理部
120…クエリの情報要求
121…クエリとクエリの情報要求(拡張クエリ)
122…検索結果
123…ランキング処理部(検索結果処理手段)
124…最終検索結果
125…支援処理部
130…ユーザインタフェース
131…クエリ入力画面
132…検索結果表示画面
133…検索ログ記録部
Claims (3)
- ユーザ端末から検索指示されたクエリを含む電子文書を検索するときに検索エンジンの検索ログを利用する文書検索装置であって、
前記検索ログに含まれたクエリに応じた検索結果のタイトルおよび概要文から拡張語を生成し、該拡張語を前記クエリの拡張情報として保存するクエリ情報保存手段と、
前記検索ログからクリックされた検索結果の検索時のクエリを判別し、該クエリに関連する拡張語を前記クエリ情報保存手段から求め、検索結果がクリックされたときに投入されたクエリの拡張語群を検索結果の拡張情報として保存する検索結果情報保存手段と、
ユーザ端末から検索指示されたクエリについて、クエリの拡張語を前記クエリ情報保存手段から取得し、ユーザ端末に送る照合処理手段と、
前記検索指示されたクエリを前記拡張語で拡張した拡張クエリの検索で得られた検索結果に対して、前記検索結果情報保存手段に保存された拡張語群を付与して検索結果を拡張し、拡張された検索結果を前記拡張クエリとの類似度により並び替え、この並び替えた結果をリスト化した最終検索結果を前記ユーザ端末に送る検索結果処理手段と、
を備えることを特徴とする文書検索装置。 - ユーザ端末から検索指示されたクエリを含む電子文書を検索するときに検索エンジンの検索ログを利用する文書検索方法であって、
前記検索ログに含まれたクエリに応じた検索結果のタイトルおよび概要文から拡張語を生成し、該拡張語をクエリ情報保存手段に前記クエリの拡張情報として保存するクエリ情報保存ステップと、
検索結果情報保存手段が、前記検索ログからクリックされた検索結果の検索時のクエリを判別し、該クエリに関連する拡張語を前記クエリ情報保存手段から求め、検索結果がクリックされたときに投入されたクエリの拡張語群を検索結果の拡張情報として保存する検索結果情報保存ステップと、
照合処理手段が、ユーザ端末から検索指示されたクエリについてクエリの拡張語を前記クエリ情報保存手段から取得し、ユーザ端末に送る照合処理ステップと、
検索結果処理手段が、前記検索指示されたクエリを前記拡張語で拡張した拡張クエリの検索で得られた検索結果に対して、前記検索結果情報保存手段に保存された拡張語群を付与して検索結果を拡張し、拡張された検索結果を前記拡張クエリとの類似度により並び替え、この並び替えた結果をリスト化した最終検索結果を前記ユーザ端末に送る検索結果処理ステップと、
を有することを特徴とする文書検索方法。 - 請求項1記載の文書検索装置を構成する各手段としてコンピュータを機能させることを特徴とする文書検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008297847A JP4912384B2 (ja) | 2008-11-21 | 2008-11-21 | 文書検索装置、文書検索方法、および文書検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008297847A JP4912384B2 (ja) | 2008-11-21 | 2008-11-21 | 文書検索装置、文書検索方法、および文書検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010123036A JP2010123036A (ja) | 2010-06-03 |
JP4912384B2 true JP4912384B2 (ja) | 2012-04-11 |
Family
ID=42324309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008297847A Active JP4912384B2 (ja) | 2008-11-21 | 2008-11-21 | 文書検索装置、文書検索方法、および文書検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4912384B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102419755B (zh) | 2010-09-28 | 2013-04-24 | 阿里巴巴集团控股有限公司 | 一种搜索结果的排序方法和装置 |
JP5043209B2 (ja) * | 2011-03-04 | 2012-10-10 | 楽天株式会社 | 集合拡張処理装置、集合拡張処理方法、プログラム、及び、記録媒体 |
CN102207962B (zh) * | 2011-05-25 | 2013-03-13 | 盛乐信息技术(上海)有限公司 | 一种动态搜索引擎及方法 |
TW201435627A (zh) * | 2013-03-12 | 2014-09-16 | Hon Hai Prec Ind Co Ltd | 搜索優化系統及方法 |
JP6160018B1 (ja) * | 2016-08-26 | 2017-07-12 | ヤフー株式会社 | 情報解析装置、情報解析方法、および情報解析プログラム |
-
2008
- 2008-11-21 JP JP2008297847A patent/JP4912384B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010123036A (ja) | 2010-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9652537B2 (en) | Identifying terms associated with queries | |
KR101063364B1 (ko) | 웹 크롤링 프로세스 동안 웹 사이트에 우선순위를 부여하기위한 시스템 및 방법 | |
TWI524193B (zh) | 用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法 | |
US8332393B2 (en) | Search session with refinement | |
US7668887B2 (en) | Method, system and software product for locating documents of interest | |
EP2395443A2 (en) | Query rewriting with entity detection | |
US9251249B2 (en) | Entity summarization and comparison | |
US20090313220A1 (en) | Expansion of Search Result Information | |
US20120131008A1 (en) | Indentifying referring expressions for concepts | |
KR20110050478A (ko) | 검색 질의에 응답하여 디스커션 스레드에 대한 포스트를 제공하는 방법 및 시스템 | |
KR20080024208A (ko) | 검색 결과를 제공하기 위한 시스템 및 방법 | |
CN102737021B (zh) | 搜索引擎及其实现方法 | |
US20110208715A1 (en) | Automatically mining intents of a group of queries | |
JP4896132B2 (ja) | 情報価値を反映した情報検索方法及びその装置 | |
JP2010061420A (ja) | 商品情報検索装置、方法及びシステム | |
KR100954842B1 (ko) | 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체 | |
JP4912384B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP4759600B2 (ja) | 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体 | |
JP2013168177A (ja) | 情報提供プログラム、情報提供装置および検索サービスの提供方法 | |
KR100869545B1 (ko) | 검색 히스토리를 생성하는 되풀이 검색시스템 | |
JP2000331020A (ja) | 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体 | |
JP5315726B2 (ja) | 情報提供方法、情報提供装置、および情報提供プログラム | |
Macdonald et al. | The influence of the document ranking in expert search | |
JP5416552B2 (ja) | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム | |
JP5450135B2 (ja) | 関連度辞書を用いた検索モデリングシステムおよび方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100610 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110927 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120110 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4912384 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150127 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |