JP4534690B2 - 文書検索装置および方法 - Google Patents
文書検索装置および方法 Download PDFInfo
- Publication number
- JP4534690B2 JP4534690B2 JP2004275228A JP2004275228A JP4534690B2 JP 4534690 B2 JP4534690 B2 JP 4534690B2 JP 2004275228 A JP2004275228 A JP 2004275228A JP 2004275228 A JP2004275228 A JP 2004275228A JP 4534690 B2 JP4534690 B2 JP 4534690B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- event
- vector
- user
- request
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
GUI上のユーザイベントを監視する枠組みを用意し、自然文入力した関連文書検索におけるクエリの種情報を特定できるイベントを監視する。ここでは関連文書検索に加えNグラム法の全文検索、および種文書を用いた関連文書検索をオプションとして利用できるものとする。イベントには例えばつぎのものがある。
全文検索が実行された場合、その文字列(キーワード)が関連文書検索のクエリになり得る
自然文検索クエリのフィールドに文が入力されていく状態を、IMEの確定処理などをタイミングとして動的にチェックする
種文書がチェックされる都度、その文書の語ベクトルを用いて検索演算する。
イベント内容が、新規か、既存の処理に対する追加イベントか否かを識別する。新規か追加かはその内容を過去のイベントと比較して判断できる。新規イベントであれば、ユーザ情報とイベント内容をあわせ、IDとして保持しておく。
イベントが新規であれば、バックグラウンドで、前述のイベントに基づく検索を開始する。結果に基づくベクトル演算結果は、IDに対応させて保持しておく。
イベントが追加であれば、直前のクエリの種との差分を算出し、差分のみに対して検索演算を実行し、追加された結果をベクトル演算結果に足し込む。
最終的に検索指示が行なわれると、未実施の差分演算があれば実行・マージしたうえで、該当する検索結果を表示する。一方、一定期間アクセスがないか、イベントに対応する画面が破棄されるなど、結果を維持する必要がなくなった場合は、ベクトル演算結果を消去する。
[ステップS11]:イベント監視部103がイベントを監視し続ける。なお、このステップは本来はクライアント装置10でループする。
[ステップS12]:イベント内容が、新規か、既存の処理に対する追加イベントか否かを識別する。新規か追加かはその内容を過去のイベントと比較して判断できる。新規イベントであれば、ユーザ情報とイベント内容をあわせ、IDとして保持しておく。新規イベントであればステップS13へ進み、追加イベントであればステップS14へ進む。
[ステップS13]:イベントが新規であれば、バックグラウンドで、前述のイベントに基づく検索を開始する。結果に基づくベクトル演算結果は、IDに対応させてイベントDB205に保持しておく。
[ステップS14]:イベントが追加であれば、直前のクエリの種との差分を算出する。
[ステップS15]:差分のみに対して検索演算を実行し、追加された結果をベクトル演算結果に足し込む。
[ステップS16]:最終的に検索指示が行なわれると、実検索が開始される。
[ステップS17]:該当するクエリの種(イベント)があるかどうか判別し、あればステップS18へ進み、なければステップS20へ進む。
[ステップS18]:直前のクエリの種との差分を算出する。
[ステップS19]:差分のみ差分のみに対して検索演算を実行し、追加された結果をベクトル演算結果に足し込む。ステップS21へ進む。
[ステップS20]:受け取ったクエリに対して検索演算を実行する。ステップS21へ進む。
[ステップS21]:検索演算のスコアに基づいて検索結果を生成してクライアント装置10に送出する。
20 サーバ装置
101 ユーザインタフェース部
102 検索要求発行部
103 イベント監視部
104 イベント送信部
105 検索結果受信部
201 検索要求受信部
202 イベント受信部
203 検索演算部
204 関連検索インデックスDB
205 イベントDB
206 合成部
207 全文検索部
208 種文書検索部
Claims (7)
- ユーザの検索要求を入力するユーザ検索要求入力手段と、
上記ユーザの検索要求に用いられる検索式の構成部分を特定するイベントを受信するイベント受信手段と、
上記イベント受信手段により受信されたイベントにより特定された検索式の構成部分をなす語ベクトルと対象文書の語ベクトルとの間で検索用のベクトル演算を行なう検索演算手段と、
上記検索式の構成部分をなす語ベクトルと対象文書の語ベクトルとの間で検索用のベクトル演算を行って得た、検索演算結果を記憶する記憶手段と、
上記イベント受信手段がイベントを受信するたびに、上記検索式の構成部分から上記記憶手段に記憶された検索演算結果に対応する構成部分を除いた差分をなす、語ベクトルと、上記対象文書の語ベクトルとの間で、上記検索演算手段を用いて検索用のベクトル演算を行って得た、当該差分に対する検索演算結果と、上記記憶手段に記憶された検索演算結果とを用いて、上記ユーザの検索要求に対する検索演算結果を合成する合成手段と、
上記合成手段によって合成された検索演算結果を、新たな検索演算結果として上記記憶手段に登録する登録手段と、
上記記憶手段により記憶された検索演算結果を、上記ユーザの検索要求の全体に対する検索演算結果として出力する検索結果出力手段とを有することを特徴とする文書検索装置。 - n−gram法による全文検索を行なう全文検索手段を有し、上記検索式の構成部分を特定するイベントには上記全文検索手段に入力される全文検索の文書検索要求の検索式の入力が含まれる請求項1記載の文書検索装置。
- 上記検索式は1または複数の種文書を特定するものであり、上記検索式の構成部分を特定するイベントには、上記種文書の各々の指定が含まれ、上記検索演算手段は、上記種文書の各々の語ベクトルと対象文書の語ベクトルとの間で検索用のベクトル演算を行なう請求項1または2記載の文書検索装置。
- コンピュータを、
ユーザの検索要求を入力するユーザ検索要求入力手段、
上記ユーザの検索要求に用いられる検索式の構成部分を特定するイベントを受信するイベント受信手段、
上記イベント受信手段により受信されたイベントにより特定された検索式の構成部分をなす語ベクトルと対象文書の語ベクトルとの間で検索用のベクトル演算を行なう検索演算手段、
上記検索式の構成部分をなす語ベクトルと対象文書の語ベクトルとの間で検索用のベクトル演算を行って得た、検索演算結果を記憶する記憶手段、
上記イベント受信手段がイベントを受信するたびに、上記検索式の構成部分から上記記憶手段に記憶された検索演算結果に対応する構成部分を除いた差分をなす、語ベクトルと、上記対象文書の語ベクトルとの間で上記検索演算手段を用いて検索用のベクトル演算を行って得た、当該差分に対する検索演算結果と、上記記憶手段に記憶された検索演算結果とを用いて、上記ユーザの検索要求に対する検索演算結果を合成する合成手段、
上記合成手段によって合成された検索演算結果を、新たな検索演算結果として上記記憶手段に登録する登録手段、
上記記憶手段により記憶された検索演算結果を、上記ユーザの検索要求の全体に対する検索演算結果として出力する検索結果出力手段、
として機能させることを特徴とする文書検索用コンピュータプログラム。 - 検索クライアント装置と検索サーバ装置とを含んでなる検索システムにおいて、
上記検索クライアント装置は、
ユーザの検索要求を入力するユーザ検索要求入力手段と、
上記入力されたユーザの検索要求を上記検索サーバ装置に発行する検索要求発行手段と、
上記ユーザの検索要求に用いられる検索式の構成部分を特定するイベントを監視するイベント監視手段と、
上記イベント監視手段により検出されたイベントを上記検索サーバ装置に送出するイベント送出手段と、
上記検索サーバ装置から上記ユーザの検索要求に対する検索結果を受け取る検索結果受信手段とを有し、
上記検索サーバ装置は、
上記クライアント装置から上記ユーザの検索要求を受け取る検索要求受信手段と
上記クライアント装置から上記イベントを受信するイベント受信手段と、
上記イベント受信手段により受信されたイベントにより特定された検索式の構成部分をなす語ベクトルと対象文書の語ベクトルとの間で検索用のベクトル演算を行なう検索演算手段と、
上記検索式の構成部分をなす語ベクトルと対象文書の語ベクトルとの間で検索用のベクトル演算を行って得た、検索演算結果を記憶する記憶手段と、
上記イベント受信手段がイベントを受信するたびに、上記検索式の構成部分から上記記憶手段に記憶された検索演算結果に対応する構成部分を除いた差分をなす、語ベクトルと、上記対象文書の語ベクトルとの間で上記検索演算手段を用いて検索用のベクトル演算を行って得た、当該差分に対する検索演算結果と、上記記憶手段に記憶された検索演算結果とを用いて、上記ユーザの検索要求に対する検索演算結果を合成する合成手段と、
上記合成手段によって合成された検索演算結果を、新たな検索演算結果として上記記憶手段に登録する登録手段と、
上記記憶手段により記憶された検索演算結果を、上記ユーザの検索要求の全体に対する検索演算結果として上記クライアント装置に送出する検索結果出力手段とを有することを特徴とする検索システム。 - 検索クライアント装置からユーザの検索要求を処理する検索サーバ装置において、
上記クライアント装置から、上記ユーザの検索要求を受け取る検索要求受信手段と
上記クライアント装置から、上記ユーザの検索要求に用いられる検索式の構成部分を特定するイベントを受信するイベント受信手段と、
上記イベント受信手段により受信されたイベントにより特定された検索式の構成部分をなす語ベクトルと対象文書の語ベクトルとの間で検索用のベクトル演算を行なう検索演算手段と、
上記検索式の構成部分をなす語ベクトルと対象文書の語ベクトルとの間で検索用のベクトル演算を行って得た、検索演算結果を記憶する記憶手段と、
上記イベント受信手段がイベントを受信するたびに、上記検索式の構成部分から上記記憶手段に記憶された検索演算結果に対応する構成部分を除いた差分をなす、語ベクトルと、上記対象文書の語ベクトルとの間で上記検索演算手段を用いて検索用のベクトル演算を行って得た、当該差分に対する検索演算結果と、上記記憶手段に記憶された検索演算結果とを用いて、上記ユーザの検索要求に対する検索演算結果を合成する合成手段と、
上記合成手段によって合成された検索演算結果を、新たな検索演算結果として上記記憶手段に登録する登録手段と、
上記記憶手段により記憶された検索演算結果を、上記ユーザの検索要求の全体に対する検索結果を上記クライアント装置に送出する検索結果出力手段とを有することを特徴とする検索サーバ装置。 - 検索クライアント装置からユーザの検索要求を処理する検索サーバコンピュータ用の文書検索用コンピュータプログラムにおいて、
当該検索サーバコンピュータを、
上記クライアント装置から上記ユーザの検索要求を受け取る検索要求受信手段、
上記クライアント装置から、上記ユーザの検索要求に用いられる検索式の構成部分を特定するイベントを受信するイベント受信手段、
上記イベント受信手段により受信されたイベントにより特定された検索式の構成部分をなす語ベクトルと対象文書の語ベクトルとの間で検索用のベクトル演算を行なう検索演算手段、
上記検索式の構成部分をなす語ベクトルと対象文書の語ベクトルとの間で検索用のベクトル演算を行って得た、検索演算結果を記憶する記憶手段、
上記イベント受信手段がイベントを受信するたびに、上記検索式の構成部分から上記記憶手段に記憶された検索演算結果に対応する構成部分を除いた差分をなす、語ベクトルと、上記対象文書の語ベクトルとの間で上記検索演算手段を用いて検索用のベクトル演算を行って得た、当該差分に対する検索演算結果と、上記記憶手段に記憶された検索演算結果とを用いて、上記ユーザの検索要求に対する検索演算結果を合成する合成手段、
上記合成手段によって合成された検索演算結果を、新たな検索演算結果として上記記憶手段に登録する登録手段、
上記記憶手段により記憶された検索演算結果を、上記ユーザの検索要求の全体に対する検索演算結果として上記クライアント装置に送出する検索結果出力手段、
として機能させることを特徴とする文書検索用コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004275228A JP4534690B2 (ja) | 2004-09-22 | 2004-09-22 | 文書検索装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004275228A JP4534690B2 (ja) | 2004-09-22 | 2004-09-22 | 文書検索装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006092136A JP2006092136A (ja) | 2006-04-06 |
JP4534690B2 true JP4534690B2 (ja) | 2010-09-01 |
Family
ID=36233057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004275228A Expired - Fee Related JP4534690B2 (ja) | 2004-09-22 | 2004-09-22 | 文書検索装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4534690B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011159100A (ja) * | 2010-02-01 | 2011-08-18 | Nippon Telegr & Teleph Corp <Ntt> | 逐次類似文書検索装置、逐次類似文書検索方法およびプログラム |
JP6190313B2 (ja) * | 2014-04-23 | 2017-08-30 | カシオ計算機株式会社 | 情報処理装置及びプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000315206A (ja) * | 1999-04-30 | 2000-11-14 | Fujitsu Ltd | 検索条件の組み合わせに基づく検索システムおよび方法 |
JP2001116579A (ja) * | 1999-10-15 | 2001-04-27 | Aisin Aw Co Ltd | ナビゲーション装置及び記録媒体 |
JP2002073681A (ja) * | 2000-08-28 | 2002-03-12 | Hitachi Ltd | 類似文書検索方法および装置および、類似文書検索方法のためのプログラムが記録された記憶媒体 |
JP2003330958A (ja) * | 2002-05-09 | 2003-11-21 | Canon Inc | 情報検索装置、情報検索方法、プログラムおよび記憶媒体 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3851712B2 (ja) * | 1997-07-28 | 2006-11-29 | 株式会社ジャストシステム | 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
-
2004
- 2004-09-22 JP JP2004275228A patent/JP4534690B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000315206A (ja) * | 1999-04-30 | 2000-11-14 | Fujitsu Ltd | 検索条件の組み合わせに基づく検索システムおよび方法 |
JP2001116579A (ja) * | 1999-10-15 | 2001-04-27 | Aisin Aw Co Ltd | ナビゲーション装置及び記録媒体 |
JP2002073681A (ja) * | 2000-08-28 | 2002-03-12 | Hitachi Ltd | 類似文書検索方法および装置および、類似文書検索方法のためのプログラムが記録された記憶媒体 |
JP2003330958A (ja) * | 2002-05-09 | 2003-11-21 | Canon Inc | 情報検索装置、情報検索方法、プログラムおよび記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2006092136A (ja) | 2006-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3225912B2 (ja) | 情報検索装置、方法及び記録媒体 | |
US9245004B1 (en) | Predicted query generation from partial search query input | |
US9430573B2 (en) | Coherent question answering in search results | |
US8280900B2 (en) | Speculative query expansion for relevance feedback | |
JP4962967B2 (ja) | Webページ検索サーバ及びクエリ推薦方法 | |
US8214347B2 (en) | Search result sub-topic identification system and method | |
JP2005128873A (ja) | 質問応答型文書検索システム及び質問応答型文書検索プログラム | |
JP2010257488A (ja) | 対話形サーチクエリー改良のためのシステム及び方法 | |
JP2015525929A (ja) | 検索品質を改善するための重みベースのステミング | |
US20180246896A1 (en) | Corpus Specific Generative Query Completion Assistant | |
US20140172907A1 (en) | Corpus search improvements using term normalization | |
US20060230031A1 (en) | Document searching device, document searching method, program, and recording medium | |
US20160217181A1 (en) | Annotating Query Suggestions With Descriptions | |
JP2004341753A (ja) | 検索支援装置、検索支援方法、およびプログラム | |
JP5226241B2 (ja) | タグを付与する方法 | |
US10102199B2 (en) | Corpus specific natural language query completion assistant | |
JP2006178599A (ja) | 文書検索装置および方法 | |
US20130226913A1 (en) | Use of statistical language modeling for generating exploratory search results | |
JP2008117351A (ja) | 検索システム | |
JP2001084256A (ja) | データベース処理装置、データベース処理方法、及びデータベース処理プログラムを記録したコンピュータ読み取り可能な記憶媒体 | |
JP4534690B2 (ja) | 文書検索装置および方法 | |
JP2004310561A (ja) | 情報検索方法、情報検索システム及び検索サーバ | |
JP2004192546A (ja) | 情報検索方法、装置、プログラム、および記録媒体 | |
JP2010211438A (ja) | 文書検索装置及び文書検索方法 | |
US20210319068A1 (en) | Smart find for in-application searching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070816 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100309 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100510 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100525 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100607 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130625 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4534690 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140625 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |