JP2004094387A - 特定情報検索方法および情報検索装置 - Google Patents
特定情報検索方法および情報検索装置 Download PDFInfo
- Publication number
- JP2004094387A JP2004094387A JP2002251743A JP2002251743A JP2004094387A JP 2004094387 A JP2004094387 A JP 2004094387A JP 2002251743 A JP2002251743 A JP 2002251743A JP 2002251743 A JP2002251743 A JP 2002251743A JP 2004094387 A JP2004094387 A JP 2004094387A
- Authority
- JP
- Japan
- Prior art keywords
- specific information
- search
- document
- keyword
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】特定情報検索装置10を用いて、被検索文書(2次検索候補文書32)を文単位及び単語単位に分解し、少なくとも1つの文単位(照合領域)内の特定情報に関するキーワードと一致する単語の数を計数し、計数結果が所定条件を満たすとき計数結果に基づいて当該照合領域における特定情報評価値を求め、特定所情報評価値が所定値以上であれば、当該被検索文書が特定情報に関連する文書であることを判別する。
【選択図】 図5
Description
【発明の属する技術分野】
本発明は、特定情報検索方法、及び情報検索装置、及び特定情報検索方法の手順を実行させるためのプログラム、及び特定情報検索方法の手順を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来技術】
一般的に、WWWの情報検索手段としてはロボット収集型の全文検索エンジンが最もよく利用されている。
一方、情報検索の自動化手段としては、あらかじめ設定した特定のキーワード集合と検索対象範囲の文書集合の何らかの類似度を評価することによってユーザーの検索意図に適合した文書を選別する方法がある。例えば、類似度評価の方法としてはベクトル空間モデルによる方法が用いられている。この方法によればキーワード集合と文書集合を、それぞれに含まれる単語を基底とする多次元のベクトル空間で特徴ベクトルとして表現し、両方のベクトル間の類似度を求め、その値が所定の閾値以上であれば当該文書は検索意図に適合するものとみなす。
【0003】
【発明が解決しようとする課題】
従来の技術によれば、以下のような問題点がある。
既存の検索エンジンでは一般に文書内での検索キーワードの有無によって検索対象文書であるか否かの判定がなされるため、検索結果を最初から効率よく絞り込むことが困難である。またユーザーが人手によるオペレーションによってキーワード入力と検索結果の吟味、再検索といったサイクルを何度も繰り返す必要があるため、時間的なコストを要し探索範囲の網羅性の点で限界がある。さらにユーザーは個々の検索エンジンの機能や特性を把握する必要があり、キーワード絞込みなど探索の戦略において利用者のノウハウに依存する部分が大きい。
一方、自動化手段の一つであるベクトル空間モデルによる方法によれば文書内での検索キーワードの有無だけでなく、個々の単語の重要度を加味した文書全体での類似度を評価することができる。しかしながら、この方法では文書中でのキーワードが出現する“位置”に関する評価はなされていない。
キーワードが出現する“位置”に関しては、例えば、検索文書中でユーザーが指定した複数のキーワードが意味的なまとまりのある一定範囲内に同時に出現したほうが、当該文書は検索意図に適合した文書である可能性が高い。ここで「意味的なまとまりのある一定範囲」とは、例えば、文書、段落、章、節、文等である。
ところがベクトル空間モデルによる方法では、文書中でのキーワードの出現位置に関する評価がなされておらず、例えば、第1のキーワードと第2のキーワードが1つの文単位中にあっても、文書の先頭と末尾にあっても同様に評価されてしまう。このため、ユーザーの検索意図に適合しない文書の評価値が高くなってしまう可能性もある。
そこで、本発明では、複数のキーワードの共起関係を評価することで、ユーザーの検索意図に適合した文書を容易に取得することができる特定情報検索機能を提供することを目的とする。
【0004】
【課題を解決するための手段】
前記目的を解決するために、請求項1に記載の発明は、被検索文書入力手段と、単語辞書記憶手段と、単語系列記憶手段と、特定情報に関するキーワードを記憶するキーワード記憶手段と、特定情報評価値記憶手段と、計数手段と、制御手段とを有する特定情報に関連する文書を検索する特定情報検索装置における特定情報検索方法において、前記制御手段は、前記入力手段により入力された被検索文書を単語辞書記憶手段と照合し、文単位および単語単位に分解して単語系列記憶手段に記憶する第1のステップと、前記単語系列記憶手段から少なくとも1つの文単位を照合領域として読み出し、該文単位内における単語をキーワード記憶手段と照合して、キーワードと一致する単語の数を前記計数手段で計数させ、計数結果が所定条件を満たすとき該計数結果に基づき該照合領域における特定情報評価値を求め、特定情報評価値記憶手段に記憶させる第2のステップと、記憶された特定情報評価値が所定値以上であれば、前記被検索文書が特定情報に関連する文書であることを判別する第3のステップとを実行する特定情報検索方法である。
請求項1に記載の特定情報検索方法によれば、複数のキーワードの共起関係を評価することで、ユーザーの検索意図に適合した特定情報に関連する文書であることを容易に判別することができる。
【0005】
請求項2に記載の発明は、請求項1に記載の特定情報検索方法であって、第2のステップにおいて、照合領域を被検索文書の先頭の文単位から末尾の文単位までの領域の間で、1つの文単位以上の間隔で順次シフトさせて設定し、求められた各照合領域における特定情報評価値を累算し、特定情報評価値記憶手段に記憶させることを特徴とする特定情報検索方法である。
請求項2に記載の特定情報検索方法によれば、ユーザーの検索意図に適合した特定情報に関連する文書であることを精度良く判別することができる。
【0006】
請求項3に記載の発明は、請求項2に記載の特定情報検索方法であって、第2のステップにおいて、照合領域をシフトさせる都度、特定情報評価値を累算し特定情報評価値記憶手段に記憶させて第2ステップを終了し、第3ステップを実行して、特定情報評価値が所定値以下であれば第2ステップに戻り、シフトされた照合領域の特定情報評価値を更に累算し、第3ステップに進むことを繰り返し実行する特定情報検索方法である。
請求項3に記載の特定情報検索方法によれば、特定情報評価値が所定値以上になれば、当該文書を特定情報に関連する文書であることを判別するので、検索に要する時間が短縮され、検索の精度も向上する。
【0007】
請求項4に記載の発明は、請求項1〜3のいずれかに記載の特定情報検索方法であって、検索エンジンに対し所定の特定情報に関する複数のキーワードを検索キーとして検索を実行することにより、インターネットを介して収集した所定の特定情報に関するキーワードが含まれる検索文書を被検索文書として被検索文書入力手段に入力することを特徴とする特定情報検索方法である。
請求項4に記載の特定情報検索方法によれば、被検索文書を収集することが容易である。
【0008】
請求項5に記載の発明は、請求項4に記載の特定情報検索方法であって、前記検索文書に含まれる少なくとも1階層分のリンク先から収集した文書を被検索文書として前記検索文書に加えて被検索文書入力手段に入力することを特徴とする特定情報検索方法である。
請求項5に記載の特定情報検索方法によれば、検索文書の少なくとも1階層分のリンク先からインターネットを介して収集した文書を被検索文書に選択することができるので、特定情報検索の信頼性が向上する。
【0009】
請求項6に記載の発明は、請求項4又は5に記載の特定情報検索方法であって、特定情報検索装置はさらに候補除外リスト記憶手段を有し、前記制御装置は、被検索文書を記憶された候補除外リストと照合し、これに該当する文書の被検索文書入力手段への入力を除外することを特徴とする特定情報検索方法である。
請求項6に記載の特定情報検索方法によれば、予め不要な被検索文書を除外しておく事ができるので、検索に要する時間を短縮することができる。
【0010】
請求項7に記載の発明は、特定情報に関連する文書を検索する特定情報検索装置と、特定情報検索装置と通信可能な端末装置と、インターネットへのアクセス手段とを備える情報検索装置であって、
端末装置は、特定情報検索装置に特定情報に関するキーワードと検索要求信号を送信する入力手段と、特定情報検索装置から送られる特定情報に関する情報を表示する表示手段とを備え、
特定情報検索装置は、被検索文書入力手段と、特定情報に関するキーワード入力手段と、単語辞書記憶手段と、単語系列記憶手段と、特定情報に関するキーワードを記憶するキーワード記憶手段と、特定情報評価値記憶手段と、計数手段と、制御手段と、特定情報関連文書記憶手段と、送信手段とを有し、
前記制御手段は、特定情報に関するキーワードと検索要求信号を受信すると、受信したキーワードに基づいて前記インターネットアクセス手段を介して検索エンジンによって被検索文書を収集して前記被検索文書入力手段に入力し、入力された被検索文書を単語辞書記憶手段と照合して文単位内および単語単位に分解して単語系列記憶手段に記憶させ、前記単語系列記憶手段から少なくとも1つの文単位をキーワード記憶手段との照合領域として読み出し、該文単位内における単語をキーワード記憶手段と照合して、キーワードと一致する単語の数を前記計数手段で計数させ、計数結果が所定条件を満たすとき該計数結果に基づき特定情報評価値を求め前記特定情報評価値記憶手段に記憶させ、特定情報評価値が所定値以上であれば、前記被検索文書が特定情報に関連する文書であることを判別して該文書を前記特定情報関連文書記憶手段に記憶させ、特定情報関連文書記憶手段に記憶された文書を前記送信手段により前記端末装置に送信する、
ことを特徴とする情報検索装置である。
請求項7に記載の情報検索装置によれば、ユーザーが端末装置から複数のキーワードを入力し、入力した複数のキーワードの共起関係が評価されることで、ユーザーの検索意図に適合した特定情報に関連する文書であることが容易に判別される。
【0011】
請求項8に記載の発明は、請求項7の情報検索装置であって、特定情報の検索装置における制御手段は、照合領域を被検索文書の先頭の文単位から末尾の文単位までの領域の間で、1つの文単位以上の間隔で順次シフトさせて設定し、求められた各照合領域における特定情報評価値を累算して特定情報評価値記憶手段に記憶させることを特徴とする情報検索装置。
請求項8に記載の情報検索装置によれば、特定情報の記載された文書を精度よく検索することが可能である。
【0012】
請求項9に記載の発明は、請求項7または8に記載の情報検索装置であって、特定文書検索装置の制御手段は、前記インターネットアクセス手段を介して収集した被検索文書に含まれる少なくとも1階層分のリンク先から収集した文書を被検索文書入力手段に入力することを特徴とする情報検索装置である。
請求項9に記載の情報検索装置によれば、検索文書の少なくとも1階層分のリンク先からインターネットを介して収集した文書を被検索文書に選択することができるので、特定情報検索の信頼性が向上する。
【0013】
また、請求項10に記載の発明は、コンピュータに請求項1〜6に記載の特定情報検索方法の手順を実行させるためのプログラムである。
請求項10に記載のプログラムを用いれば、コンピュータにより複数のキーワードの共起関係を評価することで、ユーザーの検索意図に適合した特定情報に関連する文書であることを容易に判別することができる。
【0014】
また、請求項11に記載の発明は、請求項10に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
請求項11に記載の記憶媒体を用いれば、コンピュータにより複数のキーワードの共起関係を評価することで、ユーザーの検索意図に適合した特定情報に関連する文書であることを容易に判別することができる。
【0015】
【発明の実施の形態】
以下に、本発明の情報検索装置1の一実施の形態を、図1〜図11を用いて説明する。本実施の形態では、特定情報とは求人情報である場合について説明する。
まず、図1を用いて本実施の形態の構成を説明する。
情報検索装置1は、ユーザー端末(端末装置)Aと、特定情報検索装置10と、インターネットアクセス手段(図示していない。)とを備えている。例えば、ユーザー端末A及び特定情報検索装置10は、インターネットアクセス手段を介してインターネット20に接続されていて互いに通信可能である。また、インターネット20には、例えば、ユーザー端末Aの情報の送受信を管理するサーバをはじめとする各種サーバ群や、検索エンジンa〜cが接続されている。
特定情報検索装置10に設けられている記憶装置11は、ユーザーが特定情報に関する文書を検索する際に用いられる、単語辞書記憶手段12a、単語系列記憶手段12b、キーワード記憶手段12c、特定情報評価値記憶手段12d、システムキーワード記憶手段12eを備えている。単語辞書記憶手段12aには、“単語”や、“単語”と品詞の対応関係が記憶されている。単語系列記憶手段12bには、文単位および単語単位に分解した、ユーザーが検索する文書が記憶されている。キーワード記憶手段12cには、その時の検索に用いられるキーワード(ユーザーが設定したキーワードやシステムキーワード)が記憶されている。特定情報評価値記憶手段12dには、検索する文書が特定情報に関連する文書であるか否かを判別するための類似度を表わす特定情報評価値が記憶されている。また、予めシステムキーワード記憶手段12eには、例えば、図11に示すように、特定情報(この場合は、求人情報)に関連する単語の集合(例えば、“募集”、“履歴書”等)が記憶されている。
また、記憶装置11には、特定情報検索装置10の制御手段(CPU)13が実行する特定情報検索方法のプログラムも記憶されている。
なお、ユーザー端末Aと特定情報検索装置10は、互いに通信可能であればよく、インターネット20に直接接続されていなくてもよい。例えば、特定情報検索装置10は、所定のファイアーウォールサーバ(図示していない)中にあってもよい。
また、インターネットアクセス手段は、ユーザー端末Aや特定情報検索装置10が兼ねていてもよい。
また、単語辞書記憶手段12a、単語系列記憶手段12b、キーワード記憶手段12c、特定情報評価値記憶手段12d、システムキーワード記憶手段12eは、別の部材である必要はなく、記憶装置11のそれぞれのメモリエリアに記憶されていればよい。
【0016】
次に、情報検索装置1の動作について説明する。
ユーザー端末Aは、入力手段(例えば、キーボード)と表示手段(例えば、モニタ)を備えている。
図2〜図4は、ユーザー端末Aの表示手段(例えば、CRT、液晶のモニタ)に表示される表示例である。
ユーザーが、ユーザー端末Aを用いて特定情報検索装置10にアクセスすると、図2に示す、「検索キーワード入力画面」21が表示される。「検索キーワード入力画面」21には、キーワード入力欄20a、検索方法選択項目20b、検索開始キー20c、コメント欄20dが設けられている。検索方法選択項目20bでは、[一般検索]か[求人情報検索]かのいずれかを選択できる。また、コメント欄20dには、“検索結果はメールで通知されます。”旨のコメントが表示されている。
ここで、[求人情報検索]とは、求人情報を効率良く検索できるモードであり、ユーザーは、求人情報に関するWebコンテンツの文書を閲覧したい場合には、このモードを選択すると便利である。
【0017】
そこで、まず[求人情報検索]について説明する。
例えば、ユーザーは、特許事務所や企業の特許担当課に就職を希望しており、就職先を探すために、キーワードとして、“特許”及び“弁理士”を選択して求人情報検索を実行する。
ユーザーは、キーワード入力欄20aにキーワード(この場合、“特許”、“弁理士”の2つ)を入力し、検索方法選択項目20bで[求人情報検索]を選択し、検索開始キー20cを操作する。
これらの一連の操作には、例えば、ユーザー端末Aのキーボード、マウス(図示していない。)を用いる。
すると、「検索キーワード入力画面」21のコメント欄20dに表示されていたように、検索処理完了後に、ユーザー端末Aに、図3に示すような「検索結果通知メール」22が送信される。検索結果通知メール22には、コメント欄22a、検索結果の要約書のURL表示欄22b、ユーザーの宛名表示22cが設けられている。コメント欄22aには、例えば、「キーワード“特許”、“弁理士”で検索した結果、該当すると思われるものを100件ピックアップしました。結果は、次のURLを参照して下さい。」と表示されている。そこで、ユーザーは、求人情報検索結果の要約書を見るために、URL表示欄22bを操作(例えば、マウスでクリック)する。
すると、URL表示欄22bに表示されたURLのWebコンテンツがユーザー端末Aにダウンロードされ、図4に示す「求人情報検索結果の要約画面」23が表示される。求人情報検索結果の要約画面23には、[求人情報検索]によって検索されたWebコンテンツのタイトル欄23a、検索された文書のURL表示欄23b、当該文書の先頭から所定の長さの文書欄23cが設けられている。
ユーザーは、タイトル欄23aや文書欄23cの表示に基づいて、必要なWebコンテンツを選択し、例えば、URL表示欄23bをマウスでクリックする。これにより、選択したWebコンテンツがユーザー端末Aにダウンロードされて表示される。
【0018】
次に、[一般検索]について説明する。
例えば、ユーザーは、弁理士の仕事内容を調査する事を希望しており、キーワードとして、“特許”及び“弁理士”を選択して一般検索を実行する。
ユーザーは、キーワード入力欄20aにキーワード(この場合、“特許”、“弁理士”の2つ)を入力し、検索方法選択項目20bで[一般検索]を選択し、検索開始キー20cを操作する。
すると、「検索キーワード入力画面」21のコメント欄20dに表示されていたように、検索処理完了後に、ユーザー端末Aに、「検索結果通知メール」22が送信される。検索結果通知メール22には、図3に示す[求人情報検索]の場合と同様に、検索結果の要約書のURL表示欄が設けられている。そこで、ユーザーは、一般検索結果の要約書を見るために、URL表示欄を操作する。すると、検索結果の要約書のURL表示欄に表示されたURLのWebコンテンツがユーザー端末Aにダウンロードされ、「一般検索結果の要約画面」(図示していない。)が表示される。一般検索結果画面には、図4に示す「求人情報検索結果の要約画面」23と同様の表示項目が表示されている。
ユーザーは、「一般検索結果の要約画面」に表示されているWebコンテンツの中から、必要なWebコンテンツを選択して、ユーザー端末Aにダウンロードする。
【0019】
本実施の形態では、[求人情報検索]の結果は、図4に示すような「求人情報検索結果の要約画面」23が表示されるURLがメールに記載されて送信されている(図3)が、例えば、「求人情報検索結果の要約画面」23はメールに添付されていてもよいし、メールの内容として記載されていてもよい。また、その他の形態でもよい。
【0020】
前述した動作を実行するための特定情報検索装置10の処理手順について図6〜図8のフローチャート図を用いて説明する。
この処理手順は、特定情報検索装置10内の記憶装置11に記憶された特定情報検索方法のプログラムに基づいて特定情報検索装置10内の制御手段(CPU)13が実行するものである。
まず、ステップS10で、検索キーワードが入力されたか否か判別する。例えば、図2に示す「検索キーワード入力画面」21のキーワード入力欄20aにキーワードが書き込まれ、検索開始キー20cが操作されたか否かを判別する。検索キーワードが入力されていなければ(No)待機する。検索キーワードが入力されていれば(Yes)、ステップS12に進む。
ステップS12では、[求人情報検索]か[一般検索]のいずれが選択されているかを判別する。例えば、図2に示す「検索キーワード入力画面」21の検索方法選択項目20bで[求人情報検索]か[一般検索]のいずれが選択されているかを判別する。[求人情報検索]であれば、ステップS14に進む。[一般検索]であれば、ステップS16に進む。
ステップS14では、求人情報検索フラグをオンして、ステップS16に進む。
ステップS16では、1次検索を実行する。例えば、インターネットアクセス手段を介してインターネット20に接続し、図1に示す複数の検索エンジンa〜cを用いてユーザーにより設定されたキーワードを含むWebコンテンツの文書を、図5に示すインターネット中のWebコンテンツの文書の集合30から検索し、1次検索の結果として該当する文書のURLリストを収集する(メタサーチエンジンプログラム)。そして、ステップS22に進む。
【0021】
ステップS22では、ステップS16の1次検索で得られた結果を用いて、2次検索(請求項中の第1〜第3のステップに相当する文書類似度判定)候補のWebコンテンツの文書を収集する。この処理の詳細については、図7に基づいて後述する。そして、ステップS24に進む。
ステップS24では、2次検索(文書類似度判定)を実行する。この処理の詳細については、図8に基づいて後述する。そして、ステップS26に進む。
ステップS26では、ステップS24の2次検索で得られた結果に基づいて、ユーザー端末Aから要求があった際にユーザー端末Aに送信するための、図4に示すような要約書(「求人情報検索結果の要約」もしくは「一般検索結果の要約」)を作成する。そして、ステップS28に進む。
ステップS28では、図3に示すような「検索結果通知メール」22をユーザー端末Aに送信して、ステップS30に進む。
ステップS30では、次の特定情報検索に備え、求人情報検索フラグをオフにし、ステップS32に進む。
ステップS32では、ユーザー端末Aから2次検索結果の要求があるか否か判別する。例えば、図4に示す「検索結果通知メール」23のURL表示欄23bが操作されているか否か判別する。URL表示欄23bが操作されていて、ユーザー端末Aから2次検索結果の要求がある場合には、ステップS34に進む。要求が無い場合には、ステップS33に進む。
ステップS33では、ステップS26の2次検索結果の要約書が作成されてから、1週間経過したか否か判別する。1週間経過していなければ、待機する。1週間経過していれば、ステップS35の進む。
一方、ステップS34では、ユーザー端末Aに、「検索結果の要約」を送信してステップS35に進む。
ステップS35では、「検索結果の要約」を削除して終了する。
【0022】
次に、図6のステップS22の2次検索候補文書を収集する処理の詳細について、図7を参照して説明する。
ステップS40で、図6に示すステップS16で収集した1次検索結果のURLリストから、図5に示すように、各URLに対応するWebコンテンツの文書(1次検索結果文書31)を収集する。そして、ステップS42に進む。
ステップS42では、ステップS40で収集した各Webコンテンツの文書31を分析して、各文書のリンク1階層分のリンク先URLを抽出し、重複しているものを排除する。リンク1階層分のURLに対応するWebコンテンツの文書を収集する。そして、ステップS44に進む。
ステップS44では、ステップS40で収集した1次検索結果文書31と、ステップS42で収集した文書を、図5に示す、2次検索候補文書32としてリターンする。
【0023】
次に、図6に示すステップS24の2次検索について、図8〜図11を参照して説明する。
ここで、図8に示すフローチャート図は、請求項中の第1〜第3のステップを実行するための特定情報検索装置10の処理手順を示す。
2次検索では、複数のキーワード(本実施の形態では、ユーザーが入力したキーワード群、もしくはユーザーが入力したキーワードにシステムキーワード(詳細は、後述する。)を加えたキーワード群)を用いて、2次検索候補文書32のそれぞれについて、キーワードの出現する“位置”に関する評価、つまり共起関係を評価する。そして、2次検索候補文書32のそれぞれと、前記複数のキーワードとの「類似度」を判別する。
まず、ステップS50で、[求人情報検索]であるか[一般検索]であるか判別する。例えば、ステップS14の求人検索フラグがオンしているか否かを判別する。求人検索フラグがオンしていて、[求人情報検索]が選択されていれば、ステップS51に進む。求人検索フラグがオフしていれば、ステップS52に進む。
ステップS51では、2次検索候補文書を検索するキーワードとして、ユーザーが設定したキーワード(“特許”、“弁理士”)と、システムに予め登録してある、例えば、図11に示す求人情報に関するシステムキーワードを用いる準備をする。システムキーワードは、例えば、予め記憶装置11のシステムキーワード記憶手段12eに記憶されている求人情報に関するキーワード全てを用いる。システムキーワードは、所定の条件に基づいて一部を抽出して用いるようにしてもよい。そして、ステップS53に進む。
一方、ステップS52では、2次検索候補文書を検索するキーワードとして、ユーザーが設定したキーワード(“特許”、“弁理士”)のみを用いる準備をする。そして、ステップS53に進む。
ステップS53では、2次検索候補の所定の文書を、単語辞書記憶手段12aに記憶されている単語と照合して文単位に分割する。例えば、既存技術である形態素解析手法を用いて2次検索候補の所定の文書を単語に分割し、さらに、読点もしくは改行マークにより文単位に分解する。そして、単語系列記憶手段12bに記憶させ、ステップS52に進む。
ここで形態素解析手法とは、文を構成要素の単語に分割し(日本語の場合)、分割された単語に品詞情報を付与する技術である。形態素解析をコンピュータで実行するための手段としては、例えば以下の手順を用いればよい。まず解析対象である文をコンピュータのメモリ上に読み込み、文の構成要素である文字列を、あらかじめ単語辞書記憶手段12aに記憶された単語と品詞の対応関係が記述された辞書と比較することによって文頭から単語と品詞情報を同定していく。この時、複数の単語系列の候補が得られる場合はあらかじめ形態素解析実行手段が備える分割ルールに従い候補を一つに同定していく。例えば分割ルールとしては最長一致や一文内の分割数最小などの方法が知られている。
ステップS54では、図9に示すように、単語系列記憶手段12bに記憶されている文単位に分解した所定の2次検索候補の文書を、文書の先頭から、1文単位の観測窓(照合領域)にかけて照合する。そして、ステップS55に進む。
ステップS55では、観測窓内にユーザーが設定したキーワードの種類と数を、計数手段(図示していない。記憶装置11に記憶されている、制御手段13が実行するプログラム)を用いて計数する。また、観測窓内のキーワードの総数(種類問わず)をnとする。そして、ステップS56に進む。
ステップS56では、条件1及び条件2及び条件3を全て満足しているか否か判別する。ここで、条件1〜3とは、
条件1・・n≧2
条件2・・システムキーワードだけではない。(ユーザーが設定したキーワードも含まれている。)
条件3・・同じキーワードばかりではない。
である。条件1〜3を全て満足していれば、ステップS58に進む。全て満足していなければ、ステップS60に進む。
ステップS58では、当該観測窓内のキーワード総数nを特定情報評価値とし、特定情報評価値記憶手段12dに記憶されている評価値Scに加算する。
一方、ステップS60では、観測窓を1文単位末尾方向の隣にシフトさせ、ステップS61に進む。
ステップS61では、文書末尾の文単位を含む観測窓の照合が終了したか否か判別する。終了していなければ、ステップS55に戻る。終了していれば、ステップS62に進む。
ステップS62では、評価値Scが所定値以上であるか否か判別する。評価値Scが所定値以上であれば、ステップS63に進む。所定値未満であれば、ステップS64に進む。
ステップS63では、評価値Scが所定値以上であり、当該文書の類似度が高いとし、当該文書を2次検索結果文書の集合に入れる。そして、ステップS64に進む。
ステップS64では、評価値ScをクリアしてステップS65に進む。
ステップS65では、2次検索候補のWebコンテンツの文書を全て照合したか否か判別する。照合していなければ、ステップS66に進む。終了していれば、リターンする。
ステップS66では、次の2次検索候補の文書を選択し、同様の処理をする。
【0024】
次に、[求人情報検索]で、図9に示すように1文単位の観測窓αを用いた場合の文書類似度判定の詳細について説明する(図8のフローチャートに示す、ステップS53〜S63の処理)。
ここで、図9に示すように、選択した2次検索候補のWebコンテンツの文書の中に文単位70〜74がある。
また、この2次検索候補の文書には、ユーザーが設定したキーワード“特許”(図9中の●)、キーワード“弁理士”(図9中の○)、図11に示す求人情報に関するシステムキーワードの中の“給与”(図9中の◆)、システムキーワードの中の“資格”(図9中の◇)が存在するものとする。
そこで、観測窓αを用いて先頭の文単位70を照合すると、[●1;○1]で、キーワードの総数nは“2”である。すなわち、条件1はOK、また、条件2はOK、また、条件3はOKであるので、文単位70中に含まれるキーワードの総数n=“2”を特定情報評価値記憶手段12dに記憶されている特定情報評価値(Sc)に加算する。特定情報評価値(Sc)は先にクリアされているので、ここで、評価値(Sc)=“2”となる。
次に、文単位71を照合するために観測窓αを末尾方向に1文単位シフトさせる。観測窓αが文単位71を照合すると、結果は[●1]で、キーワードの総数は“1”である。すなわち、条件1がNGである。そこで、文単位71中に含まれるキーワードの総数n=“1”は、特定情報評価値(Sc)に加算しない。
次に、文単位72を照合するために観測窓αを更に末尾方向に1文単位シフトさせる。観測窓αが文単位72を照合すると、結果は[○1]で、キーワードの総数は1である。すなわち、条件1がNGである。そこで、文単位72中に含まれるキーワードの総数n=“1”は、特定情報評価値(Sc)に加算しない。
次に、文単位73を照合するために観測窓αを更に末尾方向に1文単位シフトさせる。観測窓αが文単位72を照合すると、結果は[◆1;◇1]で、キーワードの総数は“2”である。すなわち、条件1はOK、条件2がNG(システムキーワードのみ)である。そこで、文単位72中に含まれるキーワードの総数n=“2”は、特定情報評価値(Sc)に加算しない。
次に、文単位74を照合するために観測窓αを更に末尾方向に1文単位シフトさせる。観測窓αが文単位74を照合すると、[●2;◇1]で、キーワードの総数nは“3”である。すなわち、条件1はOK、また、条件2はOK、また、条件3はOKであるので、文単位70中に含まれるキーワードの総数n=“3”を特定情報評価値(Sc)に加算する。ここで、特定情報評価値(Sc)=“2”+“3”=“5”となる。
このようにして、選択した2次検索候補のWebコンテンツの文書の特定情報評価値(Sc)を求める。この場合、特定情報評価値(Sc)の値は、“5”となる。そして、特定情報評価値(Sc)を予め設定された所定値(閾値)と比較して所定値よりも大きければ、当該文書は検索キーワードから想起される事柄との類似度が高いことを判別して、2次検索結果文書集合33に入れる。
この場合に使用した求人情報に関するシステムキーワードは、予め特定情報検索装置10の記憶装置11のシステムキーワード記憶手段12eに記憶されている求人情報に関するキーワード全てを用いるので、図11に示すいずれかのシステムキーワードが選択された文書中に存在すれば、計数される。
【0025】
一方、例えば、図10に示すように2文単位の観測窓βを用いた場合の文書類似度判定について説明する。
観測窓βを用いて文単位70、71を照合すると、[●2;○1]で、キーワードの総数nは“3”である。すなわち、条件1はOK、また、条件2はOK、また、条件3はOKであるので、文単位70、71中に含まれるキーワードの総数n=“3”を特定情報評価値(Sc)に加算する。特定情報評価値(Sc)は先にクリアされているので、ここで、特定情報評価値(Sc)=“3”となる。
次に、文単位71、72を照合するために観測窓βを末尾方向に1文単位シフトさせる。観測窓βが文単位71、72を照合すると、結果は[●2]で、キーワードの総数は“2”である。すなわち、条件1はOK、条件2はOK、条件3はNG(●が1種類のみ)である。そこで、文単位71、72中に含まれるキーワードの総数n=“2”は、特定情報評価値(Sc)に加算しない。
次に、文単位72、73を照合するために観測窓βを更に末尾方向に1文単位シフトさせる。観測窓βが文単位72、73を照合すると、結果は[●1;◇1;◆1]で、キーワードの総数は“3”である。すなわち、条件1はOK、条件2はOK、条件3はOKであるので、文単位72、73中に含まれるキーワードの総数n=“3”を特定情報評価値(Sc)に加算する。ここで、特定情報評価値(Sc)=“3”+“3”=“6”となる。
次に、文単位73、74を照合するために観測窓βを更に末尾方向に1文単位シフトさせる。観測窓βが文単位73、74を照合すると、結果は[●2;◇2;◆1]で、キーワードの総数は“5”である。すなわち、条件1はOK、条件2はOK、条件3はOKであるので、文単位73、74中に含まれるキーワードの総数n=“5”を特定情報評価値(Sc)に加算する。ここで、特定情報評価値(Sc)=“6”+“5”=“11”となる。
文単位74は、文書末尾の文単位であるので、観測窓βを用いた照合を終了する。
このようにして、選択した2次検索候補のWebコンテンツの文書の特定情報評価値(Sc)を求める。この場合、特定情報評価値(Sc)の値は、“5”となる。そして、特定情報評価値(Sc)を予め設定された所定値(閾値)と比較して所定値よりも大きければ、当該文書は類似度が高いことを判別して、2次検索結果文書集合33に入れる。
このように、観測窓に含まれる文単位の数、また、観測窓のシフトの仕方等によって、特定情報評価値(Sc)の値は異なる。そこで、類似度が高いか否かを判別する閾値は、予め、適宜、最適な値に設定する。例えば、様々なWebコンテンツを観測することにより最適な値を見出す。このように、閾値を変更することができるので、システムの自由度が高い。
【0026】
このようにして、複数のキーワードが、少なくとも1つの文単位で形成された観測窓(検索領域)中に、所定値以上存在するか否かを判別することで(但し、同種類のみではない。また、システムキーワードだけでもない。)、複数のキーワードの共起関係を特定情報評価値(Sc)に反映することができる。
例えば、本実施の形態で、ユーザーは、弁理士の仕事内容を調査する事を希望しており、キーワードとして、“特許”及び“弁理士”を選択して特定情報検索装置10を用いて[一般検索]を実行している。そして、キーワードとして、“特許”及び“弁理士”を選択している。キーワード“特許”とキーワード“弁理士”が、同じ文単位、もしくは隣接する文単位等互いに近くに存在していれば、当該文書は、ユーザーが必要な情報である可能性が高い(類似度が高い)。しかしながら、例えば、一般の検索エンジンもしくは検索エンジンの組み合わせ等によりキーワードの存在のみを検索した場合には、Webコンテンツの文書の先頭部分と末尾部分にキーワードが離れて存在している場合も検索結果として取得される。この場合、ユーザーが必要な情報である可能性が低い。
例えば、一般的な検索エンジンによる検索では、BBB予備校のWebコンテンツの文書で、ビジネスモデルに関して、「○○○に関する“特許”出願中」という第1の記事が先頭頁に掲載され、最終頁に「BBB予備校の講座案内 1.“弁理士”基礎講座・・」という第2の記事が掲載されていたとしても、“特許”と”弁理士”が文書内に含まれているので、検索結果として取得される。しかしながら、これは、ユーザーが必要とする情報が含まれる文書ではない。
このように、本発明の、情報検索装置1を用いれば、キーワードが出現する“位置”に関する評価(共起関係の評価)を自動的に行うことにより、ユーザーは、検索エンジンに関する知識や検索のノウハウを知らなくても、必要な情報が記載された文書を容易に効率良く取得することができる。
また、特定情報(本実施の形態では求人情報)に特化した検索を行う場合には、特定情報に関するシステムキーワードが自動的に検索キーワードが付加されて検索が実行され、候補文書の類似度を判別するため、検索キーワードの選定が容易である。
【0027】
本発明の、特定情報検索方法及び情報検索装置は、実施の形態の構成及び動作に限定されるものではない。
また、特定情報評価値(Sc)は、例えば、公知のベクトル空間モデルを併用して求めてもよい。例えば、本実施の形態のように複数のキーワードの共起関係の評価をすることで求めた評価値を(Sw)、ベクトル空間モデルの評価値を(Sv)として、
特定情報評価値(Sc)=(Sv)+k(Sw)
(k;所定の実数値)
としてもよい。これによれば、ベクトル空間モデルによるキーワードと文書の類似度評価値に、文書内でのキーワードの共起関係の評価値を加味して再評価することになるので、情報検索の信頼性が一層向上する。
また、特定情報評価値(Sc)は、例えば下記の数式(式1)で表現する事が出来る。
niはi回目の照合における観測窓内のキーワード出現数、Nは文書全体での照合回数(観測窓の数)である。特定情報を検索するためのプログラムでは、(式1)を用いて特定情報評価値(Sc)を算出する。また、特定情報評価値(Sc)には、他の数式を用いてもよい。
また、予め、候補除外リストが作成してあり、候補除外リストに該当するWebコンテンツの文書は、2次検索候補から除外するようにしてもよい。これによれば、2次検索に要する時間を短縮し検索意図に適合しない結果を排除することができる。例えば、ユーザーは同業他社の製品に関する情報を収集したい時に、自社や関係会社のURLを候補除外リストに加えることにより、2次検索候補文書から除外するようにしてもよい。この場合、例えば、図2に示す「検索キーワード入力画面」21に、候補文書から除外するためのキーワード設定欄(図示していない)が表示されるようにする。例えば、ユーザーがキーボードを用いて候補文書から除外するためのキーワード(このキーワードを含んでいれば、2次検索候補文書から除外する。)を設定してもよいし、候補文書から除外するためのキーワードの候補が予め表示されていて、ユーザーは表示されているキーワードの候補をチェックするようにしてもよい。
実施の形態では、前述の条件1〜3を全て満足した時に特定情報評価値(Sc)に加算したが、この条件は、別の条件でもよい。
また、観測窓で照合する際に、特定情報評価値が所定値以上のなった時点で、当該文書の照合は終了し、他の文書に移ってもよい。すなわち、文書の末尾まで検索しなくてもよい。
実施の形態では、請求項中の「特定情報」が「求人情報」である場合について説明したが、「特定情報」は多種多様考えられる。
また、観測窓をシフトする方向は末尾に向けてではなくてもよい。
また、観測窓を用いて文単位の先頭から照合しなくてもよい。例えば、末尾からでもよい。
また、ユーザー端末は多数あってもよい。
また、2次検索の候補文書は、1次検索結果文書のリンク1階層分のみでなくてもよい。少なくとも、1階層分であり、例えば、2階層分でもよい。
また、1次検索結果文書をそのまま、2次検索候補文書としてもよい。
また、システムキーワードはなくてもよく、例えば、本実施の形態では、「一般検索」ができるだけでもよい。
また、本実施の形態では、[求人情報検索]を実行する場合には、システムキーワードを全て用いたが、全て用いなくてもよい。いくつかを選択して用いてもよい。いずれのキーワードを選択するかについては、特定情報検索装置10で自動的の選択されてもよいし、ユーザーが選択できるようにしてもよい。
また、ユーザーが入力したキーワードとシステムキーワードが重複する場合には、当該キーワードはユーザーが入力したキーワードとして扱う。
また、本実施の形態では、1週間後に検索結果の要約書を削除したが、削除しなくてもよい。例えば、上書きしてもよい。
また、観測窓の長さを設定する際に、予備的に検索を実行して、最適な長さを設定してもよい。例えば、2次検索候補文書の中の10%の文書について評価値Scを求め、全ての評価値Scが所定の範囲内となるように観測窓の長さを設定してもよい。その他、観測窓の長さの設定については、種々の方法が考えられる。
【0028】
【発明の効果】
以上説明したように、請求項1に記載の特定情報検索方法によれば、複数のキーワードの共起関係を評価することで、ユーザーの検索意図に適合した特定情報に関連する文書であることを容易に判別することができる。
また、請求項2に記載の特定情報検索方法によれば、ユーザーの検索意図に適合した特定情報に関連する文書であることを精度良く判別することができる。
また、請求項3に記載の特定情報検索方法によれば、検索に要する時間が短縮され、検索の精度も向上する。
また、請求項4に記載の特定情報検索方法によれば、被検索文書を収集することが容易である。
また、請求項5に記載の特定情報検索方法によれば、1次検索文書の少なくとも1階層分のリンク先からインターネットを介して収集した文書を被検索文書に選択することができるので、特定情報検索の信頼性が向上する。
また、請求項6に記載の特定情報検索方法によれば、予め不要な被検索文書を除外しておく事ができるので、検索に要する時間を短縮することができる。
また、請求項7に記載の情報検索装置によれば、ユーザーが端末装置から複数のキーワードを入力し、入力した複数のキーワードの共起関係が評価されることで、ユーザーの検索意図に適合した特定情報に関連する文書であることが容易に判別される。
また、請求項8に記載の情報検索装置によれば、被検索文書を収集することが容易である。
また、請求項9に記載のプログラムによれば、複数のキーワードの共起関係を評価することで、ユーザーの検索意図に適合した特定情報に関連する文書であることを容易に判別することができる。
また、請求項10に記載の記録媒体によれば、複数のキーワードの共起関係を評価することで、ユーザーの検索意図に適合した特定情報に関連する文書であることを容易に判別することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態の構成を示すブロック図である。
【図2】ユーザー端末Aの表示手段に表示される表示例である。
【図3】ユーザー端末Aの表示手段に表示される表示例である。
【図4】ユーザー端末Aの表示手段に表示される表示例である。
【図5】本実施の形態の動作を示す説明図である。
【図6】特定情報検索装置10のCPUの処理を示すフローチャート図である。
【図7】特定情報検索装置10のCPUの処理を示すフローチャート図である。
【図8】特定情報検索装置10のCPUの処理を示すフローチャート図である。
【図9】観測窓を用いた文書類似度判定動作についての説明図である。
【図10】観測窓を用いた文書類似度判定動作についての説明図である。
【図11】特定情報検索装置10の中に予め特定情報に関するキーワード(システムキーワード)が記憶されている場合の説明図である。
【符号の説明】
1 情報検索装置
10 特定情報検索装置
11 記憶装置
12a 単語辞書記憶手段
12b 単語系列記憶手段
12c キーワード記憶手段
12d 特定情報評価値記憶手段
12e システムキーワード記憶手段
13 制御手段
20 インターネット
Claims (11)
- 被検索文書入力手段と、単語辞書記憶手段と、単語系列記憶手段と、特定情報に関するキーワードを記憶するキーワード記憶手段と、特定情報評価値記憶手段と、計数手段と、制御手段とを有する特定情報に関連する文書を検索する特定情報検索装置における特定情報検索方法において、
前記制御手段は、
前記入力手段により入力された被検索文書を単語辞書記憶手段と照合し、文単位および単語単位に分解して単語系列記憶手段に記憶する第1のステップと、
前記単語系列記憶手段から少なくとも1つの文単位を照合領域として読み出し、該文単位内における単語をキーワード記憶手段と照合して、キーワードと一致する単語の数を前記計数手段で計数させ、計数結果が所定条件を満たすとき該計数結果に基づき該照合領域における特定情報評価値を求め、特定情報評価値記憶手段に記憶させる第2のステップと、
記憶された特定情報評価値が所定値以上であれば、前記被検索文書が特定情報に関連する文書であることを判別する第3のステップとを実行する特定情報検索方法。 - 請求項1に記載の特定情報検索方法であって、第2のステップにおいて、照合領域を被検索文書の先頭の文単位から末尾の文単位までの領域の間で、1つの文単位以上の間隔で順次シフトさせて設定し、求められた各照合領域における特定情報評価値を累算し、特定情報評価値記憶手段に記憶させることを特徴とする特定情報検索方法。
- 請求項2に記載の特定情報検索方法であって、第2のステップにおいて、照合領域をシフトさせる都度、特定情報評価値を累算し特定情報評価値記憶手段に記憶させて第2ステップを終了し、第3ステップを実行して、特定情報評価値が所定値以下であれば第2ステップに戻り、シフトされた照合領域の特定情報評価値を更に累算し、第3ステップに進むことを繰り返し実行する特定情報検索方法。
- 請求項1〜3のいずれかに記載の特定情報検索方法であって、検索エンジンに対し所定の特定情報に関する複数のキーワードを検索キーとして検索を実行することにより、インターネットを介して収集した所定の特定情報に関するキーワードが含まれる検索文書を被検索文書として被検索文書入力手段に入力することを特徴とする特定情報検索方法。
- 請求項4に記載の特定情報検索方法であって、前記検索文書に含まれる少なくとも1階層分のリンク先から収集した文書を被検索文書として前記検索文書に加えて被検索文書入力手段に入力することを特徴とする特定情報検索方法。
- 請求項4又は5に記載の特定情報検索方法であって、特定情報検索装置はさらに候補除外リスト記憶手段を有し、前記制御装置は、被検索文書を記憶された候補除外リストと照合し、これに該当する文書の被検索文書入力手段への入力を除外することを特徴とする特定情報検索方法。
- 特定情報に関連する文書を検索する特定情報検索装置と、特定情報検索装置と通信可能な端末装置と、インターネットへのアクセス手段とを備える情報検索装置であって、
端末装置は、特定情報検索装置に特定情報に関するキーワードと検索要求信号を送信する入力手段と、特定情報検索装置から送られる特定情報に関する情報を表示する表示手段とを備え、
特定情報検索装置は、被検索文書入力手段と、特定情報に関するキーワード入力手段と、単語辞書記憶手段と、単語系列記憶手段と、特定情報に関するキーワードを記憶するキーワード記憶手段と、特定情報評価値記憶手段と、計数手段と、制御手段と、特定情報関連文書記憶手段と、送信手段とを有し、
前記制御手段は、
特定情報に関するキーワードと検索要求信号を受信すると、受信したキーワードに基づいて前記インターネットアクセス手段を介して検索エンジンによって被検索文書を収集して前記被検索文書入力手段に入力し、入力された被検索文書を単語辞書記憶手段と照合して文単位内および単語単位に分解して単語系列記憶手段に記憶させ、前記単語系列記憶手段から少なくとも1つの文単位をキーワード記憶手段との照合領域として読み出し、該文単位内における単語をキーワード記憶手段と照合して、キーワードと一致する単語の数を前記計数手段で計数させ、計数結果が所定条件を満たすとき該計数結果に基づき特定情報評価値を求め前記特定情報評価値記憶手段に記憶させ、特定情報評価値が所定値以上であれば、前記被検索文書が特定情報に関連する文書であることを判別して該文書を前記特定情報関連文書記憶手段に記憶させ、特定情報関連文書記憶手段に記憶された文書を前記送信手段により前記端末装置に送信する、
ことを特徴とする情報検索装置。 - 請求項7に記載の情報検索装置であって、特定情報の検索装置における制御手段は、照合領域を被検索文書の先頭の文単位から末尾の文単位までの領域の間で、1つの文単位以上の間隔で順次シフトさせて設定し、求められた各照合領域における特定情報評価値を累算して特定情報評価値記憶手段に記憶させることを特徴とする情報検索装置。
- 請求項7又は8に記載の情報検索装置であって、特定文書検索装置の制御手段は、前記インターネットアクセス手段を介して収集した被検索文書に含まれる少なくとも1階層分のリンク先から収集した文書を被検索文書入力手段に入力することを特徴とする情報検索装置。
- コンピュータに請求項1〜6に記載の特定情報検索方法の手順を実行させるためのプログラム。
- 請求項10に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002251743A JP4213931B2 (ja) | 2002-08-29 | 2002-08-29 | 特定情報検索方法および情報検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002251743A JP4213931B2 (ja) | 2002-08-29 | 2002-08-29 | 特定情報検索方法および情報検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004094387A true JP2004094387A (ja) | 2004-03-25 |
JP4213931B2 JP4213931B2 (ja) | 2009-01-28 |
Family
ID=32058248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002251743A Expired - Fee Related JP4213931B2 (ja) | 2002-08-29 | 2002-08-29 | 特定情報検索方法および情報検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4213931B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008542926A (ja) * | 2005-06-03 | 2008-11-27 | トムソン グローバル リソーシーズ | オープンウェブコンテンツへのアクセスを備えるペイフォーアクセス法律調査システム |
WO2009066501A1 (ja) * | 2007-11-19 | 2009-05-28 | Nippon Telegraph And Telephone Corporation | 情報検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 |
JP2010267109A (ja) * | 2009-05-15 | 2010-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法、情報検索装置、情報検索プログラム |
-
2002
- 2002-08-29 JP JP2002251743A patent/JP4213931B2/ja not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008542926A (ja) * | 2005-06-03 | 2008-11-27 | トムソン グローバル リソーシーズ | オープンウェブコンテンツへのアクセスを備えるペイフォーアクセス法律調査システム |
WO2009066501A1 (ja) * | 2007-11-19 | 2009-05-28 | Nippon Telegraph And Telephone Corporation | 情報検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 |
JP5116775B2 (ja) * | 2007-11-19 | 2013-01-09 | 日本電信電話株式会社 | 情報検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 |
US8909654B2 (en) | 2007-11-19 | 2014-12-09 | Nippon Telegraph And Telephone Corporation | Information search method, apparatus, program and computer readable recording medium |
JP2010267109A (ja) * | 2009-05-15 | 2010-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法、情報検索装置、情報検索プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4213931B2 (ja) | 2009-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6480835B1 (en) | Method and system for searching on integrated metadata | |
EP2315135B1 (en) | Document search system | |
US6389412B1 (en) | Method and system for constructing integrated metadata | |
US8326842B2 (en) | Semantic table of contents for search results | |
Segev et al. | Context-based matching and ranking of web services for composition | |
KR101120760B1 (ko) | 구조화 문서 검색 | |
US20060224579A1 (en) | Data mining techniques for improving search engine relevance | |
US20030105589A1 (en) | Media agent | |
US20040068495A1 (en) | Method and system for retrieving a document and computer readable storage meidum | |
US20050060290A1 (en) | Automatic query routing and rank configuration for search queries in an information retrieval system | |
US20080189273A1 (en) | System and method for utilizing advanced search and highlighting techniques for isolating subsets of relevant content data | |
US20030004932A1 (en) | Method and system for knowledge repository exploration and visualization | |
US20150186540A1 (en) | Method for inputting and processing feature word of file content | |
US5893094A (en) | Method and apparatus using run length encoding to evaluate a database | |
US7024405B2 (en) | Method and apparatus for improved internet searching | |
US20060179041A1 (en) | Search system and search method | |
US20060288038A1 (en) | Generation of a blended classification model | |
JP2007527558A (ja) | ウェブサイトなどの情報源によるナビゲーション | |
US20110208715A1 (en) | Automatically mining intents of a group of queries | |
US8458187B2 (en) | Methods and systems for visualizing topic location in a document redundancy graph | |
US9971782B2 (en) | Document tagging and retrieval using entity specifiers | |
US6278990B1 (en) | Sort system for text retrieval | |
Kantorski et al. | Automatic filling of hidden web forms: A survey | |
JP2001290843A (ja) | 文書検索装置及びその方法並びに文書検索プログラム及びそのプログラムを記録した記録媒体 | |
JP2003271609A (ja) | 情報監視装置及び情報監視方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080603 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081007 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081031 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111107 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111107 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121107 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121107 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131107 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |