JP2003256471A - 検索システム、システム、端末、検索方法およびプログラム - Google Patents

検索システム、システム、端末、検索方法およびプログラム

Info

Publication number
JP2003256471A
JP2003256471A JP2002046934A JP2002046934A JP2003256471A JP 2003256471 A JP2003256471 A JP 2003256471A JP 2002046934 A JP2002046934 A JP 2002046934A JP 2002046934 A JP2002046934 A JP 2002046934A JP 2003256471 A JP2003256471 A JP 2003256471A
Authority
JP
Japan
Prior art keywords
search
document
user
selection
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002046934A
Other languages
English (en)
Other versions
JP3791908B2 (ja
Inventor
Takeo Kawamura
建夫 川村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2002046934A priority Critical patent/JP3791908B2/ja
Priority to US10/366,833 priority patent/US7110996B2/en
Publication of JP2003256471A publication Critical patent/JP2003256471A/ja
Application granted granted Critical
Publication of JP3791908B2 publication Critical patent/JP3791908B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 効率良く目的とする文書を抽出できる検索サ
ービス提供システムを提供する。 【解決手段】 検索サービス提供システムは、ユーザが
使用するユーザ端末10の要求に応じてサーバ20が検
索処理を行う。まずユーザ端末10の要求に応じてサー
バ20は全文検索実行部22において全文検索を行う。
得られた全文検索の結果に対し、ユーザによる文書の選
択が行われ、ユーザ端末10は類似文書検索を要求す
る。それに対して、サーバ20は類似文書検索実行部2
3において、選択された文書の過去の選択履歴を選択履
歴データ蓄積部34から抽出し、過去の検索結果におい
て選択された文書と同時に選択された他の文書を抽出す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データベースにお
ける検索において、効率的に目的とするものを抽出する
ことができる検索システム等に関する。
【0002】
【従来の技術】近年、多くのコンピュータ装置が、イン
ターネット、社内ネットワーク、LAN(Local Area N
etwork)等のネットワークに接続されて使用されてい
る。これらネットワークには、サービスを提供するコン
ピュータ装置としてサーバが接続されており、様々な情
報がこのサーバに蓄積されている。ユーザは、自分が使
用する端末であるコンピュータ装置を、ネットワークを
介してサーバに接続させ、様々な情報を入手することが
できる。
【0003】ところで、ユーザが情報を取得するには、
多量に蓄積された情報から、目的とする情報を抽出する
処理を行う必要がある。その方法としては、例えば、ユ
ーザが目的とする情報に含まれるであろうキーワードを
想定し、多量に蓄積された情報からそのキーワードを含
んだデータを抽出する。このような抽出処理では、検索
エンジンと呼ばれるプログラムが広く使用されている。
この検索エンジンは、サーバに蓄積された情報を広くサ
ーチし、ユーザが指定したキーワードを含むデータを自
動的に抽出する。その結果、ユーザはそのキーワードを
含んでいるデータを入手することができる。
【0004】
【発明が解決しようとする課題】しかしながら、このよ
うな検索エンジンを用いて得られるデータの全てが、ユ
ーザの目的とする情報であるとは限られない。例えば、
「OLE for Process Control」(プロセス制御のためのO
LE)についての情報を入手したい場合を例に挙げて説明
すると、「OLE for Process Control 」はしばしば「O
PC」という省略語で表現されているので、正式な名称
「OLE for Process Control 」をキーワードとして検索
しても、「OPC」として表記されている情報は取得す
ることができない。そこで、キーワードとしてこの「O
PC」を含めて検索を行うと、「OPC」を含むデータ
を全て抽出することが可能となる。
【0005】ところが、「OPC」は「Organic Photo
Conductor」(有機光半導体)の省略語でもあるため、
ユーザが目的とする「OLE for Process Control」のデ
ータと共に、全く関係のない「Organic Photo Conducto
r」のデータも抽出されてしまう。したがって、ユーザ
は抽出されたデータの中から、個別に必要なデータをピ
ックアップしなければならない。この場合、抽出された
データが多ければ多いほど、目的とするデータを探し出
す作業に時間を要し、また大変な手間がかかる。
【0006】一方、「OLE for Process Control」に関
連する新たなキーワード、例えば「制御」をさらに掛け
合わせることにより、全く関係のない「Organic Photo
Conductor」のデータを排除し、抽出されたデータを絞
り込むことも可能である。しかしこの処理を行うと、
「OLE for Process Control」のデータであっても、新
たなキーワード「制御」を含んでいないものは抽出され
ない。したがって、本来であれば抽出されるべき「OLE
for Process Control」のデータまで排除される可能性
が生じてしまう。このように絞り込み検索を行って不必
要なデータを排除しようとすると、必要なデータまで排
除されてしまい、目的とするデータが得られないといっ
た問題が生じる。
【0007】本発明は、上記のような技術的課題に基づ
いてなされたもので、ユーザが必要な情報をより的確に
抽出することができる検索システム等を提供することを
主たる目的とする。
【0008】
【課題を解決するための手段】かかる目的のもと、本発
明の検索システムは、あらかじめ記憶された文書に対す
る検索処理を実行するサーバと、サーバに対して検索処
理を要求する少なくとも1つの端末を備えた検索システ
ムであって、端末は、検索結果に示される所定の文書に
対するユーザの指定を受け付け、指定された文書(指定
文書)に基づく拡張検索をサーバに対して要求し、サー
バは、拡張検索の要求を受け付け、ユーザもしくはその
他のユーザまたは両方が過去に行った検索処理において
同時に選択した少なくとも1つの文書からなる1または
複数のグループにおいて、指定文書が属するグループを
抽出し、抽出されたグループに属する文書を拡張検索結
果として出力することを特徴とするものである。この検
索システムでは、過去において行われた検索処理を利用
して検索を行うことで、目的とする文書を抽出すること
ができる。
【0009】この検索システムにおいては、端末は、検
索結果および拡張検索結果に含まれる文書に対してユー
ザが行った選択をサーバへ送出し、サーバは、選択から
新たなグループを作成し、新たなグループを選択履歴と
して記憶することができる。また、端末は、拡張検索の
要求の前において検索用タームに基づく準備用検索をサ
ーバに対して要求し、指定文書は、準備用検索の結果か
ら選択された文書とすることができる。この場合、サー
バは、準備用検索に用いた検索用タームを検索結果と共
に選択履歴として記憶することが好ましい。
【0010】また、本発明はサーバ等のシステムとして
捉えることもできる。本発明のシステムは、ユーザから
の要求に応じてオブジェクトの検索処理を行うシステム
であって、過去の検索処理において、ユーザもしくはそ
の他のユーザまたはその両方が、過去において行った検
索処理において同時に選択したオブジェクトを選択履歴
データとして記憶する選択履歴記憶部と、拡張検索用に
ユーザが指定したオブジェクト(指定オブジェクト)に
基づく拡張検索要求を受け付ける受付部と、指定オブジ
ェクトの履歴データが、選択履歴記憶部に記憶されてい
るか否かを判断する判断部と、指定オブジェクトの履歴
データが選択履歴記憶部に記憶されていると判断部によ
り判断されると、選択履歴記憶部に記憶された検索結果
から指定オブジェクトと同時に選択された1または複数
のオブジェクトを特定するオブジェクト特定部と、を備
えたことを特徴とするものである。
【0011】このシステムは、オブジェクトを蓄積した
オブジェクト・データベースと、オブジェクト特定部に
より特定されたオブジェクトを、オブジェクト・データ
ベースから抽出するオブジェクト抽出部と、をさらに備
えることができる。また、システムは、過去に選択され
た回数に関するデータをオブジェクト毎に記憶する選択
回数記憶部をさらに備えていてもよい。
【0012】さらに、本発明は端末として捉えることも
できる。本発明の端末は、ネットワークを介してサーバ
に接続し、目的とするオブジェクトをサーバから抽出可
能な端末であって、ユーザからの検索指示を受け付ける
入力部と、検索指示に基づいてサーバに対して検索の要
求を送出し、検索の結果を受信する送受信部と、ユーザ
からの入力およびサーバから送出されたデータを表示す
る表示部とを備え、表示部は、サーバから受信した検索
の結果に示されたオブジェクトのうち、任意のオブジェ
クトの選択を可能とする選択部と、選択されたオブジェ
クトについての類似検索指示の受け付けを可能とする受
け付け部と、を表示することを特徴とするものである。
【0013】端末の表示部は、類似検索の結果ととも
に、結果に含まれる類似オブジェクトの選択を可能とす
る類似オブジェクト選択部を表示することもできる。ま
た表示部は、類似検索の結果として、選択されたオブジ
ェクトに類似する類似オブジェクトと共に、類似オブジ
ェクトが過去に選択された回数を表示するものであって
もよい。
【0014】その他、本発明は検索方法として捉えるこ
ともできる。この検索方法は、データベースから目的と
する文書の検索を行う検索方法であって、ユーザの要求
に応じて所定のタームを基に1次検索を行うステップ
と、1次検索の結果に対して所定の文書の選択を受け付
けるステップと、選択された所定の文書に基づいて2次
検索を行うステップとを有し、2次検索では、ユーザも
しくはその他のユーザまたはその両方を含むユーザによ
る過去の検索処理において所定の文書が抽出されたこと
がある場合に、所定の文書と同時に選択された履歴を有
する文書を抽出することを特徴とする方法である。
【0015】この検索方法は、2次検索において抽出さ
れた文書に対し、ユーザより同時に選択された文書を新
たな検索結果として記憶するステップをさらに有するこ
とが好ましい。
【0016】さらに、本発明はプログラムとして捉える
こともできる。このプログラムは、類似検索処理をコン
ピュータ装置に実行させるためのプログラムであって、
複数のユーザによって行われた検索における検索結果に
対し、ユーザによって選択されたオブジェクトの選択履
歴を記憶する手順と、検索用オブジェクトを指定した類
似検索要求を受け付ける手順と、指定された検索用オブ
ジェクトについての選択履歴が既に記憶されている場
合、選択履歴を抽出する手順と、選択履歴から、検索用
オブジェクトと共通点を有する類似オブジェクトを抽出
する手順とをコンピュータ装置に実行させることを特徴
とするプログラムである。
【0017】このプログラムにおいて、共通点は、例え
ば類似オブジェクトが、検索用オブジェクトと同時に抽
出されたことである。また、共通点は、類似オブジェク
トが、検索用オブジェクトと同じキーワードで抽出され
たことである。
【0018】また本発明のプログラムは、コンピュータ
装置において検索要求を処理させるためのプログラムで
あって、ユーザからの検索指示を受け付ける手順と、検
索指示に基づいて検索の要求を行う手順と、検索の結果
とともに、所定のオブジェクトを選択する選択手段をユ
ーザに対して表示する手順と、選択された所定のオブジ
ェクトについて他人の検索結果を得るための類似検索指
示を受け付ける受付手段をユーザに対して表示する手順
と、類似検索指示に基づいて検索指示を行い、他人の検
索結果を入手する手順と、をコンピュータ装置に実行さ
せることを特徴とするプログラムである。
【0019】このプログラムは、類似検索の結果ととも
に、結果に含まれる類似オブジェクトを選択する選択手
段をユーザに対して表示する手順をさらにコンピュータ
装置に実行させることができる。また、類似検索の結果
として、所定のオブジェクトに類似するオブジェクトと
共に、類似オブジェクトが過去に選択された回数を表示
する手順をさらにコンピュータ装置に実行させることも
できる。
【0020】
【発明の実施の形態】以下、添付図面に示す実施の形態
に基づいて本発明を詳細に説明する。図1は、実施の形
態における検索サービス提供システムを説明する図であ
る。この検索サービス提供システム(検索システム)で
は、ユーザが検索を行って目的とする文書(オブジェク
ト)を探し出す処理に使用するユーザ端末10と、文書
データを蓄積して検索を実行するサーバ20と、を備え
ており、それぞれインターネット等のネットワークを介
して接続されている。
【0021】ユーザ端末10は、ネットワークを介して
データの送受信を行う送受信部11と、ユーザからの入
力を受け付けるキーボードやマウス等の入力部12と、
出力されるデータを表示するディスプレイ等の表示部1
3と、CPU等で構成される演算処理部14と、を備え
ている。
【0022】サーバ20は、ネットワークを介してデー
タの送受信を行う送受信部21と、全文検索を実行する
全文検索実行部22と、類似文書の検索を実行する類似
文書検索実行部23と、選択履歴蓄積処理部24と、デ
ータの一時保存を行うメモリ等で構成された記憶部25
と、文書のデータを蓄積した文書データベース(以下、
データベースをDBと称す)30と、検索履歴のデータ
を蓄積した履歴DB33(と、を備えている。ここで、
あるユーザAが選択した文書Xがあるとした場合、文書
Xの「類似文書」とは、過去の検索処理(ユーザA以外
のユーザによる検索を含む。)において、文書Xととも
に選択されたことがある文書のことをいう。1回の検索
処理で同時に選ばれる文書は、関連性が強いと考えられ
ることから、このように称する。
【0023】サーバ20において、記憶部25は、全文
検索結果を一時的に保存する全文検索結果記憶部26
と、類似文書の検索結果を一時的に保存する類似文書検
索結果記憶部27と、ユーザが選択した文書を一時的に
保存する選択結果記憶部28と、を備えている。文書D
B30は、文書データを検索しやすくするために作成さ
れた索引データを蓄積する索引データ蓄積部31と、文
書データそのものを蓄積する本文データ蓄積部32と、
を備えている。履歴DB33は、ユーザが選択した文書
データの履歴データを蓄積する選択履歴データ蓄積部3
4を備えている。また、必要な場合には、文書データご
とに選択された回数のデータを蓄積する選択回数データ
蓄積部35も備えている。
【0024】図1に示す検索サービス提供システムで
は、全文検索(1次検索、準備用検索)を行った後、続
けて類似文書検索(2次検索、拡張検索)を行うこと
で、検索を行うユーザが目的とする文書を簡単に且つ高
精度で抽出することができる。以下、検索サービス提供
システムにおける検索処理について具体的に説明する。
【0025】図2は、ユーザ端末10における処理の流
れを示す図である。図3は、ユーザ端末10の表示部1
3に表示されるメイン画面を示す図である。まず、ユー
ザ端末10は、ユーザによる入力部12を介した全文検
索の要求があるか否かを判断する(ステップS10
1)。具体的には、図3に示す全文検索ボタン50がユ
ーザによって押されると、ユーザ端末10は全文検索の
要求があったと判断し、図4に示すようなキーワードを
入力するウィンドウを表示部13に表示する。ユーザは
このキーワードを入力する枠内に、ユーザが取得したい
情報に含まれるであろうキーワードを入力する。なお、
図4に示す枠内には、「検索」と「履歴」が「AND」
で繋がれているので、この場合「検索」と「履歴」の双
方のキーワードが含まれる文書データが抽出されること
となる。
【0026】ステップS101において、ユーザ端末1
0が全文検索の要求はないと判断した場合、後述のステ
ップS113の処理が行われる。一方、全文検索の要求
があると判断した場合、サーバ20に対して全文検索を
実行するように、ユーザ端末10は送受信部11を介し
て全文検索実行要求を送出する(ステップS103)。
このとき、ユーザが図4に示す枠内に入力したキーワー
ドも一緒に送出する。そして、この全文検索実行要求に
対してサーバ20からネットワークを介して送信された
全文検索結果を、ユーザ端末10は送受信部11におい
て受信する(ステップS105)。
【0027】続いて、ユーザ端末10は、受信した全文
検索結果を表示部13に表示する(ステップS10
7)。図5は、表示部13に表示される全文検索結果の
画面を示す図である。図5に示すように、全文検索結果
の画面には、抽出された文書データごとに選択ボタン
(選択部)51が表示されており、ユーザが所定の文書
データを選択できるようになっている。なお、この選択
に際し、ユーザは画面に表示されたタイトルを元に所定
の文書データを選択することができるが、その文書デー
タの本文を参照することで選択することも可能である。
具体的には、タイトルを選択指示する(例えば入力部1
2に接続されたマウスで下線が引かれているタイトルを
クリックする)ことで、図6に示すような文書データの
本文52を表示させることができる。なお、図6に示す
ように、本文52を表示させているウィンドウ内にも、
その文書データを選択するための選択ボタン53を表示
させることもできる。なお、以下に述べる画面において
タイトルの下に下線が引かれているものについては、同
様に選択指示することで本文52を表示することが可能
である。
【0028】このようにして選択ボタン53がチェック
された文書データに対して、ユーザ端末10は選択文書
リストへの追加要求があるか否かを判断する(ステップ
S109)。具体的には図5に示す全文検索結果の画面
において、選択文書リストに追加ボタン54がユーザに
よって押されたか否かによって判断する。ステップS1
09において、ユーザ端末10は、選択文書リストに追
加要求がないと判断した場合、後述のステップS113
の処理が行われる。追加要求があると判断した場合、選
択文書リストにおいて選択された文書を選択文書リスト
に追加し、さらに選択文書リストのデータをサーバ20
に対して送出する(ステップS111)。このとき、図
5に示す全文検索結果の選択ボタン51において選択さ
れた文書のリストが、図7に示すように、メイン画面に
表示される。
【0029】続けて、ユーザ端末10は、類似文書検索
要求があるか否かを判断する(ステップS113)。ま
ず、ユーザは図7に示すメイン画面において表示された
文書のリストにおいて、選択ボタン51をチェックする
ことにより類似文書検索時の基本となる文書を選択す
る。このようにメイン画面において所定の文書が選択さ
れた状態で図7に示すメイン画面の類似文書検索ボタン
(受け付け部)55が押されると、ユーザ端末10は類
似文書検索の要求がなされたと判断する。
【0030】ステップS113において、ユーザ端末1
0が類似文書検索の要求はないと判断した場合、後述の
ステップS125の処理が行われる。一方、類似文書検
索の要求があると判断した場合、ユーザ端末10は送受
信部11を介してサーバ20へ類似文書検索実行要求を
送出する(ステップS115)。このとき、類似文書検
索時の基本となる選択された文書を指定するデータも一
緒に送出する。そして、この類似文書検索実行要求に対
してサーバ20からネットワークを介して送信された類
似文書検索結果を、ユーザ端末10は送受信部11にお
いて受信する(ステップS117)。
【0031】ここで、類似文書検索結果とは、全文検索
の結果に対して選択された文書が、過去の他の検索にお
いて選択されたことがある場合に抽出される文書グルー
プである。具体的には、他の検索時において今回選択さ
れた文書と、その文書と同時に選択された文書とを含む
文書グループである。更なる詳細は、後述のサーバ20
における処理において説明する。なお、類似文書検索に
おいて、図7のリスト中の文書を複数選択してもよい。
この場合、選択された全ての文書が含まれる文書グルー
プを抽出するものであってもよいし(AND抽出)、選
択された文書のいずれかが含まれる文書グループを抽出
するものであってもよい(OR抽出)。また抽出の方法
は、類似文書検索の要求をする際にどちらの方法を希望
するかユーザが選択することもできる。
【0032】続いて、ユーザ端末10は、受信した類似
検索結果を表示部13に表示する(ステップS11
9)。図8は、表示部13に表示される類似文書検索結
果の画面を示す図である。図8に示すように類似検索結
果の画面には、図5に示す全文検索結果の画面と同様
に、文書毎に選択ボタン56が表示されている。ここで
既に選択済みの文書は、着色したり、チェック不能な入
力属性を持たせることにより、識別可能とすることがで
きる。さらに、選択ボタン56の隣には符号57に示す
ようにその文書が過去に何回選択されたかの回数が文書
毎に表示されている。過去に選択された回数が多いほ
ど、重要性が高い文書であることが多い。したがって、
ユーザは、文書のタイトル、本文だけでなく、その文書
が過去に選択された回数を参考にして、類似文書検索結
果の中から適当であると思う文書を選択することができ
る。
【0033】このようにして選択ボタン56がチェック
されたリストに対して、ユーザ端末10は選択文書リス
トへの追加要求があるか否かを判断する(ステップS1
21)。ユーザ端末10が、選択文書リストに追加要求
がないと判断した場合、後述のステップS125の処理
が行われる。追加要求があると判断した場合、選択文書
リストに選択された文書を追加し、さらに選択文書リス
トのデータをサーバ20に対して送出する(ステップS
123)。このとき、図8に示す類似文書検索結果の選
択ボタン56において選択された文書のリストが、図9
に示すように、メイン画面に表示される。
【0034】続けて、ユーザ端末10は、終了要求があ
るか否かを判断する(ステップS125)。これは、図
9に示すメイン画面において表示されている終了ボタン
58がユーザによって押されたかどうかに基づいて判断
する。終了要求はないと判断した場合、ステップS10
1に戻って上記の処理を再度行う。終了要求があると判
断した場合、図9に示す文書のリストにおいて選択され
ている文書を指定する選択文書リストをサーバ20に送
出し(ステップS127)、本処理を終了する。なお、
このように終了要求があった場合、最終的にユーザが選
択したリストをユーザが後に使用することができる。具
体的には、最終的に選択されたリストを、ユーザ端末1
0に保存し、ユーザが希望するときに最終的な選択要求
されたリストに追加したときの文書が閲覧できるように
することが可能である。また、ユーザは他のアプリケー
ション、例えば電子メール等において使用することがで
きる。なお、ここでは、選択マークがついている文書の
みを選択文書リストに含めるように構成してもよい。
【0035】次に、サーバ20における処理の流れを説
明する。図10は、サーバ20における処理の流れを示
す図である。まず、サーバ20は、送受信部21を介し
てユーザ端末10が送出した全文検索実行要求を受信し
たか否かを判断する(ステップS201)。全文検索実
行要求を受信していないと判断した場合、後述のステッ
プS213の処理が行われる。一方、全文検索実行要求
を受信したと判断した場合、サーバ20は、全文検索実
行要求と共に送られてきたキーワードを基に全文検索実
行部22において全文検索を実行する(ステップS20
3)。
【0036】図11は、文書DB30の索引データ蓄積
部31に蓄積されたデータの一例を示す図である。ステ
ップS203における全文検索は、全文検索実行部22
が索引データ蓄積部31において検索に際し指定された
キーワードが図11に示す索引情報に含まれている文書
を抽出する。そして、抽出した全文検索結果は記憶部2
5の全文検索結果記憶部26に一時的に保存される(ス
テップS205)。ここで、図13に全文検索結果記憶
部26に保存されるデータの一例を示す。続けて、サー
バ20は送受信部21を介して全文検索結果をユーザ端
末10へ送出する(ステップS207)。
【0037】なお、送出した全文検索結果に関連して、
ユーザ端末10から所定の文書の本文の閲覧要求が送出
される場合がある。この場合、指定された文書に対応す
る本文のデータを文書DB30の本文データ蓄積部32
から抽出してユーザ端末10へ対して送出する。具体的
には、本文データ蓄積部32に蓄積された図12に示す
ようなデータにおいて、該当するファイル名の本文デー
タを抽出する。尚、本文の閲覧要求は、以下の処理にお
いても、要求がある度に随時行われる。
【0038】続けて、サーバ20は、ユーザ端末10が
送出した選択文書リストのデータを受信したか否かを判
断する(ステップS209)。選択文書リストのデータ
を受信していないと判断した場合には、後述のステップ
S213の処理が行われる。選択文書リストのデータを
受信したと判断した場合、記憶部25の選択結果記憶部
28に選択結果として選択文書リストのデータを一時保
存する(ステップS211)。
【0039】次に、サーバ20は、ユーザ端末10が送
出した類似文書検索実行要求を受信したか否かを判断す
る(ステップS213)。類似文書検索実行要求を受け
付けていないと判断した場合、後述のステップS225
の処理が行われる。一方、類似文書検索実行要求を受信
したと判断した場合、サーバ20は、類似文書検索実行
要求と共に送られてきた選択文書リスト中の文書の識別
番号(以下、文書IDという)を基に類似文書検索実行
部23において類似文書検索を実行する(ステップS2
15)。ここで、類似文書検索について詳細を説明す
る。
【0040】図14は、類似文書検索における具体的な
処理の流れを示す図である。まず、サーバ20の類似文
書検索実行部23は、選択文書リストから類似文書検索
のために選択された文書(以下、指定文書)についての
選択履歴データが、履歴DB33の選択履歴データ蓄積
部34に蓄積されているか否かを判断する(ステップS
301)。具体的には、類似文書検索の際に図7に示す
メイン画面においてユーザによって選択された文書の文
書IDと同じ文書IDを有する選択履歴データが、履歴
DB33の選択履歴データ蓄積部34にあるか否かを調
査し、その同じ文書IDのデータを抽出する。図15
は、履歴DB33の選択履歴データ蓄積部34に蓄積さ
れた選択履歴データの一例を示す図である。例えば図7
に示すような選択がされていた場合、まず選択ボタン5
1がチェックされている文書ID=821について、図
15に示す選択履歴データ蓄積部34に蓄積された選択
履歴データから文書ID=821の選択履歴データを探
し出す。
【0041】ここで選択履歴データとは、過去の検索処
理において、ユーザ(同じユーザに限られない)が検索
した結果、得られた複数の文書の集合体の中から、最終
的にユーザが閲覧を希望するのに選択された文書からな
るグループである。例えば図15では、選択IDがXX
の文書が複数個存在するが、これらの文書はXX番目の
検索時においてユーザによって最終的に閲覧を希望する
ために同時に選択された文書である。なお、最終的に閲
覧を希望する際に選択される文書とは、後述する図10
におけるステップS227で受信する選択文書リストの
文書である。
【0042】ステップS301において類似文書検索実
行部23が指定文書についての選択履歴データはないと
判断した場合、図14に示す類似文書検索の処理は終了
する。一方、指定文書についての選択履歴データはある
と判断した場合、その指定文書の選択履歴データが属す
る文書グループ(同じ選択IDを有する文書のグルー
プ)を1つ抽出する(ステップS303)。例えば図1
5において指定文書が文書ID=821の場合、選択I
DがXXの文書グループを抽出する。続けて、文書グル
ープ内の1つの文書について選択履歴データを抽出する
(ステップS305)。例えば図15において文書グル
ープとして選択IDがXXの選択履歴データを抽出した
場合、文書ID=321、821、1094のうちの1
つ、例えば文書ID=321の選択履歴データを抽出す
る。
【0043】続けて、類似文書検索実行部23は、ステ
ップS305において抽出した選択履歴データの文書
が、類似文書検索結果にリストアップ済みか否か(類似
文書検索結果記憶部27に記憶された文書であるか否
か)を判断する(ステップS307)。リストアップさ
れていないと判断した場合、その文書に関するデータを
類似文書検索結果記憶部27に記憶し、リストアップす
る(ステップS308)。ステップS308でリストア
ップ後およびステップS307でリストアップ済みと判
断された場合、この抽出された文書の選択回数データ
(図16参照)に1を加える(ステップS309)。こ
のような計数処理を行うことで、過去に選択された回数
を単純に合計する場合と比べて、指定文書との関係でよ
り選択頻度の高い文書を示すことが可能となる。次に、
ステップS303において抽出された文書グループ内の
文書は全てリストアップ済みか否かを判断する(ステッ
プS310)。抽出された文書グループ内の文書におい
てリストアップ済みでないものが未だあると判断した場
合、ステップS305へ戻り、文書グループ内の文書が
全てリストアップされるまで処理が繰り返される。
【0044】ステップS310において抽出された文書
グループ内の文書が全てリストアップされたと判断した
場合、選択履歴データ蓄積部34において、選択された
文書と同じ選択IDを有する文書グループは全て抽出さ
れたか否かを判断する(ステップS311)。例えば指
定文書が文書ID=821の場合、図15に示す選択履
歴データでは、選択IDがXXの他に、選択IDがYY
のデータが存在する。このように1つの選択された文書
に対して複数の選択履歴データが存在することがある場
合には、その選択履歴データを含む文書グループの全て
を抽出するようにする。
【0045】ステップS311において、未だ全ての文
書グループが抽出されていないと判断した場合、ステッ
プS303へ戻って次の文書グループを抽出し、選択履
歴データ蓄積部34において指定文書と同じ選択IDを
有する文書グループが全て抽出されるまで処理が繰り返
される。そして、ステップS311において全ての文書
グループが抽出されたと判断した場合、類似文書検索の
処理を終了する。
【0046】以上のようにして、図10のステップS2
15における類似文書検索が実行された後、得られた類
似文書検索結果を、サーバ20は記憶部25の類似文書
検索結果記憶部27に一時的に保存する(ステップS2
17)。図16に類似文書検索結果記憶部27に保存す
るデータの一例を示す。続けて、サーバ20は類似文書
検索結果を、送受信部21を介してユーザ端末10へと
送出する(ステップS219)。このとき、類似文書検
索結果として、選択履歴データと共にその文書について
の選択回数のデータを一緒に送出する。なお、本発明で
は前述のとおり類似文書の検索処理の過程で選択回数デ
ータを蓄積するが、過去の選択回数を履歴DB33の蓄
積データからまとめて個別に計算しておき、その合計数
を選択回数データとして送出するように構成してもよ
い。
【0047】続けて、サーバ20は、類似文書検索結果
に対する選択文書リストのデータをユーザ端末10から
受信したか否かを判断する(ステップS221)。選択
文書リストのデータを受信していないと判断した場合に
は、後述のステップS225の処理が行われる。選択文
書リストのデータを受信したと判断した場合、記憶部2
5の選択結果記憶部28に選択結果を更新して、一時保
存する(ステップS223)。ここで、図17に選択結
果記憶部28に保存されたデータの一例を示す。
【0048】そして、サーバ20は検索処理の終了要求
をユーザ端末10から受信したか否かを判断する(ステ
ップS225)。終了要求を受け付けていないと判断し
た場合、ステップS201へ戻って、上記の検索処理を
引き続き行う。例えば、ステップS215において類似
文書検索実行を行った結果得られた類似文書検索結果の
リストの中から、さらに文書を選択して、その文書につ
いての類似文書検索の要求が行われる可能性がある。一
方、サーバ20が終了要求を受信したと判断した場合、
続けてユーザ端末10から選択文書リストを受信する
(ステップS227)。選択文書リストは、類似文書検
索(類似文書検索が行われなかった場合には全文検索)
の結果に対してユーザが最終的に閲覧を希望するために
選択した文書のリストであり、例えば図9において選択
ボックスがチェックされている文書である。
【0049】サーバ20は、ステップS227において
受信した選択文書リストを履歴DB33の選択履歴デー
タ蓄積部34に保存する(ステップS229)。ここ
で、保存するときの処理について具体的に説明する。図
18は、選択文書リストの保存処理の流れを説明する図
である。まず、サーバ20の選択履歴蓄積処理部24
が、履歴DB33の選択履歴データ蓄積部34に蓄積さ
れている選択履歴データが最大保存数に達しているか否
かを判断する(ステップS401)。
【0050】ステップS401において最大保存数に達
していると選択履歴蓄積処理部24が判断した場合、選
択履歴データ蓄積部34に蓄積されている選択履歴デー
タのうち、最も古い選択履歴データが属する文書グルー
プのデータを削除する(ステップS403)。そして、
データを削除した後、またはステップS401において
最大保存数に達していないと判断した場合、選択文書リ
ストのデータ、すなわち文書IDと選択IDのデータを
選択履歴データ蓄積部34に蓄積し(ステップS40
5)、保存処理を終了する。なお、選択履歴データ蓄積
部34に蓄積できるデータ量に制限がない場合には、こ
のような保存処理を行わずに、全ての選択履歴データを
保存するものであってもよい。
【0051】このようにして、図10のステップS22
9における選択文書リストの保存が実行された後、本処
理を終了する。なお、選択回数のデータを一括して蓄積
しておく場合には、データの更新処理をステップS22
9の後に実行する(ステップS231)。この場合、デー
タの更新は、選択履歴リストにおいて選択された文書に
対し、選択回数データ蓄積部35の選択回数のデータを
1つ増分する等の処理である。後述する集約処理を事前
に行う場合には、ステップS231が必要となる。
【0052】以上のように本実施の形態では、一度全文
検索を実行した後に得られる全文検索結果において、ユ
ーザが目的とする文書、または目的とする文書に近い文
書を選択し、その文書に対する類似文書検索を行う。類
似文書検索では、過去に他のユーザが行った検索におい
て最終的に選択された文書グループを抽出することがで
きる。文書グループは、過去の検索において他のユーザ
が検索結果の中から目的とする文書を抽出した文書の集
合体である。したがって、ユーザが選択した目的とする
文書を含む文書グループは、今回のユーザの検索におい
て目的とする文書の集合体である可能性が高く、ユーザ
は目的とする文書を効率良く入手できる。
【0053】また、通常の検索では所定のキーワードを
元に検索を行うので、検索結果にはユーザが目的とする
文書とともに不必要な文書も含まれる。しかし、本実施
の形態では、類似検索の際に選択した文書とともに過去
に選択されたことがある他の文書をユーザに提示するこ
とができる。したがって、不必要な文書を高い割合で排
除することができるので、全文検索の結果において多量
の文書が抽出されても、簡単な処理によりユーザが目的
とする文書を高い割合で提示することができる。更には
通常の検索では抽出することが難しい文書や、参照頻度
が低い文書や、ユーザの全文検索において抽出できなか
った文書等も提示することができる。
【0054】なお、上記実施の形態において、図10に
示すステップS229の選択文書リストを文書グループ
として保存する処理や文書グループの作成方法は、図1
8に示す方法に限定されない。例えば、検索に使用する
複数のキーワードの組み合わせ(以下、キーワード・セ
ット)を元に目的とする文書グループを形成する方法も
ある。以下に、他の文書グループの作成方法について具
体例(キーワード・セット間の距離を利用する方法、集
約処理を事前に行う方法)を挙げて説明する。
【0055】○キーワード・セット間の距離を利用する
方法 まず、キーワード・セット間の距離を求める方法を説明
する。例えばキーワード・セットとして、2つのキーワ
ード・セットKS1、KS2があり、それぞれのキーワー
ド・セットが有するキーワード(以下、KWD)を以下に
示すものと仮定する。 KS1={KWDa、KWDb、KWDc} KS2={KWDb、KWDc、KWDd、KWDe、KWDf} ここで、キーワードはKWDa〜fと6つあるので、6次
元の空間にそれぞれKS- 1、KS-2の座標上の点K
1、KP2が存在すると考えることができる。
【0056】そこで、KP1、KP2の2点間の距離Dを
計算する。KWDの順にKWDa〜fの順で、そのキーワード
がある場合を"1"、ない場合を"0"と仮定して座標値に変
換すると以下のようになる。 KP1=(1,1,1,0,0,0) KP2=(0,1,1,1,1,1) これを用いて距離Dを計算する。 D2 =(KP1−KP2)22 =12+ 02 + 02+ 12 + 12 + 122 =4=22
【0057】距離Dは、値が大きいほどKP1、KP2
2点間の距離が大きいと言える(なお、ここでは異なる
キーワードは異なる空間軸に有るものとしている)。こ
の距離から、キーワード・セットとしてKS1を用いた
検索と、KS2を用いた検索の類似度がわかる。類似度
の判断において距離Dの値を比較するときには、単純な
値の比較ではなく、次元数に対する割合を考慮する。例
えば、距離Dの値が2の場合、4次元しかない空間では
共通点はゼロとなるが、10次元の空間であれば共通点
は8割と考えられる。
【0058】なお、検索においてより精度を上げるなら
ば、類義語を考慮に入れることが好ましい。この場合、
キーワードの座標値も"0 or 1"ではなく、類義語間の意
味の強弱に応じてより広い値をとる等の処置を行う。ま
たキーワードの中には、"システム"などのように頻繁に
用いられるがあまり検索対象との結びつきが強くないも
のも有り得る。こうしたキーワードには座標値として低
い値をつけるといった処理を行うこともできる。
【0059】○集約処理を事前に行う方法 次に、集約処理を事前に行う方法について説明する。例
えば、過去の選択結果として下記のデータが存在するも
のとする。 選択結果1 {DOC1, DOC2, DOC3, DOC4} 選択結果2 {DOC2, DOC4, DOC5} 選択結果3 {DOC5, DOC6, DOC7, DOC8, DOC9} 選択結果4 {DOC6, DOC8, DOC9} 選択結果5 {DOC9, DOC10, DOC11}
【0060】まず、これらのデータを、選択されている
文書の類似性で分類する。ここでは、文書の内容ではな
く、選択結果のパターンから分類する。具体的な分類方
法は、データの分布などから適切な分類を行う統計的な
手法として各種知られている手法を採用できる。例え
ば、選択結果間の類似性は、上記のキーワード・セット
間の距離の計算と同じものでも計算可能である。ただ
し、適切なグループ数の決め方や、距離を計算するため
の基準となる座標の決め方、大量データの処理方法等を
考慮することが好ましい。
【0061】例えば、次に示す例ではセット間の距離D
が3以下であるものは同じグループに属すると見なし
て、得られる選択文書セット1,2,3である。 選択文書セット1: (選択結果1+2)={DOC1(1), DOC2(2), DOC3(1), DOC4
(2), DOC5(1)} 選択文書セット2: (選択結果3+4)={DOC5(1), DOC6(2), DOC7(1), DOC8
(2), DOC9(2)} 選択文書セット3: (選択結果5)={DOC9(1), DOC10(1), DOC11(1)} ここで、DOCjのjは、選択されたj番目の文書を表し、
DOCj(n)のnは、文書DOCjがn回選択されたことを表
す。なお、このようなデータの集約処理は、実際に選択
結果が保存される度に行なう方法や、例えば1日分の選
択結果をまとめて、夜間などにバッチ処理するといった
方法が採用できる。
【0062】このように集約された集約データが蓄積さ
れた状態において、下記のような選択された文書に基づ
く類似文書検索が行なわれたとする。 指定文書:{DOC1, DOC5} このとき、{DOC1, DOC5}を含む選択文書セットを蓄積
された集約データから検索する。この例では、上記した
選択文書セット1が選択され、その結果は以下のように
なる。 検索結果:{DOC1(1), DOC2(2), DOC3(1), DOC4(2), DO
C5(1) }
【0063】なお、検索される選択文書セットは複数あ
っても良い。例えば、下記のような 指定文書(選択された文書)に基づく類似文書検索が行
なわれたとする。指定文書:{DOC5} この場合は、選択文書セット1,2が検索対象となり、
その結果は以下のようになる。 検索結果:{DOC1(1), DOC2(2), DOC3(1), DOC4(2), DO
C5(2), DOC6(2), DOC7(1), DOC8(2), DOC9(2)} また、この状態において更に指定文書としてDOC1を追加
で選択すると、その結果は以下のようになり、検索にお
いてより正確な絞り込みを行うことができる。検索結
果:{DOC1(1), DOC2(2), DOC3(1), DOC4(2), DOC5
(1)}すなわち、上記のDOC1とDOC5を始めから指定した
場合と同じ検索結果が得られる。
【0064】図19に、以上説明したキーワード・セッ
トと集約処理を用いた選択文書リストの保存処理の流れ
を示す。まず、サーバ20は、新たな検索の結果生じた
新規キーワード・セットと、選択履歴データ蓄積部34
に記憶されているキーワード・セットとの距離Dを計算
する(ステップS501)。そしてサーバ20は、距離
Dが指定値以下か否かを判断する(ステップS50
3)。この指定値は、キーワードの数、すなわち次元に
応じて適宜設定することができる。
【0065】ステップS503において距離Dが指定値
以下ではないと判断した場合、新規キーワード・セット
と、ステップS227で受信した選択文書リストを選択
履歴データ蓄積部34に記憶する(ステップS50
4)。ステップS503において距離Dが指定値以下で
あると判断した場合、既に選択履歴データ蓄積部34に
記憶されているキーワード・セットについてキーワード
毎の選択回数を更新させ、すなわち1増加させ、新規キ
ーワードについては選択回数を“1”にセットして記憶
する(ステップS505)。
【0066】続けて、抽出されたキーワード・セットと
新規キーワード・セット内の選択文書のグループとの距
離D’を計算する(ステップS507)。距離D’が所
定の指定値以下であるか否かを判断する(ステップS5
09)。距離D’が指定値以下ではないと判断した場
合、新しい選択文書リストを選択履歴データ蓄積部34
に記憶し(ステップS510)、本処理を終了する。距
離D’が指定値以下であると判断した場合、選択履歴デ
ータ蓄積部34に既に記憶されている選択文書リスト毎
の選択回数を更新させ、すなわち1増加させ、新規文書
について選択回数を“1”にセットして記憶し(ステッ
プS511)、本処理を終了する。
【0067】先の例において図19の処理を行った場合
の選択回数データの蓄積例を図20に示す。なお、図2
0では、キーワード・セットの集約の後、そのキーワー
ド・セット内での選択文書セットによる集約が実行され
ている。しかしながら、キーワード・セットの集約を省
略し、選択文書セットによる集約のみとしてもよいこと
に注意されたい。
【0068】このように検索に用いたキーワード・セッ
トに対して距離Dの近い過去のキーワード・セットを抽
出し、その過去のキーワード・セットにおいて選択され
ていた文書を抽出することで、類似文書検索を行うこと
ができる。以上のように、本実施の形態では、類似文書
検索として様々な方法を採用することができ、目的とす
る文書を高い精度で抽出することができる。
【0069】その他、本実施の形態の検索処理は、上記
述べた方法に限定されない。例えば、本実施の形態の検
索処理では、類似文書検索の前に全文検索が行われてい
るが、検索方法はこれに限定されず、例えば、タイトル
や要約、または番号による検索であってもよい。また、
所定の文書を最初に指定することで、全文検索等の前処
理を行うことなく初めから類似文書検索を行うことも可
能である。また、本実施の形態においてユーザ端末10
における検索は、ユーザ端末10に導入した所定のプロ
グラムで処理されるものであってもよく、またインター
ネット等のネットワークからのデータを表示するブラウ
ザ上で処理されるものであってもよい。
【0070】なお、本実施の形態で示したような処理を
行うためのプログラムは、以下のような記憶媒体、プロ
グラム伝送装置の形態とすることもできる。すなわち、
記憶媒体としては、コンピュータ装置に実行させるプロ
グラムを、CD−ROM、DVD、メモリ、ハードディ
スク等の記憶媒体に、コンピュータ装置が読み取り可能
に記憶させれば良い。また、プログラム伝送装置として
は、上記したようなプログラムを記憶させたCD−RO
M、DVD、メモリ、ハードディスク等の記憶手段と、
この記憶手段から当該プログラムを読み出し、当該プロ
グラムを実行する装置側に、コネクタ、あるいはインタ
ーネットやLAN等のネットワークを介して当該プログ
ラムを伝送する伝送手段とを備える構成とすれば良い。
【0071】その他、検索を行うユーザに対して表示す
る画面は、本実施の形態で示す検索ごとにウィンドウが
切り替わるものに限られない。例えば、全文検索の結果
に対して行った類似文書検索の結果を、全文検索の結果
においてハイライトをつけたり、並び替えすることで表
示させたりすることもできる。また、本実施の形態で
は、選択文書リストを作成するための文書の選択は、ユ
ーザによって選択ボタンをチェックすることで行われる
が、選択の指定方法はこれに限定されない。例えば、カ
ートのようなものにユーザが選択したい文書を入れる方
法であってもよい。また、ユーザが文書の本文や要約を
閲覧するためにクリックしたものを自動的に選択される
ように処理することもできる。
【0072】なお、本実施の形態では、検索対象を文書
等の文字データとしているが、検索対象はこれに限定さ
れない。例えば、検索対象は画像等の視覚で認識するも
のや音楽等の音で認識するものに対しても応用すること
が可能である。これ以外にも、本発明の主旨を逸脱しな
い限り、上記実施の形態で挙げた構成を取捨選択した
り、他の構成に適宜変更することが可能である。
【0073】
【発明の効果】このように本発明によれば、検索システ
ムにおいてユーザが必要な情報をより的確に抽出するこ
とができる。
【図面の簡単な説明】
【図1】 実施の形態における検索サービス提供システ
ムを説明する図である。
【図2】 ユーザ端末における処理の流れを示す図であ
る。
【図3】 ユーザ端末の表示部に表示されるメイン画面
を示す図である。
【図4】 キーワードを入力する画面を示す図である。
【図5】 表示部に表示される全文検索結果の画面を示
す図である。
【図6】 文書データの本文を表示させた画面を示す図
である。
【図7】 ユーザ端末の表示部に表示されるメイン画面
を示す図である。
【図8】 表示部に表示される類似文書検索結果の画面
を示す図である。
【図9】 類似検索結果の画面を示す図である。
【図10】 サーバにおける処理の流れを示す図であ
る。
【図11】 文書DBの索引データ蓄積部に蓄積された
データの一例を示す図である。
【図12】 文書DBの本文データ蓄積部に蓄積された
データの一例を示す図である。
【図13】 全文検索結果記憶部に保存されるデータの
一例を示す図である。
【図14】 類似文書検索における具体的な処理の流れ
を示す図である。
【図15】 履歴DBの選択履歴データ蓄積部に蓄積さ
れた選択履歴データの一例を示す図である。
【図16】 類似文書検索結果記憶部に保存するデータ
の一例を示す図である。
【図17】 選択結果記憶部に記憶されるデータの一例
を示す図である。
【図18】 選択文書リストの保存処理の流れを説明す
る図である。
【図19】 選択文書リストの保存処理の流れの他の例
を説明する図である。
【図20】 図19の集約結果のデータの蓄積例を示す
図である。
【符号の説明】
10…ユーザ端末、20…サーバ、22…全文検索実行
部、23…類似文書検索実行部(判断部、オブジェクト
特定部、オブジェクト抽出部)、24…選択履歴蓄積処
理部(選択履歴記憶部)、25…記憶部、26…全文検
索結果記憶部、27…類似文書検索結果記憶部、28…
選択結果記憶部、30…文書DB(オブジェクト・デー
タベース)、31…索引データ蓄積部、32…本文デー
タ蓄積部、33…履歴DB(選択履歴記憶部)、34…
選択履歴データ蓄積部、35…選択回数データ蓄積部
フロントページの続き (72)発明者 川村 建夫 神奈川県大和市下鶴間1623番地14 日本ア イ・ビー・エム株式会社 大和事業所内 Fターム(参考) 5B075 ND03 NR12 PP13 PP24 PR03

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 あらかじめ記憶された文書に対する検索
    処理を実行するサーバと、前記サーバに対して検索処理
    を要求する少なくとも1つの端末を備えた検索システム
    であって、 前記端末は、 検索結果に示される所定の文書に対するユーザの指定を
    受け付け、 指定された前記文書(指定文書)に基づく拡張検索を前
    記サーバに対して要求し、 前記サーバは、 前記拡張検索の要求を受け付け、 前記ユーザもしくはその他のユーザまたはその両方が、
    過去に行った検索処理において同時に選択した少なくと
    も1つの文書からなる1または複数のグループにおい
    て、前記指定文書が属する当該グループを抽出し、 抽出された前記グループに属する文書を拡張検索結果と
    して出力することを特徴とする検索システム。
  2. 【請求項2】 前記端末は、前記検索結果および前記拡
    張検索結果に含まれる文書に対してユーザが行った選択
    を前記サーバへ送出し、 前記サーバは、前記選択から新たなグループを作成し、
    当該新たなグループを選択履歴として記憶することを特
    徴とする請求項1記載の検索システム。
  3. 【請求項3】 前記端末は、前記拡張検索の要求の前に
    おいて検索用タームに基づく準備用検索を前記サーバに
    対して要求し、 前記指定文書は、前記準備用検索の結果から選択された
    文書であることを特徴とする請求項1記載の検索システ
    ム。
  4. 【請求項4】 前記サーバは、前記準備用検索に用いた
    前記検索用タームを前記検索結果と共に選択履歴として
    記憶することを特徴とする請求項3記載の検索システ
    ム。
  5. 【請求項5】 ユーザからの要求に応じてオブジェクト
    の検索処理を行うシステムであって、 過去の検索処理において、前記ユーザもしくはその他の
    ユーザまたはその両方が、過去において行った検索処理
    において同時に選択したオブジェクトを選択履歴データ
    として記憶する選択履歴記憶部と、 拡張検索用に前記ユーザが指定したオブジェクト(指定
    オブジェクト)に基づく拡張検索要求を受け付ける受付
    部と、 前記指定オブジェクトの履歴データが、前記選択履歴記
    憶部に記憶されているか否かを判断する判断部と、 前記指定オブジェクトの履歴データが前記選択履歴記憶
    部に記憶されていると前記判断部により判断されると、
    当該選択履歴記憶部に記憶された前記検索結果から前記
    指定オブジェクトと同時に選択された1または複数のオ
    ブジェクトを特定するオブジェクト特定部と、 を備えたことを特徴とするシステム。
  6. 【請求項6】 オブジェクトを蓄積したオブジェクト・
    データベースと、 前記オブジェクト特定部により特定された前記オブジェ
    クトを、前記オブジェクト・データベースから抽出する
    オブジェクト抽出部と、 をさらに備えたことを特徴とする請求項5記載のシステ
    ム。
  7. 【請求項7】 過去に選択された回数に関するデータを
    オブジェクト毎に記憶する選択回数記憶部をさらに備え
    たことを特徴とする請求項5記載のシステム。
  8. 【請求項8】 ネットワークを介してサーバに接続し、
    目的とするオブジェクトを当該サーバから抽出可能な端
    末であって、 ユーザからの検索指示を受け付ける入力部と、 前記検索指示に基づいて前記サーバに対して検索の要求
    を送出し、当該検索の結果を受信する送受信部と、 前記ユーザからの入力および前記サーバから送出された
    データを表示する表示部と、を備え、 前記表示部は、 前記サーバから受信した前記検索の結果に示されたオブ
    ジェクトのうち、任意のオブジェクトの選択を可能とす
    る選択部と、 選択された前記オブジェクトについての類似検索指示の
    受け付けを可能とする受け付け部と、を表示することを
    特徴とする端末。
  9. 【請求項9】 前記表示部は、前記類似検索の結果とと
    もに、当該結果に含まれる類似オブジェクトの選択を可
    能とする類似オブジェクト選択部を表示することを特徴
    とする請求項8記載の端末。
  10. 【請求項10】 前記表示部は、前記類似検索の結果と
    して、選択された前記オブジェクトに類似する類似オブ
    ジェクトと共に、当該類似オブジェクトが過去に選択さ
    れた回数を表示することを特徴とする請求項8記載の端
    末。
  11. 【請求項11】 データベースから目的とする文書の検
    索を行う検索方法であって、 ユーザの要求に応じて所定のタームを基に1次検索を行
    うステップと、 前記1次検索の結果に対して所定の文書の選択を受け付
    けるステップと、 選択された前記所定の文書に基づいて2次検索を行うス
    テップと、を有し、 前記2次検索では、前記ユーザもしくはその他のユーザ
    またはその両方を含むユーザによる過去の検索処理にお
    いて前記所定の文書が抽出されたことがある場合に、当
    該所定の文書と同時に選択された履歴を有する文書を抽
    出することを特徴とする検索方法。
  12. 【請求項12】 前記2次検索において抽出された前記
    文書に対し、同時に選択された文書を新たな検索結果と
    して記憶するステップをさらに有することを特徴とする
    請求項11記載の検索方法。
  13. 【請求項13】 類似検索処理をコンピュータ装置に実
    行させるためのプログラムであって、 複数のユーザによって行われた検索における検索結果に
    対し、当該ユーザによって選択されたオブジェクトの選
    択履歴を記憶する手順と、 検索用オブジェクトを指定した類似検索要求を受け付け
    る手順と、 指定された前記検索用オブジェクトについての選択履歴
    が既に記憶されている場合、当該選択履歴を抽出する手
    順と、 前記選択履歴から、前記検索用オブジェクトと共通点を
    有する類似オブジェクトを抽出する手順とを前記コンピ
    ュータ装置に実行させることを特徴とするプログラム。
  14. 【請求項14】 前記共通点は、前記類似オブジェクト
    が、選択された前記検索用オブジェクトと同時に抽出さ
    れたことであることを特徴とする請求項13記載のプロ
    グラム。
  15. 【請求項15】 前記共通点は、前記類似オブジェクト
    が、前記検索用オブジェクトと同じキーワードで抽出さ
    れたことであることを特徴とする請求項13記載のプロ
    グラム。
  16. 【請求項16】 コンピュータ装置において検索要求を
    処理させるためのプログラムであって、ユーザからの検
    索指示を受け付ける手順と、 前記検索指示に基づいて検索の要求を行う手順と、 前記検索の結果とともに、所定のオブジェクトを選択す
    る選択手段をユーザに対して表示する手順と、 選択された前記所定のオブジェクトについて他人の検索
    結果を得るための類似検索指示を受け付ける受付手段を
    ユーザに対して表示する手順と、 前記類似検索指示に基づいて検索指示を行い、前記他人
    の検索結果を入手する手順と、 を前記コンピュータ装置に実行させることを特徴とする
    プログラム。
  17. 【請求項17】 前記類似検索の結果とともに、当該結
    果に含まれる類似オブジェクトを選択する選択手段をユ
    ーザに対して表示する手順をさらに前記コンピュータ装
    置に実行させることを特徴とする請求項16記載のプロ
    グラム。
  18. 【請求項18】 前記類似検索の結果として、前記所定
    のオブジェクトに類似するオブジェクトと共に、当該類
    似オブジェクトが過去に選択された回数を表示する手順
    をさらに前記コンピュータ装置に実行させることを特徴
    とする請求項16記載のプログラム。
JP2002046934A 2002-02-22 2002-02-22 検索システム、システム、検索方法およびプログラム Expired - Fee Related JP3791908B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002046934A JP3791908B2 (ja) 2002-02-22 2002-02-22 検索システム、システム、検索方法およびプログラム
US10/366,833 US7110996B2 (en) 2002-02-22 2003-02-14 System and method for determining numerical representations for categorical data fields and data processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002046934A JP3791908B2 (ja) 2002-02-22 2002-02-22 検索システム、システム、検索方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2003256471A true JP2003256471A (ja) 2003-09-12
JP3791908B2 JP3791908B2 (ja) 2006-06-28

Family

ID=27750669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002046934A Expired - Fee Related JP3791908B2 (ja) 2002-02-22 2002-02-22 検索システム、システム、検索方法およびプログラム

Country Status (2)

Country Link
US (1) US7110996B2 (ja)
JP (1) JP3791908B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031391A (ja) * 2004-07-15 2006-02-02 Nippon Telegr & Teleph Corp <Ntt> 情報検索システム
JP2008515087A (ja) * 2004-09-30 2008-05-08 グーグル インコーポレイテッド 文書に関係する情報の提供
WO2009019858A1 (ja) * 2007-08-08 2009-02-12 Panasonic Corporation 番組検索支援装置およびその方法
JP2010055518A (ja) * 2008-08-29 2010-03-11 Nippon Telegraph & Telephone West Corp 検索装置及び方法、ならびに、コンピュータプログラム

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8275661B1 (en) 1999-03-31 2012-09-25 Verizon Corporate Services Group Inc. Targeted banner advertisements
US8572069B2 (en) * 1999-03-31 2013-10-29 Apple Inc. Semi-automatic index term augmentation in document retrieval
AU4328000A (en) 1999-03-31 2000-10-16 Verizon Laboratories Inc. Techniques for performing a data query in a computer system
US6718363B1 (en) 1999-07-30 2004-04-06 Verizon Laboratories, Inc. Page aggregation for web sites
US6912525B1 (en) 2000-05-08 2005-06-28 Verizon Laboratories, Inc. Techniques for web site integration
US7460737B2 (en) 2004-02-12 2008-12-02 Hoshiko Llc Method and apparatus for photograph finding
JP2005267607A (ja) * 2004-02-20 2005-09-29 Fuji Photo Film Co Ltd デジタル図鑑システム、図鑑検索方法、及び図鑑検索プログラム
US7765208B2 (en) * 2005-06-06 2010-07-27 Microsoft Corporation Keyword analysis and arrangement
JP4281719B2 (ja) * 2005-08-10 2009-06-17 コニカミノルタビジネステクノロジーズ株式会社 ファイル処理装置、ファイル処理方法、およびファイル処理プログラム
JP2007133809A (ja) * 2005-11-14 2007-05-31 Canon Inc 情報処理装置、コンテンツ処理方法、記憶媒体およびプログラム
US7747600B2 (en) * 2007-06-13 2010-06-29 Microsoft Corporation Multi-level search
US7792813B2 (en) * 2007-08-31 2010-09-07 Microsoft Corporation Presenting result items based upon user behavior
JP2012058941A (ja) * 2010-09-08 2012-03-22 Seiko Epson Corp 情報検索装置、情報検索方法およびコンピュータープログラム
CN102737038B (zh) * 2011-04-07 2015-09-23 阿里巴巴集团控股有限公司 关联度确定方法及装置、信息提供方法及装置
CN103678358A (zh) * 2012-09-13 2014-03-26 腾讯科技(深圳)有限公司 一种信息搜索方法及系统
JP5701846B2 (ja) * 2012-11-28 2015-04-15 京セラドキュメントソリューションズ株式会社 画像形成装置
US9858291B1 (en) * 2013-10-30 2018-01-02 Google Inc. Detection of related local entities
CN104391958B (zh) * 2014-11-28 2018-06-26 北京国双科技有限公司 网页搜索关键词的相关性检测方法及装置
RU2632133C2 (ru) 2015-09-29 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ (варианты) и система (варианты) создания модели прогнозирования и определения точности модели прогнозирования
RU2693324C2 (ru) 2017-11-24 2019-07-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер преобразования значения категориального фактора в его числовое представление
CN108227954A (zh) * 2017-12-29 2018-06-29 北京奇虎科技有限公司 一种提供搜索输入联想词的方法、装置及电子设备
CN110427487B (zh) * 2019-07-30 2022-05-17 中国工商银行股份有限公司 一种数据标注方法、装置及存储介质
JP7164015B2 (ja) * 2019-10-01 2022-11-01 Jfeスチール株式会社 情報検索システム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096794A (ja) 1995-06-14 1997-01-10 Fuji Xerox Co Ltd データ検索指示装置
JPH0962658A (ja) 1995-08-21 1997-03-07 Hitachi Inf Syst Ltd 文書間リンク処理システム
US5826261A (en) * 1996-05-10 1998-10-20 Spencer; Graham System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query
US5974412A (en) * 1997-09-24 1999-10-26 Sapient Health Network Intelligent query system for automatically indexing information in a database and automatically categorizing users
US6772150B1 (en) * 1999-12-10 2004-08-03 Amazon.Com, Inc. Search query refinement using related search phrases
JP2002046934A (ja) 2000-08-03 2002-02-12 Ricoh Co Ltd 粘着部品の剥離装置及び供給装置
WO2003005235A1 (en) * 2001-07-04 2003-01-16 Cogisum Intermedia Ag Category based, extensible and interactive system for document retrieval

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031391A (ja) * 2004-07-15 2006-02-02 Nippon Telegr & Teleph Corp <Ntt> 情報検索システム
JP2008515087A (ja) * 2004-09-30 2008-05-08 グーグル インコーポレイテッド 文書に関係する情報の提供
JP2012104149A (ja) * 2004-09-30 2012-05-31 Google Inc 方法およびシステム
US8386453B2 (en) 2004-09-30 2013-02-26 Google Inc. Providing search information relating to a document
WO2009019858A1 (ja) * 2007-08-08 2009-02-12 Panasonic Corporation 番組検索支援装置およびその方法
US8195687B2 (en) 2007-08-08 2012-06-05 Panasonic Corporation Program retrieval support device for accumulating and searching pieces of program information and corresponding programs and a method for performing the same
JP2010055518A (ja) * 2008-08-29 2010-03-11 Nippon Telegraph & Telephone West Corp 検索装置及び方法、ならびに、コンピュータプログラム

Also Published As

Publication number Publication date
US7110996B2 (en) 2006-09-19
US20030163462A1 (en) 2003-08-28
JP3791908B2 (ja) 2006-06-28

Similar Documents

Publication Publication Date Title
JP3791908B2 (ja) 検索システム、システム、検索方法およびプログラム
JP4425641B2 (ja) 構造化ドキュメントの検索
Bergman White paper: the deep web: surfacing hidden value
US7769771B2 (en) Searching a document using relevance feedback
US7085761B2 (en) Program for changing search results rank, recording medium for recording such a program, and content search processing method
JP5638031B2 (ja) 格付け方法、検索結果分類方法、格付けシステム及び検索結果分類システム
US20090043749A1 (en) Extracting query intent from query logs
JP4962986B2 (ja) コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム
US10891700B2 (en) Methods and computer-program products for searching patent-related documents using search term variants
JP4962967B2 (ja) Webページ検索サーバ及びクエリ推薦方法
US20070271255A1 (en) Reverse search-engine
US20070043706A1 (en) Search history visual representation
US20070157129A1 (en) System and method for search queries and results preview using drag and drop interface
US20080208808A1 (en) Configuring searches
WO2007002820A2 (en) Search engine with augmented relevance ranking by community participation
US20100010982A1 (en) Web content characterization based on semantic folksonomies associated with user generated content
US20050165742A1 (en) Searching previously viewed web sites
JP2011008420A (ja) カテゴリを対応付けする装置、方法、およびプログラム
US20150169708A1 (en) Providing recently selected images
JP4375626B2 (ja) カテゴリ別のキーワードの入力順位を提供するための検索サービスシステムおよびその方法
JP2004341753A (ja) 検索支援装置、検索支援方法、およびプログラム
JP2002334107A (ja) 情報検索装置および方法と情報検索プログラムおよび該プログラムを記録した記録媒体
JP4973503B2 (ja) ファイル検索プログラム、方法及び装置
US20110119250A1 (en) Forward Progress Search Platform
JP2002157270A (ja) 興味記事配信システム及び興味記事配信方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050516

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060314

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20060316

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060403

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090414

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100414

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110414

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110414

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees