JP2003108594A - 情報検索装置およびその方法 - Google Patents

情報検索装置およびその方法

Info

Publication number
JP2003108594A
JP2003108594A JP2001305500A JP2001305500A JP2003108594A JP 2003108594 A JP2003108594 A JP 2003108594A JP 2001305500 A JP2001305500 A JP 2001305500A JP 2001305500 A JP2001305500 A JP 2001305500A JP 2003108594 A JP2003108594 A JP 2003108594A
Authority
JP
Japan
Prior art keywords
keyword
data
search
information
search engine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001305500A
Other languages
English (en)
Inventor
Iwane Ikeda
岩音 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2001305500A priority Critical patent/JP2003108594A/ja
Publication of JP2003108594A publication Critical patent/JP2003108594A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 検索において、絞り込み検索をする際、どの
ような単語を選択すればよいか分からず、徒に検索を繰
り返して、検索エンジンの負担を重くしていた。 【解決手段】 あるキーワードによる予測検索がクライ
アント200から指示されると、情報検索装置100
は、キーワード管理ファイル140を参照し、そのキー
ワードが管理されているかを調べ、検索の履歴が存在す
る場合には、検索履歴データベース150から該当する
キーワードとそのキーワードを用いて絞り込み検索を行
なった場合のデータ数とを関連づけて、クライアント2
00側に表示させる。この結果、利用者は、実際に検索
を行なうことなく、一つのキーワードに連続して検索さ
れやすいキーワードを知ることができ、更にそのキーワ
ードを用いた検索の結果の予測値を知ることができ、所
望の検索結果に素早く到達することができる。しかも検
索エンジンへの負担を低減することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力されたキーワ
ードによってデータベースから必要なデータを絞り込む
検索エンジンを有する情報検索装置及び情報検索方法に
関する。
【0002】
【従来の技術】従来から、入力されたキーワードによっ
てデータベースから必要なデータを絞り込む検索エンジ
ンを有する情報検索装置が提案されている。この種の情
報検索装置は、データベースに登録するデータをカテゴ
リ毎に分類するなどの管理が不要であり、膨大な量のデ
ータを簡便に管理、利用することができる。もとより、
キーワードによっては、検索の対象となるデータの数が
多すぎてそのまま出力したのでは使い物にならない場合
もあり得る。そこで、大規模なデータベースを対象とし
た検索装置では、キーワードによる検索の結果を直ちに
表示するのではなく、検索によりヒットしたデータの件
数を表示し、これが所定数以下となってはじめて、該当
するデータを、一覧または詳細に表示する、といった対
応も採られていた。この場合、利用者は、検索されたデ
ータの件数を見ながら、次々とキーワードを与えて、い
わゆる絞り込み検索(論理積による検索)を行なうこと
になる。
【0003】また、この種の情報検索装置は、必要とし
ているデータを取り出すために、適切なキーワードを利
用者自ら考えて入力することが前提であり、検索対象に
合わせた適切なキーワードを設定することができれば、
効率よくデータ検索を行なうことができる。換言すれ
ば、適切なキーワードが設定できないと、検索漏れなど
を起こしやすいと言うことができる。
【0004】そこで、従来の情報検索装置では、各種単
語の同義語や関連語をシソーラスとして用意しておき、
入力したキーワードに対応する同義語などを提供して、
キーワードの設定を容易にすると言った工夫を行なって
いる。また、特開平11−250086号公報には、過
去のキーワードによるデータベースの絞り込み履歴を記
憶しておき、利用者が入力したキーワードに関連するキ
ーワードを検索し、これを提示することで、利用者のデ
ータ絞り込みを支援する技術が開示されている。この技
術によれば、過去のキーワードによる絞り込み履歴を記
憶するだけで、入力したキーワードに関連したキーワー
ドを提示することができる。すなわち、この技術は、予
めシソーラスを用意する必要がなく、入力したキーワー
ドに関連するキーワードを提示することができ、簡便な
シソーラスの構築技術を提供する。
【0005】こうした絞り込み検索の手法について具体
的に説明する。例えば、関東地方の梅雨明けの時期を知
ろうとして、「関東地方*気候」(記号「*」はand
条件を意味する。以下同じ。)というキーワードを入力
して検索エンジンでデータの検索を実行した場合を考え
る。この時、従来の情報検索装置によれば、それ以前に
行なわれたキーワード検索の履歴やシソーラスから、例
えば次のキーワード「東京、神奈川、千葉、埼玉、栃
木、梅雨、予報、潮、台風、雨量、熱帯夜、降雪・・
・」が候補として提示される。利用者は、情報検索装置
から提示された上記キーワードを選択するなどして、絞
り込み用のキーワードとして「東京*梅雨*予報」を決
定することができる。この場合、検索エンジンは、キー
ワード「関東地方*気候*東京*梅雨*予報」という絞
り込みを行ない、データベースから必要なデータを更に
絞り込むことができる。以下、同様に情報検索装置が提
示する次のキーワードの候補から希望するキーワードを
選択し、あるいは自らキーワードを決定し、データベー
スの膨大なデータの中から、所望の件数まで、データを
絞り込むことになる。
【0006】
【発明が解決しようとする課題】しかしながら、こうし
た情報検索装置は、キーワードを用いたデータ絞り込み
の巧拙を補完するには未だ不十分であった。例えば、検
索されたデータの件数が所定数以下となるまで絞り込み
検索をしているような場合、似たようなキーワードをい
くら入れても検索件数を効率よく絞り込むことができな
い。シソーラスにより提供される類義語などは、こうし
た点では絞り込みにあまり役立たない場合があった。他
方、キーワードによっては、一気に対象となるデータの
件数が減ってしまう場合があり、こうしたケースでは、
必要なデータを取りこぼしてしまうおそれがあった。こ
のため、特に大規模なデータベースを検索をしようとす
る利用者は、所望の件数まで絞り込むのに、試行錯誤を
繰り返すことになりがちであった。
【0007】また、この点を検索エンジンの側から見る
と、利用者によりキーワードが入力されるたびに、実際
に検索を行なわねばならなかった。このため、検索エン
ジンの負荷は相当に重いものとなっていた。予めシソー
ラスを用意したり過去のキーワードの履歴を記憶すると
いった手法を採用しても、これは、利用者が入力したキ
ーワードに関連するキーワードの候補を提示するにすぎ
ない。従って、利用者は、この候補を利用することはで
きるものの、所望のデータ数まで絞り込むには、実際に
次々と絞り込み検索を行なう必要があった。
【0008】シソーラスや履歴情報を用いた従来の情報
検索装置は、絞り込みのためのキーワードを思案する時
間を短縮する効果は得られるものの、検索が行なわれる
回数を低減することはできなかった。すなわち、必要な
データを絞り込むためには、実際に検索エンジンを動か
して検索を行なうことが必要となり、検索エンジンの負
荷を低減することはできなかった。しかも、過去のキー
ワード検索の履歴を記憶する情報検索装置にあっては、
稚拙なキーワード、例えば非効率な絞り込みしかできな
いキーワードが選択されて非効率な検索が実行されたと
しても、その非効率なキーワードも記憶されることにな
り、次回以降の検索時にキーワードの候補として提示さ
れることになってしまう。このため、利用者の行なうキ
ーワード検索の回数や検索エンジンの絞り込み負荷はそ
のキーワードのために、より一層増大するという悪循環
を招来する可能性さえあった。
【0009】本発明は、こうした問題を解決し、必要な
データを得るまでに必要なキーワードによるデータの絞
り込みの繰り返し回数を減少させ、利用者と検索エンジ
ンとの実質的な負荷を軽減し、より早く必要なデータを
得ることができる情報検索装置及び情報検索方法を提供
することを目的とする。
【0010】
【課題を解決するための手段およびその作用・効果】上
記課題を解決する本発明の第1の情報検索装置は、入力
されたキーワードによってデータベースから必要なデー
タを絞り込む検索エンジンを有する情報検索装置であっ
て、入力されたキーワードにより絞り込まれるデータ数
を、前記検索エンジンによる過去の検索結果を用いて予
測するデータ数予測手段と、該予測されたデータ数を、
次の検索に先立って提示する予測数提示手段とを備える
ことを特徴とする。
【0011】また、この情報検索装置に対応した情報検
索方法の発明は、入力されたキーワードによってデータ
ベースから必要なデータを絞り込む検索エンジンを用い
て情報を検索する方法であって、入力されたキーワード
により絞り込まれるデータ数を、前記検索エンジンによ
る過去の検索結果を用いて予測し、該予測されたデータ
数を、次の検索に先立って提示することを特徴としてい
る。
【0012】かかる情報検索装置およびその方法によれ
ば、検索エンジンによる過去の検索結果を用いて、入力
されたキーワードにより絞り込まれるデータ数を予測
し、その予測されたデータ数を、次の検索に先立って提
示している。このため、利用者は予測されたデータ数を
見て、そのキーワードが不適切あるいは不十分であるこ
とを、検索エンジンによる実際の絞り込み以前に知るこ
とができ、絞り込みを行なうキーワードを訂正や追加す
ることができる。従って、必要なデータを得るまでに必
要なキーワードによるデータの絞り込みの繰り返し回数
を減少させ、利用者と検索エンジンとの実質的な負荷を
軽減し、より早く必要なデータを得ることができる。
【0013】なお、予測されたデータ数を提示すると
は、予測されたデータ数を数字により提示するものの
他、データ数が絞り込み結果として有意な数(例えば、
読むことができる分量)であるか否かの提示など、間接
的に提示するものも含まれる。例えば、データ数を棒グ
ラフなどを用いて提示する手法なども含まれる。また、
その提示の方法は、視覚的な表示、ビープ音などの聴覚
的な提示、あるいはこれらを組み合わせた提示など、何
れでもよい。
【0014】ここで、データ数の予測は、検索エンジン
が任意のキーワードによってデータベースから必要なデ
ータを絞り込んだとき、当該キーワードと絞り込まれた
データ数とを関連付けして記憶し、以後の当該キーワー
ドにより絞り込まれるデータ数の予測に際して関連付け
して記憶されたデータ数を用いるといった手法を採るこ
とができる。こうすれば、予めキーワード毎にデータ数
を決定する手間を省略し、あるいはキーワード毎にデー
タ数を決定することが不可能な場合に好適である。すな
わち、データベースのデータが総て既知である場合、例
えば図書館の蔵書を検索する情報検索装置にあっては、
キーワード数も予想され、かつ、そのキーワードにより
絞り込まれるデータ数を予め決定することができる。し
かし、インターネットのウェブページを検索対象とする
データベースの場合は、キーワードを予想することは通
常不可能であり、ましてやそのキーワードにより絞り込
まれるデータ数は時々刻々と変化する値となる。この様
な場合には、検索エンジンが現実にデータを絞り込んだ
とき、当該キーワードと絞り込まれたデータ数とを関連
付けして記憶し、以後の当該キーワードにより絞り込ま
れるデータ数の予測に用いることが好適となる。
【0015】また、検索エンジンが任意のキーワードに
よってデータベースから必要なデータを絞り込んだと
き、当該キーワードと絞り込まれたデータ数と絞り込ん
だ時刻とを関連付けして記憶し、以後の当該キーワード
により絞り込まれるデータ数の予測に際して関連付けし
て記憶されたデータ数と時刻とを用いることも好適であ
る。前述した例のように、インターネットのウェブペー
ジが検索対象である場合などには、絞り込まれるデータ
数は変数となり、例えば流行語などのキーワードにより
絞り込まれるデータ数は、時々刻々増加する。この様な
データベースを対象とする場合は、現実に検索エンジン
がデータを絞り込んだとき、当該キーワードと絞り込ま
れたデータ数と絞り込んだ時刻とを関連付けして記憶
し、以後の当該キーワードにより絞り込まれるデータ数
の予測に用いることが望ましい。ここで絞り込んだ時刻
との関連付けの例としては、同じキーワードにより絞り
込まれたデータ数の最新データ、過去1週間の平均値や
合計数、過去1月の平均値や合計数、過去の総数などの
単純な関連付けばかりでなく、そのデータ数の変化量か
ら現在のデータ数を統計予測するなどの関連付けを行な
っても良い。
【0016】本発明の第2の情報検索装置は、入力され
た任意のキーワードによって連続的にデータベースから
必要なデータを順次絞り込む検索エンジンを有する情報
検索装置であって、入力されたキーワードの次に入力さ
れるキーワードを、前記検索エンジンによる過去の検索
結果を用いて複数個予測するキーワード予測手段と、該
予測された各キーワードにより前記検索エンジンが絞り
込むデータ数を予測する次データ数予測手段と、該予測
されるデータ数を、前記予測された複数個のキーワード
と関連付けて提示する次予測数提示手段とを備えること
をその要旨としている。
【0017】また、この情報検索装置に対応する情報検
索方法の発明は、入力された任意のキーワードによって
連続的にデータベースから必要なデータを順次絞り込む
検索エンジンを用いて情報を検索する方法であって、入
力されたキーワードの次に入力されるキーワードを、前
記検索エンジンによる過去の検索結果を用いて複数個予
測し、該予測された各キーワードにより前記検索エンジ
ンが絞り込むデータ数を予測し、該予測されるデータ数
を、前記予測された複数個のキーワードと関連付けて提
示することをその要旨としている。
【0018】本発明の情報検索装置およびその方法は、
検索エンジンにより、入力された複数個のキーワードに
よって連続的にデータベースから必要なデータを順次絞
り込む。これは、初めに入力されたキーワードによって
データの絞り込みを行ない、その絞り込んだデータを全
体集合として次に入力されるキーワードを用いてデータ
を絞り込む処理である。この種の検索エンジンを用いれ
ば、データの絞り込みを効率的に行なうことが知られて
いる。更に本発明にあっては、入力されたキーワードの
次に入力されるキーワードを予測し、この予測されたキ
ーワードにより検索エンジンが絞り込むデータ数を予測
する。その上で、予測されたデータ数を、予測された複
数個のキーワードと関連付けて提示する。例えば、「新
庄」というキーワードによる絞り込みを行なった後に
は、大リーガーの「新庄」を欲する人は「大リーグ、野
球・・・」などのキーワードが連続し、温泉地の「新
庄」を欲する人は「温泉、山形・・・」などのキーワー
ドが連続することが容易に想定される。そこで、この様
なキーワードの連続性も予測し、その予測されるキーワ
ードのそれぞれについて予測されるデータ数を併せて提
示するのである。なお、データ数の提示には、数字その
ものの提示のみならず、数字と関連付けられた表示、例
えば棒グラフなどによるものも含まれることは前述の通
りである。
【0019】この様に構成される情報検索の手法によれ
ば、順次入力される複数個のキーワードの連続性から次
に入力されるキーワードを予測し、予測された複数の予
測キーワードのそれぞれについてデータ数が予測され、
予測キーワードと関連付けして予測されたデータ数が提
示される。この予測数の提示する際には、検索エンジン
は検索を行なわないから、従って、必要なデータを得る
までに必要なキーワードによるデータの絞り込みの繰り
返し回数を減少させ、利用者と検索エンジンとの実質的
な負荷を軽減し、より早く必要なデータを得ることがで
きる。
【0020】ここでキーワードの予測は、検索エンジン
が任意のキーワードによって連続的にデータベースから
必要なデータを順次絞り込んだとき、当該任意のキーワ
ードを連続的に記憶し、以後の当該キーワードの次に入
力されるキーワードの予測に用いることにより実現する
ことができる。また、予測したキーワードのデータ数の
予測は、記憶した複数個のキーワードについて検索エン
ジンによって絞り込まれたデータ数を予め記憶し、以後
の当該キーワードにより絞り込まれるデータ数の予測に
用いることで実現することができる。こうした構成を採
用すれば、予めキーワードの連続性やキーワード毎のデ
ータ数を決定する手間が省略され、あるいはキーワード
毎にデータ数を決定することが不可能な場合に好適であ
る。すなわち、前出の例のようにデータベースのデータ
が総て既知である図書館の蔵書を検索する情報検索装置
にあっては、キーワードの連続性やそのキーワードによ
り絞り込まれるデータ数を予め決定することは比較的容
易である。これに対して、インターネットのウェブペー
ジを検索対象とするデータベースの場合は、キーワード
を予想することは不可能であり、しかもその連続性を予
測することは非現実的であり、キーワードにより絞り込
まれるデータ数は時々刻々と変化する不定値となるから
である。
【0021】更に、キーワードの予測は、検索エンジン
が任意のキーワードによってデータベースから必要なデ
ータを順次絞り込んだとき、当該任意のキーワードを連
続的に、かつ、絞り込んだ時刻と関連付けして記憶し、
以後の当該キーワードの次に入力されるキーワードの予
測に用いることで実現してもよい。このとき、複数個の
キーワードについて検索エンジンによって絞り込まれた
データ数と検索が行なわれた時刻とを、以後の当該キー
ワードにより絞り込まれるデータ数の予測に用いること
も、時々刻々と変化する対象のデータ数をある程度の精
度で予測する上で好適である。
【0022】前述した例のように、インターネットのウ
ェブページが検索対象である場合などには、キーワード
の連続性を予測することは非現実的であり、かつ、その
連続的なキーワードにより絞り込まれるデータ数は不確
定な数値である。そこで、この様なデータベースを対象
とする場合、現実に検索エンジンが連続するキーワード
に基づいてデータを絞り込んだとき、当該キーワードの
連続性と絞り込まれたデータ数と絞り込んだ時刻とを関
連付けして記憶し、それ以後の当該キーワードにより絞
り込まれるであろうキーワードの予測、そのキーワード
により絞り込まれるデータ数の予測に用いれば、現実的
な精度を確保しつつ、予測を行なうことできる。ここで
絞り込んだ時刻との関連付けの例としては、前述したよ
うに、同じキーワードにより絞り込まれたデータ数の最
新データ、過去1週間の平均値や合計数、過去1月の平
均値や合計数、過去の総数などの単純な関連付けばかり
でなく、そのデータ数の変化量から現在のデータ数を統
計予測するなど複雑な関連付けを行なっても良い。
【0023】複数のキーワードを検索エンジンに入力す
る手法としては、予測された複数のキーワードを画面な
どに一覧表示し、これらのキーワードの少なくとも一つ
を選択することで、当該選択されたキーワードを前記検
索エンジンへ入力するものとすればよい。こうすれば、
予測され表示されるキーワードを次々と簡単に選択する
ことができ、検索の手間を軽減することができる。
【0024】こうした情報検索は、スタンドアロンのコ
ンピュータで実現してもよいが、検索エンジンを、ネッ
トワークに接続されたコンピュータ上に置いて検索サー
バを構成し、ネットワークを介して接続された他のコン
ピュータからの求めに応じて検索を行なうものとするこ
ともできる。更に、この検索エンジンが検索する対象
は、他のコンピュータが接続されたネットワーク自体ま
たはネットワークとは異なるネットワークに接続された
多数のコンピュータに記憶された情報とすることもでき
る。
【0025】なお、上記の情報検索方法は、CD−RO
Mなどの記録媒体に記録されたプログラムの形態で特定
することもできる。あるいは、プログラムをネットワー
ク上のサーバに置き、利用者がこれをダウンロードして
検索サーバを構築するといった利用も想定することがで
きる。
【0026】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図を参照しつつ説明する。図1は、本発明である情
報検索装置100の実施形態の機能ブロック図である。
図示するように情報検索装置100は、インターネット
INを介してクライアント200と接続されている。こ
こでクライアント200は、検索したいキーワードの入
力または選択を行ない、その検索結果を表示する端末で
ある。
【0027】情報検索装置100は、検索管理サーバ1
10により管理される2つのサーバ,キーワード履歴管
理サーバ120,検索サーバ130を備えている。検索
サーバ130は、検索管理サーバ110から指定された
キーワードによってデータベースDBを検索し、データ
ベースDBに記憶されている膨大なデータからそのキー
ワードに適合するデータを絞り込み、検索管理サーバ1
10を介してクライアント200へその絞り込み結果を
返信する。なお、本実施例の検索サーバ130は、クラ
イアント200による一連の検索が継続しているとき、
クライアント200から入力されるキーワードにより検
索が実行される毎に、その検索結果を母集合として新た
なキーワードによる検索を連続的に行なってデータの絞
り込みを行なう。なお、これらの検索管理サーバ11
0、キーワード履歴管理サーバ120、検索サーバ13
0、クライアント200などは、いずれもCPUやRA
M、ROM、外部記憶装置、ネットワークインタフェー
ス等を備えたコンピュータである。その構成は、周知の
ものなので、ここでは説明を省略する。
【0028】キーワード履歴管理サーバ120は、検索
サーバ130によって連続的なデータの絞り込みが行な
われているとき、その連続的なキーワードの履歴をキー
ワード管理ファイル140や検索履歴データベース15
0に記憶し、検索管理サーバ110からの要求に応じて
その記憶した連続的なキーワードやそのキーワードによ
るデータの絞り込み結果を出力する。図2は、このキー
ワード履歴管理サーバ120にて管理されているキーワ
ード管理ファイル140の一部を示している。また、図
3ないし図5は、検索履歴データベース150に記憶さ
れている絞り込みキーワード管理ファイル、頻度管理フ
ァイル、詳細履歴の一部を示している。以下、これらの
ファイルの記憶内容について詳述する。
【0029】図2に示すようにキーワード管理ファイル
は、1つのレコードが7つのフィールドから構成されて
いる。第1フィールド「アドレス番号」は、キーワード
管理ファイル中のユニークな値が設定されるフィールド
であり、このアドレス番号を指定することで所望のレコ
ードを指定することができる。第2フィールド「上位リ
ンク」は、このレコードの第3レコードに記憶されるキ
ーワードが入力される以前に、検索サーバ130にて実
行された絞り込みに使用されたキーワードを記憶してい
るアドレス番号を記憶しているフィールドである。図示
する2つのレコードの場合、上位リンクフィールドの値
は「100001234」という同一のアドレス番号で
あるから、共に同じキーワード、例えば「気候」という
キーワードの次に入力されたキーワードであることを示
している。第3フィールドには、クライアント200か
ら入力された実際の「キーワード」の文字列が記憶され
ている。
【0030】キーワード管理ファイルの第4フィールド
は「絞り込みリンク」であり、図3に示す「絞り込みキ
ーワード管理ファイルの第1フィールドに当たるアドレ
ス番号が記憶されている。すなわち、「絞り込みリン
ク」のフィールドに入力されたアドレス番号により、図
2に示す1つのアドレス番号のキーワードは、絞り込み
キーワード管理ファイルの1つのアドレス番号とリンク
することになる。本実施例の場合、図3に示す絞り込み
キーワード管理ファイルの第1フィールドのアドレス番
号は「100002345」であり、図2に示すキーワ
ード管理ファイルの第1レコード、第4フィールドの値
と一致し、これらのデータがリンクしていることを示し
ている。図3に示す絞り込みキーワード管理ファイルの
第2フィールドから第5フィールドに記憶されるデータ
A(ti)は、キーワード管理ファイルのアドレス番号
であり、その第1フィールドとリンクしているキーワー
ド(本実施例の場合は「天気」)の次の絞り込み検索に
使用された下位リンクのキーワードのアドレス番号が、
その使用された頻度順に記憶、更新されている。すなわ
ち第2フィールドは、下位リンクとして使用された総計
の最も多いキーワードのアドレスが最上位に、第2段目
には次に多いキーワードのアドレス、と順に記憶されて
いる。また、第3フィールドから第5フィールドには、
過去の1年間、1ヶ月、1週間と限った場合に下位リン
クとしての使用頻度が高かったキーワードのアドレスが
順に記憶、更新されている。すなわち、1年、1ヶ月、
1週間の間に「天気」というキーワードの次に使用され
る頻度の高かったキーワードが記憶されるキーワード管
理ファイルのアドレス番号が昇順で記憶されている。
【0031】図2の第5フィールドに記憶される頻度リ
ンクは、図4にしめす頻度管理ファイルの第1フィール
ドに記憶されるユニーク値であるアドレス番号である。
すなわち、「頻度リンク」のフィールドに入力されたア
ドレス番号により、図2に示す1つのアドレス番号のキ
ーワードは、頻度管理ファイルの1つのアドレス番号と
リンクすることになる。ここで頻度管理ファイルの第2
フィールドから第5フィールドに記憶される値は、キー
ワード管理ファイルに記憶されているキーワードが使用
された頻度(回数)を示す値であり、第2フィールドか
ら順に過去の総計、一年、1ヶ月、1週間の頻度が記
憶、更新されている。
【0032】また、頻度管理ファイルの第6フィールド
である詳細リンクは、図5に示す詳細履歴のユニーク値
であるアドレス番号である。詳細履歴には絞り込みキー
ワード管理ファイルに記憶されているキーワードによる
検索が行なわれた日時が順に記憶されている。
【0033】キーワード管理ファイルの第6フィールド
は、このレコードのキーワードにより検索サーバが絞り
込んだデータ数を示す検索結果数が記憶、更新される。
また、第7フィールドは最終更新日時であり、このレコ
ードのキーワードに関する上記情報が更新された最新の
日時が記憶、更新されている。
【0034】以上のように構成されている本実施例の情
報検索装置100を用いてクライアント200から実際
にデータの検索を行なうときの処理について説明する。
クライアント200では、いわゆるブラウザが起動され
ており、このブラウザが検索管理サーバ110の特定の
ページをアクセスすることで検索が開始される。図6
は、クライアント200側の処理を示すフローチャート
である。図示するようにクライアント200にて情報検
索が実行されると、まずブラウザによる検索用の初期画
面が表示される(ステップS100)。検索開始の時点
では、特にキーワードの履歴などが表示される訳ではな
く、通常の検索画面が表示されることになる。即ち、図
7に示すように、検索用のキーワードを入力するボック
スKBや、予測検索か実検索かを指定するラジオボタン
RB、および検索の実行を指示する実行ボタンEBが表
示される。利用者は、この画面を見ながら、キーボード
などを用いてキーワードを入力し、検索条件をラジオボ
タン(択一的な選択が行なわれるタイプのボタン)を選
択する(ステップS102)、その後、検索の実行を指
示する「実行ボタン」をクリックすると、検索指示が情
報検索装置100側に出力される(ステップS10
4)。ステップS102で入力されたキーワードは、検
索実行処理(ステップS104)に伴って情報検索装置
100へ送信されるのである。
【0035】この送信を受けて、情報検索装置100側
では検索の処理が実行されるが、説明の都合上、まずク
ライアント200側の処理を説明する。検索指示を出力
した後(ステップS104)、クライアント200は、
情報検索装置100からの返答を待ち、後述する情報検
索装置100の出力を受けて検索結果の画面を表示する
(ステップS106)。このときの画面表示の一例を図
8に示した。この画面では、検索に用いられたキーワー
ドを示すキーワード表示ボックスKB、その横に配置さ
れ、予測検索か実検索かを指示する指示ボタンGG,R
G、先に入力したキーワードによる検索の結果、実際に
検索されて得られたデータの数または予測されるデータ
数を示すボックスFB、その検索の結果得られたデータ
自体を上位から示すデータ表示ボックスDDB、先のキ
ーワードに続けて検索可能な予測キーワードをそのキー
ワードについての予測検索数と共に示す予測キーワード
表示ボックスGKB、等が表示される。予測キーワード
表示ボックスGKBには、予測数が、「総累積、最近1
年、最近1ヶ月、最近1週間」の何れであるかという情
報(以下、「検索期間」という)、および次のキーワー
ド候補の表示数を「上位10個、上位20個」の何れと
するかを示す情報もラジオボタンの形で表示されてい
る。
【0036】利用者は、この画面を見ながら、仮に予測
検索を継続する場合には、予測キーワード表示ボックス
GKBに表示されたいずれかのキーワードを選択し、更
にその検索期間と次のキーワードの表示数の設定を行な
った上で(ステップS102)、検索を継続する(ステ
ップS104)。検索が完了すれば(ステップS10
8)、通常はデータ表示ボックスDDBに表示されたデ
ータを直接クリックして、そのデータを参照する処理を
行なう。
【0037】次に、情報検索装置100側で行なわれる
サーバ側検索処理ルーチンについて、図9を参照して説
明する。情報検索装置100は、検索要求があるか否か
を監視しており(ステップS200)、クライアント2
00側からの検索の指示を受けとねと、任意のキーワー
ドや上記各種指示を受信し、最初にそのキーワードによ
る絞り込み検索が実際の検索の指示であるか、予測検索
の指示であるかを判断する(ステップS201)。そし
て、実際の検索が指示されている場合には、無条件に次
の検索実行処理(ステップS202)が行なわれ、検索
サーバ130によるデータベースDBの検索が実行され
る。検索を実行した後、そのキーワードについての検索
の履歴が、キーワード履歴管理サーバ120に存在する
か否かの判断を行なう(ステップS204)。履歴が一
度も作成されていないと判断された場合には、キーワー
ド履歴管理サーバ120は、そのキーワードについての
履歴データを新たに作成する処理を行なう(ステップ
S)206)。他方、キーワード履歴管理サーバ120
がそのキーワードについての履歴データを有している場
合には、検索履歴データを更新する処理を行なう(ステ
ップS208)。検索履歴データの更新処理について
は、後で説明する。
【0038】ステップS201に戻って、予測検索の指
示がなされたと判断された場合には、実際の検索は行な
わず、キーワード履歴管理サーバ120に問い合わせ
て、指定されたキーワードについての履歴が存在するか
否かの判断を行なう(ステップS203)。即ち、キー
ワード履歴管理サーバ120が管理しているキーワード
管理ファイルに、クライアントから送信されてきたキー
ワードについての検索の有効な履歴が記録されているか
否かを判断するのである。この判断により、キーワード
が新規なキーワードであったり、記録があっても更新日
が有効期限を越えているキーワードであった場合には、
処理はステップS202へと移行し、検索サーバ130
による実際の検索処理が実行される。この場合の処理に
ついては既に説明した。
【0039】ステップS203にて有効なキーワードの
記録がなされていると判断された場合にも、ステップS
204で、検索後に検索履歴データが存在すると判断さ
れた場合と同様、検索履歴データの更新処理が行なわれ
る(ステップS208)。なお、検索履歴データの更新
処理には、キーワード管理ファイルを初めとする上述し
た各ファイルのデータ更新処理が含まれる。すなわち、
現在の時刻などが最新の更新日時として記録されたり、
検索の頻度などの値が更新される。また、新規なキーワ
ードによる実際の検索処理が行なわれた場合には、各フ
ァイルには新たなレコードが追加されることになること
は勿論である。
【0040】こうした実際の検索処理やキーワード管理
ファイルなどの更新処理が完了すると、情報検索装置1
00は、画面データの作成し、これをクライアント20
0に送信する(ステップS210)。その後、クライア
ント200側からの接続が継続しているか切断されたか
を判断し(ステップS212)、接続が切断されるま
で、上記の処理を繰り返す。なお、情報検索装置100
が画面データを作成してクライアント200に送信する
と、クライアント200は、画面データを受信し、先に
説明した検索結果表示処理(ステップS106)を実行
する。この結果、クライアント200側の表示画面が更
新される。
【0041】図8は、任意のキーワードとして「新庄」
という文字が入力され、「予測検索」ボタンをクリック
した場合のクライアント200の表示画面例である。こ
の時、情報検索装置100側では、検索管理サーバ11
0により、キーワード履歴管理サーバ120が呼び出さ
れ、キーワード管理ファイル140に記憶されていた新
庄というキーワードの絞り込みリンクを辿って新庄に続
くキーワードとして頻度の多い次候補キーワードが取り
出される。この例では、「大リーグ、温泉、野球、阪神
・・・・」などのキーワードが取り出される。キーワー
ド履歴管理サーバ120は、このキーワード管理ファイ
ル140から取り出した次候補キーワードについて、そ
の次候補キーワードを管理している検索履歴データベー
ス150をアクセスし、絞り込み検索結果の数を、指定
された期間についてカウントし、これを次候補キーワー
ドと関連付けして送信する。すなわち、現在のキーワー
ド「新庄」を更に「大リーグ」というキーワードにより
絞り込みを行なった場合には、予測される最新一年間の
検索結果数として123400ものデータ数であるこ
と、「温泉」というキーワードの場合には同様に123
00のデータ数が予測されること、などが送信され、ク
ライアント200の表示画面に表示される。
【0042】クライアント200側では、図8に示した
画面表示を確認し、希望する次のキーワードをラジオボ
タンで選択したり、キーワード候補に希望するキーワー
ドが無い場合には新たなキーワードを上部のキーワード
入力部に直接入力するなどの処理(ステップS102)
が行なわれ、画面右下の「実行」ボタンがクリックされ
たとき(ステップS104)、新たな検索の実行を情報
検索装置100側に出力する。
【0043】以上のように構成された本実施例の情報検
索装置100によれば、検索サーバ130によるデータ
ベースDBのキーワード検索が実行される毎に、そのキ
ーワード検索が行なわれた際のキーワードの連続性、そ
の検索の日時そして検索結果である検索結果数が、キー
ワード履歴管理サーバ120により検索履歴データベー
ス150に逐次記憶、更新される。また、その記憶、更
新された情報に基づいて、次回の同一のキーワード検索
時には、予測検索が可能となり、そのキーワードにより
絞り込まれるデータ数を予測し、予測されるキーワード
と共にクライアント200へ知らせることができる。こ
のため、クライアント200ではデータの予測数を見て
キーワードが不適切あるいは不十分であることを検索に
先だって知ることができ、絞り込みを行なうキーワード
を訂正や追加することができる。従って、必要なデータ
を得るまでに必要なキーワードによるデータの絞り込み
の繰り返し回数を減少させ、クライアント200と情報
検索装置100との通信量、通信回数を激減させること
ができる上に、検索サーバ130による実際の検索の回
数をも激減させることができ、検索サーバ130の実質
的な負荷を軽減し、より早く必要なデータを得ることが
できる。
【0044】また、本実施例では、実際に検索が行なわ
れた場合に、その検索の日時を検索履歴データベース1
50に記録しているので、予測検索における該当件数
を、「最近1年」「最近1ヶ月」「最近1週間」といっ
た期間毎に表示することができる。また、予測する次候
補キーワードの数も、上位20個か10個かを選択する
ことができる。もとより、更に多数のキーワードを表示
したり、少ない数のキーワードを表示したりすることも
可能である。更に、表示画面を充分に確保できる場合に
は、各キーワードの下記のキーワードまで階層構造で表
示し、それぞれのデータの該当数を併せて表示するとい
った対応も可能である。こうすれば、多数のキーワード
により予測検索の結果を一目で知ることができ、検索回
数を更に低減することができる。
【0045】以上説明した情報検索装置100による検
索は、過去の検索に基づいて、次の検索の予測キーワー
ドや予測データ数を、検索に先立って表示している。こ
うした予測は、検索回数が少ないデータベースを対象と
している場合には、履歴を管理しているキーワードが少
なく精度を高めることは困難だが、インターネット上の
検索サーバのように、短期間に多数の検索(例えば一日
で数百万回の検索)が行なわれる装置では、きわめて有
効である。一人一人の利用者の関心や検索の範囲はまち
まちだが、これが所定数以上集まると、ある利用者が検
索しようとする範囲を既に他人が検索している蓋然性は
きわめて高くなるからである。特に、次候補キーワード
は、そのキーワード単独での検索回数が多いか否かで予
測されている訳ではなく、上位のキーワードとの関連付
けにおいて予測されている。従って利用者からすると、
自分が検索しようとしているキーワードが予測される確
率はきわめて高いものとなっている。多数の人間の関心
には一定の傾向が存在するからである。
【0046】なお、上記実施例では、インターネットI
Nを介して情報検索装置100とクライアント200が
分離している例について説明したが、これらを一体的に
構成してもよい。また、情報検索装置100を構成する
サーバを3つに分離することなく一体に構成してもよ
い。
【0047】以上、本発明の実施例について説明した
が、本発明は上記実施例に何ら限定されるものではな
く、その要旨を逸脱しない範囲内において、種々の態様
により具現化されることは勿論である。
【図面の簡単な説明】
【図1】本発明の実施例である情報検索装置100とク
ライアント200の接続説明図である。
【図2】その情報検索装置100にて管理されるキーワ
ード管理ファイルの構成説明図である。
【図3】同じく絞り込みキーワード管理ファイルの構成
説明図である。
【図4】同じく頻度管理ファイルの構成説明図である。
【図5】同じく詳細履歴の構成説明図である。
【図6】クライアント200にて処理される情報検索の
フローチャートである。
【図7】クライアント200のモニタに表示される初期
画面の一例を示す説明図である。
【図8】クライアント200のモニタに表示される検索
結果表示の一例を示す説明図である。
【図9】情報検索装置100側における検索処理の詳細
なフローチャートである。
【符号の説明】
100…情報検索装置 110…検索管理サーバ 120…キーワード履歴管理サーバ 130…検索サーバ 140…キーワード管理ファイル 150…検索履歴データベース 200…クライアント DB…データベース DDB…データ表示ボックス FB…データ数表示用ボックス GG…指示ボタン GKB…予測キーワード表示ボックス IN…インターネット KB…キーワード表示ボックス

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 入力されたキーワードによってデータベ
    ースから必要なデータを絞り込む検索エンジンを有する
    情報検索装置であって、 入力されたキーワードにより絞り込まれるデータ数を、
    前記検索エンジンによる過去の検索結果を用いて予測す
    るデータ数予測手段と、 該予測されたデータ数を、次の検索に先立って提示する
    予測数提示手段とを備える情報検索装置。
  2. 【請求項2】 前記データ数予測手段は、前記検索エン
    ジンが任意のキーワードによってデータベースから必要
    なデータを絞り込んだとき、当該キーワードと絞り込ま
    れたデータ数とを関連付けして記憶し、以後の当該キー
    ワードにより絞り込まれるデータ数の予測に際して、前
    記関連付けして記憶されたデータ数を用いる請求項1記
    載の情報検索装置。
  3. 【請求項3】 前記データ数予測手段は、前記検索エン
    ジンが任意のキーワードによってデータベースから必要
    なデータを絞り込んだとき、当該キーワードと絞り込ま
    れたデータ数と絞り込んだ時刻とを関連付けして記憶
    し、以後の当該キーワードにより絞り込まれるデータ数
    の予測に際して、前記関連付けして記憶されたデータ数
    と時刻とを用いる請求項1記載の情報検索装置。
  4. 【請求項4】 入力された任意のキーワードによって連
    続的にデータベースから必要なデータを順次絞り込む検
    索エンジンを有する情報検索装置であって、 入力されたキーワードの次に入力されるキーワードを、
    前記検索エンジンによる過去の検索結果を用いて複数個
    予測するキーワード予測手段と、 該予測された各キーワードにより前記検索エンジンが絞
    り込むデータ数を予測する次データ数予測手段と、 該予測されるデータ数を、前記予測された複数個のキー
    ワードと関連付けて提示する次予測数提示手段とを備え
    る情報検索装置。
  5. 【請求項5】 請求項4記載の情報検索装置であって、 前記キーワード予測手段は、前記検索エンジンが任意の
    キーワードによって連続的にデータベースから必要なデ
    ータを順次絞り込んだとき、当該任意のキーワードを連
    続的に記憶し、以後の当該キーワードの次に入力される
    キーワードの予測に用いる手段であり、 前記次データ数予測手段は、前記キーワード予測手段に
    より記憶される連続的なキーワードについて前記検索エ
    ンジンによって絞り込まれたデータ数を記憶し、以後の
    当該キーワードにより絞り込まれるデータ数の予測に用
    いる手段である情報検索装置。
  6. 【請求項6】 請求項4記載の情報検索装置であって、 前記キーワード予測手段は、前記検索エンジンが任意の
    キーワードによって連続的にデータベースから必要なデ
    ータを順次絞り込んだとき、当該任意のキーワードを連
    続的に、かつ、絞り込んだ時刻と関連付けして記憶し、
    以後の当該キーワードの次に入力されるキーワードの予
    測に用いる手段であり、 前記次データ数予測手段は、前記キーワード予測手段に
    より記憶される連続的なキーワードについて前記検索エ
    ンジンによって絞り込まれたデータ数と前記時刻を、以
    後の当該キーワードにより絞り込まれるデータ数の予測
    に用いる手段である情報検索装置。
  7. 【請求項7】 請求項4ないし6のいずれか記載の情報
    検索装置において、 前記次予測数提示手段により提示されたキーワードを選
    択することで、当該選択されたキーワードを前記検索エ
    ンジンへ入力するキーワードに設定するキーワード設定
    手段を備える情報検索装置。
  8. 【請求項8】 請求項1または請求項4記載の情報検索
    装置であって、 前記検索エンジンは、ネットワークを介して接続された
    他のコンピュータからの求めに応じて検索を行なう手段
    であり、該検索エンジンが検索する対象は、前記ネット
    ワーク自体または該ネットワークとは異なるネットワー
    クに接続され多数のコンピュータに記憶された情報であ
    る情報検索装置。
  9. 【請求項9】 入力されたキーワードによってデータベ
    ースから必要なデータを絞り込む検索エンジンを用いて
    情報を検索する方法であって、 入力されたキーワードにより絞り込まれるデータ数を、
    前記検索エンジンによる過去の検索結果を用いて予測
    し、 該予測されたデータ数を、次の検索に先立って提示する
    情報検索方法。
  10. 【請求項10】 入力された任意のキーワードによって
    連続的にデータベースから必要なデータを順次絞り込む
    検索エンジンを用いて情報を検索する方法であって、 入力されたキーワードの次に入力されるキーワードを、
    前記検索エンジンによる過去の検索結果を用いて複数個
    予測し、 該予測された各キーワードにより前記検索エンジンが絞
    り込むデータ数を予測し、 該予測されるデータ数を、前記予測された複数個のキー
    ワードと関連付けて提示する情報検索方法。
JP2001305500A 2001-10-01 2001-10-01 情報検索装置およびその方法 Pending JP2003108594A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001305500A JP2003108594A (ja) 2001-10-01 2001-10-01 情報検索装置およびその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001305500A JP2003108594A (ja) 2001-10-01 2001-10-01 情報検索装置およびその方法

Publications (1)

Publication Number Publication Date
JP2003108594A true JP2003108594A (ja) 2003-04-11

Family

ID=19125281

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001305500A Pending JP2003108594A (ja) 2001-10-01 2001-10-01 情報検索装置およびその方法

Country Status (1)

Country Link
JP (1) JP2003108594A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005122016A1 (ja) * 2004-06-10 2005-12-22 Matsushita Electric Industrial Co., Ltd. 入力補助装置、情報検索装置、入力補助方法、及びプログラム
JP2010113390A (ja) * 2008-11-04 2010-05-20 Hands:Kk 商品情報検索装置、方法、及びコンピュータプログラム
JP2011133926A (ja) * 2009-12-22 2011-07-07 Yahoo Japan Corp 商品検索支援装置、方法及びプログラム
JP2014099062A (ja) * 2012-11-14 2014-05-29 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置、情報検索方法、及びプログラム
JP2014154142A (ja) * 2013-02-07 2014-08-25 Fuji Xerox Co Ltd 検索の結果のプレビューを生成するシステム、方法及びプログラム
JP5919450B1 (ja) * 2015-07-22 2016-05-18 楽天株式会社 検索装置、検索方法、記録媒体、および、プログラム
JP2016194865A (ja) * 2015-04-01 2016-11-17 富士通株式会社 検索結果予測プログラム、検索結果予測方法及び検索結果予測装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005122016A1 (ja) * 2004-06-10 2005-12-22 Matsushita Electric Industrial Co., Ltd. 入力補助装置、情報検索装置、入力補助方法、及びプログラム
JP2010113390A (ja) * 2008-11-04 2010-05-20 Hands:Kk 商品情報検索装置、方法、及びコンピュータプログラム
JP2011133926A (ja) * 2009-12-22 2011-07-07 Yahoo Japan Corp 商品検索支援装置、方法及びプログラム
JP2014099062A (ja) * 2012-11-14 2014-05-29 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置、情報検索方法、及びプログラム
JP2014154142A (ja) * 2013-02-07 2014-08-25 Fuji Xerox Co Ltd 検索の結果のプレビューを生成するシステム、方法及びプログラム
JP2016194865A (ja) * 2015-04-01 2016-11-17 富士通株式会社 検索結果予測プログラム、検索結果予測方法及び検索結果予測装置
JP5919450B1 (ja) * 2015-07-22 2016-05-18 楽天株式会社 検索装置、検索方法、記録媒体、および、プログラム
TWI585599B (zh) * 2015-07-22 2017-06-01 Rakuten Inc A retrieval device, a retrieval method, a recording medium, and a program

Similar Documents

Publication Publication Date Title
US9171078B2 (en) Automatic recommendation of vertical search engines
CN101882149B (zh) 重排序和提高搜索结果的相关性
JP4638439B2 (ja) ウェブ検索の個人化
US20200302110A1 (en) System and method for providing content to users based on interactions by similar other users
US10997184B2 (en) System and method for ranking search results
JP3717808B2 (ja) 情報検索システム
JP5752245B2 (ja) 情報検索方法、情報検索装置及び記憶媒体
US20030014399A1 (en) Method for organizing records of database search activity by topical relevance
JP5673336B2 (ja) 情報処理方法、表示方法、情報処理装置、表示装置、情報処理プログラム、表示プログラム
JP2009503751A (ja) 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム
US9594809B2 (en) System and method for compiling search results using information regarding length of time users spend interacting with individual search results
JP5504595B2 (ja) 情報処理装置、情報検索システム、情報処理方法およびプログラム
JP2008538149A (ja) 格付け方法、検索結果組織化方法、格付けシステム及び検索結果組織化システム
JP2002215659A (ja) 情報検索支援方法および情報検索支援システム
JP3964630B2 (ja) 情報検索装置と情報検索プログラムおよび該プログラムを記録した記録媒体
JP5228584B2 (ja) 興味情報特定システム、興味情報特定方法、および興味情報特定用プログラム
JP5194731B2 (ja) 文書関連度算出システム、文書関連度算出方法および文書関連度算出プログラム
JP2003108594A (ja) 情報検索装置およびその方法
JP2007034772A (ja) Webサイト検索結果の最適表示システム及びその装置及びその方法及びそのプログラム
JP3645431B2 (ja) 情報検索支援装置および情報検索支援プログラム記憶媒体
JP2013134755A (ja) 情報検索システム及び情報検索方法
JP4528203B2 (ja) ファイル検索方法、ファイル検索装置、及びファイル検索プログラム
JP5915724B2 (ja) 情報処理方法、表示方法、情報処理装置、表示装置、情報処理プログラム、表示プログラム
JP2022111544A (ja) 情報処理システム、及び情報処理方法
JP5813560B2 (ja) 検索条件提示装置、方法、及びプログラム