JP5262434B2 - 情報検索システム、情報検索方法、プログラムおよび記録媒体 - Google Patents

情報検索システム、情報検索方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP5262434B2
JP5262434B2 JP2008216717A JP2008216717A JP5262434B2 JP 5262434 B2 JP5262434 B2 JP 5262434B2 JP 2008216717 A JP2008216717 A JP 2008216717A JP 2008216717 A JP2008216717 A JP 2008216717A JP 5262434 B2 JP5262434 B2 JP 5262434B2
Authority
JP
Japan
Prior art keywords
search
information
search condition
user
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008216717A
Other languages
English (en)
Other versions
JP2010055173A (ja
Inventor
禎史 荒木
哲也 池田
盈輝 徐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2008216717A priority Critical patent/JP5262434B2/ja
Publication of JP2010055173A publication Critical patent/JP2010055173A/ja
Application granted granted Critical
Publication of JP5262434B2 publication Critical patent/JP5262434B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、入力された検索条件に関連する過去の検索条件を抽出し、その抽出した検索条件において利用者が過去に参照または指定した情報を表示することができる情報検索システム、情報検索方法、その方法を実行するためのコンピュータ可読なプログラムおよびそのプログラムを格納した記録媒体に関する。
データベースにおける記憶容量の増加やネットワーク環境が整備されてきたことに伴い、膨大な情報を参照し、取得することができるようになっている。その際、利用者の目的に適合する情報を探すために、情報検索が行われる。
一般に、情報検索は、利用者が文字列からなる検索条件を入力し、得られた検索結果の中からその利用者が自己の目的に適合した情報を探すことにより行われている。
しかしながら、利用者が入力した検索条件だけではなく、利用者が過去に参照した関連情報や他人が過去に参照した関連情報等を、その利用者や他人の検索履歴を利用して表示することができれば、検索効率の向上や発想の広がりが期待できる。
そこで、利用者の過去の検索履歴を使用して情報検索を行う装置や方法が提案されている(例えば、特許文献1参照)。特許文献1に記載の技術では、情報提供サーバが、検索履歴DBと、文書検索手段と、履歴検索手段と、結果表示生成手段とを備え、検索履歴DBが、ユーザ端末からの過去の検索要求に関する履歴情報としてユーザIDと検索要求IDと検索条件と検索結果とを対応付けて保持しており、文書検索手段が、ユーザ端末から指定された検索条件を含む検索要求に応答して、この指定された検索条件に従って情報検索を行い、履歴検索手段が、この検索要求に応答して、検索履歴DBに保持された履歴情報から、ユーザIDが一致し、かつ指定検索条件に一致する過去の検索要求を履歴検索し、結果表示生成手段が、文書検索手段により得られた検索情報と、履歴検索手段の過去の検索要求に関連する情報とを合成して表示画面情報を生成し、その表示画面情報をユーザ端末へ送信する。
この特許文献1に記載の技術では、過去に検索したときの検索条件と全く同じでなくても、その一部が一致している場合、その過去の検索条件で検索された情報を抽出することができる。このため、オフィスや自宅で検索あるいは閲覧した情報を、後にモバイル環境でその情報が必要となった場面において効率良く取得することができる。
上記の特許文献1に記載の技術では、利用者の過去の履歴しか活用できない。そこで、他人の過去の履歴も活用して情報検索を行う方法が提案されている(例えば、特許文献2参照)。特許文献2に記載の方法は、検索要求が発生した場合に検索結果の少なくとも一部分と検索条件と検索要求元を特定する情報とを検索履歴として保持する第1の手順と、過去の検索結果の参照を指示する検索要求が発生した場合には保存されている検索履歴を参照して検索要求元が今回の検索要求と適合する過去の検索結果を抽出する第2の手順と、抽出された過去の検索結果と今回の検索要求の検索結果とに基づいて今回の検索結果を生成し検索要求元に提供する第3の手順とを設けてなるものである。
上記の方法を使用し、任意の端末装置から所定の通信網を介してアクセス可能な任意のコンピュータ上に存在し、随時更新される可能性のある文書情報の集合を対象として文書情報の検索を行うことで、過去の検索の際に発見した文書の再検索を容易に行うことができる。
特開2003−6225号公報 特開2004−178070号公報
しかしながら、特許文献2に記載の技術では、新たな検索で利用した検索条件と全く同じ過去の検索条件の下での検索結果のみを抽出し、提供するため、過去の検索条件を忘れた場合には、同じ結果を抽出することはできない。また、あまりなじみの分野の情報を検索する場合、適切な検索条件を思いつかないことが多く、他人が過去に関連する情報についての検索を行っていても、その他人が使用した検索条件と同じ検索条件を思いつかない限り、同じ結果を有効活用することはできない。
特許文献1に記載の技術では、検索条件の少なくとも一部が一致している必要があるが、その一部ですら忘れてしまった場合や、適切な検索条件を思いつかない場合には、関連する過去の検索結果を有効活用することはできない。なお、この技術では、利用者の過去の履歴しか活用できないので、他人の過去の履歴を活用することはできない。
いずれの技術にしろ、従来の技術では、意味的に関連の強い単語同士、例えば「図書館」と「library」は一致していないので、過去に検索条件として「library」を指定して検索を行い、その履歴情報があるにしても、新たな検索条件として「図書館」を指定して行う検索には、過去の「library」を指定して行った検索結果を活用することはできなかった。
また、検索結果の表示では、利用者の検索履歴と他人の検索履歴とを区別していないため、利用者が自己の検索目的に適合した検索履歴を見出すことが難しく、例えば、自己の過去の検索行動や思考を思い出したい場合と、自分とは異なる新たな発想を広げたい場合のそれぞれに適した検索履歴を容易に区別することはできなかった。
さらに、関連する過去の検索履歴の表示順については、特段の指定がないため、利用者の興味や関心がある情報が下位に表示される場合があり、その情報を探すのにも手間がかかっていた。
そこで、利用者が過去の検索条件を忘れた場合や適切な検索条件を思いつかない場合であっても、利用者の目的、興味や関心に適合した情報を出来るだけ少ない手間で参照することができる情報検索システムや情報検索方法の提供が望まれていた。
本発明は、上記課題を解決するために、検索条件と、その検索条件に対応する検索結果に含まれる情報、検索結果のうち利用者が参照した情報、検索結果のうち利用者が適合情報として指定した情報の少なくとも1つとを関連付けて検索履歴として記録しておき、新たな検索条件の入力があったとき、その検索履歴を使用して、新たな検索条件と検索履歴中の過去の検索条件との間の関連度を算出し、関連度が高い指定数または関連度が閾値以上の過去の検索条件とそれに関連付けられた参照情報や適合情報等を表示させる応答データを生成するように構成する。応答データは、利用者が使用するクライアント装置へ送られ、クライアント装置では、新しい検索条件で検索された検索結果のほか、関連度が高い過去の検索条件、参照情報や適合情報等が表示される。
このように構成することで、共通の単語を含まない検索条件同士でも高い関連度が算出される可能性があり、過去の検索履歴を充分に活用することができる。また、関連度が高い参照情報や適合情報等を表示させることができるため、利用者の目的、興味や関心に適合した参照情報等をより上位に表示し、少ない手間で参照することができるようにすることができる。
上記課題は、本発明の情報検索システムおよび情報検索方法を提供することにより解決することができる。
すなわち、本発明によれば、入力された検索条件に適合する情報を検索する情報検索システムであって、
入力された検索条件と、当該検索条件に基づき検索した検索結果に含まれる情報もしくは当該検索結果の中から利用者により参照された情報または当該検索結果の中から利用者により指定された情報の少なくとも1つとを関連付けて検索履歴として記録する記録手段と、
前記検索履歴を使用して、前記検索条件および当該検索条件に関連付けられた情報をノードとした各ノード間のリンクについて定義された重み値を計算し、計算した当該重み値を要素とする隣接行列を生成する生成手段と、
新たに入力された新規検索条件を含む検索要求に応答して、前記検索履歴を使用して、前記ノードと前記新規検索条件のノードとの間のリンクについて定義された重み値を計算し、計算した当該重み値を追加した前記隣接行列を使用して、前記新規検索条件に対する各前記検索条件および当該各検索条件に関連付けられた情報の関連性の強さを表す関連度を計算する計算手段と、
前記関連度が高い指定数または前記関連度が閾値以上の前記検索条件と当該検索条件に関連付けられた情報と前記新規検索条件に基づき検索した検索結果とを用いて、前記検索要求に対する応答データを生成する応答手段とを含む、情報検索システムが提供される。
2つの検索条件のノード間の重み値は、例えば、2つの検索条件の各々に基づき検索した検索結果の両方に含まれる情報数を、当該2つの検索条件の各々に基づき検索した検索結果の総情報数で除した値や、2つの検索条件の各々に基づき検索した検索結果の両方に含まれる利用者により参照された情報数を、当該2つの検索条件の各々に基づき検索した検索結果の総情報数で除した値や、2つの検索条件の各々に基づき検索した検索結果の両方に含まれる利用者により指定された情報数を、当該2つの検索条件の各々に基づき検索した検索結果の総情報数で除した値や、2つの検索条件の各々に含まれる単語の類似度や、これらを組み合わせた値から算出することができる。
応答手段は、利用者が識別しやすいように、新規検索条件に基づき検索した検索結果と、過去の検索条件に関連付けられた関連情報とを並べて表示させる応答データを生成する。これにより、その応答データを受信したクライアント装置では、検索結果と関連情報とを区別して表示することができる。例えば、異なるフレームに検索結果と関連情報とを別々に表示させることができる。
記録手段は、関連情報が参照された回数および関連情報を参照した人数を、関連情報に関連付けて記録することができる。これにより、応答手段は、関連情報を、関連度もしくは回数または人数により順位付けして表示させる応答データを生成することができる。
応答手段は、関連度に応じて検索条件を順位付けし、検索条件毎に、回数または人数により関連情報の順位付けを行うことができる。また、検索条件毎に、関連度もしくは回数または人数により順位付けし、最も高い関連度を有する検索条件に対して票を割り当て、当該最も高い関連度を得票数に1を加えた値で除した後、再び最も高い関連度を有する検索条件に対して票を割り当てる処理を繰り返して、関連情報の順位付けを行うこともできる。これは、いわゆるドント方式と呼ばれるものである。
応答手段は、関連情報のみの表示ではなく、関連情報に回数または人数を付して表示させる応答データを生成することができる。これにより、応答データを受信したクランアント装置では、関連情報に加えて、参照回数や参照人数といった情報も表示することが可能となる。
記録手段は、さらに、検索日時を関連付けて記録し、応答手段は、関連度に応じて検索条件を順位付けし、検索条件毎に、検索日時により関連情報の順位付けを行うことができる。また、応答手段は、検索日時を付して表示させる応答データを生成することができる。参照回数や参照人数のほか、検索日時により順位付けを行うことができ、クランアント装置では、参照日時も表示することが可能となる。
検索条件に関連する関連情報の表示に際して、新たな検索条件と各関連情報のRWR法における類似度、その関連情報を参照した際に利用した検索条件の類似度、その関連情報の参照回数や参照人数や参照日時を利用して表示順を決定することができ、利用者の目的、興味や関心に適合した関連情報をより上位に表示し、少ない手間で参照することができるようにすることができる。
記録手段は、さらに、関連情報の種別を関連付けて記録し、生成手段は、その種別に応じて設定された重み値を要素として隣接行列を生成することができる。関連情報の種別としては、利用者が全く参照していない情報、利用者が単に参照しただけの情報、利用者が自己の目的に適合しているだろうと判断し、選択した情報、利用者が興味をもち、実際に閲覧して自己の目的に適合していると判断した情報が挙げられる。その重み値は、その種別に応じて予め設定しておくことができる。
記録手段は、さらに、利用者に関する情報を関連付けて記録し、生成手段は、利用者に関する情報をノードとして重み値を計算して隣接行列を生成し、計算手段は、隣接行列を使用して関連度を計算し、応答手段は、利用者が過去に入力した検索条件と当該検索条件に関連付けられた情報と当該利用者が入力した新規検索条件に基づき検索した検索結果とを用いて、検索要求に対する応答データを生成することができる。利用者に関する情報としては、利用者が入力する利用者IDとすることができる。
利用者IDの入力により、利用者を区別することが可能となるため、応答手段は、利用者が参照または指定した関連情報と、他の利用者が参照または指定した関連情報とを区別して表示させる応答データを生成することができる。このように新たな検索条件を入力した利用者自身のその検索条件に関連した過去の関連情報と、他人のその検索条件に関連した過去の関連情報とを区別して表示することができるため、利用者が自分の目的に合った検索履歴を容易に見出すことができる。
本発明では、情報検索システムのほか、情報検索システムが行う各処理ステップを含む情報検索方法や、その方法を実行するためのコンピュータ可読なプログラムを提供することもできる。なお、プログラムは、コンピュータ可読な記録媒体に格納して提供することができる。
図1は、本実施形態の情報検索システムを含むネットワーク環境を例示した図である。このネットワーク環境は、情報の検索要求を送信するクライアント装置10と、クライアント装置10から受信した検索要求を処理するWebアプリケーションサーバ11と、情報検索のためのインデックスを記憶するデータベース12を管理し、情報検索エンジンとして機能するデータベースサーバ13とのそれぞれがネットワーク14に接続され、ネットワーク14を介して互いに通信可能に構築されている。
クライアント装置10は、CPU、RAM、HDD、ネットワークI/F、マウスやキーボードといった入力装置、ディスプレイといった表示装置を備えるPC等とされ、利用者が入力装置を使用して検索条件を入力したことを受け付け、検索条件を含む検索要求をWebアプリケーションサーバ11へ送信する。また、クライアント装置10は、Webアプリケーションサーバ11から検索結果を受信し、表示装置へ表示する。
クライアント装置10は、Webアプリケーションサーバ11へ検索要求を送信して情報検索を指示したり、Webアプリケーションサーバ11から受信した検索結果等の表示を行うGUIを提供するために、Webブラウザを実装する。Webブラウザとしては、これまでに知られたいかなるソフトウェアでも使用することができ、例えば、Internet Explorer(登録商標)、Netscape Navigator(登録商標)、Firefox(登録商標)、Mosaic(登録商標)、Opera(登録商標)を挙げることができる。
Webアプリケーションサーバ11は、クライアント装置10からの検索要求を受信し、検索結果および検索条件に関連した過去に入力された検索条件で検索された情報をクライアント装置10へ送信する。また、Webアプリケーションサーバ11は、データベース12に接続して、検索履歴を取得し、また、検索条件と検索結果とを関連付けて記録し、さらには、検索条件を基に照会を行う。
Webアプリケーションサーバ11は、クライアント装置10が実装するWebブラウザとの間の通信を行うために、Webアプリケーションを実装する。Webアプリケーションとしては、これまでに知られたいかなるソフトウェアでも使用することができ、例えば、IIS(登録商標)、APache(登録商標)、PHP、Java(登録商標) Servlet、JSPを挙げることができる。また、Webアプリケーションサーバ11は、データベース12からデータの取得、データの照会等を行うために、JDBC、ODBC等のAPIを実装することができる。
データベースサーバ13は、検索履歴、情報検索のためのインデックス等のデータを格納するデータベース12を備える。また、データベースサーバ13は、データベース管理システムを実装し、データベース12を管理している。データベース12は、関係データベース、オブジェクト関係データベース、オブジェクトデータベースとして構成することができ、データベース管理システムとしては、例えば、DB2(登録商標)、Oracle(登録商標)、MySQL(登録商標)、PostgreSQL(登録商標)を挙げることができる。
図1では、1つのクライアント装置10しか例示されていないが、ネットワーク14には複数のクライアント装置が接続されていてもよく、また、Webアプリケーションサーバ11、データベース12やデータベースサーバ13も1つずつに限られるものではなく、例えば、情報の種類等で分け、複数のサーバおよびデータベースで構成することもできる。また、図1では、各装置がネットワーク14により互いに接続されているが、これに限られるものではなく、互いが直接接続されていてもよい。
このネットワーク環境では、Webアプリケーションサーバ11、データベース12およびデータベースサーバ13を、情報検索システムとして構成することができ、この情報検索システムは、クライアント装置10からの検索要求に応じて情報検索を実行する。この情報検索システムは、各種情報の検索を実行することができるが、以下、文書を対象とした情報検索を実行するシステムとして説明する。
図1に示す情報検索システムに用いられるWebアプリケーションサーバ11およびデータベースサーバ13のハードウェア構成について説明するが、これらのサーバは同様の構成とすることができるため、ここではWebアプリケーションサーバ11のハードウェア構成を、図2を参照して詳細に説明する。Webアプリケーションサーバ11は、MPU20と、BIOSを格納するROM21と、MPU20により実行されるプログラムが読み出されるメモリ空間を提供するRAM22とを含んで構成される。
MPU20は、内部バス23を介して記憶制御用インタフェース24に接続され、HDD25がMPU20からの入出力要求に応答してデータの書き込み、または読み出しを実行する。また、MPU20は、内部バス23を介してUSB、IEEE1164等のシリアルまたはパラレルインタフェース26を制御して、キーボード、マウス、プリンタ等の入出力装置27と通信して、ユーザからの入力を受け取る。さらに、MPU20は、起動時に、ROM21からBIOSを読み出してシステム診断を行うとともに入出力装置27の管理を行う。記憶制御用インタフェース24としては、IDE、ATA、シリアルATA、UltraATA等の規格により、HDD25の入出力を管理するインタフェースを使用することができる。
Webアプリケーションサーバ11は、さらに、VRAM28と、グラフィックチップ29とを含み、MPU20からの指令に応答して、ビデオ信号を処理し、表示装置30へ送り、表示させる。MPU20は、内部バス23を介してネットワークI/F31と通信し、Webアプリケーションサーバ11を、ネットワーク14を介してクライアント装置10およびデータベースサーバ13と通信させる。
Webアプリケーションサーバ11は、ROM21、HDD25、図示しないNV-RAMやSDカード等の記憶装置に格納されたプログラムを読み出し、RAM22のメモリ領域に展開することにより、OSの下で、後述する各機能手段および各処理を実現する。OSとしては、Windows(登録商標)、UNIX(登録商標)、AIX、LINUX等を使用することができる。
このハードウェア構成は、データベースサーバ13も同様の構成とすることができるが、クライアント装置10もこのWebアプリケーションサーバ11と同様のハードウェア構成とすることができる。
図3は、クライアント装置および情報検索システムの機能ブロック図である。クライアント装置10は、利用者が入力装置を使用して入力した検索条件の入力を受け付ける検索条件入力部40と、検索結果の文書(検索文書)や入力された検索条件に関連した過去に入力された検索条件で検索された文書(関連文書)を受信し画面表示する結果表示部41と、表示された検索結果中の文書へのリンク情報に従ってその文書へアクセスし表示するための文書表示部42とを備える。
クライアント装置10は、Webアプリケーションサーバ11との間でメッセージ交換を行うが、このメッセージ交換は、クッキー等によってセッション管理される。検索条件入力部40は、表示装置へGUI画面を提供し、ユーザへ検索条件の入力を促す。ユーザが入力装置を使用して検索条件を入力すると、検索条件入力部40は、GUIを介して検索指示を受け付け、入力された検索条件を含む検索要求をWebアプリケーションサーバ11へ送信する。
ここで図4に、表示装置に表示させるGUI画面の一例を示す。GUI画面には、検索条件を入力するためのテキストボックス100と、検索要求を指示するための検索ボタン101とが表示される。ユーザは、入力装置であるキーボードを使用してテキストボックス100内に文字入力し、マウスを使用して検索ボタン101を押下することにより、入力した検索条件に基づく検索を開始させ、Webアプリケーションサーバ11に検索要求を指示することができる。なお、入力する文字は、1つの単語に限られるものではなく、複数の単語や文章であってもよい。
Webアプリケーションサーバ11は、クライアント装置10から送信された検索要求を処理し、検索文書や関連文書等をクライアント装置10へ送信する処理を行う。また、Webアプリケーションサーバ11は、データベース12に格納されている検索履歴を取得し、データを格納し、データの照会を行う。
再び図3を参照して、これらの処理を行うために、Webアプリケーションサーバ11は、検索履歴記録部50と、照会処理部51と、検索結果応答部52と、グラフテーブル編成部53と、グラフ構築部54と、グラフ管理部55と、更新要求部56と、サーバ起動部57と、グラフ記憶部58と、規格化処理部59と、RWR(random walk with restart)計算部60と、関連条件抽出部61とを備える。
検索履歴記録部50は、検索された文書のリストを検索結果応答部52から報告として受け取り、クライアント装置10の検索条件入力部40から送信された検索要求に含まれる検索条件と、報告された関連文書とを相互に関連付けて検索履歴格納部71へ記録する。
照会処理部51は、クライアント装置10から受信した検索条件を、SQL等のデータベース言語に変換してインデックスデータベース72に照会する。
検索結果応答部52は、照会結果として検索条件に該当する文書、例えば書誌情報やリンク情報から構成される文書のリストを取得する。そして、検索結果応答部52は、検索要求に対する検索結果を応答データとしてクライアント装置10へ返信する。
クライアント装置10では、結果表示部41がGUIを介して利用者による文書の参照の指示を受けて、文書表示部42を呼び出し、呼び出された文書表示部42が指定された文書へアクセスするとともに、文書が参照された旨の報告をWebアプリケーションサーバ11へ送信する。これを受けて、Webアプリケーションサーバ11の検索履歴記録部50は、その検索条件に対し、さらに参照済みの文書(参照文書)をさらに関連付けて記録する。
参照文書は、単に検索にヒットしただけではなく、利用者に有用な情報であるとして参照された検索条件に関連性が高い文書として検索履歴中に記録される。また、適合性フィードバックにより、利用者が選択した文書をさらに関連性が高い文書(適合文書)として記録することができる。適合性フィードバックは、利用者が、得られた検索結果のうち、どの結果が利用者の目的に適合し、どの結果が利用者の目的に適合しないかをシステムに提供することで検索精度を高めるものである。
この場合、結果表示部41は、検索された文書のリストとともに、適合文書として登録するための登録ボタン等のGUIを表示させ、利用者がそのGUIを介して登録の指示をした文書が検索履歴記録部50へ報告され、検索履歴記録部50は、指示された文書を検索条件に関連付け、適合文書として記録する。ここでは、検索された文書、参照文書、適合文書のすべてを検索条件と関連付けて記録しているが、検索条件と関連付けて記録する文書は、検索された文書、参照文書、適合文書の1つであってもよい。なお、検索された文書は、関連文書となり、参照文書および適合文書を含むものである。これらは、参照文書および適合文書を除く検索された文書(例えば、参照されていない文書)、参照文書、適合文書の順に、利用者の目的、興味や関心が高い文書である。
ここで、記録される検索履歴を、図5を参照して説明する。検索履歴は、検索履歴テーブルとして格納することができ、検索条件を識別するための検索条件IDが入力される条件フィールド110と、検索日時が入力される日時フィールド111と、検索条件の内容が入力される内容フィールド112と、参照文書を識別するための参照文書IDが入力される参照フィールド113とを含む。なお、参照文書に代えて、上記の検索された文書や適合文書であってもよい。
検索履歴は、利用者からの検索要求に含まれる検索条件に関する情報が時系列的に各フィールドに入力される。例えば、検索条件が「電子ジャーナル」については、識別子として0001が割り当てられ、その検索条件で検索して得られた結果から利用者が参照した文書として、2576、15380、40976の3つがあることを示している。
再び図3を参照すると、グラフテーブル編成部53、グラフ構築部54、グラフ管理部55は、統合的に状態遷移グラフを構成する構成手段として機能し、後述するRWR(Random-walk with Restart)方式により要求された新規検索条件と過去の検索条件との間の関連度の算出に用いるための状態遷移グラフを構成して管理する。
グラフテーブル編成部53は、時系列データとして構成される検索履歴を、データベースサーバ13の検索履歴格納部71から読み出して、状態遷移グラフを構成するためのテーブルセットを作成し、グラフテーブル格納部70へ格納する。このテーブルセットは、検索条件毎に履歴情報が整理されて構成される検索条件ノードテーブルと、過去の検索条件で検索された関連文書毎に整理されて構成される関連文書ノードテーブルとを含んで構成される。また、状態遷移グラフの各ノードは、検索条件IDおよび文書IDにより識別される。
グラフテーブル編成部53は、同じ利用者から短時間に頻発して要求された検索要求等の異常な履歴エントリや、内容が同一の重複する履歴エントリ等、不要なエントリを適宜除去して、状態遷移グラフに追加するべき履歴エントリを取捨選択しつつ、テーブルセットを作成する。これらを除去する目的は、いわゆるスパマーからのアタックを排除し、処理効率の低下を防止するためである。
更新要求部56は、予め設定された間隔やスケジュール等に従って、グラフテーブル編成部53に対してテーブルセットの再構成を指令し、検索履歴の経時的な状態変化をテーブルセットに反映させる。
サーバ起動部57は、起動時にグラフ構築部54を呼び出し、グラフ構築部54がグラフテーブル格納部からテーブルセットを読み出して状態遷移グラフを構築する。この状態遷移グラフは、検索条件および関連文書をノードとして含み、接続されるノード間の関係性を表す重み値を含む。状態遷移グラフは、各ノード間の重み値からなる隣接行列によって表現される。グラフ管理部55は、状態遷移グラフを受け取り、グラフ記憶部58に記憶させる。また、グラフ管理部55は、クライアント装置10から検索要求を受信すると、過去の関連した検索条件を抽出するために、新たな検索条件のノードを状態遷移グラフに追加して新規検索要求に適合させて更新し、この更新済みの状態遷移グラフを規格化処理部59へと渡す。
規格化処理部59は、隣接行列の各行の総和が1になるように規格化し、規格化済みの隣接行列をRWR計算部60へ渡す。
RWR計算部60は、規格化済みの隣接行列にRWR方式を適用して、新たに要求された検索条件と、過去の検索条件との間の関連性の強さを表す関連度を計算する。RWR方式では、隣接行列Aに対し、リスタートベクトルVを繰り返し適用して、定常状態のベクトルUを求める。このため、このUには、新規検索条件qnewと、過去の各検索条件qiとの関連度が成分として含まれる。また、RWR計算部60は、ここで得た定常状態のベクトルUを関連条件抽出部61へと渡す。
関連条件抽出部61は、ベクトルUの成分である関連度に従って、検索条件Qiをソーティングし、関連度が高い指定数の検索条件または関連度が予め定めた閾値以上の検索条件からなるリストを、その内容および関連度とともに照会処理部51を経由して検索結果応答部52へと渡す。検索結果応答部52は、そのリストとその検索条件に関連付けられた文書と新規検索条件に基づき検索した検索結果とを用いて、検索要求に対する応答データを生成し、その応答データをクライアント装置10へ送信する。
データベースサーバ13は、グラフ構築部54が構築した状態遷移グラフおよびグラフテーブル編成部53が作成したテーブルセットを格納するグラフテーブル格納部70と、検索履歴を格納する検索履歴格納部71と、文書検索のための全文テキスト検索インデックスを格納するインデックスデータベース72とを含んで構成される。
ここで、状態遷移グラフの構築処理について詳細に説明する。この処理は、Webアプリケーションサーバ11の起動時にサーバ起動部57により呼び出されて開始される。まず、グラフ構築部54が、グラフテーブル格納部70への接続を確立する。グラフ構築部54は、検索条件ノードテーブルおよび関連文書ノードテーブルを読み出して、検索条件qiのノードのセットおよび関連文書vdiのノードのセットからなる状態遷移グラフを構成する。具体的には、検索条件qiおよび関連文書vdiからなるノードセットを行および列とした隣接行列が準備される。
グラフ構築部54は、各検索条件のノード間のリンク(qi→qj)の重み値を計算する。このリンク(qi→qj)の重み値は、検索条件間の関連度を表し、それぞれに対応する検索結果に含まれる検索文書の重複度、若しくは、対応する検索結果から利用者が参照した参照文書の重複度、若しくは、対応する検索結果から利用者が指定した適合文書の重複度、若しくは、検索条件に含まれる単語の類似度、または、これらを適宜組み合わせた値を使用して算出することができる。これらを適宜組み合わせた値は、これらを予め定めた重みを付けて和をとることにより得ることもできる。
検索文書の重複度ObjFeedSim(qi,qj)は、検索条件qiに対応する上位Kの検索文書の集合topK(qi)と、検索条件qjに対応する上位Kの検索文書の集合topK(qj)とを用いて下記式1により算出することができる。
Figure 0005262434
上記の検索文書の重複度は、要するに、qiとqjの両方の検索結果に含まれる文書数を、qiの検索結果に含まれる文書数とqjの検索結果に含まれる文書数の和で除した値である。
参照文書または適合文書の重複度SubFeedSim(qi,qj)は、検索条件qiに対応する参照文書または適合文書の集合visDocs(qi)と、検索条件qjに対応する参照文書または適合文書の集合visDocs(qj)とを用いて下記式2により算出することができる。
Figure 0005262434
利用者が参照した参照文書の重複度は、要するに、qiとqjの両方の検索結果から利用者が参照した文書数を、qiの検索結果に含まれる文書数とqjの検索結果に含まれる文書数の和で除した値である。利用者が指定した適合文書の重要度は、qiとqjの両方の検索結果から利用者が指定した適合文書の数を、qiの検索結果に含まれる文書数とqjの検索結果に含まれる文書数の和で除した値である。
単語の類似度Contsim(qi,qj)は、検索条件qiの内容に含まれる単語の重み値Wsと、検索条件qjの内容に含まれる単語の重み値Wtと、検索条件qiと検索条件qjとの両方に含まれる単語の重み値Wuとを用いて下記式3により算出することができる。
Figure 0005262434
単語の重み値Ws、Wt、Wuは、Tf/Idf法により求められた単語の重要度を表す。Tf/Idf法は、文書中の特徴的な単語を抽出するためのアルゴリズムで、Tfは、単語の出現頻度を表し、Idfは、その単語が全文書中のどれくらいの文書に出現するかを表す尺度である。
例えば、文書dにおける、検索条件ki(i=0,1,…,n)の出現回数をtf(ki,d)とし、kiが出現する文書数をdf(ki)とし、全文書数をNとすると、Idfは、下記式4で与えられ、文書dのスコア値は、下記式5で与えられる。
Figure 0005262434
Figure 0005262434
単語の重み値Ws、Wt、Wuは、このスコア値を採用することができる。なお、スコア値は、出現文書数が少ない検索条件が多く出現するほど大きくなる。検索文書の重複度ObjFeedSim(qi,qj)、関連文書の重複度SubFeedSim(qi,qj)、単語の類似度ContSim(qi,qj)を用いるリンクの重み値の算出方法は、上記式による算出に限定されるものではないが、これらの値に係数を乗じて得られる値を用いることもできる。また、同一検索条件のノード間のリンク(qi→qj ; i=j)の重み値は、0に設定することができる。
グラフ構築部54は、検索条件のノードと関連文書のノードとの間のリンク(qi→vdj)の重み値を計算する。このリンク(qi→vdj)の重み値は、各検索条件と関連文書間の関連度を表し、各検索条件の検索結果から参照された関連文書とその検索条件との間の値を1に設定し、参照関係にない関連文書と検索条件との間の値を0に設定することができる。そのほか、参照関係にある関連文書と検索条件において、検索結果における関連文書のスコア値を適宜規格化した値をその重み値として採用することもできる。
検索条件のノード間のリンク(qi→qj)の重み値、および検索条件のノードと関連文書のノード間のリンク(qi→vdj)の重み値を用い、リンク(vdi→qj)の重み値がリンク(qi→vdj)と同一であるものとして、また、関連文書のノード間のリンク(vdi→vdj)の重み値が0であるものとして、準備された隣接行列の成分にこれらの重み値を入力して、状態遷移グラフを表現する隣接行列を生成し、グラフ記憶部58へ格納する。
図6は、RWR法における隣接行列の構成を示す。この行列は、「検索条件」と検索条件の検索結果から参照された関連文書である「参照文書」とを行および列に配した構成とされている。そして、「参照文書」に続く、行および列に、新たな検索条件を表すベクトルが追加されている。
この行列は、リンク(qi→qj)の重み値、リンク(qi→vdj)の重み値、リンク(vdi→qj)の重み値、リンク(vdi→vdj)の重み値を成分として構成されている。また、最後の行および列には、新たに要求された新規検索条件に対応する行ベクトルおよび列ベクトルがそれぞれ追加されている。この実施形態では、新規検索条件のノードと、過去の検索条件のノードとのリンク(qnew→qj ; qi→qnew)には、ある重み値が与えられ、新規検索条件のノードと履歴に含まれる関連文書のノードとのリンク(qnew→vdj ; vdi→qnew)にも、ある重み値が与えられている。
リンク(qnew→vdj ; vdi→qnew)の重み値は、例えば、検索履歴に含まれる関連文書の中から新規検索条件にて全文検索した場合に得られるスコア値を利用することができ、また、所定の閾値以下のスコア値を有する関連文書との重み値を0に設定することができる。
ここで、リンク(qnew→vdj)は、新たな検索条件qnewと過去の参照文書vdjの関連度を表す値であり、例えば、qnewで過去の参照文書の集合を全文検索した場合の、各vdjのスコア値をこの関連度を表す値に相当させることができる。この処理は、グラフ管理部55が行う。
リンク(qi→qj)は、上述したように、過去の検索条件qiと過去の参照文書vdjの関係を表す値であり、qiでvdjを参照していれば1を設定し、参照していなければ0を設定することができる。なお、参照文書vdjの代わりに適合文書を設定することもできる。リンク(vdi→qj)は、リンク(qi→vdj)を転置したものである。
隣接行列の最後の行と列には、新たな検索条件qnewを表すベクトルが追加されている。リンク(qnew→vdj)は、新たな検索条件qnewと過去の参照文書vdjの関連度を表す値であり、例えば、qnewで過去の参照情報の集合を全文検索した場合の各vdjのスコア値をこれに相当させることができる。この処理も、グラフ管理部55が行う。そしてさらに、qnewと過去の検索条件qi間の関連度をリンク(qnew→qj)として設定する。このリンク(qnew→qj)の具体的な算出方法は、式1において、qiをqnewへ置き換えることにより算出することができる。
なお、新しく行および列に追加するベクトルは、新たな検索条件を表すベクトルに関し、行および列の両方に同じ値を設定する。
図7は、図6に示した隣接行列に数値が入力され、RWR法により計算が行われているところを示した図である。RWR法によるこの計算は、下記式6を用いてRWR計算部50により行われる。
Figure 0005262434
Aは、図7に示す隣接行列、Vは、リスタートベクトル、cは、予め定めた定数値である。Vは、図7に示すように、新規検索条件に対応する成分が1であるほか、他の成分がすべて0であるベクトルである。まず、初期値のベクトルU0としてリスタートベクトルVを与える。現在のベクトルUi(i=1,2,…)から次のベクトルUi+1を算出する。算出されたUiとUi+1との差のノルム(=|Ui+1-Ui|)、すなわち距離を算出し、ノルムが所定の閾値以下となり、収束したか否かを判定する。収束していない場合は、式6中のUiにUi+1を代入し、ベクトルUi+2を算出し、再び収束したかを判定する。このようにしてノルムが所定の閾値以下になったところで、RWR法による計算が十分に収束したと判断して、計算を打ち切る。その結果、図8に示すようなベクトルUが最終的に得られる。得られたベクトルUの各要素は、過去の検索条件(Q1,Q2,Q3)および参照文書(V0,V1,V2,V3)のそれぞれに対応した関連度(RWR値)を示す。
図5の検索履歴情報に対して、新たに「電子図書館」という検索条件を入力した場合の、各検索条件のRWR値の例を図9に示す。ここでは、図5に示した検索条件IDが0001、0002、0023、0075、0137のRWR値が上位5位を占めたと仮定している。
これら5つの検索条件において、利用者が過去に参照した各文書のRWR値を図10に示す。参照文書IDは、図5に示す参照文書IDで、例えば、検索条件IDが0001のものに対しては、2876、15380、40976の3つである。各参照文書について上記のRWR法により算出したRWR値が図10に示されている。
図11は、図10に示すように抽出された各参照文書について、その参照回数、参照人数、最新参照日時を一覧にしたテーブルを示した図である。参照文書は、図9に示した0001、0002、0023、0075、0137の各検索条件において利用者が過去に参照した文書である。参照回数は、全利用者から何回参照されたかを表し、参照人数は、何人の利用者に参照されたかを表す。これらの情報は、参照文書に関連付けて、図5に示すような検索履歴情報として記録することができ、この記録された検索履歴情報から容易に求めることができる。なお、これらの情報は、検索条件が0001、0002、0023、0075、0137以外で参照された可能性もあるので、最新参照日時は、図5に示された日時より新しい場合もある。
図10および図11に示す各文書を順位付けする方法について、以下に説明する。利用者が入力した検索条件に関連する過去の検索条件として、これに限られるものではないが、例えば、上位5位まで選択される。この上位5位までに選択された過去の検索条件は、現在入力した検索条件に高い関連度(RWR値)を有している。
その過去の検索条件で検索され、参照された参照文書が図10および図11にその識別番号で表されているが、それら参照文書を順位付けする。図12は、様々な基準で順位付けした結果を示した図である。
図12に示すテーブルでは、左側からまず、各参照文書につき計算されたRWR値、すなわち図11に示すRWR値に基づき順位付けが行われている。RWR値が大きい参照文書IDが7330から順に入力されている。
次に、最新参照日時を基準に順位付けが行われている。最新参照日時は、図5に示した検索履歴情報あるいは図10に示したテーブルから得ることができ、その日時が最新のものから順に入力されている。
次に、参照回数を基準に順位付けが行われている。参照回数は、図10に示したテーブルから得ることができ、その参照回数が最も多い順に入力されている。
次の「RWR値-参照人数」は、検索条件IDにつき得られたRWR値が大きい順で、かつ参照人数の多い順に順位付けが行われている。図10に示すように、検索条件IDが最も大きいのは0075であるから、その0075の検索条件で検索され、参照文書のRWR値が大きい順にまず順位付けする。すなわち、検索条件ID=0075については、図5に示すように、参照文書ID=3477、7330、10083、28071、52166の5つが参照されており、図11を参照すると、参照文書ID=7330が最もRWR値が大きく、続いて、52166、3477、10083、28071の順とされている。そこで、これらの順に、1位から5位まで入力する。
次の6位には、検索条件IDのRWR値が2番目に大きい0023で検索され、参照文書のRWR値が最も大きい参照文書IDが入力される。検索条件ID=0023については、7330、8075、40976の3つが参照されている。このうちRWR値が最も大きい7330が入力されるが、7330は既に入力されている。順位付けとして入力される値は、重複しないように、重複していない参照文書IDのうち、RWR値が最も大きい参照文書IDが入力される。すなわち、8075が6位に入力され、残りの40976が7位に入力される。
このようにして、検索条件IDのRWR値が3番目に大きい0001、続いて4番目に大きい0002、最後に0137につき、同様にして参照文書IDを入力する。
図12に示すテーブルの右側に示されている順位付けは、図13および図14に示す方法により行われている。この順位付け方法は、比例代表選挙において議席配分で採用されている「ドント方式」と呼ばれる方法である。ここでは、上位5位までの各検索条件で参照した文書を検索条件毎に参照回数で順位付けし、各検索条件のRWR値を「得票率」とみなして、「ドント方式」を適用して、参照文書の全体の順位付けを求めている。
図13を参照すると、検索条件IDがRWR値の大きい順に左側から入力され、検索条件IDで検索され、参照された参照文書が、その参照された回数が多い順に入力されている。すなわち、検索条件ID=0075については、その検索条件で検索され、参照された参照文書は、3477、7330、10083、28071、52166の5つあるが、その5つを参照回数が多い順に並べたものが図13に示されている。これは、他の検索条件についても同様である。
最初に、全体の1位を決定する。ここでは、すべての検索条件において最終的に順位付けされた文書がまだ存在しないので、s=0としてRWR値/(1+s)を計算すると、0.76、0.62、0.58、0.48、0.36が得られる。RWR値は、図9から得られ、計算結果は、1回目の欄に入力される。
1回目の欄中でRWR値/(1+s)が最も大きい0.76を有する検索条件ID=0075で検索され、参照された参照回数が最大の参照文書IDを、全体の1位へ入力する。入力が終了すると、2回目の計算を行う。検索条件ID=0075については1つの参照文書が順位付けされたので、s=1として、RWR値/(1+s)を計算し、その他の検索条件IDについてはまだ参照文書が順位付けされていないので、s=0として計算を行う。すると、0.38、0.62、0.58、0.48、0.36が得られる。これらの値が2回目の欄に入力される。
2回目も同様にして、2回目の欄中でRWR値/(1+s)が最も大きい0.62を有する検索条件ID=0023で検索され、参照された参照回数が最大の参照文書IDを、全体の2位へ入力する。入力が終了すると、3回目の計算を行う。検索条件ID=0075と0023については1つの参照文書が順位付けされたので、s=1として、RWR値/(1+s)を計算し、その他の検索条件IDについてはまだ参照文書が順位付けされていないので、s=0として計算を行う。
これを繰り返すことで、各参照文書を順位付けすることができる。なお、参照回数が最大の参照文書IDを各順位へ入力していくと、図14の向かって左側に配列する順となる。例えば、7330は、1位、2位、6位に順位付けされ、順位が重複することから、7330の順位が不明確である。そこで、1度順位付けされた参照文書についてはそれ以降順位付けしないこととし、右側に示す配列順を構成する。この右側に示す配列順で各参照文書IDを入力したものが図12の「RWR値-参照回数(ドント方式)」の欄に示されている。
図12では、最新参照日時による順位付け、参照回数による順位付け、RWR値かつ参照人数による順位付け、ドント方式による順位付けはいずれも、利用者と他の利用者の参照が含まれている。しかしながら、これに限られるものではなく、ある利用者のみの参照回数、最新参照日時等で順位付けを行ってもよく、また、RWR値かつ参照回数による順位付けや、参照人数を基準としたドント方式を利用して順位付けを行ってもよい。
新たな検索条件「電子図書館」に関連する上位5つ過去の検索条件ID=0001、0002、0023、0075、0137にて、過去に参照された参照文書群を順位付けする方法をいくつか説明したが、これらをすべて実施する必要はない。情報検索システム毎に必要なものを取捨選択してよいし、あるいは、利用者に好みの順位付け方法を選択してもらうという方法でもよい。
図15は、過去の検索条件と関連情報を利用者のコンピュータ端末に表示したところを示した図である。これは、クライアント装置10の結果表示部32に表示される。この例では、新たな検索条件として「電子図書館」が入力され、それと関連した過去の検索条件、すなわち検索条件IDで言えば0001、0002、0023、0075、0137が、RWR値の順に上段に表示されている。
ちなみに、検索条件ID=0075は、電子図書館・マイライブラリ、0023は、図書館評価、0001は、電子ジャーナル、0002は、専門分野・文献検索、0137は、図書館ポータル・利用状況である。
各検索条件を表示する文字はクリック可能な状態となっており、利用者がその文字にポインタを重畳させ、これをクリックすることにより、その検索条件での検索処理を開始できるようになっている。検索条件の表示方法は、図15に示した方法に限られるものではなく、利用者がコンピュータ端末上で認識できるほかの方法であってもよく、また、検索結果と必ずしも一緒に表示する必要もない。その選択方法もマウスによるクリックに限られるものではなく、キーボードのリターンキーの押下等、別の手段を用いて行うこともできる。
図15では、検索条件を「電子図書館」として検索した結果が下段の向かって左側に、過去に参照した関連情報の一覧が下段の右側にそれぞれ表示されている。左側に表示された検索結果は、通常のキーワード検索や概念検索の結果と同様である。右側に表示された関連情報一覧は、「電子図書館」に関連する上位5つの過去の検索条件(ID=0001、0002、0023、0075、0137)にて、過去に参照された情報群を表示しており、その表示順は、図12に示したいずれかの順位付けに基づいて行われている。
また、この図15には、その右側の関連文書一覧に、各文書が左側の通常の検索結果において何位にランクされているかも示されている。例えば、関連文書一覧の1位の文書は、左側の検索結果一覧の2位の文書と同様である。また、関連文書一覧では、それぞれの参照回数も表示されている。ここでは、参照回数としているが、参照人数や最新参照日時等であってもよい。また、関連文書として抽出された文書は、それ以外の文書とは色分けして表示されている。このようにして表示することにより、関連文書とそれ以外の文書との識別が容易になり、かつ相互の検索結果一覧と関連文書一覧との関係も分かりやすくなる。
図16は、図15と同様の検索条件「電子図書館」において、検索結果一覧に、関連文書一覧だけを表示した例である。関連文書とそれ以外の文書とを合わせて表示し、それらを色分けして表示することにより、関連文書とそれ以外の文書との識別を容易にしている。それらの文書を識別することができれば、いかなる色で表示してもよい。
図17は、図15と同様の検索条件「電子図書館」において、検索結果一覧だけを表示した別の例である。ここでは、文書の色分けの代わりに斜体フォントを使用し、関連文書とそれ以外の文書との区別をしている。なお、それらの文書を区別することができれば、斜体フォントに限られるものではなく、太文字等であってもよい。
図18も、図15と同様の検索条件「電子図書館」において、検索結果一覧だけを表示した別の例である。ここでは、アイコンを文書名の冒頭に配置することで、関連文書とそれ以外の文書とを区別している。アイコンは、図示している菱形に限られるものではなく、いかなる形であってもよい。
図16〜18には、「電子図書館で過去に参照した関連情報」という表示があるが、これは実際に表示されても、表示されなくてもよい。
これまでの例は、新たな検索条件である「電子図書館」と関連性のある過去の検索条件として上位5位までを抽出したが、その数は上位5位までに限られるものではない。また、関連度が高い指定数の検索条件に限られるものではなく、予め定めた閾値以上の検索条件を抽出することも可能である。
上記では、検索履歴のみを使用したが、以下に説明する実施例では検索履歴に加えて、検索を実行した利用者の文書を、検索条件や、対応する検索結果の検索文書、その検索結果から利用者が参照した参照文書、その検索結果から利用者が指定した適合文書と相互に関連付けて検索履歴として記録する。この場合、Webアプリケーションサーバ11は、図19に示すように、新規に利用する利用者か否かを判定する利用者判定部62と、新規に利用する利用者である場合、利用者ノードと検索要求ノードとを追加する第1ノード追加部63と、新規に利用する利用者でない場合、検索要求ノードのみを追加する第2ノード追加部64とをさらに備える。
クライアント装置10は、利用者に対し、ユーザIDおよびパスワードの入力を求める画面を表示し、利用者にそれらの入力を促す。利用者は、ユーザIDおよびパスワードをもっている場合は、それらを入力し、それに応答して、検索条件入力部30が検索条件指定画面を表示させ、利用者に検索条件を指定させる。これにより、利用者の過去の検索条件を利用した検索結果のみ、利用者が参照した参照文書のみ、利用者が指定した適合文書のみを活用することが可能となる。一方、ユーザIDをもっていない場合、guestとして利用することができるが、利用者の過去の検索条件を利用した検索結果のみ、利用者が参照した参照文書のみ、利用者が指定した適合文書のみを活用することはできない。
図20は、データベースサーバ13の検索履歴格納部71に格納された検索履歴情報の一例を示した図である。ここでは、各検索条件IDに対して、検索条件ID、検索日時、検索条件の内容、その検索条件で参照した情報IDのほか、その検索を実行した利用者IDを相互に関連付けて格納されている。
図21は、RWR法における隣接行列の構成を示す。ここでは、検索条件のノード(query nodes)と利用者のノード(user nodes)と参照文書のノード(Visited info nodes)を、行および列に配した構成になっている。そして、最後の行と列に、新たな検索条件を表すベクトルが追加されている。リンク(qnew→vdj)については上述したので、ここでは説明を省略する。新たな検索条件を入力した利用者が新規の利用者であれば、それに対応するベクトルが追加される。すなわち、リンク(unew→uj)が追加され、これは、新規利用者unewと各既存利用者ujとの間の関連度を表す値である。この関連度を表す値としては、外部情報、例えば各利用者のプロフィール情報等により別途算出した値を用いることができる。適当な外部情報がない場合は、リンク(unew→uj)をすべて0と設定してもよい。
リンク(ui→qj)は、利用者uiが検索条件qjを使ったことがあれば1、なければ0に設定することができる。リンク(ui→vdj)は、利用者uiが関連情報vdjを参照した回数(もしくは適合情報と判断した回数)を設定する。リンク(qi→uj)とリンク(vdi→uj)はそれぞれの転置である。
リンク(ui→uj)は、利用者uiとujとの関連度を表す値で、各利用者のプロフィール情報のような外部情報により別途算出した値を用いることができる。例えば、uiとujが同じ研究室に属していれば0.9、同じ研究室ではないが同じ学科であれば0.6、同じ学科ではないが同じ学部であれば0.3、学部も異なれば0というように設定することができる。適当な外部情報がない場合は、リンク(ui→uj)をすべて0と設定してもよい。
隣接行列の最後の行と列には、新たな検索条件を表すベクトルが追加されている。リンク(qnew→qj)とリンク(qnew→vdj)については、上述したものと同様である。新たな検索条件を入力した利用者が新規の利用者(New user)であれば、それに対応するベクトルが追加される。リンク(unew→uj)は新規利用者unewと各既存利用者ujとの関連度を表す値で、上記のリンク(ui→uj)と同様に設定することができる。
図21では、新たな検索条件と新規の利用者を表す各ベクトルに関し、列ベクトルにも行ベクトルも同じ値を設定することを示している。
図22は、図21に示す隣接行列に具体的な数値を入力したところを示した図である。RWR法による計算は、RWR計算部により行われる。RWR法による計算は、式6を用いて行われ、その結果として、図23に示すようなベクトルUを最終的に得ることができる。図23では、過去の検索条件(Q1、Q2、Q3)、参照情報(V0、V1、V2、V3)、利用者(U0、U1、U2)のそれぞれに対応した関連度(RWR値)が算出されている。
図20に示した検索履歴情報に対して、新たに「電子図書館」という検索条件を入力した場合の、各検索条件のRWR値の例を示すと、図9のような値となる。そして、これら5つの検索条件において、利用者が過去に参照した各参照文書のRWR値を示すと、図10のような値となる。これらの値は、図20に示す検索履歴情報を用いることにより得ることができる。
こうして得られたRWR値、最新参照日時、参照回数、RWR値かつ参照人数、ドント方式により、過去に参照した参照文書をタンク付けすることができるが、この実施形態では、新たな検索条件qnewを入力した利用者自身(現利用者)の過去の検索条件や参照文書と、他の利用者の過去の検索条件に対応する参照文書とを区別して表示する。そのため、図12〜14に記載した順位付けおよびドント方式の処理は、現利用者と他の利用者でそれぞれ別々になされる。
図20に示す検索履歴情報において、利用者IDが634である利用者が現利用者として、新たに「電子図書館」という検索条件を入力した場合の例を考える。利用者634は「電子図書館」に関連ある上位5位の検索条件のうち0001と0075を実行している。そこで、これら2つの検索条件にて参照した参照文書のみを対象として、順位付けやドント方式の処理を行った結果を図24〜26に示す。なお、図24〜26は、図12〜14に対応するものである。処理の内容は上述したものと全く同様であるため、ここでは説明を省略する。ただし、図26において、ドント方式での全体の順位付けの結果に同じ文書の重複がないため、重複分を削除する過程が省略されている点で異なっている。
図20において、現利用者634以外の他の利用者93、289、467は、「電子図書館」に関連性のある上位5位の検索条件のうち、検索条件IDが0002、0023、0137のものを実行している。そこで、これら2つの検索条件について参照した参照文書のみを対象として、順位付けやドント方式の処理を行った結果を図27〜29に示す。図27〜29はそれぞれ、図12〜14に対応するものである。これも処理の内容は上述したものと全く同様であるので詳細な説明は省略する。ここでは、図29において、ドント方式での全体の順位付けの結果に同じ文書の重複が1件あったため(参照文書ID=7330)、その下位のものを削除する過程が表されている。
図24および図27に示す順位付けを利用して、過去の関連文書一覧を利用者のコンピュータ端末に表示するが、その際、表示スペースを節約するために、現利用者の関連文書一覧に表示した文書と重複する文書は、他の利用者の関連文書一覧には表示しないという場合もある。この例では、参照文書ID=7330、3477、52166、10083、40976、28071が重複しているので、図27に示す順位付けからこれらを除いたものを図30に示す。
図31は、過去の検索条件と関連文書を利用者のコンピュータ端末に表示したところを示した図である。この例では、新たな検索条件として「電子図書館」が入力され、それと関連の高い過去の検索条件が表示されている。その際、「電子図書館」を入力した利用者自身(現利用者)の過去の検索条件(0001と0075)が「あなたの過去の関連検索条件」として、他の利用者の過去の検索条件(0002と0023と0137)が「他人の過去の関連検索条件」として、それぞれ下記のように区別して表示されている。
すなわち、「あなたの過去の関連検索条件」に、検索条件ID=0075の電子図書館・マイライブラリと、検索条件ID=0001の電子ジャーナルとが表示され、「他人の過去の関連検索条件」に、検索条件ID=0023の図書館評価と、検索条件ID=0002の専門分野・文献検索と、検索条件ID=0137の図書館ポータル・利用状況とが表示されている。
表示された各検索条件の文字は、クリック可能な状態となっており、利用者がこれをクリックすることにより、その検索条件での検索処理を開始できるようになっている。検索条件の表示方法は、図31に示した方法に限られるものではなく、利用者が端末上で認識できるほかの方法であってもよく、また、検索結果と必ずしも一緒に表示する必要はない。これもまた、その選択方法がクリックに限られるものではなく、キーボードのリターンキーの押下等、別の手段を用いて行うこともできる。
図31では、「電子図書館」での文書検索結果が下段の左側に、現利用者が過去に参照した関連文書一覧が下段の右側上部に、他の利用者が過去に参照した関連文書が右側下部に、それぞれ表示されている。左側の検索結果は通常のキーワード検索や概念検索の結果と同様である。下段右側上部の関連文書一覧は、「電子図書館」に関連する上位5位までの過去の検索条件のうち現利用者が過去に利用したもの(検索条件ID=0001と0075)に対応して過去に参照した参照文書群が「あなたが過去に参照した関連文書」として表示されており、その表示順は図24にて示したいずれかの順位付けに基づいて入力されている。下段右側下部は他の利用者が過去に利用した検索条件ID=0002、0023、0137に対応して過去に参照した参照文書群が「他人が過去に参照した関連文書」として表示されており、その表示順は、図27あるいは図30に示したいずれかの順位付けに基づいて行われている。
下段右側の関連文書一覧では、各文書が左側の通常の検索結果において何位にランクされているかも示している。例えば、「あなたが過去に参照した関連文書」の1位の文書は、検索結果一覧の2位の文書と同じ文書であり、「他人が過去に参照した関連文書」の2位の文書は、検索結果一覧の3位の文書と同じ文書である。また、「あなたが過去に参照した関連文書」ではそれぞれの参照日時を、「他人が過去に参照した関連文書」では参照人数も一緒に表示している。なお、これらは、参照回数であってもよい。さらに、「あなたが過去に参照した関連文書」と「他人が過去に参照した関連文書」とそれ以外の文書とは色分けして表示されている。これらにより、現利用者および他の利用者の関連情報とそれ以外の文書の識別が容易になり、かつ、相互の検索結果一覧と関連文書一覧との関係も分かりやすくなる。
図32は、図31と同様の検索条件「電子図書館」にて、検索結果一覧と「他人が過去に参照した関連文書」だけを表示した図である。ここでも、文書の色分けを行うことにより、関連文書とそれ以外の文書の識別が容易になっている(2位の文書が関連文書である)。ここで、「他人が過去に参照した関連文書」の右上に「あなたの関連文献へ」というボタンがある。これを押下することにより、図33に示す表示となる。即ち、検索結果一覧と「あなたが過去に参照した関連文書」だけを表示した状態となる。ここでは、「あなたが過去に参照した関連文書」の右上に「他人の関連情報へ」というボタンがあり、これを押下すると図32に示す画面に戻ることができる。
これにより、「あなたが過去に参照した関連文書」もしくは「他人が過去に参照した関連文書」の表示スペースが増えるので、利用者が検索目的、興味や関心に応じて、そのどちらか一方のみを必要とする場合は、目的の文書をより発見しやすくなる。
図34では、「あなたが過去に参照した関連文書」もしくは「他人が過去に参照した関連文書」のそれぞれに対して、異なるアイコンを文書名の冒頭に配置することで、その両者を容易に識別できるようになっている。図34中に「電子図書館」で「あなたが過去に参照した関連文書」と「電子図書館」で「他人が過去に参照した関連文書」との記述があるが、これらは図34の説明用のもので、実際に表示されるわけではない。
なお、これまでの例では、新たな検索条件「電子図書館」と関連の高い過去の検索条件として上位5位までを抽出していたが、その数は上位5位までに限られるものではない。また、関連度が高い指定数の検索条件に限られるものではなく、予め定めた閾値以上の検索条件を抽出することも可能である。
また、これまで説明してきた例では、参照された関連文書か否かで、リンク(qi→dvj)には1か0を設定し、隣接行例の要素として入力した。しかしながら、入力された検索条件で検索された文書には、利用者が全く参照しない文書や、単に参照しただけの文書や、適合性フィードバックにより利用者が自己の目的に適合するとして指定した文書や、利用者が興味をもち、閲覧して自己の目的に適合すると判断した文書が存在する。
単に参照しただけの文書とは、検索結果の一覧画面で利用者が興味をもってタイトルをクリックする等して、その詳細情報を記載したページを閲覧した文書である。利用者は、詳細情報を見たことで、自分に興味や関心がある文書と判断することもあれば、しない場合もある。ただ、単に参照しただけという文書は、関連性の度合いという観点からは適合性が低いものである。
適合性フィードバックにより選択した文書とは、利用者が自己の目的に適合すると判断して選択した文書である。適合するか否かは、図35に示すように、検索結果一覧ページに配置されたチェックボックス120にチェックを入れることで、適合文書として指定することができる。このように利用者が選択した文書であるため、上記の単に参照しただけの文書に比較して適合性が高い文書である。しかしながら、利用者が手短にある文書をとりあえず選択したという場合もあるので、完全には適合していない可能性がある。
利用者が適合すると判断した文書は、利用者が興味をもってタイトルをクリックし、詳細情報のページを閲覧した結果、自己の目的に適合すると判断した文書であるから、適合性については最も高いものである。適合するか否かは、図36に示すように、詳細情報のページに配置されたチェックボックス130にチェックを入れることで、適合文書として指定することができる。
このように文書の種別によって適合性が異なるものであるが、重み値として1と0のみの入力では、利用者の目的、興味や関心を十分に反映することはできない。そこで、これらの文書の種別により、1と0以外の重み値を入力することができるようにする。
重み値としては、文書の種別により、例えば、全く参照しない文書に対しては、0.0を設定し、単に参照しただけの文書に対しては、0.3を設定し、適合性フィードバックにより利用者が自己の目的に適合するとして指定した文書に対しては、0.7を設定し、利用者が興味をもち、閲覧して自己の目的に適合すると判断した文書に対しては、1.0を設定することができる。これらの数値はあくまで一例であり、その他の値を設定することもできる。
これらの種別情報は、検索履歴を記録する際に文書に関連付けて記録することができ、隣接行列を生成する際、その種別情報を参照し、その種別情報に応じて予め設定された値を要素として入力することができる。種別により重み値を入力した隣接行列を図37に例示する。隣接行列を生成後のRWR値の計算および順位付け等は、上述したものと同様であるので、ここでは省略する。
これまで本発明を実施の形態をもって説明してきたが、本発明は上述した実施の形態に限定されるものではなく、他の実施の形態、追加、変更、削除など、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。したがって、本発明は、情報検索システムのほか、その情報検索システムで実行される情報検索方法およびその方法を実現するためのコンピュータ可読なプログラムとして提供することもできるものである。また、このプログラムは、FD、MD、SDカード、CD−ROM、DVD−ROM等の記録媒体に格納して提供することができる。
本実施形態の情報検索システムを含むネットワーク環境を例示した図。 Webアプリケーションサーバのハードウェア構成を例示した図。 クライアント装置および情報検索システムの機能ブロック図。 表示装置に表示させるGUI画面の一例を示した図。 記録される検索履歴を例示した図。 RWR法における隣接行列の構成を示した図。 図6に示した隣接行列に数値が入力され、RWR法により計算が行われているところを示した図。 RWR法による計算された結果を示した図。 各検索条件のRWR値を例示した図。 利用者が過去に参照した各文書のRWR値を例示した図。 図10に示すように抽出された各参照文書について、その参照回数、参照人数、最新参照日時を一覧にしたテーブルを示した図。 様々な基準で順位付けした結果を示した図。 ドント方式を適用して参照文書の全体の順位付けをしているところを例示した図。 重複した参照文書を削除し、順位付けをしているところを例示した図。 過去の検索条件と関連情報を利用者のコンピュータ端末に表示したところを示した図。 図15と同様の検索条件「電子図書館」において、検索結果一覧に、関連文書一覧だけを表示した図。 図15と同様の検索条件「電子図書館」において、検索結果一覧だけを表示した図。 データベースサーバの検索履歴格納部に格納された検索履歴情報の一例を示した図。 情報検索システムの別の実施形態を示した機能ブロック図。 データベースサーバの検索履歴格納部に格納された検索履歴情報の一例を示した図。 RWR法における隣接行列の構成を示した図。 新たな検索条件と新規の利用者を表す各ベクトルに関し、列ベクトルにも行ベクトルも同じ値を設定することを示した図。 RWR法による計算された結果を示した図。 様々な基準で順位付けした結果を示した図。 ドント方式を適用して参照文書の全体の順位付けをしているところを例示した図。 重複した参照文書を削除し、順位付けをしているところを例示した図。 様々な基準で順位付けした結果を示した図。 ドント方式を適用して参照文書の全体の順位付けをしているところを例示した図。 重複した参照文書を削除し、順位付けをしているところを例示した図。 重複した参照文書を削除し、順位付けをしているところを例示した図。 過去の検索条件と関連文書を利用者のコンピュータ端末に表示したところを示した図。 図30と同様の検索条件「電子図書館」にて、検索結果一覧と「他人が過去に参照した関連文書」だけを表示した図。 「あなたの人の関連文献へ」というボタンを押下したときに表示される画面を例示した図。 「あなたが過去に参照した関連文書」もしくは「他人が過去に参照した関連文書」のそれぞれに対して、異なるアイコンを文書名の冒頭に配置した画面を例示した図。 検索結果一覧ページを例示した図。 詳細情報のページを例示した図。 RWR法における隣接行列隣接行列に数値が入力され、RWR法により計算が行われているところを示した図。
符号の説明
10…クライアント装置、11…Webアプリケーションサーバ、12…データベース、13…データベースサーバ、14…ネットワーク、20…MPU、21…ROM、22…RAM、23…内部バス、24…記憶制御用インタフェース、25…HDD、26…インタフェース、27…入出力装置、28…VRAM、29…グラフィックチップ、30…表示装置、31…ネットワークI/F、40…検索条件入力部、41…結果表示部、42…文書表示部、50…検索履歴記録部、51…照会処理部、52…検索結果応答部、53…グラフテーブル編成部、54…グラフ構築部、55…グラフ管理部、56…更新要求部、57…サーバ起動部、58…グラフ記憶部、59…規格化処理部、60…RWR計算部、61…関連条件抽出部、62…利用者判定部、63…第1ノード追加部、64…第2ノード追加部、70…グラフテーブル格納部、71…検索履歴格納部、72…インデックスデータベース、100…テキストボックス、101…検索ボタン、110…条件フィールド、111…日時フィールド、112…内容フィールド、113…参照フィールド、120、130…チェックボックス

Claims (26)

  1. 入力された検索条件に適合する情報を検索する情報検索システムであって、
    入力された検索条件と、当該検索条件に基づき検索した検索結果に含まれる情報もしくは当該検索結果の中から利用者により参照された情報または当該検索結果の中から利用者により指定された情報の少なくとも1つとを関連付けて検索履歴として記録する記録手段と、
    前記検索履歴を使用して、前記検索条件および当該検索条件に関連付けられた情報をノードとした各ノード間のリンクについて定義された重み値を計算し、計算した当該重み値を要素とする隣接行列を生成する生成手段と、
    新たに入力された新規検索条件を含む検索要求に応答して、前記検索履歴を使用して、前記ノードと前記新規検索条件のノードとの間のリンクについて定義された重み値を計算し、計算した当該重み値を追加した前記隣接行列を使用して、前記新規検索条件に対する各前記検索条件および当該各検索条件に関連付けられた情報の関連性の強さを表す関連度を計算する計算手段と、
    前記関連度が高い指定数または前記関連度が閾値以上の前記検索条件と当該検索条件に関連付けられた情報と前記新規検索条件に基づき検索した検索結果とを用いて、前記検索要求に対する応答データを生成する応答手段とを含む、情報検索システム。
  2. 前記生成手段は、2つの検索条件のノード間の重み値を、当該2つの検索条件の各々に基づき検索した検索結果の両方に含まれる情報数を当該2つの検索条件の各々に基づき検索した検索結果の総情報数で除した値、もしくは当該2つの検索条件の各々に基づき検索した検索結果の両方に含まれる前記利用者により参照された情報数を当該2つの検索条件の各々に基づき検索した検索結果の総情報数で除した値、もしくは当該2つの検索条件の各々に基づき検索した検索結果の両方に含まれる前記利用者により指定された情報数を当該2つの検索条件の各々に基づき検索した検索結果の総情報数で除した値、もしくは当該2つの検索条件の各々に含まれる単語の類似度、またはこれらを組み合わせた値から算出する、請求項1に記載の情報検索システム。
  3. 前記応答手段は、前記新規検索条件に基づき検索した検索結果と、前記検索条件に関連付けられた情報とを並べて表示させる前記応答データを生成する、請求項1または2に記載の情報検索システム。
  4. 前記記録手段は、前記検索条件に関連付けられた情報が参照された回数および当該情報を参照した人数を、当該情報に関連付けて記録し、
    前記応答手段は、前記検索条件に関連付けられた情報を、前記関連度もしくは前記回数または前記人数により順位付けして表示させる前記応答データを生成する、請求項1〜3のいずれか1項に記載の情報検索システム。
  5. 前記応答手段は、前記関連度に応じて前記検索条件を順位付けし、前記検索条件毎に、前記回数または前記人数により前記情報の順位付けを行う、請求項4に記載の情報検索システム。
  6. 前記応答手段は、前記検索条件毎に、前記関連度もしくは前記回数または前記人数により順位付けし、最も高い関連度を有する検索条件に対して票を割り当て、当該最も高い関連度を得票数に1を加えた値で除した後、再び最も高い関連度を有する検索条件に対して票を割り当てる処理を繰り返して、前記情報の順位付けを行う、請求項4に記載の情報検索システム。
  7. 前記応答手段は、前記回数または前記人数を付して表示させる前記応答データを生成する、請求項4〜6のいずれか1項に記載の情報検索システム。
  8. 前記記録手段は、さらに、検索日時を関連付けて記録し、前記応答手段は、前記関連度に応じて前記検索条件を順位付けし、前記検索条件毎に、前記検索日時により前記情報の順位付けを行う、請求項4に記載の情報検索システム。
  9. 前記応答手段は、前記検索日時を付して表示させる前記応答データを生成する、請求項8に記載の情報検索システム。
  10. 前記記録手段は、さらに、前記情報の種別を関連付けて記録し、前記生成手段は、前記種別に応じて設定された前記重み値を要素として前記隣接行列を生成する、請求項1〜9のいずれか1項に記載の情報検索システム。
  11. 前記記録手段は、さらに、前記利用者に関する情報を関連付けて記録し、前記生成手段は、前記利用者に関する情報をノードとして前記重み値を計算して前記隣接行列を生成し、前記計算手段は、前記隣接行列を使用して前記関連度を計算し、前記応答手段は、前記利用者が過去に入力した前記検索条件と当該検索条件に関連付けられた情報と当該利用者が入力した前記新規検索条件に基づき検索した検索結果とを用いて、前記検索要求に対する応答データを生成する、請求項1〜10のいずれか1項に記載の情報検索システム。
  12. 前記応答手段は、前記利用者が参照または指定した情報と、他の利用者が参照または指定した情報とを区別して表示させる前記応答データを生成する、請求項11に記載の情報検索システム。
  13. 入力された検索条件に適合する情報を検索する方法であって、情報検索システムが、
    入力された検索条件と、当該検索条件に基づき検索した検索結果に含まれる情報もしくは当該検索結果の中から利用者により参照された情報または当該検索結果の中から利用者により指定された情報の少なくとも1つとを関連付けて検索履歴として記録するステップと、
    前記検索履歴を使用して、前記検索条件および当該検索条件に関連付けられた情報をノードとした各ノード間のリンクについて定義された重み値を計算し、計算した当該重み値を要素とする隣接行列を生成するステップと、
    新たに入力された新規検索条件を含む検索要求に応答して、前記検索履歴を使用して、前記ノードと前記新規検索条件のノードとの間のリンクについて定義された重み値を計算し、計算した当該重み値を追加した前記隣接行列を使用して、前記新規検索条件に対する各前記検索条件および当該各検索条件に関連付けられた情報の関連性の強さを表す関連度を計算するステップと、
    前記関連度が高い指定数または前記関連度が閾値以上の前記検索条件と当該検索条件に関連付けられた情報と前記新規検索条件に基づき検索した検索結果とを用いて、前記検索要求に対する応答データを生成するステップとを含む、情報検索方法。
  14. 前記隣接行列を生成するステップでは、2つの検索条件のノード間の重み値を、当該2つの検索条件の各々に基づき検索した検索結果の両方に含まれる情報数を当該2つの検索条件の各々に基づき検索した検索結果の総情報数で除した値、もしくは当該2つの検索条件の各々に基づき検索した検索結果の両方に含まれる前記利用者により参照された情報数を当該2つの検索条件の各々に基づき検索した検索結果の総情報数で除した値、もしくは当該2つの検索条件の各々に基づき検索した検索結果の両方に含まれる前記利用者により指定された情報数を当該2つの検索条件の各々に基づき検索した検索結果の総情報数で除した値、もしくは当該2つの検索条件の各々に含まれる単語の類似度、またはこれらを組み合わせた値から算出する、請求項13に記載の情報検索方法。
  15. 前記応答データを生成するステップでは、前記新規検索条件に基づき検索した検索結果と、前記検索条件に関連付けられた情報とを並べて表示させる前記応答データを生成する、請求項13または14に記載の情報検索方法。
  16. 前記記録するステップでは、前記検索条件に関連付けられた情報が参照された回数および当該情報を参照した人数を、当該情報に関連付けて記録し、
    前記応答データを生成するステップでは、前記検索条件に関連付けられた情報を、前記関連度もしくは前記回数または前記人数により順位付けして表示させる前記応答データを生成する、請求項13〜15のいずれか1項に記載の情報検索方法。
  17. 前記応答データを生成するステップでは、前記関連度に応じて前記検索条件を順位付けし、前記検索条件毎に、前記回数または前記人数により前記情報の順位付けを行う、請求項16に記載の情報検索方法。
  18. 前記応答データを生成するステップは、前記検索条件毎に、前記関連度もしくは前記回数または前記人数により順位付けし、最も高い関連度を有する検索条件に対して票を割り当て、当該最も高い関連度を得票数に1を加えた値で除した後、再び最も高い関連度を有する検索条件に対して票を割り当てる処理を繰り返して、前記情報の順位付けを行う、請求項16に記載の情報検索方法。
  19. 前記応答データを生成するステップでは、前記回数または前記人数を付して表示させる前記応答データを生成する、請求項16〜18のいずれか1項に記載の情報検索方法。
  20. 前記記録するステップでは、さらに、検索日時を関連付けて記録し、前記応答データを生成するステップでは、前記関連度に応じて前記検索条件を順位付けし、前記検索条件毎に、前記検索日時により前記情報の順位付けを行う、請求項16に記載の情報検索方法。
  21. 前記応答データを生成するステップでは、前記検索日時を付して表示させる前記応答データを生成する、請求項20に記載の情報検索方法。
  22. 前記記録するステップでは、さらに、前記情報の種別を関連付けて記録し、前記隣接行列を生成するステップでは、前記種別に応じて設定された前記重み値を要素として前記隣接行列を生成する、請求項13〜21のいずれか1項に記載の情報検索方法。
  23. 前記記録するステップでは、さらに、前記利用者に関する情報を関連付けて記録し、前記隣接行列を生成するステップでは、前記利用者に関する情報をノードとして前記重み値を計算して前記隣接行列を生成し、前記計算するステップでは、前記隣接行列を使用して前記関連度を計算し、前記応答データを生成するステップでは、前記利用者が過去に入力した前記検索条件と当該検索条件に関連付けられた情報と当該利用者が入力した前記新規検索条件に基づき検索した検索結果とを用いて、前記検索要求に対する応答データを生成する、請求項13〜22のいずれか1項に記載の情報検索方法。
  24. 前記応答データを生成するステップでは、前記利用者が参照または指定した情報と、他の利用者が参照または指定した情報とを区別して表示させる前記応答データを生成する、請求項23に記載の情報検索方法。
  25. 請求項13〜24のいずれか1項に記載の情報検索方法を実行するためのコンピュータ可読なプログラム。
  26. 請求項25に記載のコンピュータ可読なプログラムが記録された記録媒体。

JP2008216717A 2008-08-26 2008-08-26 情報検索システム、情報検索方法、プログラムおよび記録媒体 Expired - Fee Related JP5262434B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008216717A JP5262434B2 (ja) 2008-08-26 2008-08-26 情報検索システム、情報検索方法、プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008216717A JP5262434B2 (ja) 2008-08-26 2008-08-26 情報検索システム、情報検索方法、プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2010055173A JP2010055173A (ja) 2010-03-11
JP5262434B2 true JP5262434B2 (ja) 2013-08-14

Family

ID=42071057

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008216717A Expired - Fee Related JP5262434B2 (ja) 2008-08-26 2008-08-26 情報検索システム、情報検索方法、プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP5262434B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5519406B2 (ja) * 2010-05-28 2014-06-11 株式会社Nttドコモ サーバ装置、ジャンルスコア算出方法およびプログラム
JP5467062B2 (ja) * 2011-01-17 2014-04-09 日本電信電話株式会社 情報推薦装置及び方法及びプログラム
JP5469156B2 (ja) * 2011-12-06 2014-04-09 ヤフー株式会社 情報処理装置、方法及びシステム
JP6096007B2 (ja) * 2013-03-01 2017-03-15 株式会社Nttドコモ コンテンツ検索結果提供装置、コンテンツ検索結果提供方法、及びコンテンツ検索結果提供システム
JP6955161B2 (ja) * 2017-12-15 2021-10-27 富士通株式会社 情報処理プログラム、情報処理装置及び情報処理方法
KR102549006B1 (ko) * 2020-12-11 2023-06-27 주식회사 포인트테크놀러지스 사용자 행동 기반 질의 벡터 자동 보정을 활용한 기업 검색 시스템 및 그 방법

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4042678B2 (ja) * 2003-10-27 2008-02-06 日本電信電話株式会社 単語ベクトル推定方法及び装置及び単語ベクトル推定プログラム及び単語ベクトル推定プログラムを記録したコンピュータ読み取り可能な記録媒体
US7779001B2 (en) * 2004-10-29 2010-08-17 Microsoft Corporation Web page ranking with hierarchical considerations
JP2007041700A (ja) * 2005-08-01 2007-02-15 Nippon Telegr & Teleph Corp <Ntt> トピック抽出装置、トピック抽出方法、トピック抽出プログラム、および、記憶媒体
JP2007066228A (ja) * 2005-09-02 2007-03-15 Nippon Telegr & Teleph Corp <Ntt> コンテンツ検索システムおよびその方法
JP4750628B2 (ja) * 2006-06-14 2011-08-17 日本電信電話株式会社 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
JP2010055173A (ja) 2010-03-11

Similar Documents

Publication Publication Date Title
JP6199947B2 (ja) サーバ
US6947924B2 (en) Group based search engine generating search results ranking based on at least one nomination previously made by member of the user group where nomination system is independent from visitation system
Koshman et al. Web searching on the Vivisimo search engine
JP5328896B2 (ja) ソーシャルネットワークを活用したクエリーの絞込みおよび提案
JP5504595B2 (ja) 情報処理装置、情報検索システム、情報処理方法およびプログラム
JP5116593B2 (ja) 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム
US20130268564A1 (en) Genealogy investigation and documentation systems and methods
US20110252014A1 (en) Applying a model of a persona to search results
JP5262434B2 (ja) 情報検索システム、情報検索方法、プログラムおよび記録媒体
JP2014513826A (ja) コンピュータシステム、データベース及びそれらの使用
TW201447616A (zh) 依據使用者歷史之自動建議
JP2008234550A (ja) 専門家情報検索装置、専門家情報検索方法およびプログラム。
US20150169708A1 (en) Providing recently selected images
JP2002157276A (ja) 問題解決支援方法及びシステム
JP4939637B2 (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
JP2008217674A (ja) 情報処理システム、情報処理方法、サーバコンピュータおよびプログラム
JP5228584B2 (ja) 興味情報特定システム、興味情報特定方法、および興味情報特定用プログラム
JP2013011940A (ja) 情報提供サーバ、情報検索システム、情報検索方法、および情報検索プログラム
JP2013114393A (ja) 情報検索装置およびプログラム
JP2022111544A (ja) 情報処理システム、及び情報処理方法
JP4571648B2 (ja) Web情報提供装置及びその方法、プログラム
JP2012043258A (ja) 検索システム、検索装置、検索プログラム、記録媒体及び検索方法
JP2008158606A (ja) 知識情報管理システム
JP2012043290A (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
CN112214660A (zh) 工业信息标识与检索系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110613

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130415

R151 Written notification of patent or utility model registration

Ref document number: 5262434

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees