JP2008123115A - 情報検索システム、情報検索方法及びプログラム - Google Patents

情報検索システム、情報検索方法及びプログラム Download PDF

Info

Publication number
JP2008123115A
JP2008123115A JP2006304365A JP2006304365A JP2008123115A JP 2008123115 A JP2008123115 A JP 2008123115A JP 2006304365 A JP2006304365 A JP 2006304365A JP 2006304365 A JP2006304365 A JP 2006304365A JP 2008123115 A JP2008123115 A JP 2008123115A
Authority
JP
Japan
Prior art keywords
information
search
user
degree
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006304365A
Other languages
English (en)
Inventor
Kazuyuki Goto
和之 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006304365A priority Critical patent/JP2008123115A/ja
Publication of JP2008123115A publication Critical patent/JP2008123115A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザがどの程度記憶している情報を所望しているのかを考慮した情報検索を行う情報検索システムを提供すること。
【解決手段】操作履歴記憶部7には、ユーザが情報に対して行った作成、編集、閲覧等の操作について、その種類や日時等のデータを記憶した操作履歴が記憶されている。記憶度推定部8は、操作履歴に基づき、ユーザが当該情報について記憶している度合いを示す記憶度を推定する。ユーザが情報の検索を行う際に、検索条件に加えて、検索したい情報についてユーザが記憶している度合いを記憶度条件として記憶度条件入力部41から入力する。情報検索部3は、検索条件が合致し且つ記憶度が記憶度条件と合致する情報を検索し、検索した情報のリストを検索結果として検索結果提示部5に提示する。
【選択図】 図1

Description

本発明は、情報を検索する情報検索システム、情報検索方法及びプログラムに関する。
従来より、電子化された文書、図面、画像、音声などの複数の情報の中から、ユーザが所望する情報を検索するための情報検索システムが考案され、利用されている。情報検索システムの多くは、情報の内容や属性についての検索条件をユーザから受け付け、この検索条件を満足する情報の集合を求めて、検索結果としてユーザに提示するものである。代表的な検索方法としては、テキストデータを持つ情報を検索対象とし、キーワードの論理式や自然文を検索条件として、テキストデータの表記や意味内容が検索条件に合致する情報を検索する全文検索がある。また、情報の作成者や作成日時、情報が存在する情報源などの属性を検索条件として検索する方法や、これと全文検索とを併用する検索方法も多く利用されている。
近年の計算機ネットワークの普及により、ユーザは、インターネットやイントラネット上の複数の情報源にある多種大量の情報を利用できるようになった。また、ユーザ個人が使用する計算機の記憶容量も増加したため、電子メールや文書ファイルなどの大量の情報が個々のユーザの計算機に記憶されることになった。計算機ネットワークを介して接続されたこれらリモートまたはローカルな複数の情報源から、ユーザが所望する情報を横断的に検索できるようにした情報検索システムも考案されている。
情報を検索するときのユーザの意図は、大きく分けると、自分が今まで利用したことのない未知の情報を調べたい場合と、過去に利用したことはあるが所在がわからなくなった情報を見つけたい場合がある。さらに具体的には、例えば、頻繁に利用する情報を、キーワード入力によって即座に引き出したい場合に検索を行う場合もあるし、また例えば、過去に概要をざっと見ただけの情報を再び閲覧しなおすために検索を行うといった場合も多い。
しかしながら、このようなユーザの意図の違いを積極的に利用して検索の作業を効率化する方法はこれまで実現されていない。従来の情報検索システムの多くは、ユーザの意図や、ユーザが情報を利用したことがあるかどうかには関わりなく検索を行って検索結果を提示する。特に上述のように、複数の情報源から情報を横断的に検索する場合、その検索結果には、ユーザが過去に利用したことがある情報と利用したことがない情報とが混在してしまうことが多く、ユーザは、検索結果の中から所望する情報を探すのに労力がかかるという問題があった。
従来の情報検索システムでは、例えば、情報がユーザによって利用された回数や、最後に利用された日時を、情報毎に記憶しておき、この利用回数が多い順や、利用日時が新しい順に検索結果をユーザに提示するものがある。しかしながら、このような方法は、最近よく利用された情報がユーザにとって有用であるという前提のもとでは有効であるが、過去にはあまり利用していないが現在必要になった情報を検索するのには適していない。
また、特許文献1には、文書の過去の作成・更新過程および検索過程を履歴として管理し、それらの履歴を条件として、例えば「5月1日から5月7日までに3回以上書き直した文書」という条件で検索を行うことを可能にした文書管理装置が開示されている。しかし、情報の利用履歴についてのユーザ自身の記憶が曖昧であることが多いため、例えば「半年くらい前に見たかもしれない」情報を検索したい場合、これを検索条件として明示的に指定するのは容易ではないし、このような条件を厳密に適用して検索を行っても、所望する情報が得られないことが多い。特に特許文献1の方法における履歴検索の条件は、通常のデータベース検索言語で用いられるAND、NOT、OR、ANY、ALL、COUNT、<、>等であるとしているが、操作の種類や日時についての明示的な条件を論理式等の形式で指定することは困難かつ煩雑である。
特許文献2には、ユーザが文書を参照し終わってから現在までの経過時間と、忘却の速さを規定する忘却速度値、文書の累積参照回数などに基づいて、文書をユーザがどの程度記憶しているか推定し、この記憶量をアイコン画像によって視覚的に表現するようにした記憶量表示装置が開示されている。この記憶量表示装置によれば、ユーザは、画面上にアイコン画像として表示された文書を、どの程度記憶しているかを把握することができ、また、ユーザが忘却したと推定される文書を画面上に表示することで、文書の内容の忘却を回避することができる。しかしながら、この記憶量表示装置は、文書を効果的に学習することを目的としており、大量の情報の中からユーザが所望する情報を検索する目的で、全文検索などの検索方法と組み合わせて利用するようには構成されていない。また、ユーザの記憶に大きく関わると考えられる操作の種類や分量については考慮されておらず、参照操作とその回数のみから推定するため、ユーザの実際の記憶に合致しない可能性もある。
特許第2581375号公報 特開平10−333861号公報
ユーザが情報検索を行うにあたって、単に、検索条件に合致する情報を検索したいというだけではなく、実際には、利用したことがあるかも知れないが記憶に残っていない情報(あるいは、利用したことのない情報)を検索したいという意図があったり、あるいは、利用したことがあり内容をよく覚えているが所在が分からない情報を検索したいという意図があったりするが、従来、そのようなユーザの意図をも考慮して情報検索を行う技術は知られていなかった。
本発明は、上記事情を考慮してなされたもので、ユーザがどの程度記憶している情報を所望しているのかを考慮した情報検索を行う情報検索システム、情報検索方法及びプログラムを提供することを目的とする。
本発明に係る情報検索システムは、ユーザが情報に対して行った操作を記録した操作履歴データを、その情報の情報識別子と対応付けて記憶する操作履歴記憶手段と、各情報毎に、ユーザが操作の対象とした情報について記憶している度合いを示す記憶度を、その情報の情報識別子と対応付けて前記操作履歴記憶手段に記憶されている前記操作履歴データに基づいて推定する推定手段と、情報検索に係る検索条件を入力する第1の入力手段と、情報検索に係る前記検索条件以外の条件として、前記記憶度に対する条件を示す記憶度条件を入力する第2の入力手段と、検索対象となる情報のうちから、前記検索条件を満たし且つ前記記憶度条件を満たす記憶度と対応付けられた情報識別子を検索する検索手段と、前記検索手段により検索された前記情報識別子によって識別された情報のリストを提示する提示手段とを具備したことを特徴とする。
好ましくは、前記情報検索を要求するユーザを識別するユーザ識別子を入力する第3の入力手段を更に備え、前記操作履歴記憶手段は、前記操作履歴データを、その情報を操作したユーザを示すユーザ識別子とも対応付けて記憶し、前記推定手段は、各情報に対する前記記憶度を、その情報を操作の対象としたユーザ別に、その情報の情報識別子及びそのユーザのユーザ識別子の組と対応付けて前記操作履歴記憶手段に記憶されている前記操作履歴データに基づいて推定し、前記検索手段は、或る情報に対する前記記憶度として、前記第3の入力手段が入力した前記ユーザ識別子のユーザについて推定された前記記憶度を用いるようにしてもよい。
本発明によれば、ユーザが、検索したい情報について、例えば「よく記憶している」「あまり記憶していない」といった記憶している度合いを示す記憶度の条件を付加的に入力することによって、意図した情報をより容易に検索できるようになる。
また、前記記憶度推定手段が推定する記憶度は、情報に対するユーザの操作の種類や分量、操作を行った日時から現在までの経過時間などを総合して計算することで、ユーザの実際の記憶とより良く合致するようにすることができる。
また、好ましくは、前記検索手段は、情報を検索する対象となり得る情報記憶手段が複数存在する場合に、前記記憶度条件に基づいて実際に検索する情報記憶手段を選択するようにしてもよい。
例えば、ユーザが「よく記憶している」情報を所望する場合には、推定した記憶度が大きい情報を含む情報記憶手段のみを検索の対象とすればよく、不要な情報記憶手段から検索する処理を省くことで、検索の効率を向上させることができる。
また、好ましくは、前記検索手段は、前記記憶度条件に基づいて、前記検索条件を拡張する方法又はその拡張の度合いを制御するようにしてもよい。
例えば、全文検索における、シソーラスや適合性フィードバックを用いたクエリ拡張の方法は、ユーザが過去に利用したことのない情報や、記憶が曖昧な情報を検索する場合には特に有効であるが、ユーザがよく利用したことのある情報を検索する場合には適合率を低下させることがあるという弊害がある。従って、このような検索条件を拡張する方法を適用するかどうかや、拡張の度合い、例えば語句の数などを、ユーザが入力する記憶度の条件に応じて制御することで、情報検索の精度を向上させることができる。
また、好ましくは、前記提示手段は、前記情報識別子によって識別された情報のリストを提示するにあたって、各情報について推定された前記記憶度を併せて提示するようにしてもよい。
例えば、ユーザは、検索結果として提示される情報について前記記憶度推定手段が推定した記憶度を参考に、必要ならば記憶度の条件を変更して入力し、意図する情報を検索することができる。
なお、装置に係る本発明は方法に係る発明としても成立し、方法に係る本発明は装置に係る発明としても成立する。
また、装置または方法に係る本発明は、コンピュータに当該発明に相当する手順を実行させるための(あるいはコンピュータを当該発明に相当する手段として機能させるための、あるいはコンピュータに当該発明に相当する機能を実現させるための)プログラムとしても成立し、該プログラムを記録したコンピュータ読み取り可能な記録媒体としても成立する。
本発明によれば、ユーザがどの程度記憶している情報を所望しているのかを考慮した情報検索を行うことが可能になる。
以下、図面を参照しながら本発明の実施形態について説明する。
図1に、本発明の一実施形態に係る情報検索システムの構成例を示す。
図1に示されるように、本情報検索システムは、情報利用部2、情報検索部3、検索条件入力部4、検索結果提示部5、操作履歴取得部6、操作履歴記憶部7、記憶度推定部8を備えている。また、情報検索部3は検索方法制御部31を、検索条件入力部4は記憶度条件入力部41を、検索結果提示部5は記憶度提示部51をそれぞれ含んでいる。
本情報検索システムが検索対象とする情報は、電子化された文書、図面、画像、音声など、どのような情報であっても構わない。
まず、図1の基本的な構成について説明する。
情報記憶部1は、本情報検索システムが検索対象とする情報が記憶されている情報源であり、一般には、計算機ネットワークを介して接続されている複数の計算機に分散して複数存在する。例えば、インターネット上の各種検索サービスも情報記憶部1とみなすことができ、この場合、本情報検索システムは、これら検索サービスとユーザとを仲介する、いわゆるメタサーチエンジンであるとも言える。本情報検索システムは、計算機ネットワークを介して接続されている情報記憶部1に記憶された情報に対しては、図示しないネットワーク接続インタフェースを介してアクセスすることになる。
なお、情報記憶部1は、複数の場合を想定しているが、1つでも構わない。また、本情報検索システムは、それ自身がローカルに情報記憶部1を持ち、計算機ネットワークを介して接続される1又は複数の情報記憶部1に加えて、そのローカルに持つ情報記憶部1内の情報をも検索対象としても構わないし、そのローカルに持つ情報記憶部1内の情報のみを検索対象としても構わない。
情報利用部2は、情報記憶部1に記憶された情報をユーザが利用するための手段(ユーザからコマンド等の入力を受け付け、そのコマンド等に応じた処理を行う手段)であり、具体的には、電子メールの送受信を行うためのメーラーや、ウェブページを閲覧するためのウェブブラウザ、文書作成を行うためのワードプロセッサなど、複数の様々なソフトウェアがこれに相当する。
情報検索部3は、ユーザからの検索要求を受け付け、1又は複数の情報記憶部1に記憶された情報のうち検索条件を満たす情報を検索する手段である。
検索条件入力部4は、ユーザが検索条件を入力するための手段(ユーザから検索条件の入力を受け付ける手段)であり、検索結果提示部5はユーザに対して検索結果(検索された情報のリスト)を提示する手段である。例えば、これら検索条件入力部4と検索結果提示部5に、ウェブブラウザを用いてもよい。
操作履歴取得部6は、ユーザが1又は複数の情報利用部2を用いて情報を利用したときの操作の履歴を取得するための手段である。
なお、ユーザは検索結果提示部5を用いて検索結果の情報を利用するため、検索結果提示部5を情報利用部2の特別な形態であるとみなすことができる。従って、操作履歴取得部6は、検索結果提示部5におけるユーザの操作履歴も取得することとする。
操作履歴記憶部7は、取得された操作の履歴のデータ(操作履歴データ)を記憶するための手段である。なお、ここでは、操作履歴データは、各ユーザ毎、各情報毎に(ユーザID/情報IDと対応付けて)記憶するものとする。
記憶度推定部8は、操作履歴記憶部7に記憶された操作履歴に基づき、ユーザが過去に操作した個々の情報について、現在どの程度記憶しているかの度合いを示す記憶度を推定する手段である。なお、ここでは、記憶度は、各情報毎、各ユーザ毎に推定するものとする(操作履歴が存在しない情報とユーザの組み合わせについては、記憶度の推定結果が存在しないことになる)。
なお、後述するように本実施形態では、ログイン時にユーザを特定する場合を例にとっているが、これに限定されるものではなく、例えば、検索要求時にユーザIDを入力するなど、他の方法を用いても構わない。
ところで、図1に示した情報検索システムの構成のうち、情報利用部2、検索条件入力部4、検索結果提示部5は、ユーザが直接操作する手段である。従って、例えば、これら情報利用部2、検索条件入力部4、検索結果提示部5のみをユーザが使用するクライアント計算機に配置し、残りの情報検索部3、操作履歴取得部6、操作履歴記憶部7、記憶度推定部8(又は、これらと情報記憶部1)をサーバ計算機に配置するという構成で実現することも可能である。この場合には、複数のユーザが各々使用する複数のクライアント計算機と接続して情報検索のサービスを行うように構成することができる。
以下、本実施形態の情報検索システムについて詳しく説明していく。
本実施形態の情報検索システムの一つの特徴は、ユーザが情報を検索するにあたって、従来のように検索条件を入力するだけでなく、所望する情報について、ユーザ自身がその情報をよく記憶しているか、あまり記憶していないか、あるいはまったく未知の情報であるかといった記憶の度合いについての条件(すなわち、情報の持つ当該ユーザについて推定された記憶度が満たすべき条件)を、ユーザが(例えば後で図9や図10を参照しながら説明するような手段を用いるなどして)入力し、検索条件だけでなく、その記憶度条件にも合致する情報を検索・提示できるようにする点にある。
このために本実施形態では、情報検索を行うにあたって、ユーザが記憶度条件を入力するための手段(ユーザから記憶度条件の入力を受け付ける手段)である記憶度条件入力部41を(検索条件入力部4に)設けるとともに、前述のように、各情報毎、各ユーザ毎に、記憶度を推定する記憶度推定部8を設けている。
そして、情報検索部3では、検索条件に基づいて情報の検索を行うだけでなく、ユーザが記憶度条件入力部41を用いて入力した記憶度条件と、記憶度推定部8によって推定した記憶度とを比較し、合致するような情報だけをユーザに提示する。
検索結果提示部5には、検索結果の情報について本情報検索システムが推定した記憶度をユーザに提示するための記憶度提示部51を設けている(なお、記憶度提示部51は、必ずしも設けなくてもよい)。
また、情報検索部3には、詳しくは後述するが、ユーザが入力した記憶度条件に応じて、検索対象とする情報源の選択や検索条件の拡張方法などを制御することで、検索の処理の効率や精度を向上するための手段である検索方法制御部31を設けている(なお、検索方法制御部31は、必ずしも設けなくてもよい)。
次に、上記の操作履歴データを表現するためのデータ例について説明する。
図2〜図5のデータは主に操作履歴記憶部7に記憶されるが、これらのうち狭義の操作履歴データは図5に示したデータ例であり、図2〜図4は、それぞれ、ユーザのデータ例、情報源のデータ例、操作対象となる情報のデータ例である。本実施形態では、記憶の効率を良くするために、図2〜図5の4つの表(例えばリレーショナルデータベースのテーブル)に分割して記録した例を示しているが、これに限定されるものではない。
図2に例示したデータは、ユーザのデータである。この例では、ユーザのデータは、本情報検索システムを利用するユーザのユーザID、アカウント、パスワード、氏名、メールアドレスなどの項目からなる。なお、アカウントとパスワードは、ユーザ認証などの処理に用いる場合には、操作履歴記憶部7とは別の記憶手段に記憶してもよいが、例えば操作履歴記憶部7と同じリレーショナルデータベースを用いて記憶してもよい。
図3に例示したデータは、情報源のデータである。情報源のデータは、ユーザが情報利用部1を用いて利用する情報であり且つ検索の対象でもある情報が、それぞれ属している情報源を表すデータで、多くの場合、情報記憶部1の各々に対応する。この例では、情報源のデータは、情報源ID、種類、ユニークな名称などの項目からなる。情報源の種類には、例えば、ユーザ個々人のメールボックスやローカルな計算機のファイルシステム、FTP等のプロトコルで実現されたファイル共有システム、HTTP等のプロトコルで実現されたウェブサイトなどがあり、それぞれの種類に応じたユニークな名称を持つ。例えば、メールボックスは送信先のメールアドレスを情報源の名称とすればよいし、ローカルファイルはその計算機名やIPアドレスを、ファイル共有システムやウェブサイトはそのURLを、それぞれユニークな名称とする。
図4に例示したデータは、ユーザが操作の対象とする情報のデータである。この例では、情報のデータは、情報ID、情報源ID、作成者のユーザID、作成日時、ユニークな名称などの項目からなる。名称には、例えば、電子メールの場合はそのメッセージIDを、ローカルファイルの場合はそのパス名を、その他のリモートなファイルの場合はURLを記述する。これらの項目の他に、例えば、最終更新日時やサイズ、MIMEタイプ、タイトルなどの項目を記述してもよい。
図5に例示したデータは、操作履歴のデータである。この例では、操作履歴のデータは、操作したユーザのユーザID、操作対象の情報の情報ID、操作の日時、操作の種類、操作の分量などの項目からなる。
前述した通り、操作履歴は、ユーザが情報利用部2や検索結果提示部5を用いて情報を利用した場合に、操作履歴取得部6により取得される。
操作の種類には、例えば、作成、編集、閲覧などがある。また、例えば、これらの標準的な操作に加え、電子メールの場合には返信や転送など、情報の種類に応じた操作を取得して記憶するようにしてもよい。
操作の日時は、その操作が行われた日時である。操作に時間的な幅がある場合には、例えば、操作が開始された日時又は終了した日時(あるいは、それら日時の間における適当な日時)を用いればよい。
操作の分量は、その操作の量を示す指標であり、例えば、ユーザが情報の操作に費やした時間で表現する方法や、ユーザがテキストの情報の閲覧や編集を行った場合のテキスト量などに基づいて情報全体に対する比率で表現する方法などが考えられる。図5は、後者の場合を示した例になっている。
操作の分量を情報全体に対する比率で記述する方法の場合、例えば、ある情報の内容を改訂する場合における“改訂量/全体量”(例えば、改訂した行数或いは文字数/全体の行数或いは文字数、など)、ある情報を共同作成する場合における“当該ユーザの分担量/全体量”(例えば、当該ユーザが作成した行数或いは文字数/全体の行数或いは文字数、など)、ある情報を閲覧する場合における“閲覧した量/全体量”(例えば、閲覧した行数或いは文字数/全体の行数或いは文字数、閲覧した部分のウィンドウ範囲(面積)と情報全体を表示するのに必要なウィンドウ範囲(面積)との比率、閲覧に要したスクロール・バーの移動量と、情報全体を表示するのに必要なスクロール・バーの移動量との比率、或いは閲覧に要したスクロール時間と、情報全体をスクロールするのに必要な時間との比率)、ある情報を印刷する場合における“印刷量/全体量”(例えば、印刷の対象となる行数、文字数或いは面積/全体の行数、文字数或いは面積、など)、ある情報(動画)を視聴する場合における“再生した量/全体量”(例えば、再生した時間、フレーム数或いはバイト数/動画全体の再生時間、フレーム数或いはバイト数、など)などが考えられる。
なお、操作の分量は、必ずしも必須ではないが、例えば、情報をユーザが記憶している度合いは、長い時間をかけて情報を最初から最後まで閲覧した場合と、情報の冒頭部分を短時間で見た場合とでは異なってくると考えられるので、例えば情報の閲覧用画面を表示した時間や画面のスクロールの量などに基づいて分量を取得することで、後の記憶度の推定を正確に行える可能性があるので、操作の分量を用いると好ましい。
次に、本実施形態の情報検索システムにおける情報の検索と記憶度の推定の処理について説明する。
図6に、本実施形態の情報検索システムが、ユーザの要求に応じて情報の検索と記憶度の推定を行う一連の処理の流れの一例を表すフローチャートを示す。
最初に、ユーザuのログインの要求を受け付け(ステップS1)、例えばユーザが入力するアカウント及びパスワードと、図2のデータとを用いてユーザ認証を行い、認証に失敗すれば(ステップS2)、終了する。
ユーザ認証に成功すれば(ステップS2)、まず、図5に示したような操作履歴のデータを用い、ユーザuが過去に操作したことのある全ての情報について、その各々の記憶度の推定値を再計算する(ステップS3)。その計算方法については後述する。
なお、記憶度の推定値は時間の経過に従って変化するので、例えば1日に1度の間隔或いはより短い間隔で再計算を行うと好ましい。図6では、例えば1日に1度以上、ログインが行われることを想定して、ログイン時のユーザ認証の直後に再計算を行う場合を例示しているが、基本的には、どのようなタイミングで記憶度の推定を実行してもよい(ただし、ユーザ検索要求を出す前には、記憶度の推定が完了しているようにするのが望ましい)。従って、例えば1日に1度計算するものとする場合には、夜間などに一括して計算を行ってもよい。また、端末起動時に行う方法も可能である。また、情報がユーザにより操作された時点で、当該情報と当該ユーザの組み合わせに係る記憶度の推定値を再計算する方法も可能である。また、以上の方法を複数併用することも可能である。
次に、ユーザからの検索要求があれば(ステップS4)、検索を実行して検索結果の集合Dをユーザに提示する(ステップS6)。ユーザからの検索要求は、検索条件入力部4によって発せられ、この検索条件を満足する情報を検索する処理は、情報検索部3によって行われる。なお、このステップS6の処理の詳細については後で図8を参照しながら説明する。
検索結果は、検索結果提示部5によってユーザに提示されるが、この検索結果の集合Dの中にユーザuが所望する情報が存在し、これをユーザが利用すれば(ステップS7)、情報dに対するユーザuの操作履歴を、操作履歴取得部6を用いて取得して、操作履歴記録部7に記録する(ステップS8)。さらに、ここでは、情報dに対するユーザuの記憶度を再計算するものとする(ステップS9)。すなわち、ユーザuは情報dを利用したため、その記憶度は大きくなる。
なお、記憶度の推定値の再計算は、ステップS3とステップS9以外にも、図1で説明したように情報利用部2で操作が行われる都度、操作対象の情報に対して実行されるようにしてもよい。
以上のような、検索条件の入力、検索の実行、検索結果の提示、情報の利用といった一連の作業の後、ユーザuがログアウトすれば(ステップS5)、ユーザuに関する処理は終了する。ログアウトは、例えば、ユーザからのログアウトの要求、もしくは、セッションのタイムアウトによって行われる。
次に、記憶度の推定について説明する。
図7は、情報に対するユーザの現在の記憶の度合いを、ユーザの操作履歴に基づいて推定する方法の一例を説明するための図である。
図7は、次に例示するような、記憶度R(t)を指数関数で表した数式を利用したものである。
(t)=Σij・e−λ(t−t …(1)
ここで、Rij = A + B・x …(2)
図7の72の曲線は過去のある時点である情報に対して閲覧という操作を行ったのみで現在に至る場合の記憶度の減少の様子を示し、図7の71の曲線は閲覧の後に同じ情報に対して更に編集を行って現在に至る場合の編集以降の記憶度の減少の様子を示す例である。
さて、ユーザがある情報に対して操作を行った直後は、その情報をよく記憶しており、その後時間が経過するにつれて記憶は薄れる。従って、記憶度は時間についての減少関数として考えることができ、これは経験的に、例えばHermann Ebbinghausの忘却曲線として知られているような指数関数でモデル化することができる。ただし、情報に対する操作の種類や分量によって、操作の直後の記憶度の大きさと、時間の経過に伴う記憶度の減少の度合いは異なり、例えば情報の閲覧操作によるよりは編集操作によるほうが、長い時間大きく記憶に残ると考えられる(図7の71と72の曲線参照)。また、同じ情報を何度も利用することで、記憶度は増加もしくは維持すると考えられる。
従って、まず、数式(1)で示すように、ある情報iに対する現在日時tにおけるユーザの記憶度R(t)を、「情報iに対してユーザが行った操作jの操作日時tから現在日時tまでの時間の指数値を、情報iに対する全ての操作jについて加算した値」とする。
ここで、Rijは、操作日時tの時点での情報iに対する記憶度の、操作jに関わる値であり、操作の種類と分量に依存する。従って、例えば、数式(2)で示したように、操作jの分量xの1次関数とする。AとBは正の定数とし、これらの値は、例えば情報の作成や編集といったユーザ自身が能動的に行う操作のほうが、閲覧のような受動的な操作よりも大きな値とする。
また、λは、記憶度が減少する(忘却する)程度を表す定数であるが、この値も同様に、操作の種類に応じた定数とする。
なお、数式(1)におけるR(t)の値の単位は、ユーザが分かりやすいようにパーセントとし、100%を超える場合には値を100%とする。また、ここでは、ユーザが過去に利用したことのない情報の記憶度は0%とするものとする。以上に説明した方法で、記憶度の推定を行う。
続いて、本実施形態の情報検索システムにおける検索処理の詳細について説明する。
図8に、図6のステップS6の検索処理の流れの一例を表すフローチャートを示す。この処理は、情報検索部3で行われる処理である。
また、図9と図10に、検索条件の入力と検索結果の提示を行う画面例をそれぞれ示す。これらは検索条件入力部4と検索結果提示部5の画面上での表示を表している。
さて、ユーザが所望する情報を検索するために入力する条件には、まず、従来の情報検索システムにおける検索条件と同様に、情報の内容や属性についての条件がある。図9の91と図10の101に示した検索条件がこれに相当し、これらの例では全文検索におけるクエリ(キーワードまたは自然文)を検索条件としている。
一方、図9の92と図10の102に示した条件は、ユーザが検索したい情報に対してユーザ自身が記憶している度合いを入力する条件(記憶度条件)であり、例えば、図9や図10に例示するように「まったく記憶にない」から「よく記憶している」までの数段階で指定できるようにする。
図9の92で示した指定方法の例では、記憶度が80%前後の情報を検索するよう指定されており、この場合、推定した記憶度が例えば70%〜90%の範囲であるような情報を検索する。
一方、図10の102で示した指定方法では、記憶度の上限と下限(例えば0%〜20%)を指定できるようにしている。
図8のステップS11では、まず、記憶度の条件を満たす情報の集合Drを求める。例えば、記憶度の条件が70%〜90%である場合には、推定した記憶度がこの範囲にあるような情報の集合が求められる。
次に、この集合Drと、図2と図3で示したデータを用いて、記憶度の条件を満たす情報源の集合Sを求める(ステップS12)。ここでは、集合Dr中の情報を1つでも持つ可能性のある情報源が選択され、この情報源が検索対象となる。
次に、記憶度の条件に応じた方法で検索条件を拡張する(ステップS13)。例えば、全文検索においては、ユーザが入力したキーワードや自然文の検索条件に対して、これと同義のキーワードや意味的に関連の大きい表現を追加して検索を行うことで、検索の精度、特に再現率を上げることが一般に行われている。
例えば、図10に示したように、「CCD」という検索条件に対して、その訳語である「電荷結合素子」や省略前のフレーズ「Charge Coupled Device」、あるいは「デジタルカメラ」といった関連語を自動的に追加することで、より多くの情報が検索できるようになる可能性がある。
検索条件の拡張は、その方法によって、検索前に行う場合(例えばシソーラスを用いた拡張)と、検索後に行う場合(例えば擬似的関連性フィードバックなど)があるが、いずれの場合でも、図10の103のように、拡張した語やフレーズをユーザに提示して、これを次回の検索に使用するかどうかを選択させることができる。
このような検索条件の拡張は、とくにユーザが未知の情報や記憶が曖昧な情報を検索するには有効であるが、その一方、ユーザがよく記憶している情報については、不要な検索条件を増やすことで検索の効率や精度が低下する恐れがある。従って、ステップS13では、例えば、記憶度の条件に応じて、検索条件の拡張を行うかどうかや、行う場合の語数を制御する。
なお、ステップS12の処理とステップS13の処理は、それぞれ、検索の処理の効率と精度を高めるためのものであり、検索方法制御部31によって実行される処理であるが、この処理は必須ではなく、省いても構わない。
次に、ステップS14では、ステップS12で求めた情報源の集合Sの各情報源を検索対象として、検索条件を満たす情報の集合Dsを検索する。
そして、最後に、集合Drと集合Dsの積集合Dを、ユーザに提示する検索結果とするステップS15。このようにして、ユーザが指定した検索条件を満足し、かつ、ユーザが指定した記憶度の条件の範囲にある情報が検索されてユーザに提示される。
図9の93と図10の104は、検索結果の提示例である。
図9では94に示すようにシステムが推定した記憶度を検索結果の情報とともに提示しており、ユーザはこれを参考にして、必要ならば記憶度の条件を変更して入力することで、自分が意図する情報を検索することができる。
図10では、記憶度の表示105の他に、操作履歴のデータ自体を用いて、ユーザが検索結果の情報を利用した日時106を提示している。また、従来の情報検索システムにおける適合度107(検索条件が検索対象の情報に合致する度合い)などを併せて提示することも可能である。
さらに、記憶度や最終利用日などを用いて検索結果をソートする機能も用意することで、利便性を高めることも同様に容易に行える。図9は、記憶度でソートしてリスト表示した例であり、図10は、適合度でソートしてリスト表示した例である。もちろん、ユーザがどの項目でソートするかを指定できるようにするのが望ましい。
なお、図10の例では、記憶度条件に「まったく記憶にない」すなわち記憶度=0が含まれているが、記憶度の推定結果が存在しないもの(当該ユーザが利用したことのない情報)については、その記憶度を0として扱うことによって、検索結果として、記憶度の推定結果が存在しない情報も提示されている(図10では、記憶度の推定結果が存在しない情報は、記憶度の項目を「−」で表している)。
以上説明してきたように、本実施形態によれば、ユーザは、所望する情報について、これを利用した記憶が曖昧であっても、その記憶の度合いを簡便な手段で指定することで、意図した情報をより効率よく検索することができるようになる。また、ユーザが条件として入力した記憶度に基づいて、検索の対象とすべき情報源の選択や、例えば全文検索におけるクエリ拡張などの検索方式の制御が適切に行うことができるので、情報検索システムが行う検索処理の効率や精度をより向上させることができる。
ところで、これまでは、情報検索を要求するユーザを区別するマルチユーザ・タイプの形態について説明してきたが、情報検索を要求するユーザを区別しないシングルユーザ・タイプの形態ももちろん可能である。この場合、これまで情報IDとユーザIDとの組に基づいて行っていた処理等を、情報IDのみに基づいて行うように修正すればよい。
なお、以上の各機能は、ソフトウェアとして記述し適当な機構をもったコンピュータに処理させても実現可能である。
また、本実施形態は、コンピュータに所定の手順を実行させるための、あるいはコンピュータを所定の手段として機能させるための、あるいはコンピュータに所定の機能を実現させるためのプログラムとして実施することもできる。加えて該プログラムを記録したコンピュータ読取り可能な記録媒体として実施することもできる。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
本発明の一実施形態に係る情報検索システムの構成例を示す図 ユーザのデータ例を示す図 情報源のデータ例を示す図 操作対象の情報のデータ例を示す図 操作履歴のデータ例を示す図 ユーザの要求に応じて情報の検索と記憶度の推定を行う処理の流れの一例を示すフローチャート ユーザの操作と時間の経過による記憶度の変化について説明するための図 検索処理の流れの一例を示すフローチャート 検索条件の入力と検索結果の提示を行う画面例を示す図 検索条件の入力と検索結果の提示を行う画面例を示す図
符号の説明
1…情報記憶部、2…情報利用部、3…情報検索部、31…検索方法制御部、4…検索条件入力部、41…記憶度条件入力部、5…検索結果提示部、51…記憶度提示部、6…操作履歴取得部、7…操作履歴記憶部、8…記憶度推定部

Claims (15)

  1. ユーザが情報に対して行った操作を記録した操作履歴データを、その情報の情報識別子と対応付けて記憶する操作履歴記憶手段と、
    各情報毎に、ユーザが操作の対象とした情報について記憶している度合いを示す記憶度を、その情報の情報識別子と対応付けて前記操作履歴記憶手段に記憶されている前記操作履歴データに基づいて推定する推定手段と、
    情報検索に係る検索条件を入力する第1の入力手段と、
    情報検索に係る前記検索条件以外の条件として、前記記憶度に対する条件を示す記憶度条件を入力する第2の入力手段と、
    検索対象となる情報のうちから、前記検索条件を満たし且つ前記記憶度条件を満たす記憶度と対応付けられた情報識別子を検索する検索手段と、
    前記検索手段により検索された前記情報識別子によって識別された情報のリストを提示する提示手段とを具備したことを特徴とする情報検索システム。
  2. 前記情報検索を要求するユーザを識別するユーザ識別子を入力する第3の入力手段を更に備え、
    前記操作履歴記憶手段は、前記操作履歴データを、その情報を操作したユーザを示すユーザ識別子とも対応付けて記憶し、
    前記推定手段は、各情報に対する前記記憶度を、その情報を操作の対象としたユーザ別に、その情報の情報識別子及びそのユーザのユーザ識別子の組と対応付けて前記操作履歴記憶手段に記憶されている前記操作履歴データに基づいて推定し、
    前記検索手段は、或る情報に対する前記記憶度として、前記第3の入力手段が入力した前記ユーザ識別子のユーザについて推定された前記記憶度を用いることを特徴とする請求項1に記載の情報検索システム。
  3. 前記操作履歴データは、情報に対して行われた操作の種類及びその操作が行われた日時を含む単位データの集合であり、
    前記推定手段は、ユーザが操作の対象とした情報について記憶している度合いの減少の仕方が、前記操作の種類及び前記操作が行われた日時からの経過時間に応じて異なるように規定されたモデルを用いて、前記記憶度を推定することを特徴とする請求項1または2に記載の情報検索システム。
  4. 前記単位データは、前記操作の分量をも含むものであり、
    前記モデルは、前記減少の仕方が、前記操作の分量に応じて異なるように規定されたものであることを特徴とする請求項3に記載の情報検索システム。
  5. 前記記憶度条件は、前記情報について推定された記憶度が満たすべき値を示すものであり、
    前記検索手段は、前記情報について推定された記憶度が、前記記憶度条件の示す値を基準として一定の範囲内にある場合に、前記情報について推定された記憶度を、前記記憶度条件を満たすものとして扱うことを特徴とする請求項1ないし4のいずれか1項に記載の情報検索システム。
  6. 前記記憶度条件は、前記情報について推定された記憶度が満たすべき値の範囲を示すものであり、
    前記検索手段は、前記情報について推定された記憶度が、前記記憶度条件の示す範囲内にある場合に、前記情報について推定された記憶度を、前記記憶度条件を満たすものとして扱うことを特徴とする請求項1ないし4のいずれか1項に記載の情報検索システム。
  7. 前記検索手段は、記憶度が0である情報を前記記憶度条件を満たすものとして扱うべき場合に、記憶度が対応付けられていない情報については、その記憶度を0とみなすことによって、前記前記記憶度条件を満たすものとして扱うことを特徴とする請求項1ないし6のいずれか1項に記載の情報検索システム。
  8. 前記検索手段は、検索対象となる情報のうちから、前記検索条件を満たす情報を検索し、該検索した情報のうちから、前記記憶度条件を満たす記憶度と対応付けられた情報識別子を抽出し、該抽出した情報識別子を、検索結果とすることを特徴とする請求項1ないし7のいずれか1項に記載の情報検索システム。
  9. 前記検索手段は、情報を検索する対象となり得る情報記憶手段が複数存在する場合に、前記記憶度条件に基づいて実際に検索する情報記憶手段を選択することを特徴とする請求項1に記載の情報検索システム。
  10. 前記検索手段は、前記記憶度条件に基づいて、前記検索条件を拡張する方法又はその拡張の度合いを制御することを特徴とする請求項1に記載の情報検索システム。
  11. 前記提示手段は、前記情報識別子によって識別された情報のリストを提示するにあたって、各情報について推定された前記記憶度を併せて提示することを特徴とする請求項1に記載の情報検索システム。
  12. 情報検索システムにおける情報検索方法であって、
    操作履歴記憶手段が、ユーザが情報に対して行った操作を記録した操作履歴データを、その情報の情報識別子と対応付けて記憶するステップと、
    推定手段が、各情報毎に、ユーザが操作の対象とした情報について記憶している度合いを示す記憶度を、その情報の情報識別子と対応付けて前記操作履歴記憶手段に記憶されている前記操作履歴データに基づいて推定するステップと、
    第1の入力手段が、情報検索に係る検索条件を入力するステップと、
    第2の入力手段が、情報検索に係る前記検索条件以外の条件として、前記記憶度に対する条件を示す記憶度条件を入力するステップと、
    検索手段が、検索対象となる情報のうちから、前記検索条件を満たし且つ前記記憶度条件を満たす記憶度と対応付けられた情報識別子を検索するステップと、
    提示手段が、検索された前記情報識別子によって識別された情報のリストを提示するステップとを有することを特徴とする情報検索方法。
  13. 第3の入力手段が、情報検索を要求するユーザを識別するユーザ識別子を入力するステップを更に有し、
    前記操作履歴記憶手段は、前記操作履歴データを、その情報を操作したユーザを示すユーザ識別子とも対応付けて記憶し、
    前記推定手段は、各情報に対する前記記憶度を、その情報を操作の対象としたユーザ別に、その情報の情報識別子及びそのユーザのユーザ識別子の組と対応付けて前記操作履歴記憶手段に記憶されている前記操作履歴データに基づいて推定し、
    前記検索手段は、或る情報に対する前記記憶度として、前記第3の入力手段が入力した前記ユーザ識別子のユーザについて推定された前記記憶度を用いることを特徴とする請求項12に記載の情報検索方法。
  14. コンピュータを情報検索システムとして機能させるためのプログラムであって、
    操作履歴記憶手段が、ユーザが情報に対して行った操作を記録した操作履歴データを、その情報の情報識別子と対応付けて記憶するステップと、
    推定手段が、各情報毎に、ユーザが操作の対象とした情報について記憶している度合いを示す記憶度を、その情報の情報識別子と対応付けて前記操作履歴記憶手段に記憶されている前記操作履歴データに基づいて推定するステップと、
    第1の入力手段が、情報検索に係る検索条件を入力するステップと、
    第2の入力手段が、情報検索に係る前記検索条件以外の条件として、前記記憶度に対する条件を示す記憶度条件を入力するステップと、
    検索手段が、検索対象となる情報のうちから、前記検索条件を満たし且つ前記記憶度条件を満たす記憶度と対応付けられた情報識別子を検索するステップと、
    提示手段が、検索された前記情報識別子によって識別された情報のリストを提示するステップとをコンピュータに実行させるためのプログラム。
  15. 第3の入力手段が、情報検索を要求するユーザを識別するユーザ識別子を入力するステップを更にコンピュータに実行させるためのプログラムであって、
    前記操作履歴記憶手段は、前記操作履歴データを、その情報を操作したユーザを示すユーザ識別子とも対応付けて記憶し、
    前記推定手段は、各情報に対する前記記憶度を、その情報を操作の対象としたユーザ別に、その情報の情報識別子及びそのユーザのユーザ識別子の組と対応付けて前記操作履歴記憶手段に記憶されている前記操作履歴データに基づいて推定し、
    前記検索手段は、或る情報に対する前記記憶度として、前記第3の入力手段が入力した前記ユーザ識別子のユーザについて推定された前記記憶度を用いることを特徴とする請求項14に記載のプログラム。
JP2006304365A 2006-11-09 2006-11-09 情報検索システム、情報検索方法及びプログラム Pending JP2008123115A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006304365A JP2008123115A (ja) 2006-11-09 2006-11-09 情報検索システム、情報検索方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006304365A JP2008123115A (ja) 2006-11-09 2006-11-09 情報検索システム、情報検索方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2008123115A true JP2008123115A (ja) 2008-05-29

Family

ID=39507827

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006304365A Pending JP2008123115A (ja) 2006-11-09 2006-11-09 情報検索システム、情報検索方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2008123115A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012160870A1 (ja) * 2011-05-23 2012-11-29 コニカミノルタホールディングス株式会社 情報処理装置
JP2021077268A (ja) * 2019-11-13 2021-05-20 凸版印刷株式会社 情報提示装置、情報提示方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012160870A1 (ja) * 2011-05-23 2012-11-29 コニカミノルタホールディングス株式会社 情報処理装置
JP2021077268A (ja) * 2019-11-13 2021-05-20 凸版印刷株式会社 情報提示装置、情報提示方法
JP7395976B2 (ja) 2019-11-13 2023-12-12 Toppanホールディングス株式会社 情報提示装置、情報提示方法

Similar Documents

Publication Publication Date Title
JP3150209U (ja) Webコンテンツを管理するためのシステムおよび装置
JP4921152B2 (ja) 検索方法、システム、プログラム記憶装置
US9659278B2 (en) Methods, systems, and computer program products for displaying tag words for selection by users engaged in social tagging of content
US8099406B2 (en) Method for human editing of information in search results
US20090094189A1 (en) Methods, systems, and computer program products for managing tags added by users engaged in social tagging of content
US20090287655A1 (en) Image search engine employing user suitability feedback
JP2007517316A (ja) 集計されたニュースコンテンツを個人化するためのシステムおよび方法
AU2009236553A1 (en) Inserting a multimedia file through a web-based desktop productivity application
US9286309B2 (en) Representation of last viewed or last modified portion of a document
US20050091204A1 (en) Apparatus and method for retrieval of documents
JP5627332B2 (ja) データ検索装置及びその制御方法、コンピュータプログラム
JP5228584B2 (ja) 興味情報特定システム、興味情報特定方法、および興味情報特定用プログラム
JP2008146147A (ja) 情報提示装置、情報提示方法及び情報提示用プログラム
EP2947580A1 (en) A method, an apparatus for labelling images, a program, and a computer-readable medium
US20090030900A1 (en) Information processing apparatus, information processing method and computer readable information recording medium
JP4610543B2 (ja) 期間抽出装置,期間抽出方法,その方法を実装した期間抽出プログラム及びそのプログラムを格納した記録媒体
JP5200699B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP2007272465A (ja) スケジュール管理装置、スケジュール管理装置における文書提示方法、およびスケジュール管理プログラム
JP2008123115A (ja) 情報検索システム、情報検索方法及びプログラム
US8131752B2 (en) Breaking documents
JP2002149668A (ja) インターネット補助ソフトウェア及び該プログラムを記録した記録媒体
JP2003337825A (ja) オンラインデータベースによる情報供給方法
US5715442A (en) Data unit group handling apparatus
JP2009098829A (ja) 漫画のコマ検索装置
JPH09245046A (ja) 情報検索装置