JP3847977B2 - Information search method, information search device, and recording medium - Google Patents
Information search method, information search device, and recording medium Download PDFInfo
- Publication number
- JP3847977B2 JP3847977B2 JP29215198A JP29215198A JP3847977B2 JP 3847977 B2 JP3847977 B2 JP 3847977B2 JP 29215198 A JP29215198 A JP 29215198A JP 29215198 A JP29215198 A JP 29215198A JP 3847977 B2 JP3847977 B2 JP 3847977B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- search
- label
- information resource
- labeling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【0001】
【発明の属する技術分野】
本発明は、複数のユーザが参照可能な文書や画像などの情報リソースに対して、関心のある情報リソース集合と関連した未知の情報リソースを検索、収集する情報収集方法およびそれを用いた情報検索装置に関し、例えば、映画や音楽などのコンテンツに対して、嗜好の似た人から関連した未知の情報を取得する協調型フィルタリング技術、WWW(World Wide Web)ブラウザのブックマーク機能の公開・共有化によって、ネットワーク上におけるグループ(コミュニティ)内での情報共有を促進するための技術などに関わる。
【0002】
【従来の技術】
ラベル付けを利用した個人の情報分類あるいは整理方式は、従来からあるメモ、アノテイション(注釈)機能と類似した用途としてすでに存在している。これらの手法の特徴としては、ユーザがつけたラベルの名前やラベルにつけられた属性値を利用して情報を分類、検索することである。このとき、利用範囲が個人に限られている場合にはあまり問題にならないが、ユーザが勝手につけたラベル名あるいはメモ内容を直接利用して他人との情報共有や検索を行うことを考えると、ラベル名やメモで利用した言葉の統一性や整合性が問題になる。
【0003】
これを回避するため、システム構築の際には、ラベル名や用語を統一して名前空間を制限するか、シソーラスや単語データベースにより、名前の関連付けをシステム側が処理するかのいずれかを選択することが多い。
【0004】
後者の場合には、規模の大きな辞書を用意して検索の精度を上げてもなお、単語の多義性や曖昧性の問題は残る。また、ドキュメントの文章を解析してキーワードを抽出し、情報検索に用いることも、Webのドキュメントを検索する際にしばしば利用される。
【0005】
しかし、文章中の単語を抽出するだけでは、そこに単語が存在していることはわかるが、そのドキュメントがどのような観点で書かれていて、有用かどうかなどといった分析は困難である。まして、画像や音声、動画情報のみの情報リソースの場合にはキーワード解析はできない。いずれにしても、そのドキュメントがユーザにとってどれくらい有用なのか、有用だとすればどのような観点から有用なのかといった評価や分類は各ユーザごとに異なるものである。
【0006】
ユーザが行った評価情報を積極的に利用するシステムもある。その代表的な例は、推薦エンジン(Recommendation Engine)と呼ばれる協調型フィルタリング(Collaborative Filtering)を利用したシステムである。これはインタネット上でビデオや音楽、書籍を宣伝、販売する際に、ユーザの好みにあったリストを精度よく呈示する手法の1つである。具体的には、たとえば多くの映画に対して大勢のユーザが与えた数値的な評価(好きか嫌いか、あるいはどのくらい好きか)をデータベース化し、各人の嗜好性の相関を計算することにより、そのユーザの好みと類似したグループから、そのユーザが好みそうな映画のタイトルのリストを呈示するといったものである。推薦エンジンの代表的な例としては、GroupLens推薦エンジン(USA、Net Perception社)が挙げられる。現在の推薦エンジンは、評価用の定型ラベル(たとえば「好き」から「嫌い」までを数値化したマークシート的な評価用ラベル)を映画や音楽などのデータに付与していると見なすことができる。
しかし、コンテンツに対する評価としては、好きか嫌いかなどの一面的な捉え方しかできないのが現実である。
【0007】
【発明が解決しようとする課題】
このように、WWW上の「Yahoo」や「Infoseek」などの通常のキーワードに基づく検索エンジンでは、検索することと、情報を集めて整理するという行為(ブックマークやファイリング)とが完全に分離しているため、ある事柄に関して情報を集めたとしても、それを検索の精度を向上させるために利用することができないという問題点があった。
【0008】
そこで、本発明は、ネットワーク上の複数のユーザが参照可能な文書や画像といった任意の情報リソースに対して、各ユーザが自由な観点に基づいて収集し、分類した結果得られる情報を使って、関心のある情報と関連する未知の情報リソースを効率良く検索および収集できる情報検索方法およびそれを用いた情報検索装置を提供することを目的とする。
【0009】
【課題を解決するための手段】
(1)本発明の情報検索方法(請求項1)は、情報リソースと該情報リソースに付与したラベルとの対応関係にて特徴づけられる複数の情報リソースからなる複数のラベリング集合のうちの1つ(例えば、ラベリング集合A)から選択された該ラベルの論理式にて特徴付けられる1または複数の検索用情報リソース(コレクタに保存される)を、他の1または複数のラベリング集合(例えばラベリング集合B、C)のそれぞれから検索し、
その検索された該検索用情報リソースに付されたラベルについての該検索用情報リソースと該ラベルとの結びつきを評価する第1の評価値(ラベルスコア)を求め、
該第1の評価値に基づいて、前記検索用情報リソース以外の情報リソースの該検索用情報リソースとの関連の度合いを評価する第2の評価値(情報リソーススコア)を求め、
該第2の評価値に基づき選択した前記検索用情報リソースに関連する情報リソースを呈示することを特徴とする。
【0010】
本発明によれば、各ユーザが自由な観点に基づいて収集した情報リソースにラベリング(ラベル付け)により整理分類した結果を用いて、関心のある情報と関連する未知の情報リソースを効率良く検索および収集できる。
【0011】
(請求項2)好ましくは、複数のラベリング集合のそれぞれから求められた情報リソースの第2の評価値を該複数のラベリング集合のそれぞれに予め定められた重み係数に基づき統合して、その統合結果に基づき前記検索用情報リソースに関連する情報リソースを選択する。
【0012】
(請求項3)好ましくは、前記検索用情報リソースに付されたラベルについて、そのラベルの付された該検索用情報リソース1つにつき所定値を累積加算することにより、該ラベルの第1の評価値を算出する。
【0013】
(請求項4)好ましくは、前記検索用情報リソースに付されたラベルについて、そのラベルの付された該検索用情報リソースの重要度に基づき該ラベルの第1の評価値を算出する。
【0014】
(請求項5)好ましくは、前記検索用情報リソース以外の情報リソースについて、その情報リソースに付されているラベルの前記第1の評価値を累積加算することにより、該情報リソースの第2の評価値を算出する。
【0015】
(請求項6)好ましくは、前記検索用情報リソース以外の情報リソースについて、その情報リソースに付されているラベルの前記第1の評価値と該ラベルの重要度とに基づき該情報リソースの第2の評価値を算出する。
【0016】
(2)本発明の情報検索装置(請求項7)は、情報リソースと該情報リソースに付与したラベルとの対応関係にて特徴づけられる複数の情報リソースからなる複数のラベリング集合のうちの1つから選択された該ラベルの論理式にて特徴付けられる1または複数の検索用情報リソースを、他の1または複数のラベリング集合のそれぞれから検索する検索手段と、
この検索手段で検索された該検索用情報リソースに付されたラベルについての該検索用情報リソースと該ラベルとの結びつきを評価する第1の評価値を求めるラベル評価手段と、
前記第1の評価値に基づいて、前記検索用情報リソース以外の情報リソースの該検索用情報リソースとの関連の度合いを評価する第2の評価値を求める情報リソース評価手段と、
前記第2の評価値に基づき選択した前記検索用情報リソースに関連する情報リソースを呈示する呈示手段と、
を具備したことを特徴とする。
【0017】
本発明によれば、各ユーザが自由な観点に基づいて収集した情報リソースにラベリング(ラベル付け)により整理分類した結果を用いて、関心のある情報と関連する未知の情報リソースを効率良く検索および収集できる。
【0018】
(請求項8)好ましくは、複数のラベリング集合のそれぞれから求められた情報リソースの第2の評価値を該複数のラベリング集合のそれぞれに予め定められた重み係数に基づき統合して、その統合結果に基づき前記検索用情報リソースに関連する情報リソースを選択する。
【0019】
(請求項9)好ましくは、前記検索用情報リソースに付されたラベルについて、そのラベルの付された該検索用情報リソース1つにつき所定値を累積加算することにより、該ラベルの第1の評価値を算出する。
【0020】
(請求項10)好ましくは、前記検索用情報リソースに付されたラベルについて、そのラベルの付された該検索用情報リソースの重要度に基づき該ラベルの第1の評価値を算出する。
【0021】
(請求項11)好ましくは、前記検索用情報リソース以外の情報リソースについて、その情報リソースに付されているラベルの前記第1の評価値を累積加算することにより、該情報リソースの第2の評価値を算出する。
【0022】
(請求項12)好ましくは、前記検索用情報リソース以外の情報リソースについて、その情報リソースに付されているラベルの前記第1の評価値と該ラベルの重要度とに基づき、該情報リソースの第2の評価値を算出する。
【0023】
(3)本発明の記録媒体(請求項13)は、情報リソースと該情報リソースに付与したラベルとの対応関係にて特徴づけられる複数の情報リソースからなる複数のラベリング集合のうちの1つから選択された該ラベルの論理式にて特徴付けられる1または複数の検索用情報リソースを、他の1または複数のラベリング集合のそれぞれから検索させる検索手段と、
この検索手段で検索された該検索用情報リソースに付されたラベルについての該検索用情報リソースと該ラベルとの結びつきを評価する第1の評価値を算出させるラベル評価手段と、
前記第1の評価値に基づいて、該検索用情報リソース以外の情報リソースの該検索用情報リソースとの関連の度合いを評価する第2の評価値を算出させる情報リソース評価手段と、
前記第2の評価値に基づき選択した該検索用情報リソースに関連する情報リソースを呈示させる呈示手段と、
を実行するプログラムを記録した機械読み取り可能な記録媒体であり、本発明によれば、上記手段を、例えば、ラベルに対する操作を行うために画面(パレット)、情報検索のために利用するコレクタの作成や検索結果の呈示を行うためのファインダ等のユーザインタフェース画面を呈示するためのディスプレイ装置と、ハードディスク装置等の記憶装置を具備した(好ましくは、さらに、インターネット等のネットワークを介して通信可能な)パーソナルコンピュータ等のコンピュータに実行させることのできるプログラムとして、磁気ディスク(フロッピーディスク、ハードディスクなど)、光ディスク(CD−ROM、DVDなど)、半導体メモリなどの記録媒体に格納して頒布することにより、各ユーザが自由な観点に基づいて収集した情報リソースにラベリング(ラベル付け)により整理分類した結果を用いて、関心のある情報と関連する未知の情報リソースを効率良く検索および収集できる。
【0024】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して説明する。
ここで、以下の説明で用いる用語の定義を行う。
情報リソースとは、例えば、例えば、音声、テキスト、静止画、動画像、HTML文書等の情報ファイルである。
【0025】
複数の情報リソースに対して任意の基準や観点に基づいた主観的な自由な名前をもつラベルを付与する行為を「ラベリング」と呼び、ラベリングの結果得られるラベルと情報リソースの対応関係の集合を「ラベリング集合」と呼ぶことにする。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る情報検索方法を用いた情報検索装置の基本的な構成を概略的に示したもので、大きく分けて、情報検索処理部1と、データ格納部50とから構成され、情報検索処理部1は、さらに、検索用情報リソースリスト取得部10と、ラベリング集合選択部20と、情報検索部30と、候補情報リソース呈示部40とから構成されている。
【0026】
ここでは、例えば、ブラウザを用いてインターネット上から収集した、あるいは自分で作成した情報リソースに対し、ユーザが自分が整理したいあるいは記録しておきたい基準や観点に基づいて自由に決めたラベルを付して、既にラベリングされており、そのラベルに関する情報、ラベルを付けた情報リソースに関する情報等は、データ格納部50に格納されているものとする。
【0027】
図2は、2つのラベリング集合A、Bを概念的に示したものである。ここでは、例えば、ラベリング集合Aとラベリング集合Bは、それぞれ異なるユーザがもつラベリング集合を示しているが、1人のユーザが複数のラベリング集合A、Bをもつ場合であってもよい。
【0028】
1つのラベリング集合には、その内部で定義されたラベルの集合と、そのラベルが付けられた任意の情報リソースの集合が存在する。たとえば、ラベリング集合A内には、ラベル集合{A1、A2、A3}とそれらのラベルが付けられた情報リソースの集合{a、b、c、d、e}がある。
【0029】
図2では、ラベルと情報リソース間の対応づけ、つまりある情報リソースに対してあるラベルが付けられているという関係はラベルと情報リソースを結ぶ線で表現されている。
【0030】
ラベリング集合Bにおいてもラベリング集合Aと同様に、ラベル集合{B1、B2、B3、B4}が存在し、情報リソース{a、b、e、f、g、k}に対してこれらのラベルが付けられている。名前が同じ情報リソースは同じ実体を参照していることを示している。このとき、たとえばラベリング集合Aにおいて、ラベルA1とラベルA2がともに付いている情報リソースの集合は、ラベルA1とラベルA2の両方に関する事柄を含んでいると考えてよい。
【0031】
このように、ラベリングの結果、情報リソースはラベルの論理式による組み合わせによって、様々な切口で分類されている。ラベルの論理式とは、例えば、「A1 and A2」という形で表現したものであり、R(A1 and A2)とは、ラベルA1とラベルA2とがともに付いた情報リソースの集合を意味する。例えば、図2に示したラベリング集合A、Bでは、R(A1 and A2)={a、b}である。
【0032】
本発明の主な目的は、このようなラベルの論理式によって特徴づけられる情報リソースの集合を検索キーとして、別のラベリング集合からそれらの情報リソースに関連する未知の情報リソースを検索し、収集することである。
【0033】
図1の検索用情報リソースリスト取得部10では、ラベリング集合内のラベルの論理式によって表現された情報リソースのリストを取得し、これを検索のキーとして利用する。この処理は、たとえば図2のラベリング集合Aにおいて、前述したように、ラベルの論理式「A1 and A2」を指定して情報リソースリスト{a、b}を得ることに相当する。基本的には、情報リソースリスト{a、b}はラベルの論理式によって得るが、必要に応じて、この情報リソースリストから特定の情報リソースを取り除いたり、付け加えることもできる。
【0034】
検索のための情報リソースの集合を表した情報リソースリスト(具体的には、情報リソースの識別情報(ID)のリストで、メインリストともいう)を取得したあとで、つぎにこれらの情報リソースに関連した情報を検索する対象(他のラベリング集合)を決める。そのため、ラベリング集合選択部20では、検索の対象となる他のラベリング集合を選択し、検索用情報リソースリスト取得部10で得られた情報リソースリストを相手のラベリング集合に通知する。すなわち、検索対象として、社内であれば、特定の部署を指定して、当該部署に所属する人の有するラベリング集合に限定したり、特定の人物を指定して、当該人物の有するラベリング集合に限定したりといった検索範囲を限定する。なお、その必要がなければ、必ずしも検索範囲を限定する必要はない。
【0035】
図2の例では、ラベリング集合Bが選択され、情報リソースリスト{a、b}がラベリング集合Bに通知されることに相当する。一般に選択すべきラベリング集合は複数であるが、暗黙的に検索の発信源であるラベリング集合(ここでは、ラベリング集合A)以外のすべてのラベリング集合が検索対象となる。
【0036】
次に、情報検索部30において各ラベリング集合ごとに関連情報を検索する。
情報検索部30は、ラベルスコア算出部31と、情報リソーススコア算出部32と、候補情報リソースリスト作成部33とから構成される。
【0037】
ここで、ラベルスコアとは、検索用に与えた情報リソースの集合Rsに対して、あるラベリング集合内で定義されたラベルとの結び付きの度合いを表す。また、情報リソーススコアは、ラベルスコアに基づいて計算される、Rsとそれ以外の情報リソースとの関連性を計るための指標である。簡単に説明すれば、与えた情報リソースの集合Rsと同じラベル付けがされている情報リソースほどスコアが高いということになり、ラベル付けという分類上、もとのRsとの関連性が高い情報リソースであるといえる。
【0038】
図3は、ラベルスコア算出部31と情報リソーススコア算出部32の処理動作を示したフローチャートで、図4は、図3のステップS2からステップS4までの処理(ラベルスコアの算出処理)を説明するための概念図で、図5は、図3のステップS5からステップS7までの処理(情報リソーススコアの算出処理)を説明するための概念図である。
【0039】
まず、ラベルスコア算出部31の処理動作(ラベルスコアの算出処理)について、図3と図4を参照して説明する。
図4のステップS1で、ラベルスコアと情報リソーススコアを、例えば、「0」という値に初期化しておく。つぎに、ステップS2で、検索用の情報リソース集合をRsとしたとき、Rsのすべての要素(情報リソース)を調べたかどうかをチェックし、まだ調べるべき要素が残っている場合には、ステップS3に進み、Rsから1つの要素を取り出して、それをrとする。ステップS4では、当該取り出した情報リソースrに付けられた全ラベルのラベルスコアに所定の数値(例えば、「1」)を加算する。
【0040】
図4において、Rsとして情報リソース{a、b}が与えられたとき、ラベリング集合B内において、Rsの各要素(情報リソース)に付けられたラベルに対して、そのラベルが付されている1つの情報リソースにつき、全て同等に数値「1」がラベルスコアに加算されている。ラベルB1は、Rsとして与えられた情報リソースa、bのラベルであり、ラベルB2は、Rsとして与えられた情報リソースbのラベルであり、ラベルB4は、Rsとして与えられた情報リソースbのラベルであるので、ラベルB1、B2、B4のラベルスコアSc(B1)、Sc(B2)、Sc(B4)は、それぞれ、Sc(B1)=1+1=2、Sc(B2)=1、Sc(B4)=1 となる。
【0041】
ここでは、どのラベルに対しても情報リソース1つにつき加算する数値は、全て同等の「1」にしているが、この理由は、ラベリング集合Aから選んだ情報リソース集合Rsの要素(情報リソース)間に重要度などの順位付けが存在しない場合には、ラベリング集合B上でRsの要素に付けられたラベルに対して一律に同じ数値を加算することは妥当であると考えられるからである。
【0042】
もし、ラベリング集合A上でラベルA1とラベルA2に重要度の違いがあるならば、例えば、ラベリング集合Aから検索用の情報リソースの集合として、Rs=R(A1 or A2)={a、b、d、e}(「or」は「または」を意味する論理演算記号で、この場合、ラベルA1かラベルA2のうちの少なくとも一方が付されている情報リソースの集合を意味する)を選んだとき、付与されたラベルの重要度に応じて、この4つの情報リソースに重要度を割り当てることができる。したがって、ラベリング集合B上でラベルスコアを計算するときに、各情報リソースに、この重要度に応じて各情報リソースに高低をつけた数値を割り当てて、その情報リソースに付されたラベルに当該値を加算するようにしてもよい。
【0043】
次に、情報リソーススコア算出部32の処理動作(情報リソーススコアの算出処理)について、図3と図5を参照して説明する。
情報リソーススコア算出部32では、ラベルスコア算出部31で得られた各ラベルのラベルスコアの値をそのラベルが付けられたRs以外の情報リソースについて加算したものを情報リソーススコアとする。ここで、ラベリング集合B上で検索用の情報リソースの集合Rsに付けられたラベルの集合をL(Rs)とする。
【0044】
図3のステップS5では、L(Rs)の要素(ラベル)のすべてを調べたかどうかをチェックし、まだ調べるべきラベルが残っていれば、ステップS6に進み、L(Rs)から1つの要素を取り出して、それをλとする。ステップS7では、当該取り出したラベルλが付けられたRs以外の情報リソースのスコアにλのラベルスコアを加算する。
【0045】
図5において、ラベルスコア算出部31で得られた各ラベルB1、B2、B4のラベルスコアの値をそのラベルが付けられたRs以外の情報リソース{m、g}
について加算する。たとえば、情報リソースmには、ラベルB1とラベルB2とが付いている。情報リソースmのスコアSc(m)は、それに付けられているラベルB1とラベルB2のラベルスコアSc(B1)、Sc(B2)を加算したものになっている。つまり、Sc(m)=Sc(B1)+Sc(B2)=2+1=3となる。情報リソースgのスコアに関しても同様に、ラベルB4のラベルスコアから、Sc(g)=Sc(B4)=1となる。
【0046】
このとき、ラベルに重要度が与えられていたとすれば、情報リソーススコアを求める際に、各ラベルスコアからの寄与を重要度によって変えることもできる。例えば、各ラベルに、その重要度に応じて高低をつけた数値(例えば、重要度の高いものには「2」、重要度の低いものには「1」)を割り当てて、その数値と情報リソースのスコアとを乗じてから、加算するようにしてもよい。
例えば、ラベルB1は重要度が高いので「2」を割り当て、ラベルB2は重要度が低いので「1」を割り当てるとすると、情報リソースmのスコアは、Sc(m)={Sc(B1)・2}+{Sc(B2)・1}=4+1=5となる。
【0047】
候補情報リソースリスト作成部33では、情報リソーススコアの値が高い情報リソースを候補情報リソースリスト(候補リスト)として選び、そのスコアの値に基づいて情報リソースを順位付けしたリストを作成する。例えば、図5の例では、情報リソーススコアが「0」でない情報リソースは、mとgだけなのでこれらをラベリング集合Bから検索されてた候補情報リソースの集合Rc(B)={m、g}とし、各々の情報リソーススコアの値によって、1番目の候補情報リソースをm、2番目の候補情報リソースをgとする。
【0048】
最後に、候補情報リソース呈示部40で、候補情報リソースリスト作成部33で作成した順位付けされた候補情報リソースのリストを検索を発した元のラベリング集合に対して呈示する。
【0049】
以上は、1つのラベリング集合を検索の対象として想定し、説明してきたが、複数のラベリング集合にわたる情報検索の場合は、基本的には個々の検索対象のラベリング集合で得られた情報検索の結果を重ね合わせる(統合する)ことになる。
【0050】
図6は、複数(例えば4つ)のラベリング集合A〜Dから情報リソースを検索する場合を概念的に示したものである。
例えば、上記同様、ラベリング集合Aから検索が発せられると、ラベリング集合B〜D毎に上記同様にして候補情報リソースの集合Rc(B)、Rc(C)、Rc(D)が得られたとする。このとき、これら候補情報リソースの集合の論理和をとり、同じ候補情報リソースに対する情報リソーススコアについては、各ラベリング集合ごとに予め与えられた重み係数を掛けたものを足し合わせて、統合スコアを求める。
【0051】
具体的には、たとえばラベリング集合B、C、Dのそれぞれから候補情報リソースとして、それぞれ、Rc(B)={m(3)、g(1)}、Rc(C)={g(2)、m(1)、p(1)}、Rc(D)={m(2)、p(2)、e(1)}が得られたとする。ただし、各要素(情報リソース)の括弧内の数値は情報リソーススコアの値を表すとする。このとき、これら候補情報リソースの論理和をとり、最終的な候補情報リソースの集合は、Rc={m、g、p、e} である。ラベリング集合B、C、Dの重み係数として、KB、KC、KDが与えられていたとすると、候補情報リソースmの統合スコアは、各ラベリング集合B、C、Dにおける情報リソーススコアに各ラベリング集合の重み係数を乗じてから加算すればよいので、
Sc(m)=3・KB+1・KC+2・KD
となる。通常は、各ラベリング集合の重み係数はすべて同じと考えて良いので、その場合には、各候補情報リソースの統合スコアは、各ラベリング集合において計算された情報リソーススコアの単純な和でよいことになる。
(第2の実施形態)
図7は、本発明の情報検索方法を用いて情報を検索および収集する場合を概念的に示したものである。ユーザ80は、情報リソースに対して自分で定義したラベルを付けていく。ある情報リソースの集合に関連した情報を検索したい場合には、まず、その情報リソース集合を特徴づけるラベルの論理式を検索キーとして後述するコレクタ81と呼ばれる仮想的なフォルダを作成することにより、自分のラベリング集合から対応する情報リソースを抽出する。つぎに、それらの情報リソースリストを検索のキーとして、他の複数のラベリング集合83に対して検索を行う。検索結果84は候補情報リソースの順位付けされたリストとして得られる。必要に応じて候補情報リソースの中から幾つかをコレクタに追加することが可能である。
【0052】
図8は、本発明の第2の実施形態に係る情報検索装置を用いて、例えば、ネットワークを介して情報検索を行う場合を概念的に示したものである。情報リソースは、イントラネット及びインターネット上にあって、複数のユーザ(例えば2人のユーザα、β)がアクセス可能であり、図8では 情報リソースは、データ格納部402、422、432に格納されている。この例ではラベリングを行う主体はユーザすなわち人であることを想定している。
【0053】
例えば、ユーザαは、クライアントとしての情報検索装置(以下、簡単に端末と呼ぶこともある)421を利用して、自分がアクセスした情報に対してラベリングを行う。ユーザに関する情報、ユーザが作成したラベルに関する情報、ユーザがラベルを付けた情報リソースに関する情報、情報リソースを格納したコレクタに関する情報等は、各クライアント(端末421、431)のデータ格納部422、432に格納されるとともに、ネットワーク400を介して、ラベリングの情報を管理、処理するラベリングサーバ411に送られ、ラベリングDB412にも保存される。クライアントからラベリング集合間の情報検索を行う場合には、ラベリングサーバ411に対して必要な処理を要求する。なお、ラベリングサーバ411で保持・管理されている情報は、各クライアント側で保持しているデータと整合性を保つように管理されている。各ユーザの端末421、431では、各ユーザがそれぞれ独自にラベリングした結果としてのラベルに関する情報、ユーザがラベルを付けた情報リソースに関する情報、情報リソースを格納したコレクタに関する情報等を保持するとともに、各端末421、431にあるラベリングインタフェースを介して、ラベル付けや自分や他人のラベリングに対する情報検索を行うようになっている。ラベリングインタフェースは、パレット、ファインダ、コレクタという3つの基本コンポーネントから構成されている。
【0054】
図9は、本発明の第2の実施形態に係る(図8の端末421、431に相当する)情報検索装置の要部の構成を概略的に示したもので、前述の第1の実施形態に係る情報検索装置の構成をより具体的に示したものである。
【0055】
図9に示す情報検索装置は、大きく分けて、ユーザインタフェース部501と処理部502と、データ格納部506と、送受信部507とから構成されている。
【0056】
処理部502は、ラベリング処理を行うためのラベリング処理部503と、コレクタ作成処理を行うためのコレクタ作成処理部504と、情報検索処理を行うための情報検索処理部505とから構成されている。
【0057】
ラベリング処理部503は、ラベル定義部510とラベル付与部520とから構成され、コレクタ作成処理部504は、コレクタ検索式設定部530とメインリスト取得部540とメインリスト操作部550とから構成され、情報検索処理部505は、コレクタ選択部560と情報検索部570と候補情報リソースリスト呈示部580とから構成されている。
【0058】
ユーザインタフェース部501は、上記各部でラベリング処理、コレクタ作成処理、情報検索処理を実行する際に必要な情報の呈示および入力を行うためのもので、例えば、ディスプレイ装置や、マウス、キーボード等の入力装置等から構成されている。
【0059】
データ格納部506には、ユーザにより収集された情報リソースと、当該情報リソースに対しラベリングした結果であるラベル情報等とを格納する。また、コレクタ作成処理部504で作成されたコレクタも格納される。
【0060】
送受信部507は、コレクタ作成処理部504で作成されたコレクタを検索要求としてネットワーク400を介してラベリングサーバ411へ送信したり、検索結果をネットワーク400を介して受信したりする。
【0061】
図10は、図9の情報検索装置の動作を、ユーザインタフェース部590にて呈示されるユーザインタフェース画面(ラベルの操作を行うパレット610と、ラベルやコレクタごとに関係した情報リソースのリストを表示するファインダ620)と、主に情報検索のために利用するコレクタ630との関連に基づき概念的に示したものである。
【0062】
図10に示すように、パレット610では、ラベルの操作を行い、ファインダ620では、ラベルやコレクタごとに関係した情報リソースのリストを表示し、情報検索のために用いるコレクタ630を作成し、検索結果の呈示を行う。
【0063】
まず、図9のラベリング処理部503について説明する。
ラベリング、すなわち、ある情報リソースに対してユーザが定義したラベルを付与するという処理は、ラベル定義部510とラベル付与部520にて実行される。これらの処理は、パレット610のようなインタフェース画面をユーザインタフェース部501に呈示して行う。
【0064】
ラベル定義部510では、ユーザが自由にラベルの名前を決定し、ラベルを新規に作成する。また必要に応じて、ラベル名を変更したり、ラベルの消去を行う。ラベル付与部510では、情報リソースに対してラベルを付与する。
【0065】
パレット610は、別のブラウザ600と呼ばれるインタフェース画面を介して、現在表示している情報リソースのID(例えば、URL)を取得し、その取得した情報リソースに、マウス操作などによって付与すべきラベルを選択してラベル付けを行うためのインタフェース画面である。
【0066】
図11は、ユーザインタフェース部501にて呈示されるパレット610の基本画面の一例を示したものである。
図11に示したように、パレットの基本画面には、ユーザが作成したラベル(「料理」「健康」「役場」「写真」「香港映画」「論文」)が配置されている。
【0067】
新たにラベルを作成しようとするときは、マウス等を用いて、「New」というボタン614を押下すれば、任意の位置にラベルの入力領域が呈示されるので、そこに所望のラベル名を入力すればよい。また、既に作成されているラベルを消去しようとするときは、消去しようとするラベルを選択して(選択されたラベルは、例えば、反転表示する)、「Delete」というボタン615を押下すればよい。
【0068】
ユーザは、ラベルをドラッグ&ドロップ操作によって任意の位置に動かすことができるため、例えば、ジャンルの類似しているラベル(例えば「料理」と「健康」)を集めてグループ化することができる。
【0069】
パレット610上で情報リソースにラベルを貼り付けたい場合は、ユーザは、例えば、情報リソースID指定領域611に、所望の情報リソースID(例えば、URL)を入力し、あるいは、下向きの矢印が表記されたボタン616を押下することにより表示された選択可能な情報リソースのIDのリストから所望の情報リソースIDを選択する。あるいは、ブラウザ600上に開かれている情報リソースのIDが自動的に情報リソースID指定領域611に取り込まれるようになっていてもよい。次に、パレット610上に呈示されているラベルのうち所望のものを選択して(選択されたラベルは、画面上で反転表示される)、「Labelling」というラベルの貼り付け指示用のボタン612を押下すればよい。
【0070】
一度貼り付けたラベルを変更したい場合は、情報リソースID指定領域611にラベルを変更したい情報リソースのIDを入力(あるいは選択)すれば、その情報リソースに既に貼り付けてあるラベルが画面上で選択状態(例えば画面上で反転表示する)になるので、選択状態を変更して再び「Labelling」ボタン612を押下すればよい。
【0071】
指定したラベルが貼り付けられている情報リソースの一覧を参照したい場合、例えば、「料理」というラベルの貼り付けられている情報リソースの一覧を参照したいときには、パレット610の画面上でラベル「料理」を選択し「Finder」というボタン613を押下すればよい。すると、後述するファインダ620が起動されて、ラベル「料理」が貼り付けられている情報リソースの(IDの)一覧がファインダ620によって呈示される。
【0072】
複数個のラベルを選択した場合は、選択した全てのラベルが貼り付けられている情報リソースの一覧が呈示される。
第1の実施形態で説明したように、ラベルに重要度を設定する場合、パレット610の画面上で行うことが望ましい。例えば、パレット610の画面上所望のラベルを選択し、当該ラベルのプロパティ設定画面を開く。そして、例えば5段階の重要度(重要度が最も高い場合を「5」、最も低い場合を「1」)として、各ラベル毎に当該プロパティ設定画面上で設定すればよい。
【0073】
また、ラベルのプロパティとしては、上記重要度の他に、当該ラベルを付した情報リソースへのアクセス可能な範囲を限定するためのアクセス許可情報があってもよい。例えば、プロパティとして「アクセス可」と設定されているラベルの付された情報リソースに対しては、検索対象とすることができ、「アクセス不可」と設定されているラベルの付された情報リソースに対しては検索対象とすることができない、といった操作も可能とある。さらに、ラベルのプロパティとして、当該ラベルの付された情報リソースに対し、アクセス可能な(当該情報リソースを検索対象とできる)ラベリング集合を限定したり、逆に、アクセスができないラベリング集合を指定したりすることもできよう。これらラベルのプロパティ設定は、上記同様、パレット610の画面上所望のラベルを選択し、当該ラベルのプロパティ設定画面を開いて、当該画面上で行うことが望ましい。
【0074】
次に、図9のコレクタ作成処理部504について説明する。
図14において、あるユーザがもっているラベリング集合の中で、たとえば「香港映画」と「写真」というラベルがともに付いた情報リソースをしばしば参照したり、関連した情報を検索したい場合には、対応するラベルの論理式によって特徴づけられる仮想的なフォルダを作成し、それを開けばそのラベルの論理式にマッチする情報リソースのリストが得られるようにしておく。この仮想的なフォルダをコレクタと呼んでいる。またそのときのコレクトを特徴づけるラベルの論理式をコレクタ検索式と呼ぶ。
【0075】
図9のコレクタ検索式設定部53では、このコレクタ検索式を設定するものである。
図14において、コレクタ710は、「香港映画 and 写真」というコレクタ検索式を持ち、このコレクタ710を開くと情報リソース{a、c}が入っていることがわかる。情報検索時には、このコレクタごとに検索対象のラベリング集合(例えば、「人」)の指定や、検索のためのパラメータ設定を行う。
【0076】
図15に示すように、あるコレクタ830の中身をファインダ620で表示したときには、コレクタの中身は2つに分れている。1つはメインリスト810であり、もう1つは候補リスト820である。
【0077】
メインリスト810とは、検索発信源であるラベリング集合中の情報リソースのうち、当該コレクタに属する情報リソースのリストであり、候補リスト820とは、コレクタに属する候補となる他のラベリング集合から検索された情報リソースのリストである。他のラベリング集合からの情報検索結果はすべてこの候補リスト820に入り、ユーザの判断で必要に応じてメインリストに移動することができる。
【0078】
なお、コレクタにも名前をつけることができる。図14のコレクタ710には、「香港の映画」という名前が付けられており、図15のコレクタ631には、「健康的な料理」という名前が付けられている。
【0079】
図9のメインリスト取得部540では、コレクタ検索式設定部530で設定されたコレクタ検索式からメインリスト810を作成する。メインリスト操作部550では、メインリスト810から特定の情報リソースを取り除いたり、情報検索の結果が入った候補リスト820から特定の情報リソースをメインリストに移動させたりする操作を行うようになっている。
【0080】
コレクタ作成処理部504で作成されたコレクタは、データ格納部506に格納される。
図12は、コレクタを作成する際に、ユーザインタフェース部501に呈示されるファインダ620の基本画面の一例を示したものである。例えば、図12のメニューバー625にある「Collector」をマウスでクリックすることにより、まず、コレクタのフォルダと当該コレクタのアイコンとが新規に作成されて基本画面上に呈示される。その呈示されたアイコンをダブルクリックするとファインダ620が起動されて、図12に示したような上下2つに分かれた画面が呈示される。上がメインリストの呈示領域623で、下が候補リストの呈示領域624である。コレクタ検索式設定領域621にコレクタ検索式をラベルの論理式で入力すると、コレクタ検索式設定部530は、それをメインリスト取得部540へ渡す。メインリスト取得部540では、当該コレクタ検索式に当てはまる情報リソースをローカルなラベリング集合(例えば、当該ユーザにてラベリングを行ったラベリング集合で、データ格納部506に格納されている)から検索し、その結果得られた情報リソースの集合を羅列したメインリストを作成し、それをメインリスト呈示領域623に呈示する。
【0081】
メインリスト呈示部623には、情報リソースのタイトルと、当該情報リソースのID(例えばURL)と、当該情報リソースに付けられているラベルとがメインリストとして呈示されている。
【0082】
ユーザがメインリスト呈示領域623に呈示されたメインリストに対し為した操作に基づき、メインリスト操作部550は情報リソースの追加・削除を行い、ユーザの観点に合うようメインリスト中の情報リソースの集合を変更することができる。
【0083】
第1の実施形態で説明したように、情報リソースに重要度を設定する場合、ファインダ620の画面上で行うことが望ましい。例えば、図18に示すように、メインリスト呈示領域623に各情報リソースの重要度を設定するための重要度設定領域626を設ける。例えば5段階の重要度(重要度が最も高い場合を「5」、最も低い場合を「1」)として、各情報リソース毎に重要度設定領域626に所望の数値を設定すればよい。
【0084】
また、メインリストの上位に表示される情報リソースほど、重要度が高いと予め設定されていてもよい。図12では、「○○○のページ」というタイトルの情報リソースの重要度が最も高く、「健康づくりのページ」というタイトルの情報リソースの重要度が最も低い。この場合、例えばコレクタとしての情報リソースの利用頻度の統計を随時とっておき、利用頻度の高い情報リソースには高い重要度を自動的に設定するようにしてもよい。コレクタを呈示する際には、利用頻度の高いものほどメインリストの上位に呈示する。また、ユーザがメインリスト呈示領域623に呈示されたメインリストを操作して、メインリストでの情報リソースの呈示順序を変更することにより、情報リソースの重要度を設定するようにしてもよい。このような情報リソースに対する重要度の設定処理は、例えばメインリスト操作部550にて行うようにしてもよい。
【0085】
次に、図9の情報検索処理部505について説明する。
情報検索処理部505では、図12に示したようなコレクタの選択された状態、すなわち、コレクタの検索式の設定と、そのコレクタの検索式に基づき作成されたメインリストがメインリスト呈示領域623に呈示されている状態から、例えば、メニューバー621中の「Search」をマウスでダブルクリックされると、送受信部507を介してネットワーク400上のラベリングサーバ411へ、、コレクタ(少なくとも、メインリスト)を渡し、検索要求を行う。また、当該情報検索処理部505の情報検索部570において、当該コレクタを用いて検索を実行する。
【0086】
なお、検索要求を行う際に、図14に示したように、コレクタに検索範囲を設定してもよい。
ラベリングサーバ411は、例えば、図17に示すような構成である。なお、図1と同一部分には同一符号を付している。ラベリングサーバ411では、ネットワーク400、送受信部60を介して、検索用情報リソースリスト取得部10でコレクタを受け取り、ラベリング集合選択部20で、当該コレクタに検索範囲が設定されているときに、検索の対象となるラベリング集合を選択する。情報検索部30において、図3に示すようにラベルスコアの算出処理、情報リソーススコアの算出処理、統合スコアの算出等を行って、候補情報リソースのリスト(候補リスト)を作成し、検索要求元の情報検索装置に送受信部60、ネットワーク400を介して送り返す。情報検索装置では、図13に示すように、当該候補リストを候補リスト呈示領域624に呈示する。
【0087】
このように、コレクタに予めコレクタ検索式を設定し、ファインダ620から検索を実行することで、ラベリングサーバ411からコレクタ検索式にマッチする情報リソースを取ってくることができるようになっている。取ってきた情報リソースは、候補リストとして別個呈示されるとともに、コレクタに格納されるので、ユーザがカスタマイズしたメインリストを乱すことはない。ユーザは、候補リストとして候補リスト呈示領域624に呈示された情報リソースのうち必要なものだけをメインリストに移し替えればよい。
【0088】
コレクタ選択部560では、データ格納部506に格納されたあるいはコレクタ作成処理部504で作成されたコレクタのうち、検索のためのコレクタを選択するためのものである。
【0089】
情報検索部670は、例えば、図1の情報検索処理部1と同様な構成であって、検索用情報リソースリスト取得部10でコレクタ選択部560で選択されたコレクタを受け取って、第1の実施形態で説明したようにして、データ格納部506から情報リソースの検索を行う(図1の検索用情報リソースリスト取得部10、ラベリング集合選択部20、情報検索部30の処理動作と同様)。
【0090】
候補情報リソースリスト呈示部580では、情報検索部570で検索した結果得られた候補情報リソースのリストを呈示するためのものである。
次に、図16を参照して、ラベリング集合Aから作成されたコレクタ907を用いて別の2つのラベリング集合B、Cに対して情報検索を行う場合を例にとり、候補情報リソースのスコア計算について具体的に説明する。ユーザA、B、Cは、それぞれの観点からラベルつけした結果、ラベリング集合A、ラベリング集合B、ラベリング集合Cといった分類が得られたとする。
【0091】
例えば、ラベリング集合Aには、リソースIDがdat−03の情報リソースにはラベルA1とラベルA3とが付され、リソースIDがdat−10の情報リソースにはラベルA1とラベルA2とが付されている。以下、同様にして、図16のラベリング集合A〜Bの表記において、情報リソースに付されているラベルを示すために、リソースIDとラベルの交わる位置に○印を記している。
【0092】
このとき、ユーザAは、コレクタ907を生成して、コレクタ検索式として「A1 and A2」を与えたとき、自分自身のラベリング集合内でこのコレクタ検索式にマッチする情報リソースの集合は、{dat−10、dat−36、dat−42}である。すなわち、コレクタ907のメインリスト909には、{dat−10、dat−36、dat−42}が書き込まれている。
【0093】
図16では、このコレクタ検索式にマッチする情報リソースのリソースIDとそれに付されたラベルとの交わる位置に記された○印を黒く塗りつぶして示している。
【0094】
ラベリング集合Bにおいて、ヒットした(すなわち、コレクタ907にて指定された情報リソースのうちのいずれかに一致する)情報リソースは、dat−10、dat−36で、dat−10はラベルB1とB3とが付されて、dat−36はラベルB3が付されている。これら各ラベルについて加算する数値を全て「1」とすると、ラベルB1のラベルスコアはdat−10のみがヒットしているので「1」、ラベルB3のラベルスコアはdat−10とdat−36とがヒットしているので「2」となる。
【0095】
一方、ラベリング集合Cにおいて、ヒットした(すなわち、コレクタ907にて指定された情報リソースのうちのいずれかに一致する)情報リソースは、dat−10、dat−36、dat−42で、dat−10はラベルC2とC3とが付され、dat−36はラベルB2、C3、C4が付され、dat−42はラベルC2が付されている。これら各ラベルについて加算する数値を全て「1」とすると、ラベルC2のラベルスコアはdat−10、dat−36、dat−42がヒットしているので「3」、ラベルC3のラベルスコアはdat−10、dat−36がヒットしているので「2」、ラベルC4のラベルスコアはdat−10のみがヒットしているので「1」となる。
【0096】
コレクタ907を用いてラベリング集合Bから検索された候補情報リソースの集合は、{dat−20、dat−22、dat−53、dat−60}である。
また、コレクタ907を用いてラベリング集合Cから検索された候補情報リソースの集合は、{dat−04、dat−19、dat−22、dat−60}である。図16のラベリング集合A、Bの表記では、各ラベリング集合から検索された候補情報リソースのリソースIDとそれに付されたラベルとの交わる位置に二重マルを記している。
【0097】
ラベリング集合Bにおいて、候補情報リソースdat−20、dat−22、dat−53、dat−60のそれぞれの情報リソーススコアを計算する。情報リソースdat−20の情報リソーススコアはラベルB3のラベルスコア「2」となり、情報リソースdat−22の情報リソーススコアはラベルB1のラベルスコア「1」となり、情報リソースdat−53の情報リソーススコアはラベルB1のラベルスコア「1」とラベルB3のラベルスコア「2」とを加算して「3」となり、情報リソースdat−60の情報リソーススコアはラベルB1のラベルスコア「1」となる。すなわち、ラベリング集合Bにおける
dat−20の情報リソーススコアは「2」
dat−22の情報リソーススコアは「1」
dat−53の情報リソーススコアは「3」
dat−60の情報リソーススコアは「1」
である。
【0098】
一方、ラベリング集合Bにおいて、候補情報リソースdat−04、dat−19、dat−22、dat−60のそれぞれの情報リソーススコアを計算する。情報リソースdat−04の情報リソーススコアはラベルC4のラベルスコア「1」となり、情報リソースdat−19の情報リソーススコアはラベルC3のラベルスコア「2」とラベルC4のラベルスコア「1」を加算して「3」となり、情報リソースdat−22の情報リソーススコアはラベルC2のラベルスコア「3」とラベルC3のラベルスコア「2」とを加算して「5」となり、情報リソースdat−60の情報リソーススコアはラベルC2のラベルスコア「3」となる。すなわち、ラベリング集合Bにおいて、
dat−04の情報リソーススコアは「1」
dat−19の情報リソーススコアは「3」
dat−22の情報リソーススコアは「5」
dat−60の情報リソーススコアは「3」
である。
【0099】
次に、コレクタ907を用いてラベリング集合B、Cから検索された候補情報リソースの統合スコアを求める。ここでは、ラベリング集合BとCの重み係数をともに「1」とする。すると、情報リソースdat−20、dat−22、dat−53、dat−60、dat−04、dat−19のそれぞれの統合スコアはラベリング集合Bでの情報リソーススコアとラベリング集合Cでの情報リソーススコアとを加算して、
情報リソースdat−20の統合スコアは「2」+「0」=「2」
情報リソースdat−22の統合スコアは「1」+「5」=「6」
情報リソースdat−53の統合スコアは「3」+「0」=「3」
情報リソースdat−60の統合スコアは「1」+「4」=「5」
情報リソースdat−04の統合スコアは「0」+「1」=「1」
情報リソースdat−19の統合スコアは「0」+「3」=「3」
となる。統合スコアの値の大きいものから順に降順に並べて替えて、図16に示すような候補情報リソースを順位付けした候補リスト910が得られる。候補リスト910は、コレクタ907に保存される(図15参照)。
【0100】
以上説明したように、上記第2の実施形態によれば、ネットワーク上の複数のユーザが参照可能な文書や画像といった任意の情報リソースに対して、各ユーザが自由な観点に基づいて収集し、ラベル付け(ラベリング)した結果得られる分類情報を利用することにより、関心のある情報と関連する未知の情報リソースをネットワークを介して効率良く検索および収集することができる。
【0101】
なお、ネットワークを介した情報検索に限らず、オフラインでの情報検索ももちろん可能である。すなわち、図9の情報検索装置のデータ格納部506には、ユーザの収集した情報リソースと、その情報リソースに対し当該ユーザが独自にラベリングした結果としてのラベルに関する情報と、コレクタに関する情報等が格納されているので、当該ユーザが複数のラベリング集合を持っているのであれば、そのうちの1つのラベリング集合からラベルの論理式にて特徴付けられる1または複数の検索用情報リソースを選択し、これを基に、他のラベリング集合から当該検索用情報リソースに関連する情報リソースを検索して呈示するようにしてもよい。
【0102】
【発明の効果】
以上説明したように、本発明によれば、ユーザは主観的なラベリングよる自由度の高い情報整理をしながら、集めた情報と関連する情報を容易に検索することが可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る情報検索方法を用いた情報検索装置の基本的な構成を概略的に示した図。
【図2】2つのラベリング集合間で情報検索を行う様子を概念的に示した図。
【図3】ラベルスコア算出部と情報リソーススコア算出部32の処理動作を示したフローチャート。
【図4】図3のステップS2からステップS4までの処理(ラベルスコアの算出処理)を説明するための概念図。
【図5】図3のステップS5からステップS7までの処理(情報リソーススコアの算出処理)を説明するための概念図。
【図6】複数(例えば4つ)のラベリング集合A〜Dから情報リソースを検索する場合を概念的に示したもので、個々の検索対象のラベリング集合で得られた情報検索の結果を統合する場合を説明するための図。
【図7】本発明の情報検索方法を用いて情報を検索および収集する場合を概念的に示した図。
【図8】本発明の第2の実施形態に係る情報検索装置を用いて、例えば、ネットワークを介して情報検索を行う場合を概念的に示した図。
【図9】本発明の第2の実施形態に係る情報検索装置の要部の構成を概略的に示した図。
【図10】図9の情報検索装置の動作を、ユーザインタフェース部にて呈示されるユーザインタフェース画面(ラベルの操作を行うパレットと、ラベルやコレクタごとに関係した情報リソースのリストを表示するファインダ)と、主に情報検索のために利用するコレクタとの関連に基づき概念的に示した図。
【図11】ユーザインタフェース部にて呈示されるパレットの画面呈示例を示した図。
【図12】コレクタを作成する際に、ユーザインタフェース部にて呈示されるファインダの呈示画面の一例を示した図で、検索結果(候補リスト)を呈示していない場合を示している。
【図13】コレクタを作成する際に、ユーザインタフェース部にて呈示されるファインダの呈示画面の一例を示した図で、検索結果(候補リスト)を呈示した場合を示している。
【図14】情報検索の際に用いるコレクタについて説明するための図。
【図15】コレクタの中身をファインダで表示したときの表示例。
【図16】ラベリング集合Aから作成されたコレクタを用いて別の2つのラベリング集合B、Cに対して情報検索を行う場合を例にとり、候補情報リソースのスコア計算について具体的に説明するための図。
【図17】ラベリングサーバの構成を概略的に示した図。
【図18】各情報リソースの重要度を設定するための重要度設定領域を有したファインダの画面呈示例を示した図。
【符号の説明】
1…情報検索処理部
10…検索用情報リソースリスト取得部
20…ラベリング集合選択部20
30…情報検索部
31…ラベルスコア算出部
32…情報リソーススコア算出部
33…候補情報リソースリスト作成部
40…候補情報リソース呈示部
411…ラベリングサーバ
412…ラベリングデータベース
501…ユーザインタフェース部
502…処理部
503…ラベリング処理部
504…コレクタ作成処理部
505…情報検索処理部
506…データ格納部
507…送受信部
510…ラベル定義部
520…ラベル付与部
530…コレクタ検索式
540…メインリスト取得部
550…メインリスト操作部
560…コレクタ選択部
570…情報検索部
580…候補情報リソースリスト呈示部
610…パレット
620…ファインダ
630、710…コレクタ[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an information collection method for retrieving and collecting unknown information resources related to a set of information resources of interest with respect to information resources such as documents and images that can be referred to by a plurality of users, and information retrieval using the information collection method. With regard to devices, for example, by collaborative filtering technology for acquiring unknown information related to people with similar tastes for content such as movies and music, and the publication and sharing of bookmark functions of WWW (World Wide Web) browsers Involved in technology for promoting information sharing within a group (community) on a network.
[0002]
[Prior art]
The personal information classification or organization method using labeling already exists as an application similar to the conventional memo / annotation function. A feature of these methods is that information is classified and searched using the name of the label attached by the user and the attribute value attached to the label. At this time, if the range of use is limited to individuals, it will not be a problem, but considering that the user can directly use the label name or memo contents that the user has given directly to share information and search with others, The consistency and consistency of the words used in label names and memos is a problem.
[0003]
To avoid this, when building a system, choose whether to unify label names and terms to limit the name space, or to handle name association by the system using a thesaurus or word database. There are many.
[0004]
In the latter case, the problem of word ambiguity and ambiguity remains even if a large-scale dictionary is prepared to improve the search accuracy. In addition, analysis of document text, extraction of keywords, and use for information retrieval are often used when retrieving web documents.
[0005]
However, just extracting a word in a sentence reveals that the word exists, but it is difficult to analyze what kind of viewpoint the document is written in and useful. In addition, keyword analysis is not possible for information resources with only image, audio and video information. In any case, the evaluation and classification of how useful the document is for the user and from what point of view the document is useful for each user are different for each user.
[0006]
Some systems actively use evaluation information performed by users. A typical example is a system using collaborative filtering called a recommendation engine (Recommendation Engine). This is one method for accurately presenting a list that suits the user's preference when advertising and selling videos, music, and books on the Internet. Specifically, for example, by making a database of numerical evaluations (like or dislike or how much you like) given by many users to many movies, and calculating the correlation of each person's preference, A list of movie titles that the user is likely to like is presented from a group similar to the user's preferences. A representative example of the recommendation engine is a GroupLens recommendation engine (USA, Net Perception). The current recommendation engine can be regarded as giving a standard label for evaluation (for example, a mark sheet-like evaluation label in which “like” to “dislike” are quantified) to data such as movies and music.
However, the reality is that content can only be evaluated in one way, such as whether you like it or not.
[0007]
[Problems to be solved by the invention]
Thus, in a search engine based on normal keywords such as “Yahoo” and “Infoseek” on the WWW, the search and the act of collecting and organizing information (bookmarks and filing) are completely separated. Therefore, even if information is collected about a certain matter, there is a problem that it cannot be used to improve the accuracy of search.
[0008]
Therefore, the present invention uses information obtained as a result of collecting and classifying an arbitrary information resource such as a document or an image that can be referred to by a plurality of users on a network based on a free viewpoint, It is an object of the present invention to provide an information search method and an information search apparatus using the same, which can efficiently search and collect unknown information resources related to information of interest.
[0009]
[Means for Solving the Problems]
(1) An information search method according to the present invention (Claim 1) is one of a plurality of labeling sets composed of a plurality of information resources characterized by a correspondence relationship between information resources and labels assigned to the information resources. One or more search information resources (stored in the collector) characterized by the logical expression of the label selected from (for example, labeling set A) are replaced with one or more other labeling sets (for example, labeling set). Search from each of B, C)
Obtaining a first evaluation value (label score) for evaluating a link between the search information resource and the label for the label attached to the searched information resource;
Based on the first evaluation value, a second evaluation value (information resource score) that evaluates the degree of association of the information resource other than the search information resource with the search information resource is obtained.
An information resource related to the information resource for search selected based on the second evaluation value is presented.
[0010]
According to the present invention, it is possible to efficiently search for an unknown information resource related to information of interest using a result obtained by organizing and classifying information resources collected by each user based on a free viewpoint by labeling (labeling). Can be collected.
[0011]
(Claim 2) Preferably, the second evaluation value of the information resource obtained from each of the plurality of labeling sets is integrated based on a predetermined weighting factor for each of the plurality of labeling sets, and the integration result The information resource related to the information resource for search is selected based on the above.
[0012]
(Claim 3) Preferably, for a label attached to the search information resource, a predetermined value is cumulatively added for each search information resource to which the label is attached, so that the first evaluation of the label is performed. Calculate the value.
[0013]
(Claim 4) Preferably, for the label attached to the search information resource, a first evaluation value of the label is calculated based on the importance of the search information resource to which the label is attached.
[0014]
(Claim 5) Preferably, for an information resource other than the information resource for search, a second evaluation of the information resource is performed by cumulatively adding the first evaluation value of a label attached to the information resource. Calculate the value.
[0015]
(Claim 6) Preferably, for an information resource other than the information resource for search, a second of the information resource is determined based on the first evaluation value of the label attached to the information resource and the importance of the label. The evaluation value of is calculated.
[0016]
(2) The information search device of the present invention (Claim 7) is one of a plurality of labeling sets including a plurality of information resources characterized by a correspondence relationship between information resources and labels assigned to the information resources. Search means for searching one or more search information resources characterized by a logical expression of the label selected from each of the other one or more labeling sets;
Label evaluation means for obtaining a first evaluation value for evaluating a link between the search information resource and the label for the label attached to the search information resource searched by the search means;
Information resource evaluation means for obtaining a second evaluation value for evaluating the degree of association of the information resource other than the information resource for search with the information resource for search based on the first evaluation value;
Presenting means for presenting an information resource related to the information resource for search selected based on the second evaluation value;
It is characterized by comprising.
[0017]
According to the present invention, it is possible to efficiently search for an unknown information resource related to information of interest using a result obtained by organizing and classifying information resources collected by each user based on a free viewpoint by labeling (labeling). Can be collected.
[0018]
(Claim 8) Preferably, the second evaluation value of the information resource obtained from each of the plurality of labeling sets is integrated based on a weighting factor predetermined for each of the plurality of labeling sets, and the integration result The information resource related to the information resource for search is selected based on the above.
[0019]
(Claim 9) Preferably, for a label attached to the search information resource, a predetermined value is cumulatively added for each search information resource to which the label is attached, so that the first evaluation of the label is performed. Calculate the value.
[0020]
(Claim 10) Preferably, for the label attached to the search information resource, a first evaluation value of the label is calculated based on the importance of the search information resource to which the label is attached.
[0021]
(Claim 11) Preferably, for an information resource other than the information resource for search, a second evaluation of the information resource is performed by cumulatively adding the first evaluation value of a label attached to the information resource. Calculate the value.
[0022]
(Claim 12) Preferably, for information resources other than the information resource for search, based on the first evaluation value of the label attached to the information resource and the importance of the label, An evaluation value of 2 is calculated.
[0023]
(3) The recording medium of the present invention (Claim 13) is provided by one of a plurality of labeling sets including a plurality of information resources characterized by a correspondence relationship between information resources and labels assigned to the information resources. Search means for retrieving one or more search information resources characterized by the logical expression of the selected label from each of the other one or more labeling sets;
Label evaluation means for calculating a first evaluation value for evaluating a link between the search information resource and the label for the label attached to the search information resource searched by the search means;
Information resource evaluation means for calculating a second evaluation value for evaluating a degree of association of the information resource other than the search information resource with the search information resource based on the first evaluation value;
Presenting means for presenting an information resource related to the information resource for search selected based on the second evaluation value;
Is a machine-readable recording medium recording a program for executing the above, and according to the present invention, for example, a screen (pallet) for performing an operation on a label, and a collector used for information retrieval are created. And a display device for presenting a user interface screen such as a finder for presenting search results, and a storage device such as a hard disk device (preferably further capable of communication via a network such as the Internet) As programs that can be executed by a computer such as a personal computer, each program is stored and distributed in a recording medium such as a magnetic disk (floppy disk, hard disk, etc.), optical disk (CD-ROM, DVD, etc.), semiconductor memory, etc. Collect based on user's free viewpoint Labeling the information resource (labeled) using the results of the organizing classification enables efficient search and collect unknown information resources associated with information of interest.
[0024]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
Here, terms used in the following description are defined.
The information resource is, for example, an information file such as voice, text, still image, moving image, HTML document, or the like.
[0025]
The act of giving a label with a subjective free name based on an arbitrary standard or viewpoint to multiple information resources is called `` labeling '', and the set of correspondences between labels and information resources obtained as a result of labeling This will be called “labeling set”.
(First embodiment)
FIG. 1 schematically shows a basic configuration of an information search apparatus using an information search method according to the first embodiment of the present invention. The information
[0026]
Here, for example, for information resources collected from the Internet using a browser or created by the user, labels that the user decides freely based on criteria and viewpoints that the user wants to organize or record are attached. It is assumed that information about the label, information about the labeled information resource, and the like are already stored in the
[0027]
FIG. 2 conceptually shows two labeling sets A and B. Here, for example, the labeling set A and the labeling set B indicate labeling sets possessed by different users, but one user may have a plurality of labeling sets A and B.
[0028]
One labeling set includes a set of labels defined therein and a set of arbitrary information resources to which the labels are attached. For example, in the labeling set A, there is a label set {A1, A2, A3} and a set of information resources {a, b, c, d, e} to which those labels are attached.
[0029]
In FIG. 2, the relationship between the label and the information resource, that is, the relationship that a certain label is attached to a certain information resource is expressed by a line connecting the label and the information resource.
[0030]
In the labeling set B, similarly to the labeling set A, there exists a label set {B1, B2, B3, B4}, and these labels are attached to the information resources {a, b, e, f, g, k}. It has been. It shows that information resources with the same name refer to the same entity. At this time, for example, in the labeling set A, the set of information resources having both the label A1 and the label A2 may be considered to include matters relating to both the label A1 and the label A2.
[0031]
As described above, as a result of labeling, information resources are classified by various cuts according to combinations of label logical expressions. The logical expression of the label is expressed in the form of “A1 and A2”, for example, and R (A1 and A2) means a set of information resources with both the label A1 and the label A2. For example, in the labeling sets A and B shown in FIG. 2, R (A1 and A2) = {a, b}.
[0032]
The main object of the present invention is to search and collect unknown information resources related to those information resources from another labeling set using a set of information resources characterized by such a logical expression of labels as a search key. That is.
[0033]
The search information resource
[0034]
After obtaining an information resource list (specifically, an information resource identification information (ID) list, also referred to as a main list) that represents a set of information resources for search, Decide the target (other labeling set) to search for related information. Therefore, the labeling
[0035]
In the example of FIG. 2, this corresponds to selecting the labeling set B and notifying the labeling set B of the information resource list {a, b}. In general, there are a plurality of labeling sets to be selected, but all labeling sets other than the labeling set (here, labeling set A) that is the source of the search implicitly become search targets.
[0036]
Next, the
The
[0037]
Here, the label score represents a degree of association between a set of information resources Rs given for search and a label defined in a certain labeling set. The information resource score is an index for measuring the relationship between Rs and other information resources calculated based on the label score. Briefly, an information resource that is labeled the same as the given information resource set Rs has a higher score, and the information resource that is highly related to the original Rs in terms of labeling. You can say that.
[0038]
FIG. 3 is a flowchart showing the processing operations of the label
[0039]
First, the processing operation (label score calculation processing) of the label
In step S1 of FIG. 4, the label score and the information resource score are initialized to a value of “0”, for example. Next, in step S2, when the information resource set for search is Rs, it is checked whether all elements (information resources) of Rs have been examined. If elements to be examined still remain, step S3 is performed. Go to, extract one element from Rs and let it be r. In step S4, a predetermined numerical value (for example, “1”) is added to the label scores of all labels attached to the extracted information resource r.
[0040]
In FIG. 4, when an information resource {a, b} is given as Rs, in the labeling set B, the label attached to each element (information resource) of Rs is attached 1 For each information resource, the numerical value “1” is added to the label score equally. The label B1 is the label of the information resource a, b given as Rs, the label B2 is the label of the information resource b given as Rs, and the label B4 is the label of the information resource b given as Rs. Therefore, the label scores Sc (B1), Sc (B2), and Sc (B4) of the labels B1, B2, and B4 are Sc (B1) = 1 + 1 = 2, Sc (B2) = 1, and Sc (B4), respectively. ) = 1.
[0041]
Here, the numerical values to be added per information resource for all labels are all equal to “1” because the element (information resource) of the information resource set Rs selected from the labeling set A This is because it is considered appropriate to uniformly add the same numerical value to the labels attached to the elements of Rs on the labeling set B when no ranking such as importance exists between them.
[0042]
If there is a difference in importance between the label A1 and the label A2 on the labeling set A, for example, Rs = R (A1 or A2) = {a, b as a set of information resources for searching from the labeling set A , D, e} ("or" is a logical operation symbol meaning "or", and in this case means a set of information resources to which at least one of label A1 or label A2 is attached) At this time, the importance can be assigned to these four information resources according to the importance of the assigned label. Therefore, when calculating the label score on the labeling set B, each information resource is assigned a numerical value with a high or low value according to this importance, and the value assigned to the label attached to the information resource. May be added.
[0043]
Next, the processing operation (information resource score calculation process) of the information resource
In the information resource
[0044]
In step S5 in FIG. 3, it is checked whether all the elements (labels) of L (Rs) have been examined. If there are still labels to be examined, the process proceeds to step S6, and one element is selected from L (Rs). Take it out and let it be λ. In step S7, the label score of λ is added to the score of the information resource other than Rs to which the extracted label λ is attached.
[0045]
In FIG. 5, the label score values of the labels B1, B2, and B4 obtained by the label
Add about. For example, the information resource m has a label B1 and a label B2. The score Sc (m) of the information resource m is obtained by adding the label scores Sc (B1) and Sc (B2) of the label B1 and the label B2 attached thereto. That is, Sc (m) = Sc (B1) + Sc (B2) = 2 + 1 = 3. Similarly, regarding the score of the information resource g, Sc (g) = Sc (B4) = 1 from the label score of the label B4.
[0046]
At this time, if the importance is given to the label, the contribution from each label score can be changed depending on the importance when the information resource score is obtained. For example, a numerical value (for example, “2” is assigned to a higher importance level and “1” is assigned to a lower importance level) assigned to each label according to the importance level. You may make it add, after multiplying with the score of a resource.
For example, if “2” is assigned because label B1 has high importance and “1” is assigned because label B2 has low importance, the score of information resource m is Sc (m) = {Sc (B1) · 2} + {Sc (B2) · 1} = 4 + 1 = 5.
[0047]
The candidate information resource
[0048]
Finally, the candidate information
[0049]
The above has been described assuming that one labeling set is the target of the search. However, in the case of information search across a plurality of labeling sets, basically, the result of information search obtained from the labeling set of each search target Are superimposed (integrated).
[0050]
FIG. 6 conceptually shows a case where information resources are searched from a plurality (for example, four) of labeling sets A to D.
For example, when a search is issued from the labeling set A as described above, the candidate information resource sets Rc (B), Rc (C), and Rc (D) are obtained in the same manner as described above for each of the labeling sets B to D. . At this time, the logical sum of these sets of candidate information resources is calculated, and the information score for the same candidate information resource is added to each labeling set multiplied by a weighting factor given in advance to obtain an integrated score. .
[0051]
Specifically, for example, Rc (B) = {m (3), g (1)}, Rc (C) = {g (2) as candidate information resources from the labeling sets B, C, and D, respectively. , M (1), p (1)}, Rc (D) = {m (2), p (2), e (1)}. However, the numerical value in parentheses of each element (information resource) represents the value of the information resource score. At this time, the logical sum of these candidate information resources is calculated, and the final set of candidate information resources is Rc = {m, g, p, e}. Assuming that KB, KC, and KD are given as the weighting coefficients of the labeling sets B, C, and D, the integrated score of the candidate information resource m is the information resource score in each of the labeling sets B, C, and D. Since it is sufficient to add after multiplying the weighting factor,
Sc (m) = 3 · KB + 1 ·
It becomes. Normally, it can be considered that the weighting factors of each labeling set are all the same, and in this case, the integrated score of each candidate information resource may be a simple sum of the information resource scores calculated in each labeling set. Become.
(Second Embodiment)
FIG. 7 conceptually shows a case where information is retrieved and collected using the information retrieval method of the present invention. The
[0052]
FIG. 8 conceptually shows a case where information search is performed via a network, for example, using the information search apparatus according to the second embodiment of the present invention. The information resource is on the intranet and the Internet, and can be accessed by a plurality of users (for example, two users α and β). In FIG. 8, the information resource is stored in the
[0053]
For example, the user α uses an information search device (hereinafter, simply referred to as a terminal) 421 as a client to label information accessed by the user α. Information relating to the user, information relating to the label created by the user, information relating to the information resource labeled by the user, information relating to the collector storing the information resource, etc. are stored in the
[0054]
FIG. 9 schematically shows a configuration of a main part of an information search apparatus (corresponding to the
[0055]
The information search apparatus shown in FIG. 9 includes a
[0056]
The
[0057]
The
[0058]
The
[0059]
The
[0060]
The transmission /
[0061]
FIG. 10 shows the operation of the information search apparatus of FIG. 9 by displaying a user interface screen (
[0062]
As shown in FIG. 10, in the
[0063]
First, the
Labeling, that is, a process of assigning a user-defined label to a certain information resource is executed by the
[0064]
In the
[0065]
The
[0066]
FIG. 11 shows an example of a basic screen of the
As shown in FIG. 11, labels (“cooking”, “health”, “office”, “photograph”, “Hong Kong movie”, and “article”) created by the user are arranged on the basic screen of the palette.
[0067]
When trying to create a new label, if a
[0068]
Since the user can move the label to an arbitrary position by a drag and drop operation, for example, labels similar in genre (for example, “dish” and “health”) can be collected and grouped.
[0069]
When a user wants to attach a label to an information resource on the
[0070]
If you want to change the label once pasted, enter (or select) the ID of the information resource whose label you want to change in the information resource
[0071]
When it is desired to refer to the list of information resources to which the designated label is pasted, for example, when it is desired to refer to the list of information resources to which the label “Cooking” is pasted, the label “Cooking” is displayed on the
[0072]
When a plurality of labels are selected, a list of information resources to which all the selected labels are attached is presented.
As described in the first embodiment, when the importance level is set to the label, it is desirable to set it on the screen of the
[0073]
In addition to the importance, the label property may include access permission information for limiting the accessible range to the information resource with the label. For example, an information resource with a label that is set as “accessible” as a property can be searched, and an information resource with a label that is set as “not accessible” On the other hand, it is possible to perform an operation such that it cannot be a search target. In addition, as a label property, the labeling set that can be accessed (the information resource can be searched) is limited to the information resource with the label, or conversely, the labeling set that cannot be accessed is specified. You can also do it. As described above, it is desirable to set the property of these labels on the screen by selecting a desired label on the screen of the
[0074]
Next, the collector
In FIG. 14, when a user frequently refers to an information resource labeled with “Hong Kong movies” and “photos” in a labeling set possessed by a certain user, or wants to search for related information, it corresponds. A virtual folder characterized by the logical expression of the label is created, and if it is opened, a list of information resources matching the logical expression of the label is obtained. This virtual folder is called a collector. A logical expression of a label characterizing the collect at that time is called a collector search expression.
[0075]
The collector search
In FIG. 14, the
[0076]
As shown in FIG. 15, when the contents of a certain collector 830 are displayed on the
[0077]
The
[0078]
You can also name collectors. The
[0079]
The main
[0080]
The collector created by the collector
FIG. 12 shows an example of a basic screen of the
[0081]
In the main
[0082]
Based on the operation performed by the user on the main list presented in the main
[0083]
As described in the first embodiment, when the importance level is set for the information resource, it is desirable to set it on the screen of the
[0084]
Further, it may be set in advance that information resources displayed at the top of the main list have higher importance. In FIG. 12, the information resource titled “XXX page” has the highest importance, and the information resource titled “health promotion page” has the lowest importance. In this case, for example, statistics on the usage frequency of the information resource as a collector may be collected as needed, and a high importance may be automatically set for an information resource with a high usage frequency. When presenting a collector, the higher the usage frequency, the higher the main list. In addition, the user may set the importance of the information resource by operating the main list presented in the main
[0085]
Next, the information
In the information
[0086]
When making a search request, as shown in FIG. 14, a search range may be set for the collector.
The
[0087]
In this way, by setting a collector search formula for the collector in advance and executing a search from the
[0088]
The
[0089]
The information search unit 670 has, for example, the same configuration as the information
[0090]
The candidate information resource
Next, referring to FIG. 16, the score calculation of candidate information resources is performed by taking as an example a case where information is searched for another two labeling sets B and C using the
[0091]
For example, in the labeling set A, information resources with a resource ID of dat-03 are labeled with labels A1 and A3, and information resources with a resource ID of dat-10 are labeled with labels A1 and A2. Yes. Hereinafter, similarly, in the notation of the labeling sets A to B in FIG. 16, in order to indicate the label attached to the information resource, a circle is marked at the position where the resource ID and the label intersect.
[0092]
At this time, when the user A generates the
[0093]
In FIG. 16, the circles marked at the positions where the resource IDs of the information resources that match the collector search expression and the labels attached thereto are crossed out are shown in black.
[0094]
In the labeling set B, information resources that hit (that is, match one of the information resources specified by the collector 907) are dat-10 and dat-36, and dat-10 is labeled B1 and B3. And dat-36 is labeled B3. If all the numerical values to be added for each of these labels are “1”, the label score for label B1 is “1” because only dat-10 is hit, and the label scores for label B3 are dat-10 and dat-36. It is “2” because it is a hit.
[0095]
On the other hand, in the labeling set C, information resources that hit (that is, match any of the information resources specified by the collector 907) are dat-10, dat-36, and dat-42, and dat-10. Are labeled C2, C3, dat-36 is labeled B2, C3, C4, and dat-42 is labeled C2. Assuming that all the numerical values to be added for each of these labels are “1”, the label score of label C2 is “3” because dat-10, dat-36, and dat-42 are hit, and the label score of label C3 is dat−. 10. Since dat-36 is hit, it is “2”, and the label score of label C4 is “1” because only dat-10 is hit.
[0096]
A set of candidate information resources retrieved from the labeling set B using the
A set of candidate information resources retrieved from the labeling set C using the
[0097]
In the labeling set B, information resource scores of the candidate information resources dat-20, dat-22, dat-53, and dat-60 are calculated. The information resource score of the information resource dat-20 is the label score “2” of the label B3, the information resource score of the information resource dat-22 is the label score “1” of the label B1, and the information resource score of the information resource dat-53 is The label score “1” of the label B1 and the label score “2” of the label B3 are added to become “3”, and the information resource score of the information resource dat-60 becomes the label score “1” of the label B1. That is, in the labeling set B
The information resource score of dat-20 is “2”
The information resource score of dat-22 is “1”
The information resource score of dat-53 is “3”
The information resource score of dat-60 is “1”
It is.
[0098]
On the other hand, in the labeling set B, information resource scores of the candidate information resources dat-04, dat-19, dat-22, and dat-60 are calculated. The information resource score of the information resource dat-04 becomes the label score “1” of the label C4, and the information resource score of the information resource dat-19 adds the label score “2” of the label C3 and the label score “1” of the label C4. The information resource score of the information resource dat-22 is “5” by adding the label score “3” of the label C2 and the label score “2” of the label C3, and the information resource dat-60 information The resource score is the label score “3” of the label C2. That is, in the labeling set B,
The information resource score of dat-04 is “1”
The information resource score of dat-19 is “3”
The information resource score of dat-22 is “5”
The information resource score of dat-60 is “3”
It is.
[0099]
Next, an integrated score of candidate information resources retrieved from the labeling sets B and C using the
The integrated score of the information resource dat-20 is “2” + “0” = “2”
The integrated score of the information resource dat-22 is “1” + “5” = “6”
The integrated score of the information resource dat-53 is “3” + “0” = “3”
The integrated score of the information resource dat-60 is “1” + “4” = “5”
The integrated score of the information resource dat-04 is “0” + “1” = “1”
The integrated score of the information resource dat-19 is “0” + “3” = “3”
It becomes. A
[0100]
As described above, according to the second embodiment, each user collects arbitrary information resources such as documents and images that can be referred to by a plurality of users on the network based on a free viewpoint, By using the classification information obtained as a result of labeling, unknown information resources related to the information of interest can be efficiently searched and collected via the network.
[0101]
Of course, not only information retrieval via a network but also offline information retrieval is possible. That is, the
[0102]
【The invention's effect】
As described above, according to the present invention, a user can easily search for information related to collected information while organizing information with a high degree of freedom through subjective labeling.
[Brief description of the drawings]
FIG. 1 is a diagram schematically showing a basic configuration of an information search apparatus using an information search method according to a first embodiment of the present invention.
FIG. 2 is a diagram conceptually illustrating a state in which information search is performed between two labeling sets.
FIG. 3 is a flowchart showing processing operations of a label score calculation unit and an information resource
4 is a conceptual diagram for explaining processing (label score calculation processing) from step S2 to step S4 in FIG. 3;
5 is a conceptual diagram for explaining processing (information resource score calculation processing) from step S5 to step S7 in FIG. 3;
FIG. 6 conceptually shows a case where information resources are searched from a plurality (for example, four) of labeling sets A to D, and integrates information search results obtained from the labeling sets of individual search targets. The figure for demonstrating a case.
FIG. 7 is a diagram conceptually showing a case where information is searched and collected using the information search method of the present invention.
FIG. 8 is a diagram conceptually illustrating a case where information search is performed via a network, for example, using an information search apparatus according to a second embodiment of the present invention.
FIG. 9 is a diagram schematically showing a configuration of a main part of an information search device according to a second embodiment of the present invention.
FIG. 10 shows the operation of the information search apparatus of FIG. 9 in a user interface screen presented in the user interface unit (a pallet for displaying a list of information resources related to a label and a palette for manipulating labels and collectors). The figure which showed notionally based on the relationship with the collector mainly used for information retrieval.
FIG. 11 is a diagram showing an example of a pallet screen presented in the user interface unit.
FIG. 12 is a diagram showing an example of a finder presentation screen presented in the user interface unit when creating a collector, showing a case where a search result (candidate list) is not presented.
FIG. 13 is a diagram showing an example of a finder presentation screen presented in the user interface unit when creating a collector, showing a case where a search result (candidate list) is presented.
FIG. 14 is a diagram for explaining a collector used for information retrieval;
FIG. 15 is a display example when the contents of the collector are displayed in the finder.
FIG. 16 is a diagram for specifically explaining score calculation of candidate information resources, taking as an example a case where information search is performed on two other labeling sets B and C using a collector created from the labeling set A; Figure.
FIG. 17 is a diagram schematically illustrating a configuration of a labeling server.
FIG. 18 is a diagram showing a screen display example of a finder having an importance setting area for setting the importance of each information resource.
[Explanation of symbols]
1 ... Information search processing section
10 ... Information resource list acquisition unit for search
20 ... Labeling
30 ... Information search section
31 ... Label score calculation unit
32. Information resource score calculation unit
33 ... Candidate information resource list creation unit
40 ... Candidate information resource presentation section
411 ... Labeling server
412 ... Labeling database
501 ... User interface section
502... Processing unit
503 ... Labeling processing section
504 ... Collector creation processing unit
505 ... Information search processing unit
506: Data storage unit
507 ... Transmitter / receiver
510 ... Label definition part
520 ... Label giving unit
530 ... Collector search formula
540 ... Main list acquisition unit
550 ... Main list operation unit
560 ... Collector selector
570 ... Information search section
580 ... Candidate information resource list presentation unit
610 ... pallet
620 ... Finder
630, 710 ... collector
Claims (13)
情報検索処理手段と、
を備えた情報検索装置における情報検索方法であって、
前記情報検索処理手段が、前記複数のラベリング集合のうちの1つの検索元のラベリング集合内の情報リソースに付与されているラベルを用いて指定されたラベルの論理式を基に、当該検索元のラベリング集合から、該ラベルの論理式にて特徴付けられる1または複数の情報リソースを含む検索用情報リソース群を取得する取得ステップと、
前記情報検索処理手段が、前記記憶手段に記憶されている前記複数のラベリング集合のうちの前記検索元のラベリング集合以外のラベリング集合のなかから、検索対象とする1または複数のラベリング集合を選択するラベリング集合選択ステップと、
前記情報検索処理手段が、前記検索対象のラベリング集合毎に、前記検索用情報リソース群の情報リソースに付されている当該検索対象のラベリング集合中の各ラベルに対し、該検索用情報リソース群と該ラベルとの結びつきを評価する第1の評価値を求めるラベル評価ステップと、
前記情報検索処理手段が、前記検索対象のラベリング集合毎に、当該ラベリング集合中の前記検索用情報リソース群以外の情報リソースのうち、前記検索用情報リソース群の情報リソースに付されている当該検索対象のラベリング集合中のラベルが付されている情報リソースに対し、当該ラベルの前記第1の評価値を用いて、前記検索用情報リソース群との関連の度合いを評価する第2の評価値を求める情報リソース評価ステップと、
前記情報検索処理手段が、前記第2の評価値に基づき、前記検索対象のラベリング集合から、前記検索用情報リソース群に関連する情報リソースを選択する情報リソース選択ステップと、
前記情報検索処理手段が、前記情報リソース選択ステップで選択された情報リソースを呈示するステップと、
を含む情報検索方法。 Storage means for storing a plurality of labeling sets composed of a plurality of information resources characterized by the correspondence between the information resources and the labels assigned to the information resources ;
Information retrieval processing means;
An information search method in an information search device comprising:
The information search processing means is based on a logical expression of a label specified by using a label assigned to an information resource in a labeling set of one search source among the plurality of labeling sets. Obtaining a search information resource group including one or more information resources characterized by a logical expression of the label from a labeling set ;
The information search processing unit selects one or a plurality of labeling sets to be searched from among the labeling sets other than the search source labeling set among the plurality of labeling sets stored in the storage unit. A labeling set selection step;
The information retrieval processing means, each labeling set of the search target, for each label in the labeling set of the search objects are assigned to the information resources of the search information resource group, and the search information resource group A label evaluation step for obtaining a first evaluation value for evaluating a connection with the label;
The search that is attached to the information resource of the search information resource group among the information resources other than the search information resource group in the labeling set for each labeling set of the search target by the information search processing unit For an information resource with a label in the target labeling set, a second evaluation value for evaluating the degree of association with the search information resource group is obtained using the first evaluation value of the label. The required information resource assessment step;
An information resource selection step in which the information search processing means selects an information resource related to the search information resource group from the search target labeling set based on the second evaluation value ;
The information search processing means presenting the information resource selected in the information resource selection step ;
Information retrieval method including
前記複数のラベリング集合のうちの1つの検索元のラベリング集合内の情報リソースに付与されているラベルを用いて指定されたラベルの論理式を基に、当該検索元のラベリング集合から、該ラベルの論理式にて特徴付けられる1または複数の情報リソースを含む検索用情報リソース群を取得する取得手段と、
前記記憶手段に記憶されている前記複数のラベリング集合のうちの前記検索元のラベリング集合以外のラベリング集合のなかから、検索対象とする1または複数のラベリング集合を選択するラベリング集合選択手段と、
前記検索対象のラベリング集合毎に、前記検索用情報リソース群の情報リソースに付されている当該検索対象のラベリング集合中の各ラベルに対し、該検索用情報リソース群と該ラベルとの結びつきを評価する第1の評価値を求めるラベル評価手段と、
前記検索対象のラベリング集合毎に、当該ラベリング集合中の前記検索用情報リソース群以外の情報リソースのうち、前記検索用情報リソース群の情報リソースに付されている当該検索対象のラベリング集合中のラベルが付されている情報リソースに対し、当該ラベルの前記第1の評価値を用いて、前記検索用情報リソース群との関連の度合いを評価する第2の評価値を求める情報リソース評価手段と、
前記第2の評価値に基づき、前記検索対象のラベリング集合から、前記検索用情報リソース群に関連する情報リソースを選択する情報リソース選択手段と、
前記情報リソース選択手段で選択された情報リソースを呈示する呈示手段と、
を具備したことを特徴とする情報検索装置。 Storage means for storing a plurality of labeling sets composed of a plurality of information resources characterized by the correspondence between the information resources and the labels assigned to the information resources ;
Based on the logical expression of the label specified using the label given to the information resource in the labeling set of one search source among the plurality of labeling sets, the label of the label is extracted from the labeling set of the search source . An acquisition means for acquiring an information resource group for search including one or more information resources characterized by a logical expression ;
Labeling set selection means for selecting one or more labeling sets to be searched from among the labeling sets other than the search source labeling set among the plurality of labeling sets stored in the storage means;
For each label set to be searched, for each label in the search target label set attached to the information resource of the search information resource group , evaluation of the connection between the search information resource group and the label Label evaluation means for obtaining a first evaluation value to be performed;
For each labeling set to be searched, among the information resources other than the information resource group for search in the labeling set, a label in the labeling set of the search target attached to the information resource of the information resource group for search Information resource evaluation means for obtaining a second evaluation value for evaluating the degree of association with the information resource group for search using the first evaluation value of the label for the information resource to which
Information resource selection means for selecting an information resource related to the search information resource group from the labeling set to be searched based on the second evaluation value;
Presenting means for presenting the information resource selected by the information resource selecting means ;
An information retrieval apparatus comprising:
情報リソースと該情報リソースに付与したラベルとの対応関係にて特徴づけられる複数の情報リソースからなる複数のラベリング集合を記憶する記憶手段、
前記複数のラベリング集合のうちの1つの検索元のラベリング集合内の情報リソースに付与されているラベルを用いて指定されたラベルの論理式を基に、当該検索元のラベリング集合から、該ラベルの論理式にて特徴付けられる1または複数の情報リソースを含む検索用情報リソース群を取得する取得手段、
前記記憶手段に記憶されている前記複数のラベリング集合のうちの前記検索元のラベリング集合以外のラベリング集合のなかから、検索対象とする1または複数のラベリング集合を選択するラベリング集合選択手段、
前記検索対象のラベリング集合毎に、前記検索用情報リソース群の情報リソースに付されている当該検索対象のラベリング集合中の各ラベルに対し、該検索用情報リソース群と該ラベルとの結びつきを評価する第1の評価値を求めるラベル評価手段、
前記検索対象のラベリング集合毎に、当該ラベリング集合中の前記検索用情報リソース群以外の情報リソースのうち、前記検索用情報リソース群の情報リソースに付されている当該検索対象のラベリング集合中のラベルが付されている情報リソースに対し、当該ラベルの前記第1の評価値を用いて、前記検索用情報リソース群との関連の度合いを評価する第2の評価値を求める情報リソース評価手段、
前記第2の評価値に基づき、前記検索対象のラベリング集合から、前記検索用情報リソース群に関連する情報リソースを選択する情報リソース選択手段、
前記情報リソース選択手段で選択された情報リソースを呈示する呈示手段、
として機能させるためのプログラムを記録した機械読み取り可能な記録媒体。 Computer
Storage means for storing a plurality of labeling sets composed of a plurality of information resources characterized by the correspondence between the information resources and the labels assigned to the information resources ;
Based on the logical expression of the label specified using the label given to the information resource in one labeling set of the search source of the plurality of labeling sets, the label of the label is extracted from the search source labeling set. An acquisition means for acquiring a search information resource group including one or more information resources characterized by a logical expression ;
Labeling set selection means for selecting one or a plurality of labeling sets to be searched from among the labeling sets other than the search source labeling set among the plurality of labeling sets stored in the storage means;
For each label set to be searched, for each label in the search target label set attached to the information resource of the search information resource group , evaluation of the connection between the search information resource group and the label Label evaluation means for obtaining a first evaluation value
For each labeling set to be searched, among the information resources other than the information resource group for search in the labeling set, a label in the labeling set of the search target attached to the information resource of the information resource group for search Information resource evaluation means for obtaining a second evaluation value for evaluating the degree of association with the information resource group for search using the first evaluation value of the label for the information resource to which
Information resource selection means for selecting an information resource related to the search information resource group from the labeling set to be searched based on the second evaluation value;
Presenting means for presenting the information resource selected by the information resource selecting means;
A machine-readable recording medium in which a program for functioning as a computer is recorded.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29215198A JP3847977B2 (en) | 1998-10-14 | 1998-10-14 | Information search method, information search device, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29215198A JP3847977B2 (en) | 1998-10-14 | 1998-10-14 | Information search method, information search device, and recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000123033A JP2000123033A (en) | 2000-04-28 |
JP3847977B2 true JP3847977B2 (en) | 2006-11-22 |
Family
ID=17778209
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP29215198A Expired - Fee Related JP3847977B2 (en) | 1998-10-14 | 1998-10-14 | Information search method, information search device, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3847977B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4213360B2 (en) | 2001-05-15 | 2009-01-21 | 株式会社東芝 | Knowledge accumulation support system and reply message processing method in the same system |
JP4040849B2 (en) | 2001-07-16 | 2008-01-30 | 株式会社東芝 | Knowledge accumulation support system and message transfer method in the same system |
JP4850368B2 (en) * | 2001-09-12 | 2012-01-11 | 富士通株式会社 | Content management apparatus and content management method |
-
1998
- 1998-10-14 JP JP29215198A patent/JP3847977B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000123033A (en) | 2000-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7139974B1 (en) | Framework for managing document objects stored on a network | |
Terveen et al. | Constructing, organizing, and visualizing collections of topically related web resources | |
US7111232B1 (en) | Method and system for making document objects available to users of a network | |
US7480669B2 (en) | Crosslink data structure, crosslink database, and system and method of organizing and retrieving information | |
JP4721740B2 (en) | Program for managing articles or topics | |
US7548914B2 (en) | System and method for providing active tags | |
US7797287B2 (en) | User interface for navigating a keyword space | |
US7158971B1 (en) | Method for searching document objects on a network | |
US20180004850A1 (en) | Method for inputting and processing feature word of file content | |
US20060195461A1 (en) | Method of operating crosslink data structure, crosslink database, and system and method of organizing and retrieving information | |
KR100337810B1 (en) | Search dedicated website and search method on Internet | |
JP2007102767A (en) | Information processor | |
JP5425906B2 (en) | Access to research tools based on detection of research sessions | |
Amento et al. | Experiments in social data mining: The TopicShop system | |
US20070192305A1 (en) | Search term suggestion method based on analysis of correlated data in three dimensions | |
Suh et al. | Semi-automatic photo annotation strategies using event based clustering and clothing based person recognition | |
WO2006089137A1 (en) | Crosslink data structure, crosslink database, and system and method of organizing and retrieving information | |
JP2009500764A (en) | Information retrieval method and apparatus reflecting information value | |
Khusro et al. | Tag clouds: past, present and future | |
Jayawardana et al. | A personalized information environment for digital libraries | |
JP4076194B2 (en) | Information sharing device | |
KR100557874B1 (en) | Method of scientific information analysis and media that can record computer program thereof | |
JP3847977B2 (en) | Information search method, information search device, and recording medium | |
JP5447484B2 (en) | Information processing device | |
JP2004240887A (en) | Retrieval information display system, retrieval keyword information display method and retrieval keyword information display program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060523 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060724 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060822 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060824 |
|
LAPS | Cancellation because of no payment of annual fees |