JP2004038811A - 文献検索方法、文献検索装置、文献検索プログラム並びにそのプログラムを記録した記録媒体 - Google Patents

文献検索方法、文献検索装置、文献検索プログラム並びにそのプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2004038811A
JP2004038811A JP2002198016A JP2002198016A JP2004038811A JP 2004038811 A JP2004038811 A JP 2004038811A JP 2002198016 A JP2002198016 A JP 2002198016A JP 2002198016 A JP2002198016 A JP 2002198016A JP 2004038811 A JP2004038811 A JP 2004038811A
Authority
JP
Japan
Prior art keywords
document
search
user
profile
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002198016A
Other languages
English (en)
Inventor
Sen Yoshida
吉田  仙
Kaname Funakoshi
船越  要
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002198016A priority Critical patent/JP2004038811A/ja
Publication of JP2004038811A publication Critical patent/JP2004038811A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】利用者がネットワークを介し、複数の文献データベースを検索する際に、利用者にとって有益な文献がより多く含まれるようにする。
【解決手段】文献データベース220を備えた文献検索エージェント200を、それぞれ利用者対応に設置する。文献検索エージェントは、文献データベースプロファイル211として、当該文献データベースに対応する利用者に対する各分野における信頼度を多次元ベクトルで表現した数値データを保持し、利用者端末装置100から、検索要求を受け取ると、文献データベースプロファイル211について、該検索要求との類似度を計算し、類似度の高い文献データベースプロファイルに対応する他文献検索エージェントに検索要求を送り、該文献検索エージェントからの検索結果を当該利用者端末装置へ送付する。
【選択図】    図2

Description

【0001】
【発明の属する技術分野】
本発明は、利用者がネットワークなどを介して他の利用者達が持つ文献データベース群を検索する技術に係り、詳しくは、他の利用者の得意分野と嗜好を考慮した文献検索方法、文献検索装置、文献検索プログラム並びにそのプログラムを記録した記録媒体に関する。
【0002】
なお、文献は情報流通の最小単位で、図書雑誌記事、新聞記事、絵画、音楽、メール、ウェブページ、技術資料などが含まれる。文献情報は、文献を同定する情報で、例えば図書の場合、著者名、表題、出版地、出版社、出版年などが、また電子的に流通されるものであればURLなどが含まれる。分野は文献の内容を分類して命名したもので、例えばキーワードも含まれる。
【0003】
【従来の技術】
従来の文献データベース群から文献を検索する方式では、各文献データベースがネットワーク上の文献検索サーバ内に置かれている。文献検索クライアントは、文献データベースの集合の中から特定の性質を満たす文献を検索しようとしている利用者から、該利用者が望む文献の性質を文献の属する分野を数値で表した多次元ベクトルで表現した検索要求を受け取り、一般に複数存在する文献検索サーバの中からいくつかを選んで当該検索要求を渡す。文献検索サーバは、文献検索クライアントから検索要求を受け取ると、当該文献検索サーバが備える文献データベースに対し、該検索要求を用いて検索を行い、得られた文献集合を要求元の文献検索クライアントに送る。文献検索クライアントは、検索要求を渡した文献検索サーバ群から送られた検索結果を統合し、当該検索要求と共に利用者に提示する。
【0004】
ここで、文献検索クライアントが検索要求を渡す文献検索サーバを選ぶ際、各文献サーバ内の文献データベースに格納されている文献群にどういう分野のものが多いかを多次元ベクトルで表した文献データベースプロファイルを用いて、検索要求の多次元ベクトルに類似する多次元ベクトルを持っ文献データベース群を選択し、これら文献データベース群を有する各文献サーバに検索要求を送る。
【0005】
以下に、文献データベース群から文献を検索する従来の代表的な方式における文献検索クライアントと文献検索サーバについて詳述する。
文献検索クライアントには、他の文献データベース達の文献データベースプロファイルがあらかじめ登録されている。従来の文献データベースプロファイルでは、当該文献データベースの中に蓄積されている文献群にどういう分野のものが多いかを多次元ベクトルで表したものが用いられ、例えば、当該文献群の全文献を一つの文献とみなすことによって作成している。文献検索クライアントは、当該文献検索クライアントが対応している利用者から、該利用者が望む文献の性質を文献の属する分野を数値で表した多次元ベクトルで表現した検索要求を受け取ると、登録されている全ての文献データベースプロファイルに対して、検索要求との類似度を計算する。その結果、類似度の高かった文献データベースプロファイルに対応する文献データベースを有する文献検索サーバに、当該検索要求を送信する。
【0006】
一方、文献検索サーバの各文献データベースには、文献群の文献情報及び文献プロファイルが蓄積されている。文献プロファイルとは、該文献の属する分野を数値で表した多次元ベクトルである。なお、このように、文献プロファイルや検索要求において、文献の属する分野を多次元ベクトルで表現する方法は、ベクトル空間モデル(vector space model)と呼ばれ、情報検索の一般的な技術である。
【0007】
文献検索サーバは、ある文献検索クライアントから検索要求を受信すると、文献データベースの中の全ての文献プロファイルに対して、当該検索要求との類似度を計算する。その結果、類似度の高かった文献プロファイルに対応する文献情報を、検索要求元の文献検索クライアントに送信する。文献検索クライアントは、各文献検索サーバからの検索結果を受け取って統合し、当該検索要求と共に利用者に提供する。
【0008】
【発明が解決しようとする課題】
上記文献データベース群から文献を検索する従来技術には、次のような問題がある。
(1) 従来の文献検索方式では、検索対象となる文献群はネットワーク上の文献検索サーバの中に置かれる。このため、利用者は、ある文献を検索対象にしようとするときには、それをネットワークを介して文献検索サーバに渡さなければならない。これは手間になるうえ、検索対象にしようとしている文献が個人的な事柄に関係するようなときには、プライバシーの面で利用者に不安やためらいを生じさせる。
(2) 従来の文献検索方式における文献データベースプロファイルは、当該文献データベースプロファイルに相当する文献データベースに格納されている文献群について、どのような分野に属する文献が多いかを表したものである。しかし、文献には質の良いものとそうでないものがあるうえ、利用者には文献に関してそれぞれの嗜好があり、ある分野に関して文献検索を行おうとしている利用者に関して、ある文献が当該分野に属しているからといって必ずしも当該利用者が望む文献であるとは限らない。しかしながら、従来の文献検索方式は、検索要求を渡す文献サーバを選ぶ際に、検索対象となる文献の質や利用者の嗜好を考慮していない。
【0009】
本発明の目的は、上述の従来技術を解決し、下記のような文献検索を実現することにある。
(1) 検索対象となる文献群は、ネットワーク上の文献検索サーバの中でなく、各利用者に対して設置される装置(以下、文献検索エージェント)の中に置いて、文献をネットワークを介して文献検索サーバに渡すことなく検索対象とすることができるようにする。
(2) それぞれ文献が置かれる文献検索エージェント群の中から検索要求を渡す文献検索エージェントを選ぶ際に、検索対象となる文献の質や、その文献が当該利用者の嗜好等に合うものかどうかも考慮して行い、利用者にとって有益な文献が、より多く含まれるようにする。
【0010】
【課題を解決するための手段】
本発明では、従来の文献検索クライアントの機能と文献検索サーバの機能を併せ持つ文献検索エージェントを、各利用者に対して設置する。文献データベースは、それぞれこの文献検索エージェント内に置かれる。
【0011】
ある文献検索エージェント内の文献データベースには、当該利用者が読んだり書いたりした文献が格納される。これにより、文献をネットワークを介してサーバに渡すことなく検索対象とすることができる。また、当該文献データベース内に格納される文献群は、当該利用者の興味や嗜好等を反映したものとなっており、これは同時に当該利用者と興味や嗜好等が似ている利用者にとって有益な文献が多く含まれていることを意味する。
【0012】
また、本発明では、文献データベースプロファイルとして、当該文献検索エージェントに対応する利用者の、他の利用者に対する各分野における信頼度を多次元ベクトルで表現したものを用いる。各文献検索エージェントには、該文献データベースプロファイルが、各文献検索エージェントが備える文献データベース(各利用者)に対応する分、登録されている。
【0013】
要求元の文献検索エージェントは、検索要求の送り先を決める際に、該検索要求と登録されている各文献データベースプロファイルの類似度を計算し、類似度の高かった文献データベースプロファイルに対応する利用者の文献検索エージェントに当該検索要求を送る。検索要求を受け取った各文献検索エージェントは、自分が具備する文献データベースを検索し、検索結果を要求元の文献検索エージェントに返送する。要求元の文献検索エージェントは、検索要求を送信した各文献検索エージェントからの検索結果を統合し、利用者に提供する。
【0014】
本発明によれば、ある分野に関して検索を行おうとしている利用者にとって、当該分野について当該利用者と嗜好の傾向が似ているなどの理由で信頼のおける他利用者の文献検索エージェントに検索要求が送信され、したがって、検索結果には検索しようとしている利用者にとって有益な文献がより多く含まれるようになる。
【0015】
【発明の実施の形態】
以下、本発明の実施例について図面を用いて説明する。
図1は本発明の実施の形態を示すシステム図である。図1において、100は利用者端末装置、200は文献検索装置としての文献検索エージェント、300はインターネット、イントラネット、RAN等のネットワークである。文献検索エージェント200は、各利用者(ここでは1〜N)の利用者端末装置100に対して設置され、それぞれネットワーク300により接続されている。各文献検索エージェント200はそれぞれ文献データベースを備え、当該利用者が読んだり書いたりした文献が格納されている。
【0016】
文献検索エージェント200は、当該利用者端末装置100から、当該利用者が望む文献の性質を該文献の属する分野を数値で表わした多次元ベクトルで表現した検索要求を受け取ると、該分野について当該利用者と興味や嗜好等が似ているなどの理由で、望ましい検索結果を返すことが期待される他利用者等の文献検索エージェント200に対して検索要求を送る。検索要求を受け取った各文献検索エージェント200は、当該文献検索エージェント200が備える文献データベースを検索し、検索結果を要求元の文献検索エージェント200に返す。要求元の文献検索エージェント200は、検索要求を送信した各文献検索エージェント200から返えされた検索結果を統合し、検索要求とともに当該利用者端末装置100へ送り、利用者へ提供する。
【0017】
図2は文献検索エージェント200の一実施例を示す詳細ブロック図である。図2において、文献検索エージェント200は、検索要求入力部201、検索要求送信部202、検索結果受信部203、文献情報提供部204、検索要求受信部205、検索結果送信部206、類似度計算部207、208、文献データベースプロファイル登録部210、文献データベース220、利用者プロファイル登録部230などから構成される。なお、類似度計算部207,208は一つのもので兼用してもよい。
【0018】
文献データベースプロファイル登録部210は、各文献検索エージェント(各利用者)の文献データベース達のプロファイル(文献データベースプロファイル)211を蓄積している。本発明では、文献データベースプロファイル211として、各文献検索エージェントの文献データベース対応に、当該文献検索エージェントの利用者iの、当該文献データベースに対応する利用者jに対する各分野における信頼度を多次元ベクトルで表現したものを用いる。後述するように、この文献データベースプロファイル211は、利用者プロファイル登録部230が保持する当該文献検索エージェントの利用者のプロファイル(利用者プロファイル)231を利用して作成される。
【0019】
文献データベース220は、当該文献検索エージェントの利用者が読んだり書いたりした文献群の文献情報221及びその文献プロファイル222を蓄積している。文献プロファイル222は、当該文献の属する分野を数値で表わした多次元ベクトルである。先に述べたように、文献プロファイルや検索要求について、文献の属する分野を多次元ベクトルで表現する方法は、ベクトル空間モデルと呼ばれ、情報検索の一般的な技術である(例えば、文献1:Ricardo Baeza−Yates and Berthier Ribeiro−Neto.“Modern Information Retrieval”,Addison−Wesley,1999)。
【0020】
利用者プロファイル登録部230は、当該文献検索エージェント200の利用者のプロファイル(利用者プロファイル)231を蓄積している。ここで、当該文献検索エージェントの利用者をiとすると、その利用者プロファイルWは、次のような行列で表わされる。
【数1】
Figure 2004038811
ここで、Nuserは利用者数、Ntermは対象とする分野数である。要素W jkは、利用者iの、他の利用者jに対する分野kの信頼度を意味する。利用者プロファイルWを〔数1〕のように表現する方法は、すでに提案される(例えば、文献2:特開2001−34625号公報,文献3:船越要,大黒毅“利用者の得意分野を考慮した内容に基づく協調フィルタリング”電子情報通信学会論文誌,Vol.J83−D−I,No.11,pp.1224−1227,2000)。
【0021】
利用者プロファイル登録部230では、最初、利用者プロファイルWの各要素の初期値を、例えば、すべて同一の値で与えるか、乱数で与えるかして設定する。また、初期の段階で検索性能が非常に悪くなる問題を克服するためには、例えば、利用者iの興味を表す分野(キーワード)の多次元ベクトルが初期化ベクトルυ∈R termとして与えられたならば、すべてのj(1≦j≦Nuser)に対して、w jk=υ と初期化すればよい(文献3)。
【0022】
その後、利用者プロファイル登録部230は、利用者端末装置100から、利用者iが検索要求に対して提供された文献を評価した評価結果のフィードバックを受けて、逐次、利用者プロファイルWを更新する。例えば、利用者iが文献を高く評価したならば、当該文献を既に高く評価していた利用者jに対してw jkが上昇される。また、利用者iが文献を低く評価したならば、当該文献を高く評価していたすべての利用者jに対してw jkが減少される(文献2、文献3)。
【0023】
文献データベースプロファイル登録部210に蓄積される文献データベースプロファイル211は、利用者プロファイル登録部230が保持する利用者プロファイルWiから次のように作成される。すなわち、文献データベースj(利用者j)の文献データベースプロファイルdはWの第j行の各成分から成るベクトル
【数2】
Figure 2004038811
で表わされる。文献データベースプロファイル登録部210では、逐次、利用者プロファイル登録部230から最新の利用者プロファイルWを受け取り、その各行に当該文献データベース(利用者)に対応する文献検索エージェントの宛先を追加したものを文献データベースプロファイル211として蓄積しておく。
【0024】
次に、図2の文献検索エージェント200の動作について説明する。動作は、当該利用者端末装置100から検索要求が入力された場合と、他の文献検索エージェントから検索要求が送られてきた場合に大別される。
【0025】
図3は、当該利用者端末装置100から検索要求が入力された場合の処理フローチャートを示す。
検索要求入力部201は、当該文献検索エージェント200の利用者(利用者iとする)から、当該利用者端末装置100を通して、該利用者iが望む文献の性質を文献の属する分野を数値で表わした多次元ベクトルの検索要求を受け取ると、類似度計算部207に渡す(S1)。ここで、検索要求qは
【数3】
Figure 2004038811
で表わされる。
【0026】
類似度計算部207は、文献データベースプロファイル登録部210に登録されている文献データベースプロファイル211について、検索要求との類似度を計算する(S2)。ここで、検索要求q=(q、‥・、q term)と文献データベースプロファイルdの間の類似度sは、二つの多次元ベクトルの内積として次のように計算される。
【数4】
Figure 2004038811
【0027】
類似度計算部207では、検索要求入力部201から検索要求qを受け取ると、文献データベースプロファイル登録部10に蓄積されている全ての文献データベースプロファイルd・・・、d termに対して、類似度s、…、s termを計算し、類似度の高かった文献データベースプロファイルに対応する文献検索エージェントの宛先と、当該検索要求を検索要求送信部202に渡す。
【0028】
検索要求送信部202は、ネットワーク300を通し、類似度計算部207から渡された宛先の文献検索エージェント群(類似度の高かった文献データベースプロファイルに対応する文献データベースの文献検索エージェント群)に、当該検索要求を送信する(S3)。なお、この文献検索エージェント群に、当該文献検索エージェント200が含まれている場合には、検索要求送信部202は、内部信号線を介して自分の検索要求受信部205にも当該検索要求を送る。
【0029】
検索結果受信部203は、上記検索要求送信部202から検索要求を送信した他文献検索エージェント群からの検索結果を受信し、文献情報提供部204に送る(S4)。文献情報提供部204は、検索結果受信部203から送られた検索結果を統合し、検索要求入力部201からの当該検索要求と共に利用者端末装置100に送り、利用者に提供する(S5)。
【0030】
なお、検索要求送信部202が内部信号線を介して自分の検索要求受信部205にも当該検索要求を送った場合、検索結果送信部206から文献情報提供部204に対して、当該文献検索エージェント200の検索結果が送られてくる。この場合、文献情報提供部204では、検索要求受信部2053からの検索結果と検索結果送信部206からの検索結果を統合し、当該検索要求と共に利用者端末装置100へ送ることになる。
【0031】
利用者(ここでは利用者i)は、提示された検索結果を評価し、必要ならその評価結果を利用者端末装置100から当該文献検索エージェント200へ送る。先に述ベたように、文献検索エージェント200の利用者プロファイル登録部230が、当該利用者iの評価結果を受け取り、利用者プロファイルWを更新する。
【0032】
図4は、他文献検索エージェントから検索要求が送られてきた場合の処理フローチャートを示す。
検索要求受信部205は、ネットワーク300を通じ、他文献検索エージェントから送られてきた検索要求を受信し、類似度計算部208に渡す(S11)。なお、検索要求受信部205は、検索要求送信部202から内部信号線を介して当該利用者iの検索要求が送られてきた場合、その検索要求を類似度計算部208に渡す。
【0033】
類似度計算部208は、文献データベース220の中の全ての文献プロファイル222に対して検索要求との類似度を計算する(S12)。その結果、文献情報221の中から、類似度の高かった文献プロファイルに対応する文献情報が選択される。検索結果送信部206は、この類似度の高かった文献プロファイルに対応する文献情報を検索結果として検索要求元の文献検索エージェントに送信する(S13)。なお、検索要求送信部202から検索要求受信部205に対し、当該利用者iの検索要求が送られてきた場合には、検索結果送信部206は、当該文献検索エージェントの検索結果を当該文献情報提供部204へ送ることになる。
【0034】
次に本発明による文献検索の具体例を示す。例として、A氏(利用者i)の利用者プロファイルWは、次のように表現されるとする。
【数5】
Figure 2004038811
【0035】
ここでは、各利用者は上からA氏、B氏、C氏、D氏、E氏とし、分野は左から分野1、分野2、分野3、分野4、分野5とする。なお、A氏のA氏自身に対する要素(信頼度)の値は全分野において0.2である。着目すべきことは、A氏の利用者プロファイルでは、A氏は、D氏に対しては分野1に関して高い信頼度を持っており、E氏に対しては分野3に関して高い信頼度を持っている点である。
【0036】
一方、検索要求は二つの検索要求q、rとし、それぞれ次のように表現されるとする。
q =(1.0,0.5,0.0,1.0,0.5)
r =(0.0,0.5,1.0,1.0,0.5)
【0037】
検索要求qは、分野1と分野4に強く関係し、分野2と分野5に多少関係する文献を要求していることを表す。検索要求rは、分野3と分野4に強く関係し、分野2と分野5に多少関係する文献を要求していることを表す。先にも述べたように、このように検索要求を多次元ベクトルで表現する方法は、ベクトル空間モデルと呼ばれ、情報検索における一般的な方法である。検索要求の多次元ベクトルは、例えば検索要求を表す文章を形態素解析し単語の頻度を数えることによって得られる。
【0038】
検索要求qとrは、分野1と分野3の含みかたが逆であるという点のみが異なる。分野1に関してはA氏はE氏よりもD氏に対して高い信頼度を持っているので、検索要求qについては、D氏の文献データベースのほうがE氏の文献データベースよりも優先的に送信されることが望ましい。逆に分野3に関してはA氏はD氏よりもE氏に対して高い信頼度を持っているので、検索要求rについてはE氏の文献データベースのほうがD氏の文献データベースよりも優先的に送信されることが望ましい。
【0039】
検索要求と文献データベースプロファイルの類似度を計算すると、検索要求qではD氏の文献データベースが3.5、E氏の文献データベースが1.0となり、D氏の文献データベースのほうがE氏の文献データベースよりも優先的に送信される。また、検索要求rではD氏の文献データベースが1.5、E氏の文献データベースが4.0となり、E氏の文献データベースのほうがD氏の文献データベースよりも優先的に送信される。
【0040】
以上本発明の一実施の形態について説明したが、なお、図2で示した装置における各部の一部もしくは全部の処理機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行して本発明を実現することができること、あるいは、図3、図4で示した処理手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータに実行させることができることは言うまでもない。また、コンピュータでその処理機能を実現するためのプログラム、あるいは、コンピュータにその処理手順を実行させるためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えば、FDや、MO、ROM、メモリカード、CD、DVD、リムーバブルディスクなどに記録して、保存したり、提供したりすることができるとともに、インターネット等のネットワークを通してそのプログラムを配布したりすることが可能である。
【0041】
【発明の効果】
本発明によれば、以下のような効果を奏する。
(1) 文献をネットワークを介して文献検索サーバに渡すことなく検索対象にすることができる。
(2) ある分野に関して検索を行おうとしている利用者にとって、当該分野について当該利用者と嗜好の傾向が似ているなどの理由で信頼のおける他利用者の文献データベースに検索要求が送信され、検索結果には検索しようとしている利用者にとって有益な文献がより多く含まれるようになる。
【図面の簡単な説明】
【図1】本発明の実施の形態を示すシステム図である。
【図2】本発明の文献検索装置としての文献検索エージェントの一実施例の構成図である。
【図3】当該利用者からの検索要求入力時の処理フロー図である。
【図4】他文献検索エージェントからの検索要求受信時の処理フロー図である。
【符号の説明】
100 利用者端末装置
200 文献検索エージェント
300 ネットワーク
201 検索要求入力部
202 検索要求送信部
203 検索結果受信部
204 文献情報提供部
205 検索要求受信部
206 検索結果送信部
207,208 類似度計算部
211 文献データベースプロファイル
221 文献情報
222 文献プロファイル
231 利用者プロファイル

Claims (7)

  1. 各利用者端末装置に対応して設置され、それぞれ文献データベースを備えた複数の文献検索エージェントの間で、ネットワークを通して検索要求、検索結果を送受信する文献検索方法であって、
    前記文献検索エージェントは、
    各文献検索エージェントが備える文献データベースの文献データベースプロファイルとして、該文献検索エージェントの利用者の、当該文献データベースに対応する利用者に対する各分野における信頼度を多次元ベクトルで表現した数値データを保持し、
    当該利用者端末装置から、利用者が望む文献の性質を該文献の属する分野を数値で表現した多次元ベクトルの検索要求を受け取り、前記文献データベースプロファイルについて、前記検索要求との類似度を計算し、類似度の高い文献データベースプロファイルに対応する文献検索エージェントに前記検索要求を送り、前記検索要求を送った文献検索エージェントからの検索結果を受信して統合し、当該利用者端末装置へ送付する、
    ことを特徴とする文献検索方法。
  2. 請求項1記載の文献検索方法において、
    文献検索エージェントは、他文献検索エージェントから検索要求を受信すると、該検索要求を用いて、当該文献検索エージエントが備える文献データベースを検索し、検索結果を検索要求元の文献検索エージェントへ送信することを特徴とする文献検索方法。
  3. 請求項1記載の文献検索方法において、
    文献検索エージェントは、該文献検索エージェントの利用者の、他の各利用者に対する各分野に関する信頼度を多次元ベクトルの行列で表現した利用者プロファイルを保持し、該利用者プロファイルを用いて文献データベースプロファイルを作成することを特徴とする文献検索方法。
  4. 利用者端末装置に対応して設置され、ネットワークを通して、他の文献検索装置との間で検索要求、検索結果を送受信する文献検索装置であって、
    文献情報及び当該文献情報の属する分野を数値で表した多次元ベクトルの文献プロファイルを蓄積する文献データベースと、
    各文献検索装置が備える文献ブースベースの文献データベースプロファイルとして、該文献検索装置の利用者の、当該文献データベースに対応する利用者に対する各分野における信頼度を多次元ベクトルで表現した数値データを保持する手段と、
    前記利用者端末装置から、利用者が望む文献の性質の属する分野を数値で表現した多次元ベクトルの検索要求を受け取り、前記保持された文献データベースプロファイルについて、前記検索要求との類似度を計算し、類似度の高い文献データベースプロファイルに対応する文献検索装置に前記検索要求を送信する手段と、
    前記検索要求を送った文献検索装置からの検索結果を受信して統合し、前記利用者端末装置へ送付する手段と、
    他文献検索装置から検索要求を受信すると、前記蓄積された文献プロファイルについて、前記検索要求との類似度を計算し、類似度の高い文献プロファイルに対応する文献情報を検索結果として検索要求元の文献検索装置へ送信する手段と、
    を有することを特徴とする文献検索装置。
  5. 請求項4記載の文献検索装置において、
    当該利用者の、他の各利用者に対する各分野に関する信頼度を多次元ベクトルの行列で表現した利用者プロファイルを保持する手段と、該利用者プロファイルを用いて文献データベースプロファイルを作成する手段とを有することを特徴とする文献検索装置。
  6. 請求項1乃至3記載の文献検索方法をコンピュータで実行するための文献検索プログラム。
  7. 請求項1乃至3記載の文献検索方法をコンピュータで実行するための文献検索プログラムを記録した記録媒体。
JP2002198016A 2002-07-05 2002-07-05 文献検索方法、文献検索装置、文献検索プログラム並びにそのプログラムを記録した記録媒体 Pending JP2004038811A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002198016A JP2004038811A (ja) 2002-07-05 2002-07-05 文献検索方法、文献検索装置、文献検索プログラム並びにそのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002198016A JP2004038811A (ja) 2002-07-05 2002-07-05 文献検索方法、文献検索装置、文献検索プログラム並びにそのプログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2004038811A true JP2004038811A (ja) 2004-02-05

Family

ID=31705590

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002198016A Pending JP2004038811A (ja) 2002-07-05 2002-07-05 文献検索方法、文献検索装置、文献検索プログラム並びにそのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2004038811A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006048511A (ja) * 2004-08-06 2006-02-16 Nippon Telegr & Teleph Corp <Ntt> リソース検索方法およびリソース検索システム
WO2006123399A1 (ja) * 2005-05-17 2006-11-23 Mitsubishi Denki Kabushiki Kaisha メタデータ管理装置
CN113704408A (zh) * 2021-08-31 2021-11-26 工银科技有限公司 检索方法、装置、电子设备、存储介质和程序产品

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006048511A (ja) * 2004-08-06 2006-02-16 Nippon Telegr & Teleph Corp <Ntt> リソース検索方法およびリソース検索システム
JP4494901B2 (ja) * 2004-08-06 2010-06-30 日本電信電話株式会社 リソース検索方法およびリソース検索システム
WO2006123399A1 (ja) * 2005-05-17 2006-11-23 Mitsubishi Denki Kabushiki Kaisha メタデータ管理装置
CN113704408A (zh) * 2021-08-31 2021-11-26 工银科技有限公司 检索方法、装置、电子设备、存储介质和程序产品

Similar Documents

Publication Publication Date Title
US10275419B2 (en) Personalized search
US10031975B2 (en) Presentation of search results based on the size of the content sources from which they are obtained
US9342563B2 (en) Interface for a universal search
US8117212B2 (en) Information processing apparatus and method, program and recording medium
JP5705497B2 (ja) 異なるソースからのサーチエンジン結果を1つのサーチ結果へと混合する方法及びシステム
KR101016683B1 (ko) 검색 결과를 제공하기 위한 시스템 및 방법
US20080222105A1 (en) Entity recommendation system using restricted information tagged to selected entities
JP5727512B2 (ja) 検索提案のクラスタ化及び提示
US8392395B2 (en) Determining advertising placement on preprocessed content
US20090043749A1 (en) Extracting query intent from query logs
US20100153215A1 (en) Enhanced search result relevance using relationship information
US8166028B1 (en) Method, system, and graphical user interface for improved searching via user-specified annotations
US20070250501A1 (en) Search result delivery engine
US20060206475A1 (en) System and method for generating attribute-based selectable search extension
US20070162396A1 (en) Determining Advertising Placement on Preprocessed Content
US9529861B2 (en) Method, system, and graphical user interface for improved search result displays via user-specified annotations
KR20140128443A (ko) 관련 엔티티들
US20070150457A1 (en) Enabling One-Click Searching Based on Elements Related to Displayed Content
Zahera et al. Query recommendation for improving search engine results
KR20140091530A (ko) 소셜 네트워크 피쳐들을 갖는 이름 및 기타 검색 질의의 적합도
KR20110009198A (ko) 최다 클릭된 다음 객체들을 갖는 검색 결과
JP4371382B2 (ja) アクセス対象情報検索装置
US20070150483A1 (en) Network Service for Providing Related Content
US20070150468A1 (en) Preprocessing Content to Determine Relationships
US8086948B2 (en) Framework for the dynamic generation of a search engine sitemap XML file