JP2000105764A - 情報フィルタリングシステム - Google Patents

情報フィルタリングシステム

Info

Publication number
JP2000105764A
JP2000105764A JP10273501A JP27350198A JP2000105764A JP 2000105764 A JP2000105764 A JP 2000105764A JP 10273501 A JP10273501 A JP 10273501A JP 27350198 A JP27350198 A JP 27350198A JP 2000105764 A JP2000105764 A JP 2000105764A
Authority
JP
Japan
Prior art keywords
user
user profile
information
document information
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10273501A
Other languages
English (en)
Other versions
JP3759321B2 (ja
Inventor
Toshiko Aizono
敏子 相薗
Yasutsugu Morimoto
康嗣 森本
Hiroyuki Kaji
博行 梶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP27350198A priority Critical patent/JP3759321B2/ja
Publication of JP2000105764A publication Critical patent/JP2000105764A/ja
Application granted granted Critical
Publication of JP3759321B2 publication Critical patent/JP3759321B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ユーザに、最新の興味に関する文書情報と共
に、継続した興味に関する文書情報をも参照させること
を可能にした情報フィルタリングシステム。 【解決手段】 フィルタリングサーバ1は、文書選別部
1001、ユーザプロファイル作成・格納部1002及
びユーザプロファイル管理部1003から構成される。
文書選別部1001は、情報サーバからの文書情報10
05を受信して、ユーザプロファイル格納エリア100
4に格納してあるユーザプロファイルと照合し、一致度
が高いユーザプロファイルに対応するユーザのユーザ端
末にその文書情報を送信する。ユーザプロファイル作成
・格納部1002は、ユーザが適合と判定した文書情報
1007とユーザプロファイルとに基づいて新たにユー
ザプロファイルを派生して作成し、ユーザプロファイル
格納エリア1004に格納する。これにより、1ユーザ
が複数のユーザプロファイルを有することになり、ユー
ザは、継続している興味に関する文書情報のランクを下
げずに新しい興味に関する文書情報をも参照することが
できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報フィルタリン
グシステムに係り、特に、通信回線を介して提供される
多種多様で多数の情報の中からユーザの興味に合った情
報を選択してユーザに提供する情報フィルタリングシス
テムに関する。
【0002】
【従来の技術】近年、パーソナルコンピュータの普及及
びインターネットの拡大に伴い、ユーザに提供可能な電
子化された文書の量が飛躍的に増加している。その一方
で、膨大な量の情報の中からユーザが必要とするものを
直接見つけ出すことが非常に手間のかかる作業となって
いる。このような情報選択の作業を軽減するための技術
として、新聞社等が生成・蓄積する大量の文書情報から
ユーザの興味にあったものを選別し送信する情報フィル
タリングと呼ばれる技術がある。
【0003】情報フィルタリングを実現するシステム
は、一般に、大量の情報を生成・発信・蓄積する情報サ
ーバと、情報を選別してユーザに送信するフィルタリン
グサーバと、ユーザが情報を参照するユーザ端末から構
成される。この種の情報フィルタリングシステムに関す
る従来技術として、例えば、特開平9−101990号
公報等に記載された技術が知られている。
【0004】この従来技術は、ユーザが興味のある分野
名を指定したり、キーワードを入力するなどしてユーザ
プロファイルと呼ばれる情報を生成しておき、フィルタ
リングサーバが、情報サーバが持つ大量の情報の中から
ユーザプロファイルに合ったもののみ選別して、ユーザ
端末に送信するというものである。ユーザは、これによ
り、自分の興味のある情報のみを取得することができ、
効率的に情報を参照することができる。
【0005】前述の情報フィルタリング技術は、ユーザ
に配信される情報とユーザの実際の興味との適合率を向
上させるために、レリバンスフィードバックと呼ばれる
方法と併用されることが多い。レリバンスフィードバッ
クとは、配信した情報がユーザの興味と適合しているか
否か(レリバンス)をユーザに判定させて、その結果を
ユーザプロファイルにフィードバックさせるものであ
る。
【0006】レリバンスフィードバックに関する技術の
一例として、例えば、Chris BuckleyとGerald Saltonに
よる「Optimization of relevance feedback weights」
(Proceedings of the 18th Annual International ACM
SIGIR Conference on research and Development in In
formation Retrieval, pp.351-357, New York, July199
5, ACM.)に記載されたタームベクトルを用いる手法が
ある。この手法は、ユーザプロファイルに記載されたキ
ーワードに重みを与えてベクトルとして表現し、さら
に、文書情報も重要な単語を要素とするベクトルとして
表現しておき、フィードバックにおいて、元のユーザプ
ロファイルのベクトルに、適合と判定された文書情報の
ベクトルを加え、さらに関連のない文書のベクトルを引
くことにより、ユーザの興味にもっとも適合するように
ユーザプロファイルを更新していく手法である。
【0007】この従来技術によれば、ユーザプロファイ
ル中に出現するキーワードのうちユーザが適合と判定し
た文書情報中に出現するものがあればその重みが大きく
なり、また、ユーザが適合と判定した文書情報中の重要
な単語がユーザプロファイルに追加されるので、ユーザ
プロファイルをユーザの最新の興味に対応させて更新す
ることが可能となる。
【0008】
【発明が解決しようとする課題】前述した従来技術によ
るレリバンスフィードバックは、ユーザプロファイルを
ユーザの最新の興味に対応させて更新することができる
一方で、変更を加える前のユーザプロファイルに表現さ
れた興味をそのまま持ち続けているユーザにとって、送
信される文書情報とユーザの興味との適合性が低下して
しまうという問題点を有している。すなわち、レリバン
スフィードバックは、ユーザが適合と判定した文書情報
に基づいてユーザプロファイルを更新し、元のユーザプ
ロファイルを変更してしまうので、ユーザが元のユーザ
プロファイルに表現されていた興味をそのまま持ってい
る場合、元の興味に合った文書情報を受け取ることがで
きなくなるという問題点を有している。以下、ユーザの
興味の変化について説明し、問題点について詳細に説明
する。
【0009】ユーザが興味のある興味Aからそれと全く
異なる興味Bへ突然変化することは、一般的には希であ
る。むしろ、ユーザの興味は、ある興味Aからそれに関
連する興味Bへ徐々に変化することの方が多いであろ
う。その変化には、大きく次の2つの種類があると考え
られる。(1)興味全体の変化:興味Aからそれに関連
する興味Bへ変化し、もはや興味Aには関心を持たない
場合、(2)興味の派生:興味Aに関連する興味Bを持
つようになったが依然として興味Aにも関心を持ってい
る場合である。
【0010】前述した従来技術によるレリバンスフィー
ドバックは、一般に、(1)の場合に対応したユーザプ
ロファイルの更新に適している。そして、レリバンスフ
ィードバックは、ユーザが適合と判定した文書情報に基
づいてユーザプロファイルを更新し元のユーザプロファ
イルと置き換えてしまうため、(2)のように興味が変
化しても依然として元の興味をそのまま持ち続けている
ユーザにとって、元の興味に関する記述が更新されてし
まうという問題点を生じることになる。
【0011】例えば、当初「半導体」の技術動向や新製
品情報に興味を持っていたユーザが、「アメリカの半導
体メーカが円高のために日本から部品が調達できず半導
体の価格を上げた」という文書情報を参照して、半導体
の価格が円高に影響されることを知り、それ以後、円高
に関する情報、例えば、今後の円高動向等に興味を持っ
たとする。このとき、ユーザが「海外の半導体メーカが
円高のために日本から部品が調達できず半導体の価格を
上げた」という文書情報を適合と判定すると、レリバン
スフィードバックは、前記文書情報から「円高」、「部
品」、「価格」などのキーワードを抽出してユーザプロ
ファイルに追加する。その結果、フィルタリングサーバ
は、「半導体」に関する文書情報のうち、さらに「円
高」にも言及している文書情報があれば、その文書情報
を、「半導体」の技術動向のみに関する文書情報よりも
高いランクで送信するようになる。このようなユーザプ
ロファイルに基づいた情報のフィルタリングは、ユーザ
が依然として「半導体」の技術動向に関しても高い興味
を持つ場合適切とは言えない。
【0012】本発明の目的は、前述した従来技術による
レリバンスフィードバックを併用する情報フィルタリン
グ技術の問題点を解決し、常に、ユーザの興味に最も適
合したユーザプロファイルを作成して情報の選択を行う
ことを可能にした情報フィルタリングシステムを提供す
ることにある。
【0013】
【課題を解決するための手段】前述した従来技術の問題
点は、ユーザプロファイルに興味Aとそれから派生した
興味Bを同時に表現しようとしていることから生じてい
ると言える。この問題点を解決するため、本発明は、1
ユーザが複数のユーザプロファイルを保持可能な情報フ
ィルタリングシステムを構成する。また、本発明は、あ
る1ユーザに関し、ユーザが適合と判定した文書情報に
基づいて新たにユーザプロファイルを作成し、ユーザプ
ロファイル間の関係を格納・管理することにより、前述
した従来技術に記載の元の興味に関するユーザプロファ
イルの記述が更新されてしまうというレリバンスフィー
ドバックの問題点の解決を図る。さらに、本発明は、ユ
ーザプロファイル間の関係に基づいて選別した文書情報
を関連付ける文書選別を行うようにするにより、ユーザ
の興味の変化に対応した文書情報の表示を行うようにし
ている。
【0014】すなわち、本発明によれば前記目的は、情
報サーバと、フィルタリングサーバと、ユーザ端末とを
備え、フィルタリングサーバが情報サーバから取得した
情報を選別してユーザ端末に送信する情報フィルタリン
グシステムにおいて、前記フィルタリングサーバが、1
ユーザに対するユーザプロファイルを複数保持し、複数
のユーザプロファイルに基づいて情報の選別を行うこと
により達成される。
【0015】また、前記目的は、前記フィルタリングサ
ーバが、ユーザによる文書情報の適合判定結果に基づい
て新たにユーザプロファイルを作成することにより、ま
た、1ユーザに関する複数のユーザプロファイルを関係
付けて格納管理することにより、さらに、1ユーザに関
する複数のユーザプロファイル間の関係に基づいて選別
した文書情報を関連付けることにより達成される。
【0016】また、前記目的は、前記フィルタリングサ
ーバが、1ユーザに関する複数のユーザプロファイル及
びそれらの間の関係をユーザの興味の変化に合わせて変
更することにより、また、ユーザが適合と判定した文書
情報と元のユーザプロファイルとに基づいてユーザプロ
ファイルを派生させて新たにユーザプロファイルを作成
することにより、さらに、ユーザが適合と判定した文書
情報との一致度が高い他のユーザのユーザプロファイル
に基づいて新たにユーザプロファイルを作成することに
より達成される。
【0017】また、前記目的は、前記フィルタリングサ
ーバが、ユーザが適合と判定した文書の割合によってユ
ーザプロファイル間の関係を変更することにより、ま
た、1ユーザの類似しているユーザプロファイルをマー
ジすることにより、また、ユーザによって適合と判定さ
れる割合が低いユーザプロファイルを破棄することによ
り達成される。
【0018】さらに、前記目的は、前記フィルタリング
サーバが、ユーザが適合と判定した文書情報の中のユー
ザプロファイルに一致しない部分を抽出し、その一致し
ない部分を含む文書情報を収集して、それら文書情報と
元のユーザプロファイルとの一致度が低い場合、ユーザ
プロファイルを派生させて作成することにより、また、
ユーザが適合と判定した文書情報が過去における文書情
報と類似していない場合に、ユーザプロファイルを派生
させて作成することにより達成される。
【0019】以下、前述した本発明の構成において必要
な各構成要素について説明する。
【0020】ユーザプロファイルの作成 本発明は、直接ユーザプロファイルを変更せずに別のユ
ーザプロファイルを作成するため、(I)ユーザが適合
と判定した文書情報と元のユーザプロファイルとに基づ
いて新たなユーザプロファイルを派生させて新たにユー
ザプロファイルを作成する方法、(II)ユーザが適合と
判定した文書情報との一致度が高い他のユーザのユーザ
プロファイルに基づいて新たにユーザプロファイルを作
成する方法を用いる。
【0021】ユーザプロファイルの派生によるユーザプ
ロファイルの作成 元のユーザプロファイルから派生させてユーザプロファ
イルを作成する方法を、(1)元のユーザプロファイル
から派生させて新たにユーザプロファイルを作成するか
否を判定する処理と、(2)派生させると判定された場
合、ユーザが適合と判定した文書情報と元のユーザプロ
ファイルとの差分を抽出してユーザプロファイルを記述
する処理とにより構成する。
【0022】ここで、ユーザが適合と判定した文書情報
からユーザプロファイルを派生させるか否か判定する処
理について説明する。ユーザプロファイル作成手段は、
次に示す3つの処理のいずれかによって、ユーザが適合
と判定した文書情報からユーザプロファイルを派生させ
るか否か判定する。すなわち、(a)ユーザが適合と判
定した文書情報中のユーザプロファイルに一致しない部
分を抽出してユーザの新たな興味を表す情報とし、当該
新たな興味に関する文書情報を収集して、それら文書情
報と元のユーザプロファイルとの一致度を計算し、一致
度が低ければ、ユーザの新規な興味が元のユーザプロフ
ァイルに表現されている興味と異なるものであるとし
て、ユーザプロファイルを派生させる。あるいは、
(b)ユーザが適合と判定した文書情報が過去における
適合文書情報と類似していなければ、その時点において
新規と認められる文書情報であるとして、ユーザプロフ
ァイルを派生させる。あるいは、(c)上記条件のうち
いずれかを満たし、かつ、ユーザプロファイルの派生を
ユーザが承認すればユーザプロファイルを派生させる。
それ以外の場合、通常のレリバンスフィードバックと同
様にユーザプロファイルを更新する。このようなユーザ
プロファイルを作成するか否かの判定により、元のユー
ザプロファイルから派生させるユーザプロファイルの数
を抑制することができる。
【0023】他のユーザのユーザプロファイルに基づく
ユーザプロファイルの作成 他のユーザのユーザプロファイルに基づくユーザプロフ
ァイル作成は、(あ)ユーザが適合と判定した文書情報
との一致度が高い他のユーザのユーザプロファイルがあ
るか否かを判定する処理、(い)一致度が高い他のユー
ザのユーザプロファイルがある場合に、他のユーザのユ
ーザプロファイルを複製する処理、(う)複製したユー
ザプロファイルをユーザが適合と判定した文書情報を用
いて従来のレリバンスフィードバックの手法で更新して
新たなユーザプロファイルとする処理の3つの処理から
構成される。このように、他のユーザのユーザプロファ
イルを利用することにより、新たなユーザプロファイル
を容易に作成することが可能となる。
【0024】前述した2つのユーザプロファイルの作成
方法により作成したユーザプロファイルを用いて情報の
フィルタリングを行うことにより、ユーザは、継続して
持っている興味に関する文書情報を高いランクで参照す
ることができる。すなわち、前述した具体例では、ユー
ザは、「半導体」に関する文書情報と、特に「円高」に
関する文書情報とを継続して共に参照することができ
る。
【0025】ユーザプロファイルの格納 ユーザプロファイルの格納は、複数のユーザプロファイ
ル相互間の関係を格納することにより、ユーザプロファ
イルに表現された興味相互間の関係を保存することが可
能となる。
【0026】文書選別 文書選別は、ユーザプロファイルに基づいて選別した文
書情報のうち新たに作成したユーザプロファイルに一致
する文書情報を、元のユーザプロファイルに一致する文
書情報の関連情報として提示して行われる。例えば、
「半導体」に関する文書情報に関連する文書情報として
「円高」に関する文書情報をユーザに提示する。これに
より、ユーザは、興味の変化に対応させて文書情報を参
照することができ、文書情報間の関係を容易に把握する
ことができる。
【0027】ユーザプロファイルの管理 1ユーザが保持する複数のユーザプロファイル相互間の
関係をユーザの興味の変化に対応させて変更するため、
本発明は、次の3つの方法を用いる。すなわち、(ア)
ユーザが適合と判定した文書の割合によってユーザプロ
ファイル間の関係を変更する方法、(イ)類似している
ユーザプロファイルをマージする方法、(ウ)ユーザに
よって適合と判定される割合が低いユーザプロファイル
を破棄する方法である。以下、これらの3つのユーザプ
ロファイルの管理方法について説明する。
【0028】ユーザプロファイル間の関係の変更による
ユーザプロファイルの管理 ユーザが元の興味から派生した興味の方により重点を置
くようになると、元のユーザプロファイルの関連プロフ
ァイルとしてユーザプロファイル間の関係を保存するこ
とは適切ではなくなる。すなわち、前述した文書選別に
より、より重点を置いている派生した興味に関する文書
情報が元の文書情報の関連情報として表示されてしま
う。これに対して本発明は、ユーザプロファイル間の派
生関係をユーザの適合判定結果に基づいて変更するよう
にユーザプロファイルの管理を行う。具体的には、ユー
ザの適合判定結果を利用して、派生関係を持つユーザプ
ロファイルのうち、ユーザが適合と判定する文書情報の
割合がより高いユーザプロファイルを優先する。これに
より、元の興味から新たな興味が派生した場合のみでな
く、派生関係にある興味の重要度が変化した場合にも、
ユーザの興味に対応した文書情報を選別して送信するこ
とができる。
【0029】前述した具体例を用いて説明すると、前述
の具体例において、「円高」に関する文書情報をユーザ
が適合と判定する率が高くなれば、前述の管理手段は、
「半導体」に関するユーザプロファイルを、「円高」に
関するユーザプロファイルに従属するものとして変更す
る。これにより、ユーザは、「円高」に関連した文書情
報として「半導体」の技術動向に関する文書情報を参照
することができる。
【0030】ユーザプロファイルのマージによるユーザ
プロファイルの管理 既存の複数の興味が変化してほとんど同一の興味になる
という状況が考えられる。このような場合、類似した興
味に対応するユーザプロファイルが複数あると、情報フ
ィルタリングのコストがかかるばかりではなく、ユーザ
にとっても、似たような文書情報が多数送信されるため
に参照が面倒となる。このため、本発明は、類似してい
るユーザプロファイルがあれば、それらのユーザプロフ
ァイルをマージしてユーザプロファイルの数を低減させ
るようにユーザプロファイルの管理を行う。これによ
り、より効率的な情報フィルタリングが可能となる。
【0031】ユーザプロファイルの破棄によるユーザプ
ロファイルの管理 ユーザがユーザプロファイルに表現された興味を失う
と、そのユーザプロファイルに基づいて選別された文書
情報はユーザにとってノイズとなる。このため、本発明
は、ユーザプロファイルをユーザの適合判定結果に基づ
いて破棄するようにユーザプロファイルの管理を行う。
具体的には、ユーザの適合判定結果を利用して、ユーザ
が適合と判定する文書情報の割合が低いユーザプロファ
イルがあれば、そのユーザプロファイルを破棄する。こ
れにより、ユーザの興味の喪失に対応した、ノイズの少
ない文書情報の選別、送信が可能となる。
【0032】
【発明の実施の形態】以下、本発明による情報フィルタ
リングシステムの実施形態を図面により詳細に説明す
る。
【0033】図1は本発明の一実施形態による情報フィ
ルタリングシステムの全体構成を示すブロック図、図2
は情報フィルタリングシステムを構成する装置のハード
ウェア構成を示すブロック図、図3はフィルタリングサ
ーバのモジュール構成を示すブロック図、図4はユーザ
プロファイル格納エリアに格納されるユーザプロファイ
ルの構成を説明する図、図5はフィルタリングサーバが
送受信する文書情報の例を説明する図、図6は複数のユ
ーザプロファイルにより選別された文書情報の例を説明
する図、図7はユーザ端末からフィルタリングサーバに
送信する適合文書情報の例を説明する図である。図1〜
図3において、1はフィルタリングサーバ、2はユーザ
端末、3は情報サーバ、10はCPU、20はハードデ
ィスク、30はメモリ、40はディスプレイ、41はデ
ィスプレイ制御部、50はキーボード、51はキーボー
ド制御部、60はマウス、61はマウス制御部、70は
通信制御部、80はバス、1001は文書選別部、10
02はユーザプロファイル作成・格納部、1003はユ
ーザプロファイル管理部、1004はユーザプロファイ
ル格納エリア、1005は文書、1006は選別文書、
1007は適合文書である。
【0034】情報フィルタリングシステムの全体構成 本発明の一実施形態による情報フィルタリングシステム
は、図1に示すように、情報サーバ3と、フィルタリン
グサーバ1と、ユーザ端末2とが通信ネットワークに接
続されて構成される。情報サーバ3は、新聞記事等の情
報を生成・蓄積して、その文書情報をフィルタリングサ
ーバ1に送信する装置であり、新聞社の文書データベー
スサーバなどに相当する。フィルタリングサーバ1は、
ユーザの興味を表現したユーザプロファイルをユーザ端
末2を利用するユーザに対応させて格納しており、情報
サーバ3から送信された文書情報を受信して、格納して
あるユーザプロファイルと照合し、一致度の高いユーザ
プロファイルがあればその文書情報をユーザ端末2に送
信する。このフィルタリングサーバ1は、新聞社のサー
ビスサーバやコンピュータネットワーク上のサービスプ
ロバイダに相当する。ユーザ端末2は、フィルタリング
サーバ1から配信された情報をユーザに表示する装置で
あり、家庭、オフィスにおけるサービスのフロントエン
ドに相当する。前述したサーバ1、3、端末2の各装置
は、ネットワークを介して情報を送受信する。
【0035】装置のハードウェア構成 情報フィルタリングシステムを構成する情報サーバ3、
フィルタリングサーバ1及びユーザ端末2の各装置のハ
ードウェアの構成は基本的に同一であり、図2に示すよ
うに、CPU10、ハードディスク20、メモリ30、
ディスプレイ40、ディスプレイ制御部41、キーボー
ド50、キーボード制御部51、マウス60、マウス制
御部61、通信制御部70、及び、バス80を備えて構
成される。但し、各装置は、前述の各構成部の仕様の詳
細が装置の機能によって異なることが一般的である。例
えば、情報サーバ3は、文書等の情報を大量に格納する
ことが多いので、ハードディスク20が大型であること
が多い。
【0036】前述した情報サーバ3、フィルタリングサ
ーバ1及びユーザ端末2のうち、本発明は、特に、フィ
ルタリングサーバ1及びユーザ端末2に関する。よっ
て、まず、フィルタリングサーバ1のソフトウェア構成
の詳細について説明する。
【0037】フィルタリングサーバ フィルタリングサーバ1は、図3に示すように、文書選
別部1001、ユーザプロファイル作成・格納部100
2及びユーザプロファイル管理部1003の3つのモジ
ュールから構成される。文書選別部1001は、情報サ
ーバ3からの文書情報1005を受信して、ユーザプロ
ファイル格納エリア1004に格納してあるユーザプロ
ファイルと照合し、一致度が高いユーザプロファイルが
あればそのユーザプロファイルに対応するユーザのユー
ザ端末2に、高い一致度が得られた文書情報を送信す
る。また、文書選別部1001は、選別した文書情報1
006をユーザプロファイル間の派生関係に基づいて関
連付ける処理を行う。ユーザプロファイル作成・格納部
1002は、ユーザが適合と判定した文書情報1007
とユーザプロファイルとに基づいて新たにユーザプロフ
ァイルを作成して、ユーザプロファイル格納エリア10
04に格納する。ユーザプロファイル管理部1003
は、プロファイル間の関係を管理する。
【0038】前述の3つのモジュールの機能を実現する
ため、ハードディスク20には、ユーザプロファイルを
格納するユーザプロファイル格納エリア1004を有す
る。また、フィルタリングサーバ1は、情報サーバ3ま
たはユーザ端末2と、文書1005、選別文書100
6、及び適合文書1007を送受信する。
【0039】次に、フィルタイリングサーバのハードデ
ィスク内に構成されるユーザプロファイル格納エリア1
004の構成及び送受信する情報の例を説明する。
【0040】ユーザプロファイル格納エリア 図4に示すユーザプロファイル格納エリア1004の構
成の一例において、図4(a)はあるユーザプロファイ
ルから他のユーザプロファイルが派生される前の状態
を、図4(b)は他のユーザプロファイルが派生した後
の状態を、また、図4(c)はユーザプロファイル間の
派生関係が変更された後の状態を示している。図4に示
すように、ユーザプロファイル格納エリア1004は、
ユーザプロファイルのID10041、分類1004
2、キーワード10043、キーワードの重み1004
4、ユーザプロファイルが選別した文書情報とユーザの
興味との適合率10045、オリジナルのユーザプロフ
ァイルのID10046、関連ユーザプロファイルのI
D10047、及び、そのプロファイルにマッチする文
書情報を送信するユーザID10048から構成され
る。分類10042、キーワード10043及びキーワ
ードの重み10044は、文書情報を選別するための情
報である。分類10042には、文書情報の属する分野
名や情報の発信元の名称等の条件を格納する。キーワー
ド10043には、単語を、その重み10044にはキ
ーワードの重要度を格納する。
【0041】本発明の実施形態では、重みの値として0
から1までの連続値をとるものとしている。適合率10
045には、そのユーザプロファイルに基づいて選別し
て送信した文書情報のうちユーザに適合と判定された割
合を示す最新の数値を格納する。また、オリジナルのユ
ーザプロファイルID10046には、そのユーザプロ
ファイルを作成する元となったユーザプロファイルのI
Dを格納する。関連のユーザプロファイルID1004
7には、そのユーザプロファイルを元として作成したユ
ーザプロファイルのIDを格納する。これらIDのフィ
ールドには、複数のユーザプロファイルのIDを格納す
ることが可能である。ユーザID10048は、そのユ
ーザプロファイルに適合する文書情報を送信するユーザ
のIDを格納する。
【0042】図4(a)に示すユーザプロファイル作成
前の状態の例において、第1行目には、分類「産業面」
に出現する文書情報で、「半導体」と「生産」とを含む
文書情報を選別するための、ユーザID「00012」
を持つユーザのユーザプロファイル(プロファイルID
「1」)が格納されている。このユーザプロファイル
は、オリジナルあるいは関連のするユーザプロファイル
が記載されていないので、このユーザプロファイルから
派生したユーザプロファイルがない、あるいは、このユ
ーザプロファイルが他のユーザプロファイルから派生し
たユーザプロファイルでないことが判る。
【0043】図4(b)の第4行目には、分類「経済
面」に出現する文書情報で、「円高」と「貿易」とを含
む文書情報を選別するための、ユーザID「0001
2」を持つユーザのユーザプロファイル(プロファイル
ID「173」)が格納されている。この行のオリジナ
ルユーザプロファイルIDの欄には、ユーザプロファイ
ルID「1」が記載されている。このことは、このユー
ザプロファイルがID「1」のユーザプロファイルから
派生したものであることを示している。これに対応して
ID「1」のユーザプロファイルが格納されている第1
行目には、関連ユーザプロファイルIDとして「17
3」が格納されている。
【0044】前述したように、ユーザプロファイル間の
派生関係は、派生の元となったユーザプロファイル及び
派生したユーザプロファイルのそれぞれにおいて、対応
するユーザプロファイルのIDを格納することによって
管理され、1ユーザが複数のユーザプロファイルを持つ
ことができる。このユーザプロファイル間の派生関係
は、各プロファイルの適合率によって修正される。修正
された状態を示しているの図4(c)である。図4
(c)において、図4(b)で示した派生関係、すなわ
ち、ID「1」のユーザプロファイルからID「17
3」のユーザプロファイルが派生したという関係が修正
され、図4(c)の第1行目には、ID「1」のユーザ
プロファイルは、ID173のユーザプロファイルから
派生したという関係が格納されている。すなわち、図4
(b)と図4(c)とにおける、ID「1」のプロファ
イルとID「173」のプロファイルとの派生関係が逆
転させられている。
【0045】フィルタリングサーバが送受信する文書情
報 フィルタリングサーバ1が情報サーバ3から受信する文
書情報1005の一例を図5に示している。図5に示す
例は、「A社、半導体をアメリカで生産。A社は、……
…」という内容の文書情報である。情報サーバ3から
は、図5に示すような例に限らず、あらゆる分類にわた
る多種多様の多数の文書情報がフィルタリングサーバ1
に送信されてくる。フィルタリングサーバ1は、構成の
ような多数の文書情報の中から、図4により説明したユ
ーザプロファイルに適合した文書情報をユーザ毎に選別
して、対応するユーザ端末2に送信する。
【0046】図6にはフィルタリングサーバ1が図4に
より説明したユーザプロファイルに基づいて選別し、ユ
ーザ端末2に送信する選別文書情報1006の一例を示
している。図6(a)はあるユーザプロファイルから他
のユーザプロファイルが派生される前の状態でユーザプ
ロファイルにマッチして選別された文書情報の一例であ
り、この例は、図4(a)におけるユーザID「000
12」を持つユーザのユーザプロファイルにマッチして
選別された文書情報の例である。図6(b)、図6
(c)は新たなユーザプロファイルが派生した後の状態
のユーザプロファイルにより選別された文書情報の一例
を示す。さらに詳細にいえば、図6(b)は図4(b)
におけるユーザID「00012」を持つユーザのユー
ザプロファイルにマッチして派生したユーザプロファイ
ル(ID「173」)の元となったユーザプロファイル
(ID「1」)にマッチした文書情報の例であり、図6
(c)は派生したユーザプロファイル(ID「17
3」)にマッチした文書情報の例である。
【0047】図6に示す各選別文書情報の下部には、そ
の文書情報にマッチしたユーザプロファイルのID、そ
の一致度、そのユーザプロファイルが派生した元となる
オリジナルのユーザプロファイルがあればそのID、あ
るいは、そのユーザプロファイルから派生したユーザプ
ロファイルがあればそのID等の付加情報が記述され
る。なお、本発明の実施形態では、前述の付加情報を図
面の見やすさのため図の中に明示しているが、一般に、
これらの付加情報は、文書情報、選別文書情報及び適合
文書情報の属性情報として埋め込まれて送信される。
【0048】図7に示す適合文書情報1007の一例
は、ユーザがユーザ端末2で受信した文書情報を閲覧し
て、適合判定の結果を返送してきた場合の文書情報の例
であり、文書情報「半導体「値上げ必至」 米国に……
…」をユーザが適合と判定したことを示している。その
ため、図の文書情報の下部には、その文書情報にマッチ
したユーザプロファイルのID及びユーザプロファイル
との一致度に加えて、ユーザによる適合判定の結果が付
加情報として記述されている。図示の例では、この文書
情報に一致するユーザプロファイルのIDはID「1」
であり、ユーザによる適合判定の結果が「適合」である
ことが示されている。
【0049】次に、前述した本発明の実施形態における
フィルタリングサーバ1を構成する各モジュールの処理
動作を図8〜図16に示すフローチャートを参照して説
明する。
【0050】フィルタリングサーバの文書選別部の処理 図8は情報サーバ1から送信された1つの文書情報に対
してユーザプロファイルを用いて選別する処理の手順を
説明するフローチャートであり、まず、このフローを参
照して文書選別部1001の処理手順について説明す
る。この処理は、情報サーバ1から文書情報が送信され
るたびに繰り返される。
【0051】フィルタリングサーバ1は、情報サーバ3
から文書情報を受信すると、文書情報と一致するユーザ
プロファイルがあるか否かをチェックし、一致するもの
がなければ何も行うことなく処理を終了する(ステップ
101)。ステップ101で文書情報に一致するユーザ
プロプロファイルがあると判定すれば、そのユーザプロ
ファイルの関連ユーザプロファイルがあるか否かチェッ
クする(ステップ102)。ステップ102で、関連ユ
ーザプロファイルがあると判定した場合、受信した文書
情報に関連するユーザプロファイルのユーザプロファイ
ルIDの情報を付加する(ステップ103)。ステップ
103の処理後の文書情報をユーザ端末に送信する。ま
た、ステップ102で、関連ユーザプロファイルがない
と判定された場合、受信した文書情報をそのまま送信す
る(ステップ104)。
【0052】前述したステップ101の文書情報とユー
ザプロファイルとの一致度のチェック処理は、いくつか
の従来技術によって実現することが可能である。そのう
ち、本発明の実施形態は、最も一般的と考えられる「ベ
クトル空間モデル法」を用いることとする。「ベクトル
空間モデル法」は、まず、情報サーバから送信された文
書情報から単語を抽出し、その文書情報内での単語の出
現頻度とその単語が出現した文書数とに基づいて、より
特定の文書情報でかつより大きい頻度で出現した単語の
重みが大きくなるように重みを計算し、文書情報を単語
とその重みとを要素とするベクトルとして表現し、次
に、ユーザプロファイルをユーザプロファイルの中のキ
ーワードとその重みとを要素とするベクトルとして考
え、ユーザプロファイルのベクトルと文書情報のベクト
ルとがなす角の余弦を一致度とするという方法である。
具体的には、次に数1として示す式により上記ユーザプ
ロファイルと文書情報との一致度を求めることができ
る。
【0053】
【数1】
【0054】ユーザプロファイルと文書情報との一致度
がある閾値を超えれば文書情報とユーザプロファイルと
が一致していると考え、その値を文書情報とユーザプロ
ファイルとの一致度とする。さらに、一致度は、選別文
書情報をユーザに提示するときの文書情報のランク付け
に利用される。すなわち、選別された文書情報の一致度
を比較して、一致度の高い文書情報から順にユーザに提
示することにより、ユーザの文書情報の参照を支援する
ことができる。
【0055】次に、前述した図4、図6の例を参照し
て、前述した文書選別部1001の処理の一例を説明す
る。
【0056】図6(a)は、すでに説明したように、図
4(a)に示すユーザID「00012」を持つユーザ
のユーザプロファイルを用いて選別された文書情報の一
例として「半導体「値上げ必至」 米国に………」を示
している。図6(a)の中の下部には一致したユーザプ
ロファイルのIDとその一致度が記述されており、それ
ぞれID「1」と「0.75」であることが判る。図4
(a)に示すユーザプロファイル格納エリアを参照する
と、第1行目に記載されているID「1」のユーザプロ
ファイルは、オリジナル及び関連するユーザプロファイ
ルの情報がないため、この文書情報は、前述した処理に
おけるステップ103の関連情報の追加がスキップされ
てユーザ端末2に送信される。
【0057】関連するユーザプロファイルがない文書情
報である図6(a)の例に対して、図6(b)及び図6
(c)は、関連するユーザプロファイルがある例であ
る。詳細には、図6(b)はその文書情報と一致したユ
ーザプロファイルから派生したユーザプロファイルがあ
る例、図6(c)はその文書情報と一致したユーザプロ
ファイルにオリジナルのユーザプロファイルがある例で
ある。この2つの文書情報は、図4(b)に示す状態の
ユーザプロファイル格納エリアに格納されたユーザプロ
ファイルを用いて上記文書選別処理を実行した結果の例
である。
【0058】図6(b)に示す文書情報「D社、半導体
生産を増強………」は、図の下部にも示すようにID
「1」のユーザプロファイルに一致し、その一致度は
0.9である。図4(b)を参照すると、ID「1」の
ユーザプロファイルは第1行目に格納されている。この
ユーザプロファイルは、関連するユーザプロファイルと
してID173のユーザプロファイルがあることが判
る。このため、前述した文書選別処理におけるステップ
103で、関連情報としてID173のユーザプロファ
イルが関連ユーザプロファイルであることが文書情報に
追加される。図6(b)の下部に示す「(関連ユーザプ
ロファイル:173)」が追加された関連情報である。
【0059】これに対して、図6(c)に示す文書情報
「円高に追い付かぬ………」は、図の下部に示すように
ID「173」のユーザプロファイルに一致し、その一
致度が0.95であり、さらに関連情報としてそのオリ
ジナルのユーザプロファイルID「1」があることが判
る。これは、前述した文書選別処理におけるステップ1
03の処理で、ID「173」のユーザプロファイルに
はその派生の元となったユーザプロファイルがあること
を図4(b)第4行目により検出して、そのID「1」
を関連情報として追加したことによる。
【0060】フィルタリングサーバのユーザプロファイ
ル作成・格納部の処理 図9はユーザプロファイル作成・格納部1002の全体
の処理手順を説明するフローチャート、図10は差分情
報抽出処理の詳細を説明するフローチャート、図11は
ユーザプロファイル派生判定処理の詳細を説明するフロ
ーチャート、図12はユーザプロファイル派生処理の詳
細を説明するフローチャートであり、次に、ユーザプロ
ファイル作成・格納部1002の処理手順を図9〜図1
2に示すフローを参照して説明する。
【0061】ユーザプロファイル作成・格納部全体の処
理 図9に示すように、ユーザプロファイル作成・格納部1
002は、ユーザが適合と判定した文書情報とユーザプ
ロファイルとの差分情報を抽出し(ステップ201)、
抽出した差分情報を用いて関連する他のユーザプロファ
イルを派生させるか否かを判定する(ステップ20
2)。ステップ202で、他のユーザプロファイルを派
生させる必要がないと判定した場合、そのまま処理を終
了し、他のユーザプロファイルを派生させるのであれ
ば、差分情報を用いてユーザプロファイルを派生させて
作成し、そのユーザプロファイルをユーザプロファイル
格納エリアに格納する(ステップ203)。
【0062】ユーザプロファイル作成・格納部における
差分情報抽出処理 前述したステップ201の差分情報抽出処理は、図10
に示すように、ユーザが適合と判定した文書情報を単語
とその重みとを要素とするベクトルに変換する処理(ス
テップ2011)と、ユーザプロファイルをキーワード
とその重みとを要素とするベクトルとして、適合と判定
された文書情報のベクトルとの差を求め差分情報とする
処理(ステップ2012)とにより実行される。
【0063】ユーザプロファイル作成・格納部における
プロファイル派生判定処理 前述したステップ202のプロファイル派生判定処理に
おいて、図11に示すように、まず、情報サーバから送
信された文書情報を単語とその重みとを要素とするベク
トルに変換する(ステップ2021)。次に、各文書情
報と差分情報との一致度をベクトルの角度(数1に示す
式を参照)を計算することにより求める(ステップ20
22)。次に、差分情報との一致度が高い文書情報のみ
を収集し(ステップ2023)、それらの一致度が高い
文書情報と元のユーザプロファイルとの一致度をステッ
プ2022と同様に計算する(ステップ2024)。各
文書情報と元のユーザプロファイルとの一致度が全体的
に低いか否かを判定し、低ければ、「True」をリタ
ーンし、そうでなければ「False」をリターンする
(ステップ2025)。
【0064】ユーザプロファイル作成・格納部における
ユーザプロファイル派生処理 前述したステップ203のユーザプロファイル派生処理
において、図12に示すように、差分情報に含まれる単
語をキーワードとしてユーザプロファイルを作成し(ス
テップ2031)、そのユーザプロファイルをユーザプ
ロファイル格納エリアに格納する(ステップ203
2)。次に、ユーザプロファイル格納エリアの中の、作
成したユーザプロファイルを格納した行の、オリジナル
ユーザプロファイルID格納エリアに、派生の元となっ
たユーザプロファイルのIDをセットする(ステップ2
033)。また、これに対応して元のユーザプロファイ
ルの関連ユーザプロファイルID格納エリアに、作成し
たユーザプロファイルのIDをセットする(ステップ2
034)。
【0065】フィルタリングサーバのユーザプロファイ
ル管理部の処理 図13はユーザプロファイル管理部1003の全体の処
理を説明するフローチャート、図14はユーザプロファ
イル関係変更処理の詳細を説明するフローチャート、図
15はユーザプロファイルマージ処理の詳細を説明する
フローチャート、図16はユーザプロファイル破棄処理
の詳細を示すフローチャートであり、次に、ユーザプロ
ファイル管理部1003の処理手順を図13〜図16に
示すフローを参照して説明する。
【0066】ユーザプロファイル管理部全体の処理 図13に示すように、ユーザプロファイル管理部100
3は、ユーザによって適合と判定される率が高いユーザ
プロファイルを優先するようにユーザプロファイル間の
関係を変更する(ステップ301)。次に、類似したユ
ーザプロファイルをマージし(ステップ302)、適合
と判定される率が低下したユーザプロファイルを破棄す
る(ステップ303)。
【0067】ユーザプロファイル管理部におけるユーザ
プロファイル関係変更処理 前述したステップ301のユーザプロファイル関係変更
処理は、図14に示すように行われる。すなわち、ま
ず、あるユーザプロファイルに一致する文書情報に対し
てユーザが適合と判定する率が一定以上になるか否かを
チェックし(ステップ3011)、適合と判定する率が
一定以上になれば、そのユーザプロファイルにオリジナ
ルのユーザプロファイルがあるか否かをチェックする
(ステップ3012)。ステップ3012で、そのユー
ザプロファイルにオリジナルのユーザプロファイルがあ
ると判定すれば、オリジナルのユーザプロファイルが格
納してある行の文書情報の適合率と比較する(ステップ
3013)。ステップ3013で、関連ユーザプロファ
イルの適合率の方が高ければ、関連ユーザプロファイル
がオリジナル、オリジナルのユーザプロファイルが関連
ユーザプロファイルとなるようユーザプロファイルのオ
リジナルまたは関連ユーザプロファイルIDを修正する
(ステップ3014)。前述のステップ3011〜30
13の判定の結果が否であった場合、何も行うことなく
処理を終了する。
【0068】ユーザプロファイル管理部におけるユーザ
プロファイルマージ処理 前述したステップ302のユーザプロファイルマージ処
理は、図15に示すように行われる。すなわち、まず、
1ユーザが保持する複数のユーザプロファイル相互間の
類似度を前述した数1に示す式を利用して計算する。こ
の計算は、ユーザプロファイルをユーザプロファイルの
中のキーワードとその重みとを要素とするベクトルとし
て考え、2つのユーザプロファイルのベクトルがなす角
の余弦を類似度とする計算である(ステップ302
1)。次に、類似度が一定以上のユーザプロファイルの
組があるか否かをチェックしてマージ対象のユーザプロ
ファイルがあるか否かをチェックし、マージ対象のユー
ザプロファイルがなければ処理を終了する(ステップ3
022)。ステップ3022で、マージ対象のユーザプ
ロファイルがあると判定すると、マージ対象をXとYと
し(ステップ3023)、Yのオリジナルのユーザプロ
ファイルの情報をXにマージする。すなわち、ユーザプ
ロファイルYにオリジナルのユーザプロファイルZがあ
れば、そのオリジナルのユーザプロファイルZの関連ユ
ーザプロファイルIDの中のユーザプロファイルYのI
DをユーザプロファイルXのIDに置き換え、そのオリ
ジナルのユーザプロファイルZのIDを、ユーザプロフ
ァイルXのオリジナルユーザプロファイルIDに追加す
る(ステップ3024)。次に、Yの関連ユーザプロフ
ァイルの情報をXにマージする。すなわち、ユーザプロ
ファイルYに関連ユーザプロファイルVがあれば、その
関連ユーザプロファイルVのオリジナルユーザプロファ
イルIDをユーザプロファイルXのIDに置き換え、そ
の関連ユーザプロファイルVのIDを、ユーザプロファ
イルXの関連ユーザプロファイルIDに追加する(ステ
ップ3025)。最後に、YをXにマージする。すなわ
ち、XとYとをそれぞれのキーワードとその重みを要素
とするベクトルとし、XのベクトルにYのベクトルを加
え、ユーザプロファイルYのレコードを削除する(ステ
ップ3026)。
【0069】ユーザプロファイル管理部におけるユーザ
プロファイル破棄処理 前述したステップ303のユーザプロファイル破棄処理
は、図16に示すように行われる。すなわち、まず、あ
るユーザプロファイルに一致する文書情報に対してユー
ザが適合と判定する適合率が一定以下になったか否かを
チェックし、一定以下でなければ処理を終了する(ステ
ップ3031)。ステップ3031のチェックで適合率
が一定以下になった場合、そのユーザプロファイルを破
棄してよいかをユーザに問い合わせ、ユーザが承認しな
ければ処理を終了する(ステップ3032)。ステップ
3032でユーザが承認すれば、そのユーザプロファイ
ルにオリジナルのユーザプロファイルがあるかをチェッ
クし(ステップ3033)、あればオリジナルのユーザ
プロファイルの関連ユーザプロファイルのIDの中から
破棄の対象となるユーザプロファイルのIDを削除する
(ステップ3034)。また、ステップ3034の処理
後、または、ステップ3033で、オリジナルのユーザ
プロファイルがなかった場合、破棄の対象となるユーザ
プロファイルに関連するユーザプロファイルがあるか否
かをチェックし(ステップ3035)、あれば関連ユー
ザプロファイルのオリジナルユーザプロファイルのID
の中から破棄の対象となるユーザプロファイルのIDを
削除する(ステップ3036)。ステップ3036の処
理後、または、ステップ3035で、関連するユーザプ
ロファイルがなかった場合、最後に、破棄の対象となる
ユーザプロファイルのレコードを削除する(ステップ3
037)。
【0070】ユーザプロファイル管理部の処理の一例 次に、前述したユーザプロファイル管理部の処理につい
て図4を参照して説明する。
【0071】図4(b)はユーザプロファイルの派生関
係の修正前の状態、図4(c)はユーザプロファイルの
派生関係の修正後の状態のユーザプロファイル格納エリ
アの一例を示している。図4(b)に示すように、ID
「1」のユーザプロファイルの関連ユーザプロファイル
はID「173」を有している。また、ID「173」
のオリジナルユーザプロファイルのIDは「1」であ
る。これに対して、ユーザプロファイル管理手段がID
「1」とID「173」とのユーザプロファイルの適合
率に基づいてオリジナルと関連のユーザプロファイルと
のIDを変更した結果が図4(c)に示す例である。す
なわち、ID「173」のユーザプロファイルの適合率
が、ID「1」のユーザプロファイルの適合率より大き
くなったことにより、ユーザプロファイル管理部は、図
4(c)に示すように、ID「173」のユーザプロフ
ァイルの関連ユーザプロファイルをID「1」とし、I
D「1」のオリジナルユーザプロファイルのIDを「1
73」とする。
【0072】ユーザ端末 図17はユーザ端末2のモジュール構成を示すブロック
図、図18は文書表示部の処理動作を説明するフローチ
ャート、図19はユーザ端末2における文書表示画面の
例を説明する図であり、以下、図17〜図19を参照し
てユーザ端末のソフトウェア構成及び処理動作について
説明する。図17において、2001は文書表示部、2
002は適合文書送信部、2003は選別文書、200
4は適合文書である。
【0073】図17に示すように、ユーザ端末2は、文
書表示部2001及び適合文書送信部2002から構成
される。文書表示部2001は、フィルタリングサーバ
1からの選別文書情2003を受信して画面に表示し、
適合文書送信部2002は、適合文書2004をフィル
タリングサーバ1に送信する。適合文書送信部2002
の処理は単純であるので詳細な説明を省略し、次に、文
書表示部2001の処理動作を図18を参照して説明す
る。
【0074】図18に示すように、文書表示部2001
は、まず、選別文書2003の情報に関連ユーザプロフ
ァイルの情報があるか否かをチェックし(ステップ40
1)、なければ関連文書情報なしとしてその選別文書の
情報を画面に表示する(ステップ404)。ステップ4
01のチェックで、関連ユーザプロファイルがあれば、
そのユーザプロファイルに一致する文書情報が選択文書
の中にあるか否かをチェックして(ステップ402)、
関連ユーザプロファイルに一致する文書情報が選択文書
の中になければ、関連文書情報なしとして選別文書の情
報を画面に表示する(ステップ404)。ステップ40
2のチェックで、関連ユーザプロファイルに一致する文
書情報が選択文書の中にあれば、関連文書情報ありとし
てその選別文書の情報を画面に表示する(ステップ40
3)。ユーザが関連文書の表示を指示すれば(ステップ
405)、その関連文書の情報を画面に表示する(ステ
ップ406)。
【0075】前述した文書表示部2001の処理によ
り、ユーザ端末2に表示された文書表示画面の例におい
て、図19(a)はある時点においてユーザに文書情報
を提示しそれに対してユーザが適合と判定した例、図1
9(b)及び図19(c)はユーザが適合と判定した文
書情報とそれに一致するユーザプロファイルとに基づい
てユーザプロファイルを派生させた後の文書情報の例で
ある。なお、図19(a)〜図19(c)に示す文書例
は、それぞれ、図6(a)〜図6(c)に示す選別文書
例と対応している。以下、それぞれの表示例について説
明する。
【0076】図19(a)に示す例は、図4(a)に示
した状態のユーザプロファイルの中第1行目に格納され
たID「1」に一致する図6(a)に示す文書情報の表
示例と同一である。図4(a)の第1行目にはオリジナ
ル、または、関連するユーザプロファイルのIDが格納
されていない。そのため、図19(a)における、関連
する文書情報の表示を指示するボタン「関連情報」は無
効となっている。また、図19(a)に示す例では、ユ
ーザが表示されている文書情報がユーザの興味に適合し
たとして、画面左上部のセレクトボタン「適合」と「不
適合」とのうち、「適合」を選択している。
【0077】図19(b)に示す例は、図19(a)に
示す文書情報がユーザによって適合と判定された結果I
D「1」のユーザプロファイルからID「173」のユ
ーザプロファイルが派生した後の、ID「1」のユーザ
プロファイル、すなわち、元のユーザプロファイルに一
致した文書情報を表示した例である。図4(b)に示し
たように、図19(a)に示す文書情報が適合と判定さ
れても元のユーザプロファイルは直接更新されていな
い。従って、ユーザは、元のユーザプロファイルに表現
されている興味(「半導体」と「生産」)に関する文書
情報を参照することができる。さらに、元のユーザプロ
ファイルから他のユーザプロファイルが派生した後なの
で、派生したユーザプロファイルに一致する文書情報が
あれば、画面右上部の「関連情報」ボタンが有効とな
る。ユーザは、この「関連情報」ボタンをクリックする
ことにより、元のユーザプロファイルから派生したユー
ザプロファイルに一致する文書情報を参照することがで
きる。
【0078】図19(c)は、図19(b)において
「関連情報」ボタンがクリックされた後の関連情報のユ
ーザプロファイルに一致する文書情報の例である。そし
て、この例の文書情報は、「円高」と「貿易」とに関す
る文書情報であり、図19(b)に示す文書情報と関連
している。このように、ユーザは、ユーザプロファイル
相互間の派生関係に基づいて文書情報を参照することが
できる。
【0079】前述した本発明の実施形態による情報フィ
ルタリングシステムは、フィルタリングサーバ1で文書
情報を選別し、ユーザの適合判定に基づいてユーザプロ
ファイルを派生させ管理し、元のユーザプロファイルを
更新することなしに新たに生じたユーザの興味にあった
ユーザプロファイルを作成して、ユーザプロファイル間
の派生関係に基づいて文書情報を関連付けて表示するよ
うにしているので、ユーザは、最新の興味に関する文書
情報と共に継続した興味に関する文書情報をも参照する
ことができる。
【0080】ユーザプロファイル作成・格納部の変形例
1 図20はフィルタリングサーバのモジュール構成の他の
構成例を示すブロック図、図21はユーザプロファイル
作成・格納部の処理手順を説明するフローチャートであ
り、以下、図20、図21を参照して、フィルタリング
サーバのモジュールにおけるユーザプロファイル作成・
格納部の他の処理例について説明する。図20におい
て、1011は文書格納エリアであり、他の符号は図3
の場合と同一である。なお、この例を含む情報フィルタ
リングシステムの全体装置の構成及び装置のハードウェ
ア構成は、図1及び図2に示すものと同一でよいため、
その説明を省略する。
【0081】図20に示すフィルタリングサーバは、文
書選別部1001、ユーザプロファイル作成・格納部1
002、及び、ユーザプロファイル管理部1003から
構成される。これらのうち文書選別部1001とユーザ
プロファイル管理部1003とは、前述までに説明した
本発明の実施形態の場合と同一であるので、ユーザプロ
ファイル作成・格納部1002の処理動作についてのみ
後述する。この例のユーザプロファイル作成・格納部1
002を実現するために、フィルタリングサーバは、ユ
ーザプロファイル格納エリア1004と文書格納エリア
1011とを有する。これらのうちユーザプロファイル
格納エリア1004は、図3に示したものと同様であ
る。文書格納エリア1011には、ユーザが適合と判定
した適合文書情報がユーザ別に格納される。さらに、こ
の例におけるフィルタリングサーバ1は、情報サーバ3
及びユーザ端末2と、文書情報1005、選別文書情報
1006及び適合文書情報1007を送受信するが、こ
れらは、前述までに説明した本発明の実施形態の場合と
同様である。
【0082】ユーザプロファイル作成・格納部1002
の処理動作を説明する図21に示すフローにおいて、ユ
ーザプロファイル作成・格納部1002は、ユーザから
適合と判定された文書情報が送信されてくると、文書格
納エリアに格納された文書情報との一致度を計算する。
一致度の計算は、前述までに説明した本発明の実施形態
における文書選択部での処理で説明した方法と同様であ
り、数1に示す式を用いて行うことができる(ステップ
501)。次に、文書格納エリア1011に格納された
文書情報のうち、ユーザが適合と判定した文書情報との
一致度がある閾値を超えるものがないか否かをチェック
し(ステップ502)、一致度がある閾値を超えるもの
がなければ、過去に類似した文書情報が送信されていな
いとして、適合と判定された文書情報とそのユーザプロ
ファイルとに基づいてユーザプロファイルを作成してユ
ーザプロファイル格納エリア1004に格納する(ステ
ップ503)。ステップ503の処理後、または、ステ
ップ502でユーザが適合と判定した文書情報との一致
度がある閾値を超えるものがあった場合、ユーザが適合
と判定した文書情報を文書格納エリア1011に格納し
て処理を終了する(ステップ504)。
【0083】なお、前述のステップ503におけるユー
ザプロファイル作成・格納処理の詳細は、前述までに説
明した本発明の実施形態の場合と同様である。前述した
変形例1によれば、過去に類似したものがない文書情報
に関してのみユーザプロファイルを新たに作成すること
が可能となる。
【0084】ユーザプロファイル作成・格納部の変形例
2 図22はフィルタリングサーバのモジュール構成のさら
に他の構成例を示すブロック図、図23はユーザプロフ
ァイル作成・格納部の処理手順を説明するフローチャー
トであり、以下、図22、図23を参照して、フィルタ
リングサーバのモジュールにおけるユーザプロファイル
作成・格納部のさらに他の処理例について説明する。図
22における図の符号は図3の場合と同一である。な
お、この例を含む情報フィルタリングシステムの全体装
置の構成及び装置のハードウェア構成は、図1及び図2
に示すものと同一でよいため、その説明を省略する。
【0085】図22に示すフィルタリングサーバは、文
書選別部1001、ユーザプロファイル作成・格納部1
002、及び、ユーザプロファイル管理部1003から
構成される。これらのうち文書選別部1001とユーザ
プロファイル管理部1003とは、前述までに説明した
本発明の実施形態の場合と同一であるので、ユーザプロ
ファイル作成・格納部1002の処理動作についてのみ
後述する。この例のユーザプロファイル作成・格納部1
002を実現するために、フィルタリングサーバは、ユ
ーザプロファイル格納エリア1004を有する。ユーザ
プロファイル格納エリア1004は、図3に示したもの
と同様であるので説明を省略する。図22に示すフィル
タリングサーバ1は、情報サーバ3及びユーザ端末2
と、文書情報1005、選別文書情報1006及び適合
文書情報1007を送受信するが、これらは、前述まで
に説明した本発明の実施形態の場合と同様である。
【0086】ユーザプロファイル作成・格納部1002
の処理動作を説明する図23に示すフローにおいて、ユ
ーザプロファイル作成・格納部1002は、ユーザから
適合と判定された文書情報が送信されてくると、ユーザ
プロファイル格納エリア1004に格納された他のユー
ザのユーザプロファイルとの一致度を計算する。この一
致度の計算は、前述までに説明した本発明の実施形態に
おける文書選択部での処理で説明した方法と同様であ
り、数1に示す式を用いて行うことができる(ステップ
601)。次に、ユーザプロファイル格納エリア100
4に格納されたユーザプロファイルのうち、ユーザが適
合と判定した文書情報との一致度がある閾値を超えるも
のがあるか否かをチェックし、なければそのまま処理を
終了する(ステップ602)。ステップ602で、ユー
ザが適合と判定した文書情報との一致度がある閾値を超
えるものがあった場合、そのうち最も一致度の高いユー
ザプロファイルを複製する(ステップ603)。また、
ユーザプロファイルに記載されたキーワードに重みを与
えてベクトルとして表現し、さらに、ユーザが適合と判
定した文書情報も重要度の高い単語を要素とするベクト
ルとして表現し、複製したユーザプロファイルのベクト
ルに、適合と判定された文書情報のベクトルを加えるこ
とによりユーザプロファイルを更新する(ステップ60
4)。更新したユーザプロファイルを、ユーザが適合と
判定したユーザプロファイルの関連ユーザプロファイル
としてユーザプロファイル格納エリア1004に格納し
て処理を終了する(ステップ605)。
【0087】前述した変形例2によれば、他のユーザが
保持するユーザプロファイルを利用して効率的に新たな
ユーザプロファイルを作成することが可能となる。
【0088】
【発明の効果】以上説明したように本発明によれば、元
のユーザプロファイルを更新することなく、新たに生じ
たユーザの興味にあったユーザプロファイルを作成する
ことができるので、ユーザは、最新の興味に関する文書
情報と共に、継続した興味に関する文書情報をも参照す
ることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態による情報フィルタリング
システムの全体構成を示すブロック図である。
【図2】情報フィルタリングシステムを構成する装置の
ハードウェア構成を示すブロック図である。
【図3】フィルタリングサーバのモジュール構成を示す
ブロック図である。
【図4】ユーザプロファイル格納エリアに格納されるユ
ーザプロファイルの構成を説明する図である。
【図5】フィルタリングサーバが送受信する文書情報の
例を説明する図である。
【図6】複数のユーザプロファイルにより選別された文
書情報の例を説明する図である。
【図7】ユーザ端末からフィルタリングサーバに送信す
る適合文書情報の例を説明する図である。
【図8】情報サーバから送信された1つの文書情報に対
してユーザプロファイルを用いて選別する処理の手順を
説明するフローチャートである。
【図9】ユーザプロファイル作成・格納部の全体の処理
手順を説明するフローチャートである。
【図10】差分情報抽出処理の詳細を説明するフローチ
ャートである。
【図11】ユーザプロファイル派生判定処理の詳細を説
明するフローチャートである。
【図12】ユーザプロファイル派生処理の詳細を説明す
るフローチャートである。
【図13】ユーザプロファイル管理部の全体の処理を説
明するフローチャートである。
【図14】ユーザプロファイル関係変更処理の詳細を説
明するフローチャートである。
【図15】ユーザプロファイルマージ処理の詳細を説明
するフローチャートである。
【図16】ユーザプロファイル破棄処理の詳細を示すフ
ローチャートでありる。
【図17】ユーザ端末のモジュール構成を示すブロック
図である。
【図18】文書表示部の処理動作を説明するフローチャ
ートである。
【図19】ユーザ端末2における文書表示画面の例を説
明する図である。
【図20】フィルタリングサーバのモジュール構成の他
の構成例を示すブロック図である。
【図21】図20におけるユーザプロファイル作成・格
納部の処理手順を説明するフローチャートである。
【図22】フィルタリングサーバのモジュール構成のさ
らに他の構成例を示すブロック図である。
【図23】図22におけるユーザプロファイル作成・格
納部の処理手順を説明するフローチャートである。
【符号の説明】
1 フィルタリングサーバ 2 ユーザ端末 3 情報サーバ 10 CPU 20 ハードディスク 30 メモリ 40 ディスプレイ 41 ディスプレイ制御部 50 キーボード 51 キーボード制御部 60 マウス 61 マウス制御部 70 通信制御部 80 バス 1001 文書選別部 1002 ユーザプロファイル作成・格納部 1003 ユーザプロファイル管理部 1004 ユーザプロファイル格納エリア 1005 文書 1006 選別文書 1007 適合文書 1011 文書格納エリア 2001 文書表示部 2002 適合文書送信部 2003 選別文書 2004 適合文書
───────────────────────────────────────────────────── フロントページの続き (72)発明者 梶 博行 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 Fターム(参考) 5B075 KK03 KK07 ND03 NK02 NR03 PR08 QP05

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 情報サーバと、フィルタリングサーバ
    と、ユーザ端末とを備え、フィルタリングサーバが情報
    サーバから取得した情報を選別してユーザ端末に送信す
    る情報フィルタリングシステムにおいて、前記フィルタ
    リングサーバは、1ユーザに対するユーザプロファイル
    を複数保持し、複数のユーザプロファイルに基づいて情
    報の選別を行うことを特徴とする情報フィルタリングシ
    ステム。
  2. 【請求項2】 前記フィルタリングサーバは、ユーザに
    よる文書情報の適合判定結果に基づいて新たにユーザプ
    ロファイルを作成することを特徴とする請求項1記載の
    情報フィルタリングシステム。
  3. 【請求項3】 前記フィルタリングサーバは、1ユーザ
    に関する複数のユーザプロファイルを関係付けて格納管
    理することを特徴とする請求項1または2記載の情報フ
    ィルタリングシステム。
  4. 【請求項4】 前記フィルタリングサーバは、1ユーザ
    に関する複数のユーザプロファイル間の関係に基づいて
    選別した文書情報を関連付けることを特徴とする請求項
    3記載の情報フィルタリングシステム。
  5. 【請求項5】 前記フィルタリングサーバは、1ユーザ
    に関する複数のユーザプロファイル及びそれらの間の関
    係をユーザの興味の変化に合わせて変更することを特徴
    とする請求項3記載の情報フィルタリングシステム。
  6. 【請求項6】 前記フィルタリングサーバは、ユーザが
    適合と判定した文書情報と元のユーザプロファイルとに
    基づいてユーザプロファイルを派生させて新たにユーザ
    プロファイルを作成することを特徴とする請求項2記載
    の情報フィルタリングシステム。
  7. 【請求項7】 前記フィルタリングサーバは、ユーザが
    適合と判定した文書情報との一致度が高い他のユーザの
    ユーザプロファイルに基づいて新たにユーザプロファイ
    ルを作成することを特徴とする請求項2記載の情報フィ
    ルタリングシステム。
  8. 【請求項8】 前記フィルタリングサーバは、ユーザが
    適合と判定した文書の割合によってユーザプロファイル
    間の関係を変更することを特徴とする請求項5記載の情
    報フィルタリングシステム。
  9. 【請求項9】 前記フィルタリングサーバは、1ユーザ
    の類似しているユーザプロファイルをマージすることを
    特徴とする請求項5記載の情報フィルタリングシステ
    ム。
  10. 【請求項10】 前記フィルタリングサーバは、ユーザ
    によって適合と判定される割合が低いユーザプロファイ
    ルを破棄することを特徴とする請求項5記載の情報フィ
    ルタリングシステム。
  11. 【請求項11】 前記フィルタリングサーバは、ユーザ
    が適合と判定した文書情報の中のユーザプロファイルに
    一致しない部分を抽出し、その一致しない部分を含む文
    書情報を収集して、それら文書情報と元のユーザプロフ
    ァイルとの一致度が低い場合、ユーザプロファイルを派
    生させて作成することを特徴とする請求項6記載の情報
    フィルタリングシステム。
  12. 【請求項12】 前記フィルタリングサーバは、ユーザ
    が適合と判定した文書情報が過去における文書情報と類
    似していない場合に、ユーザプロファイルを派生させて
    作成することを特徴とする請求項6に記載の情報フィル
    タリングシステム。
JP27350198A 1998-09-28 1998-09-28 情報フィルタリングサーバ Expired - Fee Related JP3759321B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27350198A JP3759321B2 (ja) 1998-09-28 1998-09-28 情報フィルタリングサーバ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27350198A JP3759321B2 (ja) 1998-09-28 1998-09-28 情報フィルタリングサーバ

Publications (2)

Publication Number Publication Date
JP2000105764A true JP2000105764A (ja) 2000-04-11
JP3759321B2 JP3759321B2 (ja) 2006-03-22

Family

ID=17528784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27350198A Expired - Fee Related JP3759321B2 (ja) 1998-09-28 1998-09-28 情報フィルタリングサーバ

Country Status (1)

Country Link
JP (1) JP3759321B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002215665A (ja) * 2001-01-16 2002-08-02 Dainippon Printing Co Ltd 情報推薦サーバー装置
JP2002342364A (ja) * 2001-05-11 2002-11-29 Kddi Corp 文献情報管理方法及びシステム
JP2007535048A (ja) * 2004-04-28 2007-11-29 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 情報の再生のための方法および装置
US7403990B2 (en) 2002-05-08 2008-07-22 Ricoh Company, Ltd. Information distribution system
JP2011248484A (ja) * 2010-05-24 2011-12-08 Nippon Telegr & Teleph Corp <Ntt> 文字列ベクトル変換装置、文字列ベクトル変換方法、プログラム、及びプログラムを格納したコンピュータ読み取り可能な記録媒体

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101990A (ja) * 1995-07-31 1997-04-15 Toshiba Corp 情報フィルタリング装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101990A (ja) * 1995-07-31 1997-04-15 Toshiba Corp 情報フィルタリング装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002215665A (ja) * 2001-01-16 2002-08-02 Dainippon Printing Co Ltd 情報推薦サーバー装置
JP2002342364A (ja) * 2001-05-11 2002-11-29 Kddi Corp 文献情報管理方法及びシステム
US7403990B2 (en) 2002-05-08 2008-07-22 Ricoh Company, Ltd. Information distribution system
JP2007535048A (ja) * 2004-04-28 2007-11-29 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 情報の再生のための方法および装置
JP2011248484A (ja) * 2010-05-24 2011-12-08 Nippon Telegr & Teleph Corp <Ntt> 文字列ベクトル変換装置、文字列ベクトル変換方法、プログラム、及びプログラムを格納したコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
JP3759321B2 (ja) 2006-03-22

Similar Documents

Publication Publication Date Title
US10353969B2 (en) Identifying relationships in an online social network
US8280879B2 (en) System and method for quantifying visibility within search engines
JP4098539B2 (ja) プロファイル情報の推薦方法、プログラム及び装置
CN102073699B (zh) 用于基于用户行为来改善搜索结果的方法、装置和设备
JP5962926B2 (ja) レコメンダシステム、レコメンド方法、及びプログラム
US8352396B2 (en) Systems and methods for improving web site user experience
US8046363B2 (en) System and method for clustering documents
US20080281807A1 (en) Search engine
US20080072180A1 (en) User readability improvement for dynamic updating of search results
JP5014399B2 (ja) 検索データ管理装置
US6886016B2 (en) Method and system for supporting multivalue attributes in a database system
WO2001009770A1 (en) Rule-based message distribution between a plurality of users
JP3707361B2 (ja) 情報提供サーバ及び情報提供方法
CN110442584B (zh) 一种基于异步加载的树形结构资源检索的方法
CN104919452A (zh) 使用图像来改善人搜索
CN109977318B (zh) 书籍搜索方法、电子设备及计算机存储介质
JP2013105215A (ja) レコメンド情報生成装置、レコメンド情報生成方法及びレコメンド情報生成プログラム
JP2004515837A (ja) サーチプロファイルの比較方法
US20020116203A1 (en) System and method for managing job resumes
JP3759321B2 (ja) 情報フィルタリングサーバ
US7483877B2 (en) Dynamic comparison of search systems in a controlled environment
JP2003256472A (ja) 文書検索システム
JP2005301584A (ja) 要約記事配信サーバ及び要約記事配信方法及び要約記事配信プログラム
JP2013109734A (ja) 文書検索装置、文書検索方法及びプログラム
US7577649B2 (en) Engine for validating proposed changes to an electronic entity

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050405

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050830

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051228

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees