JP3759321B2 - 情報フィルタリングサーバ - Google Patents

情報フィルタリングサーバ Download PDF

Info

Publication number
JP3759321B2
JP3759321B2 JP27350198A JP27350198A JP3759321B2 JP 3759321 B2 JP3759321 B2 JP 3759321B2 JP 27350198 A JP27350198 A JP 27350198A JP 27350198 A JP27350198 A JP 27350198A JP 3759321 B2 JP3759321 B2 JP 3759321B2
Authority
JP
Japan
Prior art keywords
user
user profile
information
profile
document information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP27350198A
Other languages
English (en)
Other versions
JP2000105764A (ja
Inventor
敏子 相薗
康嗣 森本
博行 梶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP27350198A priority Critical patent/JP3759321B2/ja
Publication of JP2000105764A publication Critical patent/JP2000105764A/ja
Application granted granted Critical
Publication of JP3759321B2 publication Critical patent/JP3759321B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、情報フィルタリングサーバに係り、特に、通信回線を介して提供される多種多様で多数の情報の中からユーザの興味に合った情報を選択してユーザに提供する情報フィルタリングサーバに関する。
【0002】
【従来の技術】
近年、パーソナルコンピュータの普及及びインターネットの拡大に伴い、ユーザに提供可能な電子化された文書の量が飛躍的に増加している。その一方で、膨大な量の情報の中からユーザが必要とするものを直接見つけ出すことが非常に手間のかかる作業となっている。このような情報選択の作業を軽減するための技術として、新聞社等が生成・蓄積する大量の文書情報からユーザの興味にあったものを選別し送信する情報フィルタリングと呼ばれる技術がある。
【0003】
情報フィルタリングを実現するシステムは、一般に、大量の情報を生成・発信・蓄積する情報サーバと、情報を選別してユーザに送信するフィルタリングサーバと、ユーザが情報を参照するユーザ端末から構成される。この種の情報フィルタリングシステムに関する従来技術として、例えば、特開平9−101990号公報等に記載された技術が知られている。
【0004】
この従来技術は、ユーザが興味のある分野名を指定したり、キーワードを入力するなどしてユーザプロファイルと呼ばれる情報を生成しておき、フィルタリングサーバが、情報サーバが持つ大量の情報の中からユーザプロファイルに合ったもののみ選別して、ユーザ端末に送信するというものである。ユーザは、これにより、自分の興味のある情報のみを取得することができ、効率的に情報を参照することができる。
【0005】
前述の情報フィルタリング技術は、ユーザに配信される情報とユーザの実際の興味との適合率を向上させるために、レリバンスフィードバックと呼ばれる方法と併用されることが多い。レリバンスフィードバックとは、配信した情報がユーザの興味と適合しているか否か(レリバンス)をユーザに判定させて、その結果をユーザプロファイルにフィードバックさせるものである。
【0006】
レリバンスフィードバックに関する技術の一例として、例えば、Chris BuckleyとGerald Saltonによる「Optimization of relevance feedback weights」(Proceedings of the 18th Annual International ACM SIGIR Conference on research and Development in Information Retrieval, pp.351-357, New York, July 1995, ACM.)に記載されたタームベクトルを用いる手法がある。この手法は、ユーザプロファイルに記載されたキーワードに重みを与えてベクトルとして表現し、さらに、文書情報も重要な単語を要素とするベクトルとして表現しておき、フィードバックにおいて、元のユーザプロファイルのベクトルに、適合と判定された文書情報のベクトルを加え、さらに関連のない文書のベクトルを引くことにより、ユーザの興味にもっとも適合するようにユーザプロファイルを更新していく手法である。
【0007】
この従来技術によれば、ユーザプロファイル中に出現するキーワードのうちユーザが適合と判定した文書情報中に出現するものがあればその重みが大きくなり、また、ユーザが適合と判定した文書情報中の重要な単語がユーザプロファイルに追加されるので、ユーザプロファイルをユーザの最新の興味に対応させて更新することが可能となる。
【0008】
【発明が解決しようとする課題】
前述した従来技術によるレリバンスフィードバックは、ユーザプロファイルをユーザの最新の興味に対応させて更新することができる一方で、変更を加える前のユーザプロファイルに表現された興味をそのまま持ち続けているユーザにとって、送信される文書情報とユーザの興味との適合性が低下してしまうという問題点を有している。すなわち、レリバンスフィードバックは、ユーザが適合と判定した文書情報に基づいてユーザプロファイルを更新し、元のユーザプロファイルを変更してしまうので、ユーザが元のユーザプロファイルに表現されていた興味をそのまま持っている場合、元の興味に合った文書情報を受け取ることができなくなるという問題点を有している。以下、ユーザの興味の変化について説明し、問題点について詳細に説明する。
【0009】
ユーザが興味のある興味Aからそれと全く異なる興味Bへ突然変化することは、一般的には希である。むしろ、ユーザの興味は、ある興味Aからそれに関連する興味Bへ徐々に変化することの方が多いであろう。その変化には、大きく次の2つの種類があると考えられる。(1)興味全体の変化:興味Aからそれに関連する興味Bへ変化し、もはや興味Aには関心を持たない場合、(2)興味の派生:興味Aに関連する興味Bを持つようになったが依然として興味Aにも関心を持っている場合である。
【0010】
前述した従来技術によるレリバンスフィードバックは、一般に、(1)の場合に対応したユーザプロファイルの更新に適している。そして、レリバンスフィードバックは、ユーザが適合と判定した文書情報に基づいてユーザプロファイルを更新し元のユーザプロファイルと置き換えてしまうため、(2)のように興味が変化しても依然として元の興味をそのまま持ち続けているユーザにとって、元の興味に関する記述が更新されてしまうという問題点を生じることになる。
【0011】
例えば、当初「半導体」の技術動向や新製品情報に興味を持っていたユーザが、「アメリカの半導体メーカが円高のために日本から部品が調達できず半導体の価格を上げた」という文書情報を参照して、半導体の価格が円高に影響されることを知り、それ以後、円高に関する情報、例えば、今後の円高動向等に興味を持ったとする。このとき、ユーザが「海外の半導体メーカが円高のために日本から部品が調達できず半導体の価格を上げた」という文書情報を適合と判定すると、レリバンスフィードバックは、前記文書情報から「円高」、「部品」、「価格」などのキーワードを抽出してユーザプロファイルに追加する。その結果、フィルタリングサーバは、「半導体」に関する文書情報のうち、さらに「円高」にも言及している文書情報があれば、その文書情報を、「半導体」の技術動向のみに関する文書情報よりも高いランクで送信するようになる。このようなユーザプロファイルに基づいた情報のフィルタリングは、ユーザが依然として「半導体」の技術動向に関しても高い興味を持つ場合適切とは言えない。
【0012】
本発明の目的は、前述した従来技術によるレリバンスフィードバックを併用する情報フィルタリング技術の問題点を解決し、常に、ユーザの興味に最も適合したユーザプロファイルを作成して情報の選択を行うことを可能にした情報フィルタリングサーバを提供することにある。
【0013】
【課題を解決するための手段】
前述した従来技術の問題点は、ユーザプロファイルに興味Aとそれから派生した興味Bを同時に表現しようとしていることから生じていると言える。この問題点を解決するため、本発明は、1ユーザが複数のユーザプロファイルを保持可能な情報フィルタリングシステムを構成する。また、本発明は、ある1ユーザに関し、ユーザが適合と判定した文書情報に基づいて新たにユーザプロファイルを作成し、ユーザプロファイル間の関係を格納・管理することにより、前述した従来技術に記載の元の興味に関するユーザプロファイルの記述が更新されてしまうというレリバンスフィードバックの問題点の解決を図る。さらに、本発明は、ユーザプロファイル間の関係に基づいて選別した文書情報を関連付ける文書選別を行うようにするにより、ユーザの興味の変化に対応した文書情報の表示を行うようにしている。
【0014】
すなわち、本発明によれば前記目的は、情報サーバ及びユーザ端末と接続されたフィルタリングサーバであって、前記情報サーバから文書情報を取得する手段と、1ユーザに対するユーザプロファイルを複数保持する手段と、前記複数のユーザプロファイルに基づいて前記文書情報の選別を行う手段と、前記選別した情報を前記ユーザ端末に送信する手段と、前記ユーザ端末においてユーザが入力した前記選別した文書情報の適合判定結果を前記ユーザ端末から受信する手段と、ユーザが適合と判定した文書情報を単語とその重みとを要素とするベクトルとし、前記ユーザプロファイルをキーワードとその重みとを要素とするベクトルとして、前記両ベクトルの差を求めることにより、ユーザが適合と判定した文書情報と前記ユーザプロファイルとの差分情報を抽出し、情報サーバから送信された文書情報の中から前記差分情報との一致度が高い文書情報を収集し、前記差分情報と一致度が高い文書情報と前記ユーザプロファイルとの一致度が低ければ、差分情報をキーワードとして新たにユーザプロファイルを作成するユーザプロファイル作成手段とを有することにより達成される。
【0015】
また、前記目的は、上記各手段に加えて、上記差分情報を抽出したユーザプロファイルをオリジナルプロファイルとし、新たに作成したユーザプロファイルを関連プロファイルとして互いに関係付けて管理する管理手段を有することにより達成される。
【0016】
また、前記目的は、前記管理手段が、オリジナルプロファイルに一致する文書情報に対してユーザが適合と判定する率と、前記オリジナルプロファイルに関係付けられた関連プロファイルに一致する文書情報に対してユーザが適合と判定する率とを比較し、前記関連プロファイルに一致する文書情報に対してユーザが適合と判定する率のほうが高ければ、前記関連プロファイルをオリジナルプロファイルとし、前記関連プロファイルに関係付けられたオリジナルプロファイルを関連プロファイルとして関係付けを変更することにより達成される。
【0019】
以下、前述した本発明の構成において必要な各構成要素について説明する。
【0020】
ユーザプロファイルの作成
本発明は、直接ユーザプロファイルを変更せずに別のユーザプロファイルを作成するため、(I)ユーザが適合と判定した文書情報と元のユーザプロファイルとに基づいて新たなユーザプロファイルを派生させて新たにユーザプロファイルを作成する方法、(II)ユーザが適合と判定した文書情報との一致度が高い他のユーザのユーザプロファイルに基づいて新たにユーザプロファイルを作成する方法を用いる。
【0021】
ユーザプロファイルの派生によるユーザプロファイルの作成
元のユーザプロファイルから派生させてユーザプロファイルを作成する方法を、(1)元のユーザプロファイルから派生させて新たにユーザプロファイルを作成するか否を判定する処理と、(2)派生させると判定された場合、ユーザが適合と判定した文書情報と元のユーザプロファイルとの差分を抽出してユーザプロファイルを記述する処理とにより構成する。
【0022】
ここで、ユーザが適合と判定した文書情報からユーザプロファイルを派生させるか否か判定する処理について説明する。ユーザプロファイル作成手段は、次に示す3つの処理のいずれかによって、ユーザが適合と判定した文書情報からユーザプロファイルを派生させるか否か判定する。すなわち、
(a)ユーザが適合と判定した文書情報中のユーザプロファイルに一致しない部分を抽出してユーザの新たな興味を表す情報とし、当該新たな興味に関する文書情報を収集して、それら文書情報と元のユーザプロファイルとの一致度を計算し、一致度が低ければ、ユーザの新規な興味が元のユーザプロファイルに表現されている興味と異なるものであるとして、ユーザプロファイルを派生させる。あるいは、
(b)ユーザが適合と判定した文書情報が過去における適合文書情報と類似していなければ、その時点において新規と認められる文書情報であるとして、ユーザプロファイルを派生させる。あるいは、
(c)上記条件のうちいずれかを満たし、かつ、ユーザプロファイルの派生をユーザが承認すればユーザプロファイルを派生させる。それ以外の場合、通常のレリバンスフィードバックと同様にユーザプロファイルを更新する。このようなユーザプロファイルを作成するか否かの判定により、元のユーザプロファイルから派生させるユーザプロファイルの数を抑制することができる。
【0023】
他のユーザのユーザプロファイルに基づくユーザプロファイルの作成
他のユーザのユーザプロファイルに基づくユーザプロファイル作成は、(あ)ユーザが適合と判定した文書情報との一致度が高い他のユーザのユーザプロファイルがあるか否かを判定する処理、(い)一致度が高い他のユーザのユーザプロファイルがある場合に、他のユーザのユーザプロファイルを複製する処理、(う)複製したユーザプロファイルをユーザが適合と判定した文書情報を用いて従来のレリバンスフィードバックの手法で更新して新たなユーザプロファイルとする処理の3つの処理から構成される。このように、他のユーザのユーザプロファイルを利用することにより、新たなユーザプロファイルを容易に作成することが可能となる。
【0024】
前述した2つのユーザプロファイルの作成方法により作成したユーザプロファイルを用いて情報のフィルタリングを行うことにより、ユーザは、継続して持っている興味に関する文書情報を高いランクで参照することができる。すなわち、前述した具体例では、ユーザは、「半導体」に関する文書情報と、特に「円高」に関する文書情報とを継続して共に参照することができる。
【0025】
ユーザプロファイルの格納
ユーザプロファイルの格納は、複数のユーザプロファイル相互間の関係を格納することにより、ユーザプロファイルに表現された興味相互間の関係を保存することが可能となる。
【0026】
文書選別
文書選別は、ユーザプロファイルに基づいて選別した文書情報のうち新たに作成したユーザプロファイルに一致する文書情報を、元のユーザプロファイルに一致する文書情報の関連情報として提示して行われる。例えば、「半導体」に関する文書情報に関連する文書情報として「円高」に関する文書情報をユーザに提示する。これにより、ユーザは、興味の変化に対応させて文書情報を参照することができ、文書情報間の関係を容易に把握することができる。
【0027】
ユーザプロファイルの管理
1ユーザが保持する複数のユーザプロファイル相互間の関係をユーザの興味の変化に対応させて変更するため、本発明は、次の3つの方法を用いる。すなわち、(ア)ユーザが適合と判定した文書の割合によってユーザプロファイル間の関係を変更する方法、(イ)類似しているユーザプロファイルをマージする方法、(ウ)ユーザによって適合と判定される割合が低いユーザプロファイルを破棄する方法である。以下、これらの3つのユーザプロファイルの管理方法について説明する。
【0028】
ユーザプロファイル間の関係の変更によるユーザプロファイルの管理
ユーザが元の興味から派生した興味の方により重点を置くようになると、元のユーザプロファイルの関連プロファイルとしてユーザプロファイル間の関係を保存することは適切ではなくなる。すなわち、前述した文書選別により、より重点を置いている派生した興味に関する文書情報が元の文書情報の関連情報として表示されてしまう。これに対して本発明は、ユーザプロファイル間の派生関係をユーザの適合判定結果に基づいて変更するようにユーザプロファイルの管理を行う。具体的には、ユーザの適合判定結果を利用して、派生関係を持つユーザプロファイルのうち、ユーザが適合と判定する文書情報の割合がより高いユーザプロファイルを優先する。これにより、元の興味から新たな興味が派生した場合のみでなく、派生関係にある興味の重要度が変化した場合にも、ユーザの興味に対応した文書情報を選別して送信することができる。
【0029】
前述した具体例を用いて説明すると、前述の具体例において、「円高」に関する文書情報をユーザが適合と判定する率が高くなれば、前述の管理手段は、「半導体」に関するユーザプロファイルを、「円高」に関するユーザプロファイルに従属するものとして変更する。これにより、ユーザは、「円高」に関連した文書情報として「半導体」の技術動向に関する文書情報を参照することができる。
【0030】
ユーザプロファイルのマージによるユーザプロファイルの管理
既存の複数の興味が変化してほとんど同一の興味になるという状況が考えられる。このような場合、類似した興味に対応するユーザプロファイルが複数あると、情報フィルタリングのコストがかかるばかりではなく、ユーザにとっても、似たような文書情報が多数送信されるために参照が面倒となる。このため、本発明は、類似しているユーザプロファイルがあれば、それらのユーザプロファイルをマージしてユーザプロファイルの数を低減させるようにユーザプロファイルの管理を行う。これにより、より効率的な情報フィルタリングが可能となる。
【0031】
ユーザプロファイルの破棄によるユーザプロファイルの管理
ユーザがユーザプロファイルに表現された興味を失うと、そのユーザプロファイルに基づいて選別された文書情報はユーザにとってノイズとなる。このため、本発明は、ユーザプロファイルをユーザの適合判定結果に基づいて破棄するようにユーザプロファイルの管理を行う。具体的には、ユーザの適合判定結果を利用して、ユーザが適合と判定する文書情報の割合が低いユーザプロファイルがあれば、そのユーザプロファイルを破棄する。これにより、ユーザの興味の喪失に対応した、ノイズの少ない文書情報の選別、送信が可能となる。
【0032】
【発明の実施の形態】
以下、本発明による情報フィルタリングサーバの実施形態を該サーバを含むシステムの実施形態として図面により詳細に説明する。
【0033】
図1は本発明の一実施形態による情報フィルタリングシステムの全体構成を示すブロック図、図2は情報フィルタリングシステムを構成する装置のハードウェア構成を示すブロック図、図3はフィルタリングサーバのモジュール構成を示すブロック図、図4はユーザプロファイル格納エリアに格納されるユーザプロファイルの構成を説明する図、図5はフィルタリングサーバが送受信する文書情報の例を説明する図、図6は複数のユーザプロファイルにより選別された文書情報の例を説明する図、図7はユーザ端末からフィルタリングサーバに送信する適合文書情報の例を説明する図である。図1〜図3において、1はフィルタリングサーバ、2はユーザ端末、3は情報サーバ、10はCPU、20はハードディスク、30はメモリ、40はディスプレイ、41はディスプレイ制御部、50はキーボード、51はキーボード制御部、60はマウス、61はマウス制御部、70は通信制御部、80はバス、1001は文書選別部、1002はユーザプロファイル作成・格納部、1003はユーザプロファイル管理部、1004はユーザプロファイル格納エリア、1005は文書、1006は選別文書、1007は適合文書である。
【0034】
情報フィルタリングシステムの全体構成
本発明の一実施形態による情報フィルタリングシステムは、図1に示すように、情報サーバ3と、フィルタリングサーバ1と、ユーザ端末2とが通信ネットワークに接続されて構成される。情報サーバ3は、新聞記事等の情報を生成・蓄積して、その文書情報をフィルタリングサーバ1に送信する装置であり、新聞社の文書データベースサーバなどに相当する。フィルタリングサーバ1は、ユーザの興味を表現したユーザプロファイルをユーザ端末2を利用するユーザに対応させて格納しており、情報サーバ3から送信された文書情報を受信して、格納してあるユーザプロファイルと照合し、一致度の高いユーザプロファイルがあればその文書情報をユーザ端末2に送信する。このフィルタリングサーバ1は、新聞社のサービスサーバやコンピュータネットワーク上のサービスプロバイダに相当する。ユーザ端末2は、フィルタリングサーバ1から配信された情報をユーザに表示する装置であり、家庭、オフィスにおけるサービスのフロントエンドに相当する。前述したサーバ1、3、端末2の各装置は、ネットワークを介して情報を送受信する。
【0035】
装置のハードウェア構成
情報フィルタリングシステムを構成する情報サーバ3、フィルタリングサーバ1及びユーザ端末2の各装置のハードウェアの構成は基本的に同一であり、図2に示すように、CPU10、ハードディスク20、メモリ30、ディスプレイ40、ディスプレイ制御部41、キーボード50、キーボード制御部51、マウス60、マウス制御部61、通信制御部70、及び、バス80を備えて構成される。但し、各装置は、前述の各構成部の仕様の詳細が装置の機能によって異なることが一般的である。例えば、情報サーバ3は、文書等の情報を大量に格納することが多いので、ハードディスク20が大型であることが多い。
【0036】
前述した情報サーバ3、フィルタリングサーバ1及びユーザ端末2のうち、本発明は、特に、フィルタリングサーバ1及びユーザ端末2に関する。よって、まず、フィルタリングサーバ1のソフトウェア構成の詳細について説明する。
【0037】
フィルタリングサーバ
フィルタリングサーバ1は、図3に示すように、文書選別部1001、ユーザプロファイル作成・格納部1002及びユーザプロファイル管理部1003の3つのモジュールから構成される。文書選別部1001は、情報サーバ3からの文書情報1005を受信して、ユーザプロファイル格納エリア1004に格納してあるユーザプロファイルと照合し、一致度が高いユーザプロファイルがあればそのユーザプロファイルに対応するユーザのユーザ端末2に、高い一致度が得られた文書情報を送信する。また、文書選別部1001は、選別した文書情報1006をユーザプロファイル間の派生関係に基づいて関連付ける処理を行う。ユーザプロファイル作成・格納部1002は、ユーザが適合と判定した文書情報1007とユーザプロファイルとに基づいて新たにユーザプロファイルを作成して、ユーザプロファイル格納エリア1004に格納する。ユーザプロファイル管理部1003は、プロファイル間の関係を管理する。
【0038】
前述の3つのモジュールの機能を実現するため、ハードディスク20には、ユーザプロファイルを格納するユーザプロファイル格納エリア1004を有する。また、フィルタリングサーバ1は、情報サーバ3またはユーザ端末2と、文書1005、選別文書1006、及び適合文書1007を送受信する。
【0039】
次に、フィルタイリングサーバのハードディスク内に構成されるユーザプロファイル格納エリア1004の構成及び送受信する情報の例を説明する。
【0040】
ユーザプロファイル格納エリア
図4に示すユーザプロファイル格納エリア1004の構成の一例において、図4(a)はあるユーザプロファイルから他のユーザプロファイルが派生される前の状態を、図4(b)は他のユーザプロファイルが派生した後の状態を、また、図4(c)はユーザプロファイル間の派生関係が変更された後の状態を示している。図4に示すように、ユーザプロファイル格納エリア1004は、ユーザプロファイルのID10041、分類10042、キーワード10043、キーワードの重み10044、ユーザプロファイルが選別した文書情報とユーザの興味との適合率10045、オリジナルのユーザプロファイルのID10046、関連ユーザプロファイルのID10047、及び、そのプロファイルにマッチする文書情報を送信するユーザID10048から構成される。分類10042、キーワード10043及びキーワードの重み10044は、文書情報を選別するための情報である。分類10042には、文書情報の属する分野名や情報の発信元の名称等の条件を格納する。キーワード10043には、単語を、その重み10044にはキーワードの重要度を格納する。
【0041】
本発明の実施形態では、重みの値として0から1までの連続値をとるものとしている。適合率10045には、そのユーザプロファイルに基づいて選別して送信した文書情報のうちユーザに適合と判定された割合を示す最新の数値を格納する。また、オリジナルのユーザプロファイルID10046には、そのユーザプロファイルを作成する元となったユーザプロファイルのIDを格納する。関連のユーザプロファイルID10047には、そのユーザプロファイルを元として作成したユーザプロファイルのIDを格納する。これらIDのフィールドには、複数のユーザプロファイルのIDを格納することが可能である。ユーザID10048は、そのユーザプロファイルに適合する文書情報を送信するユーザのIDを格納する。
【0042】
図4(a)に示すユーザプロファイル作成前の状態の例において、第1行目には、分類「産業面」に出現する文書情報で、「半導体」と「生産」とを含む文書情報を選別するための、ユーザID「00012」を持つユーザのユーザプロファイル(プロファイルID「1」)が格納されている。このユーザプロファイルは、オリジナルあるいは関連のするユーザプロファイルが記載されていないので、このユーザプロファイルから派生したユーザプロファイルがない、あるいは、このユーザプロファイルが他のユーザプロファイルから派生したユーザプロファイルでないことが判る。
【0043】
図4(b)の第4行目には、分類「経済面」に出現する文書情報で、「円高」と「貿易」とを含む文書情報を選別するための、ユーザID「00012」を持つユーザのユーザプロファイル(プロファイルID「173」)が格納されている。この行のオリジナルユーザプロファイルIDの欄には、ユーザプロファイルID「1」が記載されている。このことは、このユーザプロファイルがID「1」のユーザプロファイルから派生したものであることを示している。これに対応してID「1」のユーザプロファイルが格納されている第1行目には、関連ユーザプロファイルIDとして「173」が格納されている。
【0044】
前述したように、ユーザプロファイル間の派生関係は、派生の元となったユーザプロファイル及び派生したユーザプロファイルのそれぞれにおいて、対応するユーザプロファイルのIDを格納することによって管理され、1ユーザが複数のユーザプロファイルを持つことができる。このユーザプロファイル間の派生関係は、各プロファイルの適合率によって修正される。修正された状態を示しているの図4(c)である。図4(c)において、図4(b)で示した派生関係、すなわち、ID「1」のユーザプロファイルからID「173」のユーザプロファイルが派生したという関係が修正され、図4(c)の第1行目には、ID「1」のユーザプロファイルは、ID173のユーザプロファイルから派生したという関係が格納されている。すなわち、図4(b)と図4(c)とにおける、ID「1」のプロファイルとID「173」のプロファイルとの派生関係が逆転させられている。
【0045】
フィルタリングサーバが送受信する文書情報
フィルタリングサーバ1が情報サーバ3から受信する文書情報1005の一例を図5に示している。図5に示す例は、「A社、半導体をアメリカで生産。A社は、………」という内容の文書情報である。情報サーバ3からは、図5に示すような例に限らず、あらゆる分類にわたる多種多様の多数の文書情報がフィルタリングサーバ1に送信されてくる。フィルタリングサーバ1は、構成のような多数の文書情報の中から、図4により説明したユーザプロファイルに適合した文書情報をユーザ毎に選別して、対応するユーザ端末2に送信する。
【0046】
図6にはフィルタリングサーバ1が図4により説明したユーザプロファイルに基づいて選別し、ユーザ端末2に送信する選別文書情報1006の一例を示している。図6(a)はあるユーザプロファイルから他のユーザプロファイルが派生される前の状態でユーザプロファイルにマッチして選別された文書情報の一例であり、この例は、図4(a)におけるユーザID「00012」を持つユーザのユーザプロファイルにマッチして選別された文書情報の例である。図6(b)、図6(c)は新たなユーザプロファイルが派生した後の状態のユーザプロファイルにより選別された文書情報の一例を示す。さらに詳細にいえば、図6(b)は図4(b)におけるユーザID「00012」を持つユーザのユーザプロファイルにマッチして派生したユーザプロファイル(ID「173」)の元となったユーザプロファイル(ID「1」)にマッチした文書情報の例であり、図6(c)は派生したユーザプロファイル(ID「173」)にマッチした文書情報の例である。
【0047】
図6に示す各選別文書情報の下部には、その文書情報にマッチしたユーザプロファイルのID、その一致度、そのユーザプロファイルが派生した元となるオリジナルのユーザプロファイルがあればそのID、あるいは、そのユーザプロファイルから派生したユーザプロファイルがあればそのID等の付加情報が記述される。なお、本発明の実施形態では、前述の付加情報を図面の見やすさのため図の中に明示しているが、一般に、これらの付加情報は、文書情報、選別文書情報及び適合文書情報の属性情報として埋め込まれて送信される。
【0048】
図7に示す適合文書情報1007の一例は、ユーザがユーザ端末2で受信した文書情報を閲覧して、適合判定の結果を返送してきた場合の文書情報の例であり、文書情報「半導体「値上げ必至」 米国に………」をユーザが適合と判定したことを示している。そのため、図の文書情報の下部には、その文書情報にマッチしたユーザプロファイルのID及びユーザプロファイルとの一致度に加えて、ユーザによる適合判定の結果が付加情報として記述されている。図示の例では、この文書情報に一致するユーザプロファイルのIDはID「1」であり、ユーザによる適合判定の結果が「適合」であることが示されている。
【0049】
次に、前述した本発明の実施形態におけるフィルタリングサーバ1を構成する各モジュールの処理動作を図8〜図16に示すフローチャートを参照して説明する。
【0050】
フィルタリングサーバの文書選別部の処理
図8は情報サーバ1から送信された1つの文書情報に対してユーザプロファイルを用いて選別する処理の手順を説明するフローチャートであり、まず、このフローを参照して文書選別部1001の処理手順について説明する。この処理は、情報サーバ1から文書情報が送信されるたびに繰り返される。
【0051】
フィルタリングサーバ1は、情報サーバ3から文書情報を受信すると、文書情報と一致するユーザプロファイルがあるか否かをチェックし、一致するものがなければ何も行うことなく処理を終了する(ステップ101)。ステップ101で文書情報に一致するユーザプロプロファイルがあると判定すれば、そのユーザプロファイルの関連ユーザプロファイルがあるか否かチェックする(ステップ102)。ステップ102で、関連ユーザプロファイルがあると判定した場合、受信した文書情報に関連するユーザプロファイルのユーザプロファイルIDの情報を付加する(ステップ103)。ステップ103の処理後の文書情報をユーザ端末に送信する。また、ステップ102で、関連ユーザプロファイルがないと判定された場合、受信した文書情報をそのまま送信する(ステップ104)。
【0052】
前述したステップ101の文書情報とユーザプロファイルとの一致度のチェック処理は、いくつかの従来技術によって実現することが可能である。そのうち、本発明の実施形態は、最も一般的と考えられる「ベクトル空間モデル法」を用いることとする。「ベクトル空間モデル法」は、まず、情報サーバから送信された文書情報から単語を抽出し、その文書情報内での単語の出現頻度とその単語が出現した文書数とに基づいて、より特定の文書情報でかつより大きい頻度で出現した単語の重みが大きくなるように重みを計算し、文書情報を単語とその重みとを要素とするベクトルとして表現し、次に、ユーザプロファイルをユーザプロファイルの中のキーワードとその重みとを要素とするベクトルとして考え、ユーザプロファイルのベクトルと文書情報のベクトルとがなす角の余弦を一致度とするという方法である。具体的には、次に数1として示す式により上記ユーザプロファイルと文書情報との一致度を求めることができる。
【0053】
【数1】
Figure 0003759321
【0054】
ユーザプロファイルと文書情報との一致度がある閾値を超えれば文書情報とユーザプロファイルとが一致していると考え、その値を文書情報とユーザプロファイルとの一致度とする。さらに、一致度は、選別文書情報をユーザに提示するときの文書情報のランク付けに利用される。すなわち、選別された文書情報の一致度を比較して、一致度の高い文書情報から順にユーザに提示することにより、ユーザの文書情報の参照を支援することができる。
【0055】
次に、前述した図4、図6の例を参照して、前述した文書選別部1001の処理の一例を説明する。
【0056】
図6(a)は、すでに説明したように、図4(a)に示すユーザID「00012」を持つユーザのユーザプロファイルを用いて選別された文書情報の一例として「半導体「値上げ必至」 米国に………」を示している。図6(a)の中の下部には一致したユーザプロファイルのIDとその一致度が記述されており、それぞれID「1」と「0.75」であることが判る。図4(a)に示すユーザプロファイル格納エリアを参照すると、第1行目に記載されているID「1」のユーザプロファイルは、オリジナル及び関連するユーザプロファイルの情報がないため、この文書情報は、前述した処理におけるステップ103の関連情報の追加がスキップされてユーザ端末2に送信される。
【0057】
関連するユーザプロファイルがない文書情報である図6(a)の例に対して、図6(b)及び図6(c)は、関連するユーザプロファイルがある例である。詳細には、図6(b)はその文書情報と一致したユーザプロファイルから派生したユーザプロファイルがある例、図6(c)はその文書情報と一致したユーザプロファイルにオリジナルのユーザプロファイルがある例である。この2つの文書情報は、図4(b)に示す状態のユーザプロファイル格納エリアに格納されたユーザプロファイルを用いて上記文書選別処理を実行した結果の例である。
【0058】
図6(b)に示す文書情報「D社、半導体生産を増強………」は、図の下部にも示すようにID「1」のユーザプロファイルに一致し、その一致度は0.9である。図4(b)を参照すると、ID「1」のユーザプロファイルは第1行目に格納されている。このユーザプロファイルは、関連するユーザプロファイルとしてID173のユーザプロファイルがあることが判る。このため、前述した文書選別処理におけるステップ103で、関連情報としてID173のユーザプロファイルが関連ユーザプロファイルであることが文書情報に追加される。図6(b)の下部に示す「(関連ユーザプロファイル:173)」が追加された関連情報である。
【0059】
これに対して、図6(c)に示す文書情報「円高に追い付かぬ………」は、図の下部に示すようにID「173」のユーザプロファイルに一致し、その一致度が0.95であり、さらに関連情報としてそのオリジナルのユーザプロファイルID「1」があることが判る。これは、前述した文書選別処理におけるステップ103の処理で、ID「173」のユーザプロファイルにはその派生の元となったユーザプロファイルがあることを図4(b)第4行目により検出して、そのID「1」を関連情報として追加したことによる。
【0060】
フィルタリングサーバのユーザプロファイル作成・格納部の処理
図9はユーザプロファイル作成・格納部1002の全体の処理手順を説明するフローチャート、図10は差分情報抽出処理の詳細を説明するフローチャート、図11はユーザプロファイル派生判定処理の詳細を説明するフローチャート、図12はユーザプロファイル派生処理の詳細を説明するフローチャートであり、次に、ユーザプロファイル作成・格納部1002の処理手順を図9〜図12に示すフローを参照して説明する。
【0061】
ユーザプロファイル作成・格納部全体の処理
図9に示すように、ユーザプロファイル作成・格納部1002は、ユーザが適合と判定した文書情報とユーザプロファイルとの差分情報を抽出し(ステップ201)、抽出した差分情報を用いて関連する他のユーザプロファイルを派生させるか否かを判定する(ステップ202)。ステップ202で、他のユーザプロファイルを派生させる必要がないと判定した場合、そのまま処理を終了し、他のユーザプロファイルを派生させるのであれば、差分情報を用いてユーザプロファイルを派生させて作成し、そのユーザプロファイルをユーザプロファイル格納エリアに格納する(ステップ203)。
【0062】
ユーザプロファイル作成・格納部における差分情報抽出処理
前述したステップ201の差分情報抽出処理は、図10に示すように、ユーザが適合と判定した文書情報を単語とその重みとを要素とするベクトルに変換する処理(ステップ2011)と、ユーザプロファイルをキーワードとその重みとを要素とするベクトルとして、適合と判定された文書情報のベクトルとの差を求め差分情報とする処理(ステップ2012)とにより実行される。
【0063】
ユーザプロファイル作成・格納部におけるプロファイル派生判定処理
前述したステップ202のプロファイル派生判定処理において、図11に示すように、まず、情報サーバから送信された文書情報を単語とその重みとを要素とするベクトルに変換する(ステップ2021)。次に、各文書情報と差分情報との一致度をベクトルの角度(数1に示す式を参照)を計算することにより求める(ステップ2022)。次に、差分情報との一致度が高い文書情報のみを収集し(ステップ2023)、それらの一致度が高い文書情報と元のユーザプロファイルとの一致度をステップ2022と同様に計算する(ステップ2024)。各文書情報と元のユーザプロファイルとの一致度が全体的に低いか否かを判定し、低ければ、「True」をリターンし、そうでなければ「False」をリターンする(ステップ2025)。
【0064】
ユーザプロファイル作成・格納部におけるユーザプロファイル派生処理
前述したステップ203のユーザプロファイル派生処理において、図12に示すように、差分情報に含まれる単語をキーワードとしてユーザプロファイルを作成し(ステップ2031)、そのユーザプロファイルをユーザプロファイル格納エリアに格納する(ステップ2032)。次に、ユーザプロファイル格納エリアの中の、作成したユーザプロファイルを格納した行の、オリジナルユーザプロファイルID格納エリアに、派生の元となったユーザプロファイルのIDをセットする(ステップ2033)。また、これに対応して元のユーザプロファイルの関連ユーザプロファイルID格納エリアに、作成したユーザプロファイルのIDをセットする(ステップ2034)。
【0065】
フィルタリングサーバのユーザプロファイル管理部の処理
図13はユーザプロファイル管理部1003の全体の処理を説明するフローチャート、図14はユーザプロファイル関係変更処理の詳細を説明するフローチャート、図15はユーザプロファイルマージ処理の詳細を説明するフローチャート、図16はユーザプロファイル破棄処理の詳細を示すフローチャートであり、次に、ユーザプロファイル管理部1003の処理手順を図13〜図16に示すフローを参照して説明する。
【0066】
ユーザプロファイル管理部全体の処理
図13に示すように、ユーザプロファイル管理部1003は、ユーザによって適合と判定される率が高いユーザプロファイルを優先するようにユーザプロファイル間の関係を変更する(ステップ301)。次に、類似したユーザプロファイルをマージし(ステップ302)、適合と判定される率が低下したユーザプロファイルを破棄する(ステップ303)。
【0067】
ユーザプロファイル管理部におけるユーザプロファイル関係変更処理
前述したステップ301のユーザプロファイル関係変更処理は、図14に示すように行われる。すなわち、まず、あるユーザプロファイルに一致する文書情報に対してユーザが適合と判定する率が一定以上になるか否かをチェックし(ステップ3011)、適合と判定する率が一定以上になれば、そのユーザプロファイルにオリジナルのユーザプロファイルがあるか否かをチェックする(ステップ3012)。ステップ3012で、そのユーザプロファイルにオリジナルのユーザプロファイルがあると判定すれば、オリジナルのユーザプロファイルが格納してある行の文書情報の適合率と比較する(ステップ3013)。ステップ3013で、関連ユーザプロファイルの適合率の方が高ければ、関連ユーザプロファイルがオリジナル、オリジナルのユーザプロファイルが関連ユーザプロファイルとなるようユーザプロファイルのオリジナルまたは関連ユーザプロファイルIDを修正する(ステップ3014)。前述のステップ3011〜3013の判定の結果が否であった場合、何も行うことなく処理を終了する。
【0068】
ユーザプロファイル管理部におけるユーザプロファイルマージ処理
前述したステップ302のユーザプロファイルマージ処理は、図15に示すように行われる。すなわち、まず、1ユーザが保持する複数のユーザプロファイル相互間の類似度を前述した数1に示す式を利用して計算する。この計算は、ユーザプロファイルをユーザプロファイルの中のキーワードとその重みとを要素とするベクトルとして考え、2つのユーザプロファイルのベクトルがなす角の余弦を類似度とする計算である(ステップ3021)。次に、類似度が一定以上のユーザプロファイルの組があるか否かをチェックしてマージ対象のユーザプロファイルがあるか否かをチェックし、マージ対象のユーザプロファイルがなければ処理を終了する(ステップ3022)。ステップ3022で、マージ対象のユーザプロファイルがあると判定すると、マージ対象をXとYとし(ステップ3023)、Yのオリジナルのユーザプロファイルの情報をXにマージする。すなわち、ユーザプロファイルYにオリジナルのユーザプロファイルZがあれば、そのオリジナルのユーザプロファイルZの関連ユーザプロファイルIDの中のユーザプロファイルYのIDをユーザプロファイルXのIDに置き換え、そのオリジナルのユーザプロファイルZのIDを、ユーザプロファイルXのオリジナルユーザプロファイルIDに追加する(ステップ3024)。次に、Yの関連ユーザプロファイルの情報をXにマージする。すなわち、ユーザプロファイルYに関連ユーザプロファイルVがあれば、その関連ユーザプロファイルVのオリジナルユーザプロファイルIDをユーザプロファイルXのIDに置き換え、その関連ユーザプロファイルVのIDを、ユーザプロファイルXの関連ユーザプロファイルIDに追加する(ステップ3025)。最後に、YをXにマージする。すなわち、XとYとをそれぞれのキーワードとその重みを要素とするベクトルとし、XのベクトルにYのベクトルを加え、ユーザプロファイルYのレコードを削除する(ステップ3026)。
【0069】
ユーザプロファイル管理部におけるユーザプロファイル破棄処理
前述したステップ303のユーザプロファイル破棄処理は、図16に示すように行われる。すなわち、まず、あるユーザプロファイルに一致する文書情報に対してユーザが適合と判定する適合率が一定以下になったか否かをチェックし、一定以下でなければ処理を終了する(ステップ3031)。ステップ3031のチェックで適合率が一定以下になった場合、そのユーザプロファイルを破棄してよいかをユーザに問い合わせ、ユーザが承認しなければ処理を終了する(ステップ3032)。ステップ3032でユーザが承認すれば、そのユーザプロファイルにオリジナルのユーザプロファイルがあるかをチェックし(ステップ3033)、あればオリジナルのユーザプロファイルの関連ユーザプロファイルのIDの中から破棄の対象となるユーザプロファイルのIDを削除する(ステップ3034)。また、ステップ3034の処理後、または、ステップ3033で、オリジナルのユーザプロファイルがなかった場合、破棄の対象となるユーザプロファイルに関連するユーザプロファイルがあるか否かをチェックし(ステップ3035)、あれば関連ユーザプロファイルのオリジナルユーザプロファイルのIDの中から破棄の対象となるユーザプロファイルのIDを削除する(ステップ3036)。ステップ3036の処理後、または、ステップ3035で、関連するユーザプロファイルがなかった場合、最後に、破棄の対象となるユーザプロファイルのレコードを削除する(ステップ3037)。
【0070】
ユーザプロファイル管理部の処理の一例
次に、前述したユーザプロファイル管理部の処理について図4を参照して説明する。
【0071】
図4(b)はユーザプロファイルの派生関係の修正前の状態、図4(c)はユーザプロファイルの派生関係の修正後の状態のユーザプロファイル格納エリアの一例を示している。図4(b)に示すように、ID「1」のユーザプロファイルの関連ユーザプロファイルはID「173」を有している。また、ID「173」のオリジナルユーザプロファイルのIDは「1」である。これに対して、ユーザプロファイル管理手段がID「1」とID「173」とのユーザプロファイルの適合率に基づいてオリジナルと関連のユーザプロファイルとのIDを変更した結果が図4(c)に示す例である。すなわち、ID「173」のユーザプロファイルの適合率が、ID「1」のユーザプロファイルの適合率より大きくなったことにより、ユーザプロファイル管理部は、図4(c)に示すように、ID「173」のユーザプロファイルの関連ユーザプロファイルをID「1」とし、ID「1」のオリジナルユーザプロファイルのIDを「173」とする。
【0072】
ユーザ端末
図17はユーザ端末2のモジュール構成を示すブロック図、図18は文書表示部の処理動作を説明するフローチャート、図19はユーザ端末2における文書表示画面の例を説明する図であり、以下、図17〜図19を参照してユーザ端末のソフトウェア構成及び処理動作について説明する。図17において、2001は文書表示部、2002は適合文書送信部、2003は選別文書、2004は適合文書である。
【0073】
図17に示すように、ユーザ端末2は、文書表示部2001及び適合文書送信部2002から構成される。文書表示部2001は、フィルタリングサーバ1からの選別文書情2003を受信して画面に表示し、適合文書送信部2002は、適合文書2004をフィルタリングサーバ1に送信する。適合文書送信部2002の処理は単純であるので詳細な説明を省略し、次に、文書表示部2001の処理動作を図18を参照して説明する。
【0074】
図18に示すように、文書表示部2001は、まず、選別文書2003の情報に関連ユーザプロファイルの情報があるか否かをチェックし(ステップ401)、なければ関連文書情報なしとしてその選別文書の情報を画面に表示する(ステップ404)。ステップ401のチェックで、関連ユーザプロファイルがあれば、そのユーザプロファイルに一致する文書情報が選択文書の中にあるか否かをチェックして(ステップ402)、関連ユーザプロファイルに一致する文書情報が選択文書の中になければ、関連文書情報なしとして選別文書の情報を画面に表示する(ステップ404)。ステップ402のチェックで、関連ユーザプロファイルに一致する文書情報が選択文書の中にあれば、関連文書情報ありとしてその選別文書の情報を画面に表示する(ステップ403)。ユーザが関連文書の表示を指示すれば(ステップ405)、その関連文書の情報を画面に表示する(ステップ406)。
【0075】
前述した文書表示部2001の処理により、ユーザ端末2に表示された文書表示画面の例において、図19(a)はある時点においてユーザに文書情報を提示しそれに対してユーザが適合と判定した例、図19(b)及び図19(c)はユーザが適合と判定した文書情報とそれに一致するユーザプロファイルとに基づいてユーザプロファイルを派生させた後の文書情報の例である。なお、図19(a)〜図19(c)に示す文書例は、それぞれ、図6(a)〜図6(c)に示す選別文書例と対応している。以下、それぞれの表示例について説明する。
【0076】
図19(a)に示す例は、図4(a)に示した状態のユーザプロファイルの中第1行目に格納されたID「1」に一致する図6(a)に示す文書情報の表示例と同一である。図4(a)の第1行目にはオリジナル、または、関連するユーザプロファイルのIDが格納されていない。そのため、図19(a)における、関連する文書情報の表示を指示するボタン「関連情報」は無効となっている。また、図19(a)に示す例では、ユーザが表示されている文書情報がユーザの興味に適合したとして、画面左上部のセレクトボタン「適合」と「不適合」とのうち、「適合」を選択している。
【0077】
図19(b)に示す例は、図19(a)に示す文書情報がユーザによって適合と判定された結果ID「1」のユーザプロファイルからID「173」のユーザプロファイルが派生した後の、ID「1」のユーザプロファイル、すなわち、元のユーザプロファイルに一致した文書情報を表示した例である。図4(b)に示したように、図19(a)に示す文書情報が適合と判定されても元のユーザプロファイルは直接更新されていない。従って、ユーザは、元のユーザプロファイルに表現されている興味(「半導体」と「生産」)に関する文書情報を参照することができる。さらに、元のユーザプロファイルから他のユーザプロファイルが派生した後なので、派生したユーザプロファイルに一致する文書情報があれば、画面右上部の「関連情報」ボタンが有効となる。ユーザは、この「関連情報」ボタンをクリックすることにより、元のユーザプロファイルから派生したユーザプロファイルに一致する文書情報を参照することができる。
【0078】
図19(c)は、図19(b)において「関連情報」ボタンがクリックされた後の関連情報のユーザプロファイルに一致する文書情報の例である。そして、この例の文書情報は、「円高」と「貿易」とに関する文書情報であり、図19(b)に示す文書情報と関連している。このように、ユーザは、ユーザプロファイル相互間の派生関係に基づいて文書情報を参照することができる。
【0079】
前述した本発明の実施形態による情報フィルタリングシステムは、フィルタリングサーバ1で文書情報を選別し、ユーザの適合判定に基づいてユーザプロファイルを派生させ管理し、元のユーザプロファイルを更新することなしに新たに生じたユーザの興味にあったユーザプロファイルを作成して、ユーザプロファイル間の派生関係に基づいて文書情報を関連付けて表示するようにしているので、ユーザは、最新の興味に関する文書情報と共に継続した興味に関する文書情報をも参照することができる。
【0080】
ユーザプロファイル作成・格納部の変形例1
図20はフィルタリングサーバのモジュール構成の他の構成例を示すブロック図、図21はユーザプロファイル作成・格納部の処理手順を説明するフローチャートであり、以下、図20、図21を参照して、フィルタリングサーバのモジュールにおけるユーザプロファイル作成・格納部の他の処理例について説明する。図20において、1011は文書格納エリアであり、他の符号は図3の場合と同一である。なお、この例を含む情報フィルタリングシステムの全体装置の構成及び装置のハードウェア構成は、図1及び図2に示すものと同一でよいため、その説明を省略する。
【0081】
図20に示すフィルタリングサーバは、文書選別部1001、ユーザプロファイル作成・格納部1002、及び、ユーザプロファイル管理部1003から構成される。これらのうち文書選別部1001とユーザプロファイル管理部1003とは、前述までに説明した本発明の実施形態の場合と同一であるので、ユーザプロファイル作成・格納部1002の処理動作についてのみ後述する。この例のユーザプロファイル作成・格納部1002を実現するために、フィルタリングサーバは、ユーザプロファイル格納エリア1004と文書格納エリア1011とを有する。これらのうちユーザプロファイル格納エリア1004は、図3に示したものと同様である。文書格納エリア1011には、ユーザが適合と判定した適合文書情報がユーザ別に格納される。さらに、この例におけるフィルタリングサーバ1は、情報サーバ3及びユーザ端末2と、文書情報1005、選別文書情報1006及び適合文書情報1007を送受信するが、これらは、前述までに説明した本発明の実施形態の場合と同様である。
【0082】
ユーザプロファイル作成・格納部1002の処理動作を説明する図21に示すフローにおいて、ユーザプロファイル作成・格納部1002は、ユーザから適合と判定された文書情報が送信されてくると、文書格納エリアに格納された文書情報との一致度を計算する。一致度の計算は、前述までに説明した本発明の実施形態における文書選択部での処理で説明した方法と同様であり、数1に示す式を用いて行うことができる(ステップ501)。次に、文書格納エリア1011に格納された文書情報のうち、ユーザが適合と判定した文書情報との一致度がある閾値を超えるものがないか否かをチェックし(ステップ502)、一致度がある閾値を超えるものがなければ、過去に類似した文書情報が送信されていないとして、適合と判定された文書情報とそのユーザプロファイルとに基づいてユーザプロファイルを作成してユーザプロファイル格納エリア1004に格納する(ステップ503)。ステップ503の処理後、または、ステップ502でユーザが適合と判定した文書情報との一致度がある閾値を超えるものがあった場合、ユーザが適合と判定した文書情報を文書格納エリア1011に格納して処理を終了する(ステップ504)。
【0083】
なお、前述のステップ503におけるユーザプロファイル作成・格納処理の詳細は、前述までに説明した本発明の実施形態の場合と同様である。前述した変形例1によれば、過去に類似したものがない文書情報に関してのみユーザプロファイルを新たに作成することが可能となる。
【0088】
【発明の効果】
以上説明したように本発明によれば、元のユーザプロファイルを更新することなく、新たに生じたユーザの興味にあったユーザプロファイルを作成することができるので、ユーザは、最新の興味に関する文書情報と共に、継続した興味に関する文書情報をも参照することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態による情報フィルタリングシステムの全体構成を示すブロック図である。
【図2】情報フィルタリングシステムを構成する装置のハードウェア構成を示すブロック図である。
【図3】フィルタリングサーバのモジュール構成を示すブロック図である。
【図4】ユーザプロファイル格納エリアに格納されるユーザプロファイルの構成を説明する図である。
【図5】フィルタリングサーバが送受信する文書情報の例を説明する図である。
【図6】複数のユーザプロファイルにより選別された文書情報の例を説明する図である。
【図7】ユーザ端末からフィルタリングサーバに送信する適合文書情報の例を説明する図である。
【図8】情報サーバから送信された1つの文書情報に対してユーザプロファイルを用いて選別する処理の手順を説明するフローチャートである。
【図9】ユーザプロファイル作成・格納部の全体の処理手順を説明するフローチャートである。
【図10】差分情報抽出処理の詳細を説明するフローチャートである。
【図11】ユーザプロファイル派生判定処理の詳細を説明するフローチャートである。
【図12】ユーザプロファイル派生処理の詳細を説明するフローチャートである。
【図13】ユーザプロファイル管理部の全体の処理を説明するフローチャートである。
【図14】ユーザプロファイル関係変更処理の詳細を説明するフローチャートである。
【図15】ユーザプロファイルマージ処理の詳細を説明するフローチャートである。
【図16】ユーザプロファイル破棄処理の詳細を示すフローチャートでありる。
【図17】ユーザ端末のモジュール構成を示すブロック図である。
【図18】文書表示部の処理動作を説明するフローチャートである。
【図19】ユーザ端末2における文書表示画面の例を説明する図である。
【図20】フィルタリングサーバのモジュール構成の他の構成例を示すブロック図である。
【図21】図20におけるユーザプロファイル作成・格納部の処理手順を説明するフローチャートである。
【符号の説明】
1 フィルタリングサーバ
2 ユーザ端末
3 情報サーバ
10 CPU
20 ハードディスク
30 メモリ
40 ディスプレイ
41 ディスプレイ制御部
50 キーボード
51 キーボード制御部
60 マウス
61 マウス制御部
70 通信制御部
80 バス
1001 文書選別部
1002 ユーザプロファイル作成・格納部
1003 ユーザプロファイル管理部
1004 ユーザプロファイル格納エリア
1005 文書
1006 選別文書
1007 適合文書
1011 文書格納エリア
2001 文書表示部
2002 適合文書送信部
2003 選別文書
2004 適合文書

Claims (3)

  1. 情報サーバ及びユーザ端末と接続されたフィルタリングサーバであって、前記情報サーバから文書情報を取得する手段と、1ユーザに対するユーザプロファイルを複数保持する手段と、前記複数のユーザプロファイルに基づいて前記文書情報の選別を行う手段と、前記選別した情報を前記ユーザ端末に送信する手段と、前記ユーザ端末においてユーザが入力した前記選別した文書情報の適合判定結果を前記ユーザ端末から受信する手段と、ユーザが適合と判定した文書情報を単語とその重みとを要素とするベクトルとし、前記ユーザプロファイルをキーワードとその重みとを要素とするベクトルとして、前記両ベクトルの差を求めることにより、ユーザが適合と判定した文書情報と前記ユーザプロファイルとの差分情報を抽出し、情報サーバから送信された文書情報の中から前記差分情報との一致度が高い文書情報を収集し、前記差分情報と一致度が高い文書情報と前記ユーザプロファイルとの一致度が低ければ、差分情報をキーワードとして新たにユーザプロファイルを作成するユーザプロファイル作成手段とを有することを特徴とする情報フィルタリングサーバ。
  2. 上記各手段に加えて、上記差分情報を抽出したユーザプロファイルをオリジナルプロファイルとし、新たに作成したユーザプロファイルを関連プロファイルとして互いに関係付けて管理する管理手段を有することを特徴とする請求項1記載の情報フィルタリングサーバ。
  3. 前記管理手段は、オリジナルプロファイルに一致する文書情報に対してユーザが適合と判定する率と、前記オリジナルプロファイルに関係付けられた関連プロファイルに一致する文書情報に対してユーザが適合と判定する率とを比較し、前記関連プロファイルに一致する文書情報に対してユーザが適合と判定する率のほうが高ければ、前記関連プロファイルをオリジナルプロファイルとし、前記関連プロファイルに関係付けられたオリジナルプロファイルを関連プロファイルとして関係付けを変更することを特徴とする請求項2記載の情報フィルタリングサーバ。
JP27350198A 1998-09-28 1998-09-28 情報フィルタリングサーバ Expired - Fee Related JP3759321B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27350198A JP3759321B2 (ja) 1998-09-28 1998-09-28 情報フィルタリングサーバ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27350198A JP3759321B2 (ja) 1998-09-28 1998-09-28 情報フィルタリングサーバ

Publications (2)

Publication Number Publication Date
JP2000105764A JP2000105764A (ja) 2000-04-11
JP3759321B2 true JP3759321B2 (ja) 2006-03-22

Family

ID=17528784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27350198A Expired - Fee Related JP3759321B2 (ja) 1998-09-28 1998-09-28 情報フィルタリングサーバ

Country Status (1)

Country Link
JP (1) JP3759321B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002215665A (ja) * 2001-01-16 2002-08-02 Dainippon Printing Co Ltd 情報推薦サーバー装置
JP2002342364A (ja) * 2001-05-11 2002-11-29 Kddi Corp 文献情報管理方法及びシステム
US7403990B2 (en) 2002-05-08 2008-07-22 Ricoh Company, Ltd. Information distribution system
DE102004020878A1 (de) * 2004-04-28 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zur Informationswiedergabe
JP5362649B2 (ja) * 2010-05-24 2013-12-11 日本電信電話株式会社 文字列ベクトル変換装置、文字列ベクトル変換方法、プログラム、及びプログラムを格納したコンピュータ読み取り可能な記録媒体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3810463B2 (ja) * 1995-07-31 2006-08-16 株式会社ニューズウオッチ 情報フィルタリング装置

Also Published As

Publication number Publication date
JP2000105764A (ja) 2000-04-11

Similar Documents

Publication Publication Date Title
US8019659B2 (en) Catalog taxonomy for storing product information and system and method using same
JP4098539B2 (ja) プロファイル情報の推薦方法、プログラム及び装置
US9576029B2 (en) Trust propagation through both explicit and implicit social networks
JP4637113B2 (ja) 階層データの好ましいビューを構築するための方法
US9576076B2 (en) Catalog taxonomy for storing product information and system and method using same
US20110231372A1 (en) Adaptive Archive Data Management
US20080281807A1 (en) Search engine
US6886016B2 (en) Method and system for supporting multivalue attributes in a database system
JP3896014B2 (ja) 情報収集システム、情報収集方法及びコンピュータに情報収集を実行させるプログラム
JP3707361B2 (ja) 情報提供サーバ及び情報提供方法
CN115220773B (zh) 低代码、可视化生成后台数据管理代码的系统和方法
KR20130053407A (ko) 데이터베이스 검색에 있어 조회 향상
CN104919452A (zh) 使用图像来改善人搜索
US8832097B2 (en) Vertical search expansion, disambiguation, and optimization of search queries
EP1556788A2 (en) Intelligent classification system
JP2015197722A (ja) 文書検索装置、文書検索方法、プログラム、及び、文書検索システム
US7389290B2 (en) System and method for scoring new messages based on previous responses within a system for harvesting community knowledge
JP4855080B2 (ja) スキーマ統合支援装置、スキーマ統合支援装置のスキーマ統合支援方法およびスキーマ統合支援プログラム
JP3759321B2 (ja) 情報フィルタリングサーバ
KR20010104871A (ko) 검색결과의 자동분류 기능을 갖는 인터넷 사이트 검색서비스 시스템
JP2013105215A (ja) レコメンド情報生成装置、レコメンド情報生成方法及びレコメンド情報生成プログラム
US20020116203A1 (en) System and method for managing job resumes
JP5488031B2 (ja) 検索装置
JP6751960B1 (ja) 情報処理システムおよび情報処理方法
JP2006330899A (ja) 電子メールおよびファイルの管理方法、プログラム及び計算機システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050405

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050830

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051228

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees