JP2000259529A - 個人プロファイル管理装置及び記憶媒体 - Google Patents

個人プロファイル管理装置及び記憶媒体

Info

Publication number
JP2000259529A
JP2000259529A JP11061864A JP6186499A JP2000259529A JP 2000259529 A JP2000259529 A JP 2000259529A JP 11061864 A JP11061864 A JP 11061864A JP 6186499 A JP6186499 A JP 6186499A JP 2000259529 A JP2000259529 A JP 2000259529A
Authority
JP
Japan
Prior art keywords
information
word
profile
appearance frequency
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11061864A
Other languages
English (en)
Inventor
Takashi Yamashita
剛史 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP11061864A priority Critical patent/JP2000259529A/ja
Publication of JP2000259529A publication Critical patent/JP2000259529A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 クライアントのプロファイルを参照する他の
クライアントに対して、参照しようとするそのクライア
ントが属する集団に応じた適切なプロファイルを提供す
る。 【解決手段】 ユーザ単語出現頻度情報記憶部20は、
過去に送受信した全相手のテキスト情報より抽出した全
単語に対する各単語の出現割合を全員単語出現頻度情報
として記憶する。単語出現頻度情報統合部28は、全員
単語出現頻度情報をプロファイルの開示を要求する相手
が属するグループに関して統合し、全単語中での各単語
の総出現回数と出現割合を算出する。プロファイル決定
部30は、総出現回数と出現割合に応じ、開示を要求す
る相手の属するグループに適したユーザのプロファイル
を決定し、要求した相手に提供する。

Description

【発明の詳細な説明】
【0001】
【発明の属する分野】本発明は、個人の専門領域や興味
を知るための重要な単語をプロファイルとして抽出する
作業を支援し、データベース等に登録された個人プロフ
ァイル情報を利用して電子メールや電子ニュースなどの
選択や顕現度付けを行う、あるいは、データベース等に
登録された個人プロファイル情報をキーワードをもとに
検索を行う、個人プロファイル抽出装置、個人プロファ
イル管理装置、及び情報フィルタリング装置あるいは個
人プロファイル検索装置に関する。
【0002】
【従来の技術】多数の人物の中から、自分にとって有用
な情報を持つ人物のみと選択的にコミュニケーションを
行うために、個人の興味を登録した個人プロファイルを
有する個人プロファイル検索装置が提案されている。こ
の時、個人プロファイルは、属性名と属性値の組、ある
いは、複数のフリーキーワード等によって構成される。
【0003】この個人プロファイルは、本人が自己につ
いて記述した場合、本当の専門性や興味を表現していな
いことと、興味の時間的な変化に合わせて個人プロファ
イルも更新しなければならない等の問題点があり、個人
プロファイルを自動的に抽出する技術が提案されてい
る。抽出の手段としては、例えば、特開平08-235088号
に開示されるように、送受信されるテキスト情報から、
個人の興味を表現する複数の単語を抜き出し、該個人が
該テキスト情報に対して行った処理の頻度情報などを活
用して、プロファイルに含まれる個々の項目の優先度を
該個人の興味の実体に合致するように調整するものがあ
る。
【0004】しかし、個人の興味を的確に表現している
だけでは、情報フィルタリング装置あるいは個人プロフ
ァイル検索装置の手段として利用する場合、他者との相
対的な関係に起因する問題点があった。例えば、ある個
人の興味を的確に表現する単語の上位に位置するものが
「情報」や「コンピュータ」等であった場合、専門分野
を特定していない集団においては十分に個人プロファイ
ルとして機能するが、情報やコンピュータに興味を持っ
ている集団においては、他の多くの人々の個人プロファ
イル中にも同じ単語が出現するために、「情報」「コン
ピュータ」は個人を特徴付ける単語にはならない。した
がって、個人の興味を的確に表現しているだけでは、集
団における個人の特徴を表現するために最適なプロファ
イルを抽出することができなかった。
【0005】
【発明が解決しようとする課題】上述の問題点を解決す
る技術として、特願平9−364536号がある。これ
は、「クライアント間で情報の送受信を行うことができ
るシステム上で、あるクライアントが他者に送信した情
報および他者から受信した情報から単語を抽出し、各単
語の出現回数を計数することで、該クライアントの単語
データを獲得する。ついで、該クライアントが情報を送
受信したクライアントの単語データを参照し、複数の個
人に関する単語データに統合する。統合された単語デー
タと該クライアントの単語データとから、他クライアン
トの単語に対する該クライアントの単語の相対的な顕現
度を定め、該クライアントに特徴的な単語をプロファイ
ルとして選定する」というものである。
【0006】特願平9−364536号に記載の技術に
おいては、単語の相対的な顕現度を定めるために複数の
個人に関する単語データを収集するが、収集された単語
データを集団の区別をせず混合して使用するため、該技
術で作成される個人プロファイル情報を、直接情報を送
受信するクライアントが参照したときに、次にあげる状
況が生じる。
【0007】すなわち、クライアントAが直接情報を送
受信するクライアントのいくつかは、同じ専門領域をも
つ集団に分類することができる。ここで、クライアント
Aが直接情報を送受信するクライアント群から2つの集
団が抽出できる場合を考える。このうち、クライアント
Aと直接情報を送受信する、あるクライアントBが属す
る集団を集団Xとし、もう一方を集団Yとする。クライ
アントAのプロファイルをクライアントBが参照する
と、クライアントBは、集団Xに高頻出する単語と、集
団Yに高頻出する単語をプロファイルとして獲得するこ
とが多い。しかしながら、クライアントBにとって、集
団Xに高頻出する単語はクライアントAを識別するプロ
ファイルとしては有効に機能しない。これは、情報やコ
ンピュータに興味を持っている集団において、プロファ
イルとして「情報」「コンピュータ」という単語をプロ
ファイルとして使うことに相当する。集団Xに関してク
ライアントBに有効なプロファイルとは、集団Xに範囲
を限定し、この集団内で相対的に作成されたクライアン
トAのプロファイルである。
【0008】この問題は、特願平9−364536号に
記載の技術が、単語の相対的な顕現度を定めるために収
集した複数の個人に関する単語データを、集団毎に分け
て使用する機構を持たないことに起因する、本質的な問
題である。
【0009】本発明は、上述の問題点に鑑みなされたも
ので、クライアントAのプロファイルを参照するクライ
アントBに対して、クライアントBが属する集団とそれ
以外の集団におけるクライアントAのプロファイルを、
動的に作成し参照させるシステムを提供することを目的
とする。
【0010】
【課題を解決するための手段】本発明は上記課題を解決
するために以下の構成とした。すなわち、本発明の個人
プロファイル管理装置は、情報を送受信する情報管理装
置に付設されて、情報管理装置を利用するユーザに関す
る個人プロファイルを、送受信する情報に基づいて管理
する個人プロファイル管理装置において、他の情報管理
装置との間で通信された情報から送受信相手を識別する
情報とテキスト情報とを抽出する送受信情報獲得部と、
テキスト情報から単語を抽出し、当該単語の出現回数を
計数する単語分割/頻度計算部と、情報の送受信相手別
に、過去に送受信したテキスト情報より抽出した全単語
に対する各単語の出現割合を算出して個別単語出現頻度
情報を生成し記憶する、かつ、過去に送受信した全相手
のテキスト情報より抽出した全単語に対する各単語の出
現割合を算出して全員単語出現頻度情報を生成し記憶す
るユーザ単語出現頻度情報記憶部と、他の個人プロファ
イル管理装置との間で、生成した全員単語出現頻度情報
の授受を行う情報通信部と、当該個人プロファイル管理
装置のユーザ以外の相手からプロファイルの開示を要求
されたときに、この相手を識別する情報を獲得するアク
セス管理部と、送受信相手を識別する情報から、送受信
相手をグループ毎に分類するクラスタ解析部と、自他の
個人プロファイル管理装置で生成された全員単語出現頻
度情報を、プロファイルの開示を要求する相手が属する
グループに関して統合し、自他の個人プロファイル管理
装置で抽出された全単語中での各単語の総出現回数およ
び出現割合を算出する単語出現頻度情報統合部と、自己
の情報管理装置を利用するユーザー個人の特徴を表すプ
ロファイルを、算出された前記総出現回数及び出現割合
に基づき、開示を要求する相手が属するグループに応じ
て決定するプロファイル決定部とを有することを特徴と
する。
【0011】ここで、クラスタ解析部は、同一の情報が
複数の情報管理装置に送受信されたとき、これらの情報
管理装置を同一のグループに属するとみなすのが好適で
ある。
【0012】また、クラスタ解析部は、同一の情報が複
数の情報管理装置に送受信されたとき、これらの情報管
理装置の中で一相手がすでにあるグループに属するとみ
なされているならば、その他の情報管理装置も当該グル
ープに属するとみなすのが好適である。
【0013】また、本発明は、情報管理装置を利用する
ユーザに関する個人プロファイルを、送受信する情報に
基づいて管理するプログラムを記憶した媒体を提供す
る。このプログラムは、コンピュータに対して少なくと
も、他の情報管理装置との間で通信された情報から送受
信相手を識別する情報とテキスト情報とを抽出させ、テ
キスト情報から単語を抽出し、当該単語の出現回数を計
数させ、情報の送受信相手別に、過去に送受信したテキ
スト情報より抽出した全単語に対する各単語の出現割合
を算出して個別単語出現頻度情報を生成し記憶させると
ともに、過去に送受信した全相手のテキスト情報より抽
出した全単語に対する各単語の出現割合を算出して全員
単語出現頻度情報を生成し記憶させ、他の個人プロファ
イル管理装置との間で、生成した全員単語出現頻度情報
の授受を行わせ、当該個人プロファイル管理装置のユー
ザ以外の相手からプロファイルの開示を要求されたとき
に、この相手を識別する情報を獲得させ、送受信相手を
識別する情報から、送受信相手をグループ毎に分類さ
せ、自他の個人プロファイル管理装置で生成された全員
単語出現頻度情報を、プロファイルの開示を要求する相
手が属するグループに関して統合し、自他の個人プロフ
ァイル管理装置で抽出された全単語中での各単語の総出
現回数および出現割合を算出させ、自己の情報管理装置
を利用するユーザ個人の特徴を表すプロファイルを、算
出された前記総出現回数と前記出現割合に基づき開示を
要求する相手が属するグループに応じて決定させる。記
憶媒体には、CD−ROMやDVD、ハードディスクな
ど電磁気的、化学的、あるいは光学的に情報を担持でき
る任意の媒体が含まれる。
【0014】
【発明の実施の形態】本発明の実施形態の全体構成を図
1に示す。この個人プロファイル管理装置は、複数のク
ライアントシステムと、これらの間で通信を行うネット
ワークから構成される。なお、図2では、クライアント
システムが複数存在することを、小さなブロックがネッ
トワークで接続されている様子で示し、ブロック内の構
成は重複を避けるために省略した。
【0015】図1において、1つのクライアントシステ
ムは、唯一のプロファイル作成部10と送信開始指令部
12、情報管理装置を通して情報を送受信した人数と同
数の単語出現頻度情報通信部14を含んで構成される。
【0016】プロファイル作成部10は、送受信情報獲
得部16、単語分割/頻度計算部18、ユーザ単語出現
頻度情報記憶部20、アドレス情報蓄積部22、アクセ
ス管理部24、クラスタ解析部26、単語出現頻度情報
統合部28、プロファイル決定部30よりなる。
【0017】単語出現頻度情報通信部14は、単語出現
頻度情報送信部32、単語出現頻度情報受信部34より
なる。
【0018】また、クライアントシステムはユーザごと
に存在する。クライアントシステムは、単語出現頻度情
報通信部14とコンピュータネットワークを通して互い
に情報の通信を行う。
【0019】なお、本実施形態では、クライアント間で
送受信される情報として電子メールを扱ったが、送受信
相手を特定できる情報を利用できるなら本発明は実施可
能であり、本発明の適用は電子メールに限定されない。
【0020】以下で、クライアントシステムの各処理部
の動作の詳細について説明する。
【0021】<送受信情報獲得部>送受信情報獲得部1
6は、電子メールシステムなどの情報管理装置が、他者
の管理下にある情報管理装置に情報を送信したことを検
出する。例えば、電子メールシステムの場合、SMTP
などのプロトコルにしたがって、他者の管理下にある情
報管理装置に情報を送信したことを検出する。そして、
送信情報から、テキスト情報と、情報を送受信した相手
を特定できるアドレス情報とを獲得する。
【0022】また、送受信情報獲得部16は、電子メー
ルシステムなどの情報管理装置が、他者の管理下にある
情報管理装置から情報を受信したことを検出する。例え
ば、電子メールシステムの場合、SMTPなどのプロト
コルにしたがって、他者の管理下にある情報管理装置か
ら情報を受信したことを検出する。そして、受信情報か
ら、テキスト情報と、情報を送受信した相手を特定でき
るアドレス情報とを獲得する。送受信情報獲得部16
は、アドレス情報とテキスト情報を獲得すると、アドレ
ス情報とテキスト情報を単語分割/頻度計算部18へ、
アドレス情報をアドレス情報蓄積部22へ送る。
【0023】<単語分割/頻度計算部>単語分割/頻度
計算部18は、送受信情報獲得部16から電子メール一
通分のアドレス情報とテキスト情報を受け取ると、すで
に公知である形態素解析技術を用いて、テキスト情報か
ら単語を抽出する。単語分割/頻度計算部18は、人名
・地名等の単語を登録した削除単語リストを有し、抽出
された単語の中にリストに登録されている単語と同じも
のがあれば、その抽出された単語を削除する。次に、抽
出された単語に重複があれば、同じ単語がいくつ存在す
るかを計数する。そして、抽出されたすべての単語につ
いて、単語Wdとその出現回数Wdfとを組としたデータ
Dを作成する。抽出された単語がn個残ったとき(n≧
1)、データの組{D[1], ... ,D[n]}をユーザ単語出現
頻度情報記憶部20へ、アドレス情報を付加して転送す
る。
【0024】図3は、ユーザ単語出現頻度情報記憶部2
0へ転送するデータの一例である。抽出された単語の総
数は50である。9個の単語は重複を含み、例えば「プ
ロファイル」という単語は、延べ3個存在することを表
す。
【0025】<ユーザ単語出現頻度情報記憶部>ユーザ
単語出現頻度情報記憶部20は、電子メールを送受信し
た相手毎に電子メールのテキスト情報を解析した結果を
蓄積する個別単語出現頻度情報と、電子メールの送受信
者全員分の電子メールのテキスト情報を解析した結果を
蓄積する全体単語出現頻度情報を有する。これらの情報
保持のために、複数の記憶領域が用意されている。これ
ら各々の記憶領域には、ユーザが送受信した電子メール
のテキスト情報から抽出した単語の出現頻度の累積値が
記憶される。
【0026】ユーザ単語出現頻度情報記憶部20は、単
語分割/頻度計算部18からデータを受け取ると、各単
語出現頻度情報の更新を開始する。まず、ユーザ単語出
現頻度情報記憶部20は、個別単語出現頻度情報の更新
を開始する。ここにおける単語出現頻度情報の記憶単位
は、単語Wf、単語Wfの累積出現頻度Wff、該記憶
領域に記憶されている全ての単語の累積出現頻度{Wff
[1], ..., Wff[m]}(mは、該記憶領域に登録されている
単語の種類の総数)の総和Sで割ることにより得られる
Wfの累積出現割合Wfr、を組としたデータFであ
る。該記憶領域には、データの組{F[1], ... , F[m]}
と、電子メールを送受信した相手のアドレス情報とが記
憶される。図4に、個別単語出現頻度情報の一例を示
す。
【0027】また、ユーザ単語出現頻度情報記憶部20
は、単語分割/頻度計算部18から情報を獲得すると、
アドレス情報を参照して、該当する送受信相手の記憶領
域へアクセスし、次の処理を行う。
【0028】(1)データの組{D[1], ... ,D[n]}の要
素数を表す変数Nにnを代入する。データの組{F[1],
... ,F[m]}の要素数を表す変数Mにmを代入する。手
順(2)へ進む。
【0029】(2){D[1], ... ,D[n]}内の一つの記憶
単位D[i]を指す変数iに1を代入する。
【0030】(3){F[1], ... ,F[m]}内の一つの記憶
単位F[j]を指す変数jに1を代入する。手順(3−1)
へ進む。
【0031】(3−1)D[i]に含まれる単語Wd[i]が、F
[j]に含まれる単語Wf[j]と一致するか調べる。Wd[i]とW
f[j]が一致したとき、手順(3−2)へ進む。Wd[i]とW
f[j]が一致しないとき、手順(3−3)へ進む。
【0032】(3−2)F[j]に含まれる累積出現頻度Wf
f[j]の値に、D[i]に含まれる出現回数Wdf[i]の値を足し
て得た値を、Wff[j]に代入する。手順(4)へ進む。
【0033】(3−3)現在のjの値に1を足した値を
jに代入する。手順(3−4)へ進む。
【0034】(3−4)jがM以下の値をとるとき、手
順(3−1)へ戻る。jがMより大きい値をとるとき、
手順(3−5)へ進む。
【0035】(3−5)新規データF[M+1]を該単語出現
頻度記憶領域に登録するために、該単語出現頻度記憶領
域を拡張する。手順(3−6)へ進む。
【0036】(3−6)記憶領域の拡張された箇所に、
新規データF[M+1]={Wf[i], Wff[i], 0.0}を記憶する。
現在のMの値に1を足した値をMに代入する。手順
(4)へ進む。
【0037】(4) 現在のiの値に1を足した値をiに
代入する。手順(5)へ進む。
【0038】(5)iがNより大きくなれば、手順
(6)へ進む。それ以外の場合は、手順(3)に戻る。
【0039】(6)Wff[1]+...+Wff[M] を計算し、この
値をSに代入する。手順(7)に進む。
【0040】(7)jに1を代入する。手順(8)に進
む。
【0041】(8)Wff[j]÷Sを計算し、この値を累積
出現割合Wfr[j]に代入する。現在のjの値に1を足した
値をjに代入する。手順(9)へ進む。
【0042】(9)jがM以下の値をとるとき、手順
(7)へ戻る。jがMより大きい値をとるとき、処理を
中止する。
【0043】上記の手順の概要を図5に示す。なお、単
語出現頻度情報の蓄積方法は上述の方法に限らない。出
現頻度の高い単語が相対的に上位にランクされる方法で
あればよく、例えば、上記手順(8)においてWfr[j]に
(Wff[j]÷S)2を代入してもよい。
【0044】次に、ユーザ単語出現頻度情報記憶部20
は、全体単語出現頻度情報の更新を開始する。ここにお
ける単語出現頻度情報の記憶形式は、上述の、個別単語
出現頻度情報の場合と同じであり、アドレス情報が登録
されていない(null)点だけが異なる。
【0045】そして、ユーザ単語出現頻度情報記憶部2
0は、単語分割/頻度計算部18から情報を獲得する
と、アドレス情報がnullである記憶領域へアクセス
し、上述の(1)〜(9)の処理を行う。
【0046】<アドレス情報蓄積部>アドレス情報蓄積
部22は、送受信情報獲得部16から受け取った、電子
メールを送受信した相手を特定できるアドレス情報を、
送信者アドレスおよび受信者アドレスとして蓄積する。
SMTPの場合、送信者アドレスはFromフィールド
に含まれるアドレスであり、受信者アドレスはToフィ
ールド、Cc:フィールド、Bcc:フィールドに含まれ
るアドレスである。送信者アドレスと受信者アドレスを
組として、図6に示すデータ構造で蓄積する。
【0047】<送信開始指令部>各クライアントシステ
ムは各々、ほぼ同時刻を示すタイマーを所有する。送信
開始指令部12はこのタイマーを参照し、所定の時間間
隔で、単語出現頻度情報送信部32に対して、送信開始
の指令を送る。
【0048】本実施形態では、各クライアントがタイマ
ーを所有する形態を示したが、ほぼ同時に各クライアン
トシステムが作動を始められる構成であればよく、例え
ば、各クライアントにより共有されるタイマー・サーバ
を設置して、各クライアントの送信開始指令部がこのサ
ーバへアクセスする形態でもよい。
【0049】<単語出現頻度情報送信部>単語出現頻度
情報送信部32は、送信開始指令部12から送信開始命
令を受けると、ユーザ単語出現頻度情報記憶部20へア
クセスし、全員単語出現頻度情報を取得する。そして、
ネットワークでつながっている相手の単語出現頻度情報
受信部へ該単語出現頻度情報を送信する。
【0050】<単語出現頻度情報受信部>単語出現頻度
情報受信部34は、ネットワークでつながっている相手
の単語出現頻度情報送信部から送信された全員単語出現
頻度情報を受信する。受信した全員単語出現頻度情報
を、単語出現頻度情報受信部自身が持つバッファ部に格
納する。
【0051】<アクセス管理部>アクセス管理部24
は、外部の情報管理装置から該クライアントシステム・
ユーザのプロファイルの公開を要求されると、要求した
相手のアドレス情報を識別した後、このアドレス情報を
単語出現頻度情報統合部28へ送る。これが、該クライ
アントシステム・ユーザのプロファイル作成のトリガと
なる。
【0052】アクセス管理部24は、プロファイル決定
部からプロファイルを受け取ると、プロファイルの公開
を要求した相手へ、このプロファイル情報を送信する。
【0053】<クラスタ解析部>クラスタ解析部26
は、単語出現頻度情報統合部28からプロファイルの公
開を要求した相手のアドレス情報を受けると、次の手順
でクラスタ解析を開始する。
【0054】(1)アドレス情報蓄積部に記憶されてい
る全種のアドレスから(ただし、該クライアント・シス
テムを利用しているユーザのアドレスは含めない)、ア
ドレスAdd、クラスタ・ラベルCL、を組としたデータT
を作成する。データTに記載される各アドレスに対し
て、ユニークなラベルを割り当てる。本実施形態では、
上から順に1、2、3、・・・と割り当てる。データT
の一例を図7に示す。
【0055】(2)データTに登録されている、あるア
ドレスAdd[n]に関して、以下の操作を行う。アドレス情
報蓄積部22に記憶されている、送信者・受信者の組の
一つを参照し、この中にAdd[n]が出現するなら、この送
信者・受信者の組の中に出現するアドレス全てに関し
て、データT内のこれらのアドレスに対応するクラスタ
・ラベルを全て同じものに書きかえる。これの例を、図
8に示す。この操作を、アドレス情報蓄積部22に記憶
されている全てのデータに対して行う。
【0056】(3)(2)の操作を、データTに登録さ
れている全てのアドレスに対して行う。
【0057】(4)データT内にプロファイルの公開を
要求した相手のアドレスが存在するかどうか検索する。
存在する場合は、(5)〜(6)の処理を行う。存在し
ない場合は(6)の処理を行う。
【0058】(5)データT内の、プロファイルの公開
を要求した相手のアドレスに対応するクラスタ・ラベル
を確認し、データT内でこれと同じクラスタ・ラベル名
を持つアドレスのみを対象としたアドレスのリストXを
作成する。ついで、データT内で、リストXに記載され
ていないアドレスのみを対象としたアドレスのリストY
を作成する。これの例を図9に示す。リストXには主
に、プロファイルの公開を要求した相手と縁がある相手
のアドレスが含まれる。リストYには、逆に縁のない相
手のアドレスが含まれる。
【0059】(6)データT内に登録されている全ての
アドレスを含むリストZを作成する。
【0060】クラスタ解析部は、(4)でプロファイル
の公開を要求した相手のアドレスが存在した場合には、
リストX、リストY、リストZを、存在しなかった場合
にはリストZを、単語出現頻度情報統合部28へ送る。
【0061】<単語出現頻度情報統合部>単語出現頻度
情報統合部28は、アクセス管理部24からプロファイ
ルの公開を要求した相手のアドレス情報を受けると、ク
ラスタ解析部26へこのアドレス情報を送る。そして、
クラスタ解析部26から3つあるいは1つのアドレスの
リストを受け取る。
【0062】次に、単語出現頻度情報統合部28は、リ
ストの情報に従って、各単語出現頻度情報受信部34内
バッファに格納されている単語出現頻度情報の統合と、
ユーザ単語出現頻度情報記憶部20内の個別単語出現頻
度情報の統合とを行う。前者の統合の場合、次の手順で
行われる。
【0063】(1)リストZの情報に従って単語出現頻
度情報の統合を行うとき、リストZに含まれる各アドレ
スに対応する単語出現頻度情報受信部34内のバッファ
へアクセスする。そして、これらに記憶されている全て
の種類の単語を抽出し、該単語出現頻度情報統合部28
内のバッファZ1に記憶する。抽出した単語の一つをW
とすると、バッファZ1には、単語、単語の出現頻度、
単語の出現割合を組とするデータ{Wc, Wcf, Wcr} = {W,
0, 0.0}を1単位として記憶させる。抽出した全ての種
類の単語について、この処理を行う。
【0064】(2)バッファZ1に記憶されたある単語
W’について、アクセスしている各単語出現頻度情報受
信部34内バッファに、W’が登録されていないか調べ
る。W’が登録されていれば、その単語出現頻度情報受
信部34内バッファにおける単語W’に対応する出現頻
度を、バッファZ1の単語W’の出現頻度の項に足す。
この処理を、バッファZ1に記憶された全ての単語につ
いて行う。
【0065】(3)バッファZ1に記憶されている全て
の単語の出現頻度の総和を計算する。この値をS’とす
る。ついで、バッファZ1の各単語に対応する出現割合
の項に、(該単語の出現頻度)÷S’で得られる値を代入
する。以上の手順の概要を、図10に示す。リストX、
リストYが存在するときには、同様の処理を行い、それ
ぞれの結果をバッファX1、バッファY1に格納する。
【0066】また、後者の統合の場合も、前者の統合と
同様に行われるが、「リストZに含まれる各アドレスに
対応する単語出現頻度情報受信部34内バッファへアク
セス」するかわりに「ユーザ単語出現頻度情報記憶部2
0内の、リストZに含まれる各アドレス情報に対応する
個別単語出現頻度情報にアクセスする」点と、「バッフ
ァZ1」のかわりに「バッファZ2」に統合情報を格納
する点が異なる。また、リストX、リストYが存在する
ときにも同様の処理を行い、それぞれの結果をバッファ
X2、バッファY2に格納する。
【0067】以上、単語出現頻度情報の統合が終了する
と、単語出現頻度情報統合部28は、クラスタ解析部2
6から受け取った3つあるいは1つのアドレスのリスト
をプロファイル決定部30に送る。
【0068】<プロファイル決定部>プロファイル決定
部30は、単語出現頻度情報統合部28から3つあるい
は1つのアドレスのリストを受け取ると、該クライアン
トシステムを利用するユーザに関する単語顕現度を算出
し、ついでプロファイルを作成する。プロファイルは、
単語出現頻度情報統合部28から受け取ったリスト毎に
作成される。
【0069】そして、プロファイル決定部30は、リス
トZに従ってプロファイルを作成する際に、単語出現頻
度情報統合部28内のバッファZ1およびバッファZ2
にアクセスし情報を得る。このプロファイルの作成は、
次の手順により作成される。
【0070】(1)単語出現頻度情報統合部28内のバ
ッファZ2へアクセスし、これに記憶されている全ての
種類の単語Wcと出現割合Wcrを抽出し、Wc, Wc
r, 相対出現割合Wcs(初期値=0.0)を組とする
データ{Wc, Wcf, Wcs}を単位として、プロファイル決定
部30内のバッファZに記憶させる。単語出現頻度情報
統合部28内のバッファZ2から抽出した全ての種類の
単語について、この処理を行う。
【0071】(2)プロファイル決定部内のバッファZ
に記憶されたある単語Wc’について、単語出現頻度情
報統合部28内のバッファZ1に該単語が登録されてい
ないか調べる。Wc’が登録されていれば、Wc’の出
現割合Wcr’を抽出し、プロファイル決定部30内の
バッファZの単語Wc’に対応するWcsに、Wcr/
Wcr’で求まる値を代入する。この処理を、プロファ
イル決定部30内のバッファZに記憶された全ての単語
について行う。
【0072】(3)プロファイル決定部30内のバッフ
ァZに含まれるデータを、Wcsの値が大きいものから
順に単数、あるいは複数選択する。そして、そのデータ
に含まれる単語をリストとしてまとめ、該クライアント
システム・ユーザのプロファイルZとして採用する。プ
ロファイルZは、該クライアントシステム・ユーザが電
子メールをやりとりしたことのある相手集合における、
単語出現頻度の相対的な比較で抽出されたプロファイル
である。
【0073】リストX、リストYを受け取ったときにも
同様の手順で、それぞれのリストに対するプロファイル
X、プロファイルYを作成する。プロファイルXは、主
にプロファイルの公開を要求した相手と縁がある相手で
構成された集合において、単語出現頻度の相対的な比較
を行い作成したプロファイルである。逆に、プロファイ
ルYは、プロファイルの公開を要求した相手と縁が薄い
相手で構成した集合において、単語出現頻度の相対的な
比較を行い作成したプロファイルである。
【0074】以上の処理が終わると、プロファイル決定
部は、単語出現頻度情報統合部28内のバッファをクリ
アする。ついで、作成されたプロファイルを、アクセス
管理部24へ送る。以上の手続きの概要を図11に示
す。
【0075】以上、本発明の実施形態について説明した
が、本実施形態の処理は、制御プログラムをコンピュー
タにインストールし、コンピュータのCPUがプログラ
ムを逐次実行することで実現することができる。制御プ
ログラムは記憶媒体から供給することができるが、通信
手段を介して供給することもできる。
【0076】
【発明の効果】以上説明したように、本発明の個人プロ
ファイル管理装置では、送受信情報から抽出した単語情
報を送受信相手毎に管理する手段を備え、また、情報の
送受信関係から送受信相手に関するコミュニティー分析
を行い情報を送受信した相手をコミュニティー毎に分類
する手段を備えたことで、該ユーザのプロファイルの開
示を要求する相手に応じて、要求してきた相手が属する
コミュニティーにおける該ユーザーのプロファイルを動
的に作成し開示することができる。このことで、プロフ
ァイルの開示を要求した相手は、自らが属するコミュニ
ティーにおいては一般的でプロファイルとして有用でな
い単語を含むプロファイルではなく、有用な単語からな
るプロファイルを得ることができる。
【図面の簡単な説明】
【図1】 実施形態の構成ブロック図である。
【図2】 実施形態のネットワーク構成図である。
【図3】 ユーザ単語出現頻度情報記憶部へ転送するデ
ータ説明図である。
【図4】 個別単語出現頻度情報の説明図である。
【図5】 ユーザ単語出現頻度情報記憶部の処理フロー
チャートである。
【図6】 アドレス蓄積部が蓄積するデータ構造説明図
である。
【図7】 クラスタ解析部におけるデータTの説明図で
ある。
【図8】 クラスタ解析部におけるクラスタラベルの説
明図である。
【図9】 クラスタ解析部におけるリスト説明図であ
る。
【図10】 単語出現頻度情報統合部の処理を示す説明
図である。
【図11】 プロファイル決定部の処理フローチャート
である。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 情報を送受信する情報管理装置に付設さ
    れて、情報管理装置を利用するユーザに関する個人プロ
    ファイルを、送受信する情報に基づいて管理する個人プ
    ロファイル管理装置において、 他の情報管理装置との間で通信された情報から送受信相
    手を識別する情報とテキスト情報とを抽出する送受信情
    報獲得部と、 テキスト情報から単語を抽出し、当該単語の出現回数を
    計数する単語分割/頻度計算部と、 情報の送受信相手別に、過去に送受信したテキスト情報
    より抽出した全単語に対する各単語の出現割合を算出し
    て個別単語出現頻度情報を生成し記憶する、かつ、過去
    に送受信した全相手のテキスト情報より抽出した全単語
    に対する各単語の出現割合を算出して全員単語出現頻度
    情報を生成し記憶するユーザ単語出現頻度情報記憶部
    と、 他の個人プロファイル管理装置との間で、生成した全員
    単語出現頻度情報の授受を行う情報通信部と、 当該個人プロファイル管理装置のユーザ以外の相手から
    プロファイルの開示を要求されたときに、この相手を識
    別する情報を獲得するアクセス管理部と、 送受信相手を識別する情報から、送受信相手をグループ
    毎に分類するクラスタ解析部と、 自他の個人プロファイル管理装置で生成された全員単語
    出現頻度情報を、プロファイルの開示を要求する相手が
    属するグループに関して統合し、自他の個人プロファイ
    ル管理装置で抽出された全単語中での各単語の総出現回
    数および出現割合を算出する単語出現頻度情報統合部
    と、 自己の情報管理装置を利用するユーザ個人の特徴を表す
    プロファイルを、算出された前記総出現回数と前記出現
    割合に基づき開示を要求する相手が属するグループに応
    じて決定するプロファイル決定部と、 を有することを特徴とする個人プロファイル管理装置。
  2. 【請求項2】 請求項1記載の装置において、 前記クラスタ解析部は、同一の情報が複数の情報管理装
    置に送受信されたとき、これらの情報管理装置を同一の
    グループに属するとみなすことを特徴とする個人プロフ
    ァイル管理装置。
  3. 【請求項3】 請求項1記載の装置において、 前記クラスタ解析部は、同一の情報が複数の情報管理装
    置に送受信されたとき、これらの情報管理装置の中で一
    相手がすでにあるグループに属するとみなされているな
    らば、その他の情報管理装置も当該グループに属すると
    みなすことを特徴とする個人プロファイル管理装置。
  4. 【請求項4】 情報管理装置を利用するユーザに関する
    個人プロファイルを、送受信する情報に基づいて管理す
    るプログラムを記憶した媒体であって、前記プログラム
    はコンピュータに対して、少なくとも、 他の情報管理装置との間で通信された情報から送受信相
    手を識別する情報とテキスト情報とを抽出させ、 テキスト情報から単語を抽出し、当該単語の出現回数を
    計数させ、 情報の送受信相手別に、過去に送受信したテキスト情報
    より抽出した全単語に対する各単語の出現割合を算出し
    て個別単語出現頻度情報を生成し記憶させるとともに、
    過去に送受信した全相手のテキスト情報より抽出した全
    単語に対する各単語の出現割合を算出して全員単語出現
    頻度情報を生成し記憶させ、 他の個人プロファイル管理装置との間で、生成した全員
    単語出現頻度情報の授受を行わせ、 当該個人プロファイル管理装置のユーザ以外の相手から
    プロファイルの開示を要求されたときに、この相手を識
    別する情報を獲得させ、 送受信相手を識別する情報から、送受信相手をグループ
    毎に分類させ、 自他の個人プロファイル管理装置で生成された全員単語
    出現頻度情報を、プロファイルの開示を要求する相手が
    属するグループに関して統合し、自他の個人プロファイ
    ル管理装置で抽出された全単語中での各単語の総出現回
    数および出現割合を算出させ、 自己の情報管理装置を利用するユーザ個人の特徴を表す
    プロファイルを、算出された前記総出現回数と前記出現
    割合に基づき開示を要求する相手が属するグループに応
    じて決定させることを特徴とする記憶媒体。
JP11061864A 1999-03-09 1999-03-09 個人プロファイル管理装置及び記憶媒体 Pending JP2000259529A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11061864A JP2000259529A (ja) 1999-03-09 1999-03-09 個人プロファイル管理装置及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11061864A JP2000259529A (ja) 1999-03-09 1999-03-09 個人プロファイル管理装置及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2000259529A true JP2000259529A (ja) 2000-09-22

Family

ID=13183422

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11061864A Pending JP2000259529A (ja) 1999-03-09 1999-03-09 個人プロファイル管理装置及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2000259529A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002025459A1 (en) * 2000-09-20 2002-03-28 Sony Corporation Distribution system and distribution method
US6910034B2 (en) 2001-09-26 2005-06-21 Kabushiki Kaisha Toshiba Search apparatus, search method and storage medium for storing search program
JP2005316699A (ja) * 2004-04-28 2005-11-10 Hitachi Ltd コンテンツ公開システム、コンテンツ公開方法、及びコンテンツ公開プログラム
JP2008217370A (ja) * 2007-03-02 2008-09-18 Nec Corp プロファイル登録システム、プロファイル登録方法およびプロファイル登録プログラム
JP2008234290A (ja) * 2007-03-20 2008-10-02 Hitachi Systems & Services Ltd 検索方法および検索装置
US7792842B2 (en) 2007-02-28 2010-09-07 Kabushiki Kaisha Toshiba Apparatus, method and computer program product for outputting information
JP2013134612A (ja) * 2011-12-26 2013-07-08 Hitachi Systems Ltd 注目単語分析方法および注目単語分析システム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002025459A1 (en) * 2000-09-20 2002-03-28 Sony Corporation Distribution system and distribution method
JPWO2002025459A1 (ja) * 2000-09-20 2004-01-29 ソニー株式会社 配信システムおよび配信方法
US8285783B2 (en) 2000-09-20 2012-10-09 Sony Corporation Distribution system and distribution method
US6910034B2 (en) 2001-09-26 2005-06-21 Kabushiki Kaisha Toshiba Search apparatus, search method and storage medium for storing search program
JP2005316699A (ja) * 2004-04-28 2005-11-10 Hitachi Ltd コンテンツ公開システム、コンテンツ公開方法、及びコンテンツ公開プログラム
US7792842B2 (en) 2007-02-28 2010-09-07 Kabushiki Kaisha Toshiba Apparatus, method and computer program product for outputting information
JP2008217370A (ja) * 2007-03-02 2008-09-18 Nec Corp プロファイル登録システム、プロファイル登録方法およびプロファイル登録プログラム
JP2008234290A (ja) * 2007-03-20 2008-10-02 Hitachi Systems & Services Ltd 検索方法および検索装置
JP2013134612A (ja) * 2011-12-26 2013-07-08 Hitachi Systems Ltd 注目単語分析方法および注目単語分析システム

Similar Documents

Publication Publication Date Title
US8949420B2 (en) Content pre-fetching and preparation
US10628502B2 (en) Graph server querying for managing social network information flow
US10402459B2 (en) Compatibility scoring of users
US6470333B1 (en) Knowledge extraction system and method
TW559742B (en) Group notification system and method for implementing and indicating the proximity of individuals or groups to other individuals or groups
TWI402702B (zh) 呈現網頁查詢結果的方法及其電腦可讀儲存媒體與電腦系統
CN101026802B (zh) 一种信息推送方法与装置
JP3446886B2 (ja) 人脈データ管理システムと人脈探索方法
US20150234891A1 (en) Method and system for providing code scanning result information
US20030167443A1 (en) System for providing document change information for a community of users
US9385985B2 (en) Systems and methods for assisting users with contact, access, and distribution lists
CN107767153B (zh) 一种数据处理方法及装置
JP2003108592A (ja) 検索方法および検索装置
EP3973417A1 (en) Efficient freshness crawl scheduling
US6640222B1 (en) Method for selecting an information unit among conflicting information units based on context fields by a user device
JP2000259529A (ja) 個人プロファイル管理装置及び記憶媒体
CN101202717A (zh) 即时通讯用户搜索方法及即时通讯服务器
CN115984643A (zh) 模型训练方法、相关设备及存储介质
JP4003314B2 (ja) 個人プロファイル管理装置
JP3804017B2 (ja) 電子メールシステム
JPH11282874A (ja) 情報フィルタリング方法および装置
WO2003052636A2 (en) System and method for processing a request using multiple database units
CN116910102A (zh) 一种基于用户反馈的企业查询方法、装置及电子设备
CN114171172A (zh) 一种医疗信息匹配与分发的系统和方法
KR100706896B1 (ko) 맞춤형 컨텐츠 정보 제공 시스템 및 방법