JP2012078932A

JP2012078932A - 重要度判定装置、重要度判定方法およびプログラム

Info

Publication number: JP2012078932A
Application number: JP2010221531A
Authority: JP
Inventors: Shinsaku Kiyomoto; 晋作清本; Toshiaki Tanaka; 俊昭田中
Original assignee: KDDI Corp
Current assignee: KDDI Corp
Priority date: 2010-09-30
Filing date: 2010-09-30
Publication date: 2012-04-19

Abstract

【課題】ネットワーク上を流れるデータの重要度を自動的に判別し、適切な保護をユーザに要求する。
【解決手段】通信路を流れるデータを取得し、データを前処理により重要度の判定ができるように変換する。そして、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定し、判定結果をユーザに送信する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。
【選択図】図４

Description

本発明は、ネットワーク上を流れるデータの重要度を自動的に判別し、適切な保護をユーザに要求する重要度判定装置、重要度判定方法およびプログラムに関する。

今日、インターネットなどのネットワークを介して重要なデータをやり取りする場面が増えてきている。特に、利用者の趣味嗜好などを考慮してサービスを提供するようなサイトにおいては、ユーザの個人情報・プライバシ情報を提供することもあり、情報漏洩によるプライバシ侵害が懸念される。また、位置情報サービスなどにおいても同様の脅威がある（例えば、非特許文献１参照。）。

ＲＦＣ２６１６ＨｙｐｅｒｔｅｘｔＴｒａｎｓｆｅｒＰｒｏｔｏｃｏｌ ―― ＨＴＴＰ／１．１

しかしながら、従来は、データの重要度を判定することはなく、データの送受信を行っており、利用者が客観的に自身が送信するデータの重要度を判定することができなかったという問題がある。

そこで、本発明は、上述の課題に鑑みてなされたものであり、ネットワーク上を流れるデータの重要度を自動的に判別し、適切な保護をユーザに要求する重要度判定装置、重要度判定方法およびプログラムを提供することを目的とする。

本発明は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。

（１）本発明は、ユーザが送受信するデータの重要度を判定する重要度判定装置であって、データを送受信する自己のクライアントモジュールとデータを送受信する他のクライアントモジュールからデータの重要度を判定するためのデータを受信する受信手段（例えば、図２のデータ読込処理部２０２に相当）と、該受信したデータをサービスごとに分類する分類手段と、該分類したデータについて、その重要度を判定できるように加工する加工手段と、該加工したデータを保存する保存手段と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する判定手段（例えば、図２のデータ特徴量抽出処理部２１０に相当）と、を備えたことを特徴とする重要度判定装置を提案している。

この発明によれば、受信手段は、データを送受信する自己のクライアントモジュールとデータを送受信する他のクライアントモジュールからデータの重要度を判定するためのデータを受信する。分類手段は、受信したデータをサービスごとに分類する。加工手段は、分類したデータについて、その重要度を判定できるように加工する。保存手段は、加工したデータを保存する。判定手段は、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。

（２）本発明は、（１）の重要度判定装置について、前記加工手段が一方向性関数を用いて、データの加工を行うことを特徴とする重要度判定装置を提案している。

この発明によれば、加工手段が一方向性関数を用いて、データの加工を行う。したがって、一方向性関数を用いることにより、情報の漏えいを防止することができる。

（３）本発明は、（１）の重要度判定装置について、前記判定手段が、匿名性を評価することによりデータの重要度を判定することを特徴とする重要度判定装置を提案している。

この発明によれば、判定手段が、匿名性を評価することによりデータの重要度を判定する。したがって、たとえば、ｋ−匿名性やｌ−多様性を評価することにより、情報の重要度を自動的に判別することができる。

（４）本発明は、（１）の重要度判定装置について、前記判定手段が、データ内の属性の種類に関する評価値によりデータの重要度を判定することを特徴とする重要度判定装置を提案している。

この発明によれば、判定手段が、データ内の属性の種類に関する評価値によりデータの重要度を判定する。したがって、評価値を、評価値＝｛（重み付け値）×（自己のデータを含む属性値の数−自己のデータを含まない属性値の数）｝の数式で算出することにより、属性値の変化を定量化して、データの重要度を自動的に判別することができる。

（５）本発明は、（１）の重要度判定装置について、前記判定手段が、データ量の差分に関する評価値によりデータの重要度を判定することを特徴とする重要度判定装置を提案している。

この発明によれば、判定手段が、データ量の差分に関する評価値によりデータの重要度を判定する。したがって、評価値を、評価値＝｛（重み付け値）×（データの総数）／（自己のデータを含む同じ属性を持つデータの数）｝の数式で算出することにより、データの重要度を自動的に判別することができる。

（６）本発明は、ユーザが送受信するデータの重要度を判定する重要度判定装置であって、前記ユーザから送られてくるネットワークを流れるデータを受信する受信手段（例えば、図８のデータ読込処理部２０２に相当）と、該受信したデータを各利用者ごとに分類する分類手段と、該分類したデータについて、その重要度を判定できるように加工する加工手段と、該加工したデータを保存する保存手段と、該保存したデータから利用者ごとに特徴ベクトルを作成する特徴ベクトル作成手段（例えば、図２の特徴ベクトル作成処理部６１１に相当）と、新たに送られてくるデータと前記作成した特徴ベクトルとの類似度を評価してデータの重要度を判定する判定手段（例えば、図８のデータ特徴量抽出処理部６１０に相当）と、を備えたことを特徴とする重要度判定装置を提案している。

この発明によれば、受信手段は、ユーザから送られてくるネットワークを流れるデータを受信する。分類手段は、受信したデータを各利用者ごとに分類する。加工手段は、分類したデータについて、その重要度を判定できるように加工する。保存手段は、加工したデータを保存する。特徴ベクトル作成手段は、保存したデータから利用者ごとに特徴ベクトルを作成する。判定手段は、新たに送られてくるデータと作成した特徴ベクトルとの類似度を評価してデータの重要度を判定する。したがって、ネットワーク上を流れるユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。

（７）本発明は、（６）の重要度判定装置について、前記加工手段が一方向性関数を用いて、データの加工を行うことを特徴とする重要度判定装置を提案している。

（８）本発明は、（６）の重要度判定装置について、前記判定手段が、データの類似度を前記特徴ベクトル間の相関性により評価することを特徴とする重要度判定装置を提案している。

この発明によれば、判定手段が、データの類似度を前記特徴ベクトル間の相関性により評価する。したがって、保存されている特徴ベクトルと受信データとの類似度を数値化して相関性を評価することによって、情報の重要度を自動的に判別することができる。

（９）本発明は、（６）の重要度判定装置について、前記特徴ベクトルには、個々に重み係数が設定されていることを特徴とする重要度判定装置を提案している。

この発明によれば、特徴ベクトルには、個々に重み係数が設定されている。したがって、重要度が高い特徴ベクトルについては、重み係数を大きくすることにより、的確に、情報の重要度を自動的に判別することができる。

（１０）本発明は、（６）の重要度判定装置について、前記保存手段に保存されたデータのうち、一定期間が経過したデータについては、複数のデータをマージして特徴的な特徴量のみを残し、圧縮する圧縮手段を設けたことを特徴とする重要度判定装置を提案している。

この発明によれば、保存手段に保存されたデータのうち、一定期間が経過したデータについては、複数のデータをマージして特徴的な特徴量のみを残し、圧縮する圧縮手段を設けている。したがって、圧縮して格納することにより、データサイズを削減し、保存するデータのサイズを有限長とする。

（１１）本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法であって、通信路を流れるデータを取得する第１のステップ（例えば、図４のステップＳ１０１に相当）と、データを前処理により重要度の判定ができるように変換する第２のステップ（例えば、図４のステップＳ１０２に相当）と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第３のステップ（例えば、図４のステップＳ１０３に相当）と、該判定結果をユーザに送信する第４のステップ（例えば、図４のステップＳ１０４に相当）と、を備えたことを特徴とする重要度判定方法を提案している。

この発明によれば、通信路を流れるデータを取得し、データを前処理により重要度の判定ができるように変換する。そして、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定し、判定結果をユーザに送信する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。

（１２）本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法であって、通信路を流れるデータを取得する第１のステップ（例えば、図１０のステップＳ３０１に相当）と、データを前処理により特徴量抽出可能な形式に変換する第２のステップ（例えば、図１０のステップＳ３０２に相当）と、各利用者のデータ特徴量を抽出して特徴ベクトルを生成する第３のステップ（例えば、図１０のステップＳ３０３に相当）と、新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定する第４のステップ（例えば、図１０のステップＳ３０４に相当）と、該判定結果をユーザに送信する第５のステップ（例えば、図１０のステップＳ３０５に相当）と、を備えたことを特徴とする重要度判定方法を提案している。

この発明によれば、通信路を流れるデータを取得し、データを前処理により特徴量抽出可能な形式に変換する。そして、各利用者のデータ特徴量を抽出して特徴ベクトルを生成し、新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定して、判定結果をユーザに送信する。したがって、ネットワーク上を流れるユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。

（１３）本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、通信路を流れるデータを取得する第１のステップ（例えば、図４のステップＳ１０１に相当）と、データを前処理により重要度の判定ができるように変換する第２のステップ（例えば、図４のステップＳ１０２に相当）と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第３のステップ（例えば、図４のステップＳ１０３に相当）と、該判定結果をユーザに送信する第４のステップ（例えば、図４のステップＳ１０４に相当）と、をコンピュータに実行させるためのプログラムを提案している。

（１４）本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、通信路を流れるデータを取得する第１のステップ（例えば、図１０のステップＳ３０１に相当）と、データを前処理により特徴量抽出可能な形式に変換する第２のステップ（例えば、図１０のステップＳ３０２に相当）と、各利用者のデータ特徴量を抽出して特徴ベクトルを生成する第３のステップ（例えば、図１０のステップＳ３０３に相当）と、新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定する第４のステップ（例えば、図１０のステップＳ３０４に相当）と、該判定結果をユーザに送信する第５のステップ（例えば、図１０のステップＳ３０５に相当）と、をコンピュータに実行させるためのプログラムを提案している。

本発明によれば、ネットワーク上を流れるデータの重要度を自動的に判別し、適切な保護をユーザに要求することにより、プライバシ情報を可視化して、ユーザに注意を喚起することができるという効果がある。

本発明の第１の実施形態に係る重要度判定装置の概念図である。本発明の第１の実施形態に係る重要度判定装置の構成を示す図である。本発明の第１の実施形態に係る重要度判定装置におけるデータの抽象化に関する図である。本発明の第１の実施形態に係る重要度判定装置の処理を示す図である。本発明の第２の実施形態に係る重要度判定装置の構成を示す図である。本発明の第２の実施形態に係る重要度判定装置の処理を示す図である。本発明の第３の実施形態に係る重要度判定装置の概念図である。本発明の第３の実施形態に係る重要度判定装置の構成を示す図である。本発明の第３の実施形態に係る重要度判定装置における特徴ベクトルの圧縮に関する図である。本発明の第３の実施形態に係る重要度判定装置の処理を示す図である。

以下、本発明の実施形態について、図面を用いて、詳細に説明する。
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。

＜第１の実施形態＞
図１から図４を用いて、本発明の第１の実施形態に係る重要度判定装置について説明する。本実施形態に係る重要度判定装置は、図１に示すように、クライアントモジュール１０１〜１０５とサービス提供サーバ３００との間に配置され、データを送受信するクライアントモジュール１０１とデータを送受信する他のクライアントモジュール１０２〜１０５からデータの重要度を判定するためのデータを受信して、ｋ−匿名性やｌ−多様性等の匿名性判定を行って、データを解析することにより、クライアントモジュール１０１からのデータの重要度を判別して、クライアント１０１モジュールに通知するものである。つまり、クライアントモジュール１０１は、データを収集し、解析する機能を有する。具体的には、データ収集機能を各ユーザの端末にインストールし、収集したデータをデータ解析機能に送付する。データ解析機能では、送られてきたデータをまとめて解析し、結果を各データ収集機能に返す。

＜重要度判定装置の構成＞
図２を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図２に示すように、制御部２０１と、データ読込処理部２０２と、データ出力処理部２０３と、通信モジュールドライバ２０４と、データ圧縮処理部２０５と、データ特徴量抽出処理部２１０と、ｌ−多様性判定モジュール２１３と、ｋ−匿名性判定モジュール２１４と、木構造データ管理部２１６と、ユーザ設定パラメータ管理部２１７とから構成されている。また、データ特徴量抽出処理部２１０は、ｋ−匿名性、ｌ−多様性判定処理部２１１と、データ事前処理部２１２とから構成されている。

制御部２０１は、予め格納された制御プログラムによって、重要度判定装置２００の全体を制御する。特に、データを送受信するクライアント１０１とデータを送受信する他のクライアント１０２〜１０５からデータの重要度を判定するためのデータを受信して、ｋ−匿名性やｌ−多様性等の匿名性判定を行って、データを解析することにより、クライアント１０１からのデータの重要度を判別して、クライアント１０１に通知する。

データ読込処理部２０２は、通信モジュールドライバ２０４からネットワークを流れるデータを取得する。データ出力処理部２０３は、通信ネットワークドライバ２０４を利用して判定結果を通知する。

ｌ−多様性判定モジュール２１３は、入力されたデータセットがｌ−多様性を満たすかどうか判定し、満たす場合はデータを匿名データセット出力に受け渡す。なお、ｌ−多様性の判定処理は独立したモジュールとし、他の評価基準も追加可能とする。また、ｌ＝１に設定された場合には、ｌ−多様性の判定処理をスキップすることで無駄な処理を行わないようにする。ｌ−多様性は、ｓｅｎｓｉｔｉｖｅａｔｔｒｉｂｕｔｅに対して実行する。

ｋ−匿名性判定モジュール２１４は、入力されたデータセットがｋ−匿名性を満たすかどうか判定し、満たす場合はデータを匿名データセット出力に受け渡す。なお、ｋ−匿名性の判定処理は独立したモジュールとし、他の評価基準も追加可能とする。また、ｋ−匿名性の判定は、個別の属性および準識別子全体に対して実行する。

具体的には、ユーザ設定パラメータ管理部２１７に格納されたパラメータにしたがって、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位（重み付け）を設定する。具体的には、各属性の重み付けは、利用者の入力により行われる。重み付けは、属性の優先順位を表わし、利用者が最も重視する属性を最上位とする。また、加工処理においては、優先順位が最下位の属性から順に加工処理を行い、ｋ−匿名性を満たした段階で終了する。したがって、最上位の属性ほど元の情報が保持される確率が高くなる。また、これにより、直接的には、ユーザとの関連性の低い複数の情報を組合せることによりユーザを特定することも防止することにより、データ利用者が求める情報を可能な限り保持することができる。利用者は、ＧＵＩ（ＧｒａｐｈｉｃａｌＵｓｅｒＩｎｔｅｒｆａｃｅ）等を利用して各属性に対して優先順位を入力する。利用者は、各優先順位に対して、重み付けポイント（数値）を設定する。この値は、加工処理を行う属性を選択する際に使用する。

つまり、設定された優先順位（重み付け）に基づいて、各データの評価ポイントを算出する。具体的には、評価ポイントは、以下の数式を用いて、算出される。
評価ポイント＝（属性値の数）＊（重み付けポイント）
ここで、（属性値の数）とは、その属性が持つ属性値の種類の数を表す。ボトムアップ処理においては、一般化によって、この評価ポイントの減少が最小になる属性を一般化を行う属性として選択する。また、トップダウン処理においては、この値の増加が最大になる属性を一般化を行う属性として選択する。

ｋ−匿名性、ｌ−多様性判定処理部２１１は、それぞれの属性単体を単体でｋ−匿名性を満たすように一般化する。また、属性によってユーザが一般化の限界レベルを設定しているものについては、それを超えて一般化はしない。さらに、生成したデータがｋ−匿名性を満たさなければ、各属性を１レベルだけ一般化して再度チェックを行う。この場合も、ユーザが設定した限界レベルを超えて一般化はせず、他の属性を一般化することで、ｋ―匿名性を達成する。

一般化に用いられるトップダウン処理は、算出した評価ポイントの増加分が最大となるようなデータ加工方法により、データの加工を行う。また、ボトムアップ処理は、算出した評価ポイントの減少分が最小となるようなデータ加工方法により、データの加工を行う。

木構造データ管理部２１６は、事前入力された木構造データを変換し、ソフトウェアが利用可能な形式で格納する。また、属性が数値データではない場合、属性値の持つ意味の包含関係によって構築された木構造が上位ノード探索のために必要である。例えば、図３にように、Ｃｏｕｎｔｒｙ、Ｓｔａｔｅ、Ｃｉｔｙ、・・・といった属性値の上下関係によって構成された階層構造を事前に作成しておく必要がある。したがって、各属性に対してこのような木構造データをユーザが設定可能とする。数値データに関しては、一定の値ごとに階層化するため、木構造データは必ずしも必要ではない。なお、木構造データの構成に関して既存のソフトウェアが使用できる場合は、使用してもよい。また、木構造データは各レベルのノード数を情報として含む。木構造データ管理部２１６は、図３に示すような木構造データを管理する。

ユーザ設定パラメータ管理部２１７は、管理者が設定情報として入力した各パラメータやファイルを一括管理する。データ圧縮処理部２０５は、一定期間の通信路を流れたデータを格納し保管するとともに、データの圧縮を定期的に行う。具体的には、一定期間経過したデータについては、複数のデータをマージしてもっとも特徴的な特徴量のみを残して圧縮する。これにより、圧縮して格納することにデータサイズを削減し、保存するデータのサイズが有限長になるようにする。

＜重要度判定装置の処理＞
図４を用いて、本実施形態に係る重要度判定装置の処理について説明する。
まず、事前処理として、不要データの削除、データの抽象化、データの圧縮を行う。

受信したデータは、サービスごとにグループ化して処理される。したがって、以下の処理は、グループごとの処理となる。まず、判定に使用しない不要データ部分を削除する。例えば、プログラムが参照しないフィールドなどを削減する。また、設定により秘匿度の高いデータと定義されたデータについては、置き換えを行う。この場合に置き換えにはハッシュ関数の出力値を使用する。

次に、設定にしたがってデータを抽象化する。数値データについては、末尾の桁から順に削除するなどしてデータを変換する。属性が数値データではない場合、属性値の持つ意味の包含関係によって構築された木構造が上位ノード探索のために必要である、例えば、図３のように、Ｃｏｕｎｔｒｙ、Ｓｔａｔｅ、Ｃｉｔｙ、・・・といった属性値の上下関係によって構成された階層構造を事前に作成しておく必要がある。したがって、各属性に対してこのような木構造データをユーザが設定可能とする。そして、この木構造にしたがってデータを抽象化する。数値データに関しては一定の値ごとに階層化するため、木構造データは必ずしも必要ではない。なお、木構造データの構成に関して既存のソフトウェアが使用できる場合は、使用してもよい。また、木構造データは各レベルのノード数を情報として含む。

さらに、データを辞書データを用いて圧縮する。まず、格納されているデータの中から頻出度の高いデータを抽出する。そして、そのデータをある記号列で置き換えることにより圧縮する。圧縮したデータ、記号列は、辞書データに登録し、新たなデータがそのデータを含む場合、記号列で置き換えるようにする。本機能は、独立したモジュールとしバッチ処理により定期的に辞書データをメンテナンスし、可能な限り圧縮度の高いデータとする。

また、データはある時間間隔ごとに分割して格納される。そして、一定時間経過したデータについては自動的に削除する。

本実施形態に係る重要度判定装置は、通信路を流れるデータを取得し（ステップＳ１０１）、データを前記前処理により重要度の判定ができるように変換する（ステップＳ１０２）。

そして、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定し（ステップＳ１０３）、判定結果をユーザに送信する（ステップＳ１０４）。

以上、説明したように、本実施形態によれば、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。

＜第２の実施形態＞
図５および図６を用いて、本発明の第２の実施形態に係る重要度判定装置について説明する。

＜重要度判定装置の構成＞
図５を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図５に示すように、制御部２０１と、データ読込処理部２０２と、データ出力処理部２０３と、通信モジュールドライバ２０４と、データ圧縮処理部２０５と、データ特徴量抽出処理部４１０と、木構造データ管理部２１５と、ユーザ設定パラメータ管理部２１６とから構成されている。また、データ特徴量抽出処理部４１０は、データ事前処理部２１２と、評価ポイント算出処理部４０１とから構成されている。なお、第１の実施形態と同一の符号を付す構成要素は、同様の機能を有するものであるから、その詳細な説明は省略する。

評価ポイント算出処理部４０１は、属性の種類に着目した評価ポイントを算出する。具体的には、以下の演算式に基づいて、評価ポイントを算出する。評価値＝｛（重み付け値）×（自己のデータを含む属性値の数−自己のデータを含まない属性値の数）｝ここで、属性値の数とは、その属性が持つ属性値の種類の数を表す。あるデータの評価ポイントは、すべての属性について上記評価ポイントの合計となる。

また、データ数の差分に着目した評価ポイントを以下の演算式で算出してもよい。評価値＝｛（重み付け値）×（データの総数）／（自己のデータを含む同じ属性を持つデータの数）｝ここで、あるデータの評価ポイントは、すべての属性について上記評価ポイントの合計をデータ数で割った値となる。

＜重要度判定装置の処理＞
まず、通信路を流れるデータを取得し（ステップＳ２０１）、データを前記前処理により重要度の判定ができるように変換する（ステップＳ２０２）。

そして、データ内の属性の種類に関する評価値あるいは、データ量の差分に関する評価値によりデータの重要度を判定し（ステップＳ２０３）、判定結果をユーザに送信する（ステップＳ２０４）。

以上、説明したように、本実施形態によれば、ネットワーク上を流れる他のユーザのデータを利用して、評価ポイントを算出することにより、データの重要度を自動的に判別することができる。

＜第３の実施形態＞
図７から図１０を用いて、本発明の第３の実施形態に係る重要度判定装置について説明する。本実施形態に係る重要度判定装置は、図７に示すように、例えば、ユーザ端末内に設けられ、ユーザの通信データから特徴ベクトルを生成して、これらを格納するとともに、格納された特徴ベクトルと重要度を判定するデータの特徴ベクトルとの類似度を数値化して、重要度の判定を行うものである。

＜重要度判定装置の構成＞
図８を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図８に示すように、制御部２０１と、データ読込処理部２０２と、データ出力処理部２０３と、通信モジュールドライバ２０４と、データ圧縮処理部２０５と、データ特徴量抽出処理部６１０と、木構造データ管理部２１５と、ユーザ設定パラメータ管理部２１６とから構成されている。また、データ特徴量抽出処理部６１０は、データ事前処理部２１２と、特徴ベクトル作成処理部６１１と、評価ポイント算出処理部６１２とから構成されている。なお、第１の実施形態と同一の符号を付す構成要素は、同様の機能を有するものであるから、その詳細な説明は省略する。

特徴ベクトル作成処理部６１１は、ユーザの通信データから特徴ベクトルを生成する。なお、生成した特徴ベクトルは、図示しない格納部に格納しておく。つまり、図９に示すように、ユーザの通信データからベクトル抽出アルゴリズムを用いて、特徴ベクトルを抽出し、時系列的に、古い特徴ベクトルについては、ベクトル圧縮アルゴリズムを用いて、圧縮して保存する。また、時間的にかなり経過したものについては、再圧縮を行ってもよい。このように、時系列的に、古い特徴ベクトルを圧縮して格納することにより、データサイズを削減して、保存するデータのサイズを有限長にすることができる。

評価ポイント算出処理部６１２は、格納された特徴ベクトルと重要度を判定するデータの特徴ベクトルとの類似度を数値化する。なお、類似度を特徴ベクトル間の相関で数値化するために、例えば、オーバーラップ係数を用いてもよい。

＜重要度判定装置の処理＞
まず、通信路を流れるデータを取得し（ステップＳ３０１）、データを前記前処理により重要度の判定ができるように変換する（ステップＳ３０２）。

そして、各利用者のデータ特徴量を抽出して特徴ベクトルを生成し（ステップＳ３０３）、新たに送られてくるデータと生成した特徴ベクトルとの類似度を評価してデータの重要度を判定するとともに（ステップＳ３０４）、判定結果をユーザに送信する（ステップＳ３０５）。

以上、説明したように、本実施形態によれば、ネットワーク上を流れるユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。

なお、重要度判定装置の処理をコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを重要度判定装置に読み込ませ、実行することによって本発明の重要度判定装置を実現することができる。ここでいうコンピュータシステムとは、ＯＳや周辺装置等のハードウェアを含む。

また、「コンピュータシステム」は、ＷＷＷ（ＷｏｒｌｄＷｉｄｅＷｅｂ）システムを利用している場合であれば、ホームページ提供環境（あるいは表示環境）も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク（通信網）や電話回線等の通信回線（通信線）のように情報を伝送する機能を有する媒体のことをいう。

また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル（差分プログラム）であってもよい。

以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。

１０１；クアントモジュール
１０２；クアントモジュール
１０３；クアントモジュール
１０４；クアントモジュール
１０５；クアントモジュール
２００；重要度判定装置
２０１；制御部
２０２；データ読込処理部
２０３；データ出力処理部
２０４；通信モジュールドライバ
２１０；データ特徴量抽出処理部
２１１；ｋ−匿名性、ｌ−多様性判定処理部
２１２；データ事前処理部
２１３；ｌ−多様性判定モジュール
２１４；ｋ−匿名性判定モジュール
２１６；木構造データ管理部
２１７；ユーザ設定パラメータ管理部
２１８；データ圧縮処理部
３００；サービス提供サーバ
４０１；評価ポイント算出処理部
４１０；データ特徴量抽出処理部
５００；クライアントモジュール
６００；重要度判定装置
６１０；データ特徴量抽出処理部
６１１；特徴ベクトル作成処理部
６１２；評価ポイント算出処理部

Claims

ユーザが送受信するデータの重要度を判定する重要度判定装置であって、
データを送受信する自己のクライアントモジュールとデータを送受信する他のクライアントモジュールからデータ重要度を判定するためのデータを受信する受信手段と、
該受信したデータをサービスごとに分類する分類手段と、
該分類したデータについて、その重要度を判定できるように加工する加工手段と、
該加工したデータを保存する保存手段と、
各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する判定手段と、
を備えたことを特徴とする重要度判定装置。
前記加工手段が一方向性関数を用いて、データの加工を行うことを特徴とする請求項１に記載の重要度判定装置。
前記判定手段が、匿名性を評価することによりデータの重要度を判定することを特徴とする請求項１に記載の重要度判定装置。
前記判定手段が、データ内の属性の種類に関する評価値によりデータの重要度を判定することを特徴とする請求項１に記載の重要度判定装置。
前記判定手段が、データ量の差分に関する評価値によりデータの重要度を判定することを特徴とする請求項１に記載の重要度判定装置。
ユーザが送受信するデータの重要度を判定する重要度判定装置であって、
前記ユーザから送られてくるネットワークを流れるデータを受信する受信手段と、
該受信したデータを各利用者ごとに分類する分類手段と、
該分類したデータについて、その重要度を判定できるように加工する加工手段と、
該加工したデータを保存する保存手段と、
該保存したデータから利用者ごとに特徴ベクトルを作成する特徴ベクトル作成手段と、
新たに送られてくるデータと前記作成した特徴ベクトルとの類似度を評価してデータの重要度を判定する判定手段と、
を備えたことを特徴とする重要度判定装置。
前記加工手段が一方向性関数を用いて、データの加工を行うことを特徴とする請求項６に記載の重要度判定装置。
前記判定手段が、データの類似度を前記特徴ベクトル間の相関性により評価することを特徴とする請求項６に記載の重要度判定装置。
前記特徴ベクトルには、個々に重み係数が設定されていることを特徴とする請求項６に記載の重要度判定装置。
前記保存手段に保存されたデータのうち、一定期間が経過したデータについては、複数のデータをマージして特徴的な特徴量のみを残し、圧縮する圧縮手段を設けたことを特徴とする請求項６に記載の重要度判定装置。
ユーザが送受信するデータの重要度を判定する重要度判定方法であって、
通信路を流れるデータを取得する第１のステップと、
データを前処理により重要度の判定ができるように変換する第２のステップと、
各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第３のステップと、
該判定結果をユーザに送信する第４のステップと、
を備えたことを特徴とする重要度判定方法。
ユーザが送受信するデータの重要度を判定する重要度判定方法であって、
通信路を流れるデータを取得する第１のステップと、
データを前処理により特徴量抽出可能な形式に変換する第２のステップと、
各利用者のデータ特徴量を抽出して特徴ベクトルを生成する第３のステップと、
新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定する第４のステップと、
該判定結果をユーザに送信する第５のステップと、
を備えたことを特徴とする重要度判定方法。
ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、
通信路を流れるデータを取得する第１のステップと、
データを前処理により重要度の判定ができるように変換する第２のステップと、
各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第３のステップと、
該判定結果をユーザに送信する第４のステップと、
をコンピュータに実行させるためのプログラム。
ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、
通信路を流れるデータを取得する第１のステップと、
データを前処理により特徴量抽出可能な形式に変換する第２のステップと、
各利用者のデータ特徴量を抽出して特徴ベクトルを生成する第３のステップと、
新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定する第４のステップと、
該判定結果をユーザに送信する第５のステップと、
をコンピュータに実行させるためのプログラム。