JP2012078932A - 重要度判定装置、重要度判定方法およびプログラム - Google Patents
重要度判定装置、重要度判定方法およびプログラム Download PDFInfo
- Publication number
- JP2012078932A JP2012078932A JP2010221531A JP2010221531A JP2012078932A JP 2012078932 A JP2012078932 A JP 2012078932A JP 2010221531 A JP2010221531 A JP 2010221531A JP 2010221531 A JP2010221531 A JP 2010221531A JP 2012078932 A JP2012078932 A JP 2012078932A
- Authority
- JP
- Japan
- Prior art keywords
- data
- importance
- user
- determination
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Storage Device Security (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】ネットワーク上を流れるデータの重要度を自動的に判別し、適切な保護をユーザに要求する。
【解決手段】通信路を流れるデータを取得し、データを前処理により重要度の判定ができるように変換する。そして、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定し、判定結果をユーザに送信する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。
【選択図】図4
【解決手段】通信路を流れるデータを取得し、データを前処理により重要度の判定ができるように変換する。そして、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定し、判定結果をユーザに送信する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。
【選択図】図4
Description
本発明は、ネットワーク上を流れるデータの重要度を自動的に判別し、適切な保護をユーザに要求する重要度判定装置、重要度判定方法およびプログラムに関する。
今日、インターネットなどのネットワークを介して重要なデータをやり取りする場面が増えてきている。特に、利用者の趣味嗜好などを考慮してサービスを提供するようなサイトにおいては、ユーザの個人情報・プライバシ情報を提供することもあり、情報漏洩によるプライバシ侵害が懸念される。また、位置情報サービスなどにおいても同様の脅威がある(例えば、非特許文献1参照。)。
RFC2616 Hypertext Transfer Protocol ―― HTTP/1.1
しかしながら、従来は、データの重要度を判定することはなく、データの送受信を行っており、利用者が客観的に自身が送信するデータの重要度を判定することができなかったという問題がある。
そこで、本発明は、上述の課題に鑑みてなされたものであり、ネットワーク上を流れるデータの重要度を自動的に判別し、適切な保護をユーザに要求する重要度判定装置、重要度判定方法およびプログラムを提供することを目的とする。
本発明は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
(1)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定装置であって、データを送受信する自己のクライアントモジュールとデータを送受信する他のクライアントモジュールからデータの重要度を判定するためのデータを受信する受信手段(例えば、図2のデータ読込処理部202に相当)と、該受信したデータをサービスごとに分類する分類手段と、該分類したデータについて、その重要度を判定できるように加工する加工手段と、該加工したデータを保存する保存手段と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する判定手段(例えば、図2のデータ特徴量抽出処理部210に相当)と、を備えたことを特徴とする重要度判定装置を提案している。
この発明によれば、受信手段は、データを送受信する自己のクライアントモジュールとデータを送受信する他のクライアントモジュールからデータの重要度を判定するためのデータを受信する。分類手段は、受信したデータをサービスごとに分類する。加工手段は、分類したデータについて、その重要度を判定できるように加工する。保存手段は、加工したデータを保存する。判定手段は、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。
(2)本発明は、(1)の重要度判定装置について、前記加工手段が一方向性関数を用いて、データの加工を行うことを特徴とする重要度判定装置を提案している。
この発明によれば、加工手段が一方向性関数を用いて、データの加工を行う。したがって、一方向性関数を用いることにより、情報の漏えいを防止することができる。
(3)本発明は、(1)の重要度判定装置について、前記判定手段が、匿名性を評価することによりデータの重要度を判定することを特徴とする重要度判定装置を提案している。
この発明によれば、判定手段が、匿名性を評価することによりデータの重要度を判定する。したがって、たとえば、k−匿名性やl−多様性を評価することにより、情報の重要度を自動的に判別することができる。
(4)本発明は、(1)の重要度判定装置について、前記判定手段が、データ内の属性の種類に関する評価値によりデータの重要度を判定することを特徴とする重要度判定装置を提案している。
この発明によれば、判定手段が、データ内の属性の種類に関する評価値によりデータの重要度を判定する。したがって、評価値を、評価値={(重み付け値)×(自己のデータを含む属性値の数−自己のデータを含まない属性値の数)}の数式で算出することにより、属性値の変化を定量化して、データの重要度を自動的に判別することができる。
(5)本発明は、(1)の重要度判定装置について、前記判定手段が、データ量の差分に関する評価値によりデータの重要度を判定することを特徴とする重要度判定装置を提案している。
この発明によれば、判定手段が、データ量の差分に関する評価値によりデータの重要度を判定する。したがって、評価値を、評価値={(重み付け値)×(データの総数)/(自己のデータを含む同じ属性を持つデータの数)}の数式で算出することにより、データの重要度を自動的に判別することができる。
(6)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定装置であって、前記ユーザから送られてくるネットワークを流れるデータを受信する受信手段(例えば、図8のデータ読込処理部202に相当)と、該受信したデータを各利用者ごとに分類する分類手段と、該分類したデータについて、その重要度を判定できるように加工する加工手段と、該加工したデータを保存する保存手段と、該保存したデータから利用者ごとに特徴ベクトルを作成する特徴ベクトル作成手段(例えば、図2の特徴ベクトル作成処理部611に相当)と、新たに送られてくるデータと前記作成した特徴ベクトルとの類似度を評価してデータの重要度を判定する判定手段(例えば、図8のデータ特徴量抽出処理部610に相当)と、を備えたことを特徴とする重要度判定装置を提案している。
この発明によれば、受信手段は、ユーザから送られてくるネットワークを流れるデータを受信する。分類手段は、受信したデータを各利用者ごとに分類する。加工手段は、分類したデータについて、その重要度を判定できるように加工する。保存手段は、加工したデータを保存する。特徴ベクトル作成手段は、保存したデータから利用者ごとに特徴ベクトルを作成する。判定手段は、新たに送られてくるデータと作成した特徴ベクトルとの類似度を評価してデータの重要度を判定する。したがって、ネットワーク上を流れるユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。
(7)本発明は、(6)の重要度判定装置について、前記加工手段が一方向性関数を用いて、データの加工を行うことを特徴とする重要度判定装置を提案している。
この発明によれば、加工手段が一方向性関数を用いて、データの加工を行う。したがって、一方向性関数を用いることにより、情報の漏えいを防止することができる。
(8)本発明は、(6)の重要度判定装置について、前記判定手段が、データの類似度を前記特徴ベクトル間の相関性により評価することを特徴とする重要度判定装置を提案している。
この発明によれば、判定手段が、データの類似度を前記特徴ベクトル間の相関性により評価する。したがって、保存されている特徴ベクトルと受信データとの類似度を数値化して相関性を評価することによって、情報の重要度を自動的に判別することができる。
(9)本発明は、(6)の重要度判定装置について、前記特徴ベクトルには、個々に重み係数が設定されていることを特徴とする重要度判定装置を提案している。
この発明によれば、特徴ベクトルには、個々に重み係数が設定されている。したがって、重要度が高い特徴ベクトルについては、重み係数を大きくすることにより、的確に、情報の重要度を自動的に判別することができる。
(10)本発明は、(6)の重要度判定装置について、前記保存手段に保存されたデータのうち、一定期間が経過したデータについては、複数のデータをマージして特徴的な特徴量のみを残し、圧縮する圧縮手段を設けたことを特徴とする重要度判定装置を提案している。
この発明によれば、保存手段に保存されたデータのうち、一定期間が経過したデータについては、複数のデータをマージして特徴的な特徴量のみを残し、圧縮する圧縮手段を設けている。したがって、圧縮して格納することにより、データサイズを削減し、保存するデータのサイズを有限長とする。
(11)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法であって、通信路を流れるデータを取得する第1のステップ(例えば、図4のステップS101に相当)と、データを前処理により重要度の判定ができるように変換する第2のステップ(例えば、図4のステップS102に相当)と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第3のステップ(例えば、図4のステップS103に相当)と、該判定結果をユーザに送信する第4のステップ(例えば、図4のステップS104に相当)と、を備えたことを特徴とする重要度判定方法を提案している。
この発明によれば、通信路を流れるデータを取得し、データを前処理により重要度の判定ができるように変換する。そして、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定し、判定結果をユーザに送信する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。
(12)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法であって、通信路を流れるデータを取得する第1のステップ(例えば、図10のステップS301に相当)と、データを前処理により特徴量抽出可能な形式に変換する第2のステップ(例えば、図10のステップS302に相当)と、各利用者のデータ特徴量を抽出して特徴ベクトルを生成する第3のステップ(例えば、図10のステップS303に相当)と、新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定する第4のステップ(例えば、図10のステップS304に相当)と、該判定結果をユーザに送信する第5のステップ(例えば、図10のステップS305に相当)と、を備えたことを特徴とする重要度判定方法を提案している。
この発明によれば、通信路を流れるデータを取得し、データを前処理により特徴量抽出可能な形式に変換する。そして、各利用者のデータ特徴量を抽出して特徴ベクトルを生成し、新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定して、判定結果をユーザに送信する。したがって、ネットワーク上を流れるユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。
(13)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、通信路を流れるデータを取得する第1のステップ(例えば、図4のステップS101に相当)と、データを前処理により重要度の判定ができるように変換する第2のステップ(例えば、図4のステップS102に相当)と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第3のステップ(例えば、図4のステップS103に相当)と、該判定結果をユーザに送信する第4のステップ(例えば、図4のステップS104に相当)と、をコンピュータに実行させるためのプログラムを提案している。
この発明によれば、通信路を流れるデータを取得し、データを前処理により重要度の判定ができるように変換する。そして、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定し、判定結果をユーザに送信する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。
(14)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、通信路を流れるデータを取得する第1のステップ(例えば、図10のステップS301に相当)と、データを前処理により特徴量抽出可能な形式に変換する第2のステップ(例えば、図10のステップS302に相当)と、各利用者のデータ特徴量を抽出して特徴ベクトルを生成する第3のステップ(例えば、図10のステップS303に相当)と、新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定する第4のステップ(例えば、図10のステップS304に相当)と、該判定結果をユーザに送信する第5のステップ(例えば、図10のステップS305に相当)と、をコンピュータに実行させるためのプログラムを提案している。
この発明によれば、通信路を流れるデータを取得し、データを前処理により特徴量抽出可能な形式に変換する。そして、各利用者のデータ特徴量を抽出して特徴ベクトルを生成し、新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定して、判定結果をユーザに送信する。したがって、ネットワーク上を流れるユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。
本発明によれば、ネットワーク上を流れるデータの重要度を自動的に判別し、適切な保護をユーザに要求することにより、プライバシ情報を可視化して、ユーザに注意を喚起することができるという効果がある。
以下、本発明の実施形態について、図面を用いて、詳細に説明する。
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
<第1の実施形態>
図1から図4を用いて、本発明の第1の実施形態に係る重要度判定装置について説明する。本実施形態に係る重要度判定装置は、図1に示すように、クライアントモジュール101〜105とサービス提供サーバ300との間に配置され、データを送受信するクライアントモジュール101とデータを送受信する他のクライアントモジュール102〜105からデータの重要度を判定するためのデータを受信して、k−匿名性やl−多様性等の匿名性判定を行って、データを解析することにより、クライアントモジュール101からのデータの重要度を判別して、クライアント101モジュールに通知するものである。つまり、クライアントモジュール101は、データを収集し、解析する機能を有する。具体的には、データ収集機能を各ユーザの端末にインストールし、収集したデータをデータ解析機能に送付する。データ解析機能では、送られてきたデータをまとめて解析し、結果を各データ収集機能に返す。
図1から図4を用いて、本発明の第1の実施形態に係る重要度判定装置について説明する。本実施形態に係る重要度判定装置は、図1に示すように、クライアントモジュール101〜105とサービス提供サーバ300との間に配置され、データを送受信するクライアントモジュール101とデータを送受信する他のクライアントモジュール102〜105からデータの重要度を判定するためのデータを受信して、k−匿名性やl−多様性等の匿名性判定を行って、データを解析することにより、クライアントモジュール101からのデータの重要度を判別して、クライアント101モジュールに通知するものである。つまり、クライアントモジュール101は、データを収集し、解析する機能を有する。具体的には、データ収集機能を各ユーザの端末にインストールし、収集したデータをデータ解析機能に送付する。データ解析機能では、送られてきたデータをまとめて解析し、結果を各データ収集機能に返す。
<重要度判定装置の構成>
図2を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図2に示すように、制御部201と、データ読込処理部202と、データ出力処理部203と、通信モジュールドライバ204と、データ圧縮処理部205と、データ特徴量抽出処理部210と、l−多様性判定モジュール213と、k−匿名性判定モジュール214と、木構造データ管理部216と、ユーザ設定パラメータ管理部217とから構成されている。また、データ特徴量抽出処理部210は、k−匿名性、l−多様性判定処理部211と、データ事前処理部212とから構成されている。
図2を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図2に示すように、制御部201と、データ読込処理部202と、データ出力処理部203と、通信モジュールドライバ204と、データ圧縮処理部205と、データ特徴量抽出処理部210と、l−多様性判定モジュール213と、k−匿名性判定モジュール214と、木構造データ管理部216と、ユーザ設定パラメータ管理部217とから構成されている。また、データ特徴量抽出処理部210は、k−匿名性、l−多様性判定処理部211と、データ事前処理部212とから構成されている。
制御部201は、予め格納された制御プログラムによって、重要度判定装置200の全体を制御する。特に、データを送受信するクライアント101とデータを送受信する他のクライアント102〜105からデータの重要度を判定するためのデータを受信して、k−匿名性やl−多様性等の匿名性判定を行って、データを解析することにより、クライアント101からのデータの重要度を判別して、クライアント101に通知する。
データ読込処理部202は、通信モジュールドライバ204からネットワークを流れるデータを取得する。データ出力処理部203は、通信ネットワークドライバ204を利用して判定結果を通知する。
l−多様性判定モジュール213は、入力されたデータセットがl−多様性を満たすかどうか判定し、満たす場合はデータを匿名データセット出力に受け渡す。なお、l−多様性の判定処理は独立したモジュールとし、他の評価基準も追加可能とする。また、l=1に設定された場合には、l−多様性の判定処理をスキップすることで無駄な処理を行わないようにする。l−多様性は、sensitive attributeに対して実行する。
k−匿名性判定モジュール214は、入力されたデータセットがk−匿名性を満たすかどうか判定し、満たす場合はデータを匿名データセット出力に受け渡す。なお、k−匿名性の判定処理は独立したモジュールとし、他の評価基準も追加可能とする。また、k−匿名性の判定は、個別の属性および準識別子全体に対して実行する。
具体的には、ユーザ設定パラメータ管理部217に格納されたパラメータにしたがって、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する。具体的には、各属性の重み付けは、利用者の入力により行われる。重み付けは、属性の優先順位を表わし、利用者が最も重視する属性を最上位とする。また、加工処理においては、優先順位が最下位の属性から順に加工処理を行い、k−匿名性を満たした段階で終了する。したがって、最上位の属性ほど元の情報が保持される確率が高くなる。また、これにより、直接的には、ユーザとの関連性の低い複数の情報を組合せることによりユーザを特定することも防止することにより、データ利用者が求める情報を可能な限り保持することができる。利用者は、GUI(Graphical User Interface)等を利用して各属性に対して優先順位を入力する。利用者は、各優先順位に対して、重み付けポイント(数値)を設定する。この値は、加工処理を行う属性を選択する際に使用する。
つまり、設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する。具体的には、評価ポイントは、以下の数式を用いて、算出される。
評価ポイント=(属性値の数)*(重み付けポイント)
ここで、(属性値の数)とは、その属性が持つ属性値の種類の数を表す。ボトムアップ処理においては、一般化によって、この評価ポイントの減少が最小になる属性を一般化を行う属性として選択する。また、トップダウン処理においては、この値の増加が最大になる属性を一般化を行う属性として選択する。
評価ポイント=(属性値の数)*(重み付けポイント)
ここで、(属性値の数)とは、その属性が持つ属性値の種類の数を表す。ボトムアップ処理においては、一般化によって、この評価ポイントの減少が最小になる属性を一般化を行う属性として選択する。また、トップダウン処理においては、この値の増加が最大になる属性を一般化を行う属性として選択する。
k−匿名性、l−多様性判定処理部211は、それぞれの属性単体を単体でk−匿名性を満たすように一般化する。また、属性によってユーザが一般化の限界レベルを設定しているものについては、それを超えて一般化はしない。さらに、生成したデータがk−匿名性を満たさなければ、各属性を1レベルだけ一般化して再度チェックを行う。この場合も、ユーザが設定した限界レベルを超えて一般化はせず、他の属性を一般化することで、k―匿名性を達成する。
一般化に用いられるトップダウン処理は、算出した評価ポイントの増加分が最大となるようなデータ加工方法により、データの加工を行う。また、ボトムアップ処理は、算出した評価ポイントの減少分が最小となるようなデータ加工方法により、データの加工を行う。
木構造データ管理部216は、事前入力された木構造データを変換し、ソフトウェアが利用可能な形式で格納する。また、属性が数値データではない場合、属性値の持つ意味の包含関係によって構築された木構造が上位ノード探索のために必要である。例えば、図3にように、Country、State、City、・・・といった属性値の上下関係によって構成された階層構造を事前に作成しておく必要がある。したがって、各属性に対してこのような木構造データをユーザが設定可能とする。数値データに関しては、一定の値ごとに階層化するため、木構造データは必ずしも必要ではない。なお、木構造データの構成に関して既存のソフトウェアが使用できる場合は、使用してもよい。また、木構造データは各レベルのノード数を情報として含む。木構造データ管理部216は、図3に示すような木構造データを管理する。
ユーザ設定パラメータ管理部217は、管理者が設定情報として入力した各パラメータやファイルを一括管理する。データ圧縮処理部205は、一定期間の通信路を流れたデータを格納し保管するとともに、データの圧縮を定期的に行う。具体的には、一定期間経過したデータについては、複数のデータをマージしてもっとも特徴的な特徴量のみを残して圧縮する。これにより、圧縮して格納することにデータサイズを削減し、保存するデータのサイズが有限長になるようにする。
<重要度判定装置の処理>
図4を用いて、本実施形態に係る重要度判定装置の処理について説明する。
まず、事前処理として、不要データの削除、データの抽象化、データの圧縮を行う。
図4を用いて、本実施形態に係る重要度判定装置の処理について説明する。
まず、事前処理として、不要データの削除、データの抽象化、データの圧縮を行う。
受信したデータは、サービスごとにグループ化して処理される。したがって、以下の処理は、グループごとの処理となる。まず、判定に使用しない不要データ部分を削除する。例えば、プログラムが参照しないフィールドなどを削減する。また、設定により秘匿度の高いデータと定義されたデータについては、置き換えを行う。この場合に置き換えにはハッシュ関数の出力値を使用する。
次に、設定にしたがってデータを抽象化する。数値データについては、末尾の桁から順に削除するなどしてデータを変換する。属性が数値データではない場合、属性値の持つ意味の包含関係によって構築された木構造が上位ノード探索のために必要である、例えば、図3のように、Country、State、City、・・・といった属性値の上下関係によって構成された階層構造を事前に作成しておく必要がある。したがって、各属性に対してこのような木構造データをユーザが設定可能とする。そして、この木構造にしたがってデータを抽象化する。数値データに関しては一定の値ごとに階層化するため、木構造データは必ずしも必要ではない。なお、木構造データの構成に関して既存のソフトウェアが使用できる場合は、使用してもよい。また、木構造データは各レベルのノード数を情報として含む。
さらに、データを辞書データを用いて圧縮する。まず、格納されているデータの中から頻出度の高いデータを抽出する。そして、そのデータをある記号列で置き換えることにより圧縮する。圧縮したデータ、記号列は、辞書データに登録し、新たなデータがそのデータを含む場合、記号列で置き換えるようにする。本機能は、独立したモジュールとしバッチ処理により定期的に辞書データをメンテナンスし、可能な限り圧縮度の高いデータとする。
また、データはある時間間隔ごとに分割して格納される。そして、一定時間経過したデータについては自動的に削除する。
本実施形態に係る重要度判定装置は、通信路を流れるデータを取得し(ステップS101)、データを前記前処理により重要度の判定ができるように変換する(ステップS102)。
そして、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定し(ステップS103)、判定結果をユーザに送信する(ステップS104)。
以上、説明したように、本実施形態によれば、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。
<第2の実施形態>
図5および図6を用いて、本発明の第2の実施形態に係る重要度判定装置について説明する。
図5および図6を用いて、本発明の第2の実施形態に係る重要度判定装置について説明する。
<重要度判定装置の構成>
図5を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図5に示すように、制御部201と、データ読込処理部202と、データ出力処理部203と、通信モジュールドライバ204と、データ圧縮処理部205と、データ特徴量抽出処理部410と、木構造データ管理部215と、ユーザ設定パラメータ管理部216とから構成されている。また、データ特徴量抽出処理部410は、データ事前処理部212と、評価ポイント算出処理部401とから構成されている。なお、第1の実施形態と同一の符号を付す構成要素は、同様の機能を有するものであるから、その詳細な説明は省略する。
図5を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図5に示すように、制御部201と、データ読込処理部202と、データ出力処理部203と、通信モジュールドライバ204と、データ圧縮処理部205と、データ特徴量抽出処理部410と、木構造データ管理部215と、ユーザ設定パラメータ管理部216とから構成されている。また、データ特徴量抽出処理部410は、データ事前処理部212と、評価ポイント算出処理部401とから構成されている。なお、第1の実施形態と同一の符号を付す構成要素は、同様の機能を有するものであるから、その詳細な説明は省略する。
評価ポイント算出処理部401は、属性の種類に着目した評価ポイントを算出する。具体的には、以下の演算式に基づいて、評価ポイントを算出する。評価値={(重み付け値)×(自己のデータを含む属性値の数−自己のデータを含まない属性値の数)}ここで、属性値の数とは、その属性が持つ属性値の種類の数を表す。あるデータの評価ポイントは、すべての属性について上記評価ポイントの合計となる。
また、データ数の差分に着目した評価ポイントを以下の演算式で算出してもよい。評価値={(重み付け値)×(データの総数)/(自己のデータを含む同じ属性を持つデータの数)}ここで、あるデータの評価ポイントは、すべての属性について上記評価ポイントの合計をデータ数で割った値となる。
<重要度判定装置の処理>
まず、通信路を流れるデータを取得し(ステップS201)、データを前記前処理により重要度の判定ができるように変換する(ステップS202)。
まず、通信路を流れるデータを取得し(ステップS201)、データを前記前処理により重要度の判定ができるように変換する(ステップS202)。
そして、データ内の属性の種類に関する評価値あるいは、データ量の差分に関する評価値によりデータの重要度を判定し(ステップS203)、判定結果をユーザに送信する(ステップS204)。
以上、説明したように、本実施形態によれば、ネットワーク上を流れる他のユーザのデータを利用して、評価ポイントを算出することにより、データの重要度を自動的に判別することができる。
<第3の実施形態>
図7から図10を用いて、本発明の第3の実施形態に係る重要度判定装置について説明する。本実施形態に係る重要度判定装置は、図7に示すように、例えば、ユーザ端末内に設けられ、ユーザの通信データから特徴ベクトルを生成して、これらを格納するとともに、格納された特徴ベクトルと重要度を判定するデータの特徴ベクトルとの類似度を数値化して、重要度の判定を行うものである。
図7から図10を用いて、本発明の第3の実施形態に係る重要度判定装置について説明する。本実施形態に係る重要度判定装置は、図7に示すように、例えば、ユーザ端末内に設けられ、ユーザの通信データから特徴ベクトルを生成して、これらを格納するとともに、格納された特徴ベクトルと重要度を判定するデータの特徴ベクトルとの類似度を数値化して、重要度の判定を行うものである。
<重要度判定装置の構成>
図8を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図8に示すように、制御部201と、データ読込処理部202と、データ出力処理部203と、通信モジュールドライバ204と、データ圧縮処理部205と、データ特徴量抽出処理部610と、木構造データ管理部215と、ユーザ設定パラメータ管理部216とから構成されている。また、データ特徴量抽出処理部610は、データ事前処理部212と、特徴ベクトル作成処理部611と、評価ポイント算出処理部612とから構成されている。なお、第1の実施形態と同一の符号を付す構成要素は、同様の機能を有するものであるから、その詳細な説明は省略する。
図8を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図8に示すように、制御部201と、データ読込処理部202と、データ出力処理部203と、通信モジュールドライバ204と、データ圧縮処理部205と、データ特徴量抽出処理部610と、木構造データ管理部215と、ユーザ設定パラメータ管理部216とから構成されている。また、データ特徴量抽出処理部610は、データ事前処理部212と、特徴ベクトル作成処理部611と、評価ポイント算出処理部612とから構成されている。なお、第1の実施形態と同一の符号を付す構成要素は、同様の機能を有するものであるから、その詳細な説明は省略する。
特徴ベクトル作成処理部611は、ユーザの通信データから特徴ベクトルを生成する。なお、生成した特徴ベクトルは、図示しない格納部に格納しておく。つまり、図9に示すように、ユーザの通信データからベクトル抽出アルゴリズムを用いて、特徴ベクトルを抽出し、時系列的に、古い特徴ベクトルについては、ベクトル圧縮アルゴリズムを用いて、圧縮して保存する。また、時間的にかなり経過したものについては、再圧縮を行ってもよい。このように、時系列的に、古い特徴ベクトルを圧縮して格納することにより、データサイズを削減して、保存するデータのサイズを有限長にすることができる。
評価ポイント算出処理部612は、格納された特徴ベクトルと重要度を判定するデータの特徴ベクトルとの類似度を数値化する。なお、類似度を特徴ベクトル間の相関で数値化するために、例えば、オーバーラップ係数を用いてもよい。
<重要度判定装置の処理>
まず、通信路を流れるデータを取得し(ステップS301)、データを前記前処理により重要度の判定ができるように変換する(ステップS302)。
まず、通信路を流れるデータを取得し(ステップS301)、データを前記前処理により重要度の判定ができるように変換する(ステップS302)。
そして、各利用者のデータ特徴量を抽出して特徴ベクトルを生成し(ステップS303)、新たに送られてくるデータと生成した特徴ベクトルとの類似度を評価してデータの重要度を判定するとともに(ステップS304)、判定結果をユーザに送信する(ステップS305)。
以上、説明したように、本実施形態によれば、ネットワーク上を流れるユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。
なお、重要度判定装置の処理をコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを重要度判定装置に読み込ませ、実行することによって本発明の重要度判定装置を実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。
また、「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
101;クアントモジュール
102;クアントモジュール
103;クアントモジュール
104;クアントモジュール
105;クアントモジュール
200;重要度判定装置
201;制御部
202;データ読込処理部
203;データ出力処理部
204;通信モジュールドライバ
210;データ特徴量抽出処理部
211;k−匿名性、l−多様性判定処理部
212;データ事前処理部
213;l−多様性判定モジュール
214;k−匿名性判定モジュール
216;木構造データ管理部
217;ユーザ設定パラメータ管理部
218;データ圧縮処理部
300;サービス提供サーバ
401;評価ポイント算出処理部
410;データ特徴量抽出処理部
500;クライアントモジュール
600;重要度判定装置
610;データ特徴量抽出処理部
611;特徴ベクトル作成処理部
612;評価ポイント算出処理部
102;クアントモジュール
103;クアントモジュール
104;クアントモジュール
105;クアントモジュール
200;重要度判定装置
201;制御部
202;データ読込処理部
203;データ出力処理部
204;通信モジュールドライバ
210;データ特徴量抽出処理部
211;k−匿名性、l−多様性判定処理部
212;データ事前処理部
213;l−多様性判定モジュール
214;k−匿名性判定モジュール
216;木構造データ管理部
217;ユーザ設定パラメータ管理部
218;データ圧縮処理部
300;サービス提供サーバ
401;評価ポイント算出処理部
410;データ特徴量抽出処理部
500;クライアントモジュール
600;重要度判定装置
610;データ特徴量抽出処理部
611;特徴ベクトル作成処理部
612;評価ポイント算出処理部
Claims (14)
- ユーザが送受信するデータの重要度を判定する重要度判定装置であって、
データを送受信する自己のクライアントモジュールとデータを送受信する他のクライアントモジュールからデータ重要度を判定するためのデータを受信する受信手段と、
該受信したデータをサービスごとに分類する分類手段と、
該分類したデータについて、その重要度を判定できるように加工する加工手段と、
該加工したデータを保存する保存手段と、
各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する判定手段と、
を備えたことを特徴とする重要度判定装置。 - 前記加工手段が一方向性関数を用いて、データの加工を行うことを特徴とする請求項1に記載の重要度判定装置。
- 前記判定手段が、匿名性を評価することによりデータの重要度を判定することを特徴とする請求項1に記載の重要度判定装置。
- 前記判定手段が、データ内の属性の種類に関する評価値によりデータの重要度を判定することを特徴とする請求項1に記載の重要度判定装置。
- 前記判定手段が、データ量の差分に関する評価値によりデータの重要度を判定することを特徴とする請求項1に記載の重要度判定装置。
- ユーザが送受信するデータの重要度を判定する重要度判定装置であって、
前記ユーザから送られてくるネットワークを流れるデータを受信する受信手段と、
該受信したデータを各利用者ごとに分類する分類手段と、
該分類したデータについて、その重要度を判定できるように加工する加工手段と、
該加工したデータを保存する保存手段と、
該保存したデータから利用者ごとに特徴ベクトルを作成する特徴ベクトル作成手段と、
新たに送られてくるデータと前記作成した特徴ベクトルとの類似度を評価してデータの重要度を判定する判定手段と、
を備えたことを特徴とする重要度判定装置。 - 前記加工手段が一方向性関数を用いて、データの加工を行うことを特徴とする請求項6に記載の重要度判定装置。
- 前記判定手段が、データの類似度を前記特徴ベクトル間の相関性により評価することを特徴とする請求項6に記載の重要度判定装置。
- 前記特徴ベクトルには、個々に重み係数が設定されていることを特徴とする請求項6に記載の重要度判定装置。
- 前記保存手段に保存されたデータのうち、一定期間が経過したデータについては、複数のデータをマージして特徴的な特徴量のみを残し、圧縮する圧縮手段を設けたことを特徴とする請求項6に記載の重要度判定装置。
- ユーザが送受信するデータの重要度を判定する重要度判定方法であって、
通信路を流れるデータを取得する第1のステップと、
データを前処理により重要度の判定ができるように変換する第2のステップと、
各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第3のステップと、
該判定結果をユーザに送信する第4のステップと、
を備えたことを特徴とする重要度判定方法。 - ユーザが送受信するデータの重要度を判定する重要度判定方法であって、
通信路を流れるデータを取得する第1のステップと、
データを前処理により特徴量抽出可能な形式に変換する第2のステップと、
各利用者のデータ特徴量を抽出して特徴ベクトルを生成する第3のステップと、
新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定する第4のステップと、
該判定結果をユーザに送信する第5のステップと、
を備えたことを特徴とする重要度判定方法。 - ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、
通信路を流れるデータを取得する第1のステップと、
データを前処理により重要度の判定ができるように変換する第2のステップと、
各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第3のステップと、
該判定結果をユーザに送信する第4のステップと、
をコンピュータに実行させるためのプログラム。 - ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、
通信路を流れるデータを取得する第1のステップと、
データを前処理により特徴量抽出可能な形式に変換する第2のステップと、
各利用者のデータ特徴量を抽出して特徴ベクトルを生成する第3のステップと、
新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定する第4のステップと、
該判定結果をユーザに送信する第5のステップと、
をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010221531A JP2012078932A (ja) | 2010-09-30 | 2010-09-30 | 重要度判定装置、重要度判定方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010221531A JP2012078932A (ja) | 2010-09-30 | 2010-09-30 | 重要度判定装置、重要度判定方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012078932A true JP2012078932A (ja) | 2012-04-19 |
Family
ID=46239144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010221531A Pending JP2012078932A (ja) | 2010-09-30 | 2010-09-30 | 重要度判定装置、重要度判定方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012078932A (ja) |
-
2010
- 2010-09-30 JP JP2010221531A patent/JP2012078932A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10901950B2 (en) | Efficient data compression and analysis as a service | |
US10681061B2 (en) | Feedback-based prioritized cognitive analysis | |
US8935390B2 (en) | Method and system for efficient and exhaustive URL categorization | |
US10078843B2 (en) | Systems and methods for analyzing consumer sentiment with social perspective insight | |
Byass et al. | Using verbal autopsy to track epidemic dynamics: the case of HIV-related mortality in South Africa | |
Svensson et al. | An investigation of how quality requirements are specified in industrial practice | |
US12045843B2 (en) | Systems and methods for tracking data shared with third parties using artificial intelligence-machine learning | |
JP2014002482A (ja) | 影響力予測装置、影響力予測方法、及びプログラム | |
Bakhshi | Forensic of things: Revisiting digital forensic investigations in internet of things | |
Barlet-Ros et al. | Load shedding in network monitoring applications | |
De Masi et al. | Towards accurate models for predicting smartphone applications’ QoE with data from a living lab study | |
JP5665685B2 (ja) | 重要度判定装置、重要度判定方法およびプログラム | |
JP2013069175A (ja) | キーワード抽出システム、キーワード抽出方法及びプログラム | |
JP5649466B2 (ja) | 重要度判定装置、重要度判定方法およびプログラム | |
CN110088756A (zh) | 隐匿化装置、数据分析装置、隐匿化方法、数据分析方法、隐匿化程序以及数据分析程序 | |
Huang | An analysis of the intellectual structure of the cloud patents of SaaS | |
KR20210000041A (ko) | 로그 데이터의 실시간 분석 방법 및 그 장치 | |
JP2012078932A (ja) | 重要度判定装置、重要度判定方法およびプログラム | |
JP2012133451A (ja) | 重要度判定システム、データの重要度判定方法およびプログラム | |
JP5665683B2 (ja) | 重要度判定装置、重要度判定方法およびプログラム | |
Jeong et al. | Fast Fourier transform based efficient data processing technique for big data processing speed enhancement in P2P computing environment | |
Raji | Digital forensic tools & cloud-based machine learning for analyzing crime data | |
Broemeling et al. | Developing and maintaining a population research registry to support primary healthcare research | |
JP2005327014A (ja) | 情報分類分析システム、情報分類分析およびプログラム | |
Hwang et al. | TASIS: Trend analysis system for international standards |