JP5286712B2 - 情報評価装置、情報評価方法、及び情報評価プログラム - Google Patents
情報評価装置、情報評価方法、及び情報評価プログラム Download PDFInfo
- Publication number
- JP5286712B2 JP5286712B2 JP2007212668A JP2007212668A JP5286712B2 JP 5286712 B2 JP5286712 B2 JP 5286712B2 JP 2007212668 A JP2007212668 A JP 2007212668A JP 2007212668 A JP2007212668 A JP 2007212668A JP 5286712 B2 JP5286712 B2 JP 5286712B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- data
- evaluation
- detection target
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims description 103
- 238000001514 detection method Methods 0.000 claims description 72
- 239000013598 vector Substances 0.000 claims description 70
- 238000000034 method Methods 0.000 claims description 33
- 238000003860 storage Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 description 21
- 238000004364 calculation method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000010365 information processing Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
以下、本発明の第1の実施の形態を、図面を参照して説明する。
図1は、本発明の第1の実施の形態による情報評価装置の機能構成を示すブロック図である。
Aの数≧10ならばレベル3
1≦Aの数≦9またはBの数≧10ならばレベル2
1≦Bの数≦9またはCの数≧10ならばレベル1
A=B=0およびCの数≦9ならばレベル0
ここで、上記例のベクトル1とベクトル2については、成分ごとの合計数がそれぞれAの数=2、Bの数=4、Cの数=5であるため、上記のレベル分類条件と照合すると、Aの数が1以上であることからレベル2と判定される。
本実施の形態によれば、評価対象とするデータ全体の重要度を精度よく判定することができる。その理由は、第1に、重要度の評価に有効な情報の種類毎にそれが検出された総数を所定の基準と照合することによってデータ全体の重要度を判定しているため、個々の情報の検出数を考慮せずにその有無だけに基づいて評価する場合に比べて、データ全体の価値が過剰に低くなることを回避できるからである。第2に、検出した情報のうち、重複している冗長な分の情報量を除去した後に重要度の判定を行なうため、データ全体の価値が過剰に高くなることも回避できるからである。
実施例1において、図1における入力部1は、例えばあるデスクトップPCに内蔵または接続されている全ての記憶装置に保存されているファイルであることを条件とし、当該条件を満たす全ファイルを情報検出部2に順次入力する。ここでは説明の簡単化のため、前記記憶装置には図4の表に示したようなfile1.txt、file2.ppt、file3.xls、file4.pdfの4つのファイルのみが保存されていたとして、以降の説明を進める。
cos(V1,V2)=V1・V2/|V1||V2|
で表すことができる。分子はベクトルV1とV2の内積を表し、分母はベクトルV1、V2それぞれの大きさ(長さ)の積を表している。ここでは、ベクトルの各成分に対する重み付きの余弦を類似度の評価に使う。ベクトルの各成分に対する重みには、図5で重み係数として記載したものを用いる。すなわち、各ベクトルの第1、第2、第3、第4成分に対してそれぞれ4,2,3,1倍の重みを予め乗ずる。重みを与えることで、ベクトル間の類似度計算において相対的に重視する成分や逆に重視しない成分をコントロールすることができる。上記の重みでは、1番目の成分(「プライベート情報」)を最も重視し、4番目の成分(「アドレス情報」)を最も軽視することを表している。図5に示したベクトルV1、V2、V3、V4について全ての2つのベクトルによる重み付き余弦類似度の組合せは、図6のようになる。
TI=Max{(プライベート情報≧10)*5,
(他社連絡情報≧10)*4,
(1≦プライベート情報≦9)*3,
(1≦他社連絡情報≦9|社内連絡情報≧10)*2,
(1≦社内連絡情報≦9|アドレス情報≧10)*1}
で計算される。ここでMax{ }は、{ }内の値のうち最大値をとる関数、|は論理和(OR)演算子、*は乗算演算子とする。図8に示した重複除去後の成分毎の合計数の組{6、5、2、3}から重要度を算出すると、
TI=Max{(プライベート情報の数=6)*3,
(他社連絡情報=2)*2,
(社内連絡情報=5)*1}
=3
となる。情報量調整部3による重複分の除去を行なわなかった場合、成分毎の合計数の組は図4の表の合計欄に示したように{8,11,3,4}となるため、重要度TIは、
TI=Max{(プライベート情報の数=6)*3,
(他社連絡情報=2|社内連絡情報=11)*2}
=3
のように計算される。この場合は計算結果の値に差が無いが、例えば社内連絡情報が10件以上の場合に重要度のレベルが4であると定義されていた場合は、情報量調整部3の処理が無ければ社内連絡情報の合計が11となり、重要度TIの値は4になる。
以上説明した実施例1による情報評価装置10の動作にかかる一連の情報評価方法によれば、ファイルに含まれた個人情報の漏洩による被害や該個人情報のマーケティング等への適切な利用による利益を鑑みて、個人情報に類する4種類の情報(プライベート情報他)を前記ファイル群の重要度を評価する上で有効な情報として検出し、検出した情報から各ファイルの特徴を表すベクトルを生成して該ベクトル間の演算による効率的な重複判定を行ない、その結果適切な重要度の値を算出することができる。
図11は、本発明による情報評価装置10を実装した端末PC100およびサーバ102を含み、さらに外部記憶装置101を含んで構成される。端末PC100の利用者が端末PC100から外部記憶装置101またはサーバ102に1つ以上のファイルをコピーしようとした際に、それら1つ以上のファイル全体に対する重要度を端末PC100上で動作する情報評価装置10が自動的に評価し、該重要度が所定の閾値以上であれば前記ファイルのコピーを中断し、警告を発する。ここで例えば、重要度の値に対応した金額を与えて「コピーしようとした一連のファイルには漏洩した場合に○円の損失となる個人情報が含まれています」のようなメッセージを出力してもよい。また、外部記憶装置101にファイルをコピーする場合とサーバ102にファイルをコピーする場合とで、異なる閾値を設定していても良い。
以上説明した実施例2によれば、端末PC100やサーバ102に情報評価装置10を含むことにより、情報漏洩の予防やリスク管理のための効率的なデータ収集が実現できる。
以上、好ましい実施の形態をあげて本発明を説明したが、本発明は、必ずしも上記実施の形態に限定されるものでなく、その技術的思想の範囲内において様々に変形して実施することができる。例えば、算出される資産価値の評価結果が実際より過剰に低くなることは容認できないが、実際より高くなることはある程度許容できるような条件がある場合や、事前に重複データの除去が行なわれている状況の下では、図12に示されるように、上記第1の実施の形態から情報量調整部3を取り除いた構成の情報評価装置10’も有効な実施の形態として考えられる。
1:入力部
2:情報検出部
3:情報量調整部
4:重要度評価部
5:出力部
11:CPU
12:主記憶部
13:提示部
14:入力部
15:インタフェース部
16:補助記憶部
17:システムバス
31:ベクトル生成部
32:重複データ判定部
32a:データ名同一性判定部
32b:ベクトル同一性判定部
33:重複内容判定部
33a:内容同一性判定部
34:重複除去部
Claims (11)
- 文字情報を含むデータの集合である評価対象データ群の重要度の評価に有効な情報として予め定められた検出対象情報を記憶する記憶部と、該記憶部に接続されたプロセッサとを有し、
前記プロセッサは、
前記データのうち所定の条件を満たす全てのデータをそれぞれ前記評価対象データ群を構成する1単位のデータとして入力し、
前記検出対象情報を前記評価対象データ群を構成する各1単位のデータから検出し、
前記検出された検出対象情報について、重複した冗長分の情報の数を減じて前記評価対象データ群全体に対する前記検出対象情報の総数の調整を行い、
前記調整後の前記検出対象情報の種類毎の総数をそれぞれ所定の基準と照合することによって前記評価対象データ群の重要度を判定し、
前記判定した重要度を出力する
ようにプログラムされており、
前記判定では、前記検出された検出対象情報の種類毎に、その総数と対応する前記所定の基準との大小を比較することによって前記評価対象データ群の重要度を判定し、
前記検出対象情報の総数の調整では、
前記データに含まれる前記検出対象情報の種類毎の数をそれぞれ成分としたベクトルを前記各1単位のデータ毎に生成し、
複数の前記ベクトル間で類似度が所定の閾値を超えた場合に、対応する前記1単位のデータ同士を重複データと判定し、
前記重複データの集合における前記検出対象情報の種類毎の数の最大値を、それぞれ当該重複データ全てに対する前記検出対象情報の種類毎の総数とする重複除去を行う
情報評価装置。 - 前記検出対象情報は機密情報である
請求項1に記載の情報評価装置。 - 前記機密情報は個人情報である請求項2に記載の情報評価装置。
- 前記重複データの判定では、さらに前記1単位のデータ同士の名前の類似度を重複データの判定基準に用いる
請求項1に記載の情報評価装置。 - 前記検出対象情報の総数の調整では、さらに、前記1単位のデータから検出された複数の検出対象情報同士を比較することにより、該情報同士の同一性を判定し、
前記重複除去では、前記所定の条件を満たす全ての1単位のデータから検出された検出対象情報全てに対して、同一と判定された情報のうち1つ以外の全ての情報の数を、前記ベクトルの対応する成分の値から差し引く
請求項1または4に記載の情報評価装置。 - 前記入力における前記所定の条件は、ファイル名に特定の拡張子を持つファイルおよび/または特定の拡張子を持たないファイルであること、である
請求項1乃至5の何れか1項に記載の情報評価装置。 - 前記入力における前記所定の条件は、特定の記憶領域に保持されるデータであること、である
請求項1乃至5の何れか1項に記載の情報評価装置。 - 文字情報を含むデータの集合である評価対象データ群の重要度の評価に有効な情報として予め定められた検出対象情報を記憶する記憶部と、該記憶部に接続されたプロセッサとを有する情報評価装置が実行する情報評価方法であって、
前記プロセッサが、
前記データのうち所定の条件を満たす全てのデータをそれぞれ前記評価対象データ群を構成する1単位のデータとして入力し、
前記検出対象情報を前記評価対象データ群を構成する各1単位のデータから検出し、
前記検出された検出対象情報について、重複した冗長分の情報の数を減じて前記評価対象データ群全体に対する前記検出対象情報の総数の調整を行い、
前記調整後の前記検出対象情報の種類毎の総数をそれぞれ所定の基準と照合することによって前記評価対象データ群の重要度を判定し、
前記判定した重要度を出力し、
前記検出対象情報の総数の調整では、
前記データに含まれる前記検出対象情報の種類毎の数をそれぞれ成分としたベクトルを前記各1単位のデータ毎に生成し、
複数の前記ベクトル間で類似度が所定の閾値を超えた場合に、対応する前記1単位のデータ同士を重複データと判定し、
前記重複データの集合における前記検出対象情報の種類毎の数の最大値を、それぞれ当該重複データ全てに対する前記検出対象情報の種類毎の総数とする重複除去を行う
情報評価方法。 - 文字情報を含むデータの集合である評価対象データ群の重要度の評価に有効な情報として予め定められた検出対象情報を記憶する記憶部に接続されたプロセッサに、
前記データのうち所定の条件を満たす全てのデータをそれぞれ前記評価対象データ群を構成する1単位のデータとして入力する入力処理と、
前記検出対象情報を前記評価対象データ群を構成する各1単位のデータから検出する情報検出処理と、
前記検出された検出対象情報について、重複した冗長分の情報の数を減じて前記評価対象データ群全体に対する前記検出対象情報の総数の調整を行う調整処理と、
前記調整後の前記検出対象情報の種類毎の総数をそれぞれ所定の基準と照合することによって前記評価対象データ群の重要度を判定する重要度判定処理と、
前記判定した重要度を出力する出力処理と
を行わせるための情報評価プログラムであって、
前記情報量調整処理は、
前記データに含まれる前記検出対象情報の種類毎の数をそれぞれ成分としたベクトルを前記各1単位のデータ毎に生成するベクトル生成処理と、
複数の前記ベクトル間で類似度が所定の閾値を超えた場合に、対応する前記1単位のデータ同士を重複データと判定する重複データ判定処理と、
前記重複データの集合における前記検出対象情報の種類毎の数の最大値を、それぞれ当該重複データ全てに対する前記検出対象情報の種類毎の総数とする重複除去処理と、
を含む
情報評価プログラム。 - 前記重複データ判定処理は、さらに前記1単位のデータ同士の名前の類似度を重複データの判定基準に用いる
請求項9に記載の情報評価プログラム。 - 前記情報量調整処理は、前記1単位のデータから検出された複数の検出対象情報同士を比較することにより、該情報同士の同一性を判定する重複内容判定処理をさらに含み、
前記重複除去処理は、前記所定の条件を満たす全ての1単位のデータから検出された検出対象情報全てに対して、同一と判定された情報のうち1つ以外の全ての情報の数を、前記ベクトルの対応する成分の値から差し引く
請求項9または10に記載の情報評価プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007212668A JP5286712B2 (ja) | 2007-08-17 | 2007-08-17 | 情報評価装置、情報評価方法、及び情報評価プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007212668A JP5286712B2 (ja) | 2007-08-17 | 2007-08-17 | 情報評価装置、情報評価方法、及び情報評価プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009048350A JP2009048350A (ja) | 2009-03-05 |
JP5286712B2 true JP5286712B2 (ja) | 2013-09-11 |
Family
ID=40500516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007212668A Active JP5286712B2 (ja) | 2007-08-17 | 2007-08-17 | 情報評価装置、情報評価方法、及び情報評価プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5286712B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200059731A (ko) * | 2018-11-21 | 2020-05-29 | 전자부품연구원 | 메모리 db 기반 중복 제거 블록 데이터 전송 방법 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7023439B2 (ja) * | 2020-02-07 | 2022-02-21 | 三菱電機株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002245061A (ja) * | 2001-02-14 | 2002-08-30 | Seiko Epson Corp | キーワード抽出 |
JP2005173950A (ja) * | 2003-12-11 | 2005-06-30 | Canon Inc | 文書処理装置及び文書処理方法 |
KR100645614B1 (ko) * | 2005-07-15 | 2006-11-14 | (주)첫눈 | 정보 가치 측정결과를 반영한 검색 방법 및 검색 장치 |
JP2007179403A (ja) * | 2005-12-28 | 2007-07-12 | Mitsubishi Electric Corp | 監視装置 |
-
2007
- 2007-08-17 JP JP2007212668A patent/JP5286712B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200059731A (ko) * | 2018-11-21 | 2020-05-29 | 전자부품연구원 | 메모리 db 기반 중복 제거 블록 데이터 전송 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP2009048350A (ja) | 2009-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Moghimi et al. | New rule-based phishing detection method | |
EP2422273B1 (en) | Digital dna sequence | |
US9692762B2 (en) | Systems and methods for efficient detection of fingerprinted data and information | |
US20180293377A1 (en) | Suspicious behavior detection system, information-processing device, method, and program | |
US9436463B2 (en) | System and method for checking open source usage | |
US8782805B2 (en) | Method and system for detecting when an outgoing communication contains certain content | |
US9473521B2 (en) | Method and system for information leak prevention | |
Laorden et al. | Study on the effectiveness of anomaly detection for spam filtering | |
Davies et al. | Differential area analysis for ransomware attack detection within mixed file datasets | |
US8600985B2 (en) | Classifying documents according to readership | |
US9495639B2 (en) | Determining document classification probabilistically through classification rule analysis | |
CN107871089B (zh) | 文件防护方法及装置 | |
US20200314125A1 (en) | Email Attack Detection And Forensics | |
Ma et al. | An API Semantics‐Aware Malware Detection Method Based on Deep Learning | |
Radhakrishna et al. | A temporal pattern mining based approach for intrusion detection using similarity measure | |
Deypir et al. | Instance based security risk value estimation for Android applications | |
JP5286712B2 (ja) | 情報評価装置、情報評価方法、及び情報評価プログラム | |
JP6247749B2 (ja) | 情報漏洩検知装置、情報漏洩検知方法、および情報漏洩検知プログラム | |
US11321453B2 (en) | Method and system for detecting and classifying malware based on families | |
CN109413048B (zh) | 基于文件型蜜罐检测勒索软件方法、电子设备及程序产品 | |
Garfinkel et al. | Detecting threatening insiders with lightweight media forensics | |
Chivukula et al. | Empirical study on Microsoft malware classification | |
US11288364B1 (en) | Data protection based on cybersecurity feeds | |
CN105893859A (zh) | 用于数据泄露防护的方法和系统 | |
Rani et al. | A Data-Driven Classification Framework for Cybersecurity Breaches |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20091007 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20091007 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100713 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120419 |
|
RD07 | Notification of extinguishment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7427 Effective date: 20120711 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120918 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121113 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130325 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130401 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130520 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5286712 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |