JP6342577B2 - データ配信チャネルを介して機密情報を送信する試みを検出するためのシステム及び方法 - Google Patents

データ配信チャネルを介して機密情報を送信する試みを検出するためのシステム及び方法 Download PDF

Info

Publication number
JP6342577B2
JP6342577B2 JP2017511681A JP2017511681A JP6342577B2 JP 6342577 B2 JP6342577 B2 JP 6342577B2 JP 2017511681 A JP2017511681 A JP 2017511681A JP 2017511681 A JP2017511681 A JP 2017511681A JP 6342577 B2 JP6342577 B2 JP 6342577B2
Authority
JP
Japan
Prior art keywords
file
image matching
data
image
matching technique
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017511681A
Other languages
English (en)
Other versions
JP2017531249A (ja
Inventor
アビアントーン・ラムジー
リンゼー・マイケル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NortonLifeLock Inc
Original Assignee
Symantec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Symantec Corp filed Critical Symantec Corp
Publication of JP2017531249A publication Critical patent/JP2017531249A/ja
Application granted granted Critical
Publication of JP6342577B2 publication Critical patent/JP6342577B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6209Protecting access to data via a platform, e.g. using keys or access control rules to a single file or object, e.g. in a secure envelope, encrypted and accessed using a key, or with access control rules appended to the object itself
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Storage Device Security (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

企業のネットワーク及びファイリングキャビネットは、多くの場合、秘密電子メール、企業の非公開文書、従業員記録、個人識別情報、納税申告用紙、財務情報などの形態の、機密データで満たされている。この機密データは、数十又は更には数百のサーバ、パーソナルコンピュータ、及び/又はハードコピーにわたって散在していることがある。このデータが安全に保たれていることを保証することは、企業の評判及びその成功の両方にとって非常に重要となる場合がある。企業は、機密データが適正に扱われることを保証するデータ漏えい防止(DLP)ポリシーを有することがあるが、データを電子メールから可搬型記憶デバイスへ、ファックスへ、ファイル共有へと送信する無数の方法があることにより、DLPポリシーの実施は以前にも増して困難になっている。
従来のDLPシステムは、一般的に、光学文字読み取り技術(OCR)を使用して、発信するハードコピー文書を検査して、それらの内容がDLPポリシーによって保護されているかを判断する。残念ながら、OCR技術は、資源集約的かつ不正確である場合が多い。したがって、本開示は、データ配信チャネルを介して機密情報を送信する試みを検出するための、追加の改善されたシステム及び方法に対する必要性を特定し、それに対処する。
更に詳細に後述するように、本開示は、全ての文書を画像として取り扱い、次に画像処理技術を使用して、DLPポリシーによって保護された画像のギャラリーと比較するための特徴を抽出することによって、データ配信チャネルを介して機密情報を送信する試みを検出する様々なシステム及び方法について記載する。
一実施例では、データ配信チャネルを介して機密情報を送信する試みを検出するためのコンピュータ実装方法は、(1)データ配信チャネルを通してファイルを送信する試みを識別すること、(2)画像マッチング技術を使用して、ファイルと、画像形式で格納されると共にDLPポリシーによって保護された少なくとも1つの既知の機密ファイルとを比較すること、(3)画像マッチング技術の結果に基づいて、ファイルがDLPポリシーに違反していると判断すること、及び(4)ファイルがDLPポリシーに違反しているとの判断に応答してセキュリティ対策を実施することを含んでもよい。
いくつかの実施形態では、セキュリティ対策は、(1)データ配信チャネルを通してファイルを送信する試みをブロックすること、(2)データ配信チャネルを通してファイルを送信する試みを管理者に警告すること、(3)データ配信チャネルを通してファイルを送信する試みがDLPポリシーに違反していることをユーザに通知すること、及び/又は(4)データ配信チャネルを通してファイルを送信する試みの記録を取ることを含んでもよい。
ファイルは、様々な方法で既知の機密ファイルと比較されてもよい。一実施形態では、ファイルと既知の機密ファイルとの比較は、ファイルを画像形式に変換することを含んでもよい。いくつかの実施例では、ファイルと既知の機密ファイルとの比較は、既知の機密ファイルとファイルとの間で異なる要素のセットを表す差分画像を作成することを含んでもよい。
それに加えて、又は別の方法として、ファイルと既知の機密ファイルとの比較(画像ドメイン内)は、既知の機密ファイル内の主要点のセットと同種であるファイル内の主要点のセットを識別することを含んでもよい。それに加えて、ファイルと既知の機密ファイルとの比較は、(1)ファイルの単一の視覚要素を既知の機密ファイルの単一の視覚要素と比較すること、(2)ファイルの主要特徴間の距離比のセットを既知の機密ファイルの主要特徴間の距離比のセットと比較すること、及び/又は(3)距離メトリックを使用して、ファイルに属する特徴ベクトルのセットを既知の機密ファイルに属する特徴ベクトルのセットと比較することを含んでもよい。
いくつかの実施例では、画像比較はいくつかのステップを伴ってもよい。一実施形態では、ファイルと既知の機密との比較は、(1)画像形式で格納されると共にデータ漏えい防止ポリシーによって保護された既知の機密ファイルのギャラリーを識別すること、(2)粗い画像マッチング技術を使用して、ファイルとギャラリー内の複数の既知の機密ファイルとを比較すること、(3)粗い画像マッチング技術よりも多くのコンピューティング資源を消費する、より精細な画像マッチング技術を使用して、ファイルと、粗い画像マッチング技術によって廃棄されなかったギャラリー内の複数の既知の機密ファイルとを比較すること、及び(4)より精細な画像マッチング技術よりも多くのコンピューティング資源を消費する最終画像マッチング技術を使用して、ファイルと、より精細な画像マッチング技術によって廃棄されなかったギャラリー内の複数の既知の機密ファイルとを比較することを含んでもよい。
一実施形態では、画像マッチング技術の結果に基づいて、ファイルがDLPポリシーに違反していると判断することは、ファイルが個人識別情報を含むと判断することを含んでもよい。例えば、既知の機密ファイルはテキストベースのフォームを含んでもよく、ファイルがDLPポリシーに違反していると判断することは、ファイルが、個人識別情報を含む、テキストベースのフォームの編集バージョンを含むと判断することを含んでもよい。
いくつかの実施例では、コンピュータ実装方法は保存データに適用されてもよい。例えば、コンピュータ実装方法は、(1)コンピューティングデバイスに格納されている追加ファイルを識別すること、(2)画像マッチング技術を使用して、追加ファイルと、画像形式で格納されると共にDLPポリシーによって保護された少なくとも1つの追加の既知の機密ファイルとを比較すること、(3)画像マッチング技術に基づいて、追加ファイルがDLPポリシーに違反していると判断すること、及び(4)追加ファイルがDLPポリシーに違反しているとの判断に応答して、追加のセキュリティ対策を実施することを更に含んでもよい。
一実施形態では、上述の方法を実装するシステムは、(1)データ配信チャネルを通してファイルを送信する試みを識別する、メモリに格納された、識別モジュール、(2)画像マッチング技術を使用して、ファイルと、画像形式で格納されると共にDLPポリシーによって保護された少なくとも1つの既知の機密ファイルとを比較する、メモリに格納された、比較モジュール、(3)画像マッチング技術の結果に基づいて、ファイルがDLPポリシーに違反していると判断する、メモリに格納された、判断モジュール、(4)ファイルがDLPポリシーに違反しているとの判断に応答してセキュリティ対策を実施する、メモリに格納された、セキュリティモジュール、並びに(5)識別モジュール、比較モジュール、判断モジュール、及びセキュリティモジュールを実行するように構成された、少なくとも1つの物理的プロセッサを含んでもよい。
いくつかの実施例では、上述の方法は、非一時的コンピュータ可読媒体上のコンピュータ可読命令としてコード化されてもよい。例えば、コンピュータ可読媒体は、コンピューティングデバイスの少なくとも1つのプロセッサによって実行されると、(1)データ配信チャネルを通してファイルを送信する試みを識別すること、(2)画像マッチング技術を使用して、ファイルと、画像形式で格納されると共にDLPポリシーによって保護された少なくとも1つの既知の機密ファイルとを比較すること、(3)画像マッチング技術の結果に基づいて、ファイルがDLPポリシーに違反していると判断すること、及び(4)ファイルがDLPポリシーに違反しているとの判断に応答して、セキュリティ対策を実施することを、コンピューティングデバイスに行わせる、1つ以上のコンピュータ実行可能命令を含んでもよい。
上述の実施形態のいずれかによる特徴が、本明細書に記載する一般原理にしたがって、互いに組み合わせて使用されてもよい。これら及び他の実施形態、特徴、及び利点は、以下の発明を実施するための形態を、添付の図面及び特許請求の範囲と併せ読むことによって、更に十分に理解されるだろう。
添付図面は、いくつかの例示的な実施形態を図示するものであり、本明細書の一部である。以下の説明と併せて、これらの図面は本開示の様々な原理を実証し説明する。
データ配信チャネルを介して機密情報を送信する試みを検出するための例示的なシステムを示すブロック図である。 データ配信チャネルを介して機密情報を送信する試みを検出するための追加の例示的なシステムを示すブロック図である。 データ配信チャネルを介して機密情報を送信する試みを検出するための例示的な方法を示すフローチャートである。 データ配信チャネルを介して機密情報を送信する試みを検出するための例示的なシステムを示すブロック図である。 データ配信チャネルを介して機密情報を送信する試みを検出するための例示的な方法を示すフローチャートである。 データ配信チャネルを介して機密情報を送信する試みを検出するための例示的なコンピューティングシステムの例示的な出力を示すブロック図である。 本明細書に記載及び/又は図示される実施形態のうち1つ以上を実装することができる例示的なコンピューティングシステムを示すブロック図である。 本明細書に記載及び/又は図示される実施形態のうち1つ以上を実装することができる例示的なコンピューティングネットワークを示すブロック図である。
図面を通して、同一の参照符号及び記述は、必ずしも同一ではないが類似している要素を示す。本明細書に記載される例示的な実施形態は、様々な修正物及び代替的な形態が可能であるが、特定の実施形態が例として図面に示されており、本明細書に詳細に記載される。しかしながら、本明細書に記載される例示的な実施形態は、開示される特定の形態に限定されることを意図しない。むしろ、本開示は、添付の特許請求の範囲内にある全ての修正物、等価物、及び代替物を網羅する。
本開示は、一般に、データ配信チャネルを介して機密情報を送信する試みを検出するためのシステム及び方法に向けられている。より詳細に後述されるように、全ての文書を画像として取り扱うことによって、本明細書に記載されるシステムは、OCRに固有の問題を回避しながら、文書を効率的に比較することができる。文書が機密文書のバージョンであることが見出された場合、本明細書に記載されるシステムは、DLPポリシー違反を識別するため、及び/又はかかる違反をより容易に調査可能にするために、文書のバージョン間における変更の検出、位置決め、及び/又は強調表示を行ってもよい。
以下に、図1、図2、及び図4を参照して、データ配信チャネルを介して機密情報を送信する試みを検出するための、例示的なシステムを詳細に説明する。対応するコンピュータ実装方法の詳細な説明もまた、図3、図5、及び図6に関連して提供される。それに加えて、本明細書に記載される実施形態のうち1つ以上を実装することができる、例示的なコンピューティングシステム及びネットワークアーキテクチャの詳細な説明が、それぞれ図7及び図8に関連して提供される。
図1は、データ配信チャネルを介して機密情報を送信する試みを検出するための、例示的なシステム100のブロック図である。この図に図示されるように、例示的なシステム100は、1つ以上のタスクを実施するための1つ以上のモジュール102を含んでもよい。例えば、より詳細に後述するように、例示的なシステム100は、データ配信チャネルを通してファイルを送信する試みを識別してもよい、識別モジュール104を含んでもよい。例示的なシステム100は、それに加えて、画像マッチング技術を使用して、ファイルと、画像形式で格納されると共にデータ漏えい防止ポリシーによって保護されてもよい少なくとも1つの既知の機密ファイル122とを比較してもよい、比較モジュール106を含んでもよい。例示的なシステム100はまた、画像マッチング技術の結果に基づいて、ファイルがデータ漏えい防止ポリシーに違反していると判断してもよい、判断モジュール108を含んでもよい。例示的なシステム100は、それに加えて、ファイルがデータ漏えい防止ポリシーに違反しているとの判断に応答してセキュリティ対策を実施してもよい、セキュリティモジュール110を含んでもよい。別々の要素として図示されるが、図1のモジュール102のうち1つ以上が、単一のモジュール又はアプリケーションの部分を表してもよい。
特定の実施形態では、図1のモジュール102のうち1つ以上は、コンピューティングデバイスによって実行されると、1つ以上のタスクをコンピューティングデバイスに実施させてもよい、1つ以上のソフトウェアアプリケーション又はプログラムを表してもよい。例えば、より詳細に後述するように、モジュール102のうち1つ以上は、図2に図示されるデバイス(例えば、コンピューティングデバイス202及び/又はサーバ206)、図7のコンピューティングシステム710、並びに/あるいは図8の例示的なネットワークアーキテクチャ800の部分など、1つ以上のコンピューティングデバイスに格納され、その上で動くように構成された、ソフトウェアモジュールを表してもよい。図1のモジュール102のうち1つ以上は、1つ以上のタスクを実施するように構成された1つ以上の専用コンピュータの全て又は一部も表してもよい。
図1に図示されるように、例示的なシステム100はまた、データベース120などの1つ以上のデータベースを含んでもよい。一実施例では、データベース120は、機密ファイル122を格納するように構成されてもよい。データベース120は、単一のデータベース若しくはコンピューティングデバイスの部分、又は複数のデータベース若しくはコンピューティングデバイスの部分を表してもよい。例えば、データベース120は、図2のサーバ206の一部分、図7のコンピューティングシステム710、及び/又は図8の例示的なネットワークアーキテクチャ800の部分を表してもよい。別の方法として、図1のデータベース120は、図2のサーバ206、図7のコンピューティングシステム710、及び/又は図8の例示的なネットワークアーキテクチャ800の部分など、コンピューティングデバイスによってアクセスすることができる、1つ以上の物理的に別個のデバイスを表してもよい。
図1の例示的なシステム100は様々な方法で実装されてもよい。例えば、例示的なシステム100の全て又は一部は、図2における例示的なシステム200の部分を表してもよい。図2に示されるように、システム200は、ネットワーク204を介してサーバ206と通信するコンピューティングデバイス202を含んでもよい。一実施例では、コンピューティングデバイス202は、モジュール102のうち1つ以上を用いてプログラムされてもよく、かつ/又はデータベース120内のデータの全て若しくは一部を格納してもよい。それに加えて、又は別の方法として、サーバ206は、モジュール102のうち1つ以上を用いてプログラムされてもよく、かつ/又はデータベース120内のデータの全て若しくは一部を格納してもよい。
一実施形態では、図1のモジュール102のうち1つ以上により、コンピューティングデバイス202及び/又はサーバ206の少なくとも1つによって実行されると、データ配信チャネルを介して機密ファイルを送信する試みを、コンピューティングデバイス202及び/又はサーバ206が検出することが可能になってもよい。例えば、より詳細に後述するように、識別モジュール104は、データ配信チャネル209を通してファイル208を送信する試みを識別してもよい。比較モジュール106は、次に、画像マッチング技術を使用して、ファイル208と、画像形式で格納されると共にDLPポリシー212によって保護された少なくとも1つの既知の機密ファイル122とを比較してもよい。判断モジュール108は、次に、一致結果214に基づいて、ファイル208がDLPポリシー212に違反していると判断してもよい。最後に、セキュリティモジュール110は、ファイル208がDLPポリシー212に違反しているとの判断に応答して、セキュリティ対策216を実行してもよい。
コンピューティングデバイス202は、一般に、コンピュータ実行可能命令を読み取ることができる任意のタイプ又は形態のコンピューティングデバイスを表す。コンピューティングデバイス202の例としては、非限定的に、ラップトップ、タブレット、デスクトップ、サーバ、携帯電話、携帯情報端末(PDA)、マルチメディアプレーヤー、埋め込みシステム、ウェアラブルデバイス(例えば、スマートウォッチ、スマートグラスなど)、ゲームコンソール、それらの1つ以上の組み合わせ、図7の例示的なコンピューティングシステム710、あるいは他の任意の好適なコンピューティングデバイスが挙げられる。
サーバ206は、一般に、画像のギャラリーを格納することができる任意のタイプ又は形態のコンピューティングデバイスを表す。サーバ206の例としては、非限定的に、様々なデータベースサービスを提供するように、かつ/又は特定のソフトウェアアプリケーションを実行するように構成された、アプリケーションサーバ及びデータベースサーバが挙げられる。
ネットワーク204は、一般に、通信若しくはデータ転送を容易にすることができる、任意の媒体又はアーキテクチャを表す。ネットワーク204の例としては、非限定的に、イントラネット、広域ネットワーク(Wide Area Network)(WAN)、ローカルエリアネットワーク(Local Area Network)(LAN)、パーソナルエリアネットワーク(Personal Area Network)(PAN)、インターネット、電力線通信(PLC)、セルラーネットワーク(例えば、Global System for Mobile Communications(GSM(登録商標))ネットワーク)、図8の例示的なネットワークアーキテクチャ800などが挙げられる。ネットワーク204は、無線若しくは有線接続を使用して通信又はデータ転送を容易にしてもよい。一実施形態では、ネットワーク204は、コンピューティングデバイス202とサーバ206との間の通信を容易にしてもよい。
図3は、データ配信チャネルを介して機密情報を送信する試みを検出するための、例示的なコンピュータ実装方法300のフローチャートである。図3に示されるステップは、任意の好適なコンピュータ実行可能コード及び/又はコンピューティングシステムによって実施されてもよい。いくつかの実施形態では、図3に示されるステップは、図1のシステム100、図2のシステム200、図7のコンピューティングシステム710、及び/又は図8の例示的なネットワークアーキテクチャ800の部分の構成要素のうち1つ以上によって実施されてもよい。
図3に図示されるように、ステップ302で、本明細書に記載されるシステムのうち1つ以上が、データ配信チャネルを通してファイルを送信する試みを識別してもよい。例えば、識別モジュール104は、図2のサーバ206の一部として、データ配信チャネル209を通してファイル208を送信する試みを識別してもよい。
「データ配信チャネル」という用語は、本明細書で使用するとき、一般に、あるエンティティから別のエンティティにデジタル情報を分散させることができる、任意のタイプ若しくは形態の通信経路、コンピューティングシステム、及び/又は実行可能コードを指す。データ配信チャネルの例としては、非限定的に、コンピューティングデバイス、移動通信デバイス、電子メールアカウント、テキストメッセージ通信サービス、ソーシャルネットワーキングプラットフォーム、インターネット及びイーサネット(登録商標、以下同じ)ネットワーク、サーバ、取外し可能な記憶デバイス、データ転送ケーブル、並びに/あるいは他の任意の好適な通信チャネルが挙げられる。
識別モジュール104は、様々な方法及び/又はコンテキストで、ファイルを送信する試みを識別してもよい。例えば、識別モジュール104は、エンドポイントデバイスにインストールされてもよく、ユニバーサルシリアルバス(USB)ポート、ネットワーク接続、ファイル転送プロトコルクライアント、及び/又は電子メールクライアントなど、エンドポイントデバイスのデータ配信チャネルを監視してもよい。別の実施例では、識別モジュール104は、ネットワークゲートウェイにインストールされてもよく、ネットワークトラフィックを監視してもよい。例えば、識別モジュール104は、ファックス機器を監視して、発信するファックスを介して機密情報を送信する試みを識別してもよい。いくつかの実施形態では、識別モジュール104は、安全な環境外の宛先にファイルを送信する試みのみを識別してもよい。他の実施形態では、識別モジュール104は、データ配信チャネルを介してファイルを送信するあらゆる試みを識別してもよい。
いくつかの実施形態では、識別モジュール104は、ファイルを送信する試みを識別すると(また、ステップ304の実施に先立って)、更なる解析が保証されるか否かを判断するために、予備的解析を実施してもよい。一実施形態では、この予備的解析は、ファイルの色ヒストグラムを解析することを伴ってもよい。例えば、識別モジュール104は、ファイルの色ヒストグラムを解析することによって、ファイルが明るい色の画像(例えば、休暇中の写真)であり、したがって機密情報を含む白黒フォームに一致する可能性は低いと判断してもよい。この実施例では、識別モジュール104は、ファイルを送信する試みを可能にしてもよく、かつ/又は更なる解析のために比較モジュール106にファイルを伝えるのを控えてもよい。この初期解析を実施することによって、識別モジュール104は、一部の画像がDLPポリシーに属していないことがあることを迅速に判断してもよく、それにより、別の方法では画像をより徹底的に解析するのに必要であろう、追加資源を節約してもよい。
ステップ304で、本明細書に記載されるシステムのうち1つ以上は、画像マッチング技術を使用して、ファイルと、画像形式で格納されると共にDLPポリシーによって保護された少なくとも1つの既知の機密ファイルとを比較してもよい。例えば、比較モジュール106は、図2のサーバ206の一部として、画像マッチング技術を使用して、ファイル208と、画像形式で格納されると共にDLPポリシー212によって保護された少なくとも1つの既知の機密ファイル122とを比較してもよい。
「画像マッチング技術」という用語は、本明細書で使用するとき、一般に、ある画像が別の画像に類似しているか否かを判断するのに使用される、任意の方法又は方法の組み合わせを指す。画像マッチング技術は、大域的及び局所的の両方の画像処理並びに/又はコンピュータビジョン技術を含んでもよい。大域的技術は画像全体を解析し、一方局所的技術は画像中の関心点のセットに焦点を当てる。いくつかの実施例では、局所的画像マッチング技術は、スケール不変性特徴変換(scale-invariant feature transform)(SIFT)技術、高速堅牢特徴(speeded-up robust features)(SURF)技術、並びに/あるいは有向FAST及び回転BRIEF(oriented fast and rotated brief)(ORB)技術など、自動又は手動で決定される主要点の周りの記述子と呼ばれる特徴ベクトルを画像から抽出する技術を含んでもよい。これらの記述子は、一般的に、スケール、照明、回転、及び視点の変化に関してある程度の不変性を提供する。大域的画像マッチング技術の例としては、ヒストグラムマッチング、相関フィルタ、主成分分析(PCA)、線形判別分析(LDA)などが挙げられるがそれらに限定されない。
「画像形式」という用語は、本明細書で使用するとき、一般に、画素の二次元アレイとして描画されてもよい、任意のデータ記憶形式を指す。いくつかの実施形態では、画像形式は、各画素を記述するデータ、及び/又は画像の幾何学的記述を含むデータを含んでもよい。いくつかの実施例では、画像形式で格納されたファイルは、形態及び/又は他のオブジェクトの絵であってもよい。画像形式の例としては、非限定的に、ラスタ画像形式、ビットマップ画像形式、グラフィックス交換形式、ポータブルネットワークグラフィックス、ベクトル画像形式、複合画像形式、及び/又は立体画像形式が挙げられる。
「機密ファイル」という用語は、本明細書で使用するとき、一般に、DLPポリシーによって保護されてもよい任意のファイルを指す。それに加えて、「データ漏えい防止ポリシー」又は「DLPポリシー」は、本明細書で使用するとき、一般に、潜在的なデータ漏えいを検出及び/又は防止するように設計された、任意のポリシー及び/又はシステムを指す。DLPシステムは、使用中、活動中、及び/又は保存中であってもよいデータに作用してもよい。DLPシステムは、データの格納及び/又は送信に関するポリシー、DLPポリシーを実施するように構成されたソフトウェア、DLPポリシーの物理的実施、並びに/あるいはデータの送信を防止してもよいハードウェア修正物を含んでもよい。DLPポリシーの例としては、非限定的に、「企業の非公開データは移動可能な記憶媒体にコピーできない」、「個人識別情報は電子メール送信できない」、及び/又は「納税申告用紙はファックス送信できない」を挙げることができる。同様に、DLP実施の例としては、非限定的に、可搬型記憶媒体への書込み要求を防止すること、発信する電子メールをフィルタ処理して機密データを検出すること、デバイスが安全でないネットワーク上にある状態で機密データにアクセスするのを防止すること、及び/又は機密データを含むファックスをブロックすることを挙げることができる。
比較モジュール106は、様々な手段及び/又はコンテキストでファイルを比較してもよい。例えば、比較モジュール106は、様々な方法を使用してファイルが機密情報を含むか否かを判断してもよい、DLPポリシー実施アプリケーションの一部であってもよい。他の実施形態では、比較モジュール106は、汎用画像比較アプリケーションの一部であってもよい。
いくつかの実施例では、比較モジュール106は、ファイルを画像形式に変換することによって、ファイルを既知の機密ファイルと比較してもよい。例えば、ファイルは画像形式でないことがあり、したがって、画像形式で格納されている機密ファイルと比較される前に変換が必要なことがある。具体的には、ファイルは、ファックス、ポータブルドキュメントフォーマットファイル、テキストファイル、及び/又は.DOCファイルの形態であることがある。そのため、比較モジュール106は、続行する前に所与の解像度にすることによって、非画像ファイルを画像形式に変換してもよい。例えば、比較モジュール106は、ファイル208を、画像形式で格納された既知の機密ファイルのギャラリーと比較する試みの前に、(例えば、様々な変換技術の1つ以上を使用して)テキストファイルからビットマップファイルに変換してもよい。
いくつかの実施形態では、比較モジュール106は、画像マッチング技術を使用して、既知の機密ファイル内の主要点のセットと同種であるファイル内の主要点のセットを識別してもよい。例えば、比較モジュール106は、画像マッチング技術を使用して、ファイル208を、採用した画像マッチング技術に関連する距離メトリックを用いて機密ファイル122と比較してもよい。1つを超える機密ファイル122がデータベースに存在する場合、比較モジュール106は、ファイル208とデータベース内のファイルそれぞれとの間の類似性を測定して、1つ以上のファイルが一致を生成するかを判断してもよい。
例えば、回転、スケーリング、照明、及び視点の変化に耐性がある(例えば自動的に若しくは管理者によって識別される、全ての主要点に対する)画像記述子を生成する、上述したような局所的画像マッチング技術を使用して、比較モジュール106は、ファイル208に属する記述子と機密ファイル122に属する記述子との間の距離を測定してもよい。記述子が浮動値のベクトルからなる場合、L2又はL1の距離メトリックが使用されてもよい。記述子がブール値のベクトルからなる場合、L0又はハミング距離が、類似性を測定するのに使用されてもよい。他の任意の好適な距離メトリックもまた使用されてもよい。
それに加えて、比較モジュール106は、マッチング記述子のセットの空間的分布に基づいて、ファイル208を既知の機密ファイルのギャラリー中の最もマッチングがよい機密ファイルに対してマッピングする、幾何学的変換を評価してもよい。このマッピングは、誤整列を補正するホモグラフィ及び/又は投影変換を含んでもよい。
他の実施形態では、比較モジュール106は、画像マッチング技術を使用して、(1)ファイルの単一の視覚要素を既知の機密ファイルの単一の視覚要素と比較すること、(2)ファイルの主要特徴間の距離比のセットを既知の機密ファイルの主要特徴間の距離比のセットと比較すること、及び/又は(3)適切な距離メトリックを使用して、ファイルに属する特徴ベクトルのセットを既知の機密ファイルに属する特徴ベクトルのセットと比較することの少なくとも1つによって、ファイルを既知の機密ファイルと比較してもよい。
例えば、比較モジュール106は、機密ファイル122の重要な視覚要素を識別し、その重要な視覚要素の存在に関してファイル208を検査してもよい。視覚要素の例としては、非限定的に、単色の領域、直線、又は幾何学形状(例えば、円、正方形、三角形、若しくは他の任意の適切な形状)が挙げられる。それに加えて、比較モジュール106は、機密ファイル122の特定の領域内の線を位置決めし、ファイル208内で類似の長さを有すると共に類似の位置にある線を位置決めしてもよい。この比較に基づいて、比較モジュール106は、そのファイル208が機密ファイル122と一致すると判断してもよい。
比較モジュール106は、それに加えて、又は別の方法として、ファイル208内に含まれる主要点のセットを識別し、それらの間の距離の比を計算してもよい。機密ファイル122がファイル208内のものに類似した距離比を有する主要点を含む場合、比較モジュール106は、ファイル208が機密ファイル122に類似していると判断してもよい。
いくつかの実施形態では、比較モジュール106は、画像マッチング技術を使用して、(1)画像形式で格納されると共にデータ漏えい防止ポリシーによって保護された、既知の機密ファイルのギャラリーを識別すること、(2)粗い画像マッチング技術を使用して、ファイルとギャラリー内の複数の既知の機密ファイルとを比較すること、(3)粗い画像マッチング技術よりも多くのコンピューティング資源を消費する、より精細な画像マッチング技術を使用して、ファイルと、粗い画像マッチング技術によって廃棄されなかったギャラリー内の複数の既知の機密ファイルとを比較すること、及び(4)より精細な画像マッチング技術よりも多くのコンピューティング資源を消費する最終画像マッチング技術を使用して、ファイルと、より精細な画像マッチング技術によって廃棄されなかったギャラリー内の複数の既知の機密ファイルとを比較することによって、ファイルと、画像形式で格納されると共にデータ漏えい防止ポリシーによって保護された既知の機密ファイルとを比較してもよい。上述のカスケードアーキテクチャは、特に機密ファイルのデータベースが大きい場合に、機密ファイル122の識別を大幅に高速化するように設計されてもよい。カスケードアーキテクチャは、最も粗いものから最も精細なものまで複雑性及びマッチング力の増加によってソートされた一連のサブマッチャーからなってもよく、2つの主な利点を提供する。第一に、カスケードアーキテクチャによって、比較モジュール106が、資源を消費しすぎることなく簡単な不一致を漸次的に排除し、より精細な一致及びより多くの資源を消費する更なる解析を要する、より困難な潜在的一致に集中することによって、探索空間を絞り込むことを可能にしてもよい。第二に、カスケードアーキテクチャによって、比較モジュール106が、資源を消費しすぎることなく、クエリファイル208に対する一致が機密ファイルのギャラリーに存在しないと早い段階で判断することによって、早期に終了することを可能にしてもよい。
図4に図示されるように、カスケードアーキテクチャ414は、ファイル208を、いくつかの実施例では機密ファイル112を含む、様々な機密ファイルを格納してもよいギャラリー402内のいずれか又は全てのファイルと比較してもよい。カスケードアーキテクチャ414は、粗いマッチャー404、より精細なマッチャー406、及び/又は最も精細なマッチャー408を含んでもよい。いくつかの実施形態では、カスケードアーキテクチャは、より精細なマッチャー406と最も精細なマッチャー408との間に、任意の数の追加のマッチャーを含んでもよい。一実施例では、粗いマッチャー404は、ファイル208をギャラリー402内のファイルと比較してもよい。粗いマッチャー404にしたがって、ファイル208に類似したファイルがギャラリー402内にない場合、本明細書に記載されるシステムは、その時点でカスケードアーキテクチャを終了させてもよい。次に、より精細なマッチャー406が、ファイル208を、粗いマッチャー404によって除外されなかったギャラリー402内の残りのファイルと比較してもよい。より精細なマッチャー406にしたがって、ファイル208に類似したファイルがギャラリー402内にない場合、本明細書に記載されるシステムは、カスケードアーキテクチャを終了させてもよい。このプロセスは、より精細なマッチャー408が、ギャラリー402内のファイルからファイル208に対する最上位の一致410を作成するか、又はギャラリー402内にはファイル208に対する一致がないと判断するまで、任意の数の照合を繰り返してもよい。
図3に戻ると、ステップ306で、本明細書に記載されるシステムのうち1つ以上は、画像マッチング技術の結果に基づいて、ファイルがDLPポリシーに違反していると判断してもよい。例えば、判断モジュール108は、図2のサーバ206の一部として、一致結果214に基づいて、ファイル208がDLPポリシー212に違反していると判断してもよい。
判断モジュール108は、様々な手段及び/又はコンテキストで、ファイルがDLPポリシーに違反していると判断してもよい。例えば、判断モジュール108は、ファイル208とDLPポリシー212によって保護されていてもよい機密ファイル122との間の類似性を実証する、比較モジュール106からの情報を受信してもよい。一実施例として、DLPポリシー212は、従業員の緊急連絡先フォームを第三者に電子メール送信すべきでないことを提示してもよい。この実施例では、機密ファイル122は空白の緊急連絡先フォームを構成してもよく、ファイル208は、緊急連絡先フォームに記入したバージョンを構成してもよい。そのため、判断モジュール108は、ファイル208を送信する試みがDLPポリシー212の違反を構成すると判断してもよい。
一実施形態では、既知の機密ファイルはテキストベースのフォームを含んでもよく、画像マッチング技術の結果に基づいて、ファイルがDLPポリシーに違反していると判断することは、ファイルがテキストベースのフォームの編集バージョンを含むと判断することを含んでもよい。例えば、ファイル208はテキストベースのフォームを含んでもよく、比較モジュール106は、ファイル208が、一致すると思われる機密ファイル122に十分に類似した主要点を含み、更に、機密ファイル122内に含まれない他の画像要素を含むと判断してもよい。かかる比較に基づいて、比較モジュール106は、ファイル208が機密ファイル122の編集バージョンを構成すると判断してもよく、判断モジュール108は、機密ファイル122が社会保障番号などの個人識別情報を要求するフィールドを含むことから、ファイル208を送信する試みがDLPポリシー212の違反を構成すると判断してもよい。
いくつかの実施例では、フォームは、デジタル化され、画像ギャラリーに追加されて、既知の機密ファイルのサンプル又はコーパスを作成してもよい。例えば、図5に図示されるように、モジュール102は、文書508のデジタル化バージョンを受信し、フォーム画像ギャラリー506へのアクセスを有してもよい。フォーム画像ギャラリー506は、DLPポリシーによって保護されていることが知られているファイルのデジタル表現を含んでもよく、ファイルは、PDFフォーム502又は印刷フォーム504などの項目によって具体化されてもよい。印刷フォーム504の例としては、非限定的に、税務書類、給与書類、特許開示フォーム、研究ノート、又は他の任意の好適な情報の物理的表現を挙げることができる。モジュール102は、文書508を検査して、フォーム画像ギャラリー506からのフォームの要素が文書508中に存在するかを判断してもよい。モジュール102が、フォームからの要素が文書508中に存在することを見出した場合、モジュール102は次に、記入されているであろう任意の領域に関して文書508を検査し、変更を含む文書508の領域を強調表示してもよい。
文書と機密ファイルとの間の差を強調表示する例示的な一実施形態では、比較モジュール106は、画像マッチング技術を使用して、既知の機密ファイルとファイルとの間で異なる要素のセットを表す差分画像を作成することによって、ファイルと既知の機密ファイルとを比較してもよい。この差分画像は、機密ファイル122の各画素の値をファイル208の対応する画素から差し引くことによって作成されてもよい。比較モジュール106は、この差分画像操作が、識別モジュール104によって生成される画像変換によって生じる可能性がある軽微な整列誤差に対して堅牢になるような形で、単純な画素対画素の減算を超える特定の画像処理技術を用いてこの差分画像を生成してもよい。画像処理技術の例としては、拡張、侵食などの形態学的操作が挙げられるが、それに限定されない。
同様に、比較モジュール106は更に、ファイル208と機密ファイル122との間の差の強調表示を強調し向上させるために、差分画像に対する形態学的操作を用いてもよい。差分画像は、それにより、画像解析の更なるステップにおいて比較モジュール106又は判断モジュール108によって使用され、又はセキュリティ対策216の一部としてセキュリティモジュール110に送達されてもよい。
「形態学的に拡張させる」という用語は、本明細書で使用するとき、所与の画素の値が所与の半径内の他の画素に適用される、画像操作技術を指す。所与の画素の値を適用する例としては、非限定的に、所与の画素の値を周囲の画素に追加すること、並びに/あるいは画素及び周囲の画素の値を平均化することが挙げられる。他のタイプの形態学的操作はまた、本明細書に記載されるモジュールのいずれかによって用いられてもよい。
いくつかの実施例では、判断モジュール108は、少なくとも部分的には、強調表示された差分画像に基づいて、ファイルがDLPポリシーに違反していると判断してもよい。図6は、強調表示動作の例示的な出力である。この実施例では、既知の機密ファイル602は、従業員情報のフィールドを有するフォームであってもよい。ファイル604は、ジェーン・スミス(Jane Smith)という氏名の従業員に関する個人情報を含む、既知の機密ファイル602の記入済みコピーを含んでもよい。氏名、日付、電話番号、携帯電話番号、社会保障番号、及び緊急連絡先氏名のフィールドに、ジェーン・スミスに関連する情報が記入されている。点線のボックスで区切られた領域は、既知の機密ファイル602をファイル604から差し引いた後に強調表示されていてもよい領域を指す。この実施例では、ファイル602は、社会保障番号を含むファイルはデータ配信チャネルを介して送信されなくてもよいことを提示するDLPポリシーに違反していることがある。
いくつかの実施例では、判断モジュール108は、ファイルがDLPポリシーに違反する何らかのタイプの注釈が、OCR解析可能なテキストを含まない場合であっても、その注釈を含むと判断してもよい。例えば、判断モジュール108は、画像ファイル間の差が、ファイルが1つ以上の署名、透かし、スタンプ、強調表示、欄外のメモ、及び/又は他の注釈を含むことを示すと判断してもよい。この実施例では、従来のOCR技術が注釈を解釈することができなかったとしても、本明細書に記載されるシステムによって使用される画像マッチング技術は、依然として、判読不能なテキストを含むか又はテキストを全く含まない潜在的なDLPポリシー違反を識別してもよく、結果としてDLP実施に対する有効な内容非依存型の方策がもたらされる。
一実施形態では、判断モジュール108は、画像マッチング技術の結果に基づいて、ファイルが個人識別情報を含むと判断することによって、ファイルがDLPポリシーに違反していると判断してもよい。判断モジュール108は、差分画像、及び/又は比較モジュール106によって生成される強調表示された差のセットを利用することによって、DLPポリシー違反が起こっていることを確定してもよい。例えば、判断モジュール108は、差の領域に基づいて、機密情報がフォームに入力されていると判断してもよい。それに加えて、又は別の方法として、判断モジュール108は、写真中の主要点と既知の機密ファイル中の主要点とのマッチングに基づいて試作デバイスなどの機密情報の表現を写真が含むと判断してもよい。
図3に戻ると、ステップ308で、本明細書に記載されるシステムのうち1つ以上は、ファイルがDLPポリシーに違反しているとの判断に応答して、セキュリティ対策を実施してもよい。例えば、セキュリティモジュール110は、図2のサーバ206の一部として、ファイル208がDLPポリシー212に違反しているとの判断に応答して、セキュリティ対策216を実施してもよい。
セキュリティモジュール110は、様々な方法でセキュリティ対策を実施してもよい。例えば、セキュリティモジュール110は、(1)データ配信チャネルを通してファイルを送信する試みをブロックすること、(2)データ配信チャネルを通してファイルを送信する試みを管理者に警告すること、(3)データ配信チャネルを通してファイルを送信する試みがDLPポリシーに違反していることをユーザに通知すること、及び/又は(4)データ配信チャネルを通してファイルを送信する試みの記録を取ることによって、セキュリティ対策を実施してもよい。例えば、セキュリティモジュール110は、添付ファイルとして機密ファイルを含む電子メールをブロックし、かつ/又は電子メールを管理者に転送してもよい。
一実施例では、本明細書に記載されるシステムは、DLPポリシーの対象である保存ファイルを識別してもよい。例えば、管理者は、コンピューティングデバイスをスキャンして、コンピューティングデバイスに格納されたいずれかのファイルがDLPポリシーの対象であるかを判断してもよい。この実施例では、また図2を参照すると、(1)識別モジュール104は、コンピューティングデバイス202に格納されている追加ファイルを識別してもよく、(2)比較モジュール106は、画像マッチング技術を使用して、追加ファイルを、画像形式で格納されていると共にDLPポリシーによって保護された少なくとも1つの追加の既知の機密ファイルと比較してもよく、(3)判断モジュール108は、画像マッチング技術に基づいて、追加ファイルがDLPポリシーに違反していると判断してもよく、(4)セキュリティモジュール110は、追加ファイルがDLPポリシーに違反しているという判断に応答して、セキュリティ対策を実施してもよい。
上記の方法300と関連して説明したように、本明細書に記載されるシステムは、データ配信チャネルを介して送信されるファイルを(例えば、ユーザ若しくは管理者によって提供される)参照文書のギャラリーと比較して、送信されたファイルがDLPポリシーによって保護されているか否かを判断してもよい。本明細書に記載されるシステムは、参照文書及び送信される文書を画像ファイルとして取り扱ってもよく、それらが同じ文書のバージョンを表すか否かを判断するために、画像に対してコンピュータビジョン技術を実施してもよい。送信された文書がギャラリーの画像と一致した場合、本明細書に記載されるシステムは更なる解析を実施して、例えば、テキストベースのフォームの記入済みフィールドを強調表示することによって、差を強調表示してもよい。比較すべき全ての文書を画像として取り扱うことによって、本明細書に記載されるシステムは、OCRと関連付けられるオーバーヘッド及び/又は困難による負担を負うことなく、文書がDLPポリシーの対象であるか否かに関する判断を効率的に行ってもよい。
図7は、本明細書に記載及び/又は図示される実施形態のうち1つ以上を実装することができる、例示的なコンピューティングシステム710のブロック図である。例えば、コンピューティングシステム710の全て又は一部分は、単独で又は他の要素と組み合わせて、(図3に図示されるステップのうち1つ以上などの)本明細書に記載されるステップのうち1つ以上を実施してもよく、かつ/又はそれを実施するための手段であってもよい。コンピューティングシステム710の全て又は一部分はまた、本明細書に記載及び/若しくは図示される他の任意のステップ、方法、又はプロセスを実施してもよく、かつ/あるいはそれを実施するための手段であってもよい。
コンピューティングシステム710は、コンピュータ可読命令を実行することができる、任意のシングル若しくはマルチプロセッサのコンピューティングデバイス又はシステムを幅広く表す。コンピューティングシステム710の例としては、非限定的に、ワークステーション、ラップトップ、クライアント側端末、サーバ、分散型コンピューティングシステム、ハンドヘルドデバイス、又は他の任意のコンピューティングシステム若しくはデバイスが挙げられる。その最も基本的な構成では、コンピューティングシステム710は、少なくとも1つのプロセッサ714及びシステムメモリ716を含んでもよい。
プロセッサ714は、一般に、データの処理又は命令の解釈及び実行が可能な、任意のタイプ若しくは形態の物理的処理装置(例えば、ハードウェア実装型中央処理装置)を表す。特定の実施形態では、プロセッサ714は、ソフトウェアアプリケーション又はモジュールから命令を受信してもよい。これらの命令によって、プロセッサ714に、本明細書に記載及び/又は図示される例示的な実施形態のうち1つ以上の機能を実施させてもよい。
システムメモリ716は、一般に、データ及び/又は他のコンピュータ可読命令を格納することができる、任意のタイプ若しくは形態の揮発性又は不揮発性記憶デバイス又は媒体を表す。システムメモリ716の例としては、非限定的に、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、フラッシュメモリ、又は他の任意の好適なメモリデバイスが挙げられる。必須ではないが、特定の実施形態では、コンピューティングシステム710は、揮発性メモリユニット(例えば、システムメモリ716など)、及び不揮発性記憶デバイス(例えば、詳細に後述されるような、一次記憶デバイス732など)の両方を含んでもよい。一実施例では、図1のモジュール102のうち1つ以上がシステムメモリ716にロードされてもよい。
特定の実施形態では、例示的なコンピューティングシステム710はまた、プロセッサ714及びシステムメモリ716に加えて、1つ以上の構成要素又は要素を含んでもよい。例えば、図7に図示されるように、コンピューティングシステム710は、メモリコントローラ718、入力/出力(I/O)コントローラ720、及び通信インターフェース722を含んでもよく、それらはそれぞれ通信基盤712を介して相互接続されてもよい。通信基盤712は一般に、コンピューティングデバイスの1つ以上の構成要素間の通信を容易にすることができる、任意のタイプ若しくは形態の基盤を表す。通信基盤712の例としては、非限定的に、通信バス(産業標準アーキテクチャ(ISA)、周辺装置相互接続(PCI)、PCIエクスプレス(PCIe)、又は類似のバスなど)、及びネットワークが挙げられる。
メモリコントローラ718は、一般に、メモリ若しくはデータを扱うか、又はコンピューティングシステム710の1つ以上の構成要素間の通信を制御することができる、任意のタイプ又は形態のデバイスを表す。例えば、特定の実施形態では、メモリコントローラ718は、通信基盤712を介して、プロセッサ714、システムメモリ716、及びI/Oコントローラ720の間の通信を制御してもよい。
I/Oコントローラ720は、一般に、コンピューティングデバイスの入出力機能を調整及び/又は制御することができる、任意のタイプ又は形態のモジュールを表す。例えば、特定の実施形態では、I/Oコントローラ720は、プロセッサ714、システムメモリ716、通信インターフェース722、ディスプレイアダプタ726、入力インターフェース730、及び記憶インターフェース734などの、コンピューティングシステム710の1つ以上の要素間におけるデータの転送を制御するか又は容易にしてもよい。
通信インターフェース722は、例示的なコンピューティングシステム710と1つ以上の追加のデバイスとの間の通信を容易にすることができる、任意のタイプ若しくは形態の通信デバイス又はアダプタを広く表す。例えば、特定の実施形態では、通信インターフェース722は、コンピューティングシステム710と、追加のコンピューティングシステムを含む私設又は公衆ネットワークとの間の通信を容易にしてもよい。通信インターフェース722の例としては、非限定的に、有線ネットワークインターフェース(ネットワークインターフェースカードなど)、無線ネットワークインターフェース(無線ネットワークインターフェースカードなど)、モデム、及び他の任意の好適なインターフェースが挙げられる。少なくとも1つの実施形態では、通信インターフェース722は、インターネットなどのネットワークへの直接リンクを介して、リモートサーバへの直接接続を提供してもよい。通信インターフェース722はまた、例えば、ローカルエリアネットワーク(イーサネットネットワークなど)、パーソナルエリアネットワーク、電話若しくはケーブルネットワーク、セルラー電話接続、衛星データ接続、又は他の任意の好適な接続を通した、かかる接続を間接的に提供してもよい。
特定の実施形態では、通信インターフェース722はまた、外部バス又は通信チャネルを介して、コンピューティングシステム710と1つ以上の追加のネットワーク又は記憶デバイスとの間の通信を容易にするように構成された、ホストアダプタを表してもよい。ホストアダプタの例としては、非限定的に、小型コンピュータシステムインターフェース(SCSI)ホストアダプタ、USBホストアダプタ、米国電気電子学会(IEEE)1394ホストアダプタ、アドバンストテクノロジーアタッチメント(ATA)、パラレルATA(PATA)、シリアルATA(SATA)、及び外部SATA(eSATA)ホストアダプタ、ファイバーチャネルインターフェースアダプタ、イーサネットアダプタなどが挙げられる。通信インターフェース722はまた、コンピューティングシステム710が分散型又はリモートコンピューティングに関与することを可能にしてもよい。例えば、通信インターフェース722は、実行のためにリモートデバイスから命令を受信するか又はリモートデバイスに命令を送信してもよい。
図7に図示されるように、コンピューティングシステム710はまた、ディスプレイアダプタ726を介して通信基盤712に連結される少なくとも1つのディスプレイデバイス724を含んでもよい。ディスプレイデバイス724は、一般に、ディスプレイアダプタ726によって転送される情報を視覚的に表示することができる、任意のタイプ若しくは形態のデバイスを表す。同様に、ディスプレイアダプタ726は、一般に、ディスプレイデバイス724に表示するために、通信基盤712から(又は当該技術分野において知られているように、フレームバッファから)、グラフィックス、テキスト、及び他のデータを転送するように構成された、任意のタイプ又は形態のデバイスを表す。
図7に図示されるように、例示的なコンピューティングシステム710はまた、入力インターフェース730を介して通信基盤712に連結される少なくとも1つの入力デバイス728を含んでもよい。入力デバイス728は、一般に、コンピュータ又は人間のいずれかが生成した入力を、例示的なコンピューティングシステム710に提供することができる、任意のタイプ若しくは形態の入力デバイスを表す。入力デバイス728の例としては、非限定的に、キーボード、ポインティングデバイス、音声認識デバイス、又は他の任意の入力デバイスが挙げられる。
図7に図示されるように、例示的なコンピューティングシステム710はまた、記憶インターフェース734を介して通信基盤712に連結される、一次記憶デバイス732及びバックアップ記憶デバイス733を含んでもよい。記憶デバイス732及び733は、一般に、データ及び/又は他のコンピュータ可読命令を格納することができる、任意のタイプ若しくは形態の記憶デバイス又は媒体を表す。例えば、記憶デバイス732及び733は、磁気ディスクドライブ(例えば、いわゆるハードドライブ)、ソリッドステートドライブ、フロッピーディスクドライブ、磁気テープドライブ、光ディスクドライブ、フラッシュドライブなどであってもよい。記憶インターフェース734は、一般に、記憶デバイス732及び733とコンピューティングシステム710の他の構成要素との間でデータを転送する、任意のタイプ若しくは形態のインターフェース又はデバイスを表す。一実施例では、図1のデータベース120は、一次ストレージデバイス732に格納されてもよい。
特定の実施形態では、記憶デバイス732及び733は、コンピュータソフトウェア、データ、又は他のコンピュータ可読情報を格納するように構成された取外し可能な記憶ユニットから読み取り、かつ/又はそれに書込むように構成されてもよい。好適な取外し可能な記憶ユニットの例としては、非限定的に、フロッピーディスク、磁気テープ、光ディスク、フラッシュメモリデバイスなどが挙げられる。記憶デバイス732及び733はまた、コンピュータソフトウェア、データ、又は他のコンピュータ可読命令をコンピューティングシステム710にロードすることを可能にする、他の類似の構造又はデバイスを含んでもよい。例えば、記憶デバイス732及び733は、ソフトウェア、データ、又は他のコンピュータ可読情報を読み取り、かつ書込むように構成されてもよい。記憶デバイス732及び733はまた、コンピューティングシステム710の一部であってもよく、又は他のインターフェースシステムを通してアクセスされる別個のデバイスであってもよい。
他の多くのデバイス又はサブシステムが、コンピューティングシステム710に接続されてもよい。反対に、図7に図示される構成要素及びデバイスは、本明細書に記載及び/又は図示される実施形態を実践するために、必ずしも全てが存在しなくてもよい。上記で言及したデバイス及びサブシステムはまた、図7に示されるものとは異なる方法で相互接続されてもよい。コンピューティングシステム710はまた、任意の数のソフトウェア、ファームウェア、及び/又はハードウェアの構成を用いてもよい。例えば、本明細書に開示される例示的な実施形態のうち1つ以上は、コンピュータ可読媒体上で、コンピュータプログラム(コンピュータソフトウェア、ソフトウェアアプリケーション、コンピュータ可読命令、又はコンピュータ制御論理とも称される)としてコード化されてもよい。「コンピュータ可読媒体」という用語は、本明細書で使用するとき、一般に、コンピュータ可読命令を格納若しくは保有することができる、任意の形態のデバイス、キャリア、又は媒体を指す。コンピュータ可読媒体の例としては、非限定的に、搬送波などの伝送型媒体、並びに磁気記憶媒体(例えば、ハードディスクドライブ、テープドライブ、及びフロッピーディスク)、光学記憶媒体(例えば、コンパクトディスク(CD)、デジタルビデオディスク(DVD)、及びブルーレイ(BLU−RAY)ディスク)、電子記憶媒体(例えば、ソリッドステートドライブ及びフラッシュメディア)、並びに他の分散システムなどの持続性タイプの媒体が挙げられる。
コンピュータプログラムを含むコンピュータ可読媒体は、コンピューティングシステム710にロードされてもよい。次に、コンピュータ可読媒体に格納されたコンピュータプログラムの全て又は一部分は、システムメモリ716に、並びに/又は記憶デバイス732及び733の様々な部分に格納されてもよい。プロセッサ714によって実行されると、コンピューティングシステム710にロードされたコンピュータプログラムは、プロセッサ714に、本明細書に記載及び/又は図示される例示的な実施形態のうち1つ以上の機能を実施させてもよく、かつ/又はそれらを実施する手段であってもよい。それに加えて、又は別の方法として、本明細書に記載及び/又は図示される例示的な実施形態のうち1つ以上は、ファームウェア及び/又はハードウェアに実装されてもよい。例えば、コンピューティングシステム710は、本明細書に開示される例示的な実施形態のうち1つ以上を実装するように適合された、特定用途向け集積回路(ASIC)として構成されてもよい。
図8は、クライアントシステム810、820、及び830、並びにサーバ840及び845がネットワーク850に連結されていてもよい、例示的なネットワークアーキテクチャ800のブロック図である。詳細に上述したように、ネットワークアーキテクチャ800の全て又は一部分は、単独で又は他の要素と組み合わせて、(図3に図示されるステップのうち1つ以上などの)本明細書に開示されるステップのうち1つ以上を実施してもよく、かつ/又はそれを実施するための手段であってもよい。ネットワークアーキテクチャ800の全て又は一部分はまた、本開示に記載される他のステップ及び特徴を実施するために使用されてもよく、かつ/又はそれを実施するための手段であってもよい。
クライアントシステム810、820、及び830は、一般に、図7の例示的なコンピューティングシステム710などの、任意のタイプ若しくは形態のコンピューティングデバイス又はシステムを表す。同様に、サーバ840及び845は、一般に、様々なデータベースサービスを提供し、かつ/又は特定のソフトウェアアプリケーションを実行するように構成された、アプリケーションサーバ又はデータベースサーバなどの、コンピューティングデバイス又はシステムを表す。ネットワーク850は、一般に、例えばイントラネット、WAN、LAN、PAN、又はインターネットを含む、任意の電気通信又はコンピュータネットワークを表す。一実施例では、クライアントシステム810、820、及び/若しくは830、並びに/又はサーバ840及び/若しくは845は、図1からのシステム100の全て又は一部分を含んでもよい。
図8に図示されるように、1つ以上の記憶デバイス860(1)〜(N)はサーバ840に直接取り付けられてもよい。同様に、1つ以上の記憶デバイス870(1)〜(N)はサーバ845に直接取り付けられてもよい。記憶デバイス860(1)〜(N)及び記憶デバイス870(1)〜(N)は、一般に、データ及び/又は他のコンピュータ可読命令を格納することができる、任意のタイプ若しくは形態の記憶デバイス又は媒体を表す。特定の実施形態では、記憶デバイス860(1)〜(N)及び記憶デバイス870(1)〜(N)は、ネットワークファイルシステム(NFS)、サーバメッセージブロック(SMB)、又は共通インターネットファイルシステム(CIFS)などの様々なプロトコルを使用して、サーバ840及び845と通信するように構成されたネットワーク接続記憶(NAS)デバイスを表してもよい。
サーバ840及び845はまた、ストレージエリアネットワーク(SAN)ファブリック880に接続されてもよい。SANファブリック880は、一般に、複数の記憶デバイス間の通信を容易にすることができる、任意のタイプ若しくは形態のコンピュータネットワーク又はアーキテクチャを表す。SANファブリック880は、サーバ840及び845と、複数の記憶デバイス890(1)〜(N)及び/又はインテリジェント記憶アレイ895との間の通信を容易にしてもよい。SANファブリック880はまた、記憶デバイス890(1)〜(N)及びインテリジェント記憶アレイ895が、クライアントシステム810、820、及び830にローカルで取り付けられたデバイスとして現れるような形で、ネットワーク850並びにサーバ840及び845を介して、クライアントシステム810、820、及び830と、デバイス890(1)〜(N)及び/又はアレイ895との間の通信を容易にしてもよい。記憶デバイス860(1)〜(N)及び記憶デバイス870(1)〜(N)と同様に、記憶デバイス890(1)〜(N)及びインテリジェント記憶アレイ895は、一般に、データ及び/又は他のコンピュータ可読命令を格納することができる、任意のタイプ又は形態の記憶デバイス又は媒体を表す。
特定の実施形態では、図7の例示的なコンピューティングシステム710を参照して、図7の通信インターフェース722などの通信インターフェースは、各クライアントシステム810、820、及び830とネットワーク850との間を接続するように使用されてもよい。クライアントシステム810、820、及び830は、例えば、ウェブブラウザ又は他のクライアントソフトウェアを使用して、サーバ840又は845上の情報にアクセスすることが可能であってもよい。かかるソフトウェアによって、クライアントシステム810、820、及び830が、サーバ840、サーバ845、記憶デバイス860(1)〜(N)、記憶デバイス870(1)〜(N)、記憶デバイス890(1)〜(N)、又はインテリジェント記憶アレイ895によってホストされるデータにアクセスすることを可能にしてもよい。図8は、データを送受信するのに(インターネットなどの)ネットワークを使用することを示しているが、本明細書に記載及び/又は図示される実施形態は、インターネット、又は任意の特定のネットワークベースの環境に限定されない。
少なくとも1つの実施形態では、本明細書に開示される例示的な実施形態のうち1つ以上の全て又は一部分は、コンピュータプログラムとしてコード化され、サーバ840、サーバ845、記憶デバイス860(1)〜(N)、記憶デバイス870(1)〜(N)、記憶デバイス890(1)〜(N)、インテリジェント記憶アレイ895、又はこれらの任意の組み合わせ上にロードされ、これらによって実行されてもよい。本明細書に開示される例示的な実施形態のうち1つ以上の全て又は一部分は、また、コンピュータプログラムとしてコード化され、サーバ840に記憶され、サーバ845によって実行され、ネットワーク850上でクライアントシステム810、820、及び830に配信されてもよい。
詳細に上述したように、コンピューティングシステム710、及び/又はネットワークアーキテクチャ800の1つ以上の構成要素は、単独で又は他の要素と組み合わせて、データ配信チャネルを介して機密情報を送信する試みを検出するための、例示的な方法の1つ以上のステップを実施してもよく、並びに/あるいはそれを実施するための手段であってもよい。
前述の開示は、特定のブロック図、フローチャート、及び実施例を使用して様々な実施形態について記載しているが、本明細書に記載及び/又は図示される各ブロック図の構成要素、フローチャートのステップ、動作、及び/又は構成要素は、個別にかつ/又は集合的に、広範なハードウェア、ソフトウェア、又はファームウェア(若しくはそれらの任意の組み合わせ)の構成を使用して実装されてもよい。それに加えて、他の多くのアーキテクチャが同じ機能性を達成するように実装可能であるので、他の構成要素内に含まれる構成要素のいずれの開示も、本質的に例示と見なされるべきである。
いくつかの実施例では、図1の例示的なシステム100の全て又は一部分は、クラウドコンピューティング環境又はネットワークベースの環境の一部を表してもよい。クラウドコンピューティング環境は、インターネットを介して、様々なサービス及びアプリケーションを提供してもよい。これらのクラウドベースのサービス(例えば、サービスとしてのソフトウェア、サービスとしてのプラットフォーム、サービスとしての基盤など)は、ウェブブラウザ又は他のリモートインターフェースを通してアクセス可能であってもよい。本明細書に記載される様々な機能は、リモートデスクトップ環境又は他の任意のクラウドベースのコンピューティング環境を通して提供されてもよい。
様々な実施形態では、図1の例示的なシステム100の全て又は一部分は、クラウドベースのコンピューティング環境内でのマルチテナンシーを容易にすることができる。換言すれば、本明細書に記載されるソフトウェアモジュールは、本明細書に記載される機能の1つ以上に対するマルチテナンシーを容易にするように、コンピューティングシステム(例えば、サーバ)を構成してもよい。例えば、本明細書に記載されるソフトウェアモジュールの1つ以上は、2つ以上のクライアント(例えば、顧客)がサーバ上で作動しているアプリケーションを共有できるように、サーバをプログラムしてもよい。このようにプログラムされたサーバは、複数の顧客(即ち、テナント)の間で、アプリケーション、オペレーティングシステム、処理システム、及び/又は記憶システムを共有してもよい。本明細書に記載されるモジュールのうち1つ以上はまた、ある顧客が別の顧客のデータ及び/又は構成情報にアクセスすることができないように、顧客ごとにマルチテナントアプリケーションのデータ及び/又は構成情報を分割してもよい。
様々な実施形態によれば、図1の例示的なシステム100の全て又は一部分は、仮想環境内で実装されてもよい。例えば、本明細書に記載されるモジュール及び/又はデータは、仮想機械内で常駐及び/又は実行してもよい。本明細書で使用するとき、「仮想機械」という用語は、一般に、仮想機械マネージャ(例えば、ハイパーバイザ)によってコンピューティングハードウェアから抽出される、任意のオペレーティングシステム環境を指す。それに加えて、又は別の方法として、本明細書に記載されるモジュール及び/又はデータは、仮想化層内で常駐及び/又は実行してもよい。本明細書で使用するとき、「仮想化層」という用語は、一般に、オペレーティングシステム環境にオーバーレイする、並びに/あるいはそこから抽出される、任意のデータ層及び/又はアプリケーション層を指す。仮想化層は、基礎となる基本オペレーティングシステムの一部であるかのように仮想化層を提示する、ソフトウェア仮想化ソリューション(例えば、ファイルシステムフィルタ)によって管理されてもよい。例えば、ソフトウェア仮想化ソリューションは、最初に基本ファイルシステム及び/又はレジストリ内の場所に方向付けられる呼出しを、仮想化層内の場所にリダイレクトしてもよい。
いくつかの実施例では、図1の例示的なシステム100の全て又は一部分は、モバイルコンピューティング環境の一部を表してもよい。モバイルコンピューティング環境は、携帯電話、タブレットコンピュータ、電子ブックリーダー、携帯情報端末、ウェアラブルコンピューティングデバイス(例えば、ヘッドマウントディスプレイを備えたコンピューティングデバイス、スマートウォッチなど)などを含む、広範なモバイルコンピューティングデバイスによって実装されてもよい。いくつかの実施例では、モバイルコンピューティング環境は、例えば、バッテリ電力への依存、任意の所与の時間における1つのみのフォアグラウンドアプリケーションの提示、リモート管理特性、タッチスクリーン特性、位置及び移動データ(例えば、全世界測位システム、ジャイロスコープ、加速度計などによって提供される)、システムレベルの構成に対する修正を制限する、及び/又は第三者のソフトウェアが他のアプリケーションの挙動を検査する能力を限定する、アプリケーションのインストールを制限するように(例えば、認可されたアプリケーションストアからのみ生じるように)制御するなどの制限されたプラットフォームを含む、1つ以上の個別の特性を有してもよい。本明細書に記載される様々な機能は、モバイルコンピューティング環境に提供されてもよく、かつ/又は他のモバイルコンピューティング環境と相互作用してもよい。
加えて、図1の例示的なシステム100の全て又は一部分は、情報管理のための1つ以上のシステムの部分を表してもよく、それと相互作用してもよく、それによって作成されるデータを消費してもよく、並びに/あるいはそれによって消費されるデータを作成してもよい。本明細書で使用するとき、「情報管理」という用語は、データの保護、組織化、及び/又は格納を指してもよい。情報管理のためのシステムの例としては、非限定的に、記憶システム、バックアップシステム、アーカイブシステム、複製システム、高可用性システム、データ検索システム、仮想化システムなどを挙げることができる。
いくつかの実施形態では、図1の例示的なシステム100の全て又は一部分は、情報セキュリティのための1つ以上のシステムの部分を表してもよく、それによって保護されるデータを作成してもよく、かつ/又はそれと通信してもよい。本明細書で使用するとき、「情報セキュリティ」という用語は、保護されたデータへのアクセスの制御を指してもよい。情報セキュリティのためのシステムの例としては、非限定的に、管理されたセキュリティサービスを提供するシステム、データ漏えい防止システム、本人認証システム、アクセス制御システム、暗号化システム、ポリシー遵守システム、侵入検出及び防止システム、電子証拠開示システムなどが挙げられ得る。
いくつかの実施例によれば、図1の例示的なシステム100の全て又は一部分は、エンドポイントセキュリティのための1つ以上のシステムの部分を表してもよく、それと通信してもよく、かつ/又はそれから保護を受けてもよい。本明細書で使用するとき、「エンドポイントセキュリティ」という用語は、権限がない及び/又は違法な使用、アクセス、並びに/あるいは制御からの、エンドポイントシステムの保護を指してもよい。エンドポイント保護のためのシステムの例としては、非限定的に、アンチマルウェアシステム、ユーザ認証システム、暗号化システム、プライバシーシステム、スパムフィルタリングサービスなどを挙げることができる。
本明細書に記載及び/又は図示されるプロセスパラメータ及び一連のステップは、単なる例として与えられるものであり、所望に応じて変更することができる。例えば、本明細書に図示及び/又は記載されるステップは特定の順序で示されるか又は考察されることがあるが、これらのステップは必ずしも図示又は考察される順序で実施されなくてもよい。本明細書に記載及び/又は図示される様々な例示的方法は、また、本明細書に記載若しくは図示されるステップの1つ以上を省略するか、又は開示されるものに加えて追加のステップを含んでもよい。
様々な実施形態を、完全に機能しているコンピューティングシステムのコンテキストで明細書に記載及び/又は図示してきたが、これらの例示的な実施形態の1つ以上は、実際に配信を実施するのに使用されるコンピュータ可読媒体の特定のタイプにかかわらず、様々な形態のプログラム製品として配信されてもよい。本明細書で開示される実施形態はまた、特定のタスクを実行するソフトウェアモジュールを使用して実装されてもよい。これらのソフトウェアモジュールは、コンピュータ可読記憶媒体に、又はコンピューティングシステムに格納することができる、スクリプト、バッチ、又は他の実行可能ファイルを含んでもよい。いくつかの実施形態では、これらのソフトウェアモジュールは、本明細書で開示される例示的な実施形態のうち1つ以上を実行するように、コンピューティングシステムを構成してもよい。
それに加えて、本明細書に記載されるモジュールのうち1つ以上は、データ、物理的デバイス、及び/又は物理的デバイスの表現を、1つの形態から別の形態へと変換してもよい。例えば、本明細書に列挙されるモジュールの1つ以上は、変換されるファイルを受信し、ファイルデータを変換し、変換の結果を画像マッチング技術に出力し、変換の結果を使用して、2つの画像が同じ文書を表しているか否かを判断し、変換の結果をデータベースに格納してもよい。それに加えて、又は別の方法として、本明細書に列挙されるモジュールの1つ以上は、コンピューティングデバイス上で実行すること、コンピューティングデバイスにデータを格納すること、及び/又は別の方法でコンピューティングデバイスと相互作用することによって、プロセッサ、揮発性メモリ、不揮発性メモリ、及び/又は物理コンピューティングデバイスの他の任意の一部を、ある形態から別の形態へと変換してもよい。
前述の記載は、本明細書に開示される例示的な実施形態の様々な態様を、他の当業者が最良に利用することができるように提供してきた。この例示的な記載は、網羅的であることを意図するものではなく、又は開示される任意の正確な形態に限定することを意図するものではない。本開示の趣旨及び範囲から逸脱することなく、多くの修正例及び変形例が可能である。本明細書で開示される実施形態は、あらゆる点で例示的であり、限定的ではないものと見なされるべきである。本開示の範囲を決定する際に、添付の特許請求の範囲及びそれらの等価物を参照するべきである。
別途記載のない限り、「〜に接続される」及び「〜に連結される」という用語(並びにそれらの派生語)は、本明細書及び特許請求の範囲で使用するとき、直接的接続及び間接的接続(すなわち、他の要素又は構成要素を介する)の両方を許容するものとして解釈されるべきである。それに加えて、「1つの(a)」又は「1つの(an)」という用語は、本明細書及び特許請求の範囲で使用するとき、「〜のうち少なくとも1つ」を意味するものとして解釈されるべきである。最後に、簡潔にするため、「含む」及び「有する」という用語(並びにそれらの派生語)は、本明細書及び特許請求の範囲で使用するとき、「備える」という単語と互換性があり、同じ意味を有する。

Claims (15)

  1. データ配信チャネルを介して機密情報を送信する試みを検出するためのコンピュータ実装方法であって、前記方法の少なくとも一部分が、少なくとも1つのプロセッサを備えるコンピューティングデバイスによって実施され、前記方法が、
    データ配信チャネルを通してファイルを送信する試みを識別することと、
    画像マッチング技術を使用して、前記ファイルと、画像形式で格納されると共にデータ漏えい防止ポリシーによって保護された少なくとも1つの既知の機密ファイルとを比較することと、
    前記画像マッチング技術の結果に基づいて、前記ファイルが、個人識別情報を含むことによって前記データ漏えい防止ポリシーに違反していると判断することと、
    前記ファイルが前記データ漏えい防止ポリシーに違反しているとの判断に応答して、セキュリティ対策を実施することと、
    を含む、コンピュータ実装方法。
  2. 前記セキュリティ対策が、
    前記データ配信チャネルを通して前記ファイルを送信する前記試みをブロックすることと、
    前記データ配信チャネルを通して前記ファイルを送信する前記試みを管理者に警告することと、
    前記データ配信チャネルを通して前記ファイルを送信する前記試みが前記データ漏えい防止ポリシーに違反していることをユーザに通知することと、
    前記データ配信チャネルを通して前記ファイルを送信する前記試みの記録を取ることと、
    のうち少なくとも1つを含む、請求項1に記載のコンピュータ実装方法。
  3. 前記画像マッチング技術を使用して、前記ファイルと前記既知の機密ファイルとを比較することが、前記ファイルを前記画像形式に変換することを含む、請求項1に記載のコンピュータ実装方法。
  4. 前記既知の機密ファイルがテキストベースのフォームを含み、前記画像マッチング技術の結果に基づいて、前記ファイルが前記データ漏えい防止ポリシーに違反していると判断することが、前記ファイルが前記テキストベースのフォームの編集バージョンを含むと判断することを含む、請求項1に記載のコンピュータ実装方法。
  5. 前記画像マッチング技術を使用して、前記ファイルと前記既知の機密ファイルとを比較することが、前記既知の機密ファイルと前記ファイルとの間で異なる要素のセットを表す差分画像を作成することを含む、請求項1に記載のコンピュータ実装方法。
  6. 前記画像マッチング技術を使用して、前記ファイルと前記既知の機密ファイルとを比較することが、前記既知の機密ファイル内の主要点のセットと同種である前記ファイル内の主要点のセットを識別することを含む、請求項1に記載の方法。
  7. 前記画像マッチング技術を使用して、前記ファイルと前記既知の機密ファイルとを比較することが、
    前記ファイルの単一の視覚要素を前記既知の機密ファイルの単一の視覚要素と比較することと、
    前記ファイルの主要特徴間の距離比のセットを前記既知の機密ファイルの主要特徴間の距離比のセットと比較することと、
    距離メトリックを使用して、前記ファイルに属する特徴ベクトルのセットを前記既知の機密ファイルに属する特徴ベクトルのセットと比較することと、
    のうち少なくとも1つを含む、請求項1に記載の方法。
  8. 前記画像マッチング技術を使用して、前記ファイルと、前記画像形式で格納されると共に前記データ漏えい防止ポリシーによって保護された前記既知の機密ファイルとを比較することが、
    画像形式で格納されると共に前記データ漏えい防止ポリシーによって保護された既知の機密ファイルのギャラリーを識別することと、
    粗い画像マッチング技術を使用して、前記ファイルと前記ギャラリー内の複数の既知の機密ファイルとを比較することと、
    前記粗い画像マッチング技術よりも多くのコンピューティング資源を消費する、より精細な画像マッチング技術を使用して、前記ファイルと、前記粗い画像マッチング技術によって廃棄されなかった前記ギャラリー内の複数の既知の機密ファイルとを比較することと、
    前記より精細な画像マッチング技術よりも多くのコンピューティング資源を消費する最終画像マッチング技術を使用して、前記ファイルと、前記より精細な画像マッチング技術によって廃棄されなかった前記ギャラリー内の複数の既知の機密ファイルとを比較することと、
    を含む、請求項1に記載のコンピュータ実装方法。
  9. 前記データ配信チャネルが取外し可能な記憶媒体を含む、請求項1に記載のコンピュータ実装方法。
  10. 前記コンピューティングデバイスに格納されている追加ファイルを識別することと、
    前記画像マッチング技術を使用して、前記追加ファイルと、前記画像形式で格納されると共に前記データ漏えい防止ポリシーによって保護された少なくとも1つの追加の既知の機密ファイルとを比較することと、
    前記画像マッチング技術に基づいて、前記追加ファイルが前記データ漏えい防止ポリシーに違反していると判断することと、
    前記追加ファイルが前記データ漏えい防止ポリシーに違反しているとの判断に応答して、追加のセキュリティ対策を実施することと、
    を更に含む、請求項1に記載のコンピュータ実装方法。
  11. データ配信チャネルを介して機密情報を送信する試みを検出するためのシステムであって、前記システムが、
    データ配信チャネルを通してファイルを送信する試みを識別する、メモリに格納された、識別モジュールと、
    画像マッチング技術を使用して、前記ファイルと、画像形式で格納されると共にデータ漏えい防止ポリシーによって保護された少なくとも1つの既知の機密ファイルとを比較する、メモリに格納された、比較モジュールと、
    前記画像マッチング技術の結果に基づいて、前記ファイルが、個人識別情報を含むことによって前記データ漏えい防止ポリシーに違反していると判断する、メモリに格納された、判断モジュールと、
    前記ファイルが前記データ漏えい防止ポリシーに違反しているとの判断に応答してセキュリティ対策を実施する、メモリに格納された、セキュリティモジュールと、
    前記識別モジュール、前記比較モジュール、前記判断モジュール、及び前記セキュリティモジュールを実行するように構成された、少なくとも1つの物理的プロセッサと、
    を備える、システム。
  12. 前記既知の機密ファイルがテキストベースのフォームを含み、前記判断モジュールが、前記画像マッチング技術の結果に基づいて、前記ファイルが前記テキストベースのフォームの編集バージョンを含むと判断することによって、前記ファイルが前記データ漏えい防止ポリシーに違反していると判断する、請求項11に記載のシステム。
  13. 前記比較モジュールが、前記画像マッチング技術を使用して、前記既知の機密ファイルと前記ファイルとの間で異なる要素のセットを表す差分画像を作成することによって、前記ファイルと前記既知の機密ファイルとを比較する、請求項11に記載のシステム。
  14. 前記比較モジュールが、前記画像マッチング技術を使用して、
    画像形式で格納されると共に前記データ漏えい防止ポリシーによって保護された既知の機密ファイルのギャラリーを識別することと、
    粗い画像マッチング技術を使用して、前記ファイルと前記ギャラリー内の複数の既知の機密ファイルとを比較することと、
    前記粗い画像マッチング技術よりも多くのコンピューティング資源を消費する、より精細な画像マッチング技術を使用して、前記ファイルと、前記粗い画像マッチング技術によって廃棄されなかった前記ギャラリー内の複数の既知の機密ファイルとを比較することと、
    前記より精細な画像マッチング技術よりも多くのコンピューティング資源を消費する最終画像マッチング技術を使用して、前記ファイルと、前記より精細な画像マッチング技術によって廃棄されなかった前記ギャラリー内の複数の既知の機密ファイルとを比較することと、
    によって、前記ファイルと、前記画像形式で格納されると共に前記データ漏えい防止ポリシーによって保護された前記既知の機密ファイルとを比較する、請求項11に記載のシステム。
  15. 1つ以上のコンピュータ可読命令を含む非一時的コンピュータ可読媒体であって、コンピューティングデバイスの少なくとも1つのプロセッサによって実行されると、前記コンピューティングデバイスに、
    データ配信チャネルを通してファイルを送信する試みを識別させ、
    画像マッチング技術を使用して、前記ファイルと、画像形式で格納されると共にデータ漏えい防止ポリシーによって保護された少なくとも1つの既知の機密ファイルとを比較させ、
    前記画像マッチング技術の結果に基づいて、前記ファイルが、個人識別情報を含むことによって前記データ漏えい防止ポリシーに違反していると判断させ、
    前記ファイルが前記データ漏えい防止ポリシーに違反しているとの判断に応答して、セキュリティ対策を実施させる、
    非一時的コンピュータ可読媒体。
JP2017511681A 2014-09-10 2015-07-31 データ配信チャネルを介して機密情報を送信する試みを検出するためのシステム及び方法 Active JP6342577B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/483,131 2014-09-10
US14/483,131 US9436821B2 (en) 2014-09-10 2014-09-10 Systems and methods for detecting attempts to transmit sensitive information via data-distribution channels
PCT/US2015/043056 WO2016039885A1 (en) 2014-09-10 2015-07-31 Systems and methods for detecting attempts to transmit sensitive information via data-distribution channels

Publications (2)

Publication Number Publication Date
JP2017531249A JP2017531249A (ja) 2017-10-19
JP6342577B2 true JP6342577B2 (ja) 2018-06-13

Family

ID=53879785

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017511681A Active JP6342577B2 (ja) 2014-09-10 2015-07-31 データ配信チャネルを介して機密情報を送信する試みを検出するためのシステム及び方法

Country Status (5)

Country Link
US (1) US9436821B2 (ja)
EP (1) EP3192001B1 (ja)
JP (1) JP6342577B2 (ja)
CN (1) CN107077570A (ja)
WO (1) WO2016039885A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105404828A (zh) * 2014-09-12 2016-03-16 国际商业机器公司 用于数据安全的方法和系统
US9697349B2 (en) 2014-10-26 2017-07-04 Microsoft Technology Licensing, Llc Access blocking for data loss prevention in collaborative environments
US9674201B1 (en) 2015-12-29 2017-06-06 Imperva, Inc. Unobtrusive protection for large-scale data breaches utilizing user-specific data object access budgets
US9674202B1 (en) * 2015-12-29 2017-06-06 Imperva, Inc. Techniques for preventing large-scale data breaches utilizing differentiated protection layers
US20190089595A1 (en) * 2017-09-18 2019-03-21 Cyber 2.0 (2015) LTD Automatic security configuration
US11323458B1 (en) 2016-08-22 2022-05-03 Paubox, Inc. Method for securely communicating email content between a sender and a recipient
US10805311B2 (en) * 2016-08-22 2020-10-13 Paubox Inc. Method for securely communicating email content between a sender and a recipient
GB2554657B (en) 2016-09-30 2019-09-11 F Secure Corp Protection from malicious and/or harmful content in cloud-based service scenarios
US10783262B2 (en) * 2017-02-03 2020-09-22 Adobe Inc. Tagging documents with security policies
US10552633B2 (en) 2017-03-23 2020-02-04 International Business Machines Corporation Privacy annotation from differential analysis of snapshots
EP3602377A1 (en) * 2017-03-30 2020-02-05 McAfee, LLC Secure software defined storage
US10817617B1 (en) * 2018-06-28 2020-10-27 Ca, Inc. Data loss prevention for biometric data
US10754998B2 (en) * 2018-10-17 2020-08-25 Bank Of America Corporation Data loss prevention using machine learning
CN109829327A (zh) * 2018-12-15 2019-05-31 中国平安人寿保险股份有限公司 敏感信息处理方法、装置、电子设备及存储介质
US11093628B2 (en) 2019-02-14 2021-08-17 International Business Machines Corporation Cross-domain content-lifecycle management
US10970532B1 (en) * 2019-06-06 2021-04-06 Ca, Inc. Systems and methods for preventing sharing of sensitive content in image data on a closed computing platform
EP3767914A1 (en) * 2019-07-17 2021-01-20 AO Kaspersky Lab System and method of detecting anomalies in a technological system
US20220309184A1 (en) * 2021-03-26 2022-09-29 Rubrik, Inc. File content analysis and data management
CN113868698A (zh) * 2021-08-26 2021-12-31 上海上讯信息技术股份有限公司 一种文件脱敏方法及设备
CN118153114B (zh) * 2024-05-11 2024-07-02 甲亥智能(成都)科技有限公司 一种非结构化数据安全保护系统

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7412489B2 (en) * 2003-08-21 2008-08-12 Ameriprise Financial, Inc. Method and system for electronic archival and retrieval of electronic communications
JP4093482B2 (ja) * 2003-12-24 2008-06-04 インターナショナル・ビジネス・マシーンズ・コーポレーション アクセス制御システム、アクセス制御装置、アクセス制御方法、プログラム、及び記録媒体
JP4557875B2 (ja) * 2005-11-30 2010-10-06 キヤノン株式会社 画像処理方法及び装置
JP2008042636A (ja) * 2006-08-08 2008-02-21 Fuji Xerox Co Ltd 文書処理装置および文書処理システム、文書処理プログラム
US8199965B1 (en) 2007-08-17 2012-06-12 Mcafee, Inc. System, method, and computer program product for preventing image-related data loss
US8271642B1 (en) * 2007-08-29 2012-09-18 Mcafee, Inc. System, method, and computer program product for isolating a device associated with at least potential data leakage activity, based on user input
US8060596B1 (en) * 2007-12-26 2011-11-15 Symantec Corporation Methods and systems for normalizing data loss prevention categorization information
US8826443B1 (en) * 2008-09-18 2014-09-02 Symantec Corporation Selective removal of protected content from web requests sent to an interactive website
JP4763812B2 (ja) * 2009-02-24 2011-08-31 インターナショナル・ビジネス・マシーンズ・コーポレーション 文書の機密度判定を支援する方法、装置及びコンピュータプログラム
CN101510257B (zh) * 2009-03-31 2011-08-10 华为技术有限公司 一种人脸相似度匹配方法及装置
CN101537251B (zh) * 2009-04-17 2011-06-15 刘铮 基于图像匹配技术的台球复位方法
JP2012182737A (ja) * 2011-03-02 2012-09-20 Nec Corp 秘密資料流出防止システム、判定装置、秘密資料流出防止方法およびプログラム
CN102231188A (zh) * 2011-07-05 2011-11-02 上海合合信息科技发展有限公司 结合文字识别和图像匹配的名片识别方法
US20150113664A1 (en) * 2011-12-27 2015-04-23 Nokia Corporation Preventing Unintentionally Violating Privacy When Sharing and/or Publishing Content
US9197655B2 (en) * 2013-07-16 2015-11-24 Bank Of America Corporation Steganography detection
CN103824030A (zh) * 2014-02-27 2014-05-28 宇龙计算机通信科技(深圳)有限公司 数据保护装置和数据保护方法

Also Published As

Publication number Publication date
EP3192001A1 (en) 2017-07-19
EP3192001B1 (en) 2021-01-13
WO2016039885A1 (en) 2016-03-17
JP2017531249A (ja) 2017-10-19
CN107077570A (zh) 2017-08-18
US20160070905A1 (en) 2016-03-10
US9436821B2 (en) 2016-09-06

Similar Documents

Publication Publication Date Title
JP6342577B2 (ja) データ配信チャネルを介して機密情報を送信する試みを検出するためのシステム及び方法
US10438000B1 (en) Using recognized backup images for recovery after a ransomware attack
US9245123B1 (en) Systems and methods for identifying malicious files
US10032033B2 (en) Systems and methods for protecting backed-up data from ransomware attacks
US10079835B1 (en) Systems and methods for data loss prevention of unidentifiable and unsupported object types
US10073864B1 (en) Systems and methods for automated aggregation of information-source metadata
US10339304B2 (en) Systems and methods for generating tripwire files
US10410158B1 (en) Systems and methods for evaluating cybersecurity risk
US10803188B1 (en) Systems and methods for preventing sensitive data sharing
CN108701188A (zh) 响应于检测潜在勒索软件以用于修改文件备份的系统和方法
US9805204B1 (en) Systems and methods for determining that files found on client devices comprise sensitive information
JP2020504402A (ja) オブジェクト固有の画像ドメインにおけるデータ損失防止のための構造化テキスト及びパターン照合
US10735468B1 (en) Systems and methods for evaluating security services
US10425435B1 (en) Systems and methods for detecting anomalous behavior in shared data repositories
US10970532B1 (en) Systems and methods for preventing sharing of sensitive content in image data on a closed computing platform
US9749299B1 (en) Systems and methods for image-based encryption of cloud data
US9027078B1 (en) Systems and methods for enforcing data loss prevention policies on sandboxed applications
US10546123B1 (en) Systems and methods for identifying malicious computer files
US11023580B1 (en) Systems and methods for cross-product malware categorization
US9342550B1 (en) Systems and methods for preventing data loss via temporary-file generating applications
US10498767B1 (en) Systems and methods for enforcing data loss prevention (DLP) policies during web conferences
US9160757B1 (en) Systems and methods for detecting suspicious attempts to access data based on organizational relationships
US11144656B1 (en) Systems and methods for protection of storage systems using decoy data
US9647846B1 (en) Systems and methods for verifying the authenticity of graphical images
US9667575B1 (en) Systems and methods for detecting webpages belonging to spam campaigns

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180424

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180516

R150 Certificate of patent or registration of utility model

Ref document number: 6342577

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250