JP6576563B2 - データオブジェクトを効率よく分類するシステム及び方法 - Google Patents

データオブジェクトを効率よく分類するシステム及び方法 Download PDF

Info

Publication number
JP6576563B2
JP6576563B2 JP2018531599A JP2018531599A JP6576563B2 JP 6576563 B2 JP6576563 B2 JP 6576563B2 JP 2018531599 A JP2018531599 A JP 2018531599A JP 2018531599 A JP2018531599 A JP 2018531599A JP 6576563 B2 JP6576563 B2 JP 6576563B2
Authority
JP
Japan
Prior art keywords
rule
evaluation
classification
rule evaluation
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018531599A
Other languages
English (en)
Other versions
JP2019502998A (ja
Inventor
トーマス・ヒュー
Original Assignee
ベリタス テクノロジーズ エルエルシー
ベリタス テクノロジーズ エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ベリタス テクノロジーズ エルエルシー, ベリタス テクノロジーズ エルエルシー filed Critical ベリタス テクノロジーズ エルエルシー
Publication of JP2019502998A publication Critical patent/JP2019502998A/ja
Application granted granted Critical
Publication of JP6576563B2 publication Critical patent/JP6576563B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/046Forward inferencing; Production systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

アーカイブシステム及びデータ損失防止(DLP)システムなどのデータ管理システムは、多くの場合異なるデータカテゴリを異なる手法で処理する。例えば、異なるデータ保持ポリシー又はデータセキュリティポリシーが、社内向け電子メールメッセージと顧客に送信される電子メールメッセージ、又はマーケティングデータファイルと財務若しくはエンジニアリングデータファイルに対して適用され得る。したがって、データ管理システムは、多くの場合、個々のデータオブジェクトの処理方法を決定する前に各データオブジェクトをカテゴリに割り当てる。
残念ながら、データ管理システムによって処理されるデータオブジェクトの数は非常に多い場合があり、多くの場合、ピーク負荷期間となる。結果的に、データオブジェクトを分類する処理は、多くの場合データ管理システムにおいてボトルネックであることが判明している。したがって、本開示は、データオブジェクトを効率よく分類するための、追加の改良されたシステム及び方法の必要性を識別し、それに対処する。
以下で更に詳細に説明されるように、本開示は、分類ルールのセットに従ってデータオブジェクトを効率よく分類するための、様々なシステム及び方法を記載する。本明細書に記載のシステム及び方法は、データオブジェクトを分類するためのルール評価ジョブを作成し、次にルール評価ジョブの推定処理時間に従ってルール評価ジョブをキューイングすることで、分類ルールのセットに従ってデータオブジェクトを分類するために要する時間を短縮することができる。本明細書に記載のシステム及び方法はまた、履歴データに基づいて分類ルールを処理するために要する処理時間を推定することもでき、データオブジェクトのカテゴリ化の効率を改善するための、例えばマルチコアプロセッサを利用する、データオブジェクトの一部だけにルール処理を限定する、及び/又はルールロジックを分析してルール処理時間を最も最小化する可能性が高い作業順序を明確にする、などの他の技術を使用することができる。
一例では、データオブジェクトを効率よく分類するためのコンピュータ実装方法は、(1)データオブジェクトを分類するためのルールのグループに従って分類されるデータオブジェクトを受信することであって、各分類ルールは1つ以上の項目を含む、ことと、(2)分類ルール中の各分類ルールに対して、分類ルール内の項目に従ってデータオブジェクトを評価するようにルール評価プロセッサに指示するルール評価ジョブを作成することであって、ルール評価プロセッサは推定処理時間の短い順に分類ルール内部の項目を評価する、ことと、(3)分類ルールに対して作成されたルール評価ジョブを、ルール評価プロセッサで処理するために1つ以上のルール評価キューに投入することであって、ルール評価ジョブは推定処理時間の長い順に投入される、ことと、(4)ルール評価プロセッサから、各ルール評価ジョブに関する評価結果を受信することと、(5)ルール評価ジョブに関する評価結果を受信することに応じて、評価結果に従ってデータオブジェクトを分類することと、を含み得る。
一実施形態では、コンピュータ実装方法は、独立して実行するルール評価プロセッサのグループを更に含んでもよく、各ルール評価プロセッサは、1つ以上のルール評価キューからのルール評価ジョブを処理する。一実施形態では、独立して実行するルール評価プロセッサは、マルチコアプロセッサのコアを含み得る。一例では、ルール評価ジョブは、ルール評価プロセッサに、論理的に結合された項目のセットを含む分類ルールに従ってデータオブジェクトを評価するように指示してもよく、各項目は、1つ以上のデータオブジェクト属性を評価し、ルール評価ジョブは、論理的に結合された項目のうちの1つ以上の評価が否定的結果を生じたときにルール評価プロセッサに分類ルールの評価を終了するように指示する。
一実施形態では、分類ルールのうちの1つ以上の項目は、ルール評価プロセッサによって評価されるデータオブジェクトの一部を指定してもよい。加えて、コンピュータ実装方法は、ルール評価プロセッサが1つ以上の分類ルールの1つ以上の項目を評価するのにかかる時間を測定することと、測定された時間に基づいて項目に関する処理時間を推定することと、を更に含んでもよい。一実施形態では、コンピュータ実装方法は、ルール評価プロセッサが1つ以上の分類ルールを評価するのにかかる時間を測定することと、測定された時間に基づいて分類ルールに関する処理時間を推定することと、を更に含んでもよい。
一実施形態では、上述の方法を実装するためのシステムは、例えば(1)データオブジェクトを分類するためのルールのグループに従って分類されるデータオブジェクトを受信する通信モジュールであって、各分類ルールは1つ以上の項目を含み得る、通信モジュール、(2)分類ルール中の各分類ルールに対して、分類ルール内の項目に従ってデータオブジェクトを評価するようにルール評価プロセッサに指示するルール評価ジョブを作成するタスクモジュールであって、ルール評価プロセッサは推定処理時間の短い順に分類ルール内部の項目を評価する、タスクモジュール、(3)分類ルールに対して作成されたルール評価ジョブを、ルール評価プロセッサで処理するために1つ以上のルール評価キューに投入するキューイングモジュールであって、ルール評価ジョブは推定処理時間の長い順に投入される、キューイングモジュール、(4)ルール評価プロセッサから、各ルール評価ジョブに関する評価結果を受信する結果モジュール、及び/又は(5)ルール評価ジョブに関する評価結果の受信に応じて、評価結果に従ってデータオブジェクトを分類する分類モジュール、などのメモリに記憶されたいくつかのモジュールを含んでもよい。システムはまた、通信モジュール、タスクモジュール、キューイングモジュール、結果モジュール、及び分類モジュールを実行するように構成されている少なくとも1つの物理プロセッサも含んでもよい。
いくつかの例では、上記の方法は、非一過性コンピュータ可読媒体上にコンピュータ可読命令としてコード化されてもよい。例えば、コンピュータ可読媒体は、コンピューティングデバイスの少なくとも1つのプロセッサによって実行されると、コンピューティングデバイスに、(1)データオブジェクトを分類するためのルールのグループに従って分類されるデータオブジェクトを受信することであって、各分類ルールは1つ以上の項目を含む、ことと、(2)分類ルール中の各分類ルールに対して、分類ルール内の項目に従ってデータオブジェクトを評価するようにルール評価プロセッサに指示するルール評価ジョブを作成することであって、ルール評価プロセッサは推定処理時間の短い順に分類ルール内部の項目を評価する、ことと、(3)分類ルールに対して作成されたルール評価ジョブを、ルール評価プロセッサで処理するために1つ以上のルール評価キューに投入することであって、ルール評価ジョブは推定処理時間の長い順に投入される、ことと、(4)ルール評価プロセッサから、各ルール評価ジョブに関する評価結果を受信することと、(5)ルール評価ジョブに関する評価結果を受信することに応じて、評価結果に従ってデータオブジェクトを分類することと、を実行させ得る1つ以上のコンピュータ実行可能命令を含んでもよい。
上記で述べた実施形態のうちのいずれかからの機能は、本明細書で説明する一般原理に従って互いと組み合わせて使用されてもよい。これらの及び他の実施形態、特性、及び利点は、添付の図面及び請求項と併せて、以下の詳細な説明を一読することで、より完全に理解されよう。
添付の図面は、いくつかの例示的な実施形態を例解し、かつ本明細書の一部である。以下の説明と共に、これらの図面は、本開示の種々の原理を実証及び説明する。
データオブジェクトを効率よく分類するための例示的なシステムのブロック図である。 データオブジェクトを効率よく分類するための追加の例示的なシステムのブロック図である。 データオブジェクトを効率よく分類するための例示的な方法のフローチャートである。 データオブジェクトを効率よく分類するための追加の例示的なシステムのブロック図である。 本明細書で説明及び/又は図示される実施形態のうちの1つ以上を実装することができる例示的コンピューティングシステムのブロック図である。 本明細書で説明及び/又は図示される実施形態のうちの1つ以上を実装することができる例示的なコンピューティングネットワークのブロック図である。
図面を通じて、同一の参照文字及び説明は、類似であるが、必ずしも同一ではない要素を示す。本明細書において説明される例示的な実施形態は、種々の修正及び代替的な形態が可能であるが、具体的な実施形態が、図面において、例として示されており、かつ本明細書において詳細に説明される。しかしながら、本明細書において説明される例示的な実施形態は、開示される特定の形態に限定されることを意図されない。むしろ、本開示は、添付の請求項の範囲内にある全ての修正物、同等物、及び代替物を網羅する。
本開示は、概して、データオブジェクトを効率よく分類するためのシステム及び方法を対象とする。以下でより詳細に説明されるように、本明細書に記載のシステム及び方法は、分類ルールのセットに従ってデータオブジェクトを分類する際に多数の処理最適化技術を適用することによって、データオブジェクトを効率よく分類することができる。処理最適化技術の一部はマルチコアプロセッサ上の複数の処理ユニットを利用して分類ルールを平行して評価することと、過去の処理時間データに基づいて、分類ルール及び分類ルール内の項目の評価をキューイングして、各データオブジェクトの分類が最小限の処理時間で決定され得る可能性を高めることと、を含んでもよい。
下記において、図1、2、及び4を参照して、データオブジェクトを効率よく分類するための例示的なシステムの詳細な説明を提供する。対応するコンピュータ実装方法についての詳細な説明もまた、図3に関連して提供される。それに加えて、本明細書で説明する実施形態のうちの1つ以上を実装できる例示的なコンピューティングシステム及びネットワークアーキテクチャについての詳細な説明が、図5及び図6と関連してそれぞれ提供される。
図1は、データオブジェクトを効率よく分類するための例示的なシステム100のブロック図である。この図に示すように、例示的なシステム100は、1つ以上のタスクを実施するための1つ以上のモジュール102を含んでもよい。例えば、そして以下でより詳細に説明されるように、例示的なシステム100は、データオブジェクトを分類するための複数のルールに従って分類されるデータオブジェクトを受信し、各分類ルールが少なくとも1つの項目を含み得る、通信モジュール104を含んでもよい。例示的なシステム100は、複数の分類ルール中の各分類ルールに対して、分類ルール内の項目に従ってデータオブジェクトを評価するようにルール評価プロセッサに指示するルール評価ジョブを作成し、ルール評価プロセッサが推定処理時間の短い順に分類ルール内部の項目を評価する、タスクモジュール106を追加的に含んでもよい。例示的なシステム100はまた、複数の分類ルールに対して作成されたルール評価ジョブを、ルール評価プロセッサで処理するために1つ以上のルール評価キューに投入し、ルール評価ジョブが推定処理時間の長い順に投入される、キューイングモジュール108も含んでもよい。例示的なシステム100は、ルール評価プロセッサから、各ルール評価ジョブに関する評価結果を受信する、結果モジュール110を追加的に含んでもよい。例示的なシステム100はまた、ルール評価ジョブに関する評価結果の受信に応じて、評価結果に従ってデータオブジェクトを分類する、分類モジュール112も含んでもよい。例示的なシステム100はまた、ルール評価プロセッサが分類ルールの処理を評価するのにかかる時間、並びにルール評価プロセッサが分類ルール項目を評価するのにかかる時間を測定する、推定モジュール114も含んでもよい。推定モジュール114はまた、測定された時間に基づいてルール及び/又は項目の処理時間も推定し得る。別個の要素として例解されるが、図1のモジュール102のうちの1つ以上は、単一のモジュール又はアプリケーションの一部分を表し得る。
特定の実施形態では、図1のモジュール102のうちの1つ以上は、コンピューティングデバイスによって実行されるとき、コンピューティングデバイスに、1つ以上のタスクを実施させてもよい1つ以上のソフトウェアアプリケーション又はプログラムを表してもよい。例えば、そして以下でより詳細に説明されるように、モジュール102のうちの1つ以上は、図2に示すデバイス(例えば、バックエンド202、及び/又はサーバ206)、図5のコンピューティングシステム510、及び/又は図6の例示的なネットワークアーキテクチャ600の部分などの1つ以上のコンピューティングデバイス上で動作するように、記憶及び構成されたソフトウェアモジュールを表し得る。図1のモジュール102のうちの1つ以上はまた、1つ以上のタスクを実施するように構成された1つ以上の特殊目的のコンピュータの全て又は一部分を表してもよい。
図1に例解されるように、例示的なシステム100はまた、データベース120などの1つ以上のデータベースも含み得る。一例では、データベース120は、データオブジェクト、データオブジェクトを分類するためのルール、及び/又は様々なデータオブジェクト分類に実施されるアクションを記憶するように構成され得る。データベース120は、単一のデータベース若しくはコンピューティングデバイス、又は複数のデータベース若しくはコンピューティングデバイスの一部分を表し得る。例えば、データベース120は、図2のサーバ206の一部分、図5のコンピューティングシステム510及び/又は図6の例示的なネットワークアーキテクチャ600の一部分を表し得る。あるいは、図1のデータベース120は、図2のサーバ206、図5のコンピューティングシステム510、及び/又は図6の例示的なネットワークアーキテクチャ600の一部分などのコンピューティングデバイスがアクセスすることができる、1つ以上の物理的に別個のデバイスを表し得る。
図1の例示的なシステム100は、様々な態様で実装されてもよい。例えば、例示的なシステム100の全て又は一部分は、図2の例示的なシステム200の部分を表してもよい。図2に示すように、システム200は、ネットワーク204を介してサーバ206と通信するバックエンド202を含み得る。一例では、バックエンド202は、モジュール102のうちの1つ以上を用いてプログラムされ得る、かつ/又はデータベース120のデータの全て若しくは一部を記憶し得る。更に又は代替的に、サーバ206は、モジュール102のうちの1つ以上を用いてプログラムされ得る、かつ/又はデータベース120のデータの全て若しくは一部を記憶し得る。
一実施形態では、図1のモジュール102のうちの1つ以上は、バックエンド202及び/又はサーバ206のうちの少なくとも1つのプロセッサによって実行されるとき、バックエンド202及び/又はサーバ206がデータオブジェクトを効率よく分類することを可能にし得る。例えば、そして以下でより詳細に説明されるように、通信モジュール104は、データオブジェクトを分類するための複数のルール210に従って分類されるデータオブジェクト208を受信してもよく、各分類ルールは、1つ以上の項目212を含んでもよい。タスクモジュール106は、複数の分類ルール210中の各分類ルールに対して、分類ルール内の項目に従ってデータオブジェクト208を評価するようにルール評価プロセッサ216に指示するルール評価ジョブ214を作成してもよく、ルール評価プロセッサ216が推定処理時間の短い順に分類ルール210内部の項目212を評価する。キューイングモジュール108は次に、複数の分類ルール210に対して作成されたルール評価ジョブ214を、ルール評価プロセッサ216で処理するために少なくとも1つのルール評価キュー218に投入してもよく、ルール評価ジョブは推定処理時間の長い順に投入される。結果モジュール110は次に、ルール評価プロセッサ216から、各ルール評価ジョブ214に関する評価結果220を受信してもよい。最後に、分類モジュール112は、ルール評価ジョブ214に関する評価結果220の受信に応じて、評価結果220に従ってデータオブジェクト208を分類してもよい。
バックエンド202は、コンピュータ実行可能命令を読み出すことができる任意のタイプ又は形式のコンピューティングデバイスを概して表す。バックエンド202の例として、限定することなく、ノートブック、タブレット、デスクトップ、サーバ、携帯電話、個人情報機器(PDA)、マルチメディアプレイヤー、組込みシステム、ウェアラブルデバイス(例えば、スマートウォッチ、スマートグラスなど)、ゲーム機、これらのもののうちの1つ以上の組合せ、図5の例示的なコンピューティングシステム510、又は任意の別の好適なコンピューティングデバイスが挙げられるが、これらに限定されない。
サーバ206は、データを受信、比較、及び/又は記憶することができる任意のタイプ又は形式のコンピューティングデバイスを概して表す。サーバ206の例としては、限定することなく、種々のデータベースサービスを提供するように、及び/又はある特定のソフトウェアアプリケーションを動作させるように構成されたアプリケーションサーバ及びデータベースサーバが挙げられる。
ネットワーク204は、通信又はデータ転送を容易にすることができる任意の媒体又はアーキテクチャを概して表す。ネットワーク204の例としては、限定することなく、イントラネット、ワイドエリアネットワーク(WAN)、ローカルエリアネットワーク(LAN)、パーソナルエリアネットワーク(PAN)、インターネット、電力線通信(PLC)、セルラネットワーク(例えば、汎欧州デジタル移動電話方式(GSM(登録商標))ネットワーク)、又は図6の例示的なネットワークアーキテクチャ600などが挙げられる。ネットワーク204は、無線又は有線接続を使用して、通信又はデータ転送を容易にし得る。一実施形態では、ネットワーク204は、バックエンド202とサーバ206との間の通信を容易にし得る。
図3は、データオブジェクトを効率よく分類するための例示的なコンピュータ実装方法300のフローチャートである。図3に示す工程は、任意の好適なコンピュータ実行可能なコード及び/又はコンピューティングシステムによって実施されてもよい。いくつかの実施形態では、図3に示す工程は、図1のシステム100、図2のシステム200、図5のコンピューティングシステム510、及び/又は図6の例示的なネットワークアーキテクチャ600の部分の構成要素のうちの1つ以上によって実施されてもよい。
図3に例解されるように、工程302において、本明細書に記載されるシステムのうちの1つ以上は、データオブジェクトを分類するための複数のルールに従って分類されるデータオブジェクトを受信してもよく、各分類ルールは、1つ以上の項目を含んでもよい。例えば、通信モジュール104は、図2のバックエンド202の一部として、データオブジェクトを分類するための複数の分類ルール210に従って分類されるデータオブジェクト208を受信してもよく、各分類ルール210は、1つ以上の項目212を含んでもよい。
本明細書で使用するとき、「データオブジェクト」という用語は、概して、データ管理システムが単一オブジェクトとして記憶し管理し得るデータの量を指す。各データオブジェクトは、分類に基づいてアクションをとるデータ管理システムを用いて分類ルールのセットに従って分類され得る。データオブジェクトとしては、限定することなく、ファイル、メッセージ、データ構造、データベースレコード、又はウェブページが挙げられ得る。
本明細書で使用するとき、「分類ルール」という用語は、概して、組み合わせてデータオブジェクトを分類することができる1つ以上の項目のセットを指す。各項目は、データオブジェクトがカテゴリに属するかどうかを決定するデータオブジェクトの属性を定義してもよい。分類ルールは、括弧並びに/又は「AND」、「OR」、及び「NOT」などのブール演算子を使用して項目を組み合わせることができる。例えば、分類ルールが、「Owner OU=‘Engineering’AND(File extension=‘DXF’ OR File Extension=‘GDL’)」である場合にファイルを「CAD Drawing」と分類してもよい。
通信モジュール104は、種々の態様でデータオブジェクトを受信し得る。例えば、通信モジュール104は、データベースからレコードを検索すること、又は電子メールのメールボックスからメッセージを抽出することによってデータオブジェクトを受信し得る。他の例では、通信モジュール104は、記憶デバイスからファイルを検索すること、データ管理システムとの接続を介してデータオブジェクトを受信することによって、又はその他の好適な手段によってデータオブジェクトを受信し得る。
一例では、データオブジェクトの分類は、データ管理システムから独立して進行し得る。このことは、データオブジェクトの分類がデータ管理システムと同じデバイス上で実行される実施形態において重要であり得る。データオブジェクト分類が、データ管理システムと同じデバイスで実行するか又は別個のデバイスで実行するかに関わらず、通信モジュール104は、データ管理システムに、データオブジェクトの分類が非同期的に続行すること、及びデータ管理システムがデータオブジェクトの分類をその後に決定したときに、受信することを通知してもよい。
工程304において、本明細書に記載のシステムのうち1つ以上は、複数の分類ルール中の各分類ルールに対して、分類ルール内の項目に従ってデータオブジェクトを評価するようにルール評価プロセッサに指示するルール評価ジョブを作成してもよく、ルール評価プロセッサは、推定処理時間の短い順に分類ルール内部の項目を評価する。例えば、タスクモジュール106は、図2のバックエンド202の一部として、複数の分類ルール210中の各分類ルールに対して、分類ルール210内の項目212に従ってデータオブジェクト208を評価するようにルール評価プロセッサ216に指示するルール評価ジョブ214を作成してもよく、ルール評価プロセッサ216は、推定処理時間の短い順に分類ルール210内部の項目212を評価する。
タスクモジュール106は、種々の態様で各分類ルールに対してルール評価ジョブを作成し得る。例えば、タスクモジュール106は、自然言語又はスクリプト言語で分類ルールを含むテキストファイルの形態でデータ管理システムから分類ルールのセットを受信し得る。別の例では、タスクモジュール106は、データベースからデータオブジェクトを選択するために使用され得るデータベース問い合わせ言語(SQLなど)で書かれたステートメントの形態で分類ルールのセットを受信し得る。
分類ルールのセットを受信した後、タスクモジュール106は、分類ルールを分析して各分類ルール内に含まれる項目を識別し、各項目の処理時間を推定してもよい。以下でより詳細に説明されるように、タスクモジュール106は、履歴データを使用して、各項目の処理時間を推定してもよい。タスクモジュール106は、次に各分類ルールに対して、推定処理時間の短い順に各分類ルール内の項目に従ってデータオブジェクトを評価するようにルール評価プロセッサに指示するルール評価ジョブを作成してもよい。一例では、データオブジェクトの評価は、提供されたデータオブジェクトの属性が分類ルールによって指定された基準に合致するかどうか判定することを伴い得る。別の例では、データオブジェクトの評価は、データベースクエリを使用してデータベースからデータオブジェクトを選択することを伴い得る。
一実施形態では、分類ルールのうちの1つ以上の項目は、ルール評価プロセッサによって評価されるデータオブジェクトの一部を指定してもよい。例えば、電子メールメッセージに対する分類ルールは、電子メールの件名又はメッセージ本文の第1パラグラフが、特定の単語又は一連の単語を含むメッセージを検索してもよい。他の例では、ファイルに対する分類ルールは、特定の日時、又は「.TXT」ファイル名拡張子を有するメッセージの後に作成されたメッセージを検索してもよい。
一実施形態では、ルール評価ジョブは、ルール評価プロセッサに、論理的に結合された項目のセットを含む分類ルールに従ってデータオブジェクトを評価するように指示し、各項目は、1つ以上のデータオブジェクト属性を評価し、ルール評価ジョブは、論理的に結合された項目のうちの1つ以上の評価が否定的結果を生じたときにルール評価プロセッサに分類ルールの評価を終了するように指示する。分類ルールの項目を処理時間の短い順に評価することは、分類ルールを評価するために要する時間を短縮し得る。例えば、電子メールメッセージに対する分類ルールは、「Subject does not contain‘Out of office’AND Message contains‘CONFIDENTIAL’」に合致するメッセージを検索してもよい。この例において、メッセージ件名を評価する項目は、メッセージ本文を評価する項目より実行する時間が少なくて済む場合がある。なぜなら2つの項目が「AND」によって結合されているので、メッセージ件名が「Out of office」を含むことを、ルール評価プロセッサが判定した場合に、次にルール評価プロセッサは、ルール中の第2の項目を評価しないで、メッセージが分類ルールに合致しないことを判断し得る。
工程306において、本明細書に記載のシステムのうち1つ以上は、複数の分類ルールに対して作成されたルール評価ジョブを、ルール評価プロセッサで処理するために1つ以上のルール評価キューに投入してもよく、ルール評価ジョブは、推定処理時間の長い順に投入される。例えば、キューイングモジュール108は、図2のバックエンド202の一部として、複数の分類ルール210に対して作成されたルール評価ジョブ214を、ルール評価プロセッサ216で処理するために少なくとも1つのルール評価キュー218に投入してもよく、ルール評価ジョブ214は推定処理時間の長い順に投入される。処理時間が少なくて済むルール評価ジョブは、最も処理時間を要するジョブと平行して、他のルール評価プロセッサによって処理するためにキューイングすることができるため、最も処理時間を要するルール評価ジョブを最初にキューイングすることによって、キューイングモジュール108は、分類ルールのセットに対する全てのルール評価ジョブを処理するために必要な時間全体を短縮し得る。
キューイングモジュール108は、種々の態様で、ルール評価ジョブをルール評価キューに投入し得る。例えば、分類ルールの各項目を別々に評価するルール評価プロセッサを用いて、キューイングモジュール108は、分類ルールの各項目を、ルール評価キューに別個のルール評価ジョブとしてそれらが処理されるべき順序で投入し得る。別の例では、分類ルールの項目を分解することができるルール評価プロセッサを用いて、キューイングモジュール108は、分類ルールを、分類ルールの項目を評価するべき順序の指示と共にルール評価キューに投入し得る。
一実施形態では、本明細書に記載のシステムは、いくつかの独立して実行するルール評価プロセッサを、各ルール評価プロセッサが1つ以上のルール評価キューからのルール評価ジョブを処理しながら、含んでもよい。一実施形態では、独立して実行するルール評価プロセッサは、マルチコアプロセッサのコアに相当し得る。例えば、キューイングモジュール108は、図2のバックエンド202の一部として、バックエンド202によって管理されるいくつかのルール評価キュー218にルール評価ジョブ214をキューイングし得る。各ルール評価キュー218からのジョブは、ルール評価プロセッサ216として機能するマルチコアプロセッサの別個の処理ユニットによって平行して評価され得る。
一実施形態では、本明細書に記載のシステムは、ルール評価プロセッサが1つ以上の分類ルールの1つ以上の項目を評価するのにかかる時間を測定し、測定された時間に基づいて項目に関する処理時間を推定してもよい。本明細書に記載のシステムはまた、ルール評価プロセッサが1つ以上の分類ルールを評価するのにかかる時間を測定し、測定された時間に基づいて分類ルールに関する処理時間を推定してもよい。例えば、推定モジュール114は、図2のバックエンド202の一部として、ルール評価プロセッサ216が分類ルール210の項目212を評価するのにかかる処理時間224を測定し、測定された処理時間224に基づいて処理時間推定値226を生成してもよい。推定モジュール114はまた、ルール評価プロセッサ216が分類ルール210全体を評価するのにかかる処理時間224を測定し、測定された処理時間224に基づいて分類ルール210に対する処理時間推定値226を生成してもよい。
推定モジュール114は、分類ルールに対する処理時間又は分類ルールの項目に対する処理時間を任意の好適な方法で推定してもよい。例えば、推定モジュールは、分類ルールのセット内の各項目に対する推定処理時間及び各分類ルール全体に対する推定処理時間を維持し得る。推定処理時間は、例えば、各ルール若しくは項目の一部若しくは全ての処理時間又は直近の処理時間の移動平均の、平均又は中央値を表してもよい。
工程308において、本明細書に記載のシステムのうち1つの以上は、ルール評価プロセッサから、各ルール評価ジョブに関する評価結果を受信してもよい。例えば、結果モジュール110は、図2のバックエンド202の一部として、ルール評価プロセッサ216から、各ルール評価ジョブ214に関する評価結果220を受信してもよい。
本明細書で使用するとき、「評価結果」という用語は、概して、データオブジェクトが、分類ルールによって指定されたデータ分類の基準を満たすかどうかの判断を指す。結果モジュール110は、種々の態様で各ルール評価ジョブに関する評価結果を受信し得る。例えば、上述のように、ルール評価ジョブは、分類ルールから1つの項目を評価してもよい。結果モジュール110は、分類ルールの項目のそれぞれから評価結果を受信し得る。別の例では、ルール評価プロセッサは、1つのルール評価ジョブ内の分類ルール全体を評価し得る。結果モジュール110は次に、データオブジェクトが分類ルールに関連する分類に属するかどうかを示す評価結果を評価プロセッサから受信し得る。
工程310において、本明細書に記載のシステムのうちの1つ以上は、ルール評価ジョブに関する評価結果の受信に応じて、評価結果に従ってデータオブジェクトを分類し得る。例えば、分類モジュール112は、図2のバックエンド202の一部として、またルール評価ジョブ214に関する評価結果220の受信に応じて、評価結果220に従ってデータオブジェクト208を分類してもよい。
分類モジュール112は、種々の態様でデータオブジェクトを分類し得る。例えば、結果モジュール110が分類ルールの項目のそれぞれを別々に評価するいくつかのルール評価ジョブの結果を受信する場合、分類モジュール112は、評価結果のそれぞれを分類ルールのロジックに従って組み合わせてデータオブジェクトが分類ルールの基準を満たすかどうかを判断してもよい。別の例では、分類モジュール112は、結果モジュール110から分類ルール全体の評価の結果を示す評価結果を受信し得る。分類モジュール112は、データオブジェクが分類ルールに要約される基準を満たすかどうかを、更なる評価を実施しないで判断してもよい。
いくつかのルール評価ジョブからの評価結果の受信後、分類モジュール112は、データオブジェクトが分類ルールのセットのそれぞれに要約された基準を満たすかどうかを判断し得る。例えば、「Sender OU=‘Legal’AND Subject does not contain‘Personal’」である場合に電子メールメッセージを「Legal」と分類し得ると分類ルールが指定し、かつ電子メールメッセージがそれらの基準を満たすと分類モジュール112が判断した場合は、分類モジュール112は、電子メールメッセージを「Legal」と分類し得る。いくつかの例では、ひとたび分類モジュール112が、データオブジェクトに分類を割り当てると、分類モジュール112は、データオブジェクトの他の分類ルールへの適合を評価するルール評価ジョブの実行を終了させてもよい。
データオブジェクトの分類の決定後、分類モジュール112は、データ管理システムに対するデータオブジェクトを、割り当てられた分類と共に識別し得る。いくつかの例では、分類モジュール112は、データ管理システムにデータオブジェクト分類が使用可能であることを通知し、データ管理システムによって要求されたときにデータオブジェクトの識別及びその割り当てられた分類を提供し得る。他の例では、分類モジュール112は、データオブジェクトの属性を割り当てられた分類に設定してもよい。例えば、分類モジュール112は、ファイル若しくは電子メールメッセージのメタデータタグ又はデータベースレコード内のフィールドを、データオブジェクトの割り当てられた分類を示す値に設定し得る。
図4は、データオブジェクトを効率よく分類するためのルール処理システム400のブロック図である。図4に示されるように、ルール処理システム400は、分類ルールのセット404に従ってメールボックス408内の電子メールメッセージ410を評価するルールコントローラ402を含み得る。分類ルールのセット404は、分類ルール406を含み得る。一実施形態では、ルールコントローラ402は、図2におけるシステム200のバックエンド202を、図1におけるシステム100のモジュール102と共に含んでもよい。
図4に示されるように、ルールコントローラ402は、「Sender OU=‘Legal’AND Recipient domain<>‘organization.com’AND Has attachment AND”Attachment file name contains‘Contract’or‘Agreement’or‘Non−disclosure’or‘License’OR First paragraph of message contains‘CONFIDENTIAL’」である場合に電子メールメッセージを「Client legal document」と分類する、分類ルール406の項目のそれぞれに従って電子メールメッセージ410を評価してもよい。履歴データに基づいて、ルールコントローラ402は、Sender OU及びRecipient domainの評価は、Attachment file nameの評価よりも処理時間が短くて済むと判断し得る。ルールコントローラ402は、Sender OU及びRecipient domainの評価をルール評価キュー412(1)に、並びにAttachment file nameの評価をルール評価キュー412(2)にキューイングし得る。ルールコントローラ402はまた、メッセージが添付を有しない場合、Attachment file nameの評価が不要であること、及びしたがって「Has attachment」項目の評価がAttachment file nameの評価の前にキューイングされるべきであることを判断し得る。ルール評価プロセッサ414(1)及び414(2)から分類ルール406の項目のそれぞれに対する評価結果416(1)及び416(2)を受信後、ルールコントローラ402は、メッセージが分類ルール406に従って「Client legal document」と分類されてもよいかどうかを決定する。
より詳細に前述したように、本明細書に記載のシステム及び方法は、いくつかの使用可能なプロセッサを利用してルール評価ジョブを平行に実行して、分類ルールのセットに従って各データオブジェクトを評価し得る。更に、本明細書に記載のシステム及び方法は、過去の処理時間データを使用して、各分類ルール及び各分類ルール内の項目を評価するために要する処理時間を推定し得る。本明細書に記載のシステム及び方法は、推定処理時間を使用して、分類ルール及び各分類ルール内の項目の評価をキューイングして、各データオブジェクトについての分類に達する時間量を最小化し得る。本明細書に記載のシステム及び方法はまた、分類ルールのロジックを使用して、データオブジェクトについて適切な分類が決定されたときに終了するルール評価ジョブの更なる実行を可能にし得る。
図5は、本明細書に記載及び/又は図示する実施形態のうちの1つ以上を実装できる例示的なコンピューティングシステム510のブロック図である。例えば、コンピューティングシステム510の全て又は一部分は、単独又は他の要素との組合せのいずれかで、本明細書において説明される工程のうちの1つ以上(図3に例示する工程のうちの1つ以上など)を実施してもよく、及び/又は実施するための手段であってもよい。コンピューティングシステム510の全て又は一部分はまた、本明細書に記載された及び/又は図示された任意の別の工程、方法、又はプロセスを実施してもよく、及び/又は実施するための手段であってもよい。
コンピューティングシステム510は、コンピュータ可読命令を実行することができる任意の単一又はマルチプロセッサコンピューティングデバイス又はシステムを広く表す。コンピューティングシステム510の例としては、限定することなく、ワークステーション、ノートブック、クライアント側端末、サーバ、分散型計算システム、携帯用デバイス、又は任意の別のコンピューティングシステム若しくはデバイスが挙げられる。その最も基本的な構成において、コンピューティングシステム510は、少なくとも1つのプロセッサ514と、システムメモリ516と、を含んでもよい。
プロセッサ514は、データを処理すること、又は命令を解釈して実行することができる任意のタイプ又は形式の物理処理ユニット(例えば、ハードウェア実装中央処理ユニット)を概して表す。特定の実施形態では、プロセッサ514は、ソフトウェアアプリケーション又はモジュールから命令を受け取ってもよい。これらの命令は、プロセッサ514に、本明細書に記載及び/又は図示する例示的な実施形態のうちの1つ以上の機能を実施させてもよい。
システムメモリ516は、データ及び/又は他のコンピュータ可読命令を記憶することが可能な任意のタイプ又は形式の揮発性又は非揮発性記憶デバイス若しくは媒体を概して表す。システムメモリ516の例としては、限定することなく、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、フラッシュメモリ、又は任意の他の好適なメモリデバイスが挙げられる。必須ではないが、特定の実施形態においてコンピューティングシステム510は、揮発性メモリユニット(例えば、システムメモリ516など)、及び非揮発性記憶デバイス(例えば、以下で詳細に説明するような1次記憶デバイス532など)の両方を含んでもよい。一例では、図1からのモジュール102のうちの1つ以上は、システムメモリ516にロードされてもよい。
特定の実施形態では、例示的なコンピューティングシステム510はまた、プロセッサ514及びシステムメモリ516に加えて、1つ以上の構成要素又は要素を含んでもよい。例えば、図5に示すように、コンピューティングシステム510は、メモリコントローラ518と、入力/出力(I/O)コントローラ520と、通信インターフェース522と、を含んでもよく、これらのそれぞれは、通信インフラストラクチャ512を介して相互接続されてもよい。通信インフラストラクチャ512は、コンピューティングデバイスの1つ以上の構成要素間の通信を容易にすることが可能な任意のタイプ又は形式のインフラストラクチャを概して表す。通信インフラストラクチャ512の例としては、限定することなく、通信バス(業界標準アーキテクチャ(ISA)、周辺構成要素相互接続(PCI)、PCIエクスプレス(PCIe)、又は類似のバスなど)、及びネットワークが挙げられる。
メモリコントローラ518は、メモリ若しくはデータを取り扱うことが可能な、又はコンピューティングシステム510の1つ以上の構成要素間の通信を制御することが可能な任意のタイプ又は形式のデバイスを概して表す。例えば、特定の実施形態においてメモリコントローラ518は、通信インフラストラクチャ512を介して、プロセッサ514、システムメモリ516、及びI/Oコントローラ520の間の通信を制御してもよい。
I/Oコントローラ520は、コンピューティングデバイスの入出力機能を調整及び/又は制御することが可能な任意のタイプ又は形式のモジュールを概して表す。例えば、特定の実施形態においてI/Oコントローラ520は、プロセッサ514、システムメモリ516、通信インターフェース522、表示アダプタ526、入力インターフェース530、及び記憶インターフェース534などのコンピューティングシステム510の1つ以上の要素の間のデータの転送を制御してもよく、又は容易にしてもよい。
通信インターフェース522は、例示的なコンピューティングシステム510と、1つ以上の追加のデバイスとの間の通信を容易にすることが可能な任意のタイプ又は形式の通信デバイス又はアダプタを広く表す。例えば、特定の実施形態において通信インターフェース522は、コンピューティングシステム510と追加のコンピューティングシステムを含むプライベート又は公衆ネットワークとの間の通信を容易にしてもよい。通信インターフェース522の例としては、限定することなく、有線ネットワークインターフェース(ネットワークインターフェースカードなど)、無線ネットワークインターフェース(無線ネットワークインターフェースカードなど)、モデム、及び任意の他の好適なインターフェースが挙げられる。少なくとも1つの実施形態では、通信インターフェース522は、インターネットなどのネットワークへの直接的なリンクを介して、リモートサーバへの直接的な接続を提供してもよい。通信インターフェース522はまた、例えば、ローカルエリアネットワーク(イーサネット(登録商標)ネットワークなど)、パーソナルエリアネットワーク、電話若しくはケーブルネットワーク、セルラ電話接続、衛星データ接続、又は任意の他の好適な接続を通じて、かかる接続を間接的に提供してもよい。
特定の実施形態では、通信インターフェース522はまた、外部バス又は通信チャネルを介して、コンピューティングシステム510と、1つ以上の追加のネットワーク又は記憶デバイスとの間の通信を容易にするように構成されたホストアダプタを表してもよい。ホストアダプタの例としては、限定することなく、スモールコンピュータシステムインターフェース(SCSI)ホストアダプタ、ユニバーサルシリアルバス(USB)ホストアダプタ、米国電気電子技術者協会(IEEE)1394ホストアダプタ、アドバンストテクノロジーアタッチメント(ATA)、パラレルATA(PATA)、シリアルATA(SATA)、及びエクスターナルSATA(eSATA)ホストアダプタ、ファイバチャネルインターフェースアダプタ、イーサネット(登録商標)アダプタなどが挙げられる。通信インターフェース522はまた、コンピューティングシステム510が分散又は遠隔コンピューティングに関与することを可能にしてもよい。例えば、通信インターフェース522は、実行のために、遠隔デバイスから命令を受信するか、又は遠隔デバイスに命令を送信してもよい。
図5に示すように、コンピューティングシステム510はまた、表示アダプタ526を介して、通信インフラストラクチャ512に連結される少なくとも1つの表示デバイス524を含んでもよい。表示デバイス524は、表示アダプタ526によって転送された情報を視覚的に表示することが可能な任意のタイプ又は形式のデバイスを概して表す。同様に、表示アダプタ526は、表示デバイス524上に表示するために、通信インフラストラクチャ512から(又は当該技術分野において既知のように、フレームバッファから)、グラフィックス、テキスト、及び他のデータを転送するように構成された任意のタイプ又は形式のデバイスを概して表す。
図5に示すように、例示的なコンピューティングシステム510はまた、入力インターフェース530を介して、通信インフラストラクチャ512に連結される少なくとも1つの入力デバイス528を含んでもよい。入力デバイス528は、コンピュータ又はヒトのいずれかによって生成された入力を、例示的なコンピューティングシステム510に提供することが可能な任意のタイプ又は形式の入力デバイスを概して表す。入力デバイス528の例としては、限定することなく、キーボード、ポインティングデバイス、音声認識デバイス、又は任意の他の入力デバイスが挙げられる。
図5に示すように、例示的なコンピューティングシステム510はまた、ストレージインターフェース534を介して、通信インフラストラクチャ512に連結される1次記憶デバイス532及びバックアップ記憶デバイス533を含んでもよい。記憶デバイス532及び533は、データ及び/又は他のコンピュータ可読命令を記憶することが可能な任意のタイプ又は形式の記憶デバイス又は媒体を概して表す。例えば、記憶デバイス532及び533は、磁気ディスクドライブ(例えば、いわゆるハードドライブ)、ソリッドステートドライブ、フロッピーディスクドライブ、磁気テープドライブ、光ディスクドライブ、フラッシュドライブなどであり得る。記憶インターフェース534は、コンピューティングシステム510の記憶デバイス532及び533と、他の構成要素との間でデータを転送するための任意のタイプ又は形式のインターフェース又はデバイスを概して表す。一例では、図1からのデータベース120は、1次記憶デバイス532内に記憶され得る。
特定の実施形態では、記憶デバイス532及び533は、コンピュータソフトウェア、データ、又は他のコンピュータ可読情報を記憶するように構成された取り外し可能なストレージユニットから読み取るように、及び/又はそれに書き込むように構成されてもよい。好適な取り外し可能なストレージユニットの例としては、限定することなく、フロッピーディスク、磁気テープ、光ディスク、フラッシュメモリデバイスなどが挙げられる。記憶デバイス532及び533はまた、コンピュータソフトウェア、データ、又は他のコンピュータ可読命令が、コンピューティングシステム510にロードされることを可能にするための他の類似の構造又はデバイスを含んでもよい。例えば、記憶デバイス532及び533は、ソフトウェア、データ、他のコンピュータ可読情報を読み取る、及び書き込むように構成されてもよい。記憶デバイス532及び533は、コンピューティングシステム510の部分であってもよく、又は他のインターフェースシステムによってアクセスされる別個のデバイスであってもよい。
多くの他のデバイス又はサブシステムは、コンピューティングシステム510に接続されてもよい。逆に、図5に示す構成要素及びデバイスの全てが、本明細書において説明及び/又は例示される実施形態を実践するために存在する必要があるわけではない。上記で述べたデバイス及びサブシステムはまた、図5に示すものとは異なる様式で相互接続されてもよい。コンピューティングシステム510はまた、任意の数のソフトウェア、ファームウェア、及び/又はハードウェア構成を採用してもよい。例えば、本明細書において開示される例示的な実施形態のうちの1つ以上は、コンピュータ可読媒体上に、コンピュータプログラム(コンピュータソフトウェア、ソフトウェアアプリケーション、コンピュータ可読命令、又はコンピュータ制御論理とも称される)としてコード化され得る。「コンピュータ可読媒体」という用語は、本明細書において使用される際、概して、コンピュータ可読命令を記憶又は担持することが可能な任意の形態のデバイス、キャリア、又は媒体を指す。コンピュータ可読媒体の例としては、限定することなく、搬送波などの伝送タイプ媒体、並びに磁気記憶媒体(例えば、ハードディスクドライブ、テープドライブ、及びフロッピーディスク)、光記憶媒体(例えば、コンパクトディスク(CD)、デジタルビデオディスク(DVD)、及びBLU−RAYディスク)、電子記憶媒体(例えば、ソリッドステートドライブ及びフラッシュ媒体)などの非一時的タイプ媒体、並びに他の分散システムが挙げられる。
コンピュータプログラムを含むコンピュータ可読媒体は、コンピューティングシステム510にロードされてもよい。次いで、コンピュータ可読媒体上に記憶されたコンピュータプログラムの全て又は一部分は、システムメモリ516及び/又は記憶デバイス532及び533の種々の部分に記憶されてもよい。プロセッサ514によって実行されるとき、コンピューティングシステム510にロードされたコンピュータプログラムは、本明細書において説明及び/又は図示する例示的な実施形態のうちの1つ以上の機能をプロセッサ514に実施させてもよく、及び/又はそれらを実施するための手段であってもよい。追加的に又は代替案として、本明細書において説明及び/又は図示される例示的な実施形態のうちの1つ以上は、ファームウェア及び/又はハードウェアにおいて実装され得る。例えば、コンピューティングシステム510は、本明細書において開示される例示的な実施形態のうちの1つ以上を実装するように適合された特定用途向け集積回路(ASIC)として構成されてもよい。
図6は、クライアントシステム610、620、及び630、並びにサーバ640及び645がネットワーク650に連結されてもよい例示的なネットワークアーキテクチャ600のブロック図である。上記で詳述されたように、ネットワークアーキテクチャ600の全て又は一部分は、単独又は他の要素との組合せのいずれかで、本明細書において開示される工程のうちの1つ以上(図3に例示する工程のうちの1つ以上など)を実施してもよく、及び/又は実施するための手段であってもよい。ネットワークアーキテクチャ600の全て又は一部分はまた、本開示において記載された他の工程及び機能を実施するために使用されてもよく、及び/又は実施するための手段であってもよい。
クライアントシステム610、620、及び630は、図5の例示的なコンピューティングシステム510などの任意のタイプ又は形式のコンピューティングデバイス又はシステムを概して表す。同様に、サーバ640及び645は、種々のデータベースサービスを提供するように、及び/又は特定のソフトウェアアプリケーションを実行するように構成されたアプリケーションサーバ又はデータベースサーバなどのコンピューティングデバイス又はシステムを概して表す。ネットワーク650は、例えば、イントラネット、WAN、LAN、PAN、又はインターネットを含む、任意の電気通信又はコンピュータネットワークを概して表す。一例では、クライアントシステム610、620、及び/若しくは630、並びに/又はサーバ640及び/若しくは645は、図1からのシステム100の全て又は一部分を含んでもよい。
図6に示すように、1つ以上の記憶デバイス660(1)〜(N)は、サーバ640に直接取設されてもよい。同様に、1つ以上の記憶デバイス670(1)〜(N)は、サーバ645に直接取設されてもよい。記憶デバイス660(1)〜(N)及び記憶デバイス670(1)〜(N)は、データ及び/又は他のコンピュータ可読命令を記憶することが可能な任意のタイプ又は形式の記憶デバイス又は媒体を概して表す。特定の実施形態では、記憶デバイス660(1)〜(N)及び記憶デバイス670(1)〜(N)は、ネットワークファイルシステム(NFS)、サーバメッセージブロック(SMB)、又は共通インターネットファイルシステム(CIFS)など種々のプロトコルを使用して、サーバ640及び645と通信するように構成されたネットワーク接続型記憶(NAS)デバイスを表してもよい。
サーバ640及び645はまた、ストレージエリアネットワーク(SAN)ファブリック680に接続されてもよい。SANファブリック680は、複数の記憶デバイス間の通信を容易にすることが可能な任意のタイプ又は形式のコンピュータネットワーク又はアーキテクチャを概して表す。SANファブリック680は、サーバ640及び645と、複数の記憶デバイス690(1)〜(N)及び/又はインテリジェント記憶アレイ695との間の通信を容易にしてもよい。SANファブリック680はまた、デバイス690(1)〜(N)及びアレイ695が、クライアントシステム610、620、及び630にローカルに取設されたデバイスとして見えるような態様で、ネットワーク650並びにサーバ640及び645を介して、クライアントシステム610、620、及び630と、記憶デバイス690(1)〜(N)及び/又はインテリジェント記憶アレイ695との間の通信を容易にしてもよい。記憶デバイス660(1)〜(N)及び記憶デバイス670(1)〜(N)と同様に、記憶デバイス690(1)〜(N)及びインテリジェント記憶アレイ695は、データ及び/又は他のコンピュータ可読命令を記憶することが可能な任意のタイプ又は形式の記憶デバイス又は媒体を概して表す。
特定の実施形態では、図5の例示的なコンピューティングシステム510参照すると、図5の通信インターフェース522などの通信インターフェースは、それぞれのクライアントシステム610、620、及び630と、ネットワーク650との間の接続性を提供するために使用されてもよい。クライアントシステム610、620、及び630は、例えば、ウェブブラウザ又は他のクライアントソフトウェアを使用して、サーバ640及び645上の情報にアクセスすることが可能であってもよい。かかるソフトウェアは、クライアントシステム610、620、及び630が、サーバ640、サーバ645、記憶デバイス660(1)〜(N)、記憶デバイス670(1)〜(N)、記憶デバイス690(1)〜(N)、又はインテリジェント記憶アレイ695によってホストされるデータにアクセスすることを可能にしてもよい。図6は、データを交換するためのネットワーク(インターネットなど)の使用を描写するが、本明細書において説明及び/又は例示する実施形態は、インターネット又はいずれの特定のネットワークベースの環境にも限定されない。
少なくとも1つの実施形態において、本明細書において開示される例示的な実施形態のうちの1つ以上の全て又は一部分は、コンピュータプログラムとしてコード化されてもよく、サーバ640、サーバ645、記憶デバイス660(1)〜(N)、記憶デバイス670(1)〜(N)、記憶デバイス690(1)〜(N)、インテリジェント記憶アレイ695、又はこれらの任意の組み合わせにロードされ、これらによって実行されてもよい。本明細書において開示される例示的な実施形態のうちの1つ以上の全て又は一部分はまた、コンピュータプログラムとしてコード化され、サーバ640内に記憶され、サーバ645によって実行され、ネットワーク650を通じてクライアントシステム610、620、及び630に分散されてもよい。
上記で詳述したように、コンピューティングシステム510及び/又はネットワークアーキテクチャ600のうちの1つ以上の構成要素は、単独又は他の要素との組み合わせのいずれかで、データオブジェクトを効率よく分類するための例示的な方法のうちの1つ以上の工程を実施し得るか、及び/又は実施するための手段であり得る。
上述の開示は、具体的なブロック図、フローチャート、及び実施例を使用して、種々の実施形態を記載するが、本明細書において説明及び/又は例解される各ブロック図の構成要素、フローチャートの工程、動作、及び/又は構成要素は、広範なハードウェア、ソフトウェア、又はファームウェア(又はこれらの任意の組み合わせ)構成を使用して、個々に、及び/又は集合的に実装され得る。加えて、他の構成要素内に含まれる構成要素のいずれの開示も、多くの他のアーキテクチャを実装して、同じ機能性を達成することができるため、事実上、例示的であると見なされるべきである。
いくつかの例では、図1の例示的なシステム100の全て又は一部分は、クラウドコンピューティング又はネットワークベース環境の部分を表してもよい。クラウドコンピューティング環境は、インターネットを介して、種々のサービス及びアプリケーションを提供し得る。これらのクラウドベースのサービス(例えば、サービスとしてのソフトウェア、サービスとしてプラットフォーム、サービスとしてのインフラストラクチャなど)は、ウェブブラウザ又は他の遠隔インターフェースを通じて、アクセス可能であり得る。本明細書において説明される種々の機能は、遠隔デスクトップ環境又は任意の他のクラウドベースのコンピューティング環境を通じて提供され得る。
種々の実施形態において、図1の例示的なシステム100の全て又は一部分は、クラウドベースのコンピューティング環境内のマルチテナンシーを容易にし得る。換言すると、本明細書において説明されるソフトウェアモジュールは、本明細書において説明される機能のうちの1つ以上に対するマルチテナンシーを容易にするように、コンピューティングシステム(例えば、サーバ)を構成し得る。例えば、本明細書において説明されるソフトウェアモジュールのうちの1つ以上は、2つ以上のクライアント(例えば、顧客)が、サーバ上で実行されているアプリケーションを共有することを可能にするように、サーバをプログラムし得る。このようにプログラムされたサーバは、複数の顧客(即ち、テナント)間でアプリケーション、オペレーティングシステム、処理システム、及び/又は記憶システムを共有し得る。本明細書において説明されるモジュールのうちの1つ以上はまた、ある顧客が別の顧客のデータ及び/又は構成情報にアクセスすることができないように、各顧客に対して、マルチテナントアプリケーションのデータ及び/又は構成情報を分割し得る。
種々の実施形態によれば、図1の例示的なシステム100の全て又は一部分は、仮想環境内で実装され得る。例えば、本明細書において説明されるモジュール及び/又はデータは、仮想マシン内に存在し得る、及び/又はそこで実行し得る。本明細書において使用される際、「仮想マシン」という用語は、概して、仮想マシンマネージャ(例えば、ハイパーバイザ)によって、コンピューティングハードウェアから抽象化される任意のオペレーティングシステム環境を指す。追加的に又は代替案として、本明細書において説明されるモジュール及び/又はデータは、仮想化層内に存在し得る、及び/又はそこで実行し得る。本明細書において使用される際、「仮想化層」という用語は、概して、オペレーティングシステム環境に重なる、及び/又はそれから抽象化される、任意のデータ層及び/又はアプリケーション層を指す。仮想化層は、仮想化層を、根本的な基本オペレーティングシステムの一部であるかのように提示する、ソフトウェア仮想化ソリューション(例えば、ファイルシステムフィルタ)によって、管理され得る。例えば、ソフトウェア仮想化ソリューションは、最初は基本ファイルシステム及び/又はレジストリ内の場所に向けられた呼び出しを、仮想化層内の場所にリダイレクトし得る。
一部の実施例において、図1の例示的なシステム100の全て又は一部分は、モバイルコンピューティング環境の一部分を表し得る。モバイルコンピューティング環境は、モバイル電話、タブレットコンピュータ、電子書籍リーダ、パーソナルデジタルアシスタント、ウェアラブルコンピューティングデバイス(例えば、頭部装着型ディスプレイ、スマートウォッチなどを有するコンピューティングデバイス)などを含む、広範なモバイルコンピューティングデバイスによって実装され得る。一部の実施例において、モバイルコンピューティング環境は、例えば、バッテリ電力への依存、任意の所与の時間に1つのフォアグラウンドアプリケーションのみを提示すること、遠隔管理特性、タッチスクリーン特性、場所及び移動データ(例えば、グローバルポジショニングシステム、ジャイロスコープ、加速度計などによって提供される)、システムレベルの構成への修正を制限する、及び/又は第3者のソフトウェアが他のアプリケーションの挙動を検査する能力、アプリケーションのインストールを制限する(例えば、承認されたアプリケーションストアのみから得る)能力などを制限する、制限されたプラットフォームを含む、1つ以上の異なる特性を含み得る。本明細書において説明される種々の機能は、モバイルコンピューティング環境に対して提供され得る、及び/又はモバイルコンピューティング環境と相互作用し得る。
加えて、図1の例示的なシステム100の全て又は一部分は、情報管理のための1つ以上のシステムの一部分を表し得る、それらの相互作用し得る、それらによって生成されるデータを消費し得る、及び/又はそれらによって消費されるデータを生成し得る。本明細書において使用される際、「情報管理」という用語は、データの保護、組織化、及び/又は記憶を指し得る。情報管理のためのシステムの例としては、限定することなく、記憶システム、バックアップシステム、アーカイバルシステム、複製システム、高可用性システム、データ検索システム、仮想化システムなどが挙げられ得る。
いくつかの実施形態では、図1の例示的なシステム100の全て又は一部分は、情報セキュリティのための1つ以上のシステムの一部分を表し得る、それらによって保護されるデータを生成し得る、及び/又はそれらと通信し得る。本明細書において使用される際、「情報セキュリティ」という用語は、保護されたデータへのアクセスの制御を指し得る。情報セキュリティのためのシステムの例としては、限定することなく、管理されたセキュリティサービスを提供するシステム、データ損失防止システム、アイデンティティ認証システム、アクセス制御システム、暗号化システム、ポリシーコンプライアンスシステム、侵入検出及び防止システム、電子ディスカバリシステムなどが挙げられ得る。
いくつかの例によれば、図1の例示的なシステム100の全て又は一部分は、エンドポイントセキュリティのための1つ以上のシステムの一部分を表し得る、それらと通信し得る、及び/又はそれらから保護を受け得る。本明細書において使用される際、「エンドポイントセキュリティ」という用語は、不法及び/又は違法な使用、アクセス、及び/又は制御からのエンドポイントシステムの保護を指し得る。エンドポイント保護のためのシステムの例としては、限定することなく、マルウェア対策システム、ユーザ認証システム、暗号化システム、プライバシーシステム、スパムフィルタリングサービスなどが挙げられ得る。
本明細書において説明及び/又は例解される工程のプロセスパラメータ及び順序は、例として示されるに過ぎず、所望に応じて変化させることができる。例えば、本明細書において例解及び/又は説明される工程は、特定の順序で図示又は考察されるが、これらの工程は、必ずしも例解又は考察される順序で実施される必要はない。本明細書において説明及び/又は例解される種々の例示的な方法もまた、本明細書において説明若しくは例解される工程のうちの1つ以上を省略し得るか、又は開示されるものに加えて追加の工程を含み得る。
種々の実施形態が、完全に機能的なコンピューティングシステムの文脈で、本明細書において説明及び/又は例解されているが、これらの例示的な実施形態のうちの1つ以上は、分散を実際に行うために使用される特定のタイプのコンピュータ可読媒体にかかわらず、様々な形態のプログラム製品として分散され得る。本明細書において開示される実施形態はまた、あるタスクを実施するソフトウェアモジュールを使用して、実装され得る。これらのソフトウェアモジュールは、コンピュータ可読記憶媒体上に、又はコンピューティングシステム内に記憶され得る、スクリプト、バッチ、又は他の実行可能なファイルを含み得る。いくつかの実施形態では、これらのソフトウェアモジュールは、本明細書において開示される例示的な実施形態のうちの1つ以上を実施するように、コンピューティングシステムを構成し得る。
加えて、本明細書において説明されるモジュールのうちの1つ以上は、データ、物理的デバイス、及び/又は物理的デバイスの表現を、ある形態から別の形態に変換し得る。例えば、本明細書において列挙されるモジュールのうちの1つ以上は、変換されるデータオブジェクト及び分類ルールを受信し、データオブジェクト及び分類ルールを変換し、変換の結果を出力して分類ルールに従ってデータオブジェクトを分類し、変換の結果を使用してデータオブジェクトをどのように処理するべきかを決定し、変換の結果を記憶してデータオブジェクトがどのように分類されたかを記録し得る。追加的に又は代替案として、本明細書において列挙されるモジュールのうちの1つ以上は、コンピューティングデバイス上で実行すること、コンピューティングデバイス上にデータを記憶すること、及び/又はそうでなければ、コンピューティングデバイスと相互作用することによって、物理コンピューティングデバイスのプロセッサ、揮発性メモリ、非揮発性メモリ、及び/又は任意の他の部分を1つの形式からもう1つの形式に変換してもよい。
先述の説明は、当業者が、本明細書において開示される例示的な実施形態の種々の態様を最良に利用することを可能にするために提供されている。この例示的な説明は、包括的であること、又は開示されるいかなる正確な形態にも限定されることを意図されない。多くの修正及び改変が、本開示の趣旨及び範囲から逸脱することなく、可能である。本明細書において開示される実施形態は、全ての点において、例解的であり、制限的ではないと見なされるべきである。本開示の範囲を判定する上では、添付の請求項及びそれらの同等物を参照するべきである。
別途記載されない限り、「〜に接続される(connected to)」及び「〜に連結される(coupled to)」という用語(及びそれらの派生語)は、本明細書及び請求項において使用される際、直接的及び間接的(即ち、他の要素又は構成要素を介した)接続の両方を許容するとして解釈されるものとする。加えて、「a」又は「an」という用語は、本明細書及び請求項において使用される際、「〜のうちの少なくとも1つ(at least one of)」を意味するとして解釈されるものとする。最後に、使用を容易にするために、「含む(including)」及び「有する(having)」という用語(及びそれらの派生語)は、本明細書及び請求項において使用される際、「備える(comprising)」という語と同義的であり、かつ同じ意味を有する。

Claims (15)

  1. データオブジェクトを効率よく分類するためのコンピュータ実装方法であって、前記方法の少なくとも一部分が、少なくとも1つのプロセッサを備えるコンピューティングデバイスによって実施され、前記方法が、
    データオブジェクトを分類するための複数のルールに従って分類されるデータオブジェクトを受信することであって、各分類ルールが少なくとも1つの項目を含む、ことと、
    前記複数の分類ルール中の各分類ルールに対して、前記分類ルール内の前記項目に従って前記データオブジェクトを評価するようにルール評価プロセッサに指示するルール評価ジョブを作成することであって、前記ルール評価プロセッサが、推定処理時間の短い順に前記分類ルール内の前記項目を評価する、ことと、
    前記複数の分類ルールに対して作成された前記ルール評価ジョブを、前記ルール評価プロセッサで処理するために少なくとも1つのルール評価キューに投入することであって、前記ルール評価ジョブが推定処理時間の長い順に投入される、ことと、
    前記ルール評価プロセッサから、各ルール評価ジョブに関する評価結果を受信することと、
    前記ルール評価ジョブに関する前記評価結果を受信することに応じて、前記評価結果に従って前記データオブジェクトを分類することと、を含む方法。
  2. 複数の独立して実行するルール評価プロセッサを更に含み、各ルール評価プロセッサが、少なくとも1つのルール評価キューからのルール評価ジョブを処理する、請求項1に記載のコンピュータ実装方法。
  3. 前記ルール評価ジョブが、
    前記ルール評価プロセッサに、論理的に結合された項目のセットを含む分類ルールに従って前記データオブジェクトを評価するように指示し、各項目が前記データオブジェクトの少なくとも1つの属性を評価し、
    前記論理的に結合された項目のうちの少なくとも1つの評価が否定的結果を生じたときに、前記ルール評価プロセッサに前記分類ルールの評価を終了するように指示する、請求項1又は2に記載のコンピュータ実装方法。
  4. 前記分類ルールのうちの少なくとも1つの項目が、前記ルール評価プロセッサによって評価される前記データオブジェクトの一部を指定する、請求項1、2、又は3に記載のコンピュータ実装方法。
  5. 前記ルール評価プロセッサが少なくとも1つの分類ルールのうちの少なくとも1つの項目を評価するのにかかる時間を測定することと、
    前記測定された時間に基づいて前記項目に関する処理時間を推定することと、を更に含む、請求項1、2、3、又は4に記載のコンピュータ実装方法。
  6. 前記ルール評価プロセッサが少なくとも1つの分類ルールを評価するのにかかる時間を測定することと、
    前記測定された時間に基づいて前記分類ルールに関する処理時間を推定することと、を更に含む、請求項1、2、3、4、又は5に記載のコンピュータ実装方法。
  7. データオブジェクトを効率よく分類するためのシステムであって、前記システムが、
    データオブジェクトを分類するための複数のルールに従って分類されるデータオブジェクトにアクセスするための手段であって、各分類ルールが少なくとも1つの項目を含む、手段と、
    前記複数の分類ルール中の各分類ルールに対して、前記分類ルール内の前記項目に従って前記データオブジェクトを評価するようにルール評価プロセッサに指示するルール評価ジョブを作成するための手段であって、前記ルール評価プロセッサが、推定処理時間の短い順に前記分類ルール内部の前記項目を評価する、手段と、
    前記複数の分類ルールに対して作成された前記ルール評価ジョブを、前記ルール評価プロセッサで処理するために少なくとも1つのルール評価キューに投入するための手段であって、前記ルール評価ジョブが推定処理時間の長い順に投入される、手段と、
    前記ルール評価プロセッサから、各ルール評価ジョブに関する評価結果を受信するための手段と、
    前記ルール評価ジョブに関する前記評価結果の受信に応じて、前記評価結果に従って前記データオブジェクトを分類するための手段と、を含むシステム
  8. 複数の独立して実行するルール評価プロセッサを更に含み、各ルール評価プロセッサが、少なくとも1つのルール評価キューからのルール評価ジョブを処理する、請求項7に記載のシステム。
  9. 前記作成するための手段によって作成された前記ルール評価ジョブが、
    前記ルール評価プロセッサに、論理的に結合された項目のセットを含む分類ルールに従って前記データオブジェクトを評価するように指示し、各項目が前記データオブジェクト
    の少なくとも1つの属性を評価し、
    前記論理的に結合された項目のうちの少なくとも1つの評価が否定的結果を生じたときに、前記ルール評価プロセッサに前記分類ルールの評価を終了するように指示する、請求項7又は8に記載のシステム。
  10. 前記分類ルールのうちの少なくとも1つの項目が、前記ルール評価プロセッサによって評価される前記データオブジェクトの一部を指定する、請求項7、8、又は9に記載のシステム。
  11. 前記ルール評価プロセッサが少なくとも1つの分類ルールのうちの少なくとも1つの項目を評価するのにかかる時間を測定し、
    前記測定された時間に基づいて前記項目に関する処理時間を推定する、推定するための手段を更に含む、請求項7、8、9、又は10に記載のシステム。
  12. 前記推定するための手段が、
    前記ルール評価プロセッサが少なくとも1つの分類ルールを評価するのにかかる時間を測定し、
    前記測定された時間に基づいて前記分類ルールに関する処理時間を推定する、請求項11に記載のシステム。
  13. 1つ以上のコンピュータ可読命令を含む非一過性コンピュータ可読媒体であって、前記命令が、コンピューティングデバイスの少なくとも1つのプロセッサによって実行されるとき、前記コンピューティングデバイスに、
    データオブジェクトを分類するための複数のルールに従って分類されるデータオブジェクトを受信させることであって、各分類ルールが少なくとも1つの項目を含む、ことと、
    前記複数の分類ルール中の各分類ルールに対して、前記分類ルール内の前記項目に従って前記データオブジェクトを評価するようにルール評価プロセッサに指示するルール評価ジョブを作成することであって、前記ルール評価プロセッサが、推定処理時間の短い順に前記分類ルール内部の前記項目を評価する、ことと、
    前記複数の分類ルールに対して作成された前記ルール評価ジョブを、前記ルール評価プロセッサで処理するために少なくとも1つのルール評価キューに投入することであって、前記ルール評価ジョブが推定処理時間の長い順に投入される、ことと、
    前記ルール評価プロセッサから、各ルール評価ジョブに関する評価結果を受信することと、
    前記ルール評価ジョブに関する前記評価結果を受信することに応じて、前記評価結果に従って前記データオブジェクトを分類することと、を実行させる非一過性コンピュータ可読媒体。
  14. 前記1つ以上のコンピュータ可読命令が、前記コンピューティングデバイスに、複数の独立して実行するルール評価プロセッサによりサービスされる少なくとも1つのルール評価キューに前記ルール評価ジョブを投入させ、各ルール評価プロセッサが、少なくとも1つのルール評価キューからのルール評価ジョブを処理する、請求項13に記載の非一過性コンピュータ可読媒体。
  15. 前記1つ以上のコンピュータ可読命令が、前記コンピューティングデバイスに、
    前記ルール評価プロセッサに、論理的に結合された項目のセットを含む分類ルールに従って前記データオブジェクトを評価するように指示し、各項目が前記データオブジェクトの少なくとも1つの属性を評価し、
    前記論理的に結合された項目のうちの少なくとも1つの評価が否定的結果を生じたときに、前記ルール評価プロセッサに前記分類ルールの評価を終了するように指示する、前記
    ルール評価ジョブを作成するようにさせる、請求項13又は14に記載の非一過性コンピュータ可読媒体。
JP2018531599A 2015-12-30 2016-11-29 データオブジェクトを効率よく分類するシステム及び方法 Active JP6576563B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/984,216 US10706368B2 (en) 2015-12-30 2015-12-30 Systems and methods for efficiently classifying data objects
US14/984,216 2015-12-30
PCT/US2016/064041 WO2017116594A1 (en) 2015-12-30 2016-11-29 Systems and methods for efficiently classifying data objects

Publications (2)

Publication Number Publication Date
JP2019502998A JP2019502998A (ja) 2019-01-31
JP6576563B2 true JP6576563B2 (ja) 2019-09-18

Family

ID=57590841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018531599A Active JP6576563B2 (ja) 2015-12-30 2016-11-29 データオブジェクトを効率よく分類するシステム及び方法

Country Status (5)

Country Link
US (1) US10706368B2 (ja)
EP (1) EP3398084A1 (ja)
JP (1) JP6576563B2 (ja)
CN (1) CN108604239B (ja)
WO (1) WO2017116594A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10706368B2 (en) 2015-12-30 2020-07-07 Veritas Technologies Llc Systems and methods for efficiently classifying data objects
US10609184B1 (en) * 2016-08-26 2020-03-31 Veritas Technologies Llc Systems and methods for consistently applying rules to messages
US10942948B2 (en) * 2017-05-02 2021-03-09 Sap Se Cloud-based pluggable classification system
US11455168B1 (en) 2017-10-19 2022-09-27 Pure Storage, Inc. Batch building for deep learning training workloads
US12067466B2 (en) 2017-10-19 2024-08-20 Pure Storage, Inc. Artificial intelligence and machine learning hyperscale infrastructure
US11494692B1 (en) 2018-03-26 2022-11-08 Pure Storage, Inc. Hyperscale artificial intelligence and machine learning infrastructure
US10360214B2 (en) 2017-10-19 2019-07-23 Pure Storage, Inc. Ensuring reproducibility in an artificial intelligence infrastructure
US11861423B1 (en) * 2017-10-19 2024-01-02 Pure Storage, Inc. Accelerating artificial intelligence (‘AI’) workflows
US10671435B1 (en) 2017-10-19 2020-06-02 Pure Storage, Inc. Data transformation caching in an artificial intelligence infrastructure
CN114092043A (zh) * 2021-11-09 2022-02-25 中国建设银行股份有限公司 数据管理平台、方法、设备及计算机可读存储介质

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040198386A1 (en) * 2002-01-16 2004-10-07 Dupray Dennis J. Applications for a wireless location gateway
US7127467B2 (en) 2002-05-10 2006-10-24 Oracle International Corporation Managing expressions in a database system
US8005802B2 (en) 2002-08-01 2011-08-23 Oracle International Corporation Partial evaluation of rule sets
US7082505B2 (en) * 2002-11-01 2006-07-25 Taiwan Semiconductor Manufacturing Company, Ltd. Backup data mechanism with fuzzy logic
US7548544B2 (en) * 2005-05-05 2009-06-16 Ironport Systems, Inc. Method of determining network addresses of senders of electronic mail messages
JP4948276B2 (ja) 2007-06-15 2012-06-06 三菱電機株式会社 データベース検索装置及びデータベース検索プログラム
US20100274750A1 (en) 2009-04-22 2010-10-28 Microsoft Corporation Data Classification Pipeline Including Automatic Classification Rules
CN101795211B (zh) * 2010-01-13 2012-02-22 北京中创信测科技股份有限公司 一种数据存储方法及系统
US20120215560A1 (en) * 2010-07-21 2012-08-23 dbMotion Ltd. System and methods for facilitating computerized interactions with emrs
US8572007B1 (en) 2010-10-29 2013-10-29 Symantec Corporation Systems and methods for classifying unknown files/spam based on a user actions, a file's prevalence within a user community, and a predetermined prevalence threshold
US8856364B2 (en) * 2011-03-11 2014-10-07 Google Inc. Conducting opportunistic network updates on a mobile device
CN103428160A (zh) * 2012-05-15 2013-12-04 上海博路信息技术有限公司 一种基于语音的排队服务系统
US10169090B2 (en) * 2012-09-12 2019-01-01 Salesforce.Com, Inc. Facilitating tiered service model-based fair allocation of resources for application servers in multi-tenant environments
JP6020004B2 (ja) 2012-09-27 2016-11-02 富士通株式会社 データ管理方法、情報処理装置およびプログラム
US9342366B2 (en) * 2012-10-17 2016-05-17 Electronics And Telecommunications Research Institute Intrusion detection apparatus and method using load balancer responsive to traffic conditions between central processing unit and graphics processing unit
CN102929861B (zh) * 2012-10-22 2015-07-22 杭州东信北邮信息技术有限公司 一种文本情感指数计算方法和系统
CN103577560B (zh) * 2013-10-24 2017-05-24 华为技术有限公司 一种输入数据库操作指令的方法和装置
US9288290B2 (en) * 2013-12-10 2016-03-15 Cisco Technology, Inc. Interactive dynamic ordering of deep packet inspection rules
CN104142998A (zh) * 2014-08-01 2014-11-12 中国传媒大学 一种文本分类方法
CN104794151A (zh) * 2015-01-30 2015-07-22 北京东方泰坦科技股份有限公司 一种基于协同标绘技术的空间知识服务系统建设方法
CN104820716B (zh) * 2015-05-21 2017-11-28 中国人民解放军海军工程大学 基于数据挖掘的装备可靠性评估方法
US10706368B2 (en) 2015-12-30 2020-07-07 Veritas Technologies Llc Systems and methods for efficiently classifying data objects

Also Published As

Publication number Publication date
US20170193389A1 (en) 2017-07-06
JP2019502998A (ja) 2019-01-31
US10706368B2 (en) 2020-07-07
EP3398084A1 (en) 2018-11-07
CN108604239A (zh) 2018-09-28
CN108604239B (zh) 2022-01-28
WO2017116594A1 (en) 2017-07-06

Similar Documents

Publication Publication Date Title
JP6576563B2 (ja) データオブジェクトを効率よく分類するシステム及び方法
US9245123B1 (en) Systems and methods for identifying malicious files
JP6336675B2 (ja) 複数の異種データ管理システムからの情報資産メタデータを集約するためのシステム及び方法
US9246941B1 (en) Systems and methods for predicting the impact of security-policy changes on users
US9077728B1 (en) Systems and methods for managing access-control groups
US9407664B1 (en) Systems and methods for enforcing enterprise data access control policies in cloud computing environments
US10607005B2 (en) Systems and methods for labeling automatically generated reports
US9992211B1 (en) Systems and methods for improving the classification accuracy of trustworthiness classifiers
US11275831B1 (en) Systems and methods for detecting anomalous system command line data
US11782965B1 (en) Systems and methods for normalizing data store classification information
US10735468B1 (en) Systems and methods for evaluating security services
US11245726B1 (en) Systems and methods for customizing security alert reports
US10380074B1 (en) Systems and methods for efficient backup deduplication
US10542017B1 (en) Systems and methods for personalizing security incident reports
US10606705B1 (en) Prioritizing backup operations using heuristic techniques
US11429823B1 (en) Systems and methods for dynamically augmenting machine learning models based on contextual factors associated with execution environments
US9332025B1 (en) Systems and methods for detecting suspicious files
AU2015346655A1 (en) Systems and methods for aggregating information-asset classifications
US9424269B1 (en) Systems and methods for deduplicating archive objects
US11023580B1 (en) Systems and methods for cross-product malware categorization
US10057274B1 (en) Systems and methods for profiling client systems
US20160179954A1 (en) Systems and methods for culling search results in electronic discovery
US10216933B1 (en) Systems and methods for determining whether malicious files are targeted
US11461462B1 (en) Systems and methods for producing adjustments to malware-detecting services
US10635645B1 (en) Systems and methods for maintaining aggregate tables in databases

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180615

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180615

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180723

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190416

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190704

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190820

R150 Certificate of patent or registration of utility model

Ref document number: 6576563

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250