JP2012524941A - 自動分類ルールを含むデータ分類パイプライン - Google Patents
自動分類ルールを含むデータ分類パイプライン Download PDFInfo
- Publication number
- JP2012524941A JP2012524941A JP2012507264A JP2012507264A JP2012524941A JP 2012524941 A JP2012524941 A JP 2012524941A JP 2012507264 A JP2012507264 A JP 2012507264A JP 2012507264 A JP2012507264 A JP 2012507264A JP 2012524941 A JP2012524941 A JP 2012524941A
- Authority
- JP
- Japan
- Prior art keywords
- classification
- classifier
- data
- pipeline
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/122—File system administration, e.g. details of archiving or snapshots using management policies
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Life Sciences & Earth Sciences (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Bioethics (AREA)
- Biotechnology (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Primary Health Care (AREA)
Abstract
Description
ファイルがまだ分類されていない場合に限り評価する。
図5は、図1から図4までの例が実装され得るのに適したコンピューティングおよびネットワーキング環境500の例を図示する。コンピューティングシステム環境500は、適したコンピューティング環境のほんの一例にすぎず、本発明の使用または機能性の範囲に関していかなる限定を示唆することも意図しない。コンピューティングシステム環境500は、例示的なオペレーティング環境500において図示されたコンポーネントの任意の1つまたはその組み合わせに関係する任意の依存性または要件を有するものとして解釈されるべきでない。
本発明は、さまざまに修正して代替的に構成することが可能であるが、そのいくつかの例示的な実施形態が図面で示され、上記で詳細に説明されている。しかしながら、本発明を開示された具体的な形式に限定することを意図せず、反対に、その意図するところは、本発明の精神および範囲内におけるすべての修正、代替的構成および同等物を網羅することであることを理解されたい。
Claims (15)
- コンピューティング環境において、データ項目と関連付けられたメタデータを入手するコンポーネント(109、222)と、それぞれが、分類メタデータに呼び出される場合に前記データ項目を分類するように構成され関連付けられた、1または複数の分類モジュールおよび分類ルール(110、223)と、前記データ項目にポリシーを適用する際に使用される前記データ項目に前記分類メタデータを関連付けるコンポーネント(111、224)とを含む分類パイプライン(108、109、110、111、222、223、224)を備えることを特徴とするシステム(500)。
- 前記分類パイプラインはデータ項目を処理するパイプラインに組み込まれ、前記データ項目を処理するパイプラインは前記項目を発見する発見モジュールを含むことを特徴とする請求項1に記載のシステム。
- 前記データ項目はファイルに対応し、前記発見モジュールはファイルシステムをスキャンしてその中のファイルを発見するための手段、またはファイルの変更を検出するための手段を有することを特徴とする請求項2に記載のシステム。
- 前記分類パイプラインはデータ項目を処理するパイプライン内に組み込まれ、前記データ項目を処理するパイプラインはポリシーを前記データ項目に適用するために前記分類メタデータを評価するポリシーモジュールを含むことを特徴とする請求項1に記載のシステム。
- 存在する任意の分類データに基づいて、または前記データファイルの以前の変更を示すタイムスタンプまたは他の識別子に基づいて、分類モジュールを呼び出すかどうかを決定する手段をさらに備えることを特徴とする請求項1に記載のシステム。
- 分類メタデータを外部に設定するために前記分類パイプラインとインタラクトするためのインタフェースをさらに備えることを特徴とする請求項1に記載のシステム。
- 分類メタデータを外部に取得するために前記分類パイプラインとインタラクトするためのインタフェースをさらに備えることを特徴とする請求項1に記載のシステム。
- 前記分類子の設定は前記分類子セット内の別の分類子の分類メタデータをオーバーライドする権限のある分類子を含み、前記分類パイプラインは前記分類メタデータ内に設定された前記分類子の異なる分類子から異なる分類結果を集約するための手段を含むことを特徴とする請求項1に記載のシステム。
- コンピューティング環境(500)において、
第1のフェーズ(106、221)において、データ項目を発見するステップ(402)と、
前記第1のフェーズとは独立している第2にフェーズ(108、109、110、111、222、223、224、232、234、242、361、362、363、364、365)において、前記データ項目と関連付けられたプロパティを使用して前記データ項目を分類するステップ(410、412、414、416、420、422、424、426、427)と、前記データ項目と関連付けられた少なくとも1つの分類プロパティを備える分類プロパティのセットを格納するステップ(430)(432)と、
前記第2のフェーズとは独立している第3のフェーズ(113、225)において、前記分類プロパティのセットに基づいてポリシーを前記データ項目に適用するステップ(407)と
を含むことを特徴とする方法。 - 前記データ項目を分類するために前記データ項目と関連付けられたプロパティを使用するステップは、少なくとも1つの分類子を備える分類子のセットからの分類結果を使用して分類ルールを自動的に適用するステップを含むことを特徴とする請求項9に記載の方法。
- 前記データ項目を分類するために前記データ項目と関連付けられたプロパティを使用するステップは、複数の分類子を呼び出すステップを有し、前記複数の分類子から複数のプロパティのセットを受信するステップと、ポリシーを適用するのに使用される前記分類プロパティのセット内に前記複数のプロパティのセットを集約するステップとをさらに含むことを特徴とする請求項9に記載の方法。
- 前記データ項目を分類するために前記データ項目と関連付けられたプロパティを使用するステップは、分類に使用するためにある分類子から設定されたプロパティを別の分類子に渡すステップを有する事前定義された順序付けにおいて複数の分類子を呼び出すステップを含むことを特徴とする請求項9に記載の方法。
- 前記データ項目を分類するために前記データ項目と関連付けられたプロパティを使用するステップは、前記順序付けにおける後続の分類子が、前記順序付けにおける以前の分類子の前記プロパティのセットを変更できるようにするステップを有する、事前定義された順序付けにおいて複数の分類子を呼び出すステップを含むことを特徴とする請求項9に記載の方法
- コンピュータ実行可能命令(510)を有する1または複数のコンピュータ可読媒体であって、実行される時に
データ項目を発見するステップ(402)と、
前記データ項目と関連付けられたプロパティのプロパティセットを入手するステップ(410、412、414、416)と、
分類子セットの各分類子を呼び出す(420、422、426、427)かどうかを決定し、および呼び出す場合、前記分類子を呼び出すかどうかを決定するステップ(424)と、
任意の分類子によって作り出される任意の変更に基づいて前記プロパティのセットを更新するステップ(430、432)と、
前記プロパティセットに基づいてポリシーを前記データ項目に適用するステップ(407)と
を備えるステップを行うことを特徴とするコンピュータ実行可能命令。 - 任意の分類子によって作り出される任意の変更に基づいて前記プロパティのセットを更新するステップは、前記プロパティのセットを直接更新する分類子を有するステップ、または前記分類子から提供された結果に基づいて前記プロパティセットを更新するルール機構を有するステップを備えることを特徴とする請求項14に記載の1または複数のコンピュータ可読媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/427,755 US20100274750A1 (en) | 2009-04-22 | 2009-04-22 | Data Classification Pipeline Including Automatic Classification Rules |
US12/427,755 | 2009-04-22 | ||
PCT/US2010/031106 WO2010123737A2 (en) | 2009-04-22 | 2010-04-14 | Data classification pipeline including automatic classification rules |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2012524941A true JP2012524941A (ja) | 2012-10-18 |
JP2012524941A5 JP2012524941A5 (ja) | 2013-05-30 |
JP5600345B2 JP5600345B2 (ja) | 2014-10-01 |
Family
ID=42993013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012507264A Expired - Fee Related JP5600345B2 (ja) | 2009-04-22 | 2010-04-14 | 自動分類ルールを含むデータ分類パイプライン |
Country Status (8)
Country | Link |
---|---|
US (1) | US20100274750A1 (ja) |
EP (1) | EP2422279A4 (ja) |
JP (1) | JP5600345B2 (ja) |
KR (1) | KR101668506B1 (ja) |
CN (1) | CN102414677B (ja) |
BR (1) | BRPI1012011A2 (ja) |
RU (1) | RU2544752C2 (ja) |
WO (1) | WO2010123737A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019502998A (ja) * | 2015-12-30 | 2019-01-31 | ベリタス テクノロジーズ エルエルシー | データオブジェクトを効率よく分類するシステム及び方法 |
JP2019194882A (ja) * | 2014-02-19 | 2019-11-07 | スノーフレーク インク. | ファーストクラスデータベース要素としての半構造データの実装 |
Families Citing this family (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8522050B1 (en) * | 2010-07-28 | 2013-08-27 | Symantec Corporation | Systems and methods for securing information in an electronic file |
US9501656B2 (en) * | 2011-04-05 | 2016-11-22 | Microsoft Technology Licensing, Llc | Mapping global policy for resource management to machines |
US9391935B1 (en) * | 2011-12-19 | 2016-07-12 | Veritas Technologies Llc | Techniques for file classification information retention |
WO2013096887A1 (en) | 2011-12-23 | 2013-06-27 | Amiato, Inc. | Scalable analysis platform for semi-structured data |
US10043022B2 (en) * | 2012-03-05 | 2018-08-07 | R.R. Donnelley & Sons Company | Systems and methods for digital content delivery |
US9037587B2 (en) * | 2012-05-10 | 2015-05-19 | International Business Machines Corporation | System and method for the classification of storage |
US20130311881A1 (en) * | 2012-05-16 | 2013-11-21 | Immersion Corporation | Systems and Methods for Haptically Enabled Metadata |
CN103729169B (zh) * | 2012-10-10 | 2017-04-05 | 国际商业机器公司 | 用于确定待迁移文件范围的方法和装置 |
JP6091144B2 (ja) * | 2012-10-10 | 2017-03-08 | キヤノン株式会社 | 画像処理装置及びその制御方法、並びにプログラム |
CN102915373B (zh) * | 2012-11-06 | 2016-08-10 | 无锡江南计算技术研究所 | 一种数据存储方法和装置 |
US10536458B2 (en) | 2012-11-13 | 2020-01-14 | Koninklijke Philips N.V. | Method and apparatus for managing a transaction right |
US20140181112A1 (en) * | 2012-12-26 | 2014-06-26 | Hon Hai Precision Industry Co., Ltd. | Control device and file distribution method |
US9514007B2 (en) | 2013-03-15 | 2016-12-06 | Amazon Technologies, Inc. | Database system with database engine and separate distributed storage service |
US20150120644A1 (en) * | 2013-10-28 | 2015-04-30 | Edge Effect, Inc. | System and method for performing analytics |
CN104090891B (zh) * | 2013-12-12 | 2016-05-04 | 深圳市腾讯计算机系统有限公司 | 数据处理方法、装置及系统 |
CN103745262A (zh) * | 2013-12-30 | 2014-04-23 | 远光软件股份有限公司 | 一种数据归集方法和装置 |
CN103699694B (zh) * | 2014-01-13 | 2017-08-29 | 联想(北京)有限公司 | 一种数据处理方法和装置 |
US9848330B2 (en) * | 2014-04-09 | 2017-12-19 | Microsoft Technology Licensing, Llc | Device policy manager |
US10635645B1 (en) * | 2014-05-04 | 2020-04-28 | Veritas Technologies Llc | Systems and methods for maintaining aggregate tables in databases |
US10025804B2 (en) | 2014-05-04 | 2018-07-17 | Veritas Technologies Llc | Systems and methods for aggregating information-asset metadata from multiple disparate data-management systems |
US9953062B2 (en) | 2014-08-18 | 2018-04-24 | Lexisnexis, A Division Of Reed Elsevier Inc. | Systems and methods for providing for display hierarchical views of content organization nodes associated with captured content and for determining organizational identifiers for captured content |
US10095768B2 (en) * | 2014-11-14 | 2018-10-09 | Veritas Technologies Llc | Systems and methods for aggregating information-asset classifications |
CN104408190B (zh) * | 2014-12-15 | 2018-06-26 | 北京国双科技有限公司 | 基于Spark的数据处理方法及装置 |
US10642941B2 (en) * | 2015-04-09 | 2020-05-05 | International Business Machines Corporation | System and method for pipeline management of artifacts |
US9977912B1 (en) * | 2015-09-21 | 2018-05-22 | EMC IP Holding Company LLC | Processing backup data based on file system authentication |
US10713272B1 (en) | 2016-06-30 | 2020-07-14 | Amazon Technologies, Inc. | Dynamic generation of data catalogs for accessing data |
US20180060822A1 (en) * | 2016-08-31 | 2018-03-01 | Linkedin Corporation | Online and offline systems for job applicant assessment |
US11681942B2 (en) | 2016-10-27 | 2023-06-20 | Dropbox, Inc. | Providing intelligent file name suggestions |
US11151102B2 (en) | 2016-10-28 | 2021-10-19 | Atavium, Inc. | Systems and methods for data management using zero-touch tagging |
US9852377B1 (en) | 2016-11-10 | 2017-12-26 | Dropbox, Inc. | Providing intelligent storage location suggestions |
US11138220B2 (en) | 2016-11-27 | 2021-10-05 | Amazon Technologies, Inc. | Generating data transformation workflows |
US10963479B1 (en) | 2016-11-27 | 2021-03-30 | Amazon Technologies, Inc. | Hosting version controlled extract, transform, load (ETL) code |
US11481408B2 (en) | 2016-11-27 | 2022-10-25 | Amazon Technologies, Inc. | Event driven extract, transform, load (ETL) processing |
US10621210B2 (en) | 2016-11-27 | 2020-04-14 | Amazon Technologies, Inc. | Recognizing unknown data objects |
US11277494B1 (en) | 2016-11-27 | 2022-03-15 | Amazon Technologies, Inc. | Dynamically routing code for executing |
US11036560B1 (en) | 2016-12-20 | 2021-06-15 | Amazon Technologies, Inc. | Determining isolation types for executing code portions |
US10545979B2 (en) | 2016-12-20 | 2020-01-28 | Amazon Technologies, Inc. | Maintaining data lineage to detect data events |
US10824474B1 (en) | 2017-11-14 | 2020-11-03 | Amazon Technologies, Inc. | Dynamically allocating resources for interdependent portions of distributed data processing programs |
US11914571B1 (en) | 2017-11-22 | 2024-02-27 | Amazon Technologies, Inc. | Optimistic concurrency for a multi-writer database |
US10866999B2 (en) | 2017-12-22 | 2020-12-15 | Microsoft Technology Licensing, Llc | Scalable processing of queries for applicant rankings |
US10908940B1 (en) | 2018-02-26 | 2021-02-02 | Amazon Technologies, Inc. | Dynamically managed virtual server system |
US10984122B2 (en) | 2018-04-13 | 2021-04-20 | Sophos Limited | Enterprise document classification |
US11500904B2 (en) | 2018-06-05 | 2022-11-15 | Amazon Technologies, Inc. | Local data classification based on a remote service interface |
US11443058B2 (en) * | 2018-06-05 | 2022-09-13 | Amazon Technologies, Inc. | Processing requests at a remote service to implement local data classification |
US11042532B2 (en) | 2018-08-31 | 2021-06-22 | International Business Machines Corporation | Processing event messages for changed data objects to determine changed data objects to backup |
US10983985B2 (en) | 2018-10-29 | 2021-04-20 | International Business Machines Corporation | Determining a storage pool to store changed data objects indicated in a database |
US11023155B2 (en) | 2018-10-29 | 2021-06-01 | International Business Machines Corporation | Processing event messages for changed data objects to determine a storage pool to store the changed data objects |
KR102185980B1 (ko) * | 2018-10-29 | 2020-12-02 | 주식회사 뉴스젤리 | 테이블 처리 방법 및 장치 |
US11409900B2 (en) | 2018-11-15 | 2022-08-09 | International Business Machines Corporation | Processing event messages for data objects in a message queue to determine data to redact |
US11429674B2 (en) | 2018-11-15 | 2022-08-30 | International Business Machines Corporation | Processing event messages for data objects to determine data to redact from a database |
CN110069570B (zh) * | 2018-11-16 | 2022-04-05 | 北京微播视界科技有限公司 | 数据处理方法和装置 |
US11269911B1 (en) | 2018-11-23 | 2022-03-08 | Amazon Technologies, Inc. | Using specified performance attributes to configure machine learning pipeline stages for an ETL job |
US11113238B2 (en) | 2019-01-25 | 2021-09-07 | International Business Machines Corporation | Methods and systems for metadata tag inheritance between multiple storage systems |
US11030054B2 (en) | 2019-01-25 | 2021-06-08 | International Business Machines Corporation | Methods and systems for data backup based on data classification |
US11914869B2 (en) | 2019-01-25 | 2024-02-27 | International Business Machines Corporation | Methods and systems for encryption based on intelligent data classification |
US11210266B2 (en) | 2019-01-25 | 2021-12-28 | International Business Machines Corporation | Methods and systems for natural language processing of metadata |
US11093448B2 (en) | 2019-01-25 | 2021-08-17 | International Business Machines Corporation | Methods and systems for metadata tag inheritance for data tiering |
US11176000B2 (en) * | 2019-01-25 | 2021-11-16 | International Business Machines Corporation | Methods and systems for custom metadata driven data protection and identification of data |
US11113148B2 (en) | 2019-01-25 | 2021-09-07 | International Business Machines Corporation | Methods and systems for metadata tag inheritance for data backup |
US11100048B2 (en) | 2019-01-25 | 2021-08-24 | International Business Machines Corporation | Methods and systems for metadata tag inheritance between multiple file systems within a storage system |
CN110096519A (zh) * | 2019-04-09 | 2019-08-06 | 北京中科智营科技发展有限公司 | 一种大数据分类规则的优化方法和装置 |
FR3095530B1 (fr) * | 2019-04-23 | 2021-05-07 | Naval Group | Procede de traitement de donnees classifiees, systeme et programme d'ordinateur associes |
RU2749969C1 (ru) * | 2019-12-30 | 2021-06-21 | Александр Владимирович Царёв | Цифровая платформа классификации исходных данных и способы ее работы |
US11341163B1 (en) | 2020-03-30 | 2022-05-24 | Amazon Technologies, Inc. | Multi-level replication filtering for a distributed database |
US11861039B1 (en) * | 2020-09-28 | 2024-01-02 | Amazon Technologies, Inc. | Hierarchical system and method for identifying sensitive content in data |
US11841769B2 (en) * | 2021-08-12 | 2023-12-12 | EMC IP Holding Company LLC | Leveraging asset metadata for policy assignment |
US11841965B2 (en) * | 2021-08-12 | 2023-12-12 | EMC IP Holding Company LLC | Automatically assigning data protection policies using anonymized analytics |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10228486A (ja) * | 1997-02-14 | 1998-08-25 | Nec Corp | 分散ドキュメント分類システム及びプログラムを記録した機械読み取り可能な記録媒体 |
JP2001034617A (ja) * | 1999-07-16 | 2001-02-09 | Ricoh Co Ltd | 情報分析支援装置、情報分析支援方法および記憶媒体 |
JP2006048220A (ja) * | 2004-08-02 | 2006-02-16 | Ricoh Co Ltd | 電子ドキュメントのセキュリティ属性付与方法およびそのプログラム |
JP2006195998A (ja) * | 2005-01-12 | 2006-07-27 | Ricoh Co Ltd | ネットワーク装置上の電子文書を文書保存ポリシーを用いて削除する方法 |
JP2006254140A (ja) * | 2005-03-11 | 2006-09-21 | Mitsubishi Electric Corp | データ記憶装置 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5495603A (en) * | 1993-06-14 | 1996-02-27 | International Business Machines Corporation | Declarative automatic class selection filter for dynamic file reclassification |
US5903884A (en) * | 1995-08-08 | 1999-05-11 | Apple Computer, Inc. | Method for training a statistical classifier with reduced tendency for overfitting |
US20060028689A1 (en) * | 1996-11-12 | 2006-02-09 | Perry Burt W | Document management with embedded data |
US6092059A (en) * | 1996-12-27 | 2000-07-18 | Cognex Corporation | Automatic classifier for real time inspection and classification |
JP3209163B2 (ja) * | 1997-09-19 | 2001-09-17 | 日本電気株式会社 | 分類装置 |
US6161130A (en) * | 1998-06-23 | 2000-12-12 | Microsoft Corporation | Technique which utilizes a probabilistic classifier to detect "junk" e-mail by automatically updating a training and re-training the classifier based on the updated training set |
US7028250B2 (en) * | 2000-05-25 | 2006-04-11 | Kanisa, Inc. | System and method for automatically classifying text |
US6782377B2 (en) * | 2001-03-30 | 2004-08-24 | International Business Machines Corporation | Method for building classifier models for event classes via phased rule induction |
US6892193B2 (en) * | 2001-05-10 | 2005-05-10 | International Business Machines Corporation | Method and apparatus for inducing classifiers for multimedia based on unified representation of features reflecting disparate modalities |
US6898737B2 (en) * | 2001-05-24 | 2005-05-24 | Microsoft Corporation | Automatic classification of event data |
US7043492B1 (en) * | 2001-07-05 | 2006-05-09 | Requisite Technology, Inc. | Automated classification of items using classification mappings |
TW542993B (en) * | 2001-07-12 | 2003-07-21 | Inst Information Industry | Multi-dimension and multi-algorithm document classifying method and system |
WO2003014975A1 (en) * | 2001-08-08 | 2003-02-20 | Quiver, Inc. | Document categorization engine |
US7349917B2 (en) * | 2002-10-01 | 2008-03-25 | Hewlett-Packard Development Company, L.P. | Hierarchical categorization method and system with automatic local selection of classifiers |
US7912820B2 (en) * | 2003-06-06 | 2011-03-22 | Microsoft Corporation | Automatic task generator method and system |
US20080027830A1 (en) * | 2003-11-13 | 2008-01-31 | Eplus Inc. | System and method for creation and maintenance of a rich content or content-centric electronic catalog |
US7165216B2 (en) * | 2004-01-14 | 2007-01-16 | Xerox Corporation | Systems and methods for converting legacy and proprietary documents into extended mark-up language format |
US7139754B2 (en) * | 2004-02-09 | 2006-11-21 | Xerox Corporation | Method for multi-class, multi-label categorization using probabilistic hierarchical modeling |
US20060218110A1 (en) * | 2005-03-28 | 2006-09-28 | Simske Steven J | Method for deploying additional classifiers |
US7849090B2 (en) * | 2005-03-30 | 2010-12-07 | Primal Fusion Inc. | System, method and computer program for faceted classification synthesis |
US7610285B1 (en) * | 2005-09-21 | 2009-10-27 | Stored IQ | System and method for classifying objects |
US7831795B2 (en) * | 2005-11-28 | 2010-11-09 | Commvault Systems, Inc. | Systems and methods for classifying and transferring information in a storage network |
RU61442U1 (ru) * | 2006-03-16 | 2007-02-27 | Открытое акционерное общество "Банк патентованных идей" /Patented Ideas Bank,Ink./ | Система автоматизированного упорядочения неструктурированного информационного потока входных данных |
US7707129B2 (en) * | 2006-03-20 | 2010-04-27 | Microsoft Corporation | Text classification by weighted proximal support vector machine based on positive and negative sample sizes and weights |
US7539658B2 (en) * | 2006-07-06 | 2009-05-26 | International Business Machines Corporation | Rule processing optimization by content routing using decision trees |
US20080027940A1 (en) * | 2006-07-27 | 2008-01-31 | Microsoft Corporation | Automatic data classification of files in a repository |
US7640345B2 (en) * | 2006-09-18 | 2009-12-29 | Emc Corporation | Information management |
US8024304B2 (en) * | 2006-10-26 | 2011-09-20 | Titus, Inc. | Document classification toolbar |
JP5270863B2 (ja) * | 2007-06-12 | 2013-08-21 | キヤノン株式会社 | データ管理装置及び方法 |
US8503797B2 (en) * | 2007-09-05 | 2013-08-06 | The Neat Company, Inc. | Automatic document classification using lexical and physical features |
US20100077001A1 (en) * | 2008-03-27 | 2010-03-25 | Claude Vogel | Search system and method for serendipitous discoveries with faceted full-text classification |
WO2010048758A1 (en) * | 2008-10-31 | 2010-05-06 | Shanghai Hewlett-Packard Co., Ltd | Classification of a document according to a weighted search tree created by genetic algorithms |
US8275726B2 (en) * | 2009-01-16 | 2012-09-25 | Microsoft Corporation | Object classification using taxonomies |
CA2718579C (en) * | 2009-10-22 | 2017-10-03 | National Research Council Of Canada | Text categorization based on co-classification learning from multilingual corpora |
-
2009
- 2009-04-22 US US12/427,755 patent/US20100274750A1/en not_active Abandoned
-
2010
- 2010-04-14 WO PCT/US2010/031106 patent/WO2010123737A2/en active Application Filing
- 2010-04-14 CN CN201080018349.8A patent/CN102414677B/zh not_active Expired - Fee Related
- 2010-04-14 EP EP10767535A patent/EP2422279A4/en not_active Withdrawn
- 2010-04-14 BR BRPI1012011A patent/BRPI1012011A2/pt not_active IP Right Cessation
- 2010-04-14 JP JP2012507264A patent/JP5600345B2/ja not_active Expired - Fee Related
- 2010-04-14 KR KR1020117024712A patent/KR101668506B1/ko active IP Right Grant
- 2010-04-14 RU RU2011142778/08A patent/RU2544752C2/ru not_active IP Right Cessation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10228486A (ja) * | 1997-02-14 | 1998-08-25 | Nec Corp | 分散ドキュメント分類システム及びプログラムを記録した機械読み取り可能な記録媒体 |
JP2001034617A (ja) * | 1999-07-16 | 2001-02-09 | Ricoh Co Ltd | 情報分析支援装置、情報分析支援方法および記憶媒体 |
JP2006048220A (ja) * | 2004-08-02 | 2006-02-16 | Ricoh Co Ltd | 電子ドキュメントのセキュリティ属性付与方法およびそのプログラム |
JP2006195998A (ja) * | 2005-01-12 | 2006-07-27 | Ricoh Co Ltd | ネットワーク装置上の電子文書を文書保存ポリシーを用いて削除する方法 |
JP2006254140A (ja) * | 2005-03-11 | 2006-09-21 | Mitsubishi Electric Corp | データ記憶装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019194882A (ja) * | 2014-02-19 | 2019-11-07 | スノーフレーク インク. | ファーストクラスデータベース要素としての半構造データの実装 |
JP7130600B2 (ja) | 2014-02-19 | 2022-09-05 | スノーフレーク インク. | ファーストクラスデータベース要素としての半構造データの実装 |
JP2019502998A (ja) * | 2015-12-30 | 2019-01-31 | ベリタス テクノロジーズ エルエルシー | データオブジェクトを効率よく分類するシステム及び方法 |
US10706368B2 (en) | 2015-12-30 | 2020-07-07 | Veritas Technologies Llc | Systems and methods for efficiently classifying data objects |
Also Published As
Publication number | Publication date |
---|---|
CN102414677B (zh) | 2016-04-13 |
EP2422279A4 (en) | 2012-09-05 |
KR101668506B1 (ko) | 2016-10-21 |
KR20120030339A (ko) | 2012-03-28 |
EP2422279A2 (en) | 2012-02-29 |
RU2544752C2 (ru) | 2015-03-20 |
RU2011142778A (ru) | 2013-04-27 |
WO2010123737A3 (en) | 2011-01-20 |
CN102414677A (zh) | 2012-04-11 |
US20100274750A1 (en) | 2010-10-28 |
BRPI1012011A2 (pt) | 2016-05-10 |
WO2010123737A2 (en) | 2010-10-28 |
JP5600345B2 (ja) | 2014-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5600345B2 (ja) | 自動分類ルールを含むデータ分類パイプライン | |
JP4222947B2 (ja) | マルチメディア・コンテンツ管理オブジェクトを表現するための方法、プログラム、及びシステム | |
US10417586B2 (en) | Attaching ownership to data | |
KR101219856B1 (ko) | 데이터 프로세싱을 자동화하기 위한 방법 및 시스템 | |
US8521741B1 (en) | Systems and methods for performing integrated searches with actions | |
KR101976220B1 (ko) | 데이터 보강 제안 기법 | |
US11770450B2 (en) | Dynamic routing of file system objects | |
US9043808B2 (en) | State management of operating system and applications | |
US20200387321A1 (en) | System and method for backup data discrimination | |
US20220229657A1 (en) | Extensible resource compliance management | |
US20230401241A1 (en) | System for lightweight objects | |
US8538980B1 (en) | Accessing forms using a metadata registry | |
US10802881B2 (en) | Methods and devices for enabling distributed computers to communicate more effectively in an enterprise requiring flexible approval notifications | |
US9110933B1 (en) | Processing data triggers in an untrusted environment based on information stored in a trusted environment | |
US7475090B2 (en) | Method and apparatus for moving data from an extensible markup language format to normalized format | |
US20090063416A1 (en) | Methods and systems for tagging a variety of applications | |
US9009731B2 (en) | Conversion of lightweight object to a heavyweight object | |
US11874848B2 (en) | Automated dataset placement for application execution | |
US20240070319A1 (en) | Dynamically updating classifier priority of a classifier model in digital data discovery | |
US7987470B1 (en) | Converting heavyweight objects to lightwight objects |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130404 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130404 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20130701 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130718 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131204 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140304 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140401 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140718 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140815 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5600345 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |