JP6077472B2 - 機械学習を行うためのユーザインターフェース及びワークフロー - Google Patents
機械学習を行うためのユーザインターフェース及びワークフロー Download PDFInfo
- Publication number
- JP6077472B2 JP6077472B2 JP2013556831A JP2013556831A JP6077472B2 JP 6077472 B2 JP6077472 B2 JP 6077472B2 JP 2013556831 A JP2013556831 A JP 2013556831A JP 2013556831 A JP2013556831 A JP 2013556831A JP 6077472 B2 JP6077472 B2 JP 6077472B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- data set
- training data
- user interface
- profile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010801 machine learning Methods 0.000 title claims description 106
- 238000012549 training Methods 0.000 claims description 112
- 238000000034 method Methods 0.000 claims description 56
- 238000013442 quality metrics Methods 0.000 claims description 34
- 230000004044 response Effects 0.000 claims description 22
- 238000013145 classification model Methods 0.000 claims description 19
- 238000001514 detection method Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 18
- 230000002265 prevention Effects 0.000 claims description 13
- 230000035945 sensitivity Effects 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 9
- 239000013598 vector Substances 0.000 description 21
- 239000003795 chemical substances by application Substances 0.000 description 16
- 238000010586 diagram Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 230000009471 action Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 238000007639 printing Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- KJLPSBMDOIVXSN-UHFFFAOYSA-N 4-[4-[2-[4-(3,4-dicarboxyphenoxy)phenyl]propan-2-yl]phenoxy]phthalic acid Chemical compound C=1C=C(OC=2C=C(C(C(O)=O)=CC=2)C(O)=O)C=CC=1C(C)(C)C(C=C1)=CC=C1OC1=CC=C(C(O)=O)C(C(O)=O)=C1 KJLPSBMDOIVXSN-UHFFFAOYSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6209—Protecting access to data via a platform, e.g. using keys or access control rules to a single file or object, e.g. in a secure envelope, encrypted and accessed using a key, or with access control rules appended to the object itself
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2101—Auditing as a secondary aspect
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2107—File encryption
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2141—Access rights, e.g. capability lists, access control lists, access tables, access matrices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2147—Locking files
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/20—Network architectures or network communication protocols for network security for managing network security; network security policies in general
Description
Claims (23)
- 機密データについての複数の陽性例及び機密データについての複数の陰性例を含むトレーニングデータセットを、ユーザインターフェースを介して、受信するステップと、
機械学習を用いて前記トレーニングデータセットを分析して、機械学習ベースド検出(machine learning-based detection (MLD))プロファイルをトレーニングするステップであって、前記MLDプロファイルは新たなデータを機密データ又は非機密データとして分類するのに用いられる、ステップと、
前記ユーザインターフェースにおいて、前記MLDプロファイルについてのクオリティーメトリックを表示するステップと
前記クオリティーメトリックがクオリティー閾値を充足しなかった場合には:
ユーザ入力に応答して前記トレーニングデータセットを変更するステップと、
前記変更されたトレーニングデータセットを分析して前記MLDプロファイルを再トレーニングするステップと
を行うステップと
を備える方法。 - 前記トレーニングデータセットを分析するステップは:
前記トレーニングデータセットについて特徴抽出を行って前記陽性例の特徴及び前記陰性例の特徴を備える特徴セットを生成するステップと、
前記トレーニングデータセットから分類モデルを生成するステップと、
前記クオリティーメトリックを算出するステップであって、前記クオリティーメトリックは偽陽性レーティング、偽陰性レーティング又はメモリ利用レーティングの少なくとも1つを含む、ステップと
を備える、請求項1に記載の方法。 - 前記トレーニングデータセットを分析する前に前記ユーザインターフェースを介してメモリ割り当てに関してのユーザ選択を受信するステップであって、データのカテゴリゼーションについての前記メモリ利用レーティングは前記メモリ割り当てに準拠する、ステップ、をさらに備える請求項2に記載の方法。
- 前記偽陽性レーティングが偽陽性閾値内である及び前記偽陰性レーティングが偽陰性閾値内である場合、展開操作を可能とするステップと、
前記展開操作を行うためのユーザ要求を前記ユーザインターフェースを介して受信するステップと、
前記ユーザ要求を受信したことに応答して、前記MLDプロファイルをDLPシステムのデータロスプリベンション(DLP)ポリシーに追加するステップと
をさらに備える請求項2に記載の方法。 - 前記トレーニングデータセットから、偽陽性を起こしたデータ及び偽陰性を起こしたデータの少なくとも1つを、前記ユーザインターフェースにて特定するステップ、をさらに備える請求項2に記載の方法。
- 機密データについての前記陽性例及び機密データについての前記陰性例に関してのカテゴリゼーション情報を受信するステップと、
前記トレーニングデータセットに追加すべきデータのカテゴリを前記ユーザインターフェースにて特定して前記クオリティーメトリックを向上させるステップと
をさらに備える請求項1に記載の方法。 - 前記MLDプロファイルについての新たなクオリティーメトリックを前記ユーザインターフェースに表示するステップ
をさらに備える請求項1に記載の方法。 - 前記トレーニングデータセットはDLPシステムのデータロスプリベンション(DLP)ポリシーにより収集されたものであり、機密データについての前記複数の陰性例は前記DLPポリシーにより機密ドキュメントとして誤分類されたドキュメントを含み、
前記MLDプロファイルを前記DLPポリシーへ展開するステップ
をさらに備える請求項1に記載の方法。 - 前記MLDプロファイルのための感度閾値についての選択を、前記ユーザインターフェースを介して受信するステップと、
前記選択に基づいて前記MLDプロファイルのための感度閾値設定を制御するステップと
をさらに備える請求項1に記載の方法。 - 命令を含むコンピュータ可読媒体であって、前記命令が処理装置により実行されると、
機密データについての複数の陽性例及び機密データについての複数の陰性例を含むトレーニングデータセットを、ユーザインターフェースを介して、受信するステップと、
機械学習を用いて前記トレーニングデータセットを分析して、機械学習ベースド検出(MLD)プロファイルをトレーニングするステップであって、前記MLDプロファイルは新たなデータを機密データ又は非機密データとして分類するのに用いられる、ステップと、
前記ユーザインターフェースにおいて、前記MLDプロファイルについてのクオリティーメトリックを表示するステップと
前記クオリティーメトリックがクオリティー閾値を充足しなかった場合には:
ユーザ入力に応答して前記トレーニングデータセットを変更するステップと、
前記変更されたトレーニングデータセットを分析して前記MLDプロファイルを再トレーニングするステップと
を行うステップと
を備える方法を前記処理装置に行わせる、コンピュータ可読媒体。 - 前記トレーニングデータセットを分析するステップは:
前記トレーニングデータセットについて特徴抽出を行って前記陽性例の特徴及び前記陰性例の特徴を備える特徴セットを生成するステップと、
前記トレーニングデータセットから分類モデルを生成するステップと、
前記クオリティーメトリックを算出するステップであって、前記クオリティーメトリックは偽陽性レーティング、偽陰性レーティング又はメモリ利用レーティングの少なくとも1つを含む、ステップと
を備える、請求項10に記載のコンピュータ可読媒体。 - 前記方法は:
前記トレーニングデータセットを分析する前に前記ユーザインターフェースを介してメモリ割り当てに関してのユーザ選択を受信するステップであって、データのカテゴリゼーションについての前記メモリ利用レーティングは前記メモリ割り当てに準拠する、ステップ
をさらに備える、請求項11に記載のコンピュータ可読媒体。 - 前記方法は:
前記偽陽性レーティングが偽陽性閾値内である及び前記偽陰性レーティングが偽陰性閾値内である場合、展開操作を可能とするステップと、
前記展開操作を行うためのユーザ要求を前記ユーザインターフェースを介して受信するステップと、
前記ユーザ要求を受信したことに応答して、前記MLDプロファイルをDLPシステムのデータロスプリベンション(DLP)ポリシーに追加するステップと
をさらに備える、請求項11に記載のコンピュータ可読媒体。 - 前記方法は:
前記トレーニングデータセットから、偽陽性を起こしたデータ及び偽陰性を起こしたデータの少なくとも1つを、前記ユーザインターフェースにて特定するステップ、
をさらに備える、請求項11に記載のコンピュータ可読媒体。 - 前記方法は:
機密データについての前記陽性例及び機密データについての前記陰性例に関してのカテゴリゼーション情報を受信するステップと、
前記トレーニングデータセットに追加すべきデータのカテゴリを前記ユーザインターフェースにて特定して前記クオリティーメトリックを向上させるステップと
をさらに備える、請求項10に記載のコンピュータ可読媒体。 - 前記方法は:
前記MLDプロファイルについての新たなクオリティーメトリックを前記ユーザインターフェースに表示するステップ
をさらに備える、請求項10に記載のコンピュータ可読媒体。 - 前記トレーニングデータセットはDLPシステムのデータロスプリベンション(DLP)ポリシーにより収集されたものであり、機密データについての前記複数の陰性例は前記DLPポリシーにより機密ドキュメントとして誤分類されたドキュメントを含み、前記方法は:
前記MLDプロファイルを前記DLPポリシーへ展開するステップ
をさらに備える、請求項10に記載のコンピュータ可読媒体。 - 前記方法は:
前記MLDプロファイルのための感度閾値についての選択を、前記ユーザインターフェースを介して受信するステップと、
前記選択に基づいて前記MLDプロファイルのための感度閾値設定を制御するステップと
をさらに備える、請求項10に記載のコンピュータ可読媒体。 - コンピューティング装置であって、
機械学習マネージャのための命令を格納するためのメモリと
前記命令を実行するための処理装置と
を備える、コンピューティング装置であって、
前記命令は前記処理装置に:
前記機械学習マネージャのためのユーザインターフェースを提供させ、
機密データについての複数の陽性例及び機密データについての複数の陰性例を含むトレーニングデータセットを、前記ユーザインターフェースを介して、受信させ、
機械学習を用いて前記トレーニングデータセットを分析させて、新たなデータを機密データ又は非機密データとして分類するのに用いられる機械学習ベースド検出(MLD)プロファイルをトレーニングさせ、
前記ユーザインターフェースにおいて、前記MLDプロファイルについてのクオリティーメトリックを表示させ、
前記クオリティーメトリックがクオリティー閾値を充足しなかった場合には:
ユーザ入力に応答して前記トレーニングデータセットを変更することと、
前記変更されたトレーニングデータセットを分析して前記MLDプロファイルを再トレーニングすることと
を行わせる
命令である、コンピューティング装置。 - 前記トレーニングデータセットを分析することは:
前記トレーニングデータセットについて特徴抽出を行って前記陽性例の特徴及び前記陰性例の特徴を備える特徴セットを生成することと、
前記トレーニングデータセットから分類モデルを生成することと、
前記クオリティーメトリックを算出することであって、前記クオリティーメトリックは偽陽性レーティング、偽陰性レーティング又はメモリ利用レーティングの少なくとも1つを含む、算出することと
を備える、請求項19に記載のコンピューティング装置。 - 前記命令は、前記処理装置にさらに:
前記トレーニングデータセットから、偽陽性を起こしたデータ及び偽陰性を起こしたデータの少なくとも1つを、前記ユーザインターフェースにて特定させる、
請求項20に記載のコンピューティング装置。 - 前記トレーニングデータセットはDLPシステムのデータロスプリベンション(DLP)ポリシーにより収集されたものであり、機密データについての前記複数の陰性例は前記DLPポリシーにより機密ドキュメントとして誤分類されたドキュメントを含み、
前記MLDプロファイルを前記DLPポリシーへ展開させる命令をさらに備える、請求項19に記載のコンピューティング装置。 - 前記MLDプロファイルのための感度閾値についての選択を、前記ユーザインターフェースを介して受信させ、
前記選択に基づいて前記MLDプロファイルのための感度閾値設定を制御させる
命令をさらに備える請求項19に記載のコンピューティング装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/038,299 | 2011-03-01 | ||
US13/038,299 US8682814B2 (en) | 2010-12-14 | 2011-03-01 | User interface and workflow for performing machine learning |
PCT/US2012/027158 WO2012118905A1 (en) | 2011-03-01 | 2012-02-29 | User interface and workflow for performing machine learning |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2014511536A JP2014511536A (ja) | 2014-05-15 |
JP2014511536A5 JP2014511536A5 (ja) | 2016-09-15 |
JP6077472B2 true JP6077472B2 (ja) | 2017-02-08 |
Family
ID=46200362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013556831A Active JP6077472B2 (ja) | 2011-03-01 | 2012-02-29 | 機械学習を行うためのユーザインターフェース及びワークフロー |
Country Status (7)
Country | Link |
---|---|
US (2) | US8682814B2 (ja) |
EP (1) | EP2681669B1 (ja) |
JP (1) | JP6077472B2 (ja) |
CN (1) | CN103620581B (ja) |
AU (1) | AU2012223360B2 (ja) |
CA (1) | CA2828744C (ja) |
WO (1) | WO2012118905A1 (ja) |
Families Citing this family (108)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8983170B2 (en) * | 2008-01-18 | 2015-03-17 | Mitek Systems, Inc. | Systems and methods for developing and verifying image processing standards for mobile deposit |
US9292737B2 (en) | 2008-01-18 | 2016-03-22 | Mitek Systems, Inc. | Systems and methods for classifying payment documents during mobile image processing |
US9842331B2 (en) | 2008-01-18 | 2017-12-12 | Mitek Systems, Inc. | Systems and methods for mobile image capture and processing of checks |
US10685223B2 (en) | 2008-01-18 | 2020-06-16 | Mitek Systems, Inc. | Systems and methods for mobile image capture and content processing of driver's licenses |
US8862522B1 (en) | 2010-12-14 | 2014-10-14 | Symantec Corporation | Incremental machine learning for data loss prevention |
US9015082B1 (en) | 2010-12-14 | 2015-04-21 | Symantec Corporation | Data quality assessment for vector machine learning |
US8682814B2 (en) | 2010-12-14 | 2014-03-25 | Symantec Corporation | User interface and workflow for performing machine learning |
US9094291B1 (en) | 2010-12-14 | 2015-07-28 | Symantec Corporation | Partial risk score calculation for a data object |
US8510446B1 (en) * | 2011-03-15 | 2013-08-13 | Symantec Corporation | Dynamically populating an identity-correlation data store |
US8763072B2 (en) | 2011-05-09 | 2014-06-24 | Symantec Corporation | Preventing inappropriate data transfers based on reputation scores |
US8666916B2 (en) | 2011-07-07 | 2014-03-04 | Yahoo! Inc. | Method for summarizing event-related texts to answer search queries |
KR20130114417A (ko) * | 2012-04-09 | 2013-10-17 | 한국전자통신연구원 | 훈련 함수 생성 장치, 훈련 함수 생성 방법 및 그것을 이용한 특징 벡터 분류 방법 |
US8448260B1 (en) * | 2012-05-25 | 2013-05-21 | Robert Hansen | Electronic clipboard protection |
US9501744B1 (en) | 2012-06-11 | 2016-11-22 | Dell Software Inc. | System and method for classifying data |
US9578060B1 (en) * | 2012-06-11 | 2017-02-21 | Dell Software Inc. | System and method for data loss prevention across heterogeneous communications platforms |
US9779260B1 (en) | 2012-06-11 | 2017-10-03 | Dell Software Inc. | Aggregation and classification of secure data |
US9390240B1 (en) | 2012-06-11 | 2016-07-12 | Dell Software Inc. | System and method for querying data |
US20140108307A1 (en) * | 2012-10-12 | 2014-04-17 | Wipro Limited | Methods and systems for providing personalized and context-aware suggestions |
US9348899B2 (en) * | 2012-10-31 | 2016-05-24 | Open Text Corporation | Auto-classification system and method with dynamic user feedback |
US9122679B1 (en) * | 2012-12-28 | 2015-09-01 | Symantec Corporation | Method and system for information retrieval effectiveness estimation in e-discovery |
US9536139B2 (en) | 2013-03-15 | 2017-01-03 | Mitek Systems, Inc. | Systems and methods for assessing standards for mobile image quality |
US9246944B1 (en) * | 2013-05-28 | 2016-01-26 | Symantec Corporation | Systems and methods for enforcing data loss prevention policies on mobile devices |
US10346616B2 (en) * | 2013-07-15 | 2019-07-09 | General Electric Company | Systems and methods for data loss prevention |
US9256826B2 (en) * | 2013-08-14 | 2016-02-09 | Adobe Systems Incorporated | Predicting reactions to short-text posts |
US20220012346A1 (en) * | 2013-09-13 | 2022-01-13 | Vmware, Inc. | Risk assessment for managed client devices |
US20150244743A1 (en) * | 2014-02-21 | 2015-08-27 | Airwatch Llc | Risk assessment for managed client devices |
US9910724B2 (en) | 2013-09-13 | 2018-03-06 | Airwatch Llc | Fast and accurate identification of message-based API calls in application binaries |
CN103973708B (zh) * | 2014-05-26 | 2018-09-07 | 中电长城网际系统应用有限公司 | 一种外泄事件的确定方法和系统 |
US9349016B1 (en) | 2014-06-06 | 2016-05-24 | Dell Software Inc. | System and method for user-context-based data loss prevention |
US10318882B2 (en) | 2014-09-11 | 2019-06-11 | Amazon Technologies, Inc. | Optimized training of linear machine learning models |
US11100420B2 (en) | 2014-06-30 | 2021-08-24 | Amazon Technologies, Inc. | Input processing for machine learning |
US10452992B2 (en) | 2014-06-30 | 2019-10-22 | Amazon Technologies, Inc. | Interactive interfaces for machine learning model evaluations |
US10540606B2 (en) | 2014-06-30 | 2020-01-21 | Amazon Technologies, Inc. | Consistent filtering of machine learning data |
US9672474B2 (en) | 2014-06-30 | 2017-06-06 | Amazon Technologies, Inc. | Concurrent binning of machine learning data |
US10339465B2 (en) | 2014-06-30 | 2019-07-02 | Amazon Technologies, Inc. | Optimized decision tree based models |
US10169715B2 (en) | 2014-06-30 | 2019-01-01 | Amazon Technologies, Inc. | Feature processing tradeoff management |
US10963810B2 (en) | 2014-06-30 | 2021-03-30 | Amazon Technologies, Inc. | Efficient duplicate detection for machine learning data sets |
US10102480B2 (en) | 2014-06-30 | 2018-10-16 | Amazon Technologies, Inc. | Machine learning service |
US9886670B2 (en) | 2014-06-30 | 2018-02-06 | Amazon Technologies, Inc. | Feature processing recipes for machine learning |
US11182691B1 (en) | 2014-08-14 | 2021-11-23 | Amazon Technologies, Inc. | Category-based sampling of machine learning data |
US9691025B2 (en) * | 2014-09-16 | 2017-06-27 | Caterpillar Inc. | Machine operation classifier |
US10210463B2 (en) * | 2014-12-05 | 2019-02-19 | Microsoft Technology Licensing, Llc | Quick path to train, score, and operationalize a machine learning project |
US10068185B2 (en) * | 2014-12-07 | 2018-09-04 | Microsoft Technology Licensing, Llc | Error-driven feature ideation in machine learning |
US10217171B2 (en) * | 2014-12-15 | 2019-02-26 | Hartford Fire Insurance Company | System to administer insurance knowledge management tool |
US10326748B1 (en) | 2015-02-25 | 2019-06-18 | Quest Software Inc. | Systems and methods for event-based authentication |
US10417613B1 (en) | 2015-03-17 | 2019-09-17 | Quest Software Inc. | Systems and methods of patternizing logged user-initiated events for scheduling functions |
US10127234B1 (en) | 2015-03-27 | 2018-11-13 | Amazon Technologies, Inc. | Proactive optimizations at multi-tier file systems |
US9990506B1 (en) | 2015-03-30 | 2018-06-05 | Quest Software Inc. | Systems and methods of securing network-accessible peripheral devices |
US9842220B1 (en) | 2015-04-10 | 2017-12-12 | Dell Software Inc. | Systems and methods of secure self-service access to content |
US9641555B1 (en) | 2015-04-10 | 2017-05-02 | Dell Software Inc. | Systems and methods of tracking content-exposure events |
US9563782B1 (en) | 2015-04-10 | 2017-02-07 | Dell Software Inc. | Systems and methods of secure self-service access to content |
US9569626B1 (en) | 2015-04-10 | 2017-02-14 | Dell Software Inc. | Systems and methods of reporting content-exposure events |
US9842218B1 (en) | 2015-04-10 | 2017-12-12 | Dell Software Inc. | Systems and methods of secure self-service access to content |
US10540608B1 (en) | 2015-05-22 | 2020-01-21 | Amazon Technologies, Inc. | Dynamically scaled training fleets for machine learning |
US10536352B1 (en) | 2015-08-05 | 2020-01-14 | Quest Software Inc. | Systems and methods for tuning cross-platform data collection |
US9443192B1 (en) | 2015-08-30 | 2016-09-13 | Jasmin Cosic | Universal artificial intelligence engine for autonomous computing devices and software applications |
US9699205B2 (en) | 2015-08-31 | 2017-07-04 | Splunk Inc. | Network security system |
CN105184403B (zh) * | 2015-09-01 | 2018-09-28 | 华东师范大学 | 基于机器学习和统计模型检验的工作流最优配置寻优方法 |
US10664777B2 (en) * | 2015-09-11 | 2020-05-26 | Workfusion, Inc. | Automated recommendations for task automation |
US10079835B1 (en) * | 2015-09-28 | 2018-09-18 | Symantec Corporation | Systems and methods for data loss prevention of unidentifiable and unsupported object types |
ES2696751T3 (es) * | 2015-09-29 | 2019-01-17 | Siemens Ag | Transmisión de datos de un objeto, encriptada de diferentes modos |
US10157358B1 (en) | 2015-10-05 | 2018-12-18 | Quest Software Inc. | Systems and methods for multi-stream performance patternization and interval-based prediction |
US10218588B1 (en) | 2015-10-05 | 2019-02-26 | Quest Software Inc. | Systems and methods for multi-stream performance patternization and optimization of virtual meetings |
US10366053B1 (en) | 2015-11-24 | 2019-07-30 | Amazon Technologies, Inc. | Consistent randomized record-level splitting of machine learning data |
US10394532B2 (en) * | 2015-12-22 | 2019-08-27 | Opera Solutions U.S.A., Llc | System and method for rapid development and deployment of reusable analytic code for use in computerized data modeling and analysis |
US20170185898A1 (en) * | 2015-12-26 | 2017-06-29 | Arnab Paul | Technologies for distributed machine learning |
US10713589B1 (en) | 2016-03-03 | 2020-07-14 | Amazon Technologies, Inc. | Consistent sort-based record-level shuffling of machine learning data |
US10142391B1 (en) | 2016-03-25 | 2018-11-27 | Quest Software Inc. | Systems and methods of diagnosing down-layer performance problems via multi-stream performance patternization |
US10778707B1 (en) | 2016-05-12 | 2020-09-15 | Amazon Technologies, Inc. | Outlier detection for streaming data using locality sensitive hashing |
US10726356B1 (en) | 2016-08-01 | 2020-07-28 | Amazon Technologies, Inc. | Target variable distribution-based acceptance of machine learning test data sets |
US9864933B1 (en) | 2016-08-23 | 2018-01-09 | Jasmin Cosic | Artificially intelligent systems, devices, and methods for learning and/or using visual surrounding for autonomous object operation |
US10789150B2 (en) * | 2016-10-07 | 2020-09-29 | Sap Portals Israel Ltd. | Static analysis rules and training data repositories |
US10452974B1 (en) | 2016-11-02 | 2019-10-22 | Jasmin Cosic | Artificially intelligent systems, devices, and methods for learning and/or using a device's circumstances for autonomous device operation |
US20180165604A1 (en) * | 2016-12-09 | 2018-06-14 | U2 Science Labs A Montana | Systems and methods for automating data science machine learning analytical workflows |
US10607134B1 (en) | 2016-12-19 | 2020-03-31 | Jasmin Cosic | Artificially intelligent systems, devices, and methods for learning and/or using an avatar's circumstances for autonomous avatar operation |
US11777963B2 (en) * | 2017-02-24 | 2023-10-03 | LogRhythm Inc. | Analytics for processing information system data |
US10410014B2 (en) | 2017-03-23 | 2019-09-10 | Microsoft Technology Licensing, Llc | Configurable annotations for privacy-sensitive user content |
JP6880891B2 (ja) * | 2017-03-23 | 2021-06-02 | 日本電気株式会社 | マルウェア判定方法、マルウェア判定装置及びマルウェア判定プログラム |
AU2018200877A1 (en) * | 2017-03-30 | 2018-10-18 | Accenture Global Solutions Limited | Closed loop nodal analysis |
US20210142221A1 (en) * | 2017-05-08 | 2021-05-13 | British Telecommunications Public Limited Company | Autonomous logic modules |
US10462208B2 (en) | 2017-07-11 | 2019-10-29 | Bank Of America Corporation | File transfer system with dynamic file exchange control functions |
RU2672394C1 (ru) | 2017-07-26 | 2018-11-14 | Общество С Ограниченной Ответственностью "Яндекс" | Способы и системы для оценки обучающих объектов посредством алгоритма машинного обучения |
US10614233B2 (en) * | 2017-07-27 | 2020-04-07 | International Business Machines Corporation | Managing access to documents with a file monitor |
US11138517B2 (en) * | 2017-08-11 | 2021-10-05 | Google Llc | On-device machine learning platform |
US11250433B2 (en) | 2017-11-02 | 2022-02-15 | Microsoft Technologly Licensing, LLC | Using semi-supervised label procreation to train a risk determination model |
US10102449B1 (en) | 2017-11-21 | 2018-10-16 | Jasmin Cosic | Devices, systems, and methods for use in automation |
US10474934B1 (en) | 2017-11-26 | 2019-11-12 | Jasmin Cosic | Machine learning for computing enabled systems and/or devices |
US10402731B1 (en) | 2017-12-15 | 2019-09-03 | Jasmin Cosic | Machine learning for computer generated objects and/or applications |
CN108664801B (zh) * | 2018-03-15 | 2020-07-10 | 北京明朝万达科技股份有限公司 | 一种结合机器学习的数据防泄漏策略动态更新方法及装置 |
US11238366B2 (en) | 2018-05-10 | 2022-02-01 | International Business Machines Corporation | Adaptive object modeling and differential data ingestion for machine learning |
US20190354718A1 (en) * | 2018-05-16 | 2019-11-21 | Microsoft Technology Licensing, Llc. | Identification of sensitive data using machine learning |
US11443058B2 (en) * | 2018-06-05 | 2022-09-13 | Amazon Technologies, Inc. | Processing requests at a remote service to implement local data classification |
US11500904B2 (en) | 2018-06-05 | 2022-11-15 | Amazon Technologies, Inc. | Local data classification based on a remote service interface |
CN108960433B (zh) * | 2018-06-26 | 2022-04-05 | 第四范式(北京)技术有限公司 | 用于运行机器学习建模过程的方法及系统 |
CN109284631A (zh) * | 2018-10-26 | 2019-01-29 | 中国电子科技网络信息安全有限公司 | 一种基于大数据的文档脱敏系统及方法 |
JP7263074B2 (ja) * | 2019-03-22 | 2023-04-24 | キヤノン株式会社 | 情報処理装置、及びその制御方法、プログラム、記憶媒体 |
US10915658B1 (en) | 2019-07-16 | 2021-02-09 | Capital One Services, Llc | System, method, and computer-accessible medium for training models on mixed sensitivity datasets |
US20210103808A1 (en) * | 2019-10-08 | 2021-04-08 | InteliSecure | Automatic triaging of network events |
CN111143882A (zh) * | 2019-12-31 | 2020-05-12 | 杭州依图医疗技术有限公司 | 一种信息处理方法及装置 |
US11620673B1 (en) | 2020-01-21 | 2023-04-04 | Deepintent, Inc. | Interactive estimates of media delivery and user interactions based on secure merges of de-identified records |
US11475155B1 (en) | 2020-01-21 | 2022-10-18 | Deepintent, Inc. | Utilizing a protected server environment to protect data used to train a machine learning system |
US11755848B1 (en) * | 2020-05-14 | 2023-09-12 | Wells Fargo Bank, N.A. | Processing structured and unstructured text to identify sensitive information |
US11861470B2 (en) | 2020-08-13 | 2024-01-02 | State Farm Mutual Automobile Insurance Company | Simplistic machine learning model generation tool for predictive data analytics |
US11829516B1 (en) * | 2020-09-30 | 2023-11-28 | Amazon Technologies, Inc. | Automated actions for application policy violations |
KR102632607B1 (ko) * | 2020-10-22 | 2024-02-02 | 주식회사 마음에이아이 | 서비스 생성 방법 |
CN112702339A (zh) * | 2020-12-23 | 2021-04-23 | 中移(杭州)信息技术有限公司 | 基于深度迁移学习的异常流量监测与分析方法和装置 |
US11870757B1 (en) | 2021-04-14 | 2024-01-09 | Wells Fargo Bank, N.A. | Protecting customer personal information in application pipeline |
WO2023009905A1 (en) * | 2021-07-29 | 2023-02-02 | Google Llc | Determining available memory on a mobile platform |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4132229B2 (ja) * | 1998-06-03 | 2008-08-13 | 株式会社ルネサステクノロジ | 欠陥分類方法 |
US9311499B2 (en) * | 2000-11-13 | 2016-04-12 | Ron M. Redlich | Data security system and with territorial, geographic and triggering event protocol |
US20040034612A1 (en) * | 2002-03-22 | 2004-02-19 | Nick Mathewson | Support vector machines for prediction and classification in supply chain management and other applications |
US20040133574A1 (en) * | 2003-01-07 | 2004-07-08 | Science Applications International Corporaton | Vector space method for secure information sharing |
US7480640B1 (en) * | 2003-12-16 | 2009-01-20 | Quantum Leap Research, Inc. | Automated method and system for generating models from data |
US7499897B2 (en) * | 2004-04-16 | 2009-03-03 | Fortelligent, Inc. | Predictive model variable management |
US7484065B2 (en) * | 2004-04-20 | 2009-01-27 | Hewlett-Packard Development Company, L.P. | Selective memory allocation |
US8272064B2 (en) * | 2005-11-16 | 2012-09-18 | The Boeing Company | Automated rule generation for a secure downgrader |
US20070300306A1 (en) * | 2006-06-21 | 2007-12-27 | Basit Hussain | Method and system for providing granular data access control for server-client applications |
US8256006B2 (en) * | 2006-11-09 | 2012-08-28 | Touchnet Information Systems, Inc. | System and method for providing identity theft security |
US8160977B2 (en) | 2006-12-11 | 2012-04-17 | Poulin Christian D | Collaborative predictive model building |
US7908234B2 (en) * | 2008-02-15 | 2011-03-15 | Yahoo! Inc. | Systems and methods of predicting resource usefulness using universal resource locators including counting the number of times URL features occur in training data |
US9082080B2 (en) * | 2008-03-05 | 2015-07-14 | Kofax, Inc. | Systems and methods for organizing data sets |
EP2112803B1 (en) * | 2008-04-22 | 2013-12-18 | Alcatel Lucent | Attack protection for a packet-based network |
US8423483B2 (en) * | 2008-05-16 | 2013-04-16 | Carnegie Mellon University | User-controllable learning of policies |
US8214364B2 (en) * | 2008-05-21 | 2012-07-03 | International Business Machines Corporation | Modeling user access to computer resources |
US20090293121A1 (en) * | 2008-05-21 | 2009-11-26 | Bigus Joseph P | Deviation detection of usage patterns of computer resources |
CN100585617C (zh) * | 2008-07-04 | 2010-01-27 | 西安电子科技大学 | 基于分类器集成的人脸识别系统及其方法 |
US8051187B2 (en) * | 2008-12-22 | 2011-11-01 | Check Point Software Technologies Ltd. | Methods for automatic categorization of internal and external communication for preventing data loss |
US8613040B2 (en) * | 2008-12-22 | 2013-12-17 | Symantec Corporation | Adaptive data loss prevention policies |
JP5213758B2 (ja) * | 2009-02-26 | 2013-06-19 | 三菱電機株式会社 | 情報処理装置及び情報処理方法及びプログラム |
US8286253B1 (en) * | 2009-11-23 | 2012-10-09 | Trend Micro Incorporated | Data leakage prevention for resource limited device |
US9311495B2 (en) * | 2010-12-09 | 2016-04-12 | International Business Machines Corporation | Method and apparatus for associating data loss protection (DLP) policies with endpoints |
US8682814B2 (en) | 2010-12-14 | 2014-03-25 | Symantec Corporation | User interface and workflow for performing machine learning |
US8626682B2 (en) | 2011-02-22 | 2014-01-07 | Thomson Reuters Global Resources | Automatic data cleaning for machine learning classifiers |
-
2011
- 2011-03-01 US US13/038,299 patent/US8682814B2/en active Active
-
2012
- 2012-02-29 CA CA2828744A patent/CA2828744C/en active Active
- 2012-02-29 CN CN201280021230.5A patent/CN103620581B/zh active Active
- 2012-02-29 WO PCT/US2012/027158 patent/WO2012118905A1/en unknown
- 2012-02-29 EP EP12751808.2A patent/EP2681669B1/en active Active
- 2012-02-29 JP JP2013556831A patent/JP6077472B2/ja active Active
- 2012-02-29 AU AU2012223360A patent/AU2012223360B2/en not_active Ceased
-
2014
- 2014-02-19 US US14/184,581 patent/US9177261B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014511536A (ja) | 2014-05-15 |
EP2681669A1 (en) | 2014-01-08 |
CN103620581A (zh) | 2014-03-05 |
CN103620581B (zh) | 2017-06-06 |
CA2828744C (en) | 2020-08-25 |
EP2681669A4 (en) | 2014-08-13 |
AU2012223360A1 (en) | 2013-09-19 |
CA2828744A1 (en) | 2012-09-07 |
US9177261B2 (en) | 2015-11-03 |
EP2681669B1 (en) | 2020-08-05 |
US20140172760A1 (en) | 2014-06-19 |
AU2012223360B2 (en) | 2017-04-06 |
US8682814B2 (en) | 2014-03-25 |
WO2012118905A1 (en) | 2012-09-07 |
US20120150773A1 (en) | 2012-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6077472B2 (ja) | 機械学習を行うためのユーザインターフェース及びワークフロー | |
US9691027B1 (en) | Confidence level threshold selection assistance for a data loss prevention system using machine learning | |
US8862522B1 (en) | Incremental machine learning for data loss prevention | |
US9015082B1 (en) | Data quality assessment for vector machine learning | |
US11106789B2 (en) | Dynamic cybersecurity detection of sequence anomalies | |
US8844059B1 (en) | Method and apparatus for preventing data loss through screen capture | |
US7991747B1 (en) | System and method for managing data loss due to policy violations in temporary files | |
US10503906B2 (en) | Determining a risk indicator based on classifying documents using a classifier | |
US8949371B1 (en) | Time and space efficient method and system for detecting structured data in free text | |
Russo et al. | Summarizing vulnerabilities’ descriptions to support experts during vulnerability assessment activities | |
US8627403B1 (en) | Policy applicability determination | |
CN112602081A (zh) | 利用警报置信度分配来增强网络安全和操作监控 | |
US20160202972A1 (en) | System and method for checking open source usage | |
Jiang et al. | Recommending new features from mobile app descriptions | |
Ebrahimi et al. | Mobile app privacy in software engineering research: A systematic mapping study | |
US20090259622A1 (en) | Classification of Data Based on Previously Classified Data | |
US20100228730A1 (en) | Inferring sensitive information from tags | |
Feiz et al. | Understanding screen relationships from screenshots of smartphone applications | |
Alzhrani et al. | Automated big text security classification | |
KR102263111B1 (ko) | 데이터 보안 관리 방법 및 이를 수행하기 위한 프로그램을 기록한 기록 매체 | |
Joun et al. | Relevance analysis using revision identifier in MS word | |
Esteva et al. | Data mining for “big archives” analysis: A case study | |
Sharma et al. | Bug Report Triaging Using Textual, Categorical and Contextual Features Using Latent Dirichlet Allocation | |
CN116894018A (zh) | 事件数据处理 | |
CN111177737A (zh) | 一种基于数据内容的数据加密方法以及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160426 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20160725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170112 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6077472 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |