JP2019016335A - コンピュータシステムにおけるデータ損失を防止するためのシステム及び方法 - Google Patents
コンピュータシステムにおけるデータ損失を防止するためのシステム及び方法 Download PDFInfo
- Publication number
- JP2019016335A JP2019016335A JP2017177962A JP2017177962A JP2019016335A JP 2019016335 A JP2019016335 A JP 2019016335A JP 2017177962 A JP2017177962 A JP 2017177962A JP 2017177962 A JP2017177962 A JP 2017177962A JP 2019016335 A JP2019016335 A JP 2019016335A
- Authority
- JP
- Japan
- Prior art keywords
- text data
- keywords
- text
- data
- density
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6209—Protecting access to data via a platform, e.g. using keys or access control rules to a single file or object, e.g. in a secure envelope, encrypted and accessed using a key, or with access control rules appended to the object itself
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/02—Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
- H04L63/0227—Filtering policies
- H04L63/0245—Filtering by information in the payload
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/20—Network architectures or network communication protocols for network security for managing network security; network security policies in general
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Bioethics (AREA)
- Computing Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Storage Device Security (AREA)
Abstract
Description
density_score=(Σ(n_i×w_i))/(n_total) (1)
ここで、「i」は見つかったキーワードのインデックス、「n_i」はi番目のキーワードの文字数、「w_i」はi番目のキーワードの重み係数、そして「n_total」はテキスト全体の文字総数を表す。
"102Weight without package: 14.5kg Weight inpackage: 17.5kg Dimensions of package: 740×365×315mm Barcode 5025155006888"
見つけられた銀行カード番号(与えられた例では、740 502515500688)の真正性は、ステップ201において、検索モジュール101によるLuhnアルゴリズムを介してチェックすることができる。この場合、解析モジュール102は、キーワード中の文字数(19文字)と、分析されるテキスト中の文字数(空白を含む110文字)を決定する。次に、解析モジュール102は、ステップ202において、キーワードの密度が0.17に等しい(即ち、19÷110=0.1727)と計算する。キーワードの密度が指定された閾値0.5を下回っているため(0.17<0.50)、分析されたテキストNo.1は、ステップ203〜204において、機密データを含むものとして判定されない。
"Card Holder: John J.
CameronExpirationDate: 1/2016 CVV2: 220 546616015315449519906/14"
Claims (21)
- コンピュータシステムにおけるデータ損失を防止するための方法であって、
検索ステップと、計算ステップと、判定ステップと、遮断ステップとを備え、
前記検索ステップでは、複数のキーワードのテキストデータを検索し前記テキストデータと一致するような1つ又は複数のキーワードを決定し、
前記計算ステップでは、前記テキストデータと一致する前記1つ又は複数のキーワードに基づいて、前記テキストデータ内のキーワードの密度を計算し、
前記判定ステップでは、前記キーワードの密度が閾値との比較に基づいて、前記テキストデータが機密データを含むかどうかを判定し、
前記遮断ステップでは、前記機密データを含むテキストデータの使用をブロックする、
方法。 - 請求項1に記載の方法において、
前記計算ステップでは、
前記一致するキーワードの文字数を決定し、
前記テキストデータの文字総数を決定し、
前記テキストデータ中の前記キーワードの密度を、前記テキストデータの文字総数に対する一致するキーワード内の文字数の比として計算する、
方法。 - 請求項2に記載の方法において、
前記文字総数は、空白文字及び非英数字のうちの少なくとも1つを除外したものである、
方法。 - 請求項1に記載の方法において、
前記計算ステップでは、
一致するキーワードの数を決定し、
前記テキストデータの総単語数を決定し、
前記テキストデータ中のキーワードの密度を、前記テキストデータの単語総数に対する一致するキーワードの数の比として計算する、
方法。 - 請求項1に記載の方法において、
前記テキストデータ中のキーワードの密度は、前記一致する各キーワードに関連する重み付け係数に基づいて計算される、
方法。 - 請求項5に記載の方法において、
第1一致キーワードの前記重み付け係数の値は、前記テキストデータ内の第2一致キーワードの出現回数に依存する、
方法。 - 請求項1に記載の方法において、
前記テキストデータを第1長さの複数のサブテキストに分割し、前記各サブテキストのキーワードのそれぞれの密度を計算する、
方法。 - コンピュータシステムにおけるデータ損失を防止するためのシステムであって、記憶装置と、少なくとも1つのプロセッサとを備え、
前記プロセッサは、検索ステップと、計算ステップと、判定ステップと、遮断ステップとを実行するように構成され、
前記検索ステップでは、複数のキーワードのテキストデータを検索し前記テキストデータと一致するような1つ又は複数のキーワードを決定し、
前記計算ステップでは、前記テキストデータと一致する前記1つ又は複数のキーワードに基づいて、前記テキストデータ内のキーワードの密度を計算し、
前記判定ステップでは、前記キーワードの密度が閾値との比較に基づいて、前記テキストデータが機密データを含むかどうかを判定し、
前記遮断ステップでは、前記機密データを含むテキストデータの使用をブロックする、
システム。 - 請求項8に記載のシステムにおいて、
前記計算ステップでは、
前記一致するキーワードの文字数を決定し、
前記テキストデータの文字総数を決定し、
前記テキストデータ中の前記キーワードの密度を、前記テキストデータの文字総数に対する一致するキーワード内の文字数の比として計算する、
システム。 - 請求項9に記載のシステムにおいて、
前記文字総数は、空白文字及び非英数字のうちの少なくとも1つを除外したものである、
システム。 - 請求項8に記載のシステムにおいて、
前記計算ステップでは、
一致するキーワードの数を決定し、
前記テキストデータの総単語数を決定し、
前記テキストデータ中のキーワードの密度を、前記テキストデータの単語総数に対する一致するキーワードの数の比として計算する、
システム。 - 請求項8に記載のシステムにおいて、
前記テキストデータ中のキーワードの密度は、前記一致する各キーワードに関連する重み付け係数に基づいて計算される、
システム。 - 請求項12に記載のシステムにおいて、
第1一致キーワードの前記重み付け係数の値は、前記テキストデータ内の第2一致キーワードの出現回数に依存する、
システム。 - 請求項8に記載のシステムにおいて、
前記テキストデータを第1長さの複数のサブテキストに分割し、前記各サブテキストのキーワードのそれぞれの密度を計算する、
システム。 - コンピュータシステムにおけるデータ損失を防止するための、コンピュータで実行可能な命令を含む非一時的なコンピュータ可読媒体であって、
前記命令は、検索ステップと、計算ステップと、判定ステップと、遮断ステップとを備え、
前記検索ステップでは、複数のキーワードのテキストデータを検索し前記テキストデータと一致するような1つ又は複数のキーワードを決定し、
前記計算ステップでは、前記テキストデータと一致する前記1つ又は複数のキーワードに基づいて、前記テキストデータ内のキーワードの密度を計算し、
前記判定ステップでは、前記キーワードの密度が閾値との比較に基づいて、前記テキストデータが機密データを含むかどうかを判定し、
前記遮断ステップでは、前記機密データを含むテキストデータの使用をブロックする、
媒体。 - 請求項15に記載の媒体において、
前記計算ステップでは、
前記一致するキーワードの文字数を決定し、
前記テキストデータの文字総数を決定し、
前記テキストデータ中の前記キーワードの密度を、前記テキストデータの文字総数に対する一致するキーワード内の文字数の比として計算する、
媒体。 - 請求項16に記載の媒体において、
前記文字総数は、空白文字及び非英数字のうちの少なくとも1つを除外したものである、
媒体。 - 請求項15に記載の媒体において、
前記計算ステップでは、
一致するキーワードの数を決定し、
前記テキストデータの総単語数を決定し、
前記テキストデータ中のキーワードの密度を、前記テキストデータの単語総数に対する一致するキーワードの数の比として計算する、
媒体。 - 請求項15に記載の媒体において、
前記テキストデータ中のキーワードの密度は、前記一致する各キーワードに関連する重み付け係数に基づいて計算される、
媒体。 - 請求項19に記載の媒体において、
第1一致キーワードの前記重み付け係数の値は、前記テキストデータ内の第2一致キーワードの出現回数に依存する、
媒体。 - 請求項15に記載の媒体において、
前記テキストデータを第1長さの複数のサブテキストに分割し、前記各サブテキストのキーワードのそれぞれの密度を計算する、
媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/642,659 US11042659B2 (en) | 2017-07-06 | 2017-07-06 | System and method of determining text containing confidential data |
US15/642,659 | 2017-07-06 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019016335A true JP2019016335A (ja) | 2019-01-31 |
JP6777612B2 JP6777612B2 (ja) | 2020-10-28 |
Family
ID=60161942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017177962A Active JP6777612B2 (ja) | 2017-07-06 | 2017-09-15 | コンピュータシステムにおけるデータ損失を防止するためのシステム及び方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11042659B2 (ja) |
EP (1) | EP3425549B1 (ja) |
JP (1) | JP6777612B2 (ja) |
CN (1) | CN109213850B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10853509B2 (en) * | 2018-08-24 | 2020-12-01 | Bank Of America Corporation | Error detection of data leakage in a data processing system |
US11016934B2 (en) * | 2019-02-14 | 2021-05-25 | International Business Machines Corporation | Automated content-based and context-based file organizational structuring |
US11995038B2 (en) * | 2021-11-17 | 2024-05-28 | VMware LLC | Data criticality-based network policy creation and consumption |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06259424A (ja) * | 1993-03-02 | 1994-09-16 | Ricoh Co Ltd | 文書表示装置及び文書要約装置並びにディジタル複写装置 |
JPH10269235A (ja) * | 1997-03-25 | 1998-10-09 | Toshiba Corp | 類似文書検索装置及び類似文書検索方法 |
JP2008226133A (ja) * | 2007-03-15 | 2008-09-25 | Hitachi Software Eng Co Ltd | 個人情報管理システム |
JP2010198157A (ja) * | 2009-02-24 | 2010-09-09 | Internatl Business Mach Corp <Ibm> | 文書の機密度判定を支援する方法、装置及びコンピュータプログラム |
JP2011014010A (ja) * | 2009-07-03 | 2011-01-20 | Nec Corp | 情報アセスメントシステム、情報アセスメント方法及びプログラム |
JP2015215758A (ja) * | 2014-05-09 | 2015-12-03 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 機密情報に応じた表示を行う装置、システム、方法およびプログラム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8849716B1 (en) * | 2001-04-20 | 2014-09-30 | Jpmorgan Chase Bank, N.A. | System and method for preventing identity theft or misuse by restricting access |
US7467202B2 (en) | 2003-09-10 | 2008-12-16 | Fidelis Security Systems | High-performance network content analysis platform |
JP2005285038A (ja) * | 2004-03-31 | 2005-10-13 | Nec Corp | 携帯電話機、そのメッセージ作成方法及びプログラム |
US7966376B2 (en) * | 2004-08-26 | 2011-06-21 | International Business Machines Corporation | Preventing the capture of chat session text |
JP4640591B2 (ja) * | 2005-06-09 | 2011-03-02 | 富士ゼロックス株式会社 | 文書検索装置 |
US7792858B2 (en) * | 2005-12-21 | 2010-09-07 | Ebay Inc. | Computer-implemented method and system for combining keywords into logical clusters that share similar behavior with respect to a considered dimension |
US20070150342A1 (en) * | 2005-12-22 | 2007-06-28 | Law Justin M | Dynamic selection of blended content from multiple media sources |
US8127149B1 (en) * | 2006-06-29 | 2012-02-28 | Symantec Corporation | Method and apparatus for content based encryption |
WO2010011179A1 (en) | 2008-07-25 | 2010-01-28 | Resolvo Systems Pte Ltd | System and method for preventing leakage of sensitive digital information on a digital communication network |
US9569528B2 (en) * | 2008-10-03 | 2017-02-14 | Ab Initio Technology Llc | Detection of confidential information |
US8533579B2 (en) * | 2009-10-21 | 2013-09-10 | Symantec Corporation | Data loss detection method for handling fuzziness in sensitive keywords |
US9203623B1 (en) * | 2009-12-18 | 2015-12-01 | Trend Micro Incorporated | Apparatus and methods for keyword proximity matching |
US8544104B2 (en) * | 2010-05-10 | 2013-09-24 | International Business Machines Corporation | Enforcement of data privacy to maintain obfuscation of certain data |
US8856157B2 (en) * | 2011-08-23 | 2014-10-07 | Business Objects Software Limited | Automatic detection of columns to be obfuscated in database schemas |
US9152811B2 (en) * | 2012-03-12 | 2015-10-06 | International Business Machines Corporation | Transparent real-time access to encrypted non-relational data |
US9275017B2 (en) * | 2013-05-06 | 2016-03-01 | The Speed Reading Group, Chamber Of Commerce Number: 60482605 | Methods, systems, and media for guiding user reading on a screen |
KR101541306B1 (ko) * | 2013-11-11 | 2015-08-04 | 주식회사 엘지씨엔에스 | 컴퓨터 실행 가능한 중요 키워드 추출 방법, 이를 수행하는 중요 키워드 추출 서버 및 이를 저장하는 기록매체 |
US9501654B1 (en) * | 2015-11-19 | 2016-11-22 | International Business Machines Corporation | Sensitive data obfuscation in output files |
-
2017
- 2017-07-06 US US15/642,659 patent/US11042659B2/en active Active
- 2017-09-15 JP JP2017177962A patent/JP6777612B2/ja active Active
- 2017-09-21 CN CN201710860000.2A patent/CN109213850B/zh active Active
- 2017-10-13 EP EP17196479.4A patent/EP3425549B1/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06259424A (ja) * | 1993-03-02 | 1994-09-16 | Ricoh Co Ltd | 文書表示装置及び文書要約装置並びにディジタル複写装置 |
JPH10269235A (ja) * | 1997-03-25 | 1998-10-09 | Toshiba Corp | 類似文書検索装置及び類似文書検索方法 |
JP2008226133A (ja) * | 2007-03-15 | 2008-09-25 | Hitachi Software Eng Co Ltd | 個人情報管理システム |
JP2010198157A (ja) * | 2009-02-24 | 2010-09-09 | Internatl Business Mach Corp <Ibm> | 文書の機密度判定を支援する方法、装置及びコンピュータプログラム |
JP2011014010A (ja) * | 2009-07-03 | 2011-01-20 | Nec Corp | 情報アセスメントシステム、情報アセスメント方法及びプログラム |
JP2015215758A (ja) * | 2014-05-09 | 2015-12-03 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 機密情報に応じた表示を行う装置、システム、方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN109213850A (zh) | 2019-01-15 |
US20190012476A1 (en) | 2019-01-10 |
EP3425549A1 (en) | 2019-01-09 |
CN109213850B (zh) | 2022-01-28 |
EP3425549B1 (en) | 2020-08-26 |
JP6777612B2 (ja) | 2020-10-28 |
US11042659B2 (en) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6736532B2 (ja) | 静的分析の要素を用いた悪質なファイルを検出するためのシステム及び方法 | |
EP3899770B1 (en) | System and method for detecting data anomalies by analysing morphologies of known and/or unknown cybersecurity threats | |
US8037145B2 (en) | System and method for detecting email content containment | |
JP5378452B2 (ja) | パターンマッチング方法及びシステム | |
US10878087B2 (en) | System and method for detecting malicious files using two-stage file classification | |
JP6828335B2 (ja) | 検索プログラム、検索装置および検索方法 | |
US20090319506A1 (en) | System and method for efficiently finding email similarity in an email repository | |
CN111869176B (zh) | 用于恶意软件签名生成的系统和方法 | |
JP6777612B2 (ja) | コンピュータシステムにおけるデータ損失を防止するためのシステム及び方法 | |
US20220004621A1 (en) | Data recovery through reversal of hash values using probabilistic data structures | |
CN113157854A (zh) | Api的敏感数据泄露检测方法及系统 | |
KR102289395B1 (ko) | 자카드 모델 기반의 문서 검색 장치 및 방법 | |
CN116451072A (zh) | 结构化敏感数据识别方法及装置 | |
CN115660073A (zh) | 基于和声鲸鱼优化算法的入侵检测方法和系统 | |
KR102255600B1 (ko) | Gan을 이용한 문서형 악성코드 탐지 장치 및 방법 | |
CN108256327A (zh) | 一种文件检测方法及装置 | |
Maghsoudimehrabani et al. | Proactive detection of query-based adversarial scenarios in NLP systems | |
JP7259932B2 (ja) | 仮説検証装置、仮説検証方法、及びプログラム | |
RU2665915C1 (ru) | Система и способ определения текста, содержащего конфиденциальные данные | |
CN115563288B (zh) | 一种文本检测的方法、装置、电子设备及存储介质 | |
KR102471731B1 (ko) | 사용자를 위한 네트워크 보안 관리 방법 | |
EP3588349A1 (en) | System and method for detecting malicious files using two-stage file classification | |
EP2234349B1 (en) | System and method for detecting email content containment | |
CN115470492A (zh) | 账户异常检测方法、装置、电子设备及存储介质 | |
JP5893474B2 (ja) | 検索式妥当性判断装置、特許検索装置、検索式妥当性判断方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181120 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190730 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20190807 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20190906 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201008 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6777612 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |