JP2013239159A - 電子文書を分類する方法、コンピュータ・プログラムおよびコンピュータ・システム - Google Patents
電子文書を分類する方法、コンピュータ・プログラムおよびコンピュータ・システム Download PDFInfo
- Publication number
- JP2013239159A JP2013239159A JP2013088418A JP2013088418A JP2013239159A JP 2013239159 A JP2013239159 A JP 2013239159A JP 2013088418 A JP2013088418 A JP 2013088418A JP 2013088418 A JP2013088418 A JP 2013088418A JP 2013239159 A JP2013239159 A JP 2013239159A
- Authority
- JP
- Japan
- Prior art keywords
- electronic document
- score
- program
- computer
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】コンピュータが、語句のグループを含む電子文書を受け取る。コンピュータは、語句のグループから特定語句を抽出する情報抽出プログラムへ電子文書を送る。電子辞書内の属性値のうちの1つと或る程度一致する各特定語句が識別される。一致する特定語句と、電子文書にアクセスしようとしているエンド・ユーザとに基づき、電子文書に関連する値が生成される。
【選択図】図1
Description
105 クライアント・コンピュータ
110 アプリケーション・プログラム
115 サーバ・コンピュータ
112 ネットワーク
120 文書リポジトリ
125 クエリ・ハンドラ
130 文書機密性計算プログラム
135a、135b、135c、135d、135e、135f、135g 電子辞書
140 情報抽出プログラム
145 エンティティ構成プログラム
150 マスタ・データ管理(MDM)システム
152 アクセス制御リスト
155 データベース・エンティティ・テーブル
160 機密文書ハンドラ・プログラム
800a、800b 内部コンポーネント
900a、900b 外部コンポーネント
Claims (18)
- 電子文書に関連する値を生成するための、コンピュータで実装される方法であって、
電子文書を受け取るステップと、
前記電子文書にアクセスしようとしているエンド・ユーザを識別するデータを受け取るステップと、
スコアと、前記電子文書内の語句とを関連付けるステップと、
前記関連付けられたスコアに基づき、前記電子文書に関連する値を生成するステップであって、前記値は、前記エンド・ユーザに特有である、前記ステップと、
を含む方法。 - 前記スコアと、前記電子文書内の前記語句とを関連付ける前記ステップは、電子辞書を生成することを含む、請求項1に記載の方法。
- 前記スコアと、前記電子文書内の前記語句とを関連付ける前記ステップは、前記電子文書を情報抽出プログラムへ送ることをさらに含む、請求項2に記載の方法。
- 前記スコアと、前記電子文書内の前記語句とを関連付ける前記ステップは、前記電子辞書内の属性値と或る程度一致する語句を判断することをさらに含む、請求項2に記載の方法。
- 前記電子文書に関連する前記値を生成する前記ステップは、前記関連付けられたスコアに対して計算を実行して前記値を得ることを含む、請求項1に記載の方法。
- 前記電子文書に関連する前記値は、データ・セキュリティを目的として前記電子文書を分類するために利用される、請求項1に記載の方法。
- 電子文書に関連する値を生成するためのコンピュータ・プログラムであって、
電子文書を受け取るプログラム命令と、
前記電子文書にアクセスしようとしているエンド・ユーザを識別するデータを受け取るプログラム命令と、
スコアと、前記電子文書内の語句とを関連付けるプログラム命令と、
前記関連付けられたスコアに基づき、前記電子文書に関連する値を生成するプログラム命令であって、前記値は、前記エンド・ユーザに特有である、前記プログラム命令と、
を含む、コンピュータ・プログラム。 - 前記スコアと、前記電子文書内の前記語句とを関連付ける前記プログラム命令は、電子辞書を生成することを含む、請求項7に記載のコンピュータ・プログラム。
- 前記スコアと、前記電子文書内の前記語句とを関連付ける前記プログラム命令は、前記電子文書を情報抽出プログラムへ送ることをさらに含む、請求項8に記載のコンピュータ・プログラム。
- 前記スコアと、前記電子文書内の前記語句とを関連付ける前記プログラム命令は、前記電子辞書内の属性値と或る程度一致する語句を判断することをさらに含む、請求項8に記載のコンピュータ・プログラム。
- 前記電子文書に関連する前記値を生成する前記プログラム命令は、前記関連付けられたスコアに対して計算を実行して前記値を得ることを含む、請求項7に記載のコンピュータ・プログラム。
- 前記電子文書に関連する前記値は、データ・セキュリティを目的として前記電子文書を分類するために利用される、請求項7に記載のコンピュータ・プログラム。
- 電子文書に関連する値を生成するためのコンピュータ・システムであって、
1つ以上のプロセッサと、1つ以上のコンピュータ可読メモリと、1つ以上のコンピュータ可読記憶媒体と、前記1つ以上のコンピュータ可読メモリを経由して前記1つ以上のプロセッサによって実行されるよう、前記1つ以上のコンピュータ可読記憶媒体上に記憶されたプログラム命令と、
を含むコンピュータ・システムであって、前記プログラム命令は、
電子文書を受け取るプログラム命令と、
前記電子文書にアクセスしようとしているエンド・ユーザを識別するデータを受け取るプログラム命令と、
スコアと、前記電子文書内の語句とを関連付けるプログラム命令と、
前記関連付けられたスコアに基づき、前記電子文書に関連する値を生成するプログラム命令であって、前記値は、前記エンド・ユーザに特有である、前記プログラム命令と、
を含む、コンピュータ・システム。 - 前記スコアと、前記電子文書内の前記語句とを関連付ける前記プログラム命令は、電子辞書を生成することを含む、請求項13に記載のコンピュータ・システム。
- 前記スコアと、前記電子文書内の前記語句とを関連付ける前記プログラム命令は、前記電子文書を情報抽出プログラムへ送ることをさらに含む、請求項14に記載のコンピュータ・システム。
- 前記スコアと、前記電子文書内の前記語句とを関連付ける前記プログラム命令は、前記電子辞書内の属性値と或る程度一致する語句を判断することをさらに含む、請求項14に記載のコンピュータ・システム。
- 前記電子文書に関連する前記値を生成する前記プログラム命令は、前記関連付けられたスコアに対して計算を実行して前記値を得ることを含む、請求項13に記載のコンピュータ・システム。
- 前記電子文書に関連する前記値は、データ・セキュリティを目的として前記電子文書を分類するために利用される、請求項13に記載のコンピュータ・システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/471971 | 2012-05-15 | ||
US13/471,971 US8875302B2 (en) | 2012-05-15 | 2012-05-15 | Classification of an electronic document |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013239159A true JP2013239159A (ja) | 2013-11-28 |
JP6265622B2 JP6265622B2 (ja) | 2018-01-24 |
Family
ID=49582449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013088418A Expired - Fee Related JP6265622B2 (ja) | 2012-05-15 | 2013-04-19 | 電子文書を分類する方法、コンピュータ・プログラムおよびコンピュータ・システム |
Country Status (3)
Country | Link |
---|---|
US (2) | US8875302B2 (ja) |
JP (1) | JP6265622B2 (ja) |
CN (1) | CN103425730A (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101473452B1 (ko) * | 2013-09-04 | 2014-12-18 | 주식회사 마크애니 | 기업 내부 정보 보안을 강화하기 위한 방법, 시스템 및 장치 |
US9177174B1 (en) * | 2014-02-06 | 2015-11-03 | Google Inc. | Systems and methods for protecting sensitive data in communications |
US10997671B2 (en) | 2014-10-30 | 2021-05-04 | Intuit Inc. | Methods, systems and computer program products for collaborative tax return preparation |
US10223542B2 (en) * | 2014-12-10 | 2019-03-05 | International Business Machines Corporation | Intelligent database with secure tables |
US10482544B2 (en) * | 2016-01-28 | 2019-11-19 | Intuit Inc. | Methods, systems and computer program products for masking tax data during collaborative tax return preparation |
CN107203542A (zh) * | 2016-03-17 | 2017-09-26 | 阿里巴巴集团控股有限公司 | 词组提取方法及装置 |
CN107515879B (zh) * | 2016-06-16 | 2021-03-19 | 伊姆西Ip控股有限责任公司 | 用于文档检索的方法和电子设备 |
US11921765B2 (en) | 2017-02-24 | 2024-03-05 | Red Hat, Inc. | Systematic iterative analysis of unstructured data files |
US10915657B2 (en) * | 2017-07-19 | 2021-02-09 | AVAST Software s.r.o. | Identifying and protecting personal sensitive documents |
US11438413B2 (en) * | 2019-04-29 | 2022-09-06 | EMC IP Holding Company LLC | Intelligent data storage and management for cloud computing |
US11017171B2 (en) * | 2019-06-06 | 2021-05-25 | International Business Machines Corporation | Relevancy as an indicator for determining document quality |
US20220114189A1 (en) * | 2020-10-14 | 2022-04-14 | International Business Machines Corporation | Extraction of structured information from unstructured documents |
US11734445B2 (en) * | 2020-12-02 | 2023-08-22 | International Business Machines Corporation | Document access control based on document component layouts |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007148921A (ja) * | 2005-11-29 | 2007-06-14 | Canon Marketing Japan Inc | 電子帳票管理装置及び電子帳票のセキュリティレベル設定方法 |
JP2007150466A (ja) * | 2005-11-24 | 2007-06-14 | Oki Electric Ind Co Ltd | 携帯端末およびデータ復号化システム |
WO2007122914A1 (ja) * | 2006-04-04 | 2007-11-01 | Panasonic Corporation | 個人情報管理装置 |
JP2010134586A (ja) * | 2008-12-03 | 2010-06-17 | Fuji Xerox Co Ltd | 情報処理装置及びプログラム |
JP2011014010A (ja) * | 2009-07-03 | 2011-01-20 | Nec Corp | 情報アセスメントシステム、情報アセスメント方法及びプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7428701B1 (en) | 1998-12-18 | 2008-09-23 | Appligent Inc. | Method, system and computer program for redaction of material from documents |
US6175830B1 (en) * | 1999-05-20 | 2001-01-16 | Evresearch, Ltd. | Information management, retrieval and display system and associated method |
US7483891B2 (en) * | 2004-01-09 | 2009-01-27 | Yahoo, Inc. | Content presentation and management system associating base content and relevant additional content |
US20060075228A1 (en) * | 2004-06-22 | 2006-04-06 | Black Alistair D | Method and apparatus for recognition and real time protection from view of sensitive terms in documents |
EP2116952A4 (en) | 2007-02-28 | 2015-04-08 | Nec Corp | INFORMATION PROCESSOR WITH LOCKING FUNCTION, LOCKING (RELEASE) METHOD FOR AN INFORMATION PROCESSOR AND PROGRAM THEREFOR |
US7934249B2 (en) | 2007-08-27 | 2011-04-26 | Oracle International Corporation | Sensitivity-enabled access control model |
US7831571B2 (en) | 2007-10-25 | 2010-11-09 | International Business Machines Corporation | Anonymizing selected content in a document |
US8321398B2 (en) * | 2009-07-01 | 2012-11-27 | Thomson Reuters (Markets) Llc | Method and system for determining relevance of terms in text documents |
US9038168B2 (en) | 2009-11-20 | 2015-05-19 | Microsoft Technology Licensing, Llc | Controlling resource access based on resource properties |
-
2012
- 2012-05-15 US US13/471,971 patent/US8875302B2/en active Active
-
2013
- 2013-04-19 JP JP2013088418A patent/JP6265622B2/ja not_active Expired - Fee Related
- 2013-05-15 CN CN2013101790667A patent/CN103425730A/zh active Pending
- 2013-05-28 US US13/903,095 patent/US8863301B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007150466A (ja) * | 2005-11-24 | 2007-06-14 | Oki Electric Ind Co Ltd | 携帯端末およびデータ復号化システム |
JP2007148921A (ja) * | 2005-11-29 | 2007-06-14 | Canon Marketing Japan Inc | 電子帳票管理装置及び電子帳票のセキュリティレベル設定方法 |
WO2007122914A1 (ja) * | 2006-04-04 | 2007-11-01 | Panasonic Corporation | 個人情報管理装置 |
JP2010134586A (ja) * | 2008-12-03 | 2010-06-17 | Fuji Xerox Co Ltd | 情報処理装置及びプログラム |
JP2011014010A (ja) * | 2009-07-03 | 2011-01-20 | Nec Corp | 情報アセスメントシステム、情報アセスメント方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20130312105A1 (en) | 2013-11-21 |
US8863301B2 (en) | 2014-10-14 |
JP6265622B2 (ja) | 2018-01-24 |
US20130312107A1 (en) | 2013-11-21 |
CN103425730A (zh) | 2013-12-04 |
US8875302B2 (en) | 2014-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6265622B2 (ja) | 電子文書を分類する方法、コンピュータ・プログラムおよびコンピュータ・システム | |
US8893288B2 (en) | Prevention of information leakage from a document based on dynamic database label based access control (LBAC) policies | |
Satvat et al. | Extractor: Extracting attack behavior from threat reports | |
US8346532B2 (en) | Managing the creation, detection, and maintenance of sensitive information | |
US9892278B2 (en) | Focused personal identifying information redaction | |
US20050038788A1 (en) | Annotation security to prevent the divulgence of sensitive information | |
US20210004485A1 (en) | Cognitive Iterative Minimization of Personally Identifiable Information in Electronic Documents | |
Cardinal | Clinical records anonymisation and text extraction (CRATE): an open-source software system | |
US9667644B2 (en) | Risk identification | |
US20220100899A1 (en) | Protecting sensitive data in documents | |
US11947704B2 (en) | Tagging and auditing sensitive information in a database environment | |
US8326833B2 (en) | Implementing metadata extraction of artifacts from associated collaborative discussions | |
US10552781B2 (en) | Task transformation responsive to confidentiality assessments | |
US20230409744A1 (en) | Privacy protection for regulated computing environments | |
US20240028650A1 (en) | Method, apparatus, and computer-readable medium for determining a data domain associated with data | |
US20140090049A1 (en) | Context-based database security | |
Kanwal et al. | Formal verification and complexity analysis of confidentiality aware textual clinical documents framework | |
US11537708B1 (en) | Password semantic analysis pipeline | |
Echenim et al. | Ensuring privacy policy compliance of wearables with iot regulations | |
US20210357410A1 (en) | Method for managing data of digital documents | |
Maeda et al. | Fast text anonymization using k-anonyminity | |
Deshpande et al. | The Mask of ZoRRo: preventing information leakage from documents | |
CN114626084A (zh) | 用于控制对数据的访问的安全智能容器 | |
US20240119170A1 (en) | Machine learning (ml) model pipeline with obfuscation to protect sensitive data therein | |
EP3864558A1 (en) | Method for managing data of digital documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160412 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170330 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170630 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6265622 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |