JP7017531B2 - リスク判定装置、リスク判定方法及びリスク判定プログラム - Google Patents
リスク判定装置、リスク判定方法及びリスク判定プログラム Download PDFInfo
- Publication number
- JP7017531B2 JP7017531B2 JP2019022609A JP2019022609A JP7017531B2 JP 7017531 B2 JP7017531 B2 JP 7017531B2 JP 2019022609 A JP2019022609 A JP 2019022609A JP 2019022609 A JP2019022609 A JP 2019022609A JP 7017531 B2 JP7017531 B2 JP 7017531B2
- Authority
- JP
- Japan
- Prior art keywords
- document data
- input
- data
- attribute
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、文書データの匿名化に関して、文書中の単語の出現頻度等から、個人を特定するための情報量を算出し、リスクを評価する手法が提案されている(例えば、非特許文献1及び2参照)。
本実施形態では、文書データとして、例えば、学校の事故レポート等、同種の文書が多数蓄積され公開されるものを想定している。これらの文書データは、管理機関のデータベースに登録する際に、人名又は地名等の個人を特定されるリスクのある語句が匿名化又は削除されることが望まれる。
また、本実施形態のリスク判定方法では、文書データの登録時に加えて、登録された文書データの公開前にも同様のリスク判定が実施され、公開情報の匿名化が行われる。
文書管理システム1は、リスク判定装置としての管理サーバ10と、文書データベース(DB)20と、ユーザ端末30とを備える。文書データベース20は、管理サーバ10に配置されてもよいし、通信接続された外部のデータベース管理装置に配置されてもよい。複数のユーザ端末30は、ネットワークを介して管理サーバ10と通信接続されている。
管理サーバ10は、要求に応じて、文書データベース20に蓄積されている文書データを公開する。
管理サーバ10は、管理機関にて運用管理される情報処理装置である。記憶部に格納されたソフトウェア(リスク判定プログラム)を制御部が実行することにより、制御部は、本実施形態の各種機能部として動作する。
具体的には、管理サーバ10は、各種機能部として、入力部11と、取得部12と、抽出部13と、出力部14と、格納部15と、匿名化部16とを備える。
また、入力部11は、文書データベース20に既に格納されている文書データ及び属性データを、入力文書データ及び入力属性データとして受け付けてもよい。
ここで、属性の選択は、ユーザにより行われてよい。あるいは、取得部12は、文書データを分類する上での影響度の大きさに基づいて、属性を選択してもよい。具体的には、例えば、主成分分析等の既存の手法が適用可能である。
また、取得部12は、修正前の入力文書データと、実際に文書データベース20に格納された修正後の入力文書データとで、異なる属性を選択し抽出部13へ提供してもよい。
この画面例は、新たに入力される報告書(文書データ)に付随して、複数の属性名と値(内容)とがユーザにより入力される。なお、属性の値は、直接入力されてもよいし、プルダウンリスト等から選択入力されてもよい。
また、各属性には、検索対象のチェックボックスが設けられ、ユーザは、取得部12が取得する文書データの属性を選択してもよい。
ここで、リスクの度合いは、例えばTF-IDF等の語句の重要度を評価する指標に基づいて算出されてよい。これにより、入力文書データ内でのみ頻出する語句、すなわち文書を特徴付ける語句は、リスクが高いと判定される。
この画面例では、入力フォームに文書データが入力された後、評価開始ボタンが押下されると、抽出部13により抽出されたリスクの高い語句について、フォント、サイズ、色、飾り等を変更したリスク判定結果が表示される。
また、リスク判定結果の総合評価として、例えば、リスクが最大の語句の評価値又はリスクの合計値等に基づいて、危険度が出力されてもよい。
修正データは、例えば、格納されている入力文書データ内の語句と、匿名化のために置換する語句又は墨塗り用の記号等とを対応付けたデータであり、匿名化前の入力文書データを公開する際に、この修正データに基づいて対象の語句が置換される。
また、匿名化部16は、入力文書データから抽出部13により抽出された語句を匿名化し、文書データベース20に格納されている入力文書データを更新してもよい。
このリスク判定処理では、ユーザが入力した文書データに含まれるリスクの高い語句を提示することで、文書データの修正を促し、修正後の文書データを文書データベース20に格納する。
このリスク判定処理では、文書データベース20に格納済みの文書データから、リスクの高い語句を抽出し、自動で匿名化の処理を施す。
これにより、管理サーバ10は、リスク評価のための母集団を適切に選択できるので、入力文書データから、プライバシに関するリスクのある語句を精度良く抽出できる。
さらに、管理サーバ10は、抽出した語句をユーザに提示することにより、ユーザが文書データを入力する時点でリスクを容易に把握し語句を修正できるので、文書データベース20に格納する前にリスクを低減できる。
これにより、管理サーバ10は、適切な属性を用いて、リスク評価のための母集団となる文書データを取得できるので、リスクの高い語句を精度良く抽出できる。
これにより、管理サーバ10は、文書データの登録時だけでなく、登録後に再度リスクを判定し、文書データの公開前に匿名化を実施できる。
これにより、管理サーバ10は、複数の異なる視点から文書データのリスクを判定し、適切な匿名化を実施できる。
10 管理サーバ(リスク判定装置)
11 入力部
12 取得部
13 抽出部
14 出力部
15 格納部
16 匿名化部
20 文書データベース
30 ユーザ端末
Claims (7)
- 公開対象の文書データ及び当該文書データを分類する属性データを対応付けて格納したデータベースと接続され、
新たに前記文書データ及び当該文書データを分類するための前記属性データを、入力文書データ及び入力属性データとして受け付ける入力部と、
前記入力属性データのうち、選択された属性の値が一致又は類似する前記文書データを前記データベースから取得する取得部と、
前記入力文書データに含まれる語句のうち、当該入力文書データ及び前記取得部により取得された前記文書データの中での出現頻度に基づいて、プライバシに関するリスクが基準を超える語句を抽出する抽出部と、
前記抽出部により抽出された語句を出力する出力部と、を備えるリスク判定装置。 - 前記取得部は、前記文書データを分類する上での影響度の大きさに基づいて、前記属性を選択する請求項1に記載のリスク判定装置。
- 前記入力部は、前記データベースに格納されている前記文書データ及び前記属性データを、前記入力文書データ及び前記入力属性データとして受け付け、
前記入力文書データから前記抽出部により抽出された語句を匿名化するための修正データを生成し、当該修正データを、前記入力文書データに対応付けて前記データベースに格納する匿名化部を備える請求項1又は請求項2に記載のリスク判定装置。 - 前記入力部は、前記データベースに格納されている前記文書データ及び前記属性データを、前記入力文書データ及び前記入力属性データとして受け付け、
前記入力文書データから前記抽出部により抽出された語句を匿名化し、前記データベースに格納されている前記入力文書データを更新する匿名化部を備える請求項1又は請求項2に記載のリスク判定装置。 - 前記入力部が新たに受け付けた前記入力文書データの修正入力を受け付け、前記入力属性データと対応付けて前記データベースに格納する格納部を備え、
前記取得部は、修正前の前記入力文書データと、前記データベースに格納された修正後の入力文書データとで、異なる前記属性を選択し前記抽出部へ提供する請求項3又は請求項4に記載のリスク判定装置。 - 公開対象の文書データ及び当該文書データを分類する属性データを対応付けて格納したデータベースと接続されたコンピュータが、
新たに前記文書データ及び当該文書データを分類するための前記属性データを、入力文書データ及び入力属性データとして受け付ける入力ステップと、
前記入力属性データのうち、選択された属性の値が一致又は類似する前記文書データを前記データベースから取得する取得ステップと、
前記入力文書データに含まれる語句のうち、当該入力文書データ及び前記取得ステップにおいて取得された前記文書データの中での出現頻度に基づいて、プライバシに関するリスクが基準を超える語句を抽出する抽出ステップと、
前記抽出ステップにおいて抽出された語句を出力する出力ステップと、を実行するリスク判定方法。 - 公開対象の文書データ及び当該文書データを分類する属性データを対応付けて格納したデータベースと接続されたコンピュータに、
新たに前記文書データ及び当該文書データを分類するための前記属性データを、入力文書データ及び入力属性データとして受け付ける入力ステップと、
前記入力属性データのうち、選択された属性の値が一致又は類似する前記文書データを前記データベースから取得する取得ステップと、
前記入力文書データに含まれる語句のうち、当該入力文書データ及び前記取得ステップにおいて取得された前記文書データの中での出現頻度に基づいて、プライバシに関するリスクが基準を超える語句を抽出する抽出ステップと、
前記抽出ステップにおいて抽出された語句を出力する出力ステップと、を実行させるためのリスク判定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019022609A JP7017531B2 (ja) | 2019-02-12 | 2019-02-12 | リスク判定装置、リスク判定方法及びリスク判定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019022609A JP7017531B2 (ja) | 2019-02-12 | 2019-02-12 | リスク判定装置、リスク判定方法及びリスク判定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020129339A JP2020129339A (ja) | 2020-08-27 |
JP7017531B2 true JP7017531B2 (ja) | 2022-02-08 |
Family
ID=72174637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019022609A Active JP7017531B2 (ja) | 2019-02-12 | 2019-02-12 | リスク判定装置、リスク判定方法及びリスク判定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7017531B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001184358A (ja) | 1999-12-24 | 2001-07-06 | Fujitsu Ltd | カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体 |
JP2007172404A (ja) | 2005-12-22 | 2007-07-05 | Internatl Business Mach Corp <Ibm> | 文字列処理方法、装置、およびプログラム |
WO2008114316A1 (ja) | 2007-03-19 | 2008-09-25 | Fujitsu Limited | 電子文書管理装置及び電子文書管理プログラム |
US20090144255A1 (en) | 2007-11-29 | 2009-06-04 | Palo Alto Research Center Incorporated | Augmenting privacy policies with inference detection |
JP2011227536A (ja) | 2010-04-15 | 2011-11-10 | Hitachi Ltd | 業務情報マスキングシステム |
JP2015041145A (ja) | 2013-08-20 | 2015-03-02 | 株式会社野村総合研究所 | 個人情報検出装置およびコンピュータプログラム |
-
2019
- 2019-02-12 JP JP2019022609A patent/JP7017531B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001184358A (ja) | 1999-12-24 | 2001-07-06 | Fujitsu Ltd | カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体 |
JP2007172404A (ja) | 2005-12-22 | 2007-07-05 | Internatl Business Mach Corp <Ibm> | 文字列処理方法、装置、およびプログラム |
WO2008114316A1 (ja) | 2007-03-19 | 2008-09-25 | Fujitsu Limited | 電子文書管理装置及び電子文書管理プログラム |
US20090144255A1 (en) | 2007-11-29 | 2009-06-04 | Palo Alto Research Center Incorporated | Augmenting privacy policies with inference detection |
JP2009134714A (ja) | 2007-11-29 | 2009-06-18 | Palo Alto Research Center Inc | プライバシーポリシーを強化するためにコンピュータが実行する方法 |
JP2011227536A (ja) | 2010-04-15 | 2011-11-10 | Hitachi Ltd | 業務情報マスキングシステム |
JP2015041145A (ja) | 2013-08-20 | 2015-03-02 | 株式会社野村総合研究所 | 個人情報検出装置およびコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020129339A (ja) | 2020-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11474696B2 (en) | Systems and methods for providing automatic document filling functionality | |
US11295034B2 (en) | System and methods for privacy management | |
AU2017255561B2 (en) | Learning from historical logs and recommending database operations on a data-asset in an ETL tool | |
US10467130B2 (en) | Method of generating and transforming test data and a system therefor | |
CN109614238B (zh) | 一种目标对象识别方法、装置、系统及可读存储介质 | |
US11093521B2 (en) | Just-in-time data quality assessment for best record creation | |
CN110336838B (zh) | 账号异常检测方法、装置、终端及存储介质 | |
US9910870B2 (en) | System and method for creating data models from complex raw log files | |
US20170300819A1 (en) | Time-Series Prediction Apparatus and Time-Series Prediction Method | |
CN113971527A (zh) | 基于机器学习的数据风险评估方法及装置 | |
KR20160028952A (ko) | 개인정보를 보호하는 장치, 개인정보를 보호하는 방법 및 개인정보를 보호하는 프로그램을 저장하는 저장매체 | |
CN117474724A (zh) | 一种中文隐私自动合规检测方法及相关设备 | |
KR101566153B1 (ko) | 포렌식 시스템 및 포렌식 방법 및 포렌식 프로그램 | |
CN110019076B (zh) | 多系统日志数据的构建方法、装置、设备及可读存储介质 | |
CN111177771B (zh) | 一种人员简历的生成方法及装置 | |
JP7017531B2 (ja) | リスク判定装置、リスク判定方法及びリスク判定プログラム | |
US20140101159A1 (en) | Knowledgebase Query Analysis | |
CN112685389B (zh) | 数据管理方法、数据管理装置、电子设备及存储介质 | |
JP2018005633A (ja) | 関連コンテンツ抽出装置、関連コンテンツ抽出方法及び関連コンテンツ抽出プログラム | |
US20150347529A1 (en) | System and method for contextual workflow automation | |
CN114356896A (zh) | 一种数据库检测方法及装置 | |
TW201539217A (zh) | 文件分析系統、文件分析方法、以及文件分析程式 | |
US10360243B2 (en) | Storage medium, information presentation method, and information presentation apparatus | |
JP2019083076A (ja) | 評価装置、評価方法、および評価プログラム | |
JP7487778B2 (ja) | 情報処理装置、情報処理方法及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220127 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7017531 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |