JP6914975B2 - 情報処理システム、情報処理装置、情報処理方法およびプログラム - Google Patents
情報処理システム、情報処理装置、情報処理方法およびプログラム Download PDFInfo
- Publication number
- JP6914975B2 JP6914975B2 JP2019000775A JP2019000775A JP6914975B2 JP 6914975 B2 JP6914975 B2 JP 6914975B2 JP 2019000775 A JP2019000775 A JP 2019000775A JP 2019000775 A JP2019000775 A JP 2019000775A JP 6914975 B2 JP6914975 B2 JP 6914975B2
- Authority
- JP
- Japan
- Prior art keywords
- record
- information
- conversion
- concealment
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
実施形態に係る情報処理システム1の概略構成を図1に示す。この情報処理システム1は、図1に示すように、第1情報処理装置10と第2情報処理装置20とが、インターネットなどのネットワーク30を介して接続された構成である。第1情報処理装置10はデータ提供者が使用する情報処理装置であり、第2情報処理装置20はデータ利用者が使用する情報処理装置である。
次に、第2実施形態について説明する。本実施形態は、第1情報処理装置10に、変換情報50を生成する機能と、変換情報50を管理する機能とを持たせた例である。その他は、上述の第1実施形態と同様である。なお、以下の説明においては、第1実施形態と共通の構成要素については同一の符号を付して、重複した説明を適宜省略する。
上述の実施形態では、レコード集合40に含まれる全てのレコードを対象として秘匿化部14による変換が行われることを想定したが、秘匿化部14による変換が行われないレコードがあってもよい。ただし、秘匿化部14による変換が行われないレコードが存在する場合であっても、秘匿化レコード集合60に含まれる各レコードは秘匿化レコード特定情報65に基づいて一意に特定される必要がある。このため、秘匿化部14により変換される属性名や属性値の変換後の値は、秘匿化部14による変換の対象とならないレコードの属性名や属性値と重複しないようにする必要がある。
上述の実施形態では、第1情報処理装置10(10’)において秘匿化レコード集合60と秘匿化レコード特定情報65の組を1つ生成する場合を想定して説明したが、秘匿化レコード集合60と秘匿化レコード特定情報65の組を複数生成する場合は、変換情報50や変換設定情報90の利用方法にいくつかのバリエーションが考えられる。
上述の実施形態で説明した第1情報処理装置10(10’)や第2情報処理装置20は、例えば、一般的なコンピュータを構成するハードウェアと、コンピュータで実行されるプログラム(ソフトウェア)との協働により実現することができる。すなわち、上述の実施形態で説明した第1情報処理装置10(10’)や第2情報処理装置20の各部の機能は、コンピュータが所定のプログラムを実行することによって実現できる。
10 第1情報処理装置
11 レコード集合取得部
12 レコード特定情報取得部
13 変換情報取得部
14 秘匿化部
15 第1送信部
16 第1受信部
17 秘匿化解除部
18 出力部
20 第2情報処理装置
21 第2受信部
22 データ分析部
23 第2送信部
25 モデル
30 ネットワーク
31 変換設定情報取得部
32 変換情報生成部
33 変換情報管理部
40 レコード集合
45 レコード特定情報
50 変換情報
60 秘匿化レコード集合
65 秘匿化レコード特定情報
70 分析結果
80 秘匿化解除分析結果
Claims (10)
- 第1情報処理装置と第2情報処理装置とを含む情報処理システムであって、
前記第1情報処理装置は、
属性名と属性値のセットであるデータ要素を複数持つレコードの集合であるレコード集合を取得するレコード集合取得部と、
前記レコード集合に含まれる各レコードを一意に特定するための情報であって、少なくとも1つの前記属性名を示すレコード特定情報を取得するレコード特定情報取得部と、
前記レコード集合に含まれる少なくとも1つのレコードが持つ複数のデータ要素のうち、変換情報により指定されたデータ要素の属性名と属性値の少なくとも一方を前記変換情報に従って変換することにより秘匿化レコード集合を生成するとともに、前記レコード特定情報と前記変換情報とに基づいて、前記秘匿化レコード集合に含まれる各レコードを一意に特定するための秘匿化レコード特定情報を生成する秘匿化部と、
前記秘匿化レコード集合と前記秘匿化レコード特定情報とを前記第2情報処理装置に送信する第1送信部と、を備え、
前記第2情報処理装置は、
前記秘匿化レコード集合と前記秘匿化レコード特定情報とを前記第1情報処理装置から受信する第2受信部と、
前記秘匿化レコード集合に含まれる各レコードであって、前記秘匿化レコード特定情報に基づいて特定される各レコードに対し、学習モデルまたは数値モデルを用いた分析を行うデータ分析部と、を備える
情報処理システム。 - 前記第2情報処理装置は、
前記データ分析部による分析結果を前記第1情報処理装置に送信する第2送信部をさらに備え、
前記第1情報処理装置は、
前記分析結果を前記第2情報処理装置から受信する第1受信部と、
前記分析結果に対し、前記変換情報に基づく逆変換を行うことにより秘匿化解除分析結果を生成する秘匿化解除部と、
前記秘匿化解除分析結果を出力する出力部と、をさらに備える
請求項1に記載の情報処理システム。 - 前記第1情報処理装置は、
前記秘匿化レコード集合を識別する第1識別情報と該秘匿化レコード集合の生成に用いた前記変換情報を識別する第2識別情報とを対応付けた対応表を保持する変換情報管理部をさらに備え、
前記秘匿化解除部は、前記分析結果に対応する前記秘匿化レコード集合の前記第1識別情報と、前記対応表とに基づいて、前記分析結果に対する逆変換に用いる前記変換情報を特定する
請求項2に記載の情報処理システム。 - 前記第1情報処理装置は、
前記変換情報を取得する変換情報取得部をさらに備える
請求項1乃至3のいずれか一項に記載の情報処理システム。 - 前記第1情報処理装置は、
変換の対象となる属性名もしくは属性値に対して適用される変換ルールを指定する変換設定情報を取得する変換設定情報取得部と、
前記変換設定情報と前記レコード集合とに基づいて前記変換情報を生成する変換情報生成部と、をさらに備える
請求項1乃至3のいずれか一項に記載の情報処理システム。 - 前記変換情報生成部は、1つの前記変換設定情報と1つの前記レコード集合とに基づいて複数の前記変換情報を生成し、
前記秘匿化部は、複数の前記変換情報を用いて1つの前記レコード集合から複数の前記秘匿化レコード集合を生成する
請求項5に記載の情報処理システム。 - 前記変換情報生成部は、1つの前記変換設定情報と複数の前記レコード集合とに基づいて1つの前記変換情報を生成し、
前記秘匿化部は、1つの前記変換情報を用いて複数の前記レコード集合から複数の前記秘匿化レコード集合を生成する
請求項5に記載の情報処理システム。 - 属性名と属性値のセットであるデータ要素を複数持つレコードの集合であるレコード集合を取得するレコード集合取得部と、
前記レコード集合に含まれる各レコードを一意に特定するための情報であって、少なくとも1つの前記属性名を示すレコード特定情報を取得するレコード特定情報取得部と、
前記レコード集合に含まれる少なくとも1つのレコードが持つ複数のデータ要素のうち、変換情報により指定されたデータ要素の属性名と属性値の少なくとも一方を前記変換情報に従って変換することにより秘匿化レコード集合を生成するとともに、前記レコード特定情報と前記変換情報とに基づいて、前記秘匿化レコード集合に含まれる各レコードを一意に特定するための秘匿化レコード特定情報を生成する秘匿化部と、
前記秘匿化レコード集合と前記秘匿化レコード特定情報とを外部装置に送信する送信部と、
前記外部装置において、前記秘匿化レコード集合に含まれる各レコードであって、前記秘匿化レコード特定情報に基づいて特定される各レコードに対し、学習モデルまたは数値モデルを用いた分析を行うことにより得られた分析結果を、前記外部装置から受信する受信部と、
前記分析結果に対し、前記変換情報に基づく逆変換を行うことにより秘匿化解除分析結果を生成する秘匿化解除部と、
前記秘匿化解除分析結果を出力する出力部と、を備える
情報処理装置。 - 第1情報処理装置と第2情報処理装置とを含む情報処理システムにより実行される情報処理方法であって、
前記第1情報処理装置のレコード集合取得部が、属性名と属性値のセットであるデータ要素を複数持つレコードの集合であるレコード集合を取得するステップと、
前記第1情報処理装置のレコード特定情報取得部が、前記レコード集合に含まれる各レコードを一意に特定するための情報であって、少なくとも1つの前記属性名を示すレコード特定情報を取得するステップと、
前記第1情報処理装置の秘匿化部が、前記レコード集合に含まれる少なくとも1つのレコードが持つ複数のデータ要素のうち、変換情報により指定されたデータ要素の属性名と属性値の少なくとも一方を前記変換情報に従って変換することにより秘匿化レコード集合を生成するとともに、前記レコード特定情報と前記変換情報とに基づいて、前記秘匿化レコード集合に含まれる各レコードを一意に特定するための秘匿化レコード特定情報を生成するステップと、
前記第1情報処理装置の送信部が、前記秘匿化レコード集合と前記秘匿化レコード特定情報とを前記第2情報処理装置に送信するステップと、
前記第2情報処理装置の受信部が、前記秘匿化レコード集合と前記秘匿化レコード特定情報とを前記第1情報処理装置から受信するステップと、
前記第2情報処理装置のデータ分析部が、前記秘匿化レコード集合に含まれる各レコードであって、前記秘匿化レコード特定情報に基づいて特定される各レコードに対し、学習モデルまたは数値モデルを用いた分析を行うステップと、を含む
情報処理方法。 - コンピュータに、
属性名と属性値のセットであるデータ要素を複数持つレコードの集合であるレコード集合を取得する機能と、
前記レコード集合に含まれる各レコードを一意に特定するための情報であって、少なくとも1つの前記属性名を示すレコード特定情報を取得する機能と、
前記レコード集合に含まれる少なくとも1つのレコードが持つ複数のデータ要素のうち、変換情報により指定されたデータ要素の属性名と属性値の少なくとも一方を前記変換情報に従って変換することにより秘匿化レコード集合を生成するとともに、前記レコード特定情報と前記変換情報とに基づいて、前記秘匿化レコード集合に含まれる各レコードを一意に特定するための秘匿化レコード特定情報を生成する機能と、
前記秘匿化レコード集合と前記秘匿化レコード特定情報とを外部装置に送信する機能と、
前記外部装置において、前記秘匿化レコード集合に含まれる各レコードであって、前記秘匿化レコード特定情報に基づいて特定される各レコードに対し、学習モデルまたは数値モデルを用いた分析を行うことにより得られた分析結果を、前記外部装置から受信する機能と、
前記分析結果に対し、前記変換情報に基づく逆変換を行うことにより秘匿化解除分析結果を生成する機能と、
前記秘匿化解除分析結果を出力する機能と、
を実現させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019000775A JP6914975B2 (ja) | 2019-01-07 | 2019-01-07 | 情報処理システム、情報処理装置、情報処理方法およびプログラム |
US16/551,978 US11372884B2 (en) | 2019-01-07 | 2019-08-27 | Information processing system, information processing apparatus, information processing method, and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019000775A JP6914975B2 (ja) | 2019-01-07 | 2019-01-07 | 情報処理システム、情報処理装置、情報処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020109592A JP2020109592A (ja) | 2020-07-16 |
JP6914975B2 true JP6914975B2 (ja) | 2021-08-04 |
Family
ID=71403784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019000775A Active JP6914975B2 (ja) | 2019-01-07 | 2019-01-07 | 情報処理システム、情報処理装置、情報処理方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11372884B2 (ja) |
JP (1) | JP6914975B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7165795B2 (ja) * | 2020-08-31 | 2022-11-04 | 株式会社日立製作所 | データ解析システムのプライバシー保護データを生成する方法及びデバイス |
JP7340059B2 (ja) * | 2021-07-22 | 2023-09-06 | 株式会社日立製作所 | 分散プラットフォームで協調計算を実施する間のデータプライバシーを管理する方法およびシステム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009017158A1 (ja) * | 2007-08-01 | 2009-02-05 | Nec Corporation | 変換プログラム探索システムおよび変換プログラム探索方法 |
US9298878B2 (en) | 2010-07-29 | 2016-03-29 | Oracle International Corporation | System and method for real-time transactional data obfuscation |
JP5655718B2 (ja) * | 2011-06-24 | 2015-01-21 | 富士通株式会社 | 変換処理方法、装置及びプログラム、復元処理方法、装置及びプログラム |
JP5844715B2 (ja) * | 2012-11-07 | 2016-01-20 | 学校法人沖縄科学技術大学院大学学園 | データ通信システム、データ解析装置、データ通信方法、および、プログラム |
JP6098294B2 (ja) * | 2013-03-28 | 2017-03-22 | 富士通株式会社 | 情報秘匿化装置、情報秘匿化方法 |
US10650020B1 (en) * | 2015-09-17 | 2020-05-12 | Trifacta Inc. | Analyzing transformations for preprocessing datasets |
US10601786B2 (en) * | 2017-03-02 | 2020-03-24 | UnifyID | Privacy-preserving system for machine-learning training data |
JP6654654B2 (ja) * | 2018-01-19 | 2020-02-26 | 株式会社日立製作所 | クエリ生成支援方法及びクエリ生成支援装置 |
US11010436B1 (en) * | 2018-04-20 | 2021-05-18 | Facebook, Inc. | Engaging users by personalized composing-content recommendation |
-
2019
- 2019-01-07 JP JP2019000775A patent/JP6914975B2/ja active Active
- 2019-08-27 US US16/551,978 patent/US11372884B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020109592A (ja) | 2020-07-16 |
US11372884B2 (en) | 2022-06-28 |
US20200218728A1 (en) | 2020-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12056583B2 (en) | Target variable distribution-based acceptance of machine learning test data sets | |
US20240267411A1 (en) | Domain name processing systems and methods | |
EP2860658B1 (en) | Classifying malware by order of network behavior artifacts | |
US10817621B2 (en) | Anonymization processing device, anonymization processing method, and program | |
CN107426165B (zh) | 一种支持密钥更新的双向安全云存储数据完整性检测方法 | |
Podani et al. | Resemblance coefficients and the horseshoe effect in principal coordinates analysis | |
US11693958B1 (en) | Processing and storing event data in a knowledge graph format for anomaly detection | |
EP3218811B1 (en) | Testing insecure computing environments using random data sets generated from characterizations of real data sets | |
US20180196835A1 (en) | Root cause analysis of performance problems | |
US20090271437A1 (en) | Determining computer information from processor properties | |
JP7067489B2 (ja) | セキュリティ情報分析装置、セキュリティ情報分析方法、セキュリティ情報分析プログラム、セキュリティ情報評価装置、セキュリティ情報評価方法及びセキュリティ情報分析システム | |
Mans et al. | Business process mining success | |
JP6914975B2 (ja) | 情報処理システム、情報処理装置、情報処理方法およびプログラム | |
JP2021507360A (ja) | データを非特定化する方法、データを非特定化するためのシステム、および非データを特定化するためのコンピュータ・プログラム | |
US20080177586A1 (en) | Apparatus and Method for Identifying Process Elements | |
CN110008743A (zh) | 一种块链式账本中的数据属性标识方法、装置及设备 | |
CN110046155B (zh) | 特征数据库的更新、数据特征的确定方法、装置及设备 | |
US11531689B2 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium | |
O’Dea et al. | Disentangling reporting and disease transmission | |
JP7422643B2 (ja) | 統合装置、統合方法、および統合プログラム | |
CN112348041B (zh) | 日志分类、日志分类训练方法及装置、设备、存储介质 | |
Chun | Improved method of estimating the product quality after multiple inspections | |
JP2014081545A (ja) | ノイズ加算装置、ノイズ加算方法、およびプログラム | |
CN114004456B (zh) | 数据标签的计算方法、装置、计算机设备和存储介质 | |
Chen et al. | Nonparametric estimation of multiplicative counting process intensity functions with an application to the Beijing SARS epidemic |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200824 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210610 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210615 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210714 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6914975 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |