WO2021070361A1 - 維持置換確率生成装置、維持置換撹乱装置、維持置換確率生成方法、維持置換撹乱方法、プログラム - Google Patents

維持置換確率生成装置、維持置換撹乱装置、維持置換確率生成方法、維持置換撹乱方法、プログラム Download PDF

Info

Publication number
WO2021070361A1
WO2021070361A1 PCT/JP2019/040235 JP2019040235W WO2021070361A1 WO 2021070361 A1 WO2021070361 A1 WO 2021070361A1 JP 2019040235 W JP2019040235 W JP 2019040235W WO 2021070361 A1 WO2021070361 A1 WO 2021070361A1
Authority
WO
WIPO (PCT)
Prior art keywords
probability
replacement
attribute value
maintenance
inequality
Prior art date
Application number
PCT/JP2019/040235
Other languages
English (en)
French (fr)
Inventor
尭之 三浦
長谷川 聡
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to JP2021551074A priority Critical patent/JP7231053B2/ja
Priority to PCT/JP2019/040235 priority patent/WO2021070361A1/ja
Priority to US17/765,441 priority patent/US20220382896A1/en
Publication of WO2021070361A1 publication Critical patent/WO2021070361A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database

Definitions

  • the present invention relates to a technique for concealing individual data from a database by a probabilistic method, and relates to a maintenance-replacement probability generator, a maintenance-replacement disturbance device, a maintenance-replacement probability generation method, a maintenance-replacement disturbance method, and a program.
  • Non-Patent Document 1 is a technique for concealing individual data from a database by a probabilistic method.
  • the maintenance / replacement disturbance used here is a protection processing technique that "for each record, the information is maintained with a certain probability and the information is rewritten with another one with a certain probability”.
  • Non-Patent Document 1 a uniform maintenance probability is set for each attribute value, and there is a possibility that protection processing has been added more than necessary depending on the underlying database. was there.
  • an object of the present invention is to provide a maintenance-replacement probability generator capable of generating a maintenance-replacement probability that realizes an appropriate degree of maintenance-replacement disturbance.
  • the maintenance / replacement probability generation device of the present invention includes a global optimum solution determination unit, a region generation unit, and an intra-regional optimum solution generation unit.
  • the global optimum solution determination unit sets d as an integer of 2 or more, and for each of the d attribute values, the maintenance probability of the predetermined attribute value and the uniform probability of setting the predetermined attribute value to the other attribute values.
  • the replacement probability group when replacing with is a column or row corresponding to a predetermined attribute value, and the column or row corresponding to each attribute value is arranged in the row or column direction, and the transition matrix P and the attribute value Determines the presence or absence of a global optimal solution, which is the replacement probability of each attribute value at which the vector representation v of the histogram is
  • 0, and outputs the global optimal solution when there is a global optimal solution. ..
  • the intra-regional optimum solution generation unit generates and outputs an intra-regional optimum solution that minimizes
  • the maintenance / replacement probability generator of the present invention it is possible to generate a maintenance / replacement probability that realizes an appropriate degree of maintenance / replacement disturbance.
  • FIG. 1 The block diagram which shows the structure of the maintenance-replacement probability generation apparatus, maintenance-replacement disturbance apparatus of Example 1.
  • FIG. The flowchart which shows the operation of the maintenance-replacement probability generation apparatus, maintenance-replacement disturbance apparatus of Example 1.
  • the maintenance-replacement probability generator and maintenance-replacement disturbance device of this embodiment realize highly useful maintenance-replacement disturbance while satisfying a certain privacy protection level for the data in the histogram format.
  • the maintenance / replacement probability generation device 11 of this embodiment includes a global optimum solution determination unit 111, a region generation unit 112, and an intra-regional optimum solution generation unit 113.
  • the maintenance / replacement disturbance device 12 of this embodiment includes the maintenance / replacement disturbance execution unit 124 in addition to the above configuration.
  • the global optimum solution determination unit 111 has a maintenance probability of a predetermined attribute value and a replacement probability when the predetermined attribute value is replaced with another attribute value with a uniform probability for each of the d attribute values.
  • 0 Determines the presence or absence of the global optimal solution q? ⁇ R d , which is the replacement probability of each attribute value, and outputs the global optimal solution when there is a global optimal solution (S111). ).
  • the maintenance-replacement probability generation device 11 and the maintenance-replacement disturbance device 12 of the present embodiment have features not found in the prior art in that the transition matrix to be represented as P 0 in the prior art is represented by P.
  • the region generation unit 112 corresponds to the i-th and j-th attribute values satisfying 1 ⁇ i ⁇ d, 1 ⁇ j ⁇ d and i ⁇ j when there is no global optimum solution as a result of the determination in step S111.
  • the region where the substitution probability coordinates (x, y) (q i , q j ) should be satisfied, and the substitution probabilities of both corresponding to the i-th and j-th attribute values are equivalent to the condition satisfying the ⁇ difference privacy.
  • step S112 is realized by executing the following function Make domine.
  • the outputs A and b satisfy the following properties.
  • FIG. 3 shows an example of the region generated in step S112.
  • the region satisfying the inequality (1) and the inequality (2) is a region sandwiched between two linear functions [1] and [2] passing through the origin, and the inequality (1) and the linear function [1]. ],
  • the inequality (2) and the linear function [2] correspond to each other (the same applies hereinafter).
  • the inequalities (1) and (2) are
  • the maintenance-replacement probability generation device 11 and the maintenance-replacement disturbance device 12 of this embodiment have features not found in the prior art.
  • the intra-regional optimum solution generation unit 113 generates and outputs an intra-regional optimum solution that minimizes
  • CVXOPT is an algorithm for finding a point that gives a minimum value using a quadratic programming method for an objective function expressed by a quadratic expression on a region represented by a linear inequality.
  • Step S113 is realized by executing the following function CVXOPT.
  • the function CVXOPT is a function having the following inputs and outputs. ⁇ Input (two) -Area ⁇ q ⁇ R d
  • the maintenance-replacement disturbance execution unit 124 executes the maintenance-replacement disturbance of the input data based on the global optimum solution or the intra-regional optimum solution (S124).
  • ⁇ Algorithm 1 Specific algorithm of the device of this embodiment> The operation of the maintenance / replacement probability generation device 11 and the maintenance / replacement disturbance device 12 of this embodiment is realized by, for example, the algorithm 1 shown below.
  • the first inequality corresponds to the condition of the third line in the algorithm 1
  • the second inequality corresponds to the condition of the fifth line in the algorithm 1.
  • the device of the present invention is, for example, as a single hardware entity, an input unit to which a keyboard or the like can be connected, an output unit to which a liquid crystal display or the like can be connected, and a communication device (for example, a communication cable) capable of communicating outside the hardware entity.
  • Communication unit to which can be connected CPU (Central Processing Unit, cache memory, registers, etc.), RAM and ROM which are memories, external storage device which is a hard disk, and input units, output units, and communication units of these.
  • CPU, RAM, ROM has a connecting bus so that data can be exchanged between external storage devices.
  • a device (drive) or the like capable of reading and writing a recording medium such as a CD-ROM may be provided in the hardware entity.
  • a physical entity equipped with such hardware resources includes a general-purpose computer and the like.
  • the external storage device of the hardware entity stores the program required to realize the above-mentioned functions and the data required for processing this program (not limited to the external storage device, for example, reading a program). It may be stored in a ROM, which is a dedicated storage device). Further, the data obtained by the processing of these programs is appropriately stored in a RAM, an external storage device, or the like.
  • each program stored in the external storage device (or ROM, etc.) and the data necessary for processing each program are read into the memory as needed, and are appropriately interpreted, executed, and processed by the CPU. ..
  • the CPU realizes a predetermined function (each configuration requirement represented by the above, ... Department, ... means, etc.).
  • the present invention is not limited to the above-described embodiment, and can be appropriately modified without departing from the spirit of the present invention. Further, the processes described in the above-described embodiment are not only executed in chronological order according to the order described, but may also be executed in parallel or individually as required by the processing capacity of the device that executes the processes. ..
  • the processing function in the hardware entity (device of the present invention) described in the above embodiment is realized by a computer
  • the processing content of the function that the hardware entity should have is described by a program.
  • the processing function in the above hardware entity is realized on the computer.
  • the various processes described above can be performed by causing the recording unit 10020 of the computer shown in FIG. 4 to read a program for executing each step of the above method and operating the control unit 10010, the input unit 10030, the output unit 10040, and the like. ..
  • the program that describes this processing content can be recorded on a computer-readable recording medium.
  • the computer-readable recording medium may be, for example, a magnetic recording device, an optical disk, a photomagnetic recording medium, a semiconductor memory, or the like.
  • a hard disk device, a flexible disk, a magnetic tape, or the like as a magnetic recording device is used as an optical disk
  • a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), or a CD-ROM (Compact Disc Read Only) is used as an optical disk.
  • Memory CD-R (Recordable) / RW (ReWritable), etc.
  • MO Magnetto-Optical disc
  • magneto-optical recording media EEPROM (Electrically Erasable and Programmable-Read Only Memory), etc. as semiconductor memory Can be used.
  • the distribution of this program is carried out, for example, by selling, transferring, renting, etc., a portable recording medium such as a DVD or CD-ROM on which the program is recorded. Further, the program may be stored in the storage device of the server computer, and the program may be distributed by transferring the program from the server computer to another computer via a network.
  • a computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. Then, when the process is executed, the computer reads the program stored in its own recording medium and executes the process according to the read program. Further, as another execution form of this program, a computer may read the program directly from a portable recording medium and execute processing according to the program, and further, the program is transferred from the server computer to this computer. Each time, the processing according to the received program may be executed sequentially. In addition, the above processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition without transferring the program from the server computer to this computer. May be.
  • the program in this embodiment includes information to be used for processing by a computer and equivalent to the program (data that is not a direct command to the computer but has a property of defining the processing of the computer, etc.).
  • the hardware entity is configured by executing a predetermined program on the computer, but at least a part of these processing contents may be realized in terms of hardware.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

適切な程度の維持置換攪乱を実現する維持置換確率を生成することができる維持置換確率生成装置を提供する。所定の属性値の維持確率と、所定の属性値を他の属性値に一様な確率で置換する場合の置換確率群とを所定の属性値に対応する列または行として、行または列方向に配置してなる遷移行列Pと、属性値のヒストグラムのベクトル表現vが||Pv-v||=0となる各属性値の置換確率である大域的最適解が有る場合に大域的最適解を出力する大域的最適解判定部と、大域的最適解が無い場合に、i番目とj番目の属性値に対応する双方の置換確率がε差分プライバシーを満たす条件と等価な不等式と、i番目とj番目の属性値に対応する一方の置換確率と他方の維持確率がε差分プライバシーを満たす条件と等価な不等式から定義される領域を生成する領域生成部と、領域内で||Pv-v||を最小化する領域内最適解を生成して出力する領域内最適解生成部を含む。

Description

維持置換確率生成装置、維持置換撹乱装置、維持置換確率生成方法、維持置換撹乱方法、プログラム
 本発明は、データベースに対して、個別データを確率的手法により秘匿する技術に関し、維持置換確率生成装置、維持置換撹乱装置、維持置換確率生成方法、維持置換撹乱方法、プログラムに関する。
 データベースに対して、個別データを確率的手法により秘匿する技術として、非特許文献1がある。ここで用いられている維持置換攪乱は、「各レコードに対し、一定の確率で情報を維持し一定の確率で情報を他のものに書き換える」という保護処理技術である。
Rakesh Agrawal, Ramakrishnan Srikant, and Dilys Thomas. Privacy preserving olap. In Proceedings of the 2005 ACM SIGMOD international conference on Management of data, pp. 251-262. ACM, 2005.
 しかし、非特許文献1におけるデータ保護処理手法では、各属性値に対して、一律の維持確率を設定しており、もとになるデータベースによっては必要以上に保護処理を加えてしまっている可能性があった。
 そこで本発明では、適切な程度の維持置換攪乱を実現する維持置換確率を生成することができる維持置換確率生成装置を提供することを目的とする。
 本発明の維持置換確率生成装置は、大域的最適解判定部と、領域生成部と、領域内最適解生成部を含む。
 大域的最適解判定部は、dを2以上の整数とし、d個の属性値のそれぞれに対して、所定の属性値の維持確率と、所定の属性値を他の属性値に一様な確率で置換する場合の置換確率群とを所定の属性値に対応する列または行とし、各属性値に対応する列または行を、行または列方向に配置してなる遷移行列Pと、属性値のヒストグラムのベクトル表現vが||Pv-v||=0となる各属性値の置換確率である大域的最適解の有無を判定し、大域的最適解が有る場合に大域的最適解を出力する。領域生成部は、大域的最適解が無い場合に、1≦i≦d,1≦j≦dかつi≠jを満たすi番目とj番目の属性値に対応する置換確率の座標(x,y)=(q,q)が満たすべき領域であって、i番目とj番目の属性値に対応する双方の置換確率がε差分プライバシーを満たす条件と等価な不等式と、i番目とj番目の属性値に対応する一方の置換確率と他方の維持確率がε差分プライバシーを満たす条件と等価な不等式から定義される領域を生成する。領域内最適解生成部は、領域内で||Pv-v||を最小化する領域内最適解を生成して出力する。
 本発明の維持置換確率生成装置によれば、適切な程度の維持置換攪乱を実現する維持置換確率を生成することができる。
実施例1の維持置換確率生成装置、維持置換撹乱装置の構成を示すブロック図。 実施例1の維持置換確率生成装置、維持置換撹乱装置の動作を示すフローチャート。 実施例1の維持置換確率生成装置、維持置換撹乱装置が生成する領域の例を示す図。 コンピュータの機能構成例を示す図。
 以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
 以下、実施例1の維持置換確率生成装置、維持置換撹乱装置について説明する。本実施例の維持置換確率生成装置、維持置換撹乱装置は、ヒストグラム形式のデータに対して、一定のプライバシー保護水準を満たしつつ、有用性が高い維持置換攪乱を実現する。
 以下、図1を参照して、本実施例の維持置換確率生成装置11、維持置換撹乱装置12の構成を説明する。同図に示すように、本実施例の維持置換確率生成装置11は、大域的最適解判定部111と、領域生成部112と、領域内最適解生成部113とを含む。本実施例の維持置換撹乱装置12は、上記構成に加え、維持置換撹乱実行部124を含んで構成される。
<維持置換確率生成装置11への入力、出力>
 本実施例の維持置換確率生成装置11への入力、出力は以下のとおりである。
入力-属性値のヒストグラムv=(v,…,v)∈Z(d個の整数値の組み合わせ)
入力-プライバシー保護指標ε(正の実数)
出力-大域的最適解、または領域内最適解
<維持置換撹乱装置12への入力、出力>
 本実施例の維持置換撹乱装置12への入力、出力は以下のとおりである。
入力-属性値のヒストグラムv=(v,…,v)∈Z(d個の整数値の組み合わせ、dは2以上の整数)
入力-プライバシー保護指標ε(正の実数)
入力-データ(維持置換撹乱を実行するデータ)
出力-ε差分プライバシーを満たすものの中で、||Pv-v||を最小化する遷移行列Pに従う維持置換攪乱済みデータ
 ただし、
・||x||はベクトルx∈Rの2乗ノルムを表す。
・遷移行列Pについては後述する。
・ε差分プライバシーとは保護メカニズムの安全性を測る指標である(参考非特許文献1:Cynthia Dwork, Aaron Roth, et al. The algorithmic foundations of differential privacy. Foundations and Trends in Theoretical Computer Science, Vol. 9, No. 3-4, pp. 211-407, 2014.)
<動作>
 以下、図2を参照して、各構成要件の動作を説明する。なお、各構成要件の動作に先立ち、ヒストグラムv∈Z、プライバシー保護指標ε>0を設定し、装置に入力するものとする。
[大域的最適解判定部111]
 大域的最適解判定部111は、d個の属性値のそれぞれに対して、所定の属性値の維持確率と、所定の属性値を他の属性値に一様な確率で置換する場合の置換確率群とを所定の属性値に対応する列または行とし、各属性値に対応する列または行を、行または列方向に配置してなる遷移行列Pと、属性値のヒストグラムのベクトル表現vが||Pv-v||=0となる各属性値の置換確率である大域的最適解q?∈Rの有無を判定し、大域的最適解が有る場合に大域的最適解を出力する(S111)。
≪遷移行列P≫
 ここで遷移行列Pは、インデックスkの属性値の維持確率p=1-q(k=1,…,d)を用いて以下のように表現される。
Figure JPOXMLDOC01-appb-M000001
 上述したように、従来技術では一律の維持確率を設定していたため、従来技術では、上記Pにおけるq=q=…=qである(この値をαとする)。従って従来技術で遷移行列を構成しようとした場合、
Figure JPOXMLDOC01-appb-M000002
と表現される。本実施例の維持置換確率生成装置11、維持置換撹乱装置12は、従来技術では、Pと表されるべき遷移行列を、Pと表した点において、従来技術にはない特徴を有する。
 なお、ヒストグラムvが固定されて入力されている状況では、||Pv-v||はq=(q,…,q)の関数であることに注意する。||Pv-v||は常に0以上の値をとるので、大域的最適解が存在すればそれが、最小値を与える点になる。
 なお、遷移行列Pにおいて、置換確率q=q=…=q=0とすれば、遷移行列は単位行列、すなわち
Figure JPOXMLDOC01-appb-M000003
となる。この場合、当然||Pv-v||=0となるが、データの置換が行われていないため、データの保護ができていない。一般に||Pv-v||の値を小さくしようとすることと、データの保護を強くしようとすることにはトレードオフの関係がある。そこで、後述するステップS112において、ε差分プライバシーの考え方を応用して、置換確率q=(q,…,q)の満たすべき条件を定義する。
[領域生成部112]
 領域生成部112は、ステップS111の判定の結果、大域的最適解が無い場合に、1≦i≦d,1≦j≦dかつi≠jを満たすi番目とj番目の属性値に対応する置換確率の座標(x,y)=(q,q)が満たすべき領域であって、i番目とj番目の属性値に対応する双方の置換確率がε差分プライバシーを満たす条件と等価な不等式と、i番目とj番目の属性値に対応する一方の置換確率と他方の維持確率がε差分プライバシーを満たす条件と等価な不等式から定義される領域を生成する(S112)。
≪関数Make domain≫
 より詳細には、ステップS112は、以下の関数Make domainを実行することにより実現される。関数Make domainは次のような入出力をもつ関数である。
・入力(二つ)
-属性値のヒストグラムv=(v,…,v)∈Z(d個の整数値の組み合わせ)
-プライバシー保護指標ε(正の実数)
・出力(二つ)
-3d(d-1)×d行列A
-3d(d-1)次ベクトルb
 ここで出力A、bは、次の性質を満たしているものとする。q∈Rに対して連立不等式Aq≦bは、任意の相異なるiとj(1≦i≦d,1≦j≦d)に対して、(x,y)=(q,q)が次の6つの不等式を満たすことと等価である。
Figure JPOXMLDOC01-appb-M000004
 図3にステップS112で生成される領域の例を示す。同図に示すように、不等式(1)と不等式(2)を満たす領域は原点を通る二つの一次関数[1][2]に挟まれる領域であって、不等式(1)と一次関数[1]、不等式(2)と一次関数[2]がそれぞれ対応している(以下も同様)。ここで不等式(1)、(2)は、
Figure JPOXMLDOC01-appb-M000005
であるため、i番目とj番目の属性値に対応する双方の置換確率q/(d-1),q/(d-1)がε差分プライバシーを満たす条件
Figure JPOXMLDOC01-appb-M000006
と等価な不等式である。
 同様に不等式(3)、(4)は、一次関数[3]、[4]と対応し、
Figure JPOXMLDOC01-appb-M000007
であるため、i番目の属性値に対応する維持確率1-qとj番目の属性値に対応する置換確率q/(d-1)がε差分プライバシーを満たす条件
Figure JPOXMLDOC01-appb-M000008
と等価な不等式である。
 同様に不等式(5)、(6)は、一次関数[5]、[6]と対応し、
Figure JPOXMLDOC01-appb-M000009
であるため、i番目の属性値に対応する置換確率q/(d-1)とj番目の属性値に対応する維持確率1-qがε差分プライバシーを満たす条件
Figure JPOXMLDOC01-appb-M000010
と等価な不等式である。
 このように、従来とは異なる遷移行列Pの各成分である置換確率q=(q,…,q)の満たすべき条件をε差分プライバシーの考え方を応用して6つの不等式で定義される領域として生成した点において、本実施例の維持置換確率生成装置11、維持置換撹乱装置12は、従来技術にはない特徴を有する。
[領域内最適解生成部113]
 領域内最適解生成部113は、上述の不等式(1)から(6)で定義される領域内で||Pv-v||を最小化する領域内最適解を生成して出力する(S113)。
≪関数CVXOPT≫
 線形不等式によって表される領域上の二次式で表現される目的関数に対して、二次計画法を用いて最小値を与えるような点を求めるアルゴリズムをCVXOPTと書くことにする。ステップS113は、以下の関数CVXOPTを実行することにより実現される。関数CVXOPTは次のような入出力をもつ関数である。
・入力(二つ)
-領域{q∈R|Aq≦b}
-領域上で定められた目的関数
・出力(一つ)
-目的関数を最小化する領域内の点q?∈R
[維持置換撹乱実行部124]
 維持置換撹乱実行部124は、大域的最適解または領域内最適解に基づいて、入力されたデータの維持置換撹乱を実行する(S124)。
<アルゴリズム1:本実施例の装置の具体的なアルゴリズム>
 本実施例の維持置換確率生成装置11、維持置換撹乱装置12の動作は、例えば以下に示すアルゴリズム1で実現される。
Input:v(ヒストグラム)、ε(プライバシー保護指標)
Output:||Pv-v||を最小化するような遷移行列Pに従い、ε差分プライバシーを満たす維持置換攪乱済みデータ
1:vを降順に並び替える
2:A,b←Make domain(v,ε)
3:if v>eε・v then(大域的最適解の存在判定:存在しない場合1)
4:(q,…,q)←CVXOPT(A,b,||Pv-v||)
Figure JPOXMLDOC01-appb-M000011
(大域的最適解の存在判定:存在しない場合2)
6:(q,…,q)←CVXOPT(A,b,||Pv-v||)
7:else (大域的最適解が存在する場合)
Figure JPOXMLDOC01-appb-M000012
10:end if
11:q,…,qを元のvに対応するよう並び替える
12:P←(q,…,q):遷移行列を作る
13:Pに従う維持置換攪乱済みデータを出力
 アルゴリズム1の3行目と5行目において、大域的最適解が存在しない場合について二つの条件を設定しているのは、以下の理由である。大域的最適解が存在することは、以下の(i)、または(ii)かつ(iii)で表すことができる。
Figure JPOXMLDOC01-appb-M000013
 なお、t∈[0,1]であり、Dε,dはアルゴリズムの入力の一つの領域を表す。すなわち、(i)⇔(ii)かつ(iii)であるため、大域的最適解が存在しない場合は、
not(i)⇔not((ii)かつ(iii))
   ⇔not(ii)またはnot(iii)
である。従って、
Figure JPOXMLDOC01-appb-M000014
または
Figure JPOXMLDOC01-appb-M000015
を満たすことに相当し、最初の不等式がアルゴリズム1における3行目、二番目の不等式がアルゴリズム1における5行目の条件に、それぞれ相当している。
<実施例1の維持置換確率生成装置11、維持置換撹乱装置12がもたらす効果>
 従来手法より精度の高い分析を可能にするプライバシー保護が実現する。
<補記>
 本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD-ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
 ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
 ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。
 本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
 既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
 上述の各種の処理は、図4に示すコンピュータの記録部10020に、上記方法の各ステップを実行させるプログラムを読み込ませ、制御部10010、入力部10030、出力部10040などに動作させることで実施できる。
 この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP-ROM(Electrically Erasable and Programmable-Read Only Memory)等を用いることができる。
 また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
 このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
 また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (8)

  1.  dを2以上の整数とし、d個の属性値のそれぞれに対して、所定の属性値の維持確率と、前記所定の属性値を他の属性値に一様な確率で置換する場合の置換確率群とを前記所定の属性値に対応する列または行とし、各属性値に対応する列または行を、行または列方向に配置してなる遷移行列Pと、前記属性値のヒストグラムのベクトル表現vが||Pv-v||=0となる各属性値の置換確率である大域的最適解の有無を判定し、前記大域的最適解が有る場合に前記大域的最適解を出力する大域的最適解判定部と、
     前記大域的最適解が無い場合に、1≦i≦d,1≦j≦dかつi≠jを満たすi番目とj番目の属性値に対応する置換確率の座標(x,y)=(q,q)が満たすべき領域であって、i番目とj番目の属性値に対応する双方の置換確率がε差分プライバシーを満たす条件と等価な不等式と、i番目とj番目の属性値に対応する一方の置換確率と他方の維持確率がε差分プライバシーを満たす条件と等価な不等式から定義される領域を生成する領域生成部と、
     前記領域内で||Pv-v||を最小化する領域内最適解を生成して出力する領域内最適解生成部を含む
     維持置換確率生成装置。
  2.  請求項1に記載の維持置換確率生成装置であって、
     前記領域生成部は、
     i番目とj番目の属性値に対応する双方の置換確率がε差分プライバシーを満たす条件と等価な二つの不等式と、i番目の属性値に対応する維持確率とj番目の属性値に対応する置換確率がε差分プライバシーを満たす条件と等価な二つの不等式と、i番目の属性値に対応する置換確率とj番目の属性値に対応する維持確率がε差分プライバシーを満たす条件と等価な二つの不等式、すなわち六つの不等式から定義される領域を生成する
     維持置換確率生成装置。
  3.  dを2以上の整数とし、d個の属性値のそれぞれに対して、所定の属性値の維持確率と、前記所定の属性値を他の属性値に一様な確率で置換する場合の置換確率群とを前記所定の属性値に対応する列または行とし、各属性値に対応する列または行を、行または列方向に配置してなる遷移行列Pと、前記属性値のヒストグラムのベクトル表現vが||Pv-v||=0となる各属性値の置換確率である大域的最適解の有無を判定し、前記大域的最適解が有る場合に前記大域的最適解を出力する大域的最適解判定部と、
     前記大域的最適解が無い場合に、1≦i≦d,1≦j≦dかつi≠jを満たすi番目とj番目の属性値に対応する置換確率の座標(x,y)=(q,q)が満たすべき領域であって、i番目とj番目の属性値に対応する双方の置換確率がε差分プライバシーを満たす条件と等価な不等式と、i番目とj番目の属性値に対応する一方の置換確率と他方の維持確率がε差分プライバシーを満たす条件と等価な不等式から定義される領域を生成する領域生成部と、
     前記領域内で||Pv-v||を最小化する領域内最適解を生成して出力する領域内最適解生成部と、
     前記大域的最適解または前記領域内最適解に基づいて、入力されたデータの維持置換撹乱を実行する維持置換撹乱実行部を含む
     維持置換撹乱装置。
  4.  請求項3に記載の維持置換撹乱装置であって、
     前記領域生成部は、
     i番目とj番目の属性値に対応する双方の置換確率がε差分プライバシーを満たす条件と等価な二つの不等式と、i番目の属性値に対応する維持確率とj番目の属性値に対応する置換確率がε差分プライバシーを満たす条件と等価な二つの不等式と、i番目の属性値に対応する置換確率とj番目の属性値に対応する維持確率がε差分プライバシーを満たす条件と等価な二つの不等式、すなわち六つの不等式から定義される領域を生成する
     維持置換撹乱装置。
  5.  dを2以上の整数とし、d個の属性値のそれぞれに対して、所定の属性値の維持確率と、前記所定の属性値を他の属性値に一様な確率で置換する場合の置換確率群とを前記所定の属性値に対応する列または行とし、各属性値に対応する列または行を、行または列方向に配置してなる遷移行列Pと、前記属性値のヒストグラムのベクトル表現vが||Pv-v||=0となる各属性値の置換確率である大域的最適解の有無を判定し、前記大域的最適解が有る場合に前記大域的最適解を出力するステップと、
     前記大域的最適解が無い場合に、1≦i≦d,1≦j≦dかつi≠jを満たすi番目とj番目の属性値に対応する置換確率の座標(x,y)=(q,q)が満たすべき領域であって、i番目とj番目の属性値に対応する双方の置換確率がε差分プライバシーを満たす条件と等価な不等式と、i番目とj番目の属性値に対応する一方の置換確率と他方の維持確率がε差分プライバシーを満たす条件と等価な不等式から定義される領域を生成するステップと、
     前記領域内で||Pv-v||を最小化する領域内最適解を生成して出力するステップを含む
     維持置換確率生成方法。
  6.  dを2以上の整数とし、d個の属性値のそれぞれに対して、所定の属性値の維持確率と、前記所定の属性値を他の属性値に一様な確率で置換する場合の置換確率群とを前記所定の属性値に対応する列または行とし、各属性値に対応する列または行を、行または列方向に配置してなる遷移行列Pと、前記属性値のヒストグラムのベクトル表現vが||Pv-v||=0となる各属性値の置換確率である大域的最適解の有無を判定し、前記大域的最適解が有る場合に前記大域的最適解を出力するステップと、
     前記大域的最適解が無い場合に、1≦i≦d,1≦j≦dかつi≠jを満たすi番目とj番目の属性値に対応する置換確率の座標(x,y)=(q,q)が満たすべき領域であって、i番目とj番目の属性値に対応する双方の置換確率がε差分プライバシーを満たす条件と等価な不等式と、i番目とj番目の属性値に対応する一方の置換確率と他方の維持確率がε差分プライバシーを満たす条件と等価な不等式から定義される領域を生成するステップと、
     前記領域内で||Pv-v||を最小化する領域内最適解を生成して出力するステップと、
     前記大域的最適解または前記領域内最適解に基づいて、入力されたデータの維持置換撹乱を実行するステップを含む
     維持置換撹乱方法。
  7.  コンピュータを請求項1または2に記載の維持置換確率生成装置として機能させるプログラム。
  8.  コンピュータを請求項3または4に記載の維持置換撹乱装置として機能させるプログラム。
PCT/JP2019/040235 2019-10-11 2019-10-11 維持置換確率生成装置、維持置換撹乱装置、維持置換確率生成方法、維持置換撹乱方法、プログラム WO2021070361A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2021551074A JP7231053B2 (ja) 2019-10-11 2019-10-11 維持置換確率生成装置、維持置換撹乱装置、維持置換確率生成方法、維持置換撹乱方法、プログラム
PCT/JP2019/040235 WO2021070361A1 (ja) 2019-10-11 2019-10-11 維持置換確率生成装置、維持置換撹乱装置、維持置換確率生成方法、維持置換撹乱方法、プログラム
US17/765,441 US20220382896A1 (en) 2019-10-11 2019-10-11 Retention-replacement probability generation device, retention-replacement perturbation device, retention-replacement probability generation method, retention-replacement perturbation method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/040235 WO2021070361A1 (ja) 2019-10-11 2019-10-11 維持置換確率生成装置、維持置換撹乱装置、維持置換確率生成方法、維持置換撹乱方法、プログラム

Publications (1)

Publication Number Publication Date
WO2021070361A1 true WO2021070361A1 (ja) 2021-04-15

Family

ID=75437837

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/040235 WO2021070361A1 (ja) 2019-10-11 2019-10-11 維持置換確率生成装置、維持置換撹乱装置、維持置換確率生成方法、維持置換撹乱方法、プログラム

Country Status (3)

Country Link
US (1) US20220382896A1 (ja)
JP (1) JP7231053B2 (ja)
WO (1) WO2021070361A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015230358A (ja) * 2014-06-04 2015-12-21 日本電信電話株式会社 撹乱再構築システム、撹乱装置、再構築装置、撹乱再構築方法及びプログラム
JP2018533087A (ja) * 2016-09-22 2018-11-08 三菱電機株式会社 データ撹乱装置およびデータ撹乱システム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9043250B2 (en) * 2012-01-10 2015-05-26 Telcordia Technologies, Inc. Privacy-preserving aggregated data mining
US8893292B2 (en) * 2012-11-14 2014-11-18 Mitsubishi Electric Research Laboratories, Inc. Privacy preserving statistical analysis for distributed databases
US10395059B2 (en) * 2015-07-15 2019-08-27 Privacy Analytics Inc. System and method to reduce a risk of re-identification of text de-identification tools
US10956603B2 (en) * 2016-04-07 2021-03-23 Samsung Electronics Co., Ltd. Private dataaggregation framework for untrusted servers
SG11201809476VA (en) * 2016-04-29 2018-11-29 Privitar Ltd Computer-implemented privacy engineering system and method
US10984113B1 (en) * 2018-12-18 2021-04-20 NortonLifeLock Inc. Identifying and protecting against a computer security threat while preserving privacy of individual client devices using differential privacy machine learning for streaming data
US11361084B1 (en) * 2018-12-18 2022-06-14 NortonLifeLock Inc. Identifying and protecting against a computer security threat while preserving privacy of individual client devices using differential privacy for text documents

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015230358A (ja) * 2014-06-04 2015-12-21 日本電信電話株式会社 撹乱再構築システム、撹乱装置、再構築装置、撹乱再構築方法及びプログラム
JP2018533087A (ja) * 2016-09-22 2018-11-08 三菱電機株式会社 データ撹乱装置およびデータ撹乱システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HASEGAWA, SATOSHI ET AL.: "Probabilistic k anonymity high-dimensional data publication via matrix factorization", ABSTRACTS OF COMPUTER SECURITY, vol. 2016, no. 2, 4 October 2016 (2016-10-04), pages 936 - 942 *
KIKUCHI, RYO ET AL.: "Probabilistic k-anonymization that realizes high utility by data distribution dependent processing", ABSTRACTS OF SYMPOSIUM ON CRYPTOGRAPHY AND INFORMATION SECURITY 2013, 22 January 2013 (2013-01-22), pages 1 - 8 *

Also Published As

Publication number Publication date
US20220382896A1 (en) 2022-12-01
JPWO2021070361A1 (ja) 2021-04-15
JP7231053B2 (ja) 2023-03-01

Similar Documents

Publication Publication Date Title
Oliva et al. Multilevel thresholding segmentation based on harmony search optimization
US11816224B2 (en) Assessing and managing computational risk involved with integrating third party computing functionality within a computing system
US20210374862A1 (en) Systems and methods for quantum based optimization of an efficient frontier determination
JP2019512128A (ja) データの秘匿性−実用性間のトレードオフを算出するためのシステムおよび方法
Su et al. Stochastic gradient boosting frequency-severity model of insurance claims
CN109918404A (zh) 企业黑名单数据分析方法、装置、计算机设备及存储介质
CN113449880A (zh) 用于纵向联邦学习决策树模型的异构加速系统及方法
Tumpach et al. Prediction of the bankruptcy of Slovak companies using neural networks with SMOTE
CN117742618A (zh) 一种固态硬盘的数据存储管理方法和固态硬盘管理装置
Bui et al. A combination of genetic algorithm and dynamic relaxation method for practical form-finding of tensegrity structures
WO2021070361A1 (ja) 維持置換確率生成装置、維持置換撹乱装置、維持置換確率生成方法、維持置換撹乱方法、プログラム
US20010025281A1 (en) Method for access control of aggregated data
Dhanasekaran et al. Enhanced Map Reduce Techniques for Big Data Analytics based on K-Means Clustering
Zhang et al. Application of random forest classifier in loan default forecast
Gupta et al. Challenges and opportunities of Management Information Systems in Business
Mahajan et al. Big data security
Brito Filho et al. Application of bayesian additive regression trees in the development of credit scoring models in Brazil
JP7290169B2 (ja) 識別推定リスク評価装置、識別推定リスク評価方法、プログラム
WO2023135636A1 (ja) 秘密クラスタ計算システム、秘密クラスタ計算装置、秘密クラスタ計算方法、プログラム
WO2023135635A1 (ja) 秘密乱数計算システム、秘密乱数計算装置、秘密乱数計算方法、秘密クラスタ計算システム、秘密クラスタ計算装置、秘密クラスタ計算方法、プログラム
Doko et al. An overview of big data analytics in banking: Approaches, challenges and issues
WO2023223452A1 (ja) ドリフト検知システム、ドリフト検知装置、ドリフト検知方法、プログラム
Pathak Explainable AI for ML Ops
Xiao et al. Cbase-ec: Achieving optimal throughput-storage efficiency trade-off using erasure codes
CN113474778B (zh) 匿名化装置、匿名化方法、计算机可读取的记录介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19948302

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021551074

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19948302

Country of ref document: EP

Kind code of ref document: A1