WO2020054403A1 - 秘密統計処理システム、方法、統計処理装置及びプログラム - Google Patents

秘密統計処理システム、方法、統計処理装置及びプログラム Download PDF

Info

Publication number
WO2020054403A1
WO2020054403A1 PCT/JP2019/033606 JP2019033606W WO2020054403A1 WO 2020054403 A1 WO2020054403 A1 WO 2020054403A1 JP 2019033606 W JP2019033606 W JP 2019033606W WO 2020054403 A1 WO2020054403 A1 WO 2020054403A1
Authority
WO
WIPO (PCT)
Prior art keywords
statistical processing
cross
secret
tabulation table
plain text
Prior art date
Application number
PCT/JP2019/033606
Other languages
English (en)
French (fr)
Inventor
哲士 田中
麻美 宮島
元 高橋
大 五十嵐
浩気 濱田
亮 菊池
仁 冨士
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to US17/274,187 priority Critical patent/US11880489B2/en
Publication of WO2020054403A1 publication Critical patent/WO2020054403A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09CCIPHERING OR DECIPHERING APPARATUS FOR CRYPTOGRAPHIC OR OTHER PURPOSES INVOLVING THE NEED FOR SECRECY
    • G09C1/00Apparatus or methods whereby a given sequence of signs, e.g. an intelligible text, is transformed into an unintelligible sequence of signs by transposing the signs or groups of signs or by replacing them by others according to a predetermined system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2209/00Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
    • H04L2209/46Secure multiparty computation, e.g. millionaire problem

Definitions

  • the present invention relates to a cryptographic application technology, and particularly to a secret calculation technology that performs data processing without revealing input data.
  • a secret calculation As a method of obtaining a specific operation result without restoring an encrypted numerical value (for example, see Non-Patent Document 1).
  • secret calculation encryption is performed to disperse fragments of numerical values to three or more arbitrary number of secret calculation devices, and addition / subtraction, constant multiplication, multiplication, logical operation, data format without restoring the original numerical values You can do the conversion. Further, by the secret calculation, it is possible to keep these operation results as encrypted, that is, as distributed fragments.
  • the object of the present invention is to provide a secret statistical processing system, method, statistical processing device, and program for performing statistical processing such as processing for obtaining parameters of logistic regression analysis faster than in the past.
  • a secret statistics processing system includes a cross tabulation table calculation device that secretly calculates a cross tabulation table whose frequency is plaintext while keeping each record concealed, and a crosstabulation device that has a plaintext frequency.
  • a statistical processing device for performing predetermined statistical processing using the table.
  • FIG. 1 is a diagram illustrating an example of a functional configuration of the secret statistical processing system.
  • FIG. 2 is a diagram illustrating an example of a processing procedure of the secret statistical processing method.
  • FIG. 3 is a diagram illustrating an example of the cross tabulation table.
  • the cross tabulation table is a table summarizing the frequencies for each combination of attribute values for a plurality of category attributes.
  • the cross tabulation table is a table in which the frequencies corresponding to each combination (x, y) of the attribute values are summarized. For example, assuming that the explanatory variable has two attributes (x 1 , x 2 ) and the objective variable has one attribute y for the sake of simplicity of explanation, if these three attributes (x 1 ⁇ x 2 ⁇ y) The cross tabulation table is as shown in FIG.
  • a 1 ,..., A l1 are attribute values of the attribute x 1
  • l 1 is the number of attribute values of the attribute x 1
  • l1 in the subscript of a l1 means “l 1 ”.
  • the expressions of further superscripts and subscripts may be omitted.
  • further superscript and subscript representations may be omitted.
  • a 1 ,..., a l2 are attribute values of the attribute x 2
  • l 2 is the number of attribute values of the attribute x 2 .
  • n i, j is the attribute value of the attribute x 1 is a i
  • the attribute value of the attribute x 2 a is b j
  • a frequency of attribute values of the attribute y is 0.
  • m i, j is the attribute value of the attribute x 1 is a i
  • the attribute value of the attribute x 2 a is b j
  • a frequency of attribute values of the attribute y is 1.
  • the processing required for statistical processing such as division, logistic analysis such as exponential function, etc. should be performed by ordinary calculation other than secret calculation based on the frequency of the obtained cross tabulation table Can be. Therefore, in the present invention, after the cross-tabulation table is obtained, based on the frequency of the obtained cross-tabulation table, division, an exponential function, or the like, is performed by a normal calculation other than the secret calculation. Do. This makes it possible to perform statistical processing such as processing for obtaining parameters for logistic regression analysis faster than in the past.
  • the secret statistical processing system includes, for example, a cross-tabulation table calculation device 2 and a statistical processing device 3.
  • the secret statistical processing system may further include one or more registration devices 1.
  • the secret statistical processing method is realized, for example, by the secret statistical processing system performing the processing of steps S1 to S3 described below and shown in FIG.
  • Each registration device 1 holds each record required to create a cross tabulation table.
  • the registration device 1 is a computer that holds information on each individual such as a health insurance union and a company.
  • the records required to create the cross tabulation table are, for example, information on health of each individual, such as height, weight, blood pressure, and the like.
  • Each registration device 1 transmits information on each record required to create a cross tabulation to the cross tabulation calculation device 2. For example, each registration device 1 generates N pieces by secretly distributing each record necessary for creating a cross tabulation, and generates these pieces as information necessary for creating a cross tabulation. The N pieces are transmitted to the cross tabulation calculation device 2.
  • the cross-tabulation table calculation device 2 confidentially calculates the cross-tabulation table whose frequency is in plain text while keeping each record concealed (step S2).
  • the cross tabulation calculation device 2 includes, for example, a management device 21 and N secret calculation devices 221,..., 22N. N is a predetermined positive integer of 2 or more. Hereinafter, the processing of the cross tabulation calculation device 2 in this case will be described.
  • the management device 21 transmits the information on each input record to the secret calculation devices 221,..., 22N (step S21). For example, when the information about each input record is N pieces of secretly shared information, the management device 21 transmits the N pieces to the secret calculation devices 221,..., 22N, respectively.
  • the secret calculation devices 221,..., 22N perform secret calculation on the cross tabulation table in which the counts are secretly shared and the fragments are obtained while each record is kept concealed (step S22). In other words, the secret calculation devices 221,..., 22N do not reconstruct the N pieces of secretly shared, but secretly calculate the cross tabulation table whose frequency is secretly shared and which is a fragment (for example, Reference Document 1). reference).
  • Reference Document 1 Igarashi Dai, Koji Senda, Hiroki Hamada, Katsumi Takahashi, "Efficient Lightweight Verifiable Three-Party Secure Function Calculation and Secure Database Processing Using It", 2011 Cryptography and Information Security Symposium
  • the secret calculation devices 221,..., 22N transmit to the management device 21 a cross tabulation table in which the frequencies are secretly shared and are fragments (step S23).
  • the management device 21 calculates the cross tabulation table in which the frequency is in plain text by restoring the fragment, in other words, by restoring the frequency that is a fragment of the cross tabulation table (step S24).
  • the management device 21 transmits the calculated cross tabulation table to the statistical processing device 3 (Step S25).
  • the statistical processing device 3 receives, as input, the cross tabulation table transmitted by the cross tabulation calculation device 2 and having a plain text count.
  • the statistical processing device 3 performs a predetermined statistical process using the cross tabulation table whose frequency is plain text (step S3).
  • the predetermined statistical processing by the statistical processing device 3 is performed not in secret calculation but in plain text.
  • the predetermined statistical processing is a processing including an operation that becomes slow when performed by a secret calculation such as division or an exponential function.
  • An example of the predetermined statistical process is a process of calculating parameters for logistic regression analysis.
  • the statistical processing device 3 obtains the parameters w 0 , w 1 , w 2 of the logistic regression analysis such that the values of these partially differentiated expressions are sufficiently close to 0.
  • the statistical processing device 3 performs the following processing, where d is a predetermined integer of 1 or more.
  • d is a predetermined integer of 1 or more.
  • the statistical processing device 3 sets the parameter ⁇ to a predetermined value (step S31).
  • the parameter ⁇ is set to a value less than 1 and sufficiently close to 0, for example. In other words, it is set so that 0 ⁇ ⁇ 1.
  • the predetermined value is, for example, a random value.
  • the statistical processing device 3 ends the process (Step S34).
  • w ⁇ (t) (w 0 (t) , w 1 (t) ,..., W d (t) ) is a parameter of the logistic regression analysis.
  • the predetermined termination condition is, for example,
  • the predetermined termination condition is
  • is the absolute value of x
  • is the L2 norm of the vector v ((v T v) ( 1/2)).
  • the processing from step S33 to step S35 is repeatedly performed until the value of the gradient grad (E (w ⁇ (t) )) satisfies the predetermined end condition.
  • each registration device 1 may transmit a record obtained by randomly replacing a record required to create a cross tabulation to the cross summary table calculation device 2 as information necessary to generate a cross tabulation. Good.
  • the cross-tabulation table calculation device calculates a cross-tabulation table whose frequency is in plain text, based on the randomly replaced records (step S2). In this case, since the records are replaced at random, each record is concealed from the cross tabulation calculation device 2.
  • a program describing this processing content can be recorded on a computer-readable recording medium.
  • a computer-readable recording medium for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.
  • the distribution of the program is performed by selling, transferring, lending, or the like, a portable recording medium such as a DVD or a CD-ROM on which the program is recorded.
  • the program may be stored in a storage device of a server computer, and the program may be distributed by transferring the program from the server computer to another computer via a network.
  • the computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. Then, when executing the processing, the computer reads the program stored in its own storage device and executes the processing according to the read program. Further, as another execution form of the program, the computer may directly read the program from the portable recording medium and execute processing according to the program, and further, the program may be transferred from the server computer to the computer. Each time, the processing according to the received program may be sequentially executed.
  • the program in the present embodiment includes information used for processing by the computer and which is similar to the program (data that is not a direct command to the computer but has characteristics that define the processing of the computer).
  • the present apparatus is configured by executing a predetermined program on a computer, but at least a part of the processing contents may be realized by hardware.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

ロジスティック回帰分析のパラメータを求める処理等の統計処理を従来よりも速く行う技術を提供する。秘密統計処理システムは、各レコードを秘匿化したまま、度数が平文となっているクロス集計表を秘密計算するクロス集計表計算装置2と、度数が平文となっているクロス集計表を用いて、所定の統計処理を行う統計処理装置3と、を備えている。クロス集計表計算装置2は、各レコードを秘匿化したまま、度数が秘密分散され断片となっているクロス集計表を秘密計算する複数の秘密計算装置221,…,22Nと、断片を復元することにより、度数が平文となっているクロス集計表を計算する管理装置21と、を備えていてもよい。

Description

秘密統計処理システム、方法、統計処理装置及びプログラム
 本発明は、暗号応用技術に関し、入力データを明かすことなくデータ処理を行う秘密計算技術に特に関する。
 暗号化された数値を復元することなく、特定の演算結果を得る方法として秘密計算と呼ばれる方法がある(例えば、非特許文献1参照。)。秘密計算により、3台又はそれ以上の任意の台数の秘密計算装置に数値の断片を分散させる暗号化を施し、元の数値を復元することなく、加減算、定数倍、乗算、論理演算、データ形式変換をすることができる。また、秘密計算により、これらの演算結果を暗号化したまま、すなわち、分散された断片のまま保持することができる。さらに、これらの秘密計算を拡張したものとして、複数のデータを秘匿したままソートを実現する秘密ソートや、浮動小数点数を秘密計算で用いる断片の形式で実現し、四則演算や指数関数等の演算を断片のまま処理する方式が知られている。
千田浩司,濱田浩気,五十嵐大,高橋克巳,"軽量検証可能3パーティ秘匿関数計算の再考",In CSS,2010. C.M.ビショップ(著)、元田浩(監訳)、栗田多喜夫(監訳)、樋口知之(監訳)、松本裕治(監訳)、村田昇(監訳)、「パターン認識と機械学習 上」、2012、pp.204-206
 ところで、クロス集計表に対してロジスティック回帰分析のパラメータを求める処理等の統計処理を行うためには、除算や指数関数と言った演算が必要となる(例えば、非特許文献2参照。)。
 しかし、既存の手法ではこれらの演算は秘密計算で実現しているが低速であり、実用的な時間で実現することができない場合があった。
 本発明は、ロジスティック回帰分析のパラメータを求める処理等の統計処理を従来よりも速く行う秘密統計処理システム、方法、統計処理装置及びプログラムを提供することを目的とする。
 この発明の一態様による秘密統計処理システムは、各レコードを秘匿化したまま、度数が平文となっているクロス集計表を秘密計算するクロス集計表計算装置と、度数が平文となっているクロス集計表を用いて、所定の統計処理を行う統計処理装置と、を備えている。
 ロジスティック回帰分析のパラメータを求める処理等の統計処理を従来よりも速く行うことができる。
図1は、秘密統計処理システムの機能構成の例を示す図である。 図2は、秘密統計処理方法の処理手続きの例を示す図である。 図3は、クロス集計表の例を示す図である。
 以下、この発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
 [技術的背景]
 クロス集計表を用いたロジスティック回帰分析のパラメータを求める処理等の統計処理を行う際に、秘密計算でロジスティック回帰分析のパラメータを求める処理等の統計処理に必要な計算を全て行うと低速となる場合がある。それは、例えば、ロジスティック回帰分析のパラメータを求める処理等の統計処理には、除算、指数関数といった秘密計算で行うと低速になる演算が含まれる場合があるためである。
 ここで、クロス集計表とは、複数のカテゴリ属性を対象に属性値の組み合わせ毎の度数をまとめた表である。言い換えれば、クロス集計表は、属性値の組み合わせ(x,y)のそれぞれに対応する度数をまとめた表である。例えば、説明の簡略化のために、説明変数が2属性(x1,x2)であり、目的変数が1属性yであるとすると、これらの3属性(x1×x2×y)のクロス集計表は、図3のようになる。
 図3において、a1,…,al1は属性x1の属性値であり、l1は属性x1の属性値の個数である。ここで、al1の下付き文字の中のl1は、「l1」を意味する。このように、下付き文字の中では、更なる上付き文字及び下付き文字の表現を省略することがある。同様に、上付き文字の中では、更なる上付き文字及び下付き文字の表現を省略することがある。a1,…,al2は属性x2の属性値であり、l2は属性x2の属性値の個数である。ni,jは、属性x1の属性値がaiであり、属性x2の属性値がbjであり、属性yの属性値が0である場合の度数である。mi,jは、属性x1の属性値がaiであり、属性x2の属性値がbjであり、属性yの属性値が1である場合の度数である。
 ここで、クロス集計表が求まった後は、求まったクロス集計表の度数に基づいて、除算、指数関数等のロジスティック分析等の統計処理に必要な処理を秘密計算ではない通常の計算で行うことができる。そこで、本発明では、クロス集計表が求まった後は、求まったクロス集計表の度数に基づいて、除算、指数関数等の秘密計算で行うと低速になる演算を秘密計算ではない通常の計算で行う。これにより、ロジスティック回帰分析のパラメータを求める処理等の統計処理を従来よりも速く行うことができる。
 [実施形態]
 秘密統計処理システムは、図1に示すように、クロス集計表計算装置2及び統計処理装置3を例えば備えている。秘密統計処理システムは、1個以上の登録装置1を更に備えていてもよい。
 秘密統計処理方法は、秘密統計処理システムが、以下に説明する及び図2に示すステップS1からステップS3の処理を行うことにより例えば実現される。
 <登録装置1>
 各登録装置1は、クロス集計表を作成するために必要な各レコードを保持している。例えば、登録装置1は、健康保険組合、企業等の各個人の情報を保有しているコンピュータである。この場合、クロス集計表を作成するために必要なレコードは、例えば各個人の身長、体重、血圧等の健康に関する情報である。
 各登録装置1は、クロス集計を作成するために必要な各レコードについての情報を、クロス集計表計算装置2に送信する。例えば、各登録装置1は、クロス集計を作成するために必要な各レコードを秘密分散することによりN個の断片を生成し、クロス集計を作成するために必要な情報として、これらの生成されたN個の断片を、クロス集計表計算装置2に送信する。
 <クロス集計表計算装置2>
 クロス集計表計算装置2に、各登録装置1が送信したクロス集計を作成するために必要な各レコードについての情報が入力される。
 クロス集計表計算装置2は、各レコードを秘匿化したまま、度数が平文となっているクロス集計表を秘密計算する(ステップS2)。
 度数が平文となっているクロス集計表は、統計処理装置3に送信される。
 クロス集計表計算装置2は、例えば、管理装置21と、N個の秘密計算装置221,…,22Nとを備えている。Nは、2以上の所定の正の整数である。以下、この場合のクロス集計表計算装置2の処理について説明する。
 各登録装置1が送信したクロス集計を作成するために必要な各レコードについての情報は、管理装置21に入力される。
 管理装置21は、入力された各レコードについての情報を秘密計算装置221,…,22Nに送信する(ステップS21)。例えば、入力された各レコードについての情報が秘密分散されたN個の断片である場合には、管理装置21は、N個の断片をそれぞれ秘密計算装置221,…,22Nに送信する。
 秘密計算装置221,…,22Nは、各レコードを秘匿化したまま、度数が秘密分散され断片となっているクロス集計表を秘密計算する(ステップS22)。言い換えれば、秘密計算装置221,…,22Nは、秘密分散されたN個の断片を復元せずに、度数が秘密分散され断片となっているクロス集計表を秘密計算する(例えば、参考文献1参照)。
 〔参考文献1〕五十嵐大,千田浩司,濱田浩気,高橋克巳,“軽量検証可能3パーティ秘匿関数計算の効率化及びこれを用いたセキュアなデータベース処理”,2011年暗号と情報セキュリティシンポジウム
 秘密計算装置221,…,22Nは、度数が秘密分散され断片となっているクロス集計表を管理装置21に送信する(ステップS23)。
 管理装置21は、断片を復元することにより、言い換えればクロス集計表の断片となっている度数を復元することにより、度数が平文となっているクロス集計表を計算する(ステップS24)。
 管理装置21は、計算したクロス集計表を、統計処理装置3に送信する(ステップS25)。
 <統計処理装置3>
 統計処理装置3には、クロス集計表計算装置2が送信した、度数が平文となっているクロス集計表が入力される。
 統計処理装置3は、度数が平文となっているクロス集計表を用いて、所定の統計処理を行う(ステップS3)。統計処理装置3による所定の統計処理は、秘密計算ではなく平文で行われる。
 所定の統計処理は、除算、指数関数等の秘密計算で行うと低速になる演算を含む処理である。所定の統計処理の例は、ロジスティック回帰分析のパラメータを計算する処理である。
 以下、所定の統計処理が、図3の3属性(x1,x2,y)のクロス集計表についてロジスティック回帰分析のパラメータを計算する処理である場合の統計処理装置3の処理の例を説明する。
 図3の3属性(x1,x2,y)のクロス集計表についてロジスティック回帰分析のパラメータを求めるためには、このクロス集計表の誤差関数E(w)
Figure JPOXMLDOC01-appb-M000001
を最大化すればよい。ここで、ロジスティック回帰分析のパラメータをw0,w1,w2として、w=(w0,w1,w2)であり、x i,j=(1,ai,bj)であり、Tをベクトル又は行列の転置として、
Figure JPOXMLDOC01-appb-M000002
であるとする。
 誤差関数E(w)をw0,w1,w2のそれぞれで偏微分すると以下の式が得られる。
Figure JPOXMLDOC01-appb-M000003
Figure JPOXMLDOC01-appb-I000004
Figure JPOXMLDOC01-appb-I000005
 これらの偏微分した式の値は、
Figure JPOXMLDOC01-appb-M000006
であるため、度数が平文となっているクロス集計表から計算可能である。統計処理装置3は、これらの偏微分した式の値が0に十分近くなるような、ロジスティック回帰分析のパラメータw0,w1,w2を求める。
 そのために、dを所定の1以上の整数として、統計処理装置3は、以下の処理を行う。3属性(x1,x2,y)のクロス集計表の場合は、d=2である。
 統計処理装置3は、パラメータαを所定の値に設定する(ステップS31)。パラメータαは、例えば1未満であり0に十分近い値に設定される。言い換えれば、0<α<<1となるように設定される。
 統計処理装置3は、w→(0)=(w0 (0),w1 (0),…,wd (0))を所定の値に設定する(ステップS32)。また、統計処理装置3は、t=0とする。所定の値は、例えばランダム値である。
 統計処理装置3は、度数が平文となっているクロス集計表から、勾配grad(E(w→(t)))=(∂E(w→(t))/∂w0 (t),∂E(w→(t))/∂w1 (t),…,∂E(w→(t))/∂wd (t))を計算する(ステップS33)。
 統計処理装置3は、勾配grad(E(w→(t)))の値が所定の終了条件を満たす場合には、処理を終了する(ステップS34)。処理終了時のw→(t)=(w0 (t),w1 (t),…,wd (t))が、ロジスティック回帰分析のパラメータとなる。所定の終了条件は、εを所定の正の値として、例えば、||grad(E(w→(t)))||<εである。εは例えば0に近い正の値である。所定の終了条件は、||grad(E(w→(t)))||<ε|E(w→(t))|又は||grad(E(w→(t)))||<ε(1+|E(w→(t))|)であってもよい。ここで、|x|はxの絶対値、||v||はベクトルvのL2ノルム((vTv)(1/2))である。
 勾配grad(E(w→(t)))の値が所定の終了条件を満たさない場合には、統計処理装置3は、w→(t+1)=w→(t)-α・grad(E(w→(t)))を計算する(ステップS35)。
 統計処理装置3は、t=t+1として、言い換えればtを1だけインクリメントして、ステップS33の処理に戻る。これにより、勾配grad(E(w→(t)))の値が所定の終了条件を満たすまで、ステップS33からステップS35の処理が繰り返し行われる。
 このようにして、クロス集計表を用いることによって、個々のレコードのプライバシは保護しながらも、秘密計算では低速となる除算や指数関数を秘密計算を用いない通常のアルゴリズムで実行することで、実用的な時間でのロジスティック回帰分析のパラメータを求めることができる。
 [変形例]
 以上、この発明の実施の形態について説明したが、具体的な構成は、これらの実施の形態に限られるものではなく、この発明の趣旨を逸脱しない範囲で適宜設計の変更等があっても、この発明に含まれることはいうまでもない。
 例えば、各登録装置1は、クロス集計表を作成するために必要なレコードをランダムに入れ替えたものを、クロス集計を作成するために必要な情報として、クロス集計表計算装置2に送信してもよい。
 この場合、クロス集計表計算装置は、ランダムに入れ替えられたレコードに基づいて、度数が平文となっているクロス集計表を計算する(ステップS2)。この場合、レコードは、ランダムに入れ替えられているので、クロス集計表計算装置2に対して、各レコードは秘匿化される。
 また、実施の形態において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
 [プログラム、記録媒体]
 上記説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
 この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
 また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
 このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
 また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
1     登録装置
2     クロス集計表計算装置
21   管理装置
221,…,22N   秘密計算装置
3     統計処理装置

Claims (6)

  1.  各レコードを秘匿化したまま、度数が平文となっているクロス集計表を秘密計算するクロス集計表計算装置と、
     前記度数が平文となっているクロス集計表を用いて、所定の統計処理を行う統計処理装置と、
     を含む秘密統計処理システム。
  2.  請求項1の秘密統計処理システムであって、
     前記統計処理装置は、ロジスティック回帰分析のパラメータを計算する処理を行う、
     秘密統計処理システム。
  3.  請求項2の秘密統計処理システムであって、
     前記クロス集計表計算装置は、各レコードを秘匿化したまま、度数が秘密分散され断片となっているクロス集計表を秘密計算する複数の秘密計算装置と、前記断片を復元することにより、前記度数が平文となっているクロス集計表を計算する管理装置と、を含む、
     秘密統計処理システム。
  4.  請求項1から3の何れかの秘密統計処理システムの統計処理装置。
  5.  クロス集計表計算装置が、各レコードを秘匿化したまま、度数が平文となっているクロス集計表を秘密計算するクロス集計表計算ステップと、
     統計処理装置が、前記度数が平文となっているクロス集計表を用いて、所定の統計処理を行う統計処理ステップと、
     を含む秘密統計処理方法。
  6.  請求項4の統計処理装置の各部としてコンピュータを機能させるためのプログラム。
PCT/JP2019/033606 2018-09-10 2019-08-28 秘密統計処理システム、方法、統計処理装置及びプログラム WO2020054403A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/274,187 US11880489B2 (en) 2018-09-10 2019-08-28 Secret statistical processing systems, methods, statistical processing apparatus and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-168573 2018-09-10
JP2018168573A JP7159717B2 (ja) 2018-09-10 2018-09-10 秘密統計処理システム、方法、統計処理装置及びプログラム

Publications (1)

Publication Number Publication Date
WO2020054403A1 true WO2020054403A1 (ja) 2020-03-19

Family

ID=69777558

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/033606 WO2020054403A1 (ja) 2018-09-10 2019-08-28 秘密統計処理システム、方法、統計処理装置及びプログラム

Country Status (3)

Country Link
US (1) US11880489B2 (ja)
JP (1) JP7159717B2 (ja)
WO (1) WO2020054403A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7118198B1 (ja) 2021-03-26 2022-08-15 エヌ・ティ・ティ・コミュニケーションズ株式会社 処理システム、処理方法及び処理プログラム
JP2022150498A (ja) * 2021-03-26 2022-10-07 エヌ・ティ・ティ・コミュニケーションズ株式会社 学習プログラム、学習方法及び学習装置
JP7118199B1 (ja) 2021-03-26 2022-08-15 エヌ・ティ・ティ・コミュニケーションズ株式会社 処理システム、処理方法及び処理プログラム
CN115632761B (zh) * 2022-08-29 2023-06-23 哈尔滨工业大学(深圳) 基于秘密共享的多用户分布式隐私保护回归方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016178291A1 (ja) * 2015-05-07 2016-11-10 日本電気株式会社 秘密計算データ利用システムと方法と装置並びにプログラム
WO2017119211A1 (ja) * 2016-01-07 2017-07-13 ソニー株式会社 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016178291A1 (ja) * 2015-05-07 2016-11-10 日本電気株式会社 秘密計算データ利用システムと方法と装置並びにプログラム
WO2017119211A1 (ja) * 2016-01-07 2017-07-13 ソニー株式会社 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Trial Service of Secure Computation System San-Shi@ -Toward safe and secure use of confidential data", BUSINESS COMMUNICATION, vol. 55, no. 9, 1 September 2018 (2018-09-01), pages 50 - 51 *
IGARASHI, DAI ET AL.: "The optimization of Lightweight verifiable 3-party secure function evaluation and secure database processing using it", THE 2011 SYMPOSIUM ON CRYPTOGRAPHY AND INFORMATION SECURITY (SCIS 2011) [ CD-ROM, 28 January 2011 (2011-01-28) *

Also Published As

Publication number Publication date
JP7159717B2 (ja) 2022-10-25
JP2020042128A (ja) 2020-03-19
US20210342476A1 (en) 2021-11-04
US11880489B2 (en) 2024-01-23

Similar Documents

Publication Publication Date Title
WO2020054403A1 (ja) 秘密統計処理システム、方法、統計処理装置及びプログラム
Archer et al. From keys to databases—real-world applications of secure multi-party computation
Goodrich et al. Privacy-preserving group data access via stateless oblivious RAM simulation
Epiphaniou et al. Electronic regulation of data sharing and processing using smart ledger technologies for supply-chain security
JP6321049B2 (ja) 秘密計算方法、秘密計算システム
Ribeiro et al. XDS-I outsourcing proxy: ensuring confidentiality while preserving interoperability
WO2014007296A1 (ja) 順序保存暗号化システム、暗号化装置、復号化装置、暗号化方法、復号化方法およびこれらのプログラム
Huang et al. Outsourced private information retrieval
Zaw et al. Database security with AES encryption, elliptic curve encryption and signature
US11250004B2 (en) Secure equijoin system, secure equijoin device, secure equijoin method, and program
Sakellariou et al. Homomorphically encrypted k-means on cloud-hosted servers with low client-side load
Knapp et al. Epoch confidentiality in updatable encryption
WO2018008547A1 (ja) 秘密計算システム、秘密計算装置、秘密計算方法、およびプログラム
JP7060115B2 (ja) 秘密配列アクセス装置、秘密配列アクセス方法、およびプログラム
Messmer et al. A novel cryptographic framework for cloud file systems and CryFS, a provably-secure construction
Shalabi et al. Cryptographically enforced role-based access control for NoSQL distributed databases
WO2019221108A1 (ja) 秘密クロス集計システム、秘密計算装置、秘密クロス集計方法、およびプログラム
US20180270056A1 (en) Matrix and key generation device, matrix and key generation system, matrix coupling device, matrix and key generation method, and program
Sanamrad et al. Query log attack on encrypted databases
Satyanarayana Murty et al. A Hybrid Intelligent Cryptography Algorithm for Distributed Big Data Storage in Cloud Computing Security
Patel et al. A survey: Secure cloud data storage and access control system using blockchain
Inamdar et al. Data Security in Hadoop Distributed File System
Ma et al. Multi-source Data Collection Data Security Analysis
Zhang et al. Achieving proof of shared ownership for the shared file in collaborative cloud applications
JP7359225B2 (ja) 秘密最大値計算装置、方法及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19858825

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19858825

Country of ref document: EP

Kind code of ref document: A1