JP5651568B2 - Database disturbance device, system, method and program - Google Patents

Database disturbance device, system, method and program Download PDF

Info

Publication number
JP5651568B2
JP5651568B2 JP2011223770A JP2011223770A JP5651568B2 JP 5651568 B2 JP5651568 B2 JP 5651568B2 JP 2011223770 A JP2011223770 A JP 2011223770A JP 2011223770 A JP2011223770 A JP 2011223770A JP 5651568 B2 JP5651568 B2 JP 5651568B2
Authority
JP
Japan
Prior art keywords
database
disturbance
unit
attribute value
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011223770A
Other languages
Japanese (ja)
Other versions
JP2013083801A (en
Inventor
大 五十嵐
大 五十嵐
千田 浩司
浩司 千田
亮 菊池
亮 菊池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011223770A priority Critical patent/JP5651568B2/en
Publication of JP2013083801A publication Critical patent/JP2013083801A/en
Application granted granted Critical
Publication of JP5651568B2 publication Critical patent/JP5651568B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

この発明は、プライバシーを保護しながらデータマイニングを行う技術に関する。   The present invention relates to a technique for performing data mining while protecting privacy.

いわゆるPk−匿名性を満たすデータベース撹乱技術が、特許文献1で提案されている(例えば、特許文献1参照。)。   A database disturbance technique that satisfies so-called Pk-anonymity is proposed in Patent Document 1 (see, for example, Patent Document 1).

Pk−匿名性は、データベースの各レコードと、その各レコードに対応する個人とを1/k以上の確率で結びつけることができないという性質である。   Pk-anonymity is a property that each record in the database and an individual corresponding to each record cannot be associated with a probability of 1 / k or more.

特開2011−100116号公報JP 2011-100116 A

しかしながら、特許文献1の技術は属性値がいわゆるカテゴリ属性値であることを想定しており、属性値がいわゆる数値属性値である場合には非特許文献1の技術を適用することができない。   However, the technique of Patent Document 1 assumes that the attribute value is a so-called category attribute value, and the technique of Non-Patent Document 1 cannot be applied when the attribute value is a so-called numeric attribute value.

この発明の課題は、属性値が数値属性値である場合にも適用することができる、Pk−匿名性を満たすデータベース撹乱装置、システム、方法及びプログラムを提供することである。   The subject of this invention is providing the database disturbance apparatus, system, method, and program which satisfy | fill Pk-anonymity which can be applied also when an attribute value is a numerical attribute value.

この発明の一態様によるデータベース撹乱装置は、データベースは複数のレコードを含み、各レコードはレコード識別子及び少なくとも1つの属性値を含み、||・||を・のL1距離とし、σを所定の値として、データベースに含まれる一部又は全部の属性値のそれぞれについて、下記の式により定義される分散2σのラプラス分布に従う値を加算する撹乱部を備える。 In the database disturbance device according to one aspect of the present invention, the database includes a plurality of records, each record includes a record identifier and at least one attribute value, || · || 1 is an L1 distance of •, and σ is a predetermined value For each or all of the attribute values included in the database, a disturbance unit that adds a value according to a Laplace distribution with a variance 2σ 2 defined by the following equation is provided.

Figure 0005651568
Figure 0005651568

属性値が数値属性値である場合にも適用することができる。   The present invention can also be applied when the attribute value is a numerical attribute value.

第一実施形態のデータベース撹乱システムを説明するためのブロック図。The block diagram for demonstrating the database disturbance system of 1st embodiment. 第一実施形態のデータベース撹乱システムを説明するための流れ図。The flowchart for demonstrating the database disturbance system of 1st embodiment. 第二実施形態のデータベース撹乱システムを説明するための流れ図。The flowchart for demonstrating the database disturbance system of 2nd embodiment. データベース撹乱システムの変形例を説明するためのブロック図。The block diagram for demonstrating the modification of a database disturbance system. データベース撹乱システムの変形例を説明するためのブロック図。The block diagram for demonstrating the modification of a database disturbance system. データベース撹乱システムの変形例を説明するためのブロック図。The block diagram for demonstrating the modification of a database disturbance system. 第一実施形態で撹乱の対象となるデータベースの例を説明するための図。The figure for demonstrating the example of the database used as the object of disturbance in 1st embodiment. 第二実施形態で撹乱の対象となるデータベースの例を説明するための図。The figure for demonstrating the example of the database used as the object of disturbance in 2nd embodiment.

以下、図面を参照して、この発明の実施形態を説明する。   Embodiments of the present invention will be described below with reference to the drawings.

[第一実施形態]
第一実施形態のデータベース撹乱システムは、図1に例示するように、撹乱装置1及び集計装置2を備えている。
[First embodiment]
The database disturbance system of 1st embodiment is provided with the disturbance apparatus 1 and the totaling apparatus 2, as illustrated in FIG.

撹乱装置1は、データベース記憶部11と、撹乱部12と、パラメータ決定部13とを例えば備えている。この例では、撹乱部12は、並替部14を備える。   The disturbance device 1 includes a database storage unit 11, a disturbance unit 12, and a parameter determination unit 13, for example. In this example, the disturbance unit 12 includes a rearrangement unit 14.

集計装置2は、集計部21を例えば備えている。   The counting device 2 includes a counting unit 21, for example.

データベース記憶部11には、撹乱の対象となるデータベースが記憶されている。データベース記憶部11に記憶されたデータベースについての情報は、撹乱部12に送信される。   The database storage unit 11 stores a database to be disturbed. Information about the database stored in the database storage unit 11 is transmitted to the disturbance unit 12.

データベースは、図7に例示するように、複数のレコードから構成されている。   The database is composed of a plurality of records as illustrated in FIG.

各レコードは、レコード識別子と少なくとも1つの属性値とから構成されている。レコード識別子は、個人を識別する識別子であり、いわゆるレコードIDである。レコード識別子は、例えば氏名や氏名に対応するID番号である。   Each record is composed of a record identifier and at least one attribute value. The record identifier is an identifier for identifying an individual and is a so-called record ID. The record identifier is, for example, a name or an ID number corresponding to the name.

各属性値は、第一実施形態では、n次元実数ベクトルの部分集合Vに含まれるベクトルであり、いわゆる数値属性値である。nは、1以上の整数である。n=1であり属性が例えば「中間テストの点数」や「期末テストの点数」である場合には、属性値は0から100までの何れかの整数である。   In the first embodiment, each attribute value is a vector included in the subset V of the n-dimensional real vector, and is a so-called numerical attribute value. n is an integer of 1 or more. When n = 1 and the attribute is, for example, “intermediate test score” or “term test score”, the attribute value is any integer from 0 to 100.

撹乱部12は、データベース記憶部11から読み込んだデータベースに含まれる一部又は全部の属性値のそれぞれについて、下記の式により定義される、平均μであり分散2σのラプラス分布に従う値を加算することによりデータベースの撹乱を行う(ステップS1)。撹乱されたデータベースは、並替部14に送信される。撹乱の対象となる属性値が複数ある場合には、それらの複数の属性値を独立に撹乱してもよいし、従属に撹乱してもよい。 The disturbance unit 12 adds a value according to the Laplace distribution of mean μ and variance 2σ 2 defined by the following formula for each or all of the attribute values included in the database read from the database storage unit 11. Thus, the database is disturbed (step S1). The disturbed database is transmitted to the rearrangement unit 14. When there are a plurality of attribute values to be disturbed, the plurality of attribute values may be disturbed independently or may be subordinately disturbed.

Figure 0005651568
Figure 0005651568

||・||は・のいわゆるL1距離であり、・がn次元実数ベクトルである場合には、ベクトル・の各成分の絶対値の総和である。nは1以上の整数である。 || · || 1 is the so-called L1 distance of, and when is an n-dimensional real vector, it is the sum of the absolute values of the components of the vector. n is an integer of 1 or more.

例えば、μ=0とする。この場合、撹乱部12が用いるラプラス分布は以下のようになる。   For example, μ = 0. In this case, the Laplace distribution used by the disturbance unit 12 is as follows.

Figure 0005651568
Figure 0005651568

以下、「ラプラス分布に従う値」について説明する。まず、ラプラス分布を含む一般の確率密度関数fに従う値について説明する。   Hereinafter, the “value according to the Laplace distribution” will be described. First, a value according to a general probability density function f including a Laplace distribution will be described.

1.「確率密度関数fに従う値」について
(1)確率密度関数fの定義域及び属性値が1次元の場合
(i)累積分布関数F(x)=∫−∞ f(x’)dx’を求める。
1. Regarding “value according to probability density function f” (1) When domain and attribute value of probability density function f are one-dimensional (i) Cumulative distribution function F (x) = ∫− x f (x ′) dx ′ Ask.

(ii)累積分布関数F(x)の逆関数F−1を求める。 (Ii) An inverse function F −1 of the cumulative distribution function F (x) is obtained.

(iii)区間[0,1]上の一様乱数rを生成する。   (Iii) Generate a uniform random number r on the interval [0, 1].

(iv)F−1(r)を「確率密度関数fに従う値」として出力する。 (Iv) F −1 (r) is output as “a value according to the probability density function f”.

累積分布関数F(x)や逆関数F−1が数式で得られる場合にはその数式に基づいてF−1(r)を計算してもよいし、そうでない場合には数値計算によってF−1(r)を計算してもよい。 When the cumulative distribution function F (x) or the inverse function F −1 is obtained by a mathematical formula, F −1 (r) may be calculated based on the mathematical formula. Otherwise, F is calculated by numerical calculation. 1 (r) may be calculated.

(2)確率密度関数fの定義域及び属性値がn次元の場合
i=0,…,n−1のそれぞれに対して、以下の(i)(ii)を行う。
(2) When the domain and the attribute value of the probability density function f are n-dimensional: The following (i) and (ii) are performed for each of i = 0,.

(i)xからxi−1までを固定し、xi+1からxn−1までを積分し、xだけを変数として残した確率密度関数fを求める。 (I) x 0 to x i−1 are fixed, x i + 1 to x n−1 are integrated, and a probability density function f i in which only x i is left as a variable is obtained.

Figure 0005651568
Figure 0005651568

(ii)確率密度関数fの定義域は1次元なので、上記「(1)確率密度関数fの定義域及び属性値が1次元の場合」で示した方法と同様の方法により、「確率密度関数fに従う値」を計算する。 (Ii) Since the domain of the probability density function f i is one-dimensional, the “probability density” is determined by a method similar to the method described above in “(1) When the domain and attribute value of the probability density function f are one-dimensional”. The value according to the function f i is calculated.

i=0,…,n−1のそれぞれに対して「確率密度関数fに従う値」を計算することにより、n個の「確率密度関数fに従う値」が得られる。 By calculating “value according to probability density function f i ” for each of i = 0,..., n−1, n “values according to probability density function f i ” are obtained.

上記の方法を、確率密度関数がラプラス分布の場合に当てはめると以下のようになる。   Applying the above method when the probability density function is a Laplace distribution is as follows.

2.「ラプラス分布に従う値」について
(1)ラプラス分布の定義域及び属性値が1次元の場合
(i)区間[0,1]上の一様乱数r、区間(0,1)上の一様乱数bを生成する。
2. About “value according to Laplace distribution” (1) When the domain and attribute value of Laplace distribution are one-dimensional (i) Uniform random number r on interval [0, 1], Uniform random number on interval (0, 1) b is generated.

(ii)(−1)σlogr+μを「ラプラス分布に従う値」として出力する。 (Ii) (-1) b σlogr + μ is output as “value according to Laplace distribution”.

(2)ラプラス分布の定義域及び属性値がn次元の場合
(i)上記「(1)ラプラス分布の定義域及び属性値が1次元の場合」で示した方法と同様の方法により、n個の「ラプラス分布に従う値」であるx,x,…,xn−1を計算する。
(2) When the domain and attribute value of the Laplace distribution are n-dimensional (i) n in the same manner as the method described in “(1) When the domain and attribute value of the Laplace distribution is one-dimensional” above X 0 , x 1 ,..., X n−1 which are “values according to the Laplace distribution”.

(ii)これらのx,x,…,xn−1を「ラプラス分布に従う値」として出力する。 (Ii) These x 0 , x 1 ,..., X n−1 are output as “values according to Laplace distribution”.

並替部14は、撹乱部12により撹乱されたデータベースに含まれるレコードの順序を並び替える(ステップS2)。レコードが並び替えられたデータベースは、集計装置2に送信される。   The rearrangement unit 14 rearranges the order of records included in the database disturbed by the disturbance unit 12 (step S2). The database in which the records are rearranged is transmitted to the aggregation device 2.

並び替えの対象となるのは、データベースに含まれる全部又は一部のレコードである。レコードの並び替えは、一様ランダムに行われてもよいし、ランダムに行われてもよいし、一部又は全部の属性値についての昇順、降順等の所定の並替規則に基づいて行われてもよい。   The target of rearrangement is all or a part of records included in the database. Records may be rearranged uniformly, randomly, or based on a predetermined rearrangement rule such as ascending or descending order for some or all attribute values. May be.

属性値の種類の数が1である場合には、属性値が属するn次元実数ベクトルの部分集合Vの元をu,vとすると、σは下記式(1)又は(2)を満たすように予め定められているとする。|R|は、データベースのレコードの数である。   When the number of types of attribute value is 1, assuming that the elements of the subset V of the n-dimensional real vector to which the attribute value belongs are u and v, σ satisfies the following formula (1) or (2): Suppose that it is predetermined. | R | is the number of records in the database.

Figure 0005651568
Figure 0005651568

属性値の種類の数が2以上である場合には、各属性値aが属するn次元実数ベクトルの部分集合Vの元をu,vとすると、σは下記式(3)又は(4)を満たすように予め定められているとする。 When the number of types of attribute values is 2 or more, assuming that the elements of the subset V a of the n-dimensional real vector to which each attribute value a belongs are u and v, σ is the following formula (3) or (4) It is assumed that it is predetermined so as to satisfy

Figure 0005651568
Figure 0005651568

パラメータ決定部13が、予め定められたkに基づいて、上記(1)から(4)の式を満たすσを決定してもよい(ステップS0)。この場合、パラメータ決定部13により決定されたσは、撹乱部12に送信される。   The parameter determination unit 13 may determine σ that satisfies the expressions (1) to (4) based on k determined in advance (step S0). In this case, σ determined by the parameter determination unit 13 is transmitted to the disturbance unit 12.

このようにして撹乱されたデータベースは、いわゆるPk−匿名性を満たす。ここでは、その証明を省略する。Pk−匿名性は、データベースの各レコードと、その各レコードに対応する個人とを1/k以上の確率で結びつけることができないという性質である。   The database disturbed in this way satisfies so-called Pk-anonymity. Here, the proof is omitted. Pk-anonymity is a property that each record in the database and an individual corresponding to each record cannot be associated with a probability of 1 / k or more.

したがって、このようにして撹乱されたデータベースは、Pk−匿名性という明確な基準で匿名性が保障される。また、撹乱前のデータベース及び撹乱後のデータベースを用いずに匿名性を保障することができる。   Therefore, the database disturbed in this way is assured of anonymity on the clear basis of Pk-anonymity. Moreover, anonymity can be ensured without using the database before disturbance and the database after disturbance.

集計部21は、撹乱装置1により撹乱されたデータベースを用いて集計処理を行う(ステップS3)。集計部21は、例えば、参考文献1に記載された反復ベイズ手法等を用いて、クロス集計等の集計結果を推定する。   The counting unit 21 performs a counting process using the database disturbed by the disturbing device 1 (step S3). The tabulation unit 21 estimates a tabulation result such as a cross tabulation using, for example, an iterative Bayesian method described in Reference Document 1.

〔参考文献1〕
五十嵐大,外2名,「多値属性に適用可能な効率的プライバシー保護クロス集計」,コンピュータセキュリティシンポジウム2008
[第二実施形態]
第一実施形態は、データベースの全ての属性値がいわゆる数値属性値である場合のデータベース撹乱システムであった。これに対して、第二実施形態は、データベースの属性値がいわゆるカテゴリ属性値を含む場合のデータベース撹乱システムである。第二実施形態で撹乱の対象となるデータベースの例を図8に示す。
[Reference 1]
University of Igarashi, 2 others, “Efficient privacy protection cross-tabulation applicable to multi-valued attributes”, Computer Security Symposium 2008
[Second Embodiment]
The first embodiment is a database disruption system in the case where all the attribute values of the database are so-called numerical attribute values. On the other hand, 2nd embodiment is a database disturbance system in case the attribute value of a database contains what is called a category attribute value. An example of a database to be disturbed in the second embodiment is shown in FIG.

カテゴリ属性値とは、例えば性別等の属性値であり、数値属性値とは異なり属性値の取り得る値がいくつかに制限されている属性値のことである。   The category attribute value is, for example, an attribute value such as gender, and is an attribute value that is limited to several values that the attribute value can take, unlike the numerical attribute value.

以下、第一実施形態と異なる部分を中心に説明する。第一実施形態と同様の部分については説明を省略する。   Hereinafter, a description will be given centering on differences from the first embodiment. Description of the same parts as those in the first embodiment is omitted.

第二実施形態の撹乱部12は、図2のステップS1に代えて、図3のステップS10,S1,S11の処理を行う。   The disturbance part 12 of 2nd embodiment replaces step S1 of FIG. 2, and performs the process of step S10, S1, S11 of FIG.

撹乱部12は、まず、データベース記憶部11から読み込んだデータベースに含まれる一部又は全部の属性値のそれぞれについて、そのそれぞれの属性値がカテゴリ属性値であるか判定する(ステップS10)。   First, the disturbance unit 12 determines whether or not each attribute value is a category attribute value for each of some or all of the attribute values included in the database read from the database storage unit 11 (step S10).

属性値がカテゴリ属性値でない場合には、すなわち数値属性値である場合には、撹乱部12は、第一実施形態と同様の方法によりラプラス分布に従う値の加算を行う(ステップS1)。   If the attribute value is not a category attribute value, that is, if it is a numerical attribute value, the disturbing unit 12 adds values according to the Laplace distribution by the same method as in the first embodiment (step S1).

属性値がカテゴリ属性値である場合には、撹乱部12は、その属性値を所定の確率で他のカテゴリ属性値に置換する(ステップS11)。具体的には、いわゆる維持確率ρの維持−置換撹乱を行う。   When the attribute value is a category attribute value, the disturbing unit 12 replaces the attribute value with another category attribute value with a predetermined probability (step S11). Specifically, the so-called maintenance probability ρ is maintained and replaced.

維持確率ρの維持−置換撹乱は、維持確率ρが予め定められているとして、維持確率ρでその属性値を変更せずに維持し、1−ρの確率でその属性値を他のカテゴリ属性値に置換する撹乱方法である。他のカテゴリ属性値に置換するとは、例えば属性が性別であり属性値が「男」である場合には、その属性値「男」を属性値「女」に置換することを意味する。維持確率ρの維持−置換撹乱の詳細については、特許文献1を参照のこと。   The maintenance-replacement disturbance of the maintenance probability ρ assumes that the maintenance probability ρ is predetermined and maintains the attribute value with the maintenance probability ρ without changing the attribute value. This is a disturbance method that replaces the value. For example, when the attribute is gender and the attribute value is “male”, the replacement with another category attribute value means that the attribute value “male” is replaced with the attribute value “female”. See Patent Document 1 for details of maintenance-replacement disturbance of maintenance probability ρ.

属性の種類の数が2以上である場合には、各属性aの属性値が属するn次元実数ベクトルの部分集合Vの元をu,vとすると、σ及び維持確率ρは下記式(5)を満たすように予め定められているとする。例えば、パラメータ決定部13が、予め定められたkに基づいて、下記式(5)の式を満たすσ及び維持確率ρを決定する(ステップS0)。|V|は、属性aのカテゴリ属性値の取り得る値の数である。 When the number of attribute types is 2 or more, assuming that the elements of the subset V a of the n-dimensional real vector to which the attribute value of each attribute a belongs are u and v, σ and the maintenance probability ρ ) To be satisfied in advance. For example, the parameter determination unit 13 determines σ and the maintenance probability ρ that satisfy the following expression (5) based on k determined in advance (step S0). | V a | is the number of possible values of the category attribute value of attribute a.

Figure 0005651568
Figure 0005651568

このようにして撹乱されたデータベースは、第一実施形態と同様に、いわゆるPk−匿名性を満たす。ここでは、その証明を省略する。   The database disturbed in this way satisfies the so-called Pk-anonymity as in the first embodiment. Here, the proof is omitted.

したがって、このようにして撹乱されたデータベースは、第一実施形態と同様に、Pk−匿名性という明確な基準で匿名性が保障される。また、撹乱前のデータベース及び撹乱後のデータベースを用いずに匿名性を保障することができる。   Therefore, the anonymity of the database disturbed in this way is ensured on the basis of the clear standard of Pk-anonymity, as in the first embodiment. Moreover, anonymity can be ensured without using the database before disturbance and the database after disturbance.

[変形例等]
並替部14の処理は行わなくてもよい。この場合、データベースのレコードの並び替えは行われず、撹乱部12により撹乱されたデータベースが集計装置2に送信される。集計装置2は、受信した並び替えが行われていないデータベースに基づいて集計処理を行う。
[Modifications, etc.]
The processing of the rearrangement unit 14 may not be performed. In this case, the database records are not rearranged, and the database disturbed by the disturbing unit 12 is transmitted to the counting device 2. The aggregation device 2 performs aggregation processing based on the received database that has not been rearranged.

撹乱部12が撹乱装置1に備えられ、集計部21が集計装置2に備えられていれば、他の各部はデータベース撹乱システムを構成する装置の何れに備えられていてもよい。   As long as the disturbing unit 12 is provided in the disturbing device 1 and the counting unit 21 is provided in the counting device 2, the other units may be provided in any of the devices constituting the database disturbing system.

例えば、図4に例示するように、パラメータ決定部13が集計装置2に備えられていてもよい。この場合、パラメータ決定部13により決定されたパラメータは、撹乱装置1に送信される。   For example, as illustrated in FIG. 4, the parameter determination unit 13 may be provided in the counting device 2. In this case, the parameter determined by the parameter determination unit 13 is transmitted to the disturbance device 1.

また、例えば、図5に示すように、データベース撹乱システムが、撹乱装置1、集計装置2及び撹乱データサーバ装置3から構成されている場合には、パラメータ決定部13が撹乱データサーバ装置3に備えられていてもよい。この場合、パラメータ決定部13により決定されたパラメータは撹乱装置1に送信され、撹乱装置1により撹乱されたデータベースは撹乱データサーバ装置3を経由して集計装置2に送信される。具体的には、撹乱データサーバ装置3のデータ送受信部31が、撹乱装置1により撹乱されたデータベースを受信して、集計装置2に送信する。   Further, for example, as shown in FIG. 5, when the database disturbance system includes a disturbance device 1, a totaling device 2, and a disturbance data server device 3, the parameter determination unit 13 is provided in the disturbance data server device 3. It may be done. In this case, the parameter determined by the parameter determination unit 13 is transmitted to the disturbance device 1, and the database disturbed by the disturbance device 1 is transmitted to the aggregation device 2 via the disturbance data server device 3. Specifically, the data transmitting / receiving unit 31 of the disturbance data server device 3 receives the database disturbed by the disturbance device 1 and transmits it to the counting device 2.

また、図6に例示するように、データベース撹乱システムに、撹乱装置1及び集計装置2のそれぞれが複数備えられていてもよい。
データベース撹乱装置の各部間のデータの送受信は直接行われてもよいし、図示していない記憶部を介して行われてもよい。データベース撹乱システムの各装置間のデータの送受信は直接行われてもよいし、他の装置を経由して行われてもよい。
Moreover, as illustrated in FIG. 6, a plurality of disturbance devices 1 and aggregating devices 2 may be provided in the database disturbance system.
Data transmission / reception between the respective units of the database disturbance device may be performed directly or may be performed via a storage unit (not shown). Data transmission / reception between the devices of the database disturbance system may be performed directly, or may be performed via other devices.

その他、この発明は上述の実施形態に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。   In addition, the present invention is not limited to the above-described embodiment. For example, the various processes described above are not only executed in time series according to the description, but may also be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes.

また、上述の構成をコンピュータによって実現する場合、各装置が有すべき各部の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各部がコンピュータ上で実現される。   Further, when the above-described configuration is realized by a computer, the processing content of each unit that each device should have is described by a program. Each part is realized on the computer by executing this program on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。   The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.

その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。   Needless to say, other modifications are possible without departing from the spirit of the present invention.

1 撹乱装置
11 データベース記憶部
12 撹乱部
13 パラメータ決定部
14 並替部
21 集計部
2 集計装置
DESCRIPTION OF SYMBOLS 1 Disturbing device 11 Database storage part 12 Disturbing part 13 Parameter determination part 14 Rearrangement part 21 Totaling part 2 Totaling apparatus

Claims (6)

データベースは複数のレコードを含み、各レコードはレコード識別子及び少なくとも1つの属性値を含み、||・||を・のL1距離とし、σを所定の値として、
上記データベースに含まれる一部又は全部の属性値のそれぞれについて、下記の式により定義される分散2σのラプラス分布に従う値を加算する撹乱部、
Figure 0005651568

を含むデータベース撹乱装置。
The database includes a plurality of records, each record includes a record identifier and at least one attribute value, || · || 1 is an L1 distance of •, and σ is a predetermined value,
For each or all of the attribute values included in the database, a disturbance unit that adds a value according to a Laplace distribution with a variance 2σ 2 defined by the following equation:
Figure 0005651568

Database disruptor including.
請求項1のデータベース撹乱装置において、
上記撹乱部により撹乱されたデータベースに含まれるレコードの順序を並び替える並替部を更に含む、
データベース撹乱装置。
The database disruptor of claim 1,
A rearrangement unit for rearranging the order of the records included in the database disturbed by the disturbance unit;
Database disturbance device.
請求項1又は2のデータベース撹乱装置において、
上記撹乱部は、上記それぞれの属性値がカテゴリ属性値である場合には、上記それぞれの属性値を所定の確率で他のカテゴリ属性値に置換する、
データベース撹乱装置。
In the database disturbance apparatus of Claim 1 or 2,
When the respective attribute values are category attribute values, the disturbing unit replaces the respective attribute values with other category attribute values with a predetermined probability.
Database disturbance device.
請求項1から3の何れかのデータベース撹乱装置と、
上記撹乱部により撹乱されたデータベース及び上記並替部によりレコードが並び替えられたデータベースを用いて集計処理を行う集計処理部と、
を含むデータベース撹乱システム。
A database disruptor according to any one of claims 1 to 3;
A tally processing unit that performs tally processing using a database disturbed by the disturbing unit and a database in which records are rearranged by the rearrangement unit;
Including database disturbance system.
データベースは複数のレコードを含み、各レコードはレコード識別子及び少なくとも1つの属性値を含み、||・||を・のL1距離とし、σを所定の値として、
撹乱部が、上記データベースに含まれる一部又は全部の属性値のそれぞれについて、下記の式により定義される分散2σのラプラス分布に従う値を加算する撹乱ステップ、
Figure 0005651568

を含むデータベース撹乱方法。
The database includes a plurality of records, each record includes a record identifier and at least one attribute value, || · || 1 is an L1 distance of •, and σ is a predetermined value,
A disturbance step in which the disturbance unit adds a value according to a Laplace distribution of variance 2σ 2 defined by the following equation for each of some or all of the attribute values included in the database:
Figure 0005651568

Database disruption method including.
請求項1から3の何れかのデータベース撹乱装置の各部としてコンピュータを機能させるためのプログラム。   The program for functioning a computer as each part of the database disturbance apparatus in any one of Claim 1 to 3.
JP2011223770A 2011-10-11 2011-10-11 Database disturbance device, system, method and program Active JP5651568B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011223770A JP5651568B2 (en) 2011-10-11 2011-10-11 Database disturbance device, system, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011223770A JP5651568B2 (en) 2011-10-11 2011-10-11 Database disturbance device, system, method and program

Publications (2)

Publication Number Publication Date
JP2013083801A JP2013083801A (en) 2013-05-09
JP5651568B2 true JP5651568B2 (en) 2015-01-14

Family

ID=48529048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011223770A Active JP5651568B2 (en) 2011-10-11 2011-10-11 Database disturbance device, system, method and program

Country Status (1)

Country Link
JP (1) JP5651568B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5945490B2 (en) * 2011-10-11 2016-07-05 日本電信電話株式会社 Database disturbance parameter determining apparatus, method and program, and database disturbance system
JP6505574B2 (en) * 2015-10-07 2019-04-24 日本電信電話株式会社 Disturbance data reconstruction device, disturbance data reconstruction method, program
JP6437416B2 (en) * 2015-10-13 2018-12-12 日本電信電話株式会社 Name identification system, apparatus, method and program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10016A (en) * 1853-09-13 Bootjack
US7014A (en) * 1850-01-15 Folding bedstead
US9018A (en) * 1852-06-15 Machine for polishing daguerreotype-plates

Also Published As

Publication number Publication date
JP2013083801A (en) 2013-05-09

Similar Documents

Publication Publication Date Title
CN108768665B (en) Block chain generation method and device, computer equipment and storage medium
US11468186B2 (en) Data protection via aggregation-based obfuscation
US20210256309A1 (en) Apparatuses, computer program products, and computer-implemented methods for privacy-preserving federated learning
US10339341B2 (en) Methods and systems for obfuscating sensitive information in computer systems
US20210112101A1 (en) Data set and algorithm validation, bias characterization, and valuation
JP5475610B2 (en) Disturbing device, disturbing method and program
CN107113183A (en) The controlled shared system and method for big data
Mans et al. Business process mining success
US10346639B2 (en) Anonymization identifier computing system
Mauri et al. Modeling threats to AI-ML systems using STRIDE
US20160352693A1 (en) Computer-Implemented System And Method For Analyzing Data Quality
JP2019512128A (en) System and method for calculating a trade-off between data confidentiality-utility
Guo et al. Using Objective Clustering for Solving Many‐Objective Optimization Problems
CN114270391A (en) Quantifying privacy impact
CN107657357B (en) Data processing method and device
JP5651568B2 (en) Database disturbance device, system, method and program
KR102379653B1 (en) Personalized data model using closed data
US9959154B2 (en) Identifying defunct nodes in data processing systems
JP6445415B2 (en) Anonymization device, anonymization method, program
Yu et al. SDSM: Secure data sharing for multilevel partnerships in iot based supply chain
US11017031B2 (en) System and method of data transformation
JP5945490B2 (en) Database disturbance parameter determining apparatus, method and program, and database disturbance system
JP6549076B2 (en) Anonymization table generation device, anonymization table generation method, program
JP5475608B2 (en) Disturbing system, disturbing device, disturbing method and program
JP2020109592A (en) Information processing system, information processing device, information processing method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141022

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141111

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141117

R150 Certificate of patent or registration of utility model

Ref document number: 5651568

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150