JP6904426B2 - 擬似データ生成装置、その方法、およびプログラム - Google Patents
擬似データ生成装置、その方法、およびプログラム Download PDFInfo
- Publication number
- JP6904426B2 JP6904426B2 JP2019548170A JP2019548170A JP6904426B2 JP 6904426 B2 JP6904426 B2 JP 6904426B2 JP 2019548170 A JP2019548170 A JP 2019548170A JP 2019548170 A JP2019548170 A JP 2019548170A JP 6904426 B2 JP6904426 B2 JP 6904426B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- pseudo data
- data
- attribute
- numerical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本発明は、擬似データ生成技術に関する。
プライバシ保護の分野では、セキュリティなどの問題で個人情報を含んだオリジナルデータを扱えない場合、代用として擬似データを生成して分析等を行うことがある。ここでは表形式のオリジナルデータから表形式の擬似データを作成するケースを考える。表形式のデータの例を図1に示す。表形式のデータを行列とみなし、行ベクトルをレコード、列ベクトルを属性と呼ぶ。オリジナルデータと擬似データとは、行数は異なることもあるが、列数は同じである。オリジナルデータの行数をn>0、擬似データの行数をn'>0とする。オリジナルデータと擬似データには、文字列のみが格納されているとする。
図1のように表形式のデータには、年齢、身長、体重などの数値属性と、職業、最終学歴、血液型などのカテゴリ属性とが含まれることがある。従来、作成したい擬似データが数値属性のみを持つ表の場合、乱数群をオリジナルデータ内の属性間の関係性(分散共分散や相関など)を保持できるよう整形することで擬似データを生成する方法がある。また、数値属性とカテゴリ属性とを含むオリジナルデータの全ての属性間の関係性を保持する擬似データの生成方法として、非特許文献1が知られている。非特許文献1では、オリジナルデータ内に存在するカテゴリの組を全て列挙し、そのカテゴリの組毎にオリジナルデータの数値属性の性質を保持する擬似データを生成し、統合することでオリジナルデータ全体の属性間の性質を保持する。
独立行政法人統計センター、「教育用擬似ミクロデータの開発とその利用〜平成16年全国消費実態調査を例として〜」、2012年.
しかしながら、従来手法によるカテゴリ属性を含む擬似データの生成では、オリジナルデータ内に存在するカテゴリの組の個数分、属性間の性質を保持する擬似データを生成する必要がある。そのため、カテゴリの組が増えるほど計算効率が悪くなる。
本発明は、カテゴリ属性を含む擬似データに対しても、数値属性のみを含む擬似データと同様の効率で、カテゴリ属性を含むオリジナルデータの全ての属性間の関係性を保持する擬似データを生成する擬似データ生成装置、その方法、およびプログラムを提供することを目的とする。
上記の課題を解決するために、本発明の一態様によれば、擬似データ生成装置は、オリジナルデータに含まれるカテゴリ属性の値を符号化ルールに従い数値属性の値に符号化する符号化部と、数値属性のための擬似データ生成方法を用いて符号化後のオリジナルデータから第一擬似データを生成するデータ整形部と、第一擬似データに含まれる、カテゴリ属性の値に対応する数値属性の値が、その数値属性の値が取り得る値の範囲を超えている場合には、その数値属性の値を、その数値属性の値が取り得る値の範囲に含まれる値に変換する変換部と、変換後の第一擬似データに含まれるカテゴリ属性の値に対応する数値属性の値を符号化ルールに従いカテゴリ属性の値に復号し、擬似データとする復号部と、を含む。
上記の課題を解決するために、本発明の他の態様によれば、擬似データ生成装置が行う擬似データ生成方法は、オリジナルデータに含まれるカテゴリ属性の値を符号化ルールに従い数値属性の値に符号化する符号化ステップと、数値属性のための擬似データ生成方法を用いて符号化後のオリジナルデータから第一擬似データを生成するデータ整形ステップと、第一擬似データに含まれる、カテゴリ属性の値に対応する数値属性の値が、その数値属性の値が取り得る値の範囲を超えている場合には、その数値属性の値を、その数値属性の値が取り得る値の範囲に含まれる値に変換する変換ステップと、変換後の第一擬似データに含まれるカテゴリ属性の値に対応する数値属性の値を符号化ルールに従いカテゴリ属性の値に復号し、擬似データとする復号ステップと、を含む。
本発明によれば、カテゴリ属性を含む擬似データに対しても、数値属性のみを含む擬似データと同様の効率で、カテゴリ属性を含むオリジナルデータの全ての属性間の関係性を保持する擬似データを生成することができるという効果を奏する。
以下、本発明の実施形態について、説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。以下の説明において、テキスト中で使用する記号「-」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
<第一実施形態のポイント>
カテゴリ属性を符号化(例えばバイナリ化)して数値属性に変換する。例えば、オリジナルデータのカテゴリ属性を符号化して数値属性のみを持つ表に変換する。変換した表を元に任意の数値属性のための擬似データ生成方法により数値属性のみの擬似データを生成する。数値属性のみの擬似データのカテゴリ属性の数値を元のカテゴリ値に復号することで、カテゴリ属性を含む擬似データを生成する。これにより、計算量の大きい擬似データ生成処理が1回のみですむ。そのため、カテゴリの組の数が増えても効率的に擬似データ生成が行える。言い換えると、一度に属性間の性質を保持する処理を行うことができるため、計算効率が向上する。
カテゴリ属性を符号化(例えばバイナリ化)して数値属性に変換する。例えば、オリジナルデータのカテゴリ属性を符号化して数値属性のみを持つ表に変換する。変換した表を元に任意の数値属性のための擬似データ生成方法により数値属性のみの擬似データを生成する。数値属性のみの擬似データのカテゴリ属性の数値を元のカテゴリ値に復号することで、カテゴリ属性を含む擬似データを生成する。これにより、計算量の大きい擬似データ生成処理が1回のみですむ。そのため、カテゴリの組の数が増えても効率的に擬似データ生成が行える。言い換えると、一度に属性間の性質を保持する処理を行うことができるため、計算効率が向上する。
<第一実施形態>
図2は第一実施形態に係る擬似データ生成装置の機能ブロック図を、図3はその処理フローを示す。
第一実施形態に係る擬似データ生成装置は、符号化部110、符号化ルール記憶部120、データ整形部130、変換部140及び復号部150を含む。
図2は第一実施形態に係る擬似データ生成装置の機能ブロック図を、図3はその処理フローを示す。
第一実施形態に係る擬似データ生成装置は、符号化部110、符号化ルール記憶部120、データ整形部130、変換部140及び復号部150を含む。
擬似データ生成装置は、例えば、中央演算処理装置(CPU: Central Processing Unit)、主記憶装置(RAM: Random Access Memory)などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。擬似データ生成装置は、例えば、中央演算処理装置の制御のもとで各処理を実行する。擬似データ生成装置に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて中央演算処理装置へ読み出されて他の処理に利用される。擬似データ生成装置の各処理部は、少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。擬似データ生成装置が備える各記憶部は、例えば、RAM(Random Access Memory)などの主記憶装置、ハードディスクや光ディスクもしくはフラッシュメモリ(Flash Memory)のような半導体メモリ素子により構成される補助記憶装置、またはリレーショナルデータベースやキーバリューストアなどのミドルウェアにより構成することができる。
第一実施形態に係る擬似データ生成装置は、オリジナルデータDと生成する擬似データに含まれるレコード数n'を入力とし、擬似データD'を生成し、出力する。なお、オリジナルデータの各属性のヒストグラム及び二次元クロス集計表と、擬似データの各属性のヒストグラム及び二次元クロス集計表とが近似するように擬似データD'を生成するものとする。なお、近似の精度は、擬似データに含まれるレコード数n'が大きさと関連し、n'が大きくなるほど近似の精度は高くなりやすい。
以下、各部の処理内容を説明する。
<符号化ルール記憶部120>
符号化ルール記憶部120には、符号化ルールが記憶される。図4は、符号化ルールの例を示す。例えば、符号化ルールは、符号とカテゴリ属性の値との対応関係を示す。
<符号化ルール記憶部120>
符号化ルール記憶部120には、符号化ルールが記憶される。図4は、符号化ルールの例を示す。例えば、符号化ルールは、符号とカテゴリ属性の値との対応関係を示す。
<符号化部110>
入力:オリジナルデータD
出力:カテゴリ属性の各値が符号化(数値ベクトル化)された表形式のデータ(符号化後のオリジナルデータ)X
入力:オリジナルデータD
出力:カテゴリ属性の各値が符号化(数値ベクトル化)された表形式のデータ(符号化後のオリジナルデータ)X
符号化部110は、オリジナルデータDに含まれるカテゴリ属性の値を符号化ルール(例えば図4参照)に従い数値属性の値に符号化(数値ベクトル化)し(S110)、符号化後のオリジナルデータXを出力する。図5は、符号化前のオリジナルデータと符号化後のオリジナルデータの例を示す。
例えば、オリジナルデータD内の全てのカテゴリ属性の値を公知の1-of-K符号化法によって数値ベクトルへ変換し、変換したオリジナルデータXを出力する。
例えば、1-of-K符号化法は下記の四種類がある。ここでは便宜上、符号化法A、B、C、Dとして記載する。使用する方法によって、最終的に得られる擬似データD'の結果が異なるため、本手法内では、擬似データD'がオリジナルデータDに近似できる方を用いる。
符号化法A:ある属性の取りうる値が(S1,S2,S3)であるとき、S1=(0,0)、S2=(1,0)、S3=(0,1)とする方法。この方法では、長さpのビット列を用いて、2p種類のカテゴリ属性の値を表現することができる。
符号化法B:ある属性の取りうる値が(S1,S2,S3)であるとき、S1=(1,0,0)、S2=(0,1,0)、S3=(0,0,1)とする方法。この方法では、長さpのビット列を用いて、p種類のカテゴリ属性の値を表現することができる。
符号化法C:ある属性の取りうる値が(S1,S2,S3)であるとき、S1=0、S2=1、S3=2とする方法。
符号化法D:ある属性の取りうる値が(S1,S2,S3)であるとき、S1=1、S2=2、S3=3とする方法。符号化法C,Dでは、p個の数値を使ってp種類のカテゴリ属性の値を表現することができる。
符号化法B:ある属性の取りうる値が(S1,S2,S3)であるとき、S1=(1,0,0)、S2=(0,1,0)、S3=(0,0,1)とする方法。この方法では、長さpのビット列を用いて、p種類のカテゴリ属性の値を表現することができる。
符号化法C:ある属性の取りうる値が(S1,S2,S3)であるとき、S1=0、S2=1、S3=2とする方法。
符号化法D:ある属性の取りうる値が(S1,S2,S3)であるとき、S1=1、S2=2、S3=3とする方法。符号化法C,Dでは、p個の数値を使ってp種類のカテゴリ属性の値を表現することができる。
例えば、図4では符号化法Dを用いている。
<データ整形部130>
入力:符号化後のオリジナルデータX,擬似データに含まれるレコード数n'
出力:第一擬似データY
入力:符号化後のオリジナルデータX,擬似データに含まれるレコード数n'
出力:第一擬似データY
データ整形部130は、数値属性のための擬似データ生成方法を用いて符号化後のオリジナルデータXから所望のレコード数n'を含む第一擬似データYを生成し(S130)、出力する。数値属性のための擬似データ生成方法には様々な公知の技術を利用できる。例えば、参考文献1または参考文献2の方法を利用することができる。
(参考文献1)Zhengli Huang, Wenliang Du, and Biao Chen. "Deriving private information from randomized data", In Proceedings of the 2005 ACM SIGMOD international conference on Management of data, pp. 37-48. ACM, 2005.
(参考文献2)Haoran Li, Li Xiong, and Xiaoqian Jiang. "Differentially private synthesization of multi-dimensional data using copula functions", In Advances in database technology: proceedings. International Conference on Extending Database Technology, Vol. 2014, p. 475. NIH Public Access, 2014.
(参考文献1)Zhengli Huang, Wenliang Du, and Biao Chen. "Deriving private information from randomized data", In Proceedings of the 2005 ACM SIGMOD international conference on Management of data, pp. 37-48. ACM, 2005.
(参考文献2)Haoran Li, Li Xiong, and Xiaoqian Jiang. "Differentially private synthesization of multi-dimensional data using copula functions", In Advances in database technology: proceedings. International Conference on Extending Database Technology, Vol. 2014, p. 475. NIH Public Access, 2014.
<変換部140>
入力:第一擬似データY
出力:変換後の第一擬似データZ
入力:第一擬似データY
出力:変換後の第一擬似データZ
変換部140は、第一擬似データYに含まれる、カテゴリ属性の値に対応する数値属性の値が、その数値属性の値が取り得る値の範囲を超えている場合には、その数値属性の値を、その数値属性の値が取り得る値の範囲に含まれる値に変換し(S140)、変換後の第一擬似データZを出力する。
第一擬似データY内のカテゴリ属性部分の値は、データ整形部130にて元の符号の形式ではなくなってしまっている可能性がある。そこで、変換部140は、第一擬似データY内のカテゴリ属性部分の値が元の符号の形式ではない場合、元の符号の形式に再形式化する。以下、その例を示す。
(符号化部110において、符号化法A、Bを用いた場合)
i番目のレコードにおけるj番目の長さljのカテゴリ属性の値をSj (i)=(s1 (i),s2 (i),…,sl_j (i))とし(ただし、下付き添え字l_jはljを意味する)、
i番目のレコードにおけるj番目の長さljのカテゴリ属性の値をSj (i)=(s1 (i),s2 (i),…,sl_j (i))とし(ただし、下付き添え字l_jはljを意味する)、
とする。このとき、各Sj (i)の各要素がs- jを超えるか確認し、超える要素があれば、超える要素集合内の最大値を1へ、それ以外の全ての要素を0にする。超える要素が無ければ、全ての要素を0にする。ただし、s- jを任意の値にする方法でも良い。
(符号化部110において、符号化法Cを用いた場合)
i番目のレコードにおけるj番目の長さljのカテゴリ属性の値をSj (i)とする。このとき、各Sj (i)が0より小さい値であればSj (i)←0とし、lj-1より大きい値であればSj (i)←lj-1とする。なお、0≦Sj (i)≦lj-1であれば、Sj (i)の整数部分をそのまま用いる。
i番目のレコードにおけるj番目の長さljのカテゴリ属性の値をSj (i)とする。このとき、各Sj (i)が0より小さい値であればSj (i)←0とし、lj-1より大きい値であればSj (i)←lj-1とする。なお、0≦Sj (i)≦lj-1であれば、Sj (i)の整数部分をそのまま用いる。
(符号化部110において、符号化法Dを用いた場合)
i番目のレコードにおけるj番目の長さljのカテゴリ属性の値をSj (i)とする。このとき、各Sj (i)が1より小さい値であればSj (i)←1とし、ljより大きい値であればSj (i)←ljとする。なお、1≦Sj (i)≦ljであれば、Sj (i)の整数部分をそのまま用いる。
i番目のレコードにおけるj番目の長さljのカテゴリ属性の値をSj (i)とする。このとき、各Sj (i)が1より小さい値であればSj (i)←1とし、ljより大きい値であればSj (i)←ljとする。なお、1≦Sj (i)≦ljであれば、Sj (i)の整数部分をそのまま用いる。
<復号部150>
入力:変換後の第一擬似データZ
出力:変換後の第一擬似データZ内の数値化されていたカテゴリ属性をカテゴリ値に復号した表形式の擬似データD'
入力:変換後の第一擬似データZ
出力:変換後の第一擬似データZ内の数値化されていたカテゴリ属性をカテゴリ値に復号した表形式の擬似データD'
復号部150は、変換後の第一擬似データZに含まれるカテゴリ属性の値に対応する数値属性の値を符号化ルール(図4参照)に従いカテゴリ属性の値に復号し(S150)、擬似データD'とし、出力する。
例えば、上述の符号化法A、B、C、Dは全単射(一対一対応)なため、その対応関係を保持しておけば逆の操作(復号)も一意に行うことができる。
<効果>
以上の構成により、カテゴリ属性を含む擬似データに対しても、数値属性のみを含む擬似データと同様の効率で、カテゴリ属性を含むオリジナルデータの全ての属性間の関係性を保持する擬似データを生成することができる。
以上の構成により、カテゴリ属性を含む擬似データに対しても、数値属性のみを含む擬似データと同様の効率で、カテゴリ属性を含むオリジナルデータの全ての属性間の関係性を保持する擬似データを生成することができる。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
Claims (3)
- オリジナルデータに含まれるカテゴリ属性の値を符号化ルールに従い数値属性の値に符号化する符号化部と、
数値属性のための擬似データ生成方法を用いて符号化後のオリジナルデータから第一擬似データを生成するデータ整形部と、
前記第一擬似データに含まれる、前記カテゴリ属性の値に対応する前記数値属性の値が、その数値属性の値が取り得る値の範囲を超えている場合には、その数値属性の値を、その数値属性の値が取り得る値の範囲に含まれる値に変換する変換部と、
変換後の第一擬似データに含まれる前記カテゴリ属性の値に対応する前記数値属性の値を前記符号化ルールに従いカテゴリ属性の値に復号し、擬似データとする復号部と、を含む、
擬似データ生成装置。 - 擬似データ生成装置が行う擬似データ生成方法であって、
オリジナルデータに含まれるカテゴリ属性の値を符号化ルールに従い数値属性の値に符号化する符号化ステップと、
数値属性のための擬似データ生成方法を用いて符号化後のオリジナルデータから第一擬似データを生成するデータ整形ステップと、
前記第一擬似データに含まれる、前記カテゴリ属性の値に対応する前記数値属性の値が、その数値属性の値が取り得る値の範囲を超えている場合には、その数値属性の値を、その数値属性の値が取り得る値の範囲に含まれる値に変換する変換ステップと、
変換後の第一擬似データに含まれる前記カテゴリ属性の値に対応する前記数値属性の値を前記符号化ルールに従いカテゴリ属性の値に復号し、擬似データとする復号ステップと、を含む、
擬似データ生成方法。 - 請求項1の擬似データ生成装置としてコンピュータを機能させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017199200 | 2017-10-13 | ||
JP2017199200 | 2017-10-13 | ||
PCT/JP2018/037309 WO2019073912A1 (ja) | 2017-10-13 | 2018-10-05 | 擬似データ生成装置、その方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019073912A1 JPWO2019073912A1 (ja) | 2020-10-22 |
JP6904426B2 true JP6904426B2 (ja) | 2021-07-14 |
Family
ID=66100802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019548170A Active JP6904426B2 (ja) | 2017-10-13 | 2018-10-05 | 擬似データ生成装置、その方法、およびプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20200257824A1 (ja) |
EP (1) | EP3696704B1 (ja) |
JP (1) | JP6904426B2 (ja) |
CN (1) | CN111213146B (ja) |
WO (1) | WO2019073912A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11983201B2 (en) * | 2019-09-27 | 2024-05-14 | International Business Machines Corporation | Creating a metatype tree for metatype introspection |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7672967B2 (en) * | 2005-02-07 | 2010-03-02 | Microsoft Corporation | Method and system for obfuscating data structures by deterministic natural data substitution |
JP4575416B2 (ja) * | 2007-10-29 | 2010-11-04 | みずほ情報総研株式会社 | テストデータ生成システム、テストデータ生成方法及びテストデータ生成プログラム |
CN101505318B (zh) * | 2009-03-18 | 2012-05-23 | 飞拓无限信息技术(北京)有限公司 | 用户属性鉴别方法和装置 |
CN102460076B (zh) * | 2009-06-10 | 2015-06-03 | 起元技术有限责任公司 | 生成测试数据 |
JP2011034264A (ja) * | 2009-07-31 | 2011-02-17 | Hitachi Solutions Ltd | 個人情報マスキングシステム |
US8364124B2 (en) * | 2010-02-18 | 2013-01-29 | Tekelec, Inc. | Methods, systems, and computer readable media for tokenization of multimedia messages |
JP5785869B2 (ja) * | 2011-12-22 | 2015-09-30 | 株式会社日立製作所 | 行動属性分析プログラムおよび装置 |
US9052358B2 (en) * | 2012-01-27 | 2015-06-09 | Portland State University | Copula-based system and method for management of manufacturing test and product specification throughout the product lifecycle for electronic systems or integrated circuits |
CN103577195B (zh) * | 2013-11-14 | 2016-10-12 | 中国联合网络通信集团有限公司 | 一种软件需求分析量化方法及系统 |
JP6532829B2 (ja) * | 2016-01-15 | 2019-06-19 | 日本電信電話株式会社 | 撹乱データ再構築誤差推定装置、撹乱データ再構築誤差推定方法、プログラム |
-
2018
- 2018-10-05 CN CN201880066293.XA patent/CN111213146B/zh active Active
- 2018-10-05 JP JP2019548170A patent/JP6904426B2/ja active Active
- 2018-10-05 EP EP18865739.9A patent/EP3696704B1/en active Active
- 2018-10-05 WO PCT/JP2018/037309 patent/WO2019073912A1/ja unknown
- 2018-10-05 US US16/753,037 patent/US20200257824A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JPWO2019073912A1 (ja) | 2020-10-22 |
WO2019073912A1 (ja) | 2019-04-18 |
EP3696704A1 (en) | 2020-08-19 |
CN111213146B (zh) | 2024-05-03 |
EP3696704A4 (en) | 2021-06-30 |
EP3696704B1 (en) | 2022-07-13 |
CN111213146A (zh) | 2020-05-29 |
US20200257824A1 (en) | 2020-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chambi et al. | Better bitmap performance with roaring bitmaps | |
CN103914506B (zh) | 数据检索装置、数据存储方法和数据检索方法 | |
US8935575B2 (en) | Test data generation | |
US7689630B1 (en) | Two-level bitmap structure for bit compression and data management | |
US9619657B2 (en) | Method and apparatus for storing redeem code, and method and apparatus for verifying redeem code | |
JP6917942B2 (ja) | データ分析サーバ、データ分析システム、及びデータ分析方法 | |
CN109726758A (zh) | 一种基于差分隐私的数据融合发布算法 | |
Bryant | Chain reduction for binary and zero-suppressed decision diagrams | |
JP6812569B2 (ja) | 擬似データ生成装置、その方法、及びプログラム | |
JP6904426B2 (ja) | 擬似データ生成装置、その方法、およびプログラム | |
CN111201532A (zh) | k-匿名化装置、方法以及程序 | |
CN113222160A (zh) | 一种量子态的转换方法及装置 | |
AU2017248412A1 (en) | Information processing apparatus, and data management method | |
EP3246900B1 (en) | Matrix and key generation device, matrix and key generation system, matrix coupling device, matrix and key generation method, and program | |
CN114297046A (zh) | 基于日志的事件获取方法、装置、设备及介质 | |
JP6780428B2 (ja) | 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法および復号化装置 | |
JP7464499B2 (ja) | コード化装置、コード化方法及びコード化プログラム | |
CN117113384B (zh) | 一种合同签约管理方法及系统 | |
Otoo et al. | New approaches to storing and manipulating multi-dimensional sparse arrays | |
WO2020179606A1 (ja) | 一般化階層集合生成装置、一般化階層集合生成方法、プログラム | |
US11212528B2 (en) | Bit string block encoder device, block decoder device, information processing device, program, block encoding method and block decoding method | |
US7383245B2 (en) | Data retrieving method, data retrieving apparatus, data compression method and data compression apparatus | |
CN117874006A (zh) | 一种数据建模方法 | |
CN105550971A (zh) | 一种基于距离比值调制的矢量地理数据密级标识方法 | |
Siahaan | Compression Rate Comparison between Elias Delta and Unary Codes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200406 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210525 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210607 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6904426 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |