JP7120439B2 - データ一般化装置、データ一般化方法、プログラム - Google Patents

データ一般化装置、データ一般化方法、プログラム Download PDF

Info

Publication number
JP7120439B2
JP7120439B2 JP2021504880A JP2021504880A JP7120439B2 JP 7120439 B2 JP7120439 B2 JP 7120439B2 JP 2021504880 A JP2021504880 A JP 2021504880A JP 2021504880 A JP2021504880 A JP 2021504880A JP 7120439 B2 JP7120439 B2 JP 7120439B2
Authority
JP
Japan
Prior art keywords
storage device
generalization
generalized
hierarchy
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021504880A
Other languages
English (en)
Other versions
JPWO2020184127A1 (ja
Inventor
聡 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2020184127A1 publication Critical patent/JPWO2020184127A1/ja
Application granted granted Critical
Publication of JP7120439B2 publication Critical patent/JP7120439B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、データベース上の個別データを秘匿する技術に関し、データ一般化装置、データ一般化方法、プログラムに関する。
データベースの個別データを確定的手法により秘匿する技術が知られている。例えば、データベースの各値を一般化処理することで、データベースの秘匿処理を行うことができる。一般化処理とは、値を汎化することである。例えば図1の例に示すように、性別[male]を一般化すると[person]、年齢「13」を一般化すると[11-20]となる。一般化処理の多くは、一般化階層と呼ばれる値の汎化・特化関係を表す木構造を準備し、その木構造を辿る(階層を上げる)ことで値の書き換えを行う。例えば、同図の年齢の階層の場合、13という数字について1つ階層を上げると、[11-20]、2つ階層を上げると[11-40]となる。このように一般化において上げる階層の数を階層上昇数と呼ぶこととする。
西川記史、礒田有哉、出射英臣、茂木和彦、吉野雅之、清水晃、早水悠登、合田和生、喜連川優、"非順序型データベースエンジンを用いた大規模データの対話的な非特定化手法の検討と初期評価"、データ工学研究会、p377、電子情報通信学会、2018
一般化を実現するにあたり大きく2つの方法がある。1つは、主記憶装置上に対象となるデータベース及び一般化階層を配置し実現する方法である。もう1つは、補助記憶装置上に対象となるデータベース及び一般化階層を配置し、適宜少量のデータを主記憶装置上に配置して実現する方法である。
前者は、高速に実行可能であるものの、大規模データベースの場合は主記憶装置の容量が不足するため、一般化処理を実行することができない。後者は、例えば、主にRDBMS(リレーショナル・データベースマネージメントシステム)等を用いてデータベースを補助記憶装置上に配置し、SQL演算を用いて一般化処理を実現する方法がある(非特許文献1)。しかしながら、一般化処理専用のSQL演算は用意されておらず、SQLで一般化処理を実現する場合は工夫が必要であり専用演算ではないため非効率(低速)となる。
そこで本発明では、小容量の主記憶装置のみを用いて、大規模データを高速に一般化処理できるデータ一般化装置を提供することを目的とする。
本発明のデータ一般化装置は、属性値を一般化するデータ一般化装置であって、並び替え部と、属性値取得部と、一般化階層取得部と、一般化処理部と、再並び替え部を含む。
並び替え部は、補助記憶装置上の一般化階層における属性値の並び順に従って、補助記憶装置上の属性値を並び替える。属性値取得部は、並び替えた属性値の一部を補助記憶装置から主記憶装置上に取得する。一般化階層取得部は、一般化階層の集合のうちの一部の一般化階層であって、主記憶装置上に取得した属性値のうち、処理対象の属性値に対応する一般化階層を補助記憶装置から主記憶装置上に取得する。一般化処理部は、主記憶装置上に取得した属性値と、主記憶装置上に取得した一般化階層に基づいて、一般化処理を実行する。再並び替え部は、一般化処理後の属性値を補助記憶装置に移動して、元の順序に並び替える。
本発明のデータ一般化装置によれば、小容量の主記憶装置のみを用いて、大規模データを高速に一般化処理できる。
一般化処理を例示する図。 先読み処理を例示する図。 実施例1のデータ一般化装置の構成を示すブロック図。 実施例1のデータ一般化装置の動作を示すフローチャート。 主記憶装置上の一般化階層のLRUアルゴリズムに基づく更新例を示す図。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
<処理の概要>
以下の実施例では、大規模データを小容量の主記憶装置で高速に一般化処理できるデータ一般化装置、データ一般化方法、プログラムを開示する。実施例1のデータ一般化装置、データ一般化方法、プログラムは、補助記憶装置(例えばHDD)の、ランダムアクセスと比較してシーケンシャルアクセス(連続アクセス)のほうが速いという特徴、補助記憶装置(例えばHDD)が主記憶装置(例えばメモリ)と比較して遅いという特徴、補助記憶装置(例えばHDD)が主記憶装置(例えばメモリ)と比べて記憶容量が大きいという特徴を考慮して、アルゴリズムとデータ構造を工夫することで、高速な処理を実現した。
以下の実施例において、一般化処理はデータベース上の属性ごとに処理を行う。以下では、説明の都合上、1属性のデータベースを想定する。なお、複数属性に対して一般化処理を行いたい場合は、1属性ごとの一般化処理をそれぞれの属性に実行すれば良い。
[手順1]
一般化の対象となるデータベースの属性を補助記憶装置上に配置する。また一般化階層も同様に補助記憶装置上に配置する。属性の各値は、値が連続となるように補助記憶装置上に配置する。ここで、「連続…に配置」とは他のデータを挟まないようにデータを連続に配置することを意味する。属性の各値を参照する際は、シーケンシャルアクセスされることを想定し、補助記憶装置から主記憶装置にデータを読み出す際は、先読み処理を行うようにする。
具体的には、図2の先読み処理の例に示すように、年齢=18,23,34,13という属性値が補助記憶装置に格納されている場合、それらを順次主記憶装置上に読み出すことを想定する。同図の例では、主記憶装置は2個の要素までを保持できるものとする。まず図2Aに示すように、0番目のindexの値にアクセスした際、0及び1番目のindexの値を主記憶装置に転送し、主記憶装置の0番目のindexの値を取得する。次に1番目のindexの値にアクセスした場合は、主記憶装置からデータを読み取る。その後2番目のindexの値にアクセスした場合は、主記憶装置に該当データが存在しないため、図2Bに示すように、補助記憶装置から2及び3番目のindexの値を主記憶装置に転送し、主記憶装置中の0番目のindexの値(補助記憶装置中の2番目に該当)を読み出す。このように連続アクセスを想定し、補助記憶装置からデータを読み出す際は、先読み処理を実行する。
各値に対する一般化階層(例えば、値が13で図1の一般化階層の場合、13→[11-20]→[11-40]を取得する処理に用いる木構造)の一部を補助記憶装置から読み出す際には、LRU(Least Recently Used)アルゴリズムに基づいて、一般化階層を更新すれば好適である。
[手順2]
対象属性を外部ソートで並び替える。
[手順3]
対象属性の各属性値をシーケンシャルに参照していき、各値ごとに該当する一般化階層の集合のうちの一部の一般化階層を取得し、一般化処理を行う。
[手順4]
一般化処理済みの属性値を元の順序に戻す。
[手順2]において予めソートしておくことにより、同じ値が連続した状態で出現する。同値の場合は、一般化階層は同じ部分を利用すれば良く、LRUアルゴリズムにより最近使われたものが主記憶装置上に配置されているため、補助記憶装置にアクセスする回数を減らすことができ、一般化処理を効率よく実行できる。
なお、以降では属性をベクトルとして表記することとしa^のように文字の後ろに「^」を付与する。なお、これは文書作成ソフトの都合による表現であり、例えばa^と表現する場合、ボールド体にサーカムフレックスを付した
Figure 0007120439000001
を意味する。なおベクトルのi番目の要素はaiと表記することとする。加えてベクトルa^の要素数を|a^|と表記することとする。一般化階層を大文字かつ、文字の後ろに「^」を付与して表記する(例えばX^)。なお、これは文書作成ソフトの都合による表現であり、X^と表現する場合、ボールド体にサーカムフレックスを付した
Figure 0007120439000002
を意味する。ある属性の値ai、階層上昇数jの一般化階層の値を
Figure 0007120439000003
と表記することとする。例えば図1において、年齢(AGE)の一般化階層をX^とし、属性値13を階層上昇数2で一般化処理した場合、
Figure 0007120439000004
となる。
以下、図3を参照して実施例1のデータ一般化装置の構成を説明する。同図に示すように、本実施例のデータ一般化装置1は、主記憶装置10Aと、補助記憶装置10Bと、並び替え部11と、属性値取得部12と、一般化階層取得部13と、一般化処理部14と、再並び替え部15を含む。以下、図4を参照して、各構成要件の動作を説明する。
<並び替え部11>
並び替え部11は、補助記憶装置10B上の一般化階層における属性値の並び順に従って、補助記憶装置10B上の属性値を並び替える(S11)。「一般化階層における属性値の並び順」とは、例えば一般化階層を表す木構造の末端のリーフの並び順を意味する。図1の例では、木構造の末端のリーフは13,18,23,34,…の順序で並んでいる。
<属性値取得部12>
属性値取得部12は、並び替えた属性値の一部を補助記憶装置10Bから主記憶装置10A上に取得する(S12)。本実施例では、属性値取得部12は、並び替えた属性値の一部を、主記憶装置10A上に予め用意したベクトルc^(後述)に格納するものとする。
<一般化階層取得部13>
一般化階層取得部13は、一般化階層の集合のうちの一部の一般化階層であって、主記憶装置10A上に取得した属性値のうち、処理対象の属性値に対応する一般化階層を補助記憶装置10Bから主記憶装置10A上に取得する(S13)。一般化階層取得部13は、一般化階層の集合内の全ての一般化階層ではなく、処理対象の属性値に対応する一部の一般化階層を補助記憶装置10Bから主記憶装置10A上に取得することに注意する。
本実施例では、一般化階層取得部13は、一般化階層の集合のうちの一部の一般化階層を、主記憶装置10A上に予め用意したベクトルd^(後述)に格納するものとする。なお、一般化階層取得部13は、主記憶装置10A上の一般化階層をLRUアルゴリズムに基づいて更新すれば好適である。
<一般化処理部14>
一般化処理部14は、主記憶装置10A上に取得した属性値と、主記憶装置10A上に取得した一般化階層に基づいて、一般化処理を実行する(S14)。
<再並び替え部15>
再並び替え部15は、一般化処理後の属性値を補助記憶装置10Bに移動して、元の順序に並び替える(S15)。
≪アルゴリズム1:大規模データ一般化アルゴリズム≫
Input:レコード数N、一般化の対象となる属性a^、属性に対応する一般化階層X^、階層上昇数j、主記憶装置10A上で用いる要素数M
Output:一般化された属性b^
[1]:対象属性a^を値が連続になるように補助記憶装置10B上に配置する。ここで、「値が連続になるように…配置」とは他のデータを挟まないようにデータを連続に配置することを意味する。一般化階層X^を補助記憶装置10B上に配置する。主記憶装置10A上に要素数Mのベクトルc^、d^を用意する。なお、c^は属性用、d^は一般化階層用の主記憶装置10A上のベクトルである。
[2]:対象属性a^を外部ソートで並び替える。外部ソートとして、例えばマージソート等がある(図4、S11相当)。
[3]:for i = 1 to N do
[4]:i番目の属性の値aiをアルゴリズム2で取得する(図4、S12相当)。
[5]:aiに対応する一般化階層の値
Figure 0007120439000005
を、アルゴリズム3で取得する(図4、S13相当)。
[6]:i番目の属性の値
Figure 0007120439000006
とする(図4、S14相当)。
[7]:end for
[8]:一般化された属性b^をa^の元の並びに変える(図4、S15相当)。
[9]:return b^
≪アルゴリズム2:先読みアルゴリズムによる値取得≫
Input:補助記憶装置10B上に配置された属性a^、参照したい要素の位置i、主記憶装置10A上のベクトルc^
Output:値ai
[1]:if i番目の要素がc^に存在しない場合 then
[2]:i番目からi + |c^| -1番目の要素を補助記憶装置10Bから取得し、c^に格納する。
[3]:end if
[4]:return c^内のai
≪アルゴリズム3:LRUアルゴリズムによる値取得≫
Input:補助記憶装置10B上に配置された一般化階層X^、参照したい一般化階層の位置を表す属性の値aiおよび階層上昇数j、主記憶装置10A上のベクトルd^
Output:
Figure 0007120439000007
[1]:if aiがd^に存在しない場合then
[2]: if d^が一杯の場合 then
[3]:d^の中から最も利用されていない要素と
Figure 0007120439000008
を入れ替える。
[4]:else
[5]:d^に、aiとそれに対応する一般化階層の値
Figure 0007120439000009
をまとめて
Figure 0007120439000010
として加える。
[6]:end if
[7]:end if
[8]:return d^ 内の
Figure 0007120439000011
Figure 0007120439000012
アルゴリズム3については、例えば図5の例に示すように、主記憶装置10A上のベクトルc^に対して属性値(T,T,U,U,V,W)が格納されており、主記憶装置10A上のベクトルd^に対して、一般化階層の一部である(QT,QU,RV)が格納されている場合、これら一般化階層の一部の参照回数に基づき、最も参照回数が少ないRVが、LRUアルゴリズムによって、新たな一般化階層の一部である(SW)に置き換わる。なお、主記憶装置10A上のベクトルd^に格納される一般化階層は、置換時にはすでに使用済みで、再度利用されることはないため、LRUアルゴリズム以外の任意のアルゴリズムで置き換えても問題ない。
<効果>
データの一般化においては、補助記憶装置から主記憶装置にデータを移動させ、主記憶装置上で計算をしたのち、主記憶装置から補助記憶装置にデータを再び移動させるのが一般的であるが、補助記憶装置はその性質上、主記憶装置に比べ動作が遅いため、できる限りアクセスしないことが重要である。また補助記憶装置にアクセスする場合、ランダムアクセスではなくシーケンシャルアクセスにして、処理効率を落とさないことが高速化のために重要である。
本実施例のデータ一般化装置1によれば、データを予めソートする等の工夫を行うこと、および属性値と一般化階層の補助記憶装置10Bからのデータの取り出し方を一般化処理に適した形で選択したことにより、補助記憶装置10Bへのアクセスの回数を減らし、補助記憶装置10Bへアクセスする際に効率の良いシーケンシャルアクセスにすることができ、小容量の主記憶装置10Aのみを用いて、大規模データを高速に一般化処理することができる。
<補記>
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD-ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (4)

  1. 属性値を一般化するデータ一般化装置であって、
    補助記憶装置上の一般化階層における前記属性値の並び順に従って、前記補助記憶装置上の前記属性値を並び替える並び替え部と、
    並び替えた前記属性値の一部を前記補助記憶装置から主記憶装置上に取得する属性値取得部と、
    前記一般化階層の集合のうちの一部の一般化階層であって、前記主記憶装置上に取得した前記属性値のうち、処理対象の前記属性値に対応する一般化階層を前記補助記憶装置から前記主記憶装置上に取得する一般化階層取得部と、
    前記主記憶装置上に取得した前記属性値と、前記主記憶装置上に取得した前記一般化階層に基づいて、一般化処理を実行する一般化処理部と、
    一般化処理後の前記属性値を前記補助記憶装置に移動して、元の順序に並び替える再並び替え部を含む
    データ一般化装置。
  2. 請求項1に記載のデータ一般化装置であって、
    前記一般化階層取得部は、
    前記主記憶装置上の前記一般化階層をLRUアルゴリズムに基づいて更新する
    データ一般化装置。
  3. 属性値を一般化するデータ一般化方法であって、
    補助記憶装置上の一般化階層における前記属性値の並び順に従って、前記補助記憶装置上の前記属性値を並び替える並び替えステップと、
    並び替えた前記属性値の一部を前記補助記憶装置から主記憶装置上に取得する属性値取得ステップと、
    前記一般化階層の集合のうちの一部の一般化階層であって、前記主記憶装置上に取得した前記属性値のうち、処理対象の前記属性値に対応する一般化階層を前記補助記憶装置から前記主記憶装置上に取得する一般化階層取得ステップと、
    前記主記憶装置上に取得した前記属性値と、前記主記憶装置上に取得した前記一般化階層に基づいて、一般化処理を実行する一般化処理ステップと、
    一般化処理後の前記属性値を前記補助記憶装置に移動して、元の順序に並び替える再並び替えステップを含む
    データ一般化方法。
  4. コンピュータを請求項1または2に記載のデータ一般化装置として機能させるプログラム。
JP2021504880A 2019-03-11 2020-02-20 データ一般化装置、データ一般化方法、プログラム Active JP7120439B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019043664 2019-03-11
JP2019043664 2019-03-11
PCT/JP2020/006711 WO2020184127A1 (ja) 2019-03-11 2020-02-20 データ一般化装置、データ一般化方法、プログラム

Publications (2)

Publication Number Publication Date
JPWO2020184127A1 JPWO2020184127A1 (ja) 2021-12-16
JP7120439B2 true JP7120439B2 (ja) 2022-08-17

Family

ID=72427335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021504880A Active JP7120439B2 (ja) 2019-03-11 2020-02-20 データ一般化装置、データ一般化方法、プログラム

Country Status (5)

Country Link
US (1) US11914740B2 (ja)
EP (1) EP3940572B1 (ja)
JP (1) JP7120439B2 (ja)
CN (1) CN113544683B (ja)
WO (1) WO2020184127A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113221034A (zh) * 2021-05-06 2021-08-06 北京百度网讯科技有限公司 数据泛化方法、装置、电子设备和存储介质
CN116342332B (zh) * 2023-05-31 2023-08-01 合肥工业大学 基于互联网的辅助审判方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140189858A1 (en) 2012-12-27 2014-07-03 Industrial Technology Research Institute Generation Method and Device for generating anonymous dataset, and method and device for risk evaluation
JP2017041048A (ja) 2015-08-19 2017-02-23 Kddi株式会社 プライバシ保護装置、方法及びプログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8566607B2 (en) * 2005-08-26 2013-10-22 International Business Machines Corporation Cryptography methods and apparatus used with a processor
CA2801659A1 (en) * 2012-01-09 2013-07-09 Ezshield, Inc. Identity management system and method including architecture for the same
JP6078437B2 (ja) * 2013-08-28 2017-02-08 株式会社日立ソリューションズ パーソナル情報匿名化システム
ES2704467T3 (es) * 2013-10-24 2019-03-18 Telefonica Germany Gmbh & Co Ohg Un método para anonimizar los datos recopilados dentro de una red de comunicación móvil
JP6301767B2 (ja) * 2014-07-28 2018-03-28 株式会社日立ソリューションズ パーソナル情報匿名化装置
CN104408054B (zh) * 2014-10-29 2017-10-31 深圳市金证科技股份有限公司 一种数据库管理系统
JP6174002B2 (ja) * 2014-12-05 2017-08-02 株式会社東芝 匿名化装置、及びプログラム
US11121868B2 (en) * 2016-07-06 2021-09-14 Nippon Telegraph And Telephone Corporation Secure computation system, secure computation device, secure computation method, and program
US10353601B2 (en) * 2016-11-28 2019-07-16 Arm Limited Data movement engine
CN107194278B (zh) * 2017-05-15 2019-11-22 华中科技大学 一种基于Skyline的数据泛化方法
CN107301353B (zh) * 2017-06-27 2020-06-09 徐萍 一种流式密集型数据脱敏方法及其数据脱敏设备
CN107704321A (zh) * 2017-09-30 2018-02-16 北京元心科技有限公司 内存分配的方法、装置及终端设备
CN107766741A (zh) * 2017-10-23 2018-03-06 中恒华瑞(北京)信息技术有限公司 数据脱敏系统和方法
US10977446B1 (en) * 2018-02-23 2021-04-13 Lang Artificial Intelligence Inc. Unsupervised language agnostic intent induction and related systems and methods
CN108595979A (zh) * 2018-04-13 2018-09-28 中国民航信息网络股份有限公司 动态脱敏方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140189858A1 (en) 2012-12-27 2014-07-03 Industrial Technology Research Institute Generation Method and Device for generating anonymous dataset, and method and device for risk evaluation
JP2017041048A (ja) 2015-08-19 2017-02-23 Kddi株式会社 プライバシ保護装置、方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
長谷川 聡,大規模データを実用的な速度で処理可能な匿名化ライブラリの設計と実装評価,CSS2017 コンピュータセキュリティシンポジウム2017 論文集,日本,一般社団法人情報処理学会,2017年10月16日,Vol.2017, No2,pp.1342-pp.1349

Also Published As

Publication number Publication date
JPWO2020184127A1 (ja) 2021-12-16
CN113544683B (zh) 2023-09-29
WO2020184127A1 (ja) 2020-09-17
EP3940572B1 (en) 2023-07-26
EP3940572A1 (en) 2022-01-19
US11914740B2 (en) 2024-02-27
US20220171872A1 (en) 2022-06-02
EP3940572A4 (en) 2022-12-07
CN113544683A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
US20220350819A1 (en) System and method for improved performance in a multidimensional database environment
US9767174B2 (en) Efficient query processing using histograms in a columnar database
Plattner The impact of columnar in-memory databases on enterprise systems: implications of eliminating transaction-maintained aggregates
US9367574B2 (en) Efficient query processing in columnar databases using bloom filters
CN103262066B (zh) 有效存储分层
US8396862B2 (en) Product join dynamic partition elimination for multilevel partitioning
US11249980B2 (en) Updating of in-memory synopsis metadata for inserts in database table
US9916211B2 (en) Relational database recovery
CN105408857A (zh) 通过针对选择性交织数据位生成用于关系数据库的多列索引
US5999936A (en) Method and apparatus for compressing and decompressing sequential records in a computer system
US11232099B2 (en) Automatically aggregating data in database tables
JP7120439B2 (ja) データ一般化装置、データ一般化方法、プログラム
CN110096509A (zh) 大数据环境下实现历史数据拉链表存储建模处理的系统及方法
JP6006740B2 (ja) インデックス管理装置
JP7173282B2 (ja) データ置換装置、データ置換方法、プログラム
Pollack Delete and Update Operations
Pollack Columnstore Index Architecture
CN115794960A (zh) 关系型数据库的管理方法及装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210816

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220718

R150 Certificate of patent or registration of utility model

Ref document number: 7120439

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150