JP7096145B2 - Clustering device, clustering method and clustering program - Google Patents
Clustering device, clustering method and clustering program Download PDFInfo
- Publication number
- JP7096145B2 JP7096145B2 JP2018232364A JP2018232364A JP7096145B2 JP 7096145 B2 JP7096145 B2 JP 7096145B2 JP 2018232364 A JP2018232364 A JP 2018232364A JP 2018232364 A JP2018232364 A JP 2018232364A JP 7096145 B2 JP7096145 B2 JP 7096145B2
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- record
- gravity
- center
- clusters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、暗号化されたデータセットをクラスタリングする装置、方法及びプログラムに関する。 The present invention relates to devices, methods and programs for clustering encrypted datasets.
従来、データの匿名化手法として、例えば非特許文献1~3に示されるように、k-匿名化のアルゴリズムが数多く提案されてきた。これらの手法は、ユーザが持つデータセットをユーザ自身が匿名化することを想定しているため、全ての演算が平文で処理される。
Conventionally, as a data anonymization method, many k-anonymization algorithms have been proposed, for example, as shown in
匿名化を外部に委託する場合、又は複数機関の持つデータを併せて匿名化する場合は、データは暗号化される必要がある。例えば、非特許文献4の手法では、複数機関で匿名化を行うことを想定しているが、データ保有者がプロトコルに参加する必要がある、確定的暗号を用いる必要があり匿名性が低下する等の課題があった。
When outsourcing anonymization, or when anonymizing data held by multiple institutions together, the data needs to be encrypted. For example, in the method of Non-Patent
また、前述のk-匿名化アルゴリズムは、平文上では高速に実行できるが、同じアルゴリズムをそのまま暗号化されたデータに対して適用した場合、次の問題がある。
秘密計算では、データを秘匿した状態で加法及び乗法が可能なため、理論上は任意の計算が秘匿した状態で実現可能である。しかし、Garbled Circuit、秘密分散、準同型暗号等、いずれの計算手法を用いた場合でも処理が遅く、大規模なデータに対しては現実的な時間で目的の機能を果たすことが困難であることが知られている。
Further, although the above-mentioned k-anonymization algorithm can be executed at high speed in plain text, when the same algorithm is applied to encrypted data as it is, there are the following problems.
In secret calculation, addition and multiplication can be performed while the data is concealed, so theoretically any calculation can be realized in a concealed state. However, even if any calculation method such as Garbled Circuit, secret sharing, homomorphic encryption, etc. is used, the processing is slow and it is difficult to achieve the desired function in a realistic time for large-scale data. It has been known.
本発明は、暗号化したデータを高速にクラスタリングできるクラスタリング装置、クラスタリング方法及びクラスタリングプログラムを提供することを目的とする。 An object of the present invention is to provide a clustering device, a clustering method, and a clustering program capable of clustering encrypted data at high speed.
本発明に係るクラスタリング装置は、暗号化されたデータセットのレコードを所定数のクラスタに分割する際に、各クラスタに少なくとも1つの初期レコードを割り当てる初期処理部と、前記クラスタそれぞれについて、所属するレコード全体の重心を算出する重心算出部と、前記クラスタ毎に、前記データセットのうち、前記重心との距離が近いレコードから順に当該クラスタに所属させる分割処理を並列に実行する分割処理部と、を備える。 The clustering apparatus according to the present invention has an initial processing unit that allocates at least one initial record to each cluster when dividing a record of an encrypted data set into a predetermined number of clusters, and a record to which each of the clusters belongs. A center of gravity calculation unit that calculates the entire center of gravity, and a division processing unit that executes division processing in parallel for each cluster so that the records that are closest to the center of gravity of the data set belong to the cluster in order. Be prepared.
前記重心算出部は、前記クラスタ毎に、前記分割処理を複数回実行した後に当該クラスタの前記重心を算出してもよい。 The center of gravity calculation unit may calculate the center of gravity of the cluster after executing the division process a plurality of times for each cluster.
前記初期処理部は、前記初期レコードをランダムに選択してもよい。 The initial processing unit may randomly select the initial record.
前記クラスタリング装置は、前記分割処理部による処理結果として、複数のクラスタに重複して所属したレコードがある場合、当該レコード毎に、最も前記重心との距離が近いクラスタのみに所属させる第1調整処理を並列に実行する第1調整部を備えてもよい。 When the clustering apparatus has records that belong to a plurality of clusters in duplicate as a result of processing by the division processing unit, the first adjustment process for each record belongs only to the cluster closest to the center of gravity. May be provided with a first adjusting unit that executes the above in parallel.
前記クラスタリング装置は、前記分割処理部による処理結果として、いずれのクラスタにも所属しなかったレコードがある場合、当該レコード毎に、最も前記重心との距離が近いクラスタに所属させる第2調整処理を並列に実行する第2調整部を備えてもよい。 If there is a record that does not belong to any of the clusters as a result of processing by the division processing unit, the clustering apparatus performs a second adjustment process for each record to belong to the cluster closest to the center of gravity. A second adjustment unit that is executed in parallel may be provided.
前記クラスタリング装置は、前記分割処理部による処理結果として、所定の大きさに満たないクラスタがある場合、当該クラスタ毎に、当該クラスタに所属しているレコードを重心間の距離が最も近いクラスタに所属させる第3調整処理を並列に実行する第3調整部を備えてもよい。 When there are clusters smaller than a predetermined size as a result of processing by the division processing unit, the clustering apparatus belongs to the cluster having the shortest distance between the centers of gravity of the records belonging to the cluster for each cluster. A third adjustment unit may be provided to execute the third adjustment process to be performed in parallel.
本発明に係るクラスタリング方法は、暗号化されたデータセットのレコードを所定数のクラスタに分割する際に、各クラスタに少なくとも1つの初期レコードを割り当てる初期処理ステップと、前記クラスタそれぞれについて、所属するレコード全体の重心を算出する重心算出ステップと、前記クラスタ毎に、前記データセットのうち、前記重心との距離が近いレコードから順に当該クラスタに所属させる分割処理を並列に実行する分割処理ステップと、をコンピュータが実行する。 The clustering method according to the present invention includes an initial processing step of allocating at least one initial record to each cluster when dividing a record of an encrypted data set into a predetermined number of clusters, and a record to which each of the clusters belongs. A center of gravity calculation step for calculating the entire center of gravity and a split processing step of parallelly executing a division process of assigning the data set to the cluster in order from the record having the closest distance to the center of the data set for each cluster. The computer runs.
本発明に係るクラスタリングプログラムは、暗号化されたデータセットのレコードを所定数のクラスタに分割する際に、各クラスタに少なくとも1つの初期レコードを割り当てる初期処理ステップと、前記クラスタそれぞれについて、所属するレコード全体の重心を算出する重心算出ステップと、前記クラスタ毎に、前記データセットのうち、前記重心との距離が近いレコードから順に当該クラスタに所属させる分割処理を並列に実行する分割処理ステップと、をコンピュータに実行させるためのものである。 The clustering program according to the present invention has an initial processing step of allocating at least one initial record to each cluster when dividing a record of an encrypted data set into a predetermined number of clusters, and a record belonging to each of the clusters. A center of gravity calculation step for calculating the entire center of gravity and a splitting process for each cluster in which the splitting process of assigning the data set to the cluster in order from the record closest to the center of gravity is executed in parallel. It's meant to be run by a computer.
本発明によれば、暗号化したデータを高速にクラスタリングできる。 According to the present invention, encrypted data can be clustered at high speed.
以下、本発明の実施形態の一例について説明する。
図1は、本実施形態に係るクラスタリング装置1の機能構成を示すブロック図である。
クラスタリング装置1は、サーバ装置又はパーソナルコンピュータ等の情報処理装置(コンピュータ)であり、制御部10及び記憶部20の他、各種データの入出力デバイス及び通信デバイス等を備える。
Hereinafter, an example of the embodiment of the present invention will be described.
FIG. 1 is a block diagram showing a functional configuration of the
The
制御部10は、クラスタリング装置1の全体を制御する部分であり、記憶部20に記憶された各種プログラムを適宜読み出して実行することにより、本実施形態における各機能を実現する。制御部10は、CPUであってよい。
The
記憶部20は、ハードウェア群をクラスタリング装置1として機能させるための各種プログラム、及び各種データ等の記憶領域であり、ROM、RAM、フラッシュメモリ又はハードディスク(HDD)等であってよい。具体的には、記憶部20は、本実施形態の各機能を制御部10に実行させるためのプログラム(クラスタリングプログラム)、及びこのプログラムが処理対象とするデータセット、各種の変数、フラグ等を記憶する。
The
制御部10は、初期処理部11と、重心算出部12と、分割処理部13と、第1調整部14と、第2調整部15と、第3調整部16とを備える。制御部10は、これらの機能部により、処理対象のデータセットを暗号化されたまま複数のクラスタに分割する。
クラスタリング装置1は、データセットの各レコードをデータ点とし、分割された各クラスタに所属する点を重心等の代表点に変更することでk-匿名化を実現する。
The
The
初期処理部11は、暗号化されたデータセットの複数のレコードを所定数のクラスタに分割する際に、各クラスタに少なくとも1つの初期レコードを割り当てる。
初期レコードの割当方法は限定されないが、本実施形態では、処理速度を優先し、初期処理部11は、初期レコードをランダムに選択する。
The
The method of allocating the initial record is not limited, but in the present embodiment, the processing speed is prioritized, and the
重心算出部12は、クラスタそれぞれについて、所属するレコード全体の重心を算出する。
クラスタに所属するレコードは、分割処理部13による分割処理の度に増加していく。したがって、重心は分割処理の度に更新されてもよいが、本実施形態では、処理速度を優先し、重心算出部12は、クラスタ毎に、分割処理を複数回実行した後にクラスタの重心を算出して更新する。例えば、重心算出部12は、繰り返し処理中の毎回の更新を省略し、所定回数の分割処理が完了した後に1回、あるいは、所定回数の分割処理が完了するまでに数回、重心を更新してもよい。
The center of
The records belonging to the cluster increase every time the
分割処理部13は、クラスタ毎に、データセットのうち、重心との距離が近いレコードから順にこのクラスタに所属させる分割処理を並列に所定回数実行する。実行回数は、例えば、k-匿名化におけるクラスタの最小数kに、適宜設定される調整数αを加算したk+α回であってよい。
これにより、分割処理部13は、重心からの距離が近いレコードを探索するという処理を、クラスタの数だけ並列化して実行し、処理速度を向上させる。
The
As a result, the
第1調整部14は、分割処理部13による処理結果として、複数のクラスタに重複して所属したレコードがある場合、該当するレコード毎に、最も重心との距離が近いクラスタのみに所属させ、他のクラスタへの所属を解除する第1調整処理を並列に実行する。
If there are duplicate records belonging to a plurality of clusters as a result of processing by the
第2調整部15は、分割処理部13による処理結果として、いずれのクラスタにも所属しなかったレコードがある場合、該当するレコード毎に、最も重心との距離が近いクラスタに所属させる第2調整処理を並列に実行する。
If there is a record that does not belong to any of the clusters as a result of processing by the
第3調整部16は、分割処理部13による処理結果として、所定の大きさ、すなわちk-匿名化における最小数kに満たないクラスタがある場合、該当するクラスタ毎に、このクラスタに所属しているレコードを、重心間の距離が最も近い他のクラスタに所属させる第3調整処理を並列に実行する。
If there is a cluster of a predetermined size, that is, less than the minimum number k in k-anonymization as a result of processing by the
図2は、本実施形態に係るクラスタリング方法における分割処理のアルゴリズムAを例示する図である。
アルゴリズムAでは、暗号化されたデータセットE(D)、k-匿名化におけるパラメータk、及び調整パラメータαが入力される。
FIG. 2 is a diagram illustrating the algorithm A of the division processing in the clustering method according to the present embodiment.
In the algorithm A, the encrypted data set E (D), the parameter k in k-anonymization, and the adjustment parameter α are input.
まず、ri[0]を、データセットE(D)のi番目のレコードの値(データ点)とする。さらに、ri[j]を、レコードriがj番目のクラスタに所属している(=E(1))か否か(=E(0))を示すフラグとする(ステップ2)。
データセットのレコード数がn、クラスタ数がKのとき、1≦i≦n、1≦j≦Kにおいて、ri[j]はE(0)に初期化される(ステップ3)。
First, let r i [0] be the value (data point) of the i-th record of the data set E (D). Further, r i [j] is set as a flag indicating whether or not the record r i belongs to the jth cluster (= E (1)) (= E (0)) (step 2).
When the number of records in the data set is n and the number of clusters is K, ri [j] is initialized to E (0) in 1 ≦ i ≦ n and 1 ≦ j ≦ K (step 3).
また、di[j]を、ri[0]とクラスタcjの重心g(cj)との距離とする(ステップ4)。
1≦i≦n、1≦j≦Kにおいて、di[j]はE(∞)に初期化される(ステップ5)。
Further, let di [j] be the distance between r i [0] and the center of gravity g (c j ) of the cluster c j (step 4).
In 1 ≦ i ≦ n and 1 ≦ j ≦ K, di [j] is initialized to E (∞) (step 5).
次に、データセットE(D)からK=floor(n/k)個のレコードがランダムに選択される(ステップ6)。
i番目のクラスタに対してi番目のレコードが選択されたとすると、ri[i]はE(1)に、g(ci)はE(ri[0])に更新される(ステップ7)。
Next, K = floor (n / k) records are randomly selected from the data set E (D) (step 6).
Assuming that the i-th record is selected for the i-th cluster, ri [ i ] is updated to E (1) and g ( ci ) is updated to E ( ri [0]) (step 7). ).
ステップ9から15において、K個のクラスタ毎に、分割処理がk+α回繰り返される。この分割処理は、クラスタの数と同数に並列化され、ステップ12と13とがクラスタの単位で並列実行される。
In
分割処理部13は、クラスタcjに対して、重心g(cj)との距離が最小となるレコードi’を、いずれのクラスタにも所属していないレコードの中から選択する(ステップ12)。そして、分割処理部13は、ri’[j]及びdi’[j]を更新する(ステップ13)。
The
k+α回の繰り返し処理が完了すると、クラスタcjには、フラグri[j]がE(1)となっているレコードriが所属している。
重心算出部12は、全てのクラスタcjについて、重心g(cj)を更新する(ステップ17)。
When the iterative processing of k + α times is completed, the record r i in which the flag r i [j] is E (1) belongs to the cluster c j .
The center of
なお、繰り返しの回数は、パラメータαにより調整されるが、この回数が多くなるほど、複数のクラスタに重複して所属するレコードが増加し、回数が少なくなるほど、いずれのクラスタにも所属しないレコードが増加する。
パラメータαは、状況に応じて適宜設定されるが、正しくクラスタリングされなかったレコードについては、次の処理により調整される。
The number of repetitions is adjusted by the parameter α, but as the number of repetitions increases, the number of records that belong to multiple clusters increases, and as the number of times decreases, the number of records that do not belong to any cluster increases. do.
The parameter α is appropriately set according to the situation, but the records that are not clustered correctly are adjusted by the following processing.
図3は、本実施形態に係る第1調整処理及び第2調整処理を含むアルゴリズムBを例示する図である。 FIG. 3 is a diagram illustrating an algorithm B including a first adjustment process and a second adjustment process according to the present embodiment.
ステップ23~27の第1調整処理では、複数のクラスタに所属したレコード、すなわち、ri[j]の和(1≦j≦K)がE(0)でもE(1)でもないレコードriが調整される。第1調整部14は、これらのレコードを並列に処理する。
In the first adjustment process of steps 23 to 27, the records belonging to a plurality of clusters, that is, the records r i in which the sum (1 ≦ j ≦ K) of r i [j] is neither E (0) nor E (1). Is adjusted. The
第1調整部14は、各レコードriについて、重心からの距離di[j]が最小のクラスタc’jを選択し(ステップ25)、フラグri[j’]をE(1)に、その他のフラグ∀ri[j≠j’]をE(0)に更新する(ステップ26)。
The
ステップ29~33の第2調整処理では、いずれのクラスタにも所属しないレコード、すなわち、ri[j]の和(1≦j≦K)がE(0)のレコードriが調整される。第2調整部15は、これらのレコードを並列に処理する。
In the second adjustment process of steps 29 to 33, a record that does not belong to any of the clusters, that is, a record r i whose sum (1 ≦ j ≦ K) of r i [j] is E (0) is adjusted. The
第2調整部15は、各レコードriについて、重心からの距離が最小のクラスタc’jを選択し(ステップ31)、フラグri[j’]をE(1)に更新する(ステップ32)。
The
第1調整処理及び第2調整処理が終了すると、全てのクラスタcjについて、重心g(cj)が更新される(ステップ34)。 When the first adjustment process and the second adjustment process are completed, the center of gravity g (c j ) is updated for all the clusters c j (step 34).
図4は、本実施形態に係る第3調整処理及び匿名化の処理を含むアルゴリズムCを例示する図である。 FIG. 4 is a diagram illustrating an algorithm C including a third adjustment process and an anonymization process according to the present embodiment.
ステップ43~47の第3調整処理では、クラスタに所属するレコードの数がkより小さい、すなわちri[j]の和(1≦i≦n)がE(k)より小さいクラスタcjが調整される。第3調整部16は、これらのクラスタを並列に処理する。
In the third adjustment process of steps 43 to 47, the cluster c j in which the number of records belonging to the cluster is smaller than k, that is, the sum of r i [j] (1 ≦ i ≦ n) is smaller than E (k) is adjusted. Will be done. The
第3調整部16は、調整対象のクラスタcjについて、重心間の距離が最小の他のクラスタc’hを選択し(ステップ45)、クラスタcjの全レコードをクラスタc’hに所属させるため、フラグri[h’]をE(1)に、フラグri[j]をE(0)に更新する(ステップ46)。
The
続いて、制御部10は、k-匿名化のため、全レコードの値ri[0]を、所属するクラスタcjの重心g(cj)に更新する(ステップ48~50)。
そして、制御部10は、ri[0]の集合を、クラスタリングされたデータセットE(D’)として出力する(ステップ51)。
Subsequently, the
Then, the
本実施形態によれば、クラスタリング装置1は、暗号化されたデータセットのレコードをクラスタに分割する際に、はじめから分割するクラスタの数を決定し、各クラスタに少なくとも1つの初期レコードを割り当てた後、クラスタ毎に、重心との距離が近いレコードから順にこのクラスタに所属させる分割処理を並列に実行する。
According to the present embodiment, when the
従来のクラスタリング手法では、全てのレコードに対してどのクラスタに属するかの判定(Argmin)処理が必要となる。例えば、各レコードとクラスタとの距離を計算した上で所属するクラスタを決定し、クラスタの更新を行うという処理が全てのレコードに対して行われるが、このアルゴリズムは並列処理が困難であり、少なくともレコードの数だけArgmin又はArgmaxの処理が必要であった。
一方、クラスタリング装置1は、各クラスタからレコードまでの距離を計算し、その後クラスタの重心を更新するため、クラスタの数と同数の並列化処理が可能となる。したがって、重心との距離が近いレコードを探索するという重い処理を並列化することで、暗号文上でもデータセットのクラスタリング(例えば、k-匿名化)を高速に実行できる。
In the conventional clustering method, it is necessary to determine (Argmin) which cluster belongs to all the records. For example, the process of calculating the distance between each record and the cluster, determining the cluster to which it belongs, and updating the cluster is performed for all records, but this algorithm is difficult to process in parallel, and at least Argmin or Argmax processing was required for the number of records.
On the other hand, since the
クラスタリング装置1は、クラスタの重心を再計算する頻度を、クラスタが更新される頻度よりも減らすことで、処理を高速化できる。なお、再計算の頻度は、クラスタリングの精度とのトレードオフにより、適宜設定されてよい。
また、クラスタリング装置1は、各クラスタの初期レコードをランダムに選択することで、処理を高速化できる。
The
Further, the
クラスタリング装置1は、分割処理の結果、複数のクラスタに重複して所属したレコードがある場合、これらのレコード毎に、最も重心との距離が近いクラスタのみに所属させる第1調整処理を並列に実行する。
また、クラスタリング装置1は、分割処理の結果、いずれのクラスタにも所属しなかったレコードがある場合、これらのレコード毎に、最も重心との距離が近いクラスタに所属させる第2調整処理を並列に実行する。
さらに、クラスタリング装置1は、分割処理の結果、所定の大きさに満たないクラスタがある場合、これらのクラスタ毎に、所属しているレコードを重心間の距離が最も近い他のクラスタに所属させる第3調整処理を並列に実行する。
したがって、クラスタリング装置1は、分割処理によりクラスタリングが十分にできなかった部分を調整でき、さらに、これらの各種調整処理を並列化することで高速に実行できる。
When the
Further, if there are records that do not belong to any of the clusters as a result of the division processing, the
Further, when the
Therefore, the
以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、前述した実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、実施形態に記載されたものに限定されるものではない。 Although the embodiments of the present invention have been described above, the present invention is not limited to the above-described embodiments. Moreover, the effects described in the above-described embodiments are merely a list of the most suitable effects resulting from the present invention, and the effects according to the present invention are not limited to those described in the embodiments.
クラスタリング装置1によるクラスタリング方法は、ソフトウェアにより実現される。ソフトウェアによって実現される場合には、このソフトウェアを構成するプログラムが、情報処理装置(コンピュータ)にインストールされる。また、これらのプログラムは、CD-ROMのようなリムーバブルメディアに記録されてユーザに配布されてもよいし、ネットワークを介してユーザのコンピュータにダウンロードされることにより配布されてもよい。さらに、これらのプログラムは、ダウンロードされることなくネットワークを介したWebサービスとしてユーザのコンピュータに提供されてもよい。
The clustering method by the
1 クラスタリング装置
10 制御部
11 初期処理部
12 重心算出部
13 分割処理部
14 第1調整部
15 第2調整部
16 第3調整部
20 記憶部
1
Claims (8)
前記クラスタそれぞれについて、所属するレコード全体の重心を暗号文上で算出する重心算出部と、
前記クラスタ毎に、前記データセットのうち、暗号文上で算出した前記重心との距離が近いレコードから順に当該クラスタに所属させる分割処理を、前記クラスタの数と同数に並列化して実行する分割処理部と、を備えるクラスタリング装置。 An initial processing unit that allocates at least one initial record to each cluster when dividing the records of the encrypted data set into a predetermined number of clusters.
For each of the clusters, a center of gravity calculation unit that calculates the center of gravity of the entire record to which it belongs on the ciphertext ,
For each cluster, the division process of assigning the data set to the cluster in order from the record calculated on the ciphertext and having the closest distance to the center of gravity is executed in parallel with the same number of clusters. A clustering device that includes a unit.
前記クラスタそれぞれについて、所属するレコード全体の重心を暗号文上で算出する重心算出ステップと、
前記クラスタ毎に、前記データセットのうち、暗号文上で算出した前記重心との距離が近いレコードから順に当該クラスタに所属させる分割処理を、前記クラスタの数と同数に並列化して実行する分割処理ステップと、をコンピュータが実行するクラスタリング方法。 An initial processing step that allocates at least one initial record to each cluster when dividing records in an encrypted dataset into a predetermined number of clusters.
For each of the clusters, a center of gravity calculation step for calculating the center of gravity of the entire record to which the record belongs on the ciphertext , and
For each cluster, the division process of assigning the data set to the cluster in order from the record calculated on the ciphertext and having the closest distance to the center of gravity is executed in parallel with the same number of clusters. Steps and how the computer performs the clustering method.
前記クラスタそれぞれについて、所属するレコード全体の重心を暗号文上で算出する重心算出ステップと、
前記クラスタ毎に、前記データセットのうち、暗号文上で算出した前記重心との距離が近いレコードから順に当該クラスタに所属させる分割処理を、前記クラスタの数と同数に並列化して実行する分割処理ステップと、をコンピュータに実行させるためのクラスタリングプログラム。 An initial processing step that allocates at least one initial record to each cluster when dividing records in an encrypted dataset into a predetermined number of clusters.
For each of the clusters, a center of gravity calculation step for calculating the center of gravity of the entire record to which the record belongs on the ciphertext , and
For each cluster, the division process of assigning the data set to the cluster in order from the record calculated on the cryptographic text and having the closest distance to the center of gravity is executed in parallel with the same number of clusters. A clustering program that lets your computer perform steps and.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018232364A JP7096145B2 (en) | 2018-12-12 | 2018-12-12 | Clustering device, clustering method and clustering program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018232364A JP7096145B2 (en) | 2018-12-12 | 2018-12-12 | Clustering device, clustering method and clustering program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020095437A JP2020095437A (en) | 2020-06-18 |
JP7096145B2 true JP7096145B2 (en) | 2022-07-05 |
Family
ID=71084969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018232364A Active JP7096145B2 (en) | 2018-12-12 | 2018-12-12 | Clustering device, clustering method and clustering program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7096145B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2020472129B2 (en) * | 2020-10-16 | 2023-12-07 | Nippon Telegraph And Telephone Corporation | Secret grouping device, secret grouping system, secret grouping method, and program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015151155A1 (en) | 2014-03-31 | 2015-10-08 | 株式会社日立国際電気 | Personal safety verification system and similarity search method for data encrypted for confidentiality |
JP2016149099A (en) | 2015-02-13 | 2016-08-18 | ソフトバンク株式会社 | Anonymity processing method, anonymity processing program and anonymity processing device |
JP2018055610A (en) | 2016-09-30 | 2018-04-05 | 日本電信電話株式会社 | Anonymization device, anonymization method and program |
-
2018
- 2018-12-12 JP JP2018232364A patent/JP7096145B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015151155A1 (en) | 2014-03-31 | 2015-10-08 | 株式会社日立国際電気 | Personal safety verification system and similarity search method for data encrypted for confidentiality |
JP2016149099A (en) | 2015-02-13 | 2016-08-18 | ソフトバンク株式会社 | Anonymity processing method, anonymity processing program and anonymity processing device |
JP2018055610A (en) | 2016-09-30 | 2018-04-05 | 日本電信電話株式会社 | Anonymization device, anonymization method and program |
Non-Patent Citations (1)
Title |
---|
ソレム ジャン・エリク,実践 コンピュータビジョン,第1版,株式会社オライリー・ジャパン ,2013年03月21日,p.131 |
Also Published As
Publication number | Publication date |
---|---|
JP2020095437A (en) | 2020-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200403778A1 (en) | Dynamic blockchain system and method for providing efficient and secure distributed data access, data storage and data transport | |
US9916394B2 (en) | Vectorized graph processing | |
US20210165913A1 (en) | Controlling access to de-identified data sets based on a risk of re- identification | |
US8515956B2 (en) | Method and system for clustering datasets | |
JP6940239B2 (en) | Methods and systems for anonymizing data stock | |
US20180114028A1 (en) | Secure multi-party information retrieval | |
Mestre et al. | Improving load balancing for mapreduce-based entity matching | |
WO2018233051A1 (en) | Data release method and device, and server and storage medium | |
WO2014108768A1 (en) | Computing regression models | |
TW201730788A (en) | Method and device for feature data processing | |
WO2017118335A1 (en) | Mapping method and device | |
CN109241193B (en) | Distributed database processing method and device, and server cluster | |
Primault et al. | Adaptive location privacy with alp | |
US10749910B1 (en) | Multidimensional vectors for analyzing and visually displaying identity permissions | |
JP7096145B2 (en) | Clustering device, clustering method and clustering program | |
Qu et al. | Privacy preserving in big data sets through multiple shuffle | |
US20230409968A1 (en) | Multi-party machine learning using a database cleanroom | |
Ye et al. | GCplace: geo-cloud based correlation aware data replica placement | |
Benjamas et al. | Impact of I/O and execution scheduling strategies on large scale parallel data mining | |
JP7283583B2 (en) | Control method, control program, and information processing device | |
Tomašić et al. | Using Hadoop MapReduce in a multicluster environment | |
JP6000175B2 (en) | Anonymization system, anonymization device, user device, anonymization method, and program | |
US11170000B2 (en) | Parallel map and reduce on hash chains | |
CN115668234A (en) | Efficient privacy enhancement of servers in federated learning | |
CN112417478A (en) | Data processing method, device, equipment and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220623 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7096145 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |