JP6154933B1 - グループ化装置、グループ化方法及びコンピュータプログラム - Google Patents

グループ化装置、グループ化方法及びコンピュータプログラム Download PDF

Info

Publication number
JP6154933B1
JP6154933B1 JP2016066645A JP2016066645A JP6154933B1 JP 6154933 B1 JP6154933 B1 JP 6154933B1 JP 2016066645 A JP2016066645 A JP 2016066645A JP 2016066645 A JP2016066645 A JP 2016066645A JP 6154933 B1 JP6154933 B1 JP 6154933B1
Authority
JP
Japan
Prior art keywords
grouping
information
records
group
equalization processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016066645A
Other languages
English (en)
Other versions
JP2017182341A (ja
Inventor
優一 真田
優一 真田
悠佑 榎本
悠佑 榎本
柳本 清
清 柳本
浩 鞍留
浩 鞍留
寛 寺門
寛 寺門
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone West Corp
Original Assignee
Nippon Telegraph and Telephone West Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone West Corp filed Critical Nippon Telegraph and Telephone West Corp
Priority to JP2016066645A priority Critical patent/JP6154933B1/ja
Application granted granted Critical
Publication of JP6154933B1 publication Critical patent/JP6154933B1/ja
Publication of JP2017182341A publication Critical patent/JP2017182341A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】匿名性及び有用性の双方を保つことが可能な匿名化技術を提供すること。【解決手段】匿名化されていない属性の値を有する非匿名化情報である複数のレコードを取得し、各グループに含まれるレコードの数が均等化するように複数のグループに分ける。【選択図】図1

Description

本発明は、情報の匿名化技術に関する。
従来、多くの情報をビッグデータとして収集し、それらを解析することによって新たな情報を取得することが行われている。ビッグデータには、個人の情報などそのままでは解析にかけることができない情報も含まれている。そのため、収集された情報を二次利用することが可能となるように、収集された情報に対して匿名化処理が行われている。
特開2015−046030号公報
しかしながら、従来の匿名化処理では匿名性及び有用性のバランスを適切に保つことが困難であった。
上記事情に鑑み、本発明は、匿名性及び有用性の双方を保つことが可能な匿名化技術を提供することを目的としている。
本発明の一態様は、匿名化されていない属性の値を有する非匿名化情報である複数のレコードを、各グループに含まれるレコードの数が均等化するように複数のグループに分ける均等化処理部、を備えるグループ化装置である。
本発明の一態様は、上記グループ化装置であって、前記均等化処理部は、一つのグループに含まれるレコードの数の最小限の数を変えて複数のパターンでグループ分けを実行し、前記複数のパターンのグループ分けの中から、所定の条件に基づいて一つのグループ分けを選択する。
本発明の一態様は、上記グループ化装置であって、前記均等化処理部は、前記複数のパターンのグループ分けの中から、生成されたグループの数が最も多く、且つ、各グループに含まれるレコードの数の分散が最も小さいグループ分けを選択する。
本発明の一態様は、上記グループ化装置であって、前記非匿名化情報に関する条件の定義を示す条件情報を取得する条件情報取得部をさらに備え、前記均等化処理部は、前記条件情報に基づいて前記複数のレコードをグループに分ける。
本発明の一態様は、上記グループ化装置であって、前記条件情報は、前記属性の値に関する閾値に基づいて前記属性の値を複数のクラスに分類する情報であり、前記均等化処理部は、クラス毎に前記レコードをグループ分けする。
本発明の一態様は、上記グループ化装置であって、前記条件情報は、一つの属性の値に関して与えられる複数のサブ属性を示す情報であり、前記均等化処理部は、前記サブ属性の値に基づいて前記レコードをグループ分けする。
本発明の一態様は、匿名化されていない属性の値を有する非匿名化情報である複数のレコードを取得するステップと、各グループに含まれるレコードの数が均等化するように複数のグループに分ける均等化処理ステップと、を有するグループ化方法である。
本発明の一態様は、匿名化されていない属性の値を有する非匿名化情報である複数のレコードを取得するステップと、各グループに含まれるレコードの数が均等化するように複数のグループに分ける均等化処理ステップと、をコンピュータに実行させるためのコンピュータプログラムである。
本発明により、匿名化処理において匿名性及び有用性の双方を保つことが可能となる。
匿名化システム1のシステム構成を表すシステム構成図である。 グループ化装置20の処理の流れの具体例を示すフローチャートである。 グループ化装置20が行う均等化処理の流れの具体例を示すフローチャートである。 均等化処理部202による均等化処理の具体例を示す図である。 グループ化装置20の動作の流れの変形例を示すフローチャートである。 均等化処理部202による均等化処理の変形例の具体例を示す図である。
図1は、匿名化システム1のシステム構成を表すシステム構成図である。匿名化システム1は、非匿名化情報記憶部10、グループ化装置20、グループ情報記憶部30、匿名化処理部40及び匿名化情報記憶部50を備える。
非匿名化情報記憶部10は、磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。非匿名化情報記憶部10は、匿名化されていない情報(以下「非匿名化情報」という。)を記憶する。非匿名化情報は、少なくとも1以上の属性を含む。1又は複数の属性の組み合わせによって表される情報のかたまりをレコードと呼ぶ。例えば、血圧値のレコードは、測定日時と、測定対象の人物を示す識別情報(例えば氏名、診察券番号など)と、血圧値と、の各属性の値を有する。非匿名化情報は、このようなレコードとして表されてもよい。
非匿名化情報記憶部10によって記憶される非匿名化情報において、匿名化の対象となっている属性(以下「匿名化対象属性」という。)は、例えば数値によって表される。例えば、匿名化対象属性は、価格、血圧、気温、消費電力量、給与、動作の回数(例:購入回数、閲覧回数)、年齢である。なお、非匿名化情報記憶部10が記憶する情報の一部には、既に匿名化された情報が含まれていてもよい。
非匿名化情報記憶部10は、さらに条件情報を記憶する。条件情報は、非匿名化情報に関する条件の定義を示す情報である。条件情報の具体例として、閾値定義、情報連結定義がある。閾値定義は、属性の値に関して予め与えられた閾値を示す情報である。閾値によって複数のクラスが定義される。例えば、属性が血圧である数値に対して予め与えられる閾値定義として、血圧の値が90以下の低血圧というクラス、血圧の値が90〜140の正常血圧というクラス、血圧の値が140以上の高血圧というクラス、という3つのクラスの定義がある。情報連結定義は、一つの属性の値に関して与えられる複数のサブ属性を示す情報である。例えば、属性が年月日である数値に対して予め与えられる情報連結定義として、最初の4桁の数値が年を表し、次の2桁の数値が月を表し、最後の2桁の数値が日を表す、という定義がある。この場合、年、月、日という3つのサブ属性が定義されている。
グループ化装置20は、非匿名化情報記憶部10に記憶される非匿名化情報の複数のレコードを、複数のグループに分類する。グループ化装置20は、メインフレームやワークステーションやパーソナルコンピュータなどの情報処理装置を用いて構成される。グループ化装置20は、バスで接続されたCPU(Central Processing Unit)やメモリや補助記憶装置などを備える。グループ化装置20は、グループ化プログラムを実行することによって、条件情報取得部201及び均等化処理部202を備える装置として機能する。なお、グループ化装置20の各機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されても良い。
条件情報取得部201は、非匿名化情報記憶部10から、匿名化対象属性に関する条件情報を取得する。条件情報取得部201は、取得された条件情報を均等化処理部202に出力する。
均等化処理部202は、非匿名化情報記憶部10から、匿名化処理の対象となる非匿名化情報の複数のレコードを取得する。均等化処理部202は、取得された複数のレコードに基づいて均等化処理を実行する。均等化処理の実行によって、均等化処理部202は、取得された複数のレコードを、各グループに含まれるレコードの数が均等化するように複数のグループに分ける。均等化処理において、均等化処理部202は、各グループに含まれるレコードの数が、予め指定された最小限の数を下回らないようにグループ化を行う。最小限の数は、例えばk匿名化処理における“k”の値である。均等化処理部202は、均等化処理の結果を示す情報(以下「グループ情報」という。)をグループ情報記憶部30に記録する。グループ情報は、均等化処理によって生成された各グループに属するレコードを示す。グループ情報は、例えば各グループの定義を示す情報(以下「グループ定義情報」という。)と、各グループに属するレコードを示す情報(以下「レコード帰属情報」という。)とを含む。
グループ情報記憶部30は、磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。グループ情報記憶部30は、グループ化装置20によって生成されたグループ情報を記憶する。
匿名化処理部40は、グループ情報記憶部30に記憶されているグループ情報に基づいて、非匿名化情報記憶部10に記憶されている非匿名化情報に対し匿名化処理を行う。例えば、匿名化処理部40は、各グループに属しているレコードの匿名化対象属性の値を、そのグループに属している各レコードの値を一般化することによって得られる値に置き換えることによって匿名化する。例えば、あるグループに属しているレコードの匿名化対象属性の値が10,11,13,14である場合、範囲を示す“10−15”という値や、中央値又は平均値を示す“12”という値などに置き換えることによって匿名化処理が行われる。匿名化処理部40は、このような匿名化処理の実行によって、非匿名化情報の匿名化対象属性の値が匿名化された情報(以下「匿名化情報」という。)を生成する。
匿名化情報記憶部50は、磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。匿名化情報記憶部50は、匿名化処理部40によって生成された匿名化情報を記憶する。
図2は、グループ化装置20の処理の流れの具体例を示すフローチャートである。まず、条件情報取得部201は、匿名化処理の対象となっている複数のレコードに関する条件情報を非匿名化情報記憶部10から取得する(ステップS101)。取得された条件情報に情報連結定義及び閾値定義が含まれない場合(ステップS102−なし、ステップS103−なし)、すなわち匿名化対象属性の値が単に数値として表される場合、均等化処理部202は匿名化対象のレコードに対して均等化処理を実行する(ステップS104)。
一方、情報連結定義はないものの閾値定義がある場合(ステップS102−なし、ステップS103−あり)、均等化処理部202はクラス分割処理を実行する(ステップS105)。クラス分割処理では、均等化処理部202は匿名化対象の複数のレコードを、閾値定義に基づいて複数のクラスに分割する。そして、均等化処理部202は、クラス毎に均等化処理を実行する(ステップS106)。このような処理により、閾値定義が存在する場合の均等化処理では、一つのグループに複数のクラスのレコードが分類されてしまうことが防止される。そのため、グループ化によって閾値の意義が滅却されてしまうことを防止できる。
情報連結定義がある場合(ステップS102−あり)、均等化処理部202はサブ属性分割処理を実行する(ステップS107)。サブ属性分割処理では、均等化処理部202は匿名化対象の複数のレコードにおいて匿名化対象属性の値を情報連結定義に基づいて複数のサブ属性に分割する。
サブ属性について閾値定義がない場合には(ステップS108−なし)、均等化処理部202は、サブ属性のうち匿名化処理の対象となっているサブ属性について均等化処理を実行する(ステップS109)。例えば、情報連結定義が“年”、“月”、“日”を示す定義であり、匿名化処理の対象となっているサブ属性が“月”である場合には、“年”及び“日”の値を無視して“月”のサブ属性の値のみに基づいて均等化処理が実行される。この場合、1月という値を有するレコードは、たとえサブ属性“年”の値がそれぞれ異なるレコード(例えば、2000年と2010年)であっても、同一のグループに分類される。例えば、情報連結定義が“年月”、“日”を示す定義であり、匿名化処理の対象となっているサブ属性が“年月”である場合には、“日”の値を無視して“年月”のサブ属性の値のみに基づいて均等化処理が実行される。この場合、“2000年1月”という値を有するレコードと“2010年1月”という値を有するレコードとは、それぞれ異なるグループに属する可能性がある。
サブ属性について閾値定義がある場合には(ステップS108−あり)、均等化処理部202は、サブ属性のうち匿名化処理の対象となっているサブ属性について、クラス分割処理を実行する(ステップS110)。そして、均等化処理部202は、サブ属性のうち匿名化処理の対象となっているサブ属性について、クラス毎に均等化処理を実行する(ステップS111)。
図3は、グループ化装置20が行う均等化処理の流れの具体例を示すフローチャートである。まず、均等化処理部202は、匿名化処理の対象となっているレコードを、匿名化対象属性の値(匿名化処理の対象となっているサブ属性の値を含む)に基づいて昇順にソートする(ステップS201)。次に、均等化処理部202は、匿名化対象属性の値が最小のレコードから、レコード個数n=aになるまでレコード個数をカウントする(ステップS202)。“a”の値は、予め指定された最小限の数以上の値である。例えば、k匿名化が実行される場合には、“a”の値は、k以上の値を有する。n=aの値までカウントできた場合、すなわちa個のレコードが存在した場合(ステップS203−YES)、均等化処理部202は、最後にカウントされたレコードの匿名化対象属性の値と、その次のレコードの匿名化対象属性の値とを比較する(ステップS204)。これらの値が等しい場合(ステップS204−YES)、均等化処理部202は、次のレコ−ドまでカウントし(ステップS205)、再度ステップS204の処理を実行する。最後にカウントされたレコードの匿名化対象属性の値と、その次のレコードの匿名化対象属性の値とが異なる場合(ステップS204−NO)、均等化処理部202は、カウントされたレコードを一つのグループとして定義する(ステップS206)。均等化処理部202は、カウントされたレコードの個数を示す値(レコード個数n)をリセットする。すなわち、レコード個数nの値を“0”にする(ステップS207)。均等化処理部202は、最後にカウントされたレコードの次のレコードから、レコード個数n=aになるまでレコード個数をカウントする(ステップS208)。そしてステップS203の処理に戻る。
ステップS203の処理において、n=aの値までカウントできなかった場合、すなわちa個のレコードが存在しなかった場合(ステップS203−NO)、カウントされたレコードを、直前に定義されたグループに追加する(ステップS209)。以上で、均等化処理が終了する。
図4は、均等化処理部202による均等化処理の具体例を示す図である。図4(A)は、昇順ソートが完了した非匿名化情報の具体例である。匿名化対象属性は“スコア”である。図4(B)は、最小限の数=5として実行された均等化処理の結果の具体例である。まず、均等化処理部202は、最小値30に相当するNO1からレコード数n=5となるNO5までカウントする(ステップS202,S203−YES)。最後のレコード(NO5)の値“40”と、次のレコードの値“43”とは異なる(ステップS204−NO)。均等化処理部202は、カウントしたレコードNO1〜NO5を一つ目のグループ(グループ1)として定義し(ステップS206)、レコード数nをリセットする(ステップS207)。均等化処理部202は、次のレコードであるレコードNO6からレコード数n=5となるNO10までカウントする(ステップS208)。
均等化処理部202は、このような処理を繰り返し、レコードNO16〜20を含むグループ4まで定義する。次に、均等化処理部202は、レコードNO21からレコード数n=5となるまでカウントする(ステップS208)。しかし、非匿名化情報にはレコードNO23までしか存在しないため、n=5までカウントできない(ステップS203−NO)。均等化処理部202は、カウントできたレコードNO21〜23までのレコードを、直前のグループであるグループ4に追加する(ステップS209)。このような処理によって、図4(B)に示されるようなグループ分けが完了する。
このように構成されたグループ化装置20では、匿名性及び有用性の双方を保つことが可能になる。具体的には以下のとおりである。
グループ化装置20が実行する均等化処理では、匿名化処理の対象となる複数のレコードは、各グループに含まれるレコードの数が均等化するように複数のグループに分けられる。そのため、極端に多くのレコードを有したグループが生じることを防止できる。その結果、匿名化対象属性の値が極端に丸められてしまうことによるデータの有用性の低下を抑止することが可能となる。
また、各グループに含まれるレコードの数は、予め指定された最小限の数(例えばk匿名化処理における“k”の値)を下回らないようにグループ化が行われる。そのため、最小限の数を下回った数のレコードのみを有するグループが生じることを防止できる。その結果、極端にレコードが少ないグループ(例えば1つしかレコードを有しないグループ)が生じてしまうことによる匿名性の低下を抑止することが可能となる。
(変形例)
図5は、グループ化装置20の動作の流れの変形例を示すフローチャートである。以下、変形例の処理の流れについて説明する。なお、図3におけるフローチャートに示される処理と同じ処理については、図5においても同じ符号を付して説明を省略する。また、図5のフローチャートの処理の開始時点では“a”に対して予め定められた初期値が与えられている。予め定められた初期値は、例えば予め指定された最小限の数であってもよいし、予め指定された最小限の数よりも大きい値であってもよい。
ステップS203の処理において、n=aの値までカウントできなかった場合、すなわちa個のレコードが存在しなかった場合(ステップS203−NO)、均等化処理部202は、その時点までにカウントされたレコード個数nがaの初期値以上であるか否か判定する(ステップS301)。レコード個数nがaの初期値以上である場合(ステップS301−YES)、均等化処理部202はカウントされたレコードを一つのグループとして定義する(ステップS302)。一方、レコード個数nがaの初期値未満である場合(ステップS301−NO)、均等化処理部202は、カウントされたレコードを直前に定義されたグループに追加する(ステップS303)。ここまでの処理によって、一つのグループ情報が定義される。
ステップS302又はステップS303の処理の後、均等化処理部202は、ステップS202〜S301の処理を所定の回数繰り返し実行したか否か判定する(ステップS304)。所定の回数繰り返して実行されていない場合(ステップS304−NO)、均等化処理部202は、“a”の値をインクリメントする(ステップS305)。そして、均等化処理部202は、インクリメント後の“a”の値を用いてステップS202以降の処理を実行する。そして、繰り返し実行された処理の回数に応じたグループ情報が生成される。所定の回数繰り返して実行された場合(ステップS304−YES)、均等化処理部202は、それまでに定義されたグループ情報の中から一つのグループ情報を選択する(ステップS306)。そして、均等化処理部202は、選択されたグループ情報を出力する。なお、所定の回数は、匿名化システム1のユーザによって設定された回数であってもよいし、匿名化システム1の設計者によって予め設定された回数であってもよいし、他の者によって設定された回数であってもよい。
図6は、均等化処理部202による均等化処理の変形例の具体例を示す図である。図6(A)は、昇順ソートが完了した非匿名化情報の具体例である。匿名化対象属性は“スコア”である。図6(B)は、a=5として実行された均等化処理の結果の具体例である。図6(C)は、a=6として実行された均等化処理の結果の具体例である。図6(D)は、a=7として実行された均等化処理の結果の具体例である。図6(E)は、a=8として実行された均等化処理の結果の具体例である。均等化処理部202は、このような複数のグループ情報の中から、所定の条件に基づいてグループ情報を選択する。例えば、各グループに含まれるレコードの数の分散が最も小さいグループ情報が選択されてもよい。この場合、a=8のグループ情報が選択される。例えば、生成されたグループの数が最も多いグループ情報のうち、各グループに含まれるレコードの数の分散が最も小さいグループ情報が選択されてもよい。この場合、a=6のグループ情報が選択される。
このように構成されたグループ化装置20によれば、各グループに含まれるレコードの数をより均等にすることが可能となる。また、生成されたグループの数が最も多いグループ情報のうち、各グループに含まれるレコードの数の分散が最も小さいグループ情報が選択されるように構成された場合には、グループの数が最大であることによってデータの有用性を維持しつつ、レコードの数を均等化することで匿名性を高めることが可能となる。
その他の変形例を以下に記載する。匿名化システム1は、非匿名化情報記憶部10、グループ情報記憶部30、匿名化情報記憶部50のいずれか一つ又は複数を備えないように構成されてもよい。この場合、各記憶部に相当する構成が、匿名化システム1の外部に設けられる。匿名化システム1に含まれる構成(グループ化装置20及び匿名化処理部40)は、匿名化システム1の外部に設けられた各記憶部に相当する構成とネットワークを介して通信し、記憶されている情報を取得する。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
1…匿名化システム, 10…非匿名化情報記憶部, 20…グループ化装置, 30…グループ情報記憶部, 40…匿名化処理部, 50…匿名化情報記憶部, 201…条件情報取得部, 202…均等化処理部

Claims (7)

  1. 匿名化されていない属性の値を有する非匿名化情報である複数のレコードを、各グループに含まれるレコードの数が均等化するように複数のグループに分ける均等化処理部、
    を備え
    前記均等化処理部は、一つのグループに含まれるレコードの数の最小限の数を変えて複数のパターンでグループ分けを実行し、前記複数のパターンのグループ分けの中から、所定の条件に基づいて一つのグループ分けを選択し、
    前記均等化処理部は、前記複数のパターンのグループ分けの中から、各グループに含まれるレコードの数の分散が最も小さいグループ分けを選択するグループ化装置。
  2. 前記均等化処理部は、前記複数のパターンのグループ分けの中から、生成されたグループの数が最も多く、且つ、各グループに含まれるレコードの数の分散が最も小さいグループ分けを選択する、請求項に記載のグループ化装置。
  3. 前記非匿名化情報に関する条件の定義を示す条件情報を取得する条件情報取得部をさらに備え、
    前記均等化処理部は、前記条件情報に基づいて前記複数のレコードをグループに分ける、請求項1又は2に記載のグループ化装置。
  4. 前記条件情報は、前記属性の値に関する閾値に基づいて前記属性の値を複数のクラスに分類する情報であり、
    前記均等化処理部は、クラス毎に前記レコードをグループ分けする、請求項に記載のグループ化装置。
  5. 前記条件情報は、一つの属性の値に関して与えられる複数のサブ属性を示す情報であり、
    前記均等化処理部は、前記サブ属性の値に基づいて前記レコードをグループ分けする、請求項に記載のグループ化装置。
  6. 情報処理装置が、匿名化されていない属性の値を有する非匿名化情報である複数のレコードを取得するステップと、
    情報処理装置が、各グループに含まれるレコードの数が均等化するように複数のグループに分ける均等化処理ステップと、
    を有し、
    前記均等化処理ステップでは、前記情報処理装置は、一つのグループに含まれるレコードの数の最小限の数を変えて複数のパターンでグループ分けを実行し、前記複数のパターンのグループ分けの中から、所定の条件に基づいて一つのグループ分けを選択し、
    前記均等化処理ステップでは、前記情報処理装置は、前記複数のパターンのグループ分けの中から、各グループに含まれるレコードの数の分散が最も小さいグループ分けを選択するグループ化方法。
  7. 匿名化されていない属性の値を有する非匿名化情報である複数のレコードを取得するステップと、
    各グループに含まれるレコードの数が均等化するように複数のグループに分ける均等化処理ステップと、
    をコンピュータに実行させ
    前記均等化処理ステップでは、一つのグループに含まれるレコードの数の最小限の数を変えて複数のパターンでグループ分けを実行し、前記複数のパターンのグループ分けの中から、所定の条件に基づいて一つのグループ分けを選択し、
    前記均等化処理ステップでは、前記複数のパターンのグループ分けの中から、各グループに含まれるレコードの数の分散が最も小さいグループ分けを選択するためのコンピュータプログラム。
JP2016066645A 2016-03-29 2016-03-29 グループ化装置、グループ化方法及びコンピュータプログラム Active JP6154933B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016066645A JP6154933B1 (ja) 2016-03-29 2016-03-29 グループ化装置、グループ化方法及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016066645A JP6154933B1 (ja) 2016-03-29 2016-03-29 グループ化装置、グループ化方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP6154933B1 true JP6154933B1 (ja) 2017-06-28
JP2017182341A JP2017182341A (ja) 2017-10-05

Family

ID=59218533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016066645A Active JP6154933B1 (ja) 2016-03-29 2016-03-29 グループ化装置、グループ化方法及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP6154933B1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05205058A (ja) * 1992-01-24 1993-08-13 Hitachi Ltd クラスタリング方法
JPH10134084A (ja) * 1996-09-02 1998-05-22 Fujitsu Ltd データ処理装置
US20070239982A1 (en) * 2005-10-13 2007-10-11 International Business Machines Corporation Method and apparatus for variable privacy preservation in data mining
JP2008299616A (ja) * 2007-05-31 2008-12-11 Kyushu Univ 文書分類装置、文書分類方法、プログラム及び記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05205058A (ja) * 1992-01-24 1993-08-13 Hitachi Ltd クラスタリング方法
JPH10134084A (ja) * 1996-09-02 1998-05-22 Fujitsu Ltd データ処理装置
US20070239982A1 (en) * 2005-10-13 2007-10-11 International Business Machines Corporation Method and apparatus for variable privacy preservation in data mining
JP2008299616A (ja) * 2007-05-31 2008-12-11 Kyushu Univ 文書分類装置、文書分類方法、プログラム及び記録媒体

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JPN6017009734; 柿澤 美穂 他: 'Pk-匿名化手法の精度改良に関する諸検討' 第7回データ工学と情報マネージメントに関するフォーラム[online] , 20150304, pp. 1-7 *
JPN6017009736; 新井淳也 他: 'クラスタリングと空間分割の併用による効率的なk-匿名化' 日本データベース学会和文論文誌 Vol.13-J, No. 1, 201410, pp. 72-77, 日本データベース学会 *
JPN6017009738; 角野為耶 他: '滞在場所のk-匿名化法' 2014年度 人工知能学会 第28回全国大会論文集CD-ROM[CD-ROM] , 20140515, pp. 1-4, 社団法人 人工知能学会 *

Also Published As

Publication number Publication date
JP2017182341A (ja) 2017-10-05

Similar Documents

Publication Publication Date Title
TWI718643B (zh) 異常群體識別方法及裝置
JP5626733B2 (ja) 個人情報匿名化装置及び方法
EP3037983A1 (en) Data processing system, data processing method, and data processing device
JP5621773B2 (ja) 分類階層再作成システム、分類階層再作成方法及び分類階層再作成プログラム
US20150356128A1 (en) Index key generating device, index key generating method, and search method
CN110297853B (zh) 频繁集挖掘方法和装置
US20150032708A1 (en) Database analysis apparatus and method
CN107292195A (zh) 基于密度划分的k‑匿名隐私保护方法
CN107870956B (zh) 一种高效用项集挖掘方法、装置及数据处理设备
WO2018059298A1 (zh) 模式挖掘方法、高效用项集挖掘方法及相关设备
JP6696568B2 (ja) アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置
JP6242540B1 (ja) データ変換システム及びデータ変換方法
CN106033425A (zh) 数据处理设备和数据处理方法
US11620406B2 (en) Information processing device, information processing method, and recording medium
WO2014006851A1 (ja) 匿名化装置、匿名化システム、匿名化方法、及び、プログラム記録媒体
JP2017182508A (ja) 匿名化装置、匿名化方法及びコンピュータプログラム
CN108268611B (zh) 一种基于MapReduce的k-means文本聚类的方法及装置
JP6154933B1 (ja) グループ化装置、グループ化方法及びコンピュータプログラム
US20160110362A1 (en) Automatic enumeration of data analysis options and rapid analysis of statistical models
JP2016014944A (ja) 相関ルール分析装置および相関ルール分析方法
JP6393411B2 (ja) データ分析支援システム及びデータ分析支援方法
US11886513B2 (en) Data analysis system, data analysis method, and computer program product
JP2021149489A (ja) 業務可視化装置、業務可視化方法、及びプログラム
JP6148370B1 (ja) グループ化装置、グループ化方法及びコンピュータプログラム
JP6452025B2 (ja) 表示システム、表示方法および表示プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170519

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170602

R150 Certificate of patent or registration of utility model

Ref document number: 6154933

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250