JP2010086179A - 情報処理装置、コンピュータプログラムおよび記録媒体 - Google Patents

情報処理装置、コンピュータプログラムおよび記録媒体 Download PDF

Info

Publication number
JP2010086179A
JP2010086179A JP2008252890A JP2008252890A JP2010086179A JP 2010086179 A JP2010086179 A JP 2010086179A JP 2008252890 A JP2008252890 A JP 2008252890A JP 2008252890 A JP2008252890 A JP 2008252890A JP 2010086179 A JP2010086179 A JP 2010086179A
Authority
JP
Japan
Prior art keywords
anonymization
item
database
data
grouping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008252890A
Other languages
English (en)
Inventor
Tooru Kamiko
徹 上甲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2008252890A priority Critical patent/JP2010086179A/ja
Publication of JP2010086179A publication Critical patent/JP2010086179A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】個々の項目に対して匿名化を行った場合に、項目全体として匿名化が出来ているか否かを判定することで情報の匿名化が可能な、情報処理装置を提供すること。
【解決手段】匿名化区分を項目毎に記憶する匿名化項目記憶部と、第1のデータベースに記録されているデータに対し、項目毎に匿名化区分を指定して該匿名化区分でグループ化し、項目毎に該グループ化後の最小のデータ数を算出することにより匿名化処理を実行し、匿名化処理の結果を第2のデータベースに記録する匿名化処理部と、第2のデータベースに記録された匿名化処理の結果に対して、所定の閾値を下回る項目が存在しているか否かを判定する匿名化判定部と、を含む、情報処理装置が提供される。
【選択図】図1

Description

本発明は、情報処理装置、コンピュータプログラムおよび記録媒体に関する。
企業や行政府等において、情報の統計を取るために情報を収集することが広く行われている。企業や行政府等が収集した情報には個人を特定し得る情報(個人情報)が含まれている場合があり、そのような情報を個人情報が識別できる状態で管理すると、万が一情報が流出した際に個人情報も共に流出してしまい、問題となる。
従って、収集した情報の内、個人を特定し得る情報に関する部分を匿名化して管理する技術が用いられている。特許文献1は、文書匿名化装置、文書管理装置、文書匿名化方法及び文書匿名化プログラムに関する発明である。特許文献1は、利用環境に応じて文書中に含まれる固有名を匿名化する際の匿名化レベルを、動的に調整できるようにしたものである。
特許文献1に記載された発明によれば、匿名化レベル調整手段によってアクセス対象文書の文書ID集合および電子文書の利用環境の条件が入力され、また匿名化レベル調整手段によって、ユーザの属性、利用場所、及び閲覧やコピー等の利用方法の条件に従って、匿名化レベルが決定される。
そして、固有名匿名化手段によって匿名化レベル調整手段が決定した匿名化レベルに従って、固有名を匿名化する匿名表現が決定され、文書出力手段によって、固有名匿名化手段が決定した匿名表現で文書中の固有名を置き換えて、アクセス対象の電子文書が出力される。
特開2006−185311号公報
特許文献1に開示された発明によれば、文書中に含まれる個々の固有名詞に対する匿名化を行うことが出来る。しかし、企業や行政府等が収集する情報は、調査対象に対する複数の調査項目からなるレコードから構成されるものがあり、従来の匿名化方法によって個々の項目を匿名化しても、匿名化した情報を用いると、複数の調査項目によって対象を特定できる場合があり、調査項目全体として匿名化が出来ているとは限らないという問題があった。
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、個々の項目に対して匿名化を行った場合に、項目全体として匿名化が出来ているか否かを判定することで情報の匿名化が可能な、新規かつ改良された情報処理装置、コンピュータプログラムおよび記録媒体を提供することにある。
上記課題を解決するために、本発明のある観点によれば、匿名化区分を項目毎に記憶する匿名化項目記憶部と、第1のデータベースに記録されているデータに対し、項目毎に匿名化区分を指定して該匿名化区分でグループ化し、項目毎に該グループ化後の最小のデータ数を算出することにより匿名化処理を実行し、匿名化処理の結果を第2のデータベースに記録する匿名化処理部と、第2のデータベースに記録された匿名化処理の結果に対して、所定の閾値を下回る項目が存在しているか否かを判定する匿名化判定部と、を含む、情報処理装置が提供される。
匿名化処理部は、匿名化判定部で所定の閾値を下回る項目が存在していないと判定した場合に、第1のデータベースにおける隣接項目を結合して匿名化処理を再度実行して結果を第2のデータベースに記録し、匿名化判定部は、匿名化処理部が匿名化処理部を再度実行して第2のデータベースに記録された結果に対して再度判定を実行し、全ての項目が結合されるまで匿名化処理部の匿名化処理および匿名化判定部の判定処理を繰り返し、匿名化判定部は、全ての項目が結合された状態で匿名化処理が実行された時点で所定の閾値を下回る項目が存在していない場合に匿名化に成功したと判定してもよい。
匿名化処理部は、匿名化区分毎にグループ化した後の最小のデータ数をソートして、ソート後における中央の匿名化区分を指定して匿名化処理を実行してもよい。
匿名化処理部は、匿名化判定部で所定の閾値を下回る項目が存在すると判定されると、最小のデータ数が最も少ない項目における匿名化区分を変更して再度匿名化処理を実行してもよい。
また、上記課題を解決するために、本発明の別の観点によれば、コンピュータを、匿名化区分を項目毎に記憶する匿名化項目記憶部と、第1のデータベースに記録されているデータに対し、項目毎に匿名化区分を指定して該匿名化区分でグループ化し、項目毎に該グループ化後の最小のデータ数を算出することにより匿名化処理を実行し、匿名化処理の結果を第2のデータベースに記録する匿名化処理部と、第2のデータベースに記録された匿名化処理の結果に対して、所定の閾値を下回る項目が存在しているか否かを判定する匿名化判定部と、を含む情報処理装置として機能させるための、コンピュータプログラムが提供される。
また、上記課題を解決するために、本発明の別の観点によれば、コンピュータを、匿名化区分を項目毎に記憶する匿名化項目記憶部と、第1のデータベースに記録されているデータに対し、項目毎に匿名化項目を指定して該匿名化区分でグループ化し、項目毎に最小のデータを算出することにより匿名化処理を実行し、匿名化処理の結果を第2のデータベースに記録する匿名化処理部と、第2のデータベースに記録された匿名化処理の結果に対して、所定の閾値を下回る項目が存在しているか否かを判定する匿名化判定部と、を含む情報処理装置として機能させるための、コンピュータプログラムが記録された記録媒体が提供される。
以上説明したように本発明によれば、個々の項目に対して匿名化を行った場合に、項目全体として匿名化が出来ているか否かを判定することで情報の匿名化が可能な、新規かつ改良された情報処理装置、コンピュータプログラムおよび記録媒体を提供することができる。
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
まず、本発明の一実施形態にかかる情報匿名化装置の構成について説明する。図1は、本発明の一実施形態にかかる情報匿名化装置100の構成について説明する説明図である、以下、図1を用いて本発明の一実施形態にかかる情報匿名化装置100の構成について説明する。
図1に示した情報匿名化装置100は、本発明の情報処理装置の一例であり、複数の項目からなる情報に対して匿名化処理を施すものである。なお、本実施形態にかかる匿名化処理の詳細については、後に詳述する。
図1に示したように、本発明の一実施形態にかかる情報匿名化装置100は、匿名化処理部110と、匿名化判定部120と、匿名化項目記憶部130と、匿名化閾値情報記憶部140と、を含んで構成される。
匿名化処理部110は、調査票データベース20に格納されている収集された情報(以下、収集された情報のことを「調査票データ」とも称する)を取得し、取得した調査票データに対して匿名化処理を実行し、匿名化処理の結果を匿名化情報データベース30に格納するものである。本実施形態においては、匿名化処理部110における匿名化処理は、匿名化処理端末10からの指示によって開始される。
匿名化判定部120は、匿名化処理部110が匿名化情報データベース30に格納した匿名化処理の結果を取得し、匿名化処理部110が匿名化情報データベース30に格納した情報が匿名化出来ているか否かを判定する匿名化判定処理を実行するものである。
匿名化項目記憶部130および匿名化閾値情報記憶部140は、匿名化処理部110における匿名化処理に際して必要となる情報が格納されているものである。匿名化項目記憶部130および匿名化閾値情報記憶部140に記憶される情報については、後の匿名化処理の説明において詳述する。
以上、図1を用いて本発明の一実施形態にかかる情報匿名化装置100の構成について説明した。次に、本発明の一実施形態にかかる情報匿名化装置100で実行する匿名化処理について詳細に説明する。
図2は、本発明の一実施形態にかかる情報匿名化装置100で実行する匿名化処理について説明する流れ図である。以下、図2を用いて本発明の一実施形態にかかる情報匿名化装置100で実行する匿名化処理について説明する。
調査票データベース20に格納されている調査票データは複数の項目からなるデータであり、各レコードは、それぞれの項目についてのデータが記録されている。表1は、調査票データベース20に格納されており、本発明の一実施形態にかかる情報匿名化装置100で匿名化する調査票データの一例を示す表である。なお、本実施形態においては、調査票データベース20に格納されている調査票データのレコード数nをn=1000000とする。
Figure 2010086179
ここで、調査票データベース20に格納されている調査票データにおいて、あるレコードと同一のデータを有するレコードが他に存在していない場合には、そのレコードは一意に特定できてしまうため、その調査票データは匿名化できていないと判断するものとする。例えば、上記の表1において、「レコード1」のデータと同一のデータを有するレコードが他に存在していない場合には、「レコード1」のデータは一意に特定できてしまうので、表1に示した調査票データは匿名化できていないと判断される。
匿名化処理部110は、表1に示した調査票データに対して、各項目に対してグループ化の方法を選択し(ステップS102)、選択した方法でグループ化することで匿名化処理を実行する(ステップS104)。グループ化の方法は、各項目に対して任意に設定でき、また項目別のグループ化の方法は匿名化項目記憶部130に記憶されている。例えば、匿名化処理端末10のユーザが匿名化処理端末10から匿名化処理の開始を指示する際に、匿名化項目記憶部130に記憶されているグループ化の方法を、情報匿名化装置100から匿名化処理端末10に表示させ、ユーザは匿名化処理端末10に表示されたグループ化の方法から指定してもよい。表2は、匿名化項目記憶部130に記憶される項目別のグループ化の方法について示す表である。
Figure 2010086179
例えば、項目NOが1の「市町村」のデータに対して「原本通り」でグループ化すると、およそ1800個の区分にグループ化できるのに対し、「都道府県」でグループ化すると、47個の区分にグループ化することができる。また「区別無」を指定すると、全てのレコードを1つの区分としてグループ化する。
全ての項目で調査票データをグループ化すると、匿名化処理部110は各項目における区分数およびグループ化後における0を除いた最小レコード数を匿名化情報データベース30に格納する。表3は、匿名化処理部110によって匿名化情報データベース30に格納される情報の一例について示す表である。表3では、「市町村」に対して「都道府県」で、「生年月日」に対して「5年間隔」で、「性別」に対して「原本通り」で、「国籍」に対して「日本・外国」で、「居住期間」に対して「10年単位」で、「教育」に対して「原本通り」で、「職種」に対して「区別無」で、「従業地」に対して「都道府県」で、それぞれグループ化した際における、0を除いた最小レコード数の一例を示している。
Figure 2010086179
表3では、「市町村」に対して「都道府県」でグループ化した結果、区分数、すなわち0件ではない都道府県の数が40、最も少ないレコード数、すなわち、0件ではない都道府県の中で最小となった都道府県のレコード数が10000件であることを示している。なお、「職種」に対して「区別無」でグループ化すると、1つのグループでグループ化することになるので、最も少ないレコード数となった区分のレコード数は1000000件となる。
そして、このようにグループ化して得られるデータに対して、匿名化判定部120において、各項目における最小データ数と、匿名化閾値情報記憶部140に記憶した閾値とを比較することで匿名化判定処理を実行する(ステップS106)。そして、各項目におけるグループ化後の最小データ数と、匿名化閾値情報記憶部140に記憶した閾値とを比較した結果、グループ化後の最小データ数が閾値を下回っている項目が存在するかどうかを匿名化判定部120で判定する(ステップS108)。
上記ステップS108における匿名化判定部120で判定の結果、各項目における最小データ数で閾値を下回っているものが存在する場合には、上記ステップS102で指定したグループ化の方法では匿名化に失敗したものと判断する。匿名化に失敗すると、失敗した旨のメッセージを匿名化処理端末10の画面に表示させる(ステップS110)。一方、上記ステップS108における匿名化判定部120で判定の結果、各項目における最小データ数が閾値以上である場合には、指定したグループ化の方法による匿名化は成功したと判断する。
例えば、匿名化閾値情報記憶部140に記憶した閾値を3とすると、この閾値を下回る最小データ数を有する項目が存在しているかどうかを匿名化判定部120で判断する。表3に示した例では、閾値を下回る最小データ数を有する項目は存在していないので、匿名化判定部120は匿名化が成功していると判断する。
匿名化が成功したと匿名化判定部120において判断されると、続いて、匿名化処理部110において、項目が全て結合(マージ)されているかどうかを判断し(ステップS112)、項目が全てマージされていないと判断されれば、調査票データベース20における隣接する項目をマージしてグループ化する(ステップS114)。そして、各項目における区分数およびグループ化後における0を除いた最小レコード数を匿名化情報データベース30に格納する。表4は、匿名化処理部110によってマージ後に匿名化情報データベース30に格納される情報の一例について示す表である。
Figure 2010086179
なお、表4では、項目1(都道府県)と項目2(生年月日)でグループ化した結果、区分数が40×20=800ではなく、それよりも少ない600となっている。これは、全ての都道府県と生年月日の組み合わせに対してレコードが存在しているとは限らないからである。
このようにグループ化して得られるデータに対して、再度、匿名化判定部120において、各項目における最小データ数と、匿名化閾値情報記憶部140に記憶した閾値とを比較する。比較した結果、各項目における最小データ数が閾値を下回っている場合には、マージ後の匿名化については失敗したものと判断する。一方、各項目における最小データ数が閾値以上である場合には、マージ後の匿名化についても成功したと判断する。
マージ後においても匿名化が成功したと匿名化判定部120において判断されると、項目のマージおよび匿名化処理を、全ての項目がマージされるまで繰り返す。表5および表6は、匿名化処理部110によってマージ後に匿名化情報データベース30に格納される情報の一例について示す表である。
Figure 2010086179
Figure 2010086179
全ての項目がマージされた状態で最小データ数が閾値以上である場合には、最初に指定したグループ化の方法によって匿名化が可能であるため、匿名化判定部120は、匿名化が成功した旨を匿名化処理端末10に通知する。なお、匿名化が成功した旨を匿名化処理端末10の画面に表示させてもよい。一方、途中において一度でも最小データ数が閾値を下回っている場合には、マージ後の匿名化については失敗したものと判断する。なお、匿名化判定部120は、匿名化が失敗した旨を匿名化処理端末10の画面に表示させてもよい。匿名化が失敗した旨を匿名化判定部120から匿名化処理端末10の画面させる際には、失敗した際のグループ化の方法および項目、並びに最小データ数の情報を表示させてもよい。
以上、図2を用いて本発明の一実施形態にかかる情報匿名化装置100で実行する匿名化処理について説明した。
このように、本発明の一実施形態にかかる情報匿名化装置100で実行する匿名化処理によれば、調査票データベース20に格納されているレコードの個々の項目に対して匿名化を行った場合に、各項目においてグループ化した場合の最小値と閾値との比較によって、項目全体として匿名化が出来ているか否かを判定することができる。また、各項目におけるグループ化処理、項目のマージ、および匿名化判定処理を繰り返して実行することで、どの時点で匿名化処理に失敗したかを把握することができる。また、マージの際には、調査票データベースにおける隣接項目をマージするので、存在しない区分の組み合わせを処理する必要が無く、効率的に匿名化処理を実行することができる。
(変形例)
次に、本発明の一実施形態の変形例について説明する。上述したように、本発明の一実施形態にかかる情報匿名化装置100で実行する匿名化処理では、最初にグループ化の方法を指定し、指定したグループ化の方法に基づいてグループ化を行っていた。本変形例では、グループ化の方法を自動的に選択し、選択したグループ化の方法によってグループ化および匿名化判定処理を繰り返すことで、調査票データベース20に格納されているレコードに対する匿名化処理を実行する。
図3は、本発明の一実施形態の変形例にかかる、情報匿名化装置100で実行する匿名化処理について説明する流れ図である。以下、図3を用いて本発明の一実施形態の変形例にかかる、情報匿名化装置100で実行する匿名化処理について説明する。
まず、匿名化処理部110において、調査票データベース20に格納されているレコードの各項目に対し、匿名化項目記憶部130に記憶されているグループ化の方法毎にデータ数の最小値を算出し、データ数の最小値の昇順でグループ化の方法をソートする(ステップS122)。匿名化処理部110によるグループ化の方法毎のデータ数の最小値の算出およびデータ数の最小値の昇順でのソートは、匿名化処理端末10からの明示的な指示によって開始されてもよく、情報匿名化装置100の内部にバッチファイルを記憶させ、所定の時間が到達した場合に当該バッチファイルを実行することによって開始されてもよい。
表7〜表10は、匿名化処理部110によってグループ化の方法毎にデータ数の最小値を算出し、データ数の最小値の昇順でグループ化の方法をソートした場合の一例を示す表である。
Figure 2010086179
Figure 2010086179
Figure 2010086179
Figure 2010086179
上記ステップS122において、匿名化処理部110によってグループ化の方法毎にデータ数の最小値を算出し、データ数の最小値の昇順でグループ化の方法をソートすると、次に、匿名化処理部110は、最小値順で中央に位置するグループ化方法を選択する(ステップS124)。なお、グループ化の方法の数が偶数であり、中央に位置するグループ化方法が存在しない場合には、匿名化処理部110は、中央以下で最もデータ数が大きいグループ化方法を選択する。表7〜表10に示した例においては、匿名化処理部110は、各項目に対して以下のようにグループ化方法を選択する。
「市町村」においては、中央に位置するグループ化方法が存在しないので、匿名化処理部110は、中央以下で最もデータ数が大きいグループ化方法である「都道府県」を選択する。「生年月日」においては、中央に位置するグループ化方法が存在しないので、匿名化処理部110は、中央以下で最もデータ数が大きいグループ化方法である「5年間隔」を選択する。
「性別」においては、中央に位置するグループ化方法が存在しないので、匿名化処理部110は、中央以下で最もデータ数が大きいグループ化方法である「原本通り」を選択する。「国籍」においては、匿名化処理部110は、中央に位置するグループ化方法である「日本・外国」を選択する。
「居住期間」においては、匿名化処理部110は、中央に位置するグループ化方法である「10年単位」を選択する。「教育」においては、中央に位置するグループ化方法が存在しないので、匿名化処理部110は、中央以下で最もデータ数が大きいグループ化方法である「原本通り」を選択する。
「職種」においては、匿名化処理部110は、中央に位置するグループ化方法である「産業分類」を選択する。「従業地」においては、中央に位置するグループ化方法が存在しないので、匿名化処理部110は、中央以下で最もデータ数が大きいグループ化方法である「都道府県」を選択する。
上記ステップS124において、最小値順で中央に位置するグループ化方法を匿名化処理部110が選択すると、続いて、匿名化判定部120は、上記ステップS124で選択したグループ化方法に対する匿名化判定処理を実行し(ステップS126)、匿名化に成功したか否か判定する(ステップS128)。このステップS126における匿名化判定処理は、上述のように、各項目における最小データ数と、匿名化閾値情報記憶部140に記憶した閾値とを比較することによって行う。
上記ステップS128における判定の結果、上記ステップS124において匿名化処理部110が選択したグループ化方法の組み合わせによる匿名化が成功したと判断した場合には、匿名化判定部120は、全ての項目において最小のデータ数で匿名化に成功したかどうかを判定する(ステップS130)。
上記ステップS130における判定の結果、最小のデータ数での匿名化に成功していないと匿名化判定部120で判定した場合には、より閾値に近いグループ化方法の組み合わせを選択するために、匿名化処理部110は、上記ステップS124において選択したグループ化方法を上限として、さらに中央に位置するグループ化方法を選択する(ステップS132)。そして、ステップS126に戻って、匿名化判定部120による匿名化判定処理を再度実行する。
例えば、「市町村」においてグループ化方法として「都道府県」が選択されている状態では、匿名化処理部110は、この「都道府県」を上限として中央に位置するグループ化方法を選択する。この場合においては、中央に位置するグループ化方法が存在しないので、匿名化処理部110は、中央以下で最もデータ数が大きいグループ化方法である「原本通り」を選択する。「市町村」以外の項目についても同様に、匿名化処理部110は新たにグループ化方法を選択する。
そして、匿名化処理部110によるグループ化方法の選択と、匿名化判定部120による匿名化判定処理を繰り返す。そして、上記ステップS128における判定の結果、一度でも匿名化に失敗したと匿名化判定部120が判定すると、匿名化処理部110は、選択したグループ化方法のうち、最小データ数が最小の項目についてグループ化方法を変更する(ステップS134)。本変形例では、匿名化処理部110は、変更の直前に選択されているグループ化方法のうち最小データ数が最小の項目について、最小データ数の大きい方へグループ化方法を1つシフトする。
例えば、項目「国籍」においてグループ化方法「原本通り」が選択されており、匿名化閾値情報記憶部140に記憶されている閾値が20である場合には、項目「国籍」におけるグループ化方法「原本通り」の最小データ数は10であるので、上記ステップS128における匿名化判定処理では匿名化に失敗したと判定される。かかる場合において、匿名化処理部110は、項目「国籍」におけるグループ化方法を、「原本通り」から「日本・外国」に変更する。
なお、変更の直前に選択されているグループ化方法のうち最小データ数が最小の項目が複数存在する場合には、匿名化処理部110は、全ての項目に対して最小データ数の大きい方にグループ化方法を1つシフトしてもよい。
上記ステップS134において匿名化処理部110がグループ化方法を変更すると、匿名化判定部120は、変更したグループ化方法で匿名化判定処理を実施し(ステップS136)、匿名化に成功したか否か判定する(ステップS138)。
上記ステップS138において匿名化に成功したと匿名化判定部120で判定した場合、または上記ステップS130における判定の結果、最小のデータ数での匿名化に成功してしたと匿名化判定部120で判定した場合には、匿名化処理部110が選択したグループ化方法を、匿名化できた組み合わせとして匿名化処理端末10に表示させる(ステップS140)。
一方、上記ステップS138において匿名化に失敗したと匿名化判定部120で判定した場合には、上記ステップS134に戻り、最小データ数が最小の項目についてグループ化方法を再度変更し、匿名化判定部120で、変更したグループ化方法による匿名化判定処理を実施し(ステップS136)、匿名化に成功したか否か判定する(ステップS138)。
以上、図3を用いて本発明の一実施形態の変形例にかかる、情報匿名化装置100で実行する匿名化処理について説明した。
以上説明したように、本発明の一実施形態の変形例によれば、匿名化閾値情報記憶部140に閾値を記憶させて閾値を指定することによって、調査票データベース20に格納されているデータの匿名化が行えるグループ化方法の組み合わせを自動的に選択することができる。これにより、調査票データベース20に格納されているデータの匿名化が行えるグループ化方法の組み合わせを選択する時間を短縮することが可能となる。
なお、上述した匿名化処理については、情報匿名化装置100の内部(例えばHDD(Hard Disk Drive)や各種メモリ)に、またはCD−ROM、DVD−ROMその他の持ち運び可能な記録媒体にコンピュータプログラムを記録し、当該コンピュータプログラムを、情報匿名化装置100の内部に格納されたCPU(Central Processing Unit)その他の制御装置が順次読み出して実行することによって行われるようにしてもよい。
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
本発明は、情報処理装置、コンピュータプログラムおよび記録媒体に適用可能であり、特に情報の匿名化処理を実行する情報処理装置、コンピュータプログラムおよび記録媒体に適用可能である。
本発明の一実施形態にかかる情報匿名化装置100の構成について示す説明図である。 本発明の一実施形態にかかる情報匿名化装置100で実行する匿名化処理について説明する流れ図である。 本発明の一実施形態の変形例にかかる、情報匿名化装置100で実行する匿名化処理について説明する流れ図である。
符号の説明
10 匿名化処理端末
20 調査票データベース
30 匿名化情報データベース
100 情報匿名化装置
110 匿名化処理部
120 匿名化判定部
130 匿名化項目記憶部
140 匿名化閾値情報記憶部

Claims (6)

  1. 匿名化区分を項目毎に記憶する匿名化項目記憶部と、
    第1のデータベースに記録されているデータに対し、前記項目毎に前記匿名化区分を指定して該匿名化区分でグループ化し、前記項目毎に該グループ化後の最小のデータ数を算出することにより匿名化処理を実行し、前記匿名化処理の結果を第2のデータベースに記録する匿名化処理部と、
    前記第2のデータベースに記録された前記匿名化処理の結果に対して、所定の閾値を下回る項目が存在しているか否かを判定する匿名化判定部と、
    を含む、情報処理装置。
  2. 前記匿名化処理部は、前記匿名化判定部で前記所定の閾値を下回る項目が存在していないと判定した場合に、第1のデータベースにおける隣接項目を結合して前記匿名化処理を再度実行して結果を前記第2のデータベースに記録し、
    前記匿名化判定部は、前記匿名化処理部が前記匿名化処理部を再度実行して前記第2のデータベースに記録された結果に対して再度判定を実行し、
    全ての項目が結合されるまで前記匿名化処理部の前記匿名化処理および前記匿名化判定部の判定処理を繰り返し、前記匿名化判定部は、全ての項目が結合された状態で前記匿名化処理が実行された時点で所定の閾値を下回る項目が存在していない場合に匿名化に成功したと判定する、請求項1に記載の情報処理装置。
  3. 前記匿名化処理部は、前記匿名化区分毎にグループ化した後の最小のデータ数をソートして、ソート後における中央の匿名化区分を指定して前記匿名化処理を実行する、請求項1に記載の情報処理装置。
  4. 前記匿名化処理部は、前記匿名化判定部で所定の閾値を下回る項目が存在すると判定されると、最小のデータ数が最も少ない項目における匿名化区分を変更して再度前記匿名化処理を実行する、請求項3に記載の情報処理装置。
  5. コンピュータを、
    匿名化区分を項目毎に記憶する匿名化項目記憶部と、
    第1のデータベースに記録されているデータに対し、前記項目毎に前記匿名化区分を指定して該匿名化区分でグループ化し、前記項目毎に該グループ化後の最小のデータ数を算出することにより匿名化処理を実行し、前記匿名化処理の結果を第2のデータベースに記録する匿名化処理部と、
    前記第2のデータベースに記録された前記匿名化処理の結果に対して、所定の閾値を下回る項目が存在しているか否かを判定する匿名化判定部と、
    を含む情報処理装置として機能させるための、コンピュータプログラム。
  6. コンピュータを、
    匿名化区分を項目毎に記憶する匿名化項目記憶部と、
    第1のデータベースに記録されているデータに対し、前記項目毎に前記匿名化項目を指定して該匿名化区分でグループ化し、前記項目毎に最小のデータを算出することにより匿名化処理を実行し、前記匿名化処理の結果を第2のデータベースに記録する匿名化処理部と、
    前記第2のデータベースに記録された前記匿名化処理の結果に対して、所定の閾値を下回る項目が存在しているか否かを判定する匿名化判定部と、
    を含む情報処理装置として機能させるための、コンピュータプログラムが記録された記録媒体。
JP2008252890A 2008-09-30 2008-09-30 情報処理装置、コンピュータプログラムおよび記録媒体 Withdrawn JP2010086179A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008252890A JP2010086179A (ja) 2008-09-30 2008-09-30 情報処理装置、コンピュータプログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008252890A JP2010086179A (ja) 2008-09-30 2008-09-30 情報処理装置、コンピュータプログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2010086179A true JP2010086179A (ja) 2010-04-15

Family

ID=42250096

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008252890A Withdrawn JP2010086179A (ja) 2008-09-30 2008-09-30 情報処理装置、コンピュータプログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP2010086179A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010182053A (ja) * 2009-02-05 2010-08-19 Giken Shoji International Co Ltd 秘匿集計システム
JP2012003440A (ja) * 2010-06-16 2012-01-05 Kddi Corp 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
WO2012067213A1 (ja) * 2010-11-16 2012-05-24 日本電気株式会社 情報処理システム及び匿名化方法
JP2012159982A (ja) * 2011-01-31 2012-08-23 Kddi Corp 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
JP2013080525A (ja) * 2013-02-07 2013-05-02 Giken Shoji International Co Ltd 秘匿集計システムにおける処理プログラム
WO2013121739A1 (ja) * 2012-02-17 2013-08-22 日本電気株式会社 匿名化装置及び匿名化方法
JP2016054002A (ja) * 2016-01-06 2016-04-14 国際航業株式会社 個別基礎情報秘匿化プログラム、及び個別基礎情報秘匿化装置
JP2017041212A (ja) * 2015-08-21 2017-02-23 ニフティ株式会社 匿名処理装置及び匿名処理方法
US10360405B2 (en) 2014-12-05 2019-07-23 Kabushiki Kaisha Toshiba Anonymization apparatus, and program
JP2019523958A (ja) * 2016-06-09 2019-08-29 グリズリー・カンパニー・リミテッド ビッグデータの非識別化処理方法
JP2021507360A (ja) * 2017-12-15 2021-02-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation データを非特定化する方法、データを非特定化するためのシステム、および非データを特定化するためのコンピュータ・プログラム

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010182053A (ja) * 2009-02-05 2010-08-19 Giken Shoji International Co Ltd 秘匿集計システム
JP2012003440A (ja) * 2010-06-16 2012-01-05 Kddi Corp 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
JP5979004B2 (ja) * 2010-11-16 2016-08-24 日本電気株式会社 情報処理システム及び匿名化方法
US8918894B2 (en) 2010-11-16 2014-12-23 Nec Corporation Information processing system, anonymization method, information processing device, and its control method and control program
WO2012067213A1 (ja) * 2010-11-16 2012-05-24 日本電気株式会社 情報処理システム及び匿名化方法
JP2012159982A (ja) * 2011-01-31 2012-08-23 Kddi Corp 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
WO2013121739A1 (ja) * 2012-02-17 2013-08-22 日本電気株式会社 匿名化装置及び匿名化方法
JPWO2013121739A1 (ja) * 2012-02-17 2015-05-11 日本電気株式会社 匿名化装置及び匿名化方法
JP2013080525A (ja) * 2013-02-07 2013-05-02 Giken Shoji International Co Ltd 秘匿集計システムにおける処理プログラム
US10360405B2 (en) 2014-12-05 2019-07-23 Kabushiki Kaisha Toshiba Anonymization apparatus, and program
JP2017041212A (ja) * 2015-08-21 2017-02-23 ニフティ株式会社 匿名処理装置及び匿名処理方法
JP2016054002A (ja) * 2016-01-06 2016-04-14 国際航業株式会社 個別基礎情報秘匿化プログラム、及び個別基礎情報秘匿化装置
JP2019523958A (ja) * 2016-06-09 2019-08-29 グリズリー・カンパニー・リミテッド ビッグデータの非識別化処理方法
JP2021507360A (ja) * 2017-12-15 2021-02-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation データを非特定化する方法、データを非特定化するためのシステム、および非データを特定化するためのコンピュータ・プログラム
JP7106643B2 (ja) 2017-12-15 2022-07-26 インターナショナル・ビジネス・マシーンズ・コーポレーション データを非特定化する方法、データを非特定化するためのシステム、および非データを特定化するためのコンピュータ・プログラム

Similar Documents

Publication Publication Date Title
JP2010086179A (ja) 情報処理装置、コンピュータプログラムおよび記録媒体
US20210049503A1 (en) Meaningfully explaining black-box machine learning models
US20200356901A1 (en) Target variable distribution-based acceptance of machine learning test data sets
US7353227B2 (en) Conflict resolution engine
TWI427493B (zh) 電腦應用中增強說明資源選擇之裝置、系統、電腦程式產品及方法
JP5015789B2 (ja) 関連コンテンツの抽出における位置類似性閾値の適応化
JP4964500B2 (ja) ソートしたコンテキスト内のリンク情報を表示するシステム及び方法
JP2011516989A (ja) 編集距離および文書情報を使用する検索結果順位付け
JP2015532474A (ja) 情報をプッシュする方法及び装置
KR20150080533A (ko) 데이터 저장 시스템에서 데이터 소스 특성화
CA2861898C (en) Download resource recommendation method, system and storage medium
JP6528669B2 (ja) 予兆検知プログラム、装置、及び方法
US7996418B2 (en) Suggesting long-tail tags
US9195730B2 (en) Verifying correctness of a database system via extended access paths
US9760842B2 (en) Operation target management apparatus and non-transitory computer readable medium
US20220253448A1 (en) Database search enhancement and interactive user interface therefor
CN115952162A (zh) 一种数据质量校验方法、装置和设备
JPWO2014006851A1 (ja) 匿名化装置、匿名化システム、匿名化方法、及び、匿名化プログラム
JP2013149061A (ja) 文書類似性評価システム、文書類似性評価方法およびコンピュータ・プログラム
CN104199924B (zh) 选择具有快照关系的网络表格的方法及装置
US20090063464A1 (en) System and method for visualizing and relevance tuning search engine ranking functions
JP2013077124A (ja) ソフトウェアテストケース生成装置
US11871049B2 (en) Method of identifying an abridged version of a video
JP5310196B2 (ja) 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法
US11526349B1 (en) Asset management tracking through source code

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20111206