JP2021060926A - 決定方法、情報処理装置、及び決定プログラム - Google Patents

決定方法、情報処理装置、及び決定プログラム Download PDF

Info

Publication number
JP2021060926A
JP2021060926A JP2019186158A JP2019186158A JP2021060926A JP 2021060926 A JP2021060926 A JP 2021060926A JP 2019186158 A JP2019186158 A JP 2019186158A JP 2019186158 A JP2019186158 A JP 2019186158A JP 2021060926 A JP2021060926 A JP 2021060926A
Authority
JP
Japan
Prior art keywords
item
personal information
items
value
deletion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019186158A
Other languages
English (en)
Other versions
JP7298431B2 (ja
Inventor
尊 福岡
Takeru Fukuoka
尊 福岡
裕司 山岡
Yuji Yamaoka
裕司 山岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019186158A priority Critical patent/JP7298431B2/ja
Publication of JP2021060926A publication Critical patent/JP2021060926A/ja
Application granted granted Critical
Publication of JP7298431B2 publication Critical patent/JP7298431B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】個人情報が有する複数の項目から削除項目の組み合わせを決定するための計算負荷を軽減する。【解決手段】コンピュータは、複数の項目をそれぞれ有する複数の個人情報を受け付け、複数の個人情報それぞれについて、項目値が存在する項目の一部を削除した場合に残される項目に対する評価値に基づき、削除候補の項目を特定する。次に、コンピュータは、複数の項目それぞれについて、項目が削除候補として特定された個人情報の個数を求め、複数の項目それぞれについて求められた個人情報の個数に基づき、削除候補の項目の中から削除項目を決定する。【選択図】図5

Description

本発明は、決定方法、情報処理装置、及び決定プログラムに関する。
Society 5.0及びDFFT(Data Free Flow with Trust)が示すように、データ流通は国家的に重要なテーマとなっている。現在、パーソナルデータ流通のための情報銀行の実現に向けて、官民で作業が進められている。
情報銀行システムでは、認定機関が、認定基準を満たす事業者を情報銀行として認定する。個人は、自己の権限においてパーソナルデータを情報銀行に預託し、情報銀行は、預託されたパーソナルデータを、個人の同意の下で情報銀行の利用者である企業等に提供する。そして、情報銀行の利用者は、パーソナルデータの利用に対する報酬として、個人にポイント等の便益を還元する。
パーソナルデータのリスクを算定するモデルとして、日本ネットワークセキュリティ協会(Japan Network Security Association,JNSA)によって策定されたJO(JNSA Damage Operation)モデルが知られている。パーソナルデータのリスクは、パーソナルデータ漏洩時の予想損害賠償額を表す。認定機関の認定基準では、利用者からパーソナルデータが漏洩した場合の責任も、情報銀行が負うことになっている。
また、パーソナルデータの価値を算定するモデルとして、日本情報経済社会推進協会によって策定されたJIPDEC(Japan Information Processing and Development Center)モデルが知られている。パーソナルデータの価値は、パーソナルデータの仮想的な市場価値を表す。
情報銀行に関連して、匿名化技術に対する特許出願技術動向調査の結果が報告されている(例えば、非特許文献1を参照)。
"AIや非構造化データへの対応技術、ビッグデータ時代のプライバシー保護"、[online]、日経XTECH、[令和1年9月17日検索]、インターネット<URL:https://tech.nikkeibp.co.jp/atcl/nxt/column/18/00053/00014/>
情報銀行は、利用者に提供するパーソナルデータのリスク及び価値の金額を算定し、パーソナルデータから高リスク低価値な部分を除外することで、想定利益を最大化することができる。パーソナルデータは、個人情報と呼ばれることもある。
情報銀行が扱う個人情報が複数の項目を有する場合、1つ以上の項目を削除することで、個人情報の価値の金額と個人情報のリスクの金額との差額を増加させることが可能である。しかしながら、項目の個数が増加すると、最適な削除項目の組み合わせを決定するための計算負荷が大きくなる。
なお、かかる問題は、JOモデル及びJIPDECモデルを用いて個人情報のリスク及び価値を評価する場合に限らず、様々な評価方法により個人情報を評価する場合において生ずるものである。
1つの側面において、本発明は、個人情報が有する複数の項目から削除項目の組み合わせを決定するための計算負荷を軽減することを目的とする。
1つの案では、コンピュータは以下の処理を実行する。
(1)コンピュータは、複数の項目をそれぞれ有する複数の個人情報を受け付ける。
(2)コンピュータは、複数の個人情報それぞれについて、項目値が存在する項目の一部を削除した場合に残される項目に対する評価値に基づき、削除候補の項目を特定する。
(3)コンピュータは、複数の項目それぞれについて、項目が削除候補として特定された個人情報の個数を求める。
(4)コンピュータは、複数の項目それぞれについて求められた個人情報の個数に基づき、削除候補の項目の中から削除項目を決定する。
1つの側面によれば、個人情報が有する複数の項目から削除項目の組み合わせを決定するための計算負荷を軽減することができる。
個人情報テーブルを示す図である。 二値化個人情報テーブルを示す図である。 局所探索法による探索処理を示す図である。 情報処理装置の機能的構成図である。 個人情報制御処理のフローチャートである。 情報処理装置の具体例を示す機能的構成図である。 5人の人物の二値化個人情報テーブルを示す図である。 パラメータ情報を示す図である。 x=(1,1,3,3)の場合に条件を満たす列の範囲を示す図である。 x=(1,3,3,3)の場合に条件を満たす列の範囲を示す図である。 削除候補セル情報を示す図である。 指標を示す図である。 実験結果を示す図である。 個人情報制御処理の具体例を示すフローチャートである。 削除候補特定処理のフローチャート(その1)である。 削除候補特定処理のフローチャート(その2)である。 削除項目決定処理のフローチャートである。 情報処理装置のハードウェア構成図である。
以下、図面を参照しながら、実施形態を詳細に説明する。
JOモデルでは、個人情報が有する属性の経済的損失レベルE及び精神的苦痛レベルPに対する機微情報度Fが、次式により計算される。
F=5^(maxE−1)+10^(maxP−1) (1)
maxEは、個人情報が有する複数の属性それぞれの経済的損失レベルEの最大値を表し、maxPは、複数の属性それぞれの精神的苦痛レベルPの最大値を表す。個人情報のリスクは、機微情報度Fに所定の定数を乗算することで算定される。
JIPDECモデルでは、個人情報が有する属性の有用性レベルU及び受容性レベルRに対する情報価値度Gが、次式により計算される。
G=6^(maxU−1)+8^(maxR−1) (2)
maxUは、個人情報が有する複数の属性それぞれの有用性レベルUの最大値を表し、maxRは、複数の属性それぞれの受容性レベルRの最大値を表す。個人情報の価値は、情報価値度Gに所定の定数を乗算することで算定される。
図1は、個人情報テーブルの例を示している。図1の個人情報テーブルの行は、3人の人物の個人IDに対応し、列は、位置情報、購買情報、生体情報、及び診療情報の項目に対応する。各個人IDは、各人物の個人情報を識別する識別情報であり、各項目は、個人情報が有する属性に対応する。個人情報101〜個人情報103は、3人の人物の個人情報を表す。
個人情報テーブルの各行及び各列に対応するセルには、項目値又は“Null”が記述されている。例えば、個人情報101の個人IDは“a”であり、位置情報は“新宿 13:13”であり、購買情報は“飲料水”であり、生体情報は“体温 36.5”であり、診療情報は“Null”である。このうち、“新宿 13:13”、“飲料水”、及び“体温 36.5”は、個人情報101に存在する項目値に対応し、“Null”は、項目値が欠損していて存在しないことを示す。
JOモデルでは、各個人の個人情報において、項目値が存在する項目の経済的損失レベルE及び精神的苦痛レベルPに基づき、式(1)により機微情報度Fを計算することで、その個人情報のリスクが算定される。また、JIPDECモデルでは、各個人の個人情報において、項目値が存在する項目の有用性レベルU及び受容性レベルRに基づき、式(2)により情報価値度Gを計算することで、その個人情報の価値が算定される。
したがって、個人情報のリスク及び価値の算定においては、各項目の項目値の有無のみが重要となる。そこで、図1の個人情報テーブルに存在する項目値を論理値“1”に置き換え、“Null”を論理値“0”に置き換えることで、二値化個人情報テーブルを生成することができる。
図2は、図1の個人情報テーブルを二値化することで生成された、二値化個人情報テーブルの例を示している。図2の二値化個人情報テーブルでは、図1の個人情報101〜個人情報103が二値化個人情報201〜二値化個人情報203にそれぞれ置き換えられている。
(E,P)は、各項目の経済的損失レベルE及び精神的苦痛レベルPの値を表し、(U,R)は、各項目の有用性レベルU及び受容性レベルRの値を表す。経済的損失レベルE、精神的苦痛レベルP、有用性レベルU、及び受容性レベルRは、各項目に対して設定されたパラメータの一例である。
例えば、位置情報については、(E,P)=(1,1)であり、(U,R)=(1,1)である。購買情報については、(E,P)=(2,1)であり、(U,R)=(3,2)である。生体情報については、(E,P)=(1,2)であり、(U,R)=(3,3)である。診療情報については、(E,P)=(1,3)であり、(U,R)=(3,3)である。
まず、JOモデルを用いて、二値化個人情報201〜二値化個人情報203に対するリスクを算定してみる。二値化個人情報201において、診療情報の値は論理値“0”であり、項目値が存在しないことを示しているため、位置情報、購買情報、及び生体情報のパラメータのみに基づいて、機微情報度Fが計算される。
この場合、位置情報、購買情報、及び生体情報の経済的損失レベルEの最大値は“2”であり、精神的苦痛レベルPの最大値も“2”である。したがって、機微情報度Fは、次式のように計算される。
F=5^(2−1)+10^(2−1)
=5+10
=15 (3)
簡単のため、機微情報度Fに乗算される定数を1とすると、二値化個人情報201に対するリスクは15円となる。同様にして、二値化個人情報202に対するリスクは11円となり、二値化個人情報203に対するリスクは101円となる。したがって、二値化個人情報201〜二値化個人情報203に対する合計リスクは127円となる。
次に、JIPDECモデルを用いて、二値化個人情報201〜二値化個人情報203に対する価値を算定してみる。二値化個人情報201において、診療情報の値は“0”であり、項目値が存在しないことを示しているため、位置情報、購買情報、及び生体情報のパラメータのみに基づいて、情報価値度Gが計算される。
この場合、位置情報、購買情報、及び生体情報の有用性レベルUの最大値は“3”であり、受容性レベルRの最大値も“3”である。したがって、情報価値度Gは、次式のように計算される。
G=6^(3−1)+8^(3−1)
=36+64
=100 (4)
簡単のため、情報価値度Gに乗算される定数を1とすると、二値化個人情報201に対する価値は100円となる。同様にして、二値化個人情報202に対する価値及び二値化個人情報203に対する価値も100円となる。したがって、二値化個人情報201〜二値化個人情報203に対する合計価値は300円となる。
このように、各二値化個人情報に対するリスク及び価値は、項目値が存在する項目のパラメータの最大値に依存するため、二値化個人情報テーブルのいずれかの列を削除すると、リスク及び価値の算定値が変化する。
そこで、個人情報から高リスク低価値な部分を除外して想定利益を最大化するために、想定利益を示す評価値を導入する。例えば、図2の各二値化個人情報に対する評価値として、二値化個人情報に対する価値から二値化個人情報に対するリスクを減算して得られる差分を用いることができる。この場合、二値化個人情報201〜二値化個人情報203に対する合計評価値は、合計価値から合計リスクを減算することで求められる。
例えば、いずれの列も削除しない場合、合計価値は300円となり、合計リスクは127円となる。したがって、合計評価値は、300円−127円=173円となる。一方、二値化個人情報テーブルから購買情報の列を削除した場合、合計価値は300円となり、合計リスクは123円となる。したがって、合計評価値は、300円−123円=177円となる。また、二値化個人情報テーブルから購買情報及び診療情報の2列を削除した場合、合計価値は300円となり、合計リスクは33円となる。したがって、合計評価値は、300円−33円=267円となる。
このように、二値化個人情報テーブルからより多くの列を削除することで、合計評価値が増加することもある。個人情報テーブルから高リスク低価値な部分を除外することで、想定利益を最大化するためには、合計評価値が最大になるような削除項目の組み合わせを求めればよい。
このような削除項目の組み合わせを求める単純な方法として、全探索法が挙げられる。全探索法では、削除項目の組み合わせすべてについて合計評価値を計算し、合計評価値が最大になるような削除項目の組み合わせが求められる。
しかしながら、全探索法では、削除項目の組み合わせすべてに対して、個人情報毎に価値及びリスクの計算が繰り返されるため、個人情報テーブルの規模が大きくなると、計算量が増大する。具体的には、n行m列の個人情報テーブルの場合、削除項目の組み合わせの総数は2個であり、計算量のオーダはO(nm2)となる。
所定のCPU(Central Processing Unit)、OS(Operating System)、メモリ、及び実装言語を用いた実験によれば、n=1000及びm=30の場合、1つの組み合わせに対する合計評価値を計算するのに、約0.01秒かかることが分かっている。したがって、230個の組み合わせに対して合計評価値を計算するには、最低でも約4か月かかることになる。実際には、合計評価値の最大値を求める処理と、合計評価値の最大値に対応する項目の組み合わせを抽出する処理も追加されるため、処理時間はさらに増加する。
そこで、削除項目の組み合わせを高速に決定するために、メタヒューリスティクスの1つである局所探索法を適用することが考えられる。局所探索法では、削除項目をランダムに指定した後、1つの項目を削除する操作又は1つの項目を復活させる操作のいずれかが行われ、合計評価値が最大となる削除項目の組み合わせが選択される。合計評価値が減少しない限り、このような操作が繰り返され、合計評価値が減少した場合又は操作回数が上限回数に到達した場合、処理を終了する。これにより、計算量を抑えながら、徐々に合計評価値を増加させていくことができる。
例えば、図2の二値化個人情報テーブルにおいて、最初に購買情報が削除項目として指定された場合、合計評価値は173円から177円に増加する。この場合、合計評価値は減少していないため、さらに削除項目が追加される。例えば、診療情報が削除項目として追加された場合、合計評価値は177円から267円に増加する。しかしながら、局所探索法では局所解が得られることが多く、必ずしも最適解が得られるとは限らない。
図3は、局所探索法による探索処理の例を示している。横軸は、削除項目の組み合わせの変化を表し、縦軸は、合計評価値を表す。折れ線301は、削除項目の組み合わせの変化に対する合計評価値の変化を表し、折れ線301上に最適解321及び局所解322が存在する。局所探索法では、矢印311及び矢印312が示すように、局所解322に対応する削除項目の組み合わせが得られる傾向にある。
図4は、実施形態の情報処理装置(コンピュータ)の機能的構成例を示している。図4の情報処理装置401は、記憶部411、特定部412、及び決定部413を含む。
図5は、図4の情報処理装置401が行う個人情報制御処理の例を示すフローチャートである。まず、情報処理装置401は、複数の項目をそれぞれ有する複数の個人情報を受け付けて、記憶部411に格納する(ステップ501)。記憶部411は、それらの個人情報を記憶する。
次に、特定部412は、複数の個人情報それぞれについて、項目値が存在する項目の一部を削除した場合に残される項目に対する評価値に基づき、削除候補の項目を特定する(ステップ502)。
次に、決定部413は、複数の項目それぞれについて、項目が削除候補として特定された個人情報の個数を求める(ステップ503)。そして、決定部413は、複数の項目それぞれについて求められた個人情報の個数に基づき、削除候補の項目の中から削除項目を決定する(ステップ504)。
図4の情報処理装置401によれば、個人情報が有する複数の項目から削除項目の組み合わせを決定するための計算負荷を軽減することができる。
上述したように、個人情報テーブルの合計評価値を最大化するために削除すべき列を計算するには、長い時間がかかるが、各個人情報の評価値を最大化するために削除すべきセルは、高速に計算することができる。その理由は、1人分の個人情報の評価値を最大化するには、残されるセルに対する価値及びリスクを計算して、削除候補のセルを優先度付けするだけで済むからである。
個人情報テーブルにおいて項目値が欠損しているセルが少ない場合、各個人情報の削除候補のセルを示す解は、個人情報テーブルの削除項目を示す解と類似する。例えば、項目値が欠損しているセルが存在しない場合、2つの解は一致する。そして、現実の個人情報においては、項目値が欠損していることが少ない。
そこで、個人情報の削除候補のセルを示す解と類似する削除項目の組み合わせを求めることで、個人情報テーブルの規模が大きい場合であっても、合計評価値を最大化する最適解に近い解を高速に求めることができる。この場合、以下のような手順により、削除項目の組み合わせが求められる。
(P1)情報処理装置は、個人情報テーブルの各行について、評価値を最大化する削除セルの組み合わせを求める。
(P2)情報処理装置は、個人情報テーブルの各列について、削除セルに指定されたセルの割合が大きい場合、その列の項目を削除項目に決定し、削除セルに指定されたセルの割合が小さい場合、その列の項目を削除項目から除外する。
(P3)情報処理装置は、(P2)の処理を行っていない列の本数が、時間的に全探索可能な本数になるまで、(P2)の処理を繰り返す。
(P4)(P2)の処理を行っていない列の本数が全探索可能な本数になった場合、情報処理装置は、残りの列に対して全探索法により削除項目の組み合わせを求める。
このような手順により、項目値があまり欠損していない個人情報テーブルに対して、評価値をできるだけ最大化するような削除項目の組み合わせを、高速に求めることができる。
図6は、図4の情報処理装置401の具体例を示している。図6の情報処理装置601は、記憶部611、入力部612、特定部613、決定部614、及び出力部615を含む。記憶部311、特定部613、及び決定部614は、図4の記憶部411、特定部412、及び決定部413にそれぞれ対応する。
入力部612は、複数の個人情報を受け付けて、記憶部611内の個人情報テーブル621に登録するとともに、個人情報テーブル621の各項目に対する複数のパラメータを受け付けて、記憶部611内のパラメータ情報623に登録する。これにより、個人情報テーブル621の各項目に対して、パラメータが設定される。
入力部612は、ユーザから入力される個人情報を受け付けてもよく、通信ネットワークを介して、外部の情報処理装置から個人情報を受信してもよい。例えば、各項目に対するパラメータとしては、精神的苦痛レベルP、経済的損失レベルE、受容性レベルR、及び有用性レベルUが用いられる。
特定部613は、個人情報テーブル621を二値化することで、二値化個人情報テーブル622を生成して、記憶部611に格納する。次に、特定部613は、二値化個人情報テーブル622に含まれる二値化個人情報毎に、各項目に対する複数のパラメータそれぞれの値の範囲に基づいて、複数の評価値を計算し、所定の評価値を実現する項目の組み合わせを特定する。
例えば、評価値としては、価値からリスクを減算して得られる差分を用いることができる。価値とリスクの差分を評価値として用いることで、二値化個人情報テーブル622の想定利益を最大化する削除項目の組み合わせを求めることが可能になる。
価値とリスクの差分を評価値として用いる場合、各二値化個人情報に対する評価値は、二値化個人情報に含まれる項目の精神的苦痛レベルP、経済的損失レベルE、受容性レベルR、及び有用性レベルUそれぞれの値の範囲によって決定される。したがって、これらのパラメータの値の範囲を変更することで、削除されるセルと残されるセルとを個別に指定しなくても、容易に複数の評価値を生成することができる。
そして、所定の評価値に対応する値の範囲を実現する項目の組み合わせを求めることで、所定の評価値を実現する項目の組み合わせを特定することができる。所定の評価値を実現する項目は、残されるセルの項目を表している。
次に、特定部613は、複数の項目の中から、特定された組み合わせに含まれる項目を除外することで、削除候補の項目を特定する。そして、特定部613は、二値化個人情報テーブル622のセルのうち、削除候補の項目に対応するセルを示す削除候補セル情報624を生成して、記憶部611に格納する。
決定部614は、二値化個人情報テーブル622の各項目について、その項目が削除候補として特定された個人情報の個数を求める。そして、決定部614は、求められた個人情報の個数に基づいて、削除候補の項目の中から削除項目を決定し、削除項目集合625を生成して、記憶部611に格納する。
出力部615は、削除項目集合625を出力する。出力部615は、削除項目集合625を画面上に表示してもよく、通信ネットワークを介して、外部の情報処理装置へ送信してもよい。
図7は、5人の人物の二値化個人情報テーブル622の例を示している。図7の二値化個人情報テーブル622は、5行6列のテーブルであり、ID1〜ID5は、5人の人物の個人IDにそれぞれ対応し、列1〜列6は、6個の項目にそれぞれ対応する。論理値“1”は、項目値が存在するセルを示しており、論理値“0”は、項目値が存在しないセルを示している。
図8は、図7の二値化個人情報テーブル622に対して設定されたパラメータ情報623の例を示している。図8(a)は、精神的苦痛レベルP及び経済的損失レベルEの例を示している。各列の項目の精神的苦痛レベルP及び経済的損失レベルEは、以下の通りである。
列1 P=3,E=3
列2 P=2,E=1
列3 P=1,E=3
列4 P=1,E=3
列5 P=2,E=2
列6 P=2,E=2
図8(b)は、受容性レベルR及び有用性レベルUの例を示している。各列の項目の受容性レベルR及び有用性レベルUは、以下の通りである。
列1 R=1,U=1
列2 R=2,U=2
列3 R=3,U=2
列4 R=1,U=3
列5 R=2,U=3
列6 R=1,U=3
特定部613は、例えば、以下のような手順により、削除候補セル情報624を生成する。
(P11)特定部613は、二値化個人情報テーブル622の各行の二値化個人情報について、項目値が存在するすべてのセルを選択する。そして、特定部613は、パラメータ情報623を参照して、選択されたセルの列に対応する項目の精神的苦痛レベルPの最大値p、経済的損失レベルEの最大値e、受容性レベルRの最大値r、及び有用性レベルUの最大値uを求める。
(P12)特定部613は、精神的苦痛レベルP、経済的損失レベルE、受容性レベルR、及び有用性レベルUそれぞれを要素とするパラメータベクトルx=(x1,x2,x3,x4)の集合Sを生成する。
S={(x1,x2,x3,x4)|
1≦x1≦p,1≦x2≦e,1≦x3≦r,1≦x4≦u} (11)
変数x1は、精神的苦痛レベルPを表す整数であり、変数x1の値の範囲は、1≦x1≦pである。変数x2は、経済的損失レベルEを表す整数であり、変数x2の値の範囲は、1≦x2≦eである。変数x3は、受容性レベルRを表す整数であり、変数x3の値の範囲は、1≦x3≦rである。変数x4は、有用性レベルUを表す整数であり、変数x4の値の範囲は、1≦x4≦uである。
(P13)特定部613は、集合Sに含まれる各パラメータベクトルxの評価値vを、次式により計算する。
v=(8^(x3−1)+6^(x4−1))
−(10^(x1−1)+5^(x2−1)) (12)
式(12)の右辺の(8^(x3−1)+6^(x4−1))は価値を表し、(10^(x1−1)+5^(x2−1))はリスクを表す。特定部613は、すべてのパラメータベクトルxを評価値vの降順にソートする。
(P14)特定部613は、最大の評価値vを有するパラメータベクトルxから順に、次の条件を満たす項目の集合を生成する。
(C1)項目値が存在するセルの列に対応する項目の精神的苦痛レベルPが、x1以下である。
(C2)項目値が存在するセルの列に対応する項目の経済的損失レベルEが、x2以下である。
(C3)項目値が存在するセルの列に対応する項目の受容性レベルRが、x3以下である。
(C4)項目値が存在するセルの列に対応する項目の有用性レベルUが、x4以下である。
(P15)特定部613は、(P14)で生成された集合に含まれる項目の精神的苦痛レベルPの最大値w1、経済的損失レベルEの最大値w2、受容性レベルRの最大値w3、及び有用性レベルUの最大値w4を求める。
(P16)パラメータベクトルxとベクトル(w1,w2,w3,w4)とが一致する場合、特定部613は、二値化個人情報の項目値が存在する項目に対するパラメータの最大値として、パラメータベクトルxが達成できると判定する。そして、特定部613は、(P14)で生成された集合に含まれる項目を、残すべき項目に決定する。一方、パラメータベクトルxとベクトル(w1,w2,w3,w4)とが一致しない場合、特定部613は、パラメータベクトルxが達成されないと判定し、次に大きな評価値vを有するパラメータベクトルxについて、(P14)の処理を繰り返す。
(P17)特定部613は、残すべき項目以外の項目を削除候補の項目に決定し、二値化個人情報の項目値が存在するセルのうち、削除候補の項目に対応するセルを、削除候補セルに決定する。そして、特定部613は、削除候補セルを示す削除候補セル情報624を生成する。
このような手順によれば、各二値化個人情報について、残されるセルの項目に対する評価値が最大になるように削除候補セルが決定される。したがって、その評価値よりも小さな評価値を実現する項目を求める必要がなくなり、評価値を最大化する削除候補セルを効率良く決定することができる。これにより、削除候補セル情報624を生成する処理の計算量のオーダはO(nm)となり、高々多項式時間で削除候補セル情報624を生成することができる。
例えば、図7のID1の二値化個人情報の場合、すべてのセルが論理値“1”を有するため、すべてのセルが選択される。そして、図8のパラメータ情報623を参照して、(p,e,r,u)=(3,3,3,3)に決定される。この場合、次のような集合Sが生成される。
S={(x1,x2,x3,x4)|
1≦x1≦3,1≦x2≦3,1≦x3≦3,1≦x4≦3} (13)
集合Sの各要素の評価値vを式(12)により計算し、それらの要素を評価値の降順にソートすると、次のようなソート結果が得られる。
(1,1,3,3),(1,2,3,3),(2,1,3,3),(2,2,3,3),
(1,3,3,3),...,(3,3,1,1)
まず、x=(1,1,3,3)の場合に、ID1の二値化個人情報に対するパラメータの最大値として、パラメータベクトルxが達成されるか否かが判定される。
図9は、図8のパラメータ情報623において、x=(1,1,3,3)の場合に上記(C1)〜(C4)の条件を満たす列の範囲を示している。図9(a)は、(C1)及び(C2)の条件を満たす列の範囲を示している。図9(a)の網掛領域901は、精神的苦痛レベルPが1以下であり、かつ、経済的損失レベルEが1以下である範囲を表す。
図9(b)は、(C3)及び(C4)の条件を満たす列の範囲を示している。図9(b)の網掛領域902は、受容性レベルRが3以下であり、かつ、有用性レベルUが3以下である範囲を表す。
網掛領域902内には列1〜列6が含まれているが、網掛領域901内にはいずれの列も含まれていないため、(C1)〜(C4)のすべての条件を満たす列は存在しない。したがって、x=(1,1,3,3)の場合にパラメータベクトルxは達成されないことが分かり、ソート結果における次の順位の(1,2,3,3)が選択される。
x=(1,2,3,3)の場合も、x=(1,1,3,3)の場合と同様にして、パラメータベクトルxは達成されないことが分かる。したがって、ソート結果における次の順位の(2,1,3,3)が選択される。
x=(2,1,3,3)の場合、(C1)〜(C4)のすべての条件を満たす列は列2のみであるが、列2のパラメータは(P,E,R,U)=(2,1,2,2)であるため、(w1,w2,w3,w4)=(2,1,2,2)となる。この場合、パラメータベクトルxとベクトル(w1,w2,w3,w4)とが一致しないため、x=(2,1,3,3)の場合にパラメータベクトルxは達成されないことが分かり、ソート結果における次の順位の(2,2,3,3)が選択される。
x=(2,2,3,3)の場合、(C1)〜(C4)のすべての条件を満たす列は列2、列5、及び列6であり、(w1,w2,w3,w4)=(2,2,2,3)となる。この場合、パラメータベクトルxとベクトル(w1,w2,w3,w4)とが一致しないため、x=(2,2,3,3)の場合にパラメータベクトルxは達成されないことが分かり、ソート結果における次の順位の(1,3,3,3)が選択される。
図10は、x=(1,3,3,3)の場合に上記(C1)〜(C4)の条件を満たす列の範囲を示している。図10(a)は、(C1)及び(C2)の条件を満たす列の範囲を示している。図10(a)の網掛領域1001は、精神的苦痛レベルPが1以下であり、かつ、経済的損失レベルEが3以下である範囲を表す。
図10(b)は、(C3)及び(C4)の条件を満たす列の範囲を示している。図10(b)の網掛領域1002は、受容性レベルRが3以下であり、かつ、有用性レベルUが3以下である範囲を表す。
網掛領域1001内には列3及び列4が含まれており、網掛領域1002内には列1〜列6が含まれている。したがって、(C1)〜(C4)のすべての条件を満たす列は列3及び列4であり、(w1,w2,w3,w4)=(1,3,3,3)となる。この場合、パラメータベクトルxとベクトル(w1,w2,w3,w4)とが一致するため、列3及び列4の項目が、残すべき項目に決定され、列1、列2、列5、及び列6の項目が、削除候補の項目に決定される。
列3及び列4のセルを残し、それ以外のセルを削除することで、ID1の二値化個人情報に対する評価値vを最大化することができ、この場合の評価値vは、次式のように計算される。
v=(8^(3−1)+6^(3−1))−(10^(1−1)+5^(3−1))
=(64+36)−(1+25)
=74 (14)
ID2〜ID5の二値化個人情報に対しても同様の処理を行うことで、各二値化個人情報に対する削除候補セルが決定される。
図11は、図7の二値化個人情報テーブル622から生成された削除候補セル情報624の例を示している。図11の削除候補セル情報624において、網掛されたセルは、削除候補セルを表す。削除候補セルの論理値は、論理値“1”から論理値“0”に変更されている。ID1〜ID5の二値化個人情報それぞれに対する評価値vを最大化した場合の合計評価値V0は、316円である。
次に、決定部614は、例えば、以下のような手順により、削除項目集合625を生成する。
(P21)決定部614は、二値化個人情報テーブル622のj番目(j=1〜m)の列を削除するか否かを判定するための指標fjを、次式により計算する。
fj=N1(j)/N2(j) (21)
N1(j)は、削除候補セル情報624において、j番目の列に含まれる削除候補セルの個数を表し、N2(j)は、二値化個人情報テーブル622において、j番目の列に含まれる論理値“1”のセルの個数を表す。
指標fjが1に近い列は、削除候補セルの割合が大きいため、削除すべき列であると言える。一方、指標fjが0に近い列は、削除候補セルの割合が小さいため、残すべき列であると言える。指標fjが1/2に近い列は、削除すべきか否かが必ずしも明確ではない。そこで、決定部614は、二値化個人情報テーブル622のm本の列を、|fj−1/2|の値の降順にソートする。
(P22)決定部614は、ソート結果における先頭のm−s本の列について、|fj−1/2|の最大値を有する列から順に、次のような操作を繰り返す。
(O1)決定部614は、fj−1/2が正である場合、j番目の列の項目を削除項目に決定する。
(O2)決定部614は、fj−1/2が負である場合、j番目の列の項目を残される項目に決定する。
(P23)決定部614は、残りのs本の列について、全探索法により削除項目を決定する。残りの列の本数が少ない場合は、全探索法により短時間で最適解を求めることができる。全探索法の対象となる列の本数sは、あらかじめシミュレーション等によって決定することができる。
(P24)決定部614は、(P22)で決定された削除項目と(P23)で決定された削除項目とを含む、削除項目集合625を生成する。
(P25)決定部614は、削除項目集合625に含まれる項目以外の項目を残した場合の合計評価値V(s)を計算し、各二値化個人情報に対する評価値vを最大化した場合の合計評価値V0と、合計評価値V(s)との誤差EVを、次式により計算する。
EV=V0−V(s) (22)
EV=0の場合、削除項目集合625は、各二値化個人情報に対する評価値vを最大化する理想的な解を示している。
このような手順によれば、削除項目集合625を生成する処理の計算量のオーダはO(nm+mlogm+nm2)となる。この計算量には、削除候補セル情報624を生成する処理の計算量も含まれている。
図12は、図7の二値化個人情報テーブル622と図11の削除候補セル情報624とを用いて計算された、列1〜列6の指標fj(j=1〜6)を示している。この場合、指標f1〜指標f6は、次式のように計算される。
列1 f1=4/4=1 (23)
列2 f2=3/5 (24)
列3 f3=0/4=0 (25)
列4 f4=1/4 (26)
列5 f5=2/4=1/2 (27)
列6 f6=3/5 (28)
列1〜列6を|fj−1/2|の降順にソートすると、次のようなソート結果が得られる。
列1,列3,列4,列2,列6,列5
ただし、|fj−1/2|が同じ値である複数の列については、jの昇順にソートされている。s=3である場合、ソート結果の先頭の3本の列について、削除するか否かが判定される。
列1については、f1−1/2=1/2>0であるため、列1の項目は削除項目に決定される。次に、列3については、f3−1/2=−1/2<0であるため、列3の項目は残される項目に決定される。次に、列4については、f4−1/2=−1/4<0であるため、列4の項目も残される項目に決定される。
その後、列2、列5、及び列6を対象として全探索法により最適解が探索され、列5及び列6の項目が削除項目に決定される。この場合、残される列2、列3、及び列4の項目に対する合計評価値V(s)は278円となり、誤差EVは38円となる。
次に、実施形態の削除項目決定方法を用いた実験により得られた効果について、説明する。実験環境としては、上述した所定のCPU、OS、メモリ、及び実装言語の組み合わせが用いられる。
n行m列の個人情報テーブルの場合、全探索法では計算量のオーダがO(nm2)であるのに対して、実施形態の削除項目決定方法ではO(nm+mlogm+nm2)となる。したがって、sが十分に小さい場合、実施形態の削除項目決定方法の方が、全探索法よりも計算負荷が軽減され、高速に解を求めることができる。
例えば、n=1000及びm=30の場合、全探索法で解を求めるためには、最低でも約4か月かかる。一方、n=1000、m=30、及びs=10の場合、実施形態の削除項目決定方法では、33秒程度で解を求めることができる。この処理時間は、実験を100回繰り返した場合の平均値である。
図13は、実施形態の削除項目決定方法と局所探索法の正答率を実験により比較した結果を示している。この実験では、項目値の欠損率がα%(α=1,2,3,4,5,10,20,30)である100個の個人情報テーブルをランダムに生成し、各個人情報テーブルに対する解を2つの方法でそれぞれ求めて、正答率が比較されている。正答率は、求められた解が最適解にどれだけ近いかを示す指標である。
図13において、実施形態の削除項目決定方法の行の分数は、削除項目決定方法の正答率が局所探索法の正答率よりも高い割合を表し、局所探索法の行の分数は、局所探索法の正答率が削除項目決定方法の正答率よりも高い割合を表す。例えば、欠損率が1%である場合、削除項目決定方法の正答率が局所探索法の正答率よりも高い割合は、25/100である。
α=1,2,3,4,5,10,20,30のいずれの場合も、実施形態の削除項目決定方法の方が局所探索法よりも良い解を与えることが分かる。特に、欠損率が10%以下の場合、局所探索法の方が良い解を与えることはほとんどない。
図14は、図6の情報処理装置601が行う個人情報制御処理の具体例を示すフローチャートである。まず、入力部612は、複数の個人情報を受け付けて個人情報テーブル621に登録し(ステップ1401)、個人情報テーブル621の各項目に対する複数のパラメータを受け付けて、パラメータ情報623に登録する(ステップ1402)。そして、特定部613は、削除候補特定処理を行って、削除候補セル情報624を生成する(ステップ1403)。
次に、入力部612は、全探索法の対象となる列の本数sを受け付け(ステップ1404)、決定部614は、削除項目決定処理を行って、削除項目集合625を生成する(ステップ1405)。そして、出力部615は、削除項目集合625を出力する(ステップ1406)。
図15A及び図15Bは、図14のステップ1403における削除候補特定処理の例を示すフローチャートである。まず、特定部613は、個人情報テーブル621を二値化することで、二値化個人情報テーブル622を生成する(ステップ1501)。
次に、特定部613は、二値化個人情報テーブル622の行を示す制御変数iに1を設定し(ステップ1502)、i番目の行の二値化個人情報について、項目値が存在するセルに対応する項目の集合Jを生成する(ステップ1503)。
次に、特定部613は、パラメータ情報623を参照して、集合Jに含まれる項目の各パラメータの最大値を特定する(ステップ1504)。これにより、精神的苦痛レベルPの最大値p、経済的損失レベルEの最大値e、受容性レベルRの最大値r、及び有用性レベルUの最大値uが特定される。
次に、特定部613は、パラメータベクトルxの集合Sを生成し(ステップ1505)、集合Sの各要素の評価値vを、式(12)により計算する(ステップ1506)。そして、特定部613は、集合Sの要素を評価値vの降順にソートする(ステップ1507)。
次に、特定部613は、ソート結果における順位を示す制御変数jに1を設定し(ステップ1508)、順位jの要素であるパラメータベクトルv1(j)について、上記(C1)〜(C4)の条件を満たす項目の集合Djを生成する(ステップ1509)。
次に、特定部613は、集合Djに含まれる項目のパラメータに基づいて、最大パラメータベクトルv2(j)=(w1,w2,w3,w4)を生成する(ステップ1510)。そして、特定部613は、v1(j)とv2(j)とを比較する(ステップ1511)。
v1(j)とv2(j)が一致しない場合(ステップ1511,NO)、特定部613は、jを1だけインクリメントして(ステップ1512)、ステップ1509以降の処理を繰り返す。
一方、v1(j)とv2(j)が一致する場合(ステップ1511,YES)、特定部613は、集合Djに含まれる項目を、残すべき項目に決定し、それ以外の項目を削除候補の項目に決定する(ステップ1513)。そして、特定部613は、iを二値化個人情報テーブル622の行の総数nと比較する(ステップ1514)。
iがnに達していない場合(ステップ1514,NO)、特定部613は、iを1だけインクリメントして(ステップ1516)、ステップ1503以降の処理を繰り返す。一方、iがnに達している場合(ステップ1514,YES)、特定部613は、各行の削除候補の項目に対応するセルを示す、削除候補セル情報624を生成する(ステップ1515)。
図16は、図14のステップ1405における削除項目決定処理の例を示すフローチャートである。まず、決定部614は、二値化個人情報テーブル622の列を示す制御変数jに1を設定し(ステップ1601)、j番目の列に対する指標fjを、式(21)により計算する(ステップ1602)。そして、決定部614は、jを二値化個人情報テーブル622の列の総数mと比較する(ステップ1603)。
jがmに達していない場合(ステップ1603,NO)、決定部614は、jを1だけインクリメントして(ステップ1612)、ステップ1602以降の処理を繰り返す。一方、jがmに達している場合(ステップ1603,YES)、決定部614は、二値化個人情報テーブル622のm本の列を、|fj−1/2|の値の降順にソートする(ステップ1604)。
次に、決定部614は、集合Kを空集合に設定し(ステップ1605)、ソート結果における順位を示す制御変数kに1を設定して(ステップ1606)、fkと1/2を比較する(ステップ1607)。fjが1/2よりも大きい場合(ステップ1607,YES)、決定部614は、ソート結果における順位kの列の項目を集合Kに追加して(ステップ1608)、kとm−sを比較する(ステップ1609)。一方、fjが1/2以下である場合(ステップ1607,NO)、決定部614は、ステップ1609以降の処理を行う。
kがm−sに達していない場合(ステップ1609,NO)、決定部614は、kを1だけインクリメントして(ステップ1613)、ステップ1607以降の処理を繰り返す。一方、kがm−sに達している場合(ステップ1609,YES)、決定部614は、順位m−s+1〜順位mのs本の列について、全探索法により削除項目を決定する(ステップ1610)。このとき、決定部614は、s本の列の集合の各部分集合Hについて、二値化個人情報テーブル622から集合K及び部分集合Hに含まれる列をすべて削除した場合の合計評価値を計算し、最大の合計評価値を有する部分集合H0を求める。
次に、決定部614は、集合K及び部分集合H0に含まれる列の項目を要素とする、削除項目集合625を生成する(ステップ1611)。そして、決定部614は、合計評価値V(s)を計算し、誤差EVを式(22)により計算する。
図4の情報処理装置401及び図6の情報処理装置601の構成は一例に過ぎず、情報処理装置の用途又は条件に応じて一部の構成要素を省略又は変更してもよい。例えば、図6の情報処理装置601において、事前に個人情報テーブル621及びパラメータ情報623が記憶部611に格納されている場合は、入力部612を省略することができる。
図5及び図14〜図16のフローチャートは一例に過ぎず、情報処理装置の構成又は条件に応じて一部の処理を省略又は変更してもよい。例えば、図6の情報処理装置601において、事前に個人情報テーブル621及びパラメータ情報623が記憶部611に格納されている場合は、図14のステップ1401及びステップ1402の処理を省略することができる。個人情報テーブル621を二値化することなく、削除候補セル情報624及び削除項目集合625を生成する場合は、図15Aのステップ1501の処理を省略することができる。
価値とリスクの差分の代わりに、価値又はリスクのみを含む評価値を用いることもできる。JIPDECモデル以外の評価方法により価値を算定してもよく、JOモデル以外の評価方法によりリスクを算定してもよい。
図1に示した個人情報テーブルは一例に過ぎず、個人情報テーブルは、受け付けられる個人情報の属性に応じて変化する。図2及び図7に示した二値化個人情報テーブルと図8〜図10に示したパラメータ情報は一例に過ぎず、二値化個人情報テーブル及びパラメータ情報は、二値化される前の個人情報テーブルに応じて変化する。図3に示した探索処理は一例に過ぎず、探索処理は、個人情報テーブルに応じて変化する。
図11に示した削除候補セル情報と図12に示した指標fjは一例に過ぎず、削除候補セル情報及び指標fjは、二値化個人情報テーブルに応じて変化する。図13に示した実験結果は一例に過ぎず、正答率は、個人情報テーブル及び実験環境に応じて変化する。
式(1)〜式(28)は一例にすぎず、情報処理装置は、別の計算式を用いて個人情報制御処理を行ってもよい。
図17は、図4の情報処理装置401及び図6の情報処理装置601のハードウェア構成例を示している。図17の情報処理装置は、CPU(Central Processing Unit)1701、メモリ1702、入力装置1703、出力装置1704、補助記憶装置1705、媒体駆動装置1706、及びネットワーク接続装置1707を含む。これらの構成要素はハードウェアであり、バス1708により互いに接続されている。
メモリ1702は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリであり、処理に用いられるプログラム及びデータを格納する。メモリ1702は、図4の記憶部411又は図6の記憶部611として用いることができる。
CPU1701(プロセッサ)は、例えば、メモリ1702を利用してプログラムを実行することにより、図4の特定部412及び決定部413として動作する。CPU1701は、メモリ1702を利用してプログラムを実行することにより、図6の特定部613及び決定部614としても動作する。
入力装置1703は、例えば、キーボード、ポインティングデバイス等であり、オペレータ又はユーザからの指示又は情報の入力に用いられる。出力装置1704は、例えば、表示装置、プリンタ、スピーカ等であり、オペレータ又はユーザへの問い合わせ又は指示、及び処理結果の出力に用いられる。処理結果は、削除項目集合625であってもよい。入力装置1703及び出力装置1704は、図6の入力部612及び出力部615としてそれぞれ用いることができる。
補助記憶装置1705は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。補助記憶装置1705は、ハードディスクドライブ又はフラッシュメモリであってもよい。情報処理装置は、補助記憶装置1705にプログラム及びデータを格納しておき、それらをメモリ1702にロードして使用することができる。補助記憶装置1705は、図4の記憶部411又は図6の記憶部611として用いることができる。
媒体駆動装置1706は、可搬型記録媒体1709を駆動し、その記録内容にアクセスする。可搬型記録媒体1709は、メモリデバイス、フレキシブルディスク、光ディスク、光磁気ディスク等である。可搬型記録媒体1709は、CD−ROM(Compact Disk Read Only Memory)、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリ等であってもよい。オペレータ又はユーザは、この可搬型記録媒体1709にプログラム及びデータを格納しておき、それらをメモリ1702にロードして使用することができる。
このように、処理に用いられるプログラム及びデータを格納するコンピュータ読み取り可能な記録媒体は、メモリ1702、補助記憶装置1705、又は可搬型記録媒体1709のような、物理的な(非一時的な)記録媒体である。
ネットワーク接続装置1707は、LAN(Local Area Network)、WAN(Wide Area Network)等の通信ネットワークに接続され、通信に伴うデータ変換を行う通信インタフェース回路である。情報処理装置は、プログラム及びデータを外部の装置からネットワーク接続装置1707を介して受信し、それらをメモリ1702にロードして使用することができる。ネットワーク接続装置1707は、図6の入力部612及び出力部615として用いることができる。
なお、情報処理装置が図17のすべての構成要素を含む必要はなく、用途又は条件に応じて一部の構成要素を省略することも可能である。例えば、オペレータ又はユーザとのインタフェースが不要な場合は、入力装置1703及び出力装置1704を省略してもよい。可搬型記録媒体1709又は通信ネットワークを使用しない場合は、媒体駆動装置1706又はネットワーク接続装置1707を省略してもよい。
開示の実施形態とその利点について詳しく説明したが、当業者は、特許請求の範囲に明確に記載した本発明の範囲から逸脱することなく、様々な変更、追加、省略をすることができるであろう。
図1乃至図17を参照しながら説明した実施形態に関し、さらに以下の付記を開示する。
(付記1)
コンピュータによって実行される決定方法であって、
前記コンピュータが、
複数の項目をそれぞれ有する複数の個人情報を受け付け、
前記複数の個人情報それぞれについて、項目値が存在する項目の一部を削除した場合に残される項目に対する評価値に基づき、削除候補の項目を特定し、
前記複数の項目それぞれについて、項目が削除候補として特定された個人情報の個数を求め、
前記複数の項目それぞれについて求められた個人情報の個数に基づき、前記削除候補の項目の中から削除項目を決定する、
ことを特徴とする決定方法。
(付記2)
前記コンピュータは、前記複数の項目各々に対して設定された複数のパラメータそれぞれの値の範囲に基づいて、複数の評価値を計算し、前記複数の評価値のうち所定の評価値を実現する項目の組み合わせを、前記残される項目として特定し、前記複数の項目から前記項目の組み合わせを除外することで、前記削除候補の項目を特定することを特徴とする付記1記載の決定方法。
(付記3)
前記コンピュータは、前記複数の個人情報それぞれについて、前記残される項目に対する評価値が最大になるように、前記削除候補の項目を特定することを特徴とする付記1又は2記載の決定方法。
(付記4)
前記残される項目に対する評価値は、前記複数の個人情報それぞれの価値と、前記複数の個人情報それぞれのリスクとの差分を表すことを特徴とする付記1乃至3のいずれか1項に記載の決定方法。
(付記5)
複数の項目をそれぞれ有する複数の個人情報を記憶する記憶部と、
前記複数の個人情報それぞれについて、項目値が存在する項目の一部を削除した場合に残される項目に対する評価値に基づき、削除候補の項目を特定する特定部と、
前記複数の項目それぞれについて、項目が削除候補として特定された個人情報の個数を求め、前記複数の項目それぞれについて求められた個人情報の個数に基づき、前記削除候補の項目の中から削除項目を決定する決定部と、
を備えることを特徴とする情報処理装置。
(付記6)
前記特定部は、前記複数の項目各々に対して設定された複数のパラメータそれぞれの値の範囲に基づいて、複数の評価値を計算し、前記複数の評価値のうち所定の評価値を実現する項目の組み合わせを、前記残される項目として特定し、前記複数の項目から前記項目の組み合わせを除外することで、前記削除候補の項目を特定することを特徴とする付記5記載の情報処理装置。
(付記7)
前記特定部は、前記複数の個人情報それぞれについて、前記残される項目に対する評価値が最大になるように、前記削除候補の項目を特定することを特徴とする付記5又は6記載の情報処理装置。
(付記8)
前記残される項目に対する評価値は、前記複数の個人情報それぞれの価値と、前記複数の個人情報それぞれのリスクとの差分を表すことを特徴とする付記5乃至7のいずれか1項に記載の情報処理装置。
(付記9)
複数の項目をそれぞれ有する複数の個人情報を受け付け、
前記複数の個人情報それぞれについて、項目値が存在する項目の一部を削除した場合に残される項目に対する評価値に基づき、削除候補の項目を特定し、
前記複数の項目それぞれについて、項目が削除候補として特定された個人情報の個数を求め、
前記複数の項目それぞれについて求められた個人情報の個数に基づき、前記削除候補の項目の中から削除項目を決定する、
処理をコンピュータに実行させるための決定プログラム。
(付記10)
前記コンピュータは、前記複数の項目各々に対して設定された複数のパラメータそれぞれの値の範囲に基づいて、複数の評価値を計算し、前記複数の評価値のうち所定の評価値を実現する項目の組み合わせを、前記残される項目として特定し、前記複数の項目から前記項目の組み合わせを除外することで、前記削除候補の項目を特定することを特徴とする付記9記載の決定プログラム。
(付記11)
前記コンピュータは、前記複数の個人情報それぞれについて、前記残される項目に対する評価値が最大になるように、前記削除候補の項目を特定することを特徴とする付記9又は10記載の決定プログラム。
(付記12)
前記残される項目に対する評価値は、前記複数の個人情報それぞれの価値と、前記複数の個人情報それぞれのリスクとの差分を表すことを特徴とする付記9乃至11のいずれか1項に記載の決定プログラム。
101〜103 個人情報
201〜203 二値化個人情報
301 折れ線
311、312 矢印
321 最適解
322 局所解
401、601 情報処理装置
411、611 記憶部
412、613 特定部
413、614 決定部
612 入力部
615 出力部
621 個人情報テーブル
622 二値化個人情報テーブル
623 パラメータ情報
624 削除候補セル情報
625 削除項目集合
901、902、1001、1002 網掛領域
1701 CPU
1702 メモリ
1703 入力装置
1704 出力装置
1705 補助記憶装置
1706 媒体駆動装置
1707 ネットワーク接続装置
1708 バス
1709 可搬型記録媒体

Claims (6)

  1. コンピュータによって実行される決定方法であって、
    前記コンピュータが、
    複数の項目をそれぞれ有する複数の個人情報を受け付け、
    前記複数の個人情報それぞれについて、項目値が存在する項目の一部を削除した場合に残される項目に対する評価値に基づき、削除候補の項目を特定し、
    前記複数の項目それぞれについて、項目が削除候補として特定された個人情報の個数を求め、
    前記複数の項目それぞれについて求められた個人情報の個数に基づき、前記削除候補の項目の中から削除項目を決定する、
    ことを特徴とする決定方法。
  2. 前記コンピュータは、前記複数の項目各々に対して設定された複数のパラメータそれぞれの値の範囲に基づいて、複数の評価値を計算し、前記複数の評価値のうち所定の評価値を実現する項目の組み合わせを、前記残される項目として特定し、前記複数の項目から前記項目の組み合わせを除外することで、前記削除候補の項目を特定することを特徴とする請求項1記載の決定方法。
  3. 前記コンピュータは、前記複数の個人情報それぞれについて、前記残される項目に対する評価値が最大になるように、前記削除候補の項目を特定することを特徴とする請求項1又は2記載の決定方法。
  4. 前記残される項目に対する評価値は、前記複数の個人情報それぞれの価値と、前記複数の個人情報それぞれのリスクとの差分を表すことを特徴とする請求項1乃至3のいずれか1項に記載の決定方法。
  5. 複数の項目をそれぞれ有する複数の個人情報を記憶する記憶部と、
    前記複数の個人情報それぞれについて、項目値が存在する項目の一部を削除した場合に残される項目に対する評価値に基づき、削除候補の項目を特定する特定部と、
    前記複数の項目それぞれについて、項目が削除候補として特定された個人情報の個数を求め、前記複数の項目それぞれについて求められた個人情報の個数に基づき、前記削除候補の項目の中から削除項目を決定する決定部と、
    を備えることを特徴とする情報処理装置。
  6. 複数の項目をそれぞれ有する複数の個人情報を受け付け、
    前記複数の個人情報それぞれについて、項目値が存在する項目の一部を削除した場合に残される項目に対する評価値に基づき、削除候補の項目を特定し、
    前記複数の項目それぞれについて、項目が削除候補として特定された個人情報の個数を求め、
    前記複数の項目それぞれについて求められた個人情報の個数に基づき、前記削除候補の項目の中から削除項目を決定する、
    処理をコンピュータに実行させるための決定プログラム。
JP2019186158A 2019-10-09 2019-10-09 決定方法、情報処理装置、及び決定プログラム Active JP7298431B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019186158A JP7298431B2 (ja) 2019-10-09 2019-10-09 決定方法、情報処理装置、及び決定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019186158A JP7298431B2 (ja) 2019-10-09 2019-10-09 決定方法、情報処理装置、及び決定プログラム

Publications (2)

Publication Number Publication Date
JP2021060926A true JP2021060926A (ja) 2021-04-15
JP7298431B2 JP7298431B2 (ja) 2023-06-27

Family

ID=75380637

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019186158A Active JP7298431B2 (ja) 2019-10-09 2019-10-09 決定方法、情報処理装置、及び決定プログラム

Country Status (1)

Country Link
JP (1) JP7298431B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006119859A (ja) * 2004-10-21 2006-05-11 Ibiken Kk 個人情報管理システム、及びそのプログラム
JP2007264827A (ja) * 2006-03-27 2007-10-11 Matsushita Electric Ind Co Ltd 個人情報保護装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006119859A (ja) * 2004-10-21 2006-05-11 Ibiken Kk 個人情報管理システム、及びそのプログラム
JP2007264827A (ja) * 2006-03-27 2007-10-11 Matsushita Electric Ind Co Ltd 個人情報保護装置

Also Published As

Publication number Publication date
JP7298431B2 (ja) 2023-06-27

Similar Documents

Publication Publication Date Title
Mokhtari et al. Interpreting financial time series with SHAP values
Chan et al. Learning Arbiter and Combiner Trees from Partitioned Data for Scaling Machine Learning.
JP6414363B2 (ja) 予測システム、方法およびプログラム
CN111966886A (zh) 对象推荐方法、对象推荐装置、电子设备及存储介质
Al-Shamri et al. Fuzzy-weighted similarity measures for memory-based collaborative recommender systems
WO2017159402A1 (ja) 共クラスタリングシステム、方法およびプログラム
JP7428927B2 (ja) ノード情報推定方法、ノード情報推定プログラムおよび情報処理装置
Runchi et al. An ensemble credit scoring model based on logistic regression with heterogeneous balancing and weighting effects
Krawczyk et al. Incremental weighted one-class classifier for mining stationary data streams
CN116468273A (zh) 客户风险识别方法及装置
Mukherjee et al. Detection of defaulters in P2P lending platforms using unsupervised learning
Silva et al. Model optimization in imbalanced regression
Sotto et al. An analysis of the influence of noneffective instructions in linear genetic programming
JP7505574B2 (ja) 求解方法選択装置および方法
Tsai et al. Data pre-processing by genetic algorithms for bankruptcy prediction
JP7298431B2 (ja) 決定方法、情報処理装置、及び決定プログラム
US11829921B2 (en) System and method for recommending demand-supply agent combination pairs for transactions using machine learning
Makrehchi et al. Text classification using small number of features
Sagala et al. Enhanced churn prediction model with boosted trees algorithms in the banking sector
Mahapatra et al. A systematic approach to enhance the forecasting of bankruptcy data
JP5506629B2 (ja) 準頻出構造パターンマイニング装置と頻出構造パターンマイニング装置とそれらの方法、及びプログラム
JP2010244363A (ja) 遺伝的処理装置、遺伝的処理方法およびプログラム
Feng et al. A novel feature selection approach based on multiple filters and new separable degree index for credit scoring
US9740681B2 (en) Method for classifying pieces of text on basis of evaluation polarity, computer program product, and computer
Wang et al. Feature selection for human resource selection based on affinity propagation and SVM sensitivity analysis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220609

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230529

R150 Certificate of patent or registration of utility model

Ref document number: 7298431

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150