JP6318929B2 - 属性値生成方法、属性値生成プログラム及び属性値生成装置 - Google Patents

属性値生成方法、属性値生成プログラム及び属性値生成装置 Download PDF

Info

Publication number
JP6318929B2
JP6318929B2 JP2014141810A JP2014141810A JP6318929B2 JP 6318929 B2 JP6318929 B2 JP 6318929B2 JP 2014141810 A JP2014141810 A JP 2014141810A JP 2014141810 A JP2014141810 A JP 2014141810A JP 6318929 B2 JP6318929 B2 JP 6318929B2
Authority
JP
Japan
Prior art keywords
attribute value
attribute
distribution
data
values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014141810A
Other languages
English (en)
Other versions
JP2016018460A (ja
Inventor
直希 濱田
直希 濱田
菊地 英幸
英幸 菊地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014141810A priority Critical patent/JP6318929B2/ja
Publication of JP2016018460A publication Critical patent/JP2016018460A/ja
Application granted granted Critical
Publication of JP6318929B2 publication Critical patent/JP6318929B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、属性値生成方法、属性値生成プログラム及び属性値生成装置に関する。
近年、行政の都市計画において、コンピュータシミュレーションにより、都市の将来を予測したり、施策の有効性を検討したりする試みが始まっている。このシミュレーションを実行するためには、個々の世帯や個人の非集計的な属性値(非集計データ)が必要となる。
しかしながら、実際の都市において、個々の世帯や個人を特定しうる詳細なデータを網羅的に収集し、利用することは、プライバシーの観点及び調査コストの観点から難しい。
一方、最近では、非集計的な属性値として少数の非集計データを集め、集計データの頻度分布に一致するように該非集計データを複製して、仮想的な非集計データを大量に生成する方法が知られている。代表的な方法としては、例えば、IPF(Iterative Proportional Fitting)などが知られている(例えば、非特許文献1、2等参照)。
Deming, W. E.; Stephan, F. F. (1940). "On a Least Squares Adjustment of a Sampled Frequency Table When the Expected Marginal Totals are Known". Annals of Mathematical Statistics 11 (4): 427-444. Beckman, R.J., K.A. Baggerly, and M.D. McKay (1996). "Creating Synthetic Baseline Populations". Transportation Research Part A: Policy and Practice, 30(6): 415-429.
しかしながら、上記IPFなどでは、収集された少数の非集計データと同一のデータが大量に生成される一方で、収集された少数の非集計データとは異なるデータが一切又はほとんど生成されない。このため、生成された仮想的な非集計データが現実の非集計データとは大きく乖離するおそれがある。
1つの側面では、本発明は、適切な属性値を生成することが可能な属性値生成方法、属性値生成プログラム及び属性値生成装置を提供することを目的とする。
一つの態様では、属性値生成方法は、コンピュータが、属性値空間に含まれる第1の属性値及び第2の属性値を受け付け、前記第1の属性値と前記第2の属性値との間の属性値である第3の属性値を生成し、前記第1の属性値、前記第2の属性値、前記第3の属性値のそれぞれに分布情報を対応付け、前記属性値空間における前記第1の属性値の位置、前記第2の属性値の位置、前記第3の属性値の位置のそれぞれの近傍に、対応付けられた分布情報に従った分布となるように属性値群を形成する、処理を実行する属性値生成方法である。
別の態様では、属性値生成方法は、コンピュータが、属性値空間に含まれる複数の属性値を受け付け、前記複数の属性値により規定される範囲内の属性値である新たな属性値を生成し、前記複数の属性値それぞれと前記新たな属性値に分布情報を対応付け、前記属性値空間における前記複数の属性値それぞれと前記新たな属性値の位置のそれぞれの近傍に、対応付けられた分布情報に従った分布となるように属性値群を形成する、処理を実行する属性値生成方法である。
適切な属性値を生成することができる。
一実施形態に係る仮想データ生成装置のハードウェア構成を概略的に示す図である。 仮想データ生成装置の機能ブロック図である。 図3(a)は、集計データの一例を示す図であり、図3(b)は、非集計データ(頂点座標データ)の一例を示す図である。 図4(a)は、頂点接続データの一例を示す図であり、図4(b)は、確率分布データの一例を示す図である。 仮想データ生成装置による仮想的な非集計データの生成・出力に関する処理の流れを示すフローチャートである。 図5のステップS20の具体的処理を示すフローチャートである。 図5のステップS22の具体的処理を示すフローチャートである。 属性値空間の一例を示す図である。 属性値空間を正規化した状態を示す図である。 図10(a)、図10(b)は、図5のステップS18の処理を説明するための図である。 図11(a),図11(b)は、図6のステップS30の処理を説明するための図である。 図6のステップS32の処理を説明するための図である。 図13(a),図13(b)は、図6のステップS34の処理を説明するための図である。 図14(a)〜図14(c)は、図7のステップS40の処理を説明するための図である。 図15(a)は、図7のステップS42の処理を説明するための図であり、図15(b)は、図7のステップS44の処理を説明するための図である。
以下、属性値生成装置の一実施形態としての仮想データ生成装置10について、図1〜図15に基づいて詳細に説明する。本実施形態の仮想データ生成装置10は、国勢調査などにより得られる都市の集計データと、アンケートなどにより得られる少数(例えば都市の全世帯又は全人口の数%程度)の非集計データとを用いて、多数(都市の全世帯又は全人口分)の仮想的な非集計データを生成する装置である。
図1には、一実施形態に係る仮想データ生成装置10のハードウェア構成が示されている。仮想データ生成装置10は、PC(Personal Computer)などの端末であり、図1に示すように、CPU(Central Processing Unit)90、ROM(Read Only Memory)92、RAM(Random Access Memory)94、記憶部(ここではHDD(Hard Disk Drive))96、ネットワークインタフェース97、表示部93、入力部95、及び可搬型記憶媒体用ドライブ99等を備えている。表示部93は液晶ディスプレイ等を含み、入力部95はキーボード等を含む。仮想データ生成装置10の構成各部は、バス98に接続されている。仮想データ生成装置10では、ROM92あるいはHDD96に格納されているプログラム(属性値生成プログラムを含む)、或いは可搬型記憶媒体用ドライブ99が可搬型記憶媒体91から読み取ったプログラム(属性値生成プログラムを含む)をCPU90が実行することにより、図2に示す各部の機能が実現される。なお、図2には、仮想データ生成装置10のHDD96等に格納されている各種データベース(Database)も図示されている。
図2には、仮想データ生成装置10の機能ブロック図が示されている。図2に示すように、仮想データ生成装置10では、CPU90がプログラムを実行することにより、制約条件入力部12、集計データ入力部14、非集計データ入力部16、単体複体生成部18、分布推定部20、仮想データ生成部22、及び仮想データ出力部24としての機能が実現されている。
制約条件入力部12は、仮想データ生成装置10の操作者から入力される、仮想的な非集計データ生成に用いる制約条件の情報を受け付け、制約条件DB30に格納する。制約条件は、仮想的な非集計データとしてあり得ないデータを排除するための条件であり、例えば、属性の情報、不等号、and、or、not等を組み合わせた条件式を採用することができる。条件式には、一例として、「世帯主年齢>0、世帯人員>0、not(世帯主年齢<18 and 既婚)」などがある。
集計データ入力部14は、操作者から入力される、国勢調査などの集計データを取得し、集計DB32に格納する。集計DB32には、一例として、図3(a)に示すような集計データが格納される。図3(a)に示す集計データは、ある都市における世帯主年齢、世帯年収、世帯人数を集計したデータを含む。
非集計データ入力部16は、操作者から入力される、アンケートなどにより得られた非集計データを取得し、頂点座標DB34に格納する。非集計データ(頂点座標データとも呼ぶ)は、図3(b)に示すようなデータ構造を有する。すなわち、非集計データ(頂点座標データ)は、m行d列の表形式のデータであり、各世帯の世帯主年齢や世帯年収、世帯人数などの情報を含んでいる。mは非集計データの数、dは1つの非集計データが持つ属性の数である。
単体複体生成部18は、非集計データを用いて、単体複体(Rips複体)を生成(構築)する。なお、単体複体における各頂点座標データの接続関係のデータ(頂点接続データ)は、頂点接続DB36に格納される。なお、頂点接続データは、図4(a)に示すようなデータである。頂点接続データは、各頂点と、該頂点に接続されている近傍の頂点とを関連付けた情報を含んでいる。i行目のデータは、頂点iの接続先頂点のリストを意味する。この場合、頂点ごとに接続先頂点の個数は異なるため、列数は行ごとに異なっている。
分布推定部20は、単体複体生成部18が生成した単体複体の各頂点における分布情報を推定する。なお、分布情報は、確率分布データとして、確率分布DB38に格納される。確率分布データは、各頂点に割り当てられた分布のパラメータの配列に関するデータであり、正規分布を用いる場合、図4(b)に示すように、パラメータとして平均ベクトルと共分散行列とを含む。なお、実際にはパラメータを2つに分けて持たずに、平均ベクトルの末尾に共分散行列の要素を順に並べて1つのベクトルにして保持するものとする。なお、分布パラメータの数や構造は、分布によって様々であるが、どの分布を用いるにしても、上記と同様、1つのベクトルにして保持するものとする。
仮想データ生成部22は、制約条件、集計データ、単体複体の情報や確率分布データ等を用いて、仮想的な非集計データを生成する。仮想的な非集計データは、対象とする都市の全世帯分生成される。
仮想データ出力部24は、仮想データ生成部22が生成した仮想的な非集計データを表示部93等に出力(表示)する。
(仮想データ生成装置10の処理)
次に、仮想データ生成装置10の処理について、図5〜図7のフローチャートに沿って、その他図面を適宜参照しつつ詳細に説明する。図5には、仮想データ生成装置10による仮想的な非集計データの生成・出力に関する処理の流れが示され、図6には、図5のステップS20の具体的処理が示され、図7には、図5のステップS22の具体的処理が示されている。なお、本実施形態では、都市αの全世帯の仮想的な非集計データを生成し、出力する場合について説明する。また、説明の簡単のため、集計データの属性値空間が2次元である場合について説明する。
図5の処理では、まず、ステップS10において、制約条件入力部12が、操作者からの制約条件の入力を受け付け、該制約条件を制約条件DB30に格納する。なお、制約条件は、前述のように、仮想的な非集計データとしてあり得ないデータを排除するための条件である。
次いで、ステップS12では、集計データ入力部14が、操作者からの集計データの入力を受け付け、該集計データを集計DB32に格納する。集計データは、図3(a)のような国勢調査等により得られる都市αの全世帯の世帯主年齢や世帯年収などを集計したデータである。
次いで、ステップS14では、非集計データ入力部16が、操作者からの非集計データの入力を受け付け、該非集計データ(頂点座標データ)を頂点座標DB34に格納する。非集計データ(頂点座標データ)は、図3(b)のような、アンケート等により得られる都市αの全世帯のうちの一部(数%程度)の世帯の世帯主年齢や世帯年収などのデータである。
次いで、ステップS16では、単体複体生成部18が、集計データの区間長が1になるように属性値空間を正規化する。例えば、図8に示すように横軸の属性として年齢(世帯主年齢)、縦軸の属性として年収(世帯年収)を設定したとする。この場合、図9に示すように、縦軸及び横軸の属性それぞれについて、集計データの1区間の長さが1に揃うようにすべての非集計データを正規化する。なお、本処理は、次に行われるRips複体の構築(S18)において、すべての属性を平等に考慮して近傍点を決めるために必要な処理である。すなわち、この正規化処理なしでは、属性によって値の範囲が大きく異なるため、範囲の小さい属性(図8の例では年齢)のみによって近傍点が決まってしまうからである。
次いで、ステップS18では、単体複体生成部18が、Rips複体を構築する。具体的には、単体複体生成部18は、非集計データの各点(頂点)xに対して、xから距離1以下にある点(図10(a)において太線で繋がれた点)の集合を求め、それを単体として単体複体を作る。この場合の単体複体は、図10(b)に示す、孤立点、太線、黒塗りの三角形すべてを合わせて1つの図形としてみなしたものである。このように一定距離内にある点の集合を単体とみなすことにより構築された単体複体は、一般にRips複体とよばれる。
次いで、ステップS20では、分布推定部20が、分布推定処理のサブルーチンを実行する。このステップS20においては、図6のフローチャートに沿った処理を実行する。
図6の処理では、まず、ステップS30において、分布推定部20が、Rips複体の各頂点について、星状近傍を求める。具体的には、分布推定部20は、図11(a)にハッチングを付して示すようにRips複体の1つの頂点(非集計データ)xを特定し、頂点xと辺で結ばれた頂点y(図11(b)の頂点y1,y2,y3,y4)の集合を星状近傍として求める。なお、頂点xの星状近傍には頂点x自身も含まれるものとする。星状近傍の頂点の情報は、図4(a)の頂点接続データとして、頂点接続DB36に格納される。分布推定部20は、この処理をすべての頂点について、実行する。
次いで、ステップS32では、分布推定部20が、各頂点の分布について、星状近傍点を学習データとして分布パラメータを最尤推定する。具体的には、分布推定部20は、図12に示すように、Rips複体の1つの頂点xを特定し、該頂点xに対して、何らかの確率モデル(例えば正規分布)を割り当て、そのパラメータθを星状近傍から最尤推定する。なお、最尤推定の方法は、使用する確率モデルでの標準的な方法に従う。この場合の確率分布は、例えば、図12において破線で表された形状の正規分布となる。この確率分布のパラメータθは、図4(b)のような確率分布データとして確率分布DB38に格納される。分布推定部20は、この処理をすべての頂点について実行する。
次いで、ステップS34では、分布推定部20が、各頂点の選択確率を設定する。ここで、各頂点の選択確率とは、後述するステップS40(図7)において頂点を選択する際に用いる値である。本実施形態では、都市αの全世帯を図13の各頂点に割り振った場合に、世帯数が多い頂点ほど選択確率が大きくなるように設定される。
具体的には、図13(a)においてハッチングを付して示す頂点xは、ハッチングを付して示す範囲Qに含まれている。範囲Qは、集計データによると、年齢(世帯主年齢)に関して1000世帯中300世帯が含まれる範囲であり、年収(世帯年収)に関して1000世帯中200世帯が含まれる範囲である。そして、この範囲Qには、頂点xを含め3つの非集計データが存在している。
このとき、頂点xの重みVxは、
Vx=(300/1000)×(200/1000)÷3=0.3×0.2÷3=0.02 …(1)
となる。
一方、図13(b)においてハッチングを付して示す頂点xは、ハッチングを付して示す範囲Rに含まれている。範囲Rは、集計データによると、年齢(世帯主年齢)に関して1000世帯中400世帯が含まれる範囲であり、年収(世帯年収)に関して1000世帯中200世帯が含まれる範囲である。そして、この範囲Rには、頂点xのみ非集計データが存在している。
このとき、頂点xの重みVxは、
Vx=(400/1000)×(200/1000)=0.4×0.2=0.08 …(2)
となる。
なお、分布推定部20は、上記のような重みの計算をすべての頂点に対して実行する。そして、各頂点の重みVxに比例する値が各頂点の選択確率となる。すなわち、図13(a)の頂点xと、図13(b)の頂点xとでは、後者のほうがステップS40において選択される確率が4倍高いことを意味している。なお、選択確率の算出方法は、上記方法に限らず、その他の方法を採用してもよい。
以上の処理により、図6の全処理が終了し、図5のステップS22に移行する。
ステップS22に移行すると、仮想データ生成部22が、仮想データ生成処理のサブルーチンを実行する。このステップS22では、図7のフローチャートに沿った処理が実行される。
図7の処理では、まず、ステップS40において、仮想データ生成部22は、近傍リストから頂点をランダムに選択してゆき、単体を選択する。具体的には、仮想データ生成部22は、まず、全頂点からランダムに頂点xを選ぶ。なお、ここでは、図14(a)においてハッチングを付して示す頂点が選ばれたものとする。次いで、仮想データ生成部22は、頂点xの星状近傍から頂点xを除いた集合を近傍リストとする。なお、近傍リストには、図11(b)の頂点y1〜y4が含まれる。そして、仮想データ生成部22は、近傍リストからランダムに頂点yを選ぶとともに、近傍リストから頂点yの星状近傍以外を除いた集合を新たな近傍リストとする。仮想データ生成部22は、この処理を近傍リストが空になるまで繰り返し、頂点x,y,…で張られる単体を選ぶ。なお、図14(a)の頂点xの場合、図14(b)の頂点y、図14(c)の頂点zが選ばれた段階で近傍リストが空になる。なお、頂点x,y,…を選択する際には、仮想データ生成部22は、ステップS34で設定された各頂点の選択確率を用いる。
次いで、ステップS42では、仮想データ生成部22が、選択した単体上の一様乱数を生成する。ここでは、仮想データ生成部22は、ステップS40において選択した単体(図14(c)の単体xyzとする)上の一様分布に従ってランダムに1点を生成する。この場合、生成する点wを単体の頂点x,y,zの線形和で表す。なお、a,b,cは係数である。
w=ax+by+cz …(3)
なお、単体の頂点の数は3つとは限らないため、ステップS40において選ばれた単体の頂点の数に応じて、上式(3)の項数は異なるものとする。このステップS42において生成された点wは、図15(a)に示す位置にあるものとする。なお、このステップで用いられている頂点x,y,zが第1の属性値及び第2の属性値を意味し、点wが第3の属性値を意味する。
次いで、ステップS44では、仮想データ生成部22は、生成した乱数(点w)で頂点分布のパラメータを結合する。この場合、仮想データ生成部22は、ステップS32で単体の頂点x,y,zに割当てた分布パラメータθx,θy,θzと、上式(3)の係数a,b,cと、を用いて、次式(4)より、点wの分布パラメータθwを決める。
θw=aθx+bθy+cθz …(4)
なお、単体の頂点の数及びその分布パラメータの数は3つとは限らないため、ステップS40において選ばれた単体の頂点の数に応じて上式(4)の項数は異なるものとする。
なお、本ステップS44において得られた分布パラメータ(確率分布)は、例えば、図15(b)において破線で表される形状の正規分布となる。
次いで、ステップS46では、仮想データ生成部22は、結合した分布(ステップS44において決められた点wの分布パラメータ)から仮想データを生成する。この場合、仮想データ生成部22は、ステップS44において得られた確率分布に基づいて、仮想的な非集計データを生成する。
次いで、ステップS48では、仮想データ生成部22は、仮想データが制約条件を満たすか否かを判断する。すなわち、仮想データ生成部22は、ステップS46において生成された仮想的な非集計データが、ステップS10(図5)で受信した制約条件と合致しているか否かを判断する。このステップS48の判断が否定された場合、すなわち、生成された仮想的な非集計データが制約条件を満たさない場合には、仮想データ生成部22は、その仮想的な非集計データを破棄してステップS40に戻り、ステップS40〜S46を実行することで、新たな仮想的な非集計データを生成する。一方、ステップS48の判断が肯定された場合、ステップS50に移行する。
ステップS50に移行すると、仮想データ生成部22は、ステップS46で生成された仮想データを仮想データ出力部24に対して出力する。次いで、ステップS52では、仮想データ生成部22が、出力した仮想データ数が集計世帯数(都市αの全世帯数)と一致したか否かを判断する。このステップS52の判断が否定された場合には、ステップS40に戻り、上記処理を繰り返す。一方、ステップS52の判断が肯定された場合、すなわち都市αの全世帯数に相当する数の仮想データ(仮想的な非集計データ)を生成できた場合には、図5のステップS24に戻る。図5のステップS24では、仮想データ出力部24が、都市αの全世帯数に相当する数の仮想データを表示部93に表示するなどして出力する。
ステップS24の処理が行われた後は、図5の全処理を終了する。
なお、上記処理においては、2次元(2つの属性を有する)の属性値空間における処理について説明したが、これに限らず、3次元以上の属性値空間においても、上記と同様の処理を行うことが可能である。
これまでの説明からわかるように、非集計データの入力を受け付ける非集計データ入力部16、非集計データからRips複体を生成する単体複体生成部18及びRips複体の各頂点の星状近傍を求める分布推定部20、及び各頂点の星状近傍(近傍リスト)から単体を選択する仮想データ生成部22により、属性値空間に含まれる複数の非集計データを受け付ける受付部としての機能が実現されている。また、ステップS32を実行する分布推定部20及びステップS44を実行する仮想データ生成部22により、複数の非集計データ(頂点)及び複数の頂点により規定される範囲に含まれる点の確率分布を各頂点及び点に対応づける対応付け部としての機能が実現されている。また、ステップS42及びステップS46を実行する仮想データ生成部22により、生成部及び形成部としての機能が実現されている。更に、ステップS48を実行する仮想データ生成部22により、除外部としての機能が実現されている。
以上、詳細に説明したように、本実施形態によると、仮想データ生成装置10は、属性値空間に含まれる複数の属性値(非集計データ)を選択し(S40)、複数の非集計データ(単体の頂点x,y,z)により規定される範囲に存在する属性値(点w)を生成し(S42)、複数の非集計データ(単体の頂点x,y,z)及び点wのそれぞれに確率分布を対応付け(S32、S44)、属性値空間における複数の非集計データ(単体の頂点x,y,z)及び点wの位置のそれぞれの近傍に、対応付けられた確率分布に従った分布となるように仮想的な非集計データを生成する(S46)。このように、本実施形態では、複数の非集計データ(単体の頂点x,y,z)により規定される範囲に存在する属性値(点w)における確率分布に従って、仮想的な非集計データを生成するので、入力された非集計データの傾向や、単体のノイズによる揺らぎ等を考慮して、適切な仮想データ(仮想的な非集計データ)の生成を実現することができる。これにより、より現実に則した仮想的な非集計データを得られるので、該仮想的な非集計データを用いた都市マイクロシミュレーションにおける予測精度(シミュレーション精度)を向上することが可能である。また、仮想的な非集計データは、個人情報を含まないものであるため、公開等してもプライバシーを侵害することがないという利点がある。
また、本実施形態では、入力された複数の非集計データから単体複体(Rips複体)を構築し(S18)、単体複体の所定の頂点に位置する非集計データ及びその星状近傍の非集計データにより規定される範囲内の点を一様分布に従って求め、該点を点wとする。これにより、一般に高次元空間において複雑な形状に分布する非集計データの特性を考慮して、適切な仮想データを生成することができる。
また、本実施形態では、仮想的な非集計データが制約条件を満たしていなかった場合に当該仮想的な非集計データを破棄し、出力しないようにしているので、15歳以下で婚姻している、15歳以下で運転免許を取得しているなど、通常あり得ない非集計データを排除することができる。この場合、非集計データの手作業での確認・修正作業を軽減することができる。
なお、上記実施形態では、都市における各世帯の非集計データを仮想的に生成する場合について説明したが、これに限られるものではない。すなわち、その他の非集計データ(企業や交通に関する非集計データ)を仮想的に生成するようにしても良い。
なお、上記実施形態では、仮想データ生成装置10がPCなどの端末である場合について説明したが、これに限られるものではない。例えば、端末とネットワーク等により接続されたサーバであってもよい。この場合、端末から入力された集計データや非集計データに基づいて、サーバが仮想的な非集計データを生成し、端末に出力するようにすればよい。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体(ただし、搬送波は除く)に記録しておくことができる。
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD−ROM(Compact Disc Read Only Memory)などの可搬型記録媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
なお、以上の実施形態の説明に関して、更に以下の付記を開示する。
(付記1) コンピュータが、
属性値空間に含まれる第1の属性値及び第2の属性値を受け付け、
前記第1の属性値と前記第2の属性値との間の属性値である第3の属性値を生成し、
前記第1の属性値、前記第2の属性値、前記第3の属性値のそれぞれに分布情報を対応付け、
前記属性値空間における前記第1の属性値の位置、前記第2の属性値の位置、前記第3の属性値の位置のそれぞれの近傍に、対応付けられた分布情報に従った分布となるように属性値群を形成する、
処理を実行することを特徴とする属性値生成方法。
(付記2) 前記受け付ける処理では、入力された複数の属性値から単体複体を構築し、前記単体複体の所定の頂点に位置する属性値及びその近傍の属性値を前記第1の属性値及び前記第2の属性値として受け付け、
前記第3の属性値を生成する処理では、一様分布に従って前記第1の属性値と前記第2の属性値との間の前記第3の属性値を生成する、ことを特徴とする付記1に記載の属性値生成方法。
(付記3) 前記属性値群を形成する処理で形成された属性値群から、予め定められた除外条件に該当する属性値を除外する、処理を前記コンピュータが実行することを特徴とする付記1又は2に記載の属性値生成方法。
(付記4) コンピュータが、
属性値空間に含まれる複数の属性値を受け付け、
前記複数の属性値により規定される範囲内の属性値である新たな属性値を生成し、
前記複数の属性値それぞれと前記新たな属性値に分布情報を対応付け、
前記属性値空間における前記複数の属性値それぞれと前記新たな属性値の位置のそれぞれの近傍に、対応付けられた分布情報に従った分布となるように属性値群を形成する、
処理を実行することを特徴とする属性値生成方法。
(付記5) コンピュータに、
属性値空間に含まれる第1の属性値及び第2の属性値を受け付け、
前記第1の属性値と前記第2の属性値との間の属性値である第3の属性値を生成し、
前記第1の属性値、前記第2の属性値、前記第3の属性値のそれぞれに分布情報を対応付け、
前記属性値空間における前記第1の属性値の位置、前記第2の属性値の位置、前記第3の属性値の位置のそれぞれの近傍に、対応付けられた分布情報に従った分布となるように属性値群を形成する、
処理を実行させることを特徴とする属性値生成プログラム。
(付記6) 前記受け付ける処理では、入力された複数の属性値から単体複体を構築し、前記単体複体の所定の頂点に位置する属性値及びその近傍の属性値を前記第1の属性値及び前記第2の属性値として受け付け、
前記第3の属性値を生成する処理では、一様分布に従って前記第1の属性値と前記第2の属性値との間の前記第3の属性値を生成する、ことを特徴とする付記5に記載の属性値生成プログラム。
(付記7) 前記属性値群を形成する処理で形成された属性値群から、予め定められた除外条件に該当する属性値を除外する、処理を前記コンピュータに更に実行させることを特徴とする付記5又は6に記載の属性値生成プログラム。
(付記8) コンピュータに、
属性値空間に含まれる複数の属性値を受け付け、
前記複数の属性値により規定される範囲内の属性値である新たな属性値を生成し、
前記複数の属性値それぞれと前記新たな属性値に分布情報を対応付け、
前記属性値空間における前記複数の属性値それぞれと前記新たな属性値の位置のそれぞれの近傍に、対応付けられた分布情報に従った分布となるように属性値群を形成する、
処理を実行させることを特徴とする属性値生成プログラム。
(付記9) 属性値空間に含まれる第1の属性値及び第2の属性値を受け付ける受付部と、
前記第1の属性値と前記第2の属性値との間の属性値である第3の属性値を生成する生成部と、
前記第1の属性値、前記第2の属性値、前記第3の属性値のそれぞれに分布情報を対応付ける対応付け部と、
前記属性値空間における前記第1の属性値の位置、前記第2の属性値の位置、前記第3の属性値の位置のそれぞれの近傍に、対応付けられた分布情報に従った分布となるように属性値群を形成する形成部と、
を備える属性値生成装置。
(付記10) 前記受付部は、入力された複数の属性値から単体複体を構築し、前記単体複体の所定の頂点に位置する属性値及びその近傍の属性値を前記第1の属性値及び前記第2の属性値として受け付け、
前記生成部は、一様分布に従って前記第1の属性値と前記第2の属性値との間の前記第3の属性値を生成する、ことを特徴とする付記9に記載の属性値生成装置。
(付記11) 前記形成部が形成した属性値群から、予め定められた除外条件に該当する属性値を除外する除外部を更に備える付記9又は10に記載の属性値生成装置。
(付記12) 属性値空間に含まれる複数の属性値を受け付ける受付部と、
前記複数の属性値により規定される範囲内の属性値である新たな属性値を生成する生成部と、
前記複数の属性値それぞれと前記新たな属性値に分布情報を対応付ける対応付け部と、
前記属性値空間における前記複数の属性値それぞれと前記新たな属性値の位置のそれぞれの近傍に、対応付けられた分布情報に従った分布となるように属性値群を形成する形成部と、
を備える属性値生成装置。
10 仮想データ生成装置(属性値生成装置)
16 非集計データ入力部(受付部の一部)
18 単体複体生成部(受付部の一部)
20 分布推定部(受付部の一部、対応付け部の一部)
22 仮想データ生成部(受付部の一部、生成部、対応付け部の一部、形成部、除外部)

Claims (8)

  1. コンピュータが、
    属性値空間に含まれる第1の属性値及び第2の属性値を受け付け、
    前記第1の属性値と前記第2の属性値との間の属性値である第3の属性値を生成し、
    前記第1の属性値、前記第2の属性値、前記第3の属性値のそれぞれに分布情報を対応付け、
    前記属性値空間における前記第1の属性値の位置、前記第2の属性値の位置、前記第3の属性値の位置のそれぞれの近傍に、対応付けられた分布情報に従った分布となるように属性値群を形成する、
    処理を実行することを特徴とする属性値生成方法。
  2. 前記受け付ける処理では、入力された複数の属性値から単体複体を構築し、前記単体複体の所定の頂点に位置する属性値及びその近傍の属性値を前記第1の属性値及び前記第2の属性値として受け付け、
    前記第3の属性値を生成する処理では、一様分布に従って前記第1の属性値と前記第2の属性値との間の前記第3の属性値を生成する、ことを特徴とする請求項1に記載の属性値生成方法。
  3. 前記属性値群を形成する処理で形成された属性値群から、予め定められた除外条件に該当する属性値を除外する、処理を前記コンピュータが実行することを特徴とする請求項1又は2に記載の属性値生成方法。
  4. コンピュータが、
    属性値空間に含まれる複数の属性値を受け付け、
    前記複数の属性値により規定される範囲内の属性値である新たな属性値を生成し、
    前記複数の属性値それぞれと前記新たな属性値に分布情報を対応付け、
    前記属性値空間における前記複数の属性値それぞれと前記新たな属性値の位置のそれぞれの近傍に、対応付けられた分布情報に従った分布となるように属性値群を形成する、
    処理を実行することを特徴とする属性値生成方法。
  5. コンピュータに、
    属性値空間に含まれる第1の属性値及び第2の属性値を受け付け、
    前記第1の属性値と前記第2の属性値との間の属性値である第3の属性値を生成し、
    前記第1の属性値、前記第2の属性値、前記第3の属性値のそれぞれに分布情報を対応付け、
    前記属性値空間における前記第1の属性値の位置、前記第2の属性値の位置、前記第3の属性値の位置のそれぞれの近傍に、対応付けられた分布情報に従った分布となるように属性値群を形成する、
    処理を実行させることを特徴とする属性値生成プログラム。
  6. コンピュータに、
    属性値空間に含まれる複数の属性値を受け付け、
    前記複数の属性値により規定される範囲内の属性値である新たな属性値を生成し、
    前記複数の属性値それぞれと前記新たな属性値に分布情報を対応付け、
    前記属性値空間における前記複数の属性値それぞれと前記新たな属性値の位置のそれぞれの近傍に、対応付けられた分布情報に従った分布となるように属性値群を形成する、
    処理を実行させることを特徴とする属性値生成プログラム。
  7. 属性値空間に含まれる第1の属性値及び第2の属性値を受け付ける受付部と、
    前記第1の属性値と前記第2の属性値との間の属性値である第3の属性値を生成する生成部と、
    前記第1の属性値、前記第2の属性値、前記第3の属性値のそれぞれに分布情報を対応付ける対応付け部と、
    前記属性値空間における前記第1の属性値の位置、前記第2の属性値の位置、前記第3の属性値の位置のそれぞれの近傍に、対応付けられた分布情報に従った分布となるように属性値群を形成する形成部と、
    を備える属性値生成装置。
  8. 属性値空間に含まれる複数の属性値を受け付ける受付部と、
    前記複数の属性値により規定される範囲内の属性値である新たな属性値を生成する生成部と、
    前記複数の属性値それぞれと前記新たな属性値に分布情報を対応付ける対応付け部と、
    前記属性値空間における前記複数の属性値それぞれと前記新たな属性値の位置のそれぞれの近傍に、対応付けられた分布情報に従った分布となるように属性値群を形成する形成部と、
    を備える属性値生成装置。
JP2014141810A 2014-07-09 2014-07-09 属性値生成方法、属性値生成プログラム及び属性値生成装置 Expired - Fee Related JP6318929B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014141810A JP6318929B2 (ja) 2014-07-09 2014-07-09 属性値生成方法、属性値生成プログラム及び属性値生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014141810A JP6318929B2 (ja) 2014-07-09 2014-07-09 属性値生成方法、属性値生成プログラム及び属性値生成装置

Publications (2)

Publication Number Publication Date
JP2016018460A JP2016018460A (ja) 2016-02-01
JP6318929B2 true JP6318929B2 (ja) 2018-05-09

Family

ID=55233622

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014141810A Expired - Fee Related JP6318929B2 (ja) 2014-07-09 2014-07-09 属性値生成方法、属性値生成プログラム及び属性値生成装置

Country Status (1)

Country Link
JP (1) JP6318929B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8438126B2 (en) * 2007-07-13 2013-05-07 The Regents Of The University Of California Targeted maximum likelihood estimation
JP5321874B2 (ja) * 2008-01-17 2013-10-23 富士通株式会社 情報処理装置、サーバ装置、およびプログラム
WO2011052473A1 (ja) * 2009-10-30 2011-05-05 株式会社エヌ・ティ・ティ・ドコモ 管理サーバ、人口情報算出管理サーバ、不在エリア管理方法および人口情報算出方法
JP5806991B2 (ja) * 2012-09-13 2015-11-10 日本電信電話株式会社 位置情報データベース生成装置及び方法及びプログラム
JP5809124B2 (ja) * 2012-10-03 2015-11-10 株式会社コスモスイニシア 情報処理システム、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
JP2016018460A (ja) 2016-02-01

Similar Documents

Publication Publication Date Title
US20210174264A1 (en) Training tree-based machine-learning modeling algorithms for predicting outputs and generating explanatory data
US20170111245A1 (en) Process traces clustering: a heterogeneous information network approach
JP4937608B2 (ja) 指標推計装置、指標推計方法、及び指標推計プログラム
JPWO2017159403A1 (ja) 予測システム、方法およびプログラム
JP6311851B2 (ja) 共クラスタリングシステム、方法およびプログラム
EP3819854A1 (en) Quotation method executed by computer, quotation device, electronic device and storage medium
JP2019091445A5 (ja)
US20150077417A1 (en) Methods and Software for Volume-Centric Shape Abstraction and Simplification of a 3D Digital Model
KR20100002097A (ko) 특성이 비슷하고 형상이 서로 다른 설계 형상을 분류ㆍ표시하는 장치, 방법 및 기록 매체
Al-Shamri et al. Fuzzy-weighted similarity measures for memory-based collaborative recommender systems
JP2017146888A (ja) 設計支援装置及び方法及びプログラム
US20230419134A1 (en) Methods of explaining an individual predictions made by predictive processes and/or predictive models
JP2013097723A (ja) テキスト要約装置、方法及びプログラム
JP2020129222A (ja) モデル出力プログラム、モデル出力方法及びモデル出力装置
JP5432935B2 (ja) 予測器選択装置、予測器選択方法、予測器選択プログラム
Fränti et al. Averaging GPS segments competition 2019
CN103782290A (zh) 建议值的生成
JP2009087235A (ja) モデル構築装置並びにモデル構築のための方法およびプログラム
JP6318929B2 (ja) 属性値生成方法、属性値生成プログラム及び属性値生成装置
Ribas et al. Assessing cloud computing SaaS adoption for enterprise applications using a Petri net MCDM framework
JP5835802B2 (ja) 購買予測装置、方法、及びプログラム
Bauckhage A Purely Geometric Approach to Non-Negative Matrix Factorization.
JP2014115911A (ja) 情報推薦装置、情報推薦方法、及び情報推薦プログラム
JP2006318013A (ja) 評価装置及びそのコンピュータプログラム
US10592585B2 (en) Stochastic network traffic modeling

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170406

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180306

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180319

R150 Certificate of patent or registration of utility model

Ref document number: 6318929

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees