JP6365064B2 - Population generation program, population generation method, and population generation apparatus - Google Patents

Population generation program, population generation method, and population generation apparatus Download PDF

Info

Publication number
JP6365064B2
JP6365064B2 JP2014152015A JP2014152015A JP6365064B2 JP 6365064 B2 JP6365064 B2 JP 6365064B2 JP 2014152015 A JP2014152015 A JP 2014152015A JP 2014152015 A JP2014152015 A JP 2014152015A JP 6365064 B2 JP6365064 B2 JP 6365064B2
Authority
JP
Japan
Prior art keywords
point
population
points
neighboring
sample set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014152015A
Other languages
Japanese (ja)
Other versions
JP2016031543A (en
Inventor
直希 濱田
直希 濱田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014152015A priority Critical patent/JP6365064B2/en
Publication of JP2016031543A publication Critical patent/JP2016031543A/en
Application granted granted Critical
Publication of JP6365064B2 publication Critical patent/JP6365064B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、母集団生成プログラム等に関する。   The present invention relates to a population generation program and the like.

近年、計算機の性能向上により、エージェントシミュレーションが都市計画、交通、エネルギー、防災等の各種の公共分野で利用されている。例えば、エージェントシミュレーションを利用することで、人口推移や都市の維持に最適な人口内訳を知ることができる。   In recent years, agent simulation has been used in various public fields such as city planning, transportation, energy, disaster prevention, etc., due to improved computer performance. For example, by using agent simulation, it is possible to know the population breakdown that is optimal for population transition and city maintenance.

ここで、上記のような分野のエージェントシミュレーションを利用する場合には、現実に即した初期条件の実測データをシミュレータに与えることが望ましい。しかし、係る実測データは、調査コストやプライバシーの観点から、入手することが難しい。   Here, when using the agent simulation in the field as described above, it is desirable to provide the simulator with actually measured data of initial conditions that are realistic. However, it is difficult to obtain the actual measurement data from the viewpoint of survey cost and privacy.

このため、実測データを入手する代わりに、対象の母集団から少数のサンプルを入手し、カーネル密度推定を利用し、少数のサンプルから母集団全体を近似的に再構築する従来技術がある。このカーネル密度推定では、バンド幅行列とよばれるパラメータの最適値を探索し、探索したパラメータを用いて、複雑な分布を再現する。   For this reason, there is a conventional technique in which instead of obtaining actual measurement data, a small number of samples are obtained from a target population, and kernel density estimation is used to approximately reconstruct the entire population from a small number of samples. In this kernel density estimation, an optimum value of a parameter called a bandwidth matrix is searched, and a complex distribution is reproduced using the searched parameter.

Dorin Comaniciu「An Algorithm for Data-Driven Bandwidth Selection」IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL.25, NO.2, FEBRUARY 2003Dorin Comaniciu `` An Algorithm for Data-Driven Bandwidth Selection '' IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL.25, NO.2, FEBRUARY 2003

しかしながら、上述した従来技術では、母集団を計算するための計算量が大きくなるという問題がある。   However, the above-described conventional technique has a problem that the amount of calculation for calculating the population increases.

上記のカーネル密度推定は、取り扱う次元が低次元の場合には複雑な分布を表現できるが、高次元の場合には、バンド幅行列の最適値を計算するまでの計算量が大きくなってしまう。   The above kernel density estimation can express a complex distribution when the dimension to be handled is low, but in the case of a high dimension, the amount of calculation until the optimum value of the bandwidth matrix is calculated becomes large.

1つの側面では、計算量が大きくなることを防いで、少数のサンプルから母集団を再構築することができる母集団生成プログラム、母集団生成方法および母集団生成装置を提供することを目的とする。   In one aspect, an object of the present invention is to provide a population generation program, a population generation method, and a population generation device capable of preventing a large amount of calculation and reconstructing a population from a small number of samples. .

第1の案では、コンピュータに下記の処理を実行させる。コンピュータに、サンプル集合に含まれる複数の点について、前記点の近傍に存在する近傍点をそれぞれ特定する処理を実行させる。コンピュータに、前記サンプル集合に含まれる点と前記点に対応する近傍点とを選択し、選択した点および近傍点の分布に基づいて新たな点を生成する処理を実行させる。コンピュータに、生成した新たな点を母集団に追加する処理を実行させる。   In the first plan, the computer executes the following processing. A computer is caused to execute a process of specifying neighboring points existing in the vicinity of the points for a plurality of points included in the sample set. The computer is caused to select a point included in the sample set and a neighboring point corresponding to the point, and execute a process of generating a new point based on the selected point and a distribution of neighboring points. The computer is caused to execute a process of adding the generated new point to the population.

本発明の1実施態様によれば、計算量が大きくなることを防いで、少数のサンプルから母集団を再構築することができるという効果を奏する。   According to one embodiment of the present invention, it is possible to prevent a calculation amount from increasing and to reconstruct a population from a small number of samples.

図1は、本実施例に係る母集団生成装置の構成を示す機能ブロック図である。FIG. 1 is a functional block diagram illustrating the configuration of the population generation apparatus according to the present embodiment. 図2は、サンプル集合情報のデータ構造の一例を示す図である。FIG. 2 is a diagram illustrating an example of a data structure of the sample set information. 図3は、k近傍情報のデータ構造の一例を示す図である。FIG. 3 is a diagram illustrating an example of a data structure of k neighborhood information. 図4は、白色化サンプル集合のデータ構造の一例を示す図である。FIG. 4 is a diagram illustrating an example of the data structure of the whitened sample set. 図5は、近傍点を特定する処理を説明するための図である。FIG. 5 is a diagram for explaining the process of specifying the neighboring points. 図6は、生成部の処理を説明するための図である。FIG. 6 is a diagram for explaining the processing of the generation unit. 図7は、母集団集合情報のデータ構造の一例を示す図である。FIG. 7 is a diagram illustrating an example of a data structure of the population set information. 図8は、本実施例に係る母集団生成装置の処理手順を示すフローチャートである。FIG. 8 is a flowchart illustrating the processing procedure of the population generation apparatus according to the present embodiment. 図9は、生成部が、新しい点を生成するその他の処理の一例を示す図である。FIG. 9 is a diagram illustrating an example of another process in which the generation unit generates a new point. 図10は、母集団生成プログラムを実行するコンピュータの一例を示す図である。FIG. 10 is a diagram illustrating an example of a computer that executes a population generation program.

以下に、本願の開示する母集団生成プログラム、母集団生成方法および母集団生成装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。   Hereinafter, embodiments of a population generation program, a population generation method, and a population generation device disclosed in the present application will be described in detail with reference to the drawings. Note that the present invention is not limited to the embodiments.

本実施例に係る母集団生成装置の一例について説明する。図1は、本実施例に係る母集団生成装置の構成を示す機能ブロック図である。図1に示すように、この母集団生成装置100は、通信部110、入力部120、表示部130、記憶部140、制御部150を有する。   An example of the population generation apparatus according to the present embodiment will be described. FIG. 1 is a functional block diagram illustrating the configuration of the population generation apparatus according to the present embodiment. As illustrated in FIG. 1, the population generation apparatus 100 includes a communication unit 110, an input unit 120, a display unit 130, a storage unit 140, and a control unit 150.

通信部110は、ネットワークを介して他の装置とデータ通信を実行する処理部である。例えば、通信部110は、通信装置等に対応する。例えば、通信部110は、後述するパラメータ情報141、サンプル集合情報142を、他の装置から受信した場合には、受信したパラメータ情報141、サンプル集合情報142を、制御部150に出力する。   The communication unit 110 is a processing unit that performs data communication with other devices via a network. For example, the communication unit 110 corresponds to a communication device or the like. For example, the communication unit 110 outputs the received parameter information 141 and sample set information 142 to the control unit 150 when receiving parameter information 141 and sample set information 142 described later from another apparatus.

入力部120は、各種の情報を母集団生成装置100に入力する入力装置である。例えば、入力部120は、キーボードやマウス、タッチパネル等に対応する。例えば、利用者は、入力部120を操作して、パラメータ情報141、サンプル集合情報142を入力してもよい。   The input unit 120 is an input device that inputs various types of information to the population generation device 100. For example, the input unit 120 corresponds to a keyboard, a mouse, a touch panel, or the like. For example, the user may input the parameter information 141 and the sample set information 142 by operating the input unit 120.

表示部130は、制御部150から出力される各種データを表示する表示装置である。例えば、表示部130は、液晶ディスプレイやタッチパネル等に対応する。   The display unit 130 is a display device that displays various data output from the control unit 150. For example, the display unit 130 corresponds to a liquid crystal display, a touch panel, or the like.

記憶部140は、パラメータ情報141、サンプル集合情報142、k近傍情報143、母集団情報144を有する。記憶部140は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子などの記憶装置に対応する。   The storage unit 140 includes parameter information 141, sample set information 142, k neighborhood information 143, and population information 144. The storage unit 140 corresponds to a storage device such as a semiconductor memory element such as a random access memory (RAM), a read only memory (ROM), and a flash memory.

パラメータ情報141は、「近傍サイズk」と、「出力サイズl」と、「抽出点数m」とを有する。近傍サイズkは、サンプル集合情報142のある点のk近傍を求める場合のサイズを指定するパラメータである。出力サイズlは、母集団情報144に含ませる点の数を指定するパラメータである。「抽出点数m」は、サンプル集合情報142に含まれる点と、この点の近傍点を抽出して、後述する交叉カーネルに与える場合に、抽出する点の数を指定するパラメータである。   The parameter information 141 includes “neighbor size k”, “output size l”, and “number of extraction points m”. The neighborhood size k is a parameter for designating the size when the k neighborhood of a certain point in the sample set information 142 is obtained. The output size l is a parameter that specifies the number of points to be included in the population information 144. The “number of extraction points m” is a parameter that specifies the number of points to be extracted when the points included in the sample set information 142 and the points near the points are extracted and given to the crossing kernel described later.

サンプル集合情報142は、母集団に含まれる点の情報のうち、一部の点の情報に対応するサンプルである。図2は、サンプル集合情報のデータ構造の一例を示す図である。   The sample set information 142 is a sample corresponding to information on some points in the information on points included in the population. FIG. 2 is a diagram illustrating an example of a data structure of the sample set information.

図2に示す例において、横軸は属性「世帯主年齢」に対応する軸であり、縦軸は属性「世帯年収」に対応する軸である。また、各属性の値に対応して、各点x〜x15が配置される。図2に示す例では、説明の便宜上、2種類の属性に対応する2つの軸を示すが、このサンプル集合情報142は、2種類以上の属性に対応する軸を有する。サンプル集合情報142の各点x〜x15は、属性がn種類の場合には、n次元のベクトルで表される。 In the example shown in FIG. 2, the horizontal axis is an axis corresponding to the attribute “household age”, and the vertical axis is an axis corresponding to the attribute “household annual income”. Further, the points x 1 to x 15 are arranged corresponding to the values of the attributes. In the example shown in FIG. 2, for convenience of explanation, two axes corresponding to two types of attributes are shown, but this sample set information 142 has axes corresponding to two or more types of attributes. Each point x 1 to x 15 of the sample set information 142 is represented by an n-dimensional vector when there are n types of attributes.

k近傍情報143は、サンプル集合情報142の点と、この点の近傍に存在する近傍点との関係を示す情報である。図3は、k近傍情報のデータ構造の一例を示す図である。図3に示すように、このk近傍情報143は、点と、近傍点とを対応付ける。近傍点の数は、近傍サイズkにより指定される数となる。   The k-neighbor information 143 is information indicating a relationship between a point of the sample set information 142 and a neighboring point existing in the vicinity of this point. FIG. 3 is a diagram illustrating an example of a data structure of k neighborhood information. As shown in FIG. 3, the k neighborhood information 143 associates points with neighborhood points. The number of neighboring points is the number specified by the neighborhood size k.

母集団情報144は、サンプル集合情報142を基に生成される母集団の情報である。母集団情報144を生成する処理は後述する。   The population information 144 is population information generated based on the sample set information 142. The process for generating the population information 144 will be described later.

制御部150は、取得部151と、白色化処理部152と、特定部153と、生成部154と、逆白色化処理部155とを有する。制御部150は、例えば、ASIC(Application Specific Integrated Circuit)や、FPGA(Field Programmable Gate Array)などの集積装置に対応する。また、制御部150は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等の電子回路に対応する。   The control unit 150 includes an acquisition unit 151, a whitening processing unit 152, a specifying unit 153, a generation unit 154, and an inverse whitening processing unit 155. The control unit 150 corresponds to an integrated device such as an application specific integrated circuit (ASIC) or a field programmable gate array (FPGA). The control unit 150 corresponds to an electronic circuit such as a CPU (Central Processing Unit) or an MPU (Micro Processing Unit).

取得部151は、通信部110または入力部120から、パラメータ情報141およびサンプル集合情報142を取得する。取得部151は、パラメータ情報141およびサンプル集合情報142を、記憶部140に登録する。   The acquisition unit 151 acquires parameter information 141 and sample set information 142 from the communication unit 110 or the input unit 120. The acquisition unit 151 registers the parameter information 141 and the sample set information 142 in the storage unit 140.

白色化処理部152は、サンプル集合情報142に対して白色化処理を実行する処理部である。白色化処理部152は、白色化処理を行ったサンプル集合情報142を、特定部153に出力する。以下の説明では、白色化処理を行ったサンプル集合情報142を、白色化サンプル集合と表記する。   The whitening processing unit 152 is a processing unit that performs whitening processing on the sample set information 142. The whitening processing unit 152 outputs the sample set information 142 that has been subjected to whitening processing to the specifying unit 153. In the following description, the sample set information 142 that has been subjected to the whitening process is referred to as a whitened sample set.

ここで、白色化処理の一例について説明する。白色化処理部152は、サンプル集合情報142に含まれる点全体の平均ベクトルが0となり、かつ、点全体の共分散行列が単位行列となるように、サンプル集合情報142の各点の位置を調整する。   Here, an example of the whitening process will be described. The whitening processing unit 152 adjusts the position of each point in the sample set information 142 so that the average vector of the entire points included in the sample set information 142 becomes 0 and the covariance matrix of the entire points becomes a unit matrix. To do.

白色化処理部152が、サンプル集合情報142に含まれる点の平均ベクトルを0にする処理の一例について説明する。白色化処理部152は、サンプル集合情報142に含まれる点の平均ベクトルを計算し、各点のベクトルの値から平均ベクトルの値を減算することにより、サンプル集合情報142に含まれる点の平均ベクトルを0にする。   An example of processing in which the whitening processing unit 152 sets the average vector of points included in the sample set information 142 to 0 will be described. The whitening processing unit 152 calculates the average vector of the points included in the sample set information 142, and subtracts the average vector value from the vector value of each point, thereby calculating the average vector of the points included in the sample set information 142. Set to 0.

白色化処理部152が、サンプル集合情報142に含まれる点の共分散行列が単位行列となるように調整する処理の一例について説明する。白色化処理部152は、サンプル集合情報142の各点に対して、各点の間隔を拡大、縮小する処理、原点を中心に各点の位置を回転する処理を実行することで、各点のベクトルの値を更新し、更新後の各点のベクトルの値によって、共分散行列を算出する。白色化処理部152は、共分散行列が単位行列となる、各点の間隔、回転量を算出する。   An example of processing in which the whitening processing unit 152 performs adjustment so that the covariance matrix of points included in the sample set information 142 becomes a unit matrix will be described. The whitening processing unit 152 performs, for each point of the sample set information 142, processing for enlarging or reducing the interval between the points, and processing for rotating the position of each point around the origin. The vector value is updated, and the covariance matrix is calculated based on the updated vector value of each point. The whitening processing unit 152 calculates an interval between each point and a rotation amount in which the covariance matrix is a unit matrix.

白色化処理部152は、上述したサンプル集合情報142に含まれる点の平均ベクトルを0にする処理と、共分散行列を単位行列とする処理とを実行することで、式(1)を満たす白色化行列「T」を特定する。式(1)において、「S」は、サンプル集合情報142に含まれる点のベクトル値を並べたサンプル行列を示すものであり、「E[TS]」は、白色化サンプル行列TSの平均ベクトルを示すものであり、「Cov[TS]」は、白色化サンプル行列TSの共分散行列を示すものであり、「I」は、単位行列を示すものである。   The whitening processing unit 152 performs processing that sets the average vector of points included in the sample set information 142 described above to 0 and processing that uses a covariance matrix as a unit matrix, thereby satisfying Equation (1). Specify the quantization matrix “T”. In Expression (1), “S” indicates a sample matrix in which vector values of points included in the sample set information 142 are arranged, and “E [TS]” indicates an average vector of the whitened sample matrix TS. “Cov [TS]” indicates a covariance matrix of the whitened sample matrix TS, and “I” indicates a unit matrix.

E[TS]=0、 Cov[TS]=I・・・(1)   E [TS] = 0, Cov [TS] = I (1)

例えば、白色化処理部152は、サンプル集合情報142に含まれる各点のベクトルに、白色化行列Tを乗算することで、各点のベクトルの値を更新し、白色化サンプル集合を生成する。白色化処理部152は、生成した白色化サンプル集合の情報を、特定部153および生成部154に出力する。また、白色化処理部152は、白色化行列Tの情報を逆白色化処理部155に出力する。   For example, the whitening processing unit 152 multiplies the vector of each point included in the sample set information 142 by the whitening matrix T, thereby updating the value of the vector of each point to generate a whitened sample set. The whitening processing unit 152 outputs information on the generated whitened sample set to the specifying unit 153 and the generating unit 154. Further, the whitening processing unit 152 outputs information on the whitening matrix T to the inverse whitening processing unit 155.

図4は、白色化サンプル集合のデータ構造の一例を示す図である。図4に示す例において、横軸は白色化処理部152が出力した第1主成分A(一般に、前記世帯主年齢とは異なる)に対応する軸であり、縦軸は第2主成分A(一般に、前記世帯年収とは異なる)に対応する軸である。白色化処理部152により白色化処理されることで、図2に示す各点x〜x15の位置は、図4に示す各点x〜x15の位置に移動している。 FIG. 4 is a diagram illustrating an example of the data structure of the whitened sample set. In the example illustrated in FIG. 4, the horizontal axis is an axis corresponding to the first principal component A 1 (generally different from the household head age) output from the whitening processing unit 152, and the vertical axis is the second principal component A. 2 (generally different from the household annual income). The whitening unit 152 by being processed whitened, the position of each point x 1 ~x 15 shown in FIG. 2 is moved to the position of each point x 1 ~x 15 shown in FIG.

特定部153は、白色化サンプル集合の各点について、点の近傍に存在する近傍点を特定する処理部である。特定部153は、点と、この点に対応する近傍点との関係を、k近傍情報143に登録する。特定部153は、近傍点の数を、パラメータ情報141の近傍サイズkに対応させる。   The specifying unit 153 is a processing unit that specifies, for each point in the whitened sample set, neighboring points that exist in the vicinity of the point. The specifying unit 153 registers the relationship between the point and the neighboring point corresponding to this point in the k neighborhood information 143. The identifying unit 153 associates the number of neighboring points with the neighborhood size k of the parameter information 141.

特定部153の処理の一例について説明する。図5は、近傍点を特定する処理を説明するための図である。特定部153は、各点について、他の点とのユーグリッド距離をそれぞれ算出する。図5の各矢印が、ユーグリッド距離を示す。特定部153は、基準となる点とのユーグリッド距離が最も近いものからk番目までの点を、基準となる点の近傍点とする。k番目は、近傍サイズkに対応する。   An example of processing of the specifying unit 153 will be described. FIG. 5 is a diagram for explaining the process of specifying the neighboring points. The specifying unit 153 calculates the Eugrid distance from each point for each point. Each arrow in FIG. 5 indicates the Eugrid distance. The identifying unit 153 sets the points from the closest Eugrid distance to the reference point to the k-th point as the vicinity points of the reference point. The kth corresponds to the neighborhood size k.

例えば、基準点を点xとし、この点xとのユーグリッド距離が近い点を近い順に、x、x、x、x、・・・とする。また、近傍サイズkを「3」とする。この場合には、特定部153は、点xの近傍点を「x、x、x」とし、点と近傍点との関係を、k近傍情報143に登録する。特定部153は、他の点x〜x15についても、同様にして、近傍点を特定し、k近傍情報143に登録する。 For example, the reference point and the point x 1, sequentially point near the Euclidean distance is short between the point x 1, x 2, x 3 , x 4, x 5, and,. The neighborhood size k is set to “3”. In this case, the specifying unit 153 sets the neighborhood points of the point x 1 to “x 2 , x 3 , x 4 ”, and registers the relationship between the points and the neighborhood points in the k neighborhood information 143. The identifying unit 153 identifies neighboring points for the other points x 2 to x 15 in the same manner and registers them in the k neighboring information 143.

図1の説明に戻る。生成部154は、白色化サンプル集合に含まれる点とこの点に対応する近傍点とを選択し、選択した点および近傍点の分布に基づいて、新たな点を生成する処理部である。生成部154は、新たに生成した点を母集団情報144に追加し、母集団情報144に含まれる点の数が、出力サイズlとなるまで、上記処理を繰り返し実行する。生成部154は、新たに生成した点を加えた母集団情報144を、逆白色化処理部155に出力する。   Returning to the description of FIG. The generation unit 154 is a processing unit that selects a point included in the whitened sample set and a neighboring point corresponding to this point, and generates a new point based on the selected point and the distribution of the neighboring point. The generation unit 154 adds the newly generated points to the population information 144 and repeats the above processing until the number of points included in the population information 144 reaches the output size l. The generation unit 154 outputs the population information 144 to which the newly generated points are added to the inverse whitening processing unit 155.

ここで、生成部154が新たな点を生成する処理の一例について説明する。生成部154は、白色化サンプル集合に含まれる複数の点から、点xを一様ランダムに選択する。また、生成部154は、一様にランダム選択した点xに対応する近傍点から、一様ランダムに非復元抽出する。生成部154は、点と近傍点との数を、抽出点数mと同数とする。   Here, an example of a process in which the generation unit 154 generates a new point will be described. The generation unit 154 uniformly selects a point x from a plurality of points included in the whitened sample set. Further, the generation unit 154 performs non-restoration extraction uniformly and randomly from neighboring points corresponding to the point x that is uniformly and randomly selected. The generation unit 154 sets the number of points and neighboring points to be the same as the number of extraction points m.

例えば、生成部154は、白色化サンプル集合に含まれる複数の点x〜x15から、1点を一様ランダムに選択して、点xを選択した場合について説明する。生成部154は、k近傍情報143を参照し、点xに対応する近傍点を特定する。生成部154は、特定した近傍点から、「抽出点数m−1」個の点を一様ランダムに非復元抽出する。 For example, a case where the generation unit 154 selects one point uniformly and randomly from a plurality of points x 1 to x 15 included in the whitened sample set and selects the point x 1 will be described. Generator 154, refers to the k-nearest neighbor information 143, identifies a neighboring point corresponding to the point x 1. The generation unit 154 uniformly and non-restoratively extracts “number of extracted points m−1” points from the specified neighboring points.

以下の説明では、白色化サンプル集合から一様ランダムに抽出した点と、この点の近傍点から一様ランダムに非復元抽出した点とを適宜、抽出点と表記する。生成部154は、抽出点の数が、抽出点数mと同数となるように点を抽出する。   In the following description, a point extracted uniformly and randomly from the whitened sample set and a non-restored and extracted point uniformly from the vicinity of this point will be referred to as extracted points as appropriate. The generation unit 154 extracts points so that the number of extraction points is the same as the extraction point number m.

生成部154は、抽出点を交叉カーネルに与え、新たな点yを生成する。図6は、生成部の処理を説明するための図である。図6に示す例では、白色化サンプル集合から一様ランダムに抽出した点をx13とし、この点x13に基づいて特定した近傍点を点x、x、x12、x14とする。この近傍点から一様ランダムに非復元抽出された点を点x12、x14とする。生成部154は、抽出点x12、x13、x14を、交叉カーネルに与え、新たな点yを生成する。生成部154は、点yを、母集団情報144に加える。生成部154は、母集団情報144のサイズが、出力サイズlとなるまで、新たな点を生成する処理を繰り返し実行する。 The generation unit 154 gives the extracted point to the crossing kernel and generates a new point y. FIG. 6 is a diagram for explaining the processing of the generation unit. In the example shown in FIG. 6, the points extracted uniformly randomly from whitened sample set as x 13, to the neighboring point identified on the basis of this point x 13 a point x 4, x 6, x 12 , x 14 . Points x 12 and x 14 are points that have been non-restored and extracted uniformly and randomly from the neighboring points. The generation unit 154 gives the extraction points x 12 , x 13 , and x 14 to the crossing kernel, and generates a new point y 1 . The generation unit 154 adds the point y 1 to the population information 144. The generation unit 154 repeatedly executes a process of generating new points until the size of the population information 144 reaches the output size l.

生成部154が利用する交叉カーネルの一例について説明する。交叉カーネルは、式(2)によって定義される。式(2)において式(5)は、抽出点の平均ベクトルを示し、式(3)によって定義される。式(1)において、εは式(4)によって定義される。εは、式(4)に示すように、平均「0」、標準偏差「1/m」のガウス分布「N(0、1/m)」に従う乱数である。式(2)から式(4)に示す「m」は、抽出点数mに対応する。 An example of the crossing kernel used by the generation unit 154 will be described. The crossover kernel is defined by equation (2). In Expression (2), Expression (5) represents an average vector of extraction points and is defined by Expression (3). In equation (1), ε i is defined by equation (4). ε i is a random number according to a Gaussian distribution “N (0, 1 / m)” having an average “0” and a standard deviation “1 / m”, as shown in Expression (4). “M” shown in the equations (2) to (4) corresponds to the number of extraction points m.

Figure 0006365064
Figure 0006365064

Figure 0006365064
Figure 0006365064

Figure 0006365064
Figure 0006365064

Figure 0006365064
Figure 0006365064

生成部154は、出力サイズlとなった母集団情報144を、逆白色化処理部155に出力する。   The generation unit 154 outputs the population information 144 having the output size l to the inverse whitening processing unit 155.

逆白色化処理部155は、母集団情報144に含まれる各点のベクトルに、白色化行列Tの逆行列「T−1」を乗算することで、逆白色化処理を実行する処理部である。逆白色化処理部155は、白色化されている母集団情報144に対して逆白色化処理を行うことで、本来の属性値をもつ母集団集合情報144を生成する。逆白色化処理部155は、生成した母集団集合情報144を、記憶部140に登録する。 The inverse whitening processing unit 155 is a processing unit that performs the inverse whitening processing by multiplying the vector of each point included in the population information 144 by the inverse matrix “T −1 ” of the whitening matrix T. . The reverse whitening processing unit 155 performs reverse whitening on the whitened population information 144 to generate population set information 144 having original attribute values. The inverse whitening processing unit 155 registers the generated population set information 144 in the storage unit 140.

図7は、母集団集合情報のデータ構造の一例を示す図である。図7に示す例において、横軸は属性「世帯種年齢」に対応する軸であり、縦軸は属性「世帯年収」に対応する軸である。上記のように、生成部154によって、母集団情報144の点が、出力サイズlまで増やされており、図2に示した少数のサンプルx〜x15から、母集団全体が再構築される。 FIG. 7 is a diagram illustrating an example of a data structure of the population set information. In the example illustrated in FIG. 7, the horizontal axis is an axis corresponding to the attribute “household type age”, and the vertical axis is an axis corresponding to the attribute “household annual income”. As described above, the generator 154, the point of the population information 144 has been increased to output size l, from a small number of samples x 1 ~x 15 shown in FIG. 2, the reconstructed entire population .

次に、本実施例に係る母集団生成装置100の処理手順について説明する。図8は、本実施例に係る母集団生成装置の処理手順を示すフローチャートである。図8に示すように、母集団生成装置100の取得部151は、近傍サイズkを取得する(ステップS101)。取得部151は、出力サイズlを取得する(ステップS102)。取得部151は、抽出点数mを取得する(ステップS103)。取得部151は、取得した各パラメータを、パラメータ情報141に登録する。   Next, a processing procedure of the population generation apparatus 100 according to the present embodiment will be described. FIG. 8 is a flowchart illustrating the processing procedure of the population generation apparatus according to the present embodiment. As illustrated in FIG. 8, the acquisition unit 151 of the population generation device 100 acquires the neighborhood size k (step S101). The acquisition unit 151 acquires the output size l (step S102). The acquisition unit 151 acquires the extraction point m (step S103). The acquisition unit 151 registers each acquired parameter in the parameter information 141.

母集団生成装置100の白色化処理部152は、サンプル集合情報142を取得し(ステップS104)、サンプル集合情報142に対して白色化処理を実行する(ステップS105)。   The whitening processing unit 152 of the population generation device 100 acquires the sample set information 142 (Step S104), and executes a whitening process on the sample set information 142 (Step S105).

母集団生成装置100の特定部153は、白色化サンプル集合の各点のk近傍を計算する(ステップS106)。ステップS106において、特定部153は、白色化サンプル集合の各点について、点の近傍に存在する近傍点を特定し、特定結果をk近傍情報143に登録する。   The specifying unit 153 of the population generation apparatus 100 calculates the k neighborhood of each point of the whitened sample set (step S106). In step S <b> 106, the specifying unit 153 specifies a neighboring point that exists in the vicinity of the point for each point of the whitened sample set, and registers the specifying result in the k-neighbor information 143.

母集団生成装置100の生成部154は、白色化サンプル集合から点xを、一様ランダムに選択する(ステップS107)。ステップS107では一例として、一様ランダムに選択した点を、点xとする。 Generator 154 of the population generator 100, the point x 1 from whitening sample set is selected uniformly randomly (step S107). As an example in step S107, the selected point on the uniform random, and the point x 1.

母集団生成装置100の生成部154は、点xのk近傍から点x、・・・、xを、一様ランダムに非復元抽出する(ステップS108)。生成部154は、抽出点x、・・・xを、交叉カーネルに与え、1点yを生成する(ステップS109)。ステップS109の抽出点x、・・・xは一例である。 The generation unit 154 of the population generation apparatus 100 performs non-restoration extraction of points x 2 ,..., X m uniformly and randomly from the vicinity of k of the point x 1 (step S108). The generation unit 154 gives the extraction points x 1 ,... X m to the crossing kernel, and generates one point y (step S109). The extraction points x 1 ,..., X m in step S109 are an example.

生成部154は、yを母集団情報144に追加する(ステップS110)。生成部154は、母集団情報144のサイズがlであるか否かを判定する(ステップS111)。生成部154は、白色化母集団のサイズがlでない場合には(ステップS111,No)、ステップS107に移行する。   The generation unit 154 adds y to the population information 144 (Step S110). The generation unit 154 determines whether the size of the population information 144 is l (step S111). If the size of the whitening population is not l (No at Step S111), the generation unit 154 proceeds to Step S107.

一方、母集団情報144のサイズがlの場合には(ステップS111,Yes)、母集団生成装置100の逆白色化処理部155は、母集団情報144を逆白色化処理して母集団情報を生成する(ステップS112)。逆白色化処理部155は、母集団情報144を出力する(ステップS113)。   On the other hand, when the size of the population information 144 is 1 (Yes at Step S111), the inverse whitening processing unit 155 of the population generation apparatus 100 performs the whitening process on the population information 144 to obtain the population information. Generate (step S112). The inverse whitening processing unit 155 outputs the population information 144 (step S113).

次に、本実施例に係る母集団生成装置100の効果について説明する。母集団生成装置100の特定部153が、白色化処理を行ったサンプル集合に含まれる複数の点について、点の近傍に存在する近傍点をそれぞれ特定する。母集団生成装置100の生成部154は、白色化処理を行ったサンプル集合に含まれる点とこの点に対応する近傍点とを選択し、選択した点および近傍点の分布に基づいて新たな点を生成し、生成した点を母集団に追加する。このため、本実施例に係る母集団生成装置100によれば、計算量が大きくなることを防いで、少数のサンプルから母集団を構築することができる。   Next, the effect of the population generation apparatus 100 according to the present embodiment will be described. The specifying unit 153 of the population generating apparatus 100 specifies neighboring points that exist in the vicinity of the points for a plurality of points included in the sample set subjected to the whitening process. The generation unit 154 of the population generation apparatus 100 selects a point included in the sample set subjected to whitening processing and a neighboring point corresponding to this point, and creates a new point based on the selected point and the distribution of the neighboring point. And add the generated points to the population. For this reason, according to the population generation apparatus 100 according to the present embodiment, it is possible to prevent a calculation amount from increasing and to construct a population from a small number of samples.

例えば、本実施例にかかる母集団生成装置100の生成部145は、サンプル集合に含まれる点とこの点に対応する近傍点とを、式(1)に示す交叉カーネルに与え、新たな点を生成する。この交叉カーネルは、例えば、式(1)に基づいて、新たな点を生成するものであり、従来のカーネル密度推定のように最適なバンド幅行列を算出するステップが存在しない。このため、計算量を大きくすることなく、高次元の複雑な分布をもつ母集団集合を生成することができる。   For example, the generation unit 145 of the population generation apparatus 100 according to the present embodiment gives a point included in the sample set and a neighboring point corresponding to this point to the crossing kernel shown in Expression (1), and adds a new point. Generate. This crossing kernel is for generating a new point based on, for example, Expression (1), and there is no step of calculating an optimum bandwidth matrix as in the conventional kernel density estimation. Therefore, a population set having a high-dimensional complex distribution can be generated without increasing the amount of calculation.

また、本実施例に係る母集団生成装置100は、少数の点を有するサンプル集合情報142を基にして、出力サイズlの母集団情報144を生成する。このため、調査コストやプライバシーの観点から、入手することが難しい実測データに近い情報を取得することができ、各種のエージェントシミュレーションに利用することができる。   Further, the population generation apparatus 100 according to the present embodiment generates the population information 144 of the output size l based on the sample set information 142 having a small number of points. For this reason, it is possible to acquire information close to actual measurement data that is difficult to obtain from the viewpoint of survey cost and privacy, and it can be used for various agent simulations.

ところで、本実施例に係る母集団生成装置100の生成部154は、サンプル集合に含まれる点とこの点に対応する近傍点とを交叉カーネルに与えて新しい点を生成していたが、新しい点を生成する処理はこれに限定されない。生成部154は、サンプル集合の点について、該点の近傍点のn次までの統計的モーメントを持つ確率密度関数を割り当て、割り当てた確率密度関数に従って、新しい点を生成してもよい。   Incidentally, the generation unit 154 of the population generation apparatus 100 according to the present embodiment generates a new point by giving a point included in the sample set and a neighboring point corresponding to this point to the crossing kernel. The process of generating is not limited to this. The generation unit 154 may assign a probability density function having statistical moments up to the n-th order of neighboring points of the sample set point to generate a new point according to the assigned probability density function.

図9は、生成部154が、新しい点を生成するその他の処理の一例を示す図である。ここでは説明の便宜上、サンプル集合に含まれる点を1次元にし、サンプル集合の点をx〜xとする。生成部154は、サンプル集合に含まれる点x,x,x、xのガウス分布を特定する。xのガウス分布をガウス分布10aとし、xのガウス分布をガウス分布10bとし、xのガウス分布をガウス分布10cとし、xのガウス分布をガウス分布10dとする。生成部154は、ガウス分布10a〜10dを平均した確率分布20を特定する。生成部154は、係る確率分布20に従って、新たな点yを生成する。このように、生成部154は、交叉カーネル以外の確率密度関数を利用して、新たな点を生成してもよい。 FIG. 9 is a diagram illustrating an example of other processing in which the generation unit 154 generates a new point. For convenience of explanation, a point included in the sample set into a one-dimensional, the points of the sample collection and x 1 ~x 4. The generation unit 154 specifies a Gaussian distribution of points x 1 , x 2 , x 3 , x 4 included in the sample set. The Gaussian distribution of x 1 where the Gaussian distribution 10a, the Gaussian distribution of the x 2 where the Gaussian distribution 10b, and Gaussian distribution of x 3 where the Gaussian distribution 10c, and Gaussian 10d Gaussian distribution of x 4. The generation unit 154 specifies the probability distribution 20 obtained by averaging the Gaussian distributions 10a to 10d. The generation unit 154 generates a new point y according to the probability distribution 20. In this way, the generation unit 154 may generate a new point using a probability density function other than the crossover kernel.

次に、上記実施例に示した母集団生成装置100と同様の機能を実現する母集団生成プログラムを実行するコンピュータの一例について説明する。図10は、母集団生成プログラムを実行するコンピュータの一例を示す図である。   Next, an example of a computer that executes a population generation program that realizes the same function as the population generation apparatus 100 shown in the above embodiment will be described. FIG. 10 is a diagram illustrating an example of a computer that executes a population generation program.

図10に示すように、コンピュータ200は、各種演算処理を実行するCPU201と、ユーザからのデータの入力を受け付ける入力装置202と、ディスプレイ203とを有する。また、コンピュータ200は、記憶媒体からプログラム等を読取る読み取り装置204と、ネットワークを介して他のコンピュータとの間でデータの授受を行うインターフェース装置205とを有する。また、コンピュータ200は、各種情報を一時記憶するRAM206と、ハードディスク装置207とを有する。そして、各装置201〜207は、バス208に接続される。   As illustrated in FIG. 10, the computer 200 includes a CPU 201 that executes various arithmetic processes, an input device 202 that receives data input from a user, and a display 203. The computer 200 includes a reading device 204 that reads a program and the like from a storage medium, and an interface device 205 that exchanges data with other computers via a network. The computer 200 also includes a RAM 206 that temporarily stores various information and a hard disk device 207. The devices 201 to 207 are connected to the bus 208.

ハードディスク装置207は、特定プログラム207a、生成プログラム207bを有する。CPU201は、特定プログラム207a、生成プログラム207bを読み出してRAM206に展開する。特定プログラム207aは、特定プロセス206aとして機能する。生成プログラム207bは、生成プロセス206bとして機能する。   The hard disk device 207 has a specific program 207a and a generation program 207b. The CPU 201 reads the specific program 207 a and the generation program 207 b and develops them in the RAM 206. The specific program 207a functions as a specific process 206a. The generation program 207b functions as a generation process 206b.

例えば、特定プロセス206aは、特定部153に対応する。生成プロセス206bは、生成部154に対応する。   For example, the specifying process 206 a corresponds to the specifying unit 153. The generation process 206 b corresponds to the generation unit 154.

なお、特定プログラム207a、生成プログラム207bについては、必ずしも最初からハードディスク装置207に記憶させておかなくても良い。例えば、コンピュータ200に挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ200が特定プログラム207a、生成プログラム207bを読み出して実行するようにしてもよい。   Note that the specific program 207a and the generation program 207b are not necessarily stored in the hard disk device 207 from the beginning. For example, each program is stored in a “portable physical medium” such as a flexible disk (FD), a CD-ROM, a DVD disk, a magneto-optical disk, and an IC card inserted into the computer 200. Then, the computer 200 may read and execute the specific program 207a and the generation program 207b.

以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。   The following supplementary notes are further disclosed with respect to the embodiments including the above examples.

(付記1)コンピュータに、
サンプル集合に含まれる主成分毎の値に対応付けられた複数の点について、各点の近傍に存在する近傍点をそれぞれ特定し、
前記サンプル集合に含まれる点と該点に対応する近傍点とを選択し、選択した点および近傍点を所定の確率密度関数に割り当てることで、新たな点が取り得る主成分毎の値と確率とを対応付けた分布を生成し、生成した分布に基づいて新たな点を生成し、
生成した新たな点を母集団に追加する
処理を実行させることを特徴とする母集団生成プログラム。
(Supplementary note 1)
For a plurality of points associated with the values for each principal component included in the sample set, identify neighboring points that exist in the vicinity of each point,
By selecting a point included in the sample set and a neighboring point corresponding to the point, and assigning the selected point and the neighboring point to a predetermined probability density function, the value and probability of each principal component that can be taken by the new point Is generated, a new point is generated based on the generated distribution,
A population generation program characterized by executing a process of adding a generated new point to a population.

(付記2)前記新たな点を生成する処理は、前記サンプル集合に含まれる点と前記点に対応する近傍点とを選択し、選択した点および近傍点の平均ベクトルを算出し、選択した点および近傍点の各ベクトルと、前記平均ベクトルと、所定のガウス分布に従う値に基づいて、前記新たな点を生成することを特徴とする付記1に記載の母集団生成プログラム。 (Additional remark 2) The process which produces | generates the said new point selects the point contained in the said sample set, and the neighboring point corresponding to the said point, calculates the average vector of the selected point and a neighboring point, and selected point The population generation program according to appendix 1, wherein the new point is generated based on each vector of neighboring points, the average vector, and a value according to a predetermined Gaussian distribution.

(付記3)前記新たな点を生成する処理は、所定数未満の点を有する前記サンプル集合に含まれる点と前記点に対応する近傍点とを選択し、選択した点および近傍点の分布に基づいて、新たな点を生成する処理を繰り返し実行することで、所定数以上の点を有する母集団を生成することを特徴とする付記1または2に記載の母集団生成プログラム。 (Additional remark 3) The process which produces | generates the said new point selects the point contained in the said sample set which has less than a predetermined number of points, and the neighboring point corresponding to the said point, and selects the distribution of the selected point and the neighboring point. The population generation program according to appendix 1 or 2, wherein a population having a predetermined number or more points is generated by repeatedly executing a process of generating new points based on the above.

(付記4)コンピュータが実行する点生成方法であって、
サンプル集合に含まれる主成分毎の値に対応付けられた複数の点について、各点の近傍に存在する近傍点をそれぞれ特定し、
前記サンプル集合に含まれる点と該点に対応する近傍点とを選択し、選択した点および近傍点を所定の確率密度関数に割り当てることで、新たな点が取り得る主成分毎の値と確率とを対応付けた分布を生成し、生成した分布に基づいて新たな点を生成し、
生成した新たな点を母集団に追加する
処理を実行することを特徴とする母集団生成方法。
(Appendix 4) A point generation method executed by a computer,
For a plurality of points associated with the values for each principal component included in the sample set, identify neighboring points that exist in the vicinity of each point,
By selecting a point included in the sample set and a neighboring point corresponding to the point, and assigning the selected point and the neighboring point to a predetermined probability density function, the value and probability of each principal component that can be taken by the new point Is generated, a new point is generated based on the generated distribution,
A method of generating a population, characterized by executing a process of adding a generated new point to the population.

(付記5)前記新たな点を生成する処理は、前記サンプル集合に含まれる点と前記点に対応する近傍点とを選択し、選択した点および近傍点の平均ベクトルを算出し、選択した点および近傍点の各ベクトルと、前記平均ベクトルと、所定のガウス分布に従う値に基づいて、前記新たな点を生成することを特徴とする付記4に記載の母集団生成方法。 (Additional remark 5) The process which produces | generates the said new point selects the point contained in the said sample set, and the neighboring point corresponding to the said point, calculates the average vector of the selected point and a neighboring point, and selected point The population generation method according to appendix 4, wherein the new point is generated based on each vector of neighboring points, the average vector, and a value according to a predetermined Gaussian distribution.

(付記6)前記新たな点を生成する処理は、所定数未満の点を有する前記サンプル集合に含まれる点と前記点に対応する近傍点とを選択し、選択した点および近傍点の分布に基づいて、新たな点を生成する処理を繰り返し実行することで、所定数以上の点を有する母集団を生成することを特徴とする付記4または5に記載の母集団生成方法。 (Additional remark 6) The process which produces | generates the said new point selects the point contained in the said sample set which has less than a predetermined number of points, and the neighboring point corresponding to the said point, and selects the distribution of the selected point and the neighboring point. 6. The population generation method according to appendix 4 or 5, wherein a population having a predetermined number or more points is generated by repeatedly executing a process of generating new points.

(付記7)サンプル集合に含まれる主成分毎の値に対応付けられた複数の点について、各点の近傍に存在する近傍点をそれぞれ特定する特定部と、
前記サンプル集合に含まれる点と該点に対応する近傍点とを選択し、選択した点および近傍点を所定の確率密度関数に割り当てることで、新たな点が取り得る主成分毎の値と確率とを対応付けた分布を生成し、生成した分布に基づいて新たな点を生成し、生成した新たな点を母集団に追加する生成部と
を有することを特徴とする母集団生成装置。
(Additional remark 7) About the some point matched with the value for every main component contained in a sample set, the specific part which each specifies the nearby point which exists in the vicinity of each point,
By selecting a point included in the sample set and a neighboring point corresponding to the point, and assigning the selected point and the neighboring point to a predetermined probability density function, the value and probability of each principal component that can be taken by the new point And a generation unit for generating a new point based on the generated distribution, and adding the generated new point to the population.

(付記8)前記生成部は、前記サンプル集合に含まれる点と前記点に対応する近傍点とを選択し、選択した点および近傍点の平均ベクトルを算出し、選択した点および近傍点の各ベクトルと、前記平均ベクトルと、所定のガウス分布に従う値に基づいて、前記新たな点を生成することを特徴とする付記7に記載の母集団生成装置。 (Supplementary Note 8) The generation unit selects a point included in the sample set and a neighboring point corresponding to the point, calculates an average vector of the selected point and the neighboring point, and selects each of the selected point and the neighboring point. The population generation apparatus according to appendix 7, wherein the new point is generated based on a vector, the average vector, and a value according to a predetermined Gaussian distribution.

(付記9)前記生成部は、所定数未満の点を有する前記サンプル集合に含まれる点と前記点に対応する近傍点とを選択し、選択した点および近傍点の分布に基づいて、新たな点を生成する処理を繰り返し実行することで、所定数以上の点を有する母集団を生成することを特徴とする付記7または8に記載の母集団生成装置。 (Supplementary Note 9) The generation unit selects a point included in the sample set having less than a predetermined number of points and a neighboring point corresponding to the point, and generates a new point based on the selected point and the distribution of neighboring points. The population generation apparatus according to appendix 7 or 8, wherein a population having a predetermined number or more points is generated by repeatedly executing a process of generating points.

100 母集団生成装置
153 特定部
154 生成部
100 population generation device 153 identification unit 154 generation unit

Claims (5)

コンピュータに、
サンプル集合に含まれる主成分毎の値に対応付けられた複数の点について、各点の近傍に存在する近傍点をそれぞれ特定し、
前記サンプル集合に含まれる点と該点に対応する近傍点とを選択し、選択した点および近傍点を所定の確率密度関数に割り当てることで、新たな点が取り得る主成分毎の値と確率とを対応付けた分布を生成し、生成した分布に基づいて新たな点を生成し、
生成した新たな点を母集団に追加する
処理を実行させることを特徴とする母集団生成プログラム。
On the computer,
For a plurality of points associated with the values for each principal component included in the sample set, identify neighboring points that exist in the vicinity of each point,
By selecting a point included in the sample set and a neighboring point corresponding to the point, and assigning the selected point and the neighboring point to a predetermined probability density function, the value and probability of each principal component that can be taken by the new point Is generated, a new point is generated based on the generated distribution,
A population generation program characterized by executing a process of adding a generated new point to a population.
前記新たな点を生成する処理は、前記サンプル集合に含まれる点と前記点に対応する近傍点とを選択し、選択した点および近傍点の平均ベクトルを算出し、選択した点および近傍点の各ベクトルと、前記平均ベクトルと、所定のガウス分布に従う値に基づいて、前記新たな点を生成することを特徴とする請求項1に記載の母集団生成プログラム。   The process of generating the new point selects a point included in the sample set and a neighboring point corresponding to the point, calculates an average vector of the selected point and the neighboring point, and selects the selected point and the neighboring point. The population generation program according to claim 1, wherein the new point is generated based on each vector, the average vector, and a value according to a predetermined Gaussian distribution. 前記新たな点を生成する処理は、所定数未満の点を有する前記サンプル集合に含まれる点と前記点に対応する近傍点とを選択し、選択した点および近傍点の分布に基づいて、新たな点を生成する処理を繰り返し実行することで、所定数以上の点を有する母集団を生成することを特徴とする請求項1または2に記載の母集団生成プログラム。   The process of generating the new point selects a point included in the sample set having less than a predetermined number of points and a neighboring point corresponding to the point, and based on the selected point and the distribution of neighboring points, a new point is created. The population generation program according to claim 1 or 2, wherein a population having a predetermined number or more points is generated by repeatedly executing a process for generating such points. コンピュータが実行する点生成方法であって、
サンプル集合に含まれる主成分毎の値に対応付けられた複数の点について、各点の近傍に存在する近傍点をそれぞれ特定し、
前記サンプル集合に含まれる点と該点に対応する近傍点とを選択し、選択した点および近傍点を所定の確率密度関数に割り当てることで、新たな点が取り得る主成分毎の値と確率とを対応付けた分布を生成し、生成した分布に基づいて新たな点を生成し、
生成した新たな点を母集団に追加する
処理を実行することを特徴とする母集団生成方法。
A point generation method executed by a computer,
For a plurality of points associated with the values for each principal component included in the sample set, identify neighboring points that exist in the vicinity of each point,
By selecting a point included in the sample set and a neighboring point corresponding to the point, and assigning the selected point and the neighboring point to a predetermined probability density function, the value and probability of each principal component that can be taken by the new point Is generated, a new point is generated based on the generated distribution,
A method of generating a population, characterized by executing a process of adding a generated new point to the population.
サンプル集合に含まれる主成分毎の値に対応付けられた複数の点について、各点の近傍に存在する近傍点をそれぞれ特定する特定部と、
前記サンプル集合に含まれる点と該点に対応する近傍点とを選択し、選択した点および近傍点を所定の確率密度関数に割り当てることで、新たな点が取り得る主成分毎の値と確率とを対応付けた分布を生成し、生成した分布に基づいて新たな点を生成し、生成した新たな点を母集団に追加する生成部と
を有することを特徴とする母集団生成装置。
For a plurality of points associated with the values for each principal component included in the sample set, a specifying unit that specifies each neighboring point existing in the vicinity of each point;
By selecting a point included in the sample set and a neighboring point corresponding to the point, and assigning the selected point and the neighboring point to a predetermined probability density function, the value and probability of each principal component that can be taken by the new point And a generation unit for generating a new point based on the generated distribution, and adding the generated new point to the population.
JP2014152015A 2014-07-25 2014-07-25 Population generation program, population generation method, and population generation apparatus Expired - Fee Related JP6365064B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014152015A JP6365064B2 (en) 2014-07-25 2014-07-25 Population generation program, population generation method, and population generation apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014152015A JP6365064B2 (en) 2014-07-25 2014-07-25 Population generation program, population generation method, and population generation apparatus

Publications (2)

Publication Number Publication Date
JP2016031543A JP2016031543A (en) 2016-03-07
JP6365064B2 true JP6365064B2 (en) 2018-08-01

Family

ID=55441911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014152015A Expired - Fee Related JP6365064B2 (en) 2014-07-25 2014-07-25 Population generation program, population generation method, and population generation apparatus

Country Status (1)

Country Link
JP (1) JP6365064B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7469983B2 (en) 2020-08-03 2024-04-17 株式会社ビデオリサーチ Pseudo specimen preparation device, pseudo specimen preparation method, and program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3830598B2 (en) * 1996-12-19 2006-10-04 大日本印刷株式会社 Color correction method
JP4206369B2 (en) * 2004-07-15 2009-01-07 日本放送協会 Time-series data complementing device, method and program thereof

Also Published As

Publication number Publication date
JP2016031543A (en) 2016-03-07

Similar Documents

Publication Publication Date Title
CN108898186B (en) Method and device for extracting image
CN110362677B (en) Text data category identification method and device, storage medium and computer equipment
RU2708955C2 (en) Online per-feature descriptor customization
JP2020027424A (en) Learning data generating device, discrimination model generating device, and program
TW200907733A (en) Robust design using manufacturability models
US9208278B2 (en) Clustering using N-dimensional placement
CN107204956B (en) Website identification method and device
CN108491714A (en) The man-machine recognition methods of identifying code
CN111339695A (en) Apparatus and method for electromagnetic field simulation
CN111783812B (en) Forbidden image recognition method, forbidden image recognition device and computer readable storage medium
JP6829518B2 (en) Systems and methods for generating random numbers using physical variations present in material samples
CN111445021A (en) Learning method, learning apparatus, and computer-readable recording medium
EP1939796A2 (en) Data processing apparatus, data processing method data processing program and computer readable medium
JP6365064B2 (en) Population generation program, population generation method, and population generation apparatus
JP7225874B2 (en) Model output program, model output method and model output device
Woodring et al. Semi‐automatic time‐series transfer functions via temporal clustering and sequencing
Tendijck et al. A model for the directional evolution of severe ocean storms
JP7509244B2 (en) GENERATION APPARATUS, GENERATION METHOD, AND GENERATION PROGRAM
CN114528973A (en) Method for generating business processing model, business processing method and device
CN114510592A (en) Image classification method and device, electronic equipment and storage medium
Deza et al. The construction of complex networks from linear and nonlinear measures–Climate Networks
JP2021149796A (en) Information processing device, specification method and specification program
JP6950505B2 (en) Discrimination program, discrimination method and discrimination device
JP6507512B2 (en) Estimation program, estimation method and estimation apparatus
WO2016122561A1 (en) Synthesizing a graph

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170406

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180605

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180618

R150 Certificate of patent or registration of utility model

Ref document number: 6365064

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees