JP5560154B2 - Model parameter estimation apparatus and program thereof - Google Patents
Model parameter estimation apparatus and program thereof Download PDFInfo
- Publication number
- JP5560154B2 JP5560154B2 JP2010222017A JP2010222017A JP5560154B2 JP 5560154 B2 JP5560154 B2 JP 5560154B2 JP 2010222017 A JP2010222017 A JP 2010222017A JP 2010222017 A JP2010222017 A JP 2010222017A JP 5560154 B2 JP5560154 B2 JP 5560154B2
- Authority
- JP
- Japan
- Prior art keywords
- hypothesis
- data
- time
- hypotheses
- storage means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims description 151
- 238000009826 distribution Methods 0.000 claims description 54
- 238000012952 Resampling Methods 0.000 claims description 33
- 238000004364 calculation method Methods 0.000 claims description 33
- 238000000034 method Methods 0.000 claims description 28
- 238000005070 sampling Methods 0.000 claims description 27
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 25
- 238000012614 Monte-Carlo sampling Methods 0.000 claims description 23
- 238000004088 simulation Methods 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 18
- 238000011156 evaluation Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 description 25
- 239000002245 particle Substances 0.000 description 6
- 239000013598 vector Substances 0.000 description 5
- 238000005315 distribution function Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、逐次モンテカルロ法によりモデルのパラメータを推定するモデルパラメータ推定装置およびそのプログラムに関する。 The present invention relates to a model parameter estimation apparatus and its program for estimating model parameters by a sequential Monte Carlo method.
従来、ある観測モデルにおいて、過去の状態から現在の状態を推定する手法として、逐次モンテカルロ法(粒子フィルタ、パーティクルフィルタ)がある。この逐次モンテカルロ法は、過去の観測情報を逐次入力し、観測モデルに適合した現在の状態(モデルのパラメータ)を逐次的に計算する手法である。すなわち、逐次モンテカルロ法(粒子フィルタ、パーティクルフィルタ)は、観測情報からパラメータの解の候補となる複数の仮説(粒子、パーティクル)を設定し、その複数の仮説を用いて、モデルパラメータの確率分布関数をモンテカルロ近似することでパラメータを推定している(非特許文献1参照)。
一方、本願出願人は、逐次モンテカルロ法を、自律分散環境で実行する手法を提案した(特許文献1参照)。この手法は、複数の分散エージェント(状態推定装置)のそれぞれが、分担して異なる観測を行い、通信を介して、状態の推定を統合するものである。
Conventionally, in a certain observation model, there is a sequential Monte Carlo method (particle filter, particle filter) as a method for estimating a current state from a past state. This sequential Monte Carlo method is a method in which past observation information is sequentially input, and a current state (model parameter) adapted to the observation model is sequentially calculated. That is, the sequential Monte Carlo method (particle filter, particle filter) sets a plurality of hypotheses (particles, particles) that are candidates for parameter solutions from observation information, and uses these hypotheses to calculate the probability distribution function of model parameters. Is estimated by Monte Carlo approximation (see Non-Patent Document 1).
On the other hand, the applicant of the present application has proposed a method of executing the sequential Monte Carlo method in an autonomous distributed environment (see Patent Document 1). In this method, each of a plurality of distributed agents (state estimation apparatuses) shares different observations and integrates state estimation via communication.
しかし、非特許文献1に記載の逐次モンテカルロ法では、特にモデルパラメータが高次元である場合や、モデルパラメータの確率分布がパラメータ空間内に広く分布する場合、その次元や分布に対して十分に多くの仮説を用いないとモンテカルロ近似の近似精度が不足してしまう。
このように、従来の逐次モンテカルロ法は、モンテカルロ近似の近似精度が不足してしまうと、局所的な解(局所解)に陥ってしまい大局的な最適解を求めることができないという問題がある。また、モンテカルロ近似の近似精度を高めるために、仮説を増やすと、その分、演算負荷が増加し、高速に状態推定を行うことができないという問題がある。
However, in the sequential Monte Carlo method described in Non-Patent
As described above, the conventional sequential Monte Carlo method has a problem that if the approximation accuracy of the Monte Carlo approximation is insufficient, it falls into a local solution (local solution) and a global optimum solution cannot be obtained. In addition, if the number of hypotheses is increased in order to increase the approximation accuracy of the Monte Carlo approximation, there is a problem that the calculation load increases correspondingly and state estimation cannot be performed at high speed.
一方、特許文献1に記載の逐次モンテカルロ法を自律分散環境で実行する手法は、個々の観測による推定を分散し統合することで、並列動作が可能になり、高速に状態を推定することができる点で優れている。しかし、前記したように、仮説が多い場合であっても、個々の状態推定装置において、高速に状態推定を行うための更なる工夫が求められていた。
On the other hand, the method of executing the sequential Monte Carlo method described in
本発明は、以上のような問題に鑑みてなされたものであり、逐次モンテカルロ法により、高速で、かつ、精度が高い状態推定を行うモデルパラメータ推定装置およびそのプログラムを提供することを課題とする。 The present invention has been made in view of the above problems, and it is an object of the present invention to provide a model parameter estimation apparatus and its program for performing state estimation at high speed and high accuracy by a sequential Monte Carlo method. .
本発明は、前記課題を解決するために創案されたものであり、まず、請求項1に記載のモデルパラメータ推定装置は、逐次モンテカルロ法によりモデルのパラメータを推定するモデルパラメータ推定装置において、仮説記憶手段と、複数の仮説処理手段と、制御手段と、代表値演算手段と、を備える構成とした。
The present invention has been made to solve the above-mentioned problems. First, the model parameter estimation apparatus according to
かかる構成において、モデルパラメータ推定装置は、複数の仮説処理手段によって、予め定めたパラメータの分布である逐次モンテカルロ法の提案分布に基づいて仮説データを標本抽出することで、新たな仮説データを生成し、仮説記憶手段に記憶されている仮説データを当該仮説データの生成時刻とともに更新する。なお、この逐次モンテカルロ法の提案分布は、予めその分布が既知の分布である。例えば、この提案分布として、確率密度関数を用いることができる。このように、仮説処理手段は、ある仮説データを提案分布に基づいて標本抽出することで、提案分布に分布が近似した仮説データを生成する。 In such a configuration, the model parameter estimation apparatus generates new hypothesis data by sampling hypothesis data based on a proposed Monte Carlo method distribution that is a predetermined parameter distribution by a plurality of hypothesis processing means. The hypothesis data stored in the hypothesis storage means is updated together with the generation time of the hypothesis data . The proposed distribution of the sequential Monte Carlo method is a distribution whose distribution is already known. For example, a probability density function can be used as the proposed distribution. In this way, the hypothesis processing means generates hypothesis data whose distribution approximates the proposed distribution by sampling certain hypothesis data based on the proposed distribution.
このとき、モデルパラメータ推定装置は、制御手段によって、仮説処理手段が仮説データの更新処理の動作中であるか否かの状態を保持し、更新動作を行っていない仮説処理手段に対して、仮説記憶手段に記憶されている仮説データの生成時刻に基づいて、前回の更新時刻以降で更新されていない仮説データを分配して、複数の仮説処理手段を動作させる。これによって、複数の仮説処理手段は、並列に起動され、仮説データごとに個々に新たな仮説データを生成し、仮説記憶手段に記憶されている仮説データを更新する。
このように、モデルパラメータ推定装置は、制御手段によって、仮説データの更新を早く終わった仮説処理手段に対して、順次未更新の仮説データを割り振ることができる。なお、仮説処理手段が仮説データの更新処理の動作中であるか否かの判定は、例えば、処理中の仮説処理手段に対してフラグを設定する等、一般的な判定手法でよい。
At this time, the model parameter estimation device retains the state of whether or not the hypothesis processing means is in the process of updating the hypothesis data by the control means, and the hypothesis processing means that is not performing the update operation Based on the generation time of hypothesis data stored in the storage means, hypothesis data that has not been updated since the last update time is distributed, and a plurality of hypothesis processing means are operated. As a result, the plurality of hypothesis processing means are activated in parallel, generate new hypothesis data individually for each hypothesis data, and update the hypothesis data stored in the hypothesis storage means.
In this way, the model parameter estimation apparatus can sequentially assign unupdated hypothesis data to the hypothesis processing means that has finished updating hypothesis data early by the control means. Whether or not the hypothesis processing means is in the process of updating the hypothesis data may be determined by a general determination method such as setting a flag for the hypothesis processing means being processed.
そして、モデルパラメータ推定装置は、制御手段によって、仮説記憶手段に記憶されている仮説データが、前回の更新時刻以降の仮説データにすべて更新された段階で、更新時刻を次回の更新時刻に更新する。これによって、ある時点ごとに同期がとられて仮説データが更新されることになる。 Then, the model parameter estimation apparatus, the control means, hypothesis data that is stored in the hypothesis storage means, at a stage that is updated every hypothesis data since the last update time, the update time for the next update time update To do . As a result, the hypothesis data is updated at a certain point in time.
そして、モデルパラメータ推定装置は、代表値演算手段によって、仮説記憶手段に記憶されている複数の仮説データの統計的な代表値を、パラメータの解の推定値として演算する。なお、この代表値を演算するタイミングは任意のタイミングでよい。例えば、代表値演算手段は、一定時間間隔、あるいは、外部からの指示信号により、動作させることとすればよい。 Then, the model parameter estimation device calculates the statistical representative value of the plurality of hypothesis data stored in the hypothesis storage means as the estimated value of the parameter solution by the representative value calculation means. The timing for calculating the representative value may be any timing. For example, the representative value calculation means may be operated at a constant time interval or by an instruction signal from the outside.
また、請求項2に記載のモデルパラメータ推定装置は、請求項1に記載のモデルパラメータ推定装置において、仮説記憶手段には、仮説データに対応付けて当該仮説データの重要度を示す重みを記憶し、仮説処理手段が、モンテカルロ標本化手段と、観測模擬手段と、尤度評価手段と、重み更新手段と、を備える構成とした。
Also, the model parameter estimation apparatus according to claim 2, in the model parameter estimation apparatus according to
かかる構成において、モデルパラメータ推定装置は、仮説処理手段のモンテカルロ標本化手段によって、提案分布によりパラメータの解の候補となる仮説データを標本抽出して生成する。そして、モデルパラメータ推定装置は、仮説処理手段の観測模擬手段によって、モンテカルロ標本化手段で生成された仮説データから、予め定めた観測モデルにより更新後の観測値である模擬観測値を生成する。 In this configuration, the model parameter estimation device samples and generates hypothesis data that is a candidate for a parameter solution based on the proposed distribution by the Monte Carlo sampling unit of the hypothesis processing unit. Then, the model parameter estimation device generates a simulated observation value, which is an observation value updated by a predetermined observation model, from the hypothesis data generated by the Monte Carlo sampling means by the observation simulation means of the hypothesis processing means.
そして、モデルパラメータ推定装置は、仮説処理手段の尤度評価手段によって、外部から観測値を入力し、現時点で入力した観測値である入力観測値と、観測模擬手段で生成された模擬観測値とが近似する度合いを示す尤度を算出する。この入力観測値と模擬観測値との近似の度合いは、例えば、当該観測値がベクトルであれば、ベクトル間の距離が近いほど、近似の度合いが大きいといえる。このように、入力観測値と模擬観測値とが近似すれば、模擬観測値を生成した仮説データはより尤もらしい仮説であるといえる。 Then, the model parameter estimation device inputs the observation value from the outside by the likelihood evaluation means of the hypothesis processing means, the input observation value that is the observation value input at the present time, the simulated observation value generated by the observation simulation means, The likelihood indicating the degree of approximation is calculated. As for the degree of approximation between the input observation value and the simulated observation value, for example, if the observation value is a vector, it can be said that the closer the distance between vectors, the greater the degree of approximation. In this way, if the input observation value and the simulated observation value are approximated, it can be said that the hypothesis data that generated the simulated observation value is a more likely hypothesis.
そこで、モデルパラメータ推定装置は、仮説処理手段の重み更新手段によって、尤度評価手段で算出された尤度に基づいて、入力観測値と模擬観測値とが近いほど値が大きくなるように重みを更新する。
そして、モデルパラメータ推定装置は、代表値演算手段によって、仮説記憶手段に記憶されている複数の仮説データを、当該仮説データに対応する重みに基づいて加重平均することで代表値を演算する。
Therefore, the model parameter estimation device uses the weight updating unit of the hypothesis processing unit to assign a weight based on the likelihood calculated by the likelihood evaluating unit so that the value becomes larger as the input observation value and the simulated observation value are closer to each other. Update.
Then, the model parameter estimation device calculates a representative value by performing a weighted average of the plurality of hypothesis data stored in the hypothesis storage unit based on the weight corresponding to the hypothesis data by the representative value calculation unit.
また、請求項3に記載のモデルパラメータ推定装置は、請求項1または請求項2に記載のモデルパラメータ推定装置において、再標本化手段をさらに備える構成とした。
The model parameter estimation device according to claim 3 is the model parameter estimation device according to
かかる構成において、モデルパラメータ推定装置は、再標本化手段によって、仮説記憶手段に記憶されている複数の仮説データを、予め定めた確率密度分布により再標本化する。このように、確率密度分布により再標本化することで、仮説データは、確率密度分布に近い分布で再編成されることになり、偏在した分布データを排除することができる。 In such a configuration, the model parameter estimation device resamples the plurality of hypothesis data stored in the hypothesis storage unit by the resampling unit using a predetermined probability density distribution. In this way, by re-sampling with the probability density distribution, the hypothesis data is reorganized with a distribution close to the probability density distribution, and uneven distribution data can be eliminated.
また、請求項4に記載のモデルパラメータ推定装置は、請求項3に記載のモデルパラメータ推定装置において、制御手段が、一定時間間隔、または、仮説記憶手段に記憶されている複数の仮説データがパラメータ空間において予め定めた条件以上偏在している場合に、再標本化手段を動作させることを特徴とする。 The model parameter estimation device according to claim 4 is the model parameter estimation device according to claim 3 , wherein the control unit is configured to use a plurality of hypothesis data stored in the hypothesis storage unit as parameters. The resampling means is operated when it is unevenly distributed over a predetermined condition in the space.
かかる構成において、モデルパラメータ推定装置は、一定時間間隔、または、複数の仮説データがパラメータ空間において偏在している場合に、制御手段が再標本化手段を動作させることで、仮説データは、確率密度分布に近い分布で再編成されることになり、偏在した仮説データを排除することができる。 In such a configuration, the model parameter estimating device operates the resampling unit when the hypothetical data is distributed at a certain time interval or when a plurality of hypothetical data is unevenly distributed in the parameter space. As a result, the hypothesis data that is unevenly distributed can be eliminated.
さらに、請求項5に記載のモデルパラメータ推定装置は、請求項2に記載のモデルパラメータ推定装置において、再標本化手段をさらに備え、制御手段が、仮説記憶手段に記憶されている複数の仮説データにおいて、予め定めた最小値よりも重みの小さい仮説データが、予め定めた数より多くなった場合に、再標本化手段を動作させることを特徴とする。 Furthermore , the model parameter estimation device according to claim 5 is the model parameter estimation device according to claim 2 , further comprising a resampling means, wherein the control means stores a plurality of hypothesis data stored in the hypothesis storage means. The re-sampling means is operated when hypothesis data having a weight smaller than a predetermined minimum value exceeds a predetermined number.
かかる構成において、モデルパラメータ推定装置は、重みの小さい仮説データが増えたときに、制御手段が再標本化手段を動作させることで、仮説データは、確率密度分布に近い分布で再編成されることになり、重みの小さい仮説データを排除することができる。 In such a configuration, when the hypothesis data with a small weight increases, the model parameter estimation device causes the control means to operate the resampling means, so that the hypothesis data is reorganized with a distribution close to the probability density distribution. Thus, hypothesis data having a small weight can be excluded.
また、請求項6に記載のモデルパラメータ推定プログラムは、逐次モンテカルロ法によりモデルのパラメータを推定するために、コンピュータを、複数の仮説処理手段、制御手段、代表値演算手段、として機能させる構成とした。 The model parameter estimation program according to claim 6 is configured to cause a computer to function as a plurality of hypothesis processing means, control means, and representative value calculation means in order to estimate model parameters by a sequential Monte Carlo method. .
かかる構成において、モデルパラメータ推定プログラムは、複数の仮説処理手段によって、予め定めたパラメータの分布である逐次モンテカルロ法の提案分布に基づいて仮説データを標本抽出することで、新たな仮説データを生成し、仮説記憶手段に記憶されている仮説データを当該仮説データの生成時刻とともに更新する。
このとき、モデルパラメータ推定プログラムは、制御手段によって、仮説処理手段が仮説データの更新処理の動作中であるか否かの状態を保持し、更新動作を行っていない仮説処理手段に対して、仮説記憶手段に記憶されている仮説データの生成時刻に基づいて、前回の更新時刻以降で更新されていない仮説データを分配して、複数の仮説処理手段を動作させる。これによって、複数の仮説処理手段は、並列に起動され、仮説データごとに個々に新たな仮説データを生成し、仮説記憶手段に記憶されている仮説データを更新する。
In such a configuration, the model parameter estimation program generates new hypothesis data by sampling hypothesis data based on a proposed Monte Carlo method distribution that is a predetermined parameter distribution by a plurality of hypothesis processing means. The hypothesis data stored in the hypothesis storage means is updated together with the generation time of the hypothesis data .
At this time, the model parameter estimation program retains the state of whether or not the hypothesis processing means is in the process of updating the hypothesis data by the control means, and applies the hypothesis to the hypothesis processing means not performing the update operation. Based on the generation time of hypothesis data stored in the storage means, hypothesis data that has not been updated since the last update time is distributed, and a plurality of hypothesis processing means are operated. As a result, the plurality of hypothesis processing means are activated in parallel, generate new hypothesis data individually for each hypothesis data, and update the hypothesis data stored in the hypothesis storage means.
そして、モデルパラメータ推定プログラムは、制御手段によって、仮説記憶手段に記憶されている仮説データが、前回の更新時刻以降の仮説データにすべて更新された段階で、更新時刻を次回の更新時刻に更新する。
そして、モデルパラメータ推定プログラムは、代表値演算手段によって、仮説記憶手段に記憶されている複数の仮説データの統計的な代表値を、パラメータの解の推定値として演算する。
Then, the model parameter estimation program, by the control means, hypothesis data that have been stored in the hypothesis storage means, at the stage that has been updated all the hypothesis data since the last update time, the update time in the next update time update To do .
Then, the model parameter estimation program calculates the statistical representative value of the plurality of hypothesis data stored in the hypothesis storage means as the estimated value of the parameter solution by the representative value calculation means.
本発明は、以下に示す優れた効果を奏するものである。
請求項1,6に記載の発明によれば、逐次モンテカルロ法による複数の仮説データを、仮説データごとに、個々の仮説処理手段で分担して処理することができ、並列処理を実現することができる。これによって、本発明は、個々の仮説処理手段を、並列計算機、マルチコアCPUを搭載した計算機等で演算することが可能になり、多量の仮説データであっても高速に演算が可能になり、精度よくパラメータの推定を行うことができる。
The present invention has the following excellent effects.
According to the first and sixth aspects of the present invention, a plurality of hypothesis data by the sequential Monte Carlo method can be processed by each hypothesis processing means for each hypothesis data, and parallel processing can be realized. it can. As a result, according to the present invention, each hypothesis processing means can be operated by a parallel computer, a computer equipped with a multi-core CPU, etc., and even a large amount of hypothesis data can be calculated at high speed. It is possible to estimate parameters well.
また、請求項1,6に記載の発明によれば、仮説処理手段が動作を行っていない空き状態をなくすことができ、複数の仮説処理手段を効率よく動作させることができる。これによって、本発明は、各仮説処理手段の負荷状態に応じて、より高速動作可能な仮説処理手段に負荷が分散されるため、高速にパラメータの推定を行うことができる。 Further , according to the first and sixth aspects of the present invention, it is possible to eliminate an empty state in which the hypothesis processing means is not operating, and it is possible to efficiently operate a plurality of hypothesis processing means. As a result, according to the present invention, the load is distributed to the hypothesis processing means capable of operating at higher speed according to the load state of each hypothesis processing means, so that the parameter can be estimated at high speed.
請求項2に記載の発明によれば、観測値に応じて、仮説データに重みを付加することができるため、パラメータの推定に仮説データの有効性を加味することができる。これによって、本発明は、仮説データが少ない場合であっても正確なパラメータ推定が可能になり、より高速にパラメータの推定を行うことができる。 According to the second aspect of the present invention, since the weight can be added to the hypothesis data according to the observed value, the effectiveness of the hypothesis data can be added to the parameter estimation. Thus, according to the present invention, accurate parameter estimation is possible even when hypothesis data is small, and parameter estimation can be performed at higher speed.
請求項3〜5に記載の発明によれば、仮説データを、確率密度分布に近い分布で再編成することができる。これによって、本発明は、仮説データがパラメータ空間内において偏在することを防止し、より少ない仮説データで正確なパラメータを推定することができる。 According to the invention described in claims 3 to 5 , the hypothesis data can be reorganized with a distribution close to the probability density distribution. Thereby, the present invention prevents hypothesis data from being unevenly distributed in the parameter space, and can estimate an accurate parameter with less hypothesis data.
以下、本発明の実施形態について図面を参照して説明する。
[モデルパラメータ推定装置の構成]
最初に、図1を参照して、本発明の実施形態に係るモデルパラメータ推定装置の構成について説明する。モデルパラメータ推定装置1は、外部から入力される観測対象の観測値に基づいて、予め定めたモデルに適合するパラメータ(モデルパラメータ)を逐次推定するものである。
Embodiments of the present invention will be described below with reference to the drawings.
[Configuration of model parameter estimation device]
First, the configuration of the model parameter estimation apparatus according to the embodiment of the present invention will be described with reference to FIG. The model
ここで、観測対象とは、動き、変動等の状態の変化を伴うもの、あるいは、事象であって、動きを伴う人物、車両等や、変動を伴う株価等がその対象となりうる。例えば、モデルパラメータ推定装置1は、人物を観測対象として、カメラで撮影した画像における人物の位置を観測値とすることで、人物の3次元位置や、速度等をモデルパラメータとして推定することができる。
ここでは、モデルパラメータ推定装置1は、ある時刻t(例えば、tは整数)においてモデルパラメータxtを推定することとするが、この時刻tは、時間の次元を持つ物理的な時刻であっても構わないし、単純に処理のステップを表すインデックスであっても構わない。以下では、便宜上、「時刻」という表現を用いることとする。
Here, the observation target is a thing accompanied by a change in a state such as movement or fluctuation, or an event, and a person, a vehicle, etc. accompanied by a movement, a stock price accompanied by a fluctuation, or the like can be the target. For example, the model
Here, the model
また、ここで、モデルとは、観測対象の観測値から推定される状態(モデルパラメータ)を確率密度分布に近似することが可能なプロセスである。また、モデルパラメータは、モデルの内部処理によって得られる1以上のデータであって、スカラ、ベクトル、行列、テンソル、関数など、その値の数学的表現は任意であるが、ここでは、ベクトルを用いて表現することとする。 Here, the model is a process capable of approximating a state (model parameter) estimated from an observation value of an observation target to a probability density distribution. The model parameter is one or more data obtained by internal processing of the model, and its mathematical expression such as a scalar, a vector, a matrix, a tensor, or a function is arbitrary. Here, a vector is used. To express.
ここでは、モデルパラメータ推定装置1は、時刻tにおけるモデルパラメータxtの解の候補となる仮説データ(以下、仮説という)をKt個(Ktは自然数)生成し、時刻tのk番目(k=0,1,…,Kt−1)の仮説xt (k)と、その仮説に対する重みwt (k)とのKt対により、以下の(1)式に示すモデルパラメータxtの確率密度分布p(xt)を近似するように動作するものとする。なお、δは、ディラック(Dirac)のデルタ関数である。また、仮説xt (k)は、モデルパラメータの候補であるため、モデルパラメータと同次元のデータであって、ベクトルを用いて表現する。
Here, the model
以下、図1を参照して、モデルパラメータ推定装置1の各構成について説明する。
図1に示すように、ここでは、モデルパラメータ推定装置1は、制御手段10と、仮説記憶手段20と、複数(N個)の仮説処理手段30(301,302,…,30N)と、再標本化手段40と、代表値演算手段50と、を備えている。
Hereinafter, with reference to FIG. 1, each structure of the model
As shown in FIG. 1, here, the model
制御手段10は、仮説記憶手段20に対するデータ(仮説、重み)のアクセス制御を行ったり、複数の仮説処理手段30、再標本化手段40および代表値演算手段50との間で、進行状況や終了状況に応じて、各手段の動作制御やデータの授受を行うものである。 The control means 10 performs access control of data (hypotheses, weights) to the hypothesis storage means 20, and progress status and end between a plurality of hypothesis processing means 30, resampling means 40 and representative value calculation means 50. Depending on the situation, operation control of each means and data exchange are performed.
具体的には、制御手段10は、N個の仮説処理手段301,302,…,30Nから、動作を行っていない(空き状態の)仮説処理手段30を検索し、仮説記憶手段20に記憶されるKt個の仮説(仮説群)を、空き状態の仮説処理手段30に仮説ごとに分配するスケジューリングを行う。そして、制御手段10は、仮説処理手段301,302,…,30Nが行った仮説の再標本化を行うように再標本化手段40を動作させたり、モデルパラメータの代表値を演算するように代表値演算手段50を動作させたりする制御を行う。
ここでは、制御手段10は、仮説アクセス制御手段11と、仮説並列処理制御手段12と、再標本化制御手段13と、代表値演算制御手段14と、を備えている。
Specifically, the control means 10 searches the hypothesis processing means 30 that is not operating (in an empty state) from the N hypothesis processing means 30 1 , 30 2 ,. Scheduling is performed to distribute the K t hypotheses (hypothesis group) stored in the hypothesis processing means 30 in an empty state for each hypothesis. Then, the control means 10 operates the re-sampling means 40 so as to re-sample the hypotheses performed by the hypothesis processing means 30 1 , 30 2 ,..., 30 N , or calculates a representative value of the model parameter. In this way, control for operating the representative value calculating means 50 is performed.
Here, the control means 10 includes a hypothesis access control means 11, a hypothesis parallel processing control means 12, a resampling control means 13, and a representative value calculation control means 14.
仮説アクセス制御手段11は、仮説記憶手段20に記憶されている仮説や重みに対するアクセス(読み出し、書き込み)を制御するものである。ここでは、仮説処理手段30、再標本化手段40および代表値演算手段50と、制御手段10内部の各手段は、この仮説アクセス制御手段11を介して、仮説記憶手段20に対して仮説や重みの読み出しや、書き込みを行うこととする。 The hypothesis access control means 11 controls access (reading and writing) to hypotheses and weights stored in the hypothesis storage means 20. Here, the hypothesis processing means 30, the resampling means 40, the representative value calculation means 50, and each means in the control means 10 are connected to the hypothesis storage means 20 via the hypothesis access control means 11. Reading and writing are performed.
仮説並列処理制御手段12は、空き状態の仮説処理手段30を検索し、仮説記憶手段20に記憶される複数(Kt個)の仮説を、仮説ごとに割り振る(分配する)スケジューリングを行うものである。
この仮説並列処理制御手段12は、ある時刻tにおいて、仮説記憶手段20に記憶されている複数の仮説の中で、更新されていない時刻(t−1)の仮説および重みを更新するように、仮説更新処理を行っていない空き状態の仮説処理手段30を動作させて、未更新の仮説を特定する識別番号(例えば、k番目)を通知する。これによって、動作を指示された仮説処理手段30が、時刻(t−1)におけるk番目の仮説および重みから、時刻tにおけるk番目の仮説および重みを生成し、仮説記憶手段20に書き込むことで、仮説および重みを更新する。
The hypothesis parallel
The hypothesis parallel
なお、仮説処理手段301,302,…,30Nが空き状態であるか否かは、フラグによって判定することができる。例えば、仮説並列処理制御手段12は、ある仮説処理手段30に仮説および重みの更新を指示した段階で、当該仮説処理手段30に対応したフラグをセットし、更新完了の通知を取得した段階で、そのフラグをリセットする。例えば、仮説並列処理制御手段12は、図3に示すような状態管理テーブルによって、仮説処理手段301,302,…,30Nがそれぞれ動作状態(例えば、“1”)であるか、空き状態(例えば、“0”)であるかを示す値を対応付けて状態を保持し、管理する。この状態管理テーブルは、図示を省略したメモリ等に設定すればよい。なお、仮説並列処理制御手段12は、図3に示すように、動作状態時に、どの仮説を処理しているのかを仮説番号kとして設定することとする。
Incidentally, the hypothesis processing means 30 1, 30 2, ..., is whether 30 or N is empty, it can be determined by a flag. For example, the hypothesis parallel processing control means 12 sets a flag corresponding to the hypothesis processing means 30 at the stage of instructing a certain hypothesis processing means 30 to update the hypothesis and weight, and at the stage of obtaining a notification of update completion, Reset the flag. For example, the hypothesis parallel-
このように、仮説並列処理制御手段12は、空き状態の仮説処理手段30に対して、仮説および重みの更新を順次動作させることで、複数の仮説処理手段30によって、仮説ごとに並列処理を行うことができる。
そして、仮説並列処理制御手段12は、仮説記憶手段20に記憶されている仮説が次の時刻である時刻tの仮説にすべて更新された段階で、時刻を更新する。
なお、ここでは、仮説並列処理制御手段12は、仮説記憶手段20に記憶されている仮説が時刻tの仮説にすべて更新された段階で、その旨を再標本化制御手段13に通知し、さらに、仮説の再標本化が完了した段階で、その旨を代表値演算制御手段14に通知することとする。
As described above, the hypothesis parallel
Then, the hypothesis parallel processing control means 12 updates the time when all the hypotheses stored in the hypothesis storage means 20 are updated to the hypothesis at time t, which is the next time.
Here, the hypothesis parallel processing control means 12 notifies the resampling control means 13 to that effect when all the hypotheses stored in the hypothesis storage means 20 have been updated to the hypotheses at time t, When the hypothesis re-sampling is completed, the representative value calculation control means 14 is notified to that effect.
再標本化制御手段13は、仮説記憶手段20に記憶されている複数の仮説(仮説群)を再標本化する再標本化手段40に対して、起動制御を行うものである。
この再標本化制御手段13は、仮説並列処理制御手段12から、仮説記憶手段20に記憶されている仮説が時刻tの仮説にすべて更新された旨が通知された段階、すなわち、一定時間間隔(ここでは時刻t)で再標本化手段40を起動する。
The resampling control means 13 performs activation control on the resampling means 40 for resampling a plurality of hypotheses (hypotheses group) stored in the hypothesis storage means 20.
This re-sampling control means 13 is in a stage when it is notified from the hypothesis parallel processing control means 12 that all the hypotheses stored in the hypothesis storage means 20 have been updated to the hypotheses at time t, that is, at a constant time interval ( Here, the resampling means 40 is activated at time t).
なお、再標本化手段40は、必ずしも定期的に起動する必要はなく、例えば、再標本化制御手段13は、仮説記憶手段20に記憶されている複数の仮説(仮説群)の状態を検出し、その状態が予め定めた条件を満たした場合に起動することとしてもよい。
例えば、この条件として、再標本化制御手段13は、仮説記憶手段20に記憶されている仮説群における重み配分が極端に偏在したことを条件として再標本化手段40を起動する。なお、重み配分が偏在しているか否かの判定は、仮説記憶手段20に記憶されている重み値集合の統計量(例えば、重み値の分散、重み値の標準偏差、重み値の最大値と最小値の差など)や、重み値集合を大津の二値化手法などにより2クラスに分けたときのクラス内分散とクラス間分散に基づき計算される数量(例えば、クラス間分散とクラス内分散の比によって定義される分離度)等によって判定することができる。
また、前記条件として、予め定めた最小値よりも重みの小さい仮説が、予め定めた数より多くなったことを条件としてもよい。
Note that the resampling means 40 does not necessarily have to be activated periodically. For example, the resampling control means 13 detects the states of a plurality of hypotheses (hypotheses group) stored in the hypothesis storage means 20. It may be activated when the state satisfies a predetermined condition.
For example, as this condition, the
The condition may be that the number of hypotheses having a weight smaller than a predetermined minimum value is greater than a predetermined number.
代表値演算制御手段14は、仮説記憶手段20に記憶されている複数の仮説から、代表値を生成する代表値演算手段50に対して、起動制御を行うものである。
この代表値演算制御手段14は、仮説並列処理制御手段12から、仮説記憶手段20に記憶されている仮説が再標本化された旨を通知された段階、すなわち、一定時間間隔(ここでは時刻t)で代表値演算手段50を起動する。
The representative value calculation control means 14 performs activation control on the representative value calculation means 50 that generates a representative value from a plurality of hypotheses stored in the hypothesis storage means 20.
The representative value calculation control means 14 is in a stage when it is notified from the hypothesis parallel processing control means 12 that the hypothesis stored in the hypothesis storage means 20 has been resampled, that is, at a certain time interval (here, time t ) Activates the representative value calculating means 50.
なお、代表値演算手段50は、必ずしも定期的に起動する必要はなく、例えば、モデルパラメータ推定装置1を操作するユーザから要求があった場合、すなわち、外部から図示を省略した入力手段を介して代表値(推定値)を出力する旨の指示信号が入力されたときのみに起動することとしてもよい。
The representative value calculation means 50 does not necessarily have to be started periodically. For example, when there is a request from a user who operates the model
仮説記憶手段20は、仮説処理手段30によって演算されるモデルパラメータの仮説と、その仮説の重要度を示す重みとを、時刻に対応付けて複数記憶するものである。この仮説記憶手段20は、ハードディスク、半導体メモリ等、一般的な記憶装置で構成することができる。ここでは、時刻tにおける仮説の総数をKt個(Ktは自然数)とし、そのk番目(k=0,1,…,Kt−1)の仮説をxt (k)とし、k番目の重みをwt (k)とする。この仮説記憶手段20には、図4に示すように、k番目を示す仮説番号ごとに、仮説と、重みと、当該仮説が生成された時刻とを対応付けて記憶しておくこととする。
なお、初期状態(時刻t=0)においては、仮説記憶手段20に、事前にKt個の仮説と重みが予め記憶されているものとする。
この仮説記憶手段20に記憶されている仮説および重みは、制御手段10によって読み出され、仮説処理手段30によって新たな仮説および重みが生成された段階で、制御手段10によって更新される。
The hypothesis storage means 20 stores a plurality of model parameter hypotheses calculated by the hypothesis processing means 30 and a weight indicating the importance of the hypothesis in association with the time. The hypothesis storage means 20 can be composed of a general storage device such as a hard disk or a semiconductor memory. Here, the total number of hypotheses at time t is K t (K t is a natural number), the k th (k = 0, 1,..., K t −1) hypothesis is x t (k) , and the k th Let w t (k) be the weight of. As shown in FIG. 4, the hypothesis storage means 20 stores a hypothesis, a weight, and a time when the hypothesis is generated in association with each hypothesis number indicating the kth.
In the initial state (time t = 0), it is assumed that K t hypotheses and weights are stored in advance in the
The hypothesis and weight stored in the
仮説処理手段30は、過去の仮説あるいは観測値から、予め定めた逐次モンテカルロ法の提案分布に基づく標本化(標本抽出)を行うことで、現時点における仮説および重みを生成するものである。なお、この仮説処理手段30は、複数(301,302,…,30N)備えられ、それぞれ並列に動作する。
また、それぞれの仮説処理手段301,302,…,30Nは、制御手段10から、時刻(t−1)において推定した仮説xt−1 (k)を特定する識別番号(ここでは、仮説番号k)を通知されることで、時刻tにおけるk番目の仮説xt (k)および重みwt (k)を生成する。
The hypothesis processing means 30 generates hypotheses and weights at the present time by performing sampling (sampling) based on a proposed distribution of a predetermined sequential Monte Carlo method from past hypotheses or observation values. The hypothesis processing means 30 is provided in a plurality (30 1 , 30 2 ,..., 30 N ) and operates in parallel.
Further, each hypothesis processing means 30 1 , 30 2 ,..., 30 N receives an identification number (here, the hypothesis x t-1 (k) estimated at time (t−1) from the control means 10. By being notified of the hypothesis number k), the k-th hypothesis x t (k) and the weight w t (k) at time t are generated.
ここで、図2を参照(適宜図1参照)して、仮説処理手段30の詳細な構成について説明する。
図2に示すように、仮説処理手段30は、モンテカルロ標本化手段31と、観測模擬手段32と、尤度評価手段33と、重み更新手段34と、を備えている。
Here, the detailed configuration of the hypothesis processing means 30 will be described with reference to FIG.
As shown in FIG. 2, the hypothesis processing means 30 includes a Monte Carlo sampling means 31, an observation simulation means 32, a likelihood evaluation means 33, and a weight update means 34.
モンテカルロ標本化手段31は、制御手段10から通知される時刻(t−1)におけるk番目の仮説xt−1 (k)から、時刻tにおける仮説xt (k)を生成するものである。なお、モンテカルロ標本化手段31は、制御手段10から通知された時刻(t−1)以前の仮説x0 (k),x1 (k),…,xt−1 (k)および時刻t以前における観測値y0,y1,…,ytの一つ以上から時刻tにおける仮説xt (k)を生成することとしてもよい。
The Monte
ここでは、モンテカルロ標本化手段31は、例えば、観測値の履歴(y0,y1,…,yt)と仮説の履歴(x0 (k),x1 (k),…,xt−1 (k))とに基づき、以下の(2)式に示す予め定めた提案分布πから、(3)式に示すように標本抽出を行うことで、時刻tの仮説xt (k)を生成する。 Here, the Monte Carlo sampling means 31 is, for example, the observation value history (y 0 , y 1 ,..., Y t ) and the hypothesis history (x 0 (k) , x 1 (k) ,..., X t− ) . 1 (k) ), sampling is performed as shown in Equation (3) from a predetermined proposal distribution π shown in Equation (2) below, and hypothesis x t (k) at time t is obtained . Generate.
ここで、提案分布とは、対応するモデルから直接標本(サンプル)を抽出する代わりに、別の分布関数(より容易に標本抽出可能な分布関数を用いることが好ましい)を用いて近似を行った分布関数(Proposal distribution)である。
また、ここで、標本抽出とは、提案分布πと分布が近似するように、母集団(仮説や観測値の履歴)から、標本をランダムに選択することである。
なお、ここでは、モンテカルロ標本化手段31は、提案分布πの一例として、以下の(4)式に示すように、確率密度関数p(事前遷移確率)を用いることとする。
Here, the proposed distribution is approximated using another distribution function (preferably a distribution function that can be sampled more easily) instead of extracting a sample (sample) directly from the corresponding model. It is a distribution function (Proposal distribution).
Here, sampling means to randomly select a sample from a population (hypothesis or history of observation values) so that the distribution is approximate to the proposed distribution π.
Here, the Monte Carlo sampling means 31 uses a probability density function p (prior transition probability) as shown in the following equation (4) as an example of the proposed distribution π.
例えば、時刻tの仮説xt (k)を生成する際に、当該仮説xt (k)が確率的に無作為(ランダム)に決定される分散共分散行列Σvのランダムウォークにより状態が遷移する場合、モンテカルロ標本化手段31は、(4)式の確率密度関数pとして、以下の(5)式の確率密度関数p(xt|xt−1)を用いることができる。
For example, when generating a hypothesis x t (k) at time t, the state transitions by a random walk of the variance-covariance matrix Σ v in which the hypothesis x t (k) is determined randomly (randomly). In this case, the Monte
ここで、「dim」は、仮説xtの情報の次元数を示す。
この確率密度関数pを使用する場合、モンテカルロ標本化手段31は、制御手段10から通知される仮説xt−1 (k)から、時刻tにおける仮説xt (k)を生成することになる。
Here, the "dim" indicates the number of dimensions of information of the hypothesis x t.
When this probability density function p is used, the Monte
このように、モンテカルロ標本化手段31は、予め定めた提案分布(あるいは、確率密度関数)から、標本抽出を行うことで、時刻tの仮説xt (k)を生成する。そして、モンテカルロ標本化手段31は、生成した時刻tの仮説xt (k)を、制御手段10を介して仮説記憶手段20に書き込み、仮説を更新する。また、ここでは、モンテカルロ標本化手段31は、生成した時刻tの仮説xt (k)を観測模擬手段32に出力する。
In this way, the Monte Carlo sampling means 31 generates a hypothesis x t (k) at time t by sampling from a predetermined proposal distribution (or probability density function). Then, the Monte
観測模擬手段32は、モンテカルロ標本化手段31で標本化され生成された仮説が、予めモデル化した観測モデルによりどのような観測値として観測されるかを模擬(演算)するものである。
ここでは、この観測模擬手段32は、モンテカルロ標本化手段31で標本化され生成された時刻tにおけるモデルパラメータ(仮説xt (k))が、観測モデルp(yt|xt)により、以下の(6)式に示すように、k番目の観測値yt (k)を模擬結果(模擬観測値)として生成する。
The
Here, the observation simulation means 32 uses the observation model p (y t | x t ) as a model parameter (hypothesis x t (k) ) at time t sampled and generated by the Monte Carlo sampling means 31. As shown in Equation (6), the k-th observation value y t (k) is generated as a simulation result (simulation observation value).
より具体的には、この観測モデルpは、以下の(7)式に示すように、模擬観測値ytが、モデルパラメータxtを関数htにより算出された結果として生成されるモデルとして定義してもよい。 More specifically, the observation model p, as shown in the following equation (7), defined as a model which simulated observations y t is generated as a result of the calculated model parameter x t by a function h t May be.
この関数htは、例えば、観測モデルが、等加速度運動モデル、等速度運動モデルである場合、時刻(t−1)の位置から、等加速度、等速度によって時刻tの位置を算出する関数である。すなわち、関数htは、観測モデルに応じて、予め定めた関数によって定義しておけばよい。 For example, when the observation model is a constant acceleration motion model or a constant velocity motion model, this function h t is a function for calculating the position at time t from the position at time (t−1) by the constant acceleration and constant velocity. is there. That is, the function h t, depending on the observation model, it is sufficient to define the predetermined function.
このように、観測模擬手段32は、モンテカルロ標本化手段31で標本化され生成された仮説を、観測モデルにより模擬することで、模擬観測値yt (k)を生成する。そして、観測模擬手段32は、模擬(演算)した結果の観測値(模擬観測値yt (k))を尤度評価手段33に出力する。
In this way, the
尤度評価手段33は、外部から入力される観測値(入力観測値)に基づいて、観測模擬手段32で生成された模擬結果(模擬観測値)がどれだけ尤もらしい結果であるか(どれだけ近似した値であるか)を示す尤度を算出するものである。
ここでは、尤度評価手段33は、観測模擬手段32で生成された模擬結果である時刻tにおける模擬観測値yt (k)と、外部から入力される時刻tにおける入力観測値ytとを比較し、尤度Lt (k)を算出する。この尤度Lt (k)は、好ましくは、模擬観測値yt (k)と入力観測値ytとが近いほど大きな値をとることとする。
Likelihood evaluation means 33 is based on the observation value (input observation value) input from the outside, how much the simulation result (simulation observation value) generated by observation simulation means 32 is a likely result (how much) The likelihood indicating whether or not it is an approximate value is calculated.
Here, the
例えば、尤度評価手段33は、以下の(8)式に示すマハラノビス(Mahalanobis)距離に基づくガウス関数によって尤度Lt (k)を定義することができる。 For example, the likelihood evaluation means 33 can define the likelihood L t (k) by a Gaussian function based on the Mahalanobis distance shown in the following equation (8).
ここで、Σyは、観測空間を正規化してマハラノビス距離を定義するための分散共分散行列であり、Tは転置を示す。これによって、尤度Lt (k)は、模擬観測値yt (k)と入力観測値ytとが近いほど大きな値となる。 Here, Σ y is a variance covariance matrix for defining the Mahalanobis distance by normalizing the observation space, and T indicates transposition. As a result, the likelihood L t (k) increases as the simulated observation value y t (k) and the input observation value y t are closer.
また、例えば、尤度評価手段33は、以下の(9)式に示すように、マハラノビス距離に基づく指数関数によって、尤度Lt (k)を定義することとしてもよい。 Further, for example, the likelihood evaluating means 33 may define the likelihood L t (k) by an exponential function based on the Mahalanobis distance as shown in the following equation (9).
このように、尤度評価手段33は、入力観測値から、観測模擬手段32で生成された模擬観測値の尤度を算出する。そして、尤度評価手段33は、算出した尤度を重み更新手段34に出力する。
In this way, the likelihood evaluation means 33 calculates the likelihood of the simulated observation value generated by the observation simulation means 32 from the input observation value. Then, the
重み更新手段34は、尤度評価手段33で算出された尤度Lt (k)に基づいて、制御手段10から通知される時刻(t−1)におけるk番目の重みwt−1 (k)から、時刻tにおける重みwt (k)を生成し、重みを更新するものである。
すなわち、重み更新手段34は、尤度評価手段33で算出された尤度Lt (k)が大きければ、時刻tの仮説xt (k)がより尤もらしいものとして、その仮説に対する重みを増加させ、尤度Lt (k)が小さければ、その仮説に対する重みを減少させる。
The
That is, if the likelihood L t (k) calculated by the
例えば、モンテカルロ標本化手段31が、前記(3)式により、提案分布πによって時刻tの仮説xt (k)を生成した場合であれば、重み更新手段34は、以下の(10)式により、時刻(t−1)における重みwt−1 (k)から、時刻tにおける重みwt (k)を生成する。 For example, if the Monte Carlo sampling means 31 generates a hypothesis x t (k) at time t from the proposed distribution π according to the expression (3), the weight updating means 34 is expressed by the following expression (10). , from the time the weight w t-1 (k) in the (t-1), to produce the weight w t (k) at time t.
また、例えば、モンテカルロ標本化手段31が、前記(5)式により、提案分布πとして確率密度関数pを用いて時刻tの仮説xt (k)を生成した場合であれば、重み更新手段34は、以下の(11)式により、時刻(t−1)における重みwt−1 (k)から、時刻tにおける重みwt (k)を生成する。 Further, for example, if the Monte Carlo sampling means 31 generates the hypothesis x t (k) at time t using the probability density function p as the proposed distribution π according to the above equation (5), the weight update means 34 Generates the weight w t (k) at time t from the weight w t-1 (k) at time (t−1) by the following equation (11).
このように、重み更新手段34は、時刻(t−1)における重みwt−1 (k)を、尤度評価手段33で算出された尤度Lt (k)に基づいて更新し、時刻tにおける重みwt (k)を生成する。そして、重み更新手段34は、更新した重みwt (k)を、制御手段10を介して仮説記憶手段20に書き込み、重みを更新する。
Thus, the
以上説明したように、仮説処理手段30は、制御手段10から通知されるk番目の時刻(t−1)における仮説xt−1 (k)およびその重みwt−1 (k)を仮説記憶手段20から読み出し、時刻tにおける新たな仮説xt (k)およびその重みwt (k)を生成し、制御手段10を介して仮説記憶手段20に書き込む。
As described above, the hypothesis processing means 30 stores the hypothesis x t-1 (k) and its weight w t-1 (k) at the k-th time (t−1) notified from the control means 10 as a hypothesis memory. Read from the
なお、制御手段10において、時刻(t−1)におけるすべての仮説が処理されるまで、仮説処理手段30には、制御手段10から時刻(t−1)における他の仮説および重みが通知される場合がある。そこで、仮説処理手段30は、新たな時刻tの仮説が入力されるまでは、観測値ytを図示を省略した記憶手段(メモリ)に保持しておくものとする。
図1に戻って、モデルパラメータ推定装置1の全体構成について説明を続ける。
The hypothesis processing means 30 is notified of other hypotheses and weights at time (t-1) from the control means 10 until all hypotheses at time (t-1) are processed in the control means 10. There is a case. Therefore, the hypothesis processing means 30, until the hypothesis of new time t is entered, it is assumed to hold the illustrated observations y t to omit the storage means (memory).
Returning to FIG. 1, the description of the overall configuration of the model
再標本化手段40は、仮説記憶手段20に記憶されている仮説を再編成するものである。ここで、仮説を再編成するとは、仮説(モデルパラメータ)が予め定めた分布に近似するように仮説を再度抽出し直すことをいう。この再標本化手段40は、制御手段10によって、一定時間間隔(ここでは時刻t)で起動されるものとする。
ここでは、再標本化手段40は、仮説記憶手段20に記憶されている以下の(12)式に示した時刻(t−1)における仮説および重みのKt−1個の対のデータを読み出し、以下の(13)式に示した時刻tにおける仮説および重みのKt個の対のデータに再編成し、仮説記憶手段20に書き込む。例えば、Kt=Kt−1=Kt−2=…=K0=定数〔K〕としても構わない。
The resampling means 40 reorganizes the hypotheses stored in the hypothesis storage means 20. Here, reorganizing a hypothesis means extracting the hypothesis again so that the hypothesis (model parameter) approximates a predetermined distribution. The re-sampling means 40 is assumed to be activated by the control means 10 at regular time intervals (here, time t).
Here, the resampling means 40 reads the data of K t−1 pairs of hypotheses and weights at time (t−1) shown in the following equation (12) stored in the hypothesis storage means 20. The data is rearranged into K t pairs of hypotheses and weights at time t shown in the following equation (13), and written in the hypothesis storage means 20. For example, K t = K t−1 = K t−2 =... = K 0 = constant [K] may be used.
このとき、再編成される(13)式が近似する分布(確率密度分布)と、(12)式が近似する分布(確率密度分布)とは、互いに類似することが好ましい。
例えば、再標本化手段40は、k番目の新しい仮説xt (k)を、以下の(14)式に示すxに関する確率密度分布D(x)から標本を抽出することで生成する。
At this time, it is preferable that the distribution (probability density distribution) approximated by Equation (13) to be reorganized and the distribution (probability density distribution) approximated by Equation (12) are similar to each other.
For example, the resampling means 40 generates the k-th new hypothesis x t (k) by extracting a sample from the probability density distribution D (x) regarding x shown in the following equation (14).
また、δは、ディラック(Dirac)のデルタ関数である。
ここで、この確率密度分布D(x)から標本を抽出する手法について説明する。
まず、再標本化手段40は、時刻(t−1)の重みwt−1 (k)(k=0,1,…,Kt−1−1)を正規化し、かつ、kに関して累積した数列((15)式)を、以下の(16)式により算出する。
Further, δ is a Dirac delta function.
Here, a method for extracting a sample from the probability density distribution D (x) will be described.
First, the resampling means 40 normalizes the weight w t−1 (k) (k = 0, 1,..., K t−1 −1) at time (t−1) and accumulates it with respect to k. The numerical sequence (Equation (15)) is calculated by the following Equation (16).
次に、再標本化手段40は、k番目(k=0,1,…,Kt−1)〔Ktは自然数,例えば、Kt=Kt−1=Kt−2=…=K0=定数〔K〕〕の標本u(k)を、以下の(17)式に示すように、0以上1未満の連続一様分布Uから標本抽出する。 Next, the re-sampling means 40 uses the k-th (k = 0, 1,..., K t −1) [K t is a natural number, eg, K t = K t−1 = K t−2 =. A sample u (k) of 0 = constant [K]] is sampled from a continuous uniform distribution U of 0 or more and less than 1 as shown in the following equation (17).
なお、この標本抽出は、擬似乱数によってランダムに抽出するが、当該擬似乱数の取り得る値域を0以上1未満に正規化することで、分布Uに近似した標本を抽出することができる。
そして、再標本化手段40は、以下の(18)式により、k番目の新しい仮説xt (k)を生成する。
This sample extraction is performed randomly using pseudo-random numbers, but a sample approximated to the distribution U can be extracted by normalizing the range that the pseudo-random numbers can take to be 0 or more and less than 1.
Then, the resampling means 40 generates the k-th new hypothesis x t (k) by the following equation (18).
また、再標本化手段40は、新しい重みwt (k)として、以下の(19)式に示すように、一様な値を設定する。 Further, the resampling means 40 sets a uniform value as shown in the following equation (19) as the new weight w t (k) .
このように、再標本化手段40は、仮説記憶手段20に記憶されている仮説を再標本化することで、仮説がパラメータ空間内において極端に偏在したり、重みの小さい仮説が多くなることを防止することができる。 As described above, the resampling means 40 resamples the hypotheses stored in the hypothesis storage means 20, so that the hypotheses are extremely unevenly distributed in the parameter space or there are many hypotheses with small weights. Can be prevented.
代表値演算手段50は、仮説記憶手段20に記憶されている仮説から代表値を求め、モデルパラメータの推定値として出力するものである。この代表値演算手段50は、制御手段10によって、一定時間間隔(ここでは時刻t)で起動されるものとする。
ここでは、代表値演算手段50は、仮説記憶手段20に記憶されている以下の(20)式に示した時刻tにおける仮説および重みのKt個の対のデータを読み出し、代表値を求める。
The representative value calculation means 50 obtains a representative value from the hypothesis stored in the hypothesis storage means 20 and outputs it as an estimated value of the model parameter. The representative value calculation means 50 is started by the control means 10 at a constant time interval (here, time t).
Here, the representative value calculation means 50 reads K t pairs of hypotheses and weights at time t shown in the following equation (20) stored in the hypothesis storage means 20 and obtains representative values.
ここでは、代表値演算手段50は、(20)式の仮説および重みを用いて、以下の(21)式に示す演算により、仮説の加重平均(重み付き平均)を求め、代表値xrepとする。 Here, the representative value calculating means 50 obtains a weighted average (weighted average) of the hypothesis by using the hypothesis and weight of the equation (20), and calculates the representative value x rep and To do.
なお、代表値演算手段50は、加重平均に限定されず、統計的処理により種々の値を代表値とすることができる。例えば、代表値演算手段50は、すべての仮説の相加平均を代表値としたり、最も重みが大きい仮説を代表値としたり等、他の統計的処理によって代表値を求めることとしてもよい。 The representative value calculation means 50 is not limited to the weighted average, and various values can be used as representative values by statistical processing. For example, the representative value calculating means 50 may obtain the representative value by other statistical processing such as using an arithmetic average of all hypotheses as a representative value, or using a hypothesis having the largest weight as a representative value.
以上説明したようにモデルパラメータ推定装置1を構成することで、逐次モンテカルロ法により、モデルパラメータを推定する際に、確率分布を近似する十分な仮説を用いたとしても、仮説ごとに、複数の仮説処理手段30によって、並列して演算を行うことができるため、高速に状態推定を行うことができる。
なお、モデルパラメータ推定装置1は、一般的なコンピュータを前記した各手段として機能させるプログラム(モデルパラメータ推定プログラム)により動作させることができる。
By configuring the model
Note that the model
[モデルパラメータ推定装置の動作]
次に、図5を参照(構成については、適宜図1参照)して、本発明の実施形態に係るモデルパラメータ推定装置の動作について説明する。
まず、モデルパラメータ推定装置1は、制御手段10の仮説並列処理制御手段12によって、時刻tを初期化する(ステップS1)。例えば、初期値として変数tに値“0”を設定する。
[Operation of model parameter estimation device]
Next, the operation of the model parameter estimation apparatus according to the embodiment of the present invention will be described with reference to FIG.
First, the model
そして、モデルパラメータ推定装置1は、制御手段10の仮説並列処理制御手段12によって、複数の仮説処理手段301,302,…,30Nに対して、仮説記憶手段20に記憶されている複数の仮説および重み(仮説群)を分担して処理させる仮説並列処理を行う(ステップS2)。この仮説並列処理は、仮説並列処理制御手段12が、空き状態の仮説処理手段30を検索し、仮説記憶手段20に記憶される複数(Kt個)の仮説を、空き状態の仮説処理手段30に分配することで、複数の仮説処理手段301,302,…,30Nで並列に複数の仮説更新処理を行う。
The model
ここで、図6を参照(構成については適宜図1,2参照)して、このステップS2の仮説並列処理について、詳細に説明を行う。
このステップS2において、まず、モデルパラメータ推定装置1は、制御手段10の仮説並列処理制御手段12によって、仮説処理手段301,302,…,30Nの中で、処理を行っていない空き状態の仮説処理手段30が存在するか否かを判定する(ステップS21)。なお、ここでは、仮説処理手段301,302,…,30Nが空き状態であるか否かはフラグによって判定することとし、仮説並列処理制御手段12が、初期段階で予めすべての仮説処理手段301,302,…,30Nが空き状態である旨のフラグを初期化(例えば、“0”)しておくこととする。
Here, referring to FIG. 6 (refer to FIGS. 1 and 2 as appropriate for the configuration), the hypothesis parallel processing in step S2 will be described in detail.
In this step S2, first, the model
ここで、空き状態の仮説処理手段30が存在しないと判定した場合(ステップS21でNo)、仮説並列処理制御手段12は、ステップS28に動作を移す。
一方、空き状態の仮説処理手段30が存在すると判定した場合(ステップS21でYes)、仮説並列処理制御手段12は、仮説処理手段30に対して、以下の仮説更新処理を実行させる。
Here, if it is determined that there is no empty hypothesis processing means 30 (No in step S21), the hypothesis parallel processing control means 12 moves the operation to step S28.
On the other hand, if it is determined that there is an empty hypothesis processing means 30 (Yes in step S21), the hypothesis parallel processing control means 12 causes the hypothesis processing means 30 to execute the following hypothesis update processing.
まず、仮説並列処理制御手段12は、空き状態の仮説処理手段30を起動し、時刻(t−1)のk番目の仮説xt−1 (k)および重みwt−1 (k)を更新する旨を指示する。なお、このとき、仮説並列処理制御手段12は、当該空き状態の仮説処理手段30に対応したフラグを、処理中となったことを示す値(例えば、“1”)にセットすることとする。
First, the hypothesis parallel
そして、仮説処理手段30は、制御手段10から通知される時刻(t−1)におけるk番目の仮説xt−1 (k)および重みwt−1 (k)を、仮説記憶手段20から読み出す(ステップS22)。
そして、仮説処理手段30は、ステップS22で仮説記憶手段20から読み出した時刻(t−1)におけるk番目の仮説xt−1 (k)および重みwt−1 (k)から、時刻tにおけるk番目の仮説xt (k)および重みwt (k)を生成する仮説更新処理を実行する。
Then, the hypothesis processing means 30 reads the kth hypothesis x t-1 (k) and the weight w t-1 (k) at the time (t−1) notified from the control means 10 from the hypothesis storage means 20. (Step S22).
Then, the hypothesis processing means 30 determines the time at the time t from the kth hypothesis x t-1 (k) and the weight w t-1 (k) at the time (t−1) read from the hypothesis storage means 20 in step S22. A hypothesis updating process for generating the kth hypothesis x t (k) and the weight w t (k) is executed.
すなわち、仮説処理手段30は、モンテカルロ標本化手段31によって、予め定めた提案分布(あるいは、確率密度関数)により、標本抽出を行うことで、時刻tにおける新たな仮説xt (k)を生成する(ステップS23)。例えば、モンテカルロ標本化手段31は、前記(5)式に示した確率密度関数p(xt|xt−1)により、仮説xt (k)を生成する。 In other words, the hypothesis processing means 30 generates a new hypothesis x t (k) at time t by sampling by the Monte Carlo sampling means 31 using a predetermined proposal distribution (or probability density function). (Step S23). For example, the Monte Carlo sampling means 31 generates a hypothesis x t (k) by the probability density function p (x t | x t−1 ) shown in the above equation (5).
そして、仮説処理手段30は、観測模擬手段32によって、ステップS22で標本化され生成された仮説xt (k)が、観測モデルによりどのような観測値(模擬観測値)として観測されるかを模擬(演算)する(ステップS24)。例えば、観測模擬手段32は、前記(7)式に示した予め観測モデルを定義した関数htの演算により、模擬観測値yt (k)を算出する。
Then, the hypothesis processing means 30 determines what observation value (simulated observation value) the hypothesis x t (k) sampled and generated in step S22 by the observation simulation means 32 is observed by the observation model. Simulation (calculation) is performed (step S24). For example, the
さらに、仮説処理手段30は、尤度評価手段33によって、時刻tにおいて外部から入力される観測値(入力観測値yt)に基づいて、ステップS24で演算された模擬観測値yt (k)がどれだけ尤もらしい結果であるかを評価する(ステップS25)。例えば、尤度評価手段33は、前記(8)式に示したマハラノビス距離に基づくガウス関数によって仮説を評価する尤度Lt (k)を算出する。 Further, the hypothesis processing means 30 is based on the observation value (input observation value y t ) input from the outside by the likelihood evaluation means 33 at the time t, and the simulated observation value y t (k) calculated in step S24. Is a plausible result (step S25). For example, the likelihood evaluation means 33 calculates the likelihood L t (k) for evaluating the hypothesis using a Gaussian function based on the Mahalanobis distance shown in the above equation (8).
そして、仮説処理手段30は、重み更新手段34によって、ステップS25で算出された尤度に基づいて、時刻(t−1)における重みwt−1 (k)から、時刻tにおける新たな重みwt (k)を生成する(ステップS26)。例えば、重み更新手段34は、前記(11)式に示すように、wt−1 (k)に尤度Lt (k)を乗算することで新たな重みwt (k)を生成する。
The hypothesis processing means 30 then calculates a new weight w at time t from the weight w t-1 (k) at time (t−1) based on the likelihood calculated at step S25 by the weight update means 34. t (k) is generated (step S26). For example, the
その後、仮説処理手段30は、ステップS23で生成された新たな仮説xt (k)と、ステップS26で生成された新たな重みwt (k)とを、制御手段10を介して、仮説記憶手段20に書き込む(ステップS27)。 Thereafter, the hypothesis processing means 30 stores the new hypothesis x t (k) generated in step S23 and the new weight w t (k) generated in step S26 via the control means 10 as a hypothesis memory. Write to the means 20 (step S27).
このステップS22からステップS27までの仮説更新処理動作によって、仮説処理手段30は、制御手段10から通知される時刻(t−1)におけるk番目の仮説xt−1 (k)および重みwt−1 (k)を、時刻tにおけるk番目の仮説xt (k)および重みwt (k)に更新する。なお、このとき、仮説処理手段30は、制御手段10に対して仮説処理を完了したことを通知する。これによって、制御手段10の仮説並列処理制御手段12は、当該仮説処理手段30に対応するフラグを、空き状態である旨の示す値(例えば、“0”)にセットする。
By the hypothesis update processing operation from step S22 to step S27, the
そして、仮説並列処理制御手段12は、仮説記憶手段20を参照し、時刻(t−1)における仮説xt−1 (k)および重みwt−1 (k)が、すべて時刻tにおける仮説xt (k)および重みwt (k)に更新されたか否かを判定する(ステップS28)。 Then, the hypothesis parallel processing control means 12 refers to the hypothesis storage means 20, and the hypothesis x t-1 (k) and the weight w t-1 (k) at time ( t-1 ) are all hypothesis x at time t. It is determined whether or not t (k) and weight w t (k) have been updated (step S28).
ここで、まだすべての仮説および重みが更新されていないと判定した場合(ステップS28でNo)、仮説並列処理制御手段12は、ステップS21に戻ってkを更新(ここでは、インクリメント)して動作を継続する。一方、すべての仮説および重みが更新されたと判定した場合(ステップS28でYes)、仮説並列処理制御手段12は、時刻tにおける仮説並列処理の動作を終了する。 If it is determined that all hypotheses and weights have not been updated yet (No in step S28), the hypothesis parallel processing control means 12 returns to step S21 to update k (increment here) and operate. Continue. On the other hand, if it is determined that all hypotheses and weights have been updated (Yes in step S28), the hypothesis parallel processing control means 12 ends the hypothesis parallel processing operation at time t.
なお、ここでは、ステップS21の判定後、順次、ステップS22からS27を動作した後、ステップS28の判定を行う手順で説明したが、このステップS22からS27までの仮説処理手段30の動作は、個々の仮説処理手段301,302,…,30Nが個別に並列して動作すればよい。 Here, after the determination in step S21, the steps S22 to S27 are sequentially operated, and then the procedure for performing the determination in step S28 has been described. However, the operation of the hypothesis processing means 30 from this step S22 to S27 is described individually. The hypothesis processing means 30 1 , 30 2 ,..., 30 N may be operated individually in parallel.
すなわち、仮説並列処理制御手段12は、ステップS21において、空き状態の仮説処理手段30を起動し、仮説更新処理(ステップS22からS27)の実行を指示した後は、その処理の完了を待たずに、ステップS28に移行する。これによって、仮説更新処理(ステップS22からS27)は、並列に動作することになる。
That is, the hypothesis parallel
なお、このとき、仮説並列処理制御手段12は、ステップS28において、すべての仮説および重みが更新されたと判定されなかった場合であっても、Kt個の仮説について、すでに仮説処理手段30に仮説更新処理を指示した場合、ステップS21には移行せず、すべての仮説処理が終了するまで待機し、すべての仮説および重みの更新が完了した時点で仮説並列処理の動作を終了することとする。 At this time, even if the hypothesis parallel processing control means 12 does not determine in step S28 that all hypotheses and weights have been updated, the hypothesis processing means 30 has already been processed with respect to the K t hypotheses. When the update process is instructed, the process does not proceed to step S21, but waits until all hypothesis processes are completed, and the operation of the hypothesis parallel process is terminated when the update of all hypotheses and weights is completed.
以上のステップS2の動作によって、仮説記憶手段20に記憶されている仮説および重みがすべて新たな時刻に対応して更新されることになる。
図5に戻って、モデルパラメータ推定装置1の全体動作について説明を続ける。
Through the operation in step S2, the hypotheses and weights stored in the hypothesis storage means 20 are all updated corresponding to the new time.
Returning to FIG. 5, the overall operation of the model
ステップS2の後、モデルパラメータ推定装置1は、制御手段10の再標本化制御手段13によって、再標本化手段40を起動し、仮説記憶手段20に記憶されている仮説の再標本化を行う(ステップS3)。この起動された再標本化手段40は、例えば、仮説記憶手段20に記憶されている仮説および重みから、前記(12)式に示した確率密度分布によって仮説を標本抽出することで再標本化を行い、新たな仮説および新たな重みを生成する。
After step S2, the model
その後、モデルパラメータ推定装置1は、制御手段10の代表値演算制御手段14によって、代表値演算手段50を起動し、仮説記憶手段20に記憶されている仮説から、代表値を演算して、モデルパラメータの推定値として出力する(ステップS4)。この代表値演算手段50は、例えば、仮説記憶手段20に記憶されている仮説および重みから、前記(21)式に示す重み付き平均演算によって、代表値を算出する。
Thereafter, the model
そして、モデルパラメータ推定装置1は、制御手段10によって、予め定めた最終時刻まで処理が終了したか否かを判定し(ステップS5)、処理が終了した場合(ステップS5でYes)、動作を終了する。一方、予め定めた最終時刻まで処理が終了していない場合(ステップS5でNo)、モデルパラメータ推定装置1は、時刻tを更新(インクリメント)し(ステップS6)、ステップS2に戻って、仮説の更新処理を継続する。
以上の動作によって、モデルパラメータ推定装置1は、複数の仮説処理手段30によって、仮説ごとに並列して演算を行うことができるため、高速に状態推定を行うことができる。
Then, the model
With the above operation, the model
以上、本発明の実施形態に係るモデルパラメータ推定装置1の構成および動作について説明したが、本発明は、この実施形態に限定されるものではない。
例えば、モデルパラメータ推定装置1において、仮説を再標本化する機能は、重みが過小な仮説が生じる無駄を回避し、有効な(重みの小さくない)仮説を増加させるため、仮説の集合が局所解に陥る危険を低減できる点で優れているが、必ずしも必須ではない。この仮説の標本化の機能を省略する場合、再標本化制御手段13および再標本化手段40を構成から省略すればよい。
The configuration and operation of the model
For example, in the model
以上説明したように、本発明に係るモデルパラメータ推定装置1は、複数の仮説処理手段30による並列演算によって、逐次モンテカルロ法の処理を高速に実行することができる。このように、複数の仮説処理手段30による並列処理を実現したことで、モデルパラメータ推定装置1は、並列ハードウェアで実装することも可能である。また、この並列処理は、複数のCPUを搭載した計算機や、マルチコア、ハイパースレッディング対応のCPUを搭載した計算機によるマルチスレッド処理、クラスタ計算機による並列演算処理にも適しており、ハードウェアリソースを有効に活用した高速演算処理が可能となる。
As described above, the model
また、モデルパラメータ推定装置1で演算可能な逐次モンテカルロ法は汎用性があるため、例えば、気象などの物理現象、金融システム、生体システムのモデルパラメータの推定に広く適用することができる。また、モデルパラメータ推定装置1は、機械学習におけるオンライン学習、映像・音声の復元処理などの逆問題解決法、制御系におけるオブザーバ、センサネットワークなど計測システムにおけるデータ融合など、逐次モンテカルロ法を適用可能な分野に応用することができる。
In addition, the sequential Monte Carlo method that can be calculated by the model
1 モデルパラメータ推定装置
10 制御手段
11 仮説アクセス制御手段
12 仮説並列処理制御手段
13 再標本化制御手段
14 代表値演算制御手段
20 仮説記憶手段
30 仮説処理手段
31 モンテカルロ標本化手段
32 観測模擬手段
33 尤度評価手段
34 重み更新手段
40 再標本化手段
50 代表値演算手段
DESCRIPTION OF
Claims (6)
前記パラメータの解の候補となる仮説データを当該仮説データの生成時刻と対応付けて複数記憶する仮説記憶手段と、
予め定めた前記パラメータの分布である逐次モンテカルロ法の提案分布に基づいて前記仮説データを標本抽出することで、新たな仮説データを生成し、前記生成時刻とともに前記仮説記憶手段に記憶されている仮説データを更新する複数の仮説処理手段と、
前記仮説記憶手段に記憶されている複数の仮説データを前記複数の仮説処理手段に分配して、前記複数の仮説処理手段を動作させる制御手段と、
前記仮説記憶手段に記憶されている複数の仮説データの代表値を、前記パラメータの解の推定値として演算する代表値演算手段と、を備え、
前記制御手段は、前記仮説処理手段が前記仮説データの更新処理の動作中であるか否かの状態を保持し、更新動作を行っていない仮説処理手段に対して、前記生成時刻に基づいて、前回の更新時刻以降で更新されていない仮説データを前記複数の仮説処理手段に分配し、前記仮説記憶手段に記憶されている仮説データが、前回の更新時刻以降の仮説データにすべて更新された段階で、前記更新時刻を次回の更新時刻に更新することを特徴とするモデルパラメータ推定装置。 In the model parameter estimation device that estimates the parameters of the model by the sequential Monte Carlo method,
Hypothesis storage means for storing a plurality of hypothesis data as candidate solutions of the parameter in association with the generation time of the hypothesis data ;
A new hypothesis data is generated by sampling the hypothesis data based on the proposed Monte Carlo method distribution, which is a predetermined parameter distribution, and the hypothesis stored in the hypothesis storage means together with the generation time A plurality of hypothesis processing means for updating data;
Control means for operating the plurality of hypothesis processing means by distributing a plurality of hypothesis data stored in the hypothesis storage means to the plurality of hypothesis processing means;
Representative value calculation means for calculating representative values of a plurality of hypothesis data stored in the hypothesis storage means as estimated values of the solution of the parameter,
The control means holds the state of whether or not the hypothesis processing means is in the process of updating the hypothesis data, based on the generation time for the hypothesis processing means not performing the update operation, the hypothesis data that have not been updated in the last update time later distributed to the plurality of hypotheses processing means, the hypothesis storage means hypothesis that have been stored in the data has been updated, all the hypotheses data since the last update time A model parameter estimation device, wherein the update time is updated to the next update time in a step.
前記仮説処理手段は、
前記提案分布により前記パラメータの解の候補となる仮説データを標本抽出して生成するモンテカルロ標本化手段と、
このモンテカルロ標本化手段で生成された仮説データから、予め定めた観測モデルにより更新後の観測値である模擬観測値を生成する観測模擬手段と、
外部から観測値を入力し、現時点で入力した観測値である入力観測値と、前記観測模擬手段で生成された模擬観測値とが近似する度合いを示す尤度を算出する尤度評価手段と、
この尤度評価手段で算出された尤度に基づいて、前記入力観測値と前記模擬観測値とが近いほど値が大きくなるように前記重みを更新する重み更新手段と、を備え、
前記代表値演算手段は、前記仮説記憶手段に記憶されている複数の仮説データを、当該仮説データに対応する重みに基づいて加重平均することで、前記代表値を演算することを特徴とする請求項1に記載のモデルパラメータ推定装置。 The hypothesis storage means stores a weight indicating the importance of the hypothesis data in association with the hypothesis data,
The hypothesis processing means includes
Monte Carlo sampling means for sampling and generating hypothesis data that is a candidate for the parameter solution by the proposed distribution;
Observation simulation means for generating simulated observation values, which are observation values updated by a predetermined observation model, from hypothesis data generated by this Monte Carlo sampling means,
A likelihood evaluation unit that inputs an observation value from the outside and calculates a likelihood indicating a degree of approximation between the input observation value that is an observation value input at the present time and the simulated observation value generated by the observation simulation unit;
Based on the likelihood calculated by the likelihood evaluation means, the weight update means for updating the weight so that the value becomes larger as the input observation value and the simulated observation value are closer,
The representative value calculating unit calculates the representative value by performing a weighted average of a plurality of hypothesis data stored in the hypothesis storage unit based on a weight corresponding to the hypothesis data. Item 2. The model parameter estimation device according to Item 1 .
前記制御手段は、前記仮説記憶手段に記憶されている複数の仮説データにおいて、予め定めた最小値よりも重みの小さい仮説データが、予め定めた数より多くなった場合に、前記再標本化手段を動作させることを特徴とする請求項2に記載のモデルパラメータ推定装置。 Re-sampling means for re-sampling a plurality of hypothesis data stored in the hypothesis storage means with a predetermined probability density distribution;
In the plurality of hypothesis data stored in the hypothesis storage means, the control means resamples the hypothesis data when hypothesis data having a weight smaller than a predetermined minimum value exceeds a predetermined number. The model parameter estimation apparatus according to claim 2 , wherein the model parameter estimation apparatus is operated.
前記パラメータの解の候補となる仮説データを当該仮説データの生成時刻と対応付けて複数記憶する仮説記憶手段において、予め定めた前記パラメータの分布である逐次モンテカルロ法の提案分布に基づいて前記仮説データを標本抽出することで、新たな仮説データを生成し、前記生成時刻とともに前記仮説記憶手段に記憶されている仮説データを更新する複数の仮説処理手段、
前記仮説記憶手段に記憶されている複数の仮説データを前記複数の仮説処理手段に分配して、前記複数の仮説処理手段を動作させる制御手段、
前記仮説記憶手段に記憶されている複数の仮説データの代表値を、前記パラメータの解の推定値として演算する代表値演算手段、として機能させ、
前記制御手段は、前記仮説処理手段が前記仮説データの更新処理の動作中であるか否かの状態を保持し、更新動作を行っていない仮説処理手段に対して、前記生成時刻に基づいて、前回の更新時刻以降で更新されていない仮説データを前記複数の仮説処理手段に分配し、前記仮説記憶手段に記憶されている仮説データが、前回の更新時刻以降の仮説データにすべて更新された段階で、前記更新時刻を次回の更新時刻に更新することを特徴とするモデルパラメータ推定プログラム。 To estimate the parameters of the model by the sequential Monte Carlo method,
In a hypothesis storage means for storing a plurality of hypothesis data that are candidates for the parameter solution in association with the generation time of the hypothesis data, the hypothesis data based on a proposed distribution of the sequential Monte Carlo method that is a predetermined distribution of the parameters the by sampling, to generate new hypotheses data, a plurality of hypotheses processing means to update the hypotheses data stored in the hypothesis storage means together with the generation time,
Control means for distributing the plurality of hypothesis data stored in the hypothesis storage means to the plurality of hypothesis processing means and operating the plurality of hypothesis processing means;
A representative value calculation means for calculating a representative value of a plurality of hypothesis data stored in the hypothesis storage means as an estimated value of the solution of the parameter;
The control means holds the state of whether or not the hypothesis processing means is in the process of updating the hypothesis data, based on the generation time for the hypothesis processing means not performing the update operation, the hypothesis data that have not been updated in the last update time later distributed to the plurality of hypotheses processing means, the hypothesis storage means hypothesis that have been stored in the data has been updated, all the hypotheses data since the last update time A model parameter estimation program that updates the update time to the next update time in a step.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010222017A JP5560154B2 (en) | 2010-09-30 | 2010-09-30 | Model parameter estimation apparatus and program thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010222017A JP5560154B2 (en) | 2010-09-30 | 2010-09-30 | Model parameter estimation apparatus and program thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012078980A JP2012078980A (en) | 2012-04-19 |
JP5560154B2 true JP5560154B2 (en) | 2014-07-23 |
Family
ID=46239184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010222017A Active JP5560154B2 (en) | 2010-09-30 | 2010-09-30 | Model parameter estimation apparatus and program thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5560154B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180098111A (en) * | 2017-02-24 | 2018-09-03 | 고려대학교 산학협력단 | Apparatus and method for recommendation of curling game strategy using deep learning |
US11262407B2 (en) | 2019-12-02 | 2022-03-01 | Samsung Electronics Co., Ltd. | Method and apparatus with battery state estimation |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5845054B2 (en) * | 2011-10-25 | 2016-01-20 | 日本放送協会 | Resampling equipment |
JP6277638B2 (en) * | 2013-09-06 | 2018-02-14 | 沖電気工業株式会社 | Signal processing apparatus, signal processing method, and computer program |
JP6901037B1 (en) * | 2020-12-18 | 2021-07-14 | 富士電機株式会社 | Control devices, control methods and programs |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4072017B2 (en) * | 2002-08-02 | 2008-04-02 | 日本放送協会 | State estimation device, method and program thereof, current state estimation device and future state estimation device |
JP4820132B2 (en) * | 2005-09-06 | 2011-11-24 | 日本放送協会 | State estimation device and program thereof, and integrated state estimation system and integrated state estimation device |
-
2010
- 2010-09-30 JP JP2010222017A patent/JP5560154B2/en active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180098111A (en) * | 2017-02-24 | 2018-09-03 | 고려대학교 산학협력단 | Apparatus and method for recommendation of curling game strategy using deep learning |
KR102045567B1 (en) * | 2017-02-24 | 2019-11-18 | 고려대학교 산학협력단 | Apparatus and method for recommendation of curling game strategy using deep learning |
US11262407B2 (en) | 2019-12-02 | 2022-03-01 | Samsung Electronics Co., Ltd. | Method and apparatus with battery state estimation |
Also Published As
Publication number | Publication date |
---|---|
JP2012078980A (en) | 2012-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Coleman et al. | Analysis of dawnbench, a time-to-accuracy machine learning performance benchmark | |
JP6790286B2 (en) | Device placement optimization using reinforcement learning | |
CN110383299B (en) | Memory enhanced generation time model | |
US11574164B2 (en) | Neural network cooperation | |
US9047423B2 (en) | Monte-Carlo planning using contextual information | |
EP3559865B1 (en) | Data-efficient reinforcement learning for continuous control tasks | |
Pan et al. | Particle swarm optimization for function optimization in noisy environment | |
Mandel et al. | Where to add actions in human-in-the-loop reinforcement learning | |
JP5560154B2 (en) | Model parameter estimation apparatus and program thereof | |
JP2013242761A (en) | Method, and controller and control program thereof, for updating policy parameters under markov decision process system environment | |
CN110795246A (en) | Resource utilization rate prediction method and device | |
US11636399B2 (en) | Parameter estimation system, parameter estimation method, and parameter estimation program recording medium for estimating parameter and kernel functions by incorporating machine learning | |
JP6853955B2 (en) | People flow pattern estimation system, people flow pattern estimation method and people flow pattern estimation program | |
WO2013086186A2 (en) | Particle methods for nonlinear control | |
US20240202558A1 (en) | Accelerator for computing combinatorial cost function | |
CA3188066A1 (en) | Methods and systems for hyperparameter tuning and benchmarking | |
Hansen et al. | Non-parametric co-clustering of large scale sparse bipartite networks on the gpu | |
Kruijswijk et al. | Streamingbandit; experimenting with bandit policies | |
Tsikerdekis et al. | Efficient deep learning bot detection in games using time windows and long short-term memory (lstm) | |
El-Amir et al. | Data resampling | |
de Freitas Cunha et al. | On the impact of MDP design for reinforcement learning agents in resource management | |
Taylor | Markov decision processes: Lecture notes for stp 425 | |
Yadwadkar et al. | Faster jobs in distributed data processing using multi-task learning | |
Boschetti et al. | Complexity of a modelling exercise: A discussion of the role of computer simulation in complex system science | |
JP7420148B2 (en) | Learning devices, learning methods and programs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140218 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20140326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140415 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140513 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140609 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5560154 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |