JPH0973438A - Device and method for statistical learning, and information storage medium - Google Patents

Device and method for statistical learning, and information storage medium

Info

Publication number
JPH0973438A
JPH0973438A JP8099740A JP9974096A JPH0973438A JP H0973438 A JPH0973438 A JP H0973438A JP 8099740 A JP8099740 A JP 8099740A JP 9974096 A JP9974096 A JP 9974096A JP H0973438 A JPH0973438 A JP H0973438A
Authority
JP
Japan
Prior art keywords
data
learning
unit
input
learning data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8099740A
Other languages
Japanese (ja)
Inventor
Kenji Fukumizu
健次 福水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP8099740A priority Critical patent/JPH0973438A/en
Publication of JPH0973438A publication Critical patent/JPH0973438A/en
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

PROBLEM TO BE SOLVED: To enable a regression curve estimation part to estimate an unknown system with a minimum error by generating data (x) minimizing the learning error of the regression curve estimation part and setting it to a learning data output part. SOLUTION: The regression curve estimation part 3 has a linear model 'f(x:θ)=Σiθifi(x)' having an M-dimensional parameter θ set previously in a model storage part 8 so as to estimate the unknown system 7 as a regression curve 'E(p(y1x))', and has a parameter estimation part 9 which estimates the M-dimensional parameter θ of the linear model. A learning data output part 5 outputs a vector (y) outputted as, a vector (x) inputted to the unknown system 7 to a regression curve setting part 3 as learning data (x, y), and a learning data generation part 6 generates the vector (x) minimizing the learning error of the regression curve estimation part 3 and sets it to the learning data output part 5. Therefore, the unknown system 7 outputs a K-dimensional vector (y) to an L-dimensional vector (x) by operating a function and adding Guassian noise.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、統計的学習装置及
び統計的学習方法、情報記憶媒体に関する。
TECHNICAL FIELD The present invention relates to a statistical learning device, a statistical learning method, and an information storage medium.

【0002】[0002]

【従来の技術】現在、ブラックボックスとして機能する
未知システムを外部から推定する統計的学習装置が研究
されている。このような統計的学習装置は、例えば、回
帰曲線推定部と学習データ出力部とを有し、この学習デ
ータ出力部が出力する学習データにより回帰曲線推定部
が未知システムを推定する。
2. Description of the Related Art Currently, a statistical learning device for externally estimating an unknown system functioning as a black box is being studied. Such a statistical learning device has, for example, a regression curve estimation unit and a learning data output unit, and the regression curve estimation unit estimates the unknown system from the learning data output by the learning data output unit.

【0003】より詳細には、未知システムが、データx
の入力に対して関数の演算とガウスノイズの加算とによ
りデータyを出力するとき、この未知システムを推定す
る回帰曲線推定部に、M個の線形モデル“f(x;θ)=
Σiθii(x)”を設定する。学習データ出力部は、未
知システムにデータxを入力して出力されるデータyを
採取し、これらのデータx,yの組み合わせを学習デー
タとして回帰曲線推定部に出力する。この回帰曲線推定
部は、学習データ(x,y)の入力に対して線形モデルを
利用した最尤推定法などを実行し、未知システムを回帰
曲線“E[p(y|x)]”として推定する。
In more detail, the unknown system uses the data x
When the data y is output by the operation of the function and the addition of Gaussian noise with respect to the input of M, the M linear models “f (x; θ) =
Σ i θ i f i (x) ”is set. The learning data output unit inputs the data x to the unknown system, collects the output data y, and sets the combination of these data x, y as the learning data. The regression curve estimation unit executes the maximum likelihood estimation method using a linear model on the input of the learning data (x, y), and outputs the unknown system to the regression curve “E [p (y | x)] ”.

【0004】また、未知システムに一次元の実数直線か
らデータxが入力される場合は、平均推定部にM次元の
パラメータθを有する多項式を設定し、この多項式によ
り未知システムを推定することも可能である。このよう
な多項式は、例えば、下記のように設定される。
Further, when the data x is inputted to the unknown system from a one-dimensional real number straight line, a polynomial having an M-dimensional parameter θ can be set in the average estimating section and the unknown system can be estimated by this polynomial. Is. Such a polynomial is set as follows, for example.

【0005】[0005]

【数7】 (Equation 7)

【0006】[0006]

【発明が解決しようとする課題】上述のような統計的学
習装置では、推定部に学習データを的確に入力すること
により、未知システムを良好に推定することができる。
In the statistical learning device as described above, the unknown system can be satisfactorily estimated by accurately inputting the learning data to the estimation unit.

【0007】しかし、学習データを的確に作成すること
ができないため、未知システムを充分に推定するために
は、膨大な学習データを入力する必要があった。
However, since the learning data cannot be created accurately, it is necessary to input a huge amount of learning data in order to sufficiently estimate the unknown system.

【0008】[0008]

【課題を解決するための手段】請求項1記載の発明の統
計的学習装置は、未知システムがデータxの入力に対し
て関数の演算とガウスノイズの加算とによりデータyを
出力するとき、この未知システムに入力するデータxと
出力されたデータyとを学習データ(x,y)として出力
する学習データ出力部を設け、学習データ(x,y)の入
力に対してM次元のパラメータθを有する線形モデル
“f(x;θ)=Σiθii(x)”により前記未知システ
ムを回帰曲線“E[p(y|x)]”として推定する回帰曲
線推定部を設けた統計的学習装置において、前記回帰曲
線推定部の学習誤差が最小となるデータxを作成して前
記学習データ出力部に設定する学習データ作成部を設け
た。
According to the statistical learning device of the invention described in claim 1, when the unknown system outputs the data y by the operation of the function and the addition of Gaussian noise with respect to the input of the data x, A learning data output unit that outputs the data x input to the unknown system and the output data y as learning data (x, y) is provided, and the M-dimensional parameter θ is set for the input of the learning data (x, y). Statistics provided with a regression curve estimation unit for estimating the unknown system as a regression curve "E [p (y | x)]" by the linear model "f (x; θ) = Σ i θ i f i (x)" In the dynamic learning device, there is provided a learning data creation unit that creates data x that minimizes the learning error of the regression curve estimation unit and sets it in the learning data output unit.

【0009】なお、本発明で云うデータxやデータyな
どは、ベクトルやスカラーなどの数値を示すデータであ
る。
The data x, data y, etc. referred to in the present invention are data indicating numerical values such as vectors and scalars.

【0010】請求項2記載の発明の統計的学習装置で
は、請求項1記載の発明の統計的学習装置において、学
習データ作成部は、パラメータvを有して学習データ
(x,y)のデータxを発生させる確率密度関数“r
(x;v)”を保持した入力分布保持部と、外部から入力
されるデータxの分布の密度関数の推定量“ハットq
(x)”を保持した推定量保持部と、密度関数の推定量
“ハットq(x)”を用いて確率密度関数“r(x;v)”
に従って学習データ(x,y)のデータxを発生させた場
合に回帰曲線推定部の学習誤差の推定値E(v)が小さく
なるパラメータvを算出する誤差最小化部とを有し、こ
の算出されたパラメータvを確率密度関数“r(x;
v)”に設定して学習データ(x,y)のデータxを発生
させる。
In the statistical learning device of the invention described in claim 2, in the statistical learning device of the invention described in claim 1, the learning data creating section has the parameter v and the learning data.
Probability density function "r that generates data x of (x, y)
(x; v) ”holding the input distribution holding unit, and the estimated amount“ hat q ”of the density function of the distribution of the data x input from the outside.
The probability density function “r (x; v)” is calculated by using the estimator holding unit that holds (x) ”and the density function estimator“ hat q (x) ”.
An error minimization unit that calculates a parameter v that reduces the learning error estimation value E (v) of the regression curve estimation unit when the data x of the learning data (x, y) is generated according to The probability density function “r (x;
v) ”to generate the data x of the learning data (x, y).

【0011】なお、本明細書の文章中の“ハットA”と
は、“^”が付加された“A”をコード表現したもので
あり、これはイメージ入力した数式では通常通りに記載
している。
The "hat A" in the text of this specification is a code expression of "A" to which "^" is added. There is.

【0012】請求項3記載の発明の統計的学習装置で
は、請求項2記載の発明の統計的学習装置において、密
度関数の推定量“ハットq(x)”を用いて
In the statistical learning device of the invention described in claim 3, in the statistical learning device of the invention described in claim 2, the density function estimator "hat q (x)" is used.

【0013】[0013]

【数8】 (Equation 8)

【0014】を計算する第一行列計算部を設け、確率密
度関数“r(x;v)”を用いて
A first matrix calculation unit for calculating is used, and the probability density function "r (x; v)" is used.

【0015】[0015]

【数9】 [Equation 9]

【0016】を計算する第二行列計算部を設け、誤差最
小化部は、学習誤差の推定値E(v)を
A second matrix calculation unit for calculating is provided, and the error minimization unit calculates the estimated value E (v) of the learning error.

【0017】[0017]

【数10】 (Equation 10)

【0018】として計算する。Calculate as

【0019】請求項4記載の発明の統計的学習装置で
は、請求項3記載の発明の統計的学習装置において、誤
差最小化部は、学習誤差の推定値E(v)を最小化するパ
ラメータvを勾配方向を利用した逐次的手法により計算
する。
In the statistical learning device of the present invention as defined in claim 4, in the statistical learning device of the invention as defined in claim 3, the error minimization section minimizes the estimated value E (v) of the learning error. Is calculated by a sequential method using the gradient direction.

【0020】請求項5記載の発明の統計的学習装置で
は、請求項4記載の発明の統計的学習装置において、入
力分布保持部は、確率密度関数“r(x;v)”が“M
(M+1)/2”以下の個数の離散分布として設定されて
いる。
In the statistical learning device of the invention described in claim 5, in the statistical learning device of the invention described in claim 4, the probability density function "r (x; v)" is "M" in the input distribution holding unit.
It is set as a discrete distribution of the number of (M + 1) / 2 "or less.

【0021】請求項6記載の発明の統計的学習装置で
は、請求項4記載の発明の統計的学習装置において、入
力分布保持部は、確率密度関数“r(x;v)”が
In the statistical learning device of the invention described in claim 6, in the statistical learning device of the invention described in claim 4, the probability distribution function "r (x; v)"

【0022】[0022]

【数11】 [Equation 11]

【0023】なる関数で一次独立の実数の個数の離散分
布として設定されている。
The following function is set as a discrete distribution of the number of real numbers that are linearly independent.

【0024】請求項7記載の発明の統計的学習装置は、
未知システムが一次元の実数直線からのデータxの入力
に対して関数の演算とガウスノイズの加算とによりデー
タyを出力するとき、この未知システムに入力するデー
タxと出力されたデータyとを学習データ(x,y)とし
て出力する学習データ出力部を設け、学習データ(x,
y)の入力に対してM次元のパラメータθを有する多項
A statistical learning device according to a seventh aspect of the invention is
When an unknown system outputs data y by inputting data x from a one-dimensional real straight line by calculating a function and adding Gaussian noise, the data x input to this unknown system and the output data y are A learning data output unit that outputs the learning data (x, y) is provided, and the learning data (x, y
y) polynomial with M-dimensional parameter θ for input

【0025】[0025]

【数12】 (Equation 12)

【0026】により前記未知システムを推定する平均推
定部を設けた統計的学習装置において、予め設定された
二つの分布の混合分布に従って前記平均推定部の学習誤
差が最小となるデータxを作成して前記学習データ出力
部に設定する学習データ作成部を設けた。
According to the statistical learning device provided with the average estimation unit for estimating the unknown system, data x which minimizes the learning error of the average estimation unit is created in accordance with the preset mixture distribution of two distributions. A learning data creating unit to be set in the learning data output unit is provided.

【0027】請求項8記載の発明の統計的学習方法は、
未知システムがデータxの入力に対して関数の演算とガ
ウスノイズの加算とによりデータyを出力するとき、こ
の未知システムに入力するデータxと出力されたデータ
yとを学習データ(x,y)として学習データ出力部に出
力させ、この学習データ(x,y)の入力に対してM次元
のパラメータθを有する線形モデル“f(x;θ)=Σi
θii(x)”により回帰曲線推定部が前記未知システ
ムを回帰曲線“E[p(y|x)]”として推定するように
した統計的学習方法において、前記回帰曲線推定部の学
習誤差が最小となるデータxを学習データ作成部が作成
して前記学習データ出力部に設定するようにした。
The statistical learning method according to the invention of claim 8 is
When the unknown system outputs the data y by the operation of the function and the addition of Gaussian noise with respect to the input of the data x, the data x input to this unknown system and the output data y are learned data (x, y). As a linear model “f (x; θ) = Σ i having an M-dimensional parameter θ for the input of this learning data (x, y).
In the statistical learning method in which the regression curve estimation unit estimates the unknown system as a regression curve “E [p (y | x)]” by θ i f i (x) ”, learning of the regression curve estimation unit The learning data creation unit creates the data x having the minimum error and sets it in the learning data output unit.

【0028】請求項9記載の発明の統計的学習方法は、
未知システムが一次元の実数直線からのデータxの入力
に対して関数の演算とガウスノイズの加算とによりデー
タyを出力するとき、この未知システムに入力するデー
タxと出力されたデータyとを学習データ(x,y)とし
て学習データ出力部に出力させ、この学習データ(x,
y)の入力に対してM次元のパラメータθを有する多項
A statistical learning method according to a ninth aspect of the invention is
When an unknown system outputs data y by inputting data x from a one-dimensional real straight line by calculating a function and adding Gaussian noise, the data x input to this unknown system and the output data y are The learning data (x, y) is output to the learning data output unit, and the learning data (x, y
y) polynomial with M-dimensional parameter θ for input

【0029】[0029]

【数13】 (Equation 13)

【0030】により平均推定部が前記未知システムを推
定するようにした統計的学習方法において、学習データ
作成部が予め設定された二つの分布の混合分布に従って
前記平均推定部の学習誤差が最小となるデータxを作成
して前記学習データ出力部に設定するようにした。
In the statistical learning method according to which the average estimating unit estimates the unknown system, the learning data creating unit minimizes the learning error of the average estimating unit according to a preset mixture distribution of two distributions. The data x was created and set in the learning data output section.

【0031】請求項10記載の発明の情報記憶媒体は、
マイクロコンピュータを動作させるソフトウェアが書き
込まれた情報記憶媒体において、請求項1,2,3,
4,5,6又は7記載の統計的学習装置の各種機能がソ
フトウェアとして書き込まれている。
An information storage medium according to the invention of claim 10 is
An information storage medium in which software for operating a microcomputer is written.
Various functions of the statistical learning device described in 4, 5, 6 or 7 are written as software.

【0032】請求項1及び8記載の発明では、未知シス
テムがデータxの入力に対して関数の演算とガウスノイ
ズの加算とによりデータyを出力するとき、この未知シ
ステムに入力するデータxと出力されたデータyとを学
習データ(x,y)として学習データ出力部に出力させ、
この学習データ(x,y)の入力に対してM次元のパラメ
ータθを有する線形モデル“f(x;θ)=Σiθi
i(x)”により回帰曲線推定部が未知システムを回帰曲
線“E[p(y|x)]”として推定する。この時、回帰曲
線推定部の学習誤差が最小となるデータxを学習データ
作成部が作成して学習データ出力部に設定するので、回
帰曲線推定部が少数の学習データで未知システムを良好
に推定する。
According to the invention described in claims 1 and 8, when the unknown system outputs the data y by the operation of the function and the addition of the Gaussian noise with respect to the input of the data x, the data x input to the unknown system and the output Output the learned data y as learning data (x, y) to the learning data output unit,
A linear model “f (x; θ) = Σ i θ i f having an M-dimensional parameter θ with respect to the input of this learning data (x, y)
The regression curve estimation unit estimates the unknown system as a regression curve “E [p (y | x)]” by “ i (x).” At this time, the data x that minimizes the learning error of the regression curve estimation unit is the learning data. Since the creation unit creates and sets it in the learning data output unit, the regression curve estimation unit satisfactorily estimates the unknown system with a small number of learning data.

【0033】請求項2記載の発明では、パラメータvを
有して学習データ(x,y)のデータxを発生させる確率
密度関数“r(x;v)”が入力分布保持部に保持されて
おり、外部から入力されるデータxの分布の密度関数の
推定量“ハットq(x)”が推定量保持部に保持されてい
る。密度関数の推定量“ハットq(x)”を用いて確率密
度関数“r(x;v)”に従って学習データ(x,y)のデ
ータxを発生させた場合に回帰曲線推定部の学習誤差の
推定値E(v)が小さくなるパラメータvを誤差最小化部
が算出すると、この算出されたパラメータvを確率密度
関数“r(x;v)”に設定して学習データ(x,y)のデ
ータxを発生させるので、回帰曲線推定部の学習誤差が
最小となるデータxが簡易に作成される。
According to the second aspect of the present invention, the probability density function "r (x; v)" for generating the data x of the learning data (x, y) with the parameter v is held in the input distribution holding unit. The estimated amount “hat q (x)” of the density function of the distribution of the data x input from the outside is held in the estimated amount holding unit. Learning error of the regression curve estimation unit when the data x of the learning data (x, y) is generated according to the probability density function “r (x; v)” using the density function estimator “hat q (x)” When the error minimization unit calculates a parameter v having a smaller estimated value E (v) of the learning data (x, y), the calculated parameter v is set to the probability density function “r (x; v)”. Since the data x is generated, the data x that minimizes the learning error of the regression curve estimation unit is easily created.

【0034】請求項3記載の発明では、密度関数の推定
量“ハットq(x)”を用いて第一行列計算部が下記の行
列を計算し、
According to the third aspect of the invention, the first matrix calculation unit calculates the following matrix using the density function estimator "hat q (x)",

【0035】[0035]

【数14】 [Equation 14]

【0036】確率密度関数“r(x;v)”を用いて第二
行列計算部が下記の行列を計算し、
The second matrix calculator calculates the following matrix using the probability density function "r (x; v)",

【0037】[0037]

【数15】 (Equation 15)

【0038】学習誤差の推定値E(v)を誤差最小化部が
下記のように計算する。
The error minimization unit calculates the learning error estimated value E (v) as follows.

【0039】[0039]

【数16】 (Equation 16)

【0040】従って、回帰曲線推定部の学習誤差の推定
値E(v)が二つの行列から簡易に計算される。
Therefore, the estimated value E (v) of the learning error of the regression curve estimator is easily calculated from the two matrices.

【0041】請求項4記載の発明では、誤差最小化部が
学習誤差の推定値E(v)を最小化するパラメータvを勾
配方向を利用した逐次的手法により計算するので、推定
値E(v)を最小化するパラメータvが簡易に計算され
る。
According to the fourth aspect of the invention, the error minimization unit calculates the parameter v for minimizing the estimated value E (v) of the learning error by the sequential method using the gradient direction. Therefore, the estimated value E (v The parameter v that minimizes) is simply calculated.

【0042】請求項5記載の発明では、入力分布保持部
の確率密度関数“r(x;v)”が“M(M+1)/2”以
下の個数の離散分布として設定されているので、学習デ
ータの個数が削減される。
In the invention according to claim 5, since the probability density function "r (x; v)" of the input distribution holding unit is set as a discrete distribution of a number of "M (M + 1) / 2" or less, learning The number of data is reduced.

【0043】請求項6記載の発明では、入力分布保持部
の確率密度関数“r(x;v)”が下記の関数で一次独立
の実数の個数の離散分布として設定されているので、学
習データの個数が必要最小限に制限される。
According to the sixth aspect of the present invention, since the probability density function "r (x; v)" of the input distribution holding unit is set as a discrete distribution of the number of real independent primary values by the following function, the learning data Is limited to the necessary minimum.

【0044】[0044]

【数17】 [Equation 17]

【0045】請求項7及び9記載の発明では、未知シス
テムが一次元の実数直線からのデータxの入力に対して
関数の演算とガウスノイズの加算とによりデータyを出
力するとき、この未知システムに入力するデータxと出
力されたデータyとを学習データ(x,y)として学習デ
ータ出力部に出力させ、この学習データ(x,y)の入力
に対してM次元のパラメータθを有する下記の多項式に
より平均推定部が未知システムを推定する。
According to the seventh and ninth aspects of the present invention, when the unknown system outputs the data y by the operation of the function and the addition of Gaussian noise with respect to the input of the data x from the one-dimensional real number straight line, the unknown system The input data x and the output data y are output as learning data (x, y) to the learning data output unit, and the following data having an M-dimensional parameter θ with respect to the input of this learning data (x, y) The average estimator estimates the unknown system by the polynomial of.

【0046】[0046]

【数18】 (Equation 18)

【0047】この時、平均推定部の学習誤差が最小とな
るデータxを学習データ作成部が予め設定された二つの
分布の混合分布に従って作成して学習データ出力部に設
定するので、回帰曲線推定部が少数の学習データで未知
システムを良好に推定する。
At this time, since the learning data creating unit creates the data x having the minimum learning error of the average estimating unit according to the preset mixed distribution of the two distributions and sets it in the learning data output unit, the regression curve estimation is performed. The department estimates the unknown system well with a small number of training data.

【0048】請求項10記載の発明では、請求項1,
2,3,4,5,6又は7記載の統計的学習装置の各種
機能がソフトウェアとして書き込まれているので、この
情報記憶媒体のソフトウェアにより動作するマイクロコ
ンピュータは、請求項1,2,3,4,5,6又は7記
載の統計的学習装置として機能する。
According to the invention of claim 10, claim 1
Since the various functions of the statistical learning device described in 2, 3, 4, 5, 6 or 7 are written as software, the microcomputer operated by the software of this information storage medium is defined in claim 1, 2, 3, It functions as the statistical learning device described in 4, 5, 6 or 7.

【0049】[0049]

【発明の実施の形態】本発明の実施の第一の形態を図1
に基づいて以下に説明する。まず、本実施の形態の統計
的学習装置1は、外部データ入力部2、回帰曲線推定部
3、外部データ出力部4、学習データ出力部5、学習デ
ータ作成部6、を有しており、未知システム7に接続さ
れている。
FIG. 1 shows a first embodiment of the present invention.
It will be described below based on. First, the statistical learning device 1 of the present embodiment has an external data input unit 2, a regression curve estimation unit 3, an external data output unit 4, a learning data output unit 5, and a learning data creation unit 6, It is connected to the unknown system 7.

【0050】この未知システム7は、外部のベクトル空
間からデータxとしてL次元のベクトルxが入力される
と、所定の関数の演算とガウスノイズの加算とを実行
し、データyとしてK次元のベクトルyを外部に出力す
る。前記外部データ入力部2は、外部から入力されるベ
クトルxを前記回帰曲線推定部3に入力し、前記外部デ
ータ出力部4は、前記回帰曲線推定部3が出力するベク
トルyを外部に出力する。
When the L-dimensional vector x is input as the data x from the external vector space, the unknown system 7 executes the operation of a predetermined function and the addition of Gaussian noise, and the data y is the K-dimensional vector. Output y to the outside. The external data input unit 2 inputs the vector x input from the outside to the regression curve estimation unit 3, and the external data output unit 4 outputs the vector y output by the regression curve estimation unit 3 to the outside. .

【0051】前記回帰曲線推定部3は、前記未知システ
ム7を回帰曲線“E[p(y|x)]”として推定するた
め、M次元のパラメータθを有する線形モデル“f
(x;θ)=Σiθii(x)”がモデル記憶部8に予め設
定されており、線形モデルのM次元のパラメータθを推
定するパラメータ推定部9を有している。
The regression curve estimator 3 estimates the unknown system 7 as a regression curve "E [p (y | x)]", and therefore a linear model "f" having an M-dimensional parameter θ is used.
(x; θ) = Σ i θ i f i (x) ”is preset in the model storage unit 8 and has a parameter estimation unit 9 for estimating the M-dimensional parameter θ of the linear model.

【0052】前記学習データ出力部5は、前記未知シス
テム7に入力するベクトルxと出力されたベクトルyと
を学習データ(x,y)前記回帰曲線推定部3に出力し、
前記学習データ作成部6は、前記回帰曲線推定部3の学
習誤差が最小となるベクトルxを作成して前記学習デー
タ出力部5に設定する。
The learning data output section 5 outputs the vector x input to the unknown system 7 and the output vector y to the learning curve (x, y) regression curve estimation section 3,
The learning data creation unit 6 creates a vector x that minimizes the learning error of the regression curve estimation unit 3 and sets it in the learning data output unit 5.

【0053】このような構成において、未知システム7
は、関数の演算とガウスノイズの加算とにより、L次元
のベクトルxの入力に対してK次元のベクトルyを出力
するので、本実施の形態の統計的学習装置1は、回帰曲
線推定部3が未知システム7の未知の関数を推定する。
In such a configuration, the unknown system 7
Outputs the K-dimensional vector y with respect to the input of the L-dimensional vector x by the calculation of the function and the addition of the Gaussian noise. Therefore, the statistical learning device 1 according to the present embodiment includes the regression curve estimation unit 3 Estimates the unknown function of the unknown system 7.

【0054】より詳細には、学習データ出力部5が、未
知システム7に入力するベクトルxと出力されたベクト
ルyとを学習データ(x,y)として回帰曲線推定部3に
出力するので、この回帰曲線推定部3は、例えば、線形
モデル“f(x;θ)=Σiθii(x)”を利用した最尤
推定法である最小自乗誤差推定法により、下記の演算が
最小となるθを求めることにより、未知システム7の関
数を回帰曲線“E[p(y|x)]”として推定する。
More specifically, the learning data output unit 5 outputs the vector x input to the unknown system 7 and the output vector y to the regression curve estimation unit 3 as learning data (x, y). The regression curve estimator 3 uses the least square error estimation method, which is the maximum likelihood estimation method using the linear model “f (x; θ) = Σ i θ i f i (x)”, for example, to minimize the following calculation. The function of the unknown system 7 is estimated as a regression curve “E [p (y | x)]” by obtaining θ that satisfies

【0055】[0055]

【数19】 [Equation 19]

【0056】この時、学習データ作成部6が、回帰曲線
推定部3の学習誤差が最小となるベクトルxを作成して
学習データ出力部5に設定するので、学習データ出力部
5は、学習データ作成部6により設定されたベクトルx
で学習データ(x,y)を採取して回帰曲線推定部3に出
力する。このため、回帰曲線推定部3は、的確な学習デ
ータ(x,y)が必要かつ充分に入力されることになり、
膨大な学習を要することなく最小の誤差で未知システム
7を良好に推定することができる。
At this time, the learning data creation unit 6 creates the vector x with which the learning error of the regression curve estimation unit 3 is minimized and sets it in the learning data output unit 5, so that the learning data output unit 5 Vector x set by the creating unit 6
The learning data (x, y) is sampled and output to the regression curve estimation unit 3. Therefore, the regression curve estimation unit 3 is required to input accurate learning data (x, y) and sufficiently,
The unknown system 7 can be well estimated with a minimum error without requiring enormous learning.

【0057】このように未知システム7を推定した回帰
曲線推定部3は、ベクトルxの入力に対して未知システ
ム7と同様にベクトルyを出力することができるので、
未知システム7が出力するベクトルyを直接に採取しな
くとも、これを推定して未知システム7を制御するよう
なことができる。
Since the regression curve estimator 3 estimating the unknown system 7 in this way can output the vector y to the input of the vector x in the same manner as the unknown system 7,
Even if the vector y output by the unknown system 7 is not directly collected, it is possible to estimate it and control the unknown system 7.

【0058】このような統計的学習装置1の具体的な利
用方法としては、カラースキャナの特性同定が想定でき
る。例えば、ある原稿の実際のカラーの物理量であるL
*a*b* 値から、これに対してカラースキャナが出力す
るYMC(Yellow,Magenta,Cyanide)値への変換関数を未
知システム7として、これに回帰曲線推定部3を同定す
る統計的学習装置1が想定できる。
As a specific method of using such a statistical learning device 1, characteristic identification of a color scanner can be assumed. For example, L, which is the physical quantity of the actual color of a certain document
A statistical learning device that identifies the regression curve estimator 3 with the conversion function from the * a * b * value to the YMC (Yellow, Magenta, Cyanide) value output from the color scanner as the unknown system 7. 1 can be assumed.

【0059】このような場合、必要な範囲を充分に微細
な単位でL*a*b* 値を変化させた標準原稿を用意して
おき、学習データ作成部6により与えられた学習データ
を観測するための入力ベクトルxに最も近いL*a*b*
値の原稿をカラースキャナで読み取り、これが出力する
YMC値をベクトルyとして一個の学習データ(x,y)
を作成する。このような作業をN回まで繰り返すことに
より、本発明の手法によるN個の学習データを作成する
ことができ、これに基づいて回帰曲線推定部3がパラメ
ータθを推定してカラースキャナの特性を同定すること
ができる。
In such a case, a standard manuscript in which the L * a * b * values are changed in a necessary range in a sufficiently fine unit is prepared, and the learning data provided by the learning data creating section 6 is observed. L * a * b * closest to the input vector x for
The original of the value is read by the color scanner, and the YMC value output by this is set as the vector y, and one learning data (x, y)
Create By repeating such an operation up to N times, N pieces of learning data can be created by the method of the present invention, and the regression curve estimation unit 3 estimates the parameter θ based on the learning data to determine the characteristics of the color scanner. Can be identified.

【0060】なお、製品として出荷するカラースキャナ
の最終調整において、未知システム7であるカラースキ
ャナに回帰曲線推定部3を同定させれば、学習データ出
力部5や学習データ作成部6は製品であるカラースキャ
ナに搭載する必要はない。
In the final adjustment of the color scanner to be shipped as a product, if the regression curve estimation unit 3 is identified by the color scanner which is the unknown system 7, the learning data output unit 5 and the learning data creation unit 6 are products. It does not need to be installed on the color scanner.

【0061】また、上述のような統計的学習装置1は、
その各部2〜6の各々を固有のハードウェアとして製作
することでも実現できるが、各部2〜6の機能をソフト
ウェアとして情報記憶媒体に書き込み、これでマイクロ
コンピュータを動作させることでも統計的学習装置1を
実現することができる。同様に、各部2〜6の一部をハ
ードウェアで製作し、他の一部をソフトウェアとして情
報記憶媒体に書き込むことも可能である。
Further, the statistical learning device 1 as described above is
This can be realized by manufacturing each of the units 2 to 6 as unique hardware, but the statistical learning device 1 can also be realized by writing the functions of the units 2 to 6 as software in an information storage medium and operating the microcomputer. Can be realized. Similarly, it is possible to manufacture a part of each of the units 2 to 6 with hardware and write the other part as software into the information storage medium.

【0062】より具体的には、情報記憶媒体に、未知シ
ステムに入力するデータxと出力されたデータyとを学
習データ(x,y)として出力すること、学習データ
(x,y)の入力に対してM次元のパラメータθを有する
線形モデル“f(x;θ)=Σiθii(x)”により未知
システム7を回帰曲線“E[p(y|x)]”として推定す
ること、この学習誤差が最小となるデータxを作成して
設定すること、等をソフトウェアとして書き込む。この
ように統計的学習装置1の各種機能をソフトウェアとし
て書き込んだ情報記憶媒体は、単体の製品として取り扱
うことも可能であり、例えば、RAM(Random Access M
emory)、ROM(Read Only Memory)、CD−ROM(Com
pact Disk-ROM)、FD(Floppy Disk)等の形態で供給す
ることができる。
More specifically, the data x input to the unknown system and the output data y are output as learning data (x, y) to the information storage medium.
The unknown system 7 is subjected to the regression curve “E [p (y) by a linear model“ f (x; θ) = Σ i θ i f i (x) ”having an M-dimensional parameter θ for the input of (x, y). | X)] ", writing and setting data x that minimizes this learning error, etc. are written as software. The information storage medium in which the various functions of the statistical learning device 1 are written as software can be handled as a single product, for example, a RAM (Random Access Memory).
emory), ROM (Read Only Memory), CD-ROM (Com
It can be supplied in the form of a pact disk-ROM), an FD (Floppy Disk), or the like.

【0063】つぎに、本発明の実施の第二の形態を図2
および図3に基づいて以下に説明する。なお、この実施
の第二の形態の統計的学習装置11に関し、上述した実
施の第一の形態の統計的学習装置1と同一の部分は、同
一の名称と符号とを利用して詳細な説明は省略する。
Next, a second embodiment of the present invention will be described with reference to FIG.
The following description is based on FIG. Regarding the statistical learning device 11 of the second embodiment, the same parts as those of the statistical learning device 1 of the first embodiment described above will be described in detail by using the same names and reference numerals. Is omitted.

【0064】本実施の形態の統計的学習装置11は、学
習データ作成部12の構成と作用とを具体的に説明する
ものであり、図2に示すように、学習データ作成部12
が、推定量保持部13、入力分布保持部14、第一行列
計算部15、第二行列計算部16、誤差最小化部17、
を有している。
The statistical learning device 11 of the present embodiment specifically explains the structure and operation of the learning data creating unit 12, and as shown in FIG.
Is an estimation amount holding unit 13, an input distribution holding unit 14, a first matrix calculation unit 15, a second matrix calculation unit 16, an error minimization unit 17,
have.

【0065】前記推定量保持部13は、外部から入力さ
れるベクトルxの分布の密度関数の推定量“ハットq
(x)”を保持しており、前記第一行列計算部15は、密
度関数の推定量“ハットq(x)”を用いて下記の行列を
計算する。なお、このように“ハット”が付加された記
号は、本案では推定であることを意味している。
The estimated amount holding unit 13 estimates the estimated amount “hat q” of the density function of the distribution of the vector x input from the outside.
(x) ”is held, and the first matrix calculation unit 15 calculates the following matrix using the estimated amount“ hat q (x) ”of the density function. The added symbol means in the present case that it is an estimate.

【0066】[0066]

【数20】 (Equation 20)

【0067】前記入力分布保持部14は、パラメータv
を有して学習データ(x,y)のベクトルxを発生させる
確率密度関数“r(x;v)”を保持しており、前記第二
行列計算部16は、確率密度関数“r(x;v)”を用い
て下記の行列を計算する。
The input distribution holding unit 14 has a parameter v
Holds a probability density function “r (x; v)” for generating a vector x of learning data (x, y), and the second matrix calculation unit 16 holds the probability density function “r (x V) ”is used to calculate the following matrix.

【0068】[0068]

【数21】 (Equation 21)

【0069】前記誤差最小化部17は、密度関数の推定
量“ハットq(x)”を用いて確率密度関数“r(x;
v)”に従って学習データ(x,y)のベクトルxを発生
させた場合に、回帰曲線推定部3の学習誤差の推定値E
(v)が小さくなるパラメータvを算出する。このため、
学習誤差の推定値E(v)を下記のように計算し、この学
習誤差の推定値E(v)を最小化するパラメータvを、山
下り法のような勾配方向を利用した逐次的手法により計
算する。
The error minimization unit 17 uses the probability density function “r (x;
v) ”, a vector x of the learning data (x, y) is generated.
A parameter v that reduces (v) is calculated. For this reason,
The estimated value E (v) of the learning error is calculated as follows, and the parameter v that minimizes the estimated value E (v) of the learning error is calculated by the sequential method using the gradient direction, such as the mountain descent method. calculate.

【0070】[0070]

【数22】 (Equation 22)

【0071】そこで、前記学習データ作成部12は、前
記誤差最小化部17により算出されたパラメータvを、
前記入力分布保持部14に保持されている確率密度関数
“r(x;v)”に設定し、学習データ(x,y)のベクト
ルxを発生させる。
Therefore, the learning data creating section 12 uses the parameter v calculated by the error minimizing section 17 as
The probability density function “r (x; v)” held in the input distribution holding unit 14 is set to generate a vector x of learning data (x, y).

【0072】このような構成において、本実施の形態の
統計的学習装置11は、前述した統計的学習装置1と同
様に、学習データ作成部12がベクトルxを作成して学
習データ出力部5に設定すると、この学習データ出力部
5は、設定されたベクトルxで学習データ(x,y)を採
取して回帰曲線推定部3に出力するので、この回帰曲線
推定部3は、入力された学習データ(x,y)に従って未
知システム7の関数を推定する。
In the statistical learning device 11 of the present embodiment having such a configuration, the learning data creation unit 12 creates the vector x and outputs it to the learning data output unit 5 as in the statistical learning device 1 described above. When set, this learning data output unit 5 collects the learning data (x, y) with the set vector x and outputs it to the regression curve estimation unit 3. Therefore, the regression curve estimation unit 3 receives the input learning data. Estimate the function of the unknown system 7 according to the data (x, y).

【0073】ここで、学習データ作成部12が、学習デ
ータ(x,y)のベクトルxを発生させる過程を以下に順
次詳述する。まず、入力分布保持部14には、学習デー
タ(x,y)のベクトルxを発生させる確率密度関数“r
(x;v)”が予め保持されているので、そのパラメータ
vが決定されるとベクトルxも確定する。
Here, the process in which the learning data creating unit 12 generates the vector x of the learning data (x, y) will be sequentially described in detail below. First, in the input distribution holding unit 14, a probability density function “r which generates a vector x of learning data (x, y)
Since (x; v) ”is held in advance, the vector x is also fixed when the parameter v is determined.

【0074】そこで、第一行列計算部15は、推定量保
持部13に予め設定されている密度関数の推定量“ハッ
トq(x)”を用いて下記の行列を計算し、
Therefore, the first matrix calculating unit 15 calculates the following matrix using the estimated amount “hat q (x)” of the density function preset in the estimated amount holding unit 13,

【0075】[0075]

【数23】 (Equation 23)

【0076】第二行列計算部16は、確率密度関数“r
(x;v)”を用いて下記の行列を計算する。
The second matrix calculation section 16 uses the probability density function "r
The following matrix is calculated using (x; v) ”.

【0077】[0077]

【数24】 (Equation 24)

【0078】誤差最小化部17は、学習誤差の推定値E
(v)を下記のように計算し、この学習誤差の推定値E
(v)を最小化するパラメータvを、勾配方向を利用した
逐次的手法により計算する。
The error minimization unit 17 calculates the estimated value E of the learning error.
(v) is calculated as follows, and the estimated value E of this learning error is calculated.
The parameter v that minimizes (v) is calculated by a sequential method using the gradient direction.

【0079】[0079]

【数25】 (Equation 25)

【0080】そして、学習データ作成部12は、上述の
ように計算されたパラメータvを確率密度関数“r
(x;v)”に設定してベクトルxを発生させるので、こ
のベクトルxによる学習データ(x,y)は、回帰曲線推
定部3の学習誤差を最小化することができる。
Then, the learning data creating unit 12 uses the probability density function "r" for the parameter v calculated as described above.
Since the vector x is generated by setting (x; v) ", the learning data (x, y) by this vector x can minimize the learning error of the regression curve estimation unit 3.

【0081】ここで、本実施の形態の統計的学習装置1
1の有効性を以下に検証する。まず、推定する未知シス
テム7の真の回帰曲線f(x)が、回帰曲線推定部3に設
定したM個の線形モデルf(x;θ)に含まれると仮定
し、f(x)=f(x;θ0)とする。つぎに、入力分布保
持部14に設定した密度関数をr(x)とし、これから作
成した学習データ(x,y)から回帰曲線推定部3が最小
自乗誤差推定により獲得したパラメータθを“ハット
θ”とする。このような状態の平均的な学習誤差は、下
記のように計算することができる。
Here, the statistical learning device 1 of the present embodiment
The effectiveness of 1 is verified below. First, it is assumed that the true regression curve f (x) of the unknown system 7 to be estimated is included in the M linear models f (x; θ) set in the regression curve estimation unit 3, and f (x) = f (x; θ 0 ). Next, the density function set in the input distribution holding unit 14 is set to r (x), and the parameter θ acquired by the least square error estimation by the regression curve estimation unit 3 from the learning data (x, y) created from this is calculated as “hat θ ” The average learning error in such a state can be calculated as follows.

【0082】[0082]

【数26】 (Equation 26)

【0083】この学習誤差の学習データの出方に対応し
た期待値をE0 とすると、これは近似的に下記のように
表現される。
Letting E 0 be the expected value corresponding to the appearance of the learning data of this learning error, this is approximately expressed as follows.

【0084】[0084]

【数27】 [Equation 27]

【0085】この場合、統計的推定で一般的な計算方法
により、下記のことが成立する。
In this case, the following is established by a general calculation method in statistical estimation.

【0086】[0086]

【数28】 [Equation 28]

【0087】従って、学習誤差の期待値E0 は、下記の
ようになる。
Therefore, the expected value E 0 of the learning error is as follows.

【0088】[0088]

【数29】 (Equation 29)

【0089】この学習誤差の期待値E0 を最小にできれ
ば、回帰曲線推定部3の学習誤差を最小にすることがで
きるので、本実施の形態の統計的学習装置11は、上述
のようなことを満足するよう学習データ作成部12を形
成している。
If the expected value E 0 of the learning error can be minimized, the learning error of the regression curve estimator 3 can be minimized. Therefore, the statistical learning device 11 of the present embodiment does the above. The learning data creation unit 12 is formed so as to satisfy

【0090】なお、本実施の形態の統計的学習装置11
では、上述のように誤差最小化部17が逐次的手法によ
り学習誤差の推定値E(v)のパラメータvを計算するの
で、適正なパラメータvを解析的に計算できない場合で
も、適正なパラメータvを獲得することができる。
Incidentally, the statistical learning device 11 of the present embodiment.
Then, since the error minimization unit 17 calculates the parameter v of the estimated value E (v) of the learning error by the sequential method as described above, even if the proper parameter v cannot be analytically calculated, the proper parameter v Can be earned.

【0091】また、このように誤差最小化部17が逐次
的手法によりパラメータvを計算する場合、入力分布保
持部14に、確率密度関数“r(x;v)”が“M(M+
1)/2”以下の個数の離散分布として設定されていれ
ば、誤差最小化部17のトレースTr の計算コストを削
減することができる。さらに、確率密度関数“r(x;
v)”を下記のような関数で一次独立の実数の個数の離
散分布として設定することができれば、誤差最小化部1
7の計算コストを必要最小限まで削減することができ
る。
Further, when the error minimization unit 17 calculates the parameter v by the sequential method in this way, the probability density function “r (x; v)” in the input distribution holding unit 14 is “M (M +
1) / 2 "or less, the calculation cost of the trace Tr of the error minimization unit 17 can be reduced. Furthermore, the probability density function" r (x;
v) ”can be set as a discrete distribution of the number of real independent primary values by the following function, the error minimization unit 1
The calculation cost of 7 can be reduced to the necessary minimum.

【0092】[0092]

【数30】 [Equation 30]

【0093】ここで、上述のような統計的学習装置11
による統計的学習方法の一具体例を図3に基づいて以下
に簡単に説明する。まず、前述のように、第一行列計算
部15が、推定量保持部13に予め設定されている密度
関数の推定量“ハットq(x)”を用いて第一の行列“ハ
ットI”を計算する(ステップS1)。つぎに、第二行
列計算部16が、入力分布保持部14に予め保持されて
いる確率密度関数“r(x;v)”を用いて第二の行列
“Jab(v)”を計算し(ステップS4)、誤差最小化部
17が、学習誤差の推定値E(v)を計算する(ステップ
S5)。
Here, the statistical learning device 11 as described above is used.
A specific example of the statistical learning method according to is briefly described below with reference to FIG. First, as described above, the first matrix calculating unit 15 uses the estimated amount “hat q (x)” of the density function preset in the estimated amount holding unit 13 to calculate the first matrix “hat I”. Calculate (step S1). Next, the second matrix calculation unit 16 calculates the second matrix “Jab (v)” using the probability density function “r (x; v)” stored in the input distribution storage unit 14 in advance ( In step S4), the error minimizing unit 17 calculates the estimated value E (v) of the learning error (step S5).

【0094】このとき、この学習誤差の推定値E(v)を
最小化するパラメータvを、勾配方向を利用した逐次的
手法により計算するため(ステップS6)、最初にパラ
メータvが乱数により初期化されるとともに(ステップ
S2)、逐次的手法である最急降下法の繰り返し回数k
が“0”に初期化され(ステップS3)、これが繰り返
し回数kend となるまで第二の行列“Jab(v)”と学習
誤差の推定値E(v)とによりパラメータvが計算される
(ステップS4〜S8)。なお、図中の“α”は収束係
数である。
At this time, since the parameter v that minimizes the estimated value E (v) of the learning error is calculated by the sequential method using the gradient direction (step S6), the parameter v is first initialized by a random number. (Step S2), the number of iterations k of the steepest descent method that is a sequential method is repeated.
Is initialized to "0" (step S3), and the parameter v is calculated by the second matrix "Jab (v)" and the estimated value E (v) of the learning error until the number of repetitions k end is reached (step S3). Steps S4 to S8). In addition, “α” in the figure is a convergence coefficient.

【0095】このように学習誤差の推定値E(v)を最小
化するパラメータvが計算されると、学習データ作成部
12が、パラメータvを確率密度関数“r(x;v)”に
設定して“N−1”個のベクトルxを発生させ(ステッ
プS9)、同時に未知システム7が実際に出力する“N
−1”個のベクトルyを取得するので(ステップS1
0)、これらの“N−1”個の学習データ(x,y)によ
り、未知システム7の線形モデルf(x;θ)のパラメー
タθが推定される(ステップS11)。
When the parameter v that minimizes the estimated value E (v) of the learning error is calculated in this way, the learning data creation unit 12 sets the parameter v to the probability density function “r (x; v)”. Then, "N-1" vectors x are generated (step S9), and at the same time, "N" which the unknown system 7 actually outputs.
Since -1 "vectors y are acquired (step S1
0), the parameter θ of the linear model f (x; θ) of the unknown system 7 is estimated from these “N−1” pieces of learning data (x, y) (step S11).

【0096】つぎに、本発明の実施の第三の形態を図4
に基づいて以下に説明する。なお、この実施の第三の形
態の統計的学習装置21に関し、上述した実施の第二の
形態の統計的学習装置11と同一の部分は、同一の名称
と符号とを利用して詳細な説明は省略する。
Next, a third embodiment of the present invention will be described with reference to FIG.
It will be described below based on. Regarding the statistical learning device 21 of the third embodiment, the same parts as those of the statistical learning device 11 of the second embodiment described above will be described in detail by using the same names and reference numerals. Is omitted.

【0097】本実施の形態の統計的学習装置21は、学
習データ作成部22の推定量保持部23を具体的に説明
するもので、この推定量保持部23は、パラメータuを
有するパラメトリックモデル“q(x;u)”が予め設定
されており、外部データ入力部2に接続されている。そ
こで、前記推定量保持部23は、外部から外部データ入
力部2に実際に入力される(N−1)次元のベクトルxを
採取し、その分布の密度関数の推定量“ハットq(x)”
をパラメトリックモデル“q(x;u)”によりパラメト
リック推定して保持する。
The statistical learning device 21 of the present embodiment specifically explains the estimated amount holding unit 23 of the learning data creation unit 22, and the estimated amount holding unit 23 has a parametric model “parameter u”. q (x; u) ”is preset and is connected to the external data input unit 2. Therefore, the estimated amount holding unit 23 collects an (N-1) -dimensional vector x that is actually input to the external data input unit 2 from the outside, and estimates the density function of the distribution "hat q (x)". ”
Is parametrically estimated and held by the parametric model “q (x; u)”.

【0098】なお、このパラメトリックモデル“q
(x;u)”としては、パラメトリック推定を実現する各
種モデルが利用できるが、例えば、正規分布からなる混
合分布により、下記のように設定されている。
Note that this parametric model "q
As (x; u) ”, various models for realizing parametric estimation can be used, and are set as follows by, for example, a mixture distribution that is a normal distribution.

【0099】[0099]

【数31】 [Equation 31]

【0100】この数式の“n(x;m,s2)”は、平均m
と分散s2 との正規分布の確率密度関数であり、これは
下記のように表されるので、パラメトリックモデル“q
(x;u)”のパラメータuは、“u=(mt,st)”であ
る。
"N (x; m, s 2 )" in this equation is the average m
And the variance s 2 of the normal distribution probability density function. Since this is expressed as follows, the parametric model “q
(x; u) "parameter u of," it is u = (m t, s t ) ".

【0101】[0101]

【数32】 (Equation 32)

【0102】このような構成において、本実施の形態の
統計的学習装置21も、前述した統計的学習装置11と
同様に、学習データ作成部22が推定量保持部23に保
持されているベクトルxの分布の密度関数の推定量“ハ
ットq(x)”を用いて学習データ(x,y)のベクトルx
を作成する。
In such a configuration, also in the statistical learning device 21 of the present embodiment, similarly to the above-described statistical learning device 11, the learning data creation unit 22 holds the vector x held in the estimated amount holding unit 23. Vector x of the training data (x, y) using the estimated value of the density function of the distribution “hat q (x)”
Create

【0103】この推定量保持部23は、外部から入力さ
れるベクトルxから推定量“ハットq(x)”をパラメト
リック推定して保持するため、このパラメトリック推定
の時点で回帰曲線推定部3の使用状況と同等なベクトル
xを外部データ入力部2に入力する。すると、推定量保
持部23は、外部から外部データ入力部2に入力される
ベクトルxを採取し、予め設定されているパラメトリッ
クモデル“q(x;u)”のパラメータuを最尤推定法な
どによりパラメトリック推定することにより、ベクトル
xの分布の密度関数の推定量“ハットq(x)”を推定し
て保持する。
Since the estimated amount holding unit 23 parametrically estimates and holds the estimated amount "hat q (x)" from the vector x input from the outside, the regression curve estimation unit 3 uses it at the time of this parametric estimation. The vector x equivalent to the situation is input to the external data input unit 2. Then, the estimated amount holding unit 23 collects the vector x input from the outside to the external data input unit 2 and uses the parameter u of the preset parametric model “q (x; u)” as the maximum likelihood estimation method or the like. By performing parametric estimation with, the estimated amount “hat q (x)” of the density function of the distribution of the vector x is estimated and held.

【0104】本実施の形態の統計的学習装置21は、上
述のように実際の使用状況と同等なベクトルxに基づい
て、学習データ作成部22の推定量保持部23にベクト
ルxの分布の密度関数の推定量“ハットq(x)”を設定
することができる。
The statistical learning device 21 of the present embodiment stores the distribution density of the vector x in the estimated amount holding unit 23 of the learning data creation unit 22 based on the vector x equivalent to the actual use condition as described above. An estimator "hat q (x)" of the function can be set.

【0105】つぎに、本発明の実施の第四の形態を図5
に基づいて以下に説明する。なお、この実施の第四の形
態の統計的学習装置31に関し、上述した実施の第三の
形態の統計的学習装置21と同一の部分は、同一の名称
と符号とを利用して詳細な説明は省略する。
Next, a fourth embodiment of the present invention will be described with reference to FIG.
It will be described below based on. Regarding the statistical learning device 31 of the fourth embodiment, the same parts as those of the statistical learning device 21 of the third embodiment described above will be described in detail by using the same names and reference numerals. Is omitted.

【0106】本実施の形態の統計的学習装置31も、学
習データ作成部32の推定量保持部33を具体的に説明
するもので、この推定量保持部33は、ノンパラメトリ
ックモデル“q(x)”が予め設定されており、外部から
外部データ入力部2に実際に入力されるベクトルxを採
取し、その分布の密度関数の推定量“ハットq(x)”を
ノンパラメトリック推定して保持する。
The statistical learning device 31 of the present embodiment also specifically describes the estimated amount holding unit 33 of the learning data creation unit 32. The estimated amount holding unit 33 is a non-parametric model "q (x ) ”Is preset and the vector x that is actually input to the external data input unit 2 from the outside is sampled, and the estimated amount“ hat q (x) ”of the distribution density function is nonparametrically estimated and stored. To do.

【0107】なお、このノンパラメトリックモデル“q
(x)”としては、ノンパラメトリック推定を実現する各
種モデルが利用できる。ベクトルxは、下記のように入
力される。
The non-parametric model "q
Various models that realize non-parametric estimation can be used as (x) ”. The vector x is input as follows.

【0108】[0108]

【数33】 [Expression 33]

【0109】この場合、ノンパラメトリックモデル“q
(x)”は、例えば、正規分布により下記のように設定さ
れる。
In this case, the non-parametric model "q
(x) ”is set as follows by a normal distribution, for example.

【0110】[0110]

【数34】 (Equation 34)

【0111】このような構成において、本実施の形態の
統計的学習装置31も、前述した統計的学習装置21と
同様に、実際の使用状況と同等なベクトルxに基づい
て、学習データ作成部32の推定量保持部33にベクト
ルxの分布の密度関数の推定量“ハットq(x)”を設定
する。この推定量保持部33は、外部から外部データ入
力部2に入力されるベクトルxを採取し、ベクトルxの
分布の密度関数の推定量“ハットq(x)”をノンパラメ
トリック推定して保持する。
In such a configuration, the statistical learning device 31 of the present embodiment also, like the statistical learning device 21 described above, based on the vector x equivalent to the actual usage condition, the learning data creation unit 32. The estimated amount “hat q (x)” of the density function of the distribution of the vector x is set in the estimated amount holding unit 33. The estimated amount holding unit 33 samples the vector x input from the outside to the external data input unit 2 and non-parametrically estimates and holds the estimated amount “hat q (x)” of the density function of the distribution of the vector x. .

【0112】なお、本実施の形態の統計的学習装置31
では、推定量保持部33に正規分布を利用したノンパラ
メトリックモデル“q(x)を設定することを例示した
が、本発明は上記形態に限定されるものではなく、この
ようなノンパラメトリックモデル“q(x)”としては、
矩形関数などの各種のカーネル関数も利用でき、例え
ば、カーネル関数にデルタ関数を用いた下記のような演
算なども利用可能である。
Incidentally, the statistical learning device 31 of the present embodiment.
In the above, the non-parametric model “q (x) using a normal distribution is set in the estimation amount holding unit 33, but the present invention is not limited to the above-described embodiment, and such a non-parametric model“ q As q (x) ”,
Various kernel functions such as a rectangular function can also be used. For example, the following calculation using a delta function as the kernel function can also be used.

【0113】[0113]

【数35】 (Equation 35)

【0114】つぎに、本発明の実施の第五の形態を図6
に基づいて以下に説明する。なお、この実施の第五の形
態の統計的学習装置41に関し、前述した実施の第二の
形態の統計的学習装置11と同一の部分は、同一の名称
と符号とを利用して詳細な説明は省略する。
Next, a fifth embodiment of the present invention will be described with reference to FIG.
It will be described below based on. Regarding the statistical learning device 41 of the fifth embodiment, the same parts as those of the statistical learning device 11 of the second embodiment described above will be described in detail by using the same names and reference numerals. Is omitted.

【0115】本実施の形態の統計的学習装置41は、学
習データ作成部42を具体的に説明するもので、この学
習データ作成部42は、推定量保持部13を有しておら
ず、第一行列計算部43が外部データ入力部2に接続さ
れている。この第一行列計算部43は、外部から外部デ
ータ入力部2に実際に入力される(N′−1)次元のベク
トルxを採取して下記のような計算を実行する。
The statistical learning device 41 of the present embodiment specifically describes the learning data creating unit 42. The learning data creating unit 42 does not have the estimated amount holding unit 13, The one-row calculation unit 43 is connected to the external data input unit 2. The first matrix calculation unit 43 collects the (N'-1) -dimensional vector x that is actually input to the external data input unit 2 from the outside and executes the following calculation.

【0116】[0116]

【数36】 [Equation 36]

【0117】このような構成において、本実施の形態の
統計的学習装置41も、前述した統計的学習装置11と
同様に、学習データ作成部42は第一行列計算部43の
計算結果を利用して学習データ(x,y)のベクトルxを
作成する。この第一行列計算部43は、外部から入力さ
れるベクトルxを利用して、積分を実行することなく加
算により計算を実行するので、計算の負担を軽減して時
間を短縮することができる。このような手法は、カーネ
ル関数にデルタ関数を用いた場合に相当する。
With such a configuration, also in the statistical learning device 41 of the present embodiment, the learning data creation unit 42 uses the calculation result of the first matrix calculation unit 43 as in the statistical learning device 11 described above. To create a vector x of learning data (x, y). Since the first matrix calculation unit 43 uses the vector x input from the outside to perform the calculation by addition without performing the integration, the calculation load can be reduced and the time can be shortened. Such a method corresponds to the case where the delta function is used as the kernel function.

【0118】つぎに、本発明の実施の第六の形態を図7
ないし図9に基づいて以下に説明する。なお、この実施
の第六の形態の統計的学習装置51に関し、前述した実
施の第一の形態の統計的学習装置1と同一の部分は、同
一の名称と符号とを利用して詳細な説明は省略する。
Next, a sixth embodiment of the present invention will be described with reference to FIG.
This will be described below with reference to FIG. With regard to the statistical learning device 51 of the sixth embodiment, the same parts as those of the statistical learning device 1 of the first embodiment described above will be described in detail by using the same names and reference numerals. Is omitted.

【0119】本実施の形態の統計的学習装置51は、図
7に示すように、一次元の実数直線からのベクトルxの
入力に対してデータyを出力する未知システム52に対
応したものであり、これを推定する平均推定部53のモ
デル記憶部54には、M次元のパラメータθを有する多
項式が下記のように設定されている。
As shown in FIG. 7, the statistical learning device 51 of the present embodiment corresponds to an unknown system 52 which outputs data y for an input of a vector x from a one-dimensional real number straight line. A polynomial having an M-dimensional parameter θ is set in the model storage unit 54 of the average estimation unit 53 that estimates the polynomial as follows.

【0120】[0120]

【数37】 (37)

【0121】そして、このような平均推定部53の学習
データ(x,y)のベクトルxを作成する学習データ作成
部55は、予め設定された二つの分布の混合分布“r
(x:v)”に従って前記平均推定部53の学習誤差E
(v)が最小となるベクトルxを作成して学習データ出力
部5に設定する。
Then, the learning data creating unit 55 for creating the vector x of the learning data (x, y) of the average estimating unit 53 as described above, has a mixture distribution “r” of two preset distributions.
(x: v) ”according to the learning error E of the average estimation unit 53.
A vector x that minimizes (v) is created and set in the learning data output unit 5.

【0122】なお、このような混合分布“r(x:v)”
は、二つの各種分布により形成されるが、ここでは“0
<a<1”なる実数aにより表現される二つの正規分布
により“an(x;0,τ1 2)+(1−a)n(x;0,τ2
2)”として予め設定されている。この場合、二つの正規
分布は、各々の線形結合係数を“a,1−a”とし、各
々の分散を“τ1 2,τ2 2”とすると、“0<a<0.1”
を満足する微小なaと“τ1 2>10”を満足するτ1 とが
“aτ1 2>10”を満足するよう設定されている。
Note that such a mixture distribution "r (x: v)"
Is formed by two different distributions, but here "0
<A <1 "by the two normal distributions are represented by real number a made" an (x; 0, τ 1 2) + (1-a) n (x; 0, τ 2
2 ) ”in this case. In this case, two normal distributions have respective linear combination coefficients of“ a, 1-a ”and respective variances of“ τ 1 2 , τ 2 2 ”. "0 <a <0.1"
Is set so as to satisfy the tau 1 is satisfied is "aτ 1 2> 10" to "τ 1 2> 10" with small a that satisfies.

【0123】このような構成において、本実施の形態の
統計的学習装置51の統計的学習方法では、図8に示す
ように、学習データ作成部55が、予め設定された二つ
の分布の混合分布“r(x:v)”に従って学習誤差E
(v)が最小となるベクトルxを作成するので(ステップ
T1)、平均推定部53は、学習データ(x,y)により
多項式f(y;θ)を利用して未知システム52を良好に
推定することができる(ステップT2〜T4)。
With such a configuration, in the statistical learning method of the statistical learning device 51 of the present embodiment, as shown in FIG. 8, the learning data creation unit 55 causes the preset distribution distribution of the two distributions to be set. Learning error E according to "r (x: v)"
Since the vector x that minimizes (v) is created (step T1), the average estimating unit 53 favorably estimates the unknown system 52 by using the polynomial f (y; θ) from the learning data (x, y). Can be performed (steps T2 to T4).

【0124】ここで、本実施の形態の統計的学習装置5
1の有効性を以下に検証する。まず、平均m、分散τ2
の正規分布の密度関数を、
Here, the statistical learning device 5 of the present embodiment.
The effectiveness of 1 is verified below. First, mean m, variance τ 2
The density function of the normal distribution of

【0125】[0125]

【数38】 (38)

【0126】とし、平均推定部53に設定された二つの
正規分布の混合分布“r(x:v)”を“an(x;0,
τ1 2)+(1−a)n(x;0,τ2 2)”とする。そして、
τ2 を有界な値とし、“aτ1 2→∞”が維持されるよう
に“a→0”“τ1 →∞”と極限を設定すると、学習誤
差E(v)のトレース値は下記のようになる。
Then, the mixture distribution “r (x: v)” of the two normal distributions set in the average estimation unit 53 is defined as “an (x; 0,
τ 1 2 ) + (1-a) n (x; 0, τ 2 2 ) ”, and
If τ 2 is a bounded value and the limit is set as “a → 0” “τ 1 → ∞” so that “a τ 1 2 → ∞” is maintained, the learning error E (v) trace value is become that way.

【0127】[0127]

【数39】 [Equation 39]

【0128】上述のように極限操作を実行すると、
“1”より大きい学習誤差E(v)のトレース値が最小の
“1”に無限に近付くので、最適な入力分布を獲得する
ことができる。しかし、実際には無限に操作を行なうこ
とはできないので、具体的な数値を設定する必要があ
る。
When the extreme operation is executed as described above,
Since the trace value of the learning error E (v) larger than "1" approaches infinitely "1", the optimum input distribution can be obtained. However, since it is not possible to operate indefinitely, it is necessary to set a specific numerical value.

【0129】これを確認するため、本実施の形態の統計
的学習装置51を以下のようにシミュレートしたとこ
ろ、充分な効果が確認された。まず、[−1,1]上の一
様分布をU、平均0分散1の正規分布に従う独立な確率
変数をZとし、q(x)による実システムの入力分布を
“U+ 0.3Z”に設定した。そして、未知システム52
の真の関数を“f(x)=x+2”としたところ、“a=
0.1,τ1=30,τ2=1 ”で充分な効果が確認された。
In order to confirm this, the statistical learning device 51 of this embodiment was simulated as follows, and a sufficient effect was confirmed. First, let U be the uniform distribution on [-1, 1], Z be an independent random variable that follows a normal distribution with mean 0 variance 1, and set the input distribution of the real system by q (x) to "U + 0.3Z". did. And the unknown system 52
When the true function of is defined as “f (x) = x + 2”, “a =
A sufficient effect was confirmed at 0.1, τ 1 = 30, τ 2 = 1 ”.

【0130】そこで、これらの数値を統計的学習装置5
1に設定し、推定のモデルを一次から五次まで変化さ
せ、前述した二つの密度関数“r(x:v),q(x)”に
より1000個の学習データ(x,y)を採取してパラメータ
の推定量“ハットθ”を計算し、その学習後の推定誤差
を以下の数式による平均二乗誤差により評価した。
Therefore, the statistical learning device 5 uses these numerical values.
Set to 1 and change the estimation model from first-order to fifth-order, and collect 1000 pieces of learning data (x, y) by the two density functions “r (x: v), q (x)” described above. The estimated amount of the parameter, “hat θ”, was calculated by the above, and the estimation error after the learning was evaluated by the mean square error by the following formula.

【0131】[0131]

【数40】 (Equation 40)

【0132】このような二つの密度関数“r(x:v),
q(x)”で 500回ずつ実行したところ、図9に示すよう
に、密度関数“q(x)”の場合にはモデルの次数の増加
に比例して誤差が増加したが、密度関数“r(x:v)”
の場合にはモデルの次数が増加しても誤差が増加しなか
った。しかも、密度関数“r(x:v)”の誤差は密度関
数“q(x)”の最小の誤差(次数が0次の場合)に同等
であり、上述のように二つの分布の混合分布“r(x:
v)”を利用してベクトルxを作成すれば学習誤差E
(v)が最小となることが確認された。
Two such density functions “r (x: v),
As shown in FIG. 9, when the density function “q (x)” was executed 500 times each, the error increased in proportion to the increase of the model order. r (x: v) ”
In the case of, the error did not increase even if the order of the model increased. Moreover, the error of the density function “r (x: v)” is equivalent to the minimum error of the density function “q (x)” (when the order is 0th order), and as described above, the mixed distribution of the two distributions. "R (x:
v) ”is used to create the vector x, the learning error E
It was confirmed that (v) was the minimum.

【0133】なお、本実施の形態の統計的学習装置51
は、前述のようにベクトルxの入力空間が一次元の実数
直線の場合に対応しているが、このような入力空間が有
界な区間[−A,B]に制限できる場合もある。このよう
な場合、その両端で学習データ(x,y)を割合“a/
2”ずつ採取し、残りの“1−a”の割合を“(A+
B)2/4”より小さい分散の分布から発生させることが
好ましい。このようにすることで、近似的に実数直線の
最適分布に近い採取が可能となるので、より良好な学習
データを作成することができる。
Incidentally, the statistical learning device 51 of the present embodiment.
Corresponds to the case where the input space of the vector x is a one-dimensional real straight line as described above, but such an input space may be limited to the bounded section [-A, B]. In such a case, the learning data (x, y) at the both ends of the ratio "a /
2 "each, and the remaining" 1-a "ratio is" (A +
B) 2/4 "to generate the distribution of smaller dispersion is preferred. In this way, since approximately taken close to the optimal distribution of the real line is possible, to create a better learning data be able to.

【0134】[0134]

【発明の効果】請求項1及び8記載の発明では、未知シ
ステムがデータxの入力に対して関数の演算とガウスノ
イズの加算とによりデータyを出力するとき、この未知
システムに入力するデータxと出力されたデータyとを
学習データ(x,y)として学習データ出力部に出力さ
せ、この学習データ(x,y)の入力に対してM次元のパ
ラメータθを有する線形モデル“f(x;θ)=Σiθi
i(x)”により回帰曲線推定部が未知システムを回帰曲
線“E[p(y|x)]”として推定する統計的学習装置及
び統計的学習方法において、回帰曲線推定部の学習誤差
が最小となるデータxを学習データ作成部が作成して学
習データ出力部に設定するようにしたことにより、この
学習データ作成部が出力するデータxに基づいて学習デ
ータ出力部が回帰曲線推定部に学習データ(x,y)を出
力するので、この回帰曲線推定部は未知システムを最小
誤差で推定することができる。
According to the first and eighth aspects of the present invention, when the unknown system outputs the data y by the operation of the function and the addition of Gaussian noise with respect to the input of the data x, the data x input to this unknown system is input. And output data y as learning data (x, y) to the learning data output unit, and a linear model “f (x (x) y) having an M-dimensional parameter θ with respect to the input of this learning data (x, y). ; Θ) = Σ i θ i f
In the statistical learning device and the statistical learning method in which the regression curve estimation unit estimates the unknown system as the regression curve “E [p (y | x)]” by i (x) ”, the learning error of the regression curve estimation unit is minimum. Since the learning data creation unit creates the data x to be set in the learning data output unit, the learning data output unit learns in the regression curve estimation unit based on the data x output by the learning data creation unit. Since the data (x, y) is output, this regression curve estimation unit can estimate the unknown system with the minimum error.

【0135】請求項2記載の発明では、学習データ作成
部は、パラメータvを有して学習データ(x,y)のデー
タxを発生させる確率密度関数“r(x;v)”を保持し
た入力分布保持部と、外部から入力されるデータxの分
布の密度関数の推定量“ハットq(x)”を保持した推定
量保持部と、密度関数の推定量“ハットq(x)”を用い
て確率密度関数“r(x;v)”に従って学習データ
(x,y)のデータxを発生させた場合に回帰曲線推定部
の学習誤差の推定値E(v)が小さくなるパラメータvを
算出する誤差最小化部とを有し、この算出されたパラメ
ータvを確率密度関数“r(x;v)”に設定して学習デ
ータ(x,y)のデータxを発生させることにより、回帰
曲線推定部の学習誤差が最小となる学習データ(x,y)
のデータxを簡易に作成することができる。
According to the second aspect of the invention, the learning data creation unit holds the probability density function "r (x; v)" for generating the data x of the learning data (x, y) with the parameter v. The input distribution holding unit, the estimation amount holding unit that holds the density function estimation amount “hat q (x)” of the distribution of the data x input from the outside, and the density function estimation amount “hat q (x)” Learning data according to probability density function "r (x; v)"
an error minimization unit that calculates a parameter v that reduces the learning error estimation value E (v) of the regression curve estimation unit when the data x of (x, y) is generated. By setting v to the probability density function “r (x; v)” and generating the data x of the learning data (x, y), the learning data (x, y) that minimizes the learning error of the regression curve estimation unit. )
The data x can be easily created.

【0136】請求項3記載の発明では、密度関数の推定
量“ハットq(x)”を用いて
According to the third aspect of the invention, the density function estimator "hat q (x)" is used.

【0137】[0137]

【数41】 [Equation 41]

【0138】を計算する第一行列計算部を設け、確率密
度関数“r(x;v)”を用いて
A first matrix calculation unit for calculating is provided and the probability density function "r (x; v)" is used.

【0139】[0139]

【数42】 (Equation 42)

【0140】を計算する第二行列計算部を設け、誤差最
小化部は、学習誤差の推定値E(v)を
A second matrix calculation unit for calculating is provided, and the error minimization unit calculates the estimated value E (v) of the learning error.

【0141】[0141]

【数43】 [Equation 43]

【0142】として計算することにより、最適なデータ
xの作成に必要な学習誤差の推定値E(v)を簡易に算出
することができる。
By calculating as, the estimated value E (v) of the learning error required for creating the optimum data x can be easily calculated.

【0143】請求項4記載の発明では、誤差最小化部
は、学習誤差の推定値E(v)を最小化するパラメータv
を勾配方向を利用した逐次的手法により計算することに
より、学習誤差E(v)を最小化するパラメータvを簡易
に算出することができる。
According to the fourth aspect of the invention, the error minimization section minimizes the estimated value E (v) of the learning error by the parameter v.
The parameter v that minimizes the learning error E (v) can be easily calculated by calculating γ by a sequential method using the gradient direction.

【0144】請求項5記載の発明では、入力分布保持部
は、確率密度関数“r(x;v)”が“M(M+1)/2”
以下の個数の離散分布として設定されていることによ
り、学習データの個数を削減することができる。
According to the fifth aspect of the invention, in the input distribution holding unit, the probability density function “r (x; v)” is “M (M + 1) / 2”.
The number of learning data can be reduced by setting the following discrete distributions.

【0145】請求項6記載の発明では、入力分布保持部
は、確率密度関数“r(x;v)”が
According to the sixth aspect of the invention, the probability distribution function “r (x; v)” is

【0146】[0146]

【数44】 [Equation 44]

【0147】なる関数で一次独立の実数の個数の離散分
布として設定されていることにより、学習データの個数
を必要最小限に制限することができる。
Since the function is set as a discrete distribution of the number of real numbers which is linearly independent, the number of learning data can be limited to the necessary minimum.

【0148】請求項7及び9記載の発明では、未知シス
テムが一次元の実数直線からのデータxの入力に対して
関数の演算とガウスノイズの加算とによりデータyを出
力するとき、この未知システムに入力するデータxと出
力されたデータyとを学習データ(x,y)として学習デ
ータ出力部に出力させ、この学習データ(x,y)の入力
に対してM次元のパラメータθを有する多項式
In the inventions according to claims 7 and 9, when the unknown system outputs the data y by the operation of the function and the addition of Gaussian noise with respect to the input of the data x from the one-dimensional real number straight line, the unknown system The input data x and the output data y are output as learning data (x, y) to the learning data output unit, and a polynomial having an M-dimensional parameter θ with respect to the input of this learning data (x, y)

【0149】[0149]

【数45】 [Equation 45]

【0150】により平均推定部が未知システムを推定す
る統計的学習装置及び統計的学習方法において、平均推
定部の学習誤差が最小となるデータxを学習データ作成
部が作成して学習データ出力部に設定するようにしたこ
とにより、この学習データ作成部が出力するデータxに
基づいて学習データ出力部が平均推定部に学習データ
(x,y)を出力するので、この平均推定部は未知システ
ムを最小誤差で推定することができる。
According to the statistical learning device and the statistical learning method in which the average estimating unit estimates the unknown system, the learning data creating unit creates the data x having the minimum learning error of the average estimating unit and outputs it to the learning data output unit. By setting the learning data, the learning data output unit outputs the learning data to the average estimation unit based on the data x output by the learning data creation unit.
Since (x, y) is output, this average estimation unit can estimate the unknown system with the minimum error.

【0151】請求項10記載の発明の情報記憶媒体は、
マイクロコンピュータを動作させるソフトウェアが書き
込まれた情報記憶媒体において、請求項1,2,3,
4,5,6又は7記載の統計的学習装置の各種機能がソ
フトウェアとして書き込まれているので、このソフトウ
ェアによりマイクロコンピュータを動作させれば、請求
項1,2,3,4,5,6又は7記載の統計的学習装置
を簡易に実現することができる。
An information storage medium according to the invention of claim 10 is
An information storage medium in which software for operating a microcomputer is written.
Since various functions of the statistical learning device according to claim 4, 5, 6 or 7 are written as software, if the microcomputer is operated by this software, the claim 1, 2, 3, 4, 5, 6 or The statistical learning device described in 7 can be easily realized.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施の第一の形態の統計的学習装置を
示すブロック図である。
FIG. 1 is a block diagram showing a statistical learning device according to a first embodiment of the present invention.

【図2】本発明の実施の第二の形態の統計的学習装置を
示すブロック図である。
FIG. 2 is a block diagram showing a statistical learning device according to a second embodiment of the present invention.

【図3】その統計的学習方法を示すフローチャートであ
る。
FIG. 3 is a flowchart showing the statistical learning method.

【図4】本発明の実施の第三の形態の統計的学習装置を
示すブロック図である。
FIG. 4 is a block diagram showing a statistical learning device according to a third embodiment of the present invention.

【図5】本発明の実施の第四の形態の統計的学習装置を
示すブロック図である。
FIG. 5 is a block diagram showing a statistical learning device according to a fourth exemplary embodiment of the present invention.

【図6】本発明の実施の第五の形態の統計的学習装置を
示すブロック図である。
FIG. 6 is a block diagram showing a statistical learning device according to a fifth embodiment of the present invention.

【図7】本発明の実施の第六の形態の統計的学習装置を
示すブロック図である。
FIG. 7 is a block diagram showing a statistical learning device according to a sixth embodiment of the present invention.

【図8】その統計的学習方法を示すフローチャートであ
る。
FIG. 8 is a flowchart showing the statistical learning method.

【図9】その推定誤差の試験結果を示す特性図である。FIG. 9 is a characteristic diagram showing test results of the estimation error.

【符号の説明】[Explanation of symbols]

1,11,21,31,41,51 統計的学習装置 3 回帰曲線推定部 5,22 学習データ出力部 6,12,32,42 学習データ作成部 7,52 未知システム 13,23,33 推定量保持部 14 入力分布保持部 15 第一行列計算部 16 第二行列計算部 17 誤差最小化部 53 平均推定部 55 学習データ作成部 1,11,21,31,41,51 Statistical learning device 3 Regression curve estimation unit 5,22 Learning data output unit 6,12,32,42 Learning data creation unit 7,52 Unknown system 13,23,33 Estimated amount Storage unit 14 Input distribution storage unit 15 First matrix calculation unit 16 Second matrix calculation unit 17 Error minimization unit 53 Average estimation unit 55 Learning data creation unit

─────────────────────────────────────────────────────
─────────────────────────────────────────────────── ───

【手続補正書】[Procedure amendment]

【提出日】平成8年6月13日[Submission date] June 13, 1996

【手続補正1】[Procedure amendment 1]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0084[Correction target item name]

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0084】[0084]

【数27】 [Equation 27]

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】 未知システムがデータxの入力に対して
関数の演算とガウスノイズの加算とによりデータyを出
力するとき、この未知システムに入力するデータxと出
力されたデータyとを学習データ(x,y)として出力す
る学習データ出力部を設け、学習データ(x,y)の入力
に対してM次元のパラメータθを有する線形モデル“f
(x;θ)=Σiθii(x)”により前記未知システムを
回帰曲線“E[p(y|x)]”として推定する回帰曲線推
定部を設けた統計的学習装置において、前記回帰曲線推
定部の学習誤差が最小となるデータxを作成して前記学
習データ出力部に設定する学習データ作成部を設けたこ
とを特徴とする統計的学習装置。
1. When an unknown system outputs data y by an operation of a function and addition of Gaussian noise with respect to an input of data x, the data x input to this unknown system and the output data y are learned data. A learning data output unit for outputting as (x, y) is provided, and a linear model “f” having an M-dimensional parameter θ with respect to the input of learning data (x, y)
(x; θ) = Σ i θ i f i (x) ”In a statistical learning device provided with a regression curve estimation unit that estimates the unknown system as a regression curve“ E [p (y | x)] ”, A statistical learning device comprising: a learning data creation unit that creates data x that minimizes the learning error of the regression curve estimation unit and sets the data x in the learning data output unit.
【請求項2】 学習データ作成部は、パラメータvを有
して学習データ(x,y)のデータxを発生させる確率密
度関数“r(x;v)”を保持した入力分布保持部と、外
部から入力されるデータxの分布の密度関数の推定量
“ハットq(x)”を保持した推定量保持部と、密度関数
の推定量“ハットq(x)”を用いて確率密度関数“r
(x;v)”に従って学習データ(x,y)のデータxを発
生させた場合に回帰曲線推定部の学習誤差の推定値E
(v)が小さくなるパラメータvを算出する誤差最小化部
とを有し、この算出されたパラメータvを確率密度関数
“r(x;v)”に設定して学習データ(x,y)のデータ
xを発生させることを特徴とする請求項1記載の統計的
学習装置。
2. The learning data creation unit, an input distribution holding unit holding a probability density function “r (x; v)” for generating data x of learning data (x, y) with a parameter v, The probability density function “using the estimated quantity holding unit that holds the estimated quantity“ hat q (x) ”of the density function of the distribution of the data x input from the outside and the estimated quantity“ hat q (x) ”of the density function r
When the data x of the learning data (x, y) is generated according to (x; v) ", the estimated value E of the learning error of the regression curve estimation unit E
and an error minimization unit that calculates a parameter v in which (v) becomes smaller, and the calculated parameter v is set to the probability density function “r (x; v)” of the learning data (x, y). The statistical learning device according to claim 1, wherein the data x is generated.
【請求項3】 密度関数の推定量“ハットq(x)”を用
いて 【数1】 を計算する第一行列計算部を設け、確率密度関数“r
(x;v)”を用いて 【数2】 を計算する第二行列計算部を設け、誤差最小化部は、学
習誤差の推定値E(v)を 【数3】 として計算することを特徴とする請求項2記載の統計的
学習装置。
3. A density function estimator “hat q (x)” is used to obtain: The probability density function "r
(x; v) ” A second matrix calculation unit for calculating is provided, and the error minimization unit calculates the estimated value E (v) of the learning error as 3. The statistical learning device according to claim 2, wherein
【請求項4】 誤差最小化部は、学習誤差の推定値E
(v)を最小化するパラメータvを勾配方向を利用した逐
次的手法により計算することを特徴とする請求項3記載
の統計的学習装置。
4. The error minimization unit estimates the learning error E
4. The statistical learning device according to claim 3, wherein the parameter v that minimizes (v) is calculated by a sequential method using the gradient direction.
【請求項5】 入力分布保持部は、確率密度関数“r
(x;v)”が“M(M+1)/2”以下の個数の離散分布
として設定されていることを特徴とする請求項4記載の
統計的学習装置。
5. The probability distribution function “r
5. The statistical learning device according to claim 4, wherein (x; v) "is set as a discrete distribution of a number of" M (M + 1) / 2 "or less.
【請求項6】 入力分布保持部は、確率密度関数“r
(x;v)”が 【数4】 なる関数で一次独立の実数の個数の離散分布として設定
されていることを特徴とする請求項4記載の統計的学習
装置。
6. The probability distribution function “r
(x; v) ”is 5. The statistical learning device according to claim 4, wherein the function is set as a discrete distribution of the number of real numbers that are linearly independent.
【請求項7】 未知システムが一次元の実数直線からの
データxの入力に対して関数の演算とガウスノイズの加
算とによりデータyを出力するとき、この未知システム
に入力するデータxと出力されたデータyとを学習デー
タ(x,y)として出力する学習データ出力部を設け、学
習データ(x,y)の入力に対してM次元のパラメータθ
を有する多項式 【数5】 により前記未知システムを推定する平均推定部を設けた
統計的学習装置において、予め設定された二つの分布の
混合分布に従って前記平均推定部の学習誤差が最小とな
るデータxを作成して前記学習データ出力部に設定する
学習データ作成部を設けたことを特徴とする統計的学習
装置。
7. When the unknown system outputs the data y by inputting the data x from the one-dimensional real number straight line by the calculation of the function and the addition of Gaussian noise, the data x input to the unknown system is output. The learning data output unit that outputs the learned data y and the learning data (x, y) is provided, and the M-dimensional parameter θ is input to the learning data (x, y).
Polynomial with In the statistical learning device provided with the average estimation unit for estimating the unknown system according to the above, the learning data is created by creating the data x with which the learning error of the average estimation unit is minimized in accordance with the preset mixed distribution of two distributions. A statistical learning device, characterized in that a learning data creation unit for setting the output unit is provided.
【請求項8】 未知システムがデータxの入力に対して
関数の演算とガウスノイズの加算とによりデータyを出
力するとき、この未知システムに入力するデータxと出
力されたデータyとを学習データ(x,y)として学習デ
ータ出力部に出力させ、この学習データ(x,y)の入力
に対してM次元のパラメータθを有する線形モデル“f
(x;θ)=Σiθii(x)”により回帰曲線推定部が前
記未知システムを回帰曲線“E[p(y|x)]”として推
定するようにした統計的学習方法において、前記回帰曲
線推定部の学習誤差が最小となるデータxを学習データ
作成部が作成して前記学習データ出力部に設定するよう
にしたことを特徴とする統計的学習方法。
8. When the unknown system outputs data y by inputting data x by calculating a function and adding Gaussian noise, the data x input to this unknown system and the output data y are learned data. (x, y) is output to the learning data output unit, and a linear model “f” having an M-dimensional parameter θ for the input of this learning data (x, y)
(x; θ) = Σ i θ i f i (x) ”In the statistical learning method, the regression curve estimation unit estimates the unknown system as a regression curve“ E [p (y | x)] ”. The statistical learning method is characterized in that the learning data creation unit creates data x that minimizes the learning error of the regression curve estimation unit and sets it in the learning data output unit.
【請求項9】 未知システムが一次元の実数直線からの
データxの入力に対して関数の演算とガウスノイズの加
算とによりデータyを出力するとき、この未知システム
に入力するデータxと出力されたデータyとを学習デー
タ(x,y)として学習データ出力部に出力させ、この学
習データ(x,y)の入力に対してM次元のパラメータθ
を有する多項式 【数6】 により平均推定部が前記未知システムを推定するように
した統計的学習方法において、学習データ作成部が予め
設定された二つの分布の混合分布に従って前記平均推定
部の学習誤差が最小となるデータxを作成して前記学習
データ出力部に設定するようにしたことを特徴とする統
計的学習方法。
9. When an unknown system outputs data y by inputting data x from a one-dimensional real number straight line by calculating a function and adding Gaussian noise, it is output as data x input to this unknown system. Output data y as learning data (x, y) to the learning data output unit, and an M-dimensional parameter θ for the input of this learning data (x, y).
A polynomial with According to the statistical learning method in which the average estimation unit estimates the unknown system, the learning data creation unit calculates the data x with which the learning error of the average estimation unit is minimized according to the mixture distribution of two distributions set in advance. A statistical learning method, which is created and set in the learning data output unit.
【請求項10】 マイクロコンピュータを動作させるソ
フトウェアが書き込まれた情報記憶媒体において、請求
項1,2,3,4,5,6又は7記載の統計的学習装置
の各種機能がソフトウェアとして書き込まれていること
を特徴とする情報記憶媒体。
10. An information storage medium in which software for operating a microcomputer is written, and various functions of the statistical learning device according to claim 1, 2, 3, 4, 5, 6 or 7 are written as software. An information storage medium characterized by being present.
JP8099740A 1995-06-30 1996-04-22 Device and method for statistical learning, and information storage medium Pending JPH0973438A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8099740A JPH0973438A (en) 1995-06-30 1996-04-22 Device and method for statistical learning, and information storage medium

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP16494095 1995-06-30
JP7-164940 1995-06-30
JP8099740A JPH0973438A (en) 1995-06-30 1996-04-22 Device and method for statistical learning, and information storage medium

Publications (1)

Publication Number Publication Date
JPH0973438A true JPH0973438A (en) 1997-03-18

Family

ID=26440850

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8099740A Pending JPH0973438A (en) 1995-06-30 1996-04-22 Device and method for statistical learning, and information storage medium

Country Status (1)

Country Link
JP (1) JPH0973438A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012053040A (en) * 2010-08-10 2012-03-15 Astrium Gmbh Operation of accuracy parameter of spatial signal improved by robust in local navigation satellite system or global navigation satellite system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012053040A (en) * 2010-08-10 2012-03-15 Astrium Gmbh Operation of accuracy parameter of spatial signal improved by robust in local navigation satellite system or global navigation satellite system
US9121933B2 (en) 2010-08-10 2015-09-01 Astrium Gmbh Computing of robust and improved signal-in-space accuracy parameters in a regional or global navigation satellite system

Similar Documents

Publication Publication Date Title
Sadjina et al. Energy conservation and power bonds in co-simulations: non-iterative adaptive step size control and error estimation
US9483602B2 (en) Method and system for identifying rare-event failure rates
Shampine et al. Solving index-1 DAEs in MATLAB and Simulink
Schennach Nonparametric regression in the presence of measurement error
Giraldi et al. To be or not to be intrusive? The solution of parametric and stochastic equations---the “plain vanilla” Galerkin case
Zhu et al. A semi‐parametric regression model with errors in variables
Arnst et al. An overview of nonintrusive characterization, propagation, and sensitivity analysis of uncertainties in computational mechanics
Seo Asymptotic distribution of the cointegrating vector estimator in error correction models with conditional heteroskedasticity
JP7058202B2 (en) Information processing method and information processing system
Andrews et al. Higher-order improvements of the parametric bootstrap for long-memory Gaussian processes
Römisch et al. Stepsize control for mean-square numerical methods for stochastic differential equations with small noise
US6556954B1 (en) Method and device for determining a fault in a technical system
Cui et al. Component selection in the additive regression model
Dietrich et al. Fast and flexible uncertainty quantification through a data-driven surrogate model
Amatya et al. OrdNor: An R package for concurrent generation of correlated ordinal and normal data
JPH0973438A (en) Device and method for statistical learning, and information storage medium
WO2022220077A1 (en) Numerical calculation device for ordinary differential equation, method for executing arithmetic operation for solving ordinary differential equation in calculation device, and storage medium having program stored therein
Rubín et al. Spectral simulation of functional time series
Gibanica et al. Data-driven modal surrogate model for frequency response uncertainty propagation
Are et al. Optimal simple step-stress plan for Type-I censored data from geometric distribution
Gibson et al. Statistically based parametric yield prediction for integrated circuits
US7308467B2 (en) Method for on-demand generation of individual random numbers of a sequence of random numbers of a 1/f noise
Phillips A statistical perspective on nonlinear model reduction
Driessen Simulation-based optimization for product and process design
Domes et al. A scaling algorithm for polynomial constraint satisfaction problems