JP5570008B2 - カーネル回帰システム、方法及びプログラム - Google Patents

カーネル回帰システム、方法及びプログラム Download PDF

Info

Publication number
JP5570008B2
JP5570008B2 JP2010065634A JP2010065634A JP5570008B2 JP 5570008 B2 JP5570008 B2 JP 5570008B2 JP 2010065634 A JP2010065634 A JP 2010065634A JP 2010065634 A JP2010065634 A JP 2010065634A JP 5570008 B2 JP5570008 B2 JP 5570008B2
Authority
JP
Japan
Prior art keywords
data
calculating
time
observation
series data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010065634A
Other languages
English (en)
Other versions
JP2011198191A (ja
Inventor
剛 井手
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2010065634A priority Critical patent/JP5570008B2/ja
Priority to US13/053,616 priority patent/US8595155B2/en
Publication of JP2011198191A publication Critical patent/JP2011198191A/ja
Application granted granted Critical
Publication of JP5570008B2 publication Critical patent/JP5570008B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Description

この発明は、機械学習のための技法、特に、カーネル回帰の技法に関し、より詳しくは、多重核(multiple kernel)による回帰技法に関する。
近年、例えば、任意経路に対するコスト(例えば、所用時間)を予測するために、カーネル回帰の技法が採用されている。本願発明者らは、特願2008−240351号明細書に記述されているように、経路同士の類似度(カーネル関数)を表すために文字列カーネルを使用したガウス過程回帰により、地図上の任意経路に対する所用時間を予測する技法に想到した。このとき、文字列カーネルは、部分文字列の長さをパラメータとしてもつ。文字列カーネルと旅行時間の関係についての考察から、旅行時間は、さまざまな長さの部分文字列の寄与を統合したものと想定され、従って、本願発明者は、多重核関数の枠組みで予測モデルを作ることがより望ましいということに気付いた。
別の分野として、自動車の最適設計パラメータの推測技法がある。自動車の設計開発段階においては、所望の強度の条件を満たしつつも、最小のコストで済む設計パラメータを見出す必要がある。この作業は通常、シミュレーションを主とし、実車実験を従として進められるが、この場合、限られた実験点から、設計パラメータに対する目的関数(例えば、人体に加わる最大衝撃度)の依存性を知ることが重要である。それが分かると、現在のパラメータをどのように改善したらよりよくなるのかが分かる。一般に、その依存性は非線形であるので、この場合もカーネル回帰が好適であるが、設計パラメータには、様々な物理量が混在しており、単一のカーネル関数では、精度のよいモデリングを行うことが困難である。よって、物理量毎にグループ分けした上で、適切な複数のカーネル関数を用いることが望ましい。
その他の考えられる例として、顧客企業への販売見込み度スコアの計算がある。すなわち、潜在的に顧客になり得る企業のそれぞれを、何らかの数値の組として表現する。例えば、利益率などの経営指標、従業員数、競合他社の浸透状況、あるいはこれまでの購買履歴や業種をあらわす指標、などを使って、各企業を一つの属性ベクトルとして表す。そうして、既に売込みをした企業のデータを訓練データとして、過去の売上げ実績と営業担当者の感触を加味して、売り込み優先度を、何らかの実数値で計算する。その情報を用いて、ある未知の企業がどの程度見込みのある企業なのか知りたいという要望がある。この場合も、属性と見込み度の関係はやはり非線形になるはずで、カーネル回帰を用いることが望ましい。しかし、企業をあらわす属性には、質的に異なる量が混在しており、この場合も、質的に異なる量の各々に対応する適切な複数のカーネル関数を用いることが望ましい。
以上の例から見て取れるように、多重核関数学習法は、実世界におけるデータの異種混合性に対処するための極めて一般的な技法であるといえる。
特開2007−122418号公報は、複数の説明変数と、ある状態の発生の有無をあらわす従属変数とを有するサンプルの集合である学習データをデータベースから読み出す読出ステップと、前記説明変数ごとに用意された要素カーネル関数の和としてのカーネル関数を用いて定義された回帰式における回帰係数を、前記学習データを用いてあらかじめ与えられた目的関数を最適化することによって求める係数計算ステップと、入力パラメータとして複数の説明変数を前記回帰式に入力して従属変数を求める従属変数算出ステップと、求めた従属変数を確率予測関数に入力して前記ある状態が発生または発生しない確率を予測する確率予測ステップを開示する。ここで使用されるカーネル関数も、説明変数ごとに用意された要素カーネル関数の和である点で、多重核関数の一種である。
しかし、従来より、多重核関数学習法は、計算量が大きく、実用的なサイズの問題には、計算上の困難があった。
特願2008−240351号明細書 特開2007−122418号公報
この発明の目的は、実用的なサイズの問題も妥当な計算量で取り扱うことができる多重核関数学習技法を提供することにある。
本発明は例えば、複数の時系列データに、異なるフィルタをかけたデータを想定する。このデータは例えば、上述した、実験により得られた、自動車の最適設計パラメータのデータである。また、フィルタとは例えば、ノイズ除去の目的で使われるローパスフィルタや、トレンド成分の除去の目的で使われるハイパスフィルタ、あるいは、補間や区分線形近似などである。
そこで、i番目の時系列データの第q番目のフィルタの出力を、x(i) q,tと表記する。また、それぞれの時系列データは、時間軸に沿ってT個のデータをもつとすると、
x(i) q = [x(i) q,1,x(i) q,2, ..., x(i) q,T]T
ただし、ベクトルの肩のTは、転置の記号である。
ここで、類似度行列Aqを、その(i,j)成分が、x(i) qとx(j) qとの何らかの類似度を表すものとして定義する。例えば、ユークリッド空間の内積や、それを単調減少関数で変換したものなど、さまざまなものが考えられる。しかしここではそのような多様性は、フィルタの側で実現されているとして、類似度行列Aqを次のようにして定義する。
Figure 0005570008
これは、定義から分かるように、N×Nの行列となる。
本発明によると、この類似度行列で以って、下記のようにグラフ・ラプラシアンLが定義される。
Figure 0005570008
ここで、δは、クロネッカーのデルタである。uqは、結合定数であり、データから決定される(後述)。
訓練データから、結合定数{uq}を最適化することが本発明の目的であり、結合定数{uq}が最適化されると、下記のように、M個の類似度行列の一次結合として、類似度行列Aが得られる。
Figure 0005570008
本発明の知見によれば、観測変数と、それに付随する潜在変数、及び結合定数に確率モデルを想定し、変分ベイズ法を基に最適化を行うことにより、妥当な計算量で、多重核関数学習処理を計算することが可能となる。
ここで想定されるのは、次のような自然な仮定である。
− 観測モデルは、分散β-1をもつ正規分布である。
− 観測値を説明するための潜在変数も、正規分布である。
− 結合定数{uq}は、ガンマ事前分布に従う。
βと結合定数{uq}が、データから点推定されると、任意入力に対する出力の分布を計算することが可能となる。
この発明によれば、コンピュータの処理により、実用的なサイズの問題も妥当な計算量で取り扱うことができる多重核関数学習技法が提供される。
本発明を実施するための一例のハードウェア構成のブロック図である。 本発明の一実施例に係る機能論理ブロック図である。 フィルタされた各種時系列信号の波形を示す図である。 回帰用パラメータ処理のフローチャートを示す図である。 回帰用パラメータ処理のフローチャートを示す図である。 回帰用パラメータ処理のフローチャートを示す図である。 回帰用パラメータ処理のフローチャートを示す図である。 回帰処理のフローチャートを示す図である。
以下、図面に従って、本発明の実施例を説明する。これらの実施例は、本発明の好適な態様を説明するためのものであり、発明の範囲をここで示すものに限定する意図はないことを理解されたい。また、以下の図を通して、特に断わらない限り、同一符号は、同一の対象を指すものとする。
図1を参照すると、本発明の一実施例に係るシステム構成及び処理を実現するためのコンピュータ・ハードウェアのブロック図が示されている。図1において、システム・バス102には、CPU104と、主記憶(RAM)106と、ハードディスク・ドライブ(HDD)108と、キーボード110と、マウス112と、ディスプレイ114が接続されている。CPU104は、好適には、32ビットまたは64ビットのアーキテクチャに基づくものであり、例えば、インテル社のPentium(商標)4、インテル社のCore(商標) 2 DUO、AMD社のAthlon(商標)などを使用することができる。主記憶106は、好適には、1GB以上の容量、より好ましくは、2GB以上の容量をもつものである。
ハードディスク・ドライブ108には、オペレーティング・システムが、格納されている。オペレーティング・システムは、Linux(商標)、マイクロソフト社のWindows(商標) 7、Windows XP(商標)、Windows(商標)2000、アップルコンピュータのMac OS(商標)などの、CPU104に適合する任意のものでよい。
ハードディスク・ドライブ108にはさらに、訓練データとして、複数の時系列データにそれぞれ、異なるフィルタをかけた結果の時系列データが、所定のデータフォーマットで保存されている。これらの時系列データは、この実施例では、自動車の設計開発段階でシミュレーションの間に様々なセンサから取得した時系列データである。
ハードディスク・ドライブ108にはさらに、本発明に従う多重核関数の回帰用パラメータ計算プログラムと、計算されたパラメータに基づき、カーネル回帰を適用して回帰計算を行うプログラムが格納されている。これらのプログラムは、C、C++、C#、Java(商標)などの、既知の任意のプログラミング言語処理系で作成することができる。これらのプログラムについては、図2の機能ブロック図以下を参照して、後でより詳しく説明する。
キーボード110及びマウス112は、オペレーティング・システムが提供するグラフィック・ユーザ・インターフェースに従い、ディスプレイ114に表示されたアイコン、タスクバー、ウインドウなどのグラフィック・オブジェクトを操作するために使用される。キーボード110及びマウス112はまた、取得した時系列データの取り込み操作や本発明の実施例に係るプログラムを開始または終了する操作を行うためにも使用される。
ディスプレイ114は、これには限定されないが、好適には、1024×768以上の解像度をもち、32ビットtrue colorのLCDモニタである。ディスプレイ114は、所要時間などのコストを予測する経路を含む地図などを表示するために使用される。
図2は、本発明の一実施例に係る機能ブロック図を示す。訓練データ202は、この実施例では、実験により得られた、自動車の最適設計パラメータのデータを含む。このようなデータに対して、M個のフィルタを使って、N本の時系列データをそれぞれ、変換したとする。
そこで、i番目の時系列データの第q番目のフィルタの出力を、x(i) q,tと表記する。また、それぞれの時系列データは、時間軸に沿ってT個のデータをもつとすると、
x(i) q = [x(i) q,1,x(i) q,2, ..., x(i) q,T]T
ただし、ベクトルの肩のTは、転置の記号である。
図3に、フィルタの例を示す。図3(a)は、フィルタをかける前の元信号の時系列データであり、図3(b)は、フィルタをかけて周期成分を取り出した時系列データである。図3(c)は、フィルタをかけてトレンド成分を取り出した時系列データである。図3(d)は、フィルタをかけて残差成分を取り出した時系列データである。
訓練データ202は、評価値yN ≡ [y(1),y(2),...,y(N)]Tを含む。これは、訓練データ202における、個々の時系列データに対応する評価値の並びである。評価値yNは、実験結果に基づき、人為的な判断、あるいは、その他の測定ツールにより決定することができる。
訓練データ202は、CSV、XMLなどの既知の適当なデータフォーマットで、ハードディスク・ドライブ108に保存される。
回帰パラメータ計算モジュール204は、訓練データ202を入力して、観測モデルの分散βと、結合定数uのモード値を含む回帰用パラメータ206を出力する。回帰用パラメータ206は、好適には、主記憶106の所定の領域に格納される。なお、回帰用パラメータ206は、ハードディスク・ドライブ108の所定の領域の所定のファイルに含めてもよい。回帰パラメータ計算モジュール204の詳細については、図4〜図7のフローチャートを参照して、後で説明する。
観測データ208は、好適には、訓練データ202の測定に使用したのと同一のセンサを使用して測定された時系列データである。観測データ208もまた、CSV、XMLなどの既知の適当なデータフォーマットで、ハードディスク・ドライブ108に保存される。
回帰計算モジュール210は、回帰パラメータ計算モジュール204によって計算された回帰用パラメータ206及び訓練データ202を参照して、観測データ208に対応する評価値の予測分布を、計算結果212として与える。計算結果は、適当な視覚化ツール(図示しない)の処理により、表、折れ線グラフなどの形式で、ディスプレイ114に表示することができる。
次に、図4〜図6のフローチャートを参照して、回帰パラメータ計算モジュール204の処理を説明する。特に図4は、回帰パラメータ計算処理の全体の概要を示すフローチャートである。
尚、以下の計算を行うために、本実施例では、次のモデルを想定する。
- 観測モデルは、分散β-1をもつ正規分布である。
- 観測値を説明するための潜在変数も正規分布である。
- 結合定数{up}は、事前分布として、ガンマ分布に従う。{up}をベクトルとしてまとめてuと記すと、uのガンマ分布は、以下のとおりとなる。
Figure 0005570008

この式で、νは、予め適当な数値(例えば1程度)を選んでおくとする。
ガンマ分布は、指数分布の分散に対する共役自然分布として知られている。そこで、事前分布として共役自然分布を選ぶと、後の計算が劇的に簡単になることも知られている。こうして、ガンマ分布を事前分布として選ぶことは有利である。それでいて、ガンマ分布を選んでも、ほとんど一般性は失われない。なぜなら、結合定数は、その解釈上、負値をとらないことが要請され、また、もしモデリングがうまくいっていれば、ある特定の値の周りに鋭いピークをもつことが期待される。すなわち、単峰性を持つ分布であることが期待される。実用的な扱いやすさの観点から、ガンマ分布は、これらの条件をみたすほぼ唯一の分布である。
図4において、ステップ402では、回帰パラメータ計算モジュール204は、訓練データ202から、評価値yNと、L1, ..., LMを入力する。
ここで、Lq 但し、q = 1,2,...,Mとあるのは、次のようにして定義されたものである。
Figure 0005570008
すなわち、Lqは、第q番目のフィルタをかけた、i番目とj番目の時系列データの類似度行列Aqから生成されたグラフ・ラプラシアンであって、類似度行列AqがN×Nの行列なので、LqもN×Nの行列となる。
ステップ404では、回帰パラメータ計算モジュール204は、
ni = Tr(L1i) 但し、i = 1,2,...,Mを計算する。
ここで、L1は、下記で定義される。
Figure 0005570008

また、Trは、行列のトレース、すなわち、対角成分の和である。
ステップ406では、回帰パラメータ計算モジュール204は、βと、u~1,...,u~Mを初期化する。ここでβは、yNの分散の逆数程度に初期化される。u~1,...,u~Mは例えば、各々が1/M程度の値に初期化される。
尚、u~iとあるのは、uiのモード値であって、本明細書を通して、表記の便宜上、u~iと、
Figure 0005570008

を同一視する。
ステップ408では、回帰パラメータ計算モジュール204は、Λ,μ,u~1,...,u~M,βを計算する。ここでΛとμは初出であり、ΛはN×Nの行列、μはN次元のベクトルである。
ステップ408のより具体的な計算の内容は、図5のフローチャートを参照して、説明される。
図5において、ステップ502では、回帰パラメータ計算モジュール204は、あるβに対して、Λ,μ,u~1,...,u~Mを求める。そのより具体的な計算の内容は、図6のフローチャートを参照して、後で説明される。
ステップ504では、回帰パラメータ計算モジュール204は、Λ,μ,u~1,...,u~Mよりβを求める。そのより具体的な計算の内容は、図7のフローチャートを参照して、後で説明される。
ステップ506では、回帰パラメータ計算モジュール204は、Λ,μ,u~1,...,u~M,βは収束したかどうか判断する。ここで収束したかどうかの判断は、計算ループの一回前の各々の値と比較して、それらとの差が所定の閾値より小さいかどうかで行う。
回帰パラメータ計算モジュール204は、収束していないと判断すると、ステップ502に戻る。一方、ステップ506で収束したと判断すると、回帰パラメータ計算モジュール204は処理を終え、Λ,μ,u~1,...,u~M,βの値が確定する。
確定した値のうち、u~1,...,u~M,βは、回帰用パラメータ206としてセットされ、回帰計算モジュール210が利用可能となる。
次に図6のフローチャートを参照して、図5のステップ502をより詳細に説明する。図6において、回帰パラメータ計算モジュール204は、ステップ602で、βの値を入力する。これは、実際は図4のステップ406で用意されたものである。
ステップ604では、回帰パラメータ計算モジュール204は、下記の式に従い行列の値を計算して、Λに入力する。既述のように、ΛはN×Nの行列である。
Figure 0005570008

ここで、INは、N×Nの単位行列である。
ステップ606では、回帰パラメータ計算モジュール204は、ステップ604で計算されたΛを用いて、下記の式に従い、μを計算する。既述のように、μはN次元のベクトルである。
μ ← βΛ-1yN
ステップ608では、回帰パラメータ計算モジュール204は、下記の式に従い、γiと、u~i(i = 1,...,M)を計算する。
Figure 0005570008
ステップ610では、回帰パラメータ計算モジュール204は、Λ,μ,u~1,...,u~Mは収束したかどうか判断する。ここで収束したかどうかの判断は、計算ループの一回前の各々の値と比較して、それらとの差が所定の閾値より小さいかどうかで行う。
ステップ610で、回帰パラメータ計算モジュール204が収束したと判断すると、Λ,μ,u~1,...,u~Mの値を図5のステップ504に渡す。収束していない場合は、処理は、ステップ604に戻る。
次に図7のフローチャートを参照して、図5のステップ504をより詳細に説明する。図7において、回帰パラメータ計算モジュール204は、ステップ702で、Λ,μ,u~1,...,u~Mの値を入力する。これは、実際は図5のステップ502、すなわち図6のフローチャートの処理で用意されたものである。
ステップ704では、回帰パラメータ計算モジュール204は、下記の式に従い、N/βの値を計算する。
Figure 0005570008
ステップ706では、回帰パラメータ計算モジュール204は、下記の式に従い、N/βから、βの値を計算する。
Figure 0005570008
ステップ708では、回帰パラメータ計算モジュール204は、βが収束したかどうか判断する。ここで収束したかどうかの判断は、計算ループの一回前の各々の値と比較して、それらとの差が所定の閾値より小さいかどうかで行う。
ステップ708で、回帰パラメータ計算モジュール204が収束したと判断すると、βの値が確定する。収束していない場合は、処理は、ステップ704に戻る。
この結果、Λ,μ,u~1,...,u~M,βが全て確定するので、回帰パラメータ計算モジュール204は、このうち、u~1,...,u~M,βを回帰用パラメータ206にセットする。
次に、図8のフローチャートを参照して、回帰計算モジュール210による処理を説明する。
この回帰で求められるのは、入力時系列データxを与えたときの、yの確率分布である。その、未知入力に対する予測分布は、一般には次の式で与えられる。
Figure 0005570008

訓練フェーズを終えた時点で、β,niiが揃っており、νは例えば1程度に設定することで、上記積分を計算することは原理的には可能であるが、計算量が大きい。
そこで、p(y|x,data) = N(y|mL(u~),s(u~)2)という近似式を用いるのが、計算量的に妥当である。この近似は、Christopher M. Bishop, "Pattern Recognition and Machine Learning (Information Science and Statistics) ", Springer Science Media. LLC. 2006の第4章に記載されているラプラス近似に基づく。この近似は、Nが十分大きいときに妥当である。
上記計算によれば、予測分布は、下記のように既述することができる。
y = mL(u~)
なお、上記記法の式の内容については、以下で順次説明する。
図8において、ステップ802では、回帰計算モジュール210は、観測データ208から、時系列データxを得る。
ステップ804では、回帰計算モジュール210は、入力時系列データxにM種類のフィルタをかけて、M本の時系列データを作る。すなわち、q = 1,2,...,Mに対して、次のT次元ベクトルができる(Tは、時間軸上のデータ点数)。
xq ≡ [xq,1,xq,2,xq,3,...,xq,T]T ∈ RT
ここで、訓練データにおける第qフィルタで処理された時系列データをそれぞれ、
xq (1),xq (2),...,xq (T) ∈ RTとする。
さらに、aq(xq (i),xq (j)) ≡ Aq i,jと定義する。
以上の準備の下、ステップ804では、次の式によって、l0と、lが計算される。
Figure 0005570008
ステップ808では、回帰計算モジュール210は、下記の式によりDを計算する。
Figure 0005570008
ステップ810では、回帰計算モジュール210は、下記の式によりmL,s2 Lを計算する。
Figure 0005570008
ステップ812では、回帰計算モジュール210は、出力yの期待値mLを出力する。これは、yの確率分布であり、必要に応じて、結果計算モジュール212によってディスプレイ114に表示される。
なお、上記実施例は、時系列データに対する異なるフィルタ毎に異なるカーネルを適用するマルチ・カーネル・スキームであったが、これには限定されず、任意経路に対するコスト予測、顧客企業への販売見込み度スコアの計算など、一般に訓練データ内のサンプルに対する類似度ないしカーネルが定義できる問題であれば、さまざまな分野に適用可能である。例えば、特願2008−240351号明細書に記載の任意経路に対するコスト予測であれば、経路についてのカーネル行列を本明細書記載の類似度行列と同一視すればよい。
また、例示されているハードウェア構成は一例であって、マルチプロセッサ環境、ネットワーク接続のクラウドコンピューティング環境など、任意のハードウェア環境で使用可能である。
102 システム・バス
104 CPU
110 キーボード
112 マウス
114 ディスプレイ
106 主記憶
108 ハードディスク・ドライブ
202 訓練データ
204 回帰パラメータ計算モジュール
206 回帰用パラメータ
208 観測データ
210 回帰計算モジュール
212 計算結果

Claims (12)

  1. 種別の異なる複数の観測データと、その評価値を訓練データとして多重核関数学習法を使用して推定値を計算する方法であって、前記観測データが時系列データであり、前記種別の異なる複数の観測データは、前記時系列データに、異なるフィルタをかけた後の時系列データであり、前記時系列のデータが時間軸に沿ってT個のデータwを持つ場合に、x (i) q = [x (i) q,1 ,x (i) q,2 , ..., x (i )q,T ] T 、ただし、ベクトルの肩のTは転置の記号であり、i番目の時系列データの第q番目のフィルタの出力がx (i) q,t と定義され、コンピュータが、
    個々の種別のデータ毎に類似度行列 q を計算するステップであって、前記類似度行列A q が、N×Nの行列であり、その(i,j)成分がx (i) q 及びx (j) q であり、且つ下記式によって定義される:
    Figure 0005570008
    前記類似度行列を計算するステップと、
    前記計算された類似度行列 q を用いてグラフ・ラプラシアン を計算するステップであって、前記グラフ・ラプラシアンL が、N×Nの行列であり、第q番目のフィルタをかけた、i番目とj番目の時系列データの類似度行列A q から生成されたグラフ・ラプラシアンであり、且つ下記式で定義される:
    Figure 0005570008
    ここで、δはクロネッカーのデルタであり、u q は結合定数であり、q = 1,2,...,Mである、前記グラフ・ラプラシアンLを計算するステップと、
    前記計算されたグラフ・ラプラシアン 変分ベイズ法用いて、前記結合定数u q 前記複数の観測データの観測変数の分散を計算するステップと
    実行することを含む、前記方法。
  2. 前記結合定数と前記複数の観測データの前記観測変数の分散を計算するステップが、
    前記観測変数の分散から前記結合定数を計算することと、前記結合定数から前記観測変数の分散を計算することを、前記結合定数から前記観測変数の分散が収束するまで続けるステップ
    を含む、請求項1に記載の方法。
  3. 前記コンピュータが、
    前記結合定数u q と前記複数の観測データの前記観測変数の分散の値を用いて、所与の観測データから、評価値の分布を出力するステップ
    実行することをさらに含む、請求項1又は2に記載の方法。
  4. 前記異なるフィルタが、周期成分と取り出すためのフィルタ、トレンド成分を取り出すためのフィルタ、及び残差成分を取り出すためのフィルタである、請求項1〜3のいずれか一項に記載の方法
  5. 前記結合定数u q と前記複数の観測データの前記観測データの観測変数の分散とを計算するステップが、
    前記複数の観測データの各前記観測変数は分散β -1 をもつ正規分布に従い、且つ、複数の前記結合定数u q をベクトルとしてまとめてuと記すと、当該uはガンマ分布に従うという仮定の下で計算される、
    請求項1〜4のいずれか一項に記載の方法。
  6. 前記複数の観測データが、自動車の最適設計パラメータのデータである、請求項1〜5のいずれか一項に記載の方法
  7. 種別の異なる複数の観測データと、その評価値を訓練データとして、コンピュータの処理により、多重核関数学習法を使用して推定値を計算するシステムであって、前記観測データが時系列データであり、前記種別の異なる複数の観測データは、前記時系列データに、異なるフィルタをかけた後の時系列データであり、前記時系列のデータが時間軸に沿ってT個のデータwを持つ場合に、x (i) q = [x (i) q,1 ,x (i) q,2 , ..., x (i )q,T ] T 、ただし、ベクトルの肩のTは転置の記号であり、i番目の時系列データの第q番目のフィルタの出力がx (i) q,t と定義され、前記システムが、
    個々の種別のデータ毎に類似度行列 q を計算するステップであって、前記類似度行列A q が、N×Nの行列であり、その(i,j)成分がx (i) q 及びx (j) q であり、且つ下記式によって定義される:
    Figure 0005570008
    前記第1の計算手段と、
    前記計算された類似度行列 q を用いてグラフ・ラプラシアン を計算するステップであって、前記グラフ・ラプラシアンL が、N×Nの行列であり、第q番目のフィルタをかけた、i番目とj番目の時系列データの類似度行列A q から生成されたグラフ・ラプラシアンであり、且つ下記式で定義される:
    Figure 0005570008
    ここで、δはクロネッカーのデルタであり、u q は結合定数であり、q = 1,2,...,Mである、前記第2の計算手段と、
    前記計算されたグラフ・ラプラシアン 変分ベイズ法用いて、前記結合定数u q 前記複数の観測データの観測変数の分散を計算する第3の計算手段と
    備えている、前記システム。
  8. 前記第3の計算手段が、
    前記観測変数の分散から前記結合定数を計算することと、前記結合定数から前記観測変数の分散を計算することを、前記結合定数から前記観測変数の分散が収束するまで続ける手段
    備えている、請求項に記載のシステム。
  9. 前記結合定数u q と前記複数の観測データの前記観測変数の分散の値を用いて、所与の観測データから、評価値の分布を出力する出力手段
    さらに備えている請求項7又は8に記載のシステム。
  10. 前記異なるフィルタが、周期成分と取り出すためのフィルタ、トレンド成分を取り出すためのフィルタ、及び残差成分を取り出すためのフィルタである、請求項7〜9のいずれか一項に記載のシステム。
  11. 前記第3の計算手段が、
    前記複数の観測データの各前記観測変数は分散β -1 をもつ正規分布に従い、且つ、複数の前記結合定数u q をベクトルとしてまとめてuと記すと、当該uはガンマ分布に従うという仮定の下で計算される、
    請求項7〜10のいずれか一項に記載のシステム。
  12. 種別の異なる複数の観測データと、その評価値を訓練データとして多重核関数学習法を使用して推定値を計算する為のコンピュータ・プログラムであって、前記観測データが時系列データであり、前記種別の異なる複数の観測データは、前記時系列データに、異なるフィルタをかけた後の時系列データであり、前記時系列のデータが時間軸に沿ってT個のデータwを持つ場合に、x (i) q = [x (i) q,1 ,x (i) q,2 , ..., x (i )q,T ] T 、ただし、ベクトルの肩のTは転置の記号であり、i番目の時系列データの第q番目のフィルタの出力がx (i) q,t と定義され、前記訓練データが記憶装置に格納されており、コンピュータに、請求項1〜6のいずれか一項に記載の方法の各ステップを実行させる、前記コンピュータ・プログラム。
JP2010065634A 2010-03-23 2010-03-23 カーネル回帰システム、方法及びプログラム Active JP5570008B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010065634A JP5570008B2 (ja) 2010-03-23 2010-03-23 カーネル回帰システム、方法及びプログラム
US13/053,616 US8595155B2 (en) 2010-03-23 2011-03-22 Kernel regression system, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010065634A JP5570008B2 (ja) 2010-03-23 2010-03-23 カーネル回帰システム、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2011198191A JP2011198191A (ja) 2011-10-06
JP5570008B2 true JP5570008B2 (ja) 2014-08-13

Family

ID=44657497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010065634A Active JP5570008B2 (ja) 2010-03-23 2010-03-23 カーネル回帰システム、方法及びプログラム

Country Status (2)

Country Link
US (1) US8595155B2 (ja)
JP (1) JP5570008B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5839970B2 (ja) 2011-12-05 2016-01-06 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation イベント系列のリスク評価値を算出する方法、装置及びコンピュータプログラム
US8688309B2 (en) * 2011-12-12 2014-04-01 International Business Machines Corporation Active and stateful hyperspectral vehicle evaluation
JP5988419B2 (ja) 2012-01-11 2016-09-07 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 予測方法、予測システムおよびプログラム
US9860140B2 (en) * 2013-02-05 2018-01-02 Cisco Technology, Inc. Dynamically adjusting a set of monitored network properties using distributed learning machine feedback
US10304006B2 (en) 2013-02-15 2019-05-28 The Charles Stark Draper Laboratory, Inc. Method for integrating and fusing heterogeneous data types to perform predictive analysis
JP6507512B2 (ja) * 2014-07-25 2019-05-08 富士通株式会社 推定プログラム、推定方法および推定装置
KR101779584B1 (ko) * 2016-04-29 2017-09-18 경희대학교 산학협력단 복잡도 감소에 기반한 ds-cdma 시스템에서의 원신호 복원 방법
US20180182042A1 (en) * 2016-12-22 2018-06-28 American Express Travel Related Services Company, Inc. Systems and methods for estimating transaction rates
JP7007632B2 (ja) * 2017-08-03 2022-01-24 住友電気工業株式会社 検知装置、検知方法および検知プログラム
JP7395169B2 (ja) * 2017-11-14 2023-12-11 慶應義塾 時系列データ生成装置及びプログラム
KR102109369B1 (ko) * 2018-03-16 2020-05-28 울산과학기술원 시계열 데이터의 변화를 예측하고 그 이유를 설명하는 인공지능 시스템
JP7056497B2 (ja) * 2018-10-03 2022-04-19 トヨタ自動車株式会社 重回帰分析装置及び重回帰分析方法
CN111061150B (zh) * 2019-10-23 2020-11-27 南京大学 一种拉普拉斯频率响应的硬件实现方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050119534A1 (en) 2003-10-23 2005-06-02 Pfizer, Inc. Method for predicting the onset or change of a medical condition
US7636651B2 (en) * 2003-11-28 2009-12-22 Microsoft Corporation Robust Bayesian mixture modeling
JP5093431B2 (ja) 2005-10-28 2012-12-12 日本電気株式会社 シミュレータシステム、評価方法、及びプログラム
US7616826B2 (en) * 2006-07-28 2009-11-10 Massachusetts Institute Of Technology Removing camera shake from a single photograph using statistics of a natural image
JP4978860B2 (ja) * 2007-01-24 2012-07-18 株式会社国際電気通信基礎技術研究所 行動予測方法及び行動予測装置
KR100967701B1 (ko) * 2007-02-26 2010-07-07 한국외국어대학교 연구산학협력단 3차원 유화 데이터의 복원
EP1992939A1 (en) * 2007-05-16 2008-11-19 National University of Ireland, Galway A kernel-based method and apparatus for classifying materials or chemicals and for quantifying the properties of materials or chemicals in mixtures using spectroscopic data.
US20120201096A1 (en) * 2009-10-27 2012-08-09 Henri-Pierre Valero Methods and Apparatus to Process Time Series Data for Propagating Signals in A Subterranean Formation

Also Published As

Publication number Publication date
US20110238606A1 (en) 2011-09-29
JP2011198191A (ja) 2011-10-06
US8595155B2 (en) 2013-11-26

Similar Documents

Publication Publication Date Title
JP5570008B2 (ja) カーネル回帰システム、方法及びプログラム
CN111126622B (zh) 一种数据异常检测方法与装置
US8112305B2 (en) Systems and methods for distribution-transition estimation of key performance indicator
JP5988419B2 (ja) 予測方法、予測システムおよびプログラム
US9058449B2 (en) Simulating machine and method for determining sensitivity of a system output to changes in underlying system parameters
Koduru et al. Feasibility of FORM in finite element reliability analysis
CN108255897B (zh) 可视化图表数据转换处理方法和装置
JP2011222017A (ja) 技術設計最適化における最も影響力のある設計変数の識別方法
CN106022631B (zh) 一种指标权重分析方法
Luleci et al. Generative adversarial networks for labeled acceleration data augmentation for structural damage detection
WO2021049365A1 (ja) 情報処理装置、情報処理方法、及びプログラム
CN113037577A (zh) 网络流量预测方法、装置和计算机可读存储介质
JP6631540B2 (ja) 情報処理システム、変化点検出方法、およびプログラム
WO2021039545A1 (ja) 異常検知装置、異常検知方法、及びプログラム
WO2010136391A2 (en) Effort estimation using text analysis
US7512519B2 (en) Run-time characterization of on-demand analytical model accuracy
JP2010061323A (ja) 作業評価値予測方法、プログラム及びシステム
US20230076149A1 (en) Methods and apparatus for data imputation of a sparse time series data set
Sadiq et al. Prediction of software project effort using fuzzy logic
CN109598347A (zh) 用于确定因果关系的方法、系统和计算机程序产品
JP6992733B2 (ja) 情報処理装置、および情報処理方法
JP2013205848A (ja) コスト推定システム、方法及びプログラム
JP7384345B2 (ja) 特許情報処理装置、特許情報処理方法、およびプログラム
CN110880141A (zh) 一种深度双塔模型智能匹配算法及装置
WO2022234674A1 (ja) 学習装置、予測装置、学習方法、予測方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20140203

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140203

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20140203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20140205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20140609

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20140609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140620

R150 Certificate of patent or registration of utility model

Ref document number: 5570008

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250