JP5988419B2 - 予測方法、予測システムおよびプログラム - Google Patents

予測方法、予測システムおよびプログラム Download PDF

Info

Publication number
JP5988419B2
JP5988419B2 JP2012003233A JP2012003233A JP5988419B2 JP 5988419 B2 JP5988419 B2 JP 5988419B2 JP 2012003233 A JP2012003233 A JP 2012003233A JP 2012003233 A JP2012003233 A JP 2012003233A JP 5988419 B2 JP5988419 B2 JP 5988419B2
Authority
JP
Japan
Prior art keywords
variable
function
unit
kernel
regression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012003233A
Other languages
English (en)
Other versions
JP2013143031A (ja
Inventor
力矢 高橋
力矢 高橋
哲郎 森村
哲郎 森村
貴行 恐神
貴行 恐神
完壮 幸若
完壮 幸若
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2012003233A priority Critical patent/JP5988419B2/ja
Priority to US13/732,693 priority patent/US9087294B2/en
Publication of JP2013143031A publication Critical patent/JP2013143031A/ja
Application granted granted Critical
Publication of JP5988419B2 publication Critical patent/JP5988419B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Water Supply & Treatment (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、製造工程において消費される電力等のデータを正確に予測するための方法、そのシステムおよびその方法を実現するためのコンピュータ可読なプログラムに関する。
自動車や電気製品等は、多くの金属やプラスチック等の材料を溶融、成形して部品を製造し、その部品を組み立てることにより製造される。これらの製品に使用される鉄等は、原石を粉砕し、溶融し、他の金属や炭素等を添加し、一定の形状に成形することにより製造される。これらの製造において消費される電力は、鉄、銅、ポリエチレン、ポリプロピレン等の原材料の物性やその大きさ等から予測することができるが、その1つの手法として、回帰分析という手法が用いられている。
この回帰分析は、複数の量的変数のうち、注目している説明したい変数(被説明変数)を、これを説明するために用いられる変数(説明変数)で説明する回帰式を求める手法である。回帰式は、データの点の分布を良く近似する関数である。この手法では、実際に使用された原材料の物性やその大きさ等のデータと、実際に計測された電力データとを学習データとして用い、数式モデル化した回帰式を求める。なお、予測したい電力は、この求めた回帰式に、原材料の物性やその大きさ等のデータを入力することにより求めることができる。
その他の手法として、条件付き密度推定という手法も用いられている。条件付き密度推定も回帰分析と同様に被説明変数と説明変数の関係式を導出する。ただし、導出されるのは、被説明変数の平均を予測する回帰式ではなく、被説明変数の確率分布を表す条件付き確率密度関数である。回帰分析は、誤差分布に正規分布等のパラメトリックな仮定を置くが、条件付き密度推定は、多くの場合、ノンパラメトリック手法を用いて誤差分布も正規分布等に限らず、複雑な分布を取り扱う。
例えば、各説明変数の相互作用および非線形な寄与を考慮し、予測すべき状態の確率を精度良く予測することができる技術が開示されている(特許文献1参照)。この技術では、まず、複数の説明変数と、ある状態の発生の有無を表す従属変数(被説明変数)とを有するサンプルの集合である学習データをデータベースから読み出す。そして、説明変数ごとに用意された要素カーネル関数の和としてのカーネル関数を用いて定義された回帰式における回帰係数を、その学習データを用いて予め与えられた目的関数を最適化することにより求める。
その後、この技術では、入力パラメータとして複数の説明変数を回帰式に入力して従属変数を求める。そして、求めた従属変数を確率予測関数に入力して、ある状態が発生する確率、あるいは発生しない確率を予測する。ここで、上記のカーネル関数は、データx(i)のd次元の特徴空間の中でのベクトル表現をφ(x(i))とすると、i番目のデータとj番目のデータの間のカーネル関数がk(x(i),x(j))=〈φ(x(i),φ(x(j))〉のように特徴ベクトルの内積で表される関係を有するものである。
カーネル法を用いる回帰学習方法として、種別の異なる複数の観測データと、その評価値を訓練データとして、コンピュータの処理により、多重核関数学習法を使用して推定値を計算する方法が開示されている(特許文献2参照)。この方法は、個々の種別のデータ毎に類似度行列を計算し、その計算された類似度行例を用いて、個々の種別のデータ毎にグラフ・ラプラシアンを計算する。そして、結合定数による一次結合として全体のグラフ・ラプラシアンを与え、観測データの観測モデルが正規分布で、観測データを説明するための潜在変数も正規分布で、結合定数がガンマ事前分布に従うという仮定の下、グラフ・ラプラシアンを用いて変分ベイズ法により、結合定数と観測モデルの分散を計算する。その後、結合定数と観測モデルの分散を用い、ラプラス近似により、任意の入力データに対する予測分布を求める。
このように、観測変数、それに付随する潜在変数、および結合定数に確率モデルを想定し、変分ベイズ法を基に最適化することにより、妥当な計算量で、多重核関数学習処理を計算することを可能にしている。
特開2007−122418号公報 特開2011−198191号公報
上記の製造工程において原材料の物性等から消費される電力を予測するための回帰手法には、次のような課題が存在する。1つ目の課題は、学習データとして用いる被説明変数が部分的にしか観測されていないことである。
ある製鉄工場の製造工程を例にとると、データ集約により、30分毎の電力合計値のみが計測され、保存されている。この30分間の間には、材質も大きさも異なる複数の原材料が処理されている。このため、学習データとして、単一の原材料を処理した場合に消費される電力等のサンプルは得ることができず、特定の大きさで、かつ特定の組み合わせの原材料について計測された30分毎の電力合計値が得られるのみである。
2つ目の課題は、原材料の種類等の説明変数の一部が、物性や大きさ等とは異なり、ダミー変数(離散変数)であるため、従来の回帰手法では予測精度が低いことである。
原材料の種類等は、物性や大きさ等のように連続値として得られるものではなく、特定の原材料であるか否かという離散値でしか与えられないからである。
カーネル関数には、線形カーネル、多項式カーネル、RBF(Radial-Basis-Function)カーネル(ガウシアン・カーネルとも呼ばれる。)等がある。汎用的な非線形予測手法としてRBFカーネルが広く使用されるが、これは、十分なサンプルが得られる状況ではいかなる回帰関数をも復元することができる。しかしながら、上記の30分毎の電力合計値のみが保存される状況においては、サンプル数が限られているため、RBFカーネルを用いる手法では汎化誤差が大きくなってしまう。
3つ目の課題は、例えば30分間というユニット内で、オーダーが異なる消費電力が合計されており、回帰問題における誤差分布のスケール設定がしにくいことである。消費電力のオーダーが異なれば、それに応じて誤差分布のオーダーも変化すると考えられるが、個々の原材料につき消費電力が計測されないので、誤差分布のスケールをどのオーダーに設定するかを決めるのは困難である。
上記特許文献1および2に記載の方法を含む従来の回帰手法は、学習データのサンプル数が限られていることも、離散変数を含むことから予測精度が低くなることも、誤差分布のスケール設定がしにくいことも考慮されていない。このため、従来の回帰手法では、これらの課題を解決することができなかった。そこで、これらの課題を解決することができる方法やその方法を実施するためのシステムの提供が望まれていた。
本発明は、上記課題を解決するためになされたものであり、上記課題は、以下の予測方法、その方法を実施するための予測システムおよびコンピュータをその予測システムとして機能させるためのコンピュータ可読なプログラムを提供することにより解決することができる。
すなわち、この予測方法は、離散変数と連続変数の組み合わせの集合により与えられる説明変数から被説明変数を予測するためのコンピュータにより実行される方法である。この方法は、予測したい被説明変数に対する説明変数を入力データとして受け付けるステップと、入力データに含まれる集合内の離散変数と連続変数の組み合わせからなる各要素につき、被説明変数が観測された複数の集合に関する学習データを用い、離散変数が一致する当該複数の集合内の要素を検索するステップとを含む。
また、この方法は、入力データの要素と当該入力データの要素につき検索された1以上の要素の各々について、連続変数から得られる被説明変数に対応するスカラー、より具体的には被説明変数におおよそ比例するスカラーを表すスケール変数により重み付けされた2つの集合間の類似度を与える関数を適用して各関数値を計算し、各関数値の和を、入力データのすべての要素につき計算するステップと、各要素につき計算された和を、被説明変数を予測するための推定式に適用して、各要素につき被説明変数の予測値を計算するステップとを含む。
このように、離散変数が一致する要素同士についてのみ、連続変数から得られる被説明変数におおよそ比例するスカラーを表すスケール変数により重み付けされた関数を適用して各関数値を計算し、その和をそれぞれ求め、各要素につき被説明変数の予測値を計算することで、被説明変数が部分的にしか観測されていなくても、説明変数が離散変数を含む場合であっても、学習データにはない要素の組み合わせに対して被説明変数の予測値を求めることができる。
また、個々の要素と被説明変数との厳密な対応がとれていなくても、学習データを用いて個々の要素につき被説明変数の予測値を求めることができる。さらに、被説明変数のオーダーが異なる要素を含む場合であっても、小さな誤差で被説明変数の値を予測することができる。
本発明は、特に、製造業における原材料を溶融、成形等して製品を製造する際に消費される電力を予測する方法として有用である。この場合、離散変数は、消費電力が観測されるユニットに含まれる原材料の種類を表す値とされる。連続変数は、そのユニットに含まれる原材料に関する連続量をまとめたベクトルとされる。スケール変数は、そのユニットに含まれる原材料の体積もしくは質量または他の変数とそれらの変数を複数含む数式の計算値で被説明変数におおよそ比例する値とされる。被説明変数は、そのユニットで消費される消費電力となる。
2つの集合間の類似度を与える関数として、カーネル関数を用いることができ、RBFカーネルを用いることが好ましい。これにより、説明変数と被説明変数との関係が非線形であっても、その被説明変数の値を予測することができる。
上記の推定式は、回帰式または条件付き密度関数とされる。回帰式や条件付き密度関数は、高次元の特徴ベクトルを含むが、カーネル関数を適用して計算することにより、この高次元の特徴ベクトル自体を計算により求める必要がなくなり、計算時間を短縮することができる。
カーネル関数を用いた予測方法として、正規過程回帰、Nadaraya-Watsonカーネル回帰、関連ベクトル回帰、サポート・ベクトル回帰、Kullback-Leibler重要度推定法、最小二乗条件付き密度推定のいずれか1つのノンパラメトリック回帰または条件付き密度推定法が適用可能である。後述するカーネル行列およびカーネル・ベクトルの計算を含むものであれば、これら以外の手法も適用可能である。
また、上記の関数が、カーネル関数とされ、この予測方法が、正規過程回帰を用いるものである場合、カーネル関数に設定されるハイパー・パラメータを、学習データを用いて最適化するステップと、学習データを用い、最適化されたハイパー・パラメータをカーネル関数に設定してカーネル行列を導出するステップと、導出されたカーネル行列を用いて推定式に設定するためのパラメータを計算するステップとをさらに含むことができる。最適化されたハイパー・パラメータを求め、そのハイパー・パラメータから消費電力の予測に必要とされるパラメータを算出するためである。
最適化するステップは、例えば、ハイパー・パラメータを、周辺尤度最大化法を用いて最適化し、カーネル行列を導出するステップは、学習データに含まれる各集合につき、各集合に含まれる複数のスケール変数を用いて対角要素を計算して対角行列も導出し、パラメータを計算するステップは、導出されたカーネル行列と対角行列とを用いて推定式に設定するためのパラメータを計算することができる。
本発明では、上記の方法を実施するためのシステムを提供することもできる。このシステムは、上記の入力データを受け付けるデータ入力部と、上記の要素を計算する要素検索部と、上記の各関数値の和を計算する関数値計算部と、予測値を計算する予測値計算部とを含む。また、上記のハイパー・パラメータを最適化するパラメータ最適化部と、カーネル行列を導出するカーネル行列導出部と、パラメータを計算するパラメータ計算部とをさらに含むことができる。
本発明は、上記の方法をコンピュータに実行させ、そのコンピュータを上記システムとして機能させるコンピュータ可読なプログラムとして提供することも可能である。このプログラムは、ネットワークに接続されたサーバ装置やデータベース等に格納され、ダウンロード要求に応じて提供することもできるし、CD−ROM、SDカード、DVD、フラッシュメモリ等の記録媒体に格納して提供することも可能である。
本発明の方法を実施するためのシステムのハードウェア構成の一例を示した図。 図1に示すシステムの第1実施形態を示した機能ブロック図。 図2に示すシステムが行う処理の流れを示したフローチャート図。 図1に示すシステムの第2実施形態を示した機能ブロック図。 図4に示すシステムが行う処理の流れを示したフローチャート図。 カーネル行列の行列要素とカーネル・ベクトルのベクトル要素の計算法を例示した図。 従来のカーネル回帰手法と、本方法とを用いて行ったシミュレーション結果をテーブルで示した図。 ユニット内の各原材料に対して予測した消費電力と実際に測定した消費電力との関係を示した図。 図7に示す予測結果と実測結果とを対数軸にプロットしたところを示した図。 ユニット内のすべての原材料につき予測した消費電力を合計した合計消費電力と実際に測定した合計消費電力との関係を示した図。 図9に示す予測結果と実測結果とを対数軸にプロットしたところを示した図。
図1は、本発明の方法を実施するためのシステムのハードウェア構成の一例を示した図である。このシステム100は、パーソナル・コンピュータやワークステーション等とすることができ、CPU102、主記憶装置として用いられるRAM104およびROM106、ハードディスク・ドライブ(HDD)108、キーボードやマウスといった入力装置110、ディスプレイといった表示装置112を含んで構成することができる。これらは、いずれもシステム・バス114に接続され、データ等のやりとりは、このシステム・バス114を介して行われる。
CPU102は、一度に扱えるデータの幅が32ビットあるいは64ビットのものが好ましく、例えば、インテル社のCore(登録商標)、Pentium(登録商標)、AMD社のPhenom(登録商標)、Athlon(登録商標)等を用いることができる。RAM104は、CPU102が直接読み書きするための記憶装置で、例えば、1GB以上の容量のものを挙げることができる。本発明の方法は、複雑な特徴ベクトルの計算を含まないことから計算量は削減されるが、計算速度を向上させるために2GB以上の容量のものが好ましい。
ROM106は、読み出し専用のメモリで、BIOS(Basic Input/Output System)やファームウェア等を記憶する。HDD108は、各種のアプリケーション・ソフトウェアやオペレーティング・システム(OS)等を記憶する。OSとしては、UNIX(登録商標)、Linux(登録商標)、Windows(登録商標)、Mac OS(登録商標)等、CPU102に適合する任意のものを用いることができる。
また、HDD108には、本発明の方法を実行させるためのプログラムを記憶することができる。このプログラムは、CPU102によりRAM104に読み出され、CPU102がそのプログラムを実行することにより、後述する処理を実現する。このプログラムは、C、C++、C#、Java(登録商標)等のこれまでに知られた任意のプログラム言語により作成することができる。
入力装置110は、OSが提供するグラフィック・ユーザ・インタフェース(GUI)に従い、表示装置112の画面上に表示されたアイコン、タスクバー、ウィンドウ等のグラフィック・オブジェクトを操作するために、また、文字や数字等を入力するために使用される。また、入力装置110は、表示装置112の画面上に表示されたコマンド・ボタンを押下する際にも使用され、このボタン押下により処理を開始させたり、処理を中止させたり、処理を終了させたりすることができる。
表示装置112は、例えば、液晶ディスプレイとすることができ、タッチパネルを搭載したものであってもよい。タッチパネルを搭載した表示装置112である場合、画面にタッチして上記操作や文字等の入力を行うことができるため、上記の入力装置110は不要である。
そのほか、必要に応じて、ネットワークに接続するための通信インタフェースや、DVDドライブ、SDカードスロット等を備えることができる。このシステムは、無線LAN機能やBluetooth(登録商標)機能を実現するために送受信機を備えていてもよい。
図2は、本発明の方法を実施するためのシステムの第1実施形態を示した機能ブロック図である。このシステム100は、上記のようにCPU102、RAM104、HDD108を備え、HDD108には、本発明の方法を実行するためのプログラムを格納し、CPU102がそれをRAM104に読み出し、それを実行することにより、そのシステム100を以下の各機能部として機能させることができる。
したがって、このシステム100は、その機能部として、データ入力部200と、要素検索部202と、関数値計算部204と、予測値計算部206とを含む。また、システム100は、上記のRAM104やHDD108をデータ格納部208として含む。
データ入力部200は、入力装置110により入力されたデータ、もしくはシステム100がネットワークに接続されている場合はネットワークを介して受信したデータ、またはCD−ROM等の記録媒体に格納されたデータを、入力データとして受け付ける。
入力データは、予測したい被説明変数に対する説明変数である。例えば、本発明の方法を、製造業における原材料を溶融、成形等して製品を製造する際に消費される電力を予測するために使用する場合、被説明変数は消費電力であり、説明変数は原材料の物性、体積や質量、温度や圧力等の製造条件である。
製鉄工場を例にとり具体的に説明すると、鉄鉱石、石炭、石灰石等の原材料を受け入れ、その原材料を焼結する等して処理し、高炉で溶かして鉄を抽出し、必要に応じて他の金属や合金を混ぜ合わせ、所定の強度をもつ鋼を製造する。そして、加工しやすいように、一定の形に鋳固められる。
この鋼を製造する際、電気炉等が用いられるが、この電気炉で消費される電力は、含まれている原材料によって変わってくる。このことは、その後の製品を加工する際の圧延においても同様である。
したがって、説明変数は、鋼を製造する工程においては、鉄、炭素、ニッケル、クロム等の種類やその数、その体積や質量、炉内の温度、熱伝導率等とされ、圧延工程では、その種類やその数、その体積や質量、弾性係数、原材料に加える圧力等である。
説明変数のうち、原材料の体積や質量、温度、圧力、弾性係数、熱伝導率等は、精度を高くすればいくらでも正確な値が得られる連続変数である。一方、鉄、炭素、ニッケル、クロム等の種類やその数は、それ以上に分けることができない離散変数である。なお、連続変数は、入力される物性や体積等の連続値の数に応じた次元のベクトルとされる。また、原材料の体積もしくは質量または他の変数とそれらの変数を複数含む数式の計算結果で被説明変数におおよそ比例する値等は、消費電力に対応するスカラーを表すスケール変数とされる。
データ入力部200が入力データとしてこれらの連続変数と離散変数の組み合わせの集合により与えられる説明変数を受け付けると、要素検索部202へその説明変数を渡す。説明変数は、原材料である鉄について、鉄という原材料の種類を表す離散変数をもち、かつその物性(密度、弾性係数、熱伝導率等)、体積、質量、加える圧力や温度等の連続変数をもつため、離散変数と連続変数の組み合わせからなり、それが、炭素、ニッケル、クロム等についても同様の組み合わせをもつことから、それらの組み合わせの集合により与えられるものである。
本発明では、説明変数が連続変数だけでなく、離散変数も含むことから、この離散変数を考慮し、また、被説明変数におおよそ比例するスカラーであり、説明変数の1つとして含まれるスケール変数も考慮して、被説明変数を予測する。
要素検索部202は、入力データに含まれる集合内の各要素につき、学習データの複数の集合内から離散変数が一致する要素を検索する。個々の要素につき、被説明変数の予測を可能にするためである。ここでいう要素は、離散変数と連続変数の組み合わせからなるもので、具体的には、鉄という個々の原材料の物性、体積、質量等のデータである。学習データは、実際に計測等を行い、観測された被説明変数と、その被説明変数を観測するために用いられた説明変数との組を複数含むもので、データ格納部208に格納されている。
データ格納部208は、これらの組をテーブルとして格納することができる。観測された被説明変数は、具体的には、実際に電力計を使用して計測された消費電力である。また、データ格納部208は、後述する関数や推定式等もデータとして格納しており、必要に応じて読み出され、使用される。
学習データは、説明変数とそれに対応する観測された被説明変数との組を複数含み、説明変数が1以上の要素の集合により与えられることから、要素検索部202は、入力データの各要素につき、学習データの複数の集合内から離散変数が一致する要素を検索する。離散変数が鉄という種類を表す値であれば、鉄という種類を表す値を離散変数としてもつ要素を、学習データの複数の集合の中から探し出す。なお、要素は、離散変数と連続変数の組み合わせからなるため、これらの組のデータとして抽出される。
関数値計算部204は、入力データの要素と検索された1以上の要素の各々について、連続変数から得られ被説明変数におおよそ比例するスカラーを表すスケール変数により重み付けされた2つの集合間の類似度を与える関数を適用して各関数値を計算する。そして、関数値計算部204は、計算した各関数値を用い、その和を計算する。関数値計算部204は、この計算を入力データのすべての要素につき行う。
この関数は、スケール変数により重み付けられており、一例では、スケール変数により重み付けられたカーネル関数とされる。入力データの要素と検索された1つの要素との間で1つの関数値が計算されるため、1以上の要素との間では、1以上の関数値が計算される。そして、入力データの各要素につき1以上の関数値の和が計算されるため、入力データの要素の数だけ、その和が求められることになる。
こうして計算された和は、予測値計算部206へ送られる。予測値計算部206は、被説明変数を予測するための推定式にこれらの関数値の和を適用し、各要素につき被説明変数の予測値を計算する。なお、実際に使用することができる関数や推定式の詳細については後述する。
図3に示すフローチャートを参照して、被説明変数の予測処理について説明する。予測したい被説明変数に対する説明変数が入力されたことを受けてこの処理を、ステップ300から開始する。ステップ305では、データ入力部200が入力された説明変数を入力データとして受け付ける。データ入力部200がその入力データを要素検索部202へ渡すと、ステップ310において、要素検索部202が、入力データに含まれる集合内の1つの要素を選択し、ステップ315で、その選択した要素と離散変数が一致する要素を学習データの複数の集合内から検索する。
ステップ320では、入力データに含まれる集合内のすべての要素を選択したかを判定し、まだ選択されていない要素がある場合、ステップ310へ戻り、まだ選択されていない次の要素を選択する。これに対し、すべての要素を選択したと判断した場合、ステップ325へ進み、関数値計算部204が、入力データの要素と検索された1以上の要素の各々について、連続変数から得られ被説明変数におおよそ比例するスカラーを表すスケール変数により重み付けされた2つの集合間の類似度を与える関数を適用して各関数値を計算する。そして、ステップ330で、各関数値の和を計算する。
ステップ335において、入力データのすべての要素につき、関数値の和を計算したかを判断する。まだ計算していない場合、ステップ325へ戻り、次の要素につき、関数値の和を計算する。これに対し、すべて計算した場合は、ステップ340へ進み、予測値計算部206が、被説明変数を予測するための推定式を適用して、各要素につき被説明変数の予測値を計算する。この計算が終了したところで、ステップ345でこの処理を終了する。
このように、離散変数が一致する要素同士についてのみ、被説明変数におおよそ比例するスカラーを表すスケール変数により重み付けされた関数を適用して各関数値を計算し、その和を入力データのすべての要素につき求め、推定式を適用して各要素につき被説明変数の予測値を計算することで、被説明変数が部分的にしか観測されていなくても、説明変数が離散変数を含む場合であっても、学習データにはない要素の組み合わせに対して被説明変数の予測値を求めることができる。
また、個々の要素と被説明変数との厳密な対応がとれていなくても、学習データを用いて個々の要素につき被説明変数の予測値を求めることができる。さらに、被説明変数のオーダーが異なる要素を含む場合であっても、小さな誤差で被説明変数の値を予測することができる。
説明変数から被説明変数を予測するための手法として、回帰手法を用いることができるが、この回帰手法として、広範なノンパラメトリック回帰または条件付き密度推定手法が適用可能である。その一例として、正規過程回帰(Gaussian Process Regression)を用いることができる。正規過程(ガウス過程)は、確率変数の集合であって、どの任意の個数の確率変数をとっても、その結合分布がガウス分布に従うものをいう。この正規過程回帰の回帰式を、上記の推定式として用いることができる。なお、この正規過程回帰を利用した具体的な算出方法については後述する。
その他の例としては、回帰曲線としてRBFカーネルを用いたナダラヤ・ワトソン・カーネル回帰(Nadaraya-Watson Kernel Regression)、関連ベクトル回帰(Relevance Vector Regression)、サポート・ベクトル回帰(Support Vector Regression)、カルバック・ライブラー重要度推定法(Kullback-Leibler Importance Estimation Procedure)、最小二乗条件付き密度推定法(Least-Square Conditional Density Estimation)等が挙げられる。
これらの回帰手法は、カーネル行列およびカーネル・ベクトルの計算を含むもので、その手法については公知であるので、詳細な説明は省略する。これらの手法は、一例であるので、カーネル行列およびカーネル・ベクトルの計算を含むものであれば、その他の回帰手法を用いることも可能である。
正規過程回帰で被説明変数の予測を行う際、上記の関数としてカーネル関数が用いられる。カーネル関数は、ハイパー・パラメータと呼ばれるパラメータを含むが、事前に学習データを用いてこのパラメータを最適化する必要がある。このため、システム100は、図4に示すように、上記のデータ入力部200、要素検索部202、関数値計算部204、予測値計算部206、データ格納部208のほか、このハイパー・パラメータを最適化するための機能部をさらに備えることができる。
すなわち、システム100は、その機能部として、ハイパー・パラメータを最適化するパラメータ最適化部210と、その最適化されたハイパー・パラメータをカーネル関数に適用してカーネル行列を導出するカーネル行列導出部212と、その導出されたカーネル行列を用いて上記の推定式に設定するためのパラメータを計算するパラメータ計算部214とを備えることができる。
これらのパラメータ最適化部210、カーネル行列計算部212、パラメータ計算部214が行う処理を含む被説明変数の予測処理について、図5に示すフローチャートを参照して、以下に説明する。図5では、これらが行う処理が終了した後、図3に示した処理と同様の予測処理を実行している。しかしながら、入力データの受け付けた後、パラメータ最適化部210等が行う処理を実行し、その後、要素を検索する以降の処理を実行することも可能である。以下の処理では、周辺尤度最大化法を用いて最適化する場合について説明する。
ここで、周辺尤度は、回帰式と学習データの分布の尤もらしさを与える量で、周辺尤度最大化法は、この周辺尤度を最大化するハイパー・パラメータを求めることにより、そのパラメータの最尤推定値を算出する方法である。したがって、この算出された最尤推定値が最適化されたハイパー・パラメータである。
図5に示す処理は、ステップ500から開始し、ステップ505で、パラメータ最適化部210が、周辺尤度の初期値を設定し、ステップ510で、ハイパー・パラメータを選択する。初期値は、予め設定された値とされ、ハイパー・パラメータは、予め複数の値が設定される。このため、ハイパー・パラメータは、複数の値の中から1つが選択される。ハイパー・パラメータの選択は、設定された値が配列する順に1つずつ選択することにより行うことができる。
ステップ515で、パラメータ最適化部210は、カーネル行列導出部212に指示し、カーネル行列導出部212が、上記と同様のスケール変数で重み付けされたカーネル関数を用い、離散変数が一致する要素同士について得られた各関数値の和を、すべての要素につき計算することによりカーネル行列を導出する。上記では、入力データと学習データの離散変数が一致する要素同士について関数値を計算しているが、ここでは、学習データ内の離散変数が一致する要素同士について関数値を計算し、その同じ離散変数をもつ要素につき関数値の和を計算して、カーネル行列を求める。このとき、カーネル行列導出部212は、学習データに含まれる各集合につき、各集合に含まれる複数のスケール変数を用いて対角要素を計算して対角行列も導出する。
ステップ520では、カーネル行列導出部212が、続いて、計算されたカーネル行列と対角行列とを用い、周辺尤度を計算する。周辺尤度を計算するための周辺尤度関数が、ハイパー・パラメータとカーネル行列と対角行列とを含む関数で与えられ、周辺尤度は、この関数に上記で選択したハイパー・パラメータの値、導出したカーネル行列および対角行列を与えることにより計算される。
パラメータ最適化部210は、ステップ525で、選択すべきハイパー・パラメータがまだあるかどうかを判定する。まだある場合、ステップ510へ戻り、次のハイパー・パラメータを選択する。これに対し、すべてのハイパー・パラメータを選択したと判定した場合、ステップ530へ進み、パラメータ最適化部210は、計算された周辺尤度が最大になるときのハイパー・パラメータを最適化されたハイパー・パラメータとして決定する。
パラメータ最適化部210は、最適化されたハイパー・パラメータをカーネル行列導出部212へ渡し、ステップ535で、カーネル行列導出部212は、最適化されたカーネル行列を導出する。このとき、カーネル行列導出部212は、最適化された対角行列も導出する。ステップ540で、パラメータ計算部214が、導出されたその最適化されたカーネル行列と対角行列とを用い、上記の推定式に設定するためのパラメータを計算する。このパラメータは、その推定式に設定され、被説明変数の予測値の計算に使用される。
ステップ545〜ステップ580は、図3に示すステップ305〜ステップ340と同様である。ステップ580の予測値を計算したところで、ステップ585へ進み、この処理を終了する。
これまで、本発明の方法およびその方法を実施するためのシステムについて説明してきたが、実際にどのような関数や推定式を用い、各値を計算するかについて以下詳細に説明する。その際、複数の原材料を溶融、成形等して製品を製造するときに消費する電力を予測するものとして説明するが、本発明は、これに限られるものではなく、例えば、説明変数を家族の人数、年齢や年収等とし、被説明変数を数値で表される住宅の購買力等とし、この購買力等を予測すること等にも適用することができるものである。
実際の消費電力の計測は、例えば30分毎といったユニット毎に行われる。ここでは30分毎としているが、1時間毎や2時間毎等であってもよいし、圧延工程等の工程毎であってもよい。各ユニットでは、処理される原材料の種類が異なり、原材料の数も異なる。また、同じ原材料が複数使用される場合もあり、その体積も異なる。これらの種類や数等のすべての組み合わせにつき、いくつかの体積が異なるものの観測された消費電力をその組み合わせとともに学習データとしてもっていれば、多少の大きさの相違は、その学習データから予測することができる。しかしながら、現実にはすべての組み合わせにつき学習データをもつことは難しいし、メモリの記憶容量を考慮すると妥当ではない。そこで、以下のようにして、各ユニットにおける消費電力の予測を行う。
まず、定義として、ユニットがn個あり、消費電力の合計値が観測されるユニットをiとすると、式1のように表すことができる。ユニットiでは、1以上の原材料が処理されるので、各原材料につき消費される電力の合計値のみが観測されることになる。なお、式1は、ユニットiがユニット1からユニットnの中のいずれかであることを表す。
ユニットiに含まれる原材料の数をm[i]とすると、ユニットiに含まれるj番目の原材料に関する説明変数のうち連続変数の連続量をまとめたベクトルxijは、式2のように表すことができる。式2中、dは連続値入力の次元を表し、Rは、消費電力の合計が観測されるすべてのユニットのすべての原材料に関する説明変数のうち連続変数の連続量をまとめたd次元ベクトルを表す。
原材料は、例えば、鉄、炭素、ニッケル、クロム等であり、この原材料に関する説明変数は、被説明変数である消費電力を説明する変数であって、具体的には、弾性係数等の物性、体積、質量、材料に加える圧力等である。説明変数には、原材料の種類や数も含まれるが、これらは、これ以上の単位に分離することができない離散変数である。ユニットiに含まれる原材料の種類の数をMとすると、ユニットiに含まれるj番目の原材料に関する離散変数zijは、式3のように表すことができる。式3は、離散変数zijが、1からMの中のいずれかの値をとることを表している。
また、説明変数には、体積や質量等が含まれるが、これらを、またはこれらの変数をパラメータに含む計算式の値等を、消費電力に対応するスカラー、より具体的には消費電力におおよそ比例するスカラーを表すスケール変数として用いる。ユニットiに含まれるj番目の原材料に関するスケール変数sijは、式4のように表すことができる。式4中、Rは、消費電力の合計が観測されるすべてのユニットのすべての原材料に関するスケール変数を表す。
ユニットiに含まれるj番目の原材料の加工等に要する消費電力yijは観測されないが、ユニットiが要した合計消費電力yは観測することができ、yからyを成分に含むn次元ベクトルyは、式5のように表すことができる。式5中、Rは、n次元ベクトルの集合を表し、記号Tは、行列またはベクトルの転置を表す。すなわち、yは、n次元の列ベクトルである。なお、転置行列とは、行列の要素(a,b)と要素(b,a)を入れ替えた、対角線で成分を折り返した行列である。
学習データは、式6に示すように、観測された合計消費電力ベクトルyと、すべての連続説明変数xij、離散変数zij、スケール変数sijの集合のみとされる。これらを基に、式7に示す回帰式における関数fを推定するか、式8に示す条件付き密度関数gの推定を行う。式7中、εは平均0のノイズである。式8は、パラメータΘが与えられたとき、説明変数Xに対する被説明変数Yの確率分布に対応する確率密度関数を求める式である。推定された関数fまたはgを用いることで、ユニットiに含まれるj番目の原材料に関する消費電力yijの値を推定することができる。
以降、本発明で用いられる提案カーネル関数の数学的導出について補足する。ここでは、本手法を回帰分析に適用する場合、すなわち式7を前提とした場合の計算方法についてのみ説明し、式8を用いる条件付き密度推定法については説明を省略する。上記式7の推定は、連続説明変数xおよび離散説明変数zを非線形変換した高次元特徴ベクトルψ(x,z)を定義すると、ψ(x,z)を基底とした式9に示すような式のパラメータを最適化する線形回帰問題に帰着される。この式9中、εは平均0のノイズで、wφは、上述したパラメータの一例である回帰係数を並べた高次元ベクトルである。本発明では、式9に示すように、写像関数の項にも、ノイズの項にも、スケール変数sを乗算し、重み付けする。
特定のユニットiについて式9を適用し、かつユニット内のm[i]個の材料について式9の和をとると、下記式10が成立する。
上記式10を前提とすれば、少なくとも漸近的には真の回帰係数に収束する回帰係数計算方法が考案可能である。その方法においては、ユニット内の合計消費電力ベクトルyの和と、特徴ベクトルψ(x,z)の和との関係を、nユニット分のデータと最小二乗法を用いて回帰する方法で、サンプル数nが十分に大きいときに計算された回帰係数は、真の回帰係数に収束する。
一般的な非線形回帰分析では、まず、高次元特徴ベクトルψ(x,z)を自分で設計し、その後、回帰係数ベクトルwφをデータから推定する。しかしながら、本発明で使用されるカーネル法による回帰分析では、高次元特徴ベクトルψ(x,z)を与える代わりに、特徴ベクトル同士の内積であるカーネル関数を設計する。そして、回帰係数ベクトルwφを推定する代わりに、回帰係数ベクトルwφと特徴ベクトルψ(x,z)の内積であるスカラーを、カーネル関数の値だけを用いて計算する。下記式11の左辺は、ユニットiとユニットjに関してスケール補正を行った特徴ベクトル同士の内積を表す。下記式11の右辺は、その内積の値を直接カーネル関数として定義することを意味する。
本発明で用いられる独自カーネル関数の導出について説明する。M種類の原材料に対応し、M種類の高次元特徴ベクトルψ(x)、…、ψ(x)を考える。これらの高次元特徴ベクトルにスケール変数sを乗算した上で横に並べると、さらなる高次元特徴ベクトルを計算する写像関数ψを、下記式12のように定義できる。I(z=k)はz=kのとき1をとり、それ以外は0の値をとる関数であり、kは1からMまでの整数である。
一般に、連続説明変数xの値がxであるときの材料kに関連する高次元ベクトルψ(x)と、連続説明変数xの値がxであるときの材料kに関連する高次元ベクトルψ(x)との内積をカーネル関数κ(x,x)とする。高次元ベクトルψ(x)を設計するのは簡単ではないが、カーネル関数κ(x,x)には既存技術である線形カーネル、多項式カーネル、RBFカーネルなどを用いることができるため、技術者がカーネル関数κ(x,x)を指定することは比較的容易である。なお、原材料の種類、その物性、体積等と合計消費電力との関係は、線形モデルとして定義することができないことから、非線形モデルで定義される。このため、カーネル関数としてはRBFカーネル等の非線形のカーネル関数の使用が適切である。RBFカーネルは非線形カーネル関数の一つであり、その計算式は、例えば式13のように与えられる。α、γはそれぞれハイパー・パラメータであり周辺尤度最大化法などを用いて別途最適化する必要がある。
カーネル関数κ(x,x)を用いると、式12による超高次元ベクトルをユニットiとユニットjについて計算したときの両者の内積が下記式14のように計算できる。この式14は、消費電力が観測されているユニットiとユニットjとの間の類似度を与えるカーネル関数の定義である。
ここで、m[i]およびm[j]は、消費電力が観測されるユニットiおよびユニットjに含まれる原材料の数、Mは、原材料の種類の数、sは、原材料の体積もしくは質量またはその他の変数とそれらの変数を複数含む数式の計算結果で被説明変数におおよそ比例する値、zは、原材料の種類を表す値、xは、原材料に関する連続量をまとめたベクトル、Iは、ユニットiとユニットjとの間で原材料が同じものについてのみ1を与え、異なるものについては0を与える関数である。
以上のことから、式14で表されるカーネル関数と、実際のユニットが要した合計電力消費ベクトルyがあれば、上記の正規過程回帰やNadaraya-Watson Kernel Regression等のような様々なカーネル回帰手法を用いて消費電力の予測が可能となる。
具体的な実装の一例として、正規過程回帰を用いた場合の計算手法について詳細に説明する。なお、この手法は一例であるので、これ以外の上述した各手法を用いて計算することは当然にして可能であり、その他の手法も、本発明の作用・効果を奏する限り採用することができるものである。
正規過程回帰を用いる場合、最初に、カーネルのハイパー・パラメータを、周辺尤度最大化法を用いて最適化する。ハイパー・パラメータは、学習データの内容やその信頼度を表すパラメータで、カーネル関数の広がりの大きさを表すバンド幅γと、ノイズσとを含む。
最適化するにあたって、Lmaxに初期値として−∞を代入し、ハイパー・パラメータγ、σを予め設定された値の中から選択する。選択したハイパー・パラメータγ、σと、学習データに含まれる複数の説明変数および当該複数の説明変数から実際に観測された複数の被説明変数とを用い、下記式15〜17によりL(σ,γ)を計算する。すなわち、学習データに含まれる原材料の種類を表す値、原材料の数、連続量をまとめたベクトル、体積もしくは質量またはその他の変数とそれらの変数を複数含む数式の計算結果で被説明変数におおよそ比例する値、観測された合計消費電力ベクトルを用いて計算を行う。
なお、式15は、式13と式14を用いたカーネル関数を変形することにより得られる式で、スケール変数により重み付けしたものであり、離散変数が一致する要素同士、すなわち原材料が同じもの同士についてのみ計算を行うように構成されたものである。この式15により得られる値κγ,ijは、n×n行列Kγ内の行列要素となる。なお、n×n行列は、n行n列の行列を表す。
式16は、正規過程回帰を用いる場合に使用されるn×n対角行列R=diag(r,…,r)の各成分である対角要素を求める式である。このようにして得られたn×n行列Kγおよびn×n対角行列Rは、選択されたσおよび行列により与えた被説明変数である合計消費電力ベクトルy、合計消費電力ベクトルyの転置ベクトルyとともに式17に代入され、L(σ,γ)が算出される。計算されたL(σ,γ)は、初期値として代入されたLmaxと比較され、Lmaxより大きい場合、その計算されたLをLmaxとする。これを繰り返し、最も大きいLmaxを求め、そのLmaxを計算する際に選択されたγ、σを、最適化されたハイパー・パラメータγ、σ2*とする。
なお、同一のγの値に対しては、上記式17中の行列Kγや逆行列(Kγ+σ−1を何度も繰り返し計算する必要はない。それは、σの値の最適化を行うにあたって、固有値分解を利用して評価することができるからである。固有値分解により新たに計算された行列を式18のように記述する。
式18中、Uγは、ユニタリ行列である。このUγは、その転置行列Uγ との内積が単位行列Iになるものである。また、λγは、固有値である。例えば、ベクトルtを式19に示すような対角行列Rおよび合計消費電力ベクトルyの関数とし、ベクトルvγを式20に示すようなユニタリ行列およびベクトルtの関数とし、対角行列Mr,σ2を式21に示すような固有値およびσの関数として設定する。すると、式18は、式22のように置き換えることができる。
式22では、式16から得られるr、式19から得られるtおよびtの転置行列t、式20から得られるベクトルvγおよびベクトルvγの転置ベクトルvγ 、式21から得られる対角行列Mr,σ2を用いるのみで、簡単にL(σ,γ)の値を求めることができる。
次に、最適化されたハイパー・パラメータγおよびσ2*を用いて、次の式23により逆行列Jを計算し、この逆行列Jと合計消費電力ベクトルyとを用いて式24により、上記でいうパラメータであるベクトルwを計算する。式23中、n×n行列Kγ*は、最適化されたハイパー・パラメータγを用いて式15により得られたκγ*,ijを要素とするn×n行列である。この式23は、ユニタリ行列Uγ*および対角行列Mγ*,σ2*を用いて、式23中の右式のように置き換えることができる。
ベクトルwを求めた後、実際に予測したいユニットの消費電力を求める。このユニットの特性が、インデックス#を用いて(x♯1,z#1,s#1),…,(x#m#,z#m#,s#m#)のように与えられる場合、次の式25および式26を用いて、ベクトルkおよびスケールrを計算する。式25中、m#は、予測したいユニットの原材料の数であり、x#tは、そのユニットに含まれるt番目の原材料に関する説明変数のうち連続変数の連続値をまとめたベクトルである。z#tは、そのユニットに含まれるt番目の原材料に関する離散変数(原材料の種類)で、s#tは、そのユニットに含まれるt番目の原材料に関するスケール変数(体積もしくは質量またはその他の変数とそれらの変数を複数含む数式の計算結果で被説明変数におおよそ比例する値)である。
式25により計算されたκ#jは、n×1のベクトルkのj番目のベクトル要素である。このようにして計算されたベクトルkおよび対角要素rを用い、次の式27および式28により、予測したいユニットの合計消費電力の平均μと、その分散vを計算する。
図6を参照して、上記のことをわかりやすく説明すると、学習データは、複数のユニットに含まれる原材料の種類、物性、圧力、合計消費電力等のデータを含む。複数のユニットのうちの1つのユニットであるユニットiは、図6(a)に示すように、丸、三角形、四角形で表される複数の種類の原材料を含む。また、このユニットiには、同じ形の丸で表される同じ原材料も含まれる。また、図6(a)には、合計消費電力にオーダーとしておおよそ比例するスカラーを表す原材料の体積が、面積で表現されている。
図6(a)には、ユニットjも示されており、ユニットjも、丸、三角形、四角形で表される複数の種類の原材料が含まれている。そして、ユニットjも、同じ形で面積が異なるものが含まれている。これらのユニットiとユニットjとの間のカーネル行列Kγ,ijを計算するには、上記の式15を用いる。このとき、矢線に示すように形が同じ丸同士、同じ三角形同士、同じ四角形同士についてだけ、個々の図形同士の内積を計算し、それらをすべて足し合わせたものをユニットiとユニットjとの間の内積とする。この内積は、図6(b)に示すn×nカーネル行列のi行j列の行列要素となる。この図6(b)は、わかりやすくするために、縦が行を示し、横が列を示すテーブルとしてカーネル行列を表現したものである。
このようにして各行列要素につき内積が計算されると、n×nカーネル行列が求められる。このカーネル行列を用い、上記式17〜式22を適用して最適化されたハイパー・パラメータを計算し、その最適化されたハイパー・パラメータを用い、上記式23および式24を適用して推定式に設定するためのパラメータとしてベクトルwを計算する。
その後、合計消費電力を予測したいユニット(テスト・ユニット)の特性(テスト・データ)が、図6(a)のユニットiに示すようなものとして与えられた場合、上記と同様にして、テスト・ユニットと、学習データ内の例えばユニットjとの間の内積を計算する。この場合、テスト・ユニットと、学習データ内の各ユニットとの間の内積のみとなるため、上記のようなn×nカーネル行列ではなく、1×nのベクトルkとして得られる。
得られたベクトルkは、上記式27および式28に適用され、テスト・ユニットの各原材料についての消費電力が、平均μおよび分散vとして計算される。
ここで、電力消費の物理シミュレータを用い、ユニット数が300または1000のユニットに対し、90種類の原材料から、各ユニットに10個の原材料を配置し、その合計の消費電力のみを学習データとして用い、個々の消費電力の予測を行った結果を示す。
240または800のユニットを学習データとし、残りの60または200のユニットをテスト・データとしたものを5種類作成し、実際に計測した消費電力と、本発明の方法の一例として、正規過程回帰を利用した方法(以下、本方法という。)により予測した消費電力との誤差を評価した。
周辺尤度最大化法を用い、学習データのみでハイパー・パラメータγ、σを最適化した。その際、γは{10−10,10−9.5,10−9,…,10−0.5,1}の中から選択し、σは{10−2,10−1.99,10−1.98,…,10−0.01,1}の中から選択した。ただし、この選択は、入力と出力の絶対スケールを正規化した後に行った。
本方法との比較のために従来法として、原材料の種類別の特徴量を並べたベクトルに対する単一のRBFカーネルによる正規過程回帰を使用した。ただし、この単一のRBFカーネルによる正規過程回帰は、ユニット内に同一種類の原材料が複数存在する場合、使用することができない。しかしながら、90種類という材料から選択する場合、同一種類の材料が現れることは稀であることから、同一種類のものが存在しないものと仮定して、このRBFカーネルによる正規過程回帰を使用し、予測を行った。
計算された予測の分散vはデータ毎に違うことから、誤差評価の結果が評価法により異なった結果が得られた。図7には、3種類の評価法で行った結果を示す。3つの評価法は、平均対数尤度(Avg. Log Likelihood)、平均二乗誤差(Mean Square Error)、平均絶対偏差(Median Absolute Deviation)である。図7(a)は、ユニット数300の場合、図7(b)は、ユニット数1000の場合を示す。この中で、平均対数尤度が、最も重要な指標である。性能は、平均対数尤度が高いほど良く、平均二乗誤差および平均絶対偏差が低いほど良いものである。
図7(a)および(b)を参照すると、平均対数尤度が高いのは本方法であり、また、平均二乗誤差および平均絶対偏差が低いのも本方法である。したがって、いずれの場合も本方法は、従来法より高性能であることが見出された。このシミュレーションでは、同じ種類の原材料がユニット内に含まれていないにも関わらず、従来法より高性能であることを示すことができた。本方法は、同じ種類の原材料を含む場合にも適用可能であることから、従来法より有用であることがわかる。
図8および図9は、ユニット内の原材料1つ1つに対する消費電力の予測結果を示す。図8は、実軸で表した場合の、予測電力と、実際に計測した電力との関係を示したグラフである。図8(a)が従来法の結果を示し、図8(b)が本方法の結果を示す。従来法の結果は、傾きが45°の直線上にデータが集まっておらず、電力が大きくになるにつれてデータがその直線から分散している。これに対し、本方法の結果は、その直線上にほぼ集まっており、予測電力が実際に計測した電力とほぼ同じであり、予測結果が良く一致していることが示された。
平均対数尤度が重要な指標であることについてはすでに説明したが、図9は、対数軸で表した場合の、予測電力と、実際に計測した電力との関係を示したグラフである。図9(a)が従来法の結果を示し、図9(b)が本方法の結果を示す。従来法の結果は、傾きが45°の直線上に高い電力のみが一致しているのみで、低い電力についてはほとんど予測電力が実際に計測した電力を表していないことがわかる。これは、ユニット内の材料ごとの消費電力スケールの違いに対応できておらず、大きな消費電力のものに引っ張られていると考えられるからである。
これに対し、本方法は、低い電力についても多少分散しているが、ほぼ精度良く予測電力が実際に計測した電力を表していることがわかる。したがって、本方法は、多くの場合において、正しいスケールで消費電力を予測することができていることがわかる。
実際に重要であるのは、テスト・データ内の各ユニットの合計消費電力量であるが、このようにユニット内の個々の原材料につき正確な消費電力量を予測することができることから、その合計消費電力量についても正確に予測することが可能である。
図10および図11は、ユニット内のすべての原材料に対する合計消費電力量の予測結果を示す。図10は、実軸で表した場合の、予測電力と、実際に計測した電力との関係を示したグラフである。図10(a)が従来法の結果を示し、図10(b)が本方法の結果を示す。従来法の結果は、傾きが45°の直線から大きく外れており、予測電力が実際に計測した電力より大きい値となっている。これに対し、本方法の結果は、その直線上にほぼ集まっており、予測電力が実際に計測した電力とほぼ同じであり、予測結果が良く一致していることを示した。
図11は、対数軸で表した場合の、予測電力と、実際に計測した電力との関係を示したグラフである。図11(a)が従来法の結果を示し、図11(b)が本方法の結果を示す。従来法の結果は、傾きが45°の直線上に高い電力のみが一致しているのみで、低い電力についてはほとんど予測電力が実際に計測した電力を表していないことがわかる。これは、ユニット内の材料ごとの消費電力スケールの違いに対応できておらず、大きな消費電力のものに引っ張られていると考えられるからである。
これに対し、本方法は、全体的にほぼ精度良く予測電力が実際に計測した電力を表していることがわかる。ユニット内の消費電力が小さい原材料に対して、その消費電力の過小評価が起こったとしても、合計予測電力量には大きな誤差を与えない。このため、本方法は、極めて正確に消費電力を予測することができることがわかる。
以上のことから、本発明の方法を採用することで、被説明変数が部分的にしか観測されない場合においても、予測したい被説明変数を正確に予測することが可能となる。また、説明変数の一部が離散変数であっても、既存の回帰手法を利用して効率的に予測を行うことができる。さらに、集合内の個々の要素について被説明変数を正確に予測することができるため、誤差分布のスケール設定を行うことが可能である。
これまで、本発明のデータの予測方法、その方法を実行するためのシステムについて、図面を参照して詳細に説明してきたが、他の実施形態や、追加、変更、削除など、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。
したがって、本発明の予測方法を実行するためのコンピュータ可読なプログラムとして提供することもでき、このプログラムは、フレキシブル・ディスク、CD-ROM、DVD-ROM、SDカード、HDD等の記録媒体に格納して提供することができる。また、このプログラムは、インターネット等のネットワークに接続されたサーバ等に格納し、ダウンロード要求に応じて、ネットワークを介して提供することも可能である。
100…システム、102…CPU、104…RAM、106…ROM、108…HDD、110…入力装置、112…表示装置、114…システム・バス、200…データ入力部、202…要素検索部、204…関数値計算部、206…予測値計算部、208…データ格納部、210…パラメータ最適化部、212…カーネル行列導出部、214…パラメータ計算部

Claims (21)

  1. 離散変数と連続変数の組み合わせの集合により与えられる説明変数から被説明変数を予測するためのコンピュータにより実行される方法であって、
    予測したい前記被説明変数に対する前記説明変数を入力データとして受け付けるステップと、
    前記入力データに含まれる前記集合内の前記離散変数と前記連続変数の組み合わせから
    なる各要素につき、被説明変数が観測された複数の集合に関する学習データを用い、前記離散変数が一致する当該複数の集合内の要素を検索するステップと、
    前記入力データの前記要素と当該入力データの要素につき検索された1以上の前記要素の各々について、連続変数から得られ被説明変数に対応するスカラーを表すスケール変数により重み付けされた2つの集合間の類似度を与える関数を適用して各関数値を計算し、前記被説明変数が観測された集合毎の各関数値の和を、前記入力データのすべての前記要素につき計算するステップと、
    各前記要素につき計算された前記和を、前記被説明変数を予測するための推定式に適用して、前記各要素につき前記被説明変数の予測値を計算するステップとを含む、予測方法。
  2. 前記離散変数は、前記被説明変数が観測されるユニットに含まれる原材料の種類を表す値であり、前記連続変数は、前記ユニットに含まれる前記原材料に関する連続量をまとめたベクトルであり、前記スケール変数は、前記ユニットに含まれる前記原材料の体積もしくは質量または他の変数とそれらの変数を複数含む数式の計算結果で前記被説明変数に対応する値であり、前記被説明変数は、前記ユニットで消費される消費電力量である、請求項1に記載の予測方法。
  3. 前記関数は、
    (m[i]およびm[j]は、前記被説明変数が観測されるユニットiおよびユニットjに含まれる前記要素の数、Mは、前記要素の種類の数、sは、前記スケール変数、zは、前記離散変数、xは、前記連続変数、Iは、前記ユニットiと前記ユニットjとの間で前記離散変数が一致する要素同士についてのみ1を与え、それ以外は0を与える関数である。)で表されるカーネル関数であることを特徴とする、請求項1に記載の予測方法。
  4. 前記推定式は、回帰式または条件付き密度関数である、請求項1に記載の予測方法。
  5. 前記予測方法は、正規過程回帰、Nadaraya-Watsonカーネル回帰、関連ベクトル回帰、サポート・ベクトル回帰、Kullback-Leibler重要度推定法、最小二乗条件付き密度推定のいずれか1つのノンパラメトリック回帰または条件付き密度推定法が適用可能である、請求項1に記載の予測方法。
  6. 前記関数が、カーネル関数とされ、前記予測方法が、正規過程回帰を用いるものであって、前記カーネル関数に設定されるハイパー・パラメータを、前記学習データを用いて最適化するステップと、前記学習データを用い、最適化された前記ハイパー・パラメータを前記カーネル関数に設定してカーネル行列を導出するステップと、導出された前記カーネル行列を用いて前記推定式に設定するためのパラメータを計算するステップとをさらに含む、請求項1に記載の予測方法。
  7. 前記関数が、カーネル関数とされ、前記予測方法が、正規過程回帰を用いるものであって、前記カーネル関数に設定されるハイパー・パラメータを、前記学習データを用いて最適化するステップと、前記学習データを用い、最適化された前記ハイパー・パラメータを前記カーネル関数に設定してカーネル行列を導出するステップと、導出された前記カーネル行列を用いて前記推定式に設定するためのパラメータを計算するステップとをさらに含み、
    前記最適化するステップが、前記ハイパー・パラメータを、周辺尤度最大化法を用いて最適化し、前記カーネル行列を導出するステップが、前記学習データに含まれる各前記集合につき、前記各集合に含まれる複数の前記スケール変数を用いて対角要素を計算して対角行列を導出し、前記パラメータを計算するステップが、導出された前記カーネル行列と前記対角行列とを用いて前記推定式に設定するための前記パラメータを計算することを特徴とする、請求項1に記載の予測方法。
  8. 離散変数と連続変数の組み合わせの集合により与えられる説明変数から被説明変数を予測するシステムであって、
    予測したい前記被説明変数に対する前記説明変数を入力データとして受け付けるデータ入力部と、
    前記入力データに含まれる前記集合内の前記離散変数と前記連続変数の組み合わせからなる各要素につき、被説明変数が観測された複数の集合に関する学習データを用い、前記離散変数が一致する当該複数の集合内の要素を検索する要素検索部と、
    前記入力データの前記要素と当該入力データの要素につき検索された1以上の前記要素の各々について、連続変数から得られ被説明変数に対応するスカラーを表すスケール変数により重み付けされた2つの集合間の類似度を与える関数を適用して各関数値を計算し、前記被説明変数が観測された集合毎の各関数値の和を、前記入力データのすべての前記要素につき計算する関数値計算部と、
    各前記要素につき計算された前記和を、前記被説明変数を予測するための推定式に適用して、前記各要素につき前記被説明変数の予測値を計算する予測値計算部とを含む、予測システム。
  9. 前記離散変数は、前記被説明変数が観測されるユニットに含まれる原材料の種類を表す値であり、前記連続変数は、前記ユニットに含まれる前記原材料に関する連続量をまとめたベクトルであり、前記スケール変数は、前記ユニットに含まれる前記原材料の体積もしくは質量または他の変数とそれらの変数を複数含む数式の計算結果で前記被説明変数に対応する値であり、前記被説明変数は、前記ユニットで消費される消費電力量である、請求項8に記載の予測システム。
  10. 前記関数は、
    (m[i]およびm[j]は、前記被説明変数が観測されるユニットiおよびユニットjに含まれる前記要素の数、Mは、前記要素の種類の数、sは、前記スケール変数、zは、前記離散変数、xは、前記連続変数、Iは、前記ユニットiと前記ユニットjとの間で前記離散変数が一致する要素同士についてのみ1を与え、それ以外は0を与える関数である。)で表されるカーネル関数であることを特徴とする、請求項8に記載の予測システム。
  11. 前記推定式は、回帰式または条件付き密度関数である、請求項8に記載の予測システム。
  12. 前記予測システムは、正規過程回帰、Nadaraya-Watsonカーネル回帰、関連ベクトル回帰、サポート・ベクトル回帰、Kullback-Leibler重要度推定法、最小二乗条件付き密度推定のいずれか1つのノンパラメトリック回帰または条件付き密度推定法が適用可能である、請求項8に記載の予測システム。
  13. 前記関数が、カーネル関数とされ、前記予測システムが、正規過程回帰を用いるものであり、前記カーネル関数に設定されるハイパー・パラメータを、前記学習データを用いて最適化するパラメータ最適化部と、前記学習データを用い、最適化された前記ハイパー・パラメータを前記カーネル関数に設定してカーネル行列を導出するカーネル行列導出部と、導出された前記カーネル行列を用いて前記推定式に設定するためのパラメータを計算するパラメータ計算部とをさらに含む、請求項8に記載の予測システム。
  14. 前記関数が、カーネル関数とされ、前記予測システムが、正規過程回帰を用いるものであり、前記カーネル関数に設定されるハイパー・パラメータを、前記学習データを用いて最適化するパラメータ最適化部と、前記学習データを用い、最適化された前記ハイパー・パラメータを前記カーネル関数に設定してカーネル行列を導出するカーネル行列導出部と、導出された前記カーネル行列を用いて前記推定式に設定するためのパラメータを計算するパラメータ計算部とをさらに含み、
    前記パラメータ最適化部が、前記ハイパー・パラメータを、周辺尤度最大化法を用いて最適化し、前記カーネル行列導出部が、前記学習データに含まれる各前記集合につき、前記各集合に含まれる複数の前記スケール変数を用いて対角要素を計算して対角行列を導出し、前記パラメータ計算部が、導出された前記カーネル行列と前記対角行列とを用いて前記推定式に設定するための前記パラメータを計算することを特徴とする、請求項8に記載の予測システム。
  15. 離散変数と連続変数の組み合わせの集合により与えられる説明変数から被説明変数を予測するための予測方法を実行するためのコンピュータ可読なプログラムであって、前記プログラムが、
    予測したい前記被説明変数に対する前記説明変数を入力データとして受け付けるステップと、
    前記入力データに含まれる前記集合内の前記離散変数と前記連続変数の組み合わせからなる各要素につき、被説明変数が観測された複数の集合に関する学習データを用い、前記離散変数が一致する当該複数の集合内の要素を検索するステップと、
    前記入力データの前記要素と当該入力データの要素につき検索された1以上の前記要素の各々について、連続変数から得られ被説明変数に対応するスカラーを表すスケール変数により重み付けされた2つの集合間の類似度を与える関数を適用して各関数値を計算し、前記被説明変数が観測された集合毎の各関数値の和を、前記入力データのすべての前記要素につき計算するステップと、
    各前記要素につき計算された前記和を、前記被説明変数を予測するための推定式に適用して、前記各要素につき前記被説明変数の予測値を計算するステップとをコンピュータに実行させる、プログラム。
  16. 前記離散変数は、前記被説明変数が観測されるユニットに含まれる原材料の種類を表す値であり、前記連続変数は、前記ユニットに含まれる前記原材料に関する連続量をまとめたベクトルであり、前記スケール変数は、前記ユニットに含まれる前記原材料の体積もしくは質量または他の変数とそれらの変数を複数含む数式の計算結果で前記被説明変数に対応する値であり、前記被説明変数は、前記ユニットで消費される消費電力量である、請求項15に記載のプログラム。
  17. 前記関数は、
    (m[i]およびm[j]は、前記被説明変数が観測されるユニットiおよびユニットjに含まれる前記要素の数、Mは、前記要素の種類の数、sは、前記スケール変数、zは、前記離散変数、xは、前記連続変数、Iは、前記ユニットiと前記ユニットjとの間で前記離散変数が一致する要素同士についてのみ1を与え、それ以外は0を与える関数である。)で表されるカーネル関数であることを特徴とする、請求項15に記載のプログラム。
  18. 前記推定式は、回帰式または条件付き密度関数である、請求項15に記載のプログラム。
  19. 前記予測方法は、正規過程回帰、Nadaraya-Watsonカーネル回帰、関連ベクトル回帰、サポート・ベクトル回帰、Kullback-Leibler重要度推定法、最小二乗条件付き密度推定のいずれか1つのノンパラメトリック回帰または条件付き密度推定法が適用可能である、請求項15に記載のプログラム。
  20. 前記関数が、カーネル関数とされ、前記予測方法が、正規過程回帰を用いるものであって、前記プログラムは、前記カーネル関数に設定されるハイパー・パラメータを、前記学習データを用いて最適化するステップと、前記学習データを用い、最適化された前記ハイパー・パラメータを前記カーネル関数に設定してカーネル行列を導出するステップと、導出された前記カーネル行列を用いて前記推定式に設定するためのパラメータを計算するステップとをさらに前記コンピュータに実行させる、請求項15に記載のプログラム。
  21. 前記関数が、カーネル関数とされ、前記予測方法が、正規過程回帰を用いるものであって、前記プログラムは、前記カーネル関数に設定されるハイパー・パラメータを、前記学習データを用いて最適化するステップと、前記学習データを用い、最適化された前記ハイパー・パラメータを前記カーネル関数に設定してカーネル行列を導出するステップと、導出された前記カーネル行列を用いて前記推定式に設定するためのパラメータを計算するステップとをさらに前記コンピュータに実行させ、
    前記最適化するステップにおいて、前記ハイパー・パラメータを、周辺尤度最大化法を用いて最適化し、前記カーネル行列を導出するステップにおいて、前記学習データに含まれる各前記集合につき、前記各集合に含まれる複数の前記スケール変数を用いて対角要素を計算して対角行列を導出し、前記パラメータを計算するステップにおいて、導出された前記カーネル行列と前記対角行列とを用いて前記推定式に設定するための前記パラメータを計算する、請求項15に記載のプログラム。
JP2012003233A 2012-01-11 2012-01-11 予測方法、予測システムおよびプログラム Expired - Fee Related JP5988419B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012003233A JP5988419B2 (ja) 2012-01-11 2012-01-11 予測方法、予測システムおよびプログラム
US13/732,693 US9087294B2 (en) 2012-01-11 2013-01-02 Prediction method, prediction system and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012003233A JP5988419B2 (ja) 2012-01-11 2012-01-11 予測方法、予測システムおよびプログラム

Publications (2)

Publication Number Publication Date
JP2013143031A JP2013143031A (ja) 2013-07-22
JP5988419B2 true JP5988419B2 (ja) 2016-09-07

Family

ID=48744649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012003233A Expired - Fee Related JP5988419B2 (ja) 2012-01-11 2012-01-11 予測方法、予測システムおよびプログラム

Country Status (2)

Country Link
US (1) US9087294B2 (ja)
JP (1) JP5988419B2 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10304006B2 (en) * 2013-02-15 2019-05-28 The Charles Stark Draper Laboratory, Inc. Method for integrating and fusing heterogeneous data types to perform predictive analysis
JP6152073B2 (ja) * 2014-05-21 2017-06-21 日本電信電話株式会社 グループ対応付け装置、方法、及びプログラム
JP5984153B2 (ja) * 2014-09-22 2016-09-06 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、プログラム、及び情報処理方法
JP6641867B2 (ja) * 2015-10-09 2020-02-05 日本製鉄株式会社 消費電力量予測方法、装置及びプログラム
CN105701562B (zh) * 2016-01-05 2019-12-17 上海思源弘瑞自动化有限公司 训练方法、所适用的预测发电功率的方法及各自系统
JP6466863B2 (ja) * 2016-02-09 2019-02-06 日本電信電話株式会社 最適化装置、最適化方法、およびプログラム
JP6847386B2 (ja) 2016-09-09 2021-03-24 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation ニューラルネットワークの正則化
KR102346944B1 (ko) * 2017-07-12 2022-01-05 오씨아이 주식회사 태양광 발전량 및 부하량 예측을 통한 전기 에너지 충/방전 관리 시스템 및 방법
US20190080259A1 (en) * 2017-09-13 2019-03-14 General Electric Company Method of learning robust regression models from limited training data
CN108776717B (zh) * 2018-04-25 2020-11-10 香港中文大学(深圳) 核函数构造及数据预测方法、装置、设备和存储介质
JP2020071493A (ja) * 2018-10-29 2020-05-07 株式会社神戸製鋼所 結果予測装置、結果予測方法、及びプログラム
CN111985673A (zh) * 2019-05-22 2020-11-24 三菱重工业株式会社 预测装置、预测系统、预测方法以及记录介质
CN110826021B (zh) * 2019-10-31 2021-03-12 哈尔滨工业大学 一种非线性工业过程鲁棒辨识和输出估计方法
JP7424807B2 (ja) * 2019-11-28 2024-01-30 ファナック株式会社 機械学習装置、消費電力予測装置、及び制御装置
CN111539841A (zh) * 2019-12-31 2020-08-14 远景智能国际私人投资有限公司 电量预测方法、装置、设备及可读存储介质
CN112149913A (zh) * 2020-09-30 2020-12-29 浙江工业大学 基于高斯过程回归的离心泵外特性预测方法
JP7414289B2 (ja) * 2021-05-24 2024-01-16 国立大学法人広島大学 状態推定装置、状態推定方法及びプログラム
JP2023067596A (ja) * 2021-11-01 2023-05-16 株式会社東芝 パラメータベクトル値提案装置、パラメータベクトル値提案方法、パラメータ最適化方法及びパラメータベクトル値提案プログラム
CN114757386A (zh) * 2022-02-22 2022-07-15 国网江苏省电力有限公司南京供电分公司 一种电网调度控制系统故障预测方法
CN115018324A (zh) * 2022-06-08 2022-09-06 宁波和利时智能科技有限公司 一种基于核偏最小二乘模型的数据预测方法及装置
US12079230B1 (en) * 2024-01-31 2024-09-03 Clarify Health Solutions, Inc. Computer network architecture and method for predictive analysis using lookup tables as prediction models
CN118016195B (zh) * 2024-04-08 2024-08-23 深圳大学 微藻细胞发酵调控方法、装置、设备及存储介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2998453B2 (ja) 1992-09-30 2000-01-11 横河電機株式会社 制御の実行順序表示装置
JPH1075281A (ja) 1996-08-30 1998-03-17 Matsushita Electric Works Ltd コードレス電話装置
JP4046309B2 (ja) 1999-03-12 2008-02-13 株式会社東芝 プラント監視装置
JP3572521B2 (ja) 2001-12-28 2004-10-06 川崎重工業株式会社 砕石プラントの運転方法及び装置
JP2003303020A (ja) 2002-04-12 2003-10-24 Toshiba Corp プラント監視・診断システム
JP3868358B2 (ja) 2002-09-27 2007-01-17 株式会社国際電気通信基礎技術研究所 物理系の制御方法および装置ならびに物理系の制御のためのコンピュータプログラム
US7630945B2 (en) * 2005-05-12 2009-12-08 Yahoo! Inc. Building support vector machines with reduced classifier complexity
JP5005208B2 (ja) 2005-10-28 2012-08-22 株式会社国際バイオインフォマティクス研究所 予測方法、予測装置および予測プログラム
JP5011830B2 (ja) * 2006-06-09 2012-08-29 富士通セミコンダクター株式会社 データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置
JP5125071B2 (ja) * 2006-11-20 2013-01-23 富士通株式会社 スケール算出プログラム、スケール算出装置およびスケール算出方法
EP1967996A1 (en) 2007-03-09 2008-09-10 Omron Corporation Factor estimating support device and method of controlling the same, and factor estimating support program
US7555399B1 (en) * 2007-04-23 2009-06-30 Mitsubishi Electric Research Laboratories, Inc. Method and system for detecting changes in sensor sample streams
JP5198994B2 (ja) 2008-09-19 2013-05-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 所要時間予測システム、方法及びプログラム
KR101360790B1 (ko) 2009-04-22 2014-02-11 한국전력공사 발전소 계측기 성능 감시 예측 방법
JP5570008B2 (ja) 2010-03-23 2014-08-13 インターナショナル・ビジネス・マシーンズ・コーポレーション カーネル回帰システム、方法及びプログラム

Also Published As

Publication number Publication date
US9087294B2 (en) 2015-07-21
JP2013143031A (ja) 2013-07-22
US20130179380A1 (en) 2013-07-11

Similar Documents

Publication Publication Date Title
JP5988419B2 (ja) 予測方法、予測システムおよびプログラム
Erickson et al. Comparison of Gaussian process modeling software
US8595155B2 (en) Kernel regression system, method, and program
Li et al. Analysis of computational approaches for motif discovery
CN110427560B (zh) 一种应用于推荐系统的模型训练方法以及相关装置
Rosen et al. Automatic estimation of multivariate spectra via smoothing splines
WO2012176519A1 (ja) 予測装置、予測方法及び予測プログラム
CN106294859A (zh) 一种基于属性耦合矩阵分解的项目推荐方法
JP4627674B2 (ja) データ処理方法及びプログラム
JP7344149B2 (ja) 最適化装置及び最適化方法
JP2024516656A (ja) 産業特定機械学習アプリケーション
US20180144518A1 (en) Enhanced triplet embedding and triplet creation for high-dimensional data visualizations
Richards et al. Spatial deformation for nonstationary extremal dependence
Yan et al. Functional principal components analysis on moving time windows of longitudinal data: dynamic prediction of times to event
JP6791151B2 (ja) 最適化システム、最適化方法および最適化プログラム
Nan et al. A varying-coefficient Cox model for the effect of age at a marker event on age at menopause
Zhu et al. On distribution-weighted partial least squares with diverging number of highly correlated predictors
JP7559762B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP6012860B2 (ja) 作業時間推定装置
Marjoram Approximation bayesian computation
CN112991026A (zh) 一种商品推荐方法、系统、设备及计算机可读存储介质
JP2021022051A (ja) 機械学習プログラム、機械学習方法および機械学習装置
JP5860828B2 (ja) 行動確率推定装置、方法、及びプログラム
CN112581250B (zh) 模型生成方法、装置、计算机设备和存储介质
Yu et al. Regression calibration in semiparametric accelerated failure time models

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160712

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20160712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160805

R150 Certificate of patent or registration of utility model

Ref document number: 5988419

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees