JP7280921B2

JP7280921B2 - 計算機システム、推論方法、及びプログラム

Info

Publication number: JP7280921B2
Application number: JP2021099156A
Authority: JP
Inventors: 健太金井; 政幸諸橋; 晃松本
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2021-06-15
Filing date: 2021-06-15
Publication date: 2023-05-24
Anticipated expiration: 2041-06-15
Also published as: US20220398473A1; JP2022190752A

Description

本発明は、モデルの学習に使用する学習データのサンプリング技術に関する。

利益の最大化及び業務効率を実現するためにＫＰＩを改善する行動を選択するモデルを利用するシステムがある。モデルは、状態及び行動に関する値を含む学習データを用いた強化学習によって生成される。

膨大な数の学習データを用いた機械学習は処理時間が非常に長くなることが知られている。そのため、効率的な処理を行うために、学習データを絞り込むサンプリングが行われる。学習データのサンプリングの手法としては、例えば、ランダムサンプリング及び特許文献１に記載の技術が知られている。

特許文献１には、「既知データをサンプリングし、既知データに対しては複数の学習機械で独立に学習を行い、未知データに対しては次に学習すべきデータを選択する能動学習システムは、既知データをサンプリングする時に重み付けを行うためのサンプリング重み付け装置と、複数の学習機械の学習結果を統合する際に重み付けを行うための予測重み付け装置と、次に学習すべきデータを選択するときに重み付けを行うためデータ重み付け装置と、を備える。各重み付け装置は、データ数に極端に偏りが発生しているときに、その比重を重くするように重み付けを行う。」ことが記載されている。

特開２００９－１０４６３２号公報

特許文献１では、未知データを考慮してサンプリングの選択指標となる重みを決定していないため、汎用的なモデルが生成される。そのため、突発的なイベントの発生、季節の変化、及び周期の変化等によって、これまでと特性が大きく異なる未知データに対しては正確な推論ができない可能性がある。

本発明は、未知データを考慮したサンプリングを含む機械学習を実現することを目的とする。

本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、プロセッサ、前記プロセッサに接続される記憶装置、前記プロセッサに接続されるインタフェースを有する少なくとも一つの計算機を備える計算機システムであって、説明変数の値及び目的変数の値を含む学習データのデータセットと、前記説明変数の値から目的変数の予測値を出力するモデルと、を管理し、前記少なくとも一つの計算機は、前記説明変数の値を含み、時系列を形成する複数の入力データの入力を受け付けた場合、前記データセットに含まれる前記複数の学習データを、時系列順に並べて、所定の時間幅でまとめることによってグループを生成し、前記複数のグループの各々について、前記学習データのサンプリングの選択指標を算出する指標算出処理を実行し、前記選択指標に基づいて、前記データセットから前記複数の学習データを選択し、前記選択された複数の学習データを用いて前記モデルを学習し、前記モデルを用いて、前記複数の入力データの各々の予測値を出力し、前記指標算出処理では、前記少なくとも一つの計算機は、前記複数の入力データの特徴量空間における分布の特性と、前記グループに含まれる前記複数の学習データの特徴量空間における分布の特性との類似性に基づいて、前記選択指標を算出し、前記グループに含まれる前記複数の学習データの各々に前記選択指標を付与する。

本発明によれば、入力データ（未知データ）を考慮したサンプリングを含む機械学習を実現できる。これによって、推論対象の入力データ（未知データ）に対する推論の精度が高いモデルを効率的に生成できる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。

実施例１の計算機システムの機能構成の一例を示す図である。実施例１の計算機システムを構成する計算機のハードウェア構成の一例を示す図である。実施例１の計算機システムが扱うデータのデータ構造の一例を示す図である。実施例１の計算機システムが扱うデータのデータ構造の一例を示す図である。実施例１の計算機システムが扱うデータのデータ構造の一例を示す図である。実施例１の計算機システムが入力データ群を受け付けた場合に実行する処理の概要を説明するフローチャートである。実施例１の前処理部が実行する前処理の一例を説明するフローチャートである。実施例１の前処理部が実行する処理のイメージを示す図である。実施例１の前処理部が実行する処理のイメージを示す図である。実施例１の学習部が実行する学習処理の一例を説明するフローチャートである。実施例１の推論部が実行する推論処理の一例を説明するフローチャートである。実施例１の行動結果取得部が実行する行動結果取得処理の一例を説明するフローチャートである。

以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施例の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。

以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。

本明細書等における「第１」、「第２」、「第３」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。

図面等において示す各構成の位置、大きさ、形状、及び範囲等は、発明の理解を容易にするため、実際の位置、大きさ、形状、及び範囲等を表していない場合がある。したがって、本発明では、図面等に開示された位置、大きさ、形状、及び範囲等に限定されない。

推論対象の入力データを考慮したサンプリングを含む機械学習を実行する計算機システムについて説明する。

図１は、実施例１の計算機システムの機能構成の一例を示す図である。図２は、実施例１の計算機システムを構成する計算機のハードウェア構成の一例を示す図である。

計算機システム１００は、少なくとも一つの計算機２００から構成される。計算機２００は、プロセッサ２０１、主記憶装置２０２、副記憶装置２０３、ネットワークインタフェース２０４、入力装置２０５、及び出力装置２０６を有する。各ハードウェア要素は内部バスを介して互いに接続される。

プロセッサ２０１は、主記憶装置２０２に格納されるプログラムを実行する。プロセッサ２０１がプログラムにしたがって処理を実行することによって、特定の機能を実現する機能部（モジュール）として動作する。以下の説明では、機能部を主語に処理を説明する場合、プロセッサ２０１が当該機能部を実現するプログラムを実行していることを示す。

主記憶装置２０２は、ＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等であり、プロセッサ２０１が実行するプログラム及びプログラムが使用するデータを格納する。また、主記憶装置２０２はワークエリアとしても用いられる。

副記憶装置２０３は、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）及びＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等であり、データを永続的に格納する。主記憶装置２０２に格納されるプログラム及びデータは、副記憶装置２０３に格納されてもよい。この場合、プロセッサ２０１が副記憶装置２０３からプログラム及びデータを読み出し、主記憶装置２０２にロードする。

ネットワークインタフェース２０４は、ネットワークを介して外部装置と接続するためのインタフェースである。入力装置２０５は、キーボード、マウス、及びタッチパネル等であり、計算機２００に対してデータ及びコマンドを入力する。出力装置２０６は、ディスプレイ等であり、処理結果等を出力する。

なお、計算機システム１００は、ストレージシステム及びネットワークスイッチ等を含んでもよい。

計算機システム１００は、前処理部１１０、学習部１１１、推論部１１２、推論結果出力部１１３、及び行動結果取得部１１４を有し、また、設定情報１２０、学習データ管理情報１２１、及び推論モデル情報１２２を保持する。

設定情報１２０は、学習データのサンプリングの選択指標である重みの算出処理及び学習処理に関する情報を格納する。学習データ管理情報１２１は、学習データを格納する。推論モデル情報１２２は、入力データを用いて推論を行うための推論モデルを格納する。

前処理部１１０は、学習処理及び推論処理で扱うデータフォーマットのデータを生成する。また、前処理部１１０は、学習処理に使用する学習データのサンプリングを行う。前処理部１１０は、学習データ前処理部１３０、入力データ前処理部１３１、重み付け部１３２、及びサンプリング部１３３を含む。

学習データ前処理部１３０は、学習部１１１が扱うデータフォーマットの学習データに変換する。学習データ前処理部１３０は、重み付け部１３２及びサンプリング部１３３に学習データを出力する。

入力データ前処理部１３１は、推論対象の入力データ群１０５を受け付け、推論部１１２が扱うデータフォーマットに入力データを変換する。入力データ前処理部１３１は、重み付け部１３２及び推論部１１２に入力データを出力する。

重み付け部１３２は、重みを算出し、重みをサンプリング部１３３に出力する。サンプリング部１３３は、重みに基づいて学習データのサンプリングを実行し、選択された学習データを学習部１１１に出力する。

学習部１１１は、サンプリング部１３３によって選択された学習データを用いて学習処理を実行して、推論モデルを生成する。学習部１１１は、推論モデル情報１２２に推論モデルを格納する。本実施例では、学習部１１１は、強化学習によって、環境の状態から行動を選択するための推論モデル（方策）を生成するものとする。

なお、本発明は学習方法に限定されない。また、本発明は、推論モデルの種類及び構造に限定されない。また、本発明は、推論する事柄に限定されない。

推論部１１２は、一つの入力データを推論モデルに入力することによって一つの推論結果を得る。推論結果出力部１１３は推論結果を出力する。行動結果取得部１１４は、実際の行動及び行動が行われた後の環境の状態を取得し、学習データとして学習データ管理情報１２１に格納する。

なお、計算機システム１００が有する各機能部については、複数の機能部を一つの機能部にまとめてもよいし、一つの機能部を機能毎に複数の機能部に分けてもよい。また、計算機システム１００が複数の計算機２００から構成される場合、各機能部を複数の計算機２００に分散して配置してもよい。

図３Ａ、図３Ｂ、及び図３Ｃは、実施例１の計算機システム１００が扱うデータのデータ構造の一例を示す図である。

図３Ａは、学習データ管理情報１２１に格納される学習データのデータ構造を示す。学習データは、学習データのＩＤ、環境の状態が観測された日時、環境の状態を示す値、及び行動を示す値を含む。

図３Ｂは、学習データ前処理部１３０によって変換された学習データのデータ構造を示す。学習データは、学習データのＩＤ、目的変数の値、及び説明変数の値を含む。本実施例では、行動を示す値から目的変数の値が算出され、環境の状態を示す値から説明変数の値が算出される。なお、日時は、説明変数に含まれてもよいし、また、説明変数に含まれていなくてもよい。

図３Ｃは、入力データ前処理部１３１によって変換された入力データのデータ構造を示す。入力データは、入力データのＩＤ及び説明変数の値を含む。なお、計算機システム１００が受け付けた入力データは、ＩＤ、環境の状態が観測された日時、及び環境の状態を示す値を含む。

図４は、実施例１の計算機システム１００が入力データ群１０５を受け付けた場合に実行する処理の概要を説明するフローチャートである。

計算機システム１００は、時系列順に並べられた入力データから構成される入力データ群１０５を受け付けた場合、以下で説明する処理を開始する。

計算機システム１００の前処理部１１０は前処理を実行する（ステップＳ１０１）。前処理の詳細は、図５を用いて説明する。

次に、計算機システム１００の学習部１１１は学習処理を実行する（ステップＳ１０２）。学習処理の詳細は、図７を用いて説明する。

次に、計算機システム１００の推論部１１２は推論処理を実行する（ステップＳ１０３）。推論処理の詳細は、図８を用いて説明する。

次に、計算機システム１００の行動結果取得部１１４は行動結果取得処理を実行し（ステップＳ１０４）、一連の処理を終了する。行動結果取得処理の詳細は、図９を用いて説明する。

図５は、実施例１の前処理部１１０が実行する前処理の一例を説明するフローチャートである。図６Ａ及び図６Ｂは、実施例１の前処理部１１０が実行する処理のイメージを示す図である。

前処理部１１０は、学習データ管理情報１２１から学習データ群を取得し、受け付けた入力データ群１０５を取得し、また、設定情報１２０からサンプリング制御情報を取得する（ステップＳ２０１）。

具体的には、学習データ前処理部１３０が学習データ群及びサンプリング制御情報を取得し、入力データ前処理部１３１が入力データ群１０５を取得する。サンプリング制御情報には、選択するサンプル（学習データ）の数、代表学習データの選択アルゴリズム、及び重み算出アルゴリズムが含まれる。

次に、前処理部１１０は、学習データ及び入力データのデータフォーマットを変換する（ステップＳ２０２）。

具体的には、学習データ前処理部１３０が学習データ群に含まれる各学習データのデータフォーマットを変換し、入力データ前処理部１３１が入力データ群１０５に含まれる各入力データのデータフォーマットを変換する。データフォーマットの変換は公知の技術であるため詳細な説明は省略する。

次に、前処理部１１０は、学習データ群をグループ分けする（ステップＳ２０３）。

具体的には、重み付け部１３２は、学習データを時系列順に並べて、任意の時間幅で学習データをまとめることによってグループを生成する。なお、学習データの説明変数に日時が含まれていない場合、学習データ前処理部１３０が時系列順に並べた学習データを出力する。

例えば、図６Ａに示すように、重み付け部１３２は、入力データ群１０５の時間幅と同じ時間幅で学習データをまとめることによってグループを生成する。なお、縦方向は特徴量空間を示す。重み付け部１３２は、入力データ群に時系列の識別情報Ｔ０を付与する。また、重み付け部１３２は、時系列順に、学習データのグループに時系列の識別情報を付与する。図６Ａでは、過去に遡る順番で、Ｔ１からＴ８までの識別情報が付与されている。

次に、前処理部１１０は、グループのループ処理を開始する（ステップＳ２０４）。

具体的には、重み付け部１３２は、生成されたグループの中から一つのグループを選択する。ここでは、過去に遡る順番でグループが選択されるものとする。図６Ａに示す例では、Ｔ１、Ｔ２、Ｔ３、Ｔ４、Ｔ５、Ｔ６、Ｔ７、及びＴ８の順にグループが選択される。

次に、前処理部１１０は、代表学習データ及び入力データ群１０５を用いて、グループに含まれる学習データ群の分布特性と入力データ群１０５の分布特性との間の類似性に基づいてグループの重みを算出する（ステップＳ２０５）。

学習データ群の分布特性とは、特徴量空間における学習データの分布の特性を表し、入力データ群１０５の分布特性とは、特徴量空間における入力データの分布の特性を表す。重みの算出方法は以下の三つが考えられる。

（算出方法１）重み付け部１３２は、式（１）を用いて重みを算出する。

ここで、ｗは重みを表し、βは任意の定数を表し、ｔはグループの時系列間の距離を表す。例えば、グループの時系列の識別情報がＴ１の場合、ｔは１となり、グループの時系列の識別情報がＴ６の場合、ｔは６となる。算出方法１は、入力データ群との時間差が小さいほど、学習データ群の分布特性が入力データ群１０５の分布特性に類似するという仮定に基づく重みの算出方法である。

図６Ｂに示すように、重み付け部１３２は、グループに含まれる各学習データに算出された重みを付与する。

（算出方法２）重み付け部１３２は、代表学習データの選択アルゴリズムに基づいて、グループに含まれる学習データの中から代表学習データを選択する。重み付け部１３２は、例えば、特徴量空間における学習データの分布を分析し、分布の重心との距離が近い学習データを所定の数だけ選択する。又は、重み付け部１３２は、ランダムに所定の数の学習データを選択する。本発明は、代表学習データの選択方法に限定されない。

重み付け部１３２は、代表学習データ及び入力データのペアを生成する。重み付け部１３２は、各ペアの説明変数の値を用いて相関係数を算出する。重み付け部１３２は、相関係数の平均値を重みとして算出する。

（算出方法３）重み付け部１３２は、代表学習データの選択アルゴリズムに基づいて、グループに含まれる学習データの中から代表学習データを選択する。

重み付け部１３２は、代表学習データ群及び入力データ群１０５を用いて、学習データ及び入力データを分類するモデルを生成する。具体的には、重み付け部１３２は、正解ラベル「０」が付与された学習データと、正解ラベル「１」が付与された入力データとを用いてモデルを学習する。当該モデルは、分類対象のデータが入力モデルである確率値を出力する。重み付け部１３２は、当該モデルに、代表学習データを入力することによって、予測値を取得する。重み付け部１３２は、各学習データの予測値の平均値を重みとして算出する。

算出方法１の重みを用いた場合、入力データ群１０５との時間の差が小さい学習データ群から優先的に学習データが選択される。算出方法２、３の重みを用いた場合、特徴量空間の入力データ群１０５の分布と類似する学習データ群から優先的に学習データが選択される。なお、算出方法１、２、３を組み合わせてもよい。

本実施例では、入力データ群１０５の分布特性に基づいてサンプリングの選択指標（重み）が算出される。重みに基づいて学習データを選択することによって、入力データ群１０５と分布特性が類似する学習データ群を用いて推論モデルを生成できる。したがって、推論モデルは、入力データ群１０５に対して高い精度で推論を行うことができる。

以上がステップＳ２０５の処理の説明である。

次に、前処理部１１０は、すべてのグループについて処理が完了したか否かを判定する（ステップＳ２０６）。

すべてのグループについて処理が完了していないと判定された場合、前処理部１１０は、ステップＳ２０４に戻り、同様の処理を実行する。

すべてのグループについて処理が完了したと判定された場合、前処理部１１０は、重みに基づいてサンプリングを実行する（ステップＳ２０７）。その後、前処理部１１０は前処理を終了する。

具体的には、サンプリング部１３３は、重み及びサンプルの数に基づいて、確率的に所定の数の学習データを選択する。例えば、サンプリング部１３３は、図６Ｂに示すように、所定の数の学習データを選択する。

確率的に学習データを選択することによって、特定の時系列のグループのみから学習データが選択されないようにしている。これによって、学習データの偏り、及び、特定の学習データへのオーバーフィッティングを防止している。

図７は、実施例１の学習部１１１が実行する学習処理の一例を説明するフローチャートである。

学習部１１１は、前処理部１１０によって選択された学習データから学習データセットを生成する（ステップＳ３０１）。

次に、学習部１１１は、設定情報１２０から学習アルゴリズムの情報を取得する（ステップＳ３０２）。

次に、学習部１１１は、学習アルゴリズム及び学習データセットを用いた機械学習を実行することによって推論モデルを生成する（ステップＳ３０３）。機械学習は公知の方法を用いればよいため詳細な説明は省略する。

次に、学習部１１１は、推論モデル情報１２２に、生成された推論モデルを格納する（ステップＳ３０４）。その後、学習部１１１は学習処理を終了する。

例えば、学習部１１１は、推論モデル情報１２２に格納されている推論モデルに、新たな推論モデルを上書きする。また、学習部１１１は、推論モデル情報１２２に複数の推論モデルを格納してもよい。

図８は、実施例１の推論部１１２が実行する推論処理の一例を説明するフローチャートである。

推論部１１２は、推論モデル情報１２２から推論モデルを取得する（ステップＳ４０１）。推論モデル情報１２２に複数の推論モデルが格納される場合、新たに生成された推論モデルが取得される。

次に、推論部１１２は、入力データ群１０５に含まれる各入力データを推論モデルに入力し、推論結果出力部１１３がモデルから取得した推論結果を出力する（ステップＳ４０２）。推論結果は、図示しない装置又はシステムに出力されてもよいし、ユーザが操作する端末に出力されてもよい。

図９は、実施例１の行動結果取得部１１４が実行する行動結果取得処理の一例を説明するフローチャートである。

行動結果取得部１１４は、行動結果を取得する（ステップＳ５０１）。

行動結果は、推論結果を出力した装置若しくはシステム、又は、ユーザが操作する端末から取得される。

行動結果取得部１１４は、入力データと、当該入力データに対する行動結果とから学習データを生成し、学習データ管理情報１２１に保存する（ステップＳ５０２）。その後、行動結果取得部１１４は行動結果取得処理を終了する。

以上で説明したように、実施例１の計算機システム１００は、推論対象の入力データ群と、所定の時間幅でグループ化した学習データ群との間の特性の類似性から、学習データ群の重みを算出する。当該重みを用いて選択された学習データを用いて推論モデルを生成することによって、入力データに対して高い精度の推論結果を得ることができる。また、学習に要する時間も大幅に削減できる。

なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。

また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ハードディスク、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、光ディスク、光磁気ディスク、ＣＤ－Ｒ、磁気テープ、不揮発性のメモリカード、ＲＯＭなどが用いられる。

また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、Ｃ／Ｃ＋＋、ｐｅｒｌ、Ｓｈｅｌｌ、ＰＨＰ、Ｐｙｔｈｏｎ、Ｊａｖａ（登録商標）等の広範囲のプログラム又はスクリプト言語で実装できる。

さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はＣＤ－ＲＷ、ＣＤ－Ｒ等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。

上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。

１００計算機システム
１０５入力データ群
１１０前処理部
１１１学習部
１１２推論部
１１３推論結果出力部
１１４行動結果取得部
１２０設定情報
１２１学習データ管理情報
１２２推論モデル情報
１３０学習データ前処理部
１３１入力データ前処理部
１３２重み付け部
１３３サンプリング部
２００計算機
２０１プロセッサ
２０２主記憶装置
２０３副記憶装置
２０４ネットワークインタフェース
２０５入力装置
２０６出力装置

Claims

プロセッサ、前記プロセッサに接続される記憶装置、前記プロセッサに接続されるインタフェースを有する少なくとも一つの計算機を備える計算機システムであって、
説明変数の値及び目的変数の値を含む学習データのデータセットと、前記説明変数の値から目的変数の予測値を出力するモデルと、を管理し、
前記少なくとも一つの計算機は、
前記説明変数の値を含み、時系列を形成する複数の入力データの入力を受け付けた場合、前記データセットに含まれる前記複数の学習データを、時系列順に並べて、所定の時間幅でまとめることによってグループを生成し、
前記複数のグループの各々について、前記学習データのサンプリングの選択指標を算出する指標算出処理を実行し、
前記選択指標に基づいて、前記データセットから前記複数の学習データを選択し、
前記選択された複数の学習データを用いて前記モデルを学習し、
前記モデルを用いて、前記複数の入力データの各々の予測値を出力し、
前記指標算出処理では、前記少なくとも一つの計算機は、
前記複数の入力データの特徴量空間における分布の特性と、前記グループに含まれる前記複数の学習データの特徴量空間における分布の特性との類似性に基づいて、前記選択指標を算出し、
前記グループに含まれる前記複数の学習データの各々に前記選択指標を付与することを特徴とする計算機システム。
請求項１に記載の計算機システムであって、
前記少なくとも一つの計算機は、前記指標算出処理において、前記入力データ及び前記学習データの時間の差に基づいて、前記選択指標を算出することを特徴とする計算機システム。
請求項１に記載の計算機システムであって、
前記少なくとも一つの計算機は、前記指標算出処理において、
前記グループに含まれる前記複数の学習データの中から複数の代表学習データを選択し、
前記入力データ及び前記代表学習データのペアを生成し、
前記ペアを構成する前記入力データ及び前記代表学習データの間の相関係数を算出し、
複数の前記相関係数に基づいて、前記選択指標を算出することを特徴とする計算機システム。
請求項１に記載の計算機システムであって、
前記少なくとも一つの計算機は、前記指標算出処理において、
前記グループに含まれる前記複数の学習データの中から複数の代表学習データを選択し、
前記複数の入力データ及び前記複数の代表学習データを用いて、入力されたデータが前記入力データ及び前記学習データのいずれであるかを分類する分類モデルを生成し、
前記複数の代表学習データを前記分類モデルに入力して得られた出力に基づいて、前記選択指標を算出することを特徴とする計算機システム。
請求項１に記載の計算機システムであって、
前記少なくとも一つの計算機は、前記選択指標に基づいて、前記データセットの中から確率的に、前記複数の学習データを選択することを特徴とする計算機システム。
計算機システムが実行する推論方法であって、
前記計算機システムは、
プロセッサ、前記プロセッサに接続される記憶装置、前記プロセッサに接続されるインタフェースを有する少なくとも一つの計算機を含み、
説明変数の値及び目的変数の値を含む学習データのデータセットと、前記説明変数の値から目的変数の予測値を出力するモデルと、を管理し、
前記推論方法は、
前記少なくとも一つの計算機が、前記説明変数の値を含み、時系列を形成する複数の入力データの入力を受け付けた場合、前記データセットに含まれる前記複数の学習データを、時系列順に並べて、所定の時間幅でまとめることによってグループを生成する第１のステップと、
前記少なくとも一つの計算機が、前記複数のグループの各々について、前記学習データのサンプリングの選択指標を算出する指標算出処理を実行する第２のステップと、
前記少なくとも一つの計算機が、前記選択指標に基づいて、前記データセットから前記複数の学習データを選択する第３のステップと、
前記少なくとも一つの計算機が、前記選択された複数の学習データを用いて前記モデルを学習する第４のステップと、
前記少なくとも一つの計算機が、前記モデルを用いて、前記複数の入力データの各々の予測値を出力する第５のステップと、
を含み、
前記第２のステップは、
前記少なくとも一つの計算機が、前記複数の入力データの特徴量空間における分布の特性と、前記グループに含まれる前記複数の学習データの特徴量空間における分布の特性との類似性に基づいて、前記選択指標を算出する第６のステップと、
前記少なくとも一つの計算機が、前記グループに含まれる前記複数の学習データの各々に前記選択指標を付与する第７のステップと、を含むことを特徴とする推論方法。
請求項６に記載の推論方法であって、
前記第６のステップは、前記少なくとも一つの計算機が、前記入力データ及び前記学習データの時間の差に基づいて、前記選択指標を算出するステップを含むことを特徴とする推論方法。
請求項６に記載の推論方法であって、
前記第６のステップは、
前記少なくとも一つの計算機が、前記グループに含まれる前記複数の学習データの中から複数の代表学習データを選択するステップと、
前記少なくとも一つの計算機が、前記入力データ及び前記代表学習データのペアを生成するステップと、
前記少なくとも一つの計算機が、前記ペアを構成する前記入力データ及び前記代表学習データの間の相関係数を算出するステップと、
前記少なくとも一つの計算機が、複数の前記相関係数に基づいて、前記選択指標を算出するステップと、を含むことを特徴とする推論方法。
請求項６に記載の推論方法であって、
前記第６のステップは、
前記少なくとも一つの計算機が、前記グループに含まれる前記複数の学習データの中から複数の代表学習データを選択するステップと、
前記少なくとも一つの計算機が、前記複数の入力データ及び前記複数の代表学習データを用いて、入力されたデータが前記入力データ及び前記学習データのいずれであるかを分類する分類モデルを生成するステップと、
前記少なくとも一つの計算機が、前記複数の代表学習データを前記分類モデルに入力して得られた出力に基づいて、前記選択指標を算出するステップと、を含むことを特徴とする推論方法。
請求項６に記載の推論方法であって、
前記第３のステップは、前記少なくとも一つの計算機が、前記選択指標に基づいて、前記データセットの中から確率的に、前記複数の学習データを選択するステップを含むことを特徴とする推論方法。
計算機に実行させるプログラムであって、
前記計算機は、
プロセッサ、前記プロセッサに接続される記憶装置、前記プロセッサに接続されるインタフェースを有し、
説明変数の値及び目的変数の値を含む学習データのデータセットと、前記説明変数の値から目的変数の予測値を出力するモデルと、を管理し、
前記プログラムは、
前記説明変数の値を含み、時系列を形成する複数の入力データの入力を受け付けた場合、前記データセットに含まれる前記複数の学習データを、時系列順に並べて、所定の時間幅でまとめることによってグループを生成する第１の手順と、
前記複数のグループの各々について、前記学習データのサンプリングの選択指標を算出する指標算出処理を実行する第２の手順と、
前記選択指標に基づいて、前記データセットから前記複数の学習データを選択する第３の手順と、
前記選択された複数の学習データを用いて前記モデルを学習する第４の手順と、
前記モデルを用いて、前記複数の入力データの各々の予測値を出力する第５の手順と、
を前記計算機に実行させ、
前記第２の手順は、
前記複数の入力データの特徴量空間における分布の特性と、前記グループに含まれる前記複数の学習データの特徴量空間における分布の特性との類似性に基づいて、前記選択指標を算出する第６の手順と、
前記グループに含まれる前記複数の学習データの各々に前記選択指標を付与する第７の手順と、を含むことを特徴とするプログラム。