JP2021174330A

JP2021174330A - 異種機械学習のアンサンブル学習による予測装置

Info

Publication number: JP2021174330A
Application number: JP2020078810A
Authority: JP
Inventors: 隆遠藤; Takashi Endo; 敬大濱本; Keita Hamamoto
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2020-04-28
Filing date: 2020-04-28
Publication date: 2021-11-01

Abstract

【課題】少ないデータセットでも精度良く銀行ローンのデフォルト率のような希少事象の確率を推定する銀行の予測システムを提供する。【解決手段】予測装置は、新規銀行のトレーニングデータから新規銀行予測モデルを学習するモデル学習部１０２と、新規銀行のバリデーションデータと第１既存銀行の第１予測モデルに基づき、第１予測結果を出力する第１予測器４０２ａと、新規銀行のバリデーションデータと第２既存銀行の第２予測モデルに基づき、第２予測結果を出力する第２予測器４０２ｂと、新規銀行のバリデーションデータと新規銀行予測モデルに基づき、第３予測結果を出力する第３予測器４０２ｃと、第１〜第３の予測結果のアンサンブル結果がバリデーションデータの目的変数に近づくようにゲートアンサンブル重みを学習するゲートアンサンブル学習部５３１と、学習したゲートアンサンブル重み値を格納する記憶装置と、を有する。【選択図】図３

Description

本発明は、顧客の信用等に関する評価値を自動予測する技術に関するものである。特に、異種機械学習のアンサンブル学習による顧客の評価値を自動予測するための技術に関する。

金融機関では、顧客へのローンの審査を行う際に、顧客がローンの返済が不能となる、デフォルト（債務不履行）となる確率を予測し、貸付の可否の判断を行っている。こうした審査の判断をサポートするために、機械学習の技術により顧客がローン申込時に記入した情報を説明変数、デフォルトしたか否かを目標変数とした機械学習をもちいた予測システムの構築が行われている。デフォルトが希少事象であり、学習データが十分に揃わないため、銀行の違いによって予測精度が大きく異なる。複数の銀行をまとめたデータを用いても、説明変数の種類や特性が異なるため高い予測性能を得ることが難しい。機械学習の予測精度を向上させる技術として、特許文献１があげられる。

特開２０１９−７９３９２号公報

上記特許文献１では、機械学習において、予測精度が最も高い予測モデルを探索する技術を開示しているが、入力データが少ない場合の課題や別の学習データによる学習モデルを用いた学習結果をアンサンブルすることについては、触れられていない。

特に、金融機関では、顧客がローン返済不能な状態、デフォルトになる可能性を審査の段階で予測し、貸し出しの可否の判断を行っている。この判断をサポートするために、機械学習技術を用いて自動的に予測値を計算する試みが行われている。しかし、機械学習では大量の学習データが必要なため、特にデフォルト状態というレアケースを予測するためのデータが少ないため、高性能なモデルを学習するには、熟練SEによる調整が不可欠である。

また、一度作成したモデルが永久に使えるわけではなく、データの増加や顧客層の変化に応じて、定期的にメンテナンスが必要となる。

銀行毎に個別のモデルを作成し、銀行毎に予測を行うことや、データをマージして統合モデルを作成して予測を行うことが考えられる。

しかし、銀行毎にパラメータの定義が微妙に異なることや、学習のデータ数が少ないことから、個別モデルや統合モデルでは、予測性能が個々の銀行で異なり、特定の銀行で低い予測値がでることが予想される。銀行毎のモデルの調整は最小限にとどめ、SEの工数の増大を避けてN倍化を行うための技術が求められている。

さらに、新銀行が加わったときに、単純に新銀行のデータを加えた学習データを作成してモデルを学習すると、予測性能が落ちるケースが有る。これは、銀行によって顧客の特性が異なり、場合によっては目的変数に対する個々の説明変数の相関の符号が逆になる場合もあり、単純にデータを統合すると、情報が失われてしまうためである。

そこで、本発明の目的は、新規銀行の顧客のデフォルト予測を精度よく行うことができる予測装置を提供することにある。

上記課題を解決するため、新規銀行の顧客審査の結果を予測する予測装置の一態様は、前記新規銀行のトレーニングデータから新規銀行の新規銀行予測モデルを学習するモデル学習部と、前記新規銀行のバリデーションデータと第1既存銀行の第１予測モデルに基づき、第１予測結果を出力する第1予測器と、前記新規銀行のバリデーションデータと第２既存銀行の第２予測モデルに基づき、第２予測結果を出力する第２予測器と、前記新規銀行のバリデーションデータと前記新規銀行予測モデルに基づき、第３予測結果を出力する第３予測器と、を有する。さらに、前記第１、第２及び第３の予測結果のアンサンブル結果が前記バリデーションデータの目的変数に近づくようにゲートアンサンブル重みを学習するゲートアンサンブル学習部と、前記ゲートアンサンブル学習部により学習したゲートアンサンブル重み値を格納する記憶装置と、を有する。

本発明によれば、新規銀行の顧客のデフォルト予測が、新規銀行以外の既存の銀行のモデル情報を用いてアンサンブルすることにより、新規銀行のみのデータで作成したモデルのみを用いて予測する場合よりも、改善した予測結果を得ることができる。

各実施例の予測装置のハードウェアブロック図の一例を示すブロック図である。各実施例の予測装置が処理するデータの一例を示す図である。実施例１のゲートアンサンブル重み学習処理の一例を示す図である。実施例１のゲートアンサンブル重みを用いた予測値の計算処理の一例を示した図である。実施例２の新銀行の追加データを用いたゲートアンサンブル重み学習処理の一例を示した図である。実施例３のゲートアンサンブル重みの学習処理の一例を示した図である。実施例３のゲートアンサンブル重みを用いた予測値の計算処理の一例を示した図である。実施例の新規銀行のバリデーションデータに対するアンサンブル重みの算出処理の一例を示す図である。

以下、図面を参照しながら実施の形態を説明するが、実施例で部分変更によって実施できる形態は、各実施例内で変形例として記述する。また、以下の説明では、「テーブル」等の表現にて各種情報を説明することがあるが、各種情報は、テーブル以外のデータ構造で表現されていてもよい。また、データ構造に依存しないことを示すために「データ」と呼ぶことができる。

また、「プログラム」を主語として処理を説明する場合がある。そのプログラムは、処理部であるプロセッサ、例えば、ＭＰ（Micro Processor）やＣＰＵ（Central Processing Unit）によって実行され、定められた処理をするものである。なお、プロセッサは、適宜に記憶資源（例えばメモリ）及び通信インターフェース装置（例えば、通信ポート）を用いながら処理を行うため、処理の主語がプロセッサとされてもよい。プロセッサは、ＣＰＵの他に専用ハードウェアを有していてもよい。コンピュータプログラムは、プログラムソースから各コンピュータにインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバ又は記憶メディアなどで提供されるものであってもよい。

また、本実施例の図及び説明において同一部分には同一符号を付与しているが、本発明が本実施例に制限されることは無く、本発明の思想に合致するあらゆる応用例が本発明の技術的範囲に含まれる。また、特に限定しない限り、各構成要素は複数でも単数でも構わない。

＜実施形態の概要＞
予測装置は、銀行の顧客のデフォルト審査を、顧客の収入や借入額などの説明変数から、顧客が返済不能なデフォルト状態に陥るか否かの目的変数として予測する。予測装置は、あらかじめ過去の顧客の説明変数と目的変数からなるデータセットを用いて学習したモデルを、銀行毎に既存銀行モデルとして学習しておく。新規銀行の顧客に対する予測を、新規銀行のデータに対し、学習した新規銀行モデルと既存銀行モデルとをそれぞれ用いて、複数の予測結果を計算する。複数の予測結果に対し、ゲートアンサンブルでアンサンブルを行うことで、新規銀行モデルのみを用いた予測よりも予測精度を高めることを実現する。以下、新規銀行を新銀行と省略して記載することがある。

また、時間とともに新たに入手できたデータ（新規銀行のデータ）をバリデーションデータに加え、ゲートアンサンブル重みの最適化を行う。これにより、追加データを用いてモデルのスクラッチからの再構築を行うことなく、運用中に予測精度を向上させることが可能な予測装置を実現する。

実施例１を、図１から図４、図８を用いて説明する。

図１は、実施例の異種機械学習のアンサンブル学習による予測装置１０の構成例の一例を示すブロック図である。図１に示す予測装置１０は、主記憶装置１３０、外部記憶装置１（１１０）、外部記憶装置２（１２０）、中央処理装置１４０、表示情報記憶装置１５０、表示制御装置１６０、表示装置１７０、入力装置１８０を有する。

外部記憶装置１（１１０）は、モデル学習プログラム１０２、予測プログラム４０２、ゲートアンサンブル重み学習プログラム５３１、Ａ銀行予測モデル５０１、Ｂ銀行予測モデル５０２、新銀行予測モデル１０３、ゲートアンサンブル重み５４１を格納する領域を有する。尚、図１は、各部の名称を省略した形で記載している。たとえば、モデル学習プログラム１０２をモデル学習と対応がわかる範囲で省略して記載している。

モデル学習プログラム１０２は、トレーニングデータから予測モデルを学習するためのプログラムである。予測プログラム４０２は、予測モデルを用いてバリデーションデータから予測値を求めるためのプログラムである。本発明では、デフォルトの審査予測が目的変数となる。ゲートアンサンブル重み学習プログラム５３１は、複数の予測モデルとバリデーションデータから複数の予測結果を求め、複数の予測結果のアンサンブルの重み値を学習するためのプログラムである。

主記憶装置１３０は、外部記憶装置１（１１０）に格納されたプログラム（モデル学習プログラム１０２、予測プログラム４０２、ゲートアンサンブル重み学習プログラム５３１）が、実行時にロードされ、中央処置装置１４０によって実行される。これにより、モデル学習、予測、ゲートアンサンブル重み学習の各機能を実現する。

また、モデル学習、予測、ゲートアンサンブル重み学習実行時に必要となるデータ（Ａ銀行予測モデル５０１、Ｂ銀行予測モデル５０２、新銀行予測モデル１０３、ゲートアンサンブル重み５４１）を、外部記憶装置１から主記憶装置１３０に読み出して処理する。

外部記憶装置２（１２０）には、Ａ銀行トレーニングデータ１２１、Ａ銀行バリデーションデータ１２２、Ｂ銀行トレーニングデータ１２３、Ｂ銀行バリデーションデータ１２４、新銀行トレーニングデータ１０１、新銀行バリデーションデータ５１０が格納されている。これらのデータについては、図２で説明する。

入力装置１８０は、キーボードおよびマウス等の入力装置である。
表示装置１７０は、ディスプレイ等の表示装置である。表示情報記憶装置１５０は、ＶＲＡＭ等の表示情報を記憶するメモリで、表示制御装置１６０は、表示装置１７０の表示を制御する表示駆動装置である。

なお、中央処置装置１４０は、ＭＰ（Micro Processor）やＣＰＵ（Central Processing Unit）等によって構成され、主記憶装置１３０に格納されたプログラムを実行する。以下、中央処理装置を、単に処理部と呼ぶ。処理部１４０は、ＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）等によって構成されても良い。

Ｉ／Ｏバス１９１、メモリバス１９２は、外部記憶装置１（１１０）、外部記憶装置２（１２０）、主記憶装置１３０、ＣＰＵ１４０と、表示情報記憶装置１５０、表示制御装置１６０、表示装置１７０、入力装置１８０とを接続する接続装置である。

尚、図１には示していないが、外部記憶装置１（１１０）には、予測器の予測結果５２１、５２２、５２３（図３参照）や、ゲートアンサンブル重み５４１(図３参照)、ゲートアンサンブルを用いた予測結果６４１(図４参照)等を格納する。

尚、図１では、予測装置１０を便宜上一台の計算機で構成される例を示したが、クラウド上の複数の計算機やクラウド上の複数の計算機のリソースを用いた仮想計算機によって構成されても良い。

図２は、実施例で扱う銀行データの一例を示す図である。
銀行データ２００は、レコードを区別するためのkey２０１が振られ、それぞれのレコードには、目標変数obj２０２、説明変数として、たとえば自己資金２０３、融資実行金額２０４、担保評価額２９９などを含む。銀行データ２００は、異なる銀行であっても、同種の説明変数を用いている場合が多く、共通する説明変数により、目的変数を求めるようにする。

銀行データ２００は、一般的な機械学習と同様、同一形式のトレーニングデータ、バリデーションデータ、テストデータの３つに分けられる。したがって、以下、銀行データは、その目的に応じて、トレーニングデータ、バリデーションデータ、テストデータとして説明する。

予測モデルは、深層学習で複数の層を有するネットワークで説明変数に対して重み付き和を各層で計算し、最後にロジスティック計算により、０〜１の予測値を得る。

図３は、実施例１の予測装置におけるゲートアンサンブル重みの計算処理の一例を示す図である。
図３において、既存の個別の銀行毎のモデル（既存銀行モデル）として、Ａ銀行予測モデル５０１、Ｂ銀行予測モデル５０２が外部記憶装置１に格納されている。

新しく追加された銀行に対して、デフォルトの審査を行う場合には、モデル学習部１０２により、外部記憶装置１２０に格納された新規銀行のトレーニングデータを読み出し、読み出された新規銀行のトレーニングデータから新規銀行の予測モデルを作成し、作成した予測モデルを新銀行予測モデル１０３として外部記憶装置１１０に格納する。

予測器４０２a、４０２ｂ、４０２ｃは、Ａ銀行予測モデル５０１、Ｂ銀行予測モデル５０２、新銀行予測モデル１０３の各モデルを用いて、新規銀行のバリデーションデータ５１０の説明変数を読み出し、予測値を計算する。予測器４０２a、４０２ｂ、４０２ｃが計算した予測値を、それぞれ予測結果５２１、５２２、５２３として、外部記憶装置１１０に格納する。

尚、予測結果５２１は、新銀行のバリデーションデータに対しＡ銀行予測モデルを用いて、予測器４０２ａで予測した結果であり、予測結果５２２は、新銀行のバリデーションデータに対しＢ銀行予測モデルを用いて、予測器４０２ｂで予測した結果であり、予測結果５２３は、新銀行のバリデーションデータに対し新銀行予測モデルを用いて、予測器４０２ｃで予測した結果である。

ゲートアンサンブル重み学習部５３１は、外部記憶装置１２０のバリデーションデータ５１０から目的変数を取り出し、予測結果の重み付け平均との差が最小となるように、重みの最適値を計算し、ゲートアンサンブル重み５４１として外部記憶装置１１０に格納する。

以上のように、新銀行のバリデーションデータ５１０に対し、既存行であるＡ銀行とＢ銀行の予測モデル、即ち、新銀行とは異なる銀行の予測モデルを用いて、予測結果を得る。また、新銀行のバリデーションデータ５１０に対し、新銀行予測モデル１０３を用いて、予測結果を得る。そして、それぞれの予測モデルに基づいて得られた予測結果の重み付け平均と、バリデーションデータ５１０に格納されている目的変数との差が最小となるように、アンサンブル重みの最適値を計算する。

既存銀行の予測モデルを用いて計算し、各予測モデルに基づいた予測結果に対するアンサンブル重みを学習することで、データ数が少ない新規銀行の顧客のデフォルト予測を精度良く行うことができる。

図４において、実施例１のゲートアンサンブル重みを用いた予測値の計算処理の一例を示した図である。図４において、新銀行のデフォルト率の計算部分について説明する。
予測器４０２ａ、予測器４０２ｂ、予測器４０２ｃは、テストデータ４０１から、デフォルト率を予測したい顧客の説明変数を読み出す。予測器４０２ａ、予測器４０２ｂ、予測器４０２ｃは、Ａ銀行予測モデル５０１、Ｂ銀行予測モデル５０２、新銀行予測モデル１０３のそれぞれを用いて、それぞれのモデルに対する予測値を計算する。それぞれの計算結果は、Ａ銀行予測モデルを用いて予測器４０２ａによって計算された予測結果５２１、Ｂ銀行予測モデルを用いて予測器４０２ｂによって計算された予測結果５２２、予測結果５２３は、新銀行予測モデルを用いて予測器４０２ｃによって計算された予測結果である。

ゲートアンサンブル計算部６３１は、予測結果５２１、５２２、５２３に対し、ゲートアンサンブル重み５４１に格納された重み情報を用いて、重み付け平均を計算し、最終的な予測値を予測結果６４１として格納する。外部記憶装置１１０に格納された予測結果６４１は、表示制御装置１６０によって、表示装置１７０に表示される。

このように、従来は、別々の学習器として学習し、予測させたものを、多数決をとる方法で融合させる事によって、未学習のデータに対しての予測能力を向上させることができる。

新規銀行のバリデーションデータに対する予測値の一実施例を、図８に示す。図８では、同じkeyの値のレコードに対して、３つのモデルから得られた３つの予測値（１６０１、１６０２、１６０３）が得られる。

目的変数２０２の値は、keyの値が2003003、2003007の時が１でそれ以外は０となる。予測値１６０１では、key=2003007に対する予測値が0.4となり、予測値１６０２では、０．８となる。key=2003003に対する予測値１６０２は０．５で、予測値１６０１の予測値は０．７となる。key=2003003に対する、予測値１６０３は、０．５５となり、予測値１６０２の０．５となる。これらの予測値に重み付け加算によるアンサンブリングを行う。まずは、ロジットをもとに戻す計算を、１６０５で行った後に、重み格納手段に格納された重み５４１との積を計算し、その後加算集計し、アンサンブル結果１６０４(スコア)を得る。アンサンブル結果１６０４は、目的変数２０２により近い値となる。

尚、実施例１では、既存銀行が、Ａ銀行、Ｂ銀行の二行で説明したが、既存銀行が一行や三行以上の場合であっても、同様に適応可能である。

また、モデル学習予測プログラム１０２が処理部１４０によって、実行されることで、図３、図４に記載のモデル学習部１０２の機能を実現し、予測プログラム４０２を実行することで、予測器４０２ａ、４０２ｂ、４０２ｃの機能を実現し、ゲートアンサンブル重み学習プログラムを実行することで、ゲートアンサンブル重み学習部５３１が実現される。

図５に実施例２を示す。図５は、実施例２のゲートアンサンブル重みの更新処理の一例を示すブロック図である。実施例２ではＡ銀行予測モデル５０１、Ｂ銀行予測モデル５０２、新銀行予測モデル格納部１０３に格納された学習済みの予測モデルと、バリデーションデータ５１０に加え、新規銀行追加データ７０２を用いて、ゲートアンサンブル重みの更新処理を行う。

新規銀行追加データ７０２についても、予測器を用いて予測を行う。それぞれの予測器の予測結果５２１、５２２、５２３を外部記憶装置１１０に格納する。

ゲートアンサンブル重み学習部５３１は、予測結果５２１、５２２、５２３と、バリデーションデータ５１０および新規銀行追加データ７０２を用いて、ゲートアンサンブル重みの最適値を計算し直し、ゲートアンサンブル重み５４１として格納する。

ここでも、外部記憶装置１２０のバリデーションデータ５１０から目的変数を取り出し、予測結果の重み付け平均との差が最小となるように、重みの最適値を計算する。

以上の通り、実施例２では、ゲートアンサンブル重みの計算にあたって、新規銀行の学習に利用できる追加データが加わった場合に、既存銀行モデル（Ａ銀行予測モデル、Ｂ銀行予測モデル）は変更せずに、ゲートアンサンブル重みの最適化（ゲートアンサンブル重みの更新）を行う。ゲートアンサンブル重みの更新のみを行うことで、既存銀行モデル（Ａ銀行予測モデル、Ｂ銀行予測モデル）の変更をすることなく、新規銀行のテストデータに対する予測精度を向上させることができる。この際、新銀行予測モデル１０３についても、既存銀行モデルと同様、変更することなく用いることができる。

図３に示された、ゲートアンサンブル重み学習処理と、図５のゲートアンサンブル重みの更新処理を比較すると、ゲートアンサンブル重み学習部５３１がバリデーションデータ５１０、新規銀行追加データ７０２を参照する点が異なり、その他のブロックは共通である。

新規銀行について、データ量が増え、ゲートアンサンブル重みの最適化のための新規銀行追加データ７０２が利用可能となった場合、一度作成した予測モデルを用いつつ、新規銀行追加データ７０２を用いて、ゲートアンサンブル重みを更新することで、複数の予測モデルをアンサンブルすることによって得られる予測精度を向上させることができる。

実施例２においても、既存銀行の数は二行以外の場合であっても、同様に適応可能である。

図６、図７に実施例３を示す。

実施例３は、新規銀行のトレーニングデータを用いることなく、ゲートアンサンブル重み学習を行う処理の一例を示す。図６に示したブロック図では、新規銀行の予測をおこなう際に、複数の既存銀行のモデルのみを用いて、新規銀行のデータから学習したモデルは作成しない。複数の既存銀行のモデルの予測結果の重み付け平均による予測結果と実際のデフォルトの目的変数の誤差が最小となるように、ゲートアンサンブル重み学習を行うゲートアンサンブル重みの計算を行う。

ゲートアンサンブル重み学習部８３１は、既存の銀行の予測モデル（Ａ銀行予測モデル５０１、Ｂ銀行予測モデル５０２、Ｃ銀行予測モデル８０３）を用いて、ゲートアンサンブル重みを学習し、ゲートアンサンブル重み８４１を格納する。

図７に示すように、予測時には、ゲートアンサンブル計算部６３１は、既存の銀行のモデルによる予測結果をゲートアンサンブル重み８４１に格納された重みを用いて、最終予測値を計算し、予測結果９４１として外部記憶装置１１０に格納する。外部記憶装置１１０に格納された予測結果９４１は、表示制御装置１６０によって、表示装置１７０に表示される。

この実施例は、新規の銀行のデータのみでは、学習用データが不足しているケースにおいて、既存銀行の予測モデルを用いて、新規銀行のデフォルト審査の予測に有効である。

実施例３においても、既存銀行の数は二行以外の場合であっても、同様に適応可能である。

以上、上記実施例によれば、新規銀行の顧客のデフォルト予測が、新規銀行以外の既存の銀行のモデル情報を用いてアンサンブルすることにより、新規銀行のデータで作成したモデルのみを用いる場合よりも、改善した予測結果を得ることができる。

また、上記実施例によれば、運用中に新たに得られるデータを用いて、アンサンブルを行う際の重みパラメータのみを更新することで、予測値の精度を向上させることができる。この場合、予測モデルをゼロから作り直すことなく、予測精度の向上を少ないコストで実現することができる。

また、上記実施例によれば、新規銀行以外の既存の銀行のモデル情報を用いて新規銀行の顧客のデフォルトを予測できるので、データ量が少ない新規銀行の顧客について、高い精度の予測を得ることができる。

１０：予測装置
１０１：新規銀行トレーニングデータ
１０２：モデル学習部
１０３：新規銀行予測モデル
１１０：外部記憶装置１
１３０：主記憶装置
１４０：中央処理装置
１７０：表示装置
２００：銀行データ
１８０：入力装置
２０１：テストデータ格納部
４０２：予測器
５２１：予測結果（Ａ銀行予測モデル）
５２２：予測結果（Ｂ銀行予測モデル）
５２３：予測結果（新規銀行予測モデル）
５３１：ゲートアンサンブル重み学習器
５４１：ゲートアンサンブル重み

Claims

新規銀行の顧客審査の結果を予測する予測装置において、
前記新規銀行のトレーニングデータから新規銀行の新規銀行予測モデルを学習するモデル学習部と、
前記新規銀行のバリデーションデータと第1既存銀行の第１予測モデルに基づき、第１予測結果を出力する第1予測器と、
前記新規銀行のバリデーションデータと第２既存銀行の第２予測モデルに基づき、第２予測結果を出力する第２予測器と、
前記新規銀行のバリデーションデータと前記新規銀行予測モデルに基づき、第３予測結果を出力する第３予測器と、
前記第１、第２及び第３の予測結果のアンサンブル結果が前記バリデーションデータの目的変数に近づくようにゲートアンサンブル重みを学習するゲートアンサンブル学習部と、
前記ゲートアンサンブル学習部により学習したゲートアンサンブル重み値を格納する記憶装置と、を有することを特徴とする予測装置。
請求項１に記載の予測装置において、
前記ゲートアンサンブル学習部は、
前記第１予測結果、前記第２予測結果、及び前記第３予測結果の重み付け平均と、前記バリデーションデータの目的変数との誤差が最小となるようなゲーティング重みを計算する、ことを特徴とする予測装置。
請求項２に記載の予測装置において、
前記第１予測器は、前記第１予測モデルと、前記新規銀行のテストデータから第４予測値を出力し、
前記第２予測器は、前記第２予測モデルと、前記新規銀行のテストデータから第５予測値を出力し、
前記第３予測器は、前記新規銀行予測モデルと、前記新規銀行のテストデータから第６予測値を出力し、
前記第４予測値、前記第５予測値、及び前記第６予測値と、前記記憶装置に格納されたゲートアンサンブル重み値に基づいて、最終予測結果を出力するゲートアンサンブル計算部と、
前記記憶装置は、前記ゲートアンサンブル計算部の最終予測結果を格納する、ことを特徴とする予測装置。
請求項３に記載の予測装置において、
前記新規銀行のデータが追加された場合、
前記第１予測器は、前記新規銀行のバリデーションデータ及び前記新規銀行の追加データと前記第１予測モデルに基づき、第７予測結果を出力し、
前記第２予測器は、前記新規銀行のバリデーションデータ及び前記新規銀行の追加データと前記第２予測モデルに基づき、第８予測結果を出力し、
前記第３予測器は、前記新規銀行のバリデーションデータ及び前記新規銀行の追加データと前記新規銀行予測モデルに基づき、第９予測結果を出力し、
前記ゲートアンサンブル学習部は、
前記第７、第８及び第９予測結果に基づいて、前記ゲートアンサンブル重みの値を更新する、ことを特徴とする予測装置。
新規銀行の顧客審査の結果を予測する予測装置において、
前記新規銀行のバリデーションデータと第1既存銀行の第１予測モデルに基づき、第１予測結果を出力する第1予測器と、
前記新規銀行のバリデーションデータと第２既存銀行の第２予測モデルに基づき、第２予測結果を出力する第２予測器と、
前記新規銀行のバリデーションデータと第３既存銀行の第３予測モデルに基づき、第１０予測結果を出力する第３予測器と、
前記第１、第２及び第１０予測結果のアンサンブル結果が前記バリデーションデータの目的変数に近づくようにゲートアンサンブル重みを学習するゲートアンサンブル学習部と、
前記ゲートアンサンブル学習部により学習したゲートアンサンブル重み値を格納する記憶装置と、を有することを特徴とする予測装置。
請求項５に記載の予測装置において、
前記ゲートアンサンブル学習部は、
前記第１予測結果、前記第２予測結果、及び前記第１０予測結果の重み付け平均と、前記バリデーションデータの目的変数との誤差が最小となるようなゲーティング重みを計算する、ことを特徴とする予測装置。
請求項６に記載の予測装置において、
前記第１予測器は、前記第１予測モデルと、前記新規銀行のテストデータから第４予測値を出力し、
前記第２予測器は、前記第２予測モデルと、前記新規銀行のテストデータから第５予測値を出力し、
前記第３予測器は、前記第３予測モデルと、前記新規銀行のテストデータから第１１予測値を出力し、
前記第４予測値、前記第５予測値、及び前記第１１予測値と、前記記憶装置に格納されたゲートアンサンブル重み値に基づいて、最終予測結果を出力するゲートアンサンブル計算部と、
前記記憶装置は、前記ゲートアンサンブル計算部の最終予測結果を格納する、ことを特徴とする予測装置。