JP2021174330A - 異種機械学習のアンサンブル学習による予測装置 - Google Patents
異種機械学習のアンサンブル学習による予測装置 Download PDFInfo
- Publication number
- JP2021174330A JP2021174330A JP2020078810A JP2020078810A JP2021174330A JP 2021174330 A JP2021174330 A JP 2021174330A JP 2020078810 A JP2020078810 A JP 2020078810A JP 2020078810 A JP2020078810 A JP 2020078810A JP 2021174330 A JP2021174330 A JP 2021174330A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- bank
- new bank
- model
- predictor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
【課題】少ないデータセットでも精度良く銀行ローンのデフォルト率のような希少事象の確率を推定する銀行の予測システムを提供する。【解決手段】予測装置は、新規銀行のトレーニングデータから新規銀行予測モデルを学習するモデル学習部102と、新規銀行のバリデーションデータと第1既存銀行の第1予測モデルに基づき、第1予測結果を出力する第1予測器402aと、新規銀行のバリデーションデータと第2既存銀行の第2予測モデルに基づき、第2予測結果を出力する第2予測器402bと、新規銀行のバリデーションデータと新規銀行予測モデルに基づき、第3予測結果を出力する第3予測器402cと、第1〜第3の予測結果のアンサンブル結果がバリデーションデータの目的変数に近づくようにゲートアンサンブル重みを学習するゲートアンサンブル学習部531と、学習したゲートアンサンブル重み値を格納する記憶装置と、を有する。【選択図】図3
Description
本発明は、顧客の信用等に関する評価値を自動予測する技術に関するものである。特に、異種機械学習のアンサンブル学習による顧客の評価値を自動予測するための技術に関する。
金融機関では、顧客へのローンの審査を行う際に、顧客がローンの返済が不能となる、デフォルト(債務不履行)となる確率を予測し、貸付の可否の判断を行っている。こうした審査の判断をサポートするために、機械学習の技術により顧客がローン申込時に記入した情報を説明変数、デフォルトしたか否かを目標変数とした機械学習をもちいた予測システムの構築が行われている。デフォルトが希少事象であり、学習データが十分に揃わないため、銀行の違いによって予測精度が大きく異なる。複数の銀行をまとめたデータを用いても、説明変数の種類や特性が異なるため高い予測性能を得ることが難しい。機械学習の予測精度を向上させる技術として、特許文献1があげられる。
上記特許文献1では、機械学習において、予測精度が最も高い予測モデルを探索する技術を開示しているが、入力データが少ない場合の課題や別の学習データによる学習モデルを用いた学習結果をアンサンブルすることについては、触れられていない。
特に、金融機関では、顧客がローン返済不能な状態、デフォルトになる可能性を審査の段階で予測し、貸し出しの可否の判断を行っている。この判断をサポートするために、機械学習技術を用いて自動的に予測値を計算する試みが行われている。しかし、機械学習では大量の学習データが必要なため、特にデフォルト状態というレアケースを予測するためのデータが少ないため、高性能なモデルを学習するには、熟練SEによる調整が不可欠である。
また、一度作成したモデルが永久に使えるわけではなく、データの増加や顧客層の変化に応じて、定期的にメンテナンスが必要となる。
銀行毎に個別のモデルを作成し、銀行毎に予測を行うことや、データをマージして統合モデルを作成して予測を行うことが考えられる。
しかし、銀行毎にパラメータの定義が微妙に異なることや、学習のデータ数が少ないことから、個別モデルや統合モデルでは、予測性能が個々の銀行で異なり、特定の銀行で低い予測値がでることが予想される。銀行毎のモデルの調整は最小限にとどめ、SEの工数の増大を避けてN倍化を行うための技術が求められている。
さらに、新銀行が加わったときに、単純に新銀行のデータを加えた学習データを作成してモデルを学習すると、予測性能が落ちるケースが有る。これは、銀行によって顧客の特性が異なり、場合によっては目的変数に対する個々の説明変数の相関の符号が逆になる場合もあり、単純にデータを統合すると、情報が失われてしまうためである。
そこで、本発明の目的は、新規銀行の顧客のデフォルト予測を精度よく行うことができる予測装置を提供することにある。
上記課題を解決するため、新規銀行の顧客審査の結果を予測する予測装置の一態様は、前記新規銀行のトレーニングデータから新規銀行の新規銀行予測モデルを学習するモデル学習部と、前記新規銀行のバリデーションデータと第1既存銀行の第1予測モデルに基づき、第1予測結果を出力する第1予測器と、前記新規銀行のバリデーションデータと第2既存銀行の第2予測モデルに基づき、第2予測結果を出力する第2予測器と、前記新規銀行のバリデーションデータと前記新規銀行予測モデルに基づき、第3予測結果を出力する第3予測器と、を有する。さらに、前記第1、第2及び第3の予測結果のアンサンブル結果が前記バリデーションデータの目的変数に近づくようにゲートアンサンブル重みを学習するゲートアンサンブル学習部と、前記ゲートアンサンブル学習部により学習したゲートアンサンブル重み値を格納する記憶装置と、を有する。
本発明によれば、新規銀行の顧客のデフォルト予測が、新規銀行以外の既存の銀行のモデル情報を用いてアンサンブルすることにより、新規銀行のみのデータで作成したモデルのみを用いて予測する場合よりも、改善した予測結果を得ることができる。
以下、図面を参照しながら実施の形態を説明するが、実施例で部分変更によって実施できる形態は、各実施例内で変形例として記述する。また、以下の説明では、「テーブル」等の表現にて各種情報を説明することがあるが、各種情報は、テーブル以外のデータ構造で表現されていてもよい。また、データ構造に依存しないことを示すために「データ」と呼ぶことができる。
また、「プログラム」を主語として処理を説明する場合がある。そのプログラムは、処理部であるプロセッサ、例えば、MP(Micro Processor)やCPU(Central Processing Unit)によって実行され、定められた処理をするものである。なお、プロセッサは、適宜に記憶資源(例えばメモリ)及び通信インターフェース装置(例えば、通信ポート)を用いながら処理を行うため、処理の主語がプロセッサとされてもよい。プロセッサは、CPUの他に専用ハードウェアを有していてもよい。コンピュータプログラムは、プログラムソースから各コンピュータにインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバ又は記憶メディアなどで提供されるものであってもよい。
また、本実施例の図及び説明において同一部分には同一符号を付与しているが、本発明が本実施例に制限されることは無く、本発明の思想に合致するあらゆる応用例が本発明の技術的範囲に含まれる。また、特に限定しない限り、各構成要素は複数でも単数でも構わない。
<実施形態の概要>
予測装置は、銀行の顧客のデフォルト審査を、顧客の収入や借入額などの説明変数から、顧客が返済不能なデフォルト状態に陥るか否かの目的変数として予測する。予測装置は、あらかじめ過去の顧客の説明変数と目的変数からなるデータセットを用いて学習したモデルを、銀行毎に既存銀行モデルとして学習しておく。新規銀行の顧客に対する予測を、新規銀行のデータに対し、学習した新規銀行モデルと既存銀行モデルとをそれぞれ用いて、複数の予測結果を計算する。複数の予測結果に対し、ゲートアンサンブルでアンサンブルを行うことで、新規銀行モデルのみを用いた予測よりも予測精度を高めることを実現する。以下、新規銀行を新銀行と省略して記載することがある。
予測装置は、銀行の顧客のデフォルト審査を、顧客の収入や借入額などの説明変数から、顧客が返済不能なデフォルト状態に陥るか否かの目的変数として予測する。予測装置は、あらかじめ過去の顧客の説明変数と目的変数からなるデータセットを用いて学習したモデルを、銀行毎に既存銀行モデルとして学習しておく。新規銀行の顧客に対する予測を、新規銀行のデータに対し、学習した新規銀行モデルと既存銀行モデルとをそれぞれ用いて、複数の予測結果を計算する。複数の予測結果に対し、ゲートアンサンブルでアンサンブルを行うことで、新規銀行モデルのみを用いた予測よりも予測精度を高めることを実現する。以下、新規銀行を新銀行と省略して記載することがある。
また、時間とともに新たに入手できたデータ(新規銀行のデータ)をバリデーションデータに加え、ゲートアンサンブル重みの最適化を行う。これにより、追加データを用いてモデルのスクラッチからの再構築を行うことなく、運用中に予測精度を向上させることが可能な予測装置を実現する。
実施例1を、図1から図4、図8を用いて説明する。
図1は、実施例の異種機械学習のアンサンブル学習による予測装置10の構成例の一例を示すブロック図である。図1に示す予測装置10は、主記憶装置130、外部記憶装置1(110)、外部記憶装置2(120)、中央処理装置140、表示情報記憶装置150、表示制御装置160、表示装置170、入力装置180を有する。
外部記憶装置1(110)は、モデル学習プログラム102、予測プログラム402、ゲートアンサンブル重み学習プログラム531、A銀行予測モデル501、B銀行予測モデル502、新銀行予測モデル103、ゲートアンサンブル重み541を格納する領域を有する。尚、図1は、各部の名称を省略した形で記載している。たとえば、モデル学習プログラム102をモデル学習と対応がわかる範囲で省略して記載している。
モデル学習プログラム102は、トレーニングデータから予測モデルを学習するためのプログラムである。予測プログラム402は、予測モデルを用いてバリデーションデータから予測値を求めるためのプログラムである。本発明では、デフォルトの審査予測が目的変数となる。ゲートアンサンブル重み学習プログラム531は、複数の予測モデルとバリデーションデータから複数の予測結果を求め、複数の予測結果のアンサンブルの重み値を学習するためのプログラムである。
主記憶装置130は、外部記憶装置1(110)に格納されたプログラム(モデル学習プログラム102、予測プログラム402、ゲートアンサンブル重み学習プログラム531)が、実行時にロードされ、中央処置装置140によって実行される。これにより、モデル学習、予測、ゲートアンサンブル重み学習の各機能を実現する。
また、モデル学習、予測、ゲートアンサンブル重み学習実行時に必要となるデータ(A銀行予測モデル501、B銀行予測モデル502、新銀行予測モデル103、ゲートアンサンブル重み541)を、外部記憶装置1から主記憶装置130に読み出して処理する。
外部記憶装置2(120)には、A銀行トレーニングデータ121、A銀行バリデーションデータ122、B銀行トレーニングデータ123、B銀行バリデーションデータ124、新銀行トレーニングデータ101、新銀行バリデーションデータ510が格納されている。これらのデータについては、図2で説明する。
入力装置180は、キーボードおよびマウス等の入力装置である。
表示装置170は、ディスプレイ等の表示装置である。表示情報記憶装置150は、VRAM等の表示情報を記憶するメモリで、表示制御装置160は、表示装置170の表示を制御する表示駆動装置である。
表示装置170は、ディスプレイ等の表示装置である。表示情報記憶装置150は、VRAM等の表示情報を記憶するメモリで、表示制御装置160は、表示装置170の表示を制御する表示駆動装置である。
なお、中央処置装置140は、MP(Micro Processor)やCPU(Central Processing Unit)等によって構成され、主記憶装置130に格納されたプログラムを実行する。以下、中央処理装置を、単に処理部と呼ぶ。処理部140は、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等によって構成されても良い。
I/Oバス191、メモリバス192は、外部記憶装置1(110)、外部記憶装置2(120)、主記憶装置130、CPU140と、表示情報記憶装置150、表示制御装置160、表示装置170、入力装置180とを接続する接続装置である。
尚、図1には示していないが、外部記憶装置1(110)には、予測器の予測結果521、522、523(図3参照)や、ゲートアンサンブル重み541(図3参照)、ゲートアンサンブルを用いた予測結果641(図4参照)等を格納する。
尚、図1では、予測装置10を便宜上一台の計算機で構成される例を示したが、クラウド上の複数の計算機やクラウド上の複数の計算機のリソースを用いた仮想計算機によって構成されても良い。
図2は、実施例で扱う銀行データの一例を示す図である。
銀行データ200は、レコードを区別するためのkey201が振られ、それぞれのレコードには、目標変数obj202、説明変数として、たとえば自己資金203、融資実行金額204、担保評価額299などを含む。銀行データ200は、異なる銀行であっても、同種の説明変数を用いている場合が多く、共通する説明変数により、目的変数を求めるようにする。
銀行データ200は、レコードを区別するためのkey201が振られ、それぞれのレコードには、目標変数obj202、説明変数として、たとえば自己資金203、融資実行金額204、担保評価額299などを含む。銀行データ200は、異なる銀行であっても、同種の説明変数を用いている場合が多く、共通する説明変数により、目的変数を求めるようにする。
銀行データ200は、一般的な機械学習と同様、同一形式のトレーニングデータ、バリデーションデータ、テストデータの3つに分けられる。したがって、以下、銀行データは、その目的に応じて、トレーニングデータ、バリデーションデータ、テストデータとして説明する。
予測モデルは、深層学習で複数の層を有するネットワークで説明変数に対して重み付き和を各層で計算し、最後にロジスティック計算により、0〜1の予測値を得る。
図3は、実施例1の予測装置におけるゲートアンサンブル重みの計算処理の一例を示す図である。
図3において、既存の個別の銀行毎のモデル(既存銀行モデル)として、A銀行予測モデル501、B銀行予測モデル502が外部記憶装置1に格納されている。
図3において、既存の個別の銀行毎のモデル(既存銀行モデル)として、A銀行予測モデル501、B銀行予測モデル502が外部記憶装置1に格納されている。
新しく追加された銀行に対して、デフォルトの審査を行う場合には、モデル学習部102により、外部記憶装置120に格納された新規銀行のトレーニングデータを読み出し、読み出された新規銀行のトレーニングデータから新規銀行の予測モデルを作成し、作成した予測モデルを新銀行予測モデル103として外部記憶装置110に格納する。
予測器402a、402b、402cは、A銀行予測モデル501、B銀行予測モデル502、新銀行予測モデル103の各モデルを用いて、新規銀行のバリデーションデータ510の説明変数を読み出し、予測値を計算する。予測器402a、402b、402cが計算した予測値を、それぞれ予測結果521、522、523として、外部記憶装置110に格納する。
尚、予測結果521は、新銀行のバリデーションデータに対しA銀行予測モデルを用いて、予測器402aで予測した結果であり、予測結果522は、新銀行のバリデーションデータに対しB銀行予測モデルを用いて、予測器402bで予測した結果であり、予測結果523は、新銀行のバリデーションデータに対し新銀行予測モデルを用いて、予測器402cで予測した結果である。
ゲートアンサンブル重み学習部531は、外部記憶装置120のバリデーションデータ510から目的変数を取り出し、予測結果の重み付け平均との差が最小となるように、重みの最適値を計算し、ゲートアンサンブル重み541として外部記憶装置110に格納する。
以上のように、新銀行のバリデーションデータ510に対し、既存行であるA銀行とB銀行の予測モデル、即ち、新銀行とは異なる銀行の予測モデルを用いて、予測結果を得る。また、新銀行のバリデーションデータ510に対し、新銀行予測モデル103を用いて、予測結果を得る。そして、それぞれの予測モデルに基づいて得られた予測結果の重み付け平均と、バリデーションデータ510に格納されている目的変数との差が最小となるように、アンサンブル重みの最適値を計算する。
既存銀行の予測モデルを用いて計算し、各予測モデルに基づいた予測結果に対するアンサンブル重みを学習することで、データ数が少ない新規銀行の顧客のデフォルト予測を精度良く行うことができる。
図4において、実施例1のゲートアンサンブル重みを用いた予測値の計算処理の一例を示した図である。図4において、新銀行のデフォルト率の計算部分について説明する。
予測器402a、予測器402b、予測器402cは、テストデータ401から、デフォルト率を予測したい顧客の説明変数を読み出す。予測器402a、予測器402b、予測器402cは、A銀行予測モデル501、B銀行予測モデル502、新銀行予測モデル103のそれぞれを用いて、それぞれのモデルに対する予測値を計算する。それぞれの計算結果は、A銀行予測モデルを用いて予測器402aによって計算された予測結果521、B銀行予測モデルを用いて予測器402bによって計算された予測結果522、予測結果523は、新銀行予測モデルを用いて予測器402cによって計算された予測結果である。
予測器402a、予測器402b、予測器402cは、テストデータ401から、デフォルト率を予測したい顧客の説明変数を読み出す。予測器402a、予測器402b、予測器402cは、A銀行予測モデル501、B銀行予測モデル502、新銀行予測モデル103のそれぞれを用いて、それぞれのモデルに対する予測値を計算する。それぞれの計算結果は、A銀行予測モデルを用いて予測器402aによって計算された予測結果521、B銀行予測モデルを用いて予測器402bによって計算された予測結果522、予測結果523は、新銀行予測モデルを用いて予測器402cによって計算された予測結果である。
ゲートアンサンブル計算部631は、予測結果521、522、523に対し、ゲートアンサンブル重み541に格納された重み情報を用いて、重み付け平均を計算し、最終的な予測値を予測結果641として格納する。外部記憶装置110に格納された予測結果641は、表示制御装置160によって、表示装置170に表示される。
このように、従来は、別々の学習器として学習し、予測させたものを、多数決をとる方法で融合させる事によって、未学習のデータに対しての予測能力を向上させることができる。
新規銀行のバリデーションデータに対する予測値の一実施例を、図8に示す。図8では、同じkeyの値のレコードに対して、3つのモデルから得られた3つの予測値(1601、1602、1603)が得られる。
目的変数202の値は、keyの値が2003003、2003007の時が1でそれ以外は0となる。予測値1601では、key=2003007に対する予測値が0.4となり、予測値1602では、0.8となる。key=2003003に対する予測値1602は0.5で、予測値1601の予測値は0.7となる。key=2003003に対する、予測値1603は、0.55となり、予測値1602の0.5となる。これらの予測値に重み付け加算によるアンサンブリングを行う。まずは、ロジットをもとに戻す計算を、1605で行った後に、重み格納手段に格納された重み541との積を計算し、その後加算集計し、アンサンブル結果1604(スコア)を得る。アンサンブル結果1604は、目的変数202により近い値となる。
尚、実施例1では、既存銀行が、A銀行、B銀行の二行で説明したが、既存銀行が一行や三行以上の場合であっても、同様に適応可能である。
また、モデル学習予測プログラム102が処理部140によって、実行されることで、図3、図4に記載のモデル学習部102の機能を実現し、予測プログラム402を実行することで、予測器402a、402b、402cの機能を実現し、ゲートアンサンブル重み学習プログラムを実行することで、ゲートアンサンブル重み学習部531が実現される。
図5に実施例2を示す。図5は、実施例2のゲートアンサンブル重みの更新処理の一例を示すブロック図である。実施例2ではA銀行予測モデル501、B銀行予測モデル502、新銀行予測モデル格納部103に格納された学習済みの予測モデルと、バリデーションデータ510に加え、新規銀行追加データ702を用いて、ゲートアンサンブル重みの更新処理を行う。
新規銀行追加データ702についても、予測器を用いて予測を行う。それぞれの予測器の予測結果521、522、523を外部記憶装置110に格納する。
ゲートアンサンブル重み学習部531は、予測結果521、522、523と、バリデーションデータ510および新規銀行追加データ702を用いて、ゲートアンサンブル重みの最適値を計算し直し、ゲートアンサンブル重み541として格納する。
ここでも、外部記憶装置120のバリデーションデータ510から目的変数を取り出し、予測結果の重み付け平均との差が最小となるように、重みの最適値を計算する。
以上の通り、実施例2では、ゲートアンサンブル重みの計算にあたって、新規銀行の学習に利用できる追加データが加わった場合に、既存銀行モデル(A銀行予測モデル、B銀行予測モデル)は変更せずに、ゲートアンサンブル重みの最適化(ゲートアンサンブル重みの更新)を行う。ゲートアンサンブル重みの更新のみを行うことで、既存銀行モデル(A銀行予測モデル、B銀行予測モデル)の変更をすることなく、新規銀行のテストデータに対する予測精度を向上させることができる。この際、新銀行予測モデル103についても、既存銀行モデルと同様、変更することなく用いることができる。
図3に示された、ゲートアンサンブル重み学習処理と、図5のゲートアンサンブル重みの更新処理を比較すると、ゲートアンサンブル重み学習部531がバリデーションデータ510、新規銀行追加データ702を参照する点が異なり、その他のブロックは共通である。
新規銀行について、データ量が増え、ゲートアンサンブル重みの最適化のための新規銀行追加データ702が利用可能となった場合、一度作成した予測モデルを用いつつ、新規銀行追加データ702を用いて、ゲートアンサンブル重みを更新することで、複数の予測モデルをアンサンブルすることによって得られる予測精度を向上させることができる。
実施例2においても、既存銀行の数は二行以外の場合であっても、同様に適応可能である。
図6、図7に実施例3を示す。
実施例3は、新規銀行のトレーニングデータを用いることなく、ゲートアンサンブル重み学習を行う処理の一例を示す。図6に示したブロック図では、新規銀行の予測をおこなう際に、複数の既存銀行のモデルのみを用いて、新規銀行のデータから学習したモデルは作成しない。複数の既存銀行のモデルの予測結果の重み付け平均による予測結果と実際のデフォルトの目的変数の誤差が最小となるように、ゲートアンサンブル重み学習を行うゲートアンサンブル重みの計算を行う。
ゲートアンサンブル重み学習部831は、既存の銀行の予測モデル(A銀行予測モデル501、B銀行予測モデル502、C銀行予測モデル803)を用いて、ゲートアンサンブル重みを学習し、ゲートアンサンブル重み841を格納する。
図7に示すように、予測時には、ゲートアンサンブル計算部631は、既存の銀行のモデルによる予測結果をゲートアンサンブル重み841に格納された重みを用いて、最終予測値を計算し、予測結果941として外部記憶装置110に格納する。外部記憶装置110に格納された予測結果941は、表示制御装置160によって、表示装置170に表示される。
この実施例は、新規の銀行のデータのみでは、学習用データが不足しているケースにおいて、既存銀行の予測モデルを用いて、新規銀行のデフォルト審査の予測に有効である。
実施例3においても、既存銀行の数は二行以外の場合であっても、同様に適応可能である。
以上、上記実施例によれば、新規銀行の顧客のデフォルト予測が、新規銀行以外の既存の銀行のモデル情報を用いてアンサンブルすることにより、新規銀行のデータで作成したモデルのみを用いる場合よりも、改善した予測結果を得ることができる。
また、上記実施例によれば、運用中に新たに得られるデータを用いて、アンサンブルを行う際の重みパラメータのみを更新することで、予測値の精度を向上させることができる。この場合、予測モデルをゼロから作り直すことなく、予測精度の向上を少ないコストで実現することができる。
また、上記実施例によれば、新規銀行以外の既存の銀行のモデル情報を用いて新規銀行の顧客のデフォルトを予測できるので、データ量が少ない新規銀行の顧客について、高い精度の予測を得ることができる。
10 :予測装置
101:新規銀行トレーニングデータ
102:モデル学習部
103:新規銀行予測モデル
110:外部記憶装置1
130:主記憶装置
140:中央処理装置
170:表示装置
200:銀行データ
180:入力装置
201:テストデータ格納部
402:予測器
521:予測結果(A銀行予測モデル)
522:予測結果(B銀行予測モデル)
523:予測結果(新規銀行予測モデル)
531:ゲートアンサンブル重み学習器
541:ゲートアンサンブル重み
101:新規銀行トレーニングデータ
102:モデル学習部
103:新規銀行予測モデル
110:外部記憶装置1
130:主記憶装置
140:中央処理装置
170:表示装置
200:銀行データ
180:入力装置
201:テストデータ格納部
402:予測器
521:予測結果(A銀行予測モデル)
522:予測結果(B銀行予測モデル)
523:予測結果(新規銀行予測モデル)
531:ゲートアンサンブル重み学習器
541:ゲートアンサンブル重み
Claims (7)
- 新規銀行の顧客審査の結果を予測する予測装置において、
前記新規銀行のトレーニングデータから新規銀行の新規銀行予測モデルを学習するモデル学習部と、
前記新規銀行のバリデーションデータと第1既存銀行の第1予測モデルに基づき、第1予測結果を出力する第1予測器と、
前記新規銀行のバリデーションデータと第2既存銀行の第2予測モデルに基づき、第2予測結果を出力する第2予測器と、
前記新規銀行のバリデーションデータと前記新規銀行予測モデルに基づき、第3予測結果を出力する第3予測器と、
前記第1、第2及び第3の予測結果のアンサンブル結果が前記バリデーションデータの目的変数に近づくようにゲートアンサンブル重みを学習するゲートアンサンブル学習部と、
前記ゲートアンサンブル学習部により学習したゲートアンサンブル重み値を格納する記憶装置と、を有することを特徴とする予測装置。 - 請求項1に記載の予測装置において、
前記ゲートアンサンブル学習部は、
前記第1予測結果、前記第2予測結果、及び前記第3予測結果の重み付け平均と、前記バリデーションデータの目的変数との誤差が最小となるようなゲーティング重みを計算する、ことを特徴とする予測装置。 - 請求項2に記載の予測装置において、
前記第1予測器は、前記第1予測モデルと、前記新規銀行のテストデータから第4予測値を出力し、
前記第2予測器は、前記第2予測モデルと、前記新規銀行のテストデータから第5予測値を出力し、
前記第3予測器は、前記新規銀行予測モデルと、前記新規銀行のテストデータから第6予測値を出力し、
前記第4予測値、前記第5予測値、及び前記第6予測値と、前記記憶装置に格納されたゲートアンサンブル重み値に基づいて、最終予測結果を出力するゲートアンサンブル計算部と、
前記記憶装置は、前記ゲートアンサンブル計算部の最終予測結果を格納する、ことを特徴とする予測装置。 - 請求項3に記載の予測装置において、
前記新規銀行のデータが追加された場合、
前記第1予測器は、前記新規銀行のバリデーションデータ及び前記新規銀行の追加データと前記第1予測モデルに基づき、第7予測結果を出力し、
前記第2予測器は、前記新規銀行のバリデーションデータ及び前記新規銀行の追加データと前記第2予測モデルに基づき、第8予測結果を出力し、
前記第3予測器は、前記新規銀行のバリデーションデータ及び前記新規銀行の追加データと前記新規銀行予測モデルに基づき、第9予測結果を出力し、
前記ゲートアンサンブル学習部は、
前記第7、第8及び第9予測結果に基づいて、前記ゲートアンサンブル重みの値を更新する、ことを特徴とする予測装置。 - 新規銀行の顧客審査の結果を予測する予測装置において、
前記新規銀行のバリデーションデータと第1既存銀行の第1予測モデルに基づき、第1予測結果を出力する第1予測器と、
前記新規銀行のバリデーションデータと第2既存銀行の第2予測モデルに基づき、第2予測結果を出力する第2予測器と、
前記新規銀行のバリデーションデータと第3既存銀行の第3予測モデルに基づき、第10予測結果を出力する第3予測器と、
前記第1、第2及び第10予測結果のアンサンブル結果が前記バリデーションデータの目的変数に近づくようにゲートアンサンブル重みを学習するゲートアンサンブル学習部と、
前記ゲートアンサンブル学習部により学習したゲートアンサンブル重み値を格納する記憶装置と、を有することを特徴とする予測装置。 - 請求項5に記載の予測装置において、
前記ゲートアンサンブル学習部は、
前記第1予測結果、前記第2予測結果、及び前記第10予測結果の重み付け平均と、前記バリデーションデータの目的変数との誤差が最小となるようなゲーティング重みを計算する、ことを特徴とする予測装置。 - 請求項6に記載の予測装置において、
前記第1予測器は、前記第1予測モデルと、前記新規銀行のテストデータから第4予測値を出力し、
前記第2予測器は、前記第2予測モデルと、前記新規銀行のテストデータから第5予測値を出力し、
前記第3予測器は、前記第3予測モデルと、前記新規銀行のテストデータから第11予測値を出力し、
前記第4予測値、前記第5予測値、及び前記第11予測値と、前記記憶装置に格納されたゲートアンサンブル重み値に基づいて、最終予測結果を出力するゲートアンサンブル計算部と、
前記記憶装置は、前記ゲートアンサンブル計算部の最終予測結果を格納する、ことを特徴とする予測装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020078810A JP2021174330A (ja) | 2020-04-28 | 2020-04-28 | 異種機械学習のアンサンブル学習による予測装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020078810A JP2021174330A (ja) | 2020-04-28 | 2020-04-28 | 異種機械学習のアンサンブル学習による予測装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021174330A true JP2021174330A (ja) | 2021-11-01 |
Family
ID=78279826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020078810A Pending JP2021174330A (ja) | 2020-04-28 | 2020-04-28 | 異種機械学習のアンサンブル学習による予測装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021174330A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023096804A (ja) * | 2021-12-27 | 2023-07-07 | データ・フォアビジョン株式会社 | 評価支援システム及び評価支援プログラム |
-
2020
- 2020-04-28 JP JP2020078810A patent/JP2021174330A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023096804A (ja) * | 2021-12-27 | 2023-07-07 | データ・フォアビジョン株式会社 | 評価支援システム及び評価支援プログラム |
JP7452801B2 (ja) | 2021-12-27 | 2024-03-19 | データ・フォアビジョン株式会社 | 評価支援システム及び評価支援プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Alaka et al. | A big data analytics approach for construction firms failure prediction models | |
CN107220217A (zh) | 基于逻辑回归的特征系数训练方法和装置 | |
CN112270545A (zh) | 基于迁移样本筛选的金融风险预测方法、装置和电子设备 | |
JP6414363B2 (ja) | 予測システム、方法およびプログラム | |
CN112508580A (zh) | 基于拒绝推断方法的模型构建方法、装置和电子设备 | |
CN111080338B (zh) | 用户数据的处理方法、装置、电子设备及存储介质 | |
CN107316082A (zh) | 用于确定机器学习样本的特征重要性的方法及系统 | |
CN111125529A (zh) | 产品匹配方法、装置、计算机设备及存储介质 | |
JP2016099915A (ja) | 与信審査用サーバと与信審査用システム及び与信審査用プログラム | |
US20200050982A1 (en) | Method and System for Predictive Modeling for Dynamically Scheduling Resource Allocation | |
CN112785005A (zh) | 多目标任务的辅助决策方法、装置、计算机设备及介质 | |
Rath et al. | Modern approach for loan sanctioning in banks using machine learning | |
CN111209930A (zh) | 一种生成授信策略的方法、装置和电子设备 | |
US20140344020A1 (en) | Competitor pricing strategy determination | |
JP2021174330A (ja) | 異種機械学習のアンサンブル学習による予測装置 | |
Tasgetiren et al. | On the distributed software architecture of a data analysis workflow: A case study | |
Liefooghe et al. | Dominance, indicator and decomposition based search for multi-objective QAP: landscape analysis and automated algorithm selection | |
CN113298121A (zh) | 基于多数据源建模的消息发送方法、装置和电子设备 | |
CN111160733A (zh) | 一种基于有偏样本的风险控制方法、装置及电子设备 | |
JP2002279174A (ja) | 信用リスク評価方法及びシステム | |
US20230385936A1 (en) | Information processing device, information processing method, and program | |
CN113298120B (zh) | 基于融合模型的用户风险预测方法、系统和计算机设备 | |
US20140344022A1 (en) | Competitor response model based pricing tool | |
US20140344021A1 (en) | Reactive competitor price determination using a competitor response model | |
Pang et al. | Wt model & applications in loan platform customer default prediction based on decision tree algorithms |