JP2020187441A - モデル提供プログラム、モデル提供方法及びモデル提供装置 - Google Patents

モデル提供プログラム、モデル提供方法及びモデル提供装置 Download PDF

Info

Publication number
JP2020187441A
JP2020187441A JP2019090172A JP2019090172A JP2020187441A JP 2020187441 A JP2020187441 A JP 2020187441A JP 2019090172 A JP2019090172 A JP 2019090172A JP 2019090172 A JP2019090172 A JP 2019090172A JP 2020187441 A JP2020187441 A JP 2020187441A
Authority
JP
Japan
Prior art keywords
model
monitoring
examination
unit
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019090172A
Other languages
English (en)
Other versions
JP7298286B2 (ja
Inventor
琢馬 奥田
Takuma Okuda
琢馬 奥田
聡史 谷
Satoshi Tani
聡史 谷
真帆 家田
Maho Ieda
真帆 家田
正信 佐々木
Masanobu Sasaki
正信 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019090172A priority Critical patent/JP7298286B2/ja
Publication of JP2020187441A publication Critical patent/JP2020187441A/ja
Application granted granted Critical
Publication of JP7298286B2 publication Critical patent/JP7298286B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

【課題】審査時点からのタイムラグが小さい教師データを用いたモデル学習を実現できるモデル提供装置を提供する。【解決手段】モデル提供装置において、モデル実行部15Aは、記憶部13に記憶されたモデルデータ13Aに従ってスコアリングを実行する。第1モニタリング部15Bは、スコアリングが行われた審査の件数が所定の閾値に達した場合、学習部15Fへ再学習を指示する。取得部15Cは、各審査対象者の銀行取引履歴が取得する。第2モニタリング部15Dは、取得した銀行取引履歴から、第2の監視項目ごとに審査対象者全体における第2の監視項目の集計値を算出する。生成部15Eは、集計値が所定の第2の監視条件を満たすデータに対し、ラベルを付与した擬似教師データ14Aを生成する。学習部15Fは、再学習の指示があると、擬似教師データ14Aを含む教師データ14により再学習を行い、モデルデータ13Aの更新を行う。【選択図】図1

Description

本発明は、モデル提供プログラム、モデル提供方法及びモデル提供装置に関する。
機械学習等により学習されたモデルが各種の審査に利用されている。例えば、金融業界を例に挙げれば、取引先の信用力を点数化するスコアリングモデルが融資や与信等の審査に用いられる。
特開2006−164257号公報
しかしながら、上記の技術では、審査が行われてから審査の成否が判明するまでモデルの教師データに付与するラベルが定まらないので、審査時点からのタイムラグが大きい教師データがモデルの学習に用いられる場合がある。
1つの側面では、本発明は、審査時点からのタイムラグが小さい教師データを用いたモデル学習を実現できるモデル提供プログラム、モデル提供方法及びモデル提供装置を提供することを目的とする。
一態様では、モデル提供プログラムは、融資の審査対象者の取引履歴を取得し、前記融資の審査に用いるモデルへの入力データのうち前記審査対象者に対応する入力データに、前記審査対象者の取引履歴が所定の監視条件に該当するか否かに基づくラベルが付与された擬似教師データを生成し、前記擬似教師データを用いて前記モデルを学習する、処理をコンピュータに実行させる。
審査時点からのタイムラグが小さい教師データを用いたモデル学習を実現できる。
図1は、実施例1に係るモデル提供装置の機能的構成の一例を示すブロック図である。 図2Aは、ラベルの付与方法の一例を示す図である。 図2Bは、ラベルの付与方法の一例を示す図である。 図2Cは、ラベルの付与方法の一例を示す図である。 図3は、第1の再学習条件の設定例を示す図である。 図4は、第2の監視項目の一例を示す図である。 図5は、第2の監視項目のモニタリング方法の一例を示す図である。 図6Aは、第2の監視項目のモニタリング方法の他の一例を示す図である。 図6Bは、第2の監視項目のモニタリング方法の他の一例を示す図である。 図7は、サンプル項目の一例を示す図である。 図8は、サンプル項目の他の一例を示す図である。 図9は、実施例1に係る第1モニタリング処理の手順を示すフローチャートである。 図10は、実施例1に係る第2モニタリング処理の手順を示すフローチャートである。 図11は、実施例1に係る擬似教師データの生成処理の手順を示すフローチャートである。 図12は、実施例1に係る再学習処理の手順を示すフローチャートである。 図13は、データセットの分割方法の一例を示す図である。 図14Aは、評価指標値の一例を示す図である。 図14Bは、評価指標値の一例を示す図である。 図14Cは、評価指標値の一例を示す図である。 図14Dは、評価指標値の一例を示す図である。 図14Eは、評価指標値の一例を示す図である。 図15は、コンピュータのハードウェア構成例を示す図である。
以下に添付図面を参照して本願に係るモデル提供プログラム、モデル提供方法及びモデル提供装置について説明する。なお、この実施例は開示の技術を限定するものではない。そして、各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
[システム構成]
図1は、実施例1に係るモデル提供装置10の機能的構成の一例を示すブロック図である。図1に示すモデル提供装置10は、各種の審査に利用するモデルに関する各種の機能を提供するモデル提供機能を有するものである。
ここで、本実施例では、ユースケースのあくまで一例として、融資の申込情報を入力として融資の審査対象者の信用力が点数化されたスコアを出力するスコアリングモデルに関する機能、例えば学習や適用、監視等を提供する例を挙げる。なお、融資の申込情報は、スコアリングモデルへ入力する入力データのあくまで一例であり、他の任意のデータ、例えば財務諸表などであってもかまわない。
モデル提供装置10は、上記のモデル提供機能を動作させる基盤となるプラットフォームの一例である。
一実施形態として、モデル提供装置10は、パッケージソフトウェア又はオンラインソフトウェアとして、上記のモデル提供機能を実現するモデル提供プログラムを任意のコンピュータにインストールさせることによって実装できる。例えば、モデル提供装置10は、SaaS(Software as a Service)型のアプリケーションとして実装することで、上記のモデル提供機能をクラウドサービスとして提供することとしてもかまわない。これに限定されず、モデル提供装置10は、上記のモデル提供機能をオンプレミスに提供するサーバとして実装することができる。この場合、モデル提供装置10は、融資システム30の一部に組み込まれることとしてもかまわない。
図1に示すように、モデル提供装置10には、融資システム30が接続され得る。これらモデル提供装置10及び融資システム30の間は、任意のネットワークNWを介して通信可能に接続され得る。例えば、ネットワークNWは、有線または無線を問わず、インターネットやLAN(Local Area Network)などの任意の種類の通信網であってかまわない。なお、図1には、説明の便宜上、1つのモデル提供装置10につき1つの融資システム30が接続される例を挙げたが、1つのモデル提供装置10につき複数の融資システム30が接続されることを妨げない。
融資システム30は、融資業務に関する各種の機能を動作させる基盤となるプラットフォームの一例である。このような融資業務に関する機能の例として、顧客管理や融資管理、商品管理、契約管理、各種取引、延滞督促などのバックエンドの機能がパッケージで提供される。この他にも、融資システム30は、図示しないエンドユーザの端末から融資の申込情報を受け付けるポータルなどのフロントエンドの機能も有することができる。また、融資システム30は、上記の融資管理機能の一環として、上記のモデル提供機能を呼び出すAPI(Application Programming Interface)に従ってスコアリングのリクエストをモデル提供装置10へ行うことができる。この結果として得られたスコアを用いて、融資システム30は、融資の審査を支援することができる。例えば、融資システム30は、スコアの閾値判定等によって融資の審査を自動化することもできれば、金融機関の審査の担当者により使用される端末装置等にスコア又はスコアに基づくレコメンドの出力、例えば表示、音声又は印字などを行うことができる。
[課題の一側面]
上記の背景技術の欄で説明した通り、従来では、審査が行われてから審査の成否が判明するまでモデルの教師データに付与するラベルが定まらないので、審査時点からのタイムラグが大きい教師データがモデルの学習に用いられる場合がある。
あくまで一例として、融資審査を例に挙げれば、審査の結果、融資をしてよい審査対象者だと判断したとして、実際に融資した後にその審査対象者が完済したか、あるいは貸し倒れしたかの審査の成否が確定するまでには年単位の期間を要する場合がある。この場合、審査が行われてから年単位の期間が経過してからラベルが付与された教師データがモデルの学習に用いられることもある。
しかしながら、スコアリングモデルの精度は、市場トレンドなど外部環境に起因して変化する。例えば、審査時点からモデル学習の時点までのタイムラグが大きくなるほど、そのタイムラグの間に景気の不況又は好況を引き起こすイベントが発生する可能性が高まり、さらには、イベントが発生する回数が多くなる可能性が高まる。この場合、審査時とモデル学習時との間で市場トレンドに連続性がなくなるので、スコアリングモデルの精度が低下することがある。特に、個人事業主や零細企業等に行われる小口の融資審査にスコアリングモデルが用いられる場合、大口の融資が行われる取引先に比べて短期の市場トレンドの影響を受けやすい分、スコアリングモデルの精度への影響も大きい。
このような精度面の課題の他にも、上記のタイムラグが一因となって学習に十分な数の教師データが集まるまでに時間が掛かるので、再学習が実施可能となるまでのインターバルが長期化するという側面もある。
[課題解決のアプローチの一側面]
そこで、本実施例に係るモデル提供装置10は、審査に用いるスコアリングモデルに入力された入力データに対応する審査対象者の取引履歴が監視条件に該当するか否かに応じてみなしラベルが入力データに付与された擬似教師データを生成してモデル学習を行う。このような監視条件には、あくまで一例として、貸し倒れが発生するリスク、あるいは信用を毀損するリスクと関連性がある返済記録、いわゆる金融事故に関する条件を用いることができる。
図2A〜図2Cは、ラベルの付与方法の一例を示す図である。図2Aには、従来技術によるラベルの付与方法が示される一方で、図2B及び図2Cには、本実施例によるラベルの付与方法が示されている。さらに、図2A〜図2Cには、融資の申込から返済完了までの時間経過が左方向から右方向へ向けて示されている。さらに、図2A〜図2Cでは、教師データが網掛け無しで示される一方で、擬似教師データが網掛け有りで示されている。
図2Aに示すように、従来技術では、融資の申込から審査を経て融資の返済期間が終了するまで教師データに付与するラベルを決定する術がないので、融資の返済期間終了後に融資の完済又は貸し倒れが確定するまでラベルの決定を保留せざるを得ない。このため、融資の完済又は貸し倒れが確定してはじめて教師データに付与するラベルが定められる。このように、融資の完済又は貸し倒れが確定した段階で付与されるラベルのことを以下、「確定ラベル」と記載する場合がある。一方、図2B及び図2Cに示すように、本実施例では、融資の返済期間が終了するよりも前のタイミングでみなしラベルが付与される。詳細は後述するが、スコアリングモデルへ入力された入力データのうち、審査対象者の取引履歴が監視条件に該当しない入力データには、図2Bに示すように、正例「完済」のみなしラベルが付与される。一方、スコアリングモデルへ入力された入力データのうち、審査対象者の取引履歴が監視条件に該当する入力データには、図2Cに示すように、負例「貸し倒れ」のみなしラベルが付与される。図2A〜図2Cに示す通り、確定ラベルが付与される教師データよりも、みなしラベルが付与される擬似教師データの方が審査時点からのタイムラグを抑えることができるのが明らかである。
このように、本実施例に係るモデル提供装置10は、必ずしも返済が完了するか、あるいは貸し倒れが起こるかにより審査の成否が確定するまで、教師データに付与するラベルの決定を保留しない。つまり、本実施例に係るモデル提供装置10は、審査対象者の取引履歴が監視条件に抵触するか否かにより、審査の成否が確定する前にみなしラベルを付与して擬似教師データを生成する。このような擬似教師データの生成によって、審査の成否が確定するまで教師データの生成を待たずともよい分、審査時点からモデル学習の時点までのタイムラグを抑えることができる。
したがって、本実施例に係るモデル提供装置10によれば、審査時点からのタイムラグが小さい教師データを用いたモデル学習を実現することが可能になる。
[モデル提供装置10の構成]
次に、本実施例に係るモデル提供装置10の機能的構成の一例について説明する。図1に示すように、モデル提供装置10は、通信インタフェイス11と、記憶部13と、制御部15とを有する。なお、図1には、データの授受の関係を表す実線が示されているが、説明の便宜上、最小限の部分について示されているに過ぎない。すなわち、各処理部に関するデータの入出力は、図示の例に限定されず、図示以外のデータの入出力、例えば処理部及び処理部の間、処理部及びデータの間、並びに、処理部及び外部装置の間のデータの入出力が行われることとしてもかまわない。
通信インタフェイス11は、他の装置、例えば融資システム30との間で通信制御を行うインタフェイスである。
あくまで一例として、通信インタフェイス11には、LANカードなどのネットワークインタフェイスカードを採用することができる。例えば、通信インタフェイス11は、融資システム30からスコアリングのリクエストや審査対象者の取引履歴などを受け付けたり、審査対象者の信用力がスコアリングされたスコアを融資システム30へ出力したりする。
記憶部13は、制御部15で実行されるOS(Operating System)を始め、上記のモデル提供プログラムなどの各種プログラムに用いられるデータを記憶する機能部である。
あくまで一例として、記憶部13は、モデル提供装置10における補助記憶装置に対応する。例えば、HDD(Hard Disk Drive)、光ディスクやSSD(Solid State Drive)などが補助記憶装置に対応する。この他、EPROM(Erasable Programmable Read Only Memory)などのフラッシュメモリも補助記憶装置に対応する。
記憶部13は、制御部15で実行されるプログラムに用いられるデータの一例として、モデルデータ13Aと、審査データ13Bと、教師データ14とを記憶する。これらのデータ以外にも、上記のモデル提供プログラムによって参照または生成が行われるデータ、例えばモデルの学習アルゴリズムや学習後のモデルの評価アルゴリズムなどが記憶部13に記憶されることとしてもかまわない。なお、モデルデータ13A、審査データ13B及び教師データ14の説明は、各データの参照または生成が行われる制御部15の説明と合わせて行うこととする。
制御部15は、モデル提供装置10の全体制御を行う機能部である。
一実施形態として、制御部15は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などのハードウェアプロセッサにより実装することができる。ここでは、プロセッサの一例として、CPUやMPUを例示したが、汎用型および特化型を問わず、任意のプロセッサにより実装することができる。この他、制御部15は、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などのハードワイヤードロジックによって実現されることとしてもかまわない。
制御部15は、上記のモデル提供プログラムを実行することにより、図示しない主記憶装置として実装されるDRAM(Dynamic Random Access Memory)などのRAMのワークエリア上に図1に示す処理部を仮想的に実現する。なお、図1には、あくまで一例として、融資システム30が上記のモデル提供機能をAPIで呼び出すプログラムモジュールとして上記のモデル提供プログラムが実装される例を挙げたが、これに限定されない。例えば、上記のモデル提供機能は、融資システム30で動作する融資業務に関する各種の機能とパッケージ化されることとしてもよい。
例えば、制御部15は、図1に示すように、モデル実行部15Aと、第1モニタリング部15Bと、取得部15Cと、第2モニタリング部15Dと、生成部15Eと、学習部15Fとを有する。
モデル実行部15Aは、審査に用いるモデルを実行する処理部である。
一実施形態として、モデル実行部15Aは、記憶部13に記憶されたモデルデータ13Aに従ってスコアリングモデルを実行する。このようにスコアリングモデルが実行された環境の下、モデル実行部15Aは、融資システム30からスコアリングのリクエストを受け付けた場合、当該リクエストで受け付けた融資の申込情報をスコアリングモデルへ入力する。そして、モデル実行部15Aは、スコアリングモデルにより出力されたスコアを融資システム30へ応答する。また、モデル実行部15Aは、スコアリングモデルへ入力された融資の申込情報に対応する審査対象者の識別情報に融資の申込情報やスコア、スコアに基づく融資審査の結果などが対応付けられたレコードを記憶部13の審査データ13Bへ追加登録する。
なお、記憶部13に記憶されるモデルデータ13Aが学習部15Fの再学習によって更新された場合、モデル実行部15Aは、更新後のモデルデータ13Aに従ってスコアリングモデルを再実行することで、最新のスコアリングモデルを適用する。このように最新のスコアリングモデルが適用された場合、モデル実行部15Aは、記憶部13に記憶された審査データ13Bをリセットすることもできる。
第1モニタリング部15Bは、第1の監視項目を監視する処理部である。
一実施形態として、第1モニタリング部15Bは、スコアリングモデルによってスコアリングが行われた審査の件数やスコアリングモデルが適用されている期間、スコアの統計値などを第1の監視項目として監視する。このような第1の監視項目をモニタリングすることにより、学習部15Fによる再学習を実行するか否かが判断される。
図3は、第1の監視項目の一例を示す図である。例えば、図3に示す第1の監視項目を監視する場合、第1モニタリング部15Bは、次のように動作する。すなわち、第1モニタリング部15Bは、スコアリングモデルによりスコアリングが行われた場合、スコアリングモデルによってスコアリングが行われた審査の件数が所定の閾値Th11、図示の例では1000件に達したか否かを判定する。このとき、審査の件数が1000件に達した場合、第1モニタリング部15Bは、スコアリングモデルの再学習を学習部15Fへ指示する。また、第1モニタリング部15Bは、スコアリングモデルが適用されている期間が所定の閾値Th12、図示の例では30日間に達したか否かを判定する。このとき、スコアリングモデルが適用されている期間が30日間に達した場合、第1モニタリング部15Bは、スコアリングモデルの再学習を学習部15Fへ指示する。
また、第1モニタリング部15Bは、スコアリングモデルによりスコアリングが行われた場合、スコアの4種の統計値と、所定の閾値Th13〜Th16とを比較する。ここでは、図3に示す閾値Th13〜Th16は、あくまで一例として、スコアリングモデルが審査対象者の信用力を0〜1000の範囲の点数にスコアリングする前提の下で設定されたものであることとする。すなわち、第1モニタリング部15Bは、スコアの最大値が500以下であるか否か、スコアの最小値が700以上であるか否か、スコアの平均値が500以下または800以上であるか否か、さらには、スコアの中央値が500以下または800以上であるか否かを判定する。このとき、スコアの最大値が500以下である場合、スコアの最小値が700以上である場合、あるいはスコアの平均値または中央値が500以下または800以上である場合、第1モニタリング部15Bは、スコアリングモデルの再学習を学習部15Fへ指示する。
取得部15Cは、各種の取引履歴を取得する処理部である。以下では、取引履歴のあくまで一例として、銀行取引履歴を例に挙げるが、審査対象者の他の取引履歴、例えば商取引や購買履歴、通信履歴などが取得されることとしてもかまわない。
一実施形態として、取得部15Cは、所定のタイミング、例えば月次で、記憶部13に記憶された審査データ13Bに含まれる審査対象者ごとに、当該審査対象者に関する銀行取引履歴を融資システム30から取得する。このとき、取得部15Cは、当月に対応する1ヶ月分の銀行取引履歴を取得することとしてもよいし、前月以前の所定月分の銀行取引履歴を取得することとしてもかまわない。ここで言う「銀行取引履歴」とは、融資システム30に対応する金融機関と審査対象者との間における取引の履歴全般を指す。例えば、審査対象者が融資システム30に対応する金融機関で開設した口座における残高や入出金の記録の他、貸し倒れが発生するリスク、あるいは信用を毀損するリスクと関連性がある返済記録、いわゆる金融事故情報も含まれ得る。
第2モニタリング部15Dは、第2の監視項目を監視する処理部である。第2モニタリング部15Dは、監視部の一例に対応する。
一実施形態として、第2モニタリング部15Dは、第2の監視項目ごとに、取得部15Cにより審査対象者ごとに取得された銀行取引履歴を用いて、当該第2の監視項目に対応する数値情報が審査対象者全体で集計された集計値を算出する。このような第2の監視項目ごとに審査対象者全体の集計値をモニタリングすることにより、学習部15Fによる再学習を実行するか否かが判断される。
図4は、第2の監視項目の一例を示す図である。図4には、第2の監視項目の一例として、貸し倒れが発生するリスク、あるいは信用が毀損されたリスクと関連性がある返済記録、例えば金融事故やそれに類する項目が例示されている。図4に示すように、第2の監視項目には、「延滞日数」、「延滞回数」、「延滞金額」、「延滞利息金」、「架電回数」、「文書発送件数」、「通話不能回数」、「支払督促回数」および「貸倒件数」などが挙げられる。
ここで、「延滞日数」とは、返済が遅延した日数を指す。また、「延滞回数」とは、返済日に未返済となった回数を指す。また、「延滞金額」とは、返済日に未返済となった金額(元金+利息)を指す。また、「延滞利息金」とは、返済日に未返済となったことで発生する延滞利息金額(延滞利息)を指す。また、「架電回数」とは、延滞通知や督促通知、会社存在確認等で金融機関から顧客へ電話連絡が行われた回数を指す。また、「文書発送件数」とは、延滞通知や督促通知、会社存在確認等で金融機関から顧客へ文書発送が行われた回数を指す。また、「通話不能回数」とは、顧客へ電話した際、通話不能となった回数(留守電を除く)を指す。また、「支払督促回数」とは、延滞した債務の履行を請求した回数を指す。また、「貸倒件数」とは、融資金額、利息が回収不能となった件数を指す。
これら第2の監視項目ごとに集計値が算出される。例えば、「延滞回数」を例に挙げれば、第2モニタリング部15Dは、審査対象者ごとに当該審査対象者の銀行取引履歴から、審査対象者および金融機関の間で定められた返済日、図示の例では月次の指定日ごとに、融資に対する返済記録を検索する。そして、第2モニタリング部15Dは、審査対象者ごとに返済日に対する返済記録がヒットしなかった件数、あるいは返済記録がヒットしたが返済日以降に返済された返済記録の件数を延滞回数として集計する。その上で、第2モニタリング部15Dは、審査対象者ごとに集計された延滞回数をさらに集計することにより、審査対象者全体における延滞回数を算出する。なお、審査対象者全体における延滞回数は、当月、前月、前々月などといった月次の単位で集計することができるのは言うまでもない。
なお、ここでは、銀行取引履歴から第2の監視項目の集計値を算出する例を挙げたが、銀行取引履歴に審査対象者の延滞回数が記録されている場合、審査対象者個別の延滞回数を合計することとすればよい。また、ここでは、第2の監視項目の一例として、「延滞回数」を例に挙げたが、他の第2の監視項目についても同様にして集計値を算出することができる。
このように第2の監視項目ごとに審査対象者全体の集計値が算出された後、第2モニタリング部15Dは、第2の監視項目ごとに審査対象者全体の集計値が所定の条件を満たすかを判定する。そして、いずれかの第2の監視項目で集計値が所定の条件を満たす場合、第2モニタリング部15Dは、スコアリングモデルの再学習を学習部15Fへ指示する。
(1)当月監視
1つの側面として、第2モニタリング部15Dは、第2の監視項目のモニタリングの期間を「当月」として、第2の監視項目をモニタリングすることができる。例えば、第2モニタリング部15Dは、第2の監視項目ごとに当月における審査対象者全体の集計値が所定の閾値、例えば図4に示す閾値Th21〜Th29以上であるか否かを判定する。そして、いずれかの第2の監視項目で審査対象者全体の集計値が閾値以上である場合、第2モニタリング部15Dは、スコアリングモデルの再学習を学習部15Fへ指示する。
図5は、第2の監視項目のモニタリング方法の一例を示す図である。図5には、あくまで一例として、図4に示す第2の監視項目のうち「延滞日数」、「延滞回数」および「支払督促回数」の3つの第2の監視項目がモニタリングされる例が示されている。
例えば、第2モニタリング部15Dは、当月における審査対象者全体の延滞日数が閾値Th21、図示の例では100日以上である否かを判定する。さらに、第2モニタリング部15Dは、当月における審査対象者全体の延滞回数が閾値Th22、図示の例では100回以上である否かを判定する。さらに、第2モニタリング部15Dは、第2モニタリング部15Dは、当月における審査対象者全体の支払督促回数が閾値Th28、図示の例では100回以上である否かを判定する。図5に示す例で言えば、延滞日数および延滞回数の集計値は閾値Th21や閾値T22を下回るものの、支払督促回数の集計値は閾値Th28以上となる。この場合、スコアリングモデルの再学習が学習部15Fへ指示される。
(2)期間監視
他の側面として、第2モニタリング部15Dは、第2の監視項目のモニタリングの期間を当月から遡って所定の期間、例えば3ヶ月間や6ヶ月間、1年間として、第2の監視項目をモニタリングすることができる。すなわち、第2モニタリング部15Dは、第2の監視項目ごとに当月における審査対象者全体の集計値と、所定の期間における審査対象者全体の集計値から算出された統計値とを比較することで、スコアリングモデルの再学習を行うか否かを判定することもできる。例えば、第2モニタリング部15Dは、当月における審査対象者全体の集計値が所定の期間における平均値から所定値以上にわたって乖離しているか否かを判定する。そして、第2モニタリング部15Dは、当月における審査対象者全体の集計値が所定の期間における平均値から所定値以上にわたって乖離している場合、スコアリングモデルの再学習を学習部15Fへ指示する。
図6A及び図6Bは、第2の監視項目のモニタリング方法の他の一例を示す図である。図6A及び図6Bには、あくまで一例として、当月を「6月」とし、4月、5月および6月の3ヶ月分の延滞回数又は架電回数がモニタリングされる例が示されている。
図6Aに示す例で言えば、第2モニタリング部15Dは、当月である6月の延滞回数が4月〜6月の延滞回数の平均値Aveから所定値α以上にわたって乖離しているか否かを判定する。より具体的には、6月の延滞回数が4月〜6月の延滞回数の平均値Aveに所定値αが加算された加算値Ave+α以上であるか否か、あるいは6月の延滞回数が4月〜6月の延滞回数の平均値Aveから所定値αが減算された減算値Ave−α以下であるか否かを判定する。このとき、6月の延滞回数が上記の加算値Ave+α以上である場合、当月の延滞回数が急激に上昇している現象を検知できる。また、6月の延滞回数が上記の減算値Ave−α以下である場合、当月の延滞回数が急激に減少している現象を検知できる。これら急激な上昇または急激な減少のいずれかの現象が検知された場合、第2モニタリング部15Dは、スコアリングモデルの再学習を学習部15Fへ指示する。図6Aに示す例で言えば、6月の延滞回数が上記の減算値Ave−α以下であるので、急激な減少が検知される結果、スコアリングモデルの再学習が学習部15Fへ指示される。
また、図6Bに示す例で言えば、第2モニタリング部15Dは、当月である6月の架電回数が4月〜6月の架電回数の平均値Aveから所定値β以上にわたって乖離しているか否かを判定する。より具体的には、6月の架電回数が4月〜6月の架電回数の平均値Aveに所定値βが加算された加算値Ave+β以上であるか否か、あるいは6月の架電回数が4月〜6月の架電回数の平均値Aveから所定値βが減算された減算値Ave−β以下であるか否かを判定する。このとき、6月の架電回数が上記の加算値Ave+β以上である場合、当月の架電回数が急激に上昇している現象を検知できる。また、6月の架電回数が上記の減算値Ave−β以下である場合、当月の架電回数が急激に減少している現象を検知できる。これら急激な上昇または急激な減少のいずれかの現象が検知された場合、第2モニタリング部15Dは、スコアリングモデルの再学習を学習部15Fへ指示する。図6Bに示す例で言えば、6月の架電回数が上記の減算値Ave−β以下であるので、急激な減少が検知される結果、スコアリングモデルの再学習が学習部15Fへ指示される。
以上のように、第2の監視項目ごとに審査対象者全体の集計値をモニタリングすることにより、学習部15Fによる再学習を実行するか否かが判断される。
図1の説明に戻り、生成部15Eは、教師データを生成する処理部である。
1つの側面として、生成部15Eは、審査データ13Cに含まれる審査対象者のうち教師データが未生成である審査対象者ごとに、当該審査対象者に対する融資の返済が完了したか、あるいは当該審査対象者に対する融資が貸し倒れたかを監視する。このとき、融資の返済が完了した場合、生成部15Eは、当該審査対象者に対応付けられた入力データに正例「完済」の確定ラベルを付与することにより、教師データを生成する。一方、融資が貸し倒れた場合、生成部15Eは、当該審査対象者に対応付けられた入力データに負例「貸倒」の確定ラベルを付与することにより、教師データを生成する。このように生成された教師データが記憶部13における教師データ14に追加登録される。
更なる側面として、生成部15Eは、取得部15Cにより審査対象者ごとの銀行取引履歴が取得された場合、次のような処理を実行する。すなわち、生成部15Eは、審査データ13Cに含まれる審査対象者ごとに、融資を行われてから以降の銀行取引履歴が第2の監視項目別に設定された監視条件を満たすか否かを判定する。例えば、図4に例示された第2の監視項目、すなわち「延滞日数」、「延滞回数」、「延滞金額」、「延滞利息金」、「架電回数」、「文書発送件数」、「通話不能回数」、「支払督促回数」、又は、「貸倒件数」の累計値が各々の第2の監視項目別に設定された閾値以上であるか否かを判定する。
ここで、図4に例示された第2の監視項目のうちいずれかの第2の監視項目の累計値が閾値以上である場合、貸し倒れが発生するリスクがある、あるいは信用が毀損された可能性があると識別できる。この場合、生成部15Eは、当該審査対象者に対応するスコアリングモデルへの入力データに負例「貸倒」のみなしラベルが付与された擬似教師データを生成する。一方、図4に例示された全ての第2の監視項目の累計値が閾値未満である場合、貸し倒れが発生するリスクが低い、あるいは信用が毀損された可能性がないと識別できる。この場合、生成部15Eは、当該審査対象者に対応するスコアリングモデルへの入力データに正例「完済」のみなしラベルが付与された擬似教師データを生成する。このように生成された擬似教師データが記憶部13における擬似教師データ14Aに追加登録される。
学習部15Fは、スコアリングモデルの学習を行う処理部である。
(1)モデルへの入力データ
スコアリングモデルへの入力データも任意のデータとすることができるが、あくまで一例として、融資の申込情報に含まれる項目のデータをスコアリングモデルへの入力データとすることができる。
図7は、サンプル項目の一例を示す図である。図7には、法人向けのサンプル項目の一例が示されている。図7に示すように、法人向けの融資の申込情報に含まれる項目の例として、「ROA」、「ROE」、「売上高経常利益率」、「売上高営業利益率」、「回転期間」、「自己資本比率」、「負債比率」、「流動比率」、「固定比率」、「売上高増加率」、「経常利益増加率」、「営業利益増加率」、「総資本増加率」、「純資本増加率」、「従業員増加率」、「一株当たり当期純利益」、「総資本投資効率」、「設備投資効率」、「労働生産性」、「労働分配率」、「延滞有無」、「延滞日数」などの計20種類の項目が例示されている。これらの項目のうち、システム設定やユーザ設定により定められた任意の個数の項目がスコアリングモデルの学習に用いられる。
図8は、サンプル項目の他の一例を示す図である。図8には、個人向けのサンプル項目の一例が示されている。図8に示すように、個人向けの融資の申込情報に含まれる項目の例として、「年齢」、「性別」、「住居」、「居住年数」、「勤務先」、「年収」、「勤続年数」、「資本金」、「雇用形態」、「資格・職種等」、「未婚・既婚」、「他社借入状況」、「その他負債」、「手持金・自己資金」、「延滞有無」、「延滞日数」などの計16種類の項目が例示されている。これらの項目のうち、システム設定やユーザ設定により定められた任意の個数の項目がスコアリングモデルの学習に用いられる。
(2)データセットの取得
学習部15Fは、初期のスコアリングモデルの学習を行う場合、あるいは第1モニタリング部15Bまたは第2モニタリング部15Dにより再学習が指示された場合、データセットを取得する。あくまで一例として、学習部15Fは、記憶部13に記憶された擬似教師データ14Aを読み出す。続いて、学習部15Fは、記憶部13から読み出された擬似教師データ14Aのサンプル数が所定のサンプル数、例えば10000件に達しているか否かを判定する。そして、擬似教師データ14Aのサンプル数が所定のサンプル数に達していない場合、学習部15Fは、所定のサンプル数に対する不足分の教師データを記憶部13から読み出す。このとき、学習部15Fは、教師データ14のうち融資審査の日付が新しい教師データを優先して読み出す。この結果、所定のサンプル数に対応する擬似教師データ及び教師データがデータセットとして取得される。
(3)学習アルゴリズム
このように取得されたデータセットを用いて、学習部15Fは、スコアリングモデルの学習または再学習を実行する。ここで、スコアリングモデルの学習には、任意のアルゴリズムを適用することができる。例えば、ディープラーニングに代表されるニューラルネットワークの他、ロジスティック分析やランダムフォレスト、サポートベクタマシン、決定木などの学習アルゴリズムを適用することができる。
[処理の流れ]
次に、本実施例に係るモデル提供装置10の処理の流れについて説明する。ここでは、モデル提供装置10によって実行される(1)第1モニタリング処理、(2)第2モニタリング処理、(3)擬似教師データの生成処理、(4)再学習処理の順に説明する。
(1)第1モニタリング処理
図9は、実施例1に係る第1モニタリング処理の手順を示すフローチャートである。この処理は、あくまで一例として、モデル提供装置10が融資システム30にスコアリングの機能を開放する限り、繰り返し実行される。
図9に示すように、第1モニタリング部15Bは、スコアリングモデルが適用されている期間が所定の閾値Th12、例えば30日間に達したか否かを判定する(ステップS101)。このとき、スコアリングモデルが適用されている期間が30日間に達した場合(ステップS101Yes)、第1モニタリング部15Bは、スコアリングモデルの再学習を学習部15Fへ指示する(ステップS105)。
また、スコアリングモデルが適用されている期間が30日間に達していない場合(ステップS101No)、第1モニタリング部15Bは、スコアリングモデルによりスコアリングが行われたか否かを判定する(ステップS102)。なお、スコアリングモデルによりスコアリングが行われていない場合(ステップS102No)、ステップS101の処理に戻る。
このとき、スコアリングモデルによりスコアリングが行われた場合(ステップS102Yes)、第1モニタリング部15Bは、スコアリングモデルによってスコアリングが行われた審査の件数が所定の閾値Th11、図3に示す例では1000件に達したか否かを判定する(ステップS103)。
そして、スコアリングモデルによってスコアリングが行われた審査の件数が閾値Th11に達した場合(ステップS103Yes)、第1モニタリング部15Bは、スコアリングモデルの再学習を学習部15Fへ指示する(ステップS105)。
また、スコアリングモデルによってスコアリングが行われた審査の件数が閾値Th11に達していない場合(ステップS103No)、第1モニタリング部15Bは、スコアの4種の統計値と、図3に示す閾値Th13〜Th16とを比較する(ステップS104)。
ここで、スコアの4種の統計値のいずれかが閾値Th13〜Th16に関する条件を満たす場合(ステップS104Yes)、第1モニタリング部15Bは、スコアリングモデルの再学習を学習部15Fへ指示する(ステップS105)。
(2)第2モニタリング処理
図10は、実施例1に係る第2モニタリング処理の手順を示すフローチャートである。この処理は、あくまで一例として、取得部15Cにより各審査対象者の銀行取引履歴が取得される場合に起動される。
図10に示すように、取得部15Cにより各審査対象者の銀行取引履歴が取得されると(ステップS201)、第2モニタリング部15Dは、次のような処理を実行する。すなわち、第2モニタリング部15Dは、第2の監視項目ごとに、取得部15Cにより審査対象者ごとに取得された銀行取引履歴を用いて、審査対象者全体における第2の監視項目の集計値を算出する(ステップS202)。
そして、第2モニタリング部15Dは、第2の監視項目ごとに審査対象者全体の集計値が所定の条件を満たすかを判定する(ステップS203)。このとき、いずれかの第2の監視項目で集計値が所定の条件を満たす場合(ステップS203Yes)、第2モニタリング部15Dは、スコアリングモデルの再学習を学習部15Fへ指示し(ステップS204)、処理を終了する。なお、いずれの第2の監視項目においても集計値が所定の条件を満たさない場合(ステップS203No)、第2モニタリング部15Dは、ステップS204の処理をスキップして処理を終了する。
(3)擬似教師データの生成処理
図11は、実施例1に係る擬似教師データの生成処理の手順を示すフローチャートである。この処理は、あくまで一例として、取得部15Cにより各審査対象者の銀行取引履歴が取得される場合に起動される。
図11に示すように、取得部15Cにより各審査対象者の銀行取引履歴が取得されると(ステップS301)、生成部15Eは、審査データ13Cに含まれる審査対象者のうち教師データが未生成である審査対象者を1人選択する(ステップS302)。続いて、生成部15Eは、ステップS302で選択された審査対象者に融資が行われてから以降の銀行取引履歴が第2の監視項目別に設定された監視条件を満たすか否かを判定する(ステップS303)。
ここで、第2の監視項目のうちいずれかの第2の監視項目に設定された監視条件を満たす場合(ステップS303Yes)、貸し倒れが発生するリスクがある、あるいは信用が毀損された可能性があると識別できる。この場合、生成部15Eは、ステップS302で選択された審査対象者に対応するスコアリングモデルへの入力データに負例「貸倒」のみなしラベルが付与された擬似教師データを生成する(ステップS304)。
一方、第2の監視項目のうちいずれの第2の監視項目に設定された監視条件も満たさない場合(ステップS303No)、貸し倒れが発生するリスクが低い、あるいは信用が毀損された可能性がないと識別できる。この場合、生成部15Eは、当該審査対象者に対応するスコアリングモデルへの入力データに正例「完済」のみなしラベルが付与された擬似教師データを生成する(ステップS305)。
その後、教師データが未生成である全ての審査対象者が選択されるまで(ステップS306No)、生成部15Eは、上記のステップS302から上記のステップS304までの処理を繰り返し実行する。そして、教師データが未生成である全ての審査対象者が選択された場合(ステップS306Yes)、処理を終了する。
(4)再学習処理
図12は、実施例1に係る再学習処理の手順を示すフローチャートである。この処理は、あくまで一例として、モデル提供装置10が融資システム30にスコアリングの機能を開放する限り、繰り返し実行される。
図12に示すように、図9に示す第1モニタリング処理または図10に示す第2モニタリング処理のいずれかでスコアリングモデルの再学習が指示された場合(ステップS401Yes又はステップS402Yes)、学習部15Fは、擬似教師データ14Aを含む教師データ14を用いて、スコアリングモデルの再学習を実行する(ステップS403)。
[効果の一側面]
上述してきたように、本実施例に係るモデル提供装置10は、審査に用いるスコアリングモデルに入力された入力データに対応する審査対象者の取引履歴が監視条件に該当するか否かにより入力データにみなしラベルが付与された擬似教師データを生成してモデル学習を行う。
このように、本実施例に係るモデル提供装置10は、審査対象者の取引履歴が監視条件に抵触するか否かにより、審査の成否が確定する前にみなしラベルを付与して擬似教師データを生成する。このような擬似教師データの生成によって、審査の成否が確定するまで教師データの生成を待たずともよい分、審査時点からモデル学習の時点までのタイムラグを抑えることができる。
したがって、本実施例に係るモデル提供装置10によれば、審査時点からのタイムラグが小さい教師データを用いたモデル学習を実現することが可能である。
さて、これまで開示の装置に関する実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。そこで、以下では、本発明に含まれる他の実施例を説明する。
[スコアリングモデル]
上記の実施例1では、学習時または再学習時に1つのスコアリングモデルが生成される例を挙げたが、複数のスコアリングモデルを生成した上でその中から1つのスコアリングモデルを択一で選択することもできる。
このように、複数のスコアリングモデルが生成される場合、学習部15Fは、複数のスコアリングモデルの間で学習に用いる入力データの項目を変えて複数のスコアリングモデルを生成することができる。この他、学習部15Fは、複数のスコアリングモデルを同一の学習アルゴアリズムで生成することとしてもよいし、複数のスコアリングモデルのうち一部または全部のスコアリングモデルを異なる学習アルゴアリズムで生成することとしてもかまわない。これら入力データの項目または学習アルゴリズムは、ユーザ設定やシステム設定によって任意に変更できるのは言うまでもない。
さらに、複数のスコアリングモデルが生成される場合、学習部15Fは、所定の評価基準で評価が最良であるスコアリングモデルを選択することとしてもよい。このような評価基準の一例として、精度や説明性、安定性などの側面からスコアリングモデルの評価指標値を算出することができる。
ここで、「精度」とは、デフォルトの予測がどの程度当たっているかの程度を指し、例えば、テストデータが入力されたモデルの出力とテストデータのラベルとの正解率又は類似度に対応する。例えば、「精度」の評価指標値には、AR(Accuracy Ratio)値を確率または百分率などに正規化したものを用いることができる。このAR値は、一例として、ROC(Receiver Operating Characteristic)曲線の面積に対応するAUC(Area Under the Curve)を用いて、「2*AUC−1」の計算によって算出できる。
また、「説明性」とは、予測の意味をわかりやすく説明できる程度を指す。例えば、単純な数式などで表すことができるモデルほど高い評価指標値が与えられる一方で、複雑な計算をして計算内容がブラックボックスなモデルほど低い評価指標値が与えられる。あくまで一例として、ロジスティック回帰であれば90点、決定木であれば80点などといった要領で、スコアリングモデルの生成に用いる学習アルゴリズムによって固定値を割り当てることができる。
また、「安定性」とは、状況が変化した場合に精度がどの程度変化するのかを指し、例えば、状況が変化しても精度が変化しないモデルほど安定性が高いと評価される。あくまで一例として、評価指標値を100点満点とし、100点に近いほど評価が高い評価指標値に正規化する側面から、「(50−AR標準偏差)×2AR」の式を計算することによって算出することができる。この場合、1つのデータセットで複数回の評価を行うことができるCross−Validation法などを用いて、交差のラウンドごとにAR値を計算することにより、AR標準偏差も算出できる。
ここで、スコアリングモデルを評価する場合、学習部15Fは、スコアリングモデルの評価にHold−Out法やCross−Validation法などの任意の評価アルゴリズムに従って学習または再学習に用いる教師データのデータセットをモデルの生成に用いる学習データとモデルの評価に用いるテストデータとに分割する。
図13は、データセットの分割方法の一例を示す図である。図13に示すように、Hold−Out法を用いる場合、学習部15Fは、所定の配分、例えば7対3、あるいは6対4などの比率で、教師データのデータセットを学習データとテストデータとに分割する。また、Cross−Validation法を用いる場合、学習部15Fは、図13に示すように、データセットをK個のクラスタに分割する。そして、K個のクラスタのうちの1つをテストデータに割り当て、残るK−1個のクラスタを学習データに割り当てる。その後、学習部15Fは、全てのクラスタにテストデータが割り当てられるまでテストデータと学習用データを入れ替えて分割を繰り返し、全てのケースがテスト事例となるよう評価を繰り返す。これによって、1つのデータデータでK回の検証が行われることになる。この場合、評価指標には、K回の評価で得られたK個の評価値の代表値、例えば平均値や中央値、最頻値などを用いることができる。図13に示す例で言えば、データセットが5分割されるので、5回の評価が行われることになる。
このような評価アルゴリズムを用いることで、学習部15Fは、複数のスコアリングモデルごとに、精度や説明性、安定性などの評価基準別に評価指標値を算出することができる。
1つの側面として、学習部15Fは、複数のスコアリングモデルの中から、各評価指標値の合計値が最高であるスコアリングモデルを選択することができる。
他の側面として、学習部15Fは、第2の監視項目のうち集計値が閾値以上である第2の監視項目に基づいてスコアリングモデルの選択に用いる評価基準を選択することもできる。この場合、第2の監視項目と評価基準との対応関係は、あくまで一例として、融資システム30のアカウントを有するユーザ等により使用されるユーザ端末のユーザ設定を介して受け付けることができる。
以下、図14A〜図14Eを用いて、スコアリングモデルの選択に用いる評価基準の遷移例について説明する。図14A〜図14Eは、評価指標値の一例を示す図である。図14A〜図14Eでは、スコアリングモデルの選択に用いる評価基準、当該評価基準に対応する評価指標値、及び、当該評価指標値により選択されたスコアリングモデルが太字で示されている。
まず、初期のスコアリングモデルを選択する際、ユーザ端末には、スコアリングモデルA〜Cの評価後に、図14Aに示す評価基指標値のテーブルが表示される。図14Aに示すように、ユーザ端末には、スコアリングモデルA〜Cの3つのモデル別並びに評価基準別の評価指標値が表示される。ここで、図14Aに示す表示が行われた局面では、融資システム30のユーザである行員等は、3つの評価基準のうち評価基準「説明性」を重視し、ユーザ設定により評価基準「説明性」を選択したと仮定する。この場合、スコアリングモデルA〜Cのうち最高の評価指標値「0.9」が算出されたスコアリングモデルAの適用が決定される。このスコアリングモデルAがモデル実行部15Aにより実行されることで、スコアリングモデルAの運用が開始される。
スコアリングモデルAの運用から1ヶ月が経過し、第2モニタリング処理の当月監視で延滞回数用の閾値「15回」以上の延滞回数の集計値「70回」が検出されたとする。この場合、第2モニタリング部15Dから学習部15Fへ再学習が指示されるが、再学習に先立って、ユーザ端末には、スコアリングモデルAの再評価に関する表示の一例として、図14Bに示す評価基指標値のテーブルを表示することができる。すなわち、図14Bに示すように、スコアリングモデルAの運用開始時点における評価基準別の評価指標値と、運用開始から1ヶ月後におけるにおける評価基準別の評価指標値とが表示される。図14Bに示す表示が行われた局面では、融資システム30のユーザである行員等は、運用開始時に選択した評価基準「説明性」の評価指標値は、0.9から変化せず、依然として高い水準を維持していることを把握することができる。これと共に、評価基準「精度」の評価指標値が0.8から0.5へと急激に減少していることも把握できる。
このような傾向から、融資システム30のユーザである行員等のユーザ設定を介して、第2モニタリングの監視モード「当月監視」と、第2の監視項目「延滞回数」と、評価基準「精度」との対応関係がカスタマイズで定義される。このように対応関係が定義されることで、第2の監視項目のうち当月の延滞回数の集計値が閾値以上である場合、スコアリングモデルの選択に用いる評価基準を「精度」に自動的に変更することが可能になる。なお、ここでは、両者の対応関係がユーザ設定により定義される例を挙げたが、集計値が閾値以上である第2の監視項目と、最低の評価指標値が観測される評価基準との対応関係を自動的に定義することもできる。
このようなカスタマイズ定義の後、スコアリングモデルA′〜C′が再学習されたことで、ユーザ端末の表示が図14Cに示す評価基指標値のテーブルの表示へ更新される。ここでは、上記のカスタマイズ定義により評価基準「精度」が選択されているので、スコアリングモデルA′〜C′のうち最高の評価指標値「0.9」が算出されたスコアリングモデルB′の適用が決定される。このスコアリングモデルB′がモデル実行部15Aにより実行されることで、スコアリングモデルB′の運用が開始される。
スコアリングモデルB′の運用から3ヶ月が経過し、第2モニタリング処理の期間監視で督促回数の集計値が3ヶ月分の平均値からの乖離が検出されたとする。この場合、第2モニタリング部15Dから学習部15Fへ再学習が指示されるが、再学習に先立って、ユーザ端末には、スコアリングモデルB′の再評価に関する表示の一例として、図14Dに示す評価基指標値のテーブルを表示することができる。すなわち、図14Dに示すように、スコアリングモデルB′の運用開始時点における評価基準別の評価指標値と、スコアリングモデルB′の運用開始から3ヶ月後におけるにおける評価基準別の評価指標値とが表示される。図14Dに示す表示が行われた局面では、融資システム30のユーザである行員等は、スコアリングモデルB′の運用開始時に選択された評価基準「精度」の評価指標値は、0.9から変化せず、依然として高い水準を維持していることを把握することができる。これと共に、評価基準「安定性」の評価指標値が0.8から0.6へと急激に減少していることも把握できる。
このような傾向から、融資システム30のユーザである行員等のユーザ設定を介して、第2モニタリングの監視モード「期間監視」と、第2の監視項目「督促回数」と、評価基準「安定性」との対応関係がカスタマイズで定義される。このように対応関係が定義されることで、第2の監視項目のうち当月の延滞回数の集計値が所定期間の統計値から乖離することが検知された場合、スコアリングモデルの選択に用いる評価基準を「安定性」に自動的に変更することが可能になる。
このようなカスタマイズ定義の後、スコアリングモデルA″〜C″が再学習されたことで、ユーザ端末の表示が図14Eに示す評価基指標値のテーブルの表示へ更新される。ここでは、上記のカスタマイズ定義により評価基準「安定性」が選択されているので、スコアリングモデルA″〜C″のうち最高の評価指標値「0.9」が算出されたスコアリングモデルC″の適用が決定される。このスコアリングモデルC″がモデル実行部15Aにより実行されることで、スコアリングモデルC″の運用が開始される。
以上のような一連の経過によって、あくまで一例ではあるが、第2モニタリングの監視モード「当月監視」、第2の監視項目「延滞回数」および評価基準「精度」の対応関係、並びに、第2モニタリングの監視モード「期間監視」、第2の監視項目「督促回数」および評価基準「安定性」との対応関係の2つのカスタマイズ定義を獲得することができる。
[分散および統合]
また、図示した各装置の各構成要素は、必ずしも物理的に図示の如く構成されておらずともよい。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、モデル実行部15A、第1モニタリング部15B、取得部15C、第2モニタリング部15D、生成部15E又は学習部15Fをモデル提供装置10の外部装置としてネットワーク経由で接続するようにしてもよい。また、モデル実行部15A、第1モニタリング部15B、取得部15C、第2モニタリング部15D、生成部15E又は学習部15Fを別の装置がそれぞれ有し、ネットワーク接続されて協働することで、上記のモデル提供装置10の機能を実現するようにしてもよい。また、記憶部に記憶されるモデルデータ13A、審査データ13Bまたは教師データ14の全部または一部を別の装置がそれぞれ有し、ネットワーク接続されて協働することで、上記のモデル提供装置10の機能を実現するようにしてもかまわない。
[モデル提供プログラム]
また、上記の実施例で説明した各種の処理は、予め用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図15を用いて、上記の実施例1及び本実施例である実施例2と同様の機能を有するモデル提供プログラムを実行するコンピュータの一例について説明する。
図15は、コンピュータのハードウェア構成例を示す図である。図15に示すように、コンピュータ100は、操作部110aと、スピーカ110bと、カメラ110cと、ディスプレイ120と、通信部130とを有する。さらに、このコンピュータ100は、CPU150と、ROM160と、HDD170と、RAM180とを有する。これら110〜180の各部はバス140を介して接続される。
HDD170には、図15に示すように、上記の実施例1で示したモデル実行部15A、第1モニタリング部15B、取得部15C、第2モニタリング部15D、生成部15E及び学習部15Fと同様の機能を発揮するモデル提供プログラム170aが記憶される。このモデル提供プログラム170aは、図1に示したモデル実行部15A、第1モニタリング部15B、取得部15C、第2モニタリング部15D、生成部15E及び学習部15Fの各構成要素と同様、統合又は分離してもかまわない。すなわち、HDD170には、必ずしも上記の実施例1で示した全てのデータが格納されずともよく、処理に用いるデータがHDD170に格納されればよい。
このような環境の下、CPU150は、HDD170からモデル提供プログラム170aを読み出した上でRAM180へ展開する。この結果、モデル提供プログラム170aは、図15に示すように、モデル提供プロセス180aとして機能する。このモデル提供プロセス180aは、RAM180が有する記憶領域のうちモデル提供プロセス180aに割り当てられた領域にHDD170から読み出した各種データを展開し、この展開した各種データを用いて各種の処理を実行する。例えば、モデル提供プロセス180aが実行する処理の一例として、図9〜図12に示す処理などが含まれる。なお、CPU150では、必ずしも上記の実施例1で示した全ての処理部が動作せずともよく、実行対象とする処理に対応する処理部が仮想的に実現されればよい。
なお、上記のモデル提供プログラム170aは、必ずしも最初からHDD170やROM160に記憶されておらずともかまわない。例えば、コンピュータ100に挿入されるフレキシブルディスク、いわゆるFD、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」にモデル提供プログラム170aを記憶させる。そして、コンピュータ100がこれらの可搬用の物理媒体からモデル提供プログラム170aを取得して実行するようにしてもよい。また、公衆回線、インターネット、LAN、WANなどを介してコンピュータ100に接続される他のコンピュータまたはサーバ装置などにモデル提供プログラム170aを記憶させておき、コンピュータ100がこれらからモデル提供プログラム170aを取得して実行するようにしてもよい。
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)融資の審査対象者の取引履歴を取得し、
前記融資の審査に用いるモデルへの入力データのうち前記審査対象者に対応する入力データに、前記審査対象者の取引履歴が所定の監視条件に該当するか否かに基づくラベルが付与された擬似教師データを生成し、
前記擬似教師データを用いて前記モデルを学習する、
処理をコンピュータに実行させるモデル提供プログラム。
(付記2)前記生成する処理は、前記審査対象者の取引履歴が前記所定の監視条件に該当する場合、前記入力データに貸し倒れのラベルを付与し、前記審査対象者の取引履歴が前記所定の監視条件に該当しない場合、前記入力データに完済のラベルを付与することを特徴とする付記1に記載のモデル提供プログラム。
(付記3)前記審査対象者の取引履歴に基づいて所定の監視項目に対応する数値情報が各審査対象者の間で集計された集計値が所定の条件を満たすか否かを監視する処理を前記コンピュータにさらに実行させ、
前記学習する処理は、前記監視項目の前記集計値が所定の条件を満たす場合、前記モデルを再学習することを特徴とする付記1に記載のモデル提供プログラム。
(付記4)前記学習する処理は、前記擬似教師データを用いて学習される複数のモデルごとに算出される評価指標値に基づいて前記複数のモデルの中からモデルを選択することを特徴とする付記3に記載のモデル提供プログラム。
(付記5)前記学習する処理は、前記複数のモデルごとに複数の評価基準別の評価指標値を算出し、前記集計値が前記所定の条件を満たす前記監視項目に対応付けられた評価基準の評価指標値に基づいて前記複数のモデルの中からモデルを選択することを特徴とする付記4に記載のモデル提供プログラム。
(付記6)融資の審査対象者の取引履歴を取得し、
前記融資の審査に用いるモデルへの入力データのうち前記審査対象者に対応する入力データに、前記審査対象者の取引履歴が所定の監視条件に該当するか否かに基づくラベルが付与された擬似教師データを生成し、
前記擬似教師データを用いて前記モデルを学習する、
処理をコンピュータが実行するモデル提供方法。
(付記7)前記生成する処理は、前記審査対象者の取引履歴が前記所定の監視条件に該当する場合、前記入力データに貸し倒れのラベルを付与し、前記審査対象者の取引履歴が前記所定の監視条件に該当しない場合、前記入力データに完済のラベルを付与することを特徴とする付記6に記載のモデル提供方法。
(付記8)前記審査対象者の取引履歴に基づいて所定の監視項目に対応する数値情報が各審査対象者の間で集計された集計値が所定の条件を満たすか否かを監視する処理を前記コンピュータがさらに実行し、
前記学習する処理は、前記監視項目の前記集計値が所定の条件を満たす場合、前記モデルを再学習することを特徴とする付記6に記載のモデル提供方法。
(付記9)前記学習する処理は、前記擬似教師データを用いて学習される複数のモデルごとに算出される評価指標値に基づいて前記複数のモデルの中からモデルを選択することを特徴とする付記8に記載のモデル提供方法。
(付記10)前記学習する処理は、前記複数のモデルごとに複数の評価基準別の評価指標値を算出し、前記集計値が前記所定の条件を満たす前記監視項目に対応付けられた評価基準の評価指標値に基づいて前記複数のモデルの中からモデルを選択することを特徴とする付記9に記載のモデル提供方法。
(付記11)融資の審査対象者の取引履歴を取得する取得部と、
前記融資の審査に用いるモデルへの入力データのうち前記審査対象者に対応する入力データに、前記審査対象者の取引履歴が所定の監視条件に該当するか否かに基づくラベルが付与された擬似教師データを生成する生成部と、
前記擬似教師データを用いて前記モデルを学習する学習部と、
を有することを特徴とするモデル提供装置。
(付記12)前記生成部は、前記審査対象者の取引履歴が前記所定の監視条件に該当する場合、前記入力データに貸し倒れのラベルを付与し、前記審査対象者の取引履歴が前記所定の監視条件に該当しない場合、前記入力データに完済のラベルを付与することを特徴とする付記11に記載のモデル提供装置。
(付記13)前記審査対象者の取引履歴に基づいて所定の監視項目に対応する数値情報が各審査対象者の間で集計された集計値が所定の条件を満たすか否かを監視する監視部をさらに有し、
前記学習部は、前記監視項目の前記集計値が所定の条件を満たす場合、前記モデルを再学習することを特徴とする付記11に記載のモデル提供装置。
(付記14)前記学習部は、前記擬似教師データを用いて学習される複数のモデルごとに算出される評価指標値に基づいて前記複数のモデルの中からモデルを選択することを特徴とする付記13に記載のモデル提供装置。
(付記15)前記学習部は、前記複数のモデルごとに複数の評価基準別の評価指標値を算出し、前記集計値が前記所定の条件を満たす前記監視項目に対応付けられた評価基準の評価指標値に基づいて前記複数のモデルの中からモデルを選択することを特徴とする付記14に記載のモデル提供装置。
10 モデル提供装置
11 通信インタフェイス
13 記憶部
13A モデルデータ
13B 審査データ
14 教師データ
14A 擬似教師データ
15 制御部
15A モデル実行部
15B 第1モニタリング部
15C 取得部
15D 第2モニタリング部
15E 生成部
15F 学習部
30 融資システム

Claims (7)

  1. 融資の審査対象者の取引履歴を取得し、
    前記融資の審査に用いるモデルへの入力データのうち前記審査対象者に対応する入力データに、前記審査対象者の取引履歴が所定の監視条件に該当するか否かに基づくラベルが付与された擬似教師データを生成し、
    前記擬似教師データを用いて前記モデルを学習する、
    処理をコンピュータに実行させるモデル提供プログラム。
  2. 前記生成する処理は、前記審査対象者の取引履歴が前記所定の監視条件に該当する場合、前記入力データに貸し倒れのラベルを付与し、前記審査対象者の取引履歴が前記所定の監視条件に該当しない場合、前記入力データに完済のラベルを付与することを特徴とする請求項1に記載のモデル提供プログラム。
  3. 前記審査対象者の取引履歴に基づいて所定の監視項目に対応する数値情報が各審査対象者の間で集計された集計値が所定の条件を満たすか否かを監視する処理を前記コンピュータにさらに実行させ、
    前記学習する処理は、前記監視項目の前記集計値が所定の条件を満たす場合、前記モデルを再学習することを特徴とする請求項1または2に記載のモデル提供プログラム。
  4. 前記学習する処理は、前記擬似教師データを用いて学習される複数のモデルごとに算出される評価指標値に基づいて前記複数のモデルの中からモデルを選択することを特徴とする請求項3に記載のモデル提供プログラム。
  5. 前記学習する処理は、前記複数のモデルごとに複数の評価基準別の評価指標値を算出し、前記集計値が前記所定の条件を満たす前記監視項目に対応付けられた評価基準の評価指標値に基づいて前記複数のモデルの中からモデルを選択することを特徴とする請求項4に記載のモデル提供プログラム。
  6. 融資の審査対象者の取引履歴を取得し、
    前記融資の審査に用いるモデルへの入力データのうち前記審査対象者に対応する入力データに、前記審査対象者の取引履歴が所定の監視条件に該当するか否かに基づくラベルが付与された擬似教師データを生成し、
    前記擬似教師データを用いて前記モデルを学習する、
    処理をコンピュータが実行するモデル提供方法。
  7. 融資の審査対象者の取引履歴を取得する取得部と、
    前記融資の審査に用いるモデルへの入力データのうち前記審査対象者に対応する入力データに、前記審査対象者の取引履歴が所定の監視条件に該当するか否かに基づくラベルが付与された擬似教師データを生成する生成部と、
    前記擬似教師データを用いて前記モデルを学習する学習部と、
    を有することを特徴とするモデル提供装置。
JP2019090172A 2019-05-10 2019-05-10 モデル提供プログラム、モデル提供方法及びモデル提供装置 Active JP7298286B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019090172A JP7298286B2 (ja) 2019-05-10 2019-05-10 モデル提供プログラム、モデル提供方法及びモデル提供装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019090172A JP7298286B2 (ja) 2019-05-10 2019-05-10 モデル提供プログラム、モデル提供方法及びモデル提供装置

Publications (2)

Publication Number Publication Date
JP2020187441A true JP2020187441A (ja) 2020-11-19
JP7298286B2 JP7298286B2 (ja) 2023-06-27

Family

ID=73221721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019090172A Active JP7298286B2 (ja) 2019-05-10 2019-05-10 モデル提供プログラム、モデル提供方法及びモデル提供装置

Country Status (1)

Country Link
JP (1) JP7298286B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112488831A (zh) * 2020-11-20 2021-03-12 东软集团股份有限公司 区块链网络交易方法、装置、存储介质及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004295280A (ja) * 2003-03-26 2004-10-21 Daiwa Securities Smbc Co Ltd 決済不履行確率算出装置、決済不履行確率算出方法、及びプログラム
JP2007004828A (ja) * 2004-11-15 2007-01-11 Sbi Holdings Inc 与信審査を利用したスコアリングモデル評価装置および審査システム
JP2012247860A (ja) * 2011-05-25 2012-12-13 Nippon Telegr & Teleph Corp <Ntt> モデル生成方法及びモデル生成装置
JP2014026322A (ja) * 2012-07-24 2014-02-06 Resona Holdings Inc 審査モデル作成装置、コンピュータプログラム、及び審査モデル作成方法
JP2017182284A (ja) * 2016-03-29 2017-10-05 Profit Cube 株式会社 ローン審査支援装置、システム及びプログラム
JP2018014003A (ja) * 2016-07-21 2018-01-25 日本電信電話株式会社 項目値抽出モデル学習装置、項目値抽出装置、方法、及びプログラム
JP6445199B1 (ja) * 2018-03-30 2018-12-26 三井住友カード株式会社 融資審査システム、方法およびプログラム
JP6490271B1 (ja) * 2018-03-15 2019-03-27 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004295280A (ja) * 2003-03-26 2004-10-21 Daiwa Securities Smbc Co Ltd 決済不履行確率算出装置、決済不履行確率算出方法、及びプログラム
JP2007004828A (ja) * 2004-11-15 2007-01-11 Sbi Holdings Inc 与信審査を利用したスコアリングモデル評価装置および審査システム
JP2012247860A (ja) * 2011-05-25 2012-12-13 Nippon Telegr & Teleph Corp <Ntt> モデル生成方法及びモデル生成装置
JP2014026322A (ja) * 2012-07-24 2014-02-06 Resona Holdings Inc 審査モデル作成装置、コンピュータプログラム、及び審査モデル作成方法
JP2017182284A (ja) * 2016-03-29 2017-10-05 Profit Cube 株式会社 ローン審査支援装置、システム及びプログラム
JP2018014003A (ja) * 2016-07-21 2018-01-25 日本電信電話株式会社 項目値抽出モデル学習装置、項目値抽出装置、方法、及びプログラム
JP6490271B1 (ja) * 2018-03-15 2019-03-27 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP6445199B1 (ja) * 2018-03-30 2018-12-26 三井住友カード株式会社 融資審査システム、方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112488831A (zh) * 2020-11-20 2021-03-12 东软集团股份有限公司 区块链网络交易方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
JP7298286B2 (ja) 2023-06-27

Similar Documents

Publication Publication Date Title
US11922435B2 (en) Detecting and reducing bias (including discrimination) in an automated decision making process
US20230009149A1 (en) System, method and computer program for underwriting and processing of loans using machine learning
US8473391B2 (en) Method and system for an integrated approach to collections cycle optimization
US8688557B2 (en) Systems and methods for customer value optimization involving relationship optimization
US7904397B2 (en) System and method for scalable cost-sensitive learning
US20050080821A1 (en) System and method for managing collections accounts
US20110112985A1 (en) Method and system for generating a financial plan score
Van Thiel et al. Artificial intelligence credit risk prediction: An empirical study of analytical artificial intelligence tools for credit risk prediction in a digital era
CN111008896A (zh) 金融风险预警方法、装置、电子设备及存储介质
JP7311495B2 (ja) 改善された住宅ローン金利決定
Eddy et al. Credit scoring models: Techniques and issues
JP2001125962A (ja) 企業診断及び経営意思決定支援システム
KR20200123726A (ko) 금융컨텐츠 설계시스템 및 금융컨텐츠 설계방법
CN113420909A (zh) 一种用户响应信息预测模型建立方法及信息预测方法
JP2019160089A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2020187441A (ja) モデル提供プログラム、モデル提供方法及びモデル提供装置
JP6771513B2 (ja) 債務不履行確率を算出する装置、方法及びそのためのプログラム
JP7043248B2 (ja) 休廃業予測システム
CN114187104A (zh) 交易风险检测方法、装置、计算机设备和存储介质
CN112926892A (zh) 一种资金匹配方法、装置、电子设备及存储介质
Melnyk et al. Improving the quality of credit activity by using scoring model
Inani et al. Does Artificial Neural Network Forecast Better for Excessively Volatile Currency Pairs?
Konovalova et al. Evaluation of credit policy implementation in commercial banks: Evidence from latvia
Lélis et al. Deris: Information system supporting the prediction of default risk in companies
Bozorov RESEARCHING ALGORITHMS FOR CREDIT ALLOCATION USING DEEP LEARNING METHODS

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230529

R150 Certificate of patent or registration of utility model

Ref document number: 7298286

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150