JP2023108896A - 企業消滅リスク予測システム - Google Patents
企業消滅リスク予測システム Download PDFInfo
- Publication number
- JP2023108896A JP2023108896A JP2022010195A JP2022010195A JP2023108896A JP 2023108896 A JP2023108896 A JP 2023108896A JP 2022010195 A JP2022010195 A JP 2022010195A JP 2022010195 A JP2022010195 A JP 2022010195A JP 2023108896 A JP2023108896 A JP 2023108896A
- Authority
- JP
- Japan
- Prior art keywords
- company
- bankruptcy
- closure
- storage unit
- risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008033 biological extinction Effects 0.000 title claims abstract description 38
- 230000004083 survival effect Effects 0.000 claims abstract description 85
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 27
- 239000000725 suspension Substances 0.000 claims description 61
- 230000006870 function Effects 0.000 claims description 30
- 230000001186 cumulative effect Effects 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 17
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000010801 machine learning Methods 0.000 claims description 13
- 238000011835 investigation Methods 0.000 abstract description 9
- 230000036962 time dependent Effects 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 11
- 230000008034 disappearance Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000007704 transition Effects 0.000 description 6
- 238000011160 research Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013179 statistical model Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000004090 dissolution Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002747 voluntary effect Effects 0.000 description 2
- 238000001793 Wilcoxon signed-rank test Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001325 log-rank test Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】特定企業の倒産リスク及び休廃業リスクの期間構造を推定する。【解決手段】企業消滅リスク予測システム10は、複数の企業に関する所定項目に係る情報を、各情報を取得した調査時期に関連付けて登録しておく企業情報記憶部18と、倒産した企業の識別情報及び倒産時期を登録しておく企業消滅情報記憶部14と、モデル生成部12と、消滅リスク予測部22を備える。モデル生成部12は、企業情報記憶部18から各登録企業に係る所定項目の値を取得し、企業消滅情報記憶部14から倒産している登録企業の識別情報及び倒産時期を取得し、倒産している登録企業については、調査時期から倒産時期までの生存時間を目的変数とし、所定項目の値を説明変数としてランダムサバイバルフォレストのアルゴリズムに投入し、倒産していない登録企業については、所定項目の値を打切りデータとして同アルゴリズムに投入し、学習済モデルを生成する。【選択図】図1
Description
特許法第30条第2項適用申請有り 令和3年2月12日に、「令和2年度 国立大学法人滋賀大学大学院データサイエンス研究科 学位論文審査及び最終試験(修士論文公聴会)」にて公開
この発明は企業消滅リスク予測システムに係り、特に、特定の企業の倒産や休廃業のリスクの期間構造の推定し、企業の倒産および休廃業の発生までの生存時間や生存確率を算出する技術に関する。
企業が突然に倒産あるいは休廃業すると、取引先や金融機関に多大な損失が生じるのみならず、地域経済に与える影響も大きいため、その危険性を事前に把握しておくことは利害関係者にとって極めて重要といえる。
このため、従来から特定企業の倒産確率や休廃業確率を推定する技術が存在していた。
特開2003-216804号公報
特開2019-117443号公報
特許第6611068号公報
このため、従来から特定企業の倒産確率や休廃業確率を推定する技術が存在していた。
特許文献1の技術は、多数の企業の定性データに基づく統計モデルを生成し、これに特定企業の定性データを適用することにより、当該企業が所定期間内に倒産する確率を算出するものである。
また、特許文献2の技術は、多数の企業の財務データや定性データ等に基づく統計モデルを生成し、これに特定企業の同種データを適用することにより、当該企業が所定期間内に休廃業する確率を算出することを企図している。
特許文献3においても、多数の企業の財務データや定性データ等に基づく統計モデルを生成し、これに特定企業の同種データを適用することにより、イベント(倒産等)の発生を予測する技術が開示されている。
また、特許文献2の技術は、多数の企業の財務データや定性データ等に基づく統計モデルを生成し、これに特定企業の同種データを適用することにより、当該企業が所定期間内に休廃業する確率を算出することを企図している。
特許文献3においても、多数の企業の財務データや定性データ等に基づく統計モデルを生成し、これに特定企業の同種データを適用することにより、イベント(倒産等)の発生を予測する技術が開示されている。
しかしながら、これらの従来技術は何れも統計モデルの生成に際してロジスティック回帰分析やランダムフォレストなどのイベント予測手法を採用しているため、所定期間内(例えば今後1年以内)に倒産あるいは休廃業する確率を推定することはできるが、特定企業の将来における倒産確率や休廃業確率の推移を長期間に亘って推定することはできなかった。
この発明は、このような従来技術の問題点に鑑みて案出されたものであり、企業の倒産リスクや休廃業リスクの期間構造を解析し、これに基づいて特定企業の生存時間の確率分布を推定することで、任意の時間経過後の消滅リスクを出力することを目的としている。
上記の目的を達成するため、請求項1に記載した企業消滅リスク予測システムは、複数の企業に関する所定項目に係る情報を、各情報を取得した調査時期に関連付けて登録しておく企業情報記憶部と、倒産した企業の識別情報及び倒産時期を登録しておく倒産情報記憶部と、上記企業情報記憶部を参照し、各登録企業に係る所定項目の値を取得する手段と、上記倒産情報記憶部を参照し、倒産している登録企業の識別情報及び倒産時期を取得する手段と、倒産している登録企業については、調査時期から倒産時期までの生存時間を目的変数とし、上記所定項目の値を説明変数として生存時間解析用の機械学習アルゴリズムに投入し、倒産していない登録企業については、上記所定項目の値を打切りデータとして上記アルゴリズムに投入し、企業の倒産リスクの期間構造を推定する学習済モデルを生成する手段と、この学習済モデルに特定企業に係る所定項目の値を代入することにより、当該企業の将来における倒産リスクの期間構造を予測する手段と、この予測結果を出力する手段と、を備えたことを特徴としている。
上記の予測結果は、例えばグラフや生存時間関数、Kaplan-Meier(カプラン・マイヤー)法に基づく生存率曲線やCutler-Ederer(カトラー・エデラー)法に基づく生存率曲線として表現される。あるいは、当該企業の将来の任意の時点における倒産リスクや倒産ハザードとして出力することもできる。
上記の予測結果は、例えばグラフや生存時間関数、Kaplan-Meier(カプラン・マイヤー)法に基づく生存率曲線やCutler-Ederer(カトラー・エデラー)法に基づく生存率曲線として表現される。あるいは、当該企業の将来の任意の時点における倒産リスクや倒産ハザードとして出力することもできる。
請求項2に記載した企業消滅リスク予測システムは、複数の企業に関する所定項目に係る情報を、各情報を取得した調査時期に関連付けて登録しておく企業情報記憶部と、休廃業した企業の識別情報及び休廃業時期を登録しておく休廃業情報記憶部と、上記企業情報記憶部を参照し、各登録企業に係る所定項目の値を取得する手段と、上記休廃業情報記憶部を参照し、休廃業している登録企業の識別情報及び休廃業時期を取得する手段と、休廃業している登録企業については、調査時期から休廃業時期までの生存時間を目的変数とし、上記所定項目の値を説明変数として生存時間解析用の機械学習アルゴリズムに投入し、休廃業していない登録企業については、上記所定項目の値を打切りデータとして上記アルゴリズムに投入し、企業の休廃業リスクの期間構造を推定する学習済モデルを生成する手段と、この学習済モデルに特定企業に係る所定項目の値を代入することにより、当該企業の将来における休廃業リスクの期間構造を予測する手段と、この予測結果を出力する手段と、を備えたことを特徴としている。
上記の予測結果は、例えばグラフや生存時間関数、Kaplan-Meier(カプラン・マイヤー)法に基づく生存率曲線やCutler-Ederer(カトラー・エデラー)法に基づく生存率曲線として表現される。あるいは、当該企業の将来の任意の時点における休廃業リスクや休廃業ハザードとして出力することもできる。
上記の予測結果は、例えばグラフや生存時間関数、Kaplan-Meier(カプラン・マイヤー)法に基づく生存率曲線やCutler-Ederer(カトラー・エデラー)法に基づく生存率曲線として表現される。あるいは、当該企業の将来の任意の時点における休廃業リスクや休廃業ハザードとして出力することもできる。
請求項3に記載した企業消滅リスク予測システムは、複数の企業に関する所定項目に係る情報を、各情報を取得した調査時期に関連付けて登録しておく企業情報記憶部と、倒産した企業の識別情報及び倒産時期を登録しておく倒産情報記憶部と、休廃業した企業の識別情報及び休廃業時期を登録しておく休廃業情報記憶部と、上記企業情報記憶部を参照し、各登録企業に係る所定項目の値を取得する手段と、上記倒産情報記憶部を参照し、倒産している登録企業の識別情報及び倒産時期を取得する手段と、倒産している登録企業については、調査時期から倒産時期までの生存時間を目的変数とし、上記所定項目の値を説明変数として生存時間解析用の機械学習アルゴリズムに投入し、倒産していない登録企業については、上記所定項目の値を打切りデータとして上記アルゴリズムに投入し、企業の倒産リスクの期間構造を推定する学習済モデルを生成する手段と、上記休廃業情報記憶部を参照し、休廃業している登録企業の識別情報及び休廃業時期を取得する手段と、休廃業している登録企業については、調査時点から休廃業時期までの生存時間を目的変数とし、上記所定項目の値を説明変数として生存時間解析用の機械学習アルゴリズムに投入し、休廃業していない登録企業については、上記所定項目の値を打切りデータとして上記アルゴリズムに投入し、企業の休廃業リスクの期間構造を推定する学習済モデルを生成する手段と、上記倒産予測用の学習済モデルに特定企業に係る所定項目の値を代入することにより、当該企業の将来における倒産リスクの期間構造を予測し、倒産予測用グラフを生成する手段と、上記休廃業予測用の学習済モデルに上記特定企業に係る所定項目の値を代入することにより、当該企業の将来における休廃業リスクの期間構造を予測し、休廃業予測用グラフを生成する手段と、上記倒産予測用グラフと、休廃業予測用グラフを同一平面上に配置したものを予測結果として出力する手段と、を備えたことを特徴としている。
請求項4に記載した企業消滅リスク予測システムは、請求項1~3のシステムであって、上記機械学習用アルゴリズムが、ランダムサバイバルフォレストであることを特徴としている。
請求項5に記載した企業消滅リスク予測システムは、請求項3のシステムであって、上記予測結果のグラフに対してパラメトリックモデルを適用し、連続確率分布としてグラフを近似することで、累積ハザード関数及び生存時間関数を滑らかなグラフとして出力することを特徴としている。
この発明に係る企業消滅リスク予測システムの場合、学習済モデルの生成に際し、生存時間解析用の機械学習アルゴリズム(例えばランダムサバイバルフォレスト)を採用しているため、特定企業の将来における倒産確率や休廃業確率の推移を長期間に亘って推定することが可能となる。
図1のブロック図に示すように、この発明に係る企業消滅リスク予測システム10は、モデル生成部12と、企業消滅情報記憶部14と、シグナル情報記憶部16と、企業情報記憶部18と、学習済モデル記憶部20と、消滅リスク予測部22と、予測結果記憶部24を備えている。
上記モデル生成部12及び消滅リスク予測部22は、コンピュータのCPUが、OS及び専用のアプリケーションプログラムに従って必要な処理を実行することにより実現される。
また、上記企業消滅情報記憶部14、シグナル情報記憶部16、企業情報記憶部18、学習済モデル記憶部20及び予測結果記憶部24は、同コンピュータの記憶装置内に設けられている。
また、上記企業消滅情報記憶部14、シグナル情報記憶部16、企業情報記憶部18、学習済モデル記憶部20及び予測結果記憶部24は、同コンピュータの記憶装置内に設けられている。
ただし、上記のハードウェア構成は一例であり、他のハードウェア構成によって本システム10を実現することも当然に可能である。
例えば、モデル生成部12と消滅リスク予測部22を別個のコンピュータ上で実現したり、あるいは各記憶部を独立したデータベースサーバ上に設けたりすることもできる。
例えば、モデル生成部12と消滅リスク予測部22を別個のコンピュータ上で実現したり、あるいは各記憶部を独立したデータベースサーバ上に設けたりすることもできる。
上記企業情報記憶部18には、信用調査会社によって作成された膨大な数の調査対象企業に関する調査報告情報が、過去数十年分蓄積されている。
この調査報告情報は、各企業の基本情報(企業コード、商号、代表者、所在地、電話番号、企業URL、上場区分、設立年月日、資本金、事業内容、取引銀行、従業員数等)の他に、役員構成、株主構成、親子会社関係、過去の業績、今後の業績見通し、取引先(仕入先及び得意先)、財務諸表等を含む膨大なテキストデータである。
この信用調査自体は不定期に実施されるため、調査報告情報の数も企業毎にばらつきがある。
この調査報告情報は、各企業の基本情報(企業コード、商号、代表者、所在地、電話番号、企業URL、上場区分、設立年月日、資本金、事業内容、取引銀行、従業員数等)の他に、役員構成、株主構成、親子会社関係、過去の業績、今後の業績見通し、取引先(仕入先及び得意先)、財務諸表等を含む膨大なテキストデータである。
この信用調査自体は不定期に実施されるため、調査報告情報の数も企業毎にばらつきがある。
企業消滅情報記憶部14には、企業情報記憶部18に格納された各企業の中で、現実に倒産あるいは休廃業に至った企業を特定する情報(企業コード、倒産年月日、休廃業年月日等)が格納されている。
ここで「倒産」とは、任意整理(銀行取引停止、内整理)および法的整理(会社更生法、民事再生法、破産法、特別清算)を対象としており、企業が債務の支払不能等、経済活動の継続困難な状態に陥る場合を指す。
これに対し「休廃業」とは、企業活動停止が確認できた企業のなかで、倒産(任意整理、法的整理)に分類されないケースを指し、「休業」及び「廃業」の他に、「解散」をも含む概念である。
企業消滅情報記憶部14に格納された倒産情報及び休廃業情報は、多数の調査員が個々の企業を定期的に訪問し、現状を実際に確認した結果に基づいて登録されるものであるため、高い精度と信頼性を有している。
シグナル情報記憶部16には、企業の倒産・休廃業に対してポジティブまたはネガティブな影響を及ぼす事象の存在が、スポット的なシグナル情報として格納されている。
どのような事象がシグナル情報に該当するかは事前に定義されており、各調査員が自己の担当企業についてのシグナル情報を認知した時点で、企業コード及び日時に関連付けてシグナル情報記憶部16に格納する。
どのような事象がシグナル情報に該当するかは事前に定義されており、各調査員が自己の担当企業についてのシグナル情報を認知した時点で、企業コード及び日時に関連付けてシグナル情報記憶部16に格納する。
例えば、倒産や休廃業の噂を調査員が聞き付けた場合には、当該企業の倒産あるいは休廃業に対してリスクを上げる情報(ネガティブ情報)として、シグナル情報記憶部16に登録される。
また、「特許取得」の事実を調査員が確認した場合には、当該企業の休廃業に対してリスクを下げる情報(ポジティブ情報)として、シグナル情報記憶部16に登録される。
また、「特許取得」の事実を調査員が確認した場合には、当該企業の休廃業に対してリスクを下げる情報(ポジティブ情報)として、シグナル情報記憶部16に登録される。
また、所定の会員企業は企業情報記憶部18に格納された調査報告情報に随時アクセスし、特定の企業に係る信用情報を閲覧することが認められているが、他の企業から特定企業の調査報告情報にアクセスがあった時点で、シグナル情報記憶部16にその事実(アクセス元の企業コード、アクセス先の企業コード、アクセス日時等)が自動的に登録される仕組みが設けられている。
つぎに、図2のフローチャートに従い、企業消滅リスク予測のためのモデル生成に関する処理手順を説明する。
まず、管理者甲の操作するクライアント端末26から送信されたモデル生成のリクエストを受信すると(S10)、モデル生成部12は、企業消滅情報記憶部14を参照し、現時点で倒産あるいは休廃業している企業を特定すると共に、その企業コードと倒産年月あるいは休廃業年月を取得する(S11)。
まず、管理者甲の操作するクライアント端末26から送信されたモデル生成のリクエストを受信すると(S10)、モデル生成部12は、企業消滅情報記憶部14を参照し、現時点で倒産あるいは休廃業している企業を特定すると共に、その企業コードと倒産年月あるいは休廃業年月を取得する(S11)。
つぎにモデル生成部12は、企業情報記憶部18を参照し、各登録企業の調査報告書から特定項目の情報を取得すると共に(S12)、シグナル情報記憶部16を参照し、各登録企業のシグナル情報を取得する(S13)。
後述の通り、モデル生成部12は倒産予測用の学習済モデルと、休廃業予測用の学習モデルを別個に生成するのであるが、各学習済モデルの生成に用いられるデータ(変数)の種類には共通するものもある一方、相互に異なるものも存在する。このため、モデル生成部12は両モデルの生成に必要な項目をまとめて取得する。
以下は、モデル生成部12によって抽出されるデータの一例を示すものである。
以下は、モデル生成部12によって抽出されるデータの一例を示すものである。
[倒産予測用の変数]
・売上
・従業員数
・代表者属性
・資本金
・景気DI指標
・評点
・資本構成
・資金現況
・収益性
・損益状況
・担保設定状況
・売上
・従業員数
・代表者属性
・資本金
・景気DI指標
・評点
・資本構成
・資金現況
・収益性
・損益状況
・担保設定状況
[休廃業予測用の変数]
・売上
・従業員数
・資本金
・景気DI指標
・後継者の有無
・代表者の年齢
・取引銀行数
・取引先数
・評点
・業種分類
・企業HPの有無
・損益状況
・収益性
・シグナル情報
・売上
・従業員数
・資本金
・景気DI指標
・後継者の有無
・代表者の年齢
・取引銀行数
・取引先数
・評点
・業種分類
・企業HPの有無
・損益状況
・収益性
・シグナル情報
上記の各変数は、ログランク検定や一般化ウィルコクソン検定などを用いることにより、リスクの期間構造に影響を与えるものとして選定されているが、これらはあくまでも一例であり、他の変数を選定することを妨げるものではない。
上記変数中の各「評点」は、経験と学識を備えた専門家により、予め設定された範囲内で付与された数値を意味している。
代表者の死亡や引退に起因して企業の休廃業が生じるケースが多いため、休廃業予測用の共変量として「代表者の年齢」や「後継者の有無」が加えられている。
上記変数中の各「評点」は、経験と学識を備えた専門家により、予め設定された範囲内で付与された数値を意味している。
代表者の死亡や引退に起因して企業の休廃業が生じるケースが多いため、休廃業予測用の共変量として「代表者の年齢」や「後継者の有無」が加えられている。
つぎにモデル生成部12は、各登録企業に係る上記情報(共変量)に調査年月(データ収録年月)、倒産年月、休廃業年月のデータ項目からなる生存時間情報を付加することにより、モデル生成用データを生成する。
図3は、モデル生成用データを例示するものである。
モデル生成用データとしては、同一企業に係るものであっても、調査報告書単位で1レコードとして生成される。
例えば、「企業コード:10001(a)」と「企業コード:10001(b)」は同一の企業に係るデータであるが、調査年月が異なるため別個のモデル生成用データとして扱われる。
また、シグナル情報の件数や調査報告情報へのアクセス件数については、調査年月から現時点までの累計が適用される。
図3は、モデル生成用データを例示するものである。
モデル生成用データとしては、同一企業に係るものであっても、調査報告書単位で1レコードとして生成される。
例えば、「企業コード:10001(a)」と「企業コード:10001(b)」は同一の企業に係るデータであるが、調査年月が異なるため別個のモデル生成用データとして扱われる。
また、シグナル情報の件数や調査報告情報へのアクセス件数については、調査年月から現時点までの累計が適用される。
ただし、観測年代によって経済環境に差異があるため、この違いを解析結果に反映させるための工夫を講じることが望ましい。
例えば、調査年をダミー変数としてモデル生成用データに組み入れることが該当する。あるいは、各年代の景気動向指数に基づく重みを各共変量に適用することなどが該当する。
例えば、調査年をダミー変数としてモデル生成用データに組み入れることが該当する。あるいは、各年代の景気動向指数に基づく重みを各共変量に適用することなどが該当する。
これらモデル生成用データの中、休廃業年月に値が充填されているものは休廃業企業に係るものであることを意味しており、倒産年月に値が充填されているものは倒産企業に係るものであることを意味している。
これに対し、休廃業年月及び倒産年月の何れにも値が充填されていないものは、現時点で休廃業も倒産もしていない存続企業に係るものであることを意味している。
これに対し、休廃業年月及び倒産年月の何れにも値が充填されていないものは、現時点で休廃業も倒産もしていない存続企業に係るものであることを意味している。
ここで「生存時間」とは、調査年月から倒産年月あるいは休廃業年月までの月数を意味している。
例えば、企業コード「10001(a)」の企業の場合、調査開始年月が2010年8月であり、休廃業年月が2012年9月であるため、「休廃業までの生存期間:25ヶ月」となる。
これに対し、企業コード「10001(b)」の企業の場合、調査開始年月が2011年9月であり、休廃業年月が2012年9月であるため、「休廃業までの生存期間:12ヶ月」となる。
また企業コード「10003(a)」の企業の場合、調査開始年月が2012年5月であり、倒産年月が2019年4月であるため、「倒産までの生存期間:83ヶ月」となる。
企業コード「10003(b)」の企業の場合、調査開始年月が2016年6月であり、倒産年月が2019年4月であるため、「倒産までの生存期間:34ヶ月」となる。
ただし、期間の単位は「月」に限定されるものではなく、「年」や「週」、「日」等であってもよい。
例えば、企業コード「10001(a)」の企業の場合、調査開始年月が2010年8月であり、休廃業年月が2012年9月であるため、「休廃業までの生存期間:25ヶ月」となる。
これに対し、企業コード「10001(b)」の企業の場合、調査開始年月が2011年9月であり、休廃業年月が2012年9月であるため、「休廃業までの生存期間:12ヶ月」となる。
また企業コード「10003(a)」の企業の場合、調査開始年月が2012年5月であり、倒産年月が2019年4月であるため、「倒産までの生存期間:83ヶ月」となる。
企業コード「10003(b)」の企業の場合、調査開始年月が2016年6月であり、倒産年月が2019年4月であるため、「倒産までの生存期間:34ヶ月」となる。
ただし、期間の単位は「月」に限定されるものではなく、「年」や「週」、「日」等であってもよい。
つぎにモデル生成部12は、各登録企業に係る上記モデル生成用データをランダムサバイバルフォレスト(Random Survival Forest)のアルゴリズムに投入して機械学習を行い、倒産予測用の学習済モデルと、休廃業予測用の学習済モデルを生成し、それぞれを学習済モデル記憶部20に格納する。
ここで「ランダムサバイバルフォレスト」とは、生存時間分析用に開発された機械学習用のアルゴリズムであり、イベント(例えばWebサービスからのユーザの離脱や、投薬後の患者の死亡、機械の故障等)が発生するまでの時間と発生確率との関係性を分析するものである。
このランダムサバイバルフォレストはランダムフォレストの拡張バージョンであり、打切りデータをトレーニングデータとして利用できる利点や、ノンパラメトリックモデルとして、非線形なモデルを推定できる利点がある(詳細は後述)。
ここでいう「学習済モデル」とは、具体的にはランダムサバイバルフォレストのアルゴリズムと、調整されたパラメータ群とのセットを意味している。
ここでいう「学習済モデル」とは、具体的にはランダムサバイバルフォレストのアルゴリズムと、調整されたパラメータ群とのセットを意味している。
以下に、ランダムサバイバルフォレストのアルゴリズムを示す。
STEP 1:元のデータからブートストラップサンプルBを生成する。
STEP 2:ブートストラップサンプルごとにサバイバル木を生成する。
STEP 3:木の各ノードでp個の候補変数をランダムに選択する。
STEP 4:末端ノードが一つ以上のイベントが起きる制約下で、木を最大に成長させる。
STEP 5:各ツリーのCHF(累積ハザード関数)を計算し、アンサンブルCHFを得るために平均化する。
STEP 6:OOB(Out-Of-Bag)データを用いて、アンサンブルCHFに対する予測誤差を計算する。
STEP 1:元のデータからブートストラップサンプルBを生成する。
STEP 2:ブートストラップサンプルごとにサバイバル木を生成する。
STEP 3:木の各ノードでp個の候補変数をランダムに選択する。
STEP 4:末端ノードが一つ以上のイベントが起きる制約下で、木を最大に成長させる。
STEP 5:各ツリーのCHF(累積ハザード関数)を計算し、アンサンブルCHFを得るために平均化する。
STEP 6:OOB(Out-Of-Bag)データを用いて、アンサンブルCHFに対する予測誤差を計算する。
ランダムサバイバルフォレストの代わりに、同様の特性(ノンパラメトリックなモデル生成機能及び打切りデータへの対応機能)を備えた「DeepSurv」を用いてモデルを生成してもよい。「DeepSurv」は、ディープラーニングをベースとしたアルゴリズムである。
その他にも、Survival Trees、Bayesian Methods、Support Vector Mechines、Bagging Survival Trees、Boostingなどのアルゴリズムを採用することができる。
その他にも、Survival Trees、Bayesian Methods、Support Vector Mechines、Bagging Survival Trees、Boostingなどのアルゴリズムを採用することができる。
倒産予測用の学習済モデルを生成する際には、倒産企業の生存期間が目的変数として扱われ、その共変量が説明変数として扱われる。これに対し、休廃業企業のデータ(休廃業年月の値を備えたデータ)及び存続企業のデータ(倒産年月及び休廃業年月の値を有さないデータ)は、倒産しないまま設定期間を経過した打切りデータとして扱われる。
また、休廃業予測用の学習済モデルを生成する際には、休廃業企業の生存期間が目的変数として扱われ、その共変量が説明変数として扱われる。これに対し、倒産企業のデータ(倒産年月の値を備えたデータ)及び存続企業のデータ(倒産年月及び休廃業年月の値を有さないデータ)は、休廃業しないまま設定期間を経過した打切りデータとして扱われる。
つぎに、図4のフローチャートに従い、任意の企業の倒産予測及び休廃業予測を行う際の処理手順を説明する。
まず、図5(a)に示すように、ユーザ乙がクライアント端末28のディスプレイに表示された企業消滅リスク予測リクエスト画面30上で企業コードを入力し、必要な選択項目にチェックを入れて解析ボタン32をクリックすると、休廃業予測システム10に対して企業消滅リスク予測リクエストが送信される。
まず、図5(a)に示すように、ユーザ乙がクライアント端末28のディスプレイに表示された企業消滅リスク予測リクエスト画面30上で企業コードを入力し、必要な選択項目にチェックを入れて解析ボタン32をクリックすると、休廃業予測システム10に対して企業消滅リスク予測リクエストが送信される。
これを受けた消滅リスク予測部22は(S20)、企業情報記憶部18を参照し、指定された企業に係る必要情報を取得する(S21)。
同時に消滅リスク予測部22は、シグナル情報記憶部16を参照し、指定された企業の調査報告情報に対する他の企業からのアクセス数や、他のシグナル情報を取得する(S22)。
同時に消滅リスク予測部22は、シグナル情報記憶部16を参照し、指定された企業の調査報告情報に対する他の企業からのアクセス数や、他のシグナル情報を取得する(S22)。
つぎに消滅リスク予測部22は、学習済モデル記憶部20から倒産リスク予測用の学習済モデルと、休廃業リスク予測用の学習済モデルを取得する(S23)。
つぎに消滅リスク予測部22は、取得した当該企業の各種情報を両学習済モデルに投入し、当該企業の生存時間の確率分布を算出する(S24)。
図6(a)は、消滅リスク予測部22によって算出された累積ハザード関数を示すグラフであり、(1)がランダムサバイバルフォレスト(RSF)によって推定した倒産確率の推移を、(3)がランダムサバイバルフォレスト(RSF)によって推定した休廃業確率の推移を示している。
このグラフでは、縦軸に累積ハザード(倒産確率及び休廃業確率)が設定されると共に、横軸に時間(月数)が設定されており、時間の推移に伴い当該企業の倒産確率及び休廃業確率の累積値は上昇していくが、倒産の累積ハザードのほうが休廃業の累積ハザードよりも高い値で推移していることが読み取れる。
図6(a)は、消滅リスク予測部22によって算出された累積ハザード関数を示すグラフであり、(1)がランダムサバイバルフォレスト(RSF)によって推定した倒産確率の推移を、(3)がランダムサバイバルフォレスト(RSF)によって推定した休廃業確率の推移を示している。
このグラフでは、縦軸に累積ハザード(倒産確率及び休廃業確率)が設定されると共に、横軸に時間(月数)が設定されており、時間の推移に伴い当該企業の倒産確率及び休廃業確率の累積値は上昇していくが、倒産の累積ハザードのほうが休廃業の累積ハザードよりも高い値で推移していることが読み取れる。
図6(b)は、消滅リスク予測部22によって算出された生存時間関数を示すグラフであり、(1)がランダムサバイバルフォレスト(RSF)によって推定した生存率(非倒産確率)の推移を、(3)がランダムサバイバルフォレスト(RSF)によって推定した生存率(非休廃業確率)の推移を示している。
このグラフでは、縦軸に生存率(非倒産確率及び非休廃業確率)が設定されると共に、横軸に時間(月数)が設定されており、時間の推移に伴い当該企業の非倒産確率及び非休廃業確率は下降していくが、非倒産確率のほうが非休廃業確率よりも低い値で推移していることが読み取れる。
このグラフでは、縦軸に生存率(非倒産確率及び非休廃業確率)が設定されると共に、横軸に時間(月数)が設定されており、時間の推移に伴い当該企業の非倒産確率及び非休廃業確率は下降していくが、非倒産確率のほうが非休廃業確率よりも低い値で推移していることが読み取れる。
任意の時点tにおける累積ハザード関数をF(t)としたとき、生存時間関数S(t)との関係は、S(t)=1-F(t)と定義され、相互に裏腹の関係となり、特定企業の消滅リスクを示す点では共通した関数である。
すなわち、累積ハザード関数の上昇及び生存時間関数の下降の傾きの大きさは、共に各時点における倒産リスクあるいは休廃業リスクの大きさを意味している。
すなわち、累積ハザード関数の上昇及び生存時間関数の下降の傾きの大きさは、共に各時点における倒産リスクあるいは休廃業リスクの大きさを意味している。
ハザード回帰モデルは、イベントの発生時間に影響を与える変数を調べ、それらの変数を用いて、個体にイベントが発生するまでの時間を推定することができる。ハザード回帰モデルとして一般的なCox 比例ハザードモデルは、ベースラインハザードと相対ハザードで構成され、時間t において、変数x1,x2,x3,…, xnをもつ場合のハザードλ(t|x1,…,xn)は次の式で表される。
λ(t|x1,…,xn)=λ0(t)exp(β1x1+…+βnxn)
ベースラインハザードはλ0(t)の部分で、各個体で共通の関数であり、時間に依存し、個々の変数には依存しない項である。一方、相対ハザードは、exp(β1x1+…+βnxn)の部分で個々の変数に依存し、時間には依存しない項である。Cox 比例ハザードモデルでは、λ0(t)には仮定をおかず、式から明らかなように、個体間のハザード比は変数にのみ依存し、時間には依存しない。これを比例ハザード性と呼び、Cox 比例ハザードモデルでは、比例ハザード性が成り立つという非常に強い仮定をおく。
比例ハザード性の仮定は、企業毎に異なる倒産や休廃業のリスクの期間構造をモデルとして表現できないため、高い精度で推定することができない課題を持つ。
しかし、企業毎に倒産や休廃業のリスクの期間構造が異なったり、パラメータごとにリスクの期間構造に対して非線形な振る舞いをするものがあるため、本実施形態では、非比例ハザード性を考慮できるノンパラメトリックな非線形モデルの推定手法として、ランダムサバイバルフォレストを採用している(ランダムサバイバルフォレストのCox回帰に対する優位性については、後に詳述する)。
一方、図6(a)及び同図(b)に示すように、算出結果のグラフには多くの段差が生じる。1時点にイベントの発生例が集中し、周辺の時点にイベントの発生例がない場合に生存率が急激に落ちるため、線は垂直に伸び、段差のような形状になる。リスクの期間構造は、その時点だけリスクが高いことに説明性が乏しく、ユーザーが理解しづらい。
そこで消滅リスク予測部22は、算出結果にワイブル分布モデル等のパラメトリックモデルをフィッティングすることにより(S25)、連続確率分布としてグラフを近似することで、累積ハザード関数及び生存時間関数を滑らかなグラフとして出力する。ワイブル分布の他にも、指数分布や対数正規分布、対数ロジスティック分布モデル、ゴンペルツ分布モデル、一般化ガンマ分布などを適用することも可能である。
λ(t|x1,…,xn)=λ0(t)exp(β1x1+…+βnxn)
ベースラインハザードはλ0(t)の部分で、各個体で共通の関数であり、時間に依存し、個々の変数には依存しない項である。一方、相対ハザードは、exp(β1x1+…+βnxn)の部分で個々の変数に依存し、時間には依存しない項である。Cox 比例ハザードモデルでは、λ0(t)には仮定をおかず、式から明らかなように、個体間のハザード比は変数にのみ依存し、時間には依存しない。これを比例ハザード性と呼び、Cox 比例ハザードモデルでは、比例ハザード性が成り立つという非常に強い仮定をおく。
比例ハザード性の仮定は、企業毎に異なる倒産や休廃業のリスクの期間構造をモデルとして表現できないため、高い精度で推定することができない課題を持つ。
しかし、企業毎に倒産や休廃業のリスクの期間構造が異なったり、パラメータごとにリスクの期間構造に対して非線形な振る舞いをするものがあるため、本実施形態では、非比例ハザード性を考慮できるノンパラメトリックな非線形モデルの推定手法として、ランダムサバイバルフォレストを採用している(ランダムサバイバルフォレストのCox回帰に対する優位性については、後に詳述する)。
一方、図6(a)及び同図(b)に示すように、算出結果のグラフには多くの段差が生じる。1時点にイベントの発生例が集中し、周辺の時点にイベントの発生例がない場合に生存率が急激に落ちるため、線は垂直に伸び、段差のような形状になる。リスクの期間構造は、その時点だけリスクが高いことに説明性が乏しく、ユーザーが理解しづらい。
そこで消滅リスク予測部22は、算出結果にワイブル分布モデル等のパラメトリックモデルをフィッティングすることにより(S25)、連続確率分布としてグラフを近似することで、累積ハザード関数及び生存時間関数を滑らかなグラフとして出力する。ワイブル分布の他にも、指数分布や対数正規分布、対数ロジスティック分布モデル、ゴンペルツ分布モデル、一般化ガンマ分布などを適用することも可能である。
つぎに消滅リスク予測部22は、算出結果をクライアント端末28に送信する(S26)。この結果、クライアント端末28のディスプレイには、図5(b)に示すように、算出結果グラフ34が表示される。
図示の通り、この算出結果グラフ34は図6(b)の生存時間関数のグラフに対して、ワイプル分布モデルの適用によって推定された非倒産確率の推移を示す曲線(2)と、ワイプル分布モデルの適用によって推定された非休廃業確率の推移を示す曲線(4)を付加したものである。
この企業の場合、時間の経過に伴い非倒産確率及び非休廃業確率が共に低下していくが、一貫して倒産リスクの方が休廃業リスクを上回っていることが看取できる。
図示の通り、この算出結果グラフ34は図6(b)の生存時間関数のグラフに対して、ワイプル分布モデルの適用によって推定された非倒産確率の推移を示す曲線(2)と、ワイプル分布モデルの適用によって推定された非休廃業確率の推移を示す曲線(4)を付加したものである。
この企業の場合、時間の経過に伴い非倒産確率及び非休廃業確率が共に低下していくが、一貫して倒産リスクの方が休廃業リスクを上回っていることが看取できる。
なお、図5(a)に示した企業消滅リスク予測リクエスト画面30上では「倒産予測」と「休廃業予測」にチェックが入っていたため、算出結果グラフ34上に倒産用の線図と休廃業用の線図が表示されているが、何れか一方にのみチェックを入れておけば、他方の線図を非表示とすることができる。
またユーザ乙が、同画面30上で「累積ハザード関数」にチェックを入れておけば、累積ハザード関数用のグラフが算出結果として表示される。
またユーザ乙が、同画面30上で「累積ハザード関数」にチェックを入れておけば、累積ハザード関数用のグラフが算出結果として表示される。
さらにユーザ乙が、同画面30上で「『0』ヶ月後の倒産確率」や「『0』ヶ月後の休廃業確率」にチェックを入れると共に、「『0』ヶ月」の部分に具体的な数値を選択入力しておけば、該当企業の将来における任意の時点での倒産確率や休廃業確率を示す数値が消滅リスク予測部22によって算出され、クライアント端末28のディスプレイに表示される(図示省略)。
図7は、他の企業に係る算出結果((a)累積ハザード関数及び(b)生存時間関数)を示すグラフである。
この企業の場合には、時間の経過に伴い倒産リスク及び休廃業リスクが共に増大していく点では図6に示した企業と共通しているが、一貫して休廃業リスクが倒産リスクを上回っている。
この企業の場合には、時間の経過に伴い倒産リスク及び休廃業リスクが共に増大していく点では図6に示した企業と共通しているが、一貫して休廃業リスクが倒産リスクを上回っている。
図8は、他の企業に係る算出結果((a)累積ハザード関数及び(b)生存時間関数)を示すグラフである。
この企業の場合も、時間の経過に伴い倒産リスク及び休廃業リスクが共に増大していくが、一貫して倒産リスクが休廃業リスクを上回っている。
この企業の場合も、時間の経過に伴い倒産リスク及び休廃業リスクが共に増大していくが、一貫して倒産リスクが休廃業リスクを上回っている。
図9は、他の企業に係る算出結果((a)累積ハザード関数及び(b)生存時間関数)を示すグラフである。
この企業の場合、当初は倒産リスクと休廃業リスクが拮抗しているが、途中(50ヶ月以降)から休廃業リスクが倒産リスクを大きく上回り出すことが予想される。
この企業の場合、当初は倒産リスクと休廃業リスクが拮抗しているが、途中(50ヶ月以降)から休廃業リスクが倒産リスクを大きく上回り出すことが予想される。
図10は、他の企業に係る算出結果((a)累積ハザード関数及び(b)生存時間関数)を示すグラフである。
この企業の場合、当初は倒産リスクが休廃業リスクを上回っているが、途中で両者が交差し、以後、休廃業リスクが倒産リスクを上回っていくことが示されている。
この企業の場合、当初は倒産リスクが休廃業リスクを上回っているが、途中で両者が交差し、以後、休廃業リスクが倒産リスクを上回っていくことが示されている。
上記のように、一つの平面グラフ上に倒産リスクの推移を示す線図と休廃業リスクの推移を示す線図を同時に描画することにより、将来における特定企業のリスクの推移を複眼的に表現することが可能となり、その態様に応じて事前に有効な対策を講じることも可能となる。
例えば図10に示した企業の場合、上記の通り、現在から比較的近い時点では倒産する可能性の方が休廃業する可能性よりも高いが、50ヶ月まで時間が進行すると両曲線が交差し、以後は休廃業が倒産リスクを上回ることが読み取れる。
したがって、当該企業の消滅を回避するために、短期的には倒産リスクを低減するための対策(例えば資本の充実策等)を講じるべきであり、中長期的には休廃業リスクを低減するための対策(例えば後継者の手当等)を講じるべきである、といった判断が可能となる。
例えば図10に示した企業の場合、上記の通り、現在から比較的近い時点では倒産する可能性の方が休廃業する可能性よりも高いが、50ヶ月まで時間が進行すると両曲線が交差し、以後は休廃業が倒産リスクを上回ることが読み取れる。
したがって、当該企業の消滅を回避するために、短期的には倒産リスクを低減するための対策(例えば資本の充実策等)を講じるべきであり、中長期的には休廃業リスクを低減するための対策(例えば後継者の手当等)を講じるべきである、といった判断が可能となる。
図11は、ロジスティック回帰を用いた従来モデルと、ランダムサバイバルフォレストを用いた本発明モデルの特徴を対比するものである。
すなわち、従来モデルでは同図(a)に示すように、A社、B社、C社それぞれの生存時間(調査から倒産等するまでの所要時間)に差異があっても、一定の期間(例えば1年間)内に倒産等した場合には等しく「正解」として扱われることとなる。本来、倒産等するまでの時間が短いほど企業状態はより深刻なはずであるが、従来の手法ではこれをうまくモデルに組み込むことができなかった。
これに対し、本発明モデルの場合には同図(b)に示すように、倒産するまでの時間が短いほど、より深刻な企業状態として学習できるため、実態に即した予測結果を導出することができる。
すなわち、従来モデルでは同図(a)に示すように、A社、B社、C社それぞれの生存時間(調査から倒産等するまでの所要時間)に差異があっても、一定の期間(例えば1年間)内に倒産等した場合には等しく「正解」として扱われることとなる。本来、倒産等するまでの時間が短いほど企業状態はより深刻なはずであるが、従来の手法ではこれをうまくモデルに組み込むことができなかった。
これに対し、本発明モデルの場合には同図(b)に示すように、倒産するまでの時間が短いほど、より深刻な企業状態として学習できるため、実態に即した予測結果を導出することができる。
つぎに、ランダムサバイバルフォレストが従来手法であるCox回帰よりも有用な手法であることを詳細に検証する。
図12に、倒産のイベント発生に対してCox比例ハザードモデルおよびランダムサバイバルフォレストを用いて推定した学習済みモデルにテストデータを入力した場合の時間依存性AUC(Area Under the Curve)を示している。横軸に月数、縦軸にAUCを取ったグラフである。
図12に、倒産のイベント発生に対してCox比例ハザードモデルおよびランダムサバイバルフォレストを用いて推定した学習済みモデルにテストデータを入力した場合の時間依存性AUC(Area Under the Curve)を示している。横軸に月数、縦軸にAUCを取ったグラフである。
図13に、休廃業のイベント発生に対してCox比例ハザードモデルおよびランダムサバイバルフォレストを用いて推定した学習済みモデルにテストデータを入力した場合の時間依存性AUCを示している。横軸に月数、縦軸にAUCを取ったグラフである。
時間依存性AUCは、AUCの感度(真陽性率)および特異度(真陰性率)を時間依存性として定義し、生存時間解析に拡張したものである。推定された個社の各生存曲線について、ある時間に固定した場合の縦軸の生存率の値と個体のイベント発生の情報を用いれば、各時点でROC曲線を記述し、ROC 曲線以下の面積として定義されるAUCを計算することができる。i 番目の個体のリスクスコアf(xi)の推定量が与えられると、時間tにおける時間依存性AUCは次のように定義される。
ここでωiは、打ち切り重み逆確率であり、打ち切りをイベントとしたときの生存率の逆数である。また、yiは個体iの生存時間で、Iは指示関数である。各時点でAUC を計算するためのイベント発生の対象とする個体は、時間t(ti≦t)以前またはその時点でイベントを経験したすべての個体であるのに対し、打ち切りが起きていない個体の対象は、その時点で打ち切りが起きていないti>tとなる個体とする。時間依存性AUC は、一定の時間t(ti≦t)までにイベントを発生する個体とそれ以降(ti>t)にイベントを発生する個体をモデルがどの程度よく識別できるかを定量化している。AUCは、イベントが発生すると予測した個体が実際に発生したか、また、発生しないと予測した個体が実際に発生しなかったか、の両方をどの程度正確に予測できたかを指標化したもので、予測精度が高くなるほど1に近づく。
時間依存性AUCを用いて、ランダムサバイバルフォレストで推定したモデルの倒産のイベントの予測精度は、0~120ヶ月目のAUCの平均で、0.86程度となった。休廃業イベントの予測精度は、0.81程度となっている。
これに対して、Cox比例ハザードモデルで推定したモデルの倒産のイベントの予測精度は、0~120ヶ月目のAUCの平均で、0.84程度となった。休廃業イベントの予測精度は、0.77程度となった。
よって、ランダムサバイバルフォレストはCox比例ハザードモデルよりも高い精度で企業の将来イベント発生までの時間の予測を行えていることが理解できる。
また、図12、図13の通り、時間が経過しても、AUCが横ばいになっており、精度は低下していないことが分かる。
また、図12、図13の通り、時間が経過しても、AUCが横ばいになっており、精度は低下していないことが分かる。
図13について、6ヶ月目から10ヶ月は、AUCが低い期間となっている。一般的に、予測する対象のイベントが遠い未来の時点であるほど、その間に発生するランダムな事象の影響によって誤差が増幅されるため、対象イベントの予測の精度は低くなることが知られているが、図13ではそうなっていない。休廃業の場合は、倒産と異なり、企業の休廃業リスクが高い状態だったとしても、代表者の意思決定次第では、その発生を止めることができたり、休廃業する時期を柔軟に変えることができるため、必ずしも企業の経営状況と結果が一致しないことがありうる。
時間依存性AUC の定義から、その時点までにイベントを発生した企業群の推定生存率と、イベントを発生していない企業群の推定生存率の並び順(降順)が、イベントが発生した順に並んでいないケースが多い場合、予測精度は低下するが、代表者のランダムな判断要素が加わることで、発生時期が早まったり、遅くなったりするため、予測精度が落ちたと考えられる。1年以上先については、ランダムな要素が吸収され、予測精度が落ち着いている。一方、ランダムサバイバルフォレストで推定したモデルの時間依存性AUCでは、最もAUCの低い月で0.75程度であり、モデルの精度としては十分に担保できている。
時間依存性AUC の定義から、その時点までにイベントを発生した企業群の推定生存率と、イベントを発生していない企業群の推定生存率の並び順(降順)が、イベントが発生した順に並んでいないケースが多い場合、予測精度は低下するが、代表者のランダムな判断要素が加わることで、発生時期が早まったり、遅くなったりするため、予測精度が落ちたと考えられる。1年以上先については、ランダムな要素が吸収され、予測精度が落ち着いている。一方、ランダムサバイバルフォレストで推定したモデルの時間依存性AUCでは、最もAUCの低い月で0.75程度であり、モデルの精度としては十分に担保できている。
10 企業消滅リスク予測システム
12 モデル生成部
14 企業消滅情報記憶部
16 シグナル情報記憶部
18 企業情報記憶部
20 学習済モデル記憶部
22 消滅リスク予測部
24 予測結果記憶部
26 管理者のクライアント端末
28 ユーザのクライアント端末
30 企業消滅リスク予測リクエスト画面
32 解析ボタン
34 算出結果グラフ
12 モデル生成部
14 企業消滅情報記憶部
16 シグナル情報記憶部
18 企業情報記憶部
20 学習済モデル記憶部
22 消滅リスク予測部
24 予測結果記憶部
26 管理者のクライアント端末
28 ユーザのクライアント端末
30 企業消滅リスク予測リクエスト画面
32 解析ボタン
34 算出結果グラフ
Claims (5)
- 複数の企業に関する所定項目に係る情報を、各情報を取得した調査時期に関連付けて登録しておく企業情報記憶部と、
倒産した企業の識別情報及び倒産時期を登録しておく倒産情報記憶部と、
上記企業情報記憶部を参照し、各登録企業に係る所定項目の値を取得する手段と、
上記倒産情報記憶部を参照し、倒産している登録企業の識別情報及び倒産時期を取得する手段と、
倒産している登録企業については、調査時期から倒産時期までの生存時間を目的変数とし、上記所定項目の値を説明変数として生存時間解析用の機械学習アルゴリズムに投入し、倒産していない登録企業については、上記所定項目の値を打切りデータとして上記アルゴリズムに投入し、企業の倒産リスクの期間構造を推定する学習済モデルを生成する手段と、
この学習済モデルに特定企業に係る所定項目の値を代入することにより、当該企業の将来における倒産リスクの期間構造を予測する手段と、
この予測結果を出力する手段と、
を備えた企業消滅リスク予測システム。 - 複数の企業に関する所定項目に係る情報を、各情報を取得した調査時期に関連付けて登録しておく企業情報記憶部と、
休廃業した企業の識別情報及び休廃業時期を登録しておく休廃業情報記憶部と、
上記企業情報記憶部を参照し、各登録企業に係る所定項目の値を取得する手段と、
上記休廃業情報記憶部を参照し、休廃業している登録企業の識別情報及び休廃業時期を取得する手段と、
休廃業している登録企業については、調査時期から休廃業時期までの生存時間を目的変数とし、上記所定項目の値を説明変数として生存時間解析用の機械学習アルゴリズムに投入し、休廃業していない登録企業については、上記所定項目の値を打切りデータとして上記アルゴリズムに投入し、企業の休廃業リスクの期間構造を推定する学習済モデルを生成する手段と、
この学習済モデルに特定企業に係る所定項目の値を代入することにより、当該企業の将来における休廃業リスクの期間構造を予測する手段と、
この予測結果を出力する手段と、
を備えた企業消滅リスク予測システム。 - 複数の企業に関する所定項目に係る情報を、各情報を取得した調査時期に関連付けて登録しておく企業情報記憶部と、
倒産した企業の識別情報及び倒産時期を登録しておく倒産情報記憶部と、
休廃業した企業の識別情報及び休廃業時期を登録しておく休廃業情報記憶部と、
上記企業情報記憶部を参照し、各登録企業に係る所定項目の値を取得する手段と、
上記倒産情報記憶部を参照し、倒産している登録企業の識別情報及び倒産時期を取得する手段と、
倒産している登録企業については、調査時期から倒産時期までの生存時間を目的変数とし、上記所定項目の値を説明変数として生存時間解析用の機械学習アルゴリズムに投入し、倒産していない登録企業については、上記所定項目の値を打切りデータとして上記アルゴリズムに投入し、企業の倒産リスクの期間構造を推定する学習済モデルを生成する手段と、
上記休廃業情報記憶部を参照し、休廃業している登録企業の識別情報及び休廃業時期を取得する手段と、
休廃業している登録企業については、調査時点から休廃業時期までの生存時間を目的変数とし、上記所定項目の値を説明変数として生存時間解析用の機械学習アルゴリズムに投入し、休廃業していない登録企業については、上記所定項目の値を打切りデータとして上記アルゴリズムに投入し、企業の休廃業リスクの期間構造を推定する学習済モデルを生成する手段と、
上記倒産予測用の学習済モデルに特定企業に係る所定項目の値を代入することにより、当該企業の将来における倒産リスクの期間構造を予測し、倒産予測用グラフを生成する手段と、
上記休廃業予測用の学習済モデルに上記特定企業に係る所定項目の値を代入することにより、当該企業の将来における休廃業リスクの期間構造を予測し、休廃業予測用グラフを生成する手段と、
上記倒産予測用グラフと、休廃業予測用グラフを同一平面上に配置したものを予測結果として出力する手段と、
を備えた企業消滅リスク予測システム。 - 上記機械学習用アルゴリズムが、ランダムサバイバルフォレストであることを特徴とする請求項1~3の何れかに記載の企業消滅リスク予測システム。
- 上記予測結果のグラフに対してパラメトリックモデルを適用し、連続確率分布としてグラフを近似することで、累積ハザード関数及び生存時間関数を滑らかなグラフとして出力することを特徴とする請求項3に記載の企業消滅リスク予測システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022010195A JP2023108896A (ja) | 2022-01-26 | 2022-01-26 | 企業消滅リスク予測システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022010195A JP2023108896A (ja) | 2022-01-26 | 2022-01-26 | 企業消滅リスク予測システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023108896A true JP2023108896A (ja) | 2023-08-07 |
Family
ID=87517996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022010195A Pending JP2023108896A (ja) | 2022-01-26 | 2022-01-26 | 企業消滅リスク予測システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023108896A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102665304B1 (ko) * | 2023-12-29 | 2024-05-13 | (주)오아시스비즈니스 | 인공지능 기반의 예측 모델을 이용하여 가맹점의 휴폐업을 예측하고 이의 지표에 대한 정보를 제공하는 서버 |
JP7583221B1 (ja) | 2024-07-23 | 2024-11-13 | PayPay株式会社 | 情報処理装置、情報処理方法、およびプログラム |
-
2022
- 2022-01-26 JP JP2022010195A patent/JP2023108896A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102665304B1 (ko) * | 2023-12-29 | 2024-05-13 | (주)오아시스비즈니스 | 인공지능 기반의 예측 모델을 이용하여 가맹점의 휴폐업을 예측하고 이의 지표에 대한 정보를 제공하는 서버 |
JP7583221B1 (ja) | 2024-07-23 | 2024-11-13 | PayPay株式会社 | 情報処理装置、情報処理方法、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230252314A1 (en) | Predicting aggregate value of objects representing potential transactions based on potential transactions expected to be created | |
US20200202428A1 (en) | Graphical structure model-based credit risk control | |
Ogwueleka et al. | Neural network and classification approach in identifying customer behavior in the banking sector: A case study of an international bank | |
US8112340B2 (en) | Collateralized debt obligation evaluation system and method | |
CN110837931A (zh) | 客户流失预测方法、装置及存储介质 | |
US20050080821A1 (en) | System and method for managing collections accounts | |
US11538044B2 (en) | System and method for generation of case-based data for training machine learning classifiers | |
Van Thiel et al. | Artificial intelligence credit risk prediction: An empirical study of analytical artificial intelligence tools for credit risk prediction in a digital era | |
CN110738527A (zh) | 一种特征重要性排序方法、装置、设备和存储介质 | |
US20220319701A1 (en) | Supervised machine learning-based modeling of sensitivities to potential disruptions | |
Adepoju et al. | Technology acceptance of e-banking services in an unnatural environment | |
CN111708883A (zh) | 一种基于机器学习和设备指纹的授信额度确定方法及装置 | |
CN111179051A (zh) | 金融目标客户确定方法、装置及电子设备 | |
Leung et al. | A Dynamic Classification Approach to Churn Prediction in Banking Industry. | |
Louzada et al. | A zero-inflated non default rate regression model for credit scoring data | |
JP2023108896A (ja) | 企業消滅リスク予測システム | |
CN115630221A (zh) | 终端应用界面展示数据处理方法、装置及计算机设备 | |
Tudor et al. | A decision support system to predict financial distress. The case of Romania | |
JP6490271B1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP7043248B2 (ja) | 休廃業予測システム | |
CN117437020A (zh) | 商户风险判定方法、装置、电子设备和介质 | |
CN116664306A (zh) | 风控规则的智能推荐方法、装置、电子设备及介质 | |
CN116739750A (zh) | 贷户违约预测方法、装置、设备和介质 | |
US20060248096A1 (en) | Early detection and warning systems and methods | |
CN113610536A (zh) | 交易拒绝用户的用户策略分配方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20220202 |