JP2007048226A - 確率モデル生成方法、確率モデル生成装置およびプログラム - Google Patents

確率モデル生成方法、確率モデル生成装置およびプログラム Download PDF

Info

Publication number
JP2007048226A
JP2007048226A JP2005234813A JP2005234813A JP2007048226A JP 2007048226 A JP2007048226 A JP 2007048226A JP 2005234813 A JP2005234813 A JP 2005234813A JP 2005234813 A JP2005234813 A JP 2005234813A JP 2007048226 A JP2007048226 A JP 2007048226A
Authority
JP
Japan
Prior art keywords
variable
variables
probability
attribute
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005234813A
Other languages
English (en)
Other versions
JP4398916B2 (ja
Inventor
Minoru Nakatsugawa
実 中津川
Takeichiro Nishikawa
川 武一郎 西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2005234813A priority Critical patent/JP4398916B2/ja
Priority to US11/496,718 priority patent/US7899767B2/en
Publication of JP2007048226A publication Critical patent/JP2007048226A/ja
Application granted granted Critical
Publication of JP4398916B2 publication Critical patent/JP4398916B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】 所定の事象が発生または発生しない確率を求めるための確率モデルを簡易かつ精度よく生成する。
【解決手段】 本発明は、複数の変数を含む説明変数と、所定事象の発生の有無を表す目的変数とを有するサンプルの集合である学習データの各サンプルにおける変数と、各サンプルにおける目的変数と、第1の変換パラメータとを用いて定義される第1の目的関数を最適化して第1の変換パラメータを求め、求めた第1の変換パラメータを用いて前記変数をある値域をもつ中間変数に変換するための変換関数を生成し、前記サンプルごとの前記複数の変数の各々に対応する中間変数と第2の変換パラメータと各サンプルにおける目的変数とを用いて定義される第2の目的関数を最適化して第2の変換パラメータを求め、求めた第2の変換パラメータを用いて、複数の中間変数を含む中間説明変数から前記所定事象が発生または発生しない確率を計算するための確率モデルを生成する。
【選択図】 図1

Description

本発明は、確率モデル生成方法、確率モデル生成装置およびプログラムに関する。
信用リスクモデルとして、精度や解釈の容易さの観点から、財務指標を入力とする二項ロジットモデルを採用することが主流となっている。ロジットモデルを用いて企業の倒産確率の算出を行う手法を記載した文献として特許文献1がある。ロジットモデルをアナリストが実際に利用したときの違和感を少なくするために、財務指標の上下限値を適切に設定する必要がある。
財務指標に上限値と下限値を設定することにより、外れ値などによって推定倒産確率が大きく変化してしまうことを防ぐ効果がある。しかし、各財務指標に上下限値を決定するには、財務諸表や実運用に関する専門的な知識を要する。
特開2000-259729公報
本発明は、所定の事象が発生または発生しない確率を求めるための確率モデルを簡易かつ精度よく生成できる、確率モデル生成方法、確率モデル生成装置およびプログラムを提供する。
本発明の一態様としての確率モデル生成方法は、複数の変数を含む説明変数と、所定事象の発生の有無を表す目的変数とを有するサンプルの集合である学習データを用いて、前記所定事象が発生または発生しない確率を計算するための確率モデルを生成する確率モデル生成方法であって、前記学習データの各サンプルにおける前記変数と、前記各サンプルにおける前記目的変数と、第1の変換パラメータとを用いて定義される第1の目的関数を最適化することによって前記第1の変換パラメータを求めることを前記変数の属性ごとに行い、前記変数の属性ごとに、前記属性をもつ変数をある値域をもつ中間変数に変換するための変換関数を前記属性に対応する第1の変換パラメータを用いて生成し、前記サンプルごとの前記複数の変数の各々に対応する前記中間変数と、第2の変換パラメータと、前記各サンプルにおける前記目的変数とを用いて定義される第2の目的関数を最適化することにより前記第2の変換パラメータを求め、求めた前記第2の変換パラメータを用いて、複数の中間変数を含む中間説明変数から前記所定事象が発生または発生しない確率を計算するための確率モデルを生成する。
本発明の一態様としての確率モデル生成方法は、複数の変数を含む説明変数と、所定事象の発生の有無を表す目的変数とを有するサンプルの集合である学習データを用いて、前記所定事象が発生または発生しない確率を計算するための確率モデルを生成する確率モデル生成方法であって、前記学習データの各サンプルにおける各前記変数と、前記各サンプルにおける前記目的変数と、前記変数の属性ごとの第1の変換パラメータと、第2の変換パラメータとを用いて定義される目的関数を最適化することによって前記第1および第2の変換パラメータを求め、前記変数の属性ごとに、前記属性をもつ変数をある値域をもつ中間変数に変換するための変換関数を前記属性に対応する前記第1の変換パラメータを用いて生成し、求めた前記第2の変換パラメータを用いて、複数の中間変数を含む中間説明変数から前記所定事象が発生または発生しない確率を計算するための確率モデルを生成する。
本発明の一態様としての確率モデル生成装置は、複数の変数を含む説明変数と、所定事象の発生の有無を表す目的変数とを有するサンプルの集合を学習データとして格納したデータベースと、前記各サンプルにおける前記変数と、前記各サンプルにおける前記目的変数と、第1の変換パラメータとを用いて定義される第1の目的関数を最適化することによって前記第1の変換パラメータを求めることを前記変数の属性ごとに行い、前記変数の属性ごとに、前記属性をもつ変数をある値域をもつ中間変数に変換するための変換関数を前記属性に対応する前記第1の変換パラメータを用いて生成する上下限設定手段と、前記サンプルごとの前記複数の変数の各々に対応する前記中間変数と、第2の変換パラメータと、前記各サンプルにおける前記目的変数とを用いて定義される第2の目的関数を最適化することにより前記第2の変換パラメータを求め、求めた前記第2の変換パラメータを用いて、複数の中間変数を含む中間説明変数から前記所定事象が発生または発生しない確率を計算するための確率モデルを生成するモデル生成手段と、を備える。
本発明の一態様としてのプログラムは、複数の変数を含む説明変数と、所定事象の発生の有無を表す目的変数とを有するサンプルの集合である学習データの各サンプルにおける前記変数と、前記各サンプルにおける前記目的変数と、第1の変換パラメータとを用いて定義される第1の目的関数を最適化することによって前記第1の変換パラメータを求めることを前記変数の属性ごとに行うステップと、前記変数の属性ごとに、前記属性をもつ変数をある値域をもつ中間変数に変換するための変換関数を前記属性に対応する前記第1の変換パラメータを用いて生成するステップと、前記サンプルごとの前記複数の変数の各々に対応する前記中間変数と、第2の変換パラメータと、前記各サンプルにおける前記目的変数とを用いて定義される第2の目的関数を最適化することにより前記第2の変換パラメータを求めるステップと、求めた前記第2の変換パラメータを用いて、複数の中間変数を含む中間説明変数から前記所定事象が発生または発生しない確率を計算するための確率モデルを生成するステップと、をコンピュータに実行させる。
本発明により、所定の事象が発生または発生しない確率を求めるための確率モデルを簡易かつ精度よく生成できる。
(第1の実施の形態)
図1は、本発明の第1の実施の形態としての確率モデル生成装置の概略構成を示すブロック図である。
この確率モデル生成装置は、財務データベースDB1、倒産情報データベースDB2、財務データ読込手段A1、財務データ記憶手段A2、倒産情報読込手段A3、倒産情報記憶手段A4、財務指標値上下限設定手段A5、変換後指標値記憶手段A6、倒産確率算出手段A7および倒産確率記憶手段A8を備える。
図1の各手段の処理は、1つのコンピュータ機器で行ってもよいし、複数のコンピュータ機器で分散して行ってもよい。また、各手段の処理は、あらかじめ作成したプログラムをCPUに実行させることによって実現してもよいし、ハードウェア的に実現してもよいし、これらの組み合わせによって実現してもよい。
財務データ読込手段A1は、企業のある年度の財務指標値を財務データベースDB1から読み込む。
図2は、財務データベースDB1に格納された財務データ例を示す。ここには、5つの財務指標(属性)1〜5(売上高総利益率、自己資本比率、経常利益、売上債権回転期間、売上高増加率)が示される。1つの企業における財務指標1〜5の値の集合は例えば説明変数に対応し、1つの企業の各財務指標の値はそれぞれ変数に対応する。
図2のような形式のデータから、指定された企業群(例えば建設業の企業)の、指定された財務指標値(例えば自己資本比率、売上高増加率、経常利益増加率など)を読み出して、財務データ記憶手段A2に格納する。財務データ記憶手段A2はDRAM(Dynamic Random Access Memory)等のメモリ装置であっても良いし、データ量が多い場合にはハードディスクでもよい。
倒産情報読込手段A3は、倒産情報データベースDB2から企業の倒産情報を読み込んで、倒産情報記憶手段A4に格納する。倒産情報は、所定の基準日(例えば企業の決算日)から一年以内に倒産したかどうかの情報を含む。倒産情報記憶手段A4はDRAM等のメモリ装置でもよいし、データ量が多い場合にはハードディスクでもよい。
図3は、倒産情報データベースDB2に格納された企業の倒産情報の例を示す。
倒産情報の“1”は、企業が1年以内に倒産したことを表し、倒産情報の“0”は、企業が1年以内に倒産していないことを表す。倒産情報は例えば目的変数に対応し、“倒産”は例えば所定の事象に対応する。説明変数と目的変数とのペアは例えばサンプルに対応する。本実施の形態において倒産情報データベースDB2と財務データベースDB1は別個に設けられているが、これらのデータベースDB1、DB2内のデータが1つのデータベースに保存されてもよく、本発明はこれを含む。
財務指標値上下限設定手段A5は、財務データ記憶手段A2から財務指標値、倒産情報記憶手段A4から倒産情報を受け取り、以下のようにして財務指標値を変換する。
j番目の企業のi番目の財務指標値Xijの変換後の値をYijとする。Yは例えば中間変数に対応する。ロジット変換で財務指標値を変換する場合、その変換のパラメータをα,βとすると、変換は(式1)で表される。
Figure 2007048226
ロジスティック関数は0、1に漸近するので、この変換は財務指標値の上下限値を設定することに相当する。ロジスティック関数のグラフの一例を図4に示す。変換のパラメータα,βは、対数尤度
Figure 2007048226
を最大にするように学習する。ロジスティック関数の場合、対数尤度の最適化は、いわゆる凸問題であるため、ニュートン法や最急降下法などの周知の手法で行うことができる。
(式2)において、Nは財務データ記憶手段A2に格納された企業の数を表す。cjは、j番目の企業が1年以内に倒産する場合に1、非倒産の場合に0となる確率変数である。
財務指標値上下限設定手段A5は、変換後の財務指標値Yを、変換後指標値記憶手段A6に格納する。変換後指標値記憶手段A6はDRAM等のメモリ装置でもよいし、データ量が多い場合にはハードディスクでもよい。図2の財務指標値1(売上高総利益率)を(式1)により変換した例を図5に示す。変換前の各企業の財務指標値は、0から1の範囲に変換される。
倒産確率算出手段A7は、変換後指標値記憶手段A6から変換後の財務指標値Yを受け取り、企業の倒産確率を(式3)で表されるロジットモデル(変換後の財務指標を線形結合した二項ロジットモデル)で算出する。
Figure 2007048226
ここで、Pj はj番目の企業の倒産確率であり、Mは倒産確率算出に用いる財務指標の総数を表す。ベクトル(Y1j, Y2j, Y3j,・・・YMj)は例えば中間説明変数に対応する。変換のパラメータγ,δは、対数尤度
Figure 2007048226
を最大にするようにニュートン法などを用いて学習する。このように、本実施の形態では、財務指標値変換のパラメータを学習した後、ロジットモデルのパラメータを学習する。
倒産確率算出手段A7は、算出した倒産確率Pを、倒産確率記憶手段A8に格納する。倒産確率記憶手段A8はDRAM等のメモリ装置でもよいし、データ量が多い場合にはハードディスクでもよい。図6に、図2および図3のデータに基づき、(式1)および(式3)から算出した各企業の倒産確率を示す。
このように、パラメータα,βが決定された(式1)およびパラメータγ,δが決定された(式3)を用いて、評価対象となる企業の財務指標値から当該企業が1年以内に倒産する確率を算出できる。
より詳細には、図示しない入力部からある企業の財務指標値を入力する。入力する財務指標は、パラメータα、βを決定する際に用いたものと同じである。財務指標値上下設定手段A5は、入力部から入力された財務指標値を(式1)のXに入力して財務指標値を変換し、変換後の財務指標値を変換後指標値記憶手段A6に格納する。倒産確率算出手段A7は、変換後指標値記憶手段A6から変換後の財務指標値を読み出し、読み出した財務指標値を(式3)のYに入力して、この企業が1年以内に倒産する確率を算出する。倒産確率算出手段A7は、算出した倒産確率を倒産確率記憶手段A8に格納する。
以上では、財務指標値のロジット変換式として(式1)を用いたが、この式に、二次の項や対数の項を加えた変換式を用いてもよい。一例として(式1)に二次の項を加えた(式5)を以下に示す。
Figure 2007048226
このように二次の項や対数の項を加えることにより、財務指標値と倒産確率との関係が線形でない財務指標もモデル化できる。
ところで、従来では、図15に示すように、財務指標値の上下限値を、財務諸表や実運用に関する専門的な知識を有する専門家が決定していた。この例は100以上の財務指標値は100に、−100以下の財務指標値は−100に変換することを示す。これら元の財務指標値における「100」および「−100」がそれぞれ上限および下限に相当する。このように従来では上下限値の設定に専門家の知識を必要とし、上下限値を簡易に決定することができなかった。
これに対し、本実施の形態では、財務指標値を変換するためのロジスティック関数のパラメータを学習し、変換後の財務指標値から企業の倒産確率を求めるための確率モデルのパラメータを学習する。ロジスティック関数のパラメータの学習は、上下限値を設定するのと実質的に等価であるといえる。このように、本実施の形態では上下限値を自動設定できるとともに、精度のよい確率モデルを簡易に生成できる。
(第2の実施の形態)
第1の実施の形態では財務指標値変換のパラメータとロジットモデルのパラメータとを別々に学習したが、本第2の実施の形態では財務指標値変換のパラメータとロジットモデルのパラメータとを一度に学習することを特徴とする。以下本実施の形態について詳細に説明する。
図7は、本発明の第2の実施の形態としての確率モデル生成装置の概略構成を示すブロック図である。
この確率モデル生成装置は、財務データベースDB11、倒産情報データベースDB12、財務データ読込手段B1、財務データ記憶手段B2、倒産情報読込手段B3、倒産情報記憶手段B4、財務指標値上下限設定・倒産確率算出手段B5、変換後指標値記憶手段B6、および倒産確率記憶手段B7を備える。
財務データ読込装置B1は、企業のある年度の財務データを財務データベースDB11から読み込む。図2のような形式のデータから、指定された企業群(例えば建設業の企業)の、指定された財務指標値(例えば自己資本比率、売上高増加率、経常利益増加率など)を読み出して、財務データ記憶手段B2に格納する。財務データ記憶手段B2はDRAM等のメモリ装置でもよいし、データ量が多い場合にはハードディスクでもよい。
倒産情報読込手段B3は、倒産情報データベースDB12から、図3のような企業の倒産情報(1年以内に倒産したかどうか)を読み出して、倒産情報記憶手段B4に格納する。倒産情報記憶手段B4はDRAM等のメモリ装置でもよいし、データ量が多い場合にはハードディスクでもよい。
財務指標値上下限設定・倒産確率算出手段B5は、財務データ記憶手段B2から財務指標値、倒産情報記憶手段B4から倒産情報を受け取り、財務指標値を変換し、倒産確率を算出する。より詳細には以下の通りである。
j番目の企業のi番目の財務指標値Xijの変換後の値をYijとする。ロジット変換で財務指標値を変換する場合、その変換のパラメータをα,βとすると、変換は(式6)で表される。
Figure 2007048226
ロジスティック関数は0、1に漸近するので、この変換は財務指標値の上下限値を設定することに相当する。企業の倒産確率は(式7)で表されるロジットモデルで算出する。Pj はj番目の企業の倒産確率であり、Mは倒産確率算出に用いる財務指標の総数を表す。
Figure 2007048226
(式6)および(式7)における変換のパラメータα,β,γ,δは、対数尤度
Figure 2007048226
を最大にするようにニュートン法などを用いて学習する。あるいは、図8に示す構造を有するネットワーク(中間ノードが全ての入力ノードに接続されていない点において特殊なニューラルネットワークといえる)を利用して、対数尤度を最大化するように、パラメータを学習してもよい。(式8)において、Nは財務データ記憶手段B2に記憶された企業の数を表し、cjは、j番目の企業が1年以内に倒産する場合に1、非倒産の場合に0となる確率変数である。
変換後の財務指標値Yは、変換後指標値記憶手段B6に格納する。変換後指標値記憶手段B6はDRAM等のメモリ装置でもよいし、データ量が多い場合にはハードディスクでもよい。
一方、算出した倒産確率Pは、倒産確率記憶手段B7に格納する。倒産確率記憶手段B7はDRAM等のメモリ装置でもよいし、データ量が多い場合にはハードディスクでもよい。
以上のようにしてパラメータα,βが決定された(式6)およびパラメータγ,δが決定された(式7)を用いて、評価対象となる企業の財務指標値から当該企業が1年以内に倒産する確率を算出できる。
より詳細には、図示しない入力部からある企業の財務指標値を入力する。入力する財務指標は、パラメータα、β、γ,δを決定する際に用いたものと同じである。財務指標値上下設定・倒産確率算出手段B5は、入力部から入力された財務指標値を(式6)のXに入力して財務指標値を変換し、変換後の財務指標値を変換後指標値記憶手段B6に格納する。財務指標値上下設定・倒産確率算出手段B5は、変換後指標値記憶手段B6から変換後の財務指標値を読み出し、読み出した財務指標値を(式7)のYに入力して、この企業が1年以内に倒産する確率を算出する。財務指標値上下設定・倒産確率算出手段B5は、算出した倒産確率を倒産確率記憶手段B7に格納する。
以上のように、本実施の形態によれば、財務指標値変換のパラメータとロジットモデルのパラメータとを一度に学習するようにしたため、パラメータ計算に要する全体時間を短くすることができる。
(第3の実施の形態)
本実施の形態では、財務指標値を変換するための関数として折れ線関数を採用する。以下、図1を用いて本実施の形態について、詳細に説明する。
財務データ読込手段A1は、企業のある年度の財務データを格納した財務データベースDB1から、指定された企業群(例えば建設業の企業)の、指定された財務指標値(例えば自己資本比率、売上高増加率、経常利益増加率など)を読み出して、財務データ記憶手段A2に格納する。
倒産情報読込手段A3は、倒産情報データベースDB2から企業の倒産情報(一年以内に倒産したかどうか)を読み込んで、倒産情報記憶手段A4に格納する。
財務指標値上下限設定手段A5は、財務データ記憶手段A2から財務指標値、倒産情報記憶手段A4から倒産情報を受け取り、財務指標値を変換する。ここで、j番目の企業のi番目の財務指標値Xijの変換後の値をYijとする。本実施の形態では折れ線関数で財務指標値を変換する場合を考える。たとえば、以下のような方法がある。
{b1, ・・・,bK+1}を財務指標Xiの区切りの境界点(b1,bK+1は財務指標Xiの最小値、最大値)、{q1,・・・,qK}を各区切り区間に対応する倒産確率、すなわち
Figure 2007048226
とする。また、{m1, ・・・,mK}を各区切り区間の中央の点(つまり、mt=(bt+bt+1)/2, t=1,・・・,K)とする。財務指標値Xijの変換後の値Yijを以下の(式10)で定義する。
Figure 2007048226
この変換は折れ線関数による変換に相当する。図9に折れ線関数のグラフ例を示す。この例は、変換前の財務指標において、上下限値を20, 100に設定したことに相当する。
ここで、区切りの境界点{b2, ・・・,bK}は、財務指標値と倒産情報とを学習データとして、対数尤度l(b2, ・・・,bK)を以下の(式11)で定義し、l(b2, ・・・,bK)が最大となるように求める。例えば、{b2, b3 }、{b2, b3,,b4}、{b2, b3,b4,b5}・・・のそれぞれについて、対数尤度が最大となるように各要素の値を求める。
Figure 2007048226
ただし、Nは財務データ記憶手段A2に格納された企業の数を表す。cjは、j番目の企業が1年以内に倒産する場合に1、非倒産の場合に0となる確率変数である。
区切り数Kの決定方法には、別の年度の財務指標値と倒産情報をテストデータとして利用して、テストデータに対する対数尤度
Figure 2007048226
が最も大きいモデルの区切り数Kを採用するなどの方法がある。例えば、(式11)で求めた{b2, b3 }、{b2, b3,,b4}、{b2, b3,b4,b5}・・・のそれぞれについて、(式12)から対数尤度を求め、対数尤度が最も大きいものをこれらの中から選択する。ただし、N’は、計算に利用する別の年度の企業の数を表す。c’jは、j番目の企業が1年以内に倒産する場合に1、非倒産の場合に0となる確率変数である。
財務指標値上下限設定手段A5は、変換後の財務指標値Yを、変換後指標値記憶手段A6に格納する。
倒産確率算出手段A7は、変換後指標値記憶手段A6から変換後の財務指標値Yを受け取り、企業の倒産確率を(式13)で表されるロジットモデルで算出する。
Figure 2007048226
ここで、Pj はj番目の企業の倒産確率であり、Mは倒産確率算出に用いる財務指標の総数を表す。変換のパラメータγ,δは、対数尤度
Figure 2007048226
を最大にするように学習する。倒産確率算出手段A7は、算出した倒産確率Pを、倒産確率記憶手段A8に格納する。
以上のように、本実施の形態によれば、財務指標値を変換するための折れ線関数のパラメータを学習し、変換後の財務指標値から企業の倒産確率を求めるための確率モデルのパラメータを学習する。折れ線関数のパラメータの学習は、上下限値を設定することに等しいといえる。このように、本実施の形態では上下限値を自動設定できるとともに、精度のよい確率モデルを簡易に生成できる。
(第4の実施の形態)
本実施の形態は、銀行の営業店で行なわれている事務作業において、損失事故の発生する確率を評価しようとするものである。
まず、事務作業を単位事務(新規通帳作成、送金等)に分割する。銀行ではオンライン化が進んでおり、新規通帳作成や、送金など各種業務が何件発生するか容易にカウントできる。そこで、各業務ごとにどの程度の時間が必要かという標準時間を予め設定しておけば、標準時間と件数の積から、各業務における業務量をそれぞれ算出できる。計算方法から分かるとおり業務量は時間で表され、ここでは、秒単位で取り扱うものとする。ある業務について、このように計算された業務量を均等な長さの単位業務にそれぞれ分割しておくこととし、単位業務の長さを十分小さくしておく。本実施の形態では単位業務の長さを3,600秒とする。このとき、一つの単位業務で2回損失事故が発生することは稀であるため無視するとする。よって単位業務内の損失事故件数は0または1となる。仮に、ある業務について、銀行の月間業務量が100時間だとすると、単位業務は100個存在することになる。ある業務について、個々の単位業務をjで識別し、単位業務内部で事故が発生していればcj=1、単位業務内部で事故が発生していなければ、cj=0とする。また、説明変数として図10に示す指標を考える。説明変数を
Figure 2007048226
(ベクトルxj=(x1j,・・・x16j))として表す。
ただし、同一の営業店で実施されたある業務について、各単位業務のベクトルxjの値(ベクトルxj =ベクトルzj)は全て同じであると想定する。また、ベクトルzjは半年前の指標値を用いることとする。つまり、図11のように、ベクトルxjと半年後のcjの対のデータをもとに、半年後の損失事故発生確率を推定するモデルを構築する。
例えば、A営業店の単位業務数が100個であり、損失事故が2件発生していれば、A営業店について図12に示すデータが得られる(Zaはすべて同一のベクトル)。
同様に、他の営業点についてもデータを作成し、全ての営業店についてのデータをまとめた、図13に示すデータを得る。このデータを用いて第1〜第3の実施の形態と同様にして、精度の良いモデルを簡易に作成する。
(第5の実施の形態)
病院のケアで間違いがあった場合、間違いがケアの実施前に発見された事例、あるいは間違いがあったが患者に影響がなかった事例をインシデントと呼ぶ。一方、間違いが起こり、患者に影響があった事例、患者が死亡もしくは患者に障害が残った事例、あるいは濃厚な処置や治療を要した事例をアクシデントと呼ぶ。本実施の形態では、看護師毎にアクシデント発生確率を算出するモデルを構築する。
所定の半年間に看護師がアクシデントを起こすかどうかを変数cで表す。つまり、看護師jがアクシデントを起こす場合にcj=1、看護師jがアクシデントを起こさない場合にcj=0とする。半年間にアクシデントを2回起こすことは稀であるので、本実施の形態でもcは0または1をとる。また、同じ半年間に図14に示す指標を計測する。
これら値を
Figure 2007048226
(ベクトルxj=(x1j,・・・x16j))として表す。ベクトルxj=(x1j,・・・x16j)は説明変数に対応する。ここで、
Figure 2007048226
のデータを対象として、第1〜第3の実施の形態と同様にしてモデルを作成する。Nは看護師の数を表す。
本実施の形態では、ベクトルxjとcjは同じ時期に計測されるデータであるため、将来のcj=1となる確率を推定するには、将来のベクトルxjを推定し、この値をモデルに代入する必要がある。この際、cj=0であっても、cj=1となる確率が高い場合には、リスクが顕在化していないだけだと判断して対策を取る、というような使い方も考えられる。
本発明の第1の実施の形態としての確率モデル生成装置の概略構成を示すブロック図 財務指標値の例を示す図 企業の倒産情報の例を示す図 ロジスティック関数のグラフの一例を示す図 変換前と変換後の財務指標値を示す図 各企業の倒産確率を表すテーブルを示す図 本発明の第2の実施の形態としての確率モデル生成装置の概略構成を示すブロック図 ネットワーク構造の一例を示す図 財務指標値を変換する折れ線関数のグラフ例を示す図 説明変数の例を示す図 半年後における損失事故発生確率を推定するモデルの生成に用いるデータを説明する図 営業店Aのデータ例を示す図 全営業店のデータ例を示す図 説明変数の例を示す図 財務指標値の上下限値を専門家により決定する例を説明する図
符号の説明
DB1、DB11:財務データベース
DB2、DB12:倒産情報データベース
A1、B1:財務データ読込手段
A2、B2:財務データ記憶手段
A3、B3:倒産情報読込手段
A4、B4:倒産情報記憶手段
A5:財務指標値上下限設定手段
A6、B6:変換後指標値記憶手段
A7:倒産確率算出手段
A8、B7:倒産確率記憶手段
B5:財務指標値上下限設定・倒産確率算出手段

Claims (9)

  1. 複数の変数を含む説明変数と、所定事象の発生の有無を表す目的変数とを有するサンプルの集合である学習データを用いて、前記所定事象が発生または発生しない確率を計算するための確率モデルを生成する確率モデル生成方法であって、
    前記学習データの各サンプルにおける前記変数と、前記各サンプルにおける前記目的変数と、第1の変換パラメータとを用いて定義される第1の目的関数を最適化することによって前記第1の変換パラメータを求めることを前記変数の属性ごとに行い、
    前記変数の属性ごとに、前記属性をもつ変数をある値域をもつ中間変数に変換するための変換関数を前記属性に対応する第1の変換パラメータを用いて生成し、
    前記サンプルごとの前記複数の変数の各々に対応する前記中間変数と、第2の変換パラメータと、前記各サンプルにおける前記目的変数とを用いて定義される第2の目的関数を最適化することにより前記第2の変換パラメータを求め、
    求めた前記第2の変換パラメータを用いて、複数の中間変数を含む中間説明変数から前記所定事象が発生または発生しない確率を計算するための確率モデルを生成する、
    確率モデル生成方法。
  2. 複数の変数を含む説明変数と、所定事象の発生の有無を表す目的変数とを有するサンプルの集合である学習データを用いて、前記所定事象が発生または発生しない確率を計算するための確率モデルを生成する確率モデル生成方法であって、
    前記学習データの各サンプルにおける各前記変数と、前記各サンプルにおける前記目的変数と、前記変数の属性ごとの第1の変換パラメータと、第2の変換パラメータとを用いて定義される目的関数を最適化することによって前記第1および第2の変換パラメータを求め、
    前記変数の属性ごとに、前記属性をもつ変数をある値域をもつ中間変数に変換するための変換関数を前記属性に対応する前記第1の変換パラメータを用いて生成し、
    求めた前記第2の変換パラメータを用いて、複数の中間変数を含む中間説明変数から前記所定事象が発生または発生しない確率を計算するための確率モデルを生成する、
    確率モデル生成方法。
  3. 前記目的関数は対数尤度関数であり、前記対数尤度関数を最大化することにより前記目的関数を最適化することを特徴とする請求項1または2に記載の確率モデル生成方法。
  4. 前記変換関数は、ロジスティック関数であることを特徴とする請求項1ないし3のいずれかに記載の確率モデル生成方法。
  5. 前記ロジスティック関数は、前記変数のn次の項(nは2以上の整数)、または前記変数を含む対数項を有することを特徴とする請求項4に記載の確率モデル生成方法。
  6. 前記変換関数は、折れ線関数であり、前記折れ線関数は、前記変数の値が第1の閾値以上では第1の一定値を前記中間変数の値として出力し、前記変数の値が第2の閾値以下では第2の一定値を前記中間変数の値として出力することを特徴とする請求項1ないし3のいずれかに記載の確率モデル生成方法。
  7. 前記確率モデルは、二項ロジットモデルであり、前記中間変数の線形結合を含むことを特徴とする請求項1ないし6のいずれかに記載の確率モデル生成方法。
  8. 複数の変数を含む説明変数と、所定事象の発生の有無を表す目的変数とを有するサンプルの集合を学習データとして格納したデータベースと、
    前記各サンプルにおける前記変数と、前記各サンプルにおける前記目的変数と、第1の変換パラメータとを用いて定義される第1の目的関数を最適化することによって前記第1の変換パラメータを求めることを前記変数の属性ごとに行い、前記変数の属性ごとに、前記属性をもつ変数をある値域をもつ中間変数に変換するための変換関数を前記属性に対応する前記第1の変換パラメータを用いて生成する上下限設定手段と、
    前記サンプルごとの前記複数の変数の各々に対応する前記中間変数と、第2の変換パラメータと、前記各サンプルにおける前記目的変数とを用いて定義される第2の目的関数を最適化することにより前記第2の変換パラメータを求め、求めた前記第2の変換パラメータを用いて、複数の中間変数を含む中間説明変数から前記所定事象が発生または発生しない確率を計算するための確率モデルを生成するモデル生成手段と、
    を備えた確率モデル生成装置。
  9. 複数の変数を含む説明変数と、所定事象の発生の有無を表す目的変数とを有するサンプルの集合である学習データの各サンプルにおける前記変数と、前記各サンプルにおける前記目的変数と、第1の変換パラメータとを用いて定義される第1の目的関数を最適化することによって前記第1の変換パラメータを求めることを前記変数の属性ごとに行うステップと、
    前記変数の属性ごとに、前記属性をもつ変数をある値域をもつ中間変数に変換するための変換関数を前記属性に対応する前記第1の変換パラメータを用いて生成するステップと、
    前記サンプルごとの前記複数の変数の各々に対応する前記中間変数と、第2の変換パラメータと、前記各サンプルにおける前記目的変数とを用いて定義される第2の目的関数を最適化することにより前記第2の変換パラメータを求めるステップと、
    求めた前記第2の変換パラメータを用いて、複数の中間変数を含む中間説明変数から前記所定事象が発生または発生しない確率を計算するための確率モデルを生成するステップと、
    をコンピュータに実行させるためのプログラム。
JP2005234813A 2005-08-12 2005-08-12 確率モデル生成装置およびプログラム Expired - Fee Related JP4398916B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005234813A JP4398916B2 (ja) 2005-08-12 2005-08-12 確率モデル生成装置およびプログラム
US11/496,718 US7899767B2 (en) 2005-08-12 2006-08-01 Probabilistic model generation method, apparatus, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005234813A JP4398916B2 (ja) 2005-08-12 2005-08-12 確率モデル生成装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2007048226A true JP2007048226A (ja) 2007-02-22
JP4398916B2 JP4398916B2 (ja) 2010-01-13

Family

ID=37743715

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005234813A Expired - Fee Related JP4398916B2 (ja) 2005-08-12 2005-08-12 確率モデル生成装置およびプログラム

Country Status (2)

Country Link
US (1) US7899767B2 (ja)
JP (1) JP4398916B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009048236A (ja) * 2007-08-13 2009-03-05 Chugoku Electric Power Co Inc:The 倒産確率算出システム、方法及びプログラム
JP2010271877A (ja) * 2009-05-21 2010-12-02 Yamaguchi Univ 災害発生確率評価システムとそのプログラム
JP2011504061A (ja) * 2007-11-14 2011-01-27 クゥアルコム・インコーポレイテッド 移動環境においてターゲットコンテンツメッセージのユーザ相互関連付けを学習および予測するためにキーワードベクトルおよび関連するメトリックを使用する方法およびシステム
JP2013080456A (ja) * 2011-09-21 2013-05-02 Norihide Noda 企業評価システム、企業評価方法及び企業評価プログラム
US9392074B2 (en) 2007-07-07 2016-07-12 Qualcomm Incorporated User profile generation architecture for mobile content-message targeting
US9391789B2 (en) 2007-12-14 2016-07-12 Qualcomm Incorporated Method and system for multi-level distribution information cache management in a mobile environment
US9398113B2 (en) 2007-07-07 2016-07-19 Qualcomm Incorporated Methods and systems for providing targeted information using identity masking in a wireless communications device
JP2019117443A (ja) * 2017-12-26 2019-07-18 株式会社帝国データバンク 休廃業予測システム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7792769B2 (en) * 2006-05-08 2010-09-07 Cognika Corporation Apparatus and method for learning and reasoning for systems with temporal and non-temporal variables
US7958048B2 (en) 2006-06-30 2011-06-07 Corelogic Information Solutions, Inc. Method and apparatus for predicting outcomes of a home equity line of credit
US20100138807A1 (en) * 2008-12-03 2010-06-03 Bogdan Pamela A M Method and System for Benefits Calculator for Information Technology Projects
US8452679B2 (en) * 2011-08-26 2013-05-28 Bank Of America Corporation Financial statement analyzer
US10248957B2 (en) * 2011-11-02 2019-04-02 Ignite Marketing Analytics, Inc. Agent awareness modeling for agent-based modeling systems
WO2013067247A1 (en) * 2011-11-02 2013-05-10 ThinkVine Corporation Agent generation for agent-based modeling systems
JP2014228887A (ja) * 2013-05-17 2014-12-08 株式会社東芝 稼働データ分析装置およびその方法、ならびにプログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6023686A (en) 1996-02-20 2000-02-08 Health Hero Network Method for conducting an on-line bidding session with bid pooling
US5794207A (en) 1996-09-04 1998-08-11 Walker Asset Management Limited Partnership Method and apparatus for a cryptographically assisted commercial network system designed to facilitate buyer-driven conditional purchase offers
US5742775A (en) 1995-01-18 1998-04-21 King; Douglas L. Method and apparatus of creating financial instrument and administering an adjustable rate loan system
IL117424A (en) 1995-04-27 1999-09-22 Optimark Tech Inc Crossing network utilizing satisfaction density profile
DE69717359T2 (de) * 1996-07-29 2003-04-30 Matsushita Electric Ind Co Ltd Verfahren zur Komprimierung und Dekomprimierung von eindimensionalen Zeitserien
US5966699A (en) 1996-10-11 1999-10-12 Zandi; Richard System and method for conducting loan auction over computer network
JP3420488B2 (ja) 1996-12-03 2003-06-23 富士通株式会社 金融情報仲介処理装置、金融情報仲介処理方法およびそのプログラムを格納した記録媒体
JP2000259719A (ja) 1999-03-08 2000-09-22 Internatl Business Mach Corp <Ibm> 債務不履行の確率を計算する方法及び装置
JP2001216403A (ja) * 2000-02-04 2001-08-10 Hiroshi Shirakawa オークションシステム及びオークション方法
JP2001338124A (ja) 2000-05-26 2001-12-07 Sakura Bank Ltd オペレーショナルリスク計量システム及びオペレーショナルリスク計量方法及びコンピュータシステムにオペレーショナルリスクの計量を行なわせるためのコンピュータソフトウエアプログラム格納媒体
US20020116312A1 (en) 2000-12-05 2002-08-22 Talbot Kevin L. Method and apparatus for providing a reverse blind electronic credit auction
US20020120557A1 (en) 2000-12-27 2002-08-29 Yung-Sung Chien Automatic loan administration system
US20030101132A1 (en) 2001-11-29 2003-05-29 Gaubatz Dieter S. System and method for developing loss assumptions
CA2364425A1 (en) 2001-12-05 2003-06-05 Algorithmics International Corp. A system for calculation of operational risk capital
US6961719B1 (en) * 2002-01-07 2005-11-01 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Hybrid neural network and support vector machine method for optimization
JP2004005626A (ja) 2002-03-26 2004-01-08 Nli Research Institute 債券投資分析・信用リスク計量分析システム
JP2004185421A (ja) 2002-12-04 2004-07-02 Mitsubishi Trust & Banking Corp 財務定量評価システム
AU2003303250A1 (en) 2002-12-20 2004-07-14 Accenture Global Services Gmbh Quantification of operational risks
US20040205019A1 (en) 2003-04-08 2004-10-14 Lendingtree, Inc. Method and system for selecting qualification forms for financial services and financial products
ITMI20032597A1 (it) * 2003-12-24 2005-06-25 Duccio Marco Gasparri Sistema per computer per il calcolo degli interessi per affidamenti di denaro
JP2006155427A (ja) * 2004-11-30 2006-06-15 Toshiba Corp オペレーショナルリスクの計量化装置、方法、およびプログラム

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9485322B2 (en) 2007-07-07 2016-11-01 Qualcomm Incorporated Method and system for providing targeted information using profile attributes with variable confidence levels in a mobile environment
US9596317B2 (en) 2007-07-07 2017-03-14 Qualcomm Incorporated Method and system for delivery of targeted information based on a user profile in a mobile communication device
US9497286B2 (en) 2007-07-07 2016-11-15 Qualcomm Incorporated Method and system for providing targeted information based on a user profile in a mobile environment
US9392074B2 (en) 2007-07-07 2016-07-12 Qualcomm Incorporated User profile generation architecture for mobile content-message targeting
US9398113B2 (en) 2007-07-07 2016-07-19 Qualcomm Incorporated Methods and systems for providing targeted information using identity masking in a wireless communications device
JP2009048236A (ja) * 2007-08-13 2009-03-05 Chugoku Electric Power Co Inc:The 倒産確率算出システム、方法及びプログラム
US9705998B2 (en) 2007-11-14 2017-07-11 Qualcomm Incorporated Method and system using keyword vectors and associated metrics for learning and prediction of user correlation of targeted content messages in a mobile environment
JP2011504061A (ja) * 2007-11-14 2011-01-27 クゥアルコム・インコーポレイテッド 移動環境においてターゲットコンテンツメッセージのユーザ相互関連付けを学習および予測するためにキーワードベクトルおよび関連するメトリックを使用する方法およびシステム
US9203911B2 (en) 2007-11-14 2015-12-01 Qualcomm Incorporated Method and system for using a cache miss state match indicator to determine user suitability of targeted content messages in a mobile environment
US9203912B2 (en) 2007-11-14 2015-12-01 Qualcomm Incorporated Method and system for message value calculation in a mobile environment
US9391789B2 (en) 2007-12-14 2016-07-12 Qualcomm Incorporated Method and system for multi-level distribution information cache management in a mobile environment
JP4701371B2 (ja) * 2009-05-21 2011-06-15 国立大学法人山口大学 災害発生確率評価システムとそのプログラム
JP2010271877A (ja) * 2009-05-21 2010-12-02 Yamaguchi Univ 災害発生確率評価システムとそのプログラム
JP2013080456A (ja) * 2011-09-21 2013-05-02 Norihide Noda 企業評価システム、企業評価方法及び企業評価プログラム
JP2019117443A (ja) * 2017-12-26 2019-07-18 株式会社帝国データバンク 休廃業予測システム
JP7043248B2 (ja) 2017-12-26 2022-03-29 株式会社帝国データバンク 休廃業予測システム

Also Published As

Publication number Publication date
US20070038558A1 (en) 2007-02-15
US7899767B2 (en) 2011-03-01
JP4398916B2 (ja) 2010-01-13

Similar Documents

Publication Publication Date Title
JP4398916B2 (ja) 確率モデル生成装置およびプログラム
Ardia et al. Questioning the news about economic growth: Sparse forecasting using thousands of news-based sentiment values
Sornette et al. Clarifications to questions and criticisms on the Johansen–Ledoit–Sornette financial bubble model
Dong et al. Credit scorecard based on logistic regression with random coefficients
Van Gestel et al. A process model to develop an internal rating system: Sovereign credit ratings
Yadav et al. A review on industrial applications of TOPSIS approach
JP4989254B2 (ja) 信用リスク計算装置、および、信用リスク計算方法
Momparler et al. Banking failure prediction: a boosting classification tree approach
Jammazi et al. Estimating and forecasting portfolio’s Value-at-Risk with wavelet-based extreme value theory: Evidence from crude oil prices and US exchange rates
US11810187B2 (en) Hierarchical deep neural network forecasting of cashflows with linear algebraic constraints
Nolde et al. Conditional extremes in asymmetric financial markets
Loisel et al. Applying economic measures to lapse risk management with machine learning approaches
El Ghourabi et al. Consistent estimation of the value at risk when the error distribution of the volatility model is misspecified
Triantafyllopoulos Time-varying vector autoregressive models with stochastic volatility
Chou et al. Estimation of tail-related value-at-risk measures: range-based extreme value approach
Chiadamrong et al. Financial performance prediction model based on firms’ internal capability determinants: Evidence from listed firms in Thailand during the transition period of going public
Leppisaari Modeling catastrophic deaths using EVT with a microsimulation approach to reinsurance pricing
Huang et al. Multi-Period portfolio optimization for index tracking in finance
Banerjee et al. Idiosyncrasies of intraday risk in emerging and developed markets: Efficacy of the MCS-GARCH model and extreme value theory
Haley et al. Disparity, shortfall, and twice-endogenous hara utility
Ibn Musah et al. The asymptotic decision scenarios of an emerging stock exchange market: Extreme value theory and artificial neural network
Moore et al. Immigration trends’ impacts on state vocational rehabilitation agency minority application rates: An empirical forecast model demonstration study
JP2008046835A (ja) 企業の信用力算出システム及び算出プログラム
Rusý et al. An asset–liability management stochastic program of a leasing company
Deepa et al. Identification of persisting trend in the Indian stock markets using AI

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090925

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091023

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131030

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees