JP6063544B1 - 説明変数値を算出する装置、方法及びプログラム - Google Patents

説明変数値を算出する装置、方法及びプログラム Download PDF

Info

Publication number
JP6063544B1
JP6063544B1 JP2015214654A JP2015214654A JP6063544B1 JP 6063544 B1 JP6063544 B1 JP 6063544B1 JP 2015214654 A JP2015214654 A JP 2015214654A JP 2015214654 A JP2015214654 A JP 2015214654A JP 6063544 B1 JP6063544 B1 JP 6063544B1
Authority
JP
Japan
Prior art keywords
variable
value
original
original variable
explanatory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015214654A
Other languages
English (en)
Other versions
JP2017084273A (ja
Inventor
康 高野
康 高野
佐藤 隆一
隆一 佐藤
辰郎 石島
辰郎 石島
一慶 吉野
一慶 吉野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mizuho DL Financial Technology Co Ltd
Original Assignee
Mizuho DL Financial Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mizuho DL Financial Technology Co Ltd filed Critical Mizuho DL Financial Technology Co Ltd
Priority to JP2015214654A priority Critical patent/JP6063544B1/ja
Priority to US15/771,790 priority patent/US20190050373A1/en
Priority to PCT/JP2016/081072 priority patent/WO2017073446A1/ja
Application granted granted Critical
Publication of JP6063544B1 publication Critical patent/JP6063544B1/ja
Publication of JP2017084273A publication Critical patent/JP2017084273A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Abstract

【課題】統計モデルの精度と分かり易さを両立させるための説明変数値を算出する。【解決手段】応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出するプログラムは、前記原変数の値と、前記応答変数が特定の値をとる確率である応答確率の推定値との関係を定めた応答確率推定用データを取得する応答確率推定用データ取得ステップ(S201)と、前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップ(S202)と、前記原変数の実現値と、前記応答確率推定用データとを用いて、前記原変数の実現値から前記応答確率の推定値を算出し、該推定値を所定の確率分布の分布関数の逆関数に代入することによって得られる値である原変数スコアを説明変数値として算出する説明変数値算出ステップ(S203,S204)とをコンピュータに実行させる。【選択図】図5

Description

本発明は、説明変数値を算出する装置、方法及びプログラムに関する。
自然現象、社会現象といった様々な現象の解明及び予測を行うために統計モデルが用いられる。例えば、以下のような統計モデルがある。
Figure 0006063544
ただし、x、x、・・・は、説明変数と呼ばれる変数である。β、β、・・・は、説明変数x、x、・・・にそれぞれ対応する係数であり、αは定数項である。式(1)において、説明変数と係数との線形結合と定数項αとの和により表されるZは、線形予測子と呼ばれる。Yは応答変数と呼ばれる変数である。式(2)に示したように、応答変数Yの期待値E[Y]と線形予測子Zとの関係は、関数Fにより表される。
例えば、体重を応答変数とし、身長、ウエストなどを説明変数とすることができる。
このような統計モデルの例として、一般化線形モデル(generalized linear model)が挙げられる。さらに、一般化線形モデルの例として、線形回帰モデル、二項ロジットモデル、順序ロジットモデルが挙げられる。
統計モデルにおける説明変数となり得るデータ(財務指標、個人属性など)は、分布が大きく偏っている場合がある。また、単調性のないデータも多い。分布が大きく偏ったデータ又は単調性のないデータをそのまま説明変数値として用いると、精度の高い統計モデルが得られないことが多い。
そのため、説明変数となり得るデータに何らかの加工を行い、その加工後のデータを説明変数値とすることが行われる。このような加工の例として、非特許文献1には対数変換が記載されている。
竹内啓ら編、「統計学辞典」、東洋経済新報社、1989年12月、p.419
ニューラルネットワーク等の手法でも統計モデルの構築は可能だが、このような複雑な手法では、統計モデルの分かり易さが失われる。そのため、実務上は、分かり易い上記のようなモデル式が得られる統計モデルを利用することが多い。その一方で、このような単純な統計分析手法は分析の自由度が低いことから、精度を向上させるためには、分析に用いる説明変数値を算出する際に工夫を凝らすことが重要である。
本発明はこのような実状に鑑みてなされたものであって、その目的は、統計モデルの精度と分かり易さを両立させるための説明変数値を算出することにある。
上記目的を達成するために、本発明によれば、応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出するプログラムが提供される。本プログラムは、前記原変数の値と、前記応答変数が特定の値をとる確率である応答確率の推定値との関係を定めた応答確率推定用データを取得する応答確率推定用データ取得ステップと、前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、前記原変数の実現値と、前記応答確率推定用データとを用いて、前記原変数の実現値から前記応答確率の推定値を算出し、該推定値を所定の確率分布の分布関数の逆関数に代入することによって得られる値である原変数スコアを説明変数値として算出する説明変数値算出ステップとをコンピュータに実行させる。
別の実施形態によれば、応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出するプログラムであって、前記原変数の値と原変数スコアとの関係を定めた原変数スコア算出用データを取得する原変数スコア算出用データ取得ステップであって、前記原変数スコアは、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出されたものである、原変数スコア算出用データ取得ステップと、前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、前記原変数の実現値と、前記原変数スコア算出用データとを用いて、前記原変数の実現値から得られる原変数スコアを説明変数値として算出する説明変数値算出ステップとをコンピュータに実行させるプログラムが提供される。
さらに別の実施形態によれば、応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出するプログラムであって、前記原変数の値と説明変数値との関係を定めた説明変数値算出用データを取得する説明変数値算出用データ取得ステップであって、前記説明変数値は、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出される原変数スコアを、一次式で変換することによって算出されたものである、説明変数値算出用データ取得ステップと、前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、前記原変数の実現値と、前記説明変数値算出用データとを用いて、前記原変数の実現値から説明変数値を算出する説明変数値算出ステップとをコンピュータに実行させるプログラムが提供される。
上述の如く、本発明によれば、統計モデルの精度と分かり易さを両立させるための説明変数値を算出することができる。
応答確率推定用データ作成装置の機能構成例を示す説明図である。 応答確率推定用データ作成装置のハードウェア構成例を示す説明図である。 応答確率推定用データ作成装置が行う処理のフローチャートの一例である。 説明変数値算出装置の機能構成例を示す説明図である。 説明変数値算出装置が行う処理のフローチャートの一例である。 説明変数値のグラフである。 近似折線グラフである。
以下に本発明の実施形態を説明する。ただし、本発明は、以下に説明する実施の形態によって限定されるものではない。
[第1の実施形態: ロジスティック回帰分析による信用評価モデルの構築]
企業又は個人のデフォルトすなわち債務不履行のしやすさを評価する統計モデルを信用評価モデルと呼ぶ。デフォルトしにくいと評価されれば、当該企業又は個人は信用力が高いといえる。
企業を対象とした信用評価モデルにおいては、貸借対照表、損益計算書から計算される財務指標を説明変数として用いることが多い。この場合の財務指標の例としては、自己資本比率、債務償還年数、経常収支比率、売上債権回転日数などが挙げられる。
また、個人を対象とした信用評価モデルにおいては、個人の属性に関する情報を説明変数として用いることが多い。このような情報の例として、個人の年齢、世帯人数、年収、勤続年数などが挙げられる。
以下、企業の財務指標、個人の属性といった、信用力に関係する情報を「指標」とも呼ぶ。この指標が、説明変数を算出する元となる原変数である。
また、決算後一定期間内にデフォルトしていれば1、デフォルトしていなければ0をとる2値変数をデフォルトフラグと呼ぶ。このデフォルトフラグを、信用評価モデルにおける応答変数として用いることが多い。これは、信用評価モデルの対象が企業であるか個人であるかを問わない。
以上のような説明変数及び応答変数を用いて、ロジスティック回帰分析等の統計分析により、信用評価モデルを構築する。信用評価モデルのアウトプットは、用いる統計分析手法によって異なるが、信用スコア、デフォルト率、格付などの、企業又は個人の信用力を表象する情報である。アウトプットに応じて、信用スコアリングモデル、デフォルト率推定モデルなどの様々な呼び方があるが、本明細書においてはこれらをまとめて信用評価モデルと呼ぶ。
信用評価モデルの構築においては、ロジスティック回帰分析と呼ばれる分析手法が多く使われる。このロジスティック回帰分析においては、説明変数と、応答変数すなわちデフォルトフラグが1となる確率p(デフォルト率pとも呼ぶ)との関係を次式で表現する。
Figure 0006063544
ただし、X(k=1,2,・・・)は、説明変数である。βは、説明変数Xにそれぞれ対応する係数であり、αは定数項である。logit(p)は、デフォルト率pのロジットと呼ばれる。
そして、企業i(iは企業IDである)の第k番目の指標値(第k番目の原変数値とも呼ぶ)から、企業iの第k番目の指標に関する説明変数値X を以下のように算出する。
Figure 0006063544
ただし、p は、企業iの第k番目の指標値から推定された企業iのデフォルト率である。Fは、何らかの確率分布の分布関数である。F−1は、関数Fの逆関数である。
関数Fを次式のようにロジスティック分布の分布関数とすることによって、説明変数値X とlogit(p )は、式(3)の関係を満たすこととなる。
Figure 0006063544
このように、説明変数Xとデフォルト率pとの関係が信用評価モデルの仮定に従うものとなるように、説明変数値X を算出することにより、より精度の高い信用評価モデルを構築できることが期待される。
このようにして算出される説明変数値X は、第k番目の原変数値により企業iの信用力を数値化したものである。企業の様々な原変数値から算出される説明変数値を見ることにより、それぞれの指標で評価した信用力の高低が容易に把握できるようになる。推定デフォルト率p を算出する方法としては任意の方法を用いることができる。本実施形態では、後述するように離散化による方法を用いる。
なお、次式で計算される説明変数の線形結合Zを、Zスコアと呼ぶ。
Figure 0006063544
このZスコアは、信用評価モデルに取り込まれている説明変数を全て考慮した場合の企業の信用力を表している。
以下、説明変数値X を算出するために必要となる応答確率推定用データ作成について説明する。続いて、応答確率推定用データを用いた説明変数値X の算出について説明する。
[応答確率推定用データ作成]
応答確率推定用データの作成は、図1に示す応答確率推定用データ作成装置1が行う。応答確率推定用データ作成装置1は、モデル構築用データ取得部12と、応答確率推定用データ作成部14とを備えている。各機能部の詳細は後述する。
図2は、応答確率推定用データ作成装置1のコンピュータハードウェア構成例を示している。応答確率推定用データ作成装置1は、CPU51と、インタフェース装置52と、表示装置53と、入力装置54と、ドライブ装置55と、補助記憶装置56と、メモリ装置57とを備えており、これらがバス58により相互に接続されている。
応答確率推定用データ作成装置1の機能を実現するプログラムは、CD−ROM等の記録媒体59によって提供される。プログラムを記録した記録媒体59がドライブ装置55にセットされると、プログラムが記録媒体59からドライブ装置55を介して補助記憶装置56にインストールされる。あるいは、プログラムのインストールは必ずしも記録媒体59により行う必要はなく、ネットワークを介して他のコンピュータからダウンロードすることもできる。補助記憶装置56は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
メモリ装置57は、プログラムの起動指示があった場合に、補助記憶装置56からプログラムを読み出して格納する。CPU51は、メモリ装置57に格納されたプログラムにしたがって応答確率推定用データ作成装置1の機能を実現する。インタフェース装置52は、ネットワークを通して他のコンピュータに接続するためのインタフェースとして用いられる。表示装置53はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置54はキーボード及びマウス等である。
図3は、応答確率推定用データ作成装置1が行う処理を示している。まず、ステップS101において、モデル構築用データ取得部12がモデル構築用データを読み込む。モデル構築用データの例を表1に示す。
Figure 0006063544
モデル構築用データは、複数のサンプルを有している。各サンプルが一つの企業に関する情報を表している。また、「デフォルトフラグ」とは、先に述べたように、決算後一定期間内にデフォルトしていれば1、デフォルトしていなければ0をとる2値変数である。
表1における「財務指標」は、各企業の貸借対照表、損益計算書等といった決算情報から算出される。例えば、「売上高・対数」は、決算情報から算出される売上高を対数変換した情報である。「自己資本比率」、「債務償還年数」、「流動比率」、「売上高金利負担率」は、それぞれ、決算情報から算出されるものである。これらの指標が、算出対象である説明変数の元になる原変数である。なお、「k」は、原変数の番号である。
例えば、企業IDが「1」である「企業A」の「自己資本比率」の値は「46.82%」である。この値を、「自己資本比率」という原変数の実現値と呼ぶ。そして、「デフォルトフラグ」という応答変数の実現値は「0」である。このように、表1は、複数のサンプルを有し、各サンプルは、複数の原変数の実現値と応答変数の実現値とを含んでいる。なお、原変数の個数に制限はなく、複数あればよい。
ステップS102において、応答確率推定用データ作成部14が、「自己資本比率」(k=2)という原変数に関して、表2に示すような応答確率推定用データを作成する。本実施形態では、応答確率(応答変数が特定の値をとる確率のこと)がデフォルト率であるため、応答確率推定用データをデフォルト率推定用データとも呼ぶ。
Figure 0006063544
表2の「階級番号」は、連続的な指標である自己資本比率の値の存在範囲を複数の階級に離散化したことにより得られる階級の番号である。「自己資本比率」の「下限値」及び「上限値」は、各階級の下限値及び上限値を示している。そして、「サンプル数」における「非デフォルト数」は、各階級において、表1の「デフォルトフラグ」が0となっているサンプルの数である。また、「サンプル数」における「デフォルト数」は、各階級において、表1の「デフォルトフラグ」が1となっているサンプルの数である。「非デフォルト数」及び「デフォルト数」は、応答確率推定用データ作成部14が表1のモデル構築用データを参照して数え上げることにより得られる。
さらに、表2の「推定デフォルト率」は、応答確率推定用データ作成部14により、階級毎に以下のようにして計算される。
(推定デフォルト率)=(デフォルト数)/((非デフォルト数)+(デフォルト数))
なお、推定デフォルト率を「応答確率の推定値」とも呼ぶ。
以上のようにして、「自己資本比率」という原変数に関する応答確率推定用データが作成される。「自己資本比率」以外の原変数についても同様に応答確率推定用データを作成することができる。
このように、応答確率推定用データは、原変数の値と応答確率の推定値(推定デフォルト率)との関係を定めたデータである。
[説明変数値の算出]
続いて、応答確率推定用データを用いた説明変数値X の算出と、それに続く統計モデルの構築とについて説明する。説明変数値の算出は、図4に示す説明変数値算出装置2により行われる。説明変数値算出装置2は、応答確率推定用データ取得部22と、原変数データ取得部24と、原変数スコア算出部26と、説明変数値算出部28とを備えている。各機能部の詳細は後述する。説明変数値算出装置2も、図2に示したようなコンピュータハードウェア構成を有している。説明変数値算出装置2が行う処理の流れを図5に示している。
まず、ステップS201において、応答確率推定用データ取得部22は、表2に示したような応答確率推定用データを応答確率推定用データ作成装置1から読み込む。
ステップS202において、原変数データ取得部24は、表1に示したモデル構築用データを応答確率推定用データ作成装置1から読み込む。上述したように、モデル構築用データは原変数の実現値を含んでいることから、本実施例では、モデル構築用データを原変数データとして使用する。ただし、原変数データは必ずしもモデル構築用データと同じである必要はなく、原変数の実現値が含まれているデータであればよい。
ステップS203において、原変数スコア算出部26は、応答確率推定用データ(表2)及び原変数データ(表1)を用いて、「自己資本比率」という原変数(k=2)に関する推定デフォルト率を算出する。例えば、「企業A」(i=1)であれば、自己資本比率の実現値は「46.82%」であることから、表2の階級番号8を参照することにより、推定デフォルト率p が「0.96%」と算出される。このような自己資本比率に関する推定デフォルト率の算出を全ての企業について行う。
ステップS204において、原変数スコア算出部26は、ステップS203で算出された推定デフォルト率p から、次式により原変数スコアと呼ばれる値を算出する。
Figure 0006063544
先に述べたように、関数Fはロジスティック分布の分布関数である。
ステップS205では、説明変数値算出部28が説明変数値X を算出する。説明変数値X の算出は次式により行われる。
Figure 0006063544
このように、説明変数値は、原変数スコアを−1倍した値である。もちろん、これに限られず、説明変数値は、原変数スコアを一次式により変換した値とすることができる。以上が、自己資本比率に関する説明変数値算出までの流れである。
その後、自己資本比率(k=2)以外の原変数についても同様に説明変数値を算出することができる。そして、全ての原変数に関する説明変数値と、応答変数であるデフォルトフラグを用いて、ロジスティック回帰分析による統計モデル構築を行うことができる(ステップS206)。なお、統計モデル構築にあたっては、任意の説明変数の選択方法を用いることができる。
表3は、統計モデル構築におけるパラメータの推定結果の例である。パラメータとは、式(3)の定数項及び係数の総称である。
Figure 0006063544
係数は、「説明変数値が1点違うと、Zスコアが何点異なるか」を表している。係数の値が大きいほど、その係数に対応する指標すなわち原変数の影響が大きく評価されていることになる。
表3の例では、債務償還年数と自己資本比率が、影響の大きな指標であることがわかる。このように、本実施形態によれば、指標値(原変数値)から算出された説明変数値に対するパラメータの値から、当該指標の影響の大きさをすぐに読み取ることができる。
表4は、本実施形態で得られた信用評価モデルを用いて、ある企業(A社とする)の信用評価を実施した結果を示したものである。
Figure 0006063544
表4における「パラメータ推定値」は、表3に既に示したものである。「説明変数値」は、A社の指標値から上述の方法により算出された説明変数値である。「スコア寄与」は、各指標に対するパラメータと説明変数値の積である。定数項と、全ての指標についてのスコア寄与との和が、A社のZスコアとなる。A社の推定PDは、Zスコアから算出することができる。推定PDとは、Zスコアに基づく推定デフォルト率のことである。
図6は、A社に対する各指標の説明変数値を示したグラフである。このグラフから、A社は、棚卸資産回転日数に問題がある可能性が見てとれる。このように、本実施形態では、最終的な評価だけでなく、各指標による評価も容易に把握でき、それらを比較することもできる。
また、連続的な指標である自己資本比率について主に説明したが、カテゴリカルな指標についても同様に、カテゴリーごとにデフォルトサンプル数と非デフォルトサンプル数を集計することにより、カテゴリーごとの推定デフォルト率を得ることができる。欠損値や特異値(指標の分母が0になる場合など)を伴うサンプルについても、同様な方法により、そうしたサンプルの推定デフォルト率を得ることができる。さらに、2つの指標のクロス表からデフォルト率を算出し、交差変数を作成することもできる。
[参考例]
以下に、通常の信用評価モデルによる評価結果の例を示す。通常の信用評価モデルでは、原変数の値をそのまま説明変数値とするか、又は原変数の値を対数変換した値を説明変数値とすることが多い。表5は、通常の信用評価モデルで企業を評価した結果を示している。
Figure 0006063544
表5の「説明変数値」は、指標値そのものである。ただし、売上高及び棚卸資産回転日数について対数変換を行っている。「スコア寄与」とは、各指標に対するパラメータと説明変数値との積である。
指標値の水準は指標毎に大きく異なるため、表5のパラメータを見ただけでは、どの指標が重視されているのか分からない。また、スコア寄与が高い指標があったとしても、「指標値」が良い値であるからなのか、パラメータが大きい(重視されている)からなのかが分からない。例えば、「売上高・対数」のスコア寄与が比較的大きいが、これは売上高の評価が良いためなのか、売上高の評価は標準的であるものの、重要な指標であるためスコア寄与が大きくなっているからなのかは、すぐには峻別できない。このように、通常の信用評価モデルの場合は、評価結果の解釈が難しくなる。
[変形例]
上述したように、応答確率推定用データ(表2)から、式(7)により原変数スコアが得られ、その原変数スコアから式(8)により説明変数値が得られる。そこで、上記応答確率推定用データに代えて、原変数の値と原変数スコアとの関係を定めた原変数スコア算出用データを用いてもよい。この原変数スコア算出用データは、応答確率推定用データ作成装置1に類似する原変数スコア算出用データ作成装置(不図示)により作成される。原変数スコア算出用データ作成装置は、応答確率推定用データ作成部14に代えて、原変数スコア算出用データ作成部(不図示)を有している。この原変数スコア算出用データ作成部は、原変数の値と原変数スコアとの関係を定めた原変数スコア算出用データを作成する。
続いて、原変数スコア算出用データは、説明変数値算出装置2内の応答確率推定用データ取得部22に代わる原変数スコア算出用データ取得部(不図示)により取得される。そして、原変数スコア算出部26が原変数スコア算出用データを用いて原変数スコアを算出する。
あるいは、上記応答確率推定用データに代えて、原変数の値と説明変数値との関係を定めた説明変数値算出用データを用いてもよい。この説明変数値算出用データは、応答確率推定用データ作成装置1に類似する説明変数値算出用データ作成装置(不図示)により作成される。説明変数値算出用データ作成装置は、応答確率推定用データ作成部14に代えて、説明変数値算出用データ作成部(不図示)を有している。この説明変数値算出用データ作成部は、原変数の値と説明変数値との関係を定めた説明変数値算出用データを作成する。
続いて、説明変数値算出用データは、説明変数値算出装置2内の応答確率推定用データ取得部22に代わる説明変数値算出用データ取得部(不図示)により取得される。この場合、原変数スコア算出部26は設けられておらず、説明変数値算出部28が説明変数値算出用データを用いて説明変数値を算出する。
[第2の実施形態: 近似式を用いる場合]
本実施形態では、原変数値から推定デフォルト率p を算出するにあたり、原変数値と推定デフォルト率p との関係を表す近似式を用いる。
近似式の構築方法は様々なものが考えられるが、本実施形態では、区分線形回帰(segmented linear regression)を用いる。区分線形回帰とは、原変数の存在範囲をいくつかの区間に分割し、各区間内で原変数と推定デフォルト率との関係を線形式で近似する方法である。財務指標などの原変数の値と推定デフォルト率との関係は複雑であるため、単純な線形回帰では誤差が非常に大きくなることが多いが、区分線形回帰を用いることにより近似精度の向上が期待できる。
図7は、原変数の一つである有利子負債利子率について、区分線形回帰によって原変数の値と推定デフォルト率との関係を表す近似折線グラフである。四角形で示した各点は、原変数を離散化して算出した推定デフォルト率を示している。また、実線は、区分線形回帰によって得られた近似折線である。この近似折線を用いて推定デフォルト率を算出することにより、連続的な推定デフォルト率が得られる。その結果、連続的な説明変数値が得られる。
表6は、有利子負債利子率と推定デフォルト率との関係を表す近似式を、区分線形回帰によって計算した例である。
Figure 0006063544
区分線形回帰では、表6に示したように、各区間の閾値(原変数の値の最大値及び最小値)と、各区間の傾き及び切片の情報が得られる。傾き及び切片を関数のパラメータとも呼ぶ。そして、閾値と関数のパラメータから、各区間の推定デフォルト率の最大値及び最小値が得られる。この推定デフォルト率の最大値及び最小値を、式(7)により関数Fの逆関数F−1を用いて変換することにより、原変数スコアの最大値及び最小値が得られる。さらに、式(8)により原変数スコアの最大値及び最小値を一次式で変換することにより、説明変数値の最大値及び最小値が得られる。なお、表6においては、原変数スコアの最大値及び最小値を省略している。
表6のうち、「区間No.」と「有利子負債利子率」と「関数のパラメータ」とからなるデータが、本実施形態における応答確率推定用データである。この応答確率推定用データは、原変数である「有利子負債利子率」の値と、推定デフォルト率との関係を定めたものである。応答確率推定用データは、第1の実施形態と同様に、応答確率推定用データ作成装置1により作成される(図1及び図3)。
本実施形態における説明変数値の算出も、図5に示したような流れで行われる。すなわち、ステップS201にて上記応答確率推定用データが読み込まれる。ステップS202では、モデル構築用データ(表1)が読み込まれる。ステップS203では、上記応答確率推定用データと、モデル構築用データとから、各サンプルの原変数の実現値が上記応答確率推定用データどの区間に含まれるかが読み取られる。続いて、該当する区間の関数のパラメータが読み取られる。同ステップではさらに、推定デフォルト率が次式により算出される。
(推定デフォルト率)=(傾き)×(原変数の実現値)+(切片)
ステップS204では、式(7)により原変数スコアが算出される。ステップS205では、式(8)により説明変数値が算出される。
有利子負債がゼロの場合、有利子負債利子率を算出することができない。また、有利子負債利子率が欠損値である場合もある。従来のモデル構築では、説明変数を連続変数とする場合には、欠損値等のサンプルには「最悪値を割り当てる」といったアドホックな対応がとられていた。
このような有利子負債利子率の実現値を得ることができないサンプルについても、本実施形態では、実施形態1と同様に、非デフォルトサンプルとデフォルトサンプルを数え上げることによってそれらのサンプルの推定デフォルト率を算出し、その推定デフォルト率から説明変数値を算出する。このように、有利子負債利子率の実現値を得ることができないサンプルについても、通常のサンプルと同じ考え方で推定デフォルト率に見合った説明変数値が得られるため、統計モデルの精度向上が期待できる。
有利子負債利子率以外の指標も上述と同様に説明変数値を算出し、それらを説明変数、デフォルトフラグを応答変数としてパラメータ(定数項及び係数)の推定を行うことで、連続的な説明変数を持つ信用評価モデルを構築することができる(ステップS206)。連続変数でモデルを構築した場合にも、離散化変数の場合と同様に指標別の評価等を実施することができる。
近似式を得るための方法として、区分線形回帰に限らず、任意の方法を用いることができる。例えば、多項式回帰、対数回帰、B−スプラインが挙げられる。
また、指標の分母が正の領域ではB−スプライン、分母が負の領域では分母と分子の指標のクロス集計表で推定デフォルト率を与えることも可能である。このように、説明変数値算出を様々な方法で行うことができる。
本実施形態においても、応答確率推定用データに代えて、原変数の値と原変数スコアとの関係を定めた原変数スコア算出用データを用いてもよい。あるいは、応答確率推定用データに代えて、原変数の値と説明変数値との関係を定めた説明変数値算出用データを用いてもよい。
[第3の実施形態: プロビット回帰による信用評価モデルの構築]
プロビット回帰は、ロジスティック回帰と同様に、信用評価モデルの構築に良く用いられる手法であり、説明変数とデフォルト率との関係を以下の式で表現する。
Figure 0006063544
ただし、Φは、標準正規分布の分布関数である。このΦは、上記第1の実施形態における関数Fである。そして、関数Φの逆関数Φ−1を用いて式(7)により原変数スコアを算出することができる。
本実施形態は、関数Fを除いて上記第1の実施形態と同様である。
パラメータ推定に用いる統計分析手法と指標スコア算出時に用いる分布関数は必ずしも特定の組み合わせに限られるものではない。例えば、説明変数値の算出にあたって標準正規分布の分布関数を用い、得られた説明変数値を用いてロジスティック回帰分析でパラメータを推定することも可能である。
[第4の実施形態: 業種別に信用評価モデルを構築]
業種によって財務上の特徴は異なるため、信用評価の実務では業種別に信用評価モデルを構築することがしばしば行われる。本実施形態では、業種別に信用評価モデルを構築する。
まずステップS101において、モデル構築用データが読み込まれる。このときのモデル構築用データは、表1に示しているように、「業種」という情報をも含んでいる。そして、ステップS102において、変数の値と応答確率の推定値(推定デフォルト率)との関係を表す応答確率推定用データを業種毎に作成することができる。例えば、区分線形回帰を用いる場合は、表6のようなテーブルが、業種毎に作られることとなる。そして、ステップS201〜S205を業種毎に行った上で、ステップS206において、業種別の信用評価モデルを構築することができる。
なお、業種はセグメント情報の一種である。セグメント情報とは、統計モデルの分析対象である母集団を分割する際に参照される情報である。セグメント情報に基づいて母集団を分割して得られる各々の集団をセグメントと呼ぶ。信用評価モデルの構築では、本実施形態のように、財務的な特徴を共有すると考えられるいくつかのセグメントに母集団を分割し、セグメント毎にモデルを構築することがしばしば行われる。
[効果]
上記のように算出された説明変数値を用いて信用評価モデルを構築することにより、評価プロセスが非常に分かり易く、かつ精度の高いモデルを構築することができる。また、算出された説明変数値は、全ての指標で「単一指標で評価した信用力の絶対水準」という共通の意味を持つため、指標毎の評価の高低が容易に把握できるとともに、指標ごとの評価の比較も行える。
さらに、第4の実施形態のように、業種別にモデル化する場合には、異なる業種間で指標別の評価を比較することができる。例えば、売上高営業利益率の水準は業種によって異なるため、「売上高営業利益率が11%の小売業のA社」と、「同17%のサービス業のB社」とで、どちらが信用力が高いと考えられるかはすぐには分からない。これに対し、本発明によって得られる説明変数の値は、原変数の値から推定したデフォルト率の水準を表わしているため、異なる業種間であっても比較が可能である。先程の例では、売上高営業利益率に対応する説明変数の値を両社で比較することにより、売上高営業利益率という視点から見た場合、どちらの信用力が高いと考えられるか、という疑問に容易に答えることができる。
信用力と指標値が単調でない指標でも、問題なく統計モデルに取り入れることができる。例えば、指標によっては、大きすぎても小さすぎても信用力が低く(デフォルト率が高く)なるものがある。第1もしくは第2の実施形態によれば、こうした指標は、指標値が大きい場合や小さい場合に説明変数が小さい値となり、中庸な場合に大きい値となる。その結果、説明変数の値と信用力の関係は単調になり、様々な統計モデルに取り込みやすくなる。
また、指標値からの推定デフォルト率の算出方法は特に限定されないことから、柔軟に指標を加工することが可能である。先に述べたように、2つ以上の指標のクロス集計表を用いて交差変数を作成したり、指標の分母の値に応じて、推定デフォルト率の算出方法を異なるものとしたりすることが可能である。
原変数スコア算出時に用いる分布関数Fとして、モデル構築に用いる統計分析手法に合わせた確率分布を用いることにより、モデル精度の向上が見込まれる。一般に統計モデルでは、説明変数と応答変数が一定の関係性を満たすことを仮定しており、両者の関係がその仮定を満たさなければ、精度の高いモデルは得られない。例えば、ロジスティック回帰分析によるデフォルト率のモデル化では、デフォルト率のロジットが、説明変数の一次式で表されることが仮定されている(式(3))。モデル構築に用いる統計分析手法に合わせた確率分布を用いることにより、説明変数ごとにモデルの仮定が満たされる説明変数値が得られるため、精度向上が見込まれる。プロビットモデルによるデフォルト率のモデル化では、関数Fとして標準正規分布の分布関数を用いることにより、モデルの仮定に適合した説明変数値が得られる。
一つの統計モデルの中で、離散化によって得られる離散化変数と、近似式を用いて得られる連続変数の両者を用いることもできる。説明変数が離散化変数であるか連続変数であるかに関わらず、算出される説明変数値の意味が同じであるため、説明変数値間での比較評価が可能である。
[その他]
本明細書に開示した実施形態は、装置としての側面だけではなく、方法としての側面及びコンピュータプログラムとしての側面をも有している。
応答確率推定用データは、応答確率推定用データ作成装置1内の補助記憶装置56又は外部の任意の記憶装置に記憶することができる。原変数スコア算出用データ及び説明変数値算出用データについても同様である。
説明変数値算出装置2により算出された説明変数値は、説明変数値算出装置2内の補助記憶装置又は外部の任意の記憶装置に記憶することができる。
応答確率推定用データ作成装置1と説明変数値算出装置2とを一体の装置としてもよい。
ステップS101において読み込まれるモデル構築用データと、ステップS202において読み込まれるモデル構築用データとが異なっていてもよい。
原変数スコアを一次式で変換することなく、そのまま説明変数値としてもよい。
本発明は、式(1)及び(2)で表されるような統計モデルだけでなく、応答変数が2値変数である統計モデルに対して、幅広く適用することができる。
以上、本発明の実施の形態につき述べたが、本発明は既述の実施の形態に限定されるものではなく、本発明の技術的思想に基づいて各種の変形及び変更が可能である。
1 応答確率推定用データ装置
12 モデル構築用データ取得部
14 応答確率推定用データ作成部

2 説明変数値算出装置
22 応答確率推定用データ取得部
24 原変数データ取得部
26 原変数スコア算出部
28 説明変数値算出部

51 CPU
52 インタフェース装置
53 表示装置
54 入力装置
55 ドライブ装置
56 補助記憶装置
57 メモリ装置
58 バス
59 記録媒体

Claims (23)

  1. 応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出するプログラムであって、
    前記原変数の値と、前記応答変数が特定の値をとる確率である応答確率の推定値との関係を定めた応答確率推定用データを取得する応答確率推定用データ取得ステップと、
    前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、
    前記原変数の実現値と、前記応答確率推定用データとを用いて、前記原変数の実現値から前記応答確率の推定値を算出し、該推定値を所定の確率分布の分布関数の逆関数に代入することによって得られる値である原変数スコアを説明変数値として算出する説明変数値算出ステップと
    をコンピュータに実行させるプログラム。
  2. 前記応答確率推定用データが、前記関係を表す連続的な関数のパラメータを含むものである、請求項1に記載のプログラム。
  3. 前記応答確率推定用データが、前記原変数の値の存在範囲を離散化することにより得られる複数の階級と、前記複数の階級の各々に関係付けられた応答確率の推定値とを含むものである、請求項1に記載のプログラム。
  4. 前記応答確率推定用データが、セグメント毎に、前記原変数の値と前記応答確率の推定値との関係を定めたものであり、
    前記原変数データが、セグメント情報をさらに含むものであり、
    前記説明変数値算出ステップが、前記セグメント情報と前記原変数の実現値と前記応答確率推定用データとを用いて、前記応答確率の推定値を算出し、該推定値を前記所定の確率分布の分布関数の逆関数に代入することによって得られる値である原変数スコアを説明変数値として算出するステップである、請求項1〜3のいずれか一項に記載のプログラム。
  5. 応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出するプログラムであって、
    前記原変数の値と原変数スコアとの関係を定めた原変数スコア算出用データを取得する原変数スコア算出用データ取得ステップであって、前記原変数スコアは、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出されたものである、原変数スコア算出用データ取得ステップと、
    前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、
    前記原変数の実現値と、前記原変数スコア算出用データとを用いて、前記原変数の実現値から得られる原変数スコアを説明変数値として算出する説明変数値算出ステップと
    をコンピュータに実行させるプログラム。
  6. 前記原変数スコア算出用データが、前記関係を表す連続的な関数のパラメータを含むものである、請求項5に記載のプログラム。
  7. 前記原変数スコア算出用データが、前記原変数の値の存在範囲を離散化することにより得られる複数の階級と、前記複数の階級の各々に関係付けられた原変数スコアとを含むものである、請求項5に記載のプログラム。
  8. 前記原変数スコア算出用データが、セグメント毎に、前記原変数の値と前記原変数スコアとの関係を定めたものであり、
    前記原変数データが、セグメント情報をさらに含むものであり、
    前記説明変数値算出ステップが、前記セグメント情報と前記原変数の実現値と前記原変数スコア算出用データとを用いて得られる前記原変数スコアを説明変数値として算出するステップである、請求項5〜7のいずれか一項に記載のプログラム。
  9. 前記説明変数値算出ステップが、前記原変数スコアを一次式で変換した値を説明変数値として算出するステップである、請求項1〜8のいずれか一項に記載のプログラム。
  10. 応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出するプログラムであって、
    前記原変数の値と説明変数値との関係を定めた説明変数値算出用データを取得する説明変数値算出用データ取得ステップであって、前記説明変数値は、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出される原変数スコアを、一次式で変換することによって算出されたものである、説明変数値算出用データ取得ステップと、
    前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、
    前記原変数の実現値と、前記説明変数値算出用データとを用いて、前記原変数の実現値から説明変数値を算出する説明変数値算出ステップと
    をコンピュータに実行させるプログラム。
  11. 前記説明変数値算出用データが、前記関係を表す連続的な関数のパラメータを含むものである、請求項10に記載のプログラム。
  12. 前記説明変数値算出用データが、前記原変数の値の存在範囲を離散化することにより得られる複数の階級と、前記複数の階級の各々に関係付けられた説明変数値とを含むものである、請求項10に記載のプログラム。
  13. 前記説明変数値算出用データが、セグメント毎に、前記原変数の値と前記説明変数値との関係を定めたものであり、
    前記原変数データが、セグメント情報をさらに含むものであり、
    前記説明変数値算出ステップが、前記セグメント情報と前記原変数の実現値と前記説明変数値算出用データとを用いて前記説明変数値を算出するステップである、請求項10〜12のいずれか一項に記載のプログラム。
  14. 前記所定の確率分布がロジスティック分布である、請求項1〜13のいずれか一項に記載のプログラム。
  15. 前記所定の確率分布が標準正規分布である、請求項1〜13のいずれか一項に記載のプログラム。
  16. 応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出する装置であって、
    前記原変数の値と、前記応答変数が特定の値をとる確率である応答確率の推定値との関係を定めた応答確率推定用データを取得する応答確率推定用データ取得部と、
    前記原変数の実現値を含む原変数データを取得する原変数データ取得部と、
    前記原変数の実現値と、前記応答確率推定用データとを用いて、前記原変数の実現値から前記応答確率の推定値を算出し、該推定値を所定の確率分布の分布関数の逆関数に代入することによって得られる値である原変数スコアを説明変数値として算出する説明変数値算出部と
    を備えた装置。
  17. 応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出する装置であって、
    前記原変数の値と原変数スコアとの関係を定めた原変数スコア算出用データを取得する原変数スコア算出用データ取得部であって、前記原変数スコアは、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出されたものである、原変数スコア算出用データ取得部と、
    前記原変数の実現値を含む原変数データを取得する原変数データ取得部と、
    前記原変数の実現値と、前記原変数スコア算出用データとを用いて、前記原変数の実現値から得られる原変数スコアを説明変数値として算出する説明変数値算出部と
    を備えた装置。
  18. 前記説明変数値算出部が、前記原変数スコアを一次式で変換した値を説明変数値として算出する、請求項16又は17に記載の装置。
  19. 応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出する装置であって、
    前記原変数の値と説明変数値との関係を定めた説明変数値算出用データを取得する説明変数値算出用データ取得部であって、前記説明変数値は、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出される原変数スコアを、一次式で変換することによって算出されたものである、説明変数値算出用データ取得部と、
    前記原変数の実現値を含む原変数データを取得する原変数データ取得部と、
    前記原変数の実現値と、前記説明変数値算出用データとを用いて、前記原変数の実現値から説明変数値を算出する説明変数値算出部と
    を備えた装置。
  20. 応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出する方法であって、
    前記原変数の値と、前記応答変数が特定の値をとる確率である応答確率の推定値との関係を定めた応答確率推定用データを取得する応答確率推定用データ取得ステップと、
    前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、
    前記原変数の実現値と、前記応答確率推定用データとを用いて、前記原変数の実現値から前記応答確率の推定値を算出し、該推定値を所定の確率分布の分布関数の逆関数に代入することによって得られる値である原変数スコアを説明変数値として算出する説明変数値ステップと
    を含む方法。
  21. 応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出する方法であって、
    前記原変数の値と原変数スコアとの関係を定めた原変数スコア算出用データを取得する原変数スコア算出用データ取得ステップであって、前記原変数スコアは、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出されたものである、原変数スコア算出用データ取得ステップと、
    前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、
    前記原変数の実現値と、前記原変数スコア算出用データとを用いて、前記原変数の実現値から得られる原変数スコアを説明変数値として算出する説明変数値算出ステップと
    を含む方法。
  22. 前記説明変数値算出ステップが、前記原変数スコアを一次式で変換した値を説明変数値として算出するステップである、請求項20又は21に記載の方法。
  23. 応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出する方法であって、
    前記原変数の値と説明変数値との関係を定めた説明変数値算出用データを取得する説明変数値算出用データ取得ステップであって、前記説明変数値は、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出される原変数スコアを、一次式で変換することによって算出されたものである、説明変数値算出用データ取得ステップと、
    前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、
    前記原変数の実現値と、前記説明変数値算出用データとを用いて、前記原変数の実現値から説明変数値を算出する説明変数値算出ステップと
    を含む方法。
JP2015214654A 2015-10-30 2015-10-30 説明変数値を算出する装置、方法及びプログラム Active JP6063544B1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2015214654A JP6063544B1 (ja) 2015-10-30 2015-10-30 説明変数値を算出する装置、方法及びプログラム
US15/771,790 US20190050373A1 (en) 2015-10-30 2016-10-20 Apparatus, method, and program for calculating explanatory variable values
PCT/JP2016/081072 WO2017073446A1 (ja) 2015-10-30 2016-10-20 説明変数値を算出する装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015214654A JP6063544B1 (ja) 2015-10-30 2015-10-30 説明変数値を算出する装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP6063544B1 true JP6063544B1 (ja) 2017-01-18
JP2017084273A JP2017084273A (ja) 2017-05-18

Family

ID=57800081

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015214654A Active JP6063544B1 (ja) 2015-10-30 2015-10-30 説明変数値を算出する装置、方法及びプログラム

Country Status (3)

Country Link
US (1) US20190050373A1 (ja)
JP (1) JP6063544B1 (ja)
WO (1) WO2017073446A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117808576A (zh) * 2024-01-08 2024-04-02 深度(山东)数字科技集团有限公司 一种用于企业融资额度估算的商业汇票大数据分析方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6300251B1 (ja) * 2017-09-25 2018-03-28 株式会社エス・エム・エス 信用格付けシステムおよびプログラム
US11797668B2 (en) * 2017-10-11 2023-10-24 Mitsubishi Electric Corporation Sample data generation apparatus, sample data generation method, and computer readable medium
US11308411B2 (en) 2018-05-04 2022-04-19 Wisconsin Alumni Research Foundation Systems methods and media for automatically identifying entrepreneurial individuals in a population using individual and population level data

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6016044329; 藏本達也,外3名: 'ソフトウェア開発プロジェクトにまたがるfault-proneモジュール判別の試み' 電子情報通信学会論文誌 第J95-D巻,第3号, 20120301, pp.425-436, 社団法人電子情報通信学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117808576A (zh) * 2024-01-08 2024-04-02 深度(山东)数字科技集团有限公司 一种用于企业融资额度估算的商业汇票大数据分析方法
CN117808576B (zh) * 2024-01-08 2024-05-28 深度(山东)数字科技集团有限公司 一种用于企业融资额度估算的商业汇票大数据分析方法

Also Published As

Publication number Publication date
JP2017084273A (ja) 2017-05-18
WO2017073446A1 (ja) 2017-05-04
US20190050373A1 (en) 2019-02-14

Similar Documents

Publication Publication Date Title
Arribas-Gil et al. Shape outlier detection and visualization for functional data: the outliergram
US11210300B2 (en) System and methods of generating structured data from unstructured data
Chen et al. Seasonal ARIMA forecasting of inbound air travel arrivals to Taiwan
JP6009864B2 (ja) 企業評価システム、企業評価方法及び企業評価プログラム
JP6063544B1 (ja) 説明変数値を算出する装置、方法及びプログラム
JP6246889B1 (ja) 説明変数を選択する装置、方法及びプログラム
Ramezanian et al. Forecasting health expenditures in Iran using the ARIMA model (2016-2020)
WO2020257782A1 (en) Factory risk estimation using historical inspection data
CN102004982A (zh) 使用变量计分的模型优化系统
KR20180061458A (ko) 정형/비정형 데이터 융합 기반 산업평가 정보 분석 방법 및 시스템
Momparler et al. Banking failure prediction: a boosting classification tree approach
Popli et al. Educational attainment and wage inequality in Turkey
Gan et al. Fat-tailed regression modeling with spliced distributions
WO2017073445A1 (ja) 説明変数を選択する装置、方法及びプログラム
Lohmann et al. Nonlinear relationships and their effect on the bankruptcy prediction
CN112308293B (zh) 违约概率预测方法及装置
JP2000348015A (ja) 経時的に変動しうる評価対象の評価項目を評価するためのシステム、方法および記録媒体
JP4777941B2 (ja) 需要予測方法および装置
Justice et al. Using fiscal indicator systems to predict municipal bankruptcies
Norman et al. Estimating detailed distributions from grouped sociodemographic data:‘get me started in’curve fitting using nonlinear models
KR102053595B1 (ko) 토픽 간 m&a 활성도 생성에 기반한 유망아이템 식별 방법
Văidean On financial performance and capital structure of Romanian companies
JP6605683B1 (ja) 見積方法、課金方法、コンピュータ、及びプログラム
Erbas et al. Sensitivity of the estimated air pollution–respiratory admissions relationship to statistical model choice
Vnukova et al. Identifying changes in insurance companies’ competitiveness on the travel services market

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161216

R150 Certificate of patent or registration of utility model

Ref document number: 6063544

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R154 Certificate of patent or utility model (reissue)

Free format text: JAPANESE INTERMEDIATE CODE: R154

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250