JP2019153258A - 機械学習装置、予測システム、及び、プログラム - Google Patents

機械学習装置、予測システム、及び、プログラム Download PDF

Info

Publication number
JP2019153258A
JP2019153258A JP2018041555A JP2018041555A JP2019153258A JP 2019153258 A JP2019153258 A JP 2019153258A JP 2018041555 A JP2018041555 A JP 2018041555A JP 2018041555 A JP2018041555 A JP 2018041555A JP 2019153258 A JP2019153258 A JP 2019153258A
Authority
JP
Japan
Prior art keywords
financial
prediction
graph
data
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018041555A
Other languages
English (en)
Other versions
JP6347022B1 (ja
Inventor
毅 葉山
Takeshi Hayama
毅 葉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hayama Takeshi
Original Assignee
Hayama Takeshi
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hayama Takeshi filed Critical Hayama Takeshi
Application granted granted Critical
Publication of JP6347022B1 publication Critical patent/JP6347022B1/ja
Publication of JP2019153258A publication Critical patent/JP2019153258A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】企業の財務数値データの中に欠損値が含まれている場合であっても、少ない手間で十分な予測精度の財務状況予測を実現する。【解決手段】機械学習装置は、複数の財務項目の実績数値により構成された企業の財務数値データ13から、財務数値データ13が表現されたグラフの画像データ20を作成するグラフ作成部14と、複数の企業の各々について、グラフ作成部14により作成された画像データ20と、財務数値データ13の対象期間後における企業の財務状況の変化に対応した学習用ラベルとが対応付けられた学習用データを取得し、複数の企業についての学習用データを用いた機械学習によって、予測対象企業の財務状況の変化に関する予測結果を出力する予測モデルを作成又は更新する機械学習部16とを備えている。【選択図】図1

Description

本発明は、企業の将来予測を行うための機械学習装置等に関する。
従来から、企業の将来予測を行うための予測技術が知られている。この種の予測技術は、例えば金融機関などの利害関係者にとって、企業の倒産リスクなどの事前把握に利用できるため有用である。
特許文献1には、評価対象企業がリスク企業(倒産する可能性や経営不振により株価が下落する可能性がある企業)であるか否かを判定する企業評価システムが記載されている。また、非特許文献1には、財務諸表から得られる53項目のデータを利用した倒産分析について記載されている。
特許6009864号公報
篠原博史、他2名、"簡便なデータを用いて正確な経営状態分類マップを作成する一手法"、21st Fuzzy System Symposium(Chofu,Sept.7-9,2005)、日本知能ファジィ情報学会
ところで、企業の財務状況予測のための予測モデルを機械学習によって作成するために、企業の財務数値データを入手しても、全ての財務項目の実績数値が埋まっているとは限らない。財務項目によっては実績数値が欠損している場合(欠損値が存在している場合)がある。このような場合に、欠損値が残る財務数値データをそのまま機械学習の学習用データ(訓練データ)に用いると、機械学習により作成される予測モデルの予測精度に悪影響を与え、十分な予測精度を確保できない虞がある。そのため、実績数値が欠損している財務項目に対し、適切な数値を算出して当てはめる欠損値処理が必要となる。しかし、この欠損値処理には比較的大きな手間を要する。
また、企業の財務状況予測にあたって予測対象企業の財務数値データを入手する場合においても、実績数値が欠損している財務項目が含まれている場合がある。このような場合に、欠損値が残る財務数値データをそのまま予測モデルに入力しても、適切な予測結果を得ることができない虞がある。
本発明は、このような事情に鑑みてなされたものであり、企業の財務数値データの中に欠損値が含まれている場合であっても、少ない手間で十分な予測精度の財務状況予測を実現することを目的とする。
上述の課題を解決するべく、第1の発明は、複数の財務項目の実績数値により構成された企業の財務数値データから、前記財務数値データが表現されたグラフの画像データを作成するグラフ作成部と、複数の企業の各々について、グラフ作成部により作成された画像データと、財務数値データの対象期間後における企業の財務状況の変化に対応した学習用ラベルとが対応付けられた学習用データを取得し、複数の企業についての学習用データを用いた機械学習によって、予測対象企業の財務状況の変化に関する予測結果を出力する予測モデルを作成又は更新する機械学習部とを備えた、機械学習装置である。
第2の発明は、予測対象企業について、複数の財務項目の実績数値により構成された財務数値データから、財務数値データが表現されたグラフの画像データを作成するグラフ作成部と、画像データを分類可能な計算モデルを用いた予測モデルに対し、グラフ作成部により作成された画像データを入力して演算を行い、予測対象企業の財務状況の変化に関する予測結果を出力する予測部とを備えた、予測システムである。
第3の発明は、第2の発明において、グラフ作成部は、複数の財務項目が収まる数値範囲から、上限側又は下限側の少なくとも一方を省略して狭めた数値範囲で、グラフの画像データを作成する。
第4の発明は、第2又は第3の発明において、グラフ作成部は、複数の財務項目の各々について実績数値を棒グラフで表したグラフの画像データを作成する。
第5の発明は、第2乃至第4の何れか1つの発明において、グラフ作成部は、財務数値データの中に実績数値が欠損している財務項目が含まれている場合、欠損が残った財務数値データから、グラフの画像データを作成する。
第6の発明は、第2乃至第5の何れか1つの発明において、財務数値データにおける各財務項目には、実績数値がパーセント表示される項目が用いられ、グラフ作成部は、各財務項目についてパーセント表示の実績数値が表されたグラフの画像データを作成する。
第7の発明は、第2乃至第6の何れか1つの発明において、予測モデルは、予測対象企業の倒産リスクを予測するモデルである。
第8の発明は、コンピュータに、予測対象企業について、複数の財務項目の実績数値により構成された財務数値データから、財務数値データが表現されたグラフの画像データを作成するグラフ作成ステップと、画像データを分類可能な計算モデルを用いた予測モデルに対し、グラフ作成部により作成された画像データを入力して演算を行い、予測対象企業の財務状況の変化に関する予測結果を出力する予測ステップとを実行させるためのプログラムである。
第1の発明では、財務数値データをそのまま学習用データとして用いず、財務数値データが表現されたグラフの画像データを作成して、その画像データを学習用データとして用いて機械学習を行う。ここで、本願発明者は、企業の財務状況予測において、企業の財務数値データに欠損値が含まれる場合であっても、上述の機械学習により十分な予測精度の予測モデルを作成できることを確認している。また、財務数値データからのグラフの画像データの作成は、コンピュータで容易に行うことができ、上述の欠損値処理に比べて手間が少ない。第1の発明によれば、企業の財務数値データに欠損値が含まれる場合であっても、少ない手間で十分な予測精度の財務状況予測を実現することができる。
第2及び第8の各発明では、予測対象企業の財務数値データが表現されたグラフの画像データを作成して、その画像データを予測モデルに入力する。ここで、本願発明者は、企業の財務状況予測において、予測対象企業の財務数値データに欠損値が含まれる場合であっても、上述の画像データへの変換によって十分な予測精度が得られることを確認している。また、グラフの画像データの作成は、上述したように手間が少ない。第2及び第8の各発明によれば、企業の財務数値データの中に欠損値が含まれる場合であっても、少ない手間で十分な予測精度の財務状況予測を実現することができる。
図1は、実施形態に係る機械学習装置の模式図である。 図2は、財務数値データを説明するための図である。 図3は、企業財務グラフの画像データを説明するための図である。 図4は、機械学習部の模式図である。 図5は、機械学習方法の手順を表すフローチャートである。 図6は、予測システムの模式図である。 図7は、倒産予測方法の手順を表すフローチャートである。 図8は、その他の変形例における企業財務グラフの画像データを説明するための図である。 図9は、その他の実施例における別の企業財務グラフの画像データを説明するための図である。
以下、本発明の実施形態を詳細に説明する。なお、以下の実施形態は、本発明の一例であって、本発明、その適用物、あるいはその用途の範囲を制限することを意図するものではない。
[1.機械学習装置の構成]
機械学習装置10は、複数の企業の各々についての財務数値データ13に対し所定のデータ処理を施し、そのデータ処理が施された学習用データを用いたニューラルネットワークの機械学習によって、予測対象企業の財務状況の変化に関する予測結果を出力する予測モデル(学習済みモデル)を作成する装置である。所定のデータ処理は、財務数値データ13を、その財務数値データ13が表現されたグラフ(以下、「企業財務グラフ」という。)の画像データ20(例えば、拡張子png又はjpegなどの画像データ)に変換する処理である。また、本実施形態では、予測モデルが、予測対象企業の倒産リスクを予測するモデルであり、予測対象企業が倒産するか否かを予測結果として出力する。なお、機械学習装置10は、新たな財務数値データ13を学習用データとして用いて、予測モデルの更新を行うことも可能である。
機械学習装置10は、GPU及びメモリーを備えた、1つ又は複数のコンピュータ(パーソナルコンピュータ、サーバー等)により構成されている。本実施形態では、ニューラルネットワークとして、畳み込みニューラルネットワーク(Convolutional Neural Network:以下、「CNN」と言う。)が採用されている。なお、画像の分類に適用可能なニューラルネットワークであれば、CNN以外のものを採用してもよい。また、機械学習とは、ニューラルネットワークのパラメータ(重み、バイアス)を最適化する処理である。なお、機械学習装置10は、GPUとCPUの両方を備えたコンピュータにより構成されていてもよいし、CPUを備えたコンピュータにより構成されていてもよい。
機械学習装置10は、図1に示すように、財務数値データ13を格納するデータ記憶部12と、財務数値データ13から企業財務グラフの画像データ20を作成するグラフ作成部14と、画像データ20を学習用データとして用いた機械学習によって予測モデルを作成する機械学習部16と、機械学習部16による学習結果に基づいてニューラルネットワークのパラメータを更新するパラメータ更新部26とを備えている。データ記憶部12は、メモリーにより構成されている。メモリーには、CNNを含む学習用プログラムも格納されている。グラフ作成部14と機械学習部16とパラメータ更新部26とは、コンピュータのGPUが学習用プログラムを実行及び解釈することによって実現される機能ブロックである。
データ記憶部12は、複数の企業P〜P−x(例えば500程度の企業)について単年度の財務数値データ13が配列された表データ15(図2参照)を格納している。各企業の財務数値データ13は、複数種類(例えば190種類)の財務項目A〜Zの実績数値により構成されている。財務項目は、企業の財務状態を表す項目である。全ての財務項目A〜Zには、パーセント表示される財務指標が用いられている。財務項目A〜Zとしては、例えば、売上高増加率、営業利益率、自己資本比率、総資産利益率、株主資本利益率などを用いることができる。表データ15では、ほとんどの財務項目A〜Zに対し実績数値が入力されているが、一部に実績数値が欠損している財務項目がある。
また、表データ15では、互いに関連する財務項目が連続して並ぶように、財務項目A〜Zの配列順番(図2における縦方向の配列順番)が定められている。なお、互いに関連する財務項目の一例は、例えば、総資産利益率と株主資本利益率のように利益率に関する財務項目同士である。
また、表データ15に記述された全ての企業P〜P−xは、存続企業と倒産企業とに分けられる。図2に示す表データ15の最終行には、各企業P〜P−xに対し、存続企業であるか倒産企業であるかを示す学習用ラベルが付されている。学習用ラベルは、財務数値データ13の対象期間後における企業の財務状況の変化(悪化したか否か)に対応した内容となっている。なお、表データ15では、存続企業と倒産企業ともに複数の企業の財務数値データ13が準備されている。また、表データ15における各倒産企業の財務数値データ13の対象期間は、例えば倒産した年度の1つ前の年度である。
グラフ作成部14は、データ記憶部12から企業の財務数値データ13を取得し、その財務数値データ13が表された1つの企業財務グラフの画像データ20(図3参照)を作成する。グラフ作成部14は、データ記憶部12に格納されている全ての企業について財務数値データ13を取得し、企業毎に企業財務グラフの画像データ20を作成する。なお、図3に示す画像データ20では、各棒グラフBをグレースケールで表現しているが、各棒グラフBをカラーで表現してもよい。
企業財務グラフでは、各財務項目A〜Zに対して棒グラフBが用いられている。横軸上では各財務項目A〜Zの位置が定められている。実績数値が存在する財務項目A〜Zについて、全ての財務項目A〜Zの棒グラフBは横軸に沿って順番に並んでいる。実績数値が欠損している財務項目については棒グラフBが表示されない。また、企業財務グラフの縦軸は、各財務項目A〜Zの実績数値の大きさを表す。なお、図3では、画像データ20について、横のピクセル数がX(例えば、X=500)で表され、縦のピクセル数がY(例えばY=200)で表されている。
具体的に、企業財務グラフでは、各棒グラフBの長さが各財務項目A〜Zの数値の大きさを表す。図3に示す波線Dをゼロとして、プラスの財務項目は波線Dより上側に延び、マイナスの財務項目は波線Dより下側に延びている。また、企業財務グラフでは、横軸上において隣り合う財務項目A〜Zの棒グラフBが隙間なく並んでいる。また、企業財務グラフにおける財務項目A〜Zの順番は、表データ15における財務項目A〜Zの配列順番と同じである。そのため、企業財務グラフでは、互いに関連する財務項目の棒グラフBが連続して並ぶ。なお、波線Dは、説明のために図3に記載しているが、画像データ20では記載を省略する。画像データ20では縦軸も横軸も記載されていない。また、画像データ20では凡例や軸目盛などの他の要素も記載されていない。
また、企業財務グラフの縦軸について、財務項目A〜Zが収まる数値範囲(財務項目A〜Zの中における最小値から最大値までの範囲)よりも狭く、マイナスの下限値からプラスの上限値までのゼロを含む数値範囲(例えば−30%〜80%)に調整している。縦軸の数値範囲は、上限値(80%)の方が下限値(−30%)よりも絶対値が大きい。グラフ作成部14は、複数の財務項目が収まる数値範囲から、上限側(80%〜最大値)と下限側(最小値〜−30%)の両方を省略して狭めた数値範囲で、企業財務グラフの画像データ20を作成する。
機械学習部16は、上述したように、畳み込みニューラルネットワークにより構成されている。機械学習部16は、複数組の畳み込み層17及びプーリング層18と、多層ニューラルネットワーク構造19とを備えている。多層ニューラルネットワーク構造19は、ネットワーク構造とパラメータ(重みとバイアス)とを有し、学習前は各パラメータに初期値が設定されている。
畳み込み層17は、入力された画像データ20(全画素)に対し畳み込み演算を行うことによって複数の一次特徴マップ21を抽出する。畳み込み演算では、例えば縦サイズも横サイズも5ピクセルのフィルタが用いられる。フィルタの横サイズは棒グラフBの幅と同程度にしている。また、ストライドは1ピクセルに、パディングは0ピクセルに設定されている。ストライドは棒グラフBの幅より小さくしている。なお、フィルタのサイズ、ストライド、及びパディングは、この段落の数値に限定されない。
プーリング層18は、畳み込み層17から出力された複数の一次特徴マップ21の各々に対しプーリング(例えばマックスプーリング)を行う。マックスプーリングは、特徴マップの全ピクセルにおける最大値を代表値として採用する処理である。プーリング層18では、一次特徴マップ21よりピクセル数が少ない二次特徴マップ22が、一次特徴マップ21と同数作成される。
プーリング層18の後段には、2組目の畳み込み層及びプーリング層が設けられている(図示省略)。2組目の畳み込み層及びプーリング層では、各二次特徴マップ22に対する畳み込み演算によって三次特徴マップが抽出され、三次特徴マップに対するプーリング(例えばマックスプーリング)により四次特徴マップが作成される。機械学習部16では、畳み込み演算とプーリングとが複数回繰り返される。最終段のプーリング層18では、直前の畳み込み層17から出力されたN−1次特徴マップ23に対するプーリング(例えばマックスプーリング)によりN次特徴マップ24が作成される。
多層ニューラルネットワーク構造19は、図4に示すように、全結合層29と出力層30とを備えている。全結合層29には、最終段のプーリング層18から出力された複数のN次特徴マップ24が入力される。全結合層29は、複数の層から構成されており、各層は複数のユニット(ニューロン素子)により構成されている。出力層30は1つユニットにより構成されている。全結合層29では、隣り合う層間において前側層の各ユニットが後側層の全ユニットと繋がり、最終層の各ユニットは出力層30のユニットに繋がる。
全結合層29及び出力層30では、ユニットの出力値yが、式1によって表される。式1において、f( )は活性化関数(例えばシグモイド関数)、xnは前側層のn番目のユニットからの入力信号(入力値)、wnは前側層のn番目のユニットからの入力信号に対する重み、bはバイアス(閾値)を表す。多層ニューラルネットワーク構造19では、誤差逆転伝搬法による学習により各層の重みwnとバイアスbとを更新する。
式1:y=f(w1×x1+w2×x2+・・・+wn×xn−b)
[2.機械学習装置の動作]
図5を参照しながら、コンピュータにより構成される機械学習装置10の動作について説明する。なお、データ記憶部12には多数の企業の財務数値データ13が格納されているものとする。また、データ記憶部12には、各パラメータに初期値が設定された畳み込みニューラルネットワークが格納されている。
機械学習装置10では、学習用プログラムを実行することによって機械学習方法を構成する情報処理が開始される。まずステップS51において、グラフ作成部14は、データ記憶部12から企業の財務数値データ13を取得する。次に、ステップS52において、グラフ作成部14は、ステップ51において取得された財務数値データ13から企業財務グラフの画像データ20を作成する。なお、クラブ作成部14は、財務数値データ13の中に実績数値が欠損している財務項目が含まれている場合、その財務項目に数値データを入れずに、企業財務グラフの画像データ20を作成する。つまり、欠損値を含む財務数値データ13がそのまま用いられる。グラフ作成部14は、データ記憶部12から全ての企業の財務数値データ13を取得し、企業毎に企業財務グラフの画像データ20を作成する。
次に、ステップS53において、機械学習部16は、企業毎に、企業財務グラフの画像データ20と学習用ラベルとを取得する。そして、機械学習部16は、全ての企業について、企業財務グラフの画像データ20を畳み込みニューラルネットに入力して演算を行い、その企業財務グラフに対応する学習用ラベルの値(例えば、倒産企業=0、存続企業=1)に対する出力層30の出力値の誤差を出力する。次に、機械学習部16は、全ての企業についての誤差の集計値がゼロに近づくように各パラメータを算出する。パラメータ更新部26は、メモリーにおけるニューラルネットワークの各パラメータを、機械学習部16による算出値に更新する。以上により、予測モデルの学習済みモデルが得られ、図5に示すフローチャートの処理は終了する。
[3.予測システムの構成]
予測システム40は、図6に示すように、予測対象企業の財務数値データ13を受け付けるデータ受付部41と、データ受付部41によって受け付けられた予測対象企業の財務数値データ13から企業財務グラフの画像データ20を作成するグラフ作成部42と、学習済みの予測モデル(機械学習装置10によって作成された予測モデル)を格納するモデル記憶部43と、グラフ作成部42において作成された企業財務グラフの画像データ20を予測モデルに入力して予測対象企業の倒産予測を行う予測部44と、予測部44による予測結果を画面に表示させるための表示部46とを備えている。なお、予測システム40は、GPU及びメモリーを備えた、1つ又は複数のコンピュータ(パーソナルコンピュータ等)によって構成されている。
モデル記憶部43は、メモリーにより構成されている。データ受付部41とグラフ作成部42と予測部44と表示部46とは、コンピュータのGPUが予測モデル(CNN)を含む倒産予測プログラムを実行及び解釈することによって実現される機能ブロックである。グラフ作成部42は、機械学習装置10のグラフ作成部14と同じ処理を行う。
データ受付部41は、倒産予測プログラムの実行中に、ユーザが予測モデルに入力した予測対象企業の財務数値データ13を受け付ける部分である。例えばプログラムの起動画面においてユーザが予測対象企業の財務数値データ13に対し入力操作を行うと、データ受付部41は、財務数値データ13を受け付ける。そして、グラフ作成部42は、データ受付部41によって受け付けられた財務数値データ13を取得し、企業財務グラフの画像データ20を作成する。
予測部44は、グラフ作成部42によって作成された企業財務グラフの画像データ20を取得すると共に、モデル記憶部43から予測モデル(ネットワーク構造及び各パラメータ)を読み出す。そして、予測部44は、企業財務グラフの画像データ20を予測モデルに入力して予測モデルの演算を行う。これにより、予測モデルの出力層30から、予測対象企業が存続するか倒産するかを表す予測結果(数値)が出力される。
[4.予測システムの動作]
図7を参照しながら、コンピュータにより構成される予測システム40の動作について説明する。なお、予測システム40は、インターネット又は記録媒体を介して、予測対象企業の財務数値データ13を取得してメモリーに格納している。
予測システム40では、倒産予測プログラムを実行することによって倒産予測方法を構成する情報処理が開始される。倒産予測プログラムの実行により、まず倒産予測プログラムの起動画面が立ち上がる。そして、ユーザの操作によって予測対象企業の財務数値データ13が予測モデルへの入力データとして選択されると、ステップS71において、データ受付部41が、予測対象企業の財務数値データ13を受け付ける。
次に、ステップS72(グラフ作成ステップ)において、グラフ作成部42は、ステップ71において取得された財務数値データ13から企業財務グラフの画像データ20を作成する。クラブ作成部42は、財務数値データ13の中に実績数値が欠損している財務項目が含まれている場合は、その財務項目に数値データを入れずに、企業財務グラフの画像データ20を作成する。
次に、ステップS73(予測ステップ)において、予測部44は、ステップS72において作成された企業財務グラフの画像データ20を取得すると共に、モデル記憶部43から予測モデル(ネットワーク構造及び各パラメータ)を読み出す。そして、予測部44は、企業財務グラフの画像データ20を予測モデルに入力して予測モデルの演算を行う。これにより、予測モデルの出力層30から、予測結果を表す数値が出力される。表示部46は、その数値を「倒産」又は「存続」の文字データに変換し、コンピュータの画面上に表示させる。以上により、図7に示すフローチャートの処理は終了する。
ここで、機械学習装置10により実際に作成された予測モデル(以下、「作成モデル」という。)の予測精度について、本願発明者による評価方法及び評価結果を説明する。評価には、多数の企業の財務数値データ13と共に、各財務数値データ13に対応する企業が実際に存続しているか又は倒産しているかを表す実情報とを用いた。評価は、作成モデルに対し各企業の財務数値データ13を入力して演算を行い、実情報(存続又は倒産)に対する作成モデルの出力の正答率を算出することにより行った。なお、財務数値データ13には欠損値が含まれていた。
なお、グラフ作成部14によって作成された画像データ20のサイズは、横方向のピクセル数Xが680ピクセル、縦方向のピクセル数Yが280ピクセルであった。また、画像データ20における縦軸の数値範囲については、3通りの下限値(−10%、−20%、−30%)と、3通りの上限値(80%、90%、100%)とを組み合わせた9通りを選択した。表1は、作成モデルについて各数値範囲の正答率(予測結果)を表している。表1に示すように、低くても約70%の正答率が得られ、−30%〜80%の数値範囲を選択した時には約95%の正答率が得られた。
Figure 2019153258
[5.実施形態の効果など]
本実施形態では、財務数値データ13が表現された企業財務グラフの画像データ20を学習用データとして用いて機械学習を行うことで、企業の財務数値データ13に欠損値が含まれる場合であっても、少ない手間で十分な予測精度の倒産予測を実現することができる。また、財務数値データ13の実績数値を正規化しなくても、十分な予測精度の倒産予測を実現することができる。なお、財務数値データ13の実績数値を正規化した数値データから、企業財務グラフの画像データ20を作成することも可能である。
また、本実施形態では、予測モデルへの入力データとして、財務数値データ13が可視化された画像データ20が用いられる。そのため、ニューラルネットワークにおけるブラックボックスの問題が生じにくく、予測結果に影響を与える財務項目を把握しやすくなる。
また、本実施形態では、企業財務グラフの縦軸の数値範囲について、各財務項目が収まる数値範囲から、上限側と下限側を省略した企業財務グラフの画像データ20を作成している。これにより、倒産予測への影響が高い領域を中心に機械学習又は倒産予測が行われるため、予測精度を向上させることができる。なお、企業財務グラフの縦軸の数値範囲は、上限側と下限側のうち上限側だけを省略してもよいし、下限側だけを省略してもよい。
また、本実施形態では、横軸上において隣り合う財務項目の棒グラフBが隙間なく並ぶ企業財務グラフの画像データ20を作成している。そのため、無駄な画素が減少し、予測精度を向上させることができる。
また、本実施形態では、縦軸と横軸の両方の記載を省略した企業財務グラフの画像データ20を作成している。そのため、倒産予測に関係がない軸の情報がニューラルネットワークへの入力データに含まれないため、予測精度を向上させることができる。なお、企業財務グラフは、縦軸と横軸のうち縦軸だけを省略してもよいし、横軸だけを省略してもよい。
[6.その他の変形例]
上記実施形態では、各企業について単年度分の財務数値データ13を使用したが、複数年度分の財務数値データを使用してもよい。この場合、例えば、図8に示すように、企業財務グラフの画像データ20は、各年度の財務数値データ13から作成した企業財務グラフを横軸に沿って連続的に並べた画像データ31とすることができる。また、各財務項目を棒グラフBで表現せずに、図9に示すように、各財務項目について複数年分(倒産の5年前から1年前までの5年分)の実績数値の時系列変化を折れ線グラフLによって表した画像データ32を作成してもよい。欠損値がある財務項目については、欠損値の年度で折れ線グラフLが切れており、その年度とその前後の年度とを結ぶ線は表示されない。なお、図9に示す画像データ20は、各折れ線グラフLをグレースケールで表現しているが、各折れ線グラフLをカラーで表現してもよい。
また、上記実施形態では、財務数値データ13の中に欠損値が含まれている場合、欠損値処理を行わずに企業財務グラフの画像データ20を作成したが、欠損値処理を行った後に企業財務グラフの画像データ20を作成してもよい。
また、上記実施形態では、全ての財務項目についてパーセント表示される財務項目を用いたが、パーセント表示されない財務項目(例えば、売上高、営業利益)を用いてもよい。
また、上記実施形態において、機械学習に用いる倒産企業の財務数値データ13について、例えば倒産した年度の1つ前の年度のデータだけを用いているが、このようなデータに限定されず、例えば倒産した年度の2つ前の年度のデータが混在していてもよい。
また、上記実施形態において、機械学習装置10によって、予測対象企業が成長するか否かを予測する予測モデルを作成してもよく、予測システム40は、予測対象企業が成長するか否かを予測結果として出力してもよい。この場合、学習用データとしては、例えば、財務数値データ13の対象期間後に株価が上昇した成長企業と、それ以外の企業とに分類して学習用ラベルを付けて機械学習を行ってもよい。また、財務数値データ13の対象期間後に売上高と経常増益率の両方が上昇した企業を成長企業とすることもでき、経常増益率の代わりに、経常利益、営業利益、又は粗利益などを用いることもできる。
また、上記実施形態において、マルチラベルに対応可能なニューラルネットワークを予測モデル(例えば、出力層30に複数のユニットが設けられたニューラルネットワーク)に用いてもよい。この場合、学習用データとしては、例えば、倒産企業と、成長企業(例えば、株価が所定レベル以上に上昇した企業)と、これら以外の企業とに分類して学習用ラベルを付けて機械学習を行ってもよい。
また、上記実施形態において、倒産した年度の1つ前の年度(n年度)の財務数値データ13だけを用いて機械学習した第1予測モデルと、倒産した年度の2つ前の年度(n−1年度)の財務数値データ13だけを用いて機械学習した第2予測モデルとを生成してもよい。この場合、第1予測モデルと第2予測モデルとの各々に対し予測対象企業の財務数値データ13を入力することで、1年後に倒産するか否か又は2年後に倒産するか否かを予測することができる。
また、上記実施形態において、予測モデルは、予測対象企業の倒産確率(又は成長確率)を算出するように構成されていてもよい。この場合、例えば、多層ニューラルネットワーク構造19の後段に、出力層30の出力値に基づいて予測対象企業の倒産確率を算出する確率算出部を設ける。例えば、出力層30の出力値がゼロの場合に「100%倒産」と予測され、出力値が1の場合に「100%存続」と予測される場合に、ゼロと出力値との差に基づいて倒産確率を算出する。
本発明は、企業の将来予測を行うための機械学習装置等に適用可能である。
10 機械学習装置
12 データ記憶部
14 グラフ作成部
16 機械学習部
40 予測システム
41 データ受付部
42 グラフ作成部
43 モデル記憶部
44 予測部

Claims (8)

  1. 複数の財務項目の実績数値により構成された企業の財務数値データから、前記財務数値データが表現されたグラフの画像データを作成するグラフ作成部と、
    複数の企業の各々について、前記グラフ作成部により作成された前記画像データと、前記財務数値データの対象期間後における企業の財務状況の変化に対応した学習用ラベルとが対応付けられた学習用データを取得し、前記複数の企業についての前記学習用データを用いた機械学習によって、予測対象企業の財務状況の変化に関する予測結果を出力する予測モデルを作成又は更新する機械学習部とを備えた、機械学習装置。
  2. 予測対象企業について、複数の財務項目の実績数値により構成された財務数値データから、前記財務数値データが表現されたグラフの画像データを作成するグラフ作成部と、
    画像データを分類可能な計算モデルを用いた予測モデルに対し、前記グラフ作成部により作成された前記画像データを入力して演算を行い、前記予測対象企業の財務状況の変化に関する予測結果を出力する予測部とを備えた、予測システム。
  3. 前記グラフ作成部は、前記複数の財務項目が収まる数値範囲から、上限側又は下限側の少なくとも一方を省略して狭めた数値範囲で、前記グラフの画像データを作成する、請求項2に記載の予測システム。
  4. 前記グラフ作成部は、前記複数の財務項目の各々について前記実績数値を棒グラフで表した前記グラフの画像データを作成する、請求項2又は3に記載の予測システム。
  5. 前記グラフ作成部は、前記財務数値データの中に前記実績数値が欠損している財務項目が含まれている場合、前記欠損が残った財務数値データから、前記グラフの画像データを作成する、請求項2乃至4の何れか1つに記載の予測システム。
  6. 前記財務数値データにおける各財務項目には、前記実績数値がパーセント表示される項目が用いられ、
    前記グラフ作成部は、前記各財務項目についてパーセント表示の実績数値が表された前記グラフの画像データを作成する、請求項2乃至5の何れか1つに記載の予測システム。
  7. 前記予測モデルは、前記予測対象企業の倒産リスクを予測するモデルである、請求項2乃至6の何れか1つに記載の予測システム。
  8. コンピュータに、
    予測対象企業について、複数の財務項目の実績数値により構成された財務数値データから、前記財務数値データが表現されたグラフの画像データを作成するグラフ作成ステップと、
    画像データを分類可能な計算モデルを用いた予測モデルに対し、前記グラフ作成部により作成された前記画像データを入力して演算を行い、前記予測対象企業の財務状況の変化に関する予測結果を出力する予測ステップとを実行させるためのプログラム。
JP2018041555A 2018-02-28 2018-03-08 機械学習装置、予測システム、及び、プログラム Active JP6347022B1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018034099 2018-02-28
JP2018034099 2018-02-28

Publications (2)

Publication Number Publication Date
JP6347022B1 JP6347022B1 (ja) 2018-06-20
JP2019153258A true JP2019153258A (ja) 2019-09-12

Family

ID=62635742

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018041556A Pending JP2019153259A (ja) 2018-02-28 2018-03-08 機械学習装置、予測システム、及び、プログラム
JP2018041555A Active JP6347022B1 (ja) 2018-02-28 2018-03-08 機械学習装置、予測システム、及び、プログラム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2018041556A Pending JP2019153259A (ja) 2018-02-28 2018-03-08 機械学習装置、予測システム、及び、プログラム

Country Status (1)

Country Link
JP (2) JP2019153259A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020197898A (ja) * 2019-06-03 2020-12-10 株式会社日立製作所 経営分析支援システム、及び経営分析支援方法
KR102519878B1 (ko) * 2022-02-04 2023-04-10 주식회사 도피앙 금융기관 신용공여 사업에서의 인공지능 기반 리스크 관리 솔루션을 제공하기 위한 장치, 방법 및 명령을 기록한 기록 매체
JP7286121B1 (ja) 2022-09-20 2023-06-05 国立大学法人一橋大学 情報処理装置、モデル構築方法及びモデル構築プログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6667820B2 (ja) * 2018-07-25 2020-03-18 株式会社グーフ 印刷受発注管理システム、印刷受発注サーバ、印刷受発注管理方法及びプログラム
JP2020121503A (ja) * 2019-01-31 2020-08-13 セイコーエプソン株式会社 印刷装置、機械学習装置、機械学習方法、印刷制御プログラム
JP6797956B2 (ja) * 2019-03-14 2020-12-09 株式会社三井住友銀行 推計装置、推計方法およびプログラム
JP7022806B1 (ja) 2020-10-23 2022-02-18 株式会社エクサウィザーズ 情報処理方法、コンピュータプログラム及び情報処理装置
JP7223101B2 (ja) * 2020-10-23 2023-02-15 株式会社エクサウィザーズ 学習モデルの生成方法、コンピュータプログラム及び情報処理装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016024486A (ja) * 2014-07-16 2016-02-08 キヤノン株式会社 データ活用システム及びその制御方法
KR20170128023A (ko) * 2016-05-13 2017-11-22 한양대학교 산학협력단 데이터 뎁스를 활용한 기업 부도 예측 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020197898A (ja) * 2019-06-03 2020-12-10 株式会社日立製作所 経営分析支援システム、及び経営分析支援方法
JP7194077B2 (ja) 2019-06-03 2022-12-21 株式会社日立製作所 経営分析支援システム、及び経営分析支援方法
KR102519878B1 (ko) * 2022-02-04 2023-04-10 주식회사 도피앙 금융기관 신용공여 사업에서의 인공지능 기반 리스크 관리 솔루션을 제공하기 위한 장치, 방법 및 명령을 기록한 기록 매체
JP7286121B1 (ja) 2022-09-20 2023-06-05 国立大学法人一橋大学 情報処理装置、モデル構築方法及びモデル構築プログラム

Also Published As

Publication number Publication date
JP2019153259A (ja) 2019-09-12
JP6347022B1 (ja) 2018-06-20

Similar Documents

Publication Publication Date Title
JP6347022B1 (ja) 機械学習装置、予測システム、及び、プログラム
Galante et al. The challenge of modeling niches and distributions for data‐poor species: a comprehensive approach to model complexity
US11574011B2 (en) Merging feature subsets using graphical representation
JP6612486B1 (ja) 学習装置、分類装置、学習方法、分類方法、学習プログラム、及び分類プログラム
JP7061536B2 (ja) 最適化装置、シミュレーションシステム及び最適化方法
JP4937608B2 (ja) 指標推計装置、指標推計方法、及び指標推計プログラム
CN107133699A (zh) 电影票房趋势预测方法和装置、设备、存储介质
US11514369B2 (en) Systems and methods for machine learning model interpretation
JP2019211870A (ja) 在庫管理装置および在庫管理方法
JP2022158542A (ja) 推論プログラム、推論方法および情報処理装置
CN103649942B (zh) 利用参数估计的零售预估
TWI781461B (zh) 資訊處理裝置、資訊處理方法及程式
JP2019125206A (ja) 情報処理装置、情報処理方法及びプログラム
WO2019187289A1 (ja) 評価システム、評価方法および評価用プログラム
JP6531820B2 (ja) 推定器可視化システム
JP4607359B2 (ja) 信用リスク評価方法及びシステム
US11586951B2 (en) Evaluation system, evaluation method, and evaluation program for evaluating a result of optimization based on prediction
KR102105951B1 (ko) 추론을 위한 제한된 볼츠만 머신 구축 방법 및 추론을 위한 제한된 볼츠만 머신을 탑재한 컴퓨터 장치
CN104423964B (zh) 用于确定可视化的可信性的方法和系统
CN113537731B (zh) 基于强化学习的设计资源能力评估方法
CN115718740A (zh) 用于稀疏时间序列数据集的数据插补的方法和装置
JP2009265713A (ja) モデル構築装置およびプログラム
US10692256B2 (en) Visualization method, visualization device, and recording medium
Wang et al. Future of jobs in China under the impact of artificial intelligence
JP2021174330A (ja) 異種機械学習のアンサンブル学習による予測装置

Legal Events

Date Code Title Description
A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20180308

AA64 Notification of invalidation of claim of internal priority (with term)

Free format text: JAPANESE INTERMEDIATE CODE: A241764

Effective date: 20180322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180320

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20180406

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180511

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180517

R150 Certificate of patent or registration of utility model

Ref document number: 6347022

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250