JP6797956B2 - Estimator, estimation method and program - Google Patents
Estimator, estimation method and program Download PDFInfo
- Publication number
- JP6797956B2 JP6797956B2 JP2019047190A JP2019047190A JP6797956B2 JP 6797956 B2 JP6797956 B2 JP 6797956B2 JP 2019047190 A JP2019047190 A JP 2019047190A JP 2019047190 A JP2019047190 A JP 2019047190A JP 6797956 B2 JP6797956 B2 JP 6797956B2
- Authority
- JP
- Japan
- Prior art keywords
- image data
- histogram
- data
- customer
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 27
- 238000013473 artificial intelligence Methods 0.000 claims description 14
- 230000007423 decrease Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 29
- 238000012546 transfer Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- 238000012549 training Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000013707 sensory perception of sound Effects 0.000 description 1
Images
Description
本発明は、推計装置、推計方法およびプログラムに関する。より詳細に言えば、本発明は、複数の経営状況パターンに関連付けられる様々な融資先の口座の動態データに基づいて生成された画像データを蓄積あるいは機械学習し、特定の融資先の口座の動態データに基づく画像データを、蓄積されたあるいは機械学習された画像データに基づいて分析することにより、経営状況の大幅な変動、とりわけ、デフォルト(債務不履行)の発生有無を予測する推計装置、推計方法およびプログラムに関する。 The present invention relates to an estimation device, an estimation method and a program. More specifically, the present invention accumulates or machine-learns image data generated based on the dynamic data of the accounts of various lenders associated with a plurality of business situation patterns, and the dynamics of the account of a specific lender. By analyzing image data based on data based on accumulated or machine-learned image data, an estimation device and estimation method for predicting the occurrence of large fluctuations in business conditions, especially default (default). And about the program.
従来から、融資先の信用状態を定期的にモニタリングすることが行われている。銀行は、融資先から提供される決算書類などから財務数値データを取得したり、法人担当者が企業経営者などから定期的にヒアリングを行ったりすることによって、融資先の経営状況に変化が生じていないかどうかを判断している。 Traditionally, the credit status of lenders has been regularly monitored. Banks change the management situation of lenders by acquiring financial numerical data from financial statements provided by lenders and by having corporate managers regularly conduct hearings with corporate managers. I'm judging if it's not.
このような判断を人手に頼るだけでなく、コンピュータを利用して行う試みも行われている。例えば、融資先事業者の財務状況に関するデータに基づいて、事業者の信用度を算出する装置が知られていた(特許文献1)。 Attempts have been made not only to make such judgments manually, but also to use computers. For example, a device for calculating the creditworthiness of a lender based on data on the financial status of the lender has been known (Patent Document 1).
近年、様々な分野で人工知能(AI)を利用した機械学習の手法が利用されるようになってきている。AIを支える手法の一つである、ディープラーニング(深層学習)と呼ばれるニューラルネットワークを進化させた技術を画像分類に適用することも行われるようになってきている。深層学習モデルの中でも、畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)は、画像や動画認識に広く使用されるモデルであることが知られている。 In recent years, machine learning methods using artificial intelligence (AI) have come to be used in various fields. It is also becoming common to apply a technique called deep learning, which is one of the methods supporting AI, which is an evolution of a neural network, to image classification. Among the deep learning models, the convolutional neural network (CNN) is known to be a model widely used for image and moving image recognition.
融資先の信用状態のモニタリングで利用される財務数値データは、決算書類が作成されるタイミングである、年1回あるいは半年に1回などの期間ごとにしか取得できないものであった。また、企業規模によっては、決算月から相当程度経過してから決算書類が融資元企業に提出されることもあった。 The financial numerical data used for monitoring the credit status of the lender could only be obtained once a year or once every six months, which is the timing when the financial statements are prepared. In addition, depending on the size of the company, financial statements may be submitted to the lender company after a considerable amount of time has passed since the closing month.
企業の経営状況は、外部要因および内部要因により目まぐるしく変化するため、その企業の信用状態も短い期間で変化することも多い。外部要因および/または内部要因次第では、企業の信用状態は相当程度短い期間で変化してしまい、場合によっては、デフォルト(債務不履行)状態となってしまうこともあった。 Since the business condition of a company changes rapidly due to external and internal factors, the credit status of the company often changes in a short period of time. Depending on external and / or internal factors, a company's credit status may change in a fairly short period of time, and in some cases may become a default (default) condition.
融資先の信用状態を財務数値データに基づいて評価する場合、実際の経営状況の変化の早さから、融資元企業は、評価を適時適切に行うことができない場合もあった。かかる場合、融資元企業は、融資先に対して経営改善のサポートを適切に行うことができず、融資先のデフォルトにより融資回収が困難となる事態を招くこともあった。 When evaluating the credit status of a lender based on numerical financial data, the lender company may not be able to perform the evaluation in a timely and appropriate manner due to the rapid changes in the actual business conditions. In such a case, the lender company could not properly support the lender for management improvement, and the default of the lender may make it difficult to collect the loan.
本発明は、このような課題を解決するためになされたものであり、複数の経営状況パターンに関連付けられる様々な融資先の口座の動態データに基づいて生成された画像データを蓄積あるいは機械学習し、特定の融資先の口座の動態データに基づく画像データを、蓄積された画像データあるいは機械学習された画像データに基づいて分析することにより、経営状況の大幅な変動、とりわけ、デフォルトの発生有無を予測する推計装置、推計方法およびプログラムを提供することを目的とする。 The present invention has been made to solve such a problem, and accumulates or machine-learns image data generated based on dynamic data of accounts of various lenders associated with a plurality of business situation patterns. By analyzing image data based on the dynamic data of the account of a specific lender based on accumulated image data or machine-learned image data, it is possible to detect significant changes in business conditions, especially whether or not defaults occur. It is an object of the present invention to provide an estimation device, an estimation method and a program for predicting.
本発明の一態様である推計装置は、分析対象として指定された顧客に関連付けられる入出金明細データを読み出し、読み出された入出金明細データに含まれる変数に対して、第1の期間に関連付けられる第1の度数分布データおよび第2の期間に関連付けられる第2の度数分布データを生成し、前記第1の度数分布データおよび前記第2の度数分布データに基づいて、前記第1の期間に関連付けられる第1のヒストグラムおよび前記第2の期間に関連付けられる第2のヒストグラムを含む第1の画像データを生成し、前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムの差分の大きさを識別し、識別された前記差分の大きさが予め定められた閾値以上であるかどうかを判定し、前記差分の大きさが予め定められた閾値以上であると判定されたという条件で、前記第1の画像データと、第2の画像データとを比較することにより、前記顧客の経営状況を予測するように構成される。 The estimation device according to one aspect of the present invention reads the deposit / withdrawal detail data associated with the customer designated as the analysis target, and associates the variables included in the read deposit / withdrawal detail data with the first period. The first frequency distribution data and the second frequency distribution data associated with the second period are generated, and based on the first frequency distribution data and the second frequency distribution data, in the first period. The first image data including the associated first histogram and the second histogram associated with the second period is generated, and the first histogram and the second histogram included in the first image data are generated. The magnitude of the difference was identified, it was determined whether the magnitude of the identified difference was greater than or equal to a predetermined threshold, and it was determined that the magnitude of the difference was greater than or equal to the predetermined threshold. Under the condition that the first image data and the second image data are compared, the business situation of the customer is predicted.
本発明の別の一態様である推計装置によって実行される推計方法は、分析対象として指定された顧客に関連付けられる入出金明細データを読み出すことと、読み出された入出金明細データに含まれる変数に対して、第1の期間に関連付けられる第1の度数分布データおよび第2の期間に関連付けられる第2の度数分布データを生成することと、前記第1の度数分布データおよび前記第2の度数分布データに基づいて、前記第1の期間に関連付けられる第1のヒストグラムおよび前記第2の期間に関連付けられる第2のヒストグラムを含む第1の画像データを生成することと、前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムの差分の大きさを識別し、識別された前記差分の大きさが予め定められた閾値以上であるかどうかを判定することと、前記差分の大きさが予め定められた閾値以上であると判定されたという条件で、前記第1の画像データと、第2の画像データとを比較することにより、前記顧客の経営状況を予測することを含む。 The estimation method performed by the estimation device, which is another aspect of the present invention, reads the deposit / withdrawal detail data associated with the customer designated as the analysis target, and the variables included in the read deposit / withdrawal detail data. On the other hand, the first frequency distribution data associated with the first period and the second frequency distribution data associated with the second period are generated, and the first frequency distribution data and the second frequency are generated. To generate first image data including a first histogram associated with the first period and a second histogram associated with the second period based on the distribution data, and to generate the first image data. The magnitude of the difference between the first histogram and the second histogram included in the data is identified, and it is determined whether or not the magnitude of the identified difference is equal to or larger than a predetermined threshold value. By comparing the first image data with the second image data on the condition that the size of the data is determined to be equal to or larger than a predetermined threshold value, the business situation of the customer can be predicted. Including.
本発明によれば、特定の融資先の口座の動態データに基づく画像データを、蓄積された画像データあるいは機械学習された画像データに基づいて分析することにより、財務数値データを利用していた従来よりも早い段階で経営状況の大幅な変動、とりわけ、デフォルトの発生有無を予測することができるようになる。 According to the present invention, financial numerical data has been used by analyzing image data based on dynamic data of a specific lender's account based on accumulated image data or machine-learned image data. It will be possible to predict large fluctuations in business conditions, especially the occurrence of defaults, at an earlier stage.
本発明によれば、従来よりも早い段階で経営状況の見通しを予測することができるようになるため、融資先に対して経営改善のサポートを適時適切に行うことができるようになり、また、融資先のデフォルトにより融資回収が困難となる事態を未然に防ぐことができるようになる。 According to the present invention, since it becomes possible to predict the outlook of the business situation at an earlier stage than before, it becomes possible to provide the lender with timely and appropriate support for management improvement, and also. It will be possible to prevent the situation where it becomes difficult to collect the loan due to the default of the loan recipient.
本明細書において開示される実施形態の詳細な理解は、添付図面に関連して例示される以下の説明から得ることができる。 A detailed understanding of the embodiments disclosed herein can be obtained from the following description illustrated in connection with the accompanying drawings.
(全体構成)
以下、本発明の実施形態について詳細に説明する。図1は、本発明の実施形態に係る推計装置100を含むシステム全体の構成図である。推計装置100は、銀行システム110と相互に通信可能に接続される。推計装置100は、図1に示されるように、銀行システム110と異なるエンティティとして構成されることが可能であり、あるいは、銀行システム110の内部機能として構成されることが可能である。
(overall structure)
Hereinafter, embodiments of the present invention will be described in detail. FIG. 1 is a configuration diagram of the entire system including the
銀行システム110は、インターネットおよび専用線などの既知のネットワークを介して、1または複数の顧客端末120、1または複数のATM130、および1または複数の他行システム140と相互に通信可能に接続される。図1において、顧客端末120、ATM130、および他行システム140は、1つずつしか示されていないが、これらは複数存在し得る。
The
本明細書では、推計装置100を1つの装置として説明するが、推計装置100によって実行される様々な処理を複数の装置で分散して実行するように構成してもよい。
In the present specification, the
推計装置100は、複数の経営状況パターンに関連付けられる様々な融資先の口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに関連付けられるそれぞれの度数分布データを生成し、格納する。1つの融資先に関連付けられる口座が複数存在する場合、推計装置100は、それらを名寄せ処理して1つにまとめた上で度数分布データを生成することができる。
The
推計装置100は、生成された度数分布データを使用して、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む画像データを生成し、格納する。推計装置100は、生成された画像データを人工知能(AI)に機械学習させることもできる。
The
また、推計装置100は、経営状況の大幅な変動、とりわけ、デフォルトの発生有無を予測する対象の顧客の顧客口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに関連付けられるそれぞれの度数分布データを生成する。なお、当該顧客の顧客口座が複数存在する場合、推計装置100は、それらを名寄せ処理して1つにまとめた上で度数分布データを生成することができる。
In addition, the
推計装置100は、生成された度数分布データを使用して、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む画像データを生成する。推計装置100は、生成した画像データと、格納されている画像データとを比較し、予測する対象の顧客がどの経営状況パターン(成長、正常、デフォルト)に相当する可能性が高いかを予め定められた基準に従って判定する。また、推計装置100は、生成した画像データをAIに提供し、生成した画像データと機械学習させた画像データとをAIに比較させて、予測する対象の顧客がどの経営状況パターンに相当する可能性が高いかを判定させることができる。推計装置100は、これらの判定結果を出力することができる。
The
銀行システム110は、銀行における勘定系システムに相当し、顧客口座に対する処理、為替処理、ATM(Automated Teller's Machine:現金自動預け払い機)ネットワークや対外システムとの接続処理を制御する。銀行システム110は、顧客端末120からのアクセスに応答して、指定された顧客口座の入出金明細を提供し、また、顧客端末120からの資金移動(振込、振替)指示に基づいて対応する顧客口座からの資金移動を実行する。銀行システム110は、ATM130からのアクセスに応答して、指定された顧客口座の残高情報を提供し、また、ATM130からの資金移動指示に基づいて対応する顧客口座からの資金移動を実行する。銀行システム110は、顧客からの振込依頼に基づいて他行システム140に振込依頼電文を送信し、また、他行システム140から顧客口座宛の振込依頼電文を受信する。銀行システム110は、顧客端末120、ATM130および他行システム140からの指示に基づいて顧客口座に対する入出金処理を行い、入出金明細データを生成し、格納する。
The
顧客端末120は、銀行システム110にアクセス可能な、顧客によって操作されるコンピュータである。顧客端末120は、例えば、パーソナルコンピュータ(PC)、スマートフォン、タブレット型端末などの通信機能を備えたコンピュータとすることができるが、特定の装置に限定されることはない。顧客端末120は、銀行システム110にアクセスし、指定した顧客口座の入出金明細データを受信し、また、顧客口座から指定した口座への資金移動指示を銀行システム110に送信することができる。
The
ATM130は、顧客の操作に応答して、指定された顧客口座の残高を銀行システム110から受信して表示することができ、あるいは、顧客によって入力された情報に基づいて生成した資金移動指示を銀行システム110に送信することができる。
The
他行システム140は、他の金融機関が運用する銀行システムであり、勘定系システムを備える。他行システム140は、銀行システム110から振込依頼電文を受信し、指定された宛先口座に対する入金処理を行い、また、指定された口座から出金処理を行うとともに振込依頼電文を生成し、銀行システム110に送信する。
The
(システム構成)
図2は、本発明の実施形態に係る推計装置100のシステム構成図である。図2に示すように、推計装置100は、一般的なコンピュータと同様に、バス210などによって相互に接続された制御部201、主記憶部202、補助記憶部203、インターフェース(IF)部204および出力部205を備える。また、推計装置100は、ファイル/データベースなどの形式で、顧客マスタ206、入出金明細207、学習数値データ208、および学習画像データ209を備える。なお、推計装置100および銀行システム110が異なるエンティティである場合、顧客マスタ206および入出金明細207は、銀行システム110から受信され、同期処理されてよい。
(System configuration)
FIG. 2 is a system configuration diagram of the
制御部201は、中央処理装置(CPU)とも呼ばれ、推計装置100の各構成要素の制御やデータの演算を行い、また、補助記憶部203に格納されている各種プログラムを主記憶部202に読み出して実行する。主記憶部202は、メインメモリとも呼ばれ、受信した各種データ、コンピュータ実行可能な命令および当該命令による演算処理後のデータなどを記憶する。補助記憶部203は、ハードディスク(HDD)などに代表される記憶装置であり、データやプログラムを長期的に保存する際に使用される。
The
図2の実施形態は、制御部201、主記憶部202および補助記憶部203を同一のコンピュータの内部に設ける実施形態について説明するが、他の実施形態として、推計装置100は、制御部201、主記憶部202および補助記憶部203を複数個使用することにより、複数のコンピュータによる並列分散処理を実現するように構成することもできる。また、他の実施形態として、推計装置100のための複数のサーバを設置し、複数サーバが一つの補助記憶部203を共有する実施形態にすることも可能である。
The embodiment of FIG. 2 describes an embodiment in which the
IF部204は、他のシステムや装置との間でデータを送受信する際のインターフェースの役割を果たし、また、システムオペレータから各種コマンドや入力データ(各種マスタ、テーブルなど)を受け付けるインターフェースを提供する。出力部205は、処理されたデータを表示する表示画面や当該データを印刷するための印刷手段などを提供する。
The
顧客マスタ206は、顧客情報を格納するマスタファイルである。図3は、本発明の実施形態に係る顧客マスタ206のデータ構造の一例を示す図である。顧客マスタ206は、顧客ID301、顧客情報302、顧客口座識別情報303、業種304、およびステータス305を含むことができるが、これらのデータ項目に限定されることはなく他のデータ項目も含むことが可能である。
The
顧客ID301は、顧客を識別する識別子である。顧客情報302は、顧客名称、住所、連絡先などの顧客情報を示す。顧客口座識別情報303は、顧客が開設している1または複数の口座を識別する情報を示す。顧客は、その経営形態によって、顧客口座を1つだけ開設している場合や、異なる本支店に複数の口座を開設している場合もある。顧客開設口座が複数存在する場合、推計装置100は、複数の口座を名寄せ処理した上で、名寄せ後の口座データを使用することができる。
The
業種304は、顧客に関連付けられる業種を示す。業種は、経済産業省によって定められた分類に従ったものでもよいし、あるいは業界団体などで任意に定めた分類に従ったものでもよく、特に限定されることはない。ステータス305は、金融機関によって予め定められた基準に従って判定された、顧客の経営状況(例えば、成長、正常、デフォルトなど)を示す。
図2に戻って説明すると、入出金明細207は、顧客口座に対する入出金明細データを格納する。図4は、本発明の実施形態に係る入出金明細207のデータ構造の一例を示す図である。入出金明細207は、口座識別子401、取引年月日402、入出金区分403、金額404、残高405、および摘要406を含むことができるが、これらのデータ項目に限定されることはなく他のデータ項目も含むことが可能である。
Returning to FIG. 2, the deposit /
口座識別子401は、顧客口座を識別する識別子であり、例えば、銀行コード、支店コード、預金種目、口座番号などに基づく識別子である。取引年月日402は、入金取引または出金取引が行われた年月日を示す。入出金区分403は、行われた取引が入金取引であるのか、または出金取引であるのかを示す。金額404は、取引金額を示す。残高405は、入金取引または出金取引後の顧客口座の残高情報を示す。摘要406は、入金取引または出金取引に対する説明(例えば、振込、被振込など)を示す。
The account identifier 401 is an identifier that identifies a customer account, and is, for example, an identifier based on a bank code, a branch code, a deposit type, an account number, or the like. The
図2に戻って説明すると、学習数値データ208は、推計装置100によって生成された度数分布データを格納する。度数分布データは、複数の経営状況パターンに関連付けられる様々な融資先の口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに基づいて生成される。第1の期間と第2の期間の長さは、同一であってもよいし、異なっていてもよい。例えば、既にデフォルトしてしまった企業について言えば、業績が悪化している期間(第2の期間)が相当程度短い場合もある。
Returning to FIG. 2, the learning
図5は、本発明の実施形態に係る学習数値データ208のデータ構造の一例を示す図である。学習数値データ208は、業種501、経営状況パターン502、変数503、期間504、階級505、および度数506を含むことができるが、これらのデータ項目に限定されることはなく他のデータ項目も含むことが可能である。
FIG. 5 is a diagram showing an example of the data structure of the learning
業種501は、融資先の業種を示す。業種501によって示される分類は、業種304によって示される分類と同一である。経営状況パターン502は、融資先の経営状況(例えば、成長、正常、デフォルト)を示す。変数503は、入出金明細データに含まれる変数を示す。変数は、例えば、残高、入金額、出金額、取引件数、振込件数および金額、被振込件数および金額などであってよい。期間504は、度数分布データがどの期間の度数分布データであるのかを示す。例えば、期間504は、第1の期間、第2の期間を示し、第1の期間、第2の期間はそれぞれ、具体的な期間(From To)を示してもよい。階級505は、度数分布データを生成する際のデータ区分を示す。度数506は、それぞれの階級に属する値の数を示す。
図2に戻って説明すると、学習画像データ209は、学習数値データ208に格納されている度数分布データを使用して生成されたヒストグラム(度数分布図)を含む画像データを格納する。図6は、本発明の実施形態に係る学習画像データ209のデータ構造の一例を示す図である。学習画像データ209は、業種501、経営状況パターン502、変数503、画像データ601および差分情報602を含むことができるが、これらのデータ項目に限定されることはなく他のデータ項目も含むことが可能である。
Returning to FIG. 2, the
業種501、経営状況パターン502、および変数503は、図5を参照しながら説明した通りなので、詳細な説明は省略する。画像データ601は、業種501、経営状況パターン502、および変数503に関連付けられる期間504によって示されるそれぞれの期間の階級505および度数506のデータに基づいて生成されたヒストグラムを含む画像データを示す。例えば、デフォルトした融資先について、期間504によって第1の期間(正常期間)および第2の期間(悪化期間)が示されている場合、画像データには、第1の期間に関連付けられるヒストグラムおよび第2の期間に関連付けられるヒストグラムが含まれる。差分情報602は、第1のヒストグラムおよび第2のヒストグラムを比較した結果である、各階級について算出された差分値の情報を示す。
Since the
(処理フロー:画像データ生成処理および機械学習処理)
図7は、推計装置100によって実行される画像データ生成処理および機械学習処理を説明する図である。本処理フローを参照しながら、推計装置100が、複数の経営状況パターンに関連付けられる様々な融資先の口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに関連づけられるそれぞれの度数分布データを生成し、生成されたそれぞれの度数分布データを使用して、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む画像データを生成する処理を説明する。また、本処理フローを参照しながら、推計装置100が、生成された画像データを機械学習する処理を説明する。
(Processing flow: image data generation processing and machine learning processing)
FIG. 7 is a diagram illustrating an image data generation process and a machine learning process executed by the
S701にて、推計装置100は、処理対象として指定された業種およびステータスの情報を受信する。業種およびステータスの指定は、推計装置100に接続されたオペレータ端末(不図示)から行われてもよい。推計装置100は、顧客マスタ206にアクセスし、受信した業種およびステータスの情報に関連付けられる顧客口座識別情報303の情報を読み出し、処理対象の顧客口座を識別する。
In S701, the
S702にて、推計装置100は、入出金明細207にアクセスし、処理対象として識別された顧客口座に関連付けられる入出金明細データを読み出す。
In S702, the
S703にて、推計装置100は、読み出された入出金明細データに含まれる変数(例えば、残高)ごとに、予め定められた第1の期間および第2の期間の入出金明細データに基づくそれぞれの度数分布データを生成する。第1の期間および第2の期間は、金融機関よって予め定められていて良く、第1の期間および第2の期間は、同じ長さの期間であっても異なる長さの期間であってもよい。例えば、デフォルト(債務不履行)となってしまった企業に関しては、経営状況が悪化する前の正常期間の1年間を第1の期間とし、経営状況が悪化し始めてデフォルトとなってしまうまでの悪化期間(Nヶ月:Nは自然数)を第2の期間としてよい。推計装置100は、生成した度数分布データを学習数値データ208に格納する。度数分布データの階級505の値は、任意に定められてよい。
In S703, the
S704にて、推計装置100は、学習数値データ208に格納されているそれぞれの度数分布データを読み出し、業種501、経営状況パターン502および変数503ごとにヒストグラムを含む画像データを生成する。画像データは、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む。また、推計装置100は、第1のヒストグラムおよび第2のヒストグラムを比較し、各階級についての差分値を算出する。生成された画像データおよび各階級についての差分値は、業種501、経営状況パターン502および変数503に関連付けられて、推計装置100によって学習画像データ209の画像データ601および差分情報602にそれぞれ格納される。
In S704, the
ここで、図9を参照しながら、S703およびS704の処理を説明する。図9(a)〜(c)は、第1のヒストグラムおよび第2のヒストグラムを含む画像データを生成する過程を例示する図である。図9(a)に示すように、推計装置100は、第1の期間(例えば、正常期間)および第2の期間(例えば、悪化期間)における、ある変数の時系列変動の値から第1の度数分布データおよび第2の度数分布データを生成する。推計装置100は、第1の度数分布データおよび第2の度数分布データに基づいて第1の期間の第1のヒストグラムおよび第2の期間の第2のヒストグラムを生成する。推計装置100は、第1のヒストグラムおよび第2のヒストグラムを図9(b)に例示するように重ね合わせるとともに、各階級についての差分値を算出する。図9(c)に示すように、推計装置100は、第1のヒストグラムおよび第2のヒストグラムを含む画像データを生成する。生成された画像データおよび算出された差分値は、上述したように、学習画像データ209に格納される。
Here, the processes of S703 and S704 will be described with reference to FIG. 9 (a) to 9 (c) are diagrams illustrating a process of generating image data including a first histogram and a second histogram. As shown in FIG. 9A, the
S705にて、推計装置100は、学習画像データ209に格納されている画像データおよび差分情報を人工知能(AI)に機械学習させることができる。推計装置100は、様々な機械学習の手法を利用することができる。例えば、推計装置100は、機械学習の一手法であるディープラーニング(深層学習)を利用することもでき、その深層学習モデルの中でも、畳み込みニューラルネットワーク(CNN)を用いることもできる。
In S705, the
(処理フロー:予測処理)
図8は、推計装置100によって実行される予測処理を説明する図である。本処理フローを参照しながら、推計装置100が、分析対象となる顧客の顧客口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに基づいて生成されたそれぞれの度数分布データを使用して複数のヒストグラムを含む画像データを生成し、生成された画像データと、学習画像データ209に格納されている画像データとを比較することによって、分析対象の顧客がどの経営状況パターンに相当する可能性が高いかを判定する処理を説明する。また、本処理フローでは、AIによって、画像データ同士の比較処理や分析対象の顧客がどの経営状況パターンに相当する可能性が高いかの判定処理が行われてもよい。
(Processing flow: Prediction processing)
FIG. 8 is a diagram illustrating a prediction process executed by the
S801にて、推計装置100は、分析対象として指定された顧客の顧客ID301を受信する。顧客ID301の指定は、推計装置100に接続されたオペレータ端末(不図示)から行われてもよい。推計装置100は、顧客マスタ206にアクセスし、分析対象として指定された顧客の顧客ID301に関連付けられる顧客口座識別情報303に基づいて分析対象の顧客口座を識別する。推計装置100は、顧客ID301に関連付けられる業種304の情報も取得する。
In S801, the
S802にて、推計装置100は、入出金明細207にアクセスし、分析対象として識別された顧客口座に関連付けられる入出金明細データを読み出す。
In S802, the
S803にて、推計装置100は、読み出された入出金明細データに含まれる変数(例えば、残高)ごとに、予め定められた第1の期間および第2の期間の入出金明細データに基づく度数分布データを生成する。第1の期間および第2の期間は、図7を参照しながら説明した第1の期間および第2の期間と同一である。生成された度数分布データは、第1の期間に関連付けられる第1の度数分布データおよび第2の期間に関連付けられる第2の度数分布データを含む。
In S803, the
S804にて、推計装置100は、S803にて生成された第1の度数分布データおよび第2の度数分布データに基づいて、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む画像データを生成する。生成される画像データは、図9(c)に例示されるような画像データであってよい。また、推計装置100は、生成された画像データに含まれる第1のヒストグラムおよび第2のヒストグラムを比較し、各階級についての差分値を算出する。
In S804, the
S805にて、推計装置100は、S804にて生成された、分析対象の顧客に関連付けられる画像データに含まれる第1のヒストグラムおよび第2のヒストグラムの差分の大きさを識別する。この識別処理は、画像ベースで行われてもよく、あるいは当該画像データについて算出された各階級の差分値に基づいて行われてもよい。推計装置100は、識別された差分の大きさが予め定められた閾値以上であるかどうかを判定する。閾値は、顧客の業種などによって変動してよい。差分の大きさが予め定められた閾値以上である場合(すなわち、第1の期間と第2の期間とで経営状況の目立った変化が発生している場合)、S806に処理が進み、閾値未満である場合(すなわち、第1の期間と第2の期間に目立った経営状況の変化は発生していない場合)、本処理フローは終了となる。
In S805, the
S806にて、推計装置100は、S804にて生成された、分析対象の顧客に関連付けられる画像データと、学習画像データ209に格納されている対応する業種501および変数503(例えば、残高)に関連付けられる1または複数の画像データとを比較する。学習画像データ209は、対応する業種501および変数503に関連付けられる複数の経営状況パターン502(例えば、成長、正常、デフォルト)の画像データを有する。この比較処理により、推計装置100は、分析対象の顧客に関連付けられる画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンが、学習画像データ209に格納されているどの画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンと類似度が高いかを判定し、分析対象の顧客の経営状況を予測することができる。すなわち、類似度が高いと判定された画像データに関連付けられる経営状況パターンによって、推計装置100は、分析対象の顧客が、成長段階にあるのか、正常段階にあるのか、あるいはデフォルトに向かいつつある段階にあるのかを予測することができる。なお、類似度が高いかどうかを判定する基準は、融資元企業によって任意に定めることができ、その基準は、融資先の業種ごとに定めることが可能である。
In S806, the
本発明の実施形態では、推計装置100は、S804にて生成された、分析対象の顧客に関連付けられる画像データについて算出された各階級についての差分値と、学習画像データ209に格納されている対応する業種501および変数503(例えば、残高)に関連付けられる1または複数の画像データの差分情報602に含まれる各階級についての差分値とを比較する。この比較処理により、推計装置100は、分析対象の顧客に関連付けられる画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンが、学習画像データ209に格納されているどの画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンと類似度が高いかを判定し、分析対象の顧客の経営状況を予測することができる。
In the embodiment of the present invention, the
本発明の実施形態では、推計装置100は、S804にて生成された、分析対象の顧客に関連付けられる画像データを人工知能(AI)に提供し、予め機械学習された画像データとの比較をAIに実行させ、分析対象の顧客に関連付けられる画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンが、機械学習された画像データのうちどの画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンと類似度が高いかを判定させることによって、分析対象の顧客の経営状況を予測することができる。すなわち、推計装置100は、分析対象の顧客の経営状況を、AIによって類似度が高いと判定された画像データに関連付けられる経営状況パターン(例えば、成長、正常、デフォルト)に相当する可能性が高いと判定することができる。また、推計装置100は、AIに比較を実行させる際、S804にて算出された各階級についての差分値をAIにさらに提供することもでき、かかる場合、AIは、画像データと差分値との両方に基づいて類似度を判定することができる。
In the embodiment of the present invention, the
本発明の実施形態では、推計装置100は、S803にて生成された度数分布データのうち、第1の期間に関連付けられる第1の度数分布データと第2の期間に関連付けられる第2の度数分布データとを比較することによって分析対象の顧客が成長段階にあるのか、あるいは衰退段階にあるのかを推測することができる。より詳細に言えば、推計装置100は、第2の度数分布データに基づいて算出された第2の平均値を、第1の度数分布データに基づいて算出された第1の平均値で除し、1よりも大きい値が得られた場合に成長段階にあると判定し、1よりも小さい値が得られた場合に衰退段階にあると判定することができる。なお、平均値としては採用するのは、第1の期間および第2の期間のそれぞれの変数(例えば、残高、入金額、出金額など)の実データであってもよい。
In the embodiment of the present invention, the
上述したような処理によって、推計装置100は、特定の融資先の口座の動態データに基づく画像データを、蓄積された画像データあるいは機械学習された画像データに基づいて分析することにより、財務数値データを利用していた従来よりも早い段階で経営状況の大幅な変動、とりわけ、デフォルトの発生有無を予測することができるようになる。
By the processing as described above, the
以上、例示的な実施形態を参照しながら本発明の原理を説明したが、本発明の要旨を逸脱することなく、構成および細部において変更する様々な実施形態を実現可能であることを当業者は理解するだろう。すなわち、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能である。 Although the principles of the present invention have been described above with reference to exemplary embodiments, those skilled in the art will appreciate that various embodiments that change in configuration and details can be realized without departing from the gist of the present invention. You will understand. That is, the present invention can be implemented as, for example, a system, an apparatus, a method, a program, a storage medium, or the like.
100 推計装置
110 銀行システム
120 顧客端末
130 ATM
140 他行システム
201 制御部
202 主記憶部
203 補助記憶部
204 インターフェース(IF)部
205 出力部
206 顧客マスタ
207 入出金明細
208 学習数値データ
209 学習画像データ
210 バス
100
140
Claims (11)
分析対象として指定された顧客に関連付けられる入出金明細データを読み出し、
読み出された入出金明細データに含まれる変数に対して、第1の期間に関連付けられる第1の度数分布データおよび第2の期間に関連付けられる第2の度数分布データを生成し、
前記第1の度数分布データおよび前記第2の度数分布データに基づいて、前記第1の期間に関連付けられる第1のヒストグラムおよび前記第2の期間に関連付けられる第2のヒストグラムを含む第1の画像データを生成し、
前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムの差分の大きさを識別し、識別された前記差分の大きさが予め定められた閾値以上であるかどうかを判定し、
前記差分の大きさが予め定められた閾値以上であると判定されたという条件で、前記第1の画像データと、第2の画像データとを比較し、前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムの差分のパターンが、前記第2の画像データのうちのどの画像データによって示される前記差分のパターンと類似度が高いかを予め定められた基準に基づいて判定し、前記類似度が高いと判定された前記第2の画像データに関連付けられる経営状況パターンに従って、前記分析対象として指定された顧客が成長段階にあるのか、正常段階にあるのか、あるいはデフォルトに向かいつつある段階にあるのかを判定することにより、前記顧客の経営状況を予測する
ように構成された推計装置。 It ’s an estimation device,
Read the deposit / withdrawal detail data associated with the customer specified for analysis,
For the variables included in the read deposit / withdrawal detail data, the first frequency distribution data associated with the first period and the second frequency distribution data associated with the second period are generated.
A first image containing a first histogram associated with the first period and a second histogram associated with the second period, based on the first frequency distribution data and the second frequency distribution data. Generate data and
The magnitude of the difference between the first histogram and the second histogram included in the first image data is identified, and it is determined whether or not the magnitude of the identified difference is equal to or greater than a predetermined threshold value. And
The first image data and the second image data are compared on the condition that the magnitude of the difference is determined to be equal to or larger than a predetermined threshold value, and the first image data is included in the first image data. Based on a predetermined criterion, which image data of the second image data has a high degree of similarity to the difference pattern between the first histogram and the second histogram. According to the business condition pattern associated with the second image data determined to have a high degree of similarity, the customer designated as the analysis target is in the growth stage, the normal stage, or the default. An estimation device configured to predict the business situation of the customer by determining whether it is in the oncoming stage .
分析対象として指定された顧客に関連付けられる入出金明細データを読み出すことと、
読み出された入出金明細データに含まれる変数に対して、第1の期間に関連付けられる第1の度数分布データおよび第2の期間に関連付けられる第2の度数分布データを生成することと、
前記第1の度数分布データおよび前記第2の度数分布データに基づいて、前記第1の期間に関連付けられる第1のヒストグラムおよび前記第2の期間に関連付けられる第2のヒストグラムを含む第1の画像データを生成することと、
前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムの差分の大きさを識別し、識別された前記差分の大きさが予め定められた閾値以上であるかどうかを判定することと、
前記差分の大きさが予め定められた閾値以上であると判定されたという条件で、前記第1の画像データと、第2の画像データとを比較し、前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムの差分のパターンが、前記第2の画像データのうちのどの画像データによって示される前記差分のパターンと類似度が高いかを予め定められた基準に基づいて判定し、前記類似度が高いと判定された前記第2の画像データに関連付けられる経営状況パターンに従って、前記分析対象として指定された顧客が成長段階にあるのか、正常段階にあるのか、あるいはデフォルトに向かいつつある段階にあるのかを判定することにより、前記顧客の経営状況を予測することと
を備える、推計方法。 An estimation method performed by an estimation device,
Reading the deposit / withdrawal detail data associated with the customer specified for analysis, and
To generate the first frequency distribution data associated with the first period and the second frequency distribution data associated with the second period for the variables included in the read deposit / withdrawal detail data.
A first image containing a first histogram associated with the first period and a second histogram associated with the second period, based on the first frequency distribution data and the second frequency distribution data. To generate data and
The magnitude of the difference between the first histogram and the second histogram included in the first image data is identified, and it is determined whether or not the magnitude of the identified difference is equal to or greater than a predetermined threshold value. To do and
The first image data and the second image data are compared on the condition that the magnitude of the difference is determined to be equal to or larger than a predetermined threshold value, and the first image data is included in the first image data. Based on a predetermined criterion, which image data of the second image data has a high degree of similarity to the difference pattern between the first histogram and the second histogram. According to the business condition pattern associated with the second image data determined to have a high degree of similarity, the customer designated as the analysis target is in the growth stage, the normal stage, or the default. An estimation method that includes predicting the business situation of the customer by determining whether or not the customer is in the on-going stage .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019047190A JP6797956B2 (en) | 2019-03-14 | 2019-03-14 | Estimator, estimation method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019047190A JP6797956B2 (en) | 2019-03-14 | 2019-03-14 | Estimator, estimation method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020149443A JP2020149443A (en) | 2020-09-17 |
JP6797956B2 true JP6797956B2 (en) | 2020-12-09 |
Family
ID=72432051
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019047190A Active JP6797956B2 (en) | 2019-03-14 | 2019-03-14 | Estimator, estimation method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6797956B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7194077B2 (en) * | 2019-06-03 | 2022-12-21 | 株式会社日立製作所 | Management analysis support system and management analysis support method |
JP7386465B1 (en) | 2023-07-04 | 2023-11-27 | ゼネリックソリューション株式会社 | Examination support device, examination support method, and examination support program |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4343140B2 (en) * | 2005-05-10 | 2009-10-14 | 株式会社エヌ・ティ・ティ・データ | Evaluation apparatus and computer program therefor |
JP5867349B2 (en) * | 2011-09-21 | 2016-02-24 | 新日鐵住金株式会社 | Quality prediction apparatus, operation condition determination method, quality prediction method, computer program, and computer-readable storage medium |
JP6009864B2 (en) * | 2011-09-21 | 2016-10-19 | 典秀 野田 | Company evaluation system, company evaluation method and company evaluation program |
JP6053166B2 (en) * | 2013-07-31 | 2016-12-27 | Kddi株式会社 | Numerical data analysis apparatus and program |
JP6347022B1 (en) * | 2018-02-28 | 2018-06-20 | 毅 葉山 | Machine learning apparatus, prediction system, and program |
-
2019
- 2019-03-14 JP JP2019047190A patent/JP6797956B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020149443A (en) | 2020-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108876133B (en) | Risk assessment processing method, device, server and medium based on business information | |
CN110111113B (en) | Abnormal transaction node detection method and device | |
CA3060678A1 (en) | Systems and methods for determining credit worthiness of a borrower | |
US20230099864A1 (en) | User profiling based on transaction data associated with a user | |
CN111008896A (en) | Financial risk early warning method and device, electronic equipment and storage medium | |
US20150262184A1 (en) | Two stage risk model building and evaluation | |
US20220351207A1 (en) | System and method for optimization of fraud detection model | |
JP6797956B2 (en) | Estimator, estimation method and program | |
CN108038692B (en) | Role identification method and device and server | |
CN115545886A (en) | Overdue risk identification method, overdue risk identification device, overdue risk identification equipment and storage medium | |
CN111563187A (en) | Relationship determination method, device and system and electronic equipment | |
CN112329862A (en) | Decision tree-based anti-money laundering method and system | |
WO2023177781A1 (en) | Analyzing a transaction in a payment processing system | |
TWI792101B (en) | Data Quantification Method Based on Confirmed Value and Predicted Value | |
US20220207420A1 (en) | Utilizing machine learning models to characterize a relationship between a user and an entity | |
KR102244705B1 (en) | Method for controlling worker inflow into project by reversal adjustment of work unit price between crowdsourcing based similar projects for training data generation | |
CN113052512A (en) | Risk prediction method and device and electronic equipment | |
CN113689020A (en) | Service information prediction method, device, computer equipment and storage medium | |
CN111861493A (en) | Information processing method, information processing device, electronic equipment and storage medium | |
CN113515383B (en) | System resource data distribution method and device | |
CN112116357B (en) | Method and device for realizing cashing detection and computer equipment | |
US20230195056A1 (en) | Automatic Control Group Generation | |
CA3116479A1 (en) | System and method for optimization of fraud detection model | |
CN115187386A (en) | Online credit card risk information detection method and device | |
CN117541885A (en) | Sample data processing method, device, storage medium and system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200526 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200706 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6797956 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |