JP6797956B2 - Estimator, estimation method and program - Google Patents

Estimator, estimation method and program Download PDF

Info

Publication number
JP6797956B2
JP6797956B2 JP2019047190A JP2019047190A JP6797956B2 JP 6797956 B2 JP6797956 B2 JP 6797956B2 JP 2019047190 A JP2019047190 A JP 2019047190A JP 2019047190 A JP2019047190 A JP 2019047190A JP 6797956 B2 JP6797956 B2 JP 6797956B2
Authority
JP
Japan
Prior art keywords
image data
histogram
data
customer
period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019047190A
Other languages
Japanese (ja)
Other versions
JP2020149443A (en
Inventor
良太郎 土屋
良太郎 土屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Mitsui Banking Corp
Original Assignee
Sumitomo Mitsui Banking Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Mitsui Banking Corp filed Critical Sumitomo Mitsui Banking Corp
Priority to JP2019047190A priority Critical patent/JP6797956B2/en
Publication of JP2020149443A publication Critical patent/JP2020149443A/en
Application granted granted Critical
Publication of JP6797956B2 publication Critical patent/JP6797956B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、推計装置、推計方法およびプログラムに関する。より詳細に言えば、本発明は、複数の経営状況パターンに関連付けられる様々な融資先の口座の動態データに基づいて生成された画像データを蓄積あるいは機械学習し、特定の融資先の口座の動態データに基づく画像データを、蓄積されたあるいは機械学習された画像データに基づいて分析することにより、経営状況の大幅な変動、とりわけ、デフォルト(債務不履行)の発生有無を予測する推計装置、推計方法およびプログラムに関する。 The present invention relates to an estimation device, an estimation method and a program. More specifically, the present invention accumulates or machine-learns image data generated based on the dynamic data of the accounts of various lenders associated with a plurality of business situation patterns, and the dynamics of the account of a specific lender. By analyzing image data based on data based on accumulated or machine-learned image data, an estimation device and estimation method for predicting the occurrence of large fluctuations in business conditions, especially default (default). And about the program.

従来から、融資先の信用状態を定期的にモニタリングすることが行われている。銀行は、融資先から提供される決算書類などから財務数値データを取得したり、法人担当者が企業経営者などから定期的にヒアリングを行ったりすることによって、融資先の経営状況に変化が生じていないかどうかを判断している。 Traditionally, the credit status of lenders has been regularly monitored. Banks change the management situation of lenders by acquiring financial numerical data from financial statements provided by lenders and by having corporate managers regularly conduct hearings with corporate managers. I'm judging if it's not.

このような判断を人手に頼るだけでなく、コンピュータを利用して行う試みも行われている。例えば、融資先事業者の財務状況に関するデータに基づいて、事業者の信用度を算出する装置が知られていた(特許文献1)。 Attempts have been made not only to make such judgments manually, but also to use computers. For example, a device for calculating the creditworthiness of a lender based on data on the financial status of the lender has been known (Patent Document 1).

近年、様々な分野で人工知能(AI)を利用した機械学習の手法が利用されるようになってきている。AIを支える手法の一つである、ディープラーニング(深層学習)と呼ばれるニューラルネットワークを進化させた技術を画像分類に適用することも行われるようになってきている。深層学習モデルの中でも、畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)は、画像や動画認識に広く使用されるモデルであることが知られている。 In recent years, machine learning methods using artificial intelligence (AI) have come to be used in various fields. It is also becoming common to apply a technique called deep learning, which is one of the methods supporting AI, which is an evolution of a neural network, to image classification. Among the deep learning models, the convolutional neural network (CNN) is known to be a model widely used for image and moving image recognition.

特開2017−016652号公報JP-A-2017-016652

融資先の信用状態のモニタリングで利用される財務数値データは、決算書類が作成されるタイミングである、年1回あるいは半年に1回などの期間ごとにしか取得できないものであった。また、企業規模によっては、決算月から相当程度経過してから決算書類が融資元企業に提出されることもあった。 The financial numerical data used for monitoring the credit status of the lender could only be obtained once a year or once every six months, which is the timing when the financial statements are prepared. In addition, depending on the size of the company, financial statements may be submitted to the lender company after a considerable amount of time has passed since the closing month.

企業の経営状況は、外部要因および内部要因により目まぐるしく変化するため、その企業の信用状態も短い期間で変化することも多い。外部要因および/または内部要因次第では、企業の信用状態は相当程度短い期間で変化してしまい、場合によっては、デフォルト(債務不履行)状態となってしまうこともあった。 Since the business condition of a company changes rapidly due to external and internal factors, the credit status of the company often changes in a short period of time. Depending on external and / or internal factors, a company's credit status may change in a fairly short period of time, and in some cases may become a default (default) condition.

融資先の信用状態を財務数値データに基づいて評価する場合、実際の経営状況の変化の早さから、融資元企業は、評価を適時適切に行うことができない場合もあった。かかる場合、融資元企業は、融資先に対して経営改善のサポートを適切に行うことができず、融資先のデフォルトにより融資回収が困難となる事態を招くこともあった。 When evaluating the credit status of a lender based on numerical financial data, the lender company may not be able to perform the evaluation in a timely and appropriate manner due to the rapid changes in the actual business conditions. In such a case, the lender company could not properly support the lender for management improvement, and the default of the lender may make it difficult to collect the loan.

本発明は、このような課題を解決するためになされたものであり、複数の経営状況パターンに関連付けられる様々な融資先の口座の動態データに基づいて生成された画像データを蓄積あるいは機械学習し、特定の融資先の口座の動態データに基づく画像データを、蓄積された画像データあるいは機械学習された画像データに基づいて分析することにより、経営状況の大幅な変動、とりわけ、デフォルトの発生有無を予測する推計装置、推計方法およびプログラムを提供することを目的とする。 The present invention has been made to solve such a problem, and accumulates or machine-learns image data generated based on dynamic data of accounts of various lenders associated with a plurality of business situation patterns. By analyzing image data based on the dynamic data of the account of a specific lender based on accumulated image data or machine-learned image data, it is possible to detect significant changes in business conditions, especially whether or not defaults occur. It is an object of the present invention to provide an estimation device, an estimation method and a program for predicting.

本発明の一態様である推計装置は、分析対象として指定された顧客に関連付けられる入出金明細データを読み出し、読み出された入出金明細データに含まれる変数に対して、第1の期間に関連付けられる第1の度数分布データおよび第2の期間に関連付けられる第2の度数分布データを生成し、前記第1の度数分布データおよび前記第2の度数分布データに基づいて、前記第1の期間に関連付けられる第1のヒストグラムおよび前記第2の期間に関連付けられる第2のヒストグラムを含む第1の画像データを生成し、前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムの差分の大きさを識別し、識別された前記差分の大きさが予め定められた閾値以上であるかどうかを判定し、前記差分の大きさが予め定められた閾値以上であると判定されたという条件で、前記第1の画像データと、第2の画像データとを比較することにより、前記顧客の経営状況を予測するように構成される。 The estimation device according to one aspect of the present invention reads the deposit / withdrawal detail data associated with the customer designated as the analysis target, and associates the variables included in the read deposit / withdrawal detail data with the first period. The first frequency distribution data and the second frequency distribution data associated with the second period are generated, and based on the first frequency distribution data and the second frequency distribution data, in the first period. The first image data including the associated first histogram and the second histogram associated with the second period is generated, and the first histogram and the second histogram included in the first image data are generated. The magnitude of the difference was identified, it was determined whether the magnitude of the identified difference was greater than or equal to a predetermined threshold, and it was determined that the magnitude of the difference was greater than or equal to the predetermined threshold. Under the condition that the first image data and the second image data are compared, the business situation of the customer is predicted.

本発明の別の一態様である推計装置によって実行される推計方法は、分析対象として指定された顧客に関連付けられる入出金明細データを読み出すことと、読み出された入出金明細データに含まれる変数に対して、第1の期間に関連付けられる第1の度数分布データおよび第2の期間に関連付けられる第2の度数分布データを生成することと、前記第1の度数分布データおよび前記第2の度数分布データに基づいて、前記第1の期間に関連付けられる第1のヒストグラムおよび前記第2の期間に関連付けられる第2のヒストグラムを含む第1の画像データを生成することと、前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムの差分の大きさを識別し、識別された前記差分の大きさが予め定められた閾値以上であるかどうかを判定することと、前記差分の大きさが予め定められた閾値以上であると判定されたという条件で、前記第1の画像データと、第2の画像データとを比較することにより、前記顧客の経営状況を予測することを含む。 The estimation method performed by the estimation device, which is another aspect of the present invention, reads the deposit / withdrawal detail data associated with the customer designated as the analysis target, and the variables included in the read deposit / withdrawal detail data. On the other hand, the first frequency distribution data associated with the first period and the second frequency distribution data associated with the second period are generated, and the first frequency distribution data and the second frequency are generated. To generate first image data including a first histogram associated with the first period and a second histogram associated with the second period based on the distribution data, and to generate the first image data. The magnitude of the difference between the first histogram and the second histogram included in the data is identified, and it is determined whether or not the magnitude of the identified difference is equal to or larger than a predetermined threshold value. By comparing the first image data with the second image data on the condition that the size of the data is determined to be equal to or larger than a predetermined threshold value, the business situation of the customer can be predicted. Including.

本発明によれば、特定の融資先の口座の動態データに基づく画像データを、蓄積された画像データあるいは機械学習された画像データに基づいて分析することにより、財務数値データを利用していた従来よりも早い段階で経営状況の大幅な変動、とりわけ、デフォルトの発生有無を予測することができるようになる。 According to the present invention, financial numerical data has been used by analyzing image data based on dynamic data of a specific lender's account based on accumulated image data or machine-learned image data. It will be possible to predict large fluctuations in business conditions, especially the occurrence of defaults, at an earlier stage.

本発明によれば、従来よりも早い段階で経営状況の見通しを予測することができるようになるため、融資先に対して経営改善のサポートを適時適切に行うことができるようになり、また、融資先のデフォルトにより融資回収が困難となる事態を未然に防ぐことができるようになる。 According to the present invention, since it becomes possible to predict the outlook of the business situation at an earlier stage than before, it becomes possible to provide the lender with timely and appropriate support for management improvement, and also. It will be possible to prevent the situation where it becomes difficult to collect the loan due to the default of the loan recipient.

本明細書において開示される実施形態の詳細な理解は、添付図面に関連して例示される以下の説明から得ることができる。 A detailed understanding of the embodiments disclosed herein can be obtained from the following description illustrated in connection with the accompanying drawings.

本発明の実施形態に係る推計装置を含むシステム全体の構成図である。It is a block diagram of the whole system including the estimation apparatus which concerns on embodiment of this invention. 本発明の実施形態に係る推計装置のシステム構成図である。It is a system block diagram of the estimation apparatus which concerns on embodiment of this invention. 本発明の実施形態に係る顧客マスタのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the customer master which concerns on embodiment of this invention. 本発明の実施形態に係る入出金明細のデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the deposit / withdrawal details which concerns on embodiment of this invention. 本発明の実施形態に係る学習数値データのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the learning numerical data which concerns on embodiment of this invention. 本発明の実施形態に係る学習画像データのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the learning image data which concerns on embodiment of this invention. 推計装置によって実行される画像データ生成処理および機械学習処理を説明する図である。It is a figure explaining the image data generation processing and machine learning processing executed by an estimation apparatus. 推計装置によって実行される予測処理を説明する図である。It is a figure explaining the prediction process executed by the estimation device. 第1のヒストグラムおよび第2のヒストグラムを含む画像データを生成する過程を例示する図である。It is a figure which illustrates the process of generating the image data which includes the 1st histogram and the 2nd histogram.

(全体構成)
以下、本発明の実施形態について詳細に説明する。図1は、本発明の実施形態に係る推計装置100を含むシステム全体の構成図である。推計装置100は、銀行システム110と相互に通信可能に接続される。推計装置100は、図1に示されるように、銀行システム110と異なるエンティティとして構成されることが可能であり、あるいは、銀行システム110の内部機能として構成されることが可能である。
(overall structure)
Hereinafter, embodiments of the present invention will be described in detail. FIG. 1 is a configuration diagram of the entire system including the estimation device 100 according to the embodiment of the present invention. The estimation device 100 is communicably connected to the banking system 110. As shown in FIG. 1, the estimation device 100 can be configured as an entity different from the banking system 110, or can be configured as an internal function of the banking system 110.

銀行システム110は、インターネットおよび専用線などの既知のネットワークを介して、1または複数の顧客端末120、1または複数のATM130、および1または複数の他行システム140と相互に通信可能に接続される。図1において、顧客端末120、ATM130、および他行システム140は、1つずつしか示されていないが、これらは複数存在し得る。 The banking system 110 is communicably connected to one or more customer terminals 120, one or more ATMs 130, and one or more other banking systems 140 via the Internet and known networks such as leased lines. .. In FIG. 1, only one customer terminal 120, one ATM 130, and one other bank system 140 are shown, but there may be a plurality of these.

本明細書では、推計装置100を1つの装置として説明するが、推計装置100によって実行される様々な処理を複数の装置で分散して実行するように構成してもよい。 In the present specification, the estimation device 100 is described as one device, but various processes executed by the estimation device 100 may be configured to be distributed and executed by a plurality of devices.

推計装置100は、複数の経営状況パターンに関連付けられる様々な融資先の口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに関連付けられるそれぞれの度数分布データを生成し、格納する。1つの融資先に関連付けられる口座が複数存在する場合、推計装置100は、それらを名寄せ処理して1つにまとめた上で度数分布データを生成することができる。 The estimation device 100 is associated with predetermined first period data and second period data for each of the variables included in the deposit / withdrawal statement data of various lender accounts associated with a plurality of business condition patterns. Generate and store each frequency distribution data. When there are a plurality of accounts associated with one lender, the estimation device 100 can generate frequency distribution data after performing name identification processing on them and collecting them into one.

推計装置100は、生成された度数分布データを使用して、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む画像データを生成し、格納する。推計装置100は、生成された画像データを人工知能(AI)に機械学習させることもできる。 The estimation device 100 uses the generated frequency distribution data to generate and store image data including a first histogram associated with the first period and a second histogram associated with the second period. The estimation device 100 can also make artificial intelligence (AI) machine-learn the generated image data.

また、推計装置100は、経営状況の大幅な変動、とりわけ、デフォルトの発生有無を予測する対象の顧客の顧客口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに関連付けられるそれぞれの度数分布データを生成する。なお、当該顧客の顧客口座が複数存在する場合、推計装置100は、それらを名寄せ処理して1つにまとめた上で度数分布データを生成することができる。 In addition, the estimation device 100 has a predetermined first period for each of the variables included in the deposit / withdrawal detail data of the customer account of the target customer for predicting the occurrence of a drastic change in the business situation, particularly the occurrence of default. And generate each frequency distribution data associated with the data in the second period. When a plurality of customer accounts of the customer exist, the estimation device 100 can generate frequency distribution data after performing name identification processing on them and collecting them into one.

推計装置100は、生成された度数分布データを使用して、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む画像データを生成する。推計装置100は、生成した画像データと、格納されている画像データとを比較し、予測する対象の顧客がどの経営状況パターン(成長、正常、デフォルト)に相当する可能性が高いかを予め定められた基準に従って判定する。また、推計装置100は、生成した画像データをAIに提供し、生成した画像データと機械学習させた画像データとをAIに比較させて、予測する対象の顧客がどの経営状況パターンに相当する可能性が高いかを判定させることができる。推計装置100は、これらの判定結果を出力することができる。 The estimation device 100 uses the generated frequency distribution data to generate image data including a first histogram associated with the first period and a second histogram associated with the second period. The estimation device 100 compares the generated image data with the stored image data, and determines in advance which business condition pattern (growth, normal, default) the customer to be predicted is likely to correspond to. Judgment is made according to the given criteria. Further, the estimation device 100 provides the generated image data to the AI, compares the generated image data with the machine-learned image data with the AI, and the customer to be predicted can correspond to which business situation pattern. It is possible to judge whether the property is high. The estimation device 100 can output these determination results.

銀行システム110は、銀行における勘定系システムに相当し、顧客口座に対する処理、為替処理、ATM(Automated Teller's Machine:現金自動預け払い機)ネットワークや対外システムとの接続処理を制御する。銀行システム110は、顧客端末120からのアクセスに応答して、指定された顧客口座の入出金明細を提供し、また、顧客端末120からの資金移動(振込、振替)指示に基づいて対応する顧客口座からの資金移動を実行する。銀行システム110は、ATM130からのアクセスに応答して、指定された顧客口座の残高情報を提供し、また、ATM130からの資金移動指示に基づいて対応する顧客口座からの資金移動を実行する。銀行システム110は、顧客からの振込依頼に基づいて他行システム140に振込依頼電文を送信し、また、他行システム140から顧客口座宛の振込依頼電文を受信する。銀行システム110は、顧客端末120、ATM130および他行システム140からの指示に基づいて顧客口座に対する入出金処理を行い、入出金明細データを生成し、格納する。 The banking system 110 corresponds to a core banking system in a bank, and controls processing for customer accounts, exchange processing, ATM (Automated Teller's Machine) network, and connection processing with an external system. The bank system 110 provides a deposit / withdrawal statement of a designated customer account in response to an access from the customer terminal 120, and also responds based on a fund transfer (transfer, transfer) instruction from the customer terminal 120. Perform a transfer of funds from your account. The banking system 110 provides the balance information of the designated customer account in response to the access from the ATM 130, and also executes the transfer of funds from the corresponding customer account based on the fund transfer instruction from the ATM 130. The bank system 110 transmits a transfer request message to the other bank system 140 based on the transfer request from the customer, and also receives the transfer request message addressed to the customer account from the other bank system 140. The bank system 110 performs deposit / withdrawal processing on the customer account based on instructions from the customer terminal 120, the ATM 130, and the other bank system 140, and generates and stores the deposit / withdrawal detail data.

顧客端末120は、銀行システム110にアクセス可能な、顧客によって操作されるコンピュータである。顧客端末120は、例えば、パーソナルコンピュータ(PC)、スマートフォン、タブレット型端末などの通信機能を備えたコンピュータとすることができるが、特定の装置に限定されることはない。顧客端末120は、銀行システム110にアクセスし、指定した顧客口座の入出金明細データを受信し、また、顧客口座から指定した口座への資金移動指示を銀行システム110に送信することができる。 The customer terminal 120 is a customer-operated computer that has access to the banking system 110. The customer terminal 120 can be, for example, a computer having a communication function such as a personal computer (PC), a smartphone, or a tablet terminal, but is not limited to a specific device. The customer terminal 120 can access the bank system 110, receive the deposit / withdrawal statement data of the designated customer account, and transmit the fund transfer instruction from the customer account to the designated account to the bank system 110.

ATM130は、顧客の操作に応答して、指定された顧客口座の残高を銀行システム110から受信して表示することができ、あるいは、顧客によって入力された情報に基づいて生成した資金移動指示を銀行システム110に送信することができる。 The ATM 130 can receive and display the balance of the specified customer account from the banking system 110 in response to the customer's operation, or can issue a fund transfer instruction generated based on the information input by the customer to the bank. It can be transmitted to the system 110.

他行システム140は、他の金融機関が運用する銀行システムであり、勘定系システムを備える。他行システム140は、銀行システム110から振込依頼電文を受信し、指定された宛先口座に対する入金処理を行い、また、指定された口座から出金処理を行うとともに振込依頼電文を生成し、銀行システム110に送信する。 The other bank system 140 is a banking system operated by another financial institution and includes a core banking system. The other bank system 140 receives a transfer request message from the bank system 110, performs a deposit process for the designated destination account, performs a withdrawal process from the designated account, and generates a transfer request message to generate a bank system. Send to 110.

(システム構成)
図2は、本発明の実施形態に係る推計装置100のシステム構成図である。図2に示すように、推計装置100は、一般的なコンピュータと同様に、バス210などによって相互に接続された制御部201、主記憶部202、補助記憶部203、インターフェース(IF)部204および出力部205を備える。また、推計装置100は、ファイル/データベースなどの形式で、顧客マスタ206、入出金明細207、学習数値データ208、および学習画像データ209を備える。なお、推計装置100および銀行システム110が異なるエンティティである場合、顧客マスタ206および入出金明細207は、銀行システム110から受信され、同期処理されてよい。
(System configuration)
FIG. 2 is a system configuration diagram of the estimation device 100 according to the embodiment of the present invention. As shown in FIG. 2, the estimation device 100 has a control unit 201, a main storage unit 202, an auxiliary storage unit 203, an interface (IF) unit 204, and the like, like a general computer. The output unit 205 is provided. Further, the estimation device 100 includes a customer master 206, a deposit / withdrawal detail 207, a learning numerical data 208, and a learning image data 209 in the form of a file / database or the like. When the estimation device 100 and the banking system 110 are different entities, the customer master 206 and the deposit / withdrawal statement 207 may be received from the banking system 110 and processed synchronously.

制御部201は、中央処理装置(CPU)とも呼ばれ、推計装置100の各構成要素の制御やデータの演算を行い、また、補助記憶部203に格納されている各種プログラムを主記憶部202に読み出して実行する。主記憶部202は、メインメモリとも呼ばれ、受信した各種データ、コンピュータ実行可能な命令および当該命令による演算処理後のデータなどを記憶する。補助記憶部203は、ハードディスク(HDD)などに代表される記憶装置であり、データやプログラムを長期的に保存する際に使用される。 The control unit 201, also called a central processing unit (CPU), controls each component of the estimation device 100 and calculates data, and also transmits various programs stored in the auxiliary storage unit 203 to the main storage unit 202. Read and execute. The main storage unit 202, also called a main memory, stores various received data, computer-executable instructions, and data after arithmetic processing by the instructions. The auxiliary storage unit 203 is a storage device typified by a hard disk (HDD) or the like, and is used when storing data or programs for a long period of time.

図2の実施形態は、制御部201、主記憶部202および補助記憶部203を同一のコンピュータの内部に設ける実施形態について説明するが、他の実施形態として、推計装置100は、制御部201、主記憶部202および補助記憶部203を複数個使用することにより、複数のコンピュータによる並列分散処理を実現するように構成することもできる。また、他の実施形態として、推計装置100のための複数のサーバを設置し、複数サーバが一つの補助記憶部203を共有する実施形態にすることも可能である。 The embodiment of FIG. 2 describes an embodiment in which the control unit 201, the main storage unit 202, and the auxiliary storage unit 203 are provided inside the same computer, but as another embodiment, the estimation device 100 uses the control unit 201, By using a plurality of main storage units 202 and auxiliary storage units 203, it is possible to configure parallel distributed processing by a plurality of computers. Further, as another embodiment, it is also possible to install a plurality of servers for the estimation device 100 so that the plurality of servers share one auxiliary storage unit 203.

IF部204は、他のシステムや装置との間でデータを送受信する際のインターフェースの役割を果たし、また、システムオペレータから各種コマンドや入力データ(各種マスタ、テーブルなど)を受け付けるインターフェースを提供する。出力部205は、処理されたデータを表示する表示画面や当該データを印刷するための印刷手段などを提供する。 The IF unit 204 serves as an interface for transmitting and receiving data to and from other systems and devices, and also provides an interface for receiving various commands and input data (various masters, tables, etc.) from the system operator. The output unit 205 provides a display screen for displaying the processed data, a printing means for printing the data, and the like.

顧客マスタ206は、顧客情報を格納するマスタファイルである。図3は、本発明の実施形態に係る顧客マスタ206のデータ構造の一例を示す図である。顧客マスタ206は、顧客ID301、顧客情報302、顧客口座識別情報303、業種304、およびステータス305を含むことができるが、これらのデータ項目に限定されることはなく他のデータ項目も含むことが可能である。 The customer master 206 is a master file that stores customer information. FIG. 3 is a diagram showing an example of a data structure of the customer master 206 according to the embodiment of the present invention. The customer master 206 can include customer ID 301, customer information 302, customer account identification information 303, industry 304, and status 305, but is not limited to these data items and may also include other data items. It is possible.

顧客ID301は、顧客を識別する識別子である。顧客情報302は、顧客名称、住所、連絡先などの顧客情報を示す。顧客口座識別情報303は、顧客が開設している1または複数の口座を識別する情報を示す。顧客は、その経営形態によって、顧客口座を1つだけ開設している場合や、異なる本支店に複数の口座を開設している場合もある。顧客開設口座が複数存在する場合、推計装置100は、複数の口座を名寄せ処理した上で、名寄せ後の口座データを使用することができる。 The customer ID 301 is an identifier that identifies the customer. The customer information 302 indicates customer information such as a customer name, an address, and contact information. The customer account identification information 303 indicates information that identifies one or a plurality of accounts opened by the customer. Depending on the management form, the customer may have opened only one customer account or may have opened multiple accounts at different head offices and branches. When there are a plurality of customer-opened accounts, the estimation device 100 can use the account data after name identification after performing name identification processing on the plurality of accounts.

業種304は、顧客に関連付けられる業種を示す。業種は、経済産業省によって定められた分類に従ったものでもよいし、あるいは業界団体などで任意に定めた分類に従ったものでもよく、特に限定されることはない。ステータス305は、金融機関によって予め定められた基準に従って判定された、顧客の経営状況(例えば、成長、正常、デフォルトなど)を示す。 Industry 304 indicates the industry associated with the customer. The type of industry may be according to the classification set by the Ministry of Economy, Trade and Industry, or may be according to the classification arbitrarily set by an industry group or the like, and is not particularly limited. Status 305 indicates the business condition of the customer (eg, growth, normal, default, etc.) as determined by the financial institution according to predetermined criteria.

図2に戻って説明すると、入出金明細207は、顧客口座に対する入出金明細データを格納する。図4は、本発明の実施形態に係る入出金明細207のデータ構造の一例を示す図である。入出金明細207は、口座識別子401、取引年月日402、入出金区分403、金額404、残高405、および摘要406を含むことができるが、これらのデータ項目に限定されることはなく他のデータ項目も含むことが可能である。 Returning to FIG. 2, the deposit / withdrawal detail 207 stores the deposit / withdrawal detail data for the customer account. FIG. 4 is a diagram showing an example of the data structure of the deposit / withdrawal specification 207 according to the embodiment of the present invention. The deposit / withdrawal statement 207 may include an account identifier 401, a transaction date 402, a deposit / withdrawal category 403, an amount 404, a balance 405, and a description 406, but is not limited to these data items. Data items can also be included.

口座識別子401は、顧客口座を識別する識別子であり、例えば、銀行コード、支店コード、預金種目、口座番号などに基づく識別子である。取引年月日402は、入金取引または出金取引が行われた年月日を示す。入出金区分403は、行われた取引が入金取引であるのか、または出金取引であるのかを示す。金額404は、取引金額を示す。残高405は、入金取引または出金取引後の顧客口座の残高情報を示す。摘要406は、入金取引または出金取引に対する説明(例えば、振込、被振込など)を示す。 The account identifier 401 is an identifier that identifies a customer account, and is, for example, an identifier based on a bank code, a branch code, a deposit type, an account number, or the like. The transaction date 402 indicates the date on which the deposit transaction or the withdrawal transaction was performed. The deposit / withdrawal category 403 indicates whether the transaction performed is a deposit transaction or a withdrawal transaction. The amount 404 indicates the transaction amount. The balance 405 indicates the balance information of the customer account after the deposit transaction or the withdrawal transaction. Description 406 provides an explanation for a deposit or withdrawal transaction (eg, transfer, transfer, etc.).

図2に戻って説明すると、学習数値データ208は、推計装置100によって生成された度数分布データを格納する。度数分布データは、複数の経営状況パターンに関連付けられる様々な融資先の口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに基づいて生成される。第1の期間と第2の期間の長さは、同一であってもよいし、異なっていてもよい。例えば、既にデフォルトしてしまった企業について言えば、業績が悪化している期間(第2の期間)が相当程度短い場合もある。 Returning to FIG. 2, the learning numerical data 208 stores the frequency distribution data generated by the estimation device 100. The frequency distribution data is based on predetermined first and second period data for each of the variables contained in the deposit and withdrawal statement data of various lender accounts associated with multiple business conditions patterns. Will be generated. The lengths of the first period and the second period may be the same or different. For example, for a company that has already defaulted, the period of poor performance (second period) may be quite short.

図5は、本発明の実施形態に係る学習数値データ208のデータ構造の一例を示す図である。学習数値データ208は、業種501、経営状況パターン502、変数503、期間504、階級505、および度数506を含むことができるが、これらのデータ項目に限定されることはなく他のデータ項目も含むことが可能である。 FIG. 5 is a diagram showing an example of the data structure of the learning numerical data 208 according to the embodiment of the present invention. The learning numerical data 208 can include industry 501, business situation pattern 502, variable 503, period 504, class 505, and frequency 506, but is not limited to these data items and includes other data items. It is possible.

業種501は、融資先の業種を示す。業種501によって示される分類は、業種304によって示される分類と同一である。経営状況パターン502は、融資先の経営状況(例えば、成長、正常、デフォルト)を示す。変数503は、入出金明細データに含まれる変数を示す。変数は、例えば、残高、入金額、出金額、取引件数、振込件数および金額、被振込件数および金額などであってよい。期間504は、度数分布データがどの期間の度数分布データであるのかを示す。例えば、期間504は、第1の期間、第2の期間を示し、第1の期間、第2の期間はそれぞれ、具体的な期間(From To)を示してもよい。階級505は、度数分布データを生成する際のデータ区分を示す。度数506は、それぞれの階級に属する値の数を示す。 Industry 501 indicates the type of business to which the loan is made. The classification indicated by industry 501 is the same as the classification indicated by industry 304. The business condition pattern 502 indicates the business condition of the lender (for example, growth, normal, default). Variable 503 indicates a variable included in the deposit / withdrawal detail data. Variables may be, for example, balance, deposit amount, withdrawal amount, number of transactions, number of transfers and amount, number of transfers and amount. The period 504 indicates which period the frequency distribution data is. For example, the period 504 may indicate a first period and a second period, and the first period and the second period may each indicate a specific period (From To). Class 505 indicates a data division when generating frequency distribution data. The frequency 506 indicates the number of values belonging to each class.

図2に戻って説明すると、学習画像データ209は、学習数値データ208に格納されている度数分布データを使用して生成されたヒストグラム(度数分布図)を含む画像データを格納する。図6は、本発明の実施形態に係る学習画像データ209のデータ構造の一例を示す図である。学習画像データ209は、業種501、経営状況パターン502、変数503、画像データ601および差分情報602を含むことができるが、これらのデータ項目に限定されることはなく他のデータ項目も含むことが可能である。 Returning to FIG. 2, the training image data 209 stores image data including a histogram (frequency distribution map) generated by using the frequency distribution data stored in the training numerical data 208. FIG. 6 is a diagram showing an example of the data structure of the learning image data 209 according to the embodiment of the present invention. The learning image data 209 can include an industry 501, a business situation pattern 502, a variable 503, an image data 601 and a difference information 602, but is not limited to these data items and may include other data items. It is possible.

業種501、経営状況パターン502、および変数503は、図5を参照しながら説明した通りなので、詳細な説明は省略する。画像データ601は、業種501、経営状況パターン502、および変数503に関連付けられる期間504によって示されるそれぞれの期間の階級505および度数506のデータに基づいて生成されたヒストグラムを含む画像データを示す。例えば、デフォルトした融資先について、期間504によって第1の期間(正常期間)および第2の期間(悪化期間)が示されている場合、画像データには、第1の期間に関連付けられるヒストグラムおよび第2の期間に関連付けられるヒストグラムが含まれる。差分情報602は、第1のヒストグラムおよび第2のヒストグラムを比較した結果である、各階級について算出された差分値の情報を示す。 Since the industry 501, the business situation pattern 502, and the variable 503 are as described with reference to FIG. 5, detailed description thereof will be omitted. The image data 601 shows image data including histograms generated based on the data of class 505 and frequency 506 of each period indicated by the industry 501, the business situation pattern 502, and the period 504 associated with the variable 503. For example, for a default lender, if period 504 indicates a first period (normal period) and a second period (deterioration period), the image data will include the histogram associated with the first period and the first. Includes a histogram associated with the two periods. The difference information 602 shows the information of the difference value calculated for each class, which is the result of comparing the first histogram and the second histogram.

(処理フロー:画像データ生成処理および機械学習処理)
図7は、推計装置100によって実行される画像データ生成処理および機械学習処理を説明する図である。本処理フローを参照しながら、推計装置100が、複数の経営状況パターンに関連付けられる様々な融資先の口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに関連づけられるそれぞれの度数分布データを生成し、生成されたそれぞれの度数分布データを使用して、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む画像データを生成する処理を説明する。また、本処理フローを参照しながら、推計装置100が、生成された画像データを機械学習する処理を説明する。
(Processing flow: image data generation processing and machine learning processing)
FIG. 7 is a diagram illustrating an image data generation process and a machine learning process executed by the estimation device 100. With reference to this processing flow, the estimation device 100 uses a predetermined first period and a first period for each of the variables included in the deposit / withdrawal detail data of the accounts of various lenders associated with a plurality of business situation patterns. Generate each frequency distribution data associated with the data in the second period, and use each generated frequency distribution data to create a first histogram associated with the first period and a second associated with the second period. The process of generating image data including the histogram of 2 will be described. In addition, the process in which the estimation device 100 machine-learns the generated image data will be described with reference to this processing flow.

S701にて、推計装置100は、処理対象として指定された業種およびステータスの情報を受信する。業種およびステータスの指定は、推計装置100に接続されたオペレータ端末(不図示)から行われてもよい。推計装置100は、顧客マスタ206にアクセスし、受信した業種およびステータスの情報に関連付けられる顧客口座識別情報303の情報を読み出し、処理対象の顧客口座を識別する。 In S701, the estimation device 100 receives information on the industry and status designated as the processing target. The industry and status may be specified from an operator terminal (not shown) connected to the estimation device 100. The estimation device 100 accesses the customer master 206, reads out the information of the customer account identification information 303 associated with the received industry and status information, and identifies the customer account to be processed.

S702にて、推計装置100は、入出金明細207にアクセスし、処理対象として識別された顧客口座に関連付けられる入出金明細データを読み出す。 In S702, the estimation device 100 accesses the deposit / withdrawal detail 207 and reads out the deposit / withdrawal detail data associated with the customer account identified as the processing target.

S703にて、推計装置100は、読み出された入出金明細データに含まれる変数(例えば、残高)ごとに、予め定められた第1の期間および第2の期間の入出金明細データに基づくそれぞれの度数分布データを生成する。第1の期間および第2の期間は、金融機関よって予め定められていて良く、第1の期間および第2の期間は、同じ長さの期間であっても異なる長さの期間であってもよい。例えば、デフォルト(債務不履行)となってしまった企業に関しては、経営状況が悪化する前の正常期間の1年間を第1の期間とし、経営状況が悪化し始めてデフォルトとなってしまうまでの悪化期間(Nヶ月:Nは自然数)を第2の期間としてよい。推計装置100は、生成した度数分布データを学習数値データ208に格納する。度数分布データの階級505の値は、任意に定められてよい。 In S703, the estimation device 100 is based on the predetermined first period and second period deposit / withdrawal detail data for each variable (for example, balance) included in the read deposit / withdrawal detail data. Generate frequency distribution data for. The first period and the second period may be predetermined by the financial institution, and the first period and the second period may be the same length period or different length periods. Good. For example, for a company that has defaulted (default), the first period is one year, which is the normal period before the business situation deteriorates, and the deterioration period until the business situation begins to deteriorate and becomes the default. (N months: N is a natural number) may be the second period. The estimation device 100 stores the generated frequency distribution data in the learning numerical data 208. The value of the class 505 of the frequency distribution data may be arbitrarily determined.

S704にて、推計装置100は、学習数値データ208に格納されているそれぞれの度数分布データを読み出し、業種501、経営状況パターン502および変数503ごとにヒストグラムを含む画像データを生成する。画像データは、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む。また、推計装置100は、第1のヒストグラムおよび第2のヒストグラムを比較し、各階級についての差分値を算出する。生成された画像データおよび各階級についての差分値は、業種501、経営状況パターン502および変数503に関連付けられて、推計装置100によって学習画像データ209の画像データ601および差分情報602にそれぞれ格納される。 In S704, the estimation device 100 reads out each frequency distribution data stored in the learning numerical data 208, and generates image data including a histogram for each of the industry 501, the business situation pattern 502, and the variable 503. The image data includes a first histogram associated with the first period and a second histogram associated with the second period. Further, the estimation device 100 compares the first histogram and the second histogram, and calculates the difference value for each class. The generated image data and the difference value for each class are associated with the industry 501, the business situation pattern 502, and the variable 503, and are stored in the image data 601 and the difference information 602 of the learning image data 209 by the estimation device 100, respectively. ..

ここで、図9を参照しながら、S703およびS704の処理を説明する。図9(a)〜(c)は、第1のヒストグラムおよび第2のヒストグラムを含む画像データを生成する過程を例示する図である。図9(a)に示すように、推計装置100は、第1の期間(例えば、正常期間)および第2の期間(例えば、悪化期間)における、ある変数の時系列変動の値から第1の度数分布データおよび第2の度数分布データを生成する。推計装置100は、第1の度数分布データおよび第2の度数分布データに基づいて第1の期間の第1のヒストグラムおよび第2の期間の第2のヒストグラムを生成する。推計装置100は、第1のヒストグラムおよび第2のヒストグラムを図9(b)に例示するように重ね合わせるとともに、各階級についての差分値を算出する。図9(c)に示すように、推計装置100は、第1のヒストグラムおよび第2のヒストグラムを含む画像データを生成する。生成された画像データおよび算出された差分値は、上述したように、学習画像データ209に格納される。 Here, the processes of S703 and S704 will be described with reference to FIG. 9 (a) to 9 (c) are diagrams illustrating a process of generating image data including a first histogram and a second histogram. As shown in FIG. 9A, the estimation device 100 is the first from the value of the time series variation of a variable in the first period (for example, normal period) and the second period (for example, deterioration period). Generate frequency distribution data and second frequency distribution data. The estimation device 100 generates a first histogram of the first period and a second histogram of the second period based on the first frequency distribution data and the second frequency distribution data. The estimation device 100 superimposes the first histogram and the second histogram as illustrated in FIG. 9B, and calculates the difference value for each class. As shown in FIG. 9C, the estimation device 100 generates image data including a first histogram and a second histogram. The generated image data and the calculated difference value are stored in the training image data 209 as described above.

S705にて、推計装置100は、学習画像データ209に格納されている画像データおよび差分情報を人工知能(AI)に機械学習させることができる。推計装置100は、様々な機械学習の手法を利用することができる。例えば、推計装置100は、機械学習の一手法であるディープラーニング(深層学習)を利用することもでき、その深層学習モデルの中でも、畳み込みニューラルネットワーク(CNN)を用いることもできる。 In S705, the estimation device 100 can make artificial intelligence (AI) machine-learn the image data and the difference information stored in the training image data 209. The estimation device 100 can utilize various machine learning methods. For example, the estimation device 100 can use deep learning (deep learning), which is a method of machine learning, and can also use a convolutional neural network (CNN) in the deep learning model.

(処理フロー:予測処理)
図8は、推計装置100によって実行される予測処理を説明する図である。本処理フローを参照しながら、推計装置100が、分析対象となる顧客の顧客口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに基づいて生成されたそれぞれの度数分布データを使用して複数のヒストグラムを含む画像データを生成し、生成された画像データと、学習画像データ209に格納されている画像データとを比較することによって、分析対象の顧客がどの経営状況パターンに相当する可能性が高いかを判定する処理を説明する。また、本処理フローでは、AIによって、画像データ同士の比較処理や分析対象の顧客がどの経営状況パターンに相当する可能性が高いかの判定処理が行われてもよい。
(Processing flow: Prediction processing)
FIG. 8 is a diagram illustrating a prediction process executed by the estimation device 100. With reference to this processing flow, the estimation device 100 applies the data of the predetermined first period and the second period for each of the variables included in the deposit / withdrawal detail data of the customer account of the customer to be analyzed. By generating image data including a plurality of histograms using each frequency distribution data generated based on the above, and comparing the generated image data with the image data stored in the training image data 209. The process of determining which business situation pattern the customer to be analyzed is likely to correspond to will be described. Further, in this processing flow, AI may perform comparison processing between image data and determination processing as to which business situation pattern the customer to be analyzed is likely to correspond to.

S801にて、推計装置100は、分析対象として指定された顧客の顧客ID301を受信する。顧客ID301の指定は、推計装置100に接続されたオペレータ端末(不図示)から行われてもよい。推計装置100は、顧客マスタ206にアクセスし、分析対象として指定された顧客の顧客ID301に関連付けられる顧客口座識別情報303に基づいて分析対象の顧客口座を識別する。推計装置100は、顧客ID301に関連付けられる業種304の情報も取得する。 In S801, the estimation device 100 receives the customer ID 301 of the customer designated as the analysis target. The customer ID 301 may be designated from an operator terminal (not shown) connected to the estimation device 100. The estimation device 100 accesses the customer master 206 and identifies the customer account to be analyzed based on the customer account identification information 303 associated with the customer ID 301 of the customer designated as the analysis target. The estimation device 100 also acquires information on the industry 304 associated with the customer ID 301.

S802にて、推計装置100は、入出金明細207にアクセスし、分析対象として識別された顧客口座に関連付けられる入出金明細データを読み出す。 In S802, the estimation device 100 accesses the deposit / withdrawal detail 207 and reads out the deposit / withdrawal detail data associated with the customer account identified as the analysis target.

S803にて、推計装置100は、読み出された入出金明細データに含まれる変数(例えば、残高)ごとに、予め定められた第1の期間および第2の期間の入出金明細データに基づく度数分布データを生成する。第1の期間および第2の期間は、図7を参照しながら説明した第1の期間および第2の期間と同一である。生成された度数分布データは、第1の期間に関連付けられる第1の度数分布データおよび第2の期間に関連付けられる第2の度数分布データを含む。 In S803, the estimation device 100 determines the frequency based on the predetermined first period and second period deposit / withdrawal detail data for each variable (for example, balance) included in the read deposit / withdrawal detail data. Generate distribution data. The first period and the second period are the same as the first period and the second period described with reference to FIG. 7. The generated frequency distribution data includes a first frequency distribution data associated with a first period and a second frequency distribution data associated with a second period.

S804にて、推計装置100は、S803にて生成された第1の度数分布データおよび第2の度数分布データに基づいて、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む画像データを生成する。生成される画像データは、図9(c)に例示されるような画像データであってよい。また、推計装置100は、生成された画像データに含まれる第1のヒストグラムおよび第2のヒストグラムを比較し、各階級についての差分値を算出する。 In S804, the estimation device 100 associates with the first histogram and the second period associated with the first period based on the first frequency distribution data and the second frequency distribution data generated in S803. The image data including the second histogram to be generated is generated. The generated image data may be image data as illustrated in FIG. 9 (c). Further, the estimation device 100 compares the first histogram and the second histogram included in the generated image data, and calculates the difference value for each class.

S805にて、推計装置100は、S804にて生成された、分析対象の顧客に関連付けられる画像データに含まれる第1のヒストグラムおよび第2のヒストグラムの差分の大きさを識別する。この識別処理は、画像ベースで行われてもよく、あるいは当該画像データについて算出された各階級の差分値に基づいて行われてもよい。推計装置100は、識別された差分の大きさが予め定められた閾値以上であるかどうかを判定する。閾値は、顧客の業種などによって変動してよい。差分の大きさが予め定められた閾値以上である場合(すなわち、第1の期間と第2の期間とで経営状況の目立った変化が発生している場合)、S806に処理が進み、閾値未満である場合(すなわち、第1の期間と第2の期間に目立った経営状況の変化は発生していない場合)、本処理フローは終了となる。 In S805, the estimation device 100 identifies the magnitude of the difference between the first histogram and the second histogram included in the image data associated with the customer to be analyzed generated in S804. This identification process may be performed on an image basis, or may be performed based on the difference value of each class calculated for the image data. The estimation device 100 determines whether or not the magnitude of the identified difference is equal to or greater than a predetermined threshold value. The threshold value may vary depending on the customer's industry and the like. If the magnitude of the difference is greater than or equal to a predetermined threshold (that is, if there is a noticeable change in the business situation between the first period and the second period), the process proceeds to S806 and is less than the threshold. If (that is, there is no noticeable change in business conditions between the first period and the second period), this processing flow ends.

S806にて、推計装置100は、S804にて生成された、分析対象の顧客に関連付けられる画像データと、学習画像データ209に格納されている対応する業種501および変数503(例えば、残高)に関連付けられる1または複数の画像データとを比較する。学習画像データ209は、対応する業種501および変数503に関連付けられる複数の経営状況パターン502(例えば、成長、正常、デフォルト)の画像データを有する。この比較処理により、推計装置100は、分析対象の顧客に関連付けられる画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンが、学習画像データ209に格納されているどの画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンと類似度が高いかを判定し、分析対象の顧客の経営状況を予測することができる。すなわち、類似度が高いと判定された画像データに関連付けられる経営状況パターンによって、推計装置100は、分析対象の顧客が、成長段階にあるのか、正常段階にあるのか、あるいはデフォルトに向かいつつある段階にあるのかを予測することができる。なお、類似度が高いかどうかを判定する基準は、融資元企業によって任意に定めることができ、その基準は、融資先の業種ごとに定めることが可能である。 In S806, the estimation device 100 associates the image data generated in S804 with the customer to be analyzed with the corresponding industry 501 and variable 503 (eg, balance) stored in the training image data 209. Compare with one or more image data. The training image data 209 has image data of a plurality of business situation patterns 502 (eg, growth, normal, default) associated with the corresponding industry 501 and variable 503. By this comparison processing, the estimation device 100 uses which image data stored in the training image data 209 to display the difference pattern between the first histogram and the second histogram indicated by the image data associated with the customer to be analyzed. It is possible to determine whether or not the difference pattern between the first and second histograms shown has a high degree of similarity, and predict the business condition of the customer to be analyzed. That is, depending on the business condition pattern associated with the image data determined to have high similarity, the estimation device 100 is in the stage where the customer to be analyzed is in the growth stage, the normal stage, or is moving toward the default. It is possible to predict whether it is in. The criteria for determining whether or not the degree of similarity is high can be arbitrarily set by the lender company, and the criteria can be set for each type of loan recipient.

本発明の実施形態では、推計装置100は、S804にて生成された、分析対象の顧客に関連付けられる画像データについて算出された各階級についての差分値と、学習画像データ209に格納されている対応する業種501および変数503(例えば、残高)に関連付けられる1または複数の画像データの差分情報602に含まれる各階級についての差分値とを比較する。この比較処理により、推計装置100は、分析対象の顧客に関連付けられる画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンが、学習画像データ209に格納されているどの画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンと類似度が高いかを判定し、分析対象の顧客の経営状況を予測することができる。 In the embodiment of the present invention, the estimation device 100 has the difference value for each class calculated for the image data associated with the customer to be analyzed generated in S804 and the correspondence stored in the training image data 209. The difference value for each class included in the difference information 602 of one or more image data associated with the industry 501 and the variable 503 (for example, the balance) is compared. By this comparison processing, the estimation device 100 uses which image data stored in the training image data 209 to display the difference pattern between the first histogram and the second histogram indicated by the image data associated with the customer to be analyzed. It is possible to determine whether or not the difference pattern between the first and second histograms shown has a high degree of similarity, and predict the business condition of the customer to be analyzed.

本発明の実施形態では、推計装置100は、S804にて生成された、分析対象の顧客に関連付けられる画像データを人工知能(AI)に提供し、予め機械学習された画像データとの比較をAIに実行させ、分析対象の顧客に関連付けられる画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンが、機械学習された画像データのうちどの画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンと類似度が高いかを判定させることによって、分析対象の顧客の経営状況を予測することができる。すなわち、推計装置100は、分析対象の顧客の経営状況を、AIによって類似度が高いと判定された画像データに関連付けられる経営状況パターン(例えば、成長、正常、デフォルト)に相当する可能性が高いと判定することができる。また、推計装置100は、AIに比較を実行させる際、S804にて算出された各階級についての差分値をAIにさらに提供することもでき、かかる場合、AIは、画像データと差分値との両方に基づいて類似度を判定することができる。 In the embodiment of the present invention, the estimation device 100 provides the artificial intelligence (AI) with the image data generated in S804 and associated with the customer to be analyzed, and compares it with the image data machine-learned in advance. The pattern of the difference between the first and second histograms, which is shown by the image data associated with the customer to be analyzed, is the first histogram and which of the machine-learned image data is shown. By determining whether the difference pattern of the second histogram has a high degree of similarity, it is possible to predict the business situation of the customer to be analyzed. That is, the estimation device 100 is likely to correspond to the business condition pattern (for example, growth, normal, default) associated with the image data determined by AI to have a high degree of similarity to the business condition of the customer to be analyzed. Can be determined. Further, the estimation device 100 can further provide the AI with the difference value for each class calculated in S804 when the AI is made to perform the comparison. In such a case, the AI is the image data and the difference value. The similarity can be determined based on both.

本発明の実施形態では、推計装置100は、S803にて生成された度数分布データのうち、第1の期間に関連付けられる第1の度数分布データと第2の期間に関連付けられる第2の度数分布データとを比較することによって分析対象の顧客が成長段階にあるのか、あるいは衰退段階にあるのかを推測することができる。より詳細に言えば、推計装置100は、第2の度数分布データに基づいて算出された第2の平均値を、第1の度数分布データに基づいて算出された第1の平均値で除し、1よりも大きい値が得られた場合に成長段階にあると判定し、1よりも小さい値が得られた場合に衰退段階にあると判定することができる。なお、平均値としては採用するのは、第1の期間および第2の期間のそれぞれの変数(例えば、残高、入金額、出金額など)の実データであってもよい。 In the embodiment of the present invention, the estimation device 100 uses the first frequency distribution data associated with the first period and the second frequency distribution associated with the second period among the frequency distribution data generated in S803. By comparing with the data, it is possible to infer whether the customer to be analyzed is in the growth stage or the decline stage. More specifically, the estimation device 100 divides the second average value calculated based on the second frequency distribution data by the first average value calculated based on the first frequency distribution data. If a value greater than 1 is obtained, it can be determined to be in the growth stage, and if a value smaller than 1 is obtained, it can be determined to be in the decline stage. It should be noted that the average value may be the actual data of the variables (for example, balance, deposit amount, withdrawal amount, etc.) of the first period and the second period.

上述したような処理によって、推計装置100は、特定の融資先の口座の動態データに基づく画像データを、蓄積された画像データあるいは機械学習された画像データに基づいて分析することにより、財務数値データを利用していた従来よりも早い段階で経営状況の大幅な変動、とりわけ、デフォルトの発生有無を予測することができるようになる。 By the processing as described above, the estimation device 100 analyzes the image data based on the dynamic data of the account of the specific lender based on the accumulated image data or the machine-learned image data, thereby causing the financial numerical data. It will be possible to predict large fluctuations in business conditions, especially the occurrence of defaults, at an earlier stage than before using.

以上、例示的な実施形態を参照しながら本発明の原理を説明したが、本発明の要旨を逸脱することなく、構成および細部において変更する様々な実施形態を実現可能であることを当業者は理解するだろう。すなわち、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能である。 Although the principles of the present invention have been described above with reference to exemplary embodiments, those skilled in the art will appreciate that various embodiments that change in configuration and details can be realized without departing from the gist of the present invention. You will understand. That is, the present invention can be implemented as, for example, a system, an apparatus, a method, a program, a storage medium, or the like.

100 推計装置
110 銀行システム
120 顧客端末
130 ATM
140 他行システム
201 制御部
202 主記憶部
203 補助記憶部
204 インターフェース(IF)部
205 出力部
206 顧客マスタ
207 入出金明細
208 学習数値データ
209 学習画像データ
210 バス
100 Estimator 110 Banking system 120 Customer terminal 130 ATM
140 Other bank system 201 Control unit 202 Main storage unit 203 Auxiliary storage unit 204 Interface (IF) unit 205 Output unit 206 Customer master 207 Deposit / withdrawal details 208 Learning numerical data 209 Learning image data 210 Bus

Claims (11)

推計装置であって、
分析対象として指定された顧客に関連付けられる入出金明細データを読み出し、
読み出された入出金明細データに含まれる変数に対して、第1の期間に関連付けられる第1の度数分布データおよび第2の期間に関連付けられる第2の度数分布データを生成し、
前記第1の度数分布データおよび前記第2の度数分布データに基づいて、前記第1の期間に関連付けられる第1のヒストグラムおよび前記第2の期間に関連付けられる第2のヒストグラムを含む第1の画像データを生成し、
前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムの差分の大きさを識別し、識別された前記差分の大きさが予め定められた閾値以上であるかどうかを判定し、
前記差分の大きさが予め定められた閾値以上であると判定されたという条件で、前記第1の画像データと、第2の画像データとを比較し、前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムの差分のパターンが、前記第2の画像データのうちのどの画像データによって示される前記差分のパターンと類似度が高いかを予め定められた基準に基づいて判定し、前記類似度が高いと判定された前記第2の画像データに関連付けられる経営状況パターンに従って、前記分析対象として指定された顧客が成長段階にあるのか、正常段階にあるのか、あるいはデフォルトに向かいつつある段階にあるのかを判定することにより、前記顧客の経営状況を予測する
ように構成された推計装置。
It ’s an estimation device,
Read the deposit / withdrawal detail data associated with the customer specified for analysis,
For the variables included in the read deposit / withdrawal detail data, the first frequency distribution data associated with the first period and the second frequency distribution data associated with the second period are generated.
A first image containing a first histogram associated with the first period and a second histogram associated with the second period, based on the first frequency distribution data and the second frequency distribution data. Generate data and
The magnitude of the difference between the first histogram and the second histogram included in the first image data is identified, and it is determined whether or not the magnitude of the identified difference is equal to or greater than a predetermined threshold value. And
The first image data and the second image data are compared on the condition that the magnitude of the difference is determined to be equal to or larger than a predetermined threshold value, and the first image data is included in the first image data. Based on a predetermined criterion, which image data of the second image data has a high degree of similarity to the difference pattern between the first histogram and the second histogram. According to the business condition pattern associated with the second image data determined to have a high degree of similarity, the customer designated as the analysis target is in the growth stage, the normal stage, or the default. An estimation device configured to predict the business situation of the customer by determining whether it is in the oncoming stage .
前記予め定められた基準は、融資先の業種ごとに定められる、請求項1に記載の推計装置。The estimation device according to claim 1, wherein the predetermined standard is determined for each type of business of the lender. 前記比較することおよび前記判定することは、人工知能(AI)によって実行される、請求項に記載の推計装置。 The estimation device according to claim 1 , wherein the comparison and the determination are performed by artificial intelligence (AI). 前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムを比較し、各階級についての第1の差分値を算出するようにさらに構成された、請求項1に記載の推計装置。 The estimation according to claim 1, further configured to compare the first histogram and the second histogram included in the first image data and calculate a first difference value for each class. apparatus. 前記第1の画像データについて算出された前記各階級についての前記第1の差分値と、第2の画像データに関連付けられる対応する第2の差分値とを比較し、前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムの差分のパターンが、前記第2の画像データのうちのどの画像データによって示される前記差分のパターンと類似度が高いかを判定することによって、前記顧客の経営状況を予測するようにさらに構成された、請求項4に記載の推計装置。 The first difference value for each class calculated for the first image data is compared with the corresponding second difference value associated with the second image data, and the first image data is obtained. By determining which image data of the second image data has a high degree of similarity to the pattern of the difference between the first histogram and the second histogram included. The estimation device according to claim 4, further configured to predict the business situation of the customer. 前記第1の差分値と前記第2の差分値とを比較することおよび前記類似度が高いかを判定することは、人工知能(AI)によって実行される、請求項5に記載の推計装置。 The estimation device according to claim 5, wherein comparing the first difference value with the second difference value and determining whether the similarity is high is performed by artificial intelligence (AI). 前記第1のヒストグラムおよび前記第2のヒストグラムの差分の大きさを識別することは、前記第1の画像データに基づいて実行されるように構成された、請求項1に記載の推計装置。 The estimation device according to claim 1, wherein discriminating the magnitude of the difference between the first histogram and the second histogram is performed based on the first image data. 前記第1のヒストグラムおよび前記第2のヒストグラムの差分の大きさを識別することは、前記第1の画像データについて算出された各階級の差分値に基づいて実行されるようにさらに構成された、請求項1に記載の推計装置。 Discriminating the magnitude of the difference between the first histogram and the second histogram is further configured to be performed based on the difference value of each class calculated for the first image data. The estimation device according to claim 1. 前記第1の度数分布データおよび前記第2の度数分布データを比較することによって、前記顧客が成長段階にあるのか、あるいは衰退段階にあるのかを推測するようにさらに構成された、請求項1に記載の推計装置。 Claim 1 is further configured to infer whether the customer is in a growth stage or a decline stage by comparing the first frequency distribution data with the second frequency distribution data. The estimation device described. 推計装置によって実行される推計方法であって、
分析対象として指定された顧客に関連付けられる入出金明細データを読み出すことと、
読み出された入出金明細データに含まれる変数に対して、第1の期間に関連付けられる第1の度数分布データおよび第2の期間に関連付けられる第2の度数分布データを生成することと、
前記第1の度数分布データおよび前記第2の度数分布データに基づいて、前記第1の期間に関連付けられる第1のヒストグラムおよび前記第2の期間に関連付けられる第2のヒストグラムを含む第1の画像データを生成することと、
前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムの差分の大きさを識別し、識別された前記差分の大きさが予め定められた閾値以上であるかどうかを判定することと、
前記差分の大きさが予め定められた閾値以上であると判定されたという条件で、前記第1の画像データと、第2の画像データとを比較し、前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムの差分のパターンが、前記第2の画像データのうちのどの画像データによって示される前記差分のパターンと類似度が高いかを予め定められた基準に基づいて判定し、前記類似度が高いと判定された前記第2の画像データに関連付けられる経営状況パターンに従って、前記分析対象として指定された顧客が成長段階にあるのか、正常段階にあるのか、あるいはデフォルトに向かいつつある段階にあるのかを判定することにより、前記顧客の経営状況を予測することと
を備える、推計方法。
An estimation method performed by an estimation device,
Reading the deposit / withdrawal detail data associated with the customer specified for analysis, and
To generate the first frequency distribution data associated with the first period and the second frequency distribution data associated with the second period for the variables included in the read deposit / withdrawal detail data.
A first image containing a first histogram associated with the first period and a second histogram associated with the second period, based on the first frequency distribution data and the second frequency distribution data. To generate data and
The magnitude of the difference between the first histogram and the second histogram included in the first image data is identified, and it is determined whether or not the magnitude of the identified difference is equal to or greater than a predetermined threshold value. To do and
The first image data and the second image data are compared on the condition that the magnitude of the difference is determined to be equal to or larger than a predetermined threshold value, and the first image data is included in the first image data. Based on a predetermined criterion, which image data of the second image data has a high degree of similarity to the difference pattern between the first histogram and the second histogram. According to the business condition pattern associated with the second image data determined to have a high degree of similarity, the customer designated as the analysis target is in the growth stage, the normal stage, or the default. An estimation method that includes predicting the business situation of the customer by determining whether or not the customer is in the on-going stage .
プロセッサによって実行されたとき、請求項10に記載の方法を推計装置に実行させるプログラム。 A program that causes an estimation device to execute the method according to claim 10, when executed by a processor.
JP2019047190A 2019-03-14 2019-03-14 Estimator, estimation method and program Active JP6797956B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019047190A JP6797956B2 (en) 2019-03-14 2019-03-14 Estimator, estimation method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019047190A JP6797956B2 (en) 2019-03-14 2019-03-14 Estimator, estimation method and program

Publications (2)

Publication Number Publication Date
JP2020149443A JP2020149443A (en) 2020-09-17
JP6797956B2 true JP6797956B2 (en) 2020-12-09

Family

ID=72432051

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019047190A Active JP6797956B2 (en) 2019-03-14 2019-03-14 Estimator, estimation method and program

Country Status (1)

Country Link
JP (1) JP6797956B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7194077B2 (en) * 2019-06-03 2022-12-21 株式会社日立製作所 Management analysis support system and management analysis support method
JP7386465B1 (en) 2023-07-04 2023-11-27 ゼネリックソリューション株式会社 Examination support device, examination support method, and examination support program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4343140B2 (en) * 2005-05-10 2009-10-14 株式会社エヌ・ティ・ティ・データ Evaluation apparatus and computer program therefor
JP5867349B2 (en) * 2011-09-21 2016-02-24 新日鐵住金株式会社 Quality prediction apparatus, operation condition determination method, quality prediction method, computer program, and computer-readable storage medium
JP6009864B2 (en) * 2011-09-21 2016-10-19 典秀 野田 Company evaluation system, company evaluation method and company evaluation program
JP6053166B2 (en) * 2013-07-31 2016-12-27 Kddi株式会社 Numerical data analysis apparatus and program
JP6347022B1 (en) * 2018-02-28 2018-06-20 毅 葉山 Machine learning apparatus, prediction system, and program

Also Published As

Publication number Publication date
JP2020149443A (en) 2020-09-17

Similar Documents

Publication Publication Date Title
CN108876133B (en) Risk assessment processing method, device, server and medium based on business information
CN110111113B (en) Abnormal transaction node detection method and device
CA3060678A1 (en) Systems and methods for determining credit worthiness of a borrower
US20230099864A1 (en) User profiling based on transaction data associated with a user
CN111008896A (en) Financial risk early warning method and device, electronic equipment and storage medium
US20150262184A1 (en) Two stage risk model building and evaluation
US20220351207A1 (en) System and method for optimization of fraud detection model
JP6797956B2 (en) Estimator, estimation method and program
CN108038692B (en) Role identification method and device and server
CN115545886A (en) Overdue risk identification method, overdue risk identification device, overdue risk identification equipment and storage medium
CN111563187A (en) Relationship determination method, device and system and electronic equipment
CN112329862A (en) Decision tree-based anti-money laundering method and system
WO2023177781A1 (en) Analyzing a transaction in a payment processing system
TWI792101B (en) Data Quantification Method Based on Confirmed Value and Predicted Value
US20220207420A1 (en) Utilizing machine learning models to characterize a relationship between a user and an entity
KR102244705B1 (en) Method for controlling worker inflow into project by reversal adjustment of work unit price between crowdsourcing based similar projects for training data generation
CN113052512A (en) Risk prediction method and device and electronic equipment
CN113689020A (en) Service information prediction method, device, computer equipment and storage medium
CN111861493A (en) Information processing method, information processing device, electronic equipment and storage medium
CN113515383B (en) System resource data distribution method and device
CN112116357B (en) Method and device for realizing cashing detection and computer equipment
US20230195056A1 (en) Automatic Control Group Generation
CA3116479A1 (en) System and method for optimization of fraud detection model
CN115187386A (en) Online credit card risk information detection method and device
CN117541885A (en) Sample data processing method, device, storage medium and system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190314

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200526

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201118

R150 Certificate of patent or registration of utility model

Ref document number: 6797956

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250