JP6783002B2 - 企業の債務不履行予測システム及びその動作方法 - Google Patents

企業の債務不履行予測システム及びその動作方法 Download PDF

Info

Publication number
JP6783002B2
JP6783002B2 JP2019197263A JP2019197263A JP6783002B2 JP 6783002 B2 JP6783002 B2 JP 6783002B2 JP 2019197263 A JP2019197263 A JP 2019197263A JP 2019197263 A JP2019197263 A JP 2019197263A JP 6783002 B2 JP6783002 B2 JP 6783002B2
Authority
JP
Japan
Prior art keywords
company
default
articles
risk
analyzed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019197263A
Other languages
English (en)
Other versions
JP2020095693A (ja
Inventor
チャン ユン、ドク
チャン ユン、ドク
ヨン チョン、スク
ヨン チョン、スク
デヒヤ ワスンダラ
デヒヤ ワスンダラ
ヨン ソ、ウォン
ヨン ソ、ウォン
Original Assignee
アイエスディー インコーポレーテッド
アイエスディー インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アイエスディー インコーポレーテッド, アイエスディー インコーポレーテッド filed Critical アイエスディー インコーポレーテッド
Publication of JP2020095693A publication Critical patent/JP2020095693A/ja
Application granted granted Critical
Publication of JP6783002B2 publication Critical patent/JP6783002B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明の多様な実施例は、企業の債務不履行予測システム及びその動作方法に関し、ニュースデータの分析に基づいて企業の債務不履行の危険を評価するシステムに関する。
現代社会で最も規模が大きく重要度が高い経済主体は企業である。一年にも数多くの企業が生成し消滅されており、関連する個人、企業、更には国家にも経済的に多くの影響を及ぼすことなる。よって、企業の興亡盛衰を分析することは、該当企業の属する産業群だけでなく、全体産業群の分析においても基礎となる。企業が消滅する原因は多いが、そのうち債務不履行(Default)を介して企業が消滅する場合、該当企業の役職員はもちろん、該当企業の投資者や取引企業も莫大な影響を受けるようになる。
そのため、各企業に対する債務不履行可能性の予測に対する研究が地道に行われている。一般に、企業の債務不履行可能性は企業の営業利益によって利子コストにどれだけ耐えられるのかを示す指標であるインタレスト・カバレッジ・レシオ、負債比率などを介して予測されていた。このように、企業の債務不履行可能性の分析予測において、定量的に獲得し得る財務的なデータが主に利用されてきたが、最近は非財務的なデータを基に企業のリスクを分析する方法論が浮き彫りになっている。
企業が公開する財務的データには該当企業に不利な内容が反映されていない可能性があり、企業が公開する財務関連報告書に対する信頼性も疑われる場合があった。よって、非財務的なデータを分析する方法論が様々に台頭している実情であり、非財務的なデータのうち、分析できる程の十分な量を有するニュース記事のデータが主に利用され始めている。
ニュース記事のデータはその量が分析の対象になる程多いが、ニュース記事がいかなる企業に関する記事であるのかを分析し、該当ニュース記事を債務不履行の危険といかなる方式で関連付けて分析するのかを決定するのに難しさがあった。
本発明の多様な実施例は、複数のニュース記事を基に特定企業の債務不履行危険性を予測する方法を提供することをその目的とする。
本発明の多様な実施例は、多様なマシンラーニングアルゴリズム及び分析方法を介して、債務不履行危険性の正確度を向上させることをその目的とする。
本発明が解決しようとする課題は上述した課題に限らず、上述されていない他の課題は以下の記載から通常の技術者に明確に理解されるはずである。
上述した課題を解決するために、本発明の多様な実施例による企業の債務不履行危険性の予測方法は、インターネット上で複数のニュース記事を収集するステップと、分析対象となる企業を選択するステップと、収集した複数のニュース記事のうち分析対象企業に関連するニュース記事を分析対象記事として分類するステップと、前記分析対象記事それぞれに対する危険レベルを算出するステップと、算出された危険レベルを基準に前記分析対象記事のグループ化を行い、各グループを示す特性ベクトルを生成するステップと、生成された特性ベクトルを基に前記分析対象企業の債務不履行危険性を計算するステップと、を含む。
前記分析対象記事それぞれに対する危険レベルを算出するステップは、特定マシンラーニングアルゴリズムを採択し、採択したマシンラーニングアルゴリズムを利用して収集したニュース記事に対して回帰または項目化分析を行った後、前記回帰または項目化分析を介して導出された危険算出アルゴリズムを利用し、前記分析対象記事それぞれに対する危険レベルを算出する。
企業の債務不履行危険性の予測方法は、収集したニュース記事に対して回帰または項目化分析を行うにあたって、債務不履行が発生した企業に関するニュース記事のうち、該当企業の債務不履行から一定時間以内に発行されたニュース記事のみを分析対象として選択するステップを更に含む。
収集した複数のニュース記事のうち、分析対象企業に関連するニュース記事を分析対象記事として分類するステップは、前記分析対象企業の名称が含まれたニュース記事を選別するステップと、選別されたニュース記事それぞれに対して前記分析対象企業に関連する記事であるのかを判断するステップと、更にを含む。
選別されたニュース記事それぞれに対して前記分析対象企業に関連する記事であるのかを判断するステップは、選別されたニュース記事それぞれに関する文脈またはテーマを識別し、識別した文脈またはテーマが前記分析対象企業の情報に関連するのか否かを判断するステップを更に含む。
算出された危険レベルを基準に前記分析対象記事のグループ化を行って各グループを示す特性ベクトルを生成するステップは、前記分析対象記事に対して算出された危険レベルを基に危険レベルを複数の区間に分類し、それを介して前記分析対象記事のグループ化を行うステップを更に含む。
前記危険レベルを複数の区間に分類するステップは、前記分析対象企業が属する産業の種類によって異なる方式で分類を行うことを特徴とする。
生成された特性ベクトルを基に前記分析対象企業の債務不履行危険性を計算するステップは、グループ化が行われた分析対象記事の特性ベクトルを意思決定木アルゴリズムを介して分類した後、結果を基に前記分析対象企業の債務不履行危険性の予測値を算出するステップを更に含む。
グループ化が行われた分析対象記事の特性ベクトルを意思決定木アルゴリズムを介して分類するステップは、前記分析対象記事のグループに対して生成した特性ベクトルを含むデータをn個に分類した後、n個のデータ集合に対して交差検証(n−Cross Validation)方式で意思決定木(Decision Tree)アルゴリズムを適用して特性ベクトルを分類するステップを更に含む。
本発明他の他の実施例によると、ニュース記事を基に企業の債務不履行危険性を予測するコンピューティングシステムは、インターネット上で複数のニュース記事を収集するニュース記事収集部と、分析対象となる企業を選択する分析企業選定部と、収集した複数のニュース記事のうち分析対象企業に関連するニュース記事を分析対象記事として分類する分析対象記事分類部と、前記分析対象記事それぞれに対する危険レベルを算出する危険レベル算出部と、算出された危険レベルを基準に前記分析対象記事のグループ化を行い、各グループを示す特性ベクトルを生成する特性ベクトル生成部と、生成された特性ベクトルを基に前記分析対象企業の債務不履行危険性を計算する債務不履行危険性予測部と、を含む。
本発明の実施例によると、特定企業に対して該当企業と直接関連するニュース記事を選別し、該当記事のみに基づいて企業の債務不履行危険性を予測することができる。
本発明の実施例によると、債務不履行危険性の予測に効果的なマシンラーニングアルゴリズムが採択されて使用され、各記事に対する危険レベルが独立に計算されるだけでなく、ニュース記事のグループ化を介した分析で債務不履行危険性予測の正確度を向上させることができる。
本発明の効果は上述した効果に限らず、上述されていない他の効果は以下の記載から通常の技術者に明確に理解されるはずである。
本発明の一実施例による企業の債務不履行予測システムが動作する環境を概略的に示す画像である。 本発明の一実施例による企業の債務不履行予測システムが動作する方式を概略的に示すフローチャートである。 本発明の一実施例による債務不履行予測装置がニュース記事を収集する動作を示す図である。 本発明の一実施例による債務不履行予測装置がNERアルゴリズムを利用して分析対象企業に関連するニュース記事を分析対象記事として分類する方式を示す図である。 本発明の一実施例による債務不履行予測装置が分析対象記事に対する危険レベルを算出するにあたって使用する独立変数を選択する過程を示す図である。 本発明の一実施例による債務不履行予測装置が分析対象記事に対する危険レベルの算出に利用するマシンラーニングアルゴリズムを選択する過程を示す図である。 本発明の一実施例による債務不履行予測装置が分析対象記事の危険レベルに基づいて企業の債務不履行を予測する過程を示す図である。 本発明の一実施例による債務不履行予測装置が特定企業に関する分析対象記事をグループ化する方式を示す図である。 本発明の一実施例による債務不履行予測装置が分類された特性ベクトルを介して分析対象企業の債務不履行の危険性を計算する方式を説明する図である。 本発明の一実施例による債務不履行予測装置が意思決定木アルゴリズムを介して特性ベクトルを分類するのに利用する交差検証方式を説明する図である。 本発明の一実施例による債務不履行予測装置の構成を示すブロック図である。 本発明の一実施例による債務不履行予測装置が分析対象企業の債務不履行危険性予測値を導出するための過程を示すフローチャートである。
本明細書で使用された用語は実施例を説明するためのものであって、本発明を制限するものではない。本明細書において、単数形は文の中で特に言及されない限り複数形も含む。明細書で使用される「含む(comprises)」及び/または「含む(comprising)」は、言及された構成要素以外にも一つ以上の他の構成要素の存在または追加を排除しない。明細書全体にわたって、同じ図面符号は同じ構成要素を指し、「及び/または」は言及された構成要素のそれぞれ及び一つ以上の全ての組み合わせを含む。たとえ「第1」、「第2」などが多様な構成要素を述べるために使用されても、これらの構成要素はこれらの用語によって制限されないことはもちろんである。これらの用語は単に一つの構成要素を他の構成要素と区別するために使用するものである。よって、以下で言及する第1構成要素は、本発明の技術的思想内で第2構成要素であってもよいことはもちろんである。
明細書全体にわたって、ある部分がある構成要素を「含む」という際、これは特に反対する記載がない限り、他の構成要素を除くのではなく、他の構成要素を更に含むことを意味する。また、明細書に記載された「…部」、「モジュール」などの用途は少なくとも一つの機能や動作を処理する単位を意味し、これはハードウェアまたはソフトウェアで具現されるかハードウェアとソフトウェアの結合で具現される。
図1は、本発明の一実施例による企業の債務不履行予測システムが動作する環境を概略的に示す画像である。
図1を参照すると、企業の債務不履行予測システムは、債務不履行予測装置100、ユーザ端末機200、及び外部サーバ300からなる。
債務不履行予測装置100は、ニュース記事を収集し、収集したニュース記事の分析を介して特定企業に対する債務不履行危険性を予測する。
債務不履行予測装置100は、メモリ手段及び演算装置を備えているコンピューティングシステムからなる。つまり、債務不履行予測装置100は集約的な処理機能を有するサーバからなり、これとは異なって、パーソナルコンピュータ(例えば、デスクトップパソコン、ノートパソコンなど)、ワークステーション、PDA、ウェブパッドなどのようにメモリ手段を備え、マイクロプロセッサを搭載して演算能力を備えたデジタル機器のうち一つからなってもよい。債務不履行予測装置100が含むメモリ手段には、債務不履行の予測に関する機能を具現するソフトウェアが貯蔵または設置された状態で記録される。
ユーザ端末機200は、債務不履行予測装置100との通信を介して特定企業の債務不履行の危険性に関する情報を獲得しようとするユーザによって使用される端末機である。
本発明の一実施例によるユーザ端末機200は、携帯、スマートフォン、PDA(Personal Digital Assistant)、PMP(Portable Multimedia Player)、タブレットPCなどのようにネットワークを介してウェブサーバと連結されるあらゆる種類のハンドヘルド(Handheld)基盤の無線通信装置を含み、パーソナルコンピュータ(例えば、デスクトップパソコン、ノートパソコンなど)、ワークステーション、PDA、ウェブパッドなどのようにメモリ手段を備え、マイクロプロセッサを搭載して演算能力を備えたデジタル機器のうち一つであってもよい。
一実施例によると、ユーザはユーザ端末機200を使用して債務不履行の危険性を知りたい企業に関する識別情報を債務不履行予測装置100に伝送し、債務不履行予測装置100が分析した該当企業に対する債務不履行危険性の予測に関する情報をユーザ端末機200を介して受信し確認する。
外部サーバ300は、債務不履行予測装置100の管理主体によって管理されないサーバであって、一実施例によると、ニュースデータを含んでいるサーバである。債務不履行予測装置100は、外部サーバ300に接続してニュースデータの収集を行う。債務不履行予測装置100によって行われるニュースデータの収集は、ウェブ上で発行される多様な種類のニュースデータをクローリング(Crawling)する方式で行われる。この場合、債務不履行予測装置100は、複数の外部サーバ300からニュースデータを収集する。このように、外部サーバ300の数は特定個数に限らないことはもちろんである。
債務不履行予測装置100は、多様な方式で具現される通信網を介してユーザ端末機200及びサーバ300との通信を行う。
通信網は、有線通信網、無線通信網、及び複合通信網のうち一つに具現される。例えば、通信網は、3G、LTE(Long Term Evolution)、及びLTE−Aのような移動通信網を含んでもよい。通信網は、Wi−Fi、UMTS(Universal Mobile Telecommunications System)/GPRS(General Packet Radio Service)、またはイーサネット(登録商標)(Ethernet)などのような有線または無線通信網を含む。通信網は、磁気セキュア伝送(MST、Magnetic Secure Transmission)、RFID(Radio Frequency IDentifiction)、NFC(Near Field Communication)、ジグビー(ZigBee)、Z−Wave、ブルートゥース(登録商標)(Bluetooth(登録商標))、低電力ブルートゥース(登録商標)(BLE、Bluetooth(登録商標) Low Energy)、または赤外線通信(IR、InfraRed communication)などのような近距離通信網を含む。通信網は、近距離ネットワーク(LAN、Local Area Network)、都市圏ネットワーク(MAN、Metropolitan Area Network)、または広域ネットワーク(WAN、Wide Area Network)などを含む。 図2は、本発明の一実施例による企業の債務不履行予測システムが動作する方式を概略的に示すフローチャートである。
図2を参照すると、債務不履行予測装置100は、概略的に3つのステップを経て最終的に企業の債務不履行の危険性を予測する。
図2のステップ(a)はニュースデータを収集して全処理を行うステップであり、ステップ(b)はニュース記事別の危険レベルを算出するステップであり、ステップ(c)は最終的に企業の債務不履行の危険性を予測するステップである。
図2のステップ(a)から説明すると、ステップ(a)において、債務不履行予測装置100はインターネットに接続してクローリングを介してニュース記事を収集する。この過程で、債務不履行予測装置100は、分析対象として選択された対象企業の名称を含むニュース記事のみを収集してもよい。
次に、債務不履行予測装置100は、収集したニュース記事が分析対象企業に関するのか否かを判断し、それを介して複数のニュース記事の一部を部戦記対象記事として分類する。例えば、分析対象企業の名称をテキストの形式で含むニュース記事が存在しても、該当名称がニュース記事のテキスト上で分析対象企業の名称を称するのではなく他の用途に使用されることがあり得る。また、記事の文脈またはテーマが分析対象となる企業と関連しないこともあり得る。前記のような場合においては、ニュース記事に分析対象企業の名称が含まれていても、該当記事が分析対象記事として分類されない。
図2のステップ(b)について説明すると、ステップ(b)において、債務不履行予測装置100は、分析対象となる企業に関連すると分類された分析対象記事それぞれに対する危険レベルを算出する。
ステップ(b)において、分析対象記事それぞれに対する危険レベルの算出はマシンラーニング(Machine Learing)を介して行われる。つまり、債務不履行予測装置100は、収集したニュース記事の少なくとも一部をマシンラーニングのための学習用データ(Traning Set)及び試験用データ(Test set)と設定し、特定マシンラーニングアルゴリズムを採択した後、該当マシンラーニングアルゴリズムを介して学習用データに対する分析を行い、それを試験用データに適用して分析結果を評価する方式で、危険レベルの算出に使用される危険算出アルゴリズムを導出する。次に、債務不履行予測装置100は、導出された危険算出アルゴリズムを介して分析対象記事に対する危険レベルを算出する。
債務不履行予測装置100は、多様な種類のマシンラーニングアルゴリズムに対して学習及び試験を前記のような方式で行い、その結果を評価して、評価結果が最も良いマシンラーニングアルゴリズムを採択する。評価結果によるマシンラーニングアルゴリズムの採択は債務不履行予測装置100によって自動的に行われてもよく、債務不履行予測装置100の管理者が評価結果を確認し選択してもよい。
一実施例によると、学習用データ内にはどの企業に対して債務不履行が発生したのかに関する情報が含まれており、債務不履行予測装置100はこのような情報を活用してマシンラーニングアルゴリズムの評価を行う。例えば、債務不履行が発生した企業に関するニュース記事の危険レベルを高く算出し、債務不履行が発生していない企業に関するニュース記事の危険レベルを低く算出した程度に応じて、マシンラーニングアルゴリズムの評価か行われてもよい。
ステップ(b)では最終的に採択されたマシンラーニングアルゴリズムによって導出された危険算出アルゴリズムが活用されて、分析対象記事それぞれに対する危険レベルが算出される。
図2のステップ(c)について説明すると、債務不履行予測装置100は、ステップ(b)で算出されたニュース記事の危険レベルを基に、最終的に企業の債務不履行危険性を予測する。
債務不履行予測装置100は、分析対象企業に対して分類された分析対象記事の危険レベルを基に、分析対象企業の債務不履行の危険性を数値化された形態で計算する。また、債務不履行予測装置100は計算された債務不履行の危険性を基に該当企業に対する債務不履行の予想を可否形式(yes or no)で判断してもよく、計算された債務不履行危険性の信頼度を付加的に算出してもよい。
債務不履行予測装置100は、分析対象記事の危険レベルを基に分析対象企業の債務不履行の危険性を計算するにあたって、算出された危険レベルを基準に分析対象記事のグループ化を行い、各グループ別の特性ベクトルを生成して、それに基づいて債務不履行の危険性を計算してもよい。
図3は、本発明の一実施例による債務不履行予測装置100がニュース記事を収集する動作を示す図である。
図3を参照すると、債務不履行予測装置100はインターネット上でクローリングを介してニュース記事を収集する。図3には、債務不履行予測装置100が収集したニュース記事のうち特定企業に関するニュース記事のみが示されている。
一実施例によると、債務不履行予測装置100は、Luceneのような形態素分析ライブラリを利用し、全体のニュース記事のうちから特定企業の名称を含むニュース記事のみを選別する。
図4は、本発明の一実施例による債務不履行予測装置100がNERアルゴリズムを利用して分析対象企業に関連するニュース記事を分析対象記事として分類する方式を示す図である。
図4を参照すると、債務不履行予測装置100は、分析対象企業に関する記事を分類するのに特性化しているNER(Named Entity Recognition)アルゴリズムを活用する。図3で説明したように、形態素分析ライブラリなどを活用して全体のニュース記事のうちから特定企業の名称を含むニュース記事のみが選別されるが、この場合、選別された記事をそのまま分析対象記事として分類し使用するにはいくつかの問題点があった。問題点について説明すると、特定ニュースは該当企業と全く関係のない場合があり、形態素分析ライブラリが誤字と判断される記事を許容して関係のない記事が選別される場合もあった。また、特定企業の名称は該当企業の名称として使用されるだけでなく、該当企業が販売する商品の名称としても使用されるなど、企業の名称が異なる意味で使用されている記事が選別される場合もあった。
前記のような問題点を解決するために、債務不履行予測装置100は、NERアルゴリズムを活用して、形態素分析ライブラリを介して選別されたニュース記事が分析対象企業に関連するニュースであるのかを判断し、該当する記事を分析対象記事として分類する。つまり、債務不履行予測装置100は、分析対象企業の名称が含まれたニュース記事を形態素分析ライブラリを活用して選別し、NERアルゴリズムを介して選別されたニュース記事それぞれに対して該当記事が分析対象企業に関連する記事であるのかを判断する。
一実施例によると、NERアルゴリズムはプログラミング言語であるRを介して具現され、POS taggingとn−gram方式を活用して具現される。POS(Part−Of−Speech) taggingとはテキストを文法的機能や形態によって区分する方式を意味し、このような区分は多様な基準を介して行われる。n−gramとは単語をグループ化する方式であって、文をn個の音節または単語を有するグループに分類し、それに対する分析を行う方式を意味する。
図4を参照すると、NERアルゴリズムを介して分析対象企業に対して選別されたニュース記事が分析対象企業に関連するのか否かが判断される。企業の名称が含まれたテキストが抽出されたのか否かに基づき、NERアルゴリズムが適用されて該当記事が分析対象企業に関連するのか否かが判断されるが、図4のように「ACCEPT」または「REJECT」のような可否形式で結果が導出される。
前記のように、NERアルゴリズムによると、選別されたニュース記事それぞれに対する文脈またはテーマが識別されて、識別された文脈またはテーマが分析対象企業に関連するのか否かが判断され、特定企業の名称が該当企業を称せず他の意味として使用されているのか否かが判断される。
図5は、本発明の一実施例による債務不履行予測装置100が分析対象記事に対する危険レベルを算出するにあたって使用する独立変数を選択する過程を示す図である。
債務不履行予測装置100は、図3及び図4を介し、上述した方式を介して分類された分析記事に対する分析を行うにあたって、マシンラーニングアルゴリズムを活用する。債務不履行予測装置100は、特定のマシンラーニングアルゴリズムを採択し分析対象記事の一部を学習用データとして設定した後、それに対する分析を行って危険算出アルゴリズムを導出する。この過程で使用されるマシンラーニングアルゴリズムは、回帰分析または項目化分析方式を活用する。
図5を参照すると、債務不履行予測装置100は、多様な方式を介して危険レベルの算出に使用する独立変数を選択する。危険レベルの算出に使用される独立変数は、ニュース記事に含まれる文または単語の少なくとも一部を含む。
一実施例によると、債務不履行予測装置100は、ニュース記事に含まれる単語をn−gram形式に分類して選択するが、多様な特徴選択(Feature Selection)方式を介して単語を選択してもよい。また、単語がニュース記事で登場する頻度によって計算される希少性に基づいて、危険レベルを算出するにあたって独立変数として使用される単語が選択されてもよい。
図5は、多様な方式で独立変数が選択された際の結果値を示す。図5の右側のグラフにおいて、横軸は独立変数の選択が異なるように行われている方式を示し、棒グラフは各方式で使用されている独立変数の個数、線グラフは各方式別評価点数を示す。
図5を参照すると、1−3及び1−4方式から分かるように、独立変数の個数が大きくなると評価点数もそれに応じて上昇するが、このような方式では過剰適合(Overfitting)の問題が発生する恐れがあり、非常に過大な独立変数の数を処理する方式はコンピューティングシステムのリソースを過度に要求する恐れがある。よって、3−1方式と3−2方式に示したように、適切な数の独立変数が選定されれば、それによって適切な評価点数が過剰適合の問題を起こせず算出される。
図6は、本発明の一実施例による債務不履行予測装置100が分析対象記事に対する危険レベルの算出に利用するマシンラーニングアルゴリズムを選択する過程を示す図である。
図6を参照すると、債務不履行予測装置100は、多様な種類のマシンラーニングアルゴリズムを採択して分析対象記事を分析し、分析結果に基づいて危険算出アルゴリズムを導出する。一実施例によると、マシンラーニングアルゴリズムは回帰分析または項目化分析を利用する。マシンラーニングアルゴリズムの種類は、図6に示したように、MLP Regression、Logistic Regression、Decision Tree、Random Forest、Adaboost Classifier、SVM(Support Vector Machine)などを含む。但し、債務不履行予測装置100が採択して使用し得るマシンラーニングアルゴリズムの種類が前記例に限らないことはもちろんである。
図6には、多様な種類のマシンラーニングアルゴリズムを介して分析対象記事を分析した結果をAUC及びジニ係数(Gini Value)を介して評価した数値を示されている。AUC(Area Under Curve)は統計学で判別モデルの性能を評価するために使用する計算方式であって、x軸をFalse Positive Rateと設定し、y軸をTrue Positive Rateと設定したグラフで表されるROC(Receiver Operating Characteristics)曲線の下の面積を意味する。AUCが最大値は1であり、高い値が出る程分類の性能が優れると解釈される。ジニ係数も統計学で判別モデルの性能を評価するために使用する計算方式のうち一つであり、グラフにおいてROC曲線と原点から始まってグラフを半分に分類する対角線の間の面積をAとし、ROC曲線の下の面積をBとすると、Aを(A+B)で割ることで求められる。AUCとジニ係数の関係は、AUCに2をかけた値から1を引くとジニ係数が算出される関係である。
債務不履行予測装置100は上述した評価結果に基づいて特定のマシンラーニングアルゴリズムを採択し、採択したアルゴリズムを介して導出された危険算出アルゴリズム利用して分析対象記事それぞれに対する危険レベルを算出する。
図7は、本発明の一実施例による債務不履行予測装置100が分析対象記事の危険レベルに基づいて企業の債務不履行を予測する過程を示す図である。
図7を参照すると、債務不履行予測装置100は、分析対象企業に関連する分析対象記事の危険レベルに基づいて債務不履行記事の割合を判断し、それによって債務不履行の危険性を計算する。図7を参照すると、大略の誤差は存在するが、時間が経つ程債務不履行記事の割合が次第に増加すると表示されており、債務不履行発生4ヶ月前のM−4時点からは債務不履行記事の割合とともに債務不履行危険性数値(D.D:Distance to Default)も増加すると示されている。図7において、円で示した部分701では一時的に債務不履行記事の割合が増加したが、債務不履行危険性の数値は大きな変動を示さないことが分かる。このように債務不履行予測装置100は、債務不履行記事の割合が一時的に増加するか減少しても、債務不履行危険性の数値がこれに過度に連携して変化しないように制御することができる。
図8は、本発明の一実施例による債務不履行予測装置100が特定企業に関する分析対象記事をグループ化する方式を示す図である。
図8を参照すると、複数の分析対象記事に対する危険レベルが数値された形態に示されており、分析対象記事のグループ化が危険レベルを基準に行われた形態が示されている。
本発明の一実施例によると、複数の分析対象記事は図8のように多様な数値の危険レベルで表されるが、これは危険レベルに基づいた任意の基準によって複数個のグループにグループ化される。図8では0.7、0.8、及び0.9の危険レベルが算出された分析対象記事が第1グループ801にグループ化されており、1.2及び1.3の危険レベルが算出された分析対象記事が第2グループ803にグループ化されており、0.3、0.4、及び0.5の危険レベルが算出された分析対象記事が第3グループ805にグループ化されている状態が示されている。このように、本発明の一実施例によると、危険レベルによる複数の区間が設定され、各区間に分析対象記事に属する記事が属するようになって、分析対象記事のグループ化が行われる。
図9は、本発明の一実施例による債務不履行予測装置100が分類された特性ベクトルを介して分析対象企業の債務不履行の危険性を計算する方式を説明する図である。
図9を参照すると、債務不履行予測装置100は、前記のように分析対象記事が危険レベルを基準にグループ化された後、各グループを示す特性ベクトル(Feature Vector)を生成する。特性ベクトルは、各グループに属する分析対象記事の危険レベルに基づいて計算される統計値をベクトルの元素として含む。分析対象記事の危険レベルに基づいて計算される統計値は、最小値(Minimum)、最大値(Maximum)、平均(Mean)、中央値(Median)、最頻値(mode)などを含む。
各グループに対する特性ベクトルを生成した後、債務不履行予測装置100は、生成された特性ベクトルを基に分析対象企業の債務不履行の危険性を計算する。一実施例によると、債務不履行予測装置100は、債務不履行の危険性を計算し、最終的に該当企業の債務不履行の危険性を可否形式で判断してもよい。
この過程で、債務不履行予測装置100は、特性ベクトルを意思決定木アルゴリズムを介して分類する。つまり、特性ベクトルが有する多様な種類の特性に基づいて特性ベクトルが分類されるが、その分類結果に基づいて、分析対象企業の債務不履行危険性の予測値が計算され、債務不履行危険性予測の信頼性も計算される。
一実施例によると、債務不履行予測装置100は、意思決定木アルゴリズムを介して債務不履行危険性の予測値を計算するにあたって、各クラスの確率分布値に基づく。例えば、意思決定木アルゴリズムの同じ枝(branch)内で同じクラスが出る確率、つまり、データの分類に利用される特性ベクトルが特定クラスに分類される確率を基に債務不履行危険性の予測値を計算する。
債務不履行予測装置100は、債務不履行危険性の予測と共に危険性予測の信頼度も計算するが、これは意思決定木アルゴリズムによって特性ベクトルの全ての特性が検討されていない状態で債務不履行危険性の予測値が計算されたら、信頼度を減少させる形態に計算される可能性がある。例えば、特性ベクトルが意思決定木アルゴリズム上で分類される基準が10個であれが、その基準のうち一部のみが使用された状態で最終クラスの分類が完了されて債務不履行危険性の予測値が計算されたら、使用された基準の個数が少なく算定されることで信頼度が落ちる方式で信頼度の計算が行われる可能性がある。
図10は、本発明の一実施例による債務不履行予測装置100が意思決定木アルゴリズムを介して特性ベクトルを分類するのに利用する交差検証方式を説明する図である。
図10を参照すると、債務不履行予測装置100は、意思決定木アルゴリズムを介して特性ベクトルを分類するにあたって、交差検証方式を介して分類を行う。詳しくは、債務不履行予測装置100は、分析対象記事について算出された危険レベル情報を含むデータに基づいて、データをn個に分類した後、n個のデータ集合のうち一つの集合を試験用データに、残りの集合を学習用データ(Training setまたはLearning set)に使用することをn回繰り返す。このように、交差検証方式によると、繰り返す過程で試験用データとして使用するデータの集合が変更され続け、異なる試験用データ及び学習用データで分析をn回まで繰り返すようにことがきるようになる。
図11は、本発明の一実施例による債務不履行予測装置100の構成を示すブロック図である。
図11を参照すると、債務不履行予測装置100は、ニュース記事収集部110、分析企業選定部120、分析対象記事分類部130、危険レベル算出部140、特性ベクトル生成部150、債務不履行危険性予測部160、通信部170、貯蔵部180、及び制御部190を含んで構成される。
説明の便宜上、債務不履行予測装置100内でそれぞれの役割をする主体を…部の形態で表したが、それぞれの部分は債務不履行予測装置100内で動作するサブプログラムモジュールまたは制御部190を機能的に分類した構成である。このようなプログラムモジュールは、各動作を行うか、特定の抽象データ類型を行うルーティン、サブルーティン、プログラム、オブジェクト、コンポネント、データ構造などを包括する概念であるが、これに限らない。
ニュース記事収集部110は、インターネット上でニュース記事の収集を行う。このために、ニュース記事収集部110は、多様な種類の外部サーバ300に接続する。ニュース記事収集部110は、ウェブ上で発行されるニュース関連データに対してクローリングを行う方式でニュース記事を収集する。
一実施例によると、ニュース記事収集部110は、分析対象企業が選択されると、該当企業に関する記事のみを分類して収集する。ニュース記事収集部110は、このような企業を行うにあたって、後述する分析企業選定部120及び分析対象記事分類部130の機能を利用する。
分析企業選定部120は、分析対象となる企業を選択する。上述したように、ニュース記事収集部110は、分析企業選定部120が選択する企業に関する記事のみを収集し、後述する分析対象記事分類部130も分析企業選定部120が選択する企業に関する記事を分類する。一実施例によると、分析企業選定部120は複数の分析対象企業を選択してもよく、ユーザ端末機200から受信した企業情報に当たる企業を分析対象企業として選択してもよい。
分析対象記事分類部130は、収集したニュース記事のうち分析対象企業に関連するニュース記事を分析対象記事として分類する。このために、分析対象記事分類部130は一次的に分析対象企業の名称が含まれたニュース記事を選別し、選別されたニュース記事それぞれに対して分析対象企業に関連する記事であるのか否かを判断する。
分析対象記事分類部130は、分析対象企業の名称が含まれたニュース記事を選別するにあたって、形態素分析ライブラリを活用する。また、分析対象記事分類部130は、分析対象企業の名称が含まれたニュース記事が選別されると、選別されたニュース記事それぞれに関する文脈またはテーマを識別し、識別した文脈またはテーマが前記分析対象企業の情報に関連するのか否かを判断する。例えば、分析対象企業がおもちゃを製造する企業であり、該当企業の名称が含まれていて選別された記事のうち一つがこれには全く関係のない半導体に関する内容を含んでいれば、分析対象記事分類部130は該当記事を分析対象企業の情報とは関連しないと判断し、分析対象記事から除外する。
危険レベル算出部140は、分析対象記事分類部130が分類した分析対象記事それぞれに対する危険レベルを算出する。この過程で、危険レベル算出部140は特定マシンラーニングアルゴリズムを採択し、該当マシンラーニングアルゴリズムを利用して収集したニュース記事に関する回帰または項目化分析を行う。危険レベル算出部140は、回帰または項目化分析の結果から導出された危険算出アルゴリズムを利用して分析対象記事それぞれに対する危険レベルを算出する。
危険レベル算出部140は、分析対象企業に関するニュースだけでなく、ニュース記事収集部110が収集した全てのニュース記事に対して分析を行う。つまり、危険レベル算出部140は、マシンラーニングアルゴリズムを利用するにあたって、該当マシンラーニングアルゴリズムを学習させるべきであるため、学習用データとしてこのようなニュース記事を活用する。一実施例によると、危険レベル算出部140は、ニュース記事だけでなく、企業の債務不履行情報も管理する。企業の債務不履行情報は、債務不履行が発生した企業の情報と債務不履行の発生時点に関する情報を含む。
危険レベル算出部140は、マシンラーニングアルゴリズムを介して収集したニュース記事に対する分析を行うにあたって、債務不履行が発生した企業に関するニュース記事のみをその対象としてもよく、債務不履行が発生した企業に関するニュース記事に対して該当企業の債務不履行から一定時間以内に発行されたニュース記事のみを分析対象として選択してもよい。例えば、危険レベル算出部140は、特定企業に債務不履行が発生したら、債務不履行発生日以前の2年間に発行されたニュース記事のみを分析対象としてもよい。
このように、危険レベル算出部140が債務不履行が発生した企業に対して、企業の債務不履行発生前の一定時間以内に発行されたニュース記事のみをマシンラーニングアルゴリズムを介して分析し、分析結果によって導出された危険算出アルゴリズムを利用して分析対象記事それぞれに対する危険レベルを算出することで、危険レベル算出の正確度が向上される。つまり、危険レベル算出部140は、マシンラーニングアルゴリズムの学習を行うステップでは債務不履行が発生した事実が認知されている企業の記事を介して学習を行い、マシンラーニングアルゴリズムを介して導出された危険算出アルゴリズムを利用して債務不履行が現在まで発生していない分析対象企業のニュース記事それぞれに対する危険レベルを算出する。
特性ベクトル生成部150は、分析対象記事それぞれに対して算出された危険レベルを基準に分析対象記事のグループ化を行い、各グループを示す特性ベクトルを生成する。
特性ベクトルを生成150は、分析対象記事に対して算出された危険レベルの区間に応じて分析対象記事を複数のグループに分類し、各グループに含まれる分析対象記事の危険レベルの統計値に基づいてグループを示す特性ベクトルを生成する。
一実施例によると、特性ベクトル生成部150が特性ベクトルを生成するにあたって使用する分析対象記事の危険レベルの統計値は、危険レベル数値の平均、中央値、最頻値、最小値、最大値などを含む。特性ベクトルを生成部150は、このような統計値またはこれを活用して算出された他の数値を特性ベクトルの元素にして特性ベクトルを生成する。
一実施例によると、特性ベクトルを生成部150は、危険レベルを複数の区間に分類するにあたって、分析対象企業が属する産業の種類に応じて異なる方式で分類を行う。例えば、特性ベクトルを生成部150は、製造業、医療業、金融業、通信業などに産業を分類し、分析対象企業がどこに属するのかを捉えた後、各産業の種類に合わせて危険レベルの区間分類を行う。他の例として、特性ベクトルを生成部150は、分析対象企業が属する産業を製造業または非製造業に分類し、それによって危険レベルの各区間分類を行ってもよい。
債務不履行危険性予測部160は、分析対象企業に対して生成された複数の特性ベクトルに基づいて該当企業の債務不履行危険性の予測値を算出し、予測値の算出に関する信頼度を計算する。
一実施例によると、債務不履行危険性予測部160は、意思決定木アルゴリズムを介して特性ベクトルを分類することで債務不履行危険性の予測値を計算する。債務不履行危険性予測部160は、分析対象記事のグループに対して生成された特性ベクトルを含むデータをn個に分類した後、n個のデータ集合に対してn−Cross Validation方式で意思決定木を適用し、特性ベクトルの分類を行う。
債務不履行危険性予測部160は、意思決定木の上で各クラスの確率分布値を基に債務不履行危険性の予測値を計算する。また、債務不履行危険性予測部160は、債務不履行危険性予測の信頼度を計算するにあたって、債務不履行危険性の予測値が計算される過程で意思決定木アルゴリズムによって検討された特性の個数を基に、債務不履行危険性予測の信頼度を計算する。
通信部170は、債務不履行予測装置100がユーザ端末機200及び外部サーバ300との通信を行うようにする。通信部170が通信を行うために使用する通信網は、優先及び無線などのようなその通信様態を構わずに構成されてもよく、多様な種類の通信網で具現される。
貯蔵部180は、債務不履行予測装置100が動作する過程で活用するデータを保管する役割をする。例えば、貯蔵部180は、収集されるニュース記事のデータ及びそれに対する分析データを貯蔵し管理してもよい。
貯蔵部180は、例えば、メモリ(memory)、キャッシュ(cash)、バッファ(buffer)などを含み、ソフトウェア、ファームウェア、ハードウェア、またはこれらのうち少なくとも2つ以上の組み合わせからなる。一実施例によると、貯蔵部180はROM(Read Only Memory)の形態に具現される。
制御部190は、ニュース記事収集部110、分析企業選定部120、分析対象記事分類部130、危険レベル算出部140、特性ベクトル生成部150、債務不履行危険性予測部160、通信部170、及び貯蔵部180の間のデータの流れを制御する機能を行う。つまり、本発明による制御部190は、ニュース記事収集部110、分析企業選定部120、分析対象記事分類部130、危険レベル算出部140、特性ベクトル生成部150、債務不履行危険性予測部160、通信部170、及び貯蔵部180でそれぞれ固有の機能を行うように制御する。
図11において、ニュース記事収集部110、分析企業選定部120、分析対象記事分類部130、危険レベル算出部140、特性ベクトル生成部150、及び債務不履行危険性予測部160は、制御部190を機能的に分類した構成であるため、一つの制御部190に統合されて構成される。
図12は、本発明の一実施例による債務不履行予測装置100が分析対象記事の債務不履行危険性予測値を導出するための過程を示すフローチャートである。
図12を参照すると、債務不履行予測装置100はインターネット上でニュース記事に対する収集を行う(S1201)。このような収集ステップで蓄積されたニュース記事のデータは、後にマシンラーニングアルゴリズムの学習用データまたは試験用データとして使用されてもよく、分析対象企業として選択される企業に関するニュース記事のみが別途に分類されて債務不履行危険性の予測に使用されてもよい。
債務不履行予測装置100は、マシンラーニングアルゴリズムを介してニュース記事の分析を行い、危険算出アルゴリズムを導出する(S1203)。この過程で、債務不履行予測装置100は、多様な種類のマシンラーニングアルゴリズムを介してニュース記事の分析を行い、その結果を比較して特定のマシンラーニングアルゴリズムを採択する。債務不履行予測装置100は、ニュース記事のデータとは別に企業の債務不履行情報を収集して管理し、それに基づいてニュース記事の分析結果を評価する。
債務不履行予測装置100は、分析対象となる企業を選択し、該当企業に関するニュース記事を分析対象記事として分類する(S1205)。分析対象企業の選択はユーザによって行われ、選択情報がユーザ端末機200から債務不履行予測装置100に伝達される方式で行われてもよく、債務不履行予測装置100の管理者によって行われてもよい。債務不履行予測装置100は予め収集されたニュース記事のうち該当企業に関するニュース記事を分類してもよいが、インターネット上で該当企業に関するニュース記事を新たに検索して収集してもよい。債務不履行予測装置100は、形態素ライブラリを活用して分析対象企業の名称を含む記事のみを収集する。
債務不履行予測装置100は、分析対象となる企業を選択し該当企業に関するニュース記事を分析対象記事として分類するにあたって、形態素ライブラリを利用して収集された全体のニュース記事のうちから分析対象企業の名称を含むニュース記事のみを選別し、NERアルゴリズムを利用して選別された記事のうちから分析対象企業に関するニュース記事のみを分析対象記事として分類する。これとは異なって、債務不履行予測装置100は、収集ステップで分析対象企業の名称を含むニュース記事のみが収集されれば、それについてNERアルゴリズムを利用して分析対象企業に関するニュース記事のみを分析対象記事として分類してもよい。
債務不履行予測装置100は、分析対象記事を分類した後、S1203で導出された危険算出アルゴリズムを利用して分析対象記事それぞれに対する危険レベルを算出するS1207。
分析対象記事それぞれに対する危険レベルが算出されたら、債務不履行予測装置100は、算出された危険レベルを基準に分析対象記事をグループ化を行う(S1209)。一実施例によると、分析対象記事のグループ化は、各記事に対して算出された危険レベルが複数個の区間のうちどの区間に属するのかに基づいて行われる。
債務不履行予測装置100は、分析対象記事がグループ化された結果を活用して、分析対象記事のグループ別に特性ベクトルを生成するS1211。特性ベクトルが含む元素は、各グループに含まれる分析対象記事の危険レベルに基づいて計算される各種の統計値、またはこのような統計値を活用して算出された数値である。
債務不履行予測装置100は、最終的に、生成された特性ベクトルを基に分析対象企業の債務不履行情報の危険性を計算するS1213。分析対象企業の債務不履行危険性の計算は、意思決定木アルゴリズムを介して特性ベクトルを分類する過程を介して行われる。また、債務不履行予測装置100は、債務不履行危険性の予測値を計算する過程で債務不履行危険性予測の信頼度を別途に計算する。
このように、本発明の多様な実施例によると、特定企業に関するニュース記事の分析を介して該当企業の債務不履行の危険性を計算することができ、銀行はそれに基づいて企業に対する信用評価を行うことができるため、企業に対する貸出リスクの管理をより強化して行うことができる。また、多様なマシンラーニングアルゴリズムのうち債務不履行危険性の計算に適合したアルゴリズムが選択され、それぞれのニュース記事を介した危険レベルが独立して計算されるだけでなく、ニュース記事のグループ化を介して総体的な債務不履行の危険性が予測される。
本発明の実施例について説明した方法またはアルゴリズムのステップは、ハードウェアで直接具現されるか、ハードウェアによって実行されるソフトウェアモジュールで具現されるか、またはこれらの結合によって具現される。ソフトウェアモジュールは、RAM(Random Access Memory)、ROM、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、フラッシュメモリ(Flash Memory)、ハードディスク、着脱型ディスク、CD−ROM、または本発明が属する技術分野でよく知られている任意の形態のコンピュータで読み取り可能な記録媒体に常住してもよい。
これまで添付した図面を参照して本発明の実施例を説明したが、本発明が属する技術分野の通常の技術者は、本発明がその技術的思想や必須的特徴を変更せずも他の具体的な形態に実施され得ることを理解できるはずである。よって、上述した実施例は全ての面で例示的で、制限的ではないと理解すべきである。
100:債務不履行予測装置
200:ユーザ端末機
300:外部サーバ

Claims (10)

  1. コンピューティングシステムによって行われる、ニュース記事を基に企業の債務不履行の危険性を予測する方法において、
    インターネット上で複数のニュース記事を収集するステップと、
    分析対象となる企業を選択するステップと、
    収集した複数のニュース記事のうち分析対象企業に関連するニュース記事を分析対象記事として分類するステップと、
    前記分析対象記事それぞれに対する危険レベルを算出するステップと、
    算出された危険レベルを基準に前記分析対象記事のグループ化を行い、各グループを示す特性ベクトルを生成するステップと、
    生成された特性ベクトルを基に前記分析対象企業の債務不履行危険性を計算するステップと、を含む、企業の債務不履行危険性の予測方法。
  2. 前記分析対象記事それぞれに対する危険レベルを算出するステップは、
    特定マシンラーニングアルゴリズムを採択し、採択したマシンラーニングアルゴリズムを利用して収集したニュース記事に対して回帰または項目化分析を行った後、前記回帰または項目化分析を介して導出された危険算出アルゴリズムを利用し、前記分析対象記事それぞれに対する危険レベルを算出することである、請求項1に記載の企業の債務不履行危険性の予測方法。
  3. 収集したニュース記事に対して回帰または項目化分析を行うにあたって、債務不履行が発生した企業に関するニュース記事のうち、該当企業の債務不履行から一定時間以内に発行されたニュース記事のみを分析対象として選択するステップを更に含む、請求項2に記載の企業の債務不履行危険性の予測方法。
  4. 収集した複数のニュース記事のうち、分析対象企業に関連するニュース記事を分析対象記事として分類するステップは、
    前記分析対象企業の名称が含まれたニュース記事を選別するステップと、
    選別されたニュース記事それぞれに対して前記分析対象企業に関連する記事であるのかを判断するステップと、更にを含む、請求項1に記載の企業の債務不履行危険性の予測方法。
  5. 選別されたニュース記事それぞれに対して前記分析対象企業に関連する記事であるのかを判断するステップは、
    選別されたニュース記事それぞれに関する文脈またはテーマを識別し、識別した文脈またはテーマが前記分析対象企業の情報に関連するのか否かを判断するステップを更に含む、請求項4に記載の企業の債務不履行危険性の予測方法。
  6. 算出された危険レベルを基準に前記分析対象記事のグループ化を行って各グループを示す特性ベクトルを生成するステップは、
    前記分析対象記事に対して算出された危険レベルを基に危険レベルを複数の区間に分類し、それを介して前記分析対象記事のグループ化を行うステップを更に含む、請求項1に記載の企業の債務不履行危険性の予測方法。
  7. 前記危険レベルを複数の区間に分類するステップは、
    前記分析対象企業が属する産業の種類によって異なる方式で分類を行うことを特徴とする、請求項6に記載の企業の債務不履行危険性の予測方法。
  8. 生成された特性ベクトルを基に前記分析対象企業の債務不履行危険性を計算するステップは、
    グループ化が行われた分析対象記事の特性ベクトルを意思決定木アルゴリズムを介して分類した後、結果を基に前記分析対象企業の債務不履行危険性の予測値を算出するステップを更に含む、請求項1に記載の企業の債務不履行危険性の予測方法。
  9. グループ化が行われた分析対象記事の特性ベクトルを意思決定木アルゴリズムを介して分類するステップは、
    前記分析対象記事のグループに対して生成した特性ベクトルを含むデータをn個に分類した後、n個のデータ集合に対して交差検証(n−Cross Validation)方式で意思決定木(Decision Tree)アルゴリズムを適用して特性ベクトルを分類するステップを更に含む、請求項8に記載の企業の債務不履行危険性の予測方法。
  10. ニュース記事を基に企業の債務不履行危険性を予測するコンピューティングシステムにおいて、
    インターネット上で複数のニュース記事を収集するニュース記事収集部と、
    分析対象となる企業を選択する分析企業選定部と、
    収集した複数のニュース記事のうち分析対象企業に関連するニュース記事を分析対象記事として分類する分析対象記事分類部と、
    前記分析対象記事それぞれに対する危険レベルを算出する危険レベル算出部と、
    算出された危険レベルを基準に前記分析対象記事のグループ化を行い、各グループを示す特性ベクトルを生成する特性ベクトル生成部と、
    生成された特性ベクトルを基に前記分析対象企業の債務不履行危険性を計算する債務不履行危険性予測部と、を含む、コンピューティングシステム。

JP2019197263A 2018-12-12 2019-10-30 企業の債務不履行予測システム及びその動作方法 Active JP6783002B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020180159763A KR102168198B1 (ko) 2018-12-12 2018-12-12 기업 부도 예측 시스템 및 이의 동작 방법
KR10-2018-0159763 2018-12-12

Publications (2)

Publication Number Publication Date
JP2020095693A JP2020095693A (ja) 2020-06-18
JP6783002B2 true JP6783002B2 (ja) 2020-11-11

Family

ID=71071654

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019197263A Active JP6783002B2 (ja) 2018-12-12 2019-10-30 企業の債務不履行予測システム及びその動作方法

Country Status (6)

Country Link
US (1) US11481707B2 (ja)
EP (1) EP3726441A4 (ja)
JP (1) JP6783002B2 (ja)
KR (1) KR102168198B1 (ja)
CN (1) CN111557011A (ja)
WO (1) WO2020122487A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102168198B1 (ko) * 2018-12-12 2020-10-20 지속가능발전소 주식회사 기업 부도 예측 시스템 및 이의 동작 방법
CN113642819A (zh) * 2020-05-11 2021-11-12 上海华力集成电路制造有限公司 连环许容时间区段站点异常时产品自动调度装置和方法
US20220180232A1 (en) * 2020-12-08 2022-06-09 Intuit Inc. Forecasting based on bernoulli uncertainty characterization
KR102505632B1 (ko) * 2021-01-14 2023-03-03 사단법인 한국신용정보원 신용정보를 활용한 인공 지능 모형 기반 개인사업자 부도율 예측 방법 및 장치
WO2023097353A1 (en) * 2021-12-03 2023-06-08 Batnav Pty Ltd A method for curating information
CN116777608A (zh) * 2023-08-25 2023-09-19 北京佳格天地科技有限公司 基于大数据的农业金融风险监管系统、方法及存储介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5753164A (en) * 1980-09-17 1982-03-30 Mitsubishi Electric Corp Bus terminating system
JP2003216804A (ja) * 2002-01-24 2003-07-31 Teikoku Databank Ltd 定性データを使用した倒産確率予測システム
US7325755B2 (en) * 2004-09-02 2008-02-05 Green Industry Innovators, L.L.C. Rotary tool for spreading particulate materials and method of using the same
KR100771506B1 (ko) * 2006-02-13 2007-10-30 주식회사 디알에프앤 뉴스를 이용한 증권정보 제공시스템
KR20090001940A (ko) * 2007-05-29 2009-01-09 주식회사 신한은행 부실여신 거래 기업의 사전 선정 방법 및 시스템과 이를위한 기록매체
JP5084587B2 (ja) * 2008-03-31 2012-11-28 株式会社野村総合研究所 取引先リスク管理装置
US8266148B2 (en) 2008-10-07 2012-09-11 Aumni Data, Inc. Method and system for business intelligence analytics on unstructured data
US20120316916A1 (en) 2009-12-01 2012-12-13 Andrews Sarah L Methods and systems for generating corporate green score using social media sourced data and sentiment analysis
US8671040B2 (en) * 2010-07-23 2014-03-11 Thomson Reuters Global Resources Credit risk mining
US11257161B2 (en) * 2011-11-30 2022-02-22 Refinitiv Us Organization Llc Methods and systems for predicting market behavior based on news and sentiment analysis
US9400826B2 (en) 2013-06-25 2016-07-26 Outside Intelligence, Inc. Method and system for aggregate content modeling
AU2016298790A1 (en) * 2015-06-11 2017-11-23 Financial & Risk Organisation Limited Risk identification and risk register generation system and engine
KR101741509B1 (ko) 2015-07-01 2017-06-15 지속가능발전소 주식회사 뉴스의 데이터마이닝을 통한 기업 평판 분석 장치 및 방법, 그 방법을 수행하기 위한 기록 매체
KR101599675B1 (ko) 2015-07-02 2016-03-03 한국기업데이터 주식회사 빅 데이터 기술에 기반한 기업 뉴스 검색 기술을 이용한 기업 신용 위험도 예측 장치 및 방법
WO2017159676A2 (en) * 2016-03-14 2017-09-21 Jeol Ltd., Inductive coupling in multiple resonance circuits in a nuclear magnetic resonance probe and methods of use
US11195401B2 (en) * 2017-09-27 2021-12-07 Johnson Controls Tyco IP Holdings LLP Building risk analysis system with natural language processing for threat ingestion
KR102168198B1 (ko) * 2018-12-12 2020-10-20 지속가능발전소 주식회사 기업 부도 예측 시스템 및 이의 동작 방법
KR102105319B1 (ko) * 2019-09-20 2020-04-28 지속가능발전소 주식회사 Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법
WO2021113475A1 (en) * 2019-12-03 2021-06-10 Zendrive, Inc. Method and system for risk determination of a route

Also Published As

Publication number Publication date
US11481707B2 (en) 2022-10-25
KR20200075120A (ko) 2020-06-26
WO2020122487A1 (ko) 2020-06-18
JP2020095693A (ja) 2020-06-18
EP3726441A1 (en) 2020-10-21
KR102168198B1 (ko) 2020-10-20
US20200193340A1 (en) 2020-06-18
EP3726441A4 (en) 2021-02-17
CN111557011A (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
JP6783002B2 (ja) 企業の債務不履行予測システム及びその動作方法
WO2023279696A1 (zh) 业务风险客群的识别方法、装置、设备及存储介质
JP2021504789A (ja) Esg基盤の企業評価遂行装置及びその作動方法
Inti et al. Application of fuzzy preference–analytic hierarchy process logic in evaluating sustainability of transportation infrastructure requiring multicriteria decision making
CN111738331A (zh) 用户分类方法及装置、计算机可读存储介质、电子设备
KR102330423B1 (ko) 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템
Gu et al. [Retracted] Application of Fuzzy Decision Tree Algorithm Based on Mobile Computing in Sports Fitness Member Management
Xu et al. A hybrid interpretable credit card users default prediction model based on RIPPER
CN112561685A (zh) 客户的分类方法和装置
Westerski et al. Prediction of enterprise purchases using Markov models in procurement analytics applications
Khademolqorani et al. A hybrid analysis approach to improve financial distress forecasting: Empirical evidence from Iran
Mouronte-López Modeling the public transport networks: A study of their efficiency
Papoušková et al. Modelling loss given default in peer-to-peer lending using random forests
Perez-Valiente et al. Identification of reservoir analogues in the presence of uncertainty
Kaczmarek Construction elements of bankruptcy prediction models in multi-dimensional Early Warning Systems
Tsai et al. Simulation optimization in security screening systems subject to budget and waiting time constraints
KR102409019B1 (ko) 금융 거래 위험 평가 시스템과 방법 및 이를 위한 컴퓨터 프로그램
JP2020140521A (ja) 人的判断の予測装置、予測プログラム及び予測方法
CN111654853B (zh) 一种基于用户信息的数据分析方法
US11449743B1 (en) Dimensionality reduction for statistical modeling
Zang Construction of Mobile Internet Financial Risk Cautioning Framework Based on BP Neural Network
Kazemi et al. Estimation of optimum thresholds for binary classification using genetic algorithm: An application to solve a credit scoring problem
Guo et al. Selection of suppliers based on rough set theory and VIKOR algorithm
Wang et al. A knowledge discovery case study of software quality prediction: Isbsg database
Nawaiseh et al. Financial Statement Audit Utilising Naive Bayes Networks, Decision Trees, Linear Discriminant Analysis and Logistic Regression

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191030

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200925

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201014

R150 Certificate of patent or registration of utility model

Ref document number: 6783002

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250