KR20200115369A - 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템 - Google Patents

이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템 Download PDF

Info

Publication number
KR20200115369A
KR20200115369A KR1020200037979A KR20200037979A KR20200115369A KR 20200115369 A KR20200115369 A KR 20200115369A KR 1020200037979 A KR1020200037979 A KR 1020200037979A KR 20200037979 A KR20200037979 A KR 20200037979A KR 20200115369 A KR20200115369 A KR 20200115369A
Authority
KR
South Korea
Prior art keywords
default
company
information
deep learning
financial
Prior art date
Application number
KR1020200037979A
Other languages
English (en)
Other versions
KR102330423B1 (ko
Inventor
조진삼
Original Assignee
조진삼
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 조진삼 filed Critical 조진삼
Publication of KR20200115369A publication Critical patent/KR20200115369A/ko
Application granted granted Critical
Publication of KR102330423B1 publication Critical patent/KR102330423B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템은, 부도 기업의 재무제표 정보를 수집하고, 상기 부도 기업의 재무제표 정보를 이용하여 딥러닝 부도예측 모델을 훈련하고, 상기 딥러닝 부도예측 모델을 이용하여 의뢰 기업의 재무제표 정보에 대한 부도 예측 정보를 제공할 수 있다.

Description

이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템{ONLINE DEFAULT FORECASTING SYSTEM USING IMAGE RECOGNITION DEEP LEARNING ALGORITHM}
아래의 설명은 온라인 상에서 제공된 재무제표를 토대로 당해 기업의 부도 예측 가능성을 제공하는 기술에 관한 것이다.
1960년대 이후 꾸준히 회계정보를 활용한 부도예측기법이 시도되어 왔는데, 먼저, 비버(William Beaver)는 1966년 프로파일 분석(Profile Analysis)을 발표했다. 비버의 연구는 1954년부터 1964년까지를 연구설정기간으로 하고, 파산, 사채 원금의 미지급, 부도, 우선주 배당금의 미지급을 도산으로 정의하였다. 이를 통해 도산기업과 생존기업 간에 통계적으로 유의한 평균값이 차이가 나는 재무비율이 무엇인지를 파악하는 형태로 부도예측 모델을 수립하였다. 비버의 연구는 일변량 모형으로서 기업의 도산을 예측하기 위해 한번에 하나씩 재무제표비율을 사용한다.
그러나, 일변량 연구로는 예측의 정확도를 향상시킬 수 없고, 다양한 변수간의 복합적인 효과로 나타나는 기업부도 현상을 설명하기 힘들다. 즉, 일변량 분석은 파산을 예측하는데 있어서 개별 재무제표비율의 상대적인 중요성을 측정하거나 또는 이를 결합하는 수단을 제공하지는 못한다. 예를 들어, 유동비율과 부채비율이 높은 기업과 유동비율과 부채비율이 낮은 기업 중에서 어느 기업이 파산위험이 더 높은지에 대해서 일변량 분석은 어떤 결과도 제공하지 못한다.
이후, 다변량 판별분석이 일종인 알츠만의 z-score를 시작으로 본격적인 다변량 모형의 개발이 이뤄졌다. 이는 판별분석의 일종으로서 그의 모형에서는 5개의 재무비율을 사용하며 모형의 설명력을 최대화하기 위해 각 비율에 대해 가중치가 부여되며, Z 점수라는 전반적인 판별점수가 계산된다. 이러한 장점에도 불구하고 다변량 분석은 다음과 같은 한계를 갖는다. 첫째, 일변량 분석에서와 마찬가지로 다변량 분석이 파산과 관련한 모든 관련된 재무제표비율을 포함하고 있다고 확신할 수 없다. 둘째, 파산한 기업과 그렇지 않은 기업을 구별할 수 있는 점수를 주관적으로 판단해야 한다. 셋째, 비상장기업의 경우에는 주주지분의 시장가치를 알 수 없기 때문에 적용이 불가능하다.
파산을 예측하는 연구의 방향은 1980년대와 1990년대 초에 걸쳐서 로짓 모형(logit model)을 사용하는 것으로 발전하고 있다. 로짓 분석은 다변량 분석과는 달리 파산가능성을 확률로 나타내기 때문에 보다 이해하기 쉽다는 장점이 있다. 1960년대의 비버의 연구와 다른 점은 다양한 변수를 독립변수로 활용한다는 점이다. 중회귀분석의 일종인 로지스틱 회귀분석은 종속변수가 두 개의 반응범주로 나타나는 질적변수(이변량)인 경우에 사용되는 회귀분석 방법인 로짓(logit) 회귀식을 이용하는 것이며, 계산된 로짓을 확률로 변환할 경우 그 값이 0.5를 넘을 경우 부도기업으로 분류되는 것이다.
최근에는 이러한 로짓 모형을 다수 생성한 후 각 모형의 부도 또는 생존 판단을 집계하여 다수결로 부도를 예측하는 랜덤 포레스트(random forest) 등 앙상블(ensemble) 기법이 주류를 이루고 있다. 현재까지 개발된 기법 중에는 가장 높은 부도예측율을 나타내고 있다.
이상을 정리해보면, 그간의 부도예측 기법은 독립변수의 양을 늘리는 방향과 새로운 알고리즘을 개발하는 방식 등 크게 2가지 방향으로 전개되어 왔다. 그러나 최근 적용사례가 많아진 랜덤 포레스트 기법조차도 실상은 각 모형에서 이용하는 독립변수의 양은 제한적이며, 다만 저마다의 모형에서 다른 독립변수를 부분적으로 활용함으로써 간접적으로나마 전체 독립변수를 모두 포괄하고 있는 것이다. 이용 가능한 모든 변수를 부도예측에 활용하고자 하는 시도는 기업의 재무비율 중에서 어떤 요인으로 말미암아 기업이 부도에 이르게 되었는지를 확정적으로 단정하기 어렵기 때문이다. 따라서 전체 변수를 모두 고려하여 이들 간의 복합적인 상호작용에 의한 부도 발생을 예측하는 혁신적인 방식의 접근이 필요한 이유다.
본 발명은 재무비율 및 비재무정보(거시경제 지표, 주가관련 지표, 회계감사, 기타의 외부평가 지표 등)를 포괄하여 독립변수로 삼고, 이들의 다년간 변화양상을 이미지 패턴으로 인식하여 장단기 부도가능성을 판단하는 알고리즘으로서 이미지 인식에 사용되는 딥러닝 기법을 부도예측에 맞게 구성하는 방식과 절차, 그리고 이를 온라인 서비스로 제공할 수 있는 모델을 제공한다.
컴퓨터 시스템에 있어서, 메모리에 포함된 컴퓨터 판독 가능한 명령을 실행하도록 구현되는 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 부도 기업의 재무제표 정보를 수집하는 과정; 상기 부도 기업의 재무제표 정보를 이용하여 딥러닝 부도예측 모델을 훈련하는 과정; 및 상기 딥러닝 부도예측 모델을 이용하여 의뢰 기업의 재무제표 정보에 대한 부도 예측 정보를 제공하는 과정을 처리하는 컴퓨터 시스템을 제공한다.
일 측면에 따르면, 상기 적어도 하나의 프로세서는, 기업의 재무제표 정보를 보유한 기관의 데이터베이스 시스템과 연동하여 상기 데이터베이스 시스템으로부터 상기 부도 기업의 재무제표 정보를 수집할 수 있다.
다른 측면에 따르면, 상기 적어도 하나의 프로세서는, 상기 부도 기업의 재무제표 정보를 이미지 인식용 딥러닝 모델에서 인식 가능한 2차원 평면 상의 이미지 픽셀 정보로 전처리할 수 있다. 또한, 재무제표 정보에 추가하여 기업 활동과 관련된 거시경제 지표, 주가관련 지표, 회계감사 또는 기타의 외부평가 지표 등을 별도의 채널(channel) 정보로 2차원 이미지 데이터의 각 픽셀에 추가할 수 있다. 이는 마치 2차원의 이미지라 하더라도 하나의 픽셀이 RGB 등 3개의 값을 가지는 채널 정보를 가지고 있어서 사실상 3차원의 정보를 가지는 것과 유사한 원리다.
또 다른 측면에 따르면, 상기 적어도 하나의 프로세서는, 1년 단위 재무제표 정보 또는 적어도 2년 이상 연속된 재무제표 정보를 이용하여 1년 뒤의 부도 가능성 예측뿐만 아니라 2년 또는 그 이상의 중장기 예측에도 정확성이 향상된 부도예측 엔진을 생성할 수 있다.
또 다른 측면에 따르면, 상기 적어도 하나의 프로세서는, 상기 부도 기업의 연도 별 재무제표 정보를 입력으로 하고 부도 여부, 부도발생 예상시점, 부도 유형 중 적어도 하나에 대한 라벨링(labeling)을 출력으로 하여 딥러닝 모델을 훈련할 수 있다.
또 다른 측면에 따르면, 상기 적어도 하나의 프로세서는, GAN(generative adversarial network) 모델을 이용하여 상기 부도 기업의 일부 누락된 재무제표 정보를 생성할 수 있다. 가상의 이미지 생성에 사용되는 GAN 모델을 이용하여 부도예측 판별대상 기업의 재무비율 정보가 일부 누락이 있어도, 학습된 내용에 따라 누락부분을 생성할 수 있다. 이를 통해 일부 누락된 재무제표가 입력되거나 불충분한 재무비율정보가 입력되더라도 부도예측이 가능하게 하는 것 및 부도기업의 재무제표 전체를 가상으로 생성하여 CNN 등 다양한 딥러닝 모델에 입력하여 부도기업 판별력 향상을 도모할 수 있다. GAN 모델을 활용하여 일부 누락된 재무비율정보의 복원에 그치지 않고 부도기업과 유사한 가상기업의 재무비율 전체를 생성할 수 있다. 이러한 가상의 부도기업 재무비율 정보를 CNN기반의 딥러닝 모델에 입력하여 부도예측 엔진의 학습에 사용하도록 한다. 가상 기업의 재무비율 정보는 부도기업의 재무비율과 유사할 뿐 실제 부도기업은 아니므로, CNN은 이를 부도기업으로 분류하지 않도록 학습하도록 한다. 이처럼 GAN과 CNN은 서로를 속이거나 속지 않아야 하는 적대적 관계에 있도록 목적함수(loss function)를 설정하고, 그에 따라 GAN과 CNN이 상호 경쟁적으로 학습하는 과정에서 CNN의 부도예측 능력은 더욱 강화되는 효과를 기대할 수 있다.
그리고, GAN 모델을 이용하여 잠재공간(latent space) 상에서 잠재변수들 간의 연산과정(arithmetic process)을 통해 부도예측을 추정하는 모델을 생성할 수 있다. 학습이 완료된 데이터 잠재공간 상에서 잠재변수들 간의 다양한 연산과정을 통해, 새롭게 합성된 잠재변수벡터를 구할 수 있는 GAN의 특성을 부도예측에 이용한다. 일례로, 학습이 완료된 중소기업 부도예측 잠재변수 벡터가 있다면, 중소기업의 일반적인 특성을 제거하고, 스타트업의 일반적인 특성을 가산하는 형태로 스타트업의 부도를 추정할 수 있는 대용(proxy) 모델을 도출할 수 있다. 이는 신생 스타트업 등 아직 부도 데이터가 축적되지 않아 부도율 예측이 불가능한 경우에 부도율을 추정할 수 있는 모델로 활용이 가능하다.
또 다른 측면에 따르면, 상기 적어도 하나의 프로세서는, RNN(recurrent neural network) 모델을 이용하여 상기 딥러닝 부도예측 모델의 딥러닝 모델 파라미터(model parameter)와 하이퍼 파라미터(hyper parameter)를 수정할 수 있다.
첫째, 기업의 재무비율지표 전체를 모두 포괄하여 직접적으로 부도 예측에 활용함으로써 높은 부도예측 정확도를 기대할 수 있다.
둘째, 기업의 탄생에서부터 지속적으로 재무비율지표를 수집하고, 전체 수명주기 내에서 보여주는 재무비율지표의 변화양상을 마치 이미지의 변화로 인식하여, 딥러닝이 부도예상기업에 해당하는지를 알려주므로 부도예측의 조기경보가 가능하다. 이는 부도 직전에서야 예측이 가능한 현재의 부도예측시스템의 예측기간에 비해 월등한 능력을 기대할 수 있다. 이는 정보를 인위적으로 선별하거나 축약하여 입력하지 않고, 재무제표 정보 전체를 입력하여, 다양한 지표 간의 영향력 관계를 패턴화 하여 이미지 형태 그 자체로서 분석하는 알고리즘을 적용하기 때문이다. 일례로 부도기업의 재무비율에 있어서 특정연도에만 나타나고 이후에는 나타나지 않는 특이한 재무비율이 있거나, 부도시점보다 훨씬 이전에 발생하는 재무비율상의 고유 패턴 있는 경우에도 입력데이터. 전체를 하나의 연속적인 이미지로 판단하고 패턴을 발견해 나가는 이미지 인식 딥러닝에 있어서는 전혀 문제가 되지 않는다.
셋째, 스타트업 및 비상장기업과 같은 재무비율정보가 일부만 존재하는 기업에 대한 부도예측에 대해서도 부도예측이 가능하다. 일례로 이미지 인식기법 중의 하나인 GAN(generative adversarial network)의 경우 일부 누락된 이미지 픽셀에 대한 생성과 조합이 가능하므로 이를 통해 부도예측알고리즘의 탐지에 활용할 수 있다.
이처럼, 기업의 부도예측의 정확도를 높이고, 예측기간을 늘려서 조기경보를 가능케 하고, 부도예측 대상기업을 스타트업이나 비상장기업과 같은 재무비율지표의 부분적 확보기업에까지도 늘림으로써 부도예측의 범위를 늘릴 수 있다는 장점으로 인해 부도예측의 활용성을 크게 높일 수 있다.
특히, 스타트업이나 비상장기업의 경우, 마땅한 부도예측 데이터 확보가 힘들어서 이들 기업은 대출심사에서 기업의 성장가능성에도 불구하고 대출이 거절되는 경우가 많다. 따라서 부분적 재무정보 하에서도 부도를 예측을 할 수 있는 본 특허로 말미암아 이들 기업에 대한 부도예측과 대출의 승인, 더 나아가 스타트업 활성화까지 기대할 수 있다.
이와 같은 방식으로, 현 시장 내에서 존재하는 스타트업이 온라인으로 일정 샘플 수 이상 평가에 참여하면 당해 기업이 실제로 부도가 나서 실제 부도율을 구해야 하는 불편을 피할 수 있고 현시점에서 즉시 부도율 산정이 가능하다.
도 1은 본 발명의 일실시예에 있어서 컴퓨터 시스템의 내부 구성의 일례를 설명하기 위한 블록도이다.
도 2는 본 발명의 일 실시예에 있어서 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템의 내부 구성을 설명하기 위한 블록도이다.
도 3은 본 발명의 일 실시예에 있어서 이미지 픽셀과 재무비율 정보의 유사성을 설명하기 위한 예시 도면이다.
도 4는 본 발명의 일 실시예에 있어서 GAN을 이용한 재무제표 정보의 누락된 부분을 복원하는 원리를 설명하기 위한 예시 도면이다.
도 5 내지 도 9는 본 발명의 일 실시예에 있어서 부도예측 훈련 과정을 설명하기 위한 예시 도면이다.
도 10은 본 발명의 일 실시예에 있어서 딥러닝 모델을 이용하여 부도예측 결과를 제공하는 과정을 설명하기 위한 예시 도면이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
본 발명의 실시예들은 온라인 상에서 기업이 제공하는 자사의 재무제표를 토대로 부도 예측 가능성을 제공하는 기술에 관한 것이다. 온라인 상에서 기업이 제공하는 자사의 재무제표를 토대로 부도 예측 가능성을 제공하는 것이며, 이를 위해 이미지 인식에 활용되는 인공지능 기술을 응용하는 기술이다. 주로 이미지 인식에 활용되는 인공지능 기법의 하나인 딥러닝 기술은 다수의 입력데이터를 통해 이미지를 분류하는 메커니즘을 스스로 학습하는 방식이다. 종래에는 이를 이미지 인식에 활용했으나, 본 실시예에서는 이를 응용하여 기업의 부도예측에 이용할 수 있는 방식을 온라인 상에서 제공하는 것이다.
본 실시예에서는 재무비율 독립변수를 모두 포괄하면서 이들 간의 패턴을 인공지능이 인식하는 알고리즘으로서 이미지 인식에 사용되는 딥러닝 기법을 도입하는 방식과 절차, 그리고 이를 온라인으로 이용할 수 있는 모델을 제공한다.
이미지 인식에 사용되는 딥러닝 알고리즘의 기본적인 형태는 각 픽셀값 전체를 모두 고려하되, 부분적으로 추상화를 실시하여 정보를 요약하고, 이를 다시 합산하여 추상화를 반복하는 형태로 정보를 추출하는 과정을 담고 있다. 이러한 추상성에 기초하여 기업의 재무제표로부터 부도를 결정짓는 핵심 요인을 추출하여 부도예측정보를 IT 인프라와 유무선 장치를 이용하여 온라인으로 실시간으로 제공한다. 이를 위하여, 기업의 매년도 재무제표를 다년간 저장하여 2차원의 시계열 정보로 생성하고, 이를 이미지 인식 딥러닝 알고리즘에서 인식 가능한 2차원 평면 상의 이미지 픽셀정보로 활용할 수 있다. 아울러 비재무정보(거시경제 지표, 주가관련 지표, 회계감사, 기타의 외부평가 지표 등)도 시계열 정보로 저장하여 각 이미지 픽셀에 추가되는 채널정보 형태로 이미지 인식 딥러닝 알고리즘에서 활용하게 된다. 이를 통해 이미지 인식 딥러닝 모델이 기업의 부도판별에 최적화된다.
본 실시예에서는 획일화된 판단기준과 단기적인 예측에 머무르고 있는 기업부도예측의 한계를 극복하고자 아래와 같은 해결과제를 제시하고 있다.
첫째, 기업의 부도예측에 있어서 중장기적인 부도예측이 가능토록 하고, 둘째, 부도 예측의 정확도를 높이며, 셋째, 상장기업 이외에도 개인사업자나 스타트업의 경우에는 다양한 업종과 기업규모 등 특성에 따른 맞춤형으로 세분화된 부도예측 모델을 개발하고자 한다. 넷째, 중장기 부도예측이 관측되면, 이를 역으로 활용하여 부도기업의 패턴을 따르지 않도록 예방적인 컨설팅 정보를 해당 기업에게 하는 것이다. 이상의 서비스를 IT기반의 모바일 및 PC솔루션으로 구축하여 고객에게 관련정보를 온라인으로 공급하는 것을 목표로 한다.
도 1은 본 발명의 일실시예에 있어서 컴퓨터 시스템의 내부 구성의 일례를 설명하기 위한 블록도이다. 예를 들어, 본 발명의 실시예들에 따른 온라인 부도 예측 시스템이 도 1의 컴퓨터 시스템(100)을 통해 구현될 수 있다. 도 1에 도시한 바와 같이, 컴퓨터 시스템(100)은 온라인 부도 예측 방법을 실행하기 위한 구성요소로서 프로세서(110), 메모리(120), 영구 저장 장치(130), 버스(140), 입출력 인터페이스(150), 및 네트워크 인터페이스(160)를 포함할 수 있다.
프로세서(110)는 온라인 부도 예측을 위한 구성요소로서 명령어들의 시퀀스를 처리할 수 있는 임의의 장치를 포함하거나 그의 일부일 수 있다. 프로세서(110)는 예를 들어 컴퓨터 프로세서, 이동 장치 또는 다른 전자 장치 내의 프로세서 및/또는 디지털 프로세서를 포함할 수 있다. 프로세서(110)는 예를 들어, 서버 컴퓨팅 디바이스, 서버 컴퓨터, 일련의 서버 컴퓨터들, 서버 팜, 클라우드 컴퓨터, 컨텐츠 플랫폼 등에 포함될 수 있다. 프로세서(110)는 버스(140)를 통해 메모리(120)에 접속될 수 있다.
메모리(120)는 컴퓨터 시스템(100)에 의해 사용되거나 그에 의해 출력되는 정보를 저장하기 위한 휘발성 메모리, 영구, 가상 또는 기타 메모리를 포함할 수 있다. 메모리(120)는 예를 들어 랜덤 액세스 메모리(RAM: random access memory) 및/또는 다이내믹 RAM(DRAM: dynamic RAM)을 포함할 수 있다. 메모리(120)는 컴퓨터 시스템(100)의 상태 정보와 같은 임의의 정보를 저장하는 데 사용될 수 있다. 메모리(120)는 예를 들어 온라인 부도 예측을 위한 명령어들을 포함하는 컴퓨터 시스템(100)의 명령어들을 저장하는 데에도 사용될 수 있다. 컴퓨터 시스템(100)은 필요에 따라 또는 적절한 경우에 하나 이상의 프로세서(110)를 포함할 수 있다.
버스(140)는 컴퓨터 시스템(100)의 다양한 컴포넌트들 사이의 상호작용을 가능하게 하는 통신 기반 구조를 포함할 수 있다. 버스(140)는 예를 들어 컴퓨터 시스템(100)의 컴포넌트들 사이에, 예를 들어 프로세서(110)와 메모리(120) 사이에 데이터를 운반할 수 있다. 버스(140)는 컴퓨터 시스템(100)의 컴포넌트들 간의 무선 및/또는 유선 통신 매체를 포함할 수 있으며, 병렬, 직렬 또는 다른 토폴로지 배열들을 포함할 수 있다.
영구 저장 장치(130)는 (예를 들어, 메모리(120)에 비해) 소정의 연장된 기간 동안 데이터를 저장하기 위해 컴퓨터 시스템(100)에 의해 사용되는 바와 같은 메모리 또는 다른 영구 저장 장치와 같은 컴포넌트들을 포함할 수 있다. 영구 저장 장치(130)는 컴퓨터 시스템(100) 내의 프로세서(110)에 의해 사용되는 바와 같은 비휘발성 메인 메모리를 포함할 수 있다. 영구 저장 장치(130)는 예를 들어 플래시 메모리, 하드 디스크, 광 디스크 또는 다른 컴퓨터 판독 가능 매체를 포함할 수 있다.
입출력 인터페이스(150)는 키보드, 마우스, 음성 명령 입력, 디스플레이 또는 다른 입력 또는 출력 장치에 대한 인터페이스들을 포함할 수 있다. 구성 명령들 및/또는 온라인 부도 예측을 위한 입력이 입출력 인터페이스(150)를 통해 수신될 수 있다.
네트워크 인터페이스(160)는 근거리 네트워크 또는 인터넷과 같은 네트워크들에 대한 하나 이상의 인터페이스를 포함할 수 있다. 네트워크 인터페이스(160)는 유선 또는 무선 접속들에 대한 인터페이스들을 포함할 수 있다. 구성 명령들 및/또는 온라인 부도 예측을 위한 입력이 네트워크 인터페이스(160)를 통해 수신될 수 있다.
또한, 다른 실시예들에서 컴퓨터 시스템(100)은 도 1의 구성요소들보다 더 많은 구성요소들을 포함할 수도 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 예를 들어, 컴퓨터 시스템(100)은 상술한 입출력 인터페이스(150)와 연결되는 입출력 장치들 중 적어도 일부를 포함하도록 구현되거나 또는 트랜시버(transceiver), GPS(Global Positioning System) 모듈, 카메라, 각종 센서, 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수도 있다.
이하에서는 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템의 구체적인 실시예를 설명하기로 한다.
도 2는 본 발명의 일 실시예에 있어서 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템의 내부 구성을 설명하기 위한 블록도이다. 도 2는 온라인 부도 예측 시스템이 구현된 컴퓨터 시스템(100)의 프로세서(110)가 프로세서가 포함할 수 있는 구성요소의 예를 도시한 도면이다.
도 2에 도시한 바와 같이, 프로세서(110)는 수집모듈(201), 전처리모듈(202), 훈련모듈(203), 서비스모듈(204), 및 피드백모듈(205)를 포함할 수 있다. 이러한 프로세서(110)의 구성요소들은 적어도 하나의 프로그램 코드에 의해 제공되는 제어 명령에 따라 프로세서(110)에 의해 수행되는 서로 다른 기능들(different functions)의 표현들일 수 있다. 예를 들어, 프로세서(110)가 재무제표 정보를 수집하도록 컴퓨터 시스템(100)을 제어하기 위해 동작하는 기능적 표현으로서 수집모듈(201)이 사용될 수 있다.
프로세서(110) 및 프로세서(110)의 구성요소들은 도 3의 온라인 부도 예측 방법이 포함하는 단계들(S310 내지 S330)을 수행할 수 있다. 예를 들어, 프로세서(110) 및 프로세서(110)의 구성요소들은 메모리(120)가 포함하는 운영체제의 코드와 상술한 적어도 하나의 프로그램 코드에 따른 명령(instruction)을 실행하도록 구현될 수 있다. 여기서, 적어도 하나의 프로그램 코드는 온라인 부도 예측 방법을 처리하기 위해 구현된 프로그램의 코드에 대응될 수 있다.
수집모듈(201)은 기업 또는 개인사업자의 재무제표 정보를 온라인으로 수집할 수 있다. 수집모듈(201)은 법인 기업이나 개인 사업자의 재무제표 또는 재무비율 등을 포함하는 재무제표 정보를 수집할 수 있다. 수집모듈(201)은 기업의 재무제표 정보를 보유한 기관의 데이터베이스 시스템과 연동하여 해당 기관의 데이터베이스 시스템으로부터 부도 기업의 재무제표 정보를 수집할 수 있다.
전처리모듈(202)은 수집모듈(201)에서 수집된 재무제표 정보를 다양한 이미지인식용 딥러닝 모델에서 사용 가능한 형태로 전처리할 수 있다. 전처리모듈(202)은 각 기업의 재무제표 또는 재무비율을 이미지로 인식 가능하도록 2차원 시계열 정보로 변환할 수 있다. 딥러닝에 사용되는 이미지 픽셀의 RGB컬러값은 최대 최소값이 동일하다. 따라서, 각 재무비율지표의 변동범위를 고려하여 동일한 값으로 정규화하여 변환한다. 이는 이미지 픽셀의 RGB값을 재무비율지표값으로 대체하여 사용하는 딥러닝 기반의 부도예측에 있어서 일종의 전처리 작업에 해당된다. 또한, 전처리모듈(202)은 모델의 훈련과 선택을 위해서 훈련셋, 검증셋, 테스트셋으로 데이터를 나누는 역할도 담당한다.
훈련모듈(203)은 전처리모듈(202)에서 전처리된 재무제표 정보를 이용하여 부도 예측을 위한 딥러닝 모델을 훈련하는 것으로, 부도예측율을 높이도록 다양한 딥러닝 모델들의 모델 파라미터와 하이퍼 파라미터를 수정할 수 있다. 훈련모듈(203)은 전처리된 재무제표 정보를 이용하여 딥러닝 알고리즘이 딥러닝 모델 파라미터와 하이퍼 파라미터를 수정하도록 훈련함으로써 부도예측을 담당할 수 있다.
CNN과 같은 딥러닝 모델 내에는 예측의 정확도를 높이기 위한 다양한 파라미터가 존재한다. 훈련셋을 이용하여 딥러닝 모델 파라미터를 수정하며, 궁극적으로 모델의 예측도를 높일 수 있다. 아울러, 검증셋을 활용하여 훈련된 모델의 실제 예측성능을 검증할 수 있다. 첫째, CNN을 이용해서 부도의 예측기간을 늘리고, 사전예방을 돕는다. 이를 위해서는 다년도 재무제표를 입력으로 넣고, 부도발생 여부, 부도발생 예상시점, 다양한 부도유형(예컨대, 유동성 부족, 자본 잠식 등)을 라벨링해서 출력으로 하여 훈련한다. 따라서, 예측 결과로 단순이 부도 여부는 물론이고 부도 예측 시점이나 원인에 대해 확률을 제공할 수 있다. 둘째, GAN을 이용해서 판별 모델(D모듈)은 부도예측율을 높이고, 생성 모델(G모듈)은 단순한 기준이 아니라 잠재공간에서의 피처(feature) 연산에 의해 훈련셋에는 없는 기업유형(예: 신생스타트업)에 대한 판별여부를 유추할 수 있다. 또한, 훈련셋을 다양한 기준으로 분류하여 부도율을 조사하면 다양한 기준을 조합하여 여러가지 유형의 기업에 대한 부도발생 가능성을 추정할 수 있다. 따라서, 보다 상세한 기준으로 부도율을 예측할 수 있으며, 이를 통해 당장에 부도 데이터가 없어서 부도율 산정이 힘든 초기 신생기업에 대한 부도율 예측이나, 데이터가 있다 하더라도 좀더 다양한 기준에 의한 부도율 예측을 실시할 수 있어 은행대출시스템 등에서 기업에 대한 심사능력을 개선할 수 있다. 특히 SGAN, ACGAN은 부도/생존의 판별뿐만 아니라, 추가적인 one-hot vector형태로서 부도의 유형이나 기업의 규모 등으로 세분화하여 학습할 수 있고, 병행하여 생성 모델과 판별 모델의 경쟁적 학습에 의해 분류정확도를 더 높일 수가 있다.
GAN은 잠재공간에서의 연산을 통해서 새로운 엔진도 만들어 낼 수 있다. [부도난 기업 재무비율의 잠재공간 - 일반적인 기업 재무비율의 잠재공간 + 일반적인 스타트업 재무비율의 잠재공간 = 부도난 스타트업 재무비율 잠재공간]와 같이 스타트업이 비록 부도데이터가 축적되지 않아도 학습이 완료된 (이른바 잠재공간으로 축약된) 스타트업 부도의 전형적인 데이터를 산출할 수 있다.
하이퍼 파라미터 튜닝을 통해 모델 선택(model selection)을 구현할 수 있다. 하이퍼 파라미터는 딥러닝 모델에 있어서 레이어의 수와 같은 모델 구조를 결정하는 파라미터로서 이는 데이터의 종류와 특성에 따라 최적값을 찾아내는 것이다. 따라서, 본 실시예에에서는 테스트셋을 이용하여 하이퍼 파라미터를 확정하여 딥러닝 모델을 선택할 수 있다.
특히, 부분적으로 상실되거나 작성되지 못한 관계로 재무제표가 일부만 제공된 경우에, 또는 착오 또는 허위에 의해 잘못 작성된 재무제표가 존재하는 경우에 이를 추론하여 원본 데이터를 생성할 수 있다. 일례로, GAN의 경우 손상된 이미지나 모자이크 처리된 이미지를 원래 이미지로 복원하는 기능을 포함하고 있어 이를 재무제표의 생성과 수정에 활용할 수 있다.
서비스모듈(204)은 고객으로부터 재무제표 정보를 입력받아 훈련모듈(203)에서 훈련된 다양한 딥러닝 모델에 해당 고객의 재무제표 정보를 적용하여 해당 재무제표 정보에 따른 부도여부를 판별한 후 판별결과에 따른 부도예측(예방)정보를 통보할 수 있다. 서비스모듈(204)은 온라인 고객을 대상으로 모바일이나 PC 등의 IT 솔루션을 활용하여 부도예측 온라인 서비스를 제공할 수 있다. 이때, 서비스모듈(204)은 온라인 고객인 의뢰 기업이 부도 기업의 패턴을 따르지 않도록 기업경영 활동을 돕는 컨설팅 정보를 생성하여 제공할 수 있다.
피드백모듈(205)은 추후 기업의 실제 부도발생데이터를 확보하여 부도예측의 정확도를 점검할 수 있고, 점검 결과를 바탕으로 부도예측의 정확도를 향상하도록 수집과정, 전처리과정, 훈련과정을 수정할 수 있다. 피드백모듈(205)은 실제 기업부도결과를 반영하여 파라미터를 수정하는 역할을 한다. 일례로, RNN(recurrent neural network) 모델을 활용하여 이전 시점의 모델 파라미터와 하이퍼 파라미터를 기억하고 있다가, 향후 실제 부도발생 기업이 보고되면, 이를 온라인으로 수집하여 기존에 학습된 모델의 모델 파라미터와 하이퍼 파라미터를 수정하여 변화된 기업 환경 내에서 실제 부도발생의 패턴이 변화하더라도 이를 반영할 수 있는 자동화된 메카니즘을 구현할 수 있다.
도 3은 이미지 픽셀과 재무비율 정보의 유사성을 설명하기 위한 예시 도면이다.
도 3을 참조하면, 훈련모듈(203)에서의 훈련 대상인 부도 예측을 위한 딥러닝 모델의 일례로 CNN(convolution neural network)에 의해 각 연도별 재무비율 정보가 이미지 픽셀 값처럼 인식되어 정보가 축약될 수 있다.
미국 상장기업 데이터인 COMPUSTAT에 기록된 약 20,000개 기업 전체의 수명결정요인에 대한 실증분석자료로서 약 40년간(1095~2015)에 걸쳐 분석을 하였음에도 기업의 수명을 결정짓는 재무비율 지표가 여러 수명그룹 별로 공통적으로 영향을 미치고 있으며, 이러한 구조가 변함없이 안정적으로 존재한다. 이로써 재무비율지표는 기업의 수명에 미치는 영향력이 수명의 길고 짧음과 무관하게 안정적임을 알 수 있다. 다시 말해, 기업의 연령에 무관하게 기업부도예측의 지표로서 당해 재무비율지표들이 사용될 수 있음을 추론할 수 있다.
종전의 부도는 전기예측으로 차기부도가능성을 예측하고 있다. 다양한 알고리즘으로 부도 판별율을 높일 수 있으나 장기적 예측은 여전히 난제다. 따라서, 장기적인 부도 위험의 예측을 알면 실제 부도가 발생하기 이전에 조치를 취할 수 있다.
부도원인에 따라 다양한 라벨링이 요구된다. 예를 들어, 흑자부도, 적자부도. 등을 대/중/소 기업으로 나누고 업종 등 세부 분류가 추가로 필요하나, 이는 GAN(generative adversarial network) 모델로 해결할 수 있다.
또한, 부도시점 이전에 중장기적으로 부도 가능성을 예측하려면 부도기업의 재무비율 이미지를 창업 1년에서 n년으로 구분하여 라벨링을 해야 하나, 라벨링에 대한 기술적 한계나 제약은 CNN 모델을 사용하여 해결할 수 있다.
부도 예측을 위한 GAN 모델의 일례로 DCGAN(deep convolutional generative adversarial network)을 활용하는 경우:
1. DCGAN의 출력은 잠재 공간(latent space)이므로 각 라벨링마다 잠재 공간을 구할 수 있다. 이들 각 라벨링 간에 잠재 공간을 적절히 가감하면 새로운 잠재 공간을 만들고 이미지를 생성할 수 있다.
2. GAN 모델의 원리를 이용하면 <(상장기업)부도난 기업의 재무비율 이미지 - 생존한 기업의 재무비율 이미지 = 부도이미지>와 같고, <부도이미지 + (비상장기업) 부도난 기업의 재무비율 이미지 = 비상장기업의 재무비율 이미지>와 같다. 부도 예측을 의뢰한 비상장기업의 재무비율 이미지가 얼마나 유사한지를 판별하는 형태로, 비상장기업의 부도예측에도 대용할 수 있다.
3. 스타트업과 가장 유사한 소기업에 적용할 경우 소기업의 부도이미지를 추출할 수 있으며, 여기에 스타트업의 재무비율 이미지를 더해주면 스타트업의 부도예측도 대용치로서 가능하다.
4. IT인프라를 이용하여 비상장재무비율데이터를 보유한 은행, 기관으로부터 데이터를 공급받고 실시간으로 업데이트하여 은행, 기관, 기업 등으로 결과를 전송함으로써 비즈니스모델을 구축할 수 있다.
5. 스타트업 기업의 경우 일부 누락된 재무정보는 GAN을 이용하여 생성하고 이를 부도예측의 입력자료로서 활용할 수 있는 장점이 있다. GAN을 이용한 재무제표 정보의 누락된 부분을 복원하는 원리는 도 4와 같다.
스타트업 기업의 경우 재무제표를 입력하고 이를 CNN으로 축약한 후 기존 부도기업 데이터와 얼마나 유사한지 비교하는 방식으로 스타트업의 부도를 예측할 수 있다.
미국상장기업DB(COMPUSTAT)는 45년간 저장되어 있어서 도산기업의 수명은 1년에서 45년 사이다. 따라서, 각 연도 별로 한 개의 딥러닝 모델이 필요하므로 총 1,035개의 딥러닝 모델이 필요하다. 이를 미리 훈련시켜놓고, 고객이 제시하는 재무제표 데이터에 맞는 딥러닝 모델을 매칭시켜서 즉시 결과를 알려주게 된다. 예를 들어 고객이 5년치의 재무제표를 입력했다면 클러스터 사이즈(cluster size)가 1~5년에 각각 해당하는 딥러닝 모델을 찾아서 고객의 재무제표를 최소 1년에서 최대 5년 연속으로 재무제표를 입력해서 부도예측결과를 알려주는 것이다.
도 5 내지 도 9는 부도예측 훈련 과정을 설명하기 위한 예시 도면이다.
도 5 내지 도 7은 클러스터 사이즈를 1로 하여 1년 단위 재무비율을 입력하여 부도예측 딥러닝 모델을 학습하는 과정을 나타내고 있다.
도 5에 도시한 바와 같이, 수집모듈(201)은 부도 기업을 대상으로 각 기업별 매년 재무비율 정보를 연도 별로 수집한다. 수집모듈(201)은 기업 수명에 따라 기업군을 나누어 각 기업군의 1년 단위 재무비율 정보를 수집할 수 있다.
도 6을 참조하면, 훈련모듈(203)은 부도시점을 기준으로 기업 전체의 최근 1년 재무비율 정보를 이용하여 1년 후 부도예측 딥러닝 모델을 학습함으로써 부도예측 엔진(D)을 생성할 수 있다.
마찬가지로, 도 7을 참조하면, 훈련모듈(203)은 부도시점을 기준으로 기업 전체의 2년전 재무비율 정보를 이용하여2년 후 부도예측 딥러닝 모델을 학습함으로써 부도예측 엔진(D)을 생성할 수 있다.
상기한 과정을 반복하여 N개의 부도예측 엔진(D)까지 생성할 수 있으며, 다만 부도예측 엔진(D) 중 적어도 일부, 예컨대 부도 시점을 기준으로 사전에 정해진 시점 이후의 부도예측 엔진(D)을 유효 모델 대상에서 제외시킬 수 있다.
상기에서는 1년 단위 재무비율 정보를 이용하여 딥러닝 모델을 학습하는 것으로 설명하고 있으나, 이에 한정되지 않으며, 적어도 2년 이상 연속된 재무비율 정보를 이용하여 딥러닝 모델을 학습하는 것 또한 가능하다.
도 8과 도 9를 참조하면, 훈련모듈(203)은 클러스터 사이즈를 2로 하여, 즉 2년 단위로 2년 연속된 재무비율 정보를 이용하여 부도예측 딥러닝 모델을 학습할 수 있다. 도 9에 도시한 바와 같이, 훈련모듈(203)은 부도시점을 기준으로 기업 전체의 최근 2년 동안의 재무비율 정보를 이용하여 1년 후 부도예측 딥러닝 모델을 학습함으로써 부도예측 엔진(D)을 생성할 수 있다. 마찬가지로, 훈련모듈(203)은 부도시점을 기준으로 기업 전체의 2년전 재무비율 정보와 3년전 재무비율 정보를 이용하여 2년 후 부도예측 딥러닝 모델을 학습함으로써 부도예측 엔진(D)을 생성할 수 있다.
따라서, 훈련모듈(203)은 1년 단위 재무비율은 물론이고, 2년 단위, 3년 단위, 4년 단위 등 연속된 재무비율을 이용하여 부도예측 딥러닝 모델을 학습할 수 있으며, 이를 통해 부도예측을 위한 딥러닝 모델 전체집합을 구성할 수 있다.
도 10은 딥러닝 모델을 이용하여 부도가능성을 예측하는 과정을 설명하기 위한 예시 도면이다.
도 10을 참조하면, 서비스모듈(204)은 의뢰고객(기업)으로부터 재무제표 정보를 입력받으면 훈련모듈(203)에 의해 생성된 딥러닝 모델 전체집합 중에서 해당 고객에게 적용 가능한 딥러닝 모델을 선정하여 선정된 딥러닝 모델을 통해 부도시점을 판별할 수 있다. 고객이 2년간의 재무제표 정보를 입력하는 경우 연도 별 재무제표 정보에 대해 1년 단위 재무비율로 만들어진 딥러닝 모델을 선정하는 것은 물론이고, 2년치 재무제표 정보에 대해 2년 단위 재무비율로 만들어진 딥러닝 모델을 선정할 수 있다. 서비스모듈(204)은 의뢰고객의 재무제표 정보에 대응되는 부도예측 정보를 서비스 결과로 제공할 수 있다.
이처럼 본 발명의 실시예들에 따르면, 기업의 재무비율지표 전체를 모두 포괄하여 직접적으로 부도 예측에 활용함으로써 높은 부도예측 정확도를 기대할 수 있다. 본 발명의 실시예들에 따르면, 기업의 탄생에서부터 지속적으로 재무비율지표를 수집하고, 전체 수명주기 내에서 보여주는 재무비율지표의 변화양상을 마치 이미지의 변화로 인식하여 딥러닝이 부도예상기업에 해당하는지를 알려주므로 부도예측의 조기경보가 가능하다. 본 발명의 실시예들에 따르면, 스타트업 및 비상장기업과 같은 재무비율정보가 일부만 존재하는 기업에 대한 부도예측에 대해서도 부도예측이 가능하다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 이때, 매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 또한, 매체는 단일 또는 수 개의 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 어플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (7)

  1. 컴퓨터 시스템에 있어서,
    메모리에 포함된 컴퓨터 판독 가능한 명령을 실행하도록 구현되는 적어도 하나의 프로세서
    를 포함하고,
    상기 적어도 하나의 프로세서는,
    부도 기업의 재무제표 정보를 수집하는 과정;
    상기 부도 기업의 재무제표 정보를 이용하여 딥러닝 부도예측 모델을 훈련하는 과정; 및
    상기 딥러닝 부도예측 모델을 이용하여 의뢰 기업의 재무제표 정보에 대한 부도 예측 정보를 제공하는 과정
    을 처리하는 컴퓨터 시스템.
  2. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    기업의 재무제표 정보를 보유한 기관의 데이터베이스 시스템과 연동하여 상기 데이터베이스 시스템으로부터 상기 부도 기업의 재무제표 정보를 수집하는 것
    을 특징으로 하는 컴퓨터 시스템.
  3. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 부도 기업의 재무제표 정보를 이미지 인식용 딥러닝 모델에서 인식 가능한 2차원 평면 상의 이미지 픽셀 정보로 전처리하고,
    상기 부도 기업의 거시경제 지표, 주가관련 지표, 회계감사, 외부평가 지표를 포함하는 비재무 정보를 별도의 채널(channel) 정보로서 이미지 데이터의 각 픽셀에 추가하여 전처리하는 것
    을 특징으로 하는 컴퓨터 시스템.
  4. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    1년 단위 재무제표 정보 또는 적어도 2년 이상 연속된 재무제표 정보를 이용하여 부도 시점 기준 연도 별 부도예측 엔진을 생성하는 것
    을 특징으로 하는 컴퓨터 시스템.
  5. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 부도 기업의 연도 별 재무제표 정보를 입력으로 하고 부도 여부, 부도발생 예상시점, 부도 유형 중 적어도 하나에 대한 라벨링(labeling)을 출력으로 하여 딥러닝 모델을 훈련하는 것
    을 특징으로 하는 컴퓨터 시스템.
  6. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    GAN(generative adversarial network) 모델을 이용하여 상기 부도 기업의 일부 누락된 재무제표 정보를 생성하고,
    상기 GAN 모델을 이용하여 잠재공간(latent space) 상에서 잠재변수들 간의 연산과정(arithmetic process)을 통해 부도예측을 추정하는 모델을 생성하는 것
    을 특징으로 하는 시스템
  7. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    RNN(recurrent neural network) 모델을 이용하여 상기 딥러닝 부도예측 모델의 딥러닝 모델 파라미터와 하이퍼 파라미터를 수정하는 것
    을 특징으로 하는 컴퓨터 시스템.
KR1020200037979A 2019-03-29 2020-03-30 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템 KR102330423B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190036567 2019-03-29
KR20190036567 2019-03-29

Publications (2)

Publication Number Publication Date
KR20200115369A true KR20200115369A (ko) 2020-10-07
KR102330423B1 KR102330423B1 (ko) 2021-11-24

Family

ID=72884710

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200037979A KR102330423B1 (ko) 2019-03-29 2020-03-30 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템

Country Status (1)

Country Link
KR (1) KR102330423B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112561688A (zh) * 2020-12-21 2021-03-26 第四范式(北京)技术有限公司 基于图嵌入的信用卡逾期预测方法、装置及电子设备
CN113537576A (zh) * 2021-06-25 2021-10-22 合肥工业大学 用于预测上市企业财务困境的方法及系统
KR20220086907A (ko) 2020-12-17 2022-06-24 (주)276홀딩스 부도 예측 시스템 및 방법
KR20220102961A (ko) * 2021-01-14 2022-07-21 사단법인 한국신용정보원 신용정보를 활용한 인공 지능 모형 기반 개인사업자 부도율 예측 방법 및 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090006489A (ko) * 2007-07-11 2009-01-15 고려대학교 산학협력단 신용 위험 모형 구축용 툴 킷, 신용 위험 모형 구축을 통한신용 위험 관리 방법 및 이를 기록한 기록매체
KR20120134849A (ko) * 2011-06-03 2012-12-12 고광이 여신한도관리 방법 및 시스템
KR20160094157A (ko) * 2015-01-30 2016-08-09 경일대학교산학협력단 기업 연쇄부도위험 관리 시스템 및 이를 이용한 연쇄부도위험 관리 방법
KR101936029B1 (ko) * 2018-07-18 2019-01-11 한국과학기술정보연구원 딥러닝 기반의 가치 평가 방법 및 그 장치
KR20190027237A (ko) * 2017-09-06 2019-03-14 주식회사 씨티아이랩 데이터 이미지화를 이용한 딥러닝 기반 시스템 이상행위 분석 기술

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090006489A (ko) * 2007-07-11 2009-01-15 고려대학교 산학협력단 신용 위험 모형 구축용 툴 킷, 신용 위험 모형 구축을 통한신용 위험 관리 방법 및 이를 기록한 기록매체
KR20120134849A (ko) * 2011-06-03 2012-12-12 고광이 여신한도관리 방법 및 시스템
KR20160094157A (ko) * 2015-01-30 2016-08-09 경일대학교산학협력단 기업 연쇄부도위험 관리 시스템 및 이를 이용한 연쇄부도위험 관리 방법
KR20190027237A (ko) * 2017-09-06 2019-03-14 주식회사 씨티아이랩 데이터 이미지화를 이용한 딥러닝 기반 시스템 이상행위 분석 기술
KR101936029B1 (ko) * 2018-07-18 2019-01-11 한국과학기술정보연구원 딥러닝 기반의 가치 평가 방법 및 그 장치

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220086907A (ko) 2020-12-17 2022-06-24 (주)276홀딩스 부도 예측 시스템 및 방법
CN112561688A (zh) * 2020-12-21 2021-03-26 第四范式(北京)技术有限公司 基于图嵌入的信用卡逾期预测方法、装置及电子设备
KR20220102961A (ko) * 2021-01-14 2022-07-21 사단법인 한국신용정보원 신용정보를 활용한 인공 지능 모형 기반 개인사업자 부도율 예측 방법 및 장치
CN113537576A (zh) * 2021-06-25 2021-10-22 合肥工业大学 用于预测上市企业财务困境的方法及系统

Also Published As

Publication number Publication date
KR102330423B1 (ko) 2021-11-24

Similar Documents

Publication Publication Date Title
Mudassir et al. Time-series forecasting of Bitcoin prices using high-dimensional features: a machine learning approach
Ntakaris et al. Benchmark dataset for mid‐price forecasting of limit order book data with machine learning methods
Žliobaitė Measuring discrimination in algorithmic decision making
KR102330423B1 (ko) 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템
Oyebode et al. Neural network modeling of hydrological systems: A review of implementation techniques
Parot et al. Using Artificial Neural Networks to forecast Exchange Rate, including VAR‐VECM residual analysis and prediction linear combination
CN110400022B (zh) 自助柜员机现金用量预测方法及装置
Zhao et al. Effects of feature construction on classification performance: An empirical study in bank failure prediction
Chandar Convolutional neural network for stock trading using technical indicators
Jang et al. Business failure prediction of construction contractors using a LSTM RNN with accounting, construction market, and macroeconomic variables
Singh et al. An efficient real-time stock prediction exploiting incremental learning and deep learning
Sujatha et al. Loan prediction using machine learning and its deployement on web application
CN117422181A (zh) 一种基于模糊标签的代发客户流失预警方法及系统
Costea Performance benchmarking of non-banking financial institutions by means of Self-Organising Map algorithm
Arundina et al. Artificial intelligence for Islamic sukuk rating predictions
KR102519878B1 (ko) 금융기관 신용공여 사업에서의 인공지능 기반 리스크 관리 솔루션을 제공하기 위한 장치, 방법 및 명령을 기록한 기록 매체
KR102355255B1 (ko) Lstm 신경망과 텍스트 마이너를 이용한 주가 실시간 예측 시스템
Heistrene et al. Explainability-based Trust Algorithm for electricity price forecasting models
Cocianu et al. The Use of LSTM Neural Networks to Implement the NARX Model. A Case Study of EUR-USD Exchange Rates.
Bandhu et al. An improved technique for stock price prediction on real-time exploiting stream processing and deep learning
Singh et al. Predicting earnings per share using feature-engineered extreme gradient boosting models and constructing alpha trading strategies
Maddodi Stock Market Forecasting: A Review of Literature
Zainal et al. An optimal limit order book prediction analysis based on deep learning and pigeon-inspired optimizer
Emamverdi et al. FORECASTING THE TOTAL INDEX OF TEHRAN STOCK EXCHANGE.
US20220138778A1 (en) Method and system for using deep video prediction for economic forecasting

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant