WO2021060593A1 - 기계 학습을 이용한 신용 평가를 위한 시스템, 방법, 및 컴퓨터 프로그램 - Google Patents

기계 학습을 이용한 신용 평가를 위한 시스템, 방법, 및 컴퓨터 프로그램 Download PDF

Info

Publication number
WO2021060593A1
WO2021060593A1 PCT/KR2019/012791 KR2019012791W WO2021060593A1 WO 2021060593 A1 WO2021060593 A1 WO 2021060593A1 KR 2019012791 W KR2019012791 W KR 2019012791W WO 2021060593 A1 WO2021060593 A1 WO 2021060593A1
Authority
WO
WIPO (PCT)
Prior art keywords
vector
machine learning
input
item
credit
Prior art date
Application number
PCT/KR2019/012791
Other languages
English (en)
French (fr)
Inventor
엄성민
Original Assignee
(주)데이터리퍼블릭
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)데이터리퍼블릭 filed Critical (주)데이터리퍼블릭
Publication of WO2021060593A1 publication Critical patent/WO2021060593A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

기계 학습을 이용하여, 금융 서비스 신청 건에 관련된 적어도 하나의 항목 및 신청자에 대한 적어도 하나의 항목 중 적어도 일부 항목에 대한 값을 포함하는 입력 데이터 세트를 입력 받아, 상기 입력 데이터 세트에 대응하는 입력 벡터로부터 상기 입력 벡터보다 낮은 차원의 히든(hidden) 벡터를 생성하고, 상기 히든 벡터를 히든 벡터 분포에 기초하여 보정하고, 상기 보정된 히든 벡터로부터 상기 입력 데이터 세트의 적어도 하나의 항목에 대한 값 중 결측 값에 대한 예측 값을 포함하는 재구성 벡터를 출력하는 결측 데이터 예측부; 및 상기 재구성 벡터에 기초하여 상기 신청 건에 대한 신용 평가를 수행하는 신용 평가 처리부를 포함하는 신용 평가 시스템이 제공된다.

Description

기계 학습을 이용한 신용 평가를 위한 시스템, 방법, 및 컴퓨터 프로그램
본 개시의 실시예들은 딥 러닝을 이용한 신용 평가 시스템, 신용 평가 방법, 및 컴퓨터 프로그램에 관한 것이다.
대출, 카드 개설 등의 다양한 금융 서비스를 제공하기 위하여, 신청자의 신용 평가의 중요성이 강조되고, 이를 위한 다양한 시스템들이 제공되고 있다. 신용 평가에는 다양한 요소들이 고려되어야 하기 때문에, 신용 평가를 위해 이용되는 데이터의 종류가 다수 존재한다. 또한, 다양한 데이터에 기초하여 신용 평가를 수행하기 위한 다양한 원리와 방법이 연구되고 있다. 이와 같이 방대한 데이터를 자동으로 처리하고, 정확한 신용 평가 결과를 산출할 수 있는 시스템 및 방법이 요구되고 있다.
본 개시의 실시예들은 신용 평가를 위한 입력 정보 중, 결측 데이터(missing data)를 정확하게 예측하고 신용 평가를 수행하는 시스템, 방법, 및 컴퓨터 프로그램을 제공하기 위한 것이다.
또한, 본 개시의 실시예들은 기계 학습을 이용하여, 신용 평가에 이용되는 결측 데이터를 정확하게 예측하여, 신용 평가의 정확성을 향상시키기 위한 것이다.
또한, 본 개시의 실시예들은 경제 지표의 예측 값을 이용하여 신청 서비스의 만기를 고려한 신용 평가 방법을 제공하기 위한 것이다.
본 개시의 일 실시예의 일 측면에 따르면, 기계 학습을 이용하여, 금융 서비스 신청 건에 관련된 적어도 하나의 항목 및 신청자에 대한 적어도 하나의 항목 중 적어도 일부 항목에 대한 값을 포함하는 입력 데이터 세트를 입력 받아, 상기 입력 데이터 세트에 대응하는 입력 벡터로부터 상기 입력 벡터보다 낮은 차원의 히든(hidden) 벡터를 생성하고, 상기 히든 벡터를 히든 벡터 분포에 기초하여 보정하고, 상기 보정된 히든 벡터로부터 상기 입력 데이터 세트의 적어도 하나의 항목에 대한 값 중 결측 값에 대한 예측 값을 포함하는 재구성 벡터를 출력하는 결측 데이터 예측부; 및 상기 재구성 벡터에 기초하여 상기 신청 건에 대한 신용 평가를 수행하는 신용 평가 처리부를 포함하는 신용 평가 시스템이 제공된다.
또한, 일 실시예에 따르면, 상기 기계 학습 프로세서는, 상기 입력 데이터 세트를 입력 받아 입력 벡터를 생성하는 입력 레이어; 상기 입력 벡터보다 낮은 차원의 히든 벡터를 출력하는 부호화 레이어; 학습된(learned) 히든 벡터 분포에 기초하여 상기 히든 벡터를 보정하는 보정 레이어; 상기 보정된 히든 벡터를 입력 받아, 상기 재구성 벡터를 생성하는 복호화 레이어; 및 상기 재구성 벡터를 출력하는 출력 레이어를 포함할 수 있다.
또한, 일 실시예에 따르면, 상기 기계 학습 프로세서는, 상기 입력 데이터 세트의 항목들 사이의 관계에 대한 규칙 정보를 학습(learn)하고, 상기 학습된 규칙 정보에 기초하여 상기 복호화 레이어를 업데이트(update)할 수 있다.
또한, 일 실시예에 따르면, 상기 신청자에 대한 적어도 하나의 항목은, 성별, 나이, 결혼 여부, 자녀 유무, 주택 종류, 자가 여부, 직업, 급여 생활자 여부, 수입, 자산, 담보 유무, 기존 대출 유무, 보증 유무, 기존 대출 금액, 연체 유무, 또는 신용 불량 여부 중 적어도 하나 또는 이들의 조합을 포함할 수 있다.
또한, 일 실시예에 따르면, 상기 신청 건에 관련된 적어도 하나의 항목은, 금융 서비스 종류, 담보 유무, 신청 금액, 대출 기간, 또는 원금 상환 여부 중 적어도 하나 또는 이들의 조합을 포함할 수 있다.
또한, 일 실시예에 따르면, 상기 기계 학습 프로세서는, 신청 건 정보, 신청자에 대한 정보, 및 신용 평가 결과를 포함하는 트레이닝 데이터에 기초하여 강화 학습(reinforcement learning)될 수 있다.
또한, 일 실시예에 따르면, 상기 신용 평가 처리부는, 기간에 따른 예측 경제 지표를 입력 받고, 상기 예측 경제 지표 및 상기 재구성 벡터에 기초하여 신용 평가를 수행할 수 있다.
또한, 일 실시예에 따르면, 상기 신청자에 대한 적어도 하나의 항목은, 상기 신청자의 위치 정보 이력을 포함하고, 상기 기계 학습 프로세서는, 상기 신청자의 위치 정보 이력에 기초하여 생성된 신청자 성향 항목에 대응하는 값을 포함하는 재구성 벡터를 생성할 수 있다.
또한, 일 실시예에 따르면, 상기 재구성 벡터는 상기 입력 벡터보다 높은 차원을 갖고, 상기 입력 벡터에 기초하여 상기 기계 학습 프로세서에 의해 생성된 추가 생성 정보 항목을 포함할 수 있다.
본 개시의 일 실시예의 다른 측면에 따르면, 금융 서비스 신청 건에 관련된 적어도 하나의 항목 및 신청자에 대한 적어도 하나의 항목 중 적어도 일부 항목에 대한 값을 포함하는 입력 데이터 세트를 입력 받는 단계; 기계 학습 프로세서에 의해 상기 입력 데이터 세트에 대응하는 입력 벡터로부터 상기 입력 벡터보다 낮은 차원의 히든(hidden) 벡터를 생성하는 단계; 상기 기계 학습 프로세서에 의해 상기 히든 벡터를 히든 벡터 분포에 기초하여 보정하는 단계; 상기 기계 학습 프로세서에 의해 상기 보정된 히든 벡터로부터 상기 입력 데이터 세트의 적어도 하나의 항목에 대한 값 중 결측 값에 대한 예측 값을 포함하는 재구성 벡터를 출력하는 단계; 및 상기 재구성 벡터에 기초하여 상기 대상자에 대한 신용 평가를 수행하는 단계를 포함하는 신용 평가 방법이 제공된다.
본 개시의 일 실시예의 또 다른 측면에 따르면, 프로세서에 의해 실행되었을 때, 상기 프로세서가 신용 평가 방법을 수행하도록 명령하는 적어도 하나의 명령어를 저장하는 기록 매체를 포함하는 컴퓨터 프로그램에 있어서, 상기 신용 평가 방법은, 금융 서비스 신청 건에 관련된 적어도 하나의 항목 및 신청자에 대한 적어도 하나의 항목 중 적어도 일부 항목에 대한 값을 포함하는 입력 데이터 세트를 입력 받는 단계; 기계 학습 프로세서에 의해 상기 입력 데이터 세트에 대응하는 입력 벡터로부터 상기 입력 벡터보다 낮은 차원의 히든(hidden) 벡터를 생성하는 단계; 상기 기계 학습 프로세서에 의해 상기 히든 벡터를 히든 벡터 분포에 기초하여 보정하는 단계; 상기 기계 학습 프로세서에 의해 상기 보정된 히든 벡터로부터 상기 입력 데이터 세트의 적어도 하나의 항목에 대한 값 중 결측 값에 대한 예측 값을 포함하는 재구성 벡터를 출력하는 단계; 및 상기 재구성 벡터에 기초하여 상기 대상자에 대한 신용 평가를 수행하는 단계를 포함하는, 컴퓨터 프로그램이 제공된다.
본 개시의 실시예들예 따르면, 신용 평가를 위한 입력 정보 중, 결측 데이터(missing data)를 정확하게 예측하고 신용 평가를 수행하는 시스템, 방법, 및 컴퓨터 프로그램을 제공할 수 있는 효과가 있다.
또한, 본 개시의 실시예들에 따르면, 기계 학습을 이용하여, 신용 평가에 이용되는 결측 데이터를 정확하게 예측하여, 신용 평가의 정확성을 향상시킬 수 있는 효과가 있다.
또한, 본 개시의 실시예들에 따르면, 경제 지표의 예측 값을 이용하여 신청 서비스의 만기를 고려한 신용 평가 방법을 제공할 수 있는 효과가 있다.
도 1은 일 실시예에 따른 신용 평가 시스템을 나타낸 도면이다.
도 2는 일 실시예에 따른 신용 평가 시스템(100)의 구조를 나타낸 도면이다.
도 3은 일 실시예에 따른 신용 평가 방법을 나타낸 흐름도이다.
도 4는 입력 벡터로부터 재구성 벡터를 생성하는 과정을 설명하기 위한 도면이다.
도 5는 일 실시예에 따른 기계 학습 프로세서의 구조를 나타낸 블록도이다.
도 6은 일 실시예에 따른 히든 벡터 분포에 대한 정보를 나타낸 도면이다.
도 7은 일 실시예에 따른 기계 학습 모델의 학습 과정을 설명하기 위한 도면이다.
도 8은 일 실시예에 따른 신용 평가 처리부의 동작을 설명하기 위한 도면이다.
본 개시의 일 실시예의 일 측면에 따르면, 기계 학습을 이용하여, 금융 서비스 신청 건에 관련된 적어도 하나의 항목 및 신청자에 대한 적어도 하나의 항목 중 적어도 일부 항목에 대한 값을 포함하는 입력 데이터 세트를 입력 받아, 상기 입력 데이터 세트에 대응하는 입력 벡터로부터 상기 입력 벡터보다 낮은 차원의 히든(hidden) 벡터를 생성하고, 상기 히든 벡터를 히든 벡터 분포에 기초하여 보정하고, 상기 보정된 히든 벡터로부터 상기 입력 데이터 세트의 적어도 하나의 항목에 대한 값 중 결측 값에 대한 예측 값을 포함하는 재구성 벡터를 출력하는 결측 데이터 예측부; 및 상기 재구성 벡터에 기초하여 상기 신청 건에 대한 신용 평가를 수행하는 신용 평가 처리부를 포함하는 신용 평가 시스템이 제공된다.
본 명세서는 본 개시의 청구항의 권리범위를 명확히 하고, 본 개시의 실시 예들이 속하는 기술분야에서 통상의 지식을 가진 자가 본 개시의 실시 예들을 실시할 수 있도록, 본 개시의 실시 예들의 원리를 설명하고, 실시 예들을 개시한다. 개시된 실시 예들은 다양한 형태로 구현될 수 있다.
명세서 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다. 본 명세서가 실시 예들의 모든 요소들을 설명하는 것은 아니며, 본 개시의 실시 예들이 속하는 기술분야에서 일반적인 내용 또는 실시 예들 간에 중복되는 내용은 생략한다. 명세서에서 사용되는 '부'(part, portion)라는 용어는 소프트웨어 또는 하드웨어로 구현될 수 있으며, 실시 예들에 따라 복수의 '부'가 하나의 요소(unit, element)로 구현되거나, 하나의 '부'가 복수의 요소들을 포함하는 것도 가능하다. 이하 첨부된 도면들을 참고하여 본 개시의 실시 예들, 및 실시 예들의 작용 원리에 대해 설명한다.
도 1은 일 실시예에 따른 신용 평가 시스템을 나타낸 도면이다.
금융 기관은 대출, 신용 카드 개설 등 다양한 금융 여신 서비스를 제공하고 있다. 여신 서비스에서는 향후 여신 상환 리스크를 최소화하기 위해, 금융 여신을 실행하기 전에, 신청 건에 대한 리스크의 스코어를 산출한다. 본 개시의 실시예들에 따른 신용 평가 시스템(100)은 금융 서비스 신청 건에 대한 상환 리스크의 스코어를 산출하기 위해, 신청자에 대한 정보 및 신청 서비스에 대한 정보를 입력 받아, 신청 건에 대한 신용 평가를 수행한다.
신용 평가 시스템(100)은 신청자 정보 및 신청 건 정보를 입력 받아, 신용 평가 정보를 출력한다. 본 개시의 실시예들에서 신청 건은 금융 기관에서 수신한 금융 서비스의 신청 건을 지칭한다. 금융 서비스는 대출, 신용 카드 개설 등을 포함한다.
신청자 정보는 금융 서비스를 신청한 신청자에 대한 정보이다. 신청자 정보는 신청자와 관련된 복수의 항목들에 대한 값을 포함한다. 신청자 정보의 복수의 항목은 예를 들면, 성별, 나이, 결혼 여부, 자녀 유무, 주택 종류, 자가 여부, 직업, 급여 생활자 여부, 수입, 자산, 담보 유무, 기존 대출 유무, 보증 유무, 기존 대출 금액, 연체 유무, 또는 신용 불량 여부 중 적어도 하나 또는 이들의 조합을 포함할 수 있다.
신청자 정보는 복수의 항목들 중 일부 항목에 대한 값만 포함하거나, 모든 항목에 대한 값을 포함할 수 있다. 즉, 신청자 정보는 복수의 항목들 중 일부 항목의 값이 결측되어 있을 수 있다. 본 개시의 실시예들에 따른 신용 평가 시스템(100)은 기계 학습을 이용하여 신청자 정보 중 결측된 항목의 값을 예측하여, 신청자 정보의 데이터 세트를 완성할 수 있다.
본 개시의 실시예들에서 기계 학습은 다양한 기계 학습 알고리즘을 포함한다. 본 개시의 실시예들에 따른 기계 학습 모델은 적어도 하나의 matrix multiplication 연산 및 적어도 하나의 non-linear operation의 조합으로 interference가 실행되는 인공지능 알고리즘을 포함할 수 있다. 또한, 기계 학습 모델은 인공 신경망 모델, 또는 심층 신경망 모델을 포함할 수 있다.
금융 서비스 신청 건 정보는 금융 기관에 수신된 금융 서비스 신청 건에 대한 정보이다. 신청 건 정보는 신청된 금융 서비스를 정의하는 복수의 항목들을 포함한다. 신청 건 정보의 복수의 항목들은 예를 들면, 금융 서비스 종류, 담보 유무, 신청 금액, 대출 기간, 또는 원금 상환 여부 중 적어도 하나 또는 이들의 조합을 포함할 수 있다. 금융 서비스 종류는 예를 들면, 상품 코드로 정의될 수 있다. 신청 건의 항목은 상품 코드에 따라 정의될 수 있다. 예를 들면, 상품 코드가 주택 담보 대출에 해당하는 경우, 신청 건의 항목은 원금 상환 여부, 대출 기간, 대출 금액, 담보물 평가액, 및 고정 금리 여부 등을 포함할 수 있다.
신용 평가 시스템(100)은 입력된 신청자 정보 및 신청 건 정보에 기초하여 신용 평가 정보를 산출하여 출력한다. 신용 평가 정보는 신청 건에 대한 신용 점수를 나타낸다. 신용 평가 정보는 소정의 값으로 정의된 점수로 정의될 수 있다. 신용 평가 정보는 하나 이상의 항목에 대한 점수 또는 값으로 정의될 수 있다. 일 실시예에 따르면, 신용 평가 정보는 신청 건에 대해 산출될 수 있다. 다른 실시예에 따르면, 신용 평가 정보는 신청자에 대한 값과 신청 건에 대한 값을 별개로 가질 수 있다.
신용 평가 시스템(100)은 금융 기관의 시스템 내에 구비될 수 있다. 예를 들면, 신용 평가 시스템(100)은 은행, 증권사, 투자사, 카드사, 신용 평가 회사 등의 시스템 내에 구비될 수 있다. 금융 기관의 시스템은 보안과 안정성이 매우 높은 수준으로 요구된다. 이러한 이유로 금융 기관의 시스템은 네트워크로부터 차단되어 있는 경우가 많고, 해당 시스템으로의 데이터 유입과 해당 시스템으로부터의 데이터 유출이 엄격하게 차단되어 있다. 일반적으로 금융 기관의 시스템은 데이터 유출은 금지되어 있으며, 데이터 유입은 소정의 보안 시스템을 거쳐서만 허용되고 있다. 이러한 금융 기관 시스템의 환경으로 인해, 외부 서버에 구비된 모듈을 이용하여 신용 평가를 수행하기는 어려운 실정이다. 결국 금융 기관에서 신용 평가를 수행하기 위한 과정 중 상당 부분을 사람이 직접 처리하고 있어, 신용 평가를 수행하기 위한, 시간, 비용, 인력이 상당히 소요되고 있다. 본 개시의 실시예들에 따른 신용 평가 시스템(100)은 금융 기관의 시스템 내에 구비되어, 금융 기관의 시스템 외부로 데이터를 유출할 필요 없이, 금융 기관 시스템 내의 데이터를 활용하여 금융 기관 시스템 내에서 신용 평가를 수행할 수 있다. 따라서 본 개시의 실시예들에 따른 신용 평가 시스템(100)은 금융 기관 시스템 내에서 데이터의 외부 유출 없이 자동으로 금융 서비스의 신청 건에 대한 신용 평가를 수행할 수 있는 효과가 있다.
또한, 금융 서비스에 대한 신청 건은 각 개인이 금융 기관에서 수기로 작성하거나, 금융 기관의 시스템에 직접 입력하는 것이기 때문에, 신청 건의 항목 중 일부 항목이 결측되어 있는 경우가 많다. 그런데 신용 평가 과정을 자동화하기 위해 소정의 알고리즘을 사용하기 위해서는 데이터의 완결성이 매우 중요하기 때문에, 소정의 알고리즘을 사용하기 위해서는 결측 데이터를 채우는 과정이 매우 중요하다. 그런데 금융 서비스와 관련된 데이터는 그 항목의 개수가 매우 많고, 관련성을 알기 어려운 하이 랭크(high rank) 예측에 속하기 때문에, 신뢰성 높은 결측 데이터의 예측 알고리즘을 설계하기 어려운 실정이다. 또한, 외부로 데이터 유출이 어려운 금융 기관 시스템의 특성 상, 외부 서버를 통해 제공되는 하이 랭크 예측 알고리즘을 이용하기 어려운 실정이다.
본 개시의 실시예들에 따른 신용 평가 시스템(100)은 금융 시스템 내에 구비되어, 금융 시스템 내에서 기계 학습을 이용하여 결측 데이터 예측 과정을 학습하고, 학습된 기계 학습 모델을 이용하여 신청자 정보 및 신청 건 정보 내의 결측 데이터를 예측한다. 또한, 결측 데이터의 예측을 위한 기계 학습 모델을 학습함에 있어서, 본 개시의 실시예들에 따른 신용 평가 시스템(100)은 일부 학습 데이터에 의해 모델이 오버 핏팅(over fitting)되는 문제점을 방지하기 위해 데이터의 배치에 기초하여 인공 지능망 모델을 학습한다. 또한, 본 개시의 실시예들에 따른 신용 평가 시스템(100)은 예측의 신뢰성을 향상시키기 위해, 학습을 통해 획득된 규칙을 이용하여 기계 학습 모델 내에 액티브 컬럼(active column)을 배치하여, 예측의 신뢰성을 향상시킨다.
도 2는 일 실시예에 따른 신용 평가 시스템(100)의 구조를 나타낸 도면이다.
일 실시예에 따른 신용 평가 시스템(100)은 결측 데이터 예측부(210) 및 신용 평가 처리부(220)를 포함한다. 결측 데이터 예측부(210)는 기계 학습 프로세서(212)를 포함한다.
결측 데이터 예측부(210)는 신청자 정보 및 신청 건 정보를 포함하는 입력 데이터 세트를 입력 받아, 입력 데이터 세트의 복수의 항목 중 그 값이 없는 결측 값을 예측하고, 예측 값을 포함하는 재구성 벡터를 출력한다. 결측 데이터 예측부(210)는 기계 학습 프로세서(212)를 이용하여 결측 값을 예측한다.
기계 학습 프로세서(212)는 복수의 노드 및 복수의 레이어를 포함하는 기계 학습 모델의 동작을 수행하는 프로세서이다. 기계 학습 모델은 복수의 노드 및 복수의 노드들 사이의 가중치의 가중치에 의해 정의될 수 있다. 또한, 기계 학습 모델은 복수의 레이어를 포함하는 심층 신경망 모델에 대응될 수 있다. 기계 학습 모델은 다수의 트레이닝 데이터에 의해 학습된다. 일 실시예에 따르면, 기계 학습 프로세서(212)는 금융 시스템 내에 저장된 데이터를 트레이닝 데이터로 이용하여 기계 학습 모델을 학습시킬 수 있다.
기계 학습 프로세서(212)는 결측 데이터 예측을 위한 전용 기계 학습 칩의 형태로 구현되거나, 범용 프로세서 내에 소프트웨어 모듈 형태로 구현된 기계 학습 모델을 포함하는 형태로 구현될 수 있다. 기계 학습 프로세서(212)는 신용 평가 시스템(100) 내의 중앙 프로세서 내에 구비거나, 신용 평가 시스템(100) 내에서 중앙 프로세서와 별도의 프로세서로 구비될 수 있다.
입력 데이터 세트는 벡터(vector) 또는 텐서(tensor)로 변환되어 기계 학습 프로세서(212)로 입력된다. 본 개시에서는 입력 데이터 세트가 벡터로 변환되는 것으로 설명하지만, 이러한 기재가 벡터와 상이한 형태의 데이터 형식을 배제하는 것은 아니며, 다양한 형태의 텐서 입력이 기계 학습 프로세서(212)에서 이용될 수 있다. 입력 데이터 세트의 복수의 항목들에 대한 값이 입력 벡터로 변환된다. 입력 벡터의 차원은 입력 데이터 세트의 항목의 개수, 기계 학습 프로세서(212)의 스펙 및 성능 등에 기초하여 다양하게 결정될 수 있다.
일 실시예에 따르면, 결측 데이터 예측부(210)는 입력 데이터 세트의 항목의 종류 및 개수를 신청 건의 적어도 하나의 항목 값에 기초하여 결정할 수 있다. 예를 들면, 금융 서비스 종류에 따라 신청 건에 관련된 항목의 종류 및 개수가 달라질 수 있다. 다른 예로서, 담보 유무에 따라, 담보가 있는 경우에만 담보물 종류, 담보물 평가액, 선 순위 채권 유무 등의 항목이 입력 데이터 세트의 항목에 추가될 수 있다. 일 실시예에 따르면, 결측 데이터 예측부(210)는 입력 데이터 세트의 항목이 달라짐에 따라 입력 벡터의 각 요소의 속성을 변경하거나, 입력 벡터의 차원을 변경할 수 있다.
결측 데이터 예측부(210)는 기계 학습 프로세서(212)에 의해 입력 벡터의 결측 값에 대한 예측 값을 생성하여, 결측 값이 채워진 재구성 벡터를 출력한다. 재구성 벡터는 입력 벡터와 동일 차원이거나, 입력 벡터보다 높은 차원의 벡터일 수 있다. 일 실시예에 따르면, 재구성 벡터는 입력 벡터에 기초하여 생성된 추가 생성 항목을 엘리먼트로 포함할 수 있다. 예를 들면, 입력 벡터에 기초하여 신청자의 DSR(Debt Service Ratio) 값 항목을 생성하여 재구성 벡터의 하나의 엘리먼트로 추가할 수 있다.
신용 평가 처리부(220)는 결측 데이터 예측부(210)로부터 생성된 재구성 벡터를 입력받아, 신청 건에 대한 신용 평가를 수행한다. 신용 평가에 대한 결과 값은 신청 건에 대한 신용 리스크를 나타내는 값이다. 신용 평가 처리부(220)는 신용 평가의 결과 값으로, 적어도 하나의 항목에 대한 점수 또는 소정 형식의 값을 출력할 수 있다. 신용 평가 처리부(220)는 신청 건에 대한 신용 평가 결과를 출력하거나, 신청자 및 신청 건에 대한 결과 값을 각각 출력할 수 있다. 신용 평가 처리부(220)는 소정의 신용 평가 알고리즘을 이용하여 신청 건에 대한 신용 평가를 수행할 수 있다. 일 실시예에 따르면, 신용 평가 처리부(220)는 소정의 기계 학습 모델을 이용하여 신용 평가의 결과 값을 출력할 수 있다.
일 실시예에 따르면, 신용 평가 시스템(100)은 입력 인터페이스(230) 및 출력 인터페이스(230)를 더 포함할 수 있다.
입력 인터페이스(230)는 사용자 또는 외부 장치로부터 신청자 정보 및 신청 건 정보를 입력 받는다. 입력 인터페이스는 예를 들면, 키보드, 터치 패드, 터치 스크린, 마우스 등을 포함할 수 있다. 또한, 입력 인터페이스는 외부 장치로부터 데이터 또는 명령어를 입력 받을 수 있는 연결 단자 또는 통신 인터페이스를 포함할 수 있다.
출력 인터페이스(240)는 신용 평가 처리부(220)에 의해 생성된 신용 평가의 결과 값을 출력한다. 출력 인터페이스(240)는 예를 들면, 디스플레이, 프린터, 스피커 등을 포함할 수 있다. 또한, 출력 인터페이스(240)는 신용 평가의 결과 값을 출력하는 통신 인터페이스를 포함할 수 있다.
또한, 일 실시예에 따르면, 신용 평가 시스템(100)은 신용 평가 시스템(100) 전반의 동작을 제어하는 프로세서, 소정의 데이터 및 명령어를 저장하는 저장부, 외부 장치와 통신하는 통신부 등의 구성요소를 더 포함할 수 있다.
도 3은 일 실시예에 따른 신용 평가 방법을 나타낸 흐름도이다.
본 개시의 신용 평가 방법의 각 단계들은 프로세서를 구비하고, 기계 학습 모델을 이용하는 다양한 형태의 전자 장치에 의해 수행될 수 있다. 본 명세서는 본 개시의 실시예들에 따른 신용 평가 시스템(100)이 신용 평가 방법을 수행하는 실시예를 중심으로 설명한다. 따라서 신용 평가 시스템(100)에 대해 설명된 실시예들은 신용 평가 방법에 대한 실시예들에 적용 가능하고, 반대로 신용 평가 방법에 대해 설명된 실시예들은 신용 평가 시스템(100)에 대한 실시예들에 적용 가능하다. 개시된 실시예들에 따른 신용 평가 방법은 본 명세서에 개시된 신용 평가 시스템(100)에 의해 수행되는 것으로 그 실시예가 한정되지 않고, 다양한 형태의 전자 장치에 의해 수행될 수 있다.
결측 데이터 예측부(210)는 금융 서비스 신청 건에 대한 정보 및 신청자에 대한 정보를 포함하는 입력 데이터 세트를 입력 받는다(S302). 입력 데이터 세트는 신청 건에 관련된 적어도 하나의 항목 및 신청자에 대한 적어도 하나의 항목 중 적어도 일부 항목에 대한 값을 포함할 수 있다. 즉, 입력 데이터 세트는 적어도 하나의 항목 중 일부 항목의 값이 결측된 상태로 입력될 수 있다.
다음으로 결측 데이터 예측부(210)는 입력 데이터 세트를 입력 벡터로 변환한다. 결측 데이터 예측부(210)는 미리 정의된 형태 및 차원으로 입력 벡터를 생성할 수 있다.
도 4는 입력 벡터로부터 재구성 벡터를 생성하는 과정을 설명하기 위한 도면이다. 다음으로 도 3 및 도 4를 참조하여 입력 벡터로부터 재구성 벡터를 생성하는 과정을 설명한다.
다음으로 결측 데이터 예측부(210)는 입력 벡터(xi)로부터 입력 벡터보다 낮은 차원의 히든(hidden) 벡터(hi)를 생성한다(S304). 결측 데이터 예측부(210)는 입력 벡터(xi)에 대해 소정의 인코딩 처리를 수행하여, 입력 벡터(xi)를 더 낮은 차원의 히든 벡터(hi)로 변환할 수 있다. 히든 벡터(hi)의 각 엘리먼트의 값은 입력 벡터(xi)로부터 생성된 값이다.
다음으로 결측 데이터 예측부(210)는 히든 벡터(hi)에 대한 보정을 수행한다(S306). 히든 벡터(hi)에 대한 분포 정보는 미리 신용 평가 시스템(100)에 저장되거나, 신용 평가 시스템(100) 내에서 산출될 수 있다. 결측 데이터 예측부(210)는 히든 벡터(hi)에 대한 분포 정보에 기초하여, 입력 벡터(xi)로부터 생성된 히든 벡터(hi)의 값을 보정할 수 있다. 예를 들면, 히든 벡터(hi)에 대한 분포 정보는 소정의 n차원 공간 내에서 정의되고, 소정 개수의 히든 벡터의 클러스터가 n차원 공간 내에서 정의될 수 있다. 결측 데이터 예측부(210)는 소정의 n차원 공간 내에서 입력 벡터(xi)로부터 산출된 히든 벡터(hi)가 소정 개수의 히든 벡터의 클러스터 중 하나에 속하도록 히든 벡터(hi)의 값을 보정할 수 있다. 일 실시예에 따르면, 결측 데이터 예측부(210)는 Manifold learning 알고리즘을 이용하여 히든 벡터(hi)를 히든 벡터 분포 정보에 기초하여 보정할 수 있다. 본 개시의 실시예들은 히든 벡터의 분포 정보에 기초하여 히든 벡터를 보정함에 의해 기계 학습 모델이 랜덤 에러 또는 노이즈에 오버 피팅(over fitting)되기 어렵도록 학습하고 동작할 수 있다.
다음으로 결측 데이터 예측부(210)는 보정된 히든 벡터(hi)로부터 히든 벡터(hi)보다 높은 차원을 갖고, 입력 벡터(xi)와 같거나 높은 차원을 갖는 재구성 벡터(reconstructed vector, x'i)를 생성한다(S308). 재구성 벡터(x'i)는 입력 벡터(xi)의 결측 값에 대한 예측 값을 포함한다. 결측 데이터 예측부(210)는 재구성 벡터(x'i)를 신용 평가 처리부(220)로 출력한다.
신용 평가 처리부(220)는 입력된 재구성 벡터에 기초하여 신용 평가를 수행한다(S310). 신용 평가 처리부(220)는 기계 학습 모델을 이용하여 재구성 벡터로부터 신용 평가에 대한 결과 값을 생성할 수 있다.
도 5는 일 실시예에 따른 기계 학습 프로세서의 구조를 나타낸 블록도이다.
기계 학습 프로세서(212)는 트레이닝 데이터를 이용하여 학습된 기계 학습 모델을 이용하여 입력 벡터로부터 재구성 벡터를 생성한다. 기계 학습 프로세서(212)는 복수의 레이어로 구성될 수 있으며, 복수의 레이어는 기계 학습의 학습에 의해 생성될 수 있다. 기계 학습 프로세서(212)는 복수의 레지스터와, 복수의 레지스터들에 대해 지정된 파라미터들의 조합으로 구현될 수 있다.
기계 학습 프로세서(212)는 학습 과정에서 모든 항목에 대한 값을 갖는 입력 데이터 세트를 이용하여, 강화 학습(reinforcement learning)을 수행할 수 있다. 예를 들면, 기계 학습 프로세서(212)는 완전한 입력 데이터 세트 중 일부 항목에 대한 값이 결측된 복수의 가상 입력 데이터 세트를 생성하고, 가상 입력 데이터 세트로부터 재구성 벡터를 생성한 후 완전한 입력 데이터 세트와 비교하여 강화 학습을 수행할 수 있다.
일 실시예에 따르면, 기계 학습 프로세서(212)는 강화 학습 과정에서 적어도 하나의 보상 값(reward)을 이용할 수 있다. 적어도 하나의 보상 값은 금융기관 수익 증가, 손실 감소, 포워드 트랜스퍼(forward transfer) 성능, 백워드 트랜스퍼(backward stransfer) 성능, 및 타 금융 상품에 대한 적응성 중 적어도 하나 또는 이들의 조합을 포함할 수 있다. 금융기관 수익 증가는, 기계 학습 프로세서(212)의 예측 값에 기초하여 얼마나 금융기관의 수익이 증가하였는지를 나타내는 값이다. 손실 감소는 기계 학습 프로세서(212)의 예측 값에 기초하여 얼마나 금융 기관의 손실이 감소하였는지를 나타내는 값이다. 포워드 트랜스퍼 성능은 이전에 학습(learn)한 내용에 기초하여 새로운 지식 또는 모델을 얼마나 쉽게 잘 배우는지를 나타낸다. 백워드 트랜스퍼 성능은 새로 배운 내용이 기존에 이미 배운 내용에 대한 퍼포먼스를 향상시키는데 얼마나 도움이 되는지를 나타낸다. 타 금융 상품에 대한 적응성은 학습의 대상이 된 금융상품에서 학습한 모델이 새로운 금융상품(학습한 적이 없는 상품)에 얼마나 잘 적용되는지를 나타낸다. 기계 학습 프로세서(212)는 학습 데이터로 적어도 하나의 보상 값을 이용하고, 적어도 하나의 보상 값에 기초하여 강화 학습을 수행할 수 있다.
일 실시예에 따르면, 기계 학습 프로세서(212)는 적어도 하나의 보상 값의 컨벡스 조합(convex combination)에 기초하여 강화 학습을 수행할 수 있고, 적어도 하나의 보상 값을 고려하는 방식이 이에 한정되는 것은 아니다.
기계 학습 프로세서(212)는 복수의 레이어를 포함할 수 있다. 일 실시예에 따르면, 기계 학습 프로세서(212)는 입력 레이어(510), 부호화 레이어(520), 보정 레이어(530), 복호화 레이어(540), 및 출력 레이어(550)를 포함할 수 있다. 입력 레이어(510), 부호화 레이어(520), 보정 레이어(530), 복호화 레이어(540), 및 출력 레이어(550)는 각각 복수의 노드를 포함한다. 복수의 노드들 사이에는 가중치가 정의되고, 각 노드는 적어도 하나의 다른 노드의 값들로부터 가중치가 적용된 노드 값을 입력 받고, 입력된 값들의 합산 값에 의해 해당 노드의 노드 값이 정의될 수 있다. 각 레이어의 노드 및 노드 사이의 가중치는 기계 학습 프로세서(212) 내의 기계 학습 모델의 학습에 의해 정의될 수 있다.
입력 레이어(510)는 입력 벡터(xi)를 입력 받는다. 입력 벡터(xi)는 결측 데이터 예측부(210) 내에서 입력 데이터 세트로부터 생성될 수 있다. 입력 벡터(xi) 중 일부 엘리먼트의 값은 결측될 수 있다. 일 실시예에 따르면 기계 학습 프로세서(212)는 입력 데이터 세트를 입력 받고, 입력 레이어(510)에서 입력 데이터 세트로부터 입력 벡터(xi)를 생성할 수 있다. 입력 레이어(510)는 입력 벡터(xi)를 인식하고 입력 벡터(xi)의 엘리먼트들을 입력 레이어(510) 내의 복수의 노드들에 저장한다. 입력 레이어(510)에 입력된 입력 벡터(xi)의 엘리먼트들의 값은 소정의 가중치가 적용되고 합산되어 부호화 레이어(520) 내의 복수의 노드들로 입력된다.
부호화 레이어(520)는 입력 레이어(510)의 각 노드 값에 가중치가 부여된 합성 값을 입력 받는다. 부호화 레이어(520)는 입력 레이어(510)로부터 입력된 노드 값들로부터 입력 벡터(xi)보다 낮은 차원의 히든 벡터(hi)를 생성한다.
히든 벡터(hi)는 보정 레이어(530)로 입력된다. 보정 레이어(530)는 히든 벡터 분포에 대한 정보에 기초하여, 히든 벡터(hi)의 엘리먼트 값을 보정한다.
도 6은 일 실시예에 따른 히든 벡터 분포에 대한 정보를 나타낸 도면이다. 도 5 및 도 6을 참조하여 보정 레이어(530)의 동작을 설명한다.
신용 평가 시스템(100)은 히든 벡터 분포에 대한 정보를 저장할 수 있다. 히든 벡터 분포에 대한 정보는 미리 저장되거나, 신용 평가 시스템(100) 내에서 산출될 수 있다. 신용 평가 시스템(100)은 저장된 데이터를 이용하여 히든 벡터 분포를 산출할 수 있다. 예를 들면, 결측 데이터 예측부(210)는 신용 평가 시스템(100)에 저장된 신청자 정보 및 신청 건 정보로부터, 기계 학습 프로세서(212)를 이용하여 히든 벡터(hi)를 산출하고, 히든 벡터 분포에 대한 정보를 산출할 수 있다. 일 실시예에 따르면, 히든 벡터 분포에 대한 정보를 산출하기 위해 소정의 기계 학습 모델이 이용될 수 있다.
히든 벡터 분포에 대한 정보는, 히든 벡터 분포 상에서 정의되는 클러스터(610a, 610b, 610c, 및 610d)에 대한 정보를 포함한다. 히든 벡터는 그 데이터의 특성상 나타나는 소정의 클러스터(610a, 610b, 610c, 및 610d)를 갖는데, 이러한 클러스터(610a, 610b, 610c, 및 610d) 중 하나에 해당되도록 히든 벡터를 보정함에 의해, 결측 값의 예측 값에 대한 정확도를 향상시킬 수 있다. 또한, 기계 학습 프로세서(212)의 학습 과정에서 히든 벡터 분포 정보에 기초하여 히든 벡터를 보정하면서 학습함에 의해, 기계 학습 모델이 오버 핏팅되는 문제를 피할 수 있다.
기계 학습 모델은 학습 과정에서 특정 데이터 군에 기계 학습 모델이 오버 핏팅되는 문제 또는 catastrophic forgetting 문제가 발생할 수 있다. 본 개시의 실시예들은 기계 학습 학습에서 히든 벡터의 분포에 대한 정보를 이용하여 히든 벡터를 보정하면서 학습함에 의해, 오버 핏팅 문제 및 catastrophic forgetting 문제를 피할 수 있다.
또한, 본 개시의 실시예에 따른 신용 평가 시스템(100)은 히든 벡터를 이용하여 데이터의 분포를 보정함에 의해, 처리의 복잡도를 감소시키고, 처리 자원 및 시간을 절약할 수 있는 효과가 있다. 히든 벡터는 입력 벡터 및 재구성 벡터보다 낮은 차원의 벡터이기 때문에, 데이터의 크기가 작다. 따라서 입력 벡터 또는 재구성 벡터를 이용하여 데이터 분포에 따른 보정을 수행하는 경우에 비해, 클러스터 정의가 용이하고, 벡터의 보정을 위해 요구되는 자원 및 시간이 감소될 수 있다.
일 실시예에 따르면, 히든 벡터 분포 정보는 반복 처리(iterative process)에 의해 클러스터(610a, 610b, 610c, 및 610d) 사이의 경계(620a, 620b, 620c, 및 620d)를 업데이트하면서, 클러스터(610a, 610b, 610c, 및 610d)의 영역을 정의할 수 있다. 예를 들면, 결측 데이터 예측부(210)는 신용 평가 시스템(100)에 저장된 다수의 신청자 정보 및 신청 건 정보로부터, 히든 벡터를 산출하고, 히든 벡터의 분포를 학습하여 클러스터(610a, 610b, 610c, 및 610d) 사이의 경계(620a, 620b, 620c, 및 620d)를 학습하고 클러스터(610a, 610b, 610c, 및 610d)를 정의할 수 있다.
보정 레이어(530)는 히든 벡터 분포 정보에 기초하여 보정된 히든 벡터(hi')를 생성하여 복호화 레이어(540)로 출력한다. 복호화 레이어(540)는 보정된 히든 벡터(hi')를 입력 받아, 재구성 벡터(x'i)를 생성한다. 복호화 레이어(540)는 보정된 히든 벡터(hi')로부터 재구성 벡터(x'i)의 각 엘리먼트의 값을 생성하여 재구성 벡터(x'i)를 생성할 수 있다. 복호화 레이어(540)는 히든 벡터(hi')로부터 재구성 벡터(x'i)의 각 엘리먼트 값을 예측하도록 학습될 수 있다.
복호화 레이어(540)는 생성된 재구성 벡터(x'i)를 출력 레이어(550)로 출력한다. 출력 레이어(550)는 재구성 벡터(x'i)를 신용 평가 처리부(220)로 출력한다.
도 7은 일 실시예에 따른 기계 학습 모델의 학습 과정을 설명하기 위한 도면이다.
일 실시예에 따르면, 기계 학습 프로세서(212)에 포함된 기계 학습 모델(700)은 학습 과정에서 소정의 규칙 정보(750)를 학습하고, 학습된 규칙 정보(750)는 기계 학습 모델(700) 내의 소정의 노드 또는 레이어에 할당된다. 기계 학습 모델(700)은 복수의 레이어를 포함한다. 기계 학습 모델(700)은 입력 레이어(710), 중간 레이어(720), 및 출력 레이어(730)를 포함한다. 일 실시예에 따르면, 학습된 규칙 정보(750)는 복수의 중간 레이어(720) 내의 적어도 하나의 노드 또는 적어도 하나의 레이어에 할당될 수 있다.
규칙 정보(750)는 기계 학습 모델(700)에 의해 학습될 수 있다. 기계 학습 모델(700)은 소정의 규칙 정보(750)를 학습하고, 규칙 정보(750)의 신뢰도가 소정의 기준 값 이상 되었을 때, 학습된 규칙 정보(750)를 중간 레이어(720) 내의 소정의 노드 또는 레이어에 할당할 수 있다. 예를 들면, 규칙 정보(750)는 급여와 신용 불량 정보의 관계를 나타내는 규칙 정보 1(752), 직업과 연체 유무의 관계를 나타내는 규칙 정보 2(754) 등의 규칙 정보를 포함할 수 있다.
일 실시예에 따르면, 규칙 정보(750)는 미리 저장되거나 외부 장치로부터 입력될 수 있다. 예를 들면, 시스템 설계 과정에서 획득된 규칙 정보, 또는 다른 신용 평가 시스템에서 획득된 규칙 정보가 신용 평가 시스템(100)의 학습에 이용될 수 있다. 기계 학습 모델(700)은 미리 저장되거나 외부 장치로부터 입력된 규칙 정보(750)를 이용하여 학습을 수행하고, 규칙 정보(750)의 신뢰도가 소정의 기준 값 이상이 되면 해당 규칙 정보(750)를 기계 학습 모델(700)의 소정의 노드 또는 레이어에 할당할 수 있다.
도 8은 일 실시예에 따른 신용 평가 처리부의 동작을 설명하기 위한 도면이다.
신용 평가 처리부(220)는 재구성 벡터로부터 신청 건에 대한 신용 평가 결과 값을 생성한다. 신용 평가 처리부(220)는 다양한 기준에 기초하여 재구성 벡터로부터 신용 평가 결과 값을 생성한다.
일 실시예에 따르면, 신용 평가 처리부(220)는 신청 건이 대출 서비스인 경우, 대출 만기 시의 경제 지표 예측치에 기초하여 신용 평가 결과 값을 산출할 수 있다. 신용 평가 처리부(220)는 하나 이상의 경제 지표를 이용할 수 있다. 경제 지표는 기준 금리, 시장 금리, 국내 주가 지수, 적어도 하나의 타국의 주가 지수, 물가 지수 등의 지표를 포함할 수 있다. 예를 들면, 신용 평가 처리부(220)는 대출 만기 시에 경제 지표 예측치가 양호한 경우 신용도를 높이거나, 리스크를 낮출 수 있다. 또한, 신용 평가 처리부(220)는 대출 만기 시에 경제 지표 예측치가 부정적인 경우, 신용도를 낮추거나 리스크를 높일 수 있다.
일 실시예에 따르면, 신용 평가 처리부(220)는 미리 저장되거나 외부 장치로부터 입력된 경제 지표 예측치를 이용하여, 경제 지표 예측치에 기초한 신용 평가를 수행할 수 있다. 다른 실시예에 따르면, 신용 평가 시스템(100)은 경제 지표 예측치를 생성하기 위한 처리를 수행할 수 있다. 예를 들면 경제 지표 예측을 위한 알고리즘에 의해 동작하는 프로세서가 현재의 경제 지표 및 소정의 관련 데이터를 이용하여 경제 지표 예측치를 산출할 수 있다. 일 실시예에 따르면, 신용 평가 시스템(100)은 소정의 기계 학습 모델을 이용하여 경제 지표 예측치를 생성할 수 있다.
일 실시예에 따르면, 결측 데이터 예측부(210)의 기계 학습 프로세서(212)는 신청자의 위치 정보 이력에 기초하여, 신청자 성향 항목의 값을 생성하고, 재구성 벡터 내에 신청자 성향 항목에 대응하는 값을 기록할 수 있다. 입력 데이터 세트는 신청자의 위치 정보 이력을 포함할 수 있다. 신청자가 집과 회사에서 시간을 보내는 비율이 높은 경우, 신청자는 소비 성향이 낮게 평가될 수 있다. 반면에 신청자가 쇼핑, 유흥, 레저 등과 관련된 장소에서 시간을 보내는 비율이 높은 경우, 신청자는 소비 성향이 높게 평가될 수 있다. 이러한 원리로, 기계 학습 프로세서(212)는 신청자의 위치 정보 이력에 기초하여 신청자 성향 항목의 값을 생성할 수 있다.
한편, 개시된 실시예들은 컴퓨터에 의해 실행 가능한 명령어 및 데이터를 저장하는 컴퓨터로 읽을 수 있는 기록매체의 형태로 구현될 수 있다. 상기 명령어는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 소정의 프로그램 모듈을 생성하여 소정의 동작을 수행할 수 있다. 또한, 상기 명령어는 프로세서에 의해 실행되었을 때, 개시된 실시예들의 소정의 동작들을 수행할 수 있다.
이상에서와 같이 첨부된 도면을 참조하여 개시된 실시 예들을 설명하였다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고도, 개시된 실시 예들과 다른 형태로 본 발명이 실시될 수 있음을 이해할 것이다. 개시된 실시 예들은 예시적인 것이며, 한정적으로 해석되어서는 안 된다.

Claims (12)

  1. 기계 학습을 이용하여, 금융 서비스 신청 건에 관련된 적어도 하나의 항목 및 신청자에 대한 적어도 하나의 항목 중 적어도 일부 항목에 대한 값을 포함하는 입력 데이터 세트를 입력 받아, 상기 입력 데이터 세트에 대응하는 입력 벡터로부터 상기 입력 벡터보다 낮은 차원의 히든(hidden) 벡터를 생성하고, 상기 히든 벡터를 히든 벡터 분포에 기초하여 보정하고, 상기 보정된 히든 벡터로부터 상기 입력 데이터 세트의 적어도 하나의 항목에 대한 값 중 결측 값에 대한 예측 값을 포함하는 재구성 벡터를 출력하는 결측 데이터 예측부; 및
    상기 재구성 벡터에 기초하여 상기 신청 건에 대한 신용 평가를 수행하는 신용 평가 처리부를 포함하는 신용 평가 시스템.
  2. 제1항에 있어서,
    상기 기계 학습 프로세서는,
    상기 입력 데이터 세트를 입력 받아 입력 벡터를 생성하는 입력 레이어;
    상기 입력 벡터보다 낮은 차원의 히든 벡터를 출력하는 부호화 레이어;
    학습된(learned) 히든 벡터 분포에 기초하여 상기 히든 벡터를 보정하는 보정 레이어;
    상기 보정된 히든 벡터를 입력 받아, 상기 재구성 벡터를 생성하는 복호화 레이어; 및
    상기 재구성 벡터를 출력하는 출력 레이어를 포함하는, 신용 평가 시스템.
  3. 제1항에 있어서,
    상기 기계 학습 프로세서는,
    상기 입력 데이터 세트의 항목들 사이의 관계에 대한 규칙 정보를 학습(learn)하고, 상기 학습된 규칙 정보에 기초하여 상기 복호화 레이어를 업데이트(update)하는, 신용 평가 시스템.
  4. 제1항에 있어서,
    상기 신청자에 대한 적어도 하나의 항목은, 성별, 나이, 결혼 여부, 자녀 유무, 주택 종류, 자가 여부, 직업, 급여 생활자 여부, 수입, 자산, 담보 유무, 기존 대출 유무, 보증 유무, 기존 대출 금액, 연체 유무, 또는 신용 불량 여부 중 적어도 하나 또는 이들의 조합을 포함하는, 신용 평가 시스템.
  5. 제1항에 있어서,
    상기 신청 건에 관련된 적어도 하나의 항목은, 금융 서비스 종류, 담보 유무, 신청 금액, 대출 기간, 또는 원금 상환 여부 중 적어도 하나 또는 이들의 조합을 포함하는, 신용 평가 시스템.
  6. 제1항에 있어서,
    상기 기계 학습 프로세서는, 신청 건 정보, 신청자에 대한 정보, 및 신용 평가 결과를 포함하는 트레이닝 데이터에 기초하여 강화 학습(reinforcement learning)된, 신용 평가 시스템.
  7. 제1항에 있어서,
    상기 기계 학습 프로세서는, 적어도 하나의 보상 값을 이용하여 강화 학습되고, 상기 적어도 하나의 보상 값은 금융기관 수익 증가, 손실 감소, 포워드 트랜스퍼 성능, 백워드 트랜스퍼 성능, 및 타 금융 상품에 대한 적응성 중 적어도 하나 또는 이들의 조합을 포함하는, 신용 평가 시스템.
  8. 제1항에 있어서,
    상기 신용 평가 처리부는, 기간에 따른 예측 경제 지표를 입력 받고, 상기 예측 경제 지표 및 상기 재구성 벡터에 기초하여 신용 평가를 수행하는, 신용 평가 시스템.
  9. 제1항에 있어서,
    상기 신청자에 대한 적어도 하나의 항목은, 상기 신청자의 위치 정보 이력을 포함하고,
    상기 기계 학습 프로세서는, 상기 신청자의 위치 정보 이력에 기초하여 생성된 신청자 성향 항목에 대응하는 값을 포함하는 재구성 벡터를 생성하는, 신용 평가 시스템.
  10. 제1항에 있어서,
    상기 재구성 벡터는 상기 입력 벡터보다 높은 차원을 갖고, 상기 입력 벡터에 기초하여 상기 기계 학습 프로세서에 의해 생성된 추가 생성 정보 항목을 포함하는, 신용 평가 시스템.
  11. 금융 서비스 신청 건에 관련된 적어도 하나의 항목 및 신청자에 대한 적어도 하나의 항목 중 적어도 일부 항목에 대한 값을 포함하는 입력 데이터 세트를 입력 받는 단계;
    기계 학습 프로세서에 의해 상기 입력 데이터 세트에 대응하는 입력 벡터로부터 상기 입력 벡터보다 낮은 차원의 히든(hidden) 벡터를 생성하는 단계;
    상기 기계 학습 프로세서에 의해 상기 히든 벡터를 히든 벡터 분포에 기초하여 보정하는 단계;
    상기 기계 학습 프로세서에 의해 상기 보정된 히든 벡터로부터 상기 입력 데이터 세트의 적어도 하나의 항목에 대한 값 중 결측 값에 대한 예측 값을 포함하는 재구성 벡터를 출력하는 단계; 및
    상기 재구성 벡터에 기초하여 상기 대상자에 대한 신용 평가를 수행하는 단계를 포함하는 신용 평가 방법.
  12. 프로세서에 의해 실행되었을 때, 상기 프로세서가 신용 평가 방법을 수행하도록 명령하는 적어도 하나의 명령어를 저장하는 기록 매체를 포함하는 컴퓨터 프로그램에 있어서, 상기 신용 평가 방법은,
    금융 서비스 신청 건에 관련된 적어도 하나의 항목 및 신청자에 대한 적어도 하나의 항목 중 적어도 일부 항목에 대한 값을 포함하는 입력 데이터 세트를 입력 받는 단계;
    기계 학습 프로세서에 의해 상기 입력 데이터 세트에 대응하는 입력 벡터로부터 상기 입력 벡터보다 낮은 차원의 히든(hidden) 벡터를 생성하는 단계;
    상기 기계 학습 프로세서에 의해 상기 히든 벡터를 히든 벡터 분포에 기초하여 보정하는 단계;
    상기 기계 학습 프로세서에 의해 상기 보정된 히든 벡터로부터 상기 입력 데이터 세트의 적어도 하나의 항목에 대한 값 중 결측 값에 대한 예측 값을 포함하는 재구성 벡터를 출력하는 단계; 및
    상기 재구성 벡터에 기초하여 상기 대상자에 대한 신용 평가를 수행하는 단계를 포함하는, 컴퓨터 프로그램.
PCT/KR2019/012791 2019-09-27 2019-10-01 기계 학습을 이용한 신용 평가를 위한 시스템, 방법, 및 컴퓨터 프로그램 WO2021060593A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2019-0119250 2019-09-27
KR1020190119250A KR102156757B1 (ko) 2019-09-27 2019-09-27 기계 학습을 이용한 신용 평가를 위한 시스템, 방법, 및 컴퓨터 프로그램

Publications (1)

Publication Number Publication Date
WO2021060593A1 true WO2021060593A1 (ko) 2021-04-01

Family

ID=72669654

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/012791 WO2021060593A1 (ko) 2019-09-27 2019-10-01 기계 학습을 이용한 신용 평가를 위한 시스템, 방법, 및 컴퓨터 프로그램

Country Status (2)

Country Link
KR (1) KR102156757B1 (ko)
WO (1) WO2021060593A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102531742B1 (ko) * 2020-11-27 2023-05-11 이화여자대학교 산학협력단 센서 데이터의 누락값 보정 방법 및 누락값 보정 장치
CN112613985A (zh) * 2020-12-28 2021-04-06 恒瑞通(福建)信息技术有限公司 一种信用评估模型的数据处理方法及终端
KR20220108748A (ko) * 2021-01-27 2022-08-03 주식회사 에이젠글로벌 비금융 정보를 이용하여 금융 관련 정보를 생성하는 방법 및 상기 방법을 수행하는 금융 정보 생성 장치
KR102368010B1 (ko) * 2021-07-20 2022-02-25 리포츠 주식회사 운동 생활정보에 기초한 인공지능 기반의 대안적 신용평가정보 제공 방법 및 시스템
CN113590807B (zh) * 2021-08-05 2023-07-25 苏州工业园区企业发展服务中心 一种基于大数据挖掘的科技企业信用评价方法
KR102433935B1 (ko) * 2022-01-12 2022-08-19 주식회사 에이젠글로벌 Cb 사 신용 평가 모델 생성 및 관리 자동화 방법 및 이러한 방법을 수행하는 장치
KR102464057B1 (ko) * 2022-07-22 2022-11-09 한승현 인공지능을 이용한 신용점수 기반의 렌탈 서비스 제공 장치 및 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090030144A (ko) * 2007-09-19 2009-03-24 한국전자통신연구원 네트워크 기반 로봇을 위한 서비스 추천 방법 및 서비스추천 장치
KR20120134849A (ko) * 2011-06-03 2012-12-12 고광이 여신한도관리 방법 및 시스템
US20140229158A1 (en) * 2013-02-10 2014-08-14 Microsoft Corporation Feature-Augmented Neural Networks and Applications of Same
KR20180069452A (ko) * 2016-12-15 2018-06-25 삼성전자주식회사 뉴럴 네트워크의 학습 방법 및 뉴럴 네트워크를 이용한 인식 방법, 및 그 장치
KR20180119674A (ko) * 2016-06-12 2018-11-02 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 사용자 신용 평가 방법 및 장치, 그리고 저장 매체

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090030144A (ko) * 2007-09-19 2009-03-24 한국전자통신연구원 네트워크 기반 로봇을 위한 서비스 추천 방법 및 서비스추천 장치
KR20120134849A (ko) * 2011-06-03 2012-12-12 고광이 여신한도관리 방법 및 시스템
US20140229158A1 (en) * 2013-02-10 2014-08-14 Microsoft Corporation Feature-Augmented Neural Networks and Applications of Same
KR20180119674A (ko) * 2016-06-12 2018-11-02 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 사용자 신용 평가 방법 및 장치, 그리고 저장 매체
KR20180069452A (ko) * 2016-12-15 2018-06-25 삼성전자주식회사 뉴럴 네트워크의 학습 방법 및 뉴럴 네트워크를 이용한 인식 방법, 및 그 장치

Also Published As

Publication number Publication date
KR102156757B1 (ko) 2020-09-16

Similar Documents

Publication Publication Date Title
WO2021060593A1 (ko) 기계 학습을 이용한 신용 평가를 위한 시스템, 방법, 및 컴퓨터 프로그램
CN107392255B (zh) 少数类图片样本的生成方法、装置、计算设备及存储介质
Butterfield et al. A dictionary of computer science
CORNUET et al. Adaptive multiple importance sampling
US9928040B2 (en) Source code generation, completion, checking, correction
Hitomi et al. A classification and comparison of credit assignment strategies in multiobjective adaptive operator selection
WO2020168851A1 (zh) 行为识别
CN112905187B (zh) 编译方法、装置、电子设备及存储介质
CN117033802B (zh) 基于ai辅助的授课题目推送方法及系统
CN111209930B (zh) 一种生成授信策略的方法、装置和电子设备
CN112990958A (zh) 数据处理方法、装置、存储介质及计算机设备
CN115330435A (zh) 一种碳排放权价格指标体系建立方法、装置、设备及介质
CN115062716A (zh) 融合学习行为特征的知识追踪方法、系统及存储介质
CN115034596A (zh) 一种风险传导预测方法、装置、设备和介质
WO2018182179A1 (en) Method and apparatus for asset management
US20240020531A1 (en) System and Method for Transforming a Trained Artificial Intelligence Model Into a Trustworthy Artificial Intelligence Model
CN115629576A (zh) 非侵入式柔性负荷聚合特性辨识与优化方法、装置及设备
CN111126566B (zh) 基于gan模型的异常家具布局数据检测方法
CN113961962A (zh) 一种基于隐私保护的模型训练方法、系统及计算机设备
JP2021135683A (ja) 学習装置、推論装置、学習方法及び推論方法
CN112419025A (zh) 用户数据处理方法和装置、存储介质、电子设备
CN111882415A (zh) 一种质量检测模型的训练方法和相关装置
WO2022270947A1 (ko) 투자 가이드를 제공하는 서버, 방법 및 컴퓨터 프로그램
WO2020105776A1 (ko) 에이전트 기반 시뮬레이션에서 기계학습을 이용한 미시 시뮬레이션 파리미터 교정 방법 및 장치
Saeed et al. Applications of Machine Learning in Battling Against Novel COVID-19

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19946587

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19946587

Country of ref document: EP

Kind code of ref document: A1