KR102566466B1 - 개인의 신용도 평가를 위한 대체 신용 평가 시스템 - Google Patents

개인의 신용도 평가를 위한 대체 신용 평가 시스템 Download PDF

Info

Publication number
KR102566466B1
KR102566466B1 KR1020220170965A KR20220170965A KR102566466B1 KR 102566466 B1 KR102566466 B1 KR 102566466B1 KR 1020220170965 A KR1020220170965 A KR 1020220170965A KR 20220170965 A KR20220170965 A KR 20220170965A KR 102566466 B1 KR102566466 B1 KR 102566466B1
Authority
KR
South Korea
Prior art keywords
data
information
relevance
credit
unit
Prior art date
Application number
KR1020220170965A
Other languages
English (en)
Inventor
김민정
배성수
Original Assignee
크레파스솔루션(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 크레파스솔루션(주) filed Critical 크레파스솔루션(주)
Priority to KR1020220170965A priority Critical patent/KR102566466B1/ko
Application granted granted Critical
Publication of KR102566466B1 publication Critical patent/KR102566466B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Educational Administration (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Technology Law (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

개인의 신용도 평가를 위한 대체 신용 평가 시스템을 개시한다.
본 실시예의 일 측면에 의하면, 개인용 단말로부터 수신한 개인정보, 영리행위를 하거나 그를 준비하기 위한 영리활동 정보 및 서비스 이용요금 정보를, 금융기관 서버로부터 수신한 금융 정보를 수신하는 통신부와 인공지능 학습모델의 학습을 위한 데이터를 전처리하는 전처리부와 전처리를 거친 각 데이터들 간의 관련도 및 각 데이터와 결과값과의 관련도를 분석하는 관련도 분석부와 상기 관련도 분석부를 거친 데이터들을 이용하여 인공지능 모델을 학습시키며, 학습된 인공지능 학습모델을 이용해 상기 통신부가 수신한 데이터로부터 개인의 신용도를 평가하는 신용도 평가부 및 상기 신용도 평가부가 인공지능 모델을 학습시키기 위한 데이터들 및 상기 신용도 평가부가 생성한 인공지능 학습모델을 저장하는 메모리부를 포함하는 것을 특징으로 하는 대체 신용 평가 장치를 제공한다.

Description

개인의 신용도 평가를 위한 대체 신용 평가 시스템{Alternative Credit Rating System for Evaluating Personal Credit}
본 발명은 개인의 신용도를 평가함에 있어, 종래의 금융정보로 측정이 불가능한 영역의 신용도를 평가 할 수 있는 대체 신용 평가 시스템에 관한 것이다.
이 부분에 기술된 내용은 단순히 본 실시예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.
보통 개인에 대한 신용평가를 하는 예측기법은 우리나라 사회의 신용평가 기법의 다양화와 과거 데이터의 축적으로 예측에 대한 정확성을 확인하면서 더욱 정교하게 발전을 해왔다. 개인에 대한 신용평가시스템은 개인 고객의 신용도를 평가/산정해 신용대출 가능 여부와 대출한도, 적용금리 등을 알려 주는 시스템이다. 구체적으로, 개인의 과거 신용거래정보, 소득상황, 재무상황, 금융기관 거래정보 등을 통계적으로 분석한 후 가까운 미래의 신용도를 예측하여 대출여부, 대출금액, 여신관련 의사결정을 신속하게 알려주는 자동전산시스템이다.
이러한 시스템은 일정 수준의 정기적인 소득이 있거나 담보물 등으로 제시할 자산을 축적하고 있는 개인은 신용도가 높아질 수 있지만, 그러하지 못한 개인은 신용도가 높게 평가될 수 없는 구조를 갖는다.
이에, 일정 수준 이상의 (정기적인) 소득이 없거나, 자산이 없는 사람들에게도 부족한 자금을 지원함으로써, 실질적인 생활에 도움이 되고 사회의 일원으로 책임을 다하게 만들어주는 평가기법에 대한 수요가 등장하고 있으나, 현 실정에선 이러한 판단 시스템이 전무한 상황이다.
본 발명의 일 실시예는, 금융정보 외 신용도를 평가할만한 다양한 정보를 고려하여 개인의 신용도를 평가하는 대체 신용 평가 시스템을 제공하는 데 일 목적이 있다.
본 발명의 일 측면에 의하면, 개인용 단말로부터 수신한 개인정보, 영리행위를 하거나 그를 준비하기 위한 영리활동 정보 및 서비스 이용요금 정보를, 금융기관 서버로부터 수신한 금융 정보를 수신하는 통신부와 인공지능 학습모델의 학습을 위한 데이터를 전처리하는 전처리부와 전처리를 거친 각 데이터들 간의 관련도 및 각 데이터와 결과값과의 관련도를 분석하는 관련도 분석부와 상기 관련도 분석부를 거친 데이터들을 이용하여 인공지능 모델을 학습시키며, 학습된 인공지능 학습모델을 이용해 상기 통신부가 수신한 데이터로부터 개인의 신용도를 평가하는 신용도 평가부 및 상기 신용도 평가부가 인공지능 모델을 학습시키기 위한 데이터들 및 상기 신용도 평가부가 생성한 인공지능 학습모델을 저장하는 메모리부를 포함하는 것을 특징으로 하는 대체 신용 평가 장치를 제공한다.
본 발명의 일 측면에 의하면, 상기 개인정보는 개인의 직업, 나이, 학력 또는 개인의 시간대 별 휴대폰 통화시간을 포함하는 것을 특징으로 한다.
본 발명의 일 측면에 의하면, 상기 영리활동 정보는 자산 또는 소득을 창출하거나 그를 증가시키기 위해 하는 행위를 의미하는 것을 특징으로 한다.
본 발명의 일 측면에 의하면, 상기 영리활동 정보는 학원을 다니거나 자격증을 취득하는 행위를 포함하는 것을 특징으로 한다.
본 발명의 일 측면에 의하면, 상기 서비스 이용요금 정보는 타인 또는 외부로부터 서비스를 제공받기 위해 지불하는 요금에 관한 정보를 포함하는 것을 특징으로 한다.
본 발명의 일 측면에 의하면, 상기 전처리부는 인공지능 학습모델의 학습을 위한 데이터 내 존재하는 결측치(Missing Value)를 보상하는 것을 특징으로 한다.
본 발명의 일 측면에 의하면, 상기 전처리부는 결측치 또는 결측치가 존재하는 데이터 셋을 제거하는 것을 특징으로 한다.
본 발명의 일 측면에 의하면, 상기 전처리부는 상기 결측치를 기 설정된 값으로 대체하는 것을 특징으로 한다.
본 발명의 일 측면에 의하면, 신용평가를 받기 위한 개인이 소지하는 단말로서, 개인정보, 영리행위를 하거나 그를 준비하기 위한 영리활동 정보 및 서비스 이용요금 정보를 전송하는 개인용 단말과 개인의 금융정보를 저장하며, 외부로부터 요청이 있을 경우 외부로 상기 개인의 금융정보를 제공하는 금융기관 서버 및 상기 대체 신용 평가 장치를 포함하는 것을 특징으로 하는 대체 신용 평가 시스템을 제공한다.
본 발명의 일 측면에 의하면, 상기 금융정보는 소득이나 자산에 관한 정보, 대출 여부, 연체 여부, 상환 기간 또는 상관 방법 등 금융거래를 하거나 하기 위해 필요한 모든 정보를 포함하는 것을 특징으로 한다.
이상에서 설명한 바와 같이, 본 발명의 일 측면에 따르면, 금융정보 외 신용도를 평가할만한 다양한 정보를 고려하여 개인의 신용도를 평가함에 따라, 종래의 신용평가 시스템으로 부정확한 평가를 받는 개개인들에 대해 상대적으로 정확히 신용을 평가할 수 있는 장점이 있다.
도 1은 본 발명의 일 실시예에 따른 대체 신용 평가 시스템의 구성을 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 대체 신용 평가 장치의 구성을 도시한 도면이다.
도 3은 본 발명의 일 실시예에 따른 대체 신용 평가 장치가 각 변수들의 결과에 대한 관련도를 측정하기 위해 고려하는 요소를 도시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 대체 신용 평가 장치가 각 변수들의 결과에 대한 관련도를 측정한 결과를 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 신용도 평가모델의 정확도를 판단하기 위해 고려하는 요소를 도시한 도면이다.
도 6은 본 발명의 일 실시예에 따른 신용도 평가모델의 정확도를 도시한 그래프이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시 예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에서, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서 "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해서 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.
일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
또한, 본 발명의 각 실시예에 포함된 각 구성, 과정, 공정 또는 방법 등은 기술적으로 상호간 모순되지 않는 범위 내에서 공유될 수 있다.
도 1은 본 발명의 일 실시예에 따른 대체 신용 평가 시스템의 구성을 도시한 도면이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 대체 신용 평가 시스템(100, 이하에서 '시스템'이라 약칭함)은 개인용 단말(110), 금융기관 서버(120) 및 대체 신용 평가 장치(130, 이하에서 '장치'라 약칭함)를 포함한다.
시스템(100)은 대출 등의 금융 서비스를 제공하기 위해 개인의 신용정보를 평가해야 하는 금융기관으로 대체 신용정보를 제공하여 개인에게 대체적인 신용 평가가 이루어지도록 한다. 시스템(100)은 종래와 같이 소득 또는 자산 등의 금융정보에 한정된 신용 평가를 너머, 금융정보 뿐만 아니라 개인의 소비 패턴이나 소득이나 자산을 벌기 위한 영리 행위 준비 상태 등 신용에 영향을 미칠 수 있는 다양한 정보를 종합적으로 고려하여 개인의 신용을 (대체적으로) 평가한다.
개인용 단말(110)은 신용 평가를 받기 위한 개인이 소지하는 단말로서, 장치(130)와 통신하며 개인정보, 영리행위를 하거나 그를 준비하기 위한 영리활동 정보 및 서비스 이용요금 정보를 전송한다. 개인용 단말(110)은 개인이 소지하며 외부와 통신을 수행할 수 있는 기기, 예를 들어, PC 또는 모바일 단말 등으로 구현된다. 개인용 단말(110)은 장치(130)로 전술한 정보를 전송한다. 여기서, 개인정보는 개인의 직업, 나이 또는 학력 등의 정보나 시간대 별 휴대폰 통화시간 등의 정보를 포함한다. 영리행위를 하거나 그를 준비하기 위한 활동정보는 자산 또는 소득을 창출하거나 그를 증가시키기 위해 하는 모든 행위를 의미하며, 예를 들어, 학원을 다닌다거나, 자격증을 취득하는 등의 행위를 포함한다. 서비스 이용요금 정보는 타인 또는 외부로부터 서비스를 제공받기 위해 지불하는 요금에 관한 정보로서, 모바일 단말 등으로부터 제공되는 애플리케이션의 과금 정보, 개인용 단말 등으로 제공되는 다양한 서비스(예를 들어, 음원 제공 또는 영상제공 등)의 이용요금 등을 포함한다. 개인용 단말(110)은 (신용 평가를 받기 위한) 개인으로부터 전술한 정보들을 입력받아 장치(130)로 전송한다.
금융기관 서버(120)는 개인의 금융정보를 저장하며, 장치(130)로부터 요청이 있을 경우 장치(130)로 제공한다. 금융기관 서버(120)는 개인의 금융정보를 저장한다. 금융정보는 개인의 자산 또는 소득에 관한 정보와 함께, 대출 여부, 연체 여부, 상환 기간 또는 상관 방법 등 금융거래를 하거나 하기 위해 필요한 모든 정보를 포함한다. 금융기관 서버(120)는 이들을 저장하며, 장치(130)의 요청에 따라 장치(130)로 전송한다.
장치(130)는 금융기관 서버(120)로부터 수신한 금융 정보 뿐만 아니라, 개인용 단말(110)로부터 수신한 개인정보, 영리활동 정보 및 서비스 이용요금 정보를 수신하여, 개인의 신용을 평가한다. 종래와 달리, 장치(130)는 금융 정보 뿐만 아니라 개인의 전술한 정보를 모두 고려하여 대체적으로 개인의 신용을 평가한다. 장치(130)의 구체적인 동작은 도 2 내지 6을 참조하여 후술한다.
시스템(100)은 장치(130)를 이용해 대체적으로 개인의 신용정보를 평가하기 때문에. 소득 또는 자산이 존재하는 개인들 뿐만 아니라 그렇지 않은 개개인들도 세분화하여 상대적으로 정확히 신용정보를 평가할 수 있다. 특히, 시스템(100)은 현재 소득이나 자산은 없지만, 특정 개인의 소비 패턴이나 향후 소득이나 자산의 증가 가능성을 분석하여 그들의 신용을 평가한다. 시스템(100)은 종래의 경우라면 신용도가 현저히 낮을 대상들에 대해서도 대체적으로 신용을 평가하여 신용도를 책정하므로, 금융기관의 손해는 최소화하면서도 개인들이 대체적으로 평가된 신용정보를 이용할 수 있도록 한다.
도 2는 본 발명의 일 실시예에 따른 대체 신용 평가 장치의 구성을 도시한 도면이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 장치(130)는 통신부(210), 전처리부(220), 관련도 분석부(230), 신용도 평가부(240), 정확도 판단부(250) 및 메모리부(260)를 포함한다.
통신부(210)는 개인용 단말(110)로부터 수신한 개인정보, 영리활동 정보 및 서비스 이용요금 정보를, 금융기관 서버(120)로부터 수신한 금융 정보를 수신한다. 통신부(210)는 신용도 평가부(240)가 판단한 신용도를 금융기관 서버(120) 또는 신용도를 요청하는 외부의 다른 장치로 전송할 수 있다.
전처리부(220)는 인공지능 학습모델의 학습을 위한 데이터를 전처리한다. 후술할 바와 같이, 신용도 평가부(240)는 통신부(210)가 수신한 데이터를 입력값으로, 개인의 신용정보를 출력값으로 학습한 인공지능 학습모델을 이용하여, 개인의 신용도를 평가한다. 전처리부(220)는 이러한 인공지능 학습모델의 학습을 위한 데이터들을 전처리한다. 학습을 위한 수많은 데이터들이 오롯이 존재하는 것이 아니라, 신용도를 평가하는 과정에서 필요한 모든 데이터들이 포함되어 있지 않을 수 있다. 즉, 신용도를 평가하기 위한 모든 데이터가 포함되어 있지 않고 결측치(Missing Value)가 존재할 수 있다. 이러한 결측치는 주로 개인용 단말로부터 수신하는 개인정보, 영리활동 정보 및 서비스 이용요금 정보에 발생할 가능성이 높다. 전처리부(220)는 이러한 결측치를 보상한다.
전처리부(220)는 결측치 또는 결측치가 존재하는 데이터 셋을 제거할 수 있다. 학습을 위한 데이터 내에 데이터 포맷에 적합하지 않거나 범위를 벗어나는 데이터들이 존재할 수 있다. 전처리부(220)는 이러한 데이터들은 정확도에 영향을 미치기 때문에 아예 제거를 할 수 있다. 예를 들어, 한계치가 존재하는 데이터 내에서 한계치를 벗어나는 데이터이거나, 숫자가 입력되어야 하는 데이터에 문자가 입력되는 등의 경우가 존재할 수 있다. 전처리부(220)는 이러한 데이터들에 대해서는 데이터 만을 제거하거나 해당 데이터와 함께 저장된 데이터 셋 전체를 제거할 수 있다.
전처리부(220)는 결측치를 기 설정된 값으로 대체한다. 전처리부(220)는 특정 데이터에 결측이 존재하는 경우, 해당 데이터를 기 설정된 값으로 대체한다. 여기서, 결측 데이터가 수치형인 경우, 기 설정된 값은 해당 데이터의 모집단의 평균치 또는 중앙값일 수 있고, 결측 데이터가 수치형이 아닌 경우, 모집단 내 해당 데이터들의 최빈값일 수 있다. 또는, 전처리부(220)는 결측치를 조건부로 대치(Similar Case Imputation)할 수도 있고, 회귀분석을 이용하여 대치(Generalized Imputation)할 수도 있다.
전처리부(220)는 전술한 과정을 이용하여, 결측치를 보상한다.
나아가, 전처리부(220)는 인공지능 학습모델의 학습을 위한 데이터들 및 결측치를 보상한 데이터들에 대해 정규화(Normalizing)를 진행할 수 있다. 전처리부(220)가 정규화를 진행할 경우, 데이터들 간의 상대적인 비교가 보다 수월해질 수 있다. 전처리부(220)는 최소-최대 표준화(Min-max Standardization), z-스코어 표준화(z-score Standardization), 소수점으로의 변환에 의한 표준화(Standardization by Decimal Scaling) 방법 중 어느 하나를 이용하여 정규화를 진행할 수 있다.
관련도 분석부(230)는 전처리를 거친 각 데이터들 간의 관련도 및 각 데이터와 결과값과의 관련도를 분석한다.
관련도 분석부(230)는 먼저 각 데이터들 상호간에 얼마만큼 관련도가 있는지를 분석한다. 특정 데이터들 상호간에 관련도가 지나치게 높아질 경우, 해당 데이터들의 변화가 결과값(개인의 신용도)에 지나치게 영향을 미치게 된다. 즉, 동일하게 변화하더라도 다른 데이터들이 변화할 때보다, 관련도가 지나치게 높아진 데이터들이 변화할 때 결과값이 극적으로 변화하게 된다. 이는 신용도 평가에 있어 악영향을 미치기 때문에, 지양해야 한다. 관련도 분석부(230)는 각 데이터들 상호간에 얼마만큼 관련도가 있는지 분석한다. 관련도 분석부(230)는 단변량 유의성분석 방법(Univariate Analysis), Pearson 상관계수 산출방법, Spearman 상관계수 산출방법 또는 Kendall 상관계수 산출방법을 이용할 수 있다. 단변량 유의성 분석 방법은 각 변수들과 상수 사이에 통계적 관계가 있는지를 계산하여 관련 있는 변수들을 선별하는 방법이다. 관련도 분석부(230)는 전술한 방법 중 어느 하나를 사용하여 각 변수들 간의 관련도를 분석한다. 관련도가 기 설정된 기준치 이상인 변수들(데이터)에 대해, 관련도 분석부(230)는 후술할 공정(데이터와 결과값 간의 관련도)을 토대로 결과값에 덜 관련있는 변수 일부 또는 전부를 필터링한다. 전술한 데이터를 필터링함으로써, 관련도 분석부(230)는 상호 간에 독립적인 데이터들만을 선별한다.
관련도 분석부(230)는 각 데이터와 결과값(개인의 신용도) 간의 관련도를 분석한다. 각 데이터와 결과값의 관련도를 분석함에 있어 고려되는 요소들은 도 3에 도시되어 있다.
도 3은 본 발명의 일 실시예에 따른 대체 신용 평가 장치가 각 변수들의 결과에 대한 관련도를 측정하기 위해 고려하는 요소를 도시한 도면이다.
도 3을 참조하면, 부실분포(DB)는 전체 대출건수 대비 연체 건수의 비율을 의미한다. 정상분포(DG)는 전체 대출건수 대비 정상 상환건수의 비율을 의미한다.
가중치(WoE: Weight of Evidence)는 다음과 같이 연산된다.
Figure 112022132356592-pat00001
관련도 분석부(230)는 각 데이터에 대해 연령대 별 가중치를 연산한다. 관련도 분석부(230)는 각 연령대별 가중치를 연산한 후, 가중치 및 정상분포와 부실분포의 차이값을 이용하여 최종적인 (각 데이터와 결과값의) 관련도를 연산한다.
Figure 112022132356592-pat00002
관련도 분석부(230)는 전술한 수식을 이용하여 각 연령대 별 최종적인 관련도를 연산하고, 각 연령대 별 관련도를 합산함으로써, 각 데이터와 결과값의 관련도를 연산한다.
관련도 분석부(230)는 각 데이터와 결과값의 관련도가 기 설정된 범위를 벗어난 변수들을 필터링한다. 결과값과의 관련도가 낮아 기 설정된 범위를 벗어난 데이터들을 학습하는데 입력값으로 이용하는 것은, 오히려 데이터 처리 과정만 복잡해질 뿐 결과값의 정확도도 떨어뜨리는 문제를 야기할 수 있기 때문이다. 한편, 결과값과의 관련도가 지나치게 높아 기 설정된 범위를 벗어난 데이터들은 오히려 너무 정확하기에 예측이 의심스러울 수 있다. 따라서, 관련도 분석부(230)는 도 4에 도시된 바와 같이 관련도를 측정하여 분석한다.
도 4는 본 발명의 일 실시예에 따른 대체 신용 평가 장치가 각 변수들의 결과에 대한 관련도를 측정한 결과를 도시한 도면이다.
도 4에 도시된 바와 같이, 기 설정된 범위는 0.02 내지 0.5 사이의 범위일 수 있다. 0.02 미만의 관련도를 갖는 데이터는 관련도가 낮아 예측력이 없으며, 0.5를 초과하는 관련도를 갖는 데이터는 너무 정확해(관련도가 너무 높아)서 오히려 예측력이 의심스러운 데이터에 해당한다.
다시 도 2를 참조하면, 관련도 분석부(230)는 전술한 바와 같이 관련도를 분석하여, 전처리부(220)를 거친 데이터들 중 상호 간에 관련도가 지나치게 높은 데이터들 및 결과값과 관련도가 낮은 데이터들을 필터링한다.
신용도 평가부(240)는 관련도 분석부(230)를 거친 데이터들을 이용하여 인공지능 모델을 학습시키며, 학습된 인공지능 학습모델을 이용해 통신부(210)가 수신한 데이터로부터 개인의 신용도를 평가한다.
신용도 평가부(240)는 관련도 분석부(230)를 거친 데이터들을 이용하여 인공지능 모델을 학습시킨다. 신용도 평가부(240)는 관련도 분석부(230)를 거친 데이터들을 입력값으로, 각 데이터를 갖는 개개인들의 신용도를 출력값으로 하여, XGBoost 머신러닝 알고리즘을 학습시킨다. XGBoost 머신러닝 알고리즘은 Boosting 기법을 이용한 알고리즘으로서, 학습 에러에 가중치를 두고 순차적으로 학습모델에 반영하는 알고리즘에 해당한다. 신용도 평가부(240)는 전술한 알고리즘에, 입력값으로 관련도 분석부(230)를 거친 금융 정보, 개인정보, 영리활동 정보 및 서비스 이용요금 정보를, 출력값으로 각 데이터를 갖는 개개인들의 신용도를 입력하여 학습시킨다. 여기서, 개개인들의 신용도는 종래의 신용도가 아닌 전술한 정보를 고려하여 대체된 신용도에 해당한다. 출력값으로 입력될 신용도는 복수의 등급으로 구분될 수 있으며, 입력값에 따라 개인의 신용도는 복수의 등급 중 어느 하나로 분류될 수 있다.
신용도는 개인정보 중 나이는 상대적으로 어릴 수록 높도록 설정될 수 있고, 직업 역시, 국세청 내 분류된 업종 및 각각의 세금 납부 정도를 고려하여 달리 설정될 수 있다. 또한, 개인정보 중 시간대 별 통화시간 정보도 고려될 수 있다. 통상적인 업무 시간인 낮 시간일 때의 통화량이 적거나, 낮 이외에 밤 시간에도 통화량이 많을 경우, 금전적인 필요성이 필요한 사람일 수 있다. 영리활동 정보도 신용도 평가에 포함될 수 있다. 특정한 직업이나 자산을 형성하기 위해 학원활동을 한다거나, 자격증을 취득하는 것은 신용도 향상에 긍정적일 수 있다. 특히, 다니는 학원의 종류나 취득한 자격증의 종류가 국세청 내 분류된 업종 중 어느 하나이며 소득이 기 설정된 수준 이상일 경우, 보다 긍정적으로 평가될 수 있다. 및 서비스 이용요금 정보도 신용도 평가에 포함될 수 있다. 및 서비스 이용요금 정보는 개인의 소비 패턴을 추측케할 수 있는 정보로서, 이러한 이용요금이 많을 경우 소비패턴이 많을 것으로 합리적으로 추정할 수 있어 신용도에는 부정적일 수 있다.
신용도 평가부(240)는 전술한 데이터를 토대로 머신러닝 알고리즘을 학습시켜, 금융정보 외에 개인정보, 영리활동 정보 및 서비스 이용요금 정보까지도 고려하여 개개인의 신용도를 평가하는 인공지능(머신러닝) 학습모델을 생성한다.
신용도 평가부(240)는 통신부(210)가 수신한 데이터를 생성한 인공지능 학습모델의 입력값으로 입력하여, (개인용 단말(110)을 이용하는) 개인의 신용도를 평가한다.
정확도 판단부(250)는 신용도 평가부(240)가 생성한 인공지능 학습모델의 정확도를 판단한다. 정확도 판단부(250)는 신용도 평가부(240)의 평가 결과의 정확도를 실시간으로 또는 기 설정된 간격마다 판단한다. 정확도 판단부(250)는 다음의 과정으로 정확도를 판단한다.
Figure 112022132356592-pat00003
여기서,
Figure 112022132356592-pat00004
는 표시함수로서, Xi가 x보다 크면 1이되고, x보다 작으면 0이되는 함수에 해당한다. 이에 따라, Fn(x)는 Xi의 누적비율을 의미한다. 예를 들어, Xi가 정상 상환건수일 경우, Fn(x)는 (전체 상환건수 대비) 누적 상환비율을 의미하고, Xi가 연체 건수일 경우, Fn(x)는 (전체 연체건수 대비) 누적 연체비율을 의미한다.
정확도 판단부(250)는 전술한 수식을 이용하여 각 등급별로 누적 상환비율 및 누적 연체비율을 계산하고, 그로부터 정확도를 판단한다. 정확도 판단부(250)가 신용도 평가모델의 정확도를 판단하기 위해 고려하는 요소는 도 5에 도시되어 있다.
도 5는 본 발명의 일 실시예에 따른 신용도 평가모델의 정확도를 판단하기 위해 고려하는 요소를 도시한 도면이다.
도 5를 참조하면, 10등급에서는 전체 연체건수(100) 대비 연체가 49건이 발생하여 연체비율이 49%가 된다. 전체 상환건수(900) 대비 상환이 51건 발생하여 상환비율은 약 5.7%가 된다. 이에 따라, 10등급에서 누적 연체비율과 누적 상환비율은 각각 49%와 5.7%가 되며, 정확도는 43.3이 된다. 여기서, 정확도는 누적 연체비율과 누적 상환비율의 차이값으로 계산된다.
즉, 정확도 판단부(250)는 표본의 누적 연체비율과 누적 상환비율의 거리를 정량화한다. 이 통계의 귀무 분포는 표본이 기준 분포에서 추출되거나 표본이 동일한 분포에서 추출된다는 귀무 가설 하에서 계산된다. 즉, 정확도 판단부(250)는 두 집단에 대한 각각의 구성비를 누적해서 산출한 후 그 누적 구성비의 차이가 가장 많이 벌어지는 지점의 수치로 정확도를 평가한다. 정확도 판단부(250)가 정확도를 평가하는 과정은 도 6에 도시되어 있다.
도 6은 본 발명의 일 실시예에 따른 신용도 평가모델의 정확도를 도시한 그래프이다.
도 6에 도시된 바와 같이, 정확도 판단부(250)는 누적 연체비율(Bad 누적)과 누적 상환비율(Good 누적) 간의 최대 차이를 연산한다. 해당 차이값이 클수록, 인공지능 학습모델의 정확도는 우수함을 의미한다.
정확도 판단부(250)는 각 등급에 대해 전술한 과정을 거치며 각 등급에서의 정확도를 연산하며, 정확도가 가장 큰 값을 신용도 평가부(240)가 생성한 인공지능 학습모델의 정확도로 평가한다. 정확도 판단부(250)는 인공지능 학습모델의 정확도를 평가하여 정확도가 기 설정된 수치 이하로 떨어진 경우, 신용도 평가부(240)가 인공지능 학습모델의 학습을 다시 진행하도록 한다.
다시 도 2를 참조하면, 메모리부(260)는 신용도 평가부(240)가 인공지능 모델을 학습시키기 위한 (입력 및 출력)데이터들 및 신용도 평가부(240)가 생성한 인공지능 학습모델을 저장한다.
이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100: 대체 신용 평가 시스템
110: 개인용 단말
120: 금융기관 서버
130: 대체 신용 평가 장치
210: 통신부
220: 전처리부
230: 관련도 분석부
240: 신용도 평가부
250: 정확도 판단부
260: 메모리부

Claims (10)

  1. 개인용 단말로부터 수신한 개인정보, 영리행위를 하거나 그를 준비하기 위한 영리활동 정보 및 서비스 이용요금 정보를, 금융기관 서버로부터 수신한 금융 정보를 수신하는 통신부;
    인공지능 학습모델의 학습을 위한 데이터 내 결측치에 대해, 결측치 또는 결측치가 존재하는 데이터셋을 제거하거나, 결측이 존재하는 데이터를 기 설정된 값으로 대체하여 보상하는 전처리부;
    전처리를 거친 각 데이터들 상호간에 얼마만큼 관련도가 있는지를 분석하여 관련도가 기 설정된 기준치 이상인 변수들이나, 각 데이터와 결과값과의 관련도를 분석하여 관련도가 기 설정된 범위를 벗어난 변수들을 필터링하는 관련도 분석부;
    상기 관련도 분석부를 거친 데이터들을 이용하여 인공지능 모델을 학습시키며, 학습된 인공지능 학습모델을 이용해 상기 통신부가 수신한 데이터로부터 개인의 신용도를 평가하는 신용도 평가부;
    상기 신용도 평가부가 인공지능 모델을 학습시키기 위한 데이터들 및 상기 신용도 평가부가 생성한 인공지능 학습모델을 저장하는 메모리부; 및
    각 등급별로 누적 상환비율 및 누적 연체비율을 계산하고 양자의 차이를 이용하여, 상기 신용도 평가부의 평가 결과의 정확도를 실시간으로 또는 기 설정된 간격마다 판단하며, 정확도가 기 설정된 수치 이하로 떨어진 경우 상기 신용도 평가부가 인공지능 학습모델의 학습을 다시 진행하도록 하는 정확도 판단부를 포함하며,
    상기 영리행위를 하거나 그를 준비하기 위한 영리활동 정보는 자산 또는 소득을 창출하거나 그를 증가시키기 위해 행하는 모든 행위를 의미하며, 상기 서비스 이용요금 정보는 타인 또는 외부로부터 서비스를 제공받기 위해 지불하는 요금에 관한 정보를 의미하고,
    상기 전처리부는 결측이 존재하는 데이터를 기 설정된 값으로 대체함에 있어, 결측 데이터가 수치형인 경우 해당 데이터의 모집단의 평균치 또는 중앙값으로 대체하고, 결측치가 수치형이 아닌 경우 모집단 내 해당 데이터들의 최빈값으로 대체하고,
    상기 관련도 분석부는 각 데이터에 대해 가중치 및 정상분포와 부실분포의 차이값을 이용하여 각 데이터와 결과값에 대한 관련도를 연산하며, 각 데이터와 결과값의 관련도가 0.02 내지 0.5 범위를 벗어난 변수들을 필터링하며,
    상기 부실분포는 전체 대출건수 대비 연체건수의 비율을, 상기 정상분포는 전체 대출건수 대비 정상 상환건수의 비율을 각각 의미하며, 상기 가중치는 다음과 같이 연산되는 것을 특징으로 하는 대체 신용 평가 장치.
  2. 제1항에 있어서,
    상기 전처리부는,
    인공지능 학습모델의 학습을 위한 데이터들 및 결측치를 보상한 데이터들에 대해 정규화(Normalizing)를 진행하는 것을 특징으로 하는 대체 신용 평가 장치.
  3. 제1항에 있어서,
    상기 관련도 분석부는,
    각 데이터들 상호간에 얼마만큼 관련도가 있는지를 분석하기 위해, 단변량 유의성분석 방법(Univariate Analysis), Pearson 상관계수 산출방법, Spearman 상관계수 산출방법 또는 Kendall 상관계수 산출방법을 이용하는 것을 특징으로 하는 대체 신용 평가 장치.
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 신용평가를 받기 위한 개인이 소지하는 단말로서, 개인정보, 영리행위를 하거나 그를 준비하기 위한 영리활동 정보 및 서비스 이용요금 정보를 전송하는 개인용 단말;
    개인의 금융정보를 저장하며, 외부로부터 요청이 있을 경우 외부로 상기 개인의 금융정보를 제공하는 금융기관 서버; 및
    제1항 내지 제3항 중 어느 한 항의 대체 신용 평가 장치
    를 포함하는 것을 특징으로 하는 대체 신용 평가 시스템.
  10. 제9항에 있어서,
    상기 금융정보는,
    소득이나 자산에 관한 정보, 대출 여부, 연체 여부, 상환 기간 또는 상관 방법 등 금융거래를 하거나 하기 위해 필요한 모든 정보를 포함하는 것을 특징으로 하는 대체 신용 평가 시스템.

KR1020220170965A 2022-12-08 2022-12-08 개인의 신용도 평가를 위한 대체 신용 평가 시스템 KR102566466B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220170965A KR102566466B1 (ko) 2022-12-08 2022-12-08 개인의 신용도 평가를 위한 대체 신용 평가 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220170965A KR102566466B1 (ko) 2022-12-08 2022-12-08 개인의 신용도 평가를 위한 대체 신용 평가 시스템

Publications (1)

Publication Number Publication Date
KR102566466B1 true KR102566466B1 (ko) 2023-08-11

Family

ID=87565821

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220170965A KR102566466B1 (ko) 2022-12-08 2022-12-08 개인의 신용도 평가를 위한 대체 신용 평가 시스템

Country Status (1)

Country Link
KR (1) KR102566466B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180076109A (ko) * 2016-12-27 2018-07-05 주식회사 엘지유플러스 금융 거래 신용도 판단을 위한 장치, 시스템, 방법
KR20210127512A (ko) * 2020-04-14 2021-10-22 (주)푸드노트서비스 인공지능 기반 소상공인 신용대출 시스템 및 방법
KR102461415B1 (ko) * 2022-02-14 2022-11-01 주식회사 에이젠글로벌 외부 데이터를 고려한 신용 평가 방법 및 이러한 방법을 수행하는 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180076109A (ko) * 2016-12-27 2018-07-05 주식회사 엘지유플러스 금융 거래 신용도 판단을 위한 장치, 시스템, 방법
KR20210127512A (ko) * 2020-04-14 2021-10-22 (주)푸드노트서비스 인공지능 기반 소상공인 신용대출 시스템 및 방법
KR102461415B1 (ko) * 2022-02-14 2022-11-01 주식회사 에이젠글로벌 외부 데이터를 고려한 신용 평가 방법 및 이러한 방법을 수행하는 장치

Similar Documents

Publication Publication Date Title
Abdou et al. Neural nets versus conventional techniques in credit scoring in Egyptian banking
US7165043B2 (en) Valuation prediction models in situations with missing inputs
US7028005B2 (en) Methods and systems for finding value and reducing risk
EP1361526A1 (en) Electronic data processing system and method of using an electronic processing system for automatically determining a risk indicator value
KR102009309B1 (ko) 금융상품 관리자동화 시스템 및 관리자동화 방법
CN112862298B (zh) 一种针对用户画像的信用评估方法
US20090177589A1 (en) Cross correlation tool for automated portfolio descriptive statistics
WO2001050315A2 (en) Methods and apparatus for automated underwriting of segmentable portfolio assets
WO2001050318A2 (en) Methods and systems for efficiently sampling portfolios for optimal underwriting
WO2001050379A2 (en) Methods and apparatus for simulating competitive bidding yield
WO2001050310A9 (en) Methods and systems for automated inferred valuation of credit scoring
WO2001050314A2 (en) Methods and systems for quantifying cash flow recovery and risk
CN114078050A (zh) 贷款逾期预测方法、装置、电子设备及计算机可读介质
CN112232950A (zh) 针对借贷风险的评估方法及装置、设备、计算机可读存储介质
KR102566466B1 (ko) 개인의 신용도 평가를 위한 대체 신용 평가 시스템
CN115496205A (zh) 检测模型训练、数据检测方法、装置、设备及存储介质
CN117455681A (zh) 业务风险预测方法和装置
CN113807943A (zh) 一种不良资产的多因子估值方法及系统、介质、设备
CN113822751A (zh) 一种线上贷款的风险预测方法
CN114880369A (zh) 一种基于弱数据技术的风险授信方法和系统
Shen et al. Modelling the predictive performance of credit scoring
CN116757824A (zh) 一种基于蒙特卡洛算法的业务仿真方法
Köhler A Bayesian Approach to Predicting Default, Prepayment and Order Return in Unsecured Consumer Loans
CN116862675A (zh) 信用风险评估方法、装置及非易失性存储介质
CN117994017A (zh) 构建零售信用风险预测模型的方法和线上信贷业务Scoredelta模型

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant