KR20210029111A - Method and apparatus for explaining the reason of the evaluation resulted from credit evaluation models based on machine learning - Google Patents

Method and apparatus for explaining the reason of the evaluation resulted from credit evaluation models based on machine learning Download PDF

Info

Publication number
KR20210029111A
KR20210029111A KR1020200112569A KR20200112569A KR20210029111A KR 20210029111 A KR20210029111 A KR 20210029111A KR 1020200112569 A KR1020200112569 A KR 1020200112569A KR 20200112569 A KR20200112569 A KR 20200112569A KR 20210029111 A KR20210029111 A KR 20210029111A
Authority
KR
South Korea
Prior art keywords
customer information
classification model
credit rating
target class
value
Prior art date
Application number
KR1020200112569A
Other languages
Korean (ko)
Other versions
KR102400804B1 (en
Inventor
이성환
강신한
고한빈
정홍규
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Publication of KR20210029111A publication Critical patent/KR20210029111A/en
Application granted granted Critical
Publication of KR102400804B1 publication Critical patent/KR102400804B1/en

Links

Images

Classifications

    • G06Q40/025
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

According to one aspect of the present invention, a method for explaining a reason of evaluation of a credit rating classification model based on machine learning performed by a computer device includes the steps of: (a) receiving first customer information including credit information composed of a plurality of items and a target class to be derived as an evaluation result of the credit rating classification model; (b) selecting a specific item affecting a change of the class determined by the credit rating classification model to the target class with respect to first customer information; (c) changing a value of the selected specific item and generating second customer information including a changed item value; (d) calculating a result probability that the target class is derived as an evaluation result of a credit rating classification model with respect to an input of second customer information; and (e) comparing whether the second customer information is determined as the target class.

Description

기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치 및 방법{METHOD AND APPARATUS FOR EXPLAINING THE REASON OF THE EVALUATION RESULTED FROM CREDIT EVALUATION MODELS BASED ON MACHINE LEARNING}A device and method to explain the evaluation reason of a machine learning-based credit rating classification model {METHOD AND APPARATUS FOR EXPLAINING THE REASON OF THE EVALUATION RESULTED FROM CREDIT EVALUATION MODELS BASED ON MACHINE LEARNING}

본 발명은 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치 및 방법 에 대한 것이다.The present invention relates to an apparatus and method for explaining the evaluation reason for a machine learning-based credit rating classification model.

최근 기계학습 기술이 크게 발전하면서 금융 분야에서 대출과 관련되어 개인 및 기업의 신용평가를 위해 기계학습 모델을 적용하려고 하는 시도가 증가하였다. 금융 분야에서 기계학습 기반의 신용평가 분류 모델을 적용하는 것은 기존처럼 금융 분야의 전문가에 의해 신용평가가 이루어지는 것이 아닌 컴퓨터가 스스로 학습하고 데이터 특징을 분석하여 자동적으로 분류 가능하다는 것을 말한다. 또한 기계학습 기반 분류 모델은 항목간의 관계성을 알아낼 수도 있으며 복잡한 데이터로부터의 추론이 가능해졌으므로 높은 성능까지 도출 가능하다.Recently, as machine learning technology has developed greatly, attempts to apply machine learning models for credit evaluation of individuals and companies have increased in the financial field related to loans. The application of the machine learning-based credit rating classification model in the financial field means that credit ratings are not performed by experts in the financial field as in the past, but that the computer can learn by itself and automatically classify the data by analyzing the characteristics of the data. In addition, the classification model based on machine learning can find out the relationship between items, and because inference from complex data is possible, it is possible to derive high performance.

그러나 동시에 학습해야 할 파라미터 수와 모델의 복잡성도 모두 비약적으로 증가함에 따라서 인간이 모델의 분류 결정 이유에 대해 이해할 수 없다는 치명적인 단점을 가지게 된다. 사람이 이해할 수 없다는 것은 신뢰성이 중요한 분야 또는 기업에서는 사용할 수 없다는 것을 의미한다. 특히 금융 분야 안에서 신용 평가 결정에 대한 문제는 기업의 이익과 관련된 직결되는 문제이므로 신용 평가 모델의 높은 성능과 관계없이 모델의 결정을 신뢰할 수 없다면 적용하기 힘들다.However, as both the number of parameters to be trained at the same time and the complexity of the model increase dramatically, there is a fatal disadvantage that humans cannot understand the reason for determining the classification of the model. Incomprehensible to humans means that they cannot be used in fields or companies where reliability is important. In particular, the issue of credit rating decisions in the financial sector is directly related to corporate interests, so it is difficult to apply if the model's decisions are unreliable regardless of the high performance of the credit rating model.

그래서 기계학습 기반 모델의 결정에 대해 이해할 수 있도록 하는 설명 가능한 인공지능에 관한 연구가 최근에 주목받고 있다. 주로 이러한 연구에서는 특정 클래스에 대해서 모델의 결정을 도출하는데 있어서 영향을 크게 미치는 항목을 찾는 방법을 사용하고 있다. Therefore, research on explainable artificial intelligence that enables understanding of machine learning-based model decisions has recently attracted attention. Mainly, in these studies, a method of finding items that have a significant influence on deriving model decisions for a specific class is used.

대한민국 등록특허공보 제 10-2005734 호 (발명의 명칭: 머신 러닝 기반 유형자산 정량 평가 결과가 반영된 종합 금융 서비스 제공 시스템)Korean Registered Patent Publication No. 10-2005734 (Title of invention: Comprehensive financial service providing system reflecting the results of quantitative evaluation of tangible assets based on machine learning)

본 발명은 전술한 문제점을 해결하기 위한 것으로, 목표하는 클래스로 판단되기 위한 효과적인 고객의 신용 정보를 찾아내고 해당 정보의 값을 어떻게 변경시켜야 신용평가 결과가 뒤바뀌는지 판단하는 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치 및 방법을 제공하는 것을 기술적 과제로 한다. The present invention is to solve the above-described problem, a machine learning-based credit rating classification model that finds effective customer credit information to be determined as a target class and determines how to change the value of the information to change the credit rating result It is a technical problem to provide an apparatus and a method for explaining the reason for the evaluation.

다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.However, the technical problem to be achieved by the present embodiment is not limited to the technical problem as described above, and other technical problems may exist.

상술한 기술적 과제를 해결하기 위한 기술적 수단으로서, 본 발명의 일 측면에 따른 컴퓨터 장치에 의해 수행되는, 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법은 (a) 복수의 항목으로 구성된 신용 정보를 포함하는 제1고객정보와 신용평가 분류 모델의 평가 결과로서 도출하고자 하는 목표 클래스를 입력받는 단계; (b) 제1고객정보에 대하여 신용평가 분류 모델이 판단한 클래스를 목표 클래스로 변경하는 데 영향을 주는 특정 항목을 선택하는 단계; (c) 선택된 특정 항목의 값을 변경하고, 변경된 항목값을 포함하는 제2 고객정보를 생성하는 단계; (d) 제2고객정보의 입력에 대한 신용평가 분류 모델의 평가 결과로서 목표 클래스가 도출되는 결과 확률을 산출하는 단계; 및 (e) 제2고객정보가 목표 클래스로 판단되는지 여부를 비교하는 단계;를 포함한다.As a technical means for solving the above-described technical problem, a method for explaining the evaluation reason of the machine learning-based credit rating classification model performed by the computer device according to an aspect of the present invention is (a) credit consisting of a plurality of items. Receiving first customer information including information and a target class to be derived as an evaluation result of the credit rating classification model; (b) selecting a specific item that affects changing the class determined by the credit rating classification model to the target class for the first customer information; (c) changing the value of the selected specific item and generating second customer information including the changed item value; (d) calculating a result probability of deriving a target class as an evaluation result of the credit rating classification model for input of the second customer information; And (e) comparing whether the second customer information is determined to be a target class.

(e) 단계에서 제2고객정보가 목표 클래스로 판단되지 않는 경우, 특정 항목을 선택하는 과정부터 순차적으로 반복 수행하되, 반복될 때 마다 특정 항목의 개수를 한 개씩 추가하는 것이고, 제2고객정보가 목표 클래스로 판단된 경우, 제2 고객정보의 변경된 항목들을 검출하여 제공하는 단계를 더 포함한다.If the second customer information is not determined as the target class in step (e), it is sequentially repeated from the process of selecting a specific item, but each time it is repeated, the number of specific items is added one by one, and the second customer information When is determined to be the target class, the step of detecting and providing changed items of the second customer information is further included.

(b) 단계는 목표 클래스가 도출되는 결과 확률에 기초하여 제2고객정보에 대한 미분의 절대값이 큰 순서대로 특정 항목을 선택하되, 항목의 개수만큼 미분의 절대값이 큰 순서대로 인덱싱을 수행한다.In step (b), specific items are selected in the order in which the absolute value of the derivative for the second customer information is large, based on the probability of the result from which the target class is derived, but indexing is performed in the order in which the absolute value of the derivative is as large as the number of items. do.

(c) 단계는 인덱싱된 항목에 대하여 제1고객정보의 값을 제2고객정보의 항목값으로 변경하되, 제1및 제2고객정보에 기초하여 기 설정된 손실 함수의 값을 최소화하여 변경된 항목값을 결정한다.In step (c), the value of the first customer information for the indexed item is changed to the item value of the second customer information, but the changed item value by minimizing the value of the preset loss function based on the first and second customer information. To decide.

본 발명의 다른 측면에 따른 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치는 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법을 수행하기 위한 프로그램이 저장된 메모리; 및 프로그램을 수행하는 프로세서;를 포함하며, 프로세서는, 프로그램의 실행에 따라, 복수의 항목으로 구성된 신용 정보를 포함하는 제1고객정보와 신용평가 분류 모델의 평가 결과로서 도출하고자 하는 목표 클래스를 입력받고, 제1고객정보에 대하여 신용평가 분류 모델이 판단한 클래스를 목표 클래스로 변경하는 데 영향을 주는 특정 항목을 선택하고, 선택된 특정 항목의 값을 변경하고, 변경된 항목값을 포함하는 제2 고객정보를 생성하고, 제2고객정보의 입력에 대한 신용평가 분류 모델의 평가 결과로서 목표 클래스가 도출되는 결과 확률을 산출하고, 제2고객정보가 목표 클래스로 판단되는지 여부를 비교한다.An apparatus for explaining an evaluation reason for a machine learning-based credit rating classification model according to another aspect of the present invention includes a memory storing a program for performing a method of explaining the evaluation reason for the machine learning-based credit rating classification model; And a processor that performs a program, wherein the processor inputs first customer information including credit information composed of a plurality of items and a target class to be derived as an evaluation result of the credit rating classification model according to the execution of the program. 2nd customer information including receiving, selecting a specific item that affects changing the class determined by the credit rating classification model to the target class for the first customer information, changing the value of the selected specific item, and including the changed item value And, as a result of evaluation of the credit rating classification model for input of the second customer information, a result probability of deriving a target class is calculated, and whether the second customer information is determined as the target class is compared.

프로세서는 제2고객정보가 목표 클래스로 판단되지 않는 경우, 특정 항목을 선택하는 과정부터 순차적으로 반복 수행하되, 반복될 때 마다 특정 항목의 개수를 한 개씩 추가하는 것이고, 제2고객정보가 목표 클래스로 판단된 경우, 제2 고객정보의 변경된 항목들을 검출하여 제공한다.If the second customer information is not determined to be the target class, the processor sequentially repeats from the process of selecting a specific item, but adds one specific number of items each time it is repeated, and the second customer information is the target class. If determined to be, the changed items of the second customer information are detected and provided.

프로세서는 목표 클래스가 도출되는 결과 확률에 기초하여 제2고객정보에 대한 미분의 절대값이 큰 순서대로 특정 항목을 선택하되, 항목의 개수만큼 미분의 절대값이 큰 순서대로 인덱싱을 수행한다.The processor selects specific items in the order in which the absolute value of the derivative for the second customer information is large, based on the result probability of deriving the target class, and performs indexing in the order in which the absolute value of the derivative is as large as the number of items.

프로세서는 인덱싱된 항목에 대하여 제1고객정보의 값을 제2고객정보의 항목값으로 변경하되, 제1및 제2고객정보에 기초하여 기 설정된 손실 함수의 값을 최소화하여 변경된 항목값을 결정한다.The processor changes the value of the first customer information to the item value of the second customer information for the indexed item, but determines the changed item value by minimizing the value of a preset loss function based on the first and second customer information. .

전술한 본원의 과제 해결 수단 중 어느 하나에 의하면, 기계학습 기반 신용평가 분류 모델이 생각하기에 대출 가능/불가 클래스 사이의 분별력있는 항목을 찾아냄으로써 모델의 행동을 이해할 뿐만 아니라 모델이 집중적으로 고려하는 항목이 무엇인지 확인 가능하므로 추후 새로운 신용 평가 모델의 개발과정에서 중요히 고려해야 할 특징을 알 수 있다. According to one of the above-described problem solving means of the present application, the machine learning-based credit rating classification model not only understands the behavior of the model, but also intensively considers the model's behavior by finding sensible items between classes that can or cannot be borrowed. Since it is possible to check what the item is, it is possible to know the features that should be considered important in the development process of a new credit rating model in the future.

또한 다수의 고객 데이터에서 목표하는 클래스로 판별하는데 사용되는 공통적인 요소가 있다면 이후 모델링할 경우에도 해당 항목을 신용평가 분류 모델로 하여금 중요한 특징으로 고려되도록 제한하는 방식을 사용하여 기존보다 개선된 모델을 구축하는데 도움을 줄 수 있다. In addition, if there is a common factor used to determine the target class in a large number of customer data, even when modeling afterwards, a method that restricts the item to be considered as an important feature by the credit rating classification model is used to create an improved model. It can help you build.

더불어, 신용 정보 중 해당 항목의 값을 변경시켜 목표하는 클래스로 판단되도록 하는 기술은 대출을 해주는 기업과 대출을 하는 고객 모두에게 이익을 줄 수 있다. 예를 들어 한 고객 정보에 대해서 신용평가 분류 모델이 대출 불가라고 한 경우에 대출을 해주는 기업입장에서는 고객에게 어떠한 항목의 값을 적절하게 변화시킬 경우 대출 가능하다고 설명가능하다. 즉, 신용이 높은 고객에게 대출을 많이 해줄수록 기업의 이익이 창출되는 기업 입장에서는 이는 좋은 효과로 작용될 수 있다. 또한 대출하려는 고객입장에서는 자신의 신용 정보 중 어떤 항목에 대한 값이 대출을 하는데 있어서 부정적으로 작용하는 지 알 수 있으므로 대출을 하려면 고려해야 할 항목에 대한 정보를 획득가능하다.In addition, a technology that changes the value of a corresponding item among credit information to be determined as a target class can benefit both companies that make loans and customers who make loans. For example, if the credit rating classification model for one customer's information is that it is not possible to borrow, the position of a company that makes a loan can explain that a loan is possible if the value of a certain item is appropriately changed to the customer. In other words, the more loans to high-credit customers are, the more profitable the company is, this can be a good effect. In addition, from the viewpoint of a customer who wants to lend, it is possible to obtain information on the items to be considered in order to borrow because it is possible to know which item of their credit information is negatively acting on the loan.

도 1은 본 발명의 일 실시예에 따른 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치의 구성을 도시한 블록도이다.
도 2는 본 발명의 일 실시예에 따른 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치의 세부 모듈을 도시한 블록도이다.
도 3은 본 발명의 일 실시예에 따른 고객A의 신용정보와 이에 대한 신용평가 분류 모델에 따른 결과를 도시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 신용평가 분류 모델에 따라 고객A의 신용정보 중 목표 클래스로 도출하기 위해, 신용정보 중 변경되어야 하는 항목을 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법을 도시한 순서도이다.
1 is a block diagram showing the configuration of an apparatus for explaining an evaluation reason for a machine learning-based credit rating classification model according to an embodiment of the present invention.
2 is a block diagram illustrating a detailed module of an apparatus for explaining an evaluation reason for a machine learning-based credit rating classification model according to an embodiment of the present invention.
FIG. 3 is a diagram showing credit information of customer A according to an embodiment of the present invention and a result of a credit rating classification model therefor.
FIG. 4 is a diagram illustrating an item to be changed among credit information in order to derive a target class of credit information of customer A according to a credit rating classification model according to an embodiment of the present invention.
5 is a flowchart illustrating a method of explaining an evaluation reason for a machine learning-based credit rating classification model according to an embodiment of the present invention.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those of ordinary skill in the art can easily implement the present invention. However, the present invention may be implemented in various different forms and is not limited to the embodiments described herein. In the drawings, parts irrelevant to the description are omitted in order to clearly describe the present invention, and similar reference numerals are attached to similar parts throughout the specification.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.Throughout the specification, when a part is said to be "connected" with another part, this includes not only "directly connected" but also "electrically connected" with another element interposed therebetween. . In addition, when a part "includes" a certain component, it means that other components may be further included rather than excluding other components unless specifically stated to the contrary.

본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다. 한편, '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, '~부'는 어드레싱 할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.In the present specification, the term "unit" includes a unit realized by hardware, a unit realized by software, and a unit realized using both. Further, one unit may be realized by using two or more hardware, or two or more units may be realized by one piece of hardware. Meanwhile,'~ unit' is not meant to be limited to software or hardware, and'~ unit' may be configured to be in an addressable storage medium or configured to reproduce one or more processors. Thus, as an example,'~ unit' refers to components such as software components, object-oriented software components, class components, and task components, processes, functions, properties, and procedures. , Subroutines, segments of program code, drivers, firmware, microcode, circuits, data, databases, data structures, tables, arrays and variables. Components and functions provided in the'~ units' may be combined into a smaller number of elements and'~ units', or may be further separated into additional elements and'~ units'. In addition, components and'~ units' may be implemented to play one or more CPUs in a device or a security multimedia card.

이하에서 언급되는 "기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치"는 네트워크를 통해 서버나 타 단말에 접속할 수 있는 컴퓨터나 휴대용 단말기로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop) 등을 포함하고, 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 각종 이동 통신 기반 단말, 스마트폰, 태블릿 PC 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다. 또한, “네트워크”는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN) 또는 부가가치 통신망(Value Added Network; VAN) 등과 같은 유선 네트워크나 이동 통신망(mobile radio communication network) 또는 위성 통신망 등과 같은 모든 종류의 무선 네트워크로 구현될 수 있다. The "device for explaining the reason for evaluating the machine learning-based credit rating classification model" mentioned below may be implemented as a computer or portable terminal that can access a server or other terminal through a network. Here, the computer includes, for example, a notebook equipped with a web browser, a desktop, a laptop, and the like, and the portable terminal is, for example, a wireless communication device that guarantees portability and mobility. , Various types of handheld-based wireless communication devices such as various mobile communication-based terminals, smart phones, and tablet PCs may be included. In addition, “network” refers to a wired network such as a local area network (LAN), a wide area network (WAN), or a value added network (VAN), or a mobile radio communication network or satellite. It can be implemented with any type of wireless network such as a communication network.

이하 첨부된 도면을 참고하여 본 발명의 일 실시예를 상세히 설명하기로 한다.Hereinafter, an embodiment of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치의 구성을 도시한 블록도이다.1 is a block diagram showing the configuration of an apparatus for explaining an evaluation reason for a machine learning-based credit rating classification model according to an embodiment of the present invention.

도1을 참조하면 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치(100)는 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법을 수행하기 위한 프로그램이 저장된 메모리(103) 및 프로그램을 수행하는 프로세서(101)를 포함하며, 프로세서(101)는 프로그램의 실행에 따라, 복수의 항목으로 구성된 신용 정보를 포함하는 제1고객정보와 신용평가 분류 모델(102)의 평가 결과로서 도출하고자 하는 목표 클래스를 입력받고, 제1고객정보에 대하여 신용평가 분류 모델(102)이 판단한 클래스를 목표 클래스로 변경하는 데 영향을 주는 특정 항목을 선택하고, 선택된 특정 항목의 값을 변경하고, 변경된 항목값을 포함하는 제2 고객정보를 생성하고, 제2고객정보의 입력에 대한 신용평가 분류 모델(102)의 평가 결과로서 목표 클래스가 도출되는 결과 확률을 산출하고, 제2고객정보가 목표 클래스로 판단되는지 여부를 비교한다.Referring to FIG. 1, the apparatus 100 for explaining the reason for the evaluation of the machine learning-based credit rating classification model includes a memory 103 and a program storing a program for performing a method of explaining the evaluation reason for the machine learning-based credit rating classification model. Including a processor 101 to perform, the processor 101 is to derive as an evaluation result of the first customer information including credit information composed of a plurality of items and the credit rating classification model 102 according to the execution of the program. A target class is input, selects a specific item that affects the change of the class determined by the credit rating classification model 102 to the target class for the first customer information, changes the value of the selected specific item, and changes the item Generates second customer information including a value, calculates a result probability of deriving a target class as the evaluation result of the credit rating classification model 102 for input of the second customer information, and calculates the result probability that the second customer information is the target class. Compare whether it is judged or not.

따라서, 본 발명의 기계학습 기반 신용평가 분류 모델(102)의 평가 이유를 설명하는 장치(100)는 어떠한 고객 정보(제1고객정보)가 주어졌고, 해당 정보(예를 들어, 연봉, 과거 파산 경험, FICO 점수, 대출 신청 금액 등을 포함하는 복수의 신용 정보의 항목)를 바탕으로 신용평가 분류 모델이 A라는 클래스로 판단하였을 때, 목표 클래스인 B로 판단되도록 원래의 고객 정보(제1고객정보)에서 변경이 필요한 고객 정보(제2고객정보)를 제공할 수 있다. 이를 통해 본 발명의 신용평가 분류 모델이 기존 클래스 A와 목표 클래스B사이의 분별력있는 특징적인 신용정보 항목이 무엇인지 해석을 제공할 수 있다. Therefore, the apparatus 100 for explaining the evaluation reason for the machine learning-based credit rating classification model 102 of the present invention is given some kind of customer information (first customer information), and the corresponding information (for example, annual salary, past bankruptcy experience) , FICO score, loan application amount, etc.)When the credit rating classification model is determined to be class A, the original customer information (first customer information) is determined to be the target class B. ), you can provide customer information (second customer information) that needs to be changed. Through this, the credit rating classification model of the present invention can provide an interpretation of what are distinctive and characteristic credit information items between the existing class A and the target class B.

다시 말해서, 본 발명은 신용평가 분류 모델의 전체적인 해석보다는 주어진 고객 정보(복수의 신용 정보 항목)를 입력으로 하여 산출된 모델의 결과(목표 클래스)에 대해 설명을 제공하고자 한다. 이때 설명의 목적은 목표 클래스로 판별하는데 있어서 중요한 신용 정보의 항목을 시각화 하며 대상 항목의 값을 변경시켜 목표하는 클래스로 판단되도록 하는 방법을 제안하는 것이다.In other words, the present invention is intended to provide an explanation of the result of the model (target class) calculated by inputting given customer information (a plurality of credit information items) rather than an overall interpretation of the credit rating classification model. At this time, the purpose of the explanation is to visualize the items of credit information that are important in determining as the target class, and to propose a method to determine the target class by changing the value of the target item.

즉, 본 발명은 정확하게 특정 고객에 대해 어떠한 항목을 변경하여야 목표 클래스로 판단되는지 설명함으로써 모델의 행동을 이해하고 해석하는데 있어서 효과적인 기술이다.That is, the present invention is an effective technique in understanding and interpreting the behavior of a model by explaining exactly what items should be changed for a specific customer to be determined as a target class.

도1에 도시된 바와 같이 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치(100)는 메모리(103), 프로세서(101), 데이터베이스(104) 및 신용평가 분류 모델(102)을 포함할 수 있다.As shown in FIG. 1, the apparatus 100 for explaining the evaluation reason for the machine learning-based credit rating classification model includes a memory 103, a processor 101, a database 104, and a credit rating classification model 102. I can.

메모리(103)에는 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법을 수행하기 위한 프로그램이 저장된다. 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법을 수행하기 위한 프로그램은 복수의 항목으로 구성된 신용 정보를 포함하는 제1고객정보와 신용평가 분류 모델의 평가 결과로서 도출하고자 하는 목표 클래스를 입력받고, 제1고객정보에 대하여 신용평가 분류 모델이 판단한 클래스를 목표 클래스로 변경하는 데 영향을 주는 특정 항목을 선택하고, 선택된 특정 항목의 값을 변경하고, 변경된 항목값을 포함하는 제2 고객정보를 생성하고, 제2고객정보의 입력에 대한 신용평가 분류 모델의 평가 결과로서 목표 클래스가 도출되는 결과 확률을 산출하고, 제2고객정보가 목표 클래스로 판단되는지 여부를 비교한다. The memory 103 stores a program for performing a method of explaining the evaluation reason of the machine learning-based credit rating classification model. In the program to perform the method of explaining the evaluation reason of the machine learning-based credit rating classification model, input the first customer information including credit information consisting of a plurality of items and the target class to be derived as the evaluation result of the credit rating classification model. 2nd customer information including receiving, selecting a specific item that affects changing the class determined by the credit rating classification model to the target class for the first customer information, changing the value of the selected specific item, and including the changed item value And, as a result of evaluation of the credit rating classification model for input of the second customer information, a result probability of deriving a target class is calculated, and whether the second customer information is determined as the target class is compared.

신용평가 분류 모델(102)은 고객의 신용정보를 입력으로 인공신경망을 통해 학습되어 대출 여부를 예측하는 것이다.The credit rating classification model 102 predicts whether or not a loan is made by learning through an artificial neural network by inputting customer credit information.

이러한 메모리(103)에는 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치(100)의 구동을 위한 운영 체제나 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법을 수행하기 위한 프로그램의 실행 과정에서 발생하는 여러 종류가 데이터가 저장된다. The memory 103 contains an operating system for driving the apparatus 100 for explaining the evaluation reason for the machine learning-based credit rating classification model or a program for performing a method for explaining the evaluation reason for the machine learning-based credit rating classification model. Several types of data that occur during execution are stored.

이때, 메모리(103)는 전원이 공급되지 않아도 저장된 정보를 계속 유지하는 비휘발성 저장장치 및 저장된 정보를 유지하기 위하여 전력이 필요한 휘발성 저장장치를 통칭하는 것이다. In this case, the memory 103 collectively refers to a nonvolatile storage device that continuously maintains stored information even when power is not supplied, and a volatile storage device that requires power to maintain the stored information.

또한, 메모리(103)는 프로세서(101)가 처리하는 데이터를 일시적 또는 영구적으로 저장하는 기능을 수행할 수 있다. 여기서, 메모리(103)는 저장된 정보를 유지하기 위하여 전력이 필요한 휘발성 저장장치 외에 자기 저장 매체(magnetic storage media) 또는 플래시 저장 매체(flash storage media)를 포함할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.In addition, the memory 103 may perform a function of temporarily or permanently storing data processed by the processor 101. Here, the memory 103 may include a magnetic storage media or a flash storage media in addition to a volatile storage device requiring power to maintain stored information, but the scope of the present invention is limited thereto. It does not become.

프로세서(101)는 메모리(103)에 저장된 프로그램을 실행하되, 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법을 수행하기 위한 프로그램의 실행에 따르는 전체 과정을 제어한다. 프로세서(101)가 수행하는 각각의 동작에 대해서는 추후 보다 상세히 살펴보기로 한다.The processor 101 executes the program stored in the memory 103, but controls the entire process according to the execution of the program for performing a method of explaining the evaluation reason of the machine learning-based credit rating classification model. Each operation performed by the processor 101 will be described in more detail later.

이러한 프로세서(101)는 데이터를 처리할 수 있는 모든 종류의 장치를 포함할 수 있다. 예를 들어 프로그램 내에 포함된 코드 또는 명령으로 표현된 기능을 수행하기 위해 물리적으로 구조화된 회로를 갖는, 하드웨어에 내장된 데이터 처리 장치를 의미할 수 있다. 이와 같이 하드웨어에 내장된 데이터 처리 장치의 일 예로써, 마이 크로프로세서(microprocessor), 중앙처리장치(central processing unit: CPU), 프로세서 코어(processor core), 멀티프로세서(multiprocessor), ASIC(application-specific integrated circuit), FPGA(field programmable gate array) 등의 처리 장치를 망라할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.The processor 101 may include all kinds of devices capable of processing data. For example, it may refer to a data processing device embedded in hardware having a circuit that is physically structured to perform a function represented by a code or command included in a program. As an example of the data processing device built into the hardware as described above, a microprocessor, a central processing unit (CPU), a processor core, a multiprocessor, and an application-specific application-specific device (ASIC) Integrated circuit) and processing devices such as a field programmable gate array (FPGA) may be covered, but the scope of the present invention is not limited thereto.

데이터베이스(104)는 프로세서(101)의 제어에 따라, 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치(100)에 필요한 데이터를 저장 또는 제공한다. 이러한 데이터베이스(104)는 메모리(103)와는 별도의 구성 요소로서 포함되거나, 또는 메모리(103)의 일부 영역에 구축될 수도 있다.The database 104 stores or provides data necessary for the device 100 explaining the reason for evaluating the machine learning-based credit rating classification model under the control of the processor 101. The database 104 may be included as a separate component from the memory 103 or may be built in a partial area of the memory 103.

도 2는 본 발명의 일 실시예에 따른 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치의 세부 모듈을 도시한 블록도이다.2 is a block diagram illustrating a detailed module of an apparatus for explaining an evaluation reason for a machine learning-based credit rating classification model according to an embodiment of the present invention.

한편, 프로세서(101)는 메모리(103)에 저장된 프로그램의 실행에 따라 다양한 기능을 수행할 수 있는데, 각 기능에 따라 프로세서(101)에 포함되는 세부 모듈들을 입력부(110), 항목 선택부(120), 항목값 변경부(130), 분류 모델 결과부(140), 비교부(150) 및 설명부(160)로 나타낼 수 있다.Meanwhile, the processor 101 may perform various functions according to the execution of the program stored in the memory 103, and the detailed modules included in the processor 101 according to each function are input unit 110 and the item selection unit 120 ), an item value change unit 130, a classification model result unit 140, a comparison unit 150, and a description unit 160.

입력부(110)는 복수의 항목으로 구성된 신용 정보를 포함하는 제1고객정보와 신용평가 분류 모델의 평가 결과로서 도출하고자 하는 목표 클래스를 사용자로부터 입력받을 수 있다. 예를 들어, 사용자는 입력부(110)를 통해 제1고객정보(개인 또는 기업 고객의 원래 신용정보)와 목표 클래스(대출 가능 또는 대출 불가)를 입력할 수 있다. 이때, 신용정보는 연봉, 과거 파산 경험, FICO 점수, 대출 신청 금액 등의 복수의 항목으로 구성될 수 있다.The input unit 110 may receive first customer information including credit information composed of a plurality of items and a target class to be derived as an evaluation result of the credit rating classification model from the user. For example, the user may input first customer information (original credit information of an individual or corporate customer) and a target class (loanable or non-loanable) through the input unit 110. At this time, the credit information may be composed of a plurality of items such as an annual salary, past bankruptcy experience, FICO score, and loan application amount.

항목 선택부(120)는 제1고객정보에 대하여 신용평가 분류 모델(102)이 판단한 클래스를 목표 클래스로 변경하는 데 영향을 주는 특정 항목을 선택할 수 있다.The item selection unit 120 may select a specific item that affects changing the class determined by the credit rating classification model 102 to the target class for the first customer information.

항목값 변경부(130)는 선택된 특정 항목의 값을 변경하고, 변경된 항목값을 포함하는 제2 고객정보를 생성할 수 있다.The item value change unit 130 may change a value of a selected specific item and generate second customer information including the changed item value.

구체적으로 항목 선택부(120)는 목표 클래스가 도출되는 결과 확률에 기초하여 제2고객정보에 대한 미분의 절대값이 큰 순서대로 특정 항목을 선택하되, 항목의 개수만큼 미분의 절대값이 큰 순서대로 인덱싱을 수행할 수 있다. 여기서 미분의 절대값이 가장 큰 항목의 의미는 해당 항목값의 변경이 다른 항목에 비해 목표 클래스의 확률의 변화를 가장 크게 주는 것을 의미한다. 즉, 항목 선택부(120)는 제1고객정보가 목표 클래스로 판단되는 데 있어서, 영향을 주는 효과적인 신용정보의 항목을 하나씩 증가시키면서 선택하는 역할을 한다.Specifically, the item selection unit 120 selects specific items in the order in which the absolute value of the derivative for the second customer information is large, based on the result probability of deriving the target class, but in the order in which the absolute value of the derivative is as large as the number of items. Indexing can be performed as it is. Here, the meaning of the item with the largest differential absolute value means that the change in the item value gives the greatest change in the probability of the target class compared to other items. That is, in determining that the first customer information is a target class, the item selection unit 120 plays a role of selecting and increasing the effective credit information items that have an effect on one by one.

또한 항목값 변경부(130)는 인덱싱된 항목에 대하여 제1고객정보의 값을 제2고객정보의 항목값으로 변경하되, 제1및 제2고객정보에 기초하여 기 설정된 손실 함수의 값을 최소화하여 변경된 항목값을 결정할 수 있다. 여기서 손실 함수는 하기의 [수학식1]과 같다.In addition, the item value change unit 130 changes the value of the first customer information to the item value of the second customer information for the indexed item, but minimizes the value of the preset loss function based on the first and second customer information. The changed item value can be determined. Here, the loss function is as shown in [Equation 1] below.

[수학식1][Equation 1]

Figure pat00001
Figure pat00001

fk는 클래스 k에 대한 로직 점수(소프트 맥스 함수 이전 값), K는 클래스 수, N은 하이퍼 파라미터로 트레이닝 데이터의 수, 학습데이터i, t는 목표 클래스로 t로 판별되는 학습데이터, λ는 하이퍼 파라미터를 의미한다. 본 발명세서는 N은 100, λ는 0.3으로 설정한다. 손실 함수의 앞 변의 값을 최소화한다는 것은 제2고객정보(변경된 A의 고객 정보)의 로직 점수가 목표 클래스로 판단되는 학습 데이터들의 로직 점수와 비슷해지도록 하는 것이다. 뒤 변의 값을 최소화하는 것은 제2고객정보(변경된 A의 고객 정보)가 제1고객정보(원래의 고객 정보)와 비슷해지도록 하는 것이다.f k is the logic score for class k (the value before the soft max function), K is the number of classes, N is the number of training data as a hyper parameter, training data i, t is the training data determined by t as the target class, It means hyper parameter. In the present invention, N is set to 100 and λ is set to 0.3. To minimize the value of the front side of the loss function, the logic score of the second customer information (the changed customer information of A) becomes similar to the logic score of the training data determined as the target class. Minimizing the value of the back side is to make the second customer information (the changed customer information of A) become similar to the first customer information (the original customer information).

분류 모델 결과부(140)는 제2고객정보의 입력에 대한 신용평가 분류 모델(102)의 평가 결과로서 목표 클래스가 도출되는 결과 확률을 산출할 수 있다. 즉, 분류 모델 결과부(140)는 목표 클래스(예를 들어, 대출 가능)를 도출하기 위해서, 제2고객정보(변경된 A 고객 정보)를 입력으로 한 신용평가 분류 모델(102)의 결과 확률값을 산출할 수 있다. The classification model result unit 140 may calculate a result probability of deriving a target class as an evaluation result of the credit rating classification model 102 for input of the second customer information. That is, the classification model result unit 140 calculates the result probability value of the credit rating classification model 102 that inputs the second customer information (changed customer A information) in order to derive the target class (eg, loanable). Can be calculated.

비교부(150)는 제2고객정보가 목표 클래스로 판단되는지 여부를 비교할 수 있다. 비교부(150)는 제2고객정보가 목표 클래스로 판단되지 않는 경우, 특정 항목을 선택하는 과정부터 순차적으로 반복 수행하되, 반복될 때 마다 특정 항목의 개수를 한 개씩 추가할 수 있다. 또한, 비교부(150)는 제2고객정보가 목표 클래스로 판단된 경우, 제2 고객정보의 변경된 항목들을 검출하여 설명부(160)를 통해 제공할 수 있다.The comparison unit 150 may compare whether the second customer information is determined to be a target class. If the second customer information is not determined to be the target class, the comparison unit 150 sequentially repeats from the process of selecting a specific item, but may add the number of specific items one by one each time it is repeated. In addition, when it is determined that the second customer information is the target class, the comparison unit 150 may detect and provide changed items of the second customer information through the description unit 160.

설명부(160)는 제2고객정보가 목표 클래스로 판단되는 데, 제2고객정보의 변경된 항목을 시각화 하여 제공할 수 있다. 또한, 설명부(160)는 기계학습 기반 신용평가 분류 모델의 평가 이유를 표시하기 위한 장치이며, 후술하는 도 3및 도4에 도시된 바와 같이 고객의 신용정보 및 대출 가능 여부를 표시하는 것도 가능하다. 이로 인해, 사용자는 한 고객 정보로부터 원래의 클래스(제1고객정보에 따른 결과)와 목표 클래스(제2고객정보에 따른 결과)사이의 분별력있는 특징(변경된 신용 정보의 항목)이 무엇인지 확인할 수 있다.The description unit 160 determines that the second customer information is a target class, and may visualize and provide the changed item of the second customer information. In addition, the description unit 160 is a device for displaying the evaluation reason of the machine learning-based credit rating classification model, and as shown in FIGS. 3 and 4 to be described later, it is also possible to display the customer's credit information and whether a loan is possible. Do. Due to this, the user can check from one customer information what distinguishable characteristics (items of changed credit information) between the original class (results according to the first customer information) and the target class (results according to the second customer information). have.

도 3은 본 발명의 일 실시예에 따른 고객A의 신용정보와 이에 대한 신용평가 분류 모델에 따른 결과를 도시한 도면이다. 도 4는 본 발명의 일 실시예에 따른 분류 모델에 따라 고객A의 신용정보 중 목표 클래스로 도출하기 위해, 신용정보 중 변경되어야 하는 항목을 도시한 도면이다.FIG. 3 is a diagram showing credit information of customer A according to an embodiment of the present invention and a result of a credit rating classification model therefor. 4 is a diagram illustrating an item to be changed among credit information in order to derive a target class of credit information of customer A according to a classification model according to an embodiment of the present invention.

예시적으로 도 3에 도시된 바와 같이, 제1고객정보(10)에 대한 신용평가 분류 모델(102)의 분류 결과는 대출 불가 상태(대출 가능: 40%, 대출 불가: 60%)로 도출될 수 있다. 이때 제1고객정보는 연봉: 3,000만원, 부재: 2,000만원, 대출 금액: 7,000만원, 신용 거래 횟수 5회를 포함하는 원래의 고객A의 신용정보이다.Exemplarily, as shown in FIG. 3, the classification result of the credit rating classification model 102 for the first customer information 10 will be derived as a loan impossible state (loan available: 40%, loan not allowed: 60%). I can. At this time, the first customer information is the original customer A's credit information including annual salary: 30 million won, absence: 20 million won, loan amount: 70 million won, and five credit transactions.

예시적으로, 도4를 참조하면 프로세서(101)는 상기 제1고객정보(10)와 목표 클래스가 대출 가능으로 입력되면 목표 클래스(대출 가능)로 변경하는 데 영향을 주는 특정 항목으로, 신용 정보 중 연봉 및 부채를 선택하고, 각 항목의 값을 변경(연봉: 6,000만원, 부채: 1,000만원)한 제2고객정보(20)으로 목표 클래스(대출 가능)가 도출되는 결과(대출 가능: 90%)를 산출하고, 제2고객정보(20)가 목표 클래스로 판단된 경우, 제2고객정보(20)의 변경된 항목(연봉, 부채)을 제공할 수 있다. For example, referring to FIG. 4, the processor 101 is a specific item that affects the change to the target class (loanable) when the first customer information 10 and the target class are input as loanable, and credit information Select the annual salary and debt, and change the value of each item (annual salary: 60 million won, debt: 10 million won) as a result of deriving the target class (loan available) with the second customer information (20) (loan available: 90% ) Is calculated, and when it is determined that the second customer information 20 is a target class, the changed items (annual salary, debt) of the second customer information 20 may be provided.

즉, 사용자는 제2고객정보(20)의 변경된 항목을 통해 신용평가 분류 모델의 평가 이유를 파악할 수 있다. 고객 A의 경우, 기존에는 연봉이 3,000만원이고 부채 금액이 2,000만원(제1고객정보)이어서 목표 클래스(대출 가능)로 판단되는 데 방해되었다. 그러나, 고객 A의 신용 정보 중 연봉을 6,000만원으로 올리고, 부채 금액을 1,000만원 줄일 경우, 신용평가 분류 모델(102)이 대출 가능이라고 판단할 결과가 90%로 바뀐다는 것을 의미한다. That is, the user may grasp the reason for evaluation of the credit rating classification model through the changed item of the second customer information 20. In the case of customer A, in the past, the annual salary was 30 million won and the amount of debt was 20 million won (first customer information), which prevented it from being judged as the target class (loan available). However, if the annual salary of customer A's credit information is raised to 60 million won and the amount of debt is reduced by 10 million won, it means that the result of the credit rating classification model 102 determining that a loan is possible changes to 90%.

이에 따라, 대출해주는 기업측에서는 고객에게 대출이 가능한 조건을 제시할 수 있어, 대출 실적을 증가시킬 수 있는 동기부여가 되고, 고객측에서도 본인의 신용 정보 중 어떤 부분이 대출하는데 부족한지 정확하게 알 수 있다는 효과가 있다.As a result, the lending company can present the conditions for lending to the customer, motivating them to increase the loan performance, and the effect that the customer can accurately know which part of their credit information is insufficient for lending. There is.

이하에서는 상술한 도1 내지 도4에 도시된 구성 중 동일한 기능을 수행하는 구성의 경우 설명을 생략하기로 한다.Hereinafter, a description of a configuration that performs the same function among the configurations illustrated in FIGS. 1 to 4 will be omitted.

도 5는 본 발명의 일 실시예에 따른 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법을 도시한 순서도이다.5 is a flowchart illustrating a method of explaining an evaluation reason for a machine learning-based credit rating classification model according to an embodiment of the present invention.

도 5를 참조하면, 본 발명의 일 실시예에 따른 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법은 복수의 항목으로 구성된 신용 정보를 포함하는 제1고객정보와 신용평가 분류 모델의 평가 결과로서 도출하고자 하는 목표 클래스를 입력받는 단계(S110), 제1고객정보에 대하여 신용평가 분류 모델이 판단한 클래스를 목표 클래스로 변경하는 데 영향을 주는 특정 항목을 선택하는 단계(S120), 선택된 특정 항목의 값을 변경하고, 변경된 항목값을 포함하는 제2 고객정보를 생성하는 단계(S130), 제2고객정보의 입력에 대한 신용평가 분류 모델의 평가 결과로서 목표 클래스가 도출되는 결과 확률을 산출하는 단계(S140) 및 제2고객정보가 목표 클래스로 판단되는지 여부를 비교하는 단계(S150)를 포함한다.Referring to FIG. 5, a method of explaining the reason for evaluation of a machine learning-based credit rating classification model according to an embodiment of the present invention is to evaluate first customer information including credit information composed of a plurality of items and a credit rating classification model. Step of receiving a target class to be derived as a result (S110), selecting a specific item that affects changing the class determined by the credit rating classification model to the target class for the first customer information (S120), selected specific Step of changing the value of the item and generating second customer information including the changed item value (S130), calculating the result probability of deriving the target class as a result of the evaluation of the credit rating classification model for the input of the second customer information Step S140 and comparing whether the second customer information is determined as a target class (S150).

S150단계에서 제2고객정보가 목표 클래스로 판단되지 않는 경우, 특정 항목을 선택하는 과정부터 순차적으로 반복 수행하되, 반복될 때 마다 특정 항목의 개수를 한 개씩 추가하는 것이고, 제2고객정보가 목표 클래스로 판단된 경우, 제2 고객정보의 변경된 항목들을 검출하여 제공하는 단계를 더 포함할 수 있다.If the second customer information is not determined to be the target class in step S150, it is sequentially repeated from the process of selecting a specific item, but each time it is repeated, the number of specific items is added one by one, and the second customer information is the target. When it is determined as the class, the step of detecting and providing changed items of the second customer information may be further included.

S120단계는 목표 클래스가 도출되는 결과 확률에 기초하여 제2고객정보에 대한 미분의 절대값이 큰 순서대로 특정 항목을 선택하되, 항목의 개수만큼 미분의 절대값이 큰 순서대로 인덱싱을 수행할 수 있다.In step S120, specific items are selected in the order in which the absolute value of the derivative for the second customer information is large, based on the result probability of deriving the target class, but indexing can be performed in the order in which the absolute value of the derivative is as large as the number of items. have.

S130단계는 인덱싱된 항목에 대하여 제1고객정보의 값을 제2고객정보의 항목값으로 변경하되, 제1및 제2고객정보에 기초하여 기 설정된 손실 함수의 값을 최소화하여 변경된 항목값을 결정할 수 있다.In step S130, the value of the first customer information is changed to the item value of the second customer information for the indexed item, but the changed item value is determined by minimizing the value of the preset loss function based on the first and second customer information. I can.

본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. An embodiment of the present invention may also be implemented in the form of a recording medium including instructions executable by a computer, such as a program module executed by a computer. Computer-readable media can be any available media that can be accessed by a computer, and includes both volatile and nonvolatile media, removable and non-removable media. Further, the computer-readable medium may include a computer storage medium. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.

본 발명의 방법 및 시스템은 특정 실시예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수 있다.Although the methods and systems of the present invention have been described in connection with specific embodiments, some or all of their components or operations may be implemented using a computer system having a general-purpose hardware architecture.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.The above description of the present invention is for illustrative purposes only, and those of ordinary skill in the art to which the present invention pertains will be able to understand that other specific forms can be easily modified without changing the technical spirit or essential features of the present invention. will be. Therefore, it should be understood that the embodiments described above are illustrative and non-limiting in all respects. For example, each component described as a single type may be implemented in a distributed manner, and similarly, components described as being distributed may also be implemented in a combined form.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present invention is indicated by the claims to be described later rather than the detailed description, and all changes or modified forms derived from the meaning and scope of the claims and their equivalent concepts should be construed as being included in the scope of the present invention. do.

100: 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치
101: 프로세서
102: 신용평가 분류 모델
103: 메모리
104: 데이터베이스
110: 입력부
120: 항목 선택부
130: 항목값 변경부
140: 분류 모델 결과부
150: 비교부
160: 설명부
100: Device explaining the evaluation reason of the machine learning-based credit rating classification model
101: processor
102: credit rating classification model
103: memory
104: database
110: input unit
120: item selection unit
130: item value change unit
140: classification model result unit
150: comparison unit
160: description

Claims (8)

컴퓨터 장치에 의해 수행되는, 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법에 있어서,
(a) 복수의 항목으로 구성된 신용 정보를 포함하는 제1고객정보와 신용평가 분류 모델의 평가 결과로서 도출하고자 하는 목표 클래스를 입력받는 단계;
(b) 상기 제1고객정보에 대하여 상기 신용평가 분류 모델이 판단한 클래스를 상기 목표 클래스로 변경하는 데 영향을 주는 특정 항목을 선택하는 단계;
(c) 선택된 특정 항목의 값을 변경하고, 변경된 항목값을 포함하는 제2 고객정보를 생성하는 단계;
(d) 상기 제2고객정보의 입력에 대한 상기 신용평가 분류 모델의 평가 결과로서 상기 목표 클래스가 도출되는 결과 확률을 산출하는 단계; 및
(e) 상기 제2고객정보가 상기 목표 클래스로 판단되는지 여부를 비교하는 단계;를 포함하는 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법.
In a method for explaining the evaluation reason of a machine learning-based credit rating classification model performed by a computer device,
(a) receiving first customer information including credit information composed of a plurality of items and a target class to be derived as an evaluation result of the credit rating classification model;
(b) selecting a specific item that affects changing the class determined by the credit rating classification model to the target class for the first customer information;
(c) changing the value of the selected specific item and generating second customer information including the changed item value;
(d) calculating a result probability of deriving the target class as an evaluation result of the credit rating classification model for the input of the second customer information; And
(e) comparing whether the second customer information is determined to be the target class; and a method for explaining the evaluation reason of the machine learning-based credit rating classification model.
제 1항에 있어서,
상기 (e) 단계에서
상기 제2고객정보가 상기 목표 클래스로 판단되지 않는 경우, 상기 특정 항목을 선택하는 과정부터 순차적으로 반복 수행하되, 반복될 때 마다 상기 특정 항목의 개수를 한 개씩 추가하는 것이고,
상기 제2고객정보가 상기 목표 클래스로 판단된 경우, 상기 제2 고객정보의 변경된 항목들을 검출하여 제공하는 단계를 더 포함하는 것인, 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법.
The method of claim 1,
In step (e)
When the second customer information is not determined to be the target class, it is sequentially repeated from the process of selecting the specific item, but each time it is repeated, the number of the specific item is added one by one,
If the second customer information is determined to be the target class, the method further comprising the step of detecting and providing changed items of the second customer information.
제 2항에 있어서,
상기 (b) 단계는
상기 목표 클래스가 도출되는 결과 확률에 기초하여 상기 제2고객정보에 대한 미분의 절대값이 큰 순서대로 상기 특정 항목을 선택하되,
상기 항목의 개수만큼 상기 미분의 절대값이 큰 순서대로 인덱싱을 수행하는 것인, 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법.
The method of claim 2,
The step (b) is
Selecting the specific items in the order of the largest absolute value of the derivative for the second customer information based on the result probability of the target class being derived,
The method of explaining the evaluation reason for a machine learning-based credit rating classification model, wherein indexing is performed in an order in which the absolute value of the derivative is as large as the number of the items.
제 3항에 있어서,
상기 (c) 단계는
상기 인덱싱된 항목에 대하여 상기 제1고객정보의 값을 상기 제2고객정보의 항목값으로 변경하되, 상기 제1및 제2고객정보에 기초하여 기 설정된 손실 함수의 값을 최소화하여 상기 변경된 항목값을 결정하는 것인, 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법.
The method of claim 3,
Step (c) is
For the indexed item, the value of the first customer information is changed to the item value of the second customer information, but the changed item value by minimizing the value of a preset loss function based on the first and second customer information A method of explaining the evaluation reason of the machine learning-based credit rating classification model.
기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치에 있어서,
기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 방법을 수행하기 위한 프로그램이 저장된 메모리; 및
상기 프로그램을 수행하는 프로세서;를 포함하며,
상기 프로세서는, 상기 프로그램의 실행에 따라,
복수의 항목으로 구성된 신용 정보를 포함하는 제1고객정보와 신용평가 분류 모델의 평가 결과로서 도출하고자 하는 목표 클래스를 입력받고,
상기 제1고객정보에 대하여 상기 신용평가 분류 모델이 판단한 클래스를 상기 목표 클래스로 변경하는 데 영향을 주는 특정 항목을 선택하고,
선택된 특정 항목의 값을 변경하고, 변경된 항목값을 포함하는 제2 고객정보를 생성하고,
상기 제2고객정보의 입력에 대한 상기 신용평가 분류 모델의 평가 결과로서 상기 목표 클래스가 도출되는 결과 확률을 산출하고,
상기 제2고객정보가 상기 목표 클래스로 판단되는지 여부를 비교하는 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치.
In the device for explaining the evaluation reason of the machine learning-based credit rating classification model,
A memory storing a program for performing a method of explaining the evaluation reason of the machine learning-based credit rating classification model; And
Includes; a processor that executes the program,
The processor, according to the execution of the program,
Receive first customer information including credit information composed of a plurality of items and a target class to be derived as an evaluation result of the credit rating classification model,
Selecting a specific item that affects changing the class determined by the credit rating classification model to the target class for the first customer information,
Change the value of the selected specific item, create second customer information including the changed item value,
Calculating a result probability of deriving the target class as a result of evaluation of the credit rating classification model for the input of the second customer information,
An apparatus for explaining an evaluation reason for a machine learning-based credit rating classification model for comparing whether the second customer information is determined to be the target class.
제 5항에 있어서,
상기 프로세서는
상기 제2고객정보가 상기 목표 클래스로 판단되지 않는 경우, 상기 특정 항목을 선택하는 과정부터 순차적으로 반복 수행하되, 반복될 때 마다 상기 특정 항목의 개수를 한 개씩 추가하는 것이고,
상기 제2고객정보가 상기 목표 클래스로 판단된 경우, 상기 제2 고객정보의 변경된 항목들을 검출하여 제공하는 것인, 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치.
The method of claim 5,
The processor is
When the second customer information is not determined to be the target class, it is sequentially repeated from the process of selecting the specific item, but each time it is repeated, the number of the specific item is added one by one,
When the second customer information is determined to be the target class, changed items of the second customer information are detected and provided.
제 6항에 있어서,
상기 프로세서는
상기 목표 클래스가 도출되는 결과 확률에 기초하여 상기 제2고객정보에 대한 미분의 절대값이 큰 순서대로 상기 특정 항목을 선택하되,
상기 항목의 개수만큼 상기 미분의 절대값이 큰 순서대로 인덱싱을 수행하는 것인, 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치.
The method of claim 6,
The processor is
Selecting the specific items in the order of the largest absolute value of the derivative for the second customer information based on the result probability of the target class being derived,
The apparatus for explaining an evaluation reason for a machine learning-based credit rating classification model, wherein indexing is performed in an order in which the absolute value of the derivative is as large as the number of the items.
제 7항에 있어서,
상기 프로세서는
상기 인덱싱된 항목에 대하여 상기 제1고객정보의 값을 상기 제2고객정보의 항목값으로 변경하되, 상기 제1및 제2고객정보에 기초하여 기 설정된 손실 함수의 값을 최소화하여 상기 변경된 항목값을 결정하는 것인, 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치.
The method of claim 7,
The processor is
For the indexed item, the value of the first customer information is changed to the item value of the second customer information, but the changed item value by minimizing the value of a preset loss function based on the first and second customer information The device for explaining the evaluation reason of the machine learning-based credit rating classification model to determine the.
KR1020200112569A 2019-09-05 2020-09-03 Method and apparatus for explaining the reason of the evaluation resulted from credit evaluation models based on machine learning KR102400804B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190110179 2019-09-05
KR20190110179 2019-09-05

Publications (2)

Publication Number Publication Date
KR20210029111A true KR20210029111A (en) 2021-03-15
KR102400804B1 KR102400804B1 (en) 2022-05-24

Family

ID=75134665

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200112569A KR102400804B1 (en) 2019-09-05 2020-09-03 Method and apparatus for explaining the reason of the evaluation resulted from credit evaluation models based on machine learning

Country Status (1)

Country Link
KR (1) KR102400804B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130065778A (en) * 2011-11-29 2013-06-20 코리아크레딧뷰로 (주) Method and system for managing credit information
KR20140134918A (en) * 2013-05-15 2014-11-25 이도학 Apparatus and method for supporting management of credit rating
KR20180041727A (en) * 2016-03-15 2018-04-24 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 Credit Score Model Training Method, Credit Score Calculation Method, Device and Server
KR102005734B1 (en) 2018-07-31 2019-07-31 (주)굿레이트 Total finance service offering system reflecting quantitative evaluating result of tangible assets based on machine learning

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130065778A (en) * 2011-11-29 2013-06-20 코리아크레딧뷰로 (주) Method and system for managing credit information
KR20140134918A (en) * 2013-05-15 2014-11-25 이도학 Apparatus and method for supporting management of credit rating
KR20180041727A (en) * 2016-03-15 2018-04-24 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 Credit Score Model Training Method, Credit Score Calculation Method, Device and Server
KR102005734B1 (en) 2018-07-31 2019-07-31 (주)굿레이트 Total finance service offering system reflecting quantitative evaluating result of tangible assets based on machine learning

Also Published As

Publication number Publication date
KR102400804B1 (en) 2022-05-24

Similar Documents

Publication Publication Date Title
Oreski et al. Hybrid system with genetic algorithm and artificial neural networks and its application to retail credit risk assessment
García et al. An insight into the experimental design for credit risk and corporate bankruptcy prediction systems
Chopra et al. Application of ensemble models in credit scoring models
Amendola et al. Variable selection in high‐dimensional regression: a nonparametric procedure for business failure prediction
KR102410777B1 (en) An apparatus for improving way of product recommendation and a method thereof
US20230084638A1 (en) Method and apparatus for classification model training and classification, computer device, and storage medium
US11182804B2 (en) Segment valuation in a digital medium environment
US11210673B2 (en) Transaction feature generation
CN111125529A (en) Product matching method and device, computer equipment and storage medium
Heinemann Machine learning in untargeted metabolomics experiments
Yao et al. Enterprise credit risk prediction using supply chain information: A decision tree ensemble model based on the differential sampling rate, Synthetic Minority Oversampling Technique and AdaBoost
CN112288279A (en) Business risk assessment method and device based on natural language processing and linear regression
Matthe et al. Mapping market structure evolution
Li et al. The clustering-based case-based reasoning for imbalanced business failure prediction: a hybrid approach through integrating unsupervised process with supervised process
Ramasubramanian et al. Machine learning model evaluation
US11308130B1 (en) Constructing ground truth when classifying data
Strickland Data analytics using open-source tools
CN108229572B (en) Parameter optimization method and computing equipment
KR20210029111A (en) Method and apparatus for explaining the reason of the evaluation resulted from credit evaluation models based on machine learning
US20220269686A1 (en) Interpretation of results of a semantic query over a structured database
US11803792B2 (en) Risk management
Zieba et al. Beta-boosted ensemble for big credit scoring data
Han et al. Using source code and process metrics for defect prediction-A case study of three algorithms and dimensionality reduction.
CN115769194A (en) Automatic data linking across datasets
CN112884028A (en) System resource adjusting method, device and equipment

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant