KR102093789B1 - Explainable deep learning method and system - Google Patents

Explainable deep learning method and system Download PDF

Info

Publication number
KR102093789B1
KR102093789B1 KR1020170159824A KR20170159824A KR102093789B1 KR 102093789 B1 KR102093789 B1 KR 102093789B1 KR 1020170159824 A KR1020170159824 A KR 1020170159824A KR 20170159824 A KR20170159824 A KR 20170159824A KR 102093789 B1 KR102093789 B1 KR 102093789B1
Authority
KR
South Korea
Prior art keywords
result
deep learning
decision tree
classification
similar
Prior art date
Application number
KR1020170159824A
Other languages
Korean (ko)
Other versions
KR20190061431A (en
Inventor
이종태
Original Assignee
동국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동국대학교 산학협력단 filed Critical 동국대학교 산학협력단
Priority to KR1020170159824A priority Critical patent/KR102093789B1/en
Publication of KR20190061431A publication Critical patent/KR20190061431A/en
Application granted granted Critical
Publication of KR102093789B1 publication Critical patent/KR102093789B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Abstract

컴퓨터 구현 방법(Computer implemented method)로서, (a) 데이터 집합(data set)에 대한 딥 러닝(Deep Learning)을 수행하여 주어진 문제에 관한 결과를 획득하는 단계; (b) 상기 주어진 문제에 관한 복수의 분류 규칙을 포함하는 디시전 트리(Decision Tree)를 생성하는 단계; (c) 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 상기 딥 러닝을 통한 결과에 매칭하는 단계; 및 (d) 상기 매칭 결과를 반영하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 상기 디시전 트리로부터 획득하는 단계를 포함하는 컴퓨터 구현 방법이 제공된다.A computer implemented method, comprising: (a) performing deep learning on a data set to obtain results regarding a given problem; (b) creating a decision tree comprising a plurality of classification rules for the given problem; (c) matching the classification result of the decision tree having the result most similar to the result through the deep learning to the result through the deep learning; And (d) acquiring a basis from which the corresponding result through the deep learning is reflected from the decision tree by reflecting the matching result.

Description

설명력이 있는 딥 러닝 방법 및 시스템{EXPLAINABLE DEEP LEARNING METHOD AND SYSTEM} EXPLAINABLE DEEP LEARNING METHOD AND SYSTEM}

본 발명은 딥 러닝 기술에 관한 것으로서, 보다 구체적으로는 딥 러닝 결과와 가장 유사한 결과 값을 갖는 디시전 트리(decision tree)를 이용함으로써 딥 러닝 결과에 설명력을 확보하는 딥 러닝 방법 및 시스템에 관한 것이다. The present invention relates to a deep learning technology, and more particularly, to a deep learning method and system for securing explanatory power in a deep learning result by using a decision tree having a result value most similar to the deep learning result .

최근 딥 러닝은 이미지 분류, 음성인식, 주가예측, 자연어 채팅봇에 이르기까지 광범위하게 사용되는 신경망 기술이다. 그런데 신경망은 그 특성상 설명력을 발휘해야 하는 근거들(즉, 설명력을 제공하는 근거인 해당 결과에 대한 결정 규칙들)이 특징 기반의 히든 레이어(hidden layer)들로 분산되어 흩어지기 때문에 설명력이 약하다는 단점이 있다(도 1 참조).Deep learning is a neural network technology that is widely used in image classification, voice recognition, stock price prediction, and natural language chat bots. However, neural networks have weak explanation because the grounds for explaining the characteristics (ie, the decision rules for the corresponding result, which is the basis for providing the explanation) are scattered among feature-based hidden layers. There is a disadvantage (see FIG. 1).

즉, 딥 러닝은 주어진 데이터 세트에 대해 신경망 학습을 통해서 주어진 분류 문제에 대한 정확한 분류 결과를 제공 한다(예: Convolutional neural network). 이때, 딥 러닝은 분류의 정확도와 같이 학습의 결과가 우수하지만 해당 분류를 위해서 설정된 수학적 분류기들이 주어진 문제를 다수의 경계선으로 분리하여 주어진 데이터 들을 분류할 때의 경계선을 잘 모르게 되는 경우가 많고, 만약 알아낸다고 해도 비직교 경계선이 아니라서 말로 표현하기가 어렵다는 점이다.In other words, deep learning provides accurate classification results for a given classification problem through neural network learning for a given data set (eg, convolutional neural network). At this time, deep learning has excellent learning results such as accuracy of classification, but it is often the case that the mathematical classifiers set for the classification divide the given problem into multiple boundaries and do not know the boundary when classifying the given data. Even if it is found, it is difficult to express in words because it is not a non-orthogonal boundary.

따라서 실제로 여러 문제에서 우수한 결과를 나타내는 딥 러닝에 설명력을 확보할 수 있는 신규의 방법 및 시스템이 요구된다.Therefore, there is a need for a new method and system capable of securing explanatory power in deep learning that actually shows excellent results in various problems.

본 발명은 딥 러닝 결과와 가장 유사한 결과 값을 갖는 디시전 트리(decision tree)를 이용함으로써 딥 러닝 결과에 설명력을 확보하는 딥 러닝 방법 및 시스템을 제공하고자 한다.The present invention is to provide a deep learning method and system that secures explanatory power in a deep learning result by using a decision tree having a result value most similar to the deep learning result.

본 발명의 일 측면에 따르면, 컴퓨터 구현 방법(Computer implemented method)로서, (a) 데이터 집합(data set)에 대한 딥 러닝(Deep Learning)을 수행하여 주어진 문제에 관한 결과를 획득하는 단계; (b) 상기 주어진 문제에 관한 복수의 분류 규칙을 포함하는 디시전 트리(Decision Tree)를 생성하는 단계; (c) 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 상기 딥 러닝을 통한 결과에 매칭하는 단계; 및 (d) 상기 매칭 결과를 반영하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 상기 디시전 트리로부터 획득하는 단계를 포함하는 컴퓨터 구현 방법이 제공된다.According to an aspect of the present invention, a computer implemented method, comprising: (a) performing deep learning on a data set to obtain a result of a given problem; (b) creating a decision tree comprising a plurality of classification rules for the given problem; (c) matching the classification result of the decision tree having the result most similar to the result through the deep learning to the result through the deep learning; And (d) acquiring a basis from which the corresponding result through the deep learning is reflected from the decision tree by reflecting the matching result.

여기서, 상기 (b) 단계는, 랜덤 포레스트(Random Forrest) 또는 그레디언트 부스팅 디시전 트리(Gradient boosting decision tree)를 이용하여 생성하는 단계일 수 있다.Here, step (b) may be a step of generating using a random forrest (Random Forrest) or a gradient boosting decision tree (Gradient boosting decision tree).

여기서, 상기 (b) 단계에서 상기 데이터 집합에 기준하여 복수의 디시전 트리를 생성하되, 상기 (c) 단계는 상기 생성된 복수의 디시전 트리 중 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 상기 딥 러닝을 통한 결과에 매칭하는 단계이고,Here, in step (b), a plurality of decision trees are generated based on the data set, and step (c) has a result most similar to the result through the deep learning among the generated plurality of decision trees. Matching the result of the classification of the decision tree to the result through the deep learning,

상기 (d) 단계는, 상기 디시전 트리로부터 추출되는 상기 가장 유사한 분류 결과와 관련된 분류 규칙을 이용하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 획득할 수 있다.In the step (d), the classification result related to the most similar classification result extracted from the decision tree may be used to obtain a basis for the corresponding result through the deep learning.

본 발명의 다른 측면에 따르면, 딥 러닝 시스템으로서, 데이터 집합(data set)에 대한 딥 러닝(Deep Learning)을 수행하여 주어진 문제에 관한 결과를 획득하는 딥 러닝 수행부; 상기 주어진 문제에 관한 복수의 분류 규칙을 포함하는 디시전 트리(Decision Tree)를 생성하는 디시전 트리 생성부; 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 상기 딥 러닝을 통한 결과에 매칭하고, 상기 매칭 결과를 반영하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 상기 디시전 트리로부터 획득하는 매칭부를 포함하는 딥 러닝 시스템이 제공된다.According to another aspect of the present invention, a deep learning system comprising: a deep learning performing unit to obtain a result of a given problem by performing deep learning on a data set; A decision tree generator for generating a decision tree including a plurality of classification rules for the given problem; The classification result of the decision tree having the result most similar to the result through the deep learning is matched to the result through the deep learning, and the matching result is reflected to indicate the basis on which the corresponding result through the deep learning appears. A deep learning system including a matching unit obtained from all trees is provided.

여기서, 상기 디시전 트리 생성부는, 랜덤 포레스트(Random Forrest) 또는 그레디언트 부스팅 디시전 트리(Gradient boosting decision tree)를 이용하여 생성할 수 있다.Here, the decision tree generation unit may be generated using a random forrest (Random Forrest) or a gradient boosting decision tree (Gradient boosting decision tree).

여기서, 상기 디시전 트리 생성부는 상기 데이터 집합에 기준하여 복수의 디시전 트리를 생성하되,Here, the decision tree generation unit generates a plurality of decision trees based on the data set,

상기 매칭부는, 상기 생성된 복수의 디시전 트리 중 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 상기 딥 러닝을 통한 결과에 매칭하고, 상기 디시전 트리로부터 추출되는 상기 가장 유사한 분류 결과와 관련된 분류 규칙을 이용하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 획득할 수 있다.The matching unit matches the classification result of the decision tree having the most similar result to the result through the deep learning among the generated plurality of decision trees to the result through the deep learning, and is extracted from the decision tree The classification rule related to the most similar classification result may be used to obtain a basis for the corresponding result through the deep learning.

본 발명의 실시예에 따른 딥 러닝 방법 및 시스템에 의하면, 딥 러닝 결과와 가장 유사한 결과 값을 갖는 디시전 트리(decision tree)를 이용함으로써 딥 러닝 결과에 설명력을 확보할 수 있는 효과가 있다.According to the deep learning method and system according to an embodiment of the present invention, by using a decision tree having a result value most similar to the deep learning result, it is possible to secure an explanatory power in the deep learning result.

도 1은 기존의 딥 러닝 기술의 문제점을 설명하기 위한 참조 도면.
도 2는 본 발명의 실시예에 따른 설명력 있는 딥 러닝 방법 및 시스템을 전반적으로 설명하기 위한 도면.
도 3은 디시전 트리를 설명하기 위한 모식도이고, 도 4는 디시전 트리에서의 노드의 위치와 의미를 설명하는 참조 도면이고, 도 5는 디시전 트리의 일 예시 도면이며, 도 6은 디시전 트리에 의해서 분할되는 분류 공간을 설명하기 위한 도면.
1 is a reference diagram for explaining a problem of the existing deep learning technology.
2 is a view for explaining an explanatory deep learning method and system according to an embodiment of the present invention.
FIG. 3 is a schematic diagram for explaining the decision tree, FIG. 4 is a reference diagram for explaining the position and meaning of a node in the decision tree, FIG. 5 is an exemplary view of the decision tree, and FIG. 6 is a decision tree A diagram for describing a classification space divided by a tree.

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.The present invention can be applied to various transformations and can have various embodiments, and specific embodiments will be illustrated in the drawings and described in detail in the detailed description. However, this is not intended to limit the present invention to specific embodiments, and should be understood to include all conversions, equivalents, and substitutes included in the spirit and scope of the present invention.

본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자(예를 들어, 제1, 제2 등)는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다.In describing the present invention, when it is determined that a detailed description of related known technologies may unnecessarily obscure the subject matter of the present invention, the detailed description will be omitted. In addition, the numbers (for example, first, second, etc.) used in the description process of the present specification are only identification symbols for distinguishing one component from other components.

또한, 명세서 전체에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다.Further, in the specification, when one component is referred to as "connected" or "connected" with another component, the one component may be directly connected to the other component, or may be directly connected, but in particular It should be understood that, as long as there is no objection to the contrary, it may or may be connected via another component in the middle.

또한, 명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하나 이상의 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 조합으로 구현될 수 있음을 의미한다.In addition, throughout the specification, when a part "includes" a certain component, this means that other components may be further included instead of excluding other components unless specifically stated otherwise. In addition, terms such as “part” and “module” described in the specification mean a unit that processes at least one function or operation, which means that it can be implemented by one or more hardware or software or a combination of hardware and software. .

본 발명은 주어진 특정 문제에 대한 해답을 찾기 위해서 기존의 데이터마이닝 기술로써 설명력이 매우 높은 디시전 트리를 생성해주는 랜덤 포레스트(Random Forrest) 또는 그레디언트 부스팅 디시전 트리(Gradient boosting decision tree)의 결과를 활용하여, 딥 러닝 결과와 가장 유사한 디시전 트리의 결과를 매칭함으로써 딥 러닝에서 제시하는 가장 좋은 결과를 가시화하여 딥 러닝에서 나온 결과에 대한 설명력을 상술한 디시전 트리 기술로부터 확보하는 기술이다.The present invention utilizes the results of a random forrest or a gradient boosting decision tree that generates a highly descriptive decision tree as an existing data mining technique in order to find an answer to a given specific problem. Thus, by matching the result of the decision tree that is most similar to the deep learning result, the best result presented in deep learning is visualized to secure the explanatory power of the result from deep learning from the above-described decision tree technology.

이에 의하면, 신경망의 특징인 히든 레이어 때문에 그 결과에 대한 근거를 제시하기가 곤란했는데 이를 설명력 있는 규칙들을 생성해주는 디시전 트리를 생성하여 문제를 풀 수 있다. 대표적인 디시전 트리의 생성 방법인 랜덤 포레스트(Random Forrest) 또는 그레디언트 부스팅 결정 트리(Gradient boosting decision tree) 등의 방법과 딥 러닝의 결과를 연계하여 제시함으로써, 딥 러닝 적용 후의 결과에 대한 설명을 원하는 다양한 문제에서 결과에 대한 사용자 신뢰성을 획기적으로 증가시킬 수 있을 것으로 기대된다.According to this, it was difficult to provide a rationale for the result because of the hidden layer, which is a characteristic of the neural network, but a problem can be solved by creating a decision tree that generates explanatory rules. The method of generating a representative decision tree, such as random forrest (Random Forrest) or gradient boosting decision tree (Gradient boosting decision tree), and the results of deep learning are presented in connection with various results that want to explain the results after applying deep learning. It is expected that the user's reliability of the results from the problems can be significantly increased.

이에 관하여, 이하 첨부된 도면들을 참조하여 본 발명의 실시예를 상세히 설명하기로 한다. 여기서, 도 2는 본 발명의 실시예에 따른 설명력 있는 딥 러닝 방법 및 시스템을 전반적으로 설명하기 위한 도면이다. 또한 도 3은 디시전 트리를 설명하기 위한 모식도이고, 도 4는 디시전 트리에서의 노드의 위치와 의미를 설명하는 참조 도면이고, 도 5는 디시전 트리의 일 예시 도면이며, 도 6은 디시전 트리에 의해서 분할되는 분류 공간을 설명하기 위한 도면이다.In this regard, embodiments of the present invention will be described in detail with reference to the accompanying drawings. Here, FIG. 2 is a diagram for generally explaining an explanatory deep learning method and system according to an embodiment of the present invention. Also, FIG. 3 is a schematic diagram for explaining the decision tree, FIG. 4 is a reference diagram for explaining the position and meaning of a node in the decision tree, FIG. 5 is an exemplary view of the decision tree, and FIG. 6 is a decision tree It is a diagram for explaining the classification space divided by the entire tree.

도 2를 참조할 때, 본 발명의 실시예에 따른 설명력 있는 딥 러닝 방법 및 시스템은, 데이터 집합(data set)에 대한 딥 러닝(Deep Learning)을 수행하여 주어진 문제에 관한 결과를 획득하고, 상기 주어진 문제에 관한 복수의 분류 규칙을 포함하는 디시전 트리(Decision Tree)들을 생성하며, 상기 생성된 복수의 디시전 트리 중 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 상기 딥 러닝을 통한 결과에 매칭하고, 상기 디시전 트리로부터 추출되는 상기 가장 유사한 분류 결과와 관련된 분류 규칙을 이용하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 획득하는 방식으로 구현될 수 있다.Referring to FIG. 2, an explanatory deep learning method and system according to an embodiment of the present invention obtains a result of a given problem by performing deep learning on a data set, and Decision trees including a plurality of classification rules related to a given problem are generated, and among the generated plurality of decision trees, the classification result of the decision tree having the most similar result to the result through the deep learning May be implemented in a manner of matching the result through the deep learning and obtaining the basis for the result through the deep learning by using the classification rule related to the most similar classification result extracted from the decision tree. .

즉, 본 발명에서의 설명력 있는 딥 러닝 방법은, 먼저, 정확도가 높은 딥 러닝(예를 들어, CNN 등)으로 먼저 학습을 수행하여 주어진 문제를 판정한다. 이후, 해당 딥 러닝 결과에 대한 설명력을 확보하기 위해서 분류의 경계선을 확보해주는 디시전 트리를 생성하게 된다. 이때, 디시전 트리는 랜덤 포레스트(Random Forrest) 또는 그레디언트 부스팅 디시전 트리(Gradient boosting decision tree)를 이용하여 생성할 수 있다.That is, in the explanatory deep learning method in the present invention, first, deep learning (eg, CNN, etc.) with high accuracy is first performed to determine a given problem. Subsequently, in order to secure explanatory power for the deep learning result, a decision tree that secures the boundary of classification is generated. At this time, the decision tree may be generated using a random forrest or a gradient boosting decision tree.

이러한 디시전 트리는 도 3을 통해 도시한 바와 같이, 질문과 대답의 집합으로 주어진 문제를 분류하게 되며, 질문과 대답의 트리 구조(즉, 상위에서 하위 노드까지의 멀티 레이어의 IF-THEN 구조, 도 4 참조)를 통해서 설명력이 확보될 수 있는 직교형 경계선을 많이 만들어낼 수 있는 장점이 있다. 따라서, 직교 경계선을 생성하는 디시전 트리의 분류 규칙(classification rule)들은 도 3에 예시된 바와 같이 주어진 데이터를 분류하는 명확한 설명력을 제공함으로써, 히든 레이어에 의해서 설명력의 확보가 어려운 딥러닝의 단점을 보완해줄수 있다.3, the decision tree classifies a given problem as a set of questions and answers, as shown through FIG. 3, and a tree structure of questions and answers (that is, a multi-layer IF-THEN structure from upper to lower nodes). (See 4), it has the advantage of creating a lot of orthogonal borders through which explanatory power can be secured. Accordingly, the classification rules of the decision tree for generating the orthogonal boundary line provide a clear explanatory power to classify the given data as illustrated in FIG. 3, and thus the disadvantage of deep learning that is difficult to secure the explanatory power by the hidden layer. Can complement.

이에 관한 간략한 예시로서 도 5에는 당뇨 위험군을 분류해내기 위한 디시전 트리가 도시되어 있는데, 도 5는 당뇨 위험군을 분류하기 위한 디시전 트리로서 총 3개의 분류 규칙이 IF-THEN statement로 구성한 예를 보여주고 있다. 본 예에서 적용한 해당 분류 규칙들은 다음과 같다.As a brief example of this, FIG. 5 shows a decision tree for classifying diabetes risk groups, and FIG. 5 is an example of a classification tree for classifying diabetes risk groups, in which three classification rules are composed of IF-THEN statements. Showing. The applicable classification rules applied in this example are as follows.

제1 규칙 A(rule A) : 만일(IF) 나이 > 40 이면 (THEN) 당뇨에 위험하다.Rule A: If (IF) age> 40 (THEN) is dangerous for diabetes.

제2 규칙 B(rule B) : 만일(IF) 당화혈색소의 값이 120 이하이면 (THEN) 당뇨에 위험하다.Rule B: (IF) If the value of glycated hemoglobin is less than or equal to 120 (THEN), it is dangerous for diabetes.

제3 규칙 C(rule C) : 만일(IF) 소변에서 거품이 나면 (THEN) 당뇨에 위험하다.Rule C: If (IF) urine foams (THEN), it is dangerous for diabetes.

상술한 예시에서와 같이, 각각의 IF-THEN statement를 구성하는 트리 구조의 분류 규칙들을 이용함으로써, 설명력이 높은 초기 루트 노드들을 구성할 수 있다. As in the above-described example, by using classification rules of a tree structure constituting each IF-THEN statement, it is possible to construct initial root nodes with high explanatory power.

이때, 디시전 트리에서 각 노드들은 도 6에서와 같이 그 각 노드들에 의한 공간 분할(즉, 분류 경계선에 기반한 데이터의 분류)이 이루어지게 된다. 도 6을 참조하면, 아무런 분기가 일어나지 않은 상태의 root node는 A이고(변수가 3개짜리이니 맨 위 그림에서처럼 3차원 공간에 있는 직육면체를 A라고 상정함), A가 어떤 기준에 의해 B와 C로 분할됐다고 가정하면 두번째 그림처럼 A가 두 개의 부분 집합으로 나뉘었다고 볼 수 있다. 마지막으로 B가 D와 C로 분할됐다면, 맨 아래 그림에서처럼 terminal node는 C, D, E의 3개이며 이를 데이터 공간과 연관지어 생각해보면 전체 데이터 A가 세 개의 부분집합으로 분할된 것을 알 수 있다.At this time, each node in the decision tree is divided into spaces (that is, classification of data based on a classification boundary) by each node as shown in FIG. 6. Referring to FIG. 6, the root node in a state where no branching occurs is A (the variable is three, so a cube in 3D space is assumed to be A as in the top figure), and A is determined by B by some criteria. Assuming that it is divided into C, you can see that A is divided into two subsets as shown in the second picture. Finally, if B is divided into D and C, as shown in the figure at the bottom, the terminal nodes are 3 of C, D, and E. If you think about this in relation to the data space, you can see that the entire data A is divided into three subsets. .

상술한 바에 따른 디시전 트리의 상위 노드의 규칙들을 이용해서 설명해가면 대부분의 상황에 대한 설명력이 제공되며 매우 디테일한 규칙들을 요구하는 경우에도 디시전 트리의 하위 노드들의 규칙을 활용하여 설명할 수가 있게 된다.Described using the rules of the upper node of the decision tree according to the above, explanation power for most situations is provided, and even when very detailed rules are required, it can be explained by using the rules of the lower nodes of the decision tree. do.

따라서 본 발명의 실시예에 의하면, 기존의 딥 러닝에서 이슈가 되었던 2가지 문제를 해결할 수 있게 된다. 그 2가지 이슈 중 첫 번째 이슈는 법적인 이슈로서, 딥 러닝이 정확도가 높은 알고리즘인 것은 맞지만 해당 알고리즘의 설명력이 부족하다 보니 의료용 분류의 문제의 경우 질병이라고 판단했는데 질병이 아니라고 할 경우, 설명력의 부재로 인한 법적인 문제가 발생할 수 있었다. 두 번째 이슈는 서비스 편리성으로서, 주어진 분류 문제에 대한 해법으로 서비스를 제공시에 왜 해당 문제를 A라고 분류하였는지를 설명해줄수 있어야 하기 때문에 대화가 가능한 서비스가 필요한데 이를 위해서는 설명력을 확보하기 어려운 문제가 있었다. 그러나 본 발명의 실시예에 의하면, 설명력 있는 규칙들을 생성해주는 디시전 트리를 딥 러닝의 결과와 연계하여 활용함으로써, 딥 러닝 적용 후의 결과에 대한 설명을 원하는 다양한 문제에서 결과에 대한 사용자 신뢰성을 획기적으로 높일 수 있는 효과가 있다.Therefore, according to an embodiment of the present invention, it is possible to solve two problems that have been an issue in the existing deep learning. The first of the two issues is a legal issue, although it is true that deep learning is an algorithm with high accuracy, but it lacks the explanatory power of the algorithm. Due to the legal problems could arise. The second issue is service convenience, so it is necessary to be able to explain why the problem was classified as A when providing the service as a solution to the given classification problem. . However, according to an embodiment of the present invention, by utilizing a decision tree that generates explanatory rules in connection with the results of deep learning, the user reliability of the results is significantly improved in various problems that want to explain the results after applying deep learning. It has the effect of increasing.

상술한 본 발명의 실시예에 따른 딥 러닝 방법은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터 시스템에 의하여 해독될 수 있는 데이터가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다. The deep learning method according to the above-described embodiment of the present invention may be implemented as computer readable codes on a computer readable recording medium. The computer-readable recording medium includes any kind of recording medium storing data that can be read by a computer system. For example, there may be a read only memory (ROM), a random access memory (RAM), a magnetic tape, a magnetic disk, a flash memory, and an optical data storage device. In addition, the computer-readable recording medium may be distributed over computer systems connected by a computer communication network, and stored and executed as code readable in a distributed manner.

이상에서는 본 발명의 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 쉽게 이해할 수 있을 것이다.Although described above with reference to embodiments of the present invention, those skilled in the art variously modify the present invention without departing from the spirit and scope of the present invention as set forth in the claims below. And it can be easily understood.

Claims (6)

컴퓨터 구현 방법(Computer implemented method)로서,
(a) 데이터 집합(data set)에 대한 딥 러닝(Deep Learning)을 수행하여 주어진 문제에 관한 결과를 획득하는 단계;
(b) 상기 주어진 문제에 관한 복수의 분류 규칙을 포함하는 디시전 트리(Decision Tree)를 생성하는 단계;
(c) 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 상기 딥 러닝을 통한 결과에 매칭하는 단계; 및
(d) 상기 매칭 결과를 반영하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 상기 디시전 트리로부터 획득하는 단계
를 포함하는 컴퓨터 구현 방법.
As a computer implemented method,
(a) performing deep learning on a data set to obtain a result of a given problem;
(b) creating a decision tree comprising a plurality of classification rules for the given problem;
(c) matching the classification result of the decision tree having the result most similar to the result through the deep learning to the result through the deep learning; And
(d) reflecting the matching result, obtaining a basis for the corresponding result through the deep learning from the decision tree
Computer implemented method comprising a.
제1항에 있어서,
상기 (b) 단계는, 랜덤 포레스트(Random Forrest) 또는 그레디언트 부스팅 디시전 트리(Gradient boosting decision tree)를 이용하여 생성하는 것을 특징으로 하는, 컴퓨터 구현 방법.
According to claim 1,
The step (b), characterized in that generated using a random forrest (Random Forrest) or a gradient boosting decision tree (Gradient boosting decision tree), computer-implemented method.
제1항에 있어서,
상기 (b) 단계에서, 상기 데이터 집합에 기준하여 복수의 디시전 트리를 생성하되,
상기 (c) 단계는, 상기 생성된 복수의 디시전 트리 중 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 상기 딥 러닝을 통한 결과에 매칭하는 단계이고,
상기 (d) 단계는, 상기 디시전 트리로부터 추출되는 상기 가장 유사한 분류 결과와 관련된 분류 규칙을 이용하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 획득하는 것을 특징으로 하는, 컴퓨터 구현 방법.
According to claim 1,
In step (b), a plurality of decision trees are generated based on the data set,
The step (c) is a step of matching the classification result of the decision tree having the result most similar to the result through the deep learning among the generated plurality of decision trees to the result through the deep learning,
In step (d), the computer-implemented method is characterized in that a basis for obtaining the corresponding result through the deep learning is obtained by using a classification rule related to the most similar classification result extracted from the decision tree.
딥 러닝 시스템으로서,
데이터 집합(data set)에 대한 딥 러닝(Deep Learning)을 수행하여 주어진 문제에 관한 결과를 획득하는 딥 러닝 수행부; 상기 주어진 문제에 관한 복수의 분류 규칙을 포함하는 디시전 트리(Decision Tree)를 생성하는 디시전 트리 생성부; 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 상기 딥 러닝을 통한 결과에 매칭하고, 상기 매칭 결과를 반영하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 상기 디시전 트리로부터 획득하는 매칭부를 포함하는 딥 러닝 시스템.
As a deep learning system,
A deep learning unit performing deep learning on a data set to obtain a result of a given problem; A decision tree generator for generating a decision tree including a plurality of classification rules for the given problem; The classification result of the decision tree having the result most similar to the result through the deep learning is matched to the result through the deep learning, and the matching result is reflected to indicate the basis on which the corresponding result through the deep learning appears. Deep learning system including a matching unit obtained from all trees.
제4항에 있어서,
상기 디시전 트리 생성부는, 랜덤 포레스트(Random Forrest) 또는 그레디언트 부스팅 디시전 트리(Gradient boosting decision tree)를 이용하여 생성하는 것을 특징으로 하는, 딥 러닝 시스템.
According to claim 4,
The decision tree generation unit, characterized in that generated by using a random forest (Random Forrest) or a gradient boosting decision tree (Gradient boosting decision tree), deep learning system.
제4항에 있어서,
상기 디시전 트리 생성부는 상기 데이터 집합에 기준하여 복수의 디시전 트리를 생성하되,
상기 매칭부는, 상기 생성된 복수의 디시전 트리 중 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 상기 딥 러닝을 통한 결과에 매칭하고, 상기 디시전 트리로부터 추출되는 상기 가장 유사한 분류 결과와 관련된 분류 규칙을 이용하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 획득하는 것을 특징으로 하는, 딥 러닝 시스템.
According to claim 4,
The decision tree generation unit generates a plurality of decision trees based on the data set,
The matching unit matches the classification result of the decision tree having the most similar result to the result through the deep learning among the generated plurality of decision trees to the result through the deep learning, and is extracted from the decision tree Deep learning system, characterized in that to obtain the basis for the corresponding result through the deep learning by using the classification rule associated with the most similar classification results.
KR1020170159824A 2017-11-28 2017-11-28 Explainable deep learning method and system KR102093789B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170159824A KR102093789B1 (en) 2017-11-28 2017-11-28 Explainable deep learning method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170159824A KR102093789B1 (en) 2017-11-28 2017-11-28 Explainable deep learning method and system

Publications (2)

Publication Number Publication Date
KR20190061431A KR20190061431A (en) 2019-06-05
KR102093789B1 true KR102093789B1 (en) 2020-03-27

Family

ID=66845079

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170159824A KR102093789B1 (en) 2017-11-28 2017-11-28 Explainable deep learning method and system

Country Status (1)

Country Link
KR (1) KR102093789B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967003B (en) * 2020-07-22 2023-11-28 武汉极意网络科技有限公司 Automatic wind control rule generation system and method based on black box model and decision tree

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016177278A1 (en) 2015-05-04 2016-11-10 阿里巴巴集团控股有限公司 Method and system for matching service scene

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102558021B1 (en) * 2016-06-10 2023-07-24 한국전자통신연구원 A clinical decision support ensemble system and the clinical decision support method by using the same

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016177278A1 (en) 2015-05-04 2016-11-10 阿里巴巴集团控股有限公司 Method and system for matching service scene

Also Published As

Publication number Publication date
KR20190061431A (en) 2019-06-05

Similar Documents

Publication Publication Date Title
JP7210587B2 (en) Machine learning to integrate knowledge and natural language processing
US10846485B2 (en) Machine learning model modification and natural language processing
Suthaharan et al. Decision tree learning
US10776586B2 (en) Machine learning to integrate knowledge and augment natural language processing
US11954572B2 (en) Optimizing training data for image classification
Salaberria et al. Image captioning for effective use of language models in knowledge-based visual question answering
KR102223382B1 (en) Method and apparatus for complementing knowledge based on multi-type entity
US10839308B2 (en) Categorizing log records at run-time
US20160034554A1 (en) Large-scale data clustering with dynamic social context
US20190361679A1 (en) Hardware device based software verification
CN114491077A (en) Text generation method, device, equipment and medium
US20230177089A1 (en) Identifying similar content in a multi-item embedding space
KR20210148095A (en) Data classification method and system, and classifier training method and system
US20210279279A1 (en) Automated graph embedding recommendations based on extracted graph features
CN113836128A (en) Abnormal data identification method, system, equipment and storage medium
US11636331B2 (en) User explanation guided machine learning
KR102093789B1 (en) Explainable deep learning method and system
US11657596B1 (en) System and method for cascading image clustering using distribution over auto-generated labels
CN114330476A (en) Model training method for media content recognition and media content recognition method
US20230289734A1 (en) Apparatus and methods for creating a video record
CN111611409A (en) Case analysis method integrated with scene knowledge and related equipment
US11755671B2 (en) Projecting queries into a content item embedding space
US11556558B2 (en) Insight expansion in smart data retention systems
CN114676677A (en) Information processing method, information processing apparatus, server, and storage medium
Joshi et al. Classification of Movie Success: A Comparison of Two Movie Datasets

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right