KR20190061431A - Explainable deep learning method and system - Google Patents

Explainable deep learning method and system Download PDF

Info

Publication number
KR20190061431A
KR20190061431A KR1020170159824A KR20170159824A KR20190061431A KR 20190061431 A KR20190061431 A KR 20190061431A KR 1020170159824 A KR1020170159824 A KR 1020170159824A KR 20170159824 A KR20170159824 A KR 20170159824A KR 20190061431 A KR20190061431 A KR 20190061431A
Authority
KR
South Korea
Prior art keywords
result
deep learning
decision tree
classification
tree
Prior art date
Application number
KR1020170159824A
Other languages
Korean (ko)
Other versions
KR102093789B1 (en
Inventor
이종태
Original Assignee
동국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동국대학교 산학협력단 filed Critical 동국대학교 산학협력단
Priority to KR1020170159824A priority Critical patent/KR102093789B1/en
Publication of KR20190061431A publication Critical patent/KR20190061431A/en
Application granted granted Critical
Publication of KR102093789B1 publication Critical patent/KR102093789B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Abstract

Provided is a computer-implemented method. The computer-implemented method comprises the steps of: (a) obtaining a result on a given question by performing deep learning on a data set; (b) generating a decision tree including a plurality of classification rules related to the given question; (c) matching a classification result of the decision tree most similar to a result of the deep learning; and (d) reflecting the matching result and obtaining a basis that the corresponding result is obtained through the deep learning from the decision tree.

Description

설명력이 있는 딥 러닝 방법 및 시스템{EXPLAINABLE DEEP LEARNING METHOD AND SYSTEM} [0001] Description [0002] EXPLAINABLE DEEP LEARNING METHOD AND SYSTEM [

본 발명은 딥 러닝 기술에 관한 것으로서, 보다 구체적으로는 딥 러닝 결과와 가장 유사한 결과 값을 갖는 디시전 트리(decision tree)를 이용함으로써 딥 러닝 결과에 설명력을 확보하는 딥 러닝 방법 및 시스템에 관한 것이다. The present invention relates to a deep running technique, and more particularly, to a deep running method and system for securing explanatory power on a deep running result by using a decision tree having a result most similar to a deep running result .

최근 딥 러닝은 이미지 분류, 음성인식, 주가예측, 자연어 채팅봇에 이르기까지 광범위하게 사용되는 신경망 기술이다. 그런데 신경망은 그 특성상 설명력을 발휘해야 하는 근거들(즉, 설명력을 제공하는 근거인 해당 결과에 대한 결정 규칙들)이 특징 기반의 히든 레이어(hidden layer)들로 분산되어 흩어지기 때문에 설명력이 약하다는 단점이 있다(도 1 참조).Recently, Deep Learning is a neural network technology widely used for image classification, speech recognition, stock prediction, natural chat bots. However, neural networks have weak explanatory power because they are dispersed to the hidden layers of feature-based hidden layers (ie, the rules for determining the result, which is the basis for providing explanatory power) (See Fig. 1).

즉, 딥 러닝은 주어진 데이터 세트에 대해 신경망 학습을 통해서 주어진 분류 문제에 대한 정확한 분류 결과를 제공 한다(예: Convolutional neural network). 이때, 딥 러닝은 분류의 정확도와 같이 학습의 결과가 우수하지만 해당 분류를 위해서 설정된 수학적 분류기들이 주어진 문제를 다수의 경계선으로 분리하여 주어진 데이터 들을 분류할 때의 경계선을 잘 모르게 되는 경우가 많고, 만약 알아낸다고 해도 비직교 경계선이 아니라서 말로 표현하기가 어렵다는 점이다.That is, deep learning provides accurate classification results for a given classification problem through neural network learning for a given set of data (eg, a convolutional neural network). At this time, the deep learning is excellent in the result of learning, such as the accuracy of classification, but the mathematical classifiers set for the classification are often unaware of the boundary line when classifying given data by dividing a given problem into a plurality of boundaries, It is difficult to express in words because it is not a non-orthogonal boundary line.

따라서 실제로 여러 문제에서 우수한 결과를 나타내는 딥 러닝에 설명력을 확보할 수 있는 신규의 방법 및 시스템이 요구된다.Therefore, there is a need for a novel method and system that can provide explanatory power in deep running that exhibits excellent results in practice.

본 발명은 딥 러닝 결과와 가장 유사한 결과 값을 갖는 디시전 트리(decision tree)를 이용함으로써 딥 러닝 결과에 설명력을 확보하는 딥 러닝 방법 및 시스템을 제공하고자 한다.The present invention seeks to provide a deep running method and system for securing explanatory power in a deep running result by using a decision tree having a result most similar to a deep running result.

본 발명의 일 측면에 따르면, 컴퓨터 구현 방법(Computer implemented method)로서, (a) 데이터 집합(data set)에 대한 딥 러닝(Deep Learning)을 수행하여 주어진 문제에 관한 결과를 획득하는 단계; (b) 상기 주어진 문제에 관한 복수의 분류 규칙을 포함하는 디시전 트리(Decision Tree)를 생성하는 단계; (c) 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 매칭하는 단계; 및 (d) 상기 매칭 결과를 반영하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 상기 디시전 트리로부터 획득하는 단계를 포함하는 컴퓨터 구현 방법이 제공된다.According to an aspect of the present invention there is provided a computer implemented method comprising the steps of: (a) performing a Deep Learning on a data set to obtain a result on a given problem; (b) generating a decision tree including a plurality of classification rules related to the given problem; (c) matching the classification result of the decision tree with the result most similar to the result of the deep learning; And (d) acquiring, from the decision tree, a basis on which the corresponding result is obtained through the deep learning by reflecting the matching result.

여기서, 상기 (b) 단계는, 랜덤 포레스트(Random Forrest) 또는 그레디언트 부스팅 디시전 트리(Gradient boosting decision tree)를 이용하여 생성하는 단계일 수 있다.The step (b) may be performed using a random forrest or a gradient boosting decision tree.

여기서, 상기 (b) 단계에서 상기 데이터 집합에 기준하여 복수의 디시전 트리를 생성하되, 상기 (c) 단계는 상기 생성된 복수의 디시전 트리 중 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 매칭하는 단계이고,In the step (b), a plurality of decision trees are generated on the basis of the data set, and the step (c) includes the steps of: Matching the classification result of the decision tree,

상기 (d) 단계는, 상기 디시전 트리로부터 추출되는 상기 가장 유사한 분류 결과와 관련된 분류 규칙을 이용하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 획득할 수 있다.In the step (d), it is possible to obtain the basis on which the corresponding result is obtained through the deep learning using the classification rule related to the most similar classification result extracted from the decision tree.

본 발명의 다른 측면에 따르면, 딥 러닝 시스템으로서, 데이터 집합(data set)에 대한 딥 러닝(Deep Learning)을 수행하여 주어진 문제에 관한 결과를 획득하는 딥 러닝 수행부; 상기 주어진 문제에 관한 복수의 분류 규칙을 포함하는 디시전 트리(Decision Tree)를 생성하는 디시전 트리 생성부; 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 매칭하고, 상기 매칭 결과를 반영하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 상기 디시전 트리로부터 획득하는 매칭부를 포함하는 딥 러닝 시스템이 제공된다.According to another aspect of the present invention, there is provided a deep running system comprising: a deep running performing unit for performing a deep learning on a data set to obtain a result on a given problem; A decision tree generating unit for generating a decision tree including a plurality of classification rules related to the given problem; A matching unit that matches the classification result of the decision tree having the most similar result as the result of the deep learning and acquires from the decision tree a basis on which the corresponding result through the deep learning is reflected by reflecting the matching result A deep running system is provided.

여기서, 상기 디시전 트리 생성부는, 랜덤 포레스트(Random Forrest) 또는 그레디언트 부스팅 디시전 트리(Gradient boosting decision tree)를 이용하여 생성할 수 있다.Here, the decision tree generating unit may generate a random forrest or a gradient boosting decision tree.

여기서, 상기 디시전 트리 생성부는 상기 데이터 집합에 기준하여 복수의 디시전 트리를 생성하되,Here, the decision tree generation unit may generate a plurality of decision trees based on the data set,

상기 매칭부는, 상기 생성된 복수의 디시전 트리 중 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 매칭하고, 상기 디시전 트리로부터 추출되는 상기 가장 유사한 분류 결과와 관련된 분류 규칙을 이용하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 획득할 수 있다.Wherein the matching unit matches a classification result of the decryption tree having a result most similar to the result of the deep learning among the plurality of generated decryption trees and associates the decryption result with the most similar classification result extracted from the decryption tree It is possible to obtain a basis on which the corresponding result is obtained through the deep learning using the classification rule.

본 발명의 실시예에 따른 딥 러닝 방법 및 시스템에 의하면, 딥 러닝 결과와 가장 유사한 결과 값을 갖는 디시전 트리(decision tree)를 이용함으로써 딥 러닝 결과에 설명력을 확보할 수 있는 효과가 있다.According to the deep learning method and system according to the embodiment of the present invention, explanatory power can be secured in a deep learning result by using a decision tree having a result that is most similar to the deep learning result.

도 1은 기존의 딥 러닝 기술의 문제점을 설명하기 위한 참조 도면.
도 2는 본 발명의 실시예에 따른 설명력 있는 딥 러닝 방법 및 시스템을 전반적으로 설명하기 위한 도면.
도 3은 디시전 트리를 설명하기 위한 모식도이고, 도 4는 디시전 트리에서의 노드의 위치와 의미를 설명하는 참조 도면이고, 도 5는 디시전 트리의 일 예시 도면이며, 도 6은 디시전 트리에 의해서 분할되는 분류 공간을 설명하기 위한 도면.
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a drawing for explaining a problem of a conventional deep-running technique. FIG.
2 is a diagram generally illustrating a demonstrative deep-running method and system according to an embodiment of the present invention.
FIG. 3 is a schematic diagram for explaining a decision tree, FIG. 4 is a reference drawing for explaining the position and meaning of a node in the decision tree, FIG. 5 is an example of a decision tree, A diagram for explaining a classification space divided by a tree.

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.BRIEF DESCRIPTION OF THE DRAWINGS The present invention is capable of various modifications and various embodiments, and specific embodiments are illustrated in the drawings and described in detail in the detailed description. It is to be understood, however, that the invention is not to be limited to the specific embodiments, but includes all modifications, equivalents, and alternatives falling within the spirit and scope of the invention.

본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자(예를 들어, 제1, 제2 등)는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, the present invention will be described in detail with reference to the accompanying drawings. In addition, numerals (e.g., first, second, etc.) used in the description of the present invention are merely an identifier for distinguishing one component from another.

또한, 명세서 전체에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다.Also, throughout the specification, when an element is referred to as being " connected " or " connected " with another element, the element may be directly connected or directly connected to the other element, It should be understood that, unless an opposite description is present, it may be connected or connected via another element in the middle.

또한, 명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하나 이상의 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 조합으로 구현될 수 있음을 의미한다.Also, throughout the specification, when an element is referred to as " including " an element, it is understood that the element may include other elements as well, without departing from the other elements unless specifically stated otherwise. Also, the terms " a ", " module ", and the like in the description mean a unit for processing at least one function or operation, which means that it can be implemented by one or more hardware or software or a combination of hardware and software .

본 발명은 주어진 특정 문제에 대한 해답을 찾기 위해서 기존의 데이터마이닝 기술로써 설명력이 매우 높은 디시전 트리를 생성해주는 랜덤 포레스트(Random Forrest) 또는 그레디언트 부스팅 디시전 트리(Gradient boosting decision tree)의 결과를 활용하여, 딥 러닝 결과와 가장 유사한 디시전 트리의 결과를 매칭함으로써 딥 러닝에서 제시하는 가장 좋은 결과를 가시화하여 딥 러닝에서 나온 결과에 대한 설명력을 상술한 디시전 트리 기술로부터 확보하는 기술이다.The present invention utilizes the results of a random forrest or a gradient boosting decision tree that generates a highly illustrative decision tree as a conventional data mining technique to find a solution to a given problem. By matching the result of the deep-run and the result of the most similar deep-tree, the best result presented in the deep-run is visualized and the explanatory power of the result from the deep-run is acquired from the above-described decryption tree technique.

이에 의하면, 신경망의 특징인 히든 레이어 때문에 그 결과에 대한 근거를 제시하기가 곤란했는데 이를 설명력 있는 규칙들을 생성해주는 디시전 트리를 생성하여 문제를 풀 수 있다. 대표적인 디시전 트리의 생성 방법인 랜덤 포레스트(Random Forrest) 또는 그레디언트 부스팅 결정 트리(Gradient boosting decision tree) 등의 방법과 딥 러닝의 결과를 연계하여 제시함으로써, 딥 러닝 적용 후의 결과에 대한 설명을 원하는 다양한 문제에서 결과에 대한 사용자 신뢰성을 획기적으로 증가시킬 수 있을 것으로 기대된다.According to this, it is difficult to present the basis of the result due to the hidden layer, which is a characteristic of the neural network. The problem can be solved by generating a decision tree that generates explanatory rules. In this paper, we propose a method of generating deep tree by applying a method such as Random Forrest or Gradient boosting decision tree, which is a typical method of generating a decryption tree, It is expected that the reliability of the result will be greatly increased.

이에 관하여, 이하 첨부된 도면들을 참조하여 본 발명의 실시예를 상세히 설명하기로 한다. 여기서, 도 2는 본 발명의 실시예에 따른 설명력 있는 딥 러닝 방법 및 시스템을 전반적으로 설명하기 위한 도면이다. 또한 도 3은 디시전 트리를 설명하기 위한 모식도이고, 도 4는 디시전 트리에서의 노드의 위치와 의미를 설명하는 참조 도면이고, 도 5는 디시전 트리의 일 예시 도면이며, 도 6은 디시전 트리에 의해서 분할되는 분류 공간을 설명하기 위한 도면이다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. Herein, FIG. 2 is a diagram for explaining overall explanatory depth learning method and system according to an embodiment of the present invention. 4 is a reference diagram for explaining the positions and meanings of nodes in a decryption tree, FIG. 5 is an example of a decryption tree, and FIG. Fig. 8 is a diagram for explaining a classification space divided by an entire tree. Fig.

도 2를 참조할 때, 본 발명의 실시예에 따른 설명력 있는 딥 러닝 방법 및 시스템은, 데이터 집합(data set)에 대한 딥 러닝(Deep Learning)을 수행하여 주어진 문제에 관한 결과를 획득하고, 상기 주어진 문제에 관한 복수의 분류 규칙을 포함하는 디시전 트리(Decision Tree)들을 생성하며, 상기 생성된 복수의 디시전 트리 중 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 매칭하고, 상기 디시전 트리로부터 추출되는 상기 가장 유사한 분류 결과와 관련된 분류 규칙을 이용하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 획득하는 방식으로 구현될 수 있다.Referring to FIG. 2, a demonstrative deep learning method and system according to an embodiment of the present invention performs a deep learning on a data set to obtain a result on a given problem, Generating a plurality of decision trees including a plurality of classification rules related to a given problem and generating a classification result of the decision tree having a result most similar to the result of the deep learning among the generated plurality of decision trees And acquiring the basis on which the corresponding result is obtained through the deep learning using the classification rule associated with the most similar classification result extracted from the decision tree.

즉, 본 발명에서의 설명력 있는 딥 러닝 방법은, 먼저, 정확도가 높은 딥 러닝(예를 들어, CNN 등)으로 먼저 학습을 수행하여 주어진 문제를 판정한다. 이후, 해당 딥 러닝 결과에 대한 설명력을 확보하기 위해서 분류의 경계선을 확보해주는 디시전 트리를 생성하게 된다. 이때, 디시전 트리는 랜덤 포레스트(Random Forrest) 또는 그레디언트 부스팅 디시전 트리(Gradient boosting decision tree)를 이용하여 생성할 수 있다.That is, in the explanatory deep learning method in the present invention, first, learning is performed by deep running (for example, CNN or the like) with high accuracy to determine a given problem. Then, in order to secure explanatory power of the deep learning result, a decryption tree for securing the classification boundary line is generated. At this time, the decision tree can be generated using a random forrest or a gradient boosting decision tree.

이러한 디시전 트리는 도 3을 통해 도시한 바와 같이, 질문과 대답의 집합으로 주어진 문제를 분류하게 되며, 질문과 대답의 트리 구조(즉, 상위에서 하위 노드까지의 멀티 레이어의 IF-THEN 구조, 도 4 참조)를 통해서 설명력이 확보될 수 있는 직교형 경계선을 많이 만들어낼 수 있는 장점이 있다. 따라서, 직교 경계선을 생성하는 디시전 트리의 분류 규칙(classification rule)들은 도 3에 예시된 바와 같이 주어진 데이터를 분류하는 명확한 설명력을 제공함으로써, 히든 레이어에 의해서 설명력의 확보가 어려운 딥러닝의 단점을 보완해줄수 있다.As shown in FIG. 3, such a decision tree classifies a given problem into a set of questions and answers. The tree structure of the questions and answers (i.e., the IF-THEN structure of the multi-layer from the upper node to the lower node, 4), there is an advantage that many orthogonal boundary lines can be obtained which can secure explanatory power. Therefore, the classification rules of the decision tree for generating the orthogonal boundary lines provide a clear explanatory power for classifying the given data as illustrated in FIG. 3, thereby providing a disadvantage of deep learning that is difficult to secure explanatory power by the hidden layer You can complement it.

이에 관한 간략한 예시로서 도 5에는 당뇨 위험군을 분류해내기 위한 디시전 트리가 도시되어 있는데, 도 5는 당뇨 위험군을 분류하기 위한 디시전 트리로서 총 3개의 분류 규칙이 IF-THEN statement로 구성한 예를 보여주고 있다. 본 예에서 적용한 해당 분류 규칙들은 다음과 같다.Fig. 5 shows a decision tree for classifying diabetic risk groups. Fig. 5 shows an example in which a total of three classification rules are composed of an IF-THEN statement. . The classification rules applied in this example are as follows.

제1 규칙 A(rule A) : 만일(IF) 나이 > 40 이면 (THEN) 당뇨에 위험하다.Rule A: If (IF) age> 40 (THEN) it is dangerous to diabetes.

제2 규칙 B(rule B) : 만일(IF) 당화혈색소의 값이 120 이하이면 (THEN) 당뇨에 위험하다.Regulation 2 (rule B): If the value of (H) glycated hemoglobin is less than 120 (THEN), it is dangerous to diabetes.

제3 규칙 C(rule C) : 만일(IF) 소변에서 거품이 나면 (THEN) 당뇨에 위험하다.Third rule C (rule C): If (IF) bubbles in the urine (THEN) it is dangerous to diabetes.

상술한 예시에서와 같이, 각각의 IF-THEN statement를 구성하는 트리 구조의 분류 규칙들을 이용함으로써, 설명력이 높은 초기 루트 노드들을 구성할 수 있다. As in the above example, initial root nodes with high explanatory power can be constructed by using the classification rules of the tree structure constituting each IF-THEN statement.

이때, 디시전 트리에서 각 노드들은 도 6에서와 같이 그 각 노드들에 의한 공간 분할(즉, 분류 경계선에 기반한 데이터의 분류)이 이루어지게 된다. 도 6을 참조하면, 아무런 분기가 일어나지 않은 상태의 root node는 A이고(변수가 3개짜리이니 맨 위 그림에서처럼 3차원 공간에 있는 직육면체를 A라고 상정함), A가 어떤 기준에 의해 B와 C로 분할됐다고 가정하면 두번째 그림처럼 A가 두 개의 부분 집합으로 나뉘었다고 볼 수 있다. 마지막으로 B가 D와 C로 분할됐다면, 맨 아래 그림에서처럼 terminal node는 C, D, E의 3개이며 이를 데이터 공간과 연관지어 생각해보면 전체 데이터 A가 세 개의 부분집합으로 분할된 것을 알 수 있다.At this time, each node in the decryption tree is partitioned by each node (i.e., classification of data based on the classification boundary) as shown in FIG. Referring to FIG. 6, the root node in the state where no branching occurs is A (assuming that the cuboid in the three-dimensional space is A, as shown in the three-dimensional top view in the figure) Assuming it is partitioned into C, you can see that A is divided into two subsets as shown in the second figure. Finally, if B is divided into D and C, as shown in the bottom figure, three terminal nodes are C, D, and E, and associating it with the data space shows that the entire data A is divided into three sub-sets .

상술한 바에 따른 디시전 트리의 상위 노드의 규칙들을 이용해서 설명해가면 대부분의 상황에 대한 설명력이 제공되며 매우 디테일한 규칙들을 요구하는 경우에도 디시전 트리의 하위 노드들의 규칙을 활용하여 설명할 수가 있게 된다.Using the rules of the upper node of the decision tree according to the above description, explanatory power of most situations is provided. Even if the detailed rules are required, it is possible to explain using the rules of the lower nodes of the descreen tree do.

따라서 본 발명의 실시예에 의하면, 기존의 딥 러닝에서 이슈가 되었던 2가지 문제를 해결할 수 있게 된다. 그 2가지 이슈 중 첫 번째 이슈는 법적인 이슈로서, 딥 러닝이 정확도가 높은 알고리즘인 것은 맞지만 해당 알고리즘의 설명력이 부족하다 보니 의료용 분류의 문제의 경우 질병이라고 판단했는데 질병이 아니라고 할 경우, 설명력의 부재로 인한 법적인 문제가 발생할 수 있었다. 두 번째 이슈는 서비스 편리성으로서, 주어진 분류 문제에 대한 해법으로 서비스를 제공시에 왜 해당 문제를 A라고 분류하였는지를 설명해줄수 있어야 하기 때문에 대화가 가능한 서비스가 필요한데 이를 위해서는 설명력을 확보하기 어려운 문제가 있었다. 그러나 본 발명의 실시예에 의하면, 설명력 있는 규칙들을 생성해주는 디시전 트리를 딥 러닝의 결과와 연계하여 활용함으로써, 딥 러닝 적용 후의 결과에 대한 설명을 원하는 다양한 문제에서 결과에 대한 사용자 신뢰성을 획기적으로 높일 수 있는 효과가 있다.Therefore, according to the embodiment of the present invention, it is possible to solve two problems that have become issues in the existing deep running. The first issue of these two issues is legal issue, and it is true that deep running is an algorithm with high accuracy. However, since it lacks explanatory power of the algorithm, it is judged to be a disease in the case of a medical classification problem. However, Could lead to legal problems. The second issue is service convenience, which is a solution to a given classification problem, and it must be able to explain why the problem is classified as A when providing the service. . However, according to the embodiment of the present invention, by using the decryption tree for generating explanatory rules in connection with the results of the deep learning, it is possible to dramatically improve the user reliability on the results in various problems, There is an effect that can be increased.

상술한 본 발명의 실시예에 따른 딥 러닝 방법은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터 시스템에 의하여 해독될 수 있는 데이터가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다. The deep-learning method according to an embodiment of the present invention can be implemented as a computer-readable code on a computer-readable recording medium. The computer-readable recording medium includes all kinds of recording media storing data that can be decoded by a computer system. For example, it may be a ROM (Read Only Memory), a RAM (Random Access Memory), a magnetic tape, a magnetic disk, a flash memory, an optical data storage device, or the like. In addition, the computer-readable recording medium may be distributed and executed in a computer system connected to a computer network, and may be stored and executed as a code readable in a distributed manner.

이상에서는 본 발명의 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 쉽게 이해할 수 있을 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it will be understood by those of ordinary skill in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the following claims And changes may be made without departing from the spirit and scope of the invention.

Claims (6)

컴퓨터 구현 방법(Computer implemented method)로서,
(a) 데이터 집합(data set)에 대한 딥 러닝(Deep Learning)을 수행하여 주어진 문제에 관한 결과를 획득하는 단계;
(b) 상기 주어진 문제에 관한 복수의 분류 규칙을 포함하는 디시전 트리(Decision Tree)를 생성하는 단계;
(c) 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 매칭하는 단계; 및
(d) 상기 매칭 결과를 반영하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 상기 디시전 트리로부터 획득하는 단계
를 포함하는 컴퓨터 구현 방법.
As a computer implemented method,
(a) performing a Deep Learning on a data set to obtain a result on a given problem;
(b) generating a decision tree including a plurality of classification rules related to the given problem;
(c) matching the classification result of the decision tree with the result most similar to the result of the deep learning; And
(d) acquiring from the decision tree a basis on which the corresponding result through the deep learning is reflected by reflecting the matching result
Lt; / RTI >
제1항에 있어서,
상기 (b) 단계는, 랜덤 포레스트(Random Forrest) 또는 그레디언트 부스팅 디시전 트리(Gradient boosting decision tree)를 이용하여 생성하는 것을 특징으로 하는, 컴퓨터 구현 방법.
The method according to claim 1,
Wherein the step (b) is performed using a random forrest or a gradient boosting decision tree.
제1항에 있어서,
상기 (b) 단계에서, 상기 데이터 집합에 기준하여 복수의 디시전 트리를 생성하되,
상기 (c) 단계는, 상기 생성된 복수의 디시전 트리 중 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 매칭하는 단계이고,
상기 (d) 단계는, 상기 디시전 트리로부터 추출되는 상기 가장 유사한 분류 결과와 관련된 분류 규칙을 이용하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 획득하는 것을 특징으로 하는, 컴퓨터 구현 방법.
The method according to claim 1,
In the step (b), a plurality of decision trees are generated based on the data set,
Wherein the step (c) is a step of matching a classification result of the decryption tree having a result most similar to the result of the deep learning among the plurality of generated decryption trees,
Wherein the step (d) acquires a basis on which the corresponding result is obtained through the deep learning using a classification rule associated with the most similar classification result extracted from the decision tree.
딥 러닝 시스템으로서,
데이터 집합(data set)에 대한 딥 러닝(Deep Learning)을 수행하여 주어진 문제에 관한 결과를 획득하는 딥 러닝 수행부; 상기 주어진 문제에 관한 복수의 분류 규칙을 포함하는 디시전 트리(Decision Tree)를 생성하는 디시전 트리 생성부; 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 매칭하고, 상기 매칭 결과를 반영하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 상기 디시전 트리로부터 획득하는 매칭부를 포함하는 딥 러닝 시스템.
As a deep running system,
A deep learning performing unit for performing a deep learning on a data set to obtain a result on a given problem; A decision tree generating unit for generating a decision tree including a plurality of classification rules related to the given problem; A matching unit that matches the classification result of the decision tree having the most similar result as the result of the deep learning and acquires from the decision tree a basis on which the corresponding result through the deep learning is reflected by reflecting the matching result Includes a deep running system.
제4항에 있어서,
상기 디시전 트리 생성부는, 랜덤 포레스트(Random Forrest) 또는 그레디언트 부스팅 디시전 트리(Gradient boosting decision tree)를 이용하여 생성하는 것을 특징으로 하는, 딥 러닝 시스템.
5. The method of claim 4,
Wherein the decision tree generating unit generates the random tree using a random forrest or a gradient boosting decision tree.
제4항에 있어서,
상기 디시전 트리 생성부는 상기 데이터 집합에 기준하여 복수의 디시전 트리를 생성하되,
상기 매칭부는, 상기 생성된 복수의 디시전 트리 중 상기 딥 러닝을 통한 결과와 가장 유사한 결과를 갖는 상기 디시전 트리의 분류 결과를 매칭하고, 상기 디시전 트리로부터 추출되는 상기 가장 유사한 분류 결과와 관련된 분류 규칙을 이용하여 상기 딥 러닝을 통한 해당 결과가 나오게 된 근거를 획득하는 것을 특징으로 하는, 딥 러닝 시스템.
5. The method of claim 4,
Wherein the decision tree generation unit generates a plurality of decision trees based on the data set,
Wherein the matching unit matches a classification result of the decryption tree having a result most similar to the result of the deep learning among the plurality of generated decryption trees and associates the decryption result with the most similar classification result extracted from the decryption tree And acquires the basis on which the corresponding result is obtained through the deep learning by using the classification rule.
KR1020170159824A 2017-11-28 2017-11-28 Explainable deep learning method and system KR102093789B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170159824A KR102093789B1 (en) 2017-11-28 2017-11-28 Explainable deep learning method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170159824A KR102093789B1 (en) 2017-11-28 2017-11-28 Explainable deep learning method and system

Publications (2)

Publication Number Publication Date
KR20190061431A true KR20190061431A (en) 2019-06-05
KR102093789B1 KR102093789B1 (en) 2020-03-27

Family

ID=66845079

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170159824A KR102093789B1 (en) 2017-11-28 2017-11-28 Explainable deep learning method and system

Country Status (1)

Country Link
KR (1) KR102093789B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967003A (en) * 2020-07-22 2020-11-20 武汉极意网络科技有限公司 Automatic wind control rule generation system and method based on black box model and decision tree

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016177278A1 (en) * 2015-05-04 2016-11-10 阿里巴巴集团控股有限公司 Method and system for matching service scene
KR20170140757A (en) * 2016-06-10 2017-12-21 한국전자통신연구원 A clinical decision support ensemble system and the clinical decision support method by using the same

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016177278A1 (en) * 2015-05-04 2016-11-10 阿里巴巴集团控股有限公司 Method and system for matching service scene
KR20170140757A (en) * 2016-06-10 2017-12-21 한국전자통신연구원 A clinical decision support ensemble system and the clinical decision support method by using the same

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967003A (en) * 2020-07-22 2020-11-20 武汉极意网络科技有限公司 Automatic wind control rule generation system and method based on black box model and decision tree
CN111967003B (en) * 2020-07-22 2023-11-28 武汉极意网络科技有限公司 Automatic wind control rule generation system and method based on black box model and decision tree

Also Published As

Publication number Publication date
KR102093789B1 (en) 2020-03-27

Similar Documents

Publication Publication Date Title
JP7210587B2 (en) Machine learning to integrate knowledge and natural language processing
US10394956B2 (en) Methods, devices, and systems for constructing intelligent knowledge base
Boenninghoff et al. Explainable authorship verification in social media via attention-based similarity learning
Zeng et al. Quantum algorithms for compositional natural language processing
US11263223B2 (en) Using machine learning to determine electronic document similarity
US20160293034A1 (en) Question answering system-based generation of distractors using machine learning
JP2018532140A (en) Method and apparatus for online generation of problem paths from existing problem collections using knowledge graphs
US9536443B2 (en) Evaluating expert opinions in a question and answer system
CN110210021A (en) Read understanding method and device
US10108661B2 (en) Using synthetic events to identify complex relation lookups
US20200135039A1 (en) Content pre-personalization using biometric data
US11860953B2 (en) Apparatus and methods for updating a user profile based on a user file
US20210279279A1 (en) Automated graph embedding recommendations based on extracted graph features
WO2016175785A1 (en) Topic identification based on functional summarization
US9129216B1 (en) System, method and apparatus for computer aided association of relevant images with text
KR20210148095A (en) Data classification method and system, and classifier training method and system
US10229156B2 (en) Using priority scores for iterative precision reduction in structured lookups for questions
KR20190061431A (en) Explainable deep learning method and system
US20220067386A1 (en) Deterministic learning video scene detection
US20230289734A1 (en) Apparatus and methods for creating a video record
US20200210760A1 (en) System and method for cascading image clustering using distribution over auto-generated labels
US11790018B1 (en) Apparatus for attribute traversal
US11755671B2 (en) Projecting queries into a content item embedding space
US11797942B2 (en) Apparatus and method for applicant scoring
CN109522921A (en) Statement similarity method of discrimination and equipment

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right