KR101264223B1 - A spatial prediction analysis technique using a decision tree - Google Patents

A spatial prediction analysis technique using a decision tree Download PDF

Info

Publication number
KR101264223B1
KR101264223B1 KR1020110046325A KR20110046325A KR101264223B1 KR 101264223 B1 KR101264223 B1 KR 101264223B1 KR 1020110046325 A KR1020110046325 A KR 1020110046325A KR 20110046325 A KR20110046325 A KR 20110046325A KR 101264223 B1 KR101264223 B1 KR 101264223B1
Authority
KR
South Korea
Prior art keywords
decision tree
event
terminal node
prediction result
node
Prior art date
Application number
KR1020110046325A
Other languages
Korean (ko)
Other versions
KR20120128407A (en
Inventor
연영광
Original Assignee
한국지질자원연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국지질자원연구원 filed Critical 한국지질자원연구원
Priority to KR1020110046325A priority Critical patent/KR101264223B1/en
Publication of KR20120128407A publication Critical patent/KR20120128407A/en
Application granted granted Critical
Publication of KR101264223B1 publication Critical patent/KR101264223B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 공간사건의 원인분석 기능을 제공할 수 있도록 의사결정 트리를 이용한 공간사건에 대한 예측분석을 수행하기 위한 방법에 관한 것이다. 이와 같은 본 발명은 의사결정 트리에서 공간사건 예측결과를 표현하는 단계, 예측결과로부터 원인분석을 수행하는 특화된 단계에 관한 것이다. 의사결정 트리에서 공간사건에 대한 예측결과를 표현하기 위해 완전 성장한 트리를 구축하여, 구축된 트리에 포함된 데이터 분포를 이용하여 단말노드 등급결정 방법을 이용한다. 공간사건 예측결과에 대한 원인분석을 수행하기 위해 트리의 단말 노드 식별자를 좌표공간에 매핑하여 예측결과와 대응되도록 하여 의사결정 트리의 단말 노드로부터 일련의 부노드들의 조합을 이용하여 규칙을 추출한다. 이와 같은 본 발명은 의사결정 트리를 이용하여 공간사건 데이터에 대한 예측을 수행할 수 있을 뿐만 아니라 예측결과로부터 특정위치에서의 사건 원인을 규명하는데 사용가능하도록 한다.The present invention relates to a method for performing predictive analysis on a space event using a decision tree to provide a cause analysis function of a space event. As described above, the present invention relates to a step of expressing a spatial event prediction result in a decision tree and a specialized step of performing cause analysis from the prediction result. In order to express the prediction result of the spatial event in the decision tree, a fully grown tree is constructed and the terminal node rating method is used by using the data distribution included in the constructed tree. In order to perform the cause analysis on the prediction result of the spatial event, the terminal node identifier of the tree is mapped to the coordinate space to correspond to the prediction result, and a rule is extracted using a combination of subnodes from the terminal nodes of the decision tree. As described above, the present invention can not only perform prediction on spatial event data using a decision tree, but also make it possible to identify the cause of an event at a specific location from the prediction result.

Description

의사결정 트리를 이용한 공간사건 예측분석 방법{A SPATIAL PREDICTION ANALYSIS TECHNIQUE USING A DECISION TREE}Predictive Analysis of Spatial Event Using Decision Tree {A SPATIAL PREDICTION ANALYSIS TECHNIQUE USING A DECISION TREE}

본 발명은 공간사건 예측에 관한 것으로, 특히 데이터마이닝 분류기법들 중 하나인 의사결정 트리를 이용하여 공간사건의 예측 및 예측결과로부터 원인 분석을 수행하는 방법에 관한 것이다.The present invention relates to spatial event prediction, and more particularly, to a method of performing cause analysis from prediction and prediction of a spatial event using a decision tree, which is one of data mining classification techniques.

데이터마이닝은 대용량 데이터로부터 알려지지 않은 유용한 지식을 탐사하는 작업들로 비즈니스 데이터 분석을 비롯하여 다양한 공간데이터 분석 등 다양한 지식탐사분야에서 응용되고 있으며, 연관분석, 분류, 군집분석 등의 데이터마이닝 기법들이 연구되고 있다.Data mining is a task of exploring useful knowledge that is not known from large data. It is applied in various knowledge exploration fields such as business data analysis and various spatial data analysis. Data mining techniques such as association analysis, classification, and cluster analysis are studied. have.

공간사건의 예측은 데이터마이닝의 분류기법을 이용할 수 있으며, 분류기법은 주어진 클래스로 데이터를 분류한다. 그러나 공간사건의 분류기법의 응용은 예측적 관점에서 분류 결과를 통해 사건발생 가능성에 대한 상대적 등급값을 공간 좌표상에 매핑한다. 이러한 특징은 전통적인 데이터마이닝 분류기법인 레이블을 갖는 클래스로 결과를 도출하는 분류나 특정 수치형 데이터를 도출하는 예측과 차별화된다.Prediction of spatial events can use the classification technique of data mining, which classifies data into a given class. However, the application of the classification technique of spatial events maps the relative ratings of event occurrences onto spatial coordinates through classification results from a predictive perspective. This feature is different from the classification that results in a class with labels, a traditional data mining classification technique, or the prediction that derives specific numerical data.

대부분의 예측문제에 있어서 예측 결과에 대한 해석능력은 예측결과에 대한 신뢰성뿐만 아니라 활용도를 높일 수 있다. 공간사건의 예측결과는 좌표상에 표현되며, 특정위치에 표현된 예측결과에 대한 해석을 통해 사건발생에 대한 원인분석을 수행할 수 있다. 그러나 대부분의 공간사건의 예측응용들에서는 단지 예측결과만 산출하여 예측결과에 대한 해석기능을 제공하지 못하기 때문에 사건 원인분석에 한계가 있다.For most prediction problems, the ability to interpret the prediction results can increase the utilization as well as the reliability of the prediction results. The prediction result of the spatial event is expressed on the coordinates, and the cause analysis for the occurrence of the event can be performed by interpreting the prediction result expressed at the specific position. However, most predictive applications of spatial events have limitations in event cause analysis because they do not provide only interpretation of prediction results.

예측결과에 대한 해석을 위해서는 원인분석 기능을 제공하는 의사결정 트리를 적용할 수 있으며, 이는 예측결과를 규칙형태로 변환하여 원인분석을 가능하게 한다. 그러나 의사결정 트리는 주로 주어진 클래스로의 분류작업에 적용되어 공간사건의 예측결과에 대한 표현이 제한적이며, 주로 비공간 데이터 분류작업에 이용을 목적으로 설계되었다. 이러한 특징들로 인해 좌표공간상에 표현되는 공간사건의 예측문제에 응용되지 못하고 있다.For the interpretation of the prediction result, the decision tree that provides the cause analysis function can be applied. This enables the cause analysis by converting the prediction result into a rule form. However, the decision tree is mainly applied to the classification work for a given class, so that the expression of the prediction result of the spatial event is limited, and it is mainly designed for use in non-spatial data classification. Because of these features, they are not applied to the prediction problem of spatial events represented in coordinate space.

상기와 같은 문제점을 해결하기 위한 본 발명은, 공간사건의 예측결과에 대한 원인분석을 제공하기 위한 목적으로, 의사결정 트리를 이용하여 사건예측 분석을 위해 표현할 수 있는 방법을 제공한다. 따라서 의사결정 트리를 통해 공간사건에 대한 예측분석을 위해 좌표상에 사건 발생에 대한 상대적 등급을 표현할 수 있는 기법을 제시하고, 또한 공간사건의 예측결과로부터 사건의 원인분석기능을 제공하는데 있다.The present invention for solving the above problems, provides a method that can be expressed for event prediction analysis using the decision tree for the purpose of providing a cause analysis for the prediction result of the spatial event. Therefore, this paper proposes a technique that can express the relative class of occurrence of events on the coordinates for predictive analysis of spatial events through the decision tree, and also provides a function of analyzing the cause of events from the prediction results of spatial events.

상기와 같은 목적의 해결수단으로서, 본 발명은 다수의 원인 데이터 중 공간사건 발생에 대한 원인 데이터를 추출하는 사건유발인자 추출단계와; 상기 공간사건의 발생위치 및 공간사건 원인 데이터를 통해 하나의 루트노드와, 상기 루트노드와 연결되며 자노드를 갖는 중간 노드 및 자노드가 없는 단말노드로 구성되는 의사결정 트리를 구축하고, 단말노드에 분류된 데이터 분포를 이용하여 단말노드 등급을 결정하며, 결정된 등급에 따라 차등적인 색상을 부여하여 좌표상에 매핑하는 예측결과 도출 단계와; 상기 의사결정 트리로부터 도출된 공간사건에 대한 예측결과인 단말노드에 식별자를 부여하고, 상기 좌표상의 단말노드 식별자를 통해 의사결정 트리의 단말노드를 탐색하여 해당 단말노드와 연결된 상위 노드를 통해 규칙을 생성함으로써 예측결과에 대한 원인분석을 가능하게 하는 해석단계;를 포함하여 이루어지는 것을 특징으로 하는 의사결정 트리를 이용한 공간사건 예측분석 방법을 제공한다.As a solution for the above object, the present invention includes an event inducing factor extraction step of extracting the cause data for the occurrence of the space event among a plurality of cause data; A decision tree consisting of one root node, an intermediate node having a child node and a terminal node having no child node, and a terminal node are connected to the root node through the occurrence location and the spatial event cause data of the spatial event. Determining a terminal node class by using the data distribution classified in the above, and deriving a prediction result of giving a differential color according to the determined class and mapping it on coordinates; An identifier is assigned to a terminal node which is a prediction result of the spatial event derived from the decision tree, and the terminal node of the decision tree is searched through the terminal node identifier on the coordinates, and the rule is applied through an upper node connected to the corresponding terminal node. It provides a spatial event predictive analysis method using a decision tree, characterized in that it comprises a; the step of generating a possible analysis of the cause of the prediction result.

데이터마이닝 분류기법들을 이용한 다양한 공간사건 예측방법들이 존재하나 공간사건에 대한 예측결과에 대한 원인 분석 기법들이 제시되지 못하고 단지 전체 연구지역에 대한 상대적인 위험치를 등급으로 묘사하는데 그치고 있다. 본 발명은 의사결정 트리를 이용한 공간사건의 예측분석에 적용할 수 있을 뿐만 아니라, 좌표상 특정위치에서의 사건 원인분석을 통해 예측결과를 해석하는데 이용될 수 있다.Although there are various methods of predicting spatial events using data mining classification techniques, the cause analysis methods for the prediction results of spatial events are not presented, and they are merely describing the relative risk values for the entire research area. The present invention can be applied not only to predictive analysis of spatial events using decision trees, but also to interpret prediction results through event cause analysis at a specific location on a coordinate.

도 1은 본 발명의 실시예에 따른 의사결정 트리를 이용한 공간사건 예측분석방법의 흐름도,
도 2는 공간사건 예측분석을 위한 의사결정 트리의 구축결과를 나타낸 도면,
도 3은 공간사건에 대한 예측결과인 의사결정 트리로부터 도출된 단말노드에 식별자를 부여하고, 단말노드의 데이터 분포를 이용하여 단말노드 등급을 결정하며, 결정된 등급에 따라 차등적으로 색상을 부여하여 좌표상에 매핑하는 과정과, 원인분석을 위해 단말노드 식별자를 좌표상에 매핑하는 과정을 나타낸 도면,
도 4는 도 3의 단말노드에 부여된 식별자와, 단말노드 등급색상을 좌표상에서 매핑하여 상호 참조할 수 있도록 일대일 대응되게 배치하여, 좌표상으로 식별되는 예측결과가 의사결정 트리의 단말로드를 추적할 수 있도록 나타낸 도면,
도 5는 본 발명의 실시예에 따른 데이터로 연구지역에서의 공간사건인 산사태 위치점의 분포를 나타낸 도면,
도 6은 본 발명의 실시예에 따른 데이터 집합에 대한 설명을 나타낸 도면,
도 7은 의사결정 트리를 통해 만들어진 예측도와 이와 같이 표현된 산사태 위치도,
도 8은 도 7의 사각형 영역을 확대한 것으로, 도면 내의 식별번호(1,2,3,4)는 사건 발생 원인을 파악하기 위한 위치를 도시한 도면,
도 9는 도 8에서의 각 위치에 대하여 의사결정 트리의 노드의 조합을 나타낸 도면,
도 10은 의사결정 트리를 이용하여 성능평가를 위해 임의로 공간사건 데이터를 서브 그룹으로 나누어 교차 검증한 결과를 나타낸 도면,
도 11은 리프트차트를 이용한 교차검증(cross validation)과 적합도 검증(goodness of fit)에 대한 평가결과를 나타낸 도면.
1 is a flowchart of a spatial event prediction analysis method using a decision tree according to an embodiment of the present invention;
2 is a diagram showing a result of constructing a decision tree for predicting and analyzing spatial events;
FIG. 3 assigns an identifier to a terminal node derived from a decision tree which is a prediction result of a spatial event, determines a terminal node class using a data distribution of the terminal node, and gives colors differentially according to the determined class. A diagram illustrating a process of mapping onto coordinates and a process of mapping a terminal node identifier to coordinates for cause analysis;
4 is arranged in a one-to-one correspondence so that the identifier assigned to the terminal node of FIG. 3 and the terminal node class color are mapped on the coordinates for mutual reference, and the prediction result identified on the coordinates tracks the terminal load of the decision tree. Drawing shown to enable,
5 is a diagram showing the distribution of landslide location points which are spatial events in a study area with data according to an embodiment of the present invention;
6 is a view showing a description of a data set according to an embodiment of the present invention;
7 is a prediction diagram made through a decision tree and a landslide position diagram expressed in this way;
FIG. 8 is an enlarged view of the rectangular area of FIG. 7, and the identification numbers 1, 2, 3, and 4 in the drawing show positions for identifying a cause of an event.
9 illustrates a combination of nodes of a decision tree for each position in FIG. 8;
FIG. 10 is a diagram illustrating a result of cross-validating spatial event data into subgroups arbitrarily for performance evaluation using a decision tree;
FIG. 11 is a view showing evaluation results for cross validation and goodness of fit using a lift chart. FIG.

본 발명은 공간사건의 예측결과에 대한 원인분석 기능을 제공하기 위한 방법으로 의사결정 트리기법을 이용한 공간사건 예측기법을 제공하며, 이를 위해 의사결정 트리를 이용한 공간사건 발생예측 방법을 제시하고, 예측결과를 통해 원인분석 기능을 가능하게 할 수 있는 것을 요지로 한다.The present invention provides a spatial event prediction method using a decision tree method as a method for providing a cause analysis function for the prediction result of a spatial event, and proposes a spatial event occurrence prediction method using a decision tree for prediction The point is that the cause analysis function can be enabled through the result.

즉, 본 발명에 따른 의사결정 트리를 이용한 공간사건 예측분석 방법은, 다수의 원인 데이터 중 해당 공간사건 발생에 대한 원인 데이터를 추출하는 사건유발인자 추출단계(S100)와;That is, the spatial event predictive analysis method using the decision tree according to the present invention comprises: an event-inducing factor extraction step (S100) of extracting cause data of a corresponding spatial event occurrence among a plurality of cause data;

상기 공간사건의 발생위치 및 공간사건 원인 데이터를 통해 하나의 루트노드와, 상기 루트노드와 연결되며 자노드를 갖는 중간 노드 및 자노드가 없는 단말노드로 구성되는 의사결정 트리를 구축하고, 단말노드에 분류된 데이터 분포를 이용하여 단말노드 등급을 결정하며, 결정된 등급에 따라 차등적인 색상을 부여하여 좌표상에 매핑하는 예측결과 도출 단계(S200)와; A decision tree consisting of one root node, an intermediate node having a child node and a terminal node having no child node, and a terminal node are connected to the root node through the occurrence location and the spatial event cause data of the spatial event. Determining a terminal node class by using the data distribution classified in the step S, and deriving a prediction result of applying a differential color according to the determined class to map onto a coordinate (S200);

상기 의사결정 트리로부터 도출된 공간사건에 대한 예측결과인 단말노드에 식별자를 부여하고, 상기 좌표상의 단말노드 식별자를 통해 의사결정 트리의 단말노드를 탐색하여 해당 단말노드와 연결된 상위 노드를 통해 규칙을 생성함으로써 예측결과에 대한 원인분석을 가능하게 하는 해석단계(S300);를 포함한다.An identifier is assigned to a terminal node which is a prediction result of the spatial event derived from the decision tree, and the terminal node of the decision tree is searched through the terminal node identifier on the coordinates, and the rule is applied through an upper node connected to the corresponding terminal node. It includes; analysis step (S300) to enable the cause analysis for the prediction result by generating.

여기서, 예측결과 도출 단계(S200)는, 의사결정 트리의 전지과정을 포함한 옵션들과 관련하여, 완전히 성장한 트리를 구축할 수 있도록 옵션값들을 적용하여 사건발생 데이터가 일반화되지 않도록 완전 성정한 의사결정 트리로 구축하는 것을 특징으로 한다.Here, in the derivation of the prediction result (S200), in relation to the options including the decision-making process of the decision tree, the decision is made to completely set the event occurrence data so that the event occurrence data is not generalized by applying the option values so as to construct a fully grown tree. It is characterized by building as a tree.

또한, 상기 좌표상의 매핑은, 의사결정 트리의 단말노드 등급결정방법을 이용하여 상대적 발생 가능성을 표현하고, 각 좌표위치에 따른 상대적 발생 등급을 공간좌표상에 표현하는 것을 특징으로 한다.In addition, the mapping on the coordinates may be expressed using a terminal node grading method of the decision tree to express a relative occurrence possibility, and the relative occurrence grade according to each coordinate position may be expressed on a spatial coordinate.

또한, 상기 해석단계(S300)는, 상기 의사결정 트리의 단말노드 식별자들을 좌표상에 매핑하여 예측결과와 일대일 대응하도록 하여, 좌표로 식별되는 예측결과에 대한 원인분석은 대응되는 단말노드를 식별하여 구축된 의사결정 트리의 단말노드를 탐색하여 해당 단말노드와 연계된 일련의 부노드들의 조합으로 규칙을 추출하여 예측결과에 대한 해석을 수행하는 것을 특징으로 한다.
In addition, the analyzing step (S300), by mapping the terminal node identifiers of the decision tree on the coordinates to have a one-to-one correspondence with the prediction result, the cause analysis for the prediction result identified by the coordinates to identify the corresponding terminal node The terminal node of the constructed decision tree is searched, and the rule is extracted by a combination of a series of subnodes associated with the terminal node, and the prediction result is analyzed.

즉, 도 1과 같이 의사결정 트리를 이용한 공간사건 예측분석절차는 일련의 과정을 거친다. 공간사건 발생에 따른 원인분석을 통한 사건유발인자 선정과정, 공간사건 발생위치 데이터와 사건발생 유발 인자를 이용하여 의사결정 트리를 구축하는 예측모델 적용과정, 모델 적용 후 공간사건에 대한 예측결과를 좌표상에 표현하는 과정, 예측결과에 대한 원인분석 과정 및 결과 평가과정으로 구성한다.That is, the spatial event prediction analysis procedure using the decision tree as shown in Figure 1 goes through a series of processes. The process of selecting the event inducing factor through the cause analysis according to the occurrence of the space event, the process of applying the predictive model to construct the decision tree using the location of the event and the occurrence factor of the space event, and the coordinates of the prediction result of the space event after the model application. It consists of the process of expressing the image, the cause analysis process of the prediction result, and the process of evaluating the result.

상기의 전반적인 처리과정에서 의사결정 트리를 이용한 예측모델 적용과정은 공간사건 발생에 대한 상대적인 등급 결과를 좌표상에 표현하기 위해 별도의 과정을 필요로 한다. 선정된 사건유발인자와 사건발생위치를 예측모델의 입력 자료로 의사결정 트리를 구축한다. 의사결정 트리의 구축은 의사결정 트리 구축 옵션 중 전지하지 않은 완전 성장한 트리를 구축할 수 있도록 하여 공간사건발생 데이터가 모두 분류될 수 있도록 한다. 도 2는 구축된 의사결정 트리의 예이며, (A)트리의 루트노드, (B)는 중간노드 그리고 (C)는 단말노드이다.The process of applying the predictive model using the decision tree in the overall processing process requires a separate process to express the relative grade result of the occurrence of the spatial event on the coordinates. The decision tree is constructed from the selected event triggers and the location of the event as input data of the predictive model. The construction of the decision tree makes it possible to build a fully grown tree that is not omnipresent among the decision tree building options, so that all spatial event occurrence data can be classified. 2 is an example of the established decision tree, where (A) the root node of the tree, (B) is the intermediate node and (C) is the terminal node.

상기의 전반적인 처리 과정에서 구축한 트리로부터 예측결과를 좌표공간상에 표현하기 위해 도 3의 (A)와 같이 구축한 트리의 단말노드들은 향후 규칙생성을 위해 참조할 수 있는 식별자를 부여하고, 단말노드의 분류된 데이터분포를 이용하여 단말노드 등급을 결정한다. 결정된 등급에 따라 도 3의 (B)와 같이 등급에 따라 표현된 색상값을 정하여 좌표공간(B')에 매핑한다. 향후 좌표공간상의 예측결과로부터 결과해석을 위해 단말노드 식별자를 좌표공간(A')에 매핑한다.In order to express the prediction result from the tree constructed in the overall processing process in the coordinate space, the terminal nodes of the tree constructed as shown in FIG. 3A are given an identifier that can be referred to for rule generation in the future. The terminal node class is determined using the classified data distribution of the node. According to the determined grade, the color value expressed according to the grade is determined as shown in (B) of FIG. 3 and mapped to the coordinate space B '. The terminal node identifier is mapped to the coordinate space A 'for interpretation of the result from the prediction result in the future coordinate space.

상기의 전반적인 처리과정에서 예측결과를 해석하기 위해 별도의 과정을 필요로 한다. 먼저 도 4와 같이 단말노드 식별자를 좌표공간에 매핑하여 사건발생 예측결과와 대응하도록 한다. 특정위치에서 좌표로 식별되는 예측결과는 좌표공간에 대응되는 단말노드 식별자를 통해 의사결정 트리의 단말노드를 탐색하여 해당 단말노드로부터 일련의 부노드들의 조합을 통해 규칙을 생성한다. 이와 같은 본 발명의 특징은 기존에 예측결과에 대하여 원인분석을 가능하게 하며, 의사결정 트리를 이용하여 공간사건 예측분석에 적용하도록 한다.
In the overall process, a separate process is required to interpret the prediction result. First, as shown in FIG. 4, the terminal node identifier is mapped to the coordinate space to correspond to the event occurrence prediction result. The prediction result identified by the coordinate at the specific position searches for the terminal node of the decision tree through the terminal node identifier corresponding to the coordinate space and generates a rule through a combination of subnodes from the terminal node. This feature of the present invention enables the cause analysis of the existing prediction results, and to apply to the spatial event prediction analysis using the decision tree.

이하, 본 발명의 양호한 실시예를 도시한 첨부 도면들을 참조하여 상세히 설명한다.Hereinafter, with reference to the accompanying drawings showing a preferred embodiment of the present invention will be described in detail.

본 발명의 실시예로 산사태 공간사건을 이용하여 설명한다. 산사태는 전형적인 공간사건으로 주로 집중강우, 지진으로 인해 기인되지만 지형, 지질(토양), 임상과 같은 환경적 조건에 의해 발생여부 혹은 규모가 달라질 수 있다. 따라서 산사태 공간사건의 예측은 과거에 발생된 위치의 유사한 조건을 통해 알려지지 않은 미래사건의 예측을 할 수 있다. An embodiment of the present invention will be described using a landslide space event. Landslides are typical spatial events, mainly due to heavy rainfall and earthquakes, but may occur or vary in size due to environmental conditions such as terrain, geology (soil) and clinical conditions. Thus, landslide spatial events can predict unknown future events through similar conditions of locations that occurred in the past.

이와 같은 산사태 공간사건에 대한 본 발명의 실시를 위해 도 5와 같이 연구지역에서의 590점의 산사태 발생 위치에 대한 분포를 나타내었다. 또한 도 6은 본 발명의 실시예를 위한 예측모델 적용을 위한 연구지역의 공간사건과 사건 유발 인자 데이터 집합에 대한 설명이다.For the implementation of the present invention for such a landslide space event, as shown in FIG. In addition, Figure 6 is a description of the spatial event and event trigger data set of the study area for applying the predictive model for an embodiment of the present invention.

한편, 도 1은 본 발명의 실시예에 따른 의사결졍 트리를 이용한 공간사건 예측 분석 방법의 흐름도이다.1 is a flowchart of a spatial event prediction analysis method using a pseudo decision tree according to an embodiment of the present invention.

사건유발인자 추출단계(S100)는 다수의 원인 데이터 중 해당 공간사건 발생위치 데이터에 대한 원인 데이터를 추출하는 것으로, 공간사건발생의 원인분석(S110)을 통해 사건유발인자를 선정(S120)하고, 이를 예측모델에 적용(S130)토록 하는 것을 포함한다. 즉, 공간사건 발생(산사태)은 상기와 같이 많은 환경적 요인에 의해 발생할 수 있기 때문에, 해당 공간사건 발생에 대한 직접적인 원인이 된 원인 데이터를 추출하여 이를 예측모델에 적용하는 것이다.The event inducing factor extraction step (S100) is to extract the cause data for the corresponding spatial event occurrence position data among a plurality of cause data, select the event inducing factor through the cause analysis (S110) of the spatial event occurrence, (S120), This includes applying the prediction model (S130). That is, since the occurrence of a space event (landslide) can be caused by many environmental factors as described above, the cause data which is a direct cause of the occurrence of the space event is extracted and applied to the prediction model.

예측결과를 도출하는 단계(S200)는 공간사건의 발생위치 데이터 및 공간사건 발생위치 데이터의 원인 데이터를 통해 하나의 루트노드와, 상기 루트노드와 연결되며 자노드를 갖는 중간 노드 및 자노드가 없는 단말노드로 구성되는 의사결정 트리를 구축하여 예측결과를 도출하는 것으로, 의사결정 트리를 구축(S210)하고, 단말노드에 분류된 데이터 분포를 이용하여 단말노드 등급을 평가(S220)하며, 평가된 단말노드 등급에 따라 차등적인 색상을 부여하여 좌표상에 매핑(S230)하는 단계를 포함한다.Deriving the prediction result (S200) is one root node through the occurrence position data of the spatial event and the cause data of the spatial event occurrence position data, there is no intermediate node and child node connected to the root node and having the child node By constructing a decision tree composed of terminal nodes to derive prediction results, constructing a decision tree (S210), evaluating terminal node grades using data distributions classified in terminal nodes (S220), and evaluating And giving a differential color according to the terminal node class and mapping onto coordinates (S230).

예측결과 해석단계(S300)는 의사결정 트리를 통해 도출된 공간사건에 대한 예측결과인 단말노드에 식별자를 부여하고, 상기 좌표상의 단말노드 식별자를 통해 의사결정 트리의 단말노드를 탐색하여 해당 단말노드와 연결된 상위 노드를 통해 규칙을 생성함으로써 예측결과에 대한 원인분석을 가능하게 하는 것으로, 단말노드 식별자 좌표 공간에 매핑단계(310)와, 예측공간과 대응하는 단말노드 식별자 인식단계(S320)와, 식별된 단말노드의 일련의 부노드(중간노드들 및 루트노드)들로부터 규칙을 생성하는 단계(S330)을 포함한다.In the prediction result interpreting step (S300), an identifier is assigned to a terminal node which is a prediction result of a spatial event derived through the decision tree, and the terminal node of the decision tree is searched for through the terminal node identifier on the coordinates. By generating a rule through a higher node connected to the cause to analyze the cause of the prediction result, the mapping step 310 to the terminal node identifier coordinate space, the terminal node identifier recognition step corresponding to the prediction space (S320), Generating a rule from a series of secondary nodes (intermediate nodes and root nodes) of the identified terminal node (S330).

도 2는 공간사건 예측분석을 위한 의사결정 트리의 구축결과 기본적인 구성으로 하나의 루트노드(10)와 연결된 중간노드(20)들이 있으며, 노드들 중 자노드가 없는 경우 단말노드(31,32)라 한다.2 shows the intermediate nodes 20 connected to one root node 10 as a basic configuration of the decision tree for spatial event predictive analysis, and when there are no child nodes among the nodes, terminal nodes 31 and 32. It is called.

도 3은 공간사건 예측분석에서 의사결정 트리는 처음 하나의 루트노드(10)에 모든 데이터 집합을 포함하여 보다 순수한 데이터분포를 가질 수 있도록 자노드로 분기한다. 이와 같은 과정이 반복되어 A와 같이 분기과정이 끝날 시점에는 단말노드(31,32)에서 데이터들을 포함하고 있다. 의사결정 트리를 이용하여 상대적 공간사건의 발생가능성을 표현하기 위해서는 단말노드에 포함된 데이터 분포를 이용하여 적용범위 및 순수성을 이용하여 단말노드간 우선순위 등급을 결정할 수 있다. 결정된 등급에 따라 서로 다른 등급 값에 따른 색상을 부여할 수 있으며, 그 결과는 B와 같다. 예측결과를 B'과 같이 좌표상에 표현될 수 있으며, 특정위치의 예측결과에 대한 원인을 분석시 단말노드를 참조할 수 있도록 식별자를 A'과 같이 좌표상 표현한다.FIG. 3 shows that the decision tree branches to a child node in the spatial event prediction analysis so that the first one root node 10 includes all data sets and has a more pure data distribution. As described above, the terminal nodes 31 and 32 include data when the branching process is completed, such as A. FIG. In order to express the possibility of a relative spatial event using a decision tree, a priority level between terminal nodes may be determined using coverage and purity using the data distribution included in the terminal node. According to the determined grades, colors can be given according to different grade values, and the result is the same as B. The prediction result can be expressed in coordinates as B ', and the identifier is expressed in coordinates as A' so that the terminal node can be referred to when analyzing the cause of the prediction result of a specific position.

도 4는 좌표상에 표현된 예측결과에 대하여 원인분석을 수행하기 위해 해당위치의 단말노드 식별자를 통해 의사결정 트리의 단말노드를 탐색할 수 있으며, 해당 단말노드의 일련의 부노드 조합으로 규칙을 발견할 수 있다.FIG. 4 may search for a terminal node of a decision tree through a terminal node identifier of a corresponding position in order to perform cause analysis on a prediction result expressed on coordinates, and the rule may be defined as a combination of subnodes of the terminal node. You can find it.

도 5는 본 발명의 실시예에 따른 데이터로 연구지역에서의 산사태 위치점의 분포를 나타낸 도면이다.5 is a view showing the distribution of landslide location points in the study area with data according to an embodiment of the present invention.

도 6은 본 발명의 실시예에 따른 데이터 집합에 대한 설명이다.6 is a description of a data set according to an embodiment of the present invention.

도 7은 의사결정 트리를 통해 만들어진 예측도와 이와 같이 표현된 산사태 위치도이다. 좌측상단의 사건 발생원인에 대한 분석기능을 설명하기 위해 사각형 영역으로 식별하였다.7 is a prediction diagram generated through a decision tree and a landslide position map expressed in this manner. The rectangular area is identified to explain the analysis function of the cause of the event in the upper left corner.

도 8은 도 7에서 사각형 영역을 확대한 결과이며 도면 내의 식별번호(1,2,3,4)는 사건 발생 원인을 파악하기 위한 식별 위치이다.FIG. 8 is a result of enlarging the rectangular area in FIG. 7 and identification numbers 1, 2, 3, and 4 in the drawing are identification positions for identifying a cause of an event.

도 9는 도 8에서의 각 위치에 대하여 의사결정 트리의 노드의 조합을 나타낸다.9 illustrates a combination of nodes of the decision tree for each position in FIG. 8.

도 10은 의사결정 트릴를 이용하여 성능평가를 위해 임의로 공간사건 데이터를 서브그룹으로 나누어 교차 검증한 결과의 도면이다.FIG. 10 is a diagram of a result of cross-validating spatial event data into subgroups arbitrarily for performance evaluation using a decision trill. FIG.

도 11은 리프트차트를 이용한 교차검증과 적합도 검증에 대한 평가결과이다.
11 is an evaluation result for the cross-validation and fitness verification using the lift chart.

의사결정트리의 노드는 속성선택 기준에 의해 해당 노드에 포함된 하나의 속성을 선택하여 분기되어 트리가 성장한다. 본 발명에서의 예측모델 적용을 위해 의사결정 트리의 속성 선택기준은 엔트로피 기반의 속성 선택기준을 이용한다. 이 방법은 노드에 포함된 속성간의 무절서도를 낮추면서 진행한다. 무질서도는 정보량(Entropy)으로 정의되며, 임의의 노드 N에서의 정보량은 다음 [수학식 1]과 같다.Nodes of the decision tree are branched by selecting one attribute included in the node by attribute selection criteria to grow the tree. In order to apply the prediction model in the present invention, the attribute selection criteria of the decision tree uses entropy-based attribute selection criteria. This method works by lowering the randomness between the attributes included in the node. Disorder is defined as the amount of information (Entropy), the amount of information at any node N is represented by the following equation (1).

Figure 112011036565371-pat00001
Figure 112011036565371-pat00001

여기서 p(Cj|N):N에서의 클래스 j의 상대 빈도이다. N에 포함된 k개의 속성에 대하여 속성 A를 선택하게 될 정보량(Entropy)은 다음 [수학식 2]와 같이 정의 된다.Where p (C j | N): N is the relative frequency of class j. The amount of information (Entropy) for selecting attribute A for k attributes included in N is defined as in Equation 2 below.

Figure 112011036565371-pat00002
Figure 112011036565371-pat00002

정보이익은 원래 노드에 있었던 정보량에 대한 새롭게 분류한 정보량의 차에 대한 이익으로 InfoGain으로 정의되며, 이는 [수학식 3]과 같다.The information gain is defined as InfoGain as the profit of the difference of the newly classified information quantity with respect to the information quantity originally located at the node, which is shown in [Equation 3].

Figure 112011036565371-pat00003
Figure 112011036565371-pat00003

InforGain에 의해 정보량이 가장적거나, 정보이익이 가장 큰 속성을 선택하게 되며 이는 분리점을 많이 갖는 속성을 선택하는 경향이 있다. 이러한 경향은 연속형 속성을 포함하는 경우 해당 속성에 포함된 모든 값 사이가 분리점이기 때문에, 연속형 속성 속성에 편향되어 성장하게 된다. 이러한 문제를 회피하기 위해 분리정보를 이용하여 정보이익을 정규화한다. 분리정보는 정보량과 유사하게 분기점에 따른 정보량으로 많은 수의 분기를 갖는 속성에 대하여 높은 값의 분리정보를 갖게 된다. 분리정보는 [수학식 4]와 같다.InforGain selects the attribute with the least amount of information or the largest information benefit, which tends to select an attribute with many split points. This tendency tends to grow biased toward the continuous attribute attribute because it includes a split point between all the values contained in the attribute when the attribute is included. To avoid this problem, the information gain is normalized by using the separated information. Similar to the information amount, the separation information has a high value of separation information for an attribute having a large number of branches as information amount according to a branch point. Separation information is shown in [Equation 4].

Figure 112011036565371-pat00004
Figure 112011036565371-pat00004

따라서 정보량을 분리정보로 보상해준 값을 이득비(GainRatio)라 하며, [수학식 5]로 정의된다.Therefore, the value that compensates the information amount as the separated information is called a gain ratio (GainRatio), and is defined by [Equation 5].

Figure 112011036565371-pat00005
Figure 112011036565371-pat00005

의사결정 트리는 전지과정을 거치지 않고 완전 성장토록 하여 본 실시예에서 의사결정 트리는 828개의 단말노드가 생성되었으며 단말노드 등급평가방법을 통해 좌표공간에 예측결과를 표현하도록 하였다. 단말노드 등급 평가방법은 규칙 우선순위 평가방법인 기준인 m-branch(엠브렌치) 기법을 이용한다. 이 방법은 루트-단말노드의 재귀적으로 각 경로상, 부 노드의 등급평가결과가 자노드로 전파된다. 그 공식은 다음 [수학식 6]과 같다.The decision tree is completely grown without going through the cell process. In this embodiment, 828 terminal nodes are generated and the prediction result is expressed in the coordinate space through the terminal node rating method. The terminal node rating method uses the m-branch (m-branch) technique, which is a rule priority evaluation method. This method recursively propagates root node nodes to their own nodes on each path. The formula is shown in Equation 6 below.

Figure 112011036565371-pat00006
Figure 112011036565371-pat00006

여기서, 파라미터 m은 M+(d-1)/d×M

Figure 112011036565371-pat00007
으로 계산된다. M은 상수, N은 데이터 집합의 전역 차수이며, d는 노드의 깊이이다. 상수 M은 사용자에 의해 최고의 예측성능을 낼 수 있는 값을 경험적으로 찾아야 하며, 본 실시예에서는 그 값이 8,000일 때 이었다.Where parameter m is M + (d-1) / d × M
Figure 112011036565371-pat00007
. M is a constant, N is the global order of the data set, and d is the depth of the node. The constant M should be found empirically to find the best predictive performance by the user, the value was 8,000 in the present embodiment.

의사결정 트리를 통해 도출된 산사태 공간사건의 예측도면은 도 7과 같으며 점으로 표현된 위치는 산사태 위치이다. 좌측상단의 사건 발생원인에 대한 분석기능을 설명하기 위해 사각형 영역으로 식별하였다. 도 8은 도 7에서 식별된 사각형 영역을 확대한 결과이며, 도면 내의 식별번호(1,2,3,4)는 사건 발생 원인을 파악하기 위한 식별 위치들로 식별번호 (1,2)는 산사태가 발생되지 않은 위치, 식별번호 (3,4)는 산사태가 이미 발생된 위치이다.The predicted drawing of the landslide space event derived through the decision tree is shown in FIG. 7, and the point represented by the point is the landslide position. The rectangular area is identified to explain the analysis function of the cause of the event in the upper left corner. FIG. 8 is a result of enlarging the rectangular area identified in FIG. 7, and the identification numbers 1, 2, 3, and 4 in the drawing are identification positions for identifying the cause of the incident. Is not generated, the identification number (3,4) is the location where the landslide has already occurred.

도 9는 도 8에서의 각 위치에 대하여 의사결정 트리의 노드의 조합을 나타내며, 각 식별위치에 따라 계산된 m-brancd 등급값과 백분위 값이 포함되어 있다. 사건발생위치인 (3,4)번 위치에서는 1.63 및 1.80 백분위 수를 나타내며, 사건이 발생되지 않은 (1,2)번 위치에서는 43.83 및 88.47을 나타내어 사건 발생위치가 높은 등급으로 표현된 것을 알 수 있다. 각 위치에서 노드 조합에 따라 규칙을 생성할 수 있으며, 규칙은 'AND' 조합으로 변환할 수 있다. 그 예로, 식별번호 (1)번에서의 규칙 t_curvature > -1 & s_texture = 'Loamy skeletal' & t_slope ≤ 33.0으로 표현되며, 식별번호 (3)번에서는 t_ridgebuffer ≤ 27.0 & s_material = 'Residuum of granite genesis' & f_diameter = '18 ~ 28' & t_slope > 25 & t_curvature ≤ -6.0 & t_aspect = 'South' & f_density = '51 ~ 70%' & s_thickness = 'Moderately deep' & f_age = '30 ~40 year'.로 도출되었다.9 illustrates a combination of nodes of a decision tree for each position in FIG. 8, and includes m-brancd grade values and percentile values calculated according to each identification position. In the (3,4) position of occurrence of the event, 1.63 and 1.80 percentiles are represented, and in the (1,2) position where no event occurs, 43.83 and 88.47 are represented, indicating that the occurrence of the occurrence of the event is expressed in a high grade. have. You can create rules based on node combinations at each location, and rules can be converted to 'AND' combinations. For example, rule t_curvature in identification number (1) is expressed as -1 & s_texture = 'Loamy skeletal' & t_slope ≤ 33.0, and in identification number (3), t_ridgebuffer ≤ 27.0 & s_material = 'Residuum of granite genesis' & f_diameter = '18 ~ 28 '& t_slope> 25 & t_curvature ≤ -6.0 & t_aspect =' South '& f_density = '51 ~ 70%' & s_thickness = 'Moderately deep' & f_age = '30 ~ 40 year '. Derived.

예측모델에 대한 정량적 성능을 평가하기 위해 도 10은 공간사건 데이터를 두 개의 서브 그룹으로 나누어 교차 검증한 결과의 도면이다. 도 10의 (a)는 LandslideSetA로 예측모델을 만들고 LandslideSetB로 예측모델을 평가했으며, 도 10의 (b)는 이와 반대로 평가하여 두 평가 결과를 종합하였다. 평가 결과는 도 11과 같이 누적 리프트차트(accumulated lift chart)를 이용한 교차검증과, 모든 공간 사건데이터를 이용하여 예측한 적합도 검증에 대한 평가 결과이다. 리프트차트는 상위 포함된 가중값 순으로 2차원 그래프로 표현한다. 즉 백분위에 해당하는 단위 면적당 상위 정분류에 대한 누적비율을 2차원 그래프로 묘사하며 다음 [수학식 7]에 의해 백분위수가 결정된다.In order to evaluate the quantitative performance of the predictive model, FIG. 10 is a diagram of a cross-validation result of dividing the spatial event data into two subgroups. (A) of FIG. 10 makes a predictive model with LandslideSetA and evaluates the predictive model with LandslideSetB, and FIG. The evaluation result is the evaluation result for the cross-validation using an accumulated lift chart and the fitness verification predicted using all spatial event data as shown in FIG. 11. The lift chart is represented by a two-dimensional graph in the order of weights included above. That is, the cumulative ratio of the upper right classification per unit area corresponding to the percentile is depicted in a two-dimensional graph, and the percentile is determined by the following Equation 7.

Figure 112011036565371-pat00008
Figure 112011036565371-pat00008

성능평가에 대한 정량적 수치는 그래프의 하부 영역을 계산을 통해 산출 될 수 있다. 전체데이터를 이용한 적합도 평가(goodness of fit)결과 89.26% 이며, 교차 검증(2fold cross validation)에서는 86.08%로 높은 예측 평가를 보였다. 이와 같은 본 발명은 의사결정 트리를 이용하여 공간사건 데이터에 대한 예측을 수행할 뿐만 아니라 예측결과로부터 특정위치에서의 사건 원인을 규명하는데 사용가능하도록 한다.Quantitative figures for performance evaluation can be calculated by calculating the lower region of the graph. The goodness of fit resulted in goodness of fit using 89.26% and 86.08% in 2fold cross validation. As described above, the present invention can be used to determine the cause of an event at a specific location from the prediction result as well as to perform prediction on spatial event data using a decision tree.

10: 루트노드 20: 중간노드
31,32: 단말노드 100: 식별자 맵
200: 등급 색상맵
10: root node 20: intermediate node
31,32: terminal node 100: identifier map
200: grade colormap

Claims (4)

공간사건 발생의 원인분석을 통해 다수의 원인 데이터 중 해당 공간사건의 발생위치 데이터에 대한 원인 데이터를 추출하는 사건유발인자 추출단계(S100);
상기 공간사건의 발생위치 데이터와, 상기 발생위치 데이터에 대한 원인 데이터를 예측모델에 입력하여 하나의 루트노드와, 상기 루트노드와 연결되며 자노드를 갖는 중간 노드 및 자노드가 없는 단말노드로 구성되는 의사결정 트리를 구축하고, 단말노드에 분류된 데이터 분포를 이용하여 상대적 공간사건의 발생가능성을 표현한 단말노드간 우선순위 등급을 결정하며, 결정된 등급에 따라 차등적인 색상을 부여하여 등급 색상맵의 좌표상에 매핑하는 예측결과 도출단계(S200); 및
상기 의사결정 트리로부터 도출된 공간사건에 대한 예측결과인 단말노드에 식별자를 부여하고, 식별자 맵의 좌표상에 매핑된 단말노드 식별자를 통해 의사결정 트리의 단말노드를 탐색하여 해당 단말노드와 연결된 상위 노드를 통해 규칙을 생성함으로써 예측결과에 대한 원인분석을 가능하게 하는 해석단계(S300);를 포함하고,
상기 예측결과 도출단계(S200)는,
상기 의사결정 트리를 전지과정을 거치지 않고 완전 성장한 트리로 구축하여 모든 공간사건의 발생위치 데이터를 분류시키고, 상기 단말노드를 의사결정 트리의 단말노드 등급결정방법인 m-branch(엠브렌치) 기법을 이용하여 좌표공간에 공간사건에 대한 예측결과로 표현하며,
상기 해석단계(S300)는,
상기 의사결정 트리의 단말노드 식별자들을 상기 식별자 맵의 좌표상에 매핑한 후 상기 등급 색상맵의 좌표상에 매핑된 예측결과와 일대일 대응하도록 하여, 좌표로 식별되는 예측결과에 대한 원인분석은 대응되는 단말노드 식별자를 통해 의사결정 트리의 단말노드를 탐색하여 해당 단말노드와 연계된 일련의 부노드들의 조합으로 규칙을 추출하여 예측결과에 대한 해석을 수행하는 것을 특징으로 하는 의사결정 트리를 이용한 공간사건 예측분석 방법.
An event-inducing factor extracting step (S100) of extracting cause data of the occurrence position data of the corresponding space event from a plurality of cause data through cause analysis of the occurrence of the space event;
The occurrence location data of the spatial event and the cause data for the occurrence location data are input to a prediction model, and configured as one root node, an intermediate node having a child node, and a terminal node having no child node. Construct a decision tree, determine the priority level among terminal nodes expressing the possibility of relative spatial events by using the data distribution classified in the terminal node, and assign the differential color according to the determined grade A prediction result derivation step (S200) of mapping onto coordinates; And
An identifier is assigned to a terminal node which is a prediction result of the spatial event derived from the decision tree, and a terminal node of the decision tree is searched for through the terminal node identifier mapped on the coordinates of the identifier map, and the upper node connected to the corresponding terminal node. It includes; analysis step (S300) for enabling the cause analysis of the prediction result by generating a rule through the node,
The prediction result derivation step (S200),
The decision tree is constructed as a fully grown tree without going through a cell process to classify the occurrence location data of all spatial events, and the m-branch (m-branch) technique, which is a method of classifying the terminal node of the decision tree, is classified. Expresses the prediction result of the space event in the coordinate space
The analysis step (S300),
The terminal node identifiers of the decision tree are mapped on the coordinates of the identifier map, and then correspond one-to-one with the prediction results mapped on the coordinates of the class color map, so that the cause analysis for the prediction result identified by the coordinates is corresponding. Spatial event using a decision tree characterized by searching for a terminal node of a decision tree through a terminal node identifier, extracting a rule with a combination of a series of subnodes associated with the terminal node, and interpreting the prediction result Predictive Analysis Method.
삭제delete 삭제delete 삭제delete
KR1020110046325A 2011-05-17 2011-05-17 A spatial prediction analysis technique using a decision tree KR101264223B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110046325A KR101264223B1 (en) 2011-05-17 2011-05-17 A spatial prediction analysis technique using a decision tree

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110046325A KR101264223B1 (en) 2011-05-17 2011-05-17 A spatial prediction analysis technique using a decision tree

Publications (2)

Publication Number Publication Date
KR20120128407A KR20120128407A (en) 2012-11-27
KR101264223B1 true KR101264223B1 (en) 2013-05-14

Family

ID=47513167

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110046325A KR101264223B1 (en) 2011-05-17 2011-05-17 A spatial prediction analysis technique using a decision tree

Country Status (1)

Country Link
KR (1) KR101264223B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9336488B2 (en) 2014-06-23 2016-05-10 Korea Institute Of Goescience & Mineral Resources Leaf node ranking method in decision trees for spatial prediction and its recording medium

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102020012B1 (en) * 2018-06-08 2019-09-11 (주)에이피케이어플킹 System method for writing sports article based on bigdata analysis
KR101973642B1 (en) * 2018-08-31 2019-09-02 서울대학교산학협력단 Method and interactive system for algorithm-driven text generation
US10713622B1 (en) * 2019-12-06 2020-07-14 Coupang Corp. Computer-implemented systems and methods for intelligent prediction of out of stock items and proactive reordering

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
의사결정나무모형을 이용한 급경사지재해 예측프로그램 개발 및 적용(대한토목학회논문집 제29권 제2C호, 2009.03.)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9336488B2 (en) 2014-06-23 2016-05-10 Korea Institute Of Goescience & Mineral Resources Leaf node ranking method in decision trees for spatial prediction and its recording medium

Also Published As

Publication number Publication date
KR20120128407A (en) 2012-11-27

Similar Documents

Publication Publication Date Title
Jochem et al. Identifying residential neighbourhood types from settlement points in a machine learning approach
Hermosilla et al. Land cover classification in an era of big and open data: Optimizing localized implementation and training data selection to improve mapping outcomes
Jafari et al. Spatial prediction of soil great groups by boosted regression trees using a limited point dataset in an arid region, southeastern Iran
Hermosilla et al. Assessing contextual descriptive features for plot-based classification of urban areas
Riedel et al. Seismic vulnerability assessment of urban environments in moderate-to-low seismic hazard regions using association rule learning and support vector machine methods
He et al. Recognition of building group patterns in topographic maps based on graph partitioning and random forest
Koch et al. Revealing areas of high nature conservation importance in a seasonally dry tropical forest in Brazil: Combination of modelled plant diversity hot spots and threat patterns
Zhao et al. Slope unit-based landslide susceptibility mapping using certainty factor, support vector machine, random forest, CF-SVM and CF-RF models
Zhu et al. Applying a weighted random forests method to extract karst sinkholes from LiDAR data
CN117152893B (en) Forest disaster prevention method and system
Chen et al. A method for mineral prospectivity mapping integrating C4. 5 decision tree, weights-of-evidence and m-branch smoothing techniques: a case study in the eastern Kunlun Mountains, China
Wan Entropy-based particle swarm optimization with clustering analysis on landslide susceptibility mapping
Thompson et al. Forest loss in New England: A projection of recent trends
KR101264223B1 (en) A spatial prediction analysis technique using a decision tree
Kazemi et al. Mineral processing plant site selection using integrated fuzzy cognitive map and fuzzy analytical hierarchy process approach: A case study of gilsonite mines in Iran
US20160299929A1 (en) Spatial knowledge extractor and extraction method using the same
Sahin Implementation of free and open-source semi-automatic feature engineering tool in landslide susceptibility mapping using the machine-learning algorithms RF, SVM, and XGBoost
CN117576335B (en) Three-dimensional space model data processing method and system for mineral area investigation
Ayhan et al. Analysis of image classification methods for remote sensing
Silvero et al. Protocol for the use of legacy data and magnetic signature on soil mapping of São Paulo central west, Brazil
Oshan et al. A scoping review on the multiplicity of scale in spatial analysis
JP3697472B2 (en) Sediment disaster occurrence limit line, evacuation reference line and warning reference line creation method and program, and landslide disaster warning and evacuation support system
JP3656852B1 (en) Disaster prevention business plan support method and system
Cui et al. Research on landslide prediction based on support vector model
Masoumi et al. Investigation of sustainable urban development direction using Geographic Information Systems (case study: Zanjan city)

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160325

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170327

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180406

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190402

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20191231

Year of fee payment: 19