KR20120128407A - 의사결정 트리를 이용한 공간사건 예측분석 방법 - Google Patents

의사결정 트리를 이용한 공간사건 예측분석 방법 Download PDF

Info

Publication number
KR20120128407A
KR20120128407A KR1020110046325A KR20110046325A KR20120128407A KR 20120128407 A KR20120128407 A KR 20120128407A KR 1020110046325 A KR1020110046325 A KR 1020110046325A KR 20110046325 A KR20110046325 A KR 20110046325A KR 20120128407 A KR20120128407 A KR 20120128407A
Authority
KR
South Korea
Prior art keywords
terminal node
decision tree
event
node
spatial
Prior art date
Application number
KR1020110046325A
Other languages
English (en)
Other versions
KR101264223B1 (ko
Inventor
연영광
Original Assignee
한국지질자원연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국지질자원연구원 filed Critical 한국지질자원연구원
Priority to KR1020110046325A priority Critical patent/KR101264223B1/ko
Publication of KR20120128407A publication Critical patent/KR20120128407A/ko
Application granted granted Critical
Publication of KR101264223B1 publication Critical patent/KR101264223B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations

Abstract

본 발명은 공간사건의 원인분석 기능을 제공할 수 있도록 의사결정 트리를 이용한 공간사건에 대한 예측분석을 수행하기 위한 방법에 관한 것이다. 이와 같은 본 발명은 의사결정 트리에서 공간사건 예측결과를 표현하는 단계, 예측결과로부터 원인분석을 수행하는 특화된 단계에 관한 것이다. 의사결정 트리에서 공간사건에 대한 예측결과를 표현하기 위해 완전 성장한 트리를 구축하여, 구축된 트리에 포함된 데이터 분포를 이용하여 단말노드 등급결정 방법을 이용한다. 공간사건 예측결과에 대한 원인분석을 수행하기 위해 트리의 단말 노드 식별자를 좌표공간에 매핑하여 예측결과와 대응되도록 하여 의사결정 트리의 단말 노드로부터 일련의 부노드들의 조합을 이용하여 규칙을 추출한다. 이와 같은 본 발명은 의사결정 트리를 이용하여 공간사건 데이터에 대한 예측을 수행할 수 있을 뿐만 아니라 예측결과로부터 특정위치에서의 사건 원인을 규명하는데 사용가능하도록 한다.

Description

의사결정 트리를 이용한 공간사건 예측분석 방법{A SPATIAL PREDICTION ANALYSIS TECHNIQUE USING A DECISION TREE}
본 발명은 공간사건 예측에 관한 것으로, 특히 데이터마이닝 분류기법들 중 하나인 의사결정 트리를 이용하여 공간사건의 예측 및 예측결과로부터 원인 분석을 수행하는 방법에 관한 것이다.
데이터마이닝은 대용량 데이터로부터 알려지지 않은 유용한 지식을 탐사하는 작업들로 비즈니스 데이터 분석을 비롯하여 다양한 공간데이터 분석 등 다양한 지식탐사분야에서 응용되고 있으며, 연관분석, 분류, 군집분석 등의 데이터마이닝 기법들이 연구되고 있다.
공간사건의 예측은 데이터마이닝의 분류기법을 이용할 수 있으며, 분류기법은 주어진 클래스로 데이터를 분류한다. 그러나 공간사건의 분류기법의 응용은 예측적 관점에서 분류 결과를 통해 사건발생 가능성에 대한 상대적 등급값을 공간 좌표상에 매핑한다. 이러한 특징은 전통적인 데이터마이닝 분류기법인 레이블을 갖는 클래스로 결과를 도출하는 분류나 특정 수치형 데이터를 도출하는 예측과 차별화된다.
대부분의 예측문제에 있어서 예측 결과에 대한 해석능력은 예측결과에 대한 신뢰성뿐만 아니라 활용도를 높일 수 있다. 공간사건의 예측결과는 좌표상에 표현되며, 특정위치에 표현된 예측결과에 대한 해석을 통해 사건발생에 대한 원인분석을 수행할 수 있다. 그러나 대부분의 공간사건의 예측응용들에서는 단지 예측결과만 산출하여 예측결과에 대한 해석기능을 제공하지 못하기 때문에 사건 원인분석에 한계가 있다.
예측결과에 대한 해석을 위해서는 원인분석 기능을 제공하는 의사결정 트리를 적용할 수 있으며, 이는 예측결과를 규칙형태로 변환하여 원인분석을 가능하게 한다. 그러나 의사결정 트리는 주로 주어진 클래스로의 분류작업에 적용되어 공간사건의 예측결과에 대한 표현이 제한적이며, 주로 비공간 데이터 분류작업에 이용을 목적으로 설계되었다. 이러한 특징들로 인해 좌표공간상에 표현되는 공간사건의 예측문제에 응용되지 못하고 있다.
상기와 같은 문제점을 해결하기 위한 본 발명은, 공간사건의 예측결과에 대한 원인분석을 제공하기 위한 목적으로, 의사결정 트리를 이용하여 사건예측 분석을 위해 표현할 수 있는 방법을 제공한다. 따라서 의사결정 트리를 통해 공간사건에 대한 예측분석을 위해 좌표상에 사건 발생에 대한 상대적 등급을 표현할 수 있는 기법을 제시하고, 또한 공간사건의 예측결과로부터 사건의 원인분석기능을 제공하는데 있다.
상기와 같은 목적의 해결수단으로서, 본 발명은 다수의 원인 데이터 중 공간사건 발생에 대한 원인 데이터를 추출하는 사건유발인자 추출단계와; 상기 공간사건의 발생위치 및 공간사건 원인 데이터를 통해 하나의 루트노드와, 상기 루트노드와 연결되며 자노드를 갖는 중간 노드 및 자노드가 없는 단말노드로 구성되는 의사결정 트리를 구축하고, 단말노드에 분류된 데이터 분포를 이용하여 단말노드 등급을 결정하며, 결정된 등급에 따라 차등적인 색상을 부여하여 좌표상에 매핑하는 예측결과 도출 단계와; 상기 의사결정 트리로부터 도출된 공간사건에 대한 예측결과인 단말노드에 식별자를 부여하고, 상기 좌표상의 단말노드 식별자를 통해 의사결정 트리의 단말노드를 탐색하여 해당 단말노드와 연결된 상위 노드를 통해 규칙을 생성함으로써 예측결과에 대한 원인분석을 가능하게 하는 해석단계;를 포함하여 이루어지는 것을 특징으로 하는 의사결정 트리를 이용한 공간사건 예측분석 방법을 제공한다.
데이터마이닝 분류기법들을 이용한 다양한 공간사건 예측방법들이 존재하나 공간사건에 대한 예측결과에 대한 원인 분석 기법들이 제시되지 못하고 단지 전체 연구지역에 대한 상대적인 위험치를 등급으로 묘사하는데 그치고 있다. 본 발명은 의사결정 트리를 이용한 공간사건의 예측분석에 적용할 수 있을 뿐만 아니라, 좌표상 특정위치에서의 사건 원인분석을 통해 예측결과를 해석하는데 이용될 수 있다.
도 1은 본 발명의 실시예에 따른 의사결정 트리를 이용한 공간사건 예측분석방법의 흐름도,
도 2는 공간사건 예측분석을 위한 의사결정 트리의 구축결과를 나타낸 도면,
도 3은 공간사건에 대한 예측결과인 의사결정 트리로부터 도출된 단말노드에 식별자를 부여하고, 단말노드의 데이터 분포를 이용하여 단말노드 등급을 결정하며, 결정된 등급에 따라 차등적으로 색상을 부여하여 좌표상에 매핑하는 과정과, 원인분석을 위해 단말노드 식별자를 좌표상에 매핑하는 과정을 나타낸 도면,
도 4는 도 3의 단말노드에 부여된 식별자와, 단말노드 등급색상을 좌표상에서 매핑하여 상호 참조할 수 있도록 일대일 대응되게 배치하여, 좌표상으로 식별되는 예측결과가 의사결정 트리의 단말로드를 추적할 수 있도록 나타낸 도면,
도 5는 본 발명의 실시예에 따른 데이터로 연구지역에서의 공간사건인 산사태 위치점의 분포를 나타낸 도면,
도 6은 본 발명의 실시예에 따른 데이터 집합에 대한 설명을 나타낸 도면,
도 7은 의사결정 트리를 통해 만들어진 예측도와 이와 같이 표현된 산사태 위치도,
도 8은 도 7의 사각형 영역을 확대한 것으로, 도면 내의 식별번호(1,2,3,4)는 사건 발생 원인을 파악하기 위한 위치를 도시한 도면,
도 9는 도 8에서의 각 위치에 대하여 의사결정 트리의 노드의 조합을 나타낸 도면,
도 10은 의사결정 트리를 이용하여 성능평가를 위해 임의로 공간사건 데이터를 서브 그룹으로 나누어 교차 검증한 결과를 나타낸 도면,
도 11은 리프트차트를 이용한 교차검증(cross validation)과 적합도 검증(goodness of fit)에 대한 평가결과를 나타낸 도면.
본 발명은 공간사건의 예측결과에 대한 원인분석 기능을 제공하기 위한 방법으로 의사결정 트리기법을 이용한 공간사건 예측기법을 제공하며, 이를 위해 의사결정 트리를 이용한 공간사건 발생예측 방법을 제시하고, 예측결과를 통해 원인분석 기능을 가능하게 할 수 있는 것을 요지로 한다.
즉, 본 발명에 따른 의사결정 트리를 이용한 공간사건 예측분석 방법은, 다수의 원인 데이터 중 해당 공간사건 발생에 대한 원인 데이터를 추출하는 사건유발인자 추출단계(S100)와;
상기 공간사건의 발생위치 및 공간사건 원인 데이터를 통해 하나의 루트노드와, 상기 루트노드와 연결되며 자노드를 갖는 중간 노드 및 자노드가 없는 단말노드로 구성되는 의사결정 트리를 구축하고, 단말노드에 분류된 데이터 분포를 이용하여 단말노드 등급을 결정하며, 결정된 등급에 따라 차등적인 색상을 부여하여 좌표상에 매핑하는 예측결과 도출 단계(S200)와;
상기 의사결정 트리로부터 도출된 공간사건에 대한 예측결과인 단말노드에 식별자를 부여하고, 상기 좌표상의 단말노드 식별자를 통해 의사결정 트리의 단말노드를 탐색하여 해당 단말노드와 연결된 상위 노드를 통해 규칙을 생성함으로써 예측결과에 대한 원인분석을 가능하게 하는 해석단계(S300);를 포함한다.
여기서, 예측결과 도출 단계(S200)는, 의사결정 트리의 전지과정을 포함한 옵션들과 관련하여, 완전히 성장한 트리를 구축할 수 있도록 옵션값들을 적용하여 사건발생 데이터가 일반화되지 않도록 완전 성정한 의사결정 트리로 구축하는 것을 특징으로 한다.
또한, 상기 좌표상의 매핑은, 의사결정 트리의 단말노드 등급결정방법을 이용하여 상대적 발생 가능성을 표현하고, 각 좌표위치에 따른 상대적 발생 등급을 공간좌표상에 표현하는 것을 특징으로 한다.
또한, 상기 해석단계(S300)는, 상기 의사결정 트리의 단말노드 식별자들을 좌표상에 매핑하여 예측결과와 일대일 대응하도록 하여, 좌표로 식별되는 예측결과에 대한 원인분석은 대응되는 단말노드를 식별하여 구축된 의사결정 트리의 단말노드를 탐색하여 해당 단말노드와 연계된 일련의 부노드들의 조합으로 규칙을 추출하여 예측결과에 대한 해석을 수행하는 것을 특징으로 한다.
즉, 도 1과 같이 의사결정 트리를 이용한 공간사건 예측분석절차는 일련의 과정을 거친다. 공간사건 발생에 따른 원인분석을 통한 사건유발인자 선정과정, 공간사건 발생위치 데이터와 사건발생 유발 인자를 이용하여 의사결정 트리를 구축하는 예측모델 적용과정, 모델 적용 후 공간사건에 대한 예측결과를 좌표상에 표현하는 과정, 예측결과에 대한 원인분석 과정 및 결과 평가과정으로 구성한다.
상기의 전반적인 처리과정에서 의사결정 트리를 이용한 예측모델 적용과정은 공간사건 발생에 대한 상대적인 등급 결과를 좌표상에 표현하기 위해 별도의 과정을 필요로 한다. 선정된 사건유발인자와 사건발생위치를 예측모델의 입력 자료로 의사결정 트리를 구축한다. 의사결정 트리의 구축은 의사결정 트리 구축 옵션 중 전지하지 않은 완전 성장한 트리를 구축할 수 있도록 하여 공간사건발생 데이터가 모두 분류될 수 있도록 한다. 도 2는 구축된 의사결정 트리의 예이며, (A)트리의 루트노드, (B)는 중간노드 그리고 (C)는 단말노드이다.
상기의 전반적인 처리 과정에서 구축한 트리로부터 예측결과를 좌표공간상에 표현하기 위해 도 3의 (A)와 같이 구축한 트리의 단말노드들은 향후 규칙생성을 위해 참조할 수 있는 식별자를 부여하고, 단말노드의 분류된 데이터분포를 이용하여 단말노드 등급을 결정한다. 결정된 등급에 따라 도 3의 (B)와 같이 등급에 따라 표현된 색상값을 정하여 좌표공간(B')에 매핑한다. 향후 좌표공간상의 예측결과로부터 결과해석을 위해 단말노드 식별자를 좌표공간(A')에 매핑한다.
상기의 전반적인 처리과정에서 예측결과를 해석하기 위해 별도의 과정을 필요로 한다. 먼저 도 4와 같이 단말노드 식별자를 좌표공간에 매핑하여 사건발생 예측결과와 대응하도록 한다. 특정위치에서 좌표로 식별되는 예측결과는 좌표공간에 대응되는 단말노드 식별자를 통해 의사결정 트리의 단말노드를 탐색하여 해당 단말노드로부터 일련의 부노드들의 조합을 통해 규칙을 생성한다. 이와 같은 본 발명의 특징은 기존에 예측결과에 대하여 원인분석을 가능하게 하며, 의사결정 트리를 이용하여 공간사건 예측분석에 적용하도록 한다.
이하, 본 발명의 양호한 실시예를 도시한 첨부 도면들을 참조하여 상세히 설명한다.
본 발명의 실시예로 산사태 공간사건을 이용하여 설명한다. 산사태는 전형적인 공간사건으로 주로 집중강우, 지진으로 인해 기인되지만 지형, 지질(토양), 임상과 같은 환경적 조건에 의해 발생여부 혹은 규모가 달라질 수 있다. 따라서 산사태 공간사건의 예측은 과거에 발생된 위치의 유사한 조건을 통해 알려지지 않은 미래사건의 예측을 할 수 있다.
이와 같은 산사태 공간사건에 대한 본 발명의 실시를 위해 도 5와 같이 연구지역에서의 590점의 산사태 발생 위치에 대한 분포를 나타내었다. 또한 도 6은 본 발명의 실시예를 위한 예측모델 적용을 위한 연구지역의 공간사건과 사건 유발 인자 데이터 집합에 대한 설명이다.
한편, 도 1은 본 발명의 실시예에 따른 의사결졍 트리를 이용한 공간사건 예측 분석 방법의 흐름도이다.
사건유발인자 추출단계(S100)는 다수의 원인 데이터 중 해당 공간사건 발생위치 데이터에 대한 원인 데이터를 추출하는 것으로, 공간사건발생의 원인분석(S110)을 통해 사건유발인자를 선정(S120)하고, 이를 예측모델에 적용(S130)토록 하는 것을 포함한다. 즉, 공간사건 발생(산사태)은 상기와 같이 많은 환경적 요인에 의해 발생할 수 있기 때문에, 해당 공간사건 발생에 대한 직접적인 원인이 된 원인 데이터를 추출하여 이를 예측모델에 적용하는 것이다.
예측결과를 도출하는 단계(S200)는 공간사건의 발생위치 데이터 및 공간사건 발생위치 데이터의 원인 데이터를 통해 하나의 루트노드와, 상기 루트노드와 연결되며 자노드를 갖는 중간 노드 및 자노드가 없는 단말노드로 구성되는 의사결정 트리를 구축하여 예측결과를 도출하는 것으로, 의사결정 트리를 구축(S210)하고, 단말노드에 분류된 데이터 분포를 이용하여 단말노드 등급을 평가(S220)하며, 평가된 단말노드 등급에 따라 차등적인 색상을 부여하여 좌표상에 매핑(S230)하는 단계를 포함한다.
예측결과 해석단계(S300)는 의사결정 트리를 통해 도출된 공간사건에 대한 예측결과인 단말노드에 식별자를 부여하고, 상기 좌표상의 단말노드 식별자를 통해 의사결정 트리의 단말노드를 탐색하여 해당 단말노드와 연결된 상위 노드를 통해 규칙을 생성함으로써 예측결과에 대한 원인분석을 가능하게 하는 것으로, 단말노드 식별자 좌표 공간에 매핑단계(310)와, 예측공간과 대응하는 단말노드 식별자 인식단계(S320)와, 식별된 단말노드의 일련의 부노드(중간노드들 및 루트노드)들로부터 규칙을 생성하는 단계(S330)을 포함한다.
도 2는 공간사건 예측분석을 위한 의사결정 트리의 구축결과 기본적인 구성으로 하나의 루트노드(10)와 연결된 중간노드(20)들이 있으며, 노드들 중 자노드가 없는 경우 단말노드(31,32)라 한다.
도 3은 공간사건 예측분석에서 의사결정 트리는 처음 하나의 루트노드(10)에 모든 데이터 집합을 포함하여 보다 순수한 데이터분포를 가질 수 있도록 자노드로 분기한다. 이와 같은 과정이 반복되어 A와 같이 분기과정이 끝날 시점에는 단말노드(31,32)에서 데이터들을 포함하고 있다. 의사결정 트리를 이용하여 상대적 공간사건의 발생가능성을 표현하기 위해서는 단말노드에 포함된 데이터 분포를 이용하여 적용범위 및 순수성을 이용하여 단말노드간 우선순위 등급을 결정할 수 있다. 결정된 등급에 따라 서로 다른 등급 값에 따른 색상을 부여할 수 있으며, 그 결과는 B와 같다. 예측결과를 B'과 같이 좌표상에 표현될 수 있으며, 특정위치의 예측결과에 대한 원인을 분석시 단말노드를 참조할 수 있도록 식별자를 A'과 같이 좌표상 표현한다.
도 4는 좌표상에 표현된 예측결과에 대하여 원인분석을 수행하기 위해 해당위치의 단말노드 식별자를 통해 의사결정 트리의 단말노드를 탐색할 수 있으며, 해당 단말노드의 일련의 부노드 조합으로 규칙을 발견할 수 있다.
도 5는 본 발명의 실시예에 따른 데이터로 연구지역에서의 산사태 위치점의 분포를 나타낸 도면이다.
도 6은 본 발명의 실시예에 따른 데이터 집합에 대한 설명이다.
도 7은 의사결정 트리를 통해 만들어진 예측도와 이와 같이 표현된 산사태 위치도이다. 좌측상단의 사건 발생원인에 대한 분석기능을 설명하기 위해 사각형 영역으로 식별하였다.
도 8은 도 7에서 사각형 영역을 확대한 결과이며 도면 내의 식별번호(1,2,3,4)는 사건 발생 원인을 파악하기 위한 식별 위치이다.
도 9는 도 8에서의 각 위치에 대하여 의사결정 트리의 노드의 조합을 나타낸다.
도 10은 의사결정 트릴를 이용하여 성능평가를 위해 임의로 공간사건 데이터를 서브그룹으로 나누어 교차 검증한 결과의 도면이다.
도 11은 리프트차트를 이용한 교차검증과 적합도 검증에 대한 평가결과이다.
의사결정트리의 노드는 속성선택 기준에 의해 해당 노드에 포함된 하나의 속성을 선택하여 분기되어 트리가 성장한다. 본 발명에서의 예측모델 적용을 위해 의사결정 트리의 속성 선택기준은 엔트로피 기반의 속성 선택기준을 이용한다. 이 방법은 노드에 포함된 속성간의 무절서도를 낮추면서 진행한다. 무질서도는 정보량(Entropy)으로 정의되며, 임의의 노드 N에서의 정보량은 다음 [수학식 1]과 같다.
Figure pat00001
여기서 p(Cj|N):N에서의 클래스 j의 상대 빈도이다. N에 포함된 k개의 속성에 대하여 속성 A를 선택하게 될 정보량(Entropy)은 다음 [수학식 2]와 같이 정의 된다.
Figure pat00002
정보이익은 원래 노드에 있었던 정보량에 대한 새롭게 분류한 정보량의 차에 대한 이익으로 InfoGain으로 정의되며, 이는 [수학식 3]과 같다.
Figure pat00003
InforGain에 의해 정보량이 가장적거나, 정보이익이 가장 큰 속성을 선택하게 되며 이는 분리점을 많이 갖는 속성을 선택하는 경향이 있다. 이러한 경향은 연속형 속성을 포함하는 경우 해당 속성에 포함된 모든 값 사이가 분리점이기 때문에, 연속형 속성 속성에 편향되어 성장하게 된다. 이러한 문제를 회피하기 위해 분리정보를 이용하여 정보이익을 정규화한다. 분리정보는 정보량과 유사하게 분기점에 따른 정보량으로 많은 수의 분기를 갖는 속성에 대하여 높은 값의 분리정보를 갖게 된다. 분리정보는 [수학식 4]와 같다.
Figure pat00004
따라서 정보량을 분리정보로 보상해준 값을 이득비(GainRatio)라 하며, [수학식 5]로 정의된다.
Figure pat00005
의사결정 트리는 전지과정을 거치지 않고 완전 성장토록 하여 본 실시예에서 의사결정 트리는 828개의 단말노드가 생성되었으며 단말노드 등급평가방법을 통해 좌표공간에 예측결과를 표현하도록 하였다. 단말노드 등급 평가방법은 규칙 우선순위 평가방법인 기준인 m-branch(엠브렌치) 기법을 이용한다. 이 방법은 루트-단말노드의 재귀적으로 각 경로상, 부 노드의 등급평가결과가 자노드로 전파된다. 그 공식은 다음 [수학식 6]과 같다.
Figure pat00006
여기서, 파라미터 m은 M+(d-1)/d×M
Figure pat00007
으로 계산된다. M은 상수, N은 데이터 집합의 전역 차수이며, d는 노드의 깊이이다. 상수 M은 사용자에 의해 최고의 예측성능을 낼 수 있는 값을 경험적으로 찾아야 하며, 본 실시예에서는 그 값이 8,000일 때 이었다.
의사결정 트리를 통해 도출된 산사태 공간사건의 예측도면은 도 7과 같으며 점으로 표현된 위치는 산사태 위치이다. 좌측상단의 사건 발생원인에 대한 분석기능을 설명하기 위해 사각형 영역으로 식별하였다. 도 8은 도 7에서 식별된 사각형 영역을 확대한 결과이며, 도면 내의 식별번호(1,2,3,4)는 사건 발생 원인을 파악하기 위한 식별 위치들로 식별번호 (1,2)는 산사태가 발생되지 않은 위치, 식별번호 (3,4)는 산사태가 이미 발생된 위치이다.
도 9는 도 8에서의 각 위치에 대하여 의사결정 트리의 노드의 조합을 나타내며, 각 식별위치에 따라 계산된 m-brancd 등급값과 백분위 값이 포함되어 있다. 사건발생위치인 (3,4)번 위치에서는 1.63 및 1.80 백분위 수를 나타내며, 사건이 발생되지 않은 (1,2)번 위치에서는 43.83 및 88.47을 나타내어 사건 발생위치가 높은 등급으로 표현된 것을 알 수 있다. 각 위치에서 노드 조합에 따라 규칙을 생성할 수 있으며, 규칙은 'AND' 조합으로 변환할 수 있다. 그 예로, 식별번호 (1)번에서의 규칙 t_curvature > -1 & s_texture = 'Loamy skeletal' & t_slope ≤ 33.0으로 표현되며, 식별번호 (3)번에서는 t_ridgebuffer ≤ 27.0 & s_material = 'Residuum of granite genesis' & f_diameter = '18 ~ 28' & t_slope > 25 & t_curvature ≤ -6.0 & t_aspect = 'South' & f_density = '51 ~ 70%' & s_thickness = 'Moderately deep' & f_age = '30 ~40 year'.로 도출되었다.
예측모델에 대한 정량적 성능을 평가하기 위해 도 10은 공간사건 데이터를 두 개의 서브 그룹으로 나누어 교차 검증한 결과의 도면이다. 도 10의 (a)는 LandslideSetA로 예측모델을 만들고 LandslideSetB로 예측모델을 평가했으며, 도 10의 (b)는 이와 반대로 평가하여 두 평가 결과를 종합하였다. 평가 결과는 도 11과 같이 누적 리프트차트(accumulated lift chart)를 이용한 교차검증과, 모든 공간 사건데이터를 이용하여 예측한 적합도 검증에 대한 평가 결과이다. 리프트차트는 상위 포함된 가중값 순으로 2차원 그래프로 표현한다. 즉 백분위에 해당하는 단위 면적당 상위 정분류에 대한 누적비율을 2차원 그래프로 묘사하며 다음 [수학식 7]에 의해 백분위수가 결정된다.
Figure pat00008
성능평가에 대한 정량적 수치는 그래프의 하부 영역을 계산을 통해 산출 될 수 있다. 전체데이터를 이용한 적합도 평가(goodness of fit)결과 89.26% 이며, 교차 검증(2fold cross validation)에서는 86.08%로 높은 예측 평가를 보였다. 이와 같은 본 발명은 의사결정 트리를 이용하여 공간사건 데이터에 대한 예측을 수행할 뿐만 아니라 예측결과로부터 특정위치에서의 사건 원인을 규명하는데 사용가능하도록 한다.
10: 루트노드 20: 중간노드
31,32: 단말노드 100: 식별자 맵
200: 등급 색상맵

Claims (4)

  1. 다수의 원인 데이터 중 해당 공간사건 발생에 대한 원인 데이터를 추출하는 사건유발인자 추출단계(S100)와;
    상기 공간사건의 발생위치 및 공간사건 원인 데이터를 통해 하나의 루트노드와, 상기 루트노드와 연결되며 자노드를 갖는 중간 노드 및 자노드가 없는 단말노드로 구성되는 의사결정 트리를 구축하고, 단말노드에 분류된 데이터 분포를 이용하여 단말노드 등급을 결정하며, 결정된 등급에 따라 차등적인 색상을 부여하여 좌표상에 매핑하는 예측결과 도출 단계(S200)와;
    상기 의사결정 트리로부터 도출된 공간사건에 대한 예측결과인 단말노드에 식별자를 부여하고, 상기 좌표상의 단말노드 식별자를 통해 의사결정 트리의 단말노드를 탐색하여 해당 단말노드와 연결된 상위 노드를 통해 규칙을 생성함으로써 예측결과에 대한 원인분석을 가능하게 하는 해석단계(S300);
    를 포함하여 이루어지는 것을 특징으로 하는 의사결정 트리를 이용한 공간사건 예측분석 방법.
  2. 제 1항에 있어서,
    상기 예측결과 도출 단계(S200)는,
    의사결정 트리의 전지과정을 포함한 옵션들과 관련하여, 완전히 성장한 트리를 구축할 수 있도록 옵션값들을 적용하여 사건발생 데이터가 일반화되지 않도록 완전 성정한 의사결정 트리로 구축하는 것을 특징으로 하는 의사결정 트리를 이용한 공간사건 예측분석 방법.
  3. 제 1항에 있어서,
    상기 좌표상의 매핑은,
    의사결정 트리의 단말노드 등급결정방법을 이용하여 상대적 발생 가능성을 표현하고, 각 좌표위치에 따른 상대적 발생 가능성을 공간좌표상에 표현하는 것을 특징으로 하는 의사결정 트리를 이용한 공간사건 예측분석 방법.
  4. 제 1항에 있어서,
    상기 해석단계(S300)는,
    상기 의사결정 트리의 단말노드 식별자들을 좌표상에 매핑하여 예측결과와 일대일 대응하도록 하여, 좌표로 식별되는 예측결과에 대한 원인분석은 대응되는 단말노드를 식별하여 구축된 의사결정 트리의 단말노드를 탐색하여 해당 단말노드와 연계된 일련의 부노드들의 조합으로 규칙을 추출하여 예측결과에 대한 해석을 수행하는 것을 특징으로 하는 의사결정 트리를 이용한 공간사건 예측분석 방법.
KR1020110046325A 2011-05-17 2011-05-17 의사결정 트리를 이용한 공간사건 예측분석 방법 KR101264223B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110046325A KR101264223B1 (ko) 2011-05-17 2011-05-17 의사결정 트리를 이용한 공간사건 예측분석 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110046325A KR101264223B1 (ko) 2011-05-17 2011-05-17 의사결정 트리를 이용한 공간사건 예측분석 방법

Publications (2)

Publication Number Publication Date
KR20120128407A true KR20120128407A (ko) 2012-11-27
KR101264223B1 KR101264223B1 (ko) 2013-05-14

Family

ID=47513167

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110046325A KR101264223B1 (ko) 2011-05-17 2011-05-17 의사결정 트리를 이용한 공간사건 예측분석 방법

Country Status (1)

Country Link
KR (1) KR101264223B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101469136B1 (ko) * 2014-06-23 2014-12-04 한국지질자원연구원 의사결정트리에서 공간 예측을 위한 리프노드 등급 결정 방법 및 이를 기록한 기록매체
KR101973642B1 (ko) * 2018-08-31 2019-09-02 서울대학교산학협력단 텍스트 자동 생성을 위한 인터랙티브 시스템 및 방법
KR102020012B1 (ko) * 2018-06-08 2019-09-11 (주)에이피케이어플킹 빅데이터 분석 기반의 인공지능 실시간 스포츠 기사 자동 작성 시스템 및 방법
KR20210071789A (ko) * 2019-12-06 2021-06-16 쿠팡 주식회사 아이템 품절의 지능적인 예측과 사전 재주문을 위한 컴퓨터 구현 시스템 및 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101469136B1 (ko) * 2014-06-23 2014-12-04 한국지질자원연구원 의사결정트리에서 공간 예측을 위한 리프노드 등급 결정 방법 및 이를 기록한 기록매체
KR102020012B1 (ko) * 2018-06-08 2019-09-11 (주)에이피케이어플킹 빅데이터 분석 기반의 인공지능 실시간 스포츠 기사 자동 작성 시스템 및 방법
KR101973642B1 (ko) * 2018-08-31 2019-09-02 서울대학교산학협력단 텍스트 자동 생성을 위한 인터랙티브 시스템 및 방법
KR20210071789A (ko) * 2019-12-06 2021-06-16 쿠팡 주식회사 아이템 품절의 지능적인 예측과 사전 재주문을 위한 컴퓨터 구현 시스템 및 방법

Also Published As

Publication number Publication date
KR101264223B1 (ko) 2013-05-14

Similar Documents

Publication Publication Date Title
Jochem et al. Identifying residential neighbourhood types from settlement points in a machine learning approach
Hermosilla et al. Land cover classification in an era of big and open data: Optimizing localized implementation and training data selection to improve mapping outcomes
Jafari et al. Spatial prediction of soil great groups by boosted regression trees using a limited point dataset in an arid region, southeastern Iran
Koch et al. Revealing areas of high nature conservation importance in a seasonally dry tropical forest in Brazil: Combination of modelled plant diversity hot spots and threat patterns
He et al. Recognition of building group patterns in topographic maps based on graph partitioning and random forest
Riedel et al. Seismic vulnerability assessment of urban environments in moderate-to-low seismic hazard regions using association rule learning and support vector machine methods
Hermosilla et al. Assessing contextual descriptive features for plot-based classification of urban areas
Zhang et al. Heuristic sample learning for complex urban scenes: Application to urban functional-zone mapping with VHR images and POI data
CN117152893B (zh) 一种森林防灾方法及系统
Pechanec et al. Decision support tool for the evaluation of landscapes
Thompson et al. Forest loss in New England: A projection of recent trends
Kazemi et al. Mineral processing plant site selection using integrated fuzzy cognitive map and fuzzy analytical hierarchy process approach: A case study of gilsonite mines in Iran
KR101264223B1 (ko) 의사결정 트리를 이용한 공간사건 예측분석 방법
Sahin Implementation of free and open-source semi-automatic feature engineering tool in landslide susceptibility mapping using the machine-learning algorithms RF, SVM, and XGBoost
CN117576335B (zh) 面向矿产区域勘查的三维空间模型数据处理方法及系统
Ayhan et al. Analysis of image classification methods for remote sensing
Baja et al. GIS-based soil erosion modeling for assessing land suitability in the urban watershed of tallo river, South Sulawesi, Indonesia
Palamakumbure et al. ArcGIS V. 10 landslide susceptibility data mining add-in tool integrating data mining and GIS techniques to model landslide susceptibility
JP3697472B2 (ja) 土砂災害の発生限界線、避難基準線及び警戒基準線の作成方法とそのプログラム及び土砂災害の警戒避難支援システム
JP3656852B1 (ja) 防災事業計画支援方法とそのシステム
CN109326004B (zh) 一种水系沉积物采样点的自动化布置方法
Cui et al. Research on landslide prediction based on support vector model
Masoumi et al. Investigation of sustainable urban development direction using Geographic Information Systems (case study: Zanjan city)
Germanaitė et al. Case study of spatial pattern description, identification and application methodology
Reeves Deriving traverse paths for scientific fieldwork with multicriteria evaluation and path modeling in a geographic information system

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160325

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170327

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180406

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190402

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20191231

Year of fee payment: 19