KR102379472B1 - 시공간 피해특성을 고려한 다종 데이터 융합 분석방법 - Google Patents

시공간 피해특성을 고려한 다종 데이터 융합 분석방법 Download PDF

Info

Publication number
KR102379472B1
KR102379472B1 KR1020210176351A KR20210176351A KR102379472B1 KR 102379472 B1 KR102379472 B1 KR 102379472B1 KR 1020210176351 A KR1020210176351 A KR 1020210176351A KR 20210176351 A KR20210176351 A KR 20210176351A KR 102379472 B1 KR102379472 B1 KR 102379472B1
Authority
KR
South Korea
Prior art keywords
analysis
risk
data
regression model
index
Prior art date
Application number
KR1020210176351A
Other languages
English (en)
Inventor
이미란
문지원
정명훈
조정호
손종영
김구윤
한지혜
Original Assignee
대한민국
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대한민국 filed Critical 대한민국
Priority to KR1020210176351A priority Critical patent/KR102379472B1/ko
Application granted granted Critical
Publication of KR102379472B1 publication Critical patent/KR102379472B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • Algebra (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Library & Information Science (AREA)
  • Fuzzy Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Remote Sensing (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은, 전 국토를 직각으로 교차하여 표현하는 격자 크기를 활용하여 행정구역기반의 상황관리와 격자 기반의 상황관리를 융합하여 실무에 적용하기 위한 것으로, 컴퓨터 내 다종 데이터 융합분석 프로그램에 의해 수행되며, 각 정보 제공원들로부터 재난 관련정보들이 제공되면, 지오코딩 작업을 통해 지도 위에 격자 변환된 상태로 모니터에 표시되도록 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법에 있어서,
원시 재난 관련정보들을 지표 간의 상이한 범위를 동일하게 맞추기 위해 최소-최대 방법에 의해 데이터를 정규화하는 과정과;
그 다음 정규화된 격자 데이터로 상관관계 분석을 하여 회귀모형분석에 사용할 수 있는 지표를 일차적으로 선택하는데, 여기서 VIF(variance inflation factors) 분석을 통해 분석값이 5 이하인 지표를 선택하도록 하는 상관관계 분석하는 과정과;
이후 선택된 지표들로 회귀모형분석을 하여 종속변수에 대하여 통계적으로 유의미한 지표를 선택하는 회귀모형 분석하는 과정과;
회귀모형분석을 통해 선택된 각 지표에 대한 가중치를 엔트로피 방법을 통해 계산하는 지표 가중치의 결정 과정과;
상기 지표 가중치를 위험지도 계산에 적용하는 위험도 산출 과정과;
최종적으로 산출된 위해성, 취약성, 경감성, 위험도에 대한 공간통계분석이 이뤄지는 공간통계 분석하는 과정으로 이루어진 것을 특징으로 한다.

Description

시공간 피해특성을 고려한 다종 데이터 융합 분석방법 {Multimodal data integration method considering spatiotemporal characteristics of disaster damage}
본 발명은, 전 국토를 직각으로 교차하여 표현하는 격자 크기를 활용하여 행정구역기반의 상황관리와 격자 기반의 상황관리를 융합하여 실무에 적용하기 위한 것으로, 지자체 및 유관기관으로부터 수집된 다양한 데이터들을 지오코딩 작업을 통해 위치기반으로 변환하고, 기초 데이터는 연속수치지형도의 건물 레이어를 기초로 활용하여 다른 데이터와 융합 활용함으로써, 격자 지도 위에서 종합적인 재난 현황을 직관적으로 파악할 수 있도록 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법에 관한 것이다.
또한 본 발명은, 연구의 통계적 처리를 통해 상관분석, 회귀분석을 통한 다중밀집시설 화재의 주요 지표를 자동으로 선정할 수 있으며, 격자공간체계 기반의 공간자기상관성 분석을 통해 통계적으로 유의미한 위험지역을 용이하게 식별할 수 있도록 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법에 관한 것이다.
산업혁명 이후 인류가 지구에 미치는 영향이 갈수록 증가하고 있다. 일부에서는 이 시점을 인류세의 시작으로 정의하였고 이 과정에서 나타나는 대표적인 예시가 최근 세계적으로 문제가 야기되고 있는 높은 비율의 도시화가 있다.
우리나라의 경우 도시지역의 인구는 이미 90%를 넘어서고 있으며, 도시화 과정에서 짧은 기간에 집중적으로 건설된 도시기반시설과 건축물은 집단적인 노후화에 봉착하였다.
좁은 면적에 더 많은 인구와 시설들을 밀집시키기 위한 초고층 건물 및 4차산업혁명으로 인한 신기술의 발전으로 인해 도시 시스템의 연결성과 복잡성이 극대화되었는데, 그 결과 화재, 붕괴, 폭발과 같은 사회재난은 지속적인 증가와 대형 재난으로의 잠재성을 예고하고 있다.
도시지역 내 사회재난의 증가로 동 단위 중심의 행정구역 기반의 관리체계로는 재난의 예방, 대응, 복구 단계의 상황 인지에 한계가 존재한다. 국가재난관리정보시스템(NDMS, National Disaster Management System)에서 수집하는 정보는 지방자치단체별 다른 형식으로 등록되고 있다. 중앙정부의 재난관리담당자는 이처럼 표준화되지 않은 정보의 접근 및 활용성이 저조하여 지역별 피해 이력 정보 확인이 곤란하기 때문에 안전정보 기반의 사전 대비 환경 구축이 미비한 실정이다.
이러한 문제점들을 해결하기 위해 동 단위 이하의 소지역으로 구분할 수 있는 새로운 공간정보 기준의 필요성이 제기되었고 재난 상황판단을 위한 분석 및 해석 도구의 필요성이 강조되고 있다. 과거에는 재난의 예방, 대응, 복구를 위해 문서나 이미지 정보를 사용하였으나 IT 기술의 고도화로 지도 위에 각종 재난 관련 정보들을 시각화하여 특정 위치에 대한 재난 상황을 보다 직관적으로 이해하여 신속, 정확한 대응을 하고자 한다.
그러나, 다양한 정보의 분석 결과가 이를 해석하는 사람에 따라 크게 달라지고 있다. 또한, 재난 관련 상황이나 문제는 행정구역 경계에 걸쳐서 발생하는 사례도 있는데, 실무에서는 행정경계 기반의 정보를 활용하고 있어 도시의 재난은 동 단위보다 세밀한 단위에서의 예방, 대응 활동이 이루어져야 할 필요성이 강조되고 있다.
따라서 전 국토를 직각으로 교차하여 표현하는 격자 크기를 활용하여 행정구역 기반의 상황관리와 격자 기반의 상황관리를 융합하여 실무에 적용함이 바람직 할 것인데, 현재 격자공간체계는 이미 국토지리정보원, 통계청, 기상청, 해양수산부 등 다양한 공공기관에서 사용하고 있지만, 대부분 연구개발, 시범 서비스 단계에 머무르고 있어 업무 활용도는 저조한 상태이다.
특허문헌 1: 대한민국 특허공개공보 제 2016-0133199호 특허문헌 2: 대한민국 특허공개공보 제 2016-0099931호
본 발명에서는 위 문제점을 해소하기 위한 것으로서,
재난상황관리를 위한 격자공간체계 데이터 관리 및 활용방안을 제시하고 지역별, 유형별 피해대상, 피해 규모와 같은 다종데이터를 활용한 융합분석기술을 개발하여 지도기반의 시각화로 최종 결과물을 도출함으로써, 격자 지도 위에서 종합적인 재난 현황을 직관적으로 파악할 수 있도록 함에 첫번째 목적이 있는 것이다.
또한, 전 국토를 직각으로 교차하여 표현하는 격자 크기를 활용하여 행정구역기반의 상황관리와 격자 기반의 상황관리를 융합하여 실무에 적용하기 위한 것으로, 자자체 및 유관기관으로부터 수집된 다양한 데이터들을 지오코딩 작업을 통해 위치기반으로 변환하고, 기초 데이터는 연속수치지형도의 건물 레이어를 기초로 활용하여 다른 데이터와 융합 활용할 수 있도록 하며,
연구의 통계적 처리를 통해 상관분석, 회귀분석을 통한 다중밀집시설 화재의 주요 지표를 자동으로 선정하는 한편, 격자공간체계 기반의 공간자기상관성 분석을 통해 통계적으로 유의미한 위험지역을 용이하게 식별할 수 있도록 함으로써, 여러 공공기관들과의 정보 연계도 용이하도록 함에 두번째 목적이 있는 것이다.
상기한 목적을 달성하기 위한 본 발명의 시공간 피해특성을 고려한 다종 데이터 융합 분석방법에서는,
컴퓨터 내 다종 데이터 융합분석 프로그램에 의해 수행되며, 각 정보 제공원들로부터 재난 관련정보들이 제공되면, 지오코딩 작업을 통해 지도 위에 격자 변환된 상태로 모니터에 표시되도록 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법에 있어서,
원시 자연 재난 관련정보들을 지표 간의 상이한 범위를 동일하게 맞추기 위해 최소-최대 방법으로 데이터를 정규화하는 과정과;
그 다음 정규화된 격자 데이터로 상관관계 분석을 하여 회귀모형분석에 사용할 수 있는 지표를 일차적으로 선택하는데, 여기서 VIF(variance inflation factors) 분석을 통해 분석값이 5 이하인 지표를 선택하도록 하는 상관관계 분석하는 과정과;
이후 선택된 지표들로 회귀모형분석을 하여 종속변수에 대하여 통계적으로 유의미한 지표를 선택하는 회귀모형 분석하는 과정과;
회귀모형분석을 통해 선택된 각 지표에 대한 가중치를 엔트로피 방법을 통해 계산하는 지표 가중치의 결정 과정과;
상기 지표 가중치를 위험지도 계산에 적용하는 위험도 산출 과정과;
최종적으로 산출된 위해성, 취약성, 경감성, 위험도에 대한 공간통계분석이 이뤄지는 공간통계 분석하는 과정으로 이루어진 것을 특징으로 한다.
상기 데이터 정규화하는 과정에서, 최소-최대 정규화 방법은 지표의 최댓값과 최솟값을 이용하는 방법으로, 최댓값 및 최솟값에 이상치가 존재할 경우, 해당 수치에 영향을 받아 왜곡된 결과가 나올 수 있기에 이상 치에 해당하는 값을 최댓값으로 대체하는 방법이다.
상기 상관관계 분석하는 과정에서, 상관관계의 정도를 상관계수(-1~1)로 표시하며, 상관계수의 해석기준은 -1.0~-0.7의 경우 강한 음의 선형관계이고, -0.7~-0.3의 경우 뚜렷한 음의 선형관계이고, -0.3~-0.1의 경우 약한 음의 선형관계이고, -0.1~0.1의 경우 거의 무시될 수 있는 선형관계이고, 0.1~0.3의 경우 약한 양의 선형관계이고, 0.3~0.7의 경우 뚜렷한 양의 선형관계이고, 0.7~1.0의 경우 강한 양의 선형관계이다.
상기 상관관계 분석하는 과정에서, 두 변수의 관계가 선형적이고 직교 좌표계에 좌표상의 점들을 표시함으로써 확인 가능해야하고, 등분산성과, 정규분포성이 전제되어야하며, 연속형 변수를 다루기 위한 피어슨 상관분석을 사용하고, 해당 변수들을 회귀 분석에 사용하기 위한 통계적 유의성을 판단하기 위하여 VIF분석을 실시할 수 있다.
상기 VIF분석은 독립변수 간 다중공선성이 있는지 측정하는 척도에 해당하고, 상기 다중공선성은 독립변수 간에 강한 상관관계가 존재하는 경우를 의미하며, VIF 값이 1에 가까울수록 다중공선성이 작음을 의미하고 반대로 값이 커질수록 다중공성의 정도가 큼을 의미하고, 상기 VIF 값이 5 이상일 경우 해당 변수가 다중공선성이 있다고 판단한다.
상기 회귀 모형 분석과정에서, 먼저 모형의 오차제곱합을 최소로 하는 최소제곱법(least squares met hod)에 의해 회귀계수를 추정하고,
회귀모형에서의 독립변수마다 유의확률(p-value)을 확인하여 유의성 검정을 통한 최적 변수를 선택하기 위해 전진선택법, 후진소거법, 단계선택법 중에서 어느 한 방법을 사용하며,
수정된 결정계수(adjusted R2) 또는 분산분석(F- statistic)에 의해 회귀모형의 적합도를 검정할 수 있다.
상기 수정된 결정계수(adjusted R2)는 0 에서 1 사이의 값을 가지고, 1에 가까울수록 회귀모형이 해당현상을 잘 설명한 것으로 판단하며,
분산분석(F- statistic)에서는 분산분석의 F값이 1보다 크고 유의 확률이 유의수준 0.05보다 작을 때 독립변수는 종속변수에 대하여 통계적으로 유의하다고 판단할 수 있다.
상기 회귀모형은, 오차항이 정규분포를 따라야 하고, 오차항은 서로 독립이어야 하며, 오차항의 평균은 0이어야 하고, 오차항은 등분산을 구비할 수 있다.
모든 변수를 독립변수로 포함한 회귀분석을 수행한 이후 독립변수를 하나씩 소거해나가며 조합함으로써 Akaike Information Criterion(AIC)를 최소화하는 조합을 발견하는 방법인 후진소거법을 통해 유의확률이 유의수준보다 작아 통계적으로 유의한 변수를 선택할 수 있다.
상기 지표 가중치의 결정 과정에서, 위험지역의 평가 요소에 대한 가중치는 엔트로피 방법을 이용하여 결정하고 중첩분석을 통해 위험도를 산정하되, 엔트로피 가중치와 AHP의 가중치를 결합한 수정엔트로피를 사용하거나 엔트로피 가중치와 델파이 가중치를 사용하는 혼합 가중치 기법을 사용할 수 있다.
엔트로피를 이용한 계산과정은, 위해성, 취약성, 경감성에 따른 속성 정보를 이용하여 행렬을 구성하는 과정과;
Figure 112021143306341-pat00001
평가항목별 속성정보를 정규화하는 과정과;
Figure 112021143306341-pat00002
각각의 지표별 엔트로피를 계산하는 과정과;
Figure 112021143306341-pat00003
계산된 지표별 엔트로피의 다양성을 고려한 엔트로피 가중치를 산정하는 과정으로 이루어진다.
Figure 112021143306341-pat00004
상기 위험도 산출 과정에서, 위험도를 산출하기 위한 각 지표의 점수는 아래식과 같이 계산된다.
Figure 112021143306341-pat00005
(여기에서, N, M, S는 각각 위해성 지표 개수, 취약성 지표 개수, 경감성 지표 개수이고, α와 n은 각 지표에 대한 가중치를 의미함)
상기 계산된 각 지표의 값은 아래식과 같이 위험도가 계산된다.
Figure 112021143306341-pat00006
(여기에서, [등급화 적용]이란 계산된 위험도 값에 대한 1~10 사이의 등급에 따른 점수 부여를 의미함)
상기 위험도에 적용되는 등급화에서는, 최적화 분류 방법을 사용하여 실제의 분포를 분류하기에 최적화될 수 있도록 네추럴 브레이크를 이용한 등급화 방법을 사용할 수 있다.
상기 공간통계 분석하는 과정에서는, 공간에 종속된 데이터가 공간적 특성에 따라 어떠한 성질을 보이는가를 정규화하기 위해 Moran’s I가 사용되는데, 공간자기상관의 국지적 변이(local variations)를 고려한 시각적 지표인 Local Moran’s I는 아래의 식으로 계산된다.
Figure 112021143306341-pat00007
(여기에서, xi는 특성 i에 대한 속성,
Figure 112021143306341-pat00008
x는 해당 속성의 평균, wi,j는 i와 j사이의 공간적 가중치(이웃하면 1 아니면 0),
Figure 112021143306341-pat00009
은 표본 분산을 의미함)
상기 Local Moran’s I의 계산 후, 이것이 공간적, 통계적으로 의미가 있는 수치인지 검증하기 위해 Local Moran’s I에 대한 p-value와 z score를 이용한다.
본 발명에서는,
재난상황관리를 위한 격자공간체계 데이터 관리 및 활용방안을 제시하고 지역별, 유형별 피해대상, 피해 규모와 같은 다종데이터를 활용한 융합분석기술을 개발하여 지도기반의 시각화로 최종 결과물을 도출함으로써, 격자 지도 위에서 종합적인 재난 현황을 직관적으로 파악할 수 있도록 하는 효과가 있다.
또한, 전 국토를 직각으로 교차하여 표현하는 격자 크기를 활용하여 행정구역기반의 상황관리와 격자 기반의 상황관리를 융합하여 실무에 적용하기 위한 것으로, 자자체 및 유관기관으로부터 수집된 다양한 데이터들을 지오코딩 작업을 통해 위치기반으로 변환하고, 기초 데이터는 연속수치지형도의 건물 레이어를 기초로 활용하여 다른 데이터와 융합 활용할 수 있도록 하며,
연구의 통계적 처리를 통해 상관분석, 회귀분석을 통한 다중밀집시설 화재의 주요 지표를 자동으로 선정하는 한편, 격자공간체계 기반의 공간자기상관성 분석을 통해 통계적으로 유의미한 위험지역을 용이하게 식별할 수 있도록 함으로써, 여러 공공기관들과의 정보 연계도 용이하도록 하는 효과도 있는 것이다.
도 1은 본 발명의 시공간 피해특성을 고려한 다종 데이터 융합 분석방법을 수행하기 위한 기본 시스템 구성도이고,
도 2는 도 1의 시스템의 전체 처리과정을 나타낸 블록도이고,
도 3은 본 발명에 따른 시공간 피해특성을 고려한 다종 데이터 융합 분석방법의 전체 처리과정을 나타낸 블록도이고,
도 4는 본 발명에서의 데이터 정규화 결과를 나타낸 도표로서, 최소-최대 정규화 방법 적용 전후를 비교한 도표이고,
도 5는 본 발명에서의 상관관계 분석 결과를 나타낸 도표이고,
도 6은 본 발명에서의 회귀모형 분석 결과를 나타낸 도표로서, 후진소거법 전,후를 비교한 도표이고,
도 7은 본 발명에서의 지수 가중치 결정 결과를 나타낸 도표이고,
도 8은 본 발명에서의 위험지도 산출결과를 나타낸 도표이고,
도 9는 본 발명에서의 공간 통계분석을 위해 국지공간자기상관지표(LISA)를 예시한 도표이고,
도 10은 본 발명에서의 공간 통계분석을 위해 국지공간자기상관지표(LISA)에 대한 지정데이터의 시각화 예시도이고,
도 11은 본 발명에서의 공간통계분석 결과를 나타낸 예시도로서, 100m 간격의 격자구조에 대한 예시도이고,
도 12는 본 발명에서의 공간통계분석 결과를 나타낸 예시도로서, 500m 간격의 격자구조에 대한 예시도이고,
도 13은 본 발명에서의 공간통계분석 결과를 나타낸 예시도로서, 1km 간격의 격자구조에 대한 예시도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다.
한편, 하기 본 발명에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하다. 따라서 본 발명의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다.
예컨대, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다.
또한 본 발명에서 제시된 목적 또는 효과는 특정 실시예가 이를 전부 포함하여야 한다거나 그러한 효과만을 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
본 발명에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 가진다.
일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부도면을 참조하여 본 발명의 바람직한 실시예를 설명함으로써, 본 발명을 상세히 설명한다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.
도 1은 본 발명의 시공간 피해특성을 고려한 다종 데이터 융합 분석방법을 수행하기 위한 기본 시스템 구성도로서,
본 발명의 시공간 피해특성을 고려한 다종 데이터 융합 분석방법은 컴퓨터 내 다종 데이터 융합분석 프로그램에 의해 수행되며, 상기 컴퓨터에는 행정안전부, 기획재정부, 국토교통부 등의 정보 제공원으로부터 재난 관련정보들이 제공되고, 상기 다종 데이터 융합분석 프로그램의 수행결과는 지오코딩 작업을 통해 지도 위에 격자 변환된 상태로 모니터에 표시된다.
도 2는 도 1의 시스템의 전체 처리과정을 나타낸 블록도로서,
본 발명에서는 기관 간의 연계 강화 및 대국민 서비스를 위해 재난 관련 정보를 대국민 및 관계자들에게 제공할 수 있도록 구성되는데, 행정안전부, 기획재정부, 국토교통부 등의 정보 제공원으로부터 웹상에서 데이터 공급을 받고, 상기 데이터를 공급받으면 컴퓨터 내 다종 데이터 융합분석 프로그램이 실행되어, 데이터 수집, 데이터 제공, 분석시스템이 수행되며, 최종 분석된 결과는 서비스 포털을 통해 대국민, 공공기관, 민간기업, 연구기관 등의 관계자들에게 제공되어진다.
한편, 데이터 수집 시에는 저장, 가공, 관리가 함께 이루어지고, 데이터는 OPEN API, 데이터 세트 등으로 제공될 수 있으며, 분석시스템에서는 통계분석 및 시뮬레이션하여 지도 형태로 시각화되어진다.
재난 관련 정보는 플랫폼으로 제공된 것을 이용하는 것이 바람직하고, 서비스 아키텍처는 원활한 정보의 수집을 위해 원천 정보를 공급하는 기관을 선정하여 정보를 수집하고 있다.
원시정보는 서비스 목적에 맞게 가공하고 저장하고 관리되어야하며, 가공한 정보는 OPEN API 또는 데이터 세트의 방법으로 사용자에게 제공되는데, 가공한 정보는 공간정보와 결합하여 통계 분석, 시뮬레이션, 지도 시각화 등 다양한 방법으로 양질의 정보를 제공할 수 있도록 본 발명에 따른 분석 시스템이 구성된다.
또한 본 발명에 따른 분석 시스템에서는 서비스 포털에 등록되어 위치기반의 정보, 격자 기반의 통계정보, 안전점검 정보, 재난 발생 시 피난 유도 방향 제시 등 다양한 형태의 서비스를 대국민, 공공기관, 민간기업, 연구기관을 대상으로 제공할 수 있다.
도 3은 본 발명에 따른 시공간 피해특성을 고려한 다종 데이터 융합 분석방법의 전체 처리과정을 나타낸 블록도로서,
본 발명에 따른 시공간 피해특성을 고려한 다종 데이터 융합 분석방법은, 다양한 종류의 원시 재난 관련정보들을 융합 분석할 수 있도록 가공, 관리됨에 특징이 있는 것으로서, 원시 재난 관련정보들을 지표 간의 상이한 범위를 동일하게 맞추기 위해 최소-최대 방법으로 데이터를 정규화하는 과정과; 상관관계 분석하는 과정과; 회귀모형 분석하는 과정과; 지표 가중치를 결정하는 과정과; 위험도를 산출하는 과정과; 공간통계 분석하는 과정으로 이루어진다.
즉, 분석결과에 앞서 다종데이터 융합분석의 전체적인 흐름은 다음과 같은데,
먼저 지표 간의 상이한 범위를 동일하게 맞추기 위하여 최소-최대 방법을 통해 데이터를 정규화하고, 그 다음 정규화된 격자 데이터로 상관관계 분석을 하여 회귀모형분석에 사용할 수 있는 지표를 일차적으로 선택하는데, 여기서 VIF(variance inflation factors) 분석을 통해 분석값이 5 이하인 지표를 선택하며, 이후 선택된 지표들로 회귀모형분석을 하여 종속변수에 대하여 통계적으로 유의미한 지표를 선택하고,
회귀모형분석을 통해 선택된 각 지표에 대한 가중치를 엔트로피 방법을 통해 계산한 후 이를 위험지도 계산에 적용하며, 최종적으로 산출된 위해성, 취약성, 경감성, 위험도에 대한 공간통계분석이 이뤄진다.
데이터 정규화에 대해 살펴보자면, 일반적으로 위험요인을 통해 공간분석을 할 경우, 지표들의 성격과 단위가 다르기에 각각의 인자들이 가지는 의미를 명확하게 도출하고 평가하기 위해선 정규화 과정이 필수적으로 선행되어야 하는데, 격자기반 지표가 아래와 같이 정리될 수 있다.
Figure 112021143306341-pat00010
Ranking은 단순 나열 방식으로 이 방법은 자료의 특성을 고려하지 않기 때문에 일반적인 통계 분석에 잘 사용되지 않는다. 최소-최대 방법은 지표의 최댓값과 최솟값을 이용하는 방법으로 최댓값 및 최솟값에 이상치가 존재할 경우, 해당 수치에 영향을 받아 왜곡된 결과가 나올 수 있기에 이상 치에 해당하는 값을 최댓값으로 대체하는 방법이 있다. Z-score는 변수의 값들에 평균을 뺀 편차 점수를 구한 뒤 표준편차로 나누어 줌으로써 해당 변수의 평균이 0, 표준편차가 1인 단위분포로 전환시키는 방법으로 -3과 +3 사이의 값을 갖게 되며, 이로 인해 음수 값이 발생하기에 해당값의 수준을 직관적으로 파악하기 어려움이 있다. T-score는 Z-score에 10을 곱하고 50을 더해주어 평균 50, 표준편차 10인 분포로 전환하여 해당 변수의 값들이 대부분 20~80 사이의 값을 갖게 된다.
앞서 설명한 4가지 정규화 방법 중 z-score를 사용하지 않은 이유로는 현재 구축된 데이터의 경우 정규성을 가지지 않기 때문이다. 따라서 본 발명에선 머신러닝 학습에 많이 사용되는 최소-최대 방법을 이용하였다. 최소-최대 방법을 통해 100m, 500m, 1km 격자 데이터의 모든 지표를 정규화하였으며 이에 관한 결과는 도 4에서와 같다.
도 4는 본 발명에서의 데이터 정규화 결과를 나타낸 도표로서, 최소-최대 정규화 방법 적용 전후를 비교한 100m 격자 데이터에 대한 적용 예시인데, 화재 발생 건수 열을 보면 알 수 있듯이 최댓값인 2가 에선 최소-최대 정규화 방법 적용 후 1로 변환된 것을 알 수 있다. 변환된 지표 값들은 상관관계분석에 사용된다.
이와 같이 데이터 정규화가 이루어지면, 시공간 피해특성을 고려한 다종 데이터 융합분석 - 상관관계 분석이 이루지는데,
상관분석은 확률론과 통계학에서 두 변수 간의 관계성을 파악하는 분석하는 방법으로서, 두 변수가 서로 관련성이 있다고 추측되는 관계를 상관관계라고 부르며 상관관계의 정도를 상관계수(-1~1)라고 부른다.
Figure 112021143306341-pat00011
위 그림을 보면 상관계수가 음수이면 그림 왼쪽과 같이 두 변수가 음의 관계임을 의미하며 반대로 양수이면 그림 오른쪽과 같이 두 변수가 양의 관계임을 의미한다.
이를 해석하는 방법, 즉 상관계수 해석기준은 아래와 같다.
Figure 112021143306341-pat00012
본 발명의 상관관계분석을 위해서는 다음 3가지의 기본 가정이 전제되어야 한다.
- 선형성 : 두 변수의 관계가 선형적이어야 하며 직교 좌표계에 좌표상의 점들을 표시함으로써 확인할 수 있다.
- 등분산성 : 두 변수를 대표하는 직선을 그었을 때 독립변수의 어떤 지점에서도 종속변수의 흩어진 정도가 같음을 의미한다.
- 정규분포성 : 두 변수가 모두 모집단에서 정규분포를 이룬다.
상관분석 방법으로는 피어슨, 스피어만, 켄달 방법이 있겠으나, 본 발명에서는 연속형 변수를 다루기 때문에 피어슨 상관분석을 선택하였고 해당 변수들을 회귀분석에 사용하기 위한 통계적 유의성을 판단하기 위하여 VIF분석을 실시하였다.
VIF분석은 독립변수 간 다중공선성이 있는지 측정하는 척도에 해당하고, 여기서 다중공선성은 독립변수 간에 강한 상관관계가 존재하는 경우를 의미하며, VIF 값이 1에 가까울수록 다중공선성이 작음을 의미하고 반대로 값이 커질수록 다중공선성의 정도가 큼을 의미한다. VIF 값이 10(엄격하게는 5) 이상일 경우 해당 변수가 다중공선성이 있다고 판단한다.
상관관계분석은 화재 발생 건수를 제외한 위험성 지표와 취약성 지표를 기반으로 Pearson의 상관분석을 사용하였는데, 격자 데이터 범위에 따른 분석결과는 도 5와 같다.
도 5는 본 발명에서의 상관관계 분석 결과를 나타낸 도표로서, 분석결과를 보면 격자의 범위가 커질수록 인구밀도-노후건물, 방화지구-다중밀집시설 지표 간의 상관성이 양의 방향으로 커짐을 알 수 있다.
해당 변수들을 회귀모형분석에 적용하기 위해선 독립변수 간의 상관성이 낮아야하는데 상관분석 결과 일부 지표에선 높은 상관성이 보이지만 전체적으로 지표 간의 상관성이 낮음을 알 수 있다. 이에 대한 통계적 유의성을 판단하기 위하여 VIF 분석을 통해 변수 간 다중공선성이 있는지 확인하였으며 분석결과는 아래 도표를 참고하면 된다.
Figure 112021143306341-pat00013
위 도표를 보면 격자의 범위가 커질수록 다중공선성 값이 소폭 상승하지만 전부 1~2 사이의 값을 가지며 엄격한 다중공선성 값인 5를 기준으로 하더라도 지표 전체에 다중공선성이 없음을 알 수 있다. 따라서 지표 전부 상관관계가 낮음을 의미하며 모든 지표를 회귀모형분석에 사용하였다.
이와 같이 상관관계 분석이 이루어진 후에는, 시공간 피해특성을 고려한 다종데이터 융합분석-회귀모형 분석이 이루어져야한다.
설명변수(독립변수)와 반응변수(종속변수) 사이에 식으로 표현되는 관계가 존재하는지 확인하고, 그 관계가 존재한다면 어떠한 형태로 표현되는지 파악하여 추론 및 예측하고자 한다.
1) 회귀계수추정
회귀모형분석에서의 회귀계수의 추정식은 아래와 같다.
Figure 112021143306341-pat00014
위 식에서 Y는 종속변수, X는 독립변수, ε는 오차항, β는 회귀계수에 해당한다. 위 식과 같은 다중회귀직선의 회귀계수를 추정하기 위해 모형의 오차제곱합을 최소로 하는 최소제곱법(least squares method)을 이용한다.
2) 변수 선택
회귀모형에서의 독립변수마다 유의확률(p-value)을 확인하여 유의성 검정을 통한 최적 변수를 선택할 수 있으며 선택방법으로 다음과 같이 전진선택법, 후진소거법, 단계선택법이 있는데,
전진선택법(forward selection)은 독립변수를 하나도 포함하지 않은 상태에서 독립변수를 하나씩 회귀식에 추가시키는 방법이고,
후진소거법(backward elimination)은 독립변수를 모두 포함한 회귀식에서 독립변수를 하나씩 제외하는 방법이며,
단계선택법(stepwise selection)은 독립변수의 추가, 제거를 조합하여 최선의 회귀식을 도출하는 방법이다.
3) 회귀모형 정규화 검정
회귀모형의 정규화를 판정한다는 것은 도출된 회귀식이 통계적으로 유의한지, 변수가 유의하게 영향을 미치는지 그리고 얼마나 설명력을 가지는지 등의 여부를 확인함을 의미한다.
적합도를 판단하는 방법으로 수정된 결정계수(adjusted R2), 분산분석(F-statistic)이 있다. 먼저, 수정된 결정계수는 독립변수가 얼마나 종속변수의 변동(분산)을 잘 설명하는지를 나타내며, 회귀모형의 적합도를 검정하기 위한 계수이다.
이러한 계수는 0에서 1 사이의 값을 가지며, 1에 가까울수록 회귀모형이 해당현상을 잘 설명한다고 판단한다.
분산분석은 도출된 회귀식이 회귀분석 모델 전체에 대하여 통계적으로 의미가 있는지 파악하는 방법이다. 결과에 대한 해석은 분산분석의 F값이 1보다 크고 유의확률이 유의수준 0.05보다 작을 때 회귀모델분석에 있어서 독립변수는 종속변수에 대하여 통계적으로 유의하다고 판단한다.
회귀모형은 다음 4가지가 가정되어야한다.
- 정규성 : 오차항은 정규분포를 따라야 한다.
- 독립성 : 오차항은 서로 독립이어야 한다.
- 불편성 : 오차항의 평균은 0이어야 한다.
- 등분산성 : 오차항은 등분산을 가져야 한다.
회귀모형의 종속변수로 위해성 지표 중 화재 발생 건수를 선택하였으며, 독립변수로 화재 발생 건수를 제외한 위해성 지표와 취약성 지표를 사용하였는데, 각 격자 범위에 대한 회귀분석 결과는 도 6과 같다.
도 6은 본 발명에서의 회귀모형 분석 결과를 나타낸 도표로서, 후진소거법 전,후를 비교한 도표인데,
회귀모형의 최적 변수를 선택하기 위하여 모든 변수를 독립변수로 포함한 회귀분석을 수행한 이후 독립변수를 하나씩 소거해나가며 조합함으로써 Akaike Information Criterion(AIC)를 최소화하는 조합을 발견하는 방법인 후진소거법을 통해 유의확률이 유의수준보다 작아 통계적으로 유의한 변수를 선택하였다.
첫 번째 결과인 100m 격자 데이터의 회귀분석결과에서 수정된 결정계수 값이 0.1425로 이는 해당 회귀모형이 1.425%의 수치로 현상을 설명할 수 있다고 볼 수 있으며, 분산분석의 F값이 2.073으로 1보다 크고 해당 유의확률이 유의수준보다 작으므로 통계적으로 유의성이 입증되었다. (도 6)
하지만, 독립변수인 화재경계지구, 고층 건물, 방화지구의 p-value가 0.05보다 작지않아 유의하지 않다는 것을 확인할 수 있기 때문에 최적의 변수 조합으로 구성된 회귀계수 추정식을 만들기 위해 후진소거법을 적용한 결과를 (도 6)에서 확인할 수 있다. 이 결과는 AIC를 최소화하는 조합으로 구성된 것이며 독립변수가 모두 0.05보다 작아 유의하다는 것을 먼저 확인할 수 있다. 또한, 수정된 결정계수 값이 0.142로 약간 높아졌고, F값이 2.962로 더 커졌다.
두 번째 결과로 500m 격자 데이터의 회귀분석 결과의 경우, 수정된 결정계수 값이 0.3222로 이는 해당 회귀모형이 32.22%의 수치로 현상을 설명할 수 있다고 볼 수 있으며, 분산분석의 F값이 27.53으로 1보다 크고 해당 유의확률이 유의수준보다 작으므로 통계적으로 유의성이 입증되었다. 하지만, 독립 변수인 화재 인명피해, 화재경계지구, 고층건물, 다중밀집시설, 방화지구의 p-value가 0.005보다 작지 않아 유의하지 않다는 것을 확인할 수 있으므로 최적의 변수 조합으로 구성된 회귀계수 추정식을 만들기 위해 후진소거법을 적용한 결과를 (도 6)에서 확인할 수 있다. 이 결과는 AIC를 최소화하는 조합으로 구성된 것이며 독립변수가 모두 0.05보다 작아 유의하다는 것을 먼저 확인할 수 있다.
또한, 수정된 결정계수 값이 0.3247로 약간 높아졌고, F값이 54.65로 더 커졌다.
각 격자 범위별 선택된 변수는 다음과 같으며 해당 변수들은 가중치 결정에 사용된다.
- 100m 격자 데이터 : 화재 인명피해, 화재 재산피해, 노후건물, 다중밀집시설, 유류 및 가스 취급시설, 인구밀도, 드라이비트
- 500m 격자 데이터 : 화재 재산피해, 노후건물, 유류 및 가스 취급시설, 인구밀도, 드라이비트
- 1km 격자 데이터 : 화재 재산피해, 노후건물, 인구밀도
회귀모형분석의 경우 회귀모형의 오차에 대하여 정규성, 독립성, 등분산성, 불편성과 같은 4개의 가정을 충족하여야 일반화된 결과라고 해석할 수 있으며, 본 발명에 따른 회귀식은 해당 가정들을 만족하지 않아 현재의 회귀모델은 일반화된 결과라고 할 수 없기에 사용하기 적합하지 않다.
이상에서와 같이 회귀모형 분석이 이루어진 후에는 지표 가중치가 결정되어야하는데, 만약 가중치를 적용하지 않고 위험도 분석을 진행한다면 분석결과가 과소평가 또는 과대평가가 될 수 있기 때문이다. 여기서 가중치는 실제와 맞게끔 보정을 해주는 역할을 하는 것이므로, 가중치를 결정하기 위한 방법론을 조사하고 연구 환경에 맞는 가중치 결정 방법을 선정하기로 한다.
1) 가중치 결정 방법 사전 조사
가중치 결정 방법은 크게 정성적 방법론과 정량적 방법론으로 구분할 수 있으며 정성적 방법은 다속성호용이론, 계층화분석법, 퍼지집합이론, 델파이기법 등이 있으며, 정량적 방법은 통계적방법론으론 요인본석, 주성분분석, 프로빗모형, 다중회귀모형, 엔트로피, 머신러닝 등이 있다.
정성적 방법들은 전문가 또는 의사결정자의 의견을 기반으로 가중치가 결정되기때문에 가중치에 대한 책임소재가 분명할 수 있으나 다수의 전문가 의견이 필요하므로 가중치를 산정하기 위해선 정량적 방법에 비하여 많은 시간이 필요하다.
또한, 전문가의 주관에 따라 가중치가 판단되기 때문에 판단 주체의 전문성에 따라 결과의 편차가 클 수 있다는 단점이 있다.
반면 정량적 방법의 경우 정성적 방법과는 다르게 데이터를 기반으로 가중치를 도출하기 때문에 연구자의 주관을 배제하고 객관적으로 가중치를 산정할 수 있고 설문 조사와 같은 절차가 생략되기에 빠르게 가중치를 산정할 수 있는 장점이 있다. 따라서 가중치 결정 방법 중 정량적 방법을 사용하기로 하였다.
2) 정량적 방법을 이용한 기존 연구
본 발명에서는 대기오염과 관련된 취약성 노출, 민감도, 적응능력 세가지 변수 특성별 지표 간의 가중치를 결정하기 위해 엔트로피를 사용하였고, 가뭄 취약성 평가를 위해 주성분 분석으로 선정된 인자들에 대한 가중치 산정으로 엔트로피 기법을 사용하였으며, 위험지역의 평가 요소에 대한 가중치는 엔트로피 방법을 이용하여 결정하고 중첩분석을 통해 위험도 산정 사례를 확인하였다.
또한, 엔트로피 가중치와 AHP의 가중치를 결합한 수정엔트로피를 사용하였고 “사회재난 위험지수 개발 연구”에선 엔트로피 가중치와 델파이 가중치를 사용하는 혼합 가중치 기법을 사용한 결과가 있다.
이와 같이 지표 간의 중요도를 파악하기 위해 엔트로피가 많이 쓰이고 있으며, 따라서 본 발명에선 다중밀집시설 대형화재 지표들의 가중치를 산정하기 위하여 엔트로피 기법을 사용하였다.
3) 엔트로피를 이용한 가중치 산정
엔트로피는 확률분포가 가지는 정보의 정보량을 수치로 표현하여 가중치를 산정하는 의사결정 도구이다. 엔트로피를 이용한 계산 과정은 다음과 같다.
먼저 위해성, 취약성, 경감성에 따른 속성정보를 이용하여 행렬을 구성한다.
Figure 112021143306341-pat00015
둘째, 평가항목별 속성정보를 정규화한다.
Figure 112021143306341-pat00016
셋째, 각각의 지표별 엔트로피를 계산한다.
Figure 112021143306341-pat00017
넷째, 계산된 지표별 엔트로피의 다양성을 고려한 엔트로피 가중치 산정한다.
Figure 112021143306341-pat00018
이렇게 엔트로피를 이용한 가중치 산정 결과는 도 7과 같다.
이상과 같이 지표 가중치가 결정된 후에는 다음과 같이 위험지도를 산출한다.
위험지도를 산출하기 위한 각 지표의 점수는 아래식과 같이 계산된다.
Figure 112021143306341-pat00019
-------- (식 1)
위 식에서 N, M, S는 각각 위해성 지표 개수, 취약성 지표 개수, 경감성 지표 개수이며 α와 n은 각 지표에 대한 가중치를 의미한다. 지표 점수를 기반으로 아래식을 통해 위험도가 계산된다. 아래식에서 [등급화 적용]이란 계산된 위험도 값에 대한 1~10 사이의 등급에 따른 점수 부여를 의미한다.
Figure 112021143306341-pat00020
----------- (식 2)
위의 과정을 모든 격자 구조에 적용하여 최종적으로 위험도를 계산하게 된다. 위험도에 적용되는 등급화의 경우 다양한 방법이 존재하는데 일반적인 GIS 시스템에서 제공하는 방법으로는 등간격, 등개수(분위수), 로그 스케일, 표준편차, 네추럴 브레이크, 프리티 브레이크 총 6가지가 존재한다. 해당 방법들을 다음 표와 같이 정리할 수 있다.
Figure 112021143306341-pat00021
등간격, 등개수(분위수)의 경우 데이터의 분포가 일정하지 않을 경우, 사용하기 힘들고 구축된 데이터는 정규성을 띄지 않기 때문에 표준편차 방법을 사용하기 어려우며 프리티 브레이크는 최대, 최소 범위를 정수 단위로 나누기 때문에 실제 데이터의 분포를 정확히 나누기 힘들다. 따라서 본 발명에선 최적화 분류 방법을 사용하여 실제의 분포를 분류하는데 최적화된 방법인 네추럴 브레이크를 이용한 등급화를 통하여 점수를 부여하였다. 결과에 대한 예시로 도 8을 보면 grid 열은 수원시 100m 격자 데이터에서의 격자 이름에 해당하고 위해성, 취약성, 경감성은 식 1을 통해 계산된 결과에 해당한다. 계산된 위해성, 취약성, 경감성 값으로 식 2에 대입한 결과가 위험도 열에 해당한다.
등급화 열은 natural break를 통해 위험도를 등급화한 결과이다. 최종적으로 계산된 위해성, 취약성, 경감성, 위험도는 공간통계분석에 사용된다.
위와 같이 위험지도가 산출된 후에는 시공간 피해특성을 고려한 다종 데이터 융합분석 - 공간통계 분석(LISA 분석)이 이루어진다.
공간통계분석의 일종인 공간적 자기상관성 분석은 공간에 종속된 데이터가 공간적 특성에 따라 어떠한 성질을 보이는가를 정규화 하기 위한 방법이며, 대표적으로 Moran’s I가 있다. Moran‘s I와 같은 전체 연구지역의 공간자기상관관계를 하나의 값으로 보여주는 전역지수(global index)의 경우, 간단하게 전반적인 공간적 특성을 파악할 수 있지만, 연구지역이 상대적으로 넓을 때, 지역 안에서도 공간자기상관이 위치에 따라서 다를 수 있다.
이처럼 연구지역 내에서 발생할 수 있는 공간자기상관의 국지적 변이(local variations)를 고려한 시각적 지표가 국지공간자기상관지표(local indicators of spatial association, LISA)이다.
LISA를 이용하면 한 변수의 공간자기상관이 특정 지역에서 매우 높게 나타나는 '온열지점(hot spots)'을 찾을 수 있으며 LISA 중 하나인 Local Moran’s I는 아래의 식으로 계산된다.
Figure 112021143306341-pat00022
xi는 특성 i에 대한 속성,
Figure 112021143306341-pat00023
x는 해당 속성의 평균, wi,j는 i와 j사이의 공간적 가중치(이웃하면 1 아니면 0),
Figure 112021143306341-pat00024
은 표본 분산을 의미한다.
Local Moran’s I의 계산 후, 이것이 공간적, 통계적으로 의미가 있는 수치인지 검증하기 위해 Local Moran’s I에 대한 p-value와 z score를 이용할 수 있으며, HH(High-High), LL(Low-Low), HL(High-Low), LH(Low-High)와 같이 p-value와 수치에 따라 문자로 표현할 수 있다. 여기서 HH는 온열지점, LL은 냉열지점에 해당한다.
도 9는 본 발명에서의 공간 통계분석을 위해 국지공간자기상관지표(LISA)를 예시한 도표이고, 도 10은 본 발명에서의 공간 통계분석을 위해 국지공간자기상관 지표(LISA)에 대한 지정데이터의 시각화 예시도이다.
회귀모형분석을 통해 선택된 지표를 기반으로 100m, 500m, 1km 격자의 위해성, 취약성, 경감성, 위험도를 계산하였으며 이를 공간통계분석에 사용하였다. 특히 본 발명에서는 위해성, 취약성, 경감성 측면에서 공간적인 특성과 수치가 높은 통계적으로 유의미한 지역을 찾기 위하여 HH 지역을 파악하였다.
도 11은 본 발명에서의 공간통계분석 결과를 나타낸 예시도로서, 100m 간격의 격자구조에 대한 예시도이고, 도 12는 본 발명에서의 공간통계분석 결과를 나타낸 예시도로서, 500m 간격의 격자구조에 대한 예시도이고, 도 13은 본 발명에서의 공간통계분석 결과를 나타낸 예시도로서, 1km 간격의 격자구조에 대한 예시도이다.
위 그림들은 Local Moran’s I를 위해성, 취약성, 경감성, 위험도 지수에 적용한 결과를 시각화한 지도로서, 지도에 표시된 영역은 HH에 해당하는 지역으로 100m, 500m, 1km 격자 데이터 전부 비슷한 지역임을 알 수 있으며, 지표의 값이 공간적, 통계적으로 유의미한 군집을 이룬 영역과 위해성, 취약성, 경감성의 값이 군집을 이룬 영역을 비교하였을 때, 경감 노력이 필요할 것으로 보이는 위치를 파악할 수 있다.
위해성과 취약성의 경우, 인구수가 집중된 공간을 대부분 특정하였으며, 이는 지표의 특성을 잘 반영하는 타당한 군집을 이룬 것으로 확인할 수 있다. 경찰서, 병원, 소방서와 같은 시설에 대한 접근성으로 정의된 경감성의 경우 산악지역에선 낮은 값을, 도심지역에서는 높은 값을 가지며, HH의 분포 역시 대부분 도심지역에 있는 것을 확인하였다. 위험도의 경우 위해성과 비슷한 결과를 보였다.
또한, 각 격자들을 취합하여 확장된 셀에 대한 특성도 그림에 나타낼 수 있는데, 이는 도 12, 도 13과 같다.
이상 설명한 바와 같이 본 발명은, 재난상황관리를 위한 격자공간체계 데이터 관리 및 활용방안을 제시하고 지역별, 유형별 피해대상, 피해 규모와 같은 다종데이터를 활용한 융합분석기술을 개발하여 지도기반의 시각화로 최종 결과물을 도출함으로써, 격자 지도 위에서 종합적인 재난 현황을 직관적으로 파악할 수 있도록 하는 효과가 있다.
또한, 전 국토를 직각으로 교차하여 표현하는 격자 크기를 활용하여 행정구역기반의 상황관리와 격자 기반의 상황관리를 융합하여 실무에 적용하기 위한 것으로, 자자체 및 유관기관으로부터 수집된 다양한 데이터들을 지오코딩 작업을 통해 위치기반으로 변환하고, 기초 데이터는 연속수치지형도의 건물 레이어를 기초로 활용하여 다른 데이터와 융합 활용할 수 있도록 하며,
연구의 통계적 처리를 통해 상관분석, 회귀분석을 통한 다중밀집시설 화재의 주요 지표를 자동으로 선정하는 한편, 격자공간체계 기반의 공간자기상관성 분석을 통해 통계적으로 유의미한 위험지역을 용이하게 식별할 수 있도록 함으로써, 여러 공공기관들과의 정보 연계도 용이하도록 하는 효과도 있는 것이다.
본 발명의 기술적 사상은 바람직한 실시형태에서 구체적으로 기술되었으나, 상기한 실시형태는 그 설명을 위한 것이며, 그 제한을 위한 것이 아님을 주의하여야 한다. 본 발명의 기술사상 범위 내에서 다양한 변형 및 수정이 가능함은 당업자에게 명백한 것이며, 따라서 이러한 변형 및 수정이 첨부된 특허청구범위에 속함은 당연한 것이다.

Claims (16)

  1. 컴퓨터 내 다종 데이터 융합분석 프로그램에 의해 수행되며, 각 정보 제공원들로부터 재난 관련정보들이 제공되면, 지오코딩 작업을 통해 지도 위에 격자 변환된 상태로 모니터에 표시되도록 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법에 있어서,
    원시 재난 관련정보들을 지표 간의 상이한 범위를 동일하게 맞추기 위해 최소-최대 방법에 의해 데이터를 정규화하는 과정과;
    그 다음 정규화된 격자 데이터로 상관관계 분석을 하여 회귀모형분석에 사용할 수 있는 지표를 일차적으로 선택하는데, 여기서 VIF(variance inflation factors) 분석을 통해 분석값이 5 이하인 지표를 선택하도록 하는 상관관계 분석하는 과정과;
    이후 선택된 지표들로 회귀모형분석을 하여 종속변수에 대하여 통계적으로 유의미한 지표를 선택하는 회귀모형 분석하는 과정과;
    회귀모형분석을 통해 선택된 각 지표에 대한 가중치를 엔트로피 방법을 통해 계산하는 지표 가중치의 결정 과정과;
    상기 지표 가중치를 위험지도 계산에 적용하는 위험도 산출 과정과;
    최종적으로 산출된 위해성, 취약성, 경감성, 위험도에 대한 공간통계분석이 이뤄지는 공간통계 분석하는 과정으로 이루어지되,
    상기 위험도 산출 과정에서, 위험도를 산출하기 위한 각 지표의 점수는 아래식과 같이 계산되는 것을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
    Figure 112022014506510-pat00047

    (여기에서, N, M, S는 각각 위해성 지표 개수, 취약성 지표 개수, 경감성 지표 개수이고, α와 n은 각 지표에 대한 가중치를 의미함)
  2. 제 1항에 있어서,
    상기 데이터 정규화하는 과정에서, 최소-최대 방법은 지표의 최댓값과 최솟값을 이용하는 방법으로 최댓값 및 최솟값에 이상치가 존재할 경우, 해당 수치에 영향을 받아 왜곡된 결과가 나올 수 있기에 이상치에 해당하는 값을 최댓값으로 대체하는 방법인 것을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
  3. 제 1항에 있어서,
    상기 상관관계 분석하는 과정에서, 상관관계의 정도를 상관계수(-1~1)로 표시하며, 상관계수의 해석기준은 -1.0~-0.7의 경우 강한 음의 선형관계이고, -0.7~-0.3의 경우 뚜렷한 음의 선형관계이고, -0.3~-0.1의 경우 약한 음의 선형관계이고, -0.1~0.1의 경우 거의 무시될 수 있는 선형관계이고, 0.1~0.3의 경우 약한 양의 선형관계이고, 0.3~0.7의 경우 뚜렷한 양의 선형관계이고, 0.7~1.0의 경우 강한 양의 선형관계인 것을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
  4. 제 1항 또는 제 3항에 있어서,
    상기 상관관계 분석하는 과정에서, 두 변수의 관계가 선형적이고 직교 좌표계에 좌표상의 점들을 표시함으로써 확인 가능해야하고, 등분산성과, 정규분포성이 전제되어야하며, 연속형 변수를 다루기 위한 피어슨 상관분석을 사용하고, 해당 변수들을 회귀 분석에 사용하기 위한 통계적 유의성을 판단하기 위하여 VIF분석을 실시한 것을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
  5. 제 4항에 있어서,
    상기 VIF분석은 독립변수 간 다중공선성이 있는지 측정하는 척도에 해당하고, 상기 다중공선성은 독립변수 간에 강한 상관관계가 존재하는 경우를 의미하며, VIF 값이 1에 가까울수록 다중공선성이 작음을 의미하고 반대로 값이 커질수록 다중공성의 정도가 큼을 의미하고, 상기 VIF 값이 5 이상일 경우 해당 변수가 다중공선성이 있다고 판단하는 것을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
  6. 제 1항에 있어서,
    상기 회귀 모형 분석과정에서, 먼저 모형의 오차제곱합을 최소로 하는 최소제곱법(least squares met hod)에 의해 회귀계수를 추정하고,
    회귀모형에서의 독립변수마다 유의확률(p-value)을 확인하여 유의성 검정을 통한 최적 변수를 선택하기 위해 전진선택법, 후진소거법, 단계선택법 중에서 어느 한 방법을 사용하며,
    수정된 결정계수(adjusted R2) 또는 분산분석(F- statistic)에 의해 회귀모형의 적합도를 검정하는 것을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
  7. 제 6항에 있어서,
    상기 수정된 결정계수(adjusted R2)는 0 에서 1 사이의 값을 가지고, 1에 가까울수록 회귀모형이 해당현상을 잘 설명한 것으로 판단하며,
    분산분석(F- statistic)에서는 분산분석의 F값이 1보다 크고 유의 확률이 유의수준 0.05보다 작을 때 독립변수는 종속변수에 대하여 통계적으로 유의하다고 판단하는 것을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
  8. 제 6항에 있어서,
    상기 회귀모형은, 오차항이 정규분포를 따라야 하고, 오차항은 서로 독립이어야 하며, 오차항의 평균은 0이어야 하고, 오차항은 등분산을 구비함을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
  9. 제 6항에 있어서,
    모든 변수를 독립변수로 포함한 회귀분석을 수행한 이후 독립변수를 하나씩 소거해나가며 조합함으로써 Akaike Information Criterion(AIC)를 최소화하는 조합을 발견하는 방법인 후진소거법을 통해 유의확률이 유의수준보다 작아 통계적으로 유의한 변수를 선택한 것을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
  10. 제 1항에 있어서,
    상기 지표 가중치의 결정 과정에서, 위험지역의 평가 요소에 대한 가중치는 엔트로피 방법을 이용하여 결정하고 중첩분석을 통해 위험도를 산정하되, 엔트로피 가중치와 AHP의 가중치를 결합한 수정엔트로피를 사용하거나 엔트로피 가중치와 델파이 가중치를 사용하는 혼합 가중치 기법을 사용한 것을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
  11. 제 10항에 있어서,
    엔트로피를 이용한 계산과정은, 위해성, 취약성, 경감성에 따른 속성 정보를 이용하여 행렬을 구성하는 과정과;
    Figure 112021143306341-pat00025

    평가항목별 속성정보를 정규화하는 과정과;
    Figure 112021143306341-pat00026

    각각의 지표별 엔트로피를 계산하는 과정과;
    Figure 112021143306341-pat00027

    계산된 지표별 엔트로피의 다양성을 고려한 엔트로피 가중치를 산정하는 과정으로 된 것을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
    Figure 112021143306341-pat00028

  12. 삭제
  13. 제 1항에 있어서,
    상기 계산된 각 지표의 값은 아래식과 같이 위험도가 계산되는 것을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
    Figure 112022014506510-pat00030

    (여기에서, [등급화 적용]이란 계산된 위험도 값에 대한 1~10 사이의 등급에 따른 점수 부여를 의미함)
  14. 제 13항에 있어서,
    상기 위험도에 적용되는 등급화에서는, 최적화 분류 방법을 사용하여 실제의 분포를 분류하기에 최적화될 수 있도록 네추럴 브레이크를 이용한 등급화 방법을 사용함을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
  15. 제 1항에 있어서,
    상기 공간통계 분석하는 과정에서는, 공간에 종속된 데이터가 공간적 특성에 따라 어떠한 성질을 보이는가를 정규화하기 위해 Moran’s I가 사용되는데, 공간자기상관의 국지적 변이(local variations)를 고려한 시각적 지표인 Local Moran’s I는 아래의 식으로 계산된 것을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
    Figure 112021143306341-pat00031

    (여기에서, xi는 특성 i에 대한 속성,
    Figure 112021143306341-pat00032
    x는 해당 속성의 평균, wi,j는 i와 j사이의 공간적 가중치(이웃하면 1 아니면 0),
    Figure 112021143306341-pat00033
    은 표본 분산을 의미함)
  16. 제 15항에 있어서,
    상기 Local Moran’s I의 계산 후, 이것이 공간적, 통계적으로 의미가 있는 수치인지 검증하기 위해 Local Moran’s I에 대한 p-value와 z score를 이용한 것을 특징으로 하는 시공간 피해특성을 고려한 다종 데이터 융합 분석방법.
KR1020210176351A 2021-12-10 2021-12-10 시공간 피해특성을 고려한 다종 데이터 융합 분석방법 KR102379472B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210176351A KR102379472B1 (ko) 2021-12-10 2021-12-10 시공간 피해특성을 고려한 다종 데이터 융합 분석방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210176351A KR102379472B1 (ko) 2021-12-10 2021-12-10 시공간 피해특성을 고려한 다종 데이터 융합 분석방법

Publications (1)

Publication Number Publication Date
KR102379472B1 true KR102379472B1 (ko) 2022-03-29

Family

ID=80997426

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210176351A KR102379472B1 (ko) 2021-12-10 2021-12-10 시공간 피해특성을 고려한 다종 데이터 융합 분석방법

Country Status (1)

Country Link
KR (1) KR102379472B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114970956A (zh) * 2022-04-19 2022-08-30 北京理工大学 一种基于ols和qoic人口关联分析及预测方法
CN115146705A (zh) * 2022-05-27 2022-10-04 南京林业大学 遥感和地表雷击火环境相结合识别森林雷击火的方法
CN117195610A (zh) * 2023-11-08 2023-12-08 中国矿业大学(北京) 边坡监测预警方法、装置、电子设备及可读存储介质
CN117690572A (zh) * 2023-12-25 2024-03-12 南京天溯自动化控制系统有限公司 一种基于多元回归的ct使用时间风险预测方法、装置、设备及介质
CN118171120A (zh) * 2024-05-14 2024-06-11 临沂润恒信息科技有限公司 一种基于多元数据融合的国土测绘方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160099931A (ko) 2015-02-13 2016-08-23 대한민국(국민안전처 국립재난안전연구원장) 재난 위험 및 관심 지역에 대한 재난 예방 및 관리방법
KR20160133199A (ko) 2015-05-12 2016-11-22 대한민국(국민안전처 국립재난안전연구원장) 빅데이터 의미 기반 재난 감성분류방법
KR101982753B1 (ko) * 2017-12-12 2019-05-27 (주)위세아이텍 열차사고 위험도 예측 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160099931A (ko) 2015-02-13 2016-08-23 대한민국(국민안전처 국립재난안전연구원장) 재난 위험 및 관심 지역에 대한 재난 예방 및 관리방법
KR20160133199A (ko) 2015-05-12 2016-11-22 대한민국(국민안전처 국립재난안전연구원장) 빅데이터 의미 기반 재난 감성분류방법
KR101982753B1 (ko) * 2017-12-12 2019-05-27 (주)위세아이텍 열차사고 위험도 예측 장치 및 방법

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Byung-Ju Hwang et al.A study on grid-based spatial information utilization for typhoon response, Journal of the Society of Disaster Information, Vol. 17, No. 1, March 2021 (2021.03.31.) *
Richard R. Sharker, et. al., Investigating urban heat island through spatial analysis of New York City streetscapes, Journal of Cleaner Production 233 (2019) (2019.06.14) *
Richard R. Sharker, et. al., Investigating urban heat island through spatial analysis of New York City streetscapes, Journal of Cleaner Production 233 (2019) (2019.06.14)*
Test of Regression Model- Multicollinearity Test and Resolution, Naver Blog, (2017.03.25.) *
황병주 외 3인, 태풍대응을 위한 격자 기반 공간정보 활용방안 연구, Journal of the Society of Disaster Information, Vol. 17, No. 1, March 2021(2021.03.31.)*
회귀모형의 검정- 다중공선성의 검정과 해결, 네이버 블로그, (2017.03.25.)*

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114970956A (zh) * 2022-04-19 2022-08-30 北京理工大学 一种基于ols和qoic人口关联分析及预测方法
CN115146705A (zh) * 2022-05-27 2022-10-04 南京林业大学 遥感和地表雷击火环境相结合识别森林雷击火的方法
CN115146705B (zh) * 2022-05-27 2023-08-01 南京林业大学 遥感和地表雷击火环境相结合识别森林雷击火的方法
CN117195610A (zh) * 2023-11-08 2023-12-08 中国矿业大学(北京) 边坡监测预警方法、装置、电子设备及可读存储介质
CN117195610B (zh) * 2023-11-08 2024-01-26 中国矿业大学(北京) 边坡监测预警方法、装置、电子设备及可读存储介质
CN117690572A (zh) * 2023-12-25 2024-03-12 南京天溯自动化控制系统有限公司 一种基于多元回归的ct使用时间风险预测方法、装置、设备及介质
CN118171120A (zh) * 2024-05-14 2024-06-11 临沂润恒信息科技有限公司 一种基于多元数据融合的国土测绘方法及系统

Similar Documents

Publication Publication Date Title
KR102379472B1 (ko) 시공간 피해특성을 고려한 다종 데이터 융합 분석방법
AU2018101946A4 (en) Geographical multivariate flow data spatio-temporal autocorrelation analysis method based on cellular automaton
Mishra et al. Current trends in disaster management simulation modelling research
Sheu Dynamic relief-demand management for emergency logistics operations under large-scale disasters
Miles et al. ResilUS: A community based disaster resilience model
CN108280553A (zh) 基于gis-神经网络集成的山洪灾害风险区划及预测方法
CN107886235A (zh) 一种耦合确定性与不确定分析的火灾风险评估方法
CN109947806B (zh) 一种基于案例推理的超高层施工安全事故应急辅助决策方法
Ghajari et al. Urban vulnerability under various blast loading scenarios: Analysis using GIS-based multi-criteria decision analysis techniques
CN104346538A (zh) 基于三种灾情因子控制的地震灾害评估方法
CN110636066B (zh) 基于无监督生成推理的网络安全威胁态势评估方法
CN112508443B (zh) 一种电力行业现场作业风险管控系统
CN113505978A (zh) 一种不同形式城市社区的防灾功能评估方法和装置
Mohd Shamsuddin et al. Identifying of potential crime area using analytical hierachy process (AHP) and geographical information system (GIS)
CN116624226A (zh) 一种煤矿灾害数据采集、分析及可视化展现系统
KR102350252B1 (ko) 맵 라이브러리 데이터셋 구축 및 활용방법
Liu et al. Study on construction safety management in megaprojects from the perspective of resilient governance
CN114037283A (zh) 一种商业综合体的火灾动态风险评估方法
CN116703148B (zh) 基于云计算的矿山企业风险画像方法
CN117057601B (zh) 基于物联网的非煤矿山安全监测预警系统
Yang A study on the impact of corporate financial accounting management system on corporate innovation under sustainable development strategy
CN116644954B (zh) 抽蓄工程施工安全风险智能化决策方法
CN115829209A (zh) 基于碳路径的绿色智能仓库环保质量分析方法及装置
Alla et al. Seismic liquefaction analysis of MCDM weighted SPT data using support vector machine classification
CN113592311A (zh) 用于复杂人机系统选择人因方法的方法

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant