KR20140068436A - 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법 - Google Patents

시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법 Download PDF

Info

Publication number
KR20140068436A
KR20140068436A KR1020120135925A KR20120135925A KR20140068436A KR 20140068436 A KR20140068436 A KR 20140068436A KR 1020120135925 A KR1020120135925 A KR 1020120135925A KR 20120135925 A KR20120135925 A KR 20120135925A KR 20140068436 A KR20140068436 A KR 20140068436A
Authority
KR
South Korea
Prior art keywords
function
data
prediction
observation data
model
Prior art date
Application number
KR1020120135925A
Other languages
English (en)
Other versions
KR101463425B1 (ko
Inventor
윤희성
하규철
김용철
Original Assignee
한국지질자원연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국지질자원연구원 filed Critical 한국지질자원연구원
Priority to KR1020120135925A priority Critical patent/KR101463425B1/ko
Publication of KR20140068436A publication Critical patent/KR20140068436A/ko
Application granted granted Critical
Publication of KR101463425B1 publication Critical patent/KR101463425B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Algebra (AREA)
  • Marketing (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법에 관한 것으로, 보다 상세하게는 과거의 관측자료들을 이용하여 예측된 결과에 기초하여 이상관측자료를 판별할 수 있도록 한 것이다.
특히, 본 발명은 지지벡터기계(Support Vector Machine, SVM)알고리즘을 이용하여, 과거에 측정된 관측자료에 의한 예측결과와 과거의 예측자료에 의한 예측결과를 비교함으로써, 실시간으로 이상관측자료를 판별할 수 있다.
구체적으로, 지하수위의 자연적인 변화에 영향을 주는 강우 등의 기상 자료와 지하수위 관측 자료를 이용하여, 지하수위 예측 시계열 모델을 만들고 이를 이용함으로써, 지하수위에 대한 이상관측자료의 탐지능력을 크게 향상시킬 수 있다.
따라서, 수자원 관리 분야, 특히 지하수 관리 분야는 물론, 다양한 기후 변화와 연관된 자연자원의 관리 분야 및 이와 연관 내지 유사한 분야에서 신뢰성 및 경쟁력을 향상시킬 수 있다.

Description

시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법{Abnormality observation data detection method using time series prediction model and abnormality observation data of ground water level}
본 발명은 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법에 관한 것으로서, 보다 상세하게는 과거의 관측자료들을 이용하여 예측된 결과에 기초하여 이상관측자료를 판별할 수 있도록 한 것이다.
특히, 본 발명은 지지벡터기계(Support Vector Machine, SVM)알고리즘을 이용하여, 과거에 측정된 관측자료에 의한 예측결과와 과거의 예측자료에 의한 예측결과를 비교함으로써, 이상관측자료를 판별할 수 있는 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법에 관한 것이다.
기후변화는 오늘날 가장 심각한 환경문제의 하나로, 그 규모가 전 지구적으로 광범위하게 일어나고 있으며, 우리나라에도 여러 분야에서 그 징후가 나타나고 있을 뿐만 아니라, 이에 따른 영향이 사회전반에 걸쳐 나타나고 있다.
또한, 기후변화는 홍수, 가뭄, 태풍 등의 기상변화 및 생태계의 변화와 연관되어 있으며, 이러한 기후변화에 대응하기 위해서는, 기후변화의 영향에 따른 평가가 분야별로 요구되며, 이를 위해서는 자료의 신뢰성 확보가 가장 중요하다고 할 수 있다.
특히, 우리의 생활과 가장 밀접한 수자원은, 기후변화뿐만 아니라 산업구조의 급격한 변화와 인구증가에 따른 용수수요의 증가 및 생태환경에 대한 인식변화 등으로 인하여, 지표수 이용에 많은 한계를 보이고 있으며, 이에 따른 대체 수자원으로서 지하수의 역할이 증대되고 있다.
그러나, 지하수의 개발과 이용에 대한 체계적인 관리가 이루어지지 않을 경우, 지하수를 포함하는 수자원에 대한 정확한 파악이 어렵고, 무분별한 지하수의 개발 등으로 인하여, 지하수의 고갈 등과 같은 관리적인 문제를 유발하고 있다.
한편, 유무선 통신망을 이용한 원격관리시스템 및 자동관측(계측)기술이 발전하면서, 국가지하수관측망, 보조지하수관측망, 해수침투관측망 등 지하수 실시간 관측 시스템들이 구축되고 있다.
그러나, 전자소자와 프로그램을 이용한 장치 및 시스템에서는, 하드웨어의 이상이나 소프트웨어의 연산오류 등이 발생할 수 있으며, 이로 인해 관측(계측)자료에 오류가 발생할 수 있다.
따라서, 관측자료의 신뢰성 확보 및 이를 통한 효율적인 관측망 운영과 지하수자원의 지속가능한 활용을 위해서는, 관측자료에 대한 실시간 이상관측자료 탐지방법이나 오류확인방법 등이 요구되고 있다.
이러한 방법 중 하나로는, 실제 관측된 자료와 과거 관측자료 통계값의 비교를 통해서 이상자료를 탐지할 수 있겠으나, 이러한 방법은 해당 지역 지하수위의 자연적인 변화 양상을 고려하기 힘들다는 점에서 제한적이라 할 수 있다.
하기의 종래 특허문헌에서도, 해당 지역 지하수위의 자연적인 변화 양상을 고려하여 이상자료를 실시간으로 탐지함으로써, 충분한 신뢰성을 보장할 수 있는 관측자료를 제공하는 방법에 대해서는 나타나 있지 않다.
대한민국 등록특허공보 제10-1013182호 "지하수의 수위 변화를 이용한 지하수 양수량 산출방법, 수위측정센서 및 양수량 산출방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체"
상기와 같은 문제점을 해결하기 위해서, 본 발명은 지하수위의 자연적인 변화에 영향을 주는 강우 등의 기상 자료와 지하수위 관측 자료를 이용하여 지하수위 예측 시계열 모델을 만들고 이를 활용하여 이상 관측 자료를 탐지할 수 있는 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법을 제공하는데 목적이 있다.
다시 말해, 예측대상에 대하여 과거의 관측자료들을 이용하여 예측된 결과에 의해 이상관측자료를 판별할 수 있도록 한 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법을 제공하는데 목적이 있다.
특히, 본 발명은 지지벡터기계(Support Vector Machine, SVM)알고리즘을 이용하여, 과거에 측정된 관측자료에 의한 예측결과와 과거의 예측자료에 의한 예측결과를 비교함으로써, 이상관측자료를 판별에 대한 신뢰성을 향상시킬 수 있는 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법을 제공하는데 목적이 있다.
상기와 같은 목적을 달성하기 위해서, 본 발명에 따른 시계열 예측 모델을 이용한 이상관측자료 탐지 방법은, 예측대상의 과거 관측데이터들 중 시계열 예측모델 설정을 위한 데이터를 추출하는 관측자료군 선정단계; 상기 관측자료군에 기초하여 SVM(Support Vector Machine)기반의 모델함수를 생성하는 모델함수 생성단계; 상기 모델함수를 이용하여 현재 관측데이터에 따른 상기 예측대상의 변화를 예측하는 예측데이터 산출단계; 및 상기 예측데이터에 기초하여 이상관측데이터를 확인하는 이상자료 판별단계를 포함한다.
또한, 상기 모델함수 생성단계는, SVM기반의 시계열 예측을 위한 모델의 구조를 설정하는 구조설정단계; 및 상기 SVM기반의 예측함수를 설정하고 최적화하는 최적화예측함수 생성단계를 포함하고, 상기 최적화예측함수에 의해 상기 모델함수를 생성할 수 있다.
또한, 상기 구조설정단계는, 상기 현재 관측데이터에 따른 입력벡터(Input vector); 상기 관측자료군에서 추출되는 지지벡터(SV, Support vector); 상기 입력벡터 및 지지벡터를 고차원 변환하는 차원변환함수; 및 상기 커널함수를 이용하여 예측데이터를 산출하는 출력함수(Output)를 포함하여, 상기 모델의 구조를 설정할 수 있다.
또한, 상기 최적화예측함수 생성단계는, 상기 SVM기반의 예측함수를 설정하는 단계; 상기 예측함수를 계산하기 위한 목적함수를 설정하는 단계; 및 상기 목적함수에 최적화 조건을 설정하여 상기 최적화예측함수로 변환하는 단계를 포함할 수 있다.
또한, 상기 예측데이터 산출단계는, 상기 모델함수에 과거의 관측데이터 및 현재의 관측데이터를 적용하여 예측된 실측기반 예측데이터; 및 상기 모델함수에 과거의 예측데이터 및 현재의 관측데이터를 적용하여 예측된 예측기반 예측데이터 중 적어도 하나를 산출할 수 있다.
또한, 상기 이상자료 판별단계는, 상기 실측기반예측데이터 및 예측기반예측데이터를 비교하고, 두 예측데이터의 차이값에 기초하여 이상관측데이터를 판별할 수 있다.
또한, 본 발명에 따른 지하수위의 이상관측자료 탐지 방법은, 예측대상인 지하수위 및 상기 지하수위에 영향을 미치는 강우량을 포함하는 영향인자의 과거 관측데이터들 중 이상관측이 발생하지 않은 자료군을 추출하는 관측자료군 선정단계; 상기 관측자료군에 기초하여 SVM(Support Vector Machine)기반으로, 과거의 관측데이터를 이용하여 예측을 수행하는 실측기반모델함수 및 과거의 예측데이터를 이용하여 예측을 수행하는 예측기반모델함수를 생성하는 모델함수 생성단계; 상기 실측기반모델함수 및 예측기반모델함수 각각에 대하여, 현재 관측데이터에 따른 상기 지하수위의 변화를 예측하는 예측데이터 산출단계; 및 상기 실측기반모델함수의 예측데이터 및 상기 예측기반모델함수의 예측데이터를 비교하고, 두 예측데이터의 차이값이 이상판단기준값보다 큰 경우, 해당 데이터를 이상관측데이터로 결정하는 이상자료 판별단계를 포함한다.
또한, 상기 모델함수 생성단계는, SVM기반의 시계열 예측을 위한 모델의 구조를 설정하는 구조설정단계; 및 SMO(Sequential Minimal Optimization)알고리즘으로 예측함수를 설정하고 최적화하는 최적화예측함수 생성단계를 포함하고, 상기 최적화예측함수에 의해 상기 모델함수를 생성할 수 있다.
또한, 상기 구조설정단계는, 상기 현재 관측데이터에 따른 입력벡터(Input vector); 상기 관측자료군에서 추출되는 지지벡터(SV, Support vector); 상기 입력벡터 및 지지벡터를 커널트릭(Kernel trick)으로 고차원 변환하는 커널함수(Kernel function); 및 상기 커널함수를 이용하여 예측데이터를 산출하는 출력함수(Output)를 포함하여, 상기 모델의 구조를 설정할 수 있다.
또한, 상기 커널함수는, 가우시안(Gaussian) 형태의 "radial basis kernel" 함수를 포함할 수 있다.
또한, 상기 최적화예측함수 생성단계는, 상기 SVM기반의 예측함수를 상기 SMO알고리즘으로 설정하는 단계; 상기 예측함수를 계산하기 위한 목적함수를 설정하는 단계; 및 상기 목적함수에 최적화 조건을 설정하여 상기 최적화예측함수로 변환하는 단계를 포함할 수 있다.
또한, 상기 최적화예측함수 생성단계는, 상기 목적함수를 계산하기 위하여 라그랑제 승수(Lagrangian multiplier)를 이용한 안장점(Saddle point) 문제를 적용할 수 있다.
상기와 같은 해결수단에 의해, 본 발명은 예측대상에 대하여 과거의 관측자료들을 이용하여 예측된 결과에 의해 이상관측자료를 실시간으로 정확하게 판별할 수 있는 장점이 있다.
특히, 예측대상과 더불어 예측대상에 영향을 미치는 영향인자에 대한 예측을 병행하여 처리함으로써, 실시간 이상관측자료의 판별에 대한 신뢰성을 크게 향상시킬 수 있는 장점이 있다.
구체적으로, 지하수위의 자연적인 변화에 영향을 주는 강우 등의 기상 자료와 지하수위 관측 자료를 이용하여, 지하수위 예측 시계열 모델을 만들고 이를 이용함으로써, 지하수위에 대한 이상관측자료의 탐지능력을 크게 향상시킬 수 있는 효과가 있다.
따라서, 수자원 관리 분야, 특히 지하수 관리 분야는 물론, 다양한 기후 변화와 연관된 자연자원의 관리 분야 및 이와 연관 내지 유사한 분야에서 신뢰성 및 경쟁력을 향상시킬 수 있다.
도 1은 본 발명에 의한 시계열 예측 모델을 이용한 이상관측자료 탐지 방법을 설명하기 위한 흐름도이다.
도 2는 본 발명에 의한 지하수위의 이상관측자료 탐지 방법을 설명하기 위한 흐름도이다.
도 3은 본 발명에 의한 이상관측자료 탐지 방법의 개념을 설명하기 위한 도면이다.
도 4는 본 발명에 의한 예측모델의 구조를 설명하기 위한 개념도이다.
도 5는 도 2의 과정을 적용하기 위한 강우량 및 지하수위의 관측데이터를 나타낸 그래프이다.
도 6은 도 2에 나타난 실측기반모델함수에 의해 예측된 결과를 나타낸 그래프이다.
도 7은 도 2에 나타난 예측기반모델함수에 의해 예측된 결과를 나타낸 그래프이다.
도 8은 도 2에 나타난 실측기반모델함수 및 예측기반모델함수의 차이를 나타낸 그래프이다.
본 발명에 따른 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법에 대한 예는 다양하게 적용할 수 있으며, 이하에서는 첨부된 도면을 참조하여 가장 바람직한 실시 예에 대해 설명하기로 한다.
도 1은 본 발명에 의한 시계열 예측 모델을 이용한 이상관측자료 탐지 방법을 설명하기 위한 흐름도이다.
도 1을 참조하면, 시계열 예측 모델을 이용한 이상관측자료 탐지 방법은, 예측대상의 과거 관측데이터들 중 시계열 예측모델 설정을 위한 데이터를 추출하는 관측자료군 선정한다(단계 S100). 여기서, 추출되는 관측자료군은, 과거 관측데이터들 중 이상 관측값이 발생하지 않았다고 판단되는 자료군으로 선정함이 바람직하다.
관측자료군이 선정되면, 해당 관측자료군에 기초하여 SVM(Support Vector Machine)기반의 모델함수를 생성한다(단계 S200).
모델함수의 생성 과정을 살펴보면, SVM기반의 시계열 예측을 위한 모델의 기본적인 구조를 설정한 후, SVM기반의 예측함수를 설정하고 최적화하여 최적화예측함수를 생성할 수 있으며, 생성된 최적화예측함수에 의해 상기 모델함수를 생성할 수 있다.
또한, 시계열 예측을 위한 모델의 기본적인 구조는, 현재 관측데이터에 따른 입력벡터(Input vector) 및 관측자료군에서 추출되는 지지벡터(SV, Support vector)와, 입력벡터 및 지지벡터를 고차원 변환하는 차원변환함수, 그리고 차원변환함수를 이용하여 예측데이터를 산출하는 출력함수(Output)를 포함하여 구성될 수 있다.
또한, 최적화예측함수는, SVM기반의 예측함수를 설정하고, 예측함수를 계산하기 위한 목적함수를 설정한 후, 목적함수에 최적화 조건을 설정하여 변환하는 과정을 통해 생성될 수 있다.
모델함수가 생성되면, 생성된 모델함수를 이용하여 현재 관측데이터에 따른 예측대상의 변화를 예측하고 예측데이터를 산출한다(단계 S300). 예를 들어, 예측데이터는 과거의 관측데이터 및 현재의 관측데이터를 적용하여 예측된 실측기반 예측데이터 및 과거의 예측데이터 및 현재의 관측데이터를 적용하여 예측된 예측기반 예측데이터를 포함할 수 있다.
실측기반 예측데이터 및 예측기반 예측데이터를 포함하는 예측데이터가 산출되면, 산출된 예측데이터에 기초하여 이상관측데이터를 확인(판별)한다(단계 S400). 예를 들어, 이상관측데이터의 판별은 실측기반 예측데이터 및 예측기반 예측데이터를 비교하고, 두 예측데이터의 차이가 큰 경우를 이상관측데이터로 판단할 수 있다.
이상에서 설명된 도 1의 이상관측자료 탐지 방법은 다양한 자연자원에 대하여 적용이 가능하며, 이하에서는 수자원, 특히 지하수에 적용한 경우에 대하여 살펴보기로 한다.
도 2는 본 발명에 의한 지하수위의 이상관측자료 탐지 방법을 설명하기 위한 흐름도이다. 이하에서, 도 3 내지 도 8을 참조하여 도 2의 구체적인 일 실시예를 살펴보기로 한다.
도 2 및 도 3를 참조하면, 예측대상인 지하수위 및 지하수위에 영향을 미치는 강우량을 포함하는 영향인자의 과거 관측데이터(t-1 시점 이전의 데이터)들 중 이상관측이 발생하지 않은 자료군(t-k 내지 t-k-τ)을 추출하여 관측자료군으로 선정한다(단계 S110). 예를 들어, 도 5에 나타난 바와 같이 2000년부터 2001년의 관측데이터를 자료군으로 추출할 수 있다.
그리고, 선정된 관측자료군에 기초하여 SVM(Support Vector Machine)기반으로, 과거의 관측데이터를 이용하여 예측을 수행하는 실측기반모델함수(모델A) 및 과거의 예측데이터를 이용하여 예측을 수행하는 예측기반모델함수(모델B)를 생성한다(단계 S120).
이때, 예측모델은 수학식 1 및 수학식 2와 같이 나타낼 수 있다.
(수학식 1)
Figure pat00001
(수학식2)
Figure pat00002
여기서, x는 강우 등의 기상요소(설명변수), y는 지하수위(종속변수), fA는 모델A 함수, fB는 모델B 함수, a는 설명변수의 지연시간, b는 종속변수의 지연시간이다.
이후, 수학식 1의 실측기반모델함수 및 수학식 2의 예측기반모델함수 각각에 대하여, 도 5에 나타난 바와 같이 2002년부터 2004년의 자료에 적용하여, 현재 관측데이터(도 3에서 t+1 시점의 데이터)에 따른 지하수위의 변화를 예측한다(단계 S130).
예측결과에 따라 도 6에 나타난 바와 같이 실측기반모델함수의 예측데이터 및 도 7에 나타난 예측기반모델함수의 예측데이터를 비교하고, 도 8에 나타난 두 예측데이터의 차이값이 이상판단기준값보다 큰 경우(도 8에서 점선부분), 해당 데이터를 이상관측데이터로 결정한다(단계 S140).
이하에서 시계열 모델 개발(생성) 방법에 대해 보다 구체적으로 살펴보기로 한다.
본 발명은 지지벡터기계(Support Vector Machine; SVM)알고리즘에 의해 시계열 모델을 생성할 수 있다.
먼저, SVM알고리즘을 살펴보면, SVM은 ANN(Artifitial Neural Network)등의 일반적인 학습 모델들이 지닌 경험적 위험 최소화 원리(Empirical Risk Minimization; ERM)가 아닌, 구조적인 위험 최소화 원리(Structural Risk Minimization; SRM)에 의한 것으로, 일반적인 학습방법보다 높은 일반화 성능을 보여줄 수 있다.
자료의 분류의 측면에서 살펴보면, ANN을 포함한 기존의 방법들은 학습 자료에 의한 분류 오류율을 최소화하는 목적으로 설계되지만, SVM은 분류될 자료 군들 사이에 존재하는 여백(Margin)을 최대화시키는 방향으로 설계됨으로써, 모델의 일반화 능력을 극대화시킬 수 있다.
SVM의 전체 구조는 도 4에 나타난 바와 같다.
도 4를 참조하면, SVM은 ANN과 비슷한 모습을 보이지만 그 원리는 상이하다. ANN의 구조가 입·출력 벡터가 가지는 성분들을 노드로 설정하고 해당 노드에 주어진 자료들이 들어오게 되어있는 구조인 반면, SVM은 훈련에 이용될 입·출력 벡터들 중 모델을 ‘지지’하기에 적합한 벡터들이 선정되어 모델을 구성하게 된다. 이와 같이 선정된 벡터들을 지지벡터(Support Vector; SV)라 한다.
선정된 SV로 구성된 SVM에 새로운 입력벡터(Input vector)가 들어오게 되면 지지벡터(SV)와의 계산을 통해 새로운 출력값을 예측하게 된다.
이 과정에서 커널함수의 전이에 의해 SV와 입력 벡터는 보다 높은 차원으로 이동하게 되고, 이렇게 높여진 차원 내에서 비선형적인 부분이 보다 간편하게 계산될 수 있으며, 이러한 방법을 커널 트릭(Kernel trick)이라 한다.
본 발명에서는, 커널함수로 수학식 3과 같이 가우시안(Gaussian) 형태의 "radial basis kernel" 함수를 이용할 수 있다.
(수학식 3)
Figure pat00003
한편, SVM은 뛰어난 학습 및 일반화 능력을 지니고 있지만, SVM의 해는 2차규모의 Quadratic Programing을 풀이함으로써 얻어지기 때문에, 학습 데이터 수가 늘어남에 따라 학습에 필요한 시간이 기하급수적으로 늘어나는 단점을 가지고 있다.
본 발명에서는, 이러한 문제점을 해결하기 위하여, 순차적 최소규모 최적화(Sequential Minimal Optimization; SMO) 알고리즘을 이용함으로써, 계산해야 될 2차규모의 파라미터를 2개로 최소화시켜 이의 해석해를 계속적으로 구해가는 방법으로 SVM의 계산속도 향상시킬 수 있다. 이를 통해 실시간처리가 가능해질 수 있다.
SVM에 의한 예측함수는 수학식 4와 같이 나타낼 수 있으며, 예측함수를 구하기 위한 목적함수는 수학식 5와 같이 나타낼 수 있다.
(수학식 4)
Figure pat00004
(수학식 5)
Figure pat00005
여기서, w는 연결강도 벡터, b는 편중 정도, φ는 비선형 전이함수이며, 비선형 전이함수 φ는 이하에서 커널함수 K로 표현될 수 있다.
ξ는 특정 손실함수를 통해 훈련 과정에서의 오차에 대해 벌칙을 주는 파라미터, ε는 오차 허용률, C는 최적화 문제에 경험 오차의 정도를 제공하는 길항 파라미터이다.
수학식 5에서, 라그랑제 승수(Lagrangian multiplier)를 이용한 안장점(Saddle point) 문제를 통해 풀이한다.
라그랑제 승수 (α, η)를 이용하여 수학식 5를 수학식 6과 같이 변환할 수 있다.
(수학식 6)
Figure pat00006
또한, 수학식 6은 수학식 7의 최적화 조건을 만족시킴으로써, 수학식 8과 같이 풀이될 수 있다.
(수학식 7)
Figure pat00007
(수학식 8)
Figure pat00008
SMO에서는
Figure pat00009
라 하고 수학식 8를 β에 대한 2차 함수 문제로 만들어서, β의 다양한 구간에 대해 최소값의 해석해를 반복적으로 구함으로써, SV와 그 연결강도를 결정하여 SVM 예측함수를 제공할 수 있다.
따라서, 예측대상인 지하수위에 대하여, 과거의 관측자료들을 이용하여 예측된 결과에 의해 이상관측자료를 실시간으로 정확하게 판별할 수 있다.
이상에서 본 발명에 의한 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법에 대하여 설명하였다. 이러한 본 발명의 기술적 구성은 본 발명이 속하는 기술분야의 당업자가 본 발명의 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다.
그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 한정적인 것이 아닌 것으로서 이해되어야 하고, 본 발명의 범위는 전술한 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지는 것이므로, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (12)

  1. 예측대상의 과거 관측데이터들 중 시계열 예측모델 설정을 위한 데이터를 추출하는 관측자료군 선정단계;
    상기 관측자료군에 기초하여 SVM(Support Vector Machine)기반의 모델함수를 생성하는 모델함수 생성단계;
    상기 모델함수를 이용하여 현재 관측데이터에 따른 상기 예측대상의 변화를 예측하는 예측데이터 산출단계; 및
    상기 예측데이터에 기초하여 이상관측데이터를 확인하는 이상자료 판별단계를 포함하는 시계열 예측 모델을 이용한 이상관측자료 탐지 방법.
  2. 제 1항에 있어서,
    상기 모델함수 생성단계는,
    SVM기반의 시계열 예측을 위한 모델의 구조를 설정하는 구조설정단계; 및
    상기 SVM기반의 예측함수를 설정하고 최적화하는 최적화예측함수 생성단계를 포함하고,
    상기 최적화예측함수에 의해 상기 모델함수를 생성하는 것을 특징으로 하는 시계열 예측 모델을 이용한 이상관측자료 탐지 방법.
  3. 제 2항에 있어서,
    상기 구조설정단계는,
    상기 현재 관측데이터에 따른 입력벡터(Input vector);
    상기 관측자료군에서 추출되는 지지벡터(SV, Support vector);
    상기 입력벡터 및 지지벡터를 고차원 변환하는 차원변환함수; 및
    상기 차원변환함수를 이용하여 예측데이터를 산출하는 출력함수(Output)를 포함하여, 상기 모델의 구조를 설정하는 것을 특징으로 하는 시계열 예측 모델을 이용한 이상관측자료 탐지 방법.
  4. 제 2항에 있어서,
    상기 최적화예측함수 생성단계는,
    상기 SVM기반의 예측함수를 설정하는 단계;
    상기 예측함수를 계산하기 위한 목적함수를 설정하는 단계; 및
    상기 목적함수에 최적화 조건을 설정하여 상기 최적화예측함수로 변환하는 단계를 포함하는 것을 특징으로 하는 시계열 예측 모델을 이용한 이상관측자료 탐지 방법.
  5. 제 1항 내지 제 4항 중 어느 한 항에 있어서,
    상기 예측데이터 산출단계는,
    상기 모델함수에 과거의 관측데이터 및 현재의 관측데이터를 적용하여 예측된 실측기반 예측데이터; 및
    상기 모델함수에 과거의 예측데이터 및 현재의 관측데이터를 적용하여 예측된 예측기반 예측데이터 중 적어도 하나를 산출하는 것을 특징으로 하는 시계열 예측 모델을 이용한 이상관측자료 탐지 방법.
  6. 제 5항에 있어서,
    상기 이상자료 판별단계는,
    상기 실측기반 예측데이터 및 예측기반 예측데이터를 비교하고, 두 예측데이터의 차이값에 기초하여 이상관측데이터를 판별하는 것을 특징으로 하는 시계열 예측 모델을 이용한 이상관측자료 탐지 방법.
  7. 예측대상인 지하수위 및 상기 지하수위에 영향을 미치는 강우량을 포함하는 영향인자의 과거 관측데이터들 중 이상관측이 발생하지 않은 자료군을 추출하는 관측자료군 선정단계;
    상기 관측자료군에 기초하여 SVM(Support Vector Machine)기반으로, 과거의 관측데이터를 이용하여 예측을 수행하는 실측기반모델함수 및 과거의 예측데이터를 이용하여 예측을 수행하는 예측기반모델함수를 생성하는 모델함수 생성단계;
    상기 실측기반모델함수 및 예측기반모델함수 각각에 대하여, 현재 관측데이터에 따른 상기 지하수위의 변화를 예측하는 예측데이터 산출단계; 및
    상기 실측기반모델함수의 예측데이터 및 상기 예측기반모델함수의 예측데이터를 비교하고, 두 예측데이터의 차이값이 이상판단기준값보다 큰 경우, 해당 데이터를 이상관측데이터로 결정하는 이상자료 판별단계를 포함하는 지하수위의 이상관측자료 탐지 방법.
  8. 제 7항에 있어서,
    상기 모델함수 생성단계는,
    SVM기반의 시계열 예측을 위한 모델의 구조를 설정하는 구조설정단계; 및
    SMO(Sequential Minimal Optimization)알고리즘으로 예측함수를 설정하고 최적화하는 최적화예측함수 생성단계를 포함하고,
    상기 최적화예측함수에 의해 상기 모델함수를 생성하는 것을 특징으로 하는 지하수위의 이상관측자료 탐지 방법.
  9. 제 8항에 있어서,
    상기 구조설정단계는,
    상기 현재 관측데이터에 따른 입력벡터(Input vector);
    상기 관측자료군에서 추출되는 지지벡터(SV, Support vector);
    상기 입력벡터 및 지지벡터를 커널트릭(Kernel trick)으로 고차원 변환하는 커널함수(Kernel function); 및
    상기 커널함수를 이용하여 예측데이터를 산출하는 출력함수(Output)를 포함하여, 상기 모델의 구조를 설정하는 것을 특징으로 하는 지하수위의 이상관측자료 탐지 방법.
  10. 제 9항에 있어서,
    상기 커널함수는,
    가우시안(Gaussian) 형태의 "radial basis kernel" 함수를 포함하는 것을 특징으로 하는 지하수위의 이상관측자료 탐지 방법
  11. 제 8항에 있어서,
    상기 최적화예측함수 생성단계는,
    상기 SVM기반의 예측함수를 상기 SMO알고리즘으로 설정하는 단계;
    상기 예측함수를 계산하기 위한 목적함수를 설정하는 단계; 및
    상기 목적함수에 최적화 조건을 설정하여 상기 최적화예측함수로 변환하는 단계를 포함하는 것을 특징으로 하는 지하수위의 이상관측자료 탐지 방법.
  12. 제 11항에 있어서,
    상기 최적화예측함수 생성단계는,
    상기 목적함수를 계산하기 위하여 라그랑제 승수(Lagrangian multiplier)를 이용한 안장점(Saddle point) 문제를 적용하는 것을 특징으로 하는 지하수위의 이상관측자료 탐지 방법.
KR1020120135925A 2012-11-28 2012-11-28 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법 KR101463425B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120135925A KR101463425B1 (ko) 2012-11-28 2012-11-28 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120135925A KR101463425B1 (ko) 2012-11-28 2012-11-28 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법

Publications (2)

Publication Number Publication Date
KR20140068436A true KR20140068436A (ko) 2014-06-09
KR101463425B1 KR101463425B1 (ko) 2014-11-20

Family

ID=51124175

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120135925A KR101463425B1 (ko) 2012-11-28 2012-11-28 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법

Country Status (1)

Country Link
KR (1) KR101463425B1 (ko)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190033393A (ko) * 2017-09-21 2019-03-29 한림대학교 산학협력단 경제학 그래프를 작성하는 방법 및 장치
CN111125197A (zh) * 2019-12-27 2020-05-08 成都康赛信息技术有限公司 基于mic和mp的数据集异常数据处理方法
CN111310981A (zh) * 2020-01-20 2020-06-19 浙江工业大学 一种基于时间序列的水库水位趋势预测方法
CN111652424A (zh) * 2020-05-28 2020-09-11 国网甘肃省电力公司经济技术研究院 一种氢负荷预测方法
KR20210017342A (ko) * 2019-08-08 2021-02-17 한국전자통신연구원 과거 데이터에 기초한 시계열 예측 방법 및 장치
CN114492168A (zh) * 2021-12-28 2022-05-13 大唐水电科学技术研究院有限公司 一种动系统下大坝安全监测数据粗差识别方法
KR102473709B1 (ko) * 2021-11-19 2022-12-02 (주)해양정보기술 수위 관측 데이터 기반 지진해일 검출 방법 및 시스템
KR20230093915A (ko) * 2021-12-20 2023-06-27 경북대학교 산학협력단 딥러닝 기반 지하수위 정상 범위 확률론적 예측 장치 및 그 방법
CN116681180A (zh) * 2023-06-19 2023-09-01 中国水利水电科学研究院 一种基于两层相似性度量的湖泊水位相似预报方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102494889B1 (ko) * 2021-01-20 2023-02-06 주식회사 동녘 기상 관측 환경 분류 방법 및 이를 수행하기 위한 컴퓨팅 장치
KR102614096B1 (ko) 2022-08-10 2023-12-15 경북대학교 산학협력단 예측 모델 생성 장치 및 방법

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190033393A (ko) * 2017-09-21 2019-03-29 한림대학교 산학협력단 경제학 그래프를 작성하는 방법 및 장치
KR20210017342A (ko) * 2019-08-08 2021-02-17 한국전자통신연구원 과거 데이터에 기초한 시계열 예측 방법 및 장치
CN111125197A (zh) * 2019-12-27 2020-05-08 成都康赛信息技术有限公司 基于mic和mp的数据集异常数据处理方法
CN111310981A (zh) * 2020-01-20 2020-06-19 浙江工业大学 一种基于时间序列的水库水位趋势预测方法
CN111310981B (zh) * 2020-01-20 2022-07-19 浙江工业大学 一种基于时间序列的水库水位趋势预测方法
CN111652424B (zh) * 2020-05-28 2022-06-10 国网甘肃省电力公司经济技术研究院 一种氢负荷预测方法
CN111652424A (zh) * 2020-05-28 2020-09-11 国网甘肃省电力公司经济技术研究院 一种氢负荷预测方法
KR102473709B1 (ko) * 2021-11-19 2022-12-02 (주)해양정보기술 수위 관측 데이터 기반 지진해일 검출 방법 및 시스템
KR20230093915A (ko) * 2021-12-20 2023-06-27 경북대학교 산학협력단 딥러닝 기반 지하수위 정상 범위 확률론적 예측 장치 및 그 방법
CN114492168A (zh) * 2021-12-28 2022-05-13 大唐水电科学技术研究院有限公司 一种动系统下大坝安全监测数据粗差识别方法
CN114492168B (zh) * 2021-12-28 2024-05-10 大唐水电科学技术研究院有限公司 一种动系统下大坝安全监测数据粗差识别方法
CN116681180A (zh) * 2023-06-19 2023-09-01 中国水利水电科学研究院 一种基于两层相似性度量的湖泊水位相似预报方法
CN116681180B (zh) * 2023-06-19 2024-01-26 中国水利水电科学研究院 一种基于两层相似性度量的湖泊水位相似预报方法

Also Published As

Publication number Publication date
KR101463425B1 (ko) 2014-11-20

Similar Documents

Publication Publication Date Title
KR101463425B1 (ko) 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법
Chacon-Hurtado et al. Rainfall and streamflow sensor network design: a review of applications, classification, and a proposed framework
Wang et al. Machine learning for risk and resilience assessment in structural engineering: Progress and future trends
Corizzo et al. Anomaly detection and repair for accurate predictions in geo-distributed big data
Tao et al. Training and testing data division influence on hybrid machine learning model process: application of river flow forecasting
Qi et al. A hybrid method for improved stability prediction in construction projects: A case study of stope hangingwall stability
Mounce et al. Ensemble decision tree models using RUSBoost for estimating risk of iron failure in drinking water distribution systems
Li et al. Development of a stepwise-clustered hydrological inference model
CN112506990A (zh) 一种基于时空信息的水文数据异常检测方法
Dong et al. Applying the ensemble artificial neural network-based hybrid data-driven model to daily total load forecasting
Chebbi et al. Optimal extension of rain gauge monitoring network for rainfall intensity and erosivity index interpolation
Wang et al. Study on wavelet neural network based anomaly detection in ocean observing data series
Ferreira et al. Probabilistic ramp detection and forecasting for wind power prediction
Lu et al. Neural network interpretability for forecasting of aggregated renewable generation
Ouyang et al. Model of selecting prediction window in ramps forecasting
Ch et al. Groundwater level forecasting using SVM-PSO
Osmani et al. Integrating fuzzy logic with Pearson correlation to optimize contaminant detection in water distribution system with uncertainty analyses
Wang et al. Real-time water quality detection based on fluctuation feature analysis with the LSTM model
KR101703972B1 (ko) 공간정보를 이용한 지하수 부존 지역 예측시스템 및 지하수 부존 지역 예측방법
CN115081673A (zh) 一种油气管道的异常预测方法、装置、电子设备及介质
Khairudin et al. In-Depth review on machine learning models for long-term flood forecasting
Tangrand Some new contributions to neural networks and wavelets with applications
Zamenian et al. Systematic approach for asset management of urban water pipeline infrastructure systems
MEHR et al. Electrical energy demand prediction: A comparison between genetic programming and decision tree
Al Mehedi et al. Unraveling The Complexities of Urban Flood Hydraulics Through AI

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170918

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180927

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20191001

Year of fee payment: 6