KR102490498B1 - 슈퍼앙상블 기법을 이용한 표면 대기 온도 예측 방법 및 시스템 - Google Patents

슈퍼앙상블 기법을 이용한 표면 대기 온도 예측 방법 및 시스템 Download PDF

Info

Publication number
KR102490498B1
KR102490498B1 KR1020220114815A KR20220114815A KR102490498B1 KR 102490498 B1 KR102490498 B1 KR 102490498B1 KR 1020220114815 A KR1020220114815 A KR 1020220114815A KR 20220114815 A KR20220114815 A KR 20220114815A KR 102490498 B1 KR102490498 B1 KR 102490498B1
Authority
KR
South Korea
Prior art keywords
prediction
data
temperature
weight
model
Prior art date
Application number
KR1020220114815A
Other languages
English (en)
Inventor
문병권
위지은
강진희
Original Assignee
전북대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전북대학교산학협력단 filed Critical 전북대학교산학협력단
Priority to KR1020220114815A priority Critical patent/KR102490498B1/ko
Application granted granted Critical
Publication of KR102490498B1 publication Critical patent/KR102490498B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W2201/00Weather detection, monitoring or forecasting for establishing the amount of global warming
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Environmental Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Atmospheric Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

슈퍼앙상블 기법을 이용한 대기 온도 예측 방법이 개시된다. 슈퍼앙상블 기법을 이용한 대기 온도 예측 방법은 대상 지역의 대기 온도와 관련하여, 복수의 수리학적 예측 모델들에 의해 예측된 과거 시간 구간에 대한 예측 데이터들과 상기 과거 시간 구간 동안의 실제 데이터들을 비교하여, 상기 복수의 수리학적 예측 모델들 각각의 가중치를 산출하는 제1 단계; 상기 복수의 수리학적 예측 모델들 각각을 이용하여 상기 대상 지역의 대기 온도와 관련하여 장래 시간의 예측 데이터를 생성하는 제2 단계; 및 상기 복수의 수리학적 예측 모델들에 의해 생성된 예측 데이터를 상기 가중치를 이용한 에러 기반 슈퍼앙상블 기법으로 합산하여 최종 예측 데이터를 생성하는 제3 단계;를 포함할 수 있다.

Description

슈퍼앙상블 기법을 이용한 표면 대기 온도 예측 방법 및 시스템{METHOD AND SYSTEM OF PREDICTING SURFACE AIR TEMPERATURE USING SUPERENSEMBLE TECHNIQUE}
본 발명은 통계적 분석을 통해 여름철 표면 대기 온도를 예측하는 방법 및 시스템에 관한 것이다.
폭염의 지속기간 및 강도는 최근 현저하게 증가되었고, 폭염 피해는 글로벌 온난화 때문에 증가할 것으로 기대된다. 고온인 날의 수가 증가하는 것은 농작물의 질병 및 열 질병의 증가 등과 같은 다양한 사회경제적 효과를 야기할 수 있다. 그러한 재앙을 준비하기 위해, 표면 대기 온도를 정확하게 예측하는 것은 매우 중요하다.
S2S(subseasonal-to-seasonal) 예보 프로젝트는 최근 날씨로부터 기후까지 연속적인 범위에서의 연속적인 예보 연구를 위한 12 모델들을 사용하는 예보 데이터를 제공한다. 예보된 데이터는 2015년 이후 생성되었고, 모델에 따라 초기 날짜로부터 30~60일에 대한 예보를 제공한다. 이러한 데이터는 매든-줄리안 진동, 태풍, 폭염 및 성층권-대기권 상호작용을 연구하기 위해 사용되었다.
하지만, 대기는 불안정하고 비선형적인 시스템이므로, 기후 예보는 에러를 가진다. 모델의 예보 성능은 소스 코드, 파라미터들, 경계 조건들을 조절함에 의해 향상될 수 있고, 이는 많은 재원 및 시간을 요구한다. 또한, 모델에서의 본질적인 비선형 에러를 감소시키는 것은 어렵다.
본 발명의 일 목적은 모델별 가중치를 반영한 슈퍼앙상블 기법을 이용하여 표면 대기 온도를 예측하는 방법을 제공하는 것이다.
본 발명의 다른 목적은 상기 방법을 구현하기 위한 시스템을 제공하는 것이다.
본 발명의 실시예에 따른 슈퍼앙상블 기법을 이용한 대기 온도 예측 방법은, 대상 지역의 대기 온도와 관련하여, 복수의 수리학적 예측 모델들에 의해 예측된 과거 시간 구간에 대한 예측 데이터들과 상기 과거 시간 구간 동안의 실제 데이터들을 비교하여, 상기 복수의 수리학적 예측 모델들 각각의 가중치를 산출하는 제1 단계; 상기 복수의 수리학적 예측 모델들 각각을 이용하여 상기 대상 지역의 대기 온도와 관련하여 장래 시간의 예측 데이터를 생성하는 제2 단계; 및 상기 복수의 수리학적 예측 모델들에 의해 생성된 예측 데이터를 상기 가중치를 이용한 에러 기반 슈퍼앙상블 기법으로 합산하여 최종 예측 데이터를 생성하는 제3 단계;를 포함한다.
일 실시예에 있어서, 상기 가중치는 상기 트레이닝 기간에 대한 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 RMSE(root-mean-square-errors)를 기반으로 하기 수식 1 및 2에 의해 산출될 수 있다.
[수식 1]
Figure 112022095471015-pat00001
[수식 2]
Figure 112022095471015-pat00002
상기 수식 1, 2에서,
Figure 112022095471015-pat00003
Figure 112022095471015-pat00004
은 N개의 수리학적 예측 모델 중 i-번째 모델의 RMSE(root-mean-square-errors) 및 가중치를 각각 나타내고,
Figure 112022095471015-pat00005
,
Figure 112022095471015-pat00006
Figure 112022095471015-pat00007
는 트레이닝 기간, 상기 트레이닝 기간 내의 시간 t에서의 i번째 모델에 의해 생성된 기온 예측 데이터 및 실제 기온 데이터를 각각 나타낸다.
일 실시예에 있어서, 상기 가중치는 상기 트레이닝 기간에 대한 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 선형회귀분석을 통해 산출된 선형회귀 상수(linear regression coefficient)일 수 있다.
일 실시예에 있어서, 상기 장래 시간의 상기 대상 지역의 기온과 관련한 최종 예측 데이터는 하기 수식 3에 따라 생성될 수 있다.
[수식 3]
Figure 112022095471015-pat00008
상기 수식 3에서,
Figure 112022095471015-pat00009
는 장래 시간 t에서의 최종 예측 데이터이고,
Figure 112022095471015-pat00010
은 기 설정된 과거 시간으로부터 현재 시간까지의 실제 관측 데이터의 평균값이고,
Figure 112022095471015-pat00011
는 i-번째 모델의 장래 시간 t에서의 실시간 예측값이고,
Figure 112022095471015-pat00012
는 i-번째 모델의 장래 시간 t까지의 과거 예측값들의 평균값이며,
Figure 112022095471015-pat00013
는 i-번째 모델의 가중치이다.
일 실시예에 있어서, 기준값 이하의 제곱근 에러값이나 선형회귀 상수를 만족하는 모델들을 선택한 후 이들에 대해서 가중치를 산출하고, 산출된 가중치를 이용하여 슈퍼 앙상블 기법으로 최종 예측 데이터를 생성할 수 있다.
일 실시예에 있어서, 상기 복수의 수리학적 예측 모델들에 의해 생성된 기온 예측 데이터의 평균값이 기설정된 온도 이상인 경우에는 상기 수리학적 예측 모델의 예측 데이터들에 대한 RMSE(root-mean-square-errors)를 기반으로 산출된 제1 가중치를 적용하여 상기 최종 예측 데이터를 생성하고, 상기 평균값이 기설정된 온도 미만인 경우에는 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 선형회귀 상수(linear regression coefficient)를 기반으로 산출된 제2 가중치를 적용하여 상기 최종 예측 데이터를 생성할 수 있다.
일 실시예에 있어서, 예측 시기별로 상기 수리학적 예측 모델의 예측 데이터들에 대한 RMSE(root-mean-square-errors)를 기반으로 산출된 제1 가중치와 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 선형회귀 상수(linear regression coefficient)를 기반으로 산출된 제2 가중치 중 더 작은 오차를 갖는 가중치를 미리 결정한 후, 예측 시기에 따라 상기 결정된 가중치를 적용하여 상기 최종 예측 데이터를 생성할 수 있다.
본 발명의 실시예에 따른 기온 예측 시스템은, 복수의 수리학적 예측 모델들을 포함하는 수리학적 예측 모델부; 상기 대상 지역의 실제 온도 데이터들을 저장하는 기온 정보 저장부; 예측 시간보다 앞선 트레이닝 기간 동안의 상기 복수의 수리학적 예측 모델들에 의해 생성된 상기 대상 지역의 기온 예측 데이터들과 상기 트레이닝 기간 동안의 상기 대상 지역의 실제 온도 데이터들과 비교함으로써 상기 복수의 수리학적 예측 모델들 각각의 가중치를 산출하는 가중치 생성부: 및 상기 복수의 수리학적 예측 모델들에 의해 생성된 예측 데이터들을 상기 가중치 정보를 반영한 후 이들을 슈퍼 앙상블 기법으로 합산함으로써, 장래 시간의 상기 대상 지역의 기온과 관련한 최종 예측 데이터를 생성하는 예측 기온 생성부;를 포함할 수 있다.
일 실시예에 있어서, 상기 가중치 생성부는 상기 트레이닝 기간에 대한 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 RMSE(root-mean-square-errors)를 기반으로 하기 수식 1, 2에 의해 생성된 제1 가중치 또는 상기 트레이닝 기간에 대한 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 선형회귀분석을 통해 산출된 선형회귀 상수(linear regression coefficient)를 기반으로 생성된 제2 가중치를 생성할 수 있다.
[수식 1]
Figure 112022095471015-pat00014
[수식 2]
Figure 112022095471015-pat00015
상기 수식 1, 2에서,
Figure 112022095471015-pat00016
Figure 112022095471015-pat00017
은 N개의 수리학적 예측 모델 중 i-번째 모델의 RMSE(root-mean-square-errors) 및 가중치를 각각 나타내고,
Figure 112022095471015-pat00018
,
Figure 112022095471015-pat00019
Figure 112022095471015-pat00020
는 트레이닝 기간, 상기 트레이닝 기간 내의 시간 t에서의 i번째 모델에 의해 생성된 기온 예측 데이터 및 실제 기온 데이터를 각각 나타낸다.
일 실시예에 있어서, 상기 예측 기온 생성부는 하기 수식 3에 따라 최종 예측 데이터는 생성할 수 있다.
[수식 3]
Figure 112022095471015-pat00021
상기 수식 3에서,
Figure 112022095471015-pat00022
는 장래 시간 t에서의 최종 예측 데이터이고,
Figure 112022095471015-pat00023
은 기 설정된 과거 시간으로부터 현재 시간까지의 실제 관측 데이터의 평균값이고,
Figure 112022095471015-pat00024
는 i-번째 모델의 장래 시간 t에서의 실시간 예측값이고,
Figure 112022095471015-pat00025
는 i-번째 모델의 장래 시간 t까지의 과거 예측값들의 평균값이며,
Figure 112022095471015-pat00026
는 i-번째 모델의 가중치이다.
일 실시예에 있어서, 상기 기온 예측 시스템은 상기 복수의 수리학적 예측 모델들 중 기설정된 기준을 만족하는 모델들을 선택한 후 이들에 의해 생성된 데이터를 상기 가중치 생성부 및 상기 예측 기온 생성부에 제공하는 모델 선택부를 더 포함할 수 있고, 이 경우, 상기 가중치 생성부는 상기 선택된 모델들에 대해 상기 가중치를 산출하고, 상기 예측 기온 생성부는 상기 선택된 모델들에 의해 생성된 예측 데이터들 및 이들에 대한 가중치를 이용하여 상기 최종 예측 데이터를 생성할 수 있다.
일 실시예에 있어서, 상기 예측 기온 생성부는, 상기 복수의 수리학적 예측 모델들에 의해 생성된 기온 예측 데이터의 평균값이 기설정된 온도 이상인 경우에는 상기 제1 가중치를 적용하여 상기 최종 예측 데이터를 생성하고, 상기 평균값이 기설정된 온도 미만인 경우에는 상기 제2 가중치를 적용하여 상기 최종 예측 데이터를 생성할 수 있다.
일 실시예에 있어서, 상기 가중치 생성부는 예측 시기별로 상기 제1 가중치와 상기 제2 가중치 중 더 작은 오차를 갖는 가중치를 미리 결정하고, 상기 예측 기온 생성부는 예측하고자 하는 시기별로 상기 제1 가중치와 상기 제2 가중치 중 결정된 가중치를 적용하여 상기 최종 예측 데이터를 생성할 수 있다.
본 발명의 기온 예측 방법 및 기온 예측 시스템에 따르면, 저비용으로 간단한 방법을 통해 단시간에 대상 지역에 대한 표면 대기 온도 예측 성능을 향상시킬 수 있다.
도 1은 본 발명의 실시예에 따른 슈퍼앙상블 기법을 이용한 기온 예측 방법을 설명하기 위한 순서도이다.
도 2는 본 발명에 따른 기온 예측 시스템을 설명하기 위한 도면이다.
도 3은 2016년부터 2020년까지 동아시아에서의 평균 표면 대기 온도의 RMSE를 보여주는 그래프이다.
도 4는 1-31일의 예측 시간 동안 2016년부터 2020년까지 동아시아에서의 평균 표면 온도의 RMSE의 그래프이다.
도 5 내지 도 7은 2016년부터 2020년까지의 각 년도에 대한 ENS, SUPR, SUPL 예측 데이터의 MBE의 박스-휘스커 플롯(box-and-whisker plot)을 보여준다.
도 8의 a는 2016년부터 2020년까지 ENS, SUPR 및 SUPL 방법들의 RMSE 분석결과를 나타내는 그래프이고, b는 ENS, SUPR 및 SUPL 방법 하에서 초기 달에 대한 RMSE를 보여주는 그래프이며, c는 ENS, SUPR 및 SUPL 방법들에 대해 예측 날짜에 의한 RMSE를 보여주는 그래프이다.
이하, 첨부한 도면을 참조하여 본 발명의 실시예에 대해 상세히 설명한다. 본 발명은 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 본문에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다. 첨부된 도면에 있어서, 구조물들의 치수는 본 발명의 명확성을 기하기 위하여 실제보다 확대하여 도시한 것이다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
본 출원에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로서 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
도 1은 본 발명의 실시예에 따른 슈퍼앙상블 기법을 이용한 기온 예측 방법을 설명하기 위한 순서도이다.
도 1을 참조하면, 본 발명의 실시예에 따른 슈퍼앙상블 기법을 이용한 지표면 대기 온도 예측 방법은, 대상 지역의 대기 온도와 관련하여, 복수의 수리학적 예측 모델들에 의해 예측된 과거 시간 구간에 대한 예측 데이터들과 상기 과거 시간 구간 동안의 실제 데이터들을 비교하여, 상기 복수의 수리학적 예측 모델들 각각의 가중치를 산출하는 제1 단계(S110); 상기 복수의 수리학적 예측 모델들 각각을 이용하여 상기 대상 지역의 대기 온도와 관련하여 장래 시간의 예측 데이터를 생성하는 제2 단계(S120); 및 상기 복수의 수리학적 예측 모델들에 의해 생성된 예측 데이터를 상기 가중치를 이용한 에러 기반 슈퍼앙상블 기법으로 합산하여 최종 예측 데이터를 생성하는 제3 단계(S130);를 포함할 수 있다.
상기 제1 단계(S110)에 있어서, 상기 복수의 수리학적 예측 모델로는 외부에 제공된 상기 대상 지역의 과거 또는 현재의 기온 정보를 기초로 상기 대상 지역의 장래 시간에 대한 기온 데이터를 수리학적 방식에 의해 생성할 수 있는 기온 예측 모델이 제한 없이 적용될 수 있고, 적용되는 모델의 수는 특별히 제한되지 않는다.
일 실시예에 있어서, 상기 복수의 수리학적 예측 모델의 가중치를 생성하기 위해, 과거 시간의 구간인 트레이닝 기간 동안의 상기 복수의 수리학적 예측 모델들에 의해 생성된 상기 대상 지역의 기온 예측 데이터들을 상기 트레이닝 기간 동안의 상기 대상 지역의 실제 온도 데이터들과 비교함으로써 상기 복수의 수리학적 예측 모델들 각각의 가중치를 산출할 수 있다. 이 때, 상기 복수의 수리학적 예측 모델들에는 상기 트레이닝 기간의 시간보다 앞선 제2 과거 시간에 대한 상기 대상 지역의 기온 정보가 제공될 수 있고, 상기 복수의 수리학적 예측 모델들 각각은 상기 제2 과거 시간에 대한 상기 대상 지역의 기온 정보를 기초로 상기 트레이인 기간의 시간에 대한 예측 데이터를 생성할 수 있다.
상기 트레이닝 기간에 대한 상기 대상지역의 실제 기온 데이터는 China Meteorological Administration (CMA), the Korea Meteorological Administration (KMA), the National Centers fro Environmental Prediction (NCEP), the Met Office (UKMO) 등으로부터 수신한 데이터를 사용할 수 있다.
일 실시예에 있어서, 상기 가중치는 상기 트레이닝 기간에 대한 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 RMSE(root-mean-square-errors)를 기반으로 산출될 수 있다. 예를 들면, 상기 가중치는 하기 수식 1, 2에 의해 산출될 수 있다.
[수식 1]
Figure 112022095471015-pat00027
[수식 2]
Figure 112022095471015-pat00028
상기 수식 1, 2에서,
Figure 112022095471015-pat00029
Figure 112022095471015-pat00030
은 N개의 수리학적 예측 모델 중 i-번째 모델의 RMSE(root-mean-square-errors) 및 가중치를 각각 나타내고,
Figure 112022095471015-pat00031
,
Figure 112022095471015-pat00032
Figure 112022095471015-pat00033
는 트레이닝 기간, 상기 트레이닝 기간 내의 시간 t에서의 i번째 모델에 의해 생성된 기온 예측 데이터 및 실제 기온 데이터를 각각 나타낸다.
다른 실시예에 있어서, 상기 가중치는 상기 트레이닝 기간에 대한 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 선형회귀분석을 통해 산출된 선형회귀 상수(linear regression coefficient)일 수 있다.
상기 복수의 수리학적 예측 모델들은 적용된 수리학적 방식에 따라 본질적으로 시스템적인 에러를 가지므로, 본 발명에서는 각 수리학적 예측 모델별로 가중치를 산출한 후 이를 이용함으로써, 상기 시스템적인 에러를 효과적으로 보상하여 보다 정확한 기온 예측 데이터를 생성할 수 있다.
상기 제2 단계(S120)에 있어서, 상기 복수의 수리학적 예측 모델들은 외부에 제공된 상기 대상 지역의 과거 또는 현재의 기온 정보를 기초로, 상기 대상 지역의 기온과 관련하여 장래 시간의 예측 데이터를 생성할 수 있다.
상기 제3 단계(S130)에 있어서, 상기 복수의 수리학적 예측 모델들에 의해 생성된 예측 데이터들을 상기 제1 단계(S110)에서 산출한 가충치를 반영하여 슈퍼 앙상블 기법으로 합산함으로써, 장래 시간의 상기 대상 지역의 기온과 관련한 최종 예측 데이터를 생성할 수 있다.
일 실시예에 있어서, 상기 장래 시간의 상기 대상 지역의 기온과 관련한 최종 예측 데이터는 하기 수식 3에 따라 생성될 수 있다.
[수식 3]
Figure 112022095471015-pat00034
상기 수식 3에서,
Figure 112022095471015-pat00035
는 장래 시간 t에서의 최종 예측 데이터이고,
Figure 112022095471015-pat00036
은 기 설정된 과거 시간으로부터 현재 시간까지의 실제 관측 데이터의 평균값이고,
Figure 112022095471015-pat00037
는 i-번째 모델의 장래 시간 t에서의 실시간 예측값이고,
Figure 112022095471015-pat00038
는 i-번째 모델의 장래 시간 t까지의 과거 예측값들의 평균값이며,
Figure 112022095471015-pat00039
는 i-번째 모델의 가중치이다.
일 실시예에 있어서, 상기 슈퍼 앙상블 기법은 상기 복수의 수리학적 예측 모델들에 의해 생성된 예측 데이터들 전부에 대해 수행될 수도 있으나, 상기 복수의 수리학적 예측 모델들 중 일부를 선택한 후 선택된 모델들에 의해서 생성된 예측 데이터들에 대해 수행될 수도 있다. 예를 들면, 상기 복수의 수리학적 예측 모델들 중 기설정된 기준, 예를 들면, 기준값 이하의 제곱근 에러값이나 선형회귀 상수를 만족하는 모델들을 선택한 후 이들에 대해서 가중치를 산출하고, 산출된 가중치를 이용하여 슈퍼 앙상블 기법으로 최종 예측 데이터를 생성할 수 있다.
일 실시예에 있어서, 상기 슈퍼 앙상블 기법은 기설정된 조건을 만족하는 경우에는 제1 가중치를 적용하고, 기설정된 조건을 만족하지 않는 경우에는 제2 가중치를 적용하여 최종 예측 데이터를 생성할 수 있다.
일 실시예로, 상기 복수의 수리학적 예측 모델들에 의해 생성된 기온 예측 데이터의 평균값이 기설정된 온도 이상인 경우에는 상기 수리학적 예측 모델의 예측 데이터들에 대한 RMSE(root-mean-square-errors)를 기반으로 산출된 제1 가중치를 적용하여 상기 최종 예측 데이터를 생성하고, 상기 평균값이 기설정된 온도 미만인 경우에는 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 선형회귀 상수(linear regression coefficient)를 기반으로 산출된 제2 가중치를 적용하여 상기 최종 예측 데이터를 생성할 수 있다. 기온이 높은 경우에는 선형회귀 상수(linear regression coefficient)를 기반으로 산출된 가중치를 적용한 슈퍼 앙상블 기법보다 RMSE(root-mean-square-errors)를 기반으로 산출된 가중치를 적용한 슈퍼 앙상블 기법이 보다 정확한 기온 정보를 생성할 수 있기 때문이다.
다른 실시예로, 예측 시기별로 상기 제1 가중치와 상기 제2 가중치 중 더 작은 오차를 갖는 가중치를 미리 결정한 후, 예측하고자 하는 시기별로 기 제1 가중치와 상기 제2 가중치 중 결정된 가중치를 적용하여 상기 최종 예측 데이터를 생성할 수 있다.
도 2는 본 발명에 따른 기온 예측 시스템을 설명하기 위한 도면이다.
도 2를 참조하면, 본 발명의 실시예에 따른 기온 예측 시스템(100)은 복수의 수리학적 예측 모델부(110), 가중치 생성부(120), 기온 정보 저장부(130) 및 예측 기온 생성부(140)를 포함할 수 있다. 그리고 상기 기온 예측 시스템(110)은 모델 선택부(150)를 더 포함할 수 있다.
상기 수리학적 예측 모델부(110)는 복수의 수리학적 예측 모델들을 포함할 수 있다. 상기 복수의 수리학적 예측 모델들에 대해서는 앞에서 설명하였으므로, 이에 대한 중복된 상세한 설명은 생략한다.
상기 가중치 생성부(120)는 예측 시간보다 앞선 트레이닝 기간 동안의 상기 복수의 수리학적 예측 모델들에 의해 생성된 상기 대상 지역의 기온 예측 데이터들과 상기 트레이닝 기간 동안의 상기 대상 지역의 실제 온도 데이터들과 비교함으로써 상기 복수의 수리학적 예측 모델들 각각의 가중치를 산출할 수 있다. 이 때, 상기 가중치 생성부(120)는 상기 기온 정보 저장부(130)로부터 상기 대상 지역의 실제 온도 데이터들을 제공받을 수 있다. 상기 트레이닝 기간에 대한 상기 대상지역의 실제 기온 데이터는, 외부 기온 정보 제공부(10), 예를 들면, China Meteorological Administration (CMA), the Korea Meteorological Administration (KMA), the National Centers fro Environmental Prediction (NCEP), the Met Office (UKMO) 등으로부터 수신할 수 있다.
일 실시예에 있어서, 상기 가중치 생성부(120)는 상기 트레이닝 기간에 대한 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 RMSE(root-mean-square-errors)를 기반으로 상기 가중치를 생성할 수 있다. 예를 들면, 상기 가중치는 하기 수식 1, 2에 의해 산출될 수 있다.
[수식 1]
Figure 112022095471015-pat00040
[수식 2]
Figure 112022095471015-pat00041
상기 수식 1, 2에서,
Figure 112022095471015-pat00042
Figure 112022095471015-pat00043
은 N개의 수리학적 예측 모델 중 i-번째 모델의 RMSE(root-mean-square-errors) 및 가중치를 각각 나타내고,
Figure 112022095471015-pat00044
,
Figure 112022095471015-pat00045
Figure 112022095471015-pat00046
는 트레이닝 기간, 상기 트레이닝 기간 내의 시간 t에서의 i번째 모델에 의해 생성된 기온 예측 데이터 및 실제 기온 데이터를 각각 나타낸다.
다른 실시예에 있어서, 상기 가중치 생성부(120)는 상기 트레이닝 기간에 대한 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 선형회귀분석을 통해 산출된 선형회귀 상수(linear regression coefficient)를 기반으로 상기 가중치를 생성할 수 있다.
일 실시예에 있어서, 상기 가중치 생성부(120)는 일정 시간 간격 또는 실시간으로 가중치를 업데이트할 수 있다. 예를 들면, 상기 가중치 생성부(120)는 시간 경과에 따른 최신 실제 데이터와 이에 대응하는 예측 데이터를 반영하여 상기 가중치를 업데이트할 수 있다.
상기 예측 기온 생성부(140)는 상기 수리학적 예측 모델부(110)로부터 제공받은 상기 복수의 수리학적 예측 모델들에 의해 생성된 예측 데이터들을 상기 가중치 생성부(120)로부터 제공받은 상기 가중치 정보를 반영한 후 이들을 슈퍼 앙상블 기법으로 합산함으로써, 장래 시간의 상기 대상 지역의 기온과 관련한 최종 예측 데이터를 생성할 수 있다.
일 실시예에 있어서, 상기 예측 기온 생성부(140)는 상기 장래 시간의 상기 대상 지역의 기온과 관련한 최종 예측 데이터는 하기 수식 3에 따라 생성할 수 있다.
[수식 3]
Figure 112022095471015-pat00047
상기 수식 3에서,
Figure 112022095471015-pat00048
는 장래 시간 t에서의 최종 예측 데이터이고,
Figure 112022095471015-pat00049
은 기 설정된 과거 시간으로부터 현재 시간까지의 실제 관측 데이터의 평균값이고,
Figure 112022095471015-pat00050
는 i-번째 모델의 장래 시간 t에서의 실시간 예측값이고,
Figure 112022095471015-pat00051
는 i-번째 모델의 장래 시간 t까지의 과거 예측값들의 평균값이며,
Figure 112022095471015-pat00052
는 i-번째 모델의 가중치이다.
일 실시예에 있어서, 상기 예측 기온 생성부(140)는 상기 모델 선택부(150)에 의해 선택된 모델들에 의해서 생성된 예측 데이터들에 대해 수행될 수도 있다. 예를 들면, 상기 모델 선택부(150)는 상기 복수의 수리학적 예측 모델들 중 기설정된 기준, 예를 들면, 기준값 이하의 제곱근 에러값이나 선형회귀 상수를 만족하는 모델들을 선택한 후 이들에 의해 생성된 데이터를 상기 가중치 생성부(120) 및 상기 예측 기온 생성부(140)에 제공할 수 있고, 상기 가중치 생성부(120)는 상기 선택된 모델들에 대해 가중치를 산출할 수 있으며, 상기 예측 기온 생성부(140)는 상기 선택된 모델들에 의해 생성된 예측 데이터들 및 이들에 대한 가중치를 이용하여 상기 최종 예측 데이터를 생성할 수 있다.
일 실시예에 있어서, 상기 예측 기온 생성부(140)는 기설정된 조건을 만족하는 경우에는 제1 가중치를 적용하고, 기설정된 조건을 만족하지 않는 경우에는 제2 가중치를 적용하여 상기 최종 예측 데이터를 생성할 수 있다.
일 실시예로, 상기 예측 기온 생성부(140)는 상기 복수의 수리학적 예측 모델들에 의해 생성된 기온 예측 데이터의 평균값이 기설정된 온도 이상인 경우, 상기 예측 기온 생성부(140)는 상기 수리학적 예측 모델의 예측 데이터들에 대한 RMSE(root-mean-square-errors)를 기반으로 산출된 제1 가중치를 적용하여 상기 최종 예측 데이터를 생성하고, 상기 평균값이 기설정된 온도 미만인 경우, 상기 예측 기온 생성부(140)는 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 선형회귀 상수(linear regression coefficient)를 기반으로 산출된 제2 가중치를 적용하여 상기 최종 예측 데이터를 생성할 수 있다.
다른 실시예로, 상기 가중치 생성부(120)는 예측 시기별로 상기 제1 가중치와 상기 제2 가중치 중 더 작은 오차를 갖는 가중치를 미리 결정할 수 있고, 상기 예측 기온 생성부(140)는 예측하고자 하는 시기별로 상기 제1 가중치와 상기 제2 가중치 중 결정된 가중치를 적용하여 상기 최종 예측 데이터를 생성할 수 있다.
본 발명의 기온 예측 방법 및 기온 예측 시스템에 따르면, 저비용 및 간단한 방법을 통해 대상 지역에 대한 표면 대기 온도 예측 성능을 향상시킬 수 있다.
이하 본 발명의 실시예에 대해 상술한다. 다만, 하기 실시예는 본 발명의 일부 실시 형태에 불과한 것으로서, 본 발명의 범위가 하기 실시예에 한정되는 것은 아니다.
[실시예]
Data
S2S 예보 데이터 프로젝트에 참여하는 표 1에 기재된 7개 모델들을 이용하여 분석되었다. 2016-2020년 동안 5월부터 8월까지 실시간 데이터가 사용되었다. 그러나 손실 때문에 ECCC 및 KMA 데이터는 2016년 데이터로부터 제외되었다. 모든 모델들이 데이터를 재예보하는 방식으로, 1999-2010 기간이 가중치 상수를 계산하기 위해 사용되었다. 또한, 본 연구는 1~31일 예보 시간을 분석하였고, 이는 모든 모델에 의해 공통으로 채용된 기간이다.
Figure 112022095471015-pat00053
초기 시간 간격은 CAM, KMA, NCEP 및 UKMO에 대해서는 1일, ECCC 및 ISAC-CNR에 대해서는 1주, ECMWF에 대해서는 2주 이었다. 분석에 사용된 모델 초기 시간이 여름 표면 대기 온도의 예측 가능성을 분석하기 위해 1주일에 1번으로 매칭되었을 때, 5월부터 8월까지 전체 17일이 있었다.
모델의 예측 가능성을 평가하기 위해, ACEP 및 NCAR의 재분석 2개 데이터가 에러 분석을 위한 기준 데이터로서 사용되었다. NCEP 데이터는 한반도 상의 표면 대기 온도의 본래 환경에서의 관찰과 매우 높은 관련성을 보여주었다. 기간은 S2S 모델 데이터와 동일하였고, 수평 해상도는 S2S 데이터와 유사하게 보간하고 분석되었다. 연구 지역은 동아시아이었다.(25°°N, 105°°E)
Methodology
예측 시간 t에 대한 슈퍼앙상블 예측 데이터는 수식 3을 이용하여 산출하였다. 트레이닝 기간은 1991년부터 2010이었고, 이는 재예보 데이터 기간이었으며, 실시간 예측 값은 2016년부터 2020년에 대응되었다.
슈펑앙상블 예측 데이터는 가중치 상수를 계산하기 위해 2가지 방법들을 사용하여 생성되었다.
첫 번째 방법에서, 트레이닝 기간 동안의 각 모델의 RMSEs 및 관측 데이터가 계산되었고, 이 방법은 SUPR로 표시되고, 최종 예측 데이터는 수식 4에 의해 산출되었다.
[수식 4]
Figure 112022095471015-pat00054
두번째 방법에서, 트레이닝 기간 동안의 모델 및 관찰 값의 선형회귀상수는 슈퍼앙상블 가중치 상수로서 결정되었고, 가중치 상수를 계산하기 위해 사용되었다. 이 방법은 SUPL로서 표시되고, 최종 예측 데이터는 수식 5에 의해 산출되었다.
[수식 5]
Figure 112022095471015-pat00055
RMS를 기초로 계산된 SUPR의 가중치 상수는 양의 값을 가짐에 반해, 회귀 분석을 기초로 계산된 SUPL의 가중치는 양의 값 또는 음의 값을 가질 수 있다. 따라서, 모델이 재예측 데이터에서 초기 날짜 및 예측 시간에 따라 음의 값을 갖는다면, 상수는 또한 실시간 데이터에 적용될 수 있다.
위의 2가지 슈퍼앙상블 기술과 비교하기 위해, 모든 모델이 동일한 가중치를 갖는 단순 다중모델 앙상블 수단(ENS)에 의한 최종 예측 데이터가 하기 수식 6 따라 산출되었다.
[수식 6]
Figure 112022095471015-pat00056
모델의 예측 성능은 평균 편향 에러(mean bias error, MBE) 및 RMSE의 관점에서 비교되었다. 모델 예측 및 관측 값은 M 및 O로 각각 표시되었다. MBE 및 RMSE는 다음의 수식 7, 8을 사용하여 획득하였다.
[수식 7]
Figure 112022095471015-pat00057
[수식 8]
Figure 112022095471015-pat00058
[실험예]
도 3은 2016년부터 2020년까지 동아시아에서의 평균 표면 대기 온도의 RMSE를 보여주는 그래프이다. 이는 1-17일의 초기 시간에 대해 1-31일 동안을 평균하여 도출하였고, 1-31일의 예측 시간은 모든 모델에 대해 공통적으로 적용된 기간이다. 각 모델은 청색 점선들로 표시되었고, ENS, SUPR 및 SUPL 방법들은 회색, 검정색, 적색 실선들로 각각 표시되었다.
도 3을 참조하면, 각각 모델들의 RMSE는 0.37과 3.0 사이의 영역에 있었고, ENS, SUPR 및 SUPL 방법들의 RMSE는 0.30과 1.49 사이의 영역에 있었다. 좁은 영역의 에러를 갖는 슈퍼앙상블 예측 데이터는 더 넓은 범위의 에러를 갖는 각각의 모델로부터의 데이터보다 더 낮은 에러를 가졌다. 모델의 본질적인 에러들의 보상 때문에, 모델의 RMSE는 모델의 예측 바이어스를 평균함에 의해 감소될 수 있다. 5월부터 8월까지 초기 시간 간격은 17일 이었으므로, 에러는 2016년 5월(1-4일) 및 다른 년도의 7월(10-13일)에서 작았다. SUPR 방법의 RMSE에서의 변화는 ENS 방법에서의 변화와 유사하였고, SUPR 방법의 에러는 낮았다. SUPL 방법의 RMSE는 ENS 및 SUPR 방법과는 다른 변화 특성을 나타내었다. 2016년 및 2018년에서, 초기 3-9일은 상대적으로 낮은 에러를 가졌으나, 그 이후의 에러는 더 높았다. 2020년에서, SUPL 방법은 모든 초기 기간 동안 각각의 모델들 및 다른 슈퍼앙상블 기술에 의해 만들어진 예측과 비교하여 매우 낮은 에러를 가졌다.
도 4는 1-31일의 예측 시간 동안 2016년부터 2020년까지 동아시아에서의 평균 표면 온도의 RMSE의 그래프이다.
도 4를 참조하면, 도 3의 결과와 유사하게, 앙상블 예측 데이터는 각각의 모델들보다 더 낮은 RMSE를 가졌다. 또한, SUPL의 에러 보정 효과는 2020년에 높았다. 2018년 및 2019년에서, 예측 시간이 16일을 초과하였을 때, 3가지 앙상블의 예측 데이터는 모든 모델들의 에러 값들이 높았을 대, 유사한 에러를 가졌지만, SUPL 방법은 에러가 작았을 때 현저하게 더 낮은 에러를 가졌다. 따라서, 3 및 4 주 동안의 예측에서, SUPL 방법은 에러가 작았을 때 더 높은 에러 보정 효과를 나타내었다. 반면, 3가지 앙상블 결과는 에러가 높았을 때, 유사하였다.
초기 시간 및 초기 날짜 모두에 대해, RMSE 시간 연속 분석의 결과는 앙상블 예측이 각각의 모델들보다 더 우수한 성능을 보여줌을 나타내었다. 앙상블 예측의 성능은 참여하는 모델 중 가장 낮은 에러를 갖는 것의 성능을 따랐고, 가장 큰 에러를 갖는 모델과는 관련성이 낮았으며, 그 결과 가장 낮은 에러를 갖는 모델의 참여가 앙상블 예측에서 중요하였다. 추가적으로, 슈퍼앙상블 예측 데이터는 단순 앙상블 예측 데이터를 능가하였기 때문에, 모델들의 예측 성능을 추가적으로 향상시키기 위해 슈퍼앙상블 기술을 적용하는 것이 중요하다.
에러의 사인들(sign)을은 슈퍼앙상블 예측 데이터의 MBE 분석을 통해 확인될 수 있다. 개별 모델들 중 가장 낮은 에러를 갖는 모델로서 ENS를 고려하면, 그것은 슈퍼앙상블 기술이 적용된 SUPR 및 SUPL 예측 데이터와 비교될 수 있다.
도 5 내지 도 7은 2016년부터 2020년까지의 각 년도에 대한 ENS, SUPR, SUPL 예측 데이터의 MBE의 박스-휘스커 플롯(box-and-whisker plot)을 보여준다.
도 5 내지 도 7을 참조하면, ENS 방법과 비교하여, SUPR 및 SUPL 방법들의 최대 MBE는 모든 년도에서 더 낮았다. 2016년 2020년에 대해, SUPR 및 SUPL 방법의 최소값은 증가하였고, 이는 최대 및 최소 에러 사이의 차이가 감소하였음을 나타낸다. 2017년 및 2018년에 대해, SUPR 및 SUPL 방법의 MBE 및 평균 MBE는 음의 값이었다. 이러한 결과는 슈퍼앙상블 결과가 모델의 양의 바이어스를 감소시키고, 음의 바이어스 보정 효과는 매년 변화함을 보여준다.
각각의 연도에 대한 앙상블 데이터 비교의 결과는 슈퍼앙상블 분석 데이터의 최대값과 최소값 사이의 영역은 일반적으로 감소되었음을 나타내었다. 초기 며칠은 각 달에 대해 평균화되었고, 박스 및 휘스크 플롯 분석은 ENS, SUPR 및 SUPL의 MBE에 대해 수행되었다.(도 6 참조) 달들이 초기 시간에 의해 구별됨에 따라, 실제 예측 날짜는 대응되는 달 및 다음 달의 부분을 포함한다. 최소 MBE와 최대 MBE 사이의 차이는 6월 및 7월 보다 5월 및 8월에 보다 현저하였고, 이는 에러가 큰 것을 나타낸다. 지역이 북서태평양에서의 높은 기압에 의해 영향을 받았을 때, 계절의 변화는 5월 및 8월에 변화하였다. 양의 바이어스에 대해, MBE는 ENS, SUPL 및 SUPR의 순서로 작은 값을 가졌다. 월별 분석은 또는 슈퍼앙상블 효과가 양의 바이어스를 감소시킴을 보여줬다. SUPR 방법은 더 작은 음의 바이어스를 가졌고, SUPL 또한 7월을 제외하고 음의 바이어스를 가졌다.
MBE의 박스 및 휘스크 플롯이 예측 시간 동안 생성되었다.(도 7 참조) 예측 데이터 1-28은 7일 간격으로 분할되었고, 주 1-4로서 정의되었다. 예측 시간에 의한 분석은 ENS 방법의 평균 MBE가 제로에 더 가깝다는 것을 보여주었다. 만약 년도 또는 초기 날짜가 고려되지 않았다면, ENS 방법은 더 우수한 예측 성능을 보여주었다. 예측 시간에 의한 바이어스 분포의 분석은 SUPR 및 SUPL 방법이 주 2 및 주 3에서 바이어스 폭의 감소에 기여함을 보여주었다.
모델들의 바이어스 분포의 분석은 SUPR 및 SUPL 방법들이 양의 바이어스를 감소시킴을 보여주었다. 그러나 음의 바이어스는 주 1 및 주 4 뿐만 아니라 2017년 및 2018년에서 7월에 증가하였다. 음의 바이어스 보정에 대한 이러한 효과는 모델의 MBE를 결정하는 것으로 보여진다.
도 8의 a는 2016년부터 2020년까지 ENS, SUPR 및 SUPL 방법들의 RMSE 분석결과를 나타내는 그래프이고, b는 ENS, SUPR 및 SUPL 방법 하에서 초기 달에 대한 RMSE를 보여주는 그래프이며, c는 ENS, SUPR 및 SUPL 방법들에 대해 예측 날짜에 의한 RMSE를 보여주는 그래프이다.
도 8을 참조하면, ENS 방법의 RMSE는 2016년부터 2019년까지 약 0.83 이었으나, 2020년에 1.03으로 현저하게 증가하였다. SUPR 및 SUPL 방법들은 ENS와 유사하거나 약간 더 작은 에러를 가졌다. 2016년 및 2018년에서, SUPR 방법은 SUPL 방법보다 더 우수한 예측 성능을 보여주었으나, 2019년 및 2020년에서는 SUPL의 예측 성능이 더 우수하였다. SUPR 및 SUPL 예측 방법들이 ENS 방법보다 예측 성능을 향상시키는데 더 유용할 것으로 기대된다.
도 8의 b에 도시된 바와 같이, 7월을 제외하고, ENS, SUPR 및 SUPL 순으로 RMSE는 감소하였다. 7월의 경우, ENS 및 SUPR 방법들의 RMSE는 약 0.66 이었으나, SUPL 방법은 0.72의 가장 높은 에러를 가졌다. 7월의 초기 시간에 대해 예측 시간이 1-31 일이므로, 예보 기간은 7월-8월에 대응되었다.
도 8의 c에 도시된 바와 같이, 주 1에서 주 3에서, 모든 예측 에러는 증가하였고, 이어서 주 4에서 약간 감소하였다. SUPR 및 SUPL 방법은 모든 주에서 ENS 방법보다 더 작은 RMSE를 보여주었고, 이는 더 우수한 예측 성능을 보여준다. 주 1 및 주 2에서, SUPR 및 SUPL 방법들은 유사한 RMSE를 가졌다. 그러나, 주 3 및 주 4에서, SUPL 방법은 SUPR 방법보다 더 낮은 RMSE를 가졌다. 따라서, 주 3 또는 그 이후의 예측 날짜에 대해, SUPR 및 SUPL 예측 방법은 예측 성능을 향상시킬 것이다.
2016-2020년 동안 ENS, SUPR 및 SUPL 방법들의 전반적인 RMSE는 각각 0.886, 0.848 및 0.763이었다. SUPR 및 SUPL 방법의 예측 에러는 ENS 방법보다 각각 4.2% 및 13.8% 더 작았다. 차이는 2020년에 가장 현저하였다. 또한, 초기 날짜기 5월, 6월 및 8월에 있었을 때 및 예측 시간이 1-4주이었을 때, SUPL 방법의 에러 향상 효과가 높았다.
도 6-8에 제시된 결과들은 음의 바이어스에서의 향상은 현저하지 않고, 또는 슈퍼앙상블은 에러 감소 효과가 낮을 때 더 큰 바이어스를 가짐을 보여준다. 따라서, 모델이 음의 바이어스를 갖는다면, 슈퍼앙상블 기술은 보다 주의깊게 사용되어야 할 것이다.
슈퍼앙상블 예측 방법인 SUPR 및 SUPL의 RMSE는 ENS와 비교하여 4.2% 및 13.8% 각각 감소된 에러를 보여주었고, 이는 예측 에러를 감소시키는데 있어서 슈퍼앙상블 기술이 단순 앙상블 예측보다 더 효과적임을 증명할 수 있다. SUPR 및 SUPL 방법들을 비교하였을 때, 선형 회귀 상수를 사용하는 가중치 계산 방법은 RMSE를 사용하는 것보다 더 높은 효과를 보여주었다. 반면, SUPL 방법은 7월의 조기 달 또는 동아시아에서 가장 더운 폭염(2016년, 2018년)이었을 때 약간 더 높은 에러를 보여주었다. 따라서, ENS 앙상블 방법 또는 SUPR 슈퍼앙상블 방법은 높은 온도의 경우에 SUPL 방법보다 더 효과적일 것이다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100: 기온 예측 시스템 110: 수리학적 예측 모델부
120: 가중치 생성부 130: 기온 정보 저장부
140: 예측 기온 생성부 150: 모델 선택부

Claims (13)

  1. 대상 지역의 대기 온도와 관련하여, 복수의 수리학적 예측 모델들에 의해 예측된 과거 트레이닝 기간에 대한 예측 데이터들과 상기 트레이닝 기간 동안의 실제 데이터들을 비교하여, 상기 복수의 수리학적 예측 모델들 각각의 가중치를 산출하는 제1 단계;
    상기 복수의 수리학적 예측 모델들 각각을 이용하여 상기 대상 지역의 대기 온도와 관련하여 장래 시간의 예측 데이터를 생성하는 제2 단계; 및
    상기 복수의 수리학적 예측 모델들에 의해 생성된 예측 데이터를 상기 가중치를 이용한 에러 기반 슈퍼앙상블 기법으로 합산하여 최종 예측 데이터를 하기 수식 3에 따라 생성하는 제3 단계;를 포함하고,
    상기 복수의 수리학적 예측 모델들에 의해 생성된 기온 예측 데이터의 평균값이 기설정된 온도 이상인 경우에는 상기 수리학적 예측 모델의 예측 데이터들에 대한 RMSE(root-mean-square-errors)를 기반으로 하기 수식 1 및 2에 의해 산출된 제1 가중치를 적용하여 상기 최종 예측 데이터를 생성하고, 상기 평균값이 기설정된 온도 미만인 경우에는 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 선형회귀 상수(linear regression coefficient)를 기반으로 산출된 제2 가중치를 적용하여 상기 최종 예측 데이터를 생성하는 것을 특징으로 하는, 슈퍼앙상블 기법을 이용한 대기 온도 예측 방법:
    [수식 1]
    Figure 112022137883110-pat00093

    [수식 2]
    Figure 112022137883110-pat00094

    [수식 3]
    Figure 112022137883110-pat00095

    상기 수식 1, 2에서,
    Figure 112022137883110-pat00096
    Figure 112022137883110-pat00097
    은 N개의 수리학적 예측 모델 중 i-번째 모델의 RMSE(root-mean-square-errors) 및 가중치를 각각 나타내고,
    Figure 112022137883110-pat00098
    ,
    Figure 112022137883110-pat00099
    Figure 112022137883110-pat00100
    는 트레이닝 기간, 상기 트레이닝 기간 내의 시간 t에서의 i번째 모델에 의해 생성된 기온 예측 데이터 및 실제 기온 데이터를 각각 나타내고,
    상기 수식 3에서,
    Figure 112022137883110-pat00101
    는 장래 시간 t에서의 최종 예측 데이터이고,
    Figure 112022137883110-pat00102
    은 기 설정된 과거 시간으로부터 현재 시간까지의 실제 관측 데이터의 평균값이고,
    Figure 112022137883110-pat00103
    는 i-번째 모델의 장래 시간 t에서의 실시간 예측값이고,
    Figure 112022137883110-pat00104
    는 i-번째 모델의 장래 시간 t까지의 과거 예측값들의 평균값이며,
    Figure 112022137883110-pat00105
    는 i-번째 모델의 가중치이다.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 대상 지역의 대기 온도와 관련하여, 복수의 수리학적 예측 모델들에 의해 예측된 과거 트레이닝 기간에 대한 예측 데이터들과 상기 트레이닝 기간 동안의 실제 데이터들을 비교하여, 상기 복수의 수리학적 예측 모델들 각각의 가중치를 산출하는 제1 단계;
    상기 복수의 수리학적 예측 모델들 각각을 이용하여 상기 대상 지역의 대기 온도와 관련하여 장래 시간의 예측 데이터를 생성하는 제2 단계; 및
    상기 복수의 수리학적 예측 모델들에 의해 생성된 예측 데이터를 상기 가중치를 이용한 에러 기반 슈퍼앙상블 기법으로 합산하여 최종 예측 데이터를 하기 수식 3에 따라 생성하는 제3 단계;를 포함하고,
    예측 시기별로 상기 수리학적 예측 모델의 예측 데이터들에 대한 RMSE(root-mean-square-errors)를 기반으로 하기 수식 1 및 2에 의해 산출된 제1 가중치와 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 선형회귀 상수(linear regression coefficient)를 기반으로 산출된 제2 가중치 중 더 작은 오차를 갖는 가중치를 미리 결정한 후, 예측 시기에 따라 상기 결정된 가중치를 적용하여 상기 최종 예측 데이터를 생성하는 것을 특징으로 하는, 슈퍼앙상블 기법을 이용한 대기 온도 예측 방법:
    [수식 1]
    Figure 112022137883110-pat00106

    [수식 2]
    Figure 112022137883110-pat00107

    [수식 3]
    Figure 112022137883110-pat00108

    상기 수식 1, 2에서,
    Figure 112022137883110-pat00109
    Figure 112022137883110-pat00110
    은 N개의 수리학적 예측 모델 중 i-번째 모델의 RMSE(root-mean-square-errors) 및 가중치를 각각 나타내고,
    Figure 112022137883110-pat00111
    ,
    Figure 112022137883110-pat00112
    Figure 112022137883110-pat00113
    는 트레이닝 기간, 상기 트레이닝 기간 내의 시간 t에서의 i번째 모델에 의해 생성된 기온 예측 데이터 및 실제 기온 데이터를 각각 나타내고,
    상기 수식 3에서,
    Figure 112022137883110-pat00114
    는 장래 시간 t에서의 최종 예측 데이터이고,
    Figure 112022137883110-pat00115
    은 기 설정된 과거 시간으로부터 현재 시간까지의 실제 관측 데이터의 평균값이고,
    Figure 112022137883110-pat00116
    는 i-번째 모델의 장래 시간 t에서의 실시간 예측값이고,
    Figure 112022137883110-pat00117
    는 i-번째 모델의 장래 시간 t까지의 과거 예측값들의 평균값이며,
    Figure 112022137883110-pat00118
    는 i-번째 모델의 가중치이다.
  8. 복수의 수리학적 예측 모델들을 포함하는 수리학적 예측 모델부;
    대상 지역의 실제 온도 데이터들을 저장하는 기온 정보 저장부;
    예측 시간보다 앞선 트레이닝 기간 동안의 상기 복수의 수리학적 예측 모델들에 의해 생성된 상기 대상 지역의 기온 예측 데이터들과 상기 트레이닝 기간 동안의 상기 대상 지역의 실제 온도 데이터들과 비교함으로써 상기 복수의 수리학적 예측 모델들 각각의 가중치를 산출하는 가중치 생성부: 및
    상기 복수의 수리학적 예측 모델들에 의해 생성된 예측 데이터들을 상기 가중치 정보를 반영한 후 이들을 슈퍼 앙상블 기법으로 합산함으로써, 장래 시간의 상기 대상 지역의 기온과 관련한 최종 예측 데이터를 하기 수식 3에 따라 생성하는 예측 기온 생성부;를 포함하고,
    상기 가중치 생성부는, 상기 수리학적 예측 모델의 예측 데이터들에 대한 RMSE(root-mean-square-errors)를 기반으로 하기 수식 1 및 2에 의해 산출된 제1 가중치 및 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 선형회귀 상수(linear regression coefficient)를 기반으로 산출된 제2 가중치를 생성하고,
    상기 예측 기온 생성부는, 상기 복수의 수리학적 예측 모델들에 의해 생성된 기온 예측 데이터의 평균값이 기설정된 온도 이상인 경우에는 상기 제1 가중치를 적용하여 상기 최종 예측 데이터를 생성하고, 상기 평균값이 기설정된 온도 미만인 경우에는 상기 제2 가중치를 적용하여 상기 최종 예측 데이터를 생성하는 것을 특징으로 하는, 기온 예측 시스템:
    [수식 1]
    Figure 112022137883110-pat00119

    [수식 2]
    Figure 112022137883110-pat00120

    [수식 3]
    Figure 112022137883110-pat00121

    상기 수식 1, 2에서,
    Figure 112022137883110-pat00122
    Figure 112022137883110-pat00123
    은 N개의 수리학적 예측 모델 중 i-번째 모델의 RMSE(root-mean-square-errors) 및 가중치를 각각 나타내고,
    Figure 112022137883110-pat00124
    ,
    Figure 112022137883110-pat00125
    Figure 112022137883110-pat00126
    는 트레이닝 기간, 상기 트레이닝 기간 내의 시간 t에서의 i번째 모델에 의해 생성된 기온 예측 데이터 및 실제 기온 데이터를 각각 나타내고,
    상기 수식 3에서,
    Figure 112022137883110-pat00127
    는 장래 시간 t에서의 최종 예측 데이터이고,
    Figure 112022137883110-pat00128
    은 기 설정된 과거 시간으로부터 현재 시간까지의 실제 관측 데이터의 평균값이고,
    Figure 112022137883110-pat00129
    는 i-번째 모델의 장래 시간 t에서의 실시간 예측값이고,
    Figure 112022137883110-pat00130
    는 i-번째 모델의 장래 시간 t까지의 과거 예측값들의 평균값이며,
    Figure 112022137883110-pat00131
    는 i-번째 모델의 가중치이다.
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 복수의 수리학적 예측 모델들을 포함하는 수리학적 예측 모델부;
    대상 지역의 실제 온도 데이터들을 저장하는 기온 정보 저장부;
    예측 시간보다 앞선 트레이닝 기간 동안의 상기 복수의 수리학적 예측 모델들에 의해 생성된 상기 대상 지역의 기온 예측 데이터들과 상기 트레이닝 기간 동안의 상기 대상 지역의 실제 온도 데이터들과 비교함으로써 상기 복수의 수리학적 예측 모델들 각각의 가중치를 산출하는 가중치 생성부: 및
    상기 복수의 수리학적 예측 모델들에 의해 생성된 예측 데이터들을 상기 가중치 정보를 반영한 후 이들을 슈퍼 앙상블 기법으로 합산함으로써, 장래 시간의 상기 대상 지역의 기온과 관련한 최종 예측 데이터를 하기 수식 3에 따라 생성하는 예측 기온 생성부;를 포함하고,
    상기 가중치 생성부는, 상기 수리학적 예측 모델의 예측 데이터들에 대한 RMSE(root-mean-square-errors)를 기반으로 하기 수식 1 및 2에 의해 산출된 제1 가중치 및 상기 복수의 수리학적 예측 모델의 예측 데이터들에 대한 선형회귀 상수(linear regression coefficient)를 기반으로 산출된 제2 가중치를 생성하고,
    상기 가중치 생성부는 예측 시기별로 상기 제1 가중치와 상기 제2 가중치 중 더 작은 오차를 갖는 가중치를 미리 결정하고,
    상기 예측 기온 생성부는 예측하고자 하는 시기별로 상기 제1 가중치와 상기 제2 가중치 중 결정된 가중치를 적용하여 상기 최종 예측 데이터를 생성하는 것을 특징으로 하는, 기온 예측 시스템:
    [수식 1]
    Figure 112022137883110-pat00132

    [수식 2]
    Figure 112022137883110-pat00133

    [수식 3]
    Figure 112022137883110-pat00134

    상기 수식 1, 2에서,
    Figure 112022137883110-pat00135
    Figure 112022137883110-pat00136
    은 N개의 수리학적 예측 모델 중 i-번째 모델의 RMSE(root-mean-square-errors) 및 가중치를 각각 나타내고,
    Figure 112022137883110-pat00137
    ,
    Figure 112022137883110-pat00138
    Figure 112022137883110-pat00139
    는 트레이닝 기간, 상기 트레이닝 기간 내의 시간 t에서의 i번째 모델에 의해 생성된 기온 예측 데이터 및 실제 기온 데이터를 각각 나타내고,
    상기 수식 3에서,
    Figure 112022137883110-pat00140
    는 장래 시간 t에서의 최종 예측 데이터이고,
    Figure 112022137883110-pat00141
    은 기 설정된 과거 시간으로부터 현재 시간까지의 실제 관측 데이터의 평균값이고,
    Figure 112022137883110-pat00142
    는 i-번째 모델의 장래 시간 t에서의 실시간 예측값이고,
    Figure 112022137883110-pat00143
    는 i-번째 모델의 장래 시간 t까지의 과거 예측값들의 평균값이며,
    Figure 112022137883110-pat00144
    는 i-번째 모델의 가중치이다.
KR1020220114815A 2022-09-13 2022-09-13 슈퍼앙상블 기법을 이용한 표면 대기 온도 예측 방법 및 시스템 KR102490498B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220114815A KR102490498B1 (ko) 2022-09-13 2022-09-13 슈퍼앙상블 기법을 이용한 표면 대기 온도 예측 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220114815A KR102490498B1 (ko) 2022-09-13 2022-09-13 슈퍼앙상블 기법을 이용한 표면 대기 온도 예측 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR102490498B1 true KR102490498B1 (ko) 2023-01-18

Family

ID=85106565

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220114815A KR102490498B1 (ko) 2022-09-13 2022-09-13 슈퍼앙상블 기법을 이용한 표면 대기 온도 예측 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR102490498B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117390875A (zh) * 2023-10-27 2024-01-12 长安大学 一种大气加权平均温度模型的构建方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101092380B1 (ko) * 2011-04-29 2011-12-13 공주대학교 산학협력단 지역기후모델의 모의결과를 고려한 지역기후 앙상블 예측 방법
US20160299255A1 (en) * 2014-09-12 2016-10-13 The Climate Corporation Weather forecasts through post-processing
CN112180472A (zh) * 2020-09-28 2021-01-05 南京北极光智能科技有限公司 一种基于深度学习的大气能见度集成预报方法
KR20220076748A (ko) * 2020-12-01 2022-06-08 주식회사 동녘 기상 예측 정보 생성 방법 및 이를 수행하기 위한 컴퓨팅 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101092380B1 (ko) * 2011-04-29 2011-12-13 공주대학교 산학협력단 지역기후모델의 모의결과를 고려한 지역기후 앙상블 예측 방법
US20160299255A1 (en) * 2014-09-12 2016-10-13 The Climate Corporation Weather forecasts through post-processing
CN112180472A (zh) * 2020-09-28 2021-01-05 南京北极光智能科技有限公司 一种基于深度学习的大气能见度集成预报方法
KR20220076748A (ko) * 2020-12-01 2022-06-08 주식회사 동녘 기상 예측 정보 생성 방법 및 이를 수행하기 위한 컴퓨팅 장치

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Chui, Timothy Chun-Yiu. On the use of multiple planetary boundary layer parameterization schemes forecasting temperature and precipitation in complex terrain. Vancouver : University of British Columbia Library. 2017.01.31* *
ZHI Xiefei 외 3명. A Comparison of Three Kinds of Multimodel Ensemble Forecast Techniques Based on the TIGGE Data. Journal of Meteorological Research. 2012.02.28, Vol.26, No.1* *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117390875A (zh) * 2023-10-27 2024-01-12 长安大学 一种大气加权平均温度模型的构建方法
CN117390875B (zh) * 2023-10-27 2024-03-12 长安大学 一种大气加权平均温度模型的构建方法

Similar Documents

Publication Publication Date Title
Zhang et al. The Pacific meridional mode and the occurrence of tropical cyclones in the western North Pacific
Maurer et al. Utility of daily vs. monthly large-scale climate data: an intercomparison of two statistical downscaling methods
Li et al. A model output machine learning method for grid temperature forecasts in the Beijing area
Jones et al. Influence of the Madden–Julian oscillation on forecasts of extreme precipitation in the contiguous United States
CN103117546B (zh) 一种超短期风电功率滑动预测方法
CN111611692B (zh) 气候变化情景下基于等可靠度的设计洪水推求方法及系统
KR102490498B1 (ko) 슈퍼앙상블 기법을 이용한 표면 대기 온도 예측 방법 및 시스템
Akyurek et al. Tesla: Taylor expanded solar analog forecasting
Fauzi et al. Bias correction and statistical downscaling of earth system models using quantile delta mapping (QDM) and bias correction constructed analogues with quantile mapping reordering (BCCAQ)
Ehsan et al. Impact of different cumulus parameterization schemes in SAUDI-KAU AGCM
Loridan et al. Parametric modeling of transitioning cyclone wind fields for risk assessment studies in the western North Pacific
Yang et al. Low cloud–SST feedback over the subtropical northeast Pacific and the remote effect on ENSO variability
Dong et al. Simulation of United States mesoscale convective systems using GFDL’s new high-resolution general circulation model
CN117293809A (zh) 一种基于大模型的多时空尺度新能源发电功率预测方法
CN114819264A (zh) 一种基于时空依赖的光伏电站辐照度超短期预测方法及存储介质
Hou et al. Improving the forecast accuracy of ECMWF 2-m air temperature using a historical dataset
KR100993684B1 (ko) 매든-줄리안 진동의 예측 방법
Chung et al. Using urban effect corrected temperature data and a tree phenology model to project geographical shift of cherry flowering date in South Korea
Schreck et al. Sources of tropical subseasonal skill in the CFSv2
Jones A homogeneous stochastic model of the Madden–Julian oscillation
Chaudhuri et al. Neuro-computing based short range prediction of some meteorological parameters during the pre-monsoon season
CN117076738A (zh) 基于变网格模型的中长期气象预测方法、系统及介质
Tseng et al. Fast and slow responses of the tropical pacific to radiative forcing in northern high latitudes
KR20180060286A (ko) 단시간 강수 예측의 정확도 향상을 위한 보정 방법 및 시스템
Yun et al. Underlying mechanisms leading to El Niño-to-La Niña transition are unchanged under global warming

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant