KR101088082B1 - System of searching similar weather map by principle component analysis and the method thereof - Google Patents

System of searching similar weather map by principle component analysis and the method thereof Download PDF

Info

Publication number
KR101088082B1
KR101088082B1 KR1020100120044A KR20100120044A KR101088082B1 KR 101088082 B1 KR101088082 B1 KR 101088082B1 KR 1020100120044 A KR1020100120044 A KR 1020100120044A KR 20100120044 A KR20100120044 A KR 20100120044A KR 101088082 B1 KR101088082 B1 KR 101088082B1
Authority
KR
South Korea
Prior art keywords
weather
map
matrix
weather map
encoding
Prior art date
Application number
KR1020100120044A
Other languages
Korean (ko)
Inventor
오승준
진기범
이재원
이영조
오희석
Original Assignee
(주)에스이랩
주식회사 엘지씨엔에스
오희석
이재원
이영조
진기범
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)에스이랩, 주식회사 엘지씨엔에스, 오희석, 이재원, 이영조, 진기범 filed Critical (주)에스이랩
Priority to KR1020100120044A priority Critical patent/KR101088082B1/en
Application granted granted Critical
Publication of KR101088082B1 publication Critical patent/KR101088082B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE: A system of searching similar weather map by principle component analysis and a method thereof are provided to enable a rapid and accurate weather forecast by statistically analyzing and searching old weather map data based on a PCA(Principal Component Analysis). CONSTITUTION: A base weather map generator(220) produces the eigenvector from a weather component data and creates base weather map matrix. A decomposition matrix calculator(240) calculates the decomposition matrix from the base weather map matrix. A similar weather map searcher(270) outputs an encoding matrix by calculating the search object weather map with the decomposition matrix. The similar weather map searcher searches the similar weather map with similar range by comparing the encoding matrix with the encoding matrix of each old weather map.

Description

주성분 분석에 의한 유사 일기도 검색 시스템 및 그 방법{System of searching similar weather map by principle component analysis and the method thereof}System of searching similar weather map by principle component analysis and the method

본 발명은 유사 일기도 검색 시스템 및 그 방법에 관한 것으로, 보다 상세하게는 주성분 분석에 의해 검색 대상 일기도와 유사한 과거 일기도를 검색하는 주성분 분석에 의한 유사 일기도 검색 시스템 및 그 방법에 관한 것이다. The present invention relates to a similar weather map search system and a method thereof, and more particularly, to a similar weather map search system and method by principal component analysis for searching past weather maps similar to the search target weather map by principal component analysis.

지구는 오래 동안 인류가 태어나고 일생을 살아가며 후손을 이어가는 중요한 삶의 터전이며, 이러한 지구는 인간이 살기에 편안한 쾌적한 날씨 또는 기후의 환경을 제공하지만 온도, 바람, 습도 등이 포함되는 기후의 급속한 변화는 때로 인간에게 살기 어려운 환경을 제공한다.The Earth is an important place of life where humans are born, live their lives, and continue their descendants, and while these planets provide a comfortable climate or climate for humans to live in, the rapid changes in climate, including temperature, wind and humidity, Sometimes it provides a difficult environment for humans.

이러한 기후의 급속한 변화에는 태풍, 회오리바람, 황사, 안개, 폭우, 대설 등이 포함되며 이러한 현상을 기상 변화 또는 기후변화라 하고, 급속한 기상의 변화는 천연적인 자연재해를 불러오며, 이러한 자연재해를 미리 확인 또는 예측하는 경우, 예방하거나 피해를 최대한 줄일 수 있는 것이 일반적이다.Rapid changes in climate include typhoons, tornadoes, yellow dust, fog, heavy rain, and heavy snow. These phenomena are called weather changes or climate changes, and rapid weather changes lead to natural disasters. If identified or predicted in advance, it is common to be able to prevent or minimize the damage as much as possible.

지구상에서의 기후 변화는 매우 넓은 지역의 환경 변화에 의하여 발생하고, 그 발생범위도 매우 크고 넓으며, 서서히 다가오지만 일단 다가오면 매우 강력한 영향을 미치어 인간의 생활을 바꾸게 된다.Climate change on Earth is caused by environmental changes in a very large area, its range is very large and wide, and it is approaching slowly, but once approached, it has a very powerful effect on human life.

지구상의 넓은 지역에서 온도, 바람, 습도 등의 환경변화를 감시 또는 관측하고 축적 관리하여 분석하는 경우 기후변화를 예측할 수 있고, 특히, 인공위성을 이용하면 매우 넓은 지역의 기후변화를 3 차원의 공간정보와 이미지와 함께 감시하므로 기후변화의 예측 정확도가 높아지므로, 인공위성을 이용한 기후 관측의 활용도와 중요성이 점차 증가하고 있다.When monitoring, observing, accumulating, and analyzing environmental changes such as temperature, wind, and humidity in large areas of the earth, climate change can be predicted. Monitoring with and images increases the accuracy of forecasting climate change, so the use and importance of climate observations using satellites is increasing.

일기도(weather chart/map)는 어떤 지역의 특정 시각의 기상 상태를 파악하기 위해서 기온, 기압, 풍향, 풍속 등을 숫자, 기호, 등치선 등으로 표현한 지도이다. 일반적으로 기상 예보관은 이와 같은 일기도를 분석하여 기상을 예측하며, 보다 신뢰성 있는 예측을 하기 위해 과거의 일기도 중에서 유사한 일기도를 검색하여 비교하게 된다. 즉, 정확하고 신속한 예보를 위해서 예보관에게 필요한 것은 현재와 가장 유사한 과거 자료를 확보하여 예보에 활용하는 것이다.Weather charts (maps) are weather, air pressure, wind direction, wind speed, etc. in numbers, symbols, and isolines to identify weather conditions at specific times in a given area. In general, the weather forecaster predicts the weather by analyzing such weather maps, and searches and compares similar weather maps from past weather maps to make more reliable predictions. In other words, the forecaster's need for accurate and rapid forecasting is to obtain historical data that is most similar to the present and use it for forecasting.

이때, 기상 예보관이 과거의 일기도 자료를 검색하여 현재 일기도와 유사한 일기도를 찾고자 할 경우, 이러한 작업이 모두 수작업으로 이루어지기 때문에 방대한 과거 자료로부터 유사한 일기도를 찾는 것이 용이하지 않으며, 상당한 시간을 요구하게 된다. 또한, 일기도 간의 유사성 비교를 기상 예보관의 육안에 의존하기 때문에 신속성과 정확도가 떨어지게 되는 단점이 있다.At this time, if the weather forecaster searches for the weather map data of the past to find a weather map similar to the current weather map, it is not easy to find similar weather maps from the vast past data because all these operations are performed by hand. do. In addition, the similarity between weather maps depends on the naked eye of the weather forecaster.

따라서, 과거의 누적된 일기도 데이터로부터 현재 일기도와 유사한 일기도를 효과적으로 검색할 수 있는 과학적인 방법이 절실히 요구되고 있다.
Therefore, there is an urgent need for a scientific method capable of effectively retrieving weather maps similar to the current weather map from past accumulated weather map data.

본 발명의 목적은 주성분 분석에 의해 과거 일기도를 검색 대상 일기도와 비교하여 유사 일기도를 검색함으로써 신속하고 정확한 기상 예보를 제공하는 주성분 분석에 의한 유사 일기도 검색 시스템 및 그 방법을 제공함에 있다.SUMMARY OF THE INVENTION An object of the present invention is to provide a system and method for retrieving a similar weather map by principal component analysis that provides a quick and accurate weather forecast by searching for a similar weather map by comparing a past weather map with a search target weather map by principal component analysis.

또한, 본 발명의 목적은 각 기상 요소에 대해 주성분 분석을 통해 기저 일기도를 생성하고, 분해 매트릭스에 의해 개별 일기도를 인코딩 매트릭스로 표현함으로써 유사 일기도의 검색을 신속하고 신뢰성 있게 할 수 있는 주성분 분석에 의한 유사 일기도 검색 시스템 및 그 방법을 제공함에 있다.
In addition, an object of the present invention is to generate a base weather map through the principal component analysis for each meteorological element, and by the principal component analysis that can quickly and reliably search for similar weather maps by expressing individual weather maps as encoding matrices by decomposition matrix. A similar weather map search system and method are provided.

상기한 목적을 달성하기 위하여, 본 발명에 따른 유사 일기도 검색 시스템은 복수의 과거 일기도 자료에서 지도 상의 특정 영역에 대해 적어도 하나의 기상 관련 요소를 디지털 데이터로 저장하는 과거 일기도 데이터베이스; 상기 과거 일기도 데이터베이스에 저장된 각 기상 관련 요소별 디지털 데이터로부터 주성분 분석에 의해 고유 벡터를 산출하여 기저 일기도 매트릭스를 생성하는 기저 일기도 생성부; 상기 생성된 기저 일기도 매트릭스로부터 검색 대상 일기도의 인코딩 매트릭스 산출을 위한 분해 매트릭스를 산출하는 분해 매트릭스 산출부; 상기 분해 매트릭스 산출부에서 산출된 상기 분해 매트릭스로 상기 과거 일기도 데이터베이스에 저장된 개별 과거 일기도의 데이터와 연산하여 각 개별 과거 일기도에 대한 인코딩 매트릭스를 산출하는 인코딩 매트릭스 산출부; 상기 인코딩 매트릭스 산출부에서 산출된 각 개별 과거 일기도에 대한 상기 인코딩 매트릭스를 해당 과거 일기도 정보에 대한 식별자와 매핑하여 저장하는 인코딩 매트릭스 데이터베이스; 및 검색 대상 일기도를 상기 분해 매트릭스와 연산하여 인코딩 매트릭스를 산출하고, 상기 산출된 해당 검색 대상 일기도에 대한 인코딩 매트릭스를 상기 인코딩 매트릭스 데이터베이스에 저장된 개별 과거 일기도에 대한 각 인코딩 매트릭스와 비교하여 가장 유사한 과거 일기도를 검색하는 유사 일기도 검색부;를 포함한다.In order to achieve the above object, the similar weather map search system according to the present invention comprises a past weather map database for storing at least one weather-related element as a digital data for a specific area on the map from a plurality of past weather map data; A base weather map generator for generating a base weather map matrix by calculating eigenvectors by principal component analysis from digital data for each weather-related element stored in the past weather map database; A decomposition matrix calculator for calculating a decomposition matrix for calculating an encoding matrix of a search target weather map from the generated base weather map matrix; An encoding matrix calculator configured to calculate an encoding matrix for each individual past weather map by calculating the decomposition matrix calculated by the decomposition matrix calculation unit with data of the individual past weather maps stored in the past weather map database; An encoding matrix database configured to map the encoding matrix for each individual past weather map calculated by the encoding matrix calculator to an identifier for corresponding past weather information and to store the encoding matrix; And calculating the encoding matrix by calculating a search target weather map with the decomposition matrix, and comparing the calculated encoding matrix for the search target weather map with each encoding matrix for individual past weather maps stored in the encoding matrix database. Includes; similar weather search for searching for.

또한, 상기 시스템은 상기 기저 일기도 생성부에서 산출된 상기 기저 일기도 매트릭스와 상기 인코딩 매트릭스의 연산에 의해 재생산된 일기도의 데이터를 상기 주성분 분석하기 전 원래의 일기도 데이터와 비교하여 상기 기저 일기도 매트릭스를 검증하는 기저 일기도 검증부;를 더 포함하는 것을 특징으로 한다.The system also compares the data of the weather map generated by the calculation of the base weather map generation unit and the encoding matrix with the original weather map data before the principal component analysis to compare the data of the weather map reproduced by the calculation of the encoding matrix. And a basic weather map verification unit for verifying the matrix.

이때, 상기 기상 관련 요소는 특정 기압을 기준으로 설정된 고도장, 온도장, 해면기압, 습수장 및 와도장 중에서 선택된 어느 하나 이상인 것을 특징으로 한다.At this time, the weather-related element is characterized in that at least one selected from the altitude field, temperature field, sea level air pressure, moist water field and the wado coating set on the basis of a specific air pressure.

또한, 상기 인코딩 매트릭스 산출부는 상기 산출된 개별 과거 일기도에 대한 인코딩 매트릭스를 최근접 이웃 방법을 사용하여 범주화하고, 해당 범주값을 상기 인코딩 매트릭스 데이터베이스에 저장하는 것을 특징으로 한다.The encoding matrix calculator may categorize an encoding matrix for the calculated individual past weather maps using a nearest neighbor method, and store corresponding category values in the encoding matrix database.

한편, 상기 유사 일기도 검색부는 n개의 인코딩을 이용한 n-차원 거리로 검색하는 방법, 제1 주성분의 인코딩을 먼저 검색한 후 나머지 인코딩을 이용하여 n-1차원 거리로 검색하는 방법, 제1 및 제2 주성분의 인코딩을 먼저 검색한 후 나머지 인코딩을 이용하여 n-2차원 거리로 검색하는 방법 중에서 선택된 어느 하나의 방법으로 유사 일기도를 검색하는 것을 특징으로 한다.On the other hand, the likelihood weather searcher searches for n-dimensional distances using n encodings, first searches for encodings of a first principal component, and then searches for n-1-dimensional distances using the remaining encodings, first and The first weather element may be searched for an encoding of the second principal component, and then the similar weather map may be searched by one of the methods selected from the n-2 dimensional distances using the remaining encodings.

또한, 상기 유사 일기도 검색부는 상기 인코딩 매트릭스의 유발성 분할표를 생성하고, 상기 생성된 우발성 분할표의 스코어를 산출하여 유사 일기도를 검색하는 것을 특징으로 한다.The similarity map search unit may generate an incidence dividing table of the encoding matrix, and calculate a score of the generated contingency dividing table to search for similar weather maps.

아울러, 상기 유사 일기도 검색부는 상기 검색 대상 일기도에 대한 인코딩 매트릭스와 개별 과거 일기도에 대한 각 인코딩 매트릭스 사이의 기울기 및 상관 계수를 산출하여 유사 일기도를 검색하는 것을 특징으로 한다.The similarity map search unit may search for the similar weather map by calculating a slope and a correlation coefficient between the encoding matrix for the search target weather map and each encoding matrix for the individual past weather map.

상기한 목적을 달성하기 위하여, 본 발명에 따른 유사 일기도 검색 방법은 복수의 과거 일기도 자료에서 지도 상의 특정 영역에 대해 적어도 하나의 기상 관련 요소를 디지털 데이터로 데이터베이스에 저장하는 단계; 상기 데이터베이스에 저장된 각 기상 관련 요소별 디지털 데이터로부터 주성분 분석에 의해 고유 벡터를 산출하여 기저 일기도 매트릭스를 생성하는 단계; 상기 생성된 기저 일기도 매트릭스로부터 검색 대상 일기도의 인코딩 매트릭스 산출을 위한 분해 매트릭스를 산출하는 단계; 상기 산출된 분해 매트릭스로 상기 데이터베이스에 저장된 개별 과거 일기도의 데이터와 연산하여 각 개별 과거 일기도에 대한 인코딩 매트릭스를 산출하는 단계; 상기 산출된 각 개별 과거 일기도에 대한 상기 인코딩 매트릭스를 해당 과거 일기도 정보에 대한 식별자와 매핑하여 데이터베이스에 저장하는 단계; 검색 대상 일기도를 상기 분해 매트릭스와 연산하여 인코딩 매트릭스를 산출하는 단계; 및 상기 산출된 해당 검색 대상 일기도에 대한 인코딩 매트릭스를 상기 데이터베이스에 저장된 개별 과거 일기도에 대한 각 인코딩 매트릭스와 비교하여 가장 유사한 과거 일기도를 검색하는 단계;를 포함한다.
In order to achieve the above object, the similar weather map search method according to the present invention comprises the steps of: storing at least one weather-related element as digital data in a database for a specific area on a map in a plurality of historical weather data; Generating a basis weather map matrix by calculating eigenvectors by principal component analysis from digital data for each weather related element stored in the database; Calculating a decomposition matrix for calculating an encoding matrix of a search target weather map from the generated base weather map matrix; Calculating an encoding matrix for each individual past weather map by calculating the data of the individual past weather maps stored in the database using the calculated decomposition matrix; Mapping the calculated matrix for each individual past weather map to an identifier for corresponding past weather map information and storing it in a database; Calculating an encoding matrix by calculating a search target weather map with the decomposition matrix; And searching the most similar past weather map by comparing the calculated encoding matrix for the corresponding search target weather map with each encoding matrix for the individual past weather maps stored in the database.

본 발명에 따르면, 종래에 수작업으로 일일이 과거 일기도 자료를 비교하였던 것을 주성분 분석을 이용하여 통계학적으로 분석하여 검색함으로써 신속하고 정확한 일기 예보가 가능하게 되는 장점이 있다.According to the present invention, it is possible to perform a quick and accurate weather forecast by statistically analyzing and retrieving the past weather map data manually by hand using the principal component analysis.

또한, 일기도를 구성하는 각 요소별 데이터를 주성분 분석에 의해 손실 없이 적은 차원의 자료로 축소하여 나타냄으로써 데이터 처리 속도가 향상되며, 신뢰도 높은 검색 결과를 얻을 수 있는 장점이 있다.In addition, the data processing speed is improved by reducing the data of each element constituting the weather map into data of a small dimension without loss by principal component analysis, and has the advantage of obtaining a reliable search result.

또한, 본 발명에 따른 주성분 분석을 이용한 유사 일기도 검색 시스템에 의해 기상 예보관뿐만 아니라 일반인도 현재 날씨를 기준으로 유사한 일기도를 검색할 수 있다. 따라서, 비전문가인 일반인도 검색된 유사 일기도에 따라 용이하게 기상을 예측할 수가 있는 장점이 있다.In addition, the similar weather map search system using the principal component analysis according to the present invention can search similar weather maps based on the current weather as well as the weather forecaster. Therefore, there is an advantage that the ordinary person who is not an expert can easily predict the weather according to the searched similar weather map.

아울러, 본 발명에 따른 주성분 분석을 이용한 유사 일기도 검색 시스템을 프로그램화하여 개인 또는 기업에 판매할 경우, 이에 따른 수익 창출이 가능하며, 기상청에 의해 국한된 종래의 기상 예보 시스템에서 더 나아가 다양한 루트를 통한 기상 예보가 가능해진다. 이에 따라, 일반인으로 하여금 기상 예보 선택의 폭이 넓어지며, 경쟁을 통해 보다 신뢰성 있는 기상 예보가 가능하게 된다.In addition, when a similar weather map search system using a principal component analysis according to the present invention is programmed and sold to an individual or a company, revenue can be generated according to the present invention. The weather forecast through this is possible. As a result, the general public has a wider choice of weather forecasts, and competition enables more reliable weather forecasts.

한편, 본 발명에 따른 주성분 분석을 이용한 유사 일기도 검색 시스템을 프로그램화하여 개인 또는 기업에 배포할 경우, 과거 일기도와 관련된 데이터는 기상청 서버 등을 통해 네트워크로 공유하고, 검색 시스템은 웹상에서 구현되도록 함으로써 검색자의 컴퓨터 단말기가 고사양이 아니더라도 본 발명에 따른 검색 시스템의 구현이 가능할 수가 있게 되는 장점이 있다.
Meanwhile, when a similar weather map search system using a principal component analysis according to the present invention is programmed and distributed to an individual or a company, the data related to past weather maps are shared to a network through a meteorological office server, and the search system is implemented on the web. As a result, even if the searcher's computer terminal is not a high specification, the search system according to the present invention can be implemented.

도 1은 본 발명에 따른 주성분 분석에 의한 유사 일기도 검색 시스템의 개념을 나타내는 도면.
도 2는 본 발명에 따른 주성분 분석에 의한 유사 일기도 검색 시스템의 구성도.
도 3은 본 발명에 따른 주성분 분석에 의한 유사 일기도 검색 절차를 나타내는 흐름도.
도 4는 본 발명의 실시예에 따른 기저 일기도 산출 및 검증 절차를 나타내는 흐름도.
도 5는 본 발명의 실시예에 따른 인코딩 매트릭스 산출 절차를 나타내는 흐름도.
도 6은 본 발명의 실시예에 따른 유사 일기도 추출 절차를 나타내는 흐름도.
도 7은 본 발명의 실시예에 따라 기저 일기도 확정을 위한 과거 데이터의 선정 영역을 나타내는 도면.
도 8은 본 발명의 실시예에 따라 결정된 기저 일기도를 나타내는 도면.
도 9는 본 발명의 실시예에 따른 도 8에서 결정된 기저 일기도의 오차를 검증하는 그래프.
도 10은 본 발명의 실시예에 따라 거리에 의해 검색된 유사 일기도를 나타내는 도면.
도 11은 본 발명의 실시예에 따라 스코어에 의해 검색된 유사 일기도를 나타내는 도면.
도 12 및 도 13은 본 발명의 실시예에 따라 기울기와 상관계수에 의해 검색된 유사 일기도를 나타내는 도면.
도 14는 본 발명의 실시예에 따라 주성분 개수와 오차와의 관계를 나타내는 그래프.
도 15는 본 발명의 실시예에 따라 주성분 개수와 거리감소율의 관계를 나타내는 그래프.
1 is a view showing the concept of a similar weather map search system by the principal component analysis according to the present invention.
Figure 2 is a block diagram of a system for searching similar weather maps by principal component analysis according to the present invention.
3 is a flow chart showing a similar weather map search procedure by principal component analysis according to the present invention.
4 is a flow chart illustrating a basis weather map calculation and verification procedure according to an embodiment of the present invention.
5 is a flowchart illustrating an encoding matrix calculation procedure according to an embodiment of the present invention.
6 is a flowchart illustrating a similar weather map extraction procedure according to an embodiment of the present invention.
7 is a view showing a selection area of past data for determining a base weather map according to an embodiment of the present invention.
8 is a diagram showing a basal weather map determined according to an embodiment of the present invention.
FIG. 9 is a graph verifying an error of a base weather map determined in FIG. 8 according to an embodiment of the present invention. FIG.
FIG. 10 illustrates a similar weather map retrieved by distance in accordance with an embodiment of the present invention. FIG.
FIG. 11 illustrates a similar weather map retrieved by score, in accordance with an embodiment of the invention. FIG.
12 and 13 illustrate similar weather maps retrieved by slope and correlation coefficient in accordance with an embodiment of the present invention.
14 is a graph showing the relationship between the number of principal components and an error according to an embodiment of the present invention.
15 is a graph showing a relationship between the number of principal components and a distance reduction rate according to an embodiment of the present invention.

본 발명은 과거의 누적된 일기도 데이터로부터 현재 일기도와 유사한 일기도를 효과적으로 검색할 수 있는 방법을 제안한다. 이를 위해, 본 발명에서는 과거의 누적된 일기도 데이터를 디지털 데이터로 저장하고, 개별 일기도 데이터가 가지는 특징 성분들을 수치화함으로써 현재 일기도 데이터와 비교하게 된다.The present invention proposes a method for effectively retrieving a weather map similar to the current weather map from past accumulated weather map data. To this end, the present invention stores the accumulated weather map data of the past as digital data, and compares the current weather data by digitizing the feature components of the individual weather map data.

한편, 본 발명에서는 일기도 데이터 분석에 주성분 분석 방법(Principle Component Analysys; PCA)을 적용하여 원본 데이터의 손실 없이 적은 차원의 자료로도 분석이 가능하게 된다. 즉, 과거 일기도 데이터의 각 기상 요소에 대해 주성분 분석을 통해 기저 일기도를 생성하고, 분해 매트릭스에 의해 개별 일기도를 인코딩 매트릭스로 표현한다. 그런 다음, 검색하고자 하는 대상 일기도의 인코딩 매트릭스를 상기 분해 매트릭스에 의해 산출하여 과거 일기도의 인코딩 매트릭스 값과 비교함으로써 신속하고 신뢰도 높은 유사 일기도를 검색할 수 있게 된다.On the other hand, in the present invention, by applying a principal component analysis method (PCA) to the weather data analysis, it is possible to analyze even small data without losing the original data. That is, a base weather map is generated through principal component analysis for each weather element of past weather map data, and an individual weather map is represented as an encoding matrix by a decomposition matrix. Then, by calculating the encoding matrix of the target weather map to be searched by the decomposition matrix and comparing it with the encoding matrix values of the past weather map, it is possible to search similar weather maps quickly and with high reliability.

본 발명을 설명하기에 앞서, 본 발명에 적용되는 주성분 분석 방법(Principle Component Analysys; PCA)을 간략히 설명하기로 한다. 주성분 분석은 다차원의 자료집합을 낮은 차원의 주성분 매트릭스와 인코딩 매트릭스로 분해하여 원자료가 가지는 특징의 손실 없이 적은 차원의 자료로 축소하는 데 사용되는 통계학 기법으로 패턴인식 등에 사용되고 있는 방법이다.Prior to describing the present invention, a principal component analysis method (PCA) applied to the present invention will be briefly described. Principal component analysis is a statistical technique used for pattern recognition, which is used to decompose multidimensional data sets into low dimensional principal component matrix and encoding matrix and to reduce them to small dimensional data without loss of original features.

즉, 주성분 분석 방법은 데이터 집합을 분석하는 방법으로서 데이터의 분산이 가장 커지는 축을 첫번째 주성분으로 하고, 두 번째로 커지는 축을 두번째 주성분으로 하며, 이와 같은 방법으로 새로운 좌표계로 데이터를 선형 변환함으로써 데이터 집합의 차원을 낮은 차원으로 변환하게 된다. 따라서, 다차원의 자료 집합을 훨씬 적은 차원의 자료 집합으로 줄이면서도 원 자료 집합의 변동 양상을 많이 반영할 수 있으며, 인코딩 매트릭스에서 원 데이터 복원시 경제적이면서 특징 추출의 용이성이 확보된다. In other words, the principal component analysis method is a method of analyzing a data set. The first principal component is the axis where the variance of data is the largest, and the second principal component is the second largest axis. You will convert the dimension to a lower dimension. Therefore, while reducing the multidimensional dataset to a much smaller dataset, it is possible to reflect a lot of variation of the original dataset, and it is economical and easy to extract features from the original data in the encoding matrix.

따라서, 고차원의 데이터 집합을 V라고 하면, 상기 고차원의 데이터 집합은 하기 <수학식 1>에서와 같이 저차원의 기저 매트릭스(W)와 인코딩 매트릭스(H)로 분해되어 해석될 수 있다.Therefore, if V is a high-dimensional data set, the high-dimensional data set may be interpreted by being decomposed into a low-order base matrix W and an encoding matrix H as shown in Equation 1 below.

Figure 112010078455677-pat00001
Figure 112010078455677-pat00001

예컨대, x, y, z 축의 3차워능로 분포되어 있는 데이터를 주성분을 2개로 설정하여 분석하는 경우, 제1 주성분(PC1)과 제2 주성분(PC2)의 좌표계로 표현되는 데이터로 재분포시킬 수 있다. 상기와 같이 주성분 분석 방법에 의해 원본 매트릭스를 인코딩 매트릭스로 분해할 경우, 기저 매트릭스와 다시 연산하면 원본 매트릭스를 다시 복구할 수 있다. 이때, 상기 주성분을 몇 개로 설정하는 지 여부에 따라서 원본 매트릭스와의 유사도가 결정된다. 즉, 주성분의 개수를 적절히 선택하게 되면 원본 데이터의 특징이 손실되지 않고 적은 차원의 자료로 축소할 수 있다.For example, when the data distributed by the third power capability of the x, y, and z axes are analyzed by setting two principal components, the data are redistributed into data represented by the coordinate system of the first principal component PC1 and the second principal component PC2. Can be. When the original matrix is decomposed into the encoding matrix by the principal component analysis method as described above, the original matrix can be recovered again by recalculating with the base matrix. At this time, the similarity with the original matrix is determined according to how many main components are set. In other words, if the number of principal components is properly selected, the original data can be reduced to a smaller dimension without losing the characteristics of the original data.

이하 본 발명의 바람직한 실시 예에 따른 상세한 설명을 첨부된 도면들을 참조하여 설명한다. 하기에는 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.DETAILED DESCRIPTION Hereinafter, a detailed description of a preferred embodiment of the present invention will be described with reference to the accompanying drawings. In the following description of the present invention, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear.

도 1은 본 발명에 따른 주성분 분석에 의한 유사 일기도 검색 시스템의 개념을 나타내는 도면이다. 도 1을 참조하면, 일기도 데이터베이스(DB)에 저장된 축적된 과거 일기도 데이터로부터 일기도의 특징을 수학적으로 가장 잘 나타낼 수 있는 기저 일기도(즉, 기저 일기도 매트릭스)를 작성(110)한다. 이때, 기저 일기도 생성을 위해 주성분 분석 방법(Principle Component Analysys; PCA)을 이용하게 된다. 1 is a view showing the concept of a similar weather map search system by the principal component analysis according to the present invention. Referring to FIG. 1, a base weather map (ie, a base weather map matrix) may be created 110, which may best represent mathematically the characteristics of a weather map from accumulated past weather data stored in a weather map database DB. At this time, Principle Component Analysys (PCA) is used to generate the basic weather map.

한편, 검색의 대상이 되는 과거 일기도는 GRIB(GRIdded Binary) 포맷의 디지털 일기도 데이터로 저장하는 것이 바람직하다. 예컨대, 유럽 중규모 기상 예보 센터로부터 확보된 ECMWF(European Centre for Medium-Range Weather Forecasts) 데이터 또는 기상청이 보유하는 과거 일기도를 대상으로 각 기압에 따른(500hPa, 700hPa, 850hPa 등) 고도장, 온도장, 습수장, 와도장, 해면 기압 등의 데이터를 GRIB 포맷의 디지털 데이터로 저장하여 분석할 수 있다. 상기 GRIB 포맷은 관측 영역에 격자별로 압력, 온도, 이슬점 등 여러 물리량이 레이어 개념으로 구성되어 있는 하나의 데이터 집합을 의미한다. 본 발명은 상기 언급한 데이터 외에도 일기도 상에서 각 영역에 대한 기상과 관련된 어떠한 데이터도 적용이 가능하다.On the other hand, the past weather map to be searched is preferably stored as digital weather map data in GRIB (GRIdded Binary) format. For example, in the European Center for Medium-Range Weather Forecasts (ECMWF) data obtained from the European Medium-Scale Weather Forecast Center or in the past weather maps held by the Meteorological Agency, the altitude, temperature field, Data such as wetlands, wades, and barometric pressure can be stored and analyzed as digital data in GRIB format. The GRIB format refers to a data set in which various physical quantities such as pressure, temperature, dew point, etc. are configured for each lattice in an observation region. The present invention can be applied to any data related to the weather for each region on the weather map in addition to the above-mentioned data.

이와 같이, 기저 일기도가 작성되면, 상기 작성된 기저 일기도와 인코딩 매트릭스로 재생산된 일기도를 원자료의 일기도 전체 집합과 비교함으로써 기저 일기도의 정확도를 검증하게 된다. 상기 검증을 통해 작성된 기저 일기도가 특정 신뢰 범위 이상을 만족할 경우, 해당 기저 일기도를 일기도 분석에 사용할 기저 일기도로 확정하게 된다. 이에 대한, 상세한 설명은 후술하기로 한다.As such, when the base weather map is created, the accuracy of the base weather map is verified by comparing the weather map reproduced with the created base weather map and the encoding matrix with the entire weather map set of the original data. When the base weather map generated through the verification satisfies a certain confidence range or more, the base weather map is determined as the base weather map to be used for the weather map analysis. Detailed description thereof will be described later.

다음으로, 상기 확정된 기저 일기도로부터 주성분 분석 방법에 따라 각 일기도에 대한 인코딩 매트릭스 산출을 위한 분해 매트릭스를 산출하게 된다. 그럼 다음, 데이터베이스에 기저장된 과거 일기도 데이터를 개별 일기도 단위로 상기 분해 매트릭스와 연산하여 인코딩 매트릭스를 계산(120)한다. 상기 계산된 각 개별 과거 일기도에 대한 인코딩 매트릭스는 인코딩 매트릭스 데이터베이스에 저장된다. 이때, 상기 계산된 인코딩 매트릭스는 해당 과거 일기도 정보에 대한 식별자와 매핑하여 저장하는 것이 바람직하다.Next, a decomposition matrix for calculating an encoding matrix for each weather map is calculated from the determined base weather map according to a principal component analysis method. Next, the encoding matrix is calculated 120 by calculating the past weather data stored in the database with the decomposition matrix in units of individual weather maps. The encoding matrix for each individual historical weather map calculated is stored in an encoding matrix database. In this case, it is preferable that the calculated encoding matrix is mapped and stored with the identifier for the past weather information.

한편, 검색 대상 일기도에 대한 데이터에 대해서도 상기 과거 일기도에 대해 연산한 방법과 같이 동일하게 분해 매트릭스와 연산함으로써, 해당 검색 대상 일기도에 대한 인코딩 매트릭스를 산출하게 된다. 이와 같이, 산출된 검색 대상 일기도에 대한 인코딩 매트릭스는상 상기 인코딩 매트릭스 데이터베이스에 저장된 각 개별 과거 일기도에 대한 인코딩 매트릭스와 비교하여 가장 유사한 일기도를 검색(130)하게 된다. 이때, 상기 검색된 인코딩 매트릭스와 매핑된 해당 과거 일기도 정보를 일기도 데이터베이스로부터 추출하여 결과를 출력하게 된다.On the other hand, the data for the search target weather map is calculated in the same way as the calculation method for the past weather map, and the encoding matrix for the search target weather map is calculated. As such, the calculated encoding matrix for the search target weather map is searched 130 for the most similar weather map by comparing with the encoding matrix for each individual past weather map stored in the encoding matrix database. At this time, the past weather map information mapped with the searched encoding matrix is extracted from a weather map database, and the result is output.

즉, 일기도 데이터베이스에 축적된 많은 과거 일기도 데이터들을 주성분 분석 방법에 의해 개별 일기도 단위로 인코딩 매트릭스로 해석하여 저장함으로써, 현재 일기도와 유사한 일기도를 신속하고 정확하게 검색할 수가 있게 된다.In other words, by analyzing and storing a lot of historical weather data stored in the weather map database as an encoding matrix in units of individual weather maps by the principal component analysis method, a weather map similar to the current weather map can be searched quickly and accurately.

이를 수학적으로 설명하면 다음과 같다. 검색 대상 일기도를 M 이라고 하면 상기 검색 대상 일기도는 주성분 분석 방법에 의해 하기 <수학식 2>와 같이 인코딩 값과 기저일기도의 연산으로 해석될 수 있다.This is explained mathematically as follows. If the search target weather map is M, the search target weather map may be interpreted as an operation of encoding value and base diaries, as shown in Equation 2, by a principal component analysis method.

Figure 112010078455677-pat00002
Figure 112010078455677-pat00002

이때, β(β1, β2, β3, ... βn)는 인코딩 값(encoding values)으로서, 고유값(eigen value)를 의미하고, 상기 B는 기저 일기도를 의미한다. 즉, 상기 <수학식 2>에서와 같이 검색 대상 일기도는 기저 일기도를 주성분 백터로 하는 낮은 차원의 데이터로 근사될 수 있다.In this case, β (β 1 , β 2 , β 3 , ... β n ) are encoding values, meaning eigen values, and B means base weather maps. That is, as shown in Equation 2, the search target weather map may be approximated with low-dimensional data having the base weather map as the main component vector.

한편, 기저 일기도 매트릭스(즉, 일기도 데이터의 고유 벡터(eigen vector))를 X'이라고 하면, 분해 매트릭스(decomposition matrix) D는 하기 <수학식 3>과 같이 나타낼 수 있다.On the other hand, if the basis weather matrix (i.e., eigen vector of the weather data) is X ', the decomposition matrix D can be expressed as Equation 3 below.

Figure 112010078455677-pat00003
Figure 112010078455677-pat00003

이때, X'은 X 매트릭스의 전치 행렬(transpose matrix)를 의미한다.In this case, X 'means a transpose matrix of the X matrix.

따라서, 상술한 바와 같이, 해당 분석 대상 일기도의 인코딩 매트릭스 H는 하기 <수학식 4>와 같이 산출된다.Therefore, as described above, the encoding matrix H of the analysis target weather map is calculated as in Equation 4 below.

Figure 112010078455677-pat00004
Figure 112010078455677-pat00004

즉, 검색 대상 일기도(M) 또는 개별 분석 대상 일기도와 상기 분해 매트릭스(M)를 연산함으로써 인코딩 매트릭스(H)를 산출하게 된다. 이때, 상기 산출된 인코딩 매트릭스(H)를 다시 기저 일기도 매트릭스(W)와 연산하면 하기 <수학식 5>와 같이 원본 일기도 데이터(V)에 근사한 값이 산출된다.That is, the encoding matrix H is calculated by calculating the search subject weather map M or the individual analysis subject weather map and the decomposition matrix M. FIG. In this case, when the calculated encoding matrix H is further calculated with the base weather map matrix W, a value approximating the original weather map data V is calculated as shown in Equation 5 below.

Figure 112010078455677-pat00005
Figure 112010078455677-pat00005

이상으로, 도 1을 참조하여 본 발명의 개념 및 수학적 원리를 설명하였다. 이하, 도 2 내지 도 6을 참조하여 본 발명의 실시예에 따른 주성분 분석에 의한 유사 일기도 검색 시스템 및 방법을 상세히 설명하기로 한다.In the above, the concept and mathematical principle of the present invention have been described with reference to FIG. Hereinafter, a system and method for retrieving a similar weather map by principal component analysis according to an embodiment of the present invention will be described in detail with reference to FIGS. 2 to 6.

도 2는 본 발명에 따른 주성분 분석에 의한 유사 일기도 검색 시스템의 구성도이다. 도 2를 참조하면, 본발명에 따른 유사 일기도 검색 시스템(200)은, 과거 일기도 데이터베이스(210), 기저 일기도 생성부(220), 기저 일기도 검증부(230), 분해 매트릭스 산출부(240), 인코딩 매트릭스 산출부(250), 인코딩 매트릭스 데이터베이스(260) 및 유사 일기도 검색부(270) 등으로 구성될 수 있다.2 is a block diagram of a system for searching similar weather maps by principal component analysis according to the present invention. Referring to FIG. 2, the similar weather map search system 200 according to the present invention includes a past weather map database 210, a base weather map generator 220, a base weather map verifier 230, and a decomposition matrix calculator. 240, an encoding matrix calculator 250, an encoding matrix database 260, a similar weather map searcher 270, and the like.

과거 일기도 데이터베이스(210)에는 각종 과거 일기도 데이터를 디지털 데이터로 저장한다. 예컨대. 유럽 중규모 기상 예보 센터로부터 확보된 50년치의 ECMWF(European Centre for Medium-Range Weather Forecasts) 데이터 또는 기상청이 보유하는 과거 일기도를 대상으로 각 기압에 따른(500hPa, 700hPa, 850hPa 등) 고도장, 온도장, 습수장, 와도장, 해면 기압 등의 데이터를 GRIB 포맷의 디지털 데이터로 저장할 수 있다.The past weather map database 210 stores various past weather map data as digital data. for example. 50-year-old European Center for Medium-Range Weather Forecasts (ECMWF) data obtained from European mid-scale weather forecast centers or historical weather maps held by the Meteorological Agency, according to the pressure (500hPa, 700hPa, 850hPa, etc.) Data such as wetlands, watersheds, and barometric pressure can be stored as digital data in GRIB format.

기저 일기도 생성부(220)는 상기 과거 일기도 데이터베이스(210)에 저장된 각 기상 관련 요소 별 데이터를 기초로 주성분 분석 방법을 통해 각 기상 관련 요소별 기저 일기도 매트릭스를 생성한다. 즉, 상술한 바와 같이 다수의 과거 일기도 데이터를 분석하여 낮은 차원의 주성분 매트릭스로 분석하게 된다.The base weather map generator 220 generates a base weather map matrix for each weather related element through a principal component analysis method based on data for each weather related element stored in the past weather map database 210. That is, as described above, a plurality of historical weather data are analyzed and analyzed as a low-order principal component matrix.

상기 기저 일기도 생성부(220)에서 생성된 기저 일기도 매트릭스는 기저 일기도 검증부(230)에서 검증함으로써 기저 일기도 매트릭스를 확정시키게 된다. 상기 기저 일기도 검증 방법은 생성된 기저 일기도를 인코딩 매트릭스에 의해 일기도 데이터로 복원하고 이를 원본 일기도와 비교하여 오차를 계산함으로써 검증하게 된다.The base weather map matrix generated by the base weather map generation unit 220 is confirmed by the base weather map verification unit 230 to determine the base weather map matrix. The basal weather verification method is verified by restoring the generated basal weather map to weather data by an encoding matrix and comparing the original weather map with the original weather map to calculate an error.

이를 보다 구체적으로 설명하면 다음과 같다. 상기 <수학식 5>에서 상술한 바와 같이 일기도 데이터(V)는 기저 일기도 매트릭스(W)와 인코딩 매트릭스(H)의 연산으로 산출되므로, 원본 일기도와 기저 일기도 매트릭스에 의해 복원된 일기도의 오차(δ)는 매트릭스 V와 매트릭스 WH의 차이로 산출될 수 있다.This will be described in more detail as follows. As described above in Equation 5, the weather map data V is calculated by the calculation of the base weather map matrix W and the encoding matrix H, so that the weather map data restored by the original weather map and the base weather map matrix is obtained. The error δ may be calculated as the difference between the matrix V and the matrix WH.

따라서, 하기 <수학식 6>과 같이 근사도(quality of approximation)의 정도를 결정하는 비용함수(cost function)에서 정의한 방법에 의해 기저 일기도 매트릭스의 신뢰도를 검증하게 된다.Therefore, the reliability of the underlying weather matrix is verified by a method defined in a cost function that determines the degree of quality of approximation as shown in Equation 6 below.

Figure 112010078455677-pat00006
Figure 112010078455677-pat00006

이때, 거리 감소율(Sequence destance reduction rate; SDDR)은 하기 <수학식 7>과 같다.In this case, the sequence destance reduction rate (SDDR) is expressed by Equation 7 below.

Figure 112010078455677-pat00007
Figure 112010078455677-pat00007

즉, <수학식 6>에서와 같이 매트릭스 사이의 절대 거리로 신뢰도를 검증하며, <수학식 7>에서와 같이 매트릭스 사이의 절대 거리가 감소하는 비율을 고려하여 검증하게 된다. 상기 <수학식 7>에서 n은 사용된 인코딩의 개수이다.That is, as shown in Equation 6, the reliability is verified by the absolute distance between the matrices, and as shown in Equation 7, the reliability is verified by considering the rate at which the absolute distance between the matrices decreases. In Equation 7, n is the number of encodings used.

여기서, 상기 오차가 주성분(PC)의 개수에 따라 변하는 추이를 살펴보면 도 15와 같다. 도 15를 참조하면, 주성분(PC)의 개수를 증가시킬수록 오차는 줄어들게 된다. 따라서, 도 16에 도시된 바와 같이 주성분(PC) 개수 증가에 따른 오차의 거리 감소율을 참조하여 최적의 주성분(PC) 개수를 선택하게 된다. 이렇게 함으로써 검색에 사용할 기저 일기도 매트릭스를 최종적으로 확정하게 된다.Here, the error is changed according to the number of principal components (PC) as shown in FIG. Referring to FIG. 15, as the number of principal components PC increases, the error decreases. Accordingly, as shown in FIG. 16, the optimal number of principal components PC is selected by referring to the rate of decrease of the distance according to the increase of the number of principal components PC. This finally establishes the underlying weather matrix to be used for the search.

상술한 바와 같이 기저 일기도 생성부(220)에서 기저 일기도 매트릭스가 확정되면, 분해 매트릭스 산출부(240)에서는 상기 <수학식 3>에서 상술한 바와 같이 기저 일기도 매트릭스로부터 분해 매트릭스(decomposition matrix)를 산출하게 된다.As described above, when the base weather matrix is determined by the base weather map generator 220, the decomposition matrix calculator 240 decomposes a matrix from the base weather matrix as described in Equation 3 above. Will be calculated.

이와 같이 분해 매트릭스가 산출되면, 인코딩 매트릭스 산출부(250)에서는 <수학식 4>에서와 같이 과거 일기도 데이터베이스(210)에 저장된 각 개별 일기도 데이터를 상기 산출된 분해 매트릭스와 연산하여 인코딩 매트릭스 산출(250)한다.When the decomposition matrix is calculated as described above, the encoding matrix calculation unit 250 calculates the encoding matrix by calculating each individual weather data stored in the past weather map database 210 with the calculated decomposition matrix as shown in Equation (4). (250).

상기 산출된 각 일기도별 인코딩 매트릭스는 해당 일기도에 대한 식별자와 매핑하여 인코딩 매트릭스 데이터베이스(260)에 저장한다. 이때, 상기 일기도에 대한 식별자는 각 일기도마다 사용자가 별도로 부가할 수도 있으며, 해당 일기도의 날짜 및 시간 정보를 이용할 수도 있다. 상기 식별자를 통해 각 과거 일기도와 해당 일기도로부터 산출된 인코딩 매트릭스가 1:1 대응될 수 있다. 따라서, 이후 최종적으로 유사한 일기도의 인코딩 매트릭스를 검색하게 되면, 상기 식별자에 의해 검색된 인코딩 매트릭스와 매핑된 해당 과거 일기도를 추출할 수가 있게 된다.The calculated encoding matrix for each weather map is stored in the encoding matrix database 260 by mapping with the identifier for the weather map. At this time, the identifier for the weather map may be separately added by the user for each weather map, or may use date and time information of the weather map. Through the identifier, the past weather map and the encoding matrix calculated from the weather map may correspond 1: 1. Therefore, when finally searching for the encoding matrix of the similar weather map, it is possible to extract the corresponding past weather map mapped to the encoding matrix searched by the identifier.

한편, 검색 대상 일기도(예컨대, 현재 일기도)는 인코딩 매트릭스 산출부(250)에서 과거 일기도 데이터에서 연산한 방법과 동일한 방법으로 분해 매트릭스와 연산되어 인코딩 매트릭스가 산출된다.Meanwhile, the search target weather map (for example, the current weather map) is computed with the decomposition matrix in the same manner as the encoding matrix calculation unit 250 calculates the past weather map data to calculate the encoding matrix.

유사 일기도 검색부(270)에서는 상기 인코딩 매트릭스 산출부(250)에서 산출된 검색 대상 일기도의 인코딩 매트릭스를 인코딩 매트릭스 데이터베이스(260)에 기저장된 과거 일기도의 인코딩 매트릭스와 비교하여 가장 유사한 인코딩 매트릭스를 검색한다. 상기 검색 결과 유사한 인코딩 매트릭스가 검색되면, 상기 검색된 인코딩 매트릭스에 매핑된 식별자를 통해 과거 일기도 데이터베이스(210)에 저장된 해당 과거 일기도를 유사 일기도로 하여 검색 결과를 출력한다.The similarity degree searcher 270 searches the encoding matrix that is most similar by comparing the encoding matrix of the search target weather map calculated by the encoding matrix calculator 250 with the encoding matrix of past weather maps previously stored in the encoding matrix database 260. do. When a similar encoding matrix is found as a result of the search, a search result is output by using the past weather map stored in the past weather map database 210 as a similar weather map through an identifier mapped to the searched encoding matrix.

이하, 도 3 내지 도 6을 참조하여, 본 발명의 실시예에 따른 유사 일기도 검색 절차를 보다 상세히 설명한다.3 to 6, a detailed weather map search procedure according to an embodiment of the present invention will be described in more detail.

도 3은 본 발명에 따른 주성분 분석에 의한 유사 일기도 검색 절차를 나타내는 흐름도이다. 먼저 과거 일기도로부터 기저 일기도를 생성(S301)하고, 상기 생성된 기저 일기도 검증을 통해 기저 일기도를 확정(S302)한다. 이때, 상기 기저 일기도도 매트릭스 형태로 표현된다.3 is a flowchart illustrating a similar weather map search procedure by principal component analysis according to the present invention. First, a base weather map is generated from the past weather map (S301), and the base weather map is determined through verification of the generated base weather map (S302). In this case, the basis weather map is also expressed in a matrix form.

상기 기저 일기도가 확정되면, 확정된 기저 일기도 매트릭스로부터 주성분 분석 방법에 따라 분해 매트릭스를 산출(S202)한다. 그런 다음, 개별 과거 일기도를 각각 상기 산출된 분해 매트릭스로 인코딩하여 인코딩 매트릭스를 산출(S304)한다. 상기 산출된 개별 인코딩 매트릭스는 데이터베이스에 저장(S305)된다.When the basis weather map is determined, a decomposition matrix is calculated from the determined basis weather map matrix according to the principal component analysis method (S202). Then, the individual past weather maps are encoded into the calculated decomposition matrix, respectively, to calculate an encoding matrix (S304). The calculated individual encoding matrix is stored in a database (S305).

한편, 검색 대상 일기도에 대해 유사 일기도를 검색하고자 할 경우, 상기 검색 대상 일기도를 상기 산출된 분해 매트릭스로 인코딩하여 인코딩 매트릭스를 산출(S306)한 후, 상기 산출된 검색 대상 일기도의 인코딩 매트릭스와 상기 데이터베이스에 저장된 인코딩 매트릭스와 비교(S307)함으로써 과거 일기도 중 검색 대상 일기도와 유사한 일기도를 검색(S308)하게 된다.On the other hand, if a similar weather map is to be searched for the search target weather map, the search target weather map is encoded into the calculated decomposition matrix to calculate an encoding matrix (S306), and then the encoding matrix of the search target weather map and the database are calculated. By comparing with the encoding matrix stored in the (S307) to search for a weather map similar to the search target weather map of the past weather map (S308).

이하, 상기 각 단계별 세부적인 구현 방법의 실시예를 도 4 내지 도 6을 참조하여 설명한다.Hereinafter, embodiments of the detailed implementation method for each step will be described with reference to FIGS. 4 to 6.

도 4는 본 발명의 실시예에 따른 기저 일기도 산출 및 검증 절차를 나타내는 흐름도이다. 도 4를 참조하면, 과거 일기도에 대한 GRIB 포맷의 격자 자료를 1차원 자료로 재분배한다. 이때 분석 대상 데이터로는 GDAPS 분석 자료, ECMWF, NCEP, JMA 재분석 자료 등 어떠한 기상 및 일기도 관련 자료도 가능하다. 또한, 분석할 각 일기도의 기상 관련 요소도 상술한 바와 같이 각 기압에 따른(500hPa, 700hPa, 850hPa 등) 고도장, 온도장, 습수장, 와도장, 해면 기압 등의 데이터를 포함하여 수치화할 수 있는 어떠한 기상 관련 데이터도 가능하다.4 is a flowchart illustrating a basis weather map calculation and verification procedure according to an embodiment of the present invention. Referring to FIG. 4, grid data of a GRIB format for past weather maps are redistributed into one-dimensional data. At this time, any weather and weather related data such as GDAPS analysis data, ECMWF, NCEP, JMA reanalysis data can be used. In addition, the weather-related elements of each weather map to be analyzed can be quantified by including data such as altitude field, temperature field, wet water field, vortex, sea level air pressure according to each air pressure (500hPa, 700hPa, 850hPa, etc.) as described above. Any weather related data is available.

이와 같이 1차원 자료로 재분배된 데이터는 주성분 분석을 위한 자료 정규화 및 자료의 컬럼(column)별 평균 편차(anormaly)를 계산(S402)한다. 그런 다음, 정규화된 자료의 분산(variance) 행렬 및 공분산(covariance) 행렬을 계산(S403)한다.The data redistributed into one-dimensional data as described above calculates data normalization for principal component analysis and average deviation (anormaly) for each column of data (S402). Then, a variance matrix and covariance matrix of the normalized data are calculated (S403).

상기 계산된 공분산 행렬로부터 고유값(eigne value) 및 고유 벡터(eigen vector)를 산출하고 이에 따라 기저 함수(즉, 기저 일기도 매트릭스)를 계산(S404)한다. 이와 같이, 기저 함수가 계산되면, 이를 이용하여 재생산된 일기도를 원본 일기도 데이터와 비교함으로써 상술한 바와 같이 기저 일기도 매트릭스에 대한 검증(S405)을 수행하게 된다. 상기 검증이 완료되면, 최종적으로 고유값 및 고유 벡터를 통해 기저 일기도 매트릭스를 결정(S406)한다.An eigen value and an eigen vector are calculated from the calculated covariance matrix, and a basis function (ie, a base weather matrix) is calculated (S404). As described above, when the basis function is calculated, the reproduced weather map is compared with the original weather map data to verify the basis weather matrix (S405) as described above. When the verification is completed, the basis weather matrix is finally determined through the eigenvalues and the eigenvectors (S406).

도 5는 본 발명의 실시예에 따른 인코딩 매트릭스 산출 절차를 나타내는 흐름도이다. 도 5를 참조하면, 인코딩 매트릭스를 산출함에 있어 본 발명의 실시예에 따라 산출된 인코딩 매트릭스에 대해 최근접 이웃 방법(Nearest neighbor method)에 의해 범주화하여 범주값을 사용함으로써 이후 검색할 때의 검색 시간을 단축시키게 된다.5 is a flowchart illustrating an encoding matrix calculation procedure according to an embodiment of the present invention. Referring to FIG. 5, in calculating an encoding matrix, a search time for subsequent retrieval by using a category value categorized by a nearest neighbor method to an encoding matrix calculated according to an embodiment of the present invention. Will shorten.

즉, 과거 일기도 전체에 대한 인코딩 매트릭스를 계산(S501)하면, 상기 과거 일기도 전체의 인코딩 매트릭스를 최근접 이웃 방법을 사용하여 범주화(S502)한다. 상기 범주화에 따라 동일 범주에 속하는 일기도들에 대해 유사성 검증을 통해 범주화의 타당성 검증 및 범주화의 단계수를 결정(S503)한다. 이와 같이 검증이 되면, 과거 일기도 전체에 대해 일기도의 인코딩 매트릭스를 데이터베이스에 저장하고, 범주값을 함께 인덱스로 저장(S504)한다. 마지막으로, 각 범주의 매트릭스 공간상의 범주 중심 좌표를 결정(S505)한다.That is, when the encoding matrix for the entire past weather map is calculated (S501), the encoding matrix for the whole past weather map is categorized using the nearest neighbor method (S502). According to the categorization, the validity of the categorization and the number of stages of categorization are determined through similarity verification for the weather maps belonging to the same category (S503). In this case, the encoding matrix of the weather map is stored in the database for the entire past weather map, and the category values are stored together as an index (S504). Finally, the category center coordinates on the matrix space of each category are determined (S505).

이와 같이, 인코딩 매트릭스를 범주화하여 저장하게 되면, 검색 대상 일기도의 인코딩 매트릭스와 유사한 인코딩 매트릭스를 검색할 때 모든 일기도에 대한 인코딩 매트릭스를 검사하지 않고, 상기 결정된 범주 중심 좌표에 해당하는 각 범주별 중심 인코딩 매트릭스만을 검사함으로써 검색 시간 및 연산을 줄일 수가 있게 된다. 즉, 인코딩 매트릭스 검색 시 먼저 범주를 검색하고, 다음으로 해당 범주에 속한 각 인코딩 매트릭스에 대해 검색을 수행함으로써 가장 유사한 인코딩 매트릭스를 효율적으로 검색할 수가 있다. As such, when the encoding matrix is categorized and stored, when searching for an encoding matrix similar to the encoding matrix of the searchable weather map, the center encoding for each category corresponding to the determined category center coordinates is not checked without checking the encoding matrix for all weather maps. Examining only the matrix can reduce search time and computation. In other words, when searching an encoding matrix, a category is searched first, and then, for each encoding matrix in the category, a most similar encoding matrix can be efficiently searched.

도 6은 본 발명의 실시예에 따른 유사 일기도 추출 절차를 나타내는 흐름도이다. 도 6을 참조하면, 도 5에서 상술한 바와 같이 검색 대상 일기도의 인코딩 매트릭스를 계산(S601)하고, 우선적으로 검색 대상 일기도의 인코딩 결과를 인코딩 매트릭스에 검색을 요청하여 해당 범주를 검색(S602)한다. 다음으로, 과거 일기도 데이터베이스에서 검색 대상 일기도와 같은 범주를 가지는 유사 일기도를 추출(S603)하게 된다.6 is a flowchart illustrating a similar weather map extraction procedure according to an embodiment of the present invention. Referring to FIG. 6, as described above with reference to FIG. 5, an encoding matrix of a search target weather map is calculated (S601), and a corresponding category is searched by first requesting a search for an encoding result of the search target weather map to an encoding matrix (S602). . Next, a similar weather map having the same category as the search target weather map is extracted from the past weather map database (S603).

이상으로, 본 발명의 실시예에 따른 유사 일기도 검색 시스템 및 방법을 상세히 설명하였다. 이하, 도 7 내지 도 14를 참조하여 실제 일기도 데이터를 이용하여 본 발명에 따라 유사 일기도를 검색한 실험 예를 설명한다.In the above, the similar weather map search system and method according to an embodiment of the present invention have been described in detail. Hereinafter, an example of searching for a similar weather map according to the present invention using actual weather data will be described with reference to FIGS. 7 to 14.

도 7은 본 발명의 실시예에 따라 기저 일기도 확정을 위한 과거 데이터의 선정 영역을 나타내는 도면이다. 도 7을 참조하면, 동아시아 영역(예컨대, 110×70 grid data 영역)을 검색 대상 영역으로 선정하고, 500hPa 고도장에 대한 주성분 분석을 수행하여 고유 벡터를 산출한다. 이와 같이, 산출된 고유 벡터를 이용하여 기저 일기도를 산출하면, 도 8에 도시된 바와 같은 기저 일기도가 산출된다.7 is a diagram illustrating a selection area of past data for determining a base weather map according to an embodiment of the present invention. Referring to FIG. 7, an East Asian region (eg, 110 × 70 grid data region) is selected as a search target region, and eigenvectors are calculated by performing principal component analysis on a 500 hPa high field. As such, when the basis weather map is calculated using the calculated eigenvectors, the basis weather map as shown in FIG. 8 is calculated.

이때, 도 9에 도시된 그래프는 500 고도장에 대해 인코딩 매트릭스를 산출한 결과와 이를 통해 재생산된 일기도에 오차에 대한 그래프이다. 도 9의 상부 3개의 그래프는 좌측으로부터 각각 제1 주성분, 제2 주성분 및 제3 주성분에 대한 인코딩 매트릭스를 각 일기도(날짜)별로 표시한 그래프이다. 도 9의 하부 3개의 매트릭스는 각각 주성분 수 증가에 따른 오차를 개별 형태로 나타낸 그래프이다.In this case, the graph shown in FIG. 9 is a result of calculating the encoding matrix for the 500 altitude field and a graph of the error in the weather map reproduced through the graph. 9 is a graph showing encoding matrices for each of the first principal component, the second principal component, and the third principal component from the left, for each weather map (date), respectively. The lower three matrices of FIG. 9 are graphs showing errors in accordance with an increase in the number of principal components in individual forms.

이와 같이 인코딩 매트릭스에 의해 검색을 수행하면, 도 10에 도시된 바와 같은 결과를 얻게 된다. 상기 도 10의 좌측 4개의 그래프는 n개의 인코딩을 이용한 n-차원 거리로 검색하는 1단계 검색 방법에 의해 검색된 결과이며, 4개의 일기도가 그룹으로 표현될 수 있다. 또한, 상기 도 10의 우측 4개의 그래프는 제1 주성분(PC1)에 의해 인코딩을 먼저 검색한 후, 나머지 인코딩을 이용 n-1차원 거리로 검색하는 2단계 검색 방법에 의해 검색된 결과이다. 마찬가지로 4개의 일기도가 그룹으로 표현되어 검색될 수 있다. When the search is performed by the encoding matrix in this way, a result as shown in FIG. 10 is obtained. The left four graphs of FIG. 10 are the search results obtained by the one-step search method for searching by n-dimensional distances using n encodings, and four weather maps may be represented in groups. In addition, the four graphs on the right side of FIG. 10 are the results of the two-stage retrieval method in which an encoding is first searched by the first principal component PC1 and then the n-1-dimensional distance is searched using the remaining encoding. Similarly, four weather maps can be represented and searched in groups.

상기 도 10에 도시하지는 않았으나, 3단계 검색 방법으로 제1 주성분(PC1) 및 제2 주성분(PC2)의 인코딩을 먼저 검색한 후, 나머지 인코딩을 이용하여 n-2 차원의 거리로 검색을 수행할 수 있다. 이를 확장하면, 4단계 이상의 검색 방법으로 확장이 가능하며, 연산 속도 및 효율성을 고려하여 절절한 단계의 방법을 사용하여 검색하는 것이 바람직하다.Although not shown in FIG. 10, the encoding of the first principal component PC1 and the second principal component PC2 is first searched using a three-step search method, and then the search is performed in the n-2-dimensional distance using the remaining encodings. Can be. If it is extended, it can be extended by a search method of four or more steps, and it is preferable to search using an appropriate step method in consideration of the computation speed and efficiency.

상기 도 10에서는 인코딩 매트릭스 간의 거리를 이용하여 유사한 인코딩 매트릭스를 검색하는 방법을 사용하였으나, 도 11에서는 유발성 분할표를 이용한 스코어 산출을 통해 검색한 결과를 도시한다. 도 11에 도시된 검색 결과는 700hPa 습수장에 대한 데이터를 트라이 매트릭스 스코어 산출 방법에 의해 유발성 분할표를 생성하고, HSS(HeidkeSkill Score) 방법으로 멀티 카테고리에 대해 스코어를 산출함으로써 검색한 결과이다.In FIG. 10, a method of searching for a similar encoding matrix using a distance between encoding matrices is used. In FIG. 11, a result of searching through a score calculation using an inductive division table is shown. The search result shown in FIG. 11 is a result of searching for data for 700hPa wet water field by generating an inductive division table by a tri-matrix score calculation method and calculating a score for multiple categories using a HeidkeSkill Score (HSS) method.

또한, 다른 실시예로서 도 12 및 도 13에서와 같이 인코딩 매트릭스 사이의 기울기와 상관 계수를 이용하여 검색하는 것도 가능하다.In another embodiment, as shown in FIGS. 12 and 13, it is also possible to search using the slope and the correlation coefficient between the encoding matrices.

이때, 상기 인코딩 매트릭스는 선형 회귀 분석 방법에 의해 하기 <수학식 8>과 같이 기울기 및 상관 계수로 나타낼 수 있다.In this case, the encoding matrix may be represented by a slope and a correlation coefficient as shown in Equation 8 by a linear regression analysis method.

Figure 112010078455677-pat00008
Figure 112010078455677-pat00008

상기 <수학식 8>에서 R은 상관 계수(correlation coefficient)이고, Δα는 기울기이다. 상기 상관 계수 및 기울기를 이용하여 인코딩 매트릭스를 비교함으로써 유사한 인코딩 매트릭스를 검색할 수가 있게 된다.In Equation 8, R is a correlation coefficient and Δα is a slope. Similar correlation matrices can be retrieved by comparing the encoding matrices using the correlation coefficient and the slope.

도 12는 GPM 500 데이터를 상기 방법을 적용하여 검색한 결과이고, 도 13은 500 와도장에 적용하여 검색한 결과이다.FIG. 12 is a result of searching the GPM 500 data by applying the above method, and FIG. 13 is a result of applying the 500 W painting.

한편, 본 발명의 실시 예에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 안되며 후술하는 특허 청구의 범위뿐만 아니라 이 특허 청구의 범위와 균등한 것들에 의해 정해져야 한다.
On the other hand, in the embodiment of the present invention has been described with respect to specific embodiments, various modifications are possible without departing from the scope of the invention. Therefore, the scope of the present invention should not be limited by the illustrated embodiments, but should be determined by the scope of the appended claims and equivalents thereof.

110 : 기저 일기도 작성 120 : 인코딩 매트릭스 계산
130 : 일기도 검색 200 : 유사 일기도 검색 시스템
210 : 과거 일기도 데이터베이스 220 : 기저 일기도 생성부
230 : 기저 일기도 검증부 240 : 분해 매트릭스 산출부
250 : 인코딩 매트릭스 산출부 260 : 인코딩 매트릭스 데이터베이스
270 : 유사 일기도 검색부
110: create a basic weather map 120: calculate the encoding matrix
130: Weather Map Search 200: Similar Weather Map Search System
210: past weather map database 220: base weather map generator
230: basis weather map verification unit 240: decomposition matrix calculation unit
250: encoding matrix calculation unit 260: encoding matrix database
270: similar weather map search unit

Claims (14)

복수의 과거 일기도 자료에서 지도 상의 특정 영역에 대해 적어도 하나의 기상 관련 요소를 디지털 데이터로 저장하는 과거 일기도 데이터베이스;
상기 과거 일기도 데이터베이스에 저장된 각 기상 관련 요소별 디지털 데이터로부터 주성분 분석에 의해 고유 벡터를 산출하여 기저 일기도 매트릭스를 생성하는 기저 일기도 생성부;
상기 생성된 기저 일기도 매트릭스로부터 검색 대상 일기도의 인코딩 매트릭스 산출을 위한 분해 매트릭스를 산출하는 분해 매트릭스 산출부;
상기 분해 매트릭스 산출부에서 산출된 상기 분해 매트릭스로 상기 과거 일기도 데이터베이스에 저장된 개별 과거 일기도의 데이터와 연산하여 각 개별 과거 일기도에 대한 인코딩 매트릭스를 산출하고, 상기 산출된 개별 과거 일기도에 대한 인코딩 매트릭스를 최근접 이웃 방법을 사용하여 범주화하여 해당 범주값을 상기 인코딩 매트릭스 데이터베이스에 저장하는는 인코딩 매트릭스 산출부;
상기 인코딩 매트릭스 산출부에서 산출된 각 개별 과거 일기도에 대한 상기 인코딩 매트릭스를 해당 과거 일기도 정보에 대한 식별자와 매핑하여 저장하는 인코딩 매트릭스 데이터베이스; 및
검색 대상 일기도를 상기 분해 매트릭스와 연산하여 인코딩 매트릭스를 산출하고, 상기 산출된 해당 검색 대상 일기도에 대한 인코딩 매트릭스를 상기 인코딩 매트릭스 데이터베이스에 저장된 개별 과거 일기도에 대한 각 인코딩 매트릭스와 비교하여 동일한 범주를 가지는 유사 일기도를 검색하는 유사 일기도 검색부;를 포함하는 것을 특징으로 하는 주성분 분석에 의한 유사 일기도 검색 시스템.
A historical weather map database for storing at least one weather related element as digital data for a specific area on a map in the plurality of historical weather data;
A base weather map generator for generating a base weather map matrix by calculating eigenvectors by principal component analysis from digital data for each weather-related element stored in the past weather map database;
A decomposition matrix calculator for calculating a decomposition matrix for calculating an encoding matrix of a search target weather map from the generated base weather map matrix;
The encoding matrix calculated by the decomposition matrix calculator calculates an encoding matrix for each individual past weather map by calculating the data of the individual past weather maps stored in the past weather map database, and calculates an encoding matrix for the calculated individual past weather maps. An encoding matrix calculator configured to categorize using a nearest neighbor method and store the corresponding category value in the encoding matrix database;
An encoding matrix database configured to map the encoding matrix for each individual past weather map calculated by the encoding matrix calculator to an identifier for corresponding past weather information and to store the encoding matrix; And
Similarity having the same category by calculating the encoding matrix by calculating a search target weather map with the decomposition matrix and comparing the calculated encoding matrix for the search target weather map with each encoding matrix for individual past weather maps stored in the encoding matrix database. Similar weather map search system for searching the weather map; similar weather map search system by the principal component analysis comprising a.
제1항에 있어서, 상기 시스템은,
상기 기저 일기도 생성부에서 산출된 상기 기저 일기도 매트릭스와 상기 인코딩 매트릭스의 연산에 의해 재생산된 일기도의 데이터를 상기 주성분 분석하기 전 원래의 일기도 데이터와 비교하여 상기 기저 일기도 매트릭스를 검증하는 기저 일기도 검증부;를 더 포함하는 것을 특징으로 하는 주성분 분석에 의한 유사 일기도 검색 시스템.
The system of claim 1, wherein the system is
A basis for verifying the basis weather matrix by comparing the data of the weather map calculated by the operation of the base weather matrix and the encoding matrix with the original weather data before the principal component analysis. Weather map verification unit; similar weather map search system by the principal component analysis characterized in that it further comprises.
제1항에 있어서, 상기 기상 관련 요소는,
특정 기압을 기준으로 설정된 고도장, 온도장, 해면기압, 습수장 및 와도장 중에서 선택된 어느 하나 이상인 것을 특징으로 하는 주성분 분석에 의한 유사 일기도 검색 시스템.
The method of claim 1, wherein the weather-related element,
A similar weather map search system based on the principal component analysis, characterized in that at least one selected from among the altitude field, temperature field, sea level air pressure, damp water field and vortex coating based on a specific air pressure.
삭제delete 제1항에 있어서, 상기 유사 일기도 검색부는,
n개의 인코딩을 이용한 n-차원 거리로 검색하는 방법, 제1 주성분의 인코딩을 먼저 검색한 후 나머지 인코딩을 이용하여 n-1차원 거리로 검색하는 방법, 제1 및 제2 주성분의 인코딩을 먼저 검색한 후 나머지 인코딩을 이용하여 n-2차원 거리로 검색하는 방법 중에서 선택된 어느 하나의 방법으로 유사 일기도를 검색하는 것을 특징으로 하는 주성분 분석에 의한 유사 일기도 검색 시스템.
The method of claim 1, wherein the similar weather map search unit,
A method for searching by n-dimensional distance using n encodings, A method of searching for an encoding of a first principal component first and then an n-1-dimensional distance using a remaining encoding, A search for an encoding of first and second principal components first And then searching for similar weather maps using any one of a method of searching by n-dimensional distance using the remaining encoding.
제1항에 있어서, 상기 유사 일기도 검색부는,
상기 인코딩 매트릭스의 유발성 분할표를 생성하고, 상기 생성된 유발성 분할표의 스코어를 산출하여 유사 일기도를 검색하는 것을 특징으로 하는 주성분 분석에 의한 유사 일기도 검색 시스템.
The method of claim 1, wherein the similar weather map search unit,
Generating a trigger table of the encoding matrix, calculating a score of the generated trigger table, and searching for similar weather maps according to principal component analysis.
제1항에 있어서, 상기 유사 일기도 검색부는,
상기 검색 대상 일기도에 대한 인코딩 매트릭스와 개별 과거 일기도에 대한 각 인코딩 매트릭스 사이의 기울기 및 상관 계수를 산출하여 유사 일기도를 검색하는 것을 특징으로 하는 주성분 분석에 의한 유사 일기도 검색 시스템.
The method of claim 1, wherein the similar weather map search unit,
And calculating a slope and a correlation coefficient between the encoding matrix for the search target weather map and each encoding matrix for the individual past weather map to search for similar weather maps.
유사 일기도 검색 시스템이 복수의 과거 일기도 자료에서 지도 상의 특정 영역에 대해 적어도 하나의 기상 관련 요소를 디지털 데이터로 데이터베이스에 저장하는 단계;
상기 유사 일기도 검색 시스템이 상기 데이터베이스에 저장된 각 기상 관련 요소별 디지털 데이터로부터 주성분 분석에 의해 고유 벡터를 산출하여 기저 일기도 매트릭스를 생성하는 단계;
상기 유사 일기도 검색 시스템이 상기 생성된 기저 일기도 매트릭스로부터 검색 대상 일기도의 인코딩 매트릭스 산출을 위한 분해 매트릭스를 산출하는 단계;
상기 유사 일기도 검색 시스템이 상기 산출된 분해 매트릭스로 상기 데이터베이스에 저장된 개별 과거 일기도의 데이터와 연산하여 각 개별 과거 일기도에 대한 인코딩 매트릭스를 산출하는 단계;
상기 유사 일기도 검색 시스템이 상기 산출된 각 개별 과거 일기도에 대한 상기 인코딩 매트릭스를 해당 과거 일기도 정보에 대한 식별자와 매핑하여 데이터베이스에 저장하는 단계;
상기 유사 일기도 검색 시스템이 검색 대상 일기도를 상기 분해 매트릭스와 연산하여 인코딩 매트릭스를 산출하는 단계; 및
상기 유사 일기도 검색 시스템이 상기 산출된 해당 검색 대상 일기도에 대한 인코딩 매트릭스를 상기 데이터베이스에 저장된 개별 과거 일기도에 대한 각 인코딩 매트릭스와 비교하여 동일한 범주를 가지는 유사 일기도를 검색하는 단계;를 포함하되,
상기 인코딩 매트릭스 산출하는 단계는,
상기 유사 일기도 검색 시스템이 상기 산출된 개별 과거 일기도에 대한 인코딩 매트릭스를 최근접 이웃 방법을 사용하여 범주화하는 단계; 및
상기 유사 일기도 검색 시스템이 상기 범주화된 해당 범주값을 상기 인코딩 매트릭스 데이터베이스에 저장하는 단계;를 더 포함하는 것을 특징으로 하는 주성분 분석에 의한 유사 일기도 검색 방법.
A similar weather map search system storing at least one weather related element as digital data in a database for a particular area on a map in the plurality of historical weather data;
Generating a basis weather matrix by calculating a eigenvector by principal component analysis from digital data for each weather related element stored in the database;
Calculating, by the similar weather map search system, a decomposition matrix for calculating an encoding matrix of a search target weather map from the generated base weather map matrix;
Calculating, by the similar weather map search system, an encoding matrix for each individual past weather map by operating with the calculated decomposition matrix and data of the individual past weather maps stored in the database;
The similarity map search system mapping the encoding matrix for the calculated individual past weather maps with an identifier for corresponding past weather map information and storing them in a database;
Calculating, by the similarity map search system, an encoding matrix by calculating a search target weather map with the decomposition matrix; And
And comparing, by the similarity map search system, the similarity map having the same category by comparing the calculated encoding matrix for the corresponding search target weather map with each encoding matrix for the individual past weather map stored in the database.
Computing the encoding matrix,
The similarity map search system categorizing the encoding matrix for the calculated individual past weather map using a nearest neighbor method; And
And storing, by the similarity map search system, the categorized corresponding category value in the encoding matrix database.
제8항에 있어서, 상기 기저 일기도 매트릭스를 생성하는 단계 이후 상기 분해 매트릭스를 산출하는 단계 이전에,
상기 유사 일기도 검색 시스템이 상기 산출된 기저 일기도 매트릭스와 상기 인코딩 매트릭스의 연산에 의해 재생산된 일기도의 데이터를 상기 주성분 분석하기 전 원래의 일기도 데이터와 비교하여 상기 기저 일기도 매트릭스를 검증하는 단계;를 더 포함하는 것을 특징으로 하는 주성분 분석에 의한 유사 일기도 검색 방법.
The method of claim 8, wherein after generating the base weather matrix, before calculating the decomposition matrix,
Verifying the base weather matrix by comparing the calculated base weather matrix and the data of the weather map reproduced by the calculation of the encoding matrix with the original weather data before the principal component analysis. Similar weather map search method by the principal component analysis, characterized in that it further comprises;
제8항에 있어서, 상기 기상 관련 요소는,
특정 기압을 기준으로 설정된 고도장, 온도장, 해면기압, 습수장 및 와도장 중에서 선택된 어느 하나 이상인 것을 특징으로 하는 주성분 분석에 의한 유사 일기도 검색 방법.
The method of claim 8, wherein the weather-related element,
A method for retrieving similar weather maps by principal component analysis, characterized in that at least one selected from an altitude field, a temperature field, a sea level air pressure, a damp water field, and a vortex coating based on a specific air pressure.
삭제delete 제8항에 있어서, 상기 유사 일기도를 검색하는 단계는,
상기 유사 일기도 검색 시스템이 n개의 인코딩을 이용한 n-차원 거리로 검색하는 방법, 제1 주성분의 인코딩을 먼저 검색한 후 나머지 인코딩을 이용하여 n-1차원 거리로 검색하는 방법, 제1 및 제2 주성분의 인코딩을 먼저 검색한 후 나머지 인코딩을 이용하여 n-2차원 거리로 검색하는 방법 중에서 선택된 어느 하나의 방법으로 유사 일기도를 검색하는 것을 특징으로 하는 주성분 분석에 의한 유사 일기도 검색 방법.
The method of claim 8, wherein the searching for the similar weather map comprises:
A method of searching by an n-dimensional distance using n encodings; a method of first searching an encoding of a first principal component and then searching by an n-dimensional distance using the remaining encodings; A method of searching for similar weather maps by principal component analysis, wherein the similarity maps are searched by any one of a method of searching an encoding of two principal components first and then searching the n-2-dimensional distance using the remaining encoding.
제8항에 있어서, 상기 유사 일기도를 검색하는 단계는,
상기 유사 일기도 검색 시스템이 상기 인코딩 매트릭스의 유발성 분할표를 생성하고, 상기 생성된 유발성 분할표의 스코어를 산출하여 유사 일기도를 검색하는 것을 특징으로 하는 주성분 분석에 의한 유사 일기도 검색 방법.
The method of claim 8, wherein the searching for the similar weather map comprises:
And the likelihood weather search system generates an incidence dividing table of the encoding matrix, and calculates a score of the generated incidence dividing table to search for similar weather maps.
제8항에 있어서, 상기 유사 일기도를 검색하는 단계는,
상기 유사 일기도 검색 시스템이 상기 검색 대상 일기도에 대한 인코딩 매트릭스와 개별 과거 일기도에 대한 각 인코딩 매트릭스 사이의 기울기 및 상관 계수를 산출하여 유사 일기도를 검색하는 것을 특징으로 하는 주성분 분석에 의한 유사 일기도 검색 방법.
The method of claim 8, wherein the searching for the similar weather map comprises:
The similar weather map search system searches for similar weather maps by calculating a slope and a correlation coefficient between the encoding matrix for the search target weather map and each encoding matrix for individual past weather maps, and searches for similar weather maps by principal component analysis. Way.
KR1020100120044A 2010-11-29 2010-11-29 System of searching similar weather map by principle component analysis and the method thereof KR101088082B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100120044A KR101088082B1 (en) 2010-11-29 2010-11-29 System of searching similar weather map by principle component analysis and the method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100120044A KR101088082B1 (en) 2010-11-29 2010-11-29 System of searching similar weather map by principle component analysis and the method thereof

Publications (1)

Publication Number Publication Date
KR101088082B1 true KR101088082B1 (en) 2011-11-30

Family

ID=45398348

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100120044A KR101088082B1 (en) 2010-11-29 2010-11-29 System of searching similar weather map by principle component analysis and the method thereof

Country Status (1)

Country Link
KR (1) KR101088082B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101272246B1 (en) 2011-01-26 2013-06-11 (주)에스이랩 System of searching similar weather map by principle component analysis and the method thereof
KR101736918B1 (en) * 2016-03-29 2017-05-17 한국해양과학기술원 System and Method for Predicting Sea Wave Using Sea Surface Wind Numerical Model Forecast Data
CN114359696A (en) * 2022-01-07 2022-04-15 博微(宁波)新技术有限公司 Weather map feature type identification and similarity matching system and method
CN114706900A (en) * 2022-02-17 2022-07-05 沈阳工业大学 Precipitation similarity forecasting method based on image feature combination

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
2010 한국기상학회 가을 학술대회 논문집, 2010.10.15.*

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101272246B1 (en) 2011-01-26 2013-06-11 (주)에스이랩 System of searching similar weather map by principle component analysis and the method thereof
KR101736918B1 (en) * 2016-03-29 2017-05-17 한국해양과학기술원 System and Method for Predicting Sea Wave Using Sea Surface Wind Numerical Model Forecast Data
CN114359696A (en) * 2022-01-07 2022-04-15 博微(宁波)新技术有限公司 Weather map feature type identification and similarity matching system and method
CN114706900A (en) * 2022-02-17 2022-07-05 沈阳工业大学 Precipitation similarity forecasting method based on image feature combination
CN114706900B (en) * 2022-02-17 2024-03-19 沈阳工业大学 Precipitation similarity forecasting method based on image feature combination

Similar Documents

Publication Publication Date Title
CN111488984B (en) Method for training track prediction model and track prediction method
CN110245709B (en) 3D point cloud data semantic segmentation method based on deep learning and self-attention
CN106096066B (en) Text Clustering Method based on random neighbor insertion
CN111160621B (en) Short-term wind power prediction method integrating multi-source information
CN110895878B (en) Traffic state virtual detector generation method based on GE-GAN
CN114254561A (en) Waterlogging prediction method, waterlogging prediction system and storage medium
KR101088082B1 (en) System of searching similar weather map by principle component analysis and the method thereof
Biard et al. Automated detection of weather fronts using a deep learning neural network
CN109408578A (en) One kind being directed to isomerous environment monitoring data fusion method
Kitamoto Spatio-temporal data mining for typhoon image collection
Li et al. Deep spatio-temporal wind power forecasting
CN117274650A (en) Urban functional area identification method based on remote sensing-crowd source semantic deep clustering
KR101272246B1 (en) System of searching similar weather map by principle component analysis and the method thereof
CN113435101B (en) Particle swarm optimization-based power failure prediction method for support vector machine
CN113673866A (en) Crop decision method, model training method and related equipment
Alam et al. Weather forecasting using parallel and distributed analytics approaches on big data clouds
CN107133348B (en) Approximate searching method based on semantic consistency in large-scale picture set
Zhan et al. Daily rainfall data construction and application to weather prediction
KR20190119082A (en) Systems and methods for predicting economic trends using statistical analysis of weather data
CN116124448A (en) Fault diagnosis system and method for wind power gear box
KR101269560B1 (en) System for searching similar weather chart and method thereof
Carney et al. Robust regional clustering and modeling of nonstationary summer temperature extremes across Germany
CN117131783B (en) Multi-mode learning-based power transmission line risk prediction model, method and system
CN116452366A (en) Multi-energy load three-stage mode mining method and system
Fang et al. Applying a multi-dimensional time-series similarity method to typhoon-track prediction

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140901

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150911

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160928

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20171011

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20181008

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20191007

Year of fee payment: 9