KR20190119082A - 기상 데이터의 통계 분석을 사용하여 경제 동향들을 예측하기 위한 시스템 및 방법 - Google Patents

기상 데이터의 통계 분석을 사용하여 경제 동향들을 예측하기 위한 시스템 및 방법 Download PDF

Info

Publication number
KR20190119082A
KR20190119082A KR1020197026600A KR20197026600A KR20190119082A KR 20190119082 A KR20190119082 A KR 20190119082A KR 1020197026600 A KR1020197026600 A KR 1020197026600A KR 20197026600 A KR20197026600 A KR 20197026600A KR 20190119082 A KR20190119082 A KR 20190119082A
Authority
KR
South Korea
Prior art keywords
indicators
weather
economic
historical weather
economic performance
Prior art date
Application number
KR1020197026600A
Other languages
English (en)
Inventor
로즈마리 일딩 라디치
제니퍼 바우어스 에이커스
티모시 로프터스
마이클 알. 루트
Original Assignee
애큐웨더 아이엔씨.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 애큐웨더 아이엔씨. filed Critical 애큐웨더 아이엔씨.
Publication of KR20190119082A publication Critical patent/KR20190119082A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N5/003
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Molecular Biology (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

기존의 시스템들의 기술적 문제들을 극복하는 경제 예측 시스템이 개시된다. 기존의 경제 예측 시스템들은 미래의 행동을 예측하기 위해, 과거의 행동을 분석하여 통계적 모델(statistical model)을 구성할 수 있다. 그러나, 과거의 기상 데이터를 통합할 때, 기존의 시스템들은 기상 지표(weather metric)들의 높은 다중 곡선성(multicollinearity) 때문에, 오버핏된(overfitted) 및/또는 언더핏된(underfitted) 모델들을 생성한다. 개시된 시스템은 그룹들로 분류되는 기상 지표들을 분석함으로써(각 그룹 내의 기상 지표들의 다중 곡선성을 기반으로), 기존의 시스템들의 이러한 기술적 문제를 극복하고, 각 그룹으로부터의 하나 이상의 가장 통계적으로 유의미한 기상 지표들을 사용하여 통계적 모델을 생성한다.

Description

기상 데이터의 통계 분석을 사용하여 경제 동향들을 예측하기 위한 시스템 및 방법
사회기반시설(infrastructure) 이용 가능성으로부터 에너지 소비에 이르는 거시적- 및 미시적-경제 동향들은 종종 기상(weather)의 영향을 받는다. 이와 마찬가지로, 인간의 행동은 종종(의식적으로 또는 잠재 의식적으로) 기상의 영향을 받는다. 이에 따라, 비즈니스들 및 다른 조직들은 전반적인 경제 동향들로부터 특정 제품들에 대한 수요에 이르는 모든 것을 예측하기 위해 정확한 예측들을 추구한다.
기존의 경제 예측 시스템은 미래의 경제 행동을 예측하기 위해, 과거의 경제 행동을 분석하고 경제 예측 모델들을 구성한다. 기상 데이터베이스들은 과거의 이벤트(event)들과 상관될 수 있는 히스토리컬 기상 데이터(historical weather data)를 포함한다. 이에 따라, 몇몇 기존의 경제 예측 시스템들은, 예측된 기상 및 기후 조건들을 고려하여 미래의 경제 행동을 예측하기 위해, 과거의 기상 데이터를 통합하고 기상 조건들의 함수로서 경제 행동을 모델링할 수 있다.
기존의 경제 예측 시스템들은, 관심(interest)의 경제 지표와 상관될 수 있는 모든 이용 가능한 지표들을 분석하고, 관심의 경제 지표와 상관이 있는 지표들을 결정하고, 괌심의 경제 지표와 통계적으로 유의미한 상관이 있는 모든 지표들의 함수로서 관심의 경제 지표를 예측하는 모델을 생성함으로써, 관심의 경제 지표를 모델링한다.
그러나, 기존의 시스템들은 과거의 기상 지표들의 다중 곡선성(multicollinearity) 때문에, 과거의 기상 지표들을 기반으로 과거의 이벤트들을 모델링하도록 제대로 구성되지 않았다. 다중 곡선성은, 두 개 이상의 지표들이 서로와 적당히 또는 높게 상관될 때 발생하는 현상이다. 기상 및 기후 과학 분야에서, 기상 지표들의 개수가 크게 증가되었다. 예를 들면, 펜실베니아 주립 대학(State College, PA)의 액츄 웨더 엔터프라이즈 솔류션즈(AccuWeather Enterprise Solutions)로부터 현재 이용 가능한 기상 데이터베이스는, 1차 파생물들, 2차 파생물들 등을 포함하여, 300 개를 초과하는 기상 지표들을 포함한다. 이러한 추가 기상 지표들 중 일부는, 단순한 경제 예측 시스템들에 의해 고려될 수 있는 단순한 기상 지표들 보다 경제 동향들을 더 예측한다. 그러나, 300 개를 초과하는 기상 지표들의 경우, 이러한 기상 지표들 중 일부가 동일한 현상의 관련성이 높은 측정치들이므로, 다중 곡선성이 빈번하게 발생한다. 예를 들면, 일일 고온, 저온 및 평균 온도가 모두 다른 지표들이다. 그러나, 이들은 특정한 날짜의 특정한 위치에서 대기에 존재하는 모든 측정 열이므로, 이들은 모두 서로 밀접하게 상관이 있다.
히스토리컬 기상 지표들의 높은 다중 곡선성 때문에, 기존의 경제 예측 시스템들은 오버핏된(overfitted) 모델들 또는 언더핏된(underfitted) 모델들을 생성한다. 오버피팅(overfitting)은 특정 데이터 세트(set)에 너무 가깝거나 정확하게 대응하는 분석의 생성물이므로, 미래의 관측치들을 안정적으로 예측하지 못할 수 있다. 본질적으로, 오버핏된 모델은 과거의 데이터 내의 잔차 변동(즉, 노이즈(noise))을 따르며, 이는 미래의 데이터에서 발생할 것으로 예측되지 않고 부정확한 예측으로 이어진다. 언더피팅(underfitting)은, 통계적 모델이 데이터의 기본 구조를 적절하게 획득할 수 없을 때, 발생한다. 언더피팅의 간단한 예는 선형 데이터를 비-선형 데이터에 피팅하는 것이고, 이는 예측 성능이 좋지 않은 경향이 있다. 그러나, 언더핏된 모델은, 올바르게 지정된 모델에 나타나는 몇몇의 파라미터들이나 항(term)들이 없는 어떤 모델일 수 있다.
따라서, 히스토리컬 기상 지표들의 높은 다중 곡선성으로 인한 오버핏된 모델 또는 언더핏된 모델을 개발하지 않고, 예측된 기상 지표들을 기반으로 미래의 경제 동향들을 예측하는 경제 예측 시스템에 대한 요구가 있다.
기존의 예측 시스템들의 이들 및 다른 기술적 문제들을 극복하기 위해, 경제 예측 시스템은, 그룹들로 분류되는 기상 지표들을 분석하고(각 그룹 내의 기상 지표들의 다중 곡선성을 기반으로), 각 그룹으로부터의 가장 통계적으로 유의미한 기상 지표들을 식별하고, 각 그룹으로부터의 하나 이상의 가장 통계적으로 유의미한 기상 지표들을 사용하여 통계적 모델을 생성하고, 예측된 기상 지표들을 수신하고, 통계적 모델과 예측된 기상 지표들을 기반으로 관심의 경제 성능 지표를 예측하도록, 제공된다.
기존의 방법들을 사용하여 생성된 언더핏된 또는 오버핏된 모델들과 대조적으로, 이러한 기상 지표들의 다중 곡선성을 기반으로 그룹들로 분류되는 기상 지표들을 분석하는 것은, 개시된 시스템으로 하여금, 테스트하는 데 계산 비용이 많이 드는 많은 수의 기상 지표들을 사용하여, 미래의 경제 동향들을 가장 잘 예측하는 기상 지표들을 효율적으로 식별하게 한다.
예시적인 실시예들의 측면들은 첨부되는 도면을 참조하여 더 잘 이해될 수 있다. 도면의 구성 요소들은 반드시 스케일링될 필요는 없으며, 대신 예시적인 실시예들의 원리를 설명하기 위해 강조된다.
도 1은 예시적인 실시예에 따른 경제 예측 시스템의 블록도이다;
도 2는 예시적인 실시예에 따라, 히스토리컬 기상 지표들을 기반으로 관심의 경제 성능 지표를 위한 모델을 생성하고, 예측된 기상 지표들을 기반으로 관심의 경제 성능 지표에 대한 예측을 생성하기 위한 프로세스의 개요를 도시하는 흐름도이다;
도 3은 예시적인 실시예에 따라, 각 그룹으로부터 가장 통계적으로 유의미한 히스토리컬 기상 지표들을 선택하기 위한 프로세스를 도시하는 블록도이다;
도 4는 예시적인 실시예에 따른 경제 예측 시스템(100)의 일 아키텍처(400)의 블록도이다;
도 5는 다른 예시적인 실시예에 따른 경제 예측 시스템(100)의 다른 아키텍처(500)의 블록도이다; 그리고
도 6은 다른 예시적인 실시예에 따른 경제 예측 시스템(100)의 다른 아키텍처(600)의 블록도이다.
본 발명의 예시적인 실시예들의 다양한 뷰(view)들을 도시하는 도면들에 대한 참조가 이하에서 이루어진다. 도면과 이하의 도면의 설명에서, 특정 용어는 단지 편의를 위해 사용되며, 본 발명의 실시예들을 제한하는 것으로 간주되어서는 안 된다. 또한, 도면과 이하의 설명에서, 유사한 참조 부호는 전체에 걸쳐 유사한 요소들을 지시한다.
도 1은 예시적인 실시예에 따른 경제 예측 시스템(100)의 블록도이다.
도 1을 참조하면, 경제 예측 시스템(100)은 경제 성능 데이터베이스(120), 히스토리컬 기상 데이터베이스(140), 기상 예측 데이터베이스(160) 및 경제 예측 엔진(180)을 포함한다.
히스토리컬 경제 성능 데이터베이스(120)는 지리적-위치 및 시간-인덱스된 히스토리컬 경제 성능 지표(122)들을 저장하고 있다. 히스토리컬 경제 성능 지표(122) 각각은 특정 시간(126)에 특정 위치(124)에서 발생하는 하나 이상의 이벤트들을 기술한다. 각 지리적-위치 및 시간-인덱스된 히스토리컬 경제 성능 지표(122)에 대해, 히스토리컬 경제 성능 데이터베이스(120)는 각 지표(122)의 크기, 위치(124) 및 시간(126)을 저장하고 있다. 위치(124)는 위도와 경도, 지방자치 당국(예컨대, 시(city), 카운티(county), 주(state) 등), 지역 등으로 표현될 수 있다. 시간(126)은 날짜, 그 날짜 상의 특정 시간 등일 수 있다.
히스토리컬 경제 성능 지표(122)들은 소매 판매 지표들(예컨대, 달러로의 판매, 판매 시점 수량, 카운트 동향들, 특정 SKU 번호들로의 제품 판매 등), 사회간접자본 지표(예컨대, 위치 이용 가능성, 정전 등), 상품 지표들(예컨대, 에너지 사용, 다른 상품들에 대한 수요), 인적 자원 지표들(예컨대, 직원 이용 가능성) 등을 포함할 수 있다.
히스토리컬 경제 성능 지표(122)들은, 미국 국립 해양 대기 관리국(U.S. National Oceanic and Atmospheric Administration; NOAA), 미국 국립 항공 우주국(U.S. National Aeronautics and Space Administration; NASA), 미국 보건 자원 및 서비스 관리국(U.S. Health Resources & Services Administration; HRSA), 미국 경제 분석국(U.S. Bureau of Economic Analysis; BEA) 및 미국 노동 통계국(U.S. Bureau of Labor Statistics; BLS)과 같은 정부 소스(source)들뿐 아니라, 가뭄 모니터, NSIDC(National Snow and Ice Data Center), ESRI 마켓플레이스 데이터, CISER(Cornell Institute for Social and Economic Research), TWITTER 및 FACEBOOD 데이터(FACEBOOK은 페이스북 사(Facebook, Inc.)의 상표이다. TWITTER는 트위터 사(Twitter, Inc.)의 상표이다.), 금융 마켓 데이터 및 정전 데이터와 같은 경제 데이터의 개인 소스들을 포함하는 제3 자 소스들로부터 수신될 수 있다. 그러나, 대체로, 경제 예측 시스템(100)은 클라이언트(client)로부터 수신된 히스토리컬 경제 성능 지표(122)들을 기반으로 특정 클라이언트에 대한 경제 동향들을 예측하는 데 사용된다.
히스토리컬 기상 데이터베이스(140)는 지리적-위치 및 시간-인덱스된 히스토리컬 기상 지표(142)들을 저장하고 있다. 또한, 지리적-위치 및 시간-인덱스된 히스토리컬 기상 지표(142)들 각각은 특정 시간(146)에 특정 위치(144)에서의 기상 또는 환경 조건을 기술한다. 각 지리적-위치 및 시간-인덱스된 히스토리컬 기상 지표(142)에 대해, 히스토리컬 기상 데이터베이스(140)는 각 지표(142)의 크기, 위치(1400) 및 시간(146)을 저장하고 있다. 위치(144)는 위도와 경도, 지방자치 당국(예컨대, 시, 카운티, 주 등), 지역 등으로 표현될 수 있다. 시간(146)은 날짜, 그 날짜 상의 특정 시간 등일 수 있다.
히스토리컬 기상 지표(142)들은, 최고 온도, 최저 온도, 일 평균 온도(전체 시간들), 정상으로부터의 최고 온도 이탈, 정상으로부터의 최저 온도 이탈, 정상으로부터 일 평균 온도 이탈, 일 평균 온도(최고/최저) 등을 포함하는 온도 지표들; 최대 이슬점 온도, 최소 이슬점 온도, 평균 이슬점 온도, 최대 상대 습도, 최소 상대 습도, 평균 상대 습도, 최대 습구(wet bulb) 온도, 최소 습구 온도, 평균 습구 온도, 토양 수분 등을 포함하는 이슬점, 상대 습도, 토양 온도 및 수분 지표들; 최고 압력, 최저 압력, 평균 압력 등을 포함한느 대기 압력 지표들; 냉방 도일(degree days), 난방 도일, 유효 도일, 생장 도일, 결빙 도일 등을 포함하는 냉방, 난방, 유효, 생장 및 결빙 도일 지표들; 최대 지속 풍속, 최저 지속 풍속, 평균 지속 풍속, 최고 바람 돌풍(gust) 등을 포함하는 바람 지표들; 최대 일사량, 최소 일사량, 평균 일사량, 총 일사량 등을 포함하는 일사량 지표들; 총 햇빛 분(total minutes of sunshine), 가능 햇빛 분(minutes of sunshine possible), 가능 햇빛 백분율(percent of sunshine possible) 등을 포함하는 햇빛 지표들; 관측된 일일 물 당량, 정상적인 일일 물 당량의 백분율 등을 포함하는 강수 지표들; 강설, 0.050 인치의 눈, 지상의 눈, 35 마일 이내의 눈 등을 포함하는 눈, 결빙, 얼음 및 진눈깨비 지표들; 평균 가시성, 0.050 마일의 가시성, 2.00 마일의 가시성 등을 포함하는 봄, 열대 폭풍, 허리케인 및 가시성 지표들을 포함할 수 있다. 히스토리컬 기상 지표(142)들은 1차 파생물(proprietary), 2차 파생물 등을 포함할 수 있다. 히스토리컬 기상 지표(142)들은 평균 일일 REALFEEL 온도, 최대 일일 REALFEEL 온도, 최소 일일 REALFEEL 온도 등과 같은 독점적 기상 지표들을 포함할 수 있다(REALFEEL은 액츄웨더 사(AccuWeather, Inc.)의 등록된 서비스 마크이다).
히스토리컬 기상 지표(142)들은, 예컨대 액츄 웨더 사, 액츄 웨더 엔터프라이즈 솔류션즈 사, 미국 기상청(National Weather Service; NWS), 미국 국립 허리케인 센터(National Hurricane Center; NHC), 캐나다 환경부(Environment Canada), 다른 정부 에이전시들(예컨대, 영국 기상청(U.K. Meteorologic Service), 일본 기상청(Japan Meteorological Agency) 등), 개인 회사들(예컨대, Vaislia의 미국 국립 번개 감지 네트워크, 기상 결정 테크놀로지 사), 개인들(예컨대, Spotter Network의 회원) 등으로부터 수신될 수 있다. 또한, 히스토리컬 기상 지표(142)들은, 예컨대 미국 환경 보호국(U.S. Environmental Protection Agency; EPA)로부터 수신되는 환경 조건에 관한 정보 및/또는 예컨대 미국 지질 조사국(U.S. Geological Survey; USGS)으로부터 수신되는 자연 재해(예컨대, 지진)에 관한 정보를 포함할 수 있다.
기상 예측 데이터베이스(160)는 예측된 기상 지표(162)들을 저장하고 있다. 예측된 기상 지표(162)들은 특정 위치(164)들과 특정 시간(166)들에 대한 예측된 기상 및 환경 조건들을 포함한다. 위치(164)들은 위도와 경도, 지방자치 당국(예컨대, 시(city), 카운티(county), 주(state) 등), 지역 등으로 표현될 수 있다. 시간(166)들은 날짜, 그 날짜 상의 특정 시간 등일 수 있다. 예측된 기상 지표(162)들은 단기간(short term) 예측된 기상 지표들, 장기간(longterm) 예측된 기상 지표들, 장기간 기후 지표들 등일 수 있다.
예측된 기상 지표(162들은 히스토리컬 기상 지표(142)들과 동일한 기상 지표들을 포함하고, 동일한 소스들로부터 수신될 수 있다. 또한, 경제 예측 시스템(100)은 현재의 기상 조건들을 기반으로 미래의 기상 조건들을 예측하기 위해, 예컨대 대기와 해양의 하나 이상의 수학적 모델들을 사용하여, 예측된 기상 지표(162)들의 일부 또는 전부를 생성하는 기상 예측 엔진(미도시)를 포함할 수 있다.
경제 예측 엔진(180)은, 지리적-위치 및 시간-인덱스된 관심의 히스토리컬 경제 성능 지표(122)와 지리적-위치 및 시간-인덱스된 히스토리컬 기상 지표(142)들 사이의 상관성을 기반으로, 각 관심의 경제 성능 지표(122)에 대한 통계적 모델을 구축한다. 후술되는 바와 같이, 경제 예측 엔진(180)은, 관심의 히스토리컬 경제 성능 지표(122)와 상관이 있는 히스토리컬 기상 지표(142)들을 식별하고, 이로 인해 모델이 생성되어, 예측된 기상 지표(162)들을 기반으로 관심의 경제 성능 지표(122)를 예측하는 데 사용될 수 있다.
특히, 경제 예측 엔진(180)은, 본 문서의 배경기술에 기술된 바와 같이, 히스토리컬 기상 지표(142)들의 다중 곡선성으로 인해 오버핏된 또는 언더핏된 모델이 생성되므로, 모든 기상 지표(142)들을 함께 분석하거나 통계적으로 유의한 것으로 확인된 모든 히스토리컬 기상 지표(142)들을 사용하여 통계적 모델을 구축하지 않는다.
대신에, 경제 예측 엔진(180)은 히스토리컬 기상 지표(142)들의 그룹들을 개별적으로 분석하고, 각각의 그룹 내의 가장 통계적으로 유의미한 히스토리컬 기상 지표(142)들 중 하나 이상을 식별한다. 각 그룹은, 다중 곡선성을 기반으로 함께 그룹화되는 히스토리컬 기상 지표(142)들을 포함한다.
일 예시적인 실시예에 있어서, 경제 예측 엔진(180)은 히스토리컬 기상 지표(142)들의 다음의 열 개의 그룹들을 사용한다.:
1. 온도 지표들
a. 최고 온도
b. 최저 온도
c. 일 평균 온도(전체 시간들)
d. 정상으로부터의 최고 온도 이탈
e. 정상으로부터의 최저 온도 이탈
f. 정상으로부터 일 평균 온도 이탈
g. 일 평균 온도(최고/최저)
h. 기타
2. 이슬점, 상대 습도, 토양 온도 및 수분 지표들
a. 최대 이슬점 온도
b. 최소 이슬점 온도
c. 평균 이슬점 온도
d. 최대 상대 습도
e. 최소 상대 습도
f. 평균 상대 습도
g. 최대 습구 온도
h. 최소 습구 온도
i. 평균 습구 온도
j. 토양 수분
k. 기타
3. 대기 압력 지표들
a. 최고 압력
b. 최저 합력
c. 일 평균 압력
d. 기타
4. 냉방, 난방, 유효, 생장 및 결빙 도일 지표들
a. 냉방 도일
b. 난방 도일
c. 유효 도일
d. 생장 도일
e. 결빙 도일
f. 기타
5. 바람 지표들
a. 최대 지속 풍속
b. 최소 지속 풍속
c. 평균 풍속
d. 최고 바람 돌풍
e. 기타
6. 일사량 지표들
a. 최대 일사량
b. 최소 일사량
c. 평균 일사량
d. 총 일사량
e. 기타
7. 햇빛 지표들
a. 총 햇빛 분
b. 가능 햇빛 분
c. 가능 햇빛 백분율
d. 기타
8. 강수 지표들
a. 관측된 일일 물 당량
b. 정상적인 일일 물 당량의 백분율
c. 기타
9. 눈, 결빙, 얼음 및 진눈깨비 지표들
a. 강설
b. 50인치의 눈
c. 지상의 눈
d. 35 마일 이내의 눈
e. 기타
10. 봄, 열대 폭풍, 허리케인 및 가시성 지표들
a. 평균 가시성
b. 0.50 마일의 가시성
c. 2.00 마일의 가시성
d. 기타
히스토리컬 기상 지표(142)들은 다중 곡선성을 기반으로 그룹들로 분리되어 있다(예컨대, 상술된 바와 같이). 구체적으로, 기상 지표(142)들은, 가장 높은 절대(absolute) 피어슨 상관성 계수(Pearson correlation coefficient)를 갖는 히스토리컬 기상 지표(142)들이 동일한 그룹 내에 있도록, 그룹들로 분리된다. 표 1은 다중 곡선성을 결정하는 데 피어슨 상관성 계수들을 사용할 때의 경험 법칙(rules of thumb)들을 나타내고 있다.
Figure pct00001
표 2는, 세 개의 온도 지표들(최고 온도, 최저 온도 및 평균 온도)와 세 개의 바람 지표들(최고 풍속, 최저 풍속 및 평균 풍속)을 사용하여, 피어슨 상관성 계수들을 기반으로 히스토리컬 기상 지표(142)들을 그룹들로 분리하는 간단한 예를 나타내고 있다.
Figure pct00002
표 2에 나타낸 바와 같이, 최고 온도, 최저 온도 및 평균 온도는 모두 서로에 대해 강한(즉, 양의) 상관성을 갖고, 이에 따라 함께(온도 지표들로서) 그룹화된다. 이와 유사하게, 최고 풍속, 최저 풍속 및 평균 풍속은 모두 서로에 대해 적당한-내지-강한(즉, 양의) 상관성들을 갖고, 이에 따라 함께(바람 지표들로서) 그룹화된다. 반대로, 온도 지표들 중 어떤 것도 바람 지표들 중 어떤 것과 약한(양의 또는 음의) 상관성 조차 갖지 않는다. 따라서, 예시적인 온도 지표들과 예시적인 바람 지표들이 상이한 그룹들로 분리된다.
도 2는 예시적인 실시예에 따라, 히스토리컬 기상 지표(142)들을 기반으로 관심의 경제 성능 지표(122)를 위한 모델을 생성하고, 예측된 기상 지표(162)들을 기반으로 관심의 경제 성능 지표(122)에 대한 예측을 생성하기 위한 프로세스(200)의 개요를 도시하는 흐름도이다. 프로세스(200)는 각 관심의 경제 성능 지표(122)에 대한 경제 예측 엔진(180)에 의해 수행된다.
경제 기상 지표(142)들의 각 그룹에 대해, 상관성 분석은 단계 210에서 수행된다. 상관성 분석은 관심의 경제 성능 지표(122)에 대해 각 히스토리컬 기상 지표(142)의 피어슨 상관성 계수 및 통계적 유의미성(예컨대, 확률값(probability value) 또는 "p-값")을 결정한다.
최대 미리 결정된 개수 만큼의 가장 통계적으로 유의미한 히스토리컬 기상 지표(142)들이 단계 220에서 히스토리컬 기상 지표(142)들의 각 그룹으로부터 선택된다. 상관성 분석을 수행하고 각 그룹으로부터의 가장 통계적으로 유의미한 히스토리컬 기상 지표(142)들을 선택하는 프로세스들 210 및 220은 도 3을 참조하여 상세하게 기술된다.
통계적 모델은 단계 230 에서 선택된 히스토리컬 기상 지표(142)들을 사용하여 생성된다. 모델 예측은, 회귀 분석(regression analysis)(예컨대, 선형의, 로지스틱, 최상의 서브세트(subset)들의, 단계적 등), 결정 트리(decision tree)들(예컨대, C5, CART, CHAID 등), 뉴럴 네트워크(neural network)들(다층 퍼셉트론(Multilayer Perceptron), 방사 기저 함수(Radial Basis Function) 등) 또는 다른 인공 지능 등을 사용하여 생성될 수 있다.
예측된 기상 지표(162)들은 단계 240에서 수신된다.
관심의 경제 성능 지표(122)에 대한 예측은, 단계 230에서 생성된 통계적 모델과 단계 240에서 수신된 예측된 기상 지표(162)들을 기반으로, 단계 250에서 생성된다.
단계 250에서 생성된 예측은 단계 260에서 출력된다. 예측은 그래픽 사용자 인터페이스(graphical user interface)를 통해 사용자에게 출력될 수 있다. 추가적으로 또는 대안적으로, 예측은 클라이언트 컴퓨팅 장치(예컨대, 관심의 경제 성능 지표(122)의 소스)로 전송을 위해 통신 네트워크로 출력될 수 있다.
도 3은 예시적인 실시예에 따라, 각 그룹으로부터 가장 통계적으로 유의미한 히스토리컬 기상 지표(142)들을 결정 및 선택하기 위한 프로세스들(210, 220)을 도시하는 블록도이다.
도 3에 도시된 바와 같이, 히스토리컬 기상 지표(142)들 각각은 그룹들로 분리된다. 이러한 예에서, 히스토리컬 기상 지표(142)들은, 그룹 A가 지표 A1, 지표 A2 등을 포함하고, 그룹 B가 지표 B1, 지표 B2 등을 포함하도록, 그룹들 A 내지 J로 분리된다.
히스토리컬 기상 지표(142)들의 각 그룹에 대해, 상관성 분석은 각 히스토리컬 기상 지표(142)의 피어슨 상관성 계수와 통계적 유의미성을 식별하도록 수행된다. 구체적으로, 그룹 A에 대해, 상관성 분석은 단계 210에서, 관심의 경제 성능 지표(122)에 대해 그룹 A 내의 히스토리컬 기상 지표들 A1, A2 등 각각의 피어슨 상관성 계수와 통계적 유의미성을 식별하도록 수행된다. 이와 유사하게, 그룹 B에 대해, 상관성 분석은 단계 211에서, 관심의 경제 성능 지표(122)에 대해 그룹 B 내의 히스토리컬 기상 지표들 B1, B2 등 각각의 피어슨 상관성 계수와 통계적 유의미성을 식별하도록 수행된다. 유사한 상관성 분석이 단계들 212 내지 219에서, 그룹들 C 내지 J 내의 히스토리컬 기상 지표(142)들 각각에 대해 수행된다.
표 3은 일곱 개의 온도 지표들의 피어슨 상관성 계수와 통계적 유의미성을 식별하는 예를 나타내고 있다(상술된 예의 그룹 A).
Figure pct00003
히스토리컬 기상 지표(142)들의 각 그룹에 대해, 최대 n 개 만큼의 가장 유의미한 히스토리컬 기상 지표(142)들이 선택된다. 구체적으로, 단계 220에서의 그룹 A에 대해, 미리 결정된 임계값 내에 통계적 유의미성을 갖는
Figure pct00004
개의 히스토리컬 기상 지표(142)들이 존재하면(예컨대, 미리 결정된 임계값은
Figure pct00005
일 수 있고, 바람직하게는
Figure pct00006
일 수 있고, 더 바람직하게는
Figure pct00007
)일 수 있다), 가장 높은 절대 피어슨 상관성 계수를 갖는
Figure pct00008
개의 히스토리컬 기상 지표(142)들이 선택된다. 이와 유사하게, 단계 221에서의 그룹 B에 대해, 가장 높은 절대 피어슨 상관성 계수를 갖는
Figure pct00009
개의 히스토리컬 기상 지표(142)들이 선택된다(미리 결정된 임계값 내에 통계적 유의미성을 갖는
Figure pct00010
개의 히스토리컬 기상 지표(142)들이 존재하면). 유사한 선택 프로세스가 단계들 222 내지 229에서, 그룹 C로부터 최대
Figure pct00011
개 만큼의 지표들을 선택하고, 그룹 D로부터 최대
Figure pct00012
개 만큼의 지표들을 선택하고, ..., 및 그룹 J로부터 최대
Figure pct00013
개 만큼의 지표들을 선택하도록 수행된다.
표 3의 예를 다시 참조하면, 그룹 A로부터 선택된 히스토리컬 기상 지표(142)들의 개수
Figure pct00014
가 2이면, 경제 예측 엔진(180)은 통계적 모델을 구축하기 위해, 정상으로부터 최고 온도 이탈 및 정상으로부터 일 평균 온도 이탈을 선택한다.
각 그룹으로부터 선택된 히스토리컬 기상 지표들의 개수
Figure pct00015
은 그룹마다 다를 수 있다. 상술된 히스토리컬 기상 지표(142)들의 특정한 열 개의 그룹들을 사용하여, 경제 예측 엔진(180)은 두 개의 가장 유의미한 온도 지표들(그룹 1), 두 개의 가장 유의미한 이슬점, 상대 습도, 토양 온도 및 습도 지표들(그룹 2), 하나의 가장 통계적으로 유의미한 대기압 지표(그룹 3), 두 개의 가장 통계적으로 유의미한 냉방, 난방, 유효, 생장 및 결빙 도일 지표들(그룹 4), 두 개의 가장 통계적으로 유의미한 바람 지표들(그룹 5), 하나의 가장 통계적으로 유의미한 일사량 지표(그룹 6), 두 개의 가장 통계적으로 유의미한 햇빛 지표들(그룹 7), 두 개의 가장 통계적으로 유의미한 강수 지표들(그룹 8), 세 개의 가장 통계적으로 유의미한 눈, 결빙, 얼음 및 진눈깨비 지표들(그룹 9) 및 세 개의 가장 통계적으로 유의미한 열대 폭풍, 허리케인 및 가시성 지표들(그룹 10)을 선택한다.
상술된 바와 같이, 경제 예측 엔진(180)은 모든 그룹들로부터의 선택된 히스토리컬 기상 지표(142)들을 사용하여(가장 바람직한 실시예에서, 관심의 경제 성능 지표(122)에 대해 20 개의 가장 통계적으로 유의미한 히스토리컬 기상 지표(142)들), 관심의 경제 성능 지표(122)를 예측하기 위해 통계적 모델을 생성한다.
도 4는 예시적인 실시예에 따른 경제 예측 시스템(100)의 일 아키텍처(400)의 블록도이다.
도 4에 도시된 바와 같이, 아키텍처(400)는, 예컨대 하나 이상의 클라이언트-측 네트워크(432)들을 통해 통신하는 하나 이상의 클라이언트-측 디바이스(420)들, 및 예컨대 하나 이상의 서버-측 네트워크(434)들을 통해 통신하는 하나 이상의 서버-측 디바이스(440)들을 포함할 수 있다. 클라이언트-측 디바이스(420)들은, 인터넷과 같은 광역(wide area) 네트워크(436)를 통해 서버-측 디바이스들과 통신할 수 있다. 클라이언트-측 디바이스(420)들은 하나 이상의 클라이언트 컴퓨터(422, 424 등)들뿐 아니라 비-일시적 컴퓨터 판독 가능한 기억 매체(426)를 포함할 수 있다. 서버-측 디바이스(440)들은 하나 이상의 서버(442, 444 등)들뿐 아니라 비-일시적 컴퓨터 판독 가능한 기억 매체(446)를 포함할 수 있다.
클라이언트 컴퓨터(422, 424 등)들 각각은 네트워크(432, 436) 등을 통해 데이터를 송신 및/또는 수신하도록 구성되는 어떤 적합한 하드웨어 컴퓨팅 디바이스일 수 있다. 예를 들면, 클라이언트 컴퓨터(422, 424 등)들 각각은, 서버, 개인 컴퓨터, 노트북 컴퓨터, 스마트폰, 개인 휴대 정보 단말기(personal digital assistant; PDA), 태블릿(tablet), 네트워크-접속 차량 등과 같은 네트워크-접속 컴퓨팅 장치일 수 있다. 클라이언트 컴퓨터들 각각은 내부 저장 장치 및 중앙 처리 장치(CUP)와 같은 하드웨어 프로세서를 포함한다. 클라이언트 컴퓨터(422, 424 등)들의 일부 또는 전부는, 디스플레이와 같은 출력 디바이스들 및 키보드, 마우스, 터치패드 등과 같은 입력 디바이스들을 포함할 수 있다. 하나 이상의 서버(442, 444 등)들 각각은, 네트워크(434, 436 등)을 통해 데이터를 송신 및/또는 수신하도록 구성되는 어떤 적합한 하드웨어 컴퓨팅 디바이스일 수 있다. 예를 들면, 하나 이상의 서버(442, 444 등)들 각각은 어플리케이션 서버(application server) 및 클라이언트-측 디바이스(420)들에 의해 액세스 가능한 웹 사이트들을 호스팅하는 웹 서버일 수 있다. 하나 이사의 서버(442, 444 등)들 각각은 내부 비-일시적 저장 디바이스 및 적어도 하나의 하드웨어 컴퓨터 프로세서를 포함한다. 각 비-일시적 컴퓨터 판독 가능한 기억 매체(426, 446)는 하드 디스크들, 솔리드-스테이트(solid-state) 메모리 등을 포함할 수 있다. 하나 이상의 네트워크(432, 434, 436 등)들은, 인터넷, 셀룰러(cellular) 네트워크들, 광역(wide area) 네트워크(WAN)들, 로컬 영역(local area) 네트워크(LAN)들 등 중 어떤 조합을 포함할 수 있다. 네트워크(432, 434, 436 등)(들)를 통한 통신은 유선 및/또는 무선 접속들에 의해 실현될 수 있다.
도 1을 다시 참조하면, 경제 예측 시스템(100)은 경제 성능 데이터베이스(120), 히스토리컬 기상 데이터베이스(140), 기상 예측 데이터베이스(160) 및 경제 예측 엔진(180)을 포함한다. 경제 예측 엔진(180)은 하드웨어 컴퓨터 프로세서에 의해 실행되는 소프트웨어 명령어들에 의해 실현될 수 있다. 경제 예측 엔진(180)은 서버(442, 444 등)들 중 어느 하나(서버 측) 및/또는 클라이언트 컴퓨터(422, 424)들 중 어느 하나(클라이언트 측)에 의해 실행되는 소프트웨어 명령어들에 의해 실현될 수 있다. 이와 유사하게, 경제 성능 데이터베이스(120), 히스토리컬 기상 데이터베이스(140) 및 기상 예측 데이터베이스(160)가 비-일시적 컴퓨터 판독 가능한 기억 매체(446)(서버 측(440)) 및/또는 비-일시적 컴퓨터 판독 가능한 기억 매체(426)(클라이언트 측(420)) 상에 저장될 수 있다.
도 4에 도시된 아키텍처(400)에서, 경제 예측 엔진(180)은 서버(442, 444 등)들 중 어느 하나(서버 측)에 의해 실행되는 소프트웨어 명령어들에 의해 실현되고, 경제 성능 데이터베이스(120), 히스토리컬 기상 데이터베이스(140) 및 기상 예측 데이터베이스(160)는 비-일시적 컴퓨터 판독 가능한 기억 매체(446)(서버 측(440)) 상에 저장된다. 그러나, 경제 성능 지표(122)들과 연관된 위치(124)들과 시간(126)들과 함께 경제 성능 지표(122)들은 하나 이상의 클라이언트 컴퓨터(422, 424 등)(클라이언트 측(420))으로부터 수신될 수 있다. 이러한 실시예에서, 경제 예측 엔진(180)은, 광역 네트워크(436)을 통해 클라이언트 컴퓨터(422 또는 424)들 중 하나 이상으로 전송을 위해 서버-측 네트워크(434)로 각 관심의 경제 성능 지표(122)에 대한 예측을 출력할 수 있다. 클라이언트 컴퓨터(422, 424 등)들은 그래픽 사용자 인터페이스를 통해 사용자에게 예측을 출력할 수 있다.
도 5는 다른 예시적인 실시예에 따른 경제 예측 시스템(100)의 다른 아키텍처(500)의 블록도이다.
도 5에 도시된 아키텍처(500)는, 경제 예측 엔진(180)이 클라이언트 컴퓨터(422, 424 등)들 중 어느 하나(클라이언트 측(420))에 의해 실행되는 소프트웨어 명령어들에 의해 실현되고, 경제 성능 데이터베이스(120), 히스토리컬 기상 데이터베이스(140) 및 기상 예측 데이터베이스(160)가 비-일시적 컴퓨터 판독 가능한 기억 매체(426)(클라이언트 측(420)) 상에 저장되는 점을 제외하면, 도 4에 도시된 아키텍처(400)와 유사하다. 이러한 실시예에서, 히스토리컬 기상 지표(142)들(히스토리컬 기상 지표(142)들과 연관된 위치(144)들 및 시간(146)들과 함께)뿐 아니라 예측된 기상 지표(162)들(히스토리컬 기상 지표(162)들과 연관된 위치(164)들 및 시간(166)들과 함께)은 하나 이상의 서버(442, 444 EMD)들(서버 측(440))로부터 수신될 수 있다. 이러한 실시예에서, 경제 예측 엔진(180)은 그래픽 사용자 인터페이스를 통해 사용자에게 각 관심의 경제 성능 지표(122)에 대한 예측을 출력할 수 있다.
도 6은 다른 예시적인 실시예에 따른 경제 예측 시스템(100)의 다른 아키텍처(600)의 블록도이다.
도 6에 도시된 아키텍처(600)는, 머신 러닝(machine learning) 또는 다른 인공 지능 플랫폼과 같은 클라우드 컴퓨팅 플랫폼(cloud computing platform)(620)을 포함하는 점을 제외하면, 도 4에 도시된 아키텍처(400)와 유사하다. 예를 들면, 클라우드 컴퓨팅 플랫폼(620)은 마이크로소프트 애저(Microsoft Azure) 머신 러닝 환경일 수 있다. 이러한 실시예에서, 경제 예측 엔진은 클라우드 컴퓨팅 플랫폼(620)에 의해 실행되는 소프트웨어 명령어들에 의해 실현된다. 아키텍처(400) 및 아키텍처(500)와 유사하게, 경제 성능 데이터베이스(120), 히스토리컬 기상 데이터베이스(140) 및 기상 예측 데이터베이스(160)는 비-일시적 컴퓨터 판독 가능한 기억 매체(446)(서버 측(440)) 및/또는 비-일시적 컴퓨터 판독 가능한 기억 매체(426)(클라이언트 측(420)) 상에 저장될 수 있다.
현재 이용 가능한 기상 데이터베이스는 300 개를 초과하는 히스토리컬 기상 지표(142)들을 갖기 때문에, 상술된 차원 축소(dimensional reduction) 프로세스는, 경제 예측 시스템(100)이 모든 지표들과 함께 테스트될 때(기존의 경제 예측 시스템들로 수행되는 바와 같이) 잠재적으로 손실될 수 있는 유의미한 지표(142)들을 발견할 수 있도록 허용하여, 관심의 경제 성능 지표(122)를 예측하는 데 사용되는 통계적 모델의 정확성이 향상된다. 일 예로서, 풍속, 온도 및 습도가 함께 테스트될 때, 온도와 습도는 강한 상호 작용으로 인해 통계적으로 유의미할 수 있으며, 이는 관심의 경제 성능 지표(122)에 대한 풍속의 영향을 흐리게 한다. 그러나, 경제 예측 시스템(100)이 상술된 바와 같이 풍속을 다른 풍속 지표들과 함께 연관시켜 테스트할 때, 경제 예측 시스템(100)은, 최고 지속 풍속과 바람 돌풍 속도가 특정 경제 성능 지표(122)들과 통계적으로 유의미하다는 것을 확인한다.
경제 예측 시스템(100)은, 미래의 모델들의 정확도를 희생시키지 않으면서 히스토리컬 기상 지표(142)들의 개수를 보다 관리 가능한 세트로 감소시키고, 각 그룹으로부터 가장 통계적으로 유의미한 히스토리컬 기상 지표(142)들로 분석 프로세스들을 수행함으로써, 경제 동향들의 매우 정확한 예측들을 생성한다. 또한, 개시된 경제 예측 시스템(100)은 다양한 분석 프로젝트들을 수행하기 위해 사용자에게 반복 가능한 결과들을 제공한다.
일반적으로, 테스트를 위해 이용 가능한 많은 양의 히스토리컬 기상 지표(142)들이 테스트하는 데 계산 비용이 많이 든다. 분리된 그룹들 내의 히스토리컬 기상 지표(142)들을 테스트함으로써(그리고 이후에, 통계적 모델을 생성하기 위해 그룹들 각각으로부터 가장 통계적으로 유의미한 히스토리컬 기상 지표(142)들을 결합함으로써), 경제 예측 시스템(100)은 관심의 경제 성능 지표(122)와 유의미한 관계를 갖는 각 그룹으로부터 히스토리컬 기상 지표(142)들을 효율적으로 결정할 수 있다.
또한, 경제 예측 시스템(100)은, 미래의 판매 상승 이벤트들을 포착하고 판매 저하 이벤트들을 최소화하기 위해 예측된 기상 지표(162)들을 사용할 수 있도록, 클라이언트들에게 경제 동향들의 가장 정확한 이해들과 예측들을 제공할 수 있다. 경제 예측 시스템(100)은, 모든 제품 라인들과 지리적 지역들에 걸쳐 보다 효과적인 계획과 증가된 판매를 허용한다.
경제 예측 시스템(100)은 히스토리컬 기상 지표(142)들의 높은 다중 곡선성으로 인해, 히스토리컬 기상 지표(142)들을 함께 분석하고, 이로 인해 언더핏된 및/또는 오버핏된 통계적 모델들을 생성할 수 있는 기존의 경제 예측 시스템들의 기술적 문제를 극복한다. 히스토리컬 기상 지표(142)들을 함께 분석함으로써, 기존의 경제 예측 시스템은, 다음의 다섯 개의 히스토리컬 기상 지표(142)들만의 함수로써 관심의 경제 성능 지표(122)를 예측하는 언더핏된 통계적 모델을 생성할 수 있다.:
· 가능 햇빛 분
· 계산된 햇빛 백분율
· 0.50 인치의 눈
· 지상의 눈
· 총 물 당량
반대로, 경제 예측 시스템(100)은, 상술된 차원 축소 프로세스를 사용하여, 관심의 경제 성능 지표(122)와 더 미묘한 관계를 갖는 히스토리컬 기상 지표(142)들을 식별할 수 있으며, 이는 히스토리컬 기상 지표(142)들이 함께 분석될 때 손실된다. 이에 따라, 상술된 차원 축소 프로세스를 사용하는 경제 예측 시스템(100)은, 다음의 13 개의 히스토리컬 기상 지표(142)들의 함수로서 관심의 경제 성능 지표(122)를 예측하는 통계적 모델을 생성한다.:
· 평균 풍속
· 최대 습구 온도
· 최소 상대 습도
· 최소 지속 풍속
· 가능 햇빛 분
· 계산된 햇빛 백분율
· 0.50 인치의 눈
· 지상의 눈
· 35 마일 이내의 눈
· 토양 수분
· 총 물 당량
· 0.50 마일의 가시성
· 2.00 마일의 가시성
바람직한 실시예들이 상술되었으나, 본 문서를 검토한 해당 기술분야에서 통상의 지식을 가진 자는 다른 실시예들이 본 발명의 범위 내에서 실현될 수 있다는 것을 쉽게 이해할 것이다. 예를 들면, 특정 개수의 하드웨어 구성 요소들, 소프트웨어 모듈들 등의 개시는 제한적인 것이 아니라, 예시적인 것이다. 따라서, 본 발명은 첨부된 청구범위에 의해서만 제한되는 것으로 해석되어야 한다.

Claims (21)

  1. 관심(interest)의 경제 성능 지표(economic performance metric)를 예측하기 위한 시스템에 있어서, 상기 시스템은,
    관심의 경제 성능 지표를 포함하는 하나 이상의 지리적-위치 및 시간-인덱스된 히스토리컬 경제 성능 지표(historical economic performance metric)들을 저장하는 히스토리컬 경제 성능 데이터베이스;
    지리적-위치 및 시간-인덱스된 히스토리컬 기상 지표(historical weather metric)들을 저장하는 히스토리컬 기상 데이터베이스 - 높은 다중 곡선성을 갖는 상기 히스토리컬 기상 지표들이 함께 그룹화되도록, 상기 히스토리컬 기상 지표들이 그룹들로 분리됨 -;
    지리적-위치 및 시간-인덱스된 예측된 기상 지표(forecasted weather metric)들을 저장하는 기상 예측 데이터베이스를 포함하며,
    경제 예측 엔진은,
    상기 관심의 경제 성능 지표에 대해 상기 히스토리컬 기상 지표들 각각의 상관성 및 통계적 유의미성을 식별하기 위해, 상관성 분석을 수행하고,
    상기 관심의 경제 성능 지표에 대해 가장 높은 상관성과 미리 결정된 임계값을 충족하거나 초과하는 통계적 유의미성을 갖는 각 그룹으로부터의 최대 미리 결정된 개수 만큼의 히스토리컬 기상 지표들을 선택하고,
    상기 그룹들 모두로부터의 상기 선택된 히스토리컬 기상 지표들을 사용하여 상기 관심의 경제 성능 지표를 예측하기 위한 통계적 모델(statistical model)을 생성하고,
    상기 통계적 모델과 상기 예측된 기상 지표들을 사용하여 상기 관심의 경제 성능 지표를 예측하며,
    사용자에게 디스플레이하기 위해 상기 예측된 경제 성능 지표를 출력하는 시스템.
  2. 제1 항에 있어서,
    상기 경제 예측 엔진은,
    회귀 분석(regression analysis)을 사용하여 상기 통계적 모델을 생성하는 시스템.
  3. 제1 항에 있어서,
    상기 경제 예측 엔진은,
    결정 트리(decision tree)들을 사용하여 상기 통계적 모델을 생성하는 시스템.
  4. 제1 항에 있어서,
    상기 경제 예측 엔진은,
    뉴럴 네트워크(neural network)를 사용하여 상기 통계적 모델을 생성하는 시스템.
  5. 제1 항에 있어서,
    상기 히스토리컬 기상 지표들은,
    서로에 대해 가장 높은 절대(absolute) 피어슨 상관성 계수(Pearson correlation coefficient)를 갖는 상기 히스토리컬 기상 지표들이 동일한 그룹 내에 있도록, 그룹들로 분리되는 시스템.
  6. 제1 항에 있어서,
    상기 경제 예측 엔진은,
    상기 관심의 경제 성능 지표에 대해 상기 가장 높은 절대 피어슨 상관성 계수를 갖는 각 그룹으로부터의 최대 상기 미리 결정된 개수 만큼의 히스토리컬 기상 지표들을 선택하는 시스템.
  7. 제1 항에 있어서,
    상기 그룹들은, 제1 그룹 및 제2 그룹을 포함하고,
    상기 경제 예측 엔진은, 상기 제1 그룹으로부터 최대 미리 결정된 제1 개수 만큼의 히스토리컬 기상 지표들을 선택하고, 상기 제1 그룹으로부터 최대 미리 결정된 제2 개수 만큼의 히스토리컬 기상 지표들을 선택하며,
    상기 미리 결정된 제1 개수는, 상기 미리 결정된 제2 개수와 다른 시스템.
  8. 제1 항에 있어서,
    통계적 유의미성에 대한 상기 통계적 유의미성은,
    0.05 이하의 확률값(probability value)인 시스템.
  9. 제1 항에 있어서,
    상기 기상 지표들의 그룹들은,
    온도 지표들, 이슬점(dew point), 상대 습도, 토양 온도 및 수분 지표들, 대기압 지표들, 냉방, 난방, 유효, 생장 및 결빙 도일(degree days) 지표들, 바람 지표들, 일사량 지표들, 햇빛 지표들, 강수 지표들, 눈, 결빙, 얼음 및 진눈깨비 지표들, 및 봄, 열대 폭풍, 허리케인 및 가시성 지표들을 포함하는 시스템.
  10. 제9 항에 있어서,
    상기 경제 예측 엔진은,
    최대 두 개 만큼의 온도 지표들, 최대 두 개 만큼의 이슬점, 상대 습도, 토양 온도 및 수분 지표들, 최대 하나 만큼의 대기압 지표, 최대 두 개 만큼의 냉방, 난방, 유효, 생장 및 결빙 도일 지표들, 최대 두 개 만큼의 바람 지표들, 최대 하나 만큼의 일사량 지표, 최대 두 개 만큼의 햇빛 지표들, 최대 두 개 만큼의 강수 지표들, 최대 세 개 만큼의 눈, 결빙, 얼음 및 진눈깨비 지표들, 및 최대 세 개 만큼의 열대 폭풍, 허리케인 및 가시성 지표들을 선택하는 시스템.
  11. 지리적-위치 및 시간-인덱스된 히스토리컬 기상 지표들을 기반으로 관심의 경제 성능 지표를 예측하기 위한 방법에 있어서, 높은 다중 곡선성을 갖는 상기 히스토리컬 기상 지표들이 함께 그룹화되도록, 상기 히스토리컬 기상 지표들이 그룹들로 분리되고, 상기 방법은,
    상기 관심의 경제 성능 지표를 갖는 하나 이상의 지리적-위치 및 시간-예측의 히스토리컬 경제 성능 지표들을 수신하는 단계;
    지리적-위치 및 시간-인덱스된 예측된 기상 지표들을 수신하는 단계;
    상기 관심의 경제 성능 지표에 대해 상기 히스토리컬 기상 지표들 각각의 상관성 및 통계적 유의미성을 식별하기 위해, 상관성 분석을 수행하는 단계;
    상기 관심의 경제 성능 지표에 대해 가장 높은 상관성과 미리 결정된 임계값을 충족하거나 초과하는 통계적 유의미성을 갖는 각 그룹으로부터의 최대 미리 결정된 개수 만큼의 히스토리컬 기상 지표들을 선택하는 단계;
    상기 그룹들 모두로부터의 상기 선택된 히스토리컬 기상 지표들을 사용하여 상기 관심의 경제 성능 지표를 예측하기 위한 통계적 모델을 생성하는 단계;
    상기 통계적 모델과 상기 예측된 기상 지표들을 사용하여 상기 관심의 경제 성능 지표를 예측하는 단계; 및
    사용자에게 디스플레이하기 위해 상기 예측된 경제 성능 지표를 출력하는 단계를 포함하는 방법.
  12. 제11 항에 있어서,
    상기 통계적 모델은,
    회귀 분석을 사용하여 생성되는 방법.
  13. 제11 항에 있어서,
    상기 통계적 모델은,
    결정 트리들을 사용하여 생성되는 방법.
  14. 제11 항에 있어서,
    상기 통계적 모델은,
    뉴럴 네트워크를 사용하여 생성되는 방법.
  15. 제11 항에 있어서,
    상기 히스토리컬 기상 지표들은,
    에 대해 가장 높은 절대 피어슨 상관성 계수를 갖는 상기 히스토리컬 기상 지표들이 동일한 그룹 내에 있도록, 그룹들로 분리되는 방법.
  16. 제11 항에 있어서,
    상기 관심의 경제 성능 지표에 대해 상기 가장 높은 절대 피어슨 상관성 계수를 갖는 각 그룹으로부터의 상기 미리 결정된 개수의 히스토리컬 기상 지표들이 선택되는 방법.
  17. 제11 항에 있어서,
    상기 그룹들은, 제1 그룹 및 제2 그룹을 포함하고,
    미리 결정된 제1 개수의 히스토리컬 기상 지표들이 상기 제1 그룹으로부터 선택되고, 최대 미리 결정된 제2 개수 만큼의 히스토리컬 기상 지표들이 상기 제1 그룹으로부터 선택되며,
    상기 미리 결정된 제1 개수는, 상기 미리 결정된 제2 개수와 다른 방법.
  18. 제11 항에 있어서,
    통계적 유의미성에 대한 상기 통계적 유의미성은,
    0.05 이하의 확률값인 방법.
  19. 제11 항에 있어서,
    상기 기상 지표들의 그룹들은,
    온도 지표들, 이슬점(dew point), 상대 습도, 토양 온도 및 수분 지표들, 대기압 지표들, 냉방, 난방, 유효, 생장 및 결빙 도일(degree days) 지표들, 바람 지표들, 일사량 지표들, 햇빛 지표들, 강수 지표들, 눈, 결빙, 얼음 및 진눈깨비 지표들, 및 봄, 열대 폭풍, 허리케인 및 가시성 지표들을 포함하는 방법.
  20. 제19 항에 있어서,
    최대 두 개 만큼의 온도 지표들, 최대 두 개 만큼의 이슬점, 상대 습도, 토양 온도 및 수분 지표들, 최대 하나 만큼의 대기압 지표, 최대 두 개 만큼의 냉방, 난방, 유효, 생장 및 결빙 도일 지표들, 최대 두 개 만큼의 바람 지표들, 최대 하나 만큼의 일사량 지표, 최대 두 개 만큼의 햇빛 지표들, 최대 두 개 만큼의 강수 지표들, 최대 세 개 만큼의 눈, 결빙, 얼음 및 진눈깨비 지표들, 및 최대 세 개 만큼의 열대 폭풍, 허리케인 및 가시성 지표들이 선택되는 방법.
  21. 컴퓨터 프로세서에 의해 실행될 때,
    상기 컴퓨터 프로세서로 하여금, 지리적-위치 및 시간-인덱스된 히스토리컬 기상 지표들을 기반으로 관심의 경제 성능 지표를 예측하게 하는 명령어들을 저장하는 비-일시적 컴퓨터 판독 가능한 기억 매체에 있어서, 높은 다중 곡선성을 갖는 상기 히스토리컬 기상 지표들이 함께 그룹화되도록, 상기 히스토리컬 기상 지표들이 그룹들로 분리되고, 상기 명령어들은 상기 컴퓨터로 하여금,
    상기 관심의 경제 성능 지표를 갖는 하나 이상의 지리적-위치 및 시간-예측의 히스토리컬 경제 성능 지표들을 수신하고,
    지리적-위치 및 시간-인덱스된 예측된 기상 지표들을 수신하고,
    상기 관심의 경제 성능 지표에 대해 상기 히스토리컬 기상 지표들 각각의 상관성 및 통계적 유의미성을 식별하기 위해, 상관성 분석을 수행하고,
    상기 관심의 경제 성능 지표에 대해 가장 높은 상관성과 미리 결정된 임계값을 충족하거나 초과하는 통계적 유의미성을 갖는 각 그룹으로부터의 최대 미리 결정된 개수 만큼의 히스토리컬 기상 지표들을 선택하고,
    상기 그룹들 모두로부터의 상기 선택된 히스토리컬 기상 지표들을 사용하여 상기 관심의 경제 성능 지표를 예측하기 위한 통계적 모델을 생성하고,
    상기 통계적 모델과 상기 예측된 기상 지표들을 사용하여 상기 관심의 경제 성능 지표를 예측하며,
    사용자에게 디스플레이하기 위해 상기 예측된 경제 성능 지표를 출력하는 프로세스를 수행하게 하는 기억 매체.
KR1020197026600A 2017-02-17 2018-02-20 기상 데이터의 통계 분석을 사용하여 경제 동향들을 예측하기 위한 시스템 및 방법 KR20190119082A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762460596P 2017-02-17 2017-02-17
US62/460,596 2017-02-17
PCT/US2018/018811 WO2018152527A1 (en) 2017-02-17 2018-02-20 System and method for forecasting economic trends using statistical analysis of weather data

Publications (1)

Publication Number Publication Date
KR20190119082A true KR20190119082A (ko) 2019-10-21

Family

ID=63167960

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197026600A KR20190119082A (ko) 2017-02-17 2018-02-20 기상 데이터의 통계 분석을 사용하여 경제 동향들을 예측하기 위한 시스템 및 방법

Country Status (7)

Country Link
US (1) US20180240137A1 (ko)
EP (1) EP3583568A4 (ko)
JP (1) JP2020509484A (ko)
KR (1) KR20190119082A (ko)
CN (1) CN110520887A (ko)
CA (1) CA3053794A1 (ko)
WO (1) WO2018152527A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10770898B2 (en) * 2017-02-28 2020-09-08 Screaming Power Inc. Methods and systems for energy use normalization and forecasting
CA3026839C (en) * 2017-12-07 2023-06-13 Northview Weather Llc Storm outage management system
CN112987617A (zh) * 2021-03-15 2021-06-18 国网电力科学研究院武汉能效测评有限公司 近零能耗建筑数字化管理系统及能效监测方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7069232B1 (en) * 1996-01-18 2006-06-27 Planalytics, Inc. System, method and computer program product for short-range weather adapted, business forecasting
US7844517B2 (en) * 1996-01-18 2010-11-30 Planalytics, Inc. System, method, and computer program product for forecasting weather-based demand using proxy data
US7103560B1 (en) * 1996-01-18 2006-09-05 Planalytics, Inc. System and method for weather adapted, business performance forecasting
US6535817B1 (en) * 1999-11-10 2003-03-18 The Florida State Research Foundation Methods, systems and computer program products for generating weather forecasts from a multi-model superensemble
JP2004272674A (ja) * 2003-03-10 2004-09-30 Hitachi Ltd 予測システム及び予測方法
US7542852B1 (en) * 2005-01-25 2009-06-02 Weather Channel Inc Derivation and production of high-resolution, very short-term weather forecasts
EP1954708A4 (en) * 2005-11-23 2009-05-13 Univ Utah Res Found METHODS AND COMPOSITIONS IN INTRINSIC GENES
US20080147417A1 (en) * 2006-12-14 2008-06-19 David Friedberg Systems and Methods for Automated Weather Risk Assessment
JP2008185489A (ja) * 2007-01-30 2008-08-14 Japan Weather Association 融雪出水予測システム
US20100216718A1 (en) * 2007-10-19 2010-08-26 Cell Signaling Technology, Inc. Cancer Classification and Methods of Use
US8406162B2 (en) * 2008-05-16 2013-03-26 La Crosse Technology, Ltd. Method and apparatus of transmitting, receiving, displaying and playing weather data
US20110288917A1 (en) * 2010-05-21 2011-11-24 James Wanek Systems and methods for providing mobile targeted advertisements
US20120101880A1 (en) * 2010-10-05 2012-04-26 WeatherAlpha, LLC. Digital Communication Management System
CA2910644A1 (en) * 2012-05-23 2013-11-28 Liping Fu Road surface condition classification method and system
WO2014075108A2 (en) * 2012-11-09 2014-05-15 The Trustees Of Columbia University In The City Of New York Forecasting system using machine learning and ensemble methods
US10303846B2 (en) * 2014-08-14 2019-05-28 Memed Diagnostics Ltd. Computational analysis of biological data using manifold and a hyperplane
US11346979B2 (en) * 2014-08-27 2022-05-31 Dtn, Llc Automated global weather notification system
US10770899B2 (en) * 2014-09-11 2020-09-08 Gerald Bernard Sheble Resource control by probability tree convolution production cost valuation by iterative equivalent demand duration curve expansion (aka. tree convolution)
EP3237937A4 (en) * 2014-12-22 2018-07-11 User-Centric IP, L.P. Mesoscale modeling
US10366357B2 (en) * 2015-04-10 2019-07-30 Telsco Industries, Inc. Systems and methods for site-specific tracking of snowfall
CN105550700B (zh) * 2015-12-08 2019-04-09 国网山东省电力公司电力科学研究院 一种基于关联分析和主成分分析的时间序列数据清洗方法
CN107025596B (zh) * 2016-02-01 2021-07-16 腾讯科技(深圳)有限公司 一种风险评估方法和系统
US11537847B2 (en) * 2016-06-17 2022-12-27 International Business Machines Corporation Time series forecasting to determine relative causal impact
US10028451B2 (en) * 2016-11-16 2018-07-24 The Climate Corporation Identifying management zones in agricultural fields and generating planting plans for the zones

Also Published As

Publication number Publication date
CA3053794A1 (en) 2018-08-23
EP3583568A1 (en) 2019-12-25
EP3583568A4 (en) 2020-08-05
WO2018152527A1 (en) 2018-08-23
CN110520887A (zh) 2019-11-29
JP2020509484A (ja) 2020-03-26
US20180240137A1 (en) 2018-08-23

Similar Documents

Publication Publication Date Title
US11144835B2 (en) Systems and methods for outage prediction
He et al. Nonparametric tree‐based predictive modeling of storm outages on an electric distribution network
US11315046B1 (en) Machine learning-based disaster modeling and high-impact weather event forecasting
Jones et al. Generating downscaled weather data from a suite of climate models for agricultural modelling applications
Retalis et al. Downscaling CHIRPS precipitation data: an artificial neural network modelling approach
JP7495406B2 (ja) 熱帯低気圧の影響の予想
Sittichok et al. Statistical seasonal rainfall and streamflow forecasting for the Sirba watershed, West Africa, using sea-surface temperatures
García-Cueto et al. Modeling extreme climate events: Two case studies in Mexico
KR20190119082A (ko) 기상 데이터의 통계 분석을 사용하여 경제 동향들을 예측하기 위한 시스템 및 방법
Samal et al. Estimating wind speed probability distribution based on measured data at Burla in Odisha, India
Pryor et al. Differential credibility assessment for statistical downscaling
Seo et al. Did adaptation strategies work? High fatalities from tropical cyclones in the North Indian Ocean and future vulnerability under global warming
Chun et al. Comparison of drought projections using two UK weather generators
US11493666B2 (en) System and method for forecasting snowfall probability distributions
US11397281B2 (en) Determining a realfeel seasonal index
US20210286105A1 (en) Methods and systems for facilitating forecasting of in-situ environmental conditions using nonlinear artificial neural networks-based models
González et al. Seasonal probabilistic precipitation prediction in Comahue region (Argentina) using statistical techniques
Garg et al. Rapid Damage Estimation with Iterative Improvements for Relief Resource Planning Post-Disasters
Kotamarthi et al. Climate Change Impacts at Department of Defense