KR102065780B1 - 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치 및 그 예측 방법 - Google Patents

빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치 및 그 예측 방법 Download PDF

Info

Publication number
KR102065780B1
KR102065780B1 KR1020190031734A KR20190031734A KR102065780B1 KR 102065780 B1 KR102065780 B1 KR 102065780B1 KR 1020190031734 A KR1020190031734 A KR 1020190031734A KR 20190031734 A KR20190031734 A KR 20190031734A KR 102065780 B1 KR102065780 B1 KR 102065780B1
Authority
KR
South Korea
Prior art keywords
data
analysis
event
regression
period
Prior art date
Application number
KR1020190031734A
Other languages
English (en)
Inventor
한일
Original Assignee
(주)제타큐브사이언스
한일
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)제타큐브사이언스, 한일 filed Critical (주)제타큐브사이언스
Priority to KR1020190031734A priority Critical patent/KR102065780B1/ko
Application granted granted Critical
Publication of KR102065780B1 publication Critical patent/KR102065780B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Analysis (AREA)
  • Educational Administration (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치 및 그 예측 방법에 관한 것이다. 본 발명의 하나의 예에 따라, 적어도 하나의 프로세서를 포함하는 전자 장치에 있어서, 프로세서는, 모형화기간 및 검증기간을 포함하는 적어도 제1 기간에 대한 적어도 제1 사건에 관한 제1 결과데이터를 포함하는 읽어들인 사건 시계열 데이터를 기반으로 적어도 모형화기간에 대하여 제1 결과데이터에 대한 제1 보정값 데이터 및 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점에 대한 적어도 하나의 제1 예상 값의 그룹인 적어도 하나의 제1 예상값 데이터 중 어느 하나 이상의 데이터를 산출하여, 제1 결과데이터 및 제1 결과데이터로부터 산출된 제1 산출 데이터를 포함한 제1 사건에 관한 제1 변수후보 데이터가 포함된 시계열 분석데이터를 획득하고, 적어도 모형화기간에 대하여 시계열 분석데이터의 제1 변수후보 데이터의 적어도 하나의 데이터 항목을 제1사건 독립변수 후보로 하는 제1 회귀분석을 수행하여 제1 사건에 관한 2 이상의 제1 회귀분석식들을 예비결정하고, 제1 기간 중 적어도 검증기간을 포함한 기간에 대하여 제1 회귀분석식들을 검증하고, 검증결과를 기초로 제1 기간의 제1 사건에 관한 예측용 제2 회귀분석식을 결정하고, 제1 사건에 관한 결과데이터 값이 없는 검증기간 이후 예측기간에 대하여, 시계열 분석데이터에 포함된 제1 변수후보 데이터의 획득방식과 동일하게 예측기간의 1 분석시점 단위로 제2 회귀분석식의 최종 독립변수에 관한 데이터를 산출하고 산출된 독립변수를 제2 회귀분석식에 대입하여 시점별 예측데이터를 산출하고 1 분석시점 단위의 산출 과정을 누적하며 예측기간 전체에 반복하여 예측기간 전체에 대한 제1 사건의 예측결과 데이터를 산출하고, 제1 및 제2 회귀분석식 각각은 단일 내지 다중 회귀분석식인 것을 특징으로 하는 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치가 제안된다. 또한, 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법이 제안된다.

Description

빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치 및 그 예측 방법{ELECTRONIC APPARATUS PERFORMING PREDICTION OF TIME SERIES DATA USING BIG DATA AND METHOD FOR PREDICTING THEREOF}
본 발명은 시계열 데이터 예측을 수행하는 전자 장치 및 시계열 데이터 예측 방법에 관한 것이다. 구체적으로는, 과거 시계열 데이터의 분석을 통하여 데이터의 이후 변화를 예측하기 위한 것으로서, 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치 및 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법에 관한 것이다.
시계열(time series)은 시간의 경과에 따라 연속적으로 발생하는 사건을 일정한 시간 간격으로 관찰하여 일정한 기준에 따라 계열로 정리한 것을 의미한다. 일반적으로 시계열 데이터에 대한 예측방법은 경제활동 분야(예: 증시 예측, 환율 예측, 선물 가격 예측 등), 공공정책 관련 분야(예: 범죄 발생 예측, 화재 위험 예측, 질병 발생 예측 등) 등 다양한 분야에서 활용되고 있다.
한편, 일반적으로 시계열 데이터가 데이터의 값이 장기간에 걸쳐 지속적으로 증가 또는 감소하거나 혹은 일정한 상태를 유지하는 경향을 나타내는 추세형 시계열 데이터인지 여부, 계절을 주기로 발생하는 변동요인에 따라 데이터의 변동 경향이 달라지는 계절형 시계열 데이터인지 여부, 시계열 데이터의 값을 결정하는 변수가 복수인지 여부 등을 고려하여 사용자는 적절한 시계열 예측 모델을 선택하여 시계열 데이터를 분석하며, 사용자의 선택에 따라 예측 결과의 정확도 역시 달라지게 된다.
대한민국 공개특허공보 제10-2017-0078256호 (2017년 7월 7일 공개) 대한민국 등록특허공보 제10-1645396호 (2016년 8월 3일 공고)
일반적인 시계열 데이터 예측 모델은 통계학에 대한 전문적인 지식이 부족한 일반인이 활용하기 어려운 면이 있으며, 시계열 데이터 예측 모델을 업무상 사용하기 위해 예측 시스템으로 구현하고자 하는 경우, 예측 결과에 영향을 미치는 변수의 변화를 즉각적으로 반영하기 어렵고, 예측 결과의 정확도를 유지하기 어려운 문제점이 있다.
또한, 통계학에 대한 전문적인 지식이 부족한 일반인은, 시계열 데이터가 추세형 시계열 데이터인지, 계절형 시계열 데이터인지, 또는 일정한 규칙성 없이 우연하게 변동이 발생하는 경향을 가지는 불규칙 변동형(이하, 비추세형) 시계열 데이터인지 여부에 따라 적절한 예측 모델을 선택하기 어려우며, 예측 결과의 정확도 역시 낮아지는 문제점이 있다.
전술한 목적을 달성하기 위하여, 본 발명의 하나의 모습에 따라, 적어도 하나의 프로세서를 포함하는 전자 장치에 있어서, 프로세서는, 모형화기간 및 검증기간을 포함하는 적어도 제1 기간에 대한 적어도 제1 사건에 관한 제1 결과데이터를 포함하는 읽어들인 사건 시계열 데이터를 기반으로 적어도 모형화기간에 대하여 제1 결과데이터에 대한 제1 보정값 데이터 및 적어도 하나의 제1 예상값 데이터 중 어느 하나 이상의 데이터를 제1 산출 데이터로 산출하여, 제1 결과데이터 및 제1 산출 데이터를 포함한 제1 사건에 관한 제1 변수후보 데이터가 포함된 시계열 분석데이터를 획득하고, 이때, 적어도 하나의 제1 예상값 데이터는 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점에 대한 적어도 하나의 제1 예상 값의 그룹이고, 적어도 모형화기간에 대하여 시계열 분석데이터의 제1 변수후보 데이터의 적어도 하나의 데이터 항목을 제1사건 독립변수 후보로 하는 제1 회귀분석을 수행하여 제1 사건에 관한 2 이상의 제1 회귀분석식들을 예비결정하고, 제1 기간 중 적어도 검증기간을 포함한 기간에 대하여 제1 회귀분석식들을 검증하고, 검증결과를 기초로 제1 기간의 제1 사건에 관한 예측용 제2 회귀분석식을 결정하고, 제1 사건에 관한 결과데이터 값이 없는 검증기간 이후 예측기간에 대하여, 시계열 분석데이터에 포함된 제1 변수후보 데이터의 획득방식과 동일하게 예측기간의 1 분석시점 단위로 제2 회귀분석식의 최종 독립변수에 관한 데이터를 산출하고 산출된 독립변수를 제2 회귀분석식에 대입하여 시점별 예측데이터를 산출하고 1 분석시점 단위의 산출 과정을 누적하며 예측기간 전체에 반복하여 예측기간 전체에 대한 제1 사건의 예측결과 데이터를 산출하고, 제1 및 제2 회귀분석식 각각은 단일 내지 다중 회귀분석식인 것을 특징으로 하는 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치가 제안된다.
하나의 예에서, 전술한 프로세서는, 적어도 검증기간을 포함한 기간에 대하여 제1 회귀분석식들을 검증하여 회귀분석모형을 정하고 검증결과 정해진 회귀분석모형을 토대로 제1 기간에 대하여 제2 회귀분석을 수행하여 제2 회귀분석식을 결정할 수 있다.
이때, 하나의 예에서, 전술한 프로세서는, 적어도 검증기간을 포함한 기간에 대하여, 1 분석시점 단위로 모형화기간에 대한 제1 변수후보 데이터의 획득방식과 동일하게 산출된 제1 회귀분석식들의 독립변수에 관한 제1 변수후보 데이터의 데이터 항목을 제1 회귀분석식들에 대입하여 시점별 검증 예측데이터를 산출하고 1 분석시점 단위의 산출 과정을 누적하며 검증기간 전체에 반복하여 제1 사건에 관한 제1 검증 예측데이터들을 산출하고, 적어도 제1 검증 예측데이터들과 검증기간에 대한 제1 회귀분석식들의 종속변수 관련 변수후보 데이터인 제1사건 비교데이터들을 비교하여 회귀분석모형을 정할 수 있다.
예컨대, 하나의 예에서, 전술한 프로세서는, 결정된 회귀분석모형에 따른 회귀식의 독립변수에 기초하여 제1 기간에 대한 회귀분석을 수행하며 결정되는 회귀계수에 따른 제2 회귀분석식을 결정하거나, 회귀분석모형에 따른 회귀식의 독립변수에 기초하여 수행한 제1 기간에 대한 회귀분석에 따라 독립변수 일부 제거 및 새로운 독립변수 추가 중 어느 하나 이상을 수행하며 제1 기간에 대한 새로운 독립변수와 회귀계수를 정하여 제2 회귀분석식을 결정할 수 있다.
또한, 하나의 예에 따르면, 제1 변수후보 데이터들에 포함되는 제1 산출 데이터는 제1 보정값 데이터 및 적어도 하나의 제1 예상값 데이터를 포함하고, 제1 및 제2 회귀분석식의 종속변수 항목은 제1 사건에 관한 제1 변수후보 데이터들에 포함된 제1 결과데이터 내지 제1 보정값 데이터에 관한 것일 수 있다. 이때, 전술한 프로세서는 제2 회귀분석식의 종속변수 항목이 제1 보정값 데이터에 관한 것인 경우 시점별 예측데이터의 역보정을 통해 제1 사건에 관한 제1 결과데이터의 예측에 상응하는 예측결과 데이터를 산출할 수 있다.
또 하나의 예에서, 전술한 프로세서는, 각 분석시점 대비 -1 분석시점과 각 분석시점 사이의 시점간 변화도, 각 분석시점의 소속집단에서의 데이터의 백분율값, 백분위 또는 편차, 각 분석시점의 추정기준으로부터의 이격도 중 어느 하나를 기초로 하여 각 분석시점에 대한 제1 예상 값을 각각 산출하거나, 또는 각 분석시점과 주기적 동일시점 또는 각 분석시점의 소속구간에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화도 내지 이격도에 따라 산출되는 각 분석시점의 등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화도 내지 이격도에 따라 산출되는 -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 등급 시점에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값을 포함하는 데이터 그룹 중 어느 하나 자체를 하나의 제1 예상 값으로 산출하거나 데이터 그룹 중 어느 하나를 기초로 각 분석시점에 대한 제1 예상 값을 각각 산출할 수 있다. 제1 및 제2 회귀분석식의 각 독립변수의 항은 선형항 내지 비선형항일 수 있다.
이때, 또 하나의 예에서, 시점간 변화도 및 이격도를 산출하기 위한 각 분석시점 및 추정기준의 값 각각은 제1 결과데이터 내지 제1 보정값 데이터의 값이고, 데이터의 백분율값, 백분위 또는 편차는 제1 결과데이터, 제1 보정값 데이터, 이격도 또는 그들 중 어느 하나의 증감율에 관련된 값이고, 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값은 자체가 제1 예상 값인 경우 제1 결과데이터 내지 제1 보정값 데이터의 값이고 자체가 제1 예상 값 산출의 기초인 경우에는 제1 결과데이터, 제1 보정값 데이터, 이격도 중 어느 하나의 증감율, 백분율 내지 백분위에 관한 값일 수 있다. 이때, 전술한 프로세서는, 모형화기간에 대한 시계열 분석데이터로부터 시계열 순번을 독립변수로 삼아 단순추세 선형회귀식을 산출하고 단순추세 선형회귀식에 시계열 순번을 대입하여 추세 데이터를 산출하고 추세 데이터를 추정기준으로 삼아 각 분석시점의 추정기준으로부터의 이격도를 산출할 수 있다. 또한, 프로세서는, 제1 회귀분석을 수행하여 추세형, 비추세형, 추세형과 비추세형의 혼합형 중 적어도 2 이상의 분석모형에 따른 제1 회귀분석식들을 예비결정하고 2 이상의 분석모형에 따른 회귀분석식 모형 중 하나를 회귀분석모형으로 결정할 수 있다. 이때, 추세형의 회귀분석식은 시점간 변화도, 데이터의 백분율값, 백분위 또는 편차, 이격도 중 어느 하나를 기초로 산출된 제1 예상값 데이터 각각과, 주기적 동일시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 이격도에 따라 산출되는 각 분석시점의 이격도등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 이격도등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 이격도등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 이격도등급에서의 데이터 평균, 중위수, 최빈, 극빈, 최대 또는 최소 값을 포함하는 제1 그룹 중 어느 하나 자체에 관한 제1 예상값 데이터 각각과, 제1 그룹 중 어느 하나를 기초로 산출된 제1 예상값 데이터 각각을 포함하는 그룹에서 어느 하나 이상을 독립변수 항목으로 할 수 있다. 또한, 비추세형의 회귀분석식은 시점간 변화도 내지 데이터의 백분율값, 백분위 또는 편차를 기초로 산출된 제1 예상값 데이터 각각과, 주기적 동일시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화에 따라 산출되는 각 분석시점의 변동등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 변동등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 변동등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 변동등급 시점에서의 데이터 평균, 중위수, 최빈, 극빈, 최대 또는 최소 값을 포함하는 제2 그룹 중 어느 하나 자체에 관한 제1 예상값 데이터 각각과, 제2 그룹 중 어느 하나를 기초로 산출된 제1 예상값 데이터 각각을 포함하는 그룹에서 어느 하나 이상을 독립변수 항목으로 할 수 있다. 혼합형의 회귀분석식은 추세형의 회귀 분석석의 독립변수 항목 중 어느 하나 이상과 비추세형의 회귀분석식의 독립변수 항목 중 어느 하나 이상을 독립변수 항목으로 할 수 있다.
또 하나의 예에서, 전술한 프로세서는, 독립변수와 종속변수 사이의 상관관계를 나타내는 상관계수, 상관계수의 제곱값인 결정계수, 수정된 결정계수, 더빈-왓슨비, 베타 표준화계수, 유의확률, 공선성 통계량 중 적어도 하나 이상을 고려하여 회귀분석을 수행할 수 있다. 이때, 시점간 변화도는 차이값 내지 증감율값이고, 제1 보정값 데이터는 제1 결과데이터의 값을 진폭 조정법에 따라 보정한 데이터이고, 비선형항은 제곱항, 제곱근항, 로그항, 지수항 중의 적어도 하나일 수 있다.
게다가, 또 하나의 예에서, 전술한 프로세서는, 2 이상의 사건에 관한 결과데이터를 포함하는 읽어들인 사건 시계열 데이터에 포함된 결과데이터 중 제1 사건에 관한 제1 결과데이터의 항목과 제1 결과데이터에 영향을 미치는 것으로 추정 판단되는 적어도 하나 이상의 제2 사건후보에 관한 데이터 항목을 결정하고, 적어도 모형화기간을 포함한 기간에 대하여, 사건 시계열 데이터에 포함되는 제2 사건후보에 관한 적어도 하나 이상의 후보 결과데이터 내지 후보 결과데이터를 보정한 보정값 후보데이터와 제1 사건에 관한 제1 결과데이터 내지 제1 보정값 데이터를 두 변수로 삼아 상관분석을 수행하고, 상관분석 결과에 따라 적어도 하나 이상의 제2 사건후보 중 적어도 하나를 상관변수 사건으로 결정하거나 상관변수 부존재로 결정하고, 적어도 하나의 상관변수 사건이 결정된 경우, 하나의 상관변수 사건인 제2 사건에 관한 제2 결과데이터로부터 산출된 하나 이상의 제2 산출 데이터 중 적어도 하나를 제2사건 독립변수 후보로 하는 제3 회귀분석을 수행하여 제2 사건에 관한 예측을 위한 제3 회귀분석식을 결정하는 방식으로 각 상관변수 사건 별로 각 사건에 관한 예측을 위한 회귀분석식을 결정하고, 적어도 하나의 상관변수 사건이 결정된 경우, 제2 사건에 관한 결과데이터 값이 없는 예측기간에 대하여, 제2 산출 데이터에서의 제3 회귀분석식의 독립변수와 동일한 데이터 항목 산출방식과 동일하게 1 분석시점 단위로 각 분석시점에 대해 제3 회귀분석식의 최종 독립변수에 관한 값 데이터를 산출하고 산출결과를 제3 회귀분석식에 대입하여 시점별 상관변수 예측데이터를 산출하고 1 분석시점 단위의 산출 과정을 누적하며 예측기간 전체에 대해 반복하여 예측기간 전체에 대한 제2 사건에 관한 예측상관변수 데이터를 산출하는 방식으로 각 상관변수 사건 별로 예측상관변수 데이터를 산출할 수 있다. 이때, 적어도 하나의 상관변수 사건이 결정되는 경우, 시계열 분석데이터에 포함되는 제1 사건에 관한 제1 변수후보 데이터들은 제2 사건 각각에 관한 제2 결과데이터 및 제2 산출 데이터를 포함하고, 제2 산출 데이터 각각은 제2 결과데이터에 대한 제2 보정값 데이터 및 적어도 하나의 제2 예상값 데이터 중 어느 하나 이상의 데이터를 포함하고, 제2 사건에 관한 제2 예상값 데이터 각각은 적어도 제1 기간에 대한 제2 사건에 관한 사건 시계열 데이터를 기반으로 적어도 모형화기간에 대하여 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점에 대한 적어도 하나의 제2 예상 값의 그룹일 수 있다. 게다가, 전술한 프로세서는, 상관변수 사건이 결정되고 결정된 제2 회귀분석식의 최종 독립변수에 제2 사건 관련된 적어도 하나 이상의 데이터 항목이 포함되는 경우, 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수가 예측상관변수 데이터의 산출과정에서 이미 산출된 경우 해당 값을 읽어들이고 산출되지 않은 경우 예측상관변수 데이터의 산출과정에서 산출된 값으로부터 제2 산출 데이터에서의 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수와 동일한 데이터 항목 산출과 동일하게 산출할 수 있다. 제3 회귀분석식은 단일 내지 다중 회귀분석식일 수 있다.
이때, 또 하나의 예에 따르면, 전술한 프로세서는, 적어도 하나의 상관변수 사건이 결정된 경우, 적어도 모형화기간에 대하여 제2 사건의 제2 산출 데이터의 적어도 하나의 데이터 항목을 제2사건 독립변수 후보로 하는 제3 예비 회귀분석을 수행하여 적어도 모형화기간에 대한 2 이상의 제3 예비 회귀분석식들을 예비결정하는 방식으로 각 상관변수 사건 별로 회귀분석식을 예비결정하고, 적어도 검증기간에 대하여 1 분석시점 단위로 모형화기간에 대한 제2 산출 데이터의 획득방식과 동일하게 산출된 제3 예비 회귀분석식들의 독립변수에 관한 제2 산출 데이터의 데이터를 제3 예비 회귀분석식들에 대입하여 제2 사건에 관한 시점별 제2사건 검증데이터를 산출하고 1 분석시점 단위의 산출 과정을 누적하며 검증기간 전체에 대해 반복하여 제2 사건에 관한 검증기간 전체의 제2사건 검증데이터들을 산출하고, 적어도 검증기간에 대한 제2사건 검증데이터들과 검증기간에 대한제2 사건의 제2사건 비교데이터들을 비교하고, 비교 결과 적합도에 따라 제2사건 회귀분석모형을 정하는 방식으로 각 상관변수 사건 별로 회귀분석모형을 정하고, 결정된 제2 사건 회귀분석모형을 토대로 제1 기간에 대한 제2 사건에 관한 시계열 분석데이터로부터 제3 회귀분석을 수행하여 제2 사건에 관한 예측을 위한 제3 회귀분석식을 결정하는 방식으로 각 상관변수 사건 별로 회귀분석식을 결정할 수 있다.
다음으로, 전술한 목적을 달성하기 위하여, 본 발명의 또 하나의 모습에 따라, 적어도 하나의 프로세서를 포함하는 전자 장치의 프로세서에서 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법에 있어서, 모형화기간 및 검증기간을 포함하는 적어도 제1 기간에 대한 적어도 제1 사건에 관한 제1 결과데이터를 포함하는 읽어들인 사건 시계열 데이터를 기반으로 적어도 모형화기간에 대하여 제1 결과데이터에 대한 제1 보정값 데이터 및 적어도 하나의 제1 예상값 데이터 중 어느 하나 이상의 데이터를 제1 산출 데이터로 산출하여, 제1 결과데이터 및 제1 산출 데이터를 포함한 제1 사건에 관한 제1 변수후보 데이터가 포함된 시계열 분석데이터를 획득하는 데이터 산출단계, 이때, 적어도 하나의 제1 예상값 데이터는 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점에 대한 적어도 하나의 제1 예상 값의 그룹임; 적어도 모형화기간에 대하여 시계열 분석데이터의 제1 변수후보 데이터의 적어도 하나의 데이터 항목을 제1사건 독립변수 후보로 하는 제1 회귀분석을 수행하여 2 이상의 제1 회귀분석식들을 예비결정하고, 제1 기간 중 적어도 검증기간을 포함한 기간에 대하여 제1 회귀분석식들을 검증하고, 검증결과를 기초로 제1 기간의 제1 사건에 관한 예측용 제2 회귀분석식을 결정하는 회귀식 결정단계; 및 제1 사건에 관한 결과데이터 값이 없는 검증기간 이후 예측기간에 대하여, 데이터 산출단계에서의 제1 변수후보 데이터의 획득방식과 동일하게 예측기간의 1 분석시점 단위로 제2 회귀분석식의 최종 독립변수에 관한 데이터를 산출하고 산출된 독립변수를 제2 회귀분석식에 대입하여 시점별 예측데이터를 산출하고 1 분석시점 단위의 산출 과정을 누적하며 예측기간 전체에 반복하여 예측기간에 대한 제1 사건의 예측결과 데이터를 산출하는 데이터 예측단계를 포함하고, 제1 및 제2 회귀분석식 각각은 단일 내지 다중 회귀분석식인 것을 특징으로 하는 전자 장치에서 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법이 제안된다.
하나의 예에서, 전술한 회귀식 결정단계에서는, 적어도 검증기간을 포함한 기간에 대하여 제1 회귀분석식들을 검증하여 회귀분석모형을 정하고 검증결과 정해진 회귀분석모형을 토대로 제1 기간에 대하여 제2 회귀분석을 수행하여 제2 회귀분석식을 결정할 수 있다.
이때, 하나의 예에서, 전술한 회귀식 결정단계는: 적어도 모형화기간에 대하여, 시계열 분석데이터의 제1 변수후보 데이터의 적어도 하나의 데이터 항목을 제1사건 독립변수 후보로 하는 제1 회귀분석을 수행하여 제1 사건에 관한 적어도 2 이상의 분석모형에 따른 제1 회귀분석식들을 예비결정하는 예비결정단계; 적어도 검증기간을 포함한 기간에 대하여, 1 분석시점 단위로 모형화기간에 대한 제1 변수후보 데이터의 획득방식과 동일하게 산출된 제1 회귀분석식들의 독립변수에 관한 제1 변수후보 데이터의 데이터 항목을 제1 회귀분석식들에 대입하여 시점별 검증 예측데이터를 산출하고 1 분석시점 단위의 산출 과정을 누적하며 검증기간 전체에 반복하여 제1 사건에 관한 제1 검증 예측데이터들을 산출하고, 적어도 제1 검증 예측데이터들과 검증기간에 대한 제1 회귀분석식들의 종속변수 관련 변수후보 데이터인 제1사건 비교데이터들을 비교하여 회귀분석모형을 정하는 모형 결정단계; 및 회귀분석모형을 토대로 제1 기간에 대한 시계열 분석데이터로부터 제2 회귀분석을 수행하여 제1 사건에 관한 제2 회귀분석식을 결정하는 회귀분석식 결정단계를 포함할 수 있다.
또한, 하나의 예에서, 전술한 회귀분석식 결정단계에서는, 결정된 회귀분석모형에 따른 회귀식의 독립변수에 기초하여 제1 기간에 대한 회귀분석을 수행하며 결정되는 회귀계수에 따른 제2 회귀분석식을 결정하거나, 회귀분석모형에 따른 회귀식의 독립변수에 기초하여 수행한 제1 기간에 대한 회귀분석에 따라 독립변수 일부 제거 및 새로운 독립변수 추가 중 어느 하나 이상을 수행하며 제1 기간에 대한 새로운 독립변수와 회귀계수를 정하여 제2 회귀분석식을 결정할 수 있다.
또 하나의 예에서, 제1 변수후보 데이터들에 포함되는 제1 산출 데이터는 제1 보정값 데이터 및 적어도 하나의 제1 예상값 데이터를 포함하고, 제1 및 제2 회귀분석식의 종속변수 항목은 제1 사건에 관한 제1 변수후보 데이터들에 포함된 제1 결과데이터 내지 제1 보정값 데이터에 관한 것이고, 제2 회귀분석식의 종속변수 항목이 제1 보정값 데이터에 관한 것인 경우, 예측결과 데이터는 시점별 예측데이터로부터 역보정을 통해 산출되며 제1 사건에 관한 제1 결과데이터의 예측에 상응할 수 있다.
또한 하나의 예에서, 데이터 산출단계에서의 각 분석시점에 대한 제1 예상 값 각각은 각 분석시점 대비 -1 분석시점과 각 분석시점 사이의 시점간 변화도, 각 분석시점의 소속집단에서의 데이터의 백분율값, 백분위 또는 편차, 각 분석시점의 추정기준으로부터의 이격도 중 어느 하나를 기초로 하여 산출되거나, 또는 각 분석시점과 주기적 동일시점 또는 각 분석시점의 소속구간에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화도 내지 이격도에 따라 산출되는 각 분석시점의 등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화도 내지 이격도에 따라 산출되는 -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 등급 시점에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값을 포함하는 데이터 그룹 중 어느 하나 자체이거나 데이터 그룹 중 어느 하나를 기초로 하여 산출될 수 있다. 제1 및 제2 회귀분석식의 각 독립변수의 항은 선형항 내지 비선형항일 수 있다.
이때, 하나의 예에서, 시점간 변화도 및 이격도를 산출하기 위한 각 분석시점 및 추정기준의 값 각각은 제1 결과데이터 내지 제1 보정값 데이터의 값이고, 데이터의 백분율값, 백분위 또는 편차는 제1 결과데이터, 제1 보정값 데이터, 이격도 또는 그들 중 어느 하나의 증감율에 관련된 값이고, 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값은 자체가 제1 예상 값인 경우 제1 결과데이터 내지 제1 보정값 데이터의 값이고 자체가 제1 예상 값 산출의 기초인 경우에는 제1 결과데이터, 제1 보정값 데이터, 이격도 중 어느 하나의 증감율, 백분율 내지 백분위에 관한 값일 수 있다. 전술한 회귀식 결정단계에서 모형화기간에 대한 시계열 분석데이터로부터 시계열 순번을 독립변수로 삼아 단순추세 선형회귀식을 산출하고 단순추세 선형회귀식에 시계열 순번을 대입하여 산출되는 추세 데이터를 데이터 산출단계로 피드백하고 피드백된 추세 데이터를 추정기준으로 삼아 각 분석시점의 추정기준으로부터의 이격도가 산출되고, 게다가, 제1 회귀분석을 통해 추세형, 비추세형, 추세형과 비추세형의 혼합형 중 적어도 2 이상의 분석모형에 따른 제1 회귀분석식들을 예비결정하고 그 중 하나를 회귀분석모형으로 결정할 수 있다. 예컨대, 추세형의 회귀분석식은 시점간 변화도, 데이터의 백분율값, 백분위 또는 편차, 이격도 중 어느 하나를 기초로 산출된 제1 예상값 데이터 각각과, 주기적 동일시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 이격도에 따라 산출되는 각 분석시점의 이격도등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 이격도등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 이격도등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 이격도등급에서의 데이터 평균, 중위수, 최빈, 극빈, 최대 또는 최소 값을 포함하는 제1 그룹 중 어느 하나 자체에 관한 제1 예상값 데이터 각각과, 제1 그룹 중 어느 하나를 기초로 산출된 제1 예상값 데이터 각각을 포함하는 그룹에서 어느 하나 이상을 독립변수 항목으로 하고, 비추세형의 회귀분석식은 시점간 변화도 내지 데이터의 백분율값, 백분위 또는 편차를 기초로 산출된 제1 예상값 데이터 각각과, 주기적 동일시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화에 따라 산출되는 각 분석시점의 변동등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 변동등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 변동등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 변동등급 시점에서의 데이터 평균, 중위수, 최빈, 극빈, 최대 또는 최소 값을 포함하는 제2 그룹 중 어느 하나 자체에 관한 제1 예상값 데이터 각각과, 제2 그룹 중 어느 하나를 기초로 산출된 제1 예상값 데이터 각각을 포함하는 그룹에서 어느 하나 이상을 독립변수 항목으로 하고, 혼합형의 회귀분석식은 추세형의 회귀 분석석의 독립변수 항목 중 어느 하나 이상과 비추세형의 회귀분석식의 독립변수 항목 중 어느 하나 이상을 독립변수 항목으로 할 수 있다.
이때, 또 하나의 예에서, 전술한 회귀식 결정단계에서 독립변수와 종속변수 사이의 상관관계를 나타내는 상관계수, 상관계수의 제곱값인 결정계수, 수정된 결정계수, 더빈-왓슨비, 베타 표준화계수, 유의확률, 공선성 통계량 중 적어도 하나 이상을 고려하여 회귀분석을 수행할 수 있다. 시점간 변화도는 차이값 내지 증감율값이고, 제1 보정값 데이터는 제1 결과데이터의 값을 진폭 조정법에 따라 보정한 데이터이고, 비선형항은 제곱항, 제곱근항, 로그항, 지수항 중의 적어도 하나일 수 있다.
또한, 하나의 예에 따르면, 전술한 인공지능 시계열 데이터 예측 방법은: 데이터 산출단계 이전에, 2 이상의 사건에 관한 결과데이터를 포함하는 읽어들인 사건 시계열 데이터에 포함된 결과데이터 중 제1 사건에 관한 제1 결과데이터의 항목과 제1 결과데이터에 영향을 미치는 것으로 추정 판단되는 적어도 하나 이상의 제2 사건후보에 관한 데이터 항목을 결정하는 사건항목 사전결정단계; 적어도 모형화기간을 포함한 기간에 대하여, 사건 시계열 데이터에 포함되는 제2 사건후보에 관한 적어도 하나 이상의 후보 결과데이터 내지 후보 결과데이터를 보정한 보정값 후보 데이터와 제1 사건에 관한 제1 결과데이터 내지 제1 보정값 데이터를 두 변수로 삼아 상관분석을 수행하고, 상관분석 결과에 따라 적어도 하나 이상의 제2 사건후보 중 적어도 하나를 상관변수 사건으로 결정하거나 상관변수 부존재로 결정하는 상관변수 결정단계; 적어도 하나의 상관변수 사건이 결정된 경우, 하나의 상관변수 사건인 제2 사건에 관한 제2 결과데이터로부터 산출된 하나 이상의 제2 산출 데이터 중 적어도 하나를 제2사건 독립변수 후보로 하는 제3 회귀분석을 수행하여 제2 사건에 관한 예측을 위한 제3 회귀분석식을 결정하는 방식으로 각 상관변수 사건 별로 각 사건에 관한 예측을 위한 회귀분석식을 결정하는 제2사건 분석식 결정단계; 및 적어도 하나의 상관변수 사건이 결정된 경우 제2 사건에 관한 결과데이터 값이 없는 예측기간에 대하여, 제2 산출 데이터에서의 상기 제3 회귀분석식의 독립변수와 동일한 데이터 항목 산출방식과 동일하게 1 분석시점 단위로 각 분석시점에 대해 제3 회귀분석식의 최종 독립변수에 관한 값 데이터를 산출하고 산출결과를 제3 회귀분석식에 대입하여 시점별 상관변수 예측데이터를 산출하고 1 분석시점 단위의 산출 과정을 누적하며 예측기간 전체에 대해 반복하여 예측기간 전체에 대한 제2 사건에 관한 예측상관변수 데이터를 산출하는 방식으로 각 상관변수 사건 별로 예측상관변수 데이터를 산출하는 예측상관변수 산출단계를 더 포함할 수 있다. 이때, 적어도 하나의 상관변수 사건이 결정된 경우, 시계열 분석데이터에 포함되는 제1 사건에 관한 제1 변수후보 데이터들은 제2 사건 각각에 관한 제2 결과데이터 및 제2 산출 데이터를 포함하고, 제2 산출 데이터 각각은 제2 결과데이터에 대한 제2 보정값 데이터 및 적어도 하나의 제2 예상값 데이터 중 어느 하나 이상의 데이터를 포함하고, 제2 사건에 관한 제2 예상값 데이터 각각은 적어도 제1 기간에 대한 제2 사건에 관한 제2 결과데이터 내지 제2 보정값 데이터를 기반으로 적어도 모형화기간에 대하여 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점에 대한 적어도 하나의 제2 예상 값의 그룹일 수 있다. 상관변수 사건이 결정되고 전술한 회귀식 결정단계에서 결정된 제2 회귀분석식의 최종 독립변수에 적어도 하나의 제2 사건과 관련된 적어도 하나 이상의 데이터 항목이 포함되는 경우에, 전술한 데이터 예측단계에서, 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수가 예측상관변수 산출단계에서 이미 산출된 경우 해당 값을 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수로 읽어들이고 산출되지 않은 경우 예측상관변수 산출단계에서 산출된 값으로부터 제2 산출 데이터에서의 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수와 동일한 데이터 항목 산출과 동일하게 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수로 산출할 수 있다. 제3 회귀분석식은 단일 내지 다중 회귀분석식일 수 있다.
이때, 또 하나의 예에서, 전술한 제2사건 분석식 결정단계는: 적어도 하나의 상관변수 사건이 결정된 경우, 적어도 모형화기간에 대하여 제2 사건의 제2 산출 데이터의 적어도 하나의 데이터 항목을 제2사건 독립변수 후보로 하는 제3 예비 회귀분석을 수행하여 적어도 모형화기간에 대한 2 이상의 제3 예비 회귀분석식들을 예비결정하는 방식으로 각 상관변수 사건 별로 회귀분석식을 예비결정하는 제2사건 분석식 예비결정단계; 적어도 검증기간에 대하여 1 분석시점 단위로 모형화기간에 대한 제2 산출 데이터의 획득방식과 동일하게 산출된 제3 예비 회귀분석식들의 독립변수에 관한 제2 산출 데이터의 데이터를 제3 예비 회귀분석식들에 대입하여 제2 사건에 관한 시점별 제2사건 검증데이터를 산출하고 1 분석시점 단위의 산출 과정을 누적하며 검증기간 전체에 대해 반복하여 제2 사건에 관한 검증기간 전체의 제2사건 검증데이터들을 산출하고, 적어도 검증기간에 대한 제2사건 검증데이터들과 제2 사건의 제2사건 비교데이터들을 비교하고, 비교 결과 적합도에 따라 제2사건 회귀분석모형을 정하는 방식으로 각 상관변수 사건 별로 회귀분석모형을 정하는 제2사건 모형결정단계; 및 결정된 제2 사건 회귀분석모형을 토대로 제1 기간에 대한 제2 사건에 관한 시계열 분석데이터로부터 제3 회귀분석을 수행하여 제2 사건에 관한 예측을 위한 제3 회귀분석식을 결정하는 방식으로 각 상관변수 사건 별로 회귀분석식을 결정하는 제3 분석식 결정단계를 포함할 수 있다.
본 발명의 하나의 예에 따르면, 시계열 데이터의 변동 유형에 상관없이 하나의 예측 모델을 사용할 수 있다.
본 발명의 하나의 예에 따르면, 통계학에 대한 전문적인 지식이 부족한 일반인도 쉽게 활용할 수 있는 다중 회귀분석식을 사용하여 시계열 데이터를 예측할 수 있다.
본 발명의 하나의 예에 따르면, 다중 회귀분석식을 사용하는 예측 모델을 활용함으로써, 시계열 데이터을 분석하는 예측 시스템의 구현이 복잡하지 않고, 시스템 구현에 따르는 비용을 최소화할 수 있으며, 예측 결과의 높은 정확도를 유지할 수 있다.
도 1은 본 발명의 하나의 실시 예에 따른 전자 장치를 개략적으로 도시한 블록도이다.
도 2a 및 2b 각각은 본 발명의 또 하나의 실시 예에 따른 전자 장치를 개략적으로 도시한 블록도이다.
도 3a, 3b 및 3c 각각은 본 발명의 다른 하나의 실시 예에 따른 전자 장치에서 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법에 관한 순서도이다.
도 4는 본 발명의 하나의 실시 예에 따른 시계열 데이터를 모형화기간 및 검증기간으로 구분하는 예시를 나타낸 도면이다.
도 5는 본 발명의 하나의 실시 예에서의 입력된 시계열 데이터의 모형화기간에 대한 데이터 및 보정 후 데이터의 예시를 나타낸 도면이다.
도 6a는 본 발명의 하나의 실시 예에서의 모형화기간의 각 시점에 대한 변동 등급을 결정하는 예시를 나타낸 도면이고, 도 6b는 본 발명의 하나의 실시 예에서의 모형화기간의 각 시점에 대한 데이터의 예시를 나타낸 도면이고, 도 6c는 본 발명의 하나의 실시 예에서의 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 종합변동등급과, 현 시점의 보정 후 데이터 종합변동등급 간의 관계를 나타내는 예시를 나타낸 도면이고, 도 6d는 본 발명의 하나의 실시 예에서의 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 종합변동등급과, 현 시점의 보정 후 데이터 종합변동등급 간의 관계를 구체적으로 나타내는 예시를 나타낸 도면이고, 도 6e는 본 발명의 하나의 실시 예에서의 모형화기간의 동일한 종합 변동 등급을 포함하는 현 시점의 보정 후 데이터 값들의 중위수에 대한 데이터의 예시를 나타낸 도면이고, 도 6f는 본 발명의 하나의 실시 예에서의 모형화기간의 각 시점에 대한 -1시점의 종합 변동 등급의 변화에 따른 현 시점의 보정 후 데이터 값의 증감률과 관련된 데이터의 예시를 나타낸 도면이다.
도 7a는 본 발명의 하나의 실시 예에서의 모형화기간의 보정 후 데이터의 연단위 월별 변화와 관련된 데이터의 예시를 나타낸 도면이고, 도 7b는 본 발명의 하나의 실시 예에서의 모형화기간의 보정 후 데이터의 연단위 분기별 변화와 관련된 데이터의 예시를 나타낸 도면이고, 도 7c는 본 발명의 하나의 실시 예에서의 모형화기간의 보정 후 데이터의 연단위 반기별 변화와 관련된 데이터의 예시를 나타낸 도면이다.
도 8a는 본 발명의 하나의 실시 예에서의 모형화기간의 각 시점에 대한 -1시점의 종합 변동 등급의 변화에 따른 현 시점의 보정 후 데이터 예측 값의 예시를 나타낸 도면이고, 도 8b는 본 발명의 하나의 실시 예에서의 모형화기간의 각 시점의 연단위 월별 변화에 따른 현 시점의 보정 후 데이터 예측 값의 예시를 나타낸 도면이고, 도 8c는 본 발명의 하나의 실시 예에서의 모형화기간의 각 시점의 연단위 분기별 변화에 따른 현 시점의 보정 후 데이터 예측 값의 예시를 나타낸 도면이고, 도 8d는 본 발명의 하나의 실시 예에서의 모형화기간의 각 시점의 연단위 반기별 변화에 따른 현 시점의 보정 후 데이터 예측 값의 예시를 나타낸 도면이다.
도 9a는 본 발명의 하나의 실시 예에서의 모형화기간의 보정된 데이터의 예시를 나타낸 도면이고, 도 9b는 본 발명의 하나의 실시 예에서의 모형화기간의 보정된 데이터에 기초하여 산출한 추세선과 관련된 데이터 및 그래프의 예시를 나타낸 도면이고, 도 9c는 본 발명의 하나의 실시 예에서의 추세선을 이용하여 산출한 모형화기간에 대한 추세형 데이터의 예시를 나타낸 도면이다.
도 10a는 본 발명의 하나의 실시 예에서의 모형화기간에 대한 추세형 데이터의 각 시점의 변동 등급과 관련된 데이터의 예시를 나타낸 도면이고, 도 10b는 본 발명의 하나의 실시 예에서의 모형화기간에 대한 추세형 데이터의 예시를 나타낸 도면이고, 도 10c는 본 발명의 하나의 실시 예에서의 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 종합변동등급과, 모형화기간의 각 시점에 대한 현 시점의 보정 후 데이터 종합변동등급 간의 관계를 나타내는 예시를 나타낸 도면이고, 도 10d는 본 발명의 하나의 실시 예에서의 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 종합변동등급과, 현 시점의 보정 후 데이터 종합변동등급 간의 관계를 구체적으로 나타내는 예시를 나타낸 도면이고, 도 10e는 본 발명의 하나의 실시 예에서의 동일한 종합 변동 등급을 포함하는 현 시점의 추세 이격도 값들의 중위수와 관련된 데이터의 예시를 나타낸 도면이고, 도 10f는 본 발명의 하나의 실시 예에서의 모형화기간에 대한 추세형 데이터의 변동 등급의 변화에 따른 추세 이격도와 관련된 데이터의 예시를 나타낸 도면이다.
도 11a는 본 발명의 하나의 실시 예에서의 모형화기간에 대한 추세형 데이터의 월별 추세 이격도와 관련된 데이터의 예시를 나타낸 도면이고, 도 11b는 본 발명의 하나의 실시 예에서의 모형화기간에 대한 추세형 데이터의 분기별 추세 이격도와 관련된 데이터의 예시를 나타낸 도면이고, 도 11c는 본 발명의 하나의 실시 예에서의 모형화기간에 대한 추세형 데이터의 반기별 추세 이격도와 관련된 데이터의 예시를 나타낸 도면이다.
도 12a는 본 발명의 하나의 실시 예에서의 모형화기간의 각 시점에 대한 현 시점의 추세 이격도에 기초하여 산출한 현 시점의 보정 후 데이터 예측 값의 예시를 나타낸 도면이고, 도 12b는 본 발명의 하나의 실시 예에서의 모형화기간에 대한 추세형 데이터의 월별 추세 이격도에 기초하여 산출한 현 시점의 보정 후 데이터 예측 값의 예시를 나타낸 도면이고,
도 12c는 본 발명의 하나의 실시 예에서의 모형화기간에 대한 추세형 데이터의 분기별 추세 이격도에 기초하여 산출한 현 시점의 보정 후 데이터 예측 값의 예시를 나타낸 도면이고,
도 12d는 본 발명의 하나의 실시 예에서의 모형화기간에 대한 추세형 데이터의 반기별 추세 이격도에 기초하여 산출한 현 시점의 보정 후 데이터 예측 값의 예시를 나타낸 도면이다.
도 13a는 본 발명의 하나의 실시 예에서의 모형화기간에 대한 사전 독립 변수에 대한 데이터의 예시를 나타낸 도면이고, 도 13b는 본 발명의 하나의 실시 예에서의 모형화기간의 변동 등급과 관련된 독립 변수에 대한 데이터의 예시를 나타낸 도면이고, 도 13c는 본 발명의 하나의 실시 예에서의 모형화기간의 연단위 월별 변화와 관련된 독립 변수에 대한 데이터의 예시를 나타낸 도면이고, 도 13d는 본 발명의 하나의 실시 예에서의 모형화기간에 대한 비추세형 데이터의 연단위 분기별 변화와 관련된 독립 변수에 대한 데이터의 예시를 나타낸 도면이고, 도 13e는 본 발명의 하나의 실시 예에서의 모형화기간에 대한 비추세형 데이터의 연단위 반기별 변화와 관련된 독립 변수에 대한 데이터의 예시를 나타낸 도면이고, 도 13f는 본 발명의 하나의 실시 예에서의 모형화기간에 대한 추세형 데이터의 변동 등급, 월별 변동, 분기별 변동 및 반기별 변화와 관련된 독립 변수에 대한 데이터의 예시를 나타낸 도면이다.
도 14a는 본 발명의 하나의 실시 예에서의 시계열 데이터를 예측하기 위한 예측 모형별 다중 회귀분석식에서 사용되는 독립 변수에 대한 예시를 나타낸 도면이고, 도 14b는 본 발명의 하나의 실시 예에서의 독립 변수를 이용하여 산출된 적어도 하나의 예측 모형별 다중 회귀분석식 중에서 적합한 분석식을 결정하는 예시를 나타낸 도면이고, 도 14c는 본 발명의 하나의 실시 예에서의 독립 변수를 이용하여 산출된 적어도 하나의 예측 모형별 다중 회귀분석식 중에서 적합한 분석식을 결정하는 예시를 나타낸 도면이고, 도 14d는 본 발명의 하나의 실시 예에서의 결정된 예측 모형별 다중 회귀분석식의 예시를 나타낸 도면이다
도 15는 본 발명의 다양한 실시 예에 따른 검증 기간에 대한 예측데이터의 생성과 관련된 예시를 나타낸 도면이다.
도 16a는 본 발명의 다양한 실시 예에 따른 전자 장치가 산출한 모형화기간 및 검증기간에 대한 예측데이터에 기초한 예측 모형별 적합도와 관련된 데이터의 예시를 나타낸 도면이고, 도 16b는 본 발명의 하나의 실시 예에서의 예측 모형별 적합도에 기초하여 최종 예측 모형을 결정하는 것과 관련된 예시를 나타낸 도면이고, 도 16c는 본 발명의 다양한 실시 예에 따른 전자 장치가 최종 예측 모형을 이용하여 산출한 시계열 데이터의 예측 결과와 관련된 그래프에 대한 예시를 나타낸 도면이다.
도 17a, 17b 및 17c는 본 발명의 하나의 실시 예에 따른 전자 장치에서 빅데이터를 활용한 인공지능 다중 시계열 데이터 예측 방법에 관한 순서도이다.
전술한 과제를 달성하기 위한 본 발명의 실시예들이 첨부된 도면을 참조하여 설명될 것이다. 본 설명에 있어서, 동일부호는 동일한 구성을 의미하고, 당해 분야의 통상의 지식을 가진 자에게 본 발명의 특징에 대한 이해를 도모하기 위하여 부차적인 설명은 생략될 수도 있다.
본 명세서에서 하나의 구성요소가 다른 구성요소와의 관계에서 연결 내지 결합 등의 결합관계, 또는 전송 내지 이송 등의 전달관계 등을 형성하는 경우 '직접'이라는 한정이 없는 이상, '직접적인' 결합관계 내지 전달관계 등의 형태뿐만 아니라 그들 사이에 또 다른 구성요소가 관계됨으로써 매개체에 의한 결합관계 내지 경유되는 전달관계 등의 형태로도 존재할 수 있다. 또한, '상에', '위에', '하부에', '아래에' 등의 '접촉'의 의미를 내포할 수 있는 용어들이 포함된 경우도 마찬가지이다. 게다가, 방향을 나타내는 용어들은 기준이 되는 요소에 대한 상대적 개념으로 해석되어야 한다.
또한, 본 명세서에서 비록 단수로 표현된 구성일지라도, 발명의 개념에 반하거나 모순되게 해석되지 않는 이상 복수의 구성들 전체를 대표하는 개념으로 사용될 수 있다는 점에 유의하여야 한다.
게다가, 본 명세서에서 '포함하다', '포함하여 이루어진다' 등의 단어 및 그들로부터 파생된 용어의 기재는 본래의 요소 내지 요소들에 하나 또는 그 이상의 다른 구성요소의 부가, 조합 내지 결합의 가능성을 배제하지 않으며, 나아가, '구비하다', '구성되다' 등의 의미를 갖는 단어 및 그들로부터 파생된 용어의 기재도 본래의 요소 내지 요소들에 하나 또는 그 이상의 다른 구성요소의 부가, 조합 내지 결합에 의하여 본래의 요소 내지 요소들이 자신의 특징, 기능 및/또는 성질이 상실되지 않는 경우라면 그러한 하나 또는 그 이상의 다른 구성요소의 부가 내지 결합 가능성이 배제되지 않아야 한다.
본 명세서에서 '제1', '제2' 등은 한정되는 용어의 동작이나 작용, 중요도 등에 따른 순번을 지칭하기 보다는 단지 그들에 의해 한정되는 용어 각각을 서로 구분하기 위한 것으로 이해되어야 할 것이다.
[전자 장치]
먼저, 본 발명의 하나의 예에 따른 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치를 살펴본다. 본 발명의 하나의 예에 따른 시계열 데이터 예측을 수행하는 전자 장치에 대한 이해를 돕기 위해 후술되는 발명의 실시예에 따른 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법들과 도면들이 참조될 수 있고, 이 경우 중복되는 설명은 생략될 수 있고 설명이 부족하거나 생략된 부분에 대해서는 후술되는 방법 발명의 실시예들을 참조하기로 한다.
도 1은 본 발명의 하나의 실시 예에 따른 전자 장치를 개략적으로 도시한 블록도이고, 도 2a 및 2b 각각은 본 발명의 또 하나의 실시 예에 따른 전자 장치를 개략적으로 도시한 블록도이다.
먼저 도 1을 참조하여 본 발명의 하나의 예에 따른 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치를 살펴본다. 도 1은 본 발명의 하나의 실시 예에 따른 전자 장치를 개략적으로 도시한 블록도이다.
본 발명의 하나의 실시 예에 따른 전자 장치(101)는 적어도 하나의 프로세서(110)를 포함한다. 예컨대, 도 1을 참조하면, 또 하나의 예에서, 전자 장치(101)는 메모리(120), 통신 모듈(130), 입력 모듈(140), 출력 모듈(150) 및/또는 데이터베이스(160)를 더 포함할 수 있다. 하나의 예에 따르면, 전자 장치(101)는, 메모리(120), 통신 모듈(130), 입력 모듈(140), 출력 모듈(150) 및/또는 데이터베이스(160) 구성요소들 중 적어도 하나를 생략하거나 다른 구성요소를 추가적으로 구비할 수 있다. 예컨대, 하나의 예에서, 도 1에 도시된 데이터베이스(160)는 전자 장치(101)의 외부에 구비되며 전자 장치(101)는 데이터베이스(160)에 통신연결되어 데이터를 읽어들일 수 있다.
프로세서(110)는, 예를 들면, 전자 장치(101)의 적어도 하나의 다른 구성요소들의 제어 및/또는 통신에 관한 연산이나 데이터 처리를 실행할 수 있다. 예컨대, 프로세서(110)는 자체 저장되거나 또는 메모리(120)에 저장된 소프트웨어 내지 프로그램을 구동 내지 수행할 수 있다. 예컨대, 프로세서(110)는 도 2a 및/또는 2b에 도시된 모듈들, 예컨대 변수 생성모듈(220), 회귀분석 모듈(230), 예측 산출모듈(240) 전부 또는 일부의 동작을 수행할 수 있다. 예컨대, 프로세서(110)는 도 2b에 도시된 상관분석 모듈(250)의 동작을 더 수행할 수 있다. 예컨대, 도 2a 내지 2b에 도시된 변수 생성모듈(220), 회귀분석 모듈(230), 예측 산출모듈(240) 및 상관분석 모듈(250)은 각자 또는 일부가 별개의 프로세서, 프로그램 내지 소프트웨어 또는 이들의 결합일 수 있고, 또는 전부가 하나의 프로세서, 프로그램 내지 소프트웨어 또는 이들의 결합일 수 있다. 도 2a 내지 2b에서 도시된 예측 산출모듈(240)이 생략된 실시예가 가능하고, 이때 예측 산출모듈(240)의 기능은 변수 생성모듈(220) 및 회귀분석 모듈(230)에서 수행될 수도 있다. 변수 생성모듈(220), 회귀분석 모듈(230), 예측 산출모듈(240) 및 상관분석 모듈(250)의 2 이상의 일부 또는 전부가 하나의 프로세서로 이루어지는 경우 하나의 프로세서에서 각기 다른 프로그램을 구동시키는 방식으로 구분되거나 동일 프로그램에 속하는 별도 동작이 수행되는 각기 다른 프로그램모듈을 구동시키는 방식으로 구분될 수 있고, 그들 중 2이상의 일부 또는 전부가 하나의 프로그램에 속하는 경우 별도 동작이 수행되는 각기 다른 프로그램모듈의 집합으로 이루어질 수 있고, 이에 한정되지 않는다. 본 발명의 실시예들의 특징적 구성들에 관한 프로세서(110)의 동작은 상세히 후술될 것이다.
메모리(120)는, 예를 들면, 휘발성 및/또는 비휘발성 메모리를 포함할 수 있다. 메모리(120)는, 예를 들면, 전자 장치(101)의 적어도 하나의 다른 구성요소에 관계된 명령 또는 데이터를 저장할 수 있고, 소프트웨어 내지 프로그램을 저장할 수도 있다. 예컨대, 메모리(120)는 내부 DB(160) 내지 외부 DB(210)에서 읽어들인 데이터를 프로세서(110)에서 처리하기 위해 저장하거나 임시 저장할 수 있다.
통신 모듈(130)은, 예를 들면, 전자 장치(101)와 외부 장치(미도시) 간의 통신을 설정할 수 있다. 예컨대, 도 1의 도시와 달리 데이터베이스(160)는 통신 모듈(130)을 통해 통신연결되는 외부 장치일 수 있다. 통신 모듈(130)은, 예를 들면, 무선 통신 또는 유선 통신을 통해서 네트워크(미도시)에 연결될 수 있고, 네트워크에 연결된 외부 장치와 통신할 수 있다. 통신 모듈(130)은, 예를 들면, 전자 장치(101)의 적어도 하나의 구성요소로부터 수신된 명령 또는 데이터를 외부 장치로 전송할 수 있다. 통신 모듈(130)은, 예를 들면, 외부 장치로부터 명령 또는 데이터를 수신할 수 있다.
입력 모듈(140)은, 예를 들면, 사용자로부터 명령 또는 데이터를 수신할 수 있고, 수신한 명령 또는 데이터를 전자 장치(101)의 다른 구성요소(들)에 전달할 수 있다.
출력 모듈(150)은, 예를 들면, 전자 장치(101)의 적어도 하나의 구성요소로부터 수신된 데이터를 사용자에게 제공할 수 있다. 예를 들면, 디스플레이(display)를 통해 데이터를 시각적으로 제공할 수 있고, 스피커(speaker)를 통해 데이터를 청각적으로 제공할 수도 있다.
데이터베이스(160, 210)는, 예를 들면, 프로세서(110)에서 사용되는 적어도 하나의 데이터를 저장할 수 있다. 하나의 예에 따르면, 데이터베이스(160, 210)는, 전자 장치(101)에 포함될 수도 있고, 도 2a 및/또는 2b에 도시된 바와 같이 전자 장치(101, 201, 202)와 구분되는 외부장치, 예컨대 외부 전자 장치에 위치할 수도 있다. 예를 들면, 전자 장치(101)가 제1 전자 장치에 포함되고, 데이터베이스(160)는 제1 전자 장치와 구분되는 제2 전자 장치에 포함될 수 있다. 이 경우, 전자 장치(101)는, 예를 들면, 통신 모듈(130)을 통해 제2 전자 장치에 포함된 데이터베이스(160)에 데이터의 전송을 요청할 수 있고, 데이터베이스(160)는 전자 장치(101)가 요청한 데이터를 검색할 수 있고, 검색된 데이터를 전자 장치(101)에 전송할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 또는 클라이언트-전자 장치 컴퓨팅 기술이 이용될 수 있다. 또한, 예를 들면, 전자 장치(101) 및/또는 데이터베이스(160)는 하나의 전자 장치(예: 제1 전자 장치 또는 제2 전자 장치)에 구분되어 포함될 수도 있다.
본 발명의 다양한 실시 예에 따른 전자 장치(101, 201, 202)는, 예를 들면, 스마트폰, 태블릿 PC, 이동 전화기, 영상 전화기, 데스크탑 PC, 랩탑 PC, 넷북 컴퓨터, 워크스테이션, PDA, 서버, 웨어러블 장치 또는 기타 전자 장치 중 적어도 하나를 포함할 수 있다. 이때, 전자 장치(101, 201, 202)는 적어도 하나의 프로세서를 구비하고 함께 구비되거나 외부에 구비된 데이터베이스로부터 시계열 데이터를 추출하여 데이터를 분석하고 산출할 수 있는 것이어야 한다.
한편, 도 2a 및/또는 2b를 참조하면, 본 발명의 하나의 예에서, 전자 장치(201, 202)는, 예를 들면, 변수 생성모듈(220), 회귀분석 모듈(230) 및/또는 예측 산출모듈(240)을 포함할 수 있다. 하나의 예에서, 도 2a 및/또는 2b에 도시된 데이터베이스(210)는 전자 장치(201, 202)의 외부에 구비될 수 있고, 이때, 전자 장치(201, 202)는 데이터베이스(210)와 통신연결되어 데이터를 읽어들일 수 있다. 또는 도시된 바와 달리, 전자 장치(201, 202) 내에 데이터베이스(210)가 포함될 수도 있다.
예컨대, 도 2a 및/또는 2b의 변수 생성모듈(220), 회귀분석 모듈(230) 및/또는 예측 산출모듈(240)은 도 1의 프로세서(110)에 포함되거나 프로세서(110)에 의한 동작 내지 프로세서(110)에 포함된 소프트웨어, 프로세서(110)에 의해 구동되는 소프트웨어 내지 이들 각각의 구분 단위 내지 구분 동작일 수 있다.
도 2a 및/또는 2b에서 데이터베이스(210)는, 예를 들면, 시계열 데이터를 저장할 수 있다. 도 1의 프로세서(110) 내지 도시되지 않았으나 도 2a 및/또는 2b의 각 모듈들의 동작을 수행하는 프로세서는 데이터베이스(210)로부터 시계열 데이터를 읽어들일 수 있다. 이때, 데이터베이스(160)가 전자장치(101)에 구비되는 경우 프로세서(110)에서 바로 읽어들이거나 메모리(120)에 임시저장하며 읽어들일 수 있고, 데이터베이스(210)가 전자장치(201, 202)의 외부에 구비되는 경우 예컨대 통신모듈(130)을 통해 데이터베이스(210)가 구비된 외부 전자장치와 통신을 수행하여 프로세서에서 읽어들일 수 있다.
이하에서, 본 발명의 하나의 예에 따른 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치(101, 201, 202)에 포함된 적어도 하나의 프로세서(110)의 동작 내지 각 모듈들의 동작을 살펴본다. 예컨대, 도 1의 프로세서(110)는 도 2a 및/또는 2b에 도시된 모듈들, 예컨대 변수 생성모듈(220), 회귀분석 모듈(230), 예측 산출모듈(240), 상관분석 모듈(250) 전부 또는 일부의 동작을 수행할 수 있다. 예컨대, 도 2a 및/또는 2b에 도시된 모듈들, 예컨대 변수 생성모듈(220), 회귀분석 모듈(230), 예측 산출모듈(240), 상관분석 모듈(250)은 도 1의 프로세서(110)에 통합될 수 있다. 예컨대, 도 1, 2a 및/또는 2b의 전자장치(101, 201, 202)에서 프로세서(1100 내지 각 모듈들(220, 230, 240, 250)은 도 3a, 3b 및/또는 3c에 따른 순서도에 따라 동작될 수 있다. 예컨대, 도 1, 2a 및/또는 2b의 전자장치(101, 201, 202)에서 프로세서(1100 내지 각 모듈들(220, 230, 240, 250)은 도 17a, 17b 및/또는 17c에 따른 순서도에 따라 동작될 수도 있다.
이때, 적어도 하나의 프로세서(110)는 제1 사건에 관한 시계열 분석데이터를 획득하고, 시계열 분석데이터의 회귀분석을 통해 제1 사건에 관한 예측용 제2 회귀분석식을 결정하고, 제2 회귀분석식을 이용하여 예측기간에 대한 제1 사건의 예측결과 데이터를 산출한다.
본 발명의 또 하나의 예에서, 전술한 프로세서(110)는 제1 사건에 관한 상관변수를 결정하고 결정된 상관변수인 제2 사건에 관한 예측 데이터를 산출하여 제2 회귀분석식 결정 과정에서 사용할 수 있다.
이하에서, 제1 사건에 관한 상관변수 결정 및 제2 사건에 관한 예측 데이터 산출에 대해서는 후술하고, 먼저, 전술한 프로세서(110)에 의한 시계열 분석데이터의 획득, 제2 회귀분석식의 결정 및 제1 사건 예측결과 데이터의 산출에 대해 구체적으로 살펴본다.
시계열 분석데이터 획득
먼저, 적어도 하나의 프로세서(110)에 의한 제1 사건에 관한 시계열 분석데이터의 획득을 구체적으로 살펴본다. 전술한 프로세서(110) 또는 변수 생성모듈(220)은 적어도 제1 사건에 관한 제1 결과데이터를 포함하는 사건 시계열 데이터를 기반으로 제1 결과데이터에 대한 제1 보정값 데이터 및 적어도 하나의 제1 예상값 데이터 중 어느 하나 이상의 데이터를 제1 산출 데이터로 산출하여, 제1 결과데이터 및 제1 산출 데이터를 포함한 제1 사건에 관한 제1 변수후보 데이터가 포함된 시계열 분석데이터를 획득한다. 예컨대, 프로세서(110) 또는 변수 생성모듈(220)은 먼저 데이터베이스(160, 210)로부터 또는 메모리(120)를 통해 사건 시계열 데이터를 읽어들인다. 프로세서(110) 또는 변수 생성모듈(220)은 읽어들인 사건 시계열 데이터를 기반으로 제1 변수후보 데이터가 포함된 시계열 분석데이터를 획득한다. 제1 변수후보 데이터가 포함된 시계열 분석데이터의 획득에 대한 구체적인 예는 후술된다. 예컨대, 전술한 프로세서(110) 또는 변수 생성모듈(220)은 모형화기간 및 검증기간을 포함하는 적어도 제1 기간에 대한 사건 시계열 데이터를 기반으로 제1 변수후보 데이터가 포함된 시계열 분석데이터를 획득한다. 예컨대, 모형화기간은 후술되는 회귀분석모형을 정하기 위한 기간이고 모형화기간 이후의 검증기간은 회귀분석모형을 검증하기 위한 기간일 수 있다. 모형화기간과 검증기간은 적어도 분석시점 단위로 연속될 수 있다.
본 발명에서, 시계열 데이터는 시간의 경과에 따라 연속적으로 발생하는 사건을 일정한 시간 간격으로 관찰하여 일정한 기준에 따라 계열로 정리한 데이터를 의미할 수 있다. 시계열 데이터는, 예를 들면, 도표 데이터, 텍스트 데이터, 관계형 데이터베이스(relational database, RDB) 등 다양한 형식의 데이터를 포함할 수 있다. 시계열 데이터의 시간 단위는 월 단위, 연 단위, 반기 단위, 분기 단위, 주 단위, 일 단위 등 다양한 시간 간격일 수 있고, 이에 한정되지 않는다. 다음에서 월 단위 간격의 시계열 데이터를 예로 들어 설명되나, 이는 예시적인 것이다.
한편, 시계열 데이터는, 예를 들면, 감염병 발생 횟수, 종합 주가 지수, 경제 성장률, 소비자 물가 지수, 화재 발생 횟수, 범죄 발생 횟수, 기온, 강수량 등 시간의 경과에 따라 연속적으로 발생할 수 있는 다양한 대부분의 사건에 대한 데이터를 포함할 수 있고, 예시된 바에 한정되지 않는다.
예컨대, 프로세서(110)에서의 제1 사건에 관한 시계열 분석데이터의 획득은 도 2a 및/또는 2b의 변수 생성모듈(220)에 의해 이루어질 수 있다.
예컨대, 적어도 하나의 프로세서(110) 내지 변수 생성모듈(220)은, 예를 들면, 사건 시계열 데이터에 기초하여, 시계열 데이터에 포함된 데이터 값을 나타낼 수 있는 단일 내지 다중 회귀분석식을 산출하기 위한 독립 변수 내지 독립변수 후보를 생성할 수 있다. 즉, 제1 사건에 관한 시계열 분석데이터의 획득은 제1 사건에 관한 단일 내지 다중 회귀분석식을 산출하기 위한 독립 변수 내지 독립변수 후보를 획득하는 과정일 수 있다. 여기서, 단일 내지 다중 회귀 분석은, 예를 들면, 변수 간의 인과 관계를 통계적 방법에 의해 추정하는 회귀 분석의 방법 중 하나이며, 원인이 되는 독립 변수에 따라 결과가 되는 종속 변수가 결정될 수 있다. 이하에서 설명되는 구체적 실시예에서는 다중 회귀분석을 기준으로 설명되며, 본 발명의 범위가 이에 한정되지는 않는다.
예컨대, 하나의 예에서, 적어도 하나의 프로세서(110) 내지 변수 생성모듈(220)은 데이터 산출의 기반이 되는 적어도 제1 사건에 관한 제1 결과데이터를 포함하는 사건 시계열 데이터는 모형화기간 및 검증기간을 포함하는 적어도 제1 기간에 대하여, 예컨대 외부의 DB(210) 또는 내부의 DB(160) 또는 저장소(예컨대, 메모리(120))로부터 읽어들인 데이터일 수 있다. 사건 시계열 데이터는 제1 사건에 관한 제1 결과데이터와 함께 시간데이터를 포함하고 있고, 실시예에 따라 제1 사건 외의 관련되거나 관련있는 것으로 추정되는 다른 사건에 관한 데이터도 포함할 수 있다.
프로세서(110) 내지 변수 생성모듈(220)은 전술한 사건 시계열 데이터를 기반으로 적어도 모형화기간에 대하여 제1 보정값 데이터 및 적어도 하나의 제1 예상값 데이터 중 어느 하나 이상의 데이터를 산출한다. 예컨대, 프로세서(110) 내지 변수 생성모듈(220)은 제1 기간 중 모형화기간에 대해 또는 모형화기간 및 검증기간에 대해 제1 보정값 데이터 및 적어도 하나의 제1 예상값 데이터 중 어느 하나 이상의 데이터를 산출할 수 있다. 제1 보정값 데이터는 제1 사건에 관한 제1 결과데이터를 보정한 데이터이다. 제1 예상값 데이터는 시점별 제1 예상 값의 그룹이다. 예컨대, 제1 결과데이터를 보정한 데이터 값은 제1 결과데이터의 값들간의 차이를 줄이는 방식으로 얻을 수 있다. 예컨대, 제1 보정값 데이터는 제1 결과데이터의 값을 진폭 조정법에 따라 보정한 데이터일 수 있다. 실시예에 따라, 진포 조정법 외의 다른 다양한 방식으로도 제1 결과데이터의 값들간의 차이를 줄인 제1 보정값 데이터를 구할 수 있다.
또한, 프로세서(110) 내지 변수 생성모듈(220)은 적어도 모형화기간에 대하여 제1 사건에 관한 시계열 데이터의 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점에 대한 적어도 하나의 제1 예상 값의 그룹인 적어도 하나의 제1 예상값 데이터를 산출한다. 예컨대, 제1 예상 값은 분석시점의 결과데이터 내지 결과데이터로부터 산출된 보정값 데이터를 기초로 산출될 수 있다. 예컨대, 프로세서(110) 내지 변수 생성모듈(220)은 제1 기간 중 모형화기간에 대해 또는 모형화기간 및 검증기간에 대해 적어도 하나의 제1 예상값 데이터를 산출할 수 있다.
예컨대, 하나의 예에서, 전술한 프로세서(110) 내지 변수 생성모듈(220)은, 각 분석시점 대비 -1 분석시점과 각 분석시점 사이의 시점간 변화도, 각 분석시점의 소속집단에서의 데이터의 백분율값, 백분위 또는 편차, 각 분석시점의 추정기준으로부터의 이격도 중 어느 하나를 기초로 하여 각 분석시점에 대한 제1 예상 값을 각각 산출할 수 있다. 또는 전술한 프로세서(110) 내지 변수 생성모듈(220)은, 각 분석시점과 주기적 동일시점 또는 각 분석시점의 소속구간에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화도 내지 이격도에 따라 산출되는 각 분석시점의 등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화도 내지 이격도에 따라 산출되는 -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 등급 시점에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값을 포함하는 데이터 그룹 중 어느 하나 자체를 하나의 제1 예상 값으로 산출하거나 데이터 그룹 중 어느 하나를 기초로 각 분석시점에 대한 제1 예상 값을 각각 산출할 수 있다.
예컨대, 각 분석시점에 대한 적어도 하나의 제1 예상 값의 산출의 기초가 되는 각 분석시점의 이전시점으로부터의 변화는 각 분석시점 대비 -1 분석시점과 각 분석시점 사이의 시점간 변화도, 시점간 변화도에 따라 산출되는 각 분석시점의 등급과 동일등급 시점에서의 또는 -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값 중 하나일 수 있거나, 또는 이때, 각 분석시점의 이전시점으로부터의 변화를 기초로 산출되는 각 분석시점에 대한 적어도 하나의 제1 예상 값은 시점간 변화도에 따라 산출되는 각 분석시점의 등급과 동일등급 시점에서의 또는 -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값 중 하나일 수 있다.
또한, 제1 예상 값의 산출의 기초가 되는 각 분석시점의 소속집단과의 관계는 각 분석시점의 소속집단에서의 데이터의 백분율값, 백분위 또는 편차, 각 분석시점과 주기적 동일시점 또는 각 분석시점의 소속구간에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화도 내지 이격도에 따라 산출되는 각 분석시점의 등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화도 내지 이격도에 따라 산출되는 -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 등급 시점에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값 중 하나일 수 있거나, 또는 이때, 각 분석시점의 이전시점으로부터의 변화를 기초로 산출되는 각 분석시점에 대한 적어도 하나의 제1 예상 값은 각 분석시점과 주기적 동일시점 또는 각 분석시점의 소속구간에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화도 내지 이격도에 따라 산출되는 각 분석시점의 등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화도 내지 이격도에 따라 산출되는 -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 등급 시점에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값 중 하나일 수 있다.
게다가, 제1 예상 값의 산출의 기초가 되는 추정기준과의 차이는 각 분석시점의 추정기준으로부터의 이격도, 추정기준으로부터의 이격도에 따라 산출되는 각 분석시점의 등급과 동일등급 시점에서의 또는 -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값 중 하나일 수 있거나, 또는 이때, 각 분석시점의 이전시점으로부터의 변화를 기초로 산출되는 각 분석시점에 대한 적어도 하나의 제1 예상 값은 추정기준으로부터의 이격도에 따라 산출되는 각 분석시점의 등급과 동일등급 시점에서의 또는 -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값 중 하나일 수 있다.
예컨대, 전술한 데이터의 백분율값, 백분위 또는 편차는 제1 결과데이터, 제1 보정값 데이터, 이격도 또는 그들 중 어느 하나의 증감율에 관련된 값일 수 있다. 또한, 전술한 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값은 자체가 제1 예상 값인 경우 제1 결과데이터 내지 제1 보정값 데이터의 값일 수 있고, 자체가 제1 예상 값 산출의 기초인 경우에는 제1 결과데이터, 제1 보정값 데이터, 이격도 중 어느 하나의 증감율, 백분율 내지 백분위에 관한 값일 수 있다.
예컨대, 하나의 예에서, 시점간 변화도 및 이격도를 산출하기 위한 각 분석시점 및 추정기준의 값 각각은 제1 결과데이터 내지 제1 보정값 데이터의 값일 수 있다. 예컨대, 하나의 예에서, 시점간 변화도는 차이값 내지 증감율값일 수 있다.
예컨대, 전술한 프로세서(110) 또는 변수 생성모듈(220)은, 추세형 시계열 데이터를 나타낼 수 있는 단일 내지 다중 회귀분석식(이하, 추세형 분석식)을 결정하기 위한 독립변수를 생성하기 위해, 추세선에 대한 식 및/또는 그래프를 결정할 수 있다. 이때, 추세선은 시계열 데이터가 시간의 흐름에 따라 장기간에 걸쳐 지속적으로 증가 또는 감소하거나 혹은 일정한 상태를 유지하는 일정한 경향을 나타내는 경우, 이러한 장기 추세 경향을 좌표 평면 상에 그래프로 나타내는 것을 의미할 수 있고, 직선 회귀 방정식, 로그 방정식, 지수 방정식 및/또는 사용자가 임의로 정의한 기준에 따른 산출식에 시간 변수를 대입함으로써 결정될 수 있다. 예컨대, 이때, 전술한 프로세서(110) 또는 변수 생성모듈(220)은 결정된 추세선에 대한 식에 시간 변수를 대입함으로써 모형화기간의 추세형 데이터를 산출할 수 있다.
예컨대, 전술한 프로세서(110) 또는 예컨대 변수 생성모듈(220)과 회귀분석 모듈(230)은, 적어도 모형화기간에 대한 시계열 분석데이터로부터 시계열 순번을 독립변수로 삼아 단순추세 선형회귀식을 산출하고 단순추세 선형회귀식에 시계열 순번을 대입하여 추세 데이터를 산출하고 추세 데이터를 추정기준으로 삼아 각 분석시점의 추정기준으로부터의 이격도를 산출할 수 있다.
계속하여 살펴보면, 프로세서(110)에서 적어도 모형화기간에 대하여 획득되는 시계열 분석데이터는 제1 사건에 관한 제1 변수후보 데이터를 포함한다. 제1 변수후보 데이터는 제1 사건에 관한 제1 결과데이터 및 제1 결과데이터로부터 산출된 제1 산출 데이터를 포함하고, 이때, 제1 산출 데이터는 제1 보정값 데이터 및 적어도 하나의 제1 예상값 데이터 중에서 산출되는 어느 하나 이상의 데이터이다.
예컨대, 하나의 예에서, 제1 변수후보 데이터들에 포함되는 제1 산출 데이터는 적어도 제1 보정값 데이터를 포함할 수 있다. 예컨대, 제1 변수후보 데이터들에 포함되는 제1 산출 데이터는 제1 보정값 데이터 및 적어도 하나 이상의 제1 예상값 데이터 중 적어도 제1 보정값 데이터를 포함할 수 있다. 실시예에 따라, 제1 산출 데이터는 제1 보정값 데이터와 적어도 하나 이상의 제1 예상값 데이터를 포함할 수 있다.
제2 회귀분석식 결정
다음으로, 적어도 하나의 프로세서(110)에 의한 제2 회귀분석식의 결정을 살펴본다(S330, S330', S330", S1830 참조). 전술한 프로세서(110) 내지 회귀분석 모듈(230)은 적어도 모형화기간에 대한 시계열 분석데이터에 대해 제1 회귀분석을 수행하여 2이상의 제1 회귀분석식들을 예비결정하고, 적어도 검증기간을 포함한 기간에 대한 검증하고 검증결과를 기초로 제1 기간의 제1 사건에 관한 예측용 제2 회귀분석식을 결정한다. 예컨대, 도 2a 및/또는 2b를 참조하면 검증기간에 대한 검증과정에서 예측 산출모듈(240)이 추가로 동작할 수 있다. 이때, 제1 및 제2 회귀분석식 각각은 단일 내지 다중 회귀분석식이다. 예컨대, 단일 회귀분석식은 독립변수 항이 하나인 것을 의미하고 다중 회귀분석식은 독립변수 항이 2개 이상인 것을 의미한다.
본 발명에서 모형화기간에 대한 회귀분석식을 예비결정하고 모형화기간 이후의 검증기간에 대해 검증하고 제1 기간에 대해 예측용 회귀분석식을 결정함으로써, 시계열 데이터의 예측에 대한 정확성과 신뢰성을 확보할 수 있다.
예컨대, 하나의 예에서, 전술한 프로세서(110) 내지 회귀분석 모듈(230)은, 적어도 검증기간을 포함한 기간에 대하여 예비결정된 제1 회귀분석식들을 검증하여 회귀분석모형을 정하고 검증결과 정해진 회귀분석모형을 토대로 제1 기간에 대하여 제2 회귀분석을 수행하여 제2 회귀분석식을 결정할 수 있다(S330', S330" 참조).
하나의 예에서, 전술한 프로세서(110) 내지 회귀분석 모듈(230)에 의한 제1 회귀분석을 통한 제1 회귀분석식의 예비결정을 살펴본다(S331 참조). 프로세서(110)는 적어도 모형화기간에 대하여 시계열 분석데이터의 제1 변수후보 데이터의 적어도 하나의 데이터 항목을 제1사건 독립변수 후보로 하는 제1 회귀분석을 수행하여 제1 사건에 관한 2 이상의 제1 회귀분석식들을 예비결정한다.
예컨대, 프로세서(110)에서의 제1 사건에 관한 제1 회귀분석식들의 예비결정은 도 2a 및/또는 2b의 회귀분석 모듈(230)에 의해 이루어질 수 있다. 예컨대, 프로세서(110) 내지 회귀분석 모듈(230)은 제1 변수후보 데이터의 적어도 하나의 데이터 항목을 제1사건 독립변수 후보로 하는 회귀분석을 통해 제1 회귀분석식들의 다수의 예비후보를 정하고 후보 분석식들에 모형화기간의 데이터에 기초한 독립변수를 대입하여 적어도 모형화기간에 대한 예측데이터를 후보 모형별로 생성할 수 있다. 예측데이터는, 단일 내지 다중 회귀분석식에 독립 변수를 대입함으로써 산출되는 종속 변수에 대한 데이터를 의미할 수 있다. 게다가, 프로세서(110) 내지 회귀분석 모듈(230)은 생성된 예측데이터와 프로세서(110) 내지 변수 생성모듈(220)에 의해 획득된 적어도 모형화기간의 데이터를 비교하여 비교결과에 기초하여 예측후보별로 적합도를 산출하여 제1 회귀분석식을 예비결정할 수 있다. 예컨대, 생성된 예측데이터는 비교데이터와 상응하는 관계에 있어야 하고, 예컨대 동일한 성질을 가져야한다. 예컨대, 생성된 예측데이터가 시계열 사건의 결과 데이터에 관한 예측이라면 비교되는 적어도 모형화기간의 데이터도 시계열 사건의 결과데이터여야 하고, 만일 다른 경우 어느 한쪽을 변환하여 상응하는 관계가 되도록 하여 비교할 수 있다.
예컨대, 프로세서(110) 내지 회귀분석 모듈(230)은 시계열 데이터에 포함된 데이터 값을 나타낼 수 있는 예를 들면 다중 회귀분석식을 예비결정을 위해 산출할 수 있다. 프로세서(110) 내지 회귀분석 모듈(230)은, 예를 들면, 생성된 독립 변수에 기초하여, 추세형 분석식, 비추세형 분석식 및/또는 혼합형 분석식을 산출할 수 있다. 예컨대, 혼합형 분석모형 내지 혼합형 분석식은, 예를 들면, 추세형 분석모형 내지 추세형 분석식을 결정하기 위한 독립변수 및 비추세형 분석모형 내지 비추세형 분석식을 결정하기 위한 독립변수를 모두 고려하여 산출되는 다중 회귀분석식을 의미할 수 있다. 추세형 예측 모형은 추세형 분석식을 이용하여 시계열 데이터의 예측 결과를 산출하는 방식을 의미하며, 비추세형 예측 모형은 비추세형 분석식을 이용하여 시계열 데이터의 예측 결과를 산출하는 방식을 의미하며, 혼합형 예측 모형은 혼합형 분석식을 이용하여 시계열 데이터의 예측 결과를 산출하는 방식을 의미할 수 있다.
예컨대, 다중 회귀분석식은, 고려하는 독립 변수들을 한번에 모두 포함하여 분석하는 동시 입력 추정 방법, 종속 변수에 영향력이 있다고 판단되는 독립 변수들만 포함하여 분석하는 단계적 추정 방법, 모든 독립 변수들을 포함한 상태에서 영향력이 적은 변수부터 하나씩 제거하면서 분석하는 후진(backward) 추정 방법 등을 사용하여 산출할 수 있다.
하나의 예에서, 프로세서(110) 내지 회귀분석 모듈(230)은, 제1 회귀분석을 수행하여 추세형, 비추세형, 추세형과 비추세형의 혼합형 중 적어도 2 이상의 분석모형에 따른 제1 회귀분석식들을 예비결정하고 2 이상의 분석모형에 따른 회귀분석식 모형 중 하나를 회귀분석모형으로 결정할 수 있다.
예컨대, 추세형의 회귀분석식은 시점간 변화도, 데이터의 백분율값, 백분위 또는 편차, 이격도 중 어느 하나를 기초로 산출된 제1 예상값 데이터 각각과, 주기적 동일시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 이격도에 따라 산출되는 각 분석시점의 이격도등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 이격도등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 이격도등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 이격도등급에서의 데이터 평균, 중위수, 최빈, 극빈, 최대 또는 최소 값을 포함하는 제1 그룹 중 어느 하나 자체에 관한 제1 예상값 데이터 각각과, 제1 그룹 중 어느 하나를 기초로 산출된 제1 예상값 데이터 각각을 포함하는 그룹에서 어느 하나 이상을 독립변수 항목으로 할 수 있다.
또한, 비추세형의 회귀분석식은 시점간 변화도 내지 데이터의 백분율값, 백분위 또는 편차를 기초로 산출된 제1 예상값 데이터 각각과, 주기적 동일시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화에 따라 산출되는 각 분석시점의 변동등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 변동등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 변동등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 변동등급 시점에서의 데이터 평균, 중위수, 최빈, 극빈, 최대 또는 최소 값을 포함하는 제2 그룹 중 어느 하나 자체에 관한 제1 예상값 데이터 각각과, 제2 그룹 중 어느 하나를 기초로 산출된 제1 예상값 데이터 각각을 포함하는 그룹에서 어느 하나 이상을 독립변수 항목으로 할 수 있다.
혼합형의 회귀분석식은 추세형의 회귀 분석석의 독립변수 항목 중 어느 하나 이상과 비추세형의 회귀분석식의 독립변수 항목 중 어느 하나 이상을 독립변수 항목으로 할 수 있다.
예컨대, 제1 회귀분석을 통해 예비결정되는 제1 회귀분석식들의 종속변수 항목은 제1 사건에 관한 제1 결과데이터 내지 제1 보정값 데이터에 관한 것일 수 있다. 제1 회귀분석식의 종속변수 항목을 제1 결과데이터에 관한 것으로 하는 경우 제1사건 독립변수 후보가 되는 제1 변수후보 데이터의 적어도 하나의 데이터 항목은 제1 결과데이터를 제외한 제1 변수후보 데이터의 나머지 데이터 항목, 예컨대 제1 산출 데이터 중에서 결정되고, 예컨대 적어도 하나의 제1 예상값 데이터일 수 있다. 또는 예를 들면, 제1 회귀분석식의 종속변수 항목을 제1 보정값 데이터에 관한 것으로 하는 경우 제1사건 독립변수 후보는 적어도 하나의 제1 예상값 데이터일 수 있다.
전술한 프로세서(110) 내지 예컨대 회귀분석 모듈(230) 및 예측 산출모듈(240)에 의한 적어도 검증기간을 포함한 기간에 대한 검증을 살펴본다(S333, S333' 및/또는 S333" 참조). 예컨대, 프로세서(110) 내지 예컨대 회귀분석 모듈(230)은 적어도 검증기간을 포함한 기간에 대하여 산출된 제1 회귀분석식들의 예측데이터를 이미 획득된 검증용 비교데이터와 비교하여 제1 회귀분석식들의 예측 모형의 적합도를 검증할 수 있다. 이때, 검증결과를 기초로 제1 기간의 제1 사건에 관한 제2 회귀분석식을 결정할 수 있다.
예컨대, 하나의 예에서, 프로세서(110) 내지 예컨대 회귀분석 모듈(230) 및 예측 산출모듈(240)은 적어도 검증기간을 포함한 기간에 대하여 산출된 제1 회귀분석식들의 제1 검증 예측데이터들과 이미 획득된 제1사건 비교데이터를 비교하여 제1 회귀분석식들을 검증하여 예측 모형의 적합도에 따라 회귀분석모형을 정할 수 있다(S333' 및/또는 S333" 참조). 이하에서 검증과정을 보다 구체적으로 살펴본다.
예컨대, 프로세서(110) 내지 예측 산출모듈(240)은 적어도 검증기간을 포함한 기간에 대하여 예비결정된 제1 회귀분석식들의 독립변수에 관한 제1 변수후보 데이터의 데이터 항목을 제1 회귀분석식들에 대입하여 제1 회귀분석식 각각의 종속변수인 제1 기간에 대한 제1 검증 예측데이터들을 예측 모형별로 산출할 수 있다. 또한, 프로세서(110) 내지 회귀분석 모듈(230)은 적어도 검증기간을 포함한 기간에 대한 제1 검증 예측데이터들과 제1사건 비교데이터를 비교하여 회귀분석모형을 정할 수 있다. 검증을 위한 비교는 검증기간에 대해서 수행하거나 검증기간 및 모형화기간 전체에 대해 수행될 수도 있다. 예컨대, 검증을 위한 비교 시 제1 검증 예측데이터들과 제1사건 비교데이터는 상응하는 관계, 예컨대 동일한 성질을 갖는 관계에 있어야 한다. 만일, 서로 상응하지 않는 경우 어느 한쪽을 변환하여 상응하도록 하여 비교할 수 있다.
예컨대, 프로세서(110) 내지 회귀분석 모듈(230)은, 시계열 분석데이터의 적어도 검증기간을 포함한 기간에 대한 데이터와, 단일 내지 다중 회귀분석식을 사용하여 생성한 적어도 검증기간을 포함한 기간에 대한 예측 데이터를 비교할 수 있고, 비교한 결과에 기초하여 예측 모형별 적합도를 산출할 수 있다. 예측 모형별 적합도는, 예를 들면, 다중 회귀 분석을 통해 생성한 값이 시계열 데이터의 실제 값에 근접하는 정도를 나타내는 척도이며, 정상 R 제곱(R-square)을 이용하는 등 다양한 측정 방법을 통해 예측 모형별 적합도를 산출할 수 있고, 이에 한정되지 않는다.
예컨대, 본 발명에서, 검증기간은 모형화기간과 연속되는 모형화기간 이후의 기간일 수 있고, 예컨대 나아가 사건 시계열 데이터가 확보되는 가장 최근까지의 기간일 수 있다. 예컨대, 이때, 제1 기간은 모형화기간과 검증기간으로 나눌 수 있다.
예컨대, 회귀분석모형을 정하기 위해 검증기간에 대하여 산출되는 제1 회귀분석식 각각의 독립변수는 예컨대 변수 생성모듈(220)에서 모형화기간에서와 동일한 방식으로 검증기간에 대해 기획득된 제1 결과데이터로부터 산출되는 제1 산출 데이터 내지 제1 예상값 데이터 중 어느 하나 이상의 데이터 항목이거나, 또는 예컨대 예측 산출모듈(240)에서 1 분석시점 단위로 산출되는 시점별 검증 예측데이터로부터 산출되는 제1 산출 데이터 내지 제1 예상값 데이터 중 어느 하나 이상의 데이터 항목일 수 있다. 전자의 경우 검증기간에 대한 제1 회귀분석식 각각의 독립변수와 종속변수는 각각 일괄적으로 산출될 수 있고, 후자의 경우 1 분석시점별로 피드백하는 방식으로 산출될 수 있다. 전자 방식의 경우 제1 회귀분석식의 예비결정 시 상관성 등의 적합도가 매우 높게 형성되는 경우 적용가능하나, 일반적으로 감염병 발병횟수 예측, 종합주가 지수 예측, 화재발생횟수 예측, 강수량 예측, 소비자 물가지수 예측 등의 경우 변동가능성이 매우 높으므로 적합도가 매우 높게 형성되기 어렵다. 이러한 경우, 후자의 방식으로 예비결정된 제1 회귀분석식에 대한 검증을 수행함으로써 예측의 신뢰도 내지 정확도를 향상시킬 수 있다.
예컨대, 하나의 예에서, 회귀분석모형을 정하기 위해 검증기간에 대하여 산출되는 제1 회귀분석식 각각의 독립변수와 종속변수는 1 분석시점 단위로 산출되며 직전 분석시점에서 산출된 종속변수가 현 분석시점의 독립변수 산출에 영향을 미치고 현 분석시점에서 산출된 독립변수로부터 현 분석시점의 종속변수가 산출되도록 할 수 있다.
예컨대, 하나의 예에서, 전술한 프로세서(110) 내지 예측 산출모듈(240)은, 적어도 검증기간을 포함한 기간, 예컨대 검증기간에 대하여 1 분석시점 단위로 모형화기간에 대한 제1 변수후보 데이터의 획득방식과 동일하게 산출된 제1 회귀분석식들의 독립변수에 관한 제1 변수후보 데이터의 데이터 항목을 제1 회귀분석식들에 대입하여 시점별 검증 예측데이터를 산출하고 1 분석시점 단위의 산출 과정을 누적하며 검증기간 전체에 반복하여 제1 사건에 관한 제1 검증 예측데이터들을 산출할 수 있다(S333" 참조). 예컨대, 전술한 프로세서(110) 내지 예측 산출모듈(240)은, 검증기간에 대한 1 분석시점 단위로 산출된 제1 회귀분석식들의 독립변수에 관한 제1 변수후보 데이터의 데이터 항목을 산출할 수 있다. 이때, 예측 산출모듈(240)은 모형화기간의 최종 시점에 대해 예비결정된 제1 회귀분석식으로부터 예측되는 종속변수 데이터를 산출하고, 모형화기간의 최종시점의 종속변수 데이터로부터 다음 검증기간의 최초시점에 대한 제1 회귀분석식의 독립변수에 관한 데이터 항목을 산출할 수 있다. 검증기간 최초시점의 독립변수에 관한 데이터항목을 제1 회귀분석식에 대입하며 검증기간 최초시점에 대한 검증 예측데이터를 산출하고, 이러한 1 분석시점 단위의 독립변수 산출 및 검증 예측데이터 산출을 시점단위로 누적시키며 검증기간 전체에 대한 제1 검증 예측데이터를 산출할 수 있다. 예컨대, 예측 산출모듈(240)이 생략된 경우 1 분석시점 단위의 독립변수 산출은 변수 생성모듈(220)에서, 그리고 시점별 검증 예측데이터의 산출은 회귀분석 모듈(230)에서 수행될 수도 있다. 예컨대, 검증기간 외 모형화기간에 대한 예측데이터의 산출은 모형화기간에 대한 각 시점의 독립변수 항목을 대입하여 산출될 수 있다.
예컨대, 하나의 예에서, 모형화기간 내의 각 시점의 예측데이터는 모형화기간 내의 다음 시점의 독립변수 항목에 영향을 미치지 않으나, 검증기간 내의 각 시점의 독립변수 항목은 이전시점의 예측데이터를 기반으로 산출될 수 있다.
또한, 프로세서(110) 내지 예컨대 회귀분석 모듈(230)은 적어도 검증기간을 포함한 기간에 대한 제1 검증 예측데이터들과 검증기간에 대한 제1 회귀분석식들의 종속변수 관련 변수후보 데이터인 제1사건 비교데이터들을 비교하여 회귀분석모형을 정할 수 있다. 예컨대, 이때, 제1 검증 예측데이터들은 예측 산출모듈(240)에 의해 산출되고 제1사건 비교데이터들은 변수 생성모듈(220)에서 산출된 것일 수 있다.
예컨대, 본 발명에서, 1 분석시점 단위는 일, 주, 월, 년 등의 시간 단위일 수 있으며, 시, 계절 등일 수 있고, 이에 한정되지 않는다.
다음으로, 전술한 프로세서(110) 내지 회귀분석 모듈(230)에 의한 제1 사건에 관한 예측용 제2 회귀분석식의 결정을 살펴본다(S335, S335', S335a, S335b 참조). 예컨대, 프로세서(110)는 제1 회귀분석식들의 검증결과를 기초로 제1 기간의 제1 사건에 대한 제2 회귀분석식을 결정한다. 예컨대, 제1 회귀분석식들의 검증결과 예측 모형 적합도가 가능 높은 모형을 제2 회귀분석식으로 결정할 수 있다. 또는, 프로세서(110)는 검증결과 예측 모형 적합도가 가장 높은 모형을 토대로 제1 기간에 대한 회귀분석을 수행하여 제2 회귀분석식을 산출할 수도 있다. 예컨대, 전술한 프로세서(110) 내지 회귀분석 모듈(230)은 검증결과 정해진 회귀분석모형을 토대로 제1 기간에 대한 시계열 분석데이터로부터 제2 회귀분석을 수행하여 제1 사건에 관한 예측용 제2 회귀분석식을 결정할 수 있다.
예컨대, 하나의 예에서, 전술한 프로세서(110) 내지 회귀분석 모듈(230)은, 결정된 회귀분석모형에 따른 회귀식의 독립변수에 기초하여 제1 기간에 대한 회귀분석을 수행하며 결정되는 회귀계수에 따른 제2 회귀분석식을 결정할 수 있다(S335a 참조). 또는, 프로세서(110)는 회귀분석모형에 따른 회귀식의 독립변수에 기초하여 수행한 제1 기간에 대한 회귀분석에 따라 독립변수 일부 제거 및 새로운 독립변수 추가 중 어느 하나 이상을 수행하며 제1 기간에 대한 새로운 독립변수와 회귀계수를 정하여 제2 회귀분석식을 결정할 수 있다(S335b 참조).
예컨대, S335a에서와 같이 독립변수 항목은 그대로 둔채 회귀계수만을 조정하는 경우와 S335b에서와 같이 독립변수 항목 일부 제거 내지 추가를 통해 새로운 독립변수 항목과 회귀계수를 정하는 방식 모두로부터 제2 회귀분석식의 후보를 선정하고 그 후보들 중 제1 기간에 대한 회귀분석 결과 적합도가 가능 우수한 회귀분석식을 제2 회귀분석식으로 결정할 수 있다.
예컨대, 제2 회귀분석식으로 결정되는 다중 회귀분석식은 동시 입력 추정 방법, 단계적 추정 방법, 후진(backward) 추정 방법 등을 사용하여 산출할 수 있다.
예컨대, 제1 변수후보 데이터들에 포함되는 제1 산출 데이터는 적어도 제1 보정값 데이터를 포함하고, 제1 및/또는 제2 회귀분석을 위한 제1 및/또는 제2 회귀분석식의 종속변수 항목은 제1 사건에 관한 제1 변수후보 데이터들에 포함된 제1 결과데이터 내지 제1 보정값 데이터에 관한 것일 수 있다. 또한, 하나의 예에서, 회귀분석모형을 정하기 위한 제1사건 비교데이터도 제1 사건에 관한 제1 변수후보 데이터들에 포함된 제1 보정값 데이터일 수 있다.
예컨대, 제1 및/또는 제2 회귀분석식의 각 독립변수의 항은 선형항 내지 비선형항일 수 있다. 예컨대, 비선형항은 제곱항, 제곱근항, 로그항, 지수항 중의 적어도 하나일 수 있다.
또 하나의 예에서, 전술한 프로세서(110) 내지 회귀분석 모듈(230)은, 예컨대 모형화기간에 대한 제1 회귀분석식들의 예비결정, 회귀분석모형 결정 및/또는 제1 기간에 대한 제2 회귀분석식의 결정에 있어서, 독립변수와 종속변수 사이의 상관관계의 정도를 나타내는 척도인 상관계수(correlation coefficient, R), 상관계수의 제곱값인 결정계수(coefficient of determination, R-squared), 수정된 결정계수(adjusted R-squared), 더빈-왓슨비(Durbin-Watson ratio), 베타 표준화계수, 유의확률(significance probability), 공선성 통계량 중 적어도 하나 이상을 고려하여 회귀분석을 수행할 수 있다. 그들 중 적어도 하나에 기초하여, 각 단일 내지 다중 회귀분석식이 결과를 산출하기에 적합한지 여부를 판단할 수 있다. 공선성 통계량은 분산 확대 인자(variance inflation factor, VIF), 공차 한계(tolerance) 등으로 나타낼 수 있다. 예컨대, 상관 계수, 결정 계수, 수정된 결정 계수, 유의 확률, 더빈-왓슨 비, 분산 확대 인자 및/또는 공차 한계를 예로 들어 설명하나, 본 발명의 범위는 전술한 예시에 한정되는 것은 아니며, 통계적 방법에 의하여 고려할 수 있는 모든 판단 척도를 포함할 수 있다. 예컨대, 회귀분석 수행방법은 이미 많이 공지되어 있고, 나아가 본 발명에서는 회귀분석 자체의 구체적인 내용을 권리범위로 보호받고자 하는 것이 아니라 회귀분석 수행하여 시계열 데이터로부터 예측데이터를 산출하는 전체 프로세스에 관해 보호받고자 하는 것이므로, 회귀분석 방법 자체의 내용에 대해서는 구체적인 설명을 생략하기로 하고, 다양한 회귀분석 방법들이 본 발명에서도 적용될 수 있다.
하나의 예에 따르면, 전술한 프로세서(110) 내지 회귀분석 모듈(230)은, 예를 들면, 적어도 모형화기간에 대한 제1 회귀분석식들의 예비결정, 적어도 검증기간을 포함한 기간에 대한 제1 회귀분석식들의 검증 및/또는 제1 기간에 대한 제2 회귀분석식의 결정에 있어서, 예측 모형별 적합도에 기초하여 시계열 데이터의 예측을 위한 방법에 사용하는 예비모형 결정, 검증에 따른 회귀분석모형 결정 및/또는 최종 예측모형 결정을 수행할 수 있다. 예를 들면, 전술한 프로세서(110) 내지 회귀분석 모듈(230)은, 대상기간 전체를 일정한 간격으로 구분할 수 있고 예측 모형별 적합도를 시계열 데이터의 구분된 각 기간별로 산출할 수 있고, 각 기간별 예측 모형별 적합도에 기초하여 대상 전체 기간에 대한 예측 모형별 평균 적합도를 산출할 수 있고 예컨대 평균 적합도가 가장 높은 예측 모형을 예비모형, 회귀분석모형 및/또는 최종 예측모형으로 결정할 수 있다.
예컨대, 본 발명의 하나의 예에서, 전술한 프로세서(110) 내지 회귀분석 모듈(230)은, 예를 들어 기계 학습(machine learning) 기술을 이용하여 단일 내지 다중 회귀분석식을 사용하여 생성한 모형화기간에 대한 예측데이터를 비교할 수 있고, 비교한 결과에 기초하여 예측 모형별 적합도를 산출할 수도 있고, 시계열 데이터의 예측을 위한 방법에 사용하는 예비모형, 검증결정 모형 내지 최종 예측모형을 결정할 수 있다. 여기서 기계 학습은 인공지능(artificial intelligence)의 한 분야로서, 전자 장치가 학습 모형을 기반으로 데이터를 분석 및 학습하고, 분석 및 학습한 결과에 기초하여 분석 및 학습 성능을 향상시킬 수 있는 시스템 및 이를 위한 알고리즘을 연구 및 구축하는 기술을 의미할 수 있다. 또한, 기계 학습은, 인간의 뇌신경 세포와 그 결합 구조를 모방한 전자 회로망 구조인 신경망(neural network)과, 다층구조 형태의 신경망을 기반으로 대용량의 데이터에서 핵심적인 내용 또는 기능을 요약하는 알고리즘의 집합인 딥 러닝(deep learning) 기술을 포함할 수 있다.
제1 사건의 예측결과 데이터 산출
계속하여, 적어도 하나의 프로세서(110)에 의한 제1 사건 예측결과 데이터의 산출을 살펴본다(S350 참조). 전술한 프로세서(110)는, 제1 사건에 관한 결과데이터 값이 없는 검증기간 이후 예측기간에 대하여, 시계열 분석데이터에 포함된 제1 변수후보 데이터의 획득방식과 동일하게 예측기간의 1 분석시점 단위로 제2 회귀분석식의 최종 독립변수에 관한 데이터를 산출하고 산출된 독립변수를 제2 회귀분석식에 대입하여 시점별 예측데이터를 산출한다(S351 참조). 예컨대, 도 2a 및/또는 2b의 예측 산출모듈(240)에서 예측기간의 1 분석시점 단위로 제2 회귀분석식의 최종 독립변수에 관한 데이터를 산출하고, 예측 산출모듈(240)에서 산출된 독립변수를 제2 회귀분석식에 대입하여 시점별 예측데이터를 산출할 수 있다. 또한, 프로세서(110) 내지 예측 산출모듈(240)은 1 분석시점 단위의 산출 과정을 누적하며 예측기간 전체에 반복하여 예측기간 전체에 대한 제1 사건의 예측결과 데이터를 산출한다(S353 참조). 예컨대, 예측 산출모듈(240)이 생략된 경우 변수 생성모듈(220)에서 분석시점 단위로 독립변수에 관한 데이터를 산출하고 회귀분석 모듈(230)에서 시점별 예측데이터를 산출할 수도 있다.
예컨대 이때, 제2 회귀분석식의 종속변수가 제1 사건에 관한 제1 결과데이터 내지 제1 보정값 데이터일 수 있다.
예컨대, 전술한 프로세서(110) 내지 예컨대 예측 산출모듈(240)은 시점별 예측데이터의 역보정을 통해 제1 사건에 관한 제1 결과데이터의 예측에 상응하는 예측결과 데이터를 산출할 수 있다. 예를 들면, 제2 회귀분석식의 종속변수 함목이 제1 사건에 관한 제1 보정값 데이터에 관한 것인 경우 예측을 원하는 제1 사건에 관한 데이터는 종속변수인 시점별 예측데이터인 제1 보정값 데이터에 대한 역보정을 통해 제1 사건에 대한 결과데이터를 추정 내지 예측할 수 있다. 예컨대, 예측 산출모듈(240)이 생략된 경우 변수 생성모듈(220)에서 역보정을 수행할 수도 있다.
다음으로, 본 발명의 또 하나의 예에 따른 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치를 더 살펴본다.
도 2b는 본 발명의 또 하나의 실시 예에 따른 전자 장치를 개략적으로 도시한 블록도이다. 도 17a 및 17b는 예컨대 도 2b에 따른 전자 장치에서 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 하나의 방법을 순서도로 나타내고 있다. 또한, 도 17c는 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법 중 일부 과정의 순서도를 나타내고 있다.
본 발명의 또 하나의 예에 따른 전자 장치에서, 전술한 프로세서(110)는 제2 사건후보에 관한 데이터 항목을 결정하고, 상관분석을 통해 제2 사건후보 중 적어도 하나를 상관변수 사건으로 결정하거나 상관변수 부존재로 결정하고, 적어도 하나의 상관변수 사건이 결정된 경우 하나의 상관변수 사건인 제2 사건에 관한 제3 회귀분석식을 결정하는 방식으로 각 상관변수 사건 별로 회귀분석식을 결정하고, 예측기간에 대한 제2 사건에 관한 예측 데이터를 각 상관변수 사건별로 산출할 수 있다.
예컨대 이때, 전술한 프로세서(110)는 적어도 하나의 상관변수 사건이 결정된 경우 제1 사건 독립변수 후보가 되는 제1 사건에 관한 제1 변수후보 데이터들에 제2 사건에 관한 결과데이터 및 제2 산출 데이터를 포함시킬 수 있다. 나아가, 예컨대 프로세서(110)는 제2 회귀분석식의 독립변수의 적어도 하나로 제2 사건에 관한 예측 데이터 항목을 포함시킬 수 있다. 제2 회귀분석식의 결정에 대해서는 전술한 바를 참조하기로 한다.
제2 사건후보 결정
예컨대, 전술한 프로세서(110)는 제2 사건후보에 관한 데이터 항목을 결정한다. 구체적으로 살펴보면, 하나의 예에서, 전술한 프로세서(110)는, 2 이상의 사건에 관한 결과데이터를 포함하는 읽어들인 사건 시계열 데이터에 포함된 결과데이터 중 제1 사건에 관한 제1 결과데이터의 항목과 제1 결과데이터에 영향을 미치는 것으로 추정 판단되는 적어도 하나 이상의 제2 사건후보에 관한 데이터 항목을 결정할 수 있다(S1801 참조).
예컨대, 제2 사건후보에 관한 데이터 항목의 결정은 입력 내지 입력된 선택 내지 프로그램된 설정에 의해 이루어질 수 있고, 또는 프로세서(110)의 인공지능 학습에 의해 결정될 수 있다. 예컨대, 도시되지 않았으나, 프로그램된 설정에 의해 또는 인공지능 학습에 의해 제2 사건후보에 관한 데이터 항목의 결정이 이루어지는 경우 사건후보 결정모듈(도시되지 않음)에 의해 수행될 수 있다.
예를 들면, 제1 사건이 감염병 발병횟수에 관한 것이고 제2 사건후보는 온도, 습도, 강수량 등일 수 있고, 이에 한정되지 않는다.
상관변수에 관한 결정
전술한 프로세서(110) 내지 예컨대 도 2b의 상관분석 모듈(250)은 상관분석을 통해 제2 사건후보 중 적어도 하나를 상관변수인 제2 사건으로 결정하거나 상관변수 부존재로 결정한다.
구체적으로 살펴보면, 하나의 예에서, 전술한 프로세서(110) 내지 상관분석 모듈(250)은, 적어도 모형화기간을 포함한 기간에 대하여, 사건 시계열 데이터에 포함되는 제2 사건후보에 관한 적어도 하나 이상의 후보 결과데이터 내지 후보 결과데이터를 보정한 보정값 후보데이터와 제1 사건에 관한 제1 결과데이터 내지 제1 보정값 데이터를 두 변수로 삼아 상관분석을 수행할 수 있다. 이때, 프로세서(110)는 상관분석 결과에 따라 적어도 하나 이상의 제2 사건후보 중 적어도 하나를 상관변수 사건으로 결정하거나 상관변수 부존재로 결정할 수 있다(S1805 참조).
예컨대, 상관변수에 관한 결정은 제1 변수후보 데이터를 포함하는 시계열 분석데이터의 획득 이전에 이루어지거나 또는 시계열 분석데이터의 획득 과정과 별개 과정에서 수행될 수 있다.
예컨대, 상관분석의 방법은 공지된 다양한 방법으로 수행될 수 있고, 본 발명에서 상관분석의 방법 자체에 대한 권리를 획득하고자 하는 것이 아니고 상관분석을 통해 상관변수 사건을 결정하는 것을 하나의 구성으로 삼는 것이므로 상관분석의 방법 자체에 대한 구체적인 설명은 생략하기로 한다.
제2 사건에 관한 제3 회귀분석식 결정
또한, 전술한 프로세서(110)는 적어도 하나의 상관변수 사건이 결정된 후 하나의 상관변수 사건인 제2 사건에 관한 제3 회귀분석식을 결정하며 각 상관변수 사건 별로 회귀분석식을 결정한다. 구체적으로 살펴보면, 하나의 예에서, 전술한 프로세서(110) 내지 예컨대 회귀분석 모듈(240)은 적어도 하나의 상관변수 사건이 결정된 경우, 하나의 상관변수 사건인 제2 사건에 관한 제2 결과데이터로부터 산출된 하나 이상의 제2 산출 데이터 중 적어도 하나를 제2사건 독립변수 후보로 하는 제3 회귀분석을 수행하여 제2 사건에 관한 예측을 위한 제3 회귀분석식을 결정하는 방식으로 각 상관변수 사건 별로 각 사건에 관한 예측을 위한 회귀분석식을 결정할 수 있다(S1820, S1820' 참조). 예컨대, 제3 회귀분석은 제1 기간에 대하여 수행될 수 있다.
예컨대, 제3 회귀분석식은 단일 내지 다중 회귀분석식일 수 있다. 예컨대, 제3 회귀분석식으로 결정되는 다중 회귀분석식은 동시 입력 추정 방법, 단계적 추정 방법, 후진(backward) 추정 방법 등을 사용하여 산출할 수 있다.
예컨대, 하나의 예에서, 제3 회귀분석을 수행하는 자료가 되는 시계열 분석데이터에는 제2 사건 각각에 관한 제2 결과데이터 및 제2 산출 데이터가 포함될 수 있다. 제2 결과데이터 및 제2 산출 데이터는 제2 사건에 관한 제2 변수후보 데이터일 수 있다. 예컨대, 제2 산출 데이터는 프로세서(110) 내지 변수 생성모듈(220)에 의해 산출될 수 있다.
예컨대, 이때, 제2 산출 데이터 각각은 제2 결과데이터에 대한 제2 보정값 데이터 및 적어도 하나의 제2 예상값 데이터 중 어느 하나 이상의 데이터를 포함할 수 있다. 예컨대, 제2 결과데이터 및 제2 보정값 데이터는 제2 사건후보의 후보 결과데이터 및 보정값 후보데이터 중 상관변수로 결정된 제2 사건 각각에 관한 후보 결과데이터 및 보정값 후보데이터이다. 예컨대, 제2 사건 각각에 관한 제2 예상값 데이터 각각은 상관변수 결정 후 산출되거나 또는 실시예에 따라 사전에 제1 사건에 관한 제1 예상값 데이터 산출과 병행하여 제2 사건후보에 관한 제2 후보예상값 데이터가 산출되고 상관변수 결정 후 그 중 제2 사건에 관한 제2 예상값 데이터가 결정될 수도 있다. 하나의 예에서, 제2 사건에 관한 제2 예상값 데이터는 상관변수 결정 후 산출될 수 있다. 예컨대, 만일, 상관변수 결정을 위한 상관분석이 제2 사건후보의 후보결과 데이터와 제1 사건에 관한 제1 결과데이터 간에 수행되는 경우, 제2 사건에 관한 보정값 데이터도 제2 예상값 데이터의 산출과 마찬가지로 상관변수 결정 후 산출되거나 또는 사전에 제1 사건에 관한 제1 보정값 데이터의 산출과 병행하여 산출되는 제2 사건후보의 제2 보정값 후보데이터 중에서 결정될 수도 있다.
예컨대, 제2 사건 각각에 관한 제2 예상값 데이터 각각은 적어도 제1 기간에 대한 제2 사건에 관한 사건 시계열 데이터를 기반으로 적어도 모형화기간에 대하여 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점에 대한 적어도 하나의 제2 예상 값의 그룹일 수 있다. 제2 사건에 관한 제2 예상값 데이터의 산출에 관해서는 전술한 제1 사건에 관한 제1 예상값 데이터의 산출방식과 실질적으로 동일하게 이루어질 수 있다. 따라서 전술한 바를 참조하기로 한다.
각 상관변수 사건 별로 각 사건에 관한 예측을 위한 회귀분석식 결정에 대해 구체적으로 살펴본다. 이때, 전술한 프로세서(110) 내지 예컨대 회귀분석 모듈(230), 또는 회귀분석 모듈(230)과 예측 산출모듈(240)은 각 상관변수 사건 별로 예비 회귀분석식의 예비결정, 회귀분석모형 결정 및 회귀분석식 결정을 수행할 수 있다(S1820' 및/또는 S1821 내지 S1825 참조).
예컨대, 전술한 프로세서(110) 내지 예컨대 회귀분석 모듈(230)은, 적어도 하나의 상관변수 사건이 결정된 경우, 적어도 모형화기간에 대하여 하나의 상관변수 사건인 제2 사건의 제2 산출 데이터의 적어도 하나의 데이터 항목을 제2사건 독립변수 후보로 하는 제3 예비 회귀분석을 수행하여 적어도 모형화기간에 대한 2 이상의 제3 예비 회귀분석식들을 예비결정하는 방식으로 각 상관변수 사건 별로 회귀분석식을 예비결정할 수 있다(S1821 참조). 예컨대, 제3 예비 회귀분석식들의 예비결정은 전술한 제1 사건에 관한 제1 회귀분석식의 예비결정 과정과 실질적으로 동일한 방식으로 이루어질 수 있고, 이에 따라 전술한 바를 참조하기로 한다.
또한, 프로세서(110) 내지 예컨대 예측 산출모듈(240)은, 모형화기간 이후의 적어도 검증기간을 포함한 기간, 예컨대 검증기간에 대하여 1 분석시점 단위로 모형화기간에 대한 제2 산출 데이터의 획득방식과 동일하게 제3 예비 회귀분석식들의 독립변수에 관한 제2 산출 데이터의 데이터를 산출하고, 산출된 독립변수에 관한 제2 산출 데이터의 데이터를 제3 예비 회귀분석식들에 대입하여 제2 사건에 관한 시점별 제2사건 검증데이터를 산출하고(S1823a 참조), 1 분석시점 단위의 산출 과정을 누적하며 검증기간 전체에 대해 반복하여 제2 사건에 관한 검증기간 전체의 제2사건 검증데이터들을 산출할 수 있다(S1823b 참조). 예컨대, 제3 예비 회귀분석식들의 독립변수에 관한 제2 산출 데이터의 산출, 시점별 제2사건 검증데이터의 산출 및 제2 사건 검증데이터들의 산출은 전술한 제1 사건에 관한 예비결정된 제1 회귀분석식의 독립변수에 관한 제1 산출 데이터의 산출, 제1 사건에 관한 시점별 검증 예측데이터의 산출 및 제1 사건에 관한 제1 검증 예측데이터들의 산출 각각의 과정과 실질적으로 동일한 방식으로 진행될 수 있다. 따라서, 전술한 바를 참조하기로 한다.
게다가, 프로세서(110) 내지 예컨대 회귀분석 모듈(230)은 적어도 검증기간을 포함한 기간에 대해 산출된 제2사건 검증데이터들과 적어도 검증기간을 포함한 기간에 대한 제2 사건의 제2사건 비교데이터들을 비교하고, 비교 결과 적합도에 따라 제2사건 회귀분석모형을 정할 수 있다(S1823c 참조). 이와 같은 방식으로 각 상관변수 사건 별로 회귀분석모형을 정할 수 있다. 예컨대 이때, 제2사건 회귀분석모형의 결정은 전술한 제1 사건에 관한 회귀분석모형의 결정과 실질적으로 동일한 방식으로 진행될 수 있고, 이에 따라 전술한 바를 참조하기로 한다.
또한, 프로세서(110) 내지 회귀분석 모듈(230)은 결정된 제2 사건 회귀분석모형을 토대로 제1 기간에 대한 제2 사건에 관한 시계열 분석데이터로부터 제3 회귀분석을 수행하여 제2 사건에 관한 예측을 위한 제3 회귀분석식을 결정할 수 있다(S1825 참조). 프로세서(110)는 이와 같은 방식으로 각 상관변수 사건 별로 각 사건에 관한 예측을 위한 회귀분석식을 결정할 수 있다. 예컨대, 제3 회귀분석식의 결정은 전술한 제1 사건에 관한 제2 회귀분석식의 결정과 실질적으로 동일한 방식으로 진행될 수 있고, 이에 따라 전술한 바를 참조하기로 한다.
예측기간에 대한 제2 사건에 관한 데이터 산출
게다가, 전술한 프로세서(110)는 적어도 하나의 상관변수 사건이 결정된 경우 예측기간에 대한 상관변수 사건인 제2 사건 각각에 관한 예측 데이터를 산출한다. 구체적으로, 하나의 예에서, 프로세서(110)는, 적어도 하나의 상관변수 사건이 결정된 경우 제2 사건에 관한 결과데이터 값이 없는 예측기간에 대하여, 제2 산출 데이터에서의 제3 회귀분석식의 독립변수와 동일한 데이터 항목 산출방식과 동일하게 1 분석시점 단위로 각 분석시점에 대해 제3 회귀분석식의 최종 독립변수에 관한 값 데이터를 산출하고 산출결과를 제3 회귀분석식에 대입하여 시점별 상관변수 예측데이터를 산출한다. 예컨대 예측 산출모듈(240)은 1 분석시점 단위로 각 분석시점에 대해 제3 회귀분석식의 최종 독립변수에 관한 값 데이터를 산출하고, 예측 산출모듈(240)은 산출결과를 제3 회귀분석식에 대입하여 시점별 상관변수 예측데이터를 산출할 수 있다. 또한, 프로세서(110) 내지 예측 산출모듈(240)은 1 분석시점 단위의 산출 과정을 누적하며 예측기간 전체에 대해 반복하여 예측기간 전체에 대한 제2 사건에 관한 예측상관변수 데이터를 산출할 수 있다(S1840 참조). 프로세서(110)는 이와 같은 방식으로 각 상관변수 사건 별로 예측상관변수 데이터를 산출할 수 있다.
예컨대, 제3 회귀분석식의 최종 독립변수의 값 데이터 산출, 시점별 상관변수 예측데이터 산출 및 제2 사건에 관한 예측상관변수 데이터 산출은 전술한 제1 사건에 관한 제2 회귀분석식의 최종 독립변수의 값 데이터 산출, 제1 사건에 관한 시점별 예측데이터의 산출 및 제1 사건에 관한 예측결과 데이터의 산출 각각의 과정과 실질적으로 동일한 방식으로 진행될 수 있고, 이에 따라 전술한 바를 참조하기로 한다.
제2 사건에 영향을 받는 제1 사건의 결과예측
전술한 프로세서(110)는 적어도 하나의 상관변수 사건이 결정된 경우 상관변수로 결정된 제2 사건 각각이 제1 사건과 상관관계에 있으므로, 제1 사건에 관한 회귀분석을 위한 자료로 사용되는 시계열 분석데이터에 포함되는 제1 사건에 관한 제1 변수후보 데이터들에 제2 사건 각각에 관한 제2 결과데이터 및 제2 산출 데이터를 더 포함시킬 수 있다. 예컨대, 프로세서(110)는 제2 사건 각각에 관한 제2 변수후보 데이터 중, 예컨대 제2 결과데이터 및 제2 산출 데이터들 중 적어도 하나의 데이터 항목을 제1 사건 독립변수 후보에 포함시킬 수 있다(S1810 참조).
예컨대, 제2 사건 각각에 관한 제2 결과데이터 및 제2 산출 데이터를 더 포함하는 제1 사건에 관한 제1 변수후보 데이터들에 대하여, 적어도 모형화기간에 대한 제1 회귀분석을 수행하여 2 이상의 제1 회귀분석식을 예비결정할 수 있다(S1831 참조). 예컨대, 적어도 하나의 상관변수 사건이 결정되는 경우, 프로세서(110)는 제1 회귀분석식들을 예비결정하기 위한 독립변수 후보에 제2 사건 관련 제2 변수후보 데이터 중, 예컨대 제2 결과데이터 내지 제2 산출 데이터 중 적어도 하나 이상의 테이터 항목을 포함시킬 수 있다. 예컨대, 하나의 예에서, 전술한 제1 회귀분석식들을 예비결정하기 위한 독립변수 후보는 제1 사건에 관련된 적어도 하나 이상의 데이터 항목 및/또는 제2 사건 관련된 적어도 하나 이상의 데이터 항목들을 포함할 수 있다.
또한, 프로세서(110)는 제2 사건 각각에 관한 제2 결과데이터 및 제2 산출 데이터를 더 포함하는 제1 변수후보 데이터들로부터 예비결정된 제1 회귀분석식들을 적어도 검증기간을 포함한 기간에 대하여 검증하여 회귀분석모형을 정할 수 있다(S1833 참조). 게다가, 프로세서(110)는 제2 사건 각각에 관한 제2 결과데이터 및 제2 산출 데이터를 더 포함하는 제1 사건에 관한 제1 변수후보 데이터들에 대하여, 회귀분석모형을 토대로 제2 회귀분석을 수행하여 제1 기간의 제1 사건에 관한 예측용 제2 회귀분석식을 결정할 수 있다(S1835 참조).
예컨대 하나의 예에서, 전술한 프로세서(110)는, 적어도 하나의 상관변수 사건이 결정되고 결정된 제2 회귀분석식의 최종 독립변수에 제2 사건 관련된 적어도 하나 이상의 데이터 항목이 포함되는 경우, 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수가 예측상관변수 데이터의 산출과정에서 이미 산출된 경우 해당 값을 읽어들이고 산출되지 않은 경우 예측상관변수 데이터의 산출과정에서 산출된 값으로부터 제2 산출 데이터에서의 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수와 동일한 데이터 항목 산출과 동일하게 산출할 수 있다(S1851 참조). 예컨대, 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수가 제2 사건에 관한 예측상관변수 데이터이거나 제3 회귀분석식의 최종 독립변수에 관한 값 데이터인 경우 이미 예측상관변수 데이터의 산출과정에서 산출되었으므로 해당 값을 읽어들여 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수로 삼을 수 있다. 또한, 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수가 제2 사건에 관한 예측상관변수 데이터 내지 제3 회귀분석식의 최종 독립변수에 관한 값 데이터로부터 보정된 제2 보정값 데이터이거나 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점의 제2 예상값 데이터 등인 경우 예측상관변수 데이터의 산출과정에서 산출되지 않았으므로, 예측상관변수 데이터의 산출과정에서 산출된 값으로부터 제2 산출 데이터에서의 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수와 동일한 데이터 항목 산출과 동일하게 산출할 수 있다.
[시계열 데이터 예측 방법]
다음으로, 본 발명의 다른 모습의 하나의 예에 따라, 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법을 살펴본다. 이때, 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법은 적어도 하나의 프로세서(110)를 포함하는 전자 장치의 프로세서(110)에서 수행된다. 예컨대, 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법은 도 2a 및/또는 2b에 도시된 각 모듈들에서 통합되어 수행된다. 본 발명의 하나의 예에 따른 시계열 데이터 예측 방법에 대한 이해를 돕기 위해 전술한 발명의 실시예에 따른 전자 장치들과 도면들이 참조될 수 있고, 이 경우 중복되는 설명은 생략될 수 있고 설명이 부족하거나 생략된 부분에 대해서는 전술한 전자 장치 발명의 실시예들을 참조하기로 한다.
도 3a 내지 3b 각각은 본 발명의 하나의 예에 따른 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법을 개략적으로 나타내는 순서도이다. 도 17a 및 17b는 본 발명의 또 하나의 예에 따른 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법을 개략적으로 나타내는 순서도이고, 도 17c는 도 17a 및 17b에 따른 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법의 일부과정을 개략적으로 나타내는 순서도이다.
본 발명의 하나의 예에 따른 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법은 데이터 산출단계(S310, S1810), 회귀식 결정단계(S330, S330', S330", S1830) 및 데이터 예측단계(S350, S1850)를 포함하여 제1 사건에 관한 시계열 데이터 예측을 수행한다. 또한, 본 발명의 또 하나의 예에 따르면 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법은 사건항목 사전결정단계, 상관변수 결정단계, 제2사건 분석식 결정단계 및 예측상관변수 산출단계를 더 포함할 수 있다. 이하에서 구체적으로 살펴본다. 후술되는 각 단계별 구체적인 설명은 전술한 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치의 실시예들의 설명과 중복될 수 있고, 따라서 후술되는 각 단계의 설명이 누락된 부분은 전술한 실시예들에서 프로세서(110)에 의한 시계열 분석데이터 획득, 제2 회귀분석식 결정, 제1 사건의 예측결과 데이터 산출, 제2 사건후보 결정, 상관변수에 관한 결정, 제2 사건에 관한 제3 회귀분석식 결정, 예측기간에 대한 제2 사건에 관한 데이터 산출, 제2 사건에 영향을 받는 제1 사건의 결과예측 등에 관한 설명을 참조하기로 한다.
데이터 산출단계(S310, S1810)
데이터 산출단계(S310, S1810)에서는, 전술한 전자 장치의 전술한 프로세서(110)에서, 모형화기간 및 검증기간을 포함하는 적어도 제1 기간에 대한 적어도 제1 사건에 관한 제1 결과데이터를 포함하는 읽어들인 사건 시계열 데이터를 기반으로 적어도 모형화기간에 대하여 제1 결과데이터에 대한 제1 보정값 데이터 및 적어도 하나의 제1 예상값 데이터 중 어느 하나 이상의 데이터를 제1 산출 데이터로 산출한다. 이때, 적어도 하나의 제1 예상값 데이터는 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점에 대한 적어도 하나의 제1 예상 값의 그룹이다. 또한, 데이터 산출단계(S310, S1810)에서는, 전술한 프로세서(110)에서, 제1 결과데이터 및 제1 산출 데이터를 포함한 제1 사건에 관한 제1 변수후보 데이터가 포함된 시계열 분석데이터를 획득한다.
예컨대, 제1 결과데이터를 보정한 데이터 값은 제1 결과데이터의 값들간의 차이를 줄이는 방식으로 얻을 수 있다. 예컨대, 제1 보정값 데이터는 제1 결과데이터의 값을 진폭 조정법에 따라 보정한 데이터일 수 있고, 그에 한정되지 않는다.
예컨대, 하나의 예에서, 제1 변수후보 데이터들에 포함되는 제1 산출 데이터는 제1 보정값 데이터 및 적어도 하나의 제1 예상값 데이터를 포함할 수 있다.
예컨대, 하나의 예에서, 데이터 산출단계(S310, S1810)에서의 각 분석시점에 대한 제1 예상 값 각각은 각 분석시점 대비 -1 분석시점과 각 분석시점 사이의 시점간 변화도, 각 분석시점의 소속집단에서의 데이터의 백분율값, 백분위 또는 편차, 각 분석시점의 추정기준으로부터의 이격도 중 어느 하나를 기초로 하여 산출될 수 있다. 또는, 데이터 산출단계(S310, S1810)에서의 각 분석시점에 대한 제1 예상 값 각각은 각 분석시점과 주기적 동일시점 또는 각 분석시점의 소속구간에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화도 내지 이격도에 따라 산출되는 각 분석시점의 등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화도 내지 이격도에 따라 산출되는 -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 등급 시점에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값을 포함하는 데이터 그룹 중 어느 하나 자체이거나 데이터 그룹 중 어느 하나를 기초로 하여 산출될 수 있다.
예컨대, 시점간 변화도 및 이격도를 산출하기 위한 각 분석시점 및 추정기준의 값 각각은 제1 결과데이터 내지 제1 보정값 데이터의 값일 수 있다. 예컨대, 데이터의 백분율값, 백분위 또는 편차는 제1 결과데이터, 제1 보정값 데이터, 이격도 또는 그들 중 어느 하나의 증감율에 관련된 값일 수 있다. 예컨대, 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값은 자체가 제1 예상 값인 경우 제1 결과데이터 내지 제1 보정값 데이터의 값이고 자체가 제1 예상 값 산출의 기초인 경우에는 제1 결과데이터, 제1 보정값 데이터, 이격도 중 어느 하나의 증감율, 백분율 내지 백분위에 관한 값일 수 있다.
예컨대, 시점간 변화도는 차이값 내지 증감율값일 수 있다.
예컨대, 하나의 예에서, 후술되는 회귀식 결정단계(S330, S330', S330", S1830)에서 모형화기간에 대한 시계열 분석데이터로부터 시계열 순번을 독립변수로 삼아 단순추세 선형회귀식을 산출하고 단순추세 선형회귀식에 시계열 순번을 대입하여 산출되는 추세 데이터를 데이터 산출단계(S310, S1810)로 피드백하고 피드백된 추세 데이터를 추정기준으로 삼아 각 분석시점의 추정기준으로부터의 이격도가 산출될 수 있다.
보다 구체적인 설명은 전술한 전자 장치의 실시예들에 관한 설명 중 시계열 분석데이터 획득에 관한 부분을 참조하기로 한다.
회귀식 결정단계(S330, S330', S330", S1830)
회귀식 결정단계(S330, S330', S330", S1830)에서는, 전술한 프로세서(110)에서, 적어도 모형화기간에 대하여 시계열 분석데이터의 제1 변수후보 데이터의 적어도 하나의 데이터 항목을 제1사건 독립변수 후보로 하는 제1 회귀분석을 수행하여 2 이상의 제1 회귀분석식들을 예비결정한다(S331, S1831). 또한, 회귀식 결정단계(S330, S330', S330", S1830)에서는, 전술한 프로세서(110)에서, 제1 기간 중 적어도 검증기간을 포함한 기간에 대하여 제1 회귀분석식들을 검증하고(S333, S333', S333", S1833), 검증결과를 토대로 제1 기간의 제1 사건에 관한 예측용 제2 회귀분석식을 결정한다(S335, S335', S335a, S335b, S1835). 예컨대, 회귀식 결정단계(S330', S330")에서는, 전술한 프로세서(110)에서, 적어도 검증기간을 포함한 기간에 대하여 제1 회귀분석식들을 검증하여 회귀분석모형을 정하고(S333', S333"), 검증결과 정해진 회귀분석모형을 토대로 제1 기간에 대한 제2 회귀분석을 수행하여 제2 회귀분석식을 결정할 수 있다(S335, S335', S335a, S335b).
예컨대, 제1 및 제2 회귀분석식 각각은 단일 내지 다중 회귀분석식일 수 있다.
예컨대, 제1 및 제2 회귀분석식의 종속변수 항목은 제1 사건에 관한 제1 변수후보 데이터들에 포함된 제1 결과데이터 내지 제1 보정값 데이터에 관한 것일 수 있다.
예컨대, 하나의 예에서, 제1 및 제2 회귀분석식의 각 독립변수의 항은 선형항 내지 비선형항일 수 있다. 예컨대, 비선형항은 제곱항, 제곱근항, 로그항, 지수항 중의 적어도 하나일 수 있다.
하나의 예에서, 전술한 회귀식 결정단계(S330, S330', S330", S1830)에서 독립변수와 종속변수 사이의 상관관계를 나타내는 상관계수, 상관계수의 제곱값인 결정계수, 수정된 결정계수, 더빈-왓슨비, 베타 표준화계수, 유의확률, 공선성 통계량 중 적어도 하나 이상을 고려하여 회귀분석을 수행할 수 있다. 예컨대, 회귀분석 수행방법은 이미 많이 공지되어 있고 공지된 다양한 방법들이 본 발명에 적용될 수 있고, 다양한 회귀분석 방법 자체의 내용에 대해서는 구체적인 설명은 생략될 수 있다.
예컨대 하나의 예에서, 회귀식 결정단계(S330', S330")에서는, 전술한 프로세서(110)에서, 적어도 검증기간을 포함한 기간에 대하여 예비결정된 제1 회귀분석식들의 독립변수에 관한 제1 변수후보 데이터의 데이터 항목을 제1 회귀분석식들에 대입하여 제1 사건에 대한 제1 검증 예측데이터들을 산출하고 제1 검증 예측데이터들과 검증기간에 대한 제1사건 비교데이터를 비교하여 회귀분석모형을 정할 수 있다. 게다가, 전술한 프로세서(110)에서, 회귀분석모형을 토대로 제1 기간에 대한 시계열 분석데이터로부터 제2 회귀분석을 수행하여 제1 사건에 관한 예측용 제2 회귀분석식을 결정할 수 있다.
예컨대, 회귀분석모형을 정하기 위한 제1사건 비교데이터는 제1 사건에 관한 제1 변수후보 데이터들에 포함된 제1 보정값 데이터일 수 있다.
예컨대, 도 3b 및/또는 3c를 참조하면 하나의 예에서, 회귀식 결정단계(S330', S330")는 예비결정단계(S331), 모형 결정단계(S333', S333") 및 회귀분석식 결정단계(S335, S335', S335a, S335b)를 포함할 수 있다.
예비결정단계(S331)에서는, 전술한 프로세서(110)에서, 적어도 모형화기간에 대하여, 시계열 분석데이터의 제1 변수후보 데이터의 적어도 하나의 데이터 항목을 제1사건 독립변수 후보로 하는 제1 회귀분석을 수행하여 제1 사건에 관한 적어도 2 이상의 분석모형에 따른 제1 회귀분석식들을 예비결정한다.
예컨대, 전술한 프로세서(110)에서, 제1 회귀분석을 통해 추세형, 비추세형, 추세형과 비추세형의 혼합형 중 적어도 2 이상의 분석모형에 따른 제1 회귀분석식들을 예비결정하고 그 중 하나를 회귀분석모형으로 결정할 수 있다. 예컨대, 추세형의 회귀분석식은 시점간 변화도, 데이터의 백분율값, 백분위 또는 편차, 이격도 중 어느 하나를 기초로 산출된 제1 예상값 데이터 각각과, 주기적 동일시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 이격도에 따라 산출되는 각 분석시점의 이격도등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 이격도등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 이격도등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 이격도등급에서의 데이터 평균, 중위수, 최빈, 극빈, 최대 또는 최소 값을 포함하는 제1 그룹 중 어느 하나 자체에 관한 제1 예상값 데이터 각각과, 제1 그룹 중 어느 하나를 기초로 산출된 제1 예상값 데이터 각각을 포함하는 그룹에서 어느 하나 이상을 독립변수 항목으로 하고, 비추세형의 회귀분석식은 시점간 변화도 내지 데이터의 백분율값, 백분위 또는 편차를 기초로 산출된 제1 예상값 데이터 각각과, 주기적 동일시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 시점간 변화에 따라 산출되는 각 분석시점의 변동등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 변동등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, -1 분석시점의 변동등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 변동등급 시점에서의 데이터 평균, 중위수, 최빈, 극빈, 최대 또는 최소 값을 포함하는 제2 그룹 중 어느 하나 자체에 관한 제1 예상값 데이터 각각과, 제2 그룹 중 어느 하나를 기초로 산출된 제1 예상값 데이터 각각을 포함하는 그룹에서 어느 하나 이상을 독립변수 항목으로 하고, 혼합형의 회귀분석식은 추세형의 회귀 분석석의 독립변수 항목 중 어느 하나 이상과 비추세형의 회귀분석식의 독립변수 항목 중 어느 하나 이상을 독립변수 항목으로 할 수 있다.
모형 결정단계(S333', S333")에서는, 전술한 프로세서(110)에서, 적어도 검증기간을 포함한 기간, 예컨대 검증기간에 대하여 1 분석시점 단위로 모형화기간에 대한 제1 변수후보 데이터의 획득방식과 동일하게 산출된 제1 회귀분석식들의 독립변수에 관한 제1 변수후보 데이터의 데이터 항목을 제1 회귀분석식들에 대입하여 시점별 검증 예측데이터를 산출하고(S333a) 1 분석시점 단위의 산출 과정을 누적하며 검증기간 전체에 반복하여 제1 사건에 관한 제1 검증 예측데이터들을 산출하고(S333b), 적어도 검증기간을 포함한 기간에 대한 제1 검증 예측데이터들과 적어도 검증기간을 포함한 기간에 대한 제1 회귀분석식들의 종속변수 관련 변수후보 데이터인 제1사건 비교데이터들을 비교하여 회귀분석모형을 정할 수 있다(S333c). 예컨대, 모형 결정단계(S333', S333")의 보다 구체적인 설명은 생략하고 전술한 본 발명의 하나의 예에 따른 전자장치(101, 201, 202)에서 회귀분석모형 결정과정을 참조하여 이해될 수 있다.
다음으로, 회귀분석식 결정단계(S330', S330")에서는, 전술한 프로세서(110)에서, 회귀분석모형을 토대로 제1 기간에 대한 시계열 분석데이터로부터 제2 회귀분석을 수행하여 제1 사건에 관한 제2 회귀분석식을 결정할 수 있다(S335, S335', S335a, S335b).
예컨대, 하나의 예에서, 전술한 회귀분석식 결정단계(S330, S330', S330")에서는, 전술한 프로세서(110)에서, 결정된 회귀분석모형에 따른 회귀식의 독립변수에 기초하여 제1 기간에 대한 회귀분석을 수행하며 결정되는 회귀계수에 따른 제2 회귀분석식을 결정하거나(S335a), 회귀분석모형에 따른 회귀식의 독립변수에 기초하여 수행한 제1 기간에 대한 회귀분석에 따라 독립변수 일부 제거 및 새로운 독립변수 추가 중 어느 하나 이상을 수행하며 제1 기간에 대한 새로운 독립변수와 회귀계수를 정하여 제2 회귀분석식을 결정할 수 있다(S335b).
보다 구체적인 설명은 전술한 전자 장치의 실시예들에 관한 설명 중 제2 회귀분석식 결정에 관한 부분을 참조하기로 한다.
데이터 예측단계(S350, S1850)
다음으로, 데이터 예측단계(S350, S1850)에서는, 전술한 프로세서(110)에서, 제1 사건에 관한 결과데이터 값이 없는 검증기간 이후 예측기간에 대하여, 전술한 데이터 산출단계(S310, S1810)에서의 제1 변수후보 데이터의 획득방식과 동일하게 예측기간의 1 분석시점 단위로 제2 회귀분석식의 최종 독립변수에 관한 데이터를 산출하고 산출된 독립변수를 제2 회귀분석식에 대입하여 시점별 예측데이터를 산출하고(S351, S1851) 1 분석시점 단위의 산출 과정을 누적하며 예측기간 전체에 반복하여 예측기간에 대한 제1 사건의 예측결과 데이터를 산출한다(S353, S1853).
예컨대, 제2 회귀분석식의 종속변수 항목은 제1 사건에 관한 제1 결과데이터 내지 제1 보정값 데이터에 관한 것일 수 있다.
예컨대, 하나의 예에서, 제2 회귀분석식의 종속변수 항목이 제1 사건에 관한 제1 보정값 데이터에 관한 것인 경우, 예측결과 데이터는 시점별 예측데이터로부터 역보정을 통해 산출되며 제1 사건에 관한 제1 결과데이터의 예측에 상응할 수 있다.
보다 구체적인 설명은 전술한 전자 장치의 실시예들에 관한 설명 중 제1 사건의 예측결과 데이터 산출에 관한 부분을 참조하기로 한다.
다음으로, 도 17a 17b 및 17c를 참조하면 본 발명의 또 하나의 예에 따른 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법을 살펴본다. 이때, 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법은 사건항목 사전결정단계(S1801), 상관변수 결정단계(S1805) 및 제2사건 분석식 결정단계(S1820, S1820')를 더 포함할 수 있다. 또한 하나의 예에 따른 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법은 예측상관변수 산출단계(S1840)를 더 포함할 수 있다. 이하에서, 사건항목 사전결정단계(S1801), 상관변수 결정단계(S1805), 제2사건 분석식 결정단계(S1820, S1820') 및 예측상관변수 산출단계(S1840) 순으로 살펴본다. 그리고, 하나의 예에서, 제2 사건에 영향받는 제1 사건의 결과예측 과정을 살펴본다.
사건항목 사전결정단계(S1801)
하나의 예에서, 사건항목 사전결정단계(S1801)에서는, 전술한 프로세서(110)에서, 전술한 데이터 산출단계(S1810) 이전에, 2 이상의 사건에 관한 결과데이터를 포함하는 읽어들인 사건 시계열 데이터에 포함된 결과데이터 중 제1 사건에 관한 제1 결과데이터의 항목과 제1 결과데이터에 영향을 미치는 것으로 추정 판단되는 적어도 하나 이상의 제2 사건후보에 관한 데이터 항목을 결정할 수 있다.
보다 구체적인 설명은 전술한 전자 장치의 실시예들에 관한 설명 중 제2 사건후보 결정에 관한 부분을 참조하기로 한다.
상관변수 결정단계(S1805)
하나의 예에서, 상관변수 결정단계(S1805)에서는, 전술한 프로세서(110)에서, 적어도 모형화기간을 포함한 기간에 대하여, 사건 시계열 데이터에 포함되는 제2 사건후보에 관한 적어도 하나 이상의 후보 결과데이터 내지 후보 결과데이터를 보정한 보정값 후보데이터와 제1 사건에 관한 제1 결과데이터 내지 제1 보정값 데이터를 두 변수로 삼아 상관분석을 수행하고, 상관분석 결과에 따라 적어도 하나 이상의 제2 사건후보 중 적어도 하나를 상관변수 사건으로 결정하거나 상관변수 부존재로 결정할 수 있다.
예컨대, 상관변수 결정단계(S1805)는 데이터 산출단계(S1810)에서의 제1 변수후보 데이터를 포함하는 시계열 분석데이터의 획득 이전에 이루어지거나 또는 데이터 산출단계(S1810)에서의 시계열 분석데이터의 획득 과정과 별개 과정에서 수행될 수 있다.
예컨대, 상관분석 수행에서 보정값 후보데이터 또는/및 제1 보정값 데이터가 변수로 사용되는 경우 해당 값 각각은 데이터 산출단계(S1810)에서 얻어지는 것일 수 있다. 이때, 상관변수 결정단계(S1805)에서는 데이터 산출단계(S1810)의 진행과정에서 얻어진 전술한 해당 값을 변수로 사용하는 상관분석이 수행될 수 있다.
제2사건 분석식 결정단계(S1820, S1820')
하나의 예에서, 제2사건 분석식 결정단계(S1820, S1820')에서는, 전술한 프로세서(110)에서, 적어도 하나의 상관변수 사건이 결정된 경우, 하나의 상관변수 사건인 제2 사건에 관한 제2 결과데이터로부터 산출된 하나 이상의 제2 산출 데이터 중 적어도 하나를 제2사건 독립변수 후보로 하는 제3 회귀분석을 수행하여 제2 사건에 관한 예측을 위한 제3 회귀분석식을 결정하는 방식으로 각 상관변수 사건 별로 회귀분석식을 결정할 수 있다. 예컨대, 제3 회귀분석은 제1 기간에 대하여 수행될 수 있다.
예컨대, 제3 회귀분석식은 단일 내지 다중 회귀분석식일 수 있다.
예컨대, 하나의 예에서, 제3 회귀분석을 수행하는 자료가 되는 시계열 분석데이터에는 제2 사건 각각에 관한 제2 결과데이터 및 제2 산출 데이터가 포함될 수 있다. 제2 결과데이터 및 제2 산출 데이터는 제2 사건에 관한 제2 변수후보 데이터일 수 있다. 예컨대, 이때, 제2 산출 데이터 각각은 제2 결과데이터에 대한 제2 보정값 데이터 및 적어도 하나의 제2 예상값 데이터 중 어느 하나 이상의 데이터를 포함할 수 있다. 예컨대, 제2 결과데이터 및 제2 보정값 데이터는 제2 사건후보의 후보 결과데이터 및 보정값 후보데이터 중 상관변수로 결정된 제2 사건 각각에 관한 후보 결과데이터 및 보정값 후보데이터이다. 예컨대, 제2 사건 각각에 관한 제2 예상값 데이터 각각은 상관변수 결정 후 산출되거나 또는 실시예에 따라 사전에 제1 사건에 관한 제1 예상값 데이터 산출과 병행하여 제2 사건후보에 관한 제2 후보예상값 데이터가 산출되고 상관변수 결정 후 그 중 제2 사건에 관한 제2 예상값 데이터가 결정될 수도 있다. 하나의 예에서, 제2 사건에 관한 제2 예상값 데이터는 상관변수 결정 후 산출될 수 있다. 예컨대, 만일, 상관변수 결정을 위한 상관분석이 제2 사건후보의 후보결과 데이터와 제1 사건에 관한 제1 결과데이터 간에 수행되는 경우, 제2 사건에 관한 보정값 데이터도 제2 예상값 데이터의 산출과 마찬가지로 상관변수 결정 후 산출되거나 또는 사전에 제1 사건에 관한 제1 보정값 데이터의 산출과 병행하여 산출되는 제2 사건후보의 제2 보정값 후보데이터 중에서 결정될 수도 있다.
예컨대, 제2 사건 각각에 관한 제2 예상값 데이터 각각은 적어도 제1 기간에 대한 제2 사건에 관한 사건 시계열 데이터를 기반으로 적어도 모형화기간에 대하여 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점에 대한 적어도 하나의 제2 예상 값의 그룹일 수 있다. 제2 사건에 관한 제2 예상값 데이터의 산출에 관해서는 전술한 제1 사건에 관한 제1 예상값 데이터의 산출방식과 실질적으로 동일하게 이루어질 수 있다. 따라서 전술한 바를 참조하기로 한다.
예컨대, 하나의 예에서, 전술한 제2사건 분석식 결정단계(S1820')는 제2사건 분석식 예비결정단계(S1821), 제2사건 모형결정단계(S1823) 및 제3 분석식 결정단계(S1825)를 포함할 수 있다.
이때, 제2사건 분석식 예비결정단계(S1821)에서는, 전술한 프로세서(110)에서, 적어도 하나의 상관변수 사건이 결정된 경우, 적어도 모형화기간에 대하여 제2 변수후보 데이터들의 제2 산출 데이터의 적어도 하나의 데이터 항목을 제2사건 독립변수 후보로 하는 제3 예비 회귀분석을 수행하여 적어도 모형화기간에 대한 2 이상의 제3 예비 회귀분석식들을 각 상관변수 사건 별로 예비결정할 수 있다. 예컨대, 제3 예비 회귀분석식들의 예비결정은 전술한 제1 사건에 관한 제1 회귀분석식의 예비결정 과정과 실질적으로 동일한 방식으로 이루어질 수 있고, 이에 따라 전술한 바를 참조하기로 한다.
다음 제2사건 모형결정단계(S1823)에서는, 전술한 프로세서(110)에서, 적어도 검증기간을 포함한 기간, 예컨대 검증기간에 대하여 1 분석시점 단위로 모형화기간에 대한 제2 산출 데이터의 획득방식과 동일하게 산출된 제3 예비 회귀분석식들의 독립변수에 관한 제2 산출 데이터의 데이터를 제3 예비 회귀분석식들에 대입하여 제2 사건에 관한 시점별 제2사건 검증데이터를 산출하고(S1823a) 1 분석시점 단위의 산출 과정을 누적하며 검증기간 전체에 대해 반복하여 제2 사건에 관한 검증기간 전체의 제2사건 검증데이터들을 산출하고(S1823b), 적어도 검증기간을 포함한 기간에 대한 제2사건 검증데이터들과 제2 사건의 제2사건 비교데이터들을 비교하고, 비교 결과 적합도에 따라 제2사건 회귀분석모형을 각 상관변수 사건 별로 정할 수 있다(S1823c). 예컨대, 제3 예비 회귀분석식들의 독립변수에 관한 제2 산출 데이터의 산출, 시점별 제2사건 검증데이터의 산출 및 검증기간 전체의 제2 사건 검증데이터들의 산출은 전술한 제1 사건에 관한 예비결정된 제1 회귀분석식의 독립변수에 관한 제1 산출 데이터의 산출, 제1 사건에 관한 시점별 검증 예측데이터의 산출 및 제1 사건에 관한 제1 검증 예측데이터들의 산출 각각의 과정과 실질적으로 동일한 방식으로 진행될 수 있고, 제2사건 회귀분석모형의 결정은 전술한 제1 사건에 관한 회귀분석모형의 결정과 실질적으로 동일한 방식으로 진행될 수 있다. 이에 따라 보다 구체적인 설명은 전술한 바를 참조하기로 한다.
그리고 제3 분석식 결정단계(S1825)에서는, 전술한 프로세서(110)에서, 결정된 제2 사건 회귀분석모형을 토대로 제1 기간에 대한 제2 사건에 관한 시계열 분석데이터로부터 제3 회귀분석을 수행하여 제2 사건에 관한 예측을 위한 제3 회귀분석식을 각 상관변수 사건 별로 결정할 수 있다. 예컨대, 제3 회귀분석식의 결정은 전술한 제1 사건에 관한 제2 회귀분석식의 결정과 실질적으로 동일한 방식으로 진행될 수 있다.
보다 구체적인 설명은 전술한 전자 장치의 실시예들에 관한 설명 중 상관변수에 관한 결정 및 제2 사건에 관한 제3 회귀분석식 결정에 관한 부분을 참조하기로 한다.
예측상관변수 산출단계(S1840)
다음으로, 하나의 예에 따라 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법은 예측상관변수 산출단계(S1840)를 더 포함할 수 있다.
예측상관변수 산출단계(S1840)에서는, 전술한 프로세서(110)에서, 적어도 하나의 상관변수 사건이 결정된 경우 제2 사건에 관한 결과데이터 값이 없는 예측기간에 대하여, 제2 산출 데이터에서의 제3 회귀분석식의 독립변수와 동일한 데이터 항목 산출방식과 동일하게 1 분석시점 단위로 각 분석시점에 대해 제3 회귀분석식의 최종 독립변수에 관한 값 데이터를 산출하고 산출결과를 제3 회귀분석식에 대입하여 시점별 상관변수 예측데이터를 산출할 수 있다. 예컨대, 프로세서(110)에서, 예측기간의 1 분석시점 단위로 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 각 분석시점에 대해 제3 회귀분석식의 최종 독립변수에 관한 값 데이터를 산출하고 산출결과를 제3 회귀분석식에 대입하여 시점별 상관변수 예측데이터를 산출하고 1 분석시점 단위의 산출 과정을 누적하며 예측기간 전체에 대해 반복하여 예측기간 전체에 대한 제2 사건에 관한 예측상관변수 데이터를 산출할 수 있다.
예컨대, 제3 회귀분석식의 최종 독립변수의 값 데이터 산출, 시점별 상관변수 예측데이터 산출 및 제2 사건에 관한 예측상관변수 데이터 산출은 전술한 제1 사건에 관한 제2 회귀분석식의 최종 독립변수의 값 데이터 산출, 제1 사건에 관한 시점별 예측데이터의 산출 및 제1 사건에 관한 예측결과 데이터의 산출 각각의 과정과 실질적으로 동일한 방식으로 진행될 수 있다.
보다 구체적인 설명은 전술한 전자 장치의 실시예들에 관한 설명 중 예측기간에 대한 제2 사건에 관한 데이터 산출에 관한 부분을 참조하기로 한다.
제2 사건에 영향받는 제1 사건의 결과예측 과정(S1850)
예컨대 적어도 하나의 상관변수 사건이 결정된 경우 상관변수로 결정된 제2 사건 각각이 제1 사건과 상관관계에 있으므로, 제1 사건에 관한 회귀분석을 위한 자료로 사용되는 시계열 분석데이터에 포함되는 제1 사건에 관한 제1 변수후보 데이터들에 제2 사건 각각에 관한 제2 결과데이터 및 제2 산출 데이터가 더 포함될 수 있다. 예컨대, 전술한 프로세서(110)는 제2 사건 각각에 관한 제2 변수후보 데이터 중, 예컨대 제2 결과데이터 및 제2 산출 데이터들 중 적어도 하나의 데이터 항목을 제1 사건 독립변수 후보에 포함시킬 수 있다.
예컨대, 전술한 회귀식 결정단계(S330, S330', S330", S1830)에서는, 전술한 프로세서(110)에서, 제2 사건 각각에 관한 제2 결과데이터 및 제2 산출 데이터를 더 포함하는 제1 사건에 관한 제1 변수후보 데이터들에 대하여, 적어도 모형화기간에 대한 제1 회귀분석을 수행하여 2 이상의 제1 회귀분석식을 예비결정하고, 제1 기간 중 적어도 검증기간을 포함한 기간에 대하여 제1 회귀분석식들을 검증하고, 검증결과를 기초로 제1 기간의 제1 사건에 관한 예측용 제2 회귀분석식을 결정할 수 있다. 예컨대, 전술한 회귀식 결정단계(S330', S330")에서는, 전술한 프로세서(110)에서, 적어도 검증기간을 포함한 기간에 대하여 제1 회귀분석식들을 검증하여 회귀분석모형을 정하고, 회귀분석모형을 토대로 제2 회귀분석을 수행하여 제1 기간의 제1 사건에 관한 예측용 제2 회귀분석식을 결정할 수 있다. 예컨대, 도 7b의 S1830 단계는 직접 도시되지 않았으나 도 3b 및 3c의 S330' 및 S330" 단계와 마찬가지로 수행될 수 있다.
예컨대, 하나의 예에서, 전술한 제1 회귀분석식들을 예비결정하기 위한 독립변수 후보는 제1 사건에 관련된 적어도 하나 이상의 데이터 항목 및/또는 제2 사건 관련된 적어도 하나 이상의 데이터 항목들을 포함할 수 있다.
또한 하나의 예에서, 전술한 데이터 예측단계(S1850)에서는, 전술한 프로세서(110)에서, 적어도 하나의 상관변수 사건이 결정되고 결정된 제2 회귀분석식의 최종 독립변수에 제2 사건 관련된 적어도 하나 이상의 데이터 항목이 포함되는 경우, 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수가 예측상관변수 산출단계에서 이미 산출된 경우 해당 값을 읽어들이고 산출되지 않은 경우 예측상관변수 산출단계에서 산출된 값으로부터 제2 산출 데이터에서의 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수와 동일한 데이터 항목 산출과 동일하게 산출할 수 있다(S1851). 예컨대, 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수가 제2 사건에 관한 예측상관변수 데이터이거나 제3 회귀분석식의 최종 독립변수에 관한 값 데이터인 경우 이미 예측상관변수 산출단계에서 산출되었으므로 해당 값을 읽어들여 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수로 삼을 수 있다. 또한, 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수가 제2 사건에 관한 예측상관변수 데이터 내지 제3 회귀분석식의 최종 독립변수에 관한 값 데이터로부터 보정된 제2 보정값 데이터이거나 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점의 제2 예상값 데이터 등인 경우 예측상관변수 산출단계에서 산출되지 않았으므로, 예측상관변수 산출단계에서 산출된 값으로부터 제2 산출 데이터에서의 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수와 동일한 데이터 항목 산출과 동일하게 산출할 수 있다.
이때, 제2 회귀분석식에서의 시점별 예측결과 데이터를 예측기간 전체에 반복 누적시켜 예측기간에 대한 제2사건의 영향을 받는 제1 사건의 결과추정 데이터를 산출할 수 있다(S1853).
보다 구체적인 설명은 전술한 전자 장치의 실시예들에 관한 설명 중 제2 사건에 영향을 받는 제1 사건의 결과예측에 관한 부분을 참조하기로 한다.
[구체적인 실시예]
이하에서 도면을 참조하여 설명되는 구체적인 실시예는 도 1, 2a 및/또는 2b에 따른 전자장치(101, 201, 202)에서 프로세서(110) 내지 각 모듈들(220 내지 250)에 의해 수행되는 동작을 나타내며, 동시에 본 발명의 하나의 예에 따른 빅데이터를 활용한 시계열 데이터 예측 방법을 나타내고 있다. 도 3a, 3b 및/또는 3c는 본 발명의 하나의 실시 예에 따른 전자 장치에서 빅데이터를 활용한 시계열 데이터의 예측을 위한 방법에 관한 순서도이다. 이하에서, 가급적 중복적인 설명은 생략될 수 있고, 이때 전술한 설명들을 참조하여 이해될 수 있다.
도 3a, 3b 및/또는 3c를 참조하면, 전자 장치는 S310 단계에서, 시계열 데이터를 입력 받을 수 있다. 예를 들면, 전자 장치는 사용자로부터 시계열 데이터를 입력 받거나 예를 들면, DB(데이터 베이스(210))에 저장된 시계열 데이터를 읽어들여 사용할 수도 있다.
예컨대, 프로세서(110) 내지 변수 생성모듈(220)에 의해 읽어들인 사건 시계열 데이터는 예를 들면, 감염병 발생 횟수, 종합 주가 지수, 경제 성장률, 소비자 물가 지수, 화재 발생 횟수, 범죄 발생 횟수, 기온, 강수량 등 시간의 경과에 따라 연속적으로 발생할 수 있는 다양한 대부분의 사건에 대한 데이터를 포함할 수 있다.
이하에서, 본 발명의 이해를 돕기 위해, 하나의 사건에 대한 하나의 시계열 데이터 항목을 갖는 사건 시계열 데이터로부터 해당 사건에 대한 시계열 데이터 예측을 수행하는 과정을 먼저 살펴보고, 이후에 해당 사건과 상관관계에 있는 다른 사건에 대한 시계열 데이터 항목을 더 포함하는 경우에 대한 시계열 데이터 예측을 수행하는 과정을 살펴볼 것이다.
예컨대, 전자 장치는, 도 3a, 3b 및/또는 3c의 S310 단계에서, 시계열 데이터를 모형화기간 및 검증기간을 결정할 수 있다. 예컨대, 프로세서(110) 내지 변수 생성모듈(220)은 사건 시계열 데이터로부터 모형화기간의 데이터 및/또는 검증기간의 데이터를 추출할 수 있다. 예컨대, 사건 시계열 데이터가 2010년 7월부터 2015년 9월까지의 기간을 포함하고 있는 경우를 살펴본다. 사건 시계열 데이터가 2015년 9월까지 뿐이므로 이후의 기간에 대해서 예측이 필요하다. 사건 시계열 데이터가 없는 2015년 9월 이후의 기간이 예측기간이 된다. 프로세서(110) 내지 변수 생성모듈(220)은 예를 들면 2010년 7월부터 2014년 12월까지의 기간을 모형화기간으로 결정하여 모형화기간의 데이터에 기초하여 제1 회귀분석식 후보들의 독립변수를 생성할 수 있다. 도 4를 참조하면, 프로세서(110) 내지 변수 생성모듈(220)은 2011년 1월부터 2014년 12월까지의 기간을 모형화기간으로 예시하고 있다. 즉, 모형화기간은 사건 시계열 데이터의 처음부터 내지 임의의 시점부터 검증기간 전까지로 선택될 수 있다. 게다가, 도 4를 참조하면, 2015년 1월부터 2015년 9월까지의 기간을 검증기간으로 결정할 수 있다. 도 5를 참조하면, 예컨대, 전자 장치는 2011년 1월의 데이터 값은 34, 2011년 2월의 데이터 값은 35인 것을 읽어들여 확인할 수 있다.
예컨대, 프로세서(110) 내지 변수 생성모듈(220)은 사건 시계열 데이터에 포함된 모형화기간의 데이터를 보정할 수 있다. 예컨대, 시계열 데이터 값에 대한 진폭 조정법에 따라 시계열 데이터에 포함된 모형화기간의 데이터가 보정될 수 있다. 진폭 조정법은, 예를 들면, 데이터 값의 변동이 심한 시계열 데이터를 변동이 적은 데이터 값으로 변환함으로써 데이터 분석을 용이하게 하는 방법을 의미할 수 있다. 예를 들면, 프로세서(110) 내지 변수 생성모듈(220)은, 이하 [식 1]과 같이, 사건 시계열 데이터 값들이 음수인 경우 시계열 데이터 값들을 양수로 변환하거나, 시계열 데이터 값들이 0보다 훨씬 큰 값인 경우 시계열 데이터 값들을 하향하여 보정할 수 있다. 다른 하나의 예에 따르면, 프로세서(110) 내지 변수 생성모듈(220)은 사건 시계열 데이터에 포함된 모형화기간의 데이터를 보정하지 않고 독립변수를 생성할 수도 있다. 이하에서, 보정 전 데이터의 최소값 및 중위수을 이용하여 보정하는 식을 예로 들어 설명하나, 본 발명은 [식 1]의 예시적 실시 예에 한정되는 것은 아니다.
[식1]
Figure 112019028553333-pat00001
예컨대, 전자 장치는 도 3a, 3b 및/또는 3c의 S310 단계에서, 모형화기간의 데이터를 보정할 수 있다. 도 5를 참조하면, 전자 장치는, 예를 들면, 모형화기간의 데이터들의 최소값 및 중위수를 산출할 수 있고, 산출된 최소값 및 중위수에 기초하여 모형화기간의 데이터를 보정함으로써 모형화기간의 보정 후 데이터를 생성할 수 있다. 예를 들면, 2011년 5월의 데이터 값은 125이고, 모형화기간의 데이터들의 최소값은 13, 중위수는 49이므로, 전자 장치는 [식 1]에 따라 2011년 5월의 데이터 값을 112.49로 보정할 수 있다.
예컨대, 프로세서(110) 내지 변수 생성모듈(220)은 모형화기간의 보정 후 데이터에 기초하여, 단일 내지 다중 회귀분석식을 결정하기 위한 독립 변수 내지 독립변수 후보를 생성할 수 있다. 독립변수 후보는 특정한 모형에 따른 회귀분석식의 독립변수가 되므로, 이하에서 독립변수로 설명되는 사항은 결정되기 전 회귀분석식의 독립변수이거나 결정된 회귀분석식의 독립변수일 수 있음에 유의한다. 예컨대, 전자 장치는 도 3a, 3b 및/또는 3c의 S310 단계에서, 모형화기간의 보정 후 데이터에 기초하여, 다중 회귀분석식을 결정하기 위한 독립 변수 내지 독립변수 후보를 생성할 수 있다. 전자 장치는, 예를 들면, 추세형 분석식 및 비추세형 분석식을 결정하기 위한 독립 변수를 각각 생성할 수 있다.
비추세형 분석식을 위한 변수후보 생성
예컨대, 프로세서(110) 내지 변수 생성모듈(220)은 비추세형 시계열 데이터를 나타낼 수 있는 단일 내지 다중 회귀분석식(이하, 비추세형 분석식)을 결정하기 위한 독립 변수를 생성하기 위해, 시간의 변화에 따른 모형화기간의 보정 후 데이터의 변동과 관련된 데이터를 생성할 수 있다. 이에 대해서, 이하 도 6a 내지 8d를 참조하여 설명하도록 한다.
도 6a를 참조하면, 전자 장치는, 비추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 각 시점에 대한 보정 후 데이터 값에 기초하여, 모형화기간의 각 시점에 대한 이전 시점의 보정 후 데이터 값을 결정할 수 있다. 예를 들면, 2011년 5월의 보정 후 데이터 값이 112.5이고, 2011년 6월의 보정 후 데이터 값이 75.5이므로, 전자 장치는 2011년 6월에 대한 -1시점의 보정 후 데이터 값을 112.5로 결정할 수 있다. 즉, 2011년 6월의 보정 후 데이터 값인 75.5는, -1시점인 5월의 데이터 값인 112.5에서 한 달이 경과함으로써 37이 감소한 값임을 나타낼 수 있다. 여기서, -1시점은 시계열 데이터의 각 시점에 대한 1시점 이전의 시점을 의미할 수 있고, -2시점은 시계열 데이터의 각 시점에 대한 2시점 이전의 시점을 의미할 수 있다.
예를 들면, 전자 장치는, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률을 결정할 수 있다. 예를 들면, 2011년 5월의 -1시점인 4월의 보정 후 데이터 값은 49.5이며, 2011년 5월의 2시점 이전인 3월의 보정 후 데이터 값은 38.5이므로, 전자 장치는 2011년 5월에 대한 -1시점의 보정 후 데이터 값의 증감률을, 49.5를 38.5로 나눈 값의 백분율인 128.6%로 결정할 수 있다.
예를 들면, 전자 장치는, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 백분위를 산출할 수 있다. 본 예에서는 백분위를 사용하여 수행되는 단계 또는 과정을 예로 들어 설명하나, 본 발명은 상기의 예시적 실시 예에 한정되는 것은 아니며, 표준화 지수(standard index) 등을 사용하는 단계 또는 과정을 포함할 수도 있다. 예를 들면, 2011년 5월에 대한 -1시점의 보정 후 데이터 값인 49.5는 모형화기간인 2011년 1월부터 2014년 12월까지의 기간에 대한 백분위 점수의 백분율이 55.3%로 산출될 수 있다.
예를 들면, 전자 장치는, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 백분위를 산출할 수 있다. 예를 들면, 2011년 5월의 -1시점의 보정 후 데이터 값의 증감률인 128.6%은 모형화기간인 2011년 1월부터 2014년 12월까지의 기간에 대한 백분위 점수의 백분율이 59.5%로 산출될 수 있다.
예를 들면, 전자 장치는, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 백분위에 기초하여, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 변동 등급을 결정할 수 있다. 이때, 변동 등급은, 예를 들면, 시간의 변화에 따라 모형화기간의 각 시점의 데이터가 변동하는 정도를 사용자가 쉽게 확인 및 인식할 수 있도록 하는 지표를 의미할 수 있다. 예를 들면, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 백분위의 백분율이 85% 이상인 경우 5등급, 65% 이상이고 85% 미만인 경우 4등급, 35% 이상이고 65% 미만인 경우 3등급, 20% 이상이고 35% 미만인 경우 2등급, 20% 미만인 경우 1등급으로 하여, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 변동 등급이 결정될 수 있다. 본 예에서는 변동 등급을 5단계로 구분하여 결정하는 것을 예로 들어 설명하나, 본 발명은 예시적 실시 예에 한정되는 것은 아니며, 변동 등급을 7단계, 10단계 등으로 세분화하거나, 3단계 등으로 구분하여 결정하는 것을 포함할 수 있다.
예를 들면, 전자 장치는, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 백분위에 기초하여, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 변동 등급을 결정할 수 있다. 예를 들면, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 백분위의 백분율이 85% 이상인 경우 5등급, 65% 이상이고 85% 미만인 경우 4등급, 35% 이상이고 65% 미만인 경우 3등급, 20% 이상이고 35% 미만인 경우 2등급, 20% 미만인 경우 1등급으로 하여, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 변동 등급이 결정될 수 있다.
예를 들면, 전자 장치는, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 변동 등급 및 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 변동 등급에 기초하여, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 종합변동등급을 결정할 수 있다. 예를 들면, 2011년 4월에 대한 -1시점의 보정 후 데이터 값의 변동 등급이 3등급, 2011년 4월에 대한 -1시점의 보정 후 데이터 값의 증감률의 변동 등급이 4등급인 경우, 전자 장치는, 2011년 4월에 대한 -1시점의 보정 후 데이터 종합변동등급을 3.4등급으로 결정할 수 있다.
도 6b를 참조하면, 전자 장치는, 비추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 종합변동등급, 모형화기간의 각 시점에 대한 보정 후 데이터 종합변동등급, 모형화기간의 각 시점에 대한 월별, 분기별 및/또는 반기별 데이터를 결정하여, 모형화기간의 각 시점에 대응시킬 수 있다. 본 실시 예에서는 월별, 분기별 및/또는 반기별 데이터를 예로 들어 설명하나, 본 발명은 예시적 실시 예에 한정되는 것은 아니며, 주, 일, 시, 분, 초 등 다양한 시간 간격과 관련된 데이터를 포함할 수 있다.
예를 들면, 전자 장치는, 2011년 5월의 보정 후 데이터 값을 112.5, 2011년 5월에 대한 -1시점의 보정 후 데이터 값을 49.5, 2011년 5월에 대한 -1시점의 보정 후 데이터 종합변동등급은 3.3등급, 2011년 5월의 보정 후 데이터 종합변동등급은 4.5등급, 해당 월은 5월, 해당 분기는 2분기, 해당 반기는 상반기로 결정할 수 있다.
도 6c를 참조하면, 전자 장치는, 비추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 종합변동등급과 현 시점의 보정 후 데이터 종합변동등급 간의 관계, 예컨대 등급변동 빈도를 산출할 수 있다.
예를 들면, 도 6b를 참조하면, -1시점의 보정 후 데이터 종합변동등급이 2.2등급인 시점은 2011년 2월 및 8월, 2012년 3월, 4월, 5월, 7월 및 8월, 2013년 3월 및 4월로 9회이며, 도 6b 및 6c를 참조하면, 이 중에서 현 시점의 보정 후 데이터 종합변동등급이 1.2등급으로 변경된 횟수가 1회, 2.2등급으로 유지된 횟수가 4회, 2.3등급으로 변경된 횟수가 2회, 3.5등급으로 변경된 횟수가 2회인 것을 확인할 수 있다.
도 6d를 참조하면, 전자 장치는, 비추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 종합변동등급과 현 시점의 보정 후 데이터 종합변동등급 간의 관계, 예컨대 등급변동의 빈도별 등급을 산출할 수 있다.
예를 들면, 도 6b를 참조하면, -1시점의 보정 후 데이터 종합변동등급이 2.2등급인 시점은 2011년 2월 및 8월, 2012년 3월, 4월, 5월, 7월 및 8월, 2013년 3월 및 4월이며, 이 중에서 현 시점의 보정 후 데이터 종합변동등급의 최빈도 등급은 2.2등급, 최고 등급인 극한 등급은 3.5등급, 중위 등급은 2.3등급, 최저 등급인 극저 등급은 2.1등급인 것을 확인할 수 있다. 본 실시 예에서는 종합 변동 등급과 관련하여 최빈도, 극한, 중위 및/또는 극저 등급을 예로 들어 설명하나, 본 발명은 상기의 예시적 실시 예에 한정되는 것은 아니며, 최빈도, 극한, 중위 및/또는 극저 등급 중 일부를 생략할 수도 있으며, 평균 등급 등으로 대체 또는 확장하는 것을 포함할 수 있다.
도 6e를 참조하면, 전자 장치는, 비추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 현 시점의 보정 후 데이터 종합변동등급에 기초하여, 동일한 종합 변동 등급을 포함하는 현 시점의 보정 후 데이터 값들의 중위수를 산출할 수 있다.
예를 들면, 도 6b를 참조하면, 현 시점의 보정 후 데이터 종합변동등급이 3.3 등급인 시점은 2011년 4월, 2013년 1월, 2014년 7월, 8월 및 9월이며, 도 6e를 참조하면, 이 중에서 현 시점의 보정 후 데이터 값들의 중위수는 2011년 4월의 49.49인 것을 확인할 수 있다.
도 6f를 참조하면, 전자 장치는, 비추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 종합변동등급의 값, 예컨대 중위수 대비 현 시점의 보정 후 데이터 종합변동등급의 값, 예컨대 중위수의 증감률을 산출할 수 있다. 예를 들면, 전자 장치는, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 종합변동등급이 3.3인 경우, 이에 대응하는 현 시점의 보정 후 데이터 종합변동등급의 최빈도 등급은 3.3등급, 최고 등급인 극한 등급은 4.5등급, 중위 등급은 4.4등급, 최저 등급인 극저등급은 2.2등급인 것을 확인할 수 있다. 또한, 예를 들면, 전자 장치는, 현 시점의 보정 후 데이터 종합변동등급에 대응하는 현 시점의 보정 후 데이터 값들의 중위수는, 도 6e를 참조하면, 최빈도 등급인 3.3등급은 49.49, 최고 등급인 4.5등급은 107.49, 중위 등급인 4.4등급은 87.49, 최저 등급인 2.2등급은 10.49인 것을 확인할 수 있고, 현 시점의 보정 후 데이터 종합변동등급에 대응하는 중위수들의 평균 값은 63.7로 산출할 수 있다. 한편, 예를 들면, 전자 장치는, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 종합변동등급이 3.3인 경우에 대응하는 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값들의 중위수는 49.5인 것을 확인할 수 있다. 또한, 전자 장치는, -1시점의 보정 후 데이터 값들의 중위수인 49.5 대비, 현 시점의 보정 후 데이터 값들의 중위수의 증감률을 산출할 수 있다. 예를 들면, 전자 장치는, -1시점의 보정 후 데이터 값들의 종합 변동 등급이 3.3인 경우(중위수는 49.5)에 대하여, 현 시점의 보정 후 데이터 종합변동등급의 최빈도 등급인 3.3등급(중위수는 49.5)의 증감률은 100%, 최고 등급인 4.5등급(중위수는 107.5)의 증감률은 217.2%, 중위 등급인 4.4등급(중위수는 87.5)의 증감률은 176.8%, 최저 등급인 2.2등급(중위수는 10.5)의 증감률은 21.2%인 것을 확인할 수 있다.
도 7a를 참조하면, 전자 장치는, 비추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 보정 후 데이터에 기초하여, 모형화기간의 보정 후 데이터의 연단위 월별 변화와 관련된 데이터를 생성할 수 있다.
예를 들면, 도 6b를 참조하면, 전자 장치는, 2011년 3월, 2012년 3월, 2013년 3월 및 2014년 3월의 보정 후 데이터 값들에 기초하여, 보정 후 데이터의 연단위 3월 중위수는 24.0, 연단위 3월 최대값은 89.5, 연단위 3월 평균값은 35.7, 연단위 3월 최소값은 5.5로 산출할 수 있고, 3월 중위수, 3월 최대값, 3월 평균값 및 3월 최소값의 평균은 38.7로 산출할 수 있다.
전자 장치는, 예를 들면, 연단위 월별 -1시점의 보정 후 데이터 값, 예컨대 중위수 대비 연단위 월별 현 시점의 보정 후 데이터 값, 예컨대 중위수의 증감률을 산출할 수 있다. 예를 들면, 전자 장치는, 보정 후 데이터의 연단위 4월 중위수인 41을 보정 후 데이터의 연단위 3월 중위수인 24로 나눈 값의 백분율인 170.9%를 4월의 -1시점의 보정 후 데이터 값 대비, 현 시점의 보정 후 데이터 값의 중위수 증감률로 산출할 수 있다. 예를 들면, 전자 장치는, 보정 후 데이터의 3월 중위수인 24를 보정 후 데이터의 2월 중위수인 22.5로 나눈 값의 백분율인 106.7%를 4월의 -2시점의 보정 후 데이터 값 대비, -1시점의 보정 후 데이터 값의 중위수 증감률로 산출할 수 있다.
도 7b를 참조하면, 전자 장치는, 비추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 보정 후 데이터에 기초하여, 모형화기간의 보정 후 데이터의 연단위 분기별 변화와 관련된 데이터를 생성할 수 있다.
예를 들면, 도 6b를 참조하면, 전자 장치는, 모형화기간의 보정 후 데이터를 연단위 분기별로 분석한 데이터를 생성할 수 있다. 예를 들면, 전자 장치는, 2011년 4월 내지 6월, 2012년 4월 내지 6월, 2013년 4월 내지 6월 및 2014년 4월 내지 6월의 보정 후 데이터 값들에 기초하여, 보정 후 데이터의 2분기 중위수는 75.5, 2분기 최대값은 197.5, 2분기 평균값은 85.2, 2분기 최소값은 2.5로 산출할 수 있고, 2분기 중위수, 2분기 최대값, 2분기 평균값 및 2분기 최소값의 평균은 90.2로 산출할 수 있다. 전자 장치는, 예를 들면, 분기별 -1시점의 보정 후 데이터 값 대비, 분기별 현 시점의 보정 후 데이터 값의 증감률을 산출할 수 있다.
예를 들면, 전자 장치는, 보정 후 데이터의 2분기 중위수인 75.5를 보정 후 데이터의 1분기 중위수인 25로 나눈 값의 백분율인 302.1%를, 2분기의 1분기 이전의 보정 후 데이터 값 대비, 2분기의 보정 후 데이터 값의 중위수 증감률로 산출할 수 있다. 예를 들면, 전자 장치는, 보정 후 데이터의 1분기 중위수인 25를 보정 후 데이터의 4분기 중위수인 34.5로 나눈 값의 백분율인 72.5%를, 4월의 2분기 이전의 보정 후 데이터 값 대비, 1분기 이전의 보정 후 데이터 값의 중위수 증감률로 산출할 수 있다.
도 7c를 참조하면, 전자 장치는, 비추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 보정 후 데이터에 기초하여, 모형화기간의 보정 후 데이터의 연단위 반기별 변화와 관련된 데이터를 생성할 수 있다.
예를 들면, 도 6b를 참조하면, 전자 장치는, 모형화기간의 보정 후 데이터를 연단위 반기별로 분석한 데이터를 생성할 수 있다. 예를 들면, 전자 장치는, 2011년 1월 내지 6월, 2012년 1월 내지 6월, 2013년 1월 내지 6월 및 2014년 1월 내지 6월의 보정 후 데이터 값들에 기초하여, 보정 후 데이터의 상반기 중위수는 34.5, 상반기 최대값은 197.5, 상반기 평균값은 62.6, 상반기 최소값은 2.5로 산출할 수 있고, 상반기 중위수, 상반기 최대값, 상반기 평균값 및 상반기 최소값의 평균은 74.3으로 산출할 수 있다. 전자 장치는, 예를 들면, 연단위 반기별 -1시점의 보정 후 데이터 값, 예컨대 중위수 대비 연단위 반기별 현 시점의 보정 후 데이터 값, 예컨대 중위수의 증감률을 산출할 수 있다. 예를 들면, 전자 장치는, 보정 후 데이터의 연단위 상반기 중위수인 34.5를 보정 후 데이터의 연단위 하반기 중위수인 27로 나눈 값의 백분율인 127.8%를 연단위 상반기의 -1시점의 보정 후 데이터 값 대비 연단위 상반기의 보정 후 데이터 값의 증감률로 산출할 수 있다.
도 8a를 참조하면, 전자 장치는, 예를 들면, 비추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 종합변동급 대비 현 시점의 보정 후 데이터 종합변동급의 데이터 값, 예컨대 중위수 증감율에 기초하여, 모형화기간의 각 시점에 대한 -1시점의 종합 변동 등급의 변화에 따른 현 시점의 보정 후 데이터 예측 값을 산출할 수 있다. 예를 들면, 전자 장치는, 모형화기간의 각 시점에 대한 -1시점의 종합 변동 등급의 변화에 따른 현 시점의 보정 후 데이터 예측 값을 비추세형 분석식과 관련된 종합 변동 등급의 변화에 따른 독립 변수로 결정할 수 있다.
예를 들면, 전자 장치는, 2011년 7월에 대한 -1시점의 보정 후 데이터 값과, 2011년 7월에 대한 -1시점의 보정 후 데이터 종합변동등급 대비 현 시점의 보정 후 데이터 종합변동등급의 데이터 값, 예컨대 중위수 증감률을 곱한 값을, 2011년 7월의 -1시점의 종합 변동 등급의 변화에 따른 현 시점의 보정 후 데이터 예측 값으로 산출할 수 있다. 예를 들면, 2011년 7월에 대한 -1시점의 보정 후 데이터 값인 75.49와, 2011년 7월에 대한 -1시점의 보정 후 데이터 종합변동등급 대비 현 시점의 보정 후 데이터 종합변동등급의 데이터 값 증감률인 11.2%(최빈도 등급), 96.3%(최고 등급), 96.3%(중위 등급), 11.2%(최저 등급)을 각각 곱한 값인, 8.5(최빈도 등급), 72.7(최고 등급), 72.7(중위 등급), 8.5(최저 등급)을 2011년 7월의 -1시점의 종합 변동 등급의 변화에 따른 현 시점의 보정 후 데이터 예측 값으로 산출할 수 있다.
도 8b를 참조하면, 전자 장치는, 예를 들면, 비추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 월별 -1시점의 보정 후 데이터 값 대비 월별 현 시점의 보정 후 데이터 값 증감률에 기초하여, 각 시점의 연단위 월별 변화에 따른 현 시점의 보정 후 데이터 예측 값을 산출할 수 있다. 전자 장치는, 예를 들면, 각 시점의 연단위 월별 변화에 따른 현 시점의 보정 후 데이터 예측 값을 비추세형 분석식과 관련된 연단위 월별 변화에 따른 독립 변수로 결정할 수 있다.
예를 들면, 전자 장치는, 2012년 1월에 대한 -1시점의 보정 후 데이터 값인 70.5와, 2012년 1월에 대한 월별 -1시점의 보정 후 데이터 값 대비 월별 현 시점의 보정 후 데이터 값의 중위수 증감률인 44%를 곱한 값인 31을, 2012년 1월에 대한 연단위 월별 변화에 따른 현 시점의 보정 후 데이터 예측 값의 중위수로 산출할 수 있다.
도 8c를 참조하면, 전자 장치는, 예를 들면, 비추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 분기별 -1시점의 보정 후 데이터 값 대비 분기별 현 시점의 보정 후 데이터 값의 증감률에 기초하여, 각 시점의 연단위 분기별 변화에 따른 현 시점의 보정 후 데이터 예측 값을 산출할 수 있다. 전자 장치는, 예를 들면, 각 시점의 연단위 분기별 변화에 따른 현 시점의 보정 후 데이터 예측 값을 비추세형 분석식과 관련된 연단위 분기별 변화에 따른 독립 변수로 결정할 수 있다.
예를 들면, 전자 장치는, 2012년 1월에 대한 -1시점의 보정 후 데이터 값인 70.5와, 2012년 1월에 대한 분기별 -1시점의 보정 후 데이터 값 대비 분기별 현 시점의 보정 후 데이터 값의 중위수 증감률인 72.5%를 곱한 값인 51.1을, 2012년 1월에 대한 연단위 분기별 변화에 따른 현 시점의 보정 후 데이터 예측 값의 중위수로 산출할 수 있다.
도 8d를 참조하면, 전자 장치는, 예를 들면, 비추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 반기별 -1시점의 보정 후 데이터 값 대비 반기별 현 시점의 보정 후 데이터 값의 증감률에 기초하여, 각 시점의 연단위 반기별 변화에 따른 현 시점의 보정 후 데이터 예측 값을 산출할 수 있다. 전자 장치는, 예를 들면, 각 시점의 연단위 반기별 변화에 따른 현 시점의 보정 후 데이터 예측 값을 비추세형 분석식과 관련된 연단위 반기별 변화에 따른 독립 변수로 결정할 수 있다.
예를 들면, 전자 장치는, 2012년 1월에 대한 -1시점의 보정 후 데이터 값인 70.5와, 2012년 1월에 대한 반기별 -1시점의 보정 후 데이터 값 대비, 반기별 현 시점의 보정 후 데이터 값의 중위수 증감률인 127.8%를 곱한 값인 90.1을, 2012년 1월에 대한 연단위 반기별 변화에 따른 현 시점의 보정 후 데이터 예측 값의 중위수로 산출할 수 있다.
추세형 분석식을 위한 변수후보 생성
예컨대, 프로세서(110) 내지 변수 생성모듈(220)은 추세형 시계열 데이터를 나타낼 수 있는 단일 내지 다중 회귀분석식(이하, 추세형 분석식)을 결정하기 위한 독립 변수를 생성하기 위해, 추세선에 대한 식 및 그래프를 결정할 수 있다. 예컨대, 프로세서(110) 내지 변수 생성모듈(220)은 결정된 추세선에 대한 식에 시간 변수를 대입함으로써 모형화기간의 추세형 데이터를 산출할 수 있다. 이에 대해서는 이후 도 9a 내지 12d를 참조하여 설명하도록 한다.
도 9a를 참조하면, 전자 장치는, 예를 들면, 추세선에 대한 식을 결정하기 위해, 시간의 순서에 따라 모형화기간의 보정된 데이터에 순번을 대응시킬 수 있다. 예를 들면, 전자 장치는, 2010년 7월부터 2014년 12월의 기간에 대한 순번을 대응시키는 경우, 2011년 1월의 보정된 값인 21.49에 대응되는 순번은 7번으로 결정할 수 있다.
도 9b를 참조하면, 전자 장치는, 예를 들면, 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 순번이 대응된 모형화기간의 보정된 데이터에 기초하여, 직선 회귀 방정식에 따른 추세선에 대한 식을 결정할 수 있다. 예를 들면, 도 9a를 참조하면, 전자 장치는, 추세선의 절편 값은 12.302, 추세선의 x축 변수에 대한 계수는 1.8217으로 결정할 수 있고, 추세선에 대한 식은 이하 [식 2]로 결정할 수 있다.
[식 2]
Figure 112019028553333-pat00002
도 9c를 참조하면, 전자 장치는, 예를 들면, 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 순번이 대응된 모형화기간의 보정된 데이터 및 추세선에 대한 식에 기초하여, 모형화기간의 추세형 데이터를 산출할 수 있다. 여기서, 추세형 데이터는, 예를 들면, 상기 추세선에 대한 식에 추세선에 대한 식의 독립 변수를 대입함으로써 산출되는 추세선에 대한 식의 종속 변수에 대한 데이터를 의미할 수 있다. 예를 들면, 전자 장치는, 2011년 1월의 순번인 7을 상기 식 2에 대입함으로써, 2011년 1월의 추세형 데이터 값으로 25.0539를 산출할 수 있다.
도 10a를 참조하면, 예를 들면, 전자 장치는 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 각 시점에 대한 이전 시점의 추세형 데이터 값을 결정할 수 있다. 예를 들면, 2011년 5월의 추세형 데이터 값이 32.3이고, 2011년 6월의 추세형 데이터 값이 34.2이므로, 전자 장치는 2011년 6월에 대한 -1시점의 데이터 값을 32.3으로 결정할 수 있다. 즉, 2011년 6월의 추세형 데이터 값인 34.2는, 1시점 이전인 5월의 추세형 데이터 값인 32.3에서 한 달이 경과함으로써 1.9가 증가한 값임을 나타낼 수 있다.
예를 들면, 전자 장치는 추세형 데이터 값과 보정 후 데이터 값의 차이를 나타내는 추세 이격도를 산출할 수 있다. 예를 들면, 2011년 4월에 대한 -1시점의 보정 후 데이터 값은 38.5이고, 2011년 4월에 대한 -1시점의 추세형 데이터 값은 28.7이므로, 전자 장치는 38.5를 28.7로 나눈 값의 백분율인 134.1%를 2011년 4월에 대한 -1시점의 추세 이격도로 산출할 수 있다.
예를 들면, 전자 장치는 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률을 결정할 수 있다. 예를 들면, 2011년 5월의 -1시점의 보정 후 데이터 값은 49.5이며, 2011년 5월의 -2시점의 보정 후 데이터 값은 38.5이므로, 전자 장치는 2011년 5월의 -1시점의 보정 후 데이터 값의 증감률을, 49.5를 38.5로 나눈 값의 백분율인 128.6%로 결정할 수 있다.
예를 들면, 전자 장치는 모형화기간의 각 시점에 대한 -1시점의 추세 이격도의 백분위를 산출할 수 있다. 예를 들면, 전자 장치는, 2011년 5월에 대한 -1시점의 추세 이격도인 162.2%의 모형화기간인 2011년 1월부터 2014년 12월까지의 기간에 대한 백분위 점수의 백분율은 85.1%로 산출할 수 있다. .
예를 들면, 전자 장치는 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 백분위를 산출할 수 있다. 예를 들면, 전자 장치는, 2011년 5월의 -1시점의 보정 후 데이터의 값의 증감률인 128.6%의 모형화기간인 2011년 1월부터 2014년 12월까지의 기간에 대한 백분위 점수의 백분율은 59.5%로 산출할 수 있다.
예를 들면, 전자 장치는 모형화기간의 각 시점에 대한 -1시점의 추세 이격도의 백분위에 기초하여, 모형화기간의 각 시점에 대한 -1시점의 추세 이격도의 변동 등급을 결정할 수 있다. 예를 들면, 전자 장치는, 모형화기간의 각 시점에 대한 -1시점의 추세 이격도의 백분위의 백분율이 85% 이상인 경우 5등급, 65% 이상이고 85% 미만인 경우 4등급, 35% 이상이고 65% 미만인 경우 3등급, 20% 이상이고 35% 미만인 경우 2등급, 20% 미만인 경우 1등급으로 모형화기간의 각 시점에 대한 -1시점의 추세 이격도의 변동 등급을 결정할 수 있다.
예를 들면, 전자 장치는 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 백분위에 기초하여, 모형화기간의 각 시점에 대한 -1시점의 추세 이격도의 변동 등급을 결정할 수 있다. 예를 들면, 전자 장치는, 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 백분위의 백분율이 85% 이상인 경우 5등급, 65% 이상이고 85% 미만인 경우 4등급, 35% 이상이고 65% 미만인 경우 3등급, 20% 이상이고 35% 미만인 경우 2등급, 20% 미만인 경우 1등급으로 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 변동 등급을 결정할 수 있다.
예를 들면, 전자 장치는 모형화기간의 각 시점에 대한 -1시점의 추세 이격도의 변동 등급 및 모형화기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 변동 등급에 기초하여, 모형화기간의 각 시점에 대한 -1시점의 보정 후 추세 종합변동등급을 결정할 수 있다. 예를 들면, 2011년 4월에 대한 -1시점의 추세 이격도의 변동 등급이 4등급, 2011년 4월에 대한 -1시점의 보정 후 데이터 값의 증감률의 변동 등급이 4등급인 경우, 전자 장치는, 2011년 4월에 대한 -1시점의 보정 후 추세 종합변동등급을 4.4등급으로 결정할 수 있다.
도 10b를 참조하면, 전자 장치는, 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 각 시점에 대한 -1시점의 추세형 데이터 값, 모형화기간의 각 시점에 대한 -1시점의 보정 후 추세 종합변동등급, 모형화기간의 각 시점에 대한 보정 후 추세 종합변동등급, 모형화기간의 각 시점에 대한 월별, 분기별 및/또는 반기별 데이터를 결정하여, 모형화기간의 각 시점에 대응시킬 수 있다.
예를 들면, 전자 장치는, 2011년 5월의 추세형 데이터 값을 32.3, 2011년 5월에 대한 -1시점의 추세형 데이터 값을 30.5, 2011년 5월에 대한 -1시점의 보정 후 추세 종합변동등급은 5.3등급, 2011년 5월의 보정 후 추세 종합변동등급은 5.5등급, 해당 월은 5월, 해당 분기는 2분기, 해당 반기는 상반기로 결정할 수 있다.
도 10c를 참조하면, 전자 장치는, 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 각 시점에 대한 -1시점의 보정 후 추세 종합변동등급과 모형화기간의 각 시점에 대한 현 시점의 보정 후 추세 종합변동등급 간의 관계를 산출할 수 있다.
예를 들면, 도 10b를 참조하면, 모형화기간의 각 시점에 대한 -1시점의 보정 후 추세 종합변동등급이 2.2등급인 시점은 2012년 4월, 5월, 7월, 8월 및 9월, 2013년 3월, 4월 및 10월로 8회이며, 이 중에서 현 시점의 보정 후 추세 종합변동등급이 1.3등급으로 변경된 횟수가 1회, 2.2등급으로 유지된 횟수가 4회, 2.5등급으로 변경된 횟수가 1회, 3.5등급으로 변경된 횟수가 1회, 4.5등급으로 변경된 횟수가 1회인 것을 확인할 수 있다.
도 10d를 참조하면, 전자 장치는, 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 각 시점에 대한 -1시점의 보정 후 추세 종합변동등급과 현 시점의 보정 후 추세 종합변동등급 간의 관계를 산출할 수 있다.
예를 들면, 도 10b를 참조하면, -1시점의 보정 후 추세 종합변동등급이 2.2등급인 시점은 2012년 4월, 5월, 7월, 8월 및 9월, 2013년 3월, 4월 및 10월이며, 이 중에서 현 시점의 보정 후 추세 종합변동등급의 최빈도 등급은 2.2등급, 최고 등급인 극한 등급은 4.5등급, 중위 등급은 2.5등급, 최저 등급인 극저등급은 1.3등급인 것을 확인할 수 있다.
도 10e를 참조하면, 전자 장치는, 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 현 시점의 보정 후 추세 종합변동등급에 기초하여, 동일한 종합 변동 등급을 포함하는 현 시점의 추세 이격도 값들의 중위수를 산출할 수 있다. 본 실시 예에서는 추세 이격도 값들의 중위수를 산출하는 것을 예로 들어 설명하나, 본 발명은 상기의 예시적 실시 예에 한정되는 것은 아니며, 추세 이격도 값들의 평균 등을 산출하는 것을 포함할 수 있다.
예를 들면, 도 10b를 참조하면, 현 시점의 보정 후 추세 종합변동등급이 3.2 등급인 시점은 2011년 1월 및 7월, 2012년 1월 및 2월, 2013년 8월이며, 이 중에서 현 시점의 추세 이격도 값들의 중위수는 2011년 2월의 73.5% 인 것을 확인할 수 있다.
도 10f를 참조하면, 전자 장치는, 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, -1시점의 추세 종합변동등급에 대한 현 시점의 보정 후 추세 종합변동등급에 기초하여, 모형화기간의 각 시점에 대한 현 시점의 추세 이격도를 산출할 수 있다.
예를 들면, 전자 장치는, 모형화기간의 각 시점에 대한 -1시점의 보정 후 추세 종합변동등급이 3.3인 경우, 이에 대응하는 현 시점의 보정 후 추세 종합변동등급의 최빈도 등급은 3.4등급, 최고 등급은 4.4등급, 중위 등급은 3.4등급, 최저 등급은 2.1등급인 것을 확인할 수 있다. 또한, 예를 들면, 전자 장치는, -1시점의 추세 종합변동등급에 대한 현 시점의 보정 후 추세 종합변동등급에 대응하는 현 시점의 추세 이격도들의 중위수는, 최빈도 등급인 3.4등급은 81.7%, 최고 등급인 4.4등급은 136.0%, 중위 등급인 3.4등급은 81.7%, 최저 등급인 2.1등급은 3.8%인 것을 확인할 수 있고, -1시점의 추세 종합변동등급에 대한 현 시점의 보정 후 추세 종합변동등급에 대응하는 현 시점의 추세 이격도들의 중위수들의 평균 값은 75.8%로 산출할 수 있다.
도 11a를 참조하면, 전자 장치는, 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 보정 후 데이터 및 추세형 데이터에 기초하여, 보정 후 데이터 및 추세형 데이터의 월별 추세 이격도와 관련된 데이터를 생성할 수 있다.
예를 들면, 도 10b를 참조하면, 전자 장치는, 2011년 3월, 2012년 3월, 2013년 3월 및 2014년 3월의 현 시점의 추세 이격도 값들에 기초하여, 현 시점의 추세 이격도의 3월 최대값은 134.1%, 3월 평균값은 63.8%, 3월 최소값은 7.6%로 산출할 수 있다. 본 실시 예에서는 추세 이격도의 최대값, 최소값 및 평균값을 산출하는 것을 예로 들어 설명하나, 본 발명은 상기의 예시적 실시 예에 한정되는 것은 아니며, 추세 이격도의 중위수 등을 산출하는 것을 포함할 수 있다.
도 11b를 참조하면, 전자 장치는, 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 보정 후 데이터 및 추세형 데이터에 기초하여, 보정 후 데이터 및 추세형 데이터의 분기별 추세 이격도와 관련된 데이터를 생성할 수 있다.
예를 들면, 도 10b를 참조하면, 전자 장치는, 2011년 4월 내지 6월, 2012년 4월 내지 6월, 2013년 4월 내지 6월 및 2014년 4월 내지 6월의 현 시점의 추세 이격도 값들에 기초하여, 현 시점의 추세 이격도의 2분기 최대값은 347.8%, 2분기 평균값은 140.0%, 2분기 최소값은 4.8%로 산출할 수 있다.
도 11c를 참조하면, 전자 장치는, 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 보정 후 데이터 및 추세형 데이터에 기초하여, 보정 후 데이터 및 추세형 데이터의 반기별 추세 이격도와 관련된 데이터를 생성할 수 있다.
예를 들면, 도 10b를 참조하면, 전자 장치는, 2011년 1월 내지 6월, 2012년 1월 내지 6월, 2013년 1월 내지 6월 및 2014년 1월 내지 6월의 현 시점의 추세 이격도 값들에 기초하여, 현 시점의 추세 이격도의 상반기 최대값은 347.8%, 상반기 평균값은 104.0%, 상반기 최소값은 4.8%로 산출할 수 있다.
도 12a를 참조하면, 전자 장치는, 예를 들면, 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 각 시점에 대한 현 시점의 추세 이격도에 기초하여, 현 시점의 추세형 데이터 값에 대한 보정 데이터를 산출할 수 있다. 여기서, 추세형 데이터 값에 대한 보정 데이터는, 예를 들면, 추세형 데이터에 추세 이격도를 곱한 데이터를 의미할 수 있다. 모형화기간의 각 시점에 대한 현 시점의 추세 이격도는 -1시점의 추세 종합변동등급에 대한 현 시점의 보정 후 추세 종합변동등급에서의 추세 이격도를 의미하고, 예컨대, 최빈도 등급, 최고 등급, 중위 등급, 최저 등급 등으로 나타낼 수 있다.
예를 들면, 전자 장치는, 2011년 8월에 대한 추세형 데이터 값과, 2011년 8월에 대한 현 시점의 추세 이격도를 곱한 값을, 2011년 8월의 추세형 데이터 값에 대한 보정 데이터 예측 값으로 산출할 수 있다. 예를 들면, 전자 장치는, 2011년 8월에 대한 추세형 데이터 값인 37.8과, 2011년 8월에 대한 현 시점의 추세 이격도인 77%(최빈도 등급), 77%(최고 등급), 74%(중위 등급), 11%(최저 등급)을 각각 곱한 값인, 29.1(최빈도 등급), 29.1(최고 등급), 27.8(중위 등급), 4.2(최저 등급)을 2011년 8월의 추세형 데이터 값에 대한 보정 데이터 예측 값으로 산출할 수 있다.
도 12b를 참조하면, 전자 장치는, 예를 들면, 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 보정 후 데이터 및 추세형 데이터의 월별 추세 이격도에 기초하여, 각 시점의 추세형 데이터 값에 대한 월별 보정 데이터 예측 값을 산출할 수 있다.
예를 들면, 전자 장치는, 2011년 8월에 대한 추세형 데이터 값과, 2011년 8월에 대한 현 시점의 월별 추세 이격도를 곱한 값을, 2011년 8월의 추세형 데이터 값에 대한 월별 보정 데이터 예측 값으로 산출할 수 있다. 예를 들면, 전자 장치는, 2011년 8월에 대한 추세형 데이터 값인 37.8과, 2011년 8월에 대한 월별 최대 추세 이격도인 74.2%, 월별 평균 추세 이격도인 47.0%, 월별 최소 추세 이격도인 0.8%를 각각 곱한 값인, 28.1(최대 추세 이격도), 17.8(평균 추세 이격도), 0.3(최소 추세 이격도)를 2011년 8월의 추세형 데이터 값에 대한 월별 보정 데이터 예측 값으로 각각 산출할 수 있다.
도 12c를 참조하면, 전자 장치는, 예를 들면, 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 보정 후 데이터 및 추세형 데이터의 분기별 추세 이격도에 기초하여, 각 시점의 추세형 데이터 값에 대한 분기별 보정 데이터 예측 값을 산출할 수 있다.
예를 들면, 전자 장치는, 2011년 8월에 대한 추세형 데이터 값과, 2011년 8월에 대한 현 시점의 분기별 추세 이격도를 곱한 값을, 2011년 8월의 추세형 데이터 값에 대한 분기별 보정 데이터 예측 값으로 산출할 수 있다. 예를 들면, 전자 장치는, 2011년 8월에 대한 추세형 데이터 값인 37.8과, 2011년 8월에 대한 분기별 최대 추세 이격도인 156.2%, 분기별 평균 추세 이격도인 47.6%, 분기별 최소 추세 이격도인 0.8%를 각각 곱한 값인, 59.0(최대 추세 이격도), 18.0(평균 추세 이격도), 0.3(최소 추세 이격도)를 2011년 8월의 추세형 데이터 값에 대한 분기별 보정 데이터 예측 값으로 각각 산출할 수 있다.
도 12d를 참조하면, 전자 장치는, 예를 들면, 추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 보정 후 데이터 및 추세형 데이터의 반기별 추세 이격도에 기초하여, 각 시점의 추세형 데이터 값에 대한 반기별 보정 데이터 예측 값을 산출할 수 있다.
예를 들면, 전자 장치는, 2011년 8월에 대한 추세형 데이터 값과, 2011년 8월에 대한 현 시점의 반기별 추세 이격도를 곱한 값을, 2011년 8월의 추세형 데이터 값에 대한 반기별 보정 데이터 예측 값으로 산출할 수 있다. 예를 들면, 전자 장치는, 2011년 8월에 대한 추세형 데이터 값인 37.8과, 2011년 8월에 대한 반기별 최대 추세 이격도인 312.4%, 반기별 평균 추세 이격도인 76.3%, 반기별 최소 추세 이격도인 0.8%를 각각 곱한 값인, 118.1(최대 추세 이격도), 28.8(평균 추세 이격도), 0.3(최소 추세 이격도)를 2011년 8월의 추세형 데이터 값에 대한 반기별 보정 데이터 예측 값으로 각각 산출할 수 있다.
기타 변수후보 생성
도 13a를 참조하면, 예를 들면, 전자 장치는 추세형 분석식 및 비추세형 분석식을 결정하기 위한 독립 변수를 생성하기 위해, 모형화기간의 보정 후 데이터에 기초하여, 모형화기간의 각 시점에 대한 이전 시점의 보정 후 데이터 값을 산출할 수 있다. 또한, 전자 장치는, 예를 들면, 모형화기간의 각 시점에 대한 이전 시점의 보정 후 데이터 값에 기초하여, 모형화기간의 각 시점에 대한 이전 시점들의 보정 후 데이터의 평균값을 산출할 수 있다. 전자 장치는, 예를 들면, 모형화기간의 각 시점에 대한 이전 시점의 보정 후 데이터 값 및/또는 모형화기간의 각 시점에 대한 이전 시점들의 보정 후 데이터의 평균값을 추세형 분석식 및 비추세형 분석식과 관련된 사전 독립 변수로 결정할 수 있다. 예를 들면, 도 5a를 참조하면, 2011년 2월의 보정 후 데이터 값은 22.5, 2011년 3월의 보정 후 데이터 값은 38.5, 2011년 4월의 보정 후 데이터 값은 49.5이므로, 전자 장치는, 2011년 4월에 대한 -1시점의 보정 후 데이터 값은 현재 2011년 3월의 보정 후 데이터 값인 38.5로 결정할 수 있고, 2011년 4월에 대한 -2시점의 보정 후 데이터 값은 현재 2011년 2월의 보정 후 데이터 값인 22.5로 결정할 수 있다. 예를 들면, 전자 장치는 2011년 4월에 대한 2시점 이전까지의 보정 후 데이터의 평균값은 2011년 2월의 보정 후 데이터 값인 22.5와 2011년 3월의 보정 후 데이터 값은 38.5의 평균값인 30.5로 산출할 수 있다. 본 실시 예에서는 사전 독립 변수와 관련하여, 각 시점에 대한 -2시점 내지 -6시점의 보정 후 데이터 값 등을 예로 들어 설명하나, 본 발명은 상기의 예시적 실시 예에 한정되는 것은 아니다. 한편, 본 실시 예에서는 사전 독립 변수와 관련하여, 단순 이동평균(simple moving average)을 사용하여 사전 독립 변수를 산출하는 것을 예로 들어 설명하나, 본 발명은 예시적 실시 예에 한정되는 것은 아니며, 가중 이동평균(weighted moving average), 기하 이동평균(geometric moving average) 등 모든 종류의 이동평균을 사용하여 사전 독립 변수를 산출하는 것을 포함할 수 있다.
예를 들면, 도 13b 내지 13e를 참조하면, 전자 장치는 비추세형 분석식과 관련된 종합 변동 등급의 변화에 따른 독립 변수, 추세형 분석식과 관련된 연단위 월별 변화에 따른 독립 변수, 추세형 분석식과 관련된 연단위 분기별 변화에 따른 독립 변수 및/또는 추세형 분석식과 관련된 연단위 반기별 변화에 따른 독립 변수를 결정할 수 있다.
예를 들면, 도 13f를 참조하면, 전자 장치는 모형화기간의 각 시점에 대한 추세 이격도, 월별 추세 이격도, 분기별 추세 이격도, 반기별 추세 이격도와 관련된 독립 변수를 결정할 수 있다.
하나의 예에 따르면, 전자 장치는, 다중 회귀분석식을 산출하기 위해, 도 13a 내지 13f에 개시된 독립 변수의 상용 로그화, 제곱근화, 자연 로그화, 제곱화 등 다양한 방식에 의해 변형된 독립 변수를 사용할 수도 있다.
모형별 회귀분석식 후보 산출
하나의 예에 따르면, 전자 장치는 도 3a, 3b 및/또는 3c의 S330, S330', S330" 단계에서, S310 단계에서 생성한 독립 변수에 기초하여 다중 회귀분석식을 산출할 수 있다(S331 참조). 전자 장치는, 예를 들면, 생성된 독립 변수에 기초하여, 추세형 분석식, 비추세형 분석식 및/또는 혼합형 분석식을 각각 산출할 수 있다.
예컨대, 프로세서(110) 내지 회귀분석 모듈(230)은, 생성된 독립변수 내지 독립변수 후보에 기초하여, 추세형 분석식, 비추세형 분석식 및/또는 혼합형 분석식을 산출할 수 있다. 이때, 다중 회귀분석식은 동시 입력 추정 방법, 단계적 추정 방법, 후진(backward) 추정 방법 등을 사용하여 산출할 수 있다.
예를 들면, 도 14a를 참고하면, 전자 장치는, 혼합형 분석식을 산출하기 위해, 비추세형 분석식과 관련된 독립 변수(예: 비추세형 분석식과 관련된 종합 변동 등급의 변화에 따른 독립 변수, 비추세형 분석식과 관련된 연단위 월별 변화에 따른 독립 변수, 비추세형 분석식과 관련된 연단위 분기별 변화에 따른 독립 변수, 비추세형 분석식과 관련된 연단위 반기별 변화에 따른 독립 변수 및/또는 비추세형 분석식과 관련된 연단위 반기별 변화에 따른 독립 변수), 추세형 분석식 및 비추세형 분석식과 관련된 사전 독립 변수(예: 각 시점에 대한 이전 시점의 보정 후 데이터 값 및/또는 각 시점에 대한 이전 시점들의 보정 후 데이터의 평균값) 및/또는 추세형 분석식과 관련된 독립 변수(예: 추세형 분석식과 관련된 종합 변동 등급의 변화에 따른 독립 변수, 추세형 분석식과 관련된 연단위 월별 변화에 따른 독립 변수, 추세형 분석식과 관련된 연단위 분기별 변화에 따른 독립 변수 및/또는 추세형 분석식과 관련된 연단위 반기별 변화에 따른 독립 변수)를 사용할 수 있다.
예를 들면, 전자 장치는, 추세형 분석식을 산출하기 위해, 추세형 분석식 및 비추세형 분석식과 관련된 사전 독립 변수(예: 각 시점에 대한 이전 시점의 보정 후 데이터 값 및/또는 각 시점에 대한 이전 시점들의 보정 후 데이터의 평균값) 및/또는 추세형 분석식과 관련된 독립 변수(예: 추세형 분석식과 관련된 종합 변동 등급의 변화에 따른 독립 변수, 추세형 분석식과 관련된 연단위 월별 변화에 따른 독립 변수, 추세형 분석식과 관련된 연단위 분기별 변화에 따른 독립 변수 및/또는 추세형 분석식과 관련된 연단위 반기별 변화에 따른 독립 변수)를 사용할 수 있다.
예를 들면, 전자 장치는, 비추세형 분석식을 산출하기 위해, 비추세형 분석식과 관련된 독립 변수(예: 비추세형 분석식과 관련된 종합 변동 등급의 변화에 따른 독립 변수, 비추세형 분석식과 관련된 연단위 월별 변화에 따른 독립 변수, 비추세형 분석식과 관련된 연단위 분기별 변화에 따른 독립 변수, 비추세형 분석식과 관련된 연단위 반기별 변화에 따른 독립 변수 및/또는 비추세형 분석식과 관련된 연단위 반기별 변화에 따른 독립 변수) 및/또는 추세형 분석식 및 비추세형 분석식과 관련된 사전 독립 변수(예: 각 시점에 대한 이전 시점의 보정 후 데이터 값 및/또는 각 시점에 대한 이전 시점들의 보정 후 데이터의 평균값)를 사용할 수 있다.
예컨대, 전자장치는 생성된 독립 변수에 기초하여 산출되는 추세형 분석식, 비추세형 분석식 및/또는 혼합형 분석식의 종속변수를 결과데이터의 보정 후 데이터로
회귀분석식 예비결정
예컨대, 전자 장치는 도 3a, 3b 및/또는 3c의 S331 단계에서, 예를 들면, 독립 변수를 이용하여 산출된 적어도 하나의 단일 내지 다중 회귀분석식 중에서 시계열 데이터의 예측 결과를 산출하기에 적합한 단일 내지 다중 회귀분석식을 예측 모형 별로 결정할 수 있다. 예컨대, 이때, 결정되는 예측 모형별 회귀분석식에 대하여 모형화기간 이후의 검증기간에 대한 회귀분석모형 검증을 통해 적합한 모형이 결정될 수 있다. 이하에서, 검증기간에 대한 회귀분석모형 검증의 대상이 되는 예측 모형별 회귀분석식의 예비 결정에 대해 살펴본다.
예를 들면, 도 14b를 참조하면, 특정 예측 모형(예: 혼합형 예측 모형, 추세형 예측 모형 또는 비추세형 예측 모형)에 대하여 6개의 다중 회귀분석식이 산출된 경우, 전자 장치는, 6개의 다중 회귀분석식 중에서 시계열 데이터의 예측 결과를 산출하기에 적합한 다중 회귀분석식을 결정할 수 있다. 예를 들면, 전자 장치는 두 변량 사이의 상관 관계의 정도를 나타내는 척도인 상관 계수, 상관 계수를 제곱한 값인 결정 계수, 수정된 결정 계수, 더빈-왓슨 비 등에 기초하여, 단일 내지 다중 회귀분석식이 시계열 데이터의 예측 결과를 산출하기에 적합한지 여부를 판단할 수 있다.
도 14c를 참조하면, 예를 들면, 특정 예측 모형(예: 혼합형 예측 모형, 추세형 예측 모형 또는 비추세형 예측 모형)에 대하여 6개의 다중 회귀분석식이 산출된 경우, 전자 장치는, 6개의 다중 회귀분석식 중에서 시계열 데이터의 예측 결과를 산출하기에 적합한 다중 회귀분석식을 결정할 수 있다. 예를 들면, 전자 장치는 유의 확률, 공차 한계, 분산 확대 인자 등에 기초하여, 다중 회귀분석식이 시계열 데이터의 예측 결과를 산출하기에 적합한지 여부를 판단할 수 있다.
예를 들면, 도 14d를 참조하면, 전자 장치는, 예측 결과를 산출하기에 적합한 혼합형 분석식, 비추세형 분석식 및/또는 추세형 분석식을 각각 모형별로 산출할 수 있다.
예컨대, 전자 장치는 산출된 단일 내지 다중 회귀분석식에 기초하여, 모형화기간에 대한 예측데이터를 생성할 수 있다. 예를 들면, 전자 장치는, 예측 모형 별로 산출된 단일 내지 다중 회귀분석식에 S310 단계에서 생성한 독립 변수를 대입함으로써, 모형화기간에 대한 예측데이터를 예측 모형 별로 생성할 수 있다. 이때, 전자 장치는 S310 단계에서 획득된 모형화기간에 대한 데이터와, S331 단계에서 생성한 모형화기간에 대한 예측데이터를 비교할 수 있다. 모형화기간에 대한 예측데이터와 비교되는 획득된 모형화기간에 대한 데이터는 서로 상응하는 데이터이다. 예컨대, 만일 획득된 모형화기간에 대한 비교 데이터가 시계열 사건의 결과데이터이고 예측 모형별로 산출되는 단일 내지 다중 회귀분석식의 종속변수가 시계열 사건의 결과데이터의 보정 값에 상응하는 예측된 데이터인 경우, 모형화기간에 대한 예측데이터는 종속변수의 결과에 대해 역보정 과정을 거쳐 획득된 시계열 사건의 결과데이터에 상응하는 예측된 데이터야 한다.
예를 들면, 전자 장치는 모형화기간에 대한 데이터와 모형화기간에 대한 예측데이터를 비교한 결과에 기초하여, 모형화기간에 대한 예측데이터의 적합도를 예측 모형 별로 산출할 수 있다. 예컨대, 전자 장치는 모형화기간에 대한 예측 모형별 적합도에 기초하여 예컨대 적어도 하나 이상의 모형별로 예측 모형을 결정하여, 회귀분석모형 검증을 위한 회귀분석식들에 대한 예비결정을 수행할 수 있다. 예컨대 적어도 하나 이상의 모형별로 결정된 예측 모형은 회귀분석모형 검증을 통해 최종 예측 모형으로 결정될 수 있다.
예를 들면, 전자 장치는, 시계열 데이터의 모형화기간을 일정한 간격으로 구분할 수 있고, 예측 모형별 적합도를 일정한 간격으로 구분된 기간별로 산출할 수 있다. 또한, 전자 장치는, 예를 들면, 일정한 간격으로 구분된 각 기간별 예측 모형별 적합도에 기초하여, 시계열 데이터의 모형화기간에 대한 예측 모형별 평균 적합도를 산출할 수 있고, 예컨대 적어도 하나 이상의 모형별로 평균 적합도가 가장 높은 예측 모형을 예측 모형으로 결정하여 회귀분석모형 검증을 위한 회귀분석식들에 대한 예비결정을 수행할 수 있다.
예컨대, 프로세서(110) 내지 회귀분석 모듈(230)은 인공지능(artificial intelligence) 기술인 기계 학습(machine learning) 기술, 예컨대 딥 러닝(deep learning) 기술을 이용하여 단일 내지 다중 회귀분석식을 사용하여 예측데이터를 얻고 비교하여 예측 모형별 적합도를 산출하고 예측 모형의 예비결정을 수행할 수 있다.
회귀분석모형 검증 및 결정
하나의 예에 따르면, 전자 장치는 도 3b 및/또는 3c의 S333' 또는 S333" 단계에서, 산출된 단일 내지 다중 회귀분석식에 기초하여, 적어도 검증기간에 대한 예측데이터를 생성하고, 적어도 검증기간의 비교데이터와 비교하고 비교결과 적합도에 따라 예측을 위한 최적의 회귀분석모형을 결정할 수 있다. 예를 들면, 전자 장치는, 예측 모형 별로 산출된 단일 내지 다중 회귀분석식에 S330', S330" 단계에서 생성한 독립 변수를 대입함으로써, 검증기간에 대한 예측데이터를 예측 모형 별로 생성할 수 있다. 예컨대, 이때, 검증기간에 대한 예측데이터는 검증기간의 비교데이터에 상응하는 즉, 동일한 성질을 갖는 예측된 데이터이고, 만일 단일 내지 다중 회귀분석식의 종속변수의 결과가 검증기간의 비교데이터와 상응하는 관계가 아니라면 상응하는 관계가 되도록 종속변수의 결과를 변환시켜야 한다. 예컨대, 종속변수가 시계열 사건의 결과데이터의 보정 데이터이고 검증기간의 비교데이터가 시계열 사건의 결과데이터인 경우 종속변수의 결과에 대한 역보정을 수행한 예측데이터를 검증기간의 비교데이터와 비교할 수 있다.
예컨대, 예측 모형 별로 산출된 단일 내지 다중 회귀분석식에 대입되는 독립변수는 검증기간에 대한 것으로 변수 생성과정에서 생성되거나 또는 검증기간에 대한 1 분석시점 단위로 직전시점의 예측데이터를 토대로 생성될 수 있다. 예컨대, 하나의 예에서, S333" 단계를 참조하면, 검증기간에 대한 1 분석시점 단위로 예측모형별로 독립변수 데이터를 생성하고 생성된 독립변수 데이터를 예측모형에 대입하여 검증 예측데이터를 예측모형별로 생성할 수 있다.
이하에서, 먼저, 검증기간에 대한 1 분석시점 단위로 예측모형별로 독립변수 데이터를 생성하는 과정을 살펴본다.
하나의 예에서, 전자 장치는 S333a 단계에서, 모형화기간의 보정 후 데이터 및/또는 검증기간의 보정 후 데이터에 기초하여, 검증기간에 대한 예측데이터의 생성을 위한 예측모형별 독립변수를 생성할 수 있다.
예컨대 도 15를 참조하면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립변수를 생성하기 위해, 검증기간의 각 시점에 대한 이전 시점의 보정 후 데이터 값을 결정할 수 있다. 예를 들면, 도 5b를 참조하면, 전자 장치는 모형화기간 마지막 시점인 2014년 12월의 보정 후 데이터 값인 195.5를 검증기간 최초 시점인 2015년 1월에 대한 -1시점의 보정 후 데이터 값으로 결정할 수 있다. 예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 검증기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률을 결정할 수 있다. 예를 들면, 2015년 1월의 1시점 이전인 2014년 12월의 보정 후 데이터 값은 195.5이며, 2015년 1월의 2시점 이전인 2014년 11월의 보정 후 데이터 값은 122.5이므로, 전자 장치는 2015년 1월에 대한 -1시점의 보정 후 데이터 값의 증감률을, 195.5를 122.5로 나눈 값의 백분율인 159.6%로 결정할 수 있다. 예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 검증기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 백분위를 산출할 수 있다. 예를 들면, 전자 장치는, 2015년 1월에 대한 -1시점의 보정 후 데이터 값인 195.5의 모형화기간인 2011년 1월부터 2014년 12월까지의 기간에 대한 백분위 점수의 백분율을 97.7%로 산출할 수 있다. 예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 예측 시점의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 백분위를 산출할 수 있다. 예를 들면, 전자 장치는, 2015년 1월의 -1시점의 보정 후 데이터 값의 증감률인 159.6%의 모형화기간인 2011년 1월부터 2014년 12월까지의 기간에 대한 백분위 점수의 백분율을 76.6%로 산출할 수 있다.
예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 검증기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 백분위에 기초하여, 검증기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 변동 등급을 결정할 수 있다. 예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 검증기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 백분위에 기초하여, 검증기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 변동 등급을 결정할 수 있다.
예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 검증기간의 추세형 데이터를 산출할 수 있다. 예를 들면, 전자 장치는 2015년 1월의 순번인 55를 상기 [식 2]에 대입함으로써 2015년 1월의 추세형 데이터 값으로 112.5를 산출할 수 있다. 예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 검증기간의 각 시점에 대한 이전 시점의 추세형 데이터 값을 결정할 수 있다. 예를 들면, 2015년 1월의 추세형 데이터 값이 112.5이고, 2014년 12월의 추세형 데이터 값이 110.67이므로, 전자 장치는 2015년 1월에 대한 -1시점의 추세형 데이터 값을 110.67로 결정할 수 있다. 즉, 2015년 1월의 추세형 데이터 값인 112.5는, 1시점 이전인 2014년 12월의 추세형 데이터 값인 110.67에서 한 달이 경과함으로써 1.83이 증가한 값임을 나타낼 수 있다. 예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 검증기간의 추세형 데이터 값과 검증기간의 보정 후 데이터 값의 차이를 나타내는 추세 이격도를 산출할 수 있다. 예를 들면, 2015년 1월에 대한 -1시점의 보정 후 데이터 값은 195.5이고, 2015년 1월에 대한 -1시점의 추세형 데이터 값은 110.67이므로, 전자 장치는 195.5를 110.67로 나눈 값의 백분율인 176.6%를 2015년 1월에 대한 -1시점의 추세 이격도로 산출할 수 있다. 예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 검증기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률을 결정할 수 있다. 예를 들면, 2015년 1월의 -1시점의 보정 후 데이터 값은 195.5이며, 2015년 1월의 -2시점의 보정 후 데이터 값은 122.5이므로, 전자 장치는 2015년 1월의 -1시점의 보정 후 데이터 값의 증감률을, 195.5를 122.5로 나눈 값의 백분율인 159.6%로 결정할 수 있다. 예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 검증기간의 각 시점에 대한 -1시점의 추세 이격도의 백분위를 산출할 수 있다. 예를 들면, 전자 장치는, 2015년 1월에 대한 -1시점의 추세 이격도인 176.6%의 모형화기간인 2011년 1월부터 2014년 12월까지의 기간에 대한 백분위 점수의 백분율은 86.3%로 산출할 수 있다. 예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 검증기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 백분위를 산출할 수 있다. 예를 들면, 전자 장치는, 2015년 1월의 -1시점의 보정 후 데이터의 값의 증감률인 159.6%의 모형화기간인 2011년 1월부터 2014년 12월까지의 기간에 대한 백분위 점수의 백분율은 76.6%로 산출할 수 있다.
예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 검증기간의 각 시점에 대한 -1시점의 추세 이격도의 백분위에 기초하여, 검증기간의 각 시점에 대한 -1시점의 추세 이격도의 변동 등급을 결정할 수 있다. 예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 검증기간의 각 시점에 대한 -1시점의 추세 이격도의 백분위의 백분율이 85% 이상인 경우 5등급, 65% 이상이고 85% 미만인 경우 4등급, 35% 이상이고 65% 미만인 경우 3등급, 20% 이상이고 35% 미만인 경우 2등급, 20% 미만인 경우 1등급으로 검증기간의 각 시점에 대한 -1시점의 추세 이격도의 변동 등급을 결정할 수 있다.
예를 들면, 전자 장치는 검증기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 백분위에 기초하여, 검증기간의 각 시점에 대한 -1시점의 추세 이격도의 변동 등급을 결정할 수 있다. 예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 검증기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 백분위의 백분율이 85% 이상인 경우 5등급, 65% 이상이고 85% 미만인 경우 4등급, 35% 이상이고 65% 미만인 경우 3등급, 20% 이상이고 35% 미만인 경우 2등급, 20% 미만인 경우 1등급으로 검증기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 변동 등급을 결정할 수 있다.
예를 들면, 전자 장치는 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성하기 위해, 검증기간의 각 시점에 대한 -1시점의 추세 이격도의 변동 등급 및 검증기간의 각 시점에 대한 -1시점의 보정 후 데이터 값의 증감률의 변동 등급에 기초하여, 검증기간의 각 시점에 대한 -1시점의 보정 후 데이터 종합변동등급을 결정할 수 있다. 예를 들면, 2015년 1월에 대한 -1시점의 추세 이격도의 변동 등급이 5등급, 2015년 1월에 대한 -1시점의 보정 후 데이터 값의 증감률의 변동 등급이 4등급인 경우, 전자 장치는, 2015년 1월에 대한 -1시점의 보정 후 데이터 종합변동등급을 5.4등급으로 결정할 수 있다.
예컨대, 검증기간에 대한 예측데이터의 생성을 위한 독립변수 항목은 각 예측 모형별로 예비결정된 회귀분석식의 독립변수 항목과 일치되도록 1 분석시점 단위로 독립변수가 생성될 수 있다.
다음으로, 검증기간에 대한 예측데이터의 생성과정을 살펴본다.
하나의 예에 따르면, 전자 장치는 도 3c의 S333a 단계에서, 예측모형별로 산출된 단일 내지 다중 회귀분석식에 기초하여, 검증기간에 대한 예측데이터를 생성할 수 있다. 예를 들면, 전자 장치는, S331 단계에서 예비결정으로 산출된 예측 모형별 단일 내지 다중 회귀분석식에, S333a 단계에서 검증기간의 1분석시점 단위로 생성한 독립변수를 대입함으로써, 검증기간에 대한 예측데이터를 예측 모형 별로 생성할 수 있다.
이때, 전자 장치는 1분석시점 단위의 예측데이터의 산출에 따라 검증기간 전체에 대한 예측데이터의 생성 여부를 판단할 수 있다. 예를 들면, 전자 장치는 검증기간 전체에 대해서 예측데이터가 생성되지 않은 경우, 모형화기간의 보정 후 데이터 및/또는 검증기간의 보정 후 데이터에 기초하여, 예측데이터가 생성되지 않은 나머지 검증기간에 대한 예측데이터의 생성을 위한 독립 변수를 생성할 수 있다. 이 과정을 반복수행하여 도 3c의 S333b 단계에서 검증기간 전체에 대해서 예측데이터를 획득할 수 있다.
다음으로, 검증기간에 대한 예측데이터를 비교하여 회귀분석모형을 결정하는 과정을 살펴본다.
예컨대, 도 3c의 S333c 단계에서, 전자 장치는 S333b 단계에서 검증기간 전체에 대해서 예측데이터가 생성된 경우, S310 단계에서 획득된 검증기간에 대한 데이터와, S333b 단계에서 생성한 검증기간에 대한 예측데이터를 비교할 수 있다. 예컨대, 도 3a의 S335 단계 및/또는 도 3b의 S335a 내지 S335b 단계에서, 전자 장치는 검증기간에 대한 데이터와 검증기간에 대한 예측데이터를 비교한 결과에 기초하여, 검증기간에 대한 예측데이터의 적합도를 예측 모형 별로 산출할 수 있다. 예컨대, 전자 장치는 검증기간에 대한 예측 모형별 적합도에 기초하여, 시계열 데이터의 예측을 위한 방법에 사용하는 최종 예측 모형을 결정할 수 있다. 예컨대, 예측 모형별 적합도는 정상 R 제곱을 이용하는 등 다양한 측정 방법을 통해 산출될 수 있다.
예컨대, 프로세서(110) 내지 회귀분석 모듈(230)은 인공지능(artificial intelligence) 기술인 기계 학습(machine learning) 기술, 예컨대 딥 러닝(deep learning) 기술을 이용하여 단일 내지 다중 회귀분석식을 사용하여 예측데이터를 얻고 비교하여 예측 모형별 적합도를 산출하고 회귀분석모형을 결정할 수 있다.
예를 들면, 전자 장치는, 시계열 데이터의 검증기간 또는 모형화기간과 검증기간 전체를 일정한 간격으로 구분할 수 있고, 예측 모형별 적합도를 일정한 간격으로 구분된 기간별로 산출할 수 있다. 또한, 전자 장치는, 예를 들면, 일정한 간격으로 구분된 각 기간별 예측 모형별 적합도에 기초하여, 시계열 데이터의 검증기간 또는 모형화기간과 검증기간 전체에 대한 예측 모형별 평균 적합도를 산출할 수 있고, 평균 적합도가 가장 높은 예측 모형을 최종 예측 모형으로 결정할 수도 있다.
도 16a는 본 발명의 다양한 실시 예에 따른 전자 장치가 산출한 모형화기간 및/또는 검증기간에 대한 예측데이터에 기초한 예측 모형별 적합도와 관련된 데이터의 예시를 나타낸 도면이고, 도 16b는 본 발명의 하나의 실시 예에서의 예측 모형별 적합도에 기초하여 최종 예측 모형을 결정하는 것과 관련된 예시를 나타낸 도면이다.
도 16a를 참조하면, 전자 장치는, 예를 들면, 혼합형 예측 모형, 비추세형 예측 모형 및/또는 추세형 예측 모형을 이용하여 산출한 각 예측 모형별 예측데이터에 기초하여, 모형화기간 및/또는 검증기간에 대한 예측데이터의 적합도를 예측 모형 별로 산출할 수 있다. 예를 들면, 혼합형 예측 모형의 모형화기간에 대한 적합도는, 0.87, 검증기간에 대한 적합도는 0.89로 산출할 수 있다.
도 16b를 참조하면, 전자 장치는, 예를 들면, 시계열 데이터의 모형화기간 및 검증기간을 일정한 간격으로 구분할 수 있고, 모형화기간 및 검증기간 전체에 대한 예측 모형별 예측데이터의 적합도를 일정한 간격으로 구분된 기간별로 산출할 수 있다. 예를 들면, 전자 장치는 기간별로 산출한 예측 모형별 예측데이터의 적합도에 대하여 기 설정된 기준에 따라 점수를 부여할 수 있고, 기간별로 부여된 적합도에 대한 점수의 평균에 기초하여, 최종 예측 모형을 결정할 수 있다. 예를 들면, 혼합형 예측 모형에 대한 적합도의 평균 점수가 2.8, 추세형 예측 모형에 대한 적합도의 평균 점수가 1.9, 비추세형 예측 모형에 대한 적합도의 평균 점수가 1.4인 경우, 전자 장치는, 혼합형 예측 모형을 최종 예측 모형으로 결정할 수 있다.
예측용 회귀분석식 결정
예컨대, 도 3a, 3b 및/또는 3c의 S335, S335', S335a, S335b 단계에서, 전자 장치는 검증결과를 기초로 제1 기간의 제1 사건에 대한 예측용 제2 회귀분석식을 결정할 수 있다. 예컨대, 전자장치는 검증결과 정해진 회귀분석모형을 토대로 회귀분석을 수행하여 제1 기간의 제1 사건에 대한 제2 회귀분석식을 결정할 수 있다(S335', S335a, S335b 참조).
예컨대, 도 16a 및/또는 16b에 도시된 바와 같이 적합도 평가에 따라 회귀분석모형이 정해지면, 회귀분석모형을 가지고 제1 기간에 대하여 제2 회귀분석을 수행하여 제2 회귀분석식을 결정할 수 있다.
예컨대, 이때, 제1 기간에 대해 회귀분석을 수행하며 정해진 회귀분석모형에 따른 회귀식의 독립변수를 토대로 회귀계수를 변경하며 제1 기간에 대한 최적 적합도를 갖는 제2 회귀분석식을 결정하거나, 또는 정해진 회귀분석모형에 따른 회귀식의 독립변수의 항목을 제거하거나 추가하는 과정을 통해 제1 기간에 대한 최적 적합도를 갖는 제2 회귀분석식을 결정할 수 있다. 예컨대, 회귀모형 적합도는 정상 R 제곱을 이용하는 등 다양한 측정 방법을 통해 산출될 수 있고, 이에 한정되지 않는다.
예컨대, 프로세서(110) 내지 회귀분석 모듈(230)은 인공지능(artificial intelligence) 기술인 기계 학습(machine learning) 기술, 예컨대 딥 러닝(deep learning) 기술을 이용하여 제2 회귀분석을 수행하며 회귀모형 적합도를 산출하며 최종 예측모형으로 제2 회귀분석식을 결정할 수 있다.
예측기간에 대한 예측결과 데이터 산출
예컨대, 프로세서(110) 내지 예컨대 예측 산출모듈(240)은 최종 결정모형 별로 결정된 회귀분석식을 사용하여 예측기간에 대한 예측데이터인 예측결과 데이터를 생성할 수 있다.
도 16c는 본 발명의 다양한 실시 예에 따른 전자 장치가 최종 예측 모형을 이용하여 산출한 시계열 데이터의 예측 결과와 관련된 그래프에 대한 예시를 나타낸 도면이다.
도 16c를 참조하면, 전자 장치는, 예를 들면, 최종 예측 모형으로 결정된 예측 모형을 이용하여, 시계열 데이터에 포함된 모형화기간 및 검증기간에 대한 예측데이터를 산출할 수 있다. 나아가, 전자 장치는, 예를 들면, 최종 예측 모형으로 결정된 예측 모형을 이용하여, 검증기간 이후 예측기간에 대한 예측데이터를 산출할 수 있다. 이때, 예측기간의 예측데이터는 미래에 대한 시계열 예측일 수 있다.
예컨대, 최종 결정된 제2 회귀분석식의 종속변수 항목인 시점별 예측데이터가 시계열 사건의 결과에 관한 것이 아니고 예컨대 시계열 사건 결과의 보정데이터에 관한 예측이라면 시점별 예측데이터의 누적 결과를 역보정하여 제1 사건에 관한 최정 예측결과 데이터이를 얻을 수 있다. 이때, 제1 사건의 예측결과 데이터는 시계열 제1 사건의 결과에 대한 예측기간에서의 예측이다.
상관관계 사건의 존재
도 17a 및 17b는 본 발명의 하나의 실시 예에 따른 전자 장치에서 빅데이터를 활용한 인공지능 다중 시계열 데이터 예측 방법에 관한 순서도이고, 도 17c는 또 하나의 실시 예에 따른 전자 장치에서 빅데이터를 활용한 인공지능 다중 시계열 데이터 예측 방법에서 일부과정을 나타내는 순서도이다. 도 2a, 2b, 3a, 3b 및 3c에서 설명한 내용과 중복되는 내용에 대해서는 상세한 설명을 가급적 생략하도록 한다. 도 17b에 도시된 회귀식 결정단계(S1830)의 구체적인 실시예는 도시되지 않았으나 도 3b 및/또는 3c에 도시된 회귀식 결정단계(S330', S330")와 마찬가지로 진행될 수 있다.
예컨대, 사건항목 사전결정단계(S1801)에서는, 전자 장치는, 데이터 산출단계(S1810) 이전에, 2 이상의 사건에 관한 결과데이터를 포함하는 읽어들인 사건 시계열 데이터에 포함된 결과데이터 중 제1 사건에 관한 제1 결과데이터의 항목과 제1 결과데이터에 영향을 미치는 것으로 추정 판단되는 적어도 하나 이상의 제2 사건후보에 관한 데이터 항목을 결정할 수 있다.
예컨대, 상관변수 결정단계(S1805)에서는, 전자 장치는, 적어도 모형화기간을 포함한 기간에 대하여, 사건 시계열 데이터에 포함되는 제2 사건후보에 관한 적어도 하나 이상의 후보 결과데이터 내지 후보 결과데이터를 보정한 보정값 후보데이터와 제1 사건에 관한 제1 결과데이터 내지 제1 보정값 데이터를 두 변수로 삼아 상관분석을 수행하고, 상관분석 결과에 따라 적어도 하나 이상의 제2 사건후보 중 적어도 하나를 상관변수 사건으로 결정하거나 상관변수 부존재로 결정할 수 있다. 예컨대, 제1 사건은 감염병 발생 횟수, 종합 주가 지수, 경제 성장률, 소비자 물가 지수, 화재 발생 횟수, 범죄 발생 횟수 등 시간의 경과에 따라 연속적으로 발생할 수 있는 모든 사건을 의미할 수 있고, 이에 한정되는 것은 아니다. 제1 사건과 관련된 제2 사건후보는 제1 사건에 대한 시계열 데이터의 데이터 값의 변화에 영향을 미치는 모든 요인을 의미할 수 있다. 예를 들면, 제1 사건이 감염병 발생 횟수인 경우, 제2 사건후보는 기온, 강수량, 미세 먼지 농도 등을 포함할 수 있다. 제2 사건후보 중 상관분석을 통해 적어도 하나 이상의 상관변수 사건을 결정할 수 있다. 예컨대, 전자 장치는 딥 러닝 기술 등을 포함하는 기계 학습 기술을 이용하여 제1 사건과 관련된 상관 변수를 결정할 수도 있다. 예컨대, 제2 사건후보들과 제1 사건 간 상관분석을 통해 예컨대 미리 설정된 상관도 이상의 상관관계를 나타내는 경우 상관변수로 결정할 수 있다.
예컨대, 전자 장치는 S1805 단계에서, 제1 사건과 관련된 제2 사건후보 중에서 적어도 어느 하나 이상을 상관 변수로 결정할 수 있다. 예를 들면, 전자 장치는, 제1 사건인 특정 사건과 특정 사건과 관련된 제2 사건후보인 예상 상관 변수 간의 상관 분석(correlation analysis)을 수행할 수 있고, 기 설정된 기준에 따라 특정 사건과 관련된 예상 상관 변수 중에서 적어도 어느 하나 이상을 상관 변수, 즉 제2 사건으로 결정할 수 있다. 한편, 전자 장치는, 예를 들면, 사용자 입력에 따라, 특정 사건과 관련된 예상 상관 변수 중에서 적어도 어느 하나를 상관 변수로 결정할 수도 있다. 본 실시 예에서는 상관 변수의 예로서 기온을 예로 들어 설명하나, 본 발명은 상기의 예시적 실시 예에 한정되는 것은 아니며, 상관 변수는 둘 이상일 수도 있다.
예컨대, 전자 장치는 S1810 단계에서, 상관 변수에 대한 시계열 데이터를 보정할 수 있다. 예를 들면, 전자 장치는 [식 1]에 따라, 상관 변수에 대한 시계열 데이터에 데이터 값이 음수인 데이터가 포함되어 있는 경우, 데이터 값들을 양수로 변환하거나, 데이터 값들이 0보다 훨씬 큰 값인 경우, 데이터 값들을 보다 작은 값으로 보정할 수 있고, 보정 방식은 이에 한정되지 않는다. 예컨대, 전자장치는 S1810 단계에서 상관변수 사건인 제2 사건의 보정데이터로부터 전술한 데이터 산출단계(S310)에서와 같이 제2 결과데이터 내지 제2 보정값 데이터를 기반으로 제2 예상값 데이터를 산출할 수 있다.
예컨대, 전자장치는 상관 변수에 대한 모형화기간의 보정 후 데이터에 기초하여, 상관 변수와 관련된 다중 회귀분석식을 결정하기 위한, 모형화기간의 상관 변수와 관련된 독립 변수를 생성할 수 있다. 예를 들면, 전자 장치는, 모형화기간에서 시간의 경과에 따른 기온의 변화와 관련된 독립 변수를 생성할 수 있다. 예를 들면, 상관 변수와 관련된 다중 회귀분석식을 결정하는 경우, 전자 장치는 추세형 분석식 및 비추세형 분석식을 결정하기 위한 독립 변수를 각각 생성할 수 있다.
예컨대, 전자장치는 적어도 하나의 상관변수 사건이 결정된 경우 상과변수에 관한 회귀분석식을 결정할 수 있다(S1820, S1820"). 예컨대, 제2사건 분석식 결정단계(S1820, S1820')에서, 전자장치는 각 상관변수 사건 별로 하나의 상관변수 사건, 예컨대 제2 사건에 관한 제2 결과데이터로부터 산출된 하나 이상의 제2 산출 데이터 중 적어도 하나를 제2사건 독립변수 후보로 하는 제3 회귀분석을 수행하여 제2 사건에 관한 예측을 위한 제3 회귀분석식을 결정할 수 있다.
예컨대, 전자 장치는 제2사건 분석식 결정단계(S1820')에서, 제2사건 분석식을 예비결정하고(S1821), 제2사건 회귀모형을 결정하고(S1823), 제2 사건 분석식으로 제3 분석식을 결정할 수 있다(S1825). 예컨대, 제2 사건에 관한 제3 회귀분석식의 결정은 전술한 제1 사건에 관한 제2 회귀분석식의 결정과정과 마찬가지 방식으로 진행될 수 있다.
예컨대, 제2사건 분석식 예비결정단계(S1821)에서, 전자장치는 적어도 모형화기간에 대하여 제2 변수후보 데이터들의 제2 산출 데이터의 적어도 하나의 데이터 항목을 제2사건 독립변수 후보로 하는 제3 예비 회귀분석을 수행하여 적어도 모형화기간에 대한 2 이상의 제3 예비 회귀분석식들을 각 상관변수 사건 별로 예비결정할 수 있다. 예컨대, 전자 장치는 S1821 단계에서, S1810 단계에서 생성한 상관 변수와 관련된 독립 변수에 기초하여 상관 변수와 관련된 다중 회귀분석식을 산출할 수 있다. 예를 들면, 전자 장치는 생성된 상관 변수와 관련된 독립 변수에 기초하여, 상관 변수와 관련된 추세형 분석식, 상관 변수와 관련된 비추세형 분석식 및/또는 상관 변수와 관련된 혼합형 분석식을 산출할 수 있다. 전자 장치는, 예를 들면, 산출된 적어도 하나의 상관 변수와 관련된 다중 회귀분석식 중에서 시계열 데이터의 예측 결과를 산출하기에 적합한 다중 회귀분석식을 예측 모형 별로 결정할 수 있다. 예컨대, 전자 장치는 S1821 단계에서, 모형화기간에 대한 상관 변수와 관련된 예측데이터의 예측 모형별 적합도에 기초하여, 상관 변수와 관련된 시계열 데이터의 예측을 위한 상관 변수와 관련된 예측 모형을 결정할 수 있다.
예컨대, 다음으로 제2사건 모형결정단계(S1823)에서, 전자장치는 적어도 검증기간을 포함한 기간, 예컨대 검증기간에 대하여 1 분석시점 단위로 모형화기간에 대한 제2 산출 데이터의 획득방식과 동일하게 산출된 제3 예비 회귀분석식들의 독립변수에 관한 제2 산출 데이터의 데이터를 제3 예비 회귀분석식들에 대입하여 제2 사건에 관한 시점별 제2사건 검증데이터를 산출하고(S1823a), 1 분석시점 단위의 산출 과정을 누적하며 검증기간 전체에 대해 반복하여 제2 사건에 관한 검증기간 전체의 제2사건 검증데이터들을 산출하고(S1823b), 적어도 검증기간을 포함한 기간에 대한 제2사건 검증데이터들과 제2 사건의 제2사건 비교데이터들을 비교하고, 비교 결과 적합도에 따라 제2사건 회귀분석모형을 각 상관변수 사건 별로 정할 수 있다(S1823c).
예컨대, 전자 장치는 S1823 단계에서, S1810 단계에서의 모형화기간에 대한 제2 산출 데이터의 획득방식과 동일하게, 검증기간에 대하여 1 분석시점 단위로 제3 예비 회귀분석식들의 독립변수를 생성할 수 있다. 예컨대, 전자 장치는 S1821 단계에서 예비 결정된 예측 모형에 기초하여, 독립변수를 대입함으로써 상관 변수와 관련된 검증기간에 대한 예측데이터를 생성할 수 있다. 예컨대, 전자 장치는 1분석시점 단위로 피드백 반복하며 검증기간 전체에 대해서 상관 변수와 관련된 예측데이터를 생성하고, 검증기간의 제2 사건 비교데이터와 비교하여 적합도에 따라 제2 사건 회귀분석모형을 정할 수 있다.
예컨대, 다음으로 제3 분석식 결정단계(S1825)에서, 전자장치는 각 상관변수 사건 별로 결정된 제2 사건 회귀분석모형을 토대로 제1 기간에 대한 제2 사건에 관한 시계열 분석데이터로부터 제3 회귀분석을 수행하여 제2 사건에 관한 예측을 위한 제3 회귀분석식을 결정할 수 있다. 예컨대, 제3 회귀분석식의 결정은 전술한 제1 사건에 관한 제2 회귀분석식의 결정과 실질적으로 동일한 방식으로 진행될 수 있다.
다음으로 S1840 단계를 살펴본다. 예측상관변수 산출단계(S1840)에서, 전자장치는 적어도 하나의 상관변수 사건이 결정된 경우 제2 사건에 관한 결과데이터 값이 없는 예측기간에 대하여, 제2 산출 데이터에서의 제3 회귀분석식의 독립변수와 동일한 데이터 항목 산출방식과 동일하게 1 분석시점 단위로 각 분석시점에 대해 제3 회귀분석식의 최종 독립변수에 관한 값 데이터를 산출하고 산출결과를 제3 회귀분석식에 대입하여 시점별 상관변수 예측데이터를 산출할 수 있다. 또한, 전자장치는 1 분석시점 단위의 산출 과정을 반복하며 예측기간 전체에 대해 반복하여 예측기간 전체에 대한 제2 사건에 관한 예측상관변수 데이터를 산출할 수 있다. 예컨대, 예측기간에 대한 제3 회귀분석식의 최종 독립변수의 값 데이터 산출, 시점별 상관변수 예측데이터 산출 및 제2 사건에 관한 예측상관변수 데이터 산출은 전술한 제1 사건에 관한 제2 회귀분석식의 최종 독립변수의 값 데이터 산출, 제1 사건에 관한 시점별 예측데이터의 산출 및 제1 사건에 관한 예측결과 데이터의 산출 각각의 과정과 실질적으로 동일한 방식으로 진행될 수 있다.
도 17b에서 S1830의 과정은 전술한 S330, S330', S330" 과정과 동일하게 진행될 수 있고, 전술한 설명을 참조하기로 한다. 이때, S1810 단계에서, 제1 사건뿐만 아니라 상관변수 사건인 제2 사건에 관한 산출데이터들이 제1 사건에 관한 제1 변수후보 데이터에 포함되므로, 전술한 S330, S330', S330" 과정에서 상관변수에 관련된 독립변수 후보들도 모두 고려하여 단일 내지 다중 회귀분석식이 산출될 수 있다. 예를 들면, 전자 장치는, 시간의 경과에 따른 감염병 발생 횟수의 변화와 관련된 독립 변수 및 시간의 경과에 따른 기온의 변화와 관련된 독립 변수를 모두 고려하여 시간의 경과 및 기온의 변화에 따른 감염병 발생 횟수의 변화와 관련된 전체 다중 회귀분석식을 산출할 수 있다. 예컨대, 제1 사건과 제2 사건에 관련된 변수 후보로부터 독립변수 후보를 선정하여 모형별로 다중 회귀분석식을 얻고 적합도에 따라 모형별로 제1 회귀분석식을 예비결정할 수 있다. 예비결정된 제1 회귀분석식들 각각에 대해 검증을 통해 모형을 설정하고 이를 기초로 제1 사건에 관한 예측을 위한 제2 회귀분석식을 결정할 수 있다.
예컨대, S1830 단계에서 최종 결정된 제2 회귀분석식의 독립변수 항목 중 제2 사건 관련 독립변수 항목이 포함되어 있는 경우 S1850 단계에 따라 처리될 수 있다.
예컨대, 데이터 예측단계(S1850)에서, 전자장치는 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수가 예측상관변수 산출단계에서 이미 산출된 경우 해당 값을 읽어들이고 산출되지 않은 경우 예측상관변수 산출단계에서 산출된 값으로부터 제2 산출 데이터에서의 제2 사건과 관련된 제2 회귀분석식의 최종 독립변수와 동일한 데이터 항목 산출과 동일하게 산출할 수 있다(S1851). 이때, 제2 회귀분석식에서의 시점별 예측결과 데이터를 예측기간 전체에 반복 누적시켜 예측기간에 대한 제2사건의 영향을 받는 제1 사건의 결과추정 데이터를 산출할 수 있다(S1853).
이상에서, 전술한 실시 예들 및 첨부된 도면들은 본 발명의 범주를 제한하는 것이 아니라 본 발명에 대한 당해 기술분야에서 통상의 지식을 가진 자의 이해를 돕기 위해 예시적으로 설명된 것이다. 즉, 본 발명의 다양한 실시 예는 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 전술한 구성요소들의 다양한 조합에 따라 다양한 변형된 형태로도 구현될 수 있다. 따라서, 본 발명의 범위는 특허청구범위에 기재된 발명에 따라 해석되어야 하며 전술된 실시 예들뿐만 아니라 당해 기술분야에서 통상의 지식을 가진 자에 의한 다양한 변경, 대안, 균등 실시 예들을 포함하고 있다.
101,201, 202: 전자장치 110: 프로세서
120: 메모리 130: 통신모듈
140: 입력모듈 150: 출력모듈
160,210: 데이터베이스 220: 변수 생성모듈
230: 회귀분석 모듈 240: 예측 산출모듈
250: 상관분석 모듈

Claims (20)

  1. 적어도 하나의 프로세서를 포함하는 전자 장치에 있어서,
    상기 프로세서는,
    모형화기간 및 검증기간을 포함하는 적어도 제1 기간에 대한 적어도 제1 사건에 관한 제1 결과데이터를 포함하는 읽어들인 사건 시계열 데이터를 기반으로 적어도 상기 모형화기간에 대하여 상기 제1 결과데이터에 대한 제1 보정값 데이터 및 적어도 하나의 제1 예상값 데이터 중 어느 하나 이상의 데이터를 제1 산출 데이터로 산출하여, 상기 제1 결과데이터 및 상기 제1 산출 데이터를 포함한 상기 제1 사건에 관한 제1 변수후보 데이터가 포함된 시계열 분석데이터를 획득하고, 이때, 상기 적어도 하나의 제1 예상값 데이터는 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점에 대한 적어도 하나의 제1 예상 값의 그룹이고,
    적어도 상기 모형화기간에 대하여 상기 시계열 분석데이터의 상기 제1 변수후보 데이터의 적어도 하나의 데이터 항목을 제1사건 독립변수 후보로 하는 제1 회귀분석을 수행하여 상기 제1 사건에 관한 2 이상의 제1 회귀분석식들을 예비결정하고, 상기 제1 기간 중 적어도 상기 검증기간을 포함한 기간에 대하여 상기 제1 회귀분석식들을 검증하고, 검증결과를 기초로 상기 제1 기간의 상기 제1 사건에 관한 예측용 제2 회귀분석식을 결정하고,
    상기 제1 사건에 관한 결과데이터 값이 없는 상기 검증기간 이후 예측기간에 대하여, 상기 시계열 분석데이터에 포함된 상기 제1 변수후보 데이터의 획득방식과 동일하게 상기 예측기간의 1 분석시점 단위로 상기 제2 회귀분석식의 최종 독립변수에 관한 데이터를 산출하고 산출된 독립변수를 상기 제2 회귀분석식에 대입하여 시점별 예측데이터를 산출하고 상기 1 분석시점 단위의 산출 과정을 누적하며 상기 예측기간 전체에 반복하여 상기 예측기간 전체에 대한 상기 제1 사건의 예측결과 데이터를 산출하고,
    상기 제1 및 제2 회귀분석식 각각은 단일 내지 다중 회귀분석식인 것을 특징으로 하는 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치.
  2. 청구항 1에서, 상기 프로세서는,
    적어도 상기 검증기간을 포함한 기간에 대하여 상기 제1 회귀분석식들을 검증하여 회귀분석모형을 정하고 검증결과 정해진 상기 회귀분석모형을 토대로 상기 제1 기간에 대하여 제2 회귀분석을 수행하여 상기 제2 회귀분석식을 결정하는 것을 특징으로 하는 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치.
  3. 청구항 2에서, 상기 프로세서는,
    적어도 상기 검증기간을 포함한 기간에 대하여, 1 분석시점 단위로 상기 모형화기간에 대한 상기 제1 변수후보 데이터의 획득방식과 동일하게 산출된 상기 제1 회귀분석식들의 독립변수에 관한 상기 제1 변수후보 데이터의 데이터 항목을 상기 제1 회귀분석식들에 대입하여 시점별 검증 예측데이터를 산출하고 상기 1 분석시점 단위의 산출 과정을 누적하며 상기 검증기간 전체에 반복하여 상기 제1 사건에 관한 제1 검증 예측데이터들을 산출하고,
    적어도 상기 제1 검증 예측데이터들과 상기 검증기간에 대한 상기 제1 회귀분석식들의 종속변수 관련 변수후보 데이터인 제1사건 비교데이터들을 비교하여 상기 회귀분석모형을 정하는 것을 특징으로 하는 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치.
  4. 청구항 2에서,
    상기 프로세서는, 검증결과 결정된 상기 회귀분석모형에 따른 회귀식의 독립변수에 기초하여 상기 제1 기간에 대한 회귀분석을 수행하며 결정되는 회귀계수에 따른 상기 제2 회귀분석식을 결정하거나, 상기 회귀분석모형에 따른 회귀식의 독립변수에 기초하여 수행한 상기 제1 기간에 대한 회귀분석에 따라 독립변수 일부 제거 및 새로운 독립변수 추가 중 어느 하나 이상을 수행하며 상기 제1 기간에 대한 새로운 독립변수와 회귀계수를 정하여 상기 제2 회귀분석식을 결정하는 것을 특징으로 하는 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치.
  5. 청구항 1에서,
    상기 제1 변수후보 데이터들에 포함되는 상기 제1 산출 데이터는 상기 제1 보정값 데이터 및 적어도 하나의 상기 제1 예상값 데이터를 포함하고,
    상기 제1 및 제2 회귀분석식의 종속변수 항목은 상기 제1 사건에 관한 상기 제1 변수후보 데이터들에 포함된 상기 제1 결과데이터 내지 상기 제1 보정값 데이터에 관한 것이고,
    상기 프로세서는 상기 제2 회귀분석식의 종속변수 항목이 상기 제1 보정값 데이터에 관한 것인 경우, 상기 시점별 예측데이터의 역보정을 통해 상기 제1 사건에 관한 상기 제1 결과데이터의 예측에 상응하는 예측결과 데이터를 산출하는 것을 특징으로 하는 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치.
  6. 청구항 1 내지 5 중 어느 하나에서,
    상기 프로세서는, 각 분석시점 대비 -1 분석시점과 각 분석시점 사이의 시점간 변화도, 각 분석시점의 소속집단에서의 데이터의 백분율값, 백분위 또는 편차, 각 분석시점의 상기 추정기준으로부터의 이격도 중 어느 하나를 기초로 하여 각 분석시점에 대한 상기 제1 예상 값을 각각 산출하거나, 또는 각 분석시점과 주기적 동일시점 또는 각 분석시점의 소속구간에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 시점간 변화도 내지 상기 이격도에 따라 산출되는 각 분석시점의 등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 시점간 변화도 내지 상기 이격도에 따라 산출되는 상기 -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 등급 시점에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값을 포함하는 데이터 그룹 중 어느 하나 자체를 하나의 상기 제1 예상 값으로 산출하거나 상기 데이터 그룹 중 어느 하나를 기초로 각 분석시점에 대한 상기 제1 예상 값을 각각 산출하고,
    상기 제1 및 제2 회귀분석식의 각 독립변수의 항은 선형항 내지 비선형항인 것을 특징으로 하는 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치.
  7. 청구항 6에서,
    상기 시점간 변화도 및 상기 이격도를 산출하기 위한 각 분석시점 및 상기 추정기준의 값 각각은 상기 제1 결과데이터 내지 상기 제1 보정값 데이터의 값이고,
    상기 데이터의 백분율값, 백분위 또는 편차는 상기 제1 결과데이터, 상기 제1 보정값 데이터, 상기 이격도 또는 그들 중 어느 하나의 증감율에 관련된 값이고,
    상기 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값은 자체가 상기 제1 예상 값인 경우 상기 제1 결과데이터 내지 상기 제1 보정값 데이터의 값이고 자체가 상기 제1 예상 값 산출의 기초인 경우에는 상기 제1 결과데이터, 상기 제1 보정값 데이터, 상기 이격도 중 어느 하나의 증감율, 백분율 내지 백분위에 관한 값이고,
    상기 프로세서는, 상기 모형화기간에 대한 상기 시계열 분석데이터로부터 시계열 순번을 독립변수로 삼아 단순추세 선형회귀식을 산출하고 상기 단순추세 선형회귀식에 시계열 순번을 대입하여 추세 데이터를 산출하고 상기 추세 데이터를 상기 추정기준으로 삼아 각 분석시점의 상기 추정기준으로부터의 이격도를 산출하고,
    상기 프로세서는, 상기 제1 회귀분석을 수행하여 추세형, 비추세형, 상기 추세형과 비추세형의 혼합형 중 적어도 2 이상의 분석모형에 따른 상기 제1 회귀분석식들을 예비결정하고 상기 2 이상의 분석모형에 따른 회귀분석식 모형 중 하나를 상기 회귀분석모형으로 결정하고,
    상기 추세형의 회귀분석식은 상기 시점간 변화도, 상기 데이터의 백분율값, 백분위 또는 편차, 상기 이격도 중 어느 하나를 기초로 산출된 상기 제1 예상값 데이터 각각과, 상기 주기적 동일시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 이격도에 따라 산출되는 각 분석시점의 이격도등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 -1 분석시점의 이격도등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 -1 분석시점의 이격도등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 이격도등급에서의 데이터 평균, 중위수, 최빈, 극빈, 최대 또는 최소 값을 포함하는 제1 그룹 중 어느 하나 자체에 관한 상기 제1 예상값 데이터 각각과, 상기 제1 그룹 중 어느 하나를 기초로 산출된 상기 제1 예상값 데이터 각각을 포함하는 그룹에서 어느 하나 이상을 독립변수 항목으로 하고,
    상기 비추세형의 회귀분석식은 상기 시점간 변화도 내지 상기 데이터의 백분율값, 백분위 또는 편차를 기초로 산출된 상기 제1 예상값 데이터 각각과, 상기 주기적 동일시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 시점간 변화에 따라 산출되는 각 분석시점의 변동등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 -1 분석시점의 변동등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 -1 분석시점의 변동등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 변동등급 시점에서의 데이터 평균, 중위수, 최빈, 극빈, 최대 또는 최소 값을 포함하는 제2 그룹 중 어느 하나 자체에 관한 상기 제1 예상값 데이터 각각과, 상기 제2 그룹 중 어느 하나를 기초로 산출된 상기 제1 예상값 데이터 각각을 포함하는 그룹에서 어느 하나 이상을 독립변수 항목으로 하고,
    상기 혼합형의 회귀분석식은 상기 추세형의 회귀 분석석의 독립변수 항목 중 어느 하나 이상과 상기 비추세형의 회귀분석식의 독립변수 항목 중 어느 하나 이상을 독립변수 항목으로 하는 것을 특징으로 하는 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치.
  8. 청구항 7에서,
    상기 프로세서는, 독립변수와 종속변수 사이의 상관관계를 나타내는 상관계수, 상기 상관계수의 제곱값인 결정계수, 수정된 결정계수, 더빈-왓슨비, 베타 표준화계수, 유의확률, 공선성 통계량 중 적어도 하나 이상을 고려하여 상기 회귀분석을 수행하고,
    상기 시점간 변화도는 차이값 내지 증감율값이고,
    상기 제1 보정값 데이터는 상기 제1 결과데이터의 값을 진폭 조정법에 따라 보정한 데이터이고,
    상기 비선형항은 제곱항, 제곱근항, 로그항, 지수항 중의 적어도 하나인 것을 특징으로 하는 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치.
  9. 청구항 1 내지 5 중 어느 하나에서,
    상기 프로세서는,
    2 이상의 사건에 관한 결과데이터를 포함하는 읽어들인 상기 사건 시계열 데이터에 포함된 결과데이터 중 상기 제1 사건에 관한 상기 제1 결과데이터의 항목과 상기 제1 결과데이터에 영향을 미치는 것으로 추정 판단되는 적어도 하나 이상의 제2 사건후보에 관한 데이터 항목을 결정하고,
    적어도 상기 모형화기간을 포함한 기간에 대하여, 상기 사건 시계열 데이터에 포함되는 상기 제2 사건후보에 관한 적어도 하나 이상의 후보 결과데이터 내지 상기 후보 결과데이터를 보정한 보정값 후보데이터와 상기 제1 사건에 관한 상기 제1 결과데이터 내지 상기 제1 보정값 데이터를 두 변수로 삼아 상관분석을 수행하고, 상관분석 결과에 따라 적어도 하나 이상의 상기 제2 사건후보 중 적어도 하나를 상관변수 사건으로 결정하거나 상관변수 부존재로 결정하고,
    적어도 하나의 상기 상관변수 사건이 결정된 경우, 하나의 상기 상관변수 사건인 제2 사건에 관한 제2 결과데이터로부터 산출된 하나 이상의 제2 산출 데이터 중 적어도 하나를 제2사건 독립변수 후보로 하는 제3 회귀분석을 수행하여 상기 제2 사건에 관한 예측을 위한 제3 회귀분석식을 결정하는 방식으로 각 상관변수 사건 별로 각 사건에 관한 예측을 위한 회귀분석식을 결정하고,
    적어도 하나의 상기 상관변수 사건이 결정된 경우 상기 제2 사건 각각에 관한 결과데이터 값이 없는 상기 예측기간에 대하여, 상기 제2 산출 데이터에서의 상기 제3 회귀분석식의 독립변수와 동일한 데이터 항목 산출방식과 동일하게 1 분석시점 단위로 각 분석시점에 대해 상기 제3 회귀분석식의 최종 독립변수에 관한 값 데이터를 산출하고 산출결과를 상기 제3 회귀분석식에 대입하여 시점별 상관변수 예측데이터를 산출하고 상기 1 분석시점 단위의 산출 과정을 누적하며 상기 예측기간 전체에 대해 반복하여 상기 예측기간 전체에 대한 상기 제2 사건에 관한 예측상관변수 데이터를 산출하는 방식으로 각 상관변수 사건 별로 상기 예측상관변수 데이터를 산출하고,
    적어도 하나의 상기 상관변수 사건이 결정되는 경우, 상기 시계열 분석데이터에 포함되는 상기 제1 사건에 관한 제1 변수후보 데이터들은 상기 제2 사건 각각에 관한 상기 제2 결과데이터 및 상기 제2 산출 데이터를 더 포함하고, 상기 제2 산출 데이터는 상기 제2 결과데이터에 대한 제2 보정값 데이터 및 적어도 하나의 제2 예상값 데이터 중 어느 하나 이상의 데이터를 포함하고, 상기 제2 사건에 관한 상기 제2 예상값 데이터 각각은 적어도 상기 제1 기간에 대한 상기 제2 사건에 관한 상기 제2 결과데이터 내지 상기 제2 보정값 데이터를 기반으로 적어도 상기 모형화기간에 대하여 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점에 대한 적어도 하나의 제2 예상 값의 그룹이고,
    상기 프로세서는, 상기 상관변수 사건이 결정되고 결정된 상기 제2 회귀분석식의 최종 독립변수에 상기 제2 사건 관련된 적어도 하나 이상의 데이터 항목이 포함되는 경우, 상기 제2 사건과 관련된 상기 제2 회귀분석식의 최종 독립변수가 상기 예측상관변수 데이터의 산출과정에서 이미 산출된 경우 해당 값을 읽어들이고 산출되지 않은 경우 상기 예측상관변수 데이터의 산출과정에서 산출된 값으로부터 상기 제2 산출 데이터에서의 상기 제2 사건과 관련된 상기 제2 회귀분석식의 최종 독립변수와 동일한 데이터 항목 산출과 동일하게 산출하고,
    상기 제3 회귀분석식은 단일 내지 다중 회귀분석식인 것을 특징으로 하는 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치.
  10. 청구항 9에서,
    상기 프로세서는,
    적어도 하나의 상기 상관변수 사건이 결정된 경우, 적어도 상기 모형화기간에 대하여 상기 제2 사건의 상기 제2 산출 데이터의 적어도 하나의 데이터 항목을 상기 제2사건 독립변수 후보로 하는 제3 예비 회귀분석을 수행하여 적어도 상기 모형화기간에 대한 2 이상의 제3 예비 회귀분석식들을 예비결정하는 방식으로 각 상관변수 사건 별로 회귀분석식을 예비결정하고,
    적어도 상기 검증기간에 대하여 1 분석시점 단위로 상기 모형화기간에 대한 상기 제2 산출 데이터의 획득방식과 동일하게 산출된 상기 제3 예비 회귀분석식들의 독립변수에 관한 상기 제2 산출 데이터의 데이터를 상기 제3 예비 회귀분석식들에 대입하여 상기 제2 사건에 관한 시점별 제2사건 검증데이터를 산출하고 상기 1 분석시점 단위의 산출 과정을 누적하며 상기 검증기간 전체에 대해 반복하여 상기 제2 사건에 관한 상기 검증기간 전체의 상기 제2사건 검증데이터들을 산출하고, 적어도 상기 검증기간에 대한 상기 제2사건 검증데이터들과 상기 제2 사건의 제2사건 비교데이터들을 비교하고, 비교 결과 적합도에 따라 제2사건 회귀분석모형을 정하는 방식으로 각 상관변수 사건 별로 회귀분석모형을 정하고,
    결정된 상기 제2 사건 회귀분석모형을 토대로 상기 제1 기간에 대한 상기 제2 사건에 관한 상기 시계열 분석데이터로부터 상기 제3 회귀분석을 수행하여 상기 제2 사건에 관한 예측을 위한 상기 제3 회귀분석식을 결정하는 방식으로 각 상관변수 사건 별로 회귀분석식을 결정하는 것을 특징으로 하는 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치.
  11. 적어도 하나의 프로세서를 포함하는 전자 장치의 상기 프로세서에서 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법에 있어서,
    모형화기간 및 검증기간을 포함하는 적어도 제1 기간에 대한 적어도 제1 사건에 관한 제1 결과데이터를 포함하는 읽어들인 사건 시계열 데이터를 기반으로 적어도 상기 모형화기간에 대하여 상기 제1 결과데이터에 대한 제1 보정값 데이터, 및 적어도 하나의 제1 예상값 데이터 중 어느 하나 이상의 데이터를 제1 산출 데이터로 산출하여, 상기 제1 결과데이터 및 상기 제1 산출 데이터를 포함한 상기 제1 사건에 관한 제1 변수후보 데이터가 포함된 시계열 분석데이터를 획득하는 데이터 산출단계, 이때, 상기 적어도 하나의 제1 예상값 데이터는 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점에 대한 적어도 하나의 제1 예상 값의 그룹임;
    적어도 상기 모형화기간에 대하여 상기 시계열 분석데이터의 상기 제1 변수후보 데이터의 적어도 하나의 데이터 항목을 제1사건 독립변수 후보로 하는 제1 회귀분석을 수행하여 2 이상의 제1 회귀분석식들을 예비결정하고, 상기 제1 기간 중 적어도 상기 검증기간을 포함한 기간에 대하여 상기 제1 회귀분석식들을 검증하고, 검증결과를 기초로 상기 제1 기간의 상기 제1 사건에 관한 예측용 제2 회귀분석식을 결정하는 회귀식 결정단계; 및
    상기 제1 사건에 관한 결과데이터 값이 없는 상기 검증기간 이후 예측기간에 대하여, 상기 데이터 산출단계에서의 상기 제1 변수후보 데이터의 획득방식과 동일하게 상기 예측기간의 1 분석시점 단위로 상기 제2 회귀분석식의 최종 독립변수에 관한 데이터를 산출하고 산출된 독립변수를 제2 회귀분석식에 대입하여 시점별 예측데이터를 산출하고 상기 1 분석시점 단위의 산출 과정을 누적하며 상기 예측기간 전체에 반복하여 상기 예측기간에 대한 상기 제1 사건의 예측결과 데이터를 산출하는 데이터 예측단계를 포함하고,
    상기 제1 및 제2 회귀분석식 각각은 단일 내지 다중 회귀분석식인 것을 특징으로 하는 전자 장치에서 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법.
  12. 청구항 11에서,
    상기 회귀식 결정단계에서, 적어도 상기 검증기간을 포함한 기간에 대하여 상기 제1 회귀분석식들을 검증하여 회귀분석모형을 정하고 검증결과 정해진 상기 회귀분석모형을 토대로 상기 제1 기간에 대하여 제2 회귀분석을 수행하여 상기 제2 회귀분석식을 결정하는 것을 특징으로 하는 전자 장치에서 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법.
  13. 청구항 12에서,
    상기 회귀식 결정단계는:
    적어도 상기 모형화기간에 대하여, 상기 시계열 분석데이터의 상기 제1 변수후보 데이터의 적어도 하나의 데이터 항목을 상기 제1사건 독립변수 후보로 하는 상기 제1 회귀분석을 수행하여 상기 제1 사건에 관한 적어도 2 이상의 분석모형에 따른 상기 제1 회귀분석식들을 예비결정하는 예비결정단계;
    적어도 상기 검증기간을 포함한 기간에 대하여 1 분석시점 단위로 상기 모형화기간에 대한 상기 제1 변수후보 데이터의 획득방식과 동일하게 산출된 상기 제1 회귀분석식들의 독립변수에 관한 상기 제1 변수후보 데이터의 데이터 항목을 상기 제1 회귀분석식들에 대입하여 시점별 검증 예측데이터를 산출하고 상기 1 분석시점 단위의 산출 과정을 누적하며 상기 검증기간 전체에 반복하여 상기 제1 사건에 관한 제1 검증 예측데이터들을 산출하고, 적어도 상기 제1 검증 예측데이터들과 상기 검증기간에 대한 상기 제1 회귀분석식들의 종속변수 관련 변수후보 데이터인 제1사건 비교데이터들을 비교하여 상기 회귀분석모형을 정하는 모형 결정단계; 및
    상기 회귀분석모형을 토대로 상기 제1 기간에 대한 상기 시계열 분석데이터로부터 상기 제2 회귀분석을 수행하여 상기 제1 사건에 관한 상기 제2 회귀분석식을 결정하는 회귀분석식 결정단계를 포함하는 것을 특징으로 하는 전자 장치에서 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법.
  14. 청구항 12에서,
    상기 회귀식 결정단계에서는, 검증결과 결정된 상기 회귀분석모형에 따른 회귀식의 독립변수에 기초하여 상기 제1 기간에 대한 회귀분석을 수행하며 결정되는 회귀계수에 따른 상기 제2 회귀분석식을 결정하거나, 상기 회귀분석모형에 따른 회귀식의 독립변수에 기초하여 수행한 상기 제1 기간에 대한 회귀분석에 따라 독립변수 일부 제거 및 새로운 독립변수 추가 중 어느 하나 이상을 수행하며 상기 제1 기간에 대한 새로운 독립변수와 회귀계수를 정하여 상기 제2 회귀분석식을 결정하는 것을 특징으로 하는 전자 장치에서 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법.
  15. 청구항 11에서,
    상기 제1 변수후보 데이터들에 포함되는 상기 제1 산출 데이터는 상기 제1 보정값 데이터 및 적어도 하나의 상기 제1 예상값 데이터를 포함하고,
    상기 제1 및 제2 회귀분석식의 종속변수 항목은 상기 제1 사건에 관한 상기 제1 변수후보 데이터들에 포함된 상기 제1 결과데이터 내지 상기 제1 보정값 데이터에 관한 것이고,
    상기 제2 회귀분석식의 종속변수 항목이 상기 제1 보정값 데이터에 관한 것인 경우, 상기 예측결과 데이터는 상기 시점별 예측데이터로부터 역보정을 통해 산출되며 상기 제1 사건에 관한 상기 제1 결과데이터의 예측에 상응하는 것을 특징으로 하는 전자 장치에서 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법.
  16. 청구항 11 내지 15 중 어느 하나에서,
    상기 데이터 산출단계에서의 각 분석시점에 대한 상기 제1 예상 값 각각은 각 분석시점 대비 -1 분석시점과 각 분석시점 사이의 시점간 변화도, 각 분석시점의 소속집단에서의 데이터의 백분율값, 백분위 또는 편차, 각 분석시점의 상기 추정기준으로부터의 이격도 중 어느 하나를 기초로 하여 산출되거나, 또는 각 분석시점과 주기적 동일시점 또는 각 분석시점의 소속구간에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 시점간 변화도 내지 상기 이격도에 따라 산출되는 각 분석시점의 등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 시점간 변화도 내지 상기 이격도에 따라 산출되는 상기 -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 -1 분석시점의 등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 등급 시점에서의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값을 포함하는 데이터 그룹 중 어느 하나 자체이거나 상기 데이터 그룹 중 어느 하나를 기초로 하여 산출되고,
    상기 제1 및 제2 회귀분석식의 각 독립변수의 항은 선형항 내지 비선형항인 것을 특징으로 하는 전자 장치에서 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법.
  17. 청구항 16에서,
    상기 시점간 변화도 및 상기 이격도를 산출하기 위한 각 분석시점 및 상기 추정기준의 값 각각은 상기 제1 결과데이터 내지 상기 제1 보정값 데이터의 값이고,
    상기 데이터의 백분율값, 백분위 또는 편차는 상기 제1 결과데이터, 상기 제1 보정값 데이터, 상기 이격도 또는 그들 중 어느 하나의 증감율에 관련된 값이고,
    상기 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값은 자체가 상기 제1 예상 값인 경우 상기 제1 결과데이터 내지 상기 제1 보정값 데이터의 값이고 자체가 상기 제1 예상 값 산출의 기초인 경우에는 상기 제1 결과데이터, 상기 제1 보정값 데이터, 상기 이격도 중 어느 하나의 증감율, 백분율 내지 백분위에 관한 값이고,
    상기 회귀식 결정단계에서 상기 모형화기간에 대한 상기 시계열 분석데이터로부터 시계열 순번을 독립변수로 삼아 단순추세 선형회귀식을 산출하고 상기 단순추세 선형회귀식에 시계열 순번을 대입하여 산출되는 추세 데이터를 상기 데이터 산출단계로 피드백하고 피드백된 상기 추세 데이터를 상기 추정기준으로 삼아 각 분석시점의 상기 추정기준으로부터의 이격도가 산출되고,
    상기 회귀식 결정단계에서, 상기 제1 회귀분석을 통해 추세형, 비추세형, 상기 추세형과 비추세형의 혼합형 중 적어도 2 이상의 분석모형에 따른 상기 제1 회귀분석식들을 예비결정하고 그 중 하나를 상기 회귀분석모형으로 결정하고,
    상기 추세형의 회귀분석식은 상기 시점간 변화도, 상기 데이터의 백분율값, 백분위 또는 편차, 상기 이격도 중 어느 하나를 기초로 산출된 상기 제1 예상값 데이터 각각과, 상기 주기적 동일시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 이격도에 따라 산출되는 각 분석시점의 이격도등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 -1 분석시점의 이격도등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 -1 분석시점의 이격도등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 이격도등급에서의 데이터 평균, 중위수, 최빈, 극빈, 최대 또는 최소 값을 포함하는 제1 그룹 중 어느 하나 자체에 관한 상기 제1 예상값 데이터 각각과, 상기 제1 그룹 중 어느 하나를 기초로 산출된 상기 제1 예상값 데이터 각각을 포함하는 그룹에서 어느 하나 이상을 독립변수 항목으로 하고,
    상기 비추세형의 회귀분석식은 상기 시점간 변화도 내지 상기 데이터의 백분율값, 백분위 또는 편차를 기초로 산출된 상기 제1 예상값 데이터 각각과, 상기 주기적 동일시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 시점간 변화에 따라 산출되는 각 분석시점의 변동등급과 동일등급 시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 -1 분석시점의 변동등급과 동일등급 시점 대비 0 분석시점의 데이터의 평균, 중위수, 최빈, 극빈, 최대 내지 최소 값, 상기 -1 분석시점의 변동등급과 동일등급 시점 대비 0 분석시점의 평균, 중위수, 최빈, 극빈, 최대 또는 최소 변동등급 시점에서의 데이터 평균, 중위수, 최빈, 극빈, 최대 또는 최소 값을 포함하는 제2 그룹 중 어느 하나 자체에 관한 상기 제1 예상값 데이터 각각과, 상기 제2 그룹 중 어느 하나를 기초로 산출된 상기 제1 예상값 데이터 각각을 포함하는 그룹에서 어느 하나 이상을 독립변수 항목으로 하고,
    상기 혼합형의 회귀분석식은 상기 추세형의 회귀 분석석의 독립변수 항목 중 어느 하나 이상과 상기 비추세형의 회귀분석식의 독립변수 항목 중 어느 하나 이상을 독립변수 항목으로 하는 것을 특징으로 하는 전자 장치에서 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법.
  18. 청구항 17에서,
    상기 회귀식 결정단계에서 독립변수와 종속변수 사이의 상관관계를 나타내는 상관계수, 상기 상관계수의 제곱값인 결정계수, 수정된 결정계수, 더빈-왓슨비, 베타 표준화계수, 유의확률, 공선성 통계량 중 적어도 하나 이상을 고려하여 상기 회귀분석을 수행하고,
    상기 시점간 변화도는 차이값 내지 증감율값이고,
    상기 제1 보정값 데이터는 상기 제1 결과데이터의 값을 진폭 조정법에 따라 보정한 데이터이고,
    상기 비선형항은 제곱항, 제곱근항, 로그항, 지수항 중의 적어도 하나인 것을 특징으로 하는 전자 장치에서 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법.
  19. 청구항 11 내지 15 중 어느 하나에서,
    상기 인공지능 시계열 데이터 예측 방법은:
    상기 데이터 산출단계 이전에, 2 이상의 사건에 관한 결과데이터를 포함하는 읽어들인 상기 사건 시계열 데이터에 포함된 결과데이터 중 상기 제1 사건에 관한 상기 제1 결과데이터의 항목과 상기 제1 결과데이터에 영향을 미치는 것으로 추정 판단되는 적어도 하나 이상의 제2 사건후보에 관한 데이터 항목을 결정하는 사건항목 사전결정단계;
    적어도 상기 모형화기간을 포함한 기간에 대하여, 상기 사건 시계열 데이터에 포함되는 상기 제2 사건후보에 관한 적어도 하나 이상의 후보 결과데이터 내지 상기 후보 결과데이터를 보정한 보정값 후보데이터와 상기 제1 사건에 관한 상기 제1 결과데이터 내지 상기 제1 보정값 데이터를 두 변수로 삼아 상관분석을 수행하고, 상관분석 결과에 따라 적어도 하나 이상의 상기 제2 사건후보 중 적어도 하나를 상관변수 사건으로 결정하거나 상관변수 부존재로 결정하는 상관변수 결정단계;
    적어도 하나의 상기 상관변수 사건이 결정된 경우, 하나의 상기 상관변수 사건인 제2 사건에 관한 제2 결과데이터으로부터 산출된 하나 이상의 제2 산출 데이터 중 적어도 하나를 제2사건 독립변수 후보로 하는 제3 회귀분석을 수행하여 상기 제2 사건에 관한 예측을 위한 제3 회귀분석식을 결정하는 방식으로 각 상관변수 사건 별로 각 사건에 관한 예측을 위한 회귀분석식을 결정하는 제2사건 분석식 결정단계; 및
    적어도 하나의 상기 상관변수 사건이 결정된 경우 상기 제2 사건 각각에 관한 결과데이터 값이 없는 상기 예측기간에 대하여, 상기 제2 산출 데이터에서의 상기 제3 회귀분석식의 독립변수와 동일한 데이터 항목 산출방식과 동일하게 1 분석시점 단위로 각 분석시점에 대해 상기 제3 회귀분석식의 최종 독립변수에 관한 값 데이터를 산출하고 산출결과를 상기 제3 회귀분석식에 대입하여 시점별 상관변수 예측데이터를 산출하고 상기 1 분석시점 단위의 산출 과정을 누적하며 상기 예측기간 전체에 대해 반복하여 상기 예측기간 전체에 대한 상기 제2 사건에 관한 예측상관변수 데이터를 산출하는 방식으로 각 상관변수 사건 별로 상기 예측상관변수 데이터를 산출하는 예측상관변수 산출단계를 더 포함하고,
    적어도 하나의 상기 상관변수 사건이 결정되는 경우, 상기 데이터 산출단계에서 획득되는 상기 시계열 분석데이터에 포함되는 상기 제1 사건에 관한 제1 변수후보 데이터들은 상기 제2 사건 각각에 관한 상기 제2 결과데이터 및 상기 제2 산출 데이터를 더 포함하고, 상기 제2 산출 데이터 각각은 상기 제2 결과데이터에 대한 제2 보정값 데이터 및 적어도 하나의 제2 예상값 데이터 중 어느 하나 이상의 데이터를 포함하고, 상기 제2 사건에 관한 상기 제2 예상값 데이터 각각은 적어도 상기 제1 기간에 대한 상기 제2 사건에 관한 상기 제2 결과데이터 내지 상기 제2 보정값 데이터를 기반으로 적어도 상기 모형화기간에 대하여 각 분석시점의 이전시점으로부터의 변화, 각 분석시점의 소속집단과의 관계 및 추정기준과의 차이 중 어느 하나 이상에 기초하여 산출되는 각 분석시점에 대한 적어도 하나의 제2 예상 값의 그룹이고,
    상기 상관변수 사건이 결정되고 상기 회귀식 결정단계에서 결정된 상기 제2 회귀분석식의 최종 독립변수에 적어도 하나의 상기 제2 사건과 관련된 적어도 하나 이상의 데이터 항목이 포함되는 경우에, 상기 데이터 예측단계에서는, 상기 제2 사건과 관련된 상기 제2 회귀분석식의 최종 독립변수가 상기 예측상관변수 산출단계에서 이미 산출된 경우 해당 값을 읽어들이고 산출되지 않은 경우 상기 예측상관변수 산출단계에서 산출된 값으로부터 상기 제2 산출 데이터에서의 상기 제2 사건과 관련된 상기 제2 회귀분석식의 최종 독립변수와 동일한 데이터 항목 산출과 동일하게 산출하고,
    상기 제3 회귀분석식은 단일 내지 다중 회귀분석식인 것을 특징으로 하는 전자 장치에서 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법.
  20. 청구항 19에서,
    상기 제2사건 분석식 결정단계는:
    적어도 하나의 상기 상관변수 사건이 결정된 경우, 적어도 상기 모형화기간에 대하여 상기 제2 사건의 상기 제2 산출 데이터의 적어도 하나의 데이터 항목을 상기 제2사건 독립변수 후보로 하는 제3 예비 회귀분석을 수행하여 적어도 상기 모형화기간에 대한 2 이상의 제3 예비 회귀분석식들을 예비결정하는 방식으로 각 상관변수 사건 별로 회귀분석식을 예비결정하는 제2사건 분석식 예비결정단계;
    적어도 상기 검증기간에 대하여 1 분석시점 단위로 상기 모형화기간에 대한 상기 제2 산출 데이터의 획득방식과 동일하게 산출된 상기 제3 예비 회귀분석식들의 독립변수에 관한 상기 제2 산출 데이터의 데이터를 상기 제3 예비 회귀분석식들에 대입하여 상기 제2 사건에 관한 시점별 제2사건 검증데이터를 산출하고 상기 1 분석시점 단위의 산출 과정을 누적하며 상기 검증기간 전체에 대해 반복하여 상기 제2 사건에 관한 상기 검증기간 전체의 상기 제2사건 검증데이터들을 산출하고, 적어도 상기 검증기간에 대한 상기 제2사건 검증데이터들과 상기 제2 사건의 제2사건 비교데이터들을 비교하고, 비교 결과 적합도에 따라 제2사건 회귀분석모형을 정하는 방식으로 각 상관변수 사건 별로 회귀분석모형을 정하는 제2사건 모형결정단계; 및
    결정된 상기 제2 사건 회귀분석모형을 토대로 상기 제1 기간에 대한 상기 제2 사건에 관한 상기 시계열 분석데이터로부터 상기 제3 회귀분석을 수행하여 상기 제2 사건에 관한 예측을 위한 상기 제3 회귀분석식을 결정하는 방식으로 각 상관변수 사건 별로 회귀분석식을 결정하는 제3 분석식 결정단계를 포함하는 것을 특징으로 하는 전자 장치에서 빅데이터를 활용한 인공지능 시계열 데이터 예측 방법.
KR1020190031734A 2019-03-20 2019-03-20 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치 및 그 예측 방법 KR102065780B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190031734A KR102065780B1 (ko) 2019-03-20 2019-03-20 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치 및 그 예측 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190031734A KR102065780B1 (ko) 2019-03-20 2019-03-20 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치 및 그 예측 방법

Publications (1)

Publication Number Publication Date
KR102065780B1 true KR102065780B1 (ko) 2020-01-13

Family

ID=69153100

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190031734A KR102065780B1 (ko) 2019-03-20 2019-03-20 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치 및 그 예측 방법

Country Status (1)

Country Link
KR (1) KR102065780B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418921A (zh) * 2020-11-11 2021-02-26 深圳力维智联技术有限公司 用电需量预测方法、装置、系统与计算机存储介质
WO2021241938A1 (ko) * 2020-05-27 2021-12-02 삼성전자(주) 전자장치 및 그 제어방법
WO2022002108A1 (en) * 2020-06-30 2022-01-06 5G Care Limited Intelligent system and method for event tracking
KR20230022486A (ko) * 2021-08-09 2023-02-16 배재대학교 산학협력단 시계열 데이터의 에러 값 보정을 위한 필터링 및 성능 비교 시스템 및 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006276970A (ja) * 2005-03-28 2006-10-12 Nec Corp 時系列解析システム、方法およびプログラム
KR101645396B1 (ko) 2015-02-10 2016-08-03 국민대학교 산학협력단 시계열 빅데이터 처리 방법과 그 시스템
KR20170078256A (ko) 2015-12-29 2017-07-07 삼성에스디에스 주식회사 시계열의 데이터를 예측 하는 방법 및 그 장치
JP2017224268A (ja) * 2016-06-09 2017-12-21 株式会社日立製作所 データ予測システムおよびデータ予測方法
JP2018092439A (ja) * 2016-12-05 2018-06-14 株式会社日立製作所 データ処理システム及びデータ処理方法
KR101919076B1 (ko) * 2017-12-20 2018-11-19 (주)지오시스템리서치 시계열 데이터 예측 시스템

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006276970A (ja) * 2005-03-28 2006-10-12 Nec Corp 時系列解析システム、方法およびプログラム
KR101645396B1 (ko) 2015-02-10 2016-08-03 국민대학교 산학협력단 시계열 빅데이터 처리 방법과 그 시스템
KR20170078256A (ko) 2015-12-29 2017-07-07 삼성에스디에스 주식회사 시계열의 데이터를 예측 하는 방법 및 그 장치
JP2017224268A (ja) * 2016-06-09 2017-12-21 株式会社日立製作所 データ予測システムおよびデータ予測方法
JP2018092439A (ja) * 2016-12-05 2018-06-14 株式会社日立製作所 データ処理システム及びデータ処理方法
KR101919076B1 (ko) * 2017-12-20 2018-11-19 (주)지오시스템리서치 시계열 데이터 예측 시스템

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021241938A1 (ko) * 2020-05-27 2021-12-02 삼성전자(주) 전자장치 및 그 제어방법
US11561518B2 (en) 2020-05-27 2023-01-24 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof
WO2022002108A1 (en) * 2020-06-30 2022-01-06 5G Care Limited Intelligent system and method for event tracking
CN112418921A (zh) * 2020-11-11 2021-02-26 深圳力维智联技术有限公司 用电需量预测方法、装置、系统与计算机存储介质
KR20230022486A (ko) * 2021-08-09 2023-02-16 배재대학교 산학협력단 시계열 데이터의 에러 값 보정을 위한 필터링 및 성능 비교 시스템 및 방법
KR102544621B1 (ko) 2021-08-09 2023-06-15 배재대학교 산학협력단 시계열 데이터의 에러 값 보정을 위한 필터링 및 성능 비교 시스템 및 방법

Similar Documents

Publication Publication Date Title
KR102065780B1 (ko) 빅데이터를 활용한 인공지능 시계열 데이터 예측을 수행하는 전자 장치 및 그 예측 방법
US11282099B2 (en) Probabilistic price and spike forecasting
CN112116184A (zh) 使用历史检验数据的工厂风险估计
KR20210017342A (ko) 과거 데이터에 기초한 시계열 예측 방법 및 장치
Audrino et al. Semi-parametric forecasts of the implied volatility surface using regression trees
Sari et al. Statistical metrics for assessing the quality of wind power scenarios for stochastic unit commitment
US20210248293A1 (en) Optimization device and optimization method
CN117575663A (zh) 基于深度学习的装修成本估算方法及系统
CA3186873A1 (en) Activity level measurement using deep learning and machine learning
Bhambri A CAD system for software effort estimation
CN117236800B (zh) 一种多场景自适应的用电负荷预测方法及系统
CN109978300B (zh) 客户风险承受力量化方法及系统、资产配置方法及系统
TW202133089A (zh) 最佳化驅動決策之方法及其電腦程式產品
CN111815458A (zh) 基于细粒度量化标注和集成方法的动态投资组合配置方法
KR101982636B1 (ko) 기업실적 예측모델 생성 방법 및 장치
CN112927012A (zh) 营销数据的处理方法及装置、营销模型的训练方法及装置
Edbrooke Time Series Modelling Technique Analysis for Enterprise Stress Testing
US20230288915A1 (en) Information processing device, information processing method, and computer program product
Kumar et al. Bidirectional LSTM Network-Based Short-Term Load Forecasting Method in Smart Grids
US20240242120A1 (en) System, method, and computer program product for time series forecasting using integrable multivariate pattern matching
US20230419128A1 (en) Methods for development of a machine learning system through layered gradient boosting
CN116883038A (zh) 一种电力价格数据的处理方法及装置
US20240119315A1 (en) Methods for development of a machine learning system through layered gradient boosting
CN118193928A (zh) 数据波动检测方法、装置、计算机设备和存储介质
Ye Dependent Competing Risks Modeling Using Multivariate Weibull Distribution and Process Monitoring with Classification Techniques and Real-time Contrast

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant