KR101688412B1 - 종속 변수의 예측 모델링 방법 및 시스템 - Google Patents

종속 변수의 예측 모델링 방법 및 시스템 Download PDF

Info

Publication number
KR101688412B1
KR101688412B1 KR1020150123585A KR20150123585A KR101688412B1 KR 101688412 B1 KR101688412 B1 KR 101688412B1 KR 1020150123585 A KR1020150123585 A KR 1020150123585A KR 20150123585 A KR20150123585 A KR 20150123585A KR 101688412 B1 KR101688412 B1 KR 101688412B1
Authority
KR
South Korea
Prior art keywords
variable
independent
weighting factor
variables
dependent
Prior art date
Application number
KR1020150123585A
Other languages
English (en)
Inventor
문유한
Original Assignee
주식회사 에스원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 에스원 filed Critical 주식회사 에스원
Priority to KR1020150123585A priority Critical patent/KR101688412B1/ko
Application granted granted Critical
Publication of KR101688412B1 publication Critical patent/KR101688412B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 종속 변수의 예측 모델링 방법 및 시스템에 관한 것으로, 본 발명에 따른 복수의 독립 변수에 대한 통계 데이터를 기반으로 복수의 독립 변수의 변화에 의존하는 종속 변수를 예측하는 방법은 (a) 미리 정해진 회귀 분석법에 따라 종속 변수에 대한 복수의 독립 변수의 가중률을 각각 추출하는 단계, 소정의 시간 단위마다 복수의 독립 변수 각각에 대한 이벤트 발생 여부에 따라 복수의 독립 변수의 가중률을 증감시키는 단계, 그리고 (c) 소정의 예측 기준 기간 동안 (a) 단계를 반복하여 구해지는 복수의 독립 변수의 가중률을 이용하여 종속 변수의 발생 가능성을 구하는 단계를 포함한다. 본 발명에 의하면, 지역적인 특색, 환경이나 시간 등의 다양한 독립 변수에 따라 유동적으로 가변되는 종속 변수의 예측 모델링을 구축하여 가변된 독립 변수에 맞게 종속 변수의 발생 가능성을 정확하게 예측할 수 있다.

Description

종속 변수의 예측 모델링 방법 및 시스템{Method and System for Modeling Prediction of Dependent Variable}
본 발명은 종속 변수의 예측 모델링 방법 및 시스템에 관한 것으로, 보다 자세하게는 독립 변수의 변화에 의존하는 종속 변수를 예측하는 종속 변수의 예측 모델링 방법 및 시스템에 관한 것이다.
모든 분야가 매우 빠르게 변하고 복합적으로 연결되어 있는 복잡한 현대 사회에서 관리자들은 불완전한 정보를 가지고 신속한 의사 결정을 내려야만 하는 상황에 직면하곤 한다. 이에 관리자들은 지속적으로 새로운 것을 학습하고 경험을 통해서 새로운 문제 봉착시 과거에 경험하였거나 학습한 유사 문제들을 회상하여 유사한 과거 문제를 해결하였던 방법과 그 결과에 대하여 생각하고 현재의 문제를 비교하여 과거 문제를 해결하였던 방법의 적용 가능성을 생각한다.
이후, 과거의 문제 해결 방법을 현재의 문제 해결에 적합하도록 필요한 변형 후 적용하여 예상되는 결과를 상상하여 보고, 적절한 문제 해결 방법의 수정과 적용 결과에 대한 상상을 통하여 최종적인 방법을 선택하여 의사 결정을 한다.
하지만, 관리자가 경험할 수 있는 케이스의 수는 제한되어 있고, 사람이기 때문에 경험이나 케이스를 기억하는 능력에 한계가 있으며, 많은 과거의 경험이나 학습 내용은 시간이 지나면 망각되는 문제점이 있었다.
이에 따라, 종래에는 과거의 다양한 케이스를 기반으로 독립 변수를 산출하고, 산출된 독립 변수를 기반으로 종속 변수를 예측하는 방식을 사용하였다. 종속 변수에 대한 독립 변수의 영향도 및 상관도 분석을 통하여 종속 변수의 예측 모델을 생성하는 경우 독립 변수의 통계량을 조사하고, 조사된 독립 변수의 통계량을 기초로 최초에 설정된 정책에 따라 종속 변수에 대한 독립 변수의 영향도 및 상관도를 분석하였다.
그러나, 종래의 방식은 분석하는 사람의 주관적인 정책에 따라 종속 변수에 대한 독립 변수의 영향도 및 상관도를 분석하기 때문에 객관화된 예측 모델을 생성하기 어려운 문제점이 있었다.
게다가, 이렇게 설정된 정책은 지역적인 특색, 환경 또는 시간 등의 조건이 고려되지 않은 고정된 형태의 정책이기 때문에 실제로 다양한 조건에 의해 가변되는 독립 변수의 영향도 및 상관도를 적용하기 어려운 문제점이 있었다.
이에 따라, 종속 변수에 대한 신뢰성 있는 결과를 예측하지 못하는 문제점이 있었다.
한국등록특허공보 제10-0650267호 (등록일 2006. 11. 20.)
따라서 본 발명이 해결하고자 하는 기술적 과제는 지역적인 특색, 환경이나 시간 등의 다양한 독립 변수에 따라 유동적으로 가변되는 종속 변수의 예측 모델을 구축하여 가변된 독립 변수에 맞게 종속 변수의 발생 가능성을 정확하게 예측할 수 있는 종속 변수의 예측 모델링 방법 및 시스템을 제공하는 것이다.
또한, 본 발명은 명시적으로 언급된 목적 이외에도, 후술하는 본 발명의 구성으로부터 달성될 수 있는 다른 목적도 포함한다.
상기한 기술적 과제를 해결하기 위한 본 발명의 실시예에 따른 복수의 독립 변수에 대한 통계 데이터를 기반으로 상기 복수의 독립 변수의 변화에 의존하는 종속 변수를 예측하는 종속 변수의 예측 모델링 방법은 (a) 미리 정해진 회귀 분석법에 따라 상기 종속 변수에 대한 복수의 독립 변수의 가중률을 각각 추출하는 단계, (b) 소정의 시간 단위마다 상기 복수의 독립 변수 각각에 대한 이벤트 발생 여부에 따라 상기 복수의 독립 변수의 가중률을 증감시키는 단계, 그리고 (c) 소정의 예측 기준 기간 동안 상기 (a) 단계를 반복하여 구해지는 상기 복수의 독립 변수의 가중률을 이용하여 상기 종속 변수의 발생 가능성을 구하는 단계를 포함한다.
상기 (b) 소정의 시간 단위마다 상기 복수의 독립 변수 각각에 대한 이벤트 발생 여부에 따라 상기 복수의 독립 변수의 가중률을 증감시키는 단계는 상기 독립 변수에 대한 이벤트가 발생하는 경우, 하기의 (수식 1)을 이용하여 상기 독립 변수의 가중률을 증가시키고,
(수식 1)
Figure 112015084876812-pat00001
Figure 112015084876812-pat00002
는 독립 변수 i의 가중률,
Figure 112015084876812-pat00003
는 시간 단위 및
Figure 112015084876812-pat00004
는 예측 기준 기간이다.
상기 (b) 소정의 시간 단위마다 상기 복수의 독립 변수 각각에 대한 이벤트 발생 여부에 따라 상기 복수의 독립 변수의 가중률을 증감시키는 단계는 상기 독립 변수에 대한 이벤트가 발생하지 않는 경우, 하기의 (수식 2)를 이용하여 상기 독립 변수의 가중률을 감소시키고,
(수식 2)
Figure 112015084876812-pat00005
Figure 112015084876812-pat00006
는 독립 변수 i의 가중률,
Figure 112015084876812-pat00007
는 시간 단위 및
Figure 112015084876812-pat00008
는 예측 기준 기간이다.
상기 (c) 소정의 예측 기준 기간 동안 상기 (a) 단계를 반복하여 구해지는 상기 복수의 독립 변수의 가중률을 이용하여 상기 종속 변수의 발생 가능성을 구하는 단계는 상기 복수의 독립 변수의 가중률 및 하기의 (수식 3)을 이용하여 상기 종속 변수의 발생 가능성을 구하고,
(수식 3)
Figure 112015084876812-pat00009
Figure 112015084876812-pat00010
는 종속 변수의 발생 가능성,
Figure 112015084876812-pat00011
는 독립 변수 i의 가중률 및
Figure 112015084876812-pat00012
는 독립 변수 i이다.
상기 소정의 시간 단위는 상기 복수의 독립 변수 중에서 시계열 변수의 가장 작은 단위 시간일 수 있다.
한편, 본 발명의 실시예에 따른 복수의 독립 변수에 대한 통계 데이터를 기반으로 상기 복수의 독립 변수의 변화에 의존하는 종속 변수를 예측하는 종속 변수의 예측 모델링 시스템은 미리 정해진 회귀 분석법에 따라 상기 종속 변수에 대한 복수의 독립 변수의 가중률을 각각 추출하는 독립 변수 가중률 추출부, 소정의 시간 단위마다 상기 복수의 독립 변수 각각에 대한 이벤트 발생 여부에 따라 상기 복수의 독립 변수의 가중률을 증감시키는 독립 변수 가중률 조정부, 그리고 소정의 예측 기준 기간 동안 상기 독립 변수 가중률 추출부에서 수행되는 동작을 반복하여 구해지는 상기 복수의 독립 변수의 가중률을 이용하여 상기 종속 변수의 발생 가능성을 구하는 종속 변수 예측부를 포함한다.
상기 독립 변수 가중률 조정부는 상기 독립 변수에 대한 이벤트가 발생하는 경우, 하기의 (수식 1)을 이용하여 상기 독립 변수의 가중률을 증가시키고,
(수식 1)
Figure 112015084876812-pat00013
Figure 112015084876812-pat00014
는 독립 변수 i의 가중률,
Figure 112015084876812-pat00015
는 시간 단위 및
Figure 112015084876812-pat00016
는 예측 기준 기간이다.
상기 독립 변수 가중률 조정부는 상기 독립 변수에 대한 이벤트가 발생하지 않는 경우, 하기의 (수식 2)를 이용하여 상기 독립 변수의 가중률을 감소시키고,
(수식 2)
Figure 112015084876812-pat00017
Figure 112015084876812-pat00018
는 독립 변수 i의 가중률,
Figure 112015084876812-pat00019
는 시간 단위 및
Figure 112015084876812-pat00020
는 예측 기준 기간이다.
상기 종속 변수 예측부는 상기 복수의 독립 변수의 가중률 및 하기의 (수식 3)을 이용하여 상기 종속 변수의 발생 가능성을 구하고,
(수식 3)
Figure 112015084876812-pat00021
Figure 112015084876812-pat00022
는 종속 변수의 발생 가능성,
Figure 112015084876812-pat00023
는 독립 변수 i의 가중률 및
Figure 112015084876812-pat00024
는 독립 변수 i이다.
상기 소정의 시간 단위는 상기 복수의 독립 변수 중에서 시계열 변수의 가장 작은 단위 시간일 수 있다.
이와 같이 본 발명의 실시예에 따른 종속 변수의 예측 모델링 방법 및 시스템에 따르면, 지역적인 특색, 환경이나 시간 등의 다양한 독립 변수에 따라 유동적으로 가변되는 종속 변수의 예측 모델을 구축하여 가변된 독립 변수에 맞게 종속 변수의 발생 가능성을 정확하게 예측할 수 있는 장점이 있다.
즉, 가변된 독립 변수의 가중률을 기준으로 하여 종속 변수의 발생 가능성을 구할 수 있기 때문에 종속 변수의 예측 모델링 구축에 있어서 지역적인 특색, 환경 또는 시간 등과 같은 독립 변수에 대한 고려가 동적으로 이루어질 수 있는 적응형 모델을 구성할 수 있는 장점이 있다.
한편, 본 발명의 효과는 상술된 것에 국한되지 않고 후술하는 본 발명의 구성으로부터 도출될 수 있는 다른 효과도 본 발명의 효과에 포함된다.
도 1은 본 발명의 실시예에 따른 종속 변수의 예측 모델링 시스템의 구성도이다.
도 2는 본 발명의 실시예에 따른 종속 변수의 예측 모델링 과정을 보여주는 동작 흐름도이다.
그러면 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다.
도 1은 본 발명의 실시예에 따른 종속 변수의 예측 모델링 시스템의 구성도를 나타낸다.
도 1에 도시한 바와 같이, 종속 변수의 예측 모델링 시스템(1)은 독립 변수 가중률 추출부(100), 독립 변수 가중률 조정부(200) 및 종속 변수 예측부(300)를 포함하여 구성된다.
독립 변수 가중률 추출부(100)는 미리 정해진 회귀 분석법에 따라 종속 변수에 대한 복수의 독립 변수의 가중률을 각각 추출할 수 있다.
보다 자세하게는, 서로 관계를 주고 받는 둘 또는 그 이상의 변수 중에서 다른 변수에 영향을 주는 변수도 있고, 다른 변수에 의해 영향을 받는 변수도 있는데, 이때 영향을 받는 변수를 종속 변수라 하고, 반대로 영향을 주는 변수를 독립 변수라고 한다. 예컨대, 상품의 가격과 수요의 관계에서 상품의 가격이 수요에 영향을 미칠 경우, 상품의 가격은 독립 변수가 되며, 상품의 수요는 종속 변수가 될 수 있다.
독립 변수의 가중률은 종속 변수에 해당되는 이벤트가 발생하는데 영향력을 주는 계수로서, 예컨대, y(종속 변수) = 4X1+3X2+2.5X3에서 X1, X2, X3이 서로 다른 독립 변수일 경우, X1의 4에 해당되는 가중률이 종속 변수에 대한 이벤트가 발생하는데 가장 큰 영향력을 끼친다고 볼 수 있다.
회귀 분석법은 변수 간의 관계를 분석하여 알고 있는 변수를 기초로 알려지지 않은 변수의 값을 예측하는 통계적 분석 방법으로서, 회귀 분석에서 독립 변수에 따라 종속 변수의 값이 일정한 패턴으로 변해 가는데, 이러한 변수 간의 관계를 나타내는 회귀선이 직선에 가깝게 나타나는 경우를 선형 회귀 분석이라고 한다. 그리고 선형 회귀 분석은 한 개의 독립 변수가 종속 변수에 미치는 영향을 파악하기 위해 실시하는 단순 회귀 분석법, 여러 개의 독립 변수가 종속 변수에 미치는 영향을 파악하기 위해 실시하는 다중 회귀 분석법 등으로 분류될 수 있다.
이와 같이, 독립 변수 가중률 추출부(100)는 다중 회귀 분석법에 따라 한 개의 종속 변수에 대한 복수의 독립 변수의 가중률을 각각 추출할 수 있는데, 예를 들어, A 차량에 고장이 발생하는 경우(종속 변수)를 예측하고자 할 때, 독립 변수 가중률 추출부(100)는 A 차량에 대하여 과거에 고장이 발생된 다양한 경우에 대한 통계 데이터를 데이터베이스(미도시)로부터 추출할 수 있다. 과거의 통계 데이터로부터 측정된 타이어, 엔진 또는 브레이크 등과 같이 A 차량에 고장이 발생된 원인에 해당되는 요소가 독립 변수에 해당될 수 있다. 그리고, 독립 변수 가중률 추출부(100)는 과거의 통계 데이터를 기초로 회귀 분석법에 따라 각 독립 변수(타이어, 엔진 또는 브레이크 등)에 해당하는 가중률을 추출할 수 있다.
독립 변수 가중률 조정부(200)는 소정의 시간 단위마다 복수의 독립 변수 각각에 대한 이벤트 발생 여부에 따라 복수의 독립 변수의 가중률을 증감시킬 수 있다.
예를 들어 설명하면, 독립 변수가 X1, X2, X3로 이루어진 경우, 종속 변수 y의 예측 값은 X1, X2, X3 각각의 값과 X1, X2, X3 각각의 가중률을 곱한 값을 합산하여 구해질 수 있다. 이때, 종속 변수 y의 예측 값은 필요에 따라 Y 또는 N으로 구분해야 할 경우 0~1의 2단계의 값으로 나눌 수 있거나, 1~10의 10단계의 값 또는 확률로 구분하여 산출될 수 있다. 그리고, 독립 변수가 Y 또는 N일 경우, 1 또는 0을 독립 변수에 대입하여 계산할 수 있으며, 독립 변수가 1일 경우 독립 변수의 가중률만큼 종속 변수에 영향을 미치고, 독립 변수가 0일 경우 종속 변수에 전혀 영향을 안미치게 된다.
이와 같이, 종속 변수 y에 대하여 예측은 할 수 있으나, 이 예측이 맞거나 틀린 경우를 확인하기 위해서는 실제 관측 값이 있어야 하고, 종속 변수 y의 예측 값이 Y로 산출되었으나, 실제 관측 값이 N라면 독립 변수의 가중률을 조정하여 종속 변수 y의 예측 값이 N 또는 N으로 구분되는 임계치에 근접하게 접근할 수 있도록 해야 한다.
이에 독립 변수 가중률 조정부(200)는 독립 변수에 대한 이벤트의 발생 여부에 따라 미리 정해진 가중률의 범위(예컨대, +50% or -50%) 내에서 독립 변수의 가중률이 가감되도록 하여 종속 변수의 예측 값이 실제 관측 값에 근접하도록 한다.
이때, 소정의 시간 단위는 복수의 독립 변수 중에서 시계열 변수의 가장 작은 단위 시간일 수 있다. 예컨대, 시계열 변수가 년, 월, 일, 시, 분 및 초로 이루어진 경우, 가장 작은 단위 시간은 초일 수 있다.
복수의 독립 변수의 가중률은 시계열 변수 중 가장 작은 단위 시간의 가중률을 기준으로 조정이 이루어질 수 있다. 시간 단위는 수집되는 통계 데이터의 의미에 맞게 조정 가능하다. 예를 들어, 초 단위로 많은 통계 데이터들이 유의미하게 모아진다면 초를 시간 단위로 결정하고, 분 단위로 통계 데이터들이 유의미하게 모아진다면 분을 시간 단위로 결정하고, 시 단위로 통계 데이터들이 유의미하게 모아진다면 시를 시간 단위로 결정할 수 있다.
보다 자세하게는, 독립 변수 가중률 조정부(200)는 독립 변수에 대한 이벤트가 발생하는 경우, 하기의 (수식 1)을 이용하여 독립 변수의 가중률을 증가시킬 수 있다.
(수식 1)
Figure 112015084876812-pat00025
여기서,
Figure 112015084876812-pat00026
는 독립 변수 i의 가중률,
Figure 112015084876812-pat00027
는 시간 단위 및
Figure 112015084876812-pat00028
는 예측 기준 기간이다.
그리고, 독립 변수 가중률 조정부(200)는 독립 변수에 대한 이벤트가 발생하지 않는 경우, 하기의 (수식 2)를 이용하여 독립 변수의 가중률을 감소시킬 수 있다.
(수식 2)
Figure 112015084876812-pat00029
여기서,
Figure 112015084876812-pat00030
는 독립 변수 i의 가중률,
Figure 112015084876812-pat00031
는 시간 단위 및
Figure 112015084876812-pat00032
는 예측 기준 기간이다.
종속 변수 예측부(300)는 소정의 예측 기준 기간 동안 독립 변수 가중률 조정부(200)에서 복수의 독립 변수의 가중률을 추출하는 동작을 반복하여 구해지는 복수의 독립 변수의 가중률을 이용하여 종속 변수의 발생 가능성을 구할 수 있다. 소정의 예측 기준 기간은 복수의 독립 변수에 대한 통계 데이터를 수집하여 종속 변수를 예측하도록 설정하는 기준 기간으로서, 종속 변수의 예측 모델링 시스템(1)의 종류와 필요에 따라 조정 가능할 수 있다.
보다 자세하게는, 종속 변수 예측부(300)는 복수의 독립 변수의 가중률 및 하기의 (수식 3)을 이용하여 종속 변수의 발생 가능성을 구할 수 있다.
(수식 3)
Figure 112015084876812-pat00033
여기서,
Figure 112015084876812-pat00034
는 종속 변수의 발생 가능성,
Figure 112015084876812-pat00035
는 독립 변수 i의 가중률 및
Figure 112015084876812-pat00036
는 독립 변수 i이다.
이와 같이, 각 독립 변수에 대한 이벤트의 발생 빈도에 따라 각 독립 변수의 가중률이 조정되는데, 실질적으로 종속 변수에 영향을 많이 미치는 독립 변수의 가중률은 증가되고, 영향을 미치지 않는 독립 변수의 가중률은 하락하게 된다. 그리고, 변화된 독립 변수의 가중률을 기준으로 하여 종속 변수의 발생 가능성을 구할 수 있기 때문에 종속 변수의 예측 모델링 구축에 있어서 지역적인 특색, 환경 또는 시간 등의 변수에 유동적으로 변화하는 적응형 모델을 구성할 수 있다.
이하에서는 본 발명의 실시예에 따른 종속 변수의 예측 모델링 과정에 대하여 설명하도록 한다.
도 2는 본 발명의 실시예에 따른 종속 변수의 예측 모델링 과정을 보여주는 동작 흐름도를 나타낸다.
도 2에 도시한 바와 같이, 미리 정해진 회귀 분석법에 따라 종속 변수에 대한 복수의 독립 변수의 가중률을 각각 추출할 수 있다(S200). 독립 변수의 가중률은 종속 변수에 해당되는 이벤트가 발생하는데 영향력을 주는 계수로서, 예컨대, y(종속 변수) = 4X1+3X2+2.5X3에서 X1, X2, X3이 서로 다른 독립 변수일 경우, X1의 4에 해당되는 가중률이 종속 변수에 대한 이벤트가 발생하는데 가장 큰 영향력을 끼친다고 볼 수 있다.
독립 변수 가중률 추출부(100)는 다중 회귀 분석법에 따라 한 개의 종속 변수에 대한 복수의 독립 변수의 가중률을 각각 추출할 수 있는데, 예를 들어, A 차량에 고장이 발생하는 경우(종속 변수)를 예측하고자 할 때, 독립 변수 가중률 추출부(100)는 A 차량에 대하여 과거에 고장이 발생된 다양한 경우에 대한 통계 데이터를 데이터베이스(미도시)로부터 추출할 수 있다. 과거의 통계 데이터로부터 측정된 타이어, 엔진 또는 브레이크 등과 같이 A 차량에 고장이 발생된 원인에 해당되는 요소가 독립 변수에 해당될 수 있다. 그리고, 독립 변수 가중률 추출부(100)는 과거의 통계 데이터를 기초로 회귀 분석법에 따라 각 독립 변수(타이어, 엔진 또는 브레이크 등)에 해당하는 가중률을 추출할 수 있다.
다음으로, 소정의 시간 단위마다 복수의 독립 변수 각각에 대한 이벤트 발생 여부에 따라 복수의 독립 변수의 가중률을 증감시킬 수 있다(S210).
예를 들어 설명하면, 독립 변수가 X1, X2, X3로 이루어진 경우, 종속 변수 y의 예측 값은 X1, X2, X3 각각의 값과 X1, X2, X3 각각의 가중률을 곱한 값을 합산하여 구해질 수 있다. 이때, 종속 변수 y의 예측 값은 필요에 따라 Y 또는 N으로 구분해야 할 경우 0~1 사이(2단계)의 값으로 나눌 수 있거나, 1~10의 10단계 또는 확률로 구분하여 산출할 수 있다.
이와 같이, 종속 변수 y에 대하여 예측은 할 수 있으나, 이 예측이 맞거나 틀린 경우를 확인하기 위해서는 실제 관측 값이 있어야 하고, 종속 변수 y의 예측 값이 Y로 산출되었으나, 실제 관측 값이 N라면 독립 변수의 가중률을 조정하여 종속 변수 y의 예측 값이 N 또는 N으로 구분되는 임계치에 근접하게 접근할 수 있도록 해야 한다.
이에 독립 변수 가중률 조정부(200)는 독립 변수에 대한 이벤트의 발생 여부에 따라 미리 정해진 가중률의 범위(예컨대, +50% or -50%) 내에서 독립 변수의 가중률이 가감되도록 하여 종속 변수의 예측 값이 실제 관측 값에 근접하도록 한다.
이때, 소정의 시간 단위는 복수의 독립 변수 중에서 시계열 변수의 가장 작은 단위 시간일 수 있다. 예컨대, 시계열 변수가 년, 월, 일, 시, 분, 초로 이루어진 경우, 가장 작은 단위 시간은 초일 수 있으며, 복수의 독립 변수의 가중률은 시계열 변수 중 가장 작은 단위 시간의 가중률을 기준으로 조정이 이루어질 수 있다.
보다 자세하게는, 독립 변수 가중률 조정부(200)는 독립 변수에 대한 이벤트가 발생하는 경우, 하기의 (수식 1)을 이용하여 독립 변수의 가중률을 증가시킬 수 있다.
(수식 1)
Figure 112015084876812-pat00037
여기서,
Figure 112015084876812-pat00038
는 독립 변수 i의 가중률,
Figure 112015084876812-pat00039
는 시간 단위 및
Figure 112015084876812-pat00040
는 예측 기준 기간이다.
그리고, 독립 변수 가중률 조정부(200)는 독립 변수에 대한 이벤트가 발생하지 않는 경우, 하기의 (수식 2)을 이용하여 독립 변수의 가중률을 감소시킬 수 있다.
(수식 2)
Figure 112015084876812-pat00041
여기서,
Figure 112015084876812-pat00042
는 독립 변수 i의 가중률,
Figure 112015084876812-pat00043
는 시간 단위 및
Figure 112015084876812-pat00044
는 예측 기준 기간이다.
그리고, 소정의 예측 기준 기간 동안 독립 변수의 가중률의 추출 과정을 반복하여 구해지는 복수의 독립 변수의 가중률을 이용하여 종속 변수의 발생 가능성을 구할 수 있다(S220). 소정의 예측 기준 기간은 복수의 독립 변수에 대한 통계 데이터를 수집하여 종속 변수를 예측하도록 설정하는 기준 기간으로서, 종속 변수의 예측 모델링 시스템(1)의 종류와 필요에 따라 조정 가능할 수 있다.
보다 자세하게는, 복수의 독립 변수의 가중률 및 하기의 (수식 3)을 이용하여 종속 변수의 발생 가능성을 구할 수 있다.
(수식 3)
Figure 112015084876812-pat00045
여기서,
Figure 112015084876812-pat00046
는 종속 변수의 발생 가능성,
Figure 112015084876812-pat00047
는 독립 변수 i의 가중률 및
Figure 112015084876812-pat00048
는 독립 변수 i이다.
이와 같이, 각 독립 변수에 대한 이벤트의 발생 빈도에 따라 각 독립 변수의 가중률이 조정되는데, 실질적으로 종속 변수에 영향을 많이 미치는 독립 변수의 가중률은 증가되고, 영향을 미치지 않는 독립 변수의 가중률은 하락하게 된다. 그리고, 변화된 독립 변수의 가중률을 기준으로 하여 종속 변수의 발생 가능성을 구할 수 있기 때문에 종속 변수의 예측 모델링 구축에 있어서 지역적인 특색, 환경 또는 시간 등의 변수에 유동적으로 변화하는 적응형 모델을 구성할 수 있다.
본 발명의 실시예는 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터로 읽을 수 있는 매체를 포함한다. 이 매체는 앞서 설명한 종속 변수의 예측 모델링 방법을 실행시키기 위한 프로그램을 기록한다. 이 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 이러한 매체의 예에는 하드디스크, 플로피디스크 및 자기 테이프와 같은 자기 매체, CD 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 자기-광 매체, 롬, 램, 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 구성된 하드웨어 장치 등이 있다. 또는 이러한 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상에서 본 발명의 바람직한 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
1: 종속 변수의 예측 모델링 시스템
100: 독립 변수 가중률 추출부
200: 독립 변수 가중률 조정부
300: 종속 변수 예측부

Claims (10)

  1. 복수의 독립 변수에 대한 통계 데이터를 기반으로 상기 복수의 독립 변수의 변화에 의존하는 종속 변수를 예측하는 종속 변수의 예측 모델링 방법에 있어서,
    (a) 독립 변수 가중률 추출부가 미리 정해진 회귀 분석법에 따라 상기 종속 변수에 대한 복수의 독립 변수의 가중률을 각각 추출하는 단계,
    (b) 독립 변수 가중률 조정부가 소정의 시간 단위마다 상기 복수의 독립 변수 각각에 대한 이벤트 발생 여부에 따라 상기 복수의 독립 변수의 가중률을 증감시키는 단계, 그리고
    (c) 종속 변수 예측부가 소정의 예측 기준 기간 동안 상기 (a) 단계를 반복하여 구해지는 상기 복수의 독립 변수의 가중률을 이용하여 상기 종속 변수의 발생 가능성을 구하는 단계를 포함하고,
    상기 (b) 독립 변수 가중률 조정부가 소정의 시간 단위마다 상기 복수의 독립 변수 각각에 대한 이벤트 발생 여부에 따라 상기 복수의 독립 변수의 가중률을 증감시키는 단계는,
    상기 독립 변수에 대한 이벤트가 발생하는 경우, 하기의 (수식 1)을 이용하여 상기 독립 변수의 가중률을 증가시키고,
    (수식 1)
    Figure 112016072144852-pat00049

    상기 독립 변수에 대한 이벤트가 발생하지 않는 경우, 하기의 (수식 2)를 이용하여 상기 독립 변수의 가중률을 감소시키고,
    (수식 2)
    Figure 112016072144852-pat00053

    Figure 112016072144852-pat00054
    는 독립 변수 i의 가중률,
    Figure 112016072144852-pat00055
    는 시간 단위 및
    Figure 112016072144852-pat00056
    는 예측 기준 기간이고,
    상기 소정의 시간 단위는,
    상기 복수의 독립 변수 중에서 시계열 변수의 가장 작은 단위 시간인 종속 변수의 예측 모델링 방법.
  2. 삭제
  3. 삭제
  4. 제 1 항에서,
    상기 (c) 종속 변수 예측부가 소정의 예측 기준 기간 동안 상기 (a) 단계를 반복하여 구해지는 상기 복수의 독립 변수의 가중률을 이용하여 상기 종속 변수의 발생 가능성을 구하는 단계는,
    상기 복수의 독립 변수의 가중률 및 하기의 (수식 3)을 이용하여 상기 종속 변수의 발생 가능성을 구하고,
    (수식 3)
    Figure 112016072144852-pat00057

    Figure 112016072144852-pat00058
    는 종속 변수의 발생 가능성,
    Figure 112016072144852-pat00059
    는 독립 변수 i의 가중률 및
    Figure 112016072144852-pat00060
    는 독립 변수 i인 종속 변수의 예측 모델링 방법.
  5. 삭제
  6. 복수의 독립 변수에 대한 통계 데이터를 기반으로 상기 복수의 독립 변수의 변화에 의존하는 종속 변수를 예측하는 종속 변수의 예측 모델링 시스템에 있어서,
    미리 정해진 회귀 분석법에 따라 상기 종속 변수에 대한 복수의 독립 변수의 가중률을 각각 추출하는 독립 변수 가중률 추출부,
    소정의 시간 단위마다 상기 복수의 독립 변수 각각에 대한 이벤트 발생 여부에 따라 상기 복수의 독립 변수의 가중률을 증감시키는 독립 변수 가중률 조정부, 그리고
    소정의 예측 기준 기간 동안 상기 독립 변수 가중률 추출부의 추출 동작을 반복하여 구해지는 상기 복수의 독립 변수의 가중률을 이용하여 상기 종속 변수의 발생 가능성을 구하는 종속 변수 예측부를 포함하고,
    상기 독립 변수 가중률 조정부는,
    상기 독립 변수에 대한 이벤트가 발생하는 경우, 하기의 (수식 1)을 이용하여 상기 독립 변수의 가중률을 증가시키고,
    (수식 1)
    Figure 112016072144852-pat00061

    상기 독립 변수에 대한 이벤트가 발생하지 않는 경우, 하기의 (수식 2)를 이용하여 상기 독립 변수의 가중률을 감소시키고,
    (수식 2)
    Figure 112016072144852-pat00065

    Figure 112016072144852-pat00066
    는 독립 변수 i의 가중률,
    Figure 112016072144852-pat00067
    는 시간 단위 및
    Figure 112016072144852-pat00068
    는 예측 기준 기간이고,
    상기 소정의 시간 단위는,
    상기 복수의 독립 변수 중에서 시계열 변수의 가장 작은 단위 시간인 종속 변수의 예측 모델링 시스템.
  7. 삭제
  8. 삭제
  9. 제 6 항에서,
    상기 종속 변수 예측부는,
    상기 복수의 독립 변수의 가중률 및 하기의 (수식 3)을 이용하여 상기 종속 변수의 발생 가능성을 구하고,
    (수식 3)
    Figure 112015084876812-pat00069

    Figure 112015084876812-pat00070
    는 종속 변수의 발생 가능성,
    Figure 112015084876812-pat00071
    는 독립 변수 i의 가중률 및
    Figure 112015084876812-pat00072
    는 독립 변수 i인 종속 변수의 예측 모델링 시스템.
  10. 삭제
KR1020150123585A 2015-09-01 2015-09-01 종속 변수의 예측 모델링 방법 및 시스템 KR101688412B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150123585A KR101688412B1 (ko) 2015-09-01 2015-09-01 종속 변수의 예측 모델링 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150123585A KR101688412B1 (ko) 2015-09-01 2015-09-01 종속 변수의 예측 모델링 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR101688412B1 true KR101688412B1 (ko) 2016-12-21

Family

ID=57734600

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150123585A KR101688412B1 (ko) 2015-09-01 2015-09-01 종속 변수의 예측 모델링 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101688412B1 (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101856543B1 (ko) * 2018-02-26 2018-05-11 주식회사 리앙커뮤니케이션즈 인공지능 기반의 장애 예측 시스템
KR20190048840A (ko) * 2017-10-31 2019-05-09 삼성에스디에스 주식회사 자동으로 최적의 통계 모델을 결정하는 방법 및 그 장치
KR101976689B1 (ko) * 2018-11-29 2019-05-09 주식회사 솔리드웨어 데이터 모델링을 위한 변수 자동생성방법 및 그 장치
KR20210117084A (ko) * 2020-03-18 2021-09-28 전남대학교산학협력단 오차항의 독립성 보정 기반의 모수 추정 방법, 이를 구현하는 컴퓨터 프로그램 및 이를 수행하도록 구성되는 시스템
KR20210143547A (ko) * 2020-05-20 2021-11-29 국방과학연구소 교전 시뮬레이션 결과 예측을 위한 메타 모델 생성 방법, 장치 및 기록 매체
KR102374004B1 (ko) * 2021-10-25 2022-03-15 주식회사 에어핏 위성이미지를 통한 수위, 용적량, 유입량 및 오염도 측정 장치, 방법 및 프로그램
WO2024063195A1 (ko) * 2022-09-23 2024-03-28 전남대학교산학협력단 샘플 크기가 작고 불균형한 분포를 가진 임상 데이터에서 예측을 위한 통계적학습 프레임워크

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR940020245A (ko) * 1993-02-01 1994-09-15 가나이 쯔도무 계량 경제 모델 시뮬레이션 시스템
KR20050080818A (ko) * 2004-02-11 2005-08-18 삼성전자주식회사 가중된 회귀모델 결정 방법 및 이를 이용한 혼합물의 성분농도 예측 방법
KR100650267B1 (ko) 2005-10-19 2006-11-27 주식회사 포스코 분진 예측방법
KR20140093532A (ko) * 2013-01-18 2014-07-28 주식회사 에프앤가이드 산업군에 대한 위기지수 산출방법 및 장치
KR20140116619A (ko) * 2013-03-25 2014-10-06 삼성에스디에스 주식회사 에너지 사용량 예측 시스템 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR940020245A (ko) * 1993-02-01 1994-09-15 가나이 쯔도무 계량 경제 모델 시뮬레이션 시스템
KR20050080818A (ko) * 2004-02-11 2005-08-18 삼성전자주식회사 가중된 회귀모델 결정 방법 및 이를 이용한 혼합물의 성분농도 예측 방법
KR100650267B1 (ko) 2005-10-19 2006-11-27 주식회사 포스코 분진 예측방법
KR20140093532A (ko) * 2013-01-18 2014-07-28 주식회사 에프앤가이드 산업군에 대한 위기지수 산출방법 및 장치
KR20140116619A (ko) * 2013-03-25 2014-10-06 삼성에스디에스 주식회사 에너지 사용량 예측 시스템 및 방법

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190048840A (ko) * 2017-10-31 2019-05-09 삼성에스디에스 주식회사 자동으로 최적의 통계 모델을 결정하는 방법 및 그 장치
KR102045415B1 (ko) * 2017-10-31 2019-11-15 삼성에스디에스 주식회사 자동으로 최적의 통계 모델을 결정하는 방법 및 그 장치
KR101856543B1 (ko) * 2018-02-26 2018-05-11 주식회사 리앙커뮤니케이션즈 인공지능 기반의 장애 예측 시스템
KR101976689B1 (ko) * 2018-11-29 2019-05-09 주식회사 솔리드웨어 데이터 모델링을 위한 변수 자동생성방법 및 그 장치
WO2020111423A1 (ko) * 2018-11-29 2020-06-04 주식회사 솔리드웨어 데이터 모델링을 위한 변수 자동생성방법 및 그 장치
KR20210117084A (ko) * 2020-03-18 2021-09-28 전남대학교산학협력단 오차항의 독립성 보정 기반의 모수 추정 방법, 이를 구현하는 컴퓨터 프로그램 및 이를 수행하도록 구성되는 시스템
KR102311412B1 (ko) * 2020-03-18 2021-10-12 전남대학교산학협력단 오차항의 독립성 보정 기반의 모수 추정 방법, 이를 구현하는 컴퓨터 프로그램 및 이를 수행하도록 구성되는 시스템
KR20210143547A (ko) * 2020-05-20 2021-11-29 국방과학연구소 교전 시뮬레이션 결과 예측을 위한 메타 모델 생성 방법, 장치 및 기록 매체
KR102383090B1 (ko) 2020-05-20 2022-04-05 국방과학연구소 교전 시뮬레이션 결과 예측을 위한 메타 모델 생성 방법, 장치 및 기록 매체
KR102374004B1 (ko) * 2021-10-25 2022-03-15 주식회사 에어핏 위성이미지를 통한 수위, 용적량, 유입량 및 오염도 측정 장치, 방법 및 프로그램
KR102479804B1 (ko) * 2021-10-25 2022-12-23 주식회사 에어핏 지역 및 계절에 대한 특성이 반영된 인공지능모델을 이용한 수위, 용적량, 유입량 및 오염도 측정 방법, 장치 및 프로그램
WO2024063195A1 (ko) * 2022-09-23 2024-03-28 전남대학교산학협력단 샘플 크기가 작고 불균형한 분포를 가진 임상 데이터에서 예측을 위한 통계적학습 프레임워크

Similar Documents

Publication Publication Date Title
KR101688412B1 (ko) 종속 변수의 예측 모델링 방법 및 시스템
US11645293B2 (en) Anomaly detection in big data time series analysis
KR102044205B1 (ko) 빅데이터와 기계학습을 이용한 타겟 정보 예측 시스템 및 예측 방법
JP7082461B2 (ja) 故障予知方法、故障予知装置および故障予知プログラム
JP6312630B2 (ja) 時系列データ内の異常を検出する方法
DeStefano et al. Method for estimating transition probability in bridge deterioration models
JP6354755B2 (ja) システム分析装置、システム分析方法、及びシステム分析プログラム
CN109255395A (zh) 一种滚珠丝杠副的寿命预测方法
JPWO2017022234A1 (ja) 製造プロセス分析装置、製造プロセス分析方法、及び、製造プロセス分析プログラムが格納された記録媒体
CN112683535A (zh) 基于多阶段维纳过程的轴承寿命预测方法
JP7393244B2 (ja) 時系列データ予測装置及び時系列データ予測方法
KR102152403B1 (ko) 데이터 패턴 분석을 이용한 비정상행위 탐지 장치 및 방법
US20240086707A1 (en) Device, method, program, and system for detecting unidentified water
CN116361695A (zh) 异常数据检测方法以及装置
Soons et al. Predicting remaining useful life with similarity-based priors
Charles et al. On the pernicious effects of oil price uncertainty on US real economic activities
AU2021269196B2 (en) Performance event troubleshooting system
CN107783942B (zh) 一种异常行为检测方法及装置
KR20090123352A (ko) 주식 시세 예측 방법 및 이를 이용한 주식 시세 예측시스템
KR102306968B1 (ko) 사용자의 사용특성을 고려한 전력 사용량 예측 알고리즘
JP2013149203A (ja) 最適モデル推定装置、方法、及びプログラム
Duncan et al. Nowcasting with numerous candidate predictors
Kobayashi et al. Deterioration forecasting of joint members based on long-term monitoring data
JP2020135591A (ja) 推定装置、推定方法、および、コンピュータプログラム
JP5826893B1 (ja) 変化点予測装置、変化点予測方法、及びコンピュータプログラム

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant