KR20220057121A - 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그것에 의해 수행되는 탄소 배출권 가격 예측 방법 - Google Patents

검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그것에 의해 수행되는 탄소 배출권 가격 예측 방법 Download PDF

Info

Publication number
KR20220057121A
KR20220057121A KR1020200142026A KR20200142026A KR20220057121A KR 20220057121 A KR20220057121 A KR 20220057121A KR 1020200142026 A KR1020200142026 A KR 1020200142026A KR 20200142026 A KR20200142026 A KR 20200142026A KR 20220057121 A KR20220057121 A KR 20220057121A
Authority
KR
South Korea
Prior art keywords
price
carbon
search
carbon credit
weekly
Prior art date
Application number
KR1020200142026A
Other languages
English (en)
Other versions
KR102425013B1 (ko
Inventor
한승우
김현호
김유진
임기성
이민우
Original Assignee
인하대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인하대학교 산학협력단 filed Critical 인하대학교 산학협력단
Priority to KR1020200142026A priority Critical patent/KR102425013B1/ko
Publication of KR20220057121A publication Critical patent/KR20220057121A/ko
Application granted granted Critical
Publication of KR102425013B1 publication Critical patent/KR102425013B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Mathematical Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Algebra (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그 방법에 관한 것이다.
본 발명에 따르면, 탄소 배출권과 관련된 복수의 검색어에 대한 주간 검색 빈도수 데이터를 추출하는 단계, 상기 탄소 배출권의 주간 종가 데이터를 한국 거래소로부터 수집하는 단계, 상기 주간 검색 빈도수 데이터와 상기 탄소 배출권의 주간 종가 데이터를 각각의 주차별로 저장하여 데이터베이스를 구축하는 단계, 상기 데이터베이스에 저장된 각각의 상기 주간 검색 빈도수 데이터와 주간 종가 데이터를 교차상관 분석하여 각 주차 별로 상기 주간 검색 빈도수의 상관지수를 연산하는 단계, 상기 연산된 상관지수가 기준 값보다 작은 경우, 해당 주차의 주간 검색 빈도수 데이터를 상기 데이터베이스에서 삭제하고, 주간 검색 빈도수 데이터와 주간 종가 데이터를 다중회귀 분석방법에 적용하여 상기 각 주차 별로 복수의 회귀 모델을 추출하는 단계, 상기 각각의 주차 별로 추출된 복수의 회귀모델에 대하여 각각의 적합도를 연산하고, 각 주차 별 적합도가 가장 큰 값을 가지는 회귀모델을 주차별로 선정하는 단계, 상기 각 주차 별로 선정된 회귀모델을 예측오차 분석방법에 적용하여 평균 절대 오차 비율을 연산하고, 상기 평균 절대 오차 비율이 가장 작은 회귀모델을 최종 예측모델로 선정하는 단계, 그리고 현재 시점의 탄소 배출권과 관련된 복수의 관심 검색어를 입력받아 상기 최종 예측 모델에 적용하여 최종 탄소 배출권 가격을 예측하는 단계를 포함한다.
이와 같이 본 발명에 따르면, 탄소배출권 관련 검색어에 따라 탄소배출권 가격을 예측할 수 있어 변화하는 탄소배출권 시장의 영향을 반영하여 건설 현장에서의 정확한 환경부담금을 고려한 예산을 산정할 수 있다.

Description

검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그 방법{SYSTEM FOR PREDICTING CARBON CREDITS PRICE USING SEARCH VOLUME ANALYSIS AND MULTIPLE REGRESSION ANALYSIS AND METHOD THEREOF}
본 발명은 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그 방법에 관한 것으로, 검색어 데이터와 탄소 배출권 가격 데이터를 이용하여 탄소 배출권의 가격을 정확히 예측하기 위한 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그 방법에 관한 것이다.
범국가적 탄소배출권 거래제가 시행된 이후 세계적으로 탄소배출과 관련한 관심이 높아지고 있다. 대학민국은 2015년부터 탄소배출권 거래제도가 시행되었고, 이에 발맞추어 각 산업 분야에 탄소배출권을 할당하였다.
그러나 현재 건설업에서 고려되는 탄소배출권 거래 품목은 완공 이후 건물에서 배출되는 탄소에 한정되어 있으며, 시공단계로 확대될 탄소배출권 시장에 대비하여 시공단계의 탄소배출권의 규모와 그 가격을 통해 정확한 예산을 파악하는 것이 우선되어야 한다.
국내의 탄소배출권 거래제의 도입 이후, 탄소배출권 가격의 영향요인들에 대한 분석이 진행되고 있지만, 탄소배출권 가격을 실질적으로 예측하는 예측모형 등에 대한 개발은 더딘 상황이다.
변동하는 국내의 탄소배출권 가격을 예측할 지표의 부재로 탄소배출권 가격의 정확한 추이를 짐작하기 어려우며, 이에 대략적으로 환경부담금을 고려하여 예산 산정이 진행되고 있어 전체 공사에 있어 효율적인 배분이 이루어지고 있다고 말하기 어려운 실정이다.
따라서, 건설 현장에서의 정확한 환경부담금을 고려한 예산을 산정하기 위한 기술 개발이 필요하다.
본 발명의 배경이 되는 기술은 대한민국 공개특허 제10-2008-0074753호(2008.08.13. 공개)에 개시되어 있다.
본 발명이 이루고자 하는 기술적 과제는 검색어 데이터와 탄소 배출권 가격 데이터를 이용하여 탄소 배출권의 가격을 정확히 예측하기 위한 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그 방법에 관한 것이다.
이러한 기술적 과제를 이루기 위한 본 발명의 실시 예에 따르면, 탄소 배출권 가격 예측 시스템을 이용한 탄소 배출권 가격 예측 방법에 있어서, 탄소 배출권과 관련된 복수의 검색어에 대한 주간 검색 빈도수 데이터를 추출하는 단계, 상기 탄소 배출권의 주간 종가 데이터를 한국 거래소로부터 수집하는 단계, 상기 주간 검색 빈도수 데이터와 상기 탄소 배출권의 주간 종가 데이터를 각각의 주차별로 저장하여 데이터베이스를 구축하는 단계, 상기 데이터베이스에 저장된 각각의 상기 주간 검색 빈도수 데이터와 주간 종가 데이터를 교차상관 분석하여 각 주차 별로 상기 주간 검색 빈도수의 상관지수를 연산하는 단계, 상기 연산된 상관지수가 기준 값보다 작은 경우, 해당 주차의 주간 검색 빈도수 데이터를 상기 데이터베이스에서 삭제하고, 주간 검색 빈도수 데이터와 주간 종가 데이터를 다중회귀 분석방법에 적용하여 상기 각 주차 별로 복수의 회귀 모델을 추출하는 단계, 상기 각각의 주차 별로 추출된 복수의 회귀모델에 대하여 각각의 적합도를 연산하고, 각 주차 별 적합도가 가장 큰 값을 가지는 회귀모델을 주차별로 선정하는 단계, 상기 각 주차 별로 선정된 회귀모델을 예측오차 분석방법에 적용하여 평균 절대 오차 비율을 연산하고, 상기 평균 절대 오차 비율이 가장 작은 회귀모델을 최종 예측모델로 선정하는 단계, 그리고 최종 예측모델에 적용된 복수의 관심 검색어에 대한 검색량을 입력받아 상기 최종 예측 모델에 적용하여 최종 탄소 배출권 가격을 예측하는 단계를 포함한다.
상기 상관지수를 연산하는 단계는, 아래의 수학식을 통해 상기 상관지수를 연산할 수 있다.
Figure pat00001
여기서, i는 해당 검색어의 인덱스이고, t는 해당 주차,
Figure pat00002
는 해당 주차에서의 해당 검색어의 검색 빈도수,
Figure pat00003
는 해당 검색어 빈도수 데이터의 평균 값이고,
Figure pat00004
는 해당 주차로부터 k번째 주차에서의 탄소 배출권 가격 데이터이고,
Figure pat00005
는 탄소 배출권 가격 데이터의 평균이다.
상기 적합도는, 아래의 수학식을 통해 연산될 수 있다.
Figure pat00006
여기서, R은 상관계수이고, n은 상관지수가 기준 값 이상인 검색어의 개수이고, p는 상기 탄소 배출권과 관련된 검색어의 총 개수이다.
상기 상관계수(R)는, 아래의 수학식을 통해 연산될 수 있다.
Figure pat00007
여기서,
Figure pat00008
는 해당 주차에서의 상기 회귀 모형의 근사 값,
Figure pat00009
는 해당 주차에서의 상기 회귀 모형의 근사 값의 평균 값,
Figure pat00010
는 해당 주차에서의 탄소 배출권 가격이다.
상기 최종 탄소 배출권 가격을 예측하는 단계는, 상기 각 주차 별 선정된 회귀모형을 아래의 수학식에 적용하여 각 주차 별 평균 절대 오차 비율을 연산할 수 있다.
Figure pat00011
여기서, MAPE는 평균 절대 오차 비율이고,
Figure pat00012
는 해당 주차에서의 탄소 배출권 가격이고,
Figure pat00013
는 해당 주차에서의 회귀 모형의 근사값이다.
상기 복수의 관심 검색어는, 탄소배출권거래, 후성, 탄소배출권거래제, 이건산업, 탄소배출권가격, 홈데코, "productive", 비유 및 포크레인을 포함할 수 있다.
상기 최종 탄소 배출권 가격을 예측하는 단계는, 아래의 수학식을 통해 상기 최종 탄소 배출권 가격을 예측할 수 있다.
Figure pat00014
여기서,
Figure pat00015
는 해당 주차에서의 관심 검색어의 검색 빈도수이다.
본 발명의 다른 실시예에 따르면, 탄소 배출권 가격을 예측하기 위한 탄소 배출권 가격 예측 시스템에 있어서, 탄소 배출권과 관련된 복수의 검색어에 대한 주간 검색 빈도수 데이터를 추출하는 데이터 추출부, 상기 탄소 배출권의 주간 종가 데이터를 한국 거래소로부터 수집하는 데이터 수집부, 상기 주간 검색 빈도수 데이터와 상기 탄소 배출권의 주간 종가 데이터를 각각의 주차별로 저장하여 데이터베이스를 구축하는 데이터베이스부, 상기 데이터베이스에 저장된 각각의 상기 주간 검색 빈도수 데이터와 주간 종가 데이터를 교차상관 분석하여 각 주차 별로 상기 주간 검색 빈도수의 상관지수를 연산하는 연산부, 상기 연산된 상관지수가 기준 값보다 작은 경우, 해당 주차의 주간 검색 빈도수 데이터를 상기 데이터베이스에서 삭제하고, 주간 검색 빈도수 데이터와 주간 종가 데이터를 다중회귀 분석방법에 적용하여 상기 각 주차 별로 복수의 회귀 모델을 추출하는 회귀모델 추출부, 상기 각각의 주차 별로 추출된 복수의 회귀모델에 대하여 각각의 적합도를 연산하고, 각 주차 별 적합도가 가장 큰 값을 가지는 회귀모델을 주차별로 선정하는 회귀모델 선정부, 상기 각 주차 별로 선정된 회귀모델을 예측오차 분석방법에 적용하여 평균 절대 오차 비율을 연산하고, 상기 평균 절대 오차 비율이 가장 작은 회귀모델을 최종 예측모델로 선정하는 최종 예측모델 생성부, 그리고 최종 예측모델에 적용된 복수의 관심 검색어에 대한 검색량을 입력받아 상기 최종 예측 모델에 적용하여 최종 탄소 배출권 가격을 예측하는 가격 예측부를 포함한다.
이와 같이 본 발명에 따르면, 탄소배출권 관련 검색어에 따라 탄소배출권 가격을 예측할 수 있어 변화하는 탄소배출권 시장의 영향을 반영하여 건설 현장에서의 정확한 환경부담금을 고려한 예산을 산정할 수 있다.
도 1은 본 발명의 실시예에 따른 탄소 배출권 가격 예측 시스템의 구성을 설명하기 위한 구성도이다.
도 2는 본 발명의 실시예에 따른 탄소 배출권 가격 예측 방법을 설명하기 위한 순서도이다.
도 3은 도 2의 S230 단계를 설명하기 위한 도면이다.
도 4는 본 발명의 실시예에 따른 교차상관 분석 방법을 설명하기 위한 그래프이다.
도 5는 본 발명의 실시예에 따른 교차상관 분석 방법을 설명하기 위한 도면이다.
도 6은 도 2의 S270 단계를 설명하기 위한 도면이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시 예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
그러면 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다.
도 1은 본 발명의 실시예에 따른 탄소 배출권 가격 예측 시스템의 구성을 설명하기 위한 구성도이다.
도 1에서 나타낸 것처럼, 본 발명의 실시예에 따른 탄소 배출권 가격 예측 시스템(100)은 데이터 추출부(110), 데이터 수집부(120), 데이터베이스부(130), 연산부(140), 회귀모델 추출부(150), 회귀모델 선정부(160), 최종 예측모델 생성부(170) 및 가격 예측부(180)를 포함한다.
먼더, 데이터 추출부(110)는 탄소 배출권과 관련된 복수의 검색어에 대한 주간 검색 빈도수 데이터를 추출한다.
이때, 탄소 배출권과 관련된 복수의 검색어는 네이버 연관 검색어, 논문 키워드 또는 참고 논문을 바탕으로 선정된다.
다음으로, 데이터 수집부(120)는 탄소 배출권의 주간 종가 데이터를 한국 거래소로부터 수집한다.
다음으로, 데이터베이스부(130)는 데이터 추출부(110)와 데이터 수집부(120)로부터 수집된 주간 검색 빈도수 데이터와 탄소 배출권의 주간 종가 데이터를 각각의 주차별로 저장하여 데이터베이스화한다.
다음으로, 연산부(140)는 데이터베이스에 저장된 각각의 주간 검색 빈도수 데이터와 주간 종가 데이터를 교차상관 분석하여 각 주차 별로 주간 검색 빈도수의 상관지수를 연산한다.
다음으로, 회귀모델 추출부(150)는 연산된 상관지수가 기준 값보다 작은 경우, 해당 주차의 주간 검색 빈도수 데이터를 상기 데이터베이스에서 삭제하고, 주간 검색 빈도수 데이터와 주간 종가 데이터를 다중회귀 분석방법에 적용하여 각 주차 별로 복수개의 회귀 모델을 추출한다.
다음으로, 회귀모델 선정부(160)는 각각의 주차 별로 추출된 복수의 회귀모델에 대하여 각각의 적합도를 연산하고, 각 주차 별 적합도가 가장 큰 값을 가지는 회귀모델을 주차별로 선정한다.
다음으로, 최종 예측모델 생성부(170)는 각 주차 별로 선정된 회귀모델을 예측오차 분석방법에 적용하여 평균 절대 오차 비율을 연산하고, 평균 절대 오차 비율이 가장 작은 회귀모델을 최종 예측모델로 선정한다.
다음으로, 가격 예측부(180)는 최종 예측모델에 적용된 복수의 관심 검색어에 대한 검색량을 입력받아 최종 예측 모델에 적용하여 최종 탄소 배출권 가격을 예측하는 가격 예측부를 포함한다.
이하에서는 도 2 내지 도 6을 이용하여 본 발명의 실시예에 따른 탄소 배출권 가격 예측방법에 대하여 설명한다.
또한, 본 발명에서는 발명의 설명의 편의상 해당 주차로부터 4주차까지의 데이터를 이용하여 최종 예측모델을 선정하였다.
도 2는 본 발명의 실시예에 따른 탄소 배출권 가격 예측 방법을 설명하기 위한 순서도이다.
도 2에서 나타낸 것처럼, 데이터 추출부(110)는 탄소 배출권과 관련된 복수의 검색어에 대한 주간 검색 빈도수 데이터를 추출한다(S210).
이때, 본 발명에서는 탄소 배출권과 관련된 복수의 검색어를 "탄소배출권 거래", "후성", "탄소배출권 거래제", "이건산업", "탄소배출권 가격", "한솔홈데코", "유니슨", "홈데코", "휴켐스", "productive", "productively", "productivity", "비유", "포크레인 emissions", "CO2 배출량", "비교", "correlation", "globalwarming", "NOx", "PEMS", "durable", "furniture", "wakefulness"으로 설정하였으며, 탄소 배툴권과 관련된 검색어의 개수 또는 종류는 변경될 수 있다.
다음으로, 데이터 수집부(120)는 한국 거래소로부터 탄소 배출권의 주간 종가 데이터를 수집한다(S220).
여기서, 한국 거래소는 주식, 채권, KRX 및 탄소 배출권을 관리하는 국가기관으로, 본 발명에서는 탄소 배출권의 주간 종가 가격에 대한 데이터를 획득하기 위해 이용된다.
다음으로, 데이터베이스부(130)는 주간 검색 빈도수 데이터와 탄소 배출권의 주간 종가 데이터를 각각의 주차별로 저장하여 데이터베이스화한다(S230).
도 3은 도 2의 S230 단계를 설명하기 위한 도면이다.
즉, 도 3에서 나타낸 것과 같이, 데이터베이스부(130)는 해당 주차에 따른 주간 검색 빈도수 데이터와 탄소 배출권의 주간 종가 데이터를 함께 저장하여 데이터베이스화한다.
다음으로, 연산부(140)는 데이터베이스에 저장된 각각의 상기 주간 검색 빈도수 데이터와 주간 종가 데이터를 교차상관 분석하여 각 주차 별로 주간 검색 빈도수의 상관지수를 연산한다(S240).
도 4는 본 발명의 실시예에 따른 교차상관 분석 방법을 설명하기 위한 그래프이고, 도 5는 본 발명의 실시예에 따른 교차상관 분석 방법을 설명하기 위한 도면이다.
여기서, 도 4에서 나타낸 것처럼, 본 발명의 실시예에 따른 교차상관 분석 방법은 탄소 배출권 가격(붉은색 그래프)의 데이터는 유지한 상태에서 검색어 데이터(파란색 그래프)의 시점을 이동시켜 각각의 상관성을 분석하여 상관지수를 연산한다.
예를 들어, 도 5에서 나타낸 것처럼, 검색어가 수집된 시점 7월 16일, 배출권 시점 7월 20일로 같은 행인 상태를 기준으로 7월 23일-7월 27일(1주주차), 7월 30일-8월 3일(2주주차)와 같이 짝 지어진 데이터를 각각 상관분석을 진행하여, 각각의 검색어를 교차상관분석한다.
이때, 연산부(140)는 아래의 수학식 1을 통해 상관지수를 연산한다.
Figure pat00016
여기서, i는 해당 검색어의 인덱스이고, t는 해당 주차,
Figure pat00017
는 해당 주차에서의 해당 검색어의 검색 빈도수,
Figure pat00018
는 해당 검색어 빈도수 데이터의 평균 값이고,
Figure pat00019
는 해당 주차로부터 k번째 주차에서의 탄소 배출권 가격 데이터이고,
Figure pat00020
는 탄소 배출권 가격 데이터의 평균이다.
다음으로, 회귀모델 추출부(150)는 각 주차별로 복수의 검색어에 대한 주간 검색 빈도수의 상관지수 각각에 대하여 기준 값보다 작은지 여부를 판단한다(S250).
이때, 각 주차별로 복수의 검색어에 대한 주간 검색 빈도수의 상관지수가 기준 값 이상인 경우, 해당 주차에 대한 검색어는 데이터베이스에서 제거하지 않는다.
반면에, 각 주차별로 복수의 검색어에 대한 주간 검색 빈도수의 상관지수가 기준 값 보다 작으면, 회귀모델 추출부(150)는 해당 주차에 대한 검색어를 데이터베이스에서 삭제하고, 삭제가 완료된 데이터베이스의 주간 검색 빈도수 데이터와 주간 종가 데이터를 다중회귀 분석방법에 적용하여 각 주차별 복수개의 회귀 모델을 추출한다(S260).
이때, 다중회귀 분석방법은 복수개의 독립 변수들과 하나의 종속변수의 관계를 분석하는 방법으로, 본 발명의 실시예에서는 각 주차별 복수개의 회귀 모델을 추출하기 위해 사용된다.
다음으로, 회귀모델 선정부(160)는 각각의 주차별로 추출된 복수의 회귀모델에 대하여 각각의 적합도를 연산하고, 각 주차별 적합도가 가장 큰 값을 가지는 회귀 모델을 각 주차별로 선정한다(S270).
이때, 적합도는 아래의 수학식 2을 통해 연산된다.
Figure pat00021
여기서, R은 상관계수이고, n은 상관지수가 기준 값 이상인 검색어의 개수이고, p는 상기 탄소 배출권과 관련된 검색어의 총 개수이다.
그리고, 상관계수(R)은 아래의 수학식 3을 통해 연산된다.
Figure pat00022
여기서,
Figure pat00023
는 해당 주차에서의 상기 회귀 모형의 근사 값,
Figure pat00024
는 해당 주차에서의 상기 회귀 모형의 근사 값의 평균 값,
Figure pat00025
는 해당 주차에서의 탄소 배출권 가격이다.
도 6은 도 2의 S270 단계를 설명하기 위한 도면이다.
도 6에서 나타낸 것처럼, 1주차를 case 1로, 2주차를 case 2로, 3주차를 case 3으로, 4주차를 case 4로 나타내었다.
또한, NULL은 해당 주차에 상관계수 기준 미달으로 제외된 것을 의미한다.
즉, 도 6에서 나타낸 것처럼, 각각의 주차별 적합도가 가장 큰 값을 가지는 회귀모형을 선정한다.
다음으로, 최종 예측모델 생성부(170)는 각 주차 별로 선정된 회귀모델을 예측오차 분석방법에 적용하여 평균 절대 오차 비율을 연산하고, 평균 절대 오차 비율이 가장 작은 회귀모델을 최종 예측모델로 선정한다(S280).
즉, 최종 예측모델 생성부(170)는 각 주차 별 선정된 회귀모형을 아래의 수학식 4에 적용하여 각 주차 별 평균 절대 오차 비율을 연산한다.
Figure pat00026
여기서, MAPE는 평균 절대 오차 비율이고,
Figure pat00027
는 해당 주차에서의 탄소 배출권 가격이고,
Figure pat00028
는 해당 주차에서의 회귀 모형의 근사값이다.
이때, 도 6에서 선정된 각 주차별 회귀모델을 수학식 4를 통해 각각의 MAPE를 연산한다.
그러면, 아래의 표 1과 같이 각 주차별 MAPE 값이 연산된다.
Figure pat00029
표 1에서 나타낸 것과 같이, 최종 예측모델 생성부(170)는 MAPE가 가장 적은 4주차의 회귀모델을 최종 예측모델로 선정한다.
그러면, 최종 예측모델 생성부(170)는 아래의 수학식 5와 같은 회귀모델을 최종 예측모델로 선정한다.
Figure pat00030
여기서,
Figure pat00031
는 해당 주차에서의 관심 검색어의 검색 빈도수이다.
이때, 관심 검색어는 "탄소배출권거래", "후성", "탄소배출권거래제", "이건산업", "탄소배출권가격", "홈데코", "productive", "비유" 및 "포크레인"을 포함한다.
즉, 관심 검색어는 최종 예측모델로 선정된 회귀모델에서 이용되는 검색어를 의미한다.
이때, 관심 검색어는 최종 예측모델로 선정된 회귀모델에 따라 서로 다른 검색어일 수 있다.
다음으로, 가격 예측부(180)는 최종 예측모델에 적용된 복수의 관심 검색어에 대한 검색량을 입력받아 최종 예측 모델에 적용하여 최종 탄소 배출권 가격을 예측한다(S280).
즉, 가격 예측부(180)는 데이터 추출부(110)로부터 최종 예측모델에 적용된 관심 검색어에 대한 검색량을 입력받아 수학식 5에 적용하여 최종 탄소 배출권 가격을 예측한다.
이와 같이 본 발명의 실시예에 따르면, 탄소배출권 관련 검색어에 따라 탄소배출권 가격을 예측할 수 있어 변화하는 탄소배출권 시장의 영향을 반영하여 건설 현장에서의 정확한 환경부담금을 고려한 예산을 산정할 수 있다.
본 발명은 도면에 도시된 실시 예를 참고로 설명되었으나 이는 예시적인 것이 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 다른 실시 예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의하여 정해져야 할 것이다.
100: 탄소 배출권 가격 예측 시스템,
110: 데이터 추출부, 120: 데이터 수집부,
130: 데이터베이스부, 140: 연산부,
150: 회귀모델 추출부, 160: 회귀모델 선정부,
170: 최종 예측모델 생성부, 180: 가격 예측부

Claims (14)

  1. 탄소 배출권 가격 예측 시스템을 이용한 탄소 배출권 가격 예측 방법에 있어서,
    탄소 배출권과 관련된 복수의 검색어에 대한 주간 검색 빈도수 데이터를 추출하는 단계,
    상기 탄소 배출권의 주간 종가 데이터를 한국 거래소로부터 수집하는 단계,
    상기 주간 검색 빈도수 데이터와 상기 탄소 배출권의 주간 종가 데이터를 각각의 주차별로 저장하여 데이터베이스를 구축하는 단계,
    상기 데이터베이스에 저장된 각각의 상기 주간 검색 빈도수 데이터와 주간 종가 데이터를 교차상관 분석하여 각 주차 별로 상기 주간 검색 빈도수의 상관지수를 연산하는 단계,
    상기 연산된 상관지수가 기준 값보다 작은 경우, 해당 주차의 주간 검색 빈도수 데이터를 상기 데이터베이스에서 삭제하고, 주간 검색 빈도수 데이터와 주간 종가 데이터를 다중회귀 분석방법에 적용하여 상기 각 주차 별로 복수의 회귀 모델을 추출하는 단계,
    상기 각각의 주차 별로 추출된 복수의 회귀모델에 대하여 각각의 적합도를 연산하고, 각 주차 별 적합도가 가장 큰 값을 가지는 회귀모델을 주차별로 선정하는 단계,
    상기 각 주차 별로 선정된 회귀모델을 예측오차 분석방법에 적용하여 평균 절대 오차 비율을 연산하고, 상기 평균 절대 오차 비율이 가장 작은 회귀모델을 최종 예측모델로 선정하는 단계, 그리고
    최종 예측모델에 적용된 복수의 관심 검색어에 대한 검색량을 입력받아 상기 최종 예측 모델에 적용하여 최종 탄소 배출권 가격을 예측하는 단계를 포함하는 탄소 배출권 가격 예측 방법.
  2. 제1항에 있어서,
    상기 상관지수를 연산하는 단계는,
    아래의 수학식을 통해 상기 상관지수를 연산하는 탄소 배출권 가격 예측 방법;
    Figure pat00032

    여기서, i는 해당 검색어의 인덱스이고, t는 해당 주차,
    Figure pat00033
    는 해당 주차에서의 해당 검색어의 검색 빈도수,
    Figure pat00034
    는 해당 검색어 빈도수 데이터의 평균 값이고,
    Figure pat00035
    는 해당 주차로부터 k번째 주차에서의 탄소 배출권 가격 데이터이고,
    Figure pat00036
    는 탄소 배출권 가격 데이터의 평균이다.
  3. 제1항에 있어서,
    상기 적합도는,
    아래의 수학식을 통해 연산되는 탄소 배출권 가격 예측 방법;
    Figure pat00037

    여기서, R은 상관계수이고, n은 상관지수가 기준 값 이상인 검색어의 개수이고, p는 상기 탄소 배출권과 관련된 검색어의 총 개수이다.
  4. 제3항에 있어서,
    상기 상관계수(R)는,
    아래의 수학식을 통해 연산되는 탄소 배출권 가격 예측 방법;
    Figure pat00038

    여기서,
    Figure pat00039
    는 해당 주차에서의 상기 회귀 모형의 근사 값,
    Figure pat00040
    는 해당 주차에서의 상기 회귀 모형의 근사 값의 평균 값,
    Figure pat00041
    는 해당 주차에서의 탄소 배출권 가격이다.
  5. 제1항에 있어서,
    상기 최종 탄소 배출권 가격을 예측하는 단계는,
    상기 각 주차 별 선정된 회귀모형을 아래의 수학식에 적용하여 각 주차 별 평균 절대 오차 비율을 연산하는 탄소 배출권 가격 예측 방법;
    Figure pat00042

    여기서, MAPE는 평균 절대 오차 비율이고,
    Figure pat00043
    는 해당 주차에서의 탄소 배출권 가격이고,
    Figure pat00044
    는 해당 주차에서의 회귀 모형의 근사값이다.
  6. 제1항에 있어서,
    상기 복수의 관심 검색어는,
    탄소배출권거래, 후성, 탄소배출권거래제, 이건산업, 탄소배출권가격, 홈데코, productive, 비유 및 포크레인을 포함하는 탄소 배출권 가격 예측 방법.
  7. 제6항에 있어서,
    상기 최종 탄소 배출권 가격을 예측하는 단계는,
    아래의 수학식을 통해 상기 최종 탄소 배출권 가격을 예측하는 탄소 배출권 가격 예측 방법:
    Figure pat00045

    여기서,
    Figure pat00046
    는 해당 주차에서의 관심 검색어의 검색 빈도수이다.
  8. 탄소 배출권 가격을 예측하기 위한 탄소 배출권 가격 예측 시스템에 있어서,
    탄소 배출권과 관련된 복수의 검색어에 대한 주간 검색 빈도수 데이터를 추출하는 데이터 추출부,
    상기 탄소 배출권의 주간 종가 데이터를 한국 거래소로부터 수집하는 데이터 수집부,
    상기 주간 검색 빈도수 데이터와 상기 탄소 배출권의 주간 종가 데이터를 각각의 주차별로 저장하여 데이터베이스를 구축하는 데이터베이스부,
    상기 데이터베이스에 저장된 각각의 상기 주간 검색 빈도수 데이터와 주간 종가 데이터를 교차상관 분석하여 각 주차 별로 상기 주간 검색 빈도수의 상관지수를 연산하는 연산부,
    상기 연산된 상관지수가 기준 값보다 작은 경우, 해당 주차의 주간 검색 빈도수 데이터를 상기 데이터베이스에서 삭제하고, 주간 검색 빈도수 데이터와 주간 종가 데이터를 다중회귀 분석방법에 적용하여 상기 각 주차 별로 복수의 회귀 모델을 추출하는 회귀모델 추출부,
    상기 각각의 주차 별로 추출된 복수의 회귀모델에 대하여 각각의 적합도를 연산하고, 각 주차 별 적합도가 가장 큰 값을 가지는 회귀모델을 주차별로 선정하는 회귀모델 선정부,
    상기 각 주차 별로 선정된 회귀모델을 예측오차 분석방법에 적용하여 평균 절대 오차 비율을 연산하고, 상기 평균 절대 오차 비율이 가장 작은 회귀모델을 최종 예측모델로 선정하는 최종 예측모델 생성부, 그리고
    최종 예측모델에 적용된 복수의 관심 검색어에 대한 검색량을 입력받아 상기 최종 예측 모델에 적용하여 최종 탄소 배출권 가격을 예측하는 가격 예측부를 포함하는 탄소 배출권 가격 예측 시스템.
  9. 제8항에 있어서,
    상기 연산부는,
    아래의 수학식을 통해 상기 상관지수를 연산하는 탄소 배출권 가격 예측 시스템;
    Figure pat00047

    여기서, i는 해당 검색어의 인덱스이고, t는 해당 주차,
    Figure pat00048
    는 해당 주차에서의 해당 검색어의 검색 빈도수,
    Figure pat00049
    는 해당 검색어 빈도수 데이터의 평균 값이고,
    Figure pat00050
    는 해당 주차로부터 k번째 주차에서의 탄소 배출권 가격 데이터이고,
    Figure pat00051
    는 탄소 배출권 가격 데이터의 평균이다.
  10. 제8항에 있어서,
    상기 적합도는,
    아래의 수학식을 통해 연산되는 탄소 배출권 가격 예측 시스템;
    Figure pat00052

    여기서, R은 상관계수이고, n은 상관지수가 기준 값 이상인 검색어의 개수이고, p는 상기 탄소 배출권과 관련된 검색어의 총 개수이다.
  11. 제10항에 있어서,
    상기 상관계수(R)는,
    아래의 수학식을 통해 연산되는 탄소 배출권 가격 예측 시스템;
    Figure pat00053

    여기서,
    Figure pat00054
    는 해당 주차에서의 상기 회귀 모형의 근사 값,
    Figure pat00055
    는 해당 주차에서의 상기 회귀 모형의 근사 값의 평균 값,
    Figure pat00056
    는 해당 주차에서의 탄소 배출권 가격이다.
  12. 제8항에 있어서,
    상기 가격 예측부는,
    상기 각 주차 별 선정된 회귀모형을 아래의 수학식에 적용하여 각 주차 별 평균 절대 오차 비율을 연산하는 탄소 배출권 가격 예측 시스템;
    Figure pat00057

    여기서, MAPE는 평균 절대 오차 비율이고,
    Figure pat00058
    는 해당 주차에서의 탄소 배출권 가격이고,
    Figure pat00059
    는 해당 주차에서의 회귀 모형의 근사값이다.
  13. 제8항에 있어서,
    상기 복수의 관심 검색어는,
    탄소배출권거래, 후성, 탄소배출권거래제, 이건산업, 탄소배출권가격, 홈데코, productive, 비유 및 포크레인을 포함하는 탄소 배출권 가격 예측 시스템.
  14. 제13항에 있어서,
    상기 가격 예측부는,
    아래의 수학식을 통해 상기 최종 탄소 배출권 가격을 예측하는 탄소 배출권 가격 예측 시스템:
    Figure pat00060

    여기서,
    Figure pat00061
    는 해당 주차에서의 관심 검색어의 검색 빈도수이다.
KR1020200142026A 2020-10-29 2020-10-29 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그것에 의해 수행되는 탄소 배출권 가격 예측 방법 KR102425013B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200142026A KR102425013B1 (ko) 2020-10-29 2020-10-29 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그것에 의해 수행되는 탄소 배출권 가격 예측 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200142026A KR102425013B1 (ko) 2020-10-29 2020-10-29 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그것에 의해 수행되는 탄소 배출권 가격 예측 방법

Publications (2)

Publication Number Publication Date
KR20220057121A true KR20220057121A (ko) 2022-05-09
KR102425013B1 KR102425013B1 (ko) 2022-07-25

Family

ID=81582777

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200142026A KR102425013B1 (ko) 2020-10-29 2020-10-29 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그것에 의해 수행되는 탄소 배출권 가격 예측 방법

Country Status (1)

Country Link
KR (1) KR102425013B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116307298A (zh) * 2023-05-23 2023-06-23 中国石油大学(华东) 一种基于多源异构张量数据的组合碳排放预测模型

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120097460A (ko) * 2009-05-08 2012-09-04 액센츄어 글로벌 서비시즈 리미티드 건물 에너지 소비 분석 시스템
KR101725013B1 (ko) * 2016-07-26 2017-04-18 인하대학교 산학협력단 회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법
KR20200064195A (ko) * 2018-11-23 2020-06-08 주식회사 씨씨미디어서비스 탄소세 예측 시스템
KR20200079909A (ko) * 2018-12-26 2020-07-06 인하대학교 산학협력단 건설장비의 이산화탄소 배출량에 따른 탄소 배출 처리 비용 산정 장치 및 그 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120097460A (ko) * 2009-05-08 2012-09-04 액센츄어 글로벌 서비시즈 리미티드 건물 에너지 소비 분석 시스템
KR101725013B1 (ko) * 2016-07-26 2017-04-18 인하대학교 산학협력단 회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법
KR20200064195A (ko) * 2018-11-23 2020-06-08 주식회사 씨씨미디어서비스 탄소세 예측 시스템
KR20200079909A (ko) * 2018-12-26 2020-07-06 인하대학교 산학협력단 건설장비의 이산화탄소 배출량에 따른 탄소 배출 처리 비용 산정 장치 및 그 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116307298A (zh) * 2023-05-23 2023-06-23 中国石油大学(华东) 一种基于多源异构张量数据的组合碳排放预测模型
CN116307298B (zh) * 2023-05-23 2023-08-18 中国石油大学(华东) 一种基于多源异构张量数据的组合碳排放预测方法

Also Published As

Publication number Publication date
KR102425013B1 (ko) 2022-07-25

Similar Documents

Publication Publication Date Title
CN105574025B (zh) 用于计算排序分及建立模型的方法、装置及商品推荐系统
CN110059100A (zh) 基于演员-评论家网络的sql语句构造方法
CN105550393B (zh) 一种支持方案快速生成的枪械变型设计方法
US11443204B2 (en) Computer system and method of presenting information on basis of prediction result for input data
CN110428015A (zh) 一种模型的训练方法及相关设备
CN105069077A (zh) 搜索方法及装置
Kornyshova et al. Method chunks selection by multicriteria techniques: an extension of the assembly-based approach
US20070233532A1 (en) Business process analysis apparatus
CN108664237B (zh) 一种基于启发式和神经网络的非api成员推荐方法
Senin et al. Concurrent assembly planning with genetic algorithms
KR102425013B1 (ko) 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그것에 의해 수행되는 탄소 배출권 가격 예측 방법
KR20190004605A (ko) 에너지 시뮬레이션 모델 생성 장치 및 방법
KR970004105B1 (ko) 계량 경제 모델 시뮬레이션 시스템
CN116166886A (zh) 向量指数平滑新分类法在季节时间序列预测中的应用系统
CN115953215A (zh) 一种基于时间和图结构的搜索式推荐方法
CN110135944A (zh) 贷款产品推荐方法、装置、计算机设备和存储介质
CN109583763A (zh) 分行业用户电力负荷增长特征挖掘算法
CN112488421B (zh) 一种电费应收账款的跟踪预测方法及装置
KR102550687B1 (ko) 검색량 데이터와 var 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그 방법
Muralidhar et al. HUPM-MUO: high utility pattern mining under multiple utility objectives
Berns et al. Large-scale Retrieval of Bayesian Machine Learning Models for Time Series Data via Gaussian Processes.
JP7502963B2 (ja) 情報処理システムおよび情報処理方法
CN111898666A (zh) 一种随机森林算法结合模群种群的数据变量选择方法
CN113408735A (zh) 用于模型优化的方法、装置以及存储介质
CN112380215B (zh) 一种基于交叉聚合的自动特征生成方法

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant