KR102599136B1 - 트랜스포머 모델을 이용한 농산물 가격예측 방법 및 시스템 - Google Patents

트랜스포머 모델을 이용한 농산물 가격예측 방법 및 시스템 Download PDF

Info

Publication number
KR102599136B1
KR102599136B1 KR1020230000951A KR20230000951A KR102599136B1 KR 102599136 B1 KR102599136 B1 KR 102599136B1 KR 1020230000951 A KR1020230000951 A KR 1020230000951A KR 20230000951 A KR20230000951 A KR 20230000951A KR 102599136 B1 KR102599136 B1 KR 102599136B1
Authority
KR
South Korea
Prior art keywords
data
price
model
agricultural product
equation
Prior art date
Application number
KR1020230000951A
Other languages
English (en)
Inventor
손효상
이해주
Original Assignee
손효상
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 손효상 filed Critical 손효상
Priority to KR1020230000951A priority Critical patent/KR102599136B1/ko
Application granted granted Critical
Publication of KR102599136B1 publication Critical patent/KR102599136B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0475Generative networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/096Transfer learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/098Distributed learning, e.g. federated learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Animal Husbandry (AREA)
  • Agronomy & Crop Science (AREA)
  • Mining & Mineral Resources (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Measurement Of Resistance Or Impedance (AREA)

Abstract

트랜스포머 모델을 이용한 농산물 가격 예측 방법 및 시스템이 개시된다. 본 발명의 일실시예에 따른 농산물 예측 방법은, (a) 가격 예측의 대상이 되는 농산물에 대한 정형데이터 및 비정형데이터를 수집하는 단계; (b) 상기 정형데이터 및 상기 비정형데이터를 이용하여 농산물 가격예측 모델에 사용될 학습데이터 및 평가데이터를 생성하는 단계; (c) 상기 학습데이터 및 상기 평가데이터를 이용하여 트랜스포머(Transformer) 모델 기반의 상기 농산물 가격예측 모델을 생성하는 단계; 및(d) 상기 농산물 가격예측 모델을 이용하여 특정 농산물의 장래의 가격을 예측하는 단계를 포함하고, 상기 정형 데이터는 농산물의 일별 가격, 온도, 습도 및 날씨 정보를 포함하고, 상기 비정형 데이터는 농산물의 쇼핑몰의 리뷰글을 포함하는 리뷰데이터와, 농작물명으로 검색되는 블로그글 및 뉴스기사글을 포함하는 키워드데이터를 포함하고, 상기 (c) 단계에서, 상기 농산물 가격예측 모델은, 상기 리뷰데이터를 처리하여 리뷰벡터를 출력하는 제1 코버트(KoBERT) 모델; 상기 키워드데이터를 처리하여 키워드벡터를 출력하는 제2 코버트(KoBERT) 모델; 및 상기 리뷰벡터, 상기 키워드벡터 및 상기 정형데이터를 입력데이터로 하여 미리 설정된 K일 간의 농산물 가격예측 결과를 산출하는 GPT(Generative Pre-trained Transformer) 모델을 포함하여 구성된다.

Description

트랜스포머 모델을 이용한 농산물 가격예측 방법 및 시스템{METHOD AND SYSTEM FOR PREDICTING PRICE OF AGRICULTRUAL PRODUCT BASED ON TRANSFORMER MODEL}
본 발명은 농산물 가격예측 방법 및 시스템에 관한 것으로, 더 상세하게는 개선된 트랜스포머 모델을 이용하여 정형데이터와 비정형데이터를 종합적으로 고려하여 보다 정확하게 농산물 가격을 예측할 수 있는 농산물 가격 예측 방법 및 시스템에 관한 것이다.
새로운 품종의 농산물의 경우 각 지역자치단체의 농업기술센터에서 새롭게 종자를 개발하여 대중화를 위한 작물 시험 재배를 마쳐서 출시하거나 아시아 및 유럽 등지에서 유명한 종자를 국내에 도입하여 농가에서 새롭게 작물을 길러서 시장에 판매하게 된다. 이러한 식 작물의 경우 기존 농산물 유통 과정에서 취급하지 않는 상품이어서 시장 판매 가격이 형성되어 있지 않다.
현재 농산물 가격은 전국 공영도매시장에서 매일 낙찰되는 경매가격을 중심으로 도매가를 확인할 수 있을 뿐이며, 이 또한 대중적인 작물에 한하여 경매가격의 확인이 가능하다. 즉, 새로운 품종의 농산물에 대하여는 도매 가격이 형성되어 있지 않아 새로운 품종의 농산물을 재배하여 판매하려는 농가는 근거가 되는 가격 정보가 없어 임의로 가격을 설명하여 판매하게 되는 문제점이 있었다.
또한, 도매가 등 일부의 근거가 되는 자료가 있다고 하더라도 자료가 충분하지 않는 경우가 많으므로 여러가지 정보를 종합적으로 반영하여 신뢰성 있는 농산물 가격의 예측 기술이 필요한 실정이다.
한국등록특허 제10-2137583호 한국등록특허 제10-1764147호
본 발명은 위와 같은 문제를 해결하기 위한 것으로, 트랜스포머 모델을 활용한 개선된 농산물 가격예측 모델을 이용하여 도소매가, 리뷰데이터 및 키워드데이터를 종합적으로 분석하여 보다 정확한 농산물 가격을 예측할 수 있는 트랜스포머 모델을 이용한 농산물 가격 예측 방법 및 시스템을 제공하는 것을 목적으로 한다.
본 발명의 과제들은 이상에서 언급한 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기 과제를 해결하기 위한 본 발명의 일실시예에 따른 농산물 가격 예측 서버를 이용한 농산물 가격 예측 방법은, (a) 가격 예측의 대상이 되는 농산물에 대한 정형데이터 및 비정형데이터를 수집하는 단계; (b) 상기 정형데이터 및 상기 비정형데이터를 이용하여 농산물 가격예측 모델에 사용될 학습데이터 및 평가데이터를 생성하는 단계; (c) 상기 학습데이터 및 상기 평가데이터를 이용하여 트랜스포머(Transformer) 모델 기반의 상기 농산물 가격예측 모델을 생성하는 단계; 및 (d) 상기 농산물 가격예측 모델을 이용하여 특정 농산물의 장래의 가격을 예측하는 단계를 포함하고, 상기 정형 데이터는 농산물의 일별 가격, 온도, 습도 및 날씨 정보를 포함하고, 상기 비정형 데이터는 농산물의 쇼핑몰의 리뷰글을 포함하는 리뷰데이터와, 농작물명으로 검색되는 블로그글 및 뉴스기사글을 포함하는 키워드데이터를 포함하고, 상기 (c) 단계에서, 상기 농산물 가격예측 모델은, 상기 리뷰데이터를 처리하여 리뷰벡터를 출력하는 제1 코버트(KoBERT) 모델; 상기 키워드데이터를 처리하여 키워드벡터를 출력하는 제2 코버트(KoBERT) 모델; 및 상기 리뷰벡터, 상기 키워드벡터 및 상기 정형데이터를 입력데이터로 하여 미리 설정된 K일 간의 농산물 가격예측 결과를 산출하는 GPT(Generative Pre-trained Transformer) 모델을 포함하여 구성된다.
또한, 본 발명의 일실시예에 따른 농산물 가격 예측 시스템은, 가격 예측의 대상이 되는 농산물에 대한 정형데이터 및 비정형데이터를 수집하는 데이터 수집부; 상기 정형데이터 및 상기 비정형데이터를 이용하여 농산물 가격예측 모델에 사용될 학습데이터 및 평가데이터를 생성하는 데이터 처리부; 및 상기 학습데이터 및 상기 평가데이터를 이용하여 트랜스포머(Transformer) 모델 기반으로 상기 농산물 가격예측 모델을 생성하고 이를 기반으로 농산물의 장래의 가격을 예측하는 가격 예측부를 포함하고, 상기 정형 데이터는 농산물의 일별 가격, 온도, 습도 및 날씨 정보를 포함하고, 상기 비정형 데이터는 농산물의 쇼핑몰의 리뷰글을 포함하는 리뷰데이터와, 농작물명으로 검색되는 블로그글 및 뉴스기사글을 포함하는 키워드데이터를 포함하고, 상기 농산물 가격예측 모델은, 상기 리뷰데이터를 처리하여 리뷰벡터를 출력하는 제1 코버트(KoBERT) 모델; 상기 키워드데이터를 처리하여 키워드벡터를 출력하는 제2 코버트(KoBERT) 모델; 및 상기 리뷰벡터, 상기 키워드벡터 및 상기 정형데이터를 입력데이터로 하여 미리 설정된 K일 간의 농산물 가격예측 결과를 산출하는 GPT(Generative Pre-trained Transformer) 모델을 포함하여 구성된다.
상기 본 발명의 일실시예에 따른 농산물 가격 예측 방법 및 시스템은 다음의 추가 구성 또는 한정사항을 포함할 수 있다.
일실시예에서 상기 GPT 모델은 GPT-2 모델이고, 과거 T 일간의 상기 정형데이터 및 상기 비정형 데이터를 기반으로 한 장래 K일 간의 농산물의 가격 Y는 아래의 수학식들에 의하여 결정될 수 있다.
[수학식 1]
[수학식 2]
[수학식 3]
[수학식 4]
(이때, ‘price’는 도매가 또는 소매가, ‘temperature’는 온도, ‘humidity’는 습도, ‘weather’는 날씨를 수치화한 값(맑음: 0, 흐림: 1, 비옴: 2), ‘keyword_blog’는 블로그글, ‘keyword_news’는 뉴스기사글을 의미함)
일실시예에서 상기 GPT-2 모델에 입력되는 상기 정형데이터 는 하기 [수학식 2a]와 같이 가격추세변수(price_trend)를 더 포함하여 정의되고, 상기 가격추세변수는 농산물의 일별 가격 정보를 HP(Hodrick-Prescott) 필터에 입력하여 계산된 장기적 추세성분일 수 있다.
[수학식 2a]
일실시예에서 농산물의 가격 정보가 하기 [수학식 5]로 정의될 때, 상기 장기적 추세성분()은 [수학식 6]을 만족시키는 값으로 결정될 수 있다.
[수학식 5]
[수학식 6]
(이때, ‘’는 농산물의 일별 가격, ‘’는 장기적 추세성분, ‘’는 단기적 순환성분을 의미하며, ‘’는 미리 설정된 상수임)
일실시예에서 상기 GPT-2 모델에 입력되는 상기 정형데이터 는 하기 [수학식 2b]와 같이 농산물의 가격과의 스피어만 상관계수로 보정된 온도 및 습도의 값을 포함하도록 정의될 수 있다.
[수학식 2b]
[수학식 7]
[수학식 8]
(이때, ‘’는 t 일의 온도, ‘’는 T 일간의 평균온도,‘’는 t 일의 습도, ‘’는 T 일간의 평균습도, ‘’는 농산물 가격과 온도와의 스피어만 상관계수, ‘’는 농산물 가격과 습도와의 스피어만 상관계수를 의미함)
본 발명은 트랜스포머 모델을 활용한 개선된 농산물 가격예측 모델을 이용하여 도소매가, 리뷰데이터 및 키워드데이터를 종합적으로 분석하여 보다 정확한 농산물 가격 예측이 가능하도록 할 수 있다.
본 발명에 따른 효과는 이상에서 예시된 내용에 의해 제한되지 않으며, 더욱 다양한 효과들이 본 명세서 내에 포함되어 있다.
도 1은 본 발명의 일실시예에 따른 농산물 가격예측 서버가 적용된 네트워크를 나타내는 도면이다.
도 2는 본 발명의 일실시예에 따른 농산물 가격예측 서버의 개략 구성도이다.
도 3은 본 발명의 일실시예에 따른 농산물 가격예측 서버를 이용한 농산물 가격예측 방법을 설명하는 개략 순서도이다.
도 4는 본 발명의 일실시예 따른 농산물 가격예측 서버의 가격 예측부의 데이터 처리과정을 설명하는 개념도이다.
도 5는 도 4의 가격 예측부의 제1 코버트 모델 및 제2 코버트 모델에 입력되는 리뷰데이터 및 키워드데이터의 구조를 나타내는 개념도이다.
도 6은 본 발명의 일실시예에 따른 농산물 가격예측 서버를 이용한 농산물 가격 예측 결과의 예시 그래프이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
이하, 도면을 참조하여 본 발명의 실시예에 대하여 상세히 설명한다.
도 1은 본 발명의 일실시예에 따른 농산물 가격예측 서버가 적용된 네트워크를 나타내는 도면이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 농산물 가격예측 서버(100)는 네트워크를 통하여 사용자 단말기(200), 농산물 도매가 제공 서버(300) 및 쇼핑몰 서버(400)와 연결된다.
농산물 가격예측 서버(100)는 네트워크 상에 위치하여 개선된 트랜스포머 기반의 농산물 가격예측 모델을 포함하는 서버 컴퓨터 등의 단말기를 의미한다.
도 1에서 농산물 가격예측 서버(100)는 하나의 구성으로 된 것이 도시되어 있지만 이는 농산물 가격예측 서버(100)가 물리적으로 하나의 컴퓨터로 이루어진 것으로 한정하는 것을 의미하지 않는다.
즉, 농산물 가격예측 서버(100)는 물리적 또는 소프트웨어적으로 분리된 다수의 서버 컴퓨터 또는 모듈로 구성될 수 있음은 자명하다. 따라서, 농산물 가격예측 서버(100)는 도 2에서와 같이 복수의 구성을 포함하여 구성되고 이에 따라 복수의 구성을 포함하는 농산물 가격예측 시스템으로도 불릴 수 있다.
따라서 본 발명은 농산물 가격예측 서버 또는 농산물 가격예측 시스템 모두를 포괄하는 개념이나 이하 도면을 기준으로 농산물 가격예측 서버(100)를 중심으로 설명한다.
사용자 단말기(200)는 네트워크를 통하여 농산물 가격예측 서버(100)와 연결되는 사용자가 사용하는 컴퓨터, 노트북, 스마트폰 등의 단말기를 의미한다.
구체적으로, 농산물 가격예측 서버(100)는 복수의 사용자 단말기(210, 220, 230)에 농산물 가격 예측 정보 제공을 위한 웹사이트 또는 애플리케이션을 제공할 수 있다.
이때, 사용자는 농산물을 재배하여 도매 가격으로 판매하려는 재배자나 농산물을 재배자로부터 도매가로 구입하여 소매 가격으로 판매하려는 판매자 등이 될 수 있다.
농산물 도매가 제공 서버(300)는 공영도매시장에서 제공하는 도매가 정보를 제공하는 서버 등과 같이 농산물의 가격 정보를 제공하는 공공기관이나 기업 등이 운영하는 서버를 의미한다.
쇼핑몰 서버(400)는 농산물을 판매하는 쇼핑몰이 운영하는 서버를 의미한다.
도 1에는 농산물 도매가 제공 서버(300) 및 쇼핑몰 서버(400)만 도시되어 있지만 농산물 가격예측 서버(100)는 인터넷상의 정보를 수집하기 위하여 네이버나 구글과 같은 포털 업체의 서버에 접속할 수 있으며, 편의상 이러한 다양한 인터넷상의 서버는 편의상 도시를 생략하였다.
도 2는 본 발명의 일실시예에 따른 농산물 가격예측 서버의 개략 구성도이다.
도 2를 참조하면 본 발명의 농산물 가격예측 서버(100)는 데이터 수집부(120), 데이터 처리부(140), 가격 예측부(160) 및 데이터 저장부(180)를 포함하여 구성된다.
데이터 수집부(120)는 가격 예측의 대상이 되는 농산물에 대한 정형데이터 및 비정형데이터를 수집하는 역할을 한다.
정형데이터는 가격 정보와 같이 숫자로 이루어진 데이터를 의미하며, 비정형데이터는 블로그, 기사글, 쇼핑몰 리뷰 등과 같이 글로 이루어진 데이터를 의미한다.
예를 들어, 데이터 수집부(120)는 농산물 도매가 제공 서버(300), 쇼핑몰 서버(400) 및 포털 서버 등으로부터 가격예측의 대상이 되는 농산물의 과거 즉 현재로부터 T 일간의 과거의 도매가, 소매가, 블로그, 기사글, 쇼핑몰 리뷰 등의 데이터를 크롤링(crawling)하는 방식으로 데이터를 수집할 수 있다.
데이터 처리부(140)는 데이터 수집부(120)가 수집한 정형데이터 및 비정형데이터를 이용하여 농산물 가격예측 모델에 사용될 학습데이터 및 평가데이터를 생성하는 역할을 한다.
데이터 처리부(140)는 특히 텍스트로 이루어지는 비정형데이터 중에서 미리 설정된 농산물과 관련되고 특히 가격정보와 연관되는 부분을 미리 준비된 알고리즘에 의하여 추출할 수 있도록 구성될 수 있다.
가격 예측부(160)는 데이터 처리부(140)에서 생성된 학습데이터 및 평가데이터를 이용하여 트랜스포머(Transformer) 모델 기반으로 농산물 가격예측 모델을 생성하고, 이를 기반으로 농산물의 장래의 가격을 예측하는 역할을 한다.
가격 예측부(160)는 제1 코버트 모델(162), 제2 코버트 모델(164) 및 GPT-2 모델(166)을 포함하여 구성되고 이는 본 발명의 특징적인 농산물 가격예측 모델을 형성한다.
트랜스포머(Transformer) 모델은 구글이 2017년에 발표한 모델로, 기존의 순차적 데이터 학습 모델들의 구조인 인코더-디코더(encoder-decoder) 구조를 따르면서도, 어텐션(Attention) 메커니즘만을 이용해 구현했다는 특징이 있다.
이는 기존의 순차적인 데이터 학습 모델인 RNN(Recurrent Neural Network)의 단점으로 꼽히던 긴 길이의 순차적 데이터 처리의 어려움을 해결하고, 입력데이터 처리의 병렬화를 가능케 하여 더 빠른 모델학습을 가능하게 한다. 또한, 입력데이터들간의 관계를 직접적으로 계산함으로써 입력데이터 안의 추세 및 문맥을 더 정확히 파악할 수 있다는 장점이 있다.
제1 코버트 모델(162)은 리뷰데이터를 처리하여 리뷰벡터를 출력하는 역할을 하며, 제2 코버트 모델(164)은 키워드데이터를 처리하여 키워드벡터를 출력하는 역할을 하며, GPT-2 모델(166)은 리뷰벡터, 키워드벡터 및 정형데이터를 입력데이터로 하여 미리 설정된 장래의 K일 간의 농산물 가격예측 결과를 산출하는 역할을 한다.
리뷰데이터는 쇼핑몰 서버(400)에서 제공하는 쇼핑몰 리뷰글을 의미하며, 키워드데이터는 농작물의 명칭 등을 키워드로 하여 검색시 나타나는 블로그글, 뉴스기사글 등을 의미한다.
코버트(KoBERT: Korean Bidirectional Encoder Representations from Transformers)는 한국전자통신연구원(ETRI)이 개발한 모델로 구글의 BERT 모델을 기반으로 한국어에 최적화시킨 트랜스포머 기반의 자연어 처리 모델이다.
본 발명은 제1 코버트 모델(162) 및 제2 코버트 모델(164)을 이용하여 리뷰데이터 및 키워드데이터에 대하여 자연어 처리를 한 후 이를 GPT-2 모델(166)의 입력에 사용함으로써 비정형데이터에 담겨 있는 문맥정보가 GPT-2 모델(166)의 초기 입력에 반영되어 가격예측의 정확도를 향상시킬 수 있다.
GPT-2 모델(166)의 GPT는 ‘Generative Pre-Training of a Language Model’의 약어로 대량의 자연어 데이터셋을 사전 학습(Pre-training)을 한 후 태스크에 맞는 데이터셋(Labeled corpora)을 추가로 학습시키는 파인 튜닝(Fine-tuning)을 하는 방식을 채택하며 자기회귀적 방식으로 데이터를 처리하는 구조를 채택하고 있습니다.
본 발명에서는 GPT 모델 중 2019년 2월 발표된 GPT-2 모델을 채택하고 있습니다. GPT-2 모델(166)은 디코더 블록의 개수 및 임베딩 벡터의 크기에 따라 GPT-2 SMALL, GPT-2 MEDIUM, GPT-2 LARGE, GPT-2 EXTRA LARGE로 나뉠 수 있다.
GPT-2 SMALL은 12개의 디코더 블록을 쌓아올린 모델이며, 임베딩 벡터의 경우 BERT BASE와 동일한 768차원의 임베딩 벡터를 사용한다. GPT-2 MEDIUM은 디코더 블록을 24개를 쌓아올린 모델이며, BERT LARGE와 같은 1024차원의 임베딩 벡터를 사용한다. GPT-2 LARGE와 EXTRA LARGE는 각각 36개 및 48개의 디코더를 쌓아 올렸으며, 1280, 1600 차원의 임베딩 벡터를 사용한다.
GPT-2 모델(166)은 최대 1024개의 토큰을 입력받을 수 있으며, 자기 회귀(Auto-regressive)적인 언어 모델 기반으로 동작하므로 이미 생성된 토큰이 다음 토큰의 생성 확률에 영향을 미친다.
본 발명에서 GPT 모델로 GPT-2 모델(166)을 사용한 것을 실시예로 설명하였으나, 이에 한정되는 것은 아니며 GPT-3 모델이나 향후 공개될 GPT-4 모델 등 GPT의 후속 모델들로 대체되는 것도 가능함은 물론이다.
또한, 본 발명은 인공지능 분야 중의 하나인 딥러닝(Deep Learning)을 이용하며, 모델을 구현할 딥러닝 프레임워크의 종류를 제한하지 않는다.
데이터 저장부(180)는 데이터 수집부(120), 데이터 처리부(150) 및 가격 예측부(160)가 수집하거나 처리한 데이터를 저장하는 역할을 한다.
예를 들어, 데이터 저장부(180)는 데이터 처리부(140)가 생성한 학습데이터 및 평가데이터와, 가격 예측부(160)가 산출한 가격예측 정보를 저장할 수 있다.
이하 도 3 내지 도 6을 참조하면 본 발명의 농산물 가격 예측 서버(100)의 구체적인 동작에 대하여 설명한다.
도 3은 본 발명의 일실시예에 따른 농산물 가격예측 서버를 이용한 농산물 가격예측 방법을 설명하는 개략 순서도이며, 도 4는 본 발명의 일실시예 따른 농산물 가격예측 서버의 가격 예측부의 데이터 처리과정을 설명하는 개념도이며, 도 5는 도 4의 가격 예측부의 제1 코버트 모델 및 제2 코버트 모델에 입력되는 리뷰데이터 및 키워드데이터의 구조를 나타내는 개념도이며, 도 6은 본 발명의 일실시예에 따른 농산물 가격예측 서버를 이용한 농산물 가격 예측 결과의 예시 그래프이다.
도 3을 참조하면 본 발명의 일실시예에 따른 농산물 가격예측 서버(100)는 먼저 농산물에 대한 정형데이터 및 비정형데이터를 크롤링하여 데이터를 수집한다(S310).
농산물 가격예측 서버(100)의 데이터 처리부(140)는 수집된 데이터를 전처리하여 농산물 가격예측 모델에 이용된 학습데이터 및 평가데이터를 생성한다(S320).
가격 예측부(160)는 학습데이터 및 평가데이터를 기반으로 트랜스포머 기반의 농산물 가격예측 모델을 생성하고(S330), 생성된 모델을 학습시킨다(S340).
가격 예측부(160)는 사용자 단말기(200)로부터 특정 농산물에 대한 장래의 가격예측 요청 정보가 수신된 경우 이에 대한 장래 가격을 예측하고 예측 결과를 사용자 단말기(200)로 전송할 수 있다(S350).
본 발명의 농산물 가격예측 서버(100)의 구체적인 알고리즘을 설명하면 다음과 같다.
가격 예측부(160)의 농산물 가격예측 모델이 생성되면 학습데이터를 이용해 모델 학습이 진행된다.
데이터 처리부(140)는 비정형데이터인 농산물 상품의 과거 T 일간의 온라인 쇼핑몰 리뷰글(리뷰데이터)과, 농산물 상품의 명칭을 키워드로 검색시 나오는 과거 T 일간의 블로그글 및 뉴스기사글(키워드데이터)을 각각 하나의 글로 붙인 다음 각각 제1 코버트 모델(162) 및 제2 코버트 모델(164)의 입력 데이터로 넣는다.
이때, 각 토막글(하나의 토막글은 하나의 리뷰글, 블로그글, 뉴스기사글을 지칭한다) 사이에는 도 4에 도시된 바와 같이‘[SEP]’의 구분자 토큰을 넣어 제1 코버트 모델(162) 및 제2 코버트 모델(164)이 각 토막글을 개별적으로 인식할 수 있도록 한다.
리뷰데이터와 키워드데이터의 구글의 센텐스피스(Sentence Piece)와 같은 토크나이저를 통하여 토큰화(Tokenization) 된 후 제1 코버트 모델(162) 및 제2 코버트 모델(164)의 입력으로 들어갈 수 있다.
제1 코버트 모델(162) 및 제2 코버트 모델(164)에 들어가는 리뷰데이터 및 키워드데이터를 예시를 표로 정리하면 아래의 표 1 및 표 2와 같다.
데이터 처리부(140)는 표 1의 비정형데이터를 토크나이저 등을 이용하여 전처리를 수행할 수 있으며, 표 2의 정형데이터의 경우 가격 정보는 별도의 전처리를 하지 않지만 ‘price_trend’, ‘spearman_weighted_temperature’, ‘spearman_weighted_humidity’및 ‘weather’의 경우 미리 설정된 규칙에 따라 계산 또는 지정된 숫자로 전처리되도록 한다.
먼저 ‘price_trend(가격추세변수, )’는 아래의 수학식 1 및 2에 의하여 산출될 수 있다.
상기 수학식 1 및 2에서 ‘’는 농산물의 일별 가격, ‘’는 장기적 추세성분, ‘’는 단기적 순환성분을 의미하며, ‘’는 미리 설정된 상수를 의미한다.
즉, 본 발명은 경제학에서 시계열 데이터를 장기적 추세성분과 단기적 순환성분으로 분리하는데 사용되는 HP필터(Hodrick-Prescott Filter)를 이용하여 장기적 추세성분을 가격추세변수로 도출한다.
예를 들어, 수학식 2에서 과거 1년 동안의 가격 추세를 구하기 위하여 T는 365로 설정하고, 는 200,000으로 설정할 수 있다.
의 값은 최적의 값을 임의로 설정할 수 있는데, 시뮬레이션 결과 200,000의 값을 가질 때 1년 안의 추세선 곡선이 충분히 가격 추세를 반영하는 것으로 파악되었다. 하지만, 의 값은 기초가 되는 과거 가격 추세 추적의 기간에 따라서 최적의 값으로 변동될 수 있다.
일일 가격추세변수의 벡터인 는 수식 2를 만족하도록 괄호 안의 수식이 최소화를 만족시키는 조건을 벡터 미분을 통하여 구해진다.
또한, 온도와 습도 각각에 농산물의 가격과의 스피어만 상관계수(Spearman’s Rank Correlation Coefficient)를 곱하여 가중치가 적용된 변수 ‘spearman_weighted_temperature()’ 및 ‘spearman_weighted_humidity()’는 아래의 수학식 3 및 4에 의하여 구해질 수 있다.
상기 수학식 3 및 4에서‘’는 t 일의 온도, ‘’는 T 일간의 평균온도,‘’는 t 일의 습도, ‘’는 T 일간의 평균습도, ‘’는 농산물 가격과 온도와의 스피어만 상관계수, ‘’는 농산물 가격과 습도와의 스피어만 상관계수를 의미한다.
또한 변수 ‘weather’의 경우 정형데이터 또는 비정형데이터로 수집된 날씨 데이터로부터 날씨가 ‘맑음’인 경우 O으로, ‘흐림’인 경우 1로, ‘비옴’인 경우 2로 산출할 수 있다.
하지만 ‘weather’의 변수 관련한 상기 정형데이터 값의 산출 방법은 하나의 예시일 뿐이며, 날씨의 상태 정보의 세분화 단계 등에 따라서 ‘0,1,2,3,4’와 같이 값이 추가되거나 감소될 수 있으며 또한 각각의 값의 레벨이 달라질 수도 있음은 물론이다.
일별로 정리된 정형데이터 5가지(가격변수는 도매가 및 소매가 중 하나만 취하는 것으로 가정함)는 각각 ‘h/5’번 만큼 값이 복사되어 각각 ‘h/5’길이의 벡터로 변환된다. 따라서 각 벡터의 모든 숫자의 값은 같다.
본 발명에서는 이렇게 만들어진 5 개의 벡터를 모두 이어서(concatenate) 길이 ‘h’인 하나의 벡터로 만들어 이를 GPT-2 모델(166)의 리뷰벡터, 키워드벡터의 다음 입력 데이터로 사용한다.
도 4를 참조하면, 위와 같은 방법으로 현재 일자를 포함한 과거 T 일간의 비정형데이터 및 정형데이터를 GPT-2 모델(166)의 입력데이터로 넣으면서 ‘[START]’토큰을 마지막 입력데이터로 함께 넣는다.
GPT-2 모델(166)은 ‘[START]’토큰의 위치에 해당하는 출력벡터(즉, YT+1)를 반환하는데, 이것이 바로 현재일자를 기준으로 했을 때, 내일의 농산물 가격에 대한 정보를 담고 있는 벡터이다.
출력벡터(YT+1)는 ‘[START]’토큰 다음으로 자기회귀적으로 입력데이터로 입력되고 다시 출력벡터(YT+2)가 출력된다. 이와 같은 방식으로 출력벡터 YT+1 부터 YT+K까지 K개의 벡터들이 출력된다.
이렇게 생성된 K개의 출력벡터들은 공통된 1단의 Fully-Connected Layer를 통과하는데, 이때 Fully-Connected Layer는 행렬곱과 편향덧셈을 포함하며, 입력은 길이 h의 벡터이고 출력은 스칼라값이 되도록 하는 층이다. 이때, 결과물인 스칼라값이 바로 농산물의 예측 가격이 된다.
상기의 내용을 바탕으로 과거 T 일간의 정형데이터 및 비정형데이터를 기반으로 한 장래 K일 간의 농산물의 가격 Y는 하기의 수학식 5 내지 8로 정리될 수 있다.
상기 수학식 5 내지 8에서, ‘price’는 도매가 또는 소매가, ‘temperature’는 온도, ‘humidity’는 습도, ‘weather’는 날씨를 수치화한 값(맑음: 0, 흐림: 1, 비옴: 2), ‘keyword_blog’는 블로그글, ‘keyword_news’는 뉴스기사글, ''는 농산물 가격과 온도와의 스피어만 상관계수, ‘’는 농산물 가격과 습도와의 스피어만 상관계수를 의미한다.
본 발명의 농산물 가격예측 모델의 훈련과정은 다음과 같다.
전체 모델의 파라미터를 ‘’라고 하고, ‘T+i’번째 날의 (T 번째 날이 오늘이라고 가정) 실제 농산물의 가격을 ‘’라고 할 때, 모델의 훈련 오류를 다음 수학식 9와 같으며, 모델의 파라미터 는 미분을 이용해 수학식 9를 최소화하는 방향으로 업데이트되는데, 이 업데이트는 수학식 10과 같이 이루어진다.
상기 수학식 10에서 α는 딥러닝 모델의 학습률(learning rate)을 의미하며, 본 발명에서는 0.0001의 값을 사용하였다.
위와 같은 방식으로 학습데이터를 이용해 모델은 훈련이 되는데, 모델이 전체 학습데이터를 모두 활용해 1회 학습하는 것을 1 epoch라고 한다. 본 발명의 농산물 가격예측 모델은 10 epoch마다 평가데이터를 이용해 모델의 훈련오류를 도출하고, 훈련 중 모델의 훈련오류가 증가하기 시작하면 그 순간 모델학습을 멈추고 모델의 파라미터를 저장한다.
학습이 완료된 농산물 가격예측 모델을 이용해서 가격을 예측하는 과정은 다음과 같다.
먼저 현재일자 시점에서, 현재일자를 포함한 과거 T 일간의 비정형데이터를 제1 코버트 모델(162) 및 제2 코버트 모델(164)에 입력하여 두 개의 출력벡터를 생성하여 이를 GPT-2 모델(166)에 입력시킨다.
또한 현재일자 시점에서, 현재일자를 포함한 과거 T 일간의 정형데이터를 GPT-2 모델(166)에 입력시키고, 마지막 입력 데이터로 ‘[START]’ 토큰을 입력하여 장래 K 일자까지의 농산물 가격을 예측한다.
본 발명은 위와 같은 알고리즘을 통하여 전처리된 정형데이터 및 코버트 모델로 변환된 출력벡터를 GPT 모델의 입력데이터로 입력함으로써 서로 다른 특성과 모달리티를 가지는 데이터를 종합적으로 고려하여 보다 정확한 농산물의 도매가 또는 소매가를 예측할 수 있다.
도 6은 본 발명의 농산물 가격예측 방법에 의하여 마늘 도매가격을 예측한 결과를 나타내는 그래프이다.
예측가격의 그래프의 프로파일이 실제가격의 그래프의 프로파일과 매우 유사하게 도출되었음을 확인할 수 있다.
본 발명의 농산물 가격예측 방법은 이미 도매가의 정보가 공개되어 있는 대중적인 농산물 외에도 희소한 농산물에 대해 소매가의 정보만이 일부 쇼핑몰에 공개되어 있거나 기사에서 거래가격이 일부 개시되어 있는 경우에도 이러한 비정형데이터의 문맥 정보를 반영하여 효과적으로 농산물의 가격을 예측할 수 있는 효과를 가진다.
본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
한편, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합하거나 결합하여 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시 예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성 요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성 요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수 개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 그 컴퓨터 프로그램을 구성하는 코드들 및 코드 세그먼트들은 본 발명의 기술 분야의 당업자에 의해 용이하게 추론될 수 있을 것이다. 이러한 컴퓨터 프로그램은 컴퓨터가 읽을 수 있는 비일시적 저장매체(non-transitory computer readable media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시 예를 구현할 수 있다.
여기서 비일시적 판독 가능 기록매체란, 레지스터, 캐시(cache), 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라, 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로, 상술한 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리 카드, ROM 등과 같은 비일시적 판독가능 기록매체에 저장되어 제공될 수 있다.
이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안 될 것이다.
100: 농산물 가격예측 서버
120: 데이터 수집부
140: 데이터 처리부
160: 데이터 저장부
160: 가격 예측부
162: 제1 코버트 모델
164: 제2 코버트 모델
166: GPT-2 모델

Claims (10)

  1. 네트워크 상에 위치하여 하기의 각 단계를 수행하는 서버를 이용한 농산물 가격 예측 방법에 있어서,
    (a) 가격 예측의 대상이 되는 농산물에 대한 정형데이터 및 비정형데이터를 수집하는 단계;
    (b) 상기 정형데이터 및 상기 비정형데이터를 이용하여 농산물 가격예측 모델에 사용될 학습데이터 및 평가데이터를 생성하는 단계;
    (c) 상기 학습데이터 및 상기 평가데이터를 이용하여 트랜스포머(Transformer) 모델 기반의 상기 농산물 가격예측 모델을 생성하는 단계; 및
    (d) 상기 농산물 가격예측 모델을 이용하여 특정 농산물의 장래의 가격을 예측하는 단계를 포함하고,
    상기 정형 데이터는 농산물의 일별 가격, 온도, 습도 및 날씨 정보를 포함하고, 상기 비정형 데이터는 농산물의 쇼핑몰의 리뷰글을 포함하는 리뷰데이터와, 농작물명으로 검색되는 블로그글 및 뉴스기사글을 포함하는 키워드데이터를 포함하고,
    상기 (c) 단계에서, 상기 농산물 가격예측 모델은,
    상기 리뷰데이터를 처리하여 리뷰벡터를 출력하는 제1 코버트(KoBERT) 모델;
    상기 키워드데이터를 처리하여 키워드벡터를 출력하는 제2 코버트(KoBERT) 모델; 및
    상기 리뷰벡터, 상기 키워드벡터 및 상기 정형데이터를 입력데이터로 하여 미리 설정된 K일 간의 농산물 가격예측 결과를 산출하는 GPT(Generative Pre-trained Transformer) 모델을 포함하여 구성되고,
    상기 GPT 모델은 GPT-2 모델이고, 과거 T 일간의 상기 정형데이터 및 상기 비정형 데이터를 기반으로 한 장래 K일 간의 농산물의 가격 Y는 아래의 수학식들에 의하여 결정되고,
    [수학식 1]

    [수학식 2]

    [수학식 3]

    [수학식 4]

    (이때, ‘price’는 도매가 또는 소매가, 'price_trend'는 가격추세변수, ‘temperature’는 온도, ‘humidity’는 습도, ‘weather’는 날씨를 수치화한 값(맑음: 0, 흐림: 1, 비옴: 2), ‘keyword_blog’는 블로그글, ‘keyword_news’는 뉴스기사글을 의미함)
    상기 가격추세변수는 농산물의 일별 가격 정보를 HP(Hodrick-Prescott) 필터에 입력하여 계산된 장기적 추세성분()이고,
    농산물의 가격 정보가 하기 [수학식 5]로 정의될 때, 상기 장기적 추세성분()는 [수학식 6]을 만족시키는 값으로 결정되는 것을 특징으로 하는 농산물 가격 예측 방법.
    [수학식 5]

    [수학식 6]

    (이때, ‘’는 농산물의 일별 가격, ‘’는 장기적 추세성분, ‘’는 단기적 순환성분을 의미하며, ‘’는 미리 설정된 상수임)
  2. 삭제
  3. 삭제
  4. 삭제
  5. 제1항에 있어서,
    상기 GPT-2 모델에 입력되는 상기 정형데이터 는 하기 [수학식 2b]와 같이 농산물의 가격과의 스피어만 상관계수로 보정된 온도 및 습도의 값을 포함하도록 정의되는 것을 농산물 가격 예측 방법.
    [수학식 2b]

    [수학식 7]

    [수학식 8]

    (이때, ‘’는 t 일의 온도, ‘’는 T 일간의 평균온도,‘’는 t 일의 습도, ‘’는 T 일간의 평균습도, ‘’는 농산물 가격과 온도와의 스피어만 상관계수, ‘’는 농산물 가격과 습도와의 스피어만 상관계수를 의미함)
  6. 가격 예측의 대상이 되는 농산물에 대한 정형데이터 및 비정형데이터를 수집하는 데이터 수집부;
    상기 정형데이터 및 상기 비정형데이터를 이용하여 농산물 가격예측 모델에 사용될 학습데이터 및 평가데이터를 생성하는 데이터 처리부; 및
    상기 학습데이터 및 상기 평가데이터를 이용하여 트랜스포머(Transformer) 모델 기반으로 상기 농산물 가격예측 모델을 생성하고 이를 기반으로 농산물의 장래의 가격을 예측하는 가격 예측부를 포함하고,
    상기 정형 데이터는 농산물의 일별 가격, 온도, 습도 및 날씨 정보를 포함하고, 상기 비정형 데이터는 농산물의 쇼핑몰의 리뷰글을 포함하는 리뷰데이터와, 농작물명으로 검색되는 블로그글 및 뉴스기사글을 포함하는 키워드데이터를 포함하고,
    상기 농산물 가격예측 모델은,
    상기 리뷰데이터를 처리하여 리뷰벡터를 출력하는 제1 코버트(KoBERT) 모델;
    상기 키워드데이터를 처리하여 키워드벡터를 출력하는 제2 코버트(KoBERT) 모델; 및
    상기 리뷰벡터, 상기 키워드벡터 및 상기 정형데이터를 입력데이터로 하여 미리 설정된 K일 간의 농산물 가격예측 결과를 산출하는 GPT(Generative Pre-trained Transformer) 모델을 포함하여 구성되고,
    상기 GPT 모델은 GPT-2 모델이고, 과거 T 일간의 상기 정형데이터 및 상기 비정형 데이터를 기반으로 한 장래 K일 간의 농산물의 가격 Y는 아래의 수학식들에 의하여 결정되고,
    [수학식 1]

    [수학식 2]

    [수학식 3]

    [수학식 4]

    (이때, ‘price’는 도매가 또는 소매가, 'price_trend'는 가격추세변수, ‘temperature’는 온도, ‘humidity’는 습도, ‘weather’는 날씨를 수치화한 값(맑음: 0, 흐림: 1, 비옴: 2), ‘keyword_blog’는 블로그글, ‘keyword_news’는 뉴스기사글을 의미함)
    상기 가격추세변수는 농산물의 일별 가격 정보를 HP(Hodrick-Prescott) 필터에 입력하여 계산된 장기적 추세성분()이고,
    농산물의 가격 정보가 하기 [수학식 5]로 정의될 때, 상기 장기적 추세성분()는 [수학식 6]을 만족시키는 값으로 결정되는 것을 특징으로 하는 농산물 가격 예측 시스템.
    [수학식 5]

    [수학식 6]

    (이때, ‘’는 농산물의 일별 가격, ‘’는 장기적 추세성분, ‘’는 단기적 순환성분을 의미하며, ‘’는 미리 설정된 상수임)
  7. 삭제
  8. 삭제
  9. 삭제
  10. 제6항에 있어서,
    상기 GPT-2 모델에 입력되는 상기 정형데이터 는 하기 [수학식 2b]와 같이 농산물의 가격과의 스피어만 상관계수로 보정된 온도 및 습도의 값을 포함하도록 정의되는 것을 농산물 가격 예측 시스템.
    [수학식 2b]

    [수학식 7]

    [수학식 8]

    (이때, ‘’는 t 일의 온도, ‘’는 T 일간의 평균온도,‘’는 t 일의 습도, ‘’는 T 일간의 평균습도, ‘’는 농산물 가격과 온도와의 스피어만 상관계수, ‘’는 농산물 가격과 습도와의 스피어만 상관계수를 의미함)
KR1020230000951A 2023-01-03 2023-01-03 트랜스포머 모델을 이용한 농산물 가격예측 방법 및 시스템 KR102599136B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230000951A KR102599136B1 (ko) 2023-01-03 2023-01-03 트랜스포머 모델을 이용한 농산물 가격예측 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230000951A KR102599136B1 (ko) 2023-01-03 2023-01-03 트랜스포머 모델을 이용한 농산물 가격예측 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR102599136B1 true KR102599136B1 (ko) 2023-11-03

Family

ID=88745264

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230000951A KR102599136B1 (ko) 2023-01-03 2023-01-03 트랜스포머 모델을 이용한 농산물 가격예측 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR102599136B1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101764147B1 (ko) 2014-09-26 2017-08-02 한국교통대학교산학협력단 온라인 농산물 가격 예측 방법 및 시스템
KR20200036219A (ko) * 2018-09-28 2020-04-07 충북대학교 산학협력단 Lstm을 이용한 농산물 가격 및 판매량 예측 방법
KR102359638B1 (ko) * 2021-06-24 2022-02-08 주식회사 닥터송 의료 분야 맞춤형 감성분석을 통한 의료기관 평가 분석 시스템
KR102384728B1 (ko) * 2020-11-03 2022-04-08 장세훈 산지 경매가 기반의 농산물 공급자 중심 역경매 가격 산출 방법 및 시스템
KR20220115482A (ko) * 2021-02-10 2022-08-17 주식회사 페어랩스 딥러닝 기반 특허 잠재가치 평가 장치 및 그 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101764147B1 (ko) 2014-09-26 2017-08-02 한국교통대학교산학협력단 온라인 농산물 가격 예측 방법 및 시스템
KR20200036219A (ko) * 2018-09-28 2020-04-07 충북대학교 산학협력단 Lstm을 이용한 농산물 가격 및 판매량 예측 방법
KR102137583B1 (ko) 2018-09-28 2020-07-24 충북대학교 산학협력단 Lstm을 이용한 농산물 가격 및 판매량 예측 방법
KR102384728B1 (ko) * 2020-11-03 2022-04-08 장세훈 산지 경매가 기반의 농산물 공급자 중심 역경매 가격 산출 방법 및 시스템
KR20220115482A (ko) * 2021-02-10 2022-08-17 주식회사 페어랩스 딥러닝 기반 특허 잠재가치 평가 장치 및 그 방법
KR102359638B1 (ko) * 2021-06-24 2022-02-08 주식회사 닥터송 의료 분야 맞춤형 감성분석을 통한 의료기관 평가 분석 시스템

Similar Documents

Publication Publication Date Title
Zheng et al. Feature engineering for machine learning: principles and techniques for data scientists
Cavalli et al. CNN-based multivariate data analysis for bitcoin trend prediction
CN110209805B (zh) 文本分类方法、装置、存储介质和计算机设备
CN110532479A (zh) 一种信息推荐方法、装置及设备
JP6177871B2 (ja) 製品情報の公開
Van Heijst et al. A support system for predicting eBay end prices
CN104679771A (zh) 一种个性化数据搜索方法和装置
CN113570413B (zh) 广告关键词的生成方法、装置、存储介质及电子设备
Rustam et al. Review prognosis system to predict employees job satisfaction using deep neural network
CN110795613A (zh) 商品搜索方法、装置、系统及电子设备
Hsu et al. The Recommending Agricultural Product Sales Promotion Mode in E‐Commerce Using Reinforcement Learning with Contextual Multiarmed Bandit Algorithms
KR102599136B1 (ko) 트랜스포머 모델을 이용한 농산물 가격예측 방법 및 시스템
Ma et al. Identifying purchase intention through deep learning: analyzing the Q &D text of an E-Commerce platform
Achilles et al. Using Surface and Semantic Features for Detecting Early Signs of Self-Harm in Social Media Postings.
Stevens et al. Predicting real estate price using text mining
Wei et al. Stock trend prediction using financial market news and BERT
CN112115258B (zh) 一种用户的信用评价方法、装置、服务器及存储介质
Eggebrecht et al. A hybrid convolutional neural network with long short-term memory for statistical arbitrage
KR20220151453A (ko) 상품의 가격 예측 방법
Matrouk et al. MapReduce framework based sequential association rule mining with deep learning enabled classification in retail scenario
Aljrees et al. Contradiction in text review and apps rating: prediction using textual features and transfer learning
KR102653483B1 (ko) 인공지능에 기반하여 미술품의 가격을 예측하는 방법
CN117436446B (zh) 基于弱监督的农业社会化销售服务用户评价数据分析方法
CN115880034B (zh) 一种数据的采集分析系统
CN111507366B (zh) 推荐概率模型的训练方法、智能补全方法及相关装置

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant