KR102137583B1 - Method for predicting price of agricultural product and sales volume using Long Short-Term Memory - Google Patents

Method for predicting price of agricultural product and sales volume using Long Short-Term Memory Download PDF

Info

Publication number
KR102137583B1
KR102137583B1 KR1020180115592A KR20180115592A KR102137583B1 KR 102137583 B1 KR102137583 B1 KR 102137583B1 KR 1020180115592 A KR1020180115592 A KR 1020180115592A KR 20180115592 A KR20180115592 A KR 20180115592A KR 102137583 B1 KR102137583 B1 KR 102137583B1
Authority
KR
South Korea
Prior art keywords
data
input
gate
sales
price
Prior art date
Application number
KR1020180115592A
Other languages
Korean (ko)
Other versions
KR20200036219A (en
Inventor
나형철
유도일
아지즈 나스리디노프
류가애
류관희
Original Assignee
충북대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 충북대학교 산학협력단 filed Critical 충북대학교 산학협력단
Priority to KR1020180115592A priority Critical patent/KR102137583B1/en
Publication of KR20200036219A publication Critical patent/KR20200036219A/en
Application granted granted Critical
Publication of KR102137583B1 publication Critical patent/KR102137583B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Marine Sciences & Fisheries (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Mining & Mineral Resources (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Animal Husbandry (AREA)
  • Data Mining & Analysis (AREA)
  • Agronomy & Crop Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 농산물 가격 및 판매량을 예측하는 장치에서의 농산물 가격 및 판매량 예측 방법에서, 농산물 가격 및 판매량에 관련된 데이터가 입력되면, 입력된 데이터를 가공하는 단계, LSTM(Long Short-Term Memory model) 네트워크를 생성하는 단계, 상기 LSTM 네트워크에서 가공된 데이터에 대한 학습을 진행하는 단계 및 학습된 데이터를 이용하여 상기 농산물 가격 및 판매량을 예측하는 단계를 포함한다.
본 발명에 의하면, LSTM(Long Short-Term Memory)을 이용하여 농산물 가격 및 판매량을 예측함으로써, 보다 용이하고 정확하게 농산물 가격 및 판매량을 예측할 수 있다는 효과가 있다.
In the method for predicting agricultural product prices and sales in a device for predicting agricultural product prices and sales amounts of the present invention, when data related to agricultural product prices and sales quantities are input, processing the input data, LSTM (Long Short-Term Memory model) network Generating, and learning the processed data in the LSTM network and predicting the price and sales of the agricultural products using the learned data.
According to the present invention, by predicting the price and sales of agricultural products by using LSTM (Long Short-Term Memory), it is possible to more easily and accurately predict the price and sales of agricultural products.

Description

LSTM을 이용한 농산물 가격 및 판매량 예측 방법 {Method for predicting price of agricultural product and sales volume using Long Short-Term Memory}Method for predicting price of agricultural product and sales volume using Long Short-Term Memory}

본 발명은 농산물 가격 및 판매량을 예측하는 것에 관한 것으로서, 더욱 상세하게는 LSTM을 이용하여 농산물 가격 및 판매량을 예측하는 것에 관한 것이다. The present invention relates to predicting the price and sales of agricultural products, and more particularly, to predicting the price and sales of agricultural products using LSTM.

농산물 가격 예측은 한국농촌경제연구원의 농업관측센터 등에서 특정 농산물 도매센터에 반입되는 농산물의 최근 3개월간의 거래 가격 및 반입량 추세정보를 제공하거나 최근 10일간의 도매가격과 반입량 정보를 제공하고 있다. 하지만, 실제 최근 10일간의 도매가격과 반입량 정보는 오늘 날짜로 해당 정보를 검색할 때, 일주일 이전의 2-3개의 정보만을 확인할 수 있다.The agricultural product price forecast provides the transaction price and import trend information of the last three months of agricultural products imported to a specific agricultural product wholesale center at the Agricultural Research Center of the Korea Rural Economic Institute, or provides wholesale price and import information for the last 10 days. However, the actual wholesale price and import quantity information of the last 10 days can be checked only 2-3 information from a week ago when searching for the information by today's date.

이와 같이, 기존의 농산물 가격 예측 시스템은 이전의 농산물 가격동향이나 반입량 동향에 대한 정보를 제공할 뿐, 내일이나 일주일 후의 농산물 가격을 예측하거나 예측한 가격 정보를 실시간 온라인으로 제공하고 있지 못하고 있는 실정이다.As described above, the existing agricultural product price prediction system only provides information on the previous agricultural product price trend or the import quantity trend, and does not predict the agricultural product price tomorrow or a week later or provides the predicted price information in real time online. .

특히, 농산물은 파종에서 수확에 이르기까지의 모든 과정이 최초의 계획에 의거하여 빈틈없이 진행하기가 어려울 뿐 아니라 공산품의 생산과 달리 인위적으로 통제할 수 없는 불가항력적 상황이 빈번히 발생하므로, 농산물의 가격이나 수급량에 따라 농민에서 유리한 시점에 농산물을 판매할 수 있도록 결정하는 데 있어서 농민이나 농산물 산지유통센터의 역할은 크다 할 수 있다. 하지만, 농산물 가격은 실시간 변동하기 때문에 농민이나 농산물 현지유통센터 관계자가 내일이나 일주일 후의 농산물 가격을 예측하여 농산물의 출하 시점을 결정하기는 쉽지 않다.In particular, not only is it difficult for all processes from sowing to harvesting to proceed seamlessly according to the initial plan, and agricultural products are often subject to irresistible circumstances that cannot be controlled artificially, unlike the production of agricultural products. However, depending on the supply and demand, the role of farmers or agricultural products distribution centers can be large in determining that farmers can sell agricultural products at a favorable time. However, since the prices of agricultural products fluctuate in real time, it is not easy for farmers or local officials of agricultural products distribution centers to predict the prices of agricultural products tomorrow or a week later to determine when to ship agricultural products.

종래의 농산물 생산지 정보는 품목별, 지역별로 위촉된 모니터 요원(현지 농협직원, 농업 기술 센터 직원 등)에 의한 전화조사를 통해 매월 수집되어 산지의 생산 및 거래 동향을 파악하는데 활용되었으나, 모니터 요원의 잦은 부서 이동, 농촌현장 근무에 따른 잦은 자리 비움, 모니터 활동 외의 다른 업무 수행 등으로 인해 신속하고 정확하게 수집될 수 없으므로, 수집된 농산물 생산지 정보를 산지의 생산 및 거래 동향 파악을 위한 기초 정보로서 활용되는데 한계가 있다.Conventional agricultural product information was collected monthly through telephone surveys by monitor agents commissioned by item and region (local agricultural cooperatives, agricultural technology center staff, etc.), and was used to understand production and transaction trends in mountain regions, but frequent monitoring agents Because it cannot be collected quickly and accurately due to the movement of departments, frequent absences due to work in rural fields, and performance of tasks other than monitoring activities, the collected agricultural products production area information is used as basic information for grasping production and trading trends There is.

또한, 농업 관측 정보 지원 서비스는 1999년 이래로 그 중요성이 계속 증대되고 있으나, 이를 수행하는 종래의 농업 관측 정보 지원 시스템은 조사 결과(농업 관측 정보)를 단순히 데이터베이스에 저장하거나 제공만 할 뿐, 저장된 조사 결과를 활용하여 시계열 분석 등을 수행한 분석 결과 서비스까지는 제공하지 못한다는 한계가 있다.In addition, the importance of the agricultural observation information support service has been increasing since 1999, but the conventional agricultural observation information support system that does this simply stores or provides the results of the survey (agricultural observation information) in a database, and the stored survey There is a limitation in that it is not possible to provide an analysis result service that performs time series analysis using the result.

이처럼, 농산물 소비 영역은 고유의 특징을 지닌 다양한 농산물 수요자를 대상으로 할 뿐 아니라 예측하기 어려운 소비 트렌드, 사회 분위기, 사건, 사고 등 여러 언론의 영향을 많이 받는다. 따라서 농산물에 대한 소비 관측은 관측의 수행이 어렵고 정확도가 보장되지 않는 것을 알 수 있다. As such, the area of consumption of agricultural products is not only targeted to consumers of various agricultural products with unique characteristics, but is also influenced by various media such as unpredictable consumption trends, social atmosphere, events, and accidents. Therefore, it can be seen that observation of consumption for agricultural products is difficult to perform and accuracy is not guaranteed.

대한민국 등록특허 10-1764147Republic of Korea Registered Patent 10-1764147

본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 농산물의 가격 및 판매량을 보다 정확하고 신속하게 예측할 수 있도록, LSTM(Long Short-Term Memory)을 이용하여 농산물 가격 및 판매량을 예측하는 방법을 제공하는데 그 목적이 있다. 즉, 본 발명에서는 수집되어 있는 정형 및 비정형 데이터(SNS데이터, 방송데이터)들을 사용하여 사용자의 농식품 소비 패턴에 대하여 딥 러닝(Deep learning)을 통해 분석하여 미래의 소비 가격을 예측하는 것을 목적으로 한다. The present invention has been devised to solve the above problems, and a method for predicting agricultural products prices and sales volumes using Long Short-Term Memory (LSTM) to more accurately and quickly predict agricultural products prices and sales volumes. The purpose is to provide. That is, in the present invention, the purpose of the present invention is to predict the future consumption price by analyzing the user's agri-food consumption pattern through deep learning using collected and unstructured data (SNS data, broadcast data). .

본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The objects of the present invention are not limited to the above-mentioned objects, and other objects not mentioned will be clearly understood by those skilled in the art from the following description.

이와 같은 목적을 달성하기 위한 본 발명의 농산물 가격 및 판매량을 예측하는 장치에서의 농산물 가격 및 판매량 예측 방법에서, 농산물 가격 및 판매량에 관련된 데이터가 입력되면, 입력된 데이터를 가공하는 단계, LSTM(Long Short-Term Memory model) 네트워크를 생성하는 단계, 상기 LSTM 네트워크에서 가공된 데이터에 대한 학습을 진행하는 단계 및 학습된 데이터를 이용하여 상기 농산물 가격 및 판매량을 예측하는 단계를 포함한다. In the method for predicting agricultural product prices and sales volumes in the apparatus for predicting agricultural product prices and sales volumes of the present invention for achieving the above object, when data related to agricultural product prices and sales volumes are input, processing the input data, LSTM (Long Short-Term Memory model) generating a network, learning the processed data in the LSTM network, and predicting the agricultural product price and sales amount using the learned data.

상기 입력된 데이터를 가공하는 단계에서, 상기 입력된 데이터를 각 열 별로 정규화하는 단계, 정규화된 데이터들을 학습시키기 위해 입력에 대한 데이터 시퀀스와 출력에 대한 데이터 시퀀스를 생성하는 단계 및 학습시킬 학습용 데이터셋(dataset)과, 학습된 내용을 확인할 테스트용 데이터셋을 생성하는 단계를 포함할 수 있다. In the step of processing the input data, normalizing the input data for each column, generating a data sequence for input and a data sequence for output to train the normalized data, and a training dataset to be learned and (dataset), and generating a test dataset for checking the learned content.

상기 LSTM 네트워크에서 가공된 데이터에 대한 학습을 진행하는 단계에서, 상기 LSTM 네트워크를 이용하여 상기 학습용 데이터셋을 학습시킬 수 있다. In the step of learning the processed data in the LSTM network, the learning dataset may be trained using the LSTM network.

상기 농산물 가격 및 판매량에 관련된 데이터는 정형 데이터와 비정형 데이터로 구분되고, 상기 정형 데이터는 미리 지정된 농산물의 도매가, 소매가, 판매량, 판매금액을 포함하고, 상기 비정형 데이터는 미리 지정된 농산물이 언급된 SNS, 뉴스, 방송 데이터를 포함할 수 있다. The data related to the agricultural product price and sales amount is divided into structured data and unstructured data, and the structured data includes a predetermined wholesale price, retail price, sales amount, and sales amount of the agricultural product, and the unstructured data is an SNS in which the predefined agricultural product is mentioned, News, broadcast data may be included.

본 발명에 의하면, LSTM(Long Short-Term Memory)을 이용하여 농산물 가격 및 판매량을 예측함으로써, 보다 용이하고 정확하게 농산물 가격 및 판매량을 예측할 수 있다는 효과가 있다. According to the present invention, by predicting the price and sales of agricultural products by using LSTM (Long Short-Term Memory), it is possible to more easily and accurately predict the price and sales of agricultural products.

또한, 본 발명은 예측하기 어려운 농산물 가격 및 판매량을 예측함으로써, 농산물 생산자 및 소비자에게 합리적인 의사결정에 도움을 주고, 사회적으로는 효율적인 자원배분이 가능하다는 효과가 있다. In addition, the present invention has the effect that by predicting the unpredictable price and sales of agricultural products, it helps farmers and consumers to make reasonable decisions, and socially efficient resource allocation.

도 1은 본 발명의 일 실시예에 따른 LSTM을 이용한 농산물 가격 및 판매량 예측 방법을 보여주는 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 농산물 가격 및 판매량을 예측하기 위해 사용되는 데이터 집합을 예시한 도표이다.
도 3은 본 발명의 일 실시예에 따른 패널 데이터 기준 구매 금액의 예측 데이터를 도출하기 위해 사용된 데이터 집합을 예시한 도표이다.
도 4는 본 발명의 일 실시예에 따른 도매시장 가격 금액의 예측 데이터를 도출하기 위해 사용된 데이터 집합을 예시한 도표이다.
도 5는 본 발명의 일 실시예에 따른 도매시장 반입량의 예측 데이터를 도출하기 위해 사용된 데이터 집합을 예시한 도표이다.
도 6은 본 발명의 일 실시예에 따른 도매시장 소비 가격 예측을 위한 데이터 정규화 방법을 예시한 것이다.
도 7은 본 발명의 일 실시예에 따른 도매시장 소비 가격 예측을 위한 하이퍼파라미터이다.
도 8 및 도 9는 본 발명의 일 실시예에 따른 LSTM 망 구성을 예시한 도면이다.
도 10은 본 발명의 일 실시예에 따른 LSTM을 예시한 도면이다.
도 11은 본 발명의 일 실시예에 따른 LSTM 학습 방법을 예시한 것이다.
도 12 및 도 13은 본 발명의 일 실시예에 따른 LSTM을 이용한 도매시장 소비 가격 예측 결과를 도시한 그래프이다.
1 is a flow chart showing a method for predicting agricultural product prices and sales volume using LSTM according to an embodiment of the present invention.
2 is a diagram illustrating a data set used to predict agricultural product prices and sales volumes according to an embodiment of the present invention.
3 is a diagram illustrating a data set used to derive prediction data of a purchase amount based on panel data according to an embodiment of the present invention.
4 is a diagram illustrating a data set used to derive prediction data of a wholesale market price amount according to an embodiment of the present invention.
5 is a diagram illustrating a data set used to derive prediction data of wholesale market imports according to an embodiment of the present invention.
6 illustrates a data normalization method for predicting wholesale market consumption price according to an embodiment of the present invention.
7 is a hyperparameter for predicting wholesale market consumption price according to an embodiment of the present invention.
8 and 9 are diagrams illustrating an LSTM network configuration according to an embodiment of the present invention.
10 is a diagram illustrating an LSTM according to an embodiment of the present invention.
11 illustrates an LSTM learning method according to an embodiment of the present invention.
12 and 13 are graphs showing the results of predicting the wholesale market consumption price using LSTM according to an embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.The present invention can be applied to various changes and can have various embodiments, and specific embodiments will be illustrated in the drawings and described in detail. However, this is not intended to limit the present invention to specific embodiments, and should be understood to include all modifications, equivalents, and substitutes included in the spirit and scope of the present invention.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in this application are only used to describe specific embodiments, and are not intended to limit the present invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In this application, the terms "include" or "have" are intended to indicate the presence of features, numbers, steps, actions, components, parts or combinations thereof described herein, one or more other features. It should be understood that the existence or addition possibilities of fields or numbers, steps, operations, components, parts or combinations thereof are not excluded in advance.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 갖는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by a person skilled in the art to which the present invention pertains. Terms such as those defined in a commonly used dictionary should be interpreted as having meanings consistent with meanings in the context of related technologies, and should not be interpreted as ideal or excessively formal meanings unless explicitly defined in the present application. Does not.

또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.In addition, in the description with reference to the accompanying drawings, the same components are given the same reference numerals regardless of the reference numerals, and redundant descriptions thereof will be omitted. In the description of the present invention, when it is determined that the detailed description of the related known technology may unnecessarily obscure the subject matter of the present invention, the detailed description will be omitted.

본 발명은 농산물 가격 및 판매량을 예측하는 방법에 대한 것이다. The present invention relates to a method for predicting agricultural product prices and sales volume.

본 발명의 농산물 가격 및 판매량 예측 방법을 수행하는 주체는 농산물 가격 및 판매량 예측 방법을 수행하는 제반 컴퓨터 장치라고 할 수 있으며, 또는 농산물 가격 및 판매량을 수행하는 시스템 또는 장치를 전반적으로 제어하는 제어부나 프로세서(processor)일 수 있다. 즉, 본 발명의 농산물 가격 및 판매량 예측 방법은 일종의 소프트웨어인 알고리즘으로 구성될 수 있으며, 소프트웨어는 농산물 가격 및 판매량 예측 방법을 수행하는 시스템, 장치의 제어부 또는 프로세서(processor)에서 실행될 수 있다.The subject that performs the method for predicting the price and sales of agricultural products of the present invention may be referred to as a computer device for performing the method for predicting the price and sales of agricultural products, or a control unit or processor for overall controlling the system or device for performing the price and sales of agricultural products (processor). That is, the method for predicting agricultural product price and sales amount of the present invention may be composed of an algorithm that is a kind of software, and the software may be executed in a controller or processor of a system, apparatus for performing a method for predicting agricultural product price and sales amount.

도 1은 본 발명의 일 실시예에 따른 LSTM을 이용한 농산물 가격 및 판매량 예측 방법을 보여주는 흐름도이다. 1 is a flow chart showing a method for predicting agricultural product prices and sales volume using LSTM according to an embodiment of the present invention.

도 1을 참조하면, 본 발명의 농산물 가격 및 판매량 예측 방법은, 특정 농산물의 가격 및 판매량에 대한 데이터가 입력되면, 입력된 데이터를 가공한다(S110, S120, S130). 본 발명에서 농산물의 가격 및 판매량에 대한 데이터는 정형 데이터와 비정형 데이터로 구분할 수 있다. 정형 데이터는 특정 농산물의 도매가, 소매가, 판매량, 판매금액 등의 데이터이고, 비정형 데이터는 특정 농산물이 언급된 SNS, 뉴스, 방송 등의 데이터이다. Referring to FIG. 1, in the method for predicting agricultural product prices and sales volumes of the present invention, when data on prices and sales volumes of specific agricultural products are input, the input data is processed (S110, S120, S130). In the present invention, data on prices and sales of agricultural products can be divided into structured data and unstructured data. The structured data is data such as wholesale price, retail price, sales amount, and sales amount of a specific agricultural product, and the unstructured data is data such as SNS, news, broadcast, etc. in which a specific agricultural product is mentioned.

다음, LSTM(Long Short-Term Memory model) 네트워크를 생성한다(S140). Next, a long short-term memory model (LSTM) network is generated (S140).

그리고, LSTM 네트워크에서 가공된 데이터에 대한 학습을 진행한다(S150). Then, learning is performed on the processed data in the LSTM network (S150).

그리고, 학습된 데이터를 이용하여 농산물 가격 및 판매량 데이터를 예측한다(S160). Then, using the learned data to predict the price and sales data of agricultural products (S160).

입력된 데이터를 가공하는 단계(S110, S120, S130)는, 입력된 데이터를 각 열 별로 정규화하는 단계(S110), 정규화된 데이터들을 학습시키기 위해 입력에 대한 데이터 시퀀스와 출력에 대한 데이터 시퀀스(sequence)를 생성하는 단계(S120) 및 학습시킬 학습용 데이터셋(training dataset)과, 학습된 내용을 확인할 테스트용 데이터셋(testing dataset)을 생성하는 단계(S130)를 포함한다. Processing the input data (S110, S120, S130), normalizing the input data for each column (S110), the data sequence for the input and the data sequence for the output (sequence) to train the normalized data ) (S120) and training dataset to be trained (training dataset), and generating a test dataset (testing dataset) to check the learned content (S130).

그리고, LSTM 네트워크를 이용하여 학습용 데이터셋을 학습시킬 수 있다.And, the training dataset can be trained using the LSTM network.

본 발명에서 데이터를 정규화(min-max scaling)하는 것은 데이터가 너무 작거나 너무 큰 값이 되어, 학습을 방해하는 것을 방지하기 위함이며, 최소값과 최대값을 이용하여 X를 0~1 사이의 값으로 변환하고, 각 열마다 적용한다. In the present invention, normalizing the data (min-max scaling) is to prevent the data from being too small or too large, preventing learning, and using the minimum and maximum values, X is a value between 0 and 1 Convert to, and apply to each column.

본 발명에서는 LSTM RNN(Recurrent Neural Network)을 사용하여 농산물 가격 및 판매량을 예측할 수 있다. In the present invention, the price and sales of agricultural products can be predicted using LSTM Recurrent Neural Network (RNN).

도 10은 본 발명의 일 실시예에 따른 LSTM을 예시한 도면이다. 10 is a diagram illustrating an LSTM according to an embodiment of the present invention.

도 10을 참조하면, LSTM(Long Short-Term Memory models)은 기존의 RNN 모델의 변형으로 RNN의 기울기 소멸 문제를 완화시킨 대표적인 개선 모델이다. 이 모델은 은닉노드에 메모리 셀(memory cell)을 포함 시키고 있고, 이 메모리 셀은 저장소에 값을 저장하고, 출력하고, 망각 값을 조정하는 게이트이다. Referring to FIG. 10, LSTM (Long Short-Term Memory models) is a representative improvement model that alleviates the slope disappearance problem of RNN by a modification of the existing RNN model. This model includes a memory cell in a hidden node, which is a gate that stores, outputs, and adjusts forgetting values in storage.

LSTM은 메모리 셀 이외에 입력 값에 대한 입력 게이트(input gate), 출력 값에 대한 출력 게이트(output gate), 망각 값에 대한 망각 게이트(forget gate)로 구성된다. 각 게이트에 대한 입출력 파라미터를 정리하면 다음과 같다. In addition to the memory cell, the LSTM is composed of an input gate for an input value, an output gate for an output value, and a forget gate for an oblivion value. The input/output parameters for each gate are as follows.

Figure 112018095907418-pat00001
Figure 112018095907418-pat00001

LSTM의 학습 알고리즘은 RNN과 동일하게 Backpropagation을 사용하고, 입력 데이터는 서열 데이터이고, 학습 방법은 다음과 같다. The learning algorithm of LSTM uses Backpropagation in the same way as RNN, the input data is sequence data, and the learning method is as follows.

도 11은 본 발명의 일 실시예에 따른 LSTM 학습 방법을 예시한 것이다. 11 illustrates an LSTM learning method according to an embodiment of the present invention.

도 11을 참조하면, LSTM RNN에서 입력 데이터는 서열 데이터, 입력 게이트에 대한 가중치 Ui,Wi, 출력 게이트에 대한 가중치 Uo,Wo,Vo, 망각 게이트에 대한 가중치 Uf,Wf, 메모리 셀(memory cell)에 대한 가중치 Uc,Wc, 그리고 각 게이트의 편차 항 bi,bo,bf,bc을 사용하고, 출력 데이터는 LSTM의 출력 값으로 나타낸다.Referring to FIG. 11, in LSTM RNN, input data is sequence data, weight U i ,W i for an input gate, weight U o ,W o ,V o for an output gate, weight U f ,W f for an oblivion gate , The weight U c , W c for the memory cell, and the deviation terms b i , b o , b f , b c of each gate are used, and the output data is represented by the output value of the LSTM.

그리고 학습은 입력데이터의 마지막 시점까지 계속 반복되고 내용은 다음과 같다. 우선 현 시점의 입력값과 이전 은닉층의 값을 가중치와 곱해 편차항을 더해주어 it 값을 만들어주고, 이전 은닉층에서 얻은 값은 쌍곡탄젠트를 이용하여 입력 게이트의 방법을 적용해 at을 구한다. 이 후 망각게이트 ft의 값을 시그모이드 함수를 통해 구하고 메모리 셀에서 새로 입력된 값과 이전 출력 값의 결과를 가지고 어떤 값을 사용할 것인지 ct를 구한다. 그 다음 현시점의 입력값, 이전 은닉층의 값, 이전 상태저장소의 값의 가중치를 곱한 합과 편차항을 더해 시그모이드 함수를 이용해 ot 의 출력 게이트 값을 얻은 후, 이 ot의 값과 ct의 쌍곡탄제트 결과를 이용해 최종 예측된 값을 출력한다. And learning continues until the last point of input data and the contents are as follows. First, the input value of the current time and the value of the previous hidden layer are multiplied by the weight to add a deviation term to create an i t value, and the value obtained from the previous hidden layer is obtained by applying the method of the input gate using the hyperbolic tangent to obtain a t . After that, the value of the forgetting gate f t is obtained through the sigmoid function, and the value c t to be used with the result of the newly input value and the previous output value in the memory cell is obtained. Then, the sum of the input value of the current point, the value of the previous hidden layer and the weight of the value of the previous state storage and the deviation term are added to obtain the output gate value of o t using the sigmoid function, and then the value of o t and c The final predicted value is output using the hyperbolic tangent result of t .

LSTM RNN의 학습에서 그래디언트(gradient)를 결정하기 위해 오차 함수 E의 각 게이트와 내부상태의 k번째 원소에 대한 편미분을 다음과 같이 계산한다. In order to determine the gradient in the learning of LSTM RNN, the partial differentials for each gate of the error function E and the kth element in the internal state are calculated as follows.

[수학식 1][Equation 1]

Figure 112018095907418-pat00002
Figure 112018095907418-pat00002

그리고, t-1 단계로 전달되는 그래디언트는 다음과 같다. And, the gradient delivered to the t-1 step is as follows.

[수학식 2][Equation 2]

Figure 112018095907418-pat00003
Figure 112018095907418-pat00003

그리고, p 단계 앞으로 전달되는 그래디언트는 다음과 같다. And, the gradient delivered to the p step is as follows.

[수학식 3][Equation 3]

Figure 112018095907418-pat00004
Figure 112018095907418-pat00004

여기서, p 단계 앞으로 전달되는 그레디언트는 다음과 같이 망각 게이트의 값이 p개 곱해지는 형태가 된다. 그리고, 망각 게이트 값은 시그모이드를 적용한 결과여서 구간 (0,1) 사이의 값이므로, 일반 RNN에서

Figure 112018095907418-pat00005
이 곱해지는 것보다 기울기 소멸 문제에서 유리하다.Here, the gradient delivered to the p-stage is in the form of multiplying the value of the oblivion gate by p as follows. In addition, since the forgetting gate value is a result of applying sigmoid, it is a value between the intervals (0,1), so in general RNN
Figure 112018095907418-pat00005
This multiplication is advantageous in the problem of slope disappearance.

LSTM 모델은 3개의 게이트를 포함하고 있어서 전형적인 RNN 학습에 비해 가중치 및 편차항의 개수는 약 4배가 되어 RNN 모델에 비해 실행시간과 학습시간이 더 오래 걸리지만, 기울기 소멸 문제를 완화시켜 더 정확한 결과를 얻을 수 있다.Since the LSTM model includes three gates, the number of weights and deviation terms is about 4 times that of a typical RNN learning, which takes longer to execute and learn than the RNN model, but it reduces the slope disappearance problem and provides more accurate results. Can be obtained.

도 11을 참조하면, 입력 데이터는 서열 데이터로 농산물 가격 및 판매량 관련 데이터가 되고, 입력 게이트에 대한 가중치 Ui,Wi, 출력 게이트에 대한 가중치 Uo,Wo,Vo, 망각 게이트에 대한 가중치 Uf,Wf, 메모리 셀(memory cell)에 대한 가중치 Uc,Wc, 그리고 각 게이트의 편차 항 bi,bo,bf,bc을 사용하고, 출력 데이터는 LSTM의 출력 값으로 다음 예측값이 된다.Referring to FIG. 11, input data is data related to agricultural product price and sales amount as sequence data, and weight U i ,W i for the input gate, weight U o ,W o ,V o for the output gate, and for oblivion gate The weight U f ,W f , the weight U c ,W c for the memory cell, and the deviation term b i ,b o ,b f ,b c of each gate are used, and the output data is the output value of the LSTM. Is the next predicted value.

예측방법은 다음과 같다.The prediction method is as follows.

먼저, 예측할 데이터들을 정규화하고, 정규화 된 데이터들을 학습을 시키기 위해 입력과 출력에 대한 데이터 시퀀스를 생성한다. 다음, 학습을 시킬 학습용 데이터셋과 학습된 내용을 확인 할 테스트용 데이터셋을 생성한다. 그리고, LSTM 네트워크 망을 생성하는데, 본 발명에서는 LSTM 셀을 각 셀의 출력크기, forget bias등 여러 파라미터들을 사용해 정의한 다음 stacked layers 개수의 층으로 싸인 stacked RNNs를 생성하고, 이 LSTM 셀(cell)들을 연결해서 구성한다. 연결 구성 방법은 과거 날짜의 데이터를 이용하여 다음날의 데이터 1개를 예측하기 때문에 Many-to-one 형태로 구현한다. 이렇게 구현된 LSTM 망을 이용해서 앞에서 만들었던 학습용 데이터셋(training dataset)을 학습시킨다. 이 후 학습된 내용을 이용하여 다음 날 예측될 농산물 가격 및 판매량을 예측한다.First, the data to be predicted is normalized, and data sequences for input and output are generated to train the normalized data. Next, we create a training dataset for learning and a test dataset for checking the learned content. And, in creating an LSTM network network, in the present invention, LSTM cells are defined using various parameters such as the output size of each cell and forget bias, and then stacked RNNs wrapped with layers of the number of stacked layers are generated, and these LSTM cells are generated. Connect and configure. Since the connection configuration method predicts one data of the next day using the data of the past date, it is implemented in many-to-one form. Using this implemented LSTM network, we train the training dataset created earlier. Then, by using the learned contents, we predict the price and sales of agricultural products to be predicted the next day.

본 발명의 일 실시예에서 실제 실험을 다음과 같은 방식으로 진행하였다.In one embodiment of the present invention, the actual experiment was conducted in the following manner.

본 발명에서 농산물 중에서 양파의 도매시장 소비 가격을 예측하기 위한 실험을 진행하였고, 2014년 1월 1일부터 2014년 8월 31일 까지 기간의 도매시장 소비 가격과 관련된 주별 데이터를 사용하여 LSTM RNN 방법을 이용하여 학습시켰다. 그리고, 딥러닝 라이브러리는 tensorflow를 사용하였고 GPU 모드에서 진행하였다. 데이터 학습은 입력 데이터에 대해 총 10 epoch을 학습하였고, 약 20분의 시간이 소요된 것을 볼 수 있었다. 이 도매시장 소비 가격 예측 실험을 위한 하이퍼파라미터는 다음과 같다. In the present invention, an experiment was conducted to predict the wholesale market consumption price of onion among agricultural products, and the LSTM RNN method using weekly data related to the wholesale market consumption price period from January 1, 2014 to August 31, 2014 It was learned using. And, the deep learning library used tensorflow and proceeded in GPU mode. For data learning, a total of 10 epochs were learned for the input data, and it was found that it took about 20 minutes. The hyperparameters for the experiment of predicting the consumption price of the wholesale market are as follows.

도 7은 본 발명의 일 실시예에 따른 도매시장 소비 가격 예측을 위한 하이퍼파라미터이다. 7 is a hyperparameter for predicting wholesale market consumption price according to an embodiment of the present invention.

도 7에서 input_data_column_cnt = 31 # 입력데이터의 컬럼 개수(Variable 개수)이고, output_data_column_cnt = 1 # 결과데이터의 컬럼 개수이고, seq_length = 2 # 1개 시퀀스의 길이(시계열데이터 입력 개수)이고, rnn_cell_hidden_dim = 20 # 각 셀의 (hidden)출력 크기이고, forget_bias = 0.5 # 망각편향(기본값 1.0)이고, num_stacked_layers = 1 # stacked LSTM layers 개수이고, keep_prob = 1.0 # dropout할 때 keep할 비율이고, epoch_num = 1000 # 에폭 횟수(학습용전체데이터를 몇 회 반복해서 학습할 것인가 입력)이고, learning_rate = 0.01 # 학습률의 하이퍼파라미터가 예시되어 있다. In FIG. 7, input_data_column_cnt = 31 # number of columns of input data (variable number), output_data_column_cnt = 1 # number of columns of result data, seq_length = 2 # length of 1 sequence (number of time series data input), rnn_cell_hidden_dim = 20 # (Hidden) output size of each cell, forget_bias = 0.5 # forgetting bias (default 1.0), num_stacked_layers = 1 # number of stacked LSTM layers, keep_prob = 1.0 # ratio to keep when dropout, epoch_num = 1000 # number of epochs (Enter the number of times to learn the entire data for learning repeatedly), and learning_rate = 0.01 # Hyperparameters of learning rate are illustrated.

도 2는 본 발명의 일 실시예에 따른 농산물 가격 및 판매량을 예측하기 위해 사용되는 데이터 집합을 예시한 도표이다. 2 is a diagram illustrating a data set used to predict agricultural product prices and sales volumes according to an embodiment of the present invention.

도 2의 실시예에서, 다음과 같이 컬럼명을 정의하였다. In the example of FIG. 2, column names are defined as follows.

Figure 112018095907418-pat00006
Figure 112018095907418-pat00006

Figure 112018095907418-pat00007
Figure 112018095907418-pat00007

도 3은 본 발명의 일 실시예에 따른 패널 데이터 기준 구매 금액의 예측 데이터를 도출하기 위해 사용된 데이터 집합을 예시한 도표이다. 3 is a diagram illustrating a data set used to derive prediction data of a purchase amount based on panel data according to an embodiment of the present invention.

도 3의 실시예에서, 사용 데이터는 다음과 같다. In the embodiment of Fig. 3, usage data is as follows.

Figure 112018095907418-pat00008
Figure 112018095907418-pat00008

이러한 데이터를 사용하여, 다음과 같은 예측 데이터를 산출하였다. Using these data, the following prediction data were calculated.

Figure 112018095907418-pat00009
Figure 112018095907418-pat00009

도 4는 본 발명의 일 실시예에 따른 도매시장 가격 금액의 예측 데이터를 도출하기 위해 사용된 데이터 집합을 예시한 도표이다. 4 is a diagram illustrating a data set used to derive prediction data of a wholesale market price amount according to an embodiment of the present invention.

도 4의 실시예에서 사용 데이터는 다음과 같다. Usage data in the embodiment of Figure 4 is as follows.

Figure 112018095907418-pat00010
Figure 112018095907418-pat00010

이러한 데이터를 사용하여, 다음과 같은 예측 데이터를 산출하였다. Using these data, the following prediction data were calculated.

Figure 112018095907418-pat00011
Figure 112018095907418-pat00011

즉, 도 4에서는 도 3에서 예측한 패널데이터 기준 양파 구매금액을 사용 데이터로 사용하여 도매시장 가격을 예측한 것이다. That is, in FIG. 4, the wholesale market price is predicted using the panel data-based onion purchase amount predicted in FIG. 3 as usage data.

도 5는 본 발명의 일 실시예에 따른 도매시장 반입량의 예측 데이터를 도출하기 위해 사용된 데이터 집합을 예시한 도표이다. 5 is a diagram illustrating a data set used to derive prediction data of wholesale market imports according to an embodiment of the present invention.

도 5의 실시예에서 사용 데이터는 다음과 같다. The usage data in the embodiment of FIG. 5 is as follows.

Figure 112018095907418-pat00012
Figure 112018095907418-pat00012

이러한 데이터를 사용하여, 다음과 같은 예측 데이터를 산출하였다. Using these data, the following prediction data were calculated.

Figure 112018095907418-pat00013
Figure 112018095907418-pat00013

즉, 도 5에서는 도 4에서 예측한 도매시장 가격을 사용 데이터로 사용하여 도매시장 반입량을 예측한 것이다. That is, in FIG. 5, the wholesale market import amount is predicted by using the wholesale market price predicted in FIG. 4 as usage data.

본 발명에서 데이터를 정규화(min-max scaling)하는 이유는 데이터가 너무 작거나 너무 큰 값이 되어, 학습을 방해하는 것을 방지하기 위함이며, 최소값과 최대값을 이용하여 X를 0~1 사이의 값으로 변환하고, 각 열마다 적용한다In the present invention, the reason for normalizing the data (min-max scaling) is to prevent the data from being too small or too large, preventing learning, and using the minimum and maximum values between X and 0 to 1. Convert to value and apply to each column

도 6은 본 발명의 일 실시예에 따른 도매시장 소비 가격 예측을 위한 데이터 정규화 방법을 예시한 것이다.6 illustrates a data normalization method for predicting wholesale market consumption price according to an embodiment of the present invention.

도 6에서는 panel_purchase_amount(패널 구입량) 컬럼에 대한 데이터 정규화를 예시하였다. In FIG. 6, data normalization for the panel_purchase_amount column is illustrated.

도 8 및 도 9는 본 발명의 일 실시예에 따른 LSTM 망 구성을 예시한 도면이다. 8 and 9 are diagrams illustrating an LSTM network configuration according to an embodiment of the present invention.

도 8을 참조하면, 본 발명의 일 실시예에 따른 LSTM 망은 LSTM 셀(cell)을 생성하되, 각 셀의 출력크기를 20, forget_bias를 0.5, state_is_tuple을 True(받아 들여지고 반환 된 상태는 c_state와 m_state의 2-tuples)로 설정한다. 그리고, Num_stacked_layers 개의 층으로 싸인 stacked RNNs을 생성하고, LSTM 셀을 연결한다. Referring to FIG. 8, in the LSTM network according to an embodiment of the present invention, an LSTM cell is generated, but the output size of each cell is 20, forget_bias is 0.5, and state_is_tuple is True (the received and returned state is c_state and 2-tuples of m_state). Then, stacked RNNs wrapped with Num_stacked_layers layers are generated, and LSTM cells are connected.

본 발명의 LSTM 망은 과거 날짜의 데이터를 이용하여 다음날의 데이터 1개를 예측하기 때문에 Many-to-one 형태인 것이 바람직하다. Since the LSTM network of the present invention predicts one data of the next day using data of the past date, it is preferable that it is a Many-to-one form.

도 9를 참조하면, LSTM 네트워크에서 입력 레이어에서 2개 시퀀스씩 히든 레이어(hidden layer)로 입력되고, 히든 레이어에서 순차적으로 전달되어 최종적으로 출력값을 출력하는 것을 확인할 수 있다. Referring to FIG. 9, it can be seen that in the LSTM network, two sequences are input from the input layer to the hidden layer, and sequentially transmitted from the hidden layer to output the output value.

도 12 및 도 13은 본 발명의 일 실시예에 따른 LSTM을 이용한 도매시장 소비 가격 예측 결과를 도시한 그래프이다. 12 and 13 are graphs showing the results of predicting the wholesale market consumption price using LSTM according to an embodiment of the present invention.

도 12의 그래프는 전술한 바와 같이, 2014년 1월 1일부터 2014년 8월 31일 까지 기간의 도매시장 소비 가격과 관련된 주별 데이터를 학습하여 예측한 결과를, 2014년 9월 1일부터 2014년 12월 31일까지의 주별 테스트(test) 데이터와 비교한 결과를 도시한 것이다. The graph of FIG. 12 shows the results obtained by learning and predicting weekly data related to the wholesale market consumption price for the period from January 1, 2014 to August 31, 2014, from September 1, 2014 to 2014 The results are compared with the weekly test data until December 31, 2016.

도 13은 도 12의 그래프에서 Reverse_min_max_scaling 함수를 사용하여 정규화된 값을 원래의 값으로 되돌린 그래프이다. 참고로, Reverse_min_max_scaling 함수에서 정규화하기 이전의 원본의 x값과 되돌리고 싶은 x값을 입력하면 역정규화된 값을 리턴한다.13 is a graph in which the normalized value is returned to the original value by using the Reverse_min_max_scaling function in the graph of FIG. 12. For reference, in the Reverse_min_max_scaling function, if you input the x value of the original before normalizing and the x value you want to return, the normalized value is returned.

도 12 및 도 13에서 빨간색이 현재 데이터를 나타낸 것이고, 파란색이 예측 데이터를 나타낸 것이다. In FIGS. 12 and 13, red represents current data, and blue represents prediction data.

도 12 및 도 13을 참조하면, 본 발명의 LSTM을 이용한 농산물 가격 및 판매량 예측 방법을 통한 예측 데이터들을 실제 데이터와 비교해 본 결과, 차이가 거의 나지 않는 것을 확인할 수 있다. Referring to FIGS. 12 and 13, it can be seen that as a result of comparing the predicted data using the LSTM of the present invention with the method for predicting the price and sales of agricultural products with actual data, there is little difference.

따라서, 본 발명에서 제안하는 농산물 가격 및 판매량 예측 방법을 활용하면, 예측된 결과를 바탕으로 농산물 생산자 및 소비자가 보다 효율적인 계획을 수립할 수 있고, 사회적으로 효율적인 자원배분이 가능할 것으로 기대해 볼 수 있다. Therefore, if the method for predicting the price and sales of agricultural products proposed by the present invention is used, it can be expected that the producers and consumers of agricultural products can establish more efficient plans and socially efficient resource allocation based on the predicted results.

이상 본 발명을 몇 가지 바람직한 실시예를 사용하여 설명하였으나, 이들 실시예는 예시적인 것이며 한정적인 것이 아니다. 본 발명이 속하는 기술분야에서 통상의 지식을 지닌 자라면 본 발명의 사상과 첨부된 특허청구범위에 제시된 권리범위에서 벗어나지 않으면서 다양한 변화와 수정을 가할 수 있음을 이해할 것이다.Although the present invention has been described above using some preferred embodiments, these embodiments are illustrative and not limiting. Those skilled in the art to which the present invention pertains will understand that various changes and modifications can be made without departing from the spirit of the present invention and the scope of the rights set forth in the appended claims.

Claims (4)

농산물 가격 및 판매량을 예측하는 장치에서의 농산물 가격 및 판매량 예측 방법에서,
농산물 가격 및 판매량에 관련된 데이터가 입력되면, 입력된 데이터를 가공하는 단계;
LSTM(Long Short-Term Memory model) 네트워크를 생성하는 단계;
상기 LSTM 네트워크에서 가공된 데이터에 대한 학습을 진행하는 단계; 및
학습된 데이터를 이용하여 상기 농산물 가격 및 판매량을 예측하는 단계를 포함하고,
상기 입력된 데이터를 가공하는 단계에서,
상기 입력된 데이터를 각 열 별로 정규화하는 단계;
정규화된 데이터들을 학습시키기 위해 입력에 대한 데이터 시퀀스와 출력에 대한 데이터 시퀀스를 생성하는 단계; 및
학습시킬 학습용 데이터셋(dataset)과, 학습된 내용을 확인할 테스트용 데이터셋을 생성하는 단계를 포함하고,
상기 LSTM 네트워크에서 가공된 데이터에 대한 학습을 진행하는 단계에서,
상기 LSTM 네트워크를 이용하여 상기 학습용 데이터셋을 학습시키고,
상기 농산물 가격 및 판매량에 관련된 데이터는 정형 데이터와 비정형 데이터로 구분되고,
상기 정형 데이터는 미리 지정된 농산물의 도매가, 소매가, 판매량 및 판매금액을 포함하고,
상기 비정형 데이터는 미리 지정된 농산물이 언급된 SNS, 뉴스 또는 방송 데이터를 포함하며,
상기 LSTM 네트워크는 저장소에 값을 저장하고, 출력하고, 망각 값을 조정하는 게이트인 메모리 셀(memory cell), 입력 값에 대한 입력 게이트(input gate), 출력 값에 대한 출력 게이트(output gate) 및 망각 값에 대한 망각 게이트(forget gate)로 구성되고,
상기 LSTM 네트워크에서 입력 데이터는 상기 농산물의 도매가, 소매가, 판매량 및 판매금액을 포함하는 정형 데이터와, 상기 농산물이 언급된 SNS, 뉴스 또는 방송 데이터를 포함하는 비정형 데이터이고, 입력 게이트에 대한 가중치는 Ui,Wi이고, 출력 게이트에 대한 가중치는 Uo,Wo,Vo이고, 망각 게이트에 대한 가중치 Uf,Wf이고, 메모리 셀(memory cell)에 대한 가중치는 Uc,Wc이고, 각 게이트의 편차 항 bi,bo,bf,bc을 사용하고, 출력 데이터는 LSTM의 출력 값 h1, h2, ..., ht이고, 입력 게이트에 대한 입출력 파라미터가 it, 출력 게이트에 대한 입출력 파라미터가 ot, 망각 게이트에 대한 입출력 파라미터가 ft, 메모리 셀에 대한 입출력 파라미터가 ct라고 할 때,
각 게이트에 대한 입출력 파라미터를,
Figure 112020501886699-pat00027

로 나타낼 수 있으며,
상기 LSTM 네트워크에서 상기 학습용 데이터셋을 학습시킴에 있어서, 그래디언트(gradient)를 결정하기 위해 오차 함수 E의 각 게이트와 내부상태의 k번째 원소에 대한 편미분을,
Figure 112020501886699-pat00028
(수학식 1)
로 계산할 수 있고,
t-1 단계로 전달되는 그래디언트를,
Figure 112020501886699-pat00029
(수학식 2)
로 나타낼 수 있고,
p 단계 앞으로 전달되는 그래디언트를,
Figure 112020501886699-pat00030
(수학식 3)
로 나타낼 수 있는 것을 특징으로 하는 농산물 가격 및 판매량 예측 방법.
In the method for predicting agricultural product prices and sales in a device for predicting agricultural product prices and sales,
If data related to agricultural product prices and sales amounts are input, processing the input data;
Creating a long short-term memory model (LSTM) network;
Progressing learning on the processed data in the LSTM network; And
And predicting the agricultural product price and sales amount using the learned data,
In the step of processing the input data,
Normalizing the input data for each column;
Generating a data sequence for the input and a data sequence for the output to train the normalized data; And
And generating a dataset for learning to be trained and a test dataset for checking the learned content,
In the step of learning the data processed in the LSTM network,
Train the training dataset using the LSTM network,
The data related to the price and sales of agricultural products are divided into structured data and unstructured data,
The structured data includes the wholesale price, retail price, sales volume, and sales amount of predetermined agricultural products,
The unstructured data includes SNS, news or broadcast data in which predetermined agricultural products are mentioned,
The LSTM network is a memory cell that is a gate for storing, outputting, and adjusting an oblivion value in a storage, an input gate for an input value, and an output gate for an output value. It consists of a forget gate for the forget value,
In the LSTM network, input data is structured data including the wholesale price, retail price, sales amount and sales amount of the agricultural product, and unstructured data including SNS, news or broadcast data in which the agricultural product is mentioned, and the weight for the input gate is U i ,W i , the weight for the output gate is U o ,W o ,V o , the weight for the oblivion gate is U f ,W f , the weight for the memory cell is U c ,W c , Use the deviation term b i ,b o ,b f ,b c of each gate, and the output data are the output values h 1 , h 2 , ..., h t of LSTM, and the input/output parameters for the input gate are i t , the input/output parameter to the output gate is o t , the input/output parameter to the oblivion gate is f t , and the input/output parameter to the memory cell is c t ,
Input and output parameters for each gate,
Figure 112020501886699-pat00027

Can be represented by
In learning the data set for learning in the LSTM network, in order to determine the gradient, the partial differential for each gate of the error function E and the kth element of the internal state,
Figure 112020501886699-pat00028
(Equation 1)
Can be calculated as
The gradient delivered in step t-1,
Figure 112020501886699-pat00029
(Equation 2)
Can be represented by
the gradient passed to the p level,
Figure 112020501886699-pat00030
(Equation 3)
Farming prices and sales forecasting method characterized in that it can be represented by.
삭제delete 삭제delete 삭제delete
KR1020180115592A 2018-09-28 2018-09-28 Method for predicting price of agricultural product and sales volume using Long Short-Term Memory KR102137583B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180115592A KR102137583B1 (en) 2018-09-28 2018-09-28 Method for predicting price of agricultural product and sales volume using Long Short-Term Memory

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180115592A KR102137583B1 (en) 2018-09-28 2018-09-28 Method for predicting price of agricultural product and sales volume using Long Short-Term Memory

Publications (2)

Publication Number Publication Date
KR20200036219A KR20200036219A (en) 2020-04-07
KR102137583B1 true KR102137583B1 (en) 2020-07-24

Family

ID=70291111

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180115592A KR102137583B1 (en) 2018-09-28 2018-09-28 Method for predicting price of agricultural product and sales volume using Long Short-Term Memory

Country Status (1)

Country Link
KR (1) KR102137583B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418952A (en) * 2020-12-14 2021-02-26 盐城志娟网络科技有限公司 Agricultural product market price early warning management cloud computing platform based on big data analysis
KR102599136B1 (en) 2023-01-03 2023-11-03 손효상 Method and system for predicting price of agricultrual product based on transformer model
KR102634529B1 (en) 2023-05-24 2024-02-07 주식회사 온투인 Agricultural Price Prediction Apparatus Using Multi-Step Time Series Forecasting and Method for Predicting Agricultural Product Price Using the Same
KR102647967B1 (en) 2023-07-19 2024-03-15 주식회사 미스터아빠 Direct ransaction paltform system based on demand forecasting

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102209055B1 (en) 2020-05-25 2021-01-28 주식회사 프레시앤텍 Regional food material supply and demand analysis system using food material transaction data, and method thereof
KR102438923B1 (en) * 2020-10-14 2022-09-01 고려대학교 세종산학협력단 Deep Learning based Bitcoin Block Data Prediction System Considering Characteristics of Time-Series Distribution
KR20240108156A (en) 2023-01-01 2024-07-09 안희태 A mobile facility fixed by the weight of a car
CN116777507B (en) * 2023-06-23 2024-05-28 青岛中沃兴牧食品科技有限公司 Method for predicting sales of various pork in pork monopoly website based on LSTM model
CN117196695B (en) * 2023-11-03 2024-02-27 中国民航信息网络股份有限公司 Target product sales data prediction method and device

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101764147B1 (en) 2014-09-26 2017-08-02 한국교통대학교산학협력단 Online Agricultural Price Prediction Method and System
KR20140139466A (en) * 2014-11-12 2014-12-05 변동삼 automatic sales forecasting system based on data crawling and manager's input

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
웹블로그. LSTM RNN을 이용하여 아마존 주가 예측하기(2017.12.10.)*
임진모 외 3인. 인공지능을 이용한 과일 가격 예측 모델 연구. The Journal of the Convergence on Culture Technology(2018.05.31.)*

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418952A (en) * 2020-12-14 2021-02-26 盐城志娟网络科技有限公司 Agricultural product market price early warning management cloud computing platform based on big data analysis
KR102599136B1 (en) 2023-01-03 2023-11-03 손효상 Method and system for predicting price of agricultrual product based on transformer model
KR102634529B1 (en) 2023-05-24 2024-02-07 주식회사 온투인 Agricultural Price Prediction Apparatus Using Multi-Step Time Series Forecasting and Method for Predicting Agricultural Product Price Using the Same
KR102647967B1 (en) 2023-07-19 2024-03-15 주식회사 미스터아빠 Direct ransaction paltform system based on demand forecasting

Also Published As

Publication number Publication date
KR20200036219A (en) 2020-04-07

Similar Documents

Publication Publication Date Title
KR102137583B1 (en) Method for predicting price of agricultural product and sales volume using Long Short-Term Memory
El Aissaoui et al. A multiple linear regression-based approach to predict student performance
CN109767032A (en) A kind of business finance operation digital management optimization system based on data analysis
Tsang et al. Gaussian processes for daily demand prediction in tourism planning
Wang et al. Solar flare forecasting model supported with artificial neural network techniques
Saha et al. Demand forecasting of a multinational retail company using deep learning frameworks
TW202242727A (en) Conditional parameter optimization method & system
Kaninde et al. Stock price prediction using facebook prophet
Bansal et al. Empirical analysis of regression techniques by house price and salary prediction
Zhang Prediction of Purchase Volume of Cross‐Border e‐Commerce Platform Based on BP Neural Network
Atmaja et al. Implementation of artificial neural network on sales forecasting application
Wu et al. Bayesian non-parametric method for decision support: Forecasting online product sales
Kaewchada et al. Random forest model for forecasting vegetable prices: a case study in Nakhon Si Thammarat Province, Thailand
Pundir et al. Machine learning for revenue forecasting: A case study in retail business
Sallehuddin et al. Hybrid grey relational artificial neural network and auto regressive integrated moving average model for forecasting time-series data
Cui et al. A novel attLSTM framework combining the attention mechanism and bidirectional LSTM for demand forecasting
Falah et al. Price Prediction Model for Red and Curly Red Chilies using Long Short Term Memory Method
CN114820082A (en) Consumption amount prediction method and device, computer equipment and storage medium
Lee et al. A hybrid machine learning approach for customer loyalty prediction
Nagashima et al. Data Imputation Method based on Programming by Example: APREP-S
Shirota et al. Performance analysis of Japanese manufacturing industry before and after Lehman shock
Holderbaum et al. Short Term Load Forecasting (STLF)
Satapathy Effort estimation methods in software development using machine learning algorithms
Zu et al. A multi-factor customer classification evaluation model
Paklin et al. Using Loginom Low-Code Platform for the Modeling of LTV Site Subscriber

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant