KR102471743B1 - 스마트팜의 미래 생산량 예측 방법 - Google Patents

스마트팜의 미래 생산량 예측 방법 Download PDF

Info

Publication number
KR102471743B1
KR102471743B1 KR1020200152205A KR20200152205A KR102471743B1 KR 102471743 B1 KR102471743 B1 KR 102471743B1 KR 1020200152205 A KR1020200152205 A KR 1020200152205A KR 20200152205 A KR20200152205 A KR 20200152205A KR 102471743 B1 KR102471743 B1 KR 102471743B1
Authority
KR
South Korea
Prior art keywords
production
correlation coefficient
calculated
parking
parking lot
Prior art date
Application number
KR1020200152205A
Other languages
English (en)
Other versions
KR20220065557A (ko
Inventor
김만배
황인철
양동일
노희선
안용진
박천규
신동호
정정수
Original Assignee
강원대학교산학협력단
강원도
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 강원대학교산학협력단, 강원도 filed Critical 강원대학교산학협력단
Priority to KR1020200152205A priority Critical patent/KR102471743B1/ko
Publication of KR20220065557A publication Critical patent/KR20220065557A/ko
Application granted granted Critical
Publication of KR102471743B1 publication Critical patent/KR102471743B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/25Greenhouse technology, e.g. cooling systems therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Mathematical Analysis (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

스마트팜의 미래 생산량 예측 방법이 개시된다. 스마트팜의 미래 생산량 예측 방법은, 스마트팜의 생산량 데이터 및 환경 데이터를 수집하는 단계, 수집된 생산량 데이터 및 환경 데이터를 이용하여 현재 주차(Week)의 생산량과 이전 주차의 환경인자에 대한 상관계수(correlation coefficient)를 산출하고, 산출된 상관계수를 이용하여 시간차이를 산출하는 단계, 산출된 시간차이를 이용하여 초기 대응주차(CW: Corresponding Week)를 산출하는 단계, 산출된 초기 대응주차를 개선하는 단계, 개선을 통해 생성된 개선 대응주차를 이용하여 다중선형회귀(multiple linear regression) 모델을 산출하는 단계 및 다중선형회귀 모델을 이용하여 미래 생산량을 예측하는 단계를 포함한다.

Description

스마트팜의 미래 생산량 예측 방법{Method for forecasting future production of smart farms}
본 발명은 스마트팜의 미래 생산량 예측 방법에 관한 것이다.
최근, 농업과 ICT와 융합을 통해 스마트팜(Smart Farm)을 구축하여 빅데이터와 사물인터넷 기술을 활용한 농작물의 생산성과 품질향상에 주력하고 있다. 사물인터넷 기술을 활용하여 센서에서 농작물의 환경정보를 실시간으로 측정 및 모니터링하고, 최적생육관리 시스템의 구축을 통해 농작물을 자동으로 관리하여 생산성과 품질이 비약적으로 증가하였다.
일본은 식물공장에서 온도, 습도, 조도 등의 센서를 통해 수집된 온실정보를 이용하여 스케줄링 소프트웨어로 토마토의 생육환경을 제어하고, 인공광 등이 적용된 최적 재배환경을 통해 농업의 공업화를 이루고 있다.
네덜란드의 경우, 1945년 시설원예를 구축한 이래로 정밀하고 체계적인 환경조절시스템과 자동화 기술의 발전으로 생산성 향상을 이루었다. 네덜란드의 채소 수출량은 2010년 42억 유로에 달했으나, 네덜란드의 원예작물 재배면적 중 시설채소 재배면적은 2011년 3.4%(5,041ha)에 불과하다. 네덜란드는, 부족한 일조량 등의 열악한 기상환경과 부족한 노동력에도 불구하고, 토마토 생산량이 70kg/m2에 달하는 유리온실 농가가 있으며, 2000년대 후반부터 세계 토마토 수출시장에서 2위를 차지하고 있다.
한편, 한국의 경우, 정부 주도로 스마트팜의 보급과 확산이 이루어지고 있다. 현재 스마트팜은 도입 초기 단계이므로, 스마트팜에서 센서를 통해 자동적으로 수집되는 대용량의 환경정보를 이용한 작물생육 최적환경설정 모형에 대한 연구는 미미한 실정이다.
기존의 기상기후와 관련한 농작물의 생장에 대한 연구는, 표본에 대한 실험 방식과 모델링 방식으로 이루어지고 있다. 실험 방식은 특성상 온도, 습도, 광, 관수, 양액 등의 여러 환경인자에 대한 적정한 기준 범위의 결과로 한정되어 있다. 모델링 방식은 작물생육 최적환경설정 모형의 도출로 귀결되지 않는다는 점에서 스마트 시설원예를 중점으로 한 생육환경 모형에 대한 연구가 요구되고 있다. 최근에는, 스마트팜 농가에서 자동적으로 측정된 환경 데이터와 생산량 데이터를 활용하여 변수들 간의 연관성을 도출하는 통계적 기법을 통해 데이터를 분석하고, 스마트팜의 최적 토마토 생육환경인자를 도출하는 연구가 진행되고 있다.
그러나, 파프리카, 토마토 등과 같은 농작물의 환경인자를 횡적 데이터 분석 방법을 통해 분석하는 데에는 한계가 있다. 왜냐하면, 수확량과 환경정보가 시간차 없이 매칭되어 있기 때문이다. 적절한 시간차이를 고려하지 않고 데이터를 분석하면, 농작물 생육에 영향을 미치는 환경인자의 영향을 분석할 수 없다. 따라서, 환경인자에 따른 수확량 변화를 면밀히 분석하기 위해서는, 환경설정의 효과가 발생할 시간차이를 고려해야 한다.
대한민국등록특허공보 제10-1811640호(2017.12.18)
본 발명은 농작물 생장에 대한 환경설정의 영향이 환경설정 시점으로부터 일정기간 경과 후 발효됨을 고려하여 스마트팜의 농작물의 생산량과 환경인자 사이에 대한 다중선형회귀 모델을 생성하고, 생성된 다중선형회귀 모델을 이용하여 미래 생산량을 예측하는 스마트팜의 미래 생산량 예측 방법을 제공하기 위한 것이다.
본 발명의 일 측면에 따르면, 스마트팜의 미래 생산량 예측 방법이 개시된다.
본 발명의 실시예에 따른 스마트팜의 미래 생산량 예측 방법은, 상기 스마트팜의 생산량 데이터 및 환경 데이터를 수집하는 단계, 상기 수집된 생산량 데이터 및 환경 데이터를 이용하여 현재 주차(Week)의 생산량과 이전 주차의 환경인자에 대한 상관계수(correlation coefficient)를 산출하고, 상기 산출된 상관계수를 이용하여 시간차이를 산출하는 단계, 상기 산출된 시간차이를 이용하여 초기 대응주차(CW: Corresponding Week)를 산출하는 단계, 상기 산출된 초기 대응주차를 개선하는 단계, 상기 개선을 통해 생성된 개선 대응주차를 이용하여 다중선형회귀(multiple linear regression) 모델을 산출하는 단계 및 상기 다중선형회귀 모델을 이용하여 미래 생산량을 예측하는 단계를 포함한다.
상기 시간차이는, 현재 주차의 생산량에 가장 많은 영향을 주는 이전 주차와 현재 주차의 차이값이다.
상기 산출된 상관계수를 이용하여 시간차이를 산출하는 단계는, 상기 현재 주차의 생산량과 이전 주차의 환경인자에 대한 상관계수 테이블을 생성하는 단계, 상기 생성된 상관계수 테이블에서 각 열의 상관계수값들의 최대상관계수값을 산출하고, 상기 산출된 최대상관계수값의 시간차이값을 산출하는 단계 및 상기 생성된 최대상관계수 테이블에서 최대상관계수값이 미리 설정된 임계치 미만인 시간차이값 및 최대상관계수값을 제거하여 최종 최대상관계수 테이블을 생성하는 단계를 포함한다.
상기 상관계수(ρ)는 하기 수학식을 이용하여 산출된다.
Figure 112020121955504-pat00001
여기서,
Figure 112020121955504-pat00002
이고, l은 시간차이로서, l=1, 2, …, L이고, T는 전치(transpose) 행렬이고, M개의 환경인자에 각각 적용되고, D는 미리 설정된 생산구간의 주수이고, p는 생산량 데이터이고, e는 환경 데이터이고, wc는 현재 주차이다.
상기 산출된 최대상관계수값의 시간차이값을 산출하는 단계는, 하기 수학식을 이용하여 상기 상관계수 테이블의 각 열의 최대상관계수값 및 시간차이값을 산출한다.
Figure 112020121955504-pat00003
여기서, lm *은 상기 상관계수 테이블의 각 열마다 산출되는 시간차이값이고, m은 환경인자이다.
상기 초기 대응주차는 하기 수학식을 이용하여 산출된다.
Figure 112020121955504-pat00004
여기서, u는 대응주차이고, wc는 현재 주차이고, l은 시간차이이다.
상기 산출된 초기 대응주차를 개선하는 단계는, 상기 상관계수가 미리 설정된 임계치 이상인 생산량의 주차값 및 환경인자의 대응주차값을 추출하고, 상기 상관계수가 임계치 미만인 대응주차에는 이전 주차의 대응주차값을 할당하는 단계, 상기 추출 및 할당된 대응주차값을 이용하여 상기 초기 대응주차의 회귀직선과 상기 대응주차의 평균제곱오차(MSE: mean squared error)를 산출하는 단계 및 상기 평균제곱오차를 이용하여 상기 개선 대응주차를 산출하는 단계를 포함한다.
상기 평균제곱오차는 하기 수학식을 이용하여 산출된다.
Figure 112020121955504-pat00005
여기서,
Figure 112020121955504-pat00006
는 상기 회귀직선으로서, 회귀 방정식
Figure 112020121955504-pat00007
로부터
Figure 112020121955504-pat00008
를 구하여
Figure 112020121955504-pat00009
로 산출되고, u는 대응주차이고, w는 주차이고, α는 회귀 파라미터이다.
상기 개선 대응주차를 산출하는 단계는, 상기 평균제곱오차가 임계치 이하인 대응주차값을 이용하여 하기 수학식의 회귀 방정식을 산출하는 단계 및 하기 수학식을 이용하여 상기 회귀 방정식으로부터 상기 개선 대응주차(ur)를 산출하는 단계를 포함한다.
Figure 112020121955504-pat00010
Figure 112020121955504-pat00011
여기서, u는 대응주차이고, w는 주차이고, γ는 회귀 파라미터이다.
상기 다중선형회귀 모델은 하기 수학식을 이용하여 산출된다.
Figure 112020121955504-pat00012
Figure 112020121955504-pat00013
여기서, y는 주차 구간 D의 생산량이고, x는 DⅹM개의 환경 데이터이고, β는 회귀 파라미터이고,
Figure 112020121955504-pat00014
는 β의 해 값이다.
상기 다중선형회귀 모델을 이용하여 미래 생산량을 예측하는 단계는, 미래주차의 대응주차값을 조사하는 단계, 상기 다중선형회귀 모델을 이용하여 생성되는 회귀식을 이용하여 상기 미래주차의 생산량을 산출하는 단계 및 상기 산출된 미래주차의 생산량의 평균값을 평당생산량으로 산출하여 상기 미래 생산량을 예측하는 단계를 포함한다.
상기 미래주차의 대응주차값을 조사하는 단계는, 환경인자별 대응주차값이 적어도 한 개가 현재 주차보다 큰 미래 주차에 대해서 생산량 예측을 수행하지 않는다.
상기 다중선형회귀 모델을 이용하여 생성되는 상기 회귀식은 하기 수학식으로 나타내어진다.
Figure 112020121955504-pat00015
여기서, pw는 생산량이고,
Figure 112020121955504-pat00016
은 m번째 환경 데이터이고, um은 대응주차이다.
본 발명의 실시예에 따른 스마트팜의 미래 생산량 예측 방법은, 농작물 생장에 대한 환경설정의 영향이 환경설정 시점으로부터 일정기간 경과 후 발효됨을 고려하여 스마트팜의 농작물의 생산량과 환경인자 사이에 대한 다중선형회귀 모델을 생성하고, 생성된 다중선형회귀 모델을 이용하여 미래 생산량을 예측할 수 있다.
도 1은 본 발명의 실시예에 따른 스마트팜의 미래 생산량 예측 방법을 나타낸 흐름도.
도 2 내지 도 14는 본 발명의 실시예에 따른 스마트팜의 미래 생산량 예측 방법을 설명하기 위한 도면.
본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "구성된다" 또는 "포함한다" 등의 용어는 명세서상에 기재된 여러 구성 요소들, 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
이하, 본 발명의 다양한 실시예들을 첨부된 도면을 참조하여 상술하겠다.
도 1은 본 발명의 실시예에 따른 스마트팜의 미래 생산량 예측 방법을 나타낸 흐름도이고, 도 2 내지 도 14는 본 발명의 실시예에 따른 스마트팜의 미래 생산량 예측 방법을 설명하기 위한 도면이다. 이하, 도 1을 중심으로, 본 발명의 실시예에 따른 스마트팜의 미래 생산량 예측 방법에 대하여 설명하되, 도 2 내지 도 14를 참조하기로 한다.
S100 단계에서, 생산량 데이터 및 환경 데이터를 수집한다.
도 2는 생산량 데이터와 환경 데이터의 주차(Week) 관련성을 보여준다. 도 2를 참조하면, 농작물을 심는 것이 시작되는 주를 1주라 하면, W1 주차까지 M개의 환경 데이터가 획득될 수 있다. 농작물 생산은 Ws 주차부터 시작되어 W2 주차까지 생산량이 주 단위로 측정될 수 있다.
예를 들어, 환경 데이터는 내부온도, 외부온도, 내부습도, 누적일사량, 전기전도도(EC: Electrica; Conductivity), 광량, 이산화탄소(CO2), 적정온도 상한, 적정온도 하한 및 주야간 온도차(DIF)를 포함할 수 있다.
도 3은 1주차부터 20주차까지 주 단위로 측정된 환경 데이터들의 예를 나타낸다. 도 3에서 1부터 10까지의 열번호 각각에 대응하는 환경인자는 내부온도, 외부온도, 내부습도, 누적일사량, 전기전도도(EC: Electrica; Conductivity), 광량, 이산화탄소(CO2), 적정온도 상한, 적정온도 하한 및 주야간 온도차(DIF)이다.
본 명세서에서, 사용된 생산량 데이터와 환경 데이터는 강원도 농업기술원이 수집한 강원도에 소재한 한 스마트팜 농가의 파프리카에 대한 것이다.
주차마다 D 구간의 생산량 데이터 p 및 환경 데이터 e가 주어진다. D는 보통 8~12주 정도로 설정될 수 있다. 현재 주차가 wc라고 하면,
Figure 112020121955504-pat00017
이고, 환경 데이터 e는 wc의 이전 주차에서 모두 획득된다.
Figure 112020121955504-pat00018
이고,
Figure 112020121955504-pat00019
이다.
생산량 데이터는 Dⅹ1 벡터이고, 환경 데이터는 M개이므로, DⅹM의 행렬로 표현될 수 있다.
S200 단계에서, 현재 주차의 생산량과 이전 주차의 환경인자에 대한 상관계수(correlation coefficient)값을 산출하고, 산출된 상관계수값을 이용하여 시간차이값을 산출한다.
도 4는 S200단계의 세부단계를 나타내 흐름도이다. 이하, 도 4를 참조하여 S200 단계에 대하여 설명하기로 한다.
S210 단계에서, 현재 주차의 생산량과 이전 주차의 환경인자에 대한 상관계수 테이블을 생성한다.
S200단계는, 구간
Figure 112020121955504-pat00020
의 생산량이 영향을 가장 많이 받는 환경인자값의 주차를 조사하기 위하여 수행되는 것이다. 도 2를 참조하면, 현재 주차
Figure 112020121955504-pat00021
이며, M개의 환경인자가 존재하고, 각각의 환경인자는 다른 주차의 생산량에 영향을 줄 수 있다. 그래서, 이전 주차와 현재 주차와의 시간차이(lag) 개념을 도입하여 통계적인 자료분석을 위한 상관계수가 정의될 수 있다.
상관계수 도출을 위하여, 응답변수 y 및 설명변수 x는 하기 수학식으로 정의될 수 있다.
[수학식 1]
Figure 112020121955504-pat00022
여기서, l=1, 2, …, L이고, T는 전치(transpose) 행렬이고, M개의 환경인자에 각각 적용될 수 있다.
즉, 응답변수 y에는 생산량 데이터 p가 대입되고, 설명변수 x에는 시간차이 l만큼의 지연된 환경 데이터 e가 대입될 수 있다.
y에는 현재 주차 wc의 생산량 데이터 및 이전 D-1 주차동안의 생산량 데이터가 대입될 수 있다. 예를 들어, 7주전의 m번째 환경인자 em은 wc-7로서, 시간차이값이 7이 될 수 있다.
상관계수 ρ는 하기 수학식으로 정의될 수 있다.
[수학식 2]
Figure 112020121955504-pat00023
즉, 각 주차별로 상관계수 ρ값을 산출하여 LⅹM의 상관계수 테이블을 생성할 수 있다.
S220 단계에서, 생성된 상관계수 테이블에서 각 열의 상관계수값들의 최대상관계수값을 산출하고, 산출된 최대상관계수값의 시간차이값을 산출한다.
즉, 하기 수학식을 이용하여 가장 큰 상관계수값을 가지는 l값을 산출할 수 있다.
[수학식 3]
Figure 112020121955504-pat00024
여기서, m은 환경인자이다.
그리고, 각 열마다 산출되는 시간차이값 lm * 및 최대상관계수값 ρmax가 2ⅹM 행렬로 구성되는 최대상관계수 테이블을 생성한다. 즉, 1행에는 시간차이값들이 배열되고, 2행에는 최대상관계수값들이 배열될 수 있다.
S230 단계에서, 생성된 최대상관계수 테이블에서 최대상관계수값 ρmax이 미리 설정된 임계치(예를 들어, 0.3~0.4) 미만인 시간차이값 및 최대상관계수값을 제거하여 최종 최대상관계수 테이블을 생성한다. 생성되는 최종 최대상관계수 테이블은 2ⅹN 행렬로 구성될 수 있으며, N ≤ M이다.
생산량 데이터가 존재하는 모든 주차에 대하여 최종 최대상관계수 테이블을 생성하여, 도 5 및 도 6에 도시된 바와 같은 주차별 시간차이값 및 최대상관계수값을 산출할 수 있다.
도 5 및 도 6은 각각 주차별 생산량과 환경인자의 시간차이값 및 최대 상관계수값의 산출 예를 나타낸다. 예를 들어, 도 5를 참조하면, 22주차의 경우, 생산량은 각 환경인자가 5, 6, 5, 8, 4, 5, 1, 5, 4 전주에 대응한다.
다시 도 1을 참조하여, S300 단계에서, 산출된 시간차이값을 이용하여 초기 대응주차(cw: corresponding week)를 산출한다.
시간차이는 현재 주차와 이전 주차와의 차이값으로 표현되는데, 대응주차 u는 하기 수학식으로 산출된다.
[수학식 4]
Figure 112020121955504-pat00025
예를 들어, 현재 주차 wc가 23주이고, 시간차이 l이 7주전이면, 대응주차는 u=23-7=16이 된다.
도 7의 (a) 내지 (c)는 각각 환경인자가 내부온도, 이산화탄소 및 내부습도인 경우에 산출된 대응주차값을 나타낸 그래프이다.
S400 단계에서, 산출된 초기 대응주차를 개선한다.
앞서 상관계수를 이용하여 산출한 초기 대응주차는 주차별 값의 오류가 발생할 수 있다. 즉, 대응주차는 주차에 비례하여 단조증가(monotonically increasing)하는 형태로 산출되는 것이 이상적일 수 있다.
예를 들어, 도 7의 (a)를 참조하면, 18주차, 20주차 및 26주차는 각각 18주차, 18주차 및 14주차로 매칭되어 감소하는 구간이 존재하므로, 대응주차의 오류가 발생할 수 있다.
도 8은 S400단계의 세부단계를 나타내 흐름도이다. 이하, 도 8을 참조하여 S400 단계에 대하여 설명하기로 한다.
S410 단계에서, 주차 및 대응주차 데이터를 보정한다.
[Ws, W2] 구간에서 생산량 P개의 주차 w1, w2, …, wp가 있고, 각 환경인자에 대한 초기 대응주차 u1, u2, …, up가 있다. wi는 ui와 매칭되며, (wi, ui)는 상관계수 ρi를 가진다.
앞서 S200 단계에서 산출된 초기 상관계수값이 미리 설정된 임계치(예를 들어, 0.3) 이상인 생산량의 주차 및 환경인자의 대응주차 (wi, ui)를 추출하고, 초기 상관계수값이 임계치 미만인 대응주차에는 이전 주차의 대응주차값을 할당한다(ui = ui-1).
결과적으로, P개의 데이터 [(w1, u1), (w2, u2), …, (wp, up)]가 획득될 수 있다.
S420 단계에서, 대응주차의 회귀직선과 대응주차의 평균제곱오차(MSE: mean squared error)를 산출한다.
대응주차의 회귀 방정식은 하기 수학식으로 나타낼 수 있다.
[수학식 5]
Figure 112020121955504-pat00026
여기서, 대응주차 u는 Pⅹ1 벡터이고, 주차 w는 Pⅹ1 행렬이고, 회귀 파라미터 α는 2ⅹ1 벡터이다.
수학식 5의 회귀 방정식으로부터
Figure 112020121955504-pat00027
를 구하면, 회귀 직선은 하기 수학식으로 나타낼 수 있다.
[수학식 6]
Figure 112020121955504-pat00028
그리고, 회귀 직선과 대응주차의 평균제곱오차(MSE)는 하기 수학식으로 산출될 수 있다.
[수학식 7]
Figure 112020121955504-pat00029
S430 단계에서, 회귀 직선과 대응주차의 평균제곱오차(MSEi)를 이용하여 개선된 대응주차를 산출한다.
우선, 하기 수학식과 같이, 평균제곱오차(MSEi)가 미리 설정된 임계치 Tc 이하인 대응주차들을 이용하여 회귀방정식을 생성한다.
[수학식 8]
Figure 112020121955504-pat00030
여기서, 평균제곱오차가 임계치 이하인 대응주차값의 수가 G개라 가정하면, 대응주차 u는 Gⅹ1 벡터이고, 주차 w는 Gⅹ1 벡터이고, 회귀 파라미터 γ는 2ⅹ1 벡터이다.
수학식 8의 회귀 방정식으로부터 하기 수학식과 같이 회귀 직선을 산출한다.
[수학식 9]
Figure 112020121955504-pat00031
이를 통해, 최종적으로 개선된 대응주차 ur이 획득될 수 있다.
도 9는 (a) 내지 (c)는 각각 환경인자가 내부온도, 이산화탄소 및 내부습도인 경우에 산출된 개선된 대응주차값을 나타낸 그래프이다. 도 9에 도시된 바와 같이, 개선된 대응주차값들은 단조증가하는 것으로 나타난다.
다시 도 1을 참조하여, S500 단계에서, 개선된 대응주차값을 이용하여 다중선형회귀(multiple linear regression) 모델을 산출한다.
다중선형회귀 모델은 하기 수학식으로 정의될 수 있다.
[수학식 10]
Figure 112020121955504-pat00032
여기서, y는 주차 구간 D의 생산량이고, 각 환경인자는 서로 다른 대응주차를 가지므로, X는 대응주차를 가지는 환경 데이터값이다. 그리고, β는 회귀 파라미터이다.
다중선형회귀 분석에서 종속변수인 생산량 변수 y를 설명하기 위하여 M개의 독립변수인 x1, x2, …, xM을 도입하면, 생산량 y는 하기 수학식으로 나타낼 수 있다.
[수학식 11]
Figure 112020121955504-pat00033
그리고, 독립변수 x는 하기 수학식으로 나타낼 수 있다.
[수학식 12]
Figure 112020121955504-pat00034
x는 M개의 환경인자이고, 각 열은 D개의 환경 데이터이다. 각 데이터는 대응주차를 가지는 값들이다.
그리고, 회귀 파라미터 β는 하기 수학식으로 나타낼 수 있다.
[수학식 13]
Figure 112020121955504-pat00035
여기서, β0는 절편(offset)값이다.
하기 수학식을 이용하여 해 β값이 결정될 수 있다.
[수학식 14]
Figure 112020121955504-pat00036
[수학식 15]
Figure 112020121955504-pat00037
도 10은 회귀 파라미터 β값을 이용하여 산출되는 다중선형회귀 모델의 예를 나타낸다. 즉, 도 10은 17~35주차에서 생산량에 영향을 주는 환경인자와 평당생산량의 관계식의 예를 보여주고 있다.
예를 들어, 도 10에서 23주차의 다중선형회귀 모델은 다음과 같이 나타낼 수 있다.
[수학식 16]
Figure 112020121955504-pat00038
[수학식 17]
Figure 112020121955504-pat00039
즉, 23주차의 파프리카 생산량은 수확 5주전의 누적일사량, 수확 4주전의 광량, 수확 3주전의 외부온도, 수확 1주전의 이산화탄소, 수확 4주전의 주야간 온도차(DIF)의 영향을 받은 것이다.
S600 단계에서, 생산량에 영향을 주는 환경인자와 평당생산량의 관계를 나타내는 다중선형회귀 모델을 이용하여 미래 생산량을 예측한다.
도 11을 참조하면, 미래 생산량 예측은 현재 주차 wc에서 미래 주차 wf의 생산량을 예측하는 것이다.
Figure 112020121955504-pat00040
와 같이 I개의 미래 주차가 있다고 가정하면, 미리 생산량 예측에는 현재 주차 wc와 이전 주차의 환경 데이터가 필요하다. 이전 주차는
Figure 112020121955504-pat00041
로 J개가 있다고 가정한다.
앞서 산출한 β값들로 구성되는 베타 테이블(BetaTable)을 기반으로 미래 생산량을 예측할 수 있다. 여기서, 베타 테이블은 (W2-Ws)ⅹ(M+1) 행렬이다.
그리고, 출력으로 예측된 평당생산량을 저장하는 Iⅹ1 벡터의 PROD, 같은 크기의 누적 벡터(ACC: Accumulation vector)가 사용된다. 초기에는 모든 셀 값이 0으로 설정된다.
특정 현재 주차 wc에서는 현재 주차 wc 및 J개의 이전 주차 wp가 있다. 현재 주차 wc는 1개이므로, 총 J+1개의 환경 데이터가 준비될 수 있다.
도 12는 S600단계의 세부단계를 나타내 흐름도이다. 이하, 도 12를 참조하여 S600 단계에 대하여 설명하기로 한다.
S610 단계에서, 미래주차의 대응주차값을 조사한다.
미래 주차 wf의 생산량을 산출하기 위하여, I개의 미래 주차가 있는데, 각 미래 주차 wf의 대응주차를 조사한다. 환경인자별 대응주차값이 단 한 개라도 현재 주차 wc보다 큰 미래 주차에 대해서는 생산량 예측을 하지 않는다. 반대로, 환경인자별 대응주차값이 모두 현재 주차 이하인 미래 주차에 대해서는 다중선형회귀 모델을 이용하여 생산량을 산출한다.
S620 단계에서, 회귀식을 이용하여 미래주차의 생산량을 산출한다.
다중선형회귀 모델을 이용하여 생성되는 하기 수학식을 이용하여 모든 미래 주차 wf에 대하여 생산량 p의 예측값을 산출한다.
[수학식 17]
Figure 112020121955504-pat00042
여기서,
Figure 112020121955504-pat00043
은 m번째 환경 데이터이고, um은 대응주차이고, pw는 Dⅹ1 벡터이다.
도 13은 생산량을 저장하는 PROD 메모리 및 누적개수를 저장하는 ACC 메모리의 구조를 나타낸다.
수학식 17을 이용하여 산출된 생산량 pw는 PROD 메모리에 저장된다. 즉, 구간 D에서 예측된 생산량 pw의 값은 PROD 메모리의 해당 셀에 더해지고, 더해질 때마다 ACC 메모리의 해당 셀의 값은 1씩 증가시킨다.
S630 단계에서, 산출된 미래주차의 생산량의 평균값을 평당생산량으로 산출하여 미래 생산량을 예측한다.
도 13의 PROD 메모리 및 ACC 메모리를 이용하면, 하기 수학식을 이용하여 평당생산량을 산출할 수 있다.
[수학식 18]
Figure 112020121955504-pat00044
도 14는 평당생산량의 실제값과 예측값을 비교하여 나타낸 그래프이다. 도 14에 도시된 바와 같이, 예측값이 실제값과 대체적으로 유사한 경향을 나타냄을 알 수 있다.
상기한 본 발명의 실시예는 예시의 목적을 위해 개시된 것이고, 본 발명에 대한 통상의 지식을 가지는 당업자라면 본 발명의 사상과 범위 안에서 다양한 수정, 변경, 부가가 가능할 것이며, 이러한 수정, 변경 및 부가는 하기의 특허청구범위에 속하는 것으로 보아야 할 것이다.

Claims (13)

  1. 컴퓨팅 디바이스에 의해 수행되는 스마트팜의 미래 생산량 예측 방법에 있어서,
    상기 스마트팜의 생산량 데이터 및 환경 데이터를 수집하는 단계;
    상기 수집된 생산량 데이터 및 환경 데이터를 이용하여 현재 주차(Week)의 생산량과 이전 주차의 환경인자에 대한 상관계수(correlation coefficient)를 산출하고, 상기 산출된 상관계수를 이용하여 현재 주차의 생산량에 가장 많은 영향을 주는 환경인자를 가진 이전 주차와 현재 주차의 차이값인 시간차이값을 산출하는 단계;
    상기 산출된 시간차이값을 이용하여 현재 주차에 대응하는 이전 주차인 제1 대응주차(CW: Corresponding Week)를 산출하는 단계;
    상기 산출된 제1 대응주차를 보정하여 제2 대응주차를 산출하는 단계;
    상기 산출된 제2 대응주차를 이용하여 생산량에 영향을 주는 환경인자와 생산량의관계를 나타내는 다중선형회귀(multiple linear regression) 모델을 산출하는 단계; 및
    상기 다중선형회귀 모델을 이용하여 미래 생산량을 예측하는 단계를 포함하되,
    상기 산출된 상관계수를 이용하여 현재 주차의 생산량에 가장 많은 영향을 주는 환경인자를 가진 이전 주차와 현재 주차의 차이값인 시간차이값을 산출하는 단계는,
    상기 현재 주차의 생산량과 이전 주차의 환경인자에 대한 상관계수 테이블을 생성하는 단계;
    상기 생성된 상관계수 테이블에서 각 열의 상관계수값들의 최대상관계수값을 산출하고, 상기 산출된 최대상관계수값을 이용하여 상기 시간차이값을 산출하는 단계; 및
    상기 생성된 최대상관계수 테이블에서 최대상관계수값이 미리 설정된 임계치 미만인 시간차이값 및 최대상관계수값을 제거하여 최종 최대상관계수 테이블을 생성하는 단계를 포함하는 것을 특징으로 하는 스마트팜의 미래 생산량 예측 방법.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 상관계수(ρ)는 하기 수학식을 이용하여 산출되는 것을 특징으로 하는 스마트팜의 미래 생산량 예측 방법.
    Figure 112022098944675-pat00045

    여기서,
    Figure 112022098944675-pat00046
    이고, l은 시간차이로서, l=1, 2, …, L이고, T는 전치(transpose) 행렬이고, M개의 환경인자에 각각 적용되고, D는 미리 설정된 생산구간의 주수이고, p는 생산량 데이터이고, e는 환경 데이터이고, wc는 현재 주차임
  5. 제1항에 있어서,
    상기 산출된 최대상관계수값을 이용하여 상기 시간차이값을 산출하는 단계는,
    하기 수학식을 이용하여 상기 상관계수 테이블의 각 열의 최대상관계수값 및 시간차이값을 산출하는 것을 특징으로 하는 스마트팜의 미래 생산량 예측 방법.
    Figure 112022098944675-pat00047

    여기서, lm *은 상기 상관계수 테이블의 각 열마다 산출되는 시간차이값이고, m은 환경인자이고, ρ는 현재 주차의 생산량과 이전 주차의 환경인자에 대한 상관계수이고, M은 환경인자의 개수임
  6. 제1항에 있어서,
    상기 제1 대응주차는 하기 수학식을 이용하여 산출되는 것을 특징으로 하는 스마트팜의 미래 생산량 예측 방법.
    Figure 112022098944675-pat00048

    여기서, u는 제1 대응주차이고, wc는 현재 주차이고, l은 시간차이임
  7. 제1항에 있어서,
    상기 산출된 제1 대응주차를 보정하여 제2 대응주차를 산출하는 단계는,
    상기 상관계수가 미리 설정된 임계치 이상인 생산량의 주차값 및 환경인자의 대응주차값을 추출하고, 상기 상관계수가 임계치 미만인 대응주차에는 이전 주차의 대응주차값을 할당하는 단계;
    상기 추출 및 할당된 대응주차값을 이용하여 상기 제1 대응주차의 회귀직선과 상기 대응주차의 평균제곱오차(MSE: mean squared error)를 산출하는 단계; 및
    상기 평균제곱오차를 이용하여 상기 제2 대응주차를 산출하는 단계를 포함하는 것을 특징으로 하는 스마트팜의 미래 생산량 예측 방법.
  8. 제7항에 있어서,
    상기 평균제곱오차는 하기 수학식을 이용하여 산출되는 것을 특징으로 하는 스마트팜의 미래 생산량 예측 방법.
    Figure 112022098944675-pat00049

    여기서,
    Figure 112022098944675-pat00050
    는 상기 회귀직선으로서, 회귀 방정식
    Figure 112022098944675-pat00051
    로부터
    Figure 112022098944675-pat00052
    를 구하여
    Figure 112022098944675-pat00053
    로 산출되고, u는 대응주차이고, w는 주차이고, α는 회귀 파라미터이고,
    Figure 112022098944675-pat00075
    는 2ⅹ1 벡터로 산출된 회귀 파라미터의 해 값임
  9. 제7항에 있어서,
    상기 평균제곱오차를 이용하여 상기 제2 대응주차를 산출하는 단계는,
    상기 평균제곱오차가 임계치 이하인 대응주차값을 이용하여 하기 수학식의 회귀 방정식을 산출하는 단계; 및
    Figure 112022098944675-pat00054

    여기서, u는 대응주차이고, w는 주차이고, γ는 회귀 파라미터임
    하기 수학식을 이용하여 상기 회귀 방정식으로부터 상기 제2 대응주차(ur)를 산출하는 단계를 포함하는 것을 특징으로 하는 스마트팜의 미래 생산량 예측 방법.
    Figure 112022098944675-pat00055

  10. 제1항에 있어서,
    상기 다중선형회귀 모델은 하기 수학식을 이용하여 산출되는 것을 특징으로 하는 스마트팜의 미래 생산량 예측 방법.
    Figure 112020121955504-pat00056

    Figure 112020121955504-pat00057

    여기서, y는 주차 구간 D의 생산량이고, x는 DⅹM개의 환경 데이터이고, β는 회귀 파라미터이고,
    Figure 112020121955504-pat00058
    는 β의 해 값임
  11. 제1항에 있어서,
    상기 다중선형회귀 모델을 이용하여 미래 생산량을 예측하는 단계는,
    미래주차의 생산량에 영향을 주는 환경인자를 가진 현재 주차 또는 이전 주차인 제3 대응주차를 조사하는 단계;
    상기 다중선형회귀 모델을 이용하여 생성되는 회귀식을 이용하여 상기 미래주차의 생산량을 산출하는 단계; 및
    상기 산출된 미래주차의 생산량의 평균값을 평당생산량으로 산출하여 상기 미래 생산량을 예측하는 단계를 포함하는 것을 특징으로 하는 스마트팜의 미래 생산량 예측 방법.
  12. 제11항에 있어서,
    상기 제3 대응주차를 조사하는 단계는,
    환경인자별 대응주차가 적어도 한 개가 현재 주차보다 큰 미래 주차에 대해서 생산량 예측을 수행하지 않는 것을 특징으로 하는 스마트팜의 미래 생산량 예측 방법.
  13. 제11항에 있어서,
    상기 다중선형회귀 모델을 이용하여 생성되는 상기 회귀식은 하기 수학식으로 나타내어지는 것을 특징으로 하는 스마트팜의 미래 생산량 예측 방법.
    Figure 112022098944675-pat00059

    여기서, pw는 생산량이고,
    Figure 112022098944675-pat00060
    은 m번째 환경 데이터이고, um은 대응주차이고,
    Figure 112022098944675-pat00076
    ,…,
    Figure 112022098944675-pat00077
    은 상기 다중선형회귀 모델의 회귀 파라미터(β)의 해 값임
KR1020200152205A 2020-11-13 2020-11-13 스마트팜의 미래 생산량 예측 방법 KR102471743B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200152205A KR102471743B1 (ko) 2020-11-13 2020-11-13 스마트팜의 미래 생산량 예측 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200152205A KR102471743B1 (ko) 2020-11-13 2020-11-13 스마트팜의 미래 생산량 예측 방법

Publications (2)

Publication Number Publication Date
KR20220065557A KR20220065557A (ko) 2022-05-20
KR102471743B1 true KR102471743B1 (ko) 2022-11-29

Family

ID=81798621

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200152205A KR102471743B1 (ko) 2020-11-13 2020-11-13 스마트팜의 미래 생산량 예측 방법

Country Status (1)

Country Link
KR (1) KR102471743B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240068440A (ko) 2022-11-10 2024-05-17 강원특별자치도 인공신경망 및 선형 회귀를 이용한 작물 생산량 예측방법
CN118427495B (zh) * 2024-07-04 2024-09-10 武汉上成生物科技有限公司 一种基于大数据的产物含量预测方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101811640B1 (ko) * 2016-08-03 2017-12-26 한국과학기술연구원 기계학습을 이용한 작물의 생산량 예측장치 및 방법
KR102093544B1 (ko) * 2018-02-07 2020-04-28 이화여자대학교 산학협력단 곡물 생산량 예측 방법 및 장치

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190063410A (ko) * 2017-11-29 2019-06-07 (주) 한국인프라 주산지 작물의 생산량 예측 방법 및 그 방법을 수행하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101811640B1 (ko) * 2016-08-03 2017-12-26 한국과학기술연구원 기계학습을 이용한 작물의 생산량 예측장치 및 방법
KR102093544B1 (ko) * 2018-02-07 2020-04-28 이화여자대학교 산학협력단 곡물 생산량 예측 방법 및 장치

Also Published As

Publication number Publication date
KR20220065557A (ko) 2022-05-20

Similar Documents

Publication Publication Date Title
EP3534689B1 (en) Controlling agricultural production areas
KR101811640B1 (ko) 기계학습을 이용한 작물의 생산량 예측장치 및 방법
KR102471743B1 (ko) 스마트팜의 미래 생산량 예측 방법
US20150234785A1 (en) Prediction apparatus and method for yield of agricultural products
KR20180086738A (ko) 작물 재배 가이드 정보 제공 장치, 및 그 방법
KR20180022159A (ko) 기계학습을 이용한 양액제어장치 및 방법
CN117036088A (zh) 一种ai识别绿化植物生长态势的数据采集分析方法
KR20200017054A (ko) 스마트 팜 데이터 통합 수집/분석 및 모니터링/제어/예측 시스템과 그 방법
CN117391482B (zh) 一种基于大数据监测的大棚温度智能预警方法及系统
KR20190100541A (ko) 데이터 분석 기법을 이용한 스마트 팜 관리 시스템
AU2023203307A1 (en) Controlling Agricultural Production Areas
CN116578047B (zh) 一种用于辣椒生产的精细化智能控制方法及系统
CN116451823A (zh) 一种基于气象主控因子的苹果产量预测方法
CN118044456A (zh) 一种基于物联网的智能农业监测系统
KR20210083708A (ko) 기상정보를 이용한 토양수분 예측 시스템
KR102471742B1 (ko) 스마트팜의 생산량과 환경에 대한 최적선형모델 구축 방법
JP2022136058A (ja) 農作物の生産成績を予測する予測モデルの生成方法、生成装置、及び生成プログラム
CN116579873A (zh) 基于高温干旱气象评估作物灾害减产情况的方法及系统
WO2023035066A1 (en) Soil property model using measurements of properties of nearby zones
JP7416394B2 (ja) 作付スケジュール算出装置、作付スケジュール算出プログラム、及び、作付スケジュール算出方法
JP2022136056A (ja) 農作物の生産成績を予測する予測方法、予測装置、及び予測プログラム
KR20220144218A (ko) 딥러닝 예측 모델을 이용하여 농작물의 누적 수확량을 예측하기 위한 장치 및 그 방법
JP2021174062A (ja) 機械学習プログラム、機械学習方法および機械学習装置
Verdugo-Vásquez et al. Assessment of an empirical spatio-temporal model of the grapevine phenology at the within-field scale
KR102575549B1 (ko) 스마트팜의 생산성을 높이는 최적의 작물 재배 레시피 개발방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant