KR102668766B1 - 상품 수요예측 모델 생성방법 및 이를 이용하여 상품의 수요를 예측하는 방법 - Google Patents

상품 수요예측 모델 생성방법 및 이를 이용하여 상품의 수요를 예측하는 방법 Download PDF

Info

Publication number
KR102668766B1
KR102668766B1 KR1020210168700A KR20210168700A KR102668766B1 KR 102668766 B1 KR102668766 B1 KR 102668766B1 KR 1020210168700 A KR1020210168700 A KR 1020210168700A KR 20210168700 A KR20210168700 A KR 20210168700A KR 102668766 B1 KR102668766 B1 KR 102668766B1
Authority
KR
South Korea
Prior art keywords
products
product
demand
correlation
time
Prior art date
Application number
KR1020210168700A
Other languages
English (en)
Other versions
KR20230081028A (ko
Inventor
구정인
김보현
정홍진
Original Assignee
한국생산기술연구원
Filing date
Publication date
Application filed by 한국생산기술연구원 filed Critical 한국생산기술연구원
Priority to KR1020210168700A priority Critical patent/KR102668766B1/ko
Publication of KR20230081028A publication Critical patent/KR20230081028A/ko
Application granted granted Critical
Publication of KR102668766B1 publication Critical patent/KR102668766B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

본 발명은 온라인 또는 오프라인 매장에서 상품을 판매함에 있어서 미래의 수요를 정확하게 예측할 수 있는 모델을 생성하고 이를 통해 수요를 예측하는 방법에 관한 것이다.

Description

상품 수요예측 모델 생성방법 및 이를 이용하여 상품의 수요를 예측하는 방법{Method for generating a product demand forecasting model and for predicting product demand using the same}
본 발명은 경제학 및 IT 기술분야에 관한 것으로, 온라인 또는 오프라인 매장에서 상품을 판매함에 있어서 미래의 수요를 정확하게 예측할 수 있는 모델을 생성하고 이를 통해 수요를 예측하는 방법에 관한 것이다.
상품 수요예측은 상품을 판매하는 매장에서 재고 관리, 진열, 발주 등 다양한 요소에 큰 영향을 준다. 유통 기간이 짧은 식자재가 판매되는 마트와 같은 매장은, 수요예측의 정확성이 수익과 밀접한 관련이 있다. 과거에는 매장 내 직원의 경험에 의해 수요를 예측하여 왔으나, 최근 통계적 기법과 인공지능의 발달로 인하여 보다 정교하게 수요를 예측하는 기술이 개발되고 있다.
온라인 매장의 경우 수요예측 정확성은 90%에 이르는 것으로 보고되나, 오프라인 매장은 이보다 매우 낮은 것으로 알려져 있다. 이는, 온라인 매장이 상품 구매자의 개인 정보들을 대부분 확보하고 있음에 기인한다. 오프라인 매장에서는 개인 정보 확보가 어렵기에 다양한 혜택으로 회원 가입을 유도하고 있으나, 그럼에도 개인 정보를 제공하지 않는 비회원에 의한 상품 구매의 비율이 매우 높아, 정확한 수요예측은 어려운 실정이다.
상품의 수요를 예측하는 알려진 방법 중 하나는 상품의 시간별 판매량 데이터를 시계열 분해하여 예측하는 방법이다. 여기서, 상품의 시간별 판매량 데이터는 도 1 좌측 도면과 같이 시간을 x축으로 하고 판매량을 y축으로 하는 데이터이다.
도 1 우측 도면과 같이, 실제 관측값(observed)을 시계열 분해하면 추세(trend), 계절성(seasonal) 및 전차(residual)로 구분된다. 구체적인 분해 방법은 이미 알려진 기술인바 상세한 설명을 생략한다. 추세는 판매량의 평균적인 흐름을 나타낸다. 계절성은 일정 시간 단위로 반복되는 패턴이며, 이들을 제외하면 무작위성을 나타내는 잔차가 남게 된다. 이 중에서 주로 추세와 계절성을 미래의 시간에 대입하여 상품의 수요를 예측하게 된다.
이러한 방식에서는 데이터가 많을수록 예측 정확도는 상승하게 된다. 그런데, 동일 상품군에서 개별 판매량은 달라도 추세 및/또는 계절성은 유사할 것을 전제로 할 수 있으므로 정확성 상승을 위해 동일 상품군 내 상품의 데이터를 모두 합산하여 수요를 예측하고 있다. 예컨대, "생수"의 상품군 내에서 "생수A"와 "생수B"의 개별 판매량은 달라도 추세 및/또는 계절성은 유사할 것이다. 따라서, "생수A" 상품의 수요를 예측하는 경우 "생수A"의 시간별 판매량만 시계열 분해하여 수요를 예측하는 것보다는 "생수A", "생수B" 등 모든 생수의 시간별 판매량을 모두 합산한 후 이를 시계열 분해하여 수요를 예측하는 경우 정확성이 보다 상승한다.
상대적으로 동일 상품군 내의 상품들을 함께 분석하는 경우 정확성은 상승할 것이지만 그 정도는 충분하지 않았다. 이에, 보다 많은 데이터를 합산함으로써 수요예측의 정확성을 보다 높이는 방법이 연구되고 있다.
또한, 앞서 설명한 방법은 시간별 판매량 데이터를 통계학적으로 처리하는데 그치고 있는데, 데이터가 더 많아질수록 통계학적 처리에는 과다한 시간이 소요되고 데이터 오류 및 무작위성으로 인해 오히려 정확도가 충분히 상승하지 않을 우려가 있다.
(특허문헌 1) 중국공개특허 제108133391호
(특허문헌 2) 한국등록특허 제10-2264013호
(특허문헌 3) 한국등록특허 제10-22645526호
본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것이다.
시간별 판매량 데이터를 시계열 분해함으로써 수요를 예측하는 방법을 개선하여, 하나의 상품의 수요를 예측하기 위해 해당 상품의 상품군 데이터만 사용하는 것이 아니라 추세 및/또는 계절성이 유사한 다른 상품군의 상품도 데이터로 활용할 수 있도록 함으로써, 보다 많은 데이터를 활용하여 수요예측의 정확성을 높이고자 한다.
또한, 통계학적 분석에 그치지 않고, 결과 정확성을 높이기 위해 전이학습을 적용하여 수요를 예측하고자 한다.
상기와 같은 과제를 해결하기 위한 본 발명의 일 실시예는, (A) 가중상관성 연산식 작성 모듈(210)이, 기 설정된 방법으로, 가중상관성 연산식을 작성하는 단계; (B) 군집 분류 모듈(220)이, 다수의 상품 각각의 시간별 판매량 데이터를 추세(trend), 계절성(seasonal) 및 전차(residual)로 시계열 분해한 후 상기 다수의 상품의 모든 상품 쌍 조합마다 추세 상관성(correlation of trend), 계절성 상관성(correlation of seasonality) 및 전차 상관성(correlation of residual)을 연산하여 획득하고, 이를 상기 가중상관성 연산식에 대입함으로써, 모든 상품 쌍 조합의 가중상관성(weighted correlation)을 획득하는 단계; (C) 상기 군집 분류 모듈(220)이 상기 다수의 상품 중 어느 하나의 상품이 포함되는 모든 가중상관성의 평균을 구하고, 이를 모든 상품에 대하여 수행하여, 모든 상품 각각에 대한 가중상관성 평균이 연산되는 단계; (D) 상기 군집 분류 모듈(220)이, 상기 가중상관성 평균이 기 설정된 범위 내에 있는 상품들을 동일한 군집으로 분류함으로써, 상기 다수의 상품들을 하나 이상의 군집으로 분류하는 단계; 및 (E) 수요예측 모델 생성 모듈(230)이, 상기 (D) 단계에서 분류된 모든 군집에 대하여, 동일한 군집으로 분류된 모든 상품들의 시간별 판매량 데이터를 순차적으로 전이학습(transfer learning)하여 해당 군집에 해당하는 상품에 대한 수요예측 모델을 생성하는 단계를 포함하는, 방법을 제공한다.
또한, 상기 (A) 단계는, (a1) 상기 가중상관성 연산식 작성 모듈(210)이 다수의 모델링대상 상품 각각의 시간별 판매량 데이터를 획득하는 단계; (a2) 상기 가중상관성 연산식 작성 모듈(210)이 상기 획득된 시간별 판매량 데이터를 각각 추세, 계절성 및 전차로 시계열 분해하는 단계; 및 (a3) 상기 가중상관성 연산식 작성 모듈(210)이 상기 시계열 분해된 모델링대상 상품들의 데이터를 이용하여 가중상관성 연산식을 작성하는 단계를 포함하는 것이 바람직하다.
또한, 상기 (a3) 단계는, (a31) 전이학습 모듈(290)이, 상기 시계열 분해된 모델링대상 상품들의 데이터를 순차적으로 전이학습하여 1차 수요예측 모델을 생성하는 단계; 및 (a32) 상기 전이학습 모듈(290)이, 상기 1차 수요예측 모델을 이용하여, 시계열 분해된 추세, 계절성 및 잔차 각각에 대한 순열특성 중요도(permutation importance)를 연산하고, 상기 가중상관성 연산식 작성 모듈(210)이 이를 이용하여 아래의 수식과 같은 가중상관성 연산식을 작성하는 단계를 포함하는 것이 바람직하다. 여기에서 수식은 다음과 같다.
Weighted Correlation = Correlation of Trend * Permutation Importance of Trend + Correlation of seasonality * Permutation Importance of Seasonality + Correlation of Residual * Permutation Importance of Seasonality
또한, 상기 (a1) 단계의 모델링대상 상품들과, 상기 (B) 단계의 다수의 상품은 동일한 것이 바람직하다.
또한, 상기 (E) 단계는, 상기 전이학습 모듈(290)이 상기 (D) 단계에서 분류된 군집 내의 모든 상품들의 시간별 판매량 데이터를 전이학습(transfer learning)함으로써, 상기 수요예측 모델 생성 모듈(230)이 수요예측 모델을 생성하는 단계를 포함하는 것이 바람직하다.
또한, 상기 (a31) 단계는, 상기 전이학습 모듈(290)이 랜덤포레스트 기반으로 1차 수요예측 모델을 생성하는 단계를 포함하며, 상기 (a32) 단계는, 상기 전이학습 모듈(290)이 상기 1차 수요예측 모델에서 랜덤포레스트 기반으로 순열특성 중요도(permutation importance)를 연산하는 단계를 포함하는 것이 바람직하다.
또한, 상기 (E) 단계 이후, (F) 수요예측부(120)에 소정의 상품과 예측하고자 하는 시간이 입력되는 단계; (G) 상기 수요예측부(120)가 상기 입력된 상품이 어느 군집에 포함되는지 확인하는 단계; 및 (H) 상기 수요예측부(120)가 확인된 군집에 대하여 생성된 수요예측 모델을 불러오고, 상기 예측하고자 하는 시간을 적용함으로써, 상기 예측하고자 하는 시간의 수요를 예측하는 단계를 더 포함하는 것이 바람직하다.
또한, 상기 (H) 단계 이후, (I) 발주부(130)가 상기 (H) 단계에서 예측된 상품의 수요를 이용하여, 해당 상품을 발주하기 위한 상품 발주정보를 생성하는 것이 바람직하다.
또한, 매장관리부(100)는 상기 발주부(140)와 매출정보 획득부(110)와 연동되고, 상기 매출정보 획득부(110)는 상기 다수의 상품의 시간별 판매량 데이터를 포함하는 매출정보를 획득하고, 상기 (a1) 단계는, 상기 매출정보 획득부(110)로부터 상기 다수의 상품 각각의 시간별 판매량 데이터를 획득하는 단계를 포함하고, 상기 (B) 단계는, 상기 군집 분류 모듈(220)이 상기 다수의 상품 각각의 시간별 판매량 데이터를 획득하는 단계를 포함하는 것이 바람직하다.
본 발명에 따른 방법이 적용됨으로써, 일견 추세 및/또는 계절성이 다를 것으로 예상되는 다른 상품군의 상품이지만 실제로는 추세, 계절성 및/또는 잔차가 유사한 상품들을 모두 선정하여 군집을 형성할 수 있으며, 이러한 군집은 해당 상품의 상품군 대비 훨씬 많은 데이터를 갖기에, 수요예측 모델의 정확성이 상승한다.
또한, 가중상관성을 적용함으로써, 추세, 계절성 및 잔차에 적절한 가중치를 부여할 수 있어서, 어떤 상품의 데이터를 활용할지 높은 정확도로 결정하여 군집 형성이 정교하게 이루어지며, 이에 따라 수요예측 정확성 역시 상승한다.
전이학습에 의해 모델을 생성하고 본 발명에 따른 방법을 적용하되 가중상관성을 적용하여 수요를 예측한 결과, 도 6에 도시되는 것과 같이 그 정확성이 크게 상승하였음을 확인하였다.
도 1은 시간별 판매량 데이터를 시계열 분석하여 수요를 예측하는 종래 기술을 설명하기 위한 도면이다.
도 2는 본 발명에 따른 방법을 수행하기 위한 시스템을 도시한다.
도 3은 본 발명에 따른 방법의 순서도이다.
도 4는 본 발명에 따른 방법의 검증 실험 결과 중 하나로서, 순열특성 중요도를 도출한 결과를 도시한다.
도 5는 본 발명에 따른 방법의 검증 실험 결과 중 하나로서, 각 상품 쌍 조합의 가중상관성을 도시한다.
도 6은 본 발명에 따른 방법의 검증 실험 결과 중 하나로서, 도 6a는 본 발명에 따라 군집 개념이 적용된 전이학습 이용 수요예측 모델의 검증 결과이며, 도 6b는 단일 상품을 대상으로 전이학습 이용 수요예측 모델의 검증 결과이다.
이하에서 "상품"은, 매장에서 판매되는 모든 물건을 의미한다.
이하에서 "군집"은, 상품들의 모음이며, 동일한 종류의 상품군과는 다른 개념으로서 동일한 종류 또는 동일하지 않은 종류의 상품들이 하나의 군집을 형성할 수 있다. 또한, 어느 하나의 상품은 어느 하나의 군집 내에 포함되어야 한다.
1. 시스템의 설명
도 2를 참조하여, 본 발명에 따른 방법을 수행하기 위한 시스템을 설명한다.
본 발명에 따른 방법을 수행하기 위한 시스템은, 매장관리부(100), 매출정보 획득부(110), 수요예측부(120) 및 발주부(130)를 포함하며, 제어부(200)를 더 포함한다.
매장관리부(100)는 상품이 판매되는 매장을 관리하는 기능을 하며, 종래 사용되는 어떠한 종류의 매장관리 프로그램이 실행되는 하드웨어일 수 있다. 매출을 관리하고, 발주를 진행하며, 재고를 관리할 수 있다.
매출정보 획득부(110)는 매장관리부(100)로부터 매출정보를 획득하며, 획득되는 매출정보에는 각 상품의 시간별 판매량 데이터가 포함되어 있다. 이러한 매출정보 중 제어부(200)가 요구하는 상품들의 시간별 판매량 데이터가 제어부(200)에 전달된다.
수요예측부(120)는 생성된 수요예측 모델을 이용하여, 특정 상품의 특정 시간 동안의 수요를 예측하는 기능을 수행한다.
발주부(130)는 수요예측부(120)에서 예측된 수요 정보에 기초하여 특정 상품의 발주정보를 자동 생성하여 발주처에 발신한다. 발주정보는 매장관리부(100)에 전달된다.
제어부(200)는 수요예측 모델을 생성하는 기능을 하는데, 구체적인 내용은 아래의 방법의 설명에서 후술한다. 본 발명에 따른 방법은 프로그램으로서, 해당 방법이 수행되도록 제어부(200)에 의해 동작하며 기억매체에 저장된 것일 수 있다.
2. 방법의 설명
도 3을 참조하여, 본 발명에 따른 방법을 설명한다.
본 발명에 따른 방법은 정확성 상승을 위해 보다 많은 데이터를 확보하기 위하여 군집의 개념을 도입한다. 전술한 바와 같이, 특정 상품의 유사 상품군에 한정되지 않고 추세, 계절성 및/또는 잔차가 유사할 것으로 판단되는 모든 상품을 군집으로 설정한다. 하나의 군집에 포함된 모든 상품들에 대한 데이터가 이용되어 수요예측 모델이 생성되기에, 특정 상품군에 대한 데이터만 이용하는 경우와 대비하여 정확성이 상승한다.
어떠한 상품들을 하나의 군집으로 형성할 수 있을지 여부를 판단하기 위하여 1차 수요예측 모델을 생성한 후 순열특성 중요도를 이용하여 가중상관성 연산식을 작성하여 이를 활용한다. 각 상품마다 다른 모든 상품들에 대하여 가중상관성이 연산될 것이다. N개의 상품이 데이터로 활용된다면, 가중상관성은 N-1개만큼 연산되며, 그 평균값인 가중상관성 평균을 이용하여 군집을 분류한다.
분류된 군집 내에 포함된 상품들은 추세, 계절성 및/또는 잔차가 유사할 것으로 판단되는 모든 상품을 포함한다. 유사 상품군에 한정되지 않는다. 이러한 상품들의 데이터를 모두 이용하여 군집의 수요예측 모델이 생성된다. 군집에 포함된 상품들은 수요예측 모델이 동일하다. 각 군집마다 각각 수요예측 모델이 생성된다.
수요를 예측하고자 하는 상품과 시간이 있다면, 해당 상품이 어느 군집에 해당하는지 확인하고, 그 군집의 수요예측 모델을 불러와서, 상품과 시간을 입력함으로써 판매량이 연산된다. 연산된 판매량이 해당 상품 해당 시간의 수요예측이다.
각 단계를 구체적으로 설명한다.
2.1 1차 수요예측 모델을 이용한 가중상관성 연산식 작성
모델링대상 상품을 선정한다. 매장에서 판매되는 모든 상품일 수 있다.
가중상관성 연산식 작성 모듈(210)은 다수의 모델링대상 상품 각각의 시간별 판매량 데이터를 획득한다. 이는, 매출정보 획득부(110)로부터 획득한 매출정보에서 획득될 수 있다.
다음, 가중상관성 연산식 작성 모듈(210)이 획득된 시간별 판매량 데이터를 각각 추세, 계절성 및 전차로 시계열 분해한다. 시계열 분해 방법은 종래 기술인바 상세한 설명은 생략한다.
다음, 가중상관성 연산식 작성 모듈(210)이 시계열 분해된 모델링대상 상품들의 데이터를 이용하여 가중상관성 연산식을 작성한다.
구체적으로, 전이학습 모듈(290)이, 시계열 분해된 모델링대상 상품들의 데이터를 순차적으로 전이학습하여 1차 수요예측 모델을 생성한다. 1차 수요예측 모델을 통해 시계열 분해된 추세, 계절성 및 잔차 각각에 대한 순열특성 중요도(permutation importance)가 연산된다. 순열특성 중요도는 종래 알려진 방법으로 연산될 것이다. 이러한 연산에 의해 추세의 순열특성 중요도(Permutation Importance of Trend), 계절성의 순열특성 중요도(Permutation Importance of Seasonality) 및 잔차의 순열특성 중요도(Permutation Importance of Seasonality)의 점수가 확인된다. 이제, 가중상관성 연산식 작성 모듈(210)이 이를 이용하여 아래의 수식과 같은 가중상관성 연산식을 작성한다. 해당 수식에서의 추세 상관성(correlation of trend), 계절성 상관성(correlation of seasonality) 및 전차 상관성(correlation of residual)은 후술하는 군집 분류 대상 상품의 쌍마다 결정될 것이다.
Weighted Correlation = Correlation of Trend * Permutation Importance of Trend + Correlation of seasonality * Permutation Importance of Seasonality + Correlation of Residual * Permutation Importance of Seasonality
여기서, 1차 수요예측 모델은 전이학습을 이용하여 생성된다. 예컨대, 모델링대상 상품들 중 어느 하나인 상품A를 이용하여 학습하여 수요예측 모델A을 생성한 후, 다른 모델링대상 상품인 상품B에 대한 데이터를 더 이용하여 수요예측 모델B를 생성한다. 이러한 방식으로 지속적으로 학습함으로써 N개의 모델링대상 상품에 대해서는 수요예측 모델A부터 수요예측 모델N까지 생성될 것이며, 여기에서의 수요예측 모델N이 1차 수요예측 모델이 된다.
또한, 이러한 전이학습은 랜덤포레스트 기반으로 수행될 수 있다. 이 경우, 순열특성 중요도(permutation importance) 역시 랜덤포레스트 기반으로 연산된다.
한편, 이러한 가중상관성 연산식을 작성하기 위한 모델링대상 상품에는 어떠한 제한도 없으나, 매장에서 판매되는 모든 상품, 즉 이하에서 설명하는 바와 같이 수요예측을 하고자 하는 모든 상품인 것이 정확성 측면에서 바람직하다.
2.2 군집 분류
이제, 작성된 가중상관성 연산식을 이용하여 모든 상품의 군집을 분류할 수 있다.
먼저, 군집 분류 모듈(220)이 매장에서 판매되는 다수의 상품 각각의 시간별 판매량 데이터를 추세, 계절성 및 전차로 시계열 분해한 후 상기 다수의 상품의 모든 상품 쌍 조합마다 추세 상관성, 계절성 상관성 및 전차 상관성을 연산한다. 상관성(correlation)을 연산하는 방법은 어떠한 방법을 사용하여도 무방하다. 상관성 점수는 -1부터 1 사이이며, -1일수록 음의 상관관계, 0일수록 양의 상관관계를 의미한다. 이러한 방법으로 N개의 상품 중 어느 하나의 상품에 대하여 상품 쌍 조합마다 상관성을 연산한다면, 추세 상관성, 계절성 상관성 및 전차 상관성 각각이 N-1개씩 연산될 것이다.
이러한 방법으로 획득된 N-1개의 추세 상관성, 계절성 상관성 및 전차 상관성을 앞서 설명한 수식에 대입하여 N-1개의 가중상관성을 연산하고, 이를 N-1로 나누어 가중상관성 평균을 연산한다. 이러한 방식으로 N개의 모든 상품마다 가중상관성 평균을 연산하여 확보한다.
하나의 상품은 하나의 가중상관성 평균을 갖는다. 이 점수는 해당 상품의 판매량 변동 특성을 나타내는 점수이다. 따라서, 특정 범위로 점수를 구분함으로써 군집을 분류할 수 있다. 예컨대, -0.05~0점 범위의 제1군집, 0~0.5점 범위의 제2군집, 0.5~10점 범위의 제3군집 등으로 분류할 수 있다. 구분 범위를 결정하는 구체적인 수치는 매장마다 다를 것이므로 본 명세서에서 구체적 수치를 한정하지는 않도록 한다.
이러한 방법으로 하나 이상의 군집이 형성되며, 모든 상품은 어느 하나의 군집에 포함되도록 분류된다.
2.3 수요예측 모델 생성
수요예측 모델 생성 모듈(230)은 분류된 모든 군집에 대하여 각 군집마다 수요예측 모델을 생성한다. 동일한 군집으로 분류된 모든 상품들의 시간별 판매량 데이터를 다시 확인하고, 앞서 설명한 방법과 같이 하나의 상품씩 순차적으로 전이학습하여 수요예측 모델을 생성한다. 마찬가지로, 랜덤포레스트 기반일 수 있다.
2.4 수요예측
사용자는, 수요예측부(120)에 수요를 예측하고자 하는 상품과 예측하고자 하는 시간을 입력한다. 수요예측부(120)는 먼저 입력된 상품이 어느 군집에 포함되는지 확인하고, 확인된 군집에 대하여 생성된 수요예측 모델을 불러온다.
불러온 수요예측 모델에 상품과 시간이 적용되면 판매량이 출력된다. 출력되는 판매량이 해당 시간 해당 상품의 수요로 예측되는 양이다.
한편, 수요예측부(120)에 의해 특정 상품의 특정 시간 수요가 예측되면, 이를 활용하여, 현재 재고량과 비교하여, 발주부(130)가 자동으로 해당 상품의 발주정보를 생성할 수도 있다. 생성된 발주정보는 매장관리부(100)를 통해 발주처에 자동 전송될 수도 있다.
3. 검증실험
전술한 방법으로 생성된 수요예측 모델의 정확성을 확인하기 위하여 검증실험을 실시하였다.
A지역 소재 B마트에서 거래되는 상품들 중 50개의 상품을 선정하고 시간별 판매량 데이터를 사용하였다. 이 중 40개는 학습 자료로 활용하였고 10개는 검증 자료로 활용하였다. 즉, 40개의 모델링생성 상품이 선정되었다. 이후 랜덤포레스트 기법으로 순열특성 중요도를 연산하였으며, 연산 결과는 도 4와 같이, 추세 상관성(correlation of trend)은 3.85, 계절성 상관성(correlation of seasonality)은 14.59, 전차 상관성(correlation of residual)은 6.8로 연산되었다. 이에 따라, 가중상관성 연산식은 다음과 같이 결정되었다.
Weighted Correlation = Correlation of Trend * 3.85 + Correlation of seasonality * 14.59 + Correlation of Residual * 6.8
해당 수식을 이용하여, 40개의 상품마다 다른 상품을 하나씩 쌍을 이루게 하여 가중상관성을 연산하였다. 하나의 상품마다 39개의 가중상관성이 연산되었다. 도 5는 그 결과를 도시한다. 또한, 39개의 가중상관성 점수의 평균을 연산하였다. 가중상관성 평균은 -0.05부터 10까지 분포하였다.
이제 40개의 가중상관성이 확보되었으므로 소정의 기준에 의해 이를 구분하여 군집을 형성할 수 있다. 일 예시에서, 가야산천년수2L(6개)와 동일한 군집으로 형성되는 상품들은 아래와 같았다.
- 2400설레임밀크, 가야산천년수500ml_20, 남부)불고기맛후랑크소시지, 남부)오륙도맛바, 들꽃향기물티슈리필, 미전지 불고기용, 바)누가바골드, 바)돼지바, 바)메가톤, 바)바밤바골드, 바)비비빅, 바)서울멜론바, 바)수박바, 바)스크류바, 바)쌍쌍바, 바)아맛나, 바)옥동자, 바)죠스바, 바)쿠앤크바쵸코, 봉지새송이버섯(1입, 400g_특_봉_국산), 신)참이슬후레쉬, 신)카스후레쉬병, 제주삼다수, 청정)친환경대란60구, 카스후레쉬캔, 콘)더블비얀코, 콘)부라보바닐라, 콘)빵빠레바닐라, 콘)빵빠레쵸코, 콘)월드콘
즉, 동일 상품군이 아님에도 동일 군집에 포함되는 결과가 도출되었다.
위의 군집에 대하여 다시 전이학습을 진행하여 수요예측 모델을 최종 완성하였다.
최종 완성된 수요예측 모델에 남은 10개의 상품을 이용한 valid 데이터 예측을 진행하고 실제 데이터와 비교하였다. 도 6a 상부 도면에 그 결과가 도시되며, 청색은 실제 데이터이고 적색인 예측 데이터이다. 또한, 다른 임의의 상품에 대한 test 데이터 예측을 진행하였다. 도 6a 하부 도면에 그 결과가 도시된다.
이러한 방법과 비교하기 위하여, 군집을 형성하지 않고 단일 상품에만 제한된 수요예측 모델을 형성하고 동일한 예측을 진행하였다. 도 6b 상부 도면에 valid 데이터 예측 결과가 도시되고, 도 6b 하부 도면에 test 데이터 예측 결과가 도시된다. 통계 분석 결과는 아래의 표와 같다.
구분 군집 개념 적용 전이학습 모델 단일 전이학습 모델
valid 데이터 test 데이터 valid 데이터 test 데이터
rmse 92.53 88.83 82.62 92.08
mae 73.26 66.92 63.88 65.18
r2 0.64 0.56 0.71 0.53
mape 0.51 0.14 0.49 0.15
통계적으로, 전이학습 모델 자체의 정확성은 어느 경우이든 높은 것으로 확인되었다. 다만, 단일 전이학습 모델을 사용하는 경우 예측값과 실제값의 차이가 매우 큰 예외적인 데이터 지점이 일부 확인되었다. 군집 개념이 적용된 본 발명에 따른 방법 적용 모델이 보다 안정적이며 실제값과의 차이가 통계적으로 보다 작아서 정확성이 높은 것으로 확인되었다.
100: 매장관리부
110: 매출정보 획득부
120: 수요예측부
130: 발주부
200: 제어부
210: 가중상관성 연산식 작성 모듈
220: 군집 분류 모듈
230: 수요예측 모델 생성 모듈
290: 전이 학습 모듈

Claims (10)

  1. (a1) 가중상관성 연산식 작성 모듈(210)이 다수의 모델링대상 상품 각각의 시간별 판매량 데이터를 획득하는 단계;
    (a2) 상기 가중상관성 연산식 작성 모듈(210)이 상기 획득된 시간별 판매량 데이터를 각각 추세, 계절성 및 잔차로 시계열 분해하는 단계;
    (a31) 전이학습 모듈(290)이, 상기 시계열 분해된 모델링대상 상품들의 데이터를 순차적으로 전이학습하여 1차 수요예측 모델을 생성하는 단계; 및
    (a32) 상기 전이학습 모듈(290)이, 상기 1차 수요예측 모델을 이용하여, 시계열 분해된 추세, 계절성 및 잔차 각각에 대한 순열특성 중요도(permutation importance)를 연산하고, 상기 가중상관성 연산식 작성 모듈(210)이 이를 이용하여 아래의 수식과 같은 가중상관성 연산식을 작성하는 단계;
    Weighted Correlation = Correlation of Trend * Permutation Importance of Trend + Correlation of seasonality * Permutation Importance of Seasonality + Correlation of Residual * Permutation Importance of Seasonality
    (B) 군집 분류 모듈(220)이, 다수의 상품 각각의 시간별 판매량 데이터를 추세(trend), 계절성(seasonal) 및 잔차(residual)로 시계열 분해한 후 상기 다수의 상품의 모든 상품 쌍 조합마다 추세 상관성(correlation of trend), 계절성 상관성(correlation of seasonality) 및 잔차 상관성(correlation of residual)을 연산하여 획득하고, 이를 상기 가중상관성 연산식에 대입함으로써, 모든 상품 쌍 조합의 가중상관성(weighted correlation)을 획득하는 단계;
    (C) 상기 군집 분류 모듈(220)이 상기 다수의 상품 중 어느 하나의 상품이 포함되는 모든 가중상관성의 평균을 구하고, 이를 모든 상품에 대하여 수행하여, 모든 상품 각각에 대한 가중상관성 평균이 연산되는 단계;
    (D) 상기 군집 분류 모듈(220)이, 상기 가중상관성 평균이 기 설정된 범위 내에 있는 상품들을 동일한 군집으로 분류함으로써, 상기 다수의 상품들을 하나 이상의 군집으로 분류하는 단계; 및
    (E) 수요예측 모델 생성 모듈(230)이, 상기 (D) 단계에서 분류된 모든 군집에 대하여, 동일한 군집으로 분류된 모든 상품들의 시간별 판매량 데이터를 순차적으로 전이학습(transfer learning)하여 해당 군집에 해당하는 상품에 대한 수요예측 모델을 생성하는 단계를 포함하는,
    방법.
  2. 삭제
  3. 삭제
  4. 제 1 항에 있어서,
    상기 (a1) 단계의 모델링대상 상품들과, 상기 (B) 단계의 다수의 상품은 동일한,
    방법.
  5. 제 1 항에 있어서,
    상기 (E) 단계는,
    상기 전이학습 모듈(290)이 상기 (D) 단계에서 분류된 군집 내의 모든 상품들의 시간별 판매량 데이터를 전이학습(transfer learning)함으로써, 상기 수요예측 모델 생성 모듈(230)이 수요예측 모델을 생성하는 단계를 포함하는,
    방법.
  6. 제 5 항에 있어서,
    상기 (a31) 단계는,
    상기 전이학습 모듈(290)이 랜덤포레스트 기반으로 1차 수요예측 모델을 생성하는 단계를 포함하며,
    상기 (a32) 단계는,
    상기 전이학습 모듈(290)이 상기 1차 수요예측 모델에서 랜덤포레스트 기반으로 순열특성 중요도(permutation importance)를 연산하는 단계를 포함하는,
    방법.
  7. 제 4 항에 있어서,
    상기 (E) 단계 이후,
    (F) 수요예측부(120)에 소정의 상품과 예측하고자 하는 시간이 입력되는 단계;
    (G) 상기 수요예측부(120)가 상기 입력된 상품이 어느 군집에 포함되는지 확인하는 단계; 및
    (H) 상기 수요예측부(120)가 확인된 군집에 대하여 생성된 수요예측 모델을 불러오고, 상기 예측하고자 하는 시간을 적용함으로써, 상기 예측하고자 하는 시간의 수요를 예측하는 단계를 더 포함하는,
    방법.
  8. 제 6 항에 있어서,
    상기 (H) 단계 이후,
    (I) 발주부(130)가 상기 (H) 단계에서 예측된 상품의 수요를 이용하여, 해당 상품을 발주하기 위한 상품 발주정보를 생성하는,
    방법.
  9. 제 8 항에 있어서,
    매장관리부(100)는 발주부(140)와 매출정보 획득부(110)와 연동되고, 상기 매출정보 획득부(110)는 상기 다수의 상품의 시간별 판매량 데이터를 포함하는 매출정보를 획득하고,
    상기 (a1) 단계는, 상기 매출정보 획득부(110)로부터 상기 다수의 상품 각각의 시간별 판매량 데이터를 획득하는 단계를 포함하고,
    상기 (B) 단계는, 상기 군집 분류 모듈(220)이 상기 다수의 상품 각각의 시간별 판매량 데이터를 획득하는 단계를 포함하는,
    방법.
  10. 제 1 항 및 제 4 항 내지 제 9 항 중 어느 한 항에 따른 방법이 수행되도록 제어부(200)에 의해 동작하며 기억매체에 저장된, 프로그램.
KR1020210168700A 2021-11-30 상품 수요예측 모델 생성방법 및 이를 이용하여 상품의 수요를 예측하는 방법 KR102668766B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210168700A KR102668766B1 (ko) 2021-11-30 상품 수요예측 모델 생성방법 및 이를 이용하여 상품의 수요를 예측하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210168700A KR102668766B1 (ko) 2021-11-30 상품 수요예측 모델 생성방법 및 이를 이용하여 상품의 수요를 예측하는 방법

Publications (2)

Publication Number Publication Date
KR20230081028A KR20230081028A (ko) 2023-06-07
KR102668766B1 true KR102668766B1 (ko) 2024-05-24

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116700A (ja) * 2017-01-13 2018-07-26 富士通株式会社 推定プログラム、推定方法および推定装置
JP2020149468A (ja) * 2019-03-14 2020-09-17 株式会社日立製作所 商品管理システムおよび商品管理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116700A (ja) * 2017-01-13 2018-07-26 富士通株式会社 推定プログラム、推定方法および推定装置
JP2020149468A (ja) * 2019-03-14 2020-09-17 株式会社日立製作所 商品管理システムおよび商品管理方法

Similar Documents

Publication Publication Date Title
Büyüközkan et al. Evaluation of software development projects using a fuzzy multi-criteria decision approach
CN101014935A (zh) 决定群体的设计喜好
Zekić-Sušac et al. Data mining as support to Knowledge Management in Marketing
Fonseca et al. Boost: Boosting smooth trees for partial effect estimation in nonlinear regressions
CN113656691A (zh) 数据预测方法、装置及存储介质
Yerragudipadu et al. An Efficient Novel Approach on Machine Learning Paradigmsfor Food Delivery Company through Demand Forecastıng in societal community
Romano et al. Classification trees in consumer studies for combining both product attributes and consumer preferences with additional consumer characteristics
KR102668766B1 (ko) 상품 수요예측 모델 생성방법 및 이를 이용하여 상품의 수요를 예측하는 방법
Ollech et al. A random forest-based approach to combining and ranking seasonality tests
Nikolopoulos Forecasting with quantitative methods: The impact of special events in time series
Berg Forecast accuracy of a BVAR under alternative specifications of the zero lower bound
CN110348964A (zh) 一种基于多感知的智慧化电子商务推荐方法
KR20230081028A (ko) 상품 수요예측 모델 생성방법 및 이를 이용하여 상품의 수요를 예측하는 방법
Kang et al. RETRACTED: A hybrid model to develop aesthetic product design of customer satisfaction
Xu et al. Metrological analysis of online consumption evaluation influence commodity marketing decision based on data mining
Ganhewa et al. Sales Optimization Solution for Fashion Retail
Leyva López et al. A preference choice model for the new product design problem
Kumar et al. A study of composite or hybrid classifiers for knowledge discovery
Adeli et al. Integrated sourcing and inventory decisions considering sources’ disruptions with a hybrid simulation-MOPSO-TOPSIS approach: A Pharmaceutical case study
Galvão et al. Forecasting model of a movie's profitability
Alaminos et al. Neural networks for estimating Macro Asset Pricing model in football clubs
Windmann Machine Learning in Finance
Chetthamrongchai et al. Hotel Capacity Planning Using Queuing Systems and Meta-Heuristic Algorithms.
Khumaidi et al. Forecasting of Sales Based on Long Short Term Memory Algorithm with Hyperparameter
Dominic et al. A new hybrid model for the supplier selection decision