WO2023287073A1

WO2023287073A1 - 매장 운영 예측 시스템 및 그 방법

Info

Publication number: WO2023287073A1
Application number: PCT/KR2022/009423
Authority: WO
Inventors: 강찬; 이민우; 서정환; 정민재; 이경준
Original assignee: 주식회사 식파마
Priority date: 2021-07-13
Filing date: 2022-06-30
Publication date: 2023-01-19

Abstract

본 발명은 매장 운영 예측 시스템 및 그 방법을 개시한다. 상기 매장 운영 예측 시스템은, 가맹점으로부터 시계열 데이터로 구성된 POS 데이터를 수신하여 매출 데이터를 추출하는 POS 데이터 처리 모듈, 시계열 데이터로 구성된 외부 데이터를 수신하여 상기 매출 데이터와 동일한 시간 단위로 재구성하여 처리된 외부 데이터를 생성하는 외부 데이터 처리 모듈, 상기 매출 데이터 및 상기 처리된 외부 데이터의 시점에 따른 상관관계를 판단하여 높은 상관관계를 가지는 시점으로 매칭시키고, 2차원 테이블 형식의 조정 데이터를 생성하는 데이터 조정 모듈, 상기 조정 데이터를 미리 설정된 형식으로 변환하여 입력 데이터를 생성하는 입력 데이터 재구성 모듈 및 딥러닝 모델을 포함하고, 상기 입력 데이터를 이용하여 학습하고, 매출 예측 데이터를 도출하는 시계열 예측 모듈을 포함한다.

Description

매장 운영 예측 시스템 및 그 방법

본 발명은 매장 운영 예측 시스템 및 그 방법에 관한 것이다. 구체적으로, 본 발명은 시계열 분석 딥러닝 모델을 이용하여 가맹점의 매출을 예측하는 시스템 및 방법에 대한 발명이다.

외식업 등 여러 종류의 업종에서는 매출 예측이 매우 중요한 분야 중의 하나이다. 매출 예측을 통해서, 자재의 수요를 파악하고, 앞으로 투자할 수 있는 자본의 규모 및 투자 시기 등을 확인하는 것이 해당 업주의 중요한 과제이자 의무이다.

하지만, 현재의 매출 예측은 정밀하지 않고, 단순히 감이나 경험에 의존하고 있다. 특히, 매출과 관련된 요인은 단순히 업체의 위치, 제공 메뉴 등 내부 요인에 국한되는 것이 아니라 날씨나 경제 상황 등 수많은 외부 요인이 존재할 수 있다.

따라서, 이러한 내부 요인과 외부 요인을 모두 고려하여 매출을 정확히 예측하는 것은 불가능에 가깝고, 특히 어떠한 요인이 매출에 영향을 미치기까지 걸리는 시기가 다양할 수 있기에 그러한 효과를 모두 고려하는 것도 쉽지 않다.

따라서, 이러한 다양한 요인과 효과가 적용되는 시기까지 모두 고려하여 정확한 매출을 예측하는 기술에 대한 논의가 더 필요한 시점이다.

본 발명의 과제는, 다양한 외부 요인과의 상관관계 분석을 통해서 정밀하게 입력 데이터를 구성하여 정확한 결과를 도출하는 시계열 분석을 이용한 매출 예측 시스템을 제공하는 것이다.

또한, 본 발명의 다른 과제는, 다양한 외부 요인과의 상관관계 분석을 통해서 정밀하게 입력 데이터를 구성하여 정확한 결과를 도출하는 매장 운영 예측 방법을 제공하는 것이다.

본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 발명의 실시예에 의해 보다 분명하게 이해될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.

상기 과제를 해결하기 위한 본 발명의 몇몇 실시예에 따른 매장 운영 예측 시스템은, 가맹점으로부터 시계열 데이터로 구성된 POS 데이터를 수신하여 매출 데이터를 추출하는 POS 데이터 처리 모듈, 시계열 데이터로 구성된 외부 데이터를 수신하여 상기 매출 데이터와 동일한 시간 단위로 재구성하여 처리된 외부 데이터를 생성하는 외부 데이터 처리 모듈, 상기 매출 데이터 및 상기 처리된 외부 데이터의 시점에 따른 상관관계를 판단하여 높은 상관관계를 가지는 시점으로 매칭시키고, 2차원 테이블 형식의 조정 데이터를 생성하는 데이터 조정 모듈, 상기 조정 데이터를 미리 설정된 형식으로 변환하여 입력 데이터를 생성하는 입력 데이터 재구성 모듈 및 딥러닝 모델을 포함하고, 상기 입력 데이터를 이용하여 학습하고, 매출 예측 데이터를 도출하는 시계열 예측 모듈을 포함한다.

또한, 상기 POS 데이터는 카드 결제 내역을 포함하고, 상기 POS 데이터 처리 모듈은, 상기 카드 결제 내역에서 재방문 수치를 산출하는 재방문 수치 산출 모듈과, 상기 매출 데이터를 산출하는 매출 데이터 산출 모듈을 포함할 수 있다.

또한, 상기 데이터 조정 모듈은, 상기 매출 데이터 및 상기 처리된 외부 데이터를 차분을 통한 증감량으로 표시하여 안정화 데이터를 생성하는 데이터 안정화 모듈과, 상기 안정화 데이터를 VAR(Vector Auto Regression) 방식을 이용하여 상기 매출 데이터와 상기 외부 데이터의 최적의 시점을 판단하고, 그에 따라 상기 조정 데이터를 생성하는 VAR 분석 모듈을 포함할 수 있다.

또한, 상기 매출 예측 데이터와 상기 매출 데이터를 비교하여 오차율 정보를 산출하는 오차율 판단 모듈을 더 포함하고, 상기 시계열 예측 모듈은 상기 오차율 정보에 따라 상기 딥러닝 모델의 모델링의 수행여부를 판단할 수 있다.

또한, 상기 외부 데이터는 공공 데이터, 민간 공개 API 제공 데이터 및 경제 지표 데이터 중 적어도 하나를 포함할 수 있다.

또한, 상기 매출 예측 데이터는 메뉴별 예측 매출 데이터를 포함하고, 상기 매출 예측 데이터에 따라 식자재 수요를 분석하고, 식자재 추천 발주 정보를 생성하는 식자재 추천 발주 정보 모듈을 더 포함할 수 있다.

상기 다른 과제를 해결하기 위한 본 발명의 몇몇 실시예에 따른 매장 운영 예측 방법은, POS 데이터를 수신하여 매출 데이터를 추출하고, 외부 데이터를 수신하여 상기 매출 데이터와 동일한 시간 단위로 재구성된 처리된 외부 데이터를 생성하고, 상기 매출 데이터와 상기 처리된 외부 데이터의 시점에 따른 상관관계를 분석하여 높은 상관관계의 시점으로 매칭된 조정 데이터를 생성하고, 상기 조정 데이터를 미리 설정된 형식으로 변환하여 입력 데이터를 생성하고, 상기 입력 데이터를 이용하여 딥러닝 모델을 포함하는 시계열 예측 모델을 학습시키고, 상기 시계열 예측 모델을 통해서 매출 예측 데이터를 도출하고, 상기 매출 예측 데이터의 오차율이 기준 오차율 이하인지를 판단하고, 만일 상기 오차율이 상기 기준 오차율 이하인 경우 그대로 매출 예측 데이터를 생성하고, 만일 상기 오차율이 상기 기준 오차율 초과인 경우 상기 시계열 예측 모델의 모델링을 다시 수행하는 것을 포함한다.

또한, 상기 매출 예측 데이터에 의해서 식자재 수요를 예측하여, 식자재 추천 발주 정보를 제공하는 것을 더 포함할 수 있다.

또한, 상기 POS 데이터는 카드 결제 내역을 포함하고, 상기 카드 결제 내역에서 재방문 내역을 추출하고, 상기 재방문 내역을 재방문 간격에 따라 분류하여 재방문 데이터를 생성하는 것을 더 포함하고, 상기 조정 데이터를 생성하는 것은, 상기 매출 데이터와, 상기 처리된 외부 데이터 및 상기 재방문 데이터의 시점에 따른 상관관계를 분석하는 것을 포함할 수 있다.

또한, 상기 조정 데이터를 생성하는 것은, 상기 매출 데이터 및 상기 처리된 외부 데이터를 차분하여 안정화 데이터를 생성하고, 상기 안정화 데이터를 VAR 방식을 이용하여 상관관계가 높은 시점의 데이터를 확인하고, 상기 상관관계가 높은 시점의 데이터를 결합하여 상기 조정 데이터를 생성하는 것을 포함할 수 있다.

본 발명의 매장 운영 예측 시스템 및 그 방법은, 다양한 외부 데이터를 학습 데이터로 사용하여 다양한 외부 요인에 따른 매출을 예측할 수 있다.

또한, 외부 요인과 매출의 상관관계를 통해서 외부 요인이 매출에 영향을 주는 가장 적절한 시간을 확인하여 더욱 정밀하고 적절한 예측을 도출할 수 있다.

나아가,

상술한 내용과 더불어 본 발명의 구체적인 효과는 이하 발명을 실시하기 위한 구체적인 사항을 설명하면서 함께 기술한다.

도 1은 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템을 설명하기위한 개념도이다.

도 2는 도 1의 제1 매출 예측 서버를 세부적으로 설명하기 위한 블록도이다.

도 3은 도 1의 POS 데이터 및 외부 데이터를 설명하기 위한 개념도이다.

도 4는 도 2의 POS 데이터 처리 모듈을 세부적으로 설명하기 위한 블록도이다.

도 5는 도 2의 데이터 조정 모듈을 세부적으로 설명하기 위한 블록도이다.

도 6 및 도 7은 도 5의 데이터 안정화 모듈이 데이터를 안정화하는 것을 설명하기 위한 중간 도면들이다.

도 8은 도 5의 VAR 분석 모듈이 시점에 따른 상관관계를 분석하는 것을 설명하기 위한 예시도이다.

도 9는 도 2의 입력 데이터 재구성 모듈을 세부적으로 설명하기 위한 블록도이다.

도 10은 도 9의 조정 데이터의 예시도이다.

도 11은 도 9의 스케일링된 데이터의 예시도이다.

도 12는 도 2의 시계열 예측 모듈을 세부적으로 설명하기 위한 블록도이다.

도 13은 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템을 설명하기위한 개념도이다.

도 14는 도 13의 제2 매출 예측 서버를 세부적으로 설명하기 위한 블록도이다.

도 15는 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 방법을 설명하기위한 순서도이다.

도 16은 도 15의 재방문 데이터 생성 단계를 세부적으로 설명하기 위한 순서도이다.

도 17은 도 15의 조정 데이터 생성 단계를 세부적으로 설명하기 위한 순서도이다.

도 18은 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 방법을 설명하기위한 순서도이다.

본 명세서 및 특허청구범위에서 사용된 용어나 단어는 일반적이거나 사전적인 의미로 한정하여 해석되어서는 아니된다. 발명자가 그 자신의 발명을 최선의 방법으로 설명하기 위해 용어나 단어의 개념을 정의할 수 있다는 원칙에 따라, 본 발명의 기술적 사상과 부합하는 의미와 개념으로 해석되어야 한다. 또한, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명이 실현되는 하나의 실시예에 불과하고, 본 발명의 기술적 사상을 전부 대변하는 것이 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 및 응용 가능한 예들이 있을 수 있음을 이해하여야 한다.

본 명세서 및 특허청구범위에서 사용된 제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. '및/또는' 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.

본 명세서 및 특허청구범위에서 사용된 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서 "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해서 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.

일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

또한, 본 발명의 각 실시예에 포함된 각 구성, 과정, 공정 또는 방법 등은 기술적으로 상호 간 모순되지 않는 범위 내에서 공유될 수 있다.

이하, 도 1 내지 도 10을 참조하여, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템을 설명한다.

도 1을 참조하면, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템은 제1 매출 예측 서버(200)를 포함하고, 제1 매출 예측 서버(200)는 가맹점(100) 및 외부 기관(300)과 데이터를 주고받을 수 있다.

가맹점(100)은 매출 예측이 필요한 업체일 수 있다. 가맹점(100)은 예를 들어, 외식업을 운영하는 식당이나 레스토랑일 수 있으나, 본 실시예가 이에 제한되는 것은 아니다.

가맹점(100)은 내부에 설치된 POS(Point of Sale) 단말기가 있고, 이를 통해서 POS 데이터(DP)를 생성할 수 있다. POS 데이터(DP)는 시간에 따라 기록된 판매 내역을 포함할 수 있다. 이때, 판매 내역은 팔린 메뉴, 판매 금액, 판매 시간 및 결제 방식 중 적어도 하나를 포함할 수 있다.

또한, POS 데이터(DP)는 카드 결제의 경우 카드 내역을 포함할 수 있다. 이때, 개인정보 보호를 위해서 카드 내역은 일부 자리가 비식별화되어 저장될 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.

가맹점(100)은 제1 매출 예측 서버(200)로 POS 데이터(DP)를 전송할 수 있다. 이때, POS 데이터(DP)는 시계열 데이터 즉, 시간적으로 연속적으로 생성되는 데이터일 수 있다. 따라서, 가맹점(100)은 제1 매출 예측 서버(200)로 POS 데이터(DP)를 1회성으로 보내는 것이 아니라 연속적으로 보낼 수 있다. 이때, 가맹점(100)이 주기적으로 POS 데이터(DP)를 제1 매출 예측 서버(200)로 보낼 수도 있고, 실시간으로 계속해서 POS 데이터(DP)를 제1 매출 예측 서버(200)로 보낼 수도 있다. 물론, 가맹점(100)이 POS 데이터(DP)를 비정기적으로 제1 매출 예측 서버(200)로 보내는 것도 가능할 수 있다.

외부 기관(300)은 가맹점(100)의 매출과 관련된 여러 요인에 대한 데이터를 생성하는 기관일 수 있다. 도 1에서는 외부 기관(300)이 단일 기관인 것처럼 도시되어 있지만, 본 실시예가 이에 제한되는 것은 아니다. 즉, 외부 기관(300)은 1개 또는 2개 이상의 기관일 수 있다.

외부 기관(300)은 외부 데이터(De)를 생성하여 제1 매출 예측 서버(200)로 전송할 수 있다. 외부 데이터(De)는 외부 기관(300)의 종류에 따라 여러 종류의 데이터를 포함할 수 있다. 외부 데이터(De)는 가맹점(100)의 매출에 영향을 줄 만한 다양한 데이터를 의미할 수 있다.

예를 들어, 외부 데이터(De)는 공공 데이터, 민간 공개 API(Application Programming Interface) 제공 데이터, 시장 금리 데이터, KOSPI 데이터, 경제정책불확실성 데이터, 소비자물가지수 데이터, 생산자물가지수 데이터, 소비자동향지수 데이터, 경제심리지수 데이터, 숙박 및 음식점 생산지수 데이터 및 GDP 데이터 중 적어도 하나를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.

외부 데이터(De) 중 생활 인구 데이터는 특정 위치 범위에서의 특정 시간에 따른 유동인구에 대한 시계열 데이터일 수 있다. 생활 인구 데이터를 제공하는 외부 기관(300)은 예를 들면, 통신사 사업자이거나 빅데이터 활용을 위해 데이터를 제공하는 공공 기관일 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.

생활 인구 데이터는 가맹점(100)의 근처 위치에 대해서 집계될 수 있다. 예를 들어 생활 인구 데이터는 가맹점(100)으로부터 0~1km 이내의 범위에서의 유동인구에 대한 시계열 데이터일 수 있다. 상기 범위가 너무 넓은 경우에는 가맹점(100)의 매출과 관련성이 떨어질 수 있으므로 상기 범위를 적절하게 미리 설정할 수 있다.

다른 예로, 외부 데이터(De)는 공공 데이터를 포함할 수 있다. 공공 데이터는 예를 들어, 공휴일/절기 데이터, 기상 정보 데이터, 지역 축제 일정 데이터 및 질병 확진자 수 데이터를 포함할 수 있다.

공휴일/절기 데이터의 경우에는 공휴일 데이터와 절기 데이터를 포함할 수 있다. 공휴일 데이터는 해당 시간이 공휴일인지 아닌지의 데이터를 이진법으로 표시한 데이터일 수 있다. 즉, 공휴일인 경우 1, 아닌 경우 0과 같이 표시하여 공휴일 여부를 판단하는 데이터일 수 있다.

절기 데이터는 입춘, 입추 및 동지와 같은 24 절기를 판단하는 데이터일 수 있다. 절기 데이터는 단순히 24절기에 해당되느냐 아니냐로 표시될 수도 있고, 24절기 각각에 해당되는지 여부에 대한 24개의 데이터를 각각 포함할 수 있다. 또한, 24 절기 중 일부에 대해서만 생성될 수도 있다. 이 경우, 어느 절기가 매출과 관련성이 높은지에 대한 판단을 통해서 미리 데이터가 생성될 절기가 결정될 수 있다.

또한, 공휴일/절기 데이터는 공휴일과 24절기가 아닌 날짜에 대한 데이터도 포함할 수 있다. 예를 들어, 초복, 중복 및 말복은 24절기는 아니지만 삼계탕과 같은 메뉴의 매출과 관련이 있을 수 있다. 따라서, 초복, 중복 및 말복인지에 대한 이진 데이터가 각각 혹은 같이 생성될 수 있다.

기상 정보 데이터는 기상청을 외부 기관(300)으로 하여 수집될 수 있다. 기상 정보 데이터는 다양한 날씨 정보를 포함할 수 있다. 예를 들어, 기상 정보 데이터는 날씨 데이터, 기온 데이터, 습도 데이터, 강수량 데이터, 강우량 데이터, 풍속 데이터, 일출/일몰 시간 데이터, 일사량 데이터 중 적어도 하나를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.

또한, 기상 정보 데이터는 위의 기본적인 데이터를 가공하여 만든 날씨 변화 데이터를 포함할 수도 있다. 예를 들어, 눈이 오고 기온이 5℃ 이상 상승하였는지, 오전에 비가 오고 점심 시간 이전에 날이 개었는지에 대한 데이터 등 다양한 방식의 기상 판단이 이진 데이터 형식으로 미리 설정될 수 있다. 이는 경험적으로 특정 메뉴에 대한 매출에 영향이 있는 날씨의 변화에 대한 데이터일 수 있다.

지역 축제 일정 데이터는 가맹점(100) 근처에서 개최되는 지역 축제의 일정에 대한 데이터일 수 있다. 이 경우 외부 기관(300)은 축제를 개최하는 공공 기관 또는 민간 기관일 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다. 지역 축제 일정 데이터는 유동 인구에 크게 영향을 미치므로 가맹점(100)의 매출에도 당연히 영향을 미칠 수 있다.

질병 확진자 수 데이터의 경우 외부 기관(300)은 정부 공공 기관일 수 있다. 질병 확진자 수와 같은 질병 정보는 유동 인구에 큰 영향을 미칠 수 있으므로 가맹점(100)의 매출에도 당연히 영향을 미칠 수 있어 고려해야하는 외부 요인으로 볼 수 있다.

또한, 외부 데이터(De)는 민간 공개 API 제공 데이터를 포함할 수 있다. 민간 공개 API 제공 데이터는 예를 들어, 포털 사이트의 키워드 검색 빈도를 포함할 수 있다.

이때, 어떤 키워드에 대한 검색 빈도를 외부 데이터(De)로 판단하는 지는 미리 결정될 수 있다. 예를 들어, 가맹점(100)의 명칭, 가맹점(100)의 메뉴 명칭 및 가맹점(100) 메뉴 명칭의 상위 개념이 키워드에 포함될 수 있다. 즉, 만약 '부자 김밥'이라는 가맹점(100)이 '참치 김밥'을 판매한다면, 키워드는 '부자 김밥', '참치 김밥' 및 '김밥'을 포함할 수 있다.

이때, 키워드 검색 빈도 데이터는 정규화되어 제공될 수도 있다. 즉, 키워드 검색 빈도 데이터는 미리 설정된 기준에 따라 최대값을 100, 최소값을 0으로 하여 0~100 사이의 수로 수집될 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.

외부 데이터(De)는 경제 지표 데이터를 포함할 수 있다. 경제 지표 데이터는 일단위 데이터 및 월단위 데이터를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.

일단위 데이터는 시장금리 데이터, 주가 데이터를 포함할 수 있다. 주가 데이터는 국내의 KOSPI(KOrea Composite Stock Price Index) 지수 데이터, KOSDAQ(Korea Securities Dealers Automated Quotation) 지수 데이터, 미국의 NASDAQ(National Association of Securities Dealers Automated Quotation) 지수 데이터, 다우존스(Dow Jones) 지수 데이터 중 적어도 하나를 포함할 수 있다.

이러한 주가 데이터는 실시간 데이터로 제공되긴 하지만, 변화가 너무 빠르므로 일단위 데이터로 제공받을 수 있다. 이 경우, 장이 마감되는 시점의 지수를 주가 데이터로 정의할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.

이 외에도, 경제 지표 데이터는 각종 가상화폐의 가치에 대한 데이터 및 환율 등을 포함할 수도 있다.

월단위 데이터는 경제정책불확실성(EPU; Economic Policy Uncertainty) 지수 데이터, 소비자물가지수 데이터, 생산자물가지수 데이터, 소비자동향지수 데이터, 경제심리지수 데이터, 숙박 및 음식점 생산지수 데이터 및 GDP(Gross domestic product) 데이터 중 적어도 하나를 포함할 수 있다.

이러한 경제 지표 데이터는 당연히 대중들의 소비에 영향을 미치므로 가맹점(100)의 매출을 예측할 때 고려해야할 요인이 될 수 있다.

제1 매출 예측 서버(200)는 POS 데이터(DP) 및 외부 데이터(De)를 수신하고, 매출 예측 데이터(Des)를 생성할 수 있다. 제1 매출 예측 서버(200)는 가맹점(100)에게 매출 예측 데이터(Des)를 전송할 수 있다.

제1 매출 예측 서버(200)는 워크스테이션(workstation), 데이터 센터, 인터넷 데이터 센터(internet data center(IDC)), DAS(direct attached storage) 시스템, SAN(storage area network) 시스템, NAS(network attached storage) 시스템 및 RAID(redundant array of inexpensive disks, or redundant array of independent disks) 시스템 중 적어도 하나로 구현될 수 있으나, 본 실시예가 이에 제한되는 것은 아니다.

제1 매출 예측 서버(200)는 가맹점(100)으로 네트워크를 통해서 데이터를 전송할 수 있다. 네트워크는 유선 인터넷 기술, 무선 인터넷 기술 및 근거리 통신 기술에 의한 네트워크를 포함할 수 있다. 유선 인터넷 기술은 예를 들어, 근거리 통신망(LAN, Local area network) 및 광역 통신망(WAN, wide area network) 중 적어도 하나를 포함할 수 있다.

무선 인터넷 기술은 예를 들어, 무선랜(Wireless LAN: WLAN), DLNA(Digital Living Network Alliance), 와이브로(Wireless Broadband: Wibro), 와이맥스(World Interoperability for Microwave Access: Wimax), HSDPA(High Speed Downlink Packet Access), HSUPA(High Speed Uplink Packet Access), IEEE 802.16, 롱 텀 에볼루션(Long Term Evolution: LTE), LTE-A(Long Term Evolution-Advanced), 광대역 무선 이동 통신 서비스(Wireless Mobile Broadband Service: WMBS) 및 5G NR(New Radio) 기술 중 적어도 하나를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.

근거리 통신 기술은 예를 들어, 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association: IrDA), UWB(Ultra-Wideband), 지그비(ZigBee), 인접 자장 통신(Near Field Communication: NFC), 초음파 통신(Ultra Sound Communication: USC), 가시광 통신(Visible Light Communication: VLC), 와이 파이(Wi-Fi), 와이 파이 다이렉트(Wi-Fi Direct), 5G NR (New Radio) 중 적어도 하나를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.

네트워크를 통해서 통신하는 제1 매출 예측 서버(200)는 이동통신을 위한 기술표준 및 표준 통신 방식을 준수할 수 있다. 예를 들어, 표준 통신 방식은 GSM(Global System for Mobile communication), CDMA(Code Division Multi Access), CDMA2000(Code Division Multi Access 2000), EV-DO(Enhanced Voice-Data Optimized or Enhanced Voice-Data Only), WCDMA(Wideband CDMA), HSDPA(High Speed Downlink Packet Access), HSUPA(High Speed Uplink Packet Access), LTE(Long Term Evolution), LTEA(Long Term Evolution-Advanced) 및 5G NR(New Radio) 중 적어도 하나를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.

도 2는 도 1의 제1 매출 예측 서버를 세부적으로 설명하기 위한 블록도이고, 도 3은 도 1의 POS 데이터 및 외부 데이터를 설명하기 위한 개념도이다. 도 4는 도 2의 POS 데이터 처리 모듈을 세부적으로 설명하기 위한 블록도이고, 도 5는 도 2의 데이터 조정 모듈을 세부적으로 설명하기 위한 블록도이다. 도 6 및 도 7은 도 5의 데이터 안정화 모듈이 데이터를 안정화하는 것을 설명하기 위한 중간 도면들이고, 도 8은 도 5의 VAR 분석 모듈이 시점에 따른 상관관계를 분석하는 것을 설명하기 위한 예시도이다. 도 9는 도 2의 입력 데이터 재구성 모듈을 세부적으로 설명하기 위한 블록도이고, 도 10은 도 9의 조정 데이터의 예시도이다. 도 11은 도 9의 스케일링된 데이터의 예시도이고, 도 12는 도 2의 시계열 예측 모듈을 세부적으로 설명하기 위한 블록도이다.

도 2를 참조하면, 제1 매출 예측 서버(200)는 POS 데이터 처리 모듈(210), 외부 데이터 처리 모듈(220), 데이터 조정 모듈(230), 입력 데이터 재구성 모듈(240), 시계열 예측 모듈(250) 및 오차율 판단 모듈(260)을 포함할 수 있다.

POS 데이터 처리 모듈(210)은 POS 데이터(DP)를 수신할 수 있다. POS 데이터 처리 모듈(210)은 POS 데이터(DP)로부터 재방문 데이터(Dr) 및 매출 데이터(Ds)를 생성할 수 있다. 외부 데이터 처리 모듈(220)은 외부 데이터(De)를 수신하여 처리된 외부 데이터(Dep)를 생성할 수 있다.

도 3을 참조하면, POS 데이터(DP) 및 외부 데이터(De)는 시계열 데이터일 수 있다. 즉, 시간적으로 연속적으로 이루어진 데이터일 수 있다. POS 데이터(DP)는 제1 POS 데이터(Dp1) 및 제2 POS 데이터(Dp2)를 포함할 수 있다. 제1 POS 데이터(Dp1)는 제1 시점(t1)에서부터 제2 시점(t2)까지의 POS 데이터(DP)일 수 있다. 제2 POS 데이터(Dp2)는 제2 시점(t2)에서부터 제3 시점(t3)까지의 POS 데이터(DP)일 수 있다. 제1 시점(t1)은 제2 시점(t2)보다 과거일 수 있고, 제3 시점(t3)은 제2 시점(t2)보다 과거일 수 있다.

유사하게, 외부 데이터(De)는 제1 외부 데이터(De1) 및 제2 외부 데이터(De2)를 포함할 수 있다. 제1 외부 데이터(De1)는 제1 시점(t1)에서부터 제2 시점(t2)까지의 외부 데이터(De)일 수 있다. 제2 외부 데이터(De2)는 제2 시점(t2)에서부터 제3 시점(t3)까지의 외부 데이터(De)일 수 있다.

가장 먼저 POS 데이터 처리 모듈(210)과 외부 데이터 처리 모듈(220)에 수신되는 데이터는 각각 제1 POS 데이터(Dp1) 및 제1 외부 데이터(De1)일 수 있다. 제1 매출 예측 서버(200)는 먼저, 제1 POS 데이터(Dp1) 및 제1 외부 데이터(De1)에 대해서 매출 예측 데이터(Des)를 생성하고, 추후에 제3 시점(t3)까지의 제2 POS 데이터(Dp2) 및 제2 외부 데이터(De2)가 업데이트된 POS 데이터(DP) 및 외부 데이터(De)를 이용하여 최종적인 매출 예측 데이터(Des)를 생성할 수 있다. 이에 대해서는 추후에 더 자세히 설명한다.

도 4를 참조하면, POS 데이터 처리 모듈(210)은 재방문 수치 산출 모듈(211) 및 매출 데이터 산출 모듈(212)을 포함할 수 있다.

재방문 수치 산출 모듈(211) 및 매출 데이터 산출 모듈(212)은 이상치 제거 작업을 공통적으로 수행할 수 있다. 이상치 제거 작업은 재방문 수치 산출 모듈(211) 및 매출 데이터 산출 모듈(212)에서 각각 진행될 수도 있고, 하나의 모듈에서 진행된 이후에 서로 공유될 수도 있다.

이상치 제거 작업은 카드 결제 내역 중 취소가 발생한 승인 건에 대해서 검색하고, 취소와 쌍을 이루는 승인 건을 확인하여 모두 제거하는 작업을 포함할 수 있다. 즉, 취소 건과 승인 건은 1:1로 대응되어 삭제될 수 있다.

또한, 이상치 제거 작업은 카드 결제가 연속으로 빠르게 이루어진 경우에는 이를 불법 할인대출로 판단하여 제거하는 작업을 포함할 수 있다. 불법 할인 대출이란, 신용카드로 결제하는 것처럼 꾸민 뒤 현금을 받는 불법 행위를 의미할 수 있다.

또한, 이상치 제거 작업은 카드 결제 내역에 의해서 산출된 데이터가 과거의 데이터에 비해서 지나치게 높거나 낮은 경우 정밀 검토를 수행하도록 설정될 수 있다. 예를 들어, IQR(InterQuartile Range) 기반 하위 25%나 상위 25% 구간에 분포하는 값이 나타난다면 이에 대해서 정밀 검토가 수행될 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.

재방문 수치 산출 모듈(211)은 POS 데이터(DP)를 수신하고, 재방문 데이터(Dr)를 산출할 수 있다. 재방문 수치 산출 모듈(211)은 POS 데이터(DP)의 이상치가 제거된 카드 결제 내역을 이용할 수 있다. 재방문 수치 산출 모듈(211)은 카드 결제 내역 중 비식별화되지 않은 숫자를 이용하여 동일한 사용자를 식별할 수 있다.

즉, 재방문 수치 산출 모듈(211)은 카드 결제 내역 중 중복되는 재방문 내역을 추출할 수 있다. 그리고, 재방문 수치 산출 모듈(211) 이러한 재방문 내역을 재방문 간격에 따라 분류할 수 있다. 예를 들어, 재방문 수치 산출 모듈(211)은 간격이 30일 이하인 데이터를 1달 이내 재방문 데이터로 분류하고, 간격이 31일 이상 60일 이하인 데이터를 2달마다 재방문 데이터로 분류하고, 간격이 61일 이상 90일 이하인 데이터를 3달마다 재방문 데이터로 분류할 수 있다. 또한, 추가적으로 91일 이상의 간격은 4달 이상 간격 재방문 데이터로 분류할 수 있다. 각각의 재방문 데이터는 그에 해당하는 수치를 포함할 수 있다. 위의 4가지로의 분류 방식은 예시에 불과하고, 본 실시예가 이에 제한되는 것은 아니다.

재방문 데이터(Dr)는 시간별 데이터로도 산출 가능하고, 일별, 월별 데이터로도 산출 가능할 수 있다. 즉, 시간별 데이터인 경우 시간별로 1달 이내 재방문 데이터, 2달마다 재방문 데이터, 3달마다 재방문 데이터 및 4달 이상 간격 재방문 데이터가 각각 생성될 수 있다. 같은 방식으로 일별, 월별 데이터로도 산출이 가능할 수 있다.

매출 데이터 산출 모듈(212)은 POS 데이터(DP)에서 매출 데이터(Ds)를 산출할 수 있다. 매출 데이터(Ds)는 시간별로 매출이 기록된 시계열 데이터일 수 있다. 매출 데이터(Ds)는 전체 매출에 대한 데이터도 당연히 포함하지만, 메뉴별 매출에 대한 데이터도 포함할 수 있다. 즉, 가맹점(100)이 '국밥'을 메뉴로 파는 경우 '국밥'에 대한 매출 데이터가 매출 데이터(Ds)에 포함될 수 있다.

다시, 도 2를 참조하면, 외부 데이터 처리 모듈(220)은 외부 데이터(De)를 수신하여 처리된 외부 데이터(Dep)를 생성할 수 있다. 이때, 처리된 외부 데이터(Dep)는 매출 데이터(Ds)의 시간 단위와 동일한 시간 단위로 재구성될 수 있다. 예를 들어, 매출 데이터(Ds)가 시간 단위인 경우, 일단위 및 월단위의 외부 데이터(De)는 시간 단위로 재구성될 수 있다. 일단위의 외부 데이터(De)는 하루 종일 동일한 값으로 유지될 수 있고, 월단위의 외부 데이터(De)는 한달 내내 동일한 값으로 유지될 수 있다. 만일 매출 데이터(Ds)가 일단위인 경우 처리된 외부 데이터(Dep)도 일단위로 재구성될 수 있다.

도 5 내지 도 8을 참조하면, 데이터 조정 모듈(230)은 데이터 안정화 모듈(231) 및 VAR(Vector Auto Regression) 분석 모듈(232)을 포함할 수 있다.

데이터 안정화 모듈(231)은 재방문 데이터(Dr), 매출 데이터(Ds), 처리된 외부 데이터(Dep)를 수신할 수 있다. 데이터 안정화 모듈(231)은 재방문 데이터(Dr), 매출 데이터(Ds), 처리된 외부 데이터(Dep)를 하나의 테이블 형태의 데이터로 재편집할 수 있다. 도 6은 매출 데이터(Ds) 및 처리된 외부 데이터(Dep)가 재편집된 형태를 예시적으로 나타낸다.

도 6에서는 처리된 외부 데이터(Dep) 중 일부인 KOSPI 지수 데이터와 시장 금리 데이터만이 표시되었으나, 본 실시예가 이에 제한되는 것은 아니다. 매출 데이터(Ds)와 처리된 외부 데이터(Dep)는 각각 서로 다른 열(column)을 구성하고, 하나의 행(row)은 동일한 시간대를 의미할 수 있다.

데이터 안정화 모듈(231)은 데이터 안정화를 수행할 수 있다. 즉, 도 6의 데이터와 같이 각 열의 절대값의 차이가 큰 경우에는 연산의 속도를 높이고, 연산량을 줄이기 위해서 데이터 안정화를 수행할 수 있다. 구체적으로, 데이터 안정화 모듈(231)은 각 데이터의 값에 자연 로그를 취하고 차분을 진행할 수 있다. 이때, 차분이란 어떤 시간대의 값에 바로 전 시간대의 값을 빼 준 값을 대신 채워주는 것으로 각 시간대에는 전시간대에 대한 증감량이 표시될 수 있다. 즉, 데이터가 벡터화될 수 있다. 데이터 안정화 모듈(231)은 데이터 안정화를 통해서 안정화 데이터(Dst)를 생성할 수 있다.

또한, 이러한 데이터 안정화는 데이터 변수 간의 편차를 줄여줌으로써, 추후 시계열 예측 모델(252)이 학습할 때, 어느 특정 변수에 대해 가중치가 편향적으로 업데이트되는 것을 방지할 수 있다. 이를 통해서, 시계열 예측 모델(252)의 성능이 더욱 향상될 수 있다.

도 7은 데이터 안정화가 된 안정화 데이터(Dst)의 예시를 나타내고 있다. 도 7을 살펴보면 2017-11-29의 매출란에는 원래의 값에 자연 로그를 취한 뒤 2017-11-29의 값에서 2017-11-28의 값을 뺀 값이 표시된 것을 확인할 수 있다.

VAR 분석 모듈(232)은 안정화 데이터(Dst)를 수신할 수 있다. VAR 분석 모듈(232)은 매출 데이터(Ds)와 다른 데이터와의 상관관계를 분석할 수 있다. 즉, VAR 분석 모듈(232)은 매출 데이터(Ds)와 재방문 데이터(Dr), 매출 데이터(Ds)와 처리된 외부 데이터(Dep)의 상관관계를 분석할 수 있다. 이때, 단순히 같은 시점의 데이터 간의 상관관계를 분석할 뿐만 아니라 서로 다른 시점 간의 상관관계도 분석할 수 있다.

도 8은 매출 데이터(Ds)와 처리된 외부 데이터(Dep) 즉, KOSPI 데이터 및 시장 금리 데이터와의 상관관계가 나타나 있다. “coefficient” 부분은 상관계수를 의미한다. 이 수치가 +이면 양의 상관관계, -이면 음의 상관관계를 의미할 수 있다.

“prob” 부분은 p value로서 신뢰도 95%로 설정할 경우 0.05 이하일 때만 위의 “coefficient”가 유효한 것으로 확인할 수 있다. “L1. 상인”이 나타난 행은 현재 매출 데이터(Ds)와 하루 전의 매출 데이터(Ds)의 상관관계를 나타낸 행이다. 유사하게, “L2. 상인”은 현재와 이틀 전의 매출 데이터(Ds)의 상관관계이다.

마찬가지로, “L4. KOSPI”는 4일 전의 KOSPI 지수 데이터와 매출 데이터(Ds) 사이의 상관관계를 나타낼 수 있다. 상관계수가 높은 “L8. 금리”를 확인해보면 p value도 0.05 이하이므로 유효할 수 있다. 따라서, 매출 데이터(Ds)와 처리된 외부 데이터(Dep) 중 시장 금리 데이터는 8일 정도의 시간 간격이 상관관계가 높은 것을 확인할 수 있다. 즉, 시장 금리 데이터가 변동하면 그에 따라 8일 후에 매출에 영향을 가장 크게 미치는 것을 확인할 수 있다.

이와 같이 VAR 분석 모듈(232)은 가장 상관관계가 크고 신뢰할 수 있는 시점을 찾아서 조정 데이터(Da)를 생성할 수 있다. 조정 데이터(Da)는 현재 매출 데이터(Ds)와 8일전의 시장 금리 데이터가 테이블 형식으로 구성된 데이터일 수 있다. 마찬가지로, 다른 처리된 외부 데이터(Dep) 및 재방문 데이터(Dr)도 현재 매출 데이터(Ds)와 가장 상관관계가 높은 시점을 찾아서 조정 데이터(Da)로 결합될 수 있다. 이때, 조정 데이터(Da)는 상기 안정화 작업이 되어있지 않은 상태일 수 있다. 즉, 안정화 작업은 VAR 분석을 위한 작업이고, 추후 조정 데이터(Da)는 스케일링 모듈(241)에 의해서 스케일링 단계를 거칠 수 있다.

본 실시예는 이를 통해서, 여러가지 요인의 시계열 데이터의 시점 중 가장 영향이 많은 시점을 찾아내어 분석에 사용하므로 매우 정밀하고 정확한 예측이 가능할 수 있다.

도 2 및 도 9 내지 도 11을 참조하면, 입력 데이터 재구성 모듈(240)은 스케일링 모듈(241), 데이터 분리 모듈(242) 및 3차원 데이터 재구성 모듈(243)을 포함할 수 있다.

스케일링 모듈(241)은 조정 데이터(Da)를 수신하여 스케일링 작업을 수행할 수 있다. 스케일링 모듈(241)은 조정 데이터(Da)를 정규화하는 작업을 의미할 수 있다. 즉, 각각의 데이터가 값의 범위가 다양하므로 추후 연산할 때 속도가 느려지고, 연산량이 많아질 수 있다. 도 10은 조정 데이터(Da)의 예시도로, 각각의 컬럼의 값의 범위가 매우 다양함을 확인할 수 있다.

따라서, 스케일링 모듈(241)은 min-max 스케일링 기법을 통해서 모든 데이터의 값을 0~1 사이의 값으로 정규화할 수 있다. 이를 통해서 데이터의 크기를 줄이고 처리 속도를 비약적으로 높일 수 있다. 나아가, 수치의 크기가 커서 발생할 수 있는 여러 문제점을 사전에 방지할 수 있다. 즉, 스케일링 모듈(241)은 스케일링을 통해서 스케일링된 데이터(Das)를 생성할 수 있다. 도 11은 스케일링된 데이터(Das)의 예시도로, 모든 컬럼의 값이 0에서 1 사이로 스케일링된 것을 확인할 수 있다.

또한, 상술한 바와 같이 데이터의 정규화도 데이터 변수 간의 편차를 줄여줌으로써, 추후 시계열 예측 모델(252)이 학습할 때, 어느 특정 변수에 대해 가중치가 편향적으로 업데이트되는 것을 방지할 수 있다. 이를 통해서, 시계열 예측 모델(252)의 성능이 더욱 향상될 수 있다.

이때, 스케일링 모듈(241)은 min-max 스케일링 기법 외에도 standard 스케일링 기법, max abs 스케일링 기법, robust 스케일링 기법 중 어느 하나를 채용하여 스케일링을 수행할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.

데이터 분리 모듈(242)은 스케일링된 데이터(Das)를 수신하여 트레이닝 데이터, 밸리데이션 데이터 및 테스트 데이터로 분리할 수 있다. 이렇게 분리된 데이터는 분리 데이터(Das_sep)에 포함될 수 있다.

트레이닝 데이터는 딥러닝 모듈의 가중치(weight)나 바이어스(bias) 즉, 파라미터를 조율하는데 사용될 수 있다. 즉, 딥러닝 모듈의 학습에 사용될 수 있다. 밸리데이션 데이터는 하이퍼 파라미터를 조절하기 위해서 필요한 데이터 세트를 의미할 수 있다. 이때, 하이퍼 파라미터는 학습률(learning rate), 가중치 감쇠(weight decay), 비용 함수(cost function), 컨볼루션 필터의 개수 등 사람의 경험 및 직관으로 조절해야 되는 파라미터를 의미할 수 있다. 즉, 밸리데이션 데이터를 이용하여 모델의 오차(loss), 정확도(accuracy)를 평가하면서 하이퍼 파라미터를 조절할 수 있다.

테스트 데이터는 딥러닝 모듈의 학습에는 영향을 주지 않고, 테스트를 위한 데이터 세트일 수 있다. 분리 데이터(Das_sep)는 이러한 3가지 종류의 데이터를 포함하여 추후 시계열 예측 모델(252)의 학습에 사용될 수 있다.

3차원 데이터 재구성 모듈(243)은 분리 데이터(Das_sep)를 수신하여 입력 데이터(Di)로 재구성할 수 있다. 3차원 데이터 재구성 모듈(243)은 2차원의 분리 데이터(Das_sep)를 3차원의 입력 데이터(Di)로 재구성할 수 있다. 이때, 당연히 입력 데이터(Di)도 트레이닝 데이터, 밸리데이션 데이터 및 테스트 데이터로 분리되어 있을 수 있다.

입력 데이터(Di)는 시간을 나타내는 행(row)과 각 특징(feature) 즉, 데이터의 종류에 따른 열(column)의 2차원 데이터를 배치 사이즈(batch size)에 맞추어 3차원 형태로 적층한 데이터일 수 있다. 이때, 행의 수는 어느 정도의 시간을 학습시킬지에 따라 미리 정해질 수 있다. 또한, 열의 수는 학습 변수의 개수에 따라 결정될 수 있다. 배치 사이즈는 한 번에 학습시킬 데이터의 양에 따라 결정될 수 있다.

도 2 및 도 12를 참조하면, 시계열 예측 모듈(250)은 모델링 모듈(251) 및 시계열 예측 모델(252)을 포함할 수 있다.

모델링 모듈(251)은 오차율 정보(Re)를 수신하여 시계열 예측 모델(252)의 하이퍼 파라미터(HP)를 재설정하고, 시계열 예측 모델(252)의 모델링을 수행할 수 있다. 이때, 오차율 정보(Re)가 모델링 모듈(251)에 미리 설정된 기준 오차율보다 낮은 경우에는 현재의 시계열 예측 모델(252)의 파라미터를 그대로 저장할 수 있다. 즉, 오차율 정보(Re)가 모델링 모듈(251)에 미리 설정된 기준 오차율보다 높은 경우에만 하이퍼 파라미터(HP) 및 시계열 예측 모델(252)의 모델링이 재설정될 수 있다.

시계열 예측 모델(252)은 딥러닝 모델로서 입력 데이터(Di)를 수신할 수 있다. 시계열 예측 모델(252)은 입력 데이터(Di)에 포함된 트레이닝 데이터, 밸리데이션 데이터 및 테스트 데이터를 통해서 파라미터가 조절되고 평가될 수 있다. 시계열 예측 모델(252)은 입력 데이터(Di)에 따라 매출 예측 데이터(Des)를 도출할 수 있다.

시계열 예측 모델(252)은 예를 들어, LSTM(Long Short Term Memory) 레이어를 입력 레이어로 하고, 출력 레이어로 덴스(Dense) 레이어를 사용할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다. 시계열 예측 모델(252)은 컨볼루션 레이어를 이용하여 CNN(Convolution Neural Network)-LSTM 레이어를 채용할 수도 있고, 양방향 LSTM(Bi LSTM) 레이어를 채용할 수도 있다.

덴스 레이어의 활성화 함수(activation function)는 ReLU(Rectified Linear Unit) 및 LeakyReLU 중 어느 하나를 포함할 수 있다. 이때, LeakyReLU를 사용하는 경우 매출이라는 연속적인 값을 예측하는 과정에서 가중치가 음수가 되는 경우를 차단할 수 있다. 이 경우에는 기울기가 0이 되어서 데이터(gradient)가 손실되는 경우를 방지할 수 있다.

모델링 모듈(251)은 밸리데이션 데이터를 이용하여 손실 측도(loss metric)를 확인하고 최적의 하이퍼 파라미터(HP)를 탐색할 수 있다. 이때, 모델링 모듈(251)은 소프트웨어 상의 자동화 도구를 사용하여 최적의 하이퍼 파라미터(HP)를 탐색할 수 있다. 최적의 하이퍼 파라미터(HP)는 손실 측도가 최소가 되는 값일 수 있다.

다시, 도 2를 참조하면, 오차율 판단 모듈(260)은 시계열 예측 모듈(250)로부터 매출 예측 데이터(Des)를 수신할 수 있다. 오차율 판단 모듈(260)은 매출 예측 데이터(Des)와 매출 데이터(Ds)를 비교하여 오차율 정보(Re)를 생성할 수 있다.

도 2 및 도 3을 참조하면, 시계열 예측 모듈(250)이 생성한 매출 예측 데이터(Des)는 제2 시점(t2) 및 제3 시점(t3) 사이의 매출 예측 데이터(Des)일 수 있다. 즉, 시계열 예측 모듈(250)은 제1 POS 데이터(Dp1) 및 제1 외부 데이터(De1)를 기초로, POS 데이터 처리 모듈(210), 외부 데이터 처리 모듈(220), 데이터 조정 모듈(230), 입력 데이터 재구성 모듈(240)을 거쳐서 준비된 입력 데이터(Di)를 이용하여 매출 예측 데이터(Des)를 생성할 수 있다.

오차율 판단 모듈(260)은 제2 POS 데이터(Dp2)를 수신하여 매출 예측 데이터(Des)와 비교하고 오차율을 판단할 수 있다. 이에 따라, 오차율 판단 모듈(260)은 오차율 정보(Re)를 생성할 수 있다. 오차율 판단 모듈(260)의 오차율 정보(Re) 생성은 테스트 데이터에 의한 오차율 판단과는 별개의 단계일 수 있다.

도 1 내지 도 3 및 도 12를 참조하면, 모델링 모듈(251)은 미리 설정된 기준 오차율보다 오차율 정보(Re)에서 포함된 오차율이 높다면 시계열 예측 모델(252)의 모델링을 다시 수행할 수 있다. 만일 미리 설정된 기준 오차율보다 오차율 정보(Re)에서 포함된 오차율이 낮다면, 시계열 예측 모델(252)이 충분히 신뢰할 수 있으므로, 모델링 모듈(251)은 시계열 예측 모델(252)의 파라미터를 저장하고 확정할 수 있다. 이때, 기준 오차율은 7%일 수 있으나, 본 실시예가 이에 제한되는 것은 아니다.

즉, 본 실시예는 테스트 데이터에 의한 오차율의 판단과 별개로 다시 오차율 판단 모듈(260)에 의해서 오차를 판단하여 더욱 정밀하고 정확한 예측 모델을 생성할 수 있다.

이런 단계의 반복 속에 최종적으로 오차율 정보(Re)의 오차율이 기준 오차율보다 낮아서 시계열 예측 모델(252)이 확정된 경우에는 시계열 예측 모듈(250)은 최신 정보까지 업데이트된 POS 데이터(DP) 및 외부 데이터(De)를 이용하여 매출 예측 데이터(Des)가 다시 생성될 수 있고, 이러한 매출 예측 데이터(Des)는 가맹점(100)에 제공될 수 있다.

즉, 이 경우 이용되는 POS 데이터(DP)는 제1 POS 데이터(Dp1) 및 제2 POS 데이터(Dp2)를 모두 포함한 데이터 중 최신의 데이터일 수 있다. 마찬가지로, 이 경우 이용되는 외부 데이터(De)는 제1 외부 데이터(De1) 및 제2 외부 데이터(De2)를 모두 포함한 데이터 중 최신의 데이터일 수 있다.

매출 예측 데이터(Des)는 시계열 데이터로 시간의 흐름에 따른 매출의 예측치를 포함할 수 있다. 또한, 매출 예측 데이터(Des)는 가맹점(100)이 외식업인 경우 메뉴에 따른 매출의 예측치도 포함할 수 있다.

본 실시예에 따른 매장 운영 예측 시스템은 여러 외부 요인을 통해서 매출을 예측하여 정밀한 매출 예측을 수행하고, 각 외부 요인과 매출의 상관관계를 시점별로 분석하여 가장 높은 상관관계에 대한 입력 데이터를 구축하여 시계열 예측 모델(252)에 제공하여 높은 정확도를 가지는 매출 예측 데이터(Des)를 산출할 수 있다.

나아가, 오차율의 판단을 여러 번하여 최적의 파라미터를 가지는 모델을 확정함으로써 더욱 정확하고 신뢰성 높은 매출 예측 데이터(Des) 제공할 수 있다.

이하, 도 13 및 도 14를 참조하여, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템을 설명한다. 상술한 실시예와 중복되는 부분은 간략히 하거나 생략한다.

도 13은 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템을 설명하기위한 개념도이고, 도 14는 도 13의 제2 매출 예측 서버를 세부적으로 설명하기 위한 블록도이다.

도 13을 참조하면, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템은 제2 매출 예측 서버(201)를 포함할 수 있다. 제2 매출 예측 서버(201)는 가맹점(100)으로부터 POS 데이터(DP)를 수신하고, 외부 기관(300)으로부터 외부 데이터(De)를 수신한 뒤, 매출 예측 데이터(Des)와 함께 식자재 추천 발주 정보(Df)를 가맹점(100)에게 제공할 수 있다.

도 14를 참조하면, 제2 매출 예측 서버(201)는 식자재 추천 발주 정보 모듈(270)을 더 포함할 수 있다.

식자재 추천 발주 정보 모듈(270)은 매출 예측 데이터(Des)를 수신하고, 식자재 추천 발주 정보(Df)를 생성할 수 있다. 구체적으로, 식자재 추천 발주 정보 모듈(270)은 각각의 메뉴에 들어가는 식자재의 수량에 대한 정보와 식자재의 발주시 배송 기간, 유통 기한 등의 식자재 세부 정보를 저장할 수 있다.

식자재 추천 발주 정보 모듈(270)은 매출 예측 데이터(Des)에 따라서, 메뉴별 매출 예측을 식별하고, 그에 따른 식자재 수요를 산출할 수 있다. 또한, 이러한 식자재 수요에 따른 식자재 발주 스케쥴링에 따라 적절한 시기에 가맹점(100)에게 식자재 추천 발주 정보(Df)를 제공할 수 있다.

이에 따라, 가맹점(100)은 적절한 시기에 필요한 식자재를 필요한 양만큼 주문할 수 있다. 이에 따라, 낭비되는 식자재를 줄이고, 식자재가 부족하여 급하게 비싼 값으로 식자재를 구입하여야 하는 상황도 줄여 매장 운용의 안전성을 높이고 비용도 최소화할 수 있다.

이하, 도 1 내지 도 12 및 도 15 내지 도 17을 참조하여, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 방법을 설명한다. 상술한 실시예와 중복되는 부분은 간략히 하거나 생략한다.

도 15는 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 방법을 설명하기위한 순서도이고, 도 16은 도 15의 재방문 데이터 생성 단계를 세부적으로 설명하기 위한 순서도이다. 도 17은 도 15의 조정 데이터 생성 단계를 세부적으로 설명하기 위한 순서도이다.

도 15를 참조하면, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 방법은 POS 데이터 및 외부 데이터를 수신하여 매출 데이터, 재방문 데이터 및 처리된 외부 데이터를 생성한다(S100).

구체적으로, 도 4를 참조하면, 매출 데이터 산출 모듈(212)은 POS 데이터(DP)에서 매출 데이터(Ds)를 산출할 수 있다. 매출 데이터(Ds)는 시간별로 매출이 기록된 시계열 데이터일 수 있다. 매출 데이터(Ds)는 전체 매출에 대한 데이터도 당연히 포함하지만, 메뉴별 매출에 대한 데이터도 포함할 수 있다. 즉, 가맹점(100)이 '국밥'을 메뉴로 파는 경우 '국밥'에 대한 매출 데이터가 매출 데이터(Ds)에 포함될 수 있다.

또한, 도 2를 참조하면, 외부 데이터 처리 모듈(220)은 외부 데이터(De)를 수신하여 처리된 외부 데이터(Dep)를 생성할 수 있다. 이때, 처리된 외부 데이터(Dep)는 매출 데이터(Ds)의 시간 단위와 동일한 시간 단위로 재구성될 수 있다.

또한, 재방문 데이터(Dr)에 대해서 세부적으로 설명하기 위해서 도 16을 참조하면, 먼저 카드 결제 내역 중 재방문 내역을 추출한다(S110). 이어서, 재방문 간격에 따른 수치를 산출한다(S120).

구체적으로, 도 4를 참조하면, 재방문 수치 산출 모듈(211)은 POS 데이터(DP)를 수신하고, 재방문 데이터(Dr)를 산출할 수 있다. 재방문 수치 산출 모듈(211)은 POS 데이터(DP)의 이상치가 제거된 카드 결제 내역을 이용할 수 있다. 재방문 수치 산출 모듈(211)은 카드 결제 내역 중 비식별화되지 않은 숫자를 이용하여 동일한 사용자를 식별할 수 있다. 재방문 수치 산출 모듈(211)은 카드 결제 내역 중 중복되는 재방문 내역을 추출할 수 있다. 그리고, 재방문 수치 산출 모듈(211) 이러한 재방문 내역을 재방문 간격에 따라 분류할 수 있다.

다시, 도 15를 참조하면, 데이터의 시점에 따른 상관관계를 분석하여 시점에 따른 조정 데이터를 생성한다(S200).

자세히 도 17을 참조하면, 먼저 데이터를 안정화한다(S1210).

구체적으로, 도 5 내지 도 7을 참조하면, 데이터 안정화 모듈(231)은 재방문 데이터(Dr), 매출 데이터(Ds), 처리된 외부 데이터(Dep)를 수신할 수 있다. 데이터 안정화 모듈(231)은 재방문 데이터(Dr), 매출 데이터(Ds), 처리된 외부 데이터(Dep)를 하나의 테이블 형태의 데이터로 재편집할 수 있다. 도 6은 매출 데이터(Ds) 및 처리된 외부 데이터(Dep)가 재편집된 형태를 예시적으로 나타낸다.

데이터 안정화 모듈(231)은 데이터 안정화를 수행할 수 있다. 데이터 안정화 모듈(231)은 각 데이터의 값에 자연 로그를 취하고 차분을 진행할 수 있다. 이때, 차분이란 어떤 시간대의 값에 바로 전 시간대의 값을 빼 준 값을 대신 채워주는 것으로 각 시간대에는 전시간대에 대한 증감량이 표시될 수 있다. 즉, 데이터가 벡터화될 수 있다. 데이터 안정화 모듈(231)은 데이터 안정화를 통해서 안정화 데이터(Dst)를 생성할 수 있다. 도 7은 데이터 안정화가 된 안정화 데이터(Dst)의 예시를 나타내고 있다.

다시, 도 17을 참조하면, VAR 분석을 통해서 상관관계가 높은 시점의 데이터를 확인하고(S220), 조정 데이터를 생성한다(S230).

구체적으로, 도 5 및 도 8을 참조하면, VAR 분석 모듈(232)은 안정화 데이터(Dst)를 수신할 수 있다. VAR 분석 모듈(232)은 매출 데이터(Ds)와 다른 데이터와의 상관관계를 분석할 수 있다. 즉, VAR 분석 모듈(232)은 매출 데이터(Ds)와 재방문 데이터(Dr), 매출 데이터(Ds)와 처리된 외부 데이터(Dep)의 상관관계를 분석할 수 있다. 이때, 단순히 같은 시점의 데이터 간의 상관관계를 분석할 뿐만 아니라 서로 다른 시점 간의 상관관계도 분석할 수 있다. 도 8은 상관관계 분석의 예시적인 결과를 도시하였다.

VAR 분석 모듈(232)은 가장 상관관계가 크고 신뢰할 수 있는 시점을 찾아서 조정 데이터(Da)를 생성할 수 있다. 조정 데이터(Da)는 현재 매출 데이터(Ds)와 8일전의 시장 금리 데이터가 테이블 형식으로 구성된 데이터일 수 있다. 마찬가지로, 다른 처리된 외부 데이터(Dep) 및 재방문 데이터(Dr)도 현재 매출 데이터(Ds)와 가장 상관관계가 높은 시점을 찾아서 조정 데이터(Da)로 결합될 수 있다.

다시, 도 15를 참조하면, 조정 데이터를 입력 데이터로 재구성한다(S300).

구체적으로, 도 2 및 도 9 내지 도 11을 참조하면, 스케일링 모듈(241)은 조정 데이터(Da)를 수신하여 스케일링 작업을 수행할 수 있다. 스케일링 모듈(241)은 스케일링을 통해서 스케일링된 데이터(Das)를 생성할 수 있다. 도 11은 스케일링된 데이터(Das)의 예시도로, 모든 컬럼의 값이 0에서 1 사이로 스케일링된 것을 확인할 수 있다.

3차원 데이터 재구성 모듈(243)은 분리 데이터(Das_sep)를 수신하여 입력 데이터(Di)로 재구성할 수 있다. 3차원 데이터 재구성 모듈(243)은 2차원의 분리 데이터(Das_sep)를 3차원의 입력 데이터(Di)로 재구성할 수 있다.

다시, 도 15를 참조하면, S100 내지 S300 단계와 병렬적으로 시계열 예측 모델링한다(S400).

구체적으로, 도 12를 참조하면, 시계열 예측 모델(252)은 예를 들어, LSTM 레이어를 입력 레이어로 하고, 출력 레이어로 덴스 레이어를 사용할 수 있다. 덴스 레이어의 활성화 함수는 LeakyReLU를 포함할 수 있다. 모델링 모듈(251)은 최적의 하이퍼 파라미터(HP)를 탐색하여 설정할 수 있다.

다시, 도 15를 참조하면, 시계열 예측 모델을 학습한다(S500).

구체적으로, 도 12를 참조하면, 시계열 예측 모델(252)은 딥러닝 모델로서 입력 데이터(Di)를 수신할 수 있다. 시계열 예측 모델(252)은 입력 데이터(Di)에 포함된 트레이닝 데이터, 밸리데이션 데이터 및 테스트 데이터를 통해서 파라미터가 조절되고 평가될 수 있다. 시계열 예측 모델(252)은 입력 데이터(Di)에 따라 매출 예측 데이터(Des)를 도출할 수 있다.

다시, 도 15를 참조하면, 오차율이 기준 오차율 이하인지 판단한다(S600).

구체적으로, 도 2를 참조하면, 오차율 판단 모듈(260)은 시계열 예측 모듈(250)로부터 매출 예측 데이터(Des)를 수신할 수 있다. 오차율 판단 모듈(260)은 매출 예측 데이터(Des)와 매출 데이터(Ds)를 비교하여 오차율 정보(Re)를 생성할 수 있다.

오차율 판단 모듈(260)은 제2 POS 데이터(Dp2)를 수신하여 매출 예측 데이터(Des)와 비교하고 오차율을 판단할 수 있다. 이에 따라, 오차율 판단 모듈(260)은 오차율 정보(Re)를 생성할 수 있다.

도 1 내지 도 3 및 도 12를 참조하면, 모델링 모듈(251)은 미리 설정된 기준 오차율보다 오차율 정보(Re)에서 포함된 오차율이 높다면 시계열 예측 모델(252)의 모델링을 다시 수행할 수 있다. 즉, 도 15의 S400 단계로 다시 돌아갈 수 있다.

만일 미리 설정된 기준 오차율보다 오차율 정보(Re)에서 포함된 오차율이 낮다면, 시계열 예측 모델(252)이 충분히 신뢰할 수 있다.

이 경우 다시, 도 15를 참조하면, 시계열 예측 모델을 저장하여 시계열 예측을 수행한다(S700).

구체적으로, 도 2를 참조하면, 시계열 예측 모듈(250)은 최신 정보까지 업데이트된 POS 데이터(DP) 및 외부 데이터(De)를 이용하여 매출 예측 데이터(Des)가 다시 생성될 수 있고, 이러한 매출 예측 데이터(Des)는 가맹점(100)에 제공될 수 있다.

이하, 도 13, 도 14 및 도 18을 참조하여, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 방법을 설명한다. 상술한 실시예와 중복되는 부분은 간략히 하거나 생략한다.

도 18을 참조하면, S100 내지 S700 단계는 도 15와 동일할 수 있다. 이어서, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 방법은 식자재 수요를 예측하여 식자재 추천 발주 정보를 제공한다(S800).

구체적으로, 도 13 및 도 14를 참조하면, 식자재 추천 발주 정보 모듈(270)은 매출 예측 데이터(Des)를 수신하고, 식자재 추천 발주 정보(Df)를 생성할 수 있다. 구체적으로, 식자재 추천 발주 정보 모듈(270)은 각각의 메뉴에 들어가는 식자재의 수량에 대한 정보와 식자재의 발주시 배송 기간, 유통 기한 등의 식자재 세부 정보를 저장할 수 있다.

이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims

가맹점으로부터 시계열 데이터로 구성된 POS 데이터를 수신하여 매출 데이터를 추출하는 POS 데이터 처리 모듈;

시계열 데이터로 구성된 외부 데이터를 수신하여 상기 매출 데이터와 동일한 시간 단위로 재구성하여 처리된 외부 데이터를 생성하는 외부 데이터 처리 모듈;

상기 매출 데이터 및 상기 처리된 외부 데이터의 시점에 따른 상관관계를 판단하여 높은 상관관계를 가지는 시점으로 매칭시키고, 2차원 테이블 형식의 조정 데이터를 생성하는 데이터 조정 모듈;

상기 조정 데이터를 미리 설정된 형식으로 변환하여 입력 데이터를 생성하는 입력 데이터 재구성 모듈; 및

딥러닝 모델을 포함하고, 상기 입력 데이터를 이용하여 학습하고, 매출 예측 데이터를 도출하는 시계열 예측 모듈을 포함하는 매장 운영 예측 시스템.
제1 항에 있어서,

상기 POS 데이터는 카드 결제 내역을 포함하고,

상기 POS 데이터 처리 모듈은,

상기 카드 결제 내역에서 재방문 수치를 산출하는 재방문 수치 산출 모듈과,

상기 매출 데이터를 산출하는 매출 데이터 산출 모듈을 포함하는 매장 운영 예측 시스템.
제1 항에 있어서,

상기 데이터 조정 모듈은,

상기 매출 데이터 및 상기 처리된 외부 데이터를 차분을 통한 증감량으로 표시하여 안정화 데이터를 생성하는 데이터 안정화 모듈과,

상기 안정화 데이터를 VAR(Vector Auto Regression) 방식을 이용하여 상기 매출 데이터와 상기 외부 데이터의 최적의 시점을 판단하고, 그에 따라 상기 조정 데이터를 생성하는 VAR 분석 모듈을 포함하는 매장 운영 예측 시스템.
제1 항에 있어서,

상기 매출 예측 데이터와 상기 매출 데이터를 비교하여 오차율 정보를 산출하는 오차율 판단 모듈을 더 포함하고,

상기 시계열 예측 모듈은 상기 오차율 정보에 따라 상기 딥러닝 모델의 모델링의 수행여부를 판단하는 매장 운영 예측 시스템.
제1 항에 있어서,

상기 외부 데이터는 공공 데이터, 민간 공개 API 제공 데이터 및 경제 지표 데이터 중 적어도 하나를 포함하는 매장 운영 예측 시스템.
제1 항에 있어서,

상기 매출 예측 데이터는 메뉴별 예측 매출 데이터를 포함하고,

상기 매출 예측 데이터에 따라 식자재 수요를 분석하고, 식자재 추천 발주 정보를 생성하는 식자재 추천 발주 정보 모듈을 더 포함하는 매장 운영 예측 시스템.
POS 데이터를 수신하여 매출 데이터를 추출하고, 외부 데이터를 수신하여 상기 매출 데이터와 동일한 시간 단위로 재구성된 처리된 외부 데이터를 생성하고,

상기 매출 데이터와 상기 처리된 외부 데이터의 시점에 따른 상관관계를 분석하여 높은 상관관계의 시점으로 매칭된 조정 데이터를 생성하고,

상기 조정 데이터를 미리 설정된 형식으로 변환하여 입력 데이터를 생성하고,

상기 입력 데이터를 이용하여 딥러닝 모델을 포함하는 시계열 예측 모델을 학습시키고, 상기 시계열 예측 모델을 통해서 매출 예측 데이터를 도출하고,

상기 매출 예측 데이터의 오차율이 기준 오차율 이하인지를 판단하고,

만일 상기 오차율이 상기 기준 오차율 이하인 경우 그대로 매출 예측 데이터를 생성하고,

만일 상기 오차율이 상기 기준 오차율 초과인 경우 상기 시계열 예측 모델의 모델링을 다시 수행하는 것을 포함하는 시계열 분석을 이용한 매출 예측 방법.
제7 항에 있어서,

상기 매출 예측 데이터에 의해서 식자재 수요를 예측하여, 식자재 추천 발주 정보를 제공하는 것을 더 포함하는 매장 운영 예측 방법.
제7 항에 있어서,

상기 POS 데이터는 카드 결제 내역을 포함하고,

상기 카드 결제 내역에서 재방문 내역을 추출하고,

상기 재방문 내역을 재방문 간격에 따라 분류하여 재방문 데이터를 생성하는 것을 더 포함하고,

상기 조정 데이터를 생성하는 것은, 상기 매출 데이터와, 상기 처리된 외부 데이터 및 상기 재방문 데이터의 시점에 따른 상관관계를 분석하는 것을 포함하는 매장 운영 예측 방법.
제7 항에 있어서,

상기 조정 데이터를 생성하는 것은,

상기 매출 데이터 및 상기 처리된 외부 데이터를 차분하여 안정화 데이터를 생성하고,

상기 안정화 데이터를 VAR 방식을 이용하여 상관관계가 높은 시점의 데이터를 확인하고,

상기 상관관계가 높은 시점의 데이터를 결합하여 상기 조정 데이터를 생성하는 것을 포함하는 매장 운영 예측 방법.