KR102475513B1 - Method and system for automatically generating customer lifetime value (CLV) prediction models for each stage of customer life - Google Patents

Method and system for automatically generating customer lifetime value (CLV) prediction models for each stage of customer life Download PDF

Info

Publication number
KR102475513B1
KR102475513B1 KR1020210120588A KR20210120588A KR102475513B1 KR 102475513 B1 KR102475513 B1 KR 102475513B1 KR 1020210120588 A KR1020210120588 A KR 1020210120588A KR 20210120588 A KR20210120588 A KR 20210120588A KR 102475513 B1 KR102475513 B1 KR 102475513B1
Authority
KR
South Korea
Prior art keywords
customer
learning
value
customers
model
Prior art date
Application number
KR1020210120588A
Other languages
Korean (ko)
Inventor
박찬진
Original Assignee
오브젠 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오브젠 주식회사 filed Critical 오브젠 주식회사
Priority to KR1020210120588A priority Critical patent/KR102475513B1/en
Application granted granted Critical
Publication of KR102475513B1 publication Critical patent/KR102475513B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Operations Research (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

The present invention relates to a method and system for automatically generating a customer lifetime value (CLV) prediction model by stage of a customer lifecycle. The method for automatically generating a customer lifetime value (CLV) prediction model by stage of a customer lifecycle may comprise the steps of: collecting customer information comprising at least purchase history information of a customer; calculating a sum of purchase amounts (CV) comprised in the customer's purchase history information and classifying life cycle stages of the customer based on the calculated sum of purchase amounts and the number of purchases; generating a learning model (M) for predicting future customer value with customer data for each life cycle stage and prediction cycle; calculating the customer's realized CV value after a preset unit of time; and learning the model for each life cycle stage and prediction cycle of the customer. According to the present invention, the customer value prediction model can be updated in real time, and the value prediction model for each customer level can be simultaneously learned to increase the value prediction accuracy. The influence can be reflected in the changes in marketing activities and purchase trends, and the performance of the learning model can be prevented from deteriorating. In addition, the size of the data set (time window) to be trained periodically can be adjusted. Thus, the cyclical nature of changes in the external environment can be reflected.

Description

고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 방법 및 시스템 {Method and system for automatically generating customer lifetime value (CLV) prediction models for each stage of customer life}Method and system for automatically generating customer lifetime value (CLV) prediction models for each stage of customer life}

본 발명은 고객의 생애 단계를 구분하고 각 생애 단계 별 머신러닝(machine learning) 모델을 생성하는 데 AutoML 기술을 활용하여 자동화함으로써, 고객 가치 예측 모델을 실시간으로 업데이트할 수 있는 고객 생애 단계별 고객가치 예측 방법 및 시스템에 관한 것이다.The present invention classifies the customer's life stage and automates the creation of a machine learning model for each life stage by using AutoML technology, thereby predicting customer value by stage of the customer's life stage, which can update the customer value prediction model in real time. It relates to methods and systems.

고객생애가치 (Customer Lifetime Vaule, CLV)라 함은 고객평생가치 라고도 하고, LTV라고도 한다. CLV는 고객의 재무적 가치를 평가하는 중요지수로서, 20%의 고객이 대부분의 매출을 발생시킨다는 파레토 법칙을 참조하여 기업 매출에 가장 크게 기여하는 고객을 찾고 우량 고객을 관리하기 위한 지수로 사용되고 있다.Customer Lifetime Value (CLV) is also known as customer lifetime value or LTV. CLV is an important index for evaluating the financial value of customers. Referring to the Pareto law that 20% of customers generate the most sales, it is used as an index to find customers who contribute the most to corporate sales and manage good customers. .

CLV모델은 수학식 1과 같이 표현될 수 있다.The CLV model can be expressed as Equation 1.

[수학식 1][Equation 1]

Figure 112021104708928-pat00001
Figure 112021104708928-pat00001

여기서, M은 고객 1인당 평균 매출로서, 보통 1년 단위로 계산되며, c는 고객 1인당 평균 비용으로서, 보통 1년 단위로 계산되며, r은 고객 유지비율(retention rate)로서, 어떤 고객이 그 다음 해에도 여전히 고객으로 남아 있을 확률을 의미하며, i는 이자율 또는 할인율을 의미하고, AC는 고객 획득비용(Acquistition cost)로서 고객이 첫 방문 또는 첫 구매를 하도록 하는데 드는 비용을 의미한다.Here, M is the average sales per customer, usually calculated per year, c is the average cost per customer, usually calculated per year, and r is the customer retention rate, which customer The probability of remaining a customer in the following year, where i is the interest rate or discount rate, and AC is the acquisition cost, which is the cost of getting a customer to make their first visit or first purchase.

고객생애가치를 높이기 위해서는 가능한 고객의 구매를 유지해야 하고 보다 자주, 많이, 오랫동안 구매하도록 해야 한다.To increase customer lifetime value, you need to keep customers buying as much as possible and make them buy more often, a lot, and for a longer period of time.

고객생애가치 예측은 마케팅을 위한 고객 타겟팅을 위해 중요한 데이터이다. 하지만, 기존의 고객생애예측 방법은 고객생애단계별 예측에 대한 고려가 부족했다. 충성 고객이 아닌 전 단계, 예를 들어 인지, 등록, 구매 단계인 고객이 충성 단계로 갈 가능성이 많은 고객을 먼저 파악할 수 있으면 효과적인 마케팅이 가능하다는 점에서, 인지, 등록, 구매, 충성이라는 고객 단계별 가치예측모델을 동시에 학습시켜 가치 예측 정확도를 높이는 것이 필요하다. 고객은 마케팅 활동에 의해 영향을 받고, 구매 트렌드(Trend) 변화에 영향을 받는다. 이에 따라, 마케팅 활동과 트렌드 변화가 지속적으로 반영되지 않으면 기존의 학습된 고객가치 예측 모델의 성능은 저하되므로, 지속적인 모델 학습이 필요하다.Prediction of customer lifetime value is important data for targeting customers for marketing. However, existing customer lifecycle prediction methods lacked consideration for prediction by customer lifecycle stage. Customers who are not loyal customers at all stages, such as awareness, registration, and purchase, can identify customers who are likely to go to the loyalty stage first, in that effective marketing is possible. It is necessary to simultaneously train the value prediction model to increase the accuracy of value prediction. Customers are influenced by marketing activities and are affected by changes in purchasing trends. Accordingly, if marketing activities and trend changes are not continuously reflected, the performance of the existing learned customer value prediction model deteriorates, so continuous model learning is required.

등록특허공보 제10-2237399호, 2021.04.01)Registered Patent Publication No. 10-2237399, 2021.04.01)

본 발명이 해결하고자 하는 과제는 상술한 문제점들을 해결하기 위해 창출된 것으로서, 고객 단계별 고객생애 가치 예측 모델과 고객생애 단계 변화 예측 모델을 생성 및 학습하되, 고객속성정보 및 고객구매행동 분석 결과 정보를 활용하여 AutoML 기술을 통해 주기적으로 혹은 데이터 변화 발생 시에 지속적으로 ML 모델을 자동으로 생성 및 학습하는, 고객생애 단계별 고객생애가치(CLV) 예측모델 자동 생성&학습 방법 및 시스템을 제공하는 것이다.The problem to be solved by the present invention has been created to solve the above-mentioned problems, while generating and learning a customer life cycle value prediction model and a customer life stage change prediction model for each customer stage, and analyzing customer attribute information and customer purchasing behavior analysis result information. To provide a method and system for automatically generating and learning a customer lifetime value (CLV) prediction model for each stage of a customer's lifecycle, which automatically creates and learns an ML model periodically or continuously when data changes occur through AutoML technology.

상기 기술적 과제를 이루기 위한 본 발명의 일측면에 의한 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 방법은, 적어도 고객의 구매이력정보를 포함하는 고객정보를 수집하는 단계; 상기 고객 구매이력정보에 포함된 구매액수 합(CV)을 계산하고 상기 계산된 구매액수 합과 구매횟수를 기초로 고객의 생애주기단계를 구분하는 단계; 고객 데이터로 미래 고객가치를 예측하는 학습모델(M)을 상기 생애주기단계별, 예측 주기별로 생성하는 생성하는 단계; 미리 설정된 단위 시간이 지난 후 고객의 실현된 CV 값을 계산하는 단계; 및 고객의 생애주기단계별, 예측 주기별로 모델을 학습하는 단계를 포함할 수 있다.A method for automatically generating a customer lifetime value (CLV) prediction model according to an aspect of the present invention for achieving the above technical problem includes collecting customer information including at least customer purchase history information; calculating a sum of purchase amounts (CV) included in the customer's purchase history information and classifying life cycle stages of the customer based on the calculated sum of purchase amounts and the number of purchases; generating a learning model (M) for predicting future customer value with customer data for each life cycle stage and prediction cycle; calculating the customer's realized CV value after a preset unit of time; and learning the model for each life cycle stage and prediction cycle of the customer.

상기 고객정보는 고객의 연령, 지역을 포함하는 속성정보, 매장 또는 사이트 방문수, 장바구니 구매전환율, 구매 이력을 포함하는 행동정보, 댓글을 포함하는 의견정보 중 적어도 하나를 포함할 수 있다. The customer information may include at least one of attribute information including age and region of the customer, number of store or site visits, shopping cart conversion rate, behavior information including purchase history, and opinion information including comments.

상기 고객의 생애주기 단계는 구매가 없는 신규고객, 처음으로 구매를 한 첫구매고객, 구매횟수가 제1임계값 이하인 일반고객, 구매횟수가 상기 제1임계값 보다 큰 단골고객 및 고객생애가치(CLV)가 일정 규모 이상인 충성고객을 포함할 수 있다. The life cycle stages of the customers include new customers without purchases, first-time purchasers who make purchases for the first time, regular customers whose number of purchases is less than the first threshold, regular customers whose number of purchases is greater than the first threshold, and customer lifetime value ( CLV) may include loyal customers of a certain size or higher.

상기 학습모델(M)은 현재까지의 고객정보로부터 특정 시점을 정하고 상기 특정 시점 이전의 데이터를 특징(Features)으로 하여 상기 특정 시점 이후의 데이터로부터 고객 가치(구매액)를 라벨로 삼아 고객생애가치를 예측할 수 있다.The learning model (M) determines a specific point in time from customer information up to now, uses data before the specific point in time as features, and uses customer value (purchase amount) as a label from data after the specific point in time to determine customer lifetime value. Predictable.

상기 모델을 학습하는 단계는 슬라이딩 타임 윈도우 방식으로 고객의 생애주기단계별, 예측 주기별로 모델을 학습할 수 있다.In the step of learning the model, the model may be learned for each stage of the customer's life cycle and for each prediction period in a sliding time window manner.

상기 기술적 과제를 이루기 위한 본 발명의 일측면에 의한 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템은, 적어도 고객의 구매이력정보를 포함하는 고객정보를 수집하는 고객정보 수집부; 상기 고객 구매이력정보에 포함된 구매액수 합(CV)을 계산하고 상기 계산된 구매액수 합과 구매횟수를 기초로 고객의 생애주기단계를 구분하는 생애주기분류부; 고객 데이터로 미래 고객가치를 예측하는 학습모델(M)을 상기 생애주기단계별, 예측 주기별로 생성하는 AUTOML부; 고객의 생애주기단계별, 예측 주기별 모델을 학습하는 모델학습부; 및 미리 설정된 단위 시간이 지난 후 고객의 실현된 CV 값을 계산하는 CV 계산부를 포함할 수 있다.According to one aspect of the present invention for achieving the above technical problem, the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer's lifecycle includes a customer information collection unit that collects customer information including at least purchase history information of the customer; a life cycle classification unit that calculates a sum of purchase amounts (CV) included in the customer purchase history information and classifies life cycle stages of the customer based on the calculated sum of purchase amounts and the number of purchases; an AUTOML unit for generating a learning model (M) for predicting future customer value with customer data for each life cycle stage and prediction cycle; a model learning unit that learns a model for each customer's life cycle stage and prediction cycle; and a CV calculation unit that calculates a realized CV value of the customer after a preset unit time has elapsed.

상기 고객정보 수집부는 고객의 연령, 지역을 포함하는 속성정보, 매장 또는 사이트 방문수, 장바구니 구매전환율, 구매 이력을 포함하는 행동정보, 댓글을 포함하는 의견정보 중 적어도 하나를 수집할 수 있다. 상기 고객의 생애주기분류부는 고객을 구매가 없는 신규고객, 처음으로 구매를 한 첫구매고객, 구매횟수가 제1임계값 이하인 일반고객, 구매횟수가 상기 제1임계값 보다 큰 단골고객 및 고객생애가치(CLV)가 일정 규모 이상인 충성고객으로 분류할 수 있다.The customer information collection unit may collect at least one of attribute information including age and region of the customer, number of visits to a store or site, shopping cart conversion rate, behavior information including purchase history, and opinion information including comments. The customer life cycle classification unit classifies customers into new customers without purchases, first-time purchasers who purchase for the first time, regular customers whose number of purchases is less than the first threshold, regular customers whose number of purchases is greater than the first threshold, and customer life cycles. It can be classified as a loyal customer whose value (CLV) exceeds a certain level.

상기 AUTOML부에서의 상기 학습모델(M)은 현재까지의 고객정보로부터 특정 시점을 정하고 상기 특정 시점 이전의 데이터를 특징(Features)으로 하여 상기 특정 시점 이후의 데이터로부터 고객 가치(구매액)를 라벨로 삼아 고객생애가치를 예측할 수 있다. 상기 모델학습부는 슬라이딩 타임 윈도우 방식으로 고객의 생애주기단계별, 예측 주기별 모델을 학습할 수 있다.The learning model (M) in the AUTOML unit determines a specific point in time from customer information up to now, sets data before the specific point in time as features, and labels customer value (purchase amount) from data after the specific point in time. You can predict customer lifetime value. The model learning unit may learn a model for each stage of a customer's life cycle and for each prediction cycle in a sliding time window manner.

본 발명에 따른 고객생애 단계별 고객생애가치(CLV) 예측모델 자동 생성&학습 방법 및 시스템에 의하면, 고객의 생애 단계를 구분함으로써 각 생애단계별 머신러닝(ML) 모델을 AutoML 기술을 활용하여 자동화 함으로써 고객 가치 예측모델을 실시간으로 업데이트 할 수 있고, 고객 단계별 가치예측모델을 동시에 학습시켜 가치 예측 정확도를 높일 수 있다. According to the method and system for automatically generating and learning a customer lifetime value (CLV) prediction model for each stage of a customer's life according to the present invention, by classifying a customer's life stage and automating a machine learning (ML) model for each life stage using AutoML technology, the customer The value prediction model can be updated in real time, and the value prediction accuracy can be increased by simultaneously learning the value prediction model for each customer stage.

그리고, 본 발명에 의하면, 고객 단계별로 주기적 혹은 데이터 변화 발생시 지속적으로 ML 모델을 학습할 수 있게 함으로써, 마케팅 활동과 구매 트렌드 변화에 영향을 반영할 수 있고, 학습모델의 성능이 저하되는 것을 막을 수 있다. 또한 주기적 혹은 이벤트 발생 시 동일 데이터에 대한 자동 학습 체계를 구축하여, 외부 환경 변화를 반영하는 고객 생애 가치 예측 모델을 제공할 수 있다. 특히, 본 발명에서는 주기적 학습할 Data Set의 크기 (시간 윈도우)를 조정함으로써, 외부 환경 변화의 주기적 특성을 반영할 수 있다.In addition, according to the present invention, by allowing the ML model to learn periodically or continuously when data changes for each customer stage, it is possible to reflect the influence of changes in marketing activities and purchase trends, and to prevent the performance of the learning model from deteriorating. have. In addition, it is possible to provide a customer lifetime value prediction model that reflects changes in the external environment by establishing an automatic learning system for the same data periodically or when an event occurs. In particular, in the present invention, by adjusting the size (time window) of the data set to be periodically learned, it is possible to reflect the periodic characteristics of the change in the external environment.

또한, 본 발명에 의하면, 고객 속성 및 행동 로그 데이터, 외부 환경 등 다양한 정보를 예측 인자로 활용하여 효율적인 예측 마케팅을 할 수 있다.In addition, according to the present invention, efficient predictive marketing can be performed by utilizing various information such as customer attributes, behavioral log data, and external environment as predictive factors.

도 1은 본 발명에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템의 일실시예의 구성을 블록도로 나타낸 것이다.
도 2는 본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템의 AUTOML부에서 특정 시점 이전의 데이터(Data)를 특징(Features)으로 하여 상기 특정 시점 이후의 데이터로부터 고객 가치(구매액)를 라벨로 삼아 고객가치(CV)를 예측하는 개념도를 나타낸 것이다.
도 3은 본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템의 CV계산부에서 구매액수의 크기에 비례하는 원의 크기를 이용하여 고객가치 산출을 나타내는 예를 나타낸 것이다.
도 4는 본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템의 모델학습부에서 예측 모델을 슬라이딩 타임 윈도우를 통해 학습하는 것을 나타낸 것이다.
도 5는 본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템에서의 예측 기간별 모델에서 슬라이딩 타임 윈도우의 크기 및 학습에 사용될 (Data, CV)를 나누는 기간이 달라질 수 있음을 나타내고 있다.
도 6은 본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템에서의 충성고객예측을 위한 고객생명주기 단계의 구분을 나타내고 있다.
도 7은 본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템에서 구매횟수와 구매금액을 기준으로 고객 단계를 구분하는 것을 나타내고 있다.
도 8은 본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템에서 고객의 생명주기 단계별로 고객가치 예측 모델을 학습시켜 미래가치가 반영된 CV가 충성 고객이 될 수 있음을 설명하는 개념도이다.
도 9는 본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템에서 학습시킬 예측 모델의 수를 설명하는 도면이다.
도 10은 본 발명의 일실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 방법을 흐름도로 나타낸 것이다.
도 11은 고객생애 단계별 고객생애가치(CLV)를 예측하는 데 사용되는 AutoML의 범위를 나타내고 있다.
도 12는 본 발명에 따른 고객생애 단계별 고객생애가치(CLV)를 예측하기 위해 지속적 학습을 위한 AutoML의 범위를 나타내고 있다.
도 13은 본 발명에 따른 고객생애 단계별 고객생애가치(CLV)를 예측하는 각 모델 학습 시 최적의 예측 모델을 생성하기 위해 슬라이딩 타임 윈도우의 크기가 늘어나거나 줄어들 수 있음을 나타내고 있다.
도 14는 본 발명에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템이 Data와 예측모델(M) 및 예측고객가치(예측CV)로 구성되고, 데이터에 대한 일 예를 나타내고 있다.
도 15는 본 발명에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템에 대한 전체적인 특징을 나타낸 것이다.
1 is a block diagram showing the configuration of an embodiment of a system for automatically generating a customer lifetime value (CLV) prediction model by stage of the customer life according to the present invention.
2 is a feature of the data prior to a specific point in the AUTOML unit of the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of the customer life cycle according to an embodiment of the present invention, and from the data after the specific point in time It shows a conceptual diagram that predicts customer value (CV) using customer value (purchase amount) as a label.
3 shows an example of calculating customer value using the size of a circle proportional to the size of the purchase amount in the CV calculator of the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of the customer life according to an embodiment of the present invention. will be.
4 illustrates learning of a predictive model through a sliding time window in the model learning unit of the system for automatically generating a customer lifetime value (CLV) predictive model for each stage of a customer lifecycle according to an embodiment of the present invention.
5 shows that the size of the sliding time window and the period dividing (Data, CV) to be used for learning may vary in the model for each prediction period in the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of the customer life cycle according to an embodiment of the present invention. indicates that there is
Figure 6 shows the classification of customer life cycle stages for predicting loyal customers in the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer life cycle according to an embodiment of the present invention.
7 illustrates classifying customer stages based on the number of purchases and purchase amount in the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer's life cycle according to an embodiment of the present invention.
8 is a system for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer's life cycle according to an embodiment of the present invention, by learning a customer value prediction model for each stage of a customer's life cycle, so that a CV reflecting future value can become a loyal customer. It is a conceptual diagram that explains
9 is a diagram illustrating the number of predictive models to be trained in the system for automatically generating a customer lifetime value (CLV) predictive model for each stage of a customer lifecycle according to an embodiment of the present invention.
10 is a flowchart illustrating a method of automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer life cycle according to an embodiment of the present invention.
11 shows the range of AutoML used to predict customer lifetime value (CLV) by stage of customer lifecycle.
12 shows the range of AutoML for continuous learning to predict the customer lifetime value (CLV) for each stage of the customer lifecycle according to the present invention.
13 shows that the size of the sliding time window can be increased or decreased in order to generate an optimal prediction model when learning each model for predicting the customer lifetime value (CLV) at each stage of the customer lifecycle according to the present invention.
14 shows an example of data in which the system for automatically generating a customer lifetime value (CLV) prediction model by stage according to the present invention is composed of data, a prediction model (M), and a predicted customer value (predicted CV).
15 shows the overall characteristics of the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer life cycle according to the present invention.

이하, 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 바람직한 일 실시예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원 시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. Since the embodiments described in this specification and the configurations shown in the drawings are only one preferred embodiment of the present invention and do not represent all of the technical spirit of the present invention, various equivalents that can replace them at the time of the present application It should be understood that there may be variations and variations.

본 발명은 고객 단계별 고객생애 가치 예측 모델과 고객생애 단계 변화 예측 모델을 AutoML 기술을 활용하여 ML(Machine Learning) 모델을 지속적으로 자동 생성하고 학습한다. 또한 고객속성정보 및 고객구매행동 분석 결과 정보를 이용하여 ML모델을 학습하고, AutoML 기술을 활용하여 주기적으로 혹은 데이터 변화 발생 시에 지속적으로 ML 모델을 학습한다.The present invention continuously automatically creates and learns a machine learning (ML) model by using AutoML technology for a customer life cycle value prediction model and a customer life stage change prediction model for each customer stage. In addition, ML models are learned using customer attribute information and customer purchasing behavior analysis result information, and ML models are continuously learned periodically or when data changes occur using AutoML technology.

도 1은 본 발명에 따른, 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템의 일실시예의 구성을 블록도로 나타낸 것이다. 본 발명의 일실시예에 따른, 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템은 고객정보 수집부(110), 생애주기분류부(120), AUTOML부(130), CV계산부(140) 및 모델 학습부(150)를 포함하여 이루어진다.1 is a block diagram showing the configuration of an embodiment of a system for automatically generating a customer lifetime value (CLV) prediction model by stage of the customer life according to the present invention. According to an embodiment of the present invention, the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of the customer life cycle includes a customer information collection unit 110, a life cycle classification unit 120, an AUTOML unit 130, a CV calculation unit ( 140) and a model learning unit 150.

고객정보 수집부(110)는 적어도 고객의 구매이력정보를 포함하는 고객정보를 수집한다. 본 발명에서 머신 러닝(ML) 모델은 구매 이력 외에 여러 가지의 고객 정보를 활용할 수 있다. 고객정보 수집부(110)는 고객의 연령, 지역을 포함하는 고객의 속성정보, 매장 또는 사이트 방문수, 장바구니 구매전환율, 구매 이력을 포함하는 고객의 행동정보, 댓글을 포함하는 고객의 의견정보 등을 수집할 수 있다.The customer information collection unit 110 collects customer information including at least purchase history information of the customer. In the present invention, the machine learning (ML) model may utilize various types of customer information in addition to purchase history. The customer information collection unit 110 collects customer attribute information including age and region of the customer, number of store or site visits, shopping cart conversion rate, customer behavior information including purchase history, customer opinion information including comments, and the like. can be collected

생애주기분류부(120)는 상기 고객 구매이력정보에 포함된 구매액수 합(CV)을 계산하고 상기 계산된 구매액수 합과 구매횟수를 기초로 고객의 생애주기단계를 구분한다.The life cycle classification unit 120 calculates the sum of purchase amounts (CV) included in the customer purchase history information and classifies the life cycle stages of the customer based on the calculated sum of purchase amounts and the number of purchases.

고객을 최신성(Recency), 구매횟수(Frequency), 구매액수(Monetary) 기준으로 나누는 방법은 여러가지가 있을 수 있다. 즉, 다양한 RFM 기반의 고객 단계 구분이 있을 수 있다. 본 발명에서 사용하는 고객 생애주기 단계는 예를 들어, 고객의 생애주기분류부(120)는 고객을 구매가 없는 신규고객, 처음으로 구매를 한 첫구매고객, 구매횟수가 제1임계값 이하인 일반고객, 구매횟수가 상기 제1임계값 보다 큰 단골고객 및 고객생애가치(CLV)가 일정 규모 이상인 충성고객으로 분류할 수도 있다.There can be many ways to classify customers based on Recency, Frequency, and Monetary. That is, there may be various RFM-based customer stage divisions. The customer life cycle stage used in the present invention is, for example, the life cycle classification unit 120 of the customer is a new customer who has not purchased a customer, a first purchase customer who has made a purchase for the first time, and a general customer whose number of purchases is less than the first threshold value. Customers, regular customers whose number of purchases is greater than the first threshold, and loyal customers whose customer lifetime value (CLV) is greater than or equal to a certain level may be classified.

본 발명은 고객 생애주기 단계 별 예측 모델을 만들고 모델 생성을 자동화하고 고객의 앞 단계부터 최종단계(충성고객) 도달 확률을 예측하여 이를 마케팅에 활용할 수 있다. 이를 제조에 적용하면, 수율예측으로 공정 진행 단계 별로 수율 예측을 진행함으로써, 수율이 오르거나 내릴 때를 대비할 수 있고, 이를 통해 재고를 늘리거나 판매 영업 활동을 미리 준비할 수 있다.The present invention can create a predictive model for each stage of the customer life cycle, automate the model generation, predict the probability of reaching the final stage (loyal customer) from the front stage of the customer, and use it for marketing. If this is applied to manufacturing, it is possible to prepare for an increase or decrease in yield by predicting yield for each process step, and through this, it is possible to increase inventory or prepare sales activities in advance.

AUTOML부(130)는 고객 데이터로 미래 고객가치를 예측하는 학습모델(M)을 상기 생애주기단계별, 예측 주기별로 생성한다. 상기 학습모델(M)은 도 2에 나타나 있는 바와 같이, 현재까지의 고객정보로부터 특정 시점을 정하고 상기 특정 시점 이전의 데이터(Data)를 특징(Features)으로 하여 상기 특정 시점 이후의 데이터로부터 고객 가치(구매액)를 라벨로 삼아 고객가치(CV)를 예측할 수 있다. 여러 고객별로 다른 고객의 과거 속성 정보, 행동 정보, 의견 정보에 따른 고객가치(CV) 예측 모형을 제공한다.The AUTOML unit 130 generates a learning model (M) for predicting future customer value with customer data for each life cycle stage and prediction cycle. As shown in FIG. 2, the learning model (M) determines a specific point in time from customer information up to now, sets the data before the specific point in time as features, and calculates the customer value from the data after the specific point in time. Using (purchase amount) as a label, customer value (CV) can be predicted. Provides a customer value (CV) prediction model based on past attribute information, behavioral information, and opinion information of different customers for each customer.

학습모델 M은 고객데이터를 이용하여 미래고객가치를 예측하는 모델로서, 데이터로 고객가치(CV)를 예측하는 모델을 학습한다. 모델 M은 i 번째 고객(Ci)의 데이터가 주어지면, 미래고객가치(CV) 예측값을 리턴한다. Learning model M is a model that predicts future customer value using customer data, and learns a model that predicts customer value (CV) with data. Model M returns a predicted future customer value (CV) given the data of the i-th customer (Ci).

Figure 112021104708928-pat00002
Figure 112021104708928-pat00002

CV 계산부(140)는 미리 설정된 단위 시간이 지난 후 고객의 실현된 고객가치(CV) 값을 계산한다. 본 발명에서 고객가치를 산출하는 방법은 다음과 같이 이루어질 수 있다. 각 고객은 구매 이력을 가지고 있다. 현재 시점 이전의 구매이력으로 향후 고객 가치를 예측하는 것이 일반적인 접근 방법이라 할 수 있고, 이는 확률 모델을 이용하는 것이다. 고객 가치란 주어진 기간 동안의 고객을 통한 매출 기여액을 말한다. 보통, CLV(Customer Lifetime Value)는 고객이 일생 동안 기업에 주는 재무적 가치를 의미하고, 첫 구매부터 더 이상 구매를 하지 않을 때까지의 총 매출 기여를 뜻한다. 고객이 발생하는 매출은 고객별로 이미 실현된 매출과 예측된 매출로 나눌 수 있고, 이에 상응하여 실현된 고객 가치(CV)와 예측 고객 가치가 있다. 도 3은 고객가치 산출을 나타내는 예를 나타낸 것이다. 도 3을 참조하면, 현시점 tnow를 기준으로 고객 1은 4회에 걸쳐 구매를 하였고, 청색원(310, 315, 320, 325)의 크기는 구매액의 크기를 나타낸다. 그리고 점선 원(330, 335)은 예측된 고객가치를 나타내고, 점선 원의 크기는 예측되는 고객가치의 크기를 나타낸다. 마찬가지로 고객 2는 3회(340, 345, 350)에 걸쳐 구매가 이루어졌고, 이를 점선원(360)은 기초로 예측된 고객가치를 나타낸다. The CV calculator 140 calculates a customer's realized customer value (CV) value after a preset unit time elapses. The method of calculating customer value in the present invention can be made as follows. Each customer has a purchase history. A common approach is to predict future customer value based on purchase history prior to the current point in time, and this is done using a probabilistic model. Customer value is the amount of revenue contributed by customers during a given period. In general, CLV (Customer Lifetime Value) refers to the financial value a customer gives to a company over their lifetime, and refers to the total sales contribution from the first purchase to the point of no further purchases. Sales generated by customers can be divided into already realized sales and predicted sales for each customer, and correspondingly, there are realized customer value (CV) and predicted customer value. 3 shows an example showing customer value calculation. Referring to FIG. 3 , based on the current point in time t now , customer 1 has made purchases four times, and the sizes of blue circles 310 , 315 , 320 , and 325 indicate the size of the purchase amount. Further, the dotted line circles 330 and 335 represent the predicted customer value, and the size of the dotted circle represents the size of the predicted customer value. Likewise, customer 2 has made purchases three times (340, 345, 350), and the dotted line circle 360 represents the predicted customer value based on this.

모델학습부(150)는 고객의 생애주기단계별, 예측 주기별 모델을 학습하며, 슬라이딩 타임 윈도우 방식으로 고객의 생애주기단계별, 예측 주기별 모델을 학습할 수 있다.The model learning unit 150 learns a model for each stage of the customer's life cycle and each prediction cycle, and can learn a model for each stage of the customer's life cycle and each prediction cycle in a sliding time window manner.

본 발명은 슬라이딩 타임 윈도우를 통해 지속적으로 예측 모델을 학습한다. 도 4는 예측 모델을 슬라이딩 타임 윈도우를 통해 학습하는 것을 나타낸 것이다. 도 4를 참조하면, 현재 시간이 tnow 라고 하면, tnow이전에 학습된 Mprev 모델이 있고, 상기 Mprev모델은 이전 데이터(Dataprev), 이전 고객가치(CVprev) 로부터 학습된 예측 모델이며, 각 고객에 대한 이전 가치 예측값은 예측CVprev 이다. The present invention continuously learns a predictive model through a sliding time window. 4 shows learning a predictive model through a sliding time window. Referring to FIG. 4, if the current time is t now , there is an M prev model learned before t now , and the M prev model is a prediction model learned from previous data (Data prev ) and previous customer value (CV prev ) , and the previous value forecast for each customer is the predicted CV prev .

지속적인 학습은 주기적으로 또는 특정 이벤트가 발생할 때마다 모델 학습을 지속적으로 진행한다. 학습 대상 데이터는 타임 윈도우를 가지고 주어진 시간 범위 내의 데이터를 활용한다.Continuous learning continues to train the model periodically or whenever a specific event occurs. The learning target data has a time window and utilizes data within a given time range.

tprev 이후에 실제 산출된 CV값은 이전 예측값 예측CVprev 과는 차이가 생길 수 있고, 이는 Mprev 모델의 예측 에러값과, tprev 에서 t 기간 동안의 외부 환경 변화 또는 구매 트렌드의 변화가 반영된 Data Drift 값의 합으로 볼 수 있다.The actual calculated CV value after t prev may differ from the previous predicted value predicted CV prev , which reflects the prediction error value of the M prev model and changes in the external environment or purchase trend from t prev to period t. It can be viewed as the sum of data drift values.

새로운 예측 모델 M를 학습시킬 때, Mprev를 이어받아 새로운 학습 데이터 셋(Data Set) (Data, CV)로 학습시켜 예측모델M을 만들 수 있다. 또한, 이전 모델에 학습된 지식을 보존하기 위해, | CV - 예측CVprev | < CVThreshold 인 고객만 선별하여 M을 학습시킬 수 있다. CVThreshold 값을 통해 허용될 수 있는 예측값과 실제값의 에러 범위를 제어할 수 있다.When learning a new predictive model M, the predictive model M can be created by inheriting M prev and learning it with a new training data set (Data, CV). Also, to preserve the knowledge learned in the previous model, | CV - PredictionCV prev | Only customers with < CV Threshold can be selected and M can be trained. Through the CV Threshold value, it is possible to control the allowable error range between the predicted value and the actual value.

본 발명의 실시예에 따르면, 기간별로 예측하고 슬라이딩 타임윈도우 방식을 사용하므로, RFM 기반의 고객 단계 구분에 있어서, 최신성(Recency)는 이미 모델에 반영되어 있어 구매횟수(Frequency)와 구매액수(Moneraty)를 중심으로 모델이 구성될 수 있다. According to the embodiment of the present invention, since it is predicted by period and a sliding time window method is used, in RFM-based customer stage classification,  recency is already reflected in the model, so the number of purchases (Frequency) and purchase amount ( Moneraty) can be the center of the model.

본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템에서의 예측 기간별 모델을 설명하기로 한다. 한 번에 모델을 학습시킬 때 단기 및 장기 예측 모델을 각각 구성할 수 있다. 마케팅 수단에 따라 단기/장기 가치 예측값이 대상 고객 선정에 영향을 미칠 수 있다. VIP 고객을 위한 장기 혜택성 로열티 마케팅인지 단기간에 매출을 높이기 위한 마케팅인지에 따라, 장기 예측값 혹은 단기 예측값이 사용될 수 있다.A model for each prediction period in the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer life cycle according to an embodiment of the present invention will be described. When training a model in one step, you can construct short-term and long-term predictive models separately. Depending on the marketing method, short-term/long-term value predictions may affect target customer selection. Long-term forecasts or short-term forecasts can be used, depending on whether the marketing is for long-term benefit loyalty marketing for VIP customers or marketing to increase sales in a short period of time.

도 5는 본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템에서의 예측 기간별 모델에서 슬라이딩 타임 윈도우의 크기 및 학습에 사용될 (Data, CV)를 나누는 기간이 달라질 수 있음을 나타내고 있다. 도 5를 참조하면, 본 발명은 모델 학습 시 예측 기간을 일 주(1 week), 한 달(1 month), 세 달(3 months), 1년(1 year), 고객 전 생애(lifetime)로 나누어 모델을 구성할 수 있다. 이에 따라 슬라이딩 타임 윈도우의 크기 및 학습에 사용될 (Data, CV)를 나누는 기간이 달라질 수 있다.5 shows that the size of the sliding time window and the period dividing (Data, CV) to be used for learning may vary in the model for each prediction period in the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of the customer life cycle according to an embodiment of the present invention. indicates that there is Referring to FIG. 5, the present invention sets the prediction period to 1 week, 1 month, 3 months, 1 year, and customer lifetime during model learning. The model can be divided into parts. Accordingly, the size of the sliding time window and the period dividing (Data, CV) to be used for learning may vary.

본 발명에 따른, 충성고객예측을 위한 고객생명주기 단계의 구분을 설명하기로 한다. 기업 마케팅에서 중요한 부분은 고객 유입 단계부터 미리 충성 고객을 예측하는 것이다. 미래고객가치 관점에서 고객의 생명주기단계를 구분할 수 있다. 도 6은 본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템에서의 충성고객예측을 위한 고객생명주기 단계의 구분을 나타내고 있다. 도 6을 참조하면, 예를 들어, 고객의 생명주기는 구매가 없는 신규 고객(610), 첫 구매 고객(620), 일반 고객(630), 단골 고객(640), 충성 고객(650)으로 구분되는 단계로 이루어질 수 있다. According to the present invention, the classification of customer life cycle stages for predicting loyal customers will be described. An important part of corporate marketing is to predict loyal customers in advance from the customer inflow stage. From the perspective of future customer value, it is possible to classify the stages of the customer's life cycle. Figure 6 shows the classification of customer life cycle stages for predicting loyal customers in the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer life cycle according to an embodiment of the present invention. Referring to FIG. 6, for example, the life cycle of a customer is divided into new customers without purchase (610), first-time purchase customers (620), regular customers (630), regular customers (640), and loyal customers (650). It can be done in stages.

또한 구매 횟수와 구매 금액을 기준으로 각 고객의 단계를 구분할 수 있다. 도 7은 본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템에서 구매횟수와 구매금액을 기준으로 고객 단계를 구분하는 것을 나타내고 있다. 도 7을 참조하면, 고객가치(CV)가 일정 규모 이상인 경우에는 충성고객(CV_loyal, 750), 구매 횟수가 일정 규모 이상인 경우에는 단골고객(Frequency, 740), 첫 구매 고객(720) 및 일반 고객(730) 등으로 구분하고 구매 횟수나 구매 금액에 따라 정의할 수 있다. 고객 가치를 높이기 위한 각 단계 별로 가능한 마케팅 목표는 달라질 수 있다. 예를 들어, 일반고객(730)에게 고객 구매의도를 파악하여 다양한 상품을 추천하여 단골고객이 될 수 있도록 마케팅 할 수 있다. In addition, each customer's stage can be divided based on the number of purchases and the purchase amount. 7 illustrates classifying customer stages based on the number of purchases and purchase amount in the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer's life cycle according to an embodiment of the present invention. Referring to FIG. 7, if the customer value (CV) is above a certain size, loyal customers (CV_loyal, 750), if the number of purchases is above a certain size, regular customers (Frequency, 740), first-time purchase customers (720), and regular customers (730), etc., and can be defined according to the number of purchases or purchase amount. Possible marketing goals for each step to increase customer value may be different. For example, marketing may be performed so that a general customer 730 may become a regular customer by identifying a customer purchase intention and recommending various products.

본 발명에서는 각 고객의 생명주기 단계별로 고객가치 예측 모델을 학습시킴으로써, 미래가치를 반영한 CV가 충성 고객인 고객을 파악할 수 있다. 도 8은 본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템에서 고객의 생명주기 단계별로 고객가치 예측 모델을 학습시켜 미래가치가 반영된 CV가 충성 고객이 될 수 있음을 설명하는 개념도이다.In the present invention, by learning a customer value prediction model for each customer's life cycle stage, it is possible to identify customers whose CV reflecting future value is a loyal customer. 8 is a system for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer's life cycle according to an embodiment of the present invention, by learning a customer value prediction model for each stage of a customer's life cycle, so that a CV reflecting future value can become a loyal customer. It is a conceptual diagram that explains

한편, 본 발명에 따른, 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템에서 학습시킬 예측 모델의 수를 설명한다. 도 9는 본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템에서 학습시킬 예측 모델의 수를 설명하는 도면이다. 도 9를 참조하면, 한 번에 학습시킬 예측 모델의 수는 고객생명주기 단계 수와 예측기간 종류 수를 곱한 값이다. 예를 들어, 일 주에 한 번 업데이트된 고객 가치를 산출하고, 이전 모델의 예측값을 비교하고 차이를 반영할 수 있다. 구체적인 예를 들면, 1년을 52주라고 하면, 5개의 고객생명주기(예 : 신규, 첫구매, 일반, 단골, 충성)와 5개의 예측기간(예 : 일주, 한달, 세달, 1년, 무한대(기간 제한 없음))을 일주일 단위로 매주 학습한다고 하면, 학습할 예측 모델의 개수는 1,300개(=52x5x5)의 모델을 학습시켜야 한다. Meanwhile, the number of prediction models to be trained in the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer life according to an embodiment according to the present invention will be described. 9 is a diagram illustrating the number of predictive models to be trained in the system for automatically generating a customer lifetime value (CLV) predictive model for each stage of a customer lifecycle according to an embodiment of the present invention. Referring to FIG. 9 , the number of prediction models to be trained at one time is the product of the number of customer life cycle stages and the number of prediction period types. For example, you can compute an updated customer value once a week, compare the predictions of previous models and reflect the differences. For example, if a year is 52 weeks, there are 5 customer life cycles (e.g. new, first purchase, regular, regular, loyalty) and 5 forecast periods (e.g. one week, one month, three months, one year, infinite ( No period limitation)) on a weekly basis, the number of prediction models to be trained is 1,300 (= 52x5x5) models.

도 10은 본 발명의 일실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 방법을 흐름도로 나타낸 것이다. 도 1 및 도 10을 참조하여 본 발명의 일실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 방법을 설명하기로 한다. 10 is a flowchart illustrating a method of automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer life cycle according to an embodiment of the present invention. Referring to FIGS. 1 and 10 , a method for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer life cycle according to an embodiment of the present invention will be described.

먼저, 고객정보수집부(110)가 적어도 고객의 구매이력정보를 포함하는 고객정보를 수집한다.(S1010단계) 상기 고객정보는 고객의 연령, 지역을 포함하는 속성정보, 매장 또는 사이트 방문수, 장바구니 구매전환율, 구매 이력을 포함하는 행동정보, 댓글을 포함하는 의견정보 중 적어도 하나를 포함할 수 있다. 즉, 고객정보에는 고객 속성 정보, 고객 행동 정보, 고객 의견 정보가 포함될 수 있다. 고객 정보에는 CV 산출을 위한 고객의 구매 이력정보가 포함되는 것이 필요하다. 구매이력정보는 고객의 구매일자, 구매액수 정보 등을 포함할 수 있다. 구매이력정보 외의 정보는 CV를 예측하기 위한 데이터로 활용된다.(Data, CV)First, the customer information collection unit 110 collects customer information including at least the customer's purchase history information (step S1010). The customer information includes the customer's age, attribute information including region, number of visits to stores or sites, and shopping cart. At least one of behavioral information including a purchase conversion rate, purchase history, and opinion information including comments may be included. That is, customer information may include customer attribute information, customer behavior information, and customer opinion information. The customer information needs to include the customer's purchase history information for CV calculation. The purchase history information may include the customer's purchase date, purchase amount information, and the like. Information other than purchase history information is used as data to predict CV. (Data, CV)

고객정보가 수집되면, 생애주기분류부(120)는 상기 고객 구매이력정보에 포함된 구매액수 합(CV)을 계산하고 상기 계산된 구매액수 합과 구매횟수를 기초로 고객의 생애주기단계를 구분한다.(S1020단계) 상기 고객의 생애주기 단계는 구매가 없는 신규고객, 처음으로 구매를 한 첫구매고객, 구매횟수가 제1임계값 이하인 일반고객, 구매횟수가 상기 제1임계값 보다 큰 단골고객 및 고객생애가치(CLV)가 일정 규모 이상인 충성고객을 포함할 수 있다.When customer information is collected, the life cycle classification unit 120 calculates the sum of purchase amounts (CV) included in the customer purchase history information and classifies the life cycle stages of the customer based on the calculated sum of purchase amounts and the number of purchases. (Step S1020) The stages of the customer's life cycle include new customers without purchases, first-time purchasers who purchase for the first time, regular customers whose number of purchases is less than the first threshold, and regular customers whose number of purchases is greater than the first threshold. It may include customers and loyal customers whose customer lifetime value (CLV) exceeds a certain level.

즉, 고객정보가 수집되면, 실현된 CV를 계산하고 이를 바탕으로 생애주기분류부(120)를 통해 고객의 생애주기 단계를 구분한다. 실현된 CV는 학습에 사용된 고객 구매 이력 정보에서 구매 액수의 합으로 계산하며, 고객의 CV총합과 구매횟수에 따라 고객의 생애주기 단계를 구분한다. 첫 구매 고객의 경우, 구매가 이 기간 내에 포함되지 않을 수 있다. 해당 고객을 이탈고객으로 판단할 지 첫 구매 고객으로 판단할 지는 필요에 따라 결정한다. 충성 고객과 그 외의 고객은 구매 총합의 임계값(Threshold)에 따라 구분하고, 나머지 일반 고객과 단골 고객은 구매 횟수 Threshold에 따라 구분한다. 일반 고객은 2회 이상 구매 이력을 가진 고객으로 구분 할 수 있다.That is, when customer information is collected, the realized CV is calculated, and based on this, the life cycle classification unit 120 classifies the customer's life cycle stage. The realized CV is calculated as the sum of the purchase amount from the customer purchase history information used for learning, and the customer's life cycle stage is classified according to the customer's total CV and the number of purchases. For first-time customers, purchases may not be included within this period. Whether to judge the customer as a churn customer or as a first-time purchaser is determined as needed. Loyal customers and other customers are classified according to the threshold of total purchases, and the rest of the regular customers and regular customers are classified according to the threshold of the number of purchases. A general customer can be classified as a customer with a purchase history of two or more times.

AUTOML부(130)는 고객 데이터로 미래 고객가치를 예측하는 학습모델(M)을 상기 생애주기단계별, 예측 주기별로 생성하는 생성한다.(S1030단계) 상기 학습모델(M)은 현재까지의 고객정보로부터 특정 시점을 정하고 상기 특정 시점 이전의 데이터를 특징(Features)으로 하여 상기 특정 시점 이후의 데이터로부터 고객 가치(구매액)를 라벨로 삼아 고객생애가치를 예측할 수 있다. 이전의 고객가치 예측 모델 M_0가 없다면, 데이터와 고객가치의 셋(set)인 (Data, CV)로 모델 M_0를 구성할 수 있다.The AUTOML unit 130 generates a learning model (M) for predicting future customer value with customer data for each life cycle stage and prediction cycle (step S1030). The learning model (M) is the customer information up to now. It is possible to predict a customer lifetime value by setting a specific point in time and using data before the specific point in time as features and using customer value (purchase amount) as a label from data after the specific point in time. If there is no previous customer value prediction model M_0, model M_0 can be constructed with (Data, CV), which is a set of data and customer value.

CV계산부(140)는 미리 설정된 단위 시간이 지난 후 고객의 실현된 CV 값을 계산한다.(S1040단계) CV값은 단위 시간 (예를 들어, 1주 단위 슬라이딩)이 지난 후, 그 동안 실현된 CV 값을 계산할 수 있다.The CV calculation unit 140 calculates the realized CV value of the customer after a preset unit time has elapsed (step S1040). CV values can be calculated.

모델학습부(150)는 고객의 생애주기단계별, 예측 주기별로 모델을 학습한다.(S1050단계) 상기 모델 학습은 슬라이딩 타임 윈도우 방식으로 고객의 생애주기단계별, 예측 주기별로 모델을 학습할 수 있다.The model learning unit 150 learns the model for each stage of the customer's life cycle and each prediction cycle. (Step S1050) The model learning may be performed for each stage of the customer's life cycle and each prediction cycle in a sliding time window method.

상기 S1040단계와 상기 S1050단계를 반복하여 수행함으로 고객생애 단계별 고객생애가치(CLV)를 예측할 수 있다.By repeatedly performing steps S1040 and S1050, it is possible to predict customer lifetime value (CLV) for each stage of a customer's lifecycle.

한편, 본 발명에 따른 고객생애 단계별 고객생애가치(CLV)를 예측하는 AutoML에 대해 보다 상세히 설명하기로 한다. 고객주기생애 단계별 모델을 예측기간 별로 주기적으로 학습시키기 위해서는 분석가에 의한 수동 학습으로는 불가능하다. Meanwhile, AutoML predicting the customer lifetime value (CLV) for each stage of the customer lifecycle according to the present invention will be described in more detail. Manual learning by analysts is impossible to periodically train the model for each customer lifecycle stage by forecast period.

AutoML(자동기계학습)은 머신러닝 파이프라인에서 수작업과 반복되는 작업을 자동화하는 프로세스로서, 예측 모델 개발에 많은 시간을 소요했던 코딩, 알고리즘 선택, 튜닝 작업을 자동화한다. AutoML은 학습을 위한 데이터가 주어지면, 최적의 분류 및 예측 모델을 생성하여 ML (Machine Learning) 학습을 자동화할 수 있도록 한다.Automated machine learning (AutoML) is the process of automating manual and repetitive tasks in the machine learning pipeline, automating the time-consuming coding, algorithm selection, and tuning tasks of developing predictive models. AutoML enables machine learning (ML) learning to be automated by generating optimal classification and prediction models given data for learning.

도 11은 고객생애 단계별 고객생애가치(CLV)를 예측하는 데 사용되는 AutoML의 범위를 나타내고 있다. AutoML은 피처(Feature) 엔지니어링, 모델(알고리즘) 선택, 하이퍼 파라미터 (Hyper Parameter) 최적화의 과정으로 구성될 수 있다. (유사 피처 혹은 결측 피처 등을 보완하는 데이터 준비 과정을 포함하는 AutoML 기술도 있지만, 본 발명에서는 일부 변동은 있을 수 있으나 동일한 Data Set을 대상으로 지속적 학습을 진행하므로 데이터 준비 과정은 AutoML의 범위에서 제외하기로 한다).11 shows the range of AutoML used to predict customer lifetime value (CLV) by stage of customer lifecycle. AutoML can be composed of the process of feature engineering, model (algorithm) selection, and hyper parameter optimization. (There is also AutoML technology that includes a data preparation process that compensates for similar features or missing features, but in the present invention, although there may be some variations, data preparation process is excluded from the scope of AutoML because it continuously learns from the same data set. to do).

피처(Feature) 엔지니어링은 데이터로부터 학습에 필요한 인자(parameter)를 구성하는 작업으로, 새로운 피처를 만들거나 모델에 영향 주지 않는 피처를 제거함으로써 최적의 모델 성능을 만들어가는 과정이다. Feature engineering is a process of constructing parameters necessary for learning from data, and is a process of creating optimal model performance by creating new features or removing features that do not affect the model.

알고리즘 선택은 주어진 데이터로부터 최적의 분류 및 예측 모델을 만들기 위한 다양한 알고리즘을 검토하고 선정하는 과정이다. 예측 모델을 위해, 선형회귀, 로지스틱회귀 등의 알고리즘, 분류 문제를 위해, 랜덤포레스트, 베이지안, 서포트 벡터 머신 등 알려진 알고리즘을 후보로 두고, 다양한 실험을 자동으로 실행한다.Algorithm selection is the process of reviewing and selecting various algorithms to create optimal classification and prediction models from given data. For prediction models, algorithms such as linear regression and logistic regression, and for classification problems, known algorithms such as random forest, Bayesian, and support vector machines are set as candidates, and various experiments are automatically executed.

하이퍼파라미터 최적화는 선택된 알고리즘에서의 하이퍼 파라미터를 최적화하는 과정이다. 파라미터에는 모델 파라미터와 하이퍼 파라미터 두 종류가 있고, 선형회귀의 기울기나 딥러닝의 뉴런 간 연결강도 값 등은 학습을 통해 얻는 모델 파라미터이며, 랜덤 포레스트에서 트리의 수 혹은 최대 깊이 등은 학습 전에 설정하는 하이퍼 파라미터이다. 신경망에서의 하이퍼 파라미터는 학습 비율, 학습 횟수 등이 있다.Hyperparameter optimization is the process of optimizing hyperparameters in a selected algorithm. There are two types of parameters: model parameters and hyperparameters. The slope of linear regression or the value of the connection strength between neurons in deep learning are model parameters obtained through learning, and the number of trees or maximum depth in a random forest are set before learning. It is a hyperparameter. Hyperparameters in neural networks include a learning rate and the number of times of learning.

도 12는 본 발명에 따른 고객생애 단계별 고객생애가치(CLV)를 예측하기 위해 지속적 학습을 위한 AutoML의 범위를 나타내고 있다. 최근 다양한 AutoML 오픈소스와 상용 제품이 출시되어 사용되고 있다. 해결해야 하는 데이터 분석 과제가 많지만, 데이터 분석가 인력이 부족한 기업에서 분석 효율화를 위해 활용할 수 있다. 상용으로는 MS Azure ML, Google Cloud AutoML, AWS SageMaker, DataRobot 등이 있고, 오픈소스로는 H2O, Auto-sklearn, TPOT 등이 있다. 12 shows the range of AutoML for continuous learning to predict the customer lifetime value (CLV) for each stage of the customer lifecycle according to the present invention. Recently, various AutoML open source and commercial products have been released and used. There are many data analysis tasks to be solved, but it can be used to improve analysis efficiency in companies that lack data analyst manpower. For commercial use, there are MS Azure ML, Google Cloud AutoML, AWS SageMaker, DataRobot, etc., and for open source, there are H2O, Auto-sklearn, TPOT, etc.

본 발명에서는 모델학습을 위해 AutoML을 활용하며, 기존 AutoML은 AutoML이 주어진 데이터를 활용하여 모델을 생성하는 단위 과제 수행에 활용하지만, 지속적 학습을 위한 인프라로 활용하고 있지 않다. 주기적 혹은 이벤트 발생 시 동일 데이터에 대한 자동 학습 체계를 구축하여, 외부 환경 변화를 반영하는 고객 생애 가치 예측 모델이 본 발명의 핵심부분이다.In the present invention, AutoML is used for model learning, and existing AutoML is used to perform unit tasks to create models using data given by AutoML, but is not used as an infrastructure for continuous learning. A core part of the present invention is a customer lifetime value prediction model that reflects external environment changes by establishing an automatic learning system for the same data periodically or when an event occurs.

더우기, 본 발명에서는 주기적 학습할 Data Set의 크기 (시간 윈도우)를 조정함으로써, 외부 환경 변화의 주기적 특성을 반영한다. Furthermore, in the present invention, by adjusting the size (time window) of the data set to be periodically learned, the periodic characteristics of the change in the external environment are reflected.

도 13에 도시된 바와 같이, 각 모델 학습 시 슬라이딩 타임 윈도우의 크기를 바꾸어가며 최적의 예측 모델을 생성하며, 이 타임 윈도우는 매 학습 시 늘어나거나 줄어들 수 있다. As shown in FIG. 13, an optimal prediction model is created by changing the size of the sliding time window during each model training, and this time window can be increased or decreased during each learning.

그리고, 도 14는 본 발명에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템이 Data(1410)와 예측모델(M, 1420) 및 예측고객가치(예측CV, 1430)로 구성되고, 데이터에 대한 일 예를 나타내고 있다. 도 14를 참조하면, 본 발명의 실시예에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템은 인구통계적 정보, 구매행동정보, 의견정보를 데이터(1410)로 받아들여 생성된 고객각치 예측모델을 통해 고객가치를 예측할 수 있다. 인구통계적 정보에는 연령, 성별, 지역이 포함될 수 있고, 구매행동정보에는 방문수, 장바구니, 구매이력, 최근 구매일, 총구매횟수, 총구매액수 등이 포함될 수 있고, 의견정보에는 참여자수, 감성지수가 포함될 수 있다.14 shows that the system for automatically generating a customer lifetime value (CLV) prediction model by stage of the customer life according to the present invention is composed of Data (1410), a prediction model (M, 1420), and a predicted customer value (predicted CV, 1430), An example of the data is shown. Referring to FIG. 14 , the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer's life cycle according to an embodiment of the present invention accepts demographic information, purchase behavior information, and opinion information as data 1410 and generates customer values. Predictive models can predict customer value. Demographic information may include age, gender, and region, purchase behavior information may include the number of visits, shopping cart, purchase history, recent purchase date, total number of purchases, total purchase amount, etc., and opinion information may include the number of participants, emotional index may be included.

한편, 본 발명에 적용될 수 있는 CLV에 기반한 비즈니스 개선 시나리오는 다음과 같다. Meanwhile, business improvement scenarios based on CLV applicable to the present invention are as follows.

1) Cart, Browse, and Search Abandonment1) Cart, Browse, and Search Abandonment

사이트 광고로 유입된 고객이 상품을 찾아서 장바구니에 넣는 데 이미 많은 마케팅 비용이 사용된 것이다. 장바구니에 넣은 상품을 구매 포기하는 경우, 실제로 온라인 쇼핑 장바구니의 69%가 구매를 포기하는데, 이는 비효율적인 마케팅이다.A lot of marketing costs have already been spent on finding products and putting them in the shopping cart by customers who have been brought in through site advertisements. In fact, 69% of online shopping carts abandon purchases when items in the shopping cart are abandoned, which is ineffective marketing.

리타겟팅 (Retargetting)과 장바구니 취소 메일을 보내 사이트 방문 및 클릭율을 높이고 매출 및 이익을 증대하는 것이 필요하다. 고객생애단계를 고려한 마케팅은 신규 유입 고객과 단골/충성 고객을 확보하는 것이므로, 해당 상품의 할인 정보를 알리고 함께 구매된 상품을 보여주는 식의 개인화 마케팅이 필요하다. Retargeting and sending cart cancel emails are necessary to increase site visits and click-through rates and increase sales and profits. Marketing considering the customer life stage is to secure new customers and regular/loyal customers, so personalized marketing is needed to inform discount information on the product and show products purchased together.

2) Onboarding and Early Activation2) Onboarding and Early Activation

신규 고객의 경우 초기 단계에서 고객의 의도나 취향을 빠르게 판단하는 것은 무엇보다 중요하다. 가입하고 일정기간 주문이 없는 고객에게 검색 혹은 장바구니 리스트 상의 상품에 대해 특별 할인 쿠폰을 보내는 것과 같은 활동이 필요하다. For new customers, it is most important to quickly judge the customer's intention or taste in the early stage. Activities such as sending special discount coupons for products on the search or cart list to customers who have signed up and have not ordered for a certain period of time are required.

3) Upselling and Cross-Selling3) Upselling and Cross-Selling

품질 및 기능이 더 우수한 상품을 소개하여 구매액을 높이거나 보완 상품을 제시하여 추가 구매를 유도한다. 상품 구매 전에 다른 기능 혹은 브랜드의 유사 상품을 추천하거나 구매 시 혹은 구매 후에 함께 필요로 하는 다른 제품을 제시함으로써 고객의 추가 방문을 유도하고 CLV를 개선한다.Introduce products with better quality and functions to increase the purchase amount or suggest complementary products to induce additional purchases. Encourage additional visits from customers and improve CLV by recommending similar products of other functions or brands before purchasing a product, or by presenting other products that are needed together during or after purchase.

4) Segmentation and Drip Campaigns4) Segmentation and Drip Campaigns

고객 세그멘트에 따라 혹은 고객 취향에 맞게 정해진 일정에 따라 자동으로 마케팅 이메일을 발송 (Drip Campaigns) 하는 것은 고객이 상품에 관심을 갖도록 유도하는 효과적인 수단이 될 수 있다.Automatically sending marketing emails (Drip Campaigns) according to customer segments or according to a schedule tailored to customer tastes can be an effective means of inducing customers to take interest in a product.

그리고, CLV를 알아야 신규 고객을 확보하기 위한 적정한 예산을 수립할 수 있다. 신규 고객을 확보하기 위한 비용을 CPA (Cost Per Acquisition)라 한다. 고객의 평균 구매 비용에 대한 측정 혹은 추정이 없이는 고객 유입 마케팅에 얼마를 써야할 지 결정하기 어렵다. CLV 값이 없다면, 유입되거나 구매하지 않을 고객에 대해 CPA를 낭비할 수 있고, CLV를 알아야 고객 유지 대상을 선정할 수 있다. 고객 생애 동안 얼마만큼의 매출을 일으킬 지에 대한 정보가 있어야, 고객 유지를 위해 얼마만큼의 돈을 투자할 지 결정할 수 있다.And, knowing CLV, you can establish an appropriate budget to secure new customers. The cost of acquiring new customers is called CPA (Cost Per Acquisition). Without measuring or estimating the average cost of a customer's purchase, it is difficult to determine how much to spend on customer acquisition marketing. If you don't have a CLV value, you can waste CPA on customers who won't or won't buy, and you need to know CLV to select customers to retain. When you have information about how much sales you will generate over the lifetime of your customers, you can decide how much money to invest in retaining them.

CLV를 높이기 위한 예측 마케팅을 구체적으로 설명한다. Explains predictive marketing specifically to increase CLV.

1) 예측 마케팅은 고객생애주기 전반에 걸쳐 모든 접점에서 고객과 더 관련성 있고, 의미 있는 고객 경험을 제공하고, 고객 충성도와 수익을 향상시키는 활동이다. 최근의 우버, 에어비엔비 같은 테크 스타트업은 예측마케팅이 비즈니스 핵심이다 (Surge Pricing). 또한, 넷플릭스의 콘텐츠 추천, 아미존의 장바구니 내의 상품 추천 등은 빅데이터, AI와 같은 신기술을 활용한 비즈니스 선도 사례라 할 수 있다. 1) Predictive marketing is an activity that provides a more relevant and meaningful customer experience to customers at all touch points throughout the customer lifecycle, and improves customer loyalty and revenue. For recent tech startups such as Uber and Airbnb, predictive marketing is at the core of their business (Surge Pricing). In addition, Netflix's content recommendation and Amazon's product recommendation in the shopping cart are leading business cases using new technologies such as big data and AI.

2) 예측 마케팅은 고객 타게팅 및 고객 획득 활동의 정밀도를 향상시키는데, 가장 수익성 높은 고객을 창출하는 채널을 파악하고 마케팅 지출을 최적화하고, 특정 마이크로 세그먼트를 초정밀 타깃으로 설정하고 이들의 고객 전환율을 증가시키는 고객 획득 캠페인을 설계할 수 있다. 2) Predictive marketing improves the precision of customer targeting and customer acquisition activities by identifying the channels that generate the most profitable customers, optimizing marketing spend, hyper-targeting specific micro-segments and increasing their conversion rates. You can design customer acquisition campaigns.

3) 예측 마케팅은 개인화된 경험을 활용하여 고객 평생가치를 높일 수 있다. 예측 마케팅을 통해 고객상호작용의 개인화, 관련성, 타이밍을 개선할 수 있고, 고객으로 하여금 재방문하게 만들고 고객평생가치를 극대화한다.3) Predictive marketing can leverage personalized experiences to increase customer lifetime value. Through predictive marketing, you can improve the personalization, relevance, and timing of customer interactions, keep customers coming back, and maximize customer lifetime value.

4) 예측 마케팅은 고객 유지 및 충성도에 대한 이해를 높일 수 있다. 고객 상호 작용의 개인화, 관련성, 타이밍을 개선할 수 있다. 고객으로 하여금 재방문하게 만들고, 고객평생가치를 극대화할 수 있다. 4) Predictive marketing can increase understanding of customer retention and loyalty. You can improve the personalization, relevance, and timing of customer interactions. Make customers come back and maximize customer lifetime value.

5) 예측 마케팅은 고객유지 및 충성도에 대한 이해를 높일 수 있다. 언제, 왜, 어떤 고객이 되돌아올지 아니면 이탈할지 예측하는 것은 많은 기업에게 커다란 숙제이다. 예측 마케팅을 통해 고객을 계속 붙잡아두기 위해 선제적으로 조치를 취할 수 있도록 이탈 위험이 있는 고객을 찾아내어 리스트에 표시한다.5) Predictive marketing can increase understanding of customer retention and loyalty. Predicting when, why, and which customers will return or churn is a big challenge for many companies. Predictive marketing identifies and lists customers at risk of churn so you can take proactive steps to retain them.

6) 예측 마케팅은 고객 인게이지먼트(Engagement)를 최적화한다. 이메일 프로모션에 누가 응답할 것인지, 단순 구경 고객을 구매자로 전환하기 위해서 필요한 것이 무엇인지, 거래를 완료 하도록 고객을 유인하는 데 필요한 할인은 어느 정도인지를 예측한다.6) Predictive marketing optimizes customer engagement. Predict who will respond to email promotions, what it will take to convert a casual customer into a buyer, and what discount will be needed to entice the customer to complete the transaction.

한편, 전통적 CLV 예측 모델 (확률적 모델) 은 고객주문거래 데이터로부터 CLV를 예측한다. CLV 모델에서 중요한 세 가지 입력은 최근 구매, 빈도, 금액이며, 이를 RFM (최신성 Recency, 빈도 Frequency, 규모 Monetary)이라고 부른다. 고객이 언제 마지막으로 주문했는가, 고객이 얼마나 자주 구매하는가, 고객이 얼마를 지출하는가를 기반으로 고객가치예측 모델을 구축한다.On the other hand, the traditional CLV prediction model (probabilistic model) predicts CLV from customer order transaction data. The three important inputs in the CLV model are recent purchases, frequency, and amount, which are called RFM (Recency, Frequency, and Monetary). Build a customer value prediction model based on when the customer last ordered, how often the customer buys, and how much the customer spends.

1) BTYD (Buy-Till-You-Die) 모델 1) BTYD (Buy-Till-You-Die) model

1959년 에런버그는 NBD 모델 (Negative Binomial Distribution)이 소비자 구매 패턴이라는 것을 논문을 통해 제시하였으며, 지난 고객의 주문 정보에 기반한 고객의 미래가치예측을 위해 RFM 기반의 확률 모델을 제시하였다. BTYD 모델은RFM Data set에 가장 적합하도록 고객미래가치 분포의 인자를 학습시키고, 분포로부터 샘플링하여 고객의 미래가치를 예측한다. 모델을 통해 예측하고자 하는 바는 어떤 고객이 이탈하지 않고 지속적으로 구매할 가능성이 높은가? (유지비율예측), 각 고객으로부터 얼마나 많은 구매가 있을 것인가? (구매횟수예측)이며, 구매 횟수에 고객의 평균 구매액을 곱하면 고객 가치가 나오고, 이에 유지 비율을 곱해서 CLV를 산정한다.In 1959, Ehrenberg presented in a thesis that the NBD model (Negative Binomial Distribution) is a consumer purchasing pattern, and presented an RFM-based probability model to predict the customer's future value based on the customer's order information in the past. The BTYD model learns the factor of the customer future value distribution to be most suitable for the RFM data set, and predicts the customer's future value by sampling from the distribution. What we want the model to predict is which customers are more likely to keep buying and not churn? (retention rate prediction), how many purchases will there be from each customer? (Predicting the number of purchases), and multiplying the number of purchases by the average purchase amount of the customer gives the customer value, and the CLV is calculated by multiplying this by the retention rate.

2) Pareto/NBD (PNBD) 모델 2) Pareto/NBD (PNBD) model

파레토 분포는 고객이탈예측을 위해 사용될 수 있고, NBD 분포는 미래구매예측에 활용될 수 있다. 먼저, 고객수명모델은 파레토 분포를 따른다고 가정하면, 일반적으로 고객이 된 후 빠르게 이탈하지만 특정 고객은 오랫동안 단골/충성 고객이 된다. Exp는 지수분포 혹은 파레토 분포를 의미하고, μc 값은 고객 특성 값으로 고객 이탈률을 의미한다.The Pareto distribution can be used to predict customer churn, and the NBD distribution can be used to predict future purchases. First, assuming that the customer lifespan model follows the Pareto distribution, general customers leave quickly after becoming customers, but certain customers become regular/loyal customers for a long time. Exp means exponential distribution or Pareto distribution, and μ c value is customer characteristic value and means customer churn rate.

고객의 구매 횟수는 t 시간 동안 k 번 구매하는 포아송 분포를 따른다고 가정하면, 포아송 분포는 일종의 음 이항 분포(NBD)로, λc 는 단위 시간 당 구매 건수를 의미한다.Assuming that the number of purchases by a customer follows a Poisson distribution of k purchases during time t, the Poisson distribution is a kind of negative binomial distribution (NBD), where λ c denotes the number of purchases per unit time.

고객수명분포로부터 고객기대수명을 예측하고, 고객구매분포로부터 고객의 기대구매횟수를 예측하며, 고객 기대구매횟수와 평균구매금액을 곱하여 고객생애가치를 얻는다.Customer life expectancy is predicted from the customer life span distribution, and the customer's expected number of purchases is predicted from the customer purchase distribution, and the customer lifetime value is obtained by multiplying the customer's expected number of purchases by the average purchase amount.

ML 기반 CLV 예측을 설명하기로 한다. 전통적 방법은 주문거래 데이터만 활용하지만 머신러닝(ML) 모델은 RFM 이외의 여러 특성을 반영할 수 있다는 장점이 있다. 고객 속성 및 행동 로그 데이터, 외부 환경 등 다양한 정보가 예측 인자로 활용될 수 있다. 기준일 이전의 주문 및 고객 특성 정보를 모델 학습에 사용하고 (Features), 기준일 이후의 주문은 목표 값을 계산하는 데 사용한다 (Labels). 학습 데이터에 대한 레이블은 CLV이며, 예를 들어 지난 2년 과거 주문 정보로 지난 1년 동안의 CLV를 예측하는 모델을 학습시키고, 지난 1년 동안의 주문 정보로 내년 1년의 CLV를 예측한다.ML-based CLV prediction will be described. Traditional methods only use order transaction data, but machine learning (ML) models have the advantage of being able to reflect multiple characteristics other than RFM. Various information such as customer attributes, behavioral log data, and external environment can be used as predictive factors. Order and customer characteristics information before the base date are used for model training (Features), and orders after the base date are used to calculate target values (Labels). The label for the training data is CLV, for example, train a model to predict CLV for the past year with order information from the past two years, and predict CLV for next year with order information for the past year.

도 15는 본 발명에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템에 대한 전체적인 특징을 나타낸 것이다. 도 15를 참조하면, 본 발명에 따른 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템은 연령, 지역 정보를 포함하는 고객속성정보, 구매 뿐만 아니라 장바구니, 관심상품, 조회 등 고객행동분석데이터를 활용하여 고객단계별로 고객가치 예측모델을 학습하되, 기준일을 점진적으로 늘려가는 타임윈도우를 통해 지속적으로 학습한다. 15 shows the overall characteristics of the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer life cycle according to the present invention. Referring to FIG. 15, the system for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer's lifecycle according to the present invention includes customer attribute information including age and region information, customer behavior analysis data such as shopping carts, products of interest, and inquiry as well as purchases. Using , the customer value prediction model is learned by customer stage, but it is continuously learned through a time window that gradually increases the base date.

본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.Although the present invention has been described with reference to the embodiments shown in the drawings, this is only exemplary, and those skilled in the art will understand that various modifications and equivalent other embodiments are possible therefrom. Therefore, the true technical protection scope of the present invention should be determined by the technical spirit of the attached claims.

110 : 고객정보 수집부
120 : 생애주기 분류부
130 : AUTOML부
140 : CV계산부
150 : 모델학습부
110: customer information collection unit
120: life cycle classification unit
130: AUTOML part
140: CV calculation unit
150: model learning unit

Claims (10)

고객정보수집부가 적어도 고객의 구매이력정보 뿐만 아니라 적어도 고객의 연령, 지역을 포함하는 속성정보, 매장 또는 사이트 방문수, 장바구니 구매전환율, 구매 이력을 포함하는 행동정보, 댓글을 포함하는 의견정보 중 하나를 포함하는 고객정보를 수집하는 단계;
생애주기분류부가 상기 고객 구매이력정보에 포함된 구매액수 합(CV)을 계산하고 상기 계산된 구매액수 합과 구매횟수를 기초로 고객의 생애주기단계를 구매가 없는 신규고객, 처음으로 구매를 한 첫구매고객, 구매횟수가 제1임계값 이하인 일반고객, 구매횟수가 상기 제1임계값 보다 큰 단골고객 및 고객생애가치(CLV)가 일정 규모 이상인 충성고객으로 구분하는 단계;
자동기계학습(AUTOML)부가 고객 데이터로 미래 고객가치를 예측하는 학습모델(M)을 상기 신규고객, 첫구매고객, 일반고객, 단골고객 및 충성고객 별로 각각 생성하되, 상기 신규고객, 첫구매고객, 일반고객, 단골고객 및 충성고객 별(고객생애주기별)로 복수의 학습주기로 학습하고, 머신러닝 파이프라인에서 코딩, 알고리즘 선택, 튜닝작업을 자동화하는 자동기계학습(AUTOML)을 통해 학습을 수행하는 단계;
CV계산부가 상기 고객생애주기별로 미리 설정된 단위 시간이 지난 후 고객이 상기 단위 시간 동안 실제 구매 금액을 계산하여 상기 고객생애주기별로 실현된 CV 값을 획득하는 단계; 및
모델학습부가 상기 고객생애주기별로 상기 획득된 CV값을 이전 CV값으로 하여 상기 자동기계학습(AUTOML)부에 의해 생성된 다수의 학습모델들을 슬라이딩 타임 윈도우 방식으로 실행하여 출력되는 예측CV값이 미리 정해진 값 이상이면 충성고객으로 예측하는 단계를 포함하고,
상기 학습모델을 학습할 때, 이전의 학습모델(Mprev)을 이어받아 새로운 학습데이터 셋(Data, CV)으로 학습시켜 새로운 예측모델(M)을 생성하고, 고객이 실제 구매한 금액을 CV라 하고, 예측된 구매금액인 예측CV와의 차이가 미리 설정된 임계값 보다 작은 고객만 선별하여 예측 모델(M) 학습하는, 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 방법.
The customer information collection unit collects at least one of the customer's purchase history information as well as at least one of the customer's age and region including attribute information, store or site visits, shopping cart conversion rate, behavioral information including purchase history, and opinion information including comments. Collecting customer information including;
The life cycle classification unit calculates the sum of purchase amounts (CV) included in the customer purchase history information, and based on the calculated sum of purchase amounts and the number of purchases, the life cycle stage of the customer is new customers without purchases, first purchases, etc. Classifying into first-time purchase customers, general customers whose number of purchases is less than a first threshold, regular customers whose number of purchases is greater than the first threshold, and loyal customers whose customer lifetime value (CLV) is greater than or equal to a certain size;
The automatic machine learning (AUTOML) unit creates a learning model (M) that predicts future customer value with customer data for each of the new customers, first-time purchasers, regular customers, regular customers, and loyal customers, and the new customers and first-time purchasers , Learning by multiple learning cycles by regular customers, regular customers, and loyal customers (by customer life cycle), and learning through automatic machine learning (AUTOML) that automates coding, algorithm selection, and tuning tasks in the machine learning pipeline. doing;
obtaining a CV value realized by the customer life cycle by calculating a customer's actual purchase amount during the unit time after a predetermined unit time for each customer life cycle has elapsed, by a CV calculator; and
The model learning unit executes a plurality of learning models generated by the automatic machine learning (AUTOML) unit in a sliding time window method using the obtained CV value for each customer life cycle as the previous CV value, and the predicted CV value output is in advance If it is more than a set value, it includes a step of predicting a loyal customer,
When learning the learning model, a new prediction model (M) is created by taking over the previous learning model (Mprev) and learning it with a new learning data set (Data, CV), and the actual purchase amount by the customer is called CV , A method of automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer's lifecycle, selecting only customers whose difference from the predicted purchase amount, the predicted CV, is less than a preset threshold and learning the prediction model (M).
삭제delete 삭제delete 제1항에 있어서, 상기 학습모델(M)은
현재까지의 고객정보로부터 특정 시점을 정하고 상기 특정 시점 이전의 데이터를 특징(Features)으로 하여 상기 특정 시점 이후의 데이터로부터 고객 가치(구매액)를 라벨로 삼아 고객생애가치를 예측하는 것을 특징으로 하는, 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 방법.
The method of claim 1, wherein the learning model (M)
Characterized in that, by determining a specific point in time from customer information up to now, using data before the specific point in time as features, and using customer value (purchase amount) as a label from data after the specific point in time to predict the lifetime value of the customer, A method for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer's lifecycle.
삭제delete 적어도 고객의 구매이력정보 뿐만 아니라, 적어도 고객의 연령, 지역을 포함하는 속성정보, 매장 또는 사이트 방문수, 장바구니 구매전환율, 구매 이력을 포함하는 행동정보, 댓글을 포함하는 의견정보 중 하나를 포함하는 고객정보를 수집하는 고객정보 수집부;
상기 고객 구매이력정보에 포함된 구매액수 합(CV)을 계산하고 상기 계산된 구매액수 합과 구매횟수를 기초로 고객의 생애주기단계를 구분하되, 고객을 구매가 없는 신규고객, 처음으로 구매를 한 첫구매고객, 구매횟수가 제1임계값 이하인 일반고객, 구매횟수가 상기 제1임계값 보다 큰 단골고객 및 고객생애가치(CLV)가 일정 규모 이상인 충성고객으로 분류하는 생애주기분류부;
고객 데이터로 미래 고객가치를 예측하는 학습모델(M)들을 상기 신규고객, 첫구매고객, 일반고객, 단골고객 및 충성고객 (생애주기단계) 별로 생성하되, 상기 생애주기 단계 별로 복수의 학습주기로 학습하며, 머신러닝 파이프라인에서 코딩, 알고리즘 선택, 튜닝작업을 자동화하는 자동기계학습(AUTOML)을 통해 학습이 이루어지는 AUTOML부;
상기 고객생애주기별로 미리 설정된 단위 시간이 지난 후 고객이 상기 단위 시간 동안 실제 구매 금액을 계산하여 상기 고객생애주기별로 실현된 CV 값을 획득하는 CV 계산부; 및
상기 고객생애주기별로 상기 획득된 CV값을 이전 CV값으로 하여 슬라이딩 타임 윈도우 방식으로 상기 자동기계학습(AUTOML)부에 의해, 고객의 생애주기단계별로 생성된 다수의 학습모델들을 통해 충성고객을 예측하는 모델학습부를 포함하고,
상기 학습모델을 학습할 때, 이전의 학습모델(Mprev)을 이어받아 새로운 학습데이터 셋(Data, CV)으로 학습시켜 새로운 예측모델(M)을 생성하고, 고객이 실제 구매한 금액을 CV라 하고, 예측된 구매금액인 예측CV와의 차이가 미리 설정된 임계값 보다 작은 고객만 선별하여 예측 모델(M) 학습하는, 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템.
Customers that include at least one of the customer's purchase history information, at least attribute information including age and region of the customer, number of store or site visits, shopping cart conversion rate, behavioral information including purchase history, and opinion information including comments Customer information collection unit to collect information;
Calculate the sum of purchase amounts (CV) included in the customer purchase history information and classify the life cycle stage of the customer based on the calculated sum of purchase amounts and the number of purchases, a life cycle classification unit that classifies first-time purchase customers, general customers whose number of purchases is less than a first threshold, regular customers whose number of purchases is greater than the first threshold, and loyal customers whose lifetime value (CLV) is greater than or equal to a certain size;
Create learning models (M) that predict future customer value with customer data for each new customer, first-time purchase customer, regular customer, regular customer, and loyal customer (life cycle stage), and learn them through a plurality of learning cycles for each life cycle stage. and an AUTOML unit in which learning is performed through automatic machine learning (AUTOML) that automates coding, algorithm selection, and tuning in the machine learning pipeline;
After a predetermined unit time for each customer life cycle has elapsed, the customer calculates an actual purchase amount during the unit time to obtain a CV value realized for each customer life cycle. CV calculation unit; and
Predicting loyal customers through a plurality of learning models generated by the automatic machine learning (AUTOML) unit for each stage of the customer's life cycle using the obtained CV value for each customer life cycle as the previous CV value in a sliding time window method Including a model learning unit that does,
When learning the learning model, a new prediction model (M) is created by taking over the previous learning model (Mprev) and learning it with a new learning data set (Data, CV), and the actual purchase amount by the customer is called CV A system for automatically generating a customer lifetime value (CLV) prediction model for each stage of a customer's lifecycle, which selects only customers whose difference from the predicted purchase amount, the predicted CV, is less than a preset threshold and learns the prediction model (M).
삭제delete 삭제delete 제6항에 있어서, 상기 학습모델(M)은
현재까지의 고객정보로부터 특정 시점을 정하고 상기 특정 시점 이전의 데이터를 특징(Features)으로 하여 상기 특정 시점 이후의 데이터로부터 고객 가치(구매액)를 라벨로 삼아 고객생애가치를 예측하는 것을 특징으로 하는, 고객생애 단계별 고객생애가치(CLV) 예측 모델 자동 생성 시스템.

The method of claim 6, wherein the learning model (M)
Characterized in that, by determining a specific point in time from customer information up to now, using data before the specific point in time as features, and using customer value (purchase amount) as a label from data after the specific point in time to predict the lifetime value of the customer, A system that automatically generates a customer lifetime value (CLV) prediction model for each stage of a customer's lifecycle.

삭제delete
KR1020210120588A 2021-09-09 2021-09-09 Method and system for automatically generating customer lifetime value (CLV) prediction models for each stage of customer life KR102475513B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210120588A KR102475513B1 (en) 2021-09-09 2021-09-09 Method and system for automatically generating customer lifetime value (CLV) prediction models for each stage of customer life

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210120588A KR102475513B1 (en) 2021-09-09 2021-09-09 Method and system for automatically generating customer lifetime value (CLV) prediction models for each stage of customer life

Publications (1)

Publication Number Publication Date
KR102475513B1 true KR102475513B1 (en) 2022-12-08

Family

ID=84437044

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210120588A KR102475513B1 (en) 2021-09-09 2021-09-09 Method and system for automatically generating customer lifetime value (CLV) prediction models for each stage of customer life

Country Status (1)

Country Link
KR (1) KR102475513B1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010109402A (en) * 2000-05-31 2001-12-10 전하진 System and method for measuring customer's activity value on internet
KR20020045626A (en) * 2000-12-09 2002-06-20 김형주 Customer Behavior Analysis based client management system and Personalization method
KR102237399B1 (en) 2019-07-18 2021-04-07 정화민 Apparatus and method for providing forecasting platform for shopping mall based on artificial intelligence
KR20210079886A (en) * 2019-12-20 2021-06-30 주식회사 엘지씨엔에스 A method and apparatus for determining purchase attribute of customer
KR20210100458A (en) * 2020-02-06 2021-08-17 주식회사 커넥트닷 Method and server for pet health care based on machine learning

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010109402A (en) * 2000-05-31 2001-12-10 전하진 System and method for measuring customer's activity value on internet
KR20020045626A (en) * 2000-12-09 2002-06-20 김형주 Customer Behavior Analysis based client management system and Personalization method
KR102237399B1 (en) 2019-07-18 2021-04-07 정화민 Apparatus and method for providing forecasting platform for shopping mall based on artificial intelligence
KR20210079886A (en) * 2019-12-20 2021-06-30 주식회사 엘지씨엔에스 A method and apparatus for determining purchase attribute of customer
KR20210100458A (en) * 2020-02-06 2021-08-17 주식회사 커넥트닷 Method and server for pet health care based on machine learning

Similar Documents

Publication Publication Date Title
US20170220943A1 (en) Systems and methods for automated data analysis and customer relationship management
CA3235875A1 (en) Method and system for generation of at least one output analytic for a promotion
KR102097045B1 (en) Method and apparatus to recommend products reflecting characteristics of users
Verhoef et al. Advances in customer value management
US11494721B1 (en) Artificial intelligence system for electronically monitoring and analyzing data transmitted through multiple electronic channels to suggest actions for increasing the effectiveness of data transmitted through the channels
Wei et al. Online shopping behavior analysis for smart business using big data analytics and blockchain security
JP2021170326A (en) Method, device and program used in data analysis
KR102475513B1 (en) Method and system for automatically generating customer lifetime value (CLV) prediction models for each stage of customer life
Badiee et al. Development of a monopoly pricing model for diffusion maximization in fuzzy weighted social networks with negative externalities of heterogeneous nodes using a case study
CN116304374A (en) Customer matching method and system based on package data
Huang et al. A method of customer valuation score and implementation for marketing strategy
Hadad et al. A decision‐making support system module for customer segmentation and ranking
Vapiwala et al. Analyzing the Application of Artificial Intelligence for E-Commerce Customer Engagement
Goldstein et al. Are we there yet? Analyzing progress in the conversion funnel using the diversity of searched products
Guo A study on data mining of digital display performance of brand advertisement
Hilpi Measuring customer experience in online grocery industry
Tănase Predictive Marketing: Anticipating Market Demand with Proactive Action
Vezzoli et al. Will they stay or will they go? predicting customer churn in the energy sector
Rudskaia et al. Digital clustering in customer relationship management
Rymarczyk et al. Profiling and segmenting clients with the use of machine learning algorithms
Sarı Responsive Demand Management in the Era of Digitization
Aichner et al. Demand Forecasting Methods and the Potential of Machine Learning in the FMCG Retail Industry
Bisset A stochastic programming approach for marketing campaign optimisation
Bajpai et al. Decision making with IoT-Paving an integrated approach
US20230410015A1 (en) Dashboard analysis using computation engine for pipeline performance management

Legal Events

Date Code Title Description
AMND Amendment
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant