KR102129962B1 - 딥 러닝과 부스티드 디시즌 트리를 활용한 고객이탈 예측장치 및 이를 이용한 고객이탈 예측방법 - Google Patents

딥 러닝과 부스티드 디시즌 트리를 활용한 고객이탈 예측장치 및 이를 이용한 고객이탈 예측방법 Download PDF

Info

Publication number
KR102129962B1
KR102129962B1 KR1020180057094A KR20180057094A KR102129962B1 KR 102129962 B1 KR102129962 B1 KR 102129962B1 KR 1020180057094 A KR1020180057094 A KR 1020180057094A KR 20180057094 A KR20180057094 A KR 20180057094A KR 102129962 B1 KR102129962 B1 KR 102129962B1
Authority
KR
South Korea
Prior art keywords
customer
prediction
model
processing data
data
Prior art date
Application number
KR1020180057094A
Other languages
English (en)
Other versions
KR20190134934A (ko
Inventor
이지형
우상명
김경태
Original Assignee
성균관대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 성균관대학교산학협력단 filed Critical 성균관대학교산학협력단
Priority to KR1020180057094A priority Critical patent/KR102129962B1/ko
Publication of KR20190134934A publication Critical patent/KR20190134934A/ko
Application granted granted Critical
Publication of KR102129962B1 publication Critical patent/KR102129962B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 기업이 제공하는 서비스로부터 고객이 이탈할 것인지를 예측하는 고객이탈 예측장치에 관한 것으로,
본 발명의 실시예에 따른 고객이탈 예측장치는,
고객 데이터가 입력되는 입력부; 상기 입력부로 입력된 고객 데이터를 전처리하여 시간기준 전처리 데이터와 고객기준 전처리 데이터로 분류하는 전처리부; 상기 분류된 시간기준 전처리 데이터를 이용하여 행동패턴을 추출하고, 상기 분류된 고객기준 전처리 데이터를 이용하여 고객의 통계지표를 추출하며, 상기 추출된 행동패턴과 통계지표를 이용하여 고객의 이탈 여부를 예측하는 고객이탈 예측부; 및, 상기 고객이탈 예측부의 예측 결과를 출력하는 출력부를 포함한다.

Description

딥 러닝과 부스티드 디시즌 트리를 활용한 고객이탈 예측장치 및 이를 이용한 고객이탈 예측방법 {Predictive device for customer churn using Deep Learning and Boosted Decision Trees and method of predicting customer churn using it}
본 발명은 기업이 제공하는 서비스로부터 고객이 이탈할 것인지를 예측하는 고객이탈 예측장치 및 이를 이용한 고객이탈 예측방법에 관한 것이다.
많은 기업들은 경쟁 시장에서 우위를 유지하고 안정적인 수익을 확보하기 위해, 고객 중심 비즈니스 전략의 중요성을 인식하고 있다. 회사는 고객으로부터 발생하는 수익에 의존적이기 때문에, 고객 관계 관리(Customer Relationship Management)는 고객의 실제 행동을 반영하는 데이터를 기반으로 의사 결정을 수행한다. 예를 들면, 데이터 분석을 통해 고객의 잠재적 가치를 평가하고, 고객 이탈 가능성을 예측한다.
거래를 중단하려는 고객의 경향으로 정의되는 고객 이탈은 전 세계 기업이 당면 하고 있는 중요한 과제 중 하나이다. 고객 이탈로 인한 매출 감소는 기회비용을 발생시킬 뿐만 아니라 신규 고객 유치의 필요성을 증가시킨다. 하지만 신규 고객을 확보하는데 드는 비용은 $300에서 $600에 이르는 것으로 추산되며, 이 수치는 기존의 고객을 유지하기 위해 소요되는 비용보다 5∼6배 더 높은 수치이다.
따라서 기존의 고객 중 이탈할 가능성이 높은 고객을 예측해 방지하는 것이 신규 고객을 유치하는 것보다 비용적인 측면에서 효과적이다. 고객 이탈을 효과적으로 관리하기 위해서는 정확한 고객 이탈 예측모델을 구축하는 것이 중요하다.
데이터마이닝 기법을 통한 백화점의 고객이탈예측모형 연구 (아시아마케팅저널, 2005, 6권 4호, 저자 윤성준)
본 발명은 보다 향상된 정확도로 고객의 이탈 여부를 판단할 수 있는 고객이탈 예측장치 및 이를 이용한 고객이탈 예측방법을 제공하는 것을 목적으로 한다.
본 발명의 실시예에 따른 고객이탈 예측장치는,
고객 데이터가 입력되는 입력부; 상기 입력부로 입력된 고객 데이터를 전처리하여 시간기준 전처리 데이터와 고객기준 전처리 데이터로 분류하는 전처리부; 상기 분류된 시간기준 전처리 데이터를 이용하여 행동패턴을 추출하고, 상기 분류된 고객기준 전처리 데이터를 이용하여 고객의 통계지표를 추출하며, 상기 추출된 행동패턴과 통계지표를 이용하여 고객의 이탈 여부를 예측하는 고객이탈 예측부; 및, 상기 고객이탈 예측부의 예측 결과를 출력하는 출력부를 포함한다.
본 발명의 실시예에 따른 고객이탈 예측장치에 있어서, 상기 전처리부는, 상기 입력부로 입력된 고객 데이터를 시간기준으로 전처리하여 시간기준 전처리 데이터로 분류하는 시간기준 전처리 모듈과, 상기 입력부로 입력된 고객 데이터를 고객기준으로 전처리하여 고객기준 전처리 데이터로 분류하는 고객기준 전처리 모듈을 포함한다.
본 발명의 실시예에 따른 고객이탈 예측장치에 있어서, 상기 시간기준 전처리 데이터는 고객의 행동을 시간 순으로 배열한 타임 테이블 형식이고, 상기 고객기준 전처리 데이터는 시간과는 무관하게 다수의 고객 속성을 배열한 속성 테이블 형식일 수 있다.
본 발명의 실시예에 따른 고객이탈 예측장치에 있어서, 상기 고객이탈 예측부는, 상기 분류된 시간기준 전처리 데이터를 이용하여 행동패턴을 추출하여 고객의 이탈 여부를 예측하는 행동패턴 추출모델과, 상기 분류된 고객기준 전처리 데이터를 이용하여 통계지표를 추출하여 고객의 이탈 여부를 예측하는 통계지표 추출모델과, 상기 행동패턴 추출모델과 상기 통계지표 추출모델의 예측 결과에 대해 투표 기법을 적용하여 과반수 이상의 예측 결과를 산출하는 앙상블 예측모델을 포함한다.
본 발명의 실시예에 따른 고객이탈 예측장치에 있어서, 상기 행동패턴 추출모델은 RNN(Recurrent Neural Network, 순환 신경망) 기반의 예측모델, CNN(Convolutional Neural Network, 콘볼루션 신경망) 기반의 예측모델, 상기 통계지표 추출모델은 RF(Random Forest, 랜덤 포레스트) 기반의 예측 모델 또는 XGBoost(Extreme Gradient Boosting) 기반의 예측 모델일 수 있다.
본 발명의 실시예에 따른 고객이탈 예측장치에 있어서, 상기 고객이탈 예측부는, 상기 RNN, CNN, RF, XGBoost 기반의 예측 모델 중 적어도 어느 3개의 예측 모델로 이루어질 수 있다.
본 발명의 실시예에 따른 고객이탈 예측장치에 있어서, 상기 앙상블 예측모델은, 상기 RNN 기반의 예측 모델과 상기 RF 기반의 예측 모델과, 상기 XGBoost 기반의 예측 모델로 이루어질 수 있다.
본 발명의 실시예에 따른 고객이탈 예측방법은,
컴퓨팅 수단에 의해 수행되며, 고객 데이터를 입력하는 제1 단계; 상기 입력된 고객 데이터를 전처리하여 시간기준 전처리 데이터와 고객기준 전처리 데이터로 분류하는 제2 단계; 상기 분류된 시간기준 전처리 데이터를 이용하여 행동패턴을 추출하고, 상기 분류된 고객기준 전처리 데이터를 이용하여 고객의 통계지표를 추출하며, 상기 추출된 행동패턴과 통계지표를 이용하여 고객의 이탈 여부를 예측하는 제3 단계; 및, 상기 고객이탈 예측부의 예측 결과를 출력하는 제4 단계를 포함한다.
본 발명의 실시예에 따른 고객이탈 예측방법에 있어서, 상기 제2 단계는, 상기 입력된 고객 데이터를 시간기준으로 전처리하여 시간기준 전처리 데이터로 분류하고, 상기 입력된 고객 데이터를 고객기준으로 전처리하여 고객기준 전처리 데이터로 분류한다.
본 발명의 실시예에 따른 고객이탈 예측방법에 있어서, 상기 시간기준 전처리 데이터는 고객의 행동을 시간 순으로 배열한 타임 테이블 형식이고, 상기 고객기준 전처리 데이터는 시간과는 무관하게 다수의 고객 속성을 배열한 속성 테이블 형식일 수 있다.
본 발명의 실시예에 따른 고객이탈 예측방법에 있어서, 상기 제3 단계는, 상기 분류된 시간기준 전처리 데이터를 이용하여 행동패턴을 추출하여 고객의 이탈 여부를 예측하는 과정과, 상기 분류된 고객기준 전처리 데이터를 이용하여 통계지표를 추출하여 고객의 이탈 여부를 예측하는 과정과, 상기 예측 결과에 대해 투표 기법을 적용하여 과반수 이상의 예측 결과를 산출하는 과정을 포함한다.
본 발명의 실시예에 따른 고객이탈 예측방법에 있어서, 상기 행동패턴은 RNN 기반의 예측모델, CNN 기반의 예측모델, 상기 통계지표는 RF 기반의 예측 모델 또는 XGBoost 기반의 예측 모델을 이용하여 추출할 수 있다.
본 발명의 실시예에 따른 고객이탈 예측방법에 있어서, 상기 제3 단계는, 상기 RNN, CNN, RF, XGBoost 기반의 예측 모델 중 적어도 어느 3개의 예측 모델을 이용할 수 있다.
본 발명의 실시예에 따른 고객이탈 예측방법에 있어서, 상기 예측 결과에 대해 투표 기법을 적용하여 과반수 이상의 예측 결과를 산출하는 과정은, 상기 RNN 기반의 예측 모델과 상기 RF 기반의 예측 모델과, 상기 XGBoost 기반의 예측 모델을 이용하는 것이 바람직하다.
본 발명의 실시예에 따른 기록매체에 저장된 컴퓨터 프로그램은,
컴퓨터에서, 고객 데이터를 입력하는 제1 단계; 상기 입력된 고객 데이터를 전처리하여 시간기준 전처리 데이터와 고객기준 전처리 데이터로 분류하는 제2 단계; 상기 분류된 시간기준 전처리 데이터를 이용하여 행동패턴을 추출하고, 상기 분류된 고객기준 전처리 데이터를 이용하여 고객의 통계지표를 추출하며, 상기 추출된 행동패턴과 통계지표를 이용하여 고객의 이탈 여부를 예측하는 제3 단계; 및, 상기 고객이탈 예측부의 예측 결과를 출력하는 제4 단계를 실행시킨다.
기타 본 발명의 다양한 측면에 따른 구현예들의 구체적인 사항은 이하의 상세한 설명에 포함되어 있다.
본 발명의 실시예에 따른 고객이탈 예측장치에 의하면, 보다 향상된 정확도로 고객의 이탈 여부를 판단할 수 있다.
도 1은 본 발명의 실시예에 따른 고객이탈 예측장치가 도시된 블록도이다.
도 2는 고객의 행동을 시간 순으로 배열한 타임 테이블 형식의 시간기준 전처리 데이터의 일 예이다.
도 3은 다수의 고객 속성을 배열한 속성 테이블 형식의 고객기준 전처리 데이터의 일 예이다.
도 4는 고객의 행동패턴을 추출하는 RNN 모델이 도시된 도면이다.
도 5는 고객의 행동패턴을 추출하는 CNN 모델이 도시된 도면이다.
도 6은 본 발명의 실시예에 따른 고객이탈 예측장치의 향상된 정확도 측정에 사용된 데이터 세트이다.
도 7은 도 6의 데이터 세트를 여러 예측 모델을 이용하여 예측한 결과의 정확도가 예시된 표이다.
도 8은 각각의 예측 모델의 정확도가 예시된 표이다.
도 9는 속성의 중요도가 예시된 그래프이다.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예를 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
본 발명에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 발명에서, '포함하다' 또는 '가지다' 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 발명의 고객이탈 예측장치는 고객의 행동 패턴을 이용하여 고객 이탈을 예측하는 딥 러닝 기반의 예측모델과 고객의 통계적 특징을 활용하는 Boosted Decision Tree 기반의 예측모델을 이용한다. 본 발명의 고객이탈 예측장치는 각 모델의 효과적인 고객 이탈 예측을 위한 데이터 전처리 기법 및, 고객의 행동 패턴과 고객의 통계적 특징을 모두 활용하는 앙상블 모델에 대해 개시한다. 이하, 도면을 참조하여 본 발명의 실시예에 따른 고객이탈 예측장치 및 고객이탈 예측방법을 설명한다.
도 1은 본 발명의 일 실시예에 따른 고객이탈 예측장치가 도시된 블록도이다. 도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 고객이탈 예측장치는, 입력부(100), 전처리부(200), 고객이탈 예측부(300), 출력부(400)를 포함한다.
입력부(100)는 고객 데이터를 입력 받는다. 고객 데이터란, 고객이탈 예측을 위해 이용되는 각종 데이터로, 예를 들어, 게임 산업 분야에서는 특정 게임 사용자의 로그인 데이터 및 해당 게임에서의 활동 내역을 표시하는 데이터일 수 있고, 금융 산업 분야에서는 고객이 사용 중인 각종 카드의 사용 내역일 수 있다.
전처리부(200)는 입력부(100)로 입력된 고객 데이터를 전처리하여 시간기준 전처리 데이터와 고객기준 전처리 데이터로 분류한다. 전처리부(200)는 시간기준 전처리 모듈(210)과 고객기준 전처리 모듈(220)을 포함하고, 시간기준 전처리 모듈(210)은 입력부(100)로 입력된 고객 데이터를 시간기준으로 전처리하여 시간기준 전처리 데이터로 분류하고, 고객기준 전처리 모듈(220)은 입력부(100)로 입력된 고객 데이터를 고객기준으로 전처리하여 고객기준 전처리 데이터로 분류한다.
시간기준 전처리 모듈(210)에 의해 분류된 시간기준 전처리 데이터는 시간에 따른 고객의 행동 변화를 반영한 데이터이다.
시간기준 전처리 데이터는, 도 2에 도시된 바와 같이, 고객의 행동을 시간 순으로 배열한 타임 테이블 형식일 수 있다. 도 2의 (a), (b) 표에서 “Customer ID”는 고객 아이디, “Time”은 고객이 특정 행동을 한 시간을 의미한다. “Attribute_standard”는 기준 속성을 의미한다. 기준 속성은 고객 행동의 기준이 되는 대표 속성으로, 예를 들어, 고객이 게임을 플레이하는 경우, 해당 게임 내에서 제공되는 여러 캐릭터 중 하나일 수 있다. (a) 표에서는 1번 캐릭터가 기준 속성이 되고, (b) 표에서는 2번 캐릭터가 기준 속성이 된다. 또한 예를 들어, 고객이 사용하는 카드인 경우, 도 2의 (a), (b) 표에서 “Attribute_standard”는 종류가 다른 2개의 A 카드(1), B 카드(2)일 수 있다.
“Attribute1”, “Attribute2”는 고객의 행동을 표현하는 행동 속성을 의미한다. 예를 들어, 게임인 경우, 표 (a)의 2번째 라인은 고객(4175D6K2)이 2017년 3월 4일 1번 캐릭터로 게임을 하면서 취득한 게임 머니의 양(Attribute1)과 획득한 아이템(Attribute2)을 의미한다.
이와 같이 “Attribute + 숫자”로 표시될 수 있는 행동 속성은, 다양하게 정의될 수 있다. 예를 들어, 매 초마다 유저(고객)의 캐릭터가 얻는 경험치 양, 매 초마다 유저(고객)의 캐릭터가 얻는 돈의 양, 매 초마다 유저(고객)의 캐릭터가 이동하는 경로, 매 초마다 유저(고객)의 캐릭터가 취하는 행동(공격, 스킬 발동 등등) 등이 될 수 있다.
이러한 시간기준 전처리 데이터는 시간에 따른 고객의 행동 변화를 있는 그대로 표현하기 때문에, 고객의 행동 패턴을 추출하는 데에 효과적이다.
상기와 같이 고객의 행동 패턴은 특정 속성을 기준으로 세분화하여 표현할 수 있다. 예를 들어, 금융 산업에서의 한 고객의 행동 패턴은 사용 중인 각 카드의 결제 패턴으로 분리할 수 있다. 게임 산업에서의 한 고객의 행동 패턴은 고객이 소유하고 있는 각 캐릭터의 행동 패턴으로 분리할 수 있다. 이와 같이 기준 속성을 이용하여 고객의 행동 데이터를 분할함으로써 더 정교한 고객의 행동 패턴을 추출할 수 있다.
시간기준 전처리 모듈(210)은 기준 속성을 기준으로 고객의 행동 데이터를 세분화하여 시간에 따른 시간기준 전처리 데이터로 분류한다. 시간기준 전처리 모듈(210)에 의해 분류된 시간기준 전처리 데이터는 행동패턴 추출모델(310)을 구축하기 위해 활용된다.
고객기준 전처리 모듈(220)에 의해 분류된 고객기준 전처리 데이터는 시간에 따른 고객의 통계적 특징을 반영한 데이터이다.
고객기준 전처리 데이터는, 도 3에 도시된 바와 같이, 시간과는 무관하게 다수의 고객 속성을 배열한 속성 테이블 형식일 수 있다. 고객기준 전처리 데이터는 각 고객의 특징적인 속성을 나타내는 데이터로, 고객의 속성의 평균값, 최대값, 최소값 등이 있다. 예를 들어, 고객이 하루에 특정 게임을 play한 시간을 대상 속성으로 할 때, 고객기준 전처리 데이터는 고객(게임 유저)이 하루에 play한 시간의 평균값, 최대값, 최소값 등이 될 수 있다.
도 3의 표에서 “Customer ID”는 고객 아이디, “Attribute1_mean”은 속성1의 평균값, “Attribute2_mode”는 속성2의 최대/최소값, “Attribute3_slope”는 속성3의 기울기 등을 의미한다. 도 3의 표에서, “Attribute1_mean”, “Attribute2_mode”, “Attribute3_slope”는 각각 다른 속성에 대해 배열한 것이나, 동일한 고객 아이디의 동일한 속성에 관한 것인 경우, “Attribute2_mode”는 “Attribute1_mode”, “Attribute3_slope”는 “Attribute1_slope”로 배열할 수도 있다.
고객기준 전처리 모듈(220)에 의해 분류된 고객기준 전처리 데이터는 통계지표 추출모델(320)을 구축하기 위해 활용된다.
고객이탈 예측부(300)는 시간기준 전처리 데이터와 고객기준 전처리 데이터를 상호 보완적으로 활용하여 고객이탈 여부를 예측한다. 고객이탈 예측부(300)는 행동패턴 추출모델(310)과 통계지표 추출모델(320)과 앙상블 예측모델(330)을 포함한다.
행동패턴 추출모델(310)에서는 시간기준 전처리 데이터를 이용하여 행동패턴을 추출하여 고객의 이탈 여부를 예측하고, 통계지표 추출모델(320)에서는 고객기준 전처리 데이터를 이용하여 통계지표를 추출하여 고객의 이탈 여부를 예측한다. 앙상블 예측모델(330)은 행동패턴 추출모델(310)과 통계지표 추출모델(320)의 예측 결과에 대해 투표 기법을 적용하여 과반수 이상의 예측 결과를 산출한다.
행동패턴 추출모델(310)은 도 2에 도시된 바와 같은 시간기준 전처리 데이터를 이용하여 고객의 행동패턴을 추출하여 고객의 이탈 여부를 예측한다.
행동패턴 추출모델(310)은 RNN(Recurrent Neural Network, 순환 신경망) 기반의 예측모델, CNN(Convolutional Neural Network, 콘볼루션 신경망) 기반의 예측모델일 수 있다.
RNN은 시계열 데이터(time-series data)와 같이 시간의 흐름에 따라 변화하는 데이터를 학습하기 위한 딥 러닝 모델로, 기준 시점(t)과 다음 시점(t+1)에 네트워크를 연결하여 구성한 인공 신경망(ANN)이다.
LSTM은 RNN에서 발생하는 vanishing gradient problem을 극복하기 위해 제안된 것으로, LSTM은 각 노드로 흘러 들어가는 정보의 양을 gate들을 이용하여 조절하여 정보가 희석되는 현상을 늦춰준다. Cell state에 input gate, forget gate를 적용하여 정보를 선택적으로 추가하거나 제거한다. Gate의 열리고 닫히는 정도를 통해, hidden 노드의 정보가 희석되는 정도를 조절할 수 있어 vanishing gradient 현상을 어느 정도 예방할 수 있다. LSTM은 RNN의 일종이다.
CNN은 다층 신경망의 한 종류로 패턴 인식 분야에서 좋은 성능을 보이고 있어 이미지, 텍스트 등의 데이터를 분류, 인식하는데 주로 사용된다. CNN은 주된 요소는 convolution 층과 poolng 층이다. 입력의 특징을 추출하는 convolution 층과 중요한 정보를 손실하지 않고 입력을 축소하는 pooling 층을 통해 원본 데이터의 특징을 추출한다.
행동패턴 추출모델(310)은, 도 4 및 도 5에 도시된 바와 같이, 시간기준 전처리 데이터(TD)를 이용하여 고객의 행동패턴을 추출하는 RNN 모델(도 4) 또는 CNN 모델을 구축한다. 각 모델을 이용하여 추출한 고객의 행동패턴을 concatenate 연산하여 인공 신경망에 적용한다. 즉, 기준 속성에 따라 세분화된 고객의 행동패턴을 독립적으로 활용하여 고객 이탈을 예측한다.
행동패턴 추출모델(310)은 RNN 모델이나 CNN 모델 중 어느 하나의 모델로 이루어지거나, 또는 RNN 모델과 CNN 모델로 이루어질 수 있다.
통계지표 추출모델(320)은 도 3에 도시된 바와 같은 고객기준 전처리 데이터를 이용하여 고객의 통계 지표를 추출하여 고객의 이탈 여부를 예측한다.
통계지표 추출모델(320)은 RF(Random Forest, 랜덤 포레스트) 기반의 예측모델과 XGBoost (Extreme Gradient Boosting) 기반의 예측모델 중 적어도 어느 하나로 이루어질 수 있으며, 보다 구체적으로는 RF, XGBoost 기반의 예측모델이 함께 통계지표 추출모델(320)을 구축하는 것이 바람직하다.
RF는 의사결정 트리 기반의 기계학습 기법 중 하나로, 성능이 낮은(정확도가 낮은) 여러 개의 모델이 결합하여 높은 성능의 모델을 형성하는 앙상블 기법이다. 분류를 수행하기 위해 각 트리는 특정 class에 대해 “투표”하고, 가장 많은 득표를 한 class로 분류한다. 독립 변수의 중요도를 계산할 수 있고 과적합을 줄일 수 있다는 장점을 가지고 있다.
XGBoost는 트리 부스팅을 위한 고효율의 확장 가능한 기계학습 기법으로, 기존 트리 부스팅 기반의 기법보다 높은 성능을 보여 다양한 분야에서 사용되고 있다. 트리 앙상블 기법 중 하나로, 트리를 구성할 때 병렬처리 기법을 사용하기 때문에 수행시간이 빠르다는 장점이 있다.
통계지표 추출모델(320)이 RF와, XGBoost 기반의 예측모델이 함께 구축된 경우, 먼저 RF를 이용하여 고객기준 전처리 데이터에 포함된 각 속성의 중요도를 계산한다. 속성의 중요도 계산은, Mean Decrease Accuracy를 계산하는 것으로, Random Forest를 가동하면, Random Forest 내부의 알고리즘을 통해 계산된다. 각 속성의 중요도 계산 결과, 높은 중요도를 가지는 기설정된 개수의 속성을 선정하여 RF 모델과 XGBoost 모델을 구축한다. 여기서, 기설정된 개수는, 예를 들어 100개일 수 있다.
즉, 고객기준 전처리 데이터에 포함된 모든 속성을 이용하여 RF 모델과 XGBoost 모델을 구축하는 것이 아니라, RF 모델에 의해 계산되어 중요도 순으로 배열된 속성들 중에서 상위 100개의 속성을 선정하고, 이 선정된 속성을 이용하여 RF 모델과 XGBoost 모델을 구축한다.
앙상블 예측모델(330)은 행동패턴 추출모델(310)과 통계지표 추출모델(320)의 예측 결과에 대해 투표 기법을 적용하여 과반수 이상의 예측 결과를 산출한다. 보다 구체적으로, 앙상블 예측모델(330)은 고객의 행동패턴을 활용하는 RNN 모델, CNN 모델 중 정확도가 높은 모델 RNN 모델과, 고객의 통계지표를 활용하는 RF 모델과 XGBoost 모델로 구축될 수 있다. 즉, 앙상블 예측모델(330)은 RNN 모델, RF 모델, XGBoost 모델로 구축될 수 있는 데, 여기서 앙상블 예측모델(330)을 위해 다시 RNN 모델, RF 모델, XGBoost 모델을 구축하는 것이 아니라, 행동패턴 추출모델(310)과 통계지표 추출모델(320) 구축을 위해 사용된 RNN 모델, RF 모델, XGBoost 모델을 사용하여 앙상블 예측모델(330)을 구축한다.
앙상블 예측모델(330)에서의 이탈 여부 예측 과정은, 행동패턴 추출모델(310)과 통계지표 추출모델(320)을 구축하는 RNN 모델, RF 모델, XGBoost 모델의 이탈 여부 예측 결과, 어느 2개 이상이 “이탈”로 예측하고, 나머지 하나가 “비이탈”로 예측한 경우, 앙상블 예측모델(330)은 투표 기법에 따라 다수인 “이탈”로 예측한다.
출력부(400)는 고객이탈 예측부(300)의 예측 결과를, 시각적 또는 청각적 수단을 통해 외부로 출력한다.
다음으로, 본 발명의 실시예에 따른 고객이탈 예측방법을 설명한다.
본 발명의 실시예에 따른 고객이탈 예측방법은 컴퓨팅 수단에 의해 수행될 수 있다. 여기서, 컴퓨팅 수단은, 데스크탑 컴퓨터, 노트북, 태블릿 PC, 이동통신 단말기 등 프로그램을 저장하기 위한 메모리, 프로그램을 실행하여 연산 및 제어하기 위한 마이크로프로세서 등을 구비하고 있는 단말기를 의미한다. 이러한 컴퓨팅 수단은, 전술한 고객이탈 예측장치의 구성요소인 입력부(100), 전처리부(200), 고객이탈 예측부(300), 출력부(400) 등을 구비하거나, 이들의 기능을 실행시키는 기록매체에 저장된 프로그램이 탑재되어 고객이탈 예측방법을 수행할 수 있다.
본 발명의 실시예에 따른 고객이탈 예측방법은, 고객 데이터를 입력하는 제1 단계와, 입력된 고객 데이터를 전처리하여 시간기준 전처리 데이터와 고객기준 전처리 데이터로 분류하는 제2 단계와, 분류된 시간기준 전처리 데이터를 이용하여 행동패턴을 추출하고, 분류된 고객기준 전처리 데이터를 이용하여 고객의 통계지표를 추출하며, 추출된 행동패턴과 통계지표를 이용하여 고객의 이탈 여부를 예측하는 제3 단계와, 고객이탈 예측부의 예측 결과를 출력하는 제4 단계를 포함한다.
컴퓨팅 수단은, 제1 단계에서 입력된 고객 데이터를 시간기준으로 전처리하여 시간기준 전처리 데이터로 분류한다. 또한, 제1 단계에서 입력된 고객 데이터를 고객기준으로 전처리하여 고객기준 전처리 데이터로 분류한다.
여기서, 시간기준 전처리 데이터는 고객의 행동을 시간 순으로 배열한 타임 테이블 형식일 수 있다. 또한, 고객기준 전처리 데이터는 시간과는 무관하게 다수의 고객 속성을 배열한 속성 테이블 형식일 수 있다.
고객의 이탈 여부를 예측하는 제3 단계는, 분류된 시간기준 전처리 데이터를 이용하여 행동패턴을 추출하여 고객의 이탈 여부를 예측하는 과정과, 분류된 고객기준 전처리 데이터를 이용하여 통계지표를 추출하여 고객의 이탈 여부를 예측하는 과정과, 예측 결과에 대해 투표 기법을 적용하여 과반수 이상의 예측 결과를 산출하는 과정을 포함한다.
행동패턴은 RNN 기반의 예측모델, CNN 기반의 예측모델을 이용하여 추출할 수 있다. 또한, 통계지표는 RF 기반의 예측 모델 또는 XGBoost 기반의 예측 모델을 이용하여 추출할 수 있다.
제3 단계는, RNN, CNN, RF, XGBoost 기반의 예측 모델 중 적어도 어느 3개의 예측 모델을 이용할 수 있으며, 예측 결과에 대해 투표 기법을 적용하여 과반수 이상의 예측 결과를 산출하는 과정은, RNN 기반의 예측 모델과 RF 기반의 예측 모델과, XGBoost 기반의 예측 모델을 이용하는 것이 바람직하다.
다음으로, 실험 자료를 통해 본 발명의 실시예에 따른 고객이탈 예측장치의 향상된 정확도에 대해 살펴본다.
1. 실험 자료
본 실험은 게임 Blade & Soul의 로그 데이터를 이용하였다. Training data 4000개, validation data 3000개, test data 3000개로 구성되어 있으며, 한 개의 데이터는 한 명의 고객에 대해 8주 동안 수집된 로그 데이터이다.
본 실험에 사용한 데이터는 엔씨소프트가 제공한 데이터로, 2017 Game Data Mining competition (IEEE Computational Intelligence in Games)에서 공개되었다. 데이터의 구성은 도 6에 도시된 표와 같다.
도 6에서 “churn”은 이탈했다는 의미이다. training data을 통해 모델을 만들고, validation data를 통해 신뢰도를 구하고 test data를 이용해 최종 정확도를 계산한다. 이탈한 고객의 수와 이탈하지 않은 고객의 수가 불균형하기 때문에, Oversampling을 적용하여 데이터 불균형으로 인한 모델의 성능 감소를 해결하였다.
5.2 예측 모델 구축
시간기준 전처리를 위한 기준 속성으로 고객이 플레이하는 캐릭터를 사용하였다. 본 실험에 사용한 게임은 한 명의 유저가 여러 개의 캐릭터를 소유할 수 있다. 따라서, 플레이 시간이 가장 긴 캐릭터를 메인 캐릭터, 나머지 캐릭터를 보조 캐릭터로 정의하여, 한 고객의 행동패턴을 두 캐릭터의 행동패턴으로 분리하였다.
LSTM를 이용하여 RNN 예측 모델을 구축한다. RNN 예측 모델은 5개의 레이어로 구성되며, 각 레이어는 56개의 LSTM cell로 구성된다.
CNN 예측 모델은 5개의 레이어로 구성되며, 한 개의 레이어는 3×1 convolution과 3 ×1 max pooling으로 구성된다.
RNN 예측 모델과 CNN 예측 모델은 활성화 함수로 Exponential Linear Units(ELU)(1.0)를 사용하였다. Loss는 cross entropy를 사용하였고 optimizer로 Root Mean Square Propagation(RMSProp)를 사용하였다. 또한 각 layer에 Batch normalization과 Dropout(0.4)를 적용하였다.
RF 예측 모델과 XGBoost 예측 모델 구축을 위해 각 고객의 통계적 특징을 나타내는 속성(통계지표)과 고객의 행동 변화를 반영하는 속성(행동패턴) 1364개를 생성하였다. 예측 모델 구축에 활용할 속성의 선정을 위해, RF를 이용하여 각 속성의 Mean Decrease Accuracy를 산출하였다. 산출한 중요도를 기반으로 100개의 속성을 선정하여 RF 예측 모델과 XGBoost 예측 모델을 구축하였다.
3. 실험 결과
예측 모델의 정확도는 도 7에 도시된 표와 같다. 한 가지 특징을 활용하는 예측 모델 중 가장 높은 정확도를 보이는 모델은 RNN을 이용하여 고객의 행동패턴을 추출한 예측모델이다. 두 번째로 높은 정확도를 보이는 모델은 고객의 통계적 특징(통계지표)을 활용하는 XGBoost 예측모델이다.
RNN 모델과 XGBoost 모델을 이용하여 구축한 앙상블 예측 모델의 정확도는 76%로 가장 높은 정확도를 보였다. 즉, 고객의 행동패턴과 고객의 통계적 특징(통계지표)을 함께 활용하여 고객 이탈을 예측하는 모델의 성능이 가장 뛰어났다.
추가적으로, 기준 속성을 이용하여 분할하지 않은 데이터를 이용하여 RNN 모델과 CNN 모델을 구축하였다. 이를 통해 기준 속성을 이용한 고객 행동패턴의 세분화가 고객 이탈예측에 유효한 영향을 주는지 확인하였다.
또한, 행동 변화 반영 속성을 포함하지 않은 데이터를 이용하여 RF 모델과 XGBoost 모델을 구축하였다. 이를 통해 행동 변화 반영 속성이 고객 이탈 예측에 유효한 영향을 주는지 확인하였다. 실험 결과는 도 8에 도시된 표와 같다.
기준 속성을 이용하여 고객의 행동 데이터를 분할하여 행동패턴을 추출한 RNN 모델과 CNN 모델의 정확도가 그렇지 않은 모델의 정확도보다 평균 3.5% 높았다. 따라서 기준 속성에 따라 고객의 행동패턴을 세분화하여 추출하는 것은 고객 이탈예측에 효과적임을 알 수 있었다.
고객의 행동 변화를 반영하는 속성을 이용한 XGBoost, RF 모델의 정확도가 그렇지 않은 모델의 정확도보다 평균 6.5% 높았다. 또한, XGBoost 모델과 RF 모델을 구축하기 위해 계산한 각 속성의 중요도(Mean Decrease Accuracy)는 도 9와 같다.
가장 높은 중요도를 가지는 속성은 매주 고객이 얻은 경험치의 변화량이다. 두 번째로 중요한 속성은 마지막 한 주 동안 고객이 아이템을 변환시킨 횟수이다. 세 번째로 중요한 속성은 매주 플레이 시간의 변동 계수이다. 상위 3개의 속성이 고객의 행동 변화를 반영하는 속성이다. 따라서, 고객의 통계적 특징을 활용하여 고객 이탈을 예측할 때, 고객의 행동 변화를 반영하는 속성을 포함하는 것이 효과적임을 알 수 있다.
상기와 같은, 본 발명의 실시예에 따른 고객이탈 예측장치에 의하면, 보다 향상된 정확도로 고객의 이탈 여부를 판단할 수 있다.
이상, 본 발명의 일 실시예에 대하여 설명하였으나, 해당 기술 분야에서 통상의 지식을 가진 자라면 특허청구범위에 기재된 본 발명의 사상으로부터 벗어나지 않는 범위 내에서, 구성 요소의 부가, 변경, 삭제 또는 추가 등에 의해 본 발명을 다양하게 수정 및 변경시킬 수 있을 것이며, 이 또한 본 발명의 권리범위 내에 포함된다고 할 것이다.
100 : 입력부 200 : 전처리부
210 : 시간기준 전처리 모듈 220 : 고객기준 전처리 모듈
300 : 고객이탈 예측부 310 : 행동패턴 추출모델
320 : 통계지표 추출모델 330 : 앙상블 예측모델
400 : 출력부

Claims (15)

  1. 고객 데이터가 입력되는 입력부;
    상기 입력부로 입력된 고객 데이터를 전처리하여 시간기준 전처리 데이터와 고객기준 전처리 데이터로 분류하는 전처리부;
    상기 분류된 시간기준 전처리 데이터를 이용하여 행동패턴을 추출하고, 상기 분류된 고객기준 전처리 데이터를 이용하여 고객의 통계지표를 추출하며, 상기 추출된 행동패턴과 통계지표를 이용하여 고객의 이탈 여부를 예측하는 고객이탈 예측부; 및,
    상기 고객이탈 예측부의 예측 결과를 출력하는 출력부
    를 포함하되,
    상기 고객이탈 예측부는,
    상기 분류된 시간기준 전처리 데이터를 이용하여 상기 행동패턴을 추출하여 고객의 이탈 여부를 예측하는 행동패턴 추출모델과,
    상기 분류된 고객기준 전처리 데이터를 이용하여 상기 통계지표를 추출하여 고객의 이탈 여부를 예측하는 통계지표 추출모델과,
    상기 행동패턴 추출모델과 상기 통계지표 추출모델의 예측 결과에 대해 투표 기법을 적용하여 과반수 이상의 예측 결과를 산출하는 앙상블 예측모델을 포함하고,
    상기 행동패턴 추출모델은 기준 속성에 따라 세분화된 상기 행동패턴을 독립적으로 활용하여 고객의 이탈 여부를 예측하고,
    상기 통계지표 추출모델은 RF(Random Forest, 랜덤 포레스트) 기반의 예측 모델을 포함하고, 상기 RF 기반의 예측 모델을 이용하여 Mean Decrease Accuracy를 계산함으로써 상기 고객기준 전처리 데이터에 포함된 각 속성의 중요도를 계산하고, 높은 중요도를 가지는 기설정된 개수의 속성을 선정하여 고객의 이탈 여부를 예측하고,
    상기 앙상블 예측모델은 상기 행동패턴 추출모델과 상기 통계지표 추출모델을 구축하기 위해 사용된 모델을 이용하여 구축된 고객이탈 예측장치.
  2. 청구항 1에 있어서, 상기 전처리부는,
    상기 입력부로 입력된 고객 데이터를 시간기준으로 전처리하여 시간기준 전처리 데이터로 분류하는 시간기준 전처리 모듈과,
    상기 입력부로 입력된 고객 데이터를 고객기준으로 전처리하여 고객기준 전처리 데이터로 분류하는 고객기준 전처리 모듈
    을 포함하는 고객이탈 예측장치.
  3. 청구항 2에 있어서,
    상기 시간기준 전처리 데이터는 고객의 행동을 시간 순으로 배열한 타임 테이블 형식이고, 상기 고객기준 전처리 데이터는 시간과는 무관하게 다수의 고객 속성을 배열한 속성 테이블 형식인 고객이탈 예측장치.
  4. 삭제
  5. 청구항 1에 있어서,
    상기 행동패턴 추출모델은 RNN(Recurrent Neural Network, 순환 신경망) 기반의 예측모델, CNN(Convolutional Neural Network, 콘볼루션 신경망) 기반의 예측모델이며,
    상기 통계지표 추출모델은 XGBoost(Extreme Gradient Boosting) 기반의 예측 모델을 더 포함하는 고객이탈 예측장치.
  6. 청구항 5에 있어서, 상기 고객이탈 예측부는,
    상기 RNN, CNN, RF, XGBoost 기반의 예측 모델 중 적어도 어느 3개의 예측 모델로 이루어지는 고객이탈 예측장치.
  7. 청구항 5에 있어서, 상기 앙상블 예측모델은,
    상기 RNN 기반의 예측 모델과 상기 RF 기반의 예측 모델과, 상기 XGBoost 기반의 예측 모델로 이루어지는 고객이탈 예측장치.
  8. 컴퓨팅 수단에 의해 수행되며,
    고객 데이터를 입력하는 제1 단계;
    상기 입력된 고객 데이터를 전처리하여 시간기준 전처리 데이터와 고객기준 전처리 데이터로 분류하는 제2 단계;
    상기 분류된 시간기준 전처리 데이터를 이용하여 행동패턴을 추출하고, 상기 분류된 고객기준 전처리 데이터를 이용하여 고객의 통계지표를 추출하며, 상기 추출된 행동패턴과 통계지표를 이용하여 고객의 이탈 여부를 예측하는 제3 단계; 및,
    상기 제3 단계의 예측 결과를 출력하는 제4 단계
    를 포함하되,
    상기 제3 단계는,
    상기 분류된 시간기준 전처리 데이터를 이용하여 상기 행동패턴을 추출하여 고객의 이탈 여부를 예측하는 과정과, 상기 분류된 고객기준 전처리 데이터를 이용하여 상기 통계지표를 추출하여 고객의 이탈 여부를 예측하는 과정과, 상기 예측 결과에 대해 투표 기법을 적용하여 과반수 이상의 예측 결과를 산출하는 과정을 포함하고,
    상기 행동패턴을 추출하여 고객의 이탈 여부를 예측하는 과정은 기준 속성에 따라 세분화된 상기 행동패턴을 독립적으로 활용하여 고객의 이탈 여부를 예측하고,
    상기 통계지표를 추출하여 고객의 이탈 여부를 예측하는 과정은 RF(Random Forest, 랜덤 포레스트) 기반의 예측 모델을 이용하여 Mean Decrease Accuracy를 계산함으로써 상기 고객기준 전처리 데이터에 포함된 각 속성의 중요도를 계산하고, 높은 중요도를 가지는 기설정된 개수의 속성을 선정하여 고객의 이탈 여부를 예측하고,
    상기 예측 결과에 대해 투표 기법을 적용하여 과반수 이상의 예측 결과를 산출하는 과정은 상기 행동패턴을 추출하여 고객의 이탈 여부를 예측하는 과정과 상기 통계지표를 추출하여 고객의 이탈 여부를 예측하는 과정에서 사용된 모델을 이용하여 구축된 모델을 이용하는 고객이탈 예측방법.
  9. 청구항 8에 있어서, 상기 제2 단계는,
    상기 입력된 고객 데이터를 시간기준으로 전처리하여 시간기준 전처리 데이터로 분류하고, 상기 입력된 고객 데이터를 고객기준으로 전처리하여 고객기준 전처리 데이터로 분류하는 고객이탈 예측방법.
  10. 청구항 9에 있어서,
    상기 시간기준 전처리 데이터는 고객의 행동을 시간 순으로 배열한 타임 테이블 형식이고, 상기 고객기준 전처리 데이터는 시간과는 무관하게 다수의 고객 속성을 배열한 속성 테이블 형식인 고객이탈 예측방법.
  11. 삭제
  12. 청구항 8에 있어서,
    상기 행동패턴은 RNN 기반의 예측모델, CNN 기반의 예측모델을 이용하여 추출하며,
    상기 통계지표는 XGBoost 기반의 예측 모델을 더 이용하여 추출하는 고객이탈 예측방법.
  13. 청구항 12에 있어서, 상기 제3 단계는,
    상기 RNN, CNN, RF, XGBoost 기반의 예측 모델 중 적어도 어느 3개의 예측 모델을 이용하는 고객이탈 예측방법.
  14. 청구항 12에 있어서,
    상기 예측 결과에 대해 투표 기법을 적용하여 과반수 이상의 예측 결과를 산출하는 과정은,
    상기 RNN 기반의 예측 모델과 상기 RF 기반의 예측 모델과, 상기 XGBoost 기반의 예측 모델을 이용하는 고객이탈 예측방법.
  15. 컴퓨팅 수단에서,
    고객 데이터를 입력하는 단계;
    상기 입력된 고객 데이터를 전처리하여 시간기준 전처리 데이터와 고객기준 전처리 데이터로 분류하는 단계;
    상기 분류된 시간기준 전처리 데이터를 이용하여 행동패턴을 추출하고, 상기 분류된 고객기준 전처리 데이터를 이용하여 고객의 통계지표를 추출하며, 상기 추출된 행동패턴과 통계지표를 이용하여 고객의 이탈 여부를 예측하는 단계; 및,
    상기 고객의 이탈 여부를 예측하는 단계의 예측 결과를 출력하는 단계
    를 실행시키되,
    상기 고객의 이탈 여부를 예측하는 단계는,
    상기 분류된 시간기준 전처리 데이터를 이용하여 상기 행동패턴을 추출하여 고객의 이탈 여부를 예측하는 과정과, 상기 분류된 고객기준 전처리 데이터를 이용하여 상기 통계지표를 추출하여 고객의 이탈 여부를 예측하는 과정과, 상기 예측 결과에 대해 투표 기법을 적용하여 과반수 이상의 예측 결과를 산출하는 과정을 포함하고,
    상기 행동패턴을 추출하여 고객의 이탈 여부를 예측하는 과정은 기준 속성에 따라 세분화된 상기 행동패턴을 독립적으로 활용하여 고객의 이탈 여부를 예측하고,
    상기 통계지표를 추출하여 고객의 이탈 여부를 예측하는 과정은 RF(Random Forest, 랜덤 포레스트) 기반의 예측 모델을 이용하여 Mean Decrease Accuracy를 계산함으로써 상기 고객기준 전처리 데이터에 포함된 각 속성의 중요도를 계산하고, 높은 중요도를 가지는 기설정된 개수의 속성을 선정하여 고객의 이탈 여부를 예측하고,
    상기 예측 결과에 대해 투표 기법을 적용하여 과반수 이상의 예측 결과를 산출하는 과정은 상기 행동패턴을 추출하여 고객의 이탈 여부를 예측하는 과정과 상기 통계지표를 추출하여 고객의 이탈 여부를 예측하는 과정에서 사용된 모델을 이용하여 구축된 모델을 이용하는 기록매체에 저장된 컴퓨터 프로그램.
KR1020180057094A 2018-05-18 2018-05-18 딥 러닝과 부스티드 디시즌 트리를 활용한 고객이탈 예측장치 및 이를 이용한 고객이탈 예측방법 KR102129962B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180057094A KR102129962B1 (ko) 2018-05-18 2018-05-18 딥 러닝과 부스티드 디시즌 트리를 활용한 고객이탈 예측장치 및 이를 이용한 고객이탈 예측방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180057094A KR102129962B1 (ko) 2018-05-18 2018-05-18 딥 러닝과 부스티드 디시즌 트리를 활용한 고객이탈 예측장치 및 이를 이용한 고객이탈 예측방법

Publications (2)

Publication Number Publication Date
KR20190134934A KR20190134934A (ko) 2019-12-05
KR102129962B1 true KR102129962B1 (ko) 2020-07-03

Family

ID=69002265

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180057094A KR102129962B1 (ko) 2018-05-18 2018-05-18 딥 러닝과 부스티드 디시즌 트리를 활용한 고객이탈 예측장치 및 이를 이용한 고객이탈 예측방법

Country Status (1)

Country Link
KR (1) KR102129962B1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016734B (zh) * 2020-04-07 2024-03-22 沈阳工业大学 基于lstm栈式自编码多模型荷预测方法及系统
KR102183140B1 (ko) * 2020-05-20 2020-11-25 이창욱 빅데이터에 기반한 사용자의 재구독 가능성 계산 장치 및 방법
KR102311107B1 (ko) * 2020-10-29 2021-10-12 주식회사 디에스랩글로벌 딥러닝 모델을 자동으로 생성하는 딥러닝 솔루션 플랫폼과 연동 가능한 고객 이탈 방지 시스템에 의해서 수행되는, 고객의 이탈을 방지하기 위한 솔루션을 제공하는 고객 이탈 방지 방법
KR102570966B1 (ko) * 2021-01-04 2023-08-24 연세대학교 원주산학협력단 고객의 미래 행동 예측 장치
KR102645648B1 (ko) * 2021-06-02 2024-03-07 라인 페이 가부시키가이샤 회원 이탈 여부를 예측하는 방법 및 시스템
CN114022202B (zh) * 2021-11-03 2022-11-01 中南大学 基于深度学习的用户流失预测方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8804929B2 (en) * 2012-10-30 2014-08-12 Alcatel Lucent System and method for generating subscriber churn predictions

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
김승옥. 캐주얼 게임 유저 이탈 예측. 서울대학교 대학원(2016.08.)*
이세희 외 1인. RNN을 이용한 고객 이탈 예측 및 분석. 한국컴퓨터정보학회 하계학술대회 논문집 제24권 제2호(2016.07.)*
최준연 외 1인. 순차자료를 이용한 고객 이탈 예측 데이터마이닝 방법론에 관한 연구. 한국경영과학회 추계학술대회논문집(2002.10.)*

Also Published As

Publication number Publication date
KR20190134934A (ko) 2019-12-05

Similar Documents

Publication Publication Date Title
KR102129962B1 (ko) 딥 러닝과 부스티드 디시즌 트리를 활용한 고객이탈 예측장치 및 이를 이용한 고객이탈 예측방법
CN108304853B (zh) 游戏相关度的获取方法、装置、存储介质和电子装置
KR102168198B1 (ko) 기업 부도 예측 시스템 및 이의 동작 방법
KR20200045416A (ko) 프로젝트 가속화의 자동화된 평가
US20100223099A1 (en) Method and apparatus for a multi-dimensional offer optimization (mdoo)
CN113748439A (zh) 电影的成功商数的预测
WO2019200742A1 (zh) 短期盈利的预测方法、装置、计算机设备和存储介质
US11675823B2 (en) Sentiment analysis for aspect terms extracted from documents having unstructured text data
US20230116515A1 (en) Determining named entities associated with aspect terms extracted from documents having unstructured text data
KR102129183B1 (ko) 특징 융합 기반 주가 예측 방법 및 시스템
CN113962160A (zh) 基于用户画像的互联网卡用户流失预测方法及系统
US20230116115A1 (en) Document summarization through iterative filtering of unstructured text data of documents
Mohammadi et al. Hierarchical neural regression models for customer churn prediction
ELYUSUFI et al. Churn prediction analysis by combining machine learning algorithms and best features exploration
US9779152B2 (en) Method and system for optimizing the arrangement of spatial elements
Saif et al. An expert system with neural network and decision tree for predicting audit opinions
Taguchi et al. Constructing equity investment strategies using analyst reports and regime switching models
Janosek et al. Knowledge discovery in dynamic data using neural networks
Jaeyalakshmi et al. Prediction of Customer Churn on e-Retailing
KR20210059289A (ko) 군장비 수리부속 품목 수요예측의 고도화를 위한 강화학습 적용
Xu Prediction on Bundesliga games based on decision tree algorithm
Gui Jr Stock Prediction Based on Social Media Data via Sentiment Analysis: a Study on Reddit
Narkhede Stock Market Prediction using Machine Learning and Cloud Computing
Lalbakhsh et al. TACD: a transportable ant colony discrimination model for corporate bankruptcy prediction
Ganesan Forecasting share prices using soft computing techniques

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant