KR102183140B1 - 빅데이터에 기반한 사용자의 재구독 가능성 계산 장치 및 방법 - Google Patents

빅데이터에 기반한 사용자의 재구독 가능성 계산 장치 및 방법 Download PDF

Info

Publication number
KR102183140B1
KR102183140B1 KR1020200060335A KR20200060335A KR102183140B1 KR 102183140 B1 KR102183140 B1 KR 102183140B1 KR 1020200060335 A KR1020200060335 A KR 1020200060335A KR 20200060335 A KR20200060335 A KR 20200060335A KR 102183140 B1 KR102183140 B1 KR 102183140B1
Authority
KR
South Korea
Prior art keywords
user
subscription
parameter
users
probability
Prior art date
Application number
KR1020200060335A
Other languages
English (en)
Inventor
이창욱
Original Assignee
이창욱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이창욱 filed Critical 이창욱
Priority to KR1020200060335A priority Critical patent/KR102183140B1/ko
Application granted granted Critical
Publication of KR102183140B1 publication Critical patent/KR102183140B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

빅데이터에 기반하여 구독 서비스에 대한 사용자의 재구독 가능성을 계산하는 방법이 제공된다. 상기 사용자의 재구독 가능성을 계산하는 방법은 (a) 컴퓨팅 장치가, 상기 사용자의 구독 서비스에 관한 이용 정보를 나타내는 상기 사용자의 이용 파라미터 벡터를 계산하는 단계, (b) 상기 컴퓨팅 장치가, 상기 사용자의 이용 파라미터 벡터를 이용하여 임의의 k(단, k 는 자연수임) 개의 구독 사용자 DB에 저장된 복수의 사용자 그룹 중 하나로 상기 사용자를 할당하는 단계 및 (c) 상기 컴퓨팅 장치가, 상기 사용자가 할당된 제1 사용자 그룹에 대응하는 제1 재구독 가능성 예측 모델을 선택하여 상기 사용자의 재구독 가능성을 계산하는 단계를 포함할 수 있다.

Description

빅데이터에 기반한 사용자의 재구독 가능성 계산 장치 및 방법{APPARATUS AND METHOD OF CALCULATING USER'S RE-SUBSCRIBING PROBABILITY BASED ON BIG DATA}
이하의 설명은 빅데이터에 기반하여 사용자가 구독 서비스에 대해 재구독을 할 가능성을 계산하는 장치 및 방법에 관한 것이다.
구독 서비스는 책이나 잡지뿐만 아니라 베이커리나 커피 등을 주기적으로 고객에게 제공하는 서비스를 나타낸다. 위와 같은 구독 서비스는 디지털 기반 콘텐츠 플랫폼의 형태로도 제공된다. 예를 들면, 사용자가 월정액의 비용을 납부하면 플랫폼은 영화, 드라마 등과 같은 콘텐츠를 온라인에서 무제한으로 제공하는 것이다. 이러한 구독 서비스에 있어서, 사용자들의 이용 정보를 분석하고, 기존의 사용자들이 서비스에서 이탈되지 않도록 재구독 가능성을 계산할 필요성이 존재한다.
대한민국 등록특허 제10-1733911호는 소셜 네트워크에 업로드 된 콘텐츠에 따른 구독자의 성향분석모듈에 대한 기술을 개시한다. 구체적으로, 대상특허는 사용자의 구독자 중 주요전달자를 추출하여 대상사용자뿐만 아니라 주요전달자의 콘텐츠에 대한 구독자의 전반적인 반응을 분석하고, 지지/비지지/중립으로 구독자의 성향을 분류하는 구성을 개시한다.
일 측면에 따르면, 빅데이터에 기반하여 구독 서비스에 대한 사용자의 재구독 가능성을 계산하는 방법이 제공된다. 상기 사용자의 재구독 가능성을 계산하는 방법은 (a) 컴퓨팅 장치가, 상기 사용자의 구독 서비스에 관한 이용 정보를 나타내는 상기 사용자의 이용 파라미터 벡터를 계산하는 단계, (b) 상기 컴퓨팅 장치가, 상기 사용자의 이용 파라미터 벡터를 이용하여 임의의 k(단, k 는 자연수임) 개의 구독 사용자 DB에 저장된 복수의 사용자 그룹 중 하나로 상기 사용자를 할당하는 단계 및 (c) 상기 컴퓨팅 장치가, 상기 사용자가 할당된 제1 사용자 그룹에 대응하는 제1 재구독 가능성 예측 모델을 선택하여 상기 사용자의 재구독 가능성을 계산하는 단계를 포함할 수 있다.
일 실시 예에 따르면, 상기 구독 사용자 DB는 복수의 사용자 그룹에 대한 정보 및 상기 복수의 사용자 그룹 각각에 대응하는 재구독 가능성 예측 모델에 대한 매칭 정보를 저장하고, 상기 사용자 그룹 각각은 적어도 하나의 사용자에 대한 정보를 포함하며, 상기 사용자의 이용 파라미터 벡터는 상기 사용자의 로그인 횟수 파라미터, 상기 사용자의 최초 로그인 시점 파라미터, 상기 사용자의 최근 로그인 시점 파라미터, 상기 사용자의 페이지 접속 횟수 파라미터, 상기 사용자의 보고서 접속 횟수 파라미터, 상기 사용자의 보고서 다운로드 횟수 파라미터, 상기 사용자의 이미지 다운로드 횟수 파라미터 및 상기 사용자의 로그인 빈도 파라미터를 엘리먼트로서 포함하는 적어도 n(단, n 은 8 이상의 자연수임) 차원 이상의 벡터로 정의될 수 있다.
다른 일 실시 예에 따르면, 상기 (b) 단계는 상기 k 개의 사용자 그룹 각각의 클러스터의 중심점과 상기 사용자의 이용 파라미터 벡터의 유클리드 거리(Euclidean Distance)를 비교함으로써, 상기 사용자를 제1 사용자 그룹으로 할당하는 단계를 포함하고, 상기 임의의 k 개의 사용자 그룹은, 복수의 사용자들을 각각의 이용 파라미터 벡터에 따라 임의의 k 개의 클러스터로 할당하고, 상기 k 개의 클러스터 각각의 중심점에 기초하여 각각의 이용 파라미터 벡터를 상기 k 개의 클러스터 중 어느 하나로 재할당하고, 상기 이용 파라미터 벡터가 재할당된 k 개의 클러스터 각각의 중심점들을 다시 계산하고, 상기 이용 파라미터 벡터의 재할당의 반복 여부를 결정함으로써 생성할 수 있다.
또 다른 일 실시 예에 따르면, 상기 사용자의 재구독 가능성을 계산하는 방법은 (d) 상기 컴퓨팅 장치가, 미리 학습된 인공신경망을 이용하여 상기 k 개의 클러스터 각각에 대응하는 재구독 가능성 예측 모델을 생성하는 단계를 더 포함하고, 상기 (d) 단계는 (d1) 각각의 사용자 그룹에 포함되는 사용자들 중 임의적으로 m(m 은 자연수) 명의 사용자를 선택하는 단계, (d2) 상기 m 명의 사용자들에 연관되는 이용 파라미터들 중 d(d는 m×n 이하이고, 1 이상의 자연수) 개의 이용 파라미터를 선택하는 단계, (d3) 상기 m 명의 사용자들의 이용 파라미터 벡터를 입력 데이터로 이용하고, 상기 d 개의 이용 파라미터들의 조합을 분기점으로서 이용하여 상기 m 명의 사용자들을 재구독자 또는 이탈자로서 분류하기 위한 의사결정트리를 생성하는 단계, (d4) 상기 (d1) 단계, 상기 (d2) 단계 및 상기 (d3) 단계를 r(단, r은 자연수임) 회 반복함으로써 r 개의 의사결정트리를 생성하는 단계 및 (d5) 상기 r 개의 의사결정트리 중 재구독 여부가 결정된 사용자의 이용 정보를 기준으로 가장 높은 순도(purity)를 갖도록 분류하는 의사결정트리를 상기 재구독 가능성 예측 모델로 생성하는 단계를 포함할 수 있다.
또 다른 일 실시 예에 따르면, 상기 (d1) 단계는 상기 각각의 사용자 그룹에 포함되는 사용자들 중 중복을 허용하여 임의적으로 m 명의 사용자들을 선택하는 단계이고, 상기 (d2) 단계는 상기 m 명의 사용자들에 연관되는 이용 파라미터들 중 중복을 허용하지 않고 임의적으로 d 개의 이용 파라미터를 선택하는 단계를 포함할 수 있다.
또 다른 일 실시 예에 따르면, 상기 사용자의 재구독 가능성을 계산하는 방법은 (e) 상기 컴퓨팅 장치가, 상기 사용자의 보고서 다운로드 횟수 파라미터 및 상기 사용자의 이미지 다운로드 횟수 파라미터 중 적어도 하나가 상기 사용자가 포함되는 사용자 그룹 내의 평균 이용률 미만인 경우, 상기 사용자에 연관되는 추천 정보를 상기 사용자에 연관되는 단말로 전송하는 단계를 더 포함할 수 있다.
또 다른 일 실시 예에 따르면, 상기 사용자의 재구독 가능성을 계산하는 방법은 (f) 상기 컴퓨팅 장치가, 상기 (a) 내지 (d) 단계의 수행에 의해 산출된 구독 서비스를 이용하는 사용자들의 재구독 가능성에 대한 통계 데이터에 기반하여 상기 구독 서비스의 재구독 가격을 조정하는 단계를 더 포함하며, 상기 (f) 단계는 (f1) 상기 컴퓨팅 장치가, 상기 제1 사용자 그룹의 재구독 가능성의 평균값으로부터 상기 사용자의 재구독 가능성의 백분위를 계산하는 단계 및 (f2) 상기 제1 사용자 그룹에 대해 수학식 1에 대응하는 가격 결정 곡선에 상기 사용자의 재구독 가능성의 백분위를 입력하여 상기 사용자에 대한 구독 서비스의 재구독 가격을 조정하는 단계를 포함하고, 상기 수학식 1은
Figure 112020050849338-pat00001
이고, 상기 수학식 1에서 upercentile은 사용자 그룹 내의 재구독 가능성에 대한 사용자의 백분위, c는 사용자 그룹에 대해 미리 결정된 최대 할인 비율을 나타낼 수 있다.
도 1은 일 실시 예에 따라 빅데이터에 기반하여 구독 서비스에 대한 사용자의 재구독 가능성을 계산하는 방법을 설명하는 흐름도이다.
도 2는 일 실시 예에 따른 사용자의 이용 파라미터 벡터를 나타내는 예시도이다.
도 3는 일 실시 예에 따라 이용 파라미터 벡터에 기반하여 사용자들의 클러스터링 과정을 설명하는 흐름도이다.
도 4은 일 실시 예에 따라 재구독 가능성 예측 모델을 생성하는 과정을 설명하는 흐름도이다.
실시 예들에 대한 특정한 구조적 또는 기능적 설명들은 단지 예시를 위한 목적으로 개시된 것으로서, 다양한 형태로 변경되어 실시될 수 있다. 따라서, 실시 예들은 특정한 개시형태로 한정되는 것이 아니며, 본 명세서의 범위는 기술적 사상에 포함되는 변경, 균등물, 또는 대체물을 포함한다.
제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 이런 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 해석되어야 한다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 기재된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 해당 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 실시예들을 첨부된 도면들을 참조하여 상세하게 설명한다. 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고, 이에 대한 중복되는 설명은 생략하기로 한다.
도 1은 일 실시 예에 따라 빅데이터에 기반하여 구독 서비스에 대한 사용자의 재구독 가능성을 계산하는 방법을 설명하는 흐름도이다. 도 1을 참조하면, 빅데이터에 기반하여 구독 서비스에 대한 사용자의 재구독 가능성을 계산하는 방법(100)은 사용자의 구독 서비스에 관한 이용 정보를 나타내는 사용자의 이용 파라미터를 계산하는 단계(110), 사용자의 이용 파라미터 벡터를 이용하여 임의의 k(단, k 는 자연수임) 개의 구독 사용자 DB에 저장된 복수의 사용자 그룹 중 하나로 사용자를 할당하는 단계(120) 및 사용자가 할당된 제1 사용자 그룹에 대응하는 제1 재구독 가능성 예측 모델을 선택하여 사용자의 재구독 가능성을 계산하는 단계(130)를 포함할 수 있다.
단계(110)에서 컴퓨팅 장치는 사용자의 구독 서비스에 관한 이용 정보를 나타내는 사용자의 이용 파라미터 벡터를 계산할 수 있다. 구체적으로, 컴퓨팅 장치에 포함되는 통신부는 사용자의 구독 서비스에 관한 이용 정보를 수집할 수 있다. 통신부는 통신 인터페이스를 포함할 수 있다. 이를테면, 통신 인터페이스는 WLAN(Wireless LAN), WiFi(Wireless Fidelity) Direct, DLNA(Digital Living Network Alliance), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 등의 무선 인터넷 인터페이스와 블루투스(Bluetooth™), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), UWB(Ultra Wideband), ZigBee, NFC(Near Field Communication) 등의 근거리 통신 인터페이스를 포함할 수 있다. 뿐만 아니라, 통신 인터페이스는 외부와 통신을 수행할 수 있는 모든 인터페이스(예를 들어, 유선 인터페이스)를 나타낼 수 있다.
예시적으로, 사용자의 이용 파라미터 벡터는 사용자의 로그인 횟수 파라미터, 사용자의 최초 로그인 시점 파라미터, 사용자의 최근 로그인 시점 파라미터, 사용자의 페이지 접속 횟수 파라미터, 사용자의 보고서 접속 횟수 파라미터, 사용자의 보고서 다운로드 횟수 파라미터, 사용자의 이미지 다운로드 횟수 파라미터 및 사용자의 로그인 빈도 파라미터를 엘리먼트로서 포함하는 적어도 n(단, n 은 8 이상의 자연수임) 차원 이상의 벡터로 정의될 수 있다.
단계(120)에서 컴퓨팅 장치는 사용자의 이용 파라미터 벡터를 이용하여 임의의 k(단, k 는 자연수임) 개의 구독 사용자 DB에 저장된 복수의 사용자 그룹 중 하나로 상기 사용자를 할당할 수 있다. 컴퓨팅 장치가 임의의 k 개의 사용자 그룹에 대한 클러스터를 생성하고, 하나의 클러스터로 특정한 사용자를 할당하는 과정에 대해서는 추가적인 도면과 함께 보다 자세히 설명될 것이다.
구체적으로, 상기 구독 사용자 DB는 복수의 사용자 그룹에 대한 정보 및 상기 복수의 사용자 그룹 각각에 대응하는 재구독 가능성 예측 모델에 대한 매칭 정보를 저장할 수 있다. 또한, 사용자 그룹 각각은 적어도 하나의 사용자에 대한 정보를 포함할 수 있다.
단계(130)에서 컴퓨팅 장치는 사용자가 할당된 제1 사용자 그룹에 대응하는 제1 재구독 가능성 예측 모델을 선택하여 상기 사용자의 재구독 가능성을 계산할 수 있다.
도 1에 도시되지는 않았지만, 컴퓨팅 장치는 사용자의 보고서 다운로드 횟수 파라미터 및 상기 사용자의 이미지 다운로드 횟수 파라미터 중 적어도 하나가 상기 사용자가 포함되는 사용자 그룹 내의 평균 이용률 미만인 경우, 상기 사용자에 연관되는 추천 정보를 상기 사용자에 연관되는 단말로 전송할 수 있다.
또한, 컴퓨팅 장치는 구독 서비스를 이용하는 사용자들의 재구독 가능성에 대한 통계 데이터에 기반하여 상기 구독 서비스의 재구독 가격을 조정하는 단계를 추가적으로 수행할 수 있다. 구체적으로, 구독 서비스의 재구독 가격을 조정하는 단계는 제1 사용자 그룹의 재구독 가능성의 평균값으로부터 상기 사용자의 재구독 가능성의 백분위를 계산하는 단계 및 제1 사용자 그룹에 대해 할당된 가격 결정 곡선에 상기 사용자의 재구독 가능성의 백분위를 입력하여 상기 사용자에 대한 구독 서비스의 재구독 가격을 조정하는 단계를 포함할 수 있다.
구체적으로, 컴퓨팅 장치는 아래의 수학식 1에 따라 구독 서비스의 재구독 가격을 조정할 수 있다.
Figure 112020050849338-pat00002
상기 수학식 1에서 f(upercentile)는 사용자에 대한 구독 서비스의 가격 결정 곡선을 나타낸다. 또한, 상기 수학식 1에서 upercentile은 사용자 그룹 내의 재구독 가능성에 대한 사용자의 백분위, c는 사용자 그룹에 대해 미리 결정된 최대 할인 비율을 나타낸다.
구체적으로, 컴퓨팅 장치는 평균치 이상(백분위가 50이상)의 재구독 가능성을 갖는 사용자에 대해서는 가격 할인을 반영하지 않을 수 있다. 그러나, 평균치 미만의 재구독 가능성을 갖는 사용자에 대해서는 가격 결정 곡선에 따라 할인이 반영될 수 있다. 예를 들어, 재구독 가능성이 사용자 그룹 내에서 백분위가 10에 해당되는 사용자에게는 미리 결정된 최대 할인 비율에 90%에 해당되는 만큼의 가격 할인이 반영될 수 있다. 같은 원리로, 재구독 가능성이 사용자 그룹 내에서 백분위가 40에 해당되는 사용자에게는 미리 결정된 가격 할인 비율에 60%에 해당되는 만큼의 가격 할인이 반영될 수 있다.
도 2는 일 실시 예에 따른 사용자의 이용 파라미터 벡터를 나타내는 예시도이다. 도 2를 참조하면, 특정한 사용자에 대한 이용 파라미터 벡터가 도시된다. 예를 들면, 이용 파라미터 벡터는 사용자의 이름 및 사용자의 ID와 같은 기본 정보와 함께, 로그인 횟수, 최초 로그인 시점, 최근 로그인 시점, 페이지 접속 횟수, 보고서 접속 횟수, 보고서 다운로드 횟수, 이미지 다운로드 횟수 및 로그인 빈도 파라미터 등을 포함할 수 있다. 이는 이해를 돕기 위한 예시적 기재일 뿐, 이용 파라미터 벡터에 사용자의 구독 서비스 이용 상태를 설명하기 위한 추가적인 파라미터가 포함될 수 있다는 것은 관련 분야의 전문가에게는 자명한 사실일 것이다. 또한, 로그인 빈도 파라미터는 실제 로그인된 일자(login days)를 접속 가능한 일자(available days)로 나눈 값을 나타낼 수 있다.
도 3는 일 실시 예에 따라 이용 파라미터 벡터에 기반하여 사용자들의 클러스터링 과정을 설명하는 흐름도이다. 도 2를 참조하면, 사용자들의 클러스터링 방법(300)이 도시된다. 사용자들의 클러스터링 방법(300)은 복수의 사용자들을 각각의 이용 파라미터 벡터에 따라 임의의 k 개의 클러스터로 할당하는 단계(310), k 개의 클러스터 각각의 중심점에 기초하여 각각의 이용 파라미터 벡터를 k 개의 클러스터 중 어느 하나로 재할당하는 단계(320), 이용 파라미터 벡터가 재할당된 k 개의 클러스터 각각의 중심점들을 다시 계산하는 단계(330), 이용 파라미터 벡터의 재할당의 반복 여부를 결정하는 단계(340)를 포함할 수 있다.
단계(310)에서 컴퓨팅 장치는 복수의 사용자들에 관한 이용 파라미터 벡터를 획득할 수 있다. 또한, 컴퓨팅 장치는 임의의 k(단, k는 자연수임) 개의 클러스터로 사용자의 이용 파라미터 벡터를 할당하고, 상기 k 개의 클러스터 각각에 대응하는 중심점들을 초기화할 수 있다. 예시적으로, 이용 파라미터 벡터는 각각의 사용자의 구독 서비스의 이용 정보를 나타내는 값으로서 사용자의 로그인 횟수 파라미터, 상기 사용자의 최초 로그인 시점 파라미터, 상기 사용자의 최근 로그인 시점 파라미터, 상기 사용자의 페이지 접속 횟수 파라미터, 상기 사용자의 보고서 접속 횟수 파라미터, 상기 사용자의 보고서 다운로드 횟수 파라미터, 상기 사용자의 이미지 다운로드 횟수 파라미터 및 상기 사용자의 로그인 빈도 파라미터를 엘리먼트로서 포함하는 적어도 n(단, n 은 8 이상의 자연수임) 차원 이상의 벡터일 수 있다.
단계(320)에서 컴퓨팅 장치는 k 개의 클러스터 각각의 중심점들에 기초하여 각각의 이용 파라미터 벡터들을 상기 k 개의 클러스터 중 어느 하나로 재할당할 수 있다. 예시적으로, 상기 k 개의 클러스터 각각의 중심점들은 단계(310)에서 초기화된 중심점을 나타낼 수 있다. 컴퓨팅 장치는 복수의 사용자들 각각에 대한 이용 파라미터 벡터가 가장 가까운 중심점을 포함하는 클러스터로 할당되도록 상기 이용 파라미터 벡터들을 재할당할 수 있다.
단계(330)에서 컴퓨팅 장치는 k 개의 클러스터 각각에 새롭게 재할당된 이용 파라미터 벡터들을 이용하여 상기 k 개의 클러스터 각각의 중심점을 재선정할 수 있다.
또한, 단계(340)에서 컴퓨팅 장치는 이용 파라미터 벡터들을 재할당하는 단계의 반복 여부를 결정할 수 있다. 구체적으로, 단계(340)에서 컴퓨팅 장치는 k 개의 클러스터 각각에 상응하는 실루엣(silhouette) 값에 따라 결정될 수 있다. 보다 구체적으로, 컴퓨팅 장치는 아래의 수학식 2을 이용하여 상기 실루엣 값을 결정할 수 있다.
Figure 112020050849338-pat00003
상기 k 개의 클러스터 중 i 번째 클러스터가 선택된 경우, a(i)는 제1 이용 파라미터 벡터와 동일한 i 번째 클러스터 내에 존재하는 이용 파라미터 벡터들의 비유사도(dissimilarity) 평균값을 나타낼 수 있다. 더하여, b(i)는 상기 제1 이용 파라미터 벡터와는 상이한 제2 클러스터 내에 존재하는 이용 파라미터 벡터들의 비유사도 평균의 최소값을 나타낼 수 있다. 보다 구체적으로, a(i) 및 b(i) 각각은 유클리드 거리(Euclidean Distance)에 기초하여 계산될 수 있다. 컴퓨팅 장치는 계산된 실루엣 값이 미리 지정된 임계치 이상이 되는 경우에, 사용자들의 이용 파라미터 벡터의 클러스터링이 적절하게 수행되었다고 판단하여 상기 재할당하는 단계의 반복을 중지할 수 있다.
이에 따라, 컴퓨팅 장치는 k 개의 사용자 그룹 각각의 클러스터의 중심점과 상기 사용자의 이용 파라미터 벡터의 유클리드 거리(Euclidean Distance)를 비교함으로써, 특정한 사용자의 이용 파라미터 벡터로부터 중심점이 가장 가깝게 위치하는 사용자 그룹을 매칭 사용자 그룹으로 결정할 수 있다. 동일한 구독 서비스를 이용하는 과정에서도 사용자들의 이용 성향을 다르게 분포될 수 있다. 예를 들어, 구독 서비스가 2020년 월별 소비자들의 구매 동향에 관한 정보를 주기적으로 제공하는 서비스인 경우가 있을 수 있다. 이 경우에, 제1 사용자 그룹은 업종별 구매 동향 보고서를 다운로드 받는 그룹일 수도 있고, 제2 사용자 그룹은 구매가 많이 발생된 상품들의 이미지를 다운로드 받는 그룹일수도 있다. 본 실시예의 컴퓨팅 장치는 각각의 사용자 그룹이 나타내는 성향에 따라 재구독 과정에서 어떤 요인을 더 많이 고려하는지를 이용하여 재구독 가능성을 계산하는 정확도를 높일 수 있다.
또한, 컴퓨팅 장치는 특정한 사용자 그룹을 매칭 사용자 그룹으로 할당할 수 있다. 이에 따라, 매칭 사용자 그룹의 중심점은 앞서 기재한 원리에 기반하여 재선정될 수 있다.
도 4은 일 실시 예에 따라 재구독 가능성 예측 모델을 생성하는 과정을 설명하는 흐름도이다. 도 4을 참조하면, 사용자의 이용 파라미터 벡터에 기반하여 재구독 가능성을 예측하는 컴퓨터 장치가 랜덤 포레스트 기법에 기반하여 재구독 가능성 예측 모델을 생성하는 방법(400)이 도시된다. 컴퓨팅 장치가, 미리 학습된 인공신경망을 이용하여 상기 k 개의 클러스터 각각에 대응하는 재구독 가능성 예측 모델을 생성할 수 있다. 구체적으로, 랜덤 포레스트 기법에 기반하여 재구독 가능성 예측 모델을 생성하는 방법(400)은 각각의 사용자 그룹에 포함되는 사용자들 중 임의적으로 m(m은 자연수) 명의 사용자를 선택하는 단계(410), m 명의 사용자들에 연관되는 이용 파라미터들 중 d(d는 m×n 이하이고, 1 이상의 자연수) 개의 이용 파라미터를 선택하는 단계(420), m 명의 사용자들의 이용 파라미터 벡터를 입력 데이터로 이용하고 d 개의 이용 파라미터들의 조합을 분기점으로서 이용하여 의사결정트리를 생성하는 단계(430), 의사결정트리를 생성하는 단계들을 r(r은 자연수) 회 반복함으로써 r 개의 의사결정트리를 생성하는 단계(440) 및 r 개의 의사결정트리 중 재구독 여부가 결정된 사용자의 이용 정보를 기준으로 가장 높은 순도를 갖도록 하는 의사결정트리를 생성하는 단계(450)를 포함할 수 있다.
기계 학습(machine learning)에서의 랜덤 포레스트(random forest)는 분류, 회귀 분석 등에 사용되는 앙상블 학습 방법의 일종으로서, 훈련 과정에서 구성한 다수의 결정 트리로부터 분류 또는 평균 예측치를 출력함으로써 동작한다. 구체적으로, 랜덤 포레스트는 여러 개의 결정 트리들을 임의적으로 학습하는 방식의 앙상블 방법이다. 랜덤 포레스트 방법은 크게 다수의 결정 트리를 구성하는 학습 단계와, 입력 벡터가 들어왔을 때 분류하거나 예측하는 테스트 단계로 구성되어 있다. 랜덤 포레스트는 검출, 분류, 그리고 회귀 등 다양한 애플리케이션으로 활용되고 있다.
랜덤 포레스트의 기술적인 특징은 임의성(randomness)에 의해 서로 조금씩 다른 특성을 갖는 트리들로 구성된다는 점이다. 이 특징은 각각의 트리들의 예측(prediction)들이 비상관화(decorrelation) 되게 하며, 결과적으로 일반화(generalization) 성능을 향상시킨다. 또한, 임의화(randomization)는 포레스트가 노이즈가 포함된 데이터에 대해서도 강인하게 만들어 준다. 임의화는 각각의 트리들의 훈련 과정에서 진행되며, 가장 널리 쓰이는 두 가지 방법으로는 임의 학습 데이터 추출 방법을 이용한 앙상블 학습법인 배깅(bagging)과 임의 노드 최적화(randomized node optimization)가 있다. 이 두 가지 방법은 서로 동시에 사용되어 임의화 특성을 더욱 증진시킬 수 있다.
단계(410)에서 컴퓨팅 장치는 각각의 사용자 그룹에 포함되는 사용자들 중 임의적으로 m(m은 자연수) 명의 사용자를 선택할 수 있다. 예시적으로, 매칭 사용자 그룹 내에는 체질 분류 벡터에 기반하여 M(M은 자연수) 명의 사용자가 할당된 경우가 있을 수 있다. 이 경우에, 컴퓨팅 장치는 매칭 사용자 그룹에 포함되는 사용자들 중에서 중복을 허용하여 임의적으로 m 명의 사용자들을 선택할 수 있다. 예시적으로, 매칭 사용자 그룹 내에 100 명의 체질 분류 벡터가 저장되고 m이 60으로 결정된 경우에, 컴퓨팅 장치는 중복을 허용하여 사용자들을 임의적으로 60명 선택한다. 동일한 사용자가 최소 2회 이상 선택되는 경우가 존재할 수도 있을 것이다. 이런 방식에 따라, 재구독 가능성을 예측하는 컴퓨팅 장치는 중복을 허용하여 임의적으로 사용자들을 선택함으로써 의사결정트리를 생성하는 과정에서 충분한 개수의 학습 데이터를 제공할 뿐만 아니라, 모집단인 사용자 그룹 내에서 임의적으로 표본을 복원 추출하는 방식으로 모집단의 특성값이 보다 잘 반영된 의사결정트리를 최종적으로 생성하는 효과를 제공할 수 있다.
단계(420)에서 컴퓨팅 장치는 m 명의 사용자들에 연관되는 이용 파라미터들 중 d(d는 m×n 이하이고, 1 이상의 자연수) 개의 이용 파라미터를 선택할 수 있다. 이 경우에, 컴퓨팅 장치는 m 명의 사용자들에 연관되는 이용 파라미터들 중 중복을 허용하지 않고 임의적으로 d 개의 이용 파라미터를 선택할 수 있다. 예를 들어, 사용자 그룹의 특성에 따라 재구독 가능성에 영향을 미치는 이용 파라미터가 다를 수 있다. 예를 들어, 작은 크기의 정보(예. 이미지, 보고서 등)를 자주 이용하는 사용자 그룹은 로그인 빈도 파라미터가 사용자가 현재 구독 서비스에 만족하고 있는지를 판단하는데 우세한 영향을 미칠 수 있다. 또한, 많은 양의 정보를 포함하는 대용량의 정보(예. 2020년 소비 트렌드 보고서 등)를 오래 이용하는 사용자 그룹은 보고서 접속 횟수 파라미터가 사용자의 재구독 여부에 우세한 영향을 미칠 수 있다. 본 실시 예에 따른 컴퓨팅 장치는 사용자 그룹 별로 이용 파라미터를 임의적으로 추출하여 의사결정트리를 생성함으로써 해당 사용자 그룹에 좀 더 피팅된 의사결정트리를 생성할 수 있다.
단계(430)에서 컴퓨팅 장치는 단계(410)에 따른 m 명의 사용자들의 이용 파라미터 벡터를 입력 데이터로 이용하고, 단계(420)에 따른 d 개의 이용 파라미터들의 조합을 분기점으로서 이용하여, 상기 m 명의 사용자들을 재구독자 또는 이탈자로서 분류하기 위한 의사결정트리를 생성할 수 있다.
단계(440)에서 컴퓨팅 장치는 단계(410), 단계(420) 및 단계(430)를 r(r은 자연수) 회 반복함으로써 r 개의 의사결정트리를 생성할 수 있다. 또한, 프로세서는 단계(450)에서 r 개의 의사결정트리 중 재구독 여부가 이미 결정된 사용자들의 이용 정보를 기준으로 가장 높은 순도(purity)를 갖도록 분류하는 의사결정트리를 해당 사용자 그룹에 대한 최종 재구독 가능성 예측 모델로서 생성할 수 있다.
이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

Claims (6)

  1. 빅데이터에 기반하여 구독 서비스에 대한 사용자의 재구독 가능성을 계산하는 방법에 있어서,
    (a) 컴퓨팅 장치가, 상기 사용자의 구독 서비스에 관한 이용 정보를 나타내는 상기 사용자의 이용 파라미터 벡터를 계산하는 단계;
    (b) 상기 컴퓨팅 장치가, 상기 사용자의 이용 파라미터 벡터를 이용하여 임의의 k(단, k 는 자연수임) 개의 구독 사용자 DB에 저장된 복수의 사용자 그룹 중 하나로 상기 사용자를 할당하는 단계; 및
    (c) 상기 컴퓨팅 장치가, 상기 사용자가 할당된 제1 사용자 그룹에 대응하는 제1 재구독 가능성 예측 모델을 선택하여 상기 사용자의 재구독 가능성을 계산하는 단계
    를 포함하고,
    상기 구독 사용자 DB는 복수의 사용자 그룹에 대한 정보 및 상기 복수의 사용자 그룹 각각에 대응하는 재구독 가능성 예측 모델에 대한 매칭 정보를 저장하고, 상기 사용자 그룹 각각은 적어도 하나의 사용자에 대한 정보를 포함하며,
    상기 사용자의 이용 파라미터 벡터는 상기 사용자의 로그인 횟수 파라미터, 상기 사용자의 최초 로그인 시점 파라미터, 상기 사용자의 최근 로그인 시점 파라미터, 상기 사용자의 페이지 접속 횟수 파라미터, 상기 사용자의 보고서 접속 횟수 파라미터, 상기 사용자의 보고서 다운로드 횟수 파라미터, 상기 사용자의 이미지 다운로드 횟수 파라미터 및 상기 사용자의 로그인 빈도 파라미터를 엘리먼트로서 포함하는 적어도 n(단, n 은 8 이상의 자연수임) 차원 이상의 벡터로 정의되고,
    상기 (b) 단계는,
    상기 k 개의 사용자 그룹 각각의 클러스터의 중심점과 상기 사용자의 이용 파라미터 벡터의 유클리드 거리(Euclidean Distance)를 비교함으로써, 상기 사용자를 제1 사용자 그룹으로 할당하는 단계
    를 포함하고,
    상기 임의의 k 개의 사용자 그룹은, 복수의 사용자들을 각각의 이용 파라미터 벡터에 따라 임의의 k 개의 클러스터로 할당하고, 상기 k 개의 클러스터 각각의 중심점에 기초하여 각각의 이용 파라미터 벡터를 상기 k 개의 클러스터 중 어느 하나로 재할당하고, 상기 이용 파라미터 벡터가 재할당된 k 개의 클러스터 각각의 중심점들을 다시 계산하고, 상기 이용 파라미터 벡터의 재할당의 반복 여부를 결정함으로써 생성되는 사용자의 재구독 가능성을 계산하는 방법.
  2. 삭제
  3. 제1항에 있어서,
    (d) 상기 컴퓨팅 장치가, 미리 학습된 인공신경망을 이용하여 상기 k 개의 클러스터 각각에 대응하는 재구독 가능성 예측 모델을 생성하는 단계
    를 더 포함하고,
    상기 (d) 단계는,
    (d1) 각각의 사용자 그룹에 포함되는 사용자들 중 임의적으로 m(m 은 자연수) 명의 사용자를 선택하는 단계;
    (d2) 상기 m 명의 사용자들에 연관되는 이용 파라미터들 중 d(d는 m×n 이하이고, 1 이상의 자연수) 개의 이용 파라미터를 선택하는 단계;
    (d3) 상기 m 명의 사용자들의 이용 파라미터 벡터를 입력 데이터로 이용하고, 상기 d 개의 이용 파라미터들의 조합을 분기점으로서 이용하여 상기 m 명의 사용자들을 재구독자 또는 이탈자로서 분류하기 위한 의사결정트리를 생성하는 단계;
    (d4) 상기 (d1) 단계, 상기 (d2) 단계 및 상기 (d3) 단계를 r(단, r은 자연수임) 회 반복함으로써 r 개의 의사결정트리를 생성하는 단계; 및
    (d5) 상기 r 개의 의사결정트리 중 재구독 여부가 결정된 사용자의 이용 정보를 기준으로 가장 높은 순도(purity)를 갖도록 분류하는 의사결정트리를 상기 재구독 가능성 예측 모델로 생성하는 단계
    를 포함하는 사용자의 재구독 가능성을 계산하는 방법.
  4. 제3항에 있어서,
    상기 (d1) 단계는,
    상기 각각의 사용자 그룹에 포함되는 사용자들 중 중복을 허용하여 임의적으로 m 명의 사용자들을 선택하는 단계이고,
    상기 (d2) 단계는,
    상기 m 명의 사용자들에 연관되는 이용 파라미터들 중 중복을 허용하지 않고 임의적으로 d 개의 이용 파라미터를 선택하는 단계인 사용자의 재구독 가능성을 계산하는 방법.
  5. 제4항에 있어서,
    (e) 상기 컴퓨팅 장치가, 상기 사용자의 보고서 다운로드 횟수 파라미터 및 상기 사용자의 이미지 다운로드 횟수 파라미터 중 적어도 하나가 상기 사용자가 포함되는 사용자 그룹 내의 평균 이용률 미만인 경우, 상기 사용자에 연관되는 추천 정보를 상기 사용자에 연관되는 단말로 전송하는 단계
    를 더 포함하는 사용자의 재구독 가능성을 계산하는 방법.
  6. 제5항에 있어서,
    (f) 상기 컴퓨팅 장치가, 상기 (a) 내지 (d) 단계의 수행에 의해 산출된 구독 서비스를 이용하는 사용자들의 재구독 가능성에 대한 통계 데이터에 기반하여 상기 구독 서비스의 재구독 가격을 조정하는 단계를 더 포함하며,
    상기 (f) 단계는,
    (f1) 상기 컴퓨팅 장치가, 상기 제1 사용자 그룹의 재구독 가능성의 평균값으로부터 상기 사용자의 재구독 가능성의 백분위를 계산하는 단계; 및
    (f2) 상기 제1 사용자 그룹에 대해 수학식 1에 대응하는 가격 결정 곡선에 상기 사용자의 재구독 가능성의 백분위를 입력하여 상기 사용자에 대한 구독 서비스의 재구독 가격을 조정하는 단계
    를 포함하고,
    상기 수학식 1은
    Figure 112020050849338-pat00004
    이고, 상기 수학식 1에서 upercentile은 사용자 그룹 내의 재구독 가능성에 대한 사용자의 백분위, c는 사용자 그룹에 대해 미리 결정된 최대 할인 비율을 나타내는 사용자의 재구독 가능성을 계산하는 방법.
KR1020200060335A 2020-05-20 2020-05-20 빅데이터에 기반한 사용자의 재구독 가능성 계산 장치 및 방법 KR102183140B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200060335A KR102183140B1 (ko) 2020-05-20 2020-05-20 빅데이터에 기반한 사용자의 재구독 가능성 계산 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200060335A KR102183140B1 (ko) 2020-05-20 2020-05-20 빅데이터에 기반한 사용자의 재구독 가능성 계산 장치 및 방법

Publications (1)

Publication Number Publication Date
KR102183140B1 true KR102183140B1 (ko) 2020-11-25

Family

ID=73645771

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200060335A KR102183140B1 (ko) 2020-05-20 2020-05-20 빅데이터에 기반한 사용자의 재구독 가능성 계산 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102183140B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112419112A (zh) * 2020-11-30 2021-02-26 郑兰 学业成长曲线生成方法、装置、电子设备和存储介质
KR20220118935A (ko) * 2021-02-19 2022-08-26 (주)나인빌리언앤코 정기구독 서비스의 구독자별 최적 할인율 산출 시스템 및 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101733911B1 (ko) 2016-02-12 2017-05-24 전북대학교산학협력단 소셜 네트워크에 업로드 된 콘텐츠에 따른 구독자의 성향분석모듈
KR20180096323A (ko) * 2017-02-21 2018-08-29 주식회사 넥슨코리아 서비스 재이용을 유도하기 위한 방법 및 이를 수행하기 위한 장치
KR20190134934A (ko) * 2018-05-18 2019-12-05 성균관대학교산학협력단 딥 러닝과 부스티드 디시즌 트리를 활용한 고객이탈 예측장치 및 이를 이용한 고객이탈 예측방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101733911B1 (ko) 2016-02-12 2017-05-24 전북대학교산학협력단 소셜 네트워크에 업로드 된 콘텐츠에 따른 구독자의 성향분석모듈
KR20180096323A (ko) * 2017-02-21 2018-08-29 주식회사 넥슨코리아 서비스 재이용을 유도하기 위한 방법 및 이를 수행하기 위한 장치
KR20190134934A (ko) * 2018-05-18 2019-12-05 성균관대학교산학협력단 딥 러닝과 부스티드 디시즌 트리를 활용한 고객이탈 예측장치 및 이를 이용한 고객이탈 예측방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
김종성. 재구매 예측모형 및 고객 분류. 인제대학교(2010.06.)* *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112419112A (zh) * 2020-11-30 2021-02-26 郑兰 学业成长曲线生成方法、装置、电子设备和存储介质
CN112419112B (zh) * 2020-11-30 2024-03-05 郑兰 学业成长曲线生成方法、装置、电子设备和存储介质
KR20220118935A (ko) * 2021-02-19 2022-08-26 (주)나인빌리언앤코 정기구독 서비스의 구독자별 최적 할인율 산출 시스템 및 방법
KR102578362B1 (ko) * 2021-02-19 2023-09-14 (주)나인빌리언앤코 정기구독 서비스의 구독자별 최적 할인율 산출 시스템 및 방법

Similar Documents

Publication Publication Date Title
US11907816B2 (en) Entropy based synthetic data generation for augmenting classification system training data
CN110362677B (zh) 文本数据类别的识别方法及装置、存储介质、计算机设备
US20210042628A1 (en) Building a federated learning framework
US11468241B2 (en) Techniques to add smart device information to machine learning for increased context
US11784939B2 (en) Cloud resource management using externally-sourced data
US8775338B2 (en) Computer-implemented systems and methods for constructing a reduced input space utilizing the rejected variable space
JP6779231B2 (ja) データ処理方法及びシステム
KR102183140B1 (ko) 빅데이터에 기반한 사용자의 재구독 가능성 계산 장치 및 방법
US20180012237A1 (en) Inferring user demographics through categorization of social media data
WO2021068513A1 (zh) 异常对象识别方法、装置、介质及电子设备
Wolfe et al. High precision screening for Android malware with dimensionality reduction
CN117170685A (zh) 一种数据处理方法、装置、设备及介质
WO2023024408A1 (zh) 用户特征向量确定方法、相关设备及介质
WO2021258968A1 (zh) 小程序分类方法、装置、设备及计算机可读存储介质
CN113222073A (zh) 训练迁移学习模型和推荐模型的方法及装置
CN112887371B (zh) 边缘计算方法、装置、计算机设备及存储介质
US10692605B2 (en) Library screening for cancer probability
CN108604313B (zh) 自动化的预测性建模与框架
US11210108B2 (en) Guiding the installation process of sensor-based devices
CN112751785A (zh) 待处理请求发送方法、装置、计算机设备及存储介质
CN114611015A (zh) 交互信息处理方法、装置和云服务器
US11269625B1 (en) Method and system to identify and prioritize re-factoring to improve micro-service identification
US11676050B2 (en) Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees using leaf nodes
CN113457167A (zh) 用户分类网络的训练方法、用户分类方法及装置
CN113901328A (zh) 信息推荐方法和装置、电子设备和存储介质

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant