KR102329120B1 - 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법 및 장치, 및 시스템 - Google Patents

전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법 및 장치, 및 시스템 Download PDF

Info

Publication number
KR102329120B1
KR102329120B1 KR1020200019313A KR20200019313A KR102329120B1 KR 102329120 B1 KR102329120 B1 KR 102329120B1 KR 1020200019313 A KR1020200019313 A KR 1020200019313A KR 20200019313 A KR20200019313 A KR 20200019313A KR 102329120 B1 KR102329120 B1 KR 102329120B1
Authority
KR
South Korea
Prior art keywords
age
product
members
weighted average
probability
Prior art date
Application number
KR1020200019313A
Other languages
English (en)
Other versions
KR20210104495A (ko
Inventor
최원규
김명구
문현규
Original Assignee
카페24 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 카페24 주식회사 filed Critical 카페24 주식회사
Priority to KR1020200019313A priority Critical patent/KR102329120B1/ko
Publication of KR20210104495A publication Critical patent/KR20210104495A/ko
Application granted granted Critical
Publication of KR102329120B1 publication Critical patent/KR102329120B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 일 양태는 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법을 개시하고 있다. 상기 방법은, 전자상거래와 연관된 복수 개의 쇼핑몰의 상품 구매 이력 정보를 획득하는 단계(상기 상품 구매 이력 정보는 특정 상품에 대한 구매 회원 정보 및 구매 회원이 이전에 구매한 상품에 대한 정보를 포함함) 및 상기 구매 이력 정보를 이용하여, 상기 복수 개의 쇼핑몰 중 적어도 하나의 제 1 클래스 상품(a first class product)을 구매한 제 1 클래스 회원들(first class members) 중 연령을 입력하지 않은 복수의 연령 미입력 회원의 연령을 추정하는 단계를 포함하되, 상기 복수의 연령 미입력 회원의 연령을 추정하는 단계는, 상기 복수의 연령 미입력 회원 각각의 상기 구매 이력 정보를 이용하여, 해당 회원이 과거 구매한 적어도 하나의 제 2 클래스 상품들(at least one of second class products) 기반의 연령 추정 알고리즘에 의해 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하는 단계를 포함한다.

Description

전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법 및 장치, 및 시스템{AGE PRESUMPTION METHOD FOR MEMBER TO PURCHASE PRODUCT OF SHOPPING MALL RELATED TO E-COMMERCE, APPARATUS AND SYSTEM USING SAID METHOD}
본 발명은 회원들의 연령을 추정하는 방법에 관한 것으로, 보다 상세하게는, 효율적으로 특정 상품을 구매한 회원들의 연령을 추정하는 방법에 관한 것이다.
온라인 전자 상거래 웹 페이지(쇼핑몰이라고 부를 수 있음)를 운영하는 과정에서, 쇼핑몰들은 판매를 촉진시키기 위해 특정 상품에 대응하는 최적의 프로모션을 계획한다. 이때, 상품에 대응하는 최적 프로모션은 상품의 구매가 예상되는 회원들을 특정하여, 그에 대응하는 프로모션을 하는 것을 의미한다. 즉, 프로모션의 최적화를 위해서는 특정 상품의 구매 예상 회원들의 개인 정보를 파악할 필요가 있다.
여기서, 파악하고자 하는 개인 정보는 회원의 성별 및/또는 연령 등의 데이터를 포함한다. 다만, 대부분의 쇼핑몰 구매자들은 개인정보 입력을 꺼려하고, 평균적으로 전체 회원의 10% 수준의 회원들만이 성별 및/또는 연령 등의 개인 정보를 입력한다. 쇼핑몰의 운영자로서는 회원들이 성별 및/또는 연령과 같은 개인 정보를 많이 입력하길 원하지만 구매자들의 편의를 강요할 수는 없기 때문에 입력하지 않은 회원들에게 취할 수 있는 방법은 많지 않다.
실제 특정 쇼핑몰의 경우, 전체 513,165명의 회원 중 20.8%가 여성, 2%가 남성이며, 나머지 77.2%는 성별 표시가 없다. 구매 고객으로 한정하면, 여성 46,549(25.9%), 남성 9029(5%), 미입력 124,391(69%)로 유사한 상황이다.
즉, 이와 같이 성별 및/또는 연령을 입력하지 않는 구매 회원들의 성별 및/또는 연령을 정확하게 예측하는 것이 요구되는 실정이다.
상술한 문제점을 해결하기 위한 본 발명의 일 양태에 따른 목적은 쇼핑몰의 특정 상품에 대한 구매 회원의 상품 구매 이력을 이용하여 연령을 입력하지 않은 회원들의 연령을 정확하게 예측할 수 있는 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법, 장치 및 시스템을 제공하는 것이다.
상기한 목적을 달성하기 위한 본 발명의 일 양태에 따른 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법은, 전자상거래와 연관된 복수 개의 쇼핑몰의 상품 구매 이력 정보를 획득하는 단계(상기 상품 구매 이력 정보는 특정 상품에 대한 구매 회원 정보 및 구매 회원이 이전에 구매한 상품에 대한 정보를 포함함) 및 상기 구매 이력 정보를 이용하여, 상기 복수 개의 쇼핑몰 중 적어도 하나의 제 1 클래스 상품(a first class product)을 구매한 제 1 클래스 회원들(first class members) 중 연령을 입력하지 않은 복수의 연령 미입력 회원의 연령을 추정하는 단계를 포함하되, 상기 복수의 연령 미입력 회원의 연령을 추정하는 단계는, 상기 복수의 연령 미입력 회원 각각의 상기 구매 이력 정보를 이용하여, 해당 회원이 과거 구매한 적어도 하나의 제 2 클래스 상품들(at least one of second class products) 기반의 연령 추정 알고리즘에 의해 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하는 단계를 포함할 수 있다.
상기 연령 추정 알고리즘에 의해 추정하는 단계는, 복수의 기준값을 이용하여 연령 구간을 구분하는 단계, 상기 복수의 연령 미입력 회원 각각이 과거 구매한 적어도 하나의 제 2 클래스 상품들을 추출하는 단계, 상기 추출된 적어도 하나의 제 2 클래스 상품들을 구매한 제 2 클래스 회원들(second class members)의 상기 구분된 연령 구간 각각에 속할 확률을 가중평균하여 각 연령 구간에 대한 가중 평균 확률을 산출하는 단계 및 상기 산출된 각 연령 구간에 대한 가중 평균 확률을 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하는 단계를 포함할 수 있다.
가중 평균과 관련된 연산을 수행할 때 사용되는 가중치는, 각 제 2 클래스 상품에 대한 제 2 클래스 회원들 중 연령이 확인된 회원들의 판매수량일 수 있다.
상기 가중치와 연산되는 변수는, 상기 가중치에 대응하는 제 2 클래스 상품을 구매한 제 2 클래스 회원들 중 특정 구간의 연령으로 확인된 회원들의 비율일 수 있다.
상기 방법은, 상기 산출된 각 연령 구간에 대한 가중 평균 확률을 점수화하여 연령 추정 예상 점수를 생성하는 단계를 더 포함하되, 상기 연령 추정 예상 점수를 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 판단할 수 있다.
상기 방법은, 상기 산출된 각 연령 구간에 대한 가중 평균 확률 중 하나가 기설정된 임계 확률 이상인 회원들을 추출하는 단계; 및 상기 추출된 회원들에 대해서만 그들의 연령을 결정하는 단계를 더 포함할 수 있다.
상기 추출된 회원들에 대해서만 그들의 연령을 결정하는 단계는, 임계 확률을 넘는 가중 평균 확률을 갖는 연령 구간으로 해당 회원의 연령을 결정하는 단계를 포함할 수 있다.
상기 임계 확률은 상기 연령 구간의 수와 상기 복수의 연령 미입력 회원의 비율에 의해 결정될 수 있다.
상기 임계 확률은 임계 확률 결정을 위한 딥 러닝 모델에 의해 결정되되, 상기 딥 러닝 모델은 학습 데이터에 의해 학습되며, 상기 학습 데이터는, (i) 상기 산출된 각 연령 구간에 대한 가중평균확률 및 상기 임계확률로 구성된 입력 데이터, 및 (ii) 추후에 연령이 확인된 연령 미입력 회원의 실제 연령으로 구성된 출력 데이터를 포함할 수 있다.
상기 산출된 각 연령 구간에 대한 가중평균확률을 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하는 단계는, 제 1 연령 구간에 대한 가중평균확률과 제 2 연령 구간에 대한 가중평균확률이 임계값 이상 차이가 나는지 비교하는 단계(여기서, 상기 제 1 연령 구간에 대한 가중평균확률은 가장 높은 값을 갖는 가중 평균 확률이며, 상기 제 2 연령 구간에 대한 가중평균확률은 두번째로 높은 값을 갖는 가중 평균 확률임) 및 상기 비교 결과를 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하는 단계를 포함할 수 있다.
상기 방법은, 상기 추정된 연령을 이용하여 상품의 전체 연령 비율에 대응하는 프로모션을 수행하는 단계를 더 포함할 수 있다.
상기한 목적을 달성하기 위한 본 발명의 다른 양태에 따른 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 장치은, 전자상거래와 연관된 복수 개의 쇼핑몰의 상품 구매 이력 정보를 획득하여 저장하는 저장부(상기 상품 구매 이력 정보는 특정 상품에 대한 구매 회원 정보 및 구매 회원이 이전에 구매한 상품에 대한 정보를 포함함) 및 상기 저장부로부터 상기 구매 이력 정보를 획득하여, 상기 복수 개의 쇼핑몰 중 적어도 하나의 제 1 클래스 상품(a first class product)을 구매한 제 1 클래스 회원들(first class members) 중 연령을 입력하지 않은 복수의 연령 미입력 회원의 연령을 추정하는 프로세서를 포함하되, 상기 프로세서는, 상기 복수의 연령 미입력 회원 각각의 상기 구매 이력 정보를 이용하여, 해당 회원이 과거 구매한 적어도 하나의 제 2 클래스 상품들(at least one of second class products) 기반의 연령 추정 알고리즘에 의해 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정할 수 있다.
상기 프로세서는, 복수의 기준값을 이용하여 연령 구간을 구분하고, 상기 복수의 연령 미입력 회원 각각이 과거 구매한 적어도 하나의 제 2 클래스 상품들을 추출하며, 상기 추출된 적어도 하나의 제 2 클래스 상품들을 구매한 제 2 클래스 회원들(second class members)의 상기 구분된 연령 구간 각각에 속할 확률을 가중평균하여 각 연령 구간에 대한 가중 평균 확률을 산출하고, 상기 산출된 각 연령 구간에 대한 가중 평균 확률을 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정할 수 있다.
가중 평균과 관련된 연산을 수행할 때 사용되는 가중치는, 각 제 2 클래스 상품에 대한 제 2 클래스 회원들 중 연령이 확인된 회원들의 판매수량일 수 있다.
상기 가중치와 연산되는 변수는, 상기 가중치에 대응하는 제 2 클래스 상품을 구매한 제 2 클래스 회원들 중 특정 구간의 연령으로 확인된 회원들의 비율일 수 있다.
상기 프로세서는, 상기 산출된 각 연령 구간에 대한 가중 평균 확률을 점수화하여 연령 추정 예상 점수를 생성하되, 상기 연령 추정 예상 점수를 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 판단할 수 있다.
상기 프로세서는, 상기 산출된 각 연령 구간에 대한 가중 평균 확률 중 하나가 기설정된 임계 확률 이상인 회원들을 추출하고, 상기 추출된 회원들에 대해서만 그들의 연령을 결정할 수 있다.
상기 프로세서는, 임계 확률을 넘는 가중 평균 확률을 갖는 연령 구간으로 해당 회원의 연령을 결정할 수 있다.
상기 임계 확률은 상기 연령 구간의 수와 상기 복수의 연령 미입력 회원의 비율에 의해 결정될 수 있다.
상기 임계 확률은 임계 확률 결정을 위한 딥 러닝 모델에 의해 결정되되, 상기 딥 러닝 모델은 학습 데이터에 의해 학습되며, 상기 학습 데이터는, (i) 상기 산출된 각 연령 구간에 대한 가중평균확률 및 상기 임계확률로 구성된 입력 데이터, 및 (ii) 추후에 연령이 확인된 연령 미입력 회원의 실제 연령으로 구성된 출력 데이터를 포함할 수 있다.
상기 프로세서는, 제 1 연령 구간에 대한 가중평균확률과 제 2 연령 구간에 대한 가중평균확률이 임계값 이상 차이가 나는지 비교하고, 상기 비교 결과를 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하되, 상기 제 1 연령 구간에 대한 가중평균확률은 가장 높은 값을 갖는 가중 평균 확률이며, 상기 제 2 연령 구간에 대한 가중평균확률은 두번째로 높은 값을 갖는 가중 평균 확률일 수 있다.
상기 프로세서는, 상기 추정된 연령을 이용하여 상품의 전체 연령 비율에 대응하는 프로모션을 수행할 수 있다.
상기한 목적을 달성하기 위한 본 발명의 또 다른 양태에 따른 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 시스템은, 전자상거래와 연관된 제 1 쇼핑몰의 상품 구매 회원의 연령 추정 요청을 전송하고 상기 요청에 대응하는 추정 연령 정보를 수신하는 사용자 단말 및 상기 사용자 단말로부터의 연령 추정 요청에 대응하여, 전자상거래와 연관된 복수 개의 쇼핑몰의 상품 구매 이력 정보를 획득하여 상기 제 1 쇼핑몰의 제 1 클래스 상품(a first class product)을 구매한 제 1 클래스 회원들(first class members) 중 연령을 입력하지 않은 복수의 연령 미입력 회원의 연령을 추정함에 의해 상기 추정 연령 정보를 생성하여 상기 사용자 단말로 제공하는 상품 구매 회원 연령 추정 장치를 포함하되, 상기 상품 구매 회원 연령 추정 장치는, 상기 복수의 연령 미입력 회원 각각의 상기 구매 이력 정보를 이용하여, 해당 회원이 과거 구매한 적어도 하나의 제 2 클래스 상품들(at least one of second class products) 기반의 연령 추정 알고리즘에 의해 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정할 수 있다.
본 발명의 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법에 따르면, 특정 상품을 구매한 회원들의 연령을 정교하게 예측함으로써 상품에 구매 회원의 연령에 대응하는 최적 프로모션을 가능케함으로써, 구매회원들의 편의를 존중하면서도 프로모션을 효율화하며, 그로 인해, 쇼핑몰의 매출 증대를 도모하는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 상품 구매 회원의 성별/연령 추정 방법이 적용되는 시스템을 개략적으로 나타낸 개념도,
도 2는 본 발명의 일 실시예에 따른 상품 구매 회원의 성별 추정 방법을 개략적으로 나타낸 흐름도,
도 3은 상품별 성비를 구하는 과정을 설명하기 위한 테이블,
도 4a 및 도 4b는 구매 회원별로 과거 구매 상품의 이력을 통해 구매상품의 성비를 가중평균하는 과정을 설명하기 위한 테이블,
도 5는 성별 미입력 회원의 성별 예측을 위한 임계값을 결정하는 과정을 설명하기 위한 개념도,
도 6은 결정되는 임계값과 그에 따른 커버리지(coverage)의 관계를 설명하기 위한 개념도,
도 7은 임계값에 의해 결정되는 예측 정확도와 커버리지의 관계, 및 그에 따라 추가로 파악되는 여성회원의 수를 나타낸 도면,
도 8은 본 발명의 일 실시예에 따른 상품 구매 회원의 연령 추정 방법을 개략적으로 나타낸 흐름도,
도 9a 및 도 9b는 구매 회원별로 과거 구매 상품의 이력을 통해 구매상품의 연령 구간별 비율을 가중평균하는 과정을 설명하기 위한 테이블,
도 10은 연령 구간의 갯수와 임계 확률과의 관계를 나타낸 테이블,
도 11은 본 발명의 일 실시예에 따른 상품 구매 회원의 성별 및 연령 추정 장치를 개략적으로 나타낸 블록도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다.
그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제 1, 제 2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제 1 구성요소는 제 2 구성요소로 명명될 수 있고, 유사하게 제 2 구성요소도 제 1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 본 발명을 설명함에 있어 전체적인 이해를 용이하게 하기 위하여 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
상품 구매 회원 성별/연령 추정 시스템
도 1은 본 발명의 일 실시예에 따른 상품 구매 회원의 성별/연령 추정 방법이 적용되는 시스템을 개략적으로 나타낸 개념도이다. 도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 시스템은 쇼핑몰(110-1~110-N), 네트워크(120) 및 상품 구매 회원 성별/연령 추정 장치(130)를 포함할 수 있다.
도 1을 참조하면, 쇼핑몰(110-1~110~N)은 인터넷을 통하여 상품 및/또는 서비스를 판매하는 온라인 쇼핑몰을 의미한다. 즉, 전자상거래와 연관된 쇼핑몰들이다. 쇼핑몰(110-1~110~N)은 특정 URL을 가지고 인터넷 상에서 해당 주소로의 방문자들을 상대로 상품을 판매한다. 쇼핑몰 운영자는 판매된 상품에 대한 금액 중 적어도 일부를 쇼핑몰과 연관된 자신의 계좌를 통해 획득하는 방식으로 쇼핑몰을 운영한다.
도 1에 있어서, 쇼핑몰(110-1~110~N)은 앞서 설명한 바와 같이, 인터넷 상의 특정주소(예컨대, URL)의 웹 페이지, 쇼핑몰과 연관된 정보를 취급하는 서버 또는 쇼핑몰의 운영자의 단말기로써 구현될 수 있다. 단말은 스마트폰, PC 등의 컴퓨팅 디바이스를 포함할 수 있다.
본 발명의 실시예에 따르면, 복수 개의 쇼핑몰(110-1~110-N)은 네트워크(120)를 통해 상품 구매 회원 성별/연령 추정 장치(130)와 연동할 수 있다. 쇼핑몰(110-1~110-N)은 상품을 디스플레이하고, 쇼핑몰의 이벤트 상품을 홍보하며, 다수의 상품의 판매를 위한 웹 사이트 운영 등을 수행한다. 이때, 쇼핑몰(110-1~110-N)의 운영자는 특정 상품에 대한 프로모션을 적절히 수행하기 위해, 해당 상품의 구매 회원의 성별 및/또는 연령을 파악할 필요가 있다. 다만, 대부분의 회원들이 자신의 성별을 입력하지 않고 상품을 구매하기에, 상품 구매 회원 성별/연령 추정 장치(130)에 성별 및/또는 연령 추정을 요청하여 이에 대한 응답을 획득하는 것이 바람직하다. 그리고는, 획득된 응답의 내용에 근거하여 적합한 프로모션을 수행함으로써 판매를 촉진시킬 수 있다.
쇼핑몰(110-1~110-N) 운영자는 쇼핑몰과 관련된 상품의 구매 회원의 성별/연령을 확인하고자 할 때, 자신의 단말을 이용하여 상기 상품 구매 회원 성별/연령 추정 장치(130)로 요청할 수 있다. 이때, 쇼핑몰에서 운영하는 상품 전체에 대해 구매 회원 성별/연령 추정을 요청할 수도 있고, 개별 상품을 선택하여 특정 개별 상품에 대한 추정을 요청할 수도 있다. 더욱이, 일정한 주기로 상품 구매 회원의 성별/연령에 대한 추정을 원할 때에는 성별/연령 추정 주기를 설정하여 상품 구매 회원 성별/연령 추정 장치(130)로 제공할 수 있다.
한편, 쇼핑몰(110-1~110-N) 운영자는 상기 추정된 성별/연령 정보를 기반으로 최적의 프로모션 시점 및 방법(또는 대상)을 질의하거나 또는 프로모션의 변경 주기를 자동으로 설정하도록 상품 구매 회원 성별/연령 추정 장치(130)에 요청할 수 있다. 요청에 대응하는 프로모션 변경 시점 또는 주기에 자동으로 프로모션 방법 및 대상이 변경되도록 요청할 수도 있다.
네트워크(120)는 쇼핑몰(110-1~110-N)과 상기 상품 구매 회원 성별/연령 추정 장치(130)를 연결하는 통신망으로써, 유선망 및/또는 무선망(인터넷(internet))을 포함할 수 있다.
상품 구매 회원 성별/연령 추정 장치(130)는 쇼핑몰(110-1~110-N) 중 적어도 하나로부터 상품 구매 회원 성별/연령 추정 요청 또는 프로모션의 업데이트와 관련된 요청을 네트워크(120)를 통해 수신하고, 수신된 정보에 기반하여 상품 구매 회원의 성별 및/또는 연령을 산출하며, 이를 기반으로 해당 상품의 프로모션 정보를 업데이트할 수 있다. 상기 상품 구매 회원 성별/연령 추정 장치(130)는 쇼핑몰 운영자로부터의 요청 없이 쇼핑몰 플랫폼을 관리하는 관리자에 의해 설정된 값 또는 관리자의 명령에 의해 특정 상품의 구매 회원의 성별 및/또는 연령을 산출할 수 있다. 본 명세서 상에서 상품 구매 회원 성별/연령 추정 장치(130)는 성별 추정 장치, 연령 추정 장치, 서버, 장치로 표현될 수 있다. 다른 예에서, 추정된 성별/연령을 가지고 실제 상품의 프로모션 방향을 결정하고 실행할 수 있기 때문에, 상품 프로모션 장치, 또는 상품 프로모션 업데이트 시점(또는 주기) 산출 장치로 불릴 수 있다.
일 예에서, 상기 상품 구매 회원 성별/연령 추정 장치(130)는 컴퓨팅 장치로 구현될 수 있다. 여기서 말하는 컴퓨터 장치는 서버 급 컴퓨터 단말기로 구현될 수 있다. 상기 컴퓨터 장치는 통상적인 컴퓨터 단말이 가지는 입력 장치, 표시 장치, 네트워킹 장치, 하드디스크, 프로그램을 저장하는 메모리 및 메모리에 저장된 프로그램을 수행시키는 프로세서 등을 구비할 수 있다. 다만, 반드시 서버 급 컴퓨터 단말로 구현되어야 하는 것은 아니다.
상품 구매 회원 성별/연령 추정 장치(130)는 쇼핑몰을 개설하고 운영하는 플랫폼을 배포하고 관리하는 서버이거나 또는 상기 서버와 연동하는 서버일 수 있다. 따라서, 상품 구매 회원 성별/연령 추정 장치(130)는 하나의 쇼핑몰(110-1)과 연관된 정보만을 취급하는 것이 아니라, 다수의 쇼핑몰(110-1~110-N)과 연관된 정보를 취급하고, 빅데이터를 기반으로 다양한 정보를 분석 및 학습할 수 있다. 또한, 사용자(쇼핑몰 운영자 또는 쇼핑몰 플랫폼 관리자)의 요청에 대응하여 상품 구매회원의 성별 및/또는 연령을 산출하기 위해, 다수의 쇼핑몰(110-1~110-N)의 정보 중 필요한 정보를 수집하여 이를 성별 및/또는 연령 추정에 활용한다.
상품 구매 회원 성별/연령 추정 장치(130)는 특정 상품을 구매한 회원의 회원 정보를 획득한다. 이를 기반으로 리스트를 생성할 수도 있다. 그리고는, 각각의 회원들 중 성별을 입력하지 않은 회원들의 성별을 추정한다. 이를 성별 미입력 회원이라 칭할 수 있다. 연령의 경우, 연령 미입력 회원이라 칭한다. 이러한 성별 미입력 회원의 성별은 성별이 있는 회원들의 데이터를 이용하여 산출될 수 있다. 특히, 특정 상품이 대상이라고 하면, 대상 상품을 구매한 회원의 과거 구매 상품의 데이터를 활용한다. 이때, 과거 구매 상품을 구매한 회원들도 마찬가지로 성비를 가지고 있을 것이고, 이러한 성비를 분석 및 이용하여 추정 대상 회원의 성별을 예상한다. 이때, 성비는 성별 파악이 가능한 구매자 중 여성의 비중으로 정의한다. 다만, 반드시 그래야만 하는 것은 아니고, 남성의 비율로 정해도 무방하다. 보다 구체적으로, 장치는, 성별 미입력 회원의 성별 추정을 위해, 추정 대상 상품을 구매한 회원들의 구매 상품들에 대해 각 상품의 성비를 가중평균하여 가중평균치가 임계값(cutoff) 이상인 경우, 여성으로 판정한다. 이때, 가중치는 상품의 판매 수량으로 하는 것이 바람직하다.
연령 추정의 경우도 마찬가지이다. 다만, 연령 추정의 경우에는, 특정 상품 구매 회원의 연령의 평균을 그대로 사용하게 되면, 항상 중간 값으로 산출되므로, 실제 나이에 비해 상품 구매자 나이 평균은 과도하게 중앙에 집중되는 현상이 있다. 그걸 다시 가중평균 하게되면 연령 미입력 회원의 연령 또한 중간에 몰리게 된다. 즉, 실제 나이는 10~60 세에 걸쳐 다양하게 있으나, 예측은 40~45세에 몰리게 된다. 따라서, 연령을 구간별로 나누고 각 구간의 확률로써 이를 가중평균하여 특정 연령 구간에 속할 확률을 구하고, 이를 기반으로 해당 회원의 연령을 추정하는 것이 바람직하다. 즉, 전구간 평균치를 통한 연령 추정은 지양하는 것이 바람직하다.
본 발명의 다른 실시예에 따르면, 쇼핑몰(110-1~110-N)과 연관된 단말은 상품 상품 구매 회원 성별/연령 추정 장치(130)에서 제공하는 애플리케이션을 다운로드 받아 애플리케이션을 통해 성별/연령 산출 및 상품 프로모션 업데이트 등을 수행할 수 있다. 즉, 쇼핑몰(110-1~110-N)과 연관된 사용자 단말은 자신이 최적이라고 생각하는 임계값, 성별/연령 추정 주기, 성별/연령 추정과 관련된 팩터를 이용하여 성별 및/또는 연령을 추정하고 상품의 프로모션을 업데이트하는 과정을 단말 내에서 수행할 수 있다. 별도의 서버장치 없이 단말의 프로세서(미도시)가 다운받은 애플리케이션을 실행하면, 성별/연령 추정 및 그에 따른 상품 프로모션이 자동으로 진행되도록 할 수 있다.
상품 구매 회원 성별 추정 방법
도 2는 본 발명의 일 실시예에 따른 상품 구매 회원의 성별 추정 방법을 개략적으로 나타낸 흐름도이다.
도 2를 참조하면, 장치는 구매회원의 성별 추정을 수행해야 할 상품을 특정한다(S210). 쇼핑몰 운영자의 요청에 의해 성별 추정이 이루어지는 경우, 운영자가 특정한 상품이 대상 상품이 될 것이다. 이러한 대상 상품을 제 1 클래스(a first class)의 상품이라고 정의할 수 있다. 대상 상품은 특정 쇼핑몰에서 취급하는 모든 상품이 될 수도 있고, 하나의 상품이 될 수 있다.
상품이 특정되면, 장치는 상품 구매자의 정보를 획득하다(S220). 이를 제 1 클래스의 구매회원이라고 정의한다. 즉, 제 1 클래스의 구매회원은 성별 추정 대상인 제 1 클래스의 상품을 구매한 회원을 의미한다. 이는, 상품 구매 이력 정보로부터, 즉, 장치가 관리하는 데이터베이스(미도시)의 빅데이터를 이용하여 획득할 수 있고, 리스트 형태로 관리될 수 있다.
구매자 정보를 획득하고 나면, 장치는 상품 구매자의 이전 상품 구매 이력 정보를 획득한다(S230). 즉, 제 1 클래스 구매회원이 이전에 구매했던 상품들에 대한 데이터를 획득한다. 이러한 상품들의 리스트는 제 2 클래스(a first class) 상품 리스트로 불릴 수 있다. 즉, 제 2 클래스 상품은 상기 제 1 클래스 회원이 현재 추정 대상 상품 이전에 구매했던 상품들이라고 할 수 있고, 이는 각각의 제 1 클래스 구매회원마다 서로 다를 수 있다. 즉, 각각의 제 1 클래스 구매회원마다 제 2 클래스 상품 리스트를 생성하여 이를 성별 추정에 활용하는 것이 바람직하다.
장치는 상품 구매 이력 정보(예컨대, 제 2 클래스 상품 리스트)를 이용하여 해당 회원의 성별 추정을 위한 성비 가중 평균치를 산출한다(S240). 가중 평균은 각각의 상품의 성비에 가중치를 부여하여 합산한 후, 이를 평균을 낸 것을 의미한다. 여기서 가중치는 상품 판매 수량이 된다.
장치는 위와 같은 방법에 의해 산출된 가중평균치를 이용하여 해당 성별 미입력 회원의 성별을 추정한다(S250). 성별 추정 방법은 (i) 성별을 입력한 회원과 유사한 가중평균치인지 확인하기 위해 성별을 입력한 회원과 그렇지 않은 회원 간의 가중평균치를 비교하는 방법과, (ii) 산출된 가중평균치가 기 설정된 임계값(cutoff) 이상인지 비교하는 방법이 있다. (ii)의 방법에서 상한 임계값보다 높은 가중평균치임이 판명되면, 해당 회원을 여성으로 추정할 수 있다. 또한, 하한 임계값보다 낮은 가중평균치임이 판명되면, 해당 회원을 남성으로 추정한다.
위와 같은 추정방법에 의해, 전체 성별 미입력 회원 중 적어도 일부의 성별이 추정되면, 전체 구매회원의 성비를 다시 한번 계산하여, 그에 대응하는 프로모션을 수행한다(S260). 예컨대, 여성 비율이 80% 이상인 경우, 해당 상품은 대부분 여성이 사용한다고 판단하고, 여성 구매 회원에 적합한 프로모션을 수행한다. 반대의 경우도 마찬가지이다. 여성 또는 남성 성별에 대응하는 프로모션과 관련된 정보를 미리 준비해놓았다가 주기적으로 자동 계산되는 성비에 대응하여 적합한 프로모션이 자동으로 실행되도록 할 수 있다. 또는, 쇼핑몰 운영자가 추정된 성비를 보고 직접 적절한 프로모션을 생성하여 실행할 수도 있다.
일 예에서, 장치는 지난 성별 추정 주기 때, 여성이 많다는 결과에 대응하여 여성 고객 위주의 프로모션을 하고 있는 경우, 이번 성별 추정 주기에 남성이 많다는 결과가 도출될 수 있다. 이때, 장치는 자동으로 프로모션 방향을 변경하여, 기저장된 남성 고객용 프로모션 정보를 웹 페이지에 업로드하여 성별의 변화에 적응적으로 대응하도록 제어할 수 있다. 이는 연령 추정에도 마찬가지로 적용될 수 있다. 즉, 장치는 과거 프로모션 방향과 반대되는 결과가 상기 성별 및/또는 연령 추정 결과로써 도출된 때를 프로모션 업데이트 시점으로 결정할 수 있다.
도 3은 상품별 성비를 구하는 과정을 설명하기 위한 테이블이다.
도 3을 참조하면, 장치는 상품 대상을 특정하는 단계(S210)에서, 성비 추정 대상을 특정한다. 이때, 기 설정된 수량 이상 판매된 상품을 대상으로 하는 것이 바람직하다. 상기 기 설정된 수량은 50개, 100개, 200개 등 일정한 수 이상으로 설정되는 것이 바람직하다. 너무 적은 판매수량을 기록한 상품에 대한 성비 추정은 그 정확도가 담보되지 않기 때문이다.
장치는 추정 대상 상품이 특정되면, 구매자 중 미입력자(na), 남성(male), 여성(female)으로 구분하여 성비 관련 팩터를 정리한다. 그리고는, 전체, 그리고 여성일 확률(prob)과 미입력 확률(nap)을 산출한다. 각각의 상품마다 여성일 확률 및 미입력 확률을 산출하고, 회원별 가중평균을 산출하는 단계로 넘어간다.
도 4a 및 도 4b는 구매 회원별로 과거 구매 상품의 이력을 통해 구매상품의 성비를 가중평균하는 과정을 설명하기 위한 테이블이다.
도 4a 및 도 4b를 참조하면, 제 1 클래스의 회원들은 각각 자신의 과거 구매 이력을 살펴보고, 각각의 회원들의 성별을 추정한다. 이때, 과거 구매 이력으로부터 회원별로 구매상품의 성비를 가중평균하여 가중치를 통해 보다 정확한 상품의 성비를 파악한다. 이때, 과거 어느 시점까지의 데이터를 사용할지는 설정사항으로 임의로 가변할 수 있다. 예컨대, 최근 1개월, 2개월 등의 데이터를 수집하여 가중평균 산출 대상으로 할 수 있다. 또한, 수집된 데이터 중 판매건수가 일정 건수(예컨대, 100건) 이상되는 것들만을 가중평균 산출 대상으로 선택하는 것이 바람직하다. 그래야 어느정도의 신뢰도를 확보할 수 있다.
도 4a 및 도 4b의 실시예에서, 회원별로 구매상품의 성비를 가중평균한다. 이때, 가중치는 성별이 확인된 판매수량으로 결정한다. 장치는, 특정 제 1 클래스 회원(예컨대, 100006913@n)이 구매한 제 2 클래스 상품의 리스트를 생성한다. 해당 회원은 35개의 상품을 주문했기 때문에, 제 2 클래스 상품 리스트는 35개의 상품 리스트이며, 상품 리스트에는 각각의 제 2 클래스 상품을 구매한 제 2 클래스 구매회원의 성비가 포함되는 것이 바람직하다. 예를 들어, 100006913@n이 구매한 제 2 클래스 구매 상품, product_no 20인 상품의 경우, 이를 구매한 제 2 클래스 회원의 성비는 12687/15193 = 0.835를 나타낸다. 성비는 제 2 클래스 회원들 중 성별이 확인된 회원의 수 대비 여성회원의 비율로 정의될 수 있다. 이때, 가중치는 성별이 확인된 제 2 클래스 회원의 판매수량으로 15193이 될 수 있다. 이와 같이, 제 2 클래스 상품들 각각을 구매한 제 2 클래스 회원들의 성비에 대해, 각 제 2 클래스 상품의 판매수량을 가중치로 하여, 가중 평균 연산을 수행하면, 각각의 회원이 구매한 상품에 대한 성비 가중 평균치가 산출된다.
상기 가중 평균치는 다음의 수학식에 의해 산출된다.
WAtotal(Weighted Average) = (p1*w1 + p2*w2 + ... + pn*wn) / (w1+w2+...wn)
여기서, WAtotal은 가중평균치를, i는 상품 인덱스를 의미하고, pi는 상품 i에서의 성비를, wi은 상품 i에 대한 가중치를 나타낸다.
도 4b에서, 100006913@n 회원은 여성으로 등록되었다. 장치는, 상기 100006913@n과 가중평균치가 유사한 100008681@n 회원을 여성으로 판단할 수 있다. 장치는, 이미 여성으로 등록된 회원들의 가중평균치를 평균하고, 이로부터 기준 구간 내에 존재하는 가중평균치를 갖는 성별 미확인 회원들을 여성으로 추정할 수 있다. 상기 기준 구간은 상기 평균치로부터, ± 0.01, ± 0.02, ± 0.03, ± 0.05, ± 0.1 중 하나로 정의될 수 있다. 다만, 반드시 위의 값으로 한정되어야만 하는 것은 아니다. 또는, 장치는 임계값을 0.8로 설정하여, 이보다 높은 가중평균치를 갖는 회원들을 여성회원으로 추정할 수 있다. 임계값은 0.8로 한정되어야 하는 것은 아니고, 0.6, 0.65, 0.7, 0.75, 0.8, 0.85, 0.9, 0.95 등 다른 값으로 설정되어도 무방하다.
본 발명의 실시예에 따르면, 장치는 상기 가중평균치를 기반으로 성별 추정을 위한 예상점수로 점수화할 수 있다. 예컨대, 0.9 내지 1의 가중평균치에 대해서는 100점으로, 0.8 내지 0.9의 가중평균치에 대해서는 95점으로, 0.7 내지 0.8은 90점, 0.6 내지 0.7에 대해서는 80점으로, 0.6 이하에 대해서는 70 점으로 정의할 수 있다. 그리고는, 결정된 예상점수에 의해 여성 회원 여부를 예측할 수 있다. 예상점수가 올라갈수록 여성 비율은 증가할 수 있다.
도 5는 성별 미입력 회원의 성별 예측을 위한 임계값을 결정하는 과정을 설명하기 위한 개념도이다.
도 5를 참조하면, 장치는 복수 개의 임계값을 성별 추정을 위한 기준으로 선택할 수 있다. 이때, 복수 개의 임계값은 상한 임계값과 하한 임계값을 포함한다. 상한 임계값보다 높은 가중평균치를 갖는다면, 장치는 해당 제 1 클래스 회원을 여성으로 추정하고, 하한 임계값보다 낮은 가중평균치를 갖는다면, 장치는 해당 제 1 클래스 회원을 남성으로 추정할 수 있다. 다만, 임계값의 위치에 따라 추정되는 제 1 클래스 회원의 수가 가변되므로, 임계값 설정은 본 발명의 일 실시예에 따른 성별 추정 방법에서 매우 중요한 팩터이다. 이하, 이에 대해 보다 상세히 설명한다.
도 6은 결정되는 임계값과 그에 따른 커버리지(coverage)의 관계를 설명하기 위한 개념도이다.
도 6을 참조하면, 장치는 상한 임계값을 0.8로 설정할 수 있다. 도 6의 실시예에서, 0.8보다 높은 가중평균치를 갖는 회원들 중 남성회원의 비율은 약 16%이다(43793 : 6623). 즉, 0.8보다 높은 가중평균치를 갖는 회원들을 여성으로 판정한다면, 판정의 정확도는 43793/(43793+6623) = 86.8%가 된다. 또한, 이를 통해 추가로 성별 확인이 되는 여성회원은 43793/(43793+2701) = 94%가 된다. 즉, 정확도는 86.6%가되고, 커버리지는 94%가 된다. 이는 가중평균치를 사용하지 않고, 여성이라고 예측했을 때의 정확도인 46549/(46549+9029) = 83.7% 보다 높은 결과이다.
도 7은 임계값에 의해 결정되는 예측 정확도와 커버리지의 관계, 및 그에 따라 추가로 파악되는 여성회원의 수를 나타낸 도면이다.
도 7을 참조하면, 상한 임계값이 커질수록 정확도는 높아진다. 다만, 대상에 해당하는 회원수는 적어지고, 이는 추가로 파악되는 여성회원 수가 적어짐을 나타낸다. 즉, 정확도와 추가확보 회원수는 반비례 관계를 갖는다. 도 7의 그래프에서, 0.8의 가중평균치를 임계값으로 설정할 때, 정확도는 86%를 갖고, 그에 따른 추가 여성 회원은 현재 여성으로 등록된 회원 수 대비 약 201%의 비율로 증가함을 나타낸다. 반면, 0.9의 가중평균치를 임계값으로 설정했을 때는, 약 94%를 상회하는 정확도를 가지며, 72%의 추가 여성회원을 확보할 수 있다.
장치는 이러한 관계를 고려하여 임계값을 결정하는 것이 바람직하다. 장치는 각각의 제 1 클래스 상품, 그리고 제 1 클래스 회원들의 성별 추정 케이스, 및 상기 케이스에서의 추정 관련 팩터 값들(가중평균치 및 그에 따른 임계값 등)을 저장한다. 그리고는, 상기 저장된 성별 추정 케이스를 기반으로, 추후에 실제 제 1 클래스의 회원들의 성별이 확인된 경우, 그 결과 값과 성별 추정 케이스의 성비를 기반으로 학습데이터를 생성하여 추정 정확도를 높이는 딥 러닝 모델을 생성하고, 이를 학습한다. 학습 데이터는 추정 관련 팩터 값들을 입력값으로, 실제 성별 및/또는 커버리지 값을 출력값으로 포함하여 구성된다. 즉, 이와 같은 데이터를 계속 쌓으므로 인해, 정확도(실제 성별 데이터를 기반으로 학습)와 추가확보 회원수(커버리지 값을 기반으로 학습)의 관계에서 최적의 임계값을 찾을 수 있다. 장치는, 성별 미입력 회원의 비율도 고려하여 상기 임계값을 결정하는 것이 바람직하다. 즉, 성별 미입력 회원의 비율이 높을수록 임계값은 낮게 설정하여 추가 확보 회원의 수를 높이는 것이 바람직하다.
한편, 위의 설명은 상한 임계값에 대한 것이고, 하한 임계값에 경우에 대입해도 반대의 결과가 나오는 것은 자명한 것이다.
상품 구매 회원 연령 추정 방법
도 8은 본 발명의 일 실시예에 따른 상품 구매 회원의 연령 추정 방법을 개략적으로 나타낸 흐름도이다.
도 8을 참조하면, 장치는 구매회원의 연령 추정을 수행해야 할 상품을 특정한다(S810). 쇼핑몰 운영자의 요청에 의해 연령 추정이 이루어지는 경우, 운영자가 특정한 상품이 대상 상품이 될 것이다.
상품이 특정되면, 장치는 상품 구매자의 정보를 획득한다(S820). 이를 제 1 클래스의 구매회원이라고 정의한다. 이는, 상품 구매 이력 정보로부터 획득하여 리스트 형태로 관리될 수 있다.
구매자 정보를 획득하고 나면, 장치는 상품 구매자의 이전 상품 구매 이력 정보를 획득한다(S830). 즉, 제 1 클래스 구매회원이 이전에 구매했던 상품들에 대한 데이터를 획득한다. 각각의 제 1 클래스 구매회원마다 제 2 클래스 상품 리스트를 생성하여 이를 연령 추정에 활용한다.
장치는 연령 추정을 위해 연령 구간을 구획한다(S840). 연령 추정의 경우, 성별 추정과 동일한 방법으로 가중평균치를 산출했을 때, 추정 연령이 중간 나이대(약 40~45세)에 집중되게 되어, 정확도가 떨어지기 때문에, 연령을 복수 개 구간으로 나눈 후, 각 구간에 속할 확률을 구하는 것이 바람직하다. 장치는 10대, 20대, 30대, 40대, 50대, 60대 이상으로, 복수 개의 연령대를 구분하여 이에 속하는 비율로 처리한다.
장치는 상품 구매 이력 정보(예컨대, 제 2 클래스 상품 리스트)를 이용하여 해당 회원의 연령 추정을 위한 연령 구간 포함 확률 가중 평균을 산출한다(S850). 가중 평균은 각각의 상품의 연령 구간 포함 확률에 가중치를 부여하여 합산한 후, 이를 평균을 낸 것을 의미한다. 여기서 가중치는 연령이 확인된 회원들이 구매한 상품 판매 수량이 된다.
장치는 위와 같은 방법에 의해 산출된 가중평균확률을 이용하여 연령 미입력 회원의 연령을 추정한다(S860). 연령 추정 방법은 성별 추정과 마찬가지로, (i) 연령 정보를 정확히 입력한 회원과 유사한 가중평균확률을 갖는지 두 회원의 가중평균확률을 비교하는 방법과, (ii) 산출된 가중평균확률이 기 설정된 임계확률(cutoff) 이상인지 비교하는 방법이 있다. (ii)의 방법에서 임계확률보다 높은 가중평균확률이 판명되면, 해당 회원은 해당 연령구간으로 추정할 수 있다. 연령 추정에서는 별도의 하한 임계값은 사용하지 않는 것이 바람직하다. 다른 예에서, 복수의 연령 구간이 임계확률을 넘는 경우, 임계확률을 넘는 연령구간 중 더 높은 값을 갖는 연령구간으로 해당회원의 연령을 추정한다.
위와 같은 추정방법에 의해, 전체 연령 미입력 회원 중 적어도 일부의 연령이 추정되면, 전체 구매회원의 연령 구간을 다시 한번 통계내어, 그에 대응하는 프로모션을 수행한다(S870). 예컨대, 10대 비율이 60% 이상인 경우, 해당 상품은 대부분 10대가 사용한다고 판단하고, 10대에게 적합한 프로모션을 수행한다. 프로모션과 관련된 부분 및 연령과 관련하여 명확히 다르게 수행한다고 기재되지 않는 부분은 대부분 성별 추정 및 그에 따른 프로모션 과정과 유사하게 수행됨은 본 발명이 속하는 통상의 기술자에게는 자명할 것이다.
도 9a 및 도 9b는 구매 회원별로 과거 구매 상품의 이력을 통해 구매상품의 연령 구간별 비율을 가중평균하는 과정을 설명하기 위한 테이블이다.
장치는 추정 대상 상품이 특정되면, 구매자 중 연령 미입력자(na), 10대, 20대, 30대, 40대, 50대, 60대 이상으로 구분하여 연령 관련 팩터를 정리한다. 그리고는, 전체, 그리고 각각의 연령 구간일 확률(prob_10, prob_20 ... prob_60)과 미입력 확률(nap)을 산출한다.
제 1 클래스의 회원들은 각각 자신의 과거 구매 이력을 살펴보고, 각각의 회원들의 연령을 추정한다. 이때, 과거 구매 이력으로부터 회원별로 구매상품의 특정 연령 구간에 포함될 확률을 가중평균하여 가중평균 확률을 산출한다. 다만, 성별 추정 과정과 마찬가지로, 과거 어느 시점까지의 데이터를 사용할지, 판매건수가 어느 정도 이상인 데이터만 사용할지는 설정사항으로 임의로 가변할 수 있다.
도 9a 및 도 9b의 실시예에서, 회원별로 구매상품의 연령구간 포함 확률을 가중평균한다. 장치는, 제 1 클래스 회원(10000417@n)을 대상으로 제 2 클래스 상품들(41, 43, 54 등)에 대한 연령 구간 포함 확률을 산출하여 리스트로 생성한다. 여기서 연령구간은 연령 10세를 기준으로 10대, 20대, 30대, 40대, 50대, 60대 이상으로 구분했으나, 연령 5세를 기준으로 할 수도 있고, 8~13세, 14~18세 등 다른 구간으로 연령 구간을 결정해도 무방하다. 장치는 각각의 제 2 클래스 상품에 대해 해당 연령 구간에 속할 확률을 산출하고, 해당 상품의 연령이 확인된 회원에 대한 판매수량을 가중치로 하여 각 연령 구간에 대한 가중평균 확률을 산출한다.
도 9b를 참조하면, 10대 구간에서 일반 평균은 0.054를 나타내는데 반해, 가중평균은 0.064를 나타내고, 20대에서 일반 평균은 0.217을 나타내는데 반해, 가중평균은 0.312를 나타내는 등 일반 평균과 가중 평균 간에는 차이가 존재할 수 있다. 그리고, 가중치를 더하여 산출한 가중평균 확률이 각각의 상품에 대한 판매수량 기반의 가중치를 부과하고 있기 때문에, 실제 해당 회원이 해당 연령에 속할 가능성을 보다 정교하게 대변한다고 볼 수 있다.
이러한 연령 구간별 포함 확률에 대한 가중평균은 다음과 같이 산출될 수 있다.
WA10(Weighted Average) = (p1*w1 + p2*w2 + ... + pn*wn) / (w1+w2+...wn)
여기서, WA10은 해당 회원이 10대에 속할 확률에 대한 가중평균치를, i는 상품 인덱스를 의미하고, pi는 상품 i에서의 10에 속할 확률을, wi은 상품 i에 대한 가중치를 나타낸다. 이와 같은 방법으로 각각의 연령 구간별로 가중평균을 산출하여, WA20, WA30, WA40, WA50, WA60 등의 값을 확보하고, 이를 기반으로 해당 회원의 연령을 추정하는 것이 바람직하다.
장치는, 앞서 설명한 (i) 및 (ii) 방법 이외에, (iii) WA10 내지 WA60의 값을 상대적으로 비교하고, 가장 높은 값을 갖는 확률과 그 다음으로 높은 값을 갖는 확률 간의 차이값이 기설정된 임계값보다 큰지 여부를 기반으로 해당 회원의 연령을 추정할 수 있다. 예컨대, 상기 6개의 가중평균 확률 값 중에 WA30이 가장 큰 값을 갖는 것으로 0.5의 값을 갖고, 그 다음으로 큰 확률 값이 WA40으로 0.2의 값을 갖는다고 할 때, 두 가중평균 확률의 값을 차감연산하여, 차이값 0.3을 획득하고, 이를 임계확률(예컨대, 0.25)과 비교하여 그보다 크다고 판단함에 대응하여 해당 회원은 가장 큰 확률 값을 갖는 연령구간인 30대로 판단할 수 있다.
본 발명의 실시예에 따르면, 장치는 상기 가중평균확률을 기반으로 연령 추정을 위한 예상점수로 점수화할 수 있다. 예컨대, 0.5 내지 0.6의 가중평균치에 대해서는 100점으로, 0.4 내지 0.5의 가중평균치에 대해서는 95점으로, 0.3 내지 0.4는 90점, 0.25 내지 0.3에 대해서는 80점으로, 0.3 이하에 대해서는 70점으로 정의할 수 있다. 그리고는, 결정된 예상점수에 의해 해당 연령구간에 포함되는지 여부를 예측할 수 있다. 예상점수가 올라갈수록 해당 연령구간에 속할 확률은 증가할 수 있다.
도 10은 연령 구간의 갯수와 임계 확률과의 관계를 나타낸 테이블이다.
도 10을 참조하면, 연령구간은 사용자 설정에 의해 가변될 수 있다. 이때, 장치는 연령구간의 갯수에 따라 임계확률을 다르게 적용할 수 있다. 예컨대, 3개의 연령구간으로 구분하는 경우, 각 구간에 속할 확률이 10개의 연령구간으로 구분하는 경우보다 높다. 따라서, 3개의 연령 구간에서는 해당 연령구간에 속하는 것으로 판단하기 위한 임계확률이 0.6으로 상대적으로 높고, 4개의 연령구간 구분 케이스에서는 0.5로, 5개의 연령구간으로 구분하는 케이스에서는 0.4로 비례적으로 작아지도록 하는 것이 바람직하다. 이때, 각 케이스에서의 임계 확률의 값은 다른 값으로 설정되어도 무방함은 자명한 것이다.
연령 구간의 갯수에 따라 달라지는 임계확률의 값은 가장 높은 값을 갖는 연령구간과 두번째로 높은 값을 갖는 연령구간과의 차이값을 비교하는 방법에도 적용될 수 있다. 즉, 3개 구간으로 나누었을 때와 4개 구간으로 나누었을 때, 차이값에 적용되어 해당 구간인지 결정하기 위한 임계확률은 달라질 수 있다. 대체적으로 많은 구간을 가질 때 임계확률 값을 작아지는 것이 바람직하다.
한편, 임계확률을 결정할 때, 앞선 성별 추정 때와 마찬가지로 딥 러닝 모델이 사용될 수 있다. 장치는 연령 추정을 위한 각각의 케이스에 대한 데이터를 저장하고, 추후에 해당 회원의 실제 연령이 밝혀진 경우, 상기 케이스에 대한 저장된 데이터를 입력값으로 그리고, 실제 연령을 출력값으로 학습데이터 셋을 생성하여, 딥 러닝 모델을 학습시킴에 의해, 최적의 임계확률 값을 결정할 수 있다.
또한, 이러한 임계확률을 결정하는 데에는 연령 미입력 확률(nap)이 고려될 수 있다. 연령 미입력 확률이 클수록 임계확률을 낮게 설정하는 것이 보다 넓은 커버리지 확보를 위해 적절할 수 있다.
상품 구매 회원 성별/연령 추정 장치
도 11은 본 발명의 일 실시예에 따른 상품 구매 회원의 성별 및 연령 추정 장치를 개략적으로 나타낸 블록도이다. 도 11에 도시된 바와 같이, 장치는, 통신부(1110), 프로세서(1120), 메모리(1130) 및 입출력 모듈(1140)을 포함할 수 있다.
도 11을 참조하면, 통신부(1110)는 도 1의 네트워크(120)를 통해 사용자 단말(쇼핑몰 운영자 단말)과 정보를 주고받기 위한 구성요소이다. 통신부(1110)는 유선 또는 무선 네트워크와 연관된 통신 장치를 포함한다. 통신부(1110)는 안테나를 포함할 수 있다.
프로세서(1120)는 통신부(1110)를 통해 사용자 단말로부터 수신되는 성별/연령 추정 요청 및 성별/연령 추정과 관련된 정보를 획득하고, 프로그래밍된 바에 따라 성별/연령을 추정하고 적절한 프로모션 방향 및 시점을 결정하는 구성요소이다. 프로세서(1220)는 메모리(1230)와 신호선을 통해 연결되어 있으며, 메모리(1230)에 저장된 프로그램을 실행한다. 프로세서(1220)는 앞서 설명한 바와 같이, 성별/연령 추정의 대상이 되는 상품(제 1 클래스 상품)을 특정하고, 해당 상품의 구매자 리스트(제 1 클래스 회원 리스트)를 생성한다. 그리고는, 리스트에 속한 회원들 각각이 과거 구매한 상품들(제 2 클래스 상품들)에 대한 리스트를 생성하고, 생성된 리스트를 기반으로 해당 상품들을 구매한 회원들(제 2 클래스 회원들)의 성비(또는 연령구간에 속할 확률)를 가중평균하여 각 회원의 성비/연령 관련 가중평균치를 산출한다. 그리고는, 산출된 가중평균치를 기반으로 적응적으로 또는 기설정된 임계값과 비교하여 성별/연령 미입력 회원의 성별 및/또는 연령을 판별한다. 그리고, 판별된 성별/연령을 프로모션 방향 결정 및 최적 프로모션 관련 정보를 해당 쇼핑몰의 웹 페이지에 업로드한다.
메모리(1230)는 프로세서(1220)에서 수행해야 할 프로그램들과 연관된 명령어들을 저장하고 있으며, 프로세서(1220)에서 요구하는 각종 데이터를 저장하고 있는 저장장치이다. 메모리(1230)는 쇼핑몰의 상품 구매 회원 정보 및 각 회원들의 상품 구매 이력 정보를 저장하고 있을 수 있다. 메모리(1230)는 장치 내부의 로컬 메모리 또는 외부의 대용량 데이터베이스로써 구현될 수 있다.
입출력 모듈(1240)은 키보드, 마우스와 같은 정보 입력 수단 및 모니터, TV, 터치스크린과 같은 정보 출력 수단을 포함한다. 입출력 모듈(1240)은 성별/연령 추정, 프로모션 업데이트 시점 결정과 관련된 각종 설정값들(가중치, 임계값 등)을 변경하고 관련된 내용을 표시하는데 사용된다.
이상에서 설명된 시스템 또는 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 시스템, 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예들에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (23)

  1. 컴퓨팅 장치에서의 연령 추정 방법에 있어서,
    전자상거래와 연관된 복수 개의 쇼핑몰의 상품 구매 이력 정보를 획득하는 단계, 상기 상품 구매 이력 정보는 특정 상품에 대한 구매 회원 정보 및 구매 회원이 이전에 구매한 상품에 대한 정보를 포함함; 및
    상기 구매 이력 정보를 이용하여, 상기 복수 개의 쇼핑몰 중 적어도 하나의 제 1 클래스 상품(a first class product)을 구매한 제 1 클래스 회원들(first class members) 중 연령을 입력하지 않은 복수의 연령 미입력 회원의 연령을 추정하는 단계를 포함하되,
    상기 복수의 연령 미입력 회원의 연령을 추정하는 단계는,
    상기 복수의 연령 미입력 회원 각각의 상기 구매 이력 정보를 이용하여, 해당 회원이 과거 구매한 적어도 하나의 제 2 클래스 상품들(at least one of second class products) 기반의 연령 추정 알고리즘에 의해 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하는 단계를 포함하되, 상기 연령 추정 알고리즘에 의해 추정하는 단계는,
    복수의 기준값을 이용하여 연령 구간을 구분하는 단계;
    상기 복수의 연령 미입력 회원 각각이 과거 구매한 적어도 하나의 제 2 클래스 상품들을 추출하는 단계;
    상기 추출된 적어도 하나의 제 2 클래스 상품들을 구매한 제 2 클래스 회원들(second class members)의 상기 구분된 연령 구간 각각에 속할 확률을 가중평균하여 각 연령 구간에 대한 가중 평균 확률을 산출하는 단계; 및
    상기 산출된 각 연령 구간에 대한 가중 평균 확률을 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하는 단계를 포함하고,
    상기 가중 평균 확률은 WA10(Weighted Average) = (p1*w1 + p2*w2 + ... + pn*wn) / (w1+w2+...wn)을 이용하여 산출하되,
    여기서, WA10은 해당 회원이 10대에 속할 확률에 대한 가중평균치를, i는 상품 인덱스를 의미하고, pi는 상품 i에서의 10대 구간의 연령으로 기확인된 회원들의 비율을, wi은 상품 i에 대한 가중치를 나타내며, 상기 가중치는 각 제 2 클래스 상품에 대한 제 2 클래스 회원들 중 연령이 확인된 회원들의 판매수량을 나타내고,
    상기 수학식을 이용하여 각각의 연령 구간별로 가중평균을 산출하여, WA20, WA30, WA40, WA50, WA60, WA70, WA80의 값을 확보하고, 확보된 값을 기반으로 해당 회원의 연령을 추정하는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 제 1 항에 있어서,
    상기 산출된 각 연령 구간에 대한 가중 평균 확률을 점수화하여 연령 추정 예상 점수를 생성하는 단계를 더 포함하되,
    상기 연령 추정 예상 점수를 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 판단하는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법.
  6. 제 5 항에 있어서,
    상기 산출된 각 연령 구간에 대한 가중 평균 확률 중 하나가 기설정된 임계 확률 이상인 회원들을 추출하는 단계;
    상기 추출된 회원들에 대해서만 그들의 연령을 결정하는 단계를 더 포함하는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법.
  7. 제 6 항에 있어서, 상기 추출된 회원들에 대해서만 그들의 연령을 결정하는 단계는,
    임계 확률을 넘는 가중 평균 확률을 갖는 연령 구간으로 해당 회원의 연령을 결정하는 단계를 포함하는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법.
  8. 제 6 항에 있어서,
    상기 임계 확률은 상기 연령 구간의 수와 상기 복수의 연령 미입력 회원의 비율에 의해 결정되는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법.
  9. 제 6 항에 있어서,
    상기 임계 확률은 임계 확률 결정을 위한 딥 러닝 모델에 의해 결정되되,
    상기 딥 러닝 모델은 학습 데이터에 의해 학습되며,
    상기 학습 데이터는, (i) 상기 산출된 각 연령 구간에 대한 가중평균확률 및 상기 임계확률로 구성된 입력 데이터, 및 (ii) 추후에 연령이 확인된 연령 미입력 회원의 실제 연령으로 구성된 출력 데이터를 포함하는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법.
  10. 제 1 항에 있어서, 상기 산출된 각 연령 구간에 대한 가중평균확률을 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하는 단계는,
    제 1 연령 구간에 대한 가중평균확률과 제 2 연령 구간에 대한 가중평균확률이 임계값 이상 차이가 나는지 비교하는 단계, 여기서, 상기 제 1 연령 구간에 대한 가중평균확률은 가장 높은 값을 갖는 가중 평균 확률이며, 상기 제 2 연령 구간에 대한 가중평균확률은 두번째로 높은 값을 갖는 가중 평균 확률임; 및
    상기 비교 결과를 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하는 단계를 포함하는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법.
  11. 제 1 항에 있어서,
    상기 추정된 연령을 이용하여 상품의 전체 연령 비율에 대응하는 프로모션을 수행하는 단계를 더 포함하는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법.
  12. 전자상거래와 연관된 복수 개의 쇼핑몰의 상품 구매 이력 정보를 획득하여 저장하는 저장부, 상기 상품 구매 이력 정보는 특정 상품에 대한 구매 회원 정보 및 구매 회원이 이전에 구매한 상품에 대한 정보를 포함함; 및
    상기 저장부로부터 상기 구매 이력 정보를 획득하여, 상기 복수 개의 쇼핑몰 중 적어도 하나의 제 1 클래스 상품(a first class product)을 구매한 제 1 클래스 회원들(first class members) 중 연령을 입력하지 않은 복수의 연령 미입력 회원의 연령을 추정하는 프로세서를 포함하되,
    상기 프로세서는, 상기 복수의 연령 미입력 회원 각각의 상기 구매 이력 정보를 이용하여, 해당 회원이 과거 구매한 적어도 하나의 제 2 클래스 상품들(at least one of second class products) 기반의 연령 추정 알고리즘에 의해 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하되,
    상기 프로세서는, 복수의 기준값을 이용하여 연령 구간을 구분하고, 상기 복수의 연령 미입력 회원 각각이 과거 구매한 적어도 하나의 제 2 클래스 상품들을 추출하며, 상기 추출된 적어도 하나의 제 2 클래스 상품들을 구매한 제 2 클래스 회원들(second class members)의 상기 구분된 연령 구간 각각에 속할 확률을 가중평균하여 각 연령 구간에 대한 가중 평균 확률을 산출하고, 상기 산출된 각 연령 구간에 대한 가중 평균 확률을 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하고,
    상기 가중 평균 확률은 WA10(Weighted Average) = (p1*w1 + p2*w2 + ... + pn*wn) / (w1+w2+...wn)을 이용하여 산출하되,
    여기서, WA10은 해당 회원이 10대에 속할 확률에 대한 가중평균치를, i는 상품 인덱스를 의미하고, pi는 상품 i에서의 10대 구간의 연령으로 기확인된 회원들의 비율을, wi은 상품 i에 대한 가중치를 나타내며, 상기 가중치는 각 제 2 클래스 상품에 대한 제 2 클래스 회원들 중 연령이 확인된 회원들의 판매수량을 나타내고,
    상기 수학식을 이용하여 각각의 연령 구간별로 가중평균을 산출하여, WA20, WA30, WA40, WA50, WA60, WA70, WA80의 값을 확보하고, 확보된 값을 기반으로 해당 회원의 연령을 추정하는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 장치.
  13. 삭제
  14. 삭제
  15. 삭제
  16. 제 12 항에 있어서, 상기 프로세서는,
    상기 산출된 각 연령 구간에 대한 가중 평균 확률을 점수화하여 연령 추정 예상 점수를 생성하되,
    상기 연령 추정 예상 점수를 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 판단하는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 장치.
  17. 제 16 항에 있어서, 상기 프로세서는,
    상기 산출된 각 연령 구간에 대한 가중 평균 확률 중 하나가 기설정된 임계 확률 이상인 회원들을 추출하고, 상기 추출된 회원들에 대해서만 그들의 연령을 결정하는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 장치.
  18. 제 17 항에 있어서, 상기 프로세서는,
    임계 확률을 넘는 가중 평균 확률을 갖는 연령 구간으로 해당 회원의 연령을 결정하는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 장치.
  19. 제 17 항에 있어서,
    상기 임계 확률은 상기 연령 구간의 수와 상기 복수의 연령 미입력 회원의 비율에 의해 결정되는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 장치.
  20. 제 17 항에 있어서,
    상기 임계 확률은 임계 확률 결정을 위한 딥 러닝 모델에 의해 결정되되,
    상기 딥 러닝 모델은 학습 데이터에 의해 학습되며,
    상기 학습 데이터는, (i) 상기 산출된 각 연령 구간에 대한 가중평균확률 및 상기 임계확률로 구성된 입력 데이터, 및 (ii) 추후에 연령이 확인된 연령 미입력 회원의 실제 연령으로 구성된 출력 데이터를 포함하는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 장치.
  21. 제 12 항에 있어서, 상기 프로세서는,
    제 1 연령 구간에 대한 가중평균확률과 제 2 연령 구간에 대한 가중평균확률이 임계값 이상 차이가 나는지 비교하고, 상기 비교 결과를 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하되,
    상기 제 1 연령 구간에 대한 가중평균확률은 가장 높은 값을 갖는 가중 평균 확률이며, 상기 제 2 연령 구간에 대한 가중평균확률은 두번째로 높은 값을 갖는 가중 평균 확률인, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 장치.
  22. 제 12 항에 있어서, 상기 프로세서는,
    상기 추정된 연령을 이용하여 상품의 전체 연령 비율에 대응하는 프로모션을 수행하는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 장치.
  23. 전자상거래와 연관된 제 1 쇼핑몰의 상품 구매 회원의 연령 추정 요청을 전송하고 상기 요청에 대응하는 추정 연령 정보를 수신하는 사용자 단말; 및
    상기 사용자 단말로부터의 연령 추정 요청에 대응하여, 전자상거래와 연관된 복수 개의 쇼핑몰의 상품 구매 이력 정보를 획득하여 상기 제 1 쇼핑몰의 제 1 클래스 상품(a first class product)을 구매한 제 1 클래스 회원들(first class members) 중 연령을 입력하지 않은 복수의 연령 미입력 회원의 연령을 추정함에 의해 상기 추정 연령 정보를 생성하여 상기 사용자 단말로 제공하는 상품 구매 회원 연령 추정 장치를 포함하되,
    상기 상품 구매 회원 연령 추정 장치는, 상기 복수의 연령 미입력 회원 각각의 상기 구매 이력 정보를 이용하여, 해당 회원이 과거 구매한 적어도 하나의 제 2 클래스 상품들(at least one of second class products) 기반의 연령 추정 알고리즘에 의해 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하되,
    상기 상품 구매 회원 연령 추정 장치는, 복수의 기준값을 이용하여 연령 구간을 구분하고, 상기 복수의 연령 미입력 회원 각각이 과거 구매한 적어도 하나의 제 2 클래스 상품들을 추출하며, 상기 추출된 적어도 하나의 제 2 클래스 상품들을 구매한 제 2 클래스 회원들(second class members)의 상기 구분된 연령 구간 각각에 속할 확률을 가중평균하여 각 연령 구간에 대한 가중 평균 확률을 산출하고, 상기 산출된 각 연령 구간에 대한 가중 평균 확률을 기반으로 상기 복수의 연령 미입력 회원들 중 적어도 일부의 연령을 추정하고,
    상기 가중 평균 확률은 WA10(Weighted Average) = (p1*w1 + p2*w2 + ... + pn*wn) / (w1+w2+...wn)을 이용하여 산출하되,
    여기서, WA10은 해당 회원이 10대에 속할 확률에 대한 가중평균치를, i는 상품 인덱스를 의미하고, pi는 상품 i에서의 10대 구간의 연령으로 기확인된 회원들의 비율을, wi은 상품 i에 대한 가중치를 나타내며, 상기 가중치는 각 제 2 클래스 상품에 대한 제 2 클래스 회원들 중 연령이 확인된 회원들의 판매수량을 나타내고,
    상기 수학식을 이용하여 각각의 연령 구간별로 가중평균을 산출하여, WA20, WA30, WA40, WA50, WA60, WA70, WA80의 값을 확보하고, 확보된 값을 기반으로 해당 회원의 연령을 추정하는, 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 시스템.
KR1020200019313A 2020-02-17 2020-02-17 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법 및 장치, 및 시스템 KR102329120B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200019313A KR102329120B1 (ko) 2020-02-17 2020-02-17 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법 및 장치, 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200019313A KR102329120B1 (ko) 2020-02-17 2020-02-17 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법 및 장치, 및 시스템

Publications (2)

Publication Number Publication Date
KR20210104495A KR20210104495A (ko) 2021-08-25
KR102329120B1 true KR102329120B1 (ko) 2021-11-19

Family

ID=77495291

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200019313A KR102329120B1 (ko) 2020-02-17 2020-02-17 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법 및 장치, 및 시스템

Country Status (1)

Country Link
KR (1) KR102329120B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220198454A1 (en) * 2020-12-23 2022-06-23 Panasonic Intellectual Property Management Co., Ltd. Checkout system and checkout method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160065429A (ko) * 2014-11-30 2016-06-09 주식회사 알티웍스 하이브리드 개인화 상품추천 방법
KR20180121466A (ko) * 2017-04-06 2018-11-07 네이버 주식회사 딥러닝을 활용한 개인화 상품 추천

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220198454A1 (en) * 2020-12-23 2022-06-23 Panasonic Intellectual Property Management Co., Ltd. Checkout system and checkout method

Also Published As

Publication number Publication date
KR20210104495A (ko) 2021-08-25

Similar Documents

Publication Publication Date Title
JP6152173B2 (ja) 商品検索結果の順位付け
KR101999469B1 (ko) 정보 전달 방법 및 장치, 서버 및 저장 매체
US20170278173A1 (en) Personalized bundle recommendation system and method
WO2020192013A1 (zh) 定向广告投放方法和装置、设备及存储介质
KR102264526B1 (ko) 상품 판매량 예측 방법, 장치 및 시스템
CN111260449B (zh) 一种模型训练的方法、商品推荐的方法、装置及存储介质
US20170243127A1 (en) Graph based techniques for predicting results
US20150317709A1 (en) System and method thereof for effectuating an electronic negotiation between a consumer device and a merchant
KR20200114969A (ko) 거래 이력 데이터의 클러스터링에 기초한 상품 추천 장치 및 방법
KR102319118B1 (ko) 전자상거래와 연관된 쇼핑몰의 상품 진열 업데이트 방법 및 장치
CN111967924A (zh) 商品推荐方法、商品推荐装置、计算机设备和介质
CN106844402B (zh) 数据处理方法及装置
KR102329120B1 (ko) 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 연령 추정 방법 및 장치, 및 시스템
CN110348947B (zh) 对象推荐方法及装置
JP2021531602A (ja) 電子処理プラットフォームで行うユーザ個別の品物に関連する値の演算
US10679176B2 (en) Inventory management based on geographic information of users
US20160307146A1 (en) Rule compression in mean field system
KR102329119B1 (ko) 전자상거래와 연관된 쇼핑몰의 상품을 구매한 회원의 성별 추정 방법 및 장치, 및 시스템
KR102262118B1 (ko) 사용자 맞춤형 추천정보 제공장치 및 제공방법, 이를 실행시키기 위한 프로그램을 기록한 컴퓨터 해독 가능한 기록 매체
CN113778979A (zh) 一种直播点击率的确定方法和装置
WO2020176455A1 (en) System and method for dynamically pricing event tickets
KR102349825B1 (ko) 전자상거래 시스템에서 쇼핑몰 회원의 상품 구매 추천 시점 산출 방법, 장치 및 시스템
KR102372997B1 (ko) 웹사이트별 파라미터 종류 및 기준값 도출 방법, 장치 및 프로그램
KR20230073724A (ko) 인터넷 쇼핑몰의 상품을 구매한 회원의 성별 추정 방법 및 장치
US11418919B1 (en) Method of comparing locations and interactive audiences

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant