KR20240042718A - 고객 선호도 예측에 기반한 상품 마케팅 방법 - Google Patents

고객 선호도 예측에 기반한 상품 마케팅 방법 Download PDF

Info

Publication number
KR20240042718A
KR20240042718A KR1020220121372A KR20220121372A KR20240042718A KR 20240042718 A KR20240042718 A KR 20240042718A KR 1020220121372 A KR1020220121372 A KR 1020220121372A KR 20220121372 A KR20220121372 A KR 20220121372A KR 20240042718 A KR20240042718 A KR 20240042718A
Authority
KR
South Korea
Prior art keywords
website
product
user
products
exposed
Prior art date
Application number
KR1020220121372A
Other languages
English (en)
Inventor
박성배
Original Assignee
주식회사 저스트원더
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 저스트원더 filed Critical 주식회사 저스트원더
Priority to KR1020220121372A priority Critical patent/KR20240042718A/ko
Priority to PCT/KR2023/007760 priority patent/WO2024071568A1/ko
Publication of KR20240042718A publication Critical patent/KR20240042718A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/12Bounding box

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

고객 선호도 예측에 기반한 상품 마케팅 방법이 개시된다. 본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법은, 제1웹사이트 상에서 노출된 제1상품의 이미지를 통해 제2웹사이트로 접속한 접속자의 선호도를 예측하는 단계; 상기 제1상품과, 상기 제1상품의 이미지에 라벨링 된 키워드를 기반으로 예측부가 선호도를 예측하여, 상기 제1상품과는 다른 제N상품을 상기 제2웹사이트에 추가로 노출하는 단계; 상기 사용자의 행동 패턴을 제1패턴과 제2패턴으로 구분하여 분석하는 제1분석단계; 상기 선호도를 검증하는 제2분석단계;를 포함하며, 상기 제2분석단계는, 상기 제2웹사이트에 노출되었으며 상기 사용자가 선택한 상품의 수와, 상기 제2웹사이트에 노출되었지만 상기 사용자가 선택하지 않은 상품의 수와, 상기 제2웹사이트에 노출되지 않았지만 상기 사용자가 선택한 상품의 수를 기반으로, 상기 선호도를 검증하며, 상기 선호도는 아래의 [수학식 1]을 통해 결정되는 것을 특징으로 한다.
[수학식 1]

여기서, H는 선호도, A는 상기 제2웹사이트에 노출되었으며 상기 사용자가 선택한 상품의 수, B는 제2웹사이트에 노출되었지만 상기 사용자가 선택하지 않은 상품의 수, C는 상기 제2웹사이트에 노출되지 않았지만 상기 사용자가 선택한 상품의 수를 각각 의미한다.

Description

고객 선호도 예측에 기반한 상품 마케팅 방법{METHOD FOR PRODUCTS MARKETING BASED ON PREDICTING CUSTOMER PREFERENCE}
본 발명은 상품 마케팅 방법에 관한 것으로서, 보다 상세하게는, 고객의 선호도를 예측하고 이를 기반으로 하여 상품들을 웹사이트에 노출하여 마케팅 효과를 극대화하는 고객 선호도 예측에 기반한 상품 마케팅 방법에 관한 것이다.
최근 4차 산업혁명으로의 전환(Digital Transformation)이 코로나-19와 같은 펜데믹으로 인해 디지털화가 급가속화 되고 있다. 펜데믹으로 인해 비대면 수요가 급증하고 있으며, 이에 따라 이커머스의 수요 증가, 소비자 요구의 증가가 연쇄적으로 이루어지고 있다.
이러한 현상으로 인해 상품의 수요에 영향을 끼치는 요인이 매우 많고, 소비자 요구의 변화 주기도 매우 짧아지고 있어 상품 제공자들의 대응이 어려운 실정이다. 나아가 원/부자재 수급의 불확실성으로 인해 시장의 요구에 즉각적 대응이 어려운 실정이다.
시장의 급변화로 인해 상품의 수요 예측에 실패하는 경우, 예측치가 실제 결과와 맞지 않아 재고 처리에 문제가 생길 수 있으며 이는 상품 제공자(판매자)들에게 막대한 손해가 된다.
따라서, 사용자의 선호도를 예측하여 판매가 예상되는 상품들을 위주로 마케팅을 하고, 해당 상품 위주로 제조/생산을 할 수 있도록 하여 소비자와 판매자 모두에게 도움이 되는 시스템의 개발이 필요한 실정이다.
대한민국 공개특허 제10-2021-0131767호 "고객 선호도에 기초한 상품 매칭 방법과 제안할 상품들을 표시하는 방법 및 이들을 이용한 타겟 마케팅 시스템" 대한민국 등록특허 제10-1818618호 "빅데이터를 이용한 전자상거래 구매예측 통합솔루션시스템"
본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법은, 웹사이트에 접속하는 고객의 선호도를 예측하여, 고객의 선호에 따른 상품 위주로 노출되도록 함으로써, 마케팅 효과를 극대화하는 고객 선호도 예측에 기반한 상품 마케팅 방법을 제공하는 것을 목적으로 한다.
본 발명의 과제들은 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법은, 제1웹사이트 상에서 노출된 제1상품의 이미지를 통해 제2웹사이트로 접속한 접속자의 선호도를 예측하는 단계; 상기 제1상품과, 상기 제1상품의 이미지에 라벨링 된 키워드를 기반으로 예측부가 선호도를 예측하여, 상기 제1상품과는 다른 제N상품을 상기 제2웹사이트에 추가로 노출하는 단계; 상기 사용자의 행동 패턴을 제1패턴과 제2패턴으로 구분하여 분석하는 제1분석단계; 상기 선호도를 검증하는 제2분석단계;를 포함하며, 상기 제2분석단계는, 상기 제2웹사이트에 노출되었으며 상기 사용자가 선택한 상품의 수와, 상기 제2웹사이트에 노출되었지만 상기 사용자가 선택하지 않은 상품의 수와, 상기 제2웹사이트에 노출되지 않았지만 상기 사용자가 선택한 상품의 수를 기반으로, 상기 선호도를 검증하며, 상기 선호도는 아래의 [수학식 1]을 통해 결정되는 것을 특징으로 한다.
여기서, H는 선호도, A는 상기 제2웹사이트에 노출되었으며 상기 사용자가 선택한 상품의 수, B는 제2웹사이트에 노출되었지만 상기 사용자가 선택하지 않은 상품의 수, C는 상기 제2웹사이트에 노출되지 않았지만 상기 사용자가 선택한 상품의 수를 각각 의미한다.
여기서, 상기 제1 내지 상기 제N상품에 대한 사용자의 평가 점수와, 상기 제1 내지 상기 제N상품에 대한 예측 평가 점수인 예측 점수를 수신하여, 상기 평가 점수와 예측 점수 간의 오차 연산을 위한 제 1 손실함수 및 상기 제 1 손실함수와 상이한 오차 연산을 위한 제 2 손실함수의 조합을 기반으로 최적화를 분석하는 제3분석단계;를 더 포함할 수 있다.
여기서, 상기 제3분석단계는, 상기 제1분석단계와 상기 제2분석단계의 결과가 상이한 경우 상기 제1분석결과를 우선할 수 있다.
여기서, 웹사이트로부터 텍스트 데이터를 수집하는 단계; 상기 텍스트 데이터를 형태소 별로 구분하는 단계; 상기 형태소를 정규화하고 자연어 처리를 한 뒤 명사와 형용사를 추출하는 단계; TF-IDF 기법을 적용하여 키워드를 도출하는 단계;를 포함하는 텍스트 전처리단계;를 더 포함할 수 있다.
여기서, 이미지 처리 장치가 라벨링 된 다수의 이미지를 훈련 데이터로서 입력받아 분류기(classifier)를 학습시킴으로써 분류 모델을 생성하는 단계; 상기 이미지 처리 장치가 대상 이미지를 입력받는 단계; 상기 이미지 처리 장치가 입력된 상기 대상 이미지로부터 적어도 하나의 객체를 추출하는 단계; 추출된 상기 객체에 대한 바운딩 박스(bounding box)를 제안하는 영역 제안 네트워크(region proposal network, RPN)로부터 관심 영역(region of interest, ROI)를 얻는 단계; 상기 관심 영역 내에 포함된 객체에 대해 상기 키워드를 라벨링 하는 단계;를 더 포함하는 이미지 전처리 단계;를 더 포함할 수 있다.
여기서, 상기 예측하는 단계는, 상기 제2분석단계에서 분석된 선호도와 상기 키워드를 매칭하여 가중치를 부가하며, 상기 제2 내지 제N상품은 상기 가중치가 부가된 상기 키워드를 기준으로 갱신될 수 있다.
본 발명의 실시예들에 의하면 적어도 다음과 같은 효과가 있다.
본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법에 의하면, 웹사이트에 접속하는 고객의 선호도를 예측하여, 고객의 선호에 따른 상품 위주로 노출되도록 함으로써, 마케팅 효과를 극대화할 수 있다.
또한, 상품 판매자도 고객이 선호하는 상품 위주로 생산/판매할 수 있어, 원/부자재 수급이 어려운 상황에서도 효율적으로 상품을 생산하여 판매할 수 있다.
또한, 다단계의 검증을 통해 고객 선호도 예측 결과가 우수하다.
본 발명에 따른 효과는 이상에서 예시된 내용에 의해 제한되지 않으며, 더욱 다양한 효과들이 본 명세서 내에 포함되어 있다.
도 1은 본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법의 순서도
도 2는 본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법의 텍스트 전처리 단계의 순서도
도 3은 본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법의 텍스트 전처리 단계의 구조도
도 4는 본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법의 이미지 전처리 단계의 순서도
도 5는 본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법의 이미지 전처리 단계의 구조도
도 6은 본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법의 개략적인 구조도이다.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예를 도면에 예시하고 이에 대해 상세한 설명에 상세하게 설명한다. 본 발명의 효과 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시예를 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예에 한정되는 것이 아니라 다양한 형태로 구현될 수 있으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
설명에 앞서 상세한 설명에 기재된 용어에 대해 설명한다. 이하의 실시예에서, 제1, 제2 등의 용어는 한정적인 의미가 아니라 하나의 구성 요소를 다른 구성 요소와 구별하는 목적으로 사용되었다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다. 또한, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 또한, '포함하다' 또는 '가지다' 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 의미하는 것이고, 하나 이상의 다른 특징들 또는 구성요소가 부가될 가능성을 미리 배제하는 것은 아니다.
또한, 도면에서는 설명의 편의를 위하여 구성 요소들이 그 크기가 과장 또는 축소될 수 있다. 예컨대, 도면에서 나타난 각 구성의 크기 및 두께는 설명의 편의를 위해 임의로 나타내었으므로, 본 발명이 반드시 도시된 바에 한정되지 않는다.
이하, 본 발명에 따른 일 실시예를 첨부된 도면을 참조하여 상세히 설명한다. 첨부 도면을 참조하여 설명함에 있어, 동일하거나 대응하는 구성요소는 동일한 도면 부호를 부여하고 이에 대해 중복되는 설명은 생략한다.
본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅에 관한 것으로서, 보다 상세하게는, 고객의 선호도를 예측하고 이를 기반으로 하여 상품들을 웹사이트에 노출하여 마케팅 효과를 극대화하는 고객 선호도 예측에 기반한 상품 마케팅 방법에 관한 것이다.
도 1은 본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법의 순서도이다.
본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법(S1000)은, 데이터 전처리 단계(S100)와, 선호도 예측 단계(S200)와, 광고 단계(S300)와, 제1분석단계(S400)와 제2분석단계(S500) 및 제3분석단계(S600)를 포함한다.
데이터 전처리 단계(S100)는 접속자의 선호도를 예측하기 위해 데이터들을 수집하여 처리하는 단계이다.
도 2는 본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법의 텍스트 전처리 단계의 순서도이며, 도 3은 본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법의 텍스트 전처리 단계의 구조도이다.
본 실시예에서 제1웹사이트는 사용자(판매자)가 운영하는 웹사이트가 아닌 웹사이트를 의미한다. 즉 사용자가 상품을 판매하는 사이트가 아닌 웹사이트이다. 제1웹사이트는 사용자가 자신의 상품 중 어느 하나가 광고로 노출되는 사이트를 포함한다. 그리고 제2웹사이트는 사용자가 운영하는 웹사이트를 의미한다.
데이터 전처리 단계(S100)는 텍스트 전처리 단계(S110)와 이미지 전처리 단계(S120)를 포함한다.
텍스트 전처리 단계(S110)는 제1웹사이트와 제2웹사이트로부터 텍스트 데이터를 수집하고 이로부터 키워드를 도출하는 단계이다. 텍스트 전처리 단계(S110)는 데이터 수집단계(S111)와, 정규화 단계(S112)와, 토큰화 단계(S113)와, 자연어 처리 단계(S114) 및 키워드 추출 단계(S115)를 포함한다.
데이터 수집단계(S111)에서 크롤러는 제1웹사이트와 제2웹사이트에서 텍스트 데이터들을 수집한다. 포털 사이트, 유튜브, SNS 등의 웹사이트와 사용자가 상품을 판매하는 사이트 등 다양한 웹사이트로부터 크롤링을 통해 텍스트들을 수집한다. 여기서 텍스트는 제품 정보, 가격 정보, 영상 자막 정보, 댓글 정보, 태그 정보 등 다양한 정형/비정형 데이터이다. 수집된 텍스트 데이터들은 데이터 수집부(110)에 저장된다.
정규화 단계(S112)에서 정규화부(120)는 데이터 수집부(110)에 저장된 텍스트들로부터 쓸모없는 불용어를 제거한다 예를 들어 특수 문자(-, + 등)와 같은 구문을 제거한다.
그리고 토큰화 단계(S113)에서, 토큰화부(130)는 정규화부(120)에서 정규화 처리 된 텍스트들에 대해 형태소 단위로 토큰화 처리를 수행한다. 이 때 토큰화부(130)는 형태소이지만 한 단어로 이루어진 의존명사(예컨대, '것', '수', '때' 등)를 제외한다.
자연어 처리 단계(S114)에서 자연어 처리부(140)는 자연어를 처리하는 구문 분석기인 자연어 처리 파서(Parser)를 사용하여 각각의 토큰에 품사를 붙이는 품사(Part of Speech, POS) 태깅을 수행한다.
즉 태깅을 수행하여 정규화 처리 및 형태소 단위로 토큰화 처리가 수행 된 텍스트들에 대해 품사 태깅을 수행한 뒤, 명사와 형용사들만 데이터베이스에 저장한다.
키워드 추출 단계(S115)에서 키워드 추출부(150)는 데이터베이스에 저장된 형태소들로부터 키워드를 추출한 뒤 저장한다. 키워드 추출부(150)는 키워드 추출을 위해 TF-IDF 알고리즘을 사용한다. TF-IDF 알고리즘이란 사용자들이 작성한 문서들이 있을 때 특정 단어가 특정 문서 내에서 얼마나 중요한 지를 수치적으로 나타내기 위한 알고리즘이다. TF-IDF 알고리즘은 공지된 것이므로 자세한 설명은 생략한다.
즉, 해당 키워드는 크롤링 된 텍스트 내에서 중요한 비중을 차지하는 단어들이다.
이미지 전처리 단계(S120)는 제1웹사이트와 제2웹사이트로부터 이미지 데이터를 수집하여, 이미지 내에 포함된 상품 객체를 추출한 뒤 라벨링 하는 단계이다.
도 4는 본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법의 이미지 전처리 단계의 순서도이며, 도 5는 본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법의 이미지 전처리 단계의 구조도이다.
이미지 전처리 단계(S120)는 분류 모델 생성단계(S121)와, 이미지 데이터 수집 단계(S122)와, 객체 추출단계(S123)와, 관심 영역 획득 단계(S124) 및 라벨링 단계(S125)를 포함한다.
분류 모델 생성부(220)는 라벨링 된 다수의 이미지를 훈련 데이터로서 입력받아 분류기(classifier)를 학습시킴으로써 분류 모델을 생성한다.
분류 모델은 이미지 분류 알고리즘을 기초로 설계된 신경망의 입력 레이어에 학습 데이터에 포함된 이미지가 입력되도록 설정하고, 출력 레이어에 이미지 각각이 나타내는 상품이 라벨링된 클래스가 입력되도록 설정하고, 신경망의 가중치를 학습시켜 신경망을 생성할 수 있다.
이러한 이미지 분류 알고리즘은 인공 지능 분야에서 다루는 다양한 문제를 정의하고 그것을 해결하는 머신러닝 알고리즘을 포함한다. 본 발명의 실시예는 ResNet 알고리즘에 따라 설계된 인공지능 모델을 통해 학습을 진행할 수 있다. ResNet은 Deep neural networks 일수록 더 학습하기 어렵다는 문제를 인식하고 이를 해결하기 위해 만들어진 것으로, 이전의 학습 방법들과 달리 residual(잔차)을 학습하는 방법으로 Deep neural networks를 이전보다 더 쉽게 학습시키도록 구성된 것이다.
이미지 데이터 수집단계(S111)는 위 텍스트 데이터 수집단계(S111)와 같이 웹사이트 상에서 이미지 데이터를 수집할 수 있다. 수집된 텍스트 데이터들은 데이터 수집부(110)에 저장된다.
객체 추출부(230)는 데이터 수집부(110)에 저장된 이미지 데이터에 대해 객체 추출을 수행한다. 이미지 데이터는 복수 개의 상품 객체를 포함할 수 있다. 이때, 추출된 객체가 미리 학습된 분류 모델에 존재할 경우 분류 작업을 진행할 수 있으며, 이는 통상적인 지도 학습 방식에 따른 객체 분할 및 분류에 해당한다. 그런데, 만약 추출된 객체가 분류 모델에 존재하지 않는 경우 비지도 학습을 수행하게 된다.
객체 추출부(230)는 입력된 이미지로부터 적어도 하나의 객체를 추출한다. 보다 구체적으로, 이미지를 학습시켜 이미지 내의 객체와 배경을 구별하여 배경을 삭제하고 객체만을 인식하여 객체 정보만을 추출하는 배경 제거 과정이 수행될 수 있다.
관심 영역 획득 단계에서, 관심 영역 획득부(240)는 객체 추출부(230)에 의해 추출된 객체에 대한 바운딩 박스(bounding box)를 제안하는 영역 제안 네트워크(region proposal network, RPN)로부터 관심 영역(region of interest, ROI)를 얻는다.
관심 영역이 획득되면, 라벨링부(250)에 의해 관심 영역에 포함된 상품 객체에 대한 라벨링이 수행된다. 라벨링은 데이터 전처리 단계(S100)에서 추출된 키워드를 통해 수행된다. 즉, 키워드는 웹사이트에서 수집된 텍스트 중 상품에 대해 중요한 비중을 차지하는 단어들이며, 해당 단어들을 이용하여 각각의 이미지에 대해 라벨링이 된다. 라벨링되는 키워드의 수는 제한되지 않는다. 즉 1개의 이미지에 대해 다수의 키워드들이 라벨링될 수 있음은 물론이다. 라벨링된 이미지 데이터들은 데이터베이스에 저장된다.
선호도 예측 단계(S200)는 제1웹사이트 상에 노출된 제1상품의 광고를 통해 제2웹사이트로 접속한 접속자의 선호도를 예측하는 단계이다.
제1웹사이트는 포털 사이트, 유튜브, SNS 등의 웹사이트와 사용자가 상품을 판매하는 사이트와 관련이 없는 사이트이다. 제1웹사이트는 사용자가 자신의 상품 중 어느 하나가 광고로 노출되는 사이트를 포함한다.
제1상품은 사용자가 판매하는 상품 중 하나이다. 제1상품의 이미지는 제1웹사이트에 광고 등을 통해 노출되며, 소비자가 제1웹사이트에 노출된 제1상품 이미지를 클릭하면 제2웹사이트로 접속된다. 제2웹사이트는 사용자가 상품을 판매하거나 광고하는 웹사이트이다.
본 실시예에서 제2웹사이트는 랜딩 페이지일 수 있다. 랜딩 페이지는 사용자에게 특정 액션을 유도하는 페이지이다. 소비자가 검색엔진이나 광고 등을 통해 처음으로 보게 되는 페이지이기 때문에, 랜딩(Landing:착륙) 페이지라고 한다.
제1상품 이미지를 클릭하여 제2웹사이트로 접속한 접속자는 제1상품에 관심이 있기 때문에 접속하였다는 것이 가정된다.
이에 따라 제1상품과 관련이 있는 제2상품의 이미지를 제1상품 이미지와 함께 제2웹사이트에 함께 개시한다. 이는 구체적으로 예측부(300)가 제1상품에 라벨링 된 키워드를 통해 선호도를 분석한다. 제1상품에 라벨링 된 키워드 중 하나 이상과 동일한 키워드를 포함하는 제2상품에 대해서 접속자의 선호도가 있음을 가정하고, 이 중 선호도가 가장 높을 것으로 예측되는 상품의 이미지를 제2웹사이트에 개시한다. 이는 중복되는 키워드의 개수일 수 있다.
이 후 선호도는 분석부(400)에 의해 분석되어 수정될 수 있으며 예측부(300)는 이를 수신하여 다음 선호도 예측 시 이를 반영한다.
만일 접속자가 제2상품의 이미지를 클릭하면, 제3상품의 이미지도 함께 제2웹사이트에 개시한다. 제3상품 이미지의 선정 기준 또한 제2상품 이미지와 동일하다. 이렇게 제N상품 이미지까지 노출시킬 수 있다.
또는 제2 내지 제N상품을 한 번에 노출시킬 수 도 있다. N개의 상품 또한 중복되는 키워드의 개수로부터 산출될 수 있다.
도 6은 본 발명의 일 실시예에 따른 고객 선호도 예측에 기반한 상품 마케팅 방법의 개략적인 구조도이다.
분석단계는 접속자의 행동 패턴을 분석하여 선호도를 검증하는 단계이다. 분석단계는 제1분석단계(S400)와 제2분석단계(S500) 및 제3분석단계(S600)를 포함한다.
제1분석단계(S400)는 분석부(400)가 접속자의 행동 패턴을 제1패턴과 제2패턴으로 구분한다. 여기서 제1패턴은 사용자가 해당 웹사이트를 이탈하는 행동을 의미하며, 제2패턴은 사용자가 상품을 구매하거나, 관심을 표현하는 등 웹사이트를 이탈하지 않는 행동을 의미한다. 제1패턴은 선호도 선정 시 고려하지 않는다. 웹사이트 이탈에 여러 요인이 있기 때문에 정확도에 문제가 발생할 수 있기 때분이다.
제2분석단계(S500)는 접속자의 제2패턴과 제2웹사이트에 노출된 상품의 수로부터 선호도를 검증하는 단계이다.
분석부(400)는 기 확보된 데이터를 분석 및 예측하여 선호도를 결정할 수 있다. 구체적으로 선호도는 아래의 수학식을 통해 결정된다.
여기서, H는 선호도, A는 상기 제2웹사이트에 노출되었으며 상기 사용자가 선택한 상품의 수, B는 제2웹사이트에 노출되었지만 상기 사용자가 선택하지 않은 상품의 수, C는 상기 제2웹사이트에 노출되지 않았지만 상기 사용자가 선택한 상품의 수를 각각 의미한다.
H값이 높을수록 해당 상품에 대한 선호도가 높음을 의미한다.
즉, 제2분석단계(S500)는, 키워드를 기반으로 하여 선호도가 높을 것으로 예측되어 제2웹사이트에 노출된 실제 구매된 사움의 정보 및 개수로부터 선호도를 검증하여, 선호도가 낮은 상품으로 분류되면 해당 키워드는 선호도 분석 시 제외한다.
제3분석단계(S600)는 상품에 대한 사용자의 평가 점수와, 예측 평가 점수로부터 선호도의 최적화를 분석하는 단계이다.
분석부(400)는 제2웹사이트로부터 상품에 대한 사용자의 평가 점수를 수신한다. 그리고 상품에 대해 기 부여된 평가 점수들로부터 예측 평가 점수인 예측 점수를 산출한다.
이 후, 평가 점수와 예측 점수 간의 오차 연산을 위한 제1손실함수 및 제2손실함수의 조합을 기반으로 최적화를 분석한다. 본 실시예에서 제1손실함수는 평균 제곱 오차(mean squared error, MSE)를 연산하기 위한 손실함수를 포함할 수 있다. 제2손실함수는 평균 절대 오차(mean absolute error, MAE)를 연산하기 위한 손실함수를 포함할 수 있다.
제1손실함수는 다음과 같다
제2손실함수는 다음과 같다
여기서, n은 접속자 수, m은 실제 평점이 부여된 상품 수, ri,j는 상품에 대한 실제 평점, pi,j는 상품에 대한예상 평점, k는 총 상품 수 이다.
그리고 분석부(400)는 제2분석단계(S500)의 결과와 제3분석단계(S600)의 결과를 상호 비교한다. 만일 제2분석단계(S500)와 제3분석단계(S600)의 결과가 상이한 경우 상기 제2분석단계(S500)의 결과를 우선한다. 이는 실제 판매되는 것이 평가 점수보다 더 정확도가 높을 것이란 점을 반영한 것이다.
제2분석단계(S500)와 제3분석단계(S600)의 결과가 동일한 경우, 중복된 키워드에 대해서는 가중치를 부여한다.
상술한 분석단계에서 분석된 결과는 예측부(300)로 전송된다.
구체적으로 분석단계에서 제1상품 이미지에 대응하여 노출된 제2상품 이미지에 대해 선호도가 높은 것으로 검증된 경우, 해당 키워드에 대해 가중치를 부가한다. 가중치는 중복된 횟수가 많은 키워드 순으로 높은 가중치를 부여하여 예측부(300)에서 선호도 예측 시 이를 반영한다.
예를 들어 제1상품의 이미지에 대해 라벨링 된 다수 개의 키워드 중, 제2상품의 이미지에 대해 라벨링 된 다수 개의 키워드와 일치하는 경우 해당 제1상품의 이미지와 제2상품의 이미지의 해당 키워드에 대해서는 가중치를 부가한다.
예측부(300)는 해당 가중치를 반영된 키워드를 기반으로 하여, 제2 내지 제N상품을 갱신하며, 제1상품 이미지를 클릭하여 제2웹사이트로 접속한 접속자에 대해서는, 해당 키워드를 포함하는 상품 이미지를 우선적으로 노출시킨다.
이를 통해 웹사이트에 노출되는 상품들이 접속자들에게 선호도가 높으며 이는 구매로 이어질 가능성이 크기 때문에 마케팅 효과가 뛰어나다. 나아가 판매자도 해당 상품 위주로 생산/판매할 수 있어, 원/부자재 수급이 어려운 상황에서도 효율적으로 상품을 생산하여 판매할 수 있다.
상술한 바와 같이 본 발명에 의하면 고객의 선호도를 예측하고 이를 기반으로 하여 상품들을 웹사이트에 노출하여 마케팅 효과를 극대화하는 고객 선호도 예측에 기반한 상품 마케팅 방법이 제공된다.
본 발명에서 모든 예들 또는 예시적인 용어(예를 들어, 등등)의 사용은 단순히 본 발명을 상세히 설명하기 위한 것으로서 청구범위에 의해 한정되지 않는 이상 상기 예들 또는 예시적인 용어로 인해 본 발명의 범위가 한정되는 것은 아니다. 또한 해당 기술 분야의 통상의 기술자는 다양한 수정, 조합 및 변경이 부가된 청구범위 또는 그 균등물의 범주 내에서 설계 조건 및 팩터(factor)에 따라 구성될 수 있음을 알 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 청구범위 뿐만 아니라, 이 청구범위와 균등한 또는 이로부터 등가적으로 변경된 모든 범위는 본 발명의 사상의 범주에 속한다고 할 것이다.
S1000 : 고객 선호도 예측에 기반한 상품 마케팅 방법
S100 : 데이터 전처리 단계 S200 : 선호도 예측 단계
S300 : 광고 노출 단계 S400 : 제1분석단계
S500 : 제2분석단계 S600 : 제1분석단계

Claims (6)

  1. 제1웹사이트 상에서 노출된 제1상품의 이미지를 통해 제2웹사이트로 접속한 접속자의 선호도를 예측하는 단계;
    상기 제1상품과, 상기 제1상품의 이미지에 라벨링 된 키워드를 기반으로 예측부가 선호도를 예측하여, 상기 제1상품과는 다른 제N상품을 상기 제2웹사이트에 추가로 노출하는 단계;
    상기 사용자의 행동 패턴을 제1패턴과 제2패턴으로 구분하여 분석하는 제1분석단계;
    상기 선호도를 검증하는 제2분석단계;를 포함하며,
    상기 제2분석단계는,
    상기 제2웹사이트에 노출되었으며 상기 사용자가 선택한 상품의 수와,
    상기 제2웹사이트에 노출되었지만 상기 사용자가 선택하지 않은 상품의 수와,
    상기 제2웹사이트에 노출되지 않았지만 상기 사용자가 선택한 상품의 수를 기반으로, 상기 선호도를 검증하며,
    상기 선호도는 아래의 [수학식 1]을 통해 결정되는 것을 특징으로 하는
    고객 선호도 예측에 기반한 상품 마케팅 방법.
    [수학식 1]

    여기서, H는 선호도, A는 상기 제2웹사이트에 노출되었으며 상기 사용자가 선택한 상품의 수, B는 제2웹사이트에 노출되었지만 상기 사용자가 선택하지 않은 상품의 수, C는 상기 제2웹사이트에 노출되지 않았지만 상기 사용자가 선택한 상품의 수를 각각 의미한다.
  2. 제1항에 있어서,
    상기 제1 내지 상기 제N상품에 대한 사용자의 평가 점수와, 상기 제1 내지 상기 제N상품에 대한 예측 평가 점수인 예측 점수를 수신하여,
    상기 평가 점수와 예측 점수 간의 오차 연산을 위한 제 1 손실함수 및 상기 제 1 손실함수와 상이한 오차 연산을 위한 제 2 손실함수의 조합을 기반으로 최적화를 분석하는 제3분석단계;를 더 포함하는
    고객 선호도 예측에 기반한 상품 마케팅 방법.
  3. 제2항에 있어서,
    상기 제3분석단계는,
    상기 제1분석단계와 상기 제2분석단계의 결과가 상이한 경우 상기 제1분석결과를 우선하는
    고객 선호도 예측에 기반한 상품 마케팅 방법.
  4. 제3항에 있어서,
    웹사이트로부터 텍스트 데이터를 수집하는 단계;
    상기 텍스트 데이터를 형태소 별로 구분하는 단계;
    상기 형태소를 정규화하고 자연어 처리를 한 뒤 명사와 형용사를 추출하는 단계;
    TF-IDF 기법을 적용하여 키워드를 도출하는 단계;를 포함하는 텍스트 전처리단계;를 더 포함하는
    고객 선호도 예측에 기반한 상품 마케팅 방법.
  5. 제4항에 있어서,
    이미지 처리 장치가 라벨링 된 다수의 이미지를 훈련 데이터로서 입력받아 분류기(classifier)를 학습시킴으로써 분류 모델을 생성하는 단계;
    상기 이미지 처리 장치가 대상 이미지를 입력받는 단계;
    상기 이미지 처리 장치가 입력된 상기 대상 이미지로부터 적어도 하나의 객체를 추출하는 단계;
    추출된 상기 객체에 대한 바운딩 박스(bounding box)를 제안하는 영역 제안 네트워크(region proposal network, RPN)로부터 관심 영역(region of interest, ROI)를 얻는 단계;
    상기 관심 영역 내에 포함된 객체에 대해 상기 키워드를 라벨링 하는 단계;를 더 포함하는 이미지 전처리 단계;를 더 포함하는
    고객 선호도 예측에 기반한 상품 마케팅 방법.
  6. 제5항에 있어서,
    상기 예측하는 단계는,
    상기 제2분석단계에서 분석된 선호도와 상기 키워드를 매칭하여 가중치를 부가하며,
    상기 제2 내지 제N상품은 상기 가중치가 부가된 상기 키워드를 기준으로 갱신되는
    고객 선호도 예측에 기반한 상품 마케팅 방법.
KR1020220121372A 2022-09-26 2022-09-26 고객 선호도 예측에 기반한 상품 마케팅 방법 KR20240042718A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020220121372A KR20240042718A (ko) 2022-09-26 2022-09-26 고객 선호도 예측에 기반한 상품 마케팅 방법
PCT/KR2023/007760 WO2024071568A1 (ko) 2022-09-26 2023-06-07 고객 선호도 예측에 기반한 상품 마케팅 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220121372A KR20240042718A (ko) 2022-09-26 2022-09-26 고객 선호도 예측에 기반한 상품 마케팅 방법

Publications (1)

Publication Number Publication Date
KR20240042718A true KR20240042718A (ko) 2024-04-02

Family

ID=90478209

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220121372A KR20240042718A (ko) 2022-09-26 2022-09-26 고객 선호도 예측에 기반한 상품 마케팅 방법

Country Status (2)

Country Link
KR (1) KR20240042718A (ko)
WO (1) WO2024071568A1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101818618B1 (ko) 2016-02-25 2018-01-15 주식회사 셀팅 빅데이터를 이용한 전자상거래 구매예측 통합솔루션시스템
KR20210131767A (ko) 2020-04-24 2021-11-03 주식회사 글로씨 고객 선호도에 기초한 상품 매칭 방법과 제안할 상품들을 표시하는 방법 및 이들을 이용한 타겟 마케팅 시스템

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8930294B2 (en) * 2012-07-30 2015-01-06 Hewlett-Packard Development Company, L.P. Predicting user activity based on usage data received from client devices
KR101508647B1 (ko) * 2013-07-24 2015-04-17 강호남 모바일 앱 및 웹 기반의 광고솔루션 시스템 및 그 방법
KR102147649B1 (ko) * 2018-06-18 2020-08-26 주식회사 레이니가든 상품 정보 제공 방법 및 장치
KR102175479B1 (ko) * 2018-11-29 2020-11-06 이미경 소비자 행동분석 기반의 맞춤형 마케팅 제공 장치 및 방법
KR102474747B1 (ko) * 2020-07-06 2022-12-05 아주대학교산학협력단 사용자 행동 패턴에 기초하여 상품을 추천하고 추천 상품에 대한 사용자의 선호도 예측 장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101818618B1 (ko) 2016-02-25 2018-01-15 주식회사 셀팅 빅데이터를 이용한 전자상거래 구매예측 통합솔루션시스템
KR20210131767A (ko) 2020-04-24 2021-11-03 주식회사 글로씨 고객 선호도에 기초한 상품 매칭 방법과 제안할 상품들을 표시하는 방법 및 이들을 이용한 타겟 마케팅 시스템

Also Published As

Publication number Publication date
WO2024071568A1 (ko) 2024-04-04

Similar Documents

Publication Publication Date Title
Liu et al. Assessing product competitive advantages from the perspective of customers by mining user-generated content on social media
Ghose et al. Modeling consumer footprints on search engines: An interplay with social media
US8306962B1 (en) Generating targeted paid search campaigns
Antonio et al. Hotel online reviews: creating a multi-source aggregated index
JP2009521750A (ja) コンテキストを決定するためのコンテンツの分析およびコンテキストに基づく関係のあるコンテンツの供給
Qiao et al. Finding competitive keywords from query logs to enhance search engine advertising
JP2022035314A (ja) 情報処理装置及びプログラム
Devasia et al. Feature extracted sentiment analysis of customer product reviews
Ghabayen et al. Polarity analysis of customer reviews based on part-of-speech subcategory
CN107291686B (zh) 情感标识的辨识方法和情感标识的辨识系统
CN115794898B (zh) 一种金融资讯推荐方法、装置、电子设备及存储介质
Sangeetha et al. Comparison of sentiment analysis on online product reviews using optimised RNN-LSTM with support vector machine
CN115828914A (zh) 一种考虑用户属性偏好的满意度评估方法
Doo et al. Automated product review collection and opinion analysis methods for efficient business analysis
US20240062264A1 (en) Ai- backed e-commerce for all the top rated products on a single platform
KR20240042718A (ko) 고객 선호도 예측에 기반한 상품 마케팅 방법
Wang et al. CA-CD: context-aware clickbait detection using new Chinese clickbait dataset with transfer learning method
Rustagi et al. Toward sarcasm detection in reviews—a dual parametric approach with emojis and ratings
Jishtu et al. Prediction of the stock market based on machine learning and sentiment analysis
Xu et al. A Feature-Based Sentence Model for Evaluation of Similar Online Products 1
Khant et al. Analysis of Financial News Using Natural Language Processing and Artificial Intelligence
Gupta et al. IITP at IJCNLP-2017 task 4: Auto analysis of customer feedback using CNN and GRU network
Gollagi et al. Recursive Feature Elimination based Multi-variate Naïve Bayes Classification for Product Recommendation
Cherian et al. A comparative analysis of machine learning and deep learning techniques for aspect-based sentiment analysis
KR102625347B1 (ko) 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템