KR20190010173A - 사용자 의도 프로파일링 방법 및 이를 위한 장치 - Google Patents

사용자 의도 프로파일링 방법 및 이를 위한 장치 Download PDF

Info

Publication number
KR20190010173A
KR20190010173A KR1020170092567A KR20170092567A KR20190010173A KR 20190010173 A KR20190010173 A KR 20190010173A KR 1020170092567 A KR1020170092567 A KR 1020170092567A KR 20170092567 A KR20170092567 A KR 20170092567A KR 20190010173 A KR20190010173 A KR 20190010173A
Authority
KR
South Korea
Prior art keywords
item
keyword
user
intention
interest
Prior art date
Application number
KR1020170092567A
Other languages
English (en)
Other versions
KR102472572B1 (ko
Inventor
황영숙
이춘오
장우혁
장윤석
Original Assignee
십일번가 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 십일번가 주식회사 filed Critical 십일번가 주식회사
Priority to KR1020170092567A priority Critical patent/KR102472572B1/ko
Priority to US16/038,402 priority patent/US20190026760A1/en
Priority to CN201810796436.4A priority patent/CN109285023A/zh
Publication of KR20190010173A publication Critical patent/KR20190010173A/ko
Application granted granted Critical
Publication of KR102472572B1 publication Critical patent/KR102472572B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F17/27
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

사용자 의도 프로파일링 방법 및 이를 위한 장치가 개시된다. 온라인 사이트에 접속한 사용자의 온라인 행동에 대해 실시간으로 수집된 로그를 기반으로 행동 데이터를 생성하고, 행동 데이터를 기반으로 사용자의 구매의도와 관심 아이템을 파악하고, 온라인 사이트에 등록된 복수개의 아이템들을 기반으로 생성된 아이템 모델과 관심 아이템에 상응하는 키워드 벡터 간의 유사도를 고려하여 사용자와 연관된 키워드 랭킹 정보를 추출하고, 관심 아이템, 키워드 랭킹 정보 및 구매의도에 포함된 구매확률 중 적어도 하나를 기반으로 사용자에 상응하는 사용자 의도 프로파일을 생성할 수 있다.

Description

사용자 의도 프로파일링 방법 및 이를 위한 장치 {METHOD FOR PROFILING USER'S INTENTION AND APPARATUS THEREFOR}
본 발명은 사용자 의도를 파악하기 위한 사용자 의도 프로파일링 기술에 관한 것으로, 특히 전자상거래 중 발생하는 사용자의 행동을 실시간으로 분석하고 이에 대한 사용자 의도를 데이터화하여 제공할 수 있는 기술에 관한 것이다.
인터넷 서비스를 통해 제공되는 아이템이나 상품의 양이 기하급수적으로 늘어남에 따라 사용자는 정보의 탐색, 검색, 비교를 위해 많은 시간과 노력을 소모하여야 한다. 즉, 정보과잉과 상품의 방대함을 고려하여 적절한 선택과 의사결정을 하기 위해서는 많은 시간을 들여야 한다.
이와 같은 문제를 해결하기 위하여 소비자의 온라인 양태를 분석하고, 실시간적 사용자 소비성향 프로파일링을 통해 변화되는 소비자의 쇼핑 성향에 따라 최적의 쇼핑정보를 소비자에게 제공하는 기술이 필요하다.
또한, 상품과 그에 대한 정보를 제공하는 공급자 역시 소비자의 의도와 목적을 알아야 좀더 소비자에게 근접한 상품과 정보를 적절한 시점에 효과적으로 제공할 수 있기 때문에, 서비스 제공자 관점에서는 사용자들의 쇼핑성향과 특정시점의 동향에 따른 적절한 상품군을 적정한 시점에 적절한 가격으로 편성 및 공급할 수 있는 시스템을 구축하는 것이 필요하다.
종래 기술에서는 특정 아이템 또는 URL에 대한 고객의 행동을 분석하고, 이를 프로파일 형태로 제공한다. 이러한 분석은 특정 아이템이나 카테고리에 대한 고객의 행동을 아이템 검색에 사용한 검색어, 나열된 아이템들 중 클릭한 아이템, 클릭한 아이템 페이지 내에서의 행동들(찜하기, 리뷰확인, Q&A 확인, 장바구니 담기 등)을 점수화하고, 합산 점수가 높은 아이템 또는 카테고리를 프로파일링하여 데이터화 한다. 또한, 고객의 과거 구매이력에 기반하여 계산된 데이터를 조합하여 제공하기도 한다. 이러한 기술의 경우, 사용자의 아이템탐색 의도를 특정 아이템 또는 카테고리나 그에 대한 검색어 수준에서 제시하기 때문에 사용자의 소비성향을 소비자가 탐색한 카테고리나 아이템 그 자체만으로 제한하는 경향이 있다.
또 다른 종래의 기술에서는 사용자의 온라인 상의 쇼핑활동이 수행된 웹 페이지로부터 해당 아이템에 대한 텍스트를 추출하고, 추출된 텍스트로부터 형태소 분석을 통해 추출된 키워드를 통해 이용자정보를 생성하여 소비자 프로파일링을 수행한다. 또한, 온톨로지를 이용하여 키워드를 정규화하는 방법을 제시한바 있다.
그러나, 이러한 방법은 형태소분석이나 온톨로지 매핑을 통한 정규화 등에 소요되는 연산시간으로 인해 실시간으로 사용자의 탐색 의도를 프로파일링 하기에는 적합하지 않으며, 사용자 프로파일링에 적합한 온톨로지의 확보 및 적용범위, 적용의 적합성 등의 이슈가 있을 수 있다.
한국 등록 특허 제10-1679328호, 2016년 11월 18일 등록 (명칭: 키워드의 프로파일을 수집 및 활용하는 프로파일링 시스템 및 방법)
본 발명의 목적은, 인터넷 전자상거래를 이용하는 사용자의 실시간 의도를 분석하고 데이터화하여 제공하는 것이다.
또한, 본 발명의 목적은 개인화 추천, 광고, 검색 및 마케팅의 효용성 강화 등에 활용하기 위해 E-Commerce 서비스에서의 사용자 서비스 사용에 따른 행동로그 분석과 사용자의 아이템 탐색 의도를 명시적 키워드와 수치로 프로파일링하는 것이다.
또한, 본 발명의 목적은 대규모의 사용자와 방대한 양의 아이템들을 대상으로 사용자의 소비 탐색 의도를 실시간에 효과적으로 처리 가능한 기술을 제공하는 것이다.
또한, 본 발명의 목적은 사용자가 탐색하는 아이템 또는 상품의 특징 정보를 효과적으로 구조화하여 표현하는 것이다.
또한, 본 발명의 목적은 유사의미 키워드 클러스터링 및 대표 키워드 선정 등을 자동으로 수행함으로써 비용적 측면에서의 효율성을 제공하는 것이다.
또한, 본 발명의 목적은 유사 상품, 유사 사용자, 상품과 사용자 간의 관계성, 특정 키워드의 특성에 가까운 상품이나 사용자 등을 효과적으로 탐색하는 것이다.
또한, 본 발명의 목적은 병렬 분산 환경에서의 사용자 프로파일링 및 결과 활용의 실시간성을 향상시키는 것이다.
상기한 목적을 달성하기 위한 본 발명에 따른 사용자 의도 프로파일링 방법은 온라인 사이트에 접속한 사용자의 온라인 행동에 대해 실시간으로 수집된 로그를 기반으로 연속된 행동에 상응하는 행동 데이터를 생성하는 단계; 상기 행동 데이터를 기반으로 상기 사용자의 구매의도와 관심 아이템을 파악하는 단계; 상기 온라인 사이트에 등록된 복수개의 아이템들을 기반으로 생성된 아이템 모델과 상기 관심 아이템에 상응하는 키워드 벡터 간의 유사도를 고려하여 상기 사용자와 연관된 키워드 랭킹 정보를 추출하는 단계; 및 상기 관심 아이템, 상기 키워드 랭킹 정보 및 상기 구매의도에 포함된 구매확률 중 적어도 하나를 기반으로 상기 사용자에 상응하는 사용자 의도 프로파일을 생성하는 단계를 포함할 수 있다.
이 때, 아이템 모델은 상기 복수개의 아이템들 각각에 상응하게 생성되는 아이템 벡터를 기반으로 학습될 수 있다.
이 때, 사용자 의도 프로파일링 방법은 형태소 기반의 키워드 분석을 통해 상기 복수개의 아이템들 각각에 대한 키워드 집합을 생성하는 단계; 상기 키워드 집합에 포함된 복수개의 키워드들에 상응하게 복수개의 키워드 벡터들을 생성하는 단계; 및 상기 복수개의 키워드 벡터들에 키워드 별 가중치를 적용하고, 상기 키워드 별 가중치가 적용된 복수개의 키워드 벡터들 간의 스칼라 곱의 합을 연산하여 상기 아이템 벡터를 생성하는 단계를 더 포함할 수 있다.
이 때, 복수개의 키워드 벡터들을 생성하는 단계는 상기 복수개의 키워드들 각각에 대해 주변 문맥을 고려하여 복수개의 문맥 키워드들을 추출하고, 상기 복수개의 키워드들에 대한 상기 복수개의 문맥 키워드들 각각의 관계를 벡터 값으로 표현하고, 상기 벡터 값을 기반으로 평균 로그 확률이 최대가 되도록 학습을 수행하여 상기 복수개의 키워드 벡터들을 생성할 수 있다.
이 때, 키워드 집합을 생성하는 단계는 상기 복수개의 키워드들 중 기설정된 기준 PMI(Point-wise Mutual Information) 값을 갖는 키워드 쌍이 존재하는 경우, 상기 키워드 쌍을 하나의 복합 키워드로 생성하여 하나의 키워드로 간주할 수 있다.
이 때, 사용자 의도 프로파일링 방법은 아이템 정보 내에서 키워드의 출현 빈도, 키워드가 출현한 아이템의 비율 및 키워드가 출현한 위치 중 적어도 하나를 고려하여 상기 키워드 별 가중치를 산출하는 단계를 더 포함할 수 있다.
이 때, 행동 데이터는 발생 시각, 사용자 아이디, 단말 아이디, URI(Uniform Resource Identifier), 검색어 및 아이템 관련 정보 중 적어도 하나를 포함할 수 있다.
이 때, 사용자 의도 프로파일은 상기 관심 아이템에 상응하는 아이템 벡터에 상기 연속된 행동에 상응하는 행동 패턴의 구매 확률을 가중치로 적용하여 생성된 상기 사용자의 관심 아이템 군 정보를 포함할 수 있다.
이 때, 사용자 의도 프로파일링 방법은 상기 온라인 사이트에 상응하게 생성된 구매 확률 모델과 상기 행동 패턴을 비교하여 상기 구매 확률을 산출하는 단계를 더 포함할 수 있다.
또한, 본 발명에 따른 서버는, 온라인 사이트에 접속한 사용자의 온라인 행동에 대해 실시간으로 수집된 로그 및 상기 온라인 사이트에 등록된 복수개의 아이템들을 기반으로 생성된 아이템 모델을 저장하는 메모리; 및 상기 로그를 기반으로 연속된 행동에 상응하게 생성된 행동 데이터를 통해 상기 사용자의 구매의도와 관심 아이템을 파악하고, 상기 관심 아이템에 상응하는 키워드 벡터와 상기 아이템 모델 간의 유사도를 고려하여 상기 사용자와 연관된 키워드 랭킹 정보를 추출하고, 상기 관심 아이템, 상기 키워드 랭킹 정보 및 상기 구매의도에 포함된 구매확률 중 적어도 하나를 기반으로 상기 사용자에 상응하는 사용자 의도 프로파일을 생성하는 프로세서를 포함한다.
이 때, 아이템 모델은 상기 복수개의 아이템들 각각에 상응하게 생성되는 아이템 벡터를 기반으로 학습될 수 있다.
이 때, 프로세서는 형태소 기반의 키워드 분석을 통해 상기 복수개의 아이템들 각각에 대한 키워드 집합을 생성하고, 상기 키워드 집합에 포함된 복수개의 키워드들에 상응하게 복수개의 키워드 벡터들을 생성하고, 상기 복수개의 키워드 벡터들에 키워드 별 가중치를 적용하고, 상기 키워드 별 가중치가 적용된 복수개의 키워드 벡터들 간의 스칼라 곱의 합을 연산하여 상기 아이템 벡터를 생성할 수 있다.
이 때, 프로세서는 상기 복수개의 키워드들 각각에 대해 주변 문맥을 고려하여 복수개의 문맥 키워드들을 추출하고, 상기 복수개의 키워드들에 대한 상기 복수개의 문맥 키워드들 각각의 관계를 벡터 값으로 표현하고, 상기 벡터 값을 기반으로 평균 로그 확률이 최대가 되도록 학습을 수행하여 상기 복수개의 키워드 벡터들을 생성할 수 있다.
이 때, 프로세서는 상기 복수개의 키워드들 중 기설정된 기준 PMI(Point-wise Mutual Information) 값을 갖는 키워드 쌍이 존재하는 경우, 상기 키워드 쌍을 하나의 복합 키워드로 생성하여 하나의 키워드로 간주할 수 있다.
이 때, 프로세서는 아이템 정보 내에서 키워드의 출현 빈도, 키워드가 출현한 아이템의 비율 및 키워드가 출현한 위치 중 적어도 하나를 고려하여 상기 키워드 별 가중치를 산출할 수 있다.
이 때, 행동 데이터는 발생 시각, 사용자 아이디, 단말 아이디, URI(Uniform Resource Identifier), 검색어 및 아이템 관련 정보 중 적어도 하나를 포함할 수 있다.
이 때, 사용자 의도 프로파일은 상기 관심 아이템에 상응하는 아이템 벡터에 상기 연속된 행동에 상응하는 행동 패턴의 구매 확률을 가중치로 적용하여 생성된 상기 사용자의 관심 아이템 군 정보를 포함할 수 있다.
이 때, 프로세서는 상기 온라인 사이트에 상응하게 생성된 구매 확률 모델과 상기 행동 패턴을 비교하여 상기 구매 확률을 산출할 수 있다.
본 발명에 따르면, 인터넷 전자상거래를 이용하는 사용자의 실시간 의도를 분석하고 데이터화하여 제공할 수 있다.
또한, 본 발명은 개인화 추천, 광고, 검색 및 마케팅의 효용성 강화 등에 활용하기 위해 E-Commerce 서비스에서의 사용자 서비스 사용에 따른 행동로그 분석과 사용자의 아이템 탐색 의도를 명시적 키워드와 수치로 프로파일링 할 수 있다.
또한, 본 발명은 대규모의 사용자와 방대한 양의 아이템들을 대상으로 사용자의 소비 탐색 의도를 실시간에 효과적으로 처리 가능한 기술을 제공할 수 있다.
또한, 본 발명은 사용자가 탐색하는 아이템 또는 상품의 특징 정보를 효과적으로 구조화하여 표현할 수 있다.
또한, 본 발명은 유사의미 키워드 클러스터링 및 대표 키워드 선정 등을 자동으로 수행함으로써 비용적 측면에서의 효율성을 제공할 수 있다.
또한, 본 발명은 유사 상품, 유사 사용자, 상품과 사용자 간의 관계성, 특정 키워드의 특성에 가까운 상품이나 사용자 등을 효과적으로 탐색할 수 있다.
또한, 본 발명은 병렬 분산 환경에서의 사용자 프로파일링 및 결과 활용의 실시간성을 향상시킬 수 있다.
도 1은 본 발명의 일실시예에 따른 사용자 의도 프로파일링 시스템을 나타낸 도면이다.
도 2는 본 발명의 일실시예에 따른 사용자 의도 프로파일링 방법을 나타낸 동작 흐름도이다.
도 3은 본 발명에 따른 사용자 의도 프로파일링 방법 중 키워드 벡터를 생성하는 과정의 일 예를 나타낸 동작 흐름도이다.
도 4는 본 발명에 따른 사용자 의도 프로파일링 방법 중 아이템 모델을 생성 및 학습하는 과정의 일 예를 나타낸 동작 흐름도이다.
도 5는 본 발명에 따른 사용자 의도 프로파일링 과정의 일 예를 나타낸 도면이다.
도 6 내지 도 7은 본 발명에 따른 워드 임베딩 기반의 키워드 벡터 생성의 일 예를 나타낸 도면이다.
도 8 내지 도 9는 본 발명에 따른 사용자 의도 프로파일을 생성하는 과정의 일 예를 나타낸 도면이다.
도 10은 본 발명의 일실시예에 따른 사용자 의도 프로파일링을 수행하는 서버를 나타낸 블록도이다.
본 발명에서 사용되는 기술적 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아님을 유의해야 한다. 또한, 본 발명에서 사용되는 기술적 용어는 본 발명에서 특별히 다른 의미로 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미로 해석되어야 하며, 과도하게 포괄적인 의미로 해석되거나, 과도하게 축소된 의미로 해석되지 않아야 한다. 또한, 본 발명에서 사용되는 기술적인 용어가 본 발명의 사상을 정확하게 표현하지 못하는 잘못된 기술적 용어일 때에는 당업자가 올바르게 이해할 수 있는 기술적 용어로 대체되어 이해되어야 할 것이다. 또한, 본 발명에서 사용되는 일반적인 용어는 사전에 정의되어 있는 바에 따라, 또는 전후 문맥상에 따라 해석되어야 하며, 과도하게 축소된 의미로 해석되지 않아야 한다.
또한, 본 발명에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함한다. 본 발명에서 "구성된다" 또는 "포함한다" 등의 용어는 발명에 기재된 여러 구성 요소들 또는 여러 단계를 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다.
또한, 본 발명에서 사용되는 제 1, 제 2 등과 같이 서수를 포함하는 용어는 구성 요소들을 설명하는데 사용될 수 있지만, 구성 요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제 1 구성 요소는 제 2 구성 요소로 명명될 수 있고, 유사하게 제 2 구성 요소도 제 1 구성 요소로 명명될 수 있다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성 요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.
또한, 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 발명의 사상을 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 발명의 사상이 제한되는 것으로 해석되어서는 아니 됨을 유의해야 한다.
도 1은 본 발명의 일실시예에 따른 사용자 의도 프로파일링 시스템을 나타낸 도면이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 사용자 의도 프로파일링 시스템은 서버(110), 온라인 사이트(120), 아이템 데이터베이스(121), 사용자(130) 및 네트워크(140)를 포함한다.
본 발명의 일실시예에 따른 서버(110)는 네트워크(140)를 기반으로 사용자(130)가 온라인 사이트(130)에 접속하는 수행하는 온라인 행동을 실시간으로 고려하여 사용자 의도 프로파일링을 수행하는 기기에 상응할 수 있다.
이 때, 서버(110)는 온라인 사이트(120)에서 제공하는 복수개의 아이템들에 대한 사용자(130)의 행동뿐만 아니라 연속된 행동을 분석할 수 있다. 즉, 사용자(130)가 온라인 사이트(120)와 같은 전자상거래 사이트를 방문하여 아이템을 구매하기까지 이어지는 일련의 행동 패턴을 분석하고, 이를 통해 추출되는 구매의도나 관심 아이템을 고려하여 사용자 의도 프로파일을 생성할 수 있다.
이 때, 사용자의 온라인 행동은 온라인 사이트(120)가 제공하는 각 페이지를 탐색하거나 버튼을 클릭하는 등의 사용자의 연속된 사용 흐름에 상응할 수 있으며, 이와 함께 관련된 아이템 또는 카테고리의 특징을 추출할 수도 있다.
또한, 본 발명에 따른 서버(110)는 실시간 빅데이터 분석 및 예측에 관련된 것으로, E-Commerce 서비스에서 아이템의 정보를 탐색하거나 구매와 관련한 일련의 사용자 서비스 사용에 따른 행동로그 분석 결과를 프로파일링 결과와 결합하여 사용자에 대한 아이템 탐색 의도를 명시적 키워드와 수치로 프로파일링 할 수 있다. 따라서, 본 발명은 개인화 추천, 광고, 검색 및 마케팅 효용성 강화 등에 활용하는 Data Platform 이나 Data Science 기술에 해당할 수도 있다.
구체적으로 서버(110)는 온라인 사이트(120)로부터 사용자(130)의 온라인 행동을 기반으로 실시간 로그 입수, 로그 분석, 아이템 탐색 의도 예측 및 사용자 의도 프로파일링 등을 수행하는 일련의 프로세스를 Seamless Streaming 방식으로 처리할 수 있다. 또한, 서버(110)는 사용자 의도 프로파일로부터 API를 통한 즉시적 통계분석 결과 전송 등이 가능하게 할 수 있다.
이 때, 도 1에서는 서버(110)와 온라인 사이트(120)를 각각 도시하였으나, 경우에 따라 서버(110)와 온라인 사이트(120)를 운영하는 별도의 운영 서버는 동일한 서버일 수도 있다. 즉, 전자상거래 서비스를 제공하는 온라인 사이트(120)의 운영 서버 내부에 마케팅 관리 데이터를 제공하는 서버(110)가 포함될 수도 있다. 또는, 마케팅 관리 데이터를 제공하는 서버(110)의 내부에 전자상거래 서비스를 제공하는 온라인 사이트(120)의 운영 서버가 포함될 수도 있다.
서버(110)는 온라인 사이트(120)에 접속한 사용자(130)의 온라인 행동에 대해 실시간으로 수집된 로그를 기반으로 연속된 행동에 상응하는 행동 데이터를 생성한다.
이 때, 행동 데이터는 발생 시각, 사용자 아이디, 단말 아이디, URI(Uniform Resource Identifier), 검색어 및 아이템 관련 정보 중 적어도 하나를 포함할 수 있다.
또한, 서버(110)는 행동 데이터를 기반으로 사용자(130)의 구매의도와 관심 아이템을 파악한다.
또한, 서버(110)는 온라인 사이트(120)에 등록된 복수개의 아이템들을 기반으로 생성된 아이템 모델과 관심 아이템에 상응하는 키워드 벡터 간의 유사도를 고려하여 사용자와 연관된 키워드 랭킹 정보를 추출한다.
이 때, 아이템 모델은 복수개의 아이템들 각각에 상응하게 생성되는 아이템 벡터를 기반으로 학습될 수 있다.
또한, 서버(110)는 형태소 기반의 키워드 분석을 통해 온라인 사이트(120)에 등록된 복수개의 아이템들 각각에 대한 키워드 집합을 생성하고, 키워드 집합에 포함된 복수개의 키워드들에 상응하게 복수개의 키워드 벡터들을 생성한다.
이 때, 복수개의 키워드들 각각의 주변 문맥을 고려하여 복수개의 문맥 키워드들을 추출하고, 복수개의 키워드들에 대한 복수개의 문맥 키워드들 각각의 관계를 벡터 값으로 표현하고, 벡터 값을 기반으로 평균 로그 확률이 최대가 되도록 학습을 수행하여 복수개의 키워드 벡터들을 생성할 수 있다.
이 때, 복수개의 키워드들 중 기설정된 기준 PMI(Point-wise Mutual Information) 값을 갖는 키워드 쌍이 존재하는 경우, 키워드 쌍을 하나의 복합 키워드로 생성하여 하나의 키워드로 간주할 수 있다.
또한, 서버(110)는 복수개의 키워드 벡터들에 키워드 별 가중치를 적용하고, 키워드 별 가중치가 적용된 복수개의 키워드 벡터들 간의 스칼라 곱의 합을 연산하여 아이템 벡터를 생성한다.
이 때, 서버(110)는 아이템 정보 내에서 키워드의 출연 빈도, 키워드가 출현한 아이템의 비율 및 키워드가 출현한 위치 중 적어도 하나를 고려하여 키워드 별 가중치를 산출할 수 있다.
또한, 서버(110)는 관심 아이템, 관심 키워드 랭킹 정보 및 구매의도에 포함된 구매확률 중 적어도 하나를 기반으로 사용자에 상응하는 사용자 의도 프로파일을 생성한다.
이 때, 사용자 의도 프로파일은 관심 아이템에 상응하는 아이템 벡터에 연속된 행동에 상응하는 행동 패턴의 구매 확률을 가중치로 적용하여 생성된 사용자의 관심 아이템 군 정보를 포함할 수 있다.
이 때, 서버(110)는 온라인 사이트(120)에 상응하게 생성된 구매 확률 모델과 행동 패턴을 비교하여 구매 확률을 산출할 수 있다.
온라인 사이트(120)는 사용자(130)가 접속하여 전자상거래 서비스를 이용하기 위한 인터넷 사이트에 상응할 수 있다. 이 때, 온라인 사이트(120)를 운영하기 위한 운영 서버는 서버(110)에 포함되거나 또는 독립적으로 존재할 수 있다.
아이템 데이터베이스(121)는 온라인 사이트(120)에 등록된 복수개의 아이템들에 대한 정보를 저장 및 관리하는 저장 모듈에 상응할 수 있다.
이 때, 아이템 데이터베이스(121)는 네트워크(140)를 기반으로 서버(110)에게 복수개의 아이템들에 상응하는 아이템 정보를 제공할 수 있다.
사용자(130)는 온라인 사이트(120)에 접속하여 전자상거래 서비스를 이용하면서 다양한 행동을 하는 사람에 상응할 수 있다. 예를 들어, 사용자(130)는 온라인 사이트(120)에 접속하여, 아이템을 검색하거나, 아이템의 상세설명을 보거나, 아이템을 장바구니에 담거나, 결제를 시도하는 등 다양한 온라인 행동을 수행할 수 있다.
이 때, 사용자(130)는 모바일 단말이나 컴퓨터 등의 사용자 단말로 온라인 사이트(120)에 접속하여 전자상거래 서비스를 이용할 수 잇다.
예를 들어, 사용자 단말은 통신망에 연결되어 본 발명에 따른 어플리케이션을 실행할 수 있는 장치로, 이동통신단말기에 한정된 것이 아니고, 모든 정보통신기기, 멀티미디어 단말 및 IP(Internet Protocol) 단말 등의 다양한 단말일 수 있다. 또한, 사용자 단말은 휴대폰, PMP(Portable Multimedia Played), MID(Mobile Internet Device), 스마트폰(Smart Phone), 태블릿컴퓨터(Tablet PC), 노트북(Note book), 넷북(Net Book), 개인휴대용 정보단말(Personal Digital Assistant; PDA) 및 정보통신 기기 등과 같은 다양한 이동통신 사양을 갖는 모바일(Mobile) 단말일 수 있다.
또한, 사용자 단말은 숫자 및 문자 정보 등의 다양한 정보를 입력 받고, 각종 기능을 설정 및 사용자 단말의 기능 제어와 관련하여 입력되는 신호를 입력부를 통해 제어부로 전달할 수 있다. 또한, 사용자 단말의 입력부는 사용자의 터치 또는 조작에 따른 입력 신호를 발생하는 키패드와 터치패드 중 적어도 하나를 포함하여 구성할 수 있다. 이 때, 사용자 단말의 입력부는 사용자 단말의 표시부와 함께 하나의 터치패널(또는 터치 스크린(touch screen))의 형태로 구성되어 입력과 표시 기능을 동시에 수행할 수 있다. 또한, 사용자 단말의 입력부는 키보드, 키패드, 마우스, 조이스틱 등과 같은 입력 장치 외에도 향후 개발될 수 있는 모든 형태의 입력 수단이 사용될 수 있다.
또한, 사용자 단말의 표시부는 사용자 단말의 기능 수행 중에 발생하는 일련의 동작상태 및 동작결과 등에 대한 정보를 표시할 수 있다. 또한, 사용자 단말의 표시부는 사용자 단말의 메뉴 및 사용자가 입력한 사용자 데이터 등을 표시할 수 있다. 여기서, 사용자 단말의 표시부는 액정표시장치(LCD, Liquid Crystal Display), 초박막 액정표시장치(TFT-LCD, Thin Film Transistor LCD), 발광다이오드(LED, Light Emitting Diode), 유기 발광다이오드(OLED, Organic LED), 능동형 유기발광다이오드(AMOLED, Active Matrix OLED), 레티나 디스플레이(Retina Display), 플렉시블 디스플레이(Flexible display) 및 3차원(3 Dimension) 디스플레이 등으로 구성될 수 있다. 이 때, 사용자 단말의 표시부가 터치스크린 형태로 구성된 경우, 사용자 단말의 표시부는 사용자 단말의 입력부의 기능 중 일부 또는 전부를 수행할 수 있다.
또한, 사용자 단말의 저장부는 데이터를 저장하기 위한 장치로, 주 기억장치 및 보조 기억장치를 포함하고, 사용자 단말의 기능 동작에 필요한 응용 프로그램을 저장할 수 있다. 이러한 사용자 단말의 저장부는 크게 프로그램 영역과 데이터 영역을 포함할 수 있다. 여기서, 사용자 단말은 사용자의 요청에 상응하여 각 기능을 활성화하는 경우, 제어부의 제어 하에 해당 응용 프로그램들을 실행하여 각 기능을 제공하게 된다. 특히, 본 발명에 따른 사용자 단말의 저장부는 사용자 단말을 부팅시키는 운영체제, 원 클릭 주문을 위해 입력되는 정보를 송수신하는 어플리케이션 등을 저장할 수 있다. 또한, 사용자 단말의 저장부는 다수의 컨텐츠를 저장하는 컨텐츠 DB와 사용자 단말의 정보를 저장할 수 있다. 이 때, 컨텐츠 DB는 컨텐츠를 실행하기 위한 실행 데이터와 컨텐츠에 대한 속성 정보를 포함하고, 컨텐츠 실행에 따른 컨텐츠 사용 정보 등이 저장될 수 있다. 그리고, 사용자 단말의 정보는 단말 사양 정보를 포함할 수 있다.
또한, 사용자 단말의 통신부는 온라인 사이트(120)와 네트워크(140)을 통해 데이터를 송수신하기 위한 기능을 수행할 수 있다. 여기서 사용자 단말의 통신부는 송신되는 신호의 주파수를 상승 변환 및 증폭하는 RF 송신 수단과 수신되는 신호를 저잡음 증폭하고 주파수를 하강 변환하는 RF 수신 수단 등을 포함할 수 있다. 이러한 사용자 단말의 통신부는 무선통신 모듈을 포함할 수 있다. 그리고, 무선통신 모듈은 무선 통신 방법에 따라 데이터를 송수신하기 위한 구성이며, 사용자 단말이 무선 통신을 이용하는 경우, 무선망 통신 모듈, 무선랜 통신 모듈 및 무선팬 통신 모듈 중 어느 하나를 이용하여 데이터를 온라인 사이트(120)로 송수신할 수 있다. 즉 사용자 단말은 무선통신 모듈을 이용하여 네트워크(140)에 접속하며, 네트워크(140)를 통해 온라인 사이트(120)와 데이터를 송수신할 수 있다.
또한, 사용자 단말의 제어부는 운영 체제(OS, Operation System) 및 각 구성을 구동시키는 프로세스 장치가 될 수 있다. 예를 들어, 제어부는 온라인 사이트(120)에 접속하는 과정 전반을 제어할 수 있다. 인터넷이나 어플리케이션을 통해 온라인 사이트(120)에 접속하는 경우, 사용자의 요청에 따라 어플리케이션이 실행되는 과정 전반을 제어할 수 있으며, 실행과 동시에 온라인 사이트(120)로 전자상거래를 위한 서비스 이용 요청이 전송되도록 제어할 수 있으며, 이때 사용자 인증에 필요한 사용자 단말의 정보가 함께 전송되도록 제어할 수 있다.
네트워크(140)는 서버(110), 온라인 사이트(120) 및 사용자(130) 사이에 데이터를 전달하는 통로를 제공하는 것으로서, 기존에 이용되는 네트워크 및 향후 개발 가능한 네트워크를 모두 포괄하는 개념이다. 예를 들어, 네트워크는 한정된 지역 내에서 각종 정보장치들의 통신을 제공하는 유무선근거리 통신망, 이동체 상호 간 및 이동체와 이동체 외부와의 통신을 제공하는 이동통신망, 위성을 이용해 지구국과 지구국간 통신을 제공하는 위성통신망이거나 유무선 통신망 중에서 어느 하나이거나, 둘 이상의 결합으로 이루어질 수 있다. 한편, 네트워크의 전송 방식 표준은, 기존의 전송 방식 표준에 한정되는 것은 아니며, 향후 개발될 모든 전송 방식 표준을 포함할 수 있다.
도 2는 본 발명의 일실시예에 따른 사용자 의도 프로파일링 방법을 나타낸 동작 흐름도이다.
도 2를 참조하면, 본 발명의 일실시예에 따른 사용자 의도 프로파일링 방법은 온라인 사이트에 접속한 사용자의 온라인 행동에 대해 실시간으로 수집된 로그를 기반으로 연속된 행동에 상응하는 행동 데이터를 생성한다(S210).
본 발명은 온라인 사이트에 접속한 사용자에 대한 사용자 의도 프로파일링을 수행하기 위한 것으로, 이를 위해서 특정한 아이템 또는 카테고리에 대한 사용자의 행동뿐만 아니라 사용자의 연속된 행동을 분석할 수 있다. 즉, 사용자가 온라인 사이트를 방문하여 아이템을 구매하는 데까지 이어지는 일련의 온라인 행동을 분석할 수 있다.
이 때, 연속된 아이템 탐색 행동 내에서의 사용자의 구매관련 의도와 관심 아이템의 정보를 브랜드, 희망 가격수준, 아이템 특징 키워드 등으로 프로파일링 하되, 관심 아이템에 대한 탐색의도 정보를 단순히 아이템명이나 상세 내용만을 활용했던 종래기술과 달리 아이템명, 브랜드명, 상품상세 정보, 리뷰, Q&A 및 검색 키워드 등을 대상으로 언어처리와 통계분석을 통해 의미있는 키워드들을 추출함으로써 사용자에 대한 사용자 의도 프로파일을 생성하는 데 활용할 수 있다.
이 때, 로그는 사용자들이 온라인 사이트에 접속해서 하는 온라인 행동에 대한 것일 수 있다. 예를 들어, 로그는, 아이템 클릭, 리뷰 조회, 장바구니 추가 및 삭제, 결제 시도, 검색어 입력, 광고 클릭, 좋아요 혹은 공유 등의 소셜 활동과 같은 명시적 행동일 수 있다. 또한, 마우스 휠 조정, 스와이프 아웃 등의 UX(User Experience)와 관련된 행동이나 특정 페이지에 오래 머무는 행위, 동일 아이템 혹은 유사한 카테고리에 재방문하는 행위와 같이 관심이 있는 아이템을 유추할 가능성이 있어 보이는 모든 암묵적인 행동도 로그에 포함될 수 있다. 이 때, 상기한 예시들로 온라인 행동이 한정되지는 않는다.
이 때, 로그에 포함된 URI 정보를 기반으로 사용자 의도 검색어나 가격, 옵션 정보 등을 추출할 수 있고, 이를 기반으로 사용자 별로 구분하여 정형화된 형식의 행동 데이터를 생성할 수 있다.
이 때, 로그는 사용자가 온라인 사이트에 접속하여 행동하는 즉시 실시간으로 수집될 수 있다. 또한, 로그는 스트림 형태로 수집될 수 있고, 사용자 의도 프로파일링을 생성하는데 필요한 형태의 데이터로 가공되기 위한 전처리 과정을 거칠 수 있다.
이 때, 본 발명의 일실시예에 따른 사용자 의도 프로파일링 방법은 상기와 같이 사용자의 실시간 온라인 행동을 이용할 수 있다. 즉, 사용자의 과거 구매 기록이나 프로필 정보를 이용하여 사용자가 구매할 것으로 예상되는 아이템을 판단하거나 구매 확률을 예측하는 종래의 방식과 달리, 본 발명에서는 사용자가 현재 접속한 전자상거래 사이트 내에서 방문하고 있는 페이지가 무엇인지와 같은 행동 패턴을 바탕으로 근시간 내에 구매할 가능성이 높은 아이템이나 카테고리를 추론할 수 있다. 이와 같은 방식을 통해 현재 접속된 사용자의 사용자 의도 프로파일링을 수행함으로써 종래의 기술보다 사용자 의도를 정확하게 파악할 수 있다.
이 때, 로그를 수집하는 경로는 특정한 경로로 한정되지 않을 수 있다. 예를 들어, 모바일 웹, 모바일 어플리케이션 및 PC 웹과 같이 다양한 경로를 통해 사용자의 온라인 행동에 상응하는 로그를 실시간으로 수집할 수 있다.
또한, 본 발명의 일실시예에 따른 서버가 모든 로그를 단일화해서 전달받을 수도 있다. 일부의 단말에서 발생하는 로그를 취합하여 간소화된 형태로 전달받을 수도 있다. 즉, 로그를 수집하는 방식은 특정한 방식에 한정되지 않는다.
이 때, 행동 데이터는 발생 시각, 사용자 아이디, 단말 아이디, URI(Uniform Resource Identifier), 검색어 및 아이템 관련 정보 중 적어도 하나를 포함할 수 있다. 이 때, 아이템 관련 정보에는 해당 아이템이 무엇인지 구분하기 위한 아이템 번호나 카테고리 번호 등이 포함될 수 있다. 또한, 아이템 관련 정보에는 아이템 가격이나 옵션과 같이 온라인 행동의 중요도를 판단할 수 있는 메타정보도 포함될 수 있다.
이 때, 행동 데이터는 사용자가 온라인 사이트에 접속하는 시점을 기준으로 하는 세션 단위로 생성될 수 있다.
예를 들어, 사용자가 온라인 사이트에 로그인하는 시점부터 로그아웃하는 시점까지를 하나의 세션으로 판단하고, 해당 세션 동안 발생하는 온라인 행동에 대해 로그를 수집하여 행동 데이터를 생성할 수 있다.
다른 예를 들어, 사용자가 온라인 사이트에 접속하는 시점부터 온라인 사이트를 종료하는 시점까지를 하나의 세션으로 판단하고 행동 데이터를 생성할 수도 있다.
이 때, 하나의 세션의 시작과 종료는 특정한 시점으로 한정되지 않고 다양하게 설정될 수 있다.
또한, 본 발명의 일실시예에 따른 사용자 의도 프로파일링 방법은 행동 데이터를 기반으로 사용자의 구매의도와 관심 아이템을 파악한다(S220).
이 때, 구매의도는 사용자에 대한 구매확률을 포함할 수 있다.
이 때, 구매확률은 사용자가 연속된 의미있는 온라인 행동을 할 때 높은 값으로 산출될 수 있다.
또한, 도 2에는 도시하지 아니하였으나, 온라인 사이트에 상응하게 생성된 구매 확률 모델과 행동 패턴을 비교하여 구매 확률을 산출할 수 있다.
이 때, 구매 확률 모델은 온라인 사이트에 대한 구매 확률 모델일 수 있다. 즉, 구매 확률 모델은 해당 온라인 사이트에서 수집되는 행동 데이터로부터 행동 패턴을 추출하고, 추출된 행동 패턴에서 구매 또는 비구매가 발생하는 빈도를 분석한 결과를 기반으로 생성될 수 있다.
예를 들어, 구매 확률 모델은 해당 온라인 사이트를 이용하는 복수의 사용자들에 의해 구매가 발생하였을 경우에 자중 나타나는 연속된 행동에 대한 행동 패턴 또는 구매가 발생하지 않았을 경우에 자주 나타나는 연속된 행동에 대한 행동 패턴을 바탕으로 구매 패턴과 비구매 패턴이 추출되어 생성될 수 있다. 이 때, 각각의 패턴에서 전체적인 출현 횟수가 일정 숫자에 미달하는 행동 패턴의 경우는 생략함으로써 구매 확률 모델을 생성하기 위한 연산 속도를 개선할 수도 있다.
따라서, 사용자에 상응하게 생성된 행동 데이터에서 추출된 행동 패턴을 구매 확률 모델에 포함된 구매 패턴 또는 비구매 패턴과 비교함으로써 사용자가 아이템을 구매할지 여부를 확률로 산출할 수 있다.
또한, 본 발명의 일실시예에 따른 사용자 의도 프로파일링 방법은 온라인 사이트에 등록된 복수개의 아이템들을 기반으로 생성된 아이템 모델과 관심 아이템에 상응하는 키워드 벡터 간의 유사도를 고려하여 사용자와 연관된 키워드 랭킹 정보를 추출한다(S230).
이 때, 관심 아이템에 상응하는 키워드 벡터는 사전에 복수개의 아이템들에 상응하게 생성된 복수개의 키워드 벡터들을 기반으로 획득될 수 있다.
예를 들어, 본 발명의 일실시예에 따른 서버는 온라인 사이트에 등록된 복수개의 아이템들에 대한 아이템 정보를 획득하여 복수개의 키워드 벡터들을 생성한 뒤 별도의 데이터베이스에 저장해 둘 수 있다. 이 후, 사용자에 대한 관심 아이템이 파악되면, 복수개의 아이템들 중 관심 아이템에 해당하는 아이템을 검색하여 해당 아이템의 키워드 벡터를 획득할 수 있다.
이 때, 복수개의 키워드 벡터들을 생성하는 과정을 간략히 설명하면 다음과 같다.
먼저, 형태소 기반의 키워드 분석을 통해 복수개의 아이템들 각각에 대한 키워드 집합을 생성할 수 있다.
예를 들어, 온라인 사이트에 등록된 복수개의 아이템들에 대한 아이템 정보를 저장하고 있는 아이템 데이터베이스로부터 아이템 정보를 획득하여 형태소 분석을 수행할 수 있다. 이 후, 형태소 분석 결과의 복합 키워드 처리 및 개체명 인식 등을 기반으로 아이템을 대표적으로 표현하는 키워드를 추출 할 수 있다.
이 때, 키워드는 아이템의 고유 브랜드명, 모델명, 아이템의 크기, 색상, 용도, 목적 등에 해당하는 다양한 정보를 기반으로 추출될 수 있다.
이 때, 복수개의 키워드들 중 기설정된 기준 PMI(Point-wise Mutual Information) 값을 갖는 키워드 쌍이 존재하는 경우, 키워드 쌍을 하나의 복합 키워드로 생성하여 하나의 키워드로 간주할 수 있다.
예를 들어, 아이템 A에 대한 아이템 정보의 형태소 분석결과를 대상으로 아이템 A에 대한 브랜드명에 상응하는 키워드 B를 추출하였다고 가정할 수 있다. 이 후, 단어간 공기정보를 이용하여 키워드 B와 통계적으로 의미있는 키워드 C가 추출되는 경우, 키워드 B와 키워드 C를 결합한 복합 키워드를 아이템 A에 대한 하나의 키워드로 간주할 수 있다.
이 때, 복수개의 아이템들 전체에 대한 형태소 분석결과를 대상으로 복합 키워드 처리 과정을 반복 수행함으로써 두 단어 이상으로 구성된 의미있는 복합 키워드를 추출하여 각각의 키워드 집합에 포함시킬 수 있다.
이 후, 키워드 집합에 포함된 복수개의 키워드들에 상응하게 복수개의 키워드 벡터들을 생성할 수 있다.
이 때, 키워드 벡터는 특정 키워드에 문맥 기반 워드 임베딩 기술을 적용하여 일정크기의 의미벡터로 표현한 것에 상응할 수 있다. 즉, 의미벡터는 아이템의 특성을 표현하기 위해 사용된 복수개의 키워드들과 그 주변에 나타낸 키워드 문맥정보가 특정 크기의 벡터로 학습된 것에 상응하는 것으로, 키워드와 함께 표현되는 아이템의 특성이 벡터 공간 상에서 수치적으로 표현된 것일 수 있다.
이 때, 복수개의 키워드들 각각에 대해 주변 문맥을 고려하여 복수개의 문맥 키워드들을 추출하고, 복수개의 키워드들에 대한 복수개의 문맥 키워드들 각각의 관계를 벡터 값으로 표현할 수 있다.
예를 들어, "공기청정기"를 키워드로 갖는 아이템 A의 문맥 키워드로 "OH 라디칼 방식", "공기청정기", "미세먼지", "살균" 등이 추출되었고, 마찬가지로 "공기청정기"를 키워드로 갖는 아이템 B의 문맥 키워드로 "음이온", 공기청정기", "3중 필터", "저전력", "미세먼지" 등이 추출되었다고 가정할 수 있다. 이 때, "공기청정기"라는 키워드는 아이템 A와 아이템 B에 의해 추출된 문맥 키워드들을 벡터 공간에서 수치적으로 학습하여 공기청정기의 의미를 도출할 수 있는 특정한 벡터 값으로 표현될 수 있다.
이 때, 벡터 값을 기반으로 평균 로그 확률이 최대가 되도록 학습을 수행하여 복수개의 키워드 벡터들을 생성할 수 있다.
예를 들어, 키워드 K에 대한 키워드 벡터는, 키워드 K의 모든 문맥 키워드들을 대상으로 키워드 K의 평균 로그 확률이 최대가 되도록 학습한 결과에 상응할 수 있으며, 다음의 [수학식 1]을 통해 산출될 수 있다.
[수학식 1]
Figure pat00001
이 때, 아이템 모델은 복수개의 아이템들 각각에 상응하게 생성되는 아이템 벡터를 기반으로 학습될 수 있다.
이 때, 아이템 벡터는 아이템에 상응하는 키워드 집합과 키워드 집합에 포함된 복수개의 키워드들을 기반으로 생성된 키워드 벡터를 이용하여 나타낸 아이템의 고유한 특징벡터에 상응할 수 있다.
이 때, 복수개의 키워드 벡터들에 키워드 별 가중치를 적용하고, 키워드 별 가중치가 적용된 복수개의 키워드 벡터들 간의 스칼라 곱의 합을 연산하여 아이템 벡터를 생성할 수 있다.
예를 들어, 아이템 벡터 Pi는 [수학식 2]와 같이 아이템 정보에서 추출된 m개의 키워드들 각각이 아이템에 대해 갖는 가중치 λij와 키워드 벡터 Kij의 스칼라 곱의 합으로 산출될 수 있다.
[수학식 2]
Figure pat00002
이 때, 아이템 벡터의 차원은 키워드 벡터와 동일할 수 있다.
이 때, 아이템 정보 내에서 키워드의 출현 빈도, 키워드가 출현한 아이템의 비율 및 키워드가 출현한 위치 중 적어도 하나를 고려하여 키워드 별 가중치를 산출할 수 있다.
예를 들어, 아이템 정보 내에서 키워드의 출현 빈도는 tf, 키워드가 출현한 아이템의 비율은 idf, 키워드의 출원 위치에 따른 가중치가 α에 상응하고, 아이템 데이터베이스에 등록된 복수개의 아이템의 개수가 |P|라고 가정한다면, 아이템 별 가중치 λij는 [수학식 3]과 같이 산출될 수 있다.
[수학식 3]
Figure pat00003
이 때, [수학식 3]에서 Pj는 복수개의 아이템들 중 j번째 키워드를 포함하는 아이템의 개수를 의미할 수 있다.
이 때, 아이템 벡터의 품질에 따라 [수학식 3]의 가중치 및 모델식은 조정될 수도 있다.
이 때, 아이템 모델은 일정시간을 주기로 아이템 데이터베이스에 등록된 복수개의 아이템들의 아이템 벡터를 대상으로 학습될 수 있다.
이 때, 아이템 벡터의 크기는 키워드 벡터의 크기와 동일할 수 있는데, 실시간으로 사용자 의도 프로파일링을 수행하는 경우에 가용 메모리와 병렬분산 처리의 효율을 고려하여 키워드 벡터와 아이템 벡터의 크기를 결정할 수도 있다.
또한, 본 발명의 일실시예에 따른 사용자 의도 프로파일링 방법은 관심 아이템, 키워드 랭킹 정보 및 구매의도에 포함된 구매확률 중 적어도 하나를 기반으로 사용자에 상응하는 사용자 의도 프로파일을 생성한다(S240).
이 때, 사용자 의도 프로파일은 관심 아이템에 상응하는 아이템 벡터에 연속된 행동에 상응하는 행동 패턴의 구매 확률을 가중치로 적용하여 생성된 사용자의 관심 아이템 군 정보를 포함할 수 있다.
즉, 사용자 의도 프로파일은 사용자의 관심 아이템에 대한 프로파일과 사용자의 관심 키워드에 대한 프로파일을 포함할 수 있다.
이 때, 사용자가 원하는 가격범위와 선호 브랜드에 대한 프로파일링 또한 행동 패턴의 구매 확률을 가중치로 적용하는 방식으로 산출될 수 있다.
예를 들어, 가격범위의 경우, 최소가격, 평균가격 및 최대가격 중 적어도 하나를 기준으로 초기화된 가격범위의 값과 행동 데이터를 기반으로 검출된 현재의 선호 가격범위 간의 선형적 보간을 통해 가격범위를 재조정할 수 있다.
다른 예를 들어, 사용자에 상응하게 검출된 관심 아이템들의 가격 정보에 해당 관심 아이템이 검출된 행동 패턴의 구매확률을 가중치로 적용하여 가격범위를 추정할 수도 있다.
또한, 선호 브랜드의 경우, 사용자의 행동 패턴에 의해 추출된 관심 아이템의 브랜드에 해당 관심 아이템이 검출된 행동 패턴의 구매확률을 가중치로 적용하여 브랜드에 대한 관심도를 계산할 수 있다.
즉, 본 발명의 일실시예에 따른 사용자 의도 프로파일링 방법은 사용자의 관심 아이템에 대한 아이템 벡터에 구매확률을 가중치로 적용한 벡터 값과 아이템 모델 간의 유사도를 산출하고, 유사도가 높은 키워드를 랭킹 형식으로 사용자 의도 프로파일에 포함시킴으로써 사용자의 관심 키워드 정보를 제공할 수 있다.
또는, 본 발명의 일실시예에 따른 사용자 의도 프로파일링 방법은 온라인 사이트에 등록된 복수개의 아이템들마다 각각 N개의 핵심 키워드들을 추출하고, 추출된 각각의 키워드에 상응하는 아이템의 구매확률을 가중치로 적용하여 아이템별 키워드 랭킹 정보를 생성할 수 있다. 이 후, 사용자의 행동 데이터를 기반으로 추출된 관심 아이템의 구매확률을 관심 아이템에 해당하는 아이템의 핵심 키워드들 유사도와 곱하는 방식으로 핵심 키워드 각각에 대한 관심도를 산출하고, 산출된 관심도를 정렬하여 키워드 랭킹 정보를 생성할 수도 있다.
이 때, 사용자의 관심 아이템에 대한 관심도, 즉 구매의도는 시간이 경과함에 따라 점차 약화될 수 있으며, 아이템에 대한 구매가 이루어지고 나면 해당 아이템에 대한 관심도가 소멸되는 것으로 판단할 수도 있다.
이를 반영하여, 실시간으로 사용자 의도 프로파일링을 수행하는 과정 중 일정 세션 동안 소비탐색 관련활동이 발생하지 않은 아이템에 대해서는 시간 단위를 요소로 하는 Exponential Decaying Function을 적용하여 아이템 벡터에 적용되는 가중치인 구매확률을 점차 감소시킬 수 있다.
또한, 특정 아이템에 대한 구매가 완료된 경우에는 구매가 완료된 아이템에 최종 적용되고 있는 구매확률을 제로화하여 사용자 의도 프로파일링을 수행할 수도 있다.
이와 같은 사용자 의도 프로파일링은 사용자가 온라인 사이트에서 탐색하는 아이템의 특징 정보를 잘 구조화하여 표현하는 것에 해당하며, 주요한 특징 정보는 아이템의 카테고리, 브랜드, 가격대, 모델명, 아이템의 주요 속성과 기능 관련 키워드 및 기타 아이템 정보를 나타내는 키워드에 나타날 수 있다. 이 중 카테고리, 브랜드, 가격대 등은 사전에 정의된 키워드나 코드를 사용할 수 있고, 아이템의 주요한 속성이나 기능 등은 동일한 의미라도 다양한 형태로 표현될 수도 있다.
또한, 본 발명에서는 사용자의 아이템 탐색 의도에서 나타나는 사용자 선호 아이템 특성을 키워드로 표현하는데, 아이템 정보 기술에 사용된 단어(키워드) 그 자체를 사용하기 보다는, 단어 간의 공기관계 통계 정보를 이용하여 함께 붙어서 사용되는 단어들은 복합 키워드로 추출하여 사용할 수 있다. 또한, 추출된 키워드 주변에 출현하는 다양한 문맥 키워드들을 고정된 차원의 벡터 공간으로 인코딩한 결과를 이용하여 사용자 의도 프로파일링을 수행할 수 있다.
또한, 본 발명의 일실시예에 따라 생성되는 키워드 벡터는 키워드의 아이템 관련 의미적 특성을 복합적으로 잘 반영해주고, 다양한 형태로 표현되는 유사의미 키워드들을 잘 묶어주는 효과가 있어 사용자의 아이템 탐색 의도를 효율적으로 표현할 수 있다.
특히, 온톨로지를 이용하여 키워드를 정규화하는 종래기술의 경우에는 온톨로지 구축에 따른 오버헤드 및 온톨로지의 규모에 따른 표현력 등의 이슈가 있을 수 있는데, 본 발명의 키워드 인베딩 기술을 사용하면 유사의미 키워드 클러스터링 및 대표 키워드 선정 등을 자동으로 하여 비용의 효율을 기대할 수 있다. 또한, 벡터 연산을 통한 유사도 측정과 키워드 랭킹을 수행하므로 대용량의 아이템, 사용자를 대상으로 실시간 서비스를 하는 경우 병렬 및 분산 처리 환경을 효과적으로 활용할 수 있다는 장점이 있다.
또한, 아이템 모델과 사용자의 아이템 탐색 의도를 키워드 임베딩 벡터를 매개로 하여 표현함에 의해, 아이템 특징 키워드 추출 및 사용자 관심 키워드 랭킹 등이 벡터 연산을 통해 표현이 가능하며, 벡터 유사도 계산을 통해 유사 아이템, 유사 사용자, 아이템과 사용자 간의 관계성, 특정 키워드의 특성에 가까운 아이템, 사용자 등을 효과적으로 탐색할 수 있다는 장점이 있다.
또한, 도 2에는 도시하지 아니하였으나, 본 발명의 일실시예에 따른 사용자 의도 프로파일링 방법은 네트워크와 같은 통신망을 통해 사용자 의도 프로파일링을 위해 필요한 정보를 송수신할 수 있다. 특히, 온라인 사이트를 운영하는 별도의 운영 서버로부터 사용자의 온라인 행동에 대한 데이터 또는 온라인 사이트에 등록된 복수개의 아이템들에 상응하는 아이템 정보를 수신할 수 있다.
또한, 도 2에는 도시하지 아니하였으나, 본 발명의 일실시예에 따른 사용자 의도 프로파일링 방법은 상술한 사용자 의도 프로파일링 과정에서 발생하는 다양한 정보를 별도의 저장 모듈에 저장할 수 있다.
이와 같은 사용자 의도 프로파일링 방법을 통해, 인터넷 전자상거래를 이용하는 사용자의 실시간 의도를 분석하고 데이터화하여 제공할 수 있다.
또한, 개인화 추천, 광고, 검색 및 마케팅의 효용성 강화 등에 활용하기 위해 E-Commerce 서비스에서의 사용자 서비스 사용에 따른 행동로그 분석과 사용자의 아이템 탐색 의도를 명시적 키워드와 수치로 프로파일링할 수 있다.
또한, 대규모의 사용자와 방대한 양의 아이템들을 대상으로 사용자의 소비 탐색 의도를 실시간에 효과적으로 처리 가능한 기술을 제공할 수 있다.
또한, 사용자가 탐색하는 아이템 또는 상품의 특징 정보를 효과적으로 구조화하여 표현할 수 있다.
또한, 유사의미 키워드 클러스터링 및 대표 키워드 선정 등을 자동으로 수행함으로써 비용적 측면에서의 효율성을 제공할 수 있다.
또한, 유사 상품, 유사 사용자, 상품과 사용자 간의 관계성, 특정 키워드의 특성에 가까운 상품이나 사용자 등을 효과적으로 탐색할 수 있다.
또한, 병렬 분산 환경에서의 사용자 프로파일링 및 결과 활용의 실시간성을 향상시킬 수 있다.
도 3은 본 발명에 따른 사용자 의도 프로파일링 방법 중 키워드 벡터를 생성하는 과정의 일 예를 나타낸 동작 흐름도이다.
도 3을 참조하면, 본 발명에 따른 사용자 의도 프로파일링 방법 중 키워드 벡터를 생성하는 과정은 먼저, 형태소 기반의 키워드 분석을 통해 복수의 아이템들 각각에 대한 키워드 집합을 생성할 수 있다(S310).
예를 들어, 온라인 사이트에 등록된 복수개의 아이템들에 대한 아이템 정보를 저장하고 있는 아이템 데이터베이스로부터 아이템 정보를 획득하여 형태소 분석을 수행할 수 있다. 이 후, 형태소 분석 결과의 복합 키워드 처리 및 개체명 인식 등을 기반으로 아이템을 대표적으로 표현하는 키워드를 추출 할 수 있다.
이 때, 키워드는 아이템의 고유 브랜드명, 모델명, 아이템의 크기, 색상, 용도, 목적 등에 해당하는 다양한 정보를 기반으로 추출될 수 있다.
이 때, 복수개의 키워드들 중 기설정된 기준 PMI(Point-wise Mutual Information) 값을 갖는 키워드 쌍이 존재하는 경우, 키워드 쌍을 하나의 복합 키워드로 생성하여 하나의 키워드로 간주할 수 있다.
예를 들어, 아이템 A에 대한 아이템 정보의 형태소 분석결과를 대상으로 아이템 A에 대한 브랜드명에 상응하는 키워드 B를 추출하였다고 가정할 수 있다. 이 후, 단어간 공기정보를 이용하여 키워드 B와 통계적으로 의미있는 키워드 C가 추출되는 경우, 키워드 B와 키워드 C를 결합한 복합 키워드를 아이템 A에 대한 하나의 키워드로 간주할 수 있다.
이 후, 키워드 집합에 포함된 복수개의 키워드들 각각에 대해 주변 문맥을 고려하여 복수개의 문맥 키워드들을 추출할 수 있고(S320), 복수개의 키워드들에 대한 복수개의 문맥 키워드들 각각의 관계를 벡터 값으로 표현할 수 있다(S330).
예를 들어, "공기청정기"를 키워드로 갖는 아이템 A의 문맥 키워드로 "OH 라디칼 방식", "공기청정기", "미세먼지", "살균" 등이 추출되었고, 마찬가지로 "공기청정기"를 키워드로 갖는 아이템 B의 문맥 키워드로 "음이온", 공기청정기", "3중 필터", "저전력", "미세먼지" 등이 추출되었다고 가정할 수 있다. 이 때, "공기청정기"라는 키워드는 아이템 A와 아이템 B에 의해 추출된 문맥 키워드들을 벡터 공간에서 수치적으로 학습하여 공기청정기의 의미를 도출할 수 있는 특정한 벡터 값으로 표현될 수 있다.
이 후, 벡터 값을 기반으로 평균 로그 확률이 최대가 되도록 학습을 수행하여 복수개의 키워드 벡터들을 생성할 수 있다(S340).
예를 들어, 키워드 K에 대한 키워드 벡터는, 키워드 K의 모든 문맥 키워드들을 대상으로 키워드 K의 평균 로그 확률이 최대가 되도록 학습한 결과에 상응할 수 있으며, 다음의 [수학식 1]을 통해 산출될 수 있다.
[수학식 1]
Figure pat00004
도 4는 본 발명에 따른 사용자 의도 프로파일링 방법 중 아이템 모델을 생성 및 학습하는 과정의 일 예를 나타낸 동작 흐름도이다.
도 4를 참조하면, 본 발명에 따른 사용자 의도 프로파일링 방법 중 아이템 모델을 생성 및 학습하는 과정은 먼저, 복수개의 키워드 벡터들에 각각 키워드 별 가중치를 적용할 수 있다(S410).
예를 들어, 아이템 벡터 Pi는 [수학식 2]와 같이 아이템 정보에서 추출된 m개의 키워드들 각각이 아이템에 대해 갖는 가중치 λij와 키워드 벡터 Kij의 스칼라 곱의 합으로 산출될 수 있다.
[수학식 2]
Figure pat00005
이 때, 아이템 벡터의 차원은 키워드 벡터와 동일할 수 있다.
이 후, 키워드 별 가중치가 적용된 복수개의 키워드 벡터 간의 스칼라 곱의 합을 연산하여 복수개의 아이템들 각각에 대한 아이템 벡터를 생성할 수 있다(S420).
이 때, 아이템 정보 내에서 키워드의 출현 빈도, 키워드가 출현한 아이템의 비율 및 키워드가 출현한 위치 중 적어도 하나를 고려하여 키워드 별 가중치를 산출할 수 있다.
예를 들어, 아이템 정보 내에서 키워드의 출현 빈도는 tf, 키워드가 출현한 아이템의 비율은 idf, 키워드의 출원 위치에 따른 가중치가 α에 상응하고, 아이템 데이터베이스에 등록된 복수개의 아이템의 개수가 |P|라고 가정한다면, 아이템 별 가중치 λij는 [수학식 3]과 같이 산출될 수 있다.
[수학식 3]
Figure pat00006
이 때, [수학식 3]에서 Pj는 복수개의 아이템들 중 j번째 키워드를 포함하는 아이템의 개수를 의미할 수 있다.
이 후, 복수개의 아이템들 각각에 대한 아이템 벡터를 기반으로 학습을 수행하여 아이템 모델을 생성할 수 있다(S430).
이 때, 아이템 모델은 일정시간을 주기로 아이템 데이터베이스에 등록된 복수개의 아이템들의 아이템 벡터를 대상으로 학습될 수 있다.
도 5는 본 발명에 따른 사용자 의도 프로파일링 과정의 일 예를 나타낸 도면이다.
도 5를 참조하면, 본 발명에 따른 사용자 의도 프로파일링 과정은 먼저 아이템 데이터베이스(500)에 저장된 복수개의 아이템들에 대한 아이템 정보를 기반으로 키워드 분석을 수행할 수 있다(S502).
이 때, 형태소 기반의 키워드 분석을 통해 복수개의 아이템들 각각에 대한 키워드 집합을 생성할 수 있다.
이 후, 키워드 분석을 통해 복수개의 아이템들 각각에 대해 생성된 키워드 집합을 기반으로 키워드 벡터를 생성할 수 있다(S504).
이 때, 키워드 집합에 포함된 복수개의 키워드들 각각에 대해 주변 문맥을 고려하여 복수개의 문맥 키워드들을 추출하고, 복수개의 키워드들에 대한 복수개의 문맥 키워드들 각각의 관계를 벡터 값으로 표현하고, 벡터 값을 기반으로 평균 로그 확률이 최대가 되도록 학습을 수행하여 복수개의 키워드 벡터들을 생성할 수 있다.
이 후, 키워드 벡터를 기반으로 복수개의 아이템들 각각에 대해 아이템 벡터를 생성하고(S505), 아이템 벡터를 기반으로 학습을 수행하여 아이템 모델을 생성할 수 있다(S506).
이 때, 복수개의 키워드 벡터들에 키워드 별 가중치를 적용하고, 키워드 별 가중치가 적용된 복수개의 키워드 벡터들 간의 스칼라 곱의 합을 연산하여 아이템 벡터를 생성할 수 있다.
이 후, 서비스 채널들(511, 512, 513)을 기반으로 사용자의 온라인 행동에 상응하는 로그가 수집되면(S508), 로그를 기반으로 생성된 행동 데이터를 통해 사용자의 구매의도와 관심 아이템을 파악할 수 있다(S510, S514).
이 때, 사용자의 구매의도를 기반으로 구매확률을 산출할 수 있고(S512), 사용자의 관심 아이템의 키워드 벡터를 획득할 수 있다(S516).
이 때, 구매 확률 모델은 해당 온라인 사이트를 이용하는 복수의 사용자들에 의해 구매가 발생하였을 경우에 자중 나타나는 연속된 행동에 대한 행동 패턴 또는 구매가 발생하지 않았을 경우에 자주 나타나는 연속된 행동에 대한 행동 패턴을 바탕으로 구매 패턴과 비구매 패턴이 추출되어 생성될 수 있다.
이 후, 관심 아이템의 키워드 벡터와 아이템 모델 간의 유사도 계산을 기반으로 사용자에 대한 키워드 랭킹 정보를 생성하고, 키워드 랭킹 정보, 관심 아이템 및 구매확률 등을 고려하여 사용자 의도 프로파일을 생성할 수 있다(S518).
이 때, 사용자 의도 프로파일은 관심 아이템에 상응하는 아이템 벡터에 연속된 행동에 상응하는 행동 패턴의 구매 확률을 가중치로 적용하여 생성된 사용자의 관심 아이템 군 정보를 포함할 수 있다.
즉, 사용자 의도 프로파일은 사용자의 관심 아이템에 대한 프로파일과 사용자의 관심 키워드에 대한 프로파일을 포함할 수 있다.
도 6 내지 도 7은 본 발명에 따른 워드 임베딩 기반의 키워드 벡터 생성의 일 예를 나타낸 도면이다.
도 6 내지 도 7을 참조하면, 본 발명에 따른 키워드 벡터는 먼저 도 6에 도시된 것과 같이 복수개의 키워드들에 대한 복수개의 문맥 키워드들을 추출할 수 있다.
예를 들어, 도 6에 도시된 것과 같이 "공기청정기"를 키워드로 갖는 아이템 A에서 "OH 라디칼 방식", "공기청정기", "미세먼지", "살균" 등을 문맥 키워드로 추출할 수 있다. 마찬가지로, "공기청정기"를 키워드로 갖는 아이템 B에서는 "음이온", 공기청정기", "3중 필터", "저전력", "미세먼지" 등을 문맥 키워드로 추출할 수 있다.
이 때, "공기청정기"라는 키워드는 아이템 A와 아이템 B에 의해 추출된 문맥 키워드들을 벡터 공간에서 수치적으로 학습하여 도 7에 도시된 것과 같이 공기청정기의 의미를 도출할 수 있는 키워드 벡터(700)로 표현될 수 있다.
도 8 내지 도 9는 본 발명에 따른 사용자 의도 프로파일을 생성하는 과정의 일 예를 나타낸 도면이다.
도 8 내지 도 9를 참조하면, 본 발명에 따른 사용자 의도 프로파일은 먼저 도 8에 도시된 과정을 통해 아이템 모델을 생성할 수 있다.
예를 들어, 아이템 모델을 생성하는 과정은 다음과 같다.
먼저, 도 8에 도시된 아이템 데이터베이스를 기반으로 온라인 사이트에 등록된 복수개의 아이템들에 대한 아이템 정보를 획득할 수 있다. 이 후, 키워드 분석기(Keyword Analyzer)를 기반으로 키워드 분석을 수행하여 복수개의 아이템들 각각에 상응하게 키워드 집합을 생성할 수 있다.
이 후, 키워드 집합에 포함된 복수개의 키워드들을 기반으로 문맥 기반 워드 임베딩을 수행하여도 8에 도시된 것과 같은 키워드 벡터(810)를 키워드 별로 생성할 수 있다. 즉, 복수개의 키워드들 각각에 대해 주변 문맥을 고려하여 복수개의 문맥 키워드들을 추출하고, 복수개의 키워드들에 대한 복수개의 문맥 키워드들 각각의 관계를 벡터 값으로 표현한 뒤, 벡터 값을 기반으로 평균 로그 확률이 최대가 되도록 학습을 수행하여 복수개의 키워드 벡터들을 생성할 수 있다.
이 후, 복수개의 키워드 벡터들에 키워드 별 가중치를 적용하고, 키워드 별 가중치가 적용된 복수개의 키워드 벡터들 간의 스칼라 곱의 합을 연산하여 도 8에 도시된 것과 같은 아이템 벡터(820)를 생성할 수 있다.
이 후, 키워드 벡터와 아이템 벡터 간 유사도를 계산하고, 유사도가 높은 키워드를 Top K로 랭킹하여, 도 8에 도시된 것과 같이 아이템 모델(830)을 생성할 수 있다.
이 후, 도 9에 도시된 것과 같이 아이템 모델(830)을 이용하여 사용자 의도 프로파일을 생성할 수 있다.
예를 들어, 사용자 의도 프로파일을 생성하는 과정은 다음과 같다.
먼저, 본 발명의 일실시예에 따른 사용자 의도 프로파일러(930)를 기반으로 사용자의 온라인 행동에 상응하게 수집된 로그(910)를 기반으로 사용자의 구매의도에 따른 구매확률을 산출할 수 있다.
이 때, 구매확률은 로그를 기반으로 생성된 행동 데이터에서 URI 패턴에 상응하는 추출된 행동패턴에 따라 산출될 수 있다.
이 후, 각각의 URI 패턴, 즉 행동 패턴을 기반으로 사용자의 관심 아이템을 검출하고, 관심 아이템의 정보를 브랜드, 가격, 키워드 등을 기반으로 프로파일링하여 도 9에 도시된 것과 같은 관심 아이템 프로파일(940)을 생성할 수 있다.
이 때, 관심 아이템 프로파일(940)은 관심 아이템별 관심도를 포함할 수 있다.
또한, 본 발명의 일실시예에 따른 사용자 의도 프로파일러(930)를 기반으로 아이템 모델(830)과 관심 아이템의 키워드 벡터를 기반으로 사용자에 상응하는 키워드 랭킹 정보(950)를 생성할 수 있다.
이 때, 관심 아이템의 구매확률을 아이템 모델(830)과 관심 아이템의 키워드 벡터 간 유사도와 곱하는 방식으로 키워드 별 관심도를 계산할 수 있다. 관심도를 정렬하여 키워드 랭킹 정보(950)를 생성할 수 있다.
도 10은 본 발명의 일실시예에 따른 사용자 의도 프로파일링을 수행하는 서버를 나타낸 블록도이다.
도 10을 참조하면, 본 발명의 일실시예에 따른 사용자 의도 프로파일링을 수행하는 서버는 통신부(1010), 메모리(1020), 프로세선(1030) 및 저장부(1040)를 포함한다.
통신부(1010)는 네트워크와 같은 통신망을 통해 사용자 의도 프로파일링을 위해 필요한 정보를 송수신하는 역할을 한다. 특히, 본 발명에 따른 통신부(1010)는 온라인 사이트를 운영하는 별도의 운영 서버로부터 사용자의 온라인 행동에 대한 데이터 또는 온라인 사이트에 등록된 복수개의 아이템들에 대한 아이템 정보를 수신할 수 있다.
메모리(1020)는 온라인 사이트에 접속한 사용자의 온라인 행동에 대해 실시간으로 수집된 로그 및 온라인 사이트에 등록된 복수개의 아이템들을 기반으로 생성된 아이템 모델을 저장한다.
프로세서(1030)는 온라인 사이트에 접속한 사용자의 온라인 행동에 대해 실시간으로 수집된 로그를 기반으로 연속된 행동에 상응하는 행동 데이터를 생성한다.
본 발명은 온라인 사이트에 접속한 사용자에 대한 사용자 의도 프로파일링을 수행하기 위한 것으로, 이를 위해서 특정한 아이템 또는 카테고리에 대한 사용자의 행동뿐만 아니라 사용자의 연속된 행동을 분석할 수 있다. 즉, 사용자가 온라인 사이트를 방문하여 아이템을 구매하는 데까지 이어지는 일련의 온라인 행동을 분석할 수 있다.
이 때, 연속된 아이템 탐색 행동 내에서의 사용자의 구매관련 의도와 관심 아이템의 정보를 브랜드, 희망 가격수준, 아이템 특징 키워드 등으로 프로파일링 하되, 관심 아이템에 대한 탐색의도 정보를 단순히 아이템명이나 상세 내용만을 활용했던 종래기술과 달리 아이템명, 브랜드명, 상품상세 정보, 리뷰, Q&A 및 검색 키워드 등을 대상으로 언어처리와 통계분석을 통해 의미있는 키워드들을 추출함으로써 사용자에 대한 사용자 의도 프로파일을 생성하는 데 활용할 수 있다.
이 때, 로그는 사용자들이 온라인 사이트에 접속해서 하는 온라인 행동에 대한 것일 수 있다. 예를 들어, 로그는, 아이템 클릭, 리뷰 조회, 장바구니 추가 및 삭제, 결제 시도, 검색어 입력, 광고 클릭, 좋아요 혹은 공유 등의 소셜 활동과 같은 명시적 행동일 수 있다. 또한, 마우스 휠 조정, 스와이프 아웃 등의 UX(User Experience)와 관련된 행동이나 특정 페이지에 오래 머무는 행위, 동일 아이템 혹은 유사한 카테고리에 재방문하는 행위와 같이 관심이 있는 아이템을 유추할 가능성이 있어 보이는 모든 암묵적인 행동도 로그에 포함될 수 있다. 이 때, 상기한 예시들로 온라인 행동이 한정되지는 않는다.
이 때, 로그에 포함된 URI 정보를 기반으로 사용자 의도 검색어나 가격, 옵션 정보 등을 추출할 수 있고, 이를 기반으로 사용자 별로 구분하여 정형화된 형식의 행동 데이터를 생성할 수 있다.
이 때, 로그는 사용자가 온라인 사이트에 접속하여 행동하는 즉시 실시간으로 수집될 수 있다. 또한, 로그는 스트림 형태로 수집될 수 있고, 사용자 의도 프로파일링을 생성하는데 필요한 형태의 데이터로 가공되기 위한 전처리 과정을 거칠 수 있다.
이 때, 본 발명의 일실시예에 따른 사용자 의도 프로파일링 방법은 상기와 같이 사용자의 실시간 온라인 행동을 이용할 수 있다. 즉, 사용자의 과거 구매 기록이나 프로필 정보를 이용하여 사용자가 구매할 것으로 예상되는 아이템을 판단하거나 구매 확률을 예측하는 종래의 방식과 달리, 본 발명에서는 사용자가 현재 접속한 전자상거래 사이트 내에서 방문하고 있는 페이지가 무엇인지와 같은 행동 패턴을 바탕으로 근시간 내에 구매할 가능성이 높은 아이템이나 카테고리를 추론할 수 있다. 이와 같은 방식을 통해 현재 접속된 사용자의 사용자 의도 프로파일링을 수행함으로써 종래의 기술보다 사용자 의도를 정확하게 파악할 수 있다.
이 때, 로그를 수집하는 경로는 특정한 경로로 한정되지 않을 수 있다. 예를 들어, 모바일 웹, 모바일 어플리케이션 및 PC 웹과 같이 다양한 경로를 통해 사용자의 온라인 행동에 상응하는 로그를 실시간으로 수집할 수 있다.
또한, 본 발명의 일실시예에 따른 서버가 모든 로그를 단일화해서 전달받을 수도 있다. 일부의 단말에서 발생하는 로그를 취합하여 간소화된 형태로 전달받을 수도 있다. 즉, 로그를 수집하는 방식은 특정한 방식에 한정되지 않는다.
이 때, 행동 데이터는 발생 시각, 사용자 아이디, 단말 아이디, URI(Uniform Resource Identifier), 검색어 및 아이템 관련 정보 중 적어도 하나를 포함할 수 있다. 이 때, 아이템 관련 정보에는 해당 아이템이 무엇인지 구분하기 위한 아이템 번호나 카테고리 번호 등이 포함될 수 있다. 또한, 아이템 관련 정보에는 아이템 가격이나 옵션과 같이 온라인 행동의 중요도를 판단할 수 있는 메타정보도 포함될 수 있다.
이 때, 행동 데이터는 사용자가 온라인 사이트에 접속하는 시점을 기준으로 하는 세션 단위로 생성될 수 있다.
예를 들어, 사용자가 온라인 사이트에 로그인하는 시점부터 로그아웃하는 시점까지를 하나의 세션으로 판단하고, 해당 세션 동안 발생하는 온라인 행동에 대해 로그를 수집하여 행동 데이터를 생성할 수 있다.
다른 예를 들어, 사용자가 온라인 사이트에 접속하는 시점부터 온라인 사이트를 종료하는 시점까지를 하나의 세션으로 판단하고 행동 데이터를 생성할 수도 있다.
이 때, 하나의 세션의 시작과 종료는 특정한 시점으로 한정되지 않고 다양하게 설정될 수 있다.
또한, 프로세서(1030)는 행동 데이터를 기반으로 사용자의 구매의도와 관심 아이템을 파악한다.
이 때, 구매의도는 사용자에 대한 구매확률을 포함할 수 있다.
이 때, 구매확률은 사용자가 연속된 의미있는 온라인 행동을 할 때 높은 값으로 산출될 수 있다.
또한, 도 2에는 도시하지 아니하였으나, 온라인 사이트에 상응하게 생성된 구매 확률 모델과 행동 패턴을 비교하여 구매 확률을 산출할 수 있다.
이 때, 구매 확률 모델은 온라인 사이트에 대한 구매 확률 모델일 수 있다. 즉, 구매 확률 모델은 해당 온라인 사이트에서 수집되는 행동 데이터로부터 행동 패턴을 추출하고, 추출된 행동 패턴에서 구매 또는 비구매가 발생하는 빈도를 분석한 결과를 기반으로 생성될 수 있다.
예를 들어, 구매 확률 모델은 해당 온라인 사이트를 이용하는 복수의 사용자들에 의해 구매가 발생하였을 경우에 자중 나타나는 연속된 행동에 대한 행동 패턴 또는 구매가 발생하지 않았을 경우에 자주 나타나는 연속된 행동에 대한 행동 패턴을 바탕으로 구매 패턴과 비구매 패턴이 추출되어 생성될 수 있다. 이 때, 각각의 패턴에서 전체적인 출현 횟수가 일정 숫자에 미달하는 행동 패턴의 경우는 생략함으로써 구매 확률 모델을 생성하기 위한 연산 속도를 개선할 수도 있다.
따라서, 사용자에 상응하게 생성된 행동 데이터에서 추출된 행동 패턴을 구매 확률 모델에 포함된 구매 패턴 또는 비구매 패턴과 비교함으로써 사용자가 아이템을 구매할지 여부를 확률로 산출할 수 있다.
또한, 프로세서(1030)는 온라인 사이트에 등록된 복수개의 아이템들을 기반으로 생성된 아이템 모델과 관심 아이템에 상응하는 키워드 벡터 간의 유사도를 고려하여 사용자와 연관된 키워드 랭킹 정보를 추출한다.
이 때, 관심 아이템에 상응하는 키워드 벡터는 사전에 복수개의 아이템들에 상응하게 생성된 복수개의 키워드 벡터들을 기반으로 획득될 수 있다.
예를 들어, 본 발명의 일실시예에 따른 서버는 온라인 사이트에 등록된 복수개의 아이템들에 대한 아이템 정보를 획득하여 복수개의 키워드 벡터들을 생성한 뒤 별도의 데이터베이스에 저장해 둘 수 있다. 이 후, 사용자에 대한 관심 아이템이 파악되면, 복수개의 아이템들 중 관심 아이템에 해당하는 아이템을 검색하여 해당 아이템의 키워드 벡터를 획득할 수 있다.
이 때, 복수개의 키워드 벡터들을 생성하는 과정을 간략히 설명하면 다음과 같다.
먼저, 형태소 기반의 키워드 분석을 통해 복수개의 아이템들 각각에 대한 키워드 집합을 생성할 수 있다.
예를 들어, 온라인 사이트에 등록된 복수개의 아이템들에 대한 아이템 정보를 저장하고 있는 아이템 데이터베이스로부터 아이템 정보를 획득하여 형태소 분석을 수행할 수 있다. 이 후, 형태소 분석 결과의 복합 키워드 처리 및 개체명 인식 등을 기반으로 아이템을 대표적으로 표현하는 키워드를 추출 할 수 있다.
이 때, 키워드는 아이템의 고유 브랜드명, 모델명, 아이템의 크기, 색상, 용도, 목적 등에 해당하는 다양한 정보를 기반으로 추출될 수 있다.
이 때, 복수개의 키워드들 중 기설정된 기준 PMI(Point-wise Mutual Information) 값을 갖는 키워드 쌍이 존재하는 경우, 키워드 쌍을 하나의 복합 키워드로 생성하여 하나의 키워드로 간주할 수 있다.
예를 들어, 아이템 A에 대한 아이템 정보의 형태소 분석결과를 대상으로 아이템 A에 대한 브랜드명에 상응하는 키워드 B를 추출하였다고 가정할 수 있다. 이 후, 단어간 공기정보를 이용하여 키워드 B와 통계적으로 의미있는 키워드 C가 추출되는 경우, 키워드 B와 키워드 C를 결합한 복합 키워드를 아이템 A에 대한 하나의 키워드로 간주할 수 있다.
이 때, 복수개의 아이템들 전체에 대한 형태소 분석결과를 대상으로 복합 키워드 처리 과정을 반복 수행함으로써 두 단어 이상으로 구성된 의미있는 복합 키워드를 추출하여 각각의 키워드 집합에 포함시킬 수 있다.
이 후, 키워드 집합에 포함된 복수개의 키워드들에 상응하게 복수개의 키워드 벡터들을 생성할 수 있다.
이 때, 키워드 벡터는 특정 키워드에 문맥 기반 워드 임베딩 기술을 적용하여 일정크기의 의미벡터로 표현한 것에 상응할 수 있다. 즉, 의미벡터는 아이템의 특성을 표현하기 위해 사용된 복수개의 키워드들과 그 주변에 나타낸 키워드 문맥정보가 특정 크기의 벡터로 학습된 것에 상응하는 것으로, 키워드와 함께 표현되는 아이템의 특성이 벡터 공간 상에서 수치적으로 표현된 것일 수 있다.
이 때, 복수개의 키워드들 각각에 대해 주변 문맥을 고려하여 복수개의 문맥 키워드들을 추출하고, 복수개의 키워드들에 대한 복수개의 문맥 키워드들 각각의 관계를 벡터 값으로 표현할 수 있다.
예를 들어, "공기청정기"를 키워드로 갖는 아이템 A의 문맥 키워드로 "OH 라디칼 방식", "공기청정기", "미세먼지", "살균" 등이 추출되었고, 마찬가지로 "공기청정기"를 키워드로 갖는 아이템 B의 문맥 키워드로 "음이온", 공기청정기", "3중 필터", "저전력", "미세먼지" 등이 추출되었다고 가정할 수 있다. 이 때, "공기청정기"라는 키워드는 아이템 A와 아이템 B에 의해 추출된 문맥 키워드들을 벡터 공간에서 수치적으로 학습하여 공기청정기의 의미를 도출할 수 있는 특정한 벡터 값으로 표현될 수 있다.
이 때, 벡터 값을 기반으로 평균 로그 확률이 최대가 되도록 학습을 수행하여 복수개의 키워드 벡터들을 생성할 수 있다.
예를 들어, 키워드 K에 대한 키워드 벡터는, 키워드 K의 모든 문맥 키워드들을 대상으로 키워드 K의 평균 로그 확률이 최대가 되도록 학습한 결과에 상응할 수 있으며, 다음의 [수학식 1]을 통해 산출될 수 있다.
[수학식 1]
Figure pat00007
이 때, 아이템 모델은 복수개의 아이템들 각각에 상응하게 생성되는 아이템 벡터를 기반으로 학습될 수 있다.
이 때, 아이템 벡터는 아이템에 상응하는 키워드 집합과 키워드 집합에 포함된 복수개의 키워드들을 기반으로 생성된 키워드 벡터를 이용하여 나타낸 아이템의 고유한 특징벡터에 상응할 수 있다.
이 때, 복수개의 키워드 벡터들에 키워드 별 가중치를 적용하고, 키워드 별 가중치가 적용된 복수개의 키워드 벡터들 간의 스칼라 곱의 합을 연산하여 아이템 벡터를 생성할 수 있다.
예를 들어, 아이템 벡터 Pi는 [수학식 2]와 같이 아이템 정보에서 추출된 m개의 키워드들 각각이 아이템에 대해 갖는 가중치 λij와 키워드 벡터 Kij의 스칼라 곱의 합으로 산출될 수 있다.
[수학식 2]
Figure pat00008
이 때, 아이템 벡터의 차원은 키워드 벡터와 동일할 수 있다.
이 때, 아이템 정보 내에서 키워드의 출현 빈도, 키워드가 출현한 아이템의 비율 및 키워드가 출현한 위치 중 적어도 하나를 고려하여 키워드 별 가중치를 산출할 수 있다.
예를 들어, 아이템 정보 내에서 키워드의 출현 빈도는 tf, 키워드가 출현한 아이템의 비율은 idf, 키워드의 출원 위치에 따른 가중치가 α에 상응하고, 아이템 데이터베이스에 등록된 복수개의 아이템의 개수가 |P|라고 가정한다면, 아이템 별 가중치 λij는 [수학식 3]과 같이 산출될 수 있다.
[수학식 3]
Figure pat00009
이 때, [수학식 3]에서 Pj는 복수개의 아이템들 중 j번째 키워드를 포함하는 아이템의 개수를 의미할 수 있다.
이 때, 아이템 벡터의 품질에 따라 [수학식 3]의 가중치 및 모델식은 조정될 수도 있다.
이 때, 아이템 모델은 일정시간을 주기로 아이템 데이터베이스에 등록된 복수개의 아이템들의 아이템 벡터를 대상으로 학습될 수 있다.
이 때, 아이템 벡터의 크기는 키워드 벡터의 크기와 동일할 수 있는데, 실시간으로 사용자 의도 프로파일링을 수행하는 경우에 가용 메모리와 병렬분산 처리의 효율을 고려하여 키워드 벡터와 아이템 벡터의 크기를 결정할 수도 있다.
또한, 프로세서(1030)는 관심 아이템, 키워드 랭킹 정보 및 구매의도에 포함된 구매확률 중 적어도 하나를 기반으로 사용자에 상응하는 사용자 의도 프로파일을 생성한다.
이 때, 사용자 의도 프로파일은 관심 아이템에 상응하는 아이템 벡터에 연속된 행동에 상응하는 행동 패턴의 구매 확률을 가중치로 적용하여 생성된 사용자의 관심 아이템 군 정보를 포함할 수 있다.
즉, 사용자 의도 프로파일은 사용자의 관심 아이템에 대한 프로파일과 사용자의 관심 키워드에 대한 프로파일을 포함할 수 있다.
이 때, 사용자가 원하는 가격범위와 선호 브랜드에 대한 프로파일링 또한 행동 패턴의 구매 확률을 가중치로 적용하는 방식으로 산출될 수 있다.
예를 들어, 가격범위의 경우, 최소가격, 평균가격 및 최대가격 중 적어도 하나를 기준으로 초기화된 가격범위의 값과 행동 데이터를 기반으로 검출된 현재의 선호 가격범위 간의 선형적 보간을 통해 가격범위를 재조정할 수 있다.
다른 예를 들어, 사용자에 상응하게 검출된 관심 아이템들의 가격 정보에 해당 관심 아이템이 검출된 행동 패턴의 구매확률을 가중치로 적용하여 가격범위를 추정할 수도 있다.
또한, 선호 브랜드의 경우, 사용자의 행동 패턴에 의해 추출된 관심 아이템의 브랜드에 해당 관심 아이템이 검출된 행동 패턴의 구매확률을 가중치로 적용하여 브랜드에 대한 관심도를 계산할 수 있다.
즉, 본 발명의 일실시예에 따른 서버는 사용자의 관심 아이템에 대한 아이템 벡터에 구매확률을 가중치로 적용한 벡터 값과 아이템 모델 간의 유사도를 산출하고, 유사도가 높은 키워드를 랭킹 형식으로 사용자 의도 프로파일에 포함시킴으로써 사용자의 관심 키워드 정보를 제공할 수 있다.
또는, 본 발명의 일실시예에 따른 서버는 온라인 사이트에 등록된 복수개의 아이템들마다 각각 N개의 핵심 키워드들을 추출하고, 추출된 각각의 키워드에 상응하는 아이템의 구매확률을 가중치로 적용하여 아이템별 키워드 랭킹 정보를 생성할 수 있다. 이 후, 사용자의 행동 데이터를 기반으로 추출된 관심 아이템의 구매확률을 관심 아이템에 해당하는 아이템의 핵심 키워드들 유사도와 곱하는 방식으로 핵심 키워드 각각에 대한 관심도를 산출하고, 산출된 관심도를 정렬하여 키워드 랭킹 정보를 생성할 수도 있다.
이 때, 사용자의 관심 아이템에 대한 관심도, 즉 구매의도는 시간이 경과함에 따라 점차 약화될 수 있으며, 아이템에 대한 구매가 이루어지고 나면 해당 아이템에 대한 관심도가 소멸되는 것으로 판단할 수도 있다.
이를 반영하여, 실시간으로 사용자 의도 프로파일링을 수행하는 과정 중 일정 세션 동안 소비탐색 관련활동이 발생하지 않은 아이템에 대해서는 시간 단위를 요소로 하는 Exponential Decaying Function을 적용하여 아이템 벡터에 적용되는 가중치인 구매확률을 점차 감소시킬 수 있다.
또한, 특정 아이템에 대한 구매가 완료된 경우에는 구매가 완료된 아이템에 최종 적용되고 있는 구매확률을 제로화하여 사용자 의도 프로파일링을 수행할 수도 있다.
이와 같은 사용자 의도 프로파일링은 사용자가 온라인 사이트에서 탐색하는 아이템의 특징 정보를 잘 구조화하여 표현하는 것에 해당하며, 주요한 특징 정보는 아이템의 카테고리, 브랜드, 가격대, 모델명, 아이템의 주요 속성과 기능 관련 키워드 및 기타 아이템 정보를 나타내는 키워드에 나타날 수 있다. 이 중 카테고리, 브랜드, 가격대 등은 사전에 정의된 키워드나 코드를 사용할 수 있고, 아이템의 주요한 속성이나 기능 등은 동일한 의미라도 다양한 형태로 표현될 수도 있다.
또한, 본 발명에서는 사용자의 아이템 탐색 의도에서 나타나는 사용자 선호 아이템 특성을 키워드로 표현하는데, 아이템 정보 기술에 사용된 단어(키워드) 그 자체를 사용하기 보다는, 단어 간의 공기관계 통계 정보를 이용하여 함께 붙어서 사용되는 단어들은 복합 키워드로 추출하여 사용할 수 있다. 또한, 추출된 키워드 주변에 출현하는 다양한 문맥 키워드들을 고정된 차원의 벡터 공간으로 인코딩한 결과를 이용하여 사용자 의도 프로파일링을 수행할 수 있다.
또한, 본 발명의 일실시예에 따라 생성되는 키워드 벡터는 키워드의 아이템 관련 의미적 특성을 복합적으로 잘 반영해주고, 다양한 형태로 표현되는 유사의미 키워드들을 잘 묶어주는 효과가 있어 사용자의 아이템 탐색 의도를 효율적으로 표현할 수 있다.
특히, 온톨로지를 이용하여 키워드를 정규화하는 종래기술의 경우에는 온톨로지 구축에 따른 오버헤드 및 온톨로지의 규모에 따른 표현력 등의 이슈가 있을 수 있는데, 본 발명의 키워드 인베딩 기술을 사용하면 유사의미 키워드 클러스터링 및 대표 키워드 선정 등을 자동으로 하여 비용의 효율을 기대할 수 있다. 또한, 벡터 연산을 통한 유사도 측정과 키워드 랭킹을 수행하므로 대용량의 아이템, 사용자를 대상으로 실시간 서비스를 하는 경우 병렬 및 분산 처리 환경을 효과적으로 활용할 수 있다는 장점이 있다.
또한, 아이템 모델과 사용자의 아이템 탐색 의도를 키워드 임베딩 벡터를 매개로 하여 표현함에 의해, 아이템 특징 키워드 추출 및 사용자 관심 키워드 랭킹 등이 벡터 연산을 통해 표현이 가능하며, 벡터 유사도 계산을 통해 유사 아이템, 유사 사용자, 아이템과 사용자 간의 관계성, 특정 키워드의 특성에 가까운 아이템, 사용자 등을 효과적으로 탐색할 수 있다는 장점이 있다.
저장부(1040)는 상술한 바와 같이 본 발명의 일실시예에 따른 사용자 의도 프로파일링을 위한 기능을 지원할 수 있다. 이 때, 저장부(1040)는 별도의 대용량 스토리지로 동작할 수 있고, 동작 수행을 위한 제어 기능을 포함할 수도 있다.
한편, 서버는 메모리가 탑재되어 그 장치 내에서 정보를 저장할 수 있다. 일 구현예의 경우, 메모리는 컴퓨터로 판독 가능한 매체이다. 일 구현 예에서, 메모리는 휘발성 메모리 유닛일 수 있으며, 다른 구현예의 경우, 메모리는 비휘발성 메모리 유닛일 수도 있다. 일 구현예의 경우, 저장장치는 컴퓨터로 판독 가능한 매체이다. 다양한 서로 다른 구현 예에서, 저장장치는 예컨대 하드디스크 장치, 광학디스크 장치, 혹은 어떤 다른 대용량 저장장치를 포함할 수도 있다.
이와 같은 서버를 이용하여, 인터넷 전자상거래를 이용하는 사용자의 실시간 의도를 분석하고 데이터화하여 제공할 수 있다.
또한, 개인화 추천, 광고, 검색 및 마케팅의 효용성 강화 등에 활용하기 위해 E-Commerce 서비스에서의 사용자 서비스 사용에 따른 행동로그 분석과 사용자의 아이템 탐색 의도를 명시적 키워드와 수치로 프로파일링할 수 있다.
또한, 대규모의 사용자와 방대한 양의 아이템들을 대상으로 사용자의 소비 탐색 의도를 실시간에 효과적으로 처리 가능한 기술을 제공할 수 있다.
또한, 사용자가 탐색하는 아이템 또는 상품의 특징 정보를 효과적으로 구조화하여 표현할 수 있다.
또한, 유사의미 키워드 클러스터링 및 대표 키워드 선정 등을 자동으로 수행함으로써 비용적 측면에서의 효율성을 제공할 수 있다.
또한, 유사 상품, 유사 사용자, 상품과 사용자 간의 관계성, 특정 키워드의 특성에 가까운 상품이나 사용자 등을 효과적으로 탐색할 수 있다.
또한, 병렬 분산 환경에서의 사용자 프로파일링 및 결과 활용의 실시간성을 향상시킬 수 있다.
본 명세서에서 설명하는 기능적인 동작과 주제의 구현물들은 디지털 전자 회로로 구현되거나, 본 명세서에서 개시하는 구조 및 그 구조적인 등가물들을 포함하는 컴퓨터 소프트웨어, 펌웨어 혹은 하드웨어로 구현되거나, 이들 중 하나 이상의 결합으로 구현 가능하다. 본 명세서에서 설명하는 주제의 구현물들은 하나 이상의 컴퓨터 프로그램 제품, 다시 말해 처리 시스템의 동작을 제어하기 위하여 혹은 이것에 의한 실행을 위하여 유형의 프로그램 저장매체 상에 인코딩된 컴퓨터 프로그램 명령에 관한 하나 이상의 모듈로서 구현될 수 있다.
컴퓨터로 판독 가능한 매체는 기계로 판독 가능한 저장 장치, 기계로 판독 가능한 저장 기판, 메모리 장치, 기계로 판독 가능한 전파형 신호에 영향을 미치는 물질의 조성물 혹은 이들 중 하나 이상의 조합일 수 있다.
본 명세서에서 '시스템'이나 '장치'라 함은 예컨대 프로그래머블 프로세서, 컴퓨터 혹은 다중 프로세서나 컴퓨터를 포함하여 데이터를 처리하기 위한 모든 기구, 장치 및 기계를 포괄한다. 처리 시스템은, 하드웨어에 부가하여, 예컨대 프로세서 펌웨어를 구성하는 코드, 프로토콜 스택, 데이터베이스 관리 시스템, 운영 체제 혹은 이들 중 하나 이상의 조합 등 요청 시 컴퓨터 프로그램에 대한 실행 환경을 형성하는 코드를 포함할 수 있다.
컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 어플리케이션, 스크립트 혹은 코드로도 알려져 있음)은 컴파일되거나 해석된 언어나 선험적 혹은 절차적 언어를 포함하는 프로그래밍 언어의 어떠한 형태로도 작성될 수 있으며, 독립형 프로그램이나 모듈, 컴포넌트, 서브루틴 혹은 컴퓨터 환경에서 사용하기에 적합한 다른 유닛을 포함하여 어떠한 형태로도 전개될 수 있다. 컴퓨터 프로그램은 파일 시스템의 파일에 반드시 대응하는 것은 아니다. 프로그램은 요청된 프로그램에 제공되는 단일 파일 내에, 혹은 다중의 상호 작용하는 파일(예컨대, 하나 이상의 모듈, 하위 프로그램 혹은 코드의 일부를 저장하는 파일) 내에, 혹은 다른 프로그램이나 데이터를 보유하는 파일의 일부(예컨대, 마크업 언어 문서 내에 저장되는 하나 이상의 스크립트) 내에 저장될 수 있다. 컴퓨터 프로그램은 하나의 사이트에 위치하거나 복수의 사이트에 걸쳐서 분산되어 통신 네트워크에 의해 상호 접속된 다중 컴퓨터나 하나의 컴퓨터 상에서 실행되도록 전개될 수 있다.
한편, 컴퓨터 프로그램 명령어와 데이터를 저장하기에 적합한 컴퓨터로 판독 가능한 매체는, 예컨대 EPROM, EEPROM 및 플래시메모리 장치와 같은 반도체 메모리 장치, 예컨대 내부 하드디스크나 외장형 디스크와 같은 자기 디스크, 자기광학 디스크 및 CD-ROM과 DVD-ROM 디스크를 포함하여 모든 형태의 비휘발성 메모리, 매체 및 메모리 장치를 포함할 수 있다. 프로세서와 메모리는 특수 목적의 논리 회로에 의해 보충되거나, 그것에 통합될 수 있다.
본 명세서에서 설명한 주제의 구현물은 예컨대 데이터 서버와 같은 백엔드 컴포넌트를 포함하거나, 예컨대 어플리케이션 서버와 같은 미들웨어 컴포넌트를 포함하거나, 예컨대 사용자가 본 명세서에서 설명한 주제의 구현물과 상호 작용할 수 있는 웹 브라우저나 그래픽 유저 인터페이스를 갖는 클라이언트 컴퓨터와 같은 프론트엔드 컴포넌트 혹은 그러한 백엔드, 미들웨어 혹은 프론트엔드 컴포넌트의 하나 이상의 모든 조합을 포함하는 연산 시스템에서 구현될 수도 있다. 시스템의 컴포넌트는 예컨대 통신 네트워크와 같은 디지털 데이터 통신의 어떠한 형태나 매체에 의해서도 상호 접속 가능하다.
본 명세서는 다수의 특정한 구현물의 세부사항들을 포함하지만, 이들은 어떠한 발명이나 청구 가능한 것의 범위에 대해서도 제한적인 것으로서 이해되어서는 안되며, 오히려 특정한 발명의 특정한 실시형태에 특유할 수 있는 특징들에 대한 설명으로서 이해되어야 한다. 마찬가지로, 개별적인 실시형태의 문맥에서 본 명세서에 기술된 특정한 특징들은 단일 실시형태에서 조합하여 구현될 수도 있다. 반대로, 단일 실시형태의 문맥에서 기술한 다양한 특징들 역시 개별적으로 혹은 어떠한 적절한 하위 조합으로도 복수의 실시형태에서 구현 가능하다. 나아가, 특징들이 특정한 조합으로 동작하고 초기에 그와 같이 청구된 바와 같이 묘사될 수 있지만, 청구된 조합으로부터의 하나 이상의 특징들은 일부 경우에 그 조합으로부터 배제될 수 있으며, 그 청구된 조합은 하위 조합이나 하위 조합의 변형물로 변경될 수 있다.
또한, 본 명세서에서는 특정한 순서로 도면에서 동작들을 묘사하고 있지만, 이는 바람직한 결과를 얻기 위하여 도시된 그 특정한 순서나 순차적인 순서대로 그러한 동작들을 수행하여야 한다거나 모든 도시된 동작들이 수행되어야 하는 것으로 이해되어서는 안 된다. 특정한 경우, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다. 또한, 상술한 실시형태의 다양한 시스템 컴포넌트의 분리는 그러한 분리를 모든 실시형태에서 요구하는 것으로 이해되어서는 안되며, 설명한 프로그램 컴포넌트와 시스템들은 일반적으로 단일의 소프트웨어 제품으로 함께 통합되거나 다중 소프트웨어 제품에 패키징될 수 있다는 점을 이해하여야 한다
이와 같이, 본 명세서는 그 제시된 구체적인 용어에 본 발명을 제한하려는 의도가 아니다. 따라서, 상술한 예를 참조하여 본 발명을 상세하게 설명하였지만, 당업자라면 본 발명의 범위를 벗어나지 않으면서도 본 예들에 대한 개조, 변경 및 변형을 가할 수 있다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
본 발명에 의하면 온라인 사이트에 접속한 사용자의 온라인 행동에 대해 실시간으로 수집된 로그를 기반으로 연속된 행동에 상응하는 행동 데이터를 생성하고, 행동 데이터를 기반으로 사용자의 구매의도와 관심 아이템을 파악하고, 온라인 사이트에 등록된 복수개의 아이템들을 기반으로 생성된 아이템 모델과 관심 아이템에 상응하는 키워드 벡터 간의 유사도를 고려하여 사용자와 연관된 키워드 랭킹 정보를 추출하고, 관심 아이템, 키워드 랭킹 정보 및 구매의도에 포함된 구매확률 중 적어도 하나를 기반으로 사용자에 상응하는 사용자 의도 프로파일을 생성할 수 있다. 또한 본 발명에 의하면 쇼비자들에 대한 탐색 의도를 실시간에 효과적으로 처리함으로써 판매자 또는 제공자들이 고객 별로 개인화된 광고, 프로모션, 쿠폰 등을 효율적으로 제공하여 전자상거래 거래량을 향상시킬 수 있다.
110: 서버 120: 온라인 사이트
121, 500, 800: 아이템 데이터베이스
130: 사용자 140: 네트워크
511, 512, 513: 서비스 채널
610, 620: 아이템 정보 700, 810: 키워드 벡터
820: 아이템 벡터 830: 아이템 모델
910: 로그 920: 구매의도
930: 사용자 의도 프로파일러
940: 관심 아이템 프로파일950: 키워드 랭킹 정보
1010: 통신부 1020: 메모리
1030: 프로세서 1040: 저장부

Claims (10)

  1. 온라인 사이트에 접속한 사용자의 온라인 행동에 대해 실시간으로 수집된 로그를 기반으로 연속된 행동에 상응하는 행동 데이터를 생성하는 단계;
    상기 행동 데이터를 기반으로 상기 사용자의 구매의도와 관심 아이템을 파악하는 단계;
    상기 관심 아이템에 상응하는 키워드 벡터를 획득하고, 상기 온라인 사이트에 등록된 복수개의 아이템들을 기반으로 생성된 아이템 모델과 상기 키워드 벡터 간의 유사도를 고려하여 상기 사용자와 연관된 키워드 랭킹 정보를 추출하는 단계; 및
    상기 관심 아이템, 상기 키워드 랭킹 정보 및 상기 구매의도에 포함된 구매확률 중 적어도 하나를 기반으로 상기 사용자에 상응하는 사용자 의도 프로파일을 생성하는 단계
    를 포함하는 것을 특징으로 하는 사용자 의도 프로파일링 방법.
  2. 청구항 1에 있어서,
    상기 아이템 모델은
    상기 복수개의 아이템들 각각에 상응하게 생성되는 아이템 벡터를 기반으로 학습되는 것을 특징으로 하는 사용자 의도 프로파일링 방법.
  3. 청구항 2에 있어서,
    상기 사용자 의도 프로파일링 방법은
    형태소 기반의 키워드 분석을 통해 상기 복수개의 아이템들 각각에 대한 키워드 집합을 생성하는 단계;
    상기 키워드 집합에 포함된 복수개의 키워드들에 상응하게 복수개의 키워드 벡터들을 생성하는 단계; 및
    상기 복수개의 키워드 벡터들에 키워드 별 가중치를 적용하고, 상기 키워드 별 가중치가 적용된 복수개의 키워드 벡터들 간의 스칼라 곱의 합을 연산하여 상기 아이템 벡터를 생성하는 단계를 더 포함하는 것을 특징으로 하는 사용자 의도 프로파일링 방법.
  4. 청구항 3에 있어서,
    상기 복수개의 키워드 벡터들을 생성하는 단계는
    상기 복수개의 키워드들 각각에 대해 주변 문맥을 고려하여 복수개의 문맥 키워드들을 추출하고, 상기 복수개의 키워드들에 대한 상기 복수개의 문맥 키워드들 각각의 관계를 벡터 값으로 표현하고, 상기 벡터 값을 기반으로 평균 로그 확률이 최대가 되도록 학습을 수행하여 상기 복수개의 키워드 벡터들을 생성하는 것을 특징으로 하는 사용자 의도 프로파일링 방법.
  5. 청구항 3에 있어서,
    상기 키워드 집합을 생성하는 단계는
    상기 복수개의 키워드들 중 기설정된 기준 PMI(Point-wise Mutual Information) 값을 갖는 키워드 쌍이 존재하는 경우, 상기 키워드 쌍을 하나의 복합 키워드로 생성하여 하나의 키워드로 간주하는 것을 특징으로 하는 사용자 의도 프로파일링 방법.
  6. 청구항 3에 있어서,
    상기 사용자 의도 프로파일링 방법은
    아이템 정보 내에서 키워드의 출현 빈도, 키워드가 출현한 아이템의 비율 및 키워드가 출현한 위치 중 적어도 하나를 고려하여 상기 키워드 별 가중치를 산출하는 단계를 더 포함하는 것을 특징으로 하는 사용자 의도 프로파일링 방법.
  7. 청구항 1에 있어서,
    상기 행동 데이터는
    발생 시각, 사용자 아이디, 단말 아이디, URI(Uniform Resource Identifier), 검색어 및 아이템 관련 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 사용자 의도 프로파일링 방법.
  8. 청구항 2에 있어서,
    상기 사용자 의도 프로파일은
    상기 관심 아이템에 상응하는 아이템 벡터에 상기 연속된 행동에 상응하는 행동 패턴의 구매 확률을 가중치로 적용하여 생성된 상기 사용자의 관심 아이템 군 정보를 포함하는 것을 특징으로 하는 사용자 의도 프로파일링 방법.
  9. 청구항 8에 있어서,
    상기 사용자 의도 프로파일링 방법은
    상기 온라인 사이트에 상응하게 생성된 구매 확률 모델과 상기 행동 패턴을 비교하여 상기 구매 확률을 산출하는 단계를 더 포함하는 것을 특징으로 하는 사용자 의도 프로파일링 방법.
  10. 온라인 사이트에 접속한 사용자의 온라인 행동에 대해 실시간으로 수집된 로그 및 상기 온라인 사이트에 등록된 복수개의 아이템들을 기반으로 생성된 아이템 모델을 저장하는 메모리; 및
    상기 로그를 기반으로 연속된 행동에 상응하게 생성된 행동 데이터를 통해 상기 사용자의 구매의도와 관심 아이템을 파악하고, 상기 관심 아이템에 상응하는 키워드 벡터와 상기 아이템 모델 간의 유사도를 고려하여 상기 사용자와 연관된 키워드 랭킹 정보를 추출하고, 상기 관심 아이템, 상기 키워드 랭킹 정보 및 상기 구매의도에 포함된 구매확률 중 적어도 하나를 기반으로 상기 사용자에 상응하는 사용자 의도 프로파일을 생성하는 프로세서
    를 포함하는 것을 특징으로 하는 서버.
KR1020170092567A 2017-07-21 2017-07-21 사용자 의도 프로파일링 방법 및 이를 위한 장치 KR102472572B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020170092567A KR102472572B1 (ko) 2017-07-21 2017-07-21 사용자 의도 프로파일링 방법 및 이를 위한 장치
US16/038,402 US20190026760A1 (en) 2017-07-21 2018-07-18 Method for profiling user's intention and apparatus therefor
CN201810796436.4A CN109285023A (zh) 2017-07-21 2018-07-19 用于剖析用户意图的方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170092567A KR102472572B1 (ko) 2017-07-21 2017-07-21 사용자 의도 프로파일링 방법 및 이를 위한 장치

Publications (2)

Publication Number Publication Date
KR20190010173A true KR20190010173A (ko) 2019-01-30
KR102472572B1 KR102472572B1 (ko) 2022-11-30

Family

ID=65023139

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170092567A KR102472572B1 (ko) 2017-07-21 2017-07-21 사용자 의도 프로파일링 방법 및 이를 위한 장치

Country Status (3)

Country Link
US (1) US20190026760A1 (ko)
KR (1) KR102472572B1 (ko)
CN (1) CN109285023A (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220144647A (ko) * 2021-04-20 2022-10-27 고려대학교 산학협력단 한글 단어 임베딩에서의 어휘 밖 단어표현을 처리하기 위한 방법, 이를 수행하기 위한 기록 매체 및 시스템
WO2023158156A1 (ko) * 2022-02-15 2023-08-24 삼성전자 주식회사 광고 개인화 방법 및 장치
WO2023211243A1 (ko) * 2022-04-29 2023-11-02 네이버 주식회사 전문가 지식을 이용한 최적 경로를 제공하는 방법, 컴퓨터 장치, 및 컴퓨터 프로그램
KR102649926B1 (ko) * 2023-01-18 2024-03-22 쿠팡 주식회사 사용자의 정보를 관리하는 방법 및 그 장치
KR102649920B1 (ko) * 2023-01-18 2024-03-22 쿠팡 주식회사 추천 컨텐츠를 제공하는 방법 및 그 장치

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11055371B2 (en) * 2017-12-06 2021-07-06 Bank Of America Corporation Using smart data filters to create multi-threaded profiles
US11948582B2 (en) 2019-03-25 2024-04-02 Omilia Natural Language Solutions Ltd. Systems and methods for speaker verification
WO2020258303A1 (zh) * 2019-06-28 2020-12-30 西门子股份公司 语义模型实例化方法、系统和装置
US11126793B2 (en) * 2019-10-04 2021-09-21 Omilia Natural Language Solutions Ltd. Unsupervised induction of user intents from conversational customer service corpora
CN112131350B (zh) * 2020-09-30 2024-04-30 腾讯科技(深圳)有限公司 文本标签确定方法、装置、终端及可读存储介质
CN113010785B (zh) * 2021-03-18 2023-06-30 中国联合网络通信集团有限公司 用户推荐方法及设备
CN113379398B (zh) * 2021-08-13 2021-12-28 北京明略软件系统有限公司 一种项目需求的生成方法、装置、电子设备及存储介质
CN114093028A (zh) * 2021-11-19 2022-02-25 济南大学 一种基于意图分析的人机协同方法、系统及机器人
US11977965B1 (en) 2023-05-19 2024-05-07 Morgan Stanley Services Group Inc. Client interest profiles and embeddings for a research organization

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120136591A (ko) * 2011-06-09 2012-12-20 주식회사 와이더플래닛 양방향 맞춤형 광고 제공 시스템 및 그 방법
KR20160065429A (ko) * 2014-11-30 2016-06-09 주식회사 알티웍스 하이브리드 개인화 상품추천 방법
KR101679328B1 (ko) 2015-04-09 2016-11-25 엔에이치엔엔터테인먼트 주식회사 키워드의 프로파일을 수집 및 활용하는 프로파일링 시스템 및 방법
KR20170032748A (ko) * 2015-09-15 2017-03-23 주식회사 케이티 사용자의 의사를 고려하는 모바일 전자 결제 방법, 시스템 및 컴퓨터 프로그램

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120136591A (ko) * 2011-06-09 2012-12-20 주식회사 와이더플래닛 양방향 맞춤형 광고 제공 시스템 및 그 방법
KR20160065429A (ko) * 2014-11-30 2016-06-09 주식회사 알티웍스 하이브리드 개인화 상품추천 방법
KR101679328B1 (ko) 2015-04-09 2016-11-25 엔에이치엔엔터테인먼트 주식회사 키워드의 프로파일을 수집 및 활용하는 프로파일링 시스템 및 방법
KR20170032748A (ko) * 2015-09-15 2017-03-23 주식회사 케이티 사용자의 의사를 고려하는 모바일 전자 결제 방법, 시스템 및 컴퓨터 프로그램

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220144647A (ko) * 2021-04-20 2022-10-27 고려대학교 산학협력단 한글 단어 임베딩에서의 어휘 밖 단어표현을 처리하기 위한 방법, 이를 수행하기 위한 기록 매체 및 시스템
WO2023158156A1 (ko) * 2022-02-15 2023-08-24 삼성전자 주식회사 광고 개인화 방법 및 장치
WO2023211243A1 (ko) * 2022-04-29 2023-11-02 네이버 주식회사 전문가 지식을 이용한 최적 경로를 제공하는 방법, 컴퓨터 장치, 및 컴퓨터 프로그램
KR102649926B1 (ko) * 2023-01-18 2024-03-22 쿠팡 주식회사 사용자의 정보를 관리하는 방법 및 그 장치
KR102649920B1 (ko) * 2023-01-18 2024-03-22 쿠팡 주식회사 추천 컨텐츠를 제공하는 방법 및 그 장치

Also Published As

Publication number Publication date
US20190026760A1 (en) 2019-01-24
KR102472572B1 (ko) 2022-11-30
CN109285023A (zh) 2019-01-29

Similar Documents

Publication Publication Date Title
KR102472572B1 (ko) 사용자 의도 프로파일링 방법 및 이를 위한 장치
US11301761B2 (en) Behavioral prediction for targeted end users
KR102396803B1 (ko) 유통과 물류의 최적화를 위한 마케팅 관리 데이터 제공 방법 및 이를 위한 장치
CN111815415B (zh) 一种商品推荐方法、系统及设备
KR20200123015A (ko) 정보를 추천하는 방법, 장치, 기기 및 저장 매체
US20190012683A1 (en) Method for predicting purchase probability based on behavior sequence of user and apparatus for the same
US9910930B2 (en) Scalable user intent mining using a multimodal restricted boltzmann machine
US20170068993A1 (en) Advertising method and device using cohort-based user analysis platform and marketing platform
US20120290974A1 (en) Systems and methods for providing a discover prompt to augmented content of a web page
CN109155041A (zh) 提供与社交图相关联的基于旅行或促销的推荐
CN112163676A (zh) 多任务服务预测模型训练方法、装置、设备以及存储介质
US20190080352A1 (en) Segment Extension Based on Lookalike Selection
CN109804368A (zh) 用于提供上下文信息的系统和方法
CN106447419A (zh) 基于特征选择的拜访者标识
US11210341B1 (en) Weighted behavioral signal association graphing for search engines
CN113781149A (zh) 信息推荐方法、装置、计算机可读存储介质及电子设备
CN114862480A (zh) 广告投放定向方法及其装置、设备、介质、产品
KR102238438B1 (ko) 규격화된 광고상품을 이용한 광고상품거래 서비스 제공 시스템
US10255246B1 (en) Systems and methods for providing a searchable concept network
US11062371B1 (en) Determine product relevance
JP7454630B2 (ja) ラベル推奨モデルのトレーニング方法及び装置、ラベル取得方法及び装置
CN113139115A (zh) 信息推荐方法、搜索方法、装置及客户端、介质及设备
CN111787042A (zh) 用于推送信息的方法和装置
CN109074552A (zh) 基于知识图来增强联系卡
CN113793161A (zh) 广告投放方法、广告投放装置、可读存储介质及电子设备

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right