KR101970978B1 - 상품 카테고리별 추천 키워드 추출 방법 - Google Patents

상품 카테고리별 추천 키워드 추출 방법 Download PDF

Info

Publication number
KR101970978B1
KR101970978B1 KR1020180016482A KR20180016482A KR101970978B1 KR 101970978 B1 KR101970978 B1 KR 101970978B1 KR 1020180016482 A KR1020180016482 A KR 1020180016482A KR 20180016482 A KR20180016482 A KR 20180016482A KR 101970978 B1 KR101970978 B1 KR 101970978B1
Authority
KR
South Korea
Prior art keywords
keyword
keywords
importance
product
proximity
Prior art date
Application number
KR1020180016482A
Other languages
English (en)
Inventor
문경환
이기천
이동민
Original Assignee
주식회사 클라우드앤티나
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 클라우드앤티나, 한양대학교 산학협력단 filed Critical 주식회사 클라우드앤티나
Priority to KR1020180016482A priority Critical patent/KR101970978B1/ko
Application granted granted Critical
Publication of KR101970978B1 publication Critical patent/KR101970978B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

유사한 상품들이 포함된 상품 카테고리별로 추천 키워드를 추출하는 방법이 개시된다. 상기 상품 카테고리별로 추천 키워드를 추출하는 방법은, 상기 상품 카테고리에 포함된 상품을 판매하는 M(M은 자연수)개의 상품페이지마다 노출되는 키워드들을 선택하는 단계, 상기 M개의 상품페이지 중 m번째(m은 M 이하의 자연수) 상품페이지에서 상기 키워드가 노출되는 순서에 따라 다른 크기를 가지도록 중요도를 설정하는 단계, 상기 키워드별 중요도를 이용하여 i번째 키워드(i는 자연수)와 상기 i번째 키워드에 인접한 j 번째 키워드(j는 자연수) 사이의 근접도를 산출하는 단계 및 상기 근접도를 이용하여 상기 키워드들을 군집화한 후 군집별로 추천 키워드를 추출하는 단계를 포함할 수 있다.

Description

상품 카테고리별 추천 키워드 추출 방법{Method for extracting recommendation keyword per product category}
본 발명은 상품 카테고리별 추천 키워드 추출 방법에 관한 것으로, 특히 기존의 상품페이지의 키워드들을 이용하여 소비자들의 관심이 높은 추천 키워드들을 상품 카테고리별로 자동으로 추출할 수 있는 방법에 관한 것이다.
일반적으로 상품 검색 광고 서비스는 광고하고자 하는 키워드를 선정하고, 선정된 키워드별 입찰 금액을 설정한 후 키워드별 노출 상품을 선정하여 키워드가 입력되면 상기 키워드별 노출 상품을 노출시키는 것을 의미한다.
이와 같이 키워드를 이용하여 광고를 하고자 하는 경우 자신이 판매하고자 하는 상품과 관련하여 어떤 키워드가 소비자에게 가장 관심이 높은지 알기 어려운 문제가 있다. 이러한 문제를 해결하기 위하여 판매량이 높은 유사 상품을 파는 상품페이지들을 방문하여 키워드를 찾을 수 있으나 이는 시간이 많이 들고 상품과 관련된 핵심 키워드를 찾기 어려운 문제가 있다.
본 발명이 해결하고자 하는 과제는 상품 카테고리별로 소비자들의 관심이 높을 것으로 예상되는 추천 키워드들을 자동으로 추출할 수 있는 상품 카테고리별 추천 키워드 추출 방법을 제공하는데 있다.
상기 과제를 달성하기 위한 본 발명의 일 실시예에 따른 유사한 상품들이 포함된 상품 카테고리별로 추천 키워드를 추출하는 방법은, 상기 상품 카테고리에 포함된 상품을 판매하는 M(M은 자연수)개의 상품페이지마다 노출되는 키워드들을 선택하는 단계, 상기 M개의 상품페이지 중 m번째(m은 M 이하의 자연수) 상품페이지에서 상기 키워드가 노출되는 순서에 따라 다른 크기를 가지도록 중요도를 설정하는 단계, 상기 키워드별 중요도를 이용하여 i번째 키워드(i는 자연수)와 상기 i번째 키워드에 인접한 j 번째 키워드(j는 자연수) 사이의 근접도를 산출하는 단계 및 상기 근접도를 이용하여 상기 키워드들을 군집화한 후 군집별로 추천 키워드를 추출하는 단계를 포함할 수 있다.
상기 근접도를 산출하는 단계는, 상기 m번째 상품페이지에서 상기 i번째 키워드의 중요도와 상기 j 번째 키워드의 중요도를 이용하여 상기 i번째 키워드와 상기 j 번째 키워드 사이의 근접도를 산출하는 단계를 포함할 수 있다.
상기 근접도를 산출하는 단계는, 검색엔진에서 제공되는 상기 상품 카테고리별 연관 검색어들을 중요도순으로 P(P는 자연수)개 획득하는 단계, 상기 P개의 검색어들 중 j번째 키워드의 중요도 순위 및 상기 i번째 키워드와 인접한 키워드의 개수를 이용하여 상기 i번째 키워드와 상기 j 번째 키워드 사이의 보정값을 산출하는 단계 및 상기 보정값를 이용하여 상기 i번째 키워드와 상기 j 번째 키워드 사이의 근접도를 보정하는 단계를 포함할 수 있다.
상기 M개의 상품페이지는, 판매량이 높은 상위 M개의 상품의 상품페이지일 수 있고, 상기 키워드들을 선택하는 단계는 상기 M개의 상품페이지마다 상품명 및 상품설명 중 적어도 하나에 노출되는 키워드들을 선택하는 단계를 포함할 수 있다.
본 발명의 기술적 사상에 의한 일 실시예에 따른 상품 카테고리별 추천 키워드 추출 방법은 기존의 상품페이지 또는 판매량이 높은 상품페이지의 키워드들을 이용하여 소비자들의 관심이 높은 추천 키워드들을 상품 카테고리별로 자동으로 추출함으로써, 판매하고자 하는 제품과 관련하여 가장 관심도가 높은 키워드들을 자동으로 추출할 수 있는 장점이 있다. 또한, 최근 판매량이 높은 상품페이지의 키워드들 뿐 아니라 구글애드워즈, 키워드 플래너 등과 같은 일반적인 검색엔진에서 제공하는 키워드들을 이용하여 추천키워드를 보다 정확하게 추출할 수 있는 장점이 있다. 또한, 본 발명은 이와 같이 추천되는 키워드들을 중요도 순으로 추출할 수 있으므로, 판매자는 중요도가 높은 키워드들 중 자신의 상품과 관련성이 높은 키워드들을 이용하여 제품을 소개함으로써 소비자의 관심도를 쉽게 높일 수 있는 장점이 있다.
본 발명의 상세한 설명에서 인용되는 도면을 보다 충분히 이해하기 위하여 각 도면의 간단한 설명이 제공된다.
도 1은 본 발명의 기술적 사상에 의한 일 실시예에 따른 상품 카테고리별 추천 키워드 추출 방법의 일 실시예이다.
도 2는 본 발명의 기술적 사상에 의한 다른 일 실시예에 따른 상품 카테고리별 추천 키워드 추출 방법이다.
도 3은 도 1 또는 도 2에서 선택된 키워드들의 노출순서의 일 예를 도시한 도면이다.
도 4는 도 3의 키워드들의 중요도를 계산한 상태를 도시한 도면이다.
도 5는 도 4의 키워드들의 중요도를 이용하여 산출된 근접도를 도시한 도면이다.
도 6은 도 2에서의 상기 보정값을 산출하는 과정을 설명하기 위한 도면이다.
도 7은 도 5의 근접도를 도 6의 보정값을 이용한 보정한 상태의 근접도를 나타낸 도면이다.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 도면에 기재된 내용을 참조하여야 한다.
이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 설명함으로써, 본 발명을 상세히 설명한다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.
도 1은 본 발명의 기술적 사상에 의한 일 실시예에 따른 상품 카테고리별 추천 키워드 추출 방법의 일 실시예이다. 이하 도 1을 참조하여 유사한 상품들이 포함된 상품 카테고리별로 추천 키워드를 추출하는 상품 카테고리별 추천 키워드 추출 방법의 일 실시예에 대하여 설명한다. 이하에서 설명하는 본 발명의 기술적 사상에 의한 일 실시예에 따른 상품 카테고리별 추천 키워드 추출 방법의 각 단계들은 컴퓨터 또는 서버 등에서 수행될 수 있다.
먼저, 상기 상품 카테고리에 포함된 상품을 판매하는 M(M은 자연수)개의 상품페이지마다 노출되는 키워드들이 선택될 수 있다(S110). 상기 키워드는 상기 상품페이지마다 상품명 및 상품설명 중 적어도 하나에 노출되는 키워드일 수 있다. 이와 같은 키워드는 문자로 상기 상품페이지에 노출되어 있을 수도 있고 이미지 또는 동영상 등으로 통하여 상품페이지에 노출되어 있을 수도 있다. 상기 M개의 상품페이지는 판매량이 높은 상위 M개의 상품의 상품페이지일 수 있다. 다만, 본 발명에서 상기 상품페이지 M개를 선택함에 있어 반드시 판매량만을 기준으로 하는 것은 아니며, 사용자 방문수, 구매후기 등과 같은 다양한 요소를 기준으로 M개의 상품페이지를 선택할 수도 있다.
상기 M개의 상품페이지 중 m번째(m은 M 이하의 자연수) 상품페이지에서 상기 키워드가 노출되는 순서에 따라 다른 크기를 가지도록 중요도가 설정될 수 있다(S120). 즉, 상기 상품페이지에서 먼저 노출되는 키워드 일수록 중요한 키워드일 가능성이 높으므로, 본 발명에서는 노출되는 순서에 따라 상기 중요도를 다르게 설정한다. 예를 들어, 10개의 상품페이지가 S110 단계에서 선택된 경우, S120 단계는 10개의 상품페이지에 대하여 개별적으로 수행될 수 있다. 즉, S120 단계는 M개의 상품페이지 각각에 대하여 개별적으로 수행되며, 총 M번 수행될 수 있다.
상기 키워드별 중요도는 먼저 노출될수록 큰 값을 가지고 뒤에 노출될수록 작은 값을 가지도록 상기 키워드별로 중요도가 설정될 수 있다. 예를 들어, 가장 먼저 노출되는 키워드는 중요도 1, 두 번째로 노출되는 키워드는 1/2, 세 번째로 노출되는 키워드는 1/3과 같이 순차적으로 중요도가 낮게 설정될 수 있다. 다만, 본 발명이 이 경우에 한정되는 것은 아니며 상기 키워드별 중요도는 먼저 노출될수록 작은 값을 가지고 뒤에 노출될수록 큰 값을 가지도록 상기 중요도가 설정될 수도 있다. 또한, 상기 중요도가 점점 낮게 설정되거나 점점 높게 설정됨에 있어 특별한 규칙을 가지고 변하여야 하는 것은 아니며, 불규칙하게 또는 랜덤하게 중요도가 변할 수도 있다.
예를 들어, 상기 중요도는 아래의 수학식 1을 이용하여 설정될 수 있다.
Figure 112018014669469-pat00001
(
Figure 112018014669469-pat00002
는 m번째 상품페이지에서 k번째(k는 자연수) 키워드의 중요도, a는 상수)
즉, 수학식 1의 경우 m번째 상품페이지에서 k번째(k는 자연수) 키워드의 중요도(
Figure 112018014669469-pat00003
)는 k에 상수 a를 곱한 값의 역수로 정의되고 있다. 만약, a가 1이라면 첫 번째로 노출된 키워드의 중요도는 1, 두 번째로 노출된 키워드의 중요도는 1/2, 세 번째로 노출된 키워드의 중요도는 1/3이 될 수 있다.
S120 단계를 통하여 산출된 키워드별 중요도를 이용하여 i번째 키워드(i는 자연수)와 상기 i번째 키워드에 인접한 j번째 키워드 사이의 근접도를 산출할 수 있다(S130). i와 j는 S110 단계에서 선택된 키워드들의 개수와 같거나 작은 자연수이다. 상기 근접도는 상기 i번째 키워드와 상기 j번째 키워드가 인접하게 위치하는 경우 상기 i번째 키워드의 중요도와 상기 j번째 키워드의 중요도를 고려하여 산출될 수 있다. 예를 들어, 상기 m번째 상품페이지에서 상기 i번째 키워드와 상기 j번째 키워드 사이의 근접도(
Figure 112018014669469-pat00004
)는 수학식 2를 이용하여 산출될 수 있다.
Figure 112018014669469-pat00005
(
Figure 112018014669469-pat00006
는 i번째 키워드와 j번째 키워드가 인접하여 노출되는 모든 상품페이지의 집합,
Figure 112018014669469-pat00007
는 m번째 상품페이지에서 i번째 키워드의 중요도,
Figure 112018014669469-pat00008
는 m번째 상품페이지에서 j번째 키워드의 중요도)
S130 단계에서 산출된 상기 키워드별 근접도를 이용하여 상기 키워드들을 군집화한 후 군집별로 추천키워드를 추출할 수 있다(S140). 예를 들어, N(N은 자연수)개의 키워드들에 대하여 S120 단계 및 S130 단계를 수행한 경우, 상기 키워드별 근접도는 N X N 행렬로 나타낼 수 있으며, 이와 같이 표현된 행렬을 이용하여 상기 키워드들을 군집화할 수 있다. 상기 키워드를 군집화함에 있어서는 다양한 방법에 사용될 수 있으므로, 군집화하는 방법에 대하여 구체적인 설명은 생략한다.
예를 들어, 아래의 수학식 3과 같은 RWR(Random Walk with Restart) 알고리즘을 이용하여 상기 키워드를 군집화한 후 추천키워드를 추출할 수 있다.
Figure 112018014669469-pat00009
(r은 상기 키워드가 노출되는 순서에 관한 벡터, c는 상수, W는 상기 키워드들의 근접도와 관련된 행렬,
Figure 112018014669469-pat00010
는 사용자가 키워드를 입력한 경우 사용자가 입력한 키워드의 개수의 역수이고 사용자가 키워드를 입력하지 않은 경우에는 0)
수학식 3의 RWR 알고리즘은
Figure 112018014669469-pat00011
Figure 112018014669469-pat00012
의 값의 차이가 일정범위 이하로 낮아질 경우 수렴했다고 보아 계산을 중단할 수 있다. 초기
Figure 112018014669469-pat00013
Figure 112018014669469-pat00014
로 고정되며, 이후 수렴되면 클러스터링 알고리즘을 통하여 클러스터별로 키워드를 추출할 수 있다.
도 2는 본 발명의 기술적 사상에 의한 다른 일 실시예에 따른 상품 카테고리별 추천 키워드 추출 방법이다. 이하 도 1 및 도 2를 참조하여 유사한 상품들이 포함된 상품 카테고리별로 추천 키워드를 추출하는 상품 카테고리별 추천 키워드 추출 방법의 다른 일 실시예에 대하여 설명한다. 이하에서 설명하는 본 발명의 기술적 사상에 의한 다른 일 실시예에 따른 상품 카테고리별 추천 키워드 추출 방법의 각 단계들도 컴퓨터 또는 서버 등에서 수행될 수 있다.
도 2의 실시예는 도 1의 실시예에서 S240 단계 및 S250 단계가 추가된 실시예이다. 즉, 도 2의 S210, S220, S230, S260 단계는 도 1의 S110, S120, S130, S140 단계와 거의 유사하므로, 중복된 부분은 도 1과 관련된 설명으로 대체한다.
먼저, 상기 상품 카테고리에 포함된 상품을 판매하는 M개의 상품페이지마다 노출되는 키워드들이 선택될 수 있다(S210). 그리고, 상기 M개의 상품페이지 중 상기 m번째 상품페이지에서 상기 키워드가 노출되는 순서에 따라 다른 크기를 가지도록 중요도가 설정될 수 있다(S220). S220 단계에서 중요도가 설정된 경우, 상기 키워드별 중요도를 이용하여 상기 i번째 키워드와 상기 i번째 키워드에 인접한 상기 j 번째 키워드 사이의 근접도를 산출할 수 있다(S230). S210 내지 S230 단계는 도 1의 S110 내지 S130 단계와 유사하므로, 이하 중복되는 설명은 도 1과 관련된 설명으로 대체한다.
도 2의 실시예에서는 S230 단계까지 수행되어 산출된 근접도를 보정하여 추천키워드의 정확도를 보다 높일 수 있다. 이를 위하여, 검색엔진에서 제공되는 상기 상품 카테고리별 연관 검색어들을 중요도순으로 P(P는 자연수)개 획득하고, 상기 획득된 P개의 검색어에 대하여 보정값을 산출할 수 있다(S240). 즉, S240 단계는 P개의 검색어들 중 j번째 키워드의 중요도 순위 및 상기 i번째 키워드와 인접한 키워드의 개수를 이용하여 상기 i번째 키워드와 상기 j 번째 키워드 사이의 보정값을 산출할 수 있다. 상기 검색엔진은 구글애드워즈, 키워드플래너 등과 같은 검색엔진일 수 있으나, 본 발명의 검색엔진이 이 경우에 한정되는 것은 아니며 상품 카테고리별로 연관 검색어들을 획득할 수 있다면 다른 다양한 검색엔진을 이용할 수도 있다.
상기 보정값은 아래의 수학식 4를 이용하여 산출될 수 있다.
Figure 112018014669469-pat00015
Figure 112018014669469-pat00016
(Pj는 P개의 검색어들 중 j번째 키워드의 중요도 순위, NDi는 i번째 키워드와 인접한 키워드의 개수, b는 상수)
Pj는 P개의 검색어들 중 j번째 키워드의 중요도 순위로써, 예를 들어 100개의 검색어들을 중요도 순으로 나열하는 경우 j번째 키워드의 순위를 의미한다. NDi는 i번째 키워드와 인접한 키워드의 개수로서, 이미 카운트된 인접한 키워드와 동일한 키워드는 다시 카운트되지 않을 수 있다. 예를 들어, 제 1 키워드와 인접한 제 2 키워드가 3번 검색되더라도, 제 1 키워드와 인접한 제 2 키워드의 개수는 한 번만 카운트된다. 다만, 본 발명에서 반드시 중복 카운트를 하지 않아야 하는 것은 아니며, 필요에 따라 중복해서 카운트한 값을 NDi로 설정할 수도 있다.
이와 같이 설정된 상기 i번째 키워드와 상기 j 번째 키워드 사이의 보정값을 이용하여 상기 i번째 키워드와 상기 j 번째 키워드 사이의 근접도를 보정할 수 있다(S250). 상기 보정된 근접도(
Figure 112018014669469-pat00017
)는 아래의 수학식 5를 이용하여 계산될 수 있다.
Figure 112018014669469-pat00018
(
Figure 112018014669469-pat00019
는 상기 i번째 키워드와 상기 j 번째 키워드 사이의 근접도, d는 상수)
예를 들어, 상수 d가 2인 경우, 상기 보정된 근접도는 S230 단계에서 산출된 상기 i번째 키워드와 상기 j 번째 키워드 사이의 근접도의 1/2 값과 상기 보정값의 1/2 값을 더한 값일 수 있다. 다만, 본 발명이 이 경우에 한정되는 것은 아니며, 필요에 따라 d를 조정함으로써 상기 보정값을 어느 정도의 비율로 기존의 근접도에 추가하여 보정할 것인지 결정할 수 있다.
S250 단계에서 보정된 근접도를 이용하여 상기 키워드들을 군집화한 후 군집별로 추천 키워드를 추출할 수 있다(S260). S260 단계는 상기 보정된 근접도를 이용한다는 점을 제외하고는 S140 단계와 유사하므로, 이하 중복되는 설명은 생략한다.
이하에서는 도 3 내지 도 8을 참조하여 추천 키워드를 추출하는 일 예에 대하여 설명한다.
도 3은 도 1 또는 도 2에서 선택된 키워드들의 노출순서의 일 예를 도시한 도면이다.
도 1 내지 도 3를 참조하면, 도 3에는 4개의 상품페이지에서 선택된 키워드들이 도시되어 있다. 즉, 상품페이지 1에는 '키워드 1 - 키워드 3 - 키워드 2 - 키워드 4'의 순서로 노출되어 있고, 상품페이지 2에는 '키워드 1 - 키워드 2 - 키워드 3 - 키워드 4'의 순서로 노출되어 있다. 또한, 상품페이지 3에는 '키워드 3 - 키워드 1 - 키워드 2'의 순서로 노출되어 있고 '키워드 4'는 노출되어 있지 않으며, 상품페이지 4에는 '키워드 2 - 키워드 1 - 키워드 4'의 순서로 노출되어 있고 '키워드 3'은 노출되어 있지 않다.
도 4는 도 3의 키워드들의 중요도를 계산한 상태를 도시한 도면이다. 도 1 내지 도 4를 참조하면, 도 4의 중요도는 도 3의 키워드들의 순서 및 수학식 1(a는 1로 가정)을 이용하여 산출되었다. 즉, 도 4의 중요도는 도 3의 상품페이지별 순서의 역수인 경우이다.
도 5는 도 4의 키워드들의 중요도를 이용하여 산출된 근접도를 도시한 도면이다. 도 1 내지 도 5를 참조하면, 도 5의 근접도는 수학식 2를 이용하여 산출되었다. 예를 들어, 키워드 1과 키워드 2 사이의 근접도(w1,2)는 키워드 1과 키워드 2가 인접한 상품페이지마다 키워드 2의 중요도를 키워드 1의 중요도로 나눈값을 모두 더한 값이다. 즉, 키워드 1과 키워드 2 사이의 근접도(w1,2)는 상품페이지 2에서의 키워드 2의 중요도 '1/2'를 키워드 1의 중요도 '1'로 나눈 값인 '1/2'과 상품페이지 3에서 키워드 2의 중요도인 '1/3'을 키워드 1의 중요도인 '1/2'로 나눈 값인 '2/3'를 더한 값이다. 이와 같은 방법으로 키워드들 사이의 근접도를 계산한 결과가 도 5에 도시되어 있다. 도 5의 키워드별 근접도에서 행은 i와 관련된 값들이고 열은 j와 관련된 값들이다. 예를 들어, w1,2는 키워드 1의 행과 키워드 2의 열이 만나는 위치의 값이다.
도 1의 실시예에서는 이와 같이 산출된 도 5의 키워드들 사이의 근접도를 이용하여 상기 키워드들을 군집화한 후 군집별로 추천 키워드를 추출할 수 있다.
도 6은 도 2에서의 상기 보정값을 산출하는 과정을 설명하기 위한 도면이다. 도 1 내지 도 6을 참조하면, 도 6에서는 상기 검색엔진에서 제공되는 연관검색어들이 10개 획득되었고, 상기 10개의 연관검색어들을 중요도 순으로 나열한 경우 키워드 1의 중요도(P1)은 '1'이고, 키워드 2의 중요도(P2)는 '2'이고 , 키워드 3의 중요도(P3)는 '3'이며, 키워드 4의 중요도(P4)는 '6'인 경우로 가정하였다. 또한, b는 '1'인 것으로 가정하였고 NDi는 이미 카운트된 인접한 키워드와 동일한 키워드는 다시 카운트되지 않는 것으로 가정하였다. 이와 같이 가정된 상태에서 수학식 4를 이용하여 산출된 키워드별 보정값은 도 6에 도시된 것과 같다. 도 6의 키워드별 보정값에서 행은 i와 관련된 값들이고 열은 j와 관련된 값들이다. 예를 들어,
Figure 112018014669469-pat00020
은 키워드 1의 행과 키워드 3의 열이 만나는 위치의 값이다.
도 7은 도 5의 근접도를 도 6의 보정값을 이용한 보정한 상태의 근접도를 나타낸 도면이다. 도 1 내지 도 7을 참조하면, 도 7의 보정된 근접도는 수학식 5를 이용하여 산출된 결과이며, 수학식 5에서 d는 2인 것으로 가정하였다.
도 2의 실시예에서는 이와 같이 산출된 도 7의 보정된 키워드들 사이의 근접도를 이용하여 상기 키워드들을 군집화한 후 군집별로 추천 키워드를 추출할 수 있다.
도 8은 군집별로 추천 키워드를 추출하는 방법을 설명하기 위한 도면이다.
도 1 내지 도 8을 참조하면, 도 8의 행렬은 수학식 3에서의 W 행렬(상기 키워드들의 근접도와 관련된 행렬)을 표시한 것으로, 키워드들(A, B, ... , K)를 행과 열에 배치하고 키워드간의 근접도를 예시적으로 표시한 것이다. 도 8에 도시된 근접도는 키워드별 중요도를 이용하여 산출된 근접도일 수도 있고 상기 보정값을 이용하여 보정된 근접도일 수도 있다.
예를 들어,
Figure 112018014669469-pat00021
가 12 X 1 벡터일 때 입력 키워드가 D라면 D에 상응하는 (4,1)의 자리가 1이 될 수 있다. 그리고 이에 상응하는 수렴된
Figure 112018014669469-pat00022
은 아래와 같다.
Figure 112018014669469-pat00023
이러한 를 통하여 W 행렬에 클러스터링 알고리즘을 적용할 수 있다.
예를 들어, 상기 클러스터링 알고리즘을 적용한 경우, Cluster1 = (B,D,F,G), Cluster2 = (A,C,J,K), Cluster3 = (E,H)로 구성된다고 가정한다. 그렇다면 Cluster1에 해당하는
Figure 112018014669469-pat00024
이므로 추천키워드는 B, D가 될 수 있지만 입력키워드로 D를 넣었으므로 D를 제외하고 B가 cluster 1과 관련된 추천키워드가 될 수 있다. 다른 예로, Cluster2 에 해당하는
Figure 112018014669469-pat00025
이므로, Cluster2과 관련해서는 A와 C가 추천키워드가 될 수 있다.
이상에서와 같이 도면과 명세서에서 최적 실시예가 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.

Claims (9)

  1. 유사한 상품들이 포함된 상품 카테고리별로 추천 키워드를 추출하는 방법에 있어서,
    상기 상품 카테고리에 포함된 상품을 판매하는 M(M은 자연수)개의 상품페이지마다 노출되는 키워드들을 선택하는 단계;
    상기 M개의 상품페이지 중 m번째(m은 M 이하의 자연수) 상품페이지에서 상기 키워드가 노출되는 순서에 따라 다른 크기를 가지도록 중요도를 설정하는 단계;
    상기 키워드별 중요도를 이용하여 i번째 키워드(i는 자연수)와 상기 i번째 키워드에 인접한 j 번째 키워드(j는 자연수) 사이의 근접도를 산출하는 단계; 및
    상기 근접도를 이용하여 상기 키워드들을 군집화한 후 군집별로 추천 키워드를 추출하는 단계를 포함하고,
    상기 근접도를 산출하는 단계는,
    상기 m번째 상품페이지에서 상기 i번째 키워드의 중요도와 상기 j 번째 키워드의 중요도를 이용하여 상기 i번째 키워드와 상기 j 번째 키워드 사이의 근접도를 산출하는 단계를 포함하는 것을 특징으로 하는 상품 카테고리별 추천 키워드 추출 방법.
  2. 제1항에 있어서,
    상기 m번째 상품페이지에서 k번째 키워드의 중요도(
    Figure 112018014669469-pat00026
    )는,
    Figure 112018014669469-pat00027

    (a는 상수)
    인 것을 특징으로 하는 상품 카테고리별 추천 키워드 추출 방법.
  3. 삭제
  4. 제1항에 있어서,
    상기 m번째 상품페이지에서 상기 i번째 키워드와 상기 j 번째 키워드 사이의 근접도(
    Figure 112018014669469-pat00028
    )는,
    Figure 112018014669469-pat00029

    (
    Figure 112018014669469-pat00030
    는 i번째 키워드와 j번째 키워드가 인접하여 노출되는 모든 상품페이지의 집합,
    Figure 112018014669469-pat00031
    는 m번째 상품페이지에서 i번째 키워드의 중요도,
    Figure 112018014669469-pat00032
    는 m번째 상품페이지에서 j번째 키워드의 중요도)
    인 것을 특징으로 하는 상품 카테고리별 추천 키워드 추출 방법.
  5. 제1항에 있어서, 상기 근접도를 산출하는 단계는,
    검색엔진에서 제공되는 상기 상품 카테고리별 연관 검색어들을 중요도순으로 P(P는 자연수)개 획득하는 단계; 및
    상기 P개의 검색어들 중 j번째 키워드의 중요도 순위 및 상기 i번째 키워드와 인접한 키워드의 개수를 이용하여 상기 i번째 키워드와 상기 j 번째 키워드 사이의 보정값을 산출하는 단계; 및
    상기 보정값를 이용하여 상기 i번째 키워드와 상기 j 번째 키워드 사이의 근접도를 보정하는 단계를 더 포함하는 것을 특징으로 하는 상품 카테고리별 추천 키워드 추출 방법.
  6. 제5항에 있어서,
    상기 i번째 키워드와 상기 j 번째 키워드 사이의 상기 보정값(
    Figure 112018014669469-pat00033
    )은,
    Figure 112018014669469-pat00034

    Figure 112018014669469-pat00035

    (Pj는 P개의 검색어들 중 j번째 키워드의 중요도 순위, NDi는 i번째 키워드와 인접한 키워드의 개수, b는 상수)
    이고,
    상기 i번째 키워드와 상기 j 번째 키워드 사이의 상기 보정된 근접도(
    Figure 112018014669469-pat00036
    )는,
    Figure 112018014669469-pat00037

    (
    Figure 112018014669469-pat00038
    는 상기 i번째 키워드와 상기 j 번째 키워드 사이의 근접도, d는 상수)
    인 것을 특징으로 하는 상품 카테고리별 추천 키워드 추출 방법.
  7. 제1항에 있어서, 상기 군집별로 추천 키워드를 추출하는 단계는,
    RWR(Random Walk with Restart) 알고리즘
    Figure 112018014669469-pat00039

    (r은 상기 키워드가 노출되는 순서에 관한 벡터, c는 상수, W는 상기 키워드들의 근접도와 관련된 행렬,
    Figure 112018014669469-pat00040
    는 사용자가 키워드를 입력한 경우 사용자가 입력한 키워드의 개수의 역수이고 사용자가 키워드를 입력하지 않은 경우에는 0)
    을 이용하여 군집별로 추천 키워드를 추출하는 단계를 포함하는 것을 특징으로 하는 상품 카테고리별 추천 키워드 추출 방법.
  8. 제1항에 있어서, 상기 M개의 상품페이지는,
    판매량이 높은 상위 M개의 상품의 상품페이지인 것을 특징으로 하는 상품 카테고리별 추천 키워드 추출 방법.
  9. 제1항에 있어서, 상기 키워드들을 선택하는 단계는,
    상기 M개의 상품페이지마다 상품명 및 상품설명 중 적어도 하나에 노출되는 키워드들을 선택하는 단계를 포함하는 것을 특징으로 하는 상품 카테고리별 추천 키워드 추출 방법.
KR1020180016482A 2018-02-09 2018-02-09 상품 카테고리별 추천 키워드 추출 방법 KR101970978B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180016482A KR101970978B1 (ko) 2018-02-09 2018-02-09 상품 카테고리별 추천 키워드 추출 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180016482A KR101970978B1 (ko) 2018-02-09 2018-02-09 상품 카테고리별 추천 키워드 추출 방법

Publications (1)

Publication Number Publication Date
KR101970978B1 true KR101970978B1 (ko) 2019-04-22

Family

ID=66283022

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180016482A KR101970978B1 (ko) 2018-02-09 2018-02-09 상품 카테고리별 추천 키워드 추출 방법

Country Status (1)

Country Link
KR (1) KR101970978B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022080701A1 (ko) * 2020-10-15 2022-04-21 한국정보공학 주식회사 노출지수를 이용한 검색어 추천 방법 및 이를 위한 장치
KR20230029310A (ko) * 2021-08-24 2023-03-03 주식회사 비씨디코퍼레이션 E-커머스 통합 상품 관리 시스템의 국내 온라인 마켓 연동 장치 및 이를 이용한 등록 상품 관리 방법
KR102607872B1 (ko) 2022-12-29 2023-11-29 주식회사 바이스퀘어 인공지능을 이용한 광고주 상품의 포털 사이트별 핵심 키워드 및 연관 키워드 추천 시스템
WO2023249153A1 (ko) * 2022-06-22 2023-12-28 쿠팡 주식회사 전자 장치 및 그의 정보 제공 방법
WO2023249154A1 (ko) * 2022-06-22 2023-12-28 쿠팡 주식회사 전자 장치 및 그의 정보 제공 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110137177A (ko) * 2010-06-16 2011-12-22 주식회사 다음커뮤니케이션 키워드 추천 장치 및 키워드 추천 방법
KR101621735B1 (ko) * 2015-01-07 2016-05-17 주식회사 카카오 추천 검색어 제공 방법 및 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110137177A (ko) * 2010-06-16 2011-12-22 주식회사 다음커뮤니케이션 키워드 추천 장치 및 키워드 추천 방법
KR101621735B1 (ko) * 2015-01-07 2016-05-17 주식회사 카카오 추천 검색어 제공 방법 및 시스템

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022080701A1 (ko) * 2020-10-15 2022-04-21 한국정보공학 주식회사 노출지수를 이용한 검색어 추천 방법 및 이를 위한 장치
KR20230029310A (ko) * 2021-08-24 2023-03-03 주식회사 비씨디코퍼레이션 E-커머스 통합 상품 관리 시스템의 국내 온라인 마켓 연동 장치 및 이를 이용한 등록 상품 관리 방법
KR102574980B1 (ko) * 2021-08-24 2023-09-06 주식회사 비씨디코퍼레이션 E-커머스 통합 상품 관리 시스템의 국내 온라인 마켓 연동 장치 및 이를 이용한 등록 상품 관리 방법
WO2023249153A1 (ko) * 2022-06-22 2023-12-28 쿠팡 주식회사 전자 장치 및 그의 정보 제공 방법
WO2023249154A1 (ko) * 2022-06-22 2023-12-28 쿠팡 주식회사 전자 장치 및 그의 정보 제공 방법
KR102607872B1 (ko) 2022-12-29 2023-11-29 주식회사 바이스퀘어 인공지능을 이용한 광고주 상품의 포털 사이트별 핵심 키워드 및 연관 키워드 추천 시스템

Similar Documents

Publication Publication Date Title
KR101970978B1 (ko) 상품 카테고리별 추천 키워드 추출 방법
US11748379B1 (en) Systems and methods for generating and implementing knowledge graphs for knowledge representation and analysis
US20210271975A1 (en) User tag generation method and apparatus, storage medium, and computer device
US8250066B2 (en) Search results ranking method and system
JP5576376B2 (ja) 拡張キーワードプールを用いる検索方法およびシステム
US9064263B2 (en) System and method for advertisement placement
WO2020147594A1 (zh) 获取实体间关系表达的方法、系统和设备、广告召回系统
US9600581B2 (en) Personalized recommendations on dynamic content
US20080183660A1 (en) Content identification expansion
CN103970850B (zh) 网站信息推荐方法和系统
US10754896B2 (en) Transforming a description of services for web services
JP6261547B2 (ja) 判定装置、判定方法及び判定プログラム
CN108573041B (zh) 基于加权信任关系的概率矩阵分解推荐方法
CN110503506B (zh) 基于评分数据的物品推荐方法、装置及介质
US10135933B2 (en) Apparatus and method for generating dynamic similarity audiences
JP2014532928A (ja) 検索結果をランク付けする方法および装置ならびに検索方法および装置
CN109906450A (zh) 用于通过相似性关联对电子信息排名的方法和装置
US20210110458A1 (en) Faceted item recommendation system
KR101818717B1 (ko) 컨셉 키워드 확장 데이터 셋을 이용한 검색방법, 장치 및 컴퓨터로 판독 가능한 기록매체
CN112231555B (zh) 基于用户画像标签的召回方法、装置、设备及存储介质
US20180075035A1 (en) Store-Specific Recommendation Engine
US20110238491A1 (en) Suggesting keyword expansions for advertisement selection
CN113837842A (zh) 一种基于用户行为数据的商品推荐方法及设备
US11244014B2 (en) System and method for enhancing exploration of data items
CN106682190B (zh) 标签知识库的构建方法、装置、应用搜索方法和服务器

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant