KR20150101536A - 쇼핑몰의 동일 상품 판별 장치 및 방법 - Google Patents

쇼핑몰의 동일 상품 판별 장치 및 방법 Download PDF

Info

Publication number
KR20150101536A
KR20150101536A KR1020140022929A KR20140022929A KR20150101536A KR 20150101536 A KR20150101536 A KR 20150101536A KR 1020140022929 A KR1020140022929 A KR 1020140022929A KR 20140022929 A KR20140022929 A KR 20140022929A KR 20150101536 A KR20150101536 A KR 20150101536A
Authority
KR
South Korea
Prior art keywords
product
goods
same
information
products
Prior art date
Application number
KR1020140022929A
Other languages
English (en)
Other versions
KR102215436B1 (ko
Inventor
김민성
Original Assignee
에스케이플래닛 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이플래닛 주식회사 filed Critical 에스케이플래닛 주식회사
Priority to KR1020140022929A priority Critical patent/KR102215436B1/ko
Publication of KR20150101536A publication Critical patent/KR20150101536A/ko
Application granted granted Critical
Publication of KR102215436B1 publication Critical patent/KR102215436B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0629Directed, with specific intent or strategy for generating comparisons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0605Supply or demand aggregation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

쇼핑몰의 동일 상품 판별 장치 및 방법이 개시된다. 쇼핑몰에 등록된 상품들의 등록 정보를 획득하고, 등록 정보를 이용하여 산출한 유사도와 상품 이력 정보를 이용하여 상품 간의 동일 여부를 판단할 수 있다. 판단한 동일 상품들의 상품 아이디를 대표 상품 아이디로 치환하고, 구매자의 구매 이력에 포함된 해당 상품의 아이디를 대표 상품 아이디로 치환하여 구매자가 구매한 상품과 연관성 있는 상품을 추천하는 것이 가능하다.

Description

쇼핑몰의 동일 상품 판별 장치 및 방법{APPARATUS AND METHOD FOR DISTINGUISHING SAME PRODUCT IN SHOPPING MALL}
본 발명은 쇼핑몰에 등록된 상품들이 동일 상품인지 여부를 판별하는 쇼핑몰의 동일 상품 판별 장치 및 방법에 관한 것으로, 특히 상품들의 등록 정보를 이용하여 상품 간의 유사도를 산출하고, 산출한 유사도와 상품 이력 정보를 통해 상품 간의 동일 여부를 판단할 수 있는 쇼핑몰의 동일 상품 판별 장치 및 방법에 관한 것이다.
국내의 일반적인 어플리케이션 마켓 또는 중고샵 등은 상품 판매자들이 자율적으로 상품을 등록하고 판매하는 오픈 마켓 플레이스 형태를 갖추고 있는 온라인 쇼핑몰이다. 이러한 온라인 쇼핑몰은 다양한 판매자들이 동일한 상품을 서로 경쟁적으로 판매하기 때문에, 동일한 상품에 대해서 서로 다른 설명의 메타 데이터를 등록하는 경우가 많아 동일한 상품으로 인지하지 못하고, 이로 인해 추천 데이터의 생성에 어려움을 겪고 있다. 방대한 양의 상품 정보로 인해 상품 구입을 희망하는 사용자에게는 쇼핑몰의 효율적인 추천 상품 서비스가 필요하여, 이 때 쇼핑몰에 등록된 상품들 중 동일한 상품을 판별할 수 있다면 정교한 상품 추천 서비스를 제공함과 동시에 쇼핑몰의 운영에 있어서 긍정적인 효과를 가져올 수 있다.
따라서, 정교하게 동일 상품을 판별하기 위해서, 쇼핑몰에 등록된 상품들의 등록 정보를 획득하고, 획득한 등록 정보를 이용하여 상품 간의 유사도를 산출해 동일 여부를 판단할 수 있는 쇼핑몰의 동일 상품 판별 기술의 필요성이 절실하게 대두된다.
한국 공개 특허 제10-2012-0020502A호, 2012년 3월 8일 공개 (명칭: 인터넷 쇼핑몰의 상품 정보 연동 시스템 및 그 방법)
본 발명의 목적은, 판매자들이 쇼핑몰에 등록한 상품들이 동일한 상품인지 여부를 판단하여 구매자들이 상품 검색 시 보다 효율적으로 상품을 비교할 수 있도록 상품 정보를 제공하는 것이다.
또한, 본 발명의 목적은 쇼핑몰의 상품 추천 서비스에서 동일 상품의 판별을 통해 정돈된 상품 정보를 활용함으로써 서비스 사용자와 연관된 상품을 효과적으로 추천할 수 있도록 하는 것이다.
상기한 목적을 달성하기 위한 본 발명에 따른 동일 상품 판별 장치는, 쇼핑몰에 등록된 상품들의 등록 정보를 획득하는 등록 정보 획득부; 상기 획득된 상품들의 등록 정보를 이용하여 상품 간의 유사도를 산출하는 유사도 산출부; 및 상기 산출된 상품 간의 유사도 및 상품 이력 정보 중 하나 이상을 이용하여 상기 상품 간의 동일 여부를 판단하는 동일 상품 판단부를 포함한다.
이 때, 유사도 산출부는 상기 등록 정보에서 특징 데이터를 추출하고, 추출된 특징 데이터를 비교하여 상기 상품 간의 유사도를 산출할 수 있다.
이 때, 등록 정보는 상기 상품들의 메타 정보, 이미지 정보 및 컨텐츠 정보 중 하나 이상을 포함할 수 있다.
이 때, 특징 데이터는 상기 메타 정보 중의 상품 제목, 설명, 가격 및 출시 년도 중 하나 이상을 포함하고, 상기 이미지 정보 중의 상품 대표 이미지를 포함하고, 상기 컨텐츠 정보 중의 머리글, 목차, 출판사, 표지 이미지 및 영상의 스틸 이미지 중 하나 이상을 포함할 수 있다.
이 때, 상품 이력 정보는 구매자 정보 및 클릭자 정보 중 하나 이상을 포함할 수 있다.
이 때, 동일 상품 판단부는 상기 구매자 정보를 이용하여 상기 상품들의 동시 구매자 정보를 획득하는 동시 구매자 정보 획득부를 포함할 수 있다.
이 때, 동일 상품 판단부는 상기 상품 간의 유사도가 기설정된 값 이상이고, 동시 구매자가 존재하는 경우, 상기 상품들의 종류를 판단하는 상품 종류 판단부를 더 포함하고, 상기 상품 종류 판단 결과를 기초로 상기 상품 간의 동일 여부를 판단할 수 있다.
이 때, 동일 상품 판단부는 상기 상품 종류 판단부의 판단 결과 상품 종류가 1회성 상품인 경우, 동시 구매자의 수가 미리 설정된 기준치 이상이면 상기 상품들을 동일 상품이 아닌 것으로 판단할 수 있다.
이 때, 동일 상품 판단부는 상기 상품 종류 판단부의 판단 결과 상품 종류가 소모성 상품인 경우, 상기 클릭자 정보를 이용하여 상기 상품들의 중복 클릭자 수를 획득하고, 획득된 중복 클릭자 수를 기초로 상기 상품들의 동일 여부를 판단할 수 있다.
이 때, 동일 상품 판단부는 상기 획득된 상품들의 중복 클릭자의 수와 상기 동시 구매자의 수를 비교하고, 비교 결과 상기 중복 클릭자의 수가 상기 동시 구매자의 수보다 미리 설정된 기준치 이상으로 큰 경우 상기 상품들을 동일 상품으로 판단할 수 있다.
이 때, 동일 상품 판별 장치는 상기 동일 상품으로 판단된 상품들의 상품 아이디를 대표 상품 아이디로 치환하는 아이디 치환부; 및 상기 치환된 대표 상품 아이디 정보를 이용하여 구매자의 구매 이력에 포함된 상품 중의 해당하는 상품의 아이디를 상기 대표 상품 아이디로 치환하여 구매 이력을 수정하는 구매 이력 수정부를 더 포함할 수 있다.
이 때, 동일 상품 판별 장치는 상기 수정된 구매 이력을 이용하여 상기 구매자가 구매한 상품과 연관성 있는 상품을 추천하는 연관 상품 추천부를 더 포함할 수 있다.
또한, 본 발명에 따른 동일 상품 판별 방법은, 쇼핑몰에 등록된 상품들의 등록 정보를 획득하는 단계; 상기 획득된 상품들의 등록 정보를 이용하여 상품 간의 유사도를 산출하는 단계; 상기 상품들의 상품 이력 정보를 획득하는 단계; 및 상기 산출된 상품 간의 유사도 및 상기 획득된 상품 이력 정보 중 하나 이상을 이용하여 상기 상품 간의 동일 여부를 판단하는 단계를 포함한다.
이 때, 유사도를 산출하는 단계는 상기 등록 정보에서 특징 데이터를 추출하는 단계를 더 포함하고, 상기 추출된 특징 데이터를 비교하여 상기 상품 간의 유사도를 산출할 수 있다.
이 때, 상기 동일 여부를 판단하는 단계는 상기 상품 이력 정보 중의 구매자 정보를 이용하여 상기 상품의 동시 구매자가 존재하는지 판단하는 단계; 상기 판단 결과 동시 구매자가 존재하면 상기 상품의 종류를 판단하는 단계; 및 상기 상품의 종류를 판단한 결과에 기초하여 상기 동일 여부를 판단하는 단계를 포함할 수 있다.
이 때, 상기 상품 종류 판단 결과에 기초하여 동일 여부를 판단하는 단계는 상기 판단 결과 상품의 종류가 1회성 상품이면, 동시 구매자의 수와 미리 설정된 기준치를 비교하여 상기 상품들의 동일 여부를 판단할 수 있다.
이 때, 상기 상품 종류 판단 결과에 기초하여 동일 여부를 판단하는 단계는 상기 판단 결과 상품의 종류가 소모성 상품이면, 상기 상품 이력 정보 중의 클릭자 정보를 이용하여 상기 상품의 중복 클릭자 수를 획득하는 단계; 및 상기 획득된 중복 클릭자 수와 상기 상품의 구매자 수를 비교하여 상기 상품 간의 동일 여부를 판단하는 단계를 포함할 수 있다.
본 발명에 따르면, 메타 정보가 불충분한 경우에도 구매자와 클릭자 정보만을 이용하여 동일 상품을 판별할 수 있고, 보다 정교한 동일 상품 정보를 구축할 수 있다.
또한, 본 발명은 쇼핑몰 사용자에게 상품을 추천함에 있어서 기존에 사용자가 구매한 상품을 효과적으로 제거할 수 있어 사용자에게 신속하고 편리한 쇼핑 환경을 제공할 수 있다.
도 1은 본 발명의 일실시예에 따른 동일 상품 판별 장치를 나타낸 블록도이다.
도 2는 도 1의 동일 상품 판별 장치 중의 동일 상품 판단부의 상세 블록도이다.
도 3은 본 발명의 일실시예에 따른 동일 상품 판별 장치의 다른 예를 나타낸 블록도이다.
도 4는 본 발명의 일실시예에 따른 동일 상품 판별 방법을 나타낸 동작 흐름도이다.
도 5는 도 2의 동일 상품 판단부에서 동일 상품을 판별하는 과정을 상세하게 나타낸 동작 흐름도이다.
도 6은 본 발명의 일실시예에 따른 동일 상품을 판별하기 위한 구성을 나타낸 도면이다.
도 7은 본 발명의 일실시예에 따라 대표 상품 아이디로 치환된 구매 이력의 예를 설명하기 위한 도면이다.
이하 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 상세히 설명한다. 다만, 하기의 설명 및 첨부된 도면에서 본 발명의 요지를 흐릴 수 있는 공지 기능 또는 구성에 대한 상세한 설명은 생략한다. 또한, 도면 전체에 걸쳐 동일한 구성 요소들은 가능한 한 동일한 도면 부호로 나타내고 있음에 유의하여야 한다.
이하에서 설명되는 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위한 용어의 개념으로 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다. 또한 제 1, 제 2 등의 용어는 다양한 구성요소들을 설명하기 위해 사용하는 것으로, 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용될 뿐, 상기 구성요소들을 한정하기 위해 사용되지 않는다.
도 1은 본 발명의 일실시예에 따른 동일 상품 판별 장치를 나타낸 블록도이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 동일 상품 판별 장치는 등록 정보 획득부(110), 유사도 산출부(120) 및 동일 상품 판단부(130)를 포함할 수 있다.
등록 정보 획득부(110)는 쇼핑몰에 등록된 상품들의 등록 정보를 획득할 수 있다.
이 때, 등록 정보는 상품들의 메타 정보, 이미지 정보 및 컨텐츠 정보 중 하나 이상을 포함할 수 있다. 예를 들어, 메타 정보는 상품의 제목, 설명, 가격 및 출시 년도 등 상품에 대한 설명으로 텍스트 형태로 저장된 데이터를 의미할 수 있으며, 이미지 정보는 상품을 설명하기 위해 등록된 대표 이미지일 수 있다. 컨텐츠 정보는 전자서적, 만화책 및 영상 등의 상품에 따라서 개별 텍스트, 이미지, 영상의 스틸 이미지 등을 포함할 수 있다. 전자서적의 경우 전체 컨텐츠를 비교할 수도 있으나 많은 양의 텍스트 데이터 때문에 과도한 연산이 요구될 수 있으므로 제목, 저자, 요약이나 목차 및 출판사 정보 등의 필수적인 컨텐츠 부분만 선별하여 등록 정보로 이용할 수 있다.
유사도 산출부(120)는 획득된 상품들의 등록 정보를 이용하여 상품 간의 유사한 정도를 의미하는 유사도를 산출할 수 있다.
이 때, 등록 정보에서 상품의 특징이 될 수 있는 특징 데이터를 추출하고, 추출된 특징 데이터를 비교하여 상품 간의 유사도를 산출할 수 있다. 예를 들어, 상품 간에 추출된 모든 특징 데이터 중 유사하다고 판단된 특징 데이터를 백분율로 나타내어 유사도를 산출할 수 있다. 상품 A와 B에서 10개의 특징 데이터를 추출하였을 때, 추출된 특징 데이터 중에서 7개의 특징 데이터가 유사한 경우 해당 상품 간의 유사도는 70퍼센트로 산출할 수 있다.
이 때, 특징 데이터는 메타 정보 중의 상품 제목, 설명, 가격 및 출시 년도 중 하나 이상을 포함하고, 이미지 정보 중의 상품 대표 이미지를 포함하고, 컨텐츠 정보 중의 머리글, 목차, 출판사, 표지 이미지 및 영상의 스틸 이미지 중 하나 이상을 포함할 수 있다.
동일 상품 판단부(130)는 산출된 상품 간의 유사도 및 상품의 구매자나 클릭자와 관련된 상품 이력 정보 중 하나 이상을 이용하여 상품 간의 동일 여부를 판단할 수 있다. 이 때, 상품 이력 정보는 해당 상품을 구매한 구매자 정보 및 해당 상품을 클릭한 클릭자 정보 중 하나 이상을 포함할 수 있다.
동일 상품 판단부(130)는 상품 간의 유사도가 기설정된 값 이상이고, 개별 상품 아이디는 다르지만 동일한 상품을 동시에 구매한 동시 구매자가 존재하는 경우 상품의 종류를 판단하여 동일 여부를 판단할 수 있다. 예를 들어, 유사도에 대해 기설정된 값이 70퍼센트라고 한다면, 상품간의 유사도를 백분율로 나타내었을 때 70퍼센트 이상의 유사도를 갖는 상품일 경우 상품의 동시 구매자 존재 여부를 확인하여 동시 구매자가 존재한다면 상품의 종류를 판단할 수 있다. 만약, 상품 간의 유사도가 70퍼센트 이상이지만 동일 상품이 존재하지 않거나, 상품 간의 유사도가 70퍼센트 이하라고 한다면 상품들이 동일하지 않다고 판단할 수 있다.
동일 상품 판단부(130)는 유사도가 높고 개별 상품 아이디는 다르지만 동일한 상품을 동시에 구매한 동시 구매자가 존재하는 상품이 1번 구매하면 한동안 구매하지 않아도 되는 1회성 상품인지, 상품이 소모되어 계속해서 구매해야 하는 소모성 상품인지 여부를 판단한 결과를 기초로 상품 간의 동일 여부를 판단할 수 있다. 예를 들어, 상품 간의 유사도가 70퍼센트 이상으로 높고 상품의 동시 구매자가 존재하는 1회성 상품일 경우에는, 동시 구매자의 수가 미리 설정된 기준치인 상품 전체 구매자의 10퍼센트 이상이라면 상품들을 동일 상품이 아닌 것으로 판단할 수 있다.
이와 같이 기준치를 설정하는 이유는 일반적으로 1회성 상품이 동일 상품이라면, 개별 상품 아이디는 다르지만 동일한 상품을 동시에 구매한 동시 구매자가 없어야 하지만, 구매자의 실수나 특정 의도에 따라 동시 구매자가 발생할 수도 있기 때문에 적정한 기준치를 설정하여 동일 여부를 판단할 수 있다.
또한, 동일 상품 판단부(130)는 유사도가 높고 개별 상품 아이디는 다르지만 동일한 상품을 동시에 구매한 동시 구매자가 존재하는 소모성 상품에 대해서 상품의 클릭자 정보를 이용하여 상품들의 중복 클릭자 수를 획득하고, 획득된 중복 클릭자 수를 기초로 상품들의 동일 여부를 판단할 수 있다.
이 때, 동일 상품 판단부(130)는 획득된 상품들의 중복 클릭자 수와 동시 구매자의 수를 비교하고, 비교 결과 중복 클릭자의 수가 동시 구매자의 수보다 미리 설정된 기준치 이상으로 큰 경우 상품들을 동일 상품으로 판단할 수 있다. 예를 들어, 유사도가 70퍼센트 이상이고 동시 구매자 존재하는 소모성 상품의 동일 여부를 판단하기 위해 상품을 동시에 클릭해본 중복 클릭자의 수를 획득한다. 미리 설정된 기준치를 전체 클릭자의 20퍼센트라고 한다면 중복 클릭자 수가 전체 클릭자의 20퍼센트이상이면서, 동시 구매자의 수보다 큰 경우에 상품들을 동일 상품으로 판단할 수 있다.
만약, 소모성 상품이면서 중복 클릭자의 수가 동시 구매자의 수보다 미리 설정된 기준치 이하인 경우에는 상품들을 동일하지 않은 상품으로 판단할 수 있다.
이와 같은 장치를 이용하여 쇼핑몰에 등록된 동일 상품을 판별함으로써, 쇼핑몰을 사용하는 구매자가 상품을 검색할 때 보다 효율적으로 상품을 비교할 수 있으며, 구매자의 구매 이력을 통해 연관된 상품을 추천 받을 수 있다. 또한, 메타 정보가 불충분한 경우에도 구매자와 클릭자 정보 등을 이용하여 동일 상품을 판단할 수 있어 보다 편리하게 동일 상품에 대한 정보를 구축할 수 있다.
도 2는 도 1의 동일 상품 판별 장치 중의 동일 상품 판단부의 상세 블록도이다.
도 2를 참조하면, 본 발명의 일실시예에 따른 동일 상품 판단부는 동시 구매자 정보 획득부(210) 및 상품 종류 판단부(220)를 포함할 수 있다.
구매자 정보 획득부(210)는 상품의 구매자 정보를 이용하여 개별 상품 아이디는 다르지만 동일한 상품을 동시에 구매한 동시 구매자 정보를 획득할 수 있다. 이러한 동시 구매자 정보는 동일 상품 여부를 판단할 때 사용될 수 있다. 예를 들어, 상품 A와 상품 B의 유사도가 기설정된 값인 70퍼센트 이상의 유사도를 갖는 상품일 때, 상품 A와 상품 B를 동시에 구매한 동시 구매자 정보를 확인하여 동일 상품 여부를 판단할 수 있다. 대부분 상품을 구매할 때에는 동일한 상품을 동시에 구매하지 않기 때문에 상품 A와 상품 B의 동일 구매자가 존재하는 경우 일반적으로 두 상품이 동일 상품이 아닌 것으로 판단할 수 있다.
상품 종류 판단부(220)는 상품들이 1회성 상품인지 소모성 상품인지 종류를 판단할 수 있다. 동시 구매자 정보 획득부(210)를 통해서 개별 상품 아이디는 다르지만 동일한 상품을 동시에 구매한 동시 구매자가 존재하는 상품인 경우 해당 상품이 1회성 상품인지 소모성 상품인지에 따라서 동일 상품 여부 판단 결과가 달라질 수 있다, 이 때, 동시 구매자가 존재하면서 1회성 상품이라면, 동시 구매자의 수가 미리 설정된 기준치 이상인지 확인하여 동일 상품 여부를 판단할 수 있다. 예를 들어, 미리 설정된 기준치가 전체 구매자의 10퍼센트라고 한다면, 동시 구매자의 수가 10퍼센트에 해당하는 구매자수 이상인지 확인하여 동일 상품 여부를 판단할 수 있다.
이와 같이 기준치를 설정하는 이유는, 1회성 상품이라 하더라도 구매자의 실수로 동일 상품을 구매하는 경우가 발생할 수 있기 때문에, 실수로 동일 상품을 구입할 수 있는 경우를 감안하여 미리 기준치를 설정하고 이 기준치 이상 동시 구매자가 있는 경우에는 두 상품을 동일하지 않다고 판단할 수 있다.
만약, 개별 상품 아이디는 다르지만 동일한 상품을 동시에 구매한 동시 구매자가 존재하면서 소모성 상품이라면, 쇼핑몰에서 두 상품을 클릭한 클릭자 정보를 확인하여 동일 상품 여부를 판단할 수 있다. 소모성 상품의 경우 상품을 사용하여 모두 소모한 뒤에 다시 구입하는 경우가 빈번하게 발생하기 때문에 동시 구매자가 다수 발생할 수 있다. 따라서, 이 때 클릭자 정보를 확인하여 상품들을 모두 클릭한 중복 클릭자의 수가 동시 구매자의 수보다 미리 설정된 기준치 이상으로 큰 경우 상품들을 동일 상품으로 판단할 수 있다. 예를 들어, 상품 A와 상품 B의 동시 구매자가 존재하면서, 두 상품이 소모성 상품이고, 미리 설정된 기준치가 전체 클릭자의 20퍼센트라고 한다면, 상품 A와 상품 B를 모두 클릭한 중복 클릭자가 전제 클릭자의 20퍼센트 이상이면서 동시 구매자의 수보다 큰 경우 상품 A와 상품 B를 동일한 상품으로 판단할 수 있다.
동일한 소모성 상품의 경우 한번 사용했던 상품을 다시 구매해서 사용할 수도 있지만, 동일한 기능의 다른 상품이 있다면 두 상품을 비교하여 보고 구매할 수도 있기 때문에 이런 경우 중복 클릭자의 수가 월등히 높아질 수 있다. 따라서, 이와 같은 경우 동시 구매자의 수와 중복 클릭자의 수를 비교하여 동일 상품 여부를 판단할 수 있다.
이와 같이 상품의 메타 정보, 이미지 정보 및 컨텐츠 정보를 이용하여 상품이 동일한지 여부를 판단하더라도 구매자 정보나 상품의 종류와 같은 정보를 추가적으로 이용하여 더욱 정교하게 상품의 동일 여부를 판단할 수 있기 때문에, 쇼핑몰에서 구매 이력과 연관 지어 추천해주는 상품의 신뢰성이 향상될 수 있다.
도 3은 본 발명의 일실시예에 따른 동일 상품 판별 장치의 다른 예를 나타낸 블록도이다.
도 3을 참조하면, 본 발명의 일실시예에 따른 동일 상품 판별 장치는 등록 정보 획득부(310), 유사도 산출부(320), 동일 상품 판단부(330), 아이디 치환부(340), 구매 이력 수정부(350) 및 연관 상품 추천부(360)를 포함할 수 있다.
등록 정보 획득부(310)는 쇼핑몰에 등록된 상품들의 등록 정보를 획득할 수 있다.
이 때, 등록 정보는 상품들의 메타 정보, 이미지 정보 및 컨텐츠 정보 중 하나 이상을 포함할 수 있다. 예를 들어, 메타 정보는 상품의 제목, 설명, 가격 및 출시 년도 등 상품에 대한 설명으로 텍스트 형태로 저장된 데이터를 의미할 수 있으며, 이미지 정보는 상품을 설명하기 위해 등록된 대표 이미지일 수 있다. 컨텐츠 정보는 전자서적, 만화책 및 영상 등의 상품에 따라서 개별 텍스트, 이미지, 영상의 스틸 이미지 등을 포함할 수 있다. 전자서적의 경우 전체 컨텐츠를 비교할 수도 있으나 많은 양의 텍스트 데이터 때문에 과도한 연산이 요구될 수 있으므로 제목, 저자, 요약이나 목차 및 출판사 정보 등의 필수적인 컨텐츠 부분만 선별하여 등록 정보로 이용할 수 있다.
유사도 산출부(320)는 획득된 상품들의 등록 정보를 이용하여 상품 간의 유사한 정도를 의미하는 유사도를 산출할 수 있다.
이 때, 등록 정보에서 상품의 특징이 될 수 있는 특징 데이터를 추출하고, 추출된 특징 데이터를 비교하여 상품간의 유사도를 산출할 수 있다. 예를 들어, 상품 간에 추출된 모든 특징 데이터 중 유사하다고 판단된 특징 데이터를 백분율로 나타내어 유사도를 산출할 수 있다. 상품 A와 B에서 10개의 특징 데이터를 추출하였을 때, 추출된 특징 데이터 중에서 7개의 특징 데이터가 유사한 경우 해당 상품 간의 유사도는 70퍼센트로 산출할 수 있다.
이 때, 특징 데이터는 메타 정보 중의 상품 제목, 설명, 가격 및 출시 년도 중 하나 이상을 포함하고, 이미지 정보 중의 상품 대표 이미지를 포함하고, 컨텐츠 정보 중의 머리글, 목차, 출판사, 표지 이미지 및 영상의 스틸 이미지 중 하나 이상을 포함할 수 있다.
동일 상품 판단부(330)는 산출된 상품 간의 유사도 및 상품의 구매자나 클릭자와 관련된 상품 이력 정보 중 하나 이상을 이용하여 상품 간의 동일 여부를 판단할 수 있다. 이 때, 상품 이력 정보는 해당 상품을 구매한 구매자 정보 및 해당 상품을 클릭한 클릭자 정보 중 하나 이상을 포함할 수 있다.
동일 상품 판단부(330)는 상품 간의 유사도가 기설정된 값 이상이고, 개별 상품 아이디는 다르지만 동일한 상품을 동시에 구매한 동시 구매자가 존재하는 경우 상품의 종류를 판단할 수 있다. 예를 들어, 유사도에 대해 기설정된 값이 70퍼센트라고 한다면, 상품간의 유사도를 백분율로 나타내었을 때 70퍼센트 이상의 유사도를 갖는 상품일 경우 상품의 동시 구매자 존재 여부를 확인하여 동시 구매자가 존재한다면 상품의 종류를 판단할 수 있다. 만약, 상품 간의 유사도가 70퍼센트 이상이지만 동일 상품이 존재하지 않거나, 상품 간의 유사도가 70퍼센트 이하라고 한다면 상품들이 동일하지 않다고 판단할 수 있다.
동일 상품 판단부(330)는 유사도가 높고 개별 상품 아이디는 다르지만 동일한 상품을 동시에 구매한 동시 구매자가 존재하는 상품이 1번 구매하면 한동안 구매하지 않아도 되는 1회성 상품인지 상품이 소모되어 계속해서 구매해야 하는 소모성 상품인지 여부를 판단한 결과를 기초로 상품 간의 동일 여부를 판단할 수 있다. 예를 들어, 상품 간의 유사도가 70퍼센트 이상으로 높고, 상품의 동시 구매자가 존재하는 1회성 상품일 경우에는 동시 구매자의 수가 미리 설정된 기준치인 상품 전체 구매자의 10퍼센트 이상이라면 상품들을 동일 상품이 아닌 것으로 판단할 수 있다.
이와 같이 기준치를 설정하는 이유는 일반적으로 1회성 상품은 동일 상품이라면 동시 구매자 없어야 하지 구매자의 실수나 특정 의도에 따라 동시 구매자가 발생할 수도 있기 때문에 적정한 기준치를 설정하여 동일 여부를 판단할 수 있다.
또한, 동일 상품 판단부(330)는 유사도가 높고 개별 상품 아이디는 다르지만 동일한 상품을 동시에 구매한 동시 구매자가 존재하는 소모성 상품에 대해서 상품의 클릭자 정보를 이용하여 상품들의 중복 클릭자 수를 획득하고, 획득된 중복 클릭자 수를 기초로 상품들의 동일 여부를 판단할 수 있다.
이 때, 동일 상품 판단부(330)는 획득된 상품들의 중복 클릭자 수와 동시 구매자의 수를 비교하고, 비교 결과 중복 클릭자의 수가 동시 구매자의 수보다 미리 설정된 기준치 이상으로 큰 경우 상품들을 동일 상품으로 판단할 수 있다. 예를 들어, 유사도가 70퍼센트 이상이고 동시 구매자 존재하는 소모성 상품의 동일 여부를 판단하기 위해 상품을 동시에 클릭해본 중복 클릭자의 수를 획득한다. 미리 설정된 기준치를 전체 클릭자의 20퍼센트라고 한다면 중복 클릭자 수가 전체 클릭자의 20퍼센트이상이면서, 동시 구매자의 수보다 큰 경우에 상품들을 동일 상품으로 판단할 수 있다.
만약, 소모성 상품이면서 중복 클릭자의 수가 동시 구매자의 수보다 미리 설정된 기준치 이하인 경우에는 상품들을 동일하지 않은 상품으로 판단할 수 있다.
아이디 치환부(340)는 동일하다고 판단된 상품들이 사용하는 상품 아이디를 대표 상품 아이디로 치환할 수 있다. 예를 들어, 상품 아이디 A1, A2 및 A3를 갖는 3개의 상품이 동일한 상품을 판단되었을 경우 3개의 상품 아이디를 대표 상품 아이디인 A로 치환할 수 있다.
구매 이력 수정부(350)는 치환된 대표 상품 아이디를 이용하여 구매자의 구매 이력에 포함된 상품 중, 다른 상품들과 동일 상품으로 처리되어 상품 아이디가 대표 상품 아이디로 치환된 상품에 대해서, 구매 이력에 포함된 상품 아이디를 대표 상품 아이디로 치환하여 구매 이력을 수정할 수 있다. 예를 들어, 상품 아이디 A1과 A2를 갖는 상품이 동일한 상품으로 판별되었을 경우 상품 아이디 A1과 A2가 대표 상품 아이디 A로 치환될 수 있다. 또한, A1을 구매한 구매자 B1과 A2를 구매한 구매자 B2의 구매 이력에도 구매한 상품에 대한 상품 아이디가 대표 상품 아이디인 A로 수정될 수 있다.
연관 상품 추천부(360)는 수정된 구매 이력을 이용하여 구매자가 구매했던 상품들과 연관성 있는 상품을 추천할 수 있다. 이 때, 연관 상품 추천부(360)는 사용자의 로그를 기반으로 구매한 상품 간의 연관성을 계산하여 등록된 상품들의 연관성을 계산하는 연관 규칙 마이닝 기법을 이용하여 추천할 수 있다. 연관 규칙 마이닝 기법에서 연관 규칙의 길이는 몇 개 상품 간의 연관성을 검사할 것인가에 따라 달라질 수 있다. 만약, 규칙의 길이가 2라고 한다면 상품 2개, 즉 상품 A와 상품 B 간의 연관 규칙을 계산한다는 의미로 해석할 수 있다. 다시 말해서, "상품 A를 구매하거나 클릭하였을 때 상품 B를 구매하거나 클릭한다"는 것이 길이가 2인 연관 규칙이 될 수 있다.
도 4는 본 발명의 일실시예에 따른 동일 상품 판별 방법을 나타낸 동작 흐름도이다.
도 4를 참조하면, 본 발명의 일실시예에 따른 동일 상품 판별 방법은 쇼핑몰에 등록된 상품들의 등록 정보를 획득할 수 있다(S410).
이 때, 등록 정보는 상품들의 메타 정보, 이미지 정보 및 컨텐츠 정보 중 하나 이상을 포함할 수 있다. 예를 들어, 메타 정보는 상품의 제목, 설명, 가격 및 출시 년도 등 상품에 대한 설명으로 텍스트 형태로 저장된 데이터를 의미할 수 있으며, 이미지 정보는 상품을 설명하기 위해 등록된 대표 이미지일 수 있다. 컨텐츠 정보는 전자서적, 만화책 및 영상 등의 상품에 따라서 개별 텍스트, 이미지, 영상의 스틸 이미지 등을 포함할 수 있다. 전자서적의 경우 전체 컨텐츠를 비교할 수도 있으나 많은 양의 텍스트 데이터 때문에 과도한 연산이 요구될 수 있으므로 제목, 저자, 요약이나 목차 및 출판사 정보 등의 필수적인 컨텐츠 부분만 선별하여 등록 정보로 이용할 수 있다.
또한, 본 발명의 일실시예에 따른 동일 상품 판별 방법은 획득된 상품들의 등록 정보를 이용하여 상품 간의 유사도를 산출할 수 있다(S420).
이 때, 등록 정보에서 특징 데이터를 추출하고, 추출된 특징 데이터를 비교하여 상품 간의 유사도를 산출할 수 있다. 예를 들어, 상품 간에 추출된 모든 특징 데이터 중 유사하다고 판단된 특징 데이터를 백분율로 나타내어 유사도를 산출할 수 있다. 상품 A와 B에서 10개의 특징 데이터를 추출하였을 때, 추출된 특징 데이터 중에서 7개의 특징 데이터가 유사한 경우 해당 상품 간의 유사도는 70퍼센트로 산출할 수 있다.
또한, 특징 데이터는 메타 정보 중의 상품 제목, 설명, 가격 및 출시 년도 중 하나 이상을 포함하고, 이미지 정보 중의 상품 대표 이미지를 포함하고, 컨텐츠 정보 중의 머리글, 목차, 출판사, 표지 이미지 및 영상의 스틸 이미지 중 하나 이상을 포함할 수 있다.
또한, 본 발명의 일실시예에 따른 동일 상품 판별 방법은 상품들의 상품 이력 정보를 획득할 수 있다(S430).
이 때, 상품 이력 정보는 해당 상품을 구매한 구매자 정보 및 해당 상품을 클릭한 클릭자 정보 중 하나 이상을 포함할 수 있다.
또한, 본 발명의 일실시예에 따른 동일 상품 판별 방법은 산출된 상품 간의 유사도 및 획득된 상품 이력 정보 중 하나 이상을 이용하여 상품 간의 동일 여부를 판단할 수 있다(S440).
이 때, 구매자 정보를 이용하여 상품들을 동시에 구매한 동시 구매자 정보를 획득할 수 있다. 이러한 동시 구매자 정보는 동일 상품 여부를 판단할 때 사용될 수 있다. 예를 들어, 상품 A와 상품 B의 유사도가 기설정된 값인 70퍼센트 이상의 유사도를 갖는 상품일 때, 상품 A와 상품 B를 동시에 구매한 동시 구매자 정보를 확인하여 동일 상품 여부를 판단할 수 있다. 대부분 상품을 구매할 때에는 동일한 상품을 동시에 구매하지 않기 때문에 상품 A와 상품 B의 동일 구매자가 존재하는 경우 일반적으로 두 상품이 동일 상품이 아닌 것으로 판단할 수 있다.
또한, 상품 간의 유사도가 기설정된 값 이상이고 상품을 동시에 구매한 동시 구매자가 존재하는 경우 상품의 종류를 판단하여 동일 여부를 판단할 수 있다. 예를 들어, 유사도에 대해 기설정된 값이 70퍼센트라고 한다면, 상품간의 유사도를 백분율로 나타내었을 때 70퍼센트 이상의 유사도를 갖는 상품일 경우 상품의 동시 구매자 존재 여부를 확인하여 동시 구매자가 존재한다면 상품의 종류를 판단할 수 있다. 만약, 상품 간의 유사도가 70퍼센트 이상이지만 동일 상품이 존재하지 않거나, 상품 간의 유사도가 70퍼센트 이하라고 한다면 상품들이 동일하지 않다고 판단할 수 있다.
또한, 유사도가 높고 동시 구매자가 존재하는 상품이 1번 구매하면 한동안 구매하지 않아도 되는 1회성 상품인지 상품이 소모되어 계속해서 구매해야 하는 소모성 상품인지 여부를 판단한 결과를 기초로 상품 간의 동일 여부를 판단할 수 있다. 예를 들어, 상품 간의 유사도가 70퍼센트 이상으로 높고, 상품의 동시 구매자가 존재하는 1회성 상품일 경우에는 동시 구매자의 수가 미리 설정된 기준치인 상품 전체 구매자의 10퍼센트 이상이라면 상품들을 동일 상품이 아닌 것으로 판단할 수 있다.
이와 같이 기준치를 설정하는 이유는 일반적으로 1회성 상품이 동일 상품이라면, 개별 상품 아이디는 다르지만 동일한 상품을 구매한 동시 구매자가 없어야 하지만, 구매자의 실수나 특정 의도에 따라 동시 구매자가 발생할 수도 있기 때문에 적정한 기준치를 설정하여 동일 여부를 판단할 수 있다.
또한, 유사도가 높고 동시 구매자가 존재하는 소모성 상품에 대해서 상품의 클릭자 정보를 이용하여 상품들의 중복 클릭자 수를 획득하고, 획득된 중복 클릭자 수를 기초로 상품들의 동일 여부를 판단할 수 있다.
이 때, 획득된 상품들의 중복 클릭자 수와 동시 구매자의 수를 비교하고, 비교 결과 중복 클릭자의 수가 동시 구매자의 수보다 미리 설정된 기준치 이상으로 큰 경우 상품들을 동일 상품으로 판단할 수 있다. 예를 들어, 유사도가 70퍼센트 이상이고 동시 구매자 존재하는 소모성 상품의 동일 여부를 판단하기 위해 상품을 동시에 클릭해본 중복 클릭자의 수를 획득한다. 미리 설정된 기준치를 전체 클릭자의 20퍼센트라고 한다면 중복 클릭자 수가 전체 클릭자의 20퍼센트이상이면서, 동시 구매자의 수보다 큰 경우에 상품들을 동일 상품으로 판단할 수 있다.
만약, 소모성 상품이면서 중복 클릭자의 수가 동시 구매자의 수보다 미리 설정된 기준치 이하인 경우에는 상품들을 동일하지 않은 상품으로 판단할 수 있다.
도 4에는 도시되지 아니하였으나, 본 발명에 따른 동일 상품 판별 방법은 동일하다고 판단된 상품들이 사용하는 상품 아이디를 대표 상품 아이디로 치환할 수 있다. 예를 들어, 상품 아이디 A1, A2 및 A3를 갖는 3개의 상품이 동일한 상품을 판단되었을 경우 3개의 상품 아이디를 대표 상품 아이디인 A로 치환할 수 있다.
도 4에는 도시되지 아니하였으나, 본 발명에 따른 동일 상품 판별 방법은 치환된 대표 상품 아이디를 이용하여 구매자의 구매 이력에 포함된 상품 중, 다른 상품들과 동일 상품으로 처리되어 상품 아이디가 대표 상품 아이디로 치환된 상품에 대해서, 구매 이력에 포함된 상품 아이디를 대표 상품 아이디로 치환하여 구매 이력을 수정할 수 있다. 예를 들어, 상품 아이디 A1과 A2를 갖는 상품이 동일한 상품으로 판별되었을 경우 상품 아이디 A1과 A2가 대표 상품 아이디 A로 치환될 수 있다. 또한, A1을 구매한 구매자 B1과 A2를 구매한 구매자 B2의 구매 이력에도 구매한 상품에 대한 상품 아이디가 대표 상품 아이디인 A로 수정될 수 있다.
도 4에는 도시되지 아니하였으나, 본 발명에 따른 동일 상품 판별 방법은 수정된 구매 이력을 이용하여 구매자가 구매했던 상품들과 연관성 있는 상품을 추천할 수 있다. 이 때, 연관 상품 추천부(360)는 사용자의 로그를 기반으로 구매한 상품 간의 연관성을 계산하여 등록된 상품들의 연관성을 계산하는 연관 규칙 마이닝 기법을 이용하여 추천할 수 있다. 연관 규칙 마이닝 기법에서 연관 규칙의 길이는 몇 개 상품 간의 연관성을 검사할 것인가에 따라 달라질 수 있다. 만약, 규칙의 길이가 2라고 한다면 상품 2개, 즉 상품 A와 상품 B 간의 연관 규칙을 계산한다는 의미로 해석할 수 있다. 다시 말해서, "상품 A를 구매하거나 클릭하였을 때 상품 B를 구매하거나 클릭한다"는 것이 길이가 2인 연관 규칙이 될 수 있다.
도 5는 도 2의 동일 상품 판단부에서 동일 상품을 판별하는 과정을 상세하게 나타낸 동작 흐름도이다.
도 5를 참조하면, 쇼핑몰에 등록된 상품들의 등록 정보를 이용하여 산출한 유사도가 기설정된 값 이상인지 판단할 수 있다(S515).
이 때, 등록 정보는 상품들의 메타 정보, 이미지 정보 및 컨텐츠 정보 중 하나 이상을 포함할 수 있다. 예를 들어, 메타 정보는 상품의 제목, 설명, 가격 및 출시 년도 등 상품에 대한 설명으로 텍스트 형태로 저장된 데이터를 의미할 수 있으며, 이미지 정보는 상품을 설명하기 위해 등록된 대표 이미지일 수 있다. 컨텐츠 정보는 전자서적, 만화책 및 영상 등의 상품에 따라서 개별 텍스트, 이미지, 영상의 스틸 이미지 등을 포함할 수 있다. 전자서적의 경우 전체 컨텐츠를 비교할 수도 있으나 많은 양의 텍스트 데이터 때문에 과도한 연산이 요구될 수 있으므로 제목, 저자, 요약이나 목차 및 출판사 정보 등의 필수적인 컨텐츠 부분만 선별하여 등록 정보로 이용할 수 있다.
단계(S515)의 판단 결과 유사도가 기설정된 값 이하이면, 상품들을 다른 상품으로 판단할 수 있다(S520).
단계(S515)의 판단 결과 유사도가 기설정된 값 이상이면, 상품들의 동시 구매자가 존재하는지 여부를 판단할 수 있다(S525).
단계(S525)의 판단 결과 동시 구매자가 존재하지 않으면, 상품들을 동일 상품으로 판단할 수 있다(S510).
단계(S525)의 판단 결과 동시 구매자가 존재하면, 상품들이 소모성 상품인지 여부를 판단할 수 있다(S535).
단계(S535)의 판단 결과 상품들이 소모성 상품이라면, 상품들의 중복 클릭자 수가 기설정된 기준치 이상인지 판단할 수 있다(S545).
단계(S545)의 판단 결과 상품들의 중복 클릭자 수가 기설정된 기준치 이상이라면, 상품들을 동일 상품으로 판단할 수 있다(S510).
단계(S565)의 판단 결과 상품들의 중복 클릭자 수가 기설정된 기준치 이하라면, 상품들을 다른 상품으로 판단할 수 있다(S520).
단계(S535)의 판단 경과 상품들이 소모성 상품이 아닌 1회성 상품이라면, 상품들의 동시 구매자 수가 기설정된 기준치 이하인지 판단할 수 있다(S555).
단계(S555)의 판단 결과 동시 구매자의 수가 기설정된 기준치 이하라면, 상품들을 다른 상품으로 판단할 수 있다(S520).
단계(S555)의 판단 결과 동시 구매자의 수가 기설정된 기준치 이상이라면, 상품들이 동일 상품으로 판단할 수 있다(S510).
도 6은 본 발명의 일실시예에 따른 동일 상품을 판별하기 위한 구성을 나타낸 도면이다.
도 6을 참조하면, 본 발명의 일실시예에 따른 동일 상품을 판별하기 위한 구성에서는 상품 A가 판매자 A1, A2 및 An에 의해서 쇼핑몰에 등록되는 것을 알 수 있다. 이 때, 상품 A의 상품 아이디는 각각 A1, A2 및 An으로 쇼핑몰에 등록될 수 있다. 이와 같이 같은 상품임에도 불구하고 여러 판매자에게 등록됨으로써 상품의 아이디가 다르게 등록되기 때문에, 쇼핑몰을 이용하는 구매자는 상품 아이디를 가지고 상품 아이디 A1, A2 및 An를 갖는 상품이 동일한 상품인지 판별하는데 시간이 걸릴 수 밖에 없다. 이러한 불편함을 해결하기 위해 동일 상품 판별 장치를 이용하여 상품 아이디 A1, A2 및 An를 갖는 상품을 동일 상품으로 처리함으로써 대표 상품 아이디로 A로 상품을 등록할 수 있다.
도 7은 본 발명의 일실시예에 따라 대표 상품 아이디로 치환된 구매 이력의 예를 설명하기 위한 도면이다.
도 7을 참조하면, 쇼핑몰에 등록되는 상품들에 대해서 상품 아이디가 동일 상품 판별 방법을 통해 대표 상품 아이디로 치환되는 것을 확인할 수 있다.
먼저 대표 상품 아이디 치환 전 구매 이력(710)의 상품 아이디를 확인하면, 사용자 1부터 사용자 n까지 구매 이력 중, 상품 아이디가 A1, A2 및 A3인 상품과 상품 아이디 B1, B2 및 B3인 상품이 존재함을 알 수 있다.
이 때, 상품 아이디 A1, A2 및 A3를 갖는 상품들은 상품 A로 동일 상품이고, 상품 아이디 B1, B2 및 B3를 갖는 상품들은 상품 B로 동일한 상품이라고 한다면, 대표 상품 아이디로 치환 전 구매 이력(710)으로는 상품 A를 구매한 구매자가 상품 B를 구매한다는 연관성을 파악하기 어려운 것을 알 수 있다.
이 때, 대표 상품 아이디 치환 후 구매 이력(720)과 같이 상품 아이디 A1, A2 및 A3를 갖는 상품들과 상품 아이디 B1, B2 및 B3를 갖는 상품들을 대표 상품 아이디로 치환하여 구매 이력을 수정한다면, 상품 A와 상품 B의 연관성을 쉽고 빠르게 파악할 수 있게 된다.
이와 같이 동일한 상품을 판별하여 상품을 구별할 수 있는 식별자를 통일해줌으로써 상품 간의 연관성을 파악하는데 보다 효과적일 수 있으며, 이로 인해 쇼핑몰을 운영함에 있어서 구매자에게 더욱 정교한 추천 상품을 제공할 수 있어 수익을 상승시킬 수 있는 효과를 불러올 수 있다.
본 발명에 따른 동일 상품 판별 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 모든 형태의 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 이러한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서와 같이 본 발명에 따른 쇼핑몰의 동일 상품 판별 장치 및 방법은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
본 발명에 의하면 쇼핑몰에 등록된 상품의 등록 정보를 통해 동일한 상품을 판별함으로써 쇼핑몰 사용자가 상품 검색 시 효율적으로 상품을 비교할 수 있고, 상품 추천 서비스에서 사용자와 연관된 상품을 효과적으로 추천할 수 있다. 나아가, 쇼핑몰 운영자가 등록된 상품들의 정보 및 사용자들의 구매 패턴을 쉽게 파악할 수 있어 보다 체계적으로 쇼핑몰을 운영 및 관리할 수 있다.
110, 310: 등록 정보 획득부 120, 320: 유사도 산출부
130, 330: 동일 상품 판단부 210: 동시구매자 정보 획득부
220: 상품 종류 판단부 340: 아이디 치환부
350: 구매 이력 수정부 360: 연관 상품 추천부

Claims (18)

  1. 쇼핑몰에 등록된 상품들의 등록 정보를 획득하는 등록 정보 획득부;
    상기 획득된 상품들의 등록 정보를 이용하여 상품 간의 유사도를 산출하는 유사도 산출부; 및
    상기 산출된 상품 간의 유사도 및 상품 이력 정보 중 하나 이상을 이용하여 상기 상품 간의 동일 여부를 판단하는 동일 상품 판단부
    를 포함하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 장치.
  2. 청구항 1에 있어서,
    상기 유사도 산출부는
    상기 등록 정보에서 특징 데이터를 추출하고, 추출된 특징 데이터를 비교하여 상기 상품 간의 유사도를 산출하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 장치.
  3. 청구항 2에 있어서,
    상기 등록 정보는
    상기 상품들의 메타 정보, 이미지 정보 및 컨텐츠 정보 중 하나 이상을 포함하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 장치.
  4. 청구항 3에 있어서,
    상기 특징 데이터는
    상기 메타 정보 중의 상품 제목, 설명, 가격 및 출시 년도 중 하나 이상을 포함하고,
    상기 이미지 정보 중의 상품 대표 이미지를 포함하고,
    상기 컨텐츠 정보 중의 머리글, 목차, 출판사, 표지 이미지 및 영상의 스틸 이미지 중 하나 이상을 포함하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 장치.
  5. 청구항 1에 있어서,
    상기 상품 이력 정보는
    구매자 정보 및 클릭자 정보 중 하나 이상을 포함하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 장치.
  6. 청구항 5에 있어서,
    상기 동일 상품 판단부는
    상기 구매자 정보를 이용하여 상기 상품들의 동시 구매자 정보를 획득하는 동시 구매자 정보 획득부를 포함하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 장치.
  7. 청구항 6에 있어서,
    상기 동일 상품 판단부는
    상기 상품 간의 유사도가 기설정된 값 이상이고, 동시 구매자가 존재하는 경우, 상기 상품들의 종류를 판단하는 상품 종류 판단부를 더 포함하고,
    상기 상품 종류 판단 결과를 기초로 상기 상품 간의 동일 여부를 판단하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 장치.
  8. 청구항 7에 있어서,
    상기 동일 상품 판단부는
    상기 상품 종류 판단부의 판단 결과 상품 종류가 1회성 상품인 경우, 동시 구매자의 수가 미리 설정된 기준치 이상이면 상기 상품들을 동일 상품이 아닌 것으로 판단하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 장치.
  9. 청구항 7에 있어서,
    상기 동일 상품 판단부는
    상기 상품 종류 판단부의 판단 결과 상품 종류가 소모성 상품인 경우, 상기 클릭자 정보를 이용하여 상기 상품들의 중복 클릭자 수를 획득하고, 획득된 중복 클릭자 수를 기초로 상기 상품들의 동일 여부를 판단하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 장치.
  10. 청구항 9에 있어서,
    상기 동일 상품 판단부는
    상기 획득된 상품들의 중복 클릭자의 수와 상기 동시 구매자의 수를 비교하고, 비교 결과 상기 중복 클릭자의 수가 상기 동시 구매자의 수보다 미리 설정된 기준치 이상으로 큰 경우 상기 상품들을 동일 상품으로 판단하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 장치.
  11. 청구항 1에 있어서,
    상기 동일 상품 판별 장치는
    상기 동일 상품으로 판단된 상품들의 상품 아이디를 대표 상품 아이디로 치환하는 아이디 치환부; 및
    상기 치환된 대표 상품 아이디 정보를 이용하여 구매자의 구매 이력에 포함된 상품 중의 해당하는 상품의 아이디를 상기 대표 상품 아이디로 치환하여 구매 이력을 수정하는 구매 이력 수정부를 더 포함하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 장치.
  12. 청구항 11에 있어서,
    상기 동일 상품 판별 장치는
    상기 수정된 구매 이력을 이용하여 상기 구매자가 구매한 상품과 연관성 있는 상품을 추천하는 연관 상품 추천부를 더 포함하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 장치.
  13. 쇼핑몰에 등록된 상품들의 등록 정보를 획득하는 단계;
    상기 획득된 상품들의 등록 정보를 이용하여 상품 간의 유사도를 산출하는 단계;
    상기 상품들의 상품 이력 정보를 획득하는 단계; 및
    상기 산출된 상품 간의 유사도 및 상기 획득된 상품 이력 정보 중 하나 이상을 이용하여 상기 상품 간의 동일 여부를 판단하는 단계
    를 포함하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 방법.
  14. 청구항 13에 있어서,
    상기 유사도를 산출하는 단계는
    상기 등록 정보에서 특징 데이터를 추출하는 단계를 더 포함하고,
    상기 추출된 특징 데이터를 비교하여 상기 상품 간의 유사도를 산출하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 방법.
  15. 청구항 13에 있어서,
    상기 동일 여부를 판단하는 단계는
    상기 상품 이력 정보 중의 구매자 정보를 이용하여 상기 상품의 동시 구매자가 존재하는지 판단하는 단계;
    상기 판단 결과 동시 구매자가 존재하면 상기 상품의 종류를 판단하는 단계; 및
    상기 상품의 종류를 판단한 결과에 기초하여 상기 동일 여부를 판단하는 단계를 포함하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 방법.
  16. 청구항 15에 있어서,
    상기 상품 종류 판단 결과에 기초하여 동일 여부를 판단하는 단계는
    상기 판단 결과 상품의 종류가 1회성 상품이면, 동시 구매자의 수와 미리 설정된 기준치를 비교하여 상기 상품들의 동일 여부를 판단하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 방법.
  17. 청구항 15에 있어서,
    상기 상품 종류 판단 결과에 기초하여 동일 여부를 판단하는 단계는
    상기 판단 결과 상품의 종류가 소모성 상품이면, 상기 상품 이력 정보 중의 클릭자 정보를 이용하여 상기 상품의 중복 클릭자 수를 획득하는 단계; 및
    상기 획득된 중복 클릭자 수와 상기 상품의 구매자 수를 비교하여 상기 상품 간의 동일 여부를 판단하는 단계를 포함하는 것을 특징으로 하는 쇼핑몰의 동일 상품 판별 방법.
  18. 청구항 13 내지 17 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한 기록매체.
KR1020140022929A 2014-02-26 2014-02-26 쇼핑몰의 동일 상품 판별 장치 및 방법 KR102215436B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140022929A KR102215436B1 (ko) 2014-02-26 2014-02-26 쇼핑몰의 동일 상품 판별 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140022929A KR102215436B1 (ko) 2014-02-26 2014-02-26 쇼핑몰의 동일 상품 판별 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20150101536A true KR20150101536A (ko) 2015-09-04
KR102215436B1 KR102215436B1 (ko) 2021-02-16

Family

ID=54242625

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140022929A KR102215436B1 (ko) 2014-02-26 2014-02-26 쇼핑몰의 동일 상품 판별 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102215436B1 (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017183847A1 (ko) * 2016-04-19 2017-10-26 고현승 객체의 정보 제공 방법 및 장치
WO2018105979A1 (ko) * 2016-12-07 2018-06-14 서강대학교 산학협력단 온라인 커뮤니티에서 동일 사용자의 닉네임 목록을 추출하는 장치 및 방법
WO2021198761A1 (en) * 2020-03-30 2021-10-07 Coupang Corp. Computerized systems and methods for product integration and deduplication using artificial intelligence
KR102369961B1 (ko) * 2020-10-14 2022-03-04 쿠팡 주식회사 데이터베이스 조정을 위한 시스템 및 방법
KR20220107916A (ko) * 2021-01-25 2022-08-02 쿠팡 주식회사 변환된 이미지 정보를 사용하여 아이템 유사성을 모델링하기 위한 시스템 및 방법
US11775565B2 (en) 2020-10-14 2023-10-03 Coupang Corp. Systems and methods for database reconciliation
WO2023200030A1 (ko) * 2022-04-13 2023-10-19 쿠팡 주식회사 아이템 판매를 위한 정보를 처리하는 전자 장치 및 그 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060086658A (ko) * 2005-01-27 2006-08-01 (주)노트밸리 가격비교 연동 전자 상거래 시스템 및 쇼핑몰 시스템 간정보 공유 방법
KR20100044669A (ko) * 2008-10-22 2010-04-30 엔에이치엔비즈니스플랫폼 주식회사 이미지 매칭에 기초한 상품 정보 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
JP2010224873A (ja) * 2009-03-24 2010-10-07 Nomura Research Institute Ltd 商品検索サーバ、商品検索方法、プログラム、および記録媒体
KR20120020502A (ko) 2010-08-30 2012-03-08 권오석 인터넷 쇼핑몰의 상품 정보 연동 시스템 및 그 방법
JP2013544000A (ja) * 2010-10-22 2013-12-09 アリババ・グループ・ホールディング・リミテッド 候補製品のリンクリストを判定する方法および装置
KR101353996B1 (ko) * 2012-11-30 2014-01-21 오드컨셉 주식회사 온라인 쇼핑을 위한 상품관리 시스템 및 상품관리 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060086658A (ko) * 2005-01-27 2006-08-01 (주)노트밸리 가격비교 연동 전자 상거래 시스템 및 쇼핑몰 시스템 간정보 공유 방법
KR20100044669A (ko) * 2008-10-22 2010-04-30 엔에이치엔비즈니스플랫폼 주식회사 이미지 매칭에 기초한 상품 정보 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
JP2010224873A (ja) * 2009-03-24 2010-10-07 Nomura Research Institute Ltd 商品検索サーバ、商品検索方法、プログラム、および記録媒体
KR20120020502A (ko) 2010-08-30 2012-03-08 권오석 인터넷 쇼핑몰의 상품 정보 연동 시스템 및 그 방법
JP2013544000A (ja) * 2010-10-22 2013-12-09 アリババ・グループ・ホールディング・リミテッド 候補製品のリンクリストを判定する方法および装置
KR101353996B1 (ko) * 2012-11-30 2014-01-21 오드컨셉 주식회사 온라인 쇼핑을 위한 상품관리 시스템 및 상품관리 방법

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017183847A1 (ko) * 2016-04-19 2017-10-26 고현승 객체의 정보 제공 방법 및 장치
WO2018105979A1 (ko) * 2016-12-07 2018-06-14 서강대학교 산학협력단 온라인 커뮤니티에서 동일 사용자의 닉네임 목록을 추출하는 장치 및 방법
US11010557B2 (en) 2016-12-07 2021-05-18 Sogang University Research Foundation Apparatus and method for extracting nickname list of identical user in online community
WO2021198761A1 (en) * 2020-03-30 2021-10-07 Coupang Corp. Computerized systems and methods for product integration and deduplication using artificial intelligence
KR20210121990A (ko) * 2020-03-30 2021-10-08 쿠팡 주식회사 인공 지능을 이용한 제품 통합 및 중복제거를 위한 컴퓨터 시스템 및 방법
KR102369961B1 (ko) * 2020-10-14 2022-03-04 쿠팡 주식회사 데이터베이스 조정을 위한 시스템 및 방법
US11775565B2 (en) 2020-10-14 2023-10-03 Coupang Corp. Systems and methods for database reconciliation
KR20220107916A (ko) * 2021-01-25 2022-08-02 쿠팡 주식회사 변환된 이미지 정보를 사용하여 아이템 유사성을 모델링하기 위한 시스템 및 방법
WO2023200030A1 (ko) * 2022-04-13 2023-10-19 쿠팡 주식회사 아이템 판매를 위한 정보를 처리하는 전자 장치 및 그 방법

Also Published As

Publication number Publication date
KR102215436B1 (ko) 2021-02-16

Similar Documents

Publication Publication Date Title
KR20150101536A (ko) 쇼핑몰의 동일 상품 판별 장치 및 방법
US7373317B1 (en) Method and apparatus for facilitating sales of goods by independent parties
JP5886972B2 (ja) 異常アカウント検出装置及び方法
US20090076868A1 (en) Automated Electronic Commerce Data Analyzing and Sales System
WO2017092602A1 (zh) 一种信息投放用户的筛选方法和服务器
US10169810B2 (en) Product information inconsistency detection
JP2019029037A5 (ko)
KR100891930B1 (ko) 상품 평가 데이터를 사용하여 인기 상품을 제공하는 방법,시스템 및 컴퓨터 판독 가능한 기록 매체
Ugochukwu et al. An economic analysis of private incentives to adopt DNA barcoding technology for fish species authentication in Canada
Rahm Discovering product counterfeits in online shops: A big data integration challenge
Stadlmann et al. Find me if you can! Identification of services on websites by human beings and artificial intelligence
Jamaludin The influence of website trust and loyalty on customer intention to purchase online
KR20210028340A (ko) 빅데이터를 이용한 리셀 상품의 미래 가치 평가 시스템 및 방법
KR20150085848A (ko) 온오프라인 소비자간 렌탈 시스템 및 그 방법
TWI522826B (zh) Information providing apparatus, information providing method, program, and recording medium
Wang et al. Multifactor technique to bookmark and shop items from a screenshot
Saorayangkoon The Investigation of the relationship among perceived quality, perceived price, and perceived value toward purchase intention A case study of wooden kitchen furniture
Jamaludin et al. Factors Influencing Customer Intention to Purchase Online
Tonsor et al. Mandatory Country of Origin Labeling: Consumer Demand Impact
TW201624388A (zh) 警告裝置、記錄媒體及方法
Mishra The Extent Of Complementarity Of Re-Tailing On E-Tailing On Lenskart Sale
KR20180078663A (ko) 상품의 라이프 사이클에 따른 가격 결정 시스템 및 상품의 라이프 사이클에 따른 가격 결정 방법
Mishra et al. DO BRANDS MATTER IN BUSINESS-TO-BUSINESS MARKETING? A QUALITATIVE INVESTIGATION OF B2B BRANDING PRACTICES.
Nazari et al. Consumer Protection Against the False Description of Halal in E-Commerce
Sameeha Consumer behavior towards online shopping for clothing and accessories: a study based on Darga town

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant