KR101755409B1 - Contents recommendation system and contents recommendation method - Google Patents

Contents recommendation system and contents recommendation method Download PDF

Info

Publication number
KR101755409B1
KR101755409B1 KR1020160120246A KR20160120246A KR101755409B1 KR 101755409 B1 KR101755409 B1 KR 101755409B1 KR 1020160120246 A KR1020160120246 A KR 1020160120246A KR 20160120246 A KR20160120246 A KR 20160120246A KR 101755409 B1 KR101755409 B1 KR 101755409B1
Authority
KR
South Korea
Prior art keywords
content
contents
user
cluster
recommended
Prior art date
Application number
KR1020160120246A
Other languages
Korean (ko)
Other versions
KR20160113532A (en
Inventor
이채현
Original Assignee
에스케이플래닛 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이플래닛 주식회사 filed Critical 에스케이플래닛 주식회사
Priority to KR1020160120246A priority Critical patent/KR101755409B1/en
Publication of KR20160113532A publication Critical patent/KR20160113532A/en
Application granted granted Critical
Publication of KR101755409B1 publication Critical patent/KR101755409B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0224Discounts or incentives, e.g. coupons or rebates based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 컨텐츠 추천 시스템 및 방법에 관한 것으로서, 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 컨텐츠의 내용정보가 저장된 컨텐츠 데이터베이스 장치; 상기 컨텐츠의 내용정보를 입력받아 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 메타데이터 추출장치; 상기 추출된 메타데이터에 따라 각 컨텐츠를 클러스터링하는 컨텐츠 클러스터 생성장치; 및 사용자의 컨텐츠 구매이력에 따라, 상기 사용자가 구매한 컨텐츠를 상기 컨텐츠 클러스터와 맵핑하여 상기 사용자가 구매한 컨텐츠와 유사한 내용을 포함하는 컨텐츠를 상기 사용자에게 추천 컨텐츠 리스트로 제공하는 추천 컨텐츠 선택장치를 포함한다. 이에 의해, 컨텐츠의 내용과 컨텐츠의 구매기록을 바탕으로 사용자가 구매한 컨텐츠와 실질적으로 내용이 유사한 컨텐츠들을 추천함으로써 다양한 장르와 카테고리의 컨텐츠를 추천할 수 있고 정확도가 높은 개인화 추천정보를 제공할 수 있다.The present invention relates to a content recommendation system and method, and more particularly, to a content recommendation system and a content recommendation system, which are provided with a content database apparatus storing content information of content including content introduction, A metadata extracting unit that receives the content information of the content and extracts metadata representing characteristics of the content; A content cluster generating apparatus for clustering each content according to the extracted metadata; And a recommended content selection device for mapping the content purchased by the user to the content cluster according to the content purchase history of the user and providing the content including contents similar to the content purchased by the user to the user as a recommended content list . Accordingly, it is possible to recommend contents of various genres and categories by recommending contents substantially similar to the contents purchased by the user based on the content of the contents and the purchase record of the contents, and to provide personalized recommendation information with high accuracy have.

Description

컨텐츠 추천 시스템 및 방법{CONTENTS RECOMMENDATION SYSTEM AND CONTENTS RECOMMENDATION METHOD}[0001] CONTENTS RECOMMENDATION SYSTEM AND CONTENTS RECOMMENDATION METHOD [0002]

본 발명은 컨텐츠 추천 시스템 및 방법에 관한 것으로서, 보다 상세하게는, 컨텐츠의 내용과 컨텐츠의 구매기록을 바탕으로 사용자가 구매한 컨텐츠와 실질적으로 내용이 유사한 컨텐츠들을 추천함으로써 다양한 장르와 카테고리의 컨텐츠를 추천할 수 있고 정확도가 높은 개인화 추천정보를 제공할 수 있는 컨텐츠 추천 시스템 및 방법에 관한 것이다.The present invention relates to a content recommendation system and method, and more particularly, to a content recommendation system and method that recommends contents that are substantially similar to contents purchased by a user based on contents of contents and purchase records of contents, And to provide personalized recommendation information that can be recommended and highly accurate.

대용량 데이터의 전송 및 처리 기술의 발전으로 사용자가 접할 수 있는 컨텐츠는 기하 급수적으로 늘어나고 있다. 특히, 초고속 통신망이 도입되고 스마트폰, 태블릿, 넷북, IP TV 등과 같은 각종 멀티미디어 기기의 대용량화가 진행됨에 따라 사용자는 때와 장소에 구애됨 없이 수많은 컨텐츠를 즐길 수 있게 되었다.Due to the development of large-capacity data transmission and processing technology, the amount of content that users can access is increasing exponentially. In particular, with the introduction of high-speed communication networks and the increasing capacity of various multimedia devices such as smart phones, tablets, netbooks, and IP TVs, users can enjoy a lot of contents regardless of time and place.

그러나, 이렇게 컨텐츠의 양이 늘어남에 따라 사용자가 원하는 것을 찾는 데 걸리는 시간과 노력도 증가하게 된다. 이를 해결하기 위해 사용자가 만족할만한 컨텐츠를 선별하여 추천하는 방식이 등장하였다. However, as the amount of content increases, the time and effort required for the user to find the desired content increases. In order to solve this problem, a method of selecting and recommending contents satisfying the user has appeared.

이러한 종래의 추천 방식으로는 컨텐츠의 판매량, 구매자들의 추천정보 등을 이용하는 단순 추천 방식과, 각 사용자들이 입력한 선호 장르정보나 선호 카테고리정보, 혹은, 각 사용자들의 구매이력 등을 이용하는 맞춤형 추천 방식이 있다.In this conventional recommendation method, there are a simple recommendation method using the sales volume of contents and recommendation information of buyers, a custom recommendation method using the preference genre information and the preference category information inputted by each user, or the purchasing history of each user have.

그런데, 판매량 등에 기초한 단순 추천 방식의 경우 사용자의 개인 취향을 반영할 수 없기 때문에 추천 정확도가 떨어진다는 문제점이 있다.However, in the case of the simple recommendation method based on the sales volume or the like, there is a problem that the recommendation accuracy is lowered because the user's personal taste can not be reflected.

*그리고, 사용자가 입력한 정보나 구매 이력을 이용하는 맞춤형 추천 방식의 경우 단순히 사용자의 선호정보만을 고려하기 때문에 계속 변화하고 추가되는 컨텐츠들 전체를 고려하여 사용자 선호도에 맞춤화된 최적의 컨텐츠를 추천하는데 한계가 있으며, 추천 대상 컨텐츠의 장르, 카테고리 등이 한정되므로 다양한 컨텐츠를 추천할 수 없다는 문제점이 있다.In the case of the customized recommendation method using the information inputted by the user or the purchase history, only the user's preference information is considered. Therefore, the recommended content optimized for the user's preference is considered And there is a problem in that various contents can not be recommended because the genre, category, etc. of the content to be recommended is limited.

또한, 사용자의 구매기록만을 활용할 경우 사용자들이 구매기록이 몰리는 아이템들만 상위에 추천되므로 실제 아이템의 컨텐츠 유사도는 반영되지 않는 문제점이 있다.In addition, when only the purchasing history of the user is utilized, only the items to which the purchase history is poured are recommended by the users, so that the similarity of contents of the actual items is not reflected.

한국등록특허 제10-1111121호 : 인공지능에 기반한 개인별 맞춤형 컨텐츠 제공 장치 및 방법, 그 기록 매체Korean Patent No. 10-1111121: Apparatus and method for providing personalized contents based on artificial intelligence, and recording medium therefor

본 발명은 상술한 과제를 해결하기 위하여 안출된 것으로서, 컨텐츠의 내용과 컨텐츠의 구매기록을 바탕으로 사용자가 구매한 컨텐츠와 실질적으로 내용이 유사한 컨텐츠들을 추천함으로써 다양한 장르와 카테고리의 컨텐츠를 추천할 수 있고 정확도가 높은 개인화 추천정보를 제공할 수 있는 컨텐츠 추천 시스템 및 방법을 제공하는데 그 기술적 과제가 있다.SUMMARY OF THE INVENTION The present invention has been conceived to solve the problems described above, and it is an object of the present invention to provide a system and method for recommending contents of various genres and categories by recommending contents substantially similar to contents purchased by a user, And provides personalized recommendation information with high accuracy, and a technical object thereof is to provide a content recommendation system and method.

상술한 과제를 해결하기 위한 본 발명의 일 측면에 따르면, 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 컨텐츠의 내용정보가 저장된 컨텐츠 데이터베이스 장치; 상기 컨텐츠의 내용정보를 입력받아 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 메타데이터 추출장치; 상기 추출된 메타데이터에 따라 각 컨텐츠를 클러스터링하는 컨텐츠 클러스터 생성장치; 및 사용자의 컨텐츠 구매이력에 따라, 상기 사용자가 구매한 컨텐츠를 상기 컨텐츠 클러스터와 맵핑하여 상기 사용자가 구매한 컨텐츠와 유사한 내용을 포함하는 컨텐츠를 상기 사용자에게 추천 컨텐츠 리스트로 제공하는 추천 컨텐츠 선택장치를 포함하는 컨텐츠 추천 시스템이 제공된다.According to an aspect of the present invention, there is provided a content database apparatus for storing content information of content including a content introduction, a content usage guide, and a storyline; A metadata extracting unit that receives the content information of the content and extracts metadata representing characteristics of the content; A content cluster generating apparatus for clustering each content according to the extracted metadata; And a recommended content selection device for mapping the content purchased by the user to the content cluster according to the content purchase history of the user and providing the content including contents similar to the content purchased by the user to the user as a recommended content list A content recommendation system is provided.

여기서, 메타데이터 추출장치는, 상기 컨텐츠의 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 텍스트 데이터를 입력받는 메타데이터 수집부; 및 상기 텍스트 데이터에서 명사를 추출하여 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 피쳐 설정부를 포함할 수 있다.Here, the metadata extraction apparatus may include a metadata collection unit that receives text data including a content introduction, a content usage guide, and a plot of the content; And a feature setting unit for extracting nouns from the text data and extracting metadata representing characteristics of the content contents.

상술한 과제를 해결하기 위한 본 발명의 다른 측면에 따르면, 내용이 유사한 컨텐츠들을 포함하는 클러스터 정보가 저장된 컨텐츠 클러스터 저장부; 사용자의 컨텐츠 구매기록이 저장된 구매기록 저장부; 상기 사용자의 구매기록을 상기 클러스터에 맵핑하는 구매기록 맵핑부; 상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 산출하는 유사도 산출부; 및 상기 컨텐츠의 유사도가 높은 순서로 컨텐츠를 선택하여 추천 컨텐츠 리스트를 생성하는 추천 리스트 생성부를 포함하는 추천 컨텐츠 선택장치가 제공된다.According to another aspect of the present invention, there is provided a content clustering apparatus including: a content cluster storage unit for storing cluster information including contents having similar contents; A purchase record storage unit in which a content purchase record of a user is stored; A purchase record mapping unit for mapping the purchase record of the user to the cluster; A similarity calculating unit for calculating a similarity between the mapped content and the content included in the cluster; And a recommendation list generation unit for generating a recommended content list by selecting contents in descending order of similarity of the contents.

여기서, 상기 구매기록 맵핑부는, 상기 사용자의 구매기록을 통해 상기 사용자가 구매한 컨텐츠 정보를 확인하고 상기 사용자가 구매한 컨텐츠가 포함된 적어도 하나 이상의 클러스터 정보를 상기 컨텐츠 클러스터 저장부로부터 검색하여 맵핑할 수 있다.Here, the purchasing record mapping unit may identify the content information purchased by the user through the purchasing record of the user, and may search for and map at least one or more pieces of cluster information including the content purchased by the user from the content cluster storage unit .

그리고, 상기 유사도 산출부는, 자카드 계수, 피어슨 상관점수, 유클리디안 거리, 맨하튼 거리 중 적어도 어느 하나의 방식으로 상기 컨텐츠의 유사도를 산출할 수 있다.The similarity calculating unit may calculate the similarity of the content by at least one of a Jacquard coefficient, a Pearson correlation score, an Euclidean distance, and a Manhattan distance.

또한, 상기 추천 리스트 생성부는, 하나의 컨텐츠가 속한 클러스터가 복수개일 경우 복수개의 상기 클러스터에서 추출된 상기 추천 리스트들을 수합하고, 상기 추천 리스트들에 포함된 컨텐츠들의 유사도 순으로 컨텐츠를 선별하여 최종 추천 리스트를 생성할 수 있다.In addition, the recommendation list generator may collect the recommendation lists extracted from the plurality of clusters when a plurality of clusters to which one content belongs, sort content in order of similarity of the contents included in the recommendation lists, You can create a list.

상술한 과제를 해결하기 위한 본 발명의 또 다른 측면에 따르면, 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 컨텐츠의 내용정보로부터 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 단계; 상기 추출된 메타데이터에 따라 내용이 유사한 컨텐츠를 포함하는 클러스터를 생성하는 단계; 사용자가 구매한 컨텐츠 정보를 제공받아 상기 구매한 컨텐츠가 포함된 상기 클러스터를 맵핑하는 단계; 상기 클러스터 내에서 상기 사용자가 구매한 컨텐츠와 유사한 내용을 포함하는 컨텐츠를 선택하는 단계; 및 상기 선택된 컨텐츠를 상기 사용자에게 추천 컨텐츠 리스트로 제공하는 단계를 포함하는 컨텐츠 추천 방법이 제공된다.According to another aspect of the present invention, there is provided a method of reproducing metadata, comprising the steps of: extracting metadata representing characteristics of content from content information of content including content introduction, content usage guide, and storyline; Generating a cluster including contents similar in content according to the extracted metadata; Mapping the cluster including the purchased content to the cluster by receiving the purchased content information; Selecting content including content similar to the content purchased by the user in the cluster; And providing the selected content to the user as a recommended content list.

여기서, 상기 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 컨텐츠의 내용정보로부터 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 단계는, 상기 컨텐츠의 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 텍스트 데이터를 입력받는 단계; 및 상기 텍스트 데이터에서 명사를 추출하여 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 단계를 포함할 수 있다.The step of extracting the metadata representing the characteristics of the content from the content information of the content including the content introduction, the content usage guide, and the storyline may include extracting the content of the content, the content usage guide, ; And extracting nouns from the text data and extracting metadata representing characteristics of the content contents.

상술한 과제를 해결하기 위한 본 발명의 또 다른 측면에 따르면, 컨텐츠의 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 텍스트 데이터를 입력받는 단계; 상기 텍스트 데이터에서 명사를 추출하여 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 단계; 상기 추출된 메타데이터에 따라 내용이 유사한 컨텐츠를 포함하는 클러스터를 생성하는 단계; 사용자가 구매한 컨텐츠 정보를 제공받아 상기 구매한 컨텐츠가 포함된 상기 클러스터를 맵핑하는 단계; 상기 클러스터 내에서 상기 사용자가 구매한 컨텐츠와 유사한 내용을 포함하는 컨텐츠를 선택하는 단계; 및 상기 선택된 컨텐츠를 상기 사용자에게 추천 컨텐츠 리스트로 제공하는 단계를 포함하는 컨텐츠 추천 방법이 프로그램으로 기록되고 전자 장치에서 판독 가능한 기록매체가 제공된다.According to another aspect of the present invention, there is provided a method of providing content, comprising: receiving text data including a content introduction, a content usage guide, and a plot; Extracting nouns from the text data and extracting metadata representing characteristics of the contents; Generating a cluster including contents similar in content according to the extracted metadata; Mapping the cluster including the purchased content to the cluster by receiving the purchased content information; Selecting content including content similar to the content purchased by the user in the cluster; And providing the selected content to the user as a recommended content list, wherein the content recommendation method is recorded with a program and is readable in an electronic device.

상술한 과제를 해결하기 위한 본 발명의 또 다른 측면에 따르면, 내용이 유사한 컨텐츠들을 포함하는 클러스터 정보를 저장하는 단계; 사용자의 컨텐츠 구매기록을 저장하는 단계; 상기 사용자의 구매기록을 상기 클러스터에 맵핑하는 단계; 상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 산출하는 단계; 상기 컨텐츠의 유사도가 높은 순서로 컨텐츠를 선택하는 단계; 및 선택된 상기 컨텐츠를 포함하는 추천 컨텐츠 리스트를 생성하는 단계를 포함하는 추천 컨텐츠 선택장치의 제어방법이 제공된다.According to another aspect of the present invention, there is provided a method of reproducing cluster information, the method comprising: storing cluster information including contents having similar contents; Storing a content purchase history of a user; Mapping the purchase record of the user to the cluster; Calculating a similarity between the mapped content and the content included in the cluster; Selecting contents in descending order of similarity of the contents; And a step of generating a recommended content list including the selected content.

여기서, 상기 사용자의 구매기록을 상기 클러스터에 맵핑하는 단계는, 상기 사용자의 컨텐츠 구매기록을 통해 상기 사용자가 구매한 컨텐츠 정보를 확인하는 단계; 및 기 저장된 클러스터 정보 중, 상기 사용자가 구매한 컨텐츠가 포함된 적어도 하나 이상의 클러스터 정보를 검색하는 단계를 포함할 수 있다.The step of mapping the purchasing record of the user to the cluster may include: confirming the content information purchased by the user through the content purchase record of the user; And retrieving at least one cluster information including the content purchased by the user from the stored cluster information.

그리고, 상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 산출하는 단계는, 상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 자카드 계수, 피어슨 상관점수, 유클리디안 거리, 맨하튼 거리 중 적어도 어느 하나의 방식으로 산출하는 단계를 포함할 수 있다.The step of calculating the degree of similarity between the mapped content and the content included in the cluster may include calculating a degree of similarity between the mapped content and the content included in the cluster by a Jacquard coefficient, a Pearson correlation score, an Euclidian distance, And calculating it in at least one of the methods.

또한, 선택된 상기 컨텐츠를 포함하는 추천 컨텐츠 리스트를 생성하는 단계는, 하나의 컨텐츠가 속한 클러스터가 복수개일 경우 복수개의 상기 클러스터에서 추출된 상기 추천 리스트들을 수합하는 단계; 및 상기 추천 리스트들에 포함된 컨텐츠들의 유사도 순으로 컨텐츠를 선별하여 최종 추천 리스트를 생성하는 단계를 포함할 수 있다.The generating of the recommended content list including the selected content may include collecting the recommended lists extracted from the plurality of clusters when a plurality of clusters to which one content belongs are included; And generating a final recommendation list by sorting contents in order of similarity of contents included in the recommendation lists.

상술한 바와 같이 본 발명의 컨텐츠 추천 시스템 및 방법은 컨텐츠의 내용과 컨텐츠의 구매기록을 바탕으로 사용자가 구매한 컨텐츠와 실질적으로 내용이 유사한 컨텐츠들을 추천함으로써 정확도가 높은 개인화 추천정보를 제공할 수 있다.As described above, the content recommendation system and method according to the present invention can provide highly accurate personalized recommendation information by recommending contents substantially similar to contents purchased by the user based on the contents of the contents and the purchase record of the contents .

또한, 본 발명의 컨텐츠 추천 시스템 및 방법은 컨텐츠의 내용을 바탕으로 추천대상 컨텐츠를 선별함으로써 다양한 장르와 카테고리의 컨텐츠를 추천할 수 있다.In addition, the content recommendation system and method of the present invention can recommend contents of various genres and categories by selecting recommended contents based on contents of the contents.

도 1은 본 발명의 실시예에 따른 컨텐츠 추천 시스템의 구성도,
도 2는 본 발명의 실시예에 따른 메타데이터 추출장치의 제어블럭도,
도 3은 본 발명의 실시예에 따른 추천 컨텐츠 선택장치의 제어블럭도,
도 4는 본 발명의 실시예에 따른 클러스터 정보의 저장 상태도,
도 5는 본 발명의 실시예에 따른 추천 컨텐츠 리스트의 표시 상태도,
도 6은 본 발명의 실시예에 따른 컨텐츠 추천 방법의 흐름도,
도 7은 본 발명의 실시예에 따른 추천 컨텐츠 선택장치의 제어 흐름도이다.
1 is a configuration diagram of a content recommendation system according to an embodiment of the present invention;
2 is a control block diagram of a metadata extraction apparatus according to an embodiment of the present invention,
3 is a control block diagram of a recommended content selection apparatus according to an embodiment of the present invention,
4 is a diagram illustrating a storage state of cluster information according to an embodiment of the present invention.
5 is a display state diagram of a recommended content list according to an embodiment of the present invention,
6 is a flowchart of a content recommendation method according to an embodiment of the present invention,
7 is a control flowchart of a recommended content selection device according to an embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 보다 상세히 설명하기로 한다. 첨부 도면을 참조하여 설명함에 있어 동일하거나 대응하는 구성 요소는 동일한 도면번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description with reference to the accompanying drawings, the same or corresponding components will be denoted by the same reference numerals, and redundant description thereof will be omitted.

도 1은 본 발명의 실시예에 따른 컨텐츠 추천 시스템의 구성도이다.1 is a configuration diagram of a content recommendation system according to an embodiment of the present invention.

도 1에 도시된 바와 같이, 컨텐츠 추천 시스템은 컨텐츠 데이터베이스 장치(100)로부터 각 컨텐츠의 메타데이터를 추출하는 메타데이터 추출장치(200), 추출된 메타데이터에 따라 각 컨텐츠를 클러스터링하는 컨텐츠 클러스터 생성장치(250), 컨텐츠 클러스터와 구매이력 데이터베이스 장치(150)로부터 제공받은 각 사용자들의 컨텐츠 구매이력에 기초하여 사용자에게 제공할 추천 컨텐츠 리스트를 생성하는 추천 컨텐츠 선택장치(300)를 포함한다.1, the content recommendation system includes a metadata extracting apparatus 200 for extracting metadata of each content from the content database apparatus 100, a content cluster generating apparatus 200 for clustering each content according to the extracted metadata, And a recommended content selection device 300 for generating a recommended content list to be provided to the user based on the content purchasing history of each user provided from the content cluster and the purchase history database device 150.

컨텐츠 데이터베이스 장치(100)에는 컨텐츠의 이름, 등록일 등을 포함하는 기본정보와 함께, 컨텐츠 소개, 컨텐츠 사용 설명서 혹은 줄거리 등 컨텐츠의 내용과 관련된 정보가 저장된다.The content database apparatus 100 stores basic information including a name of a content, a date of registration, etc., and information related to content of the content such as a content introduction, a content use guide, or a plot.

메타데이터 추출장치(200)는 컨텐츠 데이터베이스 장치(100)에 저장된 정보로부터 컨텐츠의 메타데이터를 추출한다. 컨텐츠의 메타데이터는 컨텐츠 소개, 사용 설명서, 줄거리 등 컨텐츠의 내용과 관련된 정보를 포함하는 텍스트 형태로 추출될 수 있다. 예컨대, 컨텐츠가 앱인 경우 해당 앱의 개발사가 올린 태그 정보, 상세 설명 등을 메타데이터로 이용할 수 있다. 또한, 컨텐츠가 사진일 경우 사진의 색상 정보위치 정보사진을 찍은 장치 정보 등을 활용할 수 있고, 음악의 경우 가수, 작사가, 작곡가, 장르, 음의 빠르기, 가사 정보, VOD의 경우 감독, 출연자, 줄거리 등을 메타데이터로 이용할 수 있다.The metadata extracting apparatus 200 extracts metadata of contents from the information stored in the contents database apparatus 100. The metadata of the content may be extracted in the form of a text including information related to the content of the content such as a content introduction, a user guide, and a plot. For example, if the content is an app, the tag information and the detailed description provided by the developer of the app can be used as metadata. In addition, if content is a photograph, device information of a photograph of color information location information of a photograph can be utilized. In case of music, a singer, a lyricist, a composer, a genre, And a plot can be used as metadata.

*컨텐츠 클러스터 생성장치(250)는 메타데이터 추출장치(200)에서 수집된 메타데이터를 기반으로 컨텐츠들을 클러스터링한다. 본 발명에서 메타데이터는 컨텐츠의 내용과 관련된 정보이므로 유사한 내용을 갖는 컨텐츠들끼리 클러스터링 된다. 컨텐츠 클러스터 생성장치(250)는 kmeans clustering, canopy clustering, fuzzy-kmeans, Hierarchical clustering, probabilistic clustering 등, 다양한 클러스터링 기법을 이용할 수 있다.The content cluster generating apparatus 250 clusters the contents on the basis of the metadata collected by the metadata extracting apparatus 200. In the present invention, since metadata is information related to content of contents, contents having similar contents are clustered. The content cluster generating apparatus 250 may use various clustering techniques such as kmeans clustering, canopy clustering, fuzzy-kmeans, hierarchical clustering, and probabilistic clustering.

추천 컨텐츠 선택장치(300)는 구매 기록들을 컨텐츠가 속한 클러스터에 맵핑하고, 해당 클러스터 내에서 컨텐츠별 구매기록 유사도(similarity)를 산출하여 유사도가 높은 순서로 컨텐츠를 추천한다. 여기서, 컨텐츠가 속한 클러스터가 두 개 이상일 경우, 각각의 클러스터에서 추천 리스트가 생성되므로 컨텐츠 별로 추천결과를 수집한 후 유사도가 높은 순서로 n개의 추천 컨텐츠를 선별하여 최종 추천 리스트를 생성할 수 있다.The recommended content selection device 300 maps the purchase records to the cluster to which the content belongs, calculates similarity of purchase records for each content within the cluster, and recommends the content in descending order of similarity. Here, if the number of clusters to which the content belongs is two or more, a recommendation list is generated in each cluster. Therefore, the recommendation result may be collected for each content, and the recommended recommendation list may be generated by selecting n recommended contents in descending order of similarity.

이러한 구성에 의해, 본 발명의 실시예에 따른 컨텐츠 추천 시스템은 컨텐츠의 내용을 메타데이터로 활용하여 사용자가 구매하였던 컨텐츠의 내용과 실질적으로 관련된 내용을 포함하는 컨텐츠들을 선별하여 추천할 수 있다.With this configuration, the content recommendation system according to the embodiment of the present invention can selectively recommend contents including contents substantially related to the contents of the contents purchased by the user by utilizing contents of contents as metadata.

도 2는 본 발명의 실시예에 따른 메타데이터 추출장치(200)의 제어블럭도이다.2 is a control block diagram of a metadata extraction apparatus 200 according to an embodiment of the present invention.

도 2에 도시된 바와 같이, 메타데이터 추출장치(200)는 메타데이터 수집부(202)와 피쳐 설정부(204)를 포함한다. 메타데이터 수집부(202)는 컨텐츠 데이터베이스 장치(100)에 저장된 컨텐츠 정보 중 각 컨텐츠의 메타데이터를 수집한다. 메타데이터는 컨텐츠의 내용과 관련된 데이터로서, 컨텐츠 소개, 사용 설명서, 줄거리, 컨텐츠와 관련된 태그, 상세 설명 등을 포함할 수 있다.As shown in FIG. 2, the metadata extraction apparatus 200 includes a metadata collection unit 202 and a feature setting unit 204. The metadata collection unit 202 collects metadata of each content in the content information stored in the content database apparatus 100. Metadata is data related to contents of contents and may include contents introduction, user's guide, plot, tags related to contents, detailed description, and the like.

피쳐 설정부(204)는 수집된 메타데이터를 가공하여 피쳐(feature)를 생성한다. 컨텐츠가 앱일 경우, 앱의 개발사 및 태그 정보는 그 단어 자체를 피쳐로 사용할 수 있고, 상세 설명의 경우 문장을 분석하여 명사만 추출하여 피쳐로 사용할 수 있다. The feature setting unit 204 processes the collected metadata to generate a feature. If the content is an app, the developer and tag information of the app can use the word itself as a feature, and in the case of the detailed description, the sentence can be analyzed and the noun can be extracted and used as a feature.

이러한 구성에 의해, 메타데이터 추출장치(200)는 각 컨텐츠의 설명에 포함된 단어들을 추출하여 컨텐츠의 내용을 특징지을 수 있는 메타데이터를 추출한다.With this configuration, the metadata extraction apparatus 200 extracts the words included in the description of each content and extracts metadata that can characterize the content of the content.

이에, 컨텐츠 클러스터 생성장치(250)는 컨텐츠의 내용을 특징지을 수 있는 메타데이터, 즉, 단어들의 유사성을 산출하여 유사한 내용을 갖는 컨텐츠들을 클러스터링 할 수 있다.Accordingly, the content cluster generating apparatus 250 can clustering contents having similar contents by calculating the similarity of the metadata, that is, the words, which can characterize the contents.

도 3은 본 발명의 실시예에 따른 추천 컨텐츠 선택장치(300)의 제어블럭도이다.3 is a control block diagram of the recommended content selection apparatus 300 according to an embodiment of the present invention.

도 3에 도시된 바와 같이, 추천 컨텐츠 선택장치(300)는, 컨텐츠 클러스터 저장부(308)와 구매기록 저장부(310), 구매기록 맵핑부(302), 유사도 산출부(304) 및 추천 리스트 생성부(306)를 포함한다.3, the recommended content selection device 300 includes a content cluster storage unit 308, a purchase record storage unit 310, a purchase record mapping unit 302, a similarity calculation unit 304, And a generation unit 306.

컨텐츠 클러스터 저장부(308)에는 컨텐츠 클러스터 생성장치(250)가 생성한 클러스터가 저장된다. 각 클러스터는 컨텐츠 내용의 유사도에 따라 생성된 것으로서, 주기적으로 컨텐츠 정보를 업데이트 하여 유사한 내용을 갖는 컨텐츠들을 갱신할 수 있다. 도 4에 도시된 클러스터 정보는 클러스터 id(cluster id)가 "1990"인 클러스터를 예시하고 있으며, 해당 클러스터 내에 저장된 컨텐츠들의 아이템 id(item id)를 보여준다. 또한, 해당 컨텐츠의 이름(app name), 설명(description) 및 해당 컨텐츠의 피쳐(features)도 저장될 수 있다.The content cluster storage unit 308 stores clusters generated by the content cluster generation apparatus 250. [ Each cluster is generated in accordance with the similarity of content contents, and can update contents having similar contents by updating contents information periodically. The cluster information shown in FIG. 4 illustrates a cluster having a cluster id of "1990 " and shows item IDs of contents stored in the cluster. In addition, an app name, a description, and features of the content may be stored.

구매기록 저장부(310)에는 사용자들의 컨텐츠 구매기록이 저장된다. 컨텐츠 구매기록은 사용자 식별을 위한 사용자 id(user id)와 컨텐츠 식별을 위한 아이템 id(item id)를 포함할 수 있다.The purchase record storage unit 310 stores contents purchase records of users. The content purchase record may include a user ID for user identification and an item ID for content identification.

구매기록 맵핑부(302)는 구매기록에 따라 사용자가 구매한 컨텐츠들을 해당 컨텐츠가 속한 클러스터에 맵핑한다. 구매기록 맵핑부(302)는 구매기록 저장부(310)에서 사용자 id(user id)와 아이템 id(item id)를 추출하여, 아이템 id가 속한 클러스터 id들을 판단한다. The purchase record mapping unit 302 maps the contents purchased by the user according to the purchase record to the cluster to which the content belongs. The purchase record mapping unit 302 extracts a user id and an item id from the purchase record storage unit 310 and determines cluster IDs to which the item id belongs.

유사도 산출부(304)는 클러스터별로 모아진 구매기록을 이용하여 컨텐츠별 유사도를 산출한다. 이에, 클러스터 내에서 사용자들이 구매한 기록을 바탕으로 각각의 컨텐츠 사이의 유사도가 수치적으로 산출된다. 유사도 산출부(304)는 자카드 계수, 피어슨 상관점수, 유클리디안 거리, 맨하튼 거리 등 현재 알려진 유사도 산출기술을 이용하여 유사도를 산출할 수 있다. The similarity calculating unit 304 calculates the similarity for each content using the collected purchase records for each cluster. Thus, based on the records purchased by the users in the cluster, the similarities between the respective contents are numerically calculated. The similarity calculating unit 304 can calculate the similarity using a currently known similarity calculating technique such as Jacquard coefficient, Pearson correlation score, Euclidean distance, Manhattan distance, and the like.

추천 리스트 생성부(306)는 유사도 산출부(304)의 산출결과에 따라 유사도가 높은 순으로 n개의 컨텐츠를 선별하여 추천 리스트를 생성한다. 여기서, 하나의 컨텐츠가 속한 클러스터가 두 개 이상일 경우, 각각 클러스터에서 추출된 추천 리스트들을 수합한 후 다시 유사도 순으로 n개의 컨텐츠를 선별하여 추천 리스트를 생성한다. The recommendation list generation unit 306 generates a recommendation list by selecting n contents in descending order of degree of similarity according to the result of calculation by the similarity degree calculation unit 304. [ Here, if there are two or more clusters to which one content belongs, after collecting the recommendation lists extracted from the clusters, n content items are selected in order of similarity to generate a recommendation list.

도 5는 추천 리스트 생성부(306)에서 생성되는 추천 리스트를 예시한 것이다.FIG. 5 illustrates a recommendation list generated by the recommendation list generation unit 306. FIG.

도 5에 도시된 바와 같이, 컨텐츠 추천 리스트는 대상 앱과 추천앱 1 ~ 추천앱 5을 포함할 수 있다. 대상 앱은 컨텐츠 마켓에 등록된 컨텐츠이고 추천앱은 해당 컨텐츠와 내용이 유사하며, 사용자들의 구매 기록을 기반으로한 유사도가 높은 컨텐츠로서, 추천 컨텐츠의 개수는 사용자 혹은 시스템 설정에 따라 변경될 수 있다.As shown in FIG. 5, the content recommendation list may include a target app and a recommended app 1 to a recommended app 5. The target app is content registered in the content market, and the recommended app is similar to the content, and has high similarity based on the purchase history of users, and the number of recommended content can be changed according to the user or system setting .

도 6은 본 발명의 실시예에 따른 컨텐츠 추천 방법의 흐름도이다.6 is a flowchart of a content recommendation method according to an embodiment of the present invention.

메타데이터 추출장치(200)는 컨텐츠 데이터베이스 장치(100)에 저장된 정보로부터 컨텐츠의 메타데이터를 수집한다(S110). 컨텐츠의 메타데이터는 컨텐츠 소개, 사용 설명서, 줄거리 등 컨텐츠의 내용과 관련된 정보를 포함한다.The metadata extracting apparatus 200 collects metadata of contents from the information stored in the contents database apparatus 100 (S110). The metadata of the content includes information related to the content of the content such as the introduction of the content, the instruction manual, and the storyline.

메타데이터로부터 필요한 피쳐를 추출한다(S120). 메타데이터 추출장치(200)는 컨텐츠의 태그, 혹은 사용방법으로부터 명사들을 추출하여 피쳐를 생성할 수 있다.The necessary features are extracted from the metadata (S120). The metadata extraction apparatus 200 can extract nouns from a tag or a usage method of the content to generate a feature.

컨텐츠 클러스터 생성장치(250)는 추출된 피쳐를 기반으로 클러스터를 생성한다(S130). 이에, 유사한 내용을 갖는 컨텐츠들로 클러스터가 생성된다.The content cluster generating apparatus 250 generates clusters based on the extracted features (S130). Thus, clusters are created with contents having similar contents.

추천 컨텐츠 선택장치(300)는 사용자의 구매기록을 클러스터에 맵핑하여 추천 컨텐츠를 추출하고(S140), 추천 컨텐츠 리스트를 생성한다(S150).The recommended content selection device 300 maps the purchase record of the user to the cluster and extracts the recommended content (S140), and generates a recommended content list (S150).

도 7은 본 발명의 실시예에 따른 추천 컨텐츠 선택장치(300)의 제어 흐름도이다.7 is a control flowchart of the recommended content selection device 300 according to the embodiment of the present invention.

컨텐츠 클러스터 저장부(308)에는 컨텐츠 클러스터 생성장치(250)에서 생성된 클러스터 정보가 저장된다(S210). 여기서, 클러스터 정보는 클러스터 id, 아이템 id와 컨텐츠 이름(app name), 설명(description), 피쳐(features)를 포함할 수 있다. In the content cluster storage unit 308, cluster information generated by the content cluster generation apparatus 250 is stored (S210). Here, the cluster information may include a cluster id, an item id, a content name (app name), a description, and features.

구매기록 맵핑부(302)는 구매기록을 해당 컨텐츠가 속한 클러스터에 맵핑한다(S220). 구매기록은 사용자 id(user id)와 컨텐츠 식별을 위한 아이템 id(item id)를 포함할 수 있다. 이에, 구매기록 맵핑부(302)는 사용자 id(user id)와 아이템 id(item id)를 추출하여, 아이템 id가 속한 클러스터 id들을 판단할 수 있다.The purchase record mapping unit 302 maps the purchase record to the cluster to which the corresponding content belongs (S220). The purchase record may include a user id and an item id for content identification. Accordingly, the purchase record mapping unit 302 can extract a user id and an item id to determine cluster IDs to which the item id belongs.

유사도 산출부(304)는 클러스터별로 모아진 구매기록을 이용하여 컨텐츠별 유사도를 산출한다(S240). 유사도 산출부(304)는 자카드 계수, 피어슨 상관점수, 유클리디안 거리, 맨하튼 거리 등 현재 알려진 유사도 산출기술을 이용하여 유사도를 산출할 수 있다.  The similarity calculating unit 304 calculates the similarity for each content using the collected purchase records for each cluster (S240). The similarity calculating unit 304 can calculate the similarity using a currently known similarity calculating technique such as Jacquard coefficient, Pearson correlation score, Euclidean distance, Manhattan distance, and the like.

추천 리스트 생성부(306)는 유사도 산출부(304)의 산출결과에 따라 유사도가 높은 n개의 컨텐츠를 추출하고(S240), 유사도가 높은 순으로 추천 리스트를 생성한다(S250). The recommendation list generation unit 306 extracts n contents having a high degree of similarity according to the result of the similarity degree calculation unit 304 (S240), and generates a recommendation list in order of high similarity (S250).

추천 컨텐츠 리스트를 사용자에게 제공한다(S260). 이에, 사용자가 구매한 컨텐츠와 유사한 내용을 갖는 컨텐츠들을 추천 받을 수 있다.The recommended content list is provided to the user (S260). Accordingly, contents having contents similar to the contents purchased by the user can be recommended.

한편, 본 발명의 또 다른 측면에 따르면, 컨텐츠의 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 텍스트 데이터를 입력받는 단계; 상기 텍스트 데이터에서 명사를 추출하여 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 단계; 상기 추출된 메타데이터에 따라 내용이 유사한 컨텐츠를 포함하는 클러스터를 생성하는 단계; 사용자가 구매한 컨텐츠 정보를 제공받아 상기 구매한 컨텐츠가 포함된 상기 클러스터를 맵핑하는 단계; 상기 클러스터 내에서 상기 사용자가 구매한 컨텐츠와 유사한 내용을 포함하는 컨텐츠를 선택하는 단계; 및 상기 선택된 컨텐츠를 상기 사용자에게 추천 컨텐츠 리스트로 제공하는 단계를 포함하는 컨텐츠 추천 방법이 프로그램으로 기록되고 전자 장치에서 판독 가능한 기록매체에 프로그램으로 기록되고 전자 장치에서 판독 가능한 기록매체에 기록될 수 있다. According to another aspect of the present invention, there is provided a method of providing content, comprising: receiving text data including content introduction, content usage guide, and plot; Extracting nouns from the text data and extracting metadata representing characteristics of the contents; Generating a cluster including contents similar in content according to the extracted metadata; Mapping the cluster including the purchased content to the cluster by receiving the purchased content information; Selecting content including content similar to the content purchased by the user in the cluster; And providing the selected content to the user as a recommended content list, the content recommendation method may be recorded as a program, recorded on a recording medium readable by an electronic device, and recorded on a recording medium readable by the electronic device .

이러한 컨텐츠 추천 방법은 프로그램으로 작성 가능하며, 프로그램을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 컨텐츠 추천 방법에 관한 프로그램은 전자장치가 읽을 수 있는 정보저장매체(Readable Media)에 저장되고, 전자장치에 의하여 읽혀지고 실행될 수 있다.Such a content recommendation method can be created by a program, and the codes and code segments constituting the program can be easily deduced by a programmer in the field. In addition, the program relating to the content recommendation method may be stored in an information storage medium (Readable Media) readable by the electronic apparatus, and read and executed by the electronic apparatus.

또한, 본 발명의 다른 측면에 따르면, 내용이 유사한 컨텐츠들을 포함하는 클러스터 정보를 저장하는 단계; 사용자의 컨텐츠 구매기록을 저장하는 단계; 상기 사용자의 구매기록을 상기 클러스터에 맵핑하는 단계; 상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 산출하는 단계; 상기 컨텐츠의 유사도가 높은 순서로 컨텐츠를 선택하는 단계; 및 선택된 상기 컨텐츠를 포함하는 추천 컨텐츠 리스트를 생성하는 단계를 포함하는 추천 컨텐츠 선택장치의 제어방법이 프로그램으로 기록되고 전자 장치에서 판독 가능한 기록매체에 기록될 수 있다. According to another aspect of the present invention, there is also provided a method of storing cluster information, the method comprising: storing cluster information including contents having similar contents; Storing a content purchase history of a user; Mapping the purchase record of the user to the cluster; Calculating a similarity between the mapped content and the content included in the cluster; Selecting contents in descending order of similarity of the contents; And a step of generating a recommended content list including the selected content is recorded in a program and recorded in a recordable medium readable by an electronic device.

이러한 추천 컨텐츠 선택장치의 제어방법은 프로그램으로 작성 가능하며, 프로그램을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 추천 컨텐츠 선택장치의 제어방법에 관한 프로그램은 전자장치가 읽을 수 있는 정보저장매체(Readable Media)에 저장되고, 전자장치에 의하여 읽혀지고 실행될 수 있다.The control method of the recommended content selection device can be formed by a program, and the codes and code segments constituting the program can be easily deduced by a programmer in the field. Also, the program relating to the control method of the recommended content selection device may be stored in an information storage medium (Readable Media) readable by the electronic device, and read and executed by the electronic device.

이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.Thus, those skilled in the art will appreciate that the present invention may be embodied in other specific forms without departing from the spirit or essential characteristics thereof. It is therefore to be understood that the embodiments described above are to be considered in all respects only as illustrative and not restrictive. The scope of the present invention is defined by the appended claims rather than the detailed description and all changes or modifications derived from the meaning and scope of the claims and their equivalents are to be construed as being included within the scope of the present invention do.

본 발명은 컨텐츠의 내용과 컨텐츠의 구매기록을 바탕으로 사용자가 구매한 컨텐츠와 실질적으로 내용이 유사한 컨텐츠들을 추천함으로써 다양한 장르와 카테고리의 컨텐츠를 추천할 수 있고 정확도가 높은 개인화 추천정보를 제공할 수 있는 컨텐츠 추천 시스템 및 방법에 이용할 수 있다.According to the present invention, it is possible to recommend contents of various genres and categories by recommending contents substantially similar to contents purchased by the user based on the content of contents and the purchase record of contents, and to provide personalized recommendation information with high accuracy And a content recommendation system and method.

100 : 컨텐츠 데이터베이스 장치 150 : 구매이력 데이터베이스 장치
200 : 메타데이터 추출장치 202 : 메타데이터 수집부
204 : 피쳐 설정부 250 : 컨텐츠 클러스터 생성장치
300 : 추천 컨텐츠 선택장치 302 : 구매기록 맵핑부
304 : 유사도 산출부 306 : 추천 리스트 생성부
308 : 컨텐츠 클러스터 저장부 310 : 구매기록 저장부
100: content database device 150: purchase history database device
200: Metadata extraction unit 202: Metadata collection unit
204: feature setting unit 250: content cluster generating apparatus
300: Recommended content selection device 302: Purchase record mapping part
304: degree-of-similarity calculation unit 306:
308: Content cluster storage unit 310: Purchase record storage unit

Claims (2)

컨텐츠 사용 설명서, 줄거리를 포함하는 컨텐츠의 내용정보가 저장된 컨텐츠 데이터베이스 장치;
상기 컨텐츠의 내용정보를 입력받아 상기 컨텐츠 내용정보의 특성을 나타내는 메타데이터를 추출하는 메타데이터 추출장치;
상기 추출된 메타데이터에 따라 각 컨텐츠를 클러스터링하는 컨텐츠 클러스터 생성장치; 및
사용자의 컨텐츠 구매이력에 따라, 상기 사용자가 구매한 컨텐츠를 상기 컨텐츠 클러스터와 맵핑하여 상기 사용자가 구매한 컨텐츠와 유사한 내용을 포함하는 컨텐츠를 상기 사용자에게 추천 컨텐츠 리스트로 제공하는 추천 컨텐츠 선택장치를 포함하되,
상기 추천 컨텐츠 선택장치는 자카드 계수, 유클리디안 거리, 맨하튼 거리 중 적어도 어느 하나의 방식으로 상기 컨텐츠의 유사도를 산출하는 것을 특징으로 하되,
상기 추천 컨텐츠 선택장치는
내용이 유사한 컨텐츠들을 포함하는 클러스터 정보가 저장된 컨텐츠 클러스터 저장부;
사용자의 컨텐츠 구매기록이 저장된 구매기록 저장부;
상기 사용자의 구매기록을 상기 클러스터에 맵핑하는 구매기록 맵핑부;
상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 산출하는 유사도 산출부; 및
상기 컨텐츠의 유사도가 높은 순서로 컨텐츠를 선택하여 추천 컨텐츠 리스트를 생성하는 추천 리스트 생성부를 포함하되,
상기 추천 리스트 생성부는 유사도 산출부의 산출결과에 따라 유사도가 높은 순으로 n개의 컨텐츠를 선별하여 추천 리스트를 생성하며,
하나의 컨텐츠가 속한 클러스터가 두 개 이상일 경우, 각각 클러스터에 서 추출된 추천 리스트들을 수합한 후 다시 유사도 순으로 n개의 컨텐츠를 선별하여 추천 리스트를 생성하는 컨텐츠 추천 시스템.
A contents database device storing content information of content including a content usage guide and a storyline;
A metadata extracting unit that receives the content information of the content and extracts metadata representing characteristics of the content content information;
A content cluster generating apparatus for clustering each content according to the extracted metadata; And
And a recommended content selection device for mapping the content purchased by the user to the content cluster according to the content purchase history of the user and providing the content including contents similar to the content purchased by the user to the user as a recommended content list However,
Wherein the recommended content selection device calculates the similarity of the content by at least one of a Jacquard coefficient, an Euclidean distance, and a Manhattan distance,
The recommended content selection device
A content cluster storage unit for storing cluster information including contents having similar contents;
A purchase record storage unit in which a content purchase record of a user is stored;
A purchase record mapping unit for mapping the purchase record of the user to the cluster;
A similarity calculating unit for calculating a similarity between the mapped content and the content included in the cluster; And
And a recommendation list generation unit for selecting the contents in descending order of similarity of the contents to generate a recommended contents list,
Wherein the recommendation list generator generates a recommendation list by selecting n contents in descending order of similarity according to a result of calculation by the similarity calculating unit,
When the number of clusters belonging to one content is two or more, collecting the recommendation lists extracted from the clusters and then selecting n contents in order of similarity to generate a recommendation list.
제1항에 있어서,
메타데이터 추출장치는,
상기 컨텐츠의 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 텍스트 데이터를 입력받는 메타데이터 수집부; 및
상기 텍스트 데이터에서 명사를 추출하여 상기 컨텐츠 내용정보의 특성을 나타내는 메타데이터를 추출하는 피쳐 설정부를 포함하는 것을 특징으로 하되,
상기 추천 리스트는 대상앱 및 추천앱을 포함하고, 상기 대상앱은 컨텐츠 마켓에 등록된 컨텐츠이고 추천앱은 사용자들의 구매 기록을 기반으로한 유사도가 높은 컨텐츠인 것을 특징으로 하는 컨텐츠 추천 시스템.

The method according to claim 1,
The metadata extracting apparatus includes:
A metadata collection unit for receiving text data including a content introduction of the content, a content usage guide, and a plot; And
And a feature setting unit for extracting nouns from the text data and extracting metadata representing characteristics of the content content information,
Wherein the recommendation list includes a target app and a recommended app, the target app is content registered in a content market, and the recommended app is a content having high similarity based on purchase records of users.

KR1020160120246A 2016-09-20 2016-09-20 Contents recommendation system and contents recommendation method KR101755409B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160120246A KR101755409B1 (en) 2016-09-20 2016-09-20 Contents recommendation system and contents recommendation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160120246A KR101755409B1 (en) 2016-09-20 2016-09-20 Contents recommendation system and contents recommendation method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020120068127A Division KR101660463B1 (en) 2012-06-25 2012-06-25 Contents recommendation system and contents recommendation method

Publications (2)

Publication Number Publication Date
KR20160113532A KR20160113532A (en) 2016-09-29
KR101755409B1 true KR101755409B1 (en) 2017-07-27

Family

ID=57073631

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160120246A KR101755409B1 (en) 2016-09-20 2016-09-20 Contents recommendation system and contents recommendation method

Country Status (1)

Country Link
KR (1) KR101755409B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101854912B1 (en) * 2018-03-07 2018-05-04 주식회사 텐디 Method of analyzing correlation between applications and apparatus for analyzing correlation between applications
KR101871745B1 (en) * 2018-04-27 2018-08-02 주식회사 텐디 Method of determining representative keyword of mobile device user and system for determining representative keyword of mobile device user
WO2019088725A1 (en) * 2017-11-06 2019-05-09 주식회사 아티스츠카드 Method for automatically tagging metadata of music content using machine learning
WO2022065681A1 (en) * 2020-09-23 2022-03-31 삼성전자주식회사 Display device and control method therefor

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832306A (en) * 2017-11-28 2018-03-23 武汉大学 A kind of similar entities method for digging based on Doc2vec
KR102051311B1 (en) * 2018-02-21 2020-01-08 현대카드 주식회사 Method for recommending information on websites customized to clients' log by using personalization algorithm and server using the same
KR102051300B1 (en) * 2018-02-21 2020-01-08 현대카드 주식회사 Method for recommending information on wetsites customized to clients' q and a by using personalization algorithm and server using the same
KR102367568B1 (en) * 2020-12-14 2022-02-24 숙명여자대학교산학협력단 Contents caching system in cooperative MEC based on user similarity, and method thereof
KR102452642B1 (en) * 2021-09-03 2022-10-07 주식회사 뮤직카우 Method and system for determining relevance between items related to copyright

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101111121B1 (en) 2009-06-29 2012-02-13 주식회사 모임 Apparatus and Method for presenting personalized contents information based on artificial intelligence, and Recording medium thereof

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019088725A1 (en) * 2017-11-06 2019-05-09 주식회사 아티스츠카드 Method for automatically tagging metadata of music content using machine learning
KR101854912B1 (en) * 2018-03-07 2018-05-04 주식회사 텐디 Method of analyzing correlation between applications and apparatus for analyzing correlation between applications
WO2019172488A1 (en) * 2018-03-07 2019-09-12 주식회사 텐디 Method and device for relevance analysis between applications
KR101871745B1 (en) * 2018-04-27 2018-08-02 주식회사 텐디 Method of determining representative keyword of mobile device user and system for determining representative keyword of mobile device user
WO2019208873A1 (en) * 2018-04-27 2019-10-31 주식회사 텐디 Method for determining representative keyword of mobile terminal user and system for determining representative keyword of mobile terminal user
WO2022065681A1 (en) * 2020-09-23 2022-03-31 삼성전자주식회사 Display device and control method therefor

Also Published As

Publication number Publication date
KR20160113532A (en) 2016-09-29

Similar Documents

Publication Publication Date Title
KR101755409B1 (en) Contents recommendation system and contents recommendation method
KR101660463B1 (en) Contents recommendation system and contents recommendation method
US20200125981A1 (en) Systems and methods for recognizing ambiguity in metadata
US8200667B2 (en) Method and apparatus for constructing user profile using content tag, and method for content recommendation using the constructed user profile
CN101960753B (en) Annotating video intervals
US20090055390A1 (en) Information sorting device and information retrieval device
CN108846097B (en) User interest tag representation method, article recommendation device and equipment
EP3603092A1 (en) Using machine learning to recommend live-stream content
CN109145110B (en) Label query method and device
US20140229476A1 (en) System for Information Discovery & Organization
TW201220099A (en) Multi-modal approach to search query input
CN102356393A (en) Data processing device
CN105825396B (en) Method and system for clustering advertisement labels based on co-occurrence
CN113688951B (en) Video data processing method and device
JP2008084193A (en) Instance selection device, instance selection method and instance selection program
CN112989053A (en) Periodical recommendation method and device
CN106372123B (en) Tag-based related content recommendation method and system
CN117420998A (en) Client UI interaction component generation method, device, terminal and medium
CN108804491A (en) item recommendation method, device, computing device and storage medium
CN111858860B (en) Search information processing method and system, server and computer readable medium
CN111198957A (en) Push method and device, electronic equipment and storage medium
JP2006251975A (en) Text sorting method and program by the method, and text sorter
WO2017135889A1 (en) Ontology determination methods and ontology determination devices
CN109902231A (en) Education resource recommended method based on CBOW model
JP6260678B2 (en) Information processing apparatus, information processing method, and information processing program

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant