KR20140015653A - Contents recommendation system and contents recommendation method - Google Patents

Contents recommendation system and contents recommendation method Download PDF

Info

Publication number
KR20140015653A
KR20140015653A KR1020120068127A KR20120068127A KR20140015653A KR 20140015653 A KR20140015653 A KR 20140015653A KR 1020120068127 A KR1020120068127 A KR 1020120068127A KR 20120068127 A KR20120068127 A KR 20120068127A KR 20140015653 A KR20140015653 A KR 20140015653A
Authority
KR
South Korea
Prior art keywords
content
user
contents
cluster
purchased
Prior art date
Application number
KR1020120068127A
Other languages
Korean (ko)
Other versions
KR101660463B1 (en
Inventor
이채현
Original Assignee
에스케이플래닛 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이플래닛 주식회사 filed Critical 에스케이플래닛 주식회사
Priority to KR1020120068127A priority Critical patent/KR101660463B1/en
Publication of KR20140015653A publication Critical patent/KR20140015653A/en
Application granted granted Critical
Publication of KR101660463B1 publication Critical patent/KR101660463B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0224Discounts or incentives, e.g. coupons or rebates based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention relates to a system and a method for recommending content, comprising: a content database for storing information on content including a content introduction, a user's guide of the content and a summary; a metadata extracting device for receiving the information on the content and extracting metadata expressing properties of the content; a content cluster generation device for clustering each content according to the extracted metadata; and a recommended content selecting device for mapping content, purchased by a user, with the content cluster according to a user's content purchase history, and recommending content, of which substance is similar to that of the content purchased by the user, to the user with a recommended content list. By this means, the present invention recommends the content of which substance is practically similar to that of the content purchased by the user on the basis of the substance of the content and the purchase history of the content, thereby capable of recommending the content belonging to various genres and categories and providing highly precise personalized recommended information. [Reference numerals] (100) Content database; (150) Purchase history database; (200) Metadata extracting device; (250) Content cluster generation device; (300) Recommended content selecting device; (AA) Recommended content list

Description

컨텐츠 추천 시스템 및 방법{CONTENTS RECOMMENDATION SYSTEM AND CONTENTS RECOMMENDATION METHOD}CONTENTS RECOMMENDATION SYSTEM AND CONTENTS RECOMMENDATION METHOD}

본 발명은 컨텐츠 추천 시스템 및 방법에 관한 것으로서, 보다 상세하게는, 컨텐츠의 내용과 컨텐츠의 구매기록을 바탕으로 사용자가 구매한 컨텐츠와 실질적으로 내용이 유사한 컨텐츠들을 추천함으로써 다양한 장르와 카테고리의 컨텐츠를 추천할 수 있고 정확도가 높은 개인화 추천정보를 제공할 수 있는 컨텐츠 추천 시스템 및 방법에 관한 것이다.The present invention relates to a content recommendation system and method, and more particularly, to recommend content of various genres and categories by recommending contents substantially similar to the contents purchased by the user based on the contents of the contents and the purchase records of the contents. The present invention relates to a content recommendation system and method capable of recommending and providing highly accurate personalized recommendation information.

대용량 데이터의 전송 및 처리 기술의 발전으로 사용자가 접할 수 있는 컨텐츠는 기하 급수적으로 늘어나고 있다. 특히, 초고속 통신망이 도입되고 스마트폰, 태블릿, 넷북, IP TV 등과 같은 각종 멀티미디어 기기의 대용량화가 진행됨에 따라 사용자는 때와 장소에 구애됨 없이 수많은 컨텐츠를 즐길 수 있게 되었다.With the development of large data transmission and processing technology, the content that users can access is growing exponentially. In particular, with the introduction of high-speed communication networks and the increasing capacity of various multimedia devices such as smart phones, tablets, netbooks, and IP TVs, users can enjoy a lot of contents regardless of time and place.

그러나, 이렇게 컨텐츠의 양이 늘어남에 따라 사용자가 원하는 것을 찾는 데 걸리는 시간과 노력도 증가하게 된다. 이를 해결하기 위해 사용자가 만족할만한 컨텐츠를 선별하여 추천하는 방식이 등장하였다. However, as the amount of content increases, so does the time and effort required to find what the user wants. In order to solve this problem, a method of selecting and recommending content that users are satisfied with has emerged.

이러한 종래의 추천 방식으로는 컨텐츠의 판매량, 구매자들의 추천정보 등을 이용하는 단순 추천 방식과, 각 사용자들이 입력한 선호 장르정보나 선호 카테고리정보, 혹은, 각 사용자들의 구매이력 등을 이용하는 맞춤형 추천 방식이 있다.Such conventional recommendation methods include a simple recommendation method using content sales volume, buyer recommendation information, and a customized recommendation method using preference genre information, preference category information, or purchase history of each user. have.

그런데, 판매량 등에 기초한 단순 추천 방식의 경우 사용자의 개인 취향을 반영할 수 없기 때문에 추천 정확도가 떨어진다는 문제점이 있다.However, in the case of a simple recommendation method based on sales volume, there is a problem that the recommendation accuracy is lowered because the user's personal taste cannot be reflected.

그리고, 사용자가 입력한 정보나 구매 이력을 이용하는 맞춤형 추천 방식의 경우 단순히 사용자의 선호정보만을 고려하기 때문에 계속 변화하고 추가되는 컨텐츠들 전체를 고려하여 사용자 선호도에 맞춤화된 최적의 컨텐츠를 추천하는데 한계가 있으며, 추천 대상 컨텐츠의 장르, 카테고리 등이 한정되므로 다양한 컨텐츠를 추천할 수 없다는 문제점이 있다.In addition, in the case of a personalized recommendation method using information inputted by the user or the purchase history, since only the user's preference information is considered, there is a limit to recommending the optimal content customized to the user's preference in consideration of all the contents that are constantly changing and added. In addition, since the genre, category, etc. of the content to be recommended are limited, there is a problem that various contents cannot be recommended.

또한, 사용자의 구매기록만을 활용할 경우 사용자들이 구매기록이 몰리는 아이템들만 상위에 추천되므로 실제 아이템의 컨텐츠 유사도는 반영되지 않는 문제점이 있다.In addition, when only the user's purchase record is utilized, only the items in which the user's purchase record is collected are recommended at a higher level, which does not reflect the content similarity of the actual item.

한국등록특허 제10-1111121호 : 인공지능에 기반한 개인별 맞춤형 컨텐츠 제공 장치 및 방법, 그 기록 매체Korean Patent No. 10-1111121: Apparatus and method for providing personalized content based on artificial intelligence, and recording medium thereof

본 발명은 상술한 과제를 해결하기 위하여 안출된 것으로서, 컨텐츠의 내용과 컨텐츠의 구매기록을 바탕으로 사용자가 구매한 컨텐츠와 실질적으로 내용이 유사한 컨텐츠들을 추천함으로써 다양한 장르와 카테고리의 컨텐츠를 추천할 수 있고 정확도가 높은 개인화 추천정보를 제공할 수 있는 컨텐츠 추천 시스템 및 방법을 제공하는데 그 기술적 과제가 있다.The present invention has been made to solve the above-described problems, and can recommend content of various genres and categories by recommending contents substantially similar to the contents purchased by the user based on the contents of the contents and the purchase records of the contents. There is a technical problem to provide a content recommendation system and method that can provide highly accurate personalized recommendation information.

상술한 과제를 해결하기 위한 본 발명의 일 측면에 따르면, 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 컨텐츠의 내용정보가 저장된 컨텐츠 데이터베이스 장치; 상기 컨텐츠의 내용정보를 입력받아 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 메타데이터 추출장치; 상기 추출된 메타데이터에 따라 각 컨텐츠를 클러스터링하는 컨텐츠 클러스터 생성장치; 및 사용자의 컨텐츠 구매이력에 따라, 상기 사용자가 구매한 컨텐츠를 상기 컨텐츠 클러스터와 맵핑하여 상기 사용자가 구매한 컨텐츠와 유사한 내용을 포함하는 컨텐츠를 상기 사용자에게 추천 컨텐츠 리스트로 제공하는 추천 컨텐츠 선택장치를 포함하는 컨텐츠 추천 시스템이 제공된다.According to an aspect of the present invention for solving the above problems, a content database device that stores the content information of the content, including content introduction, content instruction manual, the plot; A metadata extraction device configured to receive content information of the content and extract metadata representing characteristics of the content content; A content cluster generating device for clustering each content according to the extracted metadata; And a recommended content selection device for mapping the content purchased by the user to the content cluster and providing the user with a content list including contents similar to the content purchased by the user as a recommended content list according to the user's content purchase history. A content recommendation system is provided.

여기서, 메타데이터 추출장치는, 상기 컨텐츠의 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 텍스트 데이터를 입력받는 메타데이터 수집부; 및 상기 텍스트 데이터에서 명사를 추출하여 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 피쳐 설정부를 포함할 수 있다.The metadata extracting apparatus may include a metadata collector configured to receive text data including content introduction, content instruction manual, and a plot of the content; And a feature setting unit for extracting nouns from the text data to extract metadata representing characteristics of the content content.

상술한 과제를 해결하기 위한 본 발명의 다른 측면에 따르면, 내용이 유사한 컨텐츠들을 포함하는 클러스터 정보가 저장된 컨텐츠 클러스터 저장부; 사용자의 컨텐츠 구매기록이 저장된 구매기록 저장부; 상기 사용자의 구매기록을 상기 클러스터에 맵핑하는 구매기록 맵핑부; 상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 산출하는 유사도 산출부; 및 상기 컨텐츠의 유사도가 높은 순서로 컨텐츠를 선택하여 추천 컨텐츠 리스트를 생성하는 추천 리스트 생성부를 포함하는 추천 컨텐츠 선택장치가 제공된다.According to another aspect of the present invention for solving the above problems, a content cluster storage unit for storing cluster information including similar content; A purchase record storage unit for storing a content purchase record of the user; A purchase record mapping unit for mapping the purchase record of the user to the cluster; A similarity calculator configured to calculate a similarity between the mapped content and the content included in the cluster; And a recommendation list generator which selects the contents in the order of high similarity of the contents and generates a recommended contents list.

여기서, 상기 구매기록 맵핑부는, 상기 사용자의 구매기록을 통해 상기 사용자가 구매한 컨텐츠 정보를 확인하고 상기 사용자가 구매한 컨텐츠가 포함된 적어도 하나 이상의 클러스터 정보를 상기 컨텐츠 클러스터 저장부로부터 검색하여 맵핑할 수 있다.Here, the purchase record mapping unit may check the content information purchased by the user through the purchase record of the user and search for and map at least one cluster information including the content purchased by the user from the content cluster storage unit. Can be.

그리고, 상기 유사도 산출부는, 자카드 계수, 피어슨 상관점수, 유클리디안 거리, 맨하튼 거리 중 적어도 어느 하나의 방식으로 상기 컨텐츠의 유사도를 산출할 수 있다.The similarity calculator may calculate the similarity of the content by at least one of a jacquard coefficient, a Pearson correlation score, a Euclidean distance, and a Manhattan distance.

또한, 상기 추천 리스트 생성부는, 하나의 컨텐츠가 속한 클러스터가 복수개일 경우 복수개의 상기 클러스터에서 추출된 상기 추천 리스트들을 수합하고, 상기 추천 리스트들에 포함된 컨텐츠들의 유사도 순으로 컨텐츠를 선별하여 최종 추천 리스트를 생성할 수 있다.The recommendation list generating unit may collect the recommendation lists extracted from the plurality of clusters when there are a plurality of clusters to which one content belongs, select the contents in order of similarity of the contents included in the recommendation lists, and then make a final recommendation. You can create a list.

상술한 과제를 해결하기 위한 본 발명의 또 다른 측면에 따르면, 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 컨텐츠의 내용정보로부터 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 단계; 상기 추출된 메타데이터에 따라 내용이 유사한 컨텐츠를 포함하는 클러스터를 생성하는 단계; 사용자가 구매한 컨텐츠 정보를 제공받아 상기 구매한 컨텐츠가 포함된 상기 클러스터를 맵핑하는 단계; 상기 클러스터 내에서 상기 사용자가 구매한 컨텐츠와 유사한 내용을 포함하는 컨텐츠를 선택하는 단계; 및 상기 선택된 컨텐츠를 상기 사용자에게 추천 컨텐츠 리스트로 제공하는 단계를 포함하는 컨텐츠 추천 방법이 제공된다.According to another aspect of the present invention for solving the above problems, the step of extracting metadata indicating the characteristics of the content content from the content information of the content, including content introduction, content instruction manual, plot; Generating a cluster including contents having similar contents according to the extracted metadata; Receiving content information purchased by a user and mapping the cluster including the purchased content; Selecting content in the cluster that includes content similar to the content purchased by the user; And providing the selected content to the user as a list of recommended contents.

여기서, 상기 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 컨텐츠의 내용정보로부터 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 단계는, 상기 컨텐츠의 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 텍스트 데이터를 입력받는 단계; 및 상기 텍스트 데이터에서 명사를 추출하여 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 단계를 포함할 수 있다.Here, the extracting of the metadata representing the characteristics of the content content from the content information of the content including the content introduction, the content instruction manual, and the plot may include text data including the content introduction, the content instruction manual, and the plot of the content. Receiving an input; And extracting metadata representing a characteristic of the content content by extracting a noun from the text data.

상술한 과제를 해결하기 위한 본 발명의 또 다른 측면에 따르면, 컨텐츠의 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 텍스트 데이터를 입력받는 단계; 상기 텍스트 데이터에서 명사를 추출하여 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 단계; 상기 추출된 메타데이터에 따라 내용이 유사한 컨텐츠를 포함하는 클러스터를 생성하는 단계; 사용자가 구매한 컨텐츠 정보를 제공받아 상기 구매한 컨텐츠가 포함된 상기 클러스터를 맵핑하는 단계; 상기 클러스터 내에서 상기 사용자가 구매한 컨텐츠와 유사한 내용을 포함하는 컨텐츠를 선택하는 단계; 및 상기 선택된 컨텐츠를 상기 사용자에게 추천 컨텐츠 리스트로 제공하는 단계를 포함하는 컨텐츠 추천 방법이 프로그램으로 기록되고 전자 장치에서 판독 가능한 기록매체가 제공된다.According to another aspect of the present invention for solving the above problems, the step of receiving text data including the content introduction, content instruction manual, the plot of the content; Extracting nouns from the text data to extract metadata representing characteristics of the content content; Generating a cluster including contents having similar contents according to the extracted metadata; Receiving content information purchased by a user and mapping the cluster including the purchased content; Selecting content in the cluster that includes content similar to the content purchased by the user; And providing the selected content to the user as a list of recommended contents, and a recording medium recorded by the program and readable by the electronic device.

상술한 과제를 해결하기 위한 본 발명의 또 다른 측면에 따르면, 내용이 유사한 컨텐츠들을 포함하는 클러스터 정보를 저장하는 단계; 사용자의 컨텐츠 구매기록을 저장하는 단계; 상기 사용자의 구매기록을 상기 클러스터에 맵핑하는 단계; 상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 산출하는 단계; 상기 컨텐츠의 유사도가 높은 순서로 컨텐츠를 선택하는 단계; 및 선택된 상기 컨텐츠를 포함하는 추천 컨텐츠 리스트를 생성하는 단계를 포함하는 추천 컨텐츠 선택장치의 제어방법이 제공된다.According to another aspect of the present invention for solving the above problems, the step of storing the cluster information including content that is similar in content; Storing a content purchase record of the user; Mapping the purchase record of the user to the cluster; Calculating a similarity degree between the mapped content and the content included in the cluster; Selecting contents in order of high similarity of the contents; And generating a recommendation content list including the selected content.

여기서, 상기 사용자의 구매기록을 상기 클러스터에 맵핑하는 단계는, 상기 사용자의 컨텐츠 구매기록을 통해 상기 사용자가 구매한 컨텐츠 정보를 확인하는 단계; 및 기 저장된 클러스터 정보 중, 상기 사용자가 구매한 컨텐츠가 포함된 적어도 하나 이상의 클러스터 정보를 검색하는 단계를 포함할 수 있다.The mapping of the purchase record of the user to the cluster may include: checking the content information purchased by the user through the content purchase record of the user; And retrieving at least one cluster information including content purchased by the user from among previously stored cluster information.

그리고, 상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 산출하는 단계는, 상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 자카드 계수, 피어슨 상관점수, 유클리디안 거리, 맨하튼 거리 중 적어도 어느 하나의 방식으로 산출하는 단계를 포함할 수 있다.The calculating of the similarity between the mapped content and the content included in the cluster may include determining the similarity between the mapped content and the content included in the cluster, from among jacquard coefficient, Pearson correlation score, Euclidean distance, and Manhattan distance. And calculating in at least one manner.

또한, 선택된 상기 컨텐츠를 포함하는 추천 컨텐츠 리스트를 생성하는 단계는, 하나의 컨텐츠가 속한 클러스터가 복수개일 경우 복수개의 상기 클러스터에서 추출된 상기 추천 리스트들을 수합하는 단계; 및 상기 추천 리스트들에 포함된 컨텐츠들의 유사도 순으로 컨텐츠를 선별하여 최종 추천 리스트를 생성하는 단계를 포함할 수 있다.
The generating of the recommended content list including the selected content may include: collecting the recommendation lists extracted from the plurality of clusters when there are a plurality of clusters to which one content belongs; And generating a final recommendation list by selecting content in order of similarity of the contents included in the recommendation lists.

상술한 바와 같이 본 발명의 컨텐츠 추천 시스템 및 방법은 컨텐츠의 내용과 컨텐츠의 구매기록을 바탕으로 사용자가 구매한 컨텐츠와 실질적으로 내용이 유사한 컨텐츠들을 추천함으로써 정확도가 높은 개인화 추천정보를 제공할 수 있다.As described above, the content recommendation system and method of the present invention can provide highly personalized recommendation information by recommending contents substantially similar to the contents purchased by the user based on the contents of the contents and the purchase records of the contents. .

또한, 본 발명의 컨텐츠 추천 시스템 및 방법은 컨텐츠의 내용을 바탕으로 추천대상 컨텐츠를 선별함으로써 다양한 장르와 카테고리의 컨텐츠를 추천할 수 있다.In addition, the content recommendation system and method of the present invention may recommend content of various genres and categories by selecting content to be recommended based on the content of the content.

도 1은 본 발명의 실시예에 따른 컨텐츠 추천 시스템의 구성도,
도 2는 본 발명의 실시예에 따른 메타데이터 추출장치의 제어블럭도,
도 3은 본 발명의 실시예에 따른 추천 컨텐츠 선택장치의 제어블럭도,
도 4는 본 발명의 실시예에 따른 클러스터 정보의 저장 상태도,
도 5는 본 발명의 실시예에 따른 추천 컨텐츠 리스트의 표시 상태도,
도 6은 본 발명의 실시예에 따른 컨텐츠 추천 방법의 흐름도,
도 7은 본 발명의 실시예에 따른 추천 컨텐츠 선택장치의 제어 흐름도이다.
1 is a block diagram of a content recommendation system according to an embodiment of the present invention;
2 is a control block diagram of a metadata extraction apparatus according to an embodiment of the present invention;
3 is a control block diagram of a recommended content selection device according to an embodiment of the present invention;
4 is a storage state diagram of cluster information according to an embodiment of the present invention;
5 is a display state diagram of a recommended content list according to an embodiment of the present invention;
6 is a flowchart of a content recommendation method according to an embodiment of the present invention;
7 is a flowchart illustrating a recommended content selection device according to an embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 보다 상세히 설명하기로 한다. 첨부 도면을 참조하여 설명함에 있어 동일하거나 대응하는 구성 요소는 동일한 도면번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description with reference to the accompanying drawings, the same or corresponding components will be denoted by the same reference numerals, and redundant description thereof will be omitted.

도 1은 본 발명의 실시예에 따른 컨텐츠 추천 시스템의 구성도이다.1 is a block diagram of a content recommendation system according to an exemplary embodiment of the present invention.

도 1에 도시된 바와 같이, 컨텐츠 추천 시스템은 컨텐츠 데이터베이스 장치(100)로부터 각 컨텐츠의 메타데이터를 추출하는 메타데이터 추출장치(200), 추출된 메타데이터에 따라 각 컨텐츠를 클러스터링하는 컨텐츠 클러스터 생성장치(250), 컨텐츠 클러스터와 구매이력 데이터베이스 장치(150)로부터 제공받은 각 사용자들의 컨텐츠 구매이력에 기초하여 사용자에게 제공할 추천 컨텐츠 리스트를 생성하는 추천 컨텐츠 선택장치(300)를 포함한다.As shown in FIG. 1, the content recommendation system includes a metadata extracting apparatus 200 for extracting metadata of each content from the content database apparatus 100, and a content cluster generating apparatus for clustering each content according to the extracted metadata. 250, a recommendation content selection device 300 generating a recommendation content list to be provided to the user based on the content purchase history of each user provided from the content cluster and the purchase history database device 150.

컨텐츠 데이터베이스 장치(100)에는 컨텐츠의 이름, 등록일 등을 포함하는 기본정보와 함께, 컨텐츠 소개, 컨텐츠 사용 설명서 혹은 줄거리 등 컨텐츠의 내용과 관련된 정보가 저장된다.The content database device 100 stores information related to the contents of the contents, such as contents introduction, contents instruction manual or plot, together with basic information including the name of the contents, the registration date, and the like.

메타데이터 추출장치(200)는 컨텐츠 데이터베이스 장치(100)에 저장된 정보로부터 컨텐츠의 메타데이터를 추출한다. 컨텐츠의 메타데이터는 컨텐츠 소개, 사용 설명서, 줄거리 등 컨텐츠의 내용과 관련된 정보를 포함하는 텍스트 형태로 추출될 수 있다. 예컨대, 컨텐츠가 앱인 경우 해당 앱의 개발사가 올린 태그 정보, 상세 설명 등을 메타데이터로 이용할 수 있다. 또한, 컨텐츠가 사진일 경우 사진의 색상 정보위치 정보사진을 찍은 장치 정보 등을 활용할 수 있고, 음악의 경우 가수, 작사가, 작곡가, 장르, 음의 빠르기, 가사 정보, VOD의 경우 감독, 출연자, 줄거리 등을 메타데이터로 이용할 수 있다.The metadata extracting apparatus 200 extracts metadata of the contents from the information stored in the contents database apparatus 100. The metadata of the content may be extracted in the form of text including information related to the content of the content, such as content introduction, instruction manual, and plot. For example, when the content is an app, tag information, a detailed description, etc. posted by the developer of the app may be used as metadata. In addition, when the content is a photo, the color information of the photo, location information, and device information in which the photo was taken may be utilized. The plot can be used as metadata.

컨텐츠 클러스터 생성장치(250)는 메타데이터 추출장치(200)에서 수집된 메타데이터를 기반으로 컨텐츠들을 클러스터링한다. 본 발명에서 메타데이터는 컨텐츠의 내용과 관련된 정보이므로 유사한 내용을 갖는 컨텐츠들끼리 클러스터링 된다. 컨텐츠 클러스터 생성장치(250)는 kmeans clustering, canopy clustering, fuzzy-kmeans, Hierarchical clustering, probabilistic clustering 등, 다양한 클러스터링 기법을 이용할 수 있다.The content cluster generator 250 clusters the contents based on the metadata collected by the metadata extractor 200. In the present invention, since the metadata is information related to the content of the content, contents having similar contents are clustered. The content cluster generator 250 may use various clustering techniques such as kmeans clustering, canopy clustering, fuzzy-kmeans, hierarchical clustering, probabilistic clustering, and the like.

추천 컨텐츠 선택장치(300)는 구매 기록들을 컨텐츠가 속한 클러스터에 맵핑하고, 해당 클러스터 내에서 컨텐츠별 구매기록 유사도(similarity)를 산출하여 유사도가 높은 순서로 컨텐츠를 추천한다. 여기서, 컨텐츠가 속한 클러스터가 두 개 이상일 경우, 각각의 클러스터에서 추천 리스트가 생성되므로 컨텐츠 별로 추천결과를 수집한 후 유사도가 높은 순서로 n개의 추천 컨텐츠를 선별하여 최종 추천 리스트를 생성할 수 있다.The recommended content selection device 300 maps purchase records to a cluster to which the content belongs, calculates similarity of purchase records for each content in the corresponding cluster, and recommends the contents in the order of high similarity. In this case, when there are two or more clusters to which the content belongs, a recommendation list is generated in each cluster, and thus, the final recommendation list may be generated by selecting the recommendation contents in the order of high similarity after collecting the recommendation result for each content.

이러한 구성에 의해, 본 발명의 실시예에 따른 컨텐츠 추천 시스템은 컨텐츠의 내용을 메타데이터로 활용하여 사용자가 구매하였던 컨텐츠의 내용과 실질적으로 관련된 내용을 포함하는 컨텐츠들을 선별하여 추천할 수 있다.By such a configuration, the content recommendation system according to an exemplary embodiment of the present invention may select and recommend contents including contents substantially related to the contents of contents purchased by the user by using the contents of the contents as metadata.

도 2는 본 발명의 실시예에 따른 메타데이터 추출장치(200)의 제어블럭도이다.2 is a control block diagram of a metadata extraction apparatus 200 according to an embodiment of the present invention.

도 2에 도시된 바와 같이, 메타데이터 추출장치(200)는 메타데이터 수집부(202)와 피쳐 설정부(204)를 포함한다. 메타데이터 수집부(202)는 컨텐츠 데이터베이스 장치(100)에 저장된 컨텐츠 정보 중 각 컨텐츠의 메타데이터를 수집한다. 메타데이터는 컨텐츠의 내용과 관련된 데이터로서, 컨텐츠 소개, 사용 설명서, 줄거리, 컨텐츠와 관련된 태그, 상세 설명 등을 포함할 수 있다.As shown in FIG. 2, the metadata extracting apparatus 200 includes a metadata collecting unit 202 and a feature setting unit 204. The metadata collector 202 collects metadata of each content among the content information stored in the content database device 100. The metadata is data related to the content of the content, and may include a content introduction, an instruction manual, a story line, a tag related to the content, a detailed description, and the like.

피쳐 설정부(204)는 수집된 메타데이터를 가공하여 피쳐(feature)를 생성한다. 컨텐츠가 앱일 경우, 앱의 개발사 및 태그 정보는 그 단어 자체를 피쳐로 사용할 수 있고, 상세 설명의 경우 문장을 분석하여 명사만 추출하여 피쳐로 사용할 수 있다. The feature setter 204 processes the collected metadata to generate a feature. If the content is an app, the developer and tag information of the app may use the word itself as a feature, and in the case of a detailed description, only a noun may be extracted and used as a feature.

이러한 구성에 의해, 메타데이터 추출장치(200)는 각 컨텐츠의 설명에 포함된 단어들을 추출하여 컨텐츠의 내용을 특징지을 수 있는 메타데이터를 추출한다.By such a configuration, the metadata extracting apparatus 200 extracts metadata that can characterize the contents of the contents by extracting words included in the description of each content.

이에, 컨텐츠 클러스터 생성장치(250)는 컨텐츠의 내용을 특징지을 수 있는 메타데이터, 즉, 단어들의 유사성을 산출하여 유사한 내용을 갖는 컨텐츠들을 클러스터링 할 수 있다.Accordingly, the content cluster generating apparatus 250 may cluster the contents having similar contents by calculating the metadata that characterizes the contents of the contents, that is, the similarity of the words.

도 3은 본 발명의 실시예에 따른 추천 컨텐츠 선택장치(300)의 제어블럭도이다.3 is a control block diagram of the recommended content selection device 300 according to the embodiment of the present invention.

도 3에 도시된 바와 같이, 추천 컨텐츠 선택장치(300)는, 컨텐츠 클러스터 저장부(308)와 구매기록 저장부(310), 구매기록 맵핑부(302), 유사도 산출부(304) 및 추천 리스트 생성부(306)를 포함한다.As shown in FIG. 3, the recommended content selection device 300 includes a content cluster storage unit 308, a purchase record storage unit 310, a purchase record mapping unit 302, a similarity calculator 304, and a recommendation list. The generation unit 306 is included.

컨텐츠 클러스터 저장부(308)에는 컨텐츠 클러스터 생성장치(250)가 생성한 클러스터가 저장된다. 각 클러스터는 컨텐츠 내용의 유사도에 따라 생성된 것으로서, 주기적으로 컨텐츠 정보를 업데이트 하여 유사한 내용을 갖는 컨텐츠들을 갱신할 수 있다. 도 4에 도시된 클러스터 정보는 클러스터 id(cluster id)가 "1990"인 클러스터를 예시하고 있으며, 해당 클러스터 내에 저장된 컨텐츠들의 아이템 id(item id)를 보여준다. 또한, 해당 컨텐츠의 이름(app name), 설명(description) 및 해당 컨텐츠의 피쳐(features)도 저장될 수 있다.The content cluster storage unit 308 stores the cluster generated by the content cluster generator 250. Each cluster is generated according to the similarity of contents, and may periodically update contents information to update contents having similar contents. The cluster information illustrated in FIG. 4 illustrates a cluster having a cluster id of 1990 and shows item ids of contents stored in the cluster. In addition, an app name, a description, and features of the corresponding content may be stored.

구매기록 저장부(310)에는 사용자들의 컨텐츠 구매기록이 저장된다. 컨텐츠 구매기록은 사용자 식별을 위한 사용자 id(user id)와 컨텐츠 식별을 위한 아이템 id(item id)를 포함할 수 있다.The purchase record storage unit 310 stores content purchase records of users. The content purchase record may include a user id for user identification and an item id for content identification.

구매기록 맵핑부(302)는 구매기록에 따라 사용자가 구매한 컨텐츠들을 해당 컨텐츠가 속한 클러스터에 맵핑한다. 구매기록 맵핑부(302)는 구매기록 저장부(310)에서 사용자 id(user id)와 아이템 id(item id)를 추출하여, 아이템 id가 속한 클러스터 id들을 판단한다. The purchase record mapping unit 302 maps the contents purchased by the user to the cluster to which the corresponding content belongs according to the purchase record. The purchase record mapping unit 302 extracts a user id and an item id from the purchase record storage unit 310 to determine cluster IDs to which the item id belongs.

유사도 산출부(304)는 클러스터별로 모아진 구매기록을 이용하여 컨텐츠별 유사도를 산출한다. 이에, 클러스터 내에서 사용자들이 구매한 기록을 바탕으로 각각의 컨텐츠 사이의 유사도가 수치적으로 산출된다. 유사도 산출부(304)는 자카드 계수, 피어슨 상관점수, 유클리디안 거리, 맨하튼 거리 등 현재 알려진 유사도 산출기술을 이용하여 유사도를 산출할 수 있다. The similarity calculating unit 304 calculates the similarity for each content using the purchase records collected for each cluster. Thus, similarity between each content is numerically calculated based on records purchased by users in the cluster. The similarity calculator 304 may calculate the similarity using currently known similarity calculating techniques such as jacquard coefficient, Pearson correlation score, Euclidean distance, and Manhattan distance.

추천 리스트 생성부(306)는 유사도 산출부(304)의 산출결과에 따라 유사도가 높은 순으로 n개의 컨텐츠를 선별하여 추천 리스트를 생성한다. 여기서, 하나의 컨텐츠가 속한 클러스터가 두 개 이상일 경우, 각각 클러스터에서 추출된 추천 리스트들을 수합한 후 다시 유사도 순으로 n개의 컨텐츠를 선별하여 추천 리스트를 생성한다. The recommendation list generation unit 306 selects n pieces of contents in order of high similarity according to the calculation result of the similarity calculation unit 304 and generates a recommendation list. Here, when there are two or more clusters to which one content belongs, each of the recommended lists extracted from the clusters is collected, and again, n pieces of contents are sorted in order of similarity to generate a recommendation list.

도 5는 추천 리스트 생성부(306)에서 생성되는 추천 리스트를 예시한 것이다.5 illustrates a recommendation list generated by the recommendation list generator 306.

도 5에 도시된 바와 같이, 컨텐츠 추천 리스트는 대상 앱과 추천앱 1 ~ 추천앱 5을 포함할 수 있다. 대상 앱은 컨텐츠 마켓에 등록된 컨텐츠이고 추천앱은 해당 컨텐츠와 내용이 유사하며, 사용자들의 구매 기록을 기반으로한 유사도가 높은 컨텐츠로서, 추천 컨텐츠의 개수는 사용자 혹은 시스템 설정에 따라 변경될 수 있다.As shown in FIG. 5, the content recommendation list may include a target app and a recommended app 1 to recommended app 5. The target app is a content registered in the content market, and the recommended app is similar to the corresponding content and has high similarity based on the purchase history of the user. The number of recommended content may be changed according to a user or system setting. .

도 6은 본 발명의 실시예에 따른 컨텐츠 추천 방법의 흐름도이다.6 is a flowchart of a content recommendation method according to an embodiment of the present invention.

메타데이터 추출장치(200)는 컨텐츠 데이터베이스 장치(100)에 저장된 정보로부터 컨텐츠의 메타데이터를 수집한다(S110). 컨텐츠의 메타데이터는 컨텐츠 소개, 사용 설명서, 줄거리 등 컨텐츠의 내용과 관련된 정보를 포함한다.The metadata extracting apparatus 200 collects metadata of the content from the information stored in the content database apparatus 100 (S110). The metadata of the content includes information related to the content of the content, such as content introduction, instruction manual, and the story line.

메타데이터로부터 필요한 피쳐를 추출한다(S120). 메타데이터 추출장치(200)는 컨텐츠의 태그, 혹은 사용방법으로부터 명사들을 추출하여 피쳐를 생성할 수 있다.The required feature is extracted from the metadata (S120). The metadata extracting apparatus 200 may generate a feature by extracting nouns from a tag or a method of using the content.

컨텐츠 클러스터 생성장치(250)는 추출된 피쳐를 기반으로 클러스터를 생성한다(S130). 이에, 유사한 내용을 갖는 컨텐츠들로 클러스터가 생성된다.The content cluster generator 250 generates a cluster based on the extracted feature (S130). Thus, a cluster is created with contents having similar contents.

추천 컨텐츠 선택장치(300)는 사용자의 구매기록을 클러스터에 맵핑하여 추천 컨텐츠를 추출하고(S140), 추천 컨텐츠 리스트를 생성한다(S150).The recommended content selection device 300 maps a purchase record of the user to a cluster to extract recommended content (S140), and generates a recommended content list (S150).

도 7은 본 발명의 실시예에 따른 추천 컨텐츠 선택장치(300)의 제어 흐름도이다.7 is a control flowchart of the recommended content selection device 300 according to an embodiment of the present invention.

컨텐츠 클러스터 저장부(308)에는 컨텐츠 클러스터 생성장치(250)에서 생성된 클러스터 정보가 저장된다(S210). 여기서, 클러스터 정보는 클러스터 id, 아이템 id와 컨텐츠 이름(app name), 설명(description), 피쳐(features)를 포함할 수 있다. The content cluster storage unit 308 stores cluster information generated by the content cluster generator 250 (S210). Here, the cluster information may include a cluster id, an item id, an app name, a description, and features.

구매기록 맵핑부(302)는 구매기록을 해당 컨텐츠가 속한 클러스터에 맵핑한다(S220). 구매기록은 사용자 id(user id)와 컨텐츠 식별을 위한 아이템 id(item id)를 포함할 수 있다. 이에, 구매기록 맵핑부(302)는 사용자 id(user id)와 아이템 id(item id)를 추출하여, 아이템 id가 속한 클러스터 id들을 판단할 수 있다.The purchase record mapping unit 302 maps the purchase record to a cluster to which the corresponding content belongs (S220). The purchase record may include a user id and an item id for content identification. Accordingly, the purchase record mapping unit 302 may extract a user id and an item id to determine cluster ids to which the item id belongs.

유사도 산출부(304)는 클러스터별로 모아진 구매기록을 이용하여 컨텐츠별 유사도를 산출한다(S240). 유사도 산출부(304)는 자카드 계수, 피어슨 상관점수, 유클리디안 거리, 맨하튼 거리 등 현재 알려진 유사도 산출기술을 이용하여 유사도를 산출할 수 있다.  The similarity calculator 304 calculates similarity for each content using the purchase records collected for each cluster (S240). The similarity calculator 304 may calculate the similarity using currently known similarity calculating techniques such as jacquard coefficient, Pearson correlation score, Euclidean distance, and Manhattan distance.

추천 리스트 생성부(306)는 유사도 산출부(304)의 산출결과에 따라 유사도가 높은 n개의 컨텐츠를 추출하고(S240), 유사도가 높은 순으로 추천 리스트를 생성한다(S250). The recommendation list generator 306 extracts n contents having high similarity according to the calculation result of the similarity calculator 304 (S240), and generates a recommendation list in order of high similarity (S250).

추천 컨텐츠 리스트를 사용자에게 제공한다(S260). 이에, 사용자가 구매한 컨텐츠와 유사한 내용을 갖는 컨텐츠들을 추천 받을 수 있다.The recommended content list is provided to the user (S260). Accordingly, the user may be recommended contents having contents similar to the contents purchased by the user.

한편, 본 발명의 또 다른 측면에 따르면, 컨텐츠의 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 텍스트 데이터를 입력받는 단계; 상기 텍스트 데이터에서 명사를 추출하여 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 단계; 상기 추출된 메타데이터에 따라 내용이 유사한 컨텐츠를 포함하는 클러스터를 생성하는 단계; 사용자가 구매한 컨텐츠 정보를 제공받아 상기 구매한 컨텐츠가 포함된 상기 클러스터를 맵핑하는 단계; 상기 클러스터 내에서 상기 사용자가 구매한 컨텐츠와 유사한 내용을 포함하는 컨텐츠를 선택하는 단계; 및 상기 선택된 컨텐츠를 상기 사용자에게 추천 컨텐츠 리스트로 제공하는 단계를 포함하는 컨텐츠 추천 방법이 프로그램으로 기록되고 전자 장치에서 판독 가능한 기록매체에 프로그램으로 기록되고 전자 장치에서 판독 가능한 기록매체에 기록될 수 있다. On the other hand, according to another aspect of the invention, the step of receiving text data including the content introduction, content instruction manual, the story line of the content; Extracting nouns from the text data to extract metadata representing characteristics of the content content; Generating a cluster including contents having similar contents according to the extracted metadata; Receiving content information purchased by a user and mapping the cluster including the purchased content; Selecting content in the cluster that includes content similar to the content purchased by the user; And providing the selected content as a list of recommended contents to the user. The content recommendation method may be recorded as a program, recorded on a recording medium readable by the electronic device, and recorded on a recording medium readable by the electronic device. .

이러한 컨텐츠 추천 방법은 프로그램으로 작성 가능하며, 프로그램을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 컨텐츠 추천 방법에 관한 프로그램은 전자장치가 읽을 수 있는 정보저장매체(Readable Media)에 저장되고, 전자장치에 의하여 읽혀지고 실행될 수 있다.Such a content recommendation method may be written by a program, and codes and code segments constituting the program may be easily inferred by a programmer in the art. In addition, the program related to the content recommendation method may be stored in a readable media that can be read by the electronic device, and read and executed by the electronic device.

또한, 본 발명의 다른 측면에 따르면, 내용이 유사한 컨텐츠들을 포함하는 클러스터 정보를 저장하는 단계; 사용자의 컨텐츠 구매기록을 저장하는 단계; 상기 사용자의 구매기록을 상기 클러스터에 맵핑하는 단계; 상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 산출하는 단계; 상기 컨텐츠의 유사도가 높은 순서로 컨텐츠를 선택하는 단계; 및 선택된 상기 컨텐츠를 포함하는 추천 컨텐츠 리스트를 생성하는 단계를 포함하는 추천 컨텐츠 선택장치의 제어방법이 프로그램으로 기록되고 전자 장치에서 판독 가능한 기록매체에 기록될 수 있다. In addition, according to another aspect of the invention, the step of storing the cluster information including content that is similar in content; Storing a content purchase record of the user; Mapping the purchase record of the user to the cluster; Calculating a similarity degree between the mapped content and the content included in the cluster; Selecting contents in order of high similarity of the contents; And generating a recommendation content list including the selected content. The method of controlling a recommended content selection device may be recorded by a program and recorded on a recording medium readable by the electronic device.

이러한 추천 컨텐츠 선택장치의 제어방법은 프로그램으로 작성 가능하며, 프로그램을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 추천 컨텐츠 선택장치의 제어방법에 관한 프로그램은 전자장치가 읽을 수 있는 정보저장매체(Readable Media)에 저장되고, 전자장치에 의하여 읽혀지고 실행될 수 있다.The method of controlling the recommended content selection device may be written by a program, and codes and code segments constituting the program may be easily inferred by a programmer in the art. In addition, the program related to the method of controlling the recommended content selection device may be stored in a readable media that can be read by the electronic device, and read and executed by the electronic device.

이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.Thus, those skilled in the art will appreciate that the present invention may be embodied in other specific forms without departing from the spirit or essential characteristics thereof. It is therefore to be understood that the embodiments described above are to be considered in all respects only as illustrative and not restrictive. The scope of the present invention is defined by the appended claims rather than the detailed description and all changes or modifications derived from the meaning and scope of the claims and their equivalents are to be construed as being included within the scope of the present invention do.

본 발명은 컨텐츠의 내용과 컨텐츠의 구매기록을 바탕으로 사용자가 구매한 컨텐츠와 실질적으로 내용이 유사한 컨텐츠들을 추천함으로써 다양한 장르와 카테고리의 컨텐츠를 추천할 수 있고 정확도가 높은 개인화 추천정보를 제공할 수 있는 컨텐츠 추천 시스템 및 방법에 이용할 수 있다.The present invention can recommend content of various genres and categories by recommending contents substantially similar to the contents purchased by the user based on the contents of the contents and the purchase records of the contents, and provide highly accurate personalized recommendation information. Content recommendation system and method.

100 : 컨텐츠 데이터베이스 장치 150 : 구매이력 데이터베이스 장치
200 : 메타데이터 추출장치 202 : 메타데이터 수집부
204 : 피쳐 설정부 250 : 컨텐츠 클러스터 생성장치
300 : 추천 컨텐츠 선택장치 302 : 구매기록 맵핑부
304 : 유사도 산출부 306 : 추천 리스트 생성부
308 : 컨텐츠 클러스터 저장부 310 : 구매기록 저장부
100: content database device 150: purchase history database device
200: metadata extraction device 202: metadata collection unit
204: feature setting unit 250: content cluster generator
300: recommended content selection device 302: purchase record mapping unit
304: Similarity calculation unit 306: Recommendation list generation unit
308: Content cluster storage unit 310: Purchase record storage unit

Claims (13)

컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 컨텐츠의 내용정보가 저장된 컨텐츠 데이터베이스 장치;
상기 컨텐츠의 내용정보를 입력받아 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 메타데이터 추출장치;
상기 추출된 메타데이터에 따라 각 컨텐츠를 클러스터링하는 컨텐츠 클러스터 생성장치; 및
사용자의 컨텐츠 구매이력에 따라, 상기 사용자가 구매한 컨텐츠를 상기 컨텐츠 클러스터와 맵핑하여 상기 사용자가 구매한 컨텐츠와 유사한 내용을 포함하는 컨텐츠를 상기 사용자에게 추천 컨텐츠 리스트로 제공하는 추천 컨텐츠 선택장치를 포함하는 컨텐츠 추천 시스템.
A content database device storing content information of content including content introduction, content instruction manual, and plot;
A metadata extraction device configured to receive content information of the content and extract metadata representing characteristics of the content content;
A content cluster generating device for clustering each content according to the extracted metadata; And
A recommended content selection device for mapping the content purchased by the user to the content cluster according to a user's content purchase history and providing the user with a content list including contents similar to the content purchased by the user as a recommended content list; Content recommendation system.
제1항에 있어서,
메타데이터 추출장치는,
상기 컨텐츠의 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 텍스트 데이터를 입력받는 메타데이터 수집부; 및
상기 텍스트 데이터에서 명사를 추출하여 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 피쳐 설정부를 포함하는 것을 특징으로 하는 컨텐츠 추천 시스템.
The method of claim 1,
Metadata extraction device,
A metadata collector which receives text data including contents introduction, contents instruction manual, and a plot of the contents; And
And a feature setting unit for extracting nouns from the text data to extract metadata representing characteristics of the content.
내용이 유사한 컨텐츠들을 포함하는 클러스터 정보가 저장된 컨텐츠 클러스터 저장부;
사용자의 컨텐츠 구매기록이 저장된 구매기록 저장부;
상기 사용자의 구매기록을 상기 클러스터에 맵핑하는 구매기록 맵핑부;
상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 산출하는 유사도 산출부; 및
상기 컨텐츠의 유사도가 높은 순서로 컨텐츠를 선택하여 추천 컨텐츠 리스트를 생성하는 추천 리스트 생성부를 포함하는 추천 컨텐츠 선택장치.
A content cluster storage unit in which cluster information including content having similar contents is stored;
A purchase record storage unit for storing a content purchase record of the user;
A purchase record mapping unit for mapping the purchase record of the user to the cluster;
A similarity calculator configured to calculate a similarity between the mapped content and the content included in the cluster; And
And a recommendation list generating unit for generating a recommendation content list by selecting the contents in the order of high similarity of the contents.
제3항에 있어서,
상기 구매기록 맵핑부는,
상기 사용자의 구매기록을 통해 상기 사용자가 구매한 컨텐츠 정보를 확인하고 상기 사용자가 구매한 컨텐츠가 포함된 적어도 하나 이상의 클러스터 정보를 상기 컨텐츠 클러스터 저장부로부터 검색하여 맵핑하는 것을 특징으로 하는 추천 컨텐츠 선택장치.
The method of claim 3,
The purchase record mapping unit,
Recommended content selection device characterized in that to check the content information purchased by the user through the purchase record of the user and to search for and map at least one or more cluster information including the content purchased by the user from the content cluster storage unit .
제3항에 있어서,
상기 유사도 산출부는,
자카드 계수, 피어슨 상관점수, 유클리디안 거리, 맨하튼 거리 중 적어도 어느 하나의 방식으로 상기 컨텐츠의 유사도를 산출하는 것을 특징으로 하는 추천 컨텐츠 선택장치.
The method of claim 3,
Wherein the similarity-
And calculating similarity of the content by at least one of a jacquard coefficient, a Pearson correlation score, a Euclidean distance, and a Manhattan distance.
제3항에 있어서,
상기 추천 리스트 생성부는,
하나의 컨텐츠가 속한 클러스터가 복수개일 경우 복수개의 상기 클러스터에서 추출된 상기 추천 리스트들을 수합하고, 상기 추천 리스트들에 포함된 컨텐츠들의 유사도 순으로 컨텐츠를 선별하여 최종 추천 리스트를 생성하는 것을 특징으로 하는 추천 컨텐츠 선택장치.
The method of claim 3,
The recommendation list generation unit,
When there is a plurality of clusters to which one content belongs, the recommendation lists extracted from the plurality of clusters are collected, and the final recommendation list is generated by selecting the contents in order of similarity of the contents included in the recommendation lists. Recommended content selection device.
컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 컨텐츠의 내용정보로부터 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 단계;
상기 추출된 메타데이터에 따라 내용이 유사한 컨텐츠를 포함하는 클러스터를 생성하는 단계;
사용자가 구매한 컨텐츠 정보를 제공받아 상기 구매한 컨텐츠가 포함된 상기 클러스터를 맵핑하는 단계;
상기 클러스터 내에서 상기 사용자가 구매한 컨텐츠와 유사한 내용을 포함하는 컨텐츠를 선택하는 단계; 및
상기 선택된 컨텐츠를 상기 사용자에게 추천 컨텐츠 리스트로 제공하는 단계를 포함하는 컨텐츠 추천 방법.
Extracting metadata representing characteristics of the content content from the content information of the content including content introduction, content instruction manual, and plot;
Generating a cluster including contents having similar contents according to the extracted metadata;
Receiving content information purchased by a user and mapping the cluster including the purchased content;
Selecting content in the cluster that includes content similar to the content purchased by the user; And
And providing the selected content to the user as a recommended content list.
제7항에 있어서,
상기 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 컨텐츠의 내용정보로부터 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 단계는,
상기 컨텐츠의 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 텍스트 데이터를 입력받는 단계; 및
상기 텍스트 데이터에서 명사를 추출하여 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 단계를 포함하는 것을 특징으로 하는 컨텐츠 추천 방법.
The method of claim 7, wherein
Extracting metadata indicating the characteristics of the content content from the content information of the content including the content introduction, the content instruction manual, the plot,
Receiving text data including a content introduction, a content instruction manual, and a plot of the content; And
Extracting nouns from the text data and extracting metadata representing characteristics of the content contents.
컨텐츠의 컨텐츠 소개, 컨텐츠 사용 설명서, 줄거리를 포함하는 텍스트 데이터를 입력받는 단계; 상기 텍스트 데이터에서 명사를 추출하여 상기 컨텐츠 내용의 특성을 나타내는 메타데이터를 추출하는 단계; 상기 추출된 메타데이터에 따라 내용이 유사한 컨텐츠를 포함하는 클러스터를 생성하는 단계; 사용자가 구매한 컨텐츠 정보를 제공받아 상기 구매한 컨텐츠가 포함된 상기 클러스터를 맵핑하는 단계; 상기 클러스터 내에서 상기 사용자가 구매한 컨텐츠와 유사한 내용을 포함하는 컨텐츠를 선택하는 단계; 및 상기 선택된 컨텐츠를 상기 사용자에게 추천 컨텐츠 리스트로 제공하는 단계를 포함하는 컨텐츠 추천 방법이 프로그램으로 기록되고 전자 장치에서 판독 가능한 기록매체.Receiving text data including a content introduction, a content instruction manual, and a plot of the content; Extracting nouns from the text data to extract metadata representing characteristics of the content content; Generating a cluster including contents having similar contents according to the extracted metadata; Receiving content information purchased by a user and mapping the cluster including the purchased content; Selecting content in the cluster that includes content similar to the content purchased by the user; And providing the selected contents to the user as a list of recommended contents. The recording medium is recorded by a program and can be read by an electronic device. 내용이 유사한 컨텐츠들을 포함하는 클러스터 정보를 저장하는 단계;
사용자의 컨텐츠 구매기록을 저장하는 단계;
상기 사용자의 구매기록을 상기 클러스터에 맵핑하는 단계;
상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 산출하는 단계;
상기 컨텐츠의 유사도가 높은 순서로 컨텐츠를 선택하는 단계; 및
선택된 상기 컨텐츠를 포함하는 추천 컨텐츠 리스트를 생성하는 단계를 포함하는 추천 컨텐츠 선택장치의 제어방법.
Storing cluster information including contents having similar contents;
Storing a content purchase record of the user;
Mapping the purchase record of the user to the cluster;
Calculating a similarity degree between the mapped content and the content included in the cluster;
Selecting contents in order of high similarity of the contents; And
And generating a recommendation content list including the selected content.
제10항에 있어서,
상기 사용자의 구매기록을 상기 클러스터에 맵핑하는 단계는,
상기 사용자의 컨텐츠 구매기록을 통해 상기 사용자가 구매한 컨텐츠 정보를 확인하는 단계; 및
기 저장된 클러스터 정보 중, 상기 사용자가 구매한 컨텐츠가 포함된 적어도 하나 이상의 클러스터 정보를 검색하는 단계를 포함하는 것을 특징으로 하는 추천 컨텐츠 선택장치의 제어방법.
11. The method of claim 10,
Mapping the purchase record of the user to the cluster,
Confirming content information purchased by the user through the content purchase record of the user; And
And retrieving at least one or more cluster information including content purchased by the user from among prestored cluster information.
제10항에 있어서,
상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 산출하는 단계는,
상기 맵핑된 컨텐츠와 상기 클러스터에 포함된 컨텐츠의 유사도를 자카드 계수, 피어슨 상관점수, 유클리디안 거리, 맨하튼 거리 중 적어도 어느 하나의 방식으로 산출하는 단계를 포함하는 것을 특징으로 하는 추천 컨텐츠 선택장치의 제어방법.
11. The method of claim 10,
Calculating the similarity between the mapped content and the content included in the cluster,
Calculating a similarity between the mapped content and the content included in the cluster by at least one of a jacquard coefficient, a Pearson correlation score, a Euclidean distance, and a Manhattan distance. Control method.
제10항에 있어서,
선택된 상기 컨텐츠를 포함하는 추천 컨텐츠 리스트를 생성하는 단계는,
하나의 컨텐츠가 속한 클러스터가 복수개일 경우 복수개의 상기 클러스터에서 추출된 상기 추천 리스트들을 수합하는 단계; 및
상기 추천 리스트들에 포함된 컨텐츠들의 유사도 순으로 컨텐츠를 선별하여 최종 추천 리스트를 생성하는 단계를 포함하는 것을 특징으로 하는 추천 컨텐츠 선택장치의 제어방법.
11. The method of claim 10,
Generating the recommended content list including the selected content,
Aggregating the recommendation lists extracted from a plurality of clusters when a plurality of clusters belong to one content; And
And selecting content in order of similarity of contents included in the recommendation lists to generate a final recommendation list.
KR1020120068127A 2012-06-25 2012-06-25 Contents recommendation system and contents recommendation method KR101660463B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120068127A KR101660463B1 (en) 2012-06-25 2012-06-25 Contents recommendation system and contents recommendation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120068127A KR101660463B1 (en) 2012-06-25 2012-06-25 Contents recommendation system and contents recommendation method

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020160120246A Division KR101755409B1 (en) 2016-09-20 2016-09-20 Contents recommendation system and contents recommendation method

Publications (2)

Publication Number Publication Date
KR20140015653A true KR20140015653A (en) 2014-02-07
KR101660463B1 KR101660463B1 (en) 2016-10-10

Family

ID=50264967

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120068127A KR101660463B1 (en) 2012-06-25 2012-06-25 Contents recommendation system and contents recommendation method

Country Status (1)

Country Link
KR (1) KR101660463B1 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160092962A (en) 2016-07-08 2016-08-05 네이버 주식회사 Apparatus for recommending serial contents and method for recommending serial contents
KR20160093489A (en) * 2015-01-29 2016-08-08 주식회사 솔트룩스 Content collection and recommendation system and method
KR20170076099A (en) * 2015-12-24 2017-07-04 주식회사 죠셉데일컴퍼니 Method for providing information method for online shopping and the intergration server thereof
KR20170125003A (en) * 2017-11-01 2017-11-13 네이버 주식회사 Method for providing information method for online shopping and the intergration server thereof
US9830375B2 (en) 2014-03-13 2017-11-28 Korea Institute Of Science And Technology Apparatus for selecting and providing media content on social network service and method thereof
KR20190042117A (en) * 2017-10-13 2019-04-24 극동대학교 산학협력단 System and Methode Using Collaborative Filtering to Recommend Suitable Public Bid Information

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180106772A (en) 2017-03-21 2018-10-01 삼성전자주식회사 Electronic device for perfoming pay and operation method of thereof

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110043369A (en) * 2009-10-21 2011-04-27 숭실대학교산학협력단 Association analysis method for music recommendation
KR101111121B1 (en) 2009-06-29 2012-02-13 주식회사 모임 Apparatus and Method for presenting personalized contents information based on artificial intelligence, and Recording medium thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101111121B1 (en) 2009-06-29 2012-02-13 주식회사 모임 Apparatus and Method for presenting personalized contents information based on artificial intelligence, and Recording medium thereof
KR20110043369A (en) * 2009-10-21 2011-04-27 숭실대학교산학협력단 Association analysis method for music recommendation

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9830375B2 (en) 2014-03-13 2017-11-28 Korea Institute Of Science And Technology Apparatus for selecting and providing media content on social network service and method thereof
KR20160093489A (en) * 2015-01-29 2016-08-08 주식회사 솔트룩스 Content collection and recommendation system and method
KR20170076099A (en) * 2015-12-24 2017-07-04 주식회사 죠셉데일컴퍼니 Method for providing information method for online shopping and the intergration server thereof
KR20160092962A (en) 2016-07-08 2016-08-05 네이버 주식회사 Apparatus for recommending serial contents and method for recommending serial contents
KR20190042117A (en) * 2017-10-13 2019-04-24 극동대학교 산학협력단 System and Methode Using Collaborative Filtering to Recommend Suitable Public Bid Information
KR20170125003A (en) * 2017-11-01 2017-11-13 네이버 주식회사 Method for providing information method for online shopping and the intergration server thereof

Also Published As

Publication number Publication date
KR101660463B1 (en) 2016-10-10

Similar Documents

Publication Publication Date Title
KR101755409B1 (en) Contents recommendation system and contents recommendation method
KR20140015653A (en) Contents recommendation system and contents recommendation method
JP2017224184A (en) Machine learning device
CN108846097B (en) User interest tag representation method, article recommendation device and equipment
WO2018217255A1 (en) Using machine learning to recommend live-stream content
US20090063568A1 (en) Method and apparatus for constructing user profile using content tag, and method for content recommendation using the constructed user profile
US20140172415A1 (en) Apparatus, system, and method of providing sentiment analysis result based on text
CN106980663A (en) Based on magnanimity across the user's portrait method for shielding behavioral data
CN109511015B (en) Multimedia resource recommendation method, device, storage medium and equipment
CN102265276A (en) Context-based recommender system
CN103886081A (en) Information sending method and system
CN107885852B (en) APP recommendation method and system based on APP usage record
EP4083857A1 (en) Information prediction model training method and apparatus, information prediction method and apparatus, storage medium, and device
JP6056610B2 (en) Text information processing apparatus, text information processing method, and text information processing program
CA2985257A1 (en) System and method for ranking search results
CN109582847B (en) Information processing method and device and storage medium
CN102884524A (en) Automatic image discovery and recommendation for displayed television content
CN103309869A (en) Method and system for recommending display keyword of data object
JP2020135891A (en) Methods, apparatus, devices and media for providing search suggestions
US20140136527A1 (en) Apparatus, system, and method for searching for power user in social media
CN106354867A (en) Multimedia resource recommendation method and device
CN103384883A (en) Semantic enrichment by exploiting Top-K processing
CN105426550A (en) Collaborative filtering tag recommendation method and system based on user quality model
US20130346385A1 (en) System and method for a purposeful sharing environment
JP2008084193A (en) Instance selection device, instance selection method and instance selection program

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20191022

Year of fee payment: 4