KR20220099300A - Method, server and computer program for selecting contents - Google Patents

Method, server and computer program for selecting contents Download PDF

Info

Publication number
KR20220099300A
KR20220099300A KR1020210001374A KR20210001374A KR20220099300A KR 20220099300 A KR20220099300 A KR 20220099300A KR 1020210001374 A KR1020210001374 A KR 1020210001374A KR 20210001374 A KR20210001374 A KR 20210001374A KR 20220099300 A KR20220099300 A KR 20220099300A
Authority
KR
South Korea
Prior art keywords
cluster
content
clusters
cluster set
contents
Prior art date
Application number
KR1020210001374A
Other languages
Korean (ko)
Inventor
홍석진
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020210001374A priority Critical patent/KR20220099300A/en
Publication of KR20220099300A publication Critical patent/KR20220099300A/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/475End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
    • H04N21/4758End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data for providing answers, e.g. voting

Abstract

A method for selecting content comprises the steps of: forming a plurality of clusters for a plurality of contents; defining a first cluster set including the plurality of formed clusters; selecting a cluster from the first cluster set based on similarity between the plurality of clusters included in the first cluster set and a second cluster set; including the selected cluster in the second cluster set; selecting a content from the selected cluster based on similarity between one or more contents pre-selected from the selected cluster and one or more contents not pre-selected from the selected cluster; and providing the selected contents to a user terminal. The selected contents correspond to any one among a plurality of preset famous contents. Therefore, a content set consisting of various contents can be selected to attract the interest of a user.

Description

콘텐츠 선출 방법, 서버 및 컴퓨터 프로그램{METHOD, SERVER AND COMPUTER PROGRAM FOR SELECTING CONTENTS}Method of content selection, server and computer program

본 발명은 콘텐츠 선출 방법, 서버 및 컴퓨터 프로그램에 관한 것이다. The present invention relates to a content selection method, a server and a computer program.

일반적으로, 콘텐츠 추천 시스템은 시스템에 입력되어 있거나 수신 받은 사용자 정보에 기초하여 사용자 관심사에 맞는 복수의 콘텐츠를 선별하여 추천하고 있다. 그러나, 종래의 콘텐츠 시스템은 기 입력된 사용자 정보가 없는 경우, 즉, 신규 사용자의 경우, 사용자 관심사에 맞는 복수의 콘텐츠를 추천하기 어려운 단점이 있다. In general, a content recommendation system selects and recommends a plurality of contents suitable for user interests based on user information input or received into the system. However, the conventional content system has a disadvantage in that it is difficult to recommend a plurality of contents suitable for user interests when there is no previously inputted user information, that is, for a new user.

도 1은 본 발명의 일 실시예에 따른 종래의 콘텐츠 추천 시스템을 설명하기 위한 예시적인 도면이다. 도 1을 참조하면, 종래의 콘텐츠 추천 시스템은 신규 사용자에게 각각 상이한 종류의 콘텐츠(110)를 나열하여 제시하고 있다. 신규 사용자는 나열된 복수의 콘텐츠(110) 중에서 관심사에 맞는 콘텐츠를 선택할 수 있다. 1 is an exemplary diagram for explaining a conventional content recommendation system according to an embodiment of the present invention. Referring to FIG. 1 , the conventional content recommendation system lists and presents different types of content 110 to new users. A new user may select a content suitable for interest from among the plurality of listed content 110 .

종래의 콘텐츠 추천 시스템은 신규 사용자가 나열된 복수의 콘텐츠(110) 중 선택한 콘텐츠에 기초하여 신규 사용자에 대한 정보를 활용할 수 있다. The conventional content recommendation system may utilize information on the new user based on the content selected from among the plurality of contents 110 listed by the new user.

그러나, 종래의 콘텐츠 추천 시스템에서 나열한 복수의 콘텐츠(110)는 신규 사용자의 관심사를 파악하기에 매우 제한적인 단점이 있다. 구체적으로, 종래의 콘텐츠 추천 시스템에서 나열한 복수의 콘텐츠(110)는 별도의 기준 없이 무작위로 선출된 콘텐츠로 사용자의 관심사를 제대로 파악하기에 적합하지 않다.However, the plurality of contents 110 listed in the conventional content recommendation system has a very limited disadvantage in identifying the interests of new users. Specifically, the plurality of contents 110 listed in the conventional content recommendation system are randomly selected without a separate criterion, and are not suitable for properly understanding the user's interests.

한국등록특허공보 제10-2096474호 (2020. 3. 27. 등록)Korean Patent Publication No. 10-2096474 (Registered on March 27, 2020) 한국공개특허공보 제10-2019-0096952호 (2019. 8. 20. 공개)Korean Patent Publication No. 10-2019-0096952 (published on August 20, 2019)

사용자의 관심사를 파악하기 위하여 다양한 콘텐츠로 구성된 콘텐츠 집합을 선출할 수 있는 콘텐츠 선출 방법을 제공하고자 한다. An object of the present invention is to provide a content selection method that can select a content set composed of various contents in order to understand the interests of users.

다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.However, the technical problems to be achieved by the present embodiment are not limited to the technical problems described above, and other technical problems may exist.

상술한 기술적 과제를 달성하기 위한 수단으로서, 본 발명의 일 실시예는, 콘텐츠 선출 방법에 있어서, 복수의 콘텐츠에 대해 복수의 군집을 형성하는 단계; 상기 형성된 복수의 군집을 포함하는 제 1 군집 집합을 정의하는 단계; 상기 제 1 군집 집합에 포함된 복수의 군집 및 제 2 군집 집합 간의 유사도에 기초하여 상기 제 1 군집 집합으로부터 군집을 선출하는 단계; 상기 선출된 군집을 상기 제 2 군집 집합에 포함시키는 단계; 상기 선출된 군집으로부터 기 선출된 하나 이상의 콘텐츠 및 상기 선출된 군집으로부터 기 선출되지 않은 하나 이상의 콘텐츠 간의 유사도에 기초하여 상기 선출된 군집으로부터 콘텐츠를 선출하는 단계; 상기 선출된 콘텐츠를 사용자 단말로 제공하는 단계를 포함하고, 상기 선출된 콘텐츠는 기설정된 복수의 유명 콘텐츠 중 어느 하나에 해당하는 것인, 콘텐츠 선출 방법을 제공할 수 있다. As a means for achieving the above-described technical problem, an embodiment of the present invention provides a content selection method, comprising: forming a plurality of clusters for a plurality of content; defining a first cluster set including the formed plurality of clusters; selecting a cluster from the first cluster set based on a degree of similarity between a plurality of clusters and a second cluster set included in the first cluster set; including the selected cluster in the second cluster set; selecting content from the selected cluster based on a similarity between one or more contents previously selected from the selected cluster and one or more contents not previously selected from the selected cluster; and providing the selected content to a user terminal, wherein the selected content corresponds to any one of a plurality of preset famous content.

본 발명의 다른 실시예는, 콘텐츠 선출 서버에 있어서, 복수의 콘텐츠에 대해 복수의 군집을 형성하는 콘텐츠 군집부; 상기 형성된 복수의 군집을 포함하는 제 1 군집 집합을 정의하는 군집 정의부; 상기 제 1 군집 집합에 포함된 복수의 군집 및 제 2 군집 집합 간의 유사도에 기초하여 상기 제 1 군집 집합으로부터 군집을 선출하는 군집 선출부; 상기 선출된 군집을 상기 제 2 군집 집합에 포함시키는 군집 처리부; 상기 선출된 군집으로부터 기 선출된 하나 이상의 콘텐츠 및 상기 선출된 군집으로부터 기 선출되지 않은 하나 이상의 콘텐츠 간의 유사도에 기초하여 상기 선출된 군집으로부터 콘텐츠를 선출하는 콘텐츠 선출부; 상기 선출된 콘텐츠를 사용자 단말로 제공하는 콘텐츠 제공부를 포함하고, 상기 선출된 콘텐츠는 기설정된 복수의 유명 콘텐츠 중 어느 하나에 해당하는 것인, 콘텐츠 선출 서버를 제공할 수 있다. Another embodiment of the present invention provides a content selection server, comprising: a content clustering unit for forming a plurality of clusters for a plurality of content; a cluster defining unit defining a first cluster set including the formed plurality of clusters; a cluster selector configured to select a cluster from the first cluster set based on a degree of similarity between a plurality of clusters and a second cluster set included in the first cluster set; a cluster processing unit for including the selected cluster in the second cluster set; a content selection unit for selecting content from the selected cluster based on a similarity between one or more contents previously selected from the selected cluster and one or more contents not previously selected from the selected cluster; It is possible to provide a content selection server, including a content providing unit for providing the selected content to a user terminal, wherein the selected content corresponds to any one of a plurality of preset famous content.

본 발명의 또 다른 실시예는, 콘텐츠를 선출하는 명령어들의 시퀀스를 포함하는 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램에 있어서, 상기 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우, 복수의 콘텐츠에 대해 복수의 군집을 형성하고, 상기 형성된 복수의 군집을 포함하는 제 1 군집 집합을 정의하고, 상기 제 1 군집 집합에 포함된 복수의 군집 및 제 2 군집 집합 간의 유사도에 기초하여 상기 제 1 군집 집합으로부터 군집을 선출하고, 상기 선출된 군집을 상기 제 2 군집 집합에 포함시키고, 상기 선출된 군집으로부터 기 선출된 하나 이상의 콘텐츠 및 상기 선출된 군집으로부터 기 선출되지 않은 하나 이상의 콘텐츠 간의 유사도에 기초하여 상기 선출된 군집으로부터 콘텐츠를 선출하고, 상기 선출된 콘텐츠를 사용자 단말로 제공하되, 상기 선출된 콘텐츠는 기설정된 복수의 유명 콘텐츠 중 어느 하나에 해당하도록 하는 명령어들의 시퀀스를 포함하는, 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램을 제공할 수 있다. Another embodiment of the present invention provides a computer program stored in a computer-readable recording medium including a sequence of instructions for selecting content, wherein the computer program is executed by a computing device to provide a plurality of clusters for a plurality of content. , define a first cluster set including the formed plurality of clusters, and select a cluster from the first cluster set based on the similarity between the plurality of clusters and the second cluster set included in the first cluster set and including the selected cluster in the second cluster set, and from the selected cluster based on the similarity between one or more contents previously selected from the selected cluster and one or more contents not previously selected from the selected cluster. A computer program stored in a computer-readable recording medium comprising a sequence of instructions for selecting content and providing the selected content to a user terminal, wherein the selected content corresponds to any one of a plurality of preset famous content can provide

상술한 과제 해결 수단은 단지 예시적인 것으로서, 본 발명을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 기재된 추가적인 실시예가 존재할 수 있다.The above-described problem solving means are merely exemplary, and should not be construed as limiting the present invention. In addition to the exemplary embodiments described above, there may be additional embodiments described in the drawings and detailed description.

전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 콘텐츠 간의 유사도에 기초하여 콘텐츠 군집을 형성할 수 있고, 형성된 콘텐츠 군집에서 기 선출된 군집과 유사도가 낮은 군집을 선출할 수 있고, 선출된 군집에서 기 선출된 콘텐츠와 유사도가 낮은 콘텐츠를 선출하여 각각 상이한 종류의 콘텐츠를 포함하는 콘텐츠 집합을 제공할 수 있는 콘텐츠 선출 방법을 제공할 수 있다.According to any one of the above-described problem solving means of the present invention, a content cluster can be formed based on the degree of similarity between the contents, and a cluster having a low similarity to a previously selected cluster can be selected from the formed content cluster, and the selected cluster can be selected. It is possible to provide a content selection method capable of providing a content set each including different types of content by selecting content having a low similarity to previously selected content.

즉, 다양한 콘텐츠로 구성된 콘텐츠 집합을 제공함으로써 적은 수의 피드백으로도 사용자의 취향 및 선호도를 체계적으로 파악할 수 있는 콘텐츠 선출 방법을 제공할 수 있다.That is, by providing a content set composed of various contents, it is possible to provide a content selection method that can systematically identify users' tastes and preferences even with a small amount of feedback.

도 1은 본 발명의 일 실시예에 따른 종래의 콘텐츠 추천 시스템을 설명하기 위한 예시적인 도면이다.
도 2는 본 발명의 일 실시예에 따른 콘텐츠 선출 서버의 구성도이다.
도 3은 본 발명의 일 실시예에 따른 콘텐츠 선출 시스템의 흐름에 대한 예시적인 도면이다.
도 4는 본 발명의 일 실시예에 따른 복수의 군집에 대한 예시적인 도면이다.
도 5는 본 발명의 일 실시예에 따른 콘텐츠 선출 방법의 순서도이다.
1 is an exemplary diagram for explaining a conventional content recommendation system according to an embodiment of the present invention.
2 is a block diagram of a content selection server according to an embodiment of the present invention.
3 is an exemplary diagram of a flow of a content selection system according to an embodiment of the present invention.
4 is an exemplary diagram of a plurality of clusters according to an embodiment of the present invention.
5 is a flowchart of a content selection method according to an embodiment of the present invention.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art can easily carry out the present invention. However, the present invention may be embodied in several different forms and is not limited to the embodiments described herein. And in order to clearly explain the present invention in the drawings, parts irrelevant to the description are omitted, and similar reference numerals are attached to similar parts throughout the specification.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. Throughout the specification, when a part is "connected" with another part, this includes not only the case of being "directly connected" but also the case of being "electrically connected" with another element interposed therebetween. . Also, when a part "includes" a certain component, it means that other components may be further included, rather than excluding other components, unless otherwise stated, and one or more other features However, it is to be understood that the existence or addition of numbers, steps, operations, components, parts, or combinations thereof is not precluded in advance.

본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다.In this specification, a "part" includes a unit realized by hardware, a unit realized by software, and a unit realized using both. In addition, one unit may be implemented using two or more hardware, and two or more units may be implemented by one hardware.

본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다.Some of the operations or functions described as being performed by the terminal or device in this specification may be instead performed by a server connected to the terminal or device. Similarly, some of the operations or functions described as being performed by the server may also be performed in a terminal or device connected to the corresponding server.

이하 첨부된 도면을 참고하여 본 발명의 일 실시예를 상세히 설명하기로 한다. Hereinafter, an embodiment of the present invention will be described in detail with reference to the accompanying drawings.

도 2는 본 발명의 일 실시예에 따른 콘텐츠 선출 서버의 구성도이다. 도 2를 참조하면, 콘텐츠 선출 서버(200)는 콘텐츠 군집부(210), 군집 정의부(220), 군집 선출부(230), 군집 처리부(240), 콘텐츠 선출부(250) 및 콘텐츠 제공부(260)를 포함할 수 있다. 콘텐츠 선출 서버(200)에 의하여 제어될 수 있는 구성요소들을 예시적으로 도시한 것이다. 2 is a block diagram of a content selection server according to an embodiment of the present invention. Referring to FIG. 2 , the content selection server 200 includes a content clustering unit 210 , a cluster defining unit 220 , a cluster selecting unit 230 , a cluster processing unit 240 , a content selecting unit 250 , and a content providing unit. (260). The components that can be controlled by the content selection server 200 are illustrated by way of example.

도 2의 콘텐츠 선출 서버(200)의 각 구성요소들은 일반적으로 네트워크(network)를 통해 연결된다. 예를 들어, 도 2에 도시된 바와 같이 콘텐츠 군집부(210), 군집 정의부(220), 군집 선출부(230), 군집 처리부(240), 콘텐츠 선출부(250) 및 콘텐츠 제공부(260)는 동시에 또는 시간 간격을 두고 연결될 수 있다. Each component of the content selection server 200 of FIG. 2 is generally connected through a network. For example, as shown in FIG. 2 , the content clustering unit 210 , the cluster defining unit 220 , the cluster selecting unit 230 , the cluster processing unit 240 , the content selecting unit 250 , and the content providing unit 260 . ) can be connected simultaneously or at intervals of time.

네트워크는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷 (WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함한다. 무선 데이터 통신망의 일례에는 3G, 4G, 5G, 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 블루투스 통신, 적외선 통신, 초음파 통신, 가시광 통신(VLC: Visible Light Communication), 라이파이(LiFi) 등이 포함되나 이에 한정되지는 않는다. A network refers to a connection structure that allows information exchange between each node, such as terminals and servers, and includes a local area network (LAN), a wide area network (WAN), and the Internet (WWW: World). Wide Web), wired and wireless data communication networks, telephone networks, wired and wireless television networks, and the like. Examples of wireless data communication networks include 3G, 4G, 5G, 3rd Generation Partnership Project (3GPP), Long Term Evolution (LTE), World Interoperability for Microwave Access (WIMAX), Wi-Fi, Bluetooth communication, infrared communication, ultrasound communication, Visible Light Communication (VLC), LiFi, and the like, but are not limited thereto.

도 3은 본 발명의 일 실시예에 따른 콘텐츠 선출 시스템의 흐름에 대한 예시적인 도면이다. 도 3을 참조하면, 콘텐츠 선출 서버(200)는 콘텐츠 데이터 베이스(DB, 310), API 서버(320)와 연결될 수 있고, API 서버(320)를 거쳐 사용자 단말(330)에 선출된 콘텐츠 및 콘텐츠 집합(d)을 제공할 수 있다. 예를 들어, 콘텐츠 선출 서버(200)는 콘텐츠 데이터 베이스(310)로부터 콘텐츠를 제공받아 다양한 종류의 콘텐츠로 구성된 콘텐츠 집합을 선출하여, API 서버(320)를 통해 사용자 단말(330)에 선출된 콘텐츠 집합을 제공할 수 있다.3 is an exemplary diagram of a flow of a content selection system according to an embodiment of the present invention. Referring to FIG. 3 , the content selection server 200 may be connected to the content database DB 310 and the API server 320 , and the content and content selected to the user terminal 330 through the API server 320 . A set (d) can be provided. For example, the content selection server 200 receives content from the content database 310 , selects a content set composed of various types of content, and selects the content selected for the user terminal 330 through the API server 320 . A set can be provided.

예를 들어, 콘텐츠 데이터 베이스(310)는 수집된 콘텐츠를 저장하고 관리할 수 있다. 또한, 콘텐츠 데이터 베이스(310)는 수집된 콘텐츠의 메타 정보를 저장하고 관리할 수 있다. For example, the content database 310 may store and manage the collected content. In addition, the content database 310 may store and manage the meta information of the collected content.

예를 들어, 콘텐츠 선출 서버(200)는 콘텐츠 데이터 베이스(310)로부터 콘텐츠 및 콘텐츠 메타 정보(a)를 제공 받아 콘텐츠 임베딩, 군집화 및 선출을 진행할 수 있다. 콘텐츠 선출 서버(200)는 군집 집합 전체를 생성할 수 있고, 생성된 군집 집합을 API 서버(320)에 매일 업데이트(b)할 수 있다. For example, the content selection server 200 may receive content and content meta information (a) from the content database 310 and perform content embedding, clustering, and selection. The content selection server 200 may generate the entire cluster set, and may update (b) the generated cluster set to the API server 320 every day.

예를 들어, API 서버(320)는 사용자 단말(330)로부터 단말 정보(c)를 입력 받으면, 선출된 콘텐츠 및 콘텐츠 집합(d)을 사용자 단말(330)에 제공할 수 있다. For example, when receiving the terminal information c from the user terminal 330 , the API server 320 may provide the selected content and the content set d to the user terminal 330 .

예를 들어, 사용자 단말(330)은 단말 정보 및 기 선출된 콘텐츠 집합에 대한정보(c)를 API 서버(320)에 송신할 수 있고, API 서버(320)로부터 콘텐츠 집합(d)을 수신 받을 수 있다. 사용자 단말(330)은 수신 받은 콘텐츠 집합(d)을 디스플레이할 수 있다.For example, the user terminal 330 may transmit terminal information and information (c) about the pre-selected content set to the API server 320, and receive the content set (d) from the API server 320 . can The user terminal 330 may display the received content set d.

본 발명의 일 실시예에 따른 콘텐츠 선출 서버(200)는, 전술한 콘텐츠 선출 시스템의 흐름을 통해 각각의 사용자 단말(330)에 다양한 종류의 콘텐츠로 구성된 콘텐츠 집합을 실시간으로 제공할 수 있다. 이하, 콘텐츠 선출 서버(200)에 구성되어 있는 각각의 부서를 통해 콘텐츠를 선출하는 방법에 대해 구체적으로 살펴본다. The content selection server 200 according to an embodiment of the present invention may provide a content set composed of various types of content to each user terminal 330 in real time through the flow of the content selection system described above. Hereinafter, a method of selecting content through each department configured in the content selection server 200 will be described in detail.

먼저, 본 발명의 일 실시예에 따른 콘텐츠 선출 서버(200)는 다양한 원천으로부터 콘텐츠를 수집할 수 있고, 수집된 콘텐츠 중에서 유명 콘텐츠 리스트를 추출할 수 있다. 예를 들어, 유명 콘텐츠 리스트는 다수의 사용자가 평가한 콘텐츠, 다수의 사용자가 시청한 콘텐츠 및 다수의 사용자로부터 인정받은 콘텐츠를 포함할 수 있다. First, the content selection server 200 according to an embodiment of the present invention may collect content from various sources, and may extract a famous content list from among the collected content. For example, the popular content list may include content rated by multiple users, content viewed by multiple users, and content recognized by multiple users.

콘텐츠 선출 서버(200)는 추출된 유명 콘텐츠 리스트 중에서 중복된 콘텐츠를 제거하고 후술하는 복수의 군집 각각에 유명 콘텐츠를 구분하여 포함시킬 수 있다. 즉, 복수의 군집은 각각 유명 콘텐츠를 포함할 수 있다.The content selection server 200 may remove duplicate content from the extracted famous content list and classify and include famous content in each of a plurality of clusters to be described later. That is, each of the plurality of clusters may include famous content.

본 발명의 일 실시예에 따른 콘텐츠 군집부(210)는 복수의 콘텐츠에 대해 복수의 군집을 형성할 수 있다. 예를 들어, 콘텐츠 군집부(210)는 복수의 군집을 형성하기 위해 수집된 콘텐츠를 i차원의 벡터로 임베딩할 수 있다. 콘텐츠 군집부(210)는 수집한 각각의 콘텐츠를 문서로 처리하고, 콘텐츠의 각 메타 정보를 워드처리할 수 있다. The content clustering unit 210 according to an embodiment of the present invention may form a plurality of clusters for a plurality of content. For example, the content clustering unit 210 may embed the collected content into an i-dimensional vector to form a plurality of clusters. The content clustering unit 210 may process each collected content as a document and word-process each meta-information of the content.

콘텐츠 군집부(210)는 수집된 콘텐츠를 임베딩 처리하여 유사성이 높은 콘텐츠를 벡터 공간에서 가까워지도록 할 수 있다. 예를 들어, 콘텐츠 군집부(210)는 Doc2Vec 알고리즘을 이용하여 수집된 모든 콘텐츠를 i차원의 벡터로 임베딩할 수 있다. Doc2Vec 알고리즘은 문장, 문단 또는 문서의 단위로 벡터를 생성할 수 있다. The content clustering unit 210 may embed the collected content to bring content with high similarity closer to the vector space. For example, the content clustering unit 210 may embed all the collected content into an i-dimensional vector using the Doc2Vec algorithm. The Doc2Vec algorithm can generate vectors in units of sentences, paragraphs, or documents.

콘텐츠 군집부(210)는 수집된 콘텐츠에 Doc2Vec 알고리즘 이외 Paragraph/Document 임베딩 방법을 적용시킬 수 있다. 예를 들어, 콘텐츠 군집부(210)는 콘텐츠 임베딩 처리를 통해 콘텐츠 사이의 관계성을 수학적으로 표현할 수 있다. The content clustering unit 210 may apply a Paragraph/Document embedding method other than the Doc2Vec algorithm to the collected content. For example, the content clustering unit 210 may mathematically express the relationship between content through content embedding processing.

도 4는 본 발명의 일 실시예에 따른 복수의 군집에 대한 예시적인 도면이다. 도 4를 참조하면, 콘텐츠 군집부(210)에서 임베딩 처리된 콘텐츠는 유사한 콘텐츠 간의 군집을 각각 형성할 수 있다. 4 is an exemplary diagram of a plurality of clusters according to an embodiment of the present invention. Referring to FIG. 4 , the content embedded in the content clustering unit 210 may form a cluster between similar content, respectively.

예를 들어, 콘텐츠 군집부(210)는 콘텐츠 간의 유사도에 기초하여 복수의 군집((a), (b), (c), (d), (e), (f), (g))을 형성할 수 있다. 구체적으로, 콘텐츠 군집부(210)는 i차원의 벡터 공간에 전체 콘텐츠를 대응시킬 수 있다. 이 후, 콘텐츠 군집부(210)는 Spherical K-means 알고리즘을 이용하여 전체 콘텐츠를 (a) 내지 (g)의 군집으로 형성할 수 있다. 콘텐츠 군집부(210)는 Spherical K-means 알고리즘 이외 Cosine Distance 기반의 군집화(Clustering) 알고리즘을 이용하여 전체 콘텐츠를 복수의 군집으로 형성할 수 있다. 콘텐츠 군집부(210)는 군집화 알고리즘을 통해 벡터 공간 내에 응집되어 있는 콘텐츠 군집을 확인할 수 있다. For example, the content clustering unit 210 generates a plurality of clusters ((a), (b), (c), (d), (e), (f), (g)) based on the similarity between the contents. can be formed Specifically, the content clustering unit 210 may correspond the entire content to the i-dimensional vector space. Thereafter, the content clustering unit 210 may form the entire content into clusters (a) to (g) by using a spherical K-means algorithm. The content clustering unit 210 may form the entire content into a plurality of clusters by using a cosine distance-based clustering algorithm other than the spherical K-means algorithm. The content clustering unit 210 may identify a content cluster that is aggregated in the vector space through a clustering algorithm.

도 4를 참조하면, i차원의 벡터 공간에서 특정 콘텐츠들의 응집 정도에 기초하여 콘텐츠 간의 유사성을 확인할 수 있다. 예를 들어, '007 시리즈'의 경우, '첩보물(장르)', '액션(장르)', '제임스 본드(캐릭터)', '소설 원작', 'M16(소재)' 등과 같은 공통점을 포함하고 있다. 따라서, '007 시리즈'는 벡터 공간에서 응집된 형태를 가질 수 있다.Referring to FIG. 4 , similarity between contents may be confirmed based on the degree of aggregation of specific contents in an i-dimensional vector space. For example, in the case of '007 series', it includes common features such as 'spy (genre)', 'action (genre)', 'James Bond (character)', 'original novel', 'M16 (material)', etc. are doing Therefore, the '007 series' may have an aggregated form in the vector space.

본 발명의 일 실시예에 따른 군집 정의부(220)는 형성된 복수의 군집을 포함하는 제 1 군집 집합을 정의할 수 있다. The cluster defining unit 220 according to an embodiment of the present invention may define a first cluster set including a plurality of formed clusters.

예를 들어, 군집 정의부(220)는 형성된 복수의 군집 전체를 제 1 군집 집합으로 정의할 수 있고, 공집합을 제 2 군집 집합으로 정의할 수 있다. 구체적으로, 군집 정의부(220)는 복수의 군집 전체를 제 1 군집 집합으로 정의할 수 있고, 제 1 군집 집합으로부터 기 선출된 군집을 제 2 군집 집합으로 정의할 수 있다. 즉, 군집 정의부(220)에서 정의한 제 1 군집 집합 및 제 2 군집 집합은 콘텐츠 간의 유사성에 기초한 군집이 아닌, 콘텐츠 선출 알고리즘을 수행하기 위해 정의된 개념의 집합이다. For example, the cluster defining unit 220 may define all of the formed clusters as the first cluster set, and define the empty set as the second cluster set. Specifically, the cluster definition unit 220 may define all of the plurality of clusters as the first cluster set, and define a cluster previously selected from the first cluster set as the second cluster set. That is, the first and second cluster sets defined by the cluster definition unit 220 are not a cluster based on similarity between contents, but a set of concepts defined for performing a content selection algorithm.

본 발명의 일 실시예에 따른 군집 선출부(230)는 제 1 군집 집합에 포함된 복수의 군집 및 제 2 군집 집합 간의 유사도에 기초하여 제 1 군집 집합으로부터 군집을 선출할 수 있다. 예를 들어, 군집 선출부(230)는 하기 수학식 1을 통해 기 선출된 군집과 유사도가 낮은 군집을 제 1 군집 집합으로부터 선출할 수 있다.The cluster selector 230 according to an embodiment of the present invention may select a cluster from the first cluster set based on a similarity between a plurality of clusters included in the first cluster set and the second cluster set. For example, the cluster selector 230 may select a cluster having a low similarity to the previously-selected cluster from the first cluster set through Equation 1 below.

<수학식 1><Equation 1>

Figure pat00001
Figure pat00001

수학식 1에서 A는 전체 군집에 대한 집합을 의미하고, B는 기 선출된 군집(군집 b)에 대한 집합을 의미한다. 따라서,

Figure pat00002
는 집합 A에서 집합 B를 제외한 차집합으로서, 기 선출되지 않은 군집의 집합을 의미한다. 군집 S는 기 선출되지 않은 군집 집합에 포함되어 있는 군집이고, S*는 기 선출되지 않은 군집 집합으로부터 선출된 군집을 의미한다. In Equation 1, A means a set for the entire cluster, and B means a set for a pre-selected cluster (cluster b). therefore,
Figure pat00002
is the difference set excluding set B from set A, which means a set of non-pre-selected clusters. Cluster S is a cluster included in a non-pre-elected cluster set, and S * means a cluster selected from a non-pre-elected cluster set.

즉, 수학식 1에서 A는 제 1 군집 집합을 의미할 수 있고, B는 제 2 군집 집합을 의미할 수 있고, S*는 기 선출된 군집 집합(제 2 군집 집합)과 기 선출되지 않은 군집 집합(제 1 군집 집합) 간의 유사도에 기초하여 기 선출되지 않은 군집 집합(제 1 군집 집합)으로부터 선출된 군집을 의미할 수 있다. That is, in Equation 1, A may mean a first cluster set, B may mean a second cluster set, and S * is a pre-selected cluster set (second cluster set) and a non-pre-elected cluster set. It may mean a cluster selected from a non-pre-selected cluster set (the first cluster set) based on the similarity between the sets (the first cluster set).

또한, 수학식 1에서 centroids는 군집 S의 중심 벡터를 의미하고,

Figure pat00003
는 군집 S의 11p중심 벡터와 군집 b의 중심 벡터 간의 코사인 유사도를 의미한다. argmin은 군집 S(기 선출되지 않은 군집)와 군집 b(기 선출된 군집)의 유사도에 기초하여 유사도 합이 가장 적은 군집을 선출함을 의미한다. In addition, in Equation 1, centroid s means the center vector of the cluster S,
Figure pat00003
denotes the cosine similarity between the 11p centroid vector of cluster S and the centroid vector of cluster b. argmin means that the cluster with the smallest sum of similarities is selected based on the similarity between cluster S (un-elected cluster) and cluster b (pre-elected cluster).

즉, 군집 선출부(230)는 수학식 1을 통해 기 선출되지 않은 군집과 기 선출된 군집 간의 유사도 합을 계산할 수 있다. That is, the cluster selector 230 may calculate the sum of similarities between the non-pre-elected cluster and the pre-selected cluster through Equation (1).

군집 선출부(230)는 수학식 1을 통해 제 2 군집 집합(B)과 유사도가 낮은 군집을 제 1 군집 집합(A)으로부터 선출할 수 있다. 즉, 군집 선출부(230)는 수학식 1을 통해 기 선출된 군집 집합과 유사도가 낮은 군집을 기 선출되지 않은 군집 집합으로부터 선출할 수 있다.The cluster selector 230 may select a cluster having a low similarity to the second cluster set B from the first cluster set A through Equation 1 . That is, the cluster selector 230 may select a cluster having a low similarity to the previously selected cluster set from the non-pre-selected cluster set through Equation 1 .

본 발명의 일 실시예에 따른 군집 선출부(230)는 제 2 군집 집합(B)의 크기가 0인 경우, 제 1 군집 집합(A)으로부터 어느 하나의 군집을 선출할 수 있다. 예를 들어, 군집 선출부(230)는 기 선출된 군집이 없는 경우, 제 1 군집 집합(A)으로부터 무작위로 군집을 선출할 수 있다. When the size of the second cluster set B is 0, the cluster selector 230 according to an embodiment of the present invention may select any one cluster from the first cluster set A. For example, when there is no pre-selected cluster, the cluster selector 230 may randomly select a cluster from the first cluster set (A).

다른 예를 들어, 군집 선출부(230)는 기 선출된 군집이 있는 경우, 즉, 제 2 군집 집합(B)의 크기가 0이 아닌 경우, 수학식 1에 기초하여 제 1 군집 집합(A)으로부터 기 선출된 군집과 유사도가 낮은 군집을 선출할 수 있다. For another example, when there is a pre-selected cluster, that is, when the size of the second cluster set B is not 0, the cluster selector 230 determines the first cluster set A based on Equation 1 It is possible to select a cluster with a low similarity to the previously elected cluster from

군집 선출부(230)는 제 1 군집 집합(A)에 포함된 복수의 군집과 제 2 군집 집합(B) 간의 유사도에 기초하여, 제 1 군집 집합으로부터 기 선출된 군집과 유사도가 낮은 군집을 선출하여, 콘텐츠 선출의 대상이 되는 군집이 기 선출된 군집과 구별될 수 있도록 할 수 있다.The cluster selector 230 selects a cluster having a low similarity to a previously selected cluster from the first cluster set based on the similarity between the plurality of clusters included in the first cluster set (A) and the second cluster set (B). Thus, it is possible to distinguish a cluster that is a target of content selection from a previously selected cluster.

본 발명의 일 실시예에 따른 군집 처리부(240)는 선출된 군집을 제 2 군집 집합에 포함시킬 수 있다. 예를 들어, 군집 처리부(240)는 군집 선출부(230)에서 제 1 군집 집합(A)으로부터 선출한 군집(S*)을 제 2 군집 집합(B)으로 포함시켜 기 선출된 군집 집합(B)을 갱신할 수 있다. The cluster processing unit 240 according to an embodiment of the present invention may include the selected cluster in the second cluster set. For example, the cluster processing unit 240 includes the cluster (S * ) selected from the first cluster set (A) by the cluster selector 230 as the second cluster set (B) to include the pre-selected cluster set (B). ) can be updated.

본 발명의 일 실시예에 따른 콘텐츠 선출 서버(100)는 군집 재정의부(미도시)를 더 포함할 수 있다. 군집 재정의부는 제 1 군집 집합(A)에 포함된 군집의 개수가 제 2 군집 집합(B)에 포함된 군집의 개수와 동일한 경우, 제 2 군집 집합(B)을 공집합으로 재정의할 수 있다.The content selection server 100 according to an embodiment of the present invention may further include a cluster redefining unit (not shown). When the number of clusters included in the first cluster set (A) is the same as the number of clusters included in the second cluster set (B), the cluster redefiner may redefine the second cluster set (B) as an empty set.

예를 들어, 군집 재정의부는 제 1 군집 집합(A)에 포함된 군집의 개수가 제 2 군집 집합(B)에 포함된 군집의 개수와 동일해진 경우, 즉, 군집 집합 전체를 1회 순회한 경우, 제 2 군집 집합(B)을 공집합으로 재정의할 수 있다. 다른 예를 들어, 군집 재정의부는 제 1 군집 집합(A)에 포함된 군집의 개수와 제 2 군집 집합(B)에 포함된 군집의 개수가 동일해진 경우, 반복 수를 1 증가시킬 수 있다. For example, when the number of clusters included in the first cluster set (A) is equal to the number of clusters included in the second cluster set (B), that is, when the cluster redefining unit traverses the entire cluster set once , it is possible to redefine the second cluster set (B) as an empty set. As another example, when the number of clusters included in the first cluster set (A) is equal to the number of clusters included in the second cluster set (B), the cluster redefining unit may increase the number of iterations by 1.

본 발명의 일 실시예에 따른 콘텐츠 선출부(250)는 선출된 군집(S*)으로부터 기 선출된 하나 이상의 콘텐츠(d) 및 선출된 군집(S*)으로부터 기 선출되지 않은 하나 이상의 콘텐츠(c) 간의 유사도에 기초하여 선출된 군집(S*)으로부터 콘텐츠를 선출할 수 있다.The content selection unit 250 according to an embodiment of the present invention includes one or more contents (d) previously selected from the selected cluster (S * ) and one or more contents (c) not previously selected from the selected cluster (S * ). ), content can be selected from the selected cluster (S * ) based on the similarity between them.

본 발명의 일 실시예에 따른 선출된 콘텐츠(d)는 기설정된 복수의 유명 콘텐츠 중 어느 하나에 해당할 수 있다. 예를 들어, 콘텐츠 선출부(250)는 하기 수학식 2를 통해 기 선출된 하나 이상의 콘텐츠와 유사도가 낮은 콘텐츠를 선출된 군집으로부터 선출할 수 있다.The selected content (d) according to an embodiment of the present invention may correspond to any one of a plurality of preset famous content. For example, the content selection unit 250 may select content having a low similarity to one or more previously selected content from the selected cluster through Equation 2 below.

<수학식 2><Equation 2>

Figure pat00004
Figure pat00004

수학식 2에서 S* G는 선출된 군집(S*)에서 유명 콘텐츠만으로 구성된 집합을 의미하고,

Figure pat00005
는 선출된 군집에서 유명 콘텐츠만으로 구성된 집합에서 기 선출된 유명 콘텐츠를 제외한 차집합으로 기 선출되지 않은 유명 콘텐츠를 의미한다.
Figure pat00006
는 선출된 군집에서 유명 콘텐츠만으로 구성된 집합에서 기 선출된 유명 콘텐츠를 의미한다. In Equation 2, S * G means a set consisting of only famous content from the elected cluster (S * ),
Figure pat00005
? means famous content that is not pre-elected from the set consisting of only famous content in the elected cluster except for the well-known content previously elected in the set.
Figure pat00006
denotes famous content previously selected from a set consisting of only famous content from the selected cluster.

즉, 수학식 2에서 c는 기 선출되지 않은 콘텐츠를 의미하고, d는 기 선출된 콘텐츠를 의미한다.

Figure pat00007
는 기 선출되지 않은 콘텐츠(c)와 기 선출된 콘텐츠(d) 간의 코사인 유사도를 의미하고, c*는 기 선출되지 않은 콘텐츠와 기 선출된 콘텐츠 간의 유사도에 기초하여 기 선출되지 않은 콘텐츠 중에서 선출된 콘텐츠를 의미한다.That is, in Equation 2, c denotes content that has not been previously selected, and d denotes content that has been previously selected.
Figure pat00007
denotes the cosine similarity between the non-pre-selected content (c) and the pre-selected content (d), and c * denotes the cosine similarity between the non-pre-selected content and the pre-selected content based on the similarity between the non-pre-elected content and the pre-selected content. means content.

예를 들어, 콘텐츠 선출부(250)는 수학식 2를 통해 선출된 군집(S*)에서 기 선출된 하나 이상의 콘텐츠와 기 선출되지 않은 하나 이상의 콘텐츠 간의 유사도에 기초하여 콘텐츠를 선출할 수 있다.For example, the content selector 250 may select the content based on the similarity between the one or more contents previously selected from the group S * selected through Equation 2 and the one or more contents not previously selected.

콘텐츠 선출부(250)는 선출된 군집(S*)으로부터 기 선출된 하나 이상의 콘텐츠(d)와 기 선출되지 않은 하나 이상의 콘텐츠(c) 간의 유사도에 기초하여 콘텐츠를 선출하여, 기 선출된 콘텐츠와 구별되는 콘텐츠를 선출할 수 있다. 즉, 콘텐츠 선출부(250)는 기 선출된 콘텐츠(d)와 유사도가 낮은 콘텐츠(c)를 선출하여 다양한 종류의 콘텐츠로 구성된 콘텐츠 집합을 생성할 수 있다. The content selection unit 250 selects the content based on the similarity between the one or more content (d) previously selected from the selected cluster (S * ) and the one or more content (c) not previously selected by selecting the content and Distinctive content can be selected. That is, the content selection unit 250 may generate a content set composed of various types of content by selecting the content c having a low similarity to the previously selected content d.

한편, 본 발명의 일 실시예에 따른 콘텐츠 선출부(250)는 선출된 군집(S*)으로부터 기 선출된 콘텐츠(d)가 없는 경우, 선출된 군집(S*)으로부터 유명 콘텐츠에 해당하는 어느 하나의 콘텐츠를 선출할 수 있다. 예를 들어, 콘텐츠 선출부(250)는 기 선출된 콘텐츠(d)가 없는 경우, 선출된 군집(S*)으로부터 유명 콘텐츠 중 어느 하나의 콘텐츠를 무작위로 선출할 수 있다.On the other hand, the content selection unit 250 according to an embodiment of the present invention, when there is no content (d) previously selected from the selected cluster (S * ), any content corresponding to famous content from the selected cluster (S * ) One content can be selected. For example, when there is no pre-selected content d, the content selector 250 may randomly select any one of famous content from the selected cluster S * .

또한, 본 발명의 일 실시예에 따라 선출된 군집(S*)으로부터 유명 콘텐츠에 해당하는 콘텐츠가 모두 선출된 경우, 선출된 군집을 제 1 군집 집합(A)으로부터 제외시킬 수 있다. 예를 들어, 콘텐츠 선출부(250)는, 수학식 2에서

Figure pat00008
인 경우, 즉, 선출된 군집 S*에 유명 콘텐츠가 더 이상 존재하지 않는 경우, 선출된 군집 S*를 기 선출되지 않은 군집 집합, 제 1 군집 집합(A)에서 제외시켜, 제 1 군집 집합(A)을 갱신할 수 있다. In addition, when all contents corresponding to famous contents are selected from the selected cluster (S * ) according to an embodiment of the present invention, the selected cluster may be excluded from the first cluster set (A). For example, the content selection unit 250 may
Figure pat00008
In the case of , that is, when famous content no longer exists in the elected cluster S * , the elected cluster S * is excluded from the previously unassigned cluster set, the first cluster set (A), and the first cluster set ( A) can be updated.

본 발명의 일 실시예에 따라 선출된 콘텐츠(c*)의 개수가 기설정된 콘텐츠의 개수와 동일해질 때까지 제 1 군집 집합(A)으로부터 군집을 선출하고, 선출된 군집을 제 2 군집 집합(B)에 포함시키고, 선출된 군집(S*)으로부터 콘텐츠 선출을 반복할 수 있다.According to an embodiment of the present invention, a cluster is selected from the first cluster set (A) until the number of selected content (c*) becomes equal to the number of preset content, and the selected cluster is set to a second cluster set ( B), and the content selection from the elected cluster (S * ) can be repeated.

즉, 전체 군집 집합에 포함되어 있는 콘텐츠를 모두 선출하기 전까지 전술한 수학식 1 및 수학식 2에 기초하여 군집 집합 전체에서 기 선출된 군집과 유사도가 낮은 군집을 선출하고, 선출된 군집에서 기 선출된 콘텐츠와 유사도가 낮은 콘텐츠를 선출할 수 있다. That is, until all the contents included in the entire cluster set are selected, based on Equations 1 and 2 described above, a cluster having a low similarity to the previously elected cluster is selected from the entire cluster set, and previously selected from the selected cluster. It is possible to select content with a low similarity to the content that has been used.

본 발명의 일 실시예에 따른 콘텐츠 제공부(260)는 선출된 콘텐츠를 사용자 단말로 제공할 수 있다. 예를 들어, 콘텐츠 제공부(260)는 유사도가 낮은 콘텐츠로 구성된 콘텐츠 집합을 사용자 단말에 제공할 수 있다. 즉, 콘텐츠 제공부(260)는 다양한 콘텐츠로 구성된 콘텐츠 집합을 사용자 단말에 제공할 수 있다.The content providing unit 260 according to an embodiment of the present invention may provide the selected content to the user terminal. For example, the content providing unit 260 may provide a content set composed of content having a low similarity to the user terminal. That is, the content providing unit 260 may provide a content set composed of various content to the user terminal.

도 5는 본 발명의 일 실시예에 따른 콘텐츠 선출 방법의 순서도이다. 도 5에 도시된 콘텐츠 선출 방법은 도 1 내지 도 4에 도시된 실시예에 따라 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 1 내지 도 4에 도시된 실시예에 따른 콘텐츠 선출 서버에서 콘텐츠를 선출하는 방법에도 적용된다. 5 is a flowchart of a content selection method according to an embodiment of the present invention. The content selection method shown in FIG. 5 includes steps processed in time series according to the embodiments shown in FIGS. 1 to 4 . Therefore, even if omitted below, it is also applied to the method of selecting content in the content selection server according to the embodiment shown in FIGS. 1 to 4 .

단계 S510에서 콘텐츠 선출 서버는 복수의 콘텐츠에 대해 복수의 군집을 형성할 수 있다.In step S510, the content selection server may form a plurality of clusters for a plurality of content.

단계 S520에서 콘텐츠 선출 서버는 형성된 복수의 군집을 포함하는 제 1 군집 집합을 정의할 수 있다.In step S520, the content selection server may define a first cluster set including the formed plurality of clusters.

단계 S530에서 콘텐츠 선출 서버는 제 1 군집 집합에 포함된 복수의 군집 및 제 2 군집 집합 간의 유사도에 기초하여 제 1 군집 집합으로부터 군집을 선출할 수 있다.In step S530, the content selection server may select a cluster from the first cluster set based on the similarity between the plurality of clusters included in the first cluster set and the second cluster set.

단계 S540에서 콘텐츠 선출 서버는 선출된 군집을 제 2 군집 집합에 포함시킬 수 있다.In step S540, the content selection server may include the selected cluster in the second cluster set.

단계 S550에서 콘텐츠 선출 서버는 선출된 군집으로부터 기 선출된 하나 이상의 콘텐츠 및 선출된 군집으로부터 기 선출되지 않은 하나 이상의 콘텐츠 간의 유사도에 기초하여 선출된 군집으로부터 콘텐츠를 선출할 수 있다.In step S550 , the content selection server may select content from the selected cluster based on the similarity between one or more contents previously selected from the selected cluster and one or more contents not previously selected from the selected cluster.

단계 S560에서 콘텐츠 선출 서버는 선출된 콘텐츠를 사용자 단말로 제공할 수 있다.In step S560, the content selection server may provide the selected content to the user terminal.

상술한 설명에서, 단계 S510 내지 S560은 본 발명의 구현 예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 전환될 수도 있다. In the above description, steps S510 to S560 may be further divided into additional steps or combined into fewer steps according to an embodiment of the present invention. In addition, some steps may be omitted as necessary, and the order between the steps may be switched.

도 1 내지 도 5를 통해 설명된 콘텐츠 선출 서버에서 콘텐츠를 선출하는 방법은 컴퓨터에 의해 실행되는 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램 또는 컴퓨터에 의해 실행 가능한 명령어들을 포함하는 기록 매체의 형태로도 구현될 수 있다. 또한, 도 1 내지 도 5를 통해 설명된 콘텐츠 선출 서버에서 콘텐츠를 선출하는 방법은 컴퓨터에 의해 실행되는 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램의 형태로도 구현될 수 있다. The method for selecting content in the content selection server described through FIGS. 1 to 5 is also implemented in the form of a computer program stored in a computer-readable recording medium executed by a computer or a recording medium including instructions executable by the computer. can be Also, the method for selecting content in the content selection server described with reference to FIGS. 1 to 5 may be implemented in the form of a computer program stored in a computer-readable recording medium that is executed by a computer.

컴퓨터 판독 가능 기록매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 기록매체는 컴퓨터 저장 매체를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.A computer-readable recording medium may be any available medium that can be accessed by a computer, and includes both volatile and nonvolatile media, removable and non-removable media. In addition, the computer-readable recording medium may include a computer storage medium. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다. The above description of the present invention is for illustration, and those of ordinary skill in the art to which the present invention pertains can understand that it can be easily modified into other specific forms without changing the technical spirit or essential features of the present invention. will be. Therefore, it should be understood that the embodiments described above are illustrative in all respects and not restrictive. For example, each component described as a single type may be implemented in a distributed manner, and likewise components described as distributed may also be implemented in a combined form.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present invention is indicated by the following claims rather than the above detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalents should be interpreted as being included in the scope of the present invention. do.

200: 콘텐츠 선출 서버
210: 콘텐츠 군집부
220: 군집 정의부
230: 군집 선출부
240: 군집 처리부
250: 콘텐츠 선출부
260: 콘텐츠 제공부
200: content selection server
210: content cluster
220: Cluster Justice
230: cluster electoral division
240: swarm processing unit
250: content selection unit
260: content provider

Claims (13)

콘텐츠 선출 서버에 의해 수행되는 콘텐츠 선출 방법에 있어서,
복수의 콘텐츠에 대해 복수의 군집을 형성하는 단계;
상기 형성된 복수의 군집을 포함하는 제 1 군집 집합을 정의하는 단계;
상기 제 1 군집 집합에 포함된 복수의 군집 및 제 2 군집 집합 간의 유사도에 기초하여 상기 제 1 군집 집합으로부터 군집을 선출하는 단계;
상기 선출된 군집을 상기 제 2 군집 집합에 포함시키는 단계;
상기 선출된 군집으로부터 기 선출된 하나 이상의 콘텐츠 및 상기 선출된 군집으로부터 기 선출되지 않은 하나 이상의 콘텐츠 간의 유사도에 기초하여 상기 선출된 군집으로부터 콘텐츠를 선출하는 단계;
상기 선출된 콘텐츠를 사용자 단말로 제공하는 단계
를 포함하고,
상기 선출된 콘텐츠는 기설정된 복수의 유명 콘텐츠 중 어느 하나에 해당하는 것인, 콘텐츠 선출 방법.
A content selection method performed by a content selection server, the method comprising:
forming a plurality of clusters for a plurality of contents;
defining a first cluster set including the formed plurality of clusters;
selecting a cluster from the first cluster set based on a degree of similarity between a plurality of clusters and a second cluster set included in the first cluster set;
including the selected cluster in the second cluster set;
selecting content from the selected cluster based on a similarity between one or more contents previously selected from the selected cluster and one or more contents not previously selected from the selected cluster;
providing the selected content to a user terminal
including,
The content selection method, wherein the selected content corresponds to any one of a plurality of preset famous content.
제 1 항에 있어서,
상기 제 1 군집 집합으로부터 군집을 선출하는 단계는,
상기 제 2 군집 집합의 크기가 0인 경우, 상기 제 1 군집 집합으로부터 어느 하나의 군집을 선출하는 것인, 콘텐츠 선출 방법.
The method of claim 1,
The step of selecting a cluster from the first cluster set includes:
When the size of the second cluster set is 0, any one cluster is selected from the first cluster set.
제 1 항에 있어서,
상기 선출된 군집으로부터 콘텐츠를 선출하는 단계는,
상기 선출된 군집으로부터 기 선출된 콘텐츠가 없는 경우, 상기 선출된 군집으로부터 상기 유명 콘텐츠에 해당하는 어느 하나의 콘텐츠를 선출하는 것인, 콘텐츠 선출 방법.
The method of claim 1,
The step of selecting content from the selected cluster comprises:
When there is no pre-selected content from the selected cluster, any one content corresponding to the famous content is selected from the selected cluster.
제 3 항에 있어서,
상기 선출된 군집으로부터 상기 유명 콘텐츠에 해당하는 콘텐츠가 모두 선출된 경우, 상기 선출된 군집을 상기 제 1 군집 집합으로부터 제외시키는 단계
를 더 포함하는 것인, 콘텐츠 선출 방법.
4. The method of claim 3,
excluding the selected cluster from the first cluster set when all the contents corresponding to the famous content are selected from the selected cluster
Which will further include, the content selection method.
제 1 항에 있어서,
상기 제 1 군집 집합에 포함된 군집의 개수가 상기 제 2 군집 집합에 포함된 군집의 개수와 동일한 경우, 상기 제 2 군집 집합을 공집합으로 재정의하는 단계
를 더 포함하는, 콘텐츠 선출 방법.
The method of claim 1,
redefining the second cluster set as an empty set when the number of clusters included in the first cluster set is equal to the number of clusters included in the second cluster set
Further comprising, a content selection method.
제 1 항에 있어서,
상기 선출된 콘텐츠의 개수가 기설정된 콘텐츠의 개수와 동일해질 때까지 상기 제 1 군집 집합으로부터 상기 군집을 선출하는 단계, 상기 선출된 군집을 상기 제 2 군집 집합에 포함시키는 단계 및 상기 선출된 군집으로부터 상기 콘텐츠를 선출하는 단계를 반복하는 것인, 콘텐츠 선출 방법.
The method of claim 1,
selecting the cluster from the first cluster set until the number of the selected content is equal to the number of the preset content, including the selected cluster in the second cluster set, and from the selected cluster The content selection method is to repeat the step of selecting the content.
콘텐츠 선출 서버에 있어서,
복수의 콘텐츠에 대해 복수의 군집을 형성하는 콘텐츠 군집부;
상기 형성된 복수의 군집을 포함하는 제 1 군집 집합을 정의하는 군집 정의부;
상기 제 1 군집 집합에 포함된 복수의 군집 및 제 2 군집 집합 간의 유사도에 기초하여 상기 제 1 군집 집합으로부터 군집을 선출하는 군집 선출부;
상기 선출된 군집을 상기 제 2 군집 집합에 포함시키는 군집 처리부;
상기 선출된 군집으로부터 기 선출된 하나 이상의 콘텐츠 및 상기 선출된 군집으로부터 기 선출되지 않은 하나 이상의 콘텐츠 간의 유사도에 기초하여 상기 선출된 군집으로부터 콘텐츠를 선출하는 콘텐츠 선출부;
상기 선출된 콘텐츠를 사용자 단말로 제공하는 콘텐츠 제공부
를 포함하고,
상기 선출된 콘텐츠는 기설정된 복수의 유명 콘텐츠 중 어느 하나에 해당하는 것인, 콘텐츠 선출 서버.
In the content selection server,
a content clustering unit for forming a plurality of clusters for a plurality of content;
a cluster defining unit defining a first cluster set including the formed plurality of clusters;
a cluster selector configured to select a cluster from the first cluster set based on a degree of similarity between a plurality of clusters and a second cluster set included in the first cluster set;
a cluster processing unit for including the selected cluster in the second cluster set;
a content selection unit for selecting content from the selected cluster based on a similarity between one or more contents previously selected from the selected cluster and one or more contents not previously selected from the selected cluster;
A content providing unit that provides the selected content to a user terminal
including,
The content selection server, wherein the selected content corresponds to any one of a plurality of preset famous content.
제 7 항에 있어서,
상기 군집 선출부는,
상기 제 2 군집 집합의 크기가 0인 경우, 상기 제 1 군집 집합으로부터 어느 하나의 군집을 선출하는 것인, 콘텐츠 선출 서버.
8. The method of claim 7,
The group selection unit,
When the size of the second cluster set is 0, the content selection server for selecting any one cluster from the first cluster set.
제 7 항에 있어서,
상기 콘텐츠 선출부는,
상기 선출된 군집으로부터 기 선출된 콘텐츠가 없는 경우, 상기 선출된 군집으로부터 상기 유명 콘텐츠에 해당하는 어느 하나의 콘텐츠를 선출하는 것인, 콘텐츠 선출 서버.
8. The method of claim 7,
The content selection unit,
If there is no pre-selected content from the selected cluster, the content selection server to select any one content corresponding to the famous content from the selected cluster.
제 9 항에 있어서,
상기 선출된 군집으로부터 상기 유명 콘텐츠에 해당하는 콘텐츠가 모두 선출된 경우, 상기 선출된 군집을 상기 제 1 군집 집합으로부터 제외시키는 것인, 콘텐츠 선출 서버.
10. The method of claim 9,
When all the contents corresponding to the famous content are selected from the selected cluster, the selected cluster is excluded from the first cluster set.
제 7 항에 있어서,
상기 제 1 군집 집합에 포함된 군집의 개수가 상기 제 2 군집 집합에 포함된 군집의 개수와 동일한 경우, 상기 제 2 군집 집합을 공집합으로 재정의하는 군집 재정의부
를 더 포함하는, 콘텐츠 선출 서버.
8. The method of claim 7,
When the number of clusters included in the first cluster set is the same as the number of clusters included in the second cluster set, the cluster redefining unit redefines the second cluster set as an empty set.
Further comprising, the content selection server.
제 7 항에 있어서,
상기 선출된 콘텐츠의 개수가 기설정된 콘텐츠의 개수와 동일해질 때까지 상기 제 1 군집 집합으로부터 상기 군집을 선출하고, 상기 선출된 군집을 상기 제 2 군집 집합에 포함시키고, 상기 선출된 군집으로부터 상기 콘텐츠 선출을 반복하는 것인, 콘텐츠 선출 서버.
8. The method of claim 7,
The cluster is selected from the first cluster set until the number of the selected content is equal to the number of the preset content, the selected cluster is included in the second cluster set, and the content from the selected cluster A content election server, which repeats the election.
콘텐츠를 선출하는 명령어들의 시퀀스를 포함하는 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램에 있어서,
상기 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우,
복수의 콘텐츠에 대해 복수의 군집을 형성하고,
상기 형성된 복수의 군집을 포함하는 제 1 군집 집합을 정의하고,
상기 제 1 군집 집합에 포함된 복수의 군집 및 제 2 군집 집합 간의 유사도에 기초하여 상기 제 1 군집 집합으로부터 군집을 선출하고,
상기 선출된 군집을 상기 제 2 군집 집합에 포함시키고,
상기 선출된 군집으로부터 기 선출된 하나 이상의 콘텐츠 및 상기 선출된 군집으로부터 기 선출되지 않은 하나 이상의 콘텐츠 간의 유사도에 기초하여 상기 선출된 군집으로부터 콘텐츠를 선출하고,
상기 선출된 콘텐츠를 사용자 단말로 제공하되,
상기 선출된 콘텐츠는 기설정된 복수의 유명 콘텐츠 중 어느 하나에 해당하도록 하는 명령어들의 시퀀스를 포함하는, 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램.
A computer program stored on a computer-readable recording medium comprising a sequence of instructions for selecting content, the computer program comprising:
When the computer program is executed by a computing device,
forming a plurality of clusters for a plurality of contents,
defining a first cluster set including the formed plurality of clusters;
selecting a cluster from the first cluster set based on a degree of similarity between a plurality of clusters and a second cluster set included in the first cluster set;
including the elected cluster in the second cluster set,
selecting content from the selected cluster based on a similarity between one or more contents previously selected from the selected cluster and one or more contents not previously selected from the selected cluster;
Provide the selected content to the user terminal,
wherein the selected content includes a sequence of instructions to correspond to any one of a plurality of preset popular content.
KR1020210001374A 2021-01-06 2021-01-06 Method, server and computer program for selecting contents KR20220099300A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210001374A KR20220099300A (en) 2021-01-06 2021-01-06 Method, server and computer program for selecting contents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210001374A KR20220099300A (en) 2021-01-06 2021-01-06 Method, server and computer program for selecting contents

Publications (1)

Publication Number Publication Date
KR20220099300A true KR20220099300A (en) 2022-07-13

Family

ID=82401503

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210001374A KR20220099300A (en) 2021-01-06 2021-01-06 Method, server and computer program for selecting contents

Country Status (1)

Country Link
KR (1) KR20220099300A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190096952A (en) 2016-10-07 2019-08-20 에이치에스엔아이 엘엘씨 System and method for streaming personalized media content
KR102096474B1 (en) 2014-02-26 2020-05-27 (주)드림어스컴퍼니 Apparatus and method for recommending contents

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102096474B1 (en) 2014-02-26 2020-05-27 (주)드림어스컴퍼니 Apparatus and method for recommending contents
KR20190096952A (en) 2016-10-07 2019-08-20 에이치에스엔아이 엘엘씨 System and method for streaming personalized media content

Similar Documents

Publication Publication Date Title
US11106720B2 (en) Systems and methods for clustering items associated with interactions
AU2014332532B2 (en) Systems and methods for mapping and routing based on clustering
US10698945B2 (en) Systems and methods to predict hashtags for content items
US20170186042A1 (en) Systems and methods for promoting content items
US10614143B2 (en) Systems and methods for automated page category recommendation
US9705801B2 (en) Systems and methods for mapping and routing based on clustering
US11521386B2 (en) Systems and methods for predicting video quality based on objectives of video producer
CN108491267B (en) Method and apparatus for generating information
US10061988B2 (en) Systems and methods for defining and analyzing video clusters based on video image frames
CN112534424A (en) Neural network based content distribution in online systems
US10339611B2 (en) Systems and methods for page recommendations
US10574775B2 (en) Systems and methods to optimize news feed access
US9652554B2 (en) Systems and methods for adding users to a networked computer system
US10783150B2 (en) Systems and methods for social network post audience prediction and selection
US10320927B2 (en) Systems and methods for providing personalized content
US20180060736A1 (en) Systems and methods for recommending content items
US11003692B2 (en) Systems and methods for online clustering of content items
US20190155929A1 (en) Systems and methods for automated query expansion
US10764380B2 (en) Clustering content items based on a social affinity between users associated with the content items
KR20220099300A (en) Method, server and computer program for selecting contents
CN116975018A (en) Data processing method, device, computer equipment and readable storage medium
Shi et al. Consistent and powerful non-Euclidean graph-based change-point test with applications to segmenting random interfered video data
US20180157733A1 (en) Systems and methods for generating content
Jayaprabha et al. Fuzzy-based multiparty privacy management in social media using modified elliptic curve cryptography
CN108804492B (en) Method and device for recommending multimedia objects