KR20190063352A - Apparatus and method for clip connection of image contents by similarity analysis between clips - Google Patents

Apparatus and method for clip connection of image contents by similarity analysis between clips Download PDF

Info

Publication number
KR20190063352A
KR20190063352A KR1020180019737A KR20180019737A KR20190063352A KR 20190063352 A KR20190063352 A KR 20190063352A KR 1020180019737 A KR1020180019737 A KR 1020180019737A KR 20180019737 A KR20180019737 A KR 20180019737A KR 20190063352 A KR20190063352 A KR 20190063352A
Authority
KR
South Korea
Prior art keywords
clip
keyword
image content
subject
text
Prior art date
Application number
KR1020180019737A
Other languages
Korean (ko)
Inventor
박원주
김상권
김선중
김승희
손정우
이상윤
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Publication of KR20190063352A publication Critical patent/KR20190063352A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

An embodiment of the present invention relates to a clip connection apparatus for analyzing similarity with clips of other image content including subject or keyword distributions of similar clips based on clip subject or keyword distributions, and to a method thereof. According to the present invention, an image content clip connection method executed by an image content clip connection apparatus comprises the following steps: extracting one or more clips with a preset length from image content, and extracting a clip text corresponding to the clips from an image content text corresponding to the image content; using the image content text to generate an image content subject about the image content, and using the image content subject and the clip text to generate a clip subject about the extracted clip; and generating a reverse index about a word representing the clip subject, and calculating the distance between words when the same or similar word exists between the clip and other clips to analyze the similarity of the clip subject.

Description

클립 간 유사도 분석에 의한 영상 콘텐츠의 클립 연결 장치 및 방법{APPARATUS AND METHOD FOR CLIP CONNECTION OF IMAGE CONTENTS BY SIMILARITY ANALYSIS BETWEEN CLIPS}[0001] APPARATUS AND METHOD FOR CLIP CONNECTION OF IMAGE CONTENTS BY SIMILARITY ANALYSIS BETWEEN CLIPS [0002]

아래 실시예들은 클립 간 유사도 분석에 의한 영상 콘텐츠의 클립 연결 장치 및 방법에 관한 것으로, 보다 구체적으로 클립 주제의 유사도 또는 클립 키워드의 유사도에 따라 클립 간 유사도를 분석하여 영상 콘텐츠의 클립 연결 장치 및 방법에 관한 것이다.More particularly, the present invention relates to an apparatus and a method for connecting clips of video contents by analyzing similarities between clips according to similarity of clip topics or similarity of clip keywords, .

영상 콘텐츠를 연결하기 위해서 기존에는 영상 콘텐츠에 대한 방영일, 제작사, 배우 정보, 촬영 장소, 배경 장소등의 정보를 수동으로 메타데이터로 태깅함으로써, 영상 콘텐츠의 검색 또는 추천에 활용되고 있다. In order to link image contents, conventionally, information such as a broadcast date, a production company, an actor information, a shooting place, and a background place for the image contents are manually tagged as metadata and utilized for searching or recommending image contents.

이와 같은 기술은 태깅된 메타데이터가 영상 콘텐츠와 어느 정도의 연관성이 있는지 확인하기 어려울 수 있다. 따라서, 영상 콘텐츠에 관한 정보를 자동으로 추출하며, 영상 콘텐츠와의 연관성을 확인할 수 있는 연구가 필요하다.Such a technique may be difficult to determine how relevant the tagged metadata is to the image content. Therefore, research that can extract information about image contents automatically and confirm the association with image contents is needed.

일 실시예에 의하면, 클립 텍스트를 기초로 클립 주제의 분포 및 클립 키워드의 분포를 생성하고, 클립 주제의 분포와 클립 키워드의 분포를 이용하여 클립의 의미를 표현하는 클립 연결 장치 및 방법일 수 있다.According to an embodiment, a clip connection apparatus and method for generating a distribution of a clip subject and a distribution of a clip keyword based on a clip text, and expressing the meaning of the clip using a distribution of the clip subject and a distribution of the clip keyword .

일 실시예에 의하면, 클립 주제의 분포 또는 클립 키워드의 분포에 기초하여 유사한 클립 주제의 분포 및 클립 키워드의 분포를 포함하고 있는 다른 영상 콘텐츠의 클립과 유사성을 분석하는 클립 연결 장치 및 방법일 수 있다. According to one embodiment, it may be a clip connector and method for analyzing similarities with clips of other video content that include distributions of similar clip topics and distribution of clip keywords based on the distribution of clip topics or the distribution of clip keywords .

일 실시예에 의하면, 클립 주제의 분포가 유사한 다른 영상 콘텐츠의 클립 또는 클립 키워드의 분포가 유사한 다른 영상 콘텐츠의 클립을 연결할 수 있는 정보를 제공하는 클립 연결 장치 및 방법일 수 있다.According to one embodiment, a clip connection apparatus and method for providing information that can link clips of other image contents having a similar distribution of clip subjects, or clips of other image contents having a similar distribution of clip keywords.

일 측면에 따르면, 영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법에 있어서, 영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 상기 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 상기 클립에 대응하는 클립 텍스트를 추출하는 단계; 상기 영상 콘텐츠 텍스트를 이용하여 상기 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 상기 영상 콘텐츠 주제 및 상기 클립 텍스트를 이용하여 상기 추출된 클립에 대한 클립 주제를 생성하는 단계; 및 상기 클립 주제를 표현하는 단어에 관한 역인덱스를 생성하고, 상기 클립과 다른 클립간의 동일하거나 유의한 단어가 있는 경우 상기 단어들 간의 거리를 연산하여 클립 주제의 유사도를 분석하는 단계를 포함하는 영상 콘텐츠의 클립 연결 방법일 수 있다.According to an aspect of the present invention, there is provided a clip connection method for video content performed by a clip connection device for video content, the method comprising: extracting one or more clips of a predetermined length from the video content; Extracting a corresponding clip text; Generating an image content subject for the image content using the image content text and generating a clip theme for the extracted clip using the image content theme and the clip text; And generating an inverse index related to a word representing the clip subject and analyzing the similarity of the clip subject by calculating distances between the words when there is the same or a significant word between the clip and the other clip And may be a clip connection method of contents.

상기 클립 주제의 분포는 클립 주제의 식별자 및 클립 주제의 가중치에 대한 세트를 포함하고, 상기 클립 주제는 단어, 단어의 가중치 및 단어의 개체명에 대한 세트를 포함하는 영상 콘텐츠의 클립 연결 방법일 수 있다.Wherein the distribution of the clip topics comprises a set of identifiers of clip subjects and weights of clip subjects, the clip topics being a clip association method of video content comprising a set of words, a weight of words and a set of object names of words have.

상기 클립 주제의 유사도를 분석하는 단계는, 상기 단어들 간의 거리를 연산할 때 상기 단어의 개체명의 동일성을 고려하는 영상 콘텐츠의 클립 연결 방법일 수 있다.The step of analyzing the degree of similarity of the clip subject may be a method of concatenating video contents that takes into consideration the identity of an entity name of the word when computing the distance between the words.

상기 단어와 상기 단어의 개체명을 이용하여 클립 주제의 유사도를 분석할 때, 상기 단어의 가중치 및 클립 주제의 가중치를 고려함으로써 동일하거나 유의한 단어 또는 단어의 개체명을 포함하는 클립 간의 클립 주제의 유사도를 분석하는 영상 콘텐츠의 클립 연결 방법일 수 있다. When analyzing the similarity of the clip subject by using the word and the object name of the word, considering the weight of the word and the weight of the clip subject, And may be a clip connection method of image contents for analyzing the similarity.

일 측면에 따르면, 영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법에 있어서, 영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 상기 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 상기 클립에 대응하는 클립 텍스트를 추출하는 단계; 상기 영상 콘텐츠 텍스트를 이용하여 상기 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 상기 영상 콘텐츠 주제 및 상기 클립 텍스트를 이용하여 상기 추출된 클립에 대한 클립 주제를 생성하는 단계; 상기 클립 주제와 연관된 단어의 가중치 및 클립 주제의 가중치에 기반하여, 상기 클립에 대한 클립 키워드를 생성하는 단계; 및 상기 클립 키워드에 관한 역인덱스를 생성하고, 상기 클립과 다른 클립간의 동일하거나 유의한 클립 키워드가 있는 경우 상기 클립 키워드들 간의 거리를 연산하여 클립 키워드의 유사도를 분석하는 단계를 포함하는 영상 콘텐츠 클립의 연결 방법일 수 있다.According to an aspect of the present invention, there is provided a clip connection method for video content performed by a clip connection device for video content, the method comprising: extracting one or more clips of a predetermined length from the video content; Extracting a corresponding clip text; Generating an image content subject for the image content using the image content text and generating a clip theme for the extracted clip using the image content theme and the clip text; Generating a clip keyword for the clip based on a weight of a word associated with the clip subject and a weight of a clip subject; And generating an inverse index related to the clip keyword and calculating a distance between the clip keywords if there is the same or a significant clip keyword between the clip and another clip to analyze the similarity of the clip keyword. Lt; / RTI >

상기 클립 키워드의 분포는 클립 키워드, 클립 키워드의 가중치 및 클립 키워드의 개체명의 세트를 포함하고, 상기 클립 키워드의 유사도를 분석하는 단계는, 상기 클립 키워드들 간의 거리를 연산할 때 상기 클립 키워드의 개체명의 동일성을 고려하는 영상 콘텐츠 클립의 연결 방법일 수 있다.Wherein the distribution of the clip keyword includes a clip keyword, a weight of a clip keyword, and a set of object names of a clip keyword, and the step of analyzing the similarity of the clip keyword includes: May be a method of linking video content clips that considers identity.

상기 클립 키워드와 상기 클립 키워드의 개체명을 이용하여 클립 키워드의 유사도를 분석할 때, 상기 클립 키워드의 가중치를 고려함으로써 동일하거나 유의한 클립 키워드 또는 클립 키워드의 개체명을 포함하는 클립 간의 클립 키워드의 유사도를 분석하는 영상 콘텐츠의 클립 연결 방법일 수 있다.When the similarity degree of the clip keyword is analyzed using the clip keyword and the object name of the clip keyword, the weight of the clip keyword is taken into consideration, and thereby the same or a significant clip keyword or a clip keyword among the clips including the object name of the clip keyword And may be a clip connection method of image contents for analyzing the similarity.

일 측면에 따르면, 영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법에 있어서, 영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 상기 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 상기 클립에 대응하는 클립 텍스트를 추출하는 단계; 상기 영상 콘텐츠 텍스트를 이용하여 상기 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 상기 영상 콘텐츠 주제 및 상기 클립 텍스트를 이용하여 상기 추출된 클립에 대한 클립 주제를 생성하고, 상기 클립 주제와 연관된 단어의 가중치 및 클립 주제의 가중치에 기반하여, 상기 클립에 대한 클립 키워드를 생성하는 단계; 및 상기 클립 주제와 상기 클립 키워드를 이용하여, 동일하거나 유의한 단어 및 클립 키워드가 있는 경우 상기 단어 간의 거리 및 상기 클립 키워드 간의 거리를 연산하여 클립의 유사도를 분석하는 단계를 포함하는 영상 콘텐츠의 클립 연결 방법일 수 있다.According to an aspect of the present invention, there is provided a clip connection method for video content performed by a clip connection device for video content, the method comprising: extracting one or more clips of a predetermined length from the video content; Extracting a corresponding clip text; Generating a video content theme for the video content using the video content text, generating a clip theme for the extracted clip using the video content theme and the clip text, And generating a clip keyword for the clip based on the weight of the clip subject; And analyzing the similarity of the clip by calculating the distance between the words and the distance between the clips when the same keyword or the same word and the keyword of the clip are present using the clip subject and the clip keyword, Connection method.

상기 클립 주제의 분포는 클립 주제의 식별자 및 클립 주제의 가중치에 대한 세트를 포함하고, 상기 클립 키워드의 분포는 클립 키워드, 클립 키워드의 가중치 및 클립 키워드의 개체명의 세트를 포함하는 영상 콘텐츠의 클립 연결 방법일 수 있다.Wherein the distribution of the clip topics includes a set of identifiers of clip subjects and weights of clip subjects, and the distribution of the clip keywords includes a clip keyword, a weight of clip keywords, and a clip connection Lt; / RTI >

일 측면에 따르면, 영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법에 있어서, 영상 콘텐츠로부터 추출된 클립에 태깅된 클립 주제 및 클립 키워드를 식별하는 단계; 상기 클립 주제 및 상기 클립 키워드를 이용하여, 클립 주제에 포함된 단어의 역인덱스 및 클립 키워드에 관한 역인덱스를 생성하는 단계; 다른 영상 콘텐츠에서 생성된 단어의 역인덱스 및 클립 키워드에 관한 역인덱스를 이용하여, 클립 간의 유사도를 결정하는 단계를 포함하는 영상 콘텐츠의 클립 연결 방법일 수 있다.According to an aspect of the present invention, there is provided a clip connection method of video content performed by a clip connection device of video content, the method comprising: identifying clip topics and clip keywords tagged in clips extracted from video content; Generating an inverse index related to a clip keyword and a reverse index of a word included in the clip topic using the clip topic and the clip keyword; Determining a degree of similarity between clips using an inverse index of a word generated in another image content and an inverse index of a clip keyword.

일 측면에 따르면, 영상 콘텐츠의 클립 연결 장치에 있어서, 상기 영상 콘텐츠의 클립 연결 장치는 프로세서를 포함하고, 상기 프로세서는, 영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 상기 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 상기 클립에 대응하는 클립 텍스트를 추출하고, 상기 영상 콘텐츠 텍스트를 이용하여 상기 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 상기 영상 콘텐츠 주제 및 상기 클립 텍스트를 이용하여 상기 추출된 클립에 대한 클립 주제를 생성하고, 상기 클립 주제를 표현하는 단어에 관한 역인덱스를 생성하고, 상기 클립과 다른 클립간의 동일하거나 유의한 단어가 있는 경우 상기 단어들 간의 거리를 연산하여 클립 주제의 유사도를 분석하는 영상 콘텐츠의 클립 연결 장치일 수 있다. According to an aspect of the present invention, there is provided a clip connection device for video content, the clip connection device for video content including a processor, the processor extracting one or more clips of a preset length from the video content, Extracting a clip text corresponding to the clip from the image content text, generating an image content subject for the image content using the image content text, and extracting the extracted clip And generates a reverse index related to a word representing the clip topic. If there is an identical or significant word between the clip and another clip, the distance between the words is calculated to calculate the similarity of the clip topic And may be a clip connection device of the image contents to be analyzed.

상기 클립 주제의 분포는 클립 주제의 식별자 및 클립 주제의 가중치에 대한 세트를 포함하고, 상기 클립 주제는 단어, 단어의 가중치 및 단어의 개체명에 대한 세트를 포함하는 영상 콘텐츠의 클립 연결 장치일 수 있다.Wherein the distribution of the clip topics comprises a set of identifiers of clip topics and weights of clip topics, the clip topics including a set of words, a weight of words and a set of object names of words, have.

상기 프로세서는, 상기 클립 주제의 유사도를 분석하기 위해 상기 단어들 간의 거리를 연산할 때 상기 단어의 개체명의 동일성을 고려하는 영상 콘텐츠의 클립 연결 장치일 수 있다.The processor may be a clip connection device for video content that considers the identity of an entity name of the word when calculating the distance between the words to analyze the similarity of the clip subject.

상기 프로세서는, 상기 단어와 상기 단어의 개체명을 이용하여 클립 주제의 유사도를 분석할 때, 상기 단어의 가중치 및 클립 주제의 가중치를 고려함으로써 동일하거나 유의한 단어 또는 단어의 개체명을 포함하는 클립 간의 클립 주제의 유사도를 분석하는 영상 콘텐츠의 클립 연결 장치일 수 있다.The processor analyzes the similarity of the clip subject by using the word and the object name of the word, and by considering the weight of the word and the weight of the subject of the clip, And may be a clip connection device of image contents for analyzing the similarity of the subject of the clip between them.

영상 콘텐츠의 클립 연결 장치에 있어서, 상기 영상 콘텐츠의 클립 연결 장치는 프로세서를 포함하고, 상기 프로세서는, 영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 상기 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 상기 클립에 대응하는 클립 텍스트를 추출하고, 상기 영상 콘텐츠 텍스트를 이용하여 상기 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 상기 영상 콘텐츠 주제 및 상기 클립 텍스트를 이용하여 상기 추출된 클립에 대한 클립 주제를 생성하고, 상기 클립 주제와 연관된 단어의 가중치 및 클립 주제의 가중치에 기반하여, 상기 클립에 대한 클립 키워드를 생성하고, 상기 클립 키워드에 관한 역인덱스를 생성하고, 상기 클립과 다른 클립간의 동일하거나 유의한 클립 키워드가 있는 경우 상기 클립 키워드들 간의 거리를 연산하여 클립 키워드의 유사도를 분석하는 영상 콘텐츠 클립의 연결 장치일 수 있다.A clip connection device for video content, the clip connection device for video content comprising a processor, the processor extracting one or more clips of a predetermined length from the video content, Extracting a clip text corresponding to the clip, generating an image content subject for the image content using the image content text, and extracting a clip theme for the extracted clip using the image content theme and the clip text Generating a clip keyword for the clip based on a weight of a word associated with the clip topic and a weight of the clip subject, generating a reverse index for the clip keyword, If there is one clip keyword, the clip keyword And may be a connection device of video content clips for analyzing the similarity of clip keywords.

상기 클립 키워드의 분포는 클립 키워드, 클립 키워드의 가중치 및 클립 키워드의 개체명의 세트를 포함하고, 상기 클립 키워드의 유사도를 분석하는 단계는, 상기 클립 키워드들 간의 거리를 연산할 때 상기 클립 키워드의 개체명의 동일성을 고려하는 영상 콘텐츠 클립의 연결 장치일 수 있다.Wherein the distribution of the clip keyword includes a clip keyword, a weight of a clip keyword, and a set of object names of a clip keyword, and the step of analyzing the similarity of the clip keyword includes: May be a linking device for video content clips that considers identity.

상기 프로세서는, 상기 클립 키워드와 상기 클립 키워드의 개체명을 이용하여 클립 키워드의 유사도를 분석할 때, 상기 클립 키워드의 가중치를 고려함으로써 동일하거나 유의한 클립 키워드 또는 클립 키워드의 개체명을 포함하는 클립 간의 클립 키워드의 유사도를 분석하는 영상 콘텐츠의 클립 연결 장치일 수 있다.The processor analyzes the similarity of the clip keyword using the clip keyword and the object name of the clip keyword, and when considering the similarity of the clip keyword, A clip connection device for analyzing the similarity of the clip keywords among the clip contents.

일 측면에 따르면, 영상 콘텐츠의 클립 연결 장치에 있어서, 상기 영상 콘텐츠의 클립 연결 장치는 프로세서를 포함하고, 상기 프로세서는, 영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 상기 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 상기 클립에 대응하는 클립 텍스트를 추출하고, 상기 영상 콘텐츠 텍스트를 이용하여 상기 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 상기 영상 콘텐츠 주제 및 상기 클립 텍스트를 이용하여 상기 추출된 클립에 대한 클립 주제를 생성하고, 상기 클립 주제와 연관된 단어의 가중치 및 클립 주제의 가중치에 기반하여, 상기 클립에 대한 클립 키워드를 생성하고, 상기 클립 주제와 상기 클립 키워드를 이용하여, 동일하거나 유의한 단어 및 클립 키워드가 있는 경우 상기 단어 간의 거리 및 상기 클립 키워드 간의 거리를 연산하여 클립의 유사도를 분석하는 영상 콘텐츠의 클립 연결 장치일 수 있다.According to an aspect of the present invention, there is provided a clip connection device for video content, the clip connection device for video content including a processor, the processor extracting one or more clips of a preset length from the video content, Extracting a clip text corresponding to the clip from the image content text, generating an image content subject for the image content using the image content text, and extracting the extracted clip Generating a clip keyword for the clip based on a weight of a word associated with the clip topic and a weight of the clip subject and generating a clip keyword for the clip using the same or a different If there is a word and a clip keyword, It may be Li, and clip connector of the video content, to analyze the degree of similarity of time by calculating the distance between the clip keyword.

상기 클립 주제의 분포는 클립 주제의 식별자 및 클립 주제의 가중치에 대한 세트를 포함하고, 상기 클립 키워드의 분포는 클립 키워드, 클립 키워드의 가중치 및 클립 키워드의 개체명의 세트를 포함하는 영상 콘텐츠의 클립 연결 장치일 수 있다.Wherein the distribution of the clip topics includes a set of identifiers of clip subjects and weights of clip subjects, and the distribution of the clip keywords includes a clip keyword, a weight of clip keywords, and a clip connection Device.

일 측면에 따르면, 영상 콘텐츠의 클립 연결 장치에 있어서, 상기 영상 콘텐츠의 클립 연결 장치는 프로세서를 포함하고, 상기 프로세서는, 영상 콘텐츠로부터 추출된 클립에 태깅된 클립 주제 및 클립 키워드를 식별하고, 상기 클립 주제 및 상기 클립 키워드를 이용하여, 클립 주제에 포함된 단어의 역인덱스 및 클립 키워드에 관한 역인덱스를 생성하고, 다른 영상 콘텐츠에서 생성된 단어의 역인덱스 및 클립 키워드에 관한 역인덱스를 이용하여, 클립 간의 유사도를 결정하는 영상 콘텐츠의 클립 연결 장치일 수 있다.According to an aspect of the present invention, there is provided a clip connection device for video content, the clip connection device for video content comprising a processor, the processor identifying clip topics and clip keywords tagged in clips extracted from video content, A reverse index of a word included in a clip subject and a clip keyword are generated using the clip subject and the clip keyword, and an inverse index of a word generated in another image content and a reverse index of a clip keyword are used And a clip connection device for video content that determines the similarity between the clips.

일 실시예에 의하면, 클립 텍스트를 기초로 클립 주제의 분포 및 클립 키워드의 분포를 생성하고, 클립 주제의 분포와 클립 키워드의 분포를 이용하여 클립의 의미를 표현하는 클립 연결 장치 및 방법일 수 있다.According to an embodiment, a clip connection apparatus and method for generating a distribution of a clip subject and a distribution of a clip keyword based on a clip text, and expressing the meaning of the clip using a distribution of the clip subject and a distribution of the clip keyword .

일 실시예에 의하면, 클립 주제의 분포 또는 클립 키워드의 분포에 기초하여 유사한 클립 주제의 분포 및 클립 키워드의 분포를 포함하고 있는 다른 영상 콘텐츠의 클립과 유사성을 분석하는 클립 연결 장치 및 방법일 수 있다. According to one embodiment, it may be a clip connector and method for analyzing similarities with clips of other video content that include distributions of similar clip topics and distribution of clip keywords based on the distribution of clip topics or the distribution of clip keywords .

일 실시예에 의하면, 클립 주제의 분포가 유사한 다른 영상 콘텐츠의 클립 또는 클립 키워드의 분포가 유사한 다른 영상 콘텐츠의 클립을 연결할 수 있는 정보를 제공하는 클립 연결 장치 및 방법일 수 있다.According to one embodiment, a clip connection apparatus and method for providing information that can link clips of other image contents having a similar distribution of clip subjects, or clips of other image contents having a similar distribution of clip keywords.

도 1은 일 실시예에 따른, 영상 콘텐츠에서 추출된 클립의 주제 및 키워드를 나타낸 도면이다.
도 2는 일 실시예에 따른, 영상 콘텐츠의 클립 연결 장치가 수행하는 과정을 나타낸 도면이다.
도 3은 일 실시예에 따른, 영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법을 나타낸 도면이다.
도 4는 다른 일 실시예에 따른, 영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법을 나타낸 도면이다.
도 5는 다른 일 실시예에 따른, 영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법을 나타낸 도면이다.
도 6은 다른 일 실시예에 따른, 영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법을 나타낸 도면이다.
1 is a diagram illustrating a theme and a keyword of a clip extracted from an image content according to an exemplary embodiment of the present invention.
2 is a diagram illustrating a process performed by a clip connection device for video content according to an exemplary embodiment of the present invention.
3 is a diagram illustrating a clip connection method of video contents performed by a clip connection device for video content according to an exemplary embodiment.
4 is a diagram illustrating a clip connection method of video contents performed by a clip connection device for video contents according to another embodiment.
5 is a diagram illustrating a clip connection method of video content performed by a clip connection apparatus for video content according to another embodiment.
FIG. 6 is a diagram illustrating a clip connection method of image contents performed by a clip connection device of image contents according to another embodiment.

실시예들에 대한 특정한 구조적 또는 기능적 설명들은 단지 예시를 위한 목적으로 개시된 것으로서, 다양한 형태로 변경되어 실시될 수 있다. 따라서, 실시예들은 특정한 개시형태로 한정되는 것이 아니며, 본 명세서의 범위는 기술적 사상에 포함되는 변경, 균등물, 또는 대체물을 포함한다. Specific structural or functional descriptions of embodiments are set forth for illustration purposes only and may be embodied with various changes and modifications. Accordingly, the embodiments are not intended to be limited to the particular forms disclosed, and the scope of the present disclosure includes changes, equivalents, or alternatives included in the technical idea.

제 1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 이런 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 해석되어야 한다. 예를 들어, 제 1 구성요소는 제 2 구성요소로 명명될 수 있고, 유사하게 제 2 구성요소는 제 1 구성요소로도 명명될 수 있다.The terms first or second, etc. may be used to describe various elements, but such terms should be interpreted solely for the purpose of distinguishing one element from another. For example, the first component may be referred to as a second component, and similarly, the second component may also be referred to as a first component.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. It is to be understood that when an element is referred to as being "connected" to another element, it may be directly connected or connected to the other element, although other elements may be present in between.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설명된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The singular expressions include plural expressions unless the context clearly dictates otherwise. In this specification, the terms "comprises ", or" having ", and the like, are used to specify one or more of the described features, numbers, steps, operations, elements, But do not preclude the presence or addition of steps, operations, elements, parts, or combinations thereof.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 해당 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art. Terms such as those defined in commonly used dictionaries are to be interpreted as having a meaning consistent with the meaning of the context in the relevant art and, unless explicitly defined herein, are to be interpreted as ideal or overly formal Do not.

이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 일 실시예에 따른, 영상 콘텐츠에서 추출된 클립의 주제 및 키워드를 나타낸 도면이다.1 is a diagram illustrating a theme and a keyword of a clip extracted from an image content according to an exemplary embodiment of the present invention.

일 실시예에 따르면, 영상 콘텐츠(110, 120 ~)는 매체를 통해 방송/전파되는 콘텐츠를 포함할 수 있다. 예를 들면, 영상 콘텐츠는 TV에서 방송되는 화면과 음성을 포함하는 비디오 콘텐츠를 포함할 수 있다. According to one embodiment, the image content 110, 120- may include content that is broadcast / propagated through the medium. For example, the video content may include video content that includes video and audio that is broadcast on a TV.

클립은 영상 콘텐츠에 포함된 일 부분으로서, 영상 콘텐츠(110, 120 ~)로부터 추출될 수 있다. 예를 들면, 클립 1(111)은 영상 콘텐츠(110)으로부터 추출될 수 있고, 클립 2(112)는 영상 콘텐츠(110)으로부터 추출될 수 있다. 또한, 클립 1(121)은 영상 콘텐츠(120)으로부터 추출될 수 있고, 클립 2(122)는 영상 콘텐츠(120)으로부터 추출될 수 있다. 즉, 클립은 동일한 영상 콘텐츠에서 추출되거나 다른 영상 콘텐츠에서 추출된 것을 나타낼 수 있다. The clip may be extracted from the image contents 110 and 120 - as a part included in the image contents. For example, clip 1 111 may be extracted from image content 110 and clip 2 112 may be extracted from image content 110. Clip 1 121 may be extracted from image content 120 and clip 2 122 may be extracted from image content 120. That is, the clip may be extracted from the same image content or extracted from other image content.

일 실시예에 따르면, 클립은 영상 콘텐츠로부터 미리 설정된 길이에 따라 추출될 수 있다. 여기서, 미리 설정된 길이는 자동으로 또는 수동으로 설정될 수 있다. 예를 들면, 영상 콘텐츠(110)의 전체 시간에서 클립 1(111)의 재생 시간에 대응하는 시작 시간과 끝 시간에 따라 클립 1(111)은 영상 콘텐츠(110)으로부터 추출될 수 있다. 또는, 영상 콘텐츠(110)의 전체 시간에서 클립 2(112)의 재생 시간에 대응하는 시작 시간과 끝 시간에 따라 클립 2(112)는 영상 콘텐츠(110)으로부터 추출될 수 있다. According to one embodiment, the clip may be extracted from the image content according to a predetermined length. Here, the predetermined length may be set automatically or manually. For example, the clip 1 111 can be extracted from the video content 110 according to the start time and end time corresponding to the playback time of the clip 1 111 in the entire time of the video content 110. Alternatively, the clip 2 112 may be extracted from the video content 110 according to the start time and end time corresponding to the playback time of the clip 2 112 in the entire time of the video content 110.

일 실시예에 따르면, 클립이 추출된 경우, 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트로부터 클립에 대응하는 클립 텍스트를 추출할 수 있다. 이때, 영상 콘텐츠 텍스트는 대본, 자막, 화면 캡션 데이터와 같이 영상 콘텐츠에 관련된 것을 모두 직접적으로 설명하는 텍스트를 포함할 수 있다. 또는, 영상 콘텐츠 텍스트는 블로그, SNS, 뉴스와 같이 영상 콘텐츠를 간접적으로 설명하는 텍스트를 포함할 수 있다. 여기서, 간접적으로 설명하는 텍스트는 영상 콘텐츠가 재생된 이후, 영상 콘텐츠와 관련된 내용을 포함하는 모든 텍스트를 포함할 수 있다. According to one embodiment, when a clip is extracted, the clip text corresponding to the clip can be extracted from the image content text corresponding to the image content. At this time, the image content text may include texts directly describing all related to the image content such as script, caption, and screen caption data. Alternatively, the video content text may include text that indirectly describes the video content, such as a blog, SNS, or news. Here, the indirectly describing text may include all the text including the content related to the image content after the image content is reproduced.

예를 들면, 클립 텍스트는 대본, 자막과 같이 영상 콘텐츠를 직접적으로 설명하는 텍스트에서 추출된 클립에 대응하는 텍스트 부분만 포함할 수 있다. 또는, 클립 텍스트는 영상 콘텐츠를 간접적으로 설명하는 텍스트에서 추출된 클립에 대해 설명하는 텍스트를 포함할 수 있다. 따라서, 클립 텍스트는 클립의 재생 시간에 대응하는 시간 동안의 대본, 자막의 해당 부분을 포함할 수 있고, 또는 클립의 재생 시간에 대응하는 부분에 대해 블로그에서 설명된 부분을 포함할 수 있다. For example, the clip text may only contain text portions corresponding to clips extracted from texts that directly describe the video content, such as transcripts and subtitles. Alternatively, the clip text may include text describing the clip extracted from the text that indirectly describes the video content. Therefore, the clip text may include a script for a time corresponding to the playback time of the clip, a corresponding portion of the subtitle, or a portion described in the blog for a portion corresponding to the playback time of the clip.

또 다른 예를 들면, TV를 통해 방송되는 영상 콘텐츠 텍스트는 영상 콘텐츠에 대해 기술한 대본을 포함할 수 있다. 이때, 대본은 영상 콘텐츠의 오디오와 동기화된 시간 정보를 포함하고 있어, 실시간으로 영상 콘텐츠의 재생과 함께 표시될 수 있다. 이때, 발화자의 대사뿐만 아니라, 효과음, OST, 분위기와 관련된 정보를 포함하고 있는 대본의 내용이 함께 표시될 수 있다. As another example, a video content text broadcast through a TV may include a script describing the video content. At this time, the scenario includes time information synchronized with the audio of the video content, and can be displayed together with the playback of the video content in real time. At this time, not only the dialogue of the speaker but also the contents of the script including the information related to the effect sound, the OST, and the atmosphere can be displayed together.

따라서, 클립 텍스트는 영상 컨텐츠 텍스트 중에서 추출된 클립의 길이 동안의 텍스트를 의미할 수 있다. 예를 들면, 클립 텍스트는 클립1(111)의 재생기간 동안의 대본, 블로그 등을 통해 클립 1에 대한 설명을 포함하는 텍스트를 의미할 수 있다. Thus, the clip text may mean text during the length of the clip extracted from the video content text. For example, the clip text may mean a text including a description of clip 1 through a script, a blog, or the like during reproduction of clip 1 (111).

영상 콘텐츠 텍스트 및 클립 텍스트를 분석하여 추출된 클립에 대응하는 클립 주제는 생성될 수 있다. 또는, 영상 콘텐츠 텍스트를 이용하여 영상 콘텐츠 주제에 대한 분포를 생성하고, 영상 콘텐츠 주제의 분포와 클립 텍스트를 이용하여 클립 주제는 생성될 수 있다. 여기서, 영상 콘텐츠 주제의 분포는 하나 이상의 영상 콘텐츠 주제가 분포된 것을 나타낼 수 있다.A clip subject corresponding to the extracted clip by analyzing the video content text and the clip text can be generated. Alternatively, the distribution of the image content subject may be generated using the image content text, and the clip subject may be generated using the distribution of the image content subject and the clip text. Here, the distribution of the image content subject may indicate that at least one image content subject is distributed.

예를 들면, 영상 콘텐츠 텍스트인 자막 및/또는 대본을 이용하여 하나 이상의 영상 콘텐츠 주제를 생성할 수 있다. 하나 이상의 영상 콘텐츠 주제가 생성됨에 따라 영상 콘텐츠 주제의 분포는 생성될 수 있다. 생성된 영상 콘텐츠 주제의 분포와 클립 텍스트를 이용하여 하나 이상의 클립 주제는 생성될 수 있고, 하나 이상의 클립 주제가 분포된 것은 클립 주제의 분포를 의미할 수 있다. 이때, 클립 주제는 대응하는 클립의 주제를 의미할 수 있다. For example, one or more video content topics may be generated using subtitles and / or scripts that are video content text. As more than one image content subject is created, the distribution of the image content subject may be created. One or more clip topics may be created using the distribution of the generated image content subject and clip text, and one or more clip topics may be distributed to the distribution of clip subjects. At this time, the clip subject may mean the subject of the corresponding clip.

일 실시예에 따르면, 영상 콘텐츠의 클립 주제의 분포 및 키워드의 분포를 반영하여, 클립과 동일하거나 유사한 주제, 내용, 의미를 가진 다른 클립의 리스트는 제공될 수 있다. According to one embodiment, a list of other clips having the same or similar theme, content, and meaning as the clip may be provided, reflecting the distribution of the clip theme of the video content and the distribution of the keyword.

도 2는 일 실시예에 따른, 영상 콘텐츠의 클립 연결 장치가 수행하는 과정을 나타낸 도면이다. 영상 콘텐츠의 클립 연결 장치는 프로세서를 포함할 수 있고, 프로세서에 의해 클립 간의 유사도는 결정될 수 있다. 2 is a diagram illustrating a process performed by a clip connection device for video content according to an exemplary embodiment of the present invention. The clip connector of the video content may include a processor, and the similarity between the clips may be determined by the processor.

영상 콘텐츠의 클립 연결 장치(200)는 영상 콘텐츠 및 영상 콘텐츠 텍스트를 수신할 수 있다. 예를 들면, 수신한 영상 콘텐츠는 TV에서 방영되는 화면과 음성을 포함하는 비디오 콘텐츠를 포함할 수 있다. 또한, 영상 콘텐츠 텍스트는 대본, 자막, 화면 캡션 데이터와 같이 영상 콘텐츠에 관련된 것을 모두 직접적으로 설명하는 텍스트를 포함할 수 있다. 또는, 영상 콘텐츠 텍스트는 블로그, SNS, 뉴스와 같이 영상 콘텐츠를 간접적으로 설명하는 텍스트를 포함할 수 있다. 여기서, 간접적으로 설명하는 텍스트는 영상 콘텐츠가 재생된 이후, 영상 콘텐츠와 관련된 모든 텍스트를 포함할 수 있다. The clip connection device 200 of the image content can receive the image content and the image content text. For example, the received video content may include a video content that includes a screen and audio played on the TV. In addition, the video content text may include text that directly explains all of the video content, such as script, caption, and screen caption data. Alternatively, the video content text may include text that indirectly describes the video content, such as a blog, SNS, or news. Here, the indirectly describing text may include all text associated with the image content after the image content is reproduced.

예를 들면, 클립 텍스트는 대본, 자막과 같이 영상 콘텐츠를 직접적으로 설명하는 텍스트에서 추출된 클립에 대응하는 텍스트 부분만 포함할 수 있다. 또는, 클립 텍스트는 영상 콘텐츠를 간접적으로 설명하는 텍스트에서 추출된 클립에 대해 설명하는 텍스트를 포함할 수 있다. 따라서, 클립 텍스트는 클립의 재생 시간에 대응하는 시간 동안의 대본, 자막의 해당 부분을 포함할 수 있고, 또는 클립의 재생 시간에 대응하는 부분에 대해 블로그에서 설명된 부분을 포함할 수 있다. For example, the clip text may only contain text portions corresponding to clips extracted from texts that directly describe the video content, such as transcripts and subtitles. Alternatively, the clip text may include text describing the clip extracted from the text that indirectly describes the video content. Therefore, the clip text may include a script for a time corresponding to the playback time of the clip, a corresponding portion of the subtitle, or a portion described in the blog for a portion corresponding to the playback time of the clip.

또 다른 예를 들면, TV를 통해 방송되는 영상 콘텐츠 텍스트는 영상 콘텐츠에 대해 기술한 대본을 포함할 수 있다. 이때, 대본은 영상 콘텐츠의 오디오와 동기화된 시간 정보를 포함하고 있어, 실시간으로 영상 콘텐츠의 재생과 함께 표시될 수 있다. 이때, 발화자의 대사뿐만 아니라, 효과음, OST, 분위기와 관련된 정보를 포함하고 있는 대본의 내용이 함께 표시될 수 있다. As another example, a video content text broadcast through a TV may include a script describing the video content. At this time, the scenario includes time information synchronized with the audio of the video content, and can be displayed together with the playback of the video content in real time. At this time, not only the dialogue of the speaker but also the contents of the script including the information related to the effect sound, the OST, and the atmosphere can be displayed together.

영상 콘텐츠의 클립 연결 장치(200)는 수신한 영상 콘텐츠에서 일정 길이의 클립을 추출할 수 있다. 여기서, 일정 길이는 자동 또는 수동으로 설정될 수 있다. The clip connector 200 of the image content can extract a clip of a predetermined length from the received image content. Here, the predetermined length may be set automatically or manually.

예를 들면, 영상 콘텐츠의 전체 시간에서 클립의 재생 시간에 대응하는 시작 시간과 끝 시간에 따라 클립은 영상 콘텐츠로부터 추출될 수 있다. 또 다른 예를 들면, 클립은 영상 콘텐츠에 포함된 scene간의 연결 관계를 분석하여, 동일/유사한 주제를 포함하고 있는 구간에서 추출될 수 있다. 또 다른 예를 들면, 클립은 영상 콘텐츠의 장면전환에 따라 추출될 수 있다. 클립은 이러한 예에 한정되지 않으며, 다른 예를 포함할 수 있다. For example, the clip can be extracted from the image content in accordance with the start time and end time corresponding to the clip play time in the entire time of the video content. As another example, a clip may be extracted from a section including the same / similar topic by analyzing the connection relationship between the scenes included in the video content. As another example, the clip can be extracted according to the scene change of the image content. The clip is not limited to this example, and may include other examples.

영상 콘텐츠의 클립 연결 장치(200)는 추출한 클립에 대응하는 클립 텍스트를 추출할 수 있다. 클립 텍스트는 영상 컨텐츠 텍스트 중에서 추출된 클립의 길이 동안의 텍스트를 의미할 수 있다. The clip connector 200 of the image contents can extract the clip text corresponding to the extracted clip. The clip text may mean text during the length of the clip extracted from the video content text.

예를 들면, 클립 텍스트는 시작 시간과 끝 시간이 정해진 시간에 대응하는 텍스트를 나타내거나, 또는 동일/유사한 주제를 포함하고 있는 scene의 텍스트를 나타내거나, 장면전환 되기 전까지의 텍스트를 나타낼 수 있다. 또 다른 예를 들면, 클립 텍스트는 방송된 이후, 클립 텍스트에 대한 블로그, SNS와 같이 클립에 대응하는 부분에 대한 설명하는 텍스트를 포함할 수 있다. For example, the clip text may represent text corresponding to a predetermined time of start time and end time, text of a scene containing the same / similar subject, or text before the scene change. As another example, the clip text may include text describing the clip text, a description of the portion corresponding to the clip, such as a blog, SNS, etc., after being broadcast.

영상 콘텐츠의 클립 연결 장치(200)는 영상 콘텐츠 텍스트를 이용하여 하나 이상의 영상 콘텐츠 주제를 생성할 수 있다. 영상 콘텐츠의 클립 연결 장치(200)는 영상 콘텐츠 텍스트에 포함된 단어들을 분석할 수 있다. 이때, 분석 방법으로 동시 발생성, 의미적 거리와 같은 방법을 포함할 수 있다.The clip connection device 200 of the image content may generate one or more image content topics using the image content text. The clip connection device 200 of the image contents can analyze the words included in the image content text. At this time, analysis methods can include methods such as co-occurrence and semantic distance.

예를 들면, 영상 콘텐츠의 클립 연결 장치(200)는 영상 콘텐츠 텍스트에 포함된 단어를 학습하여, 영상 콘텐츠 텍스트에서 단어의 위치와 관계없이 동일한 주제에 따라 동시 발생하는 단어들의 동시 발생성(co-occurrence)을 측정할 수 있다. 또 다른 예를 들면, 영상 콘텐츠의 클립 연결 장치(200)는 영상 콘텐츠 텍스트에 포함된 두 단어가 동시 발생한 경우, 두 단어가 어느 정도 거리에서 발생하였는지를 나타내는 의미적 거리(word distance)를 측정할 수 있다. For example, the clip connection device 200 for image contents learns words included in the image content text, and co-generates co-occurrences of words occurring on the same topic regardless of the position of the words in the image content text, occurrence can be measured. In another example, the clip connector 200 of the image contents can measure a word distance indicating how far two words have occurred at the same time when two words included in the image content text are generated at the same time have.

일 실시예에 따르면, 영상 콘텐츠의 클립 연결 장치(200)는 동시 발생성, 의미적 거리에 의해 측정한 단어들을 이용하여 영상 콘텐츠 주제 및 영상 콘텐츠 주제의 가중치를 생성할 수 있다. 이때, 영상 콘텐츠 주제는 실시예로서 영상 콘텐츠 주제에 포함된 {단어, 단어의 가중치, 단어의 개체명}에 대한 세트로 표현될 수 있다. 따라서, 영상 콘텐츠에 대한 영상 콘텐츠 주제의 분포는 생성될 수 있다. According to one embodiment, the clip connector 200 of the image content may generate weight values of the image content topic and the image content topic using words measured by the co-occurrence and semantic distance. At this time, the image content subject may be expressed as a set of {word, weight of word, object name of word} contained in the image content subject as an embodiment. Thus, the distribution of the image content subject to the image content can be generated.

여기서, 클립 주제를 표현하는 단어 분포는 {단어, 클립 주제의 가중치*단어의 가중치}의 세트를 포함할 수 있다. 이때, 단어의 가중치는 영상 콘텐츠 주제를 표현하는 단어에 대해 정규화 처리한 이후 이용가능할 수 있다. 여기서, 클립 주제를 표현하는 단어 분포는 영상 콘텐츠 주제의 분포가 생성되면서 결정될 수 있고, 정규화는 각 클립 주제를 표현하는 단어 분포에 대한 가중치의 합을 1이 되도록 하는 과정을 나타낼 수 있다. 이때, 정규화는 선택적으로 수행될 수 있다.Here, the word distribution representing the subject of the clip may include a set of {word, weight of clip subject, weight of word}. At this time, the weight of the word may be available after normalizing the word representing the image content subject. Here, the word distribution representing the clip subject can be determined while the distribution of the image content subject is generated, and the normalization can represent the process of setting the sum of the weights for the word distribution representing the subject of each clip to 1. [ At this time, the normalization may be performed selectively.

일 실시예에 따르면, 영상 콘텐츠 주제의 분포는 {영상 콘텐츠 주제의 식별자, 영상 콘텐츠 주제의 가중치}에 대한 세트를 포함할 수 있다. 영상 콘텐츠 주제의 분포와 클립에 대한 클립 텍스트를 이용하여 각각의 클립에 대한 클립 주제의 분포는 생성될 수 있다. 여기서, 클립 주제의 분포는 하나 이상의 클립 주제가 분포된 것을 나타낼 수 있다. According to one embodiment, the distribution of the image content subject may comprise a set of {the identifier of the image content subject, the weight of the image content subject}. The distribution of the clip subject for each clip can be generated using the distribution of the image content subject and the clip text for the clip. Here, the distribution of the clip theme may indicate that one or more clip topics are distributed.

영상 콘텐츠 주제의 분포를 일정 길이로 추출된 클립에 분배하여 클립 주제의 분포는 생성될 수 있다. 여기서, 클립 텍스트를 이용하여, 하나 이상의 영상 콘텐츠 주제가 분포된 영상 콘텐츠 주제의 분포는 클립에 분배될 수 있다. 일 실시예로서, 영상 콘텐츠 주제의 분포는 클립에 분배된 후, 클립 내에서 정규화 될 수 있다. 마찬가지로, 정규화는 선택적으로 수행될 수 있다.The distribution of the clip subject can be generated by distributing the distribution of the image content subject to the extracted clip of a certain length. Here, using the clip text, the distribution of the video content subject in which one or more video content subjects are distributed can be distributed to the clip. In one embodiment, the distribution of the image content subject may be normalized within the clip after being distributed to the clip. Likewise, normalization can be performed selectively.

일 실시예에 따르면, {단어, 단어의 가중치, 단어의 개체명} 세트의 유사도를 연산할 때, 단어들 간의 유사도는 코사인 유사도, 자카드 유사도와 같은 범용적인 알고리즘을 사용하거나 또는 복수의 알고리즘을 모두 이용할 수 있다. According to one embodiment, when computing the similarity of a set of {word, word weight, word object name} sets, the similarity between words may be determined using a general algorithm such as cosine similarity, jacquard similarity, Can be used.

일 실시예에 따르면, 영상 콘텐츠 주제의 분포를 생성하여 해당하는 클립에 재분배함으로써 클립 주제의 분포를 생성할 경우, 클립 텍스트에서 사용되지 않은 단어가 클립 주제로 이용될 수 있다. 즉, 클립 텍스트에 포함되지 않은 단어일지라도, 클립 주제에 포함될 수 있다.According to an embodiment, when a distribution of the image content subject is generated and redistributed to the corresponding clip, the unused word in the clip text may be used as the clip subject. That is, words that are not included in the clip text can be included in the clip theme.

여기서, 클립 주제의 분포는 {클립 주제의 식별자, 클립 주제의 가중치}에 대한 세트를 포함할 수 있다. 이때, 각각의 클립 주제는 {단어, 단어의 가중치. 단어의 개체명}에 대한 세트를 포함할 수 있고, 클립 주제는 하나 이상의 단어를 이용하여 표현될 수 있다.Here, the distribution of the clip topics may include {a set of identifiers of clip subjects, a weight of clip subjects}. At this time, each clip theme is {word, weight of word. The object name of the word}, and the clip subject may be represented using one or more words.

이때, 영상 콘텐츠의 클립 연결 장치는 단어의 개체명을 이용함으로써, 동음이의어인 단어를 구분할 수 있다. 또한, 영상 콘텐츠의 클립 연결 장치는 단어의 개체명에 따라 서비스에 차별화하여 활용할 수 있다. 따라서, 단어의 개체명을 이용하여, 클립 주제의 분포 및/또는 키워드의 분포에 포함된 단어는 선택적으로 서비스에 이용될 수 있다. 예를 들면, 서비스를 제공하기 위해 사용되는 복수의 키워드 중에서 '사람'에 대한 키워드를 이용하여 서비스를 제공하려는 경우, 복수의 개체명 중에서 '사람, 배우, 캐릭터'와 같은 단어의 개체명을 선택하고, 이와 같은 단어의 개체명을 가진 키워드만 서비스에 사용될 수 있다.At this time, the clip connection device of the image contents can distinguish words having homonyms by using the object names of words. In addition, the clip connection device of the image contents can be differentiated and utilized according to the object name of the word. Thus, by using the word ' s entity name, a word included in the distribution of the clip subject and / or the distribution of the keyword can be selectively used for the service. For example, when providing a service using a keyword for 'person' among a plurality of keywords used for providing a service, an object name of a word such as 'person, actor, character' among a plurality of object names is selected , And only keywords having an object name of such a word can be used for the service.

영상 콘텐츠의 클립 연결 장치(200)는 클립 주제의 분포를 기초로 클립 키워드의 분포를 생성할 수 있다. 여기서, 클립 키워드는 클립 주제를 나타내는 단어를 포함할 수 있으며, 클립 키워드의 분포는 클립 주제의 분포가 생성된 클립에 대응하도록 생성될 수 있다. 예를 들면, 클립 주제의 분포가 생성된 클립과 클립 키워드의 분포가 생성된 클립은 동일한 클립일 수 있다. The clip connector 200 of the image contents can generate the distribution of clip keywords based on the distribution of the clip subjects. Here, the clip keyword may include a word indicating the clip theme, and the distribution of the clip keyword may be generated so as to correspond to the clip in which the distribution of the clip subject is generated. For example, the clip in which the distribution of the clip theme is generated and the clip in which the distribution of the clip keyword is generated may be the same clip.

일 실시예에 따르면, {클립 키워드, 클립 키워드의 가중치, 클립 키워드의 개체명} 세트를 이용하여 클립 간 유사도를 연산할 때, 클립 키워드들 간의 유사도는 코사인 유사도, 자카드 유사도와 같은 범용적인 알고리즘을 사용하거나 또는 복수의 알고리즘을 모두 이용할 수 있다. According to one embodiment, when calculating the similarity between clips using a set of {clip keyword, weight of clip keyword, object name of clip keyword}, the similarity between clip keywords is calculated by a general algorithm such as cosine similarity and jacquard similarity Or use a plurality of algorithms.

일 실시예에 따르면, 클립 주제의 분포와 클립 주제를 표현하는 단어를 분석하고 클립 주제의 가중치와 각각의 클립 주제에서의 단어 가중치를 고려함으로써, 클립 키워드의 분포는 생성될 수 있다. 여기서, 클립 키워드의 분포는 {클립 키워드, 클립 키워드의 가중치, 클립 키워드의 개체명}의 세트를 포함할 수 있다. According to one embodiment, the distribution of the clip keywords can be generated by analyzing the distribution of the subject of the clip and the word representing the subject of the clip, and considering the weight of the clip subject and the word weight in each clip subject. Here, the distribution of the clip keywords may include {set of clip keywords, weight of clip keywords, object names of clip keywords}.

여기서, 클립 키워드는 클립 주제의 가중치와 단어의 가중치를 고려하여 선정될 수 있다. 예를 들면, 클립 주제의 가중치와 단어의 가중치를 곱한 값이 미리 설정한 임계값 이상인 경우 클립 키워드로 선정될 수 있다. 또는, 클립 주제의 가중치와 단어의 가중치를 곱한 값을 정렬하여, 상위에 위치하는 단어가 클립 키워드로 선정될 수 있다. 또는, 클립 주제 내의 단어가 일정 횟수 이상 사용된 경우, 단어가 클립 키워드로 선정될 수 있다. Here, the clip keyword can be selected in consideration of the weight of the clip subject and the weight of the word. For example, when the value obtained by multiplying the weight of the clip subject by the weight of the word is equal to or greater than a preset threshold value, it can be selected as a clip keyword. Alternatively, the value obtained by multiplying the weight of the clip subject by the weight of the word may be sorted, and the word located at the upper level may be selected as the clip keyword. Alternatively, if a word in the clip theme is used more than a predetermined number of times, the word may be selected as a clip keyword.

이때, 클립 키워드가 선정된 경우, 클립 키워드의 가중치는 클립 주제의 가중치와 단어 가중치를 곱한 값으로 설정될 수 있다. In this case, when the clip keyword is selected, the weight of the clip keyword may be set to a value obtained by multiplying the weight of the clip subject by the word weight.

또한, 영상 콘텐츠의 클립 연결 장치는 클립 키워드의 개체명을 이용함으로써, 동음이의어인 클립 키워드를 구분할 수 있다. 또한, 영상 콘텐츠의 클립 연결 장치는 클립 키워드의 개체명에 따라 서비스에 차별화하여 활용할 수 있다. 따라서, 클립 키워드의 개체명을 이용하여, 클립 주제의 분포에 포함된 클립 키워드는 선택적으로 서비스에 이용될 수 있다. 예를 들면, 서비스를 제공하기 위해 사용되는 복수의 클립 키워드 중에서 '사람'에 대한 클립 키워드를 이용하여 서비스를 제공하려는 경우, 복수의 개체명 중에서 '사람, 배우, 캐릭터'와 같은 클립 키워드의 개체명을 선택하고, 이와 같은 클립 키워드의 개체명을 가진 클립 키워드만 서비스에 사용될 수 있다.Further, the clip connection device of the image contents can distinguish clip keywords having homonyms by using the object names of the clip keywords. In addition, the clip connection device of the image contents can be differentiated and utilized according to the object name of the clip keyword. Therefore, by using the object name of the clip keyword, the clip keyword included in the distribution of the clip subject can be selectively used for the service. For example, when a service is provided by using a clip keyword for 'person' among a plurality of clip keywords used for providing a service, among the plurality of object names, objects of clip keywords such as 'person, actor, character' And a clip keyword having an object name of such a clip keyword can be used for the service.

영상 콘텐츠의 클립 연결 장치(200)는 영상 콘텐츠에 포함된 복수의 클립 간의 클립 주제의 유사도를 분석할 수 있다. 이때, 클립 주제의 유사도를 분석할 때, 클립 주제의 가중치와 클립 주제 내의 단어의 가중치는 이용될 수 있다. The clip connector 200 of the image contents can analyze the similarity of the clip subjects between a plurality of clips included in the image contents. At this time, when analyzing the similarity of the clip subject, the weight of the clip subject and the weight of the word in the clip subject can be used.

또한, 클립 주제의 유사도를 분석할 때, 클립 주제에 대한 단어 및/또는 단어 의 개체명을 고려할 수 있다. 따라서, 하나 이상의 동일하거나 유사한 단어 및/또는 단어의 개체명을 포함하는 클립 주제들 간의 유사도는 분석될 수 있다.Also, when analyzing the similarity of the clip subjects, it is possible to take into consideration the word and / or the word entity name of the clip subject. Thus, the similarity between clip subjects including one or more identical or similar words and / or entity names of words can be analyzed.

예를 들면, 단어와 단어의 개체명을 이용하여 클립 주제의 유사도를 분석할 때, 단어의 가중치 및 클립 주제의 가중치를 고려함으로써 동일하거나 유의한 단어 및/또는 단어의 개체명을 포함하는 클립 간의 클립 주제의 유사도는 분석될 수 있다. For example, when analyzing the similarity of a clip subject using a word and an object name of a word, the weight of the word and the weight of the subject of the clip are considered, The similarity of clip subjects can be analyzed.

영상 콘텐츠의 클립 연결 장치(200)는 동일하거나 유의한 클립 키워드 또는 클립 키워드의 개체명을 포함하는 복수의 클립 간의 클립 키워드의 유사도를 분석할 수 있다. 이때, 클립 키워드의 유사도를 분석할 때, 클립 키워드 가중치를 고려함으로써 동일하거나 유의한 클립 키워드 또는 클립 키워드의 개체명을 포함하는 클립 간의 클립 키워드의 유사도가 분석될 수 있다. 따라서, 하나 이상의 동일하거나 유사한 클립 키워드 및/또는 클립 키워드의 개체명을 포함하는 클립 주제들 간의 유사도는 분석될 수 있다.The clip connector 200 of the image contents may analyze the similarity of clip keywords among a plurality of clips including the same or a significant clip keyword or an object name of the clip keyword. At this time, when analyzing the similarity degree of the clip keyword, the similarity of the clip keyword between the clips including the same or a significant clip keyword or the object name of the clip keyword can be analyzed by considering the clip keyword weight. Thus, the similarity between clip subjects including one or more of the same or similar clip keywords and / or object names of clip keywords can be analyzed.

일 실시예에 따르면, 영상 콘텐츠의 클립 연결 장치(200)는 특정한 클립을 기준으로, 클립 주제의 유사도를 고려하여 순위 리스트를 생성할 수 있다. 여기서, 순위 리스트의 순위가 높은 것은, 특정한 클립과 클립 주제의 유사도가 높은 것을 의미할 수 있다. 이때, 순위 리스트는 특정한 클립과 나머지 전체 클립 간의 클립 주제의 유사도에 따라 생성될 수 있다. 또한, 영상 콘텐츠의 클립 연결 장치는 새로운 영상 콘텐츠를 수신할 경우, 순위 리스트는 업데이트될 수 있다. According to one embodiment, the clip connector 200 of the image content may generate a ranking list in consideration of the similarity of the clip subject, based on a specific clip. Here, the higher ranking of the ranking list may mean that the similarity between the specific clip and the subject of the clip is high. At this time, the ranking list can be generated according to the similarity of the clip subjects between the specific clip and the rest of the entire clip. Further, when the clip connection device of the image contents receives new image contents, the ranking list may be updated.

또는, 순위 리스트에 따라 클립과 클립 주제가 유사한 다른 클립을 연결할 수 있다. 이때, 순위 리스트는 클립에 메타데이터로 태깅될 수 있고, 영상 콘텐츠의 클립 연결 장치는 메타데이터를 이용하여 높은 순위의 클립을 연결할 수 있다.Or, depending on the ranking list, you can link other clips with similar clips and clip themes. At this time, the ranking list can be tagged as metadata in the clip, and the clip connection device of the image contents can link the clip of the higher rank using the metadata.

다른 일 실시예에 따르면, 영상 콘텐츠의 클립 연결 장치(200)는 특정한 클립을 기준으로, 클립 키워드의 유사도를 고려하여 순위 리스트를 생성할 수 있다. 여기서, 순위 리스트의 순위가 높은 것은, 특정한 클립과 클립 키워드의 유사도가 높은 것을 의미할 수 있다. 이때, 순위 리스트는 특정한 클립과 나머지 전체 클립 간의 클립 키워드의 유사도에 따라 생성될 수 있다. 또한, 영상 콘텐츠의 클립 연결 장치는 새로운 영상 콘텐츠를 수신할 경우, 순위 리스트는 업데이트될 수 있다.According to another embodiment, the clip connector 200 of the image content may generate a ranking list in consideration of the similarity of clip keywords based on a specific clip. Here, the higher ranking of the ranking list may mean that the similarity between a specific clip and a clip keyword is high. At this time, the ranking list can be generated according to the similarity of clip keywords between a specific clip and the rest of the whole clip. Further, when the clip connection device of the image contents receives new image contents, the ranking list may be updated.

또는, 순위 리스트에 따라 클립과 클립 키워드가 유사한 다른 클립을 연결할 수 있다. 이때, 순위 리스트는 클립에 메타데이터로 태깅될 수 있고, 영상 콘텐츠의 클립 연결 장치는 메타데이터를 이용하여 높은 순위의 클립을 연결할 수 있다.Or, depending on the ranking list, you can link other clips with similar clip and clip keywords. At this time, the ranking list can be tagged as metadata in the clip, and the clip connection device of the image contents can link the clip of the higher rank using the metadata.

도 3은 일 실시예에 따른, 영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법을 나타낸 도면이다. 3 is a diagram illustrating a clip connection method of video contents performed by a clip connection device for video content according to an exemplary embodiment.

단계(310)에서, 영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 클립에 대응하는 클립 텍스트를 추출할 수 있다.In operation 310, the clip connection device of the image content extracts one or more clips having a predetermined length from the image content, and extracts the clip text corresponding to the clip from the image content text corresponding to the image content.

영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠 및 영상 콘텐츠 텍스트를 수신할 수 있다. 예를 들면, 수신한 영상 콘텐츠는 방송국에서 방송하는 모든 영상 콘텐츠를 포함할 수 있다. The clip connection device of the image contents can receive the image contents and the image contents text. For example, the received video content may include all video content broadcasted by the broadcasting station.

이때, 영상 콘텐츠 텍스트는 영상 콘텐츠의 내용을 기재한 텍스트를 포함할 수 있다. 여기서, 영상 콘텐츠의 내용은 대본, OST, 분위기, 배경과 같은 영상 콘텐츠에 포함된 모든 사항을 포함할 수 있다. 또한, 영상 콘텐츠 텍스트는 대본과 같은 직접적인 텍스트뿐만 아니라, 영상 콘텐츠가 재생된 이후 영상 콘텐츠를 통해 검색되는 수많은 블로그, SNS, 뉴스와 같은 간접적인 텍스트도 포함할 수 있다. 예를 들면, 영상 콘텐츠가 방송된 이후, 해당 영상 콘텐츠의 시청자가 자신의 블로그에 영상 콘텐츠의 특정한 부분에 대해 자신의 평가를 기재한 블로그, SNS가 영상 콘텐츠 텍스트에 포함될 수 있다. At this time, the image content text may include text describing the content of the image content. Here, the contents of the image contents may include all items included in the image contents such as script, OST, atmosphere, and background. In addition, the image content text may include not only direct text such as a script, but also indirect text such as a number of blogs, SNS, and news retrieved through image contents after the image contents are reproduced. For example, after the image content is broadcasted, the image content text may include a blog or an SNS in which the viewer of the image content describes his or her evaluation of a specific portion of the image content on his / her blog.

일 실시예에 따르면, 영상 콘텐츠의 클립 연결 장치는 수신한 영상 콘텐츠에서 클립을 추출할 수 있다. 여기서, 클립은 자동 또는 수동으로 설정된 일정 길이를 가지며, 일정 길이는 영상 콘텐츠에 따라 다를 수 있다.According to one embodiment, the clip connection device of the image content may extract a clip from the received image content. Here, the clip has a predetermined length set automatically or manually, and the predetermined length may be different depending on the image content.

예를 들면, 영상 콘텐츠가 개그 프로그램인 경우, 영상 콘텐츠는 수많은 작은 단위의 개그에 의해 생성될 수 있다. 따라서, 영상 콘텐츠의 전체 재생 시간 중에서, 작은 단위의 개그의 재생 시간에 대응하는 클립은 추출될 수 있다. For example, when the video content is a gag program, the video content can be generated by a number of small units of gag. Therefore, among the entire playback time of the video content, a clip corresponding to the playback time of the gag in a small unit can be extracted.

또 다른 예를 들면, 영상 콘텐츠가 뉴스 프로그램인 경우, 영상 콘텐츠는 수많은 작은 단위의 뉴스에 의해 생성될 수 있다. 따라서, 영상 콘텐츠의 전체 재생 시간 중에서, 작은 단위의 뉴스의 재생 시간에 대응하는 클립은 추출될 수 있다. 다만, 클립의 추출은 위의 예에 한정되지 않으며, 다른 방법에 의해 클립은 추출될 수 있다.As another example, when the image content is a news program, the image content can be generated by a large number of small units of news. Therefore, among the entire playback time of the video content, the clip corresponding to the playback time of the news in a small unit can be extracted. However, the extraction of the clip is not limited to the above example, and the clip can be extracted by another method.

영상 콘텐츠의 클립 연결 장치는 추출한 클립에 대응하는 클립 텍스트를 추출할 수 있다. 클립 텍스트는 영상 컨텐츠 텍스트 중에서 추출된 클립의 길이 동안의 텍스트를 의미할 수 있다. 따라서, 클립 텍스트는 시작 시간과 끝 시간이 정해진 시간에 대응하는 텍스트를 포함할 수 있고, 클립 텍스트는 클립의 재생과 실시간으로 동기화될 수 있도록 시간 정보를 포함할 수 있다. The clip connection device of the image contents can extract the clip text corresponding to the extracted clip. The clip text may mean text during the length of the clip extracted from the video content text. Accordingly, the clip text may include text corresponding to the start time and end time, and the clip text may include time information so that it can be synchronized with the reproduction of the clip in real time.

예를 들면, 클립 텍스트는 작은 단위의 개그의 대본을 포함할 수 있고, 또는 영상 콘텐츠가 방송된 이후 작은 단위의 개그에 대한 블로그에 게시된 텍스트를 포함할 수 있다. For example, the clip text may include a small unit of gag script or may include text posted on a blog for a small unit of gag after the video content has been broadcast.

또 다른 예를 들면, 클립 텍스트는 작은 단위의 뉴스의 대본을 포함할 수 있고, 또는 영상 콘텐츠가 방송된 이후 작은 단위의 뉴스에 대한 SNS에 게시된 텍스트를 포함할 수 있다.As another example, the clip text may include a script of a small unit of news, or may include text posted to the SNS for news in small units since the video content was broadcast.

단계(320)에서, 영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠 텍스트를 이용하여 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 영상 콘텐츠 주제 및 클립 텍스트를 이용하여 추출된 클립에 대한 클립 주제를 생성할 수 있다.In step 320, the clip connection device of the image content may generate an image content subject for the image content using the image content text, and generate a clip theme for the extracted clip using the image content theme and clip text have.

영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠 텍스트를 이용하여 영상 콘텐츠 주제를 생성할 수 있다. 영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠 텍스트에 포함된 단어들을 분석할 수 있다. 예를 들면, 영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠에 관한 대본 또는 SNS등을 분석하여 영상 콘텐츠에 대한 주제를 생성할 수 있다. The clip connection device of the image content can generate the image content theme using the image content text. The clip connection device of the image contents can analyze the words included in the image contents text. For example, the clip connection device of the image contents may generate a subject for the image contents by analyzing a script or SNS regarding the image contents.

이때, 분석 방법으로 동시 발생성, 의미적 거리와 같은 방법을 포함할 수 있다. 다만, 이와 같은 분석 방법에 한정되는 것은 아니며, 다른 분석 방법에 의한 영상 콘텐츠 텍스트 분석도 포함될 수 있다. At this time, analysis methods can include methods such as co-occurrence and semantic distance. However, the present invention is not limited to such an analysis method, and may include analysis of image content text by another analysis method.

예를 들면, 영상 콘텐츠 텍스트에 포함된 단어를 학습하여, 영상 콘텐츠 텍스트에서 단어의 위치와 관계없이 동일한 주제에 따라 동시 발생하는 단어들의 동시 발생성(co-occurrence)을 측정할 수 있다. 또 다른 예를 들면, 영상 콘텐츠 텍스트에 포함된 두 단어가 동시 발생한 경우, 두 단어가 어느 정도 거리에서 발생하였는지를 나타내는 의미적 거리(word distance)를 측정할 수 있다. For example, it is possible to learn the co-occurrences of co-occurring words occurring on the same subject regardless of the position of the word in the image content text by learning words contained in the image content text. As another example, if the two words contained in the image content text occur simultaneously, the word distance can be measured to indicate how far apart the two words occurred.

일 실시예에 따르면, 동시 발생성, 의미적 거리에 의해 측정한 단어들을 이용하여 영상 콘텐츠 주제 및 영상 콘텐츠 주제의 가중치을 생성할 수 있다. 이때, 영상 콘텐츠 주제은 실시예로서 영상 콘텐츠 주제에 포함된 {단어, 단어의 가중치, 단어의 개체명}에 대한 세트로 표현될 수 있다. 여기서, 영상 콘텐츠 주제는 하나 이상 생성될 수 있고, 영상 콘텐츠 주제의 가중치을 이용함으로써 영상 콘텐츠에 대한 영상 콘텐츠 주제의 분포는 생성될 수 있다. According to one embodiment, weights of image content subject and image content subject can be generated using words measured by coincidence and semantic distance. At this time, the image content subject can be expressed as a set of {word, weight of word, object name of word} contained in the image content subject as an embodiment. Here, one or more image content subjects may be generated, and the distribution of the image content subjects for the image content may be generated by using the weight of the image content subject.

일 실시예에 따르면, 영상 콘텐츠 주제의 분포는 {영상 콘텐츠 주제의 식별자, 영상 콘텐츠 주제의 가중치}에 대한 세트를 포함할 수 있다. 영상 콘텐츠 주제의 분포와 클립에 대한 클립 텍스트를 이용하여 각각의 클립에 대한 클립 주제는 생성될 수 있고, 클립 주제의 분포는 하나 이상의 클립 주제가 분포된 것을 나타낼 수 있다. According to one embodiment, the distribution of the image content subject may comprise a set of {the identifier of the image content subject, the weight of the image content subject}. A clip theme for each clip can be created using the distribution of the video content subject and the clip text for the clip, and the distribution of the clip theme can indicate that one or more clip topics are distributed.

영상 콘텐츠 주제의 분포를 일정 길이로 추출된 클립에 분배하여 클립 주제의 분포는 생성될 수 있다. 일 실시예로서, 영상 콘텐츠 주제의 분포는 클립에 분배된 후, 클립 내에서 정규화 될 수 있다. The distribution of the clip subject can be generated by distributing the distribution of the image content subject to the extracted clip of a certain length. In one embodiment, the distribution of the image content subject may be normalized within the clip after being distributed to the clip.

일 실시예에 따르면, 영상 콘텐츠 주제의 분포를 생성하여 해당하는 클립에 재분배함으로써 클립 주제의 분포를 생성할 경우, 클립 텍스트에서 사용되지 않은 단어가 클립 주제로 이용될 수 있다. 즉, 클립 텍스트에 포함되지 않은 단어일지라도, 클립 주제에 포함될 수 있다. 예를 들면, 클립 텍스트에 사용되지 않은 단어이지만, 영상 콘텐츠 주제에 포함되는 단어를 이용하여 클립 주제는 표현될 수 있다. According to an embodiment, when a distribution of the image content subject is generated and redistributed to the corresponding clip, the unused word in the clip text may be used as the clip subject. That is, words that are not included in the clip text can be included in the clip theme. For example, a clip theme can be expressed using a word that is not used in the clip text but included in the video content theme.

여기서, 클립 주제의 분포는 {클립 주제의 식별자, 클립 주제의 가중치}에 대한 세트를 포함할 수 있다. 이때, 각각의 클립 주제는 {단어, 단어의 가중치, 단어의 개체명}에 대한 세트를 포함할 수 있고, 클립 주제는 하나 이상의 단어를 이용하여 표현될 수 있다. 이때, 클립 주제의 식별자를 이용하여, 클립 연결 장치는 클립 주제를 찾을 수 있다. Here, the distribution of the clip topics may include {a set of identifiers of clip subjects, a weight of clip subjects}. At this time, each clip theme may include a set of {word, weight of word, object name of word}, and the clip theme may be expressed using one or more words. At this time, using the identifier of the clip subject, the clip connector can find the clip subject.

단계(330)에서, 영상 콘텐츠의 클립 연결 장치는 클립 주제를 표현하는 단어에 관한 역인덱스를 생성하고, 클립과 다른 클립간의 동일하거나 유의한 단어가 있는 경우 단어들 간의 거리를 연산하여 클립 주제의 유사도를 분석할 수 있다.In operation 330, the clip connection device of the image content generates an inverse index related to a word representing a clip theme. If there is an identical or significant word between the clip and another clip, the distance between the words is calculated, The degree of similarity can be analyzed.

따라서, 클립 주제의 유사도를 분석하여, 다른 클립 과의 유사도를 클립 주제의 유사도 순서에 따라 결정할 수 있다.Therefore, it is possible to analyze the similarity of the clip theme and determine the similarity with other clips according to the order of similarity of the clip theme.

예를 들면, 대량의 단어를 포함하는 데이터에 인덱스를 표시할 때 하나의 단어를 역인덱스로 설정한 경우, 역인덱스를 활용하여 단어가 포함된 클립 텍스트, 영상 콘텐츠 텍스트 등은 연결될 수 있다. 따라서, 역인덱스를 이용하여, 대량의 데이터 중에서 역인덱스가 연결된 클립 또는 영상 콘텐츠를 선택하여 영상 콘텐츠 주제의 유사도 및/또는 클립 주제의 유사도의 분석에 사용될 수 있다. 그러므로, 데이터 검색 속도, 검색 후 연산 대상의 개수를 줄일 수 있다. For example, when an index is displayed on data including a large number of words, if one word is set as a reverse index, the clip text including the word using the reverse index, the image content text, and the like can be linked. Thus, using the inverse index, a clip or image content to which a reverse index is connected among a large amount of data can be selected and used for analyzing the similarity of the image content subject and / or the similarity of the clip subject. Therefore, the data retrieval speed and the number of objects to be computed after retrieval can be reduced.

또한, 동음이의어를 구분하기 위하여, {단어, 단어의 개체명}을 이용하여 역인덱스는 생성될 수 있다. 예를 들면, {사과, 과일}과 {사과, 행동}은 동일한 단어인 사과를 포함하고 있지만 다른 역인덱스를 나타낼 수 있다. 왜냐하면, 앞의 사과는 과일의 한 종류이며, 뒤의 사과는 appology를 나타내기 때문이다.In addition, in order to distinguish homonyms, an inverted index can be generated using {word, word object name}. For example, {apple, fruit} and {apple, action} contain the same word apple, but can represent other reverse indices. Because the apple in front is a kind of fruit, and the apples in the back indicate appology.

영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠에 포함된 복수의 클립 간의 클립 주제의 유사도를 분석할 수 있다. 이때, 클립 주제의 유사도를 분석할 때, 클립 주제의 가중치와 클립 주제 내의 단어의 가중치는 이용될 수 있다. The clip connection device of the image contents can analyze the similarity of the clip subjects among a plurality of clips included in the image contents. At this time, when analyzing the similarity of the clip subject, the weight of the clip subject and the weight of the word in the clip subject can be used.

또한, 클립 주제의 유사도를 분석할 때, 영상 콘텐츠의 클립 연결 장치는 클립 주제에 대한 단어 및/또는 단어의 개체명을 고려할 수 있다. 따라서, 하나 이상의 동일하거나 유사한 단어 및/또는 단어의 개체명을 포함하는 클립 주제들 간의 유사도는 분석될 수 있다.Also, when analyzing the similarity of the clip subject, the clip connection device of the image contents may consider the word and / or the object name of the clip subject. Thus, the similarity between clip subjects including one or more identical or similar words and / or entity names of words can be analyzed.

예를 들면, 단어와 단어의 개체명을 이용하여 클립 주제의 유사도를 분석할 때, 단어의 가중치 및 클립 주제의 가중치를 고려함으로써 동일하거나 유의한 단어 또는 단어 개체명을 포함하는 클립 간의 클립 주제의 유사도는 분석될 수 있다. For example, when analyzing the similarity of a clip subject by using word and word object names, the weight of the word and the weight of the clip subject are taken into account, so that the content of the clip subject between the clips containing the same or a meaningful word or word object name The similarity can be analyzed.

일 실시예에 따르면, 영상 콘텐츠의 클립 연결 장치는 특정한 클립을 기준으로, 클립 주제의 유사도를 고려하여 순위 리스트를 생성할 수 있다. 여기서, 순위 리스트의 순위가 높은 것은, 특정한 클립과 클립 주제의 유사도가 높은 것을 의미할 수 있다. 이때, 순위 리스트는 특정한 클립과 나머지 전체 클립 간의 클립 주제의 유사도에 따라 생성될 수 있다. 또한, 영상 콘텐츠의 클립 연결 장치는 새로운 영상 콘텐츠를 수신할 경우, 순위 리스트는 업데이트될 수 있다. According to an exemplary embodiment, the clip connection device of the image contents may generate a ranking list in consideration of the similarity of the clip subject, based on a specific clip. Here, the higher ranking of the ranking list may mean that the similarity between the specific clip and the subject of the clip is high. At this time, the ranking list can be generated according to the similarity of the clip subjects between the specific clip and the rest of the entire clip. Further, when the clip connection device of the image contents receives new image contents, the ranking list may be updated.

예를 들면, 영상 콘텐츠의 클립 연결 장치는 개그 프로그램 내의 특정한 개그에 대한 클립 주제와 동일하거나 다른 개그 프로그램 내의 개그의 클립 주제 간의 유사도를 순위 리스트에 표시할 수 있다. 이때, 순위 리스트의 순위는 개그를 표현하는 단어의 가중치 및 클립 주제의 가중치를 고려함으로써 동일하거나 유의한 단어 또는 단어 개체명을 고려함에 따른 순위를 반영한 것이다. For example, the clip connection device of the image content may display the similarity between the clip theme for a particular gag in the gag program or between gag clip topics in another gag program in the ranking list. In this case, the ranking of the ranking list reflects the ranking according to consideration of the same or a meaningful word or word entity name by considering the weight of the word representing the gag and the weight of the clip subject.

다른 일 실시예에 따르면, 순위 리스트에 따라 클립과 클립 주제가 유사한 다른 클립을 연결할 수 있다. 이때, 순위 리스트는 클립에 메타데이터로 태깅될 수 있고, 영상 콘텐츠의 클립 연결 장치는 메타데이터를 이용하여 높은 순위의 클립을 연결할 수 있다. 예를 들면, 메타데이터를 이용하여, 영상 콘텐츠의 클립 연결 장치는 클립 주제가 유사한 개그를 연속적으로 재생할 수 있다. According to another embodiment, it is possible to link other clips with similar clip and clip theme according to the ranking list. At this time, the ranking list can be tagged as metadata in the clip, and the clip connection device of the image contents can link the clip of the higher rank using the metadata. For example, by using the metadata, the clip connection device of the image contents can continuously reproduce the gag having the similar clip theme.

여기서 메타데이터는 순위 리스트뿐만 아니라, 클립의 식별자, 영상 콘텐츠에서 클립의 시작 시각 및 종료 시각, 클립 주제의 식별자 및 클립 주제의 가중치의 세트, 각각의 클립 주제에 포함된 단어 및 단어의 가중치 및 단어의 개체명의 세트, 클립 키워드 및 클립 키워드의 가중치 및 클립 키워드의 개체명의 세트 중에서 적어도 하나 이상을 포함할 수 있다. The meta data includes not only the ranking list but also the identifier of the clip, the start time and end time of the clip in the image content, the identifier of the clip subject and the set of weights of the clip subject, the weight of words and words included in each clip theme, A clip keyword, a weight of a clip keyword, and a set of object names of a clip keyword.

도 4는 다른 일 실시예에 따른, 영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법을 나타낸 도면이다. 4 is a diagram illustrating a clip connection method of video contents performed by a clip connection device for video contents according to another embodiment.

단계(410)에서, 영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 클립에 대응하는 클립 텍스트를 추출할 수 있다.In operation 410, the clip connection device of the image content extracts one or more clips having a predetermined length from the image content, and extracts the clip text corresponding to the clip from the image content text corresponding to the image content.

영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠 및 영상 콘텐츠 텍스트를 수신할 수 있다. 예를 들면, 수신한 영상 콘텐츠는 방송국에서 방송하는 모든 영상 콘텐츠를 포함할 수 있다. The clip connection device of the image contents can receive the image contents and the image contents text. For example, the received video content may include all video content broadcasted by the broadcasting station.

이때, 영상 콘텐츠 텍스트는 영상 콘텐츠의 내용을 기재한 텍스트를 포함할 수 있다. 여기서, 영상 콘텐츠의 내용은 대본, OST, 분위기, 배경과 같은 영상 콘텐츠에 포함된 모든 사항을 포함할 수 있다. 또한, 영상 콘텐츠 텍스트는 대본과 같은 직접적인 텍스트뿐만 아니라, 영상 콘텐츠가 재생된 이후 영상 콘텐츠를 통해 검색되는 수많은 블로그, SNS, 뉴스와 같은 간접적인 텍스트도 포함할 수 있다. 예를 들면, 영상 콘텐츠가 방송된 이후, 해당 영상 콘텐츠의 시청자가 자신의 블로그에 영상 콘텐츠의 특정한 부분에 대해 자신의 평가를 기재한 블로그, SNS가 영상 콘텐츠 텍스트에 포함될 수 있다. At this time, the image content text may include text describing the content of the image content. Here, the contents of the image contents may include all items included in the image contents such as script, OST, atmosphere, and background. In addition, the image content text may include not only direct text such as a script, but also indirect text such as a number of blogs, SNS, and news retrieved through image contents after the image contents are reproduced. For example, after the image content is broadcasted, the image content text may include a blog or an SNS in which the viewer of the image content describes his or her evaluation of a specific portion of the image content on his / her blog.

일 실시예에 따르면, 영상 콘텐츠의 클립 연결 장치는 수신한 영상 콘텐츠에서 클립을 추출할 수 있다. 여기서, 클립은 자동 또는 수동으로 설정된 일정 길이를 가지며, 일정 길이는 영상 콘텐츠에 따라 다를 수 있다.According to one embodiment, the clip connection device of the image content may extract a clip from the received image content. Here, the clip has a predetermined length set automatically or manually, and the predetermined length may be different depending on the image content.

예를 들면, 영상 콘텐츠가 개그 프로그램인 경우, 영상 콘텐츠는 수많은 작은 단위의 개그에 의해 생성될 수 있다. 따라서, 영상 콘텐츠의 전체 재생 시간 중에서, 작은 단위의 개그의 재생 시간에 대응하는 클립은 추출될 수 있다. For example, when the video content is a gag program, the video content can be generated by a number of small units of gag. Therefore, among the entire playback time of the video content, a clip corresponding to the playback time of the gag in a small unit can be extracted.

또 다른 예를 들면, 영상 콘텐츠가 뉴스 프로그램인 경우, 영상 콘텐츠는 수많은 작은 단위의 뉴스에 의해 생성될 수 있다. 따라서, 영상 콘텐츠의 전체 재생 시간 중에서, 작은 단위의 뉴스의 재생 시간에 대응하는 클립은 추출될 수 있다. 다만, 클립의 추출은 위의 예에 한정되지 않으며, 다른 방법에 의해 클립은 추출될 수 있다.As another example, when the image content is a news program, the image content can be generated by a large number of small units of news. Therefore, among the entire playback time of the video content, the clip corresponding to the playback time of the news in a small unit can be extracted. However, the extraction of the clip is not limited to the above example, and the clip can be extracted by another method.

영상 콘텐츠의 클립 연결 장치는 추출한 클립에 대응하는 클립 텍스트를 추출할 수 있다. 클립 텍스트는 영상 컨텐츠 텍스트 중에서 추출된 클립의 길이 동안의 텍스트를 의미할 수 있다. 따라서, 클립 텍스트는 시작 시간과 끝 시간이 정해진 시간에 대응하는 텍스트를 포함할 수 있고, 클립 텍스트는 클립의 재생과 실시간으로 동기화될 수 있도록 시간 정보를 포함할 수 있다. The clip connection device of the image contents can extract the clip text corresponding to the extracted clip. The clip text may mean text during the length of the clip extracted from the video content text. Accordingly, the clip text may include text corresponding to the start time and end time, and the clip text may include time information so that it can be synchronized with the reproduction of the clip in real time.

예를 들면, 클립 텍스트는 작은 단위의 개그의 대본을 포함할 수 있고, 또는 영상 콘텐츠가 방송된 이후 작은 단위의 개그에 대한 블로그에 게시된 텍스트를 포함할 수 있다. For example, the clip text may include a small unit of gag script or may include text posted on a blog for a small unit of gag after the video content has been broadcast.

또 다른 예를 들면, 클립 텍스트는 작은 단위의 뉴스의 대본을 포함할 수 있고, 또는 영상 콘텐츠가 방송된 이후 작은 단위의 뉴스에 대한 SNS에 게시된 텍스트를 포함할 수 있다.As another example, the clip text may include a script of a small unit of news, or may include text posted to the SNS for news in small units since the video content was broadcast.

단계(420)에서, 영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠 텍스트를 이용하여 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 영상 콘텐츠 주제 및 클립 텍스트를 이용하여 추출된 클립에 대한 클립 주제를 생성할 수 있다.In step 420, the clip connection device of the image content may generate the image content subject for the image content using the image content text and generate the clip subject for the extracted clip using the image content theme and clip text have.

영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠 텍스트를 이용하여 영상 콘텐츠 주제를 생성할 수 있다. 영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠 텍스트에 포함된 단어들을 분석할 수 있다. 예를 들면, 영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠에 관한 대본 또는 SNS등을 분석하여 영상 콘텐츠에 대한 주제를 생성할 수 있다. The clip connection device of the image content can generate the image content theme using the image content text. The clip connection device of the image contents can analyze the words included in the image contents text. For example, the clip connection device of the image contents may generate a subject for the image contents by analyzing a script or SNS regarding the image contents.

이때, 분석 방법으로 동시 발생성, 의미적 거리와 같은 방법을 포함할 수 있다. 다만, 이와 같은 분석 방법에 한정되는 것은 아니며, 다른 분석 방법에 의한 영상 콘텐츠 텍스트 분석도 포함될 수 있다. At this time, analysis methods can include methods such as co-occurrence and semantic distance. However, the present invention is not limited to such an analysis method, and may include analysis of image content text by another analysis method.

예를 들면, 영상 콘텐츠 텍스트에 포함된 단어를 학습하여, 영상 콘텐츠 텍스트에서 단어의 위치와 관계없이 동일한 주제에 따라 동시 발생하는 단어들의 동시 발생성(co-occurrence)을 측정할 수 있다. 또 다른 예를 들면, 영상 콘텐츠 텍스트에 포함된 두 단어가 동시 발생한 경우, 두 단어가 어느 정도 거리에서 발생하였는지를 나타내는 의미적 거리(word distance)를 측정할 수 있다. For example, it is possible to learn the co-occurrences of co-occurring words occurring on the same subject regardless of the position of the word in the image content text by learning words contained in the image content text. As another example, if the two words contained in the image content text occur simultaneously, the word distance can be measured to indicate how far apart the two words occurred.

일 실시예에 따르면, 영상 콘텐츠의 클립 연결 장치는 동시 발생성, 의미적 거리에 의해 측정한 단어들을 이용하여 영상 콘텐츠 주제 및 영상 콘텐츠 주제의 가중치을 생성할 수 있다. 이때, 영상 콘텐츠 주제은 실시예로서 영상 콘텐츠 주제에 포함된 {단어, 단어의 가중치, 단어의 개체명}에 대한 세트로 표현될 수 있다. 여기서, 영상 콘텐츠 주제는 하나 이상 생성될 수 있고, 영상 콘텐츠 주제의 가중치을 이용함으로써 영상 콘텐츠에 대한 영상 콘텐츠 주제의 분포는 생성될 수 있다. According to one embodiment, the clip connection device of the image contents can generate the weight of the image content subject and the image content subject by using the words measured by the co-occurrence and the semantic distance. At this time, the image content subject can be expressed as a set of {word, weight of word, object name of word} contained in the image content subject as an embodiment. Here, one or more image content subjects may be generated, and the distribution of the image content subjects for the image content may be generated by using the weight of the image content subject.

일 실시예에 따르면, 영상 콘텐츠 주제의 분포는 {영상 콘텐츠 주제의 식별자, 영상 콘텐츠 주제의 가중치}에 대한 세트를 포함할 수 있다. 영상 콘텐츠 주제의 분포와 클립에 대한 클립 텍스트를 이용하여 각각의 클립에 대한 클립 주제 는 생성될 수 있고, 클립 주제의 분포는 하나 이상의 클립 주제가 분포된 것을 나타낼 수 있다. 이때, 영상 콘텐츠 주제의 식별자를 이용하여 영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠 주제를 찾을 수 있다.According to one embodiment, the distribution of the image content subject may comprise a set of {the identifier of the image content subject, the weight of the image content subject}. A clip theme for each clip can be created using the distribution of the video content subject and the clip text for the clip, and the distribution of the clip theme can indicate that one or more clip topics are distributed. At this time, the clip connection device of the image contents can find the image content subject by using the identifier of the image content subject.

영상 콘텐츠 주제의 분포를 일정 길이로 추출된 클립에 분배하여 클립 주제의 분포는 생성될 수 있다. 일 실시예로서, 영상 콘텐츠 주제의 분포는 클립에 분배된 후, 클립 내에서 정규화 될 수 있다. The distribution of the clip subject can be generated by distributing the distribution of the image content subject to the extracted clip of a certain length. In one embodiment, the distribution of the image content subject may be normalized within the clip after being distributed to the clip.

일 실시예에 따르면, 영상 콘텐츠 주제의 분포를 생성하여 해당하는 클립에 재분배함으로써 클립 주제의 분포를 생성할 경우, 클립 텍스트에서 사용되지 않은 단어가 클립 주제로 이용될 수 있다. 즉, 클립 텍스트에 포함되지 않은 단어일지라도, 클립 주제에 포함될 수 있다. 예를 들면, 클립 텍스트에 사용되지 않은 단어이지만, 영상 콘텐츠 주제에 포함되는 단어를 이용하여 클립 주제는 표현될 수 있다. According to an embodiment, when a distribution of the image content subject is generated and redistributed to the corresponding clip, the unused word in the clip text may be used as the clip subject. That is, words that are not included in the clip text can be included in the clip theme. For example, a clip theme can be expressed using a word that is not used in the clip text but included in the video content theme.

여기서, 클립 주제의 분포는 {클립 주제의 식별자, 클립 주제의 가중치}에 대한 세트를 포함할 수 있다. 이때, 각각의 클립 주제는 {단어, 단어의 가중치, 단어의 개체명}에 대한 세트를 포함할 수 있고, 클립 주제는 하나 이상의 단어를 이용하여 표현될 수 있다.Here, the distribution of the clip topics may include {a set of identifiers of clip subjects, a weight of clip subjects}. At this time, each clip theme may include a set of {word, weight of word, object name of word}, and the clip theme may be expressed using one or more words.

단계(430)에서, 영상 콘텐츠의 클립 연결 장치는 클립 주제와 연관된 단어의 가중치 및 클립 주제의 가중치에 기반하여, 클립에 대한 클립 키워드를 생성할 수 있다. At step 430, the clip connector of the image content may generate a clip keyword for the clip, based on the weight of the word associated with the clip theme and the weight of the clip theme.

영상 콘텐츠의 클립 연결 장치는 클립 주제의 분포를 기초로 클립 키워드의 분포를 생성할 수 있다. 여기서, 클립 키워드의 분포는 클립 주제의 분포가 생성된 클립에 대응하도록 생성될 수 있다. 예를 들면, 클립 주제의 분포가 생성된 클립과 클립 키워드의 분포가 생성된 클립은 동일한 클립일 수 있다. The clip connection device of the image contents can generate the distribution of the clip keyword based on the distribution of the clip subject. Here, the distribution of the clip keyword may be generated so as to correspond to the clip in which the distribution of the clip subject is generated. For example, the clip in which the distribution of the clip theme is generated and the clip in which the distribution of the clip keyword is generated may be the same clip.

일 실시예에 따르면, 클립 주제의 분포와 클립 주제를 표현하는 단어를 분석하여, 클립 주제의 가중치와 각각의 클립 주제에서 단어의 가중치를 고려함으로써, 클립 키워드의 분포는 생성될 수 있다. 여기서, 클립 키워드의 분포는 {클립 키워드, 클립 키워드의 가중치, 클립 키워드의 개체명}의 세트를 포함할 수 있다. According to one embodiment, the distribution of clip keywords can be generated by analyzing the distribution of clip subjects and the words representing the clip subjects, and by considering the weight of the clip subject and the weight of the word in each clip subject. Here, the distribution of the clip keywords may include {set of clip keywords, weight of clip keywords, object names of clip keywords}.

여기서, 클립 키워드는 클립 주제의 가중치와 단어 가중치를 고려하여 선정될 수 있다. 예를 들면, 클립 주제의 가중치와 단어의 가중치를 곱한 값이 미리 설정한 임계값 이상인 경우 키워드로 선정될 수 있다. 또는, 클립 주제의 가중치와 단어 가중치를 곱한 값을 정렬하여, 상위에 위치하는 단어가 키워드로 선정될 수 있다. 또는, 클립 주제 내의 단어가 일정 횟수 이상 사용된 경우, 단어가 클립 키워드로 선정될 수 있다. Here, the clip keyword can be selected in consideration of the weight of the clip topic and the word weight. For example, if the value obtained by multiplying the weight of the clip subject by the weight of the word is equal to or greater than a preset threshold value, the keyword may be selected. Alternatively, a value obtained by multiplying the weight of the clip subject by the word weight can be sorted, and a word located in the upper part can be selected as a keyword. Alternatively, if a word in the clip theme is used more than a predetermined number of times, the word may be selected as a clip keyword.

따라서, 클립 주제를 표현하는 단어 중에서, 일정한 조건을 만족하는 경우 클립 키워드로 선정될 수 있다. 이때, 클립 키워드가 선정된 경우, 클립 키워드의 가중치는 클립 주제의 가중치와 단어 가중치를 곱한 값으로 설정될 수 있다. Accordingly, among the words expressing the clip theme, when the predetermined condition is satisfied, the keyword can be selected as the clip keyword. In this case, when the clip keyword is selected, the weight of the clip keyword may be set to a value obtained by multiplying the weight of the clip subject by the word weight.

단계(440)에서, 영상 콘텐츠의 클립 연결 장치는 클립 키워드에 관한 역인덱스를 생성하고, 클립과 다른 클립 간의 동일하거나 유의한 단어가 있는 경우 단어들 간의 거리를 연산하여 클립 주제의 유사도를 분석할 수 있다. In step 440, the clip connection apparatus of the image contents generates an inverse index related to the clip keyword, and when there is the same or a significant word between the clip and the other clip, the distance between the words is calculated to analyze the similarity of the clip subject .

따라서, 클립키워드의 유사도를 분석하여, 다른 클립 과의 유사도를 클립 키워드의 유사도 순서에 따라 결정할 수 있다.Therefore, the degree of similarity of the clip keywords can be analyzed, and the degree of similarity with other clips can be determined according to the order of similarity of the clip keywords.

영상 콘텐츠의 클립 연결 장치는 동일하거나 유의한 클립 키워드 또는 클립 키워드의 개체명을 포함하는 복수의 클립 간의 클립 키워드의 유사도를 분석할 수 있다. 이때, 클립 키워드의 유사도를 분석할 때, 클립 키워드의 가중치를 고려함으로써 동일하거나 유의한 클립 키워드 또는 클립 키워드 개체명을 포함하는 클립 간의 클립 키워드의 유사도는 분석될 수 있다. 따라서, 하나 이상의 동일하거나 유사한 클립 키워드 및/또는 클립 키워드 개체명을 포함하는 클립 주제들 간의 유사도는 분석될 수 있다.The clip connection device of the image contents may analyze the similarity of the clip keywords among a plurality of clips including the same or a significant clip keyword or an object name of the clip keyword. At this time, when analyzing the similarity degree of the clip keyword, the similarity degree of the clip keyword between the clips including the same or a significant clip keyword or clip keyword object name can be analyzed by considering the weight of the clip keyword. Thus, the similarity between clip topics including one or more of the same or similar clip keywords and / or clip keyword entity names can be analyzed.

예를 들면, 대량의 단어를 포함하는 데이터에 인덱스를 표시할 때 하나의 클립 키워드를 역인덱스로 설정한 경우, 역인덱스를 활용하여 클립 키워드가 포함된 클립 텍스트, 영상 콘텐츠 텍스트 등은 연결될 수 있다. 따라서, 역인덱스를 이용하여, 대량의 데이터 중에서 역인덱스가 연결된 클립 또는 영상 콘텐츠를 선택하여 영상 콘텐츠 주제의 유사도 및/또는 클립 키워드의 유사도의 분석에 사용될 수 있다. 그러므로, 데이터 검색 속도, 검색 후 연산 대상의 개수를 줄일 수 있다. For example, if one clip keyword is set to a reverse index when displaying an index in the data including a large number of words, the clip text including the clip keyword, the image content text, and the like can be linked using the reverse index . Thus, using the inverse index, a clip or image content to which a reverse index is connected among a large amount of data can be selected and used for analyzing the similarity of the image content subject and / or the similarity of the clip keyword. Therefore, the data retrieval speed and the number of objects to be computed after retrieval can be reduced.

또한, 동음이의어를 구분하기 위하여, {클립 키워드, 클립 키워드의 개체명}을 이용하여 역인덱스는 생성될 수 있다. 예를 들면, {사과, 과일}과 {사과, 행동}은 동일한 클립 키워드인 사과를 포함하고 있지만 다른 역인덱스를 나타낼 수 있다. 왜냐하면, 앞의 사과는 과일의 한 종류이며, 뒤의 사과는 appology를 나타내기 때문이다.Also, in order to distinguish homonyms, an inverse index can be generated using {clip keyword, object name of clip keyword}. For example, {apple, fruit} and {apple, action} contain apple, which is the same clip keyword, but can represent another reverse index. Because the apple in front is a kind of fruit, and the apples in the back indicate appology.

일 실시예에 따르면, 영상 콘텐츠의 클립 연결 장치는 특정한 클립을 기준으로, 클립 키워드의 유사도를 고려하여 순위 리스트를 생성할 수 있다. 여기서, 순위 리스트의 순위가 높은 것은, 특정한 클립과 클립 키워드의 유사도가 높은 것을 의미할 수 있다. 이때, 순위 리스트는 특정한 클립과 나머지 전체 클립 간의 클립 키워드의 유사도에 따라 생성될 수 있다. 또한, 영상 콘텐츠의 클립 연결 장치는 새로운 영상 콘텐츠를 수신할 경우, 순위 리스트는 업데이트될 수 있다.According to one embodiment, the clip connection device of the image contents can generate a ranking list in consideration of the similarity of clip keywords based on a specific clip. Here, the higher ranking of the ranking list may mean that the similarity between a specific clip and a clip keyword is high. At this time, the ranking list can be generated according to the similarity of clip keywords between a specific clip and the rest of the whole clip. Further, when the clip connection device of the image contents receives new image contents, the ranking list may be updated.

예를 들면, 영상 콘텐츠의 클립 연결 장치는 개그 프로그램 내의 특정한 개그에 대한 클립 키워드와 동일하거나 다른 개그 프로그램 내의 개그의 클립 키워드 간의 유사도를 순위 리스트에 표시할 수 있다. 이때, 순위 리스트의 순위는 개그를 표현하는 클립 키워드의 가중치를 고려한 순위를 반영한 것이다.For example, the clip connection device of the video content may display the similarity between the clip keywords for the specific gag in the gag program or between the gag clip keywords in other gag programs in the ranking list. At this time, the ranking of the ranking list reflects the ranking in consideration of the weight of the clip keyword representing the gag.

다른 일 실시예에 따르면, 순위 리스트에 따라 클립과 클립 키워드가 유사한 다른 클립을 연결할 수 있다. 이때, 순위 리스트는 클립에 메타데이터로 태깅될 수 있고, 영상 콘텐츠의 클립 연결 장치는 메타데이터를 이용하여 높은 순위의 클립을 연결할 수 있다. 예를 들면, 메타데이터를 이용하여, 영상 콘텐츠의 클립 연결 장치는 클립 키워드가 유사한 개그를 연속적으로 재생할 수 있다.According to another embodiment, it is possible to link other clips having similar clip and clip keywords according to the ranking list. At this time, the ranking list can be tagged as metadata in the clip, and the clip connection device of the image contents can link the clip of the higher rank using the metadata. For example, by using the metadata, the clip connection device of the image content can continuously reproduce the gag similar to the clip keyword.

여기서 메타데이터는 순위 리스트뿐만 아니라, 클립의 식별자, 영상 콘텐츠에서 클립의 시작 시각 및 종료 시각, 클립 주제의 식별자 및 클립 주제의 가중치의 세트, 각각의 클립 주제에 포함된 단어 및 단어의 가중치 및 단어의 개체명의 세트, 클립 키워드 및 클립 키워드의 가중치 및 클립 키워드의 개체명의 세트 중에서 적어도 하나 이상을 포함할 수 있다. The meta data includes not only the ranking list but also the identifier of the clip, the start time and end time of the clip in the image content, the identifier of the clip subject and the set of weights of the clip subject, the weight of words and words included in each clip theme, A clip keyword, a weight of a clip keyword, and a set of object names of a clip keyword.

도 5는 다른 일 실시예에 따른, 영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법을 나타낸 도면이다. 도 5에 대한 자세한 설명은 도 3과 도 4를 참조할 수 있다.5 is a diagram illustrating a clip connection method of video content performed by a clip connection apparatus for video content according to another embodiment. A detailed description of FIG. 5 can be found in FIGS. 3 and 4. FIG.

단계(510)에서, 영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 상기 클립에 대응하는 클립 텍스트를 추출할 수 있다.In operation 510, the clip connection device of the image content may extract one or more clips of a predetermined length from the image content, and extract clip text corresponding to the clip from the image content text corresponding to the image content.

단계(520)에서, 영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠 텍스트를 이용하여 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 영상 콘텐츠 주제 및 상기 클립 텍스트를 이용하여 추출된 클립에 대한 클립 주제를 생성하고, 클립 주제와 연관된 단어의 가중치 및 클립 주제의 가중치에 기반하여, 클립에 대한 클립 키워드를 생성할 수 있다.In step 520, the clip connection device of the image contents generates an image content theme for the image content using the image content text, generates a clip theme for the clip extracted using the image content theme and the clip text , A clip keyword for the clip may be generated based on the weight of the word associated with the clip subject and the weight of the clip subject.

단계(530)에서, 영상 콘텐츠의 클립 연결 장치는 클립 주제와 클립 키워드를 이용하여, 동일하거나 유의한 단어 및 클립 키워드가 있는 경우 단어 간의 거리 및 클립 키워드 간의 거리를 연산하여 클립의 유사도를 분석할 수 있다.In step 530, the clip connection device of the image contents uses the clip theme and the clip keyword to calculate the distance between the words and the distance between the clips if there is the same or a meaningful word and clip keyword to analyze the similarity of the clip .

따라서, 일 실시예에 따르면, 클립 주제 및 클립 키워드를 모두 고려하여, 클립 간의 유사도를 분석할 수 있다.Therefore, according to one embodiment, the similarity between clips can be analyzed by considering both the clip theme and the clip keyword.

도 6은 다른 일 실시예에 따른, 영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법을 나타낸 도면이다.FIG. 6 is a diagram illustrating a clip connection method of image contents performed by a clip connection device of image contents according to another embodiment.

단계(610)에서, 영상 콘텐츠의 클립 연결 장치는 영상 콘텐츠로부터 추출된 클립에 태깅된 클립 주제 및 클립 키워드를 식별할 수 있다. 영상 콘텐츠 및 클립은 사전에 분석되어 클립 주제 및 클립 키워드는 생성될 수 있고, 클립 주제 및 클립 키워드는 클립에 태깅될 수 있다. 클립 주제 및 클립 키워드에 대한 자세한 설명은 생략한다.In step 610, the clip connector of the image content may identify clip topics and clip keywords tagged in the clip extracted from the image content. The video content and clips can be pre-analyzed such that clip topics and clip keywords can be generated, and clip topics and clip keywords can be tagged to clips. Detailed descriptions of clip topics and clip keywords are omitted.

단계(620)에서, 영상 콘텐츠의 클립 연결 장치는 클립 주제 및 클립 키워드를 이용하여, 클립 주제에 포함된 단어의 역인덱스 및 클립 키워드에 관한 역인덱스를 생성할 수 있다. 역인덱스에 관한 자세한 설명은 생략한다. In step 620, the clip connection device of the image content may generate an inverse index of a word included in the clip subject and a reverse index of the clip keyword, using the clip subject and the clip keyword. The detailed description of the inverse index is omitted.

단계(630)에서, 영상 콘텐츠의 클립 연결 장치는 다른 영상 콘텐츠에서 생성된 단어의 역인덱스 및 클립 키워드에 관한 역인덱스를 이용하여, 클립 간의 유사도를 결정할 수 있다. In step 630, the clip connector of the image content can determine the similarity between the clips using the inverse index of the word generated in the other image content and the inverse index of the clip keyword.

역인덱스는 {단어, 단어의 개체명}을 이용하여 생성될 수 있다. 이때, 동일하거나 유사한 {단어, 단어의 개체명}을 포함하고 있는 역인덱스를 이용하여, 다른 영상 콘텐츠 또는 클립 간의 유사도는 분석될 수 있다. 여기서, 역인덱스는 클립 주제 및/또는 영상 콘텐츠 주제별로 생성될 수 있다. 또는 역인덱스는 클립 키워드 별로 생성될 수 있다. The inverse index can be generated using {word, object name of word}. At this time, similarity between different image contents or clips can be analyzed by using an inverse index including the same or similar {word, word object name}. Here, the inverse index may be generated by clip theme and / or image content theme. Or the inverse index may be generated for each clip keyword.

예를 들면, 동일하거나 유사한 역인덱스를 포함하는 클립들 간의 유사도는 분석될 수 있다. 또는 동일하거나 유사한 역인덱스를 포함하는 영상 콘테츠 간의 유사도는 분석될 수 있다. 또는 동일하거나 유사한 역인덱스를 포함하는 클립 키워드 간의 유사도는 분석될 수 있다. For example, the similarity between clips including the same or similar reverse index can be analyzed. Or the similarity between image contents including the same or similar reverse index can be analyzed. Or the similarity between clip keywords including the same or similar reverse index can be analyzed.

이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The embodiments described above may be implemented in hardware components, software components, and / or a combination of hardware components and software components. For example, the devices, methods, and components described in the embodiments may be implemented within a computer system, such as, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, such as an array, a programmable logic unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the operating system. The processing device may also access, store, manipulate, process, and generate data in response to execution of the software. For ease of understanding, the processing apparatus may be described as being used singly, but those skilled in the art will recognize that the processing apparatus may have a plurality of processing elements and / As shown in FIG. For example, the processing unit may comprise a plurality of processors or one processor and one controller. Other processing configurations are also possible, such as a parallel processor.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of the foregoing, and may be configured to configure the processing device to operate as desired or to process it collectively or collectively Device can be commanded. The software and / or data may be in the form of any type of machine, component, physical device, virtual equipment, computer storage media, or device , Or may be permanently or temporarily embodied in a transmitted signal wave. The software may be distributed over a networked computer system and stored or executed in a distributed manner. The software and data may be stored on one or more computer readable recording media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to an embodiment may be implemented in the form of a program command that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like, alone or in combination. The program instructions to be recorded on the medium may be those specially designed and configured for the embodiments or may be available to those skilled in the art of computer software. Examples of computer-readable media include magnetic media such as hard disks, floppy disks and magnetic tape; optical media such as CD-ROMs and DVDs; magnetic media such as floppy disks; Magneto-optical media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions include machine language code such as those produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like. The hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다Although the embodiments have been described with reference to the drawings, various technical modifications and variations may be applied to those skilled in the art. For example, it is to be understood that the techniques described may be performed in a different order than the described methods, and / or that components of the described systems, structures, devices, circuits, Lt; RTI ID = 0.0 > and / or < / RTI > equivalents,

110, 120 ~ : 영상 콘텐츠
111, 121 ~: 클립
200: 영상 콘텐츠의 클립 연결 장치
110, 120 ~: image content
111, 121 ~: Clip
200: clip connection device for image contents

Claims (20)

영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법에 있어서,
영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 상기 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 상기 클립에 대응하는 클립 텍스트를 추출하는 단계;
상기 영상 콘텐츠 텍스트를 이용하여 상기 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 상기 영상 콘텐츠 주제 및 상기 클립 텍스트를 이용하여 상기 추출된 클립에 대한 클립 주제를 생성하는 단계; 및
상기 클립 주제를 표현하는 단어에 관한 역인덱스를 생성하고, 상기 클립과 다른 클립간의 동일하거나 유의한 단어가 있는 경우 상기 단어들 간의 거리를 연산하여 클립 주제의 유사도를 분석하는 단계
를 포함하는 영상 콘텐츠의 클립 연결 방법.
A clip connection method of video content performed by a clip connection device of video content,
Extracting at least one clip having a preset length from the image content and extracting clip text corresponding to the clip from the image content text corresponding to the image content;
Generating an image content subject for the image content using the image content text and generating a clip theme for the extracted clip using the image content theme and the clip text; And
A step of generating an inverse index related to a word representing the clip subject and analyzing the similarity of the clip subject by calculating the distance between the same and a different word between the clip and the other clip
And a clipping means for clipping the clips.
제1항에 있어서,
상기 클립 주제의 분포는 클립 주제의 식별자 및 클립 주제의 가중치에 대한 세트를 포함하고,
상기 클립 주제는 단어, 단어의 가중치 및 단어의 개체명에 대한 세트를 포함하는 영상 콘텐츠의 클립 연결 방법.
The method according to claim 1,
Wherein the distribution of the clip subject includes a set of weights of the clip subject and an identifier of the clip subject,
Wherein the clip subject comprises a set of words, weight of words, and object name of a word.
제2항에 있어서,
상기 클립 주제의 유사도를 분석하는 단계는,
상기 단어들 간의 거리를 연산할 때 상기 단어의 개체명의 동일성을 고려하는 영상 콘텐츠의 클립 연결 방법.
3. The method of claim 2,
Wherein analyzing the similarity of the clip subject comprises:
And calculating the distance between the words when considering the identity of the entity name of the word.
제3항에 있어서,
상기 단어와 상기 단어의 개체명을 이용하여 클립 주제의 유사도를 분석할 때, 상기 단어의 가중치 및 클립 주제의 가중치를 고려함으로써 동일하거나 유의한 단어 또는 단어의 개체명을 포함하는 클립 간의 클립 주제의 유사도를 분석하는 영상 콘텐츠의 클립 연결 방법.
The method of claim 3,
When analyzing the similarity of the clip subject by using the word and the object name of the word, considering the weight of the word and the weight of the clip subject, Clipping Method of Image Contents to Analyze Similarity.
영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법에 있어서,
영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 상기 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 상기 클립에 대응하는 클립 텍스트를 추출하는 단계;
상기 영상 콘텐츠 텍스트를 이용하여 상기 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 상기 영상 콘텐츠 주제 및 상기 클립 텍스트를 이용하여 상기 추출된 클립에 대한 클립 주제를 생성하는 단계;
상기 클립 주제와 연관된 단어의 가중치 및 클립 주제의 가중치에 기반하여, 상기 클립에 대한 클립 키워드를 생성하는 단계; 및
상기 클립 키워드에 관한 역인덱스를 생성하고, 상기 클립과 다른 클립간의 동일하거나 유의한 클립 키워드가 있는 경우 상기 클립 키워드들 간의 거리를 연산하여 클립 키워드의 유사도를 분석하는 단계
를 포함하는 영상 콘텐츠 클립의 연결 방법.
A clip connection method of video content performed by a clip connection device of video content,
Extracting at least one clip having a preset length from the image content and extracting clip text corresponding to the clip from the image content text corresponding to the image content;
Generating an image content subject for the image content using the image content text and generating a clip theme for the extracted clip using the image content theme and the clip text;
Generating a clip keyword for the clip based on a weight of a word associated with the clip subject and a weight of a clip subject; And
Generating an inverse index related to the clip keyword and analyzing the similarity degree of the clip keyword by calculating the distance between the clip keywords if there is the same or a significant clip keyword between the clip and the other clip
The method comprising the steps of:
제5항에 있어서,
상기 클립 키워드의 분포는 클립 키워드, 클립 키워드의 가중치 및 클립 키워드의 개체명의 세트를 포함하고,
상기 클립 키워드의 유사도를 분석하는 단계는, 상기 클립 키워드들 간의 거리를 연산할 때 상기 클립 키워드의 개체명의 동일성을 고려하는 영상 콘텐츠 클립의 연결 방법.
6. The method of claim 5,
Wherein the distribution of the clip keyword includes a clip keyword, a weight of a clip keyword, and a set of object names of a clip keyword,
Wherein the step of analyzing the similarity of the clip keywords considers identity of the clip keywords when calculating distances between the clip keywords.
제6항에 있어서,
상기 클립 키워드와 상기 클립 키워드의 개체명을 이용하여 클립 키워드의 유사도를 분석할 때, 상기 클립 키워드의 가중치를 고려함으로써 동일하거나 유의한 클립 키워드 또는 클립 키워드의 개체명을 포함하는 클립 간의 클립 키워드의 유사도를 분석하는 영상 콘텐츠의 클립 연결 방법.
The method according to claim 6,
When the similarity degree of the clip keyword is analyzed using the clip keyword and the object name of the clip keyword, the weight of the clip keyword is taken into consideration, and thereby the same or a significant clip keyword or a clip keyword among the clips including the object name of the clip keyword Clipping Method of Image Contents to Analyze Similarity.
영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법에 있어서,
영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 상기 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 상기 클립에 대응하는 클립 텍스트를 추출하는 단계;
상기 영상 콘텐츠 텍스트를 이용하여 상기 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 상기 영상 콘텐츠 주제 및 상기 클립 텍스트를 이용하여 상기 추출된 클립에 대한 클립 주제를 생성하고, 상기 클립 주제와 연관된 단어의 가중치 및 클립 주제의 가중치에 기반하여, 상기 클립에 대한 클립 키워드를 생성하는 단계; 및
상기 클립 주제와 상기 클립 키워드를 이용하여, 동일하거나 유의한 단어 및 클립 키워드가 있는 경우 상기 단어 간의 거리 및 상기 클립 키워드 간의 거리를 연산하여 클립의 유사도를 분석하는 단계
를 포함하는 영상 콘텐츠의 클립 연결 방법.
A clip connection method of video content performed by a clip connection device of video content,
Extracting at least one clip having a preset length from the image content and extracting clip text corresponding to the clip from the image content text corresponding to the image content;
Generating a video content theme for the video content using the video content text, generating a clip theme for the extracted clip using the video content theme and the clip text, And generating a clip keyword for the clip based on the weight of the clip subject; And
Analyzing the similarity degree of the clip by calculating the distance between the words and the distance between the clip keywords when there is the same or a meaningful word and clip keyword using the clip topic and the clip keyword;
And a clipping means for clipping the clips.
제8항에 있어서,
상기 클립 주제의 분포는 클립 주제의 식별자 및 클립 주제의 가중치에 대한 세트를 포함하고, 상기 클립 키워드의 분포는 클립 키워드, 클립 키워드의 가중치 및 클립 키워드의 개체명의 세트를 포함하는 영상 콘텐츠의 클립 연결 방법.
9. The method of claim 8,
Wherein the distribution of the clip topics includes a set of identifiers of clip subjects and weights of clip subjects, and the distribution of the clip keywords includes a clip keyword, a weight of clip keywords, and a clip connection Way.
영상 콘텐츠의 클립 연결 장치가 수행하는 영상 콘텐츠의 클립 연결 방법에 있어서,
영상 콘텐츠로부터 추출된 클립에 태깅된 클립 주제 및 클립 키워드를 식별하는 단계;
상기 클립 주제 및 상기 클립 키워드를 이용하여, 클립 주제에 포함된 단어의 역인덱스 및 클립 키워드에 관한 역인덱스를 생성하는 단계;
다른 영상 콘텐츠에서 생성된 단어의 역인덱스 및 클립 키워드에 관한 역인덱스를 이용하여, 클립 간의 유사도를 결정하는 단계
를 포함하는 영상 콘텐츠의 클립 연결 방법.
A clip connection method of video content performed by a clip connection device of video content,
Identifying clip topics and clip keywords tagged in clips extracted from image content;
Generating an inverse index related to a clip keyword and a reverse index of a word included in the clip topic using the clip topic and the clip keyword;
Determining a degree of similarity between clips using an inverse index of a word generated in another image content and an inverse index of a clip keyword
And a clipping means for clipping the clips.
영상 콘텐츠의 클립 연결 장치에 있어서,
상기 영상 콘텐츠의 클립 연결 장치는 프로세서를 포함하고,
상기 프로세서는,
영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 상기 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 상기 클립에 대응하는 클립 텍스트를 추출하고,
상기 영상 콘텐츠 텍스트를 이용하여 상기 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 상기 영상 콘텐츠 주제 및 상기 클립 텍스트를 이용하여 상기 추출된 클립에 대한 클립 주제를 생성하고,
상기 클립 주제를 표현하는 단어에 관한 역인덱스를 생성하고, 상기 클립과 다른 클립간의 동일하거나 유의한 단어가 있는 경우 상기 단어들 간의 거리를 연산하여 클립 주제의 유사도를 분석하는 영상 콘텐츠의 클립 연결 장치.
A clip connection device for video content,
Wherein the clip connection device of the image content comprises a processor,
The processor comprising:
Extracting at least one clip having a predetermined length from the image content, extracting clip text corresponding to the clip from the image content text corresponding to the image content,
Generating an image content theme for the image content using the image content text, generating a clip theme for the extracted clip using the image content theme and the clip text,
A clip linking unit for linking an image content to an image content to generate an inverse index related to a word representing the clip theme and analyzing the similarity of the clip theme by calculating a distance between the clip and another clip, .
제11항에 있어서,
상기 클립 주제의 분포는 클립 주제의 식별자 및 클립 주제의 가중치에 대한 세트를 포함하고,
상기 클립 주제는 단어, 단어의 가중치 및 단어의 개체명에 대한 세트를 포함하는 영상 콘텐츠의 클립 연결 장치.
12. The method of claim 11,
Wherein the distribution of the clip subject includes a set of weights of the clip subject and an identifier of the clip subject,
Wherein the clip subject comprises a set of words, word weights, and object names of words.
제12항에 있어서,
상기 프로세서는,
상기 클립 주제의 유사도를 분석하기 위해 상기 단어들 간의 거리를 연산할 때 상기 단어의 개체명의 동일성을 고려하는 영상 콘텐츠의 클립 연결 장치.
13. The method of claim 12,
The processor comprising:
And when the distance between the words is calculated in order to analyze the similarity of the clip subject, consideration is given to the identity of the entity name of the word.
제13항에 있어서,
상기 프로세서는,
상기 단어와 상기 단어의 개체명을 이용하여 클립 주제의 유사도를 분석할 때, 상기 단어의 가중치 및 클립 주제의 가중치를 고려함으로써 동일하거나 유의한 단어 또는 단어의 개체명을 포함하는 클립 간의 클립 주제의 유사도를 분석하는 영상 콘텐츠의 클립 연결 장치.
14. The method of claim 13,
The processor comprising:
When analyzing the similarity of the clip subject by using the word and the object name of the word, considering the weight of the word and the weight of the clip subject, Clip connection device for video content analyzing similarity.
영상 콘텐츠의 클립 연결 장치에 있어서,
상기 영상 콘텐츠의 클립 연결 장치는 프로세서를 포함하고,
상기 프로세서는,
영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 상기 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 상기 클립에 대응하는 클립 텍스트를 추출하고,
상기 영상 콘텐츠 텍스트를 이용하여 상기 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 상기 영상 콘텐츠 주제 및 상기 클립 텍스트를 이용하여 상기 추출된 클립에 대한 클립 주제를 생성하고,
상기 클립 주제와 연관된 단어의 가중치 및 클립 주제의 가중치에 기반하여, 상기 클립에 대한 클립 키워드를 생성하고,
상기 클립 키워드에 관한 역인덱스를 생성하고, 상기 클립과 다른 클립간의 동일하거나 유의한 클립 키워드가 있는 경우 상기 클립 키워드들 간의 거리를 연산하여 클립 키워드의 유사도를 분석하는 영상 콘텐츠 클립의 연결 장치.
A clip connection device for video content,
Wherein the clip connection device of the image content comprises a processor,
The processor comprising:
Extracting at least one clip having a predetermined length from the image content, extracting clip text corresponding to the clip from the image content text corresponding to the image content,
Generating an image content theme for the image content using the image content text, generating a clip theme for the extracted clip using the image content theme and the clip text,
Generating a clip keyword for the clip based on a weight of a word associated with the clip subject and a weight of a clip subject,
And generating an inverse index related to the clip keyword and calculating a distance between the clip keywords if there is the same or a significant clip keyword between the clip and another clip to analyze the similarity of the clip keyword.
제15항에 있어서,
상기 클립 키워드의 분포는 클립 키워드, 클립 키워드의 가중치 및 클립 키워드의 개체명의 세트를 포함하고,
상기 클립 키워드의 유사도를 분석하는 단계는, 상기 클립 키워드들 간의 거리를 연산할 때 상기 클립 키워드의 개체명의 동일성을 고려하는 영상 콘텐츠 클립의 연결 장치.
16. The method of claim 15,
Wherein the distribution of the clip keyword includes a clip keyword, a weight of a clip keyword, and a set of object names of a clip keyword,
Wherein the step of analyzing the degree of similarity of the clip keywords considers the identity of an object name of the clip keyword when calculating the distance between the clip keywords.
제16항에 있어서,
상기 프로세서는,
상기 클립 키워드와 상기 클립 키워드의 개체명을 이용하여 클립 키워드의 유사도를 분석할 때, 상기 클립 키워드의 가중치를 고려함으로써 동일하거나 유의한 클립 키워드 또는 클립 키워드의 개체명을 포함하는 클립 간의 클립 키워드의 유사도를 분석하는 영상 콘텐츠의 클립 연결 장치.
17. The method of claim 16,
The processor comprising:
When the similarity degree of the clip keyword is analyzed using the clip keyword and the object name of the clip keyword, the weight of the clip keyword is taken into consideration, and thereby the same or a significant clip keyword or a clip keyword among the clips including the object name of the clip keyword Clip connection device for video content analyzing similarity.
영상 콘텐츠의 클립 연결 장치에 있어서,
상기 영상 콘텐츠의 클립 연결 장치는 프로세서를 포함하고,
상기 프로세서는,
영상 콘텐츠로부터 미리 설정된 길이의 하나 이상의 클립을 추출하고, 상기 영상 콘텐츠에 대응하는 영상 콘텐츠 텍스트에서 상기 클립에 대응하는 클립 텍스트를 추출하고,
상기 영상 콘텐츠 텍스트를 이용하여 상기 영상 콘텐츠에 대한 영상 콘텐츠 주제를 생성하고, 상기 영상 콘텐츠 주제 및 상기 클립 텍스트를 이용하여 상기 추출된 클립에 대한 클립 주제를 생성하고, 상기 클립 주제와 연관된 단어의 가중치 및 클립 주제의 가중치에 기반하여, 상기 클립에 대한 클립 키워드를 생성하고,
상기 클립 주제와 상기 클립 키워드를 이용하여, 동일하거나 유의한 단어 및 클립 키워드가 있는 경우 상기 단어 간의 거리 및 상기 클립 키워드 간의 거리를 연산하여 클립의 유사도를 분석하는 영상 콘텐츠의 클립 연결 장치.
A clip connection device for video content,
Wherein the clip connection device of the image content comprises a processor,
The processor comprising:
Extracting at least one clip having a predetermined length from the image content, extracting clip text corresponding to the clip from the image content text corresponding to the image content,
Generating a video content theme for the video content using the video content text, generating a clip theme for the extracted clip using the video content theme and the clip text, And generating a clip keyword for the clip based on the weight of the clip subject,
Wherein the similarity of the clip is analyzed by calculating the distance between the words and the distance between the clips when the same keyword or the same word and the clip keyword exist using the clip subject and the clip keyword.
제18항에 있어서,
상기 클립 주제의 분포는 클립 주제의 식별자 및 클립 주제의 가중치에 대한 세트를 포함하고, 상기 클립 키워드의 분포는 클립 키워드, 클립 키워드의 가중치 및 클립 키워드의 개체명의 세트를 포함하는 영상 콘텐츠의 클립 연결 장치.
19. The method of claim 18,
Wherein the distribution of the clip topics includes a set of identifiers of clip subjects and weights of clip subjects, and the distribution of the clip keywords includes a clip keyword, a weight of clip keywords, and a clip connection Device.
영상 콘텐츠의 클립 연결 장치에 있어서,
상기 영상 콘텐츠의 클립 연결 장치는 프로세서를 포함하고,
상기 프로세서는,
영상 콘텐츠로부터 추출된 클립에 태깅된 클립 주제 및 클립 키워드를 식별하고,
상기 클립 주제 및 상기 클립 키워드를 이용하여, 클립 주제에 포함된 단어의 역인덱스 및 클립 키워드에 관한 역인덱스를 생성하고,
다른 영상 콘텐츠에서 생성된 단어의 역인덱스 및 클립 키워드에 관한 역인덱스를 이용하여, 클립 간의 유사도를 결정하는 영상 콘텐츠의 클립 연결 장치.
A clip connection device for video content,
Wherein the clip connection device of the image content comprises a processor,
The processor comprising:
Identifying clip topics and clip keywords tagged in clips extracted from image content,
Generating an inverse index related to a clip keyword and a reverse index of a word included in the clip topic using the clip topic and the clip keyword,
Wherein the similarity between the clips is determined using an inverse index of a word generated in another image content and an inverse index related to the clip keyword.
KR1020180019737A 2017-11-29 2018-02-20 Apparatus and method for clip connection of image contents by similarity analysis between clips KR20190063352A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020170161600 2017-11-29
KR20170161600 2017-11-29

Publications (1)

Publication Number Publication Date
KR20190063352A true KR20190063352A (en) 2019-06-07

Family

ID=66850320

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180019737A KR20190063352A (en) 2017-11-29 2018-02-20 Apparatus and method for clip connection of image contents by similarity analysis between clips

Country Status (1)

Country Link
KR (1) KR20190063352A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021242771A1 (en) * 2020-05-28 2021-12-02 Snap Inc. Client application content classification and discovery
CN115022672A (en) * 2022-04-22 2022-09-06 吉林云帆智能工程有限公司 Calculation method for remote video traffic fusion load
KR102521903B1 (en) * 2022-11-28 2023-04-17 (주)비디오몬스터 System and method for automatic video editing using auto labeling
KR102521904B1 (en) * 2022-11-28 2023-04-17 (주)비디오몬스터 System and method for automatic video editing using utilization of auto labeling and insertion of design elements
KR102521905B1 (en) * 2022-11-28 2023-04-17 (주)비디오몬스터 System and method for providing automatic video editing and map service synchronized with the edited video
KR102523438B1 (en) * 2022-11-29 2023-04-19 (주)비디오몬스터 System and method for automatic video editing using utilization of auto labeling and insertion of design elements

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021242771A1 (en) * 2020-05-28 2021-12-02 Snap Inc. Client application content classification and discovery
US11574005B2 (en) 2020-05-28 2023-02-07 Snap Inc. Client application content classification and discovery
CN115022672A (en) * 2022-04-22 2022-09-06 吉林云帆智能工程有限公司 Calculation method for remote video traffic fusion load
KR102521903B1 (en) * 2022-11-28 2023-04-17 (주)비디오몬스터 System and method for automatic video editing using auto labeling
KR102521904B1 (en) * 2022-11-28 2023-04-17 (주)비디오몬스터 System and method for automatic video editing using utilization of auto labeling and insertion of design elements
KR102521905B1 (en) * 2022-11-28 2023-04-17 (주)비디오몬스터 System and method for providing automatic video editing and map service synchronized with the edited video
KR102523438B1 (en) * 2022-11-29 2023-04-19 (주)비디오몬스터 System and method for automatic video editing using utilization of auto labeling and insertion of design elements

Similar Documents

Publication Publication Date Title
CN108009293B (en) Video tag generation method and device, computer equipment and storage medium
KR101994592B1 (en) AUTOMATIC VIDEO CONTENT Metadata Creation METHOD AND SYSTEM
KR20190063352A (en) Apparatus and method for clip connection of image contents by similarity analysis between clips
CN110582025B (en) Method and apparatus for processing video
US9438850B2 (en) Determining importance of scenes based upon closed captioning data
CN110008378B (en) Corpus collection method, device, equipment and storage medium based on artificial intelligence
KR20080114786A (en) Method and device for automatic generation of summary of a plurality of images
US11682415B2 (en) Automatic video tagging
KR20060114245A (en) Apparatus and method for detecting advertisment of moving-picture, and compter-readable storage storing compter program controlling the apparatus
Tran et al. Exploiting character networks for movie summarization
CN111935529B (en) Education audio and video resource playing method, equipment and storage medium
US20180352280A1 (en) Apparatus and method for programming advertisement
CN114845149B (en) Video clip method, video recommendation method, device, equipment and medium
CN110019948B (en) Method and apparatus for outputting information
Yang et al. Vidchapters-7m: Video chapters at scale
CN111723235B (en) Music content identification method, device and equipment
KR20200098381A (en) methods and apparatuses for content retrieval, devices and storage media
KR20200063316A (en) Apparatus for searching video based on script and method for the same
CN109670080A (en) A kind of determination method, apparatus, equipment and the storage medium of video display label
US20140307968A1 (en) Method and apparatus for automatic genre identification and classification
US10372742B2 (en) Apparatus and method for tagging topic to content
KR102411095B1 (en) System and method for searching contents in accordance with advertisements
CN112804580B (en) Video dotting method and device
Do et al. Movie indexing and summarization using social network techniques
CN113609315A (en) Method and device for judging similarity of media assets, electronic equipment and storage medium