KR101029437B1 - Method and System for Detecting Duplicate Moving Picture Files - Google Patents

Method and System for Detecting Duplicate Moving Picture Files Download PDF

Info

Publication number
KR101029437B1
KR101029437B1 KR1020090027994A KR20090027994A KR101029437B1 KR 101029437 B1 KR101029437 B1 KR 101029437B1 KR 1020090027994 A KR1020090027994 A KR 1020090027994A KR 20090027994 A KR20090027994 A KR 20090027994A KR 101029437 B1 KR101029437 B1 KR 101029437B1
Authority
KR
South Korea
Prior art keywords
key frame
video
value
calculated
frame
Prior art date
Application number
KR1020090027994A
Other languages
Korean (ko)
Other versions
KR20100109640A (en
Inventor
박근한
김두호
김지승
이상호
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020090027994A priority Critical patent/KR101029437B1/en
Priority to JP2010069168A priority patent/JP5584499B2/en
Publication of KR20100109640A publication Critical patent/KR20100109640A/en
Application granted granted Critical
Publication of KR101029437B1 publication Critical patent/KR101029437B1/en

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Abstract

동영상 자체의 내용을 분석함으로써 중복을 검출할 수 있는 본 발명의 일 측면에 따른 동영상 중복 검출 방법은 동영상 별로 적어도 하나의 키 프레임을 검출하는 단계; 상기 검출된 적어도 하나의 키 프레임의 영역별 휘도 값을 이용하여 상기 적어도 하나의 키 프레임의 특징값을 산출하는 단계; 상기 산출된 적어도 하나의 키 프레임의 특징값을 이용하여 상기 동영상 별로 전체 특징값을 산출하는 단계; 및 상기 산출된 전체 특징값의 비교를 통하여 상기 동영상이 전체적으로 중복되는지 여부를 판단하는 단계를 포함한다.Video duplication detection method according to an aspect of the present invention that can detect the duplication by analyzing the content of the video itself comprises the steps of detecting at least one key frame for each video; Calculating a feature value of the at least one key frame using the detected luminance value of each region of the at least one key frame; Calculating an entire feature value for each video by using the calculated feature values of the at least one key frame; And determining whether the video is entirely overlapped by comparing the calculated total feature values.

동영상, 중복, 검출, 특징값 Video, duplicate, detection, feature value

Description

동영상 중복 검출 방법 및 시스템{Method and System for Detecting Duplicate Moving Picture Files}Method and system for detecting video duplication {Method and System for Detecting Duplicate Moving Picture Files}

본 발명은 동영상 중복 검출에 관한 것으로, 보다 상세하게는 내용이 동일한 동영상을 검출할 수 있는 동영상 검출 방법 및 시스템에 관한 것이다.The present invention relates to video overlap detection, and more particularly, to a video detection method and system capable of detecting a video having the same content.

최근 들어, 디지털 카메라/캠코더, 카메라 휴대폰, 휴대용 동영상 재생기(PMP, MP4P 등) 등의 발달로 동영상 콘텐츠의 제작과 활용이 용이해졌다. 또한, UCC(User Created Contents) 서비스의 급속한 확산으로 사용자에 의해 생산된 디지털 동영상 파일이 UCC 전문 사이트나 P2P(Peer to Peer) 방식의 파일 공유 사이트, 개인 블로그나 미니 홈페이지 등을 통해 업로드되고 있다. 이렇게 업로드된 동영상 파일은 인터넷을 통한 다운로드 또는 스트리밍 서비스에 의해 다른 사용자들에 공유된다.Recently, with the development of digital cameras / camcorders, camera mobile phones, and portable video players (PMP, MP4P, etc.), the production and utilization of video contents has become easier. In addition, due to the rapid proliferation of UCC (User Created Contents) services, digital video files produced by users are uploaded through UCC specialized sites, P2P (peer to peer) file sharing sites, personal blogs or mini homepages. The uploaded video file is shared with other users by downloading or streaming service through the Internet.

디지털 동영상은 텍스트 기반의 콘텐츠에 비해 파일 용량이 상당히 크다. 따라서, 동영상 콘텐츠의 생산자나 사용자, 그리고 UCC 서비스 등의 제공을 위해 사용자 제작 중심의 동영상 콘텐츠를 대량으로 데이터베이스화해야 하는 사업자 입장에서는 스토리지(Storage)의 효율적 관리가 매우 중요하다.Digital video has a much larger file size than text-based content. Therefore, efficient management of storage is very important for a producer or user of video content and a business that needs to mass-produce user-oriented video content in order to provide a UCC service.

스토리지의 효율적 관리를 위해서는 내용이 동일한 동영상 파일의 중복 기록을 방지해야 한다. 내용이 동일한 동영상 파일이 중복 기록되면 스토리지의 자원이 낭비되기 때문이다. 기존의 동영상 중복 기록을 방지하기 위해 중복된 동영상 검출은 동영상과 관련된 텍스트 분석, 재생시간 분석, 출처 분석 들을 통하여 그 관련성을 파악하였다. 그러나, 동영상의 종류가 다양해지고 또한 사용자들이 의도적으로 동영상들을 조금씩 변화시키고 있으므로 이를 간단한 방법으로 검출하기란 거의 불가능하다. 이에 동영상 자체의 내용을 분석함으로써 동영상의 중복을 검출할 수 있는 방법에 대한 개발이 필요하게 되었다.For efficient storage management, duplicate recording of video files with the same contents should be prevented. This is because storage of resources is wasted when video files having the same contents are duplicated and recorded. In order to prevent the existing video recording, duplicate video detection was analyzed through text analysis, playback time analysis, and source analysis related to video. However, since the types of videos are diversified and users are intentionally changing the videos little by little, it is almost impossible to detect them in a simple manner. Therefore, it is necessary to develop a method for detecting duplication of video by analyzing the contents of the video itself.

본 발명은 상술한 문제점을 해결하기 위한 것으로서, 동영상 자체의 내용을 분석함으로써 동영상 중복을 검출할 수 있는 동영상 중복 검출 방법 및 시스템을 제공하는 것을 기술적 과제로 한다.SUMMARY OF THE INVENTION The present invention has been made in view of the above-described problems, and it is a technical object of the present invention to provide a video overlap detection method and system capable of detecting video duplication by analyzing the content of the video itself.

또한, 본 발명은 두 단계의 동영상 중복 여부를 판단함으로써 보다 정확하게 동영상 중복을 검출할 수 있는 동영상 중복 검출 방법 및 시스템을 제공하는 것을 기술적 과제로 한다.Another object of the present invention is to provide a video duplication detection method and system that can more accurately detect video duplication by determining whether two videos overlap.

상술한 목적을 달성하기 위한 본 발명의 일 측면에 따른 동영상 중복 검출 방법은 동영상 별로 적어도 하나의 키 프레임을 검출하는 단계; 상기 검출된 적어도 하나의 키 프레임의 영역별 휘도 값을 이용하여 상기 적어도 하나의 키 프레임의 특징값을 산출하는 단계; 상기 산출된 적어도 하나의 키 프레임의 특징값을 이용하여 상기 동영상 별로 전체 특징값을 산출하는 단계; 및 상기 산출된 전체 특징값의 비교를 통하여 상기 동영상이 전체적으로 중복되는지 여부를 판단하는 단계를 포함한다.According to an aspect of the present invention, there is provided a method for detecting a video overlap, including detecting at least one key frame for each video; Calculating a feature value of the at least one key frame using the detected luminance value of each region of the at least one key frame; Calculating an entire feature value for each video by using the calculated feature values of the at least one key frame; And determining whether the video is entirely overlapped by comparing the calculated total feature values.

이 때, 본 발명의 일 실시예에 따른 동영상 중복 검출 방법은 상기 키 프레임을 검출하는 단계에서, 상기 적어도 하나의 키 프레임이 검출되지 않은 경우, 기준 시간 마다 키 프레임을 추가하는 단계를 포함하는 것을 특징으로 한다.At this time, the video overlap detection method according to an embodiment of the present invention includes the step of adding a key frame every reference time, when the at least one key frame is not detected in the step of detecting the key frame. It features.

또한, 본 발명의 일 실시예에 따른 동영상 중복 검출 방법은 상기 적어도 하 나의 키 프레임을 검출하는 단계에서, 컷 디텍션을 이용하여 상기 적어도 하나의 키 프레임을 검출하는 것을 특징으로 한다.In addition, the video overlap detection method according to an embodiment of the present invention, in the step of detecting the at least one key frame, characterized in that for detecting the at least one key frame using the cut detection.

그리고, 본 발명의 일 실시예에 따른 동영상 중복 검출 방법은 상기 적어도 하나의 키 프레임을 검출하는 단계에서, 그레이 히스토그램의 차이값을 이용하여 상기 적어도 하나의 키 프레임을 검출하는 것을 특징으로 하며, 상기 적어도 하나의 키 프레임은 상기 그레이 히스토그램의 차이값이 기준치 이상인 것을 특징으로 한다.In the video overlap detection method according to an embodiment of the present invention, in the detecting of the at least one key frame, the at least one key frame is detected using a difference value of a gray histogram. At least one key frame is characterized in that the difference value of the gray histogram is greater than the reference value.

한편, 상기 키 프레임을 검출하는 단계 이전에, 상기 동영상을 디코딩하는 단계를 더 포함하는 것을 특징으로 한다.Meanwhile, before the detecting of the key frame, the method may further include decoding the video.

일 실시예에 있어서, 상기 적어도 하나의 키 프레임은 아이 프레임인 것을 특징으로 하는 동영상 중복 검출 방법.The method of claim 1, wherein the at least one key frame is an eye frame.

또한, 본 발명의 일 실시예에 따른 동영상 중복 검출 방법은 상기 적어도 하나의 키 프레임의 특징값을 산출하는 단계에서, 주성분 분석법(Principal Component Analysis:PCA)에 의해 상기 적어도 하나의 키 프레임의 영역별 휘도 값의 일부로부터 상기 적어도 하나의 키 프레임의 특징값을 산출하는 것을 특징으로 한다.Also, in the method for detecting duplicate video according to an embodiment of the present invention, in the step of calculating a feature value of the at least one key frame, each region of the at least one key frame is determined by a principal component analysis (PCA). The characteristic value of the at least one key frame is calculated from a part of the luminance value.

이 때, 본 발명의 일 실시예에 따른 동영상 중복 검출 방법은 상기 동영상이 전체적으로 중복되지 않은 경우, 상기 산출된 적어도 하나의 키 프레임의 특징값에 대한 시퀀스를 생성하는 단계; 및 상기 생성된 시퀀스의 스트링 매칭을 통하여 상기 동영상이 부분적으로 중복되는지 여부를 판단하는 단계를 더 포함하는 것을 특 징으로 한다.At this time, the video overlap detection method according to an embodiment of the present invention, if the video is not overlapping as a whole, generating a sequence for the feature value of the calculated at least one key frame; And determining whether the video is partially overlapped through string matching of the generated sequence.

또한, 본 발명의 일 실시예에 따른 동영상 중복 검출 방법은 상기 시퀀스를 생성하는 단계에서, 상기 산출된 적어도 하나의 키 프레임의 특징값의 기준 크기를 이용하여 상기 시퀀스를 생성하는 것을 특징으로 한다.In addition, the video overlap detection method according to an embodiment of the present invention, in the step of generating the sequence, characterized in that for generating the sequence using the reference size of the calculated feature value of the at least one key frame.

또한, 상술한 목적을 달성하기 위한 본 발명의 일 측면에 따른 동영상 중복 검출 방법은 동영상 별로 적어도 하나의 키 프레임을 검출하는 단계; 상기 검출된 적어도 하나의 키 프레임의 특징값을 산출하는 단계; 상기 산출된 적어도 하나의 키 프레임의 특징값에 대한 시퀀스를 생성하는 단계; 및 상기 생성된 시퀀스의 스트링 매칭을 통하여 상기 동영상이 부분적으로 중복되는지 여부를 판단하는 단계를 포함한다.In addition, the video overlap detection method according to an aspect of the present invention for achieving the above object comprises the steps of detecting at least one key frame for each video; Calculating a feature value of the detected at least one key frame; Generating a sequence of feature values of the at least one key frame; And determining whether the video is partially overlapped through string matching of the generated sequence.

그리고, 본 발명의 일 실시예에 따른 동영상 중복 검출 방법은 상기 적어도 하나의 키 프레임의 특징값을 산출하는 단계에서, 상기 검출된 적어도 하나의 키 프레임의 영역별 휘도 값의 평균값을 이용하여 상기 적어도 하나의 키 프레임의 특징값을 산출하는 것을 특징으로 한다.In the video overlap detection method according to an embodiment of the present invention, in the calculating of a feature value of the at least one key frame, the at least one key frame may be generated using an average value of luminance values of regions of the at least one key frame. A feature value of one key frame is calculated.

상술한 목적을 달성하기 위한 본 발명의 다른 측면에 따른 동영상 중복 검출 시스템은 동영상 별로 적어도 하나의 키 프레임을 검출하는 키 프레임 검출부; 상기 검출된 적어도 하나의 키 프레임의 영역별 휘도 값을 이용하여 상기 적어도 하나의 키 프레임의 특징값을 산출하는 프레임 특징값 산출부; 상기 산출된 적어도 하나의 키 프레임의 특징값을 이용하여 상기 동영상 별로 전체 특징값을 산출하는 전체 특징값 산출부; 및 상기 산출된 전체 특징값의 비교를 통하여 상기 동영상이 전체적으로 중복되는지 여부를 판단하는 전체 중복 판단부를 포함한다.According to another aspect of the present invention, there is provided a video overlapping detection system, including: a key frame detector configured to detect at least one key frame for each video; A frame feature value calculator configured to calculate a feature value of the at least one key frame by using the detected luminance value of each region of the at least one key frame; An overall feature value calculator configured to calculate an overall feature value for each video using the calculated feature values of at least one key frame; And a total overlap determination unit that determines whether the video is overlapped as a whole by comparing the calculated total feature values.

본 발명에 따르면, 동영상 자체의 내용을 분석함으로써 사용자들이 의도적으로 변형시킨 동영상들의 중복 여부를 검출할 수 있다는 효과가 있다.According to the present invention, by analyzing the contents of the video itself, it is possible to detect whether or not the duplicated video intentionally modified.

또한, 본 발명은 동영상의 전체 중복 여부 및 부분 중복 여부를 두 단계로 나누어서 판단함으로써 보다 정확히 중복을 검출할 수 있다는 효과가 있다.In addition, the present invention has the effect that it is possible to detect the overlap more accurately by determining whether the video overlaps in full and partial overlap in two steps.

이하 첨부된 도면을 참조하여 본 발명의 실시예에 대해 상세히 설명하기로 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 동영상 중복 검출 시스템의 개략적인 블럭도이다. 도시된 바와 같이, 동영상 중복 검출 시스템은 디코딩부(110), 키 프레임 검출부(130), 프레임 특징값 산출부(150), 전체 중복 검출부(170) 및 부분 중복 검출부(190)를 포함한다.1 is a schematic block diagram of a video overlap detection system according to an embodiment of the present invention. As shown, the video overlap detection system includes a decoder 110, a key frame detector 130, a frame feature value calculator 150, a full overlap detector 170, and a partial overlap detector 190.

한편, 본 발명의 일 실시예에 있어서, 동영상을 디코딩하기 전에 동영상의 대부분이 검은색으로 되어 있는 경우에는 비정상 동영상으로 판단하여, 전체 및 부분 중복 여부를 판단하지 않을 수 있다. 예를 들어, 최대 그레이 히스토그램의 빈(bin)이 93%이상일 경우, 해당 동영상은 비정상 동영상으로 분류될 수 있다. 이와 같은 비정상 동영상의 판단은 동영상의 MD5 해쉬값을 이용하여 동영상의 바이트 특성으로부터 비정상 동영상을 검출할 수 있다.On the other hand, in one embodiment of the present invention, if most of the video is black before decoding the video, it is determined as an abnormal video, it may not be determined whether the entire and partial overlap. For example, when a bin of the maximum gray histogram is 93% or more, the video may be classified as an abnormal video. In determining the abnormal video, the abnormal video may be detected from the byte characteristics of the video using the MD5 hash value of the video.

디코딩부(110)는 다양한 형식으로 인코딩된 동영상들을 디코딩한다. 여기서, 본 발명에서 사용되는 동영상들은 FLV, WMV, AVI, MPG, MP4, H.264 등과 같은 다양한 형식을 이용하여 인코딩된 동영상들일 수 있으며, 본 발명은 이에 국한되지 않고 상술한 형식 이외의 다양한 형식으로 인코딩된 동영상들이 사용될 수도 있다.The decoding unit 110 decodes videos encoded in various formats. Here, the videos used in the present invention may be videos encoded using various formats such as FLV, WMV, AVI, MPG, MP4, H.264, and the like, and the present invention is not limited thereto. Encoded videos may also be used.

또한, 본 발명에서 사용되는 동영상들은 상술한 인코딩 방식 이외에도 프레임 레이트(frame rate), 비트 레이트(bit rate), 해상도 등 형식(format)이 다른 동영상들이 사용될 수 있다. 또한, 색상 또는 명암에 차이가 있는 동영상, 로고가 삽입되거나, 텍스트가 오버레이 된 동영상, 다른 내용을 가진 관련 없는 프레임이 추가된 동영상, 동일한 내용으로 동영상의 길이가 다른 동영상 등 내용적으로 다른 동영상들이 사용될 수도 있다. 본 발명의 일 실시예에 따른 동영상 중복 검출 시스템의 디코딩부는 이러한 다양한 형식으로 인코딩된 동영상들을 디코딩하는 역할을 수행한다.In addition to the above-described encoding schemes, the videos used in the present invention may be videos having different formats such as frame rate, bit rate, resolution, and the like. In addition, videos with content that differs in color or contrast, videos with logos, text overlaid, videos with extraneous frames with different content, videos with different lengths of the same content, May be used. The decoding unit of the video duplication detection system according to an embodiment of the present invention serves to decode video encoded in various formats.

한편, 일 실시예에 있어서, 디코딩부(110)는 동영상을 디코딩한 후에 디코딩된 동영상을 미리 정규화(Normalization)할 수 있다. 예를 들어, 동영상의 크기, 프레임 레이트(frame rate) 등을 동일하게 하여 동영상의 변형에 강인하게 만들 수 있다.Meanwhile, in an embodiment, the decoding unit 110 may normalize the decoded video in advance after decoding the video. For example, the size, frame rate, etc. of the video may be the same to make the video robust.

키 프레임 검출부(130)는 동영상 별로 적어도 하나의 키 프레임을 검출한다. 다시 말해, 동영상의 특징을 잘 대표할 수 있는 프레임인 키 프레임을 검출하는 것이다. 예를 들어, 상기 적어도 하나의 키 프레임은 아이(I) 프레임일 수 있다. 아이 프레임이란 MPEG 압축 방법에서 인트라 코딩 블록으로만 구성된 프레임을 의미한다. 따라서, 상기 적어도 하나의 키 프레임이 아이 프레임인 경우에는 인트라 코 딩 블록으로만 구성되어 있기 때문에 동영상의 특징으로 잘 대표할 수 있는 키 프레임이 될 수 있는 것이다.The key frame detector 130 detects at least one key frame for each video. In other words, a key frame, which is a frame that can well represent the characteristics of a video, is detected. For example, the at least one key frame may be an eye frame. An eye frame means a frame composed only of intra coding blocks in the MPEG compression method. Accordingly, when the at least one key frame is an eye frame, the at least one key frame may be a key frame that can be well represented as a feature of a video because it consists only of an intra coding block.

일 실시예에 있어서, 상기 키 프레임 검출부(130)는 적어도 하나의 키 프레임을 컷 디텍션을 이용하여 검출할 수 있다. 여기서, 컷 디텍션 다시 말해, 장면 검출이란 동영상의 여러 프레임들 중 갑자기 변화되는 프레임에 해당하는 장면을 검출하는 것을 의미하는 것으로서, 본 발명의 일 실시예에 따른 동영상 중복 검출 시스템은 키 프레임으로 컷 디텍션에 의해 검출된 프레임을 사용한다.In one embodiment, the key frame detection unit 130 may detect at least one key frame using the cut detection. Here, cut detection, that is, scene detection means detecting a scene corresponding to a suddenly changed frame among several frames of the video, and the video detection system according to an embodiment of the present invention cuts a key frame into a cut detection. Use the frame detected by

다른 실시예에 있어서, 상기 키 프레임 검출부(130)는 적어도 하나의 키 프레임을 그레이 히스토그램의 차이값을 이용하여 검출할 수 있다. 다시 말해, 인접 프레임 간에 흑백 분포도의 차이값을 이용하여 키 프레임을 검출하는 것이다.In another exemplary embodiment, the key frame detector 130 may detect at least one key frame using a difference value of the gray histogram. In other words, the key frame is detected by using a difference value of the black and white distribution between adjacent frames.

그레이 히스토그램이란 해당 이미지를 구성하는 그레이 값의 분포를 벡터 형태로 나타낸 것으로서, 다시 말해 그레이 값의 범위를 128개 또는 64개 등으로 정해 놓고 그 범위에 속하는 픽셀이 전체 이미지에서 차지하는 비율을 벡터값으로 나타낸 것을 의미한다. 예를 들어, 도 2에 도시된 바와 같이, 동영상의 그레이 히스토그램을 나타낼 수 있으며, 상기 키 프레임 검출부(130)는 인접 프레임 간의 그레이 히스토그램의 차이값을 이용하여 키 프레임을 검출할 수 있다. 또한, 도 2에 도시된 그레이 히스토그램은 16개의 그레이 빈을 사용할 수 있으며, 그레이 히스토그램의 차이값의 기준값은 0.15일 수 있다.The gray histogram is a vector form of the distribution of gray values constituting the image. In other words, the gray value is set to 128 or 64 gray values, and the percentage of pixels in the range occupies the entire image as a vector value. It means what is shown. For example, as illustrated in FIG. 2, a gray histogram of a video may be represented, and the key frame detector 130 may detect a key frame using a difference value of gray histograms between adjacent frames. In addition, the gray histogram illustrated in FIG. 2 may use 16 gray bins, and the reference value of the difference value of the gray histogram may be 0.15.

한편, 본 발명의 일 실시예에 따른 적어도 하나의 키 프레임은 상기 그레이 히스토그램의 차이값이 기준치 이상일 수 있다. 다시 말해, 인접 프레임 간에 흑백 분포도의 차이값이 기준치 이상인 프레임을 본 발명에서의 키 프레임으로 검출할 수 있다. 즉, 흑백 분포도의 차이가 임계치 이상으로 큰 경우에는 화면이 갑작스럽게 변화된 것을 의미하므로, 이러한 프레임을 키 프레임으로 검출하는 것이다.Meanwhile, in at least one key frame according to an embodiment of the present invention, a difference value of the gray histogram may be greater than or equal to a reference value. In other words, a frame in which the difference value of the black-and-white distribution map between adjacent frames is more than the reference value can be detected as a key frame in this invention. That is, when the difference in the black and white distribution is larger than the threshold, it means that the screen is changed abruptly, and thus such a frame is detected as a key frame.

또한, 일 실시예에 있어서, 키 프레임 검출부(130)는 컷 디텍션에 의해 키 프레임이 검출되지 않거나, 키 프레임이 단지 하나만 검출된 경우에는 중간에 키 프레임을 임의적으로 추가할 수 있다. 이 때, 임의적으로 추가되는 키 프레임은 기준 시간마다 삽입될 수 있으며, 예를 들어, 컷 디텍션에 의해 키 프레임이 검출되지 않는 경우 5초마다 키 프레임을 강제로 삽입할 수 있다. 이는 키 프레임이 검출되지 않는 경우 각 동영상을 대표할 수 있는 전체 특징값을 산출할 수 없기 때문에, 각 동영상을 대표하는 전체 특징값을 산출하기 위해 키 프레임이 검출되지 않는 경우를 대비하기 위해서이다.In addition, in one embodiment, the key frame detector 130 may arbitrarily add a key frame in the middle when the key frame is not detected by the cut detection or only one key frame is detected. At this time, the arbitrarily added key frame may be inserted every reference time, for example, if the key frame is not detected by the cut detection, the key frame may be forcibly inserted every 5 seconds. This is to prepare for the case where no key frame is detected to calculate the overall feature value that can represent each video when the key frame is not detected.

그리고, 일 실시예에 있어서, 키 프레임 검출부(130)는 플래쉬백(flashback)이 발생할 경우, 키 프레임간의 기준 시간을 정하여 기준 시간보다 작은 시간차이로 플래쉬백이 일어난 경우에는 키 프레임으로 검출하지 않을 수 있다. 예를 들어, 플래쉬백의 최소 시간을 0.2초라고하면, 플래쉬백이 0.2초 이내에 일어난 경우에, 컷 디텍션에 의해 키 프레임이 검출되더라도 이를 키 프레임으로 이용하지 않을 수 있다.In one embodiment, the key frame detection unit 130 may not be detected as a key frame when a flashback occurs with a time difference smaller than the reference time by setting a reference time between key frames when a flashback occurs. have. For example, assuming that the minimum time of the flashback is 0.2 seconds, when the flashback occurs within 0.2 seconds, even if a key frame is detected by the cut detection, it may not be used as the key frame.

프레임 특징값 산출부(150)는 상기 키 프레임 검출부(130)에 의해 검출된 적어도 하나의 키 프레임의 영역별 휘도 값을 이용하여 상기 적어도 하나의 키 프레임의 특징값을 산출한다.The frame feature value calculator 150 calculates a feature value of the at least one key frame by using the luminance value of each region of the at least one key frame detected by the key frame detector 130.

일 실시예에 있어서, 상기 프레임 특징값 산출부(150)는 상기 적어도 하나의 키 프레임의 영역별 휘도 값의 평균값을 이용하여 키 프레임의 특징값을 산출할 수 있다. 예를 들어, 동영상 프레임을 N*N의 블록으로 구분하고, 각 블록의 영역별 휘도 값의 평균값을 이용하여 키 프레임의 특징값을 산출할 수 있다. In an exemplary embodiment, the frame feature value calculator 150 may calculate a feature value of a key frame by using an average value of luminance values of respective regions of the at least one key frame. For example, the video frame may be divided into N * N blocks, and the feature value of the key frame may be calculated by using an average value of luminance values for each area of each block.

일 실시예에 있어서, 상기 프레임 특징값 산출부(150)는 주성분 분석법(Principal Component Analysis:PCA, 이하 'PCA'라 함)에 의해 상기 적어도 하나의 키 프레임의 영역별 휘도 값의 일부로부터 상기 적어도 하나의 키 프레임의 특징값을 산출할 수 있다. 여기서, PCA란 주로 다루기 힘든 고차원의 신호를 낮은 차원으로 줄여 다루기 쉽게 하는 통계적 방법을 의미한다. 다시 말해, PCA는 일반적으로 벡터가 존재하는 경우, 차원을 줄일 경우에 주로 사용되며, 이는 의미있는 중요한 값들이 앞 부분에 주로 위치하고, 중요하지 않은 값들이 뒤에 분포되기 때문이다. 결국, 프레임 내 영역별 휘도 값의 통계치를 구하고 이 값을 PCA를 이용하여 변환한 뒤 주요 값들만을 이용하여 키 프레임의 특징값을 산출하는 것이다.In one embodiment, the frame characteristic value calculator 150 may be configured to generate at least a portion of the luminance value of each region of the at least one key frame by a principal component analysis (PCA). The feature value of one key frame can be calculated. Here, the PCA refers to a statistical method of reducing a high-dimensional signal that is difficult to deal with mainly to a lower level, thereby making it easier to handle. In other words, PCA is commonly used to reduce dimensions when vectors are present, because significant important values are placed first and non-important values are distributed later. As a result, a statistical value of luminance values for each region in the frame is obtained, the value is converted by using the PCA, and the feature value of the key frame is calculated using only the main values.

예를 들어, 도 3에 도시된 바와 같이, 프레임을 N*N의 블록의 개수와 M*M의 블록의 개수의 합인 (N*N+M*M)개의 블록들의 영역별 휘도 값의 평균 값을 이용하여, 프레임의 특징값을 산출할 수 있으며, PCA를 이용하여 차원을 줄일 수 있다. 도 3에서는 PCA를 이용하여 차원을 줄임으로써 프레임의 특징값을 산출하기 위해 기준 비트 수를 사용하고 있으며, 기준 비트 수 각각에 해당하는 값에 대하여 임계치(threshold)가 "0"인 것을 기준으로, "0"보다 큰 값은 "1"로 "0"보다 작은 값은 "0"으로 해당 값을 양자화(Quantize)하는 것을 알 수 있다.For example, as shown in FIG. 3, an average value of luminance values of regions of (N * N + M * M) blocks, which is a sum of the number of blocks of N * N and the number of blocks of M * M, is calculated. By using, the feature value of the frame can be calculated, and the dimension can be reduced by using the PCA. In FIG. 3, the number of reference bits is used to calculate a feature value of a frame by reducing the dimension by using the PCA. Based on the threshold value "0" for each value corresponding to the reference number of bits, It can be seen that the value greater than "0" is "1" and the value smaller than "0" is "0" to quantize the value.

전체 중복 검출부(170)는 상기 프레임 특징값 산출부(150)에 의해 산출된 특징값을 이용하여 동영상이 전체적으로 중복되는지 여부를 판단하는 것으로서, 도 4에 도시된 바와 같이, 전체 특징값 산출부(172) 및 전체 중복 판단부(174)를 포함한다. The total overlap detection unit 170 determines whether the video is overlapped as a whole by using the feature values calculated by the frame feature value calculator 150. As shown in FIG. 172 and the total overlap determination unit 174.

전체 특징값 산출부(172)는 상기 프레임 특징값 산출부(150)에 의해 산출된 적어도 하나의 키 프레임의 특징값을 이용하여 상기 동영상 별로 전체 특징값을 산출한다. 예를 들어, 전체 특징값 산출부(172)는 도 3에 도시된 바와 같이, (N*N+M*M)개 블록의 영역별 휘도 값을 이용하여 산출된 키 프레임의 특징값의 평균값을 구하여 동영상 별로 동영상 전체의 특징을 대표하는 전체 특징값(global signature)을 산출할 수 있다. 다시 말해, 컷 디텍션에 의해 동영상의 키 프레임이 100개 검출되었다면, 100개의 키 프레임의 특징값이 산출될 수 있으며, 전체 특징값은 이 100개의 키 프레임의 특징값의 평균값으로, 동영상 별로 동영상을 대표하는 하나의 값으로 존재할 수 있다.The global feature value calculator 172 calculates the global feature value for each video by using the feature values of at least one key frame calculated by the frame feature value calculator 150. For example, as shown in FIG. 3, the entire feature value calculator 172 calculates an average value of feature values of a key frame calculated using luminance values for respective regions of (N * N + M * M) blocks. A global signature representing a feature of the entire video may be calculated for each video. In other words, if 100 key frames of the video are detected by the cut detection, the feature values of 100 key frames may be calculated, and the total feature values are average values of the feature values of the 100 key frames. It can exist as one value that represents.

전체 중복 판단부(174)는 상기 전제 특징값 산출부(172)에 의해 산출된 전체 특징값의 비교를 통하여 상기 동영상이 전체적으로 중복되는지 여부를 판단한다. 다시 말해, 전체 특징값 산출부(172)에 의해 동영상 별로 전체 특징을 대표하는 전체 특징값을 비교하여 각 동영상이 전체적으로 중복되는지 여부를 판단하는 것이다.The total overlap determination unit 174 determines whether the video is overlapped entirely by comparing the total feature values calculated by the preliminary feature value calculator 172. In other words, the overall feature value calculator 172 compares the feature values representing the feature for each video to determine whether each video is overlapped.

한편, 도 7에 도시된 바와 같이, 동영상이 전체적으로 중복되는 경우의 예를 살펴 보면, 도 7의 (a)와 같이 동영상이 전체적으로 동일하여 중복되는 경우가 발 생할 수 있다. 이 경우에는 동영상의 크기, 형식, 프레임 레이트(frame rate) 등이 동일할 수 있다.On the other hand, as shown in Figure 7, looking at an example in which the video overlaps as a whole, as shown in Figure 7 (a) may occur when the video is the same as the entire overlap. In this case, the size, format, frame rate, etc. of the video may be the same.

다시 도 1을 참조하면, 부분 중복 검출부(190)는 상기 전체 중복 검출부(170)에 의해 상기 동영상이 전체적으로 중복되지 않은 것으로 판단된 경우, 상기 프레임 특징값 산출부(150)에 의해 산출된 특징값을 이용하여 동영상이 부분적으로 중복되는지 여부를 판단하는 것으로서, 도 5에 도시된 바와 같이, 시퀀스 생성부(192) 및 부분 중복 판단부(194)를 포함한다.Referring to FIG. 1 again, the partial overlap detector 190 determines the feature value calculated by the frame feature value calculator 150 when it is determined that the video is not overlapped by the entire overlap detector 170. Determining whether or not the video is partially overlapped using, as illustrated in FIG. 5, includes a sequence generator 192 and a partial overlap determiner 194.

시퀀스 생성부(192)는 상기 프레임 특징값 산출부(150)에 의해 산출된 적어도 하나의 키 프레임의 특징값에 대한 시퀀스를 생성한다. The sequence generator 192 generates a sequence of feature values of at least one key frame calculated by the frame feature value calculator 150.

다시 말해, 시퀀스 생성부(192)는 동영상 별로 키 프레임의 특징값에 대한 시퀀스를 생성하고, 후술할 부분 중복 판단부(194)는 시퀀스 생성부(192)에 의해 생성된 키 프레임의 특징값의 시퀀스를 각각 비교하여 동영상이 부분적으로 중복되는지 여부를 판단한다.In other words, the sequence generator 192 generates a sequence for the feature value of the key frame for each video, and the partial overlap determination unit 194, which will be described later, is used to determine the feature value of the key frame generated by the sequence generator 192. The sequence is compared with each other to determine whether the video is partially overlapped.

일 실시예에 있어서, 상기 시퀀스 생성부(192)는 상기 산출된 적어도 하나의 키 프레임의 특징값의 기준 크기를 이용하여 상기 시퀀스를 생성할 수 있다. 예를 들어, 동영상의 키 프레임의 특징값의 앞자리 5바이트(bytes)를 이용하여 키 프레임의 특징값에 대한 시퀀스를 생성할 수 있다. 여기서, 상기 시퀀스 생성부(192)는 키 프레임이 기준 개수 이상인 경우에만 키 프레임의 시퀀스를 생성할 수 있으며, 예를 들어, 키 프레임이 10개 이상 검출된 경우에만 키 프레임의 시퀀스를 생성할 수 있다.In one embodiment, the sequence generator 192 may generate the sequence using the reference size of the calculated feature value of at least one key frame. For example, a sequence for the feature value of the key frame may be generated by using five digits of the first digit of the feature value of the key frame of the video. Here, the sequence generator 192 may generate a sequence of key frames only when the number of key frames is greater than or equal to a reference number. For example, the sequence generator 192 may generate a sequence of key frames only when 10 or more key frames are detected. have.

부분 중복 판단부(194)는 상기 시퀀스 생성부(192)에 의해 생성된 시퀀스의 스트링 매칭을 통하여 상기 동영상이 부분적으로 중복되는지 여부를 판단한다.The partial overlap determination unit 194 determines whether the video is partially overlapped through string matching of the sequence generated by the sequence generator 192.

예를 들어, 도 6에 도시된 바와 같이, "A, B, F"시퀀스로 이루어진 동영상과 "A, B, C, E"로 이루어진 동영상은 시퀀스의 스트링 매칭을 통하여"A, B"와 같이 시퀀스가 부분적으로 동일하므로 두 동영상이 부분적으로 중복되는 것을 알 수 있다. 또한 "D, C, E"시퀀스로 이루어진 동영상과 "A, B, C, E"시퀀스로 이루어진 동영상은 "C, E"와 같이 동일한 시퀀스가 존재하므로 두 동영상이 부분적으로 중복되는 것을 알 수 있다.For example, as shown in FIG. 6, a video consisting of an "A, B, F" sequence and a video consisting of "A, B, C, E" are shown as "A, B" through string matching of the sequence. Since the sequences are partially identical, it can be seen that the two videos are partially overlapped. In addition, the video consisting of the sequence "D, C, E" and the video consisting of the sequence "A, B, C, E" have the same sequence as "C, E", so the two videos are partially overlapped. .

한편, 도 7에 도시된 바와 같이, 동영상이 부분적으로 중복되는 경우의 예를 살펴 보면, 도 7의 (b)와 (c)의 경우처럼 동영상이 부분적으로 중복될 수 있으며, 이 경우 도 7의 (b)의 경우처럼 한 동영상의 전체가 다른 동영상의 일부분과 완전히 중복되어 다른 동영상에 속할수 도 있으며, 도 7의 (c)와 같이 두 동영상의 일부만이 중복될 수도 있다.On the other hand, as shown in Figure 7, looking at an example in which the video is partially overlapping, as shown in Figure 7 (b) and (c) may be partially overlapping video, in this case As in the case of (b), the entirety of one video may be completely overlapped with a portion of another video to belong to another video, and as shown in (c) of FIG. 7, only a part of two videos may overlap.

이하에서는 도 8을 참조하여 본 발명의 일 실시예에 따른 동영상 중복 검출 방법을 설명하기로 한다. Hereinafter, a video overlap detection method according to an embodiment of the present invention will be described with reference to FIG. 8.

먼저, 동영상을 디코딩한 후, 동영상 별로 적어도 하나의 키 프레임을 검출한다(S710). 다시 말해, 동영상의 특징을 잘 대표할 수 있는 프레임인 키 프레임을 검출하는 것이다. 일 실시예에 있어서, 상기 적어도 하나의 키 프레임은 아이(I) 프레임일 수 있다.First, after decoding a video, at least one key frame is detected for each video (S710). In other words, a key frame, which is a frame that can well represent the characteristics of a video, is detected. In one embodiment, the at least one key frame may be an eye (I) frame.

한편, 본 발명의 일 실시예에 있어서, 동영상을 디코딩하기 전에 동영상의 대부분이 검은색으로 되어 있는 경우에는 비정상 동영상으로 판단하여, 전체 및 부분 중복 여부를 판단하지 않을 수 있다. 예를 들어, 최대 그레이 히스토그램의 빈(bin)이 93%이상일 경우, 해당 동영상은 비정상 동영상으로 분류될 수 있다. 이와 같은 비정상 동영상의 판단은 동영상의 MD5 해쉬값을 이용하여 동영상의 바이트 특성으로부터 비정상 동영상을 검출할 수 있다.On the other hand, in one embodiment of the present invention, if most of the video is black before decoding the video, it is determined as an abnormal video, it may not be determined whether the entire and partial overlap. For example, when a bin of the maximum gray histogram is 93% or more, the video may be classified as an abnormal video. In determining the abnormal video, the abnormal video may be detected from the byte characteristics of the video using the MD5 hash value of the video.

여기서, 상기 적어도 하나의 키 프레임은 컷 디텍션을 이용하여 검출될 수 있으며, 특히 그레이 히스토그램의 차이값을 이용하여 검출될 수 있으며, 예를 들어, 그레이 히스토그램의 차이값이 기준치 이상인 경우에 키 프레임이 검출될 수 있다. 즉, 흑백 분포도의 차이가 임계치 이상으로 큰 경우에는 화면이 갑작스럽게 변화된 것을 의미하므로, 이러한 프레임을 키 프레임으로 검출하는 것이다.Here, the at least one key frame may be detected using cut detection, and in particular, may be detected using a difference value of the gray histogram. For example, when the difference value of the gray histogram is greater than or equal to the reference value, the key frame may be detected. Can be detected. That is, when the difference in the black and white distribution is larger than the threshold, it means that the screen is changed abruptly, and thus such a frame is detected as a key frame.

일 실시예에 있어서, 컷 디텍션에 의해 키 프레임이 검출되지 않거나, 키 프레임이 단지 하나만 검출된 경우에는 중간에 키 프레임을 임의적으로 추가하여 동영상의 중복 여부를 판단할 수 있다. 이 때, 임의적으로 추가되는 키 프레임은 기준 시간마다 삽입될 수 있으며, 예를 들어, 컷 디텍션에 의해 키 프레임이 검출되지 않는 경우 5초마다 키 프레임을 강제로 삽입할 수 있다. 이는 키 프레임이 검출되지 않는 경우 각 동영상을 대표할 수 있는 전체 특징값을 산출할 수 없기 때문에, 키 프레임이 검출되지 않는 경우를 대비하여 각 동영상을 대표하는 전체 특징값을 산출하기 위해서이다.In one embodiment, if no key frame is detected by the cut detection, or if only one key frame is detected, the key frame may be arbitrarily added to determine whether the video overlaps. At this time, the arbitrarily added key frame may be inserted every reference time, for example, if the key frame is not detected by the cut detection, the key frame may be forcibly inserted every 5 seconds. This is to calculate the total feature value representing each video in case the key frame is not detected, since the overall feature value that can represent each video cannot be calculated when the key frame is not detected.

또한, 일 실시예에 있어서, 플래쉬백(flashback)이 발생할 경우, 키 프레임간의 기준 시간을 정하여 기준 시간보다 작은 시간차이로 플래쉬백이 일어난 경우 에는 키 프레임으로 검출하지 않을 수 있다. 예를 들어, 플래쉬백의 최소 시간을 0.2초라고하면, 플래쉬백이 0.2초 이내에 일어난 경우에, 컷 디텍션에 의해 키 프레임이 검출되더라도 이를 키 프레임으로 이용하지 않을 수 있다.In addition, according to an embodiment, when a flashback occurs, a reference time between key frames may be determined, and when the flashback occurs with a time difference smaller than the reference time, it may not be detected as a key frame. For example, assuming that the minimum time of the flashback is 0.2 seconds, when the flashback occurs within 0.2 seconds, even if a key frame is detected by the cut detection, it may not be used as the key frame.

다음으로, 상기 검출된 적어도 하나의 키 프레임의 영역별 휘도 값을 이용하여 상기 적어도 하나의 키 프레임의 특징값을 산출한다(S720). 일 실시예에 있어서, 상기 검출된 적어도 하나의 키 프레임의 영역별 휘도 값의 평균값을 이용하여 상기 적어도 하나의 키 프레임의 특징값을 산출할 수 있다.Next, a feature value of the at least one key frame is calculated using the detected luminance value of each region of the at least one key frame (S720). In an embodiment, the feature value of the at least one key frame may be calculated using the average value of the luminance values of the at least one key frame for each region.

일 실시예에 있어서, PCA를 이용하여 상기 적어도 하나의 키 프레임의 특징값을 산출할 수 있다. 여기서, PCA란 주로 다루기 힘든 고차원의 신호를 낮은 차원으로 줄여 다루기 쉽게 하는 통계적 방법을 의미한다. 다시 말해, PCA는 일반적으로 벡터가 존재하는 경우, 차원을 줄일 경우에 주로 사용되며, 이는 의미있는 중요한 값들이 앞 부분에 주로 위치하고, 중요하지 않은 값들이 뒤에 분포되기 때문이다.In one embodiment, a feature value of the at least one key frame may be calculated using a PCA. Here, the PCA refers to a statistical method of reducing a high-dimensional signal that is difficult to deal with mainly to a lower level, thereby making it easier to handle. In other words, PCA is commonly used to reduce dimensions when vectors are present, because significant important values are placed first and non-important values are distributed later.

다음으로, 상기 산출된 적어도 하나의 키 프레임의 특징값을 이용하여 상기 동영상 별로 전체 특징값을 산출하고(S730), 상기 산출된 전체 특징값의 비교를 통하여 상기 동영상이 전체적으로 중복되는지 여부를 판단한다(S740). 다시 말해, 컷 디텍션에 의해 동영상의 키 프레임이 100개 검출되었다면, 100개의 키 프레임의 특징값이 산출될 수 있으며, 전체 특징값은 이 100개의 키 프레임의 특징값의 평균값으로서, 동영상을 대표하는 하나의 값이 되며, 동영상이 전체적으로 중복되는지 여부는 이 전체 특징값의 비교를 통하여 판단할 수 있다.Next, an overall feature value is calculated for each video using the calculated feature values of the at least one key frame (S730), and it is determined whether the video is entirely overlapped by comparing the calculated feature values. (S740). In other words, if 100 key frames of the video are detected by the cut detection, the feature values of 100 key frames may be calculated, and the total feature values are average values of the feature values of the 100 key frames and represent the video. It becomes one value and it can be determined whether or not the video overlaps as a whole by comparing the entire feature value.

다음으로, 상기 S740 단계에서 상기 동영상이 전체적으로 중복되지 않은 경우, 상기 산출된 적어도 하나의 키 프레임의 특징값에 대한 시퀀스를 생성하고(S750), 상기 생성된 시퀀스의 스트링 매칭을 통하여 상기 동영상이 부분적으로 중복되는지 여부를 판단한다(S760). Next, when the video is not entirely overlapped in step S740, a sequence of the calculated feature values of the at least one key frame is generated (S750), and the video is partially generated through string matching of the generated sequence. It is determined whether or not to overlap (S760).

일 실시예에 있어서, 상기 산출된 적어도 하나의 키 프레임의 특징값의 기준 크기를 이용하여 상기 키 프레임의 특징값에 대한 시퀀스를 생성할 수 있다. 예를 들어, 동영상의 키 프레임의 특징값의 앞자리 5바이트(bytes)를 이용하여 키 프레임의 특징값에 대한 시퀀스를 생성할 수 있다. 여기서, 키 프레임이 기준 개수 이상인 경우에만 키 프레임의 시퀀스를 생성할 수 있으며, 예를 들어, 키 프레임이 10개 이상 검출된 경우에만 키 프레임의 시퀀스를 생성할 수 있다.In an example embodiment, a sequence of the feature values of the key frame may be generated using the calculated reference size of the feature values of the at least one key frame. For example, a sequence for the feature value of the key frame may be generated by using five digits of the first digit of the feature value of the key frame of the video. Here, the sequence of key frames may be generated only when the number of key frames is greater than or equal to the reference number. For example, the sequence of key frames may be generated only when 10 or more key frames are detected.

이하에서는 도 9를 참조하여 본 발명의 다른 실시예에 따른 동영상 중복 검출 방법을 설명하기로 한다.Hereinafter, a video overlap detection method according to another embodiment of the present invention will be described with reference to FIG. 9.

먼저, 동영상을 디코딩한 후, 동영상 별로 적어도 하나의 키 프레임을 검출한다(S810). 다시 말해, 동영상의 특징을 잘 대표할 수 있는 프레임인 키 프레임을 검출하는 것이다. 일 실시예에 있어서, 상기 적어도 하나의 키 프레임은 아이(I) 프레임일 수 있다.First, after decoding a video, at least one key frame is detected for each video (S810). In other words, a key frame, which is a frame that can well represent the characteristics of a video, is detected. In one embodiment, the at least one key frame may be an eye (I) frame.

여기서, 상기 적어도 하나의 키 프레임은 컷 디텍션을 이용하여 검출될 수 있으며, 특히 그레이 히스토그램의 차이값을 이용하여 검출될 수 있으며, 예를 들어, 그레이 히스토그램의 차이값이 기준치 이상인 경우에 키 프레임이 검출될 수 있다. 즉, 흑백 분포도의 차이가 임계치 이상으로 큰 경우에는 화면이 갑작스럽게 변화된 것을 의미하므로, 이러한 프레임을 키 프레임으로 검출하는 것이다.Here, the at least one key frame may be detected using cut detection, and in particular, may be detected using a difference value of the gray histogram. For example, when the difference value of the gray histogram is greater than or equal to the reference value, the key frame may be detected. Can be detected. That is, when the difference in the black and white distribution is larger than the threshold, it means that the screen is changed abruptly, and thus such a frame is detected as a key frame.

다음으로, 상기 검출된 적어도 하나의 키 프레임의 특징값을 산출한다(S820). 일 실시예에 있어서, 상기 검출된 적어도 하나의 키 프레임의 영역별 휘도 값의 평균값을 이용하여 상기 적어도 하나의 키 프레임의 특징값을 산출할 수 있다. 다시 말해, 컷 디텍션에 의해 동영상의 키 프레임이 100개 검출되었다면, 100개의 키 프레임의 특징값이 산출될 수 있으며, 100개의 키 프레임의 특징값은 각 키 프레임의 영역별 휘도 값의 평균값을 이용하여 산출되는 것이다. Next, a feature value of the detected at least one key frame is calculated (S820). In an embodiment, the feature value of the at least one key frame may be calculated using the average value of the luminance values of the at least one key frame for each region. In other words, if 100 key frames of the video are detected by the cut detection, the feature values of 100 key frames can be calculated, and the feature values of the 100 key frames use the average value of the luminance values for each key frame region. Is calculated.

일 실시예에 있어서, 상기 적어도 하나의 키 프레임의 특징값은 주성분 분석법(Principal Component Analysis:PCA)에 의해 상기 적어도 하나의 키 프레임의 영역별 휘도 값의 일부로부터 산출될 수 있다. 여기서, PCA란 주로 다루기 힘든 고차원의 신호를 낮은 차원으로 줄여 다루기 쉽게 하는 통계적 방법을 의미한다. 다시 말해, 프레임 내 영역별 휘도 값의 통계치를 구하고 이 값을 PCA를 이용하여 변환한 뒤 주요 값들만을 이용하여 키 프레임의 특징값을 산출하는 것이다. In one embodiment, the feature value of the at least one key frame may be calculated from a portion of the luminance value for each region of the at least one key frame by Principal Component Analysis (PCA). Here, the PCA refers to a statistical method of reducing a high-dimensional signal that is difficult to deal with mainly to a lower level, thereby making it easier to handle. In other words, the statistical value of the luminance value for each region in the frame is obtained, and this value is converted using the PCA, and then the feature value of the key frame is calculated using only the main values.

다음으로, 상기 산출된 적어도 하나의 키 프레임의 특징값에 대한 시퀀스를 생성하고(S830), 상기 생성된 시퀀스의 스트링 매칭을 통하여 상기 동영상이 부분적으로 중복되는지 여부를 판단한다(S840). 일 실시예에 있어서, 상기 산출된 적어도 하나의 키 프레임의 특징값의 기준 크기를 이용하여 상기 키 프레임의 특징값에 대한 시퀀스를 생성할 수 있다. 예를 들어, 동영상의 키 프레임의 특징값의 앞자리 5바이트(bytes)를 이용하여 키 프레임의 특징값에 대한 시퀀스를 생성할 수 있다.Next, a sequence of the calculated feature values of at least one key frame is generated (S830), and it is determined whether the video is partially overlapped through string matching of the generated sequence (S840). In an example embodiment, a sequence of the feature values of the key frame may be generated using the calculated reference size of the feature values of the at least one key frame. For example, a sequence for the feature value of the key frame may be generated by using five digits of the first digit of the feature value of the key frame of the video.

한편, 상술한 동영상 중복 검출 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터로 판독 가능한 기록 매체에 기록될 수 있다. 이때, 컴퓨터로 판독 가능한 기록매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 한편, 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.On the other hand, the above-described video overlap detection method is implemented in the form of program instructions that can be executed by various computer means may be recorded in a computer-readable recording medium. In this case, the computer-readable recording medium may include program instructions, data files, data structures, and the like, alone or in combination. On the other hand, the program instructions recorded on the recording medium may be those specially designed and configured for the present invention or may be available to those skilled in the art of computer software.

컴퓨터로 판독 가능한 기록매체에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(Magnetic Media), CD-ROM, DVD와 같은 광기록 매체(Optical Media), 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 한편, 이러한 기록매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다.The computer-readable recording medium includes a magnetic recording medium such as a magnetic medium such as a hard disk, a floppy disk and a magnetic tape, an optical medium such as a CD-ROM and a DVD, a magnetic disk such as a floppy disk, A magneto-optical media, and a hardware device specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. The recording medium may be a transmission medium such as an optical or metal wire, a waveguide, or the like including a carrier wave for transmitting a signal specifying a program command, a data structure, or the like.

또한, 프로그램 명령에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.In addition, program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.

한편, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다.On the other hand, those skilled in the art will appreciate that the present invention can be implemented in other specific forms without changing the technical spirit or essential features.

그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.Therefore, it is to be understood that the embodiments described above are exemplary in all respects and not restrictive. The scope of the present invention is shown by the following claims rather than the detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalent concepts should be construed as being included in the scope of the present invention. do.

도 1은 본 발명의 일 실시예에 따른 동영상 중복 검출 시스템의 개략적인 블록도이다.1 is a schematic block diagram of a video overlap detection system according to an embodiment of the present invention.

도 2는 그레이 히스토그램 및 그레이 히스토그램의 차이값을 구하는 일 예를 보여주는 도면이다.2 is a diagram illustrating an example of obtaining a difference value between a gray histogram and a gray histogram.

도 3은 키 프레임의 영역별 휘도 값을 이용하여 키 프레임의 특징값을 산출하는 일 예를 보여주는 도면이다.3 is a diagram illustrating an example of calculating a feature value of a key frame by using luminance values of regions of the key frame.

도 4은 도 1에 도시된 전체 중복 검출부의 세부 구성을 보여주는 블록도이다.FIG. 4 is a block diagram illustrating a detailed configuration of the entire overlap detection unit illustrated in FIG. 1.

도 5는 도 1에 도시된 부분 중복 검출부의 세부 구성을 보여주는 블록도이다5 is a block diagram illustrating a detailed configuration of a partial overlap detection unit illustrated in FIG. 1.

도 6은 동영상의 스트링 매칭의 일 예를 보여주는 도면이다.6 is a diagram illustrating an example of string matching of a video.

도 7은 동영상의 전체 중복 및 부분 중복의 일 예를 보여주는 도면이다.7 is a diagram illustrating an example of full duplication and partial duplication of a video.

도 8은 본 발명의 일 실시예에 따른 동영상 중복 검출 방법을 보여주는 플로우차트이다.8 is a flowchart illustrating a video overlap detection method according to an embodiment of the present invention.

도 9는 본 발명의 일 실시예에 따른 동영상 중복 검출 방법을 보여주는 플로우차트이다.9 is a flowchart illustrating a video overlap detection method according to an embodiment of the present invention.

<도면의 주요 부분에 대한 부분의 설명><Description of part about main part of drawing>

100 : 동영상 중복 검출 시스템 110 : 디코딩부100: video overlap detection system 110: decoding unit

130 : 키 프레임 검출부 150 : 프레임 특징값 산출부130: key frame detector 150: frame feature value calculator

170 : 전체 중복 검출부 190 : 부분 중복 검출부170: total overlap detection unit 190: partial overlap detection unit

Claims (23)

동영상 별로 적어도 하나의 키 프레임을 검출하는 단계;Detecting at least one key frame for each video; 상기 검출된 적어도 하나의 키 프레임을 복수의 블록으로 구분하고, 상기 복수의 블록에 대한 영역별 휘도 값의 평균값을 이용하여 상기 적어도 하나의 키 프레임의 특징값을 산출하는 단계;Dividing the detected at least one key frame into a plurality of blocks, and calculating a feature value of the at least one key frame by using an average value of luminance values for each region of the plurality of blocks; 상기 산출된 적어도 하나의 키 프레임의 특징값을 이용하여 상기 동영상 별로 전체 특징값을 산출하는 단계;Calculating an entire feature value for each video by using the calculated feature values of the at least one key frame; 상기 산출된 전체 특징값의 비교를 통하여 상기 동영상이 전체적으로 중복되는지 여부를 판단하는 단계;Determining whether the video overlaps as a whole by comparing the calculated total feature values; 상기 동영상이 전체적으로 중복되지 않은 경우, 상기 산출된 적어도 하나의 키 프레임의 특징값에 대한 시퀀스를 생성하는 단계; 및Generating a sequence of feature values of the calculated at least one key frame when the video is not overlapped entirely; And 상기 생성된 시퀀스의 스트링 매칭을 통하여 상기 동영상이 부분적으로 중복되는지 여부를 판단하는 단계를 포함하는 것을 특징으로 하는 동영상 중복 검출 방법.And determining whether the video is partially overlapped by string matching of the generated sequence. 제 1 항에 있어서, 상기 키 프레임을 검출하는 단계에서,The method of claim 1, wherein the detecting of the key frame comprises: 상기 적어도 하나의 키 프레임이 검출되지 않은 경우, 기준 시간 마다 키 프레임을 추가하는 단계를 포함하는 것을 특징으로 하는 동영상 중복 검출 방법.And if the at least one key frame is not detected, adding a key frame every reference time. 제 1 항에 있어서, 상기 적어도 하나의 키 프레임을 검출하는 단계에서,The method of claim 1, wherein in detecting the at least one key frame: 컷 디텍션을 이용하여 상기 적어도 하나의 키 프레임을 검출하는 것을 특징으로 하는 동영상 중복 검출 방법.And detecting at least one key frame using cut detection. 제 1 항에 있어서, 상기 적어도 하나의 키 프레임을 검출하는 단계에서,The method of claim 1, wherein in detecting the at least one key frame: 그레이 히스토그램의 차이값을 이용하여 상기 적어도 하나의 키 프레임을 검출하는 것을 특징으로 하는 것을 특징으로 하는 동영상 중복 검출 방법.And detecting at least one key frame using a difference value of a gray histogram. 제 4 항에 있어서, 상기 적어도 하나의 키 프레임은The method of claim 4, wherein the at least one key frame 상기 그레이 히스토그램의 차이값이 기준치 이상인 것을 특징으로 동영상 중복 검출 방법.And a difference value of the gray histogram is equal to or greater than a reference value. 제 1 항에 있어서, 상기 키 프레임을 검출하는 단계 이전에,The method of claim 1, wherein before detecting the key frame, 상기 동영상을 디코딩하는 단계를 더 포함하는 것을 특징으로 하는 동영상 중복 검출 방법.Decoding the video further comprising the step of decoding the video. 제 1 항에 있어서,The method of claim 1, 상기 적어도 하나의 키 프레임은 아이 프레임인 것을 특징으로 하는 동영상 중복 검출 방법.And the at least one key frame is an eye frame. 제 1 항에 있어서, 상기 적어도 하나의 키 프레임의 특징값을 산출하는 단계에서,The method of claim 1, wherein the calculating of the feature value of the at least one key frame comprises: 주성분 분석법(Principal Component Analysis:PCA)에 의해 상기 적어도 하나의 키 프레임의 영역별 휘도 값의 일부로부터 상기 적어도 하나의 키 프레임의 특징값을 산출하는 것을 특징으로 하는 동영상 중복 검출 방법.And a feature value of the at least one key frame is calculated from a part of luminance values for each region of the at least one key frame by Principal Component Analysis (PCA). 삭제delete 제 1 항에 있어서, 상기 시퀀스를 생성하는 단계에서,The method of claim 1, wherein in generating the sequence: 상기 산출된 적어도 하나의 키 프레임의 특징값의 기준 크기를 이용하여 상기 시퀀스를 생성하는 것을 특징으로 하는 동영상 중복 검출 방법.And generating the sequence by using a reference size of the calculated feature values of at least one key frame. 삭제delete 삭제delete 제 1 항 내지 제 8 항, 제 10 항 중 어느 하나의 항에 기재된 방법을 수행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록매체.A computer-readable recording medium having recorded thereon a program for performing the method according to any one of claims 1 to 8 and 10. 동영상 별로 적어도 하나의 키 프레임을 검출하는 키 프레임 검출부;A key frame detector for detecting at least one key frame for each video; 상기 검출된 적어도 하나의 키 프레임을 복수의 블록으로 구분하고, 상기 복수의 블록에 대한 영역별 휘도 값의 평균값을 이용하여 상기 적어도 하나의 키 프레임의 특징값을 산출하는 프레임 특징값 산출부;A frame feature value calculator for dividing the detected at least one key frame into a plurality of blocks and calculating a feature value of the at least one key frame by using an average value of luminance values for each region of the plurality of blocks; 상기 산출된 적어도 하나의 키 프레임의 특징값을 이용하여 상기 동영상 별로 전체 특징값을 산출하는 전체 특징값 산출부;An overall feature value calculator configured to calculate an overall feature value for each video using the calculated feature values of at least one key frame; 상기 산출된 전체 특징값의 비교를 통하여 상기 동영상이 전체적으로 중복되는지 여부를 판단하는 전체 중복 판단부;A total overlap determination unit that determines whether the video is overlapped as a whole by comparing the calculated total feature values; 상기 동영상이 전체적으로 중복되지 않은 경우, 상기 산출된 적어도 하나의 키 프레임의 특징값에 대한 시퀀스를 생성하는 시퀀스 생성부; 및A sequence generator for generating a sequence of the calculated feature values of the at least one key frame when the video is not overlapped as a whole; And 상기 생성된 시퀀스의 스트링 매칭을 통하여 상기 동영상이 부분적으로 중복되는지 여부를 판단하는 부분 중복 판단부Partial overlap determination unit for determining whether the video is partially overlapped by the string matching of the generated sequence 를 포함하는 것을 특징으로 하는 동영상 중복 검출 장치.Video duplication detection apparatus comprising a. 제 14 항에 있어서, 상기 키 프레임 검출부는15. The apparatus of claim 14, wherein the key frame detector 상기 적어도 하나의 키 프레임이 검출되지 않은 경우, 기준 시간 마다 키 프레임을 추가하는 것을 특징으로 하는 동영상 중복 검출 장치.If the at least one key frame is not detected, the video overlap detection device, characterized in that for adding a key frame every reference time. 제 14 항에 있어서,The method of claim 14, 상기 적어도 하나의 키 프레임은 컷 디텍션을 이용하여 검출되는 것을 특징으로 하는 동영상 중복 검출 장치.And the at least one key frame is detected using cut detection. 제 14 항에 있어서,The method of claim 14, 상기 적어도 하나의 키 프레임은 그레이 히스토그램의 차이값을 이용하여 검출되는 것을 특징으로 하는 동영상 중복 검출 장치.And the at least one key frame is detected using a difference value of a gray histogram. 제 17 항에 있어서, 상기 적어도 하나의 키 프레임은18. The apparatus of claim 17, wherein the at least one key frame is 상기 그레이 히스토그램의 차이값이 기준치 이상인 것을 특징으로 하는 동영상 중복 검출 장치.And a difference value of the gray histogram is equal to or greater than a reference value. 제 14 항에 있어서, The method of claim 14, 상기 동영상을 디코딩하는 디코딩부를 더 포함하는 것을 특징으로 하는 동영상 중복 검출 장치.And a decoding unit for decoding the video. 제 14 항에 있어서, The method of claim 14, 상기 적어도 하나의 키 프레임은 아이 프레임인 것을 특징으로 하는 동영상 중복 검출 장치.And the at least one key frame is an eye frame. 제 14 항에 있어서,The method of claim 14, 상기 적어도 하나의 키 프레임의 특징값은 주성분 분석법(Principal Component Analysis:PCA)에 의해 상기 적어도 하나의 키 프레임의 영역별 휘도 값의 일부로부터 산출되는 것을 특징으로 하는 동영상 중복 검출 장치.And a feature value of the at least one key frame is calculated from a part of luminance values for respective regions of the at least one key frame by a principal component analysis (PCA). 삭제delete 제 14 항에 있어서, The method of claim 14, 상기 시퀀스는 상기 산출된 적어도 하나의 키 프레임의 특징값의 기준 크기를 이용하여 생성되는 것을 특징으로 하는 동영상 중복 검출 장치.And the sequence is generated using a reference size of the calculated feature value of the at least one key frame.
KR1020090027994A 2009-04-01 2009-04-01 Method and System for Detecting Duplicate Moving Picture Files KR101029437B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020090027994A KR101029437B1 (en) 2009-04-01 2009-04-01 Method and System for Detecting Duplicate Moving Picture Files
JP2010069168A JP5584499B2 (en) 2009-04-01 2010-03-25 Video duplicate detection method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090027994A KR101029437B1 (en) 2009-04-01 2009-04-01 Method and System for Detecting Duplicate Moving Picture Files

Publications (2)

Publication Number Publication Date
KR20100109640A KR20100109640A (en) 2010-10-11
KR101029437B1 true KR101029437B1 (en) 2011-04-14

Family

ID=43098569

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090027994A KR101029437B1 (en) 2009-04-01 2009-04-01 Method and System for Detecting Duplicate Moving Picture Files

Country Status (2)

Country Link
JP (1) JP5584499B2 (en)
KR (1) KR101029437B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101373849B1 (en) * 2012-02-22 2014-03-17 주식회사 다음커뮤니케이션 System and method of managing video
KR101358664B1 (en) * 2012-11-14 2014-03-19 대한민국(국가기록원) A method for detecting shot bounddary using brightness comparation between asymmetrical correspondence regions

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100750424B1 (en) 2004-03-03 2007-08-21 닛본 덴끼 가부시끼가이샤 Image similarity calculation system, image search system, image similarity calculation method, and image similarity calculation program
KR20070111264A (en) * 2006-05-17 2007-11-21 삼성전자주식회사 Apparatus and method for video retrieval

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11154163A (en) * 1997-11-20 1999-06-08 Matsushita Electric Ind Co Ltd Moving image coincidence discriminating device
JP2000242795A (en) * 1999-02-25 2000-09-08 Nippon Telegr & Teleph Corp <Ntt> Device and method for detecting picture difference and recording medium where same method is recorded
JP2001245303A (en) * 2000-02-29 2001-09-07 Toshiba Corp Moving picture coder and moving picture coding method
JP4652389B2 (en) * 2002-04-12 2011-03-16 三菱電機株式会社 Metadata processing method
JP4924423B2 (en) * 2005-06-01 2012-04-25 日本電気株式会社 Device for detecting cut point of moving image based on prediction error of feature amount
JP2009044423A (en) * 2007-08-08 2009-02-26 Univ Of Electro-Communications Scene detection system and scene detecting method
JP4333808B2 (en) * 2008-08-07 2009-09-16 株式会社日立製作所 Video search method and apparatus

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100750424B1 (en) 2004-03-03 2007-08-21 닛본 덴끼 가부시끼가이샤 Image similarity calculation system, image search system, image similarity calculation method, and image similarity calculation program
KR20070111264A (en) * 2006-05-17 2007-11-21 삼성전자주식회사 Apparatus and method for video retrieval
KR100827229B1 (en) 2006-05-17 2008-05-07 삼성전자주식회사 Apparatus and method for video retrieval

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
이창수, 지정규, "멀티미디어 서비스를 위한 동영상 이미지의 특징정보 분석 시스템에 관한 연구", Journal of Information Technology Applications & Management, 제9권 제3호, 2002.9.

Also Published As

Publication number Publication date
JP2010246103A (en) 2010-10-28
JP5584499B2 (en) 2014-09-03
KR20100109640A (en) 2010-10-11

Similar Documents

Publication Publication Date Title
Dasgupta et al. Optimized video steganography using genetic algorithm (GA)
US8885870B2 (en) Information processing device and computer program product
TWI692245B (en) Video decoding apparatus, video encoding method and apparatus, and computer-readable storage medium
US11232598B2 (en) Distinct encoding and decoding of stable information and transient/stochastic information
US8787692B1 (en) Image compression using exemplar dictionary based on hierarchical clustering
JP2006081146A (en) System and method for embedding scene change information in video bit stream
JP2004357302A (en) Method and system for identifying position in video by using content-based video timeline
US20150189222A1 (en) Content-adaptive chunking for distributed transcoding
JP2019524007A (en) Video compression method and apparatus, and computer program therefor
Mazumdar et al. Perceptual compression for video storage and processing systems
Yeh et al. Reversible video data hiding using neighbouring similarity
US7899752B2 (en) Method and system for preventing skipping playback of a special content section of a digital media stream
CN106664439B (en) Cloud streaming server
KR102190878B1 (en) System and methods for scene categorization
KR101029437B1 (en) Method and System for Detecting Duplicate Moving Picture Files
US10264273B2 (en) Computed information for metadata extraction applied to transcoding
US10674111B2 (en) Systems and methods for profile based media segment rendering
US10942914B2 (en) Latency optimization for digital asset compression
US10997426B1 (en) Optimal fragmentation of video based on shot analysis
Sowmya et al. Video authentication using watermark and digital signature—a study
KR102430177B1 (en) System for rapid management of large scale moving pictures and method thereof
US9560365B2 (en) Image coding device, image decoding device, image coding method, and image decoding method
Chen et al. A novel two-dimensional reversible data hiding method with high embedding capacity in H. 264/advanced video coding
US20150149578A1 (en) Storage device and method of distributed processing of multimedia data
Calibo et al. Metadata Extraction Analysis: A Review of Video Data in Effect to Social Media Compression

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 7