KR20090014754A - System and method for managing and detecting duplicate moving picture files based on video contents - Google Patents

System and method for managing and detecting duplicate moving picture files based on video contents Download PDF

Info

Publication number
KR20090014754A
KR20090014754A KR1020070078944A KR20070078944A KR20090014754A KR 20090014754 A KR20090014754 A KR 20090014754A KR 1020070078944 A KR1020070078944 A KR 1020070078944A KR 20070078944 A KR20070078944 A KR 20070078944A KR 20090014754 A KR20090014754 A KR 20090014754A
Authority
KR
South Korea
Prior art keywords
video
file
fingerprint
files
storage
Prior art date
Application number
KR1020070078944A
Other languages
Korean (ko)
Other versions
KR100946694B1 (en
Inventor
박만수
양승현
Original Assignee
주식회사 코난테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 코난테크놀로지 filed Critical 주식회사 코난테크놀로지
Priority to KR1020070078944A priority Critical patent/KR100946694B1/en
Publication of KR20090014754A publication Critical patent/KR20090014754A/en
Application granted granted Critical
Publication of KR100946694B1 publication Critical patent/KR100946694B1/en

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Abstract

A system and a method for video file duplication checking and management based on video information by using video fingerprint technology are provided to decide whether a previously stored video file is overlapped with a newly stored video file, based on contents of videos included in the video files before the video files are recorded in a storage, thereby preventing duplicated recording of the files. A file input unit(10) inputs plural moving picture files(MF). A video feature extractor(20) analyzes video data included in each moving picture file, and extracts video fingerprints. If similarity among the video fingerprints exceeds a threshold value, a file duplication checking unit(30) decides a comparison target moving picture file from which the video fingerprints are extracted, as a duplicated file containing the same contents of video.

Description

영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템 및 방법{System and Method for managing and detecting duplicate moving picture files based on video contents}System and Method for managing and detecting duplicate moving picture files based on video contents}

본 발명은 동영상 파일 간의 중복 여부를 판별할 수 있는 파일 관리 시스템에 관한 것으로서, 보다 상세하게는 비디오 핑거프린트 기술을 이용하여 동영상 파일에 담긴 영상 정보를 기반으로 동영상 파일 간의 중복 여부를 판별할 수 있는 시스템 및 그 방법에 관한 것이다.The present invention relates to a file management system that can determine whether or not the overlap between the video files, and more particularly, it is possible to determine whether or not the overlap between the video files based on the video information contained in the video file using the video fingerprint technology A system and method thereof are provided.

최근 들어, 디지털 카메라/캠코더, 카메라 휴대폰, 휴대용 동영상 재생기(PMP, MP4P 등) 등의 발달로 동영상 콘텐츠의 제작과 활용이 용이해졌다. 또한, UCC(User Created Contents) 서비스의 급속한 확산으로 사용자에 의해 생산된 디지털 동영상 파일이 UCC 전문 사이트나 P2P(Peer to Peer) 방식의 파일 공유 사이트, 개인 블로그나 미니 홈페이지 등을 통해 업로드되고 있다. 이렇게 업로드된 동영상 파일은 인터넷을 통한 다운로드 또는 스트리밍 서비스에 의해 다른 사용자들에게 공유된다.Recently, with the development of digital cameras / camcorders, camera mobile phones, and portable video players (PMP, MP4P, etc.), the production and utilization of video contents has become easier. In addition, due to the rapid proliferation of UCC (User Created Contents) services, digital video files produced by users are uploaded through UCC specialized sites, P2P (peer to peer) file sharing sites, personal blogs or mini homepages. The uploaded video file is shared with other users by downloading or streaming service through the Internet.

디지털 동영상은 텍스트 기반의 콘텐츠에 비해 파일 용량이 상당히 크다. 따 라서, 동영상 콘텐츠의 생산자나 사용자, 그리고 UCC 서비스 등의 제공을 위해 사용자 제작 중심의 동영상 콘텐츠를 대량으로 데이터베이스화해야 하는 사업자의 입장에서는 스토리지(Storage)의 효율적 관리가 매우 중요하다.Digital video has a much larger file size than text-based content. Therefore, efficient management of storage is very important from the perspective of producers and users of video content, and operators who need to mass-produce user-oriented video content in order to provide UCC services.

스토리지의 효율적 관리를 위해서는 내용이 동일한 동영상 파일의 중복 기록을 방지해야 한다. 내용이 동일한 동영상 파일이 중복 기록되면 스토리지의 자원이 낭비되기 때문이다. 종래에는 동영상 파일의 중복 기록을 방지하기 위해 MD5(Message Digest 5) 알고리즘이 주로 사용되었다. MD5 알고리즘은 동영상 파일의 바이너리 코드를 해슁(hashing)하여 동영상 파일 간의 동일성 여부를 판별한다. 그런데, MD5 알고리즘은 복제된 동영상 파일에 대해서만 중복 기록을 방지할 수 있다는 한계가 있다. 즉, 동영상 파일로 인코딩될 때 인코딩 방식, 메타 태그, 비트율, 샘플링 비율(이하, 이러한 요소들을 '인코딩 환경'이라고 칭한다) 등이 달라지면, MD5 알고리즘은 동영상 파일 안에 담긴 콘텐츠의 내용이 동일하더라도 파일이 서로 다르다고 판단한다. 따라서, MD5 알고리즘은 동영상 파일을 생성할 때 적용된 인코딩 환경이 달라지면 파일의 중복 기록을 방지할 수 없는 한계가 있다.For efficient storage management, duplicate recording of video files with the same contents should be prevented. This is because storage of resources is wasted when video files having the same contents are duplicated and recorded. Conventionally, the MD5 (Message Digest 5) algorithm is mainly used to prevent duplicate recording of moving image files. The MD5 algorithm hashes the binary code of the video file to determine whether the video files are identical. However, the MD5 algorithm has a limitation in that duplicate recording can be prevented only for a duplicate video file. In other words, if the encoding method, meta tag, bit rate, and sampling rate (hereinafter referred to as 'encoding environment') are different when the video file is encoded, the MD5 algorithm uses the file even if the contents of the video file are identical. I think they are different. Therefore, the MD5 algorithm has a limitation in that duplicate recording of the file cannot be prevented if the encoding environment applied when generating the video file is different.

위와 같은 MD5 알고리즘의 한계는 UCC 서비스, P2P 파일 공유 서비스, 동영상 검색 서비스가 각광을 받고 있는 작금의 상황에서 사업자 서버의 스토리지 효율성을 심각하게 떨어뜨리는 원인이 되고 있다.The limitations of the MD5 algorithm, as described above, have seriously reduced the storage efficiency of the operator's server in the recent situation where UCC service, P2P file sharing service, and video search service are in the spotlight.

예를 들어, 사회적 이슈가 되는 동영상 파일이 특정 웹사이트를 통해 업로드되어 네티즌들에게 공개된 경우를 가정해보자. 이런 경우, 해당 동영상 파일은 짧은 시간 동안 상당수의 네티즌에 의해 다운로드된다. 동영상 파일을 다운로드한 네 티즌들은 영상 캡쳐 보드 등의 동영상 편집 프로그램을 이용하여 동영상을 2차적으로 편집한 후 동시 다발적으로 자신이 운용하는 블로그나 미니 홈페이지 또는 공개적인 형태로 운용되는 자료실 등에 업로드한다. For example, suppose a video file that is a social issue has been uploaded through a specific website and made available to netizens. In this case, the video file is downloaded by a large number of netizens for a short time. After downloading the video file, four seasoned users edit the video secondly using a video editing program such as a video capture board and upload it to their blogs, mini homepages, or publicly run archives. .

이러한 동영상 파일의 업로드시, 사업자의 서버가 MD5 알고리즘에 의해 동영상 파일의 중복 여부를 체크하면, 인코딩 환경이 다르다는 이유로 내용이 동일한 다수의 동영상 파일이 여과없이 스토리지에 기록됨으로써 스토리지 용량의 낭비가 초래될 수 있는 것이다.When uploading such video files, if the operator's server checks whether the video files are duplicated by the MD5 algorithm, a large number of video files having the same contents are recorded in the storage without filtering due to different encoding environments, resulting in a waste of storage capacity. It can be.

한편, 최근에는 동영상 콘텐츠의 상업적 가치가 증대되면서 검색 포탈 사업자들이 동영상 검색 서비스를 경쟁적으로 개발하여 서비스 대열에 속속 합류하고 있다. 양질의 동영상 검색 서비스를 제공하기 위해서는, 방대한 동영상 데이터베이스의 구축과 갱신이 지속적으로 이루어져야 한다. 이러한 데이터베이스 구축 및 갱신 과정에서 동영상 파일의 중복 기록 방지가 제대로 이루어지지 않으면, 스토리지의 불필요한 낭비가 초래되는 것은 물론이고 동영상 검색의 품질이 떨어지는 문제까지 발생한다. 인코딩 환경이 다르다는 이유로 동일한 내용의 동영상 파일이 반복적으로 노출되기 때문이다.On the other hand, in recent years, as the commercial value of video content has increased, search portal operators have been competing to develop a video search service. In order to provide high quality video retrieval services, the construction and updating of a huge video database must be continued. In the process of building and updating the database, if the duplicate recording of the video file is not properly prevented, unnecessary waste of storage is caused and the quality of the video search is deteriorated. This is because video files with the same contents are repeatedly exposed because of different encoding environments.

따라서, 본 발명이 속한 기술 분야에서는 스토리지 자원의 효율적 사용과 동영상 검색 서비스의 품질을 향상시키기 위해 동영상 파일의 인코딩과 관련된 환경에 의존하지 않고 동영상 파일에 담긴 내용을 기초로 서로 다른 동영상 파일의 중복 여부를 효과적으로 판별할 수 있는 기술이 절실히 요구되고 있는 실정이다.Therefore, in the technical field to which the present invention belongs, whether or not to duplicate the different video files based on the contents of the video files without depending on the environment related to the encoding of the video files in order to efficiently use storage resources and improve the quality of the video search service. There is an urgent need for a technique that can effectively determine the number of times.

본 발명은 상술한 종래 기술의 문제점을 해결하기 위하여 창안된 것으로서, 비디오 핑거프린트 기술을 활용하여 동영상 파일에 포함된 영상의 내용을 기반으로 동영상 파일 간의 중복 여부를 판별할 수 있는 파일 관리 시스템 및 방법을 제공하는데 그 목적이 있다.The present invention was devised to solve the above-mentioned problems of the prior art, and a file management system and method that can determine whether a video file is duplicated based on the content of an image included in the video file using a video fingerprint technology. The purpose is to provide.

본 발명의 다른 목적은, 동영상 파일을 스토리지에 기록하기에 앞서 동영상 파일에 포함된 영상의 내용을 기반으로 기 저장된 동영상 파일과 신규로 저장되는 동영상 파일의 중복 여부를 판별하여 파일의 중복 기록을 방지할 수 있는 파일 관리 시스템 및 방법을 제공하는데 있다.Another object of the present invention, before recording a video file in the storage to determine whether the previously stored video file and the newly stored video file on the basis of the content of the video included in the video file to prevent duplicate recording of the file The present invention provides a file management system and method.

본 발명의 또 다른 목적은, 스토리지에 다량으로 저장되어 있는 동영상 파일의 중복 여부를 영상의 내용을 기반으로 판별하여 파일의 중복 기록 상태를 제거할 수 있는 파일 관리 시스템 및 방법을 제공하는데 있다.It is still another object of the present invention to provide a file management system and method for removing duplicate recording states of a file by determining whether a video file stored in a storage is duplicated based on the content of the video.

본 발명의 또 다른 목적은, 동영상 검색 서비스의 제공을 위한 동영상 데이터베이스의 구축시 동영상 파일의 영상의 내용을 기반으로 파일의 중복 기록을 방지함으로써 동영상 검색 서비스의 품질 열화를 방지할 수 있는 파일 관리 시스템 및 방법을 제공하는데 있다.Still another object of the present invention is a file management system capable of preventing deterioration of the quality of a video search service by preventing duplication of file recording based on the content of a video of a video file when constructing a video database for providing a video search service. And providing a method.

상기 기술적 과제를 달성하기 위한 본 발명의 일 측면에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템은, 복수의 동영상 파일을 입력받는 파일 입력부; 상기 입력된 각 동영상 파일에 포함된 영상 데이터를 분석하여 비디오 핑거프린트를 추출하는 비디오 특징 추출부; 및 상기 추출된 각 비디오 핑거프린트를 상호 대비하여 각 비디오 핑거프린트 간의 유사도가 임계치를 넘으면 비디오 핑거프린트가 추출된 비교 대상 동영상 파일이 동일한 내용의 영상을 담고 있는 중복 파일로 판별하는 파일중복 검사부;를 포함한다.According to an aspect of the present invention, there is provided a system for checking and managing video file duplication based on video information, including: a file input unit configured to receive a plurality of video files; A video feature extracting unit extracting a video fingerprint by analyzing image data included in each of the inputted video files; And a file duplication checker for judging each of the extracted video fingerprints and comparing the extracted video fingerprints with each other, when the similarity between the video fingerprints exceeds a threshold, the comparison target video file from which the video fingerprints are extracted as a duplicate file containing an image having the same contents. Include.

상기 기술적 과제를 달성하기 위한 본 발명의 다른 측면에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템은, 동영상 파일을 입력받는 파일 입력부; 상기 입력된 동영상 파일에 포함된 영상 데이터를 분석하여 비디오 핑거프린트를 추출하는 비디오 특징 추출부; 및 상기 추출된 비디오 핑거프린트와 미리 획득한 다른 동영상 파일의 비디오 핑거프린트를 상호 대비하여 비디오 핑거프린트 간의 유사도가 임계치를 넘으면 상기 입력된 동영상 파일이 상기 미리 획득한 다른 동영상 파일과 동일한 내용의 영상을 담고 있는 중복된 동영상 파일로 판별하는 파일중복 검사부;를 포함한다.According to another aspect of the present invention, a system for checking and managing video file duplication based on video information includes: a file input unit configured to receive a video file; A video feature extracting unit extracting a video fingerprint by analyzing image data included in the input video file; And comparing the extracted video fingerprint with a video fingerprint of another video file obtained in advance, and if the similarity between the video fingerprints exceeds a threshold, the input video file may display an image having the same content as the previously obtained other video file. Includes a file duplication inspection unit to determine the duplicate video file containing.

본 발명에 따른 시스템은, 상기 파일중복 검사부의 판단 결과에 따라, 내용이 동일한 동영상 파일들을 식별하여 동영상 파일의 중복 상태를 제거하는 파일 관리부;를 더 포함할 수 있다.The system according to the present invention may further include a file management unit for identifying video files having the same content and removing a duplicate state of the video file according to the determination result of the file duplication inspection unit.

바람직하게, 상기 파일 관리부는 상기 파일중복 검사부의 판단 결과에 따라 중복 입력된 동영상 파일 중 하나의 파일을 제외한 나머지 파일은 제거하거나, 별도의 스토리지 공간으로 이동시킨다. 이 때, 삭제 또는 이동 대상의 선정 기준은 동영상 파일의 품질이 될 수 있다. 한편, 상기 파일 관리부는 신규 입력된 동영상 파일의 품질이 기 저장된 동영상 파일보다 우수한 경우, 기 저장된 동영상 파일을 신규 입력된 동영상 파일로 대체할 수 있다. 상기 파일 관리부는 파일 관리자가 삭제 또는 이동 대상 파일의 선정, 또는 동영상 파일의 대체 여부를 직접 결정할 수 있도록 하는 사용자 인터페이스를 제공할 수 있다.Preferably, the file manager removes or moves the remaining files except for one of the duplicately input video files according to the determination result of the file duplication checker or moves them to a separate storage space. At this time, the selection criterion for deletion or movement may be the quality of the video file. On the other hand, if the quality of the newly input video file is superior to the pre-stored video file, the file manager may replace the pre-stored video file with the newly input video file. The file manager may provide a user interface that allows a file manager to directly determine whether to select a file to be deleted or moved, or to replace a video file.

상기 기술적 과제를 달성하기 위한 본 발명의 또 다른 측면에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템은, 동영상 파일을 입력받는 파일 입력부; 복수의 동영상 파일에 대한 비디오 핑거프린트를 저장하고 있는 비디오 핑거프린트 DB; 상기 입력된 동영상 파일에 포함된 영상 데이터를 분석하여 비디오 핑거프린트를 추출하는 비디오 특징 추출부; 상기 비디오 핑거프린트를 상기 비디오 핑거프린트 DB;에 저장하고, 상기 입력된 동영상 파일을 스토리지에 저장하는 파일 DB화부; 상기 비디오 핑거프린트 DB로부터 임계치 이상의 유사도를 갖는 비디오 핑거프린트의 그룹을 식별하여 스토리지에 저장된 동영상 파일들 간의 중복 여부를 판단하는 파일중복 검사부; 및 상기 파일중복 검사부의 판단 결과에 따라, 비디오 핑거프린트 DB 및 스토리지로부터 중복 기록된 동영상 파일들을 식별하여 동영상 파일의 중복 저장 상태를 제거하는 파일 관리부;를 포함한다.According to another aspect of the present invention, there is provided a system for checking and managing video file duplication based on video information, including: a file input unit configured to receive a video file; A video fingerprint DB for storing video fingerprints for a plurality of video files; A video feature extracting unit extracting a video fingerprint by analyzing image data included in the input video file; A file DB unit configured to store the video fingerprint in the video fingerprint DB, and store the input video file in storage; A file duplication checker that identifies a group of video fingerprints having a similarity or more than a threshold value from the video fingerprint DB and determines whether the video files stored in the storage are overlapped; And a file manager which identifies duplicately recorded video files from the video fingerprint DB and the storage and removes the redundant storage state according to the determination result of the file duplication inspection unit.

상기 기술적 과제를 달성하기 위한 본 발명의 또 다른 측면에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템은, 동영상 파일을 입력받는 파일 입력부; 복수의 동영상 파일에 대한 비디오 핑거프린트를 저장하고 있는 비디오 핑거프린트 DB; 상기 입력된 동영상 파일에 포함된 영상 데이터를 분석하여 비디오 핑거프린트를 추출하는 비디오 특징 추출부; 상기 비디오 핑거프린트 DB로부터 상기 추출된 비디오 핑거프린트와 임계치 이상의 유사도를 갖는 비디오 핑거 프린트의 존재 여부를 조회하여 동영상 파일의 중복 입력 여부를 판별하는 파일중복 검사부; 및 상기 판단 결과, 비디오 핑거프린트 DB에 임계치 이상의 유사도를 갖는 비디오 핑거프린트가 존재하지 않는 동영상 파일에 한하여 상기 추출된 비디오 핑거프린트를 비디오 핑거프린트 DB에 저장하고, 상기 입력된 동영상 파일을 스토리지에 저장하는 파일 관리부;를 포함한다.According to another aspect of the present invention, there is provided a system for checking and managing video file duplication based on video information, including: a file input unit configured to receive a video file; A video fingerprint DB for storing video fingerprints for a plurality of video files; A video feature extracting unit extracting a video fingerprint by analyzing image data included in the input video file; A file duplication checker for determining whether a video file is duplicated by inquiring whether a video fingerprint having a degree of similarity with the extracted video fingerprint from the video fingerprint DB exists above a threshold; And as a result of the determination, the extracted video fingerprint is stored in the video fingerprint DB only for a video file having a similarity or more than a threshold in the video fingerprint DB, and the input video file is stored in the storage. It includes; File management unit.

본 발명의 다른 기술적 과제는 상술한 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 동작 방법과 이 방법을 프로그램화하여 수록한 컴퓨터로 읽을 수 있는 기록매체에 의해서도 달성될 수 있다.Another technical problem of the present invention can be achieved by a method of operating a system for checking and managing a video file duplication based on image information and a computer-readable recording medium that records the program.

본 발명의 일 측면에 따르면, 디지털 동영상을 컴퓨터 시스템의 스토리지에 저장할 때 또는 다수의 동영상 파일이 컴퓨터 시스템의 스토리지에 저장되어 있을 때 영상 내용의 동일성 여부에 의해 동영상 파일 간의 중복 여부를 용이하게 판별할 수 있다.According to an aspect of the present invention, when storing a digital video in the storage of the computer system or when a plurality of video files are stored in the storage of the computer system it is easy to determine whether or not the overlap between the video files by the identity of the video content Can be.

본 발명의 다른 측면에 따르면, 내용이 동일한 동영상 파일을 스토리지로부터 삭제하거나 스토리지의 별도 저장 공간으로 이동시킴으로써 스토리지 공간을 효율적으로 사용할 수 있다.According to another aspect of the present invention, the storage space can be efficiently used by deleting the same video file from the storage or moving to a separate storage space of the storage.

본 발명의 또 다른 측면에 따르면, 다량으로 구축된 동영상 파일을 기초로 동영상 검색 서비스 등을 제공할 때 서비스의 품질을 더욱 향상시킬 수 있다.According to another aspect of the present invention, the quality of the service can be further improved when providing a video search service or the like based on a video file constructed in large quantities.

이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. Prior to this, terms or words used in the specification and claims should not be construed as having a conventional or dictionary meaning, and the inventors should properly explain the concept of terms in order to best explain their own invention. Based on the principle that can be defined, it should be interpreted as meaning and concept corresponding to the technical idea of the present invention. Therefore, the embodiments described in the specification and the drawings shown in the drawings are only the most preferred embodiment of the present invention and do not represent all of the technical idea of the present invention, various modifications that can be replaced at the time of the present application It should be understood that there may be equivalents and variations.

도 1은 본 발명의 제1실시예에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 개략적인 구성을 도시한 블록도이다.1 is a block diagram illustrating a schematic configuration of a system for checking and managing video file duplication based on video information according to a first embodiment of the present invention.

제1실시예에 따른 시스템은, 파일 입력부(10), 비디오 특징 추출부(20), 파일중복 검사부(30), 파일 관리부(40) 및 스토리지(50)를 포함한다.The system according to the first embodiment includes a file input unit 10, a video feature extraction unit 20, a file duplication inspection unit 30, a file management unit 40, and a storage 50.

상기 파일 입력부(10)는 중복 검사의 대상이 되는 복수의 동영상 파일(MF)을 입력 받아 비디오 특징 추출부(20)로 전달한다. 상기 동영상 파일(MF)은 MPEG4, MP4, Realvideo 등과 같은 포맷으로 인코딩된 디지털 동영상 파일이다. 하지만, 본 발명은 동영상 파일(MF)의 포맷에 의해 한정되지 않는다.The file input unit 10 receives a plurality of video files MF that are subject to redundancy check and delivers the plurality of video files MF to the video feature extraction unit 20. The video file MF is a digital video file encoded in a format such as MPEG4, MP4, Realvideo, or the like. However, the present invention is not limited by the format of the video file MF.

바람직하게, 중복 검사의 대상이 되는 복수의 동영상 파일(MF)은 사용자 인터페이스를 통해 지정한다. 상기 사용자 인터페이스는 컴퓨터 시스템의 스토리지(예컨대, 하드 디스크 등)에 저장된 파일들 중 중복 검사를 하고자 하는 적어도 2개 이상의 동영상 파일(MF)을 사용자가 선택할 수 있는 인터페이스를 제공한다. 대 안적으로, 상기 복수의 동영상 파일(MF)은 컴퓨터 시스템의 입출력 인터페이스 또는 네트워크 인터페이스를 통해 외부로부터 입력될 수도 있다. 상기 컴퓨터 시스템은 퍼스널 컴퓨터 또는 대용량의 서버 컴퓨터 등일 수 있다.Preferably, the plurality of video files MF to be subjected to duplication inspection are designated through a user interface. The user interface provides an interface for a user to select at least two or more video files MF to be duplicated among files stored in storage (eg, a hard disk) of a computer system. Alternatively, the plurality of video files MF may be input from the outside through an input / output interface or a network interface of a computer system. The computer system may be a personal computer or a large capacity server computer.

본 발명에서, 동영상 파일(MF) 간의 중복 검사는 동영상 파일(MF)에 포함된 실질적 내용을 기준으로 동영상 파일(MF) 간의 동일성을 판단하는 것을 말한다. 실질적 내용이란, 동영상 파일(MF)에 포함된 영상 데이터의 내용을 말한다.In the present invention, the redundancy check between the moving image files MF refers to determining the sameness between the moving image files MF based on the actual contents included in the moving image file MF. Substantial content means the content of the video data contained in the video file MF.

상기 비디오 특징 추출부(20)는 각 동영상 파일(MF)에 포함된 영상 데이터를 분석하여 비디오 핑거프린트를 추출한다. 여기서, 비디오 핑거프린트는 영상 데이터를 배타적이고도 고유하게 식별할 수 있는 일종의 비디오 지문을 지칭한다. 상기 비디오 특징 추출부(20)는 비디오 핑거프린트를 추출하기에 앞서 동영상 파일(MF)로부터 비디오 데이터만을 선택적으로 분리하는 과정을 선행할 수 있다.The video feature extractor 20 extracts a video fingerprint by analyzing image data included in each video file MF. Here, a video fingerprint refers to a kind of video fingerprint that can exclusively and uniquely identify image data. The video feature extractor 20 may precede the process of selectively separating only video data from the video file MF before extracting the video fingerprint.

상기 비디오 특징 추출부(20)는 비디오 핑거프린트를 추출하기 위해 동영상 파일(MF)에서 비디오 스트림을 선택적으로 분리하고, 분리된 비디오 스트림을 디코딩하여 raw 포맷의 영상 데이터로 변환한다. 여기서, raw 포맷은 YUV(YCbCr) 포맷 또는 RGB 포맷을 의미한다. 하지만, 본 발명은 raw 포맷의 종류에 의해 한정되지 않는다. 이어서, 상기 비디오 특징 추출부(20)는 디코딩된 영상 데이터를 구성하는 각 프레임 이미지별로 서브 비디오 핑거프린트를 추출한다.The video feature extractor 20 selectively separates the video stream from the video file MF to extract the video fingerprint, decodes the separated video stream, and converts the video stream into image data in a raw format. Here, the raw format means a YUV (YCbCr) format or an RGB format. However, the present invention is not limited by the type of raw format. Subsequently, the video feature extractor 20 extracts a sub video fingerprint for each frame image constituting the decoded image data.

상기 비디오 특징 추출부(20)가 각 프레임 이미지별로 서브 비디오 핑거프린트를 추출하는 과정은 다음과 같다. 먼저, 비디오 특징 추출부(20)는 프레임 이미지를 블록 단위로 분할한다. 일 예로서, 이미지의 세로축을 n 등분하고 가로축을 m 등분하여 프레임 이미지를 n×m 개의 블록으로 분할한다. 다른 예로서, 이미지의 세로축을 n 등분하여 프레임 이미지를 n 개의 블록으로 분할하고 다시 가로축을 m 등분하여 프레임 이미지를 m 개의 블록으로 분할하여 프레임 이미지를 n+m 개의 블록으로 분할한다.The video feature extractor 20 extracts a sub video fingerprint for each frame image as follows. First, the video feature extractor 20 divides the frame image in units of blocks. As an example, the frame image is divided into n × m blocks by dividing the vertical axis of the image by n and dividing the horizontal axis by m. As another example, the vertical axis of the image is divided into n blocks to divide the frame image into n blocks, and the horizontal axis is further divided into m blocks to divide the frame image into m blocks and the frame image is divided into n + m blocks.

이어서, 비디오 특징 추출부(20)는 분할된 블록 단위별로 각 픽셀의 영상 밝기 데이터인 Y값의 평균을 산출한 후 인접한 블록 간의 영상 밝기 평균값의 차이를 기준으로 소정 비트수(예컨대, 32비트)의 서브 비디오 핑거프린트를 생성한다.Subsequently, the video feature extractor 20 calculates an average of Y values, which are image brightness data of each pixel, for each divided block unit, and then selects a predetermined number of bits (for example, 32 bits) based on a difference in image brightness average values between adjacent blocks. Create a sub video fingerprint of.

다음 수학식 1은 하나의 프레임 이미지에 대한 서브 비디오 핑거프린트를 생성하는데 사용될 수 있는 비트 할당 함수 'B(r, c, p)' 를 예시한 것이다. 참고로, 하기 수학식 1은 하나의 프레임 이미지를 m×n 개의 블록으로 분할하였을 때를 가정한 것이다.Equation 1 below illustrates a bit allocation function 'B (r, c, p)' that can be used to generate a sub video fingerprint for one frame image. For reference, Equation 1 below assumes that one frame image is divided into m × n blocks.

Figure 112007057197370-PAT00001
Figure 112007057197370-PAT00001

Figure 112007057197370-PAT00002
Figure 112007057197370-PAT00002

여기서, B(r, c, p)는 p번째 프레임 이미지의 가로축 및 세로축을 기준으로 각각 r번째 및 c번째에 위치한 블록에 대해 비트를 할당하는 함수이다. 그리고, F(r, c, p)는 p번째 프레임 이미지의 가로축 및 세로축을 기준으로 각각 r번째 및 c번째에 위치한 블록의 영상 밝기값 평균을 나타낸다.Here, B (r, c, p) is a function for allocating bits to blocks located in the r-th and c-th based on the horizontal and vertical axes of the p-th frame image. F (r, c, p) represents an average of image brightness values of blocks located at r-th and c-th, respectively, based on the horizontal and vertical axes of the p-th frame image.

상기 수학식 1의 F(r, c, p)에서, r은 1부터 m까지의 정수값을 갖고, c는 1 부터 n-1까지의 정수값을 갖는다. 따라서 프레임 이미지가 '4×9=36'개의 블록으로 분할되면 서브 비디오 핑거프린트는 '4×8=32' 비트의 코드열을 갖게 된다. 한편, α는 1보다 작은 수로서 적절하게 선택 가능한 상수이다. 예컨대 α는 0.95이다.In F (r, c, p) of Equation 1, r has an integer value from 1 to m, and c has an integer value from 1 to n-1. Therefore, when the frame image is divided into 4 × 9 = 36 blocks, the sub video fingerprint has a code string of 4 × 8 = 32 bits. Α is a constant smaller than 1 and can be appropriately selected. Α is 0.95, for example.

한편, 상기 비디오 특징 추출부(20)는 영상의 밝기 데이터인 Y값 이외에도 각 픽셀의 색차 데이터인 Cb 또는 Cr값을 활용하여 서브 비디오 핑거프린트를 생성할 수 있다. Cb 또는 Cr값을 활용하여 서브 비디오 핑거프린트를 생성하는 방법은 상술한 바와 실질적으로 동일할 것임은 본 발명이 속한 기술분야에서 통상의 지식을 가진 자에게 자명하다.The video feature extractor 20 may generate a sub video fingerprint by using a Cb or Cr value, which is color difference data of each pixel, in addition to the Y value which is brightness data of an image. It will be apparent to those skilled in the art that a method for generating a sub video fingerprint using a Cb or Cr value will be substantially the same as described above.

상기 비디오 특징 추출부(20)는 동영상을 구성하는 각 프레임 이미지에 대한 서브 비디오 핑거프린트를 추출하고 나면, 추출된 각 서브 비디오 핑거프린트를 그룹핑함으로써 동영상 파일에 대한 비디오 핑거프린트의 생성을 완료한다.After extracting the sub video fingerprint for each frame image constituting the video, the video feature extractor 20 groups the extracted sub video fingerprints to complete generation of the video fingerprint for the video file.

상술한 비디오 핑거프린트 추출 기법은 Job Oostveen, Ton Kalker, Jaap Haitsma의 논문 "Feature Extraction and a Database Strategy for Video Fingerprinting"(Lecture Notes in Computer Science 2314 Springer 2002, pp.117-128) 에 개시되어 있다. 따라서, 상기 논문의 모든 내용은 본 발명의 구성의 일부로 통합될 수 있다. 한편, 본 발명은 비디오 핑거프린트를 추출하는 구체적인 방식에 의해 한정되지 않으므로, 비디오 핑거프린트를 추출할 수 있는 알고리즘이라면 어떠한 것이라도 채용 가능하다.The above-described video fingerprint extraction technique is disclosed in Job Oostveen, Ton Kalker, Jaap Haitsma's article "Feature Extraction and a Database Strategy for Video Fingerprinting" (Lecture Notes in Computer Science 2314 Springer 2002, pp. 117-128). Accordingly, all content of the article can be incorporated as part of the construction of the present invention. On the other hand, the present invention is not limited by the specific method of extracting the video fingerprint, any algorithm that can extract the video fingerprint can be employed.

상기 파일중복 검사부(30)는 비디오 특징 추출부(20)로부터 각 동영상 파일(MF)의 비디오 핑거프린트를 입력받는다. 그런 다음, 각 동영상 파일(MF)의 비디 오 핑거프린트를 상호 대비한다. 그 결과, 비디오 핑거프린트 사이의 유사도가 임계치 이상이면, 해당하는 동영상 파일들은 중복된 파일로 판단한다. 반대로, 비디오 핑거프린트 사이의 유사도가 임계치보다 작으면, 해당하는 동영상 파일들은 서로 중복되지 않는 것으로 판단한다. The file duplication checker 30 receives a video fingerprint of each video file MF from the video feature extractor 20. Then, contrast the video fingerprint of each video file (MF). As a result, if the similarity between video fingerprints is equal to or greater than a threshold, corresponding video files are determined to be duplicate files. On the contrary, if the similarity between video fingerprints is smaller than the threshold, it is determined that corresponding video files do not overlap each other.

예를 들어, 제1비디오 핑거프린트와 제2비디오 핑거프린트의 유사도를 비교한다면, 상기 파일중복 검사부(30)는 제1비디오 핑거프린트를 쿼리 핑거프린트로 지정하고, 제2비디오 핑거프린트를 비교 대상 핑거프린트로 지정한다. 그런 다음, 쿼리 핑거프린트에 포함된 서브 비디오 핑거프린트를 프레임 순서대로 순차적으로 추출하면서 추출된 서브 비디오 핑거프린트와 동일한 서브 비디오 핑거프린트가 비교 대상 핑거프린트에 존재하는지 판별한다. 그 결과, 동일한 서브 비디오 핑거프린트가 존재하는 것으로 판별되면, 상기 파일중복 검사부(30)는 쿼리 핑거프린트와 비교 대상 핑거프린트로부터 서브 비디오 핑거프린트가 일치하는 프레임을 전후로 하여 미리 정해진 수(예컨대, 100개)의 프레임에 대한 복수의 서브 비디오 핑거프린트를 추출한다. 그러고 나서, 추출된 서브 비디오 핑거프린트 그룹을 상호 대비하여 제1 및 제2비디오 핑거프린트 간의 유사도를 판별한다.For example, if the similarity between the first video fingerprint and the second video fingerprint is compared, the file duplication checker 30 designates the first video fingerprint as the query fingerprint, and compares the second video fingerprint with the object to be compared. Set to fingerprint. Thereafter, the sub video fingerprints included in the query fingerprint are sequentially extracted in the frame order to determine whether the same sub video fingerprint as the extracted sub video fingerprint exists in the comparison target fingerprint. As a result, when it is determined that the same sub video fingerprint exists, the file duplication inspection unit 30 determines a predetermined number (eg, 100) before and after a frame where the sub video fingerprint matches from the query fingerprint and the comparison target fingerprint. Extract a plurality of sub video fingerprints for the < RTI ID = 0.0 > Then, the similarity between the first and second video fingerprints is determined by comparing the extracted sub video fingerprint groups with each other.

일 예로, 상기 파일중복 검사부(30)는 제1 및 제2비디오 핑거프린트로부터 추출된 서브 비디오 핑거프린트 그룹을 상호 대비하여 일치하는 서브 비디오 핑거프린트 쌍의 비율을 계산한 후 그 값을 미리 설정한 임계치와 비교하여 제1 및 제2비디오 핑거프린트 간의 유사도를 판별한다.As an example, the file duplication checker 30 compares the sub video fingerprint groups extracted from the first and second video fingerprints with each other, calculates a ratio of matching sub video fingerprint pairs, and sets the value in advance. The similarity between the first and second video fingerprints is determined by comparing with the threshold.

다른 예로, 상기 파일중복 검사부(30)는 제1 및 제2비디오 핑거프린트로부터 추출된 서브 비디오 핑거프린트 그룹의 상호 대응되는 서브 비디오 핑거프린트 간의 비트 에러율(Bit Error Rate)을 근거로 전체 평균 비트 에러율을 계산한 후 그 크기를 미리 설정한 임계치와 비교하여 제1 및 제2비디오 핑거프린트 간의 유사도를 판별한다.As another example, the file duplication checker 30 may determine the overall average bit error rate based on a bit error rate between sub video fingerprints of the sub video fingerprint groups extracted from the first and second video fingerprints. After calculating the, compare the size with a preset threshold to determine the similarity between the first and second video fingerprint.

한편, 상술한 방식 이외에도 상기 파일중복 검사부(30)는 단순히 쿼리 핑거프린트 내에 포함된 서브 비디오 핑거프린트 중 비교대상 핑거프린트 내에 포함된 서브 비디오 핑거프린트의 비율을 계산한 후 그 크기를 미리 설정한 임계치와 비교하여 제1 및 제2비디오 핑거프린트 간의 유사도를 판별할 수도 있다.Meanwhile, in addition to the above-described method, the file duplication inspection unit 30 simply calculates a ratio of the sub video fingerprints included in the comparison target fingerprint among the sub video fingerprints included in the query fingerprint, and then sets a size in advance. The degree of similarity between the first and second video fingerprints may be determined in comparison with.

상기한 실시예에서는 2개의 비디오 핑거프린트 간의 유사도를 판별하는 경우를 예로 들어 설명하였다. 만약, 비교 대상이 되는 핑거프린트의 수가 3개 이상인 경우는, 조합 가능한 모든 2개의 비디오 핑거프린트 쌍에 대해 상술한 유사도 판단 방식이 동일하게 적용될 것임은 본 발명이 속한 기술분야에서 통상의 지식을 가진 자에게 자명하다.In the above-described embodiment, a case of determining similarity between two video fingerprints has been described as an example. If the number of fingerprints to be compared is three or more, the similarity determination method described above will be equally applied to all two video fingerprint pairs that can be combined. Self-explanatory

상기한 바와 같이 비디오 핑거프린트를 이용하여 동영상 파일(MF) 간의 중복 여부를 판단하면, 영상의 내용을 기반으로 동영상 파일(MF)의 실질적 동일성을 판단할 수 있다. 비교되는 비디오 핑거프린트가 임계치 이상의 유사도를 가지고 있으면 동영상 파일(MF)들이 동일한 영상을 담고 있는 동일한 파일들이라고 볼 수 있기 때문이다.As described above, if it is determined whether the video file MF is overlapped using the video fingerprint, the substantially sameness of the video file MF may be determined based on the content of the image. This is because when the video fingerprints to be compared have a similarity above the threshold, the video files MF may be regarded as the same files containing the same image.

상기 파일중복 검사부(30)는 복수의 동영상 파일(MF)에 대한 중복 검사가 완료되면 중복 검사 정보를 파일 관리부(40)로 출력한다. 바람직하게, 상기 중복 검 사 정보는 내용이 중복되는 것으로 판별된 동영상 파일들의 그룹 식별코드, 각 그룹에 속한 동영상 파일명, 각 파일의 종류, 각 파일의 인코딩 방식, 각 파일의 인코딩 효율, 각 파일의 품질 우선 순위, 파일의 용량, 파일 생성 시점 등을 포함한다.The file duplication inspection unit 30 outputs the duplication inspection information to the file manager 40 when the duplication inspection for the plurality of video files MF is completed. Preferably, the duplicate inspection information includes a group identification code of video files determined to be duplicated in content, a video file name belonging to each group, a type of each file, an encoding method of each file, an encoding efficiency of each file, and a Quality priority, file size, file creation time, and the like.

상기 파일 관리부(40)는 중복 검사 정보를 참조하여 내용이 동일한 동영상 파일들을 스토리지(50)로부터 식별한 후 동영상 파일의 중복 기록 상태를 제거한다.The file manager 40 identifies the video files having the same contents from the storage 50 with reference to the duplicate inspection information, and then removes the redundant recording state of the video file.

일 예로, 상기 파일 관리부(40)는 동일성이 있다고 판단된 복수의 동영상 파일 중 하나의 파일만을 스토리지(50)에 저장하고 나머지 파일은 삭제한다. 다른 예로, 상기 파일 관리부(40)는 동일성이 있다고 판단된 복수의 동영상 파일 중 하나의 파일만을 스토리지(50)에 저장하고 나머지 파일은 스토리지(50)에 할당된 별도의 저장공간으로 이동시킨다.For example, the file manager 40 stores only one file of the plurality of video files determined to be identical in the storage 50 and deletes the remaining files. As another example, the file manager 40 stores only one file of the plurality of video files determined to be identical in the storage 50 and moves the remaining files to a separate storage space allocated to the storage 50.

여기서, 저장되는 파일의 선정 기준은 동영상 파일의 품질이 될 수 있다. 즉, 품질이 가장 우수한 동영상 파일만을 스토리지(50)에 저장한다. 예를들어, 동영상 디지털 파일에 대해서 압축 부호화율이 가장 낮은 파일만을 스토리지(50)에 저장한다.Here, the selection criteria of the stored file may be the quality of the video file. That is, only the video file having the highest quality is stored in the storage 50. For example, only the file having the lowest compression coding rate for the moving picture digital file is stored in the storage 50.

상기 파일 관리부(40)는 파일의 삭제 또는 이동 프로세스를 자동으로 수행해도 무방하지만, 삭제 또는 이동 대상 파일을 사용자로부터 직접 지정받아도 무방하다. 이런 경우, 상기 파일 관리부(40)는 사용자 인터페이스를 통해 동일성이 있다고 판단된 동영상 파일들의 리스트(파일명, 저장위치, 압축 부호화율, 화면크기, 파일 용량, 타이틀과 같은 메타 데이터 및 태그정보 등)를 그룹화하여 제공하며, 상기 사용자 인터페이스를 통해 파일 관리자로부터 삭제 또는 이동 대상 파일을 지정 받아 해당 파일의 삭제 또는 이동 프로세스를 진행할 수 있다.The file manager 40 may automatically perform a file deletion or moving process. However, the file manager 40 may directly designate a file to be deleted or moved by a user. In this case, the file manager 40 displays a list of video files (file name, storage location, compression rate, screen size, file size, metadata such as title, tag information, etc.) determined to be identical through a user interface. Grouping is provided, and a file to be deleted or moved is designated from a file manager through the user interface, and a process of deleting or moving the corresponding file may be performed.

상술한 시스템은, 컴퓨터 시스템의 스토리지에 저장된 동영상 파일들의 동일성 여부를 영상의 내용 기반으로 판별하여 중복 저장된 동영상 파일을 삭제하거나 별도의 저장 공간으로 이동시킴으로써 스토리지 공간의 효율적인 사용을 가능하게 한다.The above-described system enables efficient use of the storage space by determining whether the video files stored in the storage of the computer system are identical based on the content of the video and deleting the duplicately stored video files or moving them to a separate storage space.

도 2는 본 발명의 제2실시예에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 개략적인 구성을 도시한 블록도이다.2 is a block diagram illustrating a schematic configuration of a system for checking and managing video file duplication based on image information according to a second embodiment of the present invention.

제2실시예에 따른 시스템은 파일 입력부(10), 비디오 특징 추출부(20), 파일중복 검사부(30), 파일 관리부(40), 스토리지(50) 및 비디오 핑거프린트 DB(60)를 포함한다.The system according to the second exemplary embodiment includes a file input unit 10, a video feature extractor 20, a file duplication checker 30, a file manager 40, a storage 50, and a video fingerprint DB 60. .

상기 파일 입력부(10)는 동영상 파일(MF)을 입력받는다. 동영상 파일(MF)은 컴퓨터 시스템의 스토리지(50)에 저장된 파일일 수도 있고, 입출력 인터페이스 또는 네트워크 인터페이스를 통해 외부로부터 전송된 파일일 수도 있다. 전자의 경우, 상기 파일 입력부(10)는 스토리지(50)에 저장된 동영상 파일을 파일 관리자가 임의로 선택할 수 있는 인터페이스를 제공하는 것이 바람직하다. 후자의 경우, 동영상 파일(MF)은 UCC 서비스, 블로그나 미니 홈페이지 서비스, 공개 자료실 등을 통해 업로드된 파일, P2P 파일 공유 서비스를 통해 외부 통신망으로부터 전송된 파일 또는 USB를 통해 이동 디스크로부터 입력된 파일일 수 있다. 상기 컴퓨터 시스 템은 퍼스널 컴퓨터 또는 대용량의 서버 컴퓨터이다.The file input unit 10 receives a video file MF. The video file MF may be a file stored in the storage 50 of the computer system or may be a file transmitted from the outside through an input / output interface or a network interface. In the former case, the file input unit 10 preferably provides an interface through which a file manager can arbitrarily select a video file stored in the storage 50. In the latter case, a video file (MF) is a file uploaded via a UCC service, a blog or mini homepage service, a public archive, etc., a file transferred from an external communication network via a P2P file sharing service, or a file input from a mobile disk via USB. Can be. The computer system is a personal computer or a large server computer.

상기 비디오 특징 추출부(20)는 입력된 동영상 파일(MF)로부터 비디오 핑거프린트를 추출한다. 비디오 핑거프린트의 추출과 관련된 구성은 제1실시에의 경우와 실질적으로 동일하다.The video feature extractor 20 extracts a video fingerprint from the input video file MF. The configuration related to the extraction of the video fingerprint is substantially the same as in the first embodiment.

상기 파일중복 검사부(30)는 비디오 특징 추출부(20)로부터 추출된 비디오 핑거프린트를 입력받는다. 그런 다음, 스토리지(50)에 저장되어 있는 동영상 파일에 대한 비디오 핑거프린트를 누적적으로 수록하고 있는 비디오 핑거프린트 DB(60)를 기준으로 파일 입력부(10)를 통해 신규 입력된 동영상 파일(MF)의 중복 여부를 판별한다. 즉, 파일중복 검사부(30)는 비디오 핑거프린트 DB(60)에 저장된 각 동영상 파일의 비디오 핑거프린트(즉, 비교 대상 핑거프린트)와 비디오 특징 추출부(20)가 추출한 비디오 핑거프린트(즉, 쿼리 핑거프린트)를 상호 비교하여 쿼리 핑거프린트와 대응되는 비교 대상 핑거프린트가 비디오 핑거프린트 DB(60) 내에 존재하는지 판단한다. 여기서, 비디오 핑거프린트가 상호 대응된다 함은 임계치 이상의 유사도를 갖는 비디오 핑거프린트가 비디오 핑거프린트 DB(60)에 이미 등록되어 있음을 의미한다. 비디오 핑거프린트 간의 유사도 판단 방식은 이미 상술한 바 있다. 상기 판단 결과, 대응되는 비디오 핑거프린트가 있으면 입력된 동영상 파일(MF)과 영상의 내용이 중복되는 동영상 파일이 스토리지(50)에 이미 저장되어 있는 것을 의미한다. 반면, 대응되는 비디오 핑거프린트가 없으면 입력된 동영상 파일(MF)과 영상의 내용이 중복되는 동영상 파일이 스토리지(50)에 저장되어 있지 않다는 것을 의미한다. 상기 파일중복 검사부(30)는 비디오 핑거프린트 DB(60)를 활 용하여 신규 입력된 동영상 파일(MF)의 중복 검사를 완료한 후 중복 검사 정보를 파일 관리부(40)로 출력한다.The file duplication checker 30 receives a video fingerprint extracted from the video feature extractor 20. Then, the video file MF newly input through the file input unit 10 based on the video fingerprint DB 60 that cumulatively records the video fingerprint of the video file stored in the storage 50. Determine if duplicates exist. In other words, the file duplication inspection unit 30 is a video fingerprint (ie, a comparison target fingerprint) of each video file stored in the video fingerprint DB 60 and a video fingerprint extracted from the video feature extractor 20 (ie, a query). Fingerprints) are compared with each other to determine whether a comparison target fingerprint corresponding to the query fingerprint exists in the video fingerprint DB 60. Here, video fingerprints correspond to each other means that a video fingerprint having a similarity or higher than a threshold is already registered in the video fingerprint DB 60. The similarity determination method between the video fingerprints has already been described above. As a result of the determination, if there is a corresponding video fingerprint, it means that the video file MF overlapping the content of the image is already stored in the storage 50. On the other hand, if there is no corresponding video fingerprint, it means that the video file MF overlapping the content of the video is not stored in the storage 50. The file duplication checker 30 completes the redundancy check of the newly input video file MF using the video fingerprint DB 60 and outputs the duplicate check information to the file manager 40.

바람직하게, 상기 중복 검사 정보는 내용이 중복되는 동영상 파일의 발견 여부를 포함하고, 내용이 중복되는 동영상 파일이 발견된 경우, 스토리지에 수록된 동영상 파일명 및 저장위치, 입력된 동영상 파일명, 각 파일의 종류, 각 파일의 인코딩 방식, 각 파일의 인코딩 효율, 각 파일의 품질 우선 순위, 파일의 용량, 파일 생성시점, 타이틀과 같은 메타 데이터, 태그정보 등을 포함한다.Preferably, the duplication check information includes whether a video file with duplicate contents is found, and when a video file with duplicate contents is found, the video file name and storage location, the input video file name, and the type of each file in the storage. The encoding method of each file, encoding efficiency of each file, quality priority of each file, file size, file creation time, metadata such as title, tag information, and the like.

상기 파일 관리부(40)는 파일중복 검사부(30)로부터 동영상 파일(MF)이 기 저장되어 있는 파일과 동일하지 않다는 취지의 중복 검사 정보가 입력되면, 스토리지(50)와 비디오 핑거프린트 DB(60)에 동영상 파일(MF)과 비디오 핑거프린트를 신규로 각각 저장한다. 반면, 파일중복 검사부(30)로부터 동영상 파일(MF)이 기 저장되어 있는 파일과 중복된다는 취지의 중복 검사 정보가 입력되면, 상기 파일 관리부(40)는 동영상 파일(MF)과 비디오 핑거프린트의 신규 저장 과정을 생략하거나, 스토리지(50)와 비디오 핑거프린트 DB(60)에 마련된 별도의 저장 공간으로 동영상 파일(MF)과 비디오 핑거프린트를 각각 이동시키거나, 기 저장된 동영상 파일과 신규로 입력된 동영상 파일(MF)의 품질을 대비하여 신규로 입력된 동영상 파일(MF)의 품질이 우수하면 스토리지(50) 및 비디오 핑거프린트 DB(60)에 저장된 정보를 신규 입력된 동영상 파일(MF) 및 이로부터 추출한 비디오 핑거프린트로 갱신할 수 있다.When the duplicated inspection information is input from the file duplication inspection unit 30 to the effect that the video file MF is not the same as the pre-stored file, the file management unit 40 stores the storage 50 and the video fingerprint DB 60. The video file MF and the video fingerprint are newly stored respectively. On the other hand, if duplicate inspection information is input from the file duplication inspection unit 30 to the effect that the video file MF is duplicated with the pre-stored file, the file management unit 40 newly generates the video file MF and the video fingerprint. Omit the storing process, move the video file MF and the video fingerprint to separate storage spaces provided in the storage 50 and the video fingerprint DB 60, or store the previously stored video file and the newly input video. If the quality of the newly inputted video file MF is excellent in preparation for the quality of the file MF, the information stored in the storage 50 and the video fingerprint DB 60 is transferred from the newly inputted video file MF and the same. It can be updated with the extracted video fingerprint.

대안적으로, 상기 파일 관리부(40)는 파일중복 검사부(30)로부터 동영상 파일(MF)이 기 저장되어 있는 파일과 중복된다는 취지의 중복 검사 정보가 입력되면, 동영상 파일(MF)이 기 저장된 파일과 중복된다는 취지의 메시지와 함께 '별도 저장', '저장 생략' 또는 '파일 갱신' 중 어느 하나의 처리 옵션을 선택할 수 있는 인터페이스를 파일 관리자에게 제공할 수 있다. 이런 경우, 상기 파일 관리부(40)는 파일 관리자가 지정한 옵션 선택에 따라 상술한 각 절차를 진행한다.Alternatively, the file manager 40 receives a duplicate check information from the file duplication checker 30 to indicate that the video file MF is duplicated with a previously stored file. A file manager may be provided with an interface for selecting one of processing options such as 'save separately', 'omit storage', or 'file update' with a message indicating that the data is duplicated. In this case, the file manager 40 proceeds to each of the above-described procedures according to the option selected by the file manager.

한편, 상기 비디오 특징 추출부(20)는 입력된 동영상 파일(MF)로부터 헤더 및 메타 정보를 더 추출할 수 있다. 이런 경우, 추출된 헤더 및 메타 정보는 파일 관리부(40)로 전달된다. 그러면, 상기 파일 관리부(40)는 비디오 핑거프린트 DB(60)에 비디오 핑거프린트를 신규로 저장 또는 갱신할 때 헤더 및 메타 정보도 함께 결합하여 저장 또는 갱신할 수 있다.The video feature extractor 20 may further extract header and meta information from the input video file MF. In this case, the extracted header and meta information are transferred to the file manager 40. Then, the file manager 40 may store or update the header and meta information together when newly storing or updating the video fingerprint in the video fingerprint DB 60.

상술한 본 발명의 제2실시예는 퍼스널 컴퓨터 또는 대용량의 서버 컴퓨터에서 동영상 파일에 대한 통합 데이터베이스를 구축하는데 유용하다. 특히, 동영상 검색 서비스의 제공을 위한 동영상 데이터베이스의 구축에 활용하면, 스토리지의 공간을 효율적으로 활용할 수 있을 뿐만 아니라 동영상 검색 결과에서 내용이 중복되는 동영상 정보가 반복적으로 노출되는 것을 원천적으로 차단할 수 있다.The second embodiment of the present invention described above is useful for constructing an integrated database for moving picture files in a personal computer or a large server computer. In particular, when used to build a video database for providing a video search service, not only can the storage space be efficiently used, but also the video information that is duplicated in the video search results can be blocked from being repeatedly exposed.

도 3은 본 발명의 제3실시예에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 개략적인 구성을 도시한 블록도이다.3 is a block diagram illustrating a schematic configuration of a system for checking and managing video file duplication based on image information according to a third embodiment of the present invention.

제3실시예에 따른 시스템은, 제2실시예와 같이 동영상 파일(MF)이 입력될 때마다 동영상 파일의 중복 여부를 판별하여 데이터베이스화 여부를 결정하지 않는다. 대신, 일정한 시간 동안 파일 입력부(10)를 통해 입력되는 동영상 파일(MF)들과 이들로부터 추출된 비디오 핑거프린트를 대량으로 데이터베이스화한 후, 배 치(batch) 처리를 통해 데이터베이스화된 동영상 파일들의 중복 여부를 판별하고 파일의 중복 저장 상태를 일괄적으로 해소하는 것을 특징으로 한다.The system according to the third embodiment does not determine whether to make a database by determining whether a video file is duplicated each time the video file MF is input as in the second embodiment. Instead, the video files MF inputted through the file input unit 10 and the video fingerprints extracted from them are databased in a large amount of time, and then batched to process the database files. It is characterized by determining whether or not to duplicate and collectively eliminate the redundant storage state of the file.

구체적으로 파일 입력부(10)와 비디오 특징 추출부(20)의 기능은 전술한 제2실시예와 동일하다. 대신 파일 DB화부(70)가 더 추가된다. 파일 DB화부(70)는 비디오 특징 추출부(20)에 의해 비디오 핑거프린트의 추출이 완료되면, 곧 바로 스토리지(50) 및 비디오 핑거프린트 DB(60)에 각각 동영상 파일(MF) 및 이로부터 추출된 비디오 핑거프린트를 저장한다. 이 때, 제2실시예와 마찬가지로 비디오 특징 추출부(20)가 동영상 파일(MF)의 헤더와 메타 정보를 더 추출하면, 파일 DB화부(70)는 비디오 핑거프린트와 헤더 및 메타 정보를 결합시켜 비디오 핑거프린트 DB(60)에 저장한다. 이러한 과정은 파일 입력부(10)를 통해 동영상 파일(MF)이 신규로 입력될 때마다 반복된다. 따라서, 일정한 기간 동안 n개의 동영상 파일이 입력되면 n개의 동영상 파일과 n개의 비디오 핑거프린트가 스토리지(50) 및 비디오 핑거프린트 DB(60)에 각각 저장되어 있게 된다. 이러한 상태에서, 동영상 파일(MF)의 중복 저장 상태를 제거하기 위해 파일중복 검사부(30)가 실행된다. 파일중복 검사부(30)는 파일 관리자에 의해 실행될 수도 있고, 미리 설정된 주기로 자동 실행될 수도 있다.In more detail, the functions of the file input unit 10 and the video feature extractor 20 are the same as those of the second embodiment. Instead, the file DBization unit 70 is further added. When the extraction of the video fingerprint is completed by the video feature extraction unit 20, the file DB unit 70 extracts the video file MF and the video file MF from the storage 50 and the video fingerprint DB 60, respectively. The stored video fingerprint. At this time, as in the second embodiment, if the video feature extractor 20 further extracts the header and meta information of the video file MF, the file DB unit 70 combines the video fingerprint with the header and meta information. The video fingerprint is stored in the DB 60. This process is repeated whenever a video file MF is newly input through the file input unit 10. Therefore, when n video files are input for a certain period, n video files and n video fingerprints are stored in the storage 50 and the video fingerprint DB 60, respectively. In this state, the file duplication inspection unit 30 is executed to remove the redundant storage state of the moving image file MF. The file duplication checker 30 may be executed by the file manager or may be automatically executed at a predetermined cycle.

상기 파일중복 검사부(30)는 비디오 핑거프린트 DB(60)로부터 중복 검사가 이루어지지 않은 n개의 동영상 파일에 대한 비디오 핑거프린트를 독출한다. 그런 다음, 조합 가능한 모든 비디오 핑거프린트 쌍에 대한 유사도를 계산하여 임계값 이상의 유사도를 갖는 비디오 핑거프린트 값끼리 그룹핑을 수행한다. 이 때, 특정 그룹에 속한 비디오 핑거프린트의 수가 k개라면 영상의 내용이 동일한 k개의 동영상 파일이 스토리지에 중복 저장되어 있음을 의미한다. 비디오 핑거프린트 쌍 간의 유사도 계산 방식은 이미 상술한 바 있으므로, 반복적인 설명은 생략한다.The file duplication checker 30 reads the video fingerprints for the n video files for which the duplicate check is not performed from the video fingerprint DB 60. Then, similarity is calculated for all combinable video fingerprint pairs, and video fingerprint values having similarity or more than a threshold value are grouped. In this case, if the number of video fingerprints belonging to a specific group is k, it means that k video files having the same content of the image are duplicated and stored in the storage. Since the similarity calculation scheme between the video fingerprint pairs has already been described above, repetitive description is omitted.

상기 파일중복 검사부(30)는 비디오 핑거프린트 값에 대한 그룹핑을 완료한 후 중복 검사 정보를 파일 관리부(40) 측으로 전달한다. 상기 중복 검사 정보는 그룹 식별정보와 각 그룹에 속하는 동영상 파일들의 식별정보(파일명)를 포함한다. 나아가, 스토리지(50)에 수록된 동영상 파일의 저장위치, 각 파일의 종류, 각 파일의 인코딩 방식, 각 파일의 인코딩 효율, 각 파일의 품질 우선 순위, 파일의 용량, 파일 생성시점, 타이틀과 같은 메타 데이터 및 태그정보 등의 정보를 포함한다.The file duplication checker 30 transfers the duplicate check information to the file manager 40 after completing the grouping of the video fingerprint value. The duplicate check information includes group identification information and identification information (file name) of video files belonging to each group. Furthermore, meta, such as the storage location of the video file stored in the storage 50, the type of each file, the encoding method of each file, the encoding efficiency of each file, the quality priority of each file, the file size, the file creation point, the title, and the like. It includes information such as data and tag information.

상기 파일 관리부(40)는 중복 검사 정보를 참조하여 내용이 동일한 동영상 파일들을 스토리지(50)로부터 식별한 후 동영상 파일의 중복 저장 상태를 제거한다.The file manager 40 identifies the video files having the same contents from the storage 50 with reference to the duplicate check information, and then removes the redundant storage state of the video file.

일 예로, 상기 파일 관리부(40)는 내용이 중복되는 것으로 판단된 복수의 동영상 파일 중 하나의 파일만을 남기고 나머지 파일은 스토리지(50)로부터 삭제한다. 그리고, 삭제된 동영상 파일의 비디오 핑거프린트도 비디오 핑거프린트 DB(60)로부터 제거한다.As an example, the file manager 40 deletes only one file of the plurality of video files determined to be duplicated in content and deletes the remaining files from the storage 50. The video fingerprint of the deleted video file is also removed from the video fingerprint DB 60.

다른 예로, 상기 파일 관리부(40)는 내용이 중복되는 것으로 판단된 복수의 동영상 파일 중 하나의 파일만을 남기고 나머지 파일은 스토리지(50)에 할당된 별도의 저장 공간으로 이동시킨다. 그리고, 이동된 동영상 파일에 대한 비디오 핑거프린트도 비디오 핑거프린트 DB(60)에 마련된 별도 저장 공간으로 이동시킨다.As another example, the file manager 40 leaves only one file of a plurality of video files determined to be duplicated in content, and moves the remaining files to a separate storage space allocated to the storage 50. The video fingerprint for the moved video file is also moved to a separate storage space provided in the video fingerprint DB 60.

여기서, 파일의 삭제 또는 이동의 기준은 동영상 파일의 품질이 될 수 있다. 즉, 품질이 가장 우수한 동영상 파일만을 남기고 나머지 동영상 파일은 삭제 또는 이동시킨다.Here, the criterion of deleting or moving the file may be the quality of the video file. That is, only the video file of the highest quality is left and the remaining video file is deleted or moved.

상기 파일 관리부(40)는 파일의 삭제 또는 이동 프로세스를 자동으로 수행해도 무방하지만, 삭제 또는 이동 대상 파일을 파일 관리자로부터 직접 지정 받아도 무방하다. 이런 경우, 상기 파일 관리부(40)는 사용자 인터페이스를 통해 내용이 중복되고 있는 것으로 판단된 동영상 파일들의 리스트를 그룹화하여 제공한다. 그런 다음, 상기 사용자 인터페이스를 통해 파일 관리자로부터 삭제 또는 이동 대상 파일을 지정 받아 해당 파일의 삭제 또는 이동 프로세스를 진행할 수 있다.The file manager 40 may automatically perform a file deletion or moving process. However, the file manager 40 may directly receive a file to be deleted or moved from a file manager. In this case, the file manager 40 groups and provides a list of video files determined to be duplicated through the user interface. Thereafter, a file to be deleted or moved is designated from the file manager through the user interface to proceed with the process of deleting or moving the file.

상술한 제3실시예는 퍼스널 컴퓨터 또는 대용량 서버 컴퓨터에 기록된 다량의 동영상 파일에 대한 중복 여부를 판별하여 스토리지를 효율적으로 관리하고자 할 때 유용하게 활용될 수 있다. 특히, 불특정 다수의 네티즌으로부터 다량의 동영상 파일을 제공받아 다양한 콘텐츠 제공 서비스를 제공하는 사업자의 입장에서 스토리지의 효율성을 제고하고 콘텐츠 서비스의 질을 높이는데 유의미한 효과가 있다.The above-described third embodiment can be usefully used to efficiently manage storage by determining whether a plurality of moving image files recorded on a personal computer or a large server computer are duplicated. In particular, in the case of an operator who provides a large amount of video files from an unspecified number of netizens and provides a variety of content providing services, there is a significant effect to improve the efficiency of storage and the quality of content services.

도 4는 본 발명의 제1실시예에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 방법의 순차적 흐름을 도시한 순서도이다. 도면에서, 각 단계의 실행 주체는 도 1에 도시된 시스템이다.4 is a flowchart illustrating a sequential flow of a method for checking and managing video file duplication based on image information according to a first embodiment of the present invention. In the figure, the execution subject of each step is the system shown in FIG.

먼저, 단계(S101)에서, 복수의 동영상 파일을 입력받는다. 그런 다음, 단계(S102)에서, 상기 입력된 각 동영상 파일에 포함된 영상 데이터를 분석하여 비디 오 핑거프린트를 추출한다. 만약, n 개의 동영상 파일을 입력받았다면, n 개 파일의 비디오 핑거프린트가 추출된다. 여기서, n 은 2보다 큰 정수이다. 이어서, 단계(S103)에서 상기 추출된 각 비디오 핑거프린트를 상호 대비하여 동영상 파일들 간의 중복 여부를 판단하여 중복 검사 정보를 파일 관리자에게 출력한다.First, in step S101, a plurality of video files are input. Then, in step S102, the video fingerprint is extracted by analyzing the image data included in each of the inputted video files. If n video files are input, video fingerprints of n files are extracted. Where n is an integer greater than two. Subsequently, in operation S103, the extracted video fingerprints are compared with each other to determine whether the video files are overlapped, and the duplicate inspection information is output to the file manager.

바람직하게, 상기 중복 검사 정보는 그래픽 인터페이스로 출력한다. 상기 중복 검사 정보는 내용이 중복되는 것으로 판별된 동영상 파일들의 그룹 식별코드, 각 그룹에 속한 동영상 파일명, 각 파일의 종류, 각 파일의 인코딩 방식, 각 파일의 인코딩 효율, 각 파일의 품질 우선 순위, 파일의 용량, 파일 생성시점, 타이틀과 같은 메타 데이터 및 태그정보 등을 포함한다.Preferably, the redundancy check information is output in a graphic interface. The duplication check information includes a group identification code of video files determined to be duplicated in content, a video file name belonging to each group, a type of each file, an encoding method of each file, an encoding efficiency of each file, a quality priority of each file, File size, file creation time, metadata such as title, tag information, and the like.

단계(S104)에서, 파일 관리자는 출력된 중복 검사 정보를 인지한 후 삭제 또는 이동시킬 파일을 선택할 수 있다. 삭제 또는 이동 대상 파일의 선택이 이루어지면, 선택된 파일을 삭제하거나 스토리지(50)에 마련된 별도의 저장 공간으로 이동시킨다. 아울러, 단계(S104)에서, 파일 관리자는 스토리지(50)에 저장할 파일을 선택할 수 있다. 그러면, 선택된 파일은 스토리지(50)에 저장된다. 물론, 선택되지 않은 파일들은 별도의 저장 공간으로 이동되거나 삭제될 수 있다.In operation S104, the file manager may select a file to be deleted or moved after recognizing the duplicated output information. When a file to be deleted or moved is selected, the selected file is deleted or moved to a separate storage space provided in the storage 50. In addition, in step S104, the file manager may select a file to be stored in the storage 50. The selected file is then stored in storage 50. Of course, files that are not selected may be moved or deleted to a separate storage space.

도 5는 본 발명의 제2실시예에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 방법의 순차적 흐름을 도시한 순서도이다. 도면에서, 각 단계의 실행 주체는 도 2에 도시된 시스템이다.5 is a flowchart illustrating a sequential flow of a method for checking and managing video file duplication based on image information according to a second embodiment of the present invention. In the figure, the execution subject of each step is the system shown in FIG.

먼저, 단계(S200)에서 다수의 동영상 파일에 대한 비디오 핑거프린트를 저장하고 있는 비디오 핑거프린트 DB를 제공한다. 바람직하게, 상기 비디오 핑거프린트 DB에는 스토리지에 저장된 모든 동영상 파일에 대한 비디오 핑거프린트가 수록되어 있다.First, in operation S200, a video fingerprint DB that stores video fingerprints for a plurality of video files is provided. Preferably, the video fingerprint DB includes video fingerprints for all video files stored in the storage.

그런 다음, 단계(S201)에서, 동영상 파일을 입력받는다. 그러고 나서, 단계(S202)에서, 상기 입력된 동영상 파일에 포함된 영상 데이터를 분석하여 비디오 핑거프린트를 추출한다.Then, in step S201, a video file is input. Then, in step S202, the video fingerprint is extracted by analyzing the image data included in the input video file.

이어서, 단계(S203)에서, 상기 추출된 비디오 핑거프린트와 상기 비디오 핑거프린트 DB에 저장된 다른 동영상 파일들의 비디오 핑거프린트들을 상호 대비하여 동영상 파일 간의 중복 여부를 영상의 내용 기반으로 판단한다. 그런 다음, 중복 검사 정보를 그래픽 인터페이스를 통해 파일 관리자에게 출력한다. Subsequently, in step S203, video fingerprints of the extracted video fingerprint and other video files stored in the video fingerprint DB are compared with each other to determine whether the video file is overlapped based on the content of the video. Then, duplicate checking information is output to the file manager through a graphical interface.

바람직하게, 상기 중복 검사 정보는 내용이 중복되는 동영상 파일의 발견 여부를 포함하고, 내용이 중복되는 동영상 파일이 발견된 경우, 스토리지에 수록된 동영상 파일명 및 저장위치, 입력된 동영상 파일명, 각 파일의 종류, 각 파일의 인코딩 방식, 각 파일의 인코딩 효율, 각 파일의 품질 우선 순위, 파일의 용량, 파일 생성시점, 타이틀과 같은 메타 데이터 및 태그정보 등을 포함한다. Preferably, the duplication check information includes whether a video file with duplicate contents is found, and when a video file with duplicate contents is found, the video file name and storage location, the input video file name, and the type of each file in the storage. , Encoding method of each file, encoding efficiency of each file, quality priority of each file, file size, file creation time, metadata such as title, tag information, and the like.

단계(S204)에서, 파일 관리자는 출력된 중복 검사 정보를 인지한 후 입력된 동영상 파일의 삭제 또는 이동 여부를 선택할 수 있다. 삭제 또는 이동 옵션이 선택되면, 선택된 파일을 스토리지로부터 삭제하거나 스토리지에 마련된 별도의 저장 공간으로 이동시킨다. 경우에 따라, 단계(S204)에서, 파일 관리자는 스토리지에 저장된 동영상 파일을 신규 입력된 동영상 파일로 대체하는 옵션을 선택할 수도 있다. 그러면, 스토리지에 저장된 동영상 파일은 신규 입력된 동영상 파일로 대체된 다.In operation S204, the file manager may select whether to delete or move the input video file after recognizing the duplicated output information. If the delete or move option is selected, the selected file is deleted from the storage or moved to a separate storage space provided in the storage. In some cases, in step S204, the file manager may select an option to replace the video file stored in the storage with the newly input video file. Then, the video file stored in the storage is replaced with the newly input video file.

한편, 단계(204)에서, 이루어지는 파일의 삭제/이동/대체는 파일 관리자의 명시적 요청 없이 자동적으로 이루어질 수 있다. 즉, 신규로 입력된 동영상 파일과 내용이 동일한 동영상 파일이 이미 존재하는 것으로 판명되면, 별도의 중복 검사 정보를 출력하지 않고, 신규로 입력된 동영상 파일을 삭제하거나 별도의 저장 공간으로 이동시킬 수 있고, 신규로 입력된 동영상 파일의 품질이 스토리지에 저장된 동영상 파일의 품질보다 우수한 경우 스토리지에 저장된 동영상 파일을 신규 입력된 동영상 파일로 대체할 수 있다.On the other hand, in step 204, deletion / movement / replacement of the file made can be done automatically without explicit request from the file manager. That is, when it is found that a video file having the same content as the newly input video file already exists, the newly input video file can be deleted or moved to a separate storage space without outputting duplicate check information. If the quality of the newly input video file is higher than the quality of the video file stored in the storage, the video file stored in the storage may be replaced with the newly input video file.

도 6은 본 발명의 제3실시예에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 방법의 순차적 흐름을 도시한 순서도이다. 도면에서, 각 단계의 실행 주체는 도 3에 도시된 시스템이다.6 is a flowchart illustrating a sequential flow of a method for checking and managing video file duplication based on image information according to a third embodiment of the present invention. In the figure, the execution subject of each step is the system shown in FIG.

먼저, 단계(S301)에서, 스토리지에 저장된 복수의 동영상 파일들에 대한 비디오 핑거프린트가 저장되어 있는 비디오 핑거프린트 DB가 제공된다. First, in step S301, a video fingerprint DB is provided in which video fingerprints for a plurality of video files stored in storage are stored.

이어서, 단계(S302)에서, 비디오 핑거프린트 DB에서 스토리지에 저장된 복수의 동영상 파일에 대한 비디오 핑거프린트를 독출한다. n 개 파일의의 비디오 핑거프린트가 비디오 핑거프린트 DB에 저장되어 있다면, n 개 파일 모두를 독출한다. 그런 다음, 조합 가능한 모든 파일의 비디오 핑거프린트 쌍에 대한 유사도를 계산한다.Subsequently, in step S302, video fingerprints for a plurality of video files stored in storage are read from the video fingerprint DB. If the video fingerprint of n files is stored in the video fingerprint DB, all n files are read. The similarity is then calculated for the video fingerprint pairs of all combinable files.

그 다음, 단계(S303)에서, 임계값 이상의 유사도를 갖는 동영상 파일끼리 그룹핑을 수행한다. 그리고, 단계(S304)에서, 스토리지에 저장된 동영상 파일 간의 중복 검사 정보를 출력한다. Next, in step S303, video files having similarity or more than a threshold value are grouped together. In operation S304, duplicate inspection information between moving image files stored in the storage is output.

상기 중복 검사 정보는 그룹 식별정보와 각 그룹에 속하는 동영상 파일들의 식별정보(파일명)를 포함한다. 나아가, 스토리지에 수록된 동영상 파일의 저장위치, 각 파일의 종류, 각 파일의 인코딩 방식, 각 파일의 인코딩 효율, 각 파일의 품질 우선 순위, 파일의 용량, 파일 생성시점, 타이틀과 같은 메타 데이터 및 태그정보 등의 정보를 포함한다.The duplicate check information includes group identification information and identification information (file name) of video files belonging to each group. Furthermore, metadata such as storage location of video files stored in storage, types of each file, encoding method of each file, encoding efficiency of each file, quality priority of each file, file size, file creation point, title, and tags Information such as information is included.

바람직하게, 상기 중복 검사 정보는 그래픽 인터페이스로 출력된다. 그래픽 인터페이스에는 파일 관리자가 동일성이 있다고 판별된 동영상 파일들을 선택하여 삭제 또는 이동시킬 수 있는 인터페이스를 포함한다.Preferably, the duplication check information is output in a graphical interface. The graphical interface includes an interface through which the file manager can select and delete or move video files determined to be identical.

단계(S305)에서, 파일 관리자로부터 삭제 또는 이동할 동영상 파일들을 지정받은 후 해당 동영상 파일을 스토리지로부터 삭제하거나 스토리지에 마련된 별도 저장 공간으로 이동시킨다. 바람직하게, 동영상 파일이 삭제되면, 대응되는 비디오 핑거프린트도 비디오 핑거프린트 DB에서 삭제한다. 그리고, 동영상 파일이 이동되면, 대응되는 비디오 핑거프린트도 비디오 핑거프린트 DB의 별도 저장공간으로 이동시킨다.In operation S305, after receiving the designated video files to be deleted or moved from the file manager, the corresponding video files are deleted from the storage or moved to a separate storage space provided in the storage. Preferably, when the video file is deleted, the corresponding video fingerprint is also deleted from the video fingerprint DB. When the video file is moved, the corresponding video fingerprint is also moved to a separate storage space of the video fingerprint DB.

한편, 동영상 파일의 삭제 또는 이동은 파일 관리자의 요청 없이 자동으로 이루어질 수 있다. 이를 위해, 파일 관리자는 파일 삭제 또는 파일 이동 중 어느 하나의 옵션을 미리 선택해 두는 것이 바람직하다. 자동으로 파일의 삭제 또는 이동이 이루어지는 경우, 파일의 삭제 또는 이동의 기준은 동영상 파일의 품질이 될 수 있다. 즉, 품질이 가장 우수한 동영상 파일만을 남기고 나머지 동영상 파일을 삭제 또는 이동시킨다.Meanwhile, deletion or movement of a video file may be automatically performed without a request of a file manager. For this purpose, it is preferable that the file manager selects one of the options of file deletion or file movement in advance. When the file is deleted or moved automatically, the criterion for deleting or moving the file may be the quality of the video file. In other words, only the video file having the highest quality is left, and the remaining video file is deleted or moved.

본 발명에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 동작 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터에 의해 판독 가능한 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합으로 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 프로그램 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예로는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급언어 코드를 포함한다. 상기한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 동작하도록 구성될 수 있으며, 그 역도 마찬가지이다.The operating method of the system for checking and managing video file duplication based on image information according to the present invention may be implemented in the form of program instructions that can be executed by various computer means and recorded in a computer-readable medium. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. Program instructions recorded on the media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those skilled in the computer program arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Hardware devices specially configured to store and execute program instructions such as magneto-optical media and ROM, RAM, flash memory and the like. The medium may be a transmission medium such as an optical or metal wire, a waveguide, or the like including a carrier wave for transmitting a signal specifying a program command, a data structure, or the like. Examples of program instructions include machine code, such as produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter. Such hardware devices may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.

도 7은 본 발명에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 동작 방법을 수행하는데 채용될 수 있는 범용 컴퓨터 시스템의 내부 블록도이다.7 is an internal block diagram of a general-purpose computer system that may be employed to perform a method of operating a system for checking and managing video file duplication based on image information according to the present invention.

상기 범용 컴퓨터 시스템(400)은 램(RAM: 420)과 롬(ROM: 430)을 포함하는 주기억장치와 연결되는 하나 이상의 프로세서(410)를 포함한다. 프로세서(410)는 중앙처리장치(CPU)로 불리기도 한다. 본 기술분야에서 널리 알려진 바와 같이, 롬(430)은 데이터와 명령을 단방향성으로 프로세서(410)에 전송하는 역할을 하며, 램(420)은 통상적으로 데이터와 명령을 양방향성으로 프로세서(410)로 전송하는데 사용된다. 램(420) 및 롬(430)은 컴퓨터 판독 가능 매체의 어떠한 적절한 형태를 포함할 수 있다. 대용량 기억장치(440)는 양방향성으로 프로세서(410)와 연결되어 추가적인 데이터 저장 능력을 제공하며, 상기된 컴퓨터 판독 가능 기록 매체 중 어떠한 것일 수 있다. 대용량 기억장치(440)는 프로그램, 데이터 등을 저장하는데 사용되며, 통상적으로 주기억장치보다 속도가 느린 하드 디스크와 같은 보조기억장치이다. CD롬(460)과 같은 특정 대용량 기억장치가 사용될 수도 있다. 프로세서(410)는 비디오 모니터, 트랙볼 마우스, 키보드, 마이크로폰, 터치스크린 형 디스플레이, 카드 판독기, 자기 또는 종이 테이프 판독기, 음성 또는 필기 인식기, 조이스틱 또는 기타 공지된 컴퓨터 입출력 장치와 같은 하나 이상의 입출력 인터페이스(450)와 연결된다. 마지막으로, 프로세서(410)는 네트워크 인터페이스(470)를 통하여 유선 또는 무선 통신 네트워크에 연결될 수 있다. 이러한 네트워크 연결을 통하여 상기된 방법의 절차를 수행할 수 있다. 상기된 장치 및 도구는 컴퓨터 하드웨어 및 소프트웨어 기술 분야의 당업자에게 잘 알려져 있다. 한편, 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 동작하 도록 구성될 수 있다.The general purpose computer system 400 includes one or more processors 410 connected to a main memory including a RAM 420 and a ROM 430. The processor 410 is also called a central processing unit (CPU). As is well known in the art, the ROM 430 serves to transmit data and instructions to the processor 410 unidirectionally, and the RAM 420 typically transfers data and instructions to the processor 410 bidirectionally. Used to transmit RAM 420 and ROM 430 may include any suitable form of computer readable media. The mass storage device 440 is bidirectionally coupled to the processor 410 to provide additional data storage capability, and may be any of the computer readable recording media described above. The mass storage device 440 is used to store programs, data, and the like, and is a secondary memory device such as a hard disk which is generally slower than the main memory device. Certain mass storage devices such as CD ROM 460 may be used. The processor 410 may include one or more input / output interfaces 450 such as video monitors, trackball mice, keyboards, microphones, touchscreen displays, card readers, magnetic or paper tape readers, voice or handwriting readers, joysticks, or other known computer input / output devices. ). Finally, the processor 410 may be connected to a wired or wireless communication network through the network interface 470. Through this network connection, the procedure of the method described above can be performed. The apparatus and tools described above are well known to those skilled in the computer hardware and software arts. On the other hand, the hardware device described above may be configured to operate as one or more software modules to perform the operation of the present invention.

이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.As described above, although the present invention has been described by way of limited embodiments and drawings, the present invention is not limited thereto and is intended by those skilled in the art to which the present invention pertains. Of course, various modifications and variations are possible within the scope of equivalents of the claims to be described.

본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 전술된 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되지 않아야 한다.The following drawings, which are attached to this specification, illustrate exemplary embodiments of the present invention, and together with the detailed description of the present invention serve to further understand the technical spirit of the present invention, the present invention includes matters described in such drawings. It should not be construed as limited to.

도 1은 본 발명의 제1실시예에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 개략적인 구성을 도시한 블록도이다.1 is a block diagram illustrating a schematic configuration of a system for checking and managing video file duplication based on video information according to a first embodiment of the present invention.

도 2는 본 발명의 제2실시예에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 개략적인 구성을 도시한 블록도이다.2 is a block diagram illustrating a schematic configuration of a system for checking and managing video file duplication based on image information according to a second embodiment of the present invention.

도 3은 본 발명의 제3실시예에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 개략적인 구성을 도시한 블록도이다.3 is a block diagram illustrating a schematic configuration of a system for checking and managing video file duplication based on image information according to a third embodiment of the present invention.

도 4는 본 발명의 제1실시예에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 방법의 흐름을 도시한 순서도이다.4 is a flowchart illustrating a flow of a method for checking and managing video file duplication based on image information according to the first embodiment of the present invention.

도 5는 본 발명의 제2실시예에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 방법의 흐름을 도시한 순서도이다.5 is a flowchart illustrating a method of checking and managing video file duplication based on image information according to a second embodiment of the present invention.

도 6은 본 발명의 제3실시예에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 방법의 순차적 흐름을 도시한 순서도이다.6 is a flowchart illustrating a sequential flow of a method for checking and managing video file duplication based on image information according to a third embodiment of the present invention.

도 7은 본 발명에 따른 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템이 구현되는 범용 컴퓨터 시스템의 구성을 나타낸 블록도이다.7 is a block diagram showing the configuration of a general-purpose computer system in which a system for checking and managing video file duplication based on image information according to the present invention is implemented.

<도면의 주요 참조 번호><Main reference number in drawing>

MF : 동영상 파일 10 : 파일 입력부MF: Movie File 10: File Input

20 : 비디오 특징 추출부 30 : 파일중복 검사부20: video feature extraction unit 30: file duplication inspection unit

40 : 파일 관리부 50 : 스토리지40: file management unit 50: storage

60 : 비디오 핑거프린트 DB 70 : 파일 DB화부60: video fingerprint DB 70: file DB unit

Claims (18)

복수의 동영상 파일을 입력받는 파일 입력부;A file input unit for receiving a plurality of video files; 상기 입력된 각 동영상 파일에 포함된 영상 데이터를 분석하여 비디오 핑거프린트를 추출하는 비디오 특징 추출부; 및A video feature extracting unit extracting a video fingerprint by analyzing image data included in each of the inputted video files; And 상기 추출된 각 비디오 핑거프린트를 상호 대비하여 각 비디오 핑거프린트 간의 유사도가 임계치를 넘으면 비디오 핑거프린트가 추출된 비교 대상 동영상 파일이 동일한 내용의 영상을 담고 있는 중복 파일로 판별하는 파일중복 검사부;를 포함하는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.And a file duplication checker for discriminating the extracted video fingerprints from each other when the similarity between the video fingerprints exceeds a threshold, and determining that the comparison target video file from which the video fingerprint is extracted is a duplicate file containing the same contents. System for video file duplication inspection and management based on video information, characterized in that the. 제1항에 있어서,The method of claim 1, 상기 파일중복 검사부의 판단 결과에 따라, 내용이 동일한 동영상 파일들을 식별하여 동영상 파일의 중복 상태를 제거하는 파일 관리부;를 더 포함하는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.The system for checking and managing video file duplication based on video information, further comprising: a file manager for identifying duplicate video files having identical contents according to a determination result of the file duplication inspection unit. . 제2항에 있어서,The method of claim 2, 상기 파일 관리부는 상기 파일중복 검사부의 판단 결과에 따라 중복 입력된 동영상 파일 중 하나의 파일을 제외한 나머지 파일은 제거하거나, 별도의 스토리지 공간으로 이동시키는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사 와 관리를 위한 시스템.The file management unit removes the remaining files except for one of the duplicately inputted video files according to the determination result of the file duplication inspection unit, or moves them to a separate storage space. System for management. 제3항에 있어서,The method of claim 3, 상기 파일 관리부는 중복 기록된 동영상 파일 중 품질이 가장 좋은 파일을 제외한 나머지 파일을 제거하거나 별도의 스토리지 공간으로 이동시키는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.The file management unit is a system for checking and managing video file duplication based on video information, characterized in that to remove the remaining files except the best quality of the duplicate recorded video files or to move to a separate storage space. 동영상 파일을 입력받는 파일 입력부;A file input unit for receiving a video file; 상기 입력된 동영상 파일에 포함된 영상 데이터를 분석하여 비디오 핑거프린트를 추출하는 비디오 특징 추출부; 및A video feature extracting unit extracting a video fingerprint by analyzing image data included in the input video file; And 상기 추출된 비디오 핑거프린트와 미리 획득한 다른 동영상 파일의 비디오 핑거프린트를 상호 대비하여 비디오 핑거프린트 간의 유사도가 임계치를 넘으면 상기 입력된 동영상 파일이 상기 미리 획득한 다른 동영상 파일과 동일한 내용의 영상을 담고 있는 중복된 동영상 파일로 판별하는 파일중복 검사부;를 포함하는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.When the similarity between the video fingerprint and the video fingerprint of the extracted video fingerprint and the previously obtained other video file crosses a threshold, the input video file includes an image having the same content as the other obtained video file. System duplication inspection and management based on the video information, characterized in that it comprises a; duplicate file inspection unit for determining a duplicate video file. 제5항에 있어서,The method of claim 5, 복수의 동영상 파일에 대한 비디오 핑거프린트를 미리 저장하고 있는 비디오 핑거프린트 DB;를 포함하고,And a video fingerprint DB for storing video fingerprints for a plurality of video files in advance. 상기 미리 획득한 다른 동영상 파일의 비디오 핑거프린트는 상기 비디오 핑 거프린트 DB 내에 수록된 비디오 핑거프린트임을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.And a video fingerprint of another previously obtained video file is a video fingerprint contained in the video fingerprint DB. 제6항에 있어서,The method of claim 6, 신규로 입력된 동영상 파일의 비디오 핑거프린트에 대응되는 비디오 핑거프린트가 존재하지 않는 경우에 한하여 신규로 입력된 동영상 파일을 스토리지에 저장하는 파일 관리부;를 더 포함하는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.And a file manager which stores the newly inputted video file in the storage only when the video fingerprint corresponding to the video fingerprint of the newly inputted video file does not exist. System for file duplication checking and management. 제7항에 있어서,The method of claim 7, wherein 상기 파일 관리부는, 신규로 입력된 동영상 파일의 비디오 핑거프린트에 대응되는 비디오 핑거프린트가 존재하고 신규로 입력된 동영상 파일이 스토리지에 기 저장된 동영상 파일보다 품질이 우수하면 기 저장된 동영상 파일을 신규 입력 동영상 파일로 갱신하는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.The file manager, if a video fingerprint corresponding to the video fingerprint of the newly input video file exists and the newly input video file has a higher quality than the video file previously stored in the storage, the previously stored video file is newly input video. System for checking and managing video file duplication based on video information, characterized in that the file is updated. 동영상 파일을 입력받는 파일 입력부;A file input unit for receiving a video file; 복수의 동영상 파일에 대한 비디오 핑거프린트를 저장하고 있는 비디오 핑거프린트 DB;A video fingerprint DB for storing video fingerprints for a plurality of video files; 상기 입력된 동영상 파일에 포함된 영상 데이터를 분석하여 비디오 핑거프린 트를 추출하는 비디오 특징 추출부;A video feature extracting unit extracting a video fingerprint by analyzing image data included in the input video file; 상기 비디오 핑거프린트를 상기 비디오 핑거프린트 DB;에 저장하고, 상기 입력된 동영상 파일을 스토리지에 저장하는 파일 DB화부;A file DB unit configured to store the video fingerprint in the video fingerprint DB, and store the input video file in storage; 상기 비디오 핑거프린트 DB로부터 임계치 이상의 유사도를 갖는 비디오 핑거프린트의 그룹을 식별하여 스토리지에 저장된 동영상 파일들 간의 중복 여부를 판단하는 파일중복 검사부; 및A file duplication checker that identifies a group of video fingerprints having a similarity or more than a threshold value from the video fingerprint DB and determines whether the video files stored in the storage are overlapped; And 상기 파일중복 검사부의 판단 결과에 따라, 비디오 핑거프린트 DB 및 스토리지로부터 중복 기록된 동영상 파일들을 식별하여 동영상 파일의 중복 저장 상태를 제거하는 파일 관리부;를 포함하는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.And a file manager to identify duplicate video files recorded from the video fingerprint DB and storage according to a determination result of the file duplication inspection unit and to remove redundant storage states of the video files. System for redundancy checking and management. 제9항에 있어서,The method of claim 9, 상기 파일 관리부는 스토리지로부터 중복 기록된 동영상 파일을 제거하고 비디오 핑거프린트 DB로부터 중복 기록된 동영상 파일의 비디오 핑거프린트를 제거하거나, 중복 기록된 동영상 파일과 비디오 핑거프린트를 스토리지와 비디오 핑거프린트 DB로부터 추출하여 스토리지 및 비디오 핑거프린트 DB의 별도 저장 공간으로 이동시키는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.The file management unit removes the redundantly recorded video file from the storage and removes the video fingerprint of the redundantly recorded video file from the video fingerprint DB, or extracts the redundantly recorded video file and the video fingerprint from the storage and video fingerprint DB. System for video file duplication inspection and management based on video information, characterized in that for moving to a separate storage space of the storage and video fingerprint DB. 제10항에 있어서,The method of claim 10, 상기 파일 관리부는 중복 기록된 동영상 파일 중 품질이 가장 좋은 파일을 제외한 나머지 파일을 제거하거나 별도 저장 공간으로 이동시키는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.The file management unit is a system for checking and managing video file duplication based on video information, characterized in that to remove the remaining files except the best quality of duplicated recorded video files or to move to a separate storage space. 동영상 파일을 입력받는 파일 입력부;A file input unit for receiving a video file; 복수의 동영상 파일에 대한 비디오 핑거프린트를 저장하고 있는 비디오 핑거프린트 DB;A video fingerprint DB for storing video fingerprints for a plurality of video files; 상기 입력된 동영상 파일에 포함된 영상 데이터를 분석하여 비디오 핑거프린트를 추출하는 비디오 특징 추출부;A video feature extracting unit extracting a video fingerprint by analyzing image data included in the input video file; 상기 비디오 핑거프린트 DB로부터 상기 추출된 비디오 핑거프린트와 임계치 이상의 유사도를 갖는 비디오 핑거프린트의 존재 여부를 조회하여 동영상 파일의 중복 입력 여부를 판별하는 파일중복 검사부; 및A file duplication checker for determining whether a video file is duplicated by inquiring whether a video fingerprint having a similarity with the extracted video fingerprint from the video fingerprint DB exists above a threshold; And 상기 판단 결과, 비디오 핑거프린트 DB에 임계치 이상의 유사도를 갖는 비디오 핑거프린트가 존재하지 않는 동영상 파일에 한하여 상기 추출된 비디오 핑거프린트를 비디오 핑거프린트 DB에 저장하고, 상기 입력된 동영상 파일을 스토리지에 저장하는 파일 관리부;를 포함하는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.As a result of the determination, the extracted video fingerprint is stored in the video fingerprint DB only for a video file having a video fingerprint having a similarity or higher than a threshold in the video fingerprint DB, and the input video file is stored in the storage. And a file manager. The system for checking and managing video file duplication based on video information, comprising: a file manager. 제12항에 있어서,The method of claim 12, 상기 파일 관리부는 중복 입력된 동영상 파일과 이로부터 추출된 비디오 핑 거프린트를 스토리지와 비디오 핑거프린트 DB의 별도 저장 공간으로 이동시키는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.And the file manager moves the duplicated input video file and the extracted video fingerprint to separate storage spaces of the storage and the video fingerprint DB. 제12항에 있어서,The method of claim 12, 상기 파일 관리부는 스토리지에 저장된 동영상 파일보다 신규 입력된 동영상 파일의 품질이 더 우수하면 스토리지에 저장된 동영상 파일을 신규 입력된 동영상 파일로 교체하는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.If the file management unit has a higher quality of the newly input video file than the video file stored in the storage, the video information duplication inspection and management based on the video information may be replaced with the newly input video file. System. 복수의 동영상 파일을 입력받는 단계;Receiving a plurality of video files; 상기 입력된 각 동영상 파일에 포함된 영상 데이터를 분석하여 비디오 핑거프린트를 추출하는 단계; 및Extracting a video fingerprint by analyzing image data included in each input video file; And 상기 추출된 각 비디오 핑거프린트를 상호 대비하여 각 비디오 핑거프린트 간의 유사도가 임계치를 넘으면 비디오 핑거프린트가 추출된 비교 대상 동영상 파일이 동일한 내용의 영상을 담고 있는 중복 파일로 판단하여 그 결과를 출력하는 단계;를 포함하는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 방법.Comparing the extracted video fingerprints with each other and comparing the video fingerprints with each other, if the similarity between the video fingerprints exceeds a threshold value, determining that the compared video file from which the video fingerprints are extracted is a duplicate file containing the same contents and outputting the result; And a method for checking and managing video file duplication based on video information, comprising: a. 동영상 파일을 입력받는 단계;Receiving a video file; 상기 입력된 동영상 파일에 포함된 영상 데이터를 분석하여 비디오 핑거프린 트를 추출하는 단계; 및Extracting a video fingerprint by analyzing image data included in the input video file; And 상기 추출된 비디오 핑거프린트와 미리 획득한 다른 동영상 파일의 비디오 핑거프린트를 상호 대비하여 비디오 핑거프린트 간의 유사도가 임계치를 넘으면 상기 입력된 동영상 파일이 상기 미리 획득한 다른 동영상 파일과 동일한 내용의 영상을 담고 있는 중복된 동영상 파일로 판단하여 그 결과를 출력하는 단계;를 포함하는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 방법.When the similarity between the video fingerprint and the video fingerprint of the extracted video fingerprint and the previously obtained other video file crosses a threshold, the input video file includes an image having the same content as the other obtained video file. And determining the duplicated video file and outputting the result thereof. The method for checking and managing the duplicated video file based on the image information. 복수의 동영상 파일에 대한 비디오 핑거프린트를 저장하고 있는 비디오 핑거프린트 DB를 구축하여 유지하는 단계;Constructing and maintaining a video fingerprint DB that stores video fingerprints for a plurality of video files; 동영상 파일을 입력받는 단계;Receiving a video file; 상기 입력된 동영상 파일에 포함된 영상 데이터를 분석하여 비디오 핑거프린트를 추출하는 단계;Extracting a video fingerprint by analyzing image data included in the input video file; 상기 추출된 비디오 핑거프린트와 상기 입력된 동영상 파일을 비디오 핑거프린트 DB와 스토리지에 각각 저장하는 단계;Storing the extracted video fingerprint and the input video file in a video fingerprint DB and storage, respectively; 상기 비디오 핑거프린트 DB로부터 임계치 이상의 유사도를 갖는 비디오 핑거프린트의 그룹을 식별하여 스토리지에 저장된 동영상 파일들 간의 중복 여부를 판단하는 단계; 및Identifying a group of video fingerprints having a similarity or more than a threshold value from the video fingerprint DB to determine whether duplicate video files are stored in the storage; And 상기 판단 결과에 따라, 비디오 핑거프린트 DB 및 스토리지로부터 동일성이 있는 동영상 파일들을 식별하여 동영상 파일의 중복 저장 상태를 제거하는 단계;를 포함하는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 방법.According to the result of the determination, identifying the video files having the same from the video fingerprint DB and storage to remove the redundant storage state of the video file; video information-based video file duplication inspection and management, comprising the Way. 복수의 동영상 파일에 대한 비디오 핑거프린트를 저장하고 비디오 핑거프린트 DB를 구축하여 유지하는 단계;Storing video fingerprints for the plurality of video files and constructing and maintaining a video fingerprint DB; 동영상 파일을 입력받는 단계;Receiving a video file; 상기 입력된 동영상 파일에 포함된 영상 데이터를 분석하여 비디오 핑거프린트를 추출하는 단계;Extracting a video fingerprint by analyzing image data included in the input video file; 상기 비디오 핑거프린트 DB로부터 상기 추출된 비디오 핑거프린트와 임계치 이상의 유사도를 갖는 비디오 핑거프린트의 존재 여부를 조회하여 동영상 파일의 중복 입력 여부를 판단하는 단계; 및Inquiring whether a video fingerprint having a similarity to the extracted video fingerprint from the video fingerprint DB exists above a threshold value and determining whether a video file is duplicated; And 상기 판단 결과, 비디오 핑거프린트 DB에 임계치 이상의 유사도를 갖는 비디오 핑거프린트가 존재하지 않는 동영상 파일에 한하여 비디오 핑거프린트를 비디오 핑거프린트 DB에 저장하고, 상기 입력된 동영상 파일을 스토리지에 저장하는 단계;를 포함하는 것을 특징으로 하는 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한 방법.As a result of the determination, storing the video fingerprint in the video fingerprint DB only for a video file having a video fingerprint having a similarity greater than or equal to a threshold in the video fingerprint DB, and storing the input video file in storage. Method for the duplication inspection and management of the video information based on the video information comprising a.
KR1020070078944A 2007-08-07 2007-08-07 System and Method for managing and detecting duplicate moving picture files based on video contents KR100946694B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070078944A KR100946694B1 (en) 2007-08-07 2007-08-07 System and Method for managing and detecting duplicate moving picture files based on video contents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070078944A KR100946694B1 (en) 2007-08-07 2007-08-07 System and Method for managing and detecting duplicate moving picture files based on video contents

Publications (2)

Publication Number Publication Date
KR20090014754A true KR20090014754A (en) 2009-02-11
KR100946694B1 KR100946694B1 (en) 2010-03-12

Family

ID=40684608

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070078944A KR100946694B1 (en) 2007-08-07 2007-08-07 System and Method for managing and detecting duplicate moving picture files based on video contents

Country Status (1)

Country Link
KR (1) KR100946694B1 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101030130B1 (en) * 2009-07-31 2011-04-20 주식회사 다음커뮤니케이션 Device and method for detecting duplicate contents
KR20120016747A (en) * 2010-08-17 2012-02-27 에스케이 텔레콤주식회사 Apparatus for data de-duplication in a distributed file system and method thereof
KR101147892B1 (en) * 2011-10-19 2012-05-24 주식회사 한글과컴퓨터 Storage apparatus and file management method of the storage apparatus
US8774561B2 (en) 2010-09-01 2014-07-08 Apple Inc. Consolidating information relating to duplicate images
US9294706B2 (en) 2012-12-20 2016-03-22 Samsung Electronics Co., Ltd Method and apparatus for playing back a moving picture
WO2016175564A1 (en) * 2015-04-27 2016-11-03 삼성전자 주식회사 Audio content recognition method and device
KR20170081356A (en) * 2016-01-04 2017-07-12 한국전자통신연구원 System for rapid management of large scale moving pictures and method thereof

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2579258A1 (en) * 2011-10-04 2013-04-10 Thomson Licensing Method of automatic management of a collection of images and corresponding device

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3457617B2 (en) 2000-03-23 2003-10-20 株式会社東芝 Image search system and image search method
KR100773963B1 (en) * 2005-10-31 2007-11-08 한국전자통신연구원 Fingerprinting management system and method for delivering fingerprint code
KR100755006B1 (en) * 2005-11-14 2007-09-04 주식회사 유베이션 File identification system in distributed network and Method thereof
KR100842310B1 (en) 2007-06-21 2008-06-30 (주)엔써즈 Method and system for clustering moving picture date according to the sameness with each other

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101030130B1 (en) * 2009-07-31 2011-04-20 주식회사 다음커뮤니케이션 Device and method for detecting duplicate contents
KR20120016747A (en) * 2010-08-17 2012-02-27 에스케이 텔레콤주식회사 Apparatus for data de-duplication in a distributed file system and method thereof
US8774561B2 (en) 2010-09-01 2014-07-08 Apple Inc. Consolidating information relating to duplicate images
EP2612325B1 (en) * 2010-09-01 2015-05-06 Apple Inc. Consolidating metadata relating to duplicate images.
US9805086B2 (en) 2010-09-01 2017-10-31 Apple Inc. Consolidating information relating to duplicate images
KR101147892B1 (en) * 2011-10-19 2012-05-24 주식회사 한글과컴퓨터 Storage apparatus and file management method of the storage apparatus
US9294706B2 (en) 2012-12-20 2016-03-22 Samsung Electronics Co., Ltd Method and apparatus for playing back a moving picture
WO2016175564A1 (en) * 2015-04-27 2016-11-03 삼성전자 주식회사 Audio content recognition method and device
US10997236B2 (en) 2015-04-27 2021-05-04 Samsung Electronics Co., Ltd. Audio content recognition method and device
KR20170081356A (en) * 2016-01-04 2017-07-12 한국전자통신연구원 System for rapid management of large scale moving pictures and method thereof

Also Published As

Publication number Publication date
KR100946694B1 (en) 2010-03-12

Similar Documents

Publication Publication Date Title
KR100946694B1 (en) System and Method for managing and detecting duplicate moving picture files based on video contents
JP6891170B2 (en) Future viewing forecasts for video segments to optimize stem resource utilization
CN102156751B (en) Method and device for extracting video fingerprint
CN108353208B (en) Optimizing media fingerprint retention to improve system resource utilization
US20130114893A1 (en) Image Compression Using Sub-Resolution Images
CN110149529B (en) Media information processing method, server and storage medium
WO2011155551A1 (en) File storage device, file storage method and program
JP6514419B1 (en) Use of Image Matching System to Improve Service Quality of Video Matching System
KR100896336B1 (en) System and Method for related search of moving video based on visual content
Ali et al. A review of digital forensics methods for JPEG file carving
Haynes et al. Vss: A storage system for video analytics
KR101832680B1 (en) Searching for events by attendants
CN106911939A (en) A kind of video transcoding method, apparatus and system
CN104216956A (en) Method and device for searching picture information
Yang et al. A security carving approach for AVI video based on frame size and index
KR20120090101A (en) Digital video fast matching system using key-frame index method
KR101812103B1 (en) Method and program for setting thumbnail image
KR100896335B1 (en) System and Method for managing and detecting duplicate movie files based on audio contents
JP4420085B2 (en) Data processing apparatus, data processing method, program, and recording medium
KR100930529B1 (en) Harmful video screening system and method through video identification
US20220417540A1 (en) Encoding Device and Method for Utility-Driven Video Compression
KR100916310B1 (en) System and Method for recommendation of music and moving video based on audio signal processing
US20220191345A1 (en) System and method for determining compression rates for images comprising text
CN115455083A (en) Duplicate checking method and device, electronic equipment and computer storage medium
KR20090096158A (en) System and Method for cross-media search based on moving video still cut

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130214

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140303

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150302

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160203

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180305

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20190108

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20191127

Year of fee payment: 11