KR100896335B1 - 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템 및 방법 - Google Patents

오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템 및 방법 Download PDF

Info

Publication number
KR100896335B1
KR100896335B1 KR1020070047197A KR20070047197A KR100896335B1 KR 100896335 B1 KR100896335 B1 KR 100896335B1 KR 1020070047197 A KR1020070047197 A KR 1020070047197A KR 20070047197 A KR20070047197 A KR 20070047197A KR 100896335 B1 KR100896335 B1 KR 100896335B1
Authority
KR
South Korea
Prior art keywords
video file
file
audio
video
uploaded
Prior art date
Application number
KR1020070047197A
Other languages
English (en)
Other versions
KR20080101034A (ko
Inventor
박만수
양승현
신동호
Original Assignee
주식회사 코난테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 코난테크놀로지 filed Critical 주식회사 코난테크놀로지
Priority to KR1020070047197A priority Critical patent/KR100896335B1/ko
Publication of KR20080101034A publication Critical patent/KR20080101034A/ko
Application granted granted Critical
Publication of KR100896335B1 publication Critical patent/KR100896335B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4622Retrieving content or additional data from different sources, e.g. from a broadcast channel and the Internet
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/27Server based end-user applications
    • H04N21/274Storing end-user multimedia data in response to end-user request, e.g. network recorder
    • H04N21/2743Video hosting of uploaded data from client

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

본 발명은 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템 및 방법을 개시한다. 본 발명에 따르면, 동영상 파일에 포함된 오디오 데이터를 분석하여 오디오 핑거프린트를 추출한 후, 다른 동영상 파일의 오디오 핑거프린트와 상호 대비하여 핑거프린트 간의 유사도가 소정 임계치를 넘어서면 비교 대상이 된 동영상 파일이 상호 중복되는 것으로 판단한다. 중복이 확인된 동영상 파일은 스토리지로부터 삭제하거나, 다른 저장공간으로 이동시킨다. 경우에 따라, 중복 확인된 동영상 파일이 기 저장된 동영상 파일보다 품질이 우수하면 기 저장된 동영상 파일을 신규 입력된 동영상 파일로 대체 가능하다.
본 발명에 따르면, 내용이 중복되는 동영상 파일의 중복 기록을 방지함으로써 스토리지 공간을 효율적으로 사용할 수 있게 되고, 대량의 동영상 파일을 데이터베이스로 구축하여 다양한 검색 서비스를 제공할 때 검색 품질을 향상시킬 수 있다.
오디오 핑거프린트, 멀티미디어, 중복 기록 방지, 파일 관리, 검색

Description

오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템 및 방법{System and Method for managing and detecting duplicate movie files based on audio contents}
본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시 예를 예시하는 것이며, 후술하는 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니 된다.
도 1은 본 발명의 제1실시예에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 개략적인 구성도이다.
도 2는 본 발명의 제2실시예에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 개략적인 블록도이다.
도 3은 본 발명의 제3실시예에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 개략적인 블록도이다.
도 4는 본 발명의 제1실시예에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 방법의 흐름을 도시한 블록도이다.
도 5는 본 발명의 제2실시예에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 방법의 흐름을 도시한 순서도이다.
도 6은 본 발명의 제3실시예에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 방법의 흐름을 도시한 순서도이다.
도 7은 본 발명에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템이 구현되는 범용 컴퓨터 시스템의 구성을 나타낸 블록도이다.
<도면의 주요 참조 번호>
MF: 동영상 파일 10: 파일 입력부
20: 오디오 특징 추출부 30: 파일중복 검사부
40: 파일 관리부 50: 스토리지
60: 오디오 핑거프린트 DB
본 발명은 동영상 파일 간의 중복 여부를 판별할 수 있는 시스템에 관한 것으로서, 보다 상세하게는 오디오 핑거프린트 기술을 이용하여 동영상 파일에 담긴 오디오 내용을 기반으로 동영상 파일 간의중복 여부를 판별할 수 있는 시스템 및 그 방법에 관한 것이다.
최근 들어, 디지털 카메라/캠코더, 카메라 휴대폰, 휴대용 디지털 음원/동영상 재생기(MP3P, PMP, MP4P 등) 등의 발달로 멀티미디어 콘텐츠의 제작과 활용이 용이해졌다. 또한, UCC(User Created Contents) 서비스의 급속한 확산으로 사용자에 의해 생산된 디지털 동영상 파일이 UCC 전문 사이트나 P2P(Peer to Peer) 방식의 파일 공유 사이트, 개인 블로그나 미니 홈페이지 등을 통해 업로드되고 있다. 이렇게 업로드된 동영상 파일은 인터넷을 통한 다운로드 또는 스트리밍 서비스에 의해 다른 사용자들에게 공유된다.
동영상 콘텐츠는 텍스트 기반의 콘텐츠에 비해 파일 용량이 상당히 크다. 따라서, 동영상 콘텐츠의 생산자나 사용자, 그리고 UCC 서비스 등의 제공을 위해 사용자 제작 중심의 멀티미디어 콘텐츠를 대량으로 데이터베이스화해야 하는 사업자의 입장에서는 스토리지의 효율적 관리가 매우 중요하다.
스토리지의 효율적 관리를 위해서는 내용이 동일한 동영상 파일의 중복 기록을 방지해야 한다. 내용이 동일한 동영상 파일이 중복 기록되면 스토리지의 자원이 낭비되기 때문이다. 종래에는 동영상 파일의 중복 기록을 방지하기 위해 MD5(Message Digest 5) 알고리즘이 주로 사용되었다. MD5 알고리즘은 동영상 파일의 바이너리 코드를 해슁(hashing)하여 동영상 파일 간의 동일성 여부를 판별한다. 그런데, MD5 알고리즘은 복제된 동영상 파일에 대해서만 중복 기록을 방지할 수 있다는 한계가 있다. 즉, 동영상 파일의 인코딩 시 인코딩 방식, 메타 태그, 비트율, 샘플링 비율(이하, 이러한 요소들을 '인코딩 환경'이라고 칭한다) 등이 달라지면, MD5 알고리즘은 동영상 파일 안에 담긴 콘텐츠의 내용이 동일하더라도 파일이 서로 다르다고 판단한다. 따라서, MD5 알고리즘은 동영상 파일을 생성할 때 적용된 인코딩 환경이 달라지면 파일의 중복 기록을 방지할 수 없는 한계가 있다.
위와 같은 MD5 알고리즘의 한계는 UCC 서비스, P2P 파일 공유 서비스, 동영상 검색 서비스가 각광을 받고 있는 작금의 상황에서 사업자 서버의 스토리지 효율성을 심각하게 떨어뜨리는 원인이 되고 있다.
예를 들어, 사회적 이슈가 되는 동영상 파일이 특정 웹사이트를 통해 업로드되어 네티즌들에게 공개된 경우를 가정해보자. 이런 경우, 해당 동영상 파일은 짧은 시간 동안 상당수의 네티즌에 의해 다운로드된다. 동영상 파일을 다운로드한 네티즌들은 영상 캡쳐 보드 등의 동영상 편집 프로그램을 이용하여 동영상을 2차적으로 편집한 후 동시 다발적으로 자신이 운용하는 블로그나 미니 홈페이지 또는 공개적인 형태로 운용되는 자료실 등에 업로드한다.
이러한 동영상 파일의 업로드시, 사업자의 서버가 MD5 알고리즘에 의해 동영상 파일의 중복 여부를 체크하면, 인코딩 환경이 다르다는 이유로 내용이 동일한 다수의 동영상 파일이 여과없이 스토리지에 기록됨으로써 스토리지 용량의 낭비가 초래될 수 있는 것이다.
한편, 최근에는 동영상 콘텐츠의 상업적 가치가 증대되면서 검색 포탈 사업자들이 동영상 검색 서비스를 경쟁적으로 개발하여 서비스 대열에 속속 합류하고 있다. 양질의 동영상 검색 서비스를 제공하기 위해서는, 방대한 동영상 데이터베이스의 구축과 갱신이 지속적으로 이루어져야 한다. 이러한 데이터베이스 구축 및 갱신 과정에서 동영상 파일의 중복 기록 방지가 제대로 이루어지지 않으면, 스토리지의 불필요한 낭비가 초래되는 것은 물론이고 동영상 검색의 품질이 떨어지는 문제까지 발생한다. 인코딩 환경이 다르다는 이유로 동일한 내용의 동영상 파일이 데이터베이스로 구축되면, 검색 결과에서 동일 내용의 동영상 파일이 반복적으로 노출되기 때문이다.
따라서, 본 발명이 속한 기술 분야에서는 스토리지 자원의 효율적 사용과 동영상 검색 서비스의 품질을 향상시키기 위해 동영상 파일의 인코딩과 관련된 환경에 의존하지 않고 동영상 파일에 담긴 내용을 기초로 서로 다른 동영상 파일의 중복 여부를 효과적으로 판별할 수 있는 기술이 절실히 요구되고 있는 실정이다.
삭제
삭제
삭제
본 발명은 상술한 종래 기술의 문제점을 해결하기 위하여 창안된 것으로서, 네트워크를 통한 동영상 파일의 업로드를 이용하여 동영상 검색 서비스의 제공을 위한 동영상 데이터베이스를 구축하는 과정에서, 오디오의 내용을 기준으로 업로드된 동영상 파일을 기존에 업로드 된 동영상 파일과 비교하여 파일의 중복 기록을 방지함으로써 동영상 검색 서비스의 품질 열화를 방지할 수 있는 시스템 및 방법을 제공하는데 목적이 있다.
본 발명의 다른 목적은, 동영상 검색 서비스의 제공을 위한 동영상 데이터베이스의 구축시 동영상 파일의 오디오 내용을 기반으로 파일의 중복 여부와 함께 동영상 파일 간의 품질을 비교하여 동영상 데이터베이스에 저장된 동영상 파일을 우수한 품질의 동영상 파일로 유지 관리할 수 있는 시스템 및 방법을 제공하는데 있다.
상기 기술적 과제를 달성하기 위한 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템은, 네트워크를 통해 사용자가 업로드 한 동영상 파일을 입력받는 파일 입력부; 상기 입력된 동영상 파일에 포함된 오디오 데이터를 분석하여 오디오 핑거프린트를 추출하는 오디오 특징 추출부; 상기 추출된 오디오 핑거프린트와 기존에 업로드되어 데이터베이스로 구축된 다른 동영상 파일로부터 추출된 오디오 핑거프린트를 상호 대비하여 동영상의 오디오 내용을 기초로 동영상 파일들 간의 중복 여부를 판단하는 파일중복 검사부; 및 상기 판단 결과 신규로 업로드된 동영상 파일의 오디오 핑거프린트에 대응되는 오디오 핑거프린트가 존재하지 않으면 신규로 업로드된 동영상 파일이 기존에 업로드 된 다른 동영상 파일과 중복되지 않는 것으로 보고 업로드된 동영상 파일을 스토리지에 저장하는 파일 관리부;를 포함한다.
상기 기술적 과제를 달성하기 위한 본 발명의 다른 측면에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템은, 네트워크를 통해 사용자가 업로드 한 동영상 파일을 입력받는 파일 입력부; 상기 입력된 동영상 파일에 포함된 오디오 데이터를 분석하여 오디오 핑거프린트를 추출하는 오디오 특징 추출부; 상기 추출된 오디오 핑거프린트와 기존에 업로드되어 데이터베이스로 구축된 다른 동영상 파일로부터 추출된 오디오 핑거프린트를 상호 대비하여 동영상의 오디오 내용을 기초로 동영상 파일들 간의 중복 여부를 판단하는 파일중복 검사부; 및 상기 판단 과정에서 신규로 업로드된 동영상 파일의 오디오 핑거프린트에 대응되는 오디오 핑거프린트가 존재하여 업로드된 동영상 파일이 기존에 업로드된 동영상 파일과 중복되는 것으로 판단되면, 신규로 업로드된 동영상 파일과 기존에 업로드된 동영상 파일의 품질을 비교하여 신규로 업로드된 동영상 파일의 품질이 우수하면 기 저장된 동영상 파일을 신규 업로드된 동영상 파일로 갱신하는 파일 관리부;를 포함한다.
삭제
삭제
삭제
삭제
삭제
삭제
본 발명의 다른 기술적 과제는 상술한 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 동작 방법과 이 방법을 프로그램화하여 수록한 컴퓨터로 읽을 수있는 기록매체에 의해서도 달성될 수 있다.
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
도 1은 본 발명의 제1실시예에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 개략적인 구성을 도시한 블록도이다.
제1실시예에 따른 시스템은, 파일 입력부(10), 오디오 특징 추출부(20), 파일중복 검사부(30), 파일 관리부(40) 및 스토리지(50)를 포함한다.
상기 파일 입력부(10)는 중복 검사의 대상이 되는 복수의 동영상 파일(MF)을 입력 받아 오디오 특징 추출부(20)로 전달한다. 상기 동영상 파일(MF)은 디지털 동영상 파일이다. 일 예로, 상기 동영상 파일은 MPEG4 포맷으로 인코딩된 디지털 동영상 파일이다. 하지만, 본 발명은 동영상 파일(MF)의 포맷에 의해 한정되지 않는다.
바람직하게, 복수의 동영상 파일(MF)은 사용자 인터페이스를 통해 지정한다. 상기 사용자 인터페이스는 컴퓨터 시스템의 스토리지(예컨대, 하드 디스크 등)에 저장된 파일들 중 중복 검사를 하고자 하는 적어도 2개 이상의 동영상 파일(MF)을 사용자가 선택할 수 있는 인터페이스를 제공한다. 대안적으로, 상기 복수의 동영상 파일(MF)은 컴퓨터 시스템의 입출력 인터페이스 또는 네트워크 인터페이스를 통해 외부로부터 입력될 수도 있다. 상기 컴퓨터 시스템은 퍼스널 컴퓨터 또는 대용량의 서버 컴퓨터 등일 수 있다.
본 발명에서, 동영상 파일(MF) 간의 중복 검사는 동영상 파일(MF)에 포함된 실질적 내용을 기준으로 동영상 파일(MF) 간의 동일성을 판단하는 것을 말한다. 실질적 내용이란, 동영상 파일(MF)에 포함된 오디오 스트림의 내용을 말한다.
상기 오디오 특징 추출부(20)는 각 동영상 파일(MF)에 포함된 오디오 데이터를 분석하여 오디오 핑거프린트를 추출한다. 여기서, 오디오 핑거프린트는 오디오 데이터를 배타적이고도 고유하게 식별할 수 있는 일종의 오디오 지문을 지칭한다. 상기 오디오 특징 추출부(20)는 동영상 파일(MF)에 오디오 및 영상 데이터가 동시에 포함되어 있다는 점을 감안하여 오디오 핑거프린트를 추출하기에 앞서 동영상 파일(MF)로부터 오디오 데이터만을 선택적으로 분리하는 과정을 선행할 수 있다.
바람직하게, 상기 오디오 특징 추출부(20)는 오디오 신호를 분석하여 오디오 핑거프린트를 추출한다. 즉, 오디오 특징 추출부(20)는 동영상 파일(MF)을 디코딩하여 파일 안에 포함된 오디오 데이터를 획득한 후 윈도우 분석을 통해 오디오 데이터를 프레임 단위로 분할한다. 그런 다음, 프레임별로 주파수 특성을 추출하기 위해 퓨리에 변환을 수행한다. 상기 윈도우 분석시에는 Hamming/Hanning 윈도우 등을 사용할 수 있다. 이어서, 상기 오디오 특징 추출부(20)는 퓨리에 변환을 적용한 프레임 마다 파워 스펙트럼의 필터뱅크 출력의 에너지 시퀀스를 기반으로 주파수 및 시간축 필터링을 수행한 후 각 주파수 밴드 에너지에 대해 특정 임계값을 기준으로 비트를 할당하여 소정 비트수(예컨대, 32비트)의 오디오 핑거프린트를 생성한다.
바람직하게, 상기 필터뱅크로는 인간의 청각 특성을 고려하기 위해 Mel/bark 스케일 필터뱅크를 사용한다. 하지만, 본 발명이 이에 한하는 것은 아니다. 한편, 주파수 및 시간축 필터링은 주파수 인접 밴드와 인접 프레임의 상관 관계를 최소화하기 위해 수행하는 것이다. 즉, 주파수 및 시간축 필터링은 인접 밴드 에너지의 차, 그리고 인접 프레임 사이의 차를 확대하여 상기 상관 관계를 최소화하기 위해 수행된다. 바람직하게, 상기 주파수 필터링은 에너지들의 상관도를 최소화할 수 있는 BPF 형태의 2차FIR 필터 타입을 사용하여 수행하고, 상기 시간축 필터링은 채널 왜곡을 줄이기 위해 잘 알려진 RASTA 필터 타입을 사용하여 수행함으로써, 외부 잡음 및 채널 잡음에 강인한 오디오 핑거프린트를 추출할 수 있다. 하지만, 본 발명은 주파수 및 시간축 필터링의 방식에 의해 한정되는 것은 아니다.
상술한 오디오 핑거프린트 기법은 박만수씨의 논문 "Frequency-Temporal Filtering for a Robust Audio Fingerprinting Scheme in Real-Noise Environments"(ETRI Journal, vol.28, no.4, Aug. 2006, pp.509-512) 에 개시되어 있다. 따라서, 상기 논문의 모든 내용은 본 발명의 구성의 일부로 통합될 수 있다. 한편, 본 발명은 오디오 핑거프린트를 추출하는 구체적인 방식에 의해 한정되지 않으므로, 오디오 핑거프린트를 추출할 수 있는 알고리즘이라면 어떠한 것이라도 채 용 가능하다. 일 예로, 상기 오디오 특징 추출부(20)는 일반적인 오디오 특징들을 적용하여 확률적 패턴 모델을 이용해오디오 핑거프린트를 추출할 수 있다.
상기 파일중복 검사부(30)는 오디오 특징 추출부(20)로부터 각 동영상 파일(MF)의 오디오 핑거프린트를 입력받는다. 그런 다음, 각 동영상 파일(MF)의 오디오 핑거프린트를 상호 대비한다. 그 결과, 오디오 핑거프린트 사이의 유사도가 임계치 이상이면, 해당하는 동영상 파일들은 중복된 파일로 판단한다. 반대로, 오디오 핑거프린트 사이의 유사도가 임계치보다 작으면, 해당하는 동영상 파일들은 서로 중복되지 않는 것으로 판단한다. 여기서, 오디오 핑거프린트 간의 유사도 판단은 오디오 핑거프린트의 HD(Hamming Distance) 값을 기반으로 할 수 있다. 일례로, 두 개의 파일 전구간에서 추출된 오디오 핑거프린트 시퀀스 사이에 HD 값이 '0'이 되는 핑거프린트의 비율을 기반으로 파일 간의 동일 여부를 판단할 수 있다. 대안적으로, 두 개의 파일 전구간에서 추출된 오디오 핑거프린트 시퀀스 사이의 전체 매칭을 통해 HD 값을 기준으로 전체 평균 BER(Bit Error Rate)를 계산하여 그 값을 기반으로 파일 간의 동일 여부를 판별 할 수도 있다. 물론, 프레임 마다 추출된 핑거프린트를 비교하기 때문에 두 개의 파일의 시간적 순서는 고려되어야 한다. 반면에, 확률적 패턴 모델링 기법에서의 오디오 핑거프린트 간의 유사도 판단은 ED(Euclidean Distance), CAD(Cosine Angle Distance), SRE(Symmetric Relative Entropy) 등의 거리 척도 함수를 기반으로 할 수도 있다.
상기와 같이 오디오 핑거프린트를 이용하여 동영상 파일(MF) 간의 중복여부를 판단하면, 오디오 내용을 기반으로 동영상 파일(MF)의 실질적 동일성을 판단할 수 있다. 오디오 핑거프린트가 동일하면 동영상 파일(MF)에 포함된 오디오의 내용 또한 동일하다는 것이고, 오디오 내용이 서로 동일하면 동영상 파일(MF)들이 서로 동일하다고 간주할 수 있기 때문이다.
상기 파일중복 검사부(30)는 복수의 동영상 파일(MF)에 대한 중복 검사정보를 파일 관리부(40)로 출력한다. 바람직하게, 상기 중복 검사 정보는 내용이 중복되는 것으로 판별된 동영상 파일들의 그룹 식별코드; 각 그룹에 속한 동영상 파일명; 각 파일의 종류; 각 파일의 인코딩 방식; 각 파일의 인코딩 효율; 각 파일의 품질 우선 순위; 파일의 용량; 파일 생성 시점 등을 포함한다.
상기 파일 관리부(40)는 중복 검사 정보를 참조하여 내용이 동일한 동영상 파일들을 스토리지(50)로부터 식별한 후 동영상 파일의 중복 기록 상태를 제거한다.
일예로, 상기 파일 관리부(40)는 동일성이 있다고 판단된 복수의 동영상 파일 중 하나의 파일만을 스토리지(50)에 저장하고 나머지 파일은 삭제한다. 다른 예로, 상기 파일 관리부(40)는 동일성이 있다고 판단된 복수의 동영상 파일 중 하나의 파일만을 스토리지(50)에 저장하고 나머지 파일은 스토리지(50)에 할당된 별도의 저장공간으로 이동시킨다.
여기서, 저장되는 파일의 선정 기준은 동영상 파일의 품질이 될 수 있다. 즉, 품질이 가장 우수한 동영상 파일만을 스토리지(50)에 저장한다. 예를들어, 압축 부호화율이 가장 낮고 화면의 크기가 가장 큰 동영상 파일만을 스토리지(50)에 저장한다.
상기 파일 관리부(40)는 파일의 삭제 또는 이동 프로세스를 자동으로 수행해도 무방하지만, 삭제 또는 이동 대상 파일을 사용자로부터 직접 지정받아도 무방하다. 이런 경우, 상기 파일 관리부(40)는 사용자 인터페이스를 통해 동일성이 있다고 판단된 동영상 파일들의 리스트(파일명, 저장위치, 압축 부호화율, 화면크기, 파일 용량, 타이틀과 같은 메타데이터 및 태그정보 등)를 그룹화하여 제공하며, 상기 사용자 인터페이스를 통해 파일 관리자로부터 삭제 또는 이동 대상 파일을 지정받아 해당 파일의 삭제 또는 이동 프로세스를 진행할 수 있다.
상술한 시스템은, 컴퓨터 시스템의 스토리지에 저장된 동영상 파일들의 동일성 여부를 내용 기반으로 판별하여 중복 저장된 동영상 파일을 삭제하거나 별도의 저장 공간으로 이동시킴으로써 스토리지 공간의 효율적인 사용을 가능하게 한다.
도 2는 본 발명의 제2실시예에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 개략적인 구성을 도시한 블록도이다.
제2실시예에 따른 시스템은 파일 입력부(10), 오디오 특징 추출부(20), 파일중복 검사부(30), 파일 관리부(40), 스토리지(50) 및 오디오 핑거프린트 DB(60)를 포함한다.
상기 파일 입력부(10)는 동영상 파일(MF)을 입력받는다. 동영상 파일(MF)은 컴퓨터 시스템의 스토리지(50)에 저장된 파일일 수도 있고, 입출력 인터페이스 또는 네트워크 인터페이스를 통해 외부로부터 전송된 파일일 수도 있다. 전자의 경우, 상기 파일 입력부(10)는 스토리지(50)에 저장된 동영상 파일을 파일 관리자가 임의로 선택할 수 있는 인터페이스를 제공하는 것이 바람직하다. 후자의 경우, 동영상 파일(MF)은 UCC 서비스, 블로그나 미니 홈페이지 서비스, 공개 자료실 등을 통해 업로드된 파일, P2P 파일 공유 서비스를 통해 외부 통신망으로부터 전송된 파일 또는 USB를 통해 이동 디스크로부터 입력된 파일일 수 있다. 상기 컴퓨터 시스템은 퍼스널 컴퓨터 또는 대용량의 서버 컴퓨터이다.
상기 오디오 특징 추출부(20)는 입력된 동영상 파일(MF)로부터 오디오 핑거프린트를 추출한다. 오디오 핑거프린트의 추출과 관련된 구성은 제1실시예의 경우와 실질적으로 동일하다.
상기 파일중복 검사부(30)는 오디오 특징 추출부(20)로부터 추출된 오디오 핑거프린트를 입력받는다. 그런 다음, 스토리지(50)에 저장되어 있는 동영상 파일에 대한 오디오 핑거프린트를 누적적으로 수록하고 있는 오디오 핑거프린트 DB(60)를 기준으로 파일 입력부(10)를 통해 신규 입력된 동영상 파일(MF)의 중복 여부를 판별한다. 즉, 파일중복 검사부(30)는 오디오 핑거프린트 DB(60)를 조회하여 오디오 특징 추출부(20)가 추출한 오디오 핑거프린트에 대응되는 오디오 핑거프린트가 존재하는지 판단한다. 여기서, 오디오 핑거프린트가 상호 대응된다 함은 임계치 이상의 유사도를 갖는 오디오 핑거프린트가 오디오 핑거프린트 DB(50)에 이미 등록되어 있음을 의미한다. 상기 판단 결과, 대응되는 오디오 핑거프린트가 있으면 입력된 동영상 파일(MF)과 내용이 중복되는 동영상 파일이 스토리지(50)에 이미 저장되어 있는 것을 의미한다. 반면, 대응되는 오디오 핑거프린트가 없으면 입력된 동영상 파일(MF)과 내용이 중복되는 동영상 파일이 스토리지(50)에 저장되어 있지 않다는 것을 의미한다. 상기 파일중복 검사부(30)는 오디오 핑거프린트 DB(60)를 활용하여 신규 입력된 동영상 파일(MF)의 중복 검사를 완료한 후 중복 검사 정보를 파일 관리부(40)로 출력한다.
바람직하게, 상기 중복 검사 정보는 내용이 중복되는 동영상 파일의 발견 여부를 포함하고, 내용이 중복되는 동영상 파일이 발견된 경우, 스토리지에 수록된 동영상 파일명 및 저장위치; 입력된 동영상 파일명; 각 파일의 종류; 각 파일의 인코딩 방식; 각 파일의 인코딩 효율; 각 파일의 품질 우선 순위; 파일의 용량; 파일 생성시점; 타이틀과 같은 메타데이터 및 태그정보 등을 포함한다.
상기 파일 관리부(40)는 파일중복 검사부(30)로부터 동영상 파일(MF)이 기 저장되어 있는 파일과 동일하지 않다는 취지의 중복 검사 정보가 입력되면, 스토리지(50)와 오디오 핑거프린트 DB(60)에 동영상 파일(MF)과 오디오 핑거프린트를 신규로 각각 저장한다. 반면, 파일중복 검사부(30)로부터 동영상 파일(MF)이 기 저장되어 있는 파일과 중복된다는 취지의 중복 검사 정보가 입력되면, 상기 파일 관리부(40)는 동영상 파일(MF)과 오디오 핑거프린트의 신규 저장 과정을 생략하거나, 스토리지(50)와 오디오 핑거프린트 DB(60)에 마련된 별도의 저장 공간으로 동영상 파일(MF)과 오디오 핑거프린트를 각각 이동시키거나, 기 저장된 동영상 파일과 신규로 입력된 동영상 파일(MF)의 품질을 대비하여 신규로 입력된 동영상 파일(MF)의 품질이 우수하면 스토리지(50) 및 오디오 핑거프린트 DB(60)에 저장된 정보를 신규 입력된 동영상 파일(MF) 및 이로부터 추출한 오디오 핑거프린트로 갱신할 수 있다.
대안적으로, 상기 파일 관리부(40)는 파일중복 검사부(30)로부터 동영상 파일(MF)이 기 저장되어 있는 파일과 중복된다는 취지의 중복 검사 정보가 입력되면, 동영상 파일(MF)이 기 저장된 파일과 중복된다는 취지의 메시지와 함께 '별도 저장', '저장 생략' 또는 '파일 갱신' 중 어느 하나의 처리 옵션을 선택할 수 있는 인터페이스를 파일 관리자에게 제공할 수 있다. 이런 경우, 상기 파일 관리부(40)는 파일 관리자가 지정한 옵션 선택에 따라 상술한 각 절차를 진행한다.
한편, 상기 오디오 특징 추출부(20)는 입력된 동영상 파일(MF)로부터 헤더 및 메타 정보를 더 추출할 수 있다. 이런 경우, 추출된 헤더 및 메타 정보는 파일 관리부(40)로 전달된다. 그러면, 상기 파일 관리부(40)는 오디오 핑거프린트 DB(60)에 오디오 핑거프린트를 신규로 저장 또는 갱신할 때 헤더 및 메타 정보도 함께 결합하여 저장 또는 갱신할 수 있다.
상술한 본 발명의 제2실시예는 퍼스널 컴퓨터 또는 대용량의 서버 컴퓨터에서 동영상 파일에 대한 통합 데이터베이스를 구축하는데 유용하다. 특히, 동영상 검색 서비스의 제공을 위한 동영상 데이터베이스의 구축에 활용하면, 스토리지의 공간을 효율적으로 활용할 수 있을 뿐만 아니라 동영상 검색 결과에서 내용이 중복되는 동영상 정보가 반복적으로 노출되는 것을 원천적으로 차단할 수 있다.
도 3은 본 발명의 제3실시예에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 개략적인 구성을 도시한 블록도이다.
제3실시예에 따른 시스템은, 제2실시예와 같이 동영상 파일(MF)이 입력될 때마다 동영상 파일의 중복 여부를 판별하여 데이터베이스화 여부를 결정하지 않는다. 대신, 일정한 시간 동안 파일 입력부(10)를 통해 입력되는 동영상 파일(MF)들과 이들로부터 추출된 오디오 핑거프린트를 대량으로 데이터베이스화한 후, 배치(batch) 처리를 통해 데이터베이스화된 동영상 파일들의 중복 여부를 판별하고 파일의 중복 저장 상태를 일괄적으로 해소하는 것을 특징으로 한다.
구체적으로, 파일 입력부(10)와 오디오 특징 추출부(20)의 기능은 전술한 제2실시예와 동일하다. 대신, 파일 DB화부(70)가 더 추가된다. 파일 DB화부(70)는 오디오 특징 추출부(20)에 의해 오디오 핑거프린트의 추출이 완료되면, 곧 바로 스토리지(50) 및 오디오 핑거프린트 DB(60)에 각각 동영상 파일(MF) 및 이로부터 추출된 오디오 핑거프린트를 저장한다. 이 때, 제2실시예와 마찬가지로 오디오 특징 추출부(20)가 동영상 파일(MF)의 헤더와 메타 정보를 더 추출하면, 파일 DB화부(70)는 오디오 핑거프린트와 헤더 및 메타 정보를 결합시켜 오디오 핑거프린트 DB(60)에 저장한다. 이러한 과정은 파일 입력부(10)를 통해 동영상 파일(MF)이 신규로 입력될 때마다 반복된다. 따라서, 일정한 기간 동안 n개의 동영상 파일(MF)이 입력되면, 스토리지(50)와 오디오 핑거프린트 DB(60)에는 n개의 동영상 파일과 n개의 오디오 핑거프린트가 저장되어 있게 된다. 이러한 상태에서, 동영상 파일(MF)의 중복 저장 상태를 제거하기 위해 파일중복 검사부(30)가 실행된다. 파일중복 검사부(30)는 파일 관리자에 의해 실행될 수도 있고, 미리 설정된 주기로 자동 실행될 수도 있다.
상기 파일중복 검사부(30)는 오디오 핑거프린트 DB(60)로부터 중복 검사가 이루어지지 않은 n개의 동영상 파일에 대한 오디오 핑거프린트를 독출한다. 그런 다음, 조합 가능한 모든 오디오 핑거프린트 쌍에 대한 유사도를 계산하여 임계값 이상의 유사도를 갖는 오디오 핑거프린트 값끼리 그룹핑을 수행한다. 이 때, 특정 그룹에 속한 오디오 핑거프린트의 수가 k개라면 내용이 동일한 k개의 동영상 파일이 스토리지에 중복 저장되어 있음을 의미한다.
상기 파일중복 검사부(30)는 오디오 핑거프린트 값에 대한 그룹핑을 완료한 후 중복 검사 정보를 파일 관리부(40) 측으로 전달한다. 상기 중복 검사 정보는 그룹 식별정보와 각 그룹에 속하는 동영상 파일들의 식별정보(파일명)를 포함한다. 나아가, 스토리지에 수록된 동영상 파일의 저장위치; 각 파일의 종류; 각 파일의 인코딩 방식; 각 파일의 인코딩 효율; 각 파일의 품질 우선 순위; 파일의 용량; 파일 생성시점; 타이틀과 같은 메타데이터 및 태그정보 등의 정보를 포함한다.
상기 파일 관리부(40)는 중복 검사 정보를 참조하여 내용이 동일한 동영상 파일들을 스토리지(50)로부터 식별한 후 동영상 파일의 중복 저장 상태를 제거한다.
일예로, 상기 파일 관리부(40)는 내용이 중복되는 것으로 판단된 복수의 동영상 파일 중 하나의 파일만을 남기고 나머지 파일은 스토리지(50)로부터 삭제한다. 그리고, 삭제된 동영상 파일의 오디오 핑거프린트도 오디오 핑거프린트 DB(60)로부터 제거한다.
다른 예로, 상기 파일 관리부(40)는 내용이 중복되는 것으로 판단된 복수의 동영상 파일 중 하나의 파일만을 남기고 나머지 파일은 스토리지(50)에 할당된 별도의 저장공간으로 이동시킨다. 그리고, 이동된 동영상 파일에 대한 오디오 핑거프린트도 오디오 핑거프린트 DB(60)에 마련된 별도 저장 공간으로 이동시킨다.
여기서, 파일의 삭제 또는 이동의 기준은 동영상 파일의 품질이 될 수 있다. 즉, 품질이 가장 우수한 동영상 파일만을 남기고 나머지 동영상 파일은 삭제 또는 이동시킨다.
상기 파일 관리부(40)는 파일의 삭제 또는 이동 프로세스를 자동으로 수행해도 무방하지만, 삭제 또는 이동 대상 파일을 파일 관리자로부터 직접 지정받아도 무방하다. 이런 경우, 상기 파일 관리부(40)는 사용자 인터페이스를 통해 내용이 중복되고 있는 것으로 판단된 동영상 파일들의 리스트를 그룹화하여 제공한다. 그런 다음, 상기 사용자 인터페이스를 통해 파일 관리자로부터 삭제 또는 이동 대상 파일을 지정받아 해당 파일의 삭제 또는 이동 프로세스를 진행할 수 있다.
상술한 제3실시예는 퍼스널 컴퓨터 또는 대용량의 서버 컴퓨터에 기록된 다량의 동영상 파일에 대한 중복 여부를 판별하여 스토리지를 효율적으로 관리하고자 할 때 유용하게 활용될 수 있다. 특히, 불특정 다수의 네티즌들로부터 다량의 동영상 파일을 제공받아 다양한 콘텐츠 제공 서비스를 제공하는 사업자의 입장에서 스토리지의 효율성을 제고하고 콘텐츠 서비스의 질을 높이는데 유의미한 효과가 있다.
도 4는 본 발명의 제1실시예에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 방법의 순차적 흐름을 도시한 순서도이다. 도면에서, 각 단계의 실행 주체는 도 1에 도시된 시스템이다.
먼저, 단계(S101)에서, 복수의 동영상 파일을 입력받는다. 그런 다음, 단계(S102)에서, 상기 입력된 각 동영상 파일에 포함된 오디오 데이터를 분석하여 오디오 핑거프린트를 추출한다. 만약, n 개의 동영상 파일을 입력 받았다면, n개 파일의 오디오 핑거프린트가 추출된다. 여기서, n은 2보다 큰 정수이다. 이어서, 단계(S103)에서 상기 추출된 각 오디오 핑거프린트를 상호 대비하여 동영상 파일들 간의 중복 여부를 판단하여 중복 검사 정보를 파일 관리자에게 출력한다.
바람직하게, 상기 중복 검사 정보는 그래픽 인터페이스로 출력된다. 상기 중복 검사 정보는 내용이 중복되는 것으로 판별된 동영상 파일들의 그룹 식별코드; 각 그룹에 속한 동영상 파일명; 각 파일의 종류; 각 파일의 인코딩 방식; 각 파일의 인코딩 효율; 각 파일의 품질 우선 순위; 파일의 용량; 파일 생성 시점; 타이틀과 같은 메타데이터 및 태그정보 등을 포함한다.
단계(S104)에서 파일 관리자는 출력된 중복 검사 정보를 인지한 후 삭제 또는 이동시킬 파일을 선택할 수 있다. 삭제 또는 이동 대상 파일의 선택이 이루어지면, 선택된 파일을 삭제하거나 스토리지(50)에 마련된 별도의 저장 공간으로 이동시킨다. 아울러, 단계(S104)에서 파일 관리자는 스토리지(50)에 저장할 파일을 선택할 수 있다. 그러면, 선택된 파일은 스토리지(50)에 저장된다. 물론, 선택되지 않은 파일들은 별도의 저장 공간으로 이동되거나 삭제될 수 있다.
도 5는 본 발명의 제2실시예에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 방법의 순차적 흐름을 도시한 순서도이다. 도면에서, 각 단계의 실행 주체는 도 2에 도시된 시스템이다.
먼저, 단계(S201)에서 다수의 동영상 파일에 대한 오디오 핑거프린트를 저장하고 있는 오디오 핑거프린트 DB를 제공한다. 바람직하게, 상기 오디오 핑거프린트 DB에는 스토리지에 저장된 모든 동영상 파일에 대한 오디오 핑거프린트가 수록되어 있다.
그런 다음, 단계(S201)에서, 동영상 파일을 입력받는다. 그러고 나서, 단계(S202)에서, 상기 입력된 동영상 파일에 포함된 오디오 데이터를 분석하여 오디오 핑거프린트를 추출한다.
이어서, 단계(S203)에서 상기 추출된 오디오 핑거프린트와 상기 오디오 핑거프린트 DB에 저장된 다른 동영상 파일들의 오디오 핑거프린트들을 상호 대비하여 동영상 파일 간의 중복 여부를 내용 기반으로 판단한다. 그런 다음, 중복 검사 정보를 그래픽 인터페이스를 통해 파일 관리자에게 출력한다.
바람직하게, 상기 중복 검사 정보는 내용이 중복되는 동영상 파일의 발견 여부를 포함하고, 내용이 중복되는 동영상 파일이 발견된 경우, 스토리지에 수록된 동영상 파일명 및 저장위치; 입력된 동영상 파일명; 각 파일의 종류; 각 파일의 인코딩 방식; 각 파일의 인코딩 효율; 각 파일의 품질 우선 순위; 파일의 용량; 파일 생성 시점; 타이틀과 같은 메타데이터 및 태그정보 등을 포함한다.
단계(S204)에서 파일 관리자는 출력된 중복 검사 정보를 인지한 후 입력된 동영상 파일의 삭제 또는 이동 여부를 선택할 수 있다. 삭제 또는 이동 옵션이 선택되면, 선택된 파일을 스토리지로부터 삭제하거나 스토리지에 마련된 별도의 저장 공간으로 이동시킨다. 경우에 따라, 단계(S204)에서 파일 관리자는 스토리지에 저장된 동영상 파일을 신규 입력된 동영상 파일로 대체하는 옵션을 선택할 수도 있다. 그러면, 스토리지에 저장된 동영상 파일은 신규 입력된 동영상 파일로 대체된다.
한편, 단계(204)에서 이루어지는 파일의 삭제/이동/대체는 파일 관리자의 명시적 요청 없이 자동적으로 이루어질 수 있다. 즉, 신규로 입력된 동영상 파일과 내용이 동일한 동영상 파일이 이미 존재하는 것으로 판명되면, 별도의 중복 검사 정보를 출력하지 않고, 신규로 입력된 동영상 파일을 삭제하거나 별도의 저장 공간으로 이동시킬 수 있고, 신규로 입력된 동영상 파일의 품질이 스토리지에 저장된 동영상 파일의 품질보다 우수한 경우 스토리지에 저장된 동영상 파일을 신규 입력된 동영상 파일로 대체할 수 있다.
도 6은 본 발명의 제3실시예에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 방법의 순차적 흐름을 도시한 순서도이다. 도면에서, 각 단계의 실행 주체는 도 3에 도시된 시스템이다.
먼저, 단계(S301)에서 스토리지에 저장된 복수의 동영상 파일들에 대한 오디오 핑거프린트가 저장되어 있는 오디오 핑거프린트 DB가 제공된다.
이어서, 단계(S302)에서 오디오 핑거프린트 DB에서 스토리지에 저장된 복수의 동영상 파일에 대한 오디오 핑거프린트를 독출한다. n 개 파일의의 오디오 핑거프린트가 오디오 핑거프린트 DB에 저장되어 있다면, n 개 파일 모두를 독출한다. 그런 다음, 조합 가능한 모든 파일의 오디오 핑거프린트 쌍에 대한 유사도를 계산한다.
그 다음, 단계(S303)에서 임계값 이상의 유사도를 갖는 동영상 파일끼리 그룹핑을 수행한다. 그리고, 단계(S304)에서 스토리지에 저장된 동영상 파일 간의 중복 검사 정보를 출력한다.
상기 중복 검사 정보는 그룹 식별정보와 각 그룹에 속하는 동영상 파일들의 식별정보(파일명)를 포함한다. 나아가, 스토리지에 수록된 동영상 파일의 저장위치; 각 파일의 종류; 각 파일의 인코딩 방식; 각 파일의 인코딩 효율; 각 파일의 품질 우선 순위; 파일의 용량; 파일 생성 시점; 타이틀과 같은 메타데이터 및 태그정보 등의 정보를 포함한다.
바람직하게, 상기 중복 검사 정보는 그래픽 인터페이스로 출력된다. 그래픽 인터페이스에는 파일 관리자가 동일성이 있다고 판별된 동영상 파일들을 선택하여 삭제 또는 이동시킬 수 있는 인터페이스를 포함한다.
단계(S305)에서 파일 관리자로부터 삭제 또는 이동할 동영상 파일들을 지정받은 후 해당 동영상 파일을 스토리지로부터 삭제하거나 스토리지에 마련된 별도 저장 공간으로 이동시킨다. 바람직하게, 동영상 파일이 삭제되면, 대응되는 오디오 핑거프린트도 오디오 핑거프린트 DB에서 삭제한다. 그리고, 동영상 파일이 이동되면, 대응되는 오디오 핑거프린트도 오디오 핑거프린트 DB의 별도 저장공간으로 이동시킨다.
한편, 동영상 파일의 삭제 또는 이동은 파일 관리자의 요청 없이 자동으로 이루어질 수 있다. 이를 위해, 파일 관리자는 파일 삭제 또는 파일 이동 중 어느 하나의 옵션을 미리 선택해 두는 것이 바람직하다. 자동으로 파일의 삭제 또는 이동이 이루어지는 경우, 파일의 삭제 또는 이동의 기준은 동영상 파일의 품질이 될 수 있다. 즉, 품질이 가장 우수한 동영상 파일만을 남기고 나머지 동영상 파일을 삭제 또는 이동시킨다.
본 발명에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 동작 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터에 의해 판독 가능한 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합으로 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 프로그램 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예로는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급언어 코드를 포함한다. 상기한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 동작하도록 구성될 수 있으며, 그 역도 마찬가지이다.
도 7은 본 발명에 따른 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템의 동작 방법을 수행하는데 채용될 수 있는범용 컴퓨터 시스템의 내부 블록도이다.
상기 범용 컴퓨터 시스템(400)은 램(RAM: 420)과 롬(ROM: 430)을 포함하는 주기억장치와 연결되는 하나 이상의 프로세서(410)를 포함한다. 프로세서(410)는 중앙처리장치(CPU)로 불리기도 한다. 본 기술분야에서 널리 알려진 바와 같이, 롬(430)은 데이터와 명령을 단방향성으로 프로세서(410)에 전송하는 역할을 하며, 램(420)은 통상적으로 데이터와 명령을 양방향성으로 프로세서(410)로 전송하는데 사용된다. 램(420) 및 롬(430)은 컴퓨터 판독 가능 매체의 어떠한 적절한 형태를 포함할 수 있다. 대용량 기억장치(440)는 양방향성으로 프로세서(410)와 연결되어 추가적인 데이터 저장 능력을 제공하며, 상기된 컴퓨터 판독 가능 기록 매체 중 어떠한 것일 수 있다. 대용량 기억장치(440)는 프로그램, 데이터 등을 저장하는데 사용되며, 통상적으로 주기억장치보다 속도가 느린 하드 디스크와 같은 보조기억장치이다. CD롬(460)과 같은 특정 대용량 기억장치가 사용될 수도 있다. 프로세서(410)는 비디오 모니터, 트랙볼 마우스, 키보드, 마이크로폰, 터치스크린 형 디스플레 이, 카드 판독기, 자기 또는 종이 테이프 판독기, 음성 또는 필기 인식기, 조이스틱 또는 기타 공지된 컴퓨터 입출력 장치와 같은 하나 이상의 입출력 인터페이스(450)와 연결된다. 마지막으로, 프로세서(410)는 네트워크 인터페이스(470)를 통하여 유선 또는 무선 통신 네트워크에 연결될 수 있다. 이러한 네트워크 연결을 통하여 상기된 방법의 절차를 수행할 수 있다. 상기된 장치 및 도구는 컴퓨터 하드웨어 및 소프트웨어 기술 분야의 당업자에게 잘 알려져 있다. 한편, 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 동작하도록 구성될 수 있다.
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.
본 발명의 일 측면에 따르면, 네트워크를 통해 업로드된 디지털 동영상을 입력 받아 컴퓨터 시스템의 스토리지에 저장하기 전에 동영상에 포함된 오디오의 내용에 의해 기존에 업로드된 동영상과 새로 업로드된 동영상 간의 중복 여부를 판별한다. 그리고 오디오 내용이 중복되지 않는 경우만 스토리지에 동영상 파일을 저장한다. 이러한 구성이 동영상 검색 서비스의 제공을 위한 데이터베이스 구축 분야에 사용될 경우 동일한 동영상 파일이 중복 검색되는 것을 차단하여 동영상 검색 서비스의 품질 열화를 방지할 수 있다.
본 발명의 다른 측면에 따르면, 네트워크를 통해 업로드된 디지털 동영상을 입력 받아 컴퓨터 시스템의 스토리지에 저장하기 전에 동영상에 포함된 오디오의 내용에 의해 기존에 업로드된 동영상과 새로 업로드된 동영상 간의 내용 중복 여부를 판별한다. 그리고 오디오 내용이 중복되면 신규 업로드된 동영상 파일과 기존에 업로드된 동영상 파일의 품질을 비교하여 기존에 업로드된 동영상 파일보다 신규로 업로드된 동영상 파일의 품질이 우수하면 기존 업로드된 동영상 파일을 신규 업로드된 동영상 파일로 갱신 저장한다. 이러한 구성이 동영상 검색 서비스의 제공을 위한 데이터베이스 구축 분야에 사용될 경우 동영상 검색 데이터베이스에 저장되는 동영상 파일의 품질을 우수하게 유지 관리함으로써 결과적으로는 동영상 검색 서비스의 품질을 향상시킬 수 있다.
삭제
삭제

Claims (34)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 네트워크를 통해 사용자가 업로드 한 동영상 파일을 입력받는 파일 입력부;
    상기 입력된 동영상 파일에 포함된 오디오 데이터를 분석하여 오디오 핑거프린트를 추출하는 오디오 특징 추출부;
    상기 추출된 오디오 핑거프린트와 기존에 업로드되어 데이터베이스로 구축된 다른 동영상 파일로부터 추출된 오디오 핑거프린트를 상호 대비하여 동영상의 오디오 내용을 기초로 동영상 파일들 간의 중복 여부를 판단하는 파일중복 검사부; 및
    상기 판단 결과 신규로 업로드된 동영상 파일의 오디오 핑거프린트에 대응되는 오디오 핑거프린트가 존재하지 않으면 신규로 업로드된 동영상 파일이 기존에 업로드 된 다른 동영상 파일과 중복되지 않는 것으로 보고 업로드된 동영상 파일을 스토리지에 저장하는 파일 관리부;를 포함하는 것을 특징으로 하는 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.
  12. 제11항에 있어서,
    상기 오디오 특징 추출부는, 동영상 파일로부터 오디오 데이터만을 선택적으로 분리하여 오디오 핑거프린트를 추출하는 것을 특징으로 하는 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.
  13. 제11항에 있어서,
    복수의 동영상 파일에 대한 오디오 핑거프린트를 미리 저장하고 있는 오디오 핑거프린트 DB를 포함하고,
    상기 파일중복 검사부는, 오디오 핑거프린트 DB로부터 상기 추출된 오디오 핑거프린트에 대응되는 오디오 핑거프린트의 존재 여부를 조회하여 동영상 파일의 중복 여부를 판단하는 것을 특징으로 하는 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.
  14. 제13항에 있어서,
    오디오 핑거프린트가 상호 대응되는 경우는 오디오 핑거프린트 사이의 유사도가 임계치 이상인 경우임을 특징으로 하는 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.
  15. 삭제
  16. 네트워크를 통해 사용자가 업로드 한 동영상 파일을 입력받는 파일 입력부;
    상기 입력된 동영상 파일에 포함된 오디오 데이터를 분석하여 오디오 핑거프린트를 추출하는 오디오 특징 추출부;
    상기 추출된 오디오 핑거프린트와 기존에 업로드되어 데이터베이스로 구축된 다른 동영상 파일로부터 추출된 오디오 핑거프린트를 상호 대비하여 동영상의 오디오 내용을 기초로 동영상 파일들 간의 중복 여부를 판단하는 파일중복 검사부; 및
    상기 판단 과정에서 신규로 업로드된 동영상 파일의 오디오 핑거프린트에 대응되는 오디오 핑거프린트가 존재하여 업로드된 동영상 파일이 기존에 업로드된 동영상 파일과 중복되는 것으로 판단되면, 신규로 업로드된 동영상 파일과 기존에 업로드된 동영상 파일의 품질을 비교하여 신규로 업로드된 동영상 파일의 품질이 우수하면 기 저장된 동영상 파일을 신규 업로드된 동영상 파일로 갱신하는 파일 관리부;를 포함하는 것을 특징으로 하는 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 네트워크를 통해 사용자가 업로드 한 동영상 파일을 입력받는 단계;
    상기 입력된 동영상 파일에 포함된 오디오 데이터를 분석하여 오디오 핑거프린트를 추출하는 단계;
    상기 추출된 오디오 핑거프린트와 기존에 업로드되어 데이터베이스로 구축된 다른 동영상 파일로부터 추출된 오디오 핑거프린트를 상호 대비하여 동영상의 오디오 내용을 기초로 동영상 파일들 간의 중복 여부를 판단하는 단계; 및
    상기 판단 결과 신규로 업로드된 동영상 파일의 오디오 핑거프린트에 대응되는 오디오 핑거프린트가 존재하지 않으면 신규로 업로드된 동영상 파일이 기존에 업로드 된 다른 동영상 파일과 중복되지 않는 것으로 보고 업로드된 동영상 파일을 스토리지에 저장하는 단계;를 포함하는 것을 특징으로 하는 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 방법.
  33. 삭제
  34. 네트워크를 통해 사용자가 업로드 한 동영상 파일을 입력받는 단계;
    상기 입력된 동영상 파일에 포함된 오디오 데이터를 분석하여 오디오 핑거프린트를 추출하는 단계;
    상기 추출된 오디오 핑거프린트와 기존에 업로드되어 데이터베이스화로 구축된 다른 동영상 파일로부터 추출된 오디오 핑거프린트를 상호 대비하여 동영상의 오디오 내용을 기초로 동영상 파일들 간의 중복 여부를 판단하는 단계;
    상기 판단 과정에서 신규로 업로드된 동영상 파일의 오디오 핑거프린트에 대응되는 오디오 핑거프린트가 존재하여 업로드된 동영상 파일이 기존에 업로드된 동영상 파일과 중복되는 것으로 판단되면, 신규로 업로드된 동영상 파일과 기존에 업로드된 동영상 파일의 품질을 비교하여 신규로 업로드된 동영상 파일의 품질이 우수하지 여부를 판단하는 단계; 및
    상기 신규로 업로드된 동영상 파일의 품질이 우수한 것으로 판단되면, 기존에 저장된 동영상 파일을 신규 업로드된 동영상 파일로 갱신하는 단계를 포함하는 것을 특징으로 하는 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템.
KR1020070047197A 2007-05-15 2007-05-15 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템 및 방법 KR100896335B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070047197A KR100896335B1 (ko) 2007-05-15 2007-05-15 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070047197A KR100896335B1 (ko) 2007-05-15 2007-05-15 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20080101034A KR20080101034A (ko) 2008-11-21
KR100896335B1 true KR100896335B1 (ko) 2009-05-07

Family

ID=40287350

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070047197A KR100896335B1 (ko) 2007-05-15 2007-05-15 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR100896335B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100985169B1 (ko) * 2009-11-23 2010-10-05 (주)피스페이스 분산 저장 시스템에서 파일의 중복을 제거하는 장치 및 방법
KR101652436B1 (ko) * 2010-08-17 2016-08-30 에스케이텔레콤 주식회사 분산파일 시스템에서의 중복 제거 장치 및 방법
KR101961132B1 (ko) * 2017-06-08 2019-03-25 김준희 오디오 특징값 추출을 통한 동영상 인코딩 방법 및 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050001174A (ko) * 2003-06-27 2005-01-06 엘지전자 주식회사 멀티미디어 중복 콘텐츠 검출 방법
KR20050039544A (ko) * 2003-10-24 2005-04-29 마이크로소프트 코포레이션 오디오 복제 검출기
KR20050086470A (ko) * 2002-11-12 2005-08-30 코닌클리케 필립스 일렉트로닉스 엔.브이. 멀티미디어 컨텐츠를 핑거프린트하는 방법
KR20070046705A (ko) * 2005-10-31 2007-05-03 한국전자통신연구원 핑거프린팅 관리 시스템 및 핑거프린트 코드 전달 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050086470A (ko) * 2002-11-12 2005-08-30 코닌클리케 필립스 일렉트로닉스 엔.브이. 멀티미디어 컨텐츠를 핑거프린트하는 방법
KR20050001174A (ko) * 2003-06-27 2005-01-06 엘지전자 주식회사 멀티미디어 중복 콘텐츠 검출 방법
KR20050039544A (ko) * 2003-10-24 2005-04-29 마이크로소프트 코포레이션 오디오 복제 검출기
KR20070046705A (ko) * 2005-10-31 2007-05-03 한국전자통신연구원 핑거프린팅 관리 시스템 및 핑거프린트 코드 전달 방법

Also Published As

Publication number Publication date
KR20080101034A (ko) 2008-11-21

Similar Documents

Publication Publication Date Title
KR100946694B1 (ko) 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한시스템 및 방법
CN105653700B (zh) 视频检索方法及系统
WO2017005149A1 (zh) 一种游戏加速方法和装置
JP5092000B2 (ja) 映像処理装置、方法、及び映像処理システム
TWI390924B (zh) 用於加速各多重同步資料流之資料庫檢視的系統以及方法
CN110149529B (zh) 媒体信息的处理方法、服务器及存储介质
Ali et al. A review of digital forensics methods for JPEG file carving
CN101300567A (zh) 在Web上的媒体共享和创作
Haynes et al. Vss: A storage system for video analytics
CN107533850A (zh) 音频内容识别方法和装置
KR100896336B1 (ko) 영상 정보 기반의 동영상 연관 검색 시스템 및 방법
CN106911939A (zh) 一种视频转码方法、装置及系统
CN104216956A (zh) 一种图片信息的搜索方法和装置
Yang et al. A security carving approach for AVI video based on frame size and index
KR20120090101A (ko) 디지털 비디오 고속 정합 시스템
KR100896335B1 (ko) 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템 및 방법
KR100916310B1 (ko) 오디오 신호처리 기반의 음악 및 동영상간의 교차 추천 시스템 및 방법
CN102932421A (zh) 云备份方法及装置
CN116680442A (zh) 视频检索方法、介质、装置和计算设备
WO2012092901A2 (zh) 媒体存储系统及方法
JP2009049668A (ja) データ処理装置、データ処理方法、プログラムおよび記録媒体
CN104637496A (zh) 计算机系统及音频比对方法
CN111666449B (zh) 视频检索方法、装置、电子设备和计算机可读介质
CN111966859A (zh) 视频数据的处理方法及装置、可读存储介质
KR101212845B1 (ko) 동영상 샘플링 방법 및 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130314

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140408

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150302

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160408

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180305

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190408

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20200211

Year of fee payment: 12