KR20070107628A - 동영상 샷의 분류 - Google Patents

동영상 샷의 분류 Download PDF

Info

Publication number
KR20070107628A
KR20070107628A KR1020070082046A KR20070082046A KR20070107628A KR 20070107628 A KR20070107628 A KR 20070107628A KR 1020070082046 A KR1020070082046 A KR 1020070082046A KR 20070082046 A KR20070082046 A KR 20070082046A KR 20070107628 A KR20070107628 A KR 20070107628A
Authority
KR
South Korea
Prior art keywords
shot
characteristic value
video
characteristic
shots
Prior art date
Application number
KR1020070082046A
Other languages
English (en)
Inventor
장중혁
Original Assignee
(주)코인미디어 랩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)코인미디어 랩 filed Critical (주)코인미디어 랩
Priority to KR1020070082046A priority Critical patent/KR20070107628A/ko
Publication of KR20070107628A publication Critical patent/KR20070107628A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2272Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/786Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using motion, e.g. object motion or camera motion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

본 발명은, 동영상을 샷 단위로 분리하는 샷 분리 단계와,
분리된 샷의 콘텐츠 특성값을 추출하여 기록하는 샷 특성값 기록 단계와,
기록된 샷 특성값을 이용하여 샷을 분류하는 샷 분류 단계를 포함하는,
동영상 샷 분류 방법
Figure 112007058975252-PAT00001
동영상, 검색, 샷

Description

동영상 샷의 분류 {Method for video shot classification}
도1은 동영상으로부터 샷을 분리하여 샷 내부에 있는 다양한 정보를 이용하여 샷을 분류하는 과정을 표현한 플로우차트
기존의 비 텍스트 기반의 동영상 검색은, MPEG7 등에서 정의된 시각 기술자(Visual Descriptor)를 이용하였기 때문에, 동영상의 모든 프레임을 검색하지 않고 컷 검출을 통해 샷 분리 지점의 프레임으로부터 추출된 시각 기술자를 비교하여 동영상을 검색하고자 하더라도, 영화 한 편에서 추출되는 샷 분리 지점 프레임의 시각 기술자가 1,000개에서 많게는 2,000개에 이르기 때문에, 탐색 대상 동영상 데이터 베이스 내에 기록된 동영상의 수가 증가함에 따라 탐색 연산량이 크게 증가하더라도 이를 줄이기 어려웠다.
그 이유는 샷 분리 지점의 시각 기술자는, 동영상의 코덱 변화나 비트레이트 변화, 프레임 레이트의 변화에 의해 크게 변화하는 경향이 있으며, 때에 따라서는 원본에서는 이루어지는 샷 분리가 변형본에서는 이루어지지 않거나 원본에서는 샷이 분리되지 않았던 위치에서 샷이 분리되는 경우가 종종 발생하고,
원본에 존재하지 않는 샷 분리 지점 프레임의 시각 기술자를 데이터 베이스 내에서 탐색할 경우, 데이터 베이스 전체를 탐색하고 나서야 존재하지 않는다는 것을 확인할 수 있고, 변형본에서 샷 분리 위치가 조금만 바뀌어도 샷 분리 위치 프레임의 시각 기술자를 입력으로 하여 데이터 베이스 전체를 탐색하고도 유사성이 충분히 높은 시각 기술자를 찾기 어려운 경우가 많기 때문에, 데이터 베이스 탐색이 매우 어려웠다.
따라서 이들 방법은, 엄격하게 통제된 환경 내에서 원본과 변형본의 품질이나 인코딩 조건이 제한되어 있거나, 텍스트에 의한 보조적 기술자가 보존되고, 상대적으로 탐색 대상 데이터 베이스가 작은 경우에 한해 제한적으로 사용할 수는 있으나, 다양한 변형본이 통제없이 발생하고 텍스트를 이용한 보조적 기술자들이 보존되지 않는 인터넷과 같은 환경에는 적용이 불가능한 문제를 안고 있다.
본 발명이 이루고자 하는 기술적 과제는, 인터넷과 같이 변형이 통제되지 않는 환경에도 불구하고, 원본 동영상 데이터를 변형에 강한 특성값을 포함할 가능성이 높은 단위로 분리하여 검색 질의가 들어오기 전에 분류하고, 변형된 동영상에 있어서도 이러한 단위로 분리하여 변형에 강한 특성값을 추출하여 검색하면 데이터 베이스 전체가 아닌 제한된 범위 내에서의 탐색만으로 데이터 베이스 내에 해당 동영상의 존재 또는 부재를 확인할 수 있는 가능성을 높게 함으로써, 입력된 동영상과 동일한 내용을 가진 동영상을 데이터베이스 내에서 검색하는데 소요되는 비용을 낮추어, 인터넷과 같은 대용량 동영상 데이터 베이스를 용이하게 검색할 수 있게 하는 것을 목표로 한다.
본 발명은, 동영상을 샷 단위로 분리하는 샷 분리 단계와,
분리된 샷의 콘텐츠 특성값을 추출하여 기록하는 샷 특성값 기록 단계와,
기록된 샷 특성값을 이용하여 샷을 분류하는 샷 분류 단계를 포함하는,
동영상 샷 분류 방법으로서,
이러한 방식으로 동영상을 샷 단위로 분리하여 색인과 검색의 단위로 사용하면, 색인과 검색 단위 내에 많은 정보가 분포하기 때문에, 다양한 변형에도 잘 변화하지 않는 정보를 이용한 색인과 검색이 가능하여, 보유한 정보량이 상대적으로 적은 샷 분리 위치의 프레임 시각 기술자 검색에 비해 다양한 변형에 강해지고,
동영상 데이터 베이스의 전체를 탐색하지 않고 변형에 강한 특성값을 이용하여 제한적 탐색 공간을 탐색하는 방법에 의해서도 낮은 오차율로 입력 동영상과 동일한 내용의 동영상의 데이터 베이스 내 존재와 부재를 판정할 수 있다.
상기 동영상 특성 데이터 추출 방법에 있어 샷 분리 단계는,
동영상 프레임 간의 복수의 기준을 이용하여 유사도를 비교하여, 연속된 프레임 간에 하나의 기준에서라도 유사도가 임계치보다 낮으면, 비교 대상 프레임 사 이에서 샷이 분리된다고 판정하여, 샷의 시작점과 샷의 종결점이 검출되면 그 사이에 있는 동영상을 샷으로 분리하는 것을 특징으로 하는 샷 분리 단계로서,
프레임 간의 유사도 비교를 위해서는, 프레임 내의 색 분포나 에지의 변화율 등을 이용한 신호 처리에 의한 유사도 비교 방법과 같이 공지 기술로 알려진 방법을 복수로 이용한다.
상기 샷 특성값 기록 단계는,
샷의 시작점과 종결점 분리를 결정하게 된 인자와 그 크기, 샷 분리를 결정하지는 못하였으나 샷 분리의 기준으로 사용되는 다른 인자의 크기를 추출하여, 해당 샷의 특징을 결정하는 특성값으로 기록하는 특징으로 하는 샷 특성값 기록 단계로서,
샷의 특성값으로 사용되는 샷 분리 결정 인자인, 연속 프레임에서 대응하는 화소의 밝기를 비교하여 얼마나 많은 변화가 일어났는지 측정하는 화소 비교 변화율이나, 화소의 세기(Y 성분)나 색상(Cb, Cr 성분)을 히스토그램으로 표현하여 비교하는 히스토그램 비교 변화율, 에지 변화율과 같은 것을 추출하는 방법은 공지 기술로 널리 알려져 있다.
다른 실시 예에서 상기 샷 특성값 기록 단계는,
샷 내에 포함된 사운드 신호로부터 음성 신호를 검출하여 그 성문(Voice print)을 추출하거나, 샷 내에 분포하는 음악 신호의 Pitch나 Beat 등을 추출하여, 해당 샷의 특징을 결정하는 특성값으로 기록하는 특징으로 하는 샷 특성값 기록 단계로서,
이를 추출하는 방법은 공지 기술로 널리 알려져 있다.
상기 샷 분류 단계는,
분리된 샷을 특성값에 따라 분류하는 단계로서, 샷 의 특성값이 n차원의 정보인 경우, 샷을 n 차원으로 분류하는 것을 특징으로 하는 샷 분류 단계로서,
이러한 분류 방법을 사용하면, 동영상으로부터 추출된 샷은 다차원의 탐색 공간을 형성하게 된다.
본 발명을 실시하면, 다양하게 변형된 동영상 데이터로부터 잘 변형되지 않는 기술자를 이용하여 원본을 탐색하는데 있어 탐색 공간을 크게 줄일 수 있기 때문에, 요구되는 컴퓨팅 파워를 크게 줄일 수 있으며, 동시에 검색 질의를 처리하는 시간이 크게 개선되어 검색 품질이 향상되는 장점이 있다.

Claims (5)

  1. 동영상을 샷 단위로 분리하는 샷 분리 단계와,
    분리된 샷의 콘텐츠 특성값을 추출하여 기록하는 샷 특성값 기록 단계와,
    기록된 샷 특성값을 이용하여 샷을 분류하는 샷 분류 단계를 포함하는,
    동영상 샷 분류 방법
  2. 제1항의 샷 분리 단계는,
    동영상 프레임 간의 복수의 기준을 이용하여 유사도를 비교하여, 연속된 프레임 간에 하나의 기준에서라도 유사도가 임계치보다 낮으면, 비교 대상 프레임 사이에서 샷이 분리된다고 판정하여, 샷의 시작점과 샷의 종결점이 검출되면 그 사이에 있는 동영상을 샷으로 분리하는 것을 특징으로 하는 샷 분리 단계
  3. 제1항의 샷 특성값 기록 단계는,
    샷의 시작점과 종결점 분리를 결정하게 된 인자와 그 크기, 샷 분리를 결정하지는 못하였으나 샷 분리의 기준으로 사용되는 다른 인자의 크기를 추출하여, 해당 샷의 특징을 결정하는 특성값으로 기록하는 특징으로 하는 샷 특성값 기록 단계
  4. 제1항의 샷 특성값 기록 단계는,
    샷 내에 분포하는 사운드 신호 내에서, 음성 신호를 분리하여 성문의 발생 시퀀스를 추출하여, 해당 샷의 특징을 결정하는 특성값으로 기록하는 특징으로 하는 샷 특성값 기록 단계
  5. 제1항의 샷 특성값 기록 단계는,
    샷 내에 분포하는 영상 신호 내에서, 객체의 움직임에 따른 벡터변화를 추출하여, 해당 샷의 특징을 결정하는 특성값으로 기록하는 특징으로 하는 샷 특성값 기록 단계
KR1020070082046A 2007-08-15 2007-08-15 동영상 샷의 분류 KR20070107628A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070082046A KR20070107628A (ko) 2007-08-15 2007-08-15 동영상 샷의 분류

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070082046A KR20070107628A (ko) 2007-08-15 2007-08-15 동영상 샷의 분류

Publications (1)

Publication Number Publication Date
KR20070107628A true KR20070107628A (ko) 2007-11-07

Family

ID=39062915

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070082046A KR20070107628A (ko) 2007-08-15 2007-08-15 동영상 샷의 분류

Country Status (1)

Country Link
KR (1) KR20070107628A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015025999A1 (ko) * 2013-08-20 2015-02-26 전자부품연구원 동영상의 일괄 컬러 변환 방법 및 그 기록매체
KR20180101959A (ko) 2017-03-06 2018-09-14 서강대학교산학협력단 멀티 모달의 상관관계를 이용한 동영상 특징 벡터 추출 방법 및 시스템

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015025999A1 (ko) * 2013-08-20 2015-02-26 전자부품연구원 동영상의 일괄 컬러 변환 방법 및 그 기록매체
KR20180101959A (ko) 2017-03-06 2018-09-14 서강대학교산학협력단 멀티 모달의 상관관계를 이용한 동영상 특징 벡터 추출 방법 및 시스템

Similar Documents

Publication Publication Date Title
EP3477506B1 (en) Video detection method, server and storage medium
Chou et al. Pattern-based near-duplicate video retrieval and localization on web-scale videos
CN106649713B (zh) 一种基于内容的电影可视化处理方法及其系统
US20110085734A1 (en) Robust video retrieval utilizing video data
JP5537285B2 (ja) 要約映像生成装置及び要約映像生成プログラム
KR101373176B1 (ko) 복제 동영상정보 검출방법 및 장치, 저장매체
KR101640317B1 (ko) 오디오 및 비디오 데이터를 포함하는 영상의 저장 및 검색 장치와 저장 및 검색 방법
JP2010186307A (ja) 動画コンテンツ識別装置および動画コンテンツ識別方法
Jawahar et al. Video retrieval based on textual queries
KR20070107628A (ko) 동영상 샷의 분류
Bekhet et al. Video matching using DC-image and local features
Chivadshetti et al. Content based video retrieval using integrated feature extraction and personalization of results
KR20080112975A (ko) 스크립트 정보 기반 동영상 검색을 위한 데이터베이스 구축방법, 데이터베이스 구축 시스템, 데이터베이스 구축용컴퓨터 프로그램이 기록된 기록매체 및 이를 이용한 동영상검색 방법
KR100930529B1 (ko) 비디오 식별을 통한 유해 동영상 검열 시스템 및 방법
Yang et al. Multiscale video sequence matching for near-duplicate detection and retrieval
US11023733B2 (en) System and method for analyzing a video file in a shortened time frame
Anh et al. Video retrieval using histogram and sift combined with graph-based image segmentation
Younessian et al. Telefonica Research at TRECVID 2010 Content-Based Copy Detection.
KR20080091411A (ko) 동영상 디엔에이를 이용한 디지털 동영상 유사도 비교 방법및 그 방법을 이용한 시스템
JP2009049667A (ja) 情報処理装置、その処理方法およびプログラム
KR100368324B1 (ko) 의미 정보를 이용한 비디오 검색 장치 및 방법
Varma et al. Video Indexing System Based on Multimodal Information Extraction Using Combination of ASR and OCR
San Pedro et al. Video retrieval using an edl-based timeline
Putpuek et al. A modification of retake detection using simple signature and LCS algorithm
CN113094524A (zh) 重复多媒体文件识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application