KR100679124B1 - 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법및 그 방법을 기록한 기록매체 - Google Patents

이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법및 그 방법을 기록한 기록매체 Download PDF

Info

Publication number
KR100679124B1
KR100679124B1 KR1020050007594A KR20050007594A KR100679124B1 KR 100679124 B1 KR100679124 B1 KR 100679124B1 KR 1020050007594 A KR1020050007594 A KR 1020050007594A KR 20050007594 A KR20050007594 A KR 20050007594A KR 100679124 B1 KR100679124 B1 KR 100679124B1
Authority
KR
South Korea
Prior art keywords
shape
sequence
descriptor
image
shape sequence
Prior art date
Application number
KR1020050007594A
Other languages
English (en)
Other versions
KR20060086700A (ko
Inventor
김회율
최민석
김현철
Original Assignee
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한양대학교 산학협력단 filed Critical 한양대학교 산학협력단
Priority to KR1020050007594A priority Critical patent/KR100679124B1/ko
Priority to JP2007553023A priority patent/JP4792471B2/ja
Priority to PCT/KR2005/003205 priority patent/WO2006080654A1/en
Priority to CN2005800473362A priority patent/CN101116108B/zh
Publication of KR20060086700A publication Critical patent/KR20060086700A/ko
Application granted granted Critical
Publication of KR100679124B1 publication Critical patent/KR100679124B1/ko
Priority to US11/881,757 priority patent/US7995870B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/23Recognition of whole body movements, e.g. for sport training
    • EFIXED CONSTRUCTIONS
    • E05LOCKS; KEYS; WINDOW OR DOOR FITTINGS; SAFES
    • E05DHINGES OR SUSPENSION DEVICES FOR DOORS, WINDOWS OR WINGS
    • E05D15/00Suspension arrangements for wings
    • E05D15/06Suspension arrangements for wings for wings sliding horizontally more or less in their own plane
    • E05D15/0621Details, e.g. suspension or supporting guides
    • E05D15/0626Details, e.g. suspension or supporting guides for wings suspended at the top
    • E05D15/063Details, e.g. suspension or supporting guides for wings suspended at the top on wheels with fixed axis
    • EFIXED CONSTRUCTIONS
    • E06DOORS, WINDOWS, SHUTTERS, OR ROLLER BLINDS IN GENERAL; LADDERS
    • E06BFIXED OR MOVABLE CLOSURES FOR OPENINGS IN BUILDINGS, VEHICLES, FENCES OR LIKE ENCLOSURES IN GENERAL, e.g. DOORS, WINDOWS, BLINDS, GATES
    • E06B3/00Window sashes, door leaves, or like elements for closing wall or like openings; Layout of fixed or moving closures, e.g. windows in wall or like openings; Features of rigidly-mounted outer frames relating to the mounting of wing frames
    • E06B3/32Arrangements of wings characterised by the manner of movement; Arrangements of movable wings in openings; Features of wings or frames relating solely to the manner of movement of the wing
    • E06B3/34Arrangements of wings characterised by the manner of movement; Arrangements of movable wings in openings; Features of wings or frames relating solely to the manner of movement of the wing with only one kind of movement
    • E06B3/42Sliding wings; Details of frames with respect to guiding
    • E06B3/46Horizontally-sliding wings
    • E06B3/4636Horizontally-sliding wings for doors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • EFIXED CONSTRUCTIONS
    • E05LOCKS; KEYS; WINDOW OR DOOR FITTINGS; SAFES
    • E05YINDEXING SCHEME ASSOCIATED WITH SUBCLASSES E05D AND E05F, RELATING TO CONSTRUCTION ELEMENTS, ELECTRIC CONTROL, POWER SUPPLY, POWER SIGNAL OR TRANSMISSION, USER INTERFACES, MOUNTING OR COUPLING, DETAILS, ACCESSORIES, AUXILIARY OPERATIONS NOT OTHERWISE PROVIDED FOR, APPLICATION THEREOF
    • E05Y2201/00Constructional elements; Accessories therefor
    • E05Y2201/60Suspension or transmission members; Accessories therefor
    • E05Y2201/622Suspension or transmission members elements
    • E05Y2201/684Rails; Tracks
    • EFIXED CONSTRUCTIONS
    • E05LOCKS; KEYS; WINDOW OR DOOR FITTINGS; SAFES
    • E05YINDEXING SCHEME ASSOCIATED WITH SUBCLASSES E05D AND E05F, RELATING TO CONSTRUCTION ELEMENTS, ELECTRIC CONTROL, POWER SUPPLY, POWER SIGNAL OR TRANSMISSION, USER INTERFACES, MOUNTING OR COUPLING, DETAILS, ACCESSORIES, AUXILIARY OPERATIONS NOT OTHERWISE PROVIDED FOR, APPLICATION THEREOF
    • E05Y2201/00Constructional elements; Accessories therefor
    • E05Y2201/60Suspension or transmission members; Accessories therefor
    • E05Y2201/622Suspension or transmission members elements
    • E05Y2201/688Rollers
    • EFIXED CONSTRUCTIONS
    • E05LOCKS; KEYS; WINDOW OR DOOR FITTINGS; SAFES
    • E05YINDEXING SCHEME ASSOCIATED WITH SUBCLASSES E05D AND E05F, RELATING TO CONSTRUCTION ELEMENTS, ELECTRIC CONTROL, POWER SUPPLY, POWER SIGNAL OR TRANSMISSION, USER INTERFACES, MOUNTING OR COUPLING, DETAILS, ACCESSORIES, AUXILIARY OPERATIONS NOT OTHERWISE PROVIDED FOR, APPLICATION THEREOF
    • E05Y2900/00Application of doors, windows, wings or fittings thereof
    • E05Y2900/10Application of doors, windows, wings or fittings thereof for buildings or parts thereof
    • E05Y2900/13Type of wing
    • E05Y2900/132Doors

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Civil Engineering (AREA)
  • Mechanical Engineering (AREA)
  • Structural Engineering (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

본 발명은 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법 및 그 방법을 기록한 기록매체에 관한 것이다. 본 발명에 따른 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법은 이미지 시퀀스에 포함된 각 이미지 프레임들을 배경으로부터 분리된 객체만을 포함하는 n(자연수)개의 프레임들로 변환하는 단계; 상기 객체를 이용하여 상기 n개의 프레임들에 상응하는 n개의 모양 기술자를 추출하는 단계; 상기 n개의 모양 기술자를 시간 순서로 나열하여 모양 시퀀스를 생성하는 단계; 상기 모양 시퀀스를 시간축으로 주파수 변환하여 주파수 정보를 가지는 변환 계수들을 획득하는 단계; 및 상기 변환 계수들 중 저주파 영역의 계수들만을 이용하여 모양 시퀀스 기술자를 추출하는 단계를 포함하여 구성된다. 따라서, 본 발명에 의해, 객체의 움직임을 표현하는 비디오 데이터를 이미지 시퀀스로 포착하고, 각 이미지 시퀀스에서 정보 요소를 추출하여 각 비디오 데이터간의 유사도 판별이 가능하다.
이미지, 비디오, 검색, 동영상

Description

이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법 및 그 방법을 기록한 기록매체{Method for extracting information parts to retrieve image sequence data and recording medium storing the method}
도 1은 본 발명의 바람직한 일 실시예에 따른 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법을 나타낸 순서도.
도 2는 본 발명의 바람직한 일 실시예에 따른 복수의 정지 이미지 분할 상태를 예시한 도면.
도 3은 본 발명의 바람직한 일 실시예에 따른 모양 시퀀스(Shape Sequence) 생성 과정을 나타낸 도면.
도 4는 본 발명의 바람직한 일 실시예에 따른 복수의 정지 이미지로 구성된 멀티미디어 데이터에 상응하는 실수부 및 허수부의 모양 시퀀스를 예시한 도면.
도 5는 본 발명의 바람직한 일 실시예에 따른 모양 시퀀스 기술자(Shape Sequence Descriptor) 생성 과정을 나타낸 도면.
도 6은 본 발명의 바람직한 일 실시예에 따른 멀티미디어 데이터로부터 모양 시퀀스 기술자(Shape Sequence Descriptor)를 생성하는 과정을 나타낸 도면.
도 7 및 도 8은 본 발명과 종래 기술에 따른 객체의 움직임 검색 효율 성능 을 실험하기 위한 비디오 클립의 예를 나타낸 도면.
도 9는 본 발명과 종래 기술에 따른 객체의 움직임 검색 효율 성능을 표로서 나타낸 도면.
도 10은 본 발명과 종래 기술에 따른 객체의 움직임 검색 효율 평균 성능 그래프.
도 11은 본 발명과 종래 기술에 따른 객체의 움직임 검색 효율의 평균 성능 그래프.
도 12 내지 도 14는 본 발명과 종래 기술에 따른 객체의 움직임 인식 성능 그래프.
도 15는 본 발명과 종래 기술에 따른 객체의 움직임 인식 성능을 표로서 나타낸 도면.
도 16은 본 발명과 종래 기술에 따른 객체의 움직임 인식 평균 성능을 그래프.
본 발명은 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법 및 그 방법을 기록한 기록매체에 관한 것으로, 특히 객체의 움직임을 표현하는 비디오 데이터를 연속된 이미지 프레임(즉, 이미지 시퀀스)으로 포착하고, 각 이미지 시퀀스에 서 정보 요소를 추출하여 각 비디오 데이터간의 유사도 판별이 가능한 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법 및 그 방법을 기록한 기록매체에 관한 것이다. 본 발명에서 이미지 시퀀스 데이터 검색을 위한 정보 요소로는 객체의 시간에 따른 모양 변화 정보로서 객체의 동작을 식별하기 위한 모양 시퀀스(Shape Sequence), 모양 시퀀스 기술자(Shape Sequence Descriptor) 등이 있다.
디지털 카메라나 캠코더 등의 촬상 장치의 보급이 늘어나면서 디지털 이미지, 동영상 데이터 등과 같은 멀티미디어 데이터의 생성이 급격히 증가하고 있다. 이에 의해, 생성된 멀티미디어 데이터들을 효과적으로 관리하고 검색함이 점점 더 어려워지고 있다.
이러한 어려움을 해결하기 위해, 멀티미디어 데이터를 데이터 생성자가 기록한 주석(annotation)이 아닌, 멀티미디어 데이터의 내용 자체를 이용하여 검색할 수 있도록 하기 위한 연구가 활발히 진행되고 있다.
이러한 방법들 중 하나로서, 내용 기반 멀티미디어 데이터 검색(Content Based Multimedia Data Retrieval) 방법은 멀티미디어 데이터로부터 모양(Shape), 색상(Color), 질감(Texture), 움직임(Motion) 등의 특징을 추출하여, 그 특징을 기록하고, 기록된 특징을 기준으로 복수의 멀티미디어 데이터들간의 유사도를 판별함으로써 유사한 특징을 가지는 멀티미디어 데이터가 검색되도록 하는 방법이다.
상술한 멀티미디어 데이터 검색의 필요성이 증대됨에 따라 국제 표준화 기구(ISO : International Organization for Standardization)/국제 전기 표준 회의(IEC : International Electrotechnical Commission) 합동 기술 위원회(Joint Technical Committee 1)(ISO/IEC JTC1)에서는 MPEG-7과 관련하여 내용 기반 멀티미디어 데이터 검색(Content Based Multimedia Data Retrieval) 기술에 대한 표준을 제정하고 있다.
현재, 멀티미디어 데이터의 특징을 기술하기 위한 정보 요소로서 모양(shape), 색상(color), 질감(texture), 움직임(motion) 정보 등이 이용되고 있다.
한편 동영상 데이터 등과 같은 비디오 데이터 검색에 있어서는 움직임 정보가 중요한 정보 요소가 된다. 비디오 데이터 검색 방법은 비디오 데이터를 구성하는 시퀀스가 표현하는 객체의 움직임 특징을 기술하는 움직임 기술자(motion descriptor)를 추출한 뒤, 사용자가 입력한 질의 비디오 데이터와 데이터베이스에서 저장되어있는 비디오 데이터의 움직임 기술자간의 유사도를 측정함으로써 유사한 비디오 데이터를 검색하는 방법이다. 여기서, 움직임 기술자는 카메라의 움직임을 기술하는 카메라 움직임(camera motion), 객체가 움직인 경로를 기술하는 움직임 경로(motion trajectory), 이미지 전체의 움직임을 기술하는 파라미터 움직임(parametric motion), 이미지 움직임의 활동성을 정량적으로 표현하는 움직임 활동(motion activity) 등이 있다. 이중에서, 움직임 기술자를 이용한 비디오 검색 방법의 효율은 움직임 기술자가 비디오 데이터의 특징을 얼마나 잘 기술할 수 있느냐에 따라 좌우된다.
즉, 비디오 데이터에서는 객체의 움직임 및 동작 정보가 그 동영상의 내용을 결정하는 중요한 요소로 작용한다. 예를 들어, 수영 종목에서의 다이빙 장면, 피겨 스케이팅에서 선수가 회전하는 장면, 체조 경기에서 텀블링을 하는 장면 등의 내용 을 결정하는 가장 중요한 요소는 선수의 움직임 및 동작 정보일 것이다.
그러나, 종래의 MPEG-7 움직임 기술자(motion descriptor)들을 이용하면 객체의 광역적 움직임 정보는 표현할 수 있지만, 세부적 움직임의 내용적 분석 및 표현은 불가능하다. 예를 들면, 사람이 걸어가는 것과 동물이 걸어가는 것은 내용적으로 다른 것이지만 움직임 기술자만을 이용할 경우 양자는 구분될 수 없는 문제점이 있었다. 또한, 움직임 경로(motion trajectory)의 경우 움직이는 객체의 궤적만을 표현하기 때문에 객체의 종류와 움직이는 동작을 구분할 수 없는 문제점이 있었다. 또한, 파라미터 움직임(parametric motion)의 경우 사람의 움직임 같은 비정형 모양 변화(non-rigid deformation)는 표현할 수 없는 문제점이 있었다.
상술한 문제점을 해결하기 위하여 종래에 모양 변화 기술자(Shape Variation Descriptor)를 이용하여 객체의 일부분만이 움직이는 이미지 시퀀스 데이터 또는 적은 수의 프레임에서 객체의 부분적인 모양 변화가 많은 경우에도 식별이 가능하여 사용자가 원하는 이미지 시퀀스를 정확하게 검색할 수 있도록 하는 비디오 데이터 검색 방법이 제안된바 있다.
일반적으로 손을 들거나 내리거나 앉거나 일어서는 등의 객체의 움직임을 정확히 구별하기 위해서는 움직임의 연속적인 정보가 필요하다. 그러나, 종래의 비디오 데이터 검색 방법에서의 모양 변화 기술자는 움직임의 연속적인 정보를 이용하지 않기 때문에 각각의 움직임을 정교하게 구분할 수는 없는 문제점이 있었다.
따라서, 상술한 문제점들을 해결하기 위한 본 발명의 목적은 객체의 움직임을 표현하는 비디오 데이터를 연속된 이미지 프레임들(즉, 이미지 시퀀스)로 포착하고, 각 이미지 시퀀스에서 정보 요소를 추출하여 각 비디오 데이터간의 유사도 판별이 가능한 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법 및 그 방법을 기록한 기록매체를 제공하는 것이다. 여기서, 이미지 시퀀스 데이터 검색을 위한 정보 요소로는 객체의 시간에 따른 모양 변화 정보로서 객체의 동작을 식별하기 위한 모양 시퀀스(Shape Sequence), 모양 시퀀스 기술자(Shape Sequence Descriptor) 등이 있다.
또한, 본 발명의 다른 목적에 따르면 객체의 모양 변화뿐 아니라 객체의 움직임 시퀀스를 이용하여 서로 다른 각각의 움직임을 구별할 수 있어 비디오 데이터 검색 성능을 향상시킬 수 있는 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법 및 그 방법을 기록한 기록매체를 제공하는 것이다.
상기 목적들을 달성하기 위하여, 본 발명의 일 측면에 따르면, 복수의 프레임에 의해 객체의 움직임을 표현하는 이미지 시퀀스에 대한 내용 기반 검색을 위해 모양 시퀀스 기술자(Shape Sequence Descriptor)를 추출하는 방법에 있어서, 이미지 시퀀스에 포함된 각 이미지 프레임들을 배경으로부터 분리된 객체만을 포함하는 n(자연수)개의 프레임들로 변환하는 단계; 상기 객체를 이용하여 상기 n개의 프레임들에 상응하는 n개의 모양 기술자(Shape Descriptor)를 추출하는 단계; 상기 n개 의 모양 기술자를 시간 순서로 나열하여 모양 시퀀스(Shape Sequence)를 생성하는 단계; 상기 모양 시퀀스를 시간축으로 주파수 변환하여 주파수 정보를 가지는 변환 계수들을 획득하는 단계; 및 상기 변환 계수들 중 저주파 영역의 계수들만을 이용하여 모양 시퀀스 기술자(Shape Sequence Descriptor)를 추출하는 단계를 포함하는 것을 특징으로 하는 모양 시퀀스 기술자 추출 방법이 제공되고, 당해 모양 시퀀스 기술자 추출 방법의 수행을 가능하게 하는 시스템, 장치 및 기록매체가 제공된다.
상기 모양 시퀀스 기술자 추출 방법에서 상기 모양 시퀀스를 생성하기 위하여 상기 n개의 모양 기술자들을 시간축으로 정규화하는 단계가 선행되는 것을 특징으로 한다.
상기 모양 시퀀스 기술자 추출 방법은 수학식
Figure 112005004987614-pat00001
으로 정의되는 ART(Angular Radial Transform)에 의해 상기 객체에서 상기 모양 기술자가 추출되는 것을 특징으로 한다. 여기서,
Figure 112005004987614-pat00002
은 상기 ART의 n, m차 계수로서 복소수이고, 상기
Figure 112005004987614-pat00003
는 극좌표상의 이미지 함수이며, 상기
Figure 112005004987614-pat00004
은 원주방향의 함수와 반지름 방향의 함수의 곱으로 표현될 수 있는 기저 함수일 수 있다.
또한, 상기 모양 시퀀스는 상기 복소수의 실수부 및 허수부에 각각 상응하도록 복수로 생성될 수 있다.
상기 변환 계수들을 획득하기 위하여 상기 모양 시퀀스는 DFT(Discrete Fourier Transform), DCT(Discrete Cosine Transform), DWT(Discrete Wavelet Transform) 중 적어도 어느 하나의 방법에 의하여 시간축으로 주파수 변환되는 것을 특징으로 한다.
복수의 이미지 시퀀스간의 유사성은 상기 모양 시퀀스 기술자의 유사도 계산에 의해 판단되며, 상기 모양 시퀀스 기술자의 유사도 계산은 수학식
Figure 112005004987614-pat00005
에 의해 수행되는 것을 특징으로 한다. 여기서, Q와 S는 비교하고자 하는 각각의 모양 시퀀스 기술자를 의미하고,
Figure 112005004987614-pat00006
Figure 112005004987614-pat00007
는 비교하고자 하는 두 연속 모양 시퀀스 기술자의 i번째 행 및 j번째 열의 값일 수 있다.
이하, 본 발명의 바람직한 실시예를 첨부한 도면들을 참조하여 상세히 설명하기로 한다. 본 발명을 설명함에 있어 전체적인 이해를 용이하게 하기 위하여 도면 번호에 상관없이 동일한 수단에 대해서는 동일한 참조 번호를 사용하기로 한다.
도 1은 본 발명의 바람직한 일 실시예에 따른 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법을 나타낸 순서도이고, 도 2는 본 발명의 바람직한 일 실시예에 따른 복수의 정지 이미지 분할 상태를 예시한 도면이며, 도 3은 본 발명의 바람직한 일 실시예에 따른 모양 시퀀스(Shape Sequence) 생성 과정을 나타낸 도면이다. 도 4는 본 발명의 바람직한 일 실시예에 따른 복수의 정지 이미지로 구성된 멀티미디어 데이터에 상응하는 실수부 및 허수부의 모양 시퀀스를 예시한 도면이 고, 도 5는 본 발명의 바람직한 일 실시예에 따른 모양 시퀀스 기술자(Shape Sequence Descriptor) 생성 과정을 나타낸 도면이다.
도 1에 도시된 하기의 과정은 정보 요소 추출 방법을 수행하도록 하기 위한 소프트웨어 프로그램의 형태로 구현될 수 있을 뿐 아니라 동일한 방법을 수행할 수 있는 정보 요소 추출 장치의 형태로도 구현될 수 있다. 하기의 설명을 통해 당업자는 별도의 설명이 없더라도 정보 요소 추출 장치의 구성을 쉽게 이해할 수 있을 것이므로 정보 요소 추출 장치에 대한 별도의 설명은 생략한다.
도 1에 도시된 바와 같이, 정보 요소 추출 과정은 우선 입력된 멀티미디어 데이터(즉, 동영상이나 애니메이션(animation) 등과 같이 일련의 연속적인 정지 영상의 집합(image sequence))를 이용하여 개별적인 정지 이미지로 분할하는 단계(단계 110)에서 개시된다.
개별 정지 이미지 분할 단계에 의해 멀티미디어 데이터가 복수의 개별 정지 이미지로 분할된 상태가 도 2에 예시되어 있다. 도 2에 도시된 바와 같이, 멀티미디어 데이터(210a, 220a, 230a, 240a)는 일련의 연속적인 움직임을 표시하는 정지 영상들의 집합(210b, 220b, 230b, 240b)으로 분리될 수 있다. 즉, 멀티미디어 데이터의 각 프레임에서 배경으로부터 분리된 객체 정보만을 포함하는 프레임으로 변환될 수 있다.
이어서, 각 이미지 시퀀스에서 모양 기술자(Shape Descriptor)를 이용한 객체 모양 정보 추출 단계(단계 120)가 수행된다. 이는, 각각의 정지 영상인 프레임에서 객체의 정지된 모양을 기술할 수 있는 특징값(feature Vector)을 추출하여 나 열하면 이미지 시퀀스에 포함된 객체에 대한 모양 특징값들의 시퀀스를 얻을 수 있기 때문이다.
모양 기술자(Shape Descriptor)는 객체 움직임(Object Motion)에 대한 특징량을 나타내는 기술자로서, 이미지 영역의 픽셀(pixel) 데이터를 기초로 이미지의 모양(Shape) 정보를 사용할 수 있다.
본 발명에서 이용되는 모양 기술자는 멀티미디어 데이터에 포함된 개별 프레임들을 배경으로부터 분리되어 객체 정보만을 포함하는 프레임으로 변환하는 단계 및 객체의 모양 정보를 추출하기 위하여 객체 정보에서 모양 기술자(Shape Descriptor)를 추출하는 단계를 통해 추출될 수 있다.
이하에서는 모양 기술자의 일 실시예인 ART(Angular Radial Transform)를 이용하여 모양 기술자(즉, 모양 특징값들)를 추출하는 방법을 설명한다.
ART는 극좌표상에서 단위원상에 정현함수(sinusoidal function)가 기저(basis)로 구성된 직교 단일 변환(orthogonal unitary transform)으로서 회전 불변한 모양을 기술할 수 있으며 직교성이 있기 때문에 정보의 중복성이 없다. ART는 하기 수학식 1과 같이 정의될 수 있다.
Figure 112005004987614-pat00008
여기서
Figure 112005004987614-pat00009
은 ART의 n, m차 계수로서 복소수이고, 이 값의 크기만을 취함으로써 이미지의 특징량을 나타낼 수 있다. 단 n=0, m=0일 때의 값은 기술자로서는 사용되지 않고, 각 계수 값들을 정규화 하는데 사용된다.
Figure 112005004987614-pat00010
는 극좌표상의 이미지 함수이며,
Figure 112005004987614-pat00011
은 원주방향의 함수와 반지름 방향의 함수의 곱으로 표현될 수 있는 기저 함수로서 하기 수학식 2와 같이 표현될 수 있다.
Figure 112005004987614-pat00012
여기서,
Figure 112005004987614-pat00013
는 ART 기저함수를 구성하는 편각함수(Angular Function)이며,
Figure 112005004987614-pat00014
는 ART 기저 함수를 구성하는 방사함수(Radial Function)이다. 회전에 불변한 특성을 나타내기 위해서는
Figure 112005004987614-pat00015
가 하기 수학식 3과 같이 표시되어져야 한다.
Figure 112005004987614-pat00016
여기서,
Figure 112005004987614-pat00017
는 원주 기저 함수(radial basis function)이며, 여현 함수(cosine function)와 정현 함수(sine function)를 사용할 때 각각 ART-C와 ART-S로 표시된다.
상술한 수학식 2의
Figure 112005004987614-pat00018
는 여러 가지 타입을 가질 수 있으며, 그 타입에 따라 하기의 수학식 4에서와 같이 ART-C로 표시될 수 있다.
Figure 112005004987614-pat00019
개별 프레임들로부터 추출된 ART 계수는 원래의 이미지에 ART 기저함수의 성분이 얼마나 포함되어 있는지를 나타내는 것이므로, ART 계수와 ART 기저함수의 곱을 조합하면 원 이미지를 복원해 낼 수 있다. 이론적으로는 무한히 많은 ART 계수와 기저함수의 곱을 조합해야 원 이미지와 완전히 동일한 이미지를 획득할 수 있으나, 실제로는 20개 내지 30개 정보만조합해도 원 이미지와 오차가 거의 없는 이미지를 획득할 수 있다.
그리고, 상기 수학식 1로부터 계산되는 ART 계수의 절대값은 다음의 수학식 5가 의미하는 바와 같은 회전 불변성(Rotation Invariance)을 가진다. 즉, 원본 이미지와 각도 α만큼 회전된 이미지로부터 추출된 ART계수들간의 하기 수학식 6과 같다. 그런데, 회전된 이미지의 값에 절대값을 취하면 하기 수학식 7과 같이, 원본 이미지의 값과 동일해지므로, 결국, ART의 크기는 회전불변의 특성을 가짐을 알 수 있다.
Figure 112005004987614-pat00020
Figure 112005004987614-pat00021
Figure 112005004987614-pat00022
도 3에 본 발명의 바람직한 일 실시예에 따른 모양 시퀀스(Shape Sequence) 생성 과정이 도시되어 있다. 도 3에 도시된 바와 같이, 멀티미디어 데이터를 구성하는 각 정지 이미지에서 배경으로부터 분리된 객체 정보들(310)에 상응하여 각각 ART(Angular Radial Transform) 변환되어 생성된 1차원 데이터인 모양 기술자들(Shape Descriptor, 320)이 생성된다. 모양 기술자는 ART 계수의 크기에 상응하는 색상으로 표시(즉, ART 계수들의 시각화 정보)되도록 구성된다.
모양 시퀀스는 도 3에 도시된 바와 같이 ART 변환된 계수로서의 복소수의 크기만으로 표시될 수도 있으나, 도 4에 도시된 바와 같이 당해 개별 프레임에 포함된 객체 정보(410)에 상응하는 복소수의 실수부(420)와 허수부(430)가 별개의 모양 시퀀스로 분리되어 구성될 수도 있다.
이어서, 단계 120을 통해 생성된 모양 기술자들(320)을 이용하여 모양 시퀀스가 생성(단계 130)된다. 즉, 상술한 과정을 통해 생성된 모양 기술자들(320)이 시간축에 따라 배열함으로써 2차원 정보인 모양 시퀀스(Sequence Sequence, 330)가 생성된다. 모양 시퀀스(330)는 각각의 모양 기술자들(320)을 정해진 시간 길이로 만들기 위하여 시간축으로 정규화함으로써 움직임의 속도에 무관하게 생성된다. 모양 시퀀스(330)를 생성하기 위한 정규화 방법으로 예를 들어 시간축으로 선형 보간 법(Linear Interpolation)이 이용될 수 있다.
이어서, 단계 140에서 모양 시퀀스 기술자(Shape Sequence Descriptor)가 생성될 필요가 있는지 여부를 판단한다.
모양 시퀀스 기술자의 생성이 필요한 경우, 단계 150에서 모양 시퀀스를 시간축으로 주파수 변환하여 변환 계수를 획득한다. 실제 시간에 따른 물체의 움직이는 모양을 표현하고 멀티미디어 데이터 검색을 위하여 상술한 과정에 의해 생성(추출)된 모양 시퀀스가 직접 이용될 수도 있다. 그러나, 모양 시퀀스는 상대적으로 그 크기가 크므로 검색에 다소 많은 시간이 소요될 수 있어, 신호의 특징을 잘 표현할 수 있는 변환(Transformation)을 통해 산출된 계수를 이용할 수도 있다. 즉, 추출된 모양 시퀀스의 각 열(column)을 시간축으로 주파수 변환한 후 저주파 부분의 계수만을 취하여 생성된 모양 시퀀스 기술자가 물체의 움직이는 모양을 표현하거나 멀티미디어 데이터 검색을 위해 이용될 수 있다. 여기서, 모양 시퀀스 기술자를 생성하기 위한 주파수 변환 방법은 예를 들어 DFT(Discrete Fourier Transform), DCT(Discrete Cosine Transform), DWT(Discrete Wavelet Transform) 등일 수 있으며, 이외에도 다양한 주파수 변환 방법이 이용될 수 있다.
이어서, 단계 160에서 주파수 변환된 변환 계수들 중 저주파 영역의 일부 계수만을 추출하여 모양 시퀀스 기술자(Shape Sequence Descriptor)를 생성한다.
도 5에 본 발명의 바람직한 일 실시예에 따른 모양 시퀀스 기술자(Shape Sequence Descriptor) 생성 과정이 도시되어 있다.
즉, ART 변환된 계수로서의 복소수에 포함된 실수부에 상응하는 모양 시퀀스 (420)와 허수부에 상응하는 모양 시퀀스(430)를 각각 시간 축으로 주파수 변환을 수행하여 주파수 변환된 모양 시퀀스(510, 520)를 생성한다.
이후, 주파수 변환된 모양 시퀀스(510, 520) 중 저주파수 영역만을 추출하여 ART 변환된 계수로서의 복소수에 포함된 실수부에 상응하는 모양 시퀀스 기술자(530)와 허수부에 상응하는 모양 시퀀스 기술자(540)를 생성한다.
움직임 인식 및 멀티미디어 데이터 검색을 위해 필요한 모양 시퀀스 기술자간의 유사도 계산은 하기 수학식 8에 표시된 바와 같이 두 기술자 요소들의 차이의 절대값의 합으로 정의될 수 있다.
Figure 112005004987614-pat00023
여기서, Q와 S는 비교하고자 하는 모양 시퀀스 기술자를 의미하며,
Figure 112005004987614-pat00024
Figure 112005004987614-pat00025
는 비교하고자 하는 두 연속 모양 시퀀스 기술자의 I번째 행(즉, 시간축) 및 j번째 열(ART 계수가 객체에 상응하도록 나열된 축)의 값이다.
도 6은 본 발명의 바람직한 일 실시예에 따른 멀티미디어 데이터로부터 모양 시퀀스 기술자(Shape Sequence Descriptor)를 생성하는 과정을 나타낸 도면이다.
앞서 도 1 내지 도 5를 참조하여 설명한 과정이 도 6에 일련의 과정으로서 도시되어 있다.
도 6에 도시된 바와 같이, 하나의 멀티미디어 데이터는 일련의 개별 프레임들(310)로 분할될 수 있고, 개별 프레임들(310)은 각각 ART 변환에 의해 모양 기술자들(320)로 생성될 수 있다.
생성된 모양 기술자들(320)은 시간축으로 정규화됨으로써 하나의 모양 시퀀스(330)를 구성할 수 있고, 모양 시퀀스(330)는 시간축으로 주파수 변환을 수행하여 주파수 변환된 모양 시퀀스(610)로 변환될 수 있다.
이후, 주파수 변환된 모양 시퀀스(610)의 저주파수 부분만을 추출하여 모양 시퀀스 기술자(620)를 생성할 수 있다.
움직임 인식 및 멀티미디어 데이터 검색을 위해 필요한 모양 시퀀스 기술자간의 유사도 계산은 상술한 수학식 8에 의해 산출될 수 있고, 산출값이 작을수록 두 개의 멀티미디어 데이터가 비슷한 특징을 가진다고 할 수 있다.
도 7 및 도 8은 본 발명과 종래 기술에 따른 객체의 움직임 검색 효율 성능을 실험하기 위한 비디오 클립의 예를 나타낸 도면이고, 도 9는 본 발명과 종래 기술에 따른 객체의 움직임 검색 효율 성능을 표로서 나타낸 도면이며, 도 10은 본 발명과 종래 기술에 따른 객체의 움직임 검색 효율 평균 성능 그래프이다. 도 11은 본 발명과 종래 기술에 따른 객체의 움직임 검색 효율의 평균 성능 그래프이고, 도 12 내지 도 14는 본 발명과 종래 기술에 따른 객체의 움직임 인식 성능 그래프이다. 도 15는 본 발명과 종래 기술에 따른 객체의 움직임 인식 성능을 표로서 나타낸 도면이고, 도 16은 본 발명과 종래 기술에 따른 객체의 움직임 인식 평균 성능 을 그래프이다.
도 7 및 도 8에 도시된(즉, 실험에 사용된) 데이터 셋(data Set)은 MPEG-7 core experiment dataset Part-B로서, 해당 데이터 셋은 5명의 사람에 의한 22종류의 움직임을 묘사하는 110개의 비디오 클립으로 구성된다.
도 7 및 도 8에 도시된 데이터 셋을 이용하여 temporal template로부터 추출된 Hu 모멘트, temporal template로부터 추출된 ART 기술자, 모양 변화 기술자 및 모양 시퀀스 기술자를 이용한 객체 움직임의 검색 효율 성능과 인식 성능의 비교 결과가 도 9 내지 도 15에 도시되어 있다. ART 기술자 및 모양 변화 기술자(Shape Variation Descriptor)를 추출하는 방법은 본 출원인의 선출원인 특허출원 제10-2002-0034258호에 상세하게 기술되어 있으므로 이에 대한 설명은 생략한다. 또한, 본 출원인의 선출원에 기재된 기술적 사상 중 필요한 사항은 본 명세서에 동일 또는 유사하게 적용될 수 있음은 자명하며, 이에 대한 중복되는 설명은 생략한다.
본 발명과 종래 기술에 따른 검색 효율 성능 비교를 위한 척도로는 NMRR(Normalized Modified Retrieval Rank)을 사용하기로 하며, 인식률은 다음과 같이 정의하기로 한다.
인식률은 특정 동작을 질의하였을 때 해당 동작으로 올바르게 판단하는지 여부를 측정하는 것이므로, 우선 대표 동작의 등록이 필요하다. 그러나, 실험 데이터가 적기 때문에 다음의 방식으로 인식 실험을 하기로 한다.
먼저 한 가지 움직임마다 5개의 데이터가 있으므로, 첫 번째 동작을 표준 동작으로 등록하고, 나머지 4개를 질의하여 올바르게 해당 동작으로 인식하는가를 계 산한다. 즉, 첫 번째 사람으로 22가지 동작을 등록해 놓고, 나머지 4명의 동작을 차례로 질의하여 인식 여부를 계산하면, 하기 수학식 9와 같이 인식률이 계산될 수 있다.
Figure 112005004987614-pat00026
또한, 인식률은 22가지 동작 전체에 수행하여 평균값이 산출될 수 있다.
그러나, 상술한 실험 방법만으로는 모델 선정에 따른 오차가 생길 수 있으므로, 모델을 변경(예를 들어, 두 번째 사람의 데이터를 표준 모델로 등록)하고 나머지 4개를 질의하고 인식 실험을 수행한다. 또한, 상술한 방식으로 모델을 전부 바꿔가면서 구한 인식률을 전부 평균해서 구한 값을 최종 인식률로 정의한다.
상술한 실험 방법에 의해 실험된 결과가 표시된 도 9 내지 도 11을 참조하면 본 발명에 따른 모양 시퀀스 기술자를 이용하는 방법이 가장 좋은 검색 효율 성능을 나타냄을 알 수 있다.
또한, 동일한 방법으로 객체의 움직임 인식 성능을 실험한 결과를 나타낸 도 12 내지 도 16을 참조할 때, 본 발명에 따른 모양 시퀀스 기술자를 이용하는 방법이 가장 좋은 움직임 인식 성능을 나타냄을 알 수 있다.
상술한 바와 같이, 본 발명에 따른 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법 및 그 방법을 기록한 기록매체는 객체의 움직임을 표현하는 비디오 데이터를 연속된 이미지 프레임(즉, 이미지 시퀀스)으로 포착하고, 각 이미지 시퀀스에서 정보 요소를 추출하여 각 비디오 데이터간의 유사도 판별이 가능하다. 여기서, 이미지 시퀀스 데이터 검색을 위한 정보 요소로는 객체의 시간에 따른 모양 변화 정보로서 객체의 동작을 식별하기 위한 모양 시퀀스(Shape Sequence), 모양 시퀀스 기술자(Shape Sequence Descriptor) 등이 있다.
또한, 본 발명은 객체의 모양 변화뿐 아니라 객체의 움직임 시퀀스를 이용하여 서로 다른 각각의 움직임을 구별할 수 있어 비디오 데이터 검색 성능을 향상시킬 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (12)

  1. 복수의 프레임에 의해 객체의 움직임을 표현하는 이미지 시퀀스에 대한 내용 기반 검색을 위한 모양 시퀀스 기술자(Shape Sequence Descriptor)를 추출하는 방법에 있어서,
    이미지 시퀀스(image sequence)에 포함된 각 이미지 프레임들을 배경으로부터 분리된 객체만을 포함하는 n(임의의 자연수)개의 프레임들로 변환하는 단계;
    상기 객체를 이용하여 상기 n개의 프레임들에 상응하는 n개의 모양 기술자(Shape Descriptor)를 추출하는 단계;
    상기 n개의 모양 기술자를 시간 순서로 나열하여 모양 시퀀스(Shape Sequence)를 생성하는 단계;
    상기 모양 시퀀스를 시간축으로 주파수 변환하여 주파수 정보를 가지는 변환 계수들을 획득하는 단계; 및
    상기 변환 계수들 중 저주파 영역의 계수들만을 이용하여 모양 시퀀스 기술자(Shape Sequence Descriptor)를 추출하는 단계를 포함하는 것을 특징으로 하는 모양 시퀀스 기술자 추출 방법.
  2. 제1항에 있어서,
    상기 모양 시퀀스를 생성하기 위하여 상기 n개의 모양 기술자들을 시간축으 로 정규화하는 단계가 선행되는 것을 특징으로 하는 모양 시퀀스 기술자 추출 방법.
  3. 제1항에 있어서,
    하기의 수학식으로 정의되는 ART(Angular Radial Transform)에 의해 상기 객체에서 상기 모양 기술자가 추출되는 것을 특징으로 하는 모양 시퀀스 기술자 추출 방법.
    Figure 112005004987614-pat00027
    여기서,
    Figure 112005004987614-pat00028
    은 상기 ART의 n, m차 계수로서 복소수이고, 상기
    Figure 112005004987614-pat00029
    는 극좌표상의 이미지 함수이며, 상기
    Figure 112005004987614-pat00030
    은 원주방향의 함수와 반지름 방향의 함수의 곱으로 표현될 수 있는 기저 함수임.
  4. 제3항에 있어서,
    상기 모양 시퀀스는 상기 복소수의 실수부 및 허수부에 각각 상응하도록 복수로 생성되는 것을 특징으로 하는 모양 시퀀스 기술자 추출 방법.
  5. 제1항에 있어서,
    상기 변환 계수들을 획득하기 위하여 상기 모양 시퀀스는 DFT(Discrete Fourier Transform), DCT(Discrete Cosine Transform), DWT(Discrete Wavelet Transform) 중 적어도 어느 하나의 방법에 의하여 시간축으로 주파수 변환되는 것을 특징으로 하는 모양 시퀀스 기술자 추출 방법.
  6. 제1항에 있어서,
    복수의 이미지 시퀀스간의 유사성은 상기 모양 시퀀스 기술자의 유사도 계산에 의해 판단되며, 상기 모양 시퀀스 기술자의 유사도 계산은 하기 수학식에 의해 수행되는 것을 특징으로 하는 모양 시퀀스 기술자 추출 방법.
    Figure 112005004987614-pat00031
    여기서, Q와 S는 비교하고자 하는 각각의 모양 시퀀스 기술자를 의미하고,
    Figure 112005004987614-pat00032
    Figure 112005004987614-pat00033
    는 비교하고자 하는 두 연속 모양 시퀀스 기술자의 i번째 행 및 j번째 열의 값임.
  7. 이미지 시퀀스에 대한 내용 기반 검색을 위한 모양 시퀀스 기술자 추출 방법을 수행하기 위해 자동화 장치에 의해 실행될 수 있는 명령어들의 프로그램이 유형적으로 구현되어 있으며, 상기 자동화 장치에 의해 판독될 수 있는 프로그램을 기록한 기록매체에 있어서,
    복수의 프레임에 의해 객체의 움직임을 표현하는 이미지 시퀀스(image sequence)에 포함된 각 이미지 프레임들을 배경으로부터 분리된 객체만을 포함하는 n(임의의 자연수)개의 프레임들로 변환하는 단계;
    상기 객체를 이용하여 상기 n개의 프레임들에 상응하는 n개의 모양 기술자(Shape Descriptor)를 추출하는 단계;
    상기 n개의 모양 기술자를 시간 순서로 나열하여 모양 시퀀스(Shape Sequence)를 생성하는 단계;
    상기 모양 시퀀스를 시간축으로 주파수 변환하여 주파수 정보를 가지는 변환 계수들을 획득하는 단계; 및
    상기 변환 계수들 중 저주파 영역의 계수들만을 이용하여 모양 시퀀스 기술자(Shape Sequence Descriptor)를 추출하는 단계를 실행하는 것을 특징으로 하는 프로그램을 기록한 기록매체.
  8. 제7항에 있어서,
    상기 모양 시퀀스를 생성하기 위하여 상기 n개의 모양 기술자들을 시간축으로 정규화하는 단계가 선행되는 것을 특징으로 하는 프로그램을 기록한 기록매체.
  9. 제7항에 있어서,
    하기의 수학식으로 정의되는 ART(Angular Radial Transform)에 의해 상기 객체에서 상기 모양 기술자가 추출되는 것을 특징으로 하는 프로그램을 기록한 기록매체.
    Figure 112005004987614-pat00034
    여기서,
    Figure 112005004987614-pat00035
    은 상기 ART의 n, m차 계수로서 복소수이고, 상기
    Figure 112005004987614-pat00036
    는 극좌표상의 이미지 함수이며, 상기
    Figure 112005004987614-pat00037
    은 원주방향의 함수와 반지름 방향의 함수의 곱으로 표현될 수 있는 기저 함수임.
  10. 제9항에 있어서,
    상기 모양 시퀀스는 상기 복소수의 실수부 및 허수부에 각각 상응하도록 복수로 생성되는 것을 특징으로 하는 프로그램을 기록한 기록매체.
  11. 제7항에 있어서,
    상기 변환 계수들을 획득하기 위하여 상기 모양 시퀀스는 DFT(Discrete Fourier Transform), DCT(Discrete Cosine Transform), DWT(Discrete Wavelet Transform) 중 적어도 어느 하나의 방법에 의하여 시간축으로 주파수 변환되는 것을 특징으로 하는 프로그램을 기록한 기록매체.
  12. 제7항에 있어서,
    복수의 이미지 시퀀스간의 유사성은 상기 모양 시퀀스 기술자의 유사도 계산에 의해 판단되며, 상기 모양 시퀀스 기술자의 유사도 계산은 하기 수학식에 의해 수행되는 것을 특징으로 하는 프로그램을 기록한 기록매체.
    Figure 112005004987614-pat00038
    여기서, Q와 S는 비교하고자 하는 각각의 모양 시퀀스 기술자를 의미하고,
    Figure 112005004987614-pat00039
    Figure 112005004987614-pat00040
    는 비교하고자 하는 두 연속 모양 시퀀스 기술자의 i번째 행 및 j번째 열의 값임.
KR1020050007594A 2005-01-27 2005-01-27 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법및 그 방법을 기록한 기록매체 KR100679124B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020050007594A KR100679124B1 (ko) 2005-01-27 2005-01-27 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법및 그 방법을 기록한 기록매체
JP2007553023A JP4792471B2 (ja) 2005-01-27 2005-09-27 イメージシーケンスデータ検索のための情報要素抽出方法及びその方法を記録した記録媒体
PCT/KR2005/003205 WO2006080654A1 (en) 2005-01-27 2005-09-27 Information parts extraction for retrieving image sequence data
CN2005800473362A CN101116108B (zh) 2005-01-27 2005-09-27 用于获取图像序列数据的信息组分提取
US11/881,757 US7995870B2 (en) 2005-01-27 2007-07-27 Information parts extraction for retrieving image sequence data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050007594A KR100679124B1 (ko) 2005-01-27 2005-01-27 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법및 그 방법을 기록한 기록매체

Publications (2)

Publication Number Publication Date
KR20060086700A KR20060086700A (ko) 2006-08-01
KR100679124B1 true KR100679124B1 (ko) 2007-02-05

Family

ID=36740643

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050007594A KR100679124B1 (ko) 2005-01-27 2005-01-27 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법및 그 방법을 기록한 기록매체

Country Status (5)

Country Link
US (1) US7995870B2 (ko)
JP (1) JP4792471B2 (ko)
KR (1) KR100679124B1 (ko)
CN (1) CN101116108B (ko)
WO (1) WO2006080654A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8031947B2 (en) * 2007-04-03 2011-10-04 Jacobsen Kenneth P Method and system for rapid matching of video streams
CN101420595B (zh) 2007-10-23 2012-11-21 华为技术有限公司 一种描述和捕获视频对象的方法及设备
US8175392B2 (en) * 2009-01-29 2012-05-08 Nec Corporation Time segment representative feature vector generation device
TWI588778B (zh) * 2012-01-17 2017-06-21 國立臺灣科技大學 動作辨識方法
US9639761B2 (en) * 2014-03-10 2017-05-02 Mitsubishi Electric Research Laboratories, Inc. Method for extracting low-rank descriptors from images and videos for querying, classification, and object detection
EP3408836A1 (en) * 2016-01-29 2018-12-05 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Crowdshaping realistic 3d avatars with words

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004025965A1 (en) * 2002-09-11 2004-03-25 Koninklijke Philips Electronics N.V. Video coding method and device

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3224514B2 (ja) * 1996-08-21 2001-10-29 シャープ株式会社 動画像符号化装置および動画像復号装置
JP4574771B2 (ja) * 1999-01-28 2010-11-04 株式会社東芝 画像情報記述方法
JP4151158B2 (ja) * 1999-06-14 2008-09-17 ソニー株式会社 シーン記述生成装置及び方法
JP3738631B2 (ja) * 1999-09-27 2006-01-25 三菱電機株式会社 画像検索システムおよび画像検索方法
US6654483B1 (en) * 1999-12-22 2003-11-25 Intel Corporation Motion detection using normal optical flow
JP2001268479A (ja) * 2000-03-16 2001-09-28 Nippon Hoso Kyokai <Nhk> 動画像検索装置
JP2002373340A (ja) * 2001-06-14 2002-12-26 Nippon Hoso Kyokai <Nhk> 動作特徴抽出法および動作認識装置ならびに動作認識プログラム
US7212671B2 (en) * 2001-06-19 2007-05-01 Whoi-Yul Kim Method of extracting shape variation descriptor for retrieving image sequence
US20040207656A1 (en) * 2001-06-30 2004-10-21 Sang-Youn Lee Apparatus and method for abstracting summarization video using shape information of object, and video summarization and indexing system and method using the same
KR100876280B1 (ko) * 2001-12-31 2008-12-26 주식회사 케이티 통계적 모양기술자 추출 장치 및 그 방법과 이를 이용한 동영상 색인 시스템

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004025965A1 (en) * 2002-09-11 2004-03-25 Koninklijke Philips Electronics N.V. Video coding method and device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
모양 변화 축적도를 이용한 움직이는 객체의 표현 및

Also Published As

Publication number Publication date
KR20060086700A (ko) 2006-08-01
US20080031523A1 (en) 2008-02-07
JP4792471B2 (ja) 2011-10-12
CN101116108B (zh) 2010-05-12
JP2008536345A (ja) 2008-09-04
WO2006080654A1 (en) 2006-08-03
US7995870B2 (en) 2011-08-09
CN101116108A (zh) 2008-01-30

Similar Documents

Publication Publication Date Title
Varol et al. Synthetic humans for action recognition from unseen viewpoints
Rochan et al. Video summarization using fully convolutional sequence networks
TWI742300B (zh) 針對一感興趣的人與一使用者介接以促進影像搜尋之方法及系統
Wang et al. Dense trajectories and motion boundary descriptors for action recognition
Gorelick et al. Actions as space-time shapes
Liu et al. A system for analyzing and indexing human-motion databases
US10671662B2 (en) Method and system for analyzing an image generated by at least one camera
Cheema et al. Action recognition by learning discriminative key poses
JP4697106B2 (ja) 画像処理装置および方法、並びにプログラム
Halit et al. Multiscale motion saliency for keyframe extraction from motion capture sequences
JP2009509215A (ja) 画像データベースでのナビゲーション、視覚化、及びクラスタ化のための相互ランク類似度空間
KR100679124B1 (ko) 이미지 시퀀스 데이터 검색을 위한 정보 요소 추출 방법및 그 방법을 기록한 기록매체
Karaman et al. Human daily activities indexing in videos from wearable cameras for monitoring of patients with dementia diseases
KR20020096998A (ko) 이미지 시퀀스 검색을 위한 모양 변화 기술자 추출 방법
JP2005517319A (ja) 客体形状情報を利用した要約画像の抽出装置及びその方法、並びにそれを利用した動画像の要約及び索引システム
Guan et al. The isometric self-organizing map for 3d hand pose estimation
Ullah et al. Event-oriented 3D convolutional features selection and hash codes generation using PCA for video retrieval
Kanagaraj et al. Curvelet transform based feature extraction and selection for multimedia event classification
Harjanto et al. Investigating the impact of frame rate towards robust human action recognition
Chivadshetti et al. Content based video retrieval using integrated feature extraction and personalization of results
Madiraju et al. Rotation invariant texture classification using covariance
Burget et al. Automated localization of temporomandibular joint disc in mri images
Liu et al. Semantic motion concept retrieval in non-static background utilizing spatial-temporal visual information
Mukherjee et al. Human action and event recognition using a novel descriptor based on improved dense trajectories
Afifi Image retrieval based on content using color feature

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130111

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20131230

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150105

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20151230

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170102

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20180102

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20190102

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20200102

Year of fee payment: 14