KR20050009672A - GoF/GoP의 질감 표현 방법과, 이를 이용한GoF/GoP 검색 방법 및 장치 - Google Patents

GoF/GoP의 질감 표현 방법과, 이를 이용한GoF/GoP 검색 방법 및 장치 Download PDF

Info

Publication number
KR20050009672A
KR20050009672A KR1020040054719A KR20040054719A KR20050009672A KR 20050009672 A KR20050009672 A KR 20050009672A KR 1020040054719 A KR1020040054719 A KR 1020040054719A KR 20040054719 A KR20040054719 A KR 20040054719A KR 20050009672 A KR20050009672 A KR 20050009672A
Authority
KR
South Korea
Prior art keywords
gof
gop
uniform texture
texture
descriptor
Prior art date
Application number
KR1020040054719A
Other languages
English (en)
Other versions
KR100612852B1 (ko
Inventor
김상균
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to US10/892,463 priority Critical patent/US7519114B2/en
Priority to EP04254309A priority patent/EP1498848A3/en
Priority to JP2004211560A priority patent/JP2005063418A/ja
Publication of KR20050009672A publication Critical patent/KR20050009672A/ko
Application granted granted Critical
Publication of KR100612852B1 publication Critical patent/KR100612852B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5862Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using texture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/7857Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using texture

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 GoF/GoP의 질감 표현 방법과, 이를 이용한 GoF/GoP 검색 방법 및 장치에 관한 것으로서, 그 GoF/GoP 질감표현방법은 GoF/GoP를 구성하는 프레임 또는 픽쳐 모두에 대해, 프레임 또는 픽쳐를 기술하는 균일질감 기술자(descriptor)를 구하는 단계; 및 GoF/GoP를 기술하는 균일질감 기술자들을, 소정의 대표값으로 간소화시켜 하나의 프레임 또는 픽쳐에 상응하는 균일질감 기술자로 표현하는 단계를 포함함을 특징으로 하고, 그 GoF/GoP 검색 방법은 데이터베이스에 저장할 복수의 GoF/GoP에 대해, GoF/GoP를 기술하는 균일질감 기술자들을 소정의 대표값으로 간소화시켜 하나의 프레임/픽쳐에 상응하는 균일질감 기술자로 표현하여 데이터베이스를 구축하는 단계; GoF/GoP가 질의로 입력되면, GoF/GoP 질의의 GoF/GoP를 기술하는 균일질감기술자들을 하나의 프레임 또는 픽쳐에 상응하는 균일질감기술자로 변환하는 단계; 데이터베이스에서 GoF/GoP 질의의 균일질감 기술자와 유사한 균일질감 기술자를 찾는 단계; 및 검색된 유사한 균일질감 기술자에 상응하는 GoF/GoP를 유사도 순으로 나열하여 검색결과값으로 결정하는 단계를 포함함을 특징으로 한다.
본 발명에 의하면, 영상의 질감을 보다 정확하게 표현하고, 효율적이고 신속한 검색이 가능하다.

Description

GoF/GoP의 질감 표현 방법과, 이를 이용한 GoF/GoP 검색 방법 및 장치{GoF/GoP Texture descriptor method, and Texture-based GoF/GoP retrieval method and apparatus using the GoF/GoP texture descriptor}
본 발명은 영상처리에 관한 것으로서, 특히 GoF/GoP(Group of Frames/Group of Pictures)의 질감 표현 방법과, 이를 이용한 GoF/GoP 검색방법 및 장치에 관한 것이다.
영상에서 질감(texture)정보는 그 영상의 특징으로 나타내는 중요한 시각적 특징 중의 하나로서 오랫동안 연구되어 왔다. 이러한 영상의 질감정보는 영상 또는 비디오 데이터를 내용기반 색인(indexing) 및 요약화 하는데 있어서 주요한 하위레벨 기술자(descriptor)로 이용된다. 또한 상기 영상의 질감정보는 전자앨범에서 특정 사진을 검색하거나 타일 또는 직물 데이터베이스에서의 내용기반 검색에 중요하게 이용되는 정보이기도 하다.
그런데, 비디오 시퀀스(video sequence)에 해당하는 GoF 나 영상군에 해당하는 GoP를 영상 데이터베이스에서 검색하기 위해서는 상기 GoF 또는 GoP를 구성하는 각각의 프레임 또는 픽쳐를 기술하는 기술자 모두를 질의(query)로 해서 상기 영상 데이터베이스를 검색하여야 한다. 예를 들어 100개의 프레임으로 이루어지는 GoF가 있다고 가정하고, 상기 GoF를 영상 데이터베이스에서 검색하고자할 때, 상기 GoF를 구성하는 프레임 각각의 기술자(descriptor) 모두를 질의(query)로 하여 상기 데이터베이스를 검색한다. 이렇게 할 때, 상기 질의에 대한 데이터가 매우 커지게 되고, 따라서 상기 질의를 통해 데이터베이스를 검색하는데 검색시간이 많이 소요된다.
본 발명이 이루고자 하는 기술적 과제는 상술한 문제점을 해결하기 위해 균일질감 기술자(Homogeneous Texture Descriptor)를 이용하여 GoF 나 GoP를 기술하는, GoF/GoP의 질감 표현 방법을 제공하는 것이다.
본 발명이 이루고자 하는 다른 기술적 과제는 상기 GoF/GoP의 질감 표현 방법을 이용하여 영상 데이터베이스에서 상기 GoF/GoP를 검색하는, 균일질감 기술자를 이용한 GoF/GoP 검색 방법 및 장치를 제공하는 것이다.
도 1은 본 발명에 의한 GoF/GoP의 질감표현 방법을 흐름도로 도시한 것이다.
도 2는 소정의 대표값으로의 간소화에 대한 개략도를 도시한 것이다.
도 3은 본 발명에 의한 균일질감기술자를 이용한 GoF/GoP 검색장치의 구성을 블록도로 도시한 것이다.
도 4는 본 발명에 의한 균일질감기술자를 이용한 GoF/GoP 검색방법을 흐름도로 도시한 것이다.
상기 기술적 과제를 이루기 위한 본 발명에 의한 GoF/GoP의 질감 표현 방법은, GoF/GoP의 질감을 표현하는 방법에 있어서, (a) 상기 GoF/GoP를 구성하는 프레임 또는 픽쳐 모두에 대해, 상기 프레임 또는 픽쳐를 기술하는 균일질감 기술자(descriptor)를 구하는 단계; 및 (b) 상기 GoF/GoP를 기술하는 균일질감 기술자들을, 소정의 대표값으로 간소화시켜 하나의 프레임 또는 픽쳐에 상응하는 균일질감 기술자로 표현하는 단계를 포함함을 특징으로 한다.
상기 균일질감 기술자는 가보 필터링된 영상의 주파수 영역의 에너지 평균값, 에너지 분산값, DC 채널의 에너지 및 상기 영상의 전체 픽셀의 분산값을 그 구성요소로 포함함이 바람직하다.
상기 (b)단계의 소정의 대표값으로의 간소화는 상기 균일질감 기술자의 각 구성요소에 대해, 모든 프레임 또는 픽쳐의 구성요소 값의 평균값을, 또는 모든 프레임 또는 픽쳐의 구성요소 값을 크기 순으로 정렬하여 그 중간값을, 또는 모든 프레임 또는 픽쳐의 구성요소 값을 크기 순으로 정렬하여 가장 작은 값을 대표값으로 함이 바람직하다.
상기 기술적 과제를 이루기 위한 본 발명에 의한 균일질감을 이용한 GoF/GoP 검색 방법은 GoF/GoP 질의와 유사한 GoF/GoP를 검색하는 방법에 있어서 데이터베이스에 저장할 복수의 GoF/GoP에 대해, 상기 GoF/GoP를 기술하는 균일질감 기술자들을 소정의 대표값으로 간소화시켜 하나의 프레임/픽쳐에 상응하는 균일질감 기술자로 표현하여 데이터베이스를 구축하는 단계; GoF/GoP가 질의로 입력되면, 상기GoF/GoP 질의의 GoF/GoP를 기술하는 균일질감기술자들을 하나의 프레임 또는 픽쳐에 상응하는 균일질감기술자로 변환하는 단계; 상기 데이터베이스에서 상기 GoF/GoP 질의의 균일질감 기술자와 유사한 균일질감 기술자들을 찾는 단계; 및 상기 검색된 가장 유사한 균일질감 기술자들에 상응하는 GoF/GoP들을 유사도 순으로 나열하여 검색결과값으로 결정하는 단계를 포함함을 특징으로 한다.
상기 데이터베이스의 소정의 대표값으로의 간소화는 상기 균일질감 기술자의 각 구성요소에 대해, 모든 프레임/픽쳐의 구성요소 값의 평균값을, 모든 프레임 또는 픽쳐의 구성요소 값을 크기 순으로 정렬하여 그 중간값을, 모든 프레임 또는 픽쳐의 구성요소 값을 크기 순으로 정렬하여 가장 작은 값을 대표값으로 함이 바람직하다.
상기 기술적 과제를 이루기 위한 본 발명에 의한 균일질감을 이용한 GoF/GoP 검색 장치는, GoF/GoP 질의와 유사한 GoF/GoP를 검색하는 장치에 있어서 데이터베이스에 저장할 복수의 GoF/GoP에 대해, 상기 GoF/GoP를 기술하는 균일질감 기술자들을 소정의 대표값으로 간소화시켜 하나의 프레임/픽쳐에 상응하는 균일질감 기술자로 표현하여 저장하고 있는 HTD 데이터베이스; GoF/GoP가 질의로 입력되면, 상기 GoF/GoP 질의에 대해 소정의 균일질감 기술자를 생성하는 질의HTD 생성부; 상기 데이터베이스에서 상기 GoF/GoP 질의의 균일질감 기술자와 유사한 균일질감 기술자들을 검색하는 HTD 검색부; 및 상기 검색된 유사한 균일질감 기술자에 상응하는 GoF/GoP들을 유사도 순으로 나열하여 검색결과값으로 결정하는 GoF/GoP 획득부를 포함함을 특징으로 한다.
그리고 상기 기재된 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
이하, 첨부된 도면들을 참조하여 본 발명에 따른 GoF/GoP의 질감 표현 방법과, 이를 이용한 GoF/GoP 검색 방법 및 장치에 대해 상세히 설명한다.
도 1은 본 발명에 의한 GoF/GoP의 질감표현 방법을 흐름도로 도시한 것이다. 먼저, 임의의 GoF 또는 GoP가 입력되면, 상기 GoF 또는 GoP를 구성하고 있는 프레임(Frame) 또는 픽쳐(Picture) 각각에 대해 균일질감 기술자(Homogeneous Texture Descriptor, 이하 HTD라 한다.)를 구한다.(100단계) 예를 들어 GoF가 100개의 프레임으로 구성되어 있으면 상기 GoF는 100개의 HTD가 생성된다.
상기 HTD를 생성하는 일 예를 설명하면 다음과 같다. 먼저, 임의의 영상이 입력되면 상기 영상을 퓨리에 변환하여 입력된 영상을 직교좌표계 또는 극좌표계 주파수 공간으로 변환한다. 그리고 나서 라돈 변환(Radon Transform)한 후 1차원 퓨리에 변환하면 극좌표계 주파수공간으로 변환된다. 여기서 상기 라돈변환이란 2차원 영상 또는 다차원 멀티미디어 데이터를 각도에 다라 선적분해가면서 1차원 투영데이터를 얻어내는 일련의 과정을 말한다. 즉 물체는 보는 각도에 따라서 달리보여지며, 한 물체를 모든 각도에서 바라보면 그 물체의 윤곽을 짐작할 수 있는데, 라돈변환은 이러한 원리를 이용한 것이다.
그 다음에 상기 극좌표계 주파수 공간으로 변환된 영상을 가보필터(Garbor Filter)를 이용해 소정의 주파수분할영역에서 필터링을 한다. 상기 가보필터는 일 예로 방사방향으로 5영역, 각도방향으로 6개로 분할된 5x6 필터개수를 가지는 가보필터가 사용될 수 있다.
그리고 나서 직교좌표계 주파수영역 또는 극좌표 주파수영역에서 상기 가보필터링된 영상의 질감특징을 추출한다. 이 때 직교좌표계 주파수 영역 또는 극좌표계 주파수 영역은 인간 시각인지시스템에 의거하여 분할될 수 있는데, 상기 분할된 각 주파수 영역을 특징채널이라고 한다.
상기 영상의 질감특징은 가보필터링된 각 주파수 영역의 에너지 평균값과 에너지 분산값, DC 채널의 에너지 및 상기 영상의 전체 픽셀의 분산값을 그 구성요소로 포함한다.
상기 각 주파수영역 즉 채널별로 에너지 평균값과 에너지 분산값을 구하면 질감기술자(HTD)는 수학식 1과 같이 표현된다.
여기서, fSTD는 영상의 전체 픽셀의 분산값을, fDC는 DC 채널의 에너지를, e(i)(i=1,, 30)는 가보필터링된 채널에서의 에너지 평균값을, d(i)(i=1,, 30)는 가보필터링된 채널에서의 에너지 분산값을 나타낸다.
따라서 본 발명의 실시에에서 상기 각 프레임 또는 픽쳐에 대한 HTD의 구성은 수학식 1에 의해 표 1에 도시된 바와 같이 62개의 값으로 이루어진다.
상기 100단계에서 GoF 또는 GoP를 구성하고 있는 프레임(Frame) 또는 픽쳐(Picture) 각각에 대해 균일질감기술자가 구해지면, GoF/GoP의 균일질감 기술자들을 소정의 대표값으로 간소화시켜 하나의 프레임, 픽쳐에 상응하는 균일질감 기술자로 간소화시켜서 표현한다.(150단계)
도 2는 상기 소정의 대표값으로의 간소화에 대한 개략도를 도시한 것이다. 상기 소정의 대표값으로의 간소화는 본 발명에서는 세가지 방법으로 수행될 수 있다.
첫 번째 방법은 상기 균일질감 기술자의 각 구성요소에 대해, 모든 프레임 또는 픽쳐의 구성요소 값의 평균값을 대표값으로 할 수 있다. 이를 식으로 나타내면 수학식 2와 같다.
여기서, AvgHTk(j)는 k번째 비디오 샷(shot)에 대한 j번째 구성요소(component)의 평균을 나타내고, HTi(j)는 i번째 프레임에서 균일질감 D의 j번째 구성요소를, bk는 샷의 첫 번째 프레임을, ek는 샷의 마지막 프레임을, M은 샷에서의 프레임 개수를 나타낸다.
두 번째 방법은 상기 균일질감 기술자의 각 구성요소에 대해, 모든 프레임 또는 픽쳐의 구성요소 값을 크기 순으로 정렬하여 그 중간값을 대표값으로 할 수 있다. 이를 식으로 나타내면 수학식 3과 같다.
여기서, MedianHTk(j)는 k번째 비디오샷에 대한 j번째 중간값을, HTi(j)는 i번째 프레임에서 균일질감 D의 j번째 구성요소를, bk는 샷의 첫 번째 프레임을, ek는 샷의 마지막 프레임을 나타낸다.
셋째는 상기 균일질감 기술자의 각 구성요소에 대해, 모든 프레임 또는 픽쳐의 구성요소 값을 크기 순으로 정렬하여 가장 작은 값을 대표값으로 할 수 있다. 이를 식으로 나타내면 수학식 4와 같다.
여기서, IntHTk(j)는 k번째 비디오샷에 대한 j번째 intersection 값을, HTi(j)는 i번째 프레임에서 균일질감 D의 j번째 구성요소를, bk는 샷의 첫 번째 프레임을, ek는 샷의 마지막 프레임을 나타낸다.
상기 균일질감 기술자를 이용한 GoF/GoP의 질감 표현 방법에 대한 DDL 표현방식에 의한 syntax를 나타내면 다음과 같다.
<!-- ################################################### -->
<!-- Definition of MPEG-7 GofGopFeature -->
<!-- ################################################### -->
<complexType name=GofGopFeature>
<complexContent>
<element name=Descriptor xsi:type=Mpeg7:VisualDType/>
<attribute name=Aggregation use=Optional>
<simpleType>
<restriction base=String>
<enumeration value=Average/>
<enumeration value=Median/>
<enumeration value=SplitMerge/>
</restriction>
</simpleType>
</attribute>
</complexContent>
</complexType>
또한 상기 균일질감 기술자를 이용한 GoF/GoP의 질감 표현 방법에 대한 2진 표현방식에 의한 syntax를 나타내면 표 2와 같다.
상기 기술자(Descriptor)의 semantics를 간략히 설명하면 다음과 같다.
DescriptorID 필드는 dercriptor identifier를 이진표현으로 규정한다. 상기 descriptor로는 Color Layout, Dominant Color, Edge Histogram, Homogeneous Texture 등이 있다. 예를 들면, 상기 Color Layout는 2, 상기 Dominant Color는 7, 상기 Edge Histogram은 8, 상기 Homogeneous Texture에 대한 ID는 12가 될 수 있다.
SizeOfDescriptor필드는 descriptor의 크기를 규정하며, 이진표현을 사용한다.
Descriptor필드는 ISO/IEC 15938-3에 정의된 description tool을 사용하여 구성요소특징(elementary feature)을 나타낸다. 여기서는 8비트가 할당되며, SizeOfDescriptor와 같은 비트수이다.
AggregationFlag필드는 aggregation 속성(attribute)의 존재를 나타낸다. 상기 aggregation 속성에는 Average, Median, SplitMerge 이 있다.
도 3은 본 발명에 의한 균일질감기술자를 이용한 GoF/GoP 검색장치의 구성을 블록도로 도시한 것으로서, 상기 GoF/GoP 검색장치는 HTD데이터베이스(300), 질의HTD생성부(320), HTD검색부(340) 및 GoF/GoP획득부(360)를 포함하여 이루어진다.
상기 HTD데이터베이스(300)는 데이터베이스에 저장할 복수의 GoF/GoP에 대해, 상기 GoF/GoP를 기술하는 균일질감 기술자들을 소정의 대표값으로 간소화시켜 하나의 프레임/픽쳐에 상응하는 균일질감 기술자로 표현하여 저장하고 있다. 상기 질의HTD생성부(320)는 GoF/GoP가 질의로 입력되면, 상기 GoF/GoP 질의에 대해 소정의 균일질감 기술자를 생성한다.
상기 HTD데이터베이스(300) 및 질의HTD생성부(320)에서의 균일질감기술자들을 소정의 대표값으로 간소화시키는 과정은 상술한 본 발명에 의한 GoF/GoP의 질감표현 방법에서의 간소화 과정과 동일하다.
상기 HTD검색부(340)는 상기 HTD 데이터베이스(300)에서 상기 GoF/GoP 질의의 균일질감 기술자와 유사한 균일질감 기술자들을 검색한다. 상기 GoF/GoP획득부(360)는 상기 검색된 유사한 균일질감 기술자에 상응하는 GoF/GoP들을 유사도 순으로 나열하여 검색결과값으로 결정한다.
도 4는 본 발명에 의한 균일질감기술자를 이용한 GoF/GoP 검색방법을 흐름도로 도시한 것으로서, 상기 도 3을 참조하여 본 발명에 의한 상기 균일질감기술자를 이용한 GoF/GoP 검색장치의 동작을 설명하기로 한다.
먼저, 복수의 GoF 또는 GoP에 대해 상기 GoF 또는 GoP 각각을 하나의 균일질감기술자(HTD)로 표현하고, 상기 복수의 GoF 또는 GoP의 HTD가 데이터베이스로 구축되면(400단계), GoF 또는 GoP를 질의(qurery)로 받아들인다.(420단계) 상기 GoF/GoP가 질의로 입력되면, 질의HTD생성부(320)에 의해 상기 GoF/GoP 질의의 GoF/GoP를 기술하는 균일질감기술자들을 하나의 프레임 또는 픽쳐에 상응하는 균일질감기술자로 변환한다.(440단계) 그 다음에 상기 HTD검색부(340)는 상기 HTD데이터베이스(300)에서 상기 GoF/GoP 질의의 균일질감 기술자와 가장 유사한 균일질감 기술자를 찾는다.(460단계) 마지막으로 상기 GoF/GoP획득부(360)에 의해 상기 유사한 균일질감 기술자들에 상응하는 GoF/GoP들을 유사도 순으로 나열하여 검색결과값으로 결정한다.(480단계)
한편, 본 발명에 의한 균일질감기술자를 이용한 GoF/GoP 검색방법 및 장치에 대해, 데이터셋(Dataset)을 이용하여 실험한 결과는 다음과 같다.
먼저, 상기 데이터셋은 M5124에서 정의된 데이터셋과 질의(query)를 포함하고, M9811에서 정의된 바와 같은 33개의 질의들을 갖는 1822의 샷으로 구성된다.
비디오 시퀀스는 다음과 같다.
misc1.mpg( CD 20), misc2.mpg( CD 21), camiloefilho.mpg ( CD 22), news2.mpg(CD18), basket.mpg ( CD 26), nhkvideo.mpg ( CD 26), lgerca_Lisa_1.mpg(CD31), lgerca _Lisa_2.mpg( CD 32)
그리고 상기 데이터셋에 대해, 질감분포특성을 나타내는 다음과 같은 비디오시퀀스를 더한다.culture.mpg ( CD 33), lascaux _english_ sample.mpg ( CD 31), tree1.mpg
상기 균일질감 기술자를 사용한 ANMRR결과는 표 3과 같다.
상기 표 3에 나타난 바와 같이 상기 첫 번째 방법인 Average와 두 번째 방법인 Median 이 특히 좋은 검색 성능을 나타냄을 알 수 있다.
본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있다.
본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.
본 발명에 의한 GoF/GoP의 질감 표현 방법과, 이를 이용한 GoF/GoP 검색 방법 및 장치에 의하면, 영상의 질감을 보다 정확하게 표현하고, 효율적이고 신속한 검색이 가능하다.

Claims (12)

  1. GoF/GoP의 질감을 표현하는 방법에 있어서,
    (a) 상기 GoF/GoP를 구성하는 프레임 또는 픽쳐 모두에 대해, 상기 프레임 또는 픽쳐를 기술하는 균일질감 기술자(descriptor)를 구하는 단계; 및
    (b) 상기 GoF/GoP를 기술하는 균일질감 기술자들을, 소정의 대표값으로 간소화시켜 하나의 프레임 또는 픽쳐에 상응하는 균일질감 기술자로 표현하는 단계를 포함함을 특징으로 하는 GoF/GoP 질감표현 방법.
  2. 제1항에 있어서, 상기 균일질감 기술자는
    가보 필터링된 영상의 주파수 영역의 에너지 평균값, 에너지 분산값, DC 채널의 에너지 및 상기 영상의 전체 픽셀의 분산값을 그 구성요소로 포함함을 특징으로 하는 GoF/GoP 질감표현 방법.
  3. 제2항에 있어서, 상기 균일질감 기술자는
    [수학식]
    (여기서, fSTD는 영상의 전체 픽셀의 분산값을, fDC는 DC 채널의 에너지를, e(i)(i=1,, 30)는 가보필터링된 채널에서의 에너지 평균값을, d(i)(i=1,, 30)는 가보필터링된 채널에서의 에너지 분산값을 나타낸다.)
    상기 수학식과 같이 표현됨을 특징으로 하는 GoF/GoP 질감표현 방법.
  4. 제1항에 있어서, 상기 (b)단계의 소정의 대표값으로의 간소화는
    상기 균일질감 기술자의 각 구성요소에 대해, 모든 프레임 또는 픽쳐의 구성요소 값의 평균값을 대표값으로 함을 특징으로 하는 GoF/GoP 질감표현 방법.
  5. 제1항에 있어서, 상기 (b)단계의 소정의 대표값으로의 간소화는
    상기 균일질감 기술자의 각 구성요소에 대해, 모든 프레임 또는 픽쳐의 구성요소 값을 크기 순으로 정렬하여 그 중간값을 대표값으로 함을 특징으로 하는 GoF/GoP 질감표현 방법.
  6. 제1항에 있어서, 상기 (b)단계의 소정의 대표값으로의 간소화는
    상기 균일질감 기술자의 각 구성요소에 대해, 모든 프레임 또는 픽쳐의 구성요소 값을 크기 순으로 정렬하여 가장 작은 값을 대표값으로 함을 특징으로 하는 GoF/GoP 질감표현 방법.
  7. GoF/GoP 질의와 유사한 GoF/GoP를 검색하는 방법에 있어서,
    데이터베이스에 저장할 복수의 GoF/GoP에 대해, 상기 GoF/GoP를 기술하는 균일질감 기술자들을 소정의 대표값으로 간소화시켜 하나의 프레임/픽쳐에 상응하는 균일질감 기술자로 표현하여 데이터베이스를 구축하는 단계;
    GoF/GoP가 질의로 입력되면, 상기 GoF/GoP 질의의 GoF/GoP를 기술하는 균일질감기술자들을 하나의 프레임 또는 픽쳐에 상응하는 균일질감기술자로 변환하는 단계;
    상기 데이터베이스에서 상기 GoF/GoP 질의의 균일질감 기술자와 유사한 균일질감 기술자들을 찾는 단계; 및
    상기 검색된 유사한 균일질감 기술자들에 상응하는 GoF/GoP들을 유사도 순으로 나열하여 검색결과값으로 결정하는 단계를 포함함을 특징으로 하는 균일질감 기술자를 이용한 GoF/GoP를 검색 방법.
  8. 제7항에 있어서, 데이터베이스의 소정의 대표값으로의 간소화는
    상기 균일질감 기술자의 각 구성요소에 대해, 모든 프레임/픽쳐의 구성요소 값의 평균값을 대표값으로 함을 특징으로 하는 균일질감 기술자를 이용한 GoF/GoP를 검색 방법.
  9. 제7항에 있어서, 상기 데이터베이스의 소정의 대표값으로의 간소화는
    상기 균일질감 기술자의 각 구성요소에 대해, 모든 프레임 또는 픽쳐의 구성요소 값을 크기 순으로 정렬하여 그 중간값을 대표값으로 함을 특징으로 하는 균일질감 기술자를 이용한 GoF/GoP를 검색 방법.
  10. 제7항에 있어서, 상기 데이터베이스의 소정의 대표값으로의 간소화는
    상기 균일질감 기술자의 각 구성요소에 대해, 모든 프레임 또는 픽쳐의 구성요소 값을 크기 순으로 정렬하여 가장 작은 값을 대표값으로 함을 특징으로 하는 균일질감 기술자를 이용한 GoF/GoP를 검색 방법.
  11. GoF/GoP 질의와 유사한 GoF/GoP를 검색하는 장치에 있어서,
    데이터베이스에 저장할 복수의 GoF/GoP에 대해, 상기 GoF/GoP를 기술하는 균일질감 기술자들을 소정의 대표값으로 간소화시켜 하나의 프레임/픽쳐에 상응하는 균일질감 기술자로 표현하여 저장하고 있는 HTD 데이터베이스;
    GoF/GoP가 질의로 입력되면, 상기 GoF/GoP 질의에 대해 소정의 균일질감 기술자를 생성하는 질의HTD 생성부;
    상기 데이터베이스에서 상기 GoF/GoP 질의의 균일질감 기술자와 유사한 균일질감 기술자들을 검색하는 HTD 검색부; 및
    상기 검색된 유사한 균일질감 기술자들에 상응하는 GoF/GoP들을 유사도 순으로 나열하여 검색결과값으로 결정하는 GoF/GoP 획득부를 포함함을 특징으로 하는 균일질감 기술자를 이용한 GoF/GoP를 검색 장치.
  12. 제1항 내지 제10항 중 어느 한 항에 기재된 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020040054719A 2003-07-18 2004-07-14 GoF/GoP의 질감 표현 방법과, 이를 이용한GoF/GoP 검색 방법 및 장치 KR100612852B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US10/892,463 US7519114B2 (en) 2003-07-18 2004-07-16 GoF/GoP texture description method, and texture-based GoF/GoP retrieval method and apparatus using the same
EP04254309A EP1498848A3 (en) 2003-07-18 2004-07-16 GoF/GoP texture description, and texture-based GoF/GoP retrieval
JP2004211560A JP2005063418A (ja) 2003-07-18 2004-07-20 GoF/GoPの質感表現方法と、これを用いたGoF/GoPの検索方法及び装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US48794503P 2003-07-18 2003-07-18
US60/487,945 2003-07-18

Publications (2)

Publication Number Publication Date
KR20050009672A true KR20050009672A (ko) 2005-01-25
KR100612852B1 KR100612852B1 (ko) 2006-08-14

Family

ID=37222366

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040054719A KR100612852B1 (ko) 2003-07-18 2004-07-14 GoF/GoP의 질감 표현 방법과, 이를 이용한GoF/GoP 검색 방법 및 장치

Country Status (2)

Country Link
US (1) US7519114B2 (ko)
KR (1) KR100612852B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458919A (zh) * 2018-02-07 2019-11-15 深圳市腾讯计算机系统有限公司 一种动态纹理视频生成方法、装置、服务器及存储介质

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200809764A (en) * 2006-04-24 2008-02-16 Sony Corp Image processing device, image processing method and program recording medium
EP2084625B1 (en) * 2006-10-19 2011-01-12 Koninklijke Philips Electronics N.V. Dominant color descriptors
GB0700468D0 (en) * 2007-01-10 2007-02-21 Mitsubishi Electric Inf Tech Improved image identification
BRPI0820720A2 (pt) * 2007-12-11 2015-06-16 Thomson Licensing Métodos e sistemas para transcodificação dentro da cadeia de distribuição
US8791951B2 (en) * 2008-12-01 2014-07-29 Electronics And Telecommunications Research Institute Image synthesis apparatus and method supporting measured materials properties

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1268870B1 (it) 1993-08-23 1997-03-13 Seiko Epson Corp Testa di registrazione a getto d'inchiostro e procedimento per la sua fabbricazione.
JP3316853B2 (ja) 1995-07-14 2002-08-19 セイコーエプソン株式会社 積層型インクジェット記録ヘッド及びその製造方法並びにこの記録ヘッドを備えたプリンタ
JP3267151B2 (ja) 1996-04-12 2002-03-18 ミノルタ株式会社 圧電振動部材およびその製造方法
US7143434B1 (en) * 1998-11-06 2006-11-28 Seungyup Paek Video description system and method
US6192150B1 (en) * 1998-11-16 2001-02-20 National University Of Singapore Invariant texture matching method for image retrieval
US6265139B1 (en) 1998-12-30 2001-07-24 Samsung Electro-Mechanics Co., Ltd. Method for fabricating piezoelectric/electrostrictive ceramic micro actuator using photolithography
US6674905B1 (en) * 1999-01-22 2004-01-06 Canon Kabushiki Kaisha Image processing method, image processing apparatus, and storage medium
DE60045022D1 (de) 1999-01-22 2010-11-11 Canon Kk Piezoelektrische dünnschichtanordnung, verfahren zu deren herstellung und tintenstrahldruckkopf
JP2002536746A (ja) * 1999-02-01 2002-10-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 動画シーケンスを表す記述子とその記述子を使用する画像検索システム
US6850644B1 (en) * 1999-10-01 2005-02-01 Samsung Electronics Co., Ltd. Method for analyzing texture of digital image
US6650705B1 (en) * 2000-05-26 2003-11-18 Mitsubishi Electric Research Laboratories Inc. Method for encoding and transcoding multiple video objects with variable temporal resolution
JP5005154B2 (ja) * 2000-09-08 2012-08-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 記憶媒体上に記憶された情報信号を再生する装置
TW530498B (en) * 2001-08-14 2003-05-01 Nat Univ Chung Cheng Object segmentation method using MPEG-7
KR100471927B1 (ko) * 2001-10-08 2005-03-08 학교법인 한국정보통신학원 웹 기반 영상 데이터 검색 시스템 및 그 방법
AUPS206802A0 (en) * 2002-05-01 2002-06-06 Canon Kabushiki Kaisha Steganographic image encoding
US8472792B2 (en) * 2003-12-08 2013-06-25 Divx, Llc Multimedia distribution system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458919A (zh) * 2018-02-07 2019-11-15 深圳市腾讯计算机系统有限公司 一种动态纹理视频生成方法、装置、服务器及存储介质
CN110533749A (zh) * 2018-02-07 2019-12-03 深圳市腾讯计算机系统有限公司 一种动态纹理视频生成方法、装置、服务器及存储介质

Also Published As

Publication number Publication date
KR100612852B1 (ko) 2006-08-14
US20050058195A1 (en) 2005-03-17
US7519114B2 (en) 2009-04-14

Similar Documents

Publication Publication Date Title
Zhang et al. An information-driven framework for image mining
US20020107827A1 (en) Multimedia network for knowledge representation
Ooi et al. Fast image retrieval using color-spatial information
Fan et al. MultiView: Multilevel video content representation and retrieval a1
KR100612852B1 (ko) GoF/GoP의 질감 표현 방법과, 이를 이용한GoF/GoP 검색 방법 및 장치
Park et al. Majority based ranking approach in web image retrieval
Pabboju et al. A novel approach for content-based image indexing and retrieval system using global and region features
Khokher et al. Image retrieval: A state of the art approach for CBIR
Tonge Content based image retrieval by K-Means clustering algorithm
Döller et al. MPEG-7 multimedia data cartridge
Lui et al. Scalable object-based image retrieval
JP2005063418A (ja) GoF/GoPの質感表現方法と、これを用いたGoF/GoPの検索方法及び装置
Di Sciascio et al. Similarity evaluation in image retrieval using simple features
Wei et al. Design of content-based multimedia retrieval
Stojanovic et al. Content-based image retrieving improved by pixel-based search
Hladnik et al. Improving performance of content based image retrieval system with color features
Heesch et al. Image browsing: Semantic analysis of nN k networks
Kovács et al. Visret–a content based annotation, retrieval and visualization toolchain
Szűcs Index picture selection for automatically divided video segments
Muneesawang et al. iARM-an interactive video retrieval system
Zhang et al. Representation and retrieval of visual media in multimedia systems
Mehrotra et al. Integrated image information management: research issues
Shih et al. Intelligent virtual world: technologies and applications in distributed virtual environment
Negoiţă et al. Querying and Information Retrieval in Multimedia Databases
Nes et al. Database support for image retrieval using spatial-color features

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120730

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20130730

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee