KR101394154B1 - 미디어 컨텐츠 및 메타데이터를 부호화하는 방법과 그 장치 - Google Patents

미디어 컨텐츠 및 메타데이터를 부호화하는 방법과 그 장치 Download PDF

Info

Publication number
KR101394154B1
KR101394154B1 KR1020070104031A KR20070104031A KR101394154B1 KR 101394154 B1 KR101394154 B1 KR 101394154B1 KR 1020070104031 A KR1020070104031 A KR 1020070104031A KR 20070104031 A KR20070104031 A KR 20070104031A KR 101394154 B1 KR101394154 B1 KR 101394154B1
Authority
KR
South Korea
Prior art keywords
media content
information
scale indicator
data area
metadata
Prior art date
Application number
KR1020070104031A
Other languages
English (en)
Other versions
KR20090038639A (ko
Inventor
조경선
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070104031A priority Critical patent/KR101394154B1/ko
Priority to EP08778499.7A priority patent/EP2201769A4/en
Priority to CN2008801118183A priority patent/CN101868976B/zh
Priority to PCT/KR2008/003835 priority patent/WO2009051327A1/en
Priority to JP2010529843A priority patent/JP5421273B2/ja
Priority to US12/170,917 priority patent/US8660999B2/en
Publication of KR20090038639A publication Critical patent/KR20090038639A/ko
Application granted granted Critical
Publication of KR101394154B1 publication Critical patent/KR101394154B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers

Abstract

본 발명은 미디어 컨텐츠 및 메타데이터를 부호화하는 방법에 관한 것으로, 메타데이터의 내부에 미디어 컨텐츠에 대한 정보의 단위 크기를 나타내는 스케일 표시자(scale indicator)를 생성하고, 생성된 스케일 표시자에 기초하여 메타데이터에 구비된 데이터 영역이 서로 다른 값을 갖도록 데이터 영역을 결정함으로써, 메타데이터 내의 제한된 공간을 가지는 데이터 영역이 표현할 수 있는 범위를 증가시키는 효과가 있다.

Description

미디어 컨텐츠 및 메타데이터를 부호화하는 방법과 그 장치{Method and apparatus for encoding media data and metadata thereof}
본 발명은 미디어 컨텐츠 및 메타데이터를 부호화하는 방법에 관한 것으로, 보다 구체적으로는 미디어 파일 포맷의 메타데이터 필드 또는 미디어 전송 프레임워크에서 전송 패킷의 헤더 필드와 같이 고정된 길이를 갖는 메타데이터에 있어서, 메타데이터에 구비된 데이터 영역으로 표현할 수 있는 최대 범위를 증가시키는 부호화 방법 및 장치에 관한 것이다.
도 1은 메타데이터 부호화에 필요한 필드 길이, 최대 범위 및 해상도 사이의 관계를 나타내는 그래프이다.
도 1을 참조하면, 먼저 (a) 및 (b) 그래프에는 필드 길이(field length), 최대 범위(max range), 해상도(resolution)가 나타나 있다. 필드 길이는 미디어 컨텐츠의 메타데이터에 필요한 비트수, 즉 메타데이터 필드의 길이를 나타내고, 최대 범위는 메타데이터가 표현할 수 있는 정보의 범위를 나타낸다. 또한, 해상도는 메타데이터가 표현하는 정보의 해상도, 즉 메타데이터가 표시하는 정보의 단위 크기에 따라 메타데이터가 얼마나 정확한 값을 나타내는지의 척도가 되는 요소이다.
(a) 그래프와 (b) 그래프를 비교하면, 같은 최대 범위를 표현하고자 할 때, 해상도에 따라 필요한 필드 길이가 달라짐을 알 수 있다. 다시 말해서, (a) 그래프에서 n-1의 해상도(resolution(n-1), 110)로서 m1 값을 표현하기 위해서는 l1의 필드 길이가 필요하다. 반면에, (b) 그래프에서 보다 높은 n+2의 해상도(resolution(n+2), 120)로서 같은 m1 값을 표현하기 위해서는 l1 보다 더 많은 l2의 필드 길이가 필요하다. 즉, 같은 최대 범위의 값을 표현함에 있어서, 메타데이터가 미디어 컨텐츠의 해당 정보를 얼마나 정확하게 가리킬 것인지에 따라서 필요한 필드 길이가 좌우된다.
미디어 파일 포맷의 메타데이터 필드 또는 미디어 전송 프레임워크에서 전송 패킷의 헤더 필드와 같은 메타데이터는 전체 파일 또는 스트림에서 상당한 비중을 차지하므로 전체 코딩 효율을 증대시키기 위해 이와 같은 메타데이터에 필요한 비트수를 감소시킬 필요가 있다.
아울러 종래에는 고정된 길이의 메타데이터를 이용하는 경우에는 최악의 경우(worst case)를 고려한 최대 범위에 맞춰서 메타데이터의 필드 길이를 결정하거나, 미디어 컨텐츠의 구간에 따라 해상도를 달리하여 메타데이터의 필드 길이를 유동적으로 변경하는 경우에는 주기적으로 외부 시그널링(externally signalling)을 적용하는 방법을 사용하였다. 위 두 가지 경우 모두 불필요한 비트가 낭비되거나 추가적인 비트가 요구된다는 문제점이 있다.
따라서, 본 발명은 상기와 같은 문제점을 해결하기 위하여 고안된 것으로, 본 발명이 이루고자 하는 기술적 과제는 메타데이터 내부에 가변적인 스케일 표시자를 생성하여, 메타데이터가 고정된 길이의 필드 구조를 갖는 경우에도 표현할 수 있는 정보의 범위를 증가시킬 수 있는 부호화 방법과 그 장치를 제공하는 것이다.
상기 기술적 과제는 본 발명에 따라, 미디어 컨텐츠 및 상기 미디어 컨텐츠의 메타데이터(metadata)를 부호화하는 방법에 있어서, 상기 메타데이터의 내부에 상기 미디어 컨텐츠에 대한 정보의 단위 크기를 나타내는 스케일 표시자(scale indicator)를 생성하는 단계와; 상기 생성된 스케일 표시자에 기초하여, 상기 메타데이터에 구비된 데이터 영역이 서로 다른 값을 갖도록 상기 데이터 영역을 결정하는 단계를 포함하는 것을 특징으로 하는 부호화 방법에 의해 해결된다.
상기 스케일 표시자는 상기 데이터 영역에서 표시하는 상기 미디어 컨텐츠에 대한 정보의 최대 범위 또는 상기 정보에 요구되는 정확도에 따라 가변적인 것이 바람직하다.
상기 스케일 표시자는 상기 정보의 최대 범위가 클수록 또는 상기 정보에 요구되는 정확도가 낮을수록 상기 정보의 단위 크기가 증가하도록 변경되는 것이 바람직하다.
상기 메타데이터의 내부에 상기 스케일 표시자 및 상기 데이터 영역의 경계 를 구별하는 필드 구분자(field barrier)를 할당하는 단계를 더 포함하는 것이 바람직하다.
상기 데이터 영역을 결정하는 단계는, 상기 스케일 표시자에 따른 오프셋 값에 의하여 상기 데이터 영역의 값을 서로 다른 값으로 결정하는 것이 바람직하다.
상기 메타데이터는 고정된 길이의 데이터 구조를 갖는 것이 바람직하며, 상기 데이터 영역이 표시하는 상기 정보는 상기 미디어 컨텐츠에 대한 시간 정보인 것이 바람직하다.
상기 데이터 영역이 표시하는 상기 정보가 상기 미디어 컨텐츠에 대한 위치 정보인 경우에, 상기 스케일 표시자가 나타내는 상기 단위 크기에 따라 상기 미디어 컨텐츠를 정렬하는 단계를 더 포함하는 것이 바람직하다.
상기 미디어 컨텐츠를 정렬하는 단계는, 상기 스케일 표시자가 나타내는 상기 단위 크기에 대응하여 더미 데이터(dummy data)를 삽입하는 단계를 더 포함하는 것이 바람직하다.
상기 데이터 영역이 표시하는 상기 정보가 상기 미디어 컨텐츠에 대한 위치 정보인 경우에, 상기 미디어 컨텐츠의 시작 위치를 나타내는 식별 코드(identification code)를 삽입하는 단계를 더 포함하는 것이 바람직하다.
한편, 본 발명의 다른 분야에 따르면 상기 기술적 과제는 미디어 컨텐츠 및 상기 미디어 컨텐츠의 메타데이터를 부호화하는 장치에 있어서, 상기 메타데이터의 내부에 상기 미디어 컨텐츠에 대한 정보의 단위 크기인 스케일 표시자(scale indicator)를 생성하는 스케일 표시자 생성부와; 상기 스케일 표시자 생성부에서 생성된 스케일 표시자에 기초하여, 상기 메타데이터에 구비된 데이터 영역이 서로 다른 값을 갖도록 상기 데이터 영역을 결정하는 데이터 영역 결정부를 포함하는 것을 특징으로 하는 부호화 장치에 의해서도 해결된다.
상기 스케일 표시자 생성부는, 상기 데이터 영역에서 표시하는 상기 미디어 컨텐츠에 대한 정보의 최대 범위 또는 상기 정보에 요구되는 정확도에 따라 가변적으로 스케일 표시자를 생성하는 것이 바람직하다.
상기 스케일 표시자 생성부는, 상기 정보의 최대 범위가 클수록 또는 상기 정보에 요구되는 정확도가 낮을수록 상기 정보의 단위 크기가 증가하는 상기 스케일 표시자를 생성하는 것이 바람직하다.
상기 스케일 표시자 생성부는, 상기 메타데이터의 내부에 상기 스케일 표시자 및 상기 데이터 영역의 경계를 구별하는 필드 구분자(field barrier)를 할당하는 필드 구분자 할당부를 더 포함하는 것이 바람직하다.
상기 데이터 영역 결정부는, 상기 스케일 표시자에 따른 오프셋 값에 의하여 상기 데이터 영역의 값을 서로 다른 값으로 결정하는 것이 바람직하다.
상기 메타데이터는 고정된 길이의 데이터 구조를 갖는 것이 바람직하며, 상기 데이터 영역이 표시하는 상기 정보는 상기 미디어 컨텐츠에 대한 시간 정보인 것이 바람직하다.
상기 데이터 영역이 표시하는 상기 정보가 상기 미디어 컨텐츠에 대한 위치 정보인 경우에, 상기 스케일 표시자가 나타내는 상기 단위 크기에 따라 상기 미디어 컨텐츠를 정렬하는 제1 미디어 컨텐츠 처리부를 더 포함하는 것이 바람직하다.
상기 제1 미디어 컨텐츠를 처리부는, 상기 스케일 표시자가 나타내는 상기 단위 크기에 대응하여 더미 데이터(dummy data)를 삽입하는 것이 바람직하다.
상기 데이터 영역이 표시하는 상기 정보가 상기 미디어 컨텐츠에 대한 위치 정보인 경우에, 상기 미디어 컨텐츠의 시작 위치를 나타내는 식별 코드(identification code)를 삽입하는 제2 미디어 컨텐츠 처리부를 더 포함하는 것이 바람직하다.
나아가 본 발명은, 미디어 컨텐츠에 대한 정보의 단위 크기인 스케일 표시자(scale indicator)를 상기 메타데이터의 내부에 생성하고, 상기 생성된 스케일 표시자에 기초하여, 상기 메타데이터에 구비된 데이터 영역이 서로 다른 값을 갖도록 상기 데이터 영역을 결정하는 부호화 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체를 포함한다.
본 발명에 의한 미디어 컨텐츠 및 메타데이터를 부호화하는 방법과 그 장치에 따르면, 메타데이터 내의 제한된 공간을 가지는 데이터 영역이 표현할 수 있는 범위를 증가시킬 수 있으며, 메타데이터에 대한 최적의 필드 길이의 데이터 공간을 결정할 수 있으므로 메타데이터의 크기를 줄이고 데이터 압출률을 높일 수 있다. 또한 외부 정보에 의하여 메타데이터의 스케일 변경을 알려줄 필요가 없으며, 따라서 메타데이터의 스케일을 동적(dynamic)으로 변경할 수 있다.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 도면에 기재된 내용을 참조하여야 한다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대해 상세히 설명한다.
도 2는 본 발명의 일 실시예에 따른, 미디어 컨텐츠 및 메타데이터를 부호화하는 방법을 설명하기 위한 플로우 차트이다.
최근 미디어 시스템은 미디어 컨텐츠의 특성이 연속적(continuous)인 것에서 불연속적(discontinuous)인 것으로, A/V(audio-visual) 데이터에서 리치 미디어(rich media) 데이터로, 시간정보의 초점이 정확함(accurate)에서 적당함(approximate)으로 변화하고 있다.
따라서, 메타데이터 역시 이러한 미디어 컨텐츠의 특성을 이용하여 보다 높은 압축 효율을 갖도록 설계되어야 한다. 본 발명에서 다루는 메타데이터는 ISO base media file format(ISO/IEC 14496-12)와 같은 미디어 데이터 저장 포맷(미디어 파일 포맷), MPEG-2 시스템(ISO/IEC 13818-1)과 같은 미디어 전송 프레임워크에 적용될 수 있으며, 또한 MPEG-4 시스템(ISO/IEC 14496-1), MPEG-4 LASeR/SAF(ISO/IEC 14496-20)와 같은 미디어 메타데이터 프레임워크에도 적용될 수 있다. 아울러, 상기 미디어 데이터 저장 포맷(미디어 파일 포맷)을 지원하는 미디어 플레이어 프레임워크에도 적용 가능하며, TV, STB, PMP, MP3, 모바일 방송 단말기, 휴대폰과 같은 미디어 처리 단말기에도 적용 가능하다.
도 2를 참조하면, 본 발명의 부호화 방법은 메타 데이터의 내부에 미디어 컨 텐츠에 대한 정보의 단위 크기를 나타내는 스케일 표시자(scale indicator)를 생성하는 단계(210)와 생성된 스케일 표시자에 기초하여, 메타 데이터에 구비된 데이터 영역이 서로 다른 값을 갖도록 상기 데이터 영역을 결정하는 단계(230)를 포함한다. 선택적으로, 상기 부호화 방법은 메타 데이터의 내부에 상기 스케일 표시자 및 데이터 영역의 경계를 구별하는 필드 구분자(field barrier)를 할당하는 단계(220)를 더 포함할 수도 있다.
단계 210에서는, 스케일 표시자를 메타데이터 내부에 생성한다. 스케일 표시자는 현재 메타데이터의 데이터 영역이 표현하는 정보의 스케일(scale)을 정의하는 지시자(indicator)이다. 즉, 상기 데이터 영역에서 표시하는 미디어 컨텐츠에 대한 정보가 어떠한 크기의 단위를 기준으로 정확하게 나타나 있는가를 나타내는 값이다. 별도의 스케일 표시자가 없는 일반적인 메타데이터의 경우에는 스케일이 1x(1배)라고 가정한다.
이러한 스케일 표시자는 데이터 영역에서 표시하는 미디어 컨텐츠에 대한 정보의 최대 범위(max range) 또는 요구되는 정확도(accuracy)에 따라 가변적으로 변화한다. 바이너리(binary) 코딩시에, 고정된 길이의 데이터 구조를 갖는 일반적인 메타데이터에서 표현할 수 있는 정보의 최대 범위는 0 ~ 2n-1 이다. 이들의 스케일은 1x 이다. 그러나, 본 발명에서는 스케일이 가변적으로 변화하므로 표현할 수 있는 정보의 최대 범위도 달라지며, 반대급부적(trade-off)으로 정보의 정확성을 나타내는 해상도(resolution)도 변화한다. 구체적으로, 스케일이 커지면 동일한 비트수로 표현가능한 정보의 범위가 증가하며, 반대로 해상도는 감소한다.
단계 220에서는, 스케일 표시자 및 데이터 영역의 경계를 구별하는 필드 구분자(field barrier)를 할당한다. 본 발명에서 가변적인 스케일 표시자는 메타 데이터 내부에 생성되어 있으므로, 외부 시그널링 없이 자체적으로 스케일 표시자를 추출하기 위해 메타 데이터 내부에 이러한 필드 구분자를 할당한다. 따라서, 스케일 표시자와 데이터 영역이 서로 구별될 수 있으므로, 스케일 표시자를 먼저 판독한 후에 데이터 영역의 값을 해당 스케일에 맞추어 해석함으로써 데이터 영역의 값이 스케일-업(scale-up)되어 표시될 수 있다.
단계 230에서는, 스케일 표시자에 따라 서로 다른 값을 갖는 데이터 영역을 결정한다. 즉, 스케일 표시자에 의하여 데이터 영역의 값이 다르게 해석되므로, 부호화 과정에서는 상기 생성된 스케일 표시자에 따른 스케일에 맞추어 표현하고자하는 데이터 영역의 값을 결정하는 것이다. 이에 대한 구체적인 실시예는 이하 도 4에서 상세히 살펴본다.
도 3은 본 발명의 일 실시예에 따른, 스케일 표시자가 구비된 메타데이터의 데이터 구조를 나타내는 도면이다.
도 3을 참조하면, (a), (b) 및 (c) 그림이 나타나 있는데, 각각의 메타데이터의 데이터 구조는 스케일 표시자, 필드 구분자 및 데이터 영역으로 구성되어 있다. 여기서 필드 구분자는 사전에 정의된 값으로 고정된 길이의 값이나, 스케일 표시자 및 데이터 영역은 다양한 경우를 나타낼 수 있으므로 필드의 길이가 가변적이다. 그러나 메타데이터 전체의 필드 길이는 고정되어 있으므로, 스케일 표시자 및 데이터 영역은 제한된 길이의 영역 내에서 서로 배타적인 영역을 차지한다. 이와 같은 메타데이터의 일 실시예를 살펴보면 아래와 같다.
도 4는 본 발명의 다른 실시예에 따른, 8비트(bits)의 메타데이터에 스케일 표시자를 적용한 경우를 나타내는 도면이다.
도 4를 참조하면, 8비트의 메타데이터에서 스케일 표시자 및 데이터 영역의 값이 어떤 경우로서 다르게 구성될 수 있는지가 나타나 있다.
여기서 스케일은 데이터 영역의 값이 나타내는 정보의 단위의 크기를 뜻한다. 이러한 스케일에 따라 메타데이터의 데이터 영역에서 표현하는 값의 간격이 결정된다. 스텝수(step number)은 스케일에 맞추어 데이터 영역의 값을 해석할 때, 표현되는 모든 이산값(discrete value)의 개수를 나타낸다. 오프셋(offset)은 s1~s9의 각 경우에서 시작값을 의미한다.
예를 들어 s1 ~ s3의 경우를 살펴보면 다음과 같다. 여기서 스케일 표시자는 1의 값을, 필드 구분자는 0의 값을 갖는다고 가정한다.
(s1) : 스케일 표시자에 할당되는 비트가 없다. 즉, 스케일은 1x 이며, 8비트 중 첫 번째 비트는 필드 구분자이다. 나머지 데이터 영역은 모두 7비트이므로, 27 = 128개의 스텝을 갖는다. 오프셋은 128 * 0 = 0으로 설정된다. 따라서 s1의 경우, 데이터 영역은 0 부터 128개의 값을 1x의 간격으로 표현할 수 있다.
(s2) : 첫 번째 비트가 스케일 표시자이다. 즉, 스케일은 2x 이며, 필드 구분자를 제외한 나머지 데이터 영역은 모두 6비트이므로, 26 = 64개의 스텝을 갖는 다. 오프셋은 128 * 1 = 128로 설정된다. 따라서 s2의 경우, 데이터 영역은 128 부터 64개의 값을 2x의 간격으로 표현할 수 있다.
(s3) : 두 번째 비트까지가 스케일 표시자이다. 즉, 스케일은 4x 이며, 필드 구분자를 제외한 나머지 데이터 영역은 모두 5비트이므로, 25 = 32개의 스텝을 갖는다. 오프셋은 128 * 2 = 256으로 설정된다. 따라서 s3의 경우, 데이터 영역은 256 부터 32개의 값을 4x의 간격으로 표현할 수 있다.
나머지 s4 ~ s9의 경우도 위와 같은 방식으로 나타난다.
따라서, 도 4와 같이 8비트의 길이를 갖는 메타데이터는 최대 범위로서 1024까지 표현할 수 있다.
도 5는 상기 도 4를 고정된 스케일을 갖는 8비트 메타데이터와 가시적으로 비교한 도면이다.
도 5를 참조하면, (a) 그림은 8비트의 고정된 스케일을 갖는 메타데이터가 표현할 수 있는 최대 범위 및 해상도를 나타내며, (b) 그림은 상기 도 4의 일 실시예를 적용한 경우의 최대 범위 및 해상도를 나타낸다.
먼저 (a) 그림을 살펴보면, 스케일 표시자를 구비하지 않은 8비트 메타데이터는 스케일 1x로 고정되어 있으므로 0 ~ 256의 범위를 1의 간격으로 표현할 수 있다.
한편 (b) 그림을 살펴보면, 내부에 가변적인 스케일 표시자를 구비한 8비트 메타데이터는 s1에서는 스케일이 1x로서 0 ~ 128의 범위를 1의 간격으로 표현하고, s2에서는 스케일이 2x로서 128 ~ 256의 범위를 2의 간격으로 표현하며, s3에서는 스케일이 4x로서 256 ~ 384의 범위를 4의 간격으로 표현한다. 그리하여 s9 에서는 1024까지 나타낼 수 있다.
따라서 (b) 그림에서 볼 수 있듯이, s1에서 s9로 갈수록 스케일 2배씩 증가하므로 해상도는 1/2배씩 감소하나, 표현할 수 있는 최대 범위의 값이 1024까지 증가하는 이점을 갖는다.
특히, 메타데이터에서 필수적인 미디어 컨텐츠에 대한 시간 정보의 경우에는 물리적인 정확성이 다소 감소하는 경우에도 미디어 컨텐츠의 사용자인 사람의 인지 능력이 이를 감지하지 못하므로, 이와 같은 원리를 이용하여 본 발명과 같이 보다 고효율의 압축률을 갖는 부호화 방법을 고안할 수 있다.
도 6은 상기 도 5의 (a), (b)에 대하여 각각의 최대 범위 및 해상도 사이의 관계를 나타내는 그래프이다.
도 6을 참조하면, 도 5의 (a)와 같은 스케일 표시자를 구비하지 않은 8비트 메타데이터의 그래프(610)와 도 5의 (b)와 같은 가변적인 스케일 표시자를 구비한 8비트 메타데이터의 그래프(620)가 나타나 있다.
s1에서는 도 5의 (a)의 그래프(610)와 (b)의 그래프(620)가 같게 나타난다. 그러나, s2에서는 (b)의 그래프(620)가 더 큰 기울기를 갖는데, 이때 (b)의 그래프(620)의 오프셋은 128sec/90k, 스텝수는 64개이며, 해상도는 45kHz이다. 한편, s3에서는 (b)의 그래프(620)가 보다 큰 기울기를 갖는데, 오프셋은 256sec/90k, 스텝수는 32개이며, 해상도는 45kHz이다. 이러한 방식으로 (b)의 그래프(620)는 최 대 범위인 1024sec/90k까지 도달하며, (a)의 그래프(610)와 비교하여 768sec/90k의 이득(gain)을 갖는다.
도 7은 본 발명의 또 다른 실시예에 따른, 미디어 컨텐츠의 위치 정보를 탐색하는 경우를 설명하기 위한 도면이다.
앞서 예로 든 시간 정보와 달리 메타데이터의 데이터 영역에서 표시하는 정보가 미디어 컨텐츠에 대한 위치 정보 등과 같이 정확성이 요구되는 정보인 경우에, 본 발명은 미디어 컨텐츠를 도 7의 (a) 또는 (b)와 같이 처리하여 부호화한다.
즉, 본 발명과 같이 스케일-업 되어 표시되는 데이터 영역의 값에 의하여 컨텐츠를 탐색하는 경우에도 정확한 위치를 찾아내기 위해 본 발명에서는 다음과 같은 두 가지 경우를 제안한다.
먼저 (a) 그림을 살펴보면, 스케일 표시자가 나타내는 정보의 단위 크기에 따라 미디어 컨텐츠를 정렬(align)하는 과정을 수행한다. (a) 그림에서 미디어 컨텐츠의 스트림에서 비어 있는 영역(710, 730, 750)은 소정의 컨텐츠의 데이터가 저장된 영역이고, X 표시된 영역(720, 740, 760)은 더미 데이터(dummy data)이다. 스케일에 의하여 메타데이터가 표시할 수 있는 단위가 4byte 라고 한다면, a1 위치 이후에는 a2 위치에 접근할 수 밖에 없다. 따라서, 만약 3byte 크기의 컨텐츠 데이터(710)라면, 1byte의 더미 데이터(720)를 추가로 채워넣어(stuffing) 총 4byte를 만들 수 있다. 마찬가지로, 5byte 크기의 컨텐츠 데이터(730)인 경우에는, 3byte의 더미 데이터(740)를 추가로 채워넣어 총 8byte를 만들 수 있다. 이렇게 스케일의 배수가 되도록 미디어 컨텐츠를 정렬하여 부호화한다.
한편 (b) 그림을 살펴보면, 더미 데이터를 사용하지 않고 시작 심볼(start symbol)과 같은 특별한 식별 코드(identification code, 780)를 사용할 수도 있다. 즉, 스케일에 의하여 메타데이터가 표시할 수 있는 단위가 8byte 라고 한다면, b1 위치 다음에는 b2 위치에 접근하게 된다. 따라서, 만약 5byte 크기의 컨텐츠 데이터(770)가 있다면, 이후 1byte의 식별 코드(780)를 삽입하여 다음 컨텐츠 데이터(790)의 시작을 알려줄 수 있다. 따라서, b1 위치에 개략적으로 접근한 이후에 시작 심볼을 나타내는 식별 코드(780)를 탐색함으로써, 정확한 컨텐츠 데이터(790)의 위치를 찾아낼 수 있다.
이러한 방법은 (a) 그림에서 채워넣는 더미 데이터의 크기와 (b) 그림에서 시작 심볼을 나타내는 식별 코드를 탐색하는 복잡도(complexity)에 따라 선택적으로 사용할 수 있다.
도 8은 본 발명의 또 다른 실시예에 따른, 미디어 컨텐츠 및 메타데이터를 부호화하는 장치를 나타내는 기능 블록도이다.
도 8을 참조하면, 부호화 장치(800)는 메타 데이터의 내부에 미디어 컨텐츠에 대한 정보의 단위 크기인 스케일 표시자를 생성하는 스케일 표시자 생성부(810)와 스케일 표시자 생성부(810)에서 생성된 스케일 표시자에 기초하여, 상기 메타 데이터에 구비된 데이터 영역이 서로 다른 값을 갖도록 결정하는 데이터 영역 결정부(820)를 포함한다. 스케일 표시자 생성부(811)는 메타 데이터의 내부에 스케일 표시자 및 데이터 영역의 경계를 구별하는 필드 구분자를 할당하는 필드 구분자 할당부(811)를 더 포함할 수 있다.
만약 데이터 영역이 표시하는 정보가 미디어 컨텐츠에 대한 위치 정보인 경우에, 스케일 표시자가 나타내는 정보의 단위의 크기에 따라 미디어 컨텐츠를 정렬하는 제1 미디어 컨텐츠 처리부(830)를 더 포함할 수 있으며, 제1 미디어 컨텐츠를 처리부(830)는 스케일 표시자가 나타내는 스케일에 대응하여 미디어 컨텐츠 데이터에 더미 데이터를 삽입한다. 이런 경우에 미디어 컨텐츠의 시작 위치를 나타내는 식별 코드를 삽입하는 제2 미디어 컨텐츠 처리부(840)를 더 포함할 수 있으며 부호화 장치(800)는 제1 미디어 컨텐츠 처리부(830) 및 제2 미디어 컨텐츠 처리부(840)를 선택적으로 이용할 수 있다.
한편, 상술한 본 발명의 미디어 컨텐츠 및 메타데이터를 부호화하는 방법은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다.
또한, 상술한바와 같이 본 발명에서 사용된 데이터의 구조는 컴퓨터로 읽을 수 있는 기록매체에 여러 수단을 통하여 기록될 수 있다.
상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장매체를 포함한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본 질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
도 1은 메타데이터 부호화에 필요한 필드 길이, 최대 범위 및 해상도 사이의 관계를 나타내는 그래프이다.
도 2는 본 발명의 일 실시예에 따른, 미디어 컨텐츠 및 메타데이터를 부호화하는 방법을 설명하기 위한 플로우 차트이다.
도 3은 본 발명의 일 실시예에 따른, 스케일 표시자가 구비된 메타데이터의 데이터 구조를 나타내는 도면이다.
도 4는 본 발명의 다른 실시예에 따른, 8비트(bits)의 메타데이터에 스케일 표시자를 적용한 경우를 나타내는 도면이다.
도 5는 상기 도 4를 고정된 스케일을 갖는 8비트 메타데이터와 가시적으로 비교한 도면이다.
도 6은 상기 도 5의 (a), (b)에 대하여 각각의 최대 범위 및 해상도 사이의 관계를 나타내는 그래프이다.
도 7은 본 발명의 또 다른 실시예에 따른, 미디어 컨텐츠의 위치 정보를 탐색하는 경우를 설명하기 위한 도면이다.
도 8은 본 발명의 또 다른 실시예에 따른, 미디어 컨텐츠 및 메타데이터를 부호화하는 장치를 나타내는 기능 블록도이다.
상기 몇 개의 도면에 있어서 대응하는 도면 번호는 대응하는 부분을 가리킨다. 도면이 본 발명의 실시예들을 나타내고 있지만, 도면이 축척에 따라 도시된 것은 아니며 본 발명을 보다 잘 나타내고 설명하기 위해 어떤 특징부는 과장되어 있을 수 있다.

Claims (21)

  1. 미디어 컨텐츠 및 상기 미디어 컨텐츠의 메타데이터(metadata)를 부호화하는 방법에 있어서,
    상기 메타데이터의 내부에 상기 미디어 컨텐츠에 대한 정보의 단위 크기를 나타내는 스케일 표시자(scale indicator)를 생성하는 단계와;
    상기 생성된 스케일 표시자에 기초하여, 상기 메타데이터에 구비된 데이터 영역이 서로 다른 값을 갖도록 상기 데이터 영역을 결정하는 단계를 포함하는 것을 특징으로 하는 부호화 방법.
  2. 제1항에 있어서,
    상기 스케일 표시자는 상기 데이터 영역에서 표시하는 상기 미디어 컨텐츠에 대한 정보의 최대 범위 또는 상기 정보에 요구되는 정확도에 따라 가변적인 것을 특징으로 하는 부호화 방법.
  3. 제2항에 있어서,
    상기 스케일 표시자는 상기 정보의 최대 범위가 클수록 또는 상기 정보에 요구되는 정확도가 낮을수록 상기 정보의 단위 크기가 증가하도록 변경되는 것을 특징으로 하는 부호화 방법.
  4. 제3항에 있어서,
    상기 메타데이터의 내부에 상기 스케일 표시자 및 상기 데이터 영역의 경계를 구별하는 필드 구분자(field barrier)를 할당하는 단계를 더 포함하는 것을 특징으로 하는 부호화 방법.
  5. 제4항에 있어서,
    상기 데이터 영역을 결정하는 단계는,
    상기 스케일 표시자에 따른 오프셋 값에 의하여 상기 데이터 영역의 값을 서로 다른 값으로 결정하는 것을 특징으로 하는 부호화 방법.
  6. 제5항에 있어서,
    상기 메타데이터는 고정된 길이의 데이터 구조를 갖는 것을 특징으로 하는 부호화 방법.
  7. 제6항에 있어서,
    상기 데이터 영역이 표시하는 상기 정보는 상기 미디어 컨텐츠에 대한 시간 정보인 것을 특징으로 하는 부호화 방법.
  8. 제6항에 있어서,
    상기 데이터 영역이 표시하는 상기 정보가 상기 미디어 컨텐츠에 대한 위치 정보인 경우에,
    상기 스케일 표시자가 나타내는 상기 단위 크기에 따라 상기 미디어 컨텐츠를 정렬하는 단계를 더 포함하는 것을 특징으로 하는 부호화 방법.
  9. 제8항에 있어서,
    상기 미디어 컨텐츠를 정렬하는 단계는,
    상기 스케일 표시자가 나타내는 상기 단위 크기에 대응하여 더미 데이터(dummy data)를 삽입하는 단계를 더 포함하는 것을 특징으로 하는 부호화 방법.
  10. 제6항에 있어서,
    상기 데이터 영역이 표시하는 상기 정보가 상기 미디어 컨텐츠에 대한 위치 정보인 경우에,
    상기 미디어 컨텐츠의 시작 위치를 나타내는 식별 코드(identification code)를 삽입하는 단계를 더 포함하는 것을 특징으로 하는 부호화 방법.
  11. 미디어 컨텐츠 및 상기 미디어 컨텐츠의 메타데이터를 부호화하는 장치에 있어서,
    상기 메타데이터의 내부에 상기 미디어 컨텐츠에 대한 정보의 단위 크기인 스케일 표시자(scale indicator)를 생성하는 스케일 표시자 생성부와;
    상기 스케일 표시자 생성부에서 생성된 스케일 표시자에 기초하여, 상기 메 타데이터에 구비된 데이터 영역이 서로 다른 값을 갖도록 상기 데이터 영역을 결정하는 데이터 영역 결정부를 포함하는 것을 특징으로 하는 부호화 장치.
  12. 제11항에 있어서,
    상기 스케일 표시자 생성부는,
    상기 데이터 영역에서 표시하는 상기 미디어 컨텐츠에 대한 정보의 최대 범위 또는 상기 정보에 요구되는 정확도에 따라 가변적으로 스케일 표시자를 생성하는 것을 특징으로 하는 부호화 장치.
  13. 제12항에 있어서,
    상기 스케일 표시자 생성부는,
    상기 정보의 최대 범위가 클수록 또는 상기 정보에 요구되는 정확도가 낮을수록 상기 정보의 단위 크기가 증가하는 상기 스케일 표시자를 생성하는 것을 특징으로 하는 부호화 장치.
  14. 제13항에 있어서,
    상기 스케일 표시자 생성부는,
    상기 메타데이터의 내부에 상기 스케일 표시자 및 상기 데이터 영역의 경계를 구별하는 필드 구분자(field barrier)를 할당하는 필드 구분자 할당부를 더 포함하는 것을 특징으로 하는 부호화 장치.
  15. 제14항에 있어서,
    상기 데이터 영역 결정부는,
    상기 스케일 표시자에 따른 오프셋 값에 의하여 상기 데이터 영역의 값을 서로 다른 값으로 결정하는 것을 특징으로 하는 부호화 장치.
  16. 제15항에 있어서,
    상기 메타데이터는 고정된 길이의 데이터 구조를 갖는 것을 특징으로 하는 부호화 장치.
  17. 제16항에 있어서,
    상기 데이터 영역이 표시하는 상기 정보는 상기 미디어 컨텐츠에 대한 시간 정보인 것을 특징으로 하는 부호화 장치.
  18. 제16항에 있어서,
    상기 데이터 영역이 표시하는 상기 정보가 상기 미디어 컨텐츠에 대한 위치 정보인 경우에,
    상기 스케일 표시자가 나타내는 상기 단위 크기에 따라 상기 미디어 컨텐츠를 정렬하는 제1 미디어 컨텐츠 처리부를 더 포함하는 것을 특징으로 하는 부호화 장치.
  19. 제18항에 있어서,
    상기 제1 미디어 컨텐츠를 처리부는,
    상기 스케일 표시자가 나타내는 상기 단위 크기에 대응하여 더미 데이터(dummy data)를 삽입하는 것을 특징으로 하는 부호화 장치.
  20. 제16항에 있어서,
    상기 데이터 영역이 표시하는 상기 정보가 상기 미디어 컨텐츠에 대한 위치 정보인 경우에,
    상기 미디어 컨텐츠의 시작 위치를 나타내는 식별 코드(identification code)를 삽입하는 제2 미디어 컨텐츠 처리부를 더 포함하는 것을 특징으로 하는 부호화 장치.
  21. 미디어 컨텐츠에 대한 정보의 단위 크기인 스케일 표시자(scale indicator)를 메타데이터의 내부에 생성하고, 상기 생성된 스케일 표시자에 기초하여, 상기 메타데이터에 구비된 데이터 영역이 서로 다른 값을 갖도록 상기 데이터 영역을 결정하는 부호화 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체.
KR1020070104031A 2007-10-16 2007-10-16 미디어 컨텐츠 및 메타데이터를 부호화하는 방법과 그 장치 KR101394154B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020070104031A KR101394154B1 (ko) 2007-10-16 2007-10-16 미디어 컨텐츠 및 메타데이터를 부호화하는 방법과 그 장치
EP08778499.7A EP2201769A4 (en) 2007-10-16 2008-06-30 METHOD AND APPARATUS FOR ENCODING MEDIA CONTENT AND METADATA THEREOF
CN2008801118183A CN101868976B (zh) 2007-10-16 2008-06-30 对媒体内容及其元数据编码的方法和设备
PCT/KR2008/003835 WO2009051327A1 (en) 2007-10-16 2008-06-30 Method and apparatus for encoding media content and metadata thereof
JP2010529843A JP5421273B2 (ja) 2007-10-16 2008-06-30 メディア・コンテンツ及びメタデータを符号化する方法及びその装置
US12/170,917 US8660999B2 (en) 2007-10-16 2008-07-10 Method and apparatus for encoding media content and metadata thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070104031A KR101394154B1 (ko) 2007-10-16 2007-10-16 미디어 컨텐츠 및 메타데이터를 부호화하는 방법과 그 장치

Publications (2)

Publication Number Publication Date
KR20090038639A KR20090038639A (ko) 2009-04-21
KR101394154B1 true KR101394154B1 (ko) 2014-05-14

Family

ID=40535232

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070104031A KR101394154B1 (ko) 2007-10-16 2007-10-16 미디어 컨텐츠 및 메타데이터를 부호화하는 방법과 그 장치

Country Status (6)

Country Link
US (1) US8660999B2 (ko)
EP (1) EP2201769A4 (ko)
JP (1) JP5421273B2 (ko)
KR (1) KR101394154B1 (ko)
CN (1) CN101868976B (ko)
WO (1) WO2009051327A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015150480A1 (en) 2014-04-02 2015-10-08 Dolby International Ab Exploiting metadata redundancy in immersive audio metadata
KR102393158B1 (ko) 2015-10-13 2022-05-02 삼성전자주식회사 메타데이터를 포함하는 비트 스트림을 이용한 서비스 제공 방법 및 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1453000A2 (en) * 1999-02-05 2004-09-01 Samsung Electronics Co., Ltd. Image texture retrieving method and apparatus thereof
KR20050006565A (ko) * 2003-07-09 2005-01-17 주식회사 픽스트리 멀티미디어 데이터의 관리 및 편집을 위한 시스템 및 방법
US20050234731A1 (en) 2004-04-14 2005-10-20 Microsoft Corporation Digital media universal elementary stream

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5623424A (en) * 1995-05-08 1997-04-22 Kabushiki Kaisha Toshiba Rate-controlled digital video editing method and system which controls bit allocation of a video encoder by varying quantization levels
US7613727B2 (en) 2002-02-25 2009-11-03 Sont Corporation Method and apparatus for supporting advanced coding formats in media files
DE10392598T5 (de) * 2002-04-29 2005-05-19 Sony Electronics Inc. Unterstützung von fortschrittlichen Codierungsformaten in Mediendateien
AU2003267699A1 (en) * 2002-10-15 2004-05-04 Koninklijke Philips Electronics N.V. System and method for transmitting scalable coded video over an ip network
EP1665800A1 (en) * 2003-09-12 2006-06-07 Koninklijke Philips Electronics N.V. Method and apparatus for scalable signal processing
JP4359120B2 (ja) * 2003-10-31 2009-11-04 財団法人エヌエイチケイエンジニアリングサービス コンテンツ品質評価装置及びそのプログラム
DE102004045849B4 (de) * 2004-09-20 2014-06-05 Anton Rodi Messgeber mit Absolut-Signalverarbeitung und Inkremental-Signalausgabe
CA2584765A1 (en) * 2004-10-21 2006-05-04 Sony Electonics Inc. Supporting fidelity range extensions in advanced video codec file format
US20060140268A1 (en) * 2004-12-29 2006-06-29 Samsung Electronics Co., Ltd. Method and apparatus for reduction of compression noise in compressed video images
US20090161762A1 (en) 2005-11-15 2009-06-25 Dong-San Jun Method of scalable video coding for varying spatial scalability of bitstream in real time and a codec using the same

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1453000A2 (en) * 1999-02-05 2004-09-01 Samsung Electronics Co., Ltd. Image texture retrieving method and apparatus thereof
EP1453000A3 (en) 1999-02-05 2004-10-20 Samsung Electronics Co., Ltd. Image texture retrieving method and apparatus thereof
KR20050006565A (ko) * 2003-07-09 2005-01-17 주식회사 픽스트리 멀티미디어 데이터의 관리 및 편집을 위한 시스템 및 방법
US20050234731A1 (en) 2004-04-14 2005-10-20 Microsoft Corporation Digital media universal elementary stream

Also Published As

Publication number Publication date
EP2201769A4 (en) 2015-04-29
JP5421273B2 (ja) 2014-02-19
JP2011501553A (ja) 2011-01-06
US8660999B2 (en) 2014-02-25
CN101868976A (zh) 2010-10-20
WO2009051327A1 (en) 2009-04-23
EP2201769A1 (en) 2010-06-30
CN101868976B (zh) 2013-11-20
KR20090038639A (ko) 2009-04-21
US20090100083A1 (en) 2009-04-16

Similar Documents

Publication Publication Date Title
US7772998B2 (en) Method and apparatus for encoding/decoding metadata
CN101164335B (zh) 流数据记录装置、流数据编辑装置、流数据再现装置、流数据记录方法、以及流数据再现方法
CN107872422B (zh) 一种数据传输方法、装置及电子设备
CN1764974B (zh) 存储多媒体数据的存储介质和再现多媒体数据的方法和设备
US20050169303A1 (en) Multiplex scheme conversion apparatus
KR100788685B1 (ko) 데이터 스트림 포맷의 변환 방법 및 장치, 이를 이용한데이터 스트림 기록 방법 및 장치
CN101505417B (zh) 时戳附加装置、时戳附加方法
EP1980958A2 (en) Apparatus and method for generating a data file or for reading a data file
US20100135646A1 (en) Storage/playback method and apparatus for mpeg-2 transport stream based on iso base media file format
JP2005129217A5 (ko)
KR102505973B1 (ko) 영상 처리 장치, 이의 제어 방법 및 컴퓨터 프로그램이 기록된 기록 매체
KR101854469B1 (ko) 오디오 컨텐츠의 비트레이트 판단장치 및 방법
CN103165151A (zh) 多媒体文件播放方法和装置
KR101394154B1 (ko) 미디어 컨텐츠 및 메타데이터를 부호화하는 방법과 그 장치
KR102344751B1 (ko) 정보 처리 장치, 정보 기록 매체 및 정보 처리 방법, 그리고 프로그램
CN114007112A (zh) 一种针对MP4视频文件中mdat box数据错误的修复方法
US10535369B2 (en) Information processing device, information generation device, information recording medium, information processing method, and program
JP2005157388A (ja) 圧縮されたオーディオビットストリームでシンクワードを探す方法及び回路、並びに前記方法を記録した記録媒体
JP2004282703A (ja) データ処理装置
JP2016096411A (ja) 特徴量生成装置、特徴量生成方法、特徴量生成プログラム及び改竄検出システム
EP1903572A2 (en) Method and system for fast format transformation
CN108538322B (zh) 影音档案处理方法及建置方法
US20240107129A1 (en) Method and apparatus for encapsulating image data in a file for progressive rendering
KR101060490B1 (ko) 가변 비트레이트의 파일의 평균 비트레이트 계산 방법 및 장치, 및 상기 장치를 포함하는 오디오 장치
JP3889338B2 (ja) データ記録方法、データ記録装置、データ変換方法、データ変換装置、データ記録媒体、データ記録のためのプログラムおよびそのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20171227

Year of fee payment: 4

R401 Registration of restoration
FPAY Annual fee payment

Payment date: 20180504

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee