본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. "및/또는" 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부한 도면들을 참조하여 본 발명에 따른 통합 코덱 방법 및 장치의 바람직한 실시예를 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어 도면 부호에 상관없이 동일하거나 대응하는 구성 요소에 대한 중복되는 설명은 생략할 수 있다.
도 1은 일반적인 복호화기의 구성을 개략적으로 나타낸 도면이고, 도 2는 일반적인 부호화기의 구성을 개략적으로 나타낸 도면이다.
도 1에 도시된 바와 같이, 일반적으로 MPEG-4 복호화기(100)는 가변장 디코딩부(Variable Length Decoding, 110), 역 스캔부(Inverse Scan, 115), 역 DC/AC 예측부(Inverse DC/AC Prediction, 120), 역 양자화부(Inverse Quantization, 125), 역 DCT부(Inverse Discrete Cosine Transform, 역 이산 여현 변환부, 130), 동영상 복원부(VOP Reconstruction, 135)를 포함한다. 복호화기(100)의 구성은 적용되는 표준에 따라 상이할 수 있음은 자명하며, 또한 일부 구성요소는 타 구성요소로 대체될 수도 있을 것이다.
전달된 비트스트림(105)이 syntax 파싱(parsing)되어 헤더 정보 및 인코딩된 비디오 데이터(encoded video data)가 추출되면, 가변장 디코딩부(110)는 미리 저장된 허프만 테이블(Huffman Table)을 이용하여 양자화된 DCT 계수를 만들고, 역 스캔부(115)는 역 스캔을 수행하여 동영상(140)과 동일한 순서의 데이터를 생성한다. 즉, 역 스캔부(115)는 인코딩시 여러 가지 방법으로 스캔된 순서의 역으로, 값을 출력한다. 인코딩 시 양자화(Quantization)를 수행한 후, 주파수 대역 값의 분포에 따라 스캔 방향이 정의될 수 있다. 일반적으로는 지그-재그(zig-zag) 스캔 방식이 사용되나, 스캔 방식은 코덱별로 다양할 수 있다.
Syntax 파싱은 가변장 디코딩부(110)에서 통합적으로 수행되거나, 가변장 디코딩부(110)에 선행하여 비트스트림(105)을 처리하는 임의의 구성 요소에서 수행될 수 있다. 이 경우, Syntax 파싱은 부호화기와 복호화기간에 적용되는 표준이 동일하므로 해당 표준에 상응하도록 미리 지정된 기준에 의해서만 처리된다.
역 DC/AC 예측부(120)는 주파수 대역에서 DCT 계수의 크기를 이용하여 예측을 위한 참조 블록의 방향성을 결정한다.
역 양자화부(125)는 역 스캔된 데이터를 역 양자화한다. 즉, 인코딩시 지정된 양자화값(QP, Quantization Parameter)을 이용하여 DC와 AC 계수를 환원한다.
역 DCT부(130)는 역 이산 여현 변환(Inverse Discrete Cosine Transform)을 수행함으로써 실제의 동영상 픽셀 값을 구하여 VOP(Video Object Plane)를 생성한다.
동영상 복원부(135)는 역 DCT부(130)에 의해 생성된 VOP를 이용하여 동영상 신호를 복원하여 출력한다.
도 2에 도시된 바와 같이, 일반적으로 MPEG-4 부호화기(200)는 DCT부(210), 양자화부(215), DC/AC 예측부(220), 스캔부(230), 가변장 인코딩부(235)를 포함한다.
부호화기(200)에 포함된 각 구성요소는 각각 대응되는 복호화기(100)의 구성 요소의 역 기능을 수행하며, 이는 당업자에게 자명하다. 간단히 설명하면, 부호화기(200)는 동영상 신호(즉, 디지털 영상 픽셀 값)를 이산 여현 변환(Discrete Cosine Transform), 양자화(Quantization) 등을 통해 주파수 값으로 변환하여 부호화를 수행한 후, 이를 정보의 빈도 수에 따라 비트 길이를 차별화하는 가변장 인코딩을 수행하여 압축된 비트스트림 상태로 출력한다.
도 3은 본 발명의 일 실시예에 따른 부호화기의 블록 구성도이다.
본 발명에 따른 부호화기는 앞서 도 2를 참조하여 설명한 종래의 부호화기(200)에 비해 확장 비트스트림 생성 및 출력부(2410)를 더 포함한다. 확장 비트스트림 생성 및 출력부(2410)는 전단까지의 처리에 의해 생성된 종래 비트스트림(316) 생성 과정에서의 제어 정보(예를 들어, 부호화된 데이터를 복호하는데 필요한 기능부들의 목록 및 연결 관계, 해당 기능부들의 입력 데이터, 신택스 정보, 신택스 연결 정보 등)를 이용하여 디코더 디스크립션을 생성한다. 또한, 생성된 디코더 디스크립션(313) 및 종래 비트스트림(316)를 이용하여 확장 비트스트림(305)을 생성하여 복호화기(300)로 전송한다. 여기서, 기능부란 단위 복호화를 수행하는 구성이다. 즉, 기능부들이 서로 유기적으로 결합됨으로써 디코더를 형성할 수 있다. 예를 들어, 도 1의 복호화 장치를 구성하는 각 구성들 각각이 하나의 기능부가 될 수 있다.
부호화기는 상기 부호화된 데이터를 복호할 수 있는 디코더를 구성하는 기능부들을 저장하는 툴박스(미도시)를 구비할 수 있다.
또한, 본 명세서에서 가변장 인코딩부(235)는 부호화기 내에서 종래 비트스트림(316)을 생성하기 위하여 최종적으로 부호화를 수행하는 임의의 구성 요소(예를 들어, 부호화부)를 지칭한 것일 뿐 이에 제한되는 것은 아니며, 또한 이로 인해 본 발명의 권리범위가 제한되지는 않는다.
도 3은 디코더 디스크립션 정보 및 종래 비트스트림을 이용하여 생성한 확장 비트스트림이 복호화기로 제공되는 경우를 가정한 도면이다.
하지만, 디코더 디스크립션은 별도의 데이터 또는 비트스트림 등의 형태로 복호화기(300)로 전달될 수도 있다. 이 경우는 가변장 인코딩부(235) 후단에 인코딩된 디코더 디스크립션 생성 및 출력부(도시되지 않음)가 위치하여, 종래의 인코딩부와 독립적으로 생성한 인코딩된 디코더 디스크립션을 복호화기(300)로 제공할 수도 있음은 자명하다.
한편, 상기 디코더 디스크립션은 해당 기능부들의 기능부 식별 정보(FUID)를 포함한다. 상기 기능부 식별 정보(FUID)는 툴박스 유닛 내에서 해당 기능부가 속하는 툴박스를 나타내는 툴박스 넘버(TBN) 필드 및 해당 기능부의 고유 식별 정보를 나타내는 FU 넘버(FU Number) 필드를 포함하여 구성된다.
상기 기능부 식별 정보 및 툴박스 유닛에 대하여는 관련 도면(도 19 내지 도 21) 및 관련 표(표 5)를 참조하여 후술하기로 한다.
<XML 기반 디코더 디스크립션>
도 4는 본 발명에 따른 복호화기의 일실시예 블록 구성도이고, 도 5는 도4의 복호화부에서 비트스트림 처리 과정의 일실시예를 구체적으로 나타낸 도면이다.
도 4에 예시된 디코더 디스크립션 및 영상 비트스트림은 예를 들어 부호화기에 의해 생성되어 제공되는 정보일 수 있다.
도 4을 참조하면, 복호화기(300)는 복호화부(305) 및 분리부(310)을 포함한다. 복호화부(305)는 BSDL 파서(320), 디코더 형성부(330), 툴박스(335) 및 디코딩 솔루션(340)을 포함한다.
BSDL 파서(320)는 분리부(310)로부터 입력된 BSDL 스키마(schema)를 이용하여 외부로부터 입력된 영상 비트스트림의 구문정보를 해석한다. BSDL 파서(320)로 입력되는 영상 비트스트림은 임의의 부호화 방식(예를 들어, MPEG-4, AVS 등)에 의해 부호화된 데이터이다. 본 명세서를 통해 BSDL 파서(320)가 자체적으로 BSDL Schema를 해석할 수 있거나, 또는 외부 알고리즘에 의해 구성될 수 있음을 당업자는 쉽게 이해할 수 있을 것이다.
BSDL 파서(320)는 XML 문법으로 기술된 BSDL 스키마를 읽어들여 BSDL 파서(320)의 구조를 재정의하기 위한 내부 처리부인 BSDL 해석 처리부를 포함한다.
BSDL 스키마를 이용해 재정의하는 규칙은 제작자가 적용하는 방법에 따라 다양할 수 있으므로, 그 기본적인 목적만을 제시하면 다음과 같다. 첫째, BSDL 스키마 상에 기록되어 있는 비트스트림의 길이 및 의미에 대한 정보를 인식할 수 있도록 하기 위한 것이다. 둘째, BSDL 스키마 상에 정의된 반복 구조 및 조건적 실행 구조를 읽어 들여 같은 반복 또는 조건문에 의해 실제 동작하는 프로그램적인 루틴을 구현하기 위한 것이다. 따라서, 재정의되기 이전의 BSDL 파서(320)는 위와 같은 목적을 달성하기 위한 기능들만이 구현된 상태라고 정의할 수도 있을 것이며, 상술한 파싱 기능을 활용해 실제로 구동하는 BSDL 파서(320)를 구현하는 과정을 재정의 하는 과정이라 할 수 있다.
BSDL 파서(320)는 BSDL 해석 처리부의 제어에 의해 유동적인 데이터 흐름을 구성할 수 있는 프로그램으로 구현되며, 예를 들어, CAL(Caltrop Actor Language), C, C++, Java 등 프로그램 언어를 이용하여 구현될 수 있다.
BSDL 내부 처리부(2525) 및 BSDL 파서(320)는 디코더 설계자의 설계 기준에 따라 제한없이 구현될 수 있다. 물론, BSDL 레퍼런스 소프트웨어와 같이 기존에 제시되어 있는 BSDL 운용 프로그램을 응용할 수도 있을 것이다. BSDL 레퍼런스 소프트웨어는 MPEG 표준화 단체에 의해 표준화된 BSDL의 원활한 운용을 위하여 제작된 공식 소프트웨어로서, BSDL 스키마를 입력받는 BSDL 파서(320) 역시 이러한 소프트웨어 자원을 이용하여 보다 용이하게 구현될 수 있음은 자명하다.
본 명세서에서 언급되는 바와 같이, BSDL 파서(320)의 기본적인 구조는 디코더 설계자가 선택한 다양한 방법에 의해 설계될 수 있다. 즉, 디코더 설계자는 BSDL 파서(320)의 지정된 기능을 수행하도록 하기 위한 상세한 알고리즘의 적용 및 설계를 자율적으로 선택할 수 있다. 다만, BSDL 파서(320)는 BSDL 스키마를 읽어들인 결과에 의해 재정의될 수 있으며, 재정의된 결과물이 복호화부(305)의 다른 구성 요소들과 협업(예를 들어, 통신 등)될 수 있어야 한다.
BSDL 파서(320)가 입력받는 BSDL 스키마에는 비트스트림에 포함된 구문 정보들에 대한 상세한 내역이 기술되며, 이 내역에는 예를 들어 구문 정보의 길이, 구문 정보의 의미, 구문 정보의 출현 조건 및 반복 출현 횟수 등이 포함될 수 있다. 여기서, 정보의 길이는 비트스트림 상에서 특정 정보가 차지하는 비트 길이를 의미하며, 구문 정보의 의미는 해당 정보가 어떤 의미를 가지는 정보인지를 나타낸다. 예를 들어, 임의의 기능부에서 A라는 정보를 요청하고 있을 경우 어느 것이 정보 A인지를 구별하는 데 필요할 수 있기 때문이다. 또한, 출현 조건이나 반복 출현 횟수의 경우, 하나의 BSDL 스키마를 이용해 동일한 규격의 동영상 비트스트림을 처리할 경우에도 비트스트림의 속성에 따라 일부 구문 정보의 출현 여부나 반복 횟수 등이 달라질 수 있으므로 이러한 경우를 정의하기 위해 BSDL 스키마에 첨부될 수 있는 정보이다. 예를 들어, 출현 조건은 인트라 프레임을 처리할 때는 모션 벡터 정보를 읽어들이지 않도록 하는 데에 필요할 수 있고, 반복 출현 횟수는 해당 매크로블록이 동일한 구조의 블록을 6개 지닌다고 할 경우 해당 블록을 반복시키는 데 사용될 수 있다.
도 5에 예시된 바와 같이, BSDL 해석 처리부는 상세한 내역에 관하여 해독한 결과 정보를 BSDL 파서(320)에 전달하여 BSDL 파서(320)가 BSDL 스키마에 지정된 순서에 따라 비트스트림에 포함된 정보를 읽어들이도록 지원한다.
BSDL 파서(320)는 BSDL 해석 처리부로부터 제공된 결과 정보를 참조하여 입력된 비트스트림의 내용을 의미 있는 데이터로 바꾸어 디코더 형성부(330) 및/또는 디코딩 솔루션(340)에 제공한다. 또한, BSDL 파서(320)가 디코더 형성부 또는/및 디코딩 솔루션(340)으로 제공하는 의미있는 데이터들로는 예를 들어, 미리 지정된 매크로블록 사이즈의 인코딩된 영상 데이터, 인트라 코딩된 매크로블록들에 대한 AC 예측 플래그(ACpred_flag), MCBPC(MB type & coded block pattern for chrominance), CBPY (coded block pattern for luminance) 등이 포함될 수 있다. 이러한 데이터 제공 과정은 디코더 형성부(330)나 디코딩 솔루션(340)의 구동 여부와 무관하게 진행될 수도 있다.
본 실시예는 디코더(복호화기)가 디코더 디스크립션을 이용하여 비트스트림을 디코딩하되, 디코더 디스크립션이 BSDL 언어 체계 및 이와 연동 가능한 XML 기반 서식을 사용하는 구조로 구현되도록 하기 위한 것이다. 본 실시예를 통해 디코더 디스크립션이 BSDL, CALML 등의 XML 서식을 가질 수 있고, BSDL 스키마는 Syntax Parsing 과정에, CALML은 기능부간의 연결 제어를 위해 사용되도록 그 역할이 구분될 수 있음을 당업자는 쉽게 이해할 수 있을 것이다.
BSDL 언어는 비트스트림의 구조와 구성 방식에 대한 정보를 포함한 XML 문서 또는 XML 스키마 형태로 기술된다. 이 언어는 각각이 하나 이상의 영상 비트스트림 구조를 표현할 수 있도록 제작된다. BSDL 언어를 사용함으로서, 디코더는 종래의 MPEG 표준에서 검증되어 사용되고 있는 비트스트림 기술 방식을 그대로 적용할지라도, 타 기술들과 높은 호환성을 획득할 수 있게 된다. BSDL에 관련된 언어 서식 및 문법은 MPEG-B Part 5에 기술되어 있으므로 이에 대한 상세한 설명은 생략한다.
BSDL과 XML을 이용한 BSDL 스키마와 연결 제어 정보의 구성예를 나타내면 아래와 같다. 물론, BSDL 스키마와 연결 제어 정보의 구성 형식이 이에 제한되지 않음은 자명하다.
BSDL 스키마
<xsd:element name="VideoObject">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="VOStartCode"
type="m4v:StartCodeType"/>
<xsd:element name="VOL">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="header" type="VOLHeaderType"
bs2:ifNext="&volSC;" rvc:port="0"/>
<xsd:element name="VOP"
type="VideoObjectPlaneType"
maxOccurs="unbounded"
bs2:ifNext="&vopSC;" rvc:port="1"/>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
연결 제어 정보
<Network name="Decoder">
<Package>
<QID>
<ID id="MPEG4 Simple Profile" />
</QID>
</Package>
<Port kind="Input" name="BITSTREAM" />
<Port kind="Ouput" name="YUV" />
<Instance id="1">
<Class name="Parser">
<QID>
<ID id="c" />
</QID>
</Class>
<Note kind="label" name="Stream Parser" />
</Instance>
<Instance id="2">
<Class name="VS">
<QID>
<ID id="c" />
</QID>
<Note kind="label" name="Video Session" />
</Class>
</Instance>
<Connection src="" src-port="BITSTREAM" dst="1" dst-port="BITSTREAM" />
<Connection src="1" src-port="CSCI" dst="2" dst-port="CSCI" />
<Connection src="1" src-port="DATA" dst="2" dst-port="DATA" />
<Connection src="2" src-port="YUV" dst="" dst-port="YUV" />
</Network>
본 실시예에서는 디코더 디스크립션(2560), 인코딩된 비디오 데이터(2580) 등의 정보가 외부로부터 입력되는 경우를 가정하여 설명하나, 그 중 하나 이상의 정보가 복호화부(305)의 임의의 구성 요소 내에 이미 내장되어 구현될 수도 있음은 자명하다.
다시 도 4을 참조하면, 디코더 형성부(330)는 분리부(310)로부터 입력받은 연결 제어 정보 또는/및 BSDL 파서(320)로부터 입력받은 비트스트림 데이터의 일부(예를 들어, 미리 지정된 매크로블록 사이즈의 인코딩된 영상 데이터, 인트라 코딩된 매크로블록들에 대한 AC 예측 플래그(ACpred_flag), MCBPC(MB type & coded block pattern for chrominance), CBPY (coded block pattern for luminance) 등 중 하나 이상)을 이용하여 디코딩 솔루션(340)이 구현되도록 제어한다.
즉, 디코더 형성부(330)는 연결 제어 정보 등을 이용하여 툴박스(335)에 구비된 기능부들 중 일부 또는 전체가 유기적인 연결 관계로서 디코딩 솔루션(340) 내에 로드되어 정렬되도록 제어한다. 여기서, 연결 제어 정보는 CALML(CAL Markup Language)로 작성될 수 있다. CALML이란 MPEG 표준화 단체에서 현재 논의중인 CAL언어(Caltrop Markup Language) 방식의 디코더 구성을 기술할 수 있는 XML 포맷이다. CAL언어는 프로그램 객체인 Actor와 각 Actor간의 연결 관계로 구성되는데, 이러한 CAL언어의 구조를 XML 서식에 의해 표현한 것이다. 이에 대한 표현 예는 앞서 BSDL 스키마와 연결 제어 정보의 표현 예로서 이미 제시하였다.
구체적으로, 디코더 형성부(330)는 여러 기능부의 집합으로 구성된 툴박스(335)에 접근할 권한을 가지며, 툴박스(335)에 구비된 기능부들간에 입, 출력 연결을 설정하여 그 결과물에 해당하는 디코딩 솔루션(340)을 구성한다. 이 때 기능부들간 입/출력 연결 구조 및 실행 순서는 연결 제어 정보를 참고하여 설정된다. 또한, 입력된 비트스트림의 종류를 구별하기 위한 일부 정보를 BSDL 파서(320)로부터는 전달받아, 기능부 연결 과정에서 참조할 수 있다. 기능부들간의 연결 구조가 모두 확정되면, 그 연결 구조는 외부로부터의 지속적인 데이터 입력이 전제될 경우 해당 디코더 디스크립션 제작자가 의도한 모든 종류의 영상 비트스트림을 해석, 디코딩 할 수 있는 독립적인 디코더로 간주할 수 있다. 이 때 이 완결된 기능부 연결 구조를 디코딩 솔루션(340)이라 명명할 수 있다.
툴박스(335)는 미리 지정된 프로세스를 수행하도록 각각 구현된 복수의 기능부들을 포함한다. 각각의 기능부들은 각각 프로그램 코드들의 조합으로 구현될 수도 있다.
툴박스(335)에 포함되는 각 기능부들은 적용되는 용도별 집합으로 구분된 복수의 세부 툴박스로 세분화될 수도 있다. 예를 들어, MPEG용 기능부들이 포함되는 제1 툴박스, MPEG용 기능부들 이외의 기능부들이 포함되는 제2 툴박스 등으로 세분화될 수 있다. 또는 MPEG-2용 기능부들의 집합인 제1 툴박스, MPEG-4용 기능부들의 집합인 제2 툴박스, 중국의 디지털 TV 압축 표준인 AVS용 기능부들의 집합인 제3 툴박스 등으로 세분화될 수 있다.
물론, 툴박스(335) 자체가 복수로 구현되어 디코더 형성부(330) 및 디코딩 솔루션(340)과 독립된 연결 관계를 가질 수도 있다. 이 경우, 도시되지는 않았으나 상술한 제1 툴박스, 제2 툴박스 등이 독립된 형식의 툴박스로 구현될 수 있을 것이다.
다만, 이하에서는 설명의 편의를 위해 하나의 툴박스(335) 내에 복수의 세부 툴박스들이 포함되거나 모든 기능부들이 집합체 구성없이 산재되어 포함되는 경우를 중심으로 설명하기로 한다.
툴박스(335)는 각각의 기능(즉, 미리 설정된 프로세스)을 수행하도록 구현된 기능부(FU, Functional Unit)들이 포함되는 영역으로, 각 기능부들은 디코더 형성부(330)의 연결 제어에 의해 디코딩 솔루션(340)에 로드(load)되어 순차적인 연결 동작 관계를 형성함으로써 영상 비트스트림(380)에 포함된 인코딩된 영상 데이터를 디코딩된 영상 데이터로 출력한다.
툴박스(335) 내에는 예를 들어, DF(De-blocking Filter) 기능부, VR(VOP Reconstructor) 기능부, FFR(Frame Field Reordering) 기능부, IPR(Intra prediction and Picture Reconstruction) 기능부, IT(Inverse Transform) 기능부, IQ(Inverse Quantization) 기능부, IAP(Inverse AC Prediction) 기능부, IS(Inverse Scan) 기능부, DCR(DC Reconstruction) 기능부 등의 기능부가 포함될 수 있다.
IT4x4 기능부, IQ4x4 기능부) 및 DCR4x4 기능부는 처리하는 블록 사이즈가 4x4인 것을 특징으로 한다. 이는 MPEG-1/2/4의 경우에는 Transform, Quantization, Prediction 시에 8x8 블록 사이즈로 데이터를 처리함에 비해, MPEG-4 AVC는 4x4 블록 사이즈로 데이터를 처리하는 경우가 존재하기 때문이다.
툴박스(335)에는 데이터 디코딩 기능을 수행하기 위한 기능부라면 적용되는 표준에 관계없이 모두 포함될 수 있을 뿐 아니라 기술 발전과정에서 필요한 기능부는 추가될 수 있고, 기존 기능부의 수정도 가능하며, 불필요한 기능부는 제거될 수 있음은 자명하다. 예를 들어, 복호화 처리를 위해 4x4 블록 사이즈로 데이터를 처리하는 IS4x4 기능부 등이 추가로 필요한 경우 해당 기능부들이 툴박스(335)에 추가될 수 있다. 또한, MPEG-4 AVC에서 인트라 예측(Intra Prediction) 수행을 위한 SPR(Special Prediction) 기능부 등이 더 추가될 수도 있을 것이다.
툴박스(335) 내에 구비된 각 기능부는 각 표준에 독립적으로 존재하지 않고, 표준에 관계없이 동일한 처리가 가능한 기능부의 경우에는 하나의 기능부로 통합되어 구비될 수도 있음은 자명하다. 각 기능부의 기능은 당업자에게 자명한 사항이므로 간략히 설명하기로 한다.
DF 기능부는 MPEG-4 AVC의 디-블록킹 필터(de-blocking filter)이고, VR 기능부는 복원된 픽셀값을 저장하는 기능부이다.
FFR 기능부는 interlaced 모드를 위한 기능부이고, IPR 기능부는 MPEG-4 AVC의 인트라 예측(Intra prediction)을 한 후 복원된 픽셀값을 저장하는 기능부이다. 상술한 바와 같이, MPEG-4 AVC의 인트라 예측은 SPR 기능부에 의해 수행될 수 있을 것이다.
IT 기능부는 DC값 및 AC값들의 역 변환(inverse transform)을 수행하는 기능부이고, IQ 기능부는 AC 값들을 역 양자화(inverse quantization)하는 기능부이다.
IAP 기능부는 AC값들을 역 예측(inverse AC prediction)하는 기능부이고, IS 기능부는 AC값들을 역 스캔(inverse scan)하는 기능부이다. DCR 기능부는 DC값들의 역 예측 및 역 양자화를 수행하는 기능부이다.
디코딩 솔루션(340)은 디코더 형성부(330)에 의해 생성된 결과물로, BSDL 파서(320)에서 구문 정보 단위로 분리된 비트스트림 데이터(또는 미리 지정된 매크로블록 크기의 인코딩된 비디오 데이터)를 입력 받는다.
도 5에 예시된 바와 같이, 입력된 비트스트림 데이터는 데이터를 입/출력하기 위한 유, 무형의 데이터 인터페이스를 통해 입력될 수 있다. 데이터 인터페이스는 소프트웨어의 경우 특정 메모리 버퍼이거나, 자료의 흐름을 정의하는 가상 포트(Port)이거나, 프로그램 상의 파라미터일 수 있고. 하드웨어의 경우에는 회로 상의 연결선일 수 있으며, 이외에도 다양하게 구현될 수 있다.
데이터의 입력은 해당 인터페이스를 통해 지속적으로, 그리고 특정 기능부의 프로세스 수행과 무관하게 지속적으로 입력(예를 들어, 병렬 처리가 가능하도록 입력)될 수 있다. 디코딩 솔루션(340)은 입력되는 데이터를 처리하여 디코딩된 영상 데이터로 출력한다. 도 5에 도시된 바와 같이, 데이터는 데이터 인터페이스로부터 시작해 각 기능부로 전달될 수 있으며, 기능부는 해당 데이터를 가공하여 후속하는 기능부로 전달할 수 있다. 이러한 데이터의 흐름은 모두 디코더 형성부(330)에 의해 사전 정의된 바에 의하여 처리된다.
디코딩 솔루션(340)내에는 BSDL 파서(320)로부터 제공받은 데이터(예를 들어, 비트스트림의 syntax 파싱에 의해 추출된 정보 등), 각 기능부의 처리 결과 데이터를 저장하기 위한 저장부가 포함될 수 있다. 디코더 형성부(330)의 제어에 의해 로드된 각 기능부는 BSDL 파서(320)로부터 제공된 데이터 및 선행하여 동작된 기능부의 결과 데이터 중 하나 이상을 이용하여 지정된 프로세스를 수행할 수 있다. 이 경우, 후속하여 프로세스를 수행할 기능부는 선행하는 기능부의 동작이 완료되었음을 인식하여야 한다. 이를 위해, 디코더 형성부(330)는 각 기능부의 동작 완료 여부를 지속적으로 모니터링하여 후속하는 기능부의 동작 개시 여부를 제어할 수 있다. 또한, 저장부 내에 각 기능부별로 독립된 영역이 구비되도록 하고, 선행하는 기능부의 처리 결과 데이터를 디코더 형성부(330)의 제어에 의해 후속하는 기능부를 위한 저장 영역에 저장되도록 하면, 후속하는 기능부는 자신의 저장 영역에 프로세스 수행을 위해 필요한 데이터가 저장되는 즉시 프로세스를 수행할 수도 있을 것이다. 이외에도, 기능부간의 처리 개시 시점을 제어하기 위한 다양한 방법이 추가적으로 고려될 수 있음은 자명하다.
물론, 해당 저장부는 디코더 형성부(330) 내에 구비될 수도 있으며, 디코더 형성부(330)는 현재 프로세스를 수행할 기능부로 BSDL 파서(320)로부터 제공받은 데이터(예를 들어, 비트스트림의 syntax 파싱에 의해 추출된 정보 등), 각 기능부의 처리 결과 데이터를 해당 기능부로 제공할 수도 있다.
이하, 도 5를 참조하여 복호화부(305)의 동작 과정을 간략히 설명하면 다음과 같다.
외부로부터 입력 영상 비트스트림과 BSDL 스키마가 입력되면(비트스트림의 임의 지점에 정보 A 와 정보 B가 존재하는 것으로 가정함), BSDL 파서(320)은 BSDL 스키마를 읽어 들여 정보 A에 해당하는 지점에 5bit의 MB type 데이터가 존재하고, 정보 B에 해당하는 지점에는 2bit의 CBPY 데이터가 존재함을 인식한다.
이어서, BSDL 파서(320)는 파서는 인식한 정보를 이용해 각 지점에서 지정된 수 만큼의 비트를 읽어 들이고, 읽어들인 정보를 부여된 의미에 따라 디코딩 솔루션(340)에 전달한다.
디코딩 솔루션(340)은 BSDL 파서(320)로부터 MB Type과 CBPY로 명명된 데이터를 제공받아 처리하게 된다. 디코딩 솔루션(340)은 디코더 형성부(330)의 연결 제어에 의해 각 기능부들이 로딩되어 구현됨은 앞서 설명한 바와 같다.
디코딩 솔루션(340)에 존재하는 데이터 인터페이스는 외부로부터 전달된 데이터를 받아들여, 연결 제어 정보에 의해 사전에 구성된 기능부들의 연결 관계를 참조하여, 해당 데이터를 요구하는 기능부들에 전달한다.
각 기능부는 역시 미리 지정된 연결 관계(즉, 데이터 처리를 위한 연결 관계)에 따라 디코딩 과정을 수행한다. 모든 데이터 흐름과 기능부 간의 연결 관계는 디코더 형성부(330)가 사전에 구성한 내역에 의한다. 각 기능부들의 순차적 처리에 의해 출력 영상 프레임이 외부로 출력된다.
상술한 바와 같이, 디코더 형성부(330) 또는/및 디코딩 솔루션(340) 내에는 저장부가 구비될 수 있다. BSDL 파서(320)로부터 데이터를 제공받음에 있어, 그 전달 과정에 끊김이 없고 또한 디코딩 과정과는 병렬적으로 데이터 제공이 수행될 수 있기 때문이다. 또한, 각 기능부는 필요한 데이터를 저장부로부터 독출하여 사용할 수도 있을 것이다.
또한, BSDL 파서(320)는 인코딩된 영상 데이터의 디코딩 처리를 위해 상응하는 데이터를 디코더 형성부(330)로 제공하여 디코더 형성부(330)가 디코딩 솔루션(340)으로 제공하도록 하거나, BSDL 파서(320)가 직접 해당 데이터를 디코딩 솔루션(340)으로 제공할 수도 있을 것이다.
다시 도 4을 참조하면, 분리부(310)는 입력된 디코더 디스크립션(2560)을 각각의 정보로 분리하여 복호화부(305)로 입력한다. 분리부(310)에 입력된 디코더 디스크립션(2560)은 비트스트림의 구조를 기술하기 위한 BSDL 스키마(2565)와 비트스트림의 디코딩 과정을 기술하기 위한 CALML 데이터(2570)를 포함할 수 있다. 상술한 두 가지 종류의 데이터는 각각 독립적으로 XML 문법에 의해 기술될 수도 있으며, 효율적인 디코더의 운용을 위하여 두 종류의 데이터가 통합되어 전송될 수 있다.
도 6는 본 발명의 다른 실시예에 따른 디코더 디스크립션 입력 과정을 나타낸 도면이다.
도 6에 예시된 바와 같이, 복호화기(300)는 디스크립션 디코더(510)를 더 포함할 수 있다. 디스크립션 디코더(510)는 입력된 인코딩된 디코더 디스크립션(520)을 디코딩 처리하여 디코더 디스크립션(2560)을 생성하여 분리부(310)로 제공할 수 있다.
디코더 디스크립션(2560)을 인코딩하여 송수신함으로써 송수신되는 데이터량을 절감할 수 있는 효과가 있다.
도 7은 본 발명에 따른 복호화기의 다른 실시예 블록 구성도이다.
앞서 도 4을 참조하여 디코더 디스크립션(2560)과 영상 비트스트림이 복호화부(305)로 입력되는 경우와, 도 6를 참조하여 인코딩된 디코더 디스크립션(520)과 영상 비트스트림(380)이 복호화부(305)로 입력되는 경우를 설명하였다.
그러나, 도 7에 예시된 바와 같이, 디코더 디스크립션(2560)의 구성 정보들이 원시적으로 분리되어 복호화부(305)로 입력될 수도 있음은 자명하다. 이 경우, 앞서 설명한 분리부(310), 디코더 디스크립션(2560) 등이 생략될 수 있음은 자명하다. 도 8은 본 발명의 다른 실시예에 따른 복호화부의 구성을 나타낸 도면이다.
앞서 도 4 내지 도 7을 참조하여 툴박스(335) 및 디코더 형성부(330)가 분리되어 구현된 복호화부(305)에 대하여 설명하였다.
그러나 도 8 에 예시된 바와 같이, 툴박스(335)가 디코더 형성부(330)의 일 구성 요소로 포함되어 구현될 수도 있음은 자명하다.
이 경우, 디코더 형성부(330)는 기능부간의 연결 구조 제어 기능 뿐 아니라 사용될 기능부의 선별 기능까지도 포함할 수 있으며, 이를 통해 구현 가능한 디코딩 솔루션(340)의 유형도 다양해질 수 있을 것이다.
도 9는 본 발명의 또 다른 실시예에 따른 BSDL 파서의 구성을 나타낸 도면이다.
앞서 도 4을 참조하여, BSDL 해석 처리부를 포함하는 BSDL 파서(320)에 대하여 설명하였다.
그러나, 본 발명에 따른 BSDL 파서(320)는 비트스트림의 디코딩을 개시하기 이전에 복호화기(300) 외부로부터 사전 정의되어 제공될 수도 있다. 따라서, 앞서 설명한 BSDL 해석 처리부가 생략될 수 있다. 이때, BSDL 파서 제작기(2610)는 BSDL 레퍼런스 소프트웨어와 같은 기존의 응용 프로그램을 활용하여 구성될 수 있을 것이다.
이제까지, BSDL 파서가 독립된 구성 요소로서 지정된 동작을 처리하는 경우를 중심으로 설명하였다. 다만, BSDL 파서는 툴박스 내에 포함되는 하나의 기능부로서 구현되거나, 디코딩 솔루션 내에 독립된 구성 요소로서 미리 포함되도록 구현될 수도 있을 것이다. 만일, BSDL 파서가 툴박스 내에 구비되는 경우 디코더 형성부는 연결 제어 정보를 이용하여 BSDL 파서가 비트스트림 디코딩을 위해 동작하는 기능부들의 동작 이전에 프로세스를 수행하도록 로드 및 제어하여야 할 것이다. 마찬가지로, BSDL 파서가 디코딩 솔루션 내에 미리 포함되는 경우, 디코더 형성부는 로드한 각 기능부들의 프로세스 수행 개시 이전에 BSDL 파서가 먼저 프로세스 수행하도록 제어하여야 할 것이다. 각각의 경우에도 BSDL 파서의 동작 및 기능은 앞서 관련 도면을 참조하여 설명한 바와 동일하므로 상세한 설명은 생략하기로 한다. 다만, BSDL 스키마 또는/및 비트스트림을 초기에 입력받는 주체가 디코더 형성부 또는/및 디코딩 솔루션으로 변경될 필요가 있을 수 있다.
이제까지 본 발명에 따른 복호화 장치 및 비트스트림 복호화를 위한 구문 해석 방법을 설명함에 있어 MPEG-4 AVC를 기준으로 설명하였으나, MPEG-1, MPEG-2, MPEG-4, AVS 및 이외의 동영상 부호화/복호화 표준에 아무런 제한없이 동일하게 적용할 수 있음은 당연하다.
또한, 연결 제어 정보에 포함되는 정보 역시 하나의 표준에 의한 디코딩 수행을 위한 기능부들의 연결 관계, 해당 기능부에 요구되는 처리 프로세스 등에 관한 정보만으로 기술되지 않고, 복수의 표준에 의한 디코딩 수행을 위한 정보로 기술될 수도 있음은 자명하다.
예를 들어, 영상 비트스트림의 초기 복수의 프레임은 MPEG-2로 인코딩되고, 후속하는 복수의 프레임은 MPEG-4로 인코딩되며, 나머지 프레임은 MPEG-1으로 인코딩되었다고 가정하자. 이 경우, 인코딩된 영상 데이터의 디코딩을 위해 연결 제어 정보는 인코딩 방법을 달리하는 각 프레임들이 툴박스(335)에 포함된 각 표준에 따른 기능부들이 유기적으로 결합되어 동작될 수 있도록 정의될 것임은 자명하다.
이하, 관련 도면을 참조하여, 본 발명에 따른 복호화기의 또 다른 실시예를 설명하기로 한다. 다만, 또 다른 실시예를 설명함에 있어, 전술한 실시예와 동일하거나 극히 유사한 기능을 수행하는 구성에 대한 설명은 그 명칭 및 도면 참조 부호를 동일하게 표시하는 것으로서 중복된 설명을 생략하기로 한다. 예를 들어, 도 11에 도시된 툴박스(335), 디코더 형성부(330) 및 디코딩 솔루션(330)은 기본적으로 전술한 구성과 동일하다.
<CDDL 기반 디코더 디스크립션>
도 10은 본 발명에 따른 복호화기의 또 다른 실시예 블록 구성도이고, 도 11은 도 10의 복호화부의 일실시예 구성을 개략적으로 나타낸 도면이다.
이하, 설명되는 실시예에서 입력되는 디코더 디스크립션은 테이블 기반 디코더 디스크립션(이하, CDDL(Compact Decoder Description Language) 기반 디코더 디스크립션)으로서, 바이너리 형태로 압축되어 복호기로 전달된다.
복호화기는 입력되는 비트스트림의 형식에 따라 필요한 기능부들을 조합하여 디코더를 재구성할 수 있다. 이로 인해, 본 발명에 따른 복호화기는 어떠한 형식으로 인코딩된 비트스트림이 입력되더라도 입력된 비트스트림에 상응하는 디코더를 형성하여 당해 비트스트림을 복호할 수 있다. 이하, 관련 도면을 참조하여 본 발명에 따른 복호화기에 대해 보다 상세히 설명하기로 한다.
전술한 바와 같이, 복호화기로 디코더 디스크립션이 비트스트림과 함께 제공된다. 디코더 디스크립션은 비트스트림과 통합적으로 구현된 비트스트림(305)의 형태로 복호화기에 제공되거나, 독립된 데이터 형태로 복호화기에 제공될 수 있다. 물론, 복호화기의 특정 저장부에 디코더 디스크립션에 상응하는 정보가 미리 저장된 경우라면, 디코더 디스크립션의 제공은 생략될 수도 있다. 다만, 이하에서는 해당 데이터가 비트스트림 내에 포함되어 복호화기로 제공되는 경우를 중심으로 설명하기로 한다.
본 발명의 다른 실시예에 따른 복호화기는 분리부(310) 및 복호화부(320)를 포함한다. 도시된 복호화기의 구성 요소(예를 들어, 분리부(310), 복호화부(320) 자체 또는 복호화부(320)에 포함된 하나 이상의 구성 요소 등) 중 하나 이상은 하기에서 설명될 기능을 수행하도록 구현된 소프트웨어 프로그램(또는 프로그램 코드들의 조합)으로 구현될 수도 있음은 자명하다.
분리부(310)는 입력된 비트스트림(Bitstream)을 압축된 디코더 디스크립션(Compressed Decoder Description)과 인코딩된 비디오 데이터로 분리하여 복호화부(320)로 각각 입력한다.
분리부(310)는 압축된 디코더 디스크립션(313)를 복원부(410)로 입력하고, 인코딩된 비디오 데이터(316)는 복호 실행부(450)로 입력할 수 있다. 상술한 바와 같이, 압축된 디코더 디스크립션과 인코딩된 비디오 데이터가 각각 독립된 데이터로 입력되는 경우 분리부(310)는 생략될 수 있다. 또한, 인코딩된 비디오 데이터는 앞서 도 1의 비트스트림(105)과 동일 또는 유사한 형식의 데이터일 수 있다.
복호화부(320)는 분리부(310)로부터 입력된 압축된 디코더 디스크립션(313)를 이용하여 인코딩된 비디오 데이터(316)을 복호화하여 디코딩된 영상 데이터(390)를 출력한다. 이하에서 도 11를 참조하여, 복호화부(320)를 구성에 대해 상세히 설명하도록 한다.
도 11을 참조하면, 복호화부(1320)는 복원부(Decompression Unit)(1410), 디코더 디스크립션 해석부(1420), 툴박스(335), ADM 생성부(1440), 복호 실행부(1450)을 포함한다. 복호 실행부(1450)는 디코더 형성부(330) 및 디코딩 솔루션(330)을 포함한다.
복원부(1410)는 분리부(1310)로부터 입력된 압축된 디코더 디스크립션(313)를 소정의 복원 방식에 따라 복원(decompression)하여 디코더 디스크립션 해석부(420)로 출력한다. 더욱 구체적으로는, 디코더 디스크립션은 소정의 규칙에 따라 바이너리 형식으로 압축되어 있으며, 복원부는 바이너리 형태의 압축된 디코더 디스크립션을 디코딩하여 상응하는 CDDL 기반 디코더 디스크립션을 복원하여 출력한다.
디코더 디스크립션 해석부(1420)는 복원된 CDDL 기반 디코더 디스크립션 을 XML 형식으로 기술된 XML 기반 디코더 디스크립션으로 변환하여 ADM 생성부(1440)로 출력한다. 물론, 디코더 디스크립션 해석부(420)을 생략하고 복원부(410)가 입력된 바이너리 데이터를 직접 XML 기반 디코더 디스크립션으로 변환하여 출력할 수도 있음은 자명하다.
ADM 생성부(440)는 하나 이상의 입출력 포트를 갖는 다수의 기능부 정보 및 상기 포트들 간의 연결 정보를 포함하는 추상적 복호화 모델(Abtstact Decoding Model, ADM)을 생성한다.
ADM 생성부(440)는 전송받은 기능부를 문맥 제어 정보, 연결 제어 정보, 파싱 제어 정보에 따라 조합하여 비트스트림을 복호화 할 수 있는 ADM을 생성한다.
복호 실행부(450)는 상기 ADM을 이용하여 전술한 바와 같이 디코더형성부(330) 및 디코딩 솔루션(340)을 통해 툴박스에 저장된 해당 기능부들을 이용하여 입력 영상을 디코딩 할 수 있다. 또한, 복호 실행부(450)는 상기 XML 기반 디코더 디스크립션을 직접 입력받아 입력 영상을 디코딩할 수도 있음은 물론이다.
이하, 본 발명의 일실시예에 따른 CDDL 기반 DD(Decoder Description)를 설명하기로 한다.
CDDL 기반 DD(Decoder Description)은 ADM 또는/및 디코딩 솔루션을 구성하는데 필요한 FU 들의 연결 관계인 FU 네트워킹을 기술하는 FU 네트워킹 테이블 그룹 및 신택스 파싱을 위한 신택스 파싱 테이블 그룹으로 구분된다.
FU 네트워킹 테이블 그룹은 가상 네트워크 테이블(Virtual Network Table, VNT), 기능부 인스턴스 테이블(Functional Unit Instance Table, FUIT), 네트워크 연결 테이블(Network Connection Table, NCT), 파라미터 테이블(Parameter Table, PT), 표현 테이블(Expression Table, ET) 및 유형 테이블(Type Table, TT)을 포함한다.
신택스 파싱 테이블 그룹은 CSCIT(Control Signal and Context Information Table), SET(Syntax Element Table), SRT(Syntax Rule Table) 및 DVT(Default Value Table)를 포함한다.
이하, 관련 도면을 참조하여 FU 네트워킹 테이블들에 대하여 먼저 설명한 후, 신택스 파싱 테이블들을 설명한다.
도 12는 본 발명의 일실시예에 따른 FU 네트워킹 테이블의 구조를 나타낸 도면이다.
CDDL 기반 DD(Decoder Description)에서 사용하는 FU 네트워킹 테이블 은 도 12에 도시된 바와 같은 구조에 따라 이진 표현 비트스트림으로 기술된다.
각 테이블은 테이블 시작 코드(Table Start Code)와 테이블 식별을 위한 고유한 테이블 번호(Table Code)가 기술된다. 그리고 실질적인 테이블의 내용이 이진화(Binary)되어 비트스트림을 구성한다. 하나의 테이블 내용이 완전하게, 즉, 하나의 테이블 내용 전체가 비트스트림에 기록되면 테이블 마침 코드(Table End Code)가 추가된다.
테이블 시작 코드(Table Start Code)는 고정된 값이며 24비트의 2진수(111111111111111111111110)로 이루어져 있고, Table End Code는 고정된 값이며 24비트의 2진수(111111111111111111111111)로 이루어져 있고, 테이블 코드(Table Code)는 고유한 테이블 번호를 식별하기 위하여 아래의 표 1과 같이 4비트의 2진수로 이루어져 있다.
표 1
Table | Code |
VNT | 0100 |
NCT | 0101 |
PT | 0110 |
FUIT | 0111 |
TT | 1000 |
ET | 1001 |
reserved | 1010 ~ 1111 |
도 13는 본 발명의 일실시예에 따른 VNT 테이블의 구조를 나타낸 도면이다.
도 13에 도시된 바와 같이, VNT 테이블은 FUID, VN 명칭(VN name), 입력포트(INPUT ports), 출력 포트(OUTPUT Ports) 및 QID 명칭(QID name) 필드를 포함한다.
기능부의 집합인 Network는 구조가 동일하면서 입력이나 출력으로 쓰이는 데이터가 동일하지 않은 경우가 존재할 수 있다. 이렇게 구조가 동일하지만 입/출력이 동일하지 않은 여러 개의 Network(개체들)을 효율적으로 구현하기 위하여 상속 개념을 이용한 기본 템플릿(Template) 객체를 생성하여 두고 이 템플릿(Template)을 모체로 하여 필요한 하위 객체(자손, 상속된 객체)를 만들어내는 형태를 구성한다. VNT는 기본 템플릿(Template)에 해당하는 정보를 기술한다.
FUID는 기능부(FU)가 이미 도구 박스(toolbox)에 존재할 수도 있고 존재하지 않는 새로운 것 일수도 있기 때문에, 기능부가 도구 박스에서 몇 번째 항목인지를 나타내는 인덱스 번호를 사용한다. 도구 박스에 존재할 경우에는 FUID flag 가 1로 세팅되고 존재하지 않는 경우에는 0으로 세팅된다. FUID flag가 0으로 세팅되는 경우 FUID가 기술되지 않고 넘어간다.
VN name은 기능부(FU)의 이름을 나타낸다. 2진화되어 비트스트림에 기록될 때에는 이름의 문자열 길이를 먼저 기술하고(8비트), 그 이후에 각 영문자를 하나씩 기록한다. 각 영문자는 아스키 코드(Ascii code)로 표현될 수 있다.
Version은 기능부(FU)의 버전을 나타낸다. 기능부의 버전이 존재하는 경우에는 version flag가 1 로 세팅되고 존재하지 않는 경우에는 0으로 세팅된다. 2진화되어 비트스트림에 기록될 때에는 버전의 문자열 길이를 먼저 기술하고(8비트), 그 이후에 각 영문자를 하나씩 기록한다. 각 영문자는 아스키 코드(Ascii code)로 표현될 수 있다.
입력 포트는 여러 개일 수가 있다. 하나의 입력 포트 이름을 2진화시켜 기록하기 전에 입력 포트 이름의 길이를 8비트로 표시하고, 그 이후에 입력 포트의 영문자를 하나씩 기록한다. 입력 포트의 타입이 존재할 수도 있고 존재하지 않을 수도 있기 때문에, 입력 포트에 대한 type flag가 존재 유무를 나타낸다. type flag가 1으로 세팅되는 경우 Type 테이블 인덱스가 8비트로 기술되고, 그렇지 않으면 Type 테이블 인덱스가 기술되지 않고 넘어간다. 여러 개의 입력 포트가 존재하는 경우, 하나의 입력 포트에 대한 기술이 끝나면, 전체 입력 포트의 기록이 완료되었는지 안되었는지를 플래그(INPUT ports flag)로 나타낸다. 만약 모든 입력 포트의 기술이 끝났으면 1로 세팅하고, 그렇지 않고 더 기록할 입력 포트가 존재한다면 0으로 세팅한다. 이후에 동일한 방식으로 남아있는 입력 포트를 기록한다.
출력 포트 또한 여러 개일 수 있으며, 2진 표현으로 비트스트림에 기록하는 형태는 입력 포트와 동일하다.
QID 명칭(QID name)은 기능부(FU)의 적절한 식별자로서 사용되는 문자열을 나타낸다. 모든 기능부가 QID 이름을 가지고 있지는 않기 때문에 QID 이름이 존재하는지 여부를 1비트로 기술한다. flag가 0으로 세팅되는 경우 QID가 기술되지 않고 넘어간다. flag가 1로 세팅되는 경우 QID 이름의 길이를 8비트로 기술한다. 그리고 나서 QID 이름을 하나씩 영문자로 기록한다. 각 영문자는 아스키 코드(Ascii code)로 표현될 수 있다.
전술한 바와 같은 구조의 바이너리 비트스트림으로 입력된 VNT 테이블은 복원부(1410) 및/또는 디코더 디스크립션 해석부(1420)에서 소정의 규칙에 따라 XML 기반 디코더 디스크립션으로 변환된다. 즉, 테이블을 나타내는 테이블 약자(영문자)가 이용되고, 테이블 내용은 '{' 로 시작되며 '}' 로 끝이 난다. 각 테이블의 필드는 ',' 로 구분되며, 하나의 행은 '(' 로 시작되며 ')' 로 끝이 나고, 하나의 필드가 여러 개의 값을 가지는 경우 '{' 로 시작되며 '}' 로 끝이 나며, 문자의 표현은 '"' 마크 사이에 기술된다.
VNT 테이블은 다음과 같은 텍스트형식으로 표현된다.
{
([FU_ID,] (VN Name), (Version),{INPUT PORTS}, {OUTPUT PORTS}, [QID name]),
…
}
XML 형식을 지원하는 MPEG-4 SP에 대한 VNT 테이블의 실시예는 다음과 같다.
VNT
{
//0
(-, "decoder", -, "mpeg", -, {"video_Y", -, "video_U", -, "video_V", -}, "mpeg4"),
(1, "parser", -, "BITS", -, {"BTYPE_Y", -, "BTYPE_U", -, "BTYPE_V", -, "MV_Y", -, "MV_U", -, "MV_V", -, "B_Y", -, "B_U", -, "B_V", -},-),
(-, "intra_FUs_16x16_Y", -, {"BTYPE", -, "QFS", -}, "f", -, "mpeg4"),
(-, "intra_FUs_8x8_C", -, {"BTYPE", -, "QFS", -}, "f", -, "mpeg4"),
(-, "motion_Y", -, {"MV", -, "BTYPE", -, "TEX", -}, "VID", -, "mpeg4"),
//5
(-, "motion_U", -, {"MV", -, "BTYPE", -, "TEX", -}, "VID", -, "mpeg4"),
(-, "motion_V", -, {"MV", -, "BTYPE", -, "TEX", -}, "VID", -, "mpeg4"),
(-, "byte2bit", -, "in8", -, "BITS", -, -),
(2, "Address16x16', -, {"MV", -, "BTYPE", -}, {"WA", -, "RA", -, "halfpel", -}, -),
(3, "Framebuf", -, {"RA", -, "WA", -, "WD", -}, "RD", -, -),
//10
(4, "Interpolate", -, {"RD", -, "halfpel", -}, "MOT", -, -),
(5, "Add", -, {"MOT", -, "TEX", -, "BTYPE", -}, "VID", -, -),
(6, "Address8x8", -, {"MV", -, "BTYPE", -}, {"WA", -, "RA", -, "halfpel", -}, -),
(7, "DCSplit", -, "IN", -, {"DC", -, "AC", -}, -),
(-, "DCR_16x16_L", -, {"BTYPE", -, "QFS_DC", -}, {"QF_DC", -, "PTR", -, "AC_PRED_DIR", -, "SIGNED", -, "QUANT", -}, "cal"),
//15
(8, "InverseScan", -, {"QFS_AC", -, "AC_PRED_DIR ", -}, "PQF_AC", -, -),
(9, "IAP_16x16", -, {"PQF_AC", -, "PTR", -, "AC_PRED_DIR", -}, "QF_AC", -, -),
(10, "Dequant", -, {"AC", -, "DC", -, "QP", -}, "OUT", -, -),
(11, "idct2d", -, {"\in\", -, "signed", -}, "out", -, -),
(-, "DCR_8x8_C", -, {"BTYPE", -, "QFS_DC", -}, {"QF_DC", -, "PTR", -, "AC_PRED_DIR", -, "SIGNED", -, "QUANT", -}, "cal"),
//20
(12, "IAP_8x8", -, {"PQF_AC", -, "PTR", -, "AC_PRED_DIR", -}, "QF_AC", -, -),
(13, "DCR_addressing_8x8", -, "BTYPE", -, {"A", -, "B", -, "C", -}, -),
(14, "DCR_invpred_8x8_C", -, {"BTYPE", -, "A", -, "B", -, "C", -, "QFS_DC", -}, {"QF_DC", -, "PTR", -, "AC_PRED_DIR", -, "SIGNED", -, "QUANT", -}, -),
(15, "DCR_addressing_16x16", -, "BTYPE", -, {"A", -, "B", -, "C", -}, -),
(16, "DCR_invpred_16x16_L", -, {"BTYPE", -, "A", -, "B", -, "C", -, "QFS_DC", -}, {"QF_DC", -, "PTR", -, "AC_PRED_DIR", -, "SIGNED", -, "QUANT", -}, -)
}
도 14는 본 발명의 일실시예에 따른 FUIT 테이블의 구조를 나타낸 도면이다.
도 14에 도시된 바와 같이, FUIT 테이블은 VNT index, Parent VNT index, Parameter indices 및 QID name 필드를 포함한다. FUIT에서는 VNT 정보인 기본 템플릿(Template)에 기반하여 실제 필요로 하는 Network로 사용되는 객체들을 생성하기 위한 주요 정보가 저장된다. 실제 필요로 하는 Network는 기본 템플릿(Template) 에서 파생된 하위 객체(자손, 상속된 객체, Instance)로 표현할 수 있다.
VNT index는 하나의 기능부를 나타내기 위한 VNT 테이블의 인덱스이다.
Parent VNT index는 하위 객체(Instance)가 필요로 하는 기본 템플릿을 나타낸다. VNT 테이블에서 참조하기 위한 인덱스이다. flag가 0으로 세팅되는 경우 VNT index 가 기술되지 않고 넘어간다.
PT indices는 하나의 기능부가 가지는 여러개의 파라미터를 나타내는 인덱스 리스트로서, 기능부가 가지는 파라미터는 없을 수도 있고, 여러 개 일 수도 있다. 파라미터의 존재 여부를 flag 로 나타내고, 파라미터 정보가 담긴 파라미터 테이블(PT) 인덱스를 이어서 기술한다. 만약 모든 파라미터 정보의 기술이 끝났으면 1로 세팅하고, 그렇지 않고 더 기록할 파라미터 테이블 인덱스가 존재한다면 0으로 세팅한다. 이후에 동일한 방식으로 남아있는 파라미터 테이블 인덱스를 기록한다.
QID name은 기능부(FU)의 적절한 식별자로서 사용되는 문자열을 나타낸다. 모든 기능부가 QID 이름을 가지고 있지는 않기 때문에 QID 이름이 존재하는지 여부를 1비트로 기술한다. flag가 0으로 세팅되는 경우 QID가 기술되지 않고 넘어간다. flag가 1로 세팅되는 경우 QID 이름의 길이를 8비트로 기술한다. 그리고 나서 QID 이름을 하나씩 영문자로 기록한다. 각 영문자는 아스키 코드(Ascii code)로 표현될 수 있다.
FUIT 테이블은 다음과 같은 텍스트형식으로 표현된다.
{
(VNT Index, [Parent VNT Index], {PT Indexes}, [QID name] ),
…
}
XML 형식을 지원하는 MPEG-4 SP에 대한 FUIT 테이블의 실시예는 다음과 같다.
FUIT
{
(1, 0, {21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37}, "mpeg4"),
(2, 0, {21, 24, 25, 23, 26, 27, 28, 29, 33, 34, 39}, "mpeg4"),
(3, 0, {21, 24, 25, 23, 26, 27, 28, 29, 33, 34, 39}, "mpeg4"),
(3, 0, {21, 24, 25, 23, 26, 27, 28, 29, 33, 34, 39}, "mpeg4"),
(4, 0, {38, 21, 40, 37, 49, 41, 7, 25, 26, 27, 29, 30, 35}, "mpeg4"),
...
...
(24, 14, {52, 21, 24, 25, 23, 26, 27, 28, 29, 33, 34, 39}, "cal")
}
도 15는 본 발명의 일실시예에 따른 PT 테이블의 구조를 나타낸 도면이다.
도 15에 도시된 바와 같이, PT 테이블은 Parameter name, Parent VNT index, ET index 및 TT index 필드를 포함한다.
Parameter는 Bitstream으로부터 생성되는 Syntax는 아니지만 기능부가 구성될 때 필요한 데이터를 생성하기 위해 사용된다. Parameter 는 Syntax가 아니기 때문에 데이터를 전송하는 Port를 통해 전달될 수 없다. 기능부의 집합인 Network 에서 그 Network에 포함되어 있는 하위 Network로 Parameter를 전달할 수 있다. 하나의 기능부가 가지는 Parameter에 대한 정보는 FUIT에 PT 인덱스로 기술된다. PT에서는 각 Parameter의 생성 정보를 가진다.
Parameter name에 있어서, 각 파라미터는 기본적으로 그 이름을 가진다. 파라미터 이름의 길이를 8비트로 기술한다. 그리고 나서 파라미터 이름을 하나씩 영문자로 기록한다. 각 영문자는 아스키 코드(Ascii code)로 표현될 수 있다
Parent VNT index에 있어서, 파라미터는 기본 템플릿이 되는 상위의 Network 기능 유닛에서 사용될 수 있고, 기본 템플릿을 통해 생성된 하위 기능 유닛 객체(Instance)에서 사용될 수도 있다. 상위의 Network 에서 사용되는 파라미터일 경우에는 flag가 1으로 세팅되며 VNT 테이블에서 참조하기 위한 인덱스가 기술된다. 그렇지 않고 하위 객체(Instance)에서 사용되는 경우에는 flag가 0으로 세팅되고 VNT 테이블 인덱스가 기술되지 않는다.
ET index에 있어서 파라미터의 형식을 나타내는 표현이 이루어질 수 있다. 이때 파라미터에 대한 표현이 존재하는 경우 flag 가 1로 세팅되고 존재하지 않는 경우에는 0으로 세팅된다. flag가 0으로 세팅되는 경우 ET 인덱스가 기술되지 않고 넘어간다. 표현에 대한 내용은 ET의 인덱스를 참조하게 된다.
TT index는 파라미터의 타입(파라미터의 종류)을 나타낸다. 파라미터의 타입이 존재하는지를 나타내는 flag가 1로 세팅되면 TT 인덱스가 기술되고, 그렇지 않으면 TT 인덱스가 기술되지 않고 넘어간다. 타입에 대한 내용은 TT의 인덱스를 참조하게 된다.
PT 테이블은 다음과 같은 텍스트형식으로 표현된다.
{
(Parameter Name, [VNT Index], [Expr Index], [Type Index]),
…
}
XML 형식을 지원하는 MPEG-4 SP에 대한 PT 테이블의 실시예는 다음과 같다.
PT
{
//0
("MAXW_IN_MB", 0, 0, -),
("MAXH_IN_MB", 0, 1, -),
("ADDR_SZ", 0, 2, -),
("PIX_SZ", 0, 3, -),
("MV_SZ", 0, 3, -),
//5
("SAMPLE_COUNT_SZ", 0, 4, -),
("SAMPLE_SZ", 0, 5, -),
("MB_COORD_SZ", 0, 4, -),
("BTYPE_SZ", 0, 0, -),
("NEWVOP", 0, 6, -),
//10
("INTRA", 0, 7, -),
("INTER", 0, 8, -),
("QUANT_MASK", 0, 9, -),
("ROUND_TYPE", 0, 10, -),
("FCODE_MASK", 0, 11, -),
//15
("FCODE_SHIFT", 0, 12, -),
("ACPRED", 0, 13, -),
("ACCODED", 0, 14, -),
("FOURMV", 0, 15, -),
("MOTION", 0, 4, -),
//20
("QUANT_SZ", 0, 12, -),
("MAXW_IN_MB", -, 16, -),
("SAMPLE_COUNT_SZ", -, 17, -),
("SAMPLE_SZ", -, 18, -),
("MB_COORD_SZ", -, 19, -),
//25
("BTYPE_SZ", -, 20, -),
("NEWVOP", -, 21, -),
("INTRA", -, 22, -),
("INTER", -, 23, -),
("QUANT_MASK", -, 24, -),
//30
("ROUND_TYPE", -, 25, -),
("FCODE_MASK", -, 26, -),
("FCODE_SHIFT", -, 27, -),
("ACPRED", -, 28, -),
("ACCODED", -, 29, -),
//35
("MOTION", -, 30, -),
("FOURMV", -, 31, -),
("MV_SZ", -, 32, -),
("SEARCHWIN_IN_MB", -, 33, -),
("QUANT_SZ", -, 34, -),
//40
("MAXH_IN_MB", -, 35, -),
("PIX_SZ", -, 36, -),
("BUF_SZ", 4, 37, -),
("FLAG_SZ", 4, 15, -),
("BUF_SZ", 5, 37, -),
//45
("FLAG_SZ", 5, 15, -),
("BUF_SZ", 6, 37, -),
("FLAG_SZ", 6, 15, -),
("FLAG_SZ", -, 38, -),
("ADDR_SZ", -, 39, -),
//50
("BUF_SZ", -, 40, -),
("SEARCHWIN_IN_MB", -, 41, -),
("DCVAL", -, 7, -)
}
도 16은 본 발명의 일실시예에 따른 NCT 테이블의 구조를 나타낸 도면이다.
도 16에 도시된 바와 같이, NCT 테이블은 Src FUIT index, Dst FUIT index, Src port name, Dst port name, Attribute name, Attribute value 및 ET Index 필드를 포함한다.
NCT에는 각각의 기능 유닛들 간에 데이터를 전송할 수 있는 통로인 Port에 관한 정보를 가지고 있다. 각각의 입력과 출력을 담당하는 Input Port와 Output Port들은 고유한 이름을 가질 수 있다.
Src FUIT index는 데이터가 하나의 기능 유닛에서 다른 하나로 전송될 때 그 데이터가 어디에서 오는지를 나타내야 한다. 데이터가 전송되기 시작하는 기능 유닛을 FUIT의 인덱스로 참조할 수 있다. 만약 비트스트림의 시작이 입력 파일 파일과 같이 기능 유닛 자체가 아니라면 '-'로 표현될 수 있다. 따라서 FUIT를 참조하는 인덱스인지 아닌지를 flag로 나타내고 FUIT 인덱스를 기록한다. flag가 0으로 세팅되는 경우 FUIT 인덱스가 기술되지 않고 넘어간다.
Dst FUIT index는 데이터가 도달하는 기능 유닛을 나타내며, 데이터가 도달하는 기능 유닛의 FUIT 인덱스를 나타낸다. 만약 비트스트림의 시작이 출력 파일과 같이 기능 유닛 자체가 아니라면 '-'로 표현될 수 있다. 따라서 FUIT를 참조하는 인덱스인지 아닌지를 flag로 나타내고 FUIT 인덱스를 기록한다. flag가 0으로 세팅되는 경우 FUIT 인덱스가 기술되지 않고 넘어간다.
Src port name and Dst port name는 데이터가 전송되는 Port의 이름을 나타낸다. 기능 유닛의 출력 포트가 데이터의 전송 시작 포트가 되며, 다른 기능 유닛의 입력 포트가 데이터가 도달하는 포트가 된다. 데이터가 전송되는 출력 포트와 입력 포트의 이름이 동일할 수도 있다. 따라서 두개의 전송 포트 이름이 동일한지 동일하지 않은지를 나타내는 same flag가 기술된다. same flag가 0으로 세팅되는 경우 Dst port 이름이 기술되지 않는다. 2진화되어 비트스트림에 기록될 때에는 이름의 문자열 길이를 먼저 기술하고(8비트), 그 이후에 각 영문자를 하나씩 기록한다. 각 영문자는 아스키 코드(Ascii code)로 표현될 수 있다.
Attribute name는 네트워크의 연결관계에 있어서 연결 속성 정보가 추가될 수 있다. 그러한 속성 정보의 이름이 존재할 경우에는 flag 가 1로 세팅되고 존재하지 않는 경우에는 0으로 세팅된다. flag가 0으로 세팅되는 경우 속성 이름이 기술되지 않고 넘어간다. 연결 속성 정보의 이름이 2진화되어 비트스트림에 기록될 때에는 이름의 문자열 길이를 먼저 기술하고(8비트), 그 이후에 각 영문자를 하나씩 기록한다. 각 영문자는 아스키 코드(Ascii code)로 표현될 수 있다.
Attribute value는 네트워크의 연결관계에서 연결 속성 정보의 이름이 존재하는 경우 그 값이 기술되는 경우가 있다. flag가 0으로 세팅되는 경우 속성 값이 기술되지 않고 넘어간다. 따라서 속성 값의 존재 여부를 flag 로 나타내고, 값을 나타내는 문자열 길이를 8비트로 기술한다. 그 이후에 각 영문자를 하나씩 기록한다. 각 영문자는 아스키 코드(Ascii code)로 표현될 수 있다.
ET index는 네트워크의 연결관계의 추가적인 표현이 이루어질 수 있다. 이때 추가적인 표현이 존재하는 경우 flag 가 1로 세팅되고 존재하지 않는 경우에는 0으로 세팅된다. flag가 0으로 세팅되는 경우 ET 인덱스가 기술되지 않고 넘어간다. 표현에 대한 내용은 ET의 인덱스를 참조하게 된다.
NCT 테이블은 다음과 같은 텍스트형식으로 표현된다.
{
([Src FUIT Index], [Dst FUIT Index], Src Port, Dst Port, [Attribute Name], [Attribute Value], [Expr Index]),
…
}
XML 형식을 지원하는 MPEG-4 SP에 대한 NCT 테이블의 실시예는 다음과 같다.
NCT
{
//FUIT 0-7
(-, 7, "mpeg", "in8", -, -, -),
(7, 0, "out", "BITS", -, -, -),
(0, 1, "BTYPE_Y", "BTYPE", -, -, -),
(0, 1, "B_Y", "QFS", -, -, -),
(0, 2, "BTYPE_U", "BTYPE", -, -, -),
(0, 2, "B_U", "QFS", -, -, -),
(0, 3, "BTYPE_V", "BTYPE", -, -, -),
(0, 3, "B_V", "QFS", -, -, -),
(1, 4, "f", "TEX", -, -, -),
(2, 5, "f", "TEX", -, -, -),
(3, 6, "f", "TEX", -, -, -),
(0, 4, "MV_Y", "MV", -, -, -),
(0, 4, "BTYPE_Y", "BTYPE", -, -, -),
(0, 5, "MV_U", "MV", -, -, -),
(0, 5, "BTYPE_U", "BTYPE", -, -, -),
(0, 6, "MV_V", "MV", -, -, -),
(0, 6, "BTYPE_V", "BTYPE", -, -, -),
(4, -, "VID", "video_Y", -, -, -),
(5, -, "VID", "video_U", -, -, -),
(6, -, "VID", "video_V", -, -, -),
//FUIT 8 9 10 11
(-, 8, "MV", "MV", -, -, -),
(-, 8, "BTYPE", "BTYPE", -, -, -),
(-, 11, "TEX", "TEX", -, -, -),
(-, 11, "BTYPE", "BTYPE", -, -, -),
(8, 9, "WA", "WA", -, -, -),
(8, 9, "RA", "RA", -, -, -),
(8, 10, "halfpel", "halfpel", -, -, -),
(9, 10, "RD", "RD", -, -, -),
(10, 11, "MOT", "MOT", -, -, -),
(11, 9, "VID", "WD", -, -, -),
(11, -, "VID", "VID", -, -, -),
//FUIT 12 13 14 15
(-, 12, "MV", "MV", -, -, -),
(-, 12, "BTYPE", "BTYPE", -, -, -),
(-, 15, "TEX", "TEX", -, -, -),
(-, 15, "BTYPE", "BTYPE", -, -, -),
(12, 13, "WA", "WA", -, -, -),
(12, 13, "RA", "RA", -, -, -),
(12, 14, "halfpel", "halfpel", -, -, -),
(13, 14, "RD", "RD", -, -, -),
(14, 15, "MOT", "MOT", -, -, -),
(15, 13, "VID", "WD", -, -, -),
(15, -, "VID", "VID", -, -, -),
//FUIT 16 17 18 19
(-, 16, "MV", "MV", -, -, -),
(-, 16, "BTYPE", "BTYPE", -, -, -),
(-, 19, "TEX", "TEX", -, -, -),
(-, 19, "BTYPE", "BTYPE", -, -, -),
(16, 17, "WA", "WA", -, -, -),
(16, 17, "RA", "RA", -, -, -),
(16, 18, "halfpel", "halfpel", -, -, -),
(17, 18, "RD", "RD", -, -, -),
(18, 19, "MOT", "MOT", -, -, -),
(19, 17, "VID", "WD", -, -, -),
(19, -, "VID", "VID", -, -, -),
//FUIT 20 21 22 23 24 25
(-, 20, "QFS", "IN", -, -, -),
(20, 21, "DC", "QFS_DC", -, -, -),
(20, 22, "AC", "QFS_AC", -, -, -),
(-, 21, "BTYPE", "BTYPE", -, -, -),
(21, 22, "AC_PRED_DIR", "AC_PRED_DIR", -, -, -),
(22, 23, "PQF_AC", "PQF_AC", -, -, -),
(23, 24, "QF_AC", "QF_AC", -, -, -),
(24, 25, "OUT", "IN", -, -, -),
(21, 23, "PTR", "PTR", -, -, -),
(21, 23, "AC_PRED_DIR", "AC_PRED_DIR", -, -, -),
(21, 24, "QUANT", "QP", -, -, -),
(21, 24, "QF_DC", "DC", -, -, -),
(21, 25, "signed", "signed", -, -, -),
(25, -, "out", "f", -, -, -),
//FUIT 26 27 28 29 30 31
(-, 26, "QFS", "IN", -, -, -),
(26, 27, "DC", "QFS_DC", -, -, -),
(26, 28, "AC", "QFS_AC", -, -, -),
(-, 27, "BTYPE", "BTYPE", -, -, -),
(27, 28, "AC_PRED_DIR", "AC_PRED_DIR", -, -, -),
(28, 29, "PQF_AC", "PQF_AC", -, -, -),
(29, 30, "QF_AC", "QF_AC", -, -, -),
(30, 31, "OUT", "IN", -, -, -),
(27, 29, "PTR", "PTR", -, -, -),
(27, 29, "AC_PRED_DIR", "AC_PRED_DIR", -, -, -),
(27, 30, "QUANT", "QP", -, -, -),
(27, 30, "QF_DC", "DC", -, -, -),
(27, 31, "signed", "signed", -, -, -),
(31, -, "out", "f", -, -, -),
//FUIT 32 33
(-, 32, "BTYPE", "BTYPE", -, -, -),
(-, 33, "QFS_DC", "QFS_DC", -, -, -),
(-, 33, "BTYPE", "BTYPE", -, -, -),
(32, 33, "A", "A", -, -, -),
(32, 33, "B", "B", -, -, -),
(32, 33, "C", "C", -, -, -),
(33, -, "PTR", "PTR", -, -, -),
(33, -, "AC_PRED_DIR", "AC_PRED_DIR", -, -, -),
(33, -, "SIGNED", "SIGNED", -, -, -),
(33, -, "QF_DC", "QF_DC", -, -, -),
(33, -, "QUANT", "QUANT", -, -, -),
//FUIT 34 35
(-, 34, "BTYPE", "BTYPE", -, -, -),
(-, 35, "QFS_DC", "QFS_DC", -, -, -),
(-, 35, "BTYPE", "BTYPE", -, -, -),
(34, 35, "A", "A", -, -, -),
(34, 35, "B", "B", -, -, -),
(34, 35, "C", "C", -, -, -),
(35, -, "PTR", "PTR", -, -, -),
(35, -, "AC_PRED_DIR", "AC_PRED_DIR", -, -, -),
(35, -, "SIGNED", "SIGNED", -, -, -),
(35, -, "QF_DC", "QF_DC", -, -, -),
(35, -, "QUANT", "QUANT", -, -, -)
}
도 17은 본 발명의 일실시예에 따른 ET 테이블의 구조를 나타낸 도면이다.
도 17에 도시된 바와 같이, ET 테이블은 Kind, Literal kind, Literal value, Variable name, Operator, Child ET index, Args ET index 필드를 포함한다.
ET 테이블은 Bitstream으로부터 얻어내는 정보가 아니며 구문(Syntax)의 표현을 위하여 참조되는 테이블이다. 표현을 위한 어떤 수식이나 정보를 나타내기 위하여 기술된다. 이 테이블은 표현에 사용되는 표현 기법의 종류와 값, 변수의 이름 등을 나타낸다.
Kind는 표현식이 나타내는 종류를 의미한다. 이 필드는 비트스트림에 3비트로 기술된다. 표현식은 아래의 표와 같은 5가지 종류가 존재한다.
표 2
Kind | Code |
Literal | 000 |
Var | 001 |
Application | 010 |
UnaryOp | 011 |
BinOpSeq | 100 |
Reserved | 101 ~ 111 |
Literal kind는 이전 Kind 필드의 값이 Literal 로 지정되었을 때에만 Literal 이 가질 수 있는 종류을 나타낸다. flag가 0으로 세팅되는 경우 Literal kind 가 기술되지 않고 넘어간다. Literal kind는 아래의 표 3과 같은 종류의 코드를 갖는다.
표 3
Literal kind | Code |
Boolean | 000 |
Integer | 001 |
Real | 010 |
String | 011 |
Character | 100 |
Reserved | 101 ~ 111 |
Literal value는 이전 Kind 필드의 값이 Literal 로 지정되었을 때 Literal 이 가지는 값을 나타낸다. flag가 0으로 세팅되는 경우 Literal Value 가 기술되지 않고 넘어간다. flag가 1로 세팅되는 경우 Literal Value 의 길이를 8비트로 기술한다. 그리고 나서 Literal Value 를 하나씩 영문자로 기록한다. 각 영문자는 아스키 코드(Ascii code)로 표현될 수 있다.
Variable name은 이전 Kind 필드의 값이 Var 로 지정되었을 때 Variable 의 이름을 나타낸다. flag가 0으로 세팅되는 경우 Variable name 이 기술되지 않고 넘어간다. flag가 1로 세팅되는 경우 Variable name 의 길이를 8비트로 기술한다. 그리고 나서 Variable name 을 하나씩 영문자로 기록한다. 각 영문자는 아스키 코드(Ascii code)로 표현될 수 있다.
Operator는 표현식이 연산을 나타내는 경우 연산자를 나타낸다. flag가 0으로 세팅되는 경우 Operator 가 기술되지 않고 넘어간다. flag가 1로 세팅되는 경우 Operator 의 길이를 8비트로 기술한다. 그리고 나서 Operator 를 하나씩 영문자로 기록한다. 각 영문자는 아스키 코드(Ascii code)로 표현될 수 있다.
Child ET index는 표현식이 다른 표현식을 포함하게 되는 경우 하위 표현식에 대한 기술을 할 수 있다. flag가 0으로 세팅되는 경우 하위 표현식에 대한 ET 인덱스가 가 기술되지 않고 넘어간다. flag가 1로 세팅되는 경우 하위 표현식을 나타내는 ET 인덱스를 8비트로 기록한다.
Args ET index는 표현식이 인자를 포함하는 경우 인자에 대한 기술을 ET 인덱스로 나타낼 수 있다. flag가 0으로 세팅되는 경우 인자를 표현하기 위한 ET 인덱스가 기술되지 않고 넘어간다. flag가 1로 세팅되는 경우 인자를 표현하기 위한 ET 인덱스를 8비트로 기록한다.
ET 테이블은 다음과 같은 XML 텍스트형식으로 표현된다.
{
(Kind, [Literal-Kind], [value], [name], [Op], [Child-Expr(ET No.)] [Args-Expr(ET No.)]),
…
}
XML 형식을 지원하는 MPEG-4 SP에 대한 ET 테이블의 실시예는 다음과 같다.
ET
{
//0
("Literal", "Integer", "12", -, -, -, -),
("Literal", "Integer", "10", -, -, -, -),
("Literal", "Integer", "20", -, -, -, -),
("Literal", "Integer", "9", -, -, -, -),
("Literal", "Integer", "8", -, -, -, -),
//5
("Literal", "Integer", "13", -, -, -, -),
("Literal", "Integer", "2048", -, -, -, -),
("Literal", "Integer", "1024", -, -, -, -),
("Literal", "Integer", "512", -, -, -, -),
("Literal", "Integer", "31", -, -, -, -),
//10
("Literal", "Integer", "32", -, -, -, -),
("Literal", "Integer", "448", -, -, -, -),
("Literal", "Integer", "6", -, -, -, -),
("Literal", "Integer", "1", -, -, -, -),
("Literal", "Integer", "2", -, -, -, -),
//15
("Literal", "Integer", "4", -, -, -, -),
("Var", -, -, "MAXW_IN_MB", -, -, -),
("Var", -, -, "SAMPLE_COUNT_SZ", -, -, -),
("Var", -, -, "SAMPLE_SZ", -, -, -),
("Var", -, -, "MB_COORD_SZ", -, -, -),
//20
("Var", -, -, "BTYPE_SZ", -, -, -),
("Var", -, -, "NEWVOP", -, -, -),
("Var", -, -, "INTRA", -, -, -),
("Var", -, -, "INTER", -, -, -),
("Var", -, -, "QUANT_MASK", -, -, -),
//25
("Var", -, -, "ROUND_TYPE", -, -, -),
("Var", -, -, "FCODE_MASK", -, -, -),
("Var", -, -, "FCODE_SHIFT", -, -, -),
("Var", -, -, "ACPRED", -, -, -),
("Var", -, -, "ACCODED", -, -, -),
//30
("Var", -, -, "MOTION", -, -, -),
("Var", -, -, "FOURMV", -, -, -),
("Var", -, -, "MV_SZ", -, -, -),
("Literal", "Integer", "3", -, -, -, -),
("Var", -, -, "QUANT_SZ", -, -, -),
//35
("Var", -, -, "MAXH_IN_MB", -, -, -),
("Var", -, -, "PIX_SZ", -, -, -),
("Literal", "Integer", "...", -, -, -, -),
("Var", -, -, "FLAG_SZ", -, -, -),
("Var", -, -, "ADDR_SZ", -, -, -),
//40
("Var", -, -, "BUF_SZ", -, -, -),
("Var", -, -, "SEARCHWIN_IN_MB", -, -, -)
}
유형 테이블(Type Table, TT)은 Type Name, Entry Name, Expr index 및 Type index 필드를 포함한다.
이하, 신택스 파싱 테이블들에 대하여 설명한다.
CSCIT는 파싱 기능부가 SET 및 SRT를 이용한 프로세스의 결과 정보인 엘리먼트 정보(예를 들어, CSCI)에 대한 상세 정보가 기술된 것이다. 즉, CSCIT는 종래 비트스트림으로부터 처리되어 CSCI 저장부에 저장되고, 디코딩 기능부들에 의해 이용될 모든 의미있는 자료(즉, 엘리먼트 정보)들에 대한 정보를 가진다. CSCIT는 해당 엘리먼트 정보의 고유 번호로서 구분자인 인덱스(C), 플래그(flag), 해당 엘리먼트 정보의 이름(Element Name), 해당 엘리먼트 정보의 자료 구조적인 특성을 지정하기 위한 속성(예를 들어, 해당 엘리먼트 정보의 저장 공간 크기, 해당 엘리먼트 정보가 배열형(Array)인지 여부 등), 해당 엘리먼트 정보가 신택스 파싱 과정에서만 이용되는지 또는 전체적인 디코딩 과정에서 이용되는지를 나타내는 Global/Local 등을 포함한다. CSCIT는 textual description이나 binary description(비트 변환된 바이너리 코드 형태) 등의 기술 방식으로 기술될 수 있을 뿐 아니라, 상기 부분 디코더 디스크립션 중 필요한 최소한의 데이터가 유사 스크립트 언어로 기술될 수도 있다.
SET는 입력된 종래 비트스트림의 신택스(syntax)들에 대한 정보에 의해 구성된 디코더 디스크립션이다. SET는 각 신택스에 대한 인덱스(index), 엘리먼트 명칭(Element Name), 파라메터(Paramter) 및 SET-프로세스(process by SET-PROC) 정보를 포함한다. 여기서 인덱스는 SRT에서 사용되는 각 신택스를 구분하는 구분자(S)이다. 엘리먼트 명칭은 신택스의 이름으로, 신택스의 의미나 역할에 따라 명명될 수 있다. 파라메터는 SRT에 기술된 파싱 과정이 SET의 파싱 알고리즘을 호출할 때 인자 값으로 제공되며, 이 인자 값은 고정된 상수나 비트스트림으로부터 계산된 값, 또는 파싱 과정에서 도출된 자료를 저장하기 위한 버퍼 공간(예를 들어, CSCI 메모리)의 식별자일 수 있다. 파라메터를 통해 전달된 인자 값은 인덱스(P)를 통해 구분되며, 각 인자 값은 엘리먼트 정보(즉, CSCI 정보(C))로서, 획득한 데이터를 저장할 때 사용될 수 있으며, 추후 해당 엘리먼트 정보가 처리 과정에서 데이터로서 필요한 경우 다시 파라메터 인덱스(P)를 이용하여 해당 엘리먼트 정보가 리드(read)될 수 있다. 또한, 파라메터는 SRT에서 지정한 바에 따라 CSCI 정보(C) 뿐 아니라 상수 값을 나타낼 수도 있다. SET-프로세스는 각 비트스트림 신택스를 입력 받아 어떤 가공 절차를 거쳐 출력 데이터인 엘리먼트 정보를 생성할 것인지의 과정을 기술한다.
SET는 textual description이나 binary description(비트 변환된 바이너리 코드 형태) 등의 기술 방식으로 기술될 수 있을 뿐 아니라, 상기 부분 디코더 디스크립션 중 필요한 최소한의 데이터가 유사 스크립트 언어로 기술될 수도 있다.
다음으로, SRT는 종래 비트스트림 내의 각 신택스간의 연결 정보를 나타낸 것이다. 즉, SRT는 각 신택스를 호출하고 다음 신택스로 이동하도록 지시하는 정보를 가진다. 파싱 기능부는 SRT를 이용하여 종래 비트스트림을 읽어 들이거나 엘리먼트 정보가 CSCI 저장부에 저장 및/또는 갱신되는 순서를 규정한다.
SRT는 인덱스(R), 파라메터(P), 규칙 정보를 포함한다.
인덱스(R)은 각 연결 정보(Rule)를 구분하도록 한다. 신택스의 인덱스(S)는 특정 연결 인덱스에서 처리할 신택스를 지정하므로, 파싱 기능부(또는 syntax 파싱을 수행하는 기능부들)는 SET를 이용하여 해당 신택스에 대해 지정된 프로세스를 수행한다. 파라메터는 SRT에 기술된 파싱 과정이 계층적으로 하위 단계에 또 다른 SRT의 파싱 알고리즘을 호출할 때 인자 값으로 제공되며, 이 인자 값은 고정된 상수나 비트스트림으로부터 계산된 값, 또는 파싱 과정에서 도출된 자료를 저장하기 위한 버퍼 공간(예를 들어, CSCI 메모리)의 식별자일 수 있다. 파라메터를 통해 전달된 인자 값은 인덱스(P)를 통해 구분되며, 각 인자 값은 획득한 데이터를 저장할 때 사용될 수 있으며, 추후 해당 엘리먼트 정보가 처리 과정에서 데이터로서 필요한 경우 다시 파라메터 인덱스(P)를 이용하여 해당 엘리먼트 정보를 리드(read)될 수 있다. 또한 파라메터는 SRT에서 지정한 바에 따라 CSCI 정보(C) 뿐 아니라 상수 값을 나타낼 수도 있다. 규칙 정보는 신택스 파싱이 처리되는 과정을 기술한 것으로, 분기와 반복 등 제어 구문을 사용할 수 있으며 하위 계층에 또다른 SRT나 SET의 엘리먼트를 호출하여 신택스 파싱을 처리할 수 있다.
입력 데이터는 해당 연결 인덱스에서의 연결 제어를 위한 조건 판단에 사용될 엘리먼트 정보의 목록을 나타낸다.
분기의 수는 후속하는 신택스에 연결되어질 수 있는 경우의 수로서, 해당 연결 인덱스에서 가지는 분기 경로의 총 수를 나타낸다. 분기 정보는 분기의 수 만큼 필요한 분기 정보가 존재(#1, #2, #3… 등)하며, 다음에 어떤 연결 인덱스를 처리할 것인지를 결정하도록 하는 조건 판단 알고리즘이다. 분기 정보에 의해 어떤 순서에 따라 어떤 내용을 읽어 들일지가 직접적으로 판단될 수 있다. 분기의 수가 1인 경우에는 입력 데이터가 존재하지 않으며, 분기 정보에 지정된 연결 인덱스를 처리하기 위해 즉시 진행한다. 그러나, 분기의 수가 2 이상인 경우에는 조건 판단이 수행(조건문 이후에는 다음 번 연결 정보(R)로 구성됨)되고 상응하는 연결 인덱스를 처리하기 위해 진행한다.
파싱 기능부는 해당 연결 인덱스에서 정의한 신택스를 처리하여 CSCI 저장부를 갱신한 후, 갱신된 CSCI 저장부(532)의 엘리먼트 정보를 참조하여 읽어들인 후 분기 조건 판단에 활용한다. 이는 예를 들어, 인덱스 R0의 분기 정보의 분기 조건인 'C0==1'에서의 C0는 신택스 S0를 처리한 후의 엘리먼트 정보 C0이다.
SRT는 textual description이나 binary description(비트 변환된 바이너리 코드 형태) 등의 기술 방식으로 기술될 수 있을 뿐 아니라, 상기 부분 디코더 디스크립션 중 필요한 최소한의 데이터가 유사 스크립트 언어로 기술될 수도 있다.
마지막으로, DVT는 각 부호화기/복호화기에서 사용하는 허프만 테이블(Huffman table) 정보가 기록된 디코더 디스크립션이다. MPEG-1/2/4/AVC에서는 각 부호화 시 엔트로피 코딩(entropy coding)을 수행한다. 이 때 주로 허프만 코딩(Huffman coding) 방법이 이용되며, 이 경우 이용되는 정보가 허프만 테이블(Huffman table)이다. 통합 코덱을 구현하기 위해서는 각 복호 시 해당 복호화기에서 사용될 허프만 테이블(Huffman table) 정보가 제공되어야 한다. 따라서, 본 발명에 따른 디코딩 디스크립션 내에 신택스 파싱시 각 신택스(syntax)에 해당하는 허프만 테이블(Huffman table) 정보를 포함한다. 물론, 각 표준에 상응하는 허프만 테이블 정보가 이미 디스크립션 저장부에 기록되어 있는 경우 DVT의 전송은 생략되거나 코덱 번호(Codec #, 1120)와 프로파일 및 레벨 번호(Profile and level #, 1130)만이 포함될 수도 있을 것이다.
DVT는 각 허프만 테이블에 대한 이름(name), 허프만 코딩에 의해 압축되어 출력되는 실제 값(value) 및 압축된 실제 값이 종래 비트스트림에 저장될 때 사용되는 코드 값(code)을 포함한다. 예를 들어, MCBPC 값을 압축하여 3이란 실제 값(value)을 얻었다면, 허프만 테이블 매핑(Huffman table mapping) 작업(예를 들어, SET의 PROCESS 부분)에 의해 종래 비트스트림(316)에는 코드 값(code) 011이 기록된다. 다른 예로서, 앞서 예시한 SET의 인덱스 S77의 Process 부분에는 VLD[1]이라 기록되어 있어 VLD라는 함수를 호출하게 된다. 이 함수에 의해 미리 지정된 길이(고정길이 또는 가변 길이)만큼 종래 비트스트림(316)을 읽어 코드 값(code)값을 얻은 후 허프만 테이블 매핑(Huffman table mapping) 작업에 의해 상응하는 실제 값(value)을 얻을 수 있다. 이 때 사용되는 Huffman table은 [1], 즉 1번째 테이블인 CBPY이다.
DVT는 textual description이나 binary description(비트 변환된 바이너리 코드 형태) 등의 기술 방식으로 기술될 수 있을 뿐 아니라, 상기 디코더 디스크립션 중 필요한 최소한의 데이터가 유사 스크립트 언어로 기술될 수도 있다.
일 예로, DVT는 아래와 같이 textual description될 수 있다.
DVT{((0,1), (1,001), (2,010), (3,011), (4,0001), (5,000001), (6,000010), (7,000011), (8,000000001), (9,NULL)) ((0,0011), (1,00101), (2,00100), (3,1001), (4,00011),(5,0111), (6,000010), (7,1011), (8,00010), (9,000011), (10,0101), (11,1010), (12,0100), (13,1000), (14,0110), (15,11), (16,000000), (17,000001), (18,NULL)) ((0,011), (1,11), (2,10), (3,010), (4,001), (5,0001), (6,00001), (7,000001), (8,0000001), (9,00000001), (10,000000001), (11,0000000001), (12,00000000001), (13,NULL)) ((0,11), (1,10), (2,01), (3,001), (4,0001), (5,00001), (6,000001), (7,0000001), (8,00000001), (9,000000001), (10,0000000001), (11,00000000001), (12,000000000001), (13,NULL))...
다른 예로서, DVT는 아래와 같이 binary description될 수 있다.
0000001111111111111111111111111011111000011000110010001101000011011001000001001100000010011000001000110000011010010000000010000011111001000011001010010100101001000010010010010100011001000111001100000100010010110010100010001100000110010001010010010100010001000010010000010001100001011001100000000011000000100000111110001101100010110001010000110100001100100100000100101000010011000000100111000000101000000000010100100000000101010000000000101011000000000010000011111000101100010100001001000110010010000010010100001001100000010…
전술한 바와 같이, 본 발명에 따른 복호화기는 기본적으로 XML 기반, 즉 BSDL 기반 디코더 디스크립션을 이용하여 디코딩 프로세스가 처리되는 한편, 제2 실시예를 통하여 상술한 바와 같이, 바이너리 형태로 압축된 CDDL 기반 디코더 디스크립션을 입력받는 경우에도 이를 XML 기반(BSDL 기반) 디코더 디스크립션으로 변환하여 처리할 수 있다.
BSDL에 기반한 DD는 높은 가독성을 갖고 있기 때문에, DD를 기반으로 다양한 구현(Implementation)을 시도하고자 하는 개발자에게 적합한 방식으로 간주된다. 그러나 XML 기반인 BSDL 서식이 자체적으로 압축 기능을 갖고 있지 않기 때문에, DD의 실시간 전송이 필요한 환경에서는 용량 관계 상 비효율적일 수 있다. 따라서, 전술한 본 발명의 제2 실시예에서와 같이 보다 적은 용량으로 동일한 처리 과정을 표현하는 CDDL 서식을 이용해 BSDL을 표현함으로서, 실시간 환경이 필요로 하는 압축 효과를 이끌어 낼 수 있다.
CDDL과 BSDL 등 서로 다른 종류의 DD를 상호간의 방식으로 변환하기 위하여, 그 중간 형태 (Intermediate form) 로서 비트스트림 구문 목록을 활용할 수 있다. 이 목록은 표준 규격 문서에서 제시하는 것과 동일, 또는 유사한 형태로 제공되는 목록으로, 영상 비트스트림이 규격에 따라 내장하게 되면 다양한 구문 정보들의 내역과 비트 길이를 나타낸다. 모든 종류의 DD 서식은 표준에 정의된 규격에 준수하여 작성되었음이 자명하기 때문에, 표준 규격 문서의 형태로 정보를 추출해 냄으로서 서로 다른 종류의 DD 규격 간 변환을 보다 손쉽게 할 수 있다.
도 18은 비트스트림 구문 목록을 활용한 CDDL/BSDL 간 상호 변환 관계를 나타낸다.
CDDL로부터 구문 정보를 추출해 내기 위하여, 다음과 같은 간결한 규칙을 CDDL 기반 DD에 적용할 수 있다.
1. SRT의 구문 정보를 읽어들인다
A. 하위 SRT 요소 호출 (Rn();) : 비트스트림 상에서의 하위 구문 요소 집합 호출로 정의한다.
B. SET 요소 호출 (Sn();) : 각각의 개별 구문 요소로 판단한다.
C. 분기 및 반복문 : 그 조건을 그대로 목록 상에 보존한다.
2. SET 요소를 판독하여 비트스트림 관련 구문을 식별한다
A. READ 명령어: 고정된 비트 길이를 가진 구문 요소로 판단한다. 읽어들이는 비트의 길이는 해당 요소에 정의된 바, 또는 해당 요소를 호출하는 상위 SRT 명령어에서 정의한 바에 따른다. 만일 Byte-align 파라메터가 사용되었을 경우, 해당 구문을 start/end code로 간주한다.
B. SEEK 명령어: When be followed by IF condition in parent SRT element, it will be considered as nextbits() function.
C. 분기/반복문이 포함된 경우: 가변 길이를 가진 구문 요소로 판단한다.
D. VLD (Huffman/Golomb…) 명령어가 쓰인 경우 : 가변 길이를 가진 구문 요소로 판단한다.
E. 그 밖에 다수의 명령어가 결합된 경우: 가변 길이를 가진 구문 요소로 판단한다.
F. READ/SEEK/VLD 등 비트스트림을 읽는 명령어가 없는 경우: 해당 SET 요소는 비트스트림의 구성과 관계가 없는 것으로 간주되어, 처리 과정에서 무시된다.
3. 모든 CSCI 요소들은 비트스트림 상에서 출현하는 개별 구문 정보를 저장하기 위한 공간으로 간주한다.
상기 규칙을 적용하여 하기 표 4의CDDL 구문을 아래와 같이 XML 구문으로 변환할 수 있다.
표 4
Element name | Mnemonic | Bits |
do { | | |
CSCI_0 | bslbf | 32bit |
CSCI_1 | uimsbf | 8bit |
while (next_bits()==00 00 01 B2) { | | |
R3(); | | |
} | | |
R1(); | | |
} while (next_bits()==433) { | | |
CSCI_2 | bslbf | 32bit |
SET
{ ("READ P1 > P2;"),
("READ P1 B > P2;"),
("SEEK P1 > P2;"),
("SEEK P1 B > P2;")
}
SRT
{("
do {
S1(32, C0);
S0(8, C1);
S3(32,V0);
while(V0==434){
R3();
S3(32,V0);
}
R1();
S3(32,V0);
}while(V0!=433);
S1(32, C2);
")}
이제까지 본 발명에 따른 복호화 장치 및 비트스트림 복호화를 위한 구문 해석 방법을 설명함에 있어 MPEG-4를 중심으로 설명하였으나, MPEG-1, MPEG-2 및 이외의 동영상 부호화/복호화 표준에 아무런 제한없이 동일하게 적용할 수 있음은 당연하다.
또한, 각 디코더 디스크립션들에 포함되는 정보 역시 하나의 표준에 의한 디코딩 수행을 위한 기능부들의 연결 관계, 해당 기능부에 요구되는 처리 프로세스 등에 관한 정보만으로 기술되지 않고, 복수의 표준에 의한 디코딩 수행을 위한 정보로 기술될 수도 있음은 자명하다.
예를 들어, 확장 비트스트림에 포함된 인코딩된 비디오 데이터의 초기 복수의 프레임은 MPEG-2로 인코딩되고, 후속하는 복수의 프레임은 MPEG-4로 인코딩되며, 나머지 프레임은 MPEG-1으로 인코딩되었다고 가정하자. 이 경우, 인코딩된 비디오 데이터의 디코딩을 위해 디코더 디스크립션에 포함되는 디코더 디스크립션 정보들은 인코딩 방법을 달리하는 각 프레임들이 툴 박스(510)에 포함된 각 표준에 따른 기능부들이 유기적으로 결합되어 동작될 수 있도록 구현될 것임은 자명하다.
전술한 바와 같은 복호화 프로세서에서 해당 기능부들을 로드하고 재조합하여 디코더를 형성하기 위하여는 효율적이고 신속하게 기능부들을 구분하고 로드할 수 있는 메커니즘이 필요하다. 이하, 본 발명에 따른 기능부(FU)들의 구체적인 구분 식별 방법 및 툴박스의 상세 구성을 설명하기로 한다.
도 19는 본 발명의 일실시예에 따른 툴박스의 상세 구성을 나타내는 예시도이다.
도 19에 도시된 바와 같이, 본 발명에 따른 툴박스는 복수의 기능부들을 유형에 따라 저장/관리하기 위하여 별도로 구분된 복수의 툴박스의 집합으로 구성될 수 있다. 이하, 상기 복수의 툴박스의 집합을 툴박스 유닛이라 칭하기로 한다. 즉, 기능부들은 그 유형에 따라 툴박스 유닛 내에서 다수의 툴박스에 구분되어 저장/관리되며, 각각의 툴박스(Toolbox)는 툴박스 넘버(Tool Box Number, TBN)로 구분되고 식별되어 관리된다. 즉, 상기 툴박스 넘버는 일종의 툴박스 식별 정보이다.
즉, 본 발명에 따른 툴박스 유닛은 MPEG 비디오 복호화와 관련된 기능부들을 저장하는 MPEG 비디오 툴박스; MPEG 오디오 복호화와 관련된 기능부들을 저장하는 MPEG 오디오 툴박스; MPEG 그래픽 복호화와 관련된 기능부들을 저장하는 MPEG 그래픽스 툴박스; 및 시스템 복호화와 관련된 기능부들을 저장하는 시스템 툴박스(System toolbox)등 멀티미디어 복호화에 관련된 기능부로 구성될 수 있으며, 사용자가 별도로 정의한 사용자 정의 기능부(Customized FU)들을 저장하는 사용자 정의 툴박스를 더 포함할 수 있다. 본 실시예에서는 MPEG 표준화 형식에 따른 기능부들 및 그외 기타 사용자가 정의한 기능부들을 예시적으로 설명하고 있으나, 본 발명은 MPEG 부호화 포맷에 한정되는 것이 아니라 다양한 부호화 포맷에 자유롭게 적용될 수 있음은 당업자에게 자명하다 할 것이다.
상기 툴박스의 툴박스 넘버는 아래의 표 5와 같이 정의될 수 있다.
표 5
툴박스 넘버(Tool Box Number, TBN) | 툴박스(Toolbox) |
0 | MPEG video toolbox |
1 | MPEG audio toolbox |
2 | MPEG graphics toolbox |
3 | System toolbox |
4 | Customized toolbox |
5 | Reserved |
… | … |
n | Reserved |
상기 툴박스 유닛 및 툴박스들은 하나의 저장 수단 내에서 논리적으로 구분되어 구현될 수도 있고, 복수의 저장 수단으로 물리적으로 구분되어 구현될 수도 있다.
도 20은 본 발명의 일실시예에 따른 기능부 식별 정보(FUID)를 나타내는 예시도이다.
도 20에 도시된 바와 같이 본 발명에 따른 기능부 식별 정보(FUID)는 해당 기능부가 속하는 툴박스를 나타내는 툴박스 넘버(TBN) 필드 및 해당 기능부의 고유 식별 정보를 나타내는 FU 넘버(FU Number) 필드를 포함하여 구성된다.
상기 툴박스 넘버 필드는 4 비트로 구현되고, 상기 FU 넘버 필드는 28 비트로 구현될 수 있다. 28비트로 FU 넘버 필드를 구현함으로써, 268,435,456개의 기능부들을 하나의 툴박스에 저장하고 식별하여 이용할 수 있다.
상기 FUID는 위에서 언급하였던 VNT에서의 FUID 필드에 적용되는 등의 방법을 통해 디코더 디스크립션에 포함되어 표현될 수 있다. 또한, 동일한 의미의 정보를 담고 있는 XML 기반의 연결 제어 정보에서도, 디코더 구성에 사용되는 각 기능부를 지칭하는 데에 사용될 수 있음은 자명하다.
도 21은 본 발명에 따른 기능부 구분/식별 메커니즘을 설명하기 위한 개념도이다.
도 21을 참조하면, 복호화부의 BSDL 파서 또는 디코더 디스크립션 해석부는 수신된 디코더 디스크립션을 해석하여 기능부 식별 정보(FUID)(1950)을 추출하고, 디코더 형성부는 상기 기능부 식별 정보(FUID)(1950)로부터 디코더를 조합하는데 필요한 기능부들의 TBN 및 FU 넘버를 리딩하고, 리딩된 TBN 및 FU 넘버에 해당하는 기능부를 해당 툴박스로 요청하면, 요청된 기능부들은 디코딩 솔루션에 로딩되고 연결됨으로써 재조합 디코더를 형성하여 입력 데이터를 복호화한다.
예를 들어, 첫번째 FUID가 TBN이 0이고 FU 넘버가 69이므로, 툴박스 내의 MPEG 비디오 툴박스(MPEG video toolbox)(1910)에 저장된 기능부들 중에서 FU 넘버가 69인 기능부가 요청되어 로딩된다.
본 발명에 따른 복호화 장치는 다양한 코덱에 기반한 비트스트림을 복호하기 위하여 여러 종류의 비트스트림을 읽어 들이기 위한 비트스트림 신택스 파서와 각각의 정보들을 디코딩하기 위한 FU가 필요하다.
이 중 비트스트림의 처리 과정은 대부분의 종류의 비트스트림에 대해 구문 요소의 순서와 길이를 조정함으로써 비교적 일반화하여 처리하는 것이 가능하므로, 디코더 디스크립션과 같은 부가 정보를 보내는 것만으로 복호화 장치에서 처리할 수 있다. 하지만, 만일 부호화 장치에서 동영상을 인코딩 하는 데 사용한 특정 기능에 대응하는 FU가 복호화 장치에 존재하지 않을 경우, 해당 비트스트림을 디코딩하는 것은 불가능하다. 이러한 문제는 특히 MPEG에 제약받지 않는 사용자 정의 고덱(Customized Codec)을 사용할 경우에 발생할 수 있다.
이러한 문제를 해결하기 위하여 본 발명에서는 FU가 복호화 장치에 전달되는 메커니즘을 정의한다. 이하, 부호화 장치 측에서 부호화한 데이터를 복호하는데 필요한 FU를 송신하고, 이를 복호화 장치에서 수신하여 처리하는 또 다른 실시예들을 설명하기로 한다.
도 22는 본 발명의 또 다른 실시예에 따른 부호화 장치이고, 도 23은 본 발명의 또 다른 실시예에 따라 송신되는 비트스트림의 패킷 구성을 나타내는 예시도이다.
도 22에 도시된 바와 같이 본 발명의 또 다른 실시예에 따른 복호화 장치는 송신하고자 하는 비디오, 오디오 또는 멀리티미디어 데이터 등을 부호화하여 부호화된 데이터(encoded data)를 생성하는 부호화부(2110), 상기 부호화된 데이터를 복호하기 위한 디코더를 구성하는 기능부(FU)들 및 그 연결 관계 등을 기술하는 디코더 디스크립션을 생성하는 디코더 디스크립션 생성부(2120), 상기 디코더 디스크립션을 입력받아 상기 부호화된 데이터를 복호하기 위해 필요한 기능부(FU)들에 대한 정보인 FU 리스트를 생성하여 출력하는 FU 리스트 생성부(2140), 상기 기능부(FU)들을 저장하는 툴박스(2130), 상기 부호화된 데이터를 입력 받고, 입력받은 부호화된 데이터에 상응하는 디코더 디스크립션, FU 리스트 및 기능부(FU)들을 입력 받아 패킷화하여 출력하는 패킷화부(packetizing unit)(2150), 상기 패킷화부로부터 출력된 패킷들을 시스템 비트스트림으로 통합하여 생성하는 시스템 비트스트림 생성부(2160) 및 시스템 비트스트림을 송신하는 송신부(미도시)를 포함하여 구성될 수 있다.
부호화부(2110)는 도 2를 참조하여 설명한 호화기 등과 같은 종래의 표준 부호화기는 물론 사용자가 새로이 정의하는 비표준 부호화기 등이 적용될 수 있다.
디코더 디스크립션 생성부(2120)는 부호화된 데이터를 복호할 수 있는 디코더를 구성하는데 필요한 기능부들에 기능부 식별 정보(FUID) 목록 및 기능부들의 연결 관계, 기능부들의 입력 데이터, 신택스 정보, 신택스 연결 정보 등을 기술하며, 상기 기능부 식별 정보(FUID)는 툴박스 유닛 내에서 해당 기능부가 속하는 툴박스를 나타내는 툴박스 넘버(TBN) 필드 및 해당 기능부의 고유 식별 정보를 나타내는 FU 넘버(FU Number) 필드를 포함하여 구성된다.
툴박스(2130)의 구체적인 구성은 도 19를 참조하여 전술한 바와 같다. 그 기술적 요지를 요약하면, 툴박스(2130)는 복수의 기능부들을 유형에 따라 저장/관리하기 위하여 별도로 구분된 복수의 툴박스의 집합인 툴박스 유닛으로 구성되며, 기능부들은 그 유형에 따라 툴박스 유닛 내에서 다수의 툴박스에 구분되어 저장/관리되며, 각각의 툴박스(Toolbox)는 툴박스 넘버(Tool Box Number, TBN)로 구분되고 식별되어 관리된다. 상기 툴박스 넘버는 일종의 툴박스 식별 정보이다.
패킷화부(2150)는 부호화된 데이터와 그에 상응하는 디코더 디스크립션 및 FU들을 입력받고, 각각에 별도의 패킷 ID(PID)를 부여하여 패킷화한다. 도 23을 참조하면, 패킷화부(2150)에서 생성하는 패킷은 부호화된 데이터 패킷(3200), 디코더 디스크립션 패킷(3300), FU 리스트 패킷(3400) 및 기능부 패킷(3510, 3520, 3530, …)을 포함한다.
패킷화부(2150)는 입력된 부호화된 데이터를 소정의 패킷 아이디(PID 010)를 부여하여 부호화된 패킷(3200)으로 패킷화하고, 입력된 디코더 디스크립션을 소정의 패킷 아이디(PID 020)를 부여하여 디코더 디스크립션 패킷(3300)으로 패킷화한다.
한편, FU는 프로그램 구문으로 구현될 수 있는데, 이 경우 FU의 데이터 용량을 고려하여 본 실시예에서는 이를 FU 리스트 헤더와 분리하여 별도의 데이터로 전송한다. 즉, 부호화된 데이터에 상응하는 FU들(3510, 3520, 3530)에 각각 별도의 패킷 ID(PID 101, PID 102, PID 103)를 부여하여 각각 패킷화하고, 상기 FU 리스트 정보를 별도의 패킷 ID(100)를 부여하여 FU 리스트 패킷(3400)으로 패킷화한다. 상기 FU 리스트 패킷에는 부호화된 데이터를 복호화할 수 있는 디코더를 구성하는 FU들의 패킷에 대한 패킷 아이디 및 기능부 식별 정보(FUID)를 포함한다.
시스템 비트스트림 생성부(2160) 는 패킷화부에서 생성된 패킷들을 입력받아 전송용 비트스트림인 시스템 비트스트림(3600)으로 통합 생성한다. 부호화된 데이터 및 디코더 디스크립션에 부가하여 FU 정보(FU 리스트 패킷 및 FU 패킷)가 더 포함된 본 실시예의 비트스트림을 전술한 확장 비트스트림과 구별하기 위해 시스템 비트스트림(3600)이라 칭한다.
전술한 바와 같이, 본 실시예에 따른 시스템 비트스트림(System Bitstream) 내의 데이터 패킷들은 Packet ID (PID) 라 불리는 식별정보를 이용하여 식별된다. PID에 기반하여 방송 비트스트림 내에 존재하는 서로 다른 종류의 패킷에 선별적으로 접근하는 것은 종래에 다수의 채널 간 구분, 다중음성 방송에서 각 음성 스트림의 구별 등에 널리 사용되는 방법이다.
이러한 방법을 응용하여, 전송되고 있는 FU 리스트와 FU 자체를 분리함으로서, 수신 측은 현재 자신의 디코더에 구비되어 있는 FU과 전송된 FU 목록을 대조함으로서 자신이 구비하지 않은 FU의 목록을 손쉽게 도출해낼 수 있다.
도 24는 본 발명의 또 다른 실시예에 따라 방송 환경에서 데이터가 송수신되는 과정을 개념적으로 나타내는 예시도이다.
도 24에 도시된 바와 같이, 본 발명의 또 다른 실시예에 따른 부호화 장치 및 복호화 장치가 방송 환경에 적용되는 경우, 본 발명의 또 다른 실시예에 따른 부호화 장치를 포함하는 송신 장치(2100)는 본 발명의 또 다른 실시예에 따른 복호화 장치를 포함하는 수신 장치(2200)로 비디오, 오디오 및 멀티 미디어 데이터를 부호화한 부호화된 데이터, 디코더 디스크립션, 기능부(FU) 및 기타 부가 데이터(auxiliary data)를 방송 비트스트림에 포함하여 송신한다.
일방향 전송인 방송 환경에서는 수신 장치에 복호화 과정에 필요한 FU가 존재하는지의 여부를 확신할 수 없으므로, 방송 비트스트림의 일부분으로서 FU를 주기적으로 전송할 수 있다. FU를 주기적으로 전송하는 이유는 방송 수신자가 임의의 시간에 방송 서비스에 연결할 것이므로, 수신자가 동영상 비트스트림의 어느 지점에 연결할지 불분명하기 때문이다. .
도 25는 본 발명의 또 다른 실시예에 따른 복호화 장치의 구성도이다.
도 25에 도시된 바와 같이, 본 발명의 또 다른 실시예에 따른 복호화 장치는 패킷 처리부(depacketizing unit)(2210), 디코더 형성부(2220), 디코딩 솔루션(2230), 기능부 비교부(2240) 및 툴박스(2250)를 포함한다.
패킷 처리부(2210)는 수신된 비트스트림을 입력받아 패킷 유형별로 분리하여, 부호화된 데이터, 디코더 디스크립션, FU 리스트 및 FU를 출력한다.
기능부 비교부(2240)는 패킷 처리부(2210)로부터 FU 리스트를 입력받고, FU 리스트의 FU 식별정보를 추출하여 툴박스(2250)에 저장된 FU들의 FU 식별정보와 비교하여 신규한 FU가 수신되었는지 여부를 판단한다. 상기 판단 결과, 신규한 FU가 수신된 경우에는 해당 FU를 패킷 처리부(2210)로부터 입력받아 툴박스에 전달하여 툴박스(2250)가 신규 FU를 저장하도록 한다. 한편, 기능부 비교부(2240)는 툴박스에 이미 저장돼 있는 FU들은 별도의 처리 없이 무시함으로써 추가적인 처리 시간 소요를 최소화할 수 있다.
디코더 형성부(2220)는 디코더 디스크립션을 입력받아 해석하여, 상기 부호화된 데이터를 복호하는데 필요한 FU 들을 툴박스(2250)로부터 디코딩 솔루션(2230)으로 로딩하고 조합하여 재조합 디코더를 형성한다.
디코딩 솔루션(2230)은 부호화된 데이터를 입력받고, 상기 재조합 디코더를 통해 상기 부호화된 데이터를 복호화하여 출력한다.
전술한 복호화 장치는 PC 등의 환경에서 프로그램 메모리를 통해 구동되는 소프트웨어 방식일 수도 있고, STB/PVR/DVD-P등의 경우와 같이 고정된 칩셋에 기반한 하드웨어 또는 펌웨어 방식일 수도 있다. 어느 경우이든, 해당 환경하에서의 시스템은 외부로부터 추가로 전송된 FU를 읽어 들이고 이를 일시적 또는 항시적으로 저장해 두기 위한 적응적 툴 라이브러리 (Adaptive Tool Library) 구조의 툴박스(2250)를 가질 수 있다. 즉, 툴박스(2250)는 소프트웨어 환경에서는 외부 FU를 저장, 관리하기 위한 여분의 하드디스크/메모리 공간일 수 있고, 하드웨어 환경에서는 별도의 저장매체, Rewritable ROM, 또는 RAM등 가변 가능한 메모리 장치에 의해 구현할 수 있다.
본 실시예를 통해 부호화 측은 수신된 데이터를 복호하는데 필요한 FU를 수신할 수 있으며, 부호화 측은 비표준의 FU 및 사용자가 별도로 정의한 사용자 정의 FU를 이용하고 복호화 측에 제공할 수 있다.
이제까지 도 22내지 도 25를 참조하여 일방향 통신 구조인 방송 환경에서부호화된 데이터와 함께 FU가 제공되는 실시예를 설명하였다. 이하에서는 양방향 통신 환경에서 FU를 제공하는 본 발명의 또 다른 실시예에 따른 부호화 및 복호화 장치에 대하여 설명하기로 한다.
도 26은 본 발명의 또 다른 실시예에 따라 양방향 통신 환경에서 FU 및 부호화된 데이터가 송수신되는 과정을 개념적으로 나타내는 예시도이다.
도 26을 참조하면, 우선 본 발명의 또 다른 실시예에 따른 부호화 시스템이 전송 비트스트림을 전송한다(S4310). 상기 전송 비트스트림은 비디오, 오디오 또는 멀티미디어 데이터 등을 부호화한 부호화된 데이터와 상기 부호화된 데이터의 디코더 디스크립션 및 FU 리스트를 포함한다.
이어서, 복호화 시스템(4200)은 상기 전송 비트스트림을 수신하고, 수신된 전송 비트스트림에서 상기 부호화된 데이터, 디코더 디스크립션 및 FU 리스트를 분리 추출한 후, 상기 FU 리스트와 툴박스에 저장된 FU들과 비교하여(S4320), 신규 FU가 있는지 판단한다(S4330).
상기 판단 결과, 수신된 FU 리스트에 신규 FU가 없는 경우에는 수신된 디코더 디스크립션 및 툴박스에 저장된 FU들을 이용하여 디코더를 조합하고, 수신된 부호화된 데이터를 디코딩한다(S4360).
한편, 상기 판단 결과, 수신된 FU 리스트에 신규 FU가 있는 경우에는 부호화 시스템으로 신규 FU의 전송을 요청하는 FU 요청 신호를 송신한다(S4340).
이어서, 상기 FU 요청 신호를 수신한 부호화 시스템은 수신된 FU 요청 신호에 응답하여 요청된 FU 들을 포함하는 FU 전송 데이터를 송신하고(S4350), 복호화 시스템은 상기 FU 전송 데이터를 수신하고, 요청한 FU를 추출하여 툴박스에 저장한 후, 수신된 디코더 디스크립션 및 툴박스에 저장된 FU들을 이용하여 디코더를 조합하고, 수신된 부호화된 데이터를 디코딩한다(S4360).
본 실시예는 IPTV 등 송/수신이 가능한 환경에 적용 가능하다. 이러한 환경에서, 수신자는 자신이 전달받은 FU 리스트에 기반해 송신 측에 특정 FU의 전달을 요청할 수 있게 된다.
도 27은 도 26의 부호화 시스템의 일실시예 구성도이다.
도 27에 도시된 바와 같이, 부호화 시스템은, 부호화부(2110), 디코더 디스크립션 생성부(2120), 툴박스(2130), FU 리스트 생성부(2140), 패킷화부(2150), 전송 비트스트림 생성부(4160), FU 전송 데이터 생성부(4170), 통신부(4180) 및 FU 요청 신호 처리부(4190)을 포함하여 구성될 수 있다.
본 실시예의 상기 구성들 중에서 도 22를 참조하여 설명한 부호화 장치의 구성과 명칭 및 참조 부호가 동일한 것들은 그 기능 및 역할이 서로 동일한 구성이다. 따라서, 도 22와 동일한 구성에 대한 중복되는 설명은 생략하고 본 실시예의 특징적 구성의 기능 및 역할에 중점을 두고 상술하기로 한다.
패킷화부(2150)는 입력된 데이터를 고유의 패킷 아이디를 부여하여 패킷화하여 출력하는 구성으로서 그 기본적인 기능은 도 22를 참조하여 전술한 패킷화부(2150)와 동일하다. 다만, 본 실시예에 따른 구체적인 기능을 설명하면 다음과 같다. 패킷화부(2150)는 부호화부(2110)로부터 입력받은 부호화된 데이터, 디코더 디스크립션 생성부(2120)로부터 입력받은 디코더 디스크립션 및 FU 리스트 생성부(2140)으로부터 입력받은 FU 리스트를 각각 고유의 패킷 아이디를 부여하여 패킷화하고 전송 비트스트림 생성부(4160)로 출력한다. 또한, 패킷화부(2150)는 툴박스로부터 입력받은 기능부(FU)를 패킷화하여 FU 전송 데이터 생성부로 출력한다(4170). 이 때, 패킷화부(2150)는 FU 리스트 패킷을 생성하는 과정에서 FU 리스트에 포함된 FU 각각에 패킷 아이디를 부여하고 부여된 패킷 아이디 정보를 FU 리스트 패킷에 FU 식별정보와 매칭하여 포함시키며, FU 패킷을 생성하는 과정에서는 툴박스로부터 입력받은 FU에 대하여 FU 리스트 패킷을 생성하는 과정에서 부여된 패킷 아이디를 부여하여 패킷화한다.
전송 비트스트림 생성부(4160)은 패킷화부(4150_로부터 입력받은 패킷들을 통합하여 전송 비트스트림을 생성하여 출력한다(4160). 즉, 전송 비트스트림 생성부(4160)은 패킷화부(2150)로부터 부호화된 데이터 패킷, 디코더 디스크립션 패킷 및 FU 리스트 패킷을 입력받고 이들을 통합하여 전송 비트스트림을 생성하여 출력한다(4160). 상기 전송 비트스트림은 필요에 따라 부호화된 데이터 패킷, 디코더 디스크립션 패킷 및 FU 리스트 패킷 중 어느 하나 이상의 조합을 포함할 수 있다.
FU 전송 데이터 생성부(4170)는 패킷화부로부터 입력받은 기능부(FU)를 유무선 통신망을 통해 송신하기 위한 포맷인 FU 전송 데이터로 변환 생성하여 출력한다.
통신부는(4180)는 외부의 통신망과 데이터를 송수신하기 위한 구성으로서, 구체적으로는 상기 전송 비트스트림 또는 FU 전송 데이터를 입력받아 송신하고, 수신된 FU 요청 신호를 FU 요청 신호 처리부(4190)로 출력한다.
FU 요청 신호 처리부(4190)는 입력된 FU 요청 신호를 해석하여 FU 요청 신호에서 요청된 FU가 툴박스(2130_로부터 패킷화부(2150)로 출력되도록 한다.
도 28은 도 26의 복호화 시스템의 일실시예 구성도이다.
도 28에 도시된 바와 같이, 복호화 시스템은 통신부(4260), 패킷 처리부(2210), FU 리스트 처리부(4270), 기능부 요청부(4280), 디코더 형성부(2220), 디코딩 솔루션(2230) 및 툴박스(2250)를 포함하여 구성될 수 있다.
본 실시예의 상기 구성들 중에서 도 25를 참조하여 설명한 복호화 장치의 구성과 명칭 및 참조 부호가 동일한 것들은 그 기능 및 역할이 서로 동일한 구성이다. 따라서, 도 25와 동일한 구성에 대한 중복되는 설명은 생략하고 본 실시예의 특징적 구성의 기능 및 역할에 중점을 두고 상술하기로 한다.
통신부는(4260)는 외부의 통신망과 데이터를 송수신하기 위한 구성으로서, 구체적으로는 통신망을 통해 전송 비트스트림 또는 FU 전송 데이터를 수신하여 출력하고 FU 요청신호를 해당 부호화 시스템으로 송신한다.
패킷 처리부는(2210) 입력받은 데이터를 패킷 유형별로 분리하여 출력하는 구성으로서, 그 기본적인 기능은 도 25를 참조하여 전술한 패킷 처리부(2210)과 동일하다. 다만, 본 실시예에 따른 구체적인 기능을 설명하면 다음과 같다. 패킷 처리부(2210)는 입력된 전송 비트스트림을 패킷 아이디를 이용하여 디코더 디스크립션, 부호화된 데이터 및 FU 리스트로 분리 추출하여 출력한다. 이 때, 상기 디코더 디스크립션은 디코더 형성부(2220)로 입력되고, 부호화된 데이터는 디코딩 솔루션(2230)으로 입력되며 FU 리스트는 FU 리스 처리부(4270)으로 입력된다. 또한, 패킷 처리부(2210)는 FU 전송 데이터로부터 FU들을 각각 분리하여 툴박스(2250)로 출력한다. 이 때, 출력된 FU는 툴박스(2250)로 입력되어 저장된다.
FU 리스트 처리부(4270)는 입력된 FU 리스트에 포함된 기능부 식별정보를이용하여 툴박스(2250)에 저장된 FU 들과 비교하여 신규 FU가 FU 리스트에 포함되어 있는지 여부를 판단한다. FU 리스트 처리부(4270)는 상기 판단 결과, 신규 FU가 포함된 경우 신규 FU의 기능부 식별정보를 기능부 요청부로 출력하고, 상기 판단 결과, 신규 FU가 없는 경우에는 디코더 형성부(2220) 및 디코딩 솔루션(2230)이 디코딩 프로세스를 시작하도록 한다.
기능부 요청부(4280)는 입력된 기능부 식별정보를 이용하여 FU 요청 신호를 생성하여 통신부(4260)로 출력하여, 해당 부호화 시스템으로 송신하도록 한다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.