KR100813435B1 - Device and method for encoding/decoding bit-stream - Google Patents
Device and method for encoding/decoding bit-stream Download PDFInfo
- Publication number
- KR100813435B1 KR100813435B1 KR1020060101245A KR20060101245A KR100813435B1 KR 100813435 B1 KR100813435 B1 KR 100813435B1 KR 1020060101245 A KR1020060101245 A KR 1020060101245A KR 20060101245 A KR20060101245 A KR 20060101245A KR 100813435 B1 KR100813435 B1 KR 100813435B1
- Authority
- KR
- South Korea
- Prior art keywords
- decoding
- information
- bitstream
- layer
- description
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/24—Systems for the transmission of television signals using pulse code modulation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
도 1은 일반적인 복호화기의 구성을 개략적으로 나타낸 도면.1 is a diagram schematically showing a configuration of a general decoder.
도 2는 일반적인 부호화기의 구성을 개략적으로 나타낸 도면.2 is a diagram schematically illustrating a configuration of a general encoder.
도 3은 본 발명의 일 실시예에 따른 복호화기의 구성을 개략적으로 나타낸 도면.3 is a diagram schematically illustrating a configuration of a decoder according to an embodiment of the present invention.
도 4는 본 발명의 일 실시예에 따른 확장 비트스트림(Extended bit-stream)의 구성을 간략히 나타낸 도면. 4 is a diagram schematically illustrating a configuration of an extended bit-stream according to an embodiment of the present invention.
도 5는 본 발명의 일 실시예에 따른 디코딩부의 구성을 개략적으로 나타낸 도면.5 is a diagram schematically illustrating a configuration of a decoding unit according to an embodiment of the present invention.
도 6은 본 발명의 일 실시예에 따른 SYN 파서(Syntax Parser)의 구성을 개략적으로 나타낸 도면.FIG. 6 is a diagram schematically illustrating a configuration of a SYN parser according to an embodiment of the present invention. FIG.
도 7은 본 발명의 일 실시예에 따른 디코딩 처리부의 구성을 개략적으로 나타낸 도면. 7 is a diagram schematically illustrating a configuration of a decoding processing unit according to an embodiment of the present invention.
도 8은 본 발명의 바람직한 제1 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면.8 illustrates a configuration of an extended bitstream according to the first preferred embodiment of the present invention.
도 9는 본 발명의 바람직한 제2 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면.9 illustrates a configuration of an extended bitstream according to the second preferred embodiment of the present invention.
도 10은 본 발명의 바람직한 제3 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면.10 is a diagram showing the configuration of an extended bitstream according to the third preferred embodiment of the present invention.
도 11은 본 발명의 바람직한 제4 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면.11 is a diagram showing the configuration of an extended bitstream according to a fourth preferred embodiment of the present invention.
도 12는 본 발명의 바람직한 제5 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면.12 is a diagram showing the configuration of an extended bitstream according to the fifth preferred embodiment of the present invention.
도 13은 본 발명의 바람직한 제6 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면.13 is a diagram showing the configuration of an extended bitstream according to the sixth preferred embodiment of the present invention.
도 14는 본 발명의 바람직한 제7 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면.14 illustrates a configuration of an extended bitstream according to the seventh preferred embodiment of the present invention.
도 15는 본 발명의 바람직한 제8 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면.15 is a diagram showing the configuration of an extended bitstream according to an eighth preferred embodiment of the present invention.
도 16은 본 발명의 일 실시예에 따른 DHT(Decoding Hierarchy Table)에 의해 규정되는 계층 구조를 예시한 도면.FIG. 16 illustrates a hierarchical structure defined by a decoding hierarchy table (DHT) according to an embodiment of the present invention. FIG.
도 17은 본 발명의 일 실시예에 따른 S-RT(Syntax Rule Table)에 의해 규정되는 계층간 호출 구조 및 계층내 연결 구조를 예시한 도면.FIG. 17 is a diagram illustrating an inter-layer call structure and an intra-layer connection structure defined by a Syntax Rule Table (S-RT) according to an embodiment of the present invention. FIG.
도 18은 본 발명의 일 실시예에 따른 복수 표준에 적용되는 기능부를 위한 인터페이스 세트를 설명하기 위한 도면. 18 is a diagram for explaining an interface set for a functional unit applied to a plurality of standards according to an embodiment of the present invention.
도 19는 본 발명의 일 실시예에 따른 각 계층별 노드들간의 전용 버퍼 공간의 연결 구조를 나타낸 도면.19 is a diagram illustrating a connection structure of dedicated buffer spaces between nodes of each layer according to an embodiment of the present invention.
도 20은 본 발명의 일 실시예에 따른 CSCI 데이터의 저장을 위한 전용 버퍼 공간의 포함 관계를 나타낸 도면.FIG. 20 is a view illustrating a inclusion relationship of a dedicated buffer space for storing CSCI data according to an embodiment of the present invention. FIG.
도 21은 본 발명의 일 실시예에 따른 기능부에 의한 출력 데이터의 저장을 위한 전용 버퍼 공간의 포함 관계를 나타낸 도면.FIG. 21 is a view illustrating a inclusion relationship of a dedicated buffer space for storing output data by a functional unit according to an embodiment of the present invention; FIG.
도 22는 본 발명의 일 실시예에 따른 syntax 파싱 및 데이터 디코딩의 병렬 처리를 개념적으로 나타낸 도면.FIG. 22 conceptually illustrates parallel processing of syntax parsing and data decoding according to an embodiment of the present invention. FIG.
본 발명은 통합 코덱에 관한 것으로서, 보다 상세하게는 비트스트림 인코딩/디코딩 방법 및 장치에 관한 것이다.The present invention relates to an integrated codec, and more particularly to a method and apparatus for bitstream encoding / decoding.
일반적으로 동영상은 부호화기(encoder)에 의해 비트스트림(Bit-stream) 형태로 변환된다. 이때, 비트스트림은 부호화기의 제약 조건을 만족하는 부호화 유형에 따라 저장된다. In general, a video is converted into a bitstream by an encoder. In this case, the bitstream is stored according to an encoding type satisfying the constraint of the encoder.
MPEG은 비트스트림의 제약 조건으로서 구문(syntax, 이하 'syntax'라 칭함) 및 의미(semantics, 이하 'semantics'라 칭함)를 요구한다. MPEG requires syntax (hereinafter referred to as 'syntax') and semantics (hereinafter referred to as 'semantics') as constraints of the bitstream.
syntax는 데이터의 구조나 형식 및 길이를 나타내며, 데이터가 어떤 순서로 표현되는지를 나타낸다. 즉, syntax는 부호화(encoding)/복호화(decoding) 작업을 위한 문법을 맞추기 위한 것으로, 비트스트림에 포함된 각 요소들(elements)의 순서와 각 요소의 길이, 데이터 형식 등을 정의한다. syntax indicates the structure, format, and length of the data, and in what order the data is represented. That is, syntax is to fit a grammar for encoding / decoding, and defines the order of each element included in the bitstream, the length of each element, and the data format.
Semantics는 데이터를 구성하는 각 비트가 의미하는 뜻을 나타낸다. 즉, semantics는 비트스트림 내의 각 요소들의 의미가 무엇인지를 나타낸다.Semantics means what each bit of data means. That is, semantics indicates what the meaning of each element in the bitstream is.
따라서, 부호화기의 부호화 조건 또는 적용된 표준(또는 코덱)에 따라 다양한 형태의 비트스트림이 생성될 수 있다. 일반적으로 각 표준(예를 들어 MPEG-1, MPEG-2, MPEG-4, MPEG-4 AVC 등)은 각각 상이한 비트스트림 syntax를 가진다. Therefore, various types of bitstreams may be generated according to encoding conditions of an encoder or an applied standard (or codec). In general, each standard (eg MPEG-1, MPEG-2, MPEG-4, MPEG-4 AVC, etc.) has a different bitstream syntax.
따라서, 각 표준이나 부호화 조건에 따라 부호화된 비트스트림은 각각 다른 형식(즉, syntax 및 semantics)을 가진다고 할 수 있으며, 해당 비트스트림의 복호화를 위해서는 부호화기에 대응되는 복호화기가 사용되어야 한다. Accordingly, bitstreams encoded according to each standard or encoding condition may have different formats (ie, syntax and semantics), and a decoder corresponding to an encoder should be used to decode the bitstream.
상술한 바와 같이, 종래의 비트스트림 복호화기는 부호화기의 제약 조건을 만족하여야 하는 제한이 있었으며, 이러한 제한은 복수의 표준에 대응되는 통합 복호화기를 구현하기 어려운 원인이 된다.As described above, the conventional bitstream decoder has a limitation of satisfying the constraints of the encoder, and this limitation causes a difficulty in implementing an integrated decoder corresponding to a plurality of standards.
따라서 본 발명은 상술한 문제점을 해결하기 위한 것으로, 각 표준(예를 들어, MPEG-1, MPEG-2, MPEG-4, MPEG-4 AVC 등)에 따른 다양한 형식(syntax, semantics)으로 부호화된 비트스트림을 동일한 정보 인식 방식으로 복호화(decoding)할 수 있는 비트스트림 디코딩 방법 및 장치를 제공하는 것이다.Accordingly, the present invention is to solve the above-described problem, and is encoded in various formats (syntax, semantics) according to each standard (for example, MPEG-1, MPEG-2, MPEG-4, MPEG-4 AVC, etc.) Disclosed is a method and apparatus for decoding a bitstream capable of decoding the bitstream in the same information recognition scheme.
본 발명의 다른 목적은 각 표준에 따른 다양한 형식(syntax, semantics)으로 부호화된 비트스트림을 동일한 정보 인식 방식으로 복호화(decoding)할 수 있도록 디코딩 디스크립션(Decoder Description)을 부가한 확장 비트스트림을 생성하는 비트스트림 인코딩 방법 및 장치를 제공하는 것이다.Another object of the present invention is to generate an extended bitstream to which a decoding description is added so that a bitstream encoded in various formats (syntax, semantics) according to each standard can be decoded in the same information recognition scheme. To provide a bitstream encoding method and apparatus.
본 발명의 또 다른 목적은 다양한 부호화 방식으로 압축된 비트스트림이 동일한 정보 분석 방법에 의해 파싱(parsing)되고, 파싱된 데이터를 이용하여 복호화를 위한 각 기능부(FU, Functional Unit)들이 유기적으로 제어되는 비트스트림 디코딩 방법 및 장치를 제공하는 것이다. It is still another object of the present invention to parse a bitstream compressed by various encoding schemes by the same information analysis method, and to control organically each functional unit (FU) for decoding using the parsed data. The present invention provides a method and apparatus for decoding a bitstream.
본 발명의 또 다른 목적은 코덱이 가진 계층 구조를 syntax 파싱 및 디코딩 과정에 응용함으로써 보다 효율적으로 디코딩 디스크립션을 기술할 수 있도록 하는 비트스트림 인코딩 방법 및 장치를 제공하는 것이다.It is still another object of the present invention to provide a bitstream encoding method and apparatus for more efficiently describing a decoding description by applying a hierarchical structure of a codec to a syntax parsing and decoding process.
본 발명의 또 다른 목적은 디코딩 디스크립션을 이용하여 각 코덱의 스케쥴링(scheduling) 관리와 각 기능부들의 유기적 처리 구조(예를 들어, 병렬 결합 구조, 직렬 병합 구조, 독립 처리 구조, 개별적 처리 구조 등)를 제시할 수 있는 비트스트림 디코딩 방법 및 장치를 제공하는 것이다.Still another object of the present invention is to use scheduling description of each codec to manage scheduling and organic processing structure of each functional unit (eg, parallel combining structure, serial merging structure, independent processing structure, and individual processing structure). It is to provide a method and apparatus for decoding a bitstream that can present.
본 발명의 또 다른 목적은 기술된 디코딩 디스크립션만으로 다양한 시스템 설계 및 구축이 가능한 비트스트림 인코딩 방법 및 장치를 제공하는 것이다.It is still another object of the present invention to provide a bitstream encoding method and apparatus capable of designing and building various systems with only the described decoding description.
본 발명의 또 다른 목적은 다양한 형태의 비트스트림을 복호화하기 위한 syntax 해석 방법을 공통적으로 적용할 수 있는 비트스트림 인코딩/디코딩 방법 및 장치를 제공하는 것이다.It is still another object of the present invention to provide a bitstream encoding / decoding method and apparatus for applying a syntax analysis method for decoding various types of bitstreams in common.
본 발명의 또 다른 목적은 다양한 형태의 비트스트림을 공통된 Syntax 해석 방법으로 파싱할 수 있도록 하기 위한 새로운 명령어들의 집합을 적용할 수 있는 비트스트림 인코딩/디코딩 방법 및 장치를 제공하는 것이다.It is still another object of the present invention to provide a bitstream encoding / decoding method and apparatus capable of applying a new set of instructions for parsing various types of bitstreams using a common syntax analysis method.
본 발명의 또 다른 목적은 syntax 엘리먼트의 변경이나 추가, 삭제 시에도 복호화기가 용이하게 비트스트림을 복호화할 수 있는 비트스트림 디코딩 방법 및 장치를 제공하는 것이다.It is still another object of the present invention to provide a bitstream decoding method and apparatus capable of easily decoding a bitstream even when a syntax element is changed, added, or deleted.
본 발명의 또 다른 목적은 해석된 syntax의 엘리먼트 정보(element information, 즉 syntax 파싱에 의한 결과물)를 비트스트림 복호화를 위해 이용되는 구성 요소들이 이용할 수 있도록 하는 비트스트림 디코딩 방법 및 장치를 제공하는 것이다.It is still another object of the present invention to provide a bitstream decoding method and apparatus for making element information (ie, a result of parsing a syntax) of an interpreted syntax available to components used for bitstream decoding.
본 발명의 또 다른 목적은 이미 해석된 syntax의 엘리먼트 정보를 후속하는 비트스트림 syntax 엘리먼트의 해석을 위해 이용할 수 있도록 하는 비트스트림 디코딩 방법 및 장치를 제공하는 것이다.It is yet another object of the present invention to provide a bitstream decoding method and apparatus which makes it possible to use element information of an already parsed syntax for interpretation of subsequent bitstream syntax elements.
본 발명의 또 다른 목적은 여러 표준(코덱)에서 제안하는 다양한 디코딩 과정에 포함된 기능들을 각기 기능부(FU, Functional Unit)대로 분할하여 툴박스(tool box)에 구비하는 비트스트림 디코딩 방법 및 장치를 제공하는 것이다.It is still another object of the present invention to provide a method and apparatus for decoding a bitstream including functions in a tool box by dividing functions included in various decoding processes proposed by various standards (codecs) into functional units (FU). To provide.
본 발명의 또 다른 목적은 다양한 형태로 부호화된 비트스트림을 복호화하기 위해 툴박스에서 필요한 기능부들만을 선별적으로 이용하는 비트스트림 디코딩 방법 및 장치를 제공하는 것이다.It is still another object of the present invention to provide a method and apparatus for decoding a bitstream selectively using only functional units required by a toolbox to decode a bitstream encoded in various forms.
본 발명의 또 다른 목적은 툴박스에 저장된 기능부의 변경이나 추가, 삭제가 용이한 비트스트림 디코딩 방법 및 장치를 제공하는 것이다.It is still another object of the present invention to provide a bitstream decoding method and apparatus that is easy to change, add, or delete a functional part stored in a toolbox.
또한, 본 발명의 또 다른 목적은 비트스트림 복호화를 위한 코덱 통합, 비트스트림이 동일한 정보 분석 방법에 의해 처리되도록 하기 위한 디코딩 디스크립션의 생성 및 확장 비트스트림의 구현에 대한 국제 표준화에 있으며, 그 외의 다른 본 발명의 목적들은 이하에 서술되는 바람직한 실시예를 통하여 보다 명확해질 것이다.It is still another object of the present invention to integrate codecs for bitstream decoding, to generate decoding descriptions for the bitstreams to be processed by the same information analysis method, and to internationally standardize the implementation of extended bitstreams. The objects of the present invention will become more apparent through the preferred embodiments described below.
상술한 목적을 달성하기 위하여 본 발명의 일 측면에 따르면, 다양한 표준에 범용적으로 이용될 수 있는 부호화기/복호화기 및/또는 통합 코덱 장치가 제공된다.According to an aspect of the present invention to achieve the above object, there is provided an encoder / decoder and / or integrated codec device that can be used universally in various standards.
본 발명의 일 실시예에 따른 복호화 장치는 테이블 정보 저장부; 부호화기로부터 수신된 디코딩 디스크립션에 상응하는 n(임의의 자연수)개의 테이블 정보(table information)을 생성하여 상기 테이블 정보 저장부에 저장하는 디스크립션 디코더; 상기 테이블 정보 저장부에 저장된 상기 테이블 정보를 이용하여 상기 부호화기로부터 수신된 비트스트림에 포함된 인코딩된 비디오 데이터를 상응하는 동영상 데이터로 디코딩하여 출력하는 디코딩부를 포함할 수 있다.Decoding apparatus according to an embodiment of the present invention comprises a table information storage unit; A description decoder for generating n (random natural numbers) table information corresponding to the decoding description received from the encoder and storing the table information in the table information storage unit; The decoder may include a decoder configured to decode encoded video data included in a bitstream received from the encoder into corresponding video data by using the table information stored in the table information storage unit.
상기 디코딩부는, 미리 지정된 프로세스를 처리하도록 각각 구현된 복수의 기능부를 포함하는 툴 박스; 및 하나 이상의 기능부에 의한 프로세스 수행에 의해 생성된 CSCI(Control Signal/Context Information) 정보, 디코딩 처리를 위한 데이 터 중 하나 이상을 저장하는 저장부를 포함할 수 있다. 여기서, 상기 복수의 기능부는 비트스트림의 신택스 파싱(syntax parsing)을 위한 하나 이상의 파싱 기능부, 상기 인코딩된 비디오 데이터의 디코딩 처리를 위한 복수의 디코딩 기능부를 포함할 수 있다. 또한, 상기 디코딩 기능부들은 상기 인코딩된 비디오 데이터의 계층 구조에 부합되어 활성화 또는 호출 여부가 결정될 수 있다.The decoding unit may include a tool box including a plurality of functional units each implemented to process a predetermined process; And a storage unit for storing one or more of CSCI (Control Signal / Context Information) information generated by process execution by one or more functional units and data for decoding processing. Here, the plurality of functional units may include one or more parsing functional units for syntax parsing of the bitstream, and a plurality of decoding functional units for decoding processing of the encoded video data. In addition, the decoding functions may determine whether to activate or call in accordance with the hierarchical structure of the encoded video data.
상기 계층 구조는 시퀀스 층, GOP 층, 픽쳐 층, 슬라이스 층, 매크로블록 층, 블록 층 중 하나 이상의 층들로 구성되며, 하위 계층이 상위 계층에 의해 호출될 수 있다.The hierarchical structure is composed of one or more layers of a sequence layer, a GOP layer, a picture layer, a slice layer, a macroblock layer, a block layer, and a lower layer may be called by an upper layer.
상기 복수의 기능부들 각각은 상기 비트스트림의 디코딩을 위해 각각의 복호화 표준들에 의해 제안된 각각의 기능을 독립적으로 수행되도록 구현될 수 있다.Each of the plurality of functional units may be implemented to independently perform each function proposed by respective decoding standards for decoding the bitstream.
상기 디코딩 기능부 각각은 미리 지정된 프로세스의 수행을 위해 필요한 CSCI 정보 및 디코딩 처리를 위한 데이터가 상기 저장부에 저장됨으로써 동작 개시될 수 있다.Each of the decoding functions may be started by storing CSCI information necessary for performing a predetermined process and data for decoding processing in the storage.
상기 디코딩 기능부 각각을 위한 전용 저장 공간이 할당될 수 있다.Dedicated storage space for each of the decoding functions may be allocated.
상기 저장부는, 상기 파싱 기능부에 의해 생성된 CSCI 정보(Control Signal/Context Information)가 저장되는 CSCI 저장부; 및 상기 파싱 기능부에 의해 생성된 상기 인코딩된 비디오 데이터에 상응하는 데이터, 상기 디코딩 기능부에 처리된 처리 데이터 중 하나 이상인 디코딩 처리를 위한 데이터가 저장되는 데이터 저장부를 포함할 수 있다.The storage unit may include a CSCI storage unit for storing CSCI information (Control Signal / Context Information) generated by the parsing function unit; And a data storage unit for storing data corresponding to the encoded video data generated by the parsing unit and data for decoding processing, which is one or more of processing data processed by the decoding unit.
상기 테이블 정보 저장부에 저장되는 테이블 정보는, 상기 인코딩된 비디오 데이터의 디코딩을 위한 계층 구조와 각 계층별 하위 계층에 관한 정보를 나타내는 DHT(Decoding Hierarchy Table); 비트스트림 신택스(syntax)에 대한 정보 및 상기 비트스트림 신택스에 상응하는 엘리먼트 정보를 생성하기 위한 프로세스를 나타내는 SET(Syntax Element Table); 상기 비트스트림 신택스간의 연결 정보, 각 계층별 호출할 하위 계층에 관한 정보 및 상기 SET의 프로세스 수행에 의해 생성된 결과 데이터가 저장될 CSCI 정보의 명칭을 지정하는 S-RT(Syntax Rule Table); 계층 구조별 CSCI 정보에 대한 상세 정보를 나타내는 CSCIT(Control Signal and Context Information Table); 상기 계층 구조에 기반하여 복수의 디코딩 기능부들간의 호출 또는 활성화 순서를 나타내는 F-RT(FU Rule Table); 상기 디코딩 기능부들의 리스트를 나타내는 FL(FU List); 및 상기 디코딩 기능부가 프로세스 수행을 위해 필요한 CSCI 정보를 나타내는 FU-CSCIT를 포함할 수 있다.The table information stored in the table information storage unit may include: a Decoding Hierarchy Table (DHT) indicating a hierarchical structure for decoding the encoded video data and information about lower layers of each layer; A Syntax Element Table (SET) indicating a process for generating information on bitstream syntax and element information corresponding to the bitstream syntax; A Syntax Rule Table (S-RT) that specifies the name of the connection information between the bitstream syntaxes, information on lower layers to be called for each layer, and CSCI information to store result data generated by the process of the SET; Control Signal and Context Information Table (CSCIT) indicating detailed information on CSCI information for each hierarchical structure; An FU Rule Table (F-RT) indicating a call or activation order among a plurality of decoding functions based on the hierarchical structure; FL (FU List) representing the list of decoding functions; And the FU-CSCIT indicating the CSCI information necessary for performing the process by the decoding function unit.
상기 테이블 정보 저장부에 저장되는 테이블 정보는, 엔트로피 코딩(entropy coding)시의 실제 값과 코드값의 관계를 나타내는 DVT(Default Value Table)를 더 포함할 수 있다.The table information stored in the table information storage unit may further include a default value table (DVT) indicating a relationship between an actual value and a code value during entropy coding.
상기 디코딩부는, 상기 F-RT를 이용하여 최상위 계층에 해당하는 하나 이상의 디코딩 기능부의 활성화 또는 호출을 제어하는 디코딩 제어부를 더 포함할 수 있다.The decoding unit may further include a decoding control unit for controlling activation or calling of one or more decoding functions corresponding to a highest layer using the F-RT.
상기 파싱 기능부는 적어도 상기 SET, 상기 S-RT, 및 상기 CSCIT를 이용하여 상기 CSCI 정보와 디코딩될 데이터 중 하나 이상을 생성할 수 있다.The parsing function may generate at least one of the CSCI information and the data to be decoded using at least the SET, the S-RT, and the CSCIT.
상기 디코딩 기능부는 적어도 상기 FL, 상기 F-RT, 상기 FU-CSCIT 및 상기 CSCIT를 이용하여 미리 지정된 프로세스를 수행할 수 있다.The decoding function unit may perform a predetermined process using at least the FL, the F-RT, the FU-CSCIT, and the CSCIT.
상기 부호화기로부터 상기 디코딩 디스크립션 및 상기 비트스트림이 통합된 확장 비트스트림이 수신되는 경우, 상기 디코딩 디스크립션 및 상기 비트스트림을 분리하기 위한 분리부를 더 포함할 수 있다.When the decoding description and the extended bitstream in which the bitstream is integrated are received from the encoder, the decoder may further include a separation unit for separating the decoding description and the bitstream.
상기 디코딩 디스크립션은 하나 이상의 테이블 영역으로 구성되고, 각 테이블 영역에는 상기 테이블을 구성하기 위한 테이블 정보가 삽입될 수 있다.The decoding description may include one or more table areas, and table information for configuring the table may be inserted into each table area.
상기 테이블 정보는 상기 비트스트림을 복호화하기 위한 코덱 번호(Codec No.), 프로파일 및 레벨 번호(Profile and level No.)에 상응하는 지정 정보를 포함하고, 상기 디스크립션 디코더는 상기 테이블 정보 저장부에 미리 저장된 복수의 테이블들 중 상기 지정 정보에 상응하는 n개의 테이블들을 추출할 수 있다.The table information includes designation information corresponding to a codec number (Codec No.), a profile and a level number (Profile and level No.) for decoding the bitstream, and the description decoder is configured in advance in the table information storage unit. Among the plurality of stored tables, n tables corresponding to the designated information may be extracted.
상기 n개의 테이블 영역에 각각 삽입되는 테이블 정보는 각각의 테이블을 구성하기 위한 바이너리 코드 정보를 포함하고, 상기 디스크립션 디코더는 상기 바이너리 코드 정보를 이용하여 n개의 테이블들을 생성하여 상기 테이블 정보 저장부에 저장할 수 있다.The table information inserted into each of the n table areas includes binary code information for constituting each table, and the description decoder generates n tables using the binary code information and stores them in the table information storage unit. Can be.
상기 n개의 테이블 영역 중 m(임의의 자연수)개의 테이블 영역에는 상응하는 테이블에 대한 코덱 번호(Codec No.)와 프로파일 및 레벨 번호(Profile and level No.)에 상응하는 지정 정보가 포함되고, k(n-m인 임의의 수)개의 테이블 영역에는 상응하는 테이블을 구성하기 위한 바이너리 코드 정보를 포함되며, 상기 디스크립션 디코더는 상기 테이블 정보 저장부에 미리 저장된 복수의 테이블들 중 상기 지정 정보에 상응하는 m개의 테이블들을 추출하고, 상기 바이너리 코드 정보를 이용 하여 k개의 테이블들을 생성하여 상기 테이블 정보 저장부에 저장할 수 있다.M (arbitrary natural numbers) of the n table areas include designation information corresponding to a codec number (Codec No.) and a profile and level number (Profile and level No.) for a corresponding table. The table area (any number of nm) includes binary code information for configuring a corresponding table, and the description decoder includes m pieces corresponding to the designated information among a plurality of tables previously stored in the table information storage unit. Tables may be extracted, k tables may be generated using the binary code information, and stored in the table information storage unit.
본 발명의 바람직한 다른 실시예에 따른 복호화 장치는, 테이블 저장부; 부호화기로부터 수신된 디코딩 디스크립션에 상응하는 n(임의의 자연수)개의 테이블 정보(table information)을 생성하여 상기 테이블 저장부에 저장하는 디스크립션 디코더; 상기 테이블 정보 저장부에 저장된 상기 테이블 정보를 이용하여 상기 부호화기로부터 수신된 비트스트림에 포함된 인코딩된 비디오 데이터를 상응하는 동영상 데이터로 디코딩하여 출력하기 위하여 각각 수행할 프로세스가 미리 지정된 복수의 기능부 및 각 기능부들에 의한 처리 데이터를 저장하기 위한 정보 저장부를 포함하는 디코딩부; 및 상기 인코딩된 비디오 데이터의 계층 구조에 부합되어 최상위 계층에 속하는 기능부들의 활성화 또는 호출을 수행하는 디코딩 제어부를 포함할 수 있다. 여기서, 상기 계층 구조에 부합하여 제1 계층의 수행을 위한 처리 데이터가 상기 정보 저장부에 저장되면 활성화된 상태인 제2 계층에 의해 상기 제1 계층이 호출될 수 있다. 호출된 계층의 디코딩 기능부는 지정된 프로세스의 수행을 위한 처리 데이터가 상기 정보 저장부에 저장되면 처리를 개시할 수 있다.Decoding apparatus according to another embodiment of the present invention, the table storage unit; A description decoder for generating n (random natural numbers) table information corresponding to the decoding description received from the encoder and storing the table information in the table storage unit; A plurality of functional units, each of which has a predetermined process to be performed to decode and output encoded video data included in a bitstream received from the encoder into corresponding video data using the table information stored in the table information storage unit; A decoding unit including an information storage unit for storing processing data by each of the functional units; And a decoding controller configured to conform to the hierarchical structure of the encoded video data and to activate or call the functional units belonging to the highest layer. Here, when the processing data for performing the first layer is stored in the information storage unit in accordance with the hierarchical structure, the first layer may be called by the second layer which is in an activated state. The decoding function of the called layer may start processing when processing data for performing a designated process is stored in the information storage unit.
상기 복수의 기능부는 비트스트림의 신택스 파싱(syntax parsing)을 위한 하나 이상의 파싱 기능부, 상기 인코딩된 비디오 데이터의 디코딩 처리를 위한 복수의 디코딩 기능부를 포함할 수 있다. 여기서, 상기 정보 저장부에 저장되는 처리 데이터는 하나 이상의 기능부에 의한 프로세스 수행에 의해 생성된 CSCI(Control Signal/Context Information) 정보, 디코딩 처리를 위한 데이터 중 하나 이상을 포함할 수 있다.The plurality of functional units may include one or more parsing functions for syntax parsing of a bitstream, and a plurality of decoding functions for decoding processing of the encoded video data. In this case, the processing data stored in the information storage unit may include one or more of CSCI (Control Signal / Context Information) information generated by a process performed by one or more functional units and data for decoding processing.
상기 디코딩 기능부들은 상기 인코딩된 비디오 데이터의 계층 구조에 부합되어 활성화 또는 호출 여부가 결정될 수 있다.The decoding functions may be activated or called according to the hierarchical structure of the encoded video data.
상기 계층 구조는 시퀀스 층, GOP 층, 픽쳐 층, 슬라이스 층, 매크로블록 층, 블록 층 중 하나 이상의 층들로 구성되며, 하위 계층이 상위 계층에 의해 호출될 수 있다.The hierarchical structure is composed of one or more layers of a sequence layer, a GOP layer, a picture layer, a slice layer, a macroblock layer, a block layer, and a lower layer may be called by an upper layer.
상기 복수의 기능부들 각각은 상기 비트스트림의 디코딩을 위해 각각의 복호화 표준들에 의해 제안된 각각의 기능을 독립적으로 수행되도록 구현될 수 있다.Each of the plurality of functional units may be implemented to independently perform each function proposed by respective decoding standards for decoding the bitstream.
상기 디코딩 기능부 각각은 미리 지정된 프로세스의 수행을 위해 필요한 CSCI 정보 및 디코딩 처리를 위한 데이터가 상기 저장부에 저장됨으로써 동작 개시될 수 있다.Each of the decoding functions may be started by storing CSCI information necessary for performing a predetermined process and data for decoding processing in the storage.
상기 디코딩 기능부 각각을 위한 전용 저장 공간이 할당될 수 있다.Dedicated storage space for each of the decoding functions may be allocated.
상기 저장부는, 상기 파싱 기능부에 의해 생성된 CSCI 정보(Control Signal/Context Information)가 저장되는 CSCI 저장부; 및 상기 파싱 기능부에 의해 생성된 상기 인코딩된 비디오 데이터에 상응하는 데이터, 상기 디코딩 기능부에 처리된 처리 데이터 중 하나 이상인 디코딩 처리를 위한 데이터가 저장되는 데이터 저장부를 포함할 수 있다.The storage unit may include a CSCI storage unit for storing CSCI information (Control Signal / Context Information) generated by the parsing function unit; And a data storage unit for storing data corresponding to the encoded video data generated by the parsing unit and data for decoding processing, which is one or more of processing data processed by the decoding unit.
상기 테이블 정보 저장부에 저장되는 테이블 정보는, 상기 인코딩된 비디오 데이터의 디코딩을 위한 계층 구조와 각 계층별 하위 계층에 관한 정보를 나타내는 DHT(Decoding Hierarchy Table); 비트스트림 신택스(syntax)에 대한 정보 및 상기 비트스트림 신택스에 상응하는 엘리먼트 정보를 생성하기 위한 프로세스를 나타내 는 SET(Syntax Element Table); 상기 비트스트림 신택스간의 연결 정보, 각 계층별 호출할 하위 계층에 관한 정보 및 상기 SET의 프로세스 수행에 의해 생성된 결과 데이터가 저장될 CSCI 정보의 명칭을 지정하는 S-RT(Syntax Rule Table); 계층 구조별 CSCI 정보에 대한 상세 정보를 나타내는 CSCIT(Control Signal and Context Information Table); 상기 계층 구조에 기반하여 복수의 디코딩 기능부들간의 호출 또는 활성화 순서를 나타내는 F-RT(FU Rule Table); 상기 디코딩 기능부들의 리스트를 나타내는 FL(FU List); 및 상기 디코딩 기능부가 프로세스 수행을 위해 필요한 CSCI 정보를 나타내는 FU-CSCIT를 포함할 수 있다.The table information stored in the table information storage unit may include: a Decoding Hierarchy Table (DHT) indicating a hierarchical structure for decoding the encoded video data and information about lower layers of each layer; A Syntax Element Table (SET) indicating information on bitstream syntax and a process for generating element information corresponding to the bitstream syntax; A Syntax Rule Table (S-RT) that specifies the name of the connection information between the bitstream syntaxes, information on lower layers to be called for each layer, and CSCI information to store result data generated by the process of the SET; Control Signal and Context Information Table (CSCIT) indicating detailed information on CSCI information for each hierarchical structure; An FU Rule Table (F-RT) indicating a call or activation order among a plurality of decoding functions based on the hierarchical structure; FL (FU List) representing the list of decoding functions; And the FU-CSCIT indicating the CSCI information necessary for performing the process by the decoding function unit.
상기 테이블 정보 저장부에 저장되는 테이블 정보는, 엔트로피 코딩(entropy coding)시의 실제 값과 코드값의 관계를 나타내는 DVT(Default Value Table)를 더 포함할 수 있다.The table information stored in the table information storage unit may further include a default value table (DVT) indicating a relationship between an actual value and a code value during entropy coding.
상기 부호화기로부터 상기 디코딩 디스크립션 및 상기 비트스트림이 통합된 확장 비트스트림이 수신되는 경우, 상기 복호화 장치는 상기 디코딩 디스크립션 및 상기 비트스트림을 분리하기 위한 분리부를 더 포함할 수 있다.When the decoding description and the extended bitstream in which the bitstream are integrated are received from the encoder, the decoding apparatus may further include a separation unit for separating the decoding description and the bitstream.
본 발명의 바람직한 다른 실시예에 따른 부호화 장치는, 하나 이상의 부호화 표준에 의해 각각 규정된 기능을 수행하도록 구현된 복수의 기능부들을 이용하여 동영상 데이터에 상응하는 인코딩된 비디오 데이터를 포함하는 비트스트림을 생성하는 인코딩부; 및 상기 인코딩된 비디오 데이터의 디코딩을 위해 복호화기에 포함된 복수의 기능부들간의 동작 관계를 규정한 n(임의의 자연수)개의 테이블 정보(table information)에 상응하는 디코딩 디스크립션을 생성하는 디스크립션 인 코더를 포함할 수 있다. 여기서, 상기 비트스트림의 디코딩을 위해 상기 비트스트림과 상기 디코딩 디스크립션은 복호화기로 함께 제공될 수 있다.According to another exemplary embodiment of the present invention, an encoding apparatus may generate a bitstream including encoded video data corresponding to moving image data by using a plurality of functional units implemented to each perform a function defined by one or more encoding standards. An encoding unit to generate; And a description encoder for generating a decoding description corresponding to n (random natural numbers) table information defining an operation relationship between a plurality of functional units included in a decoder for decoding the encoded video data. can do. Here, the bitstream and the decoding description may be provided together with a decoder for decoding the bitstream.
상기 부호화 장치는 상기 비트스트림 및 상기 디코디 디스크립션을 이용하여 하나의 확장 비트스트림을 생성하는 확장 비트스트림 생성 및 출력부를 더 포함할 수 있다.The encoding apparatus may further include an extension bitstream generation and output unit that generates one extension bitstream using the bitstream and the decode description.
상기 복호화기에 포함된 복수의 기능부들은 상기 비트스트림의 신택스 파싱(syntax parsing)을 위한 하나 이상의 파싱 기능부, 상기 인코딩된 비디오 데이터의 디코딩 처리를 위한 복수의 디코딩 기능부를 포함할 수 있다. 또한, 상기 디코딩 기능부들은 상기 디코딩 디스크립션에 포함된 임의의 테이블 정보에 의해 상기 인코딩된 비디오 데이터의 계층 구조에 부합되어 활성화 또는 호출 여부가 결정될 수 있다.The plurality of functional units included in the decoder may include one or more parsing functions for syntax parsing of the bitstream, and a plurality of decoding functions for decoding processing of the encoded video data. In addition, the decoding functions may be activated or called according to the hierarchical structure of the encoded video data by arbitrary table information included in the decoding description.
상기 계층 구조는 시퀀스 층, GOP 층, 픽쳐 층, 슬라이스 층, 매크로블록 층, 블록 층 중 하나 이상의 층들로 구성되며, 상기 디코딩 디스크립션에 포함된 임의의 테이블 정보에 따라 비활성화 상태인 제1 계층이 이미 활성화된 제2 계층에 의해 호출될 수 있다.The hierarchical structure is composed of one or more layers of a sequence layer, a GOP layer, a picture layer, a slice layer, a macroblock layer, a block layer, and the first layer, which is inactive according to any table information included in the decoding description, has already been deactivated. It may be called by the activated second layer.
상기 디스크립션 인코더에 의해 생성된 n(임의의 자연수)개의 테이블 정보(table information)는, 상기 인코딩된 비디오 데이터의 디코딩을 위한 계층 구조와 각 계층별 하위 계층에 관한 정보를 나타내는 DHT(Decoding Hierarchy Table); 비트스트림 신택스(syntax)에 대한 정보 및 상기 비트스트림 신택스에 상응하는 엘리먼트 정보를 생성하기 위한 프로세스를 나타내는 SET(Syntax Element Table); 상기 비트스트림 신택스간의 연결 정보, 각 계층별 호출할 하위 계층에 관한 정보 및 상기 SET의 프로세스 수행에 의해 생성된 결과 데이터가 저장될 CSCI 정보의 명칭을 지정하는 S-RT(Syntax Rule Table); 계층 구조별 CSCI 정보에 대한 상세 정보를 나타내는 CSCIT(Control Signal and Context Information Table); 상기 계층 구조에 기반하여 복수의 디코딩 기능부들간의 호출 또는 활성화 순서를 나타내는 F-RT(FU Rule Table); 상기 디코딩 기능부들의 리스트를 나타내는 FL(FU List); 및 상기 디코딩 기능부가 프로세스 수행을 위해 필요한 CSCI 정보를 나타내는 FU-CSCIT 중 하나 이상을 포함할 수 있다.The n (arbitrary natural number) table information generated by the description encoder is a Decoding Hierarchy Table (DHT) indicating a hierarchical structure for decoding the encoded video data and information about lower layers of each layer. ; A Syntax Element Table (SET) indicating a process for generating information on bitstream syntax and element information corresponding to the bitstream syntax; A Syntax Rule Table (S-RT) that specifies the name of the connection information between the bitstream syntaxes, information on lower layers to be called for each layer, and CSCI information to store result data generated by the process of the SET; Control Signal and Context Information Table (CSCIT) indicating detailed information on CSCI information for each hierarchical structure; An FU Rule Table (F-RT) indicating a call or activation order among a plurality of decoding functions based on the hierarchical structure; FL (FU List) representing the list of decoding functions; And FU-CSCIT indicating the CSCI information necessary for performing the process by the decoding function unit.
상기 테이블 정보는 엔트로피 코딩(entropy coding)시의 실제 값과 코드값의 관계를 나타내는 DVT(Default Value Table)를 더 포함할 수 있다.The table information may further include a default value table (DVT) indicating a relationship between an actual value and a code value during entropy coding.
상기 복호화기는 상기 F-RT를 이용하여 최상위 계층에 해당하는 하나 이상의 디코딩 기능부의 활성화 또는 호출을 제어할 수 있다.The decoder may control activation or calling of one or more decoding functions corresponding to the highest layer using the F-RT.
상기 디코딩 디스크립션은 하나 이상의 테이블 영역으로 구성되고, 각 테이블 영역에는 상기 테이블을 구성하기 위한 테이블 정보가 삽입될 수 있다.The decoding description may include one or more table areas, and table information for configuring the table may be inserted into each table area.
상기 테이블 정보는 상기 비트스트림을 복호화하기 위한 코덱 번호(Codec No.), 프로파일 및 레벨 번호(Profile and level No.)에 상응하는 지정 정보를 포함하고, 상기 복호화기는 미리 저장된 복수의 테이블들 중 상기 지정 정보에 상응하는 n개의 테이블들을 추출하여 이용할 수 있다.The table information includes designation information corresponding to a codec number (Codec No.), a profile and a level number (Profile and level No.) for decoding the bitstream, and the decoder includes N tables corresponding to the designated information can be extracted and used.
상술한 목적을 달성하기 위하여 본 발명의 다른 측면에 따르면, 다양한 표준 에 범용적으로 이용될 수 있는 복호화 방법/부호화 방법 및/또는 그 방법의 실행을 위한 프로그램이 기록된 기록매체가 제공된다.According to another aspect of the present invention for achieving the above object, there is provided a decoding method / encoding method that can be used universally in various standards and / or a recording medium on which a program for executing the method is recorded.
본 발명의 바람직한 일 실시예에 따른 복호화 방법은, (a) 비트스트림 및 디스크립션 정보가 입력되면, 상기 디스크립션 정보에 상응하는 복수의 테이블 정보를 생성하여 저장하는 단계; 및 (b) 하나 이상의 테이블 정보를 이용하여 파싱 기능부 및 최상위 계층에 속하는 하나 이상의 디코딩 기능부를 호출하는 단계를 포함할 수 있다. 여기서, 상기 파싱 기능부는 상기 비트스트림의 신택스 파싱(syntax parsing)을 수행하고, 상기 최상위 계층의 디코딩 기능부는 미리 지정된 프로세스의 수행을 위해 필요한 CSCI 정보(Control Signal/Context Information) 및 디코딩을 위한 데이터가 상기 파싱 기능부에 의해 저장부에 저장되면 처리를 수행할 수 있다. 여기서, 계층 구조에 부합하여 제1 계층의 수행을 위해 필요한 CSCI 정보 및 디코딩을 위한 데이터가 저장부에 저장되면 활성화된 상태인 제2 계층에 의해 상기 제1 계층이 호출될 수 있다.According to an embodiment of the present invention, a decoding method includes: (a) generating and storing a plurality of table information corresponding to the description information when a bitstream and description information are input; And (b) calling the parsing function and the one or more decoding functions belonging to the highest layer using the one or more table information. Herein, the parsing function performs syntax parsing of the bitstream, and the decoding function of the uppermost layer includes CSCI information (Control Signal / Context Information) and data for decoding necessary to perform a predetermined process. If stored in the storage by the parsing function, the processing can be performed. Here, the first layer may be called by the second layer which is in an activated state if CSCI information necessary for performing the first layer and data for decoding are stored in the storage unit according to the hierarchical structure.
상기 디코딩 기능부들은 상기 인코딩된 비디오 데이터의 계층 구조에 부합되어 활성화 또는 호출 여부가 결정될 수 있다. 상기 디스크립션 정보에 명시된 각각의 디코딩 기능부들의 한번 이상의 프로세스 수행에 의해 상기 비트스트림에 상응하는 동영상 데이터가 출력될 수 있다.The decoding functions may be activated or called according to the hierarchical structure of the encoded video data. Video data corresponding to the bitstream may be output by performing one or more processes of each decoding function specified in the description information.
상기 계층 구조는 시퀀스 층, GOP 층, 픽쳐 층, 슬라이스 층, 매크로블록 층, 블록 층 중 하나 이상의 층들로 구성될 수 있다.The hierarchical structure may be composed of one or more layers of a sequence layer, a GOP layer, a picture layer, a slice layer, a macroblock layer, and a block layer.
상기 파싱 기능부 및 디코딩 기능부들 각각은 상기 비트스트림의 디코딩을 위해 각각의 복호화 표준들에 의해 제안된 각각의 기능을 독립적으로 수행되도록 구현될 수 있다.Each of the parsing function and the decoding function may be implemented to independently perform each function proposed by respective decoding standards for decoding the bitstream.
상기 저장부는, 상기 파싱 기능부에 의해 생성된 CSCI 정보가 저장되는 CSCI 저장부; 및 상기 파싱 기능부에 의해 생성된 상기 인코딩된 비디오 데이터에 상응하는 데이터, 임의의 디코딩 기능부에 처리된 처리 데이터 중 하나 이상인 디코딩 처리를 위한 데이터가 저장되는 데이터 저장부를 포함할 수 있다.The storage unit may include a CSCI storage unit for storing CSCI information generated by the parsing function unit; And a data storage configured to store data for decoding processing, which is one or more of data corresponding to the encoded video data generated by the parsing function and processing data processed by an arbitrary decoding function.
상기 디코딩 기능부 각각은 미리 지정된 프로세스의 수행을 위해 필요한 CSCI 정보 및 디코딩 처리를 위한 데이터가 상기 저장부에 저장됨으로써 동작 개시될 수 있다.Each of the decoding functions may be started by storing CSCI information necessary for performing a predetermined process and data for decoding processing in the storage.
상기 디코딩 기능부 각각을 위한 전용 저장 공간이 할당될 수 있다.Dedicated storage space for each of the decoding functions may be allocated.
상기 생성된 테이블 정보는, 상기 비트스트림에 포함된 인코딩된 비디오 데이터의 디코딩을 위한 계층 구조와 각 계층별 하위 계층에 관한 정보를 나타내는 DHT(Decoding Hierarchy Table); 비트스트림 신택스(syntax)에 대한 정보 및 상기 비트스트림 신택스에 상응하는 엘리먼트 정보를 생성하기 위한 프로세스를 나타내는 SET(Syntax Element Table); 상기 비트스트림 신택스간의 연결 정보, 각 계층별 호출할 하위 계층에 관한 정보 및 상기 SET의 프로세스 수행에 의해 생성된 결과 데이터가 저장될 CSCI 정보의 명칭을 지정하는 S-RT(Syntax Rule Table); 계층 구조별 CSCI 정보에 대한 상세 정보를 나타내는 CSCIT(Control Signal and Context Information Table); 상기 계층 구조에 기반하여 복수의 디코딩 기능부들간의 호출 또는 활성화 순서를 나타내는 F-RT(FU Rule Table); 상기 디코딩 기능부들의 리스 트를 나타내는 FL(FU List); 및 상기 디코딩 기능부가 프로세스 수행을 위해 필요한 CSCI 정보를 나타내는 FU-CSCIT를 포함할 수 있다.The generated table information may include: a Decoding Hierarchy Table (DHT) indicating a hierarchical structure for decoding encoded video data included in the bitstream and information about lower layers of each layer; A Syntax Element Table (SET) indicating a process for generating information on bitstream syntax and element information corresponding to the bitstream syntax; A Syntax Rule Table (S-RT) that specifies the name of the connection information between the bitstream syntaxes, information on lower layers to be called for each layer, and CSCI information to store result data generated by the process of the SET; Control Signal and Context Information Table (CSCIT) indicating detailed information on CSCI information for each hierarchical structure; An FU Rule Table (F-RT) indicating a call or activation order among a plurality of decoding functions based on the hierarchical structure; FL (FU List) representing a list of decoding functions; And the FU-CSCIT indicating the CSCI information necessary for performing the process by the decoding function unit.
상기 테이블 정보는 엔트로피 코딩(entropy coding)시의 실제 값과 코드값의 관계를 나타내는 DVT(Default Value Table)를 더 포함할 수 있다.The table information may further include a default value table (DVT) indicating a relationship between an actual value and a code value during entropy coding.
상기 F-RT를 이용하여 최상위 계층에 해당하는 하나 이상의 디코딩 기능부의 활성화 또는 호출이 제어될 수 있다.Using the F-RT, activation or invocation of one or more decoding functions corresponding to the highest layer may be controlled.
적어도 상기 SET, 상기 S-RT, 및 상기 CSCIT를 이용하여 상기 CSCI 정보와 디코딩될 데이터 중 하나 이상이 생성될 수 있다.At least one of the CSCI information and data to be decoded may be generated using at least the SET, the S-RT, and the CSCIT.
상기 디코딩 디스크립션 및 상기 비트스트림이 통합된 확장 비트스트림의 형태로 수신되는 경우, 상기 디코딩 디스크립션 및 상기 비트스트림을 분리하는 단계가 상기 단계 (a)에서 더 수행될 수 있다.When the decoding description and the bitstream are received in the form of an integrated extension bitstream, the step of separating the decoding description and the bitstream may be further performed in step (a).
상기 디코딩 디스크립션은 하나 이상의 테이블 영역으로 구성되고, 각 테이블 영역에는 상기 테이블을 구성하기 위한 테이블 정보가 삽입될 수 있다.The decoding description may include one or more table areas, and table information for configuring the table may be inserted into each table area.
본 발명의 바람직한 다른 실시예에 따르면, 복호화 방법을 수행하기 위해 복호화 장치에서 실행될 수 있는 명령어들의 프로그램이 유형적으로 구현되어 있으며, 상기 복호화 장치에 의해 판독될 수 있는 프로그램이 기록된 기록 매체에 있어서, (a) 비트스트림 및 디스크립션 정보이 입력되면, 상기 디스크립션 정보에 상응하는 복수의 테이블 정보를 생성하여 저장하는 단계; 및 (b) 하나 이상의 테이블 정보를 이용하여 파싱 기능부 및 최상위 계층에 속하는 하나 이상의 디코딩 기능부를 호출하는 단계를 실행하는 프로그램이 기록된 기록매체가 제공된다. 여기서, 상기 파싱 기능부는 상기 비트스트림의 신택스 파싱(syntax parsing)을 수행하고, 상기 최상위 계층의 디코딩 기능부는 미리 지정된 프로세스의 수행을 위해 필요한 CSCI 정보(Control Signal/Context Information) 및 디코딩을 위한 데이터가 상기 파싱 기능부에 의해 저장부에 저장되면 처리를 수행하고, 상기 계층 구조에 부합하여 제1 계층의 수행을 위해 필요한 CSCI 정보 및 디코딩을 위한 데이터가 저장부에 저장되면 활성화된 상태인 제2 계층에 의해 상기 제1 계층이 호출될 수 있다.According to another preferred embodiment of the present invention, in a recording medium in which a program of instructions that can be executed in a decoding apparatus for performing a decoding method is tangibly implemented, and a program that can be read by the decoding apparatus is recorded, (a) generating and storing a plurality of table information corresponding to the description information when the bitstream and description information are input; And (b) calling the parsing function and the one or more decoding functions belonging to the highest layer using the one or more table information. Herein, the parsing function performs syntax parsing of the bitstream, and the decoding function of the uppermost layer includes CSCI information (Control Signal / Context Information) and data for decoding necessary to perform a predetermined process. The second layer, which is activated when the storage function is stored in the storage unit, when the storage function is stored in the storage unit. The first layer can be called by.
상기 디코딩 기능부들은 상기 인코딩된 비디오 데이터의 계층 구조에 부합되어 활성화 또는 호출 여부가 결정되고, 상기 디스크립션 정보에 명시된 각각의 디코딩 기능부들의 한번 이상의 프로세스 수행에 의해 상기 비트스트림에 상응하는 동영상 데이터가 출력될 수 있다. 상기 계층 구조는 시퀀스 층, GOP 층, 픽쳐 층, 슬라이스 층, 매크로블록 층, 블록 층 중 하나 이상의 층들로 구성될 수 있다.The decoding functions are activated or called according to the hierarchical structure of the encoded video data, and the video data corresponding to the bitstream is generated by performing one or more processes of the respective decoding functions specified in the description information. Can be output. The hierarchical structure may be composed of one or more layers of a sequence layer, a GOP layer, a picture layer, a slice layer, a macroblock layer, and a block layer.
상기 파싱 기능부 및 디코딩 기능부들 각각은 상기 비트스트림의 디코딩을 위해 각각의 복호화 표준들에 의해 제안된 각각의 기능을 독립적으로 수행되도록 구현될 수 있다.Each of the parsing function and the decoding function may be implemented to independently perform each function proposed by respective decoding standards for decoding the bitstream.
상기 디코딩 기능부 각각은 미리 지정된 프로세스의 수행을 위해 필요한 CSCI 정보 및 디코딩 처리를 위한 데이터가 상기 저장부에 저장됨으로써 동작 개시될 수 있다.Each of the decoding functions may be started by storing CSCI information necessary for performing a predetermined process and data for decoding processing in the storage.
상기 생성된 테이블 정보는, 상기 비트스트림에 포함된 인코딩된 비디오 데이터의 디코딩을 위한 계층 구조와 각 계층별 하위 계층에 관한 정보를 나타내는 DHT(Decoding Hierarchy Table); 비트스트림 신택스(syntax)에 대한 정보 및 상기 비트스트림 신택스에 상응하는 엘리먼트 정보를 생성하기 위한 프로세스를 나타내는 SET(Syntax Element Table); 상기 비트스트림 신택스간의 연결 정보, 각 계층별 호출할 하위 계층에 관한 정보 및 상기 SET의 프로세스 수행에 의해 생성된 결과 데이터가 저장될 CSCI 정보의 명칭을 지정하는 S-RT(Syntax Rule Table); 계층 구조별 CSCI 정보에 대한 상세 정보를 나타내는 CSCIT(Control Signal and Context Information Table); 상기 계층 구조에 기반하여 복수의 디코딩 기능부들간의 호출 또는 활성화 순서를 나타내는 F-RT(FU Rule Table); 상기 디코딩 기능부들의 리스트를 나타내는 FL(FU List); 및 상기 디코딩 기능부가 프로세스 수행을 위해 필요한 CSCI 정보를 나타내는 FU-CSCIT를 포함할 수 있다.The generated table information may include: a Decoding Hierarchy Table (DHT) indicating a hierarchical structure for decoding encoded video data included in the bitstream and information about lower layers of each layer; A Syntax Element Table (SET) indicating a process for generating information on bitstream syntax and element information corresponding to the bitstream syntax; A Syntax Rule Table (S-RT) that specifies the name of the connection information between the bitstream syntaxes, information on lower layers to be called for each layer, and CSCI information to store result data generated by the process of the SET; Control Signal and Context Information Table (CSCIT) indicating detailed information on CSCI information for each hierarchical structure; An FU Rule Table (F-RT) indicating a call or activation order among a plurality of decoding functions based on the hierarchical structure; FL (FU List) representing the list of decoding functions; And the FU-CSCIT indicating the CSCI information necessary for performing the process by the decoding function unit.
본 발명의 바람직한 또 다른 실시예에 따른 부호화 방법은, 하나 이상의 부호화 표준에 의해 각각 규정된 기능을 수행하도록 구현된 복수의 기능부들을 이용하여 동영상 데이터에 상응하는 인코딩된 비디오 데이터를 포함하는 비트스트림을 생성하는 단계; 및 상기 인코딩된 비디오 데이터의 디코딩을 위해 복호화기에 포함된 복수의 기능부들간의 동작 관계를 규정한 n(임의의 자연수)개의 테이블 정보(table information)에 상응하는 디코딩 디스크립션을 생성하는 단계를 포함할 수 있다. 여기서, 상기 비트스트림의 디코딩을 위해 상기 비트스트림과 상기 디코딩 디스크립션은 복호화기로 함께 제공될 수 있다.An encoding method according to another preferred embodiment of the present invention is a bitstream including encoded video data corresponding to moving image data using a plurality of functional units implemented to each perform a function defined by one or more encoding standards. Generating a; And generating a decoding description corresponding to n (random natural numbers) table information defining an operation relationship between a plurality of functional units included in a decoder for decoding the encoded video data. have. Here, the bitstream and the decoding description may be provided together with a decoder for decoding the bitstream.
상기 부호화 방법은, 상기 비트스트림 및 상기 디코디 디스크립션을 이용하여 하나의 확장 비트스트림을 생성하는 단계를 더 포함할 수 있다.The encoding method may further include generating one extended bitstream using the bitstream and the decode description.
상기 복호화기에 포함된 복수의 기능부들은 상기 비트스트림의 신택스 파싱(syntax parsing)을 위한 하나 이상의 파싱 기능부, 상기 인코딩된 비디오 데이터의 디코딩 처리를 위한 복수의 디코딩 기능부를 포함하고, 상기 디코딩 기능부들은 상기 디코딩 디스크립션에 포함된 임의의 테이블 정보에 의해 상기 인코딩된 비디오 데이터의 계층 구조에 부합되어 활성화 또는 호출 여부가 결정될 수 있다.The plurality of functional units included in the decoder may include one or more parsing functions for syntax parsing of the bitstream, a plurality of decoding functions for decoding processing of the encoded video data, and the decoding functions. May be activated or called in conformity with the hierarchical structure of the encoded video data based on any table information included in the decoding description.
상기 계층 구조는 시퀀스 층, GOP 층, 픽쳐 층, 슬라이스 층, 매크로블록 층, 블록 층 중 하나 이상의 층들로 구성되며, 상기 디코딩 디스크립션에 포함된 임의의 테이블 정보에 따라 비활성화 상태인 제1 계층이 이미 활성화된 제2 계층에 의해 호출될 수 있다.The hierarchical structure is composed of one or more layers of a sequence layer, a GOP layer, a picture layer, a slice layer, a macroblock layer, a block layer, and the first layer, which is inactive according to any table information included in the decoding description, has already been deactivated. It may be called by the activated second layer.
상기 생성된 n(임의의 자연수)개의 테이블 정보(table information)는, 상기 인코딩된 비디오 데이터의 디코딩을 위한 계층 구조와 각 계층별 하위 계층에 관한 정보를 나타내는 DHT(Decoding Hierarchy Table); 비트스트림 신택스(syntax)에 대한 정보 및 상기 비트스트림 신택스에 상응하는 엘리먼트 정보를 생성하기 위한 프로세스를 나타내는 SET(Syntax Element Table); 상기 비트스트림 신택스간의 연결 정보, 각 계층별 호출할 하위 계층에 관한 정보 및 상기 SET의 프로세스 수행에 의해 생성된 결과 데이터가 저장될 CSCI 정보의 명칭을 지정하는 S-RT(Syntax Rule Table); 계층 구조별 CSCI 정보에 대한 상세 정보를 나타내는 CSCIT(Control Signal and Context Information Table); 상기 계층 구조에 기반하여 복수의 디코딩 기능부들간의 호출 또는 활성화 순서를 나타내는 F-RT(FU Rule Table); 상기 디코딩 기능부들의 리스트를 나타내는 FL(FU List); 및 상기 디코딩 기능부가 프로세 스 수행을 위해 필요한 CSCI 정보를 나타내는 FU-CSCIT 중 하나 이상을 포함할 수 있다.The generated n (arbitrary natural number) table information includes: a Decoding Hierarchy Table (DHT) indicating a hierarchical structure for decoding the encoded video data and information on lower layers of each layer; A Syntax Element Table (SET) indicating a process for generating information on bitstream syntax and element information corresponding to the bitstream syntax; A Syntax Rule Table (S-RT) that specifies the name of the connection information between the bitstream syntaxes, information on lower layers to be called for each layer, and CSCI information to store result data generated by the process of the SET; Control Signal and Context Information Table (CSCIT) indicating detailed information on CSCI information for each hierarchical structure; An FU Rule Table (F-RT) indicating a call or activation order among a plurality of decoding functions based on the hierarchical structure; FL (FU List) representing the list of decoding functions; And the FU-CSCIT indicating the CSCI information necessary for performing the process by the decoding function unit.
상기 테이블 정보는 엔트로피 코딩(entropy coding)시의 실제 값과 코드값의 관계를 나타내는 DVT(Default Value Table)를 더 포함할 수 있다.The table information may further include a default value table (DVT) indicating a relationship between an actual value and a code value during entropy coding.
상기 복호화기는 상기 F-RT를 이용하여 최상위 계층에 해당하는 하나 이상의 디코딩 기능부의 활성화 또는 호출을 제어할 수 있다.The decoder may control activation or calling of one or more decoding functions corresponding to the highest layer using the F-RT.
상기 디코딩 디스크립션은 하나 이상의 테이블 영역으로 구성되고, 각 테이블 영역에는 상기 테이블을 구성하기 위한 테이블 정보가 삽입될 수 있다.The decoding description may include one or more table areas, and table information for configuring the table may be inserted into each table area.
상기 테이블 정보는 상기 비트스트림을 복호화하기 위한 코덱 번호(Codec No.), 프로파일 및 레벨 번호(Profile and level No.)에 상응하는 지정 정보를 포함하고, 상기 복호화기는 미리 저장된 복수의 테이블들 중 상기 지정 정보에 상응하는 n개의 테이블들을 추출하여 이용할 수 있다.The table information includes designation information corresponding to a codec number (Codec No.), a profile and a level number (Profile and level No.) for decoding the bitstream, and the decoder includes N tables corresponding to the designated information can be extracted and used.
본 발명의 또 다른 실시예에 따르면, 부호화 방법을 수행하기 위해 부호화 장치에서 실행될 수 있는 명령어들의 프로그램이 유형적으로 구현되어 있으며, 상기 부호화 장치에 의해 판독될 수 있는 프로그램이 기록된 기록 매체에 있어서, 하나 이상의 부호화 표준에 의해 각각 규정된 기능을 수행하도록 구현된 복수의 기능부들을 이용하여 동영상 데이터에 상응하는 인코딩된 비디오 데이터를 포함하는 비트스트림을 생성하는 단계; 및 상기 인코딩된 비디오 데이터의 디코딩을 위해 복호화기에 포함된 복수의 기능부들간의 동작 관계를 규정한 n(임의의 자연수)개의 테이블 정보(table information)에 상응하는 디코딩 디스크립션을 생성하는 단계를 실행하되, 상기 비트스트림의 디코딩을 위해 상기 비트스트림과 상기 디코딩 디스크립션은 복호화기로 함께 제공되는 것을 특징으로 하는 프로그램이 기록된 기록매체가 제공된다.According to still another embodiment of the present invention, there is provided a recording medium in which a program of instructions that can be executed in an encoding apparatus to perform an encoding method is tangibly implemented, and in which a program that can be read by the encoding apparatus is recorded, Generating a bitstream comprising encoded video data corresponding to moving image data using a plurality of functional units respectively implemented to perform a function defined by at least one encoding standard; And generating a decoding description corresponding to n (random natural numbers) table information defining an operation relationship between a plurality of functional units included in a decoder for decoding the encoded video data. A recording medium having a program recorded thereon, wherein the bitstream and the decoding description are provided together with a decoder for decoding the bitstream.
상기 프로그램은 상기 비트스트림 및 상기 디코디 디스크립션을 이용하여 하나의 확장 비트스트림을 생성하는 단계를 더 실행할 수 있다.The program may further execute generating one extended bitstream using the bitstream and the decode description.
상기 복호화기에 포함된 복수의 기능부들은 상기 비트스트림의 신택스 파싱(syntax parsing)을 위한 하나 이상의 파싱 기능부, 상기 인코딩된 비디오 데이터의 디코딩 처리를 위한 복수의 디코딩 기능부를 포함하고, 상기 디코딩 기능부들은 상기 디코딩 디스크립션에 포함된 임의의 테이블 정보에 의해 상기 인코딩된 비디오 데이터의 계층 구조에 부합되어 활성화 또는 호출 여부가 결정될 수 있다.The plurality of functional units included in the decoder may include one or more parsing functions for syntax parsing of the bitstream, a plurality of decoding functions for decoding processing of the encoded video data, and the decoding functions. May be activated or called in conformity with the hierarchical structure of the encoded video data based on any table information included in the decoding description.
상기 계층 구조는 시퀀스 층, GOP 층, 픽쳐 층, 슬라이스 층, 매크로블록 층, 블록 층 중 하나 이상의 층들로 구성되며, 상기 디코딩 디스크립션에 포함된 임의의 테이블 정보에 따라 비활성화 상태인 제1 계층이 이미 활성화된 제2 계층에 의해 호출될 수 있다.The hierarchical structure is composed of one or more layers of a sequence layer, a GOP layer, a picture layer, a slice layer, a macroblock layer, a block layer, and the first layer, which is inactive according to any table information included in the decoding description, has already been deactivated. It may be called by the activated second layer.
상기 생성된 n(임의의 자연수)개의 테이블 정보(table information)는, 상기 인코딩된 비디오 데이터의 디코딩을 위한 계층 구조와 각 계층별 하위 계층에 관한 정보를 나타내는 DHT(Decoding Hierarchy Table); 비트스트림 신택스(syntax)에 대한 정보 및 상기 비트스트림 신택스에 상응하는 엘리먼트 정보를 생성하기 위한 프로세스를 나타내는 SET(Syntax Element Table); 상기 비트스트림 신택스간의 연결 정보, 각 계층별 호출할 하위 계층에 관한 정보 및 상기 SET의 프로세스 수행에 의 해 생성된 결과 데이터가 저장될 CSCI 정보의 명칭을 지정하는 S-RT(Syntax Rule Table); 계층 구조별 CSCI 정보에 대한 상세 정보를 나타내는 CSCIT(Control Signal and Context Information Table); 상기 계층 구조에 기반하여 복수의 디코딩 기능부들간의 호출 또는 활성화 순서를 나타내는 F-RT(FU Rule Table); 상기 디코딩 기능부들의 리스트를 나타내는 FL(FU List); 및 상기 디코딩 기능부가 프로세스 수행을 위해 필요한 CSCI 정보를 나타내는 FU-CSCIT 중 하나 이상을 포함할 수 있다.The generated n (arbitrary natural number) table information includes: a Decoding Hierarchy Table (DHT) indicating a hierarchical structure for decoding the encoded video data and information on lower layers of each layer; A Syntax Element Table (SET) indicating a process for generating information on bitstream syntax and element information corresponding to the bitstream syntax; A Syntax Rule Table (S-RT) for specifying a name of CSCI information for storing connection information between the bitstream syntaxes, information on a lower layer to be called for each layer, and result data generated by a process of the SET; Control Signal and Context Information Table (CSCIT) indicating detailed information on CSCI information for each hierarchical structure; An FU Rule Table (F-RT) indicating a call or activation order among a plurality of decoding functions based on the hierarchical structure; FL (FU List) representing the list of decoding functions; And FU-CSCIT indicating the CSCI information necessary for performing the process by the decoding function unit.
상기 테이블 정보는 엔트로피 코딩(entropy coding)시의 실제 값과 코드값의 관계를 나타내는 DVT(Default Value Table)를 더 포함할 수 있다.The table information may further include a default value table (DVT) indicating a relationship between an actual value and a code value during entropy coding.
상기 복호화기는 상기 F-RT를 이용하여 최상위 계층에 해당하는 하나 이상의 디코딩 기능부의 활성화 또는 호출을 제어할 수 있다.The decoder may control activation or calling of one or more decoding functions corresponding to the highest layer using the F-RT.
상기 디코딩 디스크립션은 하나 이상의 테이블 영역으로 구성되고, 각 테이블 영역에는 상기 테이블을 구성하기 위한 테이블 정보가 삽입될 수 있다.The decoding description may include one or more table areas, and table information for configuring the table may be inserted into each table area.
상기 테이블 정보는 상기 비트스트림을 복호화하기 위한 코덱 번호(Codec No.), 프로파일 및 레벨 번호(Profile and level No.)에 상응하는 지정 정보를 포함하고, 상기 복호화기는 미리 저장된 복수의 테이블들 중 상기 지정 정보에 상응하는 n개의 테이블들을 추출하여 이용할 수 있다.The table information includes designation information corresponding to a codec number (Codec No.), a profile and a level number (Profile and level No.) for decoding the bitstream, and the decoder includes N tables corresponding to the designated information can be extracted and used.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. As the invention allows for various changes and numerous embodiments, particular embodiments will be illustrated in the drawings and described in detail in the written description. However, this is not intended to limit the present invention to specific embodiments, it should be understood to include all modifications, equivalents, and substitutes included in the spirit and scope of the present invention.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. "및/또는" 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다. Terms including ordinal numbers such as first and second may be used to describe various components, but the components are not limited by the terms. The terms are used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, the first component may be referred to as the second component, and similarly, the second component may also be referred to as the first component. The term “and / or” includes any combination of a plurality of related items or any item of a plurality of related items.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. When a component is referred to as being "connected" or "connected" to another component, it may be directly connected to or connected to that other component, but it may be understood that other components may be present in between. Should be. On the other hand, when a component is said to be "directly connected" or "directly connected" to another component, it should be understood that there is no other component in between.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used herein is for the purpose of describing particular example embodiments only and is not intended to be limiting of the present invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In this application, the terms "comprise" or "have" are intended to indicate that there is a feature, number, step, operation, component, part, or combination thereof described in the specification, and one or more other features. It is to be understood that the present invention does not exclude the possibility of the presence or the addition of numbers, steps, operations, components, components, or a combination thereof.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art. Terms such as those defined in the commonly used dictionaries should be construed as having meanings consistent with the meanings in the context of the related art and shall not be construed in ideal or excessively formal meanings unless expressly defined in this application. Do not.
이하, 첨부한 도면들을 참조하여 본 발명에 따른 통합 코덱 방법 및 장치의 바람직한 실시예를 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어 도면 부호에 상관없이 동일하거나 대응하는 구성 요소는 동일한 참조번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, preferred embodiments of the integrated codec method and apparatus according to the present invention will be described in detail with reference to the accompanying drawings. In the following description with reference to the accompanying drawings, the same or corresponding components are identified by the same reference numerals. The numbering and duplicate description thereof will be omitted.
도 1은 일반적인 복호화기의 구성을 개략적으로 나타낸 도면이고, 도 2는 일반적인 부호화기의 구성을 개략적으로 나타낸 도면이다.FIG. 1 is a diagram schematically showing a configuration of a general decoder, and FIG. 2 is a diagram schematically showing a configuration of a general encoder.
도 1에 도시된 바와 같이, 일반적으로 MPEG-4 복호화기(100)는 가변장 디코딩부(Variable Length Decoding, 110), 역 스캔부(Inverse Scan, 115), 역 DC/AC 예측부(Inverse DC/AC Prediction, 120), 역 양자화부(Inverse Quantization, 125), 역 DCT부(Inverse Discrete Cosine Transform, 역 이산 여현 변환부, 130), 동영상 복원부(VOP Reconstruction, 135)를 포함한다. 복호화기(100)의 구성은 적용되는 표준에 따라 상이할 수 있음은 자명하며, 또한 일부 구성요소는 타 구성요소로 대체될 수도 있을 것이다.As shown in FIG. 1, the MPEG-4
전달된 비트스트림(105)이 syntax 파싱(parsing)되어 헤더 정보 및 인코딩된 영상 데이터(encoded video data)가 추출되면, 가변장 디코딩부(110)는 미리 설정된 허프만 테이블(Huffman Table)을 이용하여 양자화된 DCT 계수를 만들고, 역 스캔부(115)는 역 스캔을 수행하여 동영상(140)과 동일한 순서의 데이터를 생성한다. 즉, 역 스캔부(115)는 인코딩시 여러 가지 방법으로 스캔된 순서의 역으로, 값을 출력한다. 인코딩 시 양자화(Quantization)를 수행한 후, 주파수 대역 값의 분포에 따라 스캔 방향이 정의될 수 있다. 일반적으로는 지그-재그(zig-zag) 스캔 방식이 사용되나, 스캔 방식은 코덱별로 다양할 수 있다. When the transmitted
Syntax 파싱은 가변장 디코딩부(110)에서 통합적으로 수행되거나, 가변장 디코딩부(110)에 선행하여 비트스트림(105)을 처리하는 임의의 구성 요소에서 수행될 수 있다. 이 경우, Syntax 파싱은 부호화기와 복호화기간에 적용되는 표준이 동일하므로 해당 표준에 상응하도록 미리 지정된 기준에 의해서만 처리된다.Syntax parsing may be performed integrally in the variable
역 DC/AC 예측부(120)는 주파수 대역에서 DCT 계수의 크기를 이용하여 예측을 위한 참조 블록의 방향성을 결정한다. The inverse DC /
역 양자화부(125)는 역 스캔된 데이터를 역 양자화한다. 즉, 인코딩시 지정된 양자화값(QP, Quantization Parameter)을 이용하여 DC와 AC 계수를 환원한다. The
역 DCT부(130)는 역 이산 여현 변환(Inverse Discrete Cosine Transform)을 수행함으로써 실제의 동영상 픽셀 값을 구하여 VOP(Video Object Plane)를 생성한다. The
동영상 복원부(135)는 역 DCT부(130)에 의해 생성된 VOP를 이용하여 동영상 신호를 복원하여 출력한다. The
도 2에 도시된 바와 같이, 일반적으로 MPEG-4 부호화기(200)는 DCT부(210), 양자화부(215), DC/AC 예측부(220), 스캔부(230), 가변장 인코딩부(235)를 포함한다. As shown in FIG. 2, the MPEG-4
부호화기(200)에 포함된 각 구성요소는 각각 대응되는 복호화기(100)의 구성 요소의 역 기능을 수행하며, 이는 당업자에게 자명하다. 간단히 설명하면, 부호화기(200)는 동영상 신호(즉, 디지털 영상 픽셀 값)를 이산 여현 변환(Discrete Cosine Transform), 양자화(Quantization) 등을 통해 주파수 값으로 변환하여 부호화를 수행한 후, 이를 정보의 빈도 수에 따라 비트 길이를 차별화하는 가변장 인코딩을 수행하여 압축된 비트스트림 상태로 출력한다. Each component included in the
도 3은 본 발명의 일 실시예에 따른 복호화기의 구성을 개략적으로 나타낸 도면이고, 도 4는 본 발명의 일 실시예에 따른 확장 비트스트림(Extende bit-stream)의 구성을 간략히 나타낸 도면이다. 도 5는 본 발명의 일 실시예에 따른 디코딩부의 구성을 개략적으로 나타낸 도면이며, 도 6은 본 발명의 일 실시예에 따른 SYN 파서(Syntax Parser)의 구성을 개략적으로 나타낸 도면이며, 도 7은 본 발명의 일 실시예에 따른 디코딩 처리부의 구성을 개략적으로 나타낸 도면이다. 도 16은 본 발명의 일 실시예에 따른 DHT(Decoding Hierarchy Table)에 의해 규정되는 계층 구조를 예시한 도면이고, 도 17은 본 발명의 일 실시예에 따른 S-RT(Syntax Rule Table)에 의해 규정되는 계층간 호출 구조 및 계층내 연결 구조를 예시한 도면이며, 도 18은 본 발명의 일 실시예에 따른 복수 표준에 적용되는 기능부를 위한 인터페이스 세트를 설명하기 위한 도면이다. 도 19는 본 발명의 일 실시예에 따른 각 계층별 노드들간의 전용 버퍼 공간의 연결 구조를 나타낸 도면이고, 도 20은 본 발명의 일 실시예에 따른 CSCI 데이터의 저장을 위한 전용 버퍼 공간의 포함 관계를 나타낸 도면이며, 도 21은 본 발명의 일 실시예에 따른 기능부에 의한 출력 데이터의 저장을 위한 전용 버퍼 공간의 포함 관계를 나타낸 도면이고, 도 22는 본 발명의 일 실시예에 따른 syntax 파싱 및 데이터 디코딩의 병렬 처리를 개념적으로 나타낸 도면이다.3 is a diagram schematically showing a configuration of a decoder according to an embodiment of the present invention, and FIG. 4 is a diagram briefly showing a configuration of an extended bit-stream according to an embodiment of the present invention. 5 is a diagram schematically showing a configuration of a decoding unit according to an embodiment of the present invention, FIG. 6 is a diagram schematically showing a configuration of a SYN parser according to an embodiment of the present invention, and FIG. 2 is a diagram schematically illustrating a configuration of a decoding processing unit according to an embodiment of the present invention. 16 is a diagram illustrating a hierarchical structure defined by a decoding hierarchy table (DHT) according to an embodiment of the present invention, and FIG. 17 is a syntax rule table (S-RT) according to an embodiment of the present invention. FIG. 18 is a diagram illustrating a defined inter-layer call structure and an intra-layer connection structure, and FIG. 18 is a diagram for explaining an interface set for functional units applied to a plurality of standards according to an embodiment of the present invention. FIG. 19 is a diagram illustrating a connection structure of dedicated buffer spaces between nodes of each layer according to an embodiment of the present invention, and FIG. 20 includes a dedicated buffer space for storing CSCI data according to an embodiment of the present invention. FIG. 21 is a diagram illustrating a relationship of inclusion of a dedicated buffer space for storing output data by a functional unit according to an embodiment of the present invention, and FIG. 22 is a syntax according to an embodiment of the present invention. A conceptual diagram illustrating parallel processing of parsing and data decoding.
본 발명의 계층 구조에 따른 인코딩/디코딩 방법의 수행을 위해, 테이블 정보로 추출되어 이용되거나 테이블 정보를 생성할 수 있도록 하기 위한 디코딩 디스크립션이 복호화기(300)로 제공된다. 디코딩 디스크립션은 비트스트림과 함께 확장 비트스트림을 구성하여 복호화기(300)로 제공되거나, 비트스트림과 독립된 데이터 형태로 복호화기(300)에 제공될 수 있다. 물론, 복호화기(300)의 특정 저장부에 해당 테이블 정보가 미리 저장된 경우라면 디코딩 디스크립션의 제공은 생략될 수도 있음은 자명하다. 다만, 이하에서는 디코딩 디스크립션이 확장 비트스트림 내에 포함되어 복호화기(300)로 제공되는 경우를 중심으로 설명하기로 한다.In order to perform the encoding / decoding method according to the hierarchical structure of the present invention, a decoding description is provided to the
도 3에 도시된 바와 같이, 본 발명에 따른 복호화기(300)는 종래의 복호화 기(도 1 참조)와 상이한 구성을 가진다.As shown in FIG. 3, the
즉, 본 발명의 일 실시예에 따른 복호화기(300)는 분리부(310), 디스크립션 디코더(DDD, Decoding Description Decoder)(320), 테이블 저장부(330) 및 디코딩부(340)를 포함한다. That is, the
도시된 복호화기의 구성 요소(예를 들어, 분리부(310), 디스크립션 디코더(320), 디코딩부(340) 등)중 하나 이상은 하기에서 설명될 기능을 수행하도록 구현된 소프트웨어 프로그램(또는 프로그램 코드들의 조합)으로 구현될 수도 있음은 자명하다.One or more of the components of the illustrated decoder (eg,
분리부(310)는 입력된 확장 비트스트림(Extended Bit-stream, 305)를 디코딩 디스크립션(DD, Decoding Description) 영역과 일반적인 비트스트림(105, 이하 '종래 비트스트림'이라 칭함) 영역으로 분리하여, 디코딩 디스크립션은 디스크립션 디코더(320)로 입력하고, 종래 비트스트림은 디코딩부(340)로 입력한다. The
즉, 본 발명의 일 실시예에 따른 확장 비트스트림은 도 4에 예시된 바와 같이 디코딩 디스크립션(410 내지 470)과 종래 비트스트림(105)을 포함할 수 있다. That is, the extended bitstream according to an embodiment of the present invention may include decoding
디코딩 디스크립션은 다양한 부호화 방식(또는 부호화 표준)에 의해 부호화된 비트스트림 및/또는 여러 기능들 중 사용자가 선택한 기능들에 의해 부호화된 비트스트림(105)을 공통적 해석 방식에 의해 파싱하기 위하여 종래 비트스트림(105)의 구성 정보와 종래 비트스트림(105)이 부호화된 방식(또는 기능부(FU, Functional Unit)들간의 연결 정보) 등에 대한 정보이다. 디코딩 디스크립션은 확장 비트스트림(305)에 포함(되어 복호화기(310)로 제공(도 4 참조)될 수 있다. 물 론, 디코딩 디스크립션은 독립된 비트스트림 또는 데이터의 형태로 복호화기(310)로 제공될 수 있음은 당연하다. 디코딩 디스크립션은 디스크립션 디코더(320)에 의해 인식 또는/및 해석될 수 있는 기술 방식으로 기술되며, 예를 들어 textual description이나 binary description 등의 기술 방식으로 기술될 수 있다.The decoding description is a conventional bitstream for parsing a bitstream coded by various coding schemes (or coding standards) and / or a
디코딩 디스크립션은 FL(Functional unit List, 410), F-RT(Functional unit Rule Table, 420), FU-CSCIT(Functional Unit CSCIT, 430), CSCIT(Control Signal and Context Information Table, 440), DHT(Decoding Hierarchy Table, 445), SET(Syntax Element Table, 450), S-RT(Syntax-Rule Table, 460), DVT(Default Value Table, 470) 등을 포함할 수 있다. 디코딩 디스크립션 정보를 구성하기 위한 각 테이블들의 순서는 다양하게 변형될 수 있음은 자명하다.Decoding descriptions include Functional Unit List (FL), Functional Unit Rule Table (F-RT) 420, Functional Unit CSCIT (430), Control Signal and Context Information Table (440), and Decoding (DHT). Hierarchy Table 445, Syntax Element Table 450, Syntax-Rule Table 460, Default Value Table DVT, and the like. Obviously, the order of the tables for configuring the decoding description information may be modified in various ways.
여기서, FL(Functional unit List, 410), F-RT(Functional unit Rule Table, 420), FU-CSCIT(Functional Unit CSCIT, 430), CSCIT(Control Signal and Context Information Table, 440), DHT(Decoding Hierarchy Table, 445) 등은 각 기능부(FU)들의 연결 관계(connection)을 설정하기 위해 이용될 수 있다(해당 테이블들은 필요시 '제1 디코딩 디스크립션'라 칭할 수 있음). Here, FL (Functional unit List, 410), F-RT (Functional unit Rule Table, 420), FU-CSCIT (Functional Unit CSCIT, 430), CSCIT (Control Signal and Context Information Table, 440), DHT (Decoding Hierarchy) Table 445 and the like may be used to establish the connection of each functional unit (FU) (the tables may be referred to as 'first decoding description' if necessary).
이중, DHT(445)는 각 코덱의 계층 구조와 각 계층별 하위 계층에 대한 정보를 기술한 정보일 수 있다(도 16 참조). 각 코덱의 계층 구조는 상위 계층과 하위 계층간의 구조로 표현될 수 있으며, 예를 들어 시퀀스 층, GOP 층, VOP 층, 슬라이스(slice) 층, 매크로블록(Macro Block, MB) 층, 블록 층 등으로 세분화될 수 있으며, 각 코덱은 하나의 이상의 층들로 구성되고, 각 계층에 하나 이상의 오브젝트를 포함할 수 있다.The
복수의 계층으로 구성된 인코딩된 비디오 데이터의 디코딩 과정에 대해 예를 들어 간략히 설명하면 다음과 같다. 물론, 계층 구조에 부합하여 비트스트림의 복호화하는 방법이 이에 제한되지 않음은 자명하다.For example, the decoding process of encoded video data composed of a plurality of layers will be briefly described as follows. Of course, the method of decoding the bitstream in conformity with the hierarchical structure is not limited thereto.
디코딩 과정 수행 시, 먼저 최상위 계층 (제1층)의 한 오브젝트가 생성되어 실행된 후, 해당 오브젝트 내에 포함된 모든 디코딩 기능부들 및 해당 오브젝트에 포함된 하나 이상의 하위 계층 (제2층) 호출부들이 활성화된다. 예를 들어, 계층 구조가 순차적으로 제1층, 제2층 및 제3층으로 구성되었다고 가정하면, 제1층(예를 들어, 시퀀스 층)의 오브젝트 실행에 의해 제2층에 속한 하나 이상의 계층 호출부(예를 들어, GOP-1 층, GOP-2 층, GOP-3 층)가 활성화되고, 제2층의 어느 하나의 제2층 오브젝트 실행에 의해 제3층에 속한 하나 이상의 계층 호출부(예를 들어, GOP-1 층의 오브젝트 실행시 픽쳐-1 층, 픽쳐-2 층, GOP-2 층의 오브젝트 실행시 픽쳐-3 층, 픽쳐-4 층 등)가 활성화된다. 물론, 본 발명에서의 계층 구조간 호출에 의한 활성화 과정에서 반드시 상위 계층이 하위 계층만을 호출하도록 제한되지는 않으며, 테이블 정보 기반하여 필요시 하위 계층에 의해 상위 계층이 호출될 수도 있음은 자명하다. When performing the decoding process, an object of the highest layer (first layer) is first generated and executed, and then all decoding functions included in the object and one or more lower layer (second layer) callers included in the object are executed. Is activated. For example, assuming that the hierarchical structure consists of the first layer, the second layer, and the third layer, one or more layers belonging to the second layer by executing the object of the first layer (eg, the sequence layer). One or more layer calling units belonging to the third layer by executing a second layer object of any one of the second layers being activated (e.g., GOP-1 layer, GOP-2 layer, GOP-3 layer) (E.g., Picture-1 layer, Picture-2 layer, Picture-3 layer, Picture-4 layer, etc. when the object of the GOP-1 layer is executed) is activated. Of course, in the activation process by the inter-layer call in the present invention, the upper layer is not necessarily limited to calling only the lower layer, and it is obvious that the upper layer may be called by the lower layer if necessary based on the table information.
활성화된 해당 계층 (제1층)의 디코딩 기능부들은 미리 지정된 프로세스 수행을 위해 필요한 CSCI 정보(Control Signal/Context Information) 및 디코딩을 위한 데이터가 저장부(520)에 저장되면 동작이 개시된다. The decoding functions of the activated layer (first layer) are started when the CSCI information (Control Signal / Context Information) necessary for performing a predetermined process and data for decoding are stored in the
활성화된 해당 계층 (제1층)의 하위 계층 (제2층) 호출부는 속한 계층의 디 코딩 기능부들 중 하나 이상이 프로세스 수행을 위해 필요한 CSCI 정보(Control Signal/Context Information) 및 디코딩을 위한 데이터가 저장부(520)에 저장되면 해당 계층 (제2층)의 오브젝트를 생성하여 실행하게 되며, 해당 오브젝트 내에 포함된 모든 디코딩 기능부들 및 해당 오브젝트에 포함된 하나 이상의 하위 계층 (제3층) 호출부들이 활성화된다 The lower layer (second layer) caller of the activated layer (first layer) activates CSCI information (Control Signal / Context Information) and data for decoding that one or more of the decoding functions of the layer to which the layer belongs. When stored in the
상술한 바와 같이, 한 계층의 오브젝트 수행에 의해 하위 계층이 호출될 수 있으며, 호출된 계층의 디코딩 기능부들이 미리 지정된 프로세스를 수행하며, 각 계층에 포함된 기능부들 중 디코딩 디스크립션에 의해 지정된 기능부들이 1회 이상 기능함으로써 인코딩된 비디오 데이터가 동영상 데이터로 복원되어 출력된다 As described above, a lower layer may be called by performing an object of one layer, the decoding functions of the called layer perform a predetermined process, and the functional parts specified by the decoding description among the functions included in each layer. By this function one or more times, encoded video data is reconstructed and output as moving picture data.
FU-CSCIT(440)는 디코딩 처리부(550) 내의 각 기능부와 CSCI 저장부(522)에 저장된 엘리먼트 정보간의 매핑(mapping)을 위한 디코딩 디스크립션 정보일 수도 있다. 이 경우, 엘리먼트 정보는 디코딩 처리부(550) 및/또는 SYN 파서(540) 내의 각 기능부에 대한 제어 변수로서 기능할 수 있다. The FU-
또한, CSCIT(Control Signal and Context Information Table, 440), DHT(Decoding Hierarchy Table, 445), SET(Syntax Element Table, 450), S-RT(Syntax-Rule Table, 460), DVT(Default Value Table, 470) 등은 종래 비트스트림(105)의 syntax 파싱(Parsing)을 위해 이용될 수 있다(해당 테이블들은 필요시 '제2 디코딩 디스크립션'라 칭할 수 있음). 각 디코딩 디스크립션 정보의 형태 및 기능은 이후 상세히 설명하기로 한다.In addition, CSCIT (Control Signal and Context Information Table, 440), DHT (Decoding Hierarchy Table, 445), SET (Syntax Element Table, 450), S-RT (Syntax-Rule Table, 460), DVT (Default Value Table, 470 may be used for syntax parsing of the conventional bitstream 105 (the tables may be referred to as 'second decoding description' if necessary). The form and function of each decoding description information will be described later in detail.
디스크립션 디코더(320)는 분리부(310)로부터 입력된 디코딩 디스크립션을 디코딩부(340)에서 인식할 수 있는 형태의 복수의 테이블들로 테이블 저장부(330)에 저장한다. 테이블 저장부에 저장되는 각 테이블은 반드시 일반적인 형태의 테이블일 필요는 없으며, 디코딩부(340)에 의해 인식될 수 있는 정보 형태이면 충분하다. 즉, 디스크립션 디코더(320)는 확장 비트스트림(305) 내에 바이너리 데이터 형태 등으로 포함된 데이터를 SYN 파서(540) 및/또는 디코딩 제어부(530)가 해석할 수 있는 테이블들로 변환하여 테이블 저장부(330)에 저장한다. The
디스크립션 디코더(320)의 디코딩 디스크립션 분석에 의해 테이블 저장부(330)에 저장되는 테이블들로는 FL(410), F-RT(420), FU-CSCIT(430), CSCIT(440), DHT(445), SET(450), S-RT(460), DVT(470) 등이 포함될 수 있다. 디스크립션 디코더(320)는 도 9에 예시된 바와 같이 TI(Table Identifier, 910)를 참조하여 각 테이블을 구분할 수 있다. Tables stored in the
물론, 디코딩 디스크립션 내에는 모든 테이블들이 반드시 포함되어야 하는 것은 아니며, 도 8에 예시된 바와 같이 코덱 번호(Codec #, 820)와 프로파일 및 레벨 번호(Profile and level #, 830)가 포함되거나, 도 10에 예시된 바와 같이 일부 테이블에 대해서만 코덱 번호(Codec #, 1020)와 프로파일 및 레벨 번호(Profile and level #, 1030)가 포함될 수도 있다. 코덱 번호(Codec #)와 프로파일 및 레벨 번호(Profile and level #)가 포함된 경우, 디스크립션 디코더(320)는 전체 테이블 또는 일부 테이블에 대해서는 새로운 테이블을 생성하지 않고 테이블 저장부(330)에 미리 저장된 테이블들 중 상응하는 테이블이 디코딩시 이용되도록 선택할 수도 있다. 물론, 코덱 번호(Codec #), 프로파일 및 레벨 번호(Profile and level #)와 수정 정보가 포함된 경우, 디스크립션 디코더(320)는 테이블 저장부(330)에 미리 저장된 테이블들 중 해당 코덱에 상응하는 테이블을 추출하여 수정 정보를 반영한 새로운 테이블을 생성할 수도 있다. 물론, 코덱 번호(Codec #)와 프로파일 및 레벨 번호(Profile and level #)가 포함되지 않고 테이블 생성을 위한 테이블 디스크립션이 포함된 경우, 디스크립션 디코더(320)는 전체 테이블 또는 일부 테이블에 대해 디코딩시 이용하기 위한 새로운 테이블을 생성할 수도 있다.Of course, not all tables must be included in the decoding description, and as illustrated in FIG. 8, a codec number (Codec #, 820) and a profile and level # (830) are included, or FIG. 10. As illustrated in FIG. 2, only some tables may include a codec number (Codec #, 1020) and a profile and level # (1030). If a codec number (Codec #) and a profile and level # are included, the
또한, 디코딩 디스크립션은 도 11에 예시된 바와 같이, 각 테이블들에 대한 디코딩 디스크립션(DD-T, 1110) 외에 갱신 정보(Revision Information, 1130)를 더 포함할 수도 있다. 각각의 확장 비트스트림의 구성에 대해서는 이후 관련 도면을 참조하여 상세히 설명한다.In addition, the decoding description may further include update information 1130 in addition to the decoding description DD-T 1110 for each table, as illustrated in FIG. 11. The configuration of each extended bitstream will be described in detail later with reference to the accompanying drawings.
테이블 저장부(330)는 디스크립션 디코더(320)에 의해 분리된 각 테이블들이 저장된다. 물론, 테이블 저장부(330)는 확장 비트스트림(305)이 코덱 번호(Codec #, 820 또는 1020)와 프로파일 및 레벨 번호(Profile and level #, 830 또는 1030)가 포함된 경우 상응하는 하나 이상의 테이블들이 디코딩부(340)에 의해 이용될 수 있도록 하기 위해, 하나 이상의 테이블들을 미리 저장할 수도 있다.The
디코딩부(340)는 도 5에 예시된 바와 같이, 툴 박스(Tool-Box, 510), 저장부(520), 디코딩 제어부(530)를 포함할 수 있다. 저장부(520)는 SYN 파서(540)에 의해 생성된 CSCI(Control Signal/Context Information, 제어 정보/문맥 정보)를 저장하기 위한 CSCI 저장부(522)와 디코딩 처리부(550)에 의해 디코딩될 데이터가 저장되는 데이터 저장부(524)를 포함할 수 있다.As illustrated in FIG. 5, the
툴 박스(510)는 SYN 파서(Syntax Parser, 540), 데이터 저장부(524)에 저장된 데이터를 디코딩하여 출력하기 위한 복수의 기능부(FU, Functional Unit)들을 포함한다. SYN 파서(540)도 하나의 기능부로 구현될 수도 있음은 자명하다. SYN 파서(540) 및 기능부들은 각각 프로그램 코드들의 조합으로 구현될 수도 있다.The
즉, 툴 박스(510)는 각각의 기능을 수행하도록 구현된 기능부(FU, Functional Unit)들이 포함되는 영역으로, 디코딩 처리부(550)에 포함된 각 기능부들은 디코딩 제어부(530)의 제어에 의해 활성화되어 종래 비트스트림(105)에 포함된 인코딩된 비디오 데이터를 동영상 데이터로 출력한다. 디코딩 제어부(530)는 각 계층 구조 단위로 상응하는 기능부들이 순차적 활성화되도록 제어할 수 있다(예를 들어, 제1 계층, 제2 계층, 제3 계층 등의 순서로 활성화되며, 제2 계층이 활성화된 시점에서 제1 계층은 활성화된 상태로 유지되거나 더 이상의 데이터 처리가 불필요한 경우 비활성화될 수 있음). 그러나, 동일한 계층 구조에 포함된 기능부들로서 동시에 활성화될지라도 타 기능부의 처리에 의한 결과 데이터를 입력 데이터로 이용하는 기능부라면 타 기능부에 의해 결과 데이터가 생성되어 데이터 저장부(524)에 저장될 때까지 처리는 유보된다. 즉, 디코딩 기능부들은 코덱의 특성에 따라 하나 이상으로 나누어진 계층에 각각 속할 수 있다. 호출된 파싱 기능부는 비트스트림의 신택스 파싱을 수행하고, 디코딩 기능부들은 지정된 프로세스의 수행을 위해 필요한 CSCI 정보 및 디코딩을 위한 데이터가 저장되면 처리를 수행한다. 또한 CSCI 정보 및 데이터의 흐름에 따라 상위 계층은 하위 계층의 디코딩 기능부를 호출하며, 디코딩 디스크립션에 명시된 모든 디코딩 기능부들이 필요에 따라 한번 이상 프로세스를 수행함으로써 비트스트림에 상응하는 동영상 데이터가 출력된다. 따라서, 디코딩 디스크립션을 이용하여 각 코덱의 스케쥴링 관리와 각 기능부들의 유기적 처리 구조를 제시할 수 있다.That is, the
즉, 디코딩부(340)에 종래 비트스트림(105)이 입력되면, 디코딩 제어부(530)는 SYN 파서(540)가 활성화되어 S-RT(460)를 이용한 Syntax 파싱이 개시되도록 하고, 또한 F-RT(420)를 참조하여 최상위 계층의 기능부들이 활성화되도록 제어한다. 제1 디코딩 디스크립션과 제2 디코딩 디스크립션 중 일부만이 초기 단계에서 이용될지라도 결과적으로 제1 디코딩 디스크립션과 제2 디코딩 디스크립션은 각각 상호 참조 등의 형태로 유기적으로 이용되어진다.That is, when the
활성화된 각각의 기능부들은 처리를 위해 필요로 하는 CSCI 또는/및 데이터가 저장부(520)에 저장될때까지 대기할 것이고, 필요로하는 CSCI 또는/및 데이터가 저장부(520)에 기록되면 기능부별로 처리를 개시한다. 이를 통해, 본 발명에 따른 디코딩부(340)는 Syntax 파싱 작업과 동영상 출력을 위한 데이터 디코딩을 동시에 수행할 수 있다(도 22 참조). 또한, 디코딩 처리부(550)에 포함된 기능부들이 계층 구조 단위로 활성화 여부가 결정되고, 각 기능부들이 개별적으로 동작 유보 또는 개시가 결정되므로 각 기능부들의 유기적 동작(예를 들어, 기능부간의 직/병렬 결합 구조를 형성하여 동작 수행)이 자유롭다.Each of the activated functional units will wait until the CSCI or / and data needed for processing is stored in the
다만, 툴 박스(510)에 포함된 SYN 파서(540)는 디코딩 제어부(530)의 연결 제어 없이 종래 비트스트림이 입력되면 즉시 종래 비트스트림(105)의 해석을 수행하도록 설정될 수도 있다. 이는 후속 처리를 수행하기 위한 디코딩 처리부(550) 내 의 기능부들이 SYN 파서(540)가 해석하여 CSCI 저장부(522)에 저장한 엘리먼트 정보(element information) 및/또는 SYN 파서(540)가 데이터 저장부(524)에 저장한 데이터(이하, '인코딩된 데이터(encoded data)'라 칭함)를 이용할 수 있기 때문이다.However, the
SYN 파서(540)는 DHT(445), SET(450), S-RT(460), CSCIT(440), DVT(470) 등을 이용하여 입력된 종래 비트스트림(105)을 해석하여 신택스 파싱(syntax parsing)의 결과물인 엘리먼트 정보(element information)를 CSCI 저장부(522)에 저장한다. CSCI 저장부(522)는 예를 들어 버퍼 메모리일 수 있다. 엘리먼트 정보는 예를 들어 CSCI(Control Signal/Context Information, 제어 정보/문맥 정보)일 수 있다. SYN 파서(540)에 의해 파싱되어 CSCI 저장부(522)에 저장된 엘리먼트 정보는 해당 단계의 파싱 결과값임과 동시에 종래 비트스트림(105)의 후속하는 신택스를 결정하는 입력 값이 될 수도 있다.The
또한, SYN 파서(540)는 신택스 파싱된 종래 비트스트림(105)의 헤더와 영상 데이터에 대한 엔트로피 디코딩을 수행하여 미리 지정된 사이즈(예를 들어, 1픽셀 단위, 4x4 단위, 8x8 단위 등)의 인코딩된 데이터를 디코딩 처리부(550)의 기능부들이 이용할 수 있도록 데이터 저장부(524)에 저장한다. 또한 SYN 파서(540)는 syntax 중 DC/AC와 같이 디코딩 과정에 사용될 데이터인 경우 데이터 저장부(524)에 저장할 수 있다. 데이터 저장부(524)는 버퍼 메모리일 수 있으며, 각 기능부별로 전용 버퍼 공간이 미리 지정될 수 있다. In addition, the
또한 각각의 전용 버퍼 공간은 도 20 및 도 21에 예시된 바와 같이 계층별로 포함 관계를 가지도록 설정될 수 있다. 따라서, 활성화된 기능부는 데이터 저장부(524)에 입력 데이터가 기록되면 즉시 처리를 개시할 수 있으며, 처리한 결과 데이터가 타 기능부의 입력 데이터로 이용되는 경우 해당 결과 데이터를 데이터 저장부(524)에 기록할 수도 있다.In addition, each dedicated buffer space may be set to have an inclusion relationship for each layer as illustrated in FIGS. 20 and 21. Therefore, the activated function unit may immediately start processing when the input data is recorded in the
SYN 파서(540)는 하나의 소프트웨어 프로그램(프로그램 코드들의 조합을 포함함)으로 구현될 수 있다. 복수의 표준(예를 들어, MPEG-1/2/4/AVC 등)에 각각 대응되는 복수의 기능을 수행하도록 SYN 파서(540)가 구현될지라도 DHT(445), SET(450), S-RT(460), CSCIT(440), DVT(470) 등을 이용하여 상응하는 동작을 수행할 수 있기 때문이다. 물론, SYN 파서(540)는 도 6에 예시된 바와 같이 복수의 기능부들로 세분화되어 구현될 수도 있으며, 각 기능부들이 블록화된 프로그램 코드들의 조합으로 구현될 수 있음은 자명하다.
도 6에 예시된 각 기능부들을 구체적으로 설명함으로써 SYN 파서(540)의 기능을 설명하면 다음과 같다. The function of the
SYN 파서(540)는 도 6에 예시된 바와 같이, NALP(Network Abstraction Layer Parsing) 기능부(FU, 610), SYNP(Syntax Parsing) 기능부(620), CTX(Context determination) 기능부(630), VLD(Variable Length Decoding) 기능부(640), RLD(Run Length Decoding) 기능부(650), MBG(Macro Block Generator) 기능부(660) 등을 포함할 수 있다. As illustrated in FIG. 6, the
물론, SYN 파서(540)에는 신택스 파싱을 위한 기능부라면 적용되는 표준에 관계없이 모두 포함될 수 있을 뿐 아니라 기술 발전과정에서 Syntax 파싱 등을 위 해 필요한 기능부는 신규로 추가될 수 있고, 기존 기능부의 수정도 가능하며, 불필요한 기능부는 제거될 수 있음은 자명하다. 또한, SYN 파서(540) 내에 구비된 각 기능부는 각 표준에 독립적으로 존재하지 않고, 표준에 관계없이 동일한 처리가 가능한 기능부의 경우에는 하나의 기능부로 통합되어 구비될 수도 있음은 자명하다. 각 기능부의 기능은 당업자에게 자명한 사항이므로 간략히 설명하기로 한다.Of course, the
NALP 기능부(610)는 MPEG-4 AVC의 NAL(Network Abstraction Layer)를 파싱(parsing)하는 기능부이고, SYNP 기능부(620)는 비트스트림의 신택스(syntax)를 파싱하는 기능부이다. SYNP 기능부(620)는 VLD 기능부(640)에 포함될 수도 있다. The
CTX 기능부(630)는 MPEG-4 AVC의 VLC 테이블을 결정하는 기능부이고, VLD 기능부(640)는 엔트로피(Entropy) 디코딩을 수행하는 기능부이다. The
RLD 기능부(650)는 AC값들을 엔트로피 디코딩하는 기능부이고, MBG 기능부(660)는 DC값 및 AC값들을 결합하여 하나의 MB(Macro Block) 데이터를 생성하는 기능부이다. 상기 언급한 SYN 파서(540) 내의 모든 기능부들 및 일부의 기능부들은 시스템 구현 방식에 따라 VLD 기능부(640)에 그 기능이 포함될 수 있을 것이다.The
상술한 바와 같이, SYN 파서(540)는 하나의 소프트웨어 프로그램으로 구현되거나, 복수의 소프트웨어 프로그램으로 구현(예를 들어 VLD 기능부(640) 등을 독립된 소프트웨어 프로그램으로 독립적 구현)될 수 있을 것이다. SYN 파서(540)가 제1 디스크립션 정보(즉, DHT(445), SET(450), S-RT(460), DVT(470) 및 CSCIT(440) 중 하나 이상)를 이용하여 엘리먼트 정보를 추출 또는 생성하여 CSCI 저장부(522)에 저장하는 과정은 이후 디코딩 제어부(530)의 설명 부분에서 상세히 설명하기로 한 다.As described above, the
디코딩 처리부(550)는 SYN 파서(540)가 데이터 저장부(524)에 저장한 인코딩된 데이터를 미리 지정된 처리 단위로 처리하여 미리 지정된 크기의 동영상 데이터로서 출력한다. 인코딩된 데이터의 처리 단위는 각 기능부별로 상이하게 적용되도록 미리 지정되거나 동일한 처리 단위로서 일반화될 수 있다.The
디코딩 처리부(550) 내에는 각 표준에 상응하여 상술한 기능을 수행하기 위한 기능부(FU)들이 포함될 수 있다. 각 기능부들은 독립된 처리 블록(예를 들어, 소프트웨어 프로그램, 명령어 코드들의 조합, 함수 등)으로 구현되어 디코딩 처리부(550)를 구성하거나, 디코딩 처리부(550)가 하나의 통합된 처리 블록으로 구현될 수도 있을 것이다. 디코딩 처리부(550)는 하나의 통합된 처리 블록으로 구현될지라도 디코딩 제어부(530)의 연결 제어에 의해 상응하는 처리가 수행될 수 있음은 자명하다.The
디코딩 처리부(550)은 도 7에 도시된 바와 같이, DF(De-blocking Filter) 기능부(710), VR(VOP Reconstructor) 기능부(715), FFR(Frame Field Reordering) 기능부(720), IPR(Intra prediction and Picture Reconstruction) 기능부(730), IT(Inverse Transform) 기능부(735), IQ(Inverse Quantization) 기능부(745), IAP(Inverse AC Prediction) 기능부(755), IS(Inverse Scan) 기능부(760), DCR(DC Reconstruction) 기능부(765)를 포함한다. As shown in FIG. 7, the
IT4x4 기능부(740), IQ4x4 기능부(750) 및 DCR4x4 기능부(770)는 처리하는 블록 사이즈가 4x4인 것을 특징으로 한다. 이는 MPEG-1/2/4의 경우에는 Transform, Quantization, Prediction 시에 8x8 블록 사이즈로 데이터를 처리함에 비해, MPEG-4 AVC는 4x4 블록 사이즈로 데이터를 처리하는 경우가 존재하기 때문이다. The
디코딩 처리부(550)에는 데이터 디코딩 기능을 수행하기 위한 기능부라면 적용되는 표준에 관계없이 모두 포함될 수 있을 뿐 아니라 기술 발전과정에서 필요한 기능부는 추가될 수 있고, 기존 기능부의 수정도 가능하며, 불필요한 기능부는 제거될 수 있음은 자명하다. 예를 들어, 복호화 처리를 위해 4x4 블록 사이즈로 데이터를 처리하는 IS4x4 기능부 등이 추가로 필요한 경우 해당 기능부들이 디코딩 처리부(550)에 추가될 수 있다. 또한, MPEG-4 AVC에서 인트라 예측(Intra Prediction) 수행을 위한 SPR(Special Prediction) 기능부(도시되지 않음) 등이 더 추가될 수도 있을 것이다.The
디코딩 처리부(550) 내에 구비된 각 기능부는 각 표준에 독립적으로 존재하지 않고, 표준에 관계없이 동일한 처리가 가능한 기능부의 경우에는 하나의 기능부로 통합되어 구비될 수도 있음은 자명하다. 각 기능부의 기능은 당업자에게 자명한 사항이므로 간략히 설명하기로 한다.Each functional unit included in the
DF 기능부(710)는 MPEG-4 AVC의 디-블록킹 필터(de-blocking filter)이고, VR 기능부(715)는 복원된 픽셀값을 저장하는 기능부이다. The
FFR 기능부(720)는 interlaced 모드를 위한 기능부이고, IPR 기능부(730)는 MPEG-4 AVC의 인트라 예측(Intra prediction)을 한 후 복원된 픽셀값을 저장하는 기능부이다. 상술한 바와 같이, MPEG-4 AVC의 인트라 예측은 SPR 기능부에 의해 수행될 수 있을 것이다. The
IT 기능부(735)는 DC값 및 AC값들의 역 변환(inverse transform)을 수행하는 기능부이고, IQ 기능부(745)는 AC 값들을 역 양자화(inverse quantization)하는 기능부이다.The
IAP 기능부(755)는 AC값들을 역 예측(inverse AC prediction)하는 기능부이고, IS 기능부(760)는 AC값들을 역 스캔(inverse scan)하는 기능부이다. DCR 기능부(765)는 DC값들의 역 예측 및 역 양자화를 수행하는 기능부이다.The
상술한 SYN 파서(540)와 디코딩 처리부(550)는 개별적으로 동작 개시되며, 디코딩 처리부(550) 내의 각 기능부는 디코딩 제어부(530)의 활성화 제어에 의해 활성화된 후 처리를 위해 필요한 CSCI 및/또는 데이터가 저장부(520)에 기록되면 개별적으로 동작을 개시한다.The
CSCI 저장부(522)에는 SYN 파서(540)에서 제2 디코딩 디스크립션(즉, CSCIT(440), DHT(445), SET(450), S-RT(460), DVT(470))를 이용한 신택스 파싱에 의한 결과값인 엘리먼트 정보(예를 들어, CSCI)를 CSCI 저장부(522)에 저장한다. 엘리먼트 정보는 CSCIT(440)에 상응하도록 저장된다. CSCI 저장부(522)는 예를 들어 버퍼 메모리(buffer memory)일 수 있다.The
CSCI 저장부(522)에 저장된 엘리먼트 정보는 SYN 파서(540)에 의해 SET(450)의 프로세스 수행을 위한 입력 데이터로 이용되거나, S-RT(460)에서 후속하는 연결 인덱스를 결정하기 위한 제어 변수 등으로 이용될 수 있다. The element information stored in the
또한, CSCI 저장부(522)에 저장된 엘리먼트 정보는 F-RT(420)를 참조하여 디코딩 제어부(530)가 계층 구조 단위로 활성화한 각 기능부들이 FU-CSCIT(430)에서 지정된 입력 CSCI를 CSCI 저장부(522)에 저장된 엘리먼트 정보들과 매핑하기 위해 이용될 수 있다. 물론, 디코딩 처리부(550) 내의 기능부들에 의해 이용될 수 있는 엘리먼트 정보라면 SYN 파서(540)가 데이터 저장부(524)에 저장할 수도 있음은 앞서 설명한 바와 같다.In addition, the element information stored in the
디코딩 제어부(530)는 다양한 표준에 의해 인코딩된 비트스트림을 디코딩하기 위해 SYN 파서(540) 또는/및 디코딩 처리부(550)에 포함된 각 기능부들이 활성화되도록 제어한다. 즉, 디코딩 제어부(530)는 F-RT(420)를 참조하여 디코딩 처리부(550)에 포함된 각 기능부들이 계층 구조 단위로 활성화되도록 제어한다. 이는, 하위 계층 구조에 속하는 기능부들을 위한 입력 데이터가 상위 계층 구조에 속하는 기능부들이 처리한 결과 데이터일 수 있기 때문이다. The
디코딩 제어부(530)가 각 기능부의 활성화 여부 및 각 기능부들이 인코딩된 데이터를 동영상 데이터로 처리하여 출력하기 위해 이용하는 테이블들로는 FL(410), F-RT(420), FU-CSCIT(430), CSCIT(440) 및 DHT(445)가 있다. 도 7에 예시된 복수의 기능부들이 상호 유기적으로 동작함으로써 인코딩된 데이터를 동영상 데이터로 변환하여 출력할 수 있다. 동영상 데이터로 변환하기 위해 어떤 기능부들이 순차적으로 동작되어야 하는지 여부는 각 인코딩 표준에 따라 상이할 수 있으며, 이는 당업자에게 자명한 사항이다. 따라서, 이하에서는 복수의 기능부들의 유기적 동작 제어를 위한 기초 정보로서 이용되는 확장 비트스트림에 포함된 제1 디코딩 디스크립션의 테이블들간의 유기적 관계를 중심으로 설명한다. Tables used by the
먼저, DHT(Decoding Hierarchy Table, 445)는 그림 16 및 하기 표 1에서 보 여지는 바와 같이, 코덱의 계층 구조와 각 계층별 하위 계층에 대한 정보를 기술한 테이블이다.First, as shown in Fig. 16 and Table 1, DHT (Decoding Hierarchy Table, 445) is a table describing the hierarchical structure of the codec and information on lower layers of each layer.
표 1. DHT(Decoding Hierarchy Table)Table 1. Decoding Hierarchy Table (DHT)
DHT(445)는 표 1에 예시된 바와 같이, 순차적으로 부여된 계층 번호인 Index, 각 계층의 명칭을 나타내는 name, 해당 계층의 하위 계층을 나타내는 Children Hierarchy 등의 항목을 포함할 수 있다. 계층의 수나 children hierarchy의 개수는 코덱에 따라 달리 표현될 수 있다. 예를 들어, 도 16에 예시된 바와 같이 VOP-3, MB-3 등이 더 존재하는 경우 이에 상응하는 계층 번호 등이 추가될 수 있음은 자명하다.As illustrated in Table 1, the
본 발명의 DHT(445)가 나타내는 계층 구조는 한 코덱을 기준하여 상이한 다른 코덱을 자유로운 계층 위치에, 자유로운 양식으로 통합할 수 있음을 의미한다. 즉, 통합 코덱을 이용하여 상이한 여러 코덱을 이용하여 하나의 새로운 코덱을 구성하고 이를 이용하여 동영상 압축 및 복원이 가능하다는 것이다. The hierarchical structure represented by the
또한, DHT(445)의 주된 기능은 주어진 코덱에 계층구조를 도입함으로써 디코 딩 디스크립션(decoder Description)을 사용하여 구성할 decoding solution의 다양한 구현(sequential/parallel, single/multiple threads, sw/hw hybrid decoding)을 용이하게 한다.In addition, the main function of the
표 1에 예시된 DHT(445)를 통하여 기술된 계층구조는 syntax 파싱 및 디코딩 과정에서 공통적으로 적용된다. 물론, syntax 파싱 또는 디코딩 과정에서 독립적으로 이용되기 위한 계층구조가 더 존재할 수도 있음은 자명하다. The hierarchy described through the
다음으로, FL(FU List, 410)은 하기 표 2에서 보여지는 바와 같이, 디코딩 처리부(550) 내에 구비된 각 기능부들의 리스트, 해당 기능부들의 입출력 데이터의 수량 등의 정보를 기술한 테이블이다. Next, as shown in Table 2, FL (FU List, 410) is a table describing information such as a list of respective functional units included in the
표 2. FL(FU List) Table 2. FL (FU List)
FL(410)은 각 기능부에 대한 입력 데이터가 기록된 전용 버퍼 영역의 명칭(또는 해당 데이터의 기록 주소 또는 해당 데이터가 기록된 버퍼 메모리 내의 주소)과 해당 기능부에 의한 출력 데이터가 기록될 전용 버퍼 영역의 명칭(또는 해당 데이터의 기록 주소 또는 해당 데이터가 기록될 버퍼 메모리 내의 주소)을 더 포함할 수 있다. 따라서, 각 기능부는 FL(410)을 이용하여 입력 데이터를 읽고 처리한 출력 데이터를 기록할 수 있다. 그러나, FL(410)에는 엘리먼트 정보를 생성하는 SYN 파서(540)의 입력 데이터 및 출력 데이터는 기재되어 있지 않으나, 이는 SYN 파서(540)가 SET(450) 등의 정보를 이용하여 엘리먼트 정보를 생성하고 지정된 위 치에 생성한 엘리먼트 정보를 기록하기 때문이다.The
FL(410)은 표 2에 예시된 바와 같이, 툴 박스(510) 내의 기능부(FU, Functional Unit)의 고유 번호인 FU ID, 각 기능부의 명칭인 FU name, 입력 데이터의 수량을 나타내는 input CSCI, 결과 데이터(출력 데이터)의 수량을 나타내는 output CSCI 등의 항목을 포함할 수 있다. FL(410) 내의 기능부 나열 순서는 FU-CSCIT(430)의 FU 나열순서 또는 Index No.에 대응된다. 각 기능부의 명칭인 FU name 항목에는 앞서 도 7을 참조하여 설명한 각 기능부들의 명칭이 기재될 수 있다.As illustrated in Table 2, the
디코딩 제어부(530)에 의해 활성화된 계층의 특정 기능부는 FU-CSCIT(430), CSCIT(440) 등을 이용하여 데이터 저장부(524)로부터 필요한 데이터를 독출하여 미리 설정된 프로세스를 수행하고, 출력 데이터를 생성한다. 생성된 출력 데이터는 데이터 저장부(524)에 기록될 수 있으며, 데이터 저장부(524)에 기록된 데이터는 후속 처리를 수행하는 기능부의 입력 데이터로 이용될 수 있다. 여기서, 기능부는 디코딩 처리부(550)에 포함되며, 입력 데이터를 미리 지정된 프로세스로 처리하여 출력데이터를 생성하는 일련의 처리 과정(예를 들어, 기능, 알고리즘 또는 함수 등)을 의미한다. The specific function unit of the layer activated by the
디코딩부(340)가 종래 비트스트림(105)에 포함된 인코딩된 비디오 데이터의 디코딩을 위해 하나의 표준만을 이용하면 충분한 경우, FL(410)은 해당 표준에서 상응하는 처리를 수행하기 위한 기능부들에 대한 정보만을 포함할 수 있다. If it is sufficient for the
그러나, 해당 비디오 데이터가 복수의 표준에 의해 인코딩된 경우(예를 들 어, 복수의 프레임 단위로 인코딩 표준을 달리 적용한 경우)에는 해당 인코딩된 비디오 데이터의 디코딩을 위해 복수의 표준에 따른 기능부들의 정보가 필요할 것이다. 따라서, 이 경우 FL(410)은 상응하는 복수의 표준에 따른 모든 기능부들 중 인코딩된 비디오 데이터의 디코딩을 위해 필요한 복수의 표준에 따른 기능부들의 정보를 포함하여야 할 것이다.However, if the video data is encoded by a plurality of standards (for example, if the encoding standard is applied differently in units of a plurality of frames), the functional units according to the plurality of standards may be used to decode the encoded video data. Information will be needed. Accordingly, in this case, the
물론, 비디오 데이터가 복수의 프레임 단위로 인코딩 표준을 달리 적용할지라도, 적용된 인코딩 표준별로 구분되어 복수의 종래 비트스트림(105) 및 확장 비트스트림(305)이 생성되어 제공된다면 각각의 FL(410)은 각각 상응하는 표준에 따른 기능부들의 정보만을 포함하면 될 것이다.Of course, even if the video data is differently applied to the encoding standard in the unit of a plurality of frames, if the plurality of
FL(410)은 textual description이나 binary description(비트 변환된 바이너리 코드 형태) 등의 기술 방식으로 기술될 수 있을 뿐 아니라, 상기 테이블 중 필요한 최소한의 데이터가 유사 스크립트 언어로 기술될 수도 있다.The
다음으로, F-RT(FU - Rule Table, 420)은 입력된 종래 비트스트림(105)을 복호화하기 위하여 사용될 기능부들의 연결 정보를 제공한다. 즉, F-RT(420)는 아래 표 3에 예시된 바와 같이 DHT(445)에서 명시한 계층 구조를 이용하여 상위 계층이 하위 계층을 호출하는 구조로 구성된다. Next, the F-RT (FU-Rule Table) 420 provides connection information of functional units to be used to decode the input
표 3. F-RT(Table 3. F-RT ( FUFU - - RuleRule TableTable ))
F-RT(420)는 표 3에서 보여지는 바와 같이, 각 계층 구조를 나타내는 Decoding Hierarchy, 활성화될 기능부 또는 호출할 하위 계층을 나타내는 Children, 루프 동작 여부를 나타내는 Loop, 루프 동작이 필요한 경우의 루프 조건을 나타내는 Loop Condition, 각 기능부 또는 하위 계층의 입력 정보(또는 활성화 순서)로서 Decording Hierarchy 또는 Children을 나타내는 Input 등을 포함한다.As shown in Table 3, the F-
표 3에 예시된 바와 같이, FH0의 계층이 가장 먼저 활성화될 것이며, FH1 계층은 입력 데이터로서 FU1의 결과 데이터를 이용하므로 후속하여 활성화될 것이다. 또는 FH1 계층도 FH0 계층과 동시에 활성화된 후 FU1의 결과 데이터가 데이터 저장부(524)에 저장될 때까지 처리 동작을 유보할 수도 있다. As illustrated in Table 3, the layer of FH0 will be activated first, and the FH1 layer will subsequently be activated since it uses the result data of FU1 as input data. Alternatively, after the FH1 layer is also activated at the same time as the FH0 layer, the processing operation may be suspended until the result data of the FU1 is stored in the
각 계층은 호출 시 instance/object 개념으로 독립성이 보장되는 객체로 생성된다. 즉, FH1[0], FH1[1], FH1[2], …, FH1[n] 같이 다수의 FH1을 생성하며, 이 구조는 다른 계층(예를 들어, FH0, FH2, FH3 등)에도 동일하게 적용될 수 있다. 또한 각 객체별 전용 버퍼 공간도 할당될 수 있다. 도 20 및 도 21에 예시된 바와 같이, 각 전용 버퍼 공간에는 특정 계층 구조 또는 해당 계층 구조 내의 기능부의 처리를 위한 CSCI 또는 데이터가 저장된다.Each layer is created as an object that ensures independence in the concept of instance / object when called. That is, FH1 [0], FH1 [1], FH1 [2],... It creates multiple FH1s, such as FH1 [n], and this structure can be equally applied to other layers (eg, FH0, FH2, FH3, etc.). In addition, a dedicated buffer space for each object may be allocated. As illustrated in FIGS. 20 and 21, each dedicated buffer space stores CSCI or data for processing a specific hierarchical structure or a functional unit within the hierarchical structure.
F-RT(420)는 textual description이나 binary description(비트 변환된 바이너리 코드 형태) 등의 기술 방식으로 기술될 수 있을 뿐 아니라, 상기 테이블 중 필요한 최소한의 데이터가 유사 스크립트 언어로 기술될 수도 있다.The F-
다음으로, FU-CSCIT(FU CSCI Table, 430)은 CSCI 저장부(522)에 저장된 엘리먼트 정보와 각 기능부가 필요로 하는 엘리먼트 정보(input CSCI)를 연결하기 위한 테이블이다.Next, the FU-CSCIT (FU CSCI Table) 430 is a table for connecting element information stored in the
표 4. Table 4. FU-FU- CSCIT(CSCIT ( FUFU CSCICSCI TableTable ))
위의 표 4에 예시된 바와 같이, FU-CSCIT(430)는 FL(410)의 FU ID와 1:1 매핑(mapping)되는 Index No, CSCI에 대한 정보 및 매핑을 위한 CSCIT(440)의 인덱스(CSCI table element)를 포함한다. FL(410)의 기능부 나열 순서와 FU-CSCIT(430)의 Index No.의 나열 순서에 의해 양자는 1:1 매핑된다. 즉, 표 2의 첫번째 기능부인 FU-A는 FU-CSCIT(430)의 첫번째 인덱스인 Index No. 1과 매핑된다. As illustrated in Table 4 above, the FU-
또한, FU-CSCIT(430)는 각 Index No.별로 인터페이스 세트가 몇 개인지에 관한 정보를 더 포함한다. 인터페이스 세트의 수는 매핑되는 경우의 수를 의미한다. 즉, FL(410)의 D0092는 FU-CSCIT(430)에 의해 인터페이스 세트의 수가 하나로 지정되므로 엘리먼트 정보로서 CH2.C6 및 CH2.C1만을 사용한다. 그러나, D0098는 인터 페이스 세트의 수가 2이므로, 어떤 경우에는 엘리먼트 정보로서 CH3.C1 및 CH3.C6을 사용하고, 또 다른 경우에는 CH4.C2 및 CH4.C5를 사용한다. 각 기능부는 지정된 엘리먼트 정보를 CSCI 저장부(522) 또는 데이터 저장부(524)로부터 독출하여 미리 지정된 프로세스를 수행한 후 생성된 출력 데이터를 데이터 저장부(524)에 저장한다.In addition, the FU-
FU-CSCIT(430)에 각 Index No.별 인터페이스 세트의 수를 명시하는 목적은 하나의 기능부가 서로 다른 데이터 플로우(data flow)에 따라 상이한 처리 동작을 수행할 수도 있기 때문이다. 즉, 도 18에 예시된 바와 같이, FU-A가 MPEG-2 및 MPEG-4에서 동시에 이용될 수 있는 기능을 가진 기능부라면, MPEG-2 표준으로 인코딩된 데이터를 처리하는 경우와 MPEG-4 표준으로 인코딩된 데이터를 처리하는 경우 각각 상이한 엘리먼트 정보가 이용될 수 있을 것이다. 따라서, 각 표준에 따른 인코딩된 데이터를 처리할 때의 엘리먼트 정보가 구분될 수 있도록 복수의 인터페이스 세트가 요구된다.The purpose of specifying the number of interface sets for each Index No. in the FU-
FU-CSCIT(430)는 textual description이나 binary description(비트 변환된 바이너리 코드 형태) 등의 기술 방식으로 기술될 수 있을 뿐 아니라, 상기 테이블 중 필요한 최소한의 데이터가 유사 스크립트 언어로 기술될 수도 있다.The FU-
마지막으로, CSCIT(440)는 아래 표 5에서 보여지는 바와 같이, SYN 파서(540)가 SET(450), S-RT(460) 등을 이용한 프로세스의 결과 정보인 엘리먼트 정보(예를 들어, CSCI)에 대한 상세 정보가 기술된 것이다. 즉, CSCIT(440)는 종래 비트스트림(105)으로부터 처리되어 CSCI 저장부(522) 또는 데이터 저장부(524)에 저장되고, 디코딩 처리부(550)에 의해 이용될 모든 의미있는 자료(즉, 엘리먼트 정보)들에 대한 정보를 가진다.Finally, as shown in Table 5 below, the
표 5. Table 5. CSCITCSCIT
위의 표 5에 예시된 바와 같이, CSCIT(440)는 각 엘리먼트 정보의 계층 구분, 해당 엘리먼트 정보의 고유 번호로서 구분자인 인덱스(Index), 해당 엘리먼트 정보의 이름(Element Name), 해당 엘리먼트 정보의 자료 구조적인 특성을 지정하기 위한 속성(예를 들어, 해당 엘리먼트 정보가 정수형(Integer)인지 배열형(Array)인지 여부 등) 등을 포함한다. 계층별로 구성된 CSCI정보는 디코더 구성 시 필요에 따라 여러 개의 배열의 형태로 사용할 수도 있다.As illustrated in Table 5 above, the
CSCIT(440)는 textual description이나 binary description(비트 변환된 바이너리 코드 형태) 등의 기술 방식으로 기술될 수 있을 뿐 아니라, 상기 테이블 중 필요한 최소한의 데이터가 유사 스크립트 언어로 기술될 수도 있다.The
이어서, SYN 파서(540)가 종래 비트스트림(105)으로부터 엘리먼트 정보를 추출 또는 생성하여 CSCI 저장부(522)에 저장하기 위하여 이용하는 CSCIT(440), DHT(445), SET(450), S-RT(460) 및 DVT(470)에 관하여 설명하기로 한다. 다만, CSCIT(440) 및 DHT(445)는 앞서 이미 설명하였으므로 이에 대한 설명은 생략한다. 도 6에 예시된 복수의 기능부들이 상호 유기적으로 동작함으로써 엘리먼트 정보를 생성하여 저장부(520)에 저장할 수 있다. 엘리먼트 정보의 유형은 각 인코딩 표준에 따라 상이할 수 있으며, 이는 당업자에게 자명한 사항이다. 따라서, 이하에서는 복수의 기능부들 또는 하나의 기능부로 통합된 SYN 파서(540)가 엘리먼트 정보들을 생성하여 저장부(520)에 저장하기 위해 이용되는 확장 비트스트림에 포함된 제2 디코딩 디스크립션의 테이블들간의 유기적 관계를 중심으로 설명한다.Subsequently, the
먼저, SET(450)는 아래 표 6에서 보여지는 바와 같이, 입력된 종래 비트스트림(105)의 신택스(syntax)들에 대한 정보에 의해 구성된 테이블이다. First, as shown in Table 6 below,
표 6. SET(Syntax Element Table)Table 6. Syntax Element Table (SET)
위의 표 6에 예시된 바와 같이, SET(450)는 각 신택스에 대한 인덱스(index), 엘리먼트 정보의 명칭(Element Name), 입력 데이터(input data) 및 SET-프로세스(process by SET-PROC) 정보를 포함한다. 여기서 인덱스는 S-RT(460)에서 사용되는 각 신택스를 구분하는 구분자(S)이다. As illustrated in Table 6 above, the
엘리먼트 명칭은 신택스의 이름으로, 신택스의 의미나 역할에 따라 명명될 수 있다. 입력 데이터는 종래 비트스트림(105)에서 한 번에 입력되는 명목적 비트 길이이다. SET-프로세스는 각 비트스트림 신택스를 입력 받아 어떤 가공 절차를 거쳐 출력 데이터인 엘리먼트 정보를 생성할 것인지의 과정을 기술한다. 참고로, 인덱스 S0에 상응하는 SET-프로세스 "READ 32 B; (IBS==HEX:1B0)>>;"는 32비트를 독출하여 "(IBS==HEX:1B0)"를 만족하면 해당 정보를 출력(>>)하라는 의미이다. 출력 데이터는 엘리먼트 정보(즉, CSCI 정보(C))로서, S-RT(460)의 Syntax #ID를 참조하여 S-RT(460)에 규정된 CSCI 정보(예를 들어, CH0.C1 등)로 CSCI 저장부(522) 또는 데이터 저장부(524)에 저장된다. The element name is a name of a syntax and may be named according to the meaning or role of the syntax. The input data is the nominal bit length input at one time in the
SET(450)는 textual description이나 binary description(비트 변환된 바이너리 코드 형태) 등의 기술 방식으로 기술될 수 있을 뿐 아니라, 상기 테이블 중 필요한 최소한의 데이터가 유사 스크립트 언어로 기술될 수도 있다.The
다음으로, S-RT(460)는 아래 표 7에서 보여지는 바와 같이, 종래 비트스트림(105) 내의 각 신택스간의 계층 및 연결 정보를 나타낸 것이다. 즉, S-RT(460)는 상위 계층이 하위 계층의 신택스를 호출하고 다음 신택스로 이동하도록 지시하는 정보를 가진다. SYN 파서(540)는 S-RT(460)를 이용하여 종래 비트스트림(105)을 읽어 들이거나 엘리먼트 정보가 CSCI 저장부(522)에 저장 및/또는 갱신되는 순서를 규정한다. 도 17에 예시된 바와 같이, S-RT(460)를 참조하여 SYN 파서(540)는 여러 개의 쓰레드(thread)로 구성되어 상위의 쓰레드가 하위의 쓰레드를 호출할 수 있으므로, 계층별 Syntax 파싱이 수행될 수 있다.Next, as shown in Table 7 below, the S-
표 7. S-RT(Syntax Rule Table)Table 7. Syntax Rule Table (S-RT)
위의 표 7에 예시된 바와 같이, S-RT(460)는 각 신택스의 계층 구분(Decoding Hierarchy), 인덱스(R), 신택스의 아이디(Syntax #ID), 입력 데이터(CSCI), 분기 정보(Branch Information)를 포함한다. As illustrated in Table 7 above, the S-
인덱스(R)은 각 연결 정보(Rule)를 구분하도록 한다. 신택스의 인덱스(S)는 각 계층 내에서 특정 연결 인덱스에서 처리할 신택스를 지정하므로, SYN 파서(540)는 SET(450)을 이용하여 해당 신택스에 대해 지정된 프로세스를 수행한다. The index R distinguishes each connection information rule. Since the index S of the syntax specifies a syntax to be processed at a specific connection index within each layer, the
입력 데이터는 해당 연결 인덱스에서의 연결 제어를 위한 조건 판단에 사용될 엘리먼트 정보의 목록을 나타낸다. SET(450)에 의한 프로세스의 결과가 Syntax #ID에 상응하는 입력 데이터의 명칭으로 저장됨은 앞서 설명한 바와 같다.The input data represents a list of element information to be used for determining a condition for connection control in the corresponding connection index. The result of the process by the
분기 정보는 다음에 어떤 연결 인덱스를 처리할 것인지를 결정하도록 하는 조건 판단 알고리즘이다. 분기 정보에 의해 어떤 순서에 따라 어떤 내용을 읽어 들일지가 직접적으로 판단될 수 있다. 분기의 수가 1인 경우(예를 들어, Syntax #ID가 S1인 경우)에는 입력 데이터가 존재하지 않을 수 있다. Branch information is a condition determination algorithm that determines which connection index to process next. The branch information can directly determine which contents are read in what order. When the number of branches is 1 (for example, when the Syntax #ID is S1), input data may not exist.
S-RT(460)는 textual description이나 binary description(비트 변환된 바이너리 코드 형태) 등의 기술 방식으로 기술될 수 있을 뿐 아니라, 상기 테이블 중 필요한 최소한의 데이터가 유사 스크립트 언어로 기술될 수도 있다.The S-
마지막으로, DVT(470)는 아래 표 8에서 보여지는 바와 같이, 각 부호화기/복호화기에서 사용하는 허프만 테이블(Huffman table) 정보가 기록된 테이블이다. MPEG-1/2/4/AVC에서는 각 부호화 시 엔트로피 코딩(entropy coding)을 수행한다. 이 때 주로 허프만 코딩(Huffman coding) 방법이 이용되며, 이 경우 이용되는 정보가 허프만 테이블(Huffman table)이다. 통합 코덱을 구현하기 위해서는 각 복호 시 해당 복호화기에서 사용될 허프만 테이블(Huffman table) 정보가 제공되어야 한다. 따라서, 본 발명에 따른 디코딩 디스크립션 내에 신택스 파싱시 각 신택스(syntax)에 해당하는 허프만 테이블(Huffman table) 정보를 포함한다. 물론, 각 표준에 상응하는 허프만 테이블 정보가 이미 테이블 저장부(330)에 기록되어 있는 경우 DVT(470)의 전송은 생략되거나 도 10에 예시된 바와 같이 코덱 번호(Codec #, 1020)와 프로파일 및 레벨 번호(Profile and level #, 1030)만이 포함될 수도 있을 것이다.Finally, the
표 8. DVT(Default Value Table)Table 8. Default Value Table
표 8에 예시된 바와 같이, DVT(470)는 각 허프만 테이블에 대한 이름(name), 허프만 코딩에 의해 압축되어 출력되는 실제 값(value) 및 압축된 실제 값이 종래 비트스트림(105)에 저장될 때 사용되는 코드 값(code)을 포함한다. 예를 들어, MCBPC 값을 압축하여 3이란 실제 값(value)을 얻었다면, 허프만 테이블 매핑(Huffman table mapping) 작업(예를 들어, SET(450)의 PROCESS 부분)에 의해 종래 비트스트림(105)에는 코드 값(code) 011이 기록된다. 다른 예로서, SET(450)의 특정 인덱스의 Process 부분에 VLD[1]이라 기록되어 있다면 VLD라는 함수를 호출하여, 해당 함수에 의해 미리 지정된 길이(고정길이 또는 가변 길이)만큼 종래 비트스트림(105)을 읽어 코드 값(code)값을 얻은 후 허프만 테이블 매핑(Huffman table mapping) 작업에 의해 상응하는 실제 값(value)을 얻을 수 있다. 이 때 사용되는 Huffman table은 [1], 즉 1번째 테이블인 CBPY이다.As illustrated in Table 8, the
DVT(470)는 textual description이나 binary description(비트 변환된 바이너리 코드 형태) 등의 기술 방식으로 기술될 수 있을 뿐 아니라, 상기 테이블 중 필요한 최소한의 데이터가 유사 스크립트 언어로 기술될 수도 있다.The
일 예로, DVT(470)는 아래와 같이 textual description될 수 있다.For example, the
DVT{((0,1), (1,001), (2,010), (3,011), (4,0001), (5,000001), (6,000010), (7,000011), (8,000000001), (9,NULL)) ((0,0011), (1,00101), (2,00100), (3,1001), (4,00011),(5,0111), (6,000010), (7,1011), (8,00010), (9,000011), (10,0101), (11,1010), (12,0100), (13,1000), (14,0110), (15,11), (16,000000), (17,000001), (18,NULL)) ((0,011), (1,11), (2,10), (3,010), (4,001), (5,0001), (6,00001), (7,000001), (8,0000001), (9,00000001), (10,000000001), (11,0000000001), (12,00000000001), (13,NULL)) ((0,11), (1,10), (2,01), (3,001), (4,0001), (5,00001), (6,000001), (7,0000001), (8,00000001), (9,000000001), (10,0000000001), (11,00000000001), (12,000000000001), (13,NULL))...DVT {((0,1), (1,001), (2,010), (3,011), (4,0001), (5,000001), (6,000010), (7,000011), (8,000000001) , (9, NULL)) ((0,0011), (1,00101), (2,00100), (3,1001), (4,00011), (5,0111), (6,000010), (7,1011), (8,00010), (9,000011), (10,0101), (11,1010), (12,0100), (13,1000), (14,0110), (15 , (11), (16,000000), (17,000001), (18, NULL)) ((0,011), (1,11), (2,10), (3,010), (4,001), (5, 0001), (6,00001), (7,000001), (8,0000001), (9,00000001), (10,000000001), (11,0000000001), (12,00000000001), (13, NULL) ) ((0,11), (1,10), (2,01), (3,001), (4,0001), (5,00001), (6,000001), (7,0000001), (8 , 00000001), (9,000000001), (10,0000000001), (11,00000000001), (12,000000000001), (13, NULL)) ...
다른 예로서, DVT(470)는 아래와 같이 binary description될 수 있다.As another example, the
00000011111111111111111111111110111110000110001100100011010000110110010000010011000000100110000010001100000110100100000000100000111110010000110010100101001010010000100100100101000110010001110011000001000100101100101000100011000001100100010100100101000100010000100100000100011000010110011000000000110000 00100000111110001101100010110001010000110100001100100100000100101000010011000000100111000000101000000000010100100000000101010000000000101011000000000010000011111000101100010100001001000110010010000010010100001001100000010… 00000011111111111111111111111110111110000110001100100011010000110110010000010011000000100110000010001100000110100100000000100000111110010000110010100101001010010000100100100101000110010001110011000001000100101100101000100011000001100100010100100101000100010000100100000100011000010110011000000000110000 00100000111110001101100010110001010000110100001100100100000100101000010011000000100111000000101000000000010100100000000101010000000000101011000000000010000011111000101100010100001001000110010010000010010100001001100000010 ...
각 테이블들은 binary description됨으로써 저장 공간을 감소시키고, 처리 효율을 증진시키며, 디코딩 디스크립션을 포함한 확장 비트스트림(305) 전송 시간을 감소시킬 수 있는 장점이 있다. Each table has the advantage of being able to reduce storage space, improve processing efficiency, and reduce transmission time of the
이하, SYN 파서(540) 및/또는 디코딩 제어부(530)에 의해 이용되는 각 테이블간의 연동 과정을 설명한다. Hereinafter, the interworking process between the tables used by the
먼저, 디코딩 제어부(530)는 테이블 저장부(330)에서 F-RT(420)에 규정된 최상위 계층의 기능부들을 호출한다. 호출된 기능부들은 처리를 위해 필요한 CSCI 정보 및/또는 데이터가 SYN 파서(540)에 의해 저장부(520)에 저장될 때까지 대기한다.First, the
SYN 파서(540)는 S-RT(460)의 규칙 정보(Rule)들 중 최상위 계층에 해당하는 Syntax를 읽고, SET(450)에 의해 VS Start Code임을 인식하고, 종래 비트스트림(105)에서 상응하는 비트(즉, SET(450)에 입력값으로 설정된 32비트)를 읽어 SET 프로세스 수행에 따른 출력값(즉, 엘리먼트 정보로서, C0)을 S-RT(460)에 규정된 입력 데이터(CSCI)의 명칭으로 CSCI 저장부(522)에 저장한다. CSCI 저장부(522)에 저장된 당해 엘리먼트 정보가 무엇인지 또한 어떤 계층에서 이용되는지는 CSCIT(440)에 기재되어 있다. 이어서, SYN 파서(540)는 CSCI 저장부(522)에 저장된 엘리먼트 정보(즉, C0)를 S-RT(460)의 상응하는 분기 정보에 대입하고, 그 결과에 상응하는 인덱스의 처리를 위해 진행한다. 예를 들어, 인덱스 SH0.SH1에 상응하는 분기 정보는 'CH0.C0==1'이므로 이를 만족하면 SH0 계층 내의 인덱스 SR2으로 진행할 것이고, 그렇지 않으면 Error 처리한다. The
그러나, SYN 파서(540)가 SET(450)를 이용하여 엘리먼트 정보를 생성하여 CSCI 저장부(522)에 저장하는 과정에서, VLD 함수가 호출되면(예를 들어, SET(450)의 인덱스 S74) DVT(470)를 이용하여 엔트로피 디코딩을 수행한다. 이 과정에서 엘리먼트 정보가 생성되면 CSCI 저장부(522)에 저장한다. However, when the
SYN 파서(540)에 의해 엘리먼트 정보 또는/및 데이터가 저장부(520)에 저장되는 동안 디코딩 처리부(550) 내의 활성화된 각각의 기능부는 미리 지정된 프로세스의 수행을 위해 필요한 엘리먼트 정보 또는/및 데이터가 모두 저장되었는지 여부를 확인한다. 해당 기능부는 모두 저장되었는지 여부를 FU-CSCIT(430)를 참조하여 확인할 수 있다. 또한, 해당 엘리먼트 정보들이 무엇인지는 CSCIT(440)와의 매핑(mapping)을 통해 인식할 수 있다. 필요한 엘리먼트 정보들 또는/및 데이터가 모두 저장된 기능부는 미리 지정된 프로세스의 수행을 개시하여, 처리된 결과 데이터를 데이터 저장부(524)에 저장한다.While the element information or / and data is stored in the
앞서 설명한 바와 같이, 기능부들은 계층 구조 단위로 순차적 활성화 또는 호출될 수 있다. 계층 구조 단위의 활성화는 예를 들어 현재 어떤 계층에서 필요한 엘리먼트 정보 또는/및 데이터의 처리가 완료되었는지 여부를 감시하는 디코딩 제어부(530)에 의해 제어될 수 있다. 호출된 기능부들은 미리 지정된 프로세스의 수행을 위해 필요한 엘리먼트 정보 또는/및 데이터의 저장이 인식되면 이를 독출하여 처리한다. 이러한 과정을 통해 각 기능부들이 순차적으로 또는 병렬적으로 연결되어 처리를 수행하는 것과 동일한 효과가 발생된다.As described above, the functional units may be sequentially activated or called in hierarchical units. The activation of the hierarchical unit may be controlled by the
동영상 데이터로의 변환을 위해 필요한 모든 기능부들의 계층이 모두 활성화됨으로써 디코딩부(340)는 입력된 종래 비트스트림(105)에 상응하는 동영상 데이터를 출력할 수 있다.Since all layers of all the functional units necessary for the conversion to the video data are activated, the
도 22는 본 발명의 일 실시예에 따른 syntax 파싱 및 데이터 디코딩의 병렬 처리를 개념적으로 나타낸 도면이다. 도 22에 도시된 바와 같이, 상술한 디코딩 디스크립션 정보를 이용하면 SYN 파서(540)에 의한 Syntax 파싱과 디코딩 처리부(550)에 의해 데이터 디코딩이 개별적(독립적)으로 수행될 수 있다. 즉, 데이터 디코딩을 위해 각 기능부에서 필요로하는 엘리먼트 정보 및/또는 데이터가 저장부(520)에 저장되기만 하면 해당 기능부는 미리 지정된 프로세스를 수행할 수 있다. 또한, 디코딩 처리를 수행하는 디코딩 처리부(550) 내의 각 기능부간에도 타 기능부의 결과 데이터가 입력 데이터로 이용되는 관계가 아니라면 각 기능부간에도 독립적인 기능 수행이 가능하다.22 is a diagram conceptually illustrating parallel processing of syntax parsing and data decoding according to an embodiment of the present invention. As illustrated in FIG. 22, using the above-described decoding description information, data decoding may be performed separately (independently) by the syntax parsing and
따라서, 본 발명에 따른 복호화기(300)는 Syntax 파싱이 모두 완료된 후 디코딩 처리부(550)가 동작 개시되도록 제약되지 않으며, SYN 파서(540)와 디코딩 처리부(550)가 개별적인 처리가 가능하며, 또한 디코딩 처리부(550) 내의 기능부들 간에도 개별적인 처리가 가능한 장점이 있다.Accordingly, the
이하, 각 테이블들을 구성하는 명령어들에 대해 상세히 설명하기로 한다.Hereinafter, the commands constituting each table will be described in detail.
앞서 예시한 각 표들에는 각 테이블들에서 이용되는 명령어들이 예시되어 있 다. 예시된 각각의 명령어들을 이용하여 MPEG-2/MPEG-4/MPEG-4 AVC 등과 같은 표준의 syntax를 파싱하기 위한 정보(즉, 테이블)를 구성 할 수 있다. In each of the tables illustrated above, commands used in the tables are illustrated. Each of the illustrated instructions may be used to construct information (ie, a table) for parsing a standard syntax such as MPEG-2 / MPEG-4 / MPEG-4 AVC.
각 테이블들을 구성하기 위한 명령어들로는 READ, SEEK, FLUSH, IF, WHILE, UNTIL, DO~WHILE, DO~UNTIL, BREAK, SET, STOP, PUSH 등이 있을 수 있다. 물론, 모든 명령어가 각 테이블 내에 모두 이용되어야 하는 것은 아니며, 각 테이블별로 임의의 명령어가 선택적으로 이용될 수 있음은 자명하다. 이하, 각 명령어의 용도를 간략히 설명하도록 한다.Commands for configuring each table may be READ, SEEK, FLUSH, IF, WHILE, UNTIL, DO ~ WHILE, DO ~ UNTIL, BREAK, SET, STOP, PUSH, and so on. Of course, not all commands need to be used in each table, and it is obvious that any command may be selectively used for each table. Hereinafter, the purpose of each command will be briefly described.
먼저, READ는 비트스트림에서 일정 비트를 읽어들이기 위한 명령어이다. 예를 들어, "READ bits B > CSCI;"와 같이 표현될 수 있다. 여기서, "bits"는 읽어들일 비트 수를 나타내고, "B"는 Byte-alignment 플래그이고, "> CSCI"는 저장할 CSCI 인덱스를 나타낸다. "B"와 "> CSCI"는 옵션(option)으로 이용되며, "> CSCI"가 지정되지 않으면 변수 IBS에만 저장하도록 설정된다.First, READ is a command for reading a certain bit from the bitstream. For example, it may be expressed as "READ bits B> CSCI;". Here, "bits" represents the number of bits to be read, "B" represents a Byte-alignment flag, and "> CSCI" represents a CSCI index to be stored. "B" and "> CSCI" are used as options. If "> CSCI" is not specified, it is set to store only in the variable IBS.
다음으로, SEEK는 비트스트림에서 일정 비트를 읽어들이되, 파일 포인터를 이동하지 않도록 하는 명령어이다. 파일 포인터란 일정 비트를 읽어들이는 등의 동작시 기준 위치를 의미한다. SEEK 명령어의 파라미터는 앞서 설명한 READ와 동일하게 적용할 수 있다. Next, SEEK reads a bit from the bitstream but does not move the file pointer. The file pointer means a reference position during an operation such as reading a predetermined bit. The parameters of the SEEK command can be applied in the same way as the READ described above.
다음으로, FLUSH는 비트스트림에서 일정 비트 수만큼 파일 포인트를 이동하는 명령어이다. 파라미터는 READ와 유사하게 적용할 수 있다.Next, FLUSH is a command for moving a file point by a certain number of bits in the bitstream. Parameters can be applied similarly to READ.
다음으로, IF는 "IF (condition) { ~ } ELSE { ~ }"의 형태로 이용될 수 있으며, 주어진 조건에 따른 분기를 제공하는 명령어이다.Next, IF may be used in the form of "IF (condition) {~} ELSE {~}", and is an instruction that provides a branch according to a given condition.
다음으로, WHILE은 "WHILE (condition) { ~ }"의 형태로 이용될 수 있으며, 주어진 조건이 참(True)인 동안 지정된 블록을 반복하여 수행하도록 하는 명령어이다.Next, WHILE can be used in the form of "WHILE (condition) {~}", and is a command to repeatedly execute a designated block while a given condition is true.
다음으로, UNTIL은 "UNTIL (condition) { ~ }"의 형태로 이용될 수 있으며, 주어진 조건이 참이 될 때까지 지정된 블록을 반복하여 수행하도록 하는 명령어이다.Next, UNTIL can be used in the form of "UNTIL (condition) {~}", which is a command to repeatedly execute a designated block until a given condition becomes true.
다음으로, DO~WHILE은 "DO { ~ } WHILE (condition)"의 형태로 이용될 수 있으며, WHILE문을 변형하여 조건 판단에 앞서 블록을 실행하도록 하는 명령어이다.Next, DO ~ WHILE can be used in the form of "DO {~} WHILE (condition)", and it is a command to transform a WHILE statement to execute a block before determining a condition.
다음으로, DO~UNTIL은 "DO { ~ } UNTIL (condition)"의 형태로 이용될 수 있으며, UNTIL문을 변형하여 조건 판단에 앞서 블록을 실행하도록 하는 명령어이다.Next, DO ~ UNTIL can be used in the form of "DO {~} UNTIL (condition)", which is a command to transform a UNTIL statement to execute a block before determining a condition.
다음으로, ( ~ ) (compute)라는 명령어는 예를 들어 "(C11=(V2+3));"의 형태로 이용된다. 즉, SET-PROC의 모든 계산식이 괄호 안에 기록되도록 할 수 있으며, 사칙연산, 대입, 비교, 가산/감산 (++/--), 비트 연산, 논리합/논리곱, CSCI 사용여부 체크 등의 연산자가 이용될 수 있다.Next, the command (~) (compute) is used in the form of "(C11 = (V2 + 3));". In other words, all calculations of SET-PROC can be written in parentheses. Operators such as arithmetic, assignment, comparison, addition / subtraction (++ /-), bitwise operation, logical sum / logical product, and check whether CSCI is used or not Can be used.
다음으로, BREAK는 가장 가까운 루프 구조로부터 이탈하도록 하는 명령어이다.Next, BREAK tells you to break away from the nearest loop structure.
다음으로, SET은 지정된 CSCI들에 대한 사용 여부 플래그를 설정하는 명령어로서, 플래그를 지정할 CSCI들이 나열되며 콤마(,)에 의해 구분(예를 들어, SET C0, C2;)될 수 있다.Next, SET is a command for setting whether to use flags for designated CSCIs, and CSCIs for designating flags are listed and separated by commas (eg, SET C0, C2;).
다음으로, STOP은 현재 수행중인 신택스 엘리먼트(Syntax Element)의 처리를 중단하고 다음으로 넘어가도록 하는 명령어이다.Next, STOP is a command for stopping the processing of the currently executing syntax element and moving on to the next.
다음으로, PUSH는 배열형 CSCI에서, 데이터가 기록된 맨 마지막 지점에서부터 주어진 데이터를 추가하도록 하는 명령어로서, 추가된 값들이 나열되며(예를 들어, PUSH C8 8, 16, 32;) 콤마에 의해 구분된다.Next, PUSH is an instruction to add a given data from the last point in which data was recorded in the array CSCI, and the added values are listed (for example, PUSH C8 8, 16, 32;) by comma. Are distinguished.
다음으로, GO는 지정한 위치로 분기하도록 하는 명령어이다. 예를 들어, GO SR#;;인 경우 SR#으로 분기하라는 명령이며, GO RT는 호출한 곳으로 복귀(return)하라는 명령이다.Next, GO tells you to branch to the specified location. For example, GO SR # ;; is a command to branch to SR #, and GO RT is a command to return to where it was called.
다음으로, HEX는 HEX 명령어 뒤에 나오는 값이 16진수임을 나타내는 명령어이다.Next, HEX is a command that indicates that the value following the HEX command is hexadecimal.
다음으로, RLD는 MPEG-4에서 지원되는 RLD 함수를 위한 인터페이스로서, "RLD index, level, run, islastrun, t#;"의 형태로 이용될 수 있다. 여기서, index, level, run 및 islastrun는 RLD 반환값을 저장하는 CSCI 혹은 내부 변수를 나타내고, t#는 RLD에 사용되는 Huffman Table ID를 나타낸다.Next, RLD is an interface for an RLD function supported in MPEG-4, and may be used in the form of "RLD index, level, run, islastrun, t #;". Here, index, level, run, and islastrun represent CSCI or internal variables storing the RLD return value, and t # represents the Huffman Table ID used for the RLD.
다음으로, VLD2는 MPEG-2용 VLD 함수로서, "VLD2 [t#] in > v1, v2, v3;"의 형태로 이용될 수 있다. 여기서, t#는 VLD에 사용되는 Huffman Table ID이고, in은 입력되는 index값을 나타내며, v1~v3은 출력 결과값을 나타낸다.Next, VLD2 is a VLD function for MPEG-2, and may be used in the form of "VLD2 [t #] in> v1, v2, v3;". Here, t # is a Huffman Table ID used for the VLD, in represents an index value to be input, and v1 to v3 represent an output result value.
마지막으로, VLD4는 MPEG-4용 VLD 함수로서, "VLD4 [T#] > CSCI;"의 형태로 이용될 수 있다. 여기서, t#는 VLD에 사용되는 Huffman Table ID를 나타내고, "> CSCI"는 저장할 CSCI 인덱스를 나타낸다. "> CSCI"는 옵션(option)으로, 지정하지 않으면 변수 IBS에만 저장되도록 한다.Finally, VLD4 is a VLD function for MPEG-4, and may be used in the form of "VLD4 [T #]> CSCI;". Here, t # represents a Huffman Table ID used for the VLD, and "> CSCI " represents a CSCI index to be stored. "> CSCI" is an option. If not specified, it is stored only in the variable IBS.
도 8은 본 발명의 바람직한 제1 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면이고, 도 9는 본 발명의 바람직한 제2 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면이며, 도 10은 본 발명의 바람직한 제3 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면이고, 도 11은 본 발명의 바람직한 제4 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면이다.8 is a diagram showing the configuration of an extended bitstream according to the first preferred embodiment of the present invention, FIG. 9 is a diagram showing the configuration of an extended bitstream according to the second preferred embodiment of the present invention, and FIG. FIG. 11 is a diagram illustrating a configuration of an extended bitstream according to a third preferred embodiment of the present invention, and FIG. 11 is a diagram illustrating a configuration of an extended bitstream according to a fourth preferred embodiment of the present invention.
도 8 내지 도 10에 예시된 바와 같이, 본 발명에 따른 확장 비트스트림(305)에 포함되는 디코딩 디스크립션은 테이블 정보를 포함하지 않고 적용된 표준 정보만을 포함하도록 구성되거나(No table), 테이블 정보를 모두 포함하도록 구성되거나(Full tables), 일부의 테이블 정보만이 포함되도록 구성될 수 있다(Partial tables). 이들 각각을 구분하기 위하여, 디코딩 디스크립션 정보는 SI(Stream Identifier) 정보를 포함할 수 있고, SI 정보는 아래의 표 2와 같이 구분될 수 있다.As illustrated in FIGS. 8 to 10, the decoding description included in the
표 9. Stream IdentifierTable 9. Stream Identifier
도 9에 예시된 바와 같이, 확장 비트스트림(305)은 디코딩 디스크립션으로서, 테이블 정보를 포함하지 않음을 표시하는 SI(810, 즉 00), 코덱 번호(Codec #, 820)과 프로파일 및 레벨 번호(Profile and level #, 830)을 포함할 수 있다. As illustrated in FIG. 9, the
이는 테이블 정보를 보내지 않고 테이블 저장부(330)에 이미 저장된 테이블 정보들을 사용하는 경우이다. 해당 종래 비트스트림(105)이 어떤 코덱과 프로파일 및 레벨을 사용하는지에 대한 기본 정보만 보낼지라도, 디코딩부(340)는 지시된 테이블들을 이용하여 복호화할 수 있다.This is a case of using the table information already stored in the
이를 위해, SET(450), CSCIT(440), FL(410), FU-CSCIT(430), DVT(470) 등이 적용 표준(즉, 코덱)별로 기술되고, F-RT(420), S-RT(460) 등은 각 적용 표준의 프로파일(profile) 별로 기술 될 수 있다(표 10 및 11 참조). For this purpose,
표 10. 코덱별 테이블 구분Table 10. Table breakdown by codec
표 11. Profile and level별 테이블 구분Table 11.Table Classification by Profile and Level
MPEG-4 SP의 경우 SET#3, FL#3, CSCIT#3, FU-CSCIT#3, DVT#3, F-RT#3-1, S-RT#3-1을 사용하여 복호화 방법을 설명 할 수 있으며, 코덱 번호를 3으로 프로파일 및 레벨 번호를 2로 지정하여 전송하면 디코딩부(340)는 이에 해당하는 테이블들을 참조하여 복호화 작업을 수행할 수 있다.For MPEG-4 SP, the decoding method is explained using
또한, 도 9에 도시된 바와 같이, 확장 비트스트림(305)은 디코딩 디스크립션으로서, 앞서 설명한 모든 테이블 정보들을 포함할 수 있다. 이 경우, SI(810)는 표 9를 참조할 때 01로 설정될 것이다. 각 테이블들은 테이블 식별자(TI, Table Identifier)(910), 테이블 시작 코드(TS Code, Table Start Code)(920), 테이블 디스크립션(TD, Table Description)(930), 테이블 종료 코드(TE Code, Table End Code)(940)를 포함할 수 있다. 테이블 식별자(910)와 테이블 시작 코드(920)의 순서는 변경될 수 있으며, 테이블 디스크립션(930)은 바이너리 디스크립션 형태로 기술될 수 있다. 물론, 각 테이블들의 순서는 변경될 수 있다. In addition, as illustrated in FIG. 9, the
또한, 도 10에 도시된 바와 같이, 확장 비트스트림(305)은 디코딩 디스크립션으로서, 앞서 설명한 일부의 테이블 정보들과 일부의 테이블 정보에 상응하는 코덱 번호 등을 포함할 수 있다. 이 경우, SI(810)는 표 9를 참조할 때 10으로 설정될 것이다. 다만, 이 경우는 테이블 정보들의 형식이 통일되지 않았으므로, 해당 테이블 정보가 어떤 형식으로 구성된 것인지를 판단할 수 있도록 구성 식별자(1010)을 테이블 식별자(910) 후단에 더 구비함이 바람직할 것이다. In addition, as shown in FIG. 10, the
또한, 도 11에 예시된 바와 같이, 확장 비트스트림은 테이블 정보에 대한 디코딩 디스크립션(T-DD, 1110)과 갱신 정보를 더 포함할 수 있다. 테이블 정보에 대한 디코딩 디스크립션(1110)은 앞서 도 8 내지 도 10을 참조하여 설명한 디코딩 디스크립션들 중 어느 하나일 수 있으며, SI(810)는 상응하는 값으로 설정될 것이다. 갱신 정보는 갱신 시작 코드(RS code, Revision Start code)(1120)와 갱신 내용(Revision, 1130)을 포함할 수 있다.In addition, as illustrated in FIG. 11, the extension bitstream may further include decoding description (T-DD) 1110 and update information for table information. The decoding description 1110 for the table information may be any one of the decoding descriptions described above with reference to FIGS. 8 to 10, and the
갱신 내용(1130)은 임의의 테이블의 규칙 정보(Rule)을 추가하거나 삭제하거나 갱신하는 등의 내용일 수 있다. 그 형태는 'insert index into table-name (…);', 'delete index from table-name;', 'update index in table-name(…);' 등일 수 있다. 예를 들어, SET#4에 S100을 추가하고자 하는 경우, 갱신 내용(1230)은 'insert S100 into SET#4 ("READ 1;IF(IBS==1){SET C31;}");'등의 형태로 구성될 수 있다. The update content 1130 may be content such as adding, deleting, or updating rule information of an arbitrary table. Its form is 'insert index into table-name (…);', 'delete index from table-name;', 'update index in table-name (…);' And the like. For example, if you want to add S100 to SET # 4, the update 1230 is 'insert S100 into SET # 4 ("
위와 같은 갱신 내용(1130)을 디스크립션 디코더(320)가 읽어 들여 해당 확장 비트스트림(305)에 대한 디코딩이 수행되는 동안은 테이블 저장부(330)에 변경된 내용의 테이블들이 저장되도록 한다. 그러나, 복호화가 완료되면 테이블 저장부(330)에 저장된 해당 테이블들을 원상태로 복원하여야 할 것이다. 복호화의 완료 여부는 디코딩부(340) 또는 트리거가 완료 통지를 디스크립션 디코더(320)로 제공하거나, 디스크립션 디코더(320)가 디코딩부(340)의 완료 여부를 감시함으로써 인식할 수 있을 것이다.As described above, the
상술한 바와 같이, 본 발명에 따르면 종래의 표준(즉, 코덱)에서 제공하는 기능부들을 사용하여 기존의 프로파일(profile)을 사용할 수도 있고, 기존의 기능부들을 이용하여 새로운 복호화기를 구성할 수도 있으며, 새로운 기능부를 이용하여 새로운 복호화기를 구현할 수도 있다. 즉, 다양한 또한 제한없는 복호화기 구현이 가능하다.As described above, according to the present invention, an existing profile may be used by using functional units provided by a conventional standard (ie, a codec), or a new decoder may be configured by using existing functional units. In addition, a new decoder may be implemented using a new function unit. That is, various and unlimited decoder implementations are possible.
다만, 새로운 기능부(Functional Unit)를 툴 박스(510)에 추가하는 경우, 해당 기능부에 대한 알고리즘(즉, 기능부에 대한 디스크립션)을 추가하고 해당 정보를 FL(410)에 추가하여야 할 것이다. 이 경우 상기 알고리즘에 대한 컴파일(compile) 과정이 추가적으로 필요할 수도 있다.However, when adding a new functional unit (Functional Unit) to the
통합 코덱을 구현하기 위해서는 다양한 부호화 방식에 의해 압축된 비트스트 림을 파싱하여 해당 부호화 방식에 대응되는 복호화 방식으로 비트스트림을 디코딩하도록 각 구성 요소를 유기적으로 제어 할 수 있어야 한다. In order to implement the integrated codec, each component must be organically controlled to parse a bitstream compressed by various coding methods and decode the bitstream using a decoding method corresponding to the corresponding coding method.
이 경우, 해당 비트스트림은 여러 가지 표준(코덱)을 혼합한 다양한 모양으로 구성된 비트스트림이거나 하나의 표준 내에서 다양한 부호화 방식에 의해 생성된 다양한 형태의 비트스트림일 수 있다. 또한 다양한 부호화/복호화 방법을 지원하기 위해서는 여러 가지 표준에서 사용되는 다양한 기능들을 별개의 유닛(Unit)으로 구분하고, 사용자가 원하고 필요로 하는 기능만을 선별하여 한 가지의 코덱(encoder and decoder)을 만들 수 있어야 한다.In this case, the corresponding bitstream may be a bitstream composed of various shapes in which various standards (codecs) are mixed or various types of bitstreams generated by various coding schemes within one standard. In addition, in order to support various encoding / decoding methods, various functions used in various standards are divided into separate units, and only one function and a function required by the user are selected to select one codec (encoder and decoder). You should be able to make it.
상술한 바와 같이, 본 발명은 디코딩 디스크립션이 함께 제공되도록 함으로써 비트스트림이 부호화된 부호화 방식에 관계없이 동일한 정보 해석 방법으로 각 기능부들을 유기적으로 연결하고 제어할 수 있는 장점을 가진다.As described above, the present invention has an advantage that the functional description can be organically connected and controlled by the same information interpretation method regardless of the encoding scheme in which the bitstream is encoded by providing the decoding description together.
또한, 본 발명의 다른 장점으로는 비트스트림의 신택스(syntax)가 변경되거나 새롭게 추가 될지라도, S-RT(460)에 해당 정보의 수정 또는 추가 정보의 삽입만으로도 능동적 대응이 가능하도록 할 수 있다. 또한 비트스트림 레벨(bit stream-level), 프레임 레벨(frame-level), 매크로블록 레벨(MB-level) 등의 처리 단위로 사용자가 원하는 기능을 선별하여 F-RT(420)를 구성함으로써 해당 복호화기의 디코딩 처리부(550) 기능부들의 연결 관계를 설정할 수 있는 장점도 있다.In addition, another advantage of the present invention is that even if the syntax of the bitstream is changed or newly added, it is possible to proactively respond to the S-
도 12는 본 발명의 바람직한 제5 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면이고, 도 13은 본 발명의 바람직한 제6 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면이며, 도 14는 본 발명의 바람직한 제7 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면이고, 도 15는 본 발명의 바람직한 제8 실시예에 따른 확장 비트스트림의 구성을 나타낸 도면이다.12 is a diagram showing the configuration of an extended bitstream according to the fifth preferred embodiment of the present invention, FIG. 13 is a diagram showing the configuration of an extended bitstream according to the sixth preferred embodiment of the present invention, and FIG. FIG. 15 is a diagram illustrating a configuration of an extended bitstream according to the seventh preferred embodiment of the present invention, and FIG. 15 is a diagram illustrating a configuration of an extended bitstream according to an eighth preferred embodiment of the present invention.
본 발명에 따른 확장 비트스트림(305)은 디코딩 디스크립션(DD, Decoding Description) 영역과 종래 비트스트림(105)으로 구성된다. 종래 비트스트림(105)이 코딩된 비디오 데이터(또는/및 코딩된 오디오 데이터)로 구성됨은 당업자에게 자명하다.The
여기서, 디코딩 디스크립션 영역은 종래 비트스트림(105)을 디코딩하기 위해 적용될 코덱 특성에 따라 상이한 구조로 형성될 수 있다. 즉, 첫번째, 종래에 표준화된 하나의 코덱을 사용하는 경우 제1 디코딩 디스크립션 구조가 적용될 수 있다.Here, the decoding description region may be formed in a different structure according to the codec characteristic to be applied to decode the
두번째, 종래에 표준화된 하나의 코덱 중 일부 내용을 수정하여 사용(즉, 상술한 7개의 테이블들 중 일부 테이블은 해당 코덱에 상응하는 테이블 내용을 그대로 사용하고 다른 일부 테이블들을 수정하여 사용)하는 경우 제2 디코딩 디스크립션 구조가 적용될 수 있다.Second, when modifying and using some of the contents of one standardized codec (that is, some of the above seven tables use the table contents corresponding to the corresponding codec and modify some other tables). The second decoding description structure can be applied.
세번째, 종래에 표준화된 복수의 코덱의 테이블 정보를 가공하여 사용(즉, 상술한 7개의 테이블들 중 일부 테이블들은 종래의 복수 코덱의 테이블 내용을 선택적으로 사용하고 다른 일부 테이블들은 수정하여 사용)하는 경우 제3 디코딩 디스크립션 구조가 적용될 수 있다.Third, processing and using table information of a plurality of standardized codecs (that is, some of the seven tables described above selectively use the contents of a table of the conventional plurality of codecs and modify some other tables). In this case, a third decoding description structure may be applied.
네번째, 종래에 표준화되지 않은 새로운 코덱을 사용(즉, 새로운 내용으로 구성된 상술한 7개의 테이블들을 모두 포함하여 전송)하는 경우 제4 디코딩 디스크립션 구조가 적용될 수 있다.Fourth, the fourth decoding description structure may be applied when using a new codec that is not conventionally standardized (i.e., including all seven tables described above with new contents).
상술한 네가지 디코딩 디스크립션 구조는 각각 상이한 코덱 타입(codec_type) 정보로서 구분될 수 있다. 예를 들어, 제1 디코딩 디스크립션 구조인 경우 "codec_type = 0"으로 설정되고, 제2 디코딩 디스크립션 구조인 경우 "codec_type = 1"으로 설정되며, 제3 디코딩 디스크립션 구조인 경우 "codec_type = 2"로 설정되고, 제4 디코딩 디스크립션 구조인 경우 "codec_type = 3"으로 설정될 수 있다. The four decoding description structures described above may be divided as different codec type information. For example, "codec_type = 0" for the first decoding description structure, "codec_type = 1" for the second decoding description structure, and "codec_type = 2" for the third decoding description structure. In case of the fourth decoding description structure, it may be set to "codec_type = 3".
도 12에 제1 디코딩 디스크립션 구조가 예시되어 있다. 도 12에 예시된 제1 디코딩 디스크립션 구조에 따를 때, 디코딩 디스크립션 영역은 코덱 타입(codec_type)(1150), 코덱 번호(codec_num)(1152) 및 프로파일 및 레벨 번호(profile_level_num)(1154)로 구성될 수 있다. 즉, 제1 디코딩 디스크립션 구조에 따르면 디코딩 디스크립션 영역에는 적용될 코덱에 관한 정보만을 중심으로 기술된다. 도면에는 각 필드가 8비트인 것으로 예시되어 있으나, 각 필드의 크기는 표현될 정보의 크기에 따라 가감될 수 있음은 자명하다.A first decoding description structure is illustrated in FIG. 12. According to the first decoding description structure illustrated in FIG. 12, the decoding description area may include a codec type (codec_type) 1150, a codec number (codec_num) 1152, and a profile and level number (profile_level_num) 1154. have. That is, according to the first decoding description structure, only the information about the codec to be applied is described in the decoding description area. Although each field is illustrated as 8 bits in the figure, it is obvious that the size of each field may be added or subtracted according to the size of information to be represented.
코덱 타입(1150)은 0(zero)으로 설정(즉, codec_type=0)될 것이며, 이는 종래 표준화된 다양한 코덱들 중 하나의 코덱을 그대로 이용하는 경우를 의미한다.The
도 13에 제2 디코딩 디스크립션 구조가 예시되어 있다.A second decoding description structure is illustrated in FIG. 13.
도 13에 예시된 제2 디코딩 디스크립션 구조에 따를 때, 디코딩 디스크립션 영역은 코덱 타입(codec_type)(1150), 코덱 번호(codec_num)(1152), 프로파일 및 레벨 번호(profile_level_num)(1154) 및 테이블 디스크립션(1156)으로 구성될 수 있다. 즉, 제2 디코딩 디스크립션 구조에 따르면 디코딩 디스크립션 영역에는 적용 될 코덱에 관한 정보와 7개의 테이블들 중 수정되는 내용을 중심으로 기술된다. 여기서, 테이블 디스크립션은 7개의 테이블 각각에 대해 개별적으로 구비된다. 즉, 디코딩 디스크립션 영역에 7개의 테이블 디스크립션이 존재할 수 있다.According to the second decoding description structure illustrated in FIG. 13, the decoding description area includes a codec type (codec_type) 1150, a codec number (codec_num) 1152, a profile and level number (profile_level_num) 1154, and a table description ( 1156). That is, according to the second decoding description structure, the decoding description area is described based on information about a codec to be applied and contents to be modified among seven tables. Here, the table description is provided separately for each of the seven tables. That is, there may be seven table descriptions in the decoding description area.
각 테이블 디스크립션(1156)은 예시된 바와 같이, 테이블 시작 코드(Table_start_code)(1158), 테이블 식별자(Table_identifier)(1160), 테이블 타입(Table_type)(1162), 내용(1163) 및 테이블 종료 코드(Table_end_code)(1164)를 포함할 수 있다. 물론 각 필드의 사이즈는 필요에 따라 증감될 수 있다. 또한 이하에서 설명되는 바와 같이, 내용(1163)은 테이블 타입(1162)의 정보에 따라 생략되거나 포함될 수 있다.Each
예를 들어, 테이블 타입(1162)의 값이 0이면 기존 테이블(즉, 코덱 타입(codec_type)(1150), 코덱 번호(codec_num)(1152), 프로파일 및 레벨 번호(profile_level_num)(1154)과 테이블 식별자(1160)에 의해 인식된 테이블)의 수정없이 적용되도록 인식될 수 있다. 이 경우, 내용(1163)은 생략될 수 있다.For example, if the value of the
그러나, 테이블 타입(1162)의 값이 1이면 기존 테이블(즉, 코덱 타입(codec_type)(1150), 코덱 번호(codec_num)(1152), 프로파일 및 레벨 번호(profile_level_num)(1154)과 테이블 식별자(1160)에 의해 인식된 테이블)을 일부 수정(즉, 내용(1163)에 정의된 내용으로 수정)하여 사용하도록 인식될 수 있다. 이 경우, 내용(1263)에는 수정된 내용(예를 들어, update command 등)이 기술될 수 있다. 예를 들어, 수정된 내용(예를 들어, update command 등)은 업데이트(update), 삽입(insert) 또는/및 삭제(delete) 등과 같은 명령어들이 포함되어 해당 테이블의 상응하는 인덱스의 테이블 내용을 수정하도록 하는 정보일 수 있다.However, if the value of the
그러나, 테이블 타입(1162)의 값이 2이면 기존 테이블(즉, 코덱 타입(codec_type)(1150), 코덱 번호(codec_num)(1152), 프로파일 및 레벨 번호(profile_level_num)(1154)과 테이블 식별자(1160)에 의해 인식된 테이블)을 완전히 변경(즉, 내용(1163)에 정의된 내용으로 변경)하여 사용하도록 인식될 수 있다. 이 경우, 내용(1163)에는 변경된 내용(예를 들어, new command 등과 같이 해당 테이블을 새로 정의하기 위한 내용)이 기술될 수 있다. However, if the value of the
도 14에 제3 디코딩 디스크립션 구조가 예시되어 있다. 도 14에 예시된 제3 디코딩 디스크립션 구조에 따를 때, 디코딩 디스크립션 영역은 코덱 타입(codec_type)(1150) 및 테이블 디스크립션(1156)으로 구성될 수 있다. 즉, 제3 디코딩 디스크립션 구조에 따르면 디코딩 디스크립션 영역에는 적용될 코덱에 관한 정보와 7개의 테이블들 중 수정되는 내용을 중심으로 기술된다. 여기서, 테이블 디스크립션은 7개의 테이블 각각에 대해 개별적으로 구비된다. 즉, 디코딩 디스크립션 영역에 7개의 테이블 디스크립션이 존재할 수 있다.A third decoding description structure is illustrated in FIG. 14. According to the third decoding description structure illustrated in FIG. 14, the decoding description area may include a codec type (codec_type) 1150 and a
각 테이블 디스크립션(1156)은 예시된 바와 같이, 테이블 시작 코드(Table_start_code)(1158), 테이블 식별자(Table_identifier)(1160), 테이블 타입(Table_type)(1162), 내용(1163) 및 테이블 종료 코드(Table_end_code)(1164)를 포함할 수 있다. 물론 각 필드의 사이즈는 필요에 따라 증감될 수 있다. Each
예를 들어, 테이블 타입(1162)의 값이 0이면 기존 테이블(즉, 코덱 번호(codec_num)(1152), 프로파일 및 레벨 번호(profile_level_num)(1154)와 테이블 식별자(1160)에 의해 인식된 테이블)의 수정없이 적용되도록 인식될 수 있다. 즉, 내용(1163) 필드 내에 적용될 테이블에 상응하는 코덱 번호(codec_num)(1152), 프로파일 및 레벨 번호(profile_level_num)(1154)가 기술된다.For example, if the value of
그러나, 테이블 타입(1162)의 값이 1이면 기존 테이블(즉, 코덱 번호(codec_num)(1152), 프로파일 및 레벨 번호(profile_level_num)(1154)와 테이블 식별자(1160)에 의해 인식된 테이블)을 일부 수정(즉, 수정 내용(1166)에 정의된 내용으로 수정)하여 사용하도록 인식될 수 있다. 이 경우, 내용(1163) 필드 내에 적용될 테이블에 상응하는 코덱 번호(codec_num)(1152), 프로파일 및 레벨 번호(profile_level_num)(1154)가 기술되고, 수정 내용(1166) 필드에는 수정된 내용(예를 들어, update command 등)이 기술될 수 있다.However, if the value of the
그러나, 테이블 타입(1162)의 값이 2이면 기존 테이블(즉, 테이블 식별자(1160)에 의해 인식된 테이블)을 완전히 변경(즉, 내용(1163) 필드에 정의된 내용으로 변경)하여 사용하도록 인식될 수 있다. 이 경우, 내용(1163) 필드에는 변경된 내용(예를 들어, new command 등과 같이 해당 테이블을 새로 정의하기 위한 내용)이 기술될 수 있다. 즉, 상술한 바와 같이 테이블 타입(1162)가 0 또는 1인 경우라면 특정 코덱이 그대로 이용되거나 일부 테이블이 수정되어 이용되므로 코덱에 관한 정보(즉, 코덱 번호(codec_num)(1152), 프로파일 및 레벨 번호(profile_level_num)(1154))가 요구되지만, 테이블 타입(1162)가 2인 경우라면 완전히 새로운 테이블 정보가 정의되므로 별도의 코덱 정보는 불필요하다.However, if the value of the
도 15에 제4 디코딩 디스크립션 구조가 예시되어 있다. 도 15에 예시된 제4 디코딩 디스크립션 구조에 따를 때, 디코딩 디스크립션 영역은 코덱 타입(codec_type)(1150) 및 테이블 디스크립션(1156)으로 구성될 수 있다. 즉, 제4 디코딩 디스크립션 구조에 따르면 디코딩 디스크립션 영역에는 7개의 테이블들을 중심으로 기술되며, 테이블 디스크립션은 7개의 테이블 각각에 대해 개별적으로 구비된다. A fourth decoding description structure is illustrated in FIG. 15. According to the fourth decoding description structure illustrated in FIG. 15, the decoding description area may include a codec type (codec_type) 1150 and a
각 테이블 디스크립션(1156)은 예시된 바와 같이, 테이블 시작 코드(Table_start_code)(1158), 테이블 식별자(Table_identifier)(1160), 테이블 타입(Table_type)(1162), 내용(1163) 및 테이블 종료 코드(Table_end_code)(1164)를 포함할 수 있다. 물론 각 필드의 사이즈는 필요에 따라 증감될 수 있다. Each
예를 들어, 테이블 타입(1162)의 값이 미리 지정된 값(예를 들어, 2) 이면 내용(1163) 필드에는 테이블 식별자(1160)에 상응하는 새로운 테이블을 기술하기 위한 정보(예를 들어, new command 등과 같이 해당 테이블을 새로 정의하기 위한 내용)가 표시된다. 상술한 바와 같이, 코덱 타입(1150)이 3인 경우에는 새로운 테이블들을 이용하여 디코딩을 수행하는 것으로 인식되므로, 테이블 타입(1162)은 하나만으로 지정되거나, 테이블 타입(1162)가 생략될 수 있다.For example, if the value of the
이하, 디코딩 디스크립션 영역의 syntax 구조 및 각 필드의 syntax 구조를 각각의 표로서 예시하기로 한다.Hereinafter, the syntax structure of the decoding description area and the syntax structure of each field will be exemplified as respective tables.
표 12. 디코딩 디스크립션Table 12. Decoding description
표 13. 코덱 디스크립션Table 13. Codec description
표 14. 테이블 디스크립션Table 14. Table description
표 15. 업데이트(update) 디스크립션Table 15. Update description
표 16. 뉴(new) 디스크립션Table 16. New description
이하, 디코딩 디스크립션의 semantics를 각각의 표로서 설명한다.The semantics of the decoding description are described below as respective tables.
표 17. 디코딩 디스크립션Table 17. Decoding Description
여기서, 코덱 타입은 8비트 코드로서, 코덱의 타입을 식별하기 위한 정보일 수 있다.Here, the codec type is an 8-bit code and may be information for identifying the type of the codec.
표 18. 코덱 디스크립션Table 18. Codec description
여기서, 코덱 번호(codec_num)는 8비트 코드로서, 사용된 코덱의 코드를 나타내는 정보일 수 있다. 또한, 프로파일 및 레벨 번호(profile_level_num)는 8비트 코드로서, 코덱에 대한 프로파일과 레벨의 번호를 지시하기 위한 정보일 수 있다. 프로파일 및 레벨 번호는 각 MPEG 표준의 프로파일 및 레벨 번호와 일치할 수 있다.Here, the codec number codec_num is an 8-bit code and may be information indicating a code of a used codec. In addition, the profile and level number (profile_level_num) is an 8-bit code and may be information for indicating the number of the profile and the level for the codec. The profile and level numbers may match the profile and level numbers of each MPEG standard.
표 19. 테이블 디스크립션(테이블 식별자)Table 19. Table description (table identifier)
여기서, 테이블 시작 코드(table_start_code)는 16진수의 26비트 문자열 0xFFFFFE일 수 있고, 이는 테이블 디스크립션의 시작을 의미할 수 있다. 테이블 식별자(table_identifier)는 위의 표 12와 같이 각각의 4비트 코드일 수 있다.Here, the table start code (table_start_code) may be a 26-bit string 0xFFFFFE in hexadecimal, which may mean the start of a table description. The table identifier (table_identifier) may be each 4-bit code as shown in Table 12 above.
표 20. 테이블 디스크립션(테이블 타입)Table 20. Table description (table type)
여기서, 테이블 타입은 4비트 값으로 기존의 테이블을 유지할 것인지, 기존의 테이블을 업데이트할 것인지 아니면 새로운 테이블을 생성할 것인지를 판단하도록 하는 정보이다. 테이블 종료 코드(table_end_code)는 16진수의 26비트 문자열 0xFFFFFF일 수 있고, 이는 테이블 디스크립션의 끝을 의미할 수 있다.Here, the table type is information for determining whether to maintain an existing table with a 4-bit value, update an existing table, or create a new table. The table end code (table_end_code) may be a 26-bit string 0xFFFFFF in hexadecimal, which may mean the end of the table description.
표 21. 업데이트 커맨드(update_command)를 위한 지시 세트Table 21. Instruction set for update command (update_command)
여기서, index#은 임의의 테이블의 인텍스 번호를 지시하는 4비트 문자열일 수 있고, table#은 테이블 식별자로서의 32비트 문자열일 수 있다.Here, index # may be a 4-bit string indicating an index number of an arbitrary table, and table # may be a 32-bit string as a table identifier.
표 22. 뉴 커맨드(new_command)를 위한 지시 세트Table 22. Instruction set for new command (new_command)
여기서, 비트(bits)는 요구되는 비트의 수를 나타내는 3 내지 34 비트 중 임의의 값이며, B는 바이트 얼라인먼트(byte alignment)를 나타내는 1비트 문자열이다. ">"는 좌측의 출력을 프린트하기 위한 1비트 문자열이고, VLD2(for MPEG-2)와 VLD4(for MPEG-4)는 엔트로피 코딩을 위한 기능들이다.Here, bits are any of 3 to 34 bits indicating the number of bits required, and B is a 1-bit string indicating byte alignment. ">" Is a 1-bit string for printing the output on the left, and VLD2 (for MPEG-2) and VLD4 (for MPEG-4) are functions for entropy coding.
도 23은 본 발명의 일 실시예에 따른 부호화기의 블록 구성도이다.23 is a block diagram of an encoder according to an embodiment of the present invention.
본 발명에 따른 부호화기(2300)는 앞서 도 2를 참조하여 설명한 종래의 부호화기(200)에 비해 확장 비트스트림 생성 및 출력부(2310)를 더 포함한다. 확장 비트스트림 생성 및 출력부(2310)는 전단까지의 처리에 의해 생성된 종래 비트스트림(105) 생성 과정에서의 제어 정보(예를 들어, 사용한 기능부들의 목록 및 연결 관계, 해당 기능부들의 입력 데이터, 신택스 정보, 신택스 연결 정보 등)를 이용하여 디코딩 디스크립션 을 생성한다. 또한, 생성된 디코딩 디스크립션 및 종래 비트스트림(105)를 이용하여 확장 비트스트림(305)을 생성하여 복호화기(300)로 전송한다. 디코딩 디스크립션의 생성 방법은 앞서 설명한 사항만으로 당업자가 충분히 이해할 수 있을 것이므로 이에 대한 설명은 생략한다. 또한, 당업자는 앞서 설명한 사항을 참조할 때, 부호화기(2300) 역시 복수의 기능부들을 포함하는 툴 박스를 구비하도록 하고, 툴 박스 내에 포함된 기능부들의 순차적 조합 또는 유기적 조합을 통해 하나 이상의 부호화 표준에 따른 비트스트림 생성이 가능할 것임을 쉽게 이해할 수 있을 것이다.The
또한, 본 명세서에서 가변장 인코딩부(235)는 부호화기(2300) 내에서 종래 비트스트림(105)을 생성하기 위하여 최종적으로 부호화를 수행하는 임의의 구성 요소(예를 들어, 부호화부)를 지칭한 것일 뿐 이에 제한되는 것은 아니며, 또한 이로 인해 본 발명의 권리범위가 제한되지는 않는다.In addition, in the present specification, the
도 23은 디코딩 디스크립션 정보 및 종래 비트스트림(105)을 이용하여 생성한 확장 비트스트림(305)이 복호화기로 제공되는 경우를 가정한 도면이다.FIG. 23 is a diagram on the assumption that the
그러나, 상술한 바와 같이, 디코딩 디스크립션은 별도의 데이터 또는 비트스트림 등의 형태로 복호화기(300)로 전달될 수도 있다. 이 경우는 가변장 인코딩부(235) 후단에 확장 비트스트림 생성 및 출력부(2310)가 위치하지 않고, 종래의 인코딩부(200)와 독립적으로 확장 비트스트림 생성 및 출력부(2310)가 위치하여 독립적으로 생성한 정보를 복호화기(300)로 제공할 수도 있음은 자명하다.However, as described above, the decoding description may be delivered to the
이제까지 본 발명에 따른 통합 코덱 장치 및 방법을 설명함에 있어 복호화기를 중심으로 설명하였으나, 복호화기와 부호화기간의 상호 관계가 당업자에게 자명하며 복호화기에 대한 상세한 설명만으로도 부호화기의 구성이 용이한 점을 고려할 때 본 발명이 복호화기에 제한되지 않음은 자명하다.In the description of the integrated codec apparatus and method according to the present invention, the decoder has been described with reference to the decoder. However, the interrelationship between the decoder and the encoding period is apparent to those skilled in the art. Obviously, the invention is not limited to decoders.
상술한 바와 같이 본 발명에 따른 통합 코덱 장치 및 방법은 하나의 표준(또는 코덱) 내에서 또는 다른 표준(또는 코덱) 간에 syntax 엘리먼트의 해석 및 기능부들의 연결 제어를 용이하게 한다. 즉, 특정 표준에 따라 생성되는 비트스트림 내의 syntax 엘리먼트들의 순서를 변경하거나, 새로운 syntax 엘리먼트들을 삽입하거나, 기존의 syntax 엘리먼트들을 삭제함에 문제되지 않는다. As described above, the integrated codec device and method according to the present invention facilitate the interpretation of syntax elements and control of the connection of functional units within one standard (or codec) or between different standards (or codecs). That is, it is not a problem to change the order of syntax elements, insert new syntax elements, or delete existing syntax elements in a bitstream generated according to a specific standard.
또한, 종래기술에 따르면 이와 같은 syntax 엘리먼트의 조작시 복호화기에서는 해당 비트스트림을 정상적으로 디코딩할 수 없는 문제점이 있었다. 예를 들어, 비트스트림 정보가 ABC이던 것을 ACB로 순서를 바꾸어 비트스트림을 구성하여 전송하면, 복호화기는 이를 인식할 수 없어 정상적인 디코딩이 불가능하다. 또한, 신규로 F를 삽입하여 ABFC로 구성하거나, B를 삭제하여 AC로 비트스트림을 구성하는 경우에도 동일하다.In addition, according to the related art, when the syntax element is manipulated, the decoder cannot decode the corresponding bitstream normally. For example, if the bitstream information is ABC and the bitstream is reconfigured to ACB, the decoder cannot recognize the decoding and cannot normally decode the bitstream. The same applies to the case where a new stream is inserted into an ABFC, or a B is deleted to form a bitstream with AC.
그러나, 본 발명에 따른 통합 코덱 장치 및 방법을 이용하면, 확장 비트스트림 내에 포함되거나 또는 독립된 데이터로 디코딩 디스크립션 정보가 제공되므로 복호화기(300)의 원활한 복호화 동작이 가능해진다.However, using the integrated codec apparatus and method according to the present invention, since the decoding description information is provided as data included in the extended bitstream or as independent data, the
이제까지 본 발명에 따른 복호화 장치 및 비트스트림 복호화를 위한 구문 해석 방법을 설명함에 있어 MPEG-4 AVC를 기준으로 설명하였으나, MPEG-1, MPEG-2, MPEG-4 및 이외의 동영상 인코딩/디코딩 표준에 아무런 제한없이 동일하게 적용할 수 있음은 당연하다.So far, the decoding apparatus and the syntax parsing method for decoding the bitstream according to the present invention have been described based on MPEG-4 AVC, but the MPEG-1, MPEG-2, MPEG-4 and other video encoding / decoding standards Naturally, the same can be applied without any limitation.
또한, 각 테이블들에 포함되는 정보 역시 하나의 표준에 의한 디코딩 수행을 위한 기능부들의 연결 관계, 해당 기능부에 요구되는 처리 프로세스 등에 관한 정보만으로 기술되지 않고, 복수의 표준에 의한 디코딩 수행을 위한 정보로 기술될 수도 있음은 자명하다.In addition, the information included in each table is not described only with information on connection relations between functional units for performing decoding by one standard, processing processes required for the corresponding functional unit, and the like. It is obvious that information may be described.
예를 들어, 확장 비트스트림에 포함된 인코딩된 비디오 데이터의 초기 복수의 프레임은 MPEG-2로 인코딩되고, 후속하는 복수의 프레임은 MPEG-4로 인코딩되며, 나머지 프레임은 MPEG-1으로 인코딩되었다고 가정하자. 이 경우, 인코딩된 비디오 데이터의 디코딩을 위해 디코딩 디스크립션에 포함되는 테이블 정보들 은 인코딩 방법을 달리하는 각 프레임들이 툴 박스(510)에 포함된 각 표준에 따른 기능부들이 유기적으로 결합되어 동작될 수 있도록 구현될 것임은 자명하다.For example, assume that an initial plurality of frames of encoded video data included in the extended bitstream are encoded in MPEG-2, subsequent frames are encoded in MPEG-4, and the remaining frames are encoded in MPEG-1. lets do it. In this case, the table information included in the decoding description for decoding the encoded video data may be operated by combining the functional units according to each standard included in the
상술한 바와 같이 본 발명에 따른 통합 코덱 장치 및 방법은 각 표준(예를 들어, MPEG-1, MPEG-2, MPEG-4, MPEG-4 AVC 등)에 따른 다양한 형식(syntax, semantics)으로 부호화된 비트스트림을 동일한 정보 인식 방식으로 복호화(decoding)할 수 있는 효과가 있다.As described above, the integrated codec apparatus and method according to the present invention are encoded in various formats (syntax, semantics) according to each standard (for example, MPEG-1, MPEG-2, MPEG-4, MPEG-4 AVC, etc.). The decoded bitstream can be decoded with the same information recognition scheme.
또한, 본 발명은 각 표준에 따른 다양한 형식(syntax, semantics)으로 부호화된 비트스트림을 동일한 정보 인식 방식으로 복호화(decoding)하도록 디코딩 디스크립션(decoding description)을 부가한 확장 비트스트림을 생성할 수 있는 효과도 있다.In addition, the present invention can generate an extended bitstream having a decoding description added to decode the bitstreams encoded in various formats (syntax, semantics) according to each standard in the same information recognition method. There is also.
또한, 본 발명은 코덱이 가진 계층 구조를 syntax 파싱 및 디코딩 과정에 응용함으로써 보다 효율적으로 디코딩 디스크립션을 기술할 수 있도록 하는 효과도 있다.In addition, the present invention has an effect of more efficiently describing the decoding description by applying the hierarchical structure of the codec to the syntax parsing and decoding process.
또한, 본 발명은 디코딩 디스크립션을 이용하여 각 코덱의 스케쥴링(scheduling) 관리와 각 기능부들의 유기적 처리 구조(예를 들어, 병렬 결합 구조, 직렬 병합 구조, 독립 처리 구조, 개별적 처리 구조 등)를 제시할 수 있는 효과도 있다.In addition, the present invention proposes scheduling management of each codec and organic processing structures (eg, parallel combining structure, serial merging structure, independent processing structure, individual processing structure, etc.) of each codec using decoding description. There is also an effect that can be done.
또한, 본 발명은 기술된 디코딩 디스크립션만으로 다양한 시스템 설계 및 구 축이 가능한 효과도 있다.In addition, the present invention also has the effect that a variety of system design and construction is possible only by the described decoding description.
또한, 본 발명은 다양한 부호화 방식으로 압축된 비트스트림을 동일한 정보 분석 방법에 의해 파싱(parsing)하고, 파싱된 데이터를 이용하여 복호화를 위한 각 기능부(FU, Functional Unit)들을 유기적으로 제어할 수 있는 효과도 있다.In addition, the present invention parses a bitstream compressed by various encoding schemes by the same information analysis method, and can organically control functional units (FU) for decoding using the parsed data. There is also an effect.
또한, 본 발명은 다양한 형태의 비트스트림을 복호화하기 위한 syntax 해석 방법을 공통적으로 적용할 수 있는 효과도 있다.In addition, the present invention has the effect that can be commonly applied to the syntax analysis method for decoding various types of bitstream.
또한, 본 발명은 다양한 형태의 비트스트림을 공통된 Syntax 해석 방법으로 파싱할 수 있도록 하기 위한 새로운 명령어들의 집합을 적용할 수 있는 효과도 있다.In addition, the present invention has the effect of applying a new set of instructions for parsing various types of bitstreams with a common syntax analysis method.
또한, 본 발명은 syntax 엘리먼트의 변경이나 추가시에도 복호화기가 용이하게 비트스트림을 복호화할 수 있는 효과도 있다.In addition, the present invention also has the effect that the decoder can easily decode the bitstream even when the syntax element is changed or added.
또한, 본 발명은 해석된 syntax의 엘리먼트 정보(element information, 즉 syntax 파싱에 의한 결과물)를 비트스트림 복호화를 위해 이용되는 구성 요소들이 공유할 수 있도록 하는 효과도 있다.In addition, the present invention has an effect that allows the components used for bitstream decoding to share the element information (the result of parsing the syntax) of the parsed syntax.
또한, 본 발명은 해석된 syntax의 엘리먼트 정보를 후속하는 비트스트림 syntax 엘리먼트의 해석을 위해 이용할 수 있도록 하는 효과도 있다.In addition, the present invention also has the effect that the element information of the parsed syntax can be used for the interpretation of subsequent bitstream syntax elements.
또한, 본 발명은 MPEG-1, MPEG-2, MPEG-4, MPEG-4 AVC 외의 블록 단위의 처리를 하는 동영상, 정지영상 코덱의 통합시에 사용할 수 있는 효과도 있다.In addition, the present invention also has an effect that can be used when integrating a moving picture or still picture codec that processes block units other than MPEG-1, MPEG-2, MPEG-4, and MPEG-4 AVC.
또한, 본 발명은 여러 표준(코덱)에서 제안하는 다양한 디코딩 방법을 구성하는 기능들을 각기 기능부(FU, Functional Unit)대로 분할하여 툴박스에 저장할 수 있는 효과도 있다.In addition, the present invention has an effect that can be stored in a toolbox by dividing the functions constituting various decoding methods proposed by various standards (codecs) into functional units (FU).
또한, 본 발명은 다양한 형태로 부호화 된 비트스트림을 복호화하기 위해 툴박스에서 필요한 기능부들만을 선별하여 디코딩할 수 있는 효과도 있다.In addition, the present invention has the effect that it is possible to selectively decode only the functional units required in the toolbox to decode the bitstream encoded in various forms.
또한, 본 발명은 툴박스에 저장된 기능부의 변경이나 추가, 삭제가 용이한 효과도 있다.In addition, the present invention has an effect that it is easy to change, add, or delete a function unit stored in a toolbox.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although the above has been described with reference to a preferred embodiment of the present invention, those skilled in the art to which the present invention pertains without departing from the spirit and scope of the invention as set forth in the claims below It will be appreciated that modifications and variations can be made.
Claims (73)
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060101245A KR100813435B1 (en) | 2006-10-18 | 2006-10-18 | Device and method for encoding/decoding bit-stream |
PCT/KR2007/004855 WO2008048009A1 (en) | 2006-10-18 | 2007-10-04 | Device and method for encoding/decoding bit-stream |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060101245A KR100813435B1 (en) | 2006-10-18 | 2006-10-18 | Device and method for encoding/decoding bit-stream |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060135202A Division KR20080035420A (en) | 2006-12-27 | 2006-12-27 | Device and method for encoding/decoding bit-stream |
Publications (1)
Publication Number | Publication Date |
---|---|
KR100813435B1 true KR100813435B1 (en) | 2008-03-13 |
Family
ID=39314193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060101245A KR100813435B1 (en) | 2006-10-18 | 2006-10-18 | Device and method for encoding/decoding bit-stream |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR100813435B1 (en) |
WO (1) | WO2008048009A1 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013157796A1 (en) * | 2012-04-15 | 2013-10-24 | 삼성전자 주식회사 | Video encoding method and device and video decoding method and device for parallel processing |
KR20150045951A (en) * | 2012-08-24 | 2015-04-29 | 아이큐브드 연구소 주식회사 | Receiving device, transmission device, and image transmission method |
KR20200076109A (en) | 2018-12-19 | 2020-06-29 | (주)이머시브캐스트 | Stereoscopic video encoding apparatus, stereoscopic video decoding apparatus and stereoscopic video display system including the same |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101624649B1 (en) * | 2009-08-14 | 2016-05-26 | 삼성전자주식회사 | Method and apparatus for video encoding considering hierarchical coded block pattern, and method and apparatus for video decoding considering hierarchical coded block pattern |
JP6472441B2 (en) * | 2013-10-11 | 2019-02-20 | シャープ株式会社 | Method for decoding video |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001041065A2 (en) | 1999-11-29 | 2001-06-07 | Koninklijke Philips Electronics N.V. | Method for coding and decoding multimedia data |
US20040140916A1 (en) | 2003-01-08 | 2004-07-22 | Lg Electronics Inc. | Apparatus and method for supporting plural codecs |
US20050166244A1 (en) | 2004-01-27 | 2005-07-28 | Moon Kyoung S. | Virtual channel table data structure, transport stream discrimination method, and digital broadcast receiver |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040065790A (en) * | 2003-01-16 | 2004-07-23 | 삼성전자주식회사 | DVD player and method for reproducing multimedia file |
EP1803301A4 (en) * | 2004-10-22 | 2011-07-20 | Humax Co Ltd | Device and method for merging different video codec |
KR20060066314A (en) * | 2004-12-13 | 2006-06-16 | 엘지전자 주식회사 | Processing apparatus and method for substitution picture of picture phone |
-
2006
- 2006-10-18 KR KR1020060101245A patent/KR100813435B1/en not_active IP Right Cessation
-
2007
- 2007-10-04 WO PCT/KR2007/004855 patent/WO2008048009A1/en active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001041065A2 (en) | 1999-11-29 | 2001-06-07 | Koninklijke Philips Electronics N.V. | Method for coding and decoding multimedia data |
US20040140916A1 (en) | 2003-01-08 | 2004-07-22 | Lg Electronics Inc. | Apparatus and method for supporting plural codecs |
US20050166244A1 (en) | 2004-01-27 | 2005-07-28 | Moon Kyoung S. | Virtual channel table data structure, transport stream discrimination method, and digital broadcast receiver |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013157796A1 (en) * | 2012-04-15 | 2013-10-24 | 삼성전자 주식회사 | Video encoding method and device and video decoding method and device for parallel processing |
US9681127B2 (en) | 2012-04-15 | 2017-06-13 | Samsung Electronics Co., Ltd. | Video encoding method and device and video decoding method and device for parallel processing |
KR20150045951A (en) * | 2012-08-24 | 2015-04-29 | 아이큐브드 연구소 주식회사 | Receiving device, transmission device, and image transmission method |
KR102114509B1 (en) * | 2012-08-24 | 2020-05-22 | 아이큐브드 연구소 주식회사 | Receiving device, transmission device, and image transmission method |
KR20200076109A (en) | 2018-12-19 | 2020-06-29 | (주)이머시브캐스트 | Stereoscopic video encoding apparatus, stereoscopic video decoding apparatus and stereoscopic video display system including the same |
US11356652B2 (en) | 2018-12-19 | 2022-06-07 | Immersivecast Co., Ltd. | Stereoscopic image generating apparatus, stereoscopic image reconstructing apparatus and stereoscopic image playing system including same |
Also Published As
Publication number | Publication date |
---|---|
WO2008048009A1 (en) | 2008-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101305491B1 (en) | Bitstream decoding device and method | |
KR101232780B1 (en) | Device and Method for unified codecs | |
KR100813435B1 (en) | Device and method for encoding/decoding bit-stream | |
KR101439381B1 (en) | Device and Method for encoding/decoding | |
KR101380825B1 (en) | Bitstream decoding device and method having decoding solution | |
KR101305514B1 (en) | Bitstream decoding device and method | |
KR100841558B1 (en) | Device and Method for encoding/decoding bit-stream | |
KR101372418B1 (en) | Bitstream decoding device and method | |
KR20090002508A (en) | Device and method for encoding/decoding video data | |
KR20080035421A (en) | Device and method for encoding/decoding bit-stream | |
KR101305513B1 (en) | Device and Method for encoding/decoding Video data | |
KR101477218B1 (en) | Device and Method for encoding/decoding | |
KR100970145B1 (en) | Device and Method for encoding/decoding | |
KR100807100B1 (en) | Device and Method for unified codecs | |
KR100767606B1 (en) | Device and Method for unified codecs | |
KR20080035420A (en) | Device and method for encoding/decoding bit-stream | |
KR20100115238A (en) | Device and method for codec design | |
KR20080006430A (en) | Device and method for unified codecs | |
KR20090002507A (en) | Device and method for encoding/decoding video data | |
US8565320B2 (en) | Device and method for encoding/decoding video data | |
KR101305517B1 (en) | Bitstream decoding device and method having decoding solution | |
KR20100094709A (en) | Device and method for encoding/decoding | |
KR101305516B1 (en) | Bitstream decoding device and method having decoding solution | |
WO2008123710A1 (en) | Bitstream decoding device and method having decoding solution | |
KR20070098459A (en) | Device and method for unified codecs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
G170 | Publication of correction | ||
FPAY | Annual fee payment |
Payment date: 20130307 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20140305 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20150302 Year of fee payment: 8 |
|
LAPS | Lapse due to unpaid annual fee |