JP2003319389A - Image data decoding apparatus and structure of image data - Google Patents

Image data decoding apparatus and structure of image data

Info

Publication number
JP2003319389A
JP2003319389A JP2002126027A JP2002126027A JP2003319389A JP 2003319389 A JP2003319389 A JP 2003319389A JP 2002126027 A JP2002126027 A JP 2002126027A JP 2002126027 A JP2002126027 A JP 2002126027A JP 2003319389 A JP2003319389 A JP 2003319389A
Authority
JP
Japan
Prior art keywords
data
slice
slice data
header
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002126027A
Other languages
Japanese (ja)
Inventor
Yoshinori Matsui
義徳 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2002126027A priority Critical patent/JP2003319389A/en
Publication of JP2003319389A publication Critical patent/JP2003319389A/en
Pending legal-status Critical Current

Links

Abstract

<P>PROBLEM TO BE SOLVED: To provide a decoding apparatus capable of handling image encoded data in a unified way independently of the transmission system and to provide the structure of image data. <P>SOLUTION: A data input means 101 receives header data including N slice data being a part of an encoded image frame, a parameter required for particularizing a start position of the N slice data, and size information required for decoding the N slice data and data comprising connected slice data for connecting the N slice data, a slice separate means 102 refers to the parameter required for particularizing the start position in the header data to particularize the start position of the slice data included in the connected slice data received successively, a decoding means 103 decodes the data and a display means 104 displays the decoded data. <P>COPYRIGHT: (C)2004,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、MPEG−4(M
oving Picture ExpertsGrou
p Phase 4)など、圧縮符号化された画像フレ
ームデータの復号装置に関するものである。
BACKGROUND OF THE INVENTION The present invention relates to MPEG-4 (M
moving Picture ExpertsGrou
The present invention relates to a decoding device for compression-coded image frame data such as p Phase 4).

【0002】[0002]

【従来の技術】1999年、MPEG−4が低ビットレ
ートにおける画像符号化方式として標準化された。しか
し、MPEG−4を上回る圧縮効率を実現する符号化方
式として、ISO/IECとITU−Tのジョイントワ
ーキンググループであるJVT(Joint Vide
o Team)で、新しい符号化方式を標準化中であ
る。本符号化方式においては、スライスデータ以下のビ
ットストリームの文法は唯一に規定するが、スライスデ
ータより上位の情報、従来のMPEG−4で言えば、ス
ライスヘッダや、VOPヘッダなどに相当する情報は伝
送方式に依存するものとし、各伝送方式毎に個別に規定
する方針である。
2. Description of the Related Art In 1999, MPEG-4 was standardized as an image coding system at a low bit rate. However, JVT (Joint Video), which is a joint working group of ISO / IEC and ITU-T, is used as an encoding method that realizes a compression efficiency higher than that of MPEG-4.
o Team), a new coding scheme is being standardized. In this encoding method, the grammar of the bit stream below the slice data is specified only, but the information higher than the slice data, that is, the information corresponding to the slice header or VOP header in the case of conventional MPEG-4, is not included. The policy is to depend on the transmission method, and is specified individually for each transmission method.

【0003】伝送方式の第1の例として、伝送方式がM
PEG−2のトランスポートストリーム(ISO/IE
C 13818−1)である場合、図9に示すように、
各スライス毎に32ビットのスライススタートコードか
ら始まるスライスヘッダを付与し、さらに各画像フレー
ムの先頭のスライスについては、スライスヘッダに先立
つピクチャヘッダを付与することが考えられている。ま
た、スタートコードと同じビットパターンがスライスデ
ータ以下で発生しないよう、図10に示すように、スラ
イスデータ以下において、例えば'0'が16ビット連続
した場合、強制的に'1'を8ビット挿入した上でMPE
G−2のトランスポートストリームとして伝送すること
が想定されている。
As a first example of the transmission method, the transmission method is M
PEG-2 transport stream (ISO / IE
C 13818-1), as shown in FIG.
It is considered that a slice header starting from a 32-bit slice start code is added to each slice, and a picture header preceding the slice header is added to the head slice of each image frame. Also, to prevent the same bit pattern as the start code from occurring below the slice data, as shown in FIG. 10, for example, when 16 bits of "0" continue in the slice data and below, 8 bits of "1" are forcibly inserted. And then MPE
It is assumed to be transmitted as a G-2 transport stream.

【0004】伝送方式の第2の例として、伝送方式がR
TP(Realtime Transport Pro
tocol、IETF/RFC1889)である場合、
図11に示すように、RTPパケットは1スライスデー
タを含むこととしている。伝送方式の第3の例として、
伝送方式がMP4ファイル(ISO/IEC 1449
6−1)である場合、図12に示すように、MP4ファ
イルの先頭部に通常配置されるヘッダ部に、各スライス
のサイズ情報を指定することが考えられている。
As a second example of the transmission method, the transmission method is R
TP (Realtime Transport Pro)
tocol, IETF / RFC1889),
As shown in FIG. 11, the RTP packet includes one slice data. As a third example of the transmission method,
The transmission method is MP4 file (ISO / IEC 1449
In the case of 6-1), as shown in FIG. 12, it is considered to specify the size information of each slice in the header portion normally arranged at the beginning of the MP4 file.

【0005】[0005]

【発明が解決しようとする課題】以上説明したように、
スライスデータより上位の情報は、各伝送方式毎に全く
異なるため、伝送方式毎にそれぞれ異なる処理が復号の
際に必要となるという課題がある。例えば、MPEG−
2では、スライスデータ以下で'0'が16ビット連続し
た場合、続く8ビットを削除する処理が必要となるが、
RTPやMP4ではこの必要がない。また、1スライス
を特定する場合も、MPEG−2ではスライススタート
コードを検索する必要があり、MP4ではファイルヘッ
ダ部に記述された各スライスのサイズ情報を取得する必
要があるが、RTPでは1パケットが1スライスである
ため、特に特別な処理が不要である。MP4の場合、全
スライスのサイズ情報をファイルヘッダ部に指定するた
め、ファイルヘッダ部のサイズが増大し、MP4ファイ
ルをダウンロードしながら再生する際、再生開始までの
時間が長くなるという問題もある。また、RTPの場
合、1RTPパケットが1スライスのみ含むため、パケ
ットのオーバヘッドが増大し、伝送効率が低下する。
As described above,
Since the information higher than the slice data is completely different for each transmission method, there is a problem that different processing is required for each transmission method at the time of decoding. For example, MPEG-
In 2, if 16 bits of '0' continue below the slice data, the process of deleting the following 8 bits is necessary.
This is not necessary for RTP and MP4. Also, when specifying one slice, MPEG-2 needs to search a slice start code, and MP4 needs to acquire size information of each slice described in the file header portion, but one packet is used in RTP. Since it is 1 slice, no special processing is required. In the case of MP4, since the size information of all slices is specified in the file header part, the size of the file header part increases, and there is also a problem that when playing back an MP4 file while downloading it, it takes a long time to start playing. Further, in the case of RTP, since one RTP packet includes only one slice, packet overhead increases and transmission efficiency decreases.

【0006】他にも、伝方式を変換する際に処理が複雑
になるという課題がある。例えば、MPEG−2で受信
した画像データをRTPに変換して伝送する場合、スラ
イスデータ以下の'0'の連続を検索して16ビット連続
時は、続く8ビットを削除した上で、さらにスライスス
タートコードを削除して、1RTPパケットとする処理
が必要である。
Another problem is that the processing becomes complicated when converting the transmission method. For example, when converting image data received by MPEG-2 to RTP and transmitting it, a sequence of '0's below the slice data is searched, and when 16 bits are consecutive, the following 8 bits are deleted and further sliced. It is necessary to delete the start code and make it 1RTP packet.

【0007】[0007]

【課題を解決するための手段】前記課題を解決するため
に、本発明の画像データ符号化装置および画像データ復
号化装置においては、各伝送方式において共通に使用可
能な、スライスデータより上位の情報であるヘッダ情報
とスライスデータを符号化して出力する、あるいは入力
して復号するものであり、具体的には以下のような手段
で構成される。
In order to solve the above-mentioned problems, in the image data coding apparatus and the image data decoding apparatus of the present invention, information which is commonly used in each transmission system and which is higher than slice data is used. The header information and the slice data are encoded and output, or input and decoded, and are specifically configured by the following means.

【0008】本発明の請求項1に係る画像データ復号化
装置は、符号化画像フレームの一部であるスライスデー
タの個数N(Nは1以上の整数)と前記N個分のスライ
スデータの開始位置の特定に使用するパラメータと前記
N個分のスライスデータの復号化に使用するサイド情報
とを連結したヘッダデータと、N個のスライスデータを
連結した連結スライスデータと、を含むデータを入力す
るデータ入力手段と、前記入力したヘッダデータにおけ
る前記開始位置の特定に使用するパラメータを参照し
て、前記入力した連結スライスデータに含まれるスライ
スデータの開始位置を特定するスライス分離手段と、開
始位置を特定したスライスデータを、前記ヘッダデータ
の復号化に使用するサイド情報を参照して復号する復号
手段と、前記復号したスライスデータを表示する表示手
段と、を備えるものである。
The image data decoding apparatus according to claim 1 of the present invention is the number N of slice data (N is an integer of 1 or more) which is a part of an encoded image frame and the start of the slice data of N pieces. Input data including header data in which a parameter used to specify a position and side information used in decoding the N slice data are concatenated, and concatenated slice data in which N slice data are concatenated. Referring to the data input means and the parameter used for specifying the start position in the input header data, the slice separating means for specifying the start position of the slice data included in the input concatenated slice data, and the start position Decoding means for decoding the specified slice data by referring to side information used for decoding the header data; Display means for displaying the slice data, and comprising a.

【0009】本発明の請求項2に係る画像データ復号化
装置は、請求項1における前記ヘッダ情報におけるサイ
ド情報は、1画像フレームにおける第1番目のスライス
データに関するサイド情報であることを識別するために
使用される情報を含むこととしたものである。
The image data decoding apparatus according to claim 2 of the present invention is for identifying that the side information in the header information in claim 1 is side information relating to the first slice data in one image frame. It is intended to include information used for.

【0010】本発明の請求項3に係る画像データ復号化
装置は、請求項1における前記ヘッダ情報におけるサイ
ド情報は、1画像フレームにおける各スライスデータの
表示位置を特定するために使用される情報を含むことと
したものである。
In the image data decoding apparatus according to claim 3 of the present invention, the side information in the header information in claim 1 is information used for specifying the display position of each slice data in one image frame. It is meant to be included.

【0011】本発明の請求項4に係る画像データ復号化
装置は、請求項1における前記ヘッダ情報におけるサイ
ド情報は、少なくとも1画像フレームにおける第1番目
のスライスデータである場合は1画像フレームを構成す
る複数のスライスデータで共通に参照される情報を含む
こととしたものである。
An image data decoding apparatus according to a fourth aspect of the present invention forms one image frame when the side information in the header information according to the first aspect is at least the first slice data in one image frame. It includes information commonly referred to by a plurality of slice data.

【0012】本発明の請求項5に係る画像データ構造
は、画像データを構成するスライスデータの個数N(N
は1以上の整数)と、前記N個分のスライスデータの開
始位置の特定に使用されるパラメータと、前記N個分の
スライスデータの復号化に使用されるサイド情報とを連
結したヘッダデータと、前記N個のスライスデータを連
結した連結スライスデータと、を含むものである。
The image data structure according to claim 5 of the present invention is the number N (N
Is an integer greater than or equal to 1), a parameter used to specify the start position of the N slice data, and side information used to decode the N slice data. , Concatenated slice data obtained by concatenating the N slice data.

【0013】[0013]

【発明の実施の形態】本発明にかかる画像データ復号装
置は、従来のMPEG−1、MPEG−2、MPEG−
4における画像符号化で必要なスライスの開始位置を特
定するためのスタートコードを不要とし、MPEG−2
伝送方式、RTP、MP4ファイルなどで共通に使用可
能なヘッダ情報を入力して参照しながら、複数のスライ
スデータを入力して復号、再生表示することを可能とす
るものである。
BEST MODE FOR CARRYING OUT THE INVENTION The image data decoding apparatus according to the present invention is a conventional MPEG-1, MPEG-2, MPEG-
4 does not require a start code for specifying the start position of a slice required for image coding, and MPEG-2
While inputting and referring to header information that can be commonly used in a transmission method, RTP, MP4 file, etc., it is possible to input a plurality of slice data and decode, reproduce and display.

【0014】(実施の形態1)以下、本発明の画像デー
タ復号装置の実施の形態1について図1から図8を用い
て説明する。図1は、画像データ復号装置の機能ブロッ
ク図を示す。画像データ復号装置は、データ入力手段1
01、スライス分離手段102、スライスデータ復号手
段103、表示手段104で構成される。
(First Embodiment) A first embodiment of the image data decoding apparatus of the present invention will be described below with reference to FIGS. 1 to 8. FIG. 1 shows a functional block diagram of the image data decoding device. The image data decoding device includes data input means 1
01, slice separation means 102, slice data decoding means 103, and display means 104.

【0015】データ入力手段101は、図2、図3に示
すような構造のデータを入力する。図2に示すデータ
は、1画像フレームに関するスライスデータを連結し、
それらのスライスデータに関するヘッダデータを付与し
たものである。この例では1画像フレームを構成してい
る5つのスライスデータを連結しているが、連結するス
ライスデータの数は1以上の範囲で任意である。なお、
図の右側に、ヘッダの直後のスライスを原点(ゼロ)と
して各スライスデータの開始位置をバイト単位で示して
いる。図3は、ヘッダデータの構造を示す概略図であ
る。ヘッダデータに続くスライスデータに関する情報を
保持する。まず、連結したスライスデータの個数を示す
フィールドである「エントリ数」がある。今、図2のよ
うに5つのスライスデータが連結されている場合、エン
トリ数は5とすることができる。そして、各エントリ#
1〜#5については、各スライスの開始位置、および各
スライスの復号時に必要となるサイド情報が記述され
る。スライスの開始位置は、エントリ#1の場合、0と
する。また、連結されたスライスデータの5つ目のスラ
イスは、図2の例では、361バイト目より開始されて
いるため、図3のエントリ#5におけるスライスの開始
位置は361となる。なお、本実施の形態においてはヘ
ッダデータの直後のスライスデータを基準点とするため
ゼロとしているが、別の点、例えばヘッダデータの第1
バイトを基準点としてもよく、その際は最初のスライス
の開始位置は0でなく、ヘッダデータのサイズに依存す
る値となる。サイド情報としては、図3に示すようにス
ライスの先頭マクロブロックの番号が一例として可能で
ある。1スライスは、複数個のマクロブロックよりな
る。マクロブロックは、MPEG−4では幅16、高さ
16ピクセル分のデータである。画像サイズが幅176
ピクセル、高さ144ピクセルである画像フレームの場
合、99個のマクロブロックで構成される。画像フレー
ムの先頭のスライスにおける開始マクロブロック番号は
0であることが一般的であるが、先頭のマクロブロック
が符号化されていない場合もあるため、0以外の場合も
可能である。また、各画像フレームにおける先頭のスラ
イスの場合、画像フレーム全体に関わるフレームレベル
情報を指定する。フレームレベル情報の一例としては、
例えば画像フレームの符号化モードとして、画面内符号
化フレームであるか画面間相関を利用したフレームであ
るかを識別する情報が可能である。また、各画像フレー
ムにおける先頭のスライスデータに限らず、任意のスラ
イスデータにおいてフレームレベル情報を指定しても良
い。例えば、図4、図5に示すように、1画像フレーム
が一方は2つのスライスで、他方は3つのスライスデー
タに分離されている場合、各分離されたのヘッダデータ
の最初のスライスにはフレームレベル情報を指定しても
良い。なお、フレームレベル情報の有無を判定する手が
かりとしては、先頭マクロブロック番号を参照する方法
や、フレームレベル情報の有無を判定するフラグをフレ
ームレベル情報より手前に配置し、これを参照する方法
が可能である。前者では、先頭マクロブロック番号がゼ
ロである場合はフレームレベル情報があると判定するこ
とが可能である。また、スライスデータの連結方法とし
て、図6に示すように、異なる画像フレームのスライス
データを連結することも可能である。図6における連結
スライスデータ#3は、画像フレーム#1と画像フレー
ム#2に属するスライスデータから構成されている。こ
の場合、連結スライスデータ#3におけるヘッダデータ
の、第2番目のスライスデータのためのサイド情報に
は、画像フレーム#2のフレームレベルの情報を含め
る。
The data input means 101 inputs data having a structure as shown in FIGS. The data shown in FIG. 2 is obtained by concatenating slice data for one image frame,
Header data relating to these slice data is added. In this example, the five slice data forming one image frame are connected, but the number of slice data to be connected is arbitrary within the range of 1 or more. In addition,
On the right side of the figure, the starting position of each slice data is shown in bytes with the slice immediately after the header as the origin (zero). FIG. 3 is a schematic diagram showing the structure of header data. It holds information about slice data that follows the header data. First, there is a "number of entries" field that indicates the number of concatenated slice data. If five slice data are connected as shown in FIG. 2, the number of entries can be set to five. And each entry #
For 1 to # 5, the start position of each slice and the side information required when decoding each slice are described. The start position of the slice is set to 0 in the case of entry # 1. Further, in the example of FIG. 2, the fifth slice of the concatenated slice data starts from the 361th byte, so the slice start position in the entry # 5 of FIG. 3 is 361. In the present embodiment, the slice data immediately after the header data is used as the reference point, so it is set to zero, but another point, for example, the first header data
The byte may be used as the reference point, in which case the start position of the first slice is not 0, but a value that depends on the size of the header data. As the side information, as shown in FIG. 3, the number of the head macroblock of the slice can be used as an example. One slice consists of a plurality of macroblocks. The macroblock is data of width 16 and height 16 pixels in MPEG-4. Image size is 176 width
An image frame having pixels and a height of 144 pixels is composed of 99 macroblocks. The starting macroblock number in the first slice of the image frame is generally 0, but since the first macroblock may not be encoded, it may be other than 0. In the case of the first slice in each image frame, frame level information relating to the entire image frame is designated. As an example of frame level information,
For example, as the encoding mode of the image frame, it is possible to use information for identifying whether it is an intra-frame encoded frame or a frame using inter-screen correlation. Further, the frame level information may be specified not only in the first slice data in each image frame but also in any slice data. For example, as shown in FIGS. 4 and 5, when one image frame is divided into two slices on the one side and three slice data on the other side, the frame is included in the first slice of the separated header data. Level information may be specified. As a clue to determine the presence / absence of frame level information, a method of referring to the leading macroblock number or a method of arranging a flag for determining the presence / absence of frame level information before the frame level information and referencing this can be used. Is. In the former case, when the head macroblock number is zero, it can be determined that there is frame level information. Further, as a method for connecting slice data, as shown in FIG. 6, it is also possible to connect slice data of different image frames. Concatenated slice data # 3 in FIG. 6 is composed of slice data belonging to image frame # 1 and image frame # 2. In this case, the side information for the second slice data of the header data in the concatenated slice data # 3 includes the frame level information of the image frame # 2.

【0016】図7は、入力データの文法を書式化したも
のである。入力データは、"compound_sli
ce()"であるとする。図7(a)では、"compo
und_slice()"は、まず8ビットフィールド
の"number_of_slice"フィールドにより
連結スライスの個数が示され、次に、各スライスに対
し、15ビットの"slice_start_offs
et"によりスライスの開始位置が示され、1ビットの"
picture_header_flag"により、フ
レームレベル情報の出現有無が示され、"pictur
e_header_flag"が1の場合、フレームレ
ベル情報である"picture_header()"が
配置される。続いて8ビットの"first_macr
oblock_number"により、開始マクロブロ
ック番号が示される。ヘッダ情報の提示の後、連結スラ
イスデータとして、"number_of_slice"
で示された数のスライスデータ"slice_data
()"が連結される。図7(b)は(a)の変形例であ
り、"picture_header_flag"により
フレームレベル情報の出現有無を示すかわりに"fir
st_macroblock_number"がゼロの
場合、すなわち画像フレームの先頭スライスデータであ
る場合は、フレームレベル情報は配置されるようにした
ものである。図7(c)は、図7(a)を拡張したもの
である。まず7ビットの"video_sequenc
e_index"フィールドにより、本連結スライスデ
ータに関連する画像シーケンス全体に関する情報を指定
する。画像シーケンス全体の情報としては、画像サイズ
や、プロファイルやレベルの情報などがあり、具体的な
例としてはMPEG−4におけるビデオオブジェクトレ
イヤや、MPEG−2におけるシーケンスヘッダに相当
する情報が可能である。続く"group_of_pi
cture_flag"は、"group_of_pic
ture()"の出現有無を示し、本フラグが1の場合
は"group_of_picture()"が配置され
る。これは複数の画像フレームをグループ化することを
示す情報であり、具体的な例としてはMPEG−4にお
けるGOV(Group of Vop)や、MPEG
−2におけるGOP(Group of Pictur
e)に相当する情報が可能である。
FIG. 7 shows a formatted grammar of input data. The input data is "compound_sli"
ce () ”. In FIG. 7A,“ compo ”
“Und_slice ()” first indicates the number of concatenated slices by the “number_of_slice” field of the 8-bit field, and then, for each slice, “slice_start_offs” of 15 bits.
The start position of the slice is indicated by "et", and 1-bit "
The "picture_header_flag" indicates whether or not the frame level information appears, and "picture
When e_header_flag "is 1, frame-level information" picture_header () "is arranged, followed by 8-bit" first_macr ".
The starting macroblock number is indicated by "block_number". After presentation of the header information, "number_of_slice" is set as concatenated slice data.
The slice data of the number indicated by "slice_data"
7 (b) is a modification of FIG. 7 (a). Instead of indicating the presence / absence of the frame level information by "picture_header_flag", "fir" is connected.
When st_macroblock_number "is zero, that is, when it is the first slice data of the image frame, the frame level information is arranged. FIG. 7C is an extension of FIG. 7A. First, 7-bit "video_sequence"
The e_index "field specifies information about the entire image sequence related to the concatenated slice data. The information about the entire image sequence includes image size, profile and level information, and specific examples include MPEG- Information corresponding to the video object layer in 4 and the sequence header in MPEG-2 is possible.Continued "group_of_pi"
"cture_flag" is "group_of_pic"
"true ()" appears, and if this flag is 1, "group_of_picture ()" is placed. This is information indicating that a plurality of image frames are grouped, and as a specific example, GOV (Group of Vop) in MPEG-4 and MPEG
-2 GOP (Group of Picture)
Information corresponding to e) is possible.

【0017】さらに、図7には示していないが、ランダ
ムアクセスが可能であることを示すフラグを指定するこ
とも可能である。なお、図7で示したフィールド名は一
例を示したに過ぎず、同等の意味をなすのであれば他の
フィールド名であっても良い。
Further, although not shown in FIG. 7, it is possible to designate a flag indicating that random access is possible. Note that the field names shown in FIG. 7 are merely examples, and other field names may be used as long as they have the same meaning.

【0018】以上のような構造である入力データを入力
したデータ入力手段101に対して、スライス分離手段
102は、ヘッダデータ部を解析してスライスデータの
開始位置を特定し、スライスを復号するために必要な情
報とともに、スライス復号手段103に出力する。スラ
イス復号手段103は、スライス分離手段102から指
示されたスライスデータの開始位置とサイズよりデータ
入力手段101から1スライス分のデータを読み込ん
で、スライスを復号する。
In order to decode the slice, the slice separating means 102 analyzes the header data part to specify the start position of the slice data, and decodes the slice, with respect to the data input means 101 which has input data having the above structure. It outputs to the slice decoding means 103 with the information required for. The slice decoding means 103 reads one slice of data from the data input means 101 based on the start position and size of the slice data designated by the slice separating means 102, and decodes the slice.

【0019】表示手段104はスライス復号手段103
が復号したスライスデータを表示する。なお、表示タイ
ミングの一例としては、スライスデータの復号が終了し
た時点で直ちに表示する、あるいは1フレーム分のスラ
イスの復号が終了した時点で表示する、あるいは図に示
していないものの、外部からの指示信号によって復号済
みのスライスデータを表示するなどが可能である。
The display means 104 is a slice decoding means 103.
Display the slice data decoded by. As an example of the display timing, it is displayed immediately when the decoding of the slice data is completed, or it is displayed when the decoding of the slice for one frame is completed, or although not shown in the figure, an instruction from the outside is given. It is possible to display decoded slice data by a signal.

【0020】図8は、MPEG−2伝送方式であるPE
Sパケットに"compound_slice()"を格
納する場合の例(a)、同じくRTP伝送方式であるR
TPパケットに格納する場合の例(b)、MP4伝送方
式であるMP4ファイルに格納する場合の例(c)につ
いて示したものである。図に示すように各種の伝送方式
において、共通のデータ構造である"compound
_slice()"が使用可能であり、従来例の課題と
して説明したようにMPEG−2伝送方式においてスタ
ートコードを削除する必要がなく、RTP伝送方式にお
いて1RTPパケット1スライスデータという制約をな
くしオーバヘッドを削減可能となり、MP4ファイル伝
送方式においては、ファイルヘッダ部のサイズを削減可
能となる。
FIG. 8 shows PE which is an MPEG-2 transmission system.
An example (a) in which “compound_slice ()” is stored in the S packet, R which is also the RTP transmission method
An example (b) when storing in a TP packet and an example (c) when storing in an MP4 file which is an MP4 transmission method are shown. As shown in the figure, "compound" which is a common data structure in various transmission systems
_Slice () "can be used, there is no need to delete the start code in the MPEG-2 transmission system as described as the problem of the conventional example, and the overhead of 1RTP packet / slice data is eliminated in the RTP transmission system to reduce overhead. It is possible to reduce the size of the file header part in the MP4 file transmission method.

【0021】また、伝送方式によらず共通のデータ構造
を使用するため、伝送方式の変換、例えばMPEG−2
伝送方式からRTP伝送方式への変換も容易に行えるよ
うになる。例えば、PESパケットヘッダを削除し、R
TPヘッダを付与することで伝送方式の変換が可能とな
る。これは例えば、地上波あるいは衛星放送でMPEG
−2伝送方式で受信した画像データをインターネット上
にRTP伝送方式で送信する際に、大変有効である。
Since a common data structure is used regardless of the transmission system, conversion of the transmission system, for example, MPEG-2.
The conversion from the transmission system to the RTP transmission system can be easily performed. For example, remove the PES packet header and add R
By adding the TP header, the transmission system can be converted. This is, for example, MPEG for terrestrial or satellite broadcasting
-It is very effective when transmitting image data received by the -2 transmission method on the Internet by the RTP transmission method.

【0022】[0022]

【発明の効果】本発明の請求項1に係る画像データ復号
化装置は、符号化画像フレームの一部をなすスライスデ
ータの個数N(Nは1以上の整数)と前記N個分のスラ
イスデータの開始位置の特定に使用するパラメータと前
記N個分のスライスデータの復号化に使用するサイド情
報とを連結したヘッダデータと、N個のスライスデータ
を連結した連結スライスデータと、を含むデータを入力
するデータ入力手段と、前記入力したヘッダデータにお
ける前記開始位置の特定に使用するパラメータを参照し
て、前記入力した連結スライスデータに含まれるスライ
スデータの開始位置を特定するスライス分離手段と、開
始位置を特定したスライスデータを、前記ヘッダデータ
の復号化に使用するサイド情報を参照して復号する復号
手段と、前記復号したスライスデータを表示する表示手
段と、を備えるため、スタートコードを使用せずとも複
数のスライスデータを分離可能となる。
According to the first aspect of the present invention, there is provided the image data decoding device, wherein the number N of slice data forming a part of an encoded image frame (N is an integer of 1 or more) and the N slice data. Data including header data obtained by concatenating the parameter used for specifying the start position of the slice information and side information used for decoding the N slice data, and concatenated slice data obtained by concatenating N slice data. A data input means for inputting, a slice separating means for identifying a start position of slice data included in the input concatenated slice data with reference to a parameter used for identifying the start position in the input header data, and a start Decoding means for decoding the slice data whose position is specified by referring to side information used for decoding the header data; To provide a display means for displaying the slice data, and without using a start code enables separating a plurality of slice data.

【0023】本発明の請求項2に係る画像データ復号化
装置は、請求項1における前記ヘッダ情報におけるサイ
ド情報は、1画像フレームにおける最初のスライスデー
タに関するものであることを識別する情報を含むため、
画像フレームにおける第1番目のスライスデータである
か否かを識別することが可能となる。
The image data decoding apparatus according to claim 2 of the present invention is characterized in that the side information in the header information in claim 1 includes information for identifying that it is related to the first slice data in one image frame. ,
It is possible to identify whether or not it is the first slice data in the image frame.

【0024】本発明の請求項3に係る画像データ復号化
装置は、請求項1における前記ヘッダ情報におけるサイ
ド情報は、1画像フレームにおける各スライスデータの
表示位置を示す情報を含むため、各スライスを復号後、
確実に表示位置を定めることを可能とするものである。
In the image data decoding apparatus according to claim 3 of the present invention, since the side information in the header information in claim 1 includes information indicating the display position of each slice data in one image frame, each slice is After decryption,
The display position can be reliably determined.

【0025】本発明の請求項4に係る画像データ復号化
装置は、請求項1における前記ヘッダ情報におけるサイ
ド情報は、少なくとも1画像フレームにおける第1番目
のスライスデータである場合は1画像フレームを構成す
る複数のスライスデータで共通に参照される情報を含む
ため、画像フレーム間で共通に使用可能な情報を効率良
く復号できるようになる。
An image data decoding apparatus according to a fourth aspect of the present invention forms one image frame when the side information in the header information according to the first aspect is at least the first slice data in one image frame. Since it includes information commonly referred to by a plurality of slice data, it becomes possible to efficiently decode information commonly used between image frames.

【0026】本発明の請求項5に係る画像データ構造
は、画像データを構成するスライスデータの個数N(N
は1以上の整数)と、前記N個分のスライスデータの開
始位置の特定に使用されるパラメータと、前記N個分の
スライスデータの復号化に使用されるサイド情報とを連
結したヘッダデータと、前記N個のスライスデータを連
結した連結スライスデータと、を含む画像データ構造と
することで、各種の伝送方式において、共通なデータ構
造を実現可能とし、結果一方の伝送方式から他方の伝送
方式への変換が容易になるとともに、画像データを入力
して復号する画像データ復号装置においても、データ構
造の解析部分を共通化することができる。
The image data structure according to claim 5 of the present invention is the number N (N
Is an integer greater than or equal to 1), a parameter used to specify the start position of the N slice data, and side information used to decode the N slice data. , And a concatenated slice data in which the N slice data are concatenated, a common data structure can be realized in various transmission systems, and as a result, one transmission system to the other transmission system can be realized. In addition, the analysis part of the data structure can be made common in the image data decoding device that inputs and decodes the image data.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施の形態1による画像データ復号装
置の機能ブロック図である。
FIG. 1 is a functional block diagram of an image data decoding device according to a first embodiment of the present invention.

【図2】本発明の実施の形態1による画像データ復号装
置の入力データを説明するための図である。
FIG. 2 is a diagram for explaining input data of the image data decoding device according to the first embodiment of the present invention.

【図3】本発明の実施の形態1による画像データ復号装
置の入力データを説明するための図である。
FIG. 3 is a diagram for explaining input data of the image data decoding device according to the first embodiment of the present invention.

【図4】本発明の実施の形態1による画像データ復号装
置の入力データを説明するための図である。
FIG. 4 is a diagram for explaining input data of the image data decoding device according to the first embodiment of the present invention.

【図5】本発明の実施の形態1による画像データ復号装
置の入力データを説明するための図である。
FIG. 5 is a diagram for explaining input data of the image data decoding device according to the first embodiment of the present invention.

【図6】本発明の実施の形態1による画像データ復号装
置の入力データを説明するための図である。
FIG. 6 is a diagram for explaining input data of the image data decoding device according to the first embodiment of the present invention.

【図7】本発明の実施の形態1による画像データ復号装
置の入力データを説明するための文法図である。
FIG. 7 is a grammar diagram for explaining input data of the image data decoding device according to the first embodiment of the present invention.

【図8】本発明の実施の形態1によるデータ構造とMP
EG−2等の伝送方式への格納方法を説明するための図
である。
FIG. 8 is a data structure and MP according to the first embodiment of the present invention.
It is a figure for demonstrating the storage method in transmission systems, such as EG-2.

【図9】MPEG−2で伝送する際の画像データ構造の
従来例の説明図である。
FIG. 9 is an explanatory diagram of a conventional example of an image data structure when transmitting by MPEG-2.

【図10】MPEG−2で伝送する際の画像データ構造
の従来例の説明図である。
FIG. 10 is an explanatory diagram of a conventional example of an image data structure when transmitting by MPEG-2.

【図11】RTPで伝送する際のデータ構造の従来例の
説明図である。
FIG. 11 is an explanatory diagram of a conventional example of a data structure when transmitting by RTP.

【図12】MP4ファイルで伝送する際のデータ構造の
従来例の説明図である。
FIG. 12 is an explanatory diagram of a conventional example of a data structure when transmitting as an MP4 file.

【符号の説明】[Explanation of symbols]

101 データ入力手段 102 スライスデータ分離手段 103 スライス復号手段 104 表示手段 101 data input means 102 slice data separation means 103 slice decoding means 104 display means

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 符号化画像フレームの一部であるスライ
スデータの個数N(Nは1以上の整数)と前記N個分の
スライスデータの開始位置の特定に使用するパラメータ
と前記N個分のスライスデータの復号化に使用するサイ
ド情報とを連結したヘッダデータと、N個のスライスデ
ータを連結した連結スライスデータと、を含むデータを
入力するデータ入力手段と、前記入力したヘッダデータ
における前記開始位置の特定に使用するパラメータを参
照して、前記入力した連結スライスデータに含まれるス
ライスデータの開始位置を特定するスライス分離手段
と、開始位置を特定したスライスデータを、前記ヘッダ
データの復号化に使用するサイド情報を参照して復号す
るスライスデータ復号手段と、前記復号したスライスデ
ータを表示する表示手段と、を備えることを特徴とす
る、画像データ復号装置。
1. A number N of slice data (N is an integer of 1 or more) which is a part of an encoded image frame, a parameter used for specifying a start position of the slice data of N pieces, and the N pieces of slice data. Data input means for inputting data including header data concatenated with side information used for decoding slice data and concatenated slice data concatenated with N slice data, and the start in the inputted header data Referring to the parameter used to specify the position, the slice separating means for specifying the start position of the slice data included in the input concatenated slice data, and the slice data for specifying the start position are used for decoding the header data. Slice data decoding means for decoding by referring to the side information to be used, and a display for displaying the decoded slice data. An image data decoding device comprising: a stage.
【請求項2】 前記ヘッダ情報におけるサイド情報は、
1画像フレームにおける第1番目のスライスデータに関
するサイド情報であることを識別するために使用される
情報を含むことを特徴とする、請求項1に記載の画像デ
ータ復号装置。
2. The side information in the header information is
The image data decoding apparatus according to claim 1, further comprising information used for identifying that the side information is the side information regarding the first slice data in one image frame.
【請求項3】 前記ヘッダ情報におけるサイド情報は、
1画像フレームにおける各スライスデータの表示位置を
特定するために使用される情報を含むことを特徴とす
る、請求項1に記載の画像データ復号装置。
3. The side information in the header information is
The image data decoding apparatus according to claim 1, further comprising information used for specifying a display position of each slice data in one image frame.
【請求項4】 前記ヘッダ情報におけるサイド情報は、
少なくとも1画像フレームにおける第1番目のスライス
データである場合は1画像フレームを構成する複数のス
ライスデータで共通に参照される情報を含むことを特徴
とする、請求項1に記載の画像データ復号装置。
4. The side information in the header information is
The image data decoding apparatus according to claim 1, wherein the image data decoding apparatus includes information commonly referred to by a plurality of slice data forming one image frame when it is at least the first slice data in one image frame. .
【請求項5】 画像データを構成するスライスデータの
個数N(Nは1以上の整数)と、前記N個分のスライス
データの開始位置の特定に使用されるパラメータと、前
記N個分のスライスデータの復号化に使用されるサイド
情報とを連結したヘッダデータと、前記N個のスライス
データを連結した連結スライスデータと、を含む画像デ
ータ構造。
5. The number N of slice data forming image data (N is an integer of 1 or more), a parameter used for specifying a start position of the N slice data, and the N slices. An image data structure including header data in which side information used for data decoding is concatenated, and concatenated slice data in which the N slice data are concatenated.
JP2002126027A 2002-04-26 2002-04-26 Image data decoding apparatus and structure of image data Pending JP2003319389A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002126027A JP2003319389A (en) 2002-04-26 2002-04-26 Image data decoding apparatus and structure of image data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002126027A JP2003319389A (en) 2002-04-26 2002-04-26 Image data decoding apparatus and structure of image data

Publications (1)

Publication Number Publication Date
JP2003319389A true JP2003319389A (en) 2003-11-07

Family

ID=29540572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002126027A Pending JP2003319389A (en) 2002-04-26 2002-04-26 Image data decoding apparatus and structure of image data

Country Status (1)

Country Link
JP (1) JP2003319389A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005229587A (en) * 2004-01-15 2005-08-25 Matsushita Electric Ind Co Ltd Multiplex system conversion device
JP2006319944A (en) * 2005-04-15 2006-11-24 Sony Corp Decoding control device and method, recording medium, and program
CN101902640A (en) * 2009-05-27 2010-12-01 索尼公司 Messaging device and method
JP2014220849A (en) * 2014-08-26 2014-11-20 ソニー株式会社 Image processing apparatus and method
JP2016178682A (en) * 2016-05-24 2016-10-06 ソニー株式会社 Image processing apparatus, method, and program
JP2018029389A (en) * 2017-10-26 2018-02-22 ソニー株式会社 Image processing apparatus, method, and program
US9967593B2 (en) 2009-08-19 2018-05-08 Sony Corporation Image processing device and method
JP2019165456A (en) * 2011-06-14 2019-09-26 サムスン エレクトロニクス カンパニー リミテッド Media packet transmission method in multimedia system

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005229587A (en) * 2004-01-15 2005-08-25 Matsushita Electric Ind Co Ltd Multiplex system conversion device
JP2006319944A (en) * 2005-04-15 2006-11-24 Sony Corp Decoding control device and method, recording medium, and program
CN101902640A (en) * 2009-05-27 2010-12-01 索尼公司 Messaging device and method
JP2010278597A (en) * 2009-05-27 2010-12-09 Sony Corp Apparatus and method for processing information
US8737467B2 (en) 2009-05-27 2014-05-27 Sony Corporation Information processing apparatus and method
US9967593B2 (en) 2009-08-19 2018-05-08 Sony Corporation Image processing device and method
US10587899B2 (en) 2009-08-19 2020-03-10 Sony Corporation Image processing device and method
US10911786B2 (en) 2009-08-19 2021-02-02 Sony Corporation Image processing device and method
JP2019165456A (en) * 2011-06-14 2019-09-26 サムスン エレクトロニクス カンパニー リミテッド Media packet transmission method in multimedia system
JP2014220849A (en) * 2014-08-26 2014-11-20 ソニー株式会社 Image processing apparatus and method
JP2016178682A (en) * 2016-05-24 2016-10-06 ソニー株式会社 Image processing apparatus, method, and program
JP2018029389A (en) * 2017-10-26 2018-02-22 ソニー株式会社 Image processing apparatus, method, and program

Similar Documents

Publication Publication Date Title
KR101073777B1 (en) Converting apparatus of multiplexed system
US7586924B2 (en) Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
US7551672B1 (en) Encoding system and method, decoding system and method, multiplexing apparatus and method, and display system and method
US6671323B1 (en) Encoding device, encoding method, decoding device, decoding method, coding system and coding method
JP2005229587A (en) Multiplex system conversion device
US7558296B2 (en) Multiplexer and demultiplexer
US20100008420A1 (en) Method and decoder for realizing random access in compressed code stream using multi-reference images
US20070165676A1 (en) Information processing device, information processing method, program, and data structure
JP2003319389A (en) Image data decoding apparatus and structure of image data
EP1119206A1 (en) MPEG decoding device
WO2015133250A1 (en) Transmission apparatus, transmission method, reception apparatus and reception method
JP5976189B2 (en) Transmitting apparatus, transmitting method, receiving apparatus, and receiving method
JP2001127726A (en) Signal processor, signal processing method and recording medium
KR100826170B1 (en) Method for managing presentation time stamp in digital broadcasting receiver
JP2008067202A (en) Moving image decoder
JP2000228768A (en) Digital signal transmitter, its method and served medium
JP5976188B2 (en) Transmitting apparatus, transmitting method, receiving apparatus, and receiving method
JP6052354B2 (en) Transmitting apparatus, transmitting method, receiving apparatus, and receiving method
JPH09247623A (en) Recording and reproducing device
JP3584460B2 (en) Bitstream conversion apparatus and method, and provided medium
JP2004328771A (en) Device and method for encoding and decoding, and recording medium
JP2018157591A (en) Transmitter, transmission method, receiver and reception method
JP2004194055A (en) Video transmitting apparatus and video transmitting system
JP2000228769A (en) Digital signal transmitter, its method, digital signal receiver, its method and served medium
WO2003036988A1 (en) Media separating method, image decoding method and image decoding device