JP2018056686A - Image encoder, image encoding method and image encoding program, and image decoder, image decoding method and image decoding program - Google Patents
Image encoder, image encoding method and image encoding program, and image decoder, image decoding method and image decoding program Download PDFInfo
- Publication number
- JP2018056686A JP2018056686A JP2016188129A JP2016188129A JP2018056686A JP 2018056686 A JP2018056686 A JP 2018056686A JP 2016188129 A JP2016188129 A JP 2016188129A JP 2016188129 A JP2016188129 A JP 2016188129A JP 2018056686 A JP2018056686 A JP 2018056686A
- Authority
- JP
- Japan
- Prior art keywords
- image
- tile
- tiles
- frame
- syntax
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Abstract
Description
本開示は、画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラムに関する。 The present disclosure relates to an image encoding device, an image encoding method, an image encoding program, an image decoding device, an image decoding method, and an image decoding program.
H.264/MPEG-4 AVC (Advanced Video Coding)よりもさらに画像情報を高効率に符号化することができる圧縮符号化方式H.265/MPEG-H HEVC(High Efficiency Video Coding)(以下、HEVCと略記する)が標準化されている(非特許文献1参照)。HEVCにおいては、フレーム(ピクチャ)を構成する画素を符号化ツリーユニット(CTU:Coding Tree Unit)と称されるブロックを分割単位として分割するタイルが規定されている。 H.265 / MPEG-H HEVC (High Efficiency Video Coding) (hereinafter referred to as HEVC), which can encode image information more efficiently than H.264 / MPEG-4 AVC (Advanced Video Coding). Are abbreviated to be standardized) (see Non-Patent Document 1). In HEVC, tiles are defined that divide pixels constituting a frame (picture) into blocks called coding tree units (CTUs) as division units.
非特許文献2には、図1に示すように、ヘッドマウントディスプレイによって視認する360度の全天画像401を六面体402の面402A〜402Fに投影し、面402A〜402Fに投影した画像を、図2に示すように、フレーム内の6つの領域に展開することが記載されている。図2において、ハッチングを付していない領域は画像が割り当てられている割り当て領域であり、ハッチングを付した領域は、画像が割り当てられていない非割り当て領域である。
In
ヘッドマウントディスプレイを装着したユーザは、図2に示す画像をヘッドマウントディスプレイで視認することによって、目の前に球状に広がる仮想現実画像(VR画像)のコンテンツを鑑賞することができる。 A user wearing a head-mounted display can view the contents of a virtual reality image (VR image) spreading in a spherical shape in front of the eyes by viewing the image shown in FIG. 2 with the head-mounted display.
ところが、HEVCのタイルでは、図2に示す画像を図3または図4に示すように分割して符号化することはできない。また、図2における非割り当て領域では、本来であれば符号化データを画像復号装置に送信して復号する必要がないが、HEVCではスキップモード、ダイレクトモード、イントラ予測におけるDC(直流)モード等を用いて符号化する必要がある。従って、画像符号化装置は非割り当て領域でも符号を伝送して、画像復号装置は伝送された符号を復号しなければならない。 However, in the HEVC tile, the image shown in FIG. 2 cannot be divided and encoded as shown in FIG. 3 or FIG. In the non-allocation area in FIG. 2, originally, it is unnecessary to transmit the encoded data to the image decoding apparatus and decode it. However, in HEVC, skip mode, direct mode, DC (direct current) mode in intra prediction, etc. Need to be encoded. Therefore, the image encoding device must transmit the code even in the non-allocation area, and the image decoding device must decode the transmitted code.
実施形態は、360度の全天画像を六面体に投影した画像をフレーム内の一部の領域を除いた領域に割り当てて符号化する際の符号化効率を向上させ、符号化または復号の処理量を低減させることができる画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラムを提供することを目的とする。 The embodiment improves the encoding efficiency when encoding an image obtained by projecting a 360-degree all-sky image onto a hexahedron to an area excluding a part of the area in the frame, and the amount of encoding or decoding processing It is an object to provide an image encoding device, an image encoding method, an image encoding program, an image decoding device, an image decoding method, and an image decoding program.
実施形態の第1の態様によれば、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報が入力され、前記画像情報の各フレームを、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割するピクチャ分割部と、前記第1のタイルの画像を符号化して符号化データを生成する符号化データ生成部と、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義した第1のシンタックス要素を含むシンタックスを生成するシンタックス生成部と、前記符号化データと前記シンタックスとを含むビットストリームを生成するビットストリーム生成部とを備えることを特徴とする画像符号化装置が提供される。 According to the first aspect of the embodiment, image information in a format including an allocated area in which an image is allocated in a frame and an unallocated area in which no image is allocated is input, and each frame of the image information is A picture dividing unit that divides into one or a plurality of first tiles set in the allocation area and one or a plurality of second tiles set in the non-allocation area, and an image of the first tile The encoded data generation unit that generates encoded data by encoding the image, and the first and second tiles are defined by the horizontal position and vertical position of the upper left corner in the frame, and the horizontal size and vertical size, respectively. Generating a syntax including the first syntax element, and generating a bitstream including the encoded data and the syntax The image coding apparatus is provided, characterized in that it comprises a appropriate bit stream generation unit.
実施形態の第2の態様によれば、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報の各フレームを、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割し、前記第1のタイルの画像を符号化して符号化データを生成し、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスを生成し、前記符号化データと前記シンタックスとを含むビットストリームを生成することを特徴とする画像符号化方法が提供される。 According to the second aspect of the embodiment, each frame of image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated is set as the allocation area. Dividing into one or a plurality of first tiles and one or a plurality of second tiles set in the non-allocation area, encoding an image of the first tiles to generate encoded data, Each of the first and second tiles generates a syntax including syntax elements defined by a horizontal position and a vertical position of the upper left corner in the frame, a horizontal size and a vertical size, and the encoded data; An image encoding method is provided that generates a bitstream including the syntax.
実施形態の第3の態様によれば、コンピュータに、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報の各フレームを、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割するステップと、前記第1のタイルの画像を符号化して符号化データを生成するステップと、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスを生成するステップと、前記符号化データと前記シンタックスとを含むビットストリームを生成するステップとを実行させることを特徴とする画像符号化プログラムが提供される。 According to the third aspect of the embodiment, each frame of image information in a format including an allocation area to which an image is allocated in a frame and a non-allocation area to which no image is allocated is assigned to the computer. Dividing into one or more first tiles set to 1 and a plurality of second tiles set to the non-allocation area, and encoding and encoding an image of the first tile Generating data, and generating a syntax including a syntax element for each of the first and second tiles defined by a horizontal position and a vertical position of the upper left corner in the frame, and a horizontal size and a vertical size. And generating a bitstream including the encoded data and the syntax. Image coding program is provided.
実施形態の第4の態様によれば、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報であり、前記画像情報の各フレームが、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割され、前記第1のタイルの画像が符号化された符号化データと、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義した第1のシンタックス要素を含むシンタックスとを含むビットストリームを受信するビットストリーム受信部と、前記符号化データを復号して前記第1のタイルの復号画像を生成する復号部と、前記第1のシンタックス要素に基づいて、前記第1のタイルの復号画像と前記第2のタイルの単一画像とを合成して各フレームの復号画像情報を生成するピクチャ合成部とを備えることを特徴とする画像復号装置が提供される。 According to the fourth aspect of the embodiment, it is image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated, and each frame of the image information includes: The image is divided into one or more first tiles set in the allocated area and one or more second tiles set in the non-allocated area, and the image of the first tile is encoded A syntax including encoded data and a first syntax element that defines each of the first and second tiles by a horizontal position and a vertical position of the upper left corner in the frame, and a horizontal size and a vertical size; A bitstream receiving unit that receives a bitstream including: a decoding unit that decodes the encoded data to generate a decoded image of the first tile; and the first An image comprising: a picture composition unit that composes a decoded image of the first tile and a single image of the second tile based on a syntax element to generate decoded image information of each frame. A decoding device is provided.
実施形態の第5の態様によれば、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報であり、前記画像情報の各フレームが、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割され、前記第1のタイルの画像が符号化された符号化データと、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスとを含むビットストリームを受信し、前記符号化データを復号して前記第1のタイルの復号画像を生成し、前記シンタックス要素に基づいて、前記第1のタイルの復号画像と前記第2のタイルの単一画像とを合成して各フレームの復号画像情報を生成することを特徴とする画像復号方法が提供される。 According to the fifth aspect of the embodiment, the image information has a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated, and each frame of the image information includes: The image is divided into one or more first tiles set in the allocated area and one or more second tiles set in the non-allocated area, and the image of the first tile is encoded A bit including encoded data and a syntax including a syntax element in which each of the first and second tiles is defined by the horizontal position and vertical position of the upper left corner in the frame and the horizontal size and vertical size. Receiving a stream, decoding the encoded data to generate a decoded image of the first tile, and decoding the first tile based on the syntax element. Image decoding method characterized by by combining the single image of the image and the second tile to generate a decoded image information of each frame is provided.
実施形態の第6の態様によれば、コンピュータに、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報であり、前記画像情報の各フレームが、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割され、前記第1のタイルの画像が符号化された符号化データと、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスとを含むビットストリームを受信するステップと、前記符号化データを復号して前記第1のタイルの復号画像を生成受信するステップと、前記シンタックス要素に基づいて、前記第1のタイルの復号画像と前記第2のタイルの単一画像とを合成して各フレームの復号画像情報を生成するステップとを実行させることを特徴とする画像復号プログラムが提供される。 According to the sixth aspect of the embodiment, the image information is in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated in the computer. A frame is divided into one or a plurality of first tiles set in the allocated area and one or a plurality of second tiles set in the non-allocated area, and an image of the first tile is encoded. Encoded syntax data, and a syntax including syntax elements defined by the horizontal position and vertical position of the upper left corner of the frame, and the horizontal size and vertical size, respectively, of the first and second tiles. Receiving a bitstream including: decoding the encoded data to generate and receive a decoded image of the first tile; and And a step of generating a decoded image information of each frame by combining the decoded image of the first tile and the single image of the second tile based on a block element. A program is provided.
実施形態の画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラムによれば、360度の全天画像を六面体に投影した画像をフレーム内の一部の領域を除いた領域に割り当てて符号化する際の符号化効率を向上させ、符号化または復号の処理量を低減させることができる。 According to the image encoding device, the image encoding method, and the image encoding program of the embodiment, and the image decoding device, the image decoding method, and the image decoding program, an image obtained by projecting a 360-degree all-sky image onto a hexahedron is obtained. It is possible to improve encoding efficiency when encoding is performed by allocating to a region excluding a part of the region in the frame, and the processing amount of encoding or decoding can be reduced.
以下、一実施形態の画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラムについて、添付図面を参照して説明する。 Hereinafter, an image encoding device, an image encoding method, an image encoding program, an image decoding device, an image decoding method, and an image decoding program according to an embodiment will be described with reference to the accompanying drawings.
まず、図5を用いて、画像符号化装置及び画像復号装置を含む画像符号化・復号システムの全体的な構成例について説明する。図5において、前処理装置50は、ユーザによる操作に従って、一実施形態の画像符号化装置100による画像情報の符号化のための各種の条件を設定する。画像符号化装置100は、前処理装置50からの設定情報に応じて、画像情報を符号化してビットストリームを出力する。ビットストリームは、符号化された画像情報及びシンタックスを含む。
First, an overall configuration example of an image encoding / decoding system including an image encoding device and an image decoding device will be described with reference to FIG. In FIG. 5, the
送信装置110は、ビットストリームを所定の伝送路120に送信する。伝送路120は有線または無線であり、インターネットのような通信回線、電話回線、テレビジョン信号を送信する地上波放送または衛星放送用の電波のいずれでもよい。受信装置150は、伝送路120によって送信されたビットストリームを受信する。一実施形態の画像復号装置200は、ビットストリームを復号して復号画像情報を出力する。
The
<画像符号化装置>
図6は、画像符号化装置100の具体的な構成例を示す。図6において、画像符号化装置100に入力される画像情報は、図2に示すような、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報である。
<Image encoding device>
FIG. 6 shows a specific configuration example of the
並べ替え(Re-order)バッファ1には、デジタル信号の画像情報の画素が順に入力される。画像情報がアナログ信号であれば、並べ替えバッファ1の前段でA/D変換器によってデジタル信号に変換されていればよい。画像情報は例えば輝度信号Y(以下、Y信号)と色差信号Cb及びCr(以下、Cb及びCr信号)であり、4:2:0フォーマットのY,Cb,Cr映像信号を例とする。
Pixels of image information of digital signals are sequentially input to the
並べ替えバッファ1は入力された画素を複数フレーム分蓄積し、必要に応じてフレーム(ピクチャ)を並べ替えて読み出す。画像情報の各フレームは、フレーム内の画素を用いて符号化するIピクチャ、過去のフレーム内の画素を用いて予測符号化するPピクチャ、過去及び未来のフレーム内の画素を用いて予測符号化するBピクチャのいずれかに設定される。Iピクチャ、Pピクチャ、Bピクチャは前処理装置50によって設定されてもよいし、画像符号化装置100が予め定めた規則に従って選択してもよい。
The
並べ替えバッファ1は、後述するビットストリームを構成するシーケンスの構成単位となる複数のピクチャ群(GOP)にBピクチャが含まれる場合には、符号化のためにフレームの順を並び替えて読み出す。並べ替えバッファ1より読み出された各フレームの画素は、ピクチャ分割部104を介して減算器2に供給される。
The
タイル分割設定部101、スキップタイル設定部102、参照タイル設定部103、ピクチャ分割部104の動作を説明する前に、減算器2以降の動作を説明する。
Before describing the operations of the tile
減算器2に入力される各フレームは、例えば水平64画素、垂直64画素のCTUに分割され、各CTUは、再帰的な四分木ブロック分割に基づいて可変サイズの符号化ユニット(CU:Coding Unit)に分割されることがある。最大サイズのCUは最大符号化ユニット(LCU:Largest Coding Unit)と称され、最小サイズのCUは最小符号化ユニット(SCU:Smallest Coding Unit)と称される。
Each frame input to the
CUは、イントラ予測部14及びインター予測部15における予測処理のために予測ユニット(PU:Prediction Unit)に分割される。また、CUは、直交変換部3における直交変換処理及び量子化部4における量子化処理のために、再帰的な四分木ブロック分割に基づいて可変サイズの変換ユニット(TU:Transform Unit)に分割される。
The CU is divided into prediction units (PUs) for prediction processing in the
以上の可変サイズのCU、PU、TUは、後述するコスト関数値が最小となるように選択される。画像情報の絵柄に応じてコスト関数値が最小となるCU、PU、TUは異なるから、各フレームの画素はサイズが異なるCU、PU、TUが混在した状態で分割される。 The variable size CU, PU, and TU described above are selected so that the cost function value described later is minimized. Since the CU, PU, and TU that minimize the cost function value are different according to the pattern of the image information, the pixels of each frame are divided in a state where CU, PU, and TU having different sizes are mixed.
減算器2は、ピクチャ分割部104より出力された原画像である画像情報のCUより、後述するイントラ予測部14またはインター予測部15によって生成された予測値(予測画像)を減算して、予測残差を生成する。減算器2は、予測残差を直交変換部3に供給する。
The
直交変換部3は、予測残差をTU単位で直交変換して、予測残差を周波数領域の信号に変換する。直交変換部3は、直交変換として、イントラ予測が選択されてTUが水平4画素、垂直4画素の場合のみ離散サイン変換(DST)を用い、他の場合は離散コサイン変換(DCT)を用いて、予測残差を直交変換する。直交変換部3は、直交変換係数を量子化部4に供給する。
The
量子化部4は、直交変換係数を量子化してエントロピー符号化部5及び逆量子化部8に供給する。エントロピー符号化部5は、量子化された直交変換係数に対して発生確率に基づいて異なる長さの符号を割り当てて、直交変換係数をエントロピー符号化する。
The
エントロピー符号化部5は、画像情報を符号化する際のシンタックスもエントロピー符号化する。シンタックスは、イントラ予測部14またはインター予測部15で選択された予測モード、動きベクトル、参照画素を特定するための情報等の各種のシンタックス要素を含む。また、シンタックスは、タイル分割設定部101、スキップタイル設定部102、参照タイル設定部103での設定情報を示すシンタックス要素も含む。
The entropy encoding unit 5 also entropy encodes the syntax for encoding image information. The syntax includes various syntax elements such as information for specifying a prediction mode, a motion vector, and a reference pixel selected by the
エントロピー符号化部5は、一例として、コンテクスト適応算術符号(CABAC: Context-based Adaptive Binary Arithmetic Coding)を用いて直交変換係数及びシンタックスをエントロピー符号化することができる。 As an example, the entropy encoding unit 5 can entropy encode orthogonal transform coefficients and syntax using context adaptive arithmetic code (CABAC: Context-based Adaptive Binary Arithmetic Coding).
レート制御部7は、エントロピー符号化部5より出力される符号化データがオーバーフローまたはアンダーフローしないよう、量子化部4における量子化動作のレートを制御する。
The rate control unit 7 controls the rate of the quantization operation in the
HRD(Hypothetical Reference Decoder)バッファ6はエントロピー符号化部5より出力される符号化データよりなるビットストリームを一時的に蓄積して出力する。
An HRD (Hypothetical Reference Decoder)
逆量子化部8は、量子化された直交変換係数をTU単位で逆量子化して、逆直交変換部9に供給する。逆量子化部8における逆量子化の動作は、量子化部4における量子化の動作とは逆の動作である。
The
逆直交変換部9は、入力された直交変換係数をTU単位で逆直交変換して、予測残差を加算器10に供給する。加算器10は、入力された予測残差と、予測値選択部16により選択されたイントラ予測部14またはインター予測部15によって生成された予測値とを加算して、復号信号を生成する。復号信号はループフィルタ11及びフレームメモリ12に供給される。
The inverse
ループフィルタ11は、復号信号の符号化ノイズを低減させる。ループフィルタ11は、ブロックの境界に生じる歪を低減させるデブロッキング・フィルタと、リンギング歪を低減させる画素適応オフセットとを含む。ループフィルタ11によってフィルタ処理された復号信号はフレームメモリ12に供給される。
The
フレームメモリ12は、加算器10より出力されたループフィルタ11によるフィルタ処理を施していない復号信号と、ループフィルタ11によるフィルタ処理が施された復号信号とを蓄積する。スイッチ13は、フレームメモリ12に蓄積されたフィルタ処理を施していない復号信号をイントラ予測部14に供給し、フレームメモリ12に蓄積されたフィルタ処理が施された復号信号をインター予測部15に供給する。
The
イントラ予測部14は、Y信号、Cb及びCr信号のそれぞれで、TU単位で、複数の予測モードで予測値を生成する。但し、予測モードはPU単位で選択される。イントラ予測部14は、コスト関数値を算出して、コスト関数値が最小となるCU、PU、TUのサイズを選択し、かつ、コスト関数値が最小となる予測モードの予測値を選択する。
The
インター予測部15は、画像の動きを検出し、CUのサイズを上限として、最小で水平8画素、垂直4画素または水平4画素、垂直8画素のPUから最大で水平64画素、垂直64画素のPUで、フレーム間動き補償予測を行って予測値を生成する。インター予測部15は、過去のフレームもしくは未来のフレーム、または、過去及び未来のフレームを参照して予測値(予測画像)を生成する。過去及び未来のフレームはそれぞれ複数のフレームであってもよい。
The
同様に、インター予測部15は、コスト関数値を算出して、コスト関数値が最小となるCU、PU、TUのサイズを選択し、かつ、コスト関数値が最小となる予測モードの予測値を選択する。
Similarly, the
予測値選択部16は、イントラ予測部14で選択された予測値とインター予測部15で選択された予測値とのうち、コスト関数値が小さい方を最終的な予測値として選択して減算器2及び加算器10に供給する。
The prediction
なお、Iピクチャを符号化する際にはイントラ予測部14による予測値のみが用いられる。Pピクチャ及びBピクチャを符号化する際には、イントラ予測部14で選択された予測値とインター予測部15で選択された予測値とのうちの小さい方の予測値が選択される。
Note that only the prediction value by the
減算器2からエントロピー符号化部5までの部分、及び、逆量子化部8から予測値選択部16までの部分は、画像情報を符号化して符号化データを生成する符号化データ生成部として機能する。
The part from the
次に、タイル分割設定部101、スキップタイル設定部102、参照タイル設定部103、ピクチャ分割部104の動作を説明する。
Next, operations of the tile
画像情報は、タイル分割設定部101にも入力される。タイル分割設定部101は、各フレームを複数のタイルに分割するよう設定する。スキップタイル設定部102は、スキップするタイルを設定する。参照タイル設定部103は、参照するタイルを設定する。タイル分割設定部101〜参照タイル設定部103によって設定した各情報は、ピクチャ分割部104に供給される。
The image information is also input to the tile
タイル分割設定部101〜参照タイル設定部103は、予め設定されて条件でそれぞれの設定を実行してもよいし、前処理装置50からの指示に応じてそれぞれの設定を実行してもよい。
The tile
ピクチャ分割部104に供給される画像情報は、1または複数のスライスに分割される。図7に示すように、複数のCTUよりなるフレームは、少なくとも1つのスライスを含む。図7において、太実線はスライスの境界を示しており、フレームは例えば3つのスライスSL0〜SL2に分割される。フレームをどのように複数のスライスに分割するかは、前処理装置50によって設定される。スライスSL0〜SL2はそれぞれ連続する少なくとも1つのCTUを含む。
The image information supplied to the
画像符号化装置100はスライス単位で画像情報を符号化し、画像復号装置200はスライス単位で画像情報を復号する。図7において、実線で示す矢印は符号化及び復号の順を示している。
The
また、複数のCTUよりなるフレームは、図8に示すように、タイル分割設定部101による設定によって、複数のタイルで分割することができる。図8において、太実線はタイルの境界を示しており、フレームは6つのタイルTL0〜TL8に分割される。後述するようにスライスとタイルとの互いの関係に制約はあるものの、ここでは図7に示すスライスの分割とは無関係にタイルの分割を示している。
Also, a frame composed of a plurality of CTUs can be divided into a plurality of tiles by setting by the tile
画像符号化装置100はタイル単位で画像情報を符号化し、画像復号装置200はタイル単位で画像情報を復号する。図8において、実線で示す矢印は符号化及び復号の順を示している。タイルは、VR画像の符号化の他、並列処理またはROI(Region Of Interest)符号化のために用いることができる。
The
図9(a)は、タイルTL0の中にスライスSL0及びSL1が設定され、タイルTL1の中にスライスSL2及びSL3が設定されている状態を示している。タイルはスライスのスーパーセットとすることができる。図9(b)は、スライスSL0の中にタイルTL0及びTL1が設定されている状態を示している。スライスはタイルのスーパーセットとすることができる。図9(a)及び図9(b)に示すように、スライスとタイルとの互いの関係を設定することができる。 FIG. 9A shows a state in which slices SL0 and SL1 are set in the tile TL0, and slices SL2 and SL3 are set in the tile TL1. A tile can be a superset of slices. FIG. 9B shows a state where tiles TL0 and TL1 are set in the slice SL0. A slice can be a superset of tiles. As shown in FIGS. 9A and 9B, the relationship between slices and tiles can be set.
図9(c)におけるスライスSL0〜SL2とタイルTL0及びTL1とは、スライスとタイルとのうちの一方がスーパーセットで他方がサブセットの関係にないので、設定不可である。 The slices SL0 to SL2 and the tiles TL0 and TL1 in FIG. 9C cannot be set because one of the slices and tiles is not a superset and the other is not a subset.
図6において、タイル分割設定部101は、具体的に次のように各フレームに対してタイルの分割を設定する。タイル分割設定部101は、1つのフレームに含まれるタイルの個数を設定する。タイルの個数を4とし、図10に示すように4つのタイルを設定する場合を例とする。
In FIG. 6, the tile
図10において、タイル番号0〜3のタイルTL0〜TL3は、図11に示すように定義することができる。ハッチングを付したタイルTL1及びTL3は、図2における非割り当て領域に相当する。ハッチングを付していないタイルTL0及びTL2は、画像が割り当てられた割り当て領域である。
In FIG. 10, tiles TL0 to TL3 with
図11に示すように、タイル番号0のタイルTL0は、黒丸で示す左上角部の座標を水平位置X0、垂直位置Y0とし、水平サイズh0、垂直サイズv0と定義される。タイルTL0におけるスキップタイルフラグは0であり、スキップされないタイルであることを示す。
As shown in FIG. 11, the tile TL0 with
タイル番号1のタイルTL1は、黒丸で示す左上角部の座標を水平位置X1、垂直位置Y1とし、水平サイズh1、垂直サイズv1と定義される。タイルTL1におけるスキップタイルフラグは1であり、スキップされるタイルであることを示す。
The tile TL1 with the
タイル番号2のタイルTL2は、黒丸で示す左上角部の座標を水平位置X2、垂直位置Y2とし、水平サイズh1、垂直サイズv2と定義される。タイルTL1におけるスキップタイルフラグは0である。タイル番号3のタイルTL3は、黒丸で示す左上角部の座標を水平位置X3、垂直位置Y3とし、水平サイズh1、垂直サイズv3と定義される。タイルTL3におけるスキップタイルフラグは1である。
The tile TL2 of
タイルTL0〜TL3の水平位置及び垂直位置はCTU単位の座標である。タイルTL0〜TL3の水平サイズ及び垂直サイズはCTU単位の大きさである。例えばCTUの大きさが水平64画素、垂直64画素であり、水平サイズが128画素、垂直サイズが192画素であるとすると、伝送される水平サイズを示すシンタックス要素は2、垂直サイズを示すシンタックス要素は3となる。本実施形態においては、1つのフレームに含まれるタイルの個数を設定し、それぞれのタイルの左上角部の座標と、水平サイズ及び垂直サイズとを設定することにより、従来のHEVCでは設定できなかったタイルを設定することができる。 The horizontal and vertical positions of the tiles TL0 to TL3 are coordinates in CTU units. The horizontal size and vertical size of the tiles TL0 to TL3 are CTU units. For example, if the size of the CTU is 64 pixels horizontal and 64 pixels vertical, the horizontal size is 128 pixels, and the vertical size is 192 pixels, the syntax element indicating the transmitted horizontal size is 2, and the syntax element indicating the vertical size is 2. The tax element is 3. In this embodiment, the number of tiles included in one frame is set, and the coordinates of the upper left corner of each tile, the horizontal size, and the vertical size are set, which cannot be set in the conventional HEVC. Tiles can be set.
スキップタイル設定部102は、従来のHEVCでは設定できなかったスキップするタイルを設定することができる。図10において、タイルTL1及びTL3をスキップするタイルと設定すれば、タイルTL1及びTL3を符号化する必要がなくなり、符号化効率を向上させることができる。
The skip
図12に示すタイルTL4とタイルTL7とは、フレーム内では離れているものの、図1に示す六面体402では隣り合う面(402F及び402A)に投影されている画像である。従って、タイルTL4とタイルTL7とは相関が高い。そこで、参照タイル設定部103は、タイルごとに、参照する1または複数のタイルを設定することができる。参照タイル設定部103が生成する参照するタイルの設定情報は、符号化するあるタイルと参照するタイルとの予測依存関係を示す情報である。
A tile TL4 and a tile TL7 illustrated in FIG. 12 are images projected on adjacent surfaces (402F and 402A) in the
図6に戻り、ピクチャ分割部104は、図11に示すように設定されたタイル分割の設定情報に基づき、各フレームを分割する。ピクチャ分割部104は、画像情報のフォーマットに応じて、割り当て領域を1または複数のタイル(第1のタイル)に分割し、非割り当て領域を1または複数のタイル(第2のタイル)に分割すればよい。図2に示すフォーマットであれば、割り当て領域と非割り当て領域とをそれぞれ複数のタイルに分割することが必要である。
Returning to FIG. 6, the
ピクチャ分割部104は、タイル分割とスキップするタイルと参照するタイルの設定情報とをエントロピー符号化部5に供給する。エントロピー符号化部5は、これらの設定情報を示すシンタックス要素を含むシンタックスを生成してエントロピー符号化する。エントロピー符号化部5は、シンタックス生成部及びビットストリーム生成部として機能する。
The
図13は、エントロピー符号化部5によって生成されて出力される、タイルに関するシンタックス要素を含むシンタックスの一例を示している。タイルに関するシンタックス要素は、ビットストリームのピクチャパラメータセット(Picture Parameter Set)に含まれて伝送されればよい。 FIG. 13 shows an example of a syntax including syntax elements related to tiles generated and output by the entropy encoding unit 5. The syntax element related to the tile may be transmitted by being included in the picture parameter set (Picture Parameter Set) of the bit stream.
タイルイネーブルフラグ(tiles_enabled_flag)が1のとき、シンタックスに、水平位置(hpos)、垂直位置(vpos)、水平サイズ(hsize)、垂直サイズ(vsize)、スキップタイルフラグ(skip_tile_flag)、参照タイル数(num_ref_tiles)、参照タイル番号(ref_tile_no)が設定される。 When the tile enable flag (tiles_enabled_flag) is 1, the syntax includes horizontal position (hpos), vertical position (vpos), horizontal size (hsize), vertical size (vsize), skip tile flag (skip_tile_flag), number of reference tiles ( num_ref_tiles) and reference tile number (ref_tile_no) are set.
スキップタイルフラグ0はスキップしないタイルであることを示し、スキップタイルフラグ1はスキップするタイルであることを示す。図13に示すように、参照タイル数は0であってもよい。なお、図13におけるloop_filter_across_tiles_enabled_flagは、タイル間にループフィルタ11によるフィルタリングを施すか否かを設定するフラグである。
The
以上のようにして、画像符号化装置100は、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットのVR画像の符号化効率を向上させ、符号化の処理量を低減させることができる。
As described above, the
<画像符号化方法>
図14に示すフローチャートを用いて、画像符号化装置100で実行される本実施形態の画像符号化方法による処理を説明する。図14は、タイル分割設定部101、スキップタイル設定部102、参照タイル設定部103で実行される処理を示している。
<Image coding method>
The process by the image coding method of this embodiment performed with the
図14において、タイル分割設定部101は、ステップS101にて、タイル数を設定し、ステップS102にて、まず、タイル番号を0に設定する。タイル分割設定部101は、ステップS103にて、水平位置及び垂直位置を設定し、ステップS104にて、水平サイズ及び垂直サイズを設定する。
In FIG. 14, the tile
スキップタイル設定部102は、ステップS105にて、各タイルに対してスキップタイルフラグを設定する。参照タイル設定部103は、ステップS106にて、スキップタイルフラグが1であるか否かを判定する。スキップタイルフラグが1でなければ(NO)、参照タイル設定部103は、ステップS107にて、参照タイル数を設定する。参照タイル数は0以上の数であり、0は他のタイルを参照しないことを示し、1以上の数はその数のタイルを参照することを示す。
In step S105, the skip
参照タイル設定部103は、ステップS108にて、参照タイル数が0以外であるか否かを判定する。参照タイル数が0以外であれば(YES)、参照タイル設定部103は、ステップS109にて、参照タイル番号を設定する。その後、処理はステップS110に移行される。
In step S108, the reference
ステップS106にてスキップタイルフラグが1であれば(YES)、また、ステップS108にて参照タイル数が0以外でなければ(NO)(即ち、参照タイル数が0であれば)、処理はステップS110に移行される。 If the skip tile flag is 1 in step S106 (YES), and if the number of reference tiles is not 0 in step S108 (NO) (that is, if the number of reference tiles is 0), the process proceeds to step S106. Moved to S110.
タイル分割設定部101は、ステップS110にて、タイル番号がタイル数−1となったか否かを判定する。タイル番号がタイル数−1でなければ(NO)、まだタイルが残っているので、タイル分割設定部101は、ステップS111にて、タイル番号を1増加させ、処理をステップS103に戻す。
In step S110, the tile
タイル分割設定部101、スキップタイル設定部102、参照タイル設定部103は、次のタイル番号のタイルでもステップS103〜S110の処理を繰り返す。ステップS110にてタイル番号がタイル数−1であれば(YES)、全てのタイルに対する設定が終了したので、タイル分割設定部101、スキップタイル設定部102、参照タイル設定部103は処理を終了させる。
The tile
<画像符号化プログラム>
図6に示す画像符号化装置100による動作をコンピュータプログラム(画像符号化プログラム)によってコンピュータに実行させることができる。図14に示す各処理を画像符号化プログラムによってコンピュータに実行させることができる。
<Image coding program>
The operation of the
図15Aにおいて、コンピュータ300は、中央処理装置(CPU)301及び記憶部302を有する。コンピュータ300には、操作部310が接続されている。記憶部302には、画像符号化プログラムが記憶されている。操作部310を図5に示す前処理装置50として機能させることができる。CPU301が画像符号化プログラムを実行させることによって、コンピュータ300を、入力された画像情報を符号化する画像符号化装置100として機能させることができる。
In FIG. 15A, the
記憶部302は、半導体メモリ、ハードディスクドライブ、光ディスク等の任意の非一時的な記憶媒体である。画像符号化プログラムは、インターネット等の通信回線を介してコンピュータ300に提供されてもよい。
The
以上説明した画像符号化装置100、画像符号化方法、画像符号化プログラムは、1つのフレーム内で、タイルはオーバラップせず、タイルが設定されていない領域が存在しないように画像情報を符号化するものとする。
The
<画像復号装置>
図16は、画像復号装置200の具体的な構成例を示す。図16において、HRDバッファ21はビットストリームを一時的に蓄積して、エントロピー復号部22に供給する。HRDバッファ21は、ビットストリームを受信するビットストリーム受信部として機能する。
<Image decoding device>
FIG. 16 shows a specific configuration example of the
ビットストリームは、符号化データとシンタックスとを含む。符号化データは、前述のように、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報を符号化した符号化データである。 The bit stream includes encoded data and syntax. As described above, the encoded data is encoded data obtained by encoding image information in a format including an allocated area in which an image is allocated in a frame and an unallocated area in which no image is allocated.
また、符号化データは、各フレームが、割り当て領域に設定された1または複数のタイルと、非割り当て領域に設定された1または複数のタイルとに分割され、割り当て領域に設定されたタイルの画像が符号化された符号化データである。 Also, the encoded data is divided into one or a plurality of tiles set in the allocation area and one or a plurality of tiles set in the non-allocation area, and an image of the tile set in the allocation area. Is the encoded data.
シンタックスは、それぞれのタイルを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含む。シンタックスは、非割り当て領域に設定されたタイルの画像を符号化しないことを示すスキップタイルフラグであるシンタックス要素を含むことが好ましい。シンタックスは、予測依存関係を示すシンタックス要素を含むことが好ましい。 The syntax includes syntax elements that define each tile with a horizontal position and vertical position of the upper left corner in the frame, and a horizontal size and vertical size. It is preferable that the syntax includes a syntax element that is a skip tile flag indicating that the image of the tile set in the non-allocation area is not encoded. The syntax preferably includes a syntax element indicating a prediction dependency.
エントロピー復号部22は、ビットストリームに含まれる直交変換係数及びシンタックスをエントロピー復号する。
The
直交変換係数は逆量子化部23に供給される。イントラ予測とインター予測とのいずれが採用されたかを示す情報は、スイッチ32に供給される。イントラ予測に関する情報は、イントラ予測部30に供給される。インター予測に関する情報は、インター予測部31に供給される。
The orthogonal transform coefficient is supplied to the inverse quantization unit 23. Information indicating whether intra prediction or inter prediction is adopted is supplied to the
タイル分割に関する情報は、タイル分割復号部201に供給される。スキップタイルに関する情報は、タイル分割復号部201を介してスキップタイル設定部202に供給される。参照タイルに関する情報は、インター予測部31と、タイル分割復号部201及びスキップタイル設定部202を介して参照タイル設定部203に供給される。
Information relating to tile division is supplied to the tile
逆量子化部23は、直交変換係数をTU単位で逆量子化して、逆直交変換部24に供給する。逆直交変換部24は、逆量子化された直交変換係数をTU単位で逆直交変換して、予測残差を加算器25に供給する。加算器25は、入力された予測残差と、スイッチ32より供給されるイントラ予測部30またはインター予測部31によって生成された予測値とを加算して、復号信号を生成する。復号信号はループフィルタ26及びフレームメモリ28に供給される。
The inverse quantization unit 23 inversely quantizes the orthogonal transform coefficient in units of TU and supplies the inverse transform coefficient to the inverse
ループフィルタ26はループフィルタ11と同様の構成であり、復号信号の符号化ノイズを低減させる。並べ替え(Re-order)バッファ27は、ループフィルタ26から供給される画素を複数フレーム分蓄積する。並べ替えバッファ27は、フレームの順が並び替えられていれば、フレームを原画像の画像情報の順に並び替える。並べ替えバッファ27より出力された各フレームのタイルを構成する画素は、ピクチャ合成部204に供給される。
The
フレームメモリ28は、加算器25より出力されたループフィルタ26によるフィルタ処理を施していない復号信号と、ループフィルタ26によるフィルタ処理が施された復号信号とを蓄積する。スイッチ29は、フレームメモリ28に蓄積されたフィルタ処理を施していない復号信号をイントラ予測部30に供給し、フレームメモリ28に蓄積されたフィルタ処理が施された復号信号をインター予測部31に供給する。
The
イントラ予測部30は、イントラ予測の予測モードを示す情報に従ってフレーム内予測を行って、Y信号とCb及びCr信号のそれぞれの予測値を生成する。インター予測部31は、インター予測に関する情報に従ってフレーム間予測を行って、Y信号とCb及びCr信号のそれぞれの予測値を生成する。
The
インター予測部31は、参照タイルに関する情報が入力されるとき、図12に示すように、他のタイル(ここではTL7)の画像を参照して、あるタイル(ここではTL4)の画像の予測値を生成する。
When the information regarding the reference tile is input, the
スイッチ32は、イントラ予測とインター予測とのいずれが採用されたかを示す情報に従って、イントラ予測部30またはインター予測部31によって生成された予測値を加算器25に供給する。
The
エントロピー復号部22からスイッチ32までの部分は、符号化データを復号して、割り当て領域に設定されたタイルの復号画像を生成する復号部として機能する。
The portion from the
タイル分割復号部201は、図11に示すように設定されたタイル分割の設定情報を復号して、スキップタイル設定部202に供給する。スキップタイル設定部202は、スキップタイルフラグに基づいてスキップするタイルを設定する。参照タイル設定部203は、参照するタイルを設定する。タイル分割の設定情報、スキップするタイルの情報、参照するタイルの情報は、ピクチャ合成部204に供給される。
The tile
ピクチャ合成部204は、タイル分割の設定情報に基づいて、復号されたタイルの画像をフレーム内の割り当て領域に配置する。ピクチャ合成部204は、スキップするタイルの情報に基づいて、非割り当て領域に例えば黒の単一画像を配置する。ピクチャ合成部204はこのように複数のタイルをピクチャ合成して、図2に示すようなフォーマットの復号画像情報の各フレームの復号画像情報を生成する。復号画像情報は、必要に応じてD/A変換器によってアナログ信号に変換される。
The
以上のようにして、画像復号装置200は、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットのVR画像を復号する処理量を低減させることができる。
As described above, the
<画像復号方法>
図17に示すフローチャートを用いて、画像復号装置200で実行される本実施形態の画像復号方法による処理を説明する。図17は、タイル分割復号部201、スキップタイル設定部202、参照タイル設定部203で実行される処理を示している。
<Image decoding method>
The process by the image decoding method of this embodiment performed with the
図17において、タイル分割復号部201は、ステップS201にて、タイル数を受信し、ステップS202にて、まず、タイル番号を0に設定する。タイル分割復号部201は、ステップS203にて、水平位置及び垂直位置を受信し、ステップS204にて、水平サイズ及び垂直サイズを受信する。
In FIG. 17, the tile
スキップタイル設定部202は、ステップS205にて、各タイルのスキップタイルフラグを受信する。参照タイル設定部203は、ステップS206にて、スキップタイルフラグが1であるか否かを判定する。スキップタイルフラグが1でなければ(NO)、参照タイル設定部203は、ステップS207にて、参照タイル数を受信する。
In step S205, the skip
参照タイル設定部203は、ステップS208にて、参照タイル数が0以外であるか否かを判定する。参照タイル数が0以外であれば(YES)、参照タイル設定部203は、ステップS209にて、参照タイル番号を受信する。その後、処理はステップS210に移行される。
In step S208, the reference
ステップS206にてスキップタイルフラグが1であれば(YES)、また、ステップS208にて参照タイル数が0以外でなければ(NO)(即ち、参照タイル数が0であれば)、処理はステップS210に移行される。 If the skip tile flag is 1 in step S206 (YES), and if the reference tile number is not 0 in step S208 (NO) (that is, if the reference tile number is 0), the process proceeds to step S206. Moved to S210.
タイル分割復号部201は、ステップS210にて、タイル番号がタイル数−1となったか否かを判定する。タイル番号がタイル数−1でなければ(NO)、まだタイルが残っているので、タイル分割復号部201は、ステップS211にて、タイル番号を1増加させ、処理をステップS203に戻す。
In step S210, the tile
タイル分割復号部201、スキップタイル設定部202、参照タイル設定部203は、次のタイル番号のタイルでもステップS203〜S210の処理を繰り返す。ステップS210にてタイル番号がタイル数−1であれば(YES)、全てのタイルの情報を受信したので、タイル分割復号部201、スキップタイル設定部202、参照タイル設定部203は処理を終了させる。
The tile
<画像復号プログラム>
図16に示す画像復号装置における動作をコンピュータプログラム(画像復号プログラム)によってコンピュータに実行させることができる。図17に示す各処理を画像復号プログラムによってコンピュータに実行させることができる。
<Image decoding program>
The operation of the image decoding apparatus shown in FIG. 16 can be executed by a computer using a computer program (image decoding program). Each process shown in FIG. 17 can be executed by a computer using an image decoding program.
図15Bに示すように、コンピュータは図15Aと同様の構成であり、図15Aと共通部分の説明を省略する。図15Bにおいて、記憶部302には、画像符号化プログラムに代えて画像復号プログラムが記憶されている。CPU301が画像復号プログラムを実行させることによって、コンピュータ300を、符号化されているビットストリームを復号する画像復号装置200として機能させることができる。
As shown in FIG. 15B, the computer has the same configuration as that in FIG. 15A, and the description of the common parts with FIG. In FIG. 15B, the
記憶部302に画像符号化プログラム及び画像復号プログラムを記憶させて、コンピュータ300を、画像符号化装置100及び画像復号装置200として機能させることも可能である。
It is also possible to store the image encoding program and the image decoding program in the
<第1の変形例>
以上説明した本実施形態の画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラムにおいて、次のような第1の変形例とすることができる。
<First Modification>
In the image encoding device, the image encoding method, and the image encoding program, and the image decoding device, the image decoding method, and the image decoding program of the present embodiment described above, the following first modified example is used. be able to.
図18に示すように、タイルを符号化して伝送する順番は、左上のタイルを最初としなくてもよい。図18において、画像符号化装置100はタイルTL0〜TL5の順で符号化して符号化データを含むビットストリームを伝送する。画像復号装置200は、タイルTL0〜TL5の順で復号する。ヘッドマウントディスプレイを装着するユーザが最初に視認する視野に対応するタイルを最初に符号化し復号するタイルTL0とする。
As shown in FIG. 18, the order of encoding and transmitting the tiles does not have to be the top left tile first. In FIG. 18, the
スキップタイルフラグを伝送しなくてもよい。この場合、上記の説明では、1つのフレーム内でタイルが設定されていない領域が存在しないように画像情報を符号化するとしたが、タイルが設定されていない領域が存在してもよい。図18において、ハッチングを付した非割り当て領域にタイルを設定しなくてもよい。 The skip tile flag need not be transmitted. In this case, in the above description, the image information is encoded so that there is no region in which no tile is set in one frame, but there may be a region in which no tile is set. In FIG. 18, it is not necessary to set a tile in a non-allocated area with hatching.
<第2の変形例>
図9(b)で説明したように、スライスはタイルのスーパーセットとすることができるとしたが、スライスがタイルのスーパーセットであることを禁じてもよい。スライスがタイルのスーパーセットであることを禁じないと、図19に示すように、互いに離れた位置にあるタイルTL0及びTL1のスーパーセットであるスライスSL0が設定されることがある。互いに離れた位置にある複数のタイルで、スライスヘッダに含まれるパラメータが共有されないよう、スライスがタイルのスーパーセットであることを禁じるのがよい。
<Second Modification>
As described with reference to FIG. 9B, the slice can be a superset of tiles, but the slice may be prohibited from being a superset of tiles. If the slice is not prohibited from being a superset of tiles, a slice SL0 that is a superset of tiles TL0 and TL1 that are located at a distance from each other may be set as shown in FIG. It is advisable to prohibit a slice from being a superset of tiles so that multiple tiles that are far from each other do not share the parameters contained in the slice header.
<第3の変形例>
上記の説明では、1つのフレーム内でタイルはオーバラップしないとしたが、タイルのオーバラップを許容してもよい。図20は、実線で示すタイルTL0と一点鎖線で示すタイルTL1とがオーバラップしている状態を示している。
<Third Modification>
In the above description, tiles do not overlap in one frame, but tile overlap may be allowed. FIG. 20 shows a state where the tile TL0 indicated by the solid line and the tile TL1 indicated by the alternate long and short dash line overlap.
ヘッドマウントディスプレイを装着しているユーザの視野が破線で示す領域AR0にあるとき、画像復号装置200は、タイルTL0のうちの領域AR0の部分の画像を復号してヘッドマウントディスプレイに表示する。ユーザの視野が領域AR0から破線で示す領域AR1に移動したとき、画像復号装置200は、タイルTL1の復号処理を開始するまでの間に、タイルTL0のタイルTL1とオーバラップしているオーバラップ領域の画像を復号して表示する。従って、ユーザの視野が移動したときの画像表示の遅延を低減させることができる。
When the field of view of the user wearing the head mounted display is in the area AR0 indicated by the broken line, the
上述した本実施形態においては、画像情報としてY,Cb,Cr映像信号を例としたが、色空間はY,Cb,Crに限定されず、Y,Co,Cg映像信号であってもよい。画像情報は、輝度成分と2つの色差信号よりなる色成分を含む任意の色空間の映像信号であればよい。 In the present embodiment described above, Y, Cb, and Cr video signals are taken as examples of image information. However, the color space is not limited to Y, Cb, and Cr, and may be Y, Co, and Cg video signals. The image information may be a video signal in an arbitrary color space including a luminance component and a color component composed of two color difference signals.
本発明は以上説明した本実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々変更可能である。画像符号化装置100及び画像復号装置200は、集積回路等のハードウェアで構成されてもよく、ソフトウェアで構成されてもよく、両者が混在してもよい。画像符号化方法及び画像復号方法は、集積回路またはコンピュータ等の任意のハードウェア資源が実行すればよい。
The present invention is not limited to the embodiment described above, and various modifications can be made without departing from the scope of the present invention. The
100 画像符号化装置
101 タイル分割設定部
102,202 スキップタイル設定部
103,203 参照タイル設定部
104 ピクチャ分割部
200 画像復号装置
201 タイル分割復号部
204 ピクチャ合成部
300 コンピュータ
302 記憶部
DESCRIPTION OF
Claims (10)
前記第1のタイルの画像を符号化して符号化データを生成する符号化データ生成部と、
前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義した第1のシンタックス要素を含むシンタックスを生成するシンタックス生成部と、
前記符号化データと前記シンタックスとを含むビットストリームを生成するビットストリーム生成部と、
を備えることを特徴とする画像符号化装置。 Image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated is input, and each frame of the image information is set to one or more set in the allocation area A picture dividing unit for dividing the first tile into one or a plurality of second tiles set in the non-allocation area;
An encoded data generation unit that encodes the image of the first tile to generate encoded data;
Syntax generation for generating a syntax including a first syntax element for each of the first and second tiles defined by the horizontal position and vertical position of the upper left corner in the frame, and the horizontal size and vertical size. And
A bit stream generation unit that generates a bit stream including the encoded data and the syntax;
An image encoding device comprising:
前記シンタックス生成部は、前記第2のタイルの画像を符号化しないことを示すスキップタイルフラグである第2のシンタックス要素を含むシンタックスを生成する
ことを特徴とする請求項1に記載の画像符号化装置。 The encoded data generation unit does not encode the image of the second tile,
The syntax generation unit generates a syntax including a second syntax element that is a skip tile flag indicating that the image of the second tile is not encoded. Image encoding device.
前記符号化データ生成部は、前記複数の第1のタイルそれぞれを符号化するときに、前記複数の第1のタイルのうちの少なくとも1つの他のタイルを参照するか否かの設定情報に基づいて、前記複数の第1のタイルそれぞれを符号化して符号化データを生成し、
前記シンタックス生成部は、前記符号化データ生成部が他のタイルを参照せず前記第1のタイルを符号化したときには他のタイルを参照しないことを示し、他のタイルを参照して前記第1のタイルを符号化したときには参照するタイルを示す第3のシンタックス要素を含むシンタックスを生成する
ことを特徴とする請求項2に記載の画像符号化装置。 The picture dividing unit divides the allocation area into a plurality of first tiles,
The encoded data generation unit is based on setting information on whether or not to refer to at least one other tile of the plurality of first tiles when encoding each of the plurality of first tiles. And encoding each of the plurality of first tiles to generate encoded data,
The syntax generation unit indicates that when the encoded data generation unit encodes the first tile without referring to other tiles, the syntax generation unit does not refer to other tiles, and refers to the other tiles. The image encoding apparatus according to claim 2, wherein when one tile is encoded, a syntax including a third syntax element indicating a tile to be referred to is generated.
前記第1のタイルの画像を符号化して符号化データを生成し、
前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスを生成し、
前記符号化データと前記シンタックスとを含むビットストリームを生成する
ことを特徴とする画像符号化方法。 Each frame of image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated, and one or more first tiles set in the allocation area; Dividing into one or a plurality of second tiles set in the non-allocation area,
Encoding the image of the first tile to generate encoded data;
Each of the first and second tiles generates a syntax including syntax elements defined by a horizontal position and a vertical position of the upper left corner in the frame, and a horizontal size and a vertical size,
An image encoding method, comprising: generating a bitstream including the encoded data and the syntax.
フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報の各フレームを、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割するステップと、
前記第1のタイルの画像を符号化して符号化データを生成するステップと、
前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスを生成するステップと、
前記符号化データと前記シンタックスとを含むビットストリームを生成するステップと、
を実行させることを特徴とする画像符号化プログラム。 On the computer,
Each frame of image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated, and one or more first tiles set in the allocation area; Dividing into one or more second tiles set in the unallocated area;
Encoding the image of the first tile to generate encoded data;
Each of the first and second tiles generating a syntax including syntax elements defined by a horizontal position and a vertical position of the upper left corner in the frame and a horizontal size and a vertical size;
Generating a bitstream including the encoded data and the syntax;
An image encoding program characterized in that
前記符号化データを復号して前記第1のタイルの復号画像を生成する復号部と、
前記第1のシンタックス要素に基づいて、前記第1のタイルの復号画像と前記第2のタイルの単一画像とを合成して各フレームの復号画像情報を生成するピクチャ合成部と、
を備えることを特徴とする画像復号装置。 It is image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated, and each frame of the image information includes one or a plurality of frames set in the allocation area Divided into a first tile and one or a plurality of second tiles set in the non-allocation area, encoded data obtained by encoding an image of the first tile, and the first and second A bit stream receiving unit that receives a bit stream including a syntax including a first syntax element defined by a horizontal position and a vertical position of the upper left corner in the frame and a horizontal size and a vertical size of each tile of When,
A decoding unit that decodes the encoded data to generate a decoded image of the first tile;
A picture synthesis unit that synthesizes the decoded image of the first tile and the single image of the second tile based on the first syntax element to generate decoded image information of each frame;
An image decoding apparatus comprising:
前記ビットストリーム受信部は、前記第2のタイルが符号化されていないことを示すスキップタイルフラグである第2のシンタックス要素を含むシンタックスを受信し、
前記ピクチャ合成部は、前記第2のシンタックス要素に基づいて、前記第2のタイルに前記単一画像を割り当てる
ことを特徴とする請求項6に記載の画像復号装置。 The encoded data is encoded data in which the image of the second tile is not encoded,
The bitstream receiving unit receives a syntax including a second syntax element that is a skip tile flag indicating that the second tile is not encoded;
The image decoding apparatus according to claim 6, wherein the picture composition unit assigns the single image to the second tile based on the second syntax element.
前記ビットストリーム受信部は、前記複数の第1のタイルそれぞれが、前記複数の第1のタイルのうちの少なくとも1つの他のタイルを参照して符号化されているか否かを示し、他のタイルを参照して符号化されているときには参照したタイルを示す第3のシンタックス要素を含むシンタックスを受信し、
前記復号部は、前記第3のシンタックス要素に基づいて、前記複数の第1のタイルそれぞれを、他のタイルを参照して符号化されていないときには他のタイルを参照することなく復号し、他のタイルを参照して符号化されているときには他のタイルを参照して復号する
ことを特徴とする請求項7に記載の画像復号装置。 The allocation area of the image information is divided into a plurality of first tiles;
The bitstream reception unit indicates whether each of the plurality of first tiles is encoded with reference to at least one other tile of the plurality of first tiles, Receiving a syntax including a third syntax element indicating the referenced tile when encoded with reference to
The decoding unit decodes each of the plurality of first tiles based on the third syntax element without referring to the other tiles when not encoded with reference to the other tiles, The image decoding apparatus according to claim 7, wherein when decoding is performed with reference to another tile, the decoding is performed with reference to the other tile.
前記符号化データを復号して前記第1のタイルの復号画像を生成し、
前記シンタックス要素に基づいて、前記第1のタイルの復号画像と前記第2のタイルの単一画像とを合成して各フレームの復号画像情報を生成する
ことを特徴とする画像復号方法。 It is image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated, and each frame of the image information includes one or a plurality of frames set in the allocation area Divided into a first tile and one or a plurality of second tiles set in the non-allocation area, encoded data obtained by encoding an image of the first tile, and the first and second Each of the tiles receives a bitstream including a syntax including a syntax element defined by a horizontal position and a vertical position of the upper left corner in the frame and a horizontal size and a vertical size;
Decoding the encoded data to generate a decoded image of the first tile;
Based on the syntax element, the decoded image information of each frame is generated by synthesizing the decoded image of the first tile and the single image of the second tile.
フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報であり、前記画像情報の各フレームが、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割され、前記第1のタイルの画像が符号化された符号化データと、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスとを含むビットストリームを受信するステップと、
前記符号化データを復号して前記第1のタイルの復号画像を生成するステップと、
前記シンタックス要素に基づいて、前記第1のタイルの復号画像と前記第2のタイルの単一画像とを合成して各フレームの復号画像情報を生成するステップと、
を実行させることを特徴とする画像復号プログラム。 On the computer,
It is image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated, and each frame of the image information includes one or a plurality of frames set in the allocation area Divided into a first tile and one or a plurality of second tiles set in the non-allocation area, encoded data obtained by encoding an image of the first tile, and the first and second Receiving a bitstream that includes a syntax including a syntax element defined by a horizontal position and a vertical position of the upper left corner and a horizontal size and a vertical size of each of the tiles in the frame;
Decoding the encoded data to generate a decoded image of the first tile;
Combining the decoded image of the first tile and the single image of the second tile based on the syntax element to generate decoded image information of each frame;
An image decoding program characterized in that
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016188129A JP2018056686A (en) | 2016-09-27 | 2016-09-27 | Image encoder, image encoding method and image encoding program, and image decoder, image decoding method and image decoding program |
PCT/JP2017/031140 WO2018061589A1 (en) | 2016-09-27 | 2017-08-30 | Image encoding device, image encoding method, image encoding program, image decoding device, image decoding method, and image decoding program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016188129A JP2018056686A (en) | 2016-09-27 | 2016-09-27 | Image encoder, image encoding method and image encoding program, and image decoder, image decoding method and image decoding program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018056686A true JP2018056686A (en) | 2018-04-05 |
Family
ID=61759560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016188129A Pending JP2018056686A (en) | 2016-09-27 | 2016-09-27 | Image encoder, image encoding method and image encoding program, and image decoder, image decoding method and image decoding program |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2018056686A (en) |
WO (1) | WO2018061589A1 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019103126A1 (en) * | 2017-11-22 | 2019-05-31 | Sharp Kabushiki Kaisha | Systems and methods for signaling tile structures for pictures of coded video |
WO2020141904A1 (en) * | 2019-01-02 | 2020-07-09 | 주식회사 엑스리스 | Image signal encoding/decoding method and device for same |
JP2022523440A (en) * | 2019-03-08 | 2022-04-22 | 中▲興▼通▲訊▼股▲ふぇん▼有限公司 | Null tile coding in video coding |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112014009569B1 (en) * | 2011-10-31 | 2022-07-05 | Mitsubishi Electric Corporation | DEVICE AND VIDEO DECODING METHOD |
WO2015197815A1 (en) * | 2014-06-27 | 2015-12-30 | Koninklijke Kpn N.V. | Determining a region of interest on the basis of a hevc-tiled video stream |
-
2016
- 2016-09-27 JP JP2016188129A patent/JP2018056686A/en active Pending
-
2017
- 2017-08-30 WO PCT/JP2017/031140 patent/WO2018061589A1/en active Application Filing
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019103126A1 (en) * | 2017-11-22 | 2019-05-31 | Sharp Kabushiki Kaisha | Systems and methods for signaling tile structures for pictures of coded video |
WO2020141904A1 (en) * | 2019-01-02 | 2020-07-09 | 주식회사 엑스리스 | Image signal encoding/decoding method and device for same |
US11012691B2 (en) | 2019-01-02 | 2021-05-18 | Xris Corporation | Image signal encoding/decoding method and device for same |
US11601646B2 (en) | 2019-01-02 | 2023-03-07 | Apple Inc. | Image signal encoding/decoding method and device for same |
JP2022523440A (en) * | 2019-03-08 | 2022-04-22 | 中▲興▼通▲訊▼股▲ふぇん▼有限公司 | Null tile coding in video coding |
JP7416820B2 (en) | 2019-03-08 | 2024-01-17 | 中興通訊股▲ふん▼有限公司 | Null tile coding in video coding |
Also Published As
Publication number | Publication date |
---|---|
WO2018061589A1 (en) | 2018-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7343573B2 (en) | Apparatus and method for dequantization | |
CN114173115B (en) | Encoder, decoder and corresponding methods for intra prediction | |
CN113748677A (en) | Encoder, decoder and corresponding intra prediction method | |
JP7366149B2 (en) | An encoder, decoder, and corresponding method for harmonizing matrix-based intra-prediction and quadratic transform core selection | |
CN116208767B (en) | Method and device for decoding code stream and equipment for storing code stream | |
CN113170202B (en) | Encoder, decoder and corresponding methods for constructing MPM list of block applying multi-hypothesis prediction | |
CN113785573A (en) | Encoder, decoder and corresponding methods using an adaptive loop filter | |
JP2023153802A (en) | Deblocking filter for sub-partition boundary caused by intra sub-partition coding tool | |
CN114125468A (en) | Intra-frame prediction method and device | |
KR20210088688A (en) | Encoders, decoders and corresponding methods using the IBC merge list | |
KR20210126771A (en) | Encoders, decoders and corresponding methods related to intra prediction mode | |
CN116828176A (en) | Decoding device, encoding device, and transmitting device | |
KR20220143943A (en) | Encoder, decoder, and corresponding method simplifying signaling of slice header syntax element | |
WO2018061589A1 (en) | Image encoding device, image encoding method, image encoding program, image decoding device, image decoding method, and image decoding program | |
CN113411613A (en) | Encoder, decoder and corresponding methods for enabling high level flags using DCT2 | |
CN113647103A (en) | Method and apparatus for quantizing coefficients for matrix-based intra prediction techniques | |
CN113170118A (en) | Method and apparatus for chroma intra prediction in video coding | |
CN114450958B (en) | Affine motion model limiting for reducing memory bandwidth of enhanced interpolation filters | |
CN113574870B (en) | Encoder, decoder and method for implementing predictive coding on current block | |
CN113727120B (en) | Decoding method, device, encoder and decoder | |
CN113228632B (en) | Encoder, decoder, and corresponding methods for local illumination compensation | |
KR20220140858A (en) | Decoder and corresponding method for signaling picture partitioning information for a slice | |
KR20220109464A (en) | Encoders, decoders and corresponding methods of flexible profile configuration | |
KR20220065880A (en) | Use of DCT-based interpolation filters and enhanced bilinear interpolation filters in affine motion compensation | |
CN113692740A (en) | Method and apparatus for division-free intra prediction |