JP2018056686A - Image encoder, image encoding method and image encoding program, and image decoder, image decoding method and image decoding program - Google Patents

Image encoder, image encoding method and image encoding program, and image decoder, image decoding method and image decoding program Download PDF

Info

Publication number
JP2018056686A
JP2018056686A JP2016188129A JP2016188129A JP2018056686A JP 2018056686 A JP2018056686 A JP 2018056686A JP 2016188129 A JP2016188129 A JP 2016188129A JP 2016188129 A JP2016188129 A JP 2016188129A JP 2018056686 A JP2018056686 A JP 2018056686A
Authority
JP
Japan
Prior art keywords
image
tile
tiles
frame
syntax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016188129A
Other languages
Japanese (ja)
Inventor
佐藤 数史
Kazufumi Sato
数史 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dwango Co Ltd
Original Assignee
Dwango Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dwango Co Ltd filed Critical Dwango Co Ltd
Priority to JP2016188129A priority Critical patent/JP2018056686A/en
Priority to PCT/JP2017/031140 priority patent/WO2018061589A1/en
Publication of JP2018056686A publication Critical patent/JP2018056686A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

PROBLEM TO BE SOLVED: To provide an image encoder which enables the increase in encoding efficiency when an image produced by projecting a 360-degree whole sky image onto a hexahedron is encoded in such a way that the image is allocated to regions in a frame, except some regions.SOLUTION: In an image encoder, a picture division part 104 divides each frame of image information into one or more of first tiles set on an allocation region to which an image is allocated, and one or more of second tiles set on a non-allocation region; a coded data generation part encodes an image of the one or more of first tiles to generate coded data; a syntax generation part (entropy encoding part 5) generates syntax including syntax elements which define each of first and second tiles in frame by horizontal and vertical positions of an upper left corner portion, and horizontal and vertical sizes; and a bit stream generation part (entropy encoding part 5) generates bet streams including coded data and the syntax.SELECTED DRAWING: Figure 6

Description

本開示は、画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラムに関する。   The present disclosure relates to an image encoding device, an image encoding method, an image encoding program, an image decoding device, an image decoding method, and an image decoding program.

H.264/MPEG-4 AVC (Advanced Video Coding)よりもさらに画像情報を高効率に符号化することができる圧縮符号化方式H.265/MPEG-H HEVC(High Efficiency Video Coding)(以下、HEVCと略記する)が標準化されている(非特許文献1参照)。HEVCにおいては、フレーム(ピクチャ)を構成する画素を符号化ツリーユニット(CTU:Coding Tree Unit)と称されるブロックを分割単位として分割するタイルが規定されている。   H.265 / MPEG-H HEVC (High Efficiency Video Coding) (hereinafter referred to as HEVC), which can encode image information more efficiently than H.264 / MPEG-4 AVC (Advanced Video Coding). Are abbreviated to be standardized) (see Non-Patent Document 1). In HEVC, tiles are defined that divide pixels constituting a frame (picture) into blocks called coding tree units (CTUs) as division units.

非特許文献2には、図1に示すように、ヘッドマウントディスプレイによって視認する360度の全天画像401を六面体402の面402A〜402Fに投影し、面402A〜402Fに投影した画像を、図2に示すように、フレーム内の6つの領域に展開することが記載されている。図2において、ハッチングを付していない領域は画像が割り当てられている割り当て領域であり、ハッチングを付した領域は、画像が割り当てられていない非割り当て領域である。   In Non-Patent Document 2, as shown in FIG. 1, 360-degree all-sky image 401 visually recognized by a head-mounted display is projected onto surfaces 402A to 402F of hexahedron 402, and images projected onto surfaces 402A to 402F are illustrated in FIG. As shown in FIG. 2, it is described that the image is expanded into six regions in the frame. In FIG. 2, an area that is not hatched is an allocated area to which an image is assigned, and an area that is hatched is an unassigned area to which no image is assigned.

ヘッドマウントディスプレイを装着したユーザは、図2に示す画像をヘッドマウントディスプレイで視認することによって、目の前に球状に広がる仮想現実画像(VR画像)のコンテンツを鑑賞することができる。   A user wearing a head-mounted display can view the contents of a virtual reality image (VR image) spreading in a spherical shape in front of the eyes by viewing the image shown in FIG. 2 with the head-mounted display.

” High Efficiency Video Coding (HEVC) text specification draft 10 (for FDIS & Last Call)”, JCTVC-L1003, January 2013”High Efficiency Video Coding (HEVC) text specification draft 10 (for FDIS & Last Call)”, JCTVC-L1003, January 2013 ”GoPro test sequences for Virtual Reality video coding”, JVET-C0021, May 2016“GoPro test sequences for Virtual Reality video coding”, JVET-C0021, May 2016

ところが、HEVCのタイルでは、図2に示す画像を図3または図4に示すように分割して符号化することはできない。また、図2における非割り当て領域では、本来であれば符号化データを画像復号装置に送信して復号する必要がないが、HEVCではスキップモード、ダイレクトモード、イントラ予測におけるDC(直流)モード等を用いて符号化する必要がある。従って、画像符号化装置は非割り当て領域でも符号を伝送して、画像復号装置は伝送された符号を復号しなければならない。   However, in the HEVC tile, the image shown in FIG. 2 cannot be divided and encoded as shown in FIG. 3 or FIG. In the non-allocation area in FIG. 2, originally, it is unnecessary to transmit the encoded data to the image decoding apparatus and decode it. However, in HEVC, skip mode, direct mode, DC (direct current) mode in intra prediction, etc. Need to be encoded. Therefore, the image encoding device must transmit the code even in the non-allocation area, and the image decoding device must decode the transmitted code.

実施形態は、360度の全天画像を六面体に投影した画像をフレーム内の一部の領域を除いた領域に割り当てて符号化する際の符号化効率を向上させ、符号化または復号の処理量を低減させることができる画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラムを提供することを目的とする。   The embodiment improves the encoding efficiency when encoding an image obtained by projecting a 360-degree all-sky image onto a hexahedron to an area excluding a part of the area in the frame, and the amount of encoding or decoding processing It is an object to provide an image encoding device, an image encoding method, an image encoding program, an image decoding device, an image decoding method, and an image decoding program.

実施形態の第1の態様によれば、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報が入力され、前記画像情報の各フレームを、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割するピクチャ分割部と、前記第1のタイルの画像を符号化して符号化データを生成する符号化データ生成部と、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義した第1のシンタックス要素を含むシンタックスを生成するシンタックス生成部と、前記符号化データと前記シンタックスとを含むビットストリームを生成するビットストリーム生成部とを備えることを特徴とする画像符号化装置が提供される。   According to the first aspect of the embodiment, image information in a format including an allocated area in which an image is allocated in a frame and an unallocated area in which no image is allocated is input, and each frame of the image information is A picture dividing unit that divides into one or a plurality of first tiles set in the allocation area and one or a plurality of second tiles set in the non-allocation area, and an image of the first tile The encoded data generation unit that generates encoded data by encoding the image, and the first and second tiles are defined by the horizontal position and vertical position of the upper left corner in the frame, and the horizontal size and vertical size, respectively. Generating a syntax including the first syntax element, and generating a bitstream including the encoded data and the syntax The image coding apparatus is provided, characterized in that it comprises a appropriate bit stream generation unit.

実施形態の第2の態様によれば、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報の各フレームを、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割し、前記第1のタイルの画像を符号化して符号化データを生成し、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスを生成し、前記符号化データと前記シンタックスとを含むビットストリームを生成することを特徴とする画像符号化方法が提供される。   According to the second aspect of the embodiment, each frame of image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated is set as the allocation area. Dividing into one or a plurality of first tiles and one or a plurality of second tiles set in the non-allocation area, encoding an image of the first tiles to generate encoded data, Each of the first and second tiles generates a syntax including syntax elements defined by a horizontal position and a vertical position of the upper left corner in the frame, a horizontal size and a vertical size, and the encoded data; An image encoding method is provided that generates a bitstream including the syntax.

実施形態の第3の態様によれば、コンピュータに、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報の各フレームを、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割するステップと、前記第1のタイルの画像を符号化して符号化データを生成するステップと、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスを生成するステップと、前記符号化データと前記シンタックスとを含むビットストリームを生成するステップとを実行させることを特徴とする画像符号化プログラムが提供される。   According to the third aspect of the embodiment, each frame of image information in a format including an allocation area to which an image is allocated in a frame and a non-allocation area to which no image is allocated is assigned to the computer. Dividing into one or more first tiles set to 1 and a plurality of second tiles set to the non-allocation area, and encoding and encoding an image of the first tile Generating data, and generating a syntax including a syntax element for each of the first and second tiles defined by a horizontal position and a vertical position of the upper left corner in the frame, and a horizontal size and a vertical size. And generating a bitstream including the encoded data and the syntax. Image coding program is provided.

実施形態の第4の態様によれば、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報であり、前記画像情報の各フレームが、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割され、前記第1のタイルの画像が符号化された符号化データと、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義した第1のシンタックス要素を含むシンタックスとを含むビットストリームを受信するビットストリーム受信部と、前記符号化データを復号して前記第1のタイルの復号画像を生成する復号部と、前記第1のシンタックス要素に基づいて、前記第1のタイルの復号画像と前記第2のタイルの単一画像とを合成して各フレームの復号画像情報を生成するピクチャ合成部とを備えることを特徴とする画像復号装置が提供される。   According to the fourth aspect of the embodiment, it is image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated, and each frame of the image information includes: The image is divided into one or more first tiles set in the allocated area and one or more second tiles set in the non-allocated area, and the image of the first tile is encoded A syntax including encoded data and a first syntax element that defines each of the first and second tiles by a horizontal position and a vertical position of the upper left corner in the frame, and a horizontal size and a vertical size; A bitstream receiving unit that receives a bitstream including: a decoding unit that decodes the encoded data to generate a decoded image of the first tile; and the first An image comprising: a picture composition unit that composes a decoded image of the first tile and a single image of the second tile based on a syntax element to generate decoded image information of each frame. A decoding device is provided.

実施形態の第5の態様によれば、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報であり、前記画像情報の各フレームが、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割され、前記第1のタイルの画像が符号化された符号化データと、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスとを含むビットストリームを受信し、前記符号化データを復号して前記第1のタイルの復号画像を生成し、前記シンタックス要素に基づいて、前記第1のタイルの復号画像と前記第2のタイルの単一画像とを合成して各フレームの復号画像情報を生成することを特徴とする画像復号方法が提供される。   According to the fifth aspect of the embodiment, the image information has a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated, and each frame of the image information includes: The image is divided into one or more first tiles set in the allocated area and one or more second tiles set in the non-allocated area, and the image of the first tile is encoded A bit including encoded data and a syntax including a syntax element in which each of the first and second tiles is defined by the horizontal position and vertical position of the upper left corner in the frame and the horizontal size and vertical size. Receiving a stream, decoding the encoded data to generate a decoded image of the first tile, and decoding the first tile based on the syntax element. Image decoding method characterized by by combining the single image of the image and the second tile to generate a decoded image information of each frame is provided.

実施形態の第6の態様によれば、コンピュータに、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報であり、前記画像情報の各フレームが、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割され、前記第1のタイルの画像が符号化された符号化データと、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスとを含むビットストリームを受信するステップと、前記符号化データを復号して前記第1のタイルの復号画像を生成受信するステップと、前記シンタックス要素に基づいて、前記第1のタイルの復号画像と前記第2のタイルの単一画像とを合成して各フレームの復号画像情報を生成するステップとを実行させることを特徴とする画像復号プログラムが提供される。   According to the sixth aspect of the embodiment, the image information is in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated in the computer. A frame is divided into one or a plurality of first tiles set in the allocated area and one or a plurality of second tiles set in the non-allocated area, and an image of the first tile is encoded. Encoded syntax data, and a syntax including syntax elements defined by the horizontal position and vertical position of the upper left corner of the frame, and the horizontal size and vertical size, respectively, of the first and second tiles. Receiving a bitstream including: decoding the encoded data to generate and receive a decoded image of the first tile; and And a step of generating a decoded image information of each frame by combining the decoded image of the first tile and the single image of the second tile based on a block element. A program is provided.

実施形態の画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラムによれば、360度の全天画像を六面体に投影した画像をフレーム内の一部の領域を除いた領域に割り当てて符号化する際の符号化効率を向上させ、符号化または復号の処理量を低減させることができる。   According to the image encoding device, the image encoding method, and the image encoding program of the embodiment, and the image decoding device, the image decoding method, and the image decoding program, an image obtained by projecting a 360-degree all-sky image onto a hexahedron is obtained. It is possible to improve encoding efficiency when encoding is performed by allocating to a region excluding a part of the region in the frame, and the processing amount of encoding or decoding can be reduced.

図1は、360度の全天画像と、360度の全天画像が投影される六面体を示す斜視図である。FIG. 1 is a perspective view showing a 360 degree whole sky image and a hexahedron onto which the 360 degree whole sky image is projected. 図2は、360度の全天画像を六面体に投影した画像をフレーム内の6つの領域に展開した状態を示す図である。FIG. 2 is a diagram illustrating a state in which an image obtained by projecting a 360-degree all-sky image onto a hexahedron is developed into six regions in the frame. 図3は、HEVCのタイルによって分割して符号化することができない第1の例を示す図である。FIG. 3 is a diagram illustrating a first example that cannot be divided and encoded by HEVC tiles. 図4は、図3は、HEVCのタイルによって分割して符号化することができない第2の例を示す図である。FIG. 4 is a diagram illustrating a second example in which FIG. 3 cannot be divided and encoded by HEVC tiles. 図5は、画像符号化装置及び画像復号装置を含む画像符号化・復号システムの全体的な構成例を示すブロック図である。FIG. 5 is a block diagram illustrating an overall configuration example of an image encoding / decoding system including an image encoding device and an image decoding device. 図6は、一実施形態の画像符号化装置を示すブロック図である。FIG. 6 is a block diagram illustrating an image encoding device according to an embodiment. 図7は、複数のスライスに分割されたフレームの構成例を示す図である。FIG. 7 is a diagram illustrating a configuration example of a frame divided into a plurality of slices. 図8は、複数のタイルに分割されたフレームの構成例を示す図である。FIG. 8 is a diagram illustrating a configuration example of a frame divided into a plurality of tiles. 図9は、スライスとタイルとの関係の例を示す図である。FIG. 9 is a diagram illustrating an example of the relationship between slices and tiles. 図10は、各タイルの位置及び大きさを示す図である。FIG. 10 is a diagram showing the position and size of each tile. 図11は、各タイルの位置、大きさ、スキップライルフラグを表形式で示す図である。FIG. 11 is a diagram showing the position, size, and skipline flag of each tile in a table format. 図12は、あるタイルを符号化または復号する際に他のタイルを参照する一例を示す図である。FIG. 12 is a diagram illustrating an example in which another tile is referred to when a certain tile is encoded or decoded. 図13は、一実施形態の画像符号化装置が伝送するシンタックスの一例を示す図である。FIG. 13 is a diagram illustrating an example of syntax transmitted by the image encoding device according to the embodiment. 図14は、一実施形態の画像符号化装置の動作、一実施形態の画像符号化方法による処理、一実施形態の画像符号化プログラムで実行される処理を示すフローチャートである。FIG. 14 is a flowchart illustrating the operation of the image encoding device according to the embodiment, the processing by the image encoding method according to the embodiment, and the processing executed by the image encoding program according to the embodiment. 図15Aは、一実施形態の画像符号化プログラムを記憶する記憶部を備えるコンピュータの概略的な構成を示すブロック図である。FIG. 15A is a block diagram illustrating a schematic configuration of a computer including a storage unit that stores an image encoding program according to an embodiment. 図15Bは、一実施形態の画像復号プログラムを記憶する記憶部を備えるコンピュータの概略的な構成を示すブロック図である。FIG. 15B is a block diagram illustrating a schematic configuration of a computer including a storage unit that stores an image decoding program according to an embodiment. 図16は、一実施形態の画像復号装置を示すブロック図である。FIG. 16 is a block diagram illustrating an image decoding apparatus according to an embodiment. 図17は、一実施形態の画像復号装置の動作、一実施形態の画像復号方法による処理、一実施形態の画像復号プログラムで実行される処理を示すフローチャートである。FIG. 17 is a flowchart illustrating the operation of the image decoding apparatus according to the embodiment, the processing by the image decoding method according to the embodiment, and the processing executed by the image decoding program according to the embodiment. 図18は、第1の変形例を説明するための図である。FIG. 18 is a diagram for explaining the first modification. 図19は、第2の変形例を説明するための図である。FIG. 19 is a diagram for explaining the second modification. 図20は、第3の変形例を説明するための図である。FIG. 20 is a diagram for explaining a third modification.

以下、一実施形態の画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラムについて、添付図面を参照して説明する。   Hereinafter, an image encoding device, an image encoding method, an image encoding program, an image decoding device, an image decoding method, and an image decoding program according to an embodiment will be described with reference to the accompanying drawings.

まず、図5を用いて、画像符号化装置及び画像復号装置を含む画像符号化・復号システムの全体的な構成例について説明する。図5において、前処理装置50は、ユーザによる操作に従って、一実施形態の画像符号化装置100による画像情報の符号化のための各種の条件を設定する。画像符号化装置100は、前処理装置50からの設定情報に応じて、画像情報を符号化してビットストリームを出力する。ビットストリームは、符号化された画像情報及びシンタックスを含む。   First, an overall configuration example of an image encoding / decoding system including an image encoding device and an image decoding device will be described with reference to FIG. In FIG. 5, the preprocessing device 50 sets various conditions for encoding image information by the image encoding device 100 according to the embodiment in accordance with an operation by the user. The image encoding device 100 encodes the image information according to the setting information from the preprocessing device 50 and outputs a bit stream. The bit stream includes encoded image information and syntax.

送信装置110は、ビットストリームを所定の伝送路120に送信する。伝送路120は有線または無線であり、インターネットのような通信回線、電話回線、テレビジョン信号を送信する地上波放送または衛星放送用の電波のいずれでもよい。受信装置150は、伝送路120によって送信されたビットストリームを受信する。一実施形態の画像復号装置200は、ビットストリームを復号して復号画像情報を出力する。   The transmission device 110 transmits a bit stream to a predetermined transmission path 120. The transmission path 120 is wired or wireless, and may be a communication line such as the Internet, a telephone line, or a radio wave for terrestrial broadcasting or satellite broadcasting that transmits a television signal. The receiving device 150 receives the bit stream transmitted through the transmission path 120. The image decoding apparatus 200 according to an embodiment decodes a bit stream and outputs decoded image information.

<画像符号化装置>
図6は、画像符号化装置100の具体的な構成例を示す。図6において、画像符号化装置100に入力される画像情報は、図2に示すような、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報である。
<Image encoding device>
FIG. 6 shows a specific configuration example of the image encoding device 100. In FIG. 6, the image information input to the image coding apparatus 100 is in a format including an allocation area where an image is allocated in a frame and a non-allocation area where no image is allocated, as shown in FIG. Image information.

並べ替え(Re-order)バッファ1には、デジタル信号の画像情報の画素が順に入力される。画像情報がアナログ信号であれば、並べ替えバッファ1の前段でA/D変換器によってデジタル信号に変換されていればよい。画像情報は例えば輝度信号Y(以下、Y信号)と色差信号Cb及びCr(以下、Cb及びCr信号)であり、4:2:0フォーマットのY,Cb,Cr映像信号を例とする。   Pixels of image information of digital signals are sequentially input to the reorder buffer 1. If the image information is an analog signal, it may be converted into a digital signal by the A / D converter in the previous stage of the rearrangement buffer 1. The image information is, for example, a luminance signal Y (hereinafter referred to as a Y signal) and color difference signals Cb and Cr (hereinafter referred to as a Cb and Cr signal).

並べ替えバッファ1は入力された画素を複数フレーム分蓄積し、必要に応じてフレーム(ピクチャ)を並べ替えて読み出す。画像情報の各フレームは、フレーム内の画素を用いて符号化するIピクチャ、過去のフレーム内の画素を用いて予測符号化するPピクチャ、過去及び未来のフレーム内の画素を用いて予測符号化するBピクチャのいずれかに設定される。Iピクチャ、Pピクチャ、Bピクチャは前処理装置50によって設定されてもよいし、画像符号化装置100が予め定めた規則に従って選択してもよい。   The rearrangement buffer 1 accumulates input pixels for a plurality of frames, and rearranges and reads frames (pictures) as necessary. Each frame of image information is encoded using an I picture that is encoded using pixels in the frame, a P picture that is encoded predictively using pixels in a past frame, and a predictive encoding using pixels in past and future frames Is set to one of the B pictures. The I picture, P picture, and B picture may be set by the preprocessing device 50, or may be selected by the image encoding device 100 according to a predetermined rule.

並べ替えバッファ1は、後述するビットストリームを構成するシーケンスの構成単位となる複数のピクチャ群(GOP)にBピクチャが含まれる場合には、符号化のためにフレームの順を並び替えて読み出す。並べ替えバッファ1より読み出された各フレームの画素は、ピクチャ分割部104を介して減算器2に供給される。   The rearrangement buffer 1 rearranges the order of frames for encoding when a plurality of picture groups (GOPs), which are constituent units of a sequence constituting a bit stream to be described later, are included. The pixels of each frame read from the rearrangement buffer 1 are supplied to the subtracter 2 via the picture dividing unit 104.

タイル分割設定部101、スキップタイル設定部102、参照タイル設定部103、ピクチャ分割部104の動作を説明する前に、減算器2以降の動作を説明する。   Before describing the operations of the tile division setting unit 101, the skip tile setting unit 102, the reference tile setting unit 103, and the picture division unit 104, operations after the subtractor 2 will be described.

減算器2に入力される各フレームは、例えば水平64画素、垂直64画素のCTUに分割され、各CTUは、再帰的な四分木ブロック分割に基づいて可変サイズの符号化ユニット(CU:Coding Unit)に分割されることがある。最大サイズのCUは最大符号化ユニット(LCU:Largest Coding Unit)と称され、最小サイズのCUは最小符号化ユニット(SCU:Smallest Coding Unit)と称される。   Each frame input to the subtracter 2 is divided into, for example, horizontal 64 pixel and vertical 64 pixel CTUs. Each CTU is divided into a variable size coding unit (CU: Coding) based on recursive quadtree block division. Unit). The maximum size CU is referred to as a maximum coding unit (LCU), and the minimum size CU is referred to as a minimum coding unit (SCU).

CUは、イントラ予測部14及びインター予測部15における予測処理のために予測ユニット(PU:Prediction Unit)に分割される。また、CUは、直交変換部3における直交変換処理及び量子化部4における量子化処理のために、再帰的な四分木ブロック分割に基づいて可変サイズの変換ユニット(TU:Transform Unit)に分割される。   The CU is divided into prediction units (PUs) for prediction processing in the intra prediction unit 14 and the inter prediction unit 15. Further, the CU is divided into variable-size transform units (TUs) based on recursive quadtree block division for orthogonal transformation processing in the orthogonal transformation unit 3 and quantization processing in the quantization unit 4. Is done.

以上の可変サイズのCU、PU、TUは、後述するコスト関数値が最小となるように選択される。画像情報の絵柄に応じてコスト関数値が最小となるCU、PU、TUは異なるから、各フレームの画素はサイズが異なるCU、PU、TUが混在した状態で分割される。   The variable size CU, PU, and TU described above are selected so that the cost function value described later is minimized. Since the CU, PU, and TU that minimize the cost function value are different according to the pattern of the image information, the pixels of each frame are divided in a state where CU, PU, and TU having different sizes are mixed.

減算器2は、ピクチャ分割部104より出力された原画像である画像情報のCUより、後述するイントラ予測部14またはインター予測部15によって生成された予測値(予測画像)を減算して、予測残差を生成する。減算器2は、予測残差を直交変換部3に供給する。   The subtracter 2 subtracts a prediction value (predicted image) generated by the intra prediction unit 14 or the inter prediction unit 15 (to be described later) from the CU of the image information that is the original image output from the picture dividing unit 104 to perform prediction. Generate a residual. The subtracter 2 supplies the prediction residual to the orthogonal transformation unit 3.

直交変換部3は、予測残差をTU単位で直交変換して、予測残差を周波数領域の信号に変換する。直交変換部3は、直交変換として、イントラ予測が選択されてTUが水平4画素、垂直4画素の場合のみ離散サイン変換(DST)を用い、他の場合は離散コサイン変換(DCT)を用いて、予測残差を直交変換する。直交変換部3は、直交変換係数を量子化部4に供給する。   The orthogonal transform unit 3 performs orthogonal transform on the prediction residual in units of TUs to convert the prediction residual into a frequency domain signal. The orthogonal transform unit 3 uses the discrete sine transform (DST) only when the intra prediction is selected and the TU is 4 pixels horizontal and 4 pixels vertical, and the discrete cosine transform (DCT) is used in other cases. The orthogonal transformation is performed on the prediction residual. The orthogonal transform unit 3 supplies the orthogonal transform coefficient to the quantization unit 4.

量子化部4は、直交変換係数を量子化してエントロピー符号化部5及び逆量子化部8に供給する。エントロピー符号化部5は、量子化された直交変換係数に対して発生確率に基づいて異なる長さの符号を割り当てて、直交変換係数をエントロピー符号化する。   The quantization unit 4 quantizes the orthogonal transform coefficient and supplies it to the entropy coding unit 5 and the inverse quantization unit 8. The entropy encoding unit 5 assigns codes having different lengths to the quantized orthogonal transform coefficients based on the occurrence probabilities, and entropy codes the orthogonal transform coefficients.

エントロピー符号化部5は、画像情報を符号化する際のシンタックスもエントロピー符号化する。シンタックスは、イントラ予測部14またはインター予測部15で選択された予測モード、動きベクトル、参照画素を特定するための情報等の各種のシンタックス要素を含む。また、シンタックスは、タイル分割設定部101、スキップタイル設定部102、参照タイル設定部103での設定情報を示すシンタックス要素も含む。   The entropy encoding unit 5 also entropy encodes the syntax for encoding image information. The syntax includes various syntax elements such as information for specifying a prediction mode, a motion vector, and a reference pixel selected by the intra prediction unit 14 or the inter prediction unit 15. The syntax also includes syntax elements indicating setting information in the tile division setting unit 101, the skip tile setting unit 102, and the reference tile setting unit 103.

エントロピー符号化部5は、一例として、コンテクスト適応算術符号(CABAC: Context-based Adaptive Binary Arithmetic Coding)を用いて直交変換係数及びシンタックスをエントロピー符号化することができる。   As an example, the entropy encoding unit 5 can entropy encode orthogonal transform coefficients and syntax using context adaptive arithmetic code (CABAC: Context-based Adaptive Binary Arithmetic Coding).

レート制御部7は、エントロピー符号化部5より出力される符号化データがオーバーフローまたはアンダーフローしないよう、量子化部4における量子化動作のレートを制御する。   The rate control unit 7 controls the rate of the quantization operation in the quantization unit 4 so that the encoded data output from the entropy encoding unit 5 does not overflow or underflow.

HRD(Hypothetical Reference Decoder)バッファ6はエントロピー符号化部5より出力される符号化データよりなるビットストリームを一時的に蓄積して出力する。   An HRD (Hypothetical Reference Decoder) buffer 6 temporarily accumulates and outputs a bit stream composed of encoded data output from the entropy encoding unit 5.

逆量子化部8は、量子化された直交変換係数をTU単位で逆量子化して、逆直交変換部9に供給する。逆量子化部8における逆量子化の動作は、量子化部4における量子化の動作とは逆の動作である。   The inverse quantization unit 8 inversely quantizes the quantized orthogonal transform coefficient in units of TU and supplies the quantized orthogonal transform coefficient to the inverse orthogonal transform unit 9. The inverse quantization operation in the inverse quantization unit 8 is an operation opposite to the quantization operation in the quantization unit 4.

逆直交変換部9は、入力された直交変換係数をTU単位で逆直交変換して、予測残差を加算器10に供給する。加算器10は、入力された予測残差と、予測値選択部16により選択されたイントラ予測部14またはインター予測部15によって生成された予測値とを加算して、復号信号を生成する。復号信号はループフィルタ11及びフレームメモリ12に供給される。   The inverse orthogonal transform unit 9 performs inverse orthogonal transform on the input orthogonal transform coefficient in units of TU, and supplies the prediction residual to the adder 10. The adder 10 adds the input prediction residual and the prediction value generated by the intra prediction unit 14 or the inter prediction unit 15 selected by the prediction value selection unit 16 to generate a decoded signal. The decoded signal is supplied to the loop filter 11 and the frame memory 12.

ループフィルタ11は、復号信号の符号化ノイズを低減させる。ループフィルタ11は、ブロックの境界に生じる歪を低減させるデブロッキング・フィルタと、リンギング歪を低減させる画素適応オフセットとを含む。ループフィルタ11によってフィルタ処理された復号信号はフレームメモリ12に供給される。   The loop filter 11 reduces coding noise of the decoded signal. The loop filter 11 includes a deblocking filter that reduces distortion generated at a block boundary and a pixel adaptive offset that reduces ringing distortion. The decoded signal filtered by the loop filter 11 is supplied to the frame memory 12.

フレームメモリ12は、加算器10より出力されたループフィルタ11によるフィルタ処理を施していない復号信号と、ループフィルタ11によるフィルタ処理が施された復号信号とを蓄積する。スイッチ13は、フレームメモリ12に蓄積されたフィルタ処理を施していない復号信号をイントラ予測部14に供給し、フレームメモリ12に蓄積されたフィルタ処理が施された復号信号をインター予測部15に供給する。   The frame memory 12 stores the decoded signal output from the adder 10 that has not been subjected to the filter processing by the loop filter 11 and the decoded signal that has been subjected to the filter processing by the loop filter 11. The switch 13 supplies the decoded signal stored in the frame memory 12 that has not been subjected to the filter processing to the intra prediction unit 14 and supplies the decoded signal stored in the frame memory 12 to which the filter processing has been performed to the inter prediction unit 15. To do.

イントラ予測部14は、Y信号、Cb及びCr信号のそれぞれで、TU単位で、複数の予測モードで予測値を生成する。但し、予測モードはPU単位で選択される。イントラ予測部14は、コスト関数値を算出して、コスト関数値が最小となるCU、PU、TUのサイズを選択し、かつ、コスト関数値が最小となる予測モードの予測値を選択する。   The intra prediction unit 14 generates predicted values in a plurality of prediction modes in units of TUs for each of the Y signal, the Cb signal, and the Cr signal. However, the prediction mode is selected in units of PUs. The intra prediction unit 14 calculates the cost function value, selects the size of the CU, PU, and TU that minimizes the cost function value, and selects the prediction value of the prediction mode that minimizes the cost function value.

インター予測部15は、画像の動きを検出し、CUのサイズを上限として、最小で水平8画素、垂直4画素または水平4画素、垂直8画素のPUから最大で水平64画素、垂直64画素のPUで、フレーム間動き補償予測を行って予測値を生成する。インター予測部15は、過去のフレームもしくは未来のフレーム、または、過去及び未来のフレームを参照して予測値(予測画像)を生成する。過去及び未来のフレームはそれぞれ複数のフレームであってもよい。   The inter prediction unit 15 detects the motion of the image, and sets the maximum size of the CU to a maximum of 64 horizontal pixels and 64 vertical pixels from a PU of 8 horizontal pixels, 4 vertical pixels or 4 horizontal pixels, and 8 vertical pixels. A prediction value is generated by performing inter-frame motion compensation prediction in the PU. The inter prediction unit 15 generates a predicted value (predicted image) with reference to a past frame, a future frame, or a past and future frame. Each of the past and future frames may be a plurality of frames.

同様に、インター予測部15は、コスト関数値を算出して、コスト関数値が最小となるCU、PU、TUのサイズを選択し、かつ、コスト関数値が最小となる予測モードの予測値を選択する。   Similarly, the inter prediction unit 15 calculates the cost function value, selects the size of the CU, PU, and TU that minimizes the cost function value, and calculates the prediction value of the prediction mode that minimizes the cost function value. select.

予測値選択部16は、イントラ予測部14で選択された予測値とインター予測部15で選択された予測値とのうち、コスト関数値が小さい方を最終的な予測値として選択して減算器2及び加算器10に供給する。   The prediction value selection unit 16 selects a subtraction unit having a smaller cost function value as a final prediction value among the prediction value selected by the intra prediction unit 14 and the prediction value selected by the inter prediction unit 15. 2 and the adder 10.

なお、Iピクチャを符号化する際にはイントラ予測部14による予測値のみが用いられる。Pピクチャ及びBピクチャを符号化する際には、イントラ予測部14で選択された予測値とインター予測部15で選択された予測値とのうちの小さい方の予測値が選択される。   Note that only the prediction value by the intra prediction unit 14 is used when encoding an I picture. When the P picture and the B picture are encoded, the smaller one of the prediction value selected by the intra prediction unit 14 and the prediction value selected by the inter prediction unit 15 is selected.

減算器2からエントロピー符号化部5までの部分、及び、逆量子化部8から予測値選択部16までの部分は、画像情報を符号化して符号化データを生成する符号化データ生成部として機能する。   The part from the subtractor 2 to the entropy encoding unit 5 and the part from the inverse quantization unit 8 to the predicted value selection unit 16 function as an encoded data generation unit that encodes image information and generates encoded data. To do.

次に、タイル分割設定部101、スキップタイル設定部102、参照タイル設定部103、ピクチャ分割部104の動作を説明する。   Next, operations of the tile division setting unit 101, the skip tile setting unit 102, the reference tile setting unit 103, and the picture division unit 104 will be described.

画像情報は、タイル分割設定部101にも入力される。タイル分割設定部101は、各フレームを複数のタイルに分割するよう設定する。スキップタイル設定部102は、スキップするタイルを設定する。参照タイル設定部103は、参照するタイルを設定する。タイル分割設定部101〜参照タイル設定部103によって設定した各情報は、ピクチャ分割部104に供給される。   The image information is also input to the tile division setting unit 101. The tile division setting unit 101 sets each frame to be divided into a plurality of tiles. The skip tile setting unit 102 sets a tile to be skipped. The reference tile setting unit 103 sets a tile to be referred to. Each piece of information set by the tile division setting unit 101 to the reference tile setting unit 103 is supplied to the picture division unit 104.

タイル分割設定部101〜参照タイル設定部103は、予め設定されて条件でそれぞれの設定を実行してもよいし、前処理装置50からの指示に応じてそれぞれの設定を実行してもよい。   The tile division setting unit 101 to the reference tile setting unit 103 may perform each setting under a preset condition, or may perform each setting according to an instruction from the preprocessing device 50.

ピクチャ分割部104に供給される画像情報は、1または複数のスライスに分割される。図7に示すように、複数のCTUよりなるフレームは、少なくとも1つのスライスを含む。図7において、太実線はスライスの境界を示しており、フレームは例えば3つのスライスSL0〜SL2に分割される。フレームをどのように複数のスライスに分割するかは、前処理装置50によって設定される。スライスSL0〜SL2はそれぞれ連続する少なくとも1つのCTUを含む。   The image information supplied to the picture dividing unit 104 is divided into one or a plurality of slices. As shown in FIG. 7, a frame made up of a plurality of CTUs includes at least one slice. In FIG. 7, a thick solid line indicates a slice boundary, and the frame is divided into, for example, three slices SL0 to SL2. How the frame is divided into a plurality of slices is set by the preprocessing device 50. Each of the slices SL0 to SL2 includes at least one continuous CTU.

画像符号化装置100はスライス単位で画像情報を符号化し、画像復号装置200はスライス単位で画像情報を復号する。図7において、実線で示す矢印は符号化及び復号の順を示している。   The image encoding device 100 encodes image information in units of slices, and the image decoding device 200 decodes image information in units of slices. In FIG. 7, arrows indicated by solid lines indicate the order of encoding and decoding.

また、複数のCTUよりなるフレームは、図8に示すように、タイル分割設定部101による設定によって、複数のタイルで分割することができる。図8において、太実線はタイルの境界を示しており、フレームは6つのタイルTL0〜TL8に分割される。後述するようにスライスとタイルとの互いの関係に制約はあるものの、ここでは図7に示すスライスの分割とは無関係にタイルの分割を示している。   Also, a frame composed of a plurality of CTUs can be divided into a plurality of tiles by setting by the tile division setting unit 101 as shown in FIG. In FIG. 8, thick solid lines indicate tile boundaries, and the frame is divided into six tiles TL0 to TL8. As will be described later, although there is a restriction on the relationship between the slice and the tile, here, the division of the tile is shown regardless of the division of the slice shown in FIG.

画像符号化装置100はタイル単位で画像情報を符号化し、画像復号装置200はタイル単位で画像情報を復号する。図8において、実線で示す矢印は符号化及び復号の順を示している。タイルは、VR画像の符号化の他、並列処理またはROI(Region Of Interest)符号化のために用いることができる。   The image encoding device 100 encodes image information in tile units, and the image decoding device 200 decodes image information in tile units. In FIG. 8, arrows indicated by solid lines indicate the order of encoding and decoding. The tile can be used for parallel processing or ROI (Region Of Interest) coding in addition to coding of a VR image.

図9(a)は、タイルTL0の中にスライスSL0及びSL1が設定され、タイルTL1の中にスライスSL2及びSL3が設定されている状態を示している。タイルはスライスのスーパーセットとすることができる。図9(b)は、スライスSL0の中にタイルTL0及びTL1が設定されている状態を示している。スライスはタイルのスーパーセットとすることができる。図9(a)及び図9(b)に示すように、スライスとタイルとの互いの関係を設定することができる。   FIG. 9A shows a state in which slices SL0 and SL1 are set in the tile TL0, and slices SL2 and SL3 are set in the tile TL1. A tile can be a superset of slices. FIG. 9B shows a state where tiles TL0 and TL1 are set in the slice SL0. A slice can be a superset of tiles. As shown in FIGS. 9A and 9B, the relationship between slices and tiles can be set.

図9(c)におけるスライスSL0〜SL2とタイルTL0及びTL1とは、スライスとタイルとのうちの一方がスーパーセットで他方がサブセットの関係にないので、設定不可である。   The slices SL0 to SL2 and the tiles TL0 and TL1 in FIG. 9C cannot be set because one of the slices and tiles is not a superset and the other is not a subset.

図6において、タイル分割設定部101は、具体的に次のように各フレームに対してタイルの分割を設定する。タイル分割設定部101は、1つのフレームに含まれるタイルの個数を設定する。タイルの個数を4とし、図10に示すように4つのタイルを設定する場合を例とする。   In FIG. 6, the tile division setting unit 101 sets tile division for each frame specifically as follows. The tile division setting unit 101 sets the number of tiles included in one frame. Assume that the number of tiles is 4, and four tiles are set as shown in FIG.

図10において、タイル番号0〜3のタイルTL0〜TL3は、図11に示すように定義することができる。ハッチングを付したタイルTL1及びTL3は、図2における非割り当て領域に相当する。ハッチングを付していないタイルTL0及びTL2は、画像が割り当てられた割り当て領域である。   In FIG. 10, tiles TL0 to TL3 with tile numbers 0 to 3 can be defined as shown in FIG. The hatched tiles TL1 and TL3 correspond to the non-allocation areas in FIG. The tiles TL0 and TL2 that are not hatched are assigned areas to which images are assigned.

図11に示すように、タイル番号0のタイルTL0は、黒丸で示す左上角部の座標を水平位置X0、垂直位置Y0とし、水平サイズh0、垂直サイズv0と定義される。タイルTL0におけるスキップタイルフラグは0であり、スキップされないタイルであることを示す。   As shown in FIG. 11, the tile TL0 with tile number 0 is defined as a horizontal size h0 and a vertical size v0 with the coordinates of the upper left corner indicated by a black circle as the horizontal position X0 and the vertical position Y0. The skip tile flag in the tile TL0 is 0, indicating that the tile is not skipped.

タイル番号1のタイルTL1は、黒丸で示す左上角部の座標を水平位置X1、垂直位置Y1とし、水平サイズh1、垂直サイズv1と定義される。タイルTL1におけるスキップタイルフラグは1であり、スキップされるタイルであることを示す。   The tile TL1 with the tile number 1 is defined as a horizontal size h1 and a vertical size v1 with the coordinates of the upper left corner indicated by a black circle as the horizontal position X1 and the vertical position Y1. The skip tile flag in the tile TL1 is 1, indicating that the tile is skipped.

タイル番号2のタイルTL2は、黒丸で示す左上角部の座標を水平位置X2、垂直位置Y2とし、水平サイズh1、垂直サイズv2と定義される。タイルTL1におけるスキップタイルフラグは0である。タイル番号3のタイルTL3は、黒丸で示す左上角部の座標を水平位置X3、垂直位置Y3とし、水平サイズh1、垂直サイズv3と定義される。タイルTL3におけるスキップタイルフラグは1である。   The tile TL2 of tile number 2 is defined as a horizontal size h1 and a vertical size v2 with the coordinates of the upper left corner indicated by a black circle as the horizontal position X2 and the vertical position Y2. The skip tile flag in the tile TL1 is 0. The tile TL3 with the tile number 3 is defined as a horizontal size h1 and a vertical size v3 with the coordinates of the upper left corner indicated by a black circle as the horizontal position X3 and the vertical position Y3. The skip tile flag in the tile TL3 is 1.

タイルTL0〜TL3の水平位置及び垂直位置はCTU単位の座標である。タイルTL0〜TL3の水平サイズ及び垂直サイズはCTU単位の大きさである。例えばCTUの大きさが水平64画素、垂直64画素であり、水平サイズが128画素、垂直サイズが192画素であるとすると、伝送される水平サイズを示すシンタックス要素は2、垂直サイズを示すシンタックス要素は3となる。本実施形態においては、1つのフレームに含まれるタイルの個数を設定し、それぞれのタイルの左上角部の座標と、水平サイズ及び垂直サイズとを設定することにより、従来のHEVCでは設定できなかったタイルを設定することができる。   The horizontal and vertical positions of the tiles TL0 to TL3 are coordinates in CTU units. The horizontal size and vertical size of the tiles TL0 to TL3 are CTU units. For example, if the size of the CTU is 64 pixels horizontal and 64 pixels vertical, the horizontal size is 128 pixels, and the vertical size is 192 pixels, the syntax element indicating the transmitted horizontal size is 2, and the syntax element indicating the vertical size is 2. The tax element is 3. In this embodiment, the number of tiles included in one frame is set, and the coordinates of the upper left corner of each tile, the horizontal size, and the vertical size are set, which cannot be set in the conventional HEVC. Tiles can be set.

スキップタイル設定部102は、従来のHEVCでは設定できなかったスキップするタイルを設定することができる。図10において、タイルTL1及びTL3をスキップするタイルと設定すれば、タイルTL1及びTL3を符号化する必要がなくなり、符号化効率を向上させることができる。   The skip tile setting unit 102 can set tiles to be skipped that cannot be set by the conventional HEVC. In FIG. 10, if the tiles TL1 and TL3 are set to be skipped tiles, it is not necessary to encode the tiles TL1 and TL3, and the encoding efficiency can be improved.

図12に示すタイルTL4とタイルTL7とは、フレーム内では離れているものの、図1に示す六面体402では隣り合う面(402F及び402A)に投影されている画像である。従って、タイルTL4とタイルTL7とは相関が高い。そこで、参照タイル設定部103は、タイルごとに、参照する1または複数のタイルを設定することができる。参照タイル設定部103が生成する参照するタイルの設定情報は、符号化するあるタイルと参照するタイルとの予測依存関係を示す情報である。   A tile TL4 and a tile TL7 illustrated in FIG. 12 are images projected on adjacent surfaces (402F and 402A) in the hexahedron 402 illustrated in FIG. 1 although they are separated in the frame. Therefore, the tile TL4 and the tile TL7 have a high correlation. Therefore, the reference tile setting unit 103 can set one or a plurality of tiles to be referenced for each tile. The reference tile setting information generated by the reference tile setting unit 103 is information indicating a prediction dependency relationship between a certain tile to be encoded and a reference tile.

図6に戻り、ピクチャ分割部104は、図11に示すように設定されたタイル分割の設定情報に基づき、各フレームを分割する。ピクチャ分割部104は、画像情報のフォーマットに応じて、割り当て領域を1または複数のタイル(第1のタイル)に分割し、非割り当て領域を1または複数のタイル(第2のタイル)に分割すればよい。図2に示すフォーマットであれば、割り当て領域と非割り当て領域とをそれぞれ複数のタイルに分割することが必要である。   Returning to FIG. 6, the picture dividing unit 104 divides each frame based on the tile division setting information set as shown in FIG. The picture dividing unit 104 divides the allocated area into one or more tiles (first tile) and divides the non-allocated area into one or more tiles (second tile) according to the format of the image information. That's fine. In the format shown in FIG. 2, it is necessary to divide the allocation area and the non-allocation area into a plurality of tiles.

ピクチャ分割部104は、タイル分割とスキップするタイルと参照するタイルの設定情報とをエントロピー符号化部5に供給する。エントロピー符号化部5は、これらの設定情報を示すシンタックス要素を含むシンタックスを生成してエントロピー符号化する。エントロピー符号化部5は、シンタックス生成部及びビットストリーム生成部として機能する。   The picture dividing unit 104 supplies the tile division, the tile to be skipped, and the setting information of the tile to be referenced to the entropy encoding unit 5. The entropy encoding unit 5 generates a syntax including syntax elements indicating the setting information and performs entropy encoding. The entropy encoding unit 5 functions as a syntax generation unit and a bit stream generation unit.

図13は、エントロピー符号化部5によって生成されて出力される、タイルに関するシンタックス要素を含むシンタックスの一例を示している。タイルに関するシンタックス要素は、ビットストリームのピクチャパラメータセット(Picture Parameter Set)に含まれて伝送されればよい。   FIG. 13 shows an example of a syntax including syntax elements related to tiles generated and output by the entropy encoding unit 5. The syntax element related to the tile may be transmitted by being included in the picture parameter set (Picture Parameter Set) of the bit stream.

タイルイネーブルフラグ(tiles_enabled_flag)が1のとき、シンタックスに、水平位置(hpos)、垂直位置(vpos)、水平サイズ(hsize)、垂直サイズ(vsize)、スキップタイルフラグ(skip_tile_flag)、参照タイル数(num_ref_tiles)、参照タイル番号(ref_tile_no)が設定される。   When the tile enable flag (tiles_enabled_flag) is 1, the syntax includes horizontal position (hpos), vertical position (vpos), horizontal size (hsize), vertical size (vsize), skip tile flag (skip_tile_flag), number of reference tiles ( num_ref_tiles) and reference tile number (ref_tile_no) are set.

スキップタイルフラグ0はスキップしないタイルであることを示し、スキップタイルフラグ1はスキップするタイルであることを示す。図13に示すように、参照タイル数は0であってもよい。なお、図13におけるloop_filter_across_tiles_enabled_flagは、タイル間にループフィルタ11によるフィルタリングを施すか否かを設定するフラグである。   The skip tile flag 0 indicates that the tile is not skipped, and the skip tile flag 1 indicates that the tile is skipped. As shown in FIG. 13, the number of reference tiles may be zero. Note that loop_filter_across_tiles_enabled_flag in FIG. 13 is a flag for setting whether to perform filtering by the loop filter 11 between tiles.

以上のようにして、画像符号化装置100は、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットのVR画像の符号化効率を向上させ、符号化の処理量を低減させることができる。   As described above, the image encoding device 100 improves the encoding efficiency of a VR image in a format including an allocation area to which an image is allocated in a frame and a non-allocation area to which no image is allocated. The amount of processing can be reduced.

<画像符号化方法>
図14に示すフローチャートを用いて、画像符号化装置100で実行される本実施形態の画像符号化方法による処理を説明する。図14は、タイル分割設定部101、スキップタイル設定部102、参照タイル設定部103で実行される処理を示している。
<Image coding method>
The process by the image coding method of this embodiment performed with the image coding apparatus 100 is demonstrated using the flowchart shown in FIG. FIG. 14 shows processing executed by the tile division setting unit 101, the skip tile setting unit 102, and the reference tile setting unit 103.

図14において、タイル分割設定部101は、ステップS101にて、タイル数を設定し、ステップS102にて、まず、タイル番号を0に設定する。タイル分割設定部101は、ステップS103にて、水平位置及び垂直位置を設定し、ステップS104にて、水平サイズ及び垂直サイズを設定する。   In FIG. 14, the tile division setting unit 101 sets the number of tiles in step S101, and first sets the tile number to 0 in step S102. The tile division setting unit 101 sets a horizontal position and a vertical position in step S103, and sets a horizontal size and a vertical size in step S104.

スキップタイル設定部102は、ステップS105にて、各タイルに対してスキップタイルフラグを設定する。参照タイル設定部103は、ステップS106にて、スキップタイルフラグが1であるか否かを判定する。スキップタイルフラグが1でなければ(NO)、参照タイル設定部103は、ステップS107にて、参照タイル数を設定する。参照タイル数は0以上の数であり、0は他のタイルを参照しないことを示し、1以上の数はその数のタイルを参照することを示す。   In step S105, the skip tile setting unit 102 sets a skip tile flag for each tile. In step S106, the reference tile setting unit 103 determines whether or not the skip tile flag is 1. If the skip tile flag is not 1 (NO), the reference tile setting unit 103 sets the reference tile number in step S107. The number of reference tiles is a number of 0 or more, and 0 indicates that other tiles are not referred to, and a number of 1 or more indicates that the number of tiles is referred to.

参照タイル設定部103は、ステップS108にて、参照タイル数が0以外であるか否かを判定する。参照タイル数が0以外であれば(YES)、参照タイル設定部103は、ステップS109にて、参照タイル番号を設定する。その後、処理はステップS110に移行される。   In step S108, the reference tile setting unit 103 determines whether the reference tile number is other than zero. If the reference tile number is other than 0 (YES), the reference tile setting unit 103 sets a reference tile number in step S109. Thereafter, the process proceeds to step S110.

ステップS106にてスキップタイルフラグが1であれば(YES)、また、ステップS108にて参照タイル数が0以外でなければ(NO)(即ち、参照タイル数が0であれば)、処理はステップS110に移行される。   If the skip tile flag is 1 in step S106 (YES), and if the number of reference tiles is not 0 in step S108 (NO) (that is, if the number of reference tiles is 0), the process proceeds to step S106. Moved to S110.

タイル分割設定部101は、ステップS110にて、タイル番号がタイル数−1となったか否かを判定する。タイル番号がタイル数−1でなければ(NO)、まだタイルが残っているので、タイル分割設定部101は、ステップS111にて、タイル番号を1増加させ、処理をステップS103に戻す。   In step S110, the tile division setting unit 101 determines whether the tile number is equal to the number of tiles -1. If the tile number is not -1 (NO), since tiles still remain, the tile division setting unit 101 increments the tile number by 1 in step S111 and returns the process to step S103.

タイル分割設定部101、スキップタイル設定部102、参照タイル設定部103は、次のタイル番号のタイルでもステップS103〜S110の処理を繰り返す。ステップS110にてタイル番号がタイル数−1であれば(YES)、全てのタイルに対する設定が終了したので、タイル分割設定部101、スキップタイル設定部102、参照タイル設定部103は処理を終了させる。   The tile division setting unit 101, the skip tile setting unit 102, and the reference tile setting unit 103 repeat the processes of steps S103 to S110 for the tile with the next tile number. If the tile number is -1 in step S110 (YES), the setting for all tiles has been completed, so the tile division setting unit 101, the skip tile setting unit 102, and the reference tile setting unit 103 end the processing. .

<画像符号化プログラム>
図6に示す画像符号化装置100による動作をコンピュータプログラム(画像符号化プログラム)によってコンピュータに実行させることができる。図14に示す各処理を画像符号化プログラムによってコンピュータに実行させることができる。
<Image coding program>
The operation of the image encoding device 100 shown in FIG. 6 can be executed by a computer by a computer program (image encoding program). Each process shown in FIG. 14 can be executed by a computer using an image encoding program.

図15Aにおいて、コンピュータ300は、中央処理装置(CPU)301及び記憶部302を有する。コンピュータ300には、操作部310が接続されている。記憶部302には、画像符号化プログラムが記憶されている。操作部310を図5に示す前処理装置50として機能させることができる。CPU301が画像符号化プログラムを実行させることによって、コンピュータ300を、入力された画像情報を符号化する画像符号化装置100として機能させることができる。   In FIG. 15A, the computer 300 includes a central processing unit (CPU) 301 and a storage unit 302. An operation unit 310 is connected to the computer 300. The storage unit 302 stores an image encoding program. The operation unit 310 can function as the preprocessing device 50 shown in FIG. By causing the CPU 301 to execute the image encoding program, the computer 300 can function as the image encoding device 100 that encodes the input image information.

記憶部302は、半導体メモリ、ハードディスクドライブ、光ディスク等の任意の非一時的な記憶媒体である。画像符号化プログラムは、インターネット等の通信回線を介してコンピュータ300に提供されてもよい。   The storage unit 302 is an arbitrary non-temporary storage medium such as a semiconductor memory, a hard disk drive, or an optical disk. The image encoding program may be provided to the computer 300 via a communication line such as the Internet.

以上説明した画像符号化装置100、画像符号化方法、画像符号化プログラムは、1つのフレーム内で、タイルはオーバラップせず、タイルが設定されていない領域が存在しないように画像情報を符号化するものとする。   The image encoding device 100, the image encoding method, and the image encoding program described above encode image information so that tiles do not overlap and there is no area in which no tile is set in one frame. It shall be.

<画像復号装置>
図16は、画像復号装置200の具体的な構成例を示す。図16において、HRDバッファ21はビットストリームを一時的に蓄積して、エントロピー復号部22に供給する。HRDバッファ21は、ビットストリームを受信するビットストリーム受信部として機能する。
<Image decoding device>
FIG. 16 shows a specific configuration example of the image decoding device 200. In FIG. 16, the HRD buffer 21 temporarily accumulates the bit stream and supplies it to the entropy decoding unit 22. The HRD buffer 21 functions as a bit stream receiving unit that receives a bit stream.

ビットストリームは、符号化データとシンタックスとを含む。符号化データは、前述のように、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報を符号化した符号化データである。   The bit stream includes encoded data and syntax. As described above, the encoded data is encoded data obtained by encoding image information in a format including an allocated area in which an image is allocated in a frame and an unallocated area in which no image is allocated.

また、符号化データは、各フレームが、割り当て領域に設定された1または複数のタイルと、非割り当て領域に設定された1または複数のタイルとに分割され、割り当て領域に設定されたタイルの画像が符号化された符号化データである。   Also, the encoded data is divided into one or a plurality of tiles set in the allocation area and one or a plurality of tiles set in the non-allocation area, and an image of the tile set in the allocation area. Is the encoded data.

シンタックスは、それぞれのタイルを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含む。シンタックスは、非割り当て領域に設定されたタイルの画像を符号化しないことを示すスキップタイルフラグであるシンタックス要素を含むことが好ましい。シンタックスは、予測依存関係を示すシンタックス要素を含むことが好ましい。   The syntax includes syntax elements that define each tile with a horizontal position and vertical position of the upper left corner in the frame, and a horizontal size and vertical size. It is preferable that the syntax includes a syntax element that is a skip tile flag indicating that the image of the tile set in the non-allocation area is not encoded. The syntax preferably includes a syntax element indicating a prediction dependency.

エントロピー復号部22は、ビットストリームに含まれる直交変換係数及びシンタックスをエントロピー復号する。   The entropy decoding unit 22 entropy decodes the orthogonal transform coefficients and syntax included in the bitstream.

直交変換係数は逆量子化部23に供給される。イントラ予測とインター予測とのいずれが採用されたかを示す情報は、スイッチ32に供給される。イントラ予測に関する情報は、イントラ予測部30に供給される。インター予測に関する情報は、インター予測部31に供給される。   The orthogonal transform coefficient is supplied to the inverse quantization unit 23. Information indicating whether intra prediction or inter prediction is adopted is supplied to the switch 32. Information regarding intra prediction is supplied to the intra prediction unit 30. Information regarding inter prediction is supplied to the inter prediction unit 31.

タイル分割に関する情報は、タイル分割復号部201に供給される。スキップタイルに関する情報は、タイル分割復号部201を介してスキップタイル設定部202に供給される。参照タイルに関する情報は、インター予測部31と、タイル分割復号部201及びスキップタイル設定部202を介して参照タイル設定部203に供給される。   Information relating to tile division is supplied to the tile division decoding unit 201. Information regarding the skip tile is supplied to the skip tile setting unit 202 via the tile division decoding unit 201. Information on the reference tile is supplied to the reference tile setting unit 203 via the inter prediction unit 31, the tile division decoding unit 201, and the skip tile setting unit 202.

逆量子化部23は、直交変換係数をTU単位で逆量子化して、逆直交変換部24に供給する。逆直交変換部24は、逆量子化された直交変換係数をTU単位で逆直交変換して、予測残差を加算器25に供給する。加算器25は、入力された予測残差と、スイッチ32より供給されるイントラ予測部30またはインター予測部31によって生成された予測値とを加算して、復号信号を生成する。復号信号はループフィルタ26及びフレームメモリ28に供給される。   The inverse quantization unit 23 inversely quantizes the orthogonal transform coefficient in units of TU and supplies the inverse transform coefficient to the inverse orthogonal transform unit 24. The inverse orthogonal transform unit 24 performs inverse orthogonal transform on the inversely quantized orthogonal transform coefficient in units of TU, and supplies the prediction residual to the adder 25. The adder 25 adds the input prediction residual and the prediction value generated by the intra prediction unit 30 or the inter prediction unit 31 supplied from the switch 32 to generate a decoded signal. The decoded signal is supplied to the loop filter 26 and the frame memory 28.

ループフィルタ26はループフィルタ11と同様の構成であり、復号信号の符号化ノイズを低減させる。並べ替え(Re-order)バッファ27は、ループフィルタ26から供給される画素を複数フレーム分蓄積する。並べ替えバッファ27は、フレームの順が並び替えられていれば、フレームを原画像の画像情報の順に並び替える。並べ替えバッファ27より出力された各フレームのタイルを構成する画素は、ピクチャ合成部204に供給される。   The loop filter 26 has the same configuration as the loop filter 11 and reduces the encoding noise of the decoded signal. The re-order buffer 27 accumulates pixels supplied from the loop filter 26 for a plurality of frames. The rearrangement buffer 27 rearranges the frames in the order of the image information of the original image if the order of the frames is rearranged. The pixels constituting the tile of each frame output from the rearrangement buffer 27 are supplied to the picture composition unit 204.

フレームメモリ28は、加算器25より出力されたループフィルタ26によるフィルタ処理を施していない復号信号と、ループフィルタ26によるフィルタ処理が施された復号信号とを蓄積する。スイッチ29は、フレームメモリ28に蓄積されたフィルタ処理を施していない復号信号をイントラ予測部30に供給し、フレームメモリ28に蓄積されたフィルタ処理が施された復号信号をインター予測部31に供給する。   The frame memory 28 stores the decoded signal output from the adder 25 that has not been subjected to the filter processing by the loop filter 26 and the decoded signal that has been subjected to the filter processing by the loop filter 26. The switch 29 supplies the decoded signal that has not been subjected to the filter processing accumulated in the frame memory 28 to the intra prediction unit 30, and supplies the decoded signal that has been subjected to the filter processing accumulated in the frame memory 28 to the inter prediction unit 31. To do.

イントラ予測部30は、イントラ予測の予測モードを示す情報に従ってフレーム内予測を行って、Y信号とCb及びCr信号のそれぞれの予測値を生成する。インター予測部31は、インター予測に関する情報に従ってフレーム間予測を行って、Y信号とCb及びCr信号のそれぞれの予測値を生成する。   The intra prediction unit 30 performs intra-frame prediction according to information indicating a prediction mode of intra prediction, and generates respective prediction values of the Y signal, the Cb signal, and the Cr signal. The inter prediction unit 31 performs inter-frame prediction in accordance with information related to inter prediction, and generates respective prediction values for the Y signal and the Cb and Cr signals.

インター予測部31は、参照タイルに関する情報が入力されるとき、図12に示すように、他のタイル(ここではTL7)の画像を参照して、あるタイル(ここではTL4)の画像の予測値を生成する。   When the information regarding the reference tile is input, the inter prediction unit 31 refers to an image of another tile (here, TL7) and predicts the image of a certain tile (here, TL4) as illustrated in FIG. Is generated.

スイッチ32は、イントラ予測とインター予測とのいずれが採用されたかを示す情報に従って、イントラ予測部30またはインター予測部31によって生成された予測値を加算器25に供給する。   The switch 32 supplies the adder 25 with the prediction value generated by the intra prediction unit 30 or the inter prediction unit 31 according to information indicating which of intra prediction and inter prediction is adopted.

エントロピー復号部22からスイッチ32までの部分は、符号化データを復号して、割り当て領域に設定されたタイルの復号画像を生成する復号部として機能する。   The portion from the entropy decoding unit 22 to the switch 32 functions as a decoding unit that decodes the encoded data and generates a decoded image of the tile set in the allocation area.

タイル分割復号部201は、図11に示すように設定されたタイル分割の設定情報を復号して、スキップタイル設定部202に供給する。スキップタイル設定部202は、スキップタイルフラグに基づいてスキップするタイルを設定する。参照タイル設定部203は、参照するタイルを設定する。タイル分割の設定情報、スキップするタイルの情報、参照するタイルの情報は、ピクチャ合成部204に供給される。   The tile division decoding unit 201 decodes the tile division setting information set as illustrated in FIG. 11 and supplies the decoded information to the skip tile setting unit 202. The skip tile setting unit 202 sets a tile to be skipped based on the skip tile flag. The reference tile setting unit 203 sets a tile to be referred to. The tile division setting information, the tile information to be skipped, and the tile information to be referred to are supplied to the picture composition unit 204.

ピクチャ合成部204は、タイル分割の設定情報に基づいて、復号されたタイルの画像をフレーム内の割り当て領域に配置する。ピクチャ合成部204は、スキップするタイルの情報に基づいて、非割り当て領域に例えば黒の単一画像を配置する。ピクチャ合成部204はこのように複数のタイルをピクチャ合成して、図2に示すようなフォーマットの復号画像情報の各フレームの復号画像情報を生成する。復号画像情報は、必要に応じてD/A変換器によってアナログ信号に変換される。   The picture composition unit 204 arranges the decoded tile image in the allocation area in the frame based on the tile division setting information. The picture composition unit 204 arranges, for example, a single black image in the non-allocation area based on the information on the tile to be skipped. The picture composition unit 204 synthesizes a plurality of tiles in this way, and generates decoded image information of each frame of the decoded image information in the format shown in FIG. The decoded image information is converted into an analog signal by a D / A converter as necessary.

以上のようにして、画像復号装置200は、フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットのVR画像を復号する処理量を低減させることができる。   As described above, the image decoding apparatus 200 can reduce the amount of processing for decoding a VR image having a format including an allocation area to which an image is allocated in a frame and a non-allocation area to which no image is allocated. it can.

<画像復号方法>
図17に示すフローチャートを用いて、画像復号装置200で実行される本実施形態の画像復号方法による処理を説明する。図17は、タイル分割復号部201、スキップタイル設定部202、参照タイル設定部203で実行される処理を示している。
<Image decoding method>
The process by the image decoding method of this embodiment performed with the image decoding apparatus 200 is demonstrated using the flowchart shown in FIG. FIG. 17 illustrates processing executed by the tile division decoding unit 201, the skip tile setting unit 202, and the reference tile setting unit 203.

図17において、タイル分割復号部201は、ステップS201にて、タイル数を受信し、ステップS202にて、まず、タイル番号を0に設定する。タイル分割復号部201は、ステップS203にて、水平位置及び垂直位置を受信し、ステップS204にて、水平サイズ及び垂直サイズを受信する。   In FIG. 17, the tile division decoding unit 201 receives the number of tiles in step S201, and first sets the tile number to 0 in step S202. The tile division decoding unit 201 receives the horizontal position and the vertical position in step S203, and receives the horizontal size and the vertical size in step S204.

スキップタイル設定部202は、ステップS205にて、各タイルのスキップタイルフラグを受信する。参照タイル設定部203は、ステップS206にて、スキップタイルフラグが1であるか否かを判定する。スキップタイルフラグが1でなければ(NO)、参照タイル設定部203は、ステップS207にて、参照タイル数を受信する。   In step S205, the skip tile setting unit 202 receives the skip tile flag of each tile. In step S206, the reference tile setting unit 203 determines whether or not the skip tile flag is 1. If the skip tile flag is not 1 (NO), the reference tile setting unit 203 receives the reference tile number in step S207.

参照タイル設定部203は、ステップS208にて、参照タイル数が0以外であるか否かを判定する。参照タイル数が0以外であれば(YES)、参照タイル設定部203は、ステップS209にて、参照タイル番号を受信する。その後、処理はステップS210に移行される。   In step S208, the reference tile setting unit 203 determines whether the reference tile number is other than zero. If the number of reference tiles is other than 0 (YES), the reference tile setting unit 203 receives the reference tile number in step S209. Thereafter, the process proceeds to step S210.

ステップS206にてスキップタイルフラグが1であれば(YES)、また、ステップS208にて参照タイル数が0以外でなければ(NO)(即ち、参照タイル数が0であれば)、処理はステップS210に移行される。   If the skip tile flag is 1 in step S206 (YES), and if the reference tile number is not 0 in step S208 (NO) (that is, if the reference tile number is 0), the process proceeds to step S206. Moved to S210.

タイル分割復号部201は、ステップS210にて、タイル番号がタイル数−1となったか否かを判定する。タイル番号がタイル数−1でなければ(NO)、まだタイルが残っているので、タイル分割復号部201は、ステップS211にて、タイル番号を1増加させ、処理をステップS203に戻す。   In step S210, the tile division decoding unit 201 determines whether or not the tile number is equal to the number of tiles−1. If the tile number is not the number of tiles -1 (NO), since tiles still remain, the tile division decoding unit 201 increments the tile number by 1 in step S211 and returns the process to step S203.

タイル分割復号部201、スキップタイル設定部202、参照タイル設定部203は、次のタイル番号のタイルでもステップS203〜S210の処理を繰り返す。ステップS210にてタイル番号がタイル数−1であれば(YES)、全てのタイルの情報を受信したので、タイル分割復号部201、スキップタイル設定部202、参照タイル設定部203は処理を終了させる。   The tile division decoding unit 201, the skip tile setting unit 202, and the reference tile setting unit 203 repeat the processes in steps S203 to S210 for the tile with the next tile number. If the tile number is the number of tiles −1 in step S210 (YES), the tile division decoding unit 201, the skip tile setting unit 202, and the reference tile setting unit 203 end the processing because information on all tiles has been received. .

<画像復号プログラム>
図16に示す画像復号装置における動作をコンピュータプログラム(画像復号プログラム)によってコンピュータに実行させることができる。図17に示す各処理を画像復号プログラムによってコンピュータに実行させることができる。
<Image decoding program>
The operation of the image decoding apparatus shown in FIG. 16 can be executed by a computer using a computer program (image decoding program). Each process shown in FIG. 17 can be executed by a computer using an image decoding program.

図15Bに示すように、コンピュータは図15Aと同様の構成であり、図15Aと共通部分の説明を省略する。図15Bにおいて、記憶部302には、画像符号化プログラムに代えて画像復号プログラムが記憶されている。CPU301が画像復号プログラムを実行させることによって、コンピュータ300を、符号化されているビットストリームを復号する画像復号装置200として機能させることができる。   As shown in FIG. 15B, the computer has the same configuration as that in FIG. 15A, and the description of the common parts with FIG. In FIG. 15B, the storage unit 302 stores an image decoding program instead of the image encoding program. By causing the CPU 301 to execute the image decoding program, the computer 300 can function as the image decoding device 200 that decodes the encoded bit stream.

記憶部302に画像符号化プログラム及び画像復号プログラムを記憶させて、コンピュータ300を、画像符号化装置100及び画像復号装置200として機能させることも可能である。   It is also possible to store the image encoding program and the image decoding program in the storage unit 302 so that the computer 300 functions as the image encoding device 100 and the image decoding device 200.

<第1の変形例>
以上説明した本実施形態の画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラムにおいて、次のような第1の変形例とすることができる。
<First Modification>
In the image encoding device, the image encoding method, and the image encoding program, and the image decoding device, the image decoding method, and the image decoding program of the present embodiment described above, the following first modified example is used. be able to.

図18に示すように、タイルを符号化して伝送する順番は、左上のタイルを最初としなくてもよい。図18において、画像符号化装置100はタイルTL0〜TL5の順で符号化して符号化データを含むビットストリームを伝送する。画像復号装置200は、タイルTL0〜TL5の順で復号する。ヘッドマウントディスプレイを装着するユーザが最初に視認する視野に対応するタイルを最初に符号化し復号するタイルTL0とする。   As shown in FIG. 18, the order of encoding and transmitting the tiles does not have to be the top left tile first. In FIG. 18, the image encoding device 100 encodes the tiles TL <b> 0 to TL <b> 5 in this order and transmits a bit stream including encoded data. The image decoding apparatus 200 decodes in the order of the tiles TL0 to TL5. A tile TL0 that first encodes and decodes a tile corresponding to the field of view that the user wearing the head-mounted display first visually recognizes.

スキップタイルフラグを伝送しなくてもよい。この場合、上記の説明では、1つのフレーム内でタイルが設定されていない領域が存在しないように画像情報を符号化するとしたが、タイルが設定されていない領域が存在してもよい。図18において、ハッチングを付した非割り当て領域にタイルを設定しなくてもよい。   The skip tile flag need not be transmitted. In this case, in the above description, the image information is encoded so that there is no region in which no tile is set in one frame, but there may be a region in which no tile is set. In FIG. 18, it is not necessary to set a tile in a non-allocated area with hatching.

<第2の変形例>
図9(b)で説明したように、スライスはタイルのスーパーセットとすることができるとしたが、スライスがタイルのスーパーセットであることを禁じてもよい。スライスがタイルのスーパーセットであることを禁じないと、図19に示すように、互いに離れた位置にあるタイルTL0及びTL1のスーパーセットであるスライスSL0が設定されることがある。互いに離れた位置にある複数のタイルで、スライスヘッダに含まれるパラメータが共有されないよう、スライスがタイルのスーパーセットであることを禁じるのがよい。
<Second Modification>
As described with reference to FIG. 9B, the slice can be a superset of tiles, but the slice may be prohibited from being a superset of tiles. If the slice is not prohibited from being a superset of tiles, a slice SL0 that is a superset of tiles TL0 and TL1 that are located at a distance from each other may be set as shown in FIG. It is advisable to prohibit a slice from being a superset of tiles so that multiple tiles that are far from each other do not share the parameters contained in the slice header.

<第3の変形例>
上記の説明では、1つのフレーム内でタイルはオーバラップしないとしたが、タイルのオーバラップを許容してもよい。図20は、実線で示すタイルTL0と一点鎖線で示すタイルTL1とがオーバラップしている状態を示している。
<Third Modification>
In the above description, tiles do not overlap in one frame, but tile overlap may be allowed. FIG. 20 shows a state where the tile TL0 indicated by the solid line and the tile TL1 indicated by the alternate long and short dash line overlap.

ヘッドマウントディスプレイを装着しているユーザの視野が破線で示す領域AR0にあるとき、画像復号装置200は、タイルTL0のうちの領域AR0の部分の画像を復号してヘッドマウントディスプレイに表示する。ユーザの視野が領域AR0から破線で示す領域AR1に移動したとき、画像復号装置200は、タイルTL1の復号処理を開始するまでの間に、タイルTL0のタイルTL1とオーバラップしているオーバラップ領域の画像を復号して表示する。従って、ユーザの視野が移動したときの画像表示の遅延を低減させることができる。   When the field of view of the user wearing the head mounted display is in the area AR0 indicated by the broken line, the image decoding apparatus 200 decodes the image of the area AR0 in the tile TL0 and displays it on the head mounted display. When the user's field of view moves from the area AR0 to the area AR1 indicated by the broken line, the image decoding apparatus 200 overlaps the tile TL1 of the tile TL0 before starting the decoding process of the tile TL1. Decode the image and display it. Accordingly, it is possible to reduce a delay in image display when the user's visual field moves.

上述した本実施形態においては、画像情報としてY,Cb,Cr映像信号を例としたが、色空間はY,Cb,Crに限定されず、Y,Co,Cg映像信号であってもよい。画像情報は、輝度成分と2つの色差信号よりなる色成分を含む任意の色空間の映像信号であればよい。   In the present embodiment described above, Y, Cb, and Cr video signals are taken as examples of image information. However, the color space is not limited to Y, Cb, and Cr, and may be Y, Co, and Cg video signals. The image information may be a video signal in an arbitrary color space including a luminance component and a color component composed of two color difference signals.

本発明は以上説明した本実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々変更可能である。画像符号化装置100及び画像復号装置200は、集積回路等のハードウェアで構成されてもよく、ソフトウェアで構成されてもよく、両者が混在してもよい。画像符号化方法及び画像復号方法は、集積回路またはコンピュータ等の任意のハードウェア資源が実行すればよい。   The present invention is not limited to the embodiment described above, and various modifications can be made without departing from the scope of the present invention. The image encoding device 100 and the image decoding device 200 may be configured by hardware such as an integrated circuit, may be configured by software, or both may be mixed. The image encoding method and the image decoding method may be executed by any hardware resource such as an integrated circuit or a computer.

100 画像符号化装置
101 タイル分割設定部
102,202 スキップタイル設定部
103,203 参照タイル設定部
104 ピクチャ分割部
200 画像復号装置
201 タイル分割復号部
204 ピクチャ合成部
300 コンピュータ
302 記憶部
DESCRIPTION OF SYMBOLS 100 Image coding apparatus 101 Tile division | segmentation setting part 102,202 Skip tile setting part 103,203 Reference tile setting part 104 Picture division part 200 Image decoding apparatus 201 Tile division decoding part 204 Picture composition part 300 Computer 302 Storage part

Claims (10)

フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報が入力され、前記画像情報の各フレームを、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割するピクチャ分割部と、
前記第1のタイルの画像を符号化して符号化データを生成する符号化データ生成部と、
前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義した第1のシンタックス要素を含むシンタックスを生成するシンタックス生成部と、
前記符号化データと前記シンタックスとを含むビットストリームを生成するビットストリーム生成部と、
を備えることを特徴とする画像符号化装置。
Image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated is input, and each frame of the image information is set to one or more set in the allocation area A picture dividing unit for dividing the first tile into one or a plurality of second tiles set in the non-allocation area;
An encoded data generation unit that encodes the image of the first tile to generate encoded data;
Syntax generation for generating a syntax including a first syntax element for each of the first and second tiles defined by the horizontal position and vertical position of the upper left corner in the frame, and the horizontal size and vertical size. And
A bit stream generation unit that generates a bit stream including the encoded data and the syntax;
An image encoding device comprising:
前記符号化データ生成部は前記第2のタイルの画像を符号化せず、
前記シンタックス生成部は、前記第2のタイルの画像を符号化しないことを示すスキップタイルフラグである第2のシンタックス要素を含むシンタックスを生成する
ことを特徴とする請求項1に記載の画像符号化装置。
The encoded data generation unit does not encode the image of the second tile,
The syntax generation unit generates a syntax including a second syntax element that is a skip tile flag indicating that the image of the second tile is not encoded. Image encoding device.
前記ピクチャ分割部は前記割り当て領域を複数の第1のタイルに分割し、
前記符号化データ生成部は、前記複数の第1のタイルそれぞれを符号化するときに、前記複数の第1のタイルのうちの少なくとも1つの他のタイルを参照するか否かの設定情報に基づいて、前記複数の第1のタイルそれぞれを符号化して符号化データを生成し、
前記シンタックス生成部は、前記符号化データ生成部が他のタイルを参照せず前記第1のタイルを符号化したときには他のタイルを参照しないことを示し、他のタイルを参照して前記第1のタイルを符号化したときには参照するタイルを示す第3のシンタックス要素を含むシンタックスを生成する
ことを特徴とする請求項2に記載の画像符号化装置。
The picture dividing unit divides the allocation area into a plurality of first tiles,
The encoded data generation unit is based on setting information on whether or not to refer to at least one other tile of the plurality of first tiles when encoding each of the plurality of first tiles. And encoding each of the plurality of first tiles to generate encoded data,
The syntax generation unit indicates that when the encoded data generation unit encodes the first tile without referring to other tiles, the syntax generation unit does not refer to other tiles, and refers to the other tiles. The image encoding apparatus according to claim 2, wherein when one tile is encoded, a syntax including a third syntax element indicating a tile to be referred to is generated.
フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報の各フレームを、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割し、
前記第1のタイルの画像を符号化して符号化データを生成し、
前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスを生成し、
前記符号化データと前記シンタックスとを含むビットストリームを生成する
ことを特徴とする画像符号化方法。
Each frame of image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated, and one or more first tiles set in the allocation area; Dividing into one or a plurality of second tiles set in the non-allocation area,
Encoding the image of the first tile to generate encoded data;
Each of the first and second tiles generates a syntax including syntax elements defined by a horizontal position and a vertical position of the upper left corner in the frame, and a horizontal size and a vertical size,
An image encoding method, comprising: generating a bitstream including the encoded data and the syntax.
コンピュータに、
フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報の各フレームを、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割するステップと、
前記第1のタイルの画像を符号化して符号化データを生成するステップと、
前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスを生成するステップと、
前記符号化データと前記シンタックスとを含むビットストリームを生成するステップと、
を実行させることを特徴とする画像符号化プログラム。
On the computer,
Each frame of image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated, and one or more first tiles set in the allocation area; Dividing into one or more second tiles set in the unallocated area;
Encoding the image of the first tile to generate encoded data;
Each of the first and second tiles generating a syntax including syntax elements defined by a horizontal position and a vertical position of the upper left corner in the frame and a horizontal size and a vertical size;
Generating a bitstream including the encoded data and the syntax;
An image encoding program characterized in that
フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報であり、前記画像情報の各フレームが、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割され、前記第1のタイルの画像が符号化された符号化データと、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義した第1のシンタックス要素を含むシンタックスとを含むビットストリームを受信するビットストリーム受信部と、
前記符号化データを復号して前記第1のタイルの復号画像を生成する復号部と、
前記第1のシンタックス要素に基づいて、前記第1のタイルの復号画像と前記第2のタイルの単一画像とを合成して各フレームの復号画像情報を生成するピクチャ合成部と、
を備えることを特徴とする画像復号装置。
It is image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated, and each frame of the image information includes one or a plurality of frames set in the allocation area Divided into a first tile and one or a plurality of second tiles set in the non-allocation area, encoded data obtained by encoding an image of the first tile, and the first and second A bit stream receiving unit that receives a bit stream including a syntax including a first syntax element defined by a horizontal position and a vertical position of the upper left corner in the frame and a horizontal size and a vertical size of each tile of When,
A decoding unit that decodes the encoded data to generate a decoded image of the first tile;
A picture synthesis unit that synthesizes the decoded image of the first tile and the single image of the second tile based on the first syntax element to generate decoded image information of each frame;
An image decoding apparatus comprising:
前記符号化データは、前記第2のタイルの画像が符号化されていない符号化データであり、
前記ビットストリーム受信部は、前記第2のタイルが符号化されていないことを示すスキップタイルフラグである第2のシンタックス要素を含むシンタックスを受信し、
前記ピクチャ合成部は、前記第2のシンタックス要素に基づいて、前記第2のタイルに前記単一画像を割り当てる
ことを特徴とする請求項6に記載の画像復号装置。
The encoded data is encoded data in which the image of the second tile is not encoded,
The bitstream receiving unit receives a syntax including a second syntax element that is a skip tile flag indicating that the second tile is not encoded;
The image decoding apparatus according to claim 6, wherein the picture composition unit assigns the single image to the second tile based on the second syntax element.
前記画像情報の前記割り当て領域は複数の第1のタイルに分割され、
前記ビットストリーム受信部は、前記複数の第1のタイルそれぞれが、前記複数の第1のタイルのうちの少なくとも1つの他のタイルを参照して符号化されているか否かを示し、他のタイルを参照して符号化されているときには参照したタイルを示す第3のシンタックス要素を含むシンタックスを受信し、
前記復号部は、前記第3のシンタックス要素に基づいて、前記複数の第1のタイルそれぞれを、他のタイルを参照して符号化されていないときには他のタイルを参照することなく復号し、他のタイルを参照して符号化されているときには他のタイルを参照して復号する
ことを特徴とする請求項7に記載の画像復号装置。
The allocation area of the image information is divided into a plurality of first tiles;
The bitstream reception unit indicates whether each of the plurality of first tiles is encoded with reference to at least one other tile of the plurality of first tiles, Receiving a syntax including a third syntax element indicating the referenced tile when encoded with reference to
The decoding unit decodes each of the plurality of first tiles based on the third syntax element without referring to the other tiles when not encoded with reference to the other tiles, The image decoding apparatus according to claim 7, wherein when decoding is performed with reference to another tile, the decoding is performed with reference to the other tile.
フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報であり、前記画像情報の各フレームが、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割され、前記第1のタイルの画像が符号化された符号化データと、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスとを含むビットストリームを受信し、
前記符号化データを復号して前記第1のタイルの復号画像を生成し、
前記シンタックス要素に基づいて、前記第1のタイルの復号画像と前記第2のタイルの単一画像とを合成して各フレームの復号画像情報を生成する
ことを特徴とする画像復号方法。
It is image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated, and each frame of the image information includes one or a plurality of frames set in the allocation area Divided into a first tile and one or a plurality of second tiles set in the non-allocation area, encoded data obtained by encoding an image of the first tile, and the first and second Each of the tiles receives a bitstream including a syntax including a syntax element defined by a horizontal position and a vertical position of the upper left corner in the frame and a horizontal size and a vertical size;
Decoding the encoded data to generate a decoded image of the first tile;
Based on the syntax element, the decoded image information of each frame is generated by synthesizing the decoded image of the first tile and the single image of the second tile.
コンピュータに、
フレーム内に画像が割り当てられている割り当て領域と画像が割り当てられていない非割り当て領域とを含むフォーマットの画像情報であり、前記画像情報の各フレームが、前記割り当て領域に設定された1または複数の第1のタイルと、前記非割り当て領域に設定された1または複数の第2のタイルとに分割され、前記第1のタイルの画像が符号化された符号化データと、前記第1及び第2のタイルそれぞれを、フレーム内での左上角部の水平位置及び垂直位置と水平サイズ及び垂直サイズとで定義したシンタックス要素を含むシンタックスとを含むビットストリームを受信するステップと、
前記符号化データを復号して前記第1のタイルの復号画像を生成するステップと、
前記シンタックス要素に基づいて、前記第1のタイルの復号画像と前記第2のタイルの単一画像とを合成して各フレームの復号画像情報を生成するステップと、
を実行させることを特徴とする画像復号プログラム。
On the computer,
It is image information in a format including an allocation area in which an image is allocated in a frame and a non-allocation area in which no image is allocated, and each frame of the image information includes one or a plurality of frames set in the allocation area Divided into a first tile and one or a plurality of second tiles set in the non-allocation area, encoded data obtained by encoding an image of the first tile, and the first and second Receiving a bitstream that includes a syntax including a syntax element defined by a horizontal position and a vertical position of the upper left corner and a horizontal size and a vertical size of each of the tiles in the frame;
Decoding the encoded data to generate a decoded image of the first tile;
Combining the decoded image of the first tile and the single image of the second tile based on the syntax element to generate decoded image information of each frame;
An image decoding program characterized in that
JP2016188129A 2016-09-27 2016-09-27 Image encoder, image encoding method and image encoding program, and image decoder, image decoding method and image decoding program Pending JP2018056686A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016188129A JP2018056686A (en) 2016-09-27 2016-09-27 Image encoder, image encoding method and image encoding program, and image decoder, image decoding method and image decoding program
PCT/JP2017/031140 WO2018061589A1 (en) 2016-09-27 2017-08-30 Image encoding device, image encoding method, image encoding program, image decoding device, image decoding method, and image decoding program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016188129A JP2018056686A (en) 2016-09-27 2016-09-27 Image encoder, image encoding method and image encoding program, and image decoder, image decoding method and image decoding program

Publications (1)

Publication Number Publication Date
JP2018056686A true JP2018056686A (en) 2018-04-05

Family

ID=61759560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016188129A Pending JP2018056686A (en) 2016-09-27 2016-09-27 Image encoder, image encoding method and image encoding program, and image decoder, image decoding method and image decoding program

Country Status (2)

Country Link
JP (1) JP2018056686A (en)
WO (1) WO2018061589A1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019103126A1 (en) * 2017-11-22 2019-05-31 Sharp Kabushiki Kaisha Systems and methods for signaling tile structures for pictures of coded video
WO2020141904A1 (en) * 2019-01-02 2020-07-09 주식회사 엑스리스 Image signal encoding/decoding method and device for same
JP2022523440A (en) * 2019-03-08 2022-04-22 中▲興▼通▲訊▼股▲ふぇん▼有限公司 Null tile coding in video coding

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112014009569B1 (en) * 2011-10-31 2022-07-05 Mitsubishi Electric Corporation DEVICE AND VIDEO DECODING METHOD
WO2015197815A1 (en) * 2014-06-27 2015-12-30 Koninklijke Kpn N.V. Determining a region of interest on the basis of a hevc-tiled video stream

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019103126A1 (en) * 2017-11-22 2019-05-31 Sharp Kabushiki Kaisha Systems and methods for signaling tile structures for pictures of coded video
WO2020141904A1 (en) * 2019-01-02 2020-07-09 주식회사 엑스리스 Image signal encoding/decoding method and device for same
US11012691B2 (en) 2019-01-02 2021-05-18 Xris Corporation Image signal encoding/decoding method and device for same
US11601646B2 (en) 2019-01-02 2023-03-07 Apple Inc. Image signal encoding/decoding method and device for same
JP2022523440A (en) * 2019-03-08 2022-04-22 中▲興▼通▲訊▼股▲ふぇん▼有限公司 Null tile coding in video coding
JP7416820B2 (en) 2019-03-08 2024-01-17 中興通訊股▲ふん▼有限公司 Null tile coding in video coding

Also Published As

Publication number Publication date
WO2018061589A1 (en) 2018-04-05

Similar Documents

Publication Publication Date Title
JP7343573B2 (en) Apparatus and method for dequantization
CN114173115B (en) Encoder, decoder and corresponding methods for intra prediction
CN113748677A (en) Encoder, decoder and corresponding intra prediction method
JP7366149B2 (en) An encoder, decoder, and corresponding method for harmonizing matrix-based intra-prediction and quadratic transform core selection
CN116208767B (en) Method and device for decoding code stream and equipment for storing code stream
CN113170202B (en) Encoder, decoder and corresponding methods for constructing MPM list of block applying multi-hypothesis prediction
CN113785573A (en) Encoder, decoder and corresponding methods using an adaptive loop filter
JP2023153802A (en) Deblocking filter for sub-partition boundary caused by intra sub-partition coding tool
CN114125468A (en) Intra-frame prediction method and device
KR20210088688A (en) Encoders, decoders and corresponding methods using the IBC merge list
KR20210126771A (en) Encoders, decoders and corresponding methods related to intra prediction mode
CN116828176A (en) Decoding device, encoding device, and transmitting device
KR20220143943A (en) Encoder, decoder, and corresponding method simplifying signaling of slice header syntax element
WO2018061589A1 (en) Image encoding device, image encoding method, image encoding program, image decoding device, image decoding method, and image decoding program
CN113411613A (en) Encoder, decoder and corresponding methods for enabling high level flags using DCT2
CN113647103A (en) Method and apparatus for quantizing coefficients for matrix-based intra prediction techniques
CN113170118A (en) Method and apparatus for chroma intra prediction in video coding
CN114450958B (en) Affine motion model limiting for reducing memory bandwidth of enhanced interpolation filters
CN113574870B (en) Encoder, decoder and method for implementing predictive coding on current block
CN113727120B (en) Decoding method, device, encoder and decoder
CN113228632B (en) Encoder, decoder, and corresponding methods for local illumination compensation
KR20220140858A (en) Decoder and corresponding method for signaling picture partitioning information for a slice
KR20220109464A (en) Encoders, decoders and corresponding methods of flexible profile configuration
KR20220065880A (en) Use of DCT-based interpolation filters and enhanced bilinear interpolation filters in affine motion compensation
CN113692740A (en) Method and apparatus for division-free intra prediction