JP2018032913A - Video encoder, program and method, and video decoder, program and method, and video transmission system - Google Patents
Video encoder, program and method, and video decoder, program and method, and video transmission system Download PDFInfo
- Publication number
- JP2018032913A JP2018032913A JP2016162234A JP2016162234A JP2018032913A JP 2018032913 A JP2018032913 A JP 2018032913A JP 2016162234 A JP2016162234 A JP 2016162234A JP 2016162234 A JP2016162234 A JP 2016162234A JP 2018032913 A JP2018032913 A JP 2018032913A
- Authority
- JP
- Japan
- Prior art keywords
- layer
- filter coefficient
- image
- encoding
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、映像符号化装置、プログラム及び方法、並びに、映像復号装置、プログラム及び方法、並びに、映像伝送システムに関し、例えば、マルチレイヤの映像情報を圧縮符号化してストリームデータとして伝送するシステムに適用し得る。 The present invention relates to a video encoding device, a program and a method, a video decoding device, a program and a method, and a video transmission system. For example, the present invention is applied to a system for compressing and encoding multi-layer video information and transmitting it as stream data. Can do.
例えば、H.264/MPEG−4 AVC(Advanced Video Coding:以下、「AVC」とも呼ぶ)やH.265/MPEG−H HEVC(High Efficiency Video Coding:以下、「HEVC」とも呼ぶ)等に代表される映像符号化方式による映像情報の圧縮符号化処理は、入力された対象画像を分割した処理単位ごとに、イントラ予測や動き補償予測等のインター予測を行った予測画像と、入力された対象画像との差分である予測残差信号に、離散コサイン変換等の空間変換を施した変換係数を量子化して、これをエントロピー符号化することによって高効率の映像圧縮を実現している。さらに、これらの映像符号化方式では、スケーラブル符号化拡張が利用可能であり、複数の空間解像度や、フレームレート、画像品質、ビット深度等の複数の映像表現をマルチレイヤの映像ストリームとして符号化することができる。 For example, H.M. H.264 / MPEG-4 AVC (Advanced Video Coding: hereinafter also referred to as “AVC”) and H.264 / MPEG-4 AVC. H.264 / MPEG-H HEVC (High Efficiency Video Coding: hereinafter also referred to as “HEVC”) and the like, video information compression and encoding processing is performed for each processing unit obtained by dividing an input target image. In addition, the transform coefficient obtained by performing spatial transformation such as discrete cosine transform on the prediction residual signal that is the difference between the predicted image that has been inter-predicted such as intra prediction and motion compensation prediction and the input target image is quantized. Thus, high-efficiency video compression is realized by entropy encoding this. Furthermore, in these video coding schemes, scalable coding extension can be used, and multiple video representations such as multiple spatial resolutions, frame rates, image quality, bit depth, etc. are encoded as a multi-layer video stream. be able to.
図8は、マルチレイヤの映像符号化装置の構成を示すブロック図である。また、図9は、マルチレイヤの映像復号装置の構成を示すブロック図である。 FIG. 8 is a block diagram illustrating a configuration of a multi-layer video encoding apparatus. FIG. 9 is a block diagram illustrating a configuration of a multi-layer video decoding apparatus.
マルチレイヤの映像符号化装置では、レイヤ0(基本レイヤ)の入力映像は、スケーラブル符号化拡張を用いないエンコーダ(レイヤ0エンコーダ)を用いて符号化される。そして、基本レイヤのみの映像ストリームは、スケーラブル符号化拡張を用いないデコーダ(レイヤ0デコーダ)を用いて復号される。マルチレイヤの映像符号化装置では、レイヤ1以上のレイヤ(拡張レイヤ)のエンコーダは、基本レイヤを含む他のレイヤの復号画像を参照して符号化されるように構成される。拡張レイヤのエンコーダは、他のレイヤのエンコーダで生成した復号画像(参照レイヤの復号画像)を用いてレイヤ間予測を行うことで、レイヤ間予測を用いない場合よりもさらに高効率な符号化を行う。各レイヤのエンコーダから出力されたストリームは、多重化(MUX)されてマルチレイヤストリームとしてマルチレイヤの映像符号化装置から出力される。
In a multi-layer video encoding apparatus, an input video of layer 0 (base layer) is encoded using an encoder (
マルチレイヤの復号装置では、マルチレイヤストリームから各レイヤの符号化ストリームがデマルチプレックス(DEMUX)されて、各レイヤのデコーダ(レイヤ0〜レイヤnデコーダ)に入力される。そして、各レイヤのデコーダは、対象レイヤの復号画像を生成し各レイヤの復号映像(レイヤ0〜レイヤn復号映像)として出力する。なお、拡張レイヤ(1以上のレイヤ)のデコーダは、他のレイヤのデコーダで生成した復号画像(参照レイヤの復号画像)を用いて、レイヤ間予測を行って復号処理を行う。
In the multi-layer decoding apparatus, the encoded stream of each layer is demultiplexed (DEMUX) from the multi-layer stream and input to the decoders (
図10は、従来の映像符号化装置における拡張レイヤのエンコーダの構成を示すブロック図である。図10において、例えば、HEVCのような符号化技術を用いる場合、レイヤi入力映像(符号化対象レイヤの画像)がエンコーダに入力される。入力された符号化対象レイヤの画像は、符号化ユニット等の処理単位領域ごとに分割されて差分処理部301に与えられる。処理単位領域ごとに分割された入力画像は、差分処理部301により、動き補償を伴うインター予測部308による予測画像、又は画面内の符号化済み画素等から予測を行うイントラ予測部309による予測画像との差分である予測残差信号が求められる。そして、予測残差信号は、変換量子化部302により、DCT(離散コサイン変換)やDST(離散サイン変換)されて、得られた変換係数が量子化される。エントロピー符号化部103では、量子化された変換係数を、可変長符号や算術符号等のようなエントロピー符号化して符号化ストリームとして出力する。なお、対象レイヤの符号化ストリームは、他のレイヤのストリームと多重化されてマルチレイヤストリームとして出力される。
FIG. 10 is a block diagram showing a configuration of an enhancement layer encoder in a conventional video encoding apparatus. In FIG. 10, for example, when an encoding technique such as HEVC is used, a layer i input video (an image of an encoding target layer) is input to the encoder. The input image of the encoding target layer is divided for each processing unit area such as an encoding unit, and is supplied to the difference processing unit 301. The input image divided for each processing unit region is predicted by the difference processing unit 301 by the
量子化された変換係数は、逆量子化逆変換部304で逆量子化、及び逆変換されて、加算部305で予測画像と加算することによって再構成画像を得る。
The quantized transform coefficient is inversely quantized and inversely transformed by the inverse quantization and inverse transform unit 304 and is added to the predicted image by the
さらに、再構成画像は、ブロック歪を軽減するデブロッキングフィルタなどのループ内フィルタ部306が適用され、復号側で生成される対象レイヤの復号画像(レイヤi復号画像)が得られる。対象レイヤの復号画像は、後続の入力画像の符号化時のインター予測の動き補償のための参照画像として参照画像バッファ307に保持されると共に、他の拡張レイヤでのレイヤ間予測のための参照レイヤ画像として他の拡張レイヤのエンコーダに供給される。
Furthermore, an
HEVCのスケーラブル拡張であるSHVC(Scalable High-efficiency Video Coding)では、参照レイヤからの復号画像(レイヤj復号画像)は、リサンプリング部320において、対象画像の空間解像度、ビット深度にリサンプリングされ、参照画像バッファ307に保持された対象レイヤの参照画像(レイヤi復号画像)と同等に参照画像番号が付与される。そして、拡張レイヤのエンコーダでは、インター予測部308においてインター予測を用いて予測画像を生成することでレイヤ間予測を実現している。なお、基本レイヤのエンコーダは、このレイヤ間予測部分を省いた構成と同等である。
In SHVC (Scalable High-efficiency Video Coding), which is a scalable extension of HEVC, a decoded image (layer j decoded image) from a reference layer is resampled to the spatial resolution and bit depth of the target image in the
図11は、従来の映像復号装置における拡張レイヤのデコーダの構成を示すブロック図である。 FIG. 11 is a block diagram showing a configuration of an enhancement layer decoder in a conventional video decoding apparatus.
映像符号化装置で生成されたマルチレイヤストリームは、デマルチプレックスされて、それぞれのレイヤのストリームが各レイヤのデコーダに入力される。 The multi-layer stream generated by the video encoding device is demultiplexed, and the stream of each layer is input to the decoder of each layer.
入力された対象レイヤの符号化ストリーム(レイヤiストリーム)は、エントロピー復号部403で復号されて、DCT等の変換係数と、符号化モード情報や動きベクトル情報が得られる。得られた変換係数は、逆量子化逆変換部304で逆量子化、及び逆変換された後、加算部405で、インター予測部408若しくはイントラ予測部409で生成された予測画像と加算することによって、符号化側と同じ再構成画像が生成される。
The input encoded stream (layer i stream) of the target layer is decoded by the
さらに、再構成画像は、デブロッキングフィルタなどのループ内フィルタ部406が適用され、対象レイヤの復号画像(レイヤi復号画像)として他の拡張レイヤのデコーダに供給されると共に、後続のインター予測のための参照画像として参照画像バッファ407に保持される。
Further, the
参照レイヤからの復号画像(レイヤj復号画像)は、リサンプリング部420において、対象画像の空間解像度、ビット深度にリサンプリングされ、参照画像バッファ407に保持された対象レイヤの参照画像(レイヤi復号画像)と同等に参照画像番号が付与される。そして、拡張レイヤのエンコーダでは、インター予測部408においてインター予測を用いて予測画像を生成することでレイヤ間予測を実現している。なお、基本レイヤのデコーダは、このレイヤ間予測部分を省いた構成と同等である。
The decoded image (layer j decoded image) from the reference layer is resampled to the spatial resolution and bit depth of the target image by the resampling unit 420 and is stored in the reference image buffer 407 (layer i decoding). A reference image number is assigned in the same manner as (image). In the enhancement layer encoder, inter prediction is realized by generating a prediction image using inter prediction in the
以上、HEVCでは、空間解像度等が異なり得る他のレイヤの復号画像を参照画像として用いて、レイヤ間予測を行うために、空間解像度やビット深度を変換するリサンプリング処理が行われる。 As described above, in HEVC, resampling processing for converting spatial resolution and bit depth is performed in order to perform inter-layer prediction using a decoded image of another layer whose spatial resolution or the like may be different as a reference image.
図12、図13は、HEVCの符号化技術で用いられるリサンプリングフィルタのフィルタ係数を示す説明図である。図12は輝度サンプルのリサンプリングに用いられる8タップのフィル夕係数、図13は色差サンプルのリサンプリングに用いられる4タップのフィルタ係数を示している。 12 and 13 are explanatory diagrams showing filter coefficients of a resampling filter used in HEVC encoding technology. FIG. 12 shows an 8-tap filter coefficient used for resampling luminance samples, and FIG. 13 shows a 4-tap filter coefficient used for resampling color difference samples.
HEVCでは、対象レイヤの画素位置に対応する参照レイヤでの画素の位置が1/16画素精度で算出され、参照レイヤ上での1/16画素精度の水平方向および垂直方向の位相(整数画素位置からのずれ)に従って、フィルタ係数が選択されて、水平方向のフィルタ処理と垂直方向のフィルタ処理を行ってリサンプリング処理が行われる。 In HEVC, the pixel position in the reference layer corresponding to the pixel position of the target layer is calculated with 1/16 pixel accuracy, and the horizontal and vertical phases (integer pixel positions) with 1/16 pixel accuracy on the reference layer are calculated. The filter coefficient is selected according to the deviation from () and the resampling process is performed by performing the horizontal filter process and the vertical filter process.
例えば、輝度フィルタでは、対象画素の参照レイヤ上での1/16画素精度の位置(X,Y)に対して、整数位置(xR,yR)と位相(xP,yP)を用いて、次の(1−1)〜(1−6)式のように参照レイヤの復号画像の画素値配列rから、対象画素の位置のリサンプルされた画素値pを求める。 For example, the luminance filter uses the integer position (xR, yR) and phase (xP, yP) for the position (X, Y) of 1/16 pixel accuracy on the reference layer of the target pixel, and The resampled pixel value p at the position of the target pixel is obtained from the pixel value array r of the decoded image of the reference layer as expressed by equations (1-1) to (1-6).
このように、HEVCではリサンプリング処理で用いるフィルタ係数として、位相ごとに固定の係数値が用いられている。一方、このようなリサンプリング処理のフィルタ係数を適応的なものとする方法として、例えば、特許文献1で挙げる方法が提案されている。
Thus, in HEVC, a fixed coefficient value is used for each phase as a filter coefficient used in the resampling process. On the other hand, as a method for adapting filter coefficients for such resampling processing, for example, a method described in
しかしながら、従来のリサンプリング処理ではリサンプリングのフィルタ処理で用いるフィルタ係数に固定の値を用いているため、符号化対象画像に対して必ずしも最適ではないフィルタ処理が行われていた。 However, since the conventional resampling process uses a fixed value for the filter coefficient used in the resampling filter process, a filter process that is not necessarily optimal for the encoding target image has been performed.
また、これを適応的な係数とする方法については、先述の特許文献1を含め具体的な実現方法が明らかではないという課題があった。
In addition, with regard to a method for making this an adaptive coefficient, there has been a problem that a specific implementation method including
そのため、レイヤ間予測処理(リンサンプリング処理)を伴う映像符号化処理及び映像復号処理を行う際に、画質劣化を低減し、かつ、符号化効率を高めることができる映像符号化装置、プログラム及び方法、並びに、映像復号装置、プログラム及び方法、並びに、映像伝送システムが望まれている。 Therefore, when performing video encoding processing and video decoding processing with inter-layer prediction processing (phosphorus sampling processing), a video encoding device, program, and method that can reduce image quality degradation and increase encoding efficiency In addition, a video decoding device, a program and method, and a video transmission system are desired.
第1の本発明は、複数レイヤの画像を階層符号化する映像符号化装置において、(1)符号化対象レイヤの入力画像を予測した予測画像を、少なくとも、他の参照レイヤの復号画像に対してフィルタ処理を行ったリサンプル画像を参照して、レイヤ間予測により生成する予測手段と、(2)前記符号化対象レイヤの入力画像と、前記参照レイヤの復号画像とを参照して、最適なフィルタ係数セットを決定するフィルタ係数決定手段と、(3)前記フィルタ係数セットを用いて、前記参照レイヤの復号画像に対してフィルタ処理を行うリサンプリング手段と、(4)前記符号化対象レイヤの入力画像と前記予測画像との残差信号を符号化する符号化手段とを有することを特徴とする。 According to a first aspect of the present invention, in a video encoding apparatus that hierarchically encodes images of a plurality of layers, (1) a predicted image obtained by predicting an input image of an encoding target layer is at least a decoded image of another reference layer The resampled image that has been subjected to the filtering process in reference to the prediction unit that generates by inter-layer prediction, and (2) the input image of the encoding target layer and the decoded image of the reference layer Filter coefficient determining means for determining an appropriate filter coefficient set; (3) resampling means for performing filter processing on the decoded image of the reference layer using the filter coefficient set; and (4) the encoding target layer. And encoding means for encoding a residual signal between the input image and the prediction image.
第2の本発明は、階層符号化された符号化データを復号する映像復号装置において、(1)復号対象レイヤの対象画像を予測した予測画像を、少なくとも、他の参照レイヤの復号画像に対してフィルタ処理を行ったリサンプル画像を参照して、レイヤ間予測により生成する予測手段と、(2)階層符号化された符号化データに含まれるフィルタ係数セットを復号する復号手段と、(3)前記復号手段により復号された前記フィルタ係数セットを用いて、前記参照レイヤの復号画像に対してフィルタ処理を行うリサンプリング手段とを有することを特徴とする。 According to a second aspect of the present invention, in a video decoding apparatus for decoding hierarchically encoded data, (1) a predicted image obtained by predicting a target image of a decoding target layer is at least a decoded image of another reference layer (2) decoding means for decoding the filter coefficient set included in the encoded data that has been hierarchically encoded, (3) And resampling means for performing filter processing on the decoded image of the reference layer using the filter coefficient set decoded by the decoding means.
第3の本発明の映像符号化プログラムは、複数レイヤの画像を階層符号化する映像符号化装置に搭載されるコンピュータを、(1)符号化対象レイヤの入力画像を予測した予測画像を、少なくとも、他の参照レイヤの復号画像に対してフィルタ処理を行ったリサンプル画像を参照して、レイヤ間予測により生成する予測手段と、(2)前記符号化対象レイヤの入力画像と、前記参照レイヤの復号画像とを参照して、最適なフィルタ係数セットを決定するフィルタ係数決定手段と、(3)前記フィルタ係数セットを用いて、前記参照レイヤの復号画像に対してフィルタ処理を行うリサンプリング手段と、(4)前記符号化対象レイヤの入力画像と前記予測画像との残差信号を符号化する符号化手段として機能させることを特徴とする。 A video encoding program according to a third aspect of the present invention provides a computer mounted in a video encoding apparatus that hierarchically encodes images of a plurality of layers, (1) a predicted image obtained by predicting an input image of an encoding target layer, at least Prediction means for generating by inter-layer prediction with reference to a resampled image obtained by filtering the decoded image of another reference layer, (2) an input image of the encoding target layer, and the reference layer And (3) resampling means for performing filter processing on the decoded image of the reference layer using the filter coefficient set. And (4) functioning as encoding means for encoding a residual signal between the input image of the encoding target layer and the predicted image.
第4の本発明の映像復号プログラムは、階層符号化された符号化データを復号する映像復号装置に搭載されるコンピュータを、(1)復号対象レイヤの対象画像を予測した予測画像を、少なくとも、他の参照レイヤの復号画像に対してフィルタ処理を行ったリサンプル画像を参照して、レイヤ間予測により生成する予測手段と、(2)階層符号化された符号化データに含まれるフィルタ係数セットを復号する復号手段と、(3)前記復号手段により復号された前記フィルタ係数セットを用いて、前記参照レイヤの復号画像に対してフィルタ処理を行うリサンプリング手段として機能させることを特徴とする。 According to a fourth aspect of the present invention, there is provided a video decoding program comprising: a computer mounted in a video decoding apparatus that decodes hierarchically encoded data; (1) a prediction image obtained by predicting a target image of a decoding target layer; Prediction means for generating by inter-layer prediction with reference to a resampled image obtained by filtering the decoded image of another reference layer, and (2) a filter coefficient set included in hierarchically encoded data And (3) using the filter coefficient set decoded by the decoding means as a resampling means for performing a filtering process on the decoded image of the reference layer.
第5の本発明は、複数レイヤの画像を階層符号化する映像符号化装置が行う映像符号化方法において、予測手段、フィルタ係数決定手段、リサンプリング手段、及び符号化手段を備え、(1)前記予測手段は、符号化対象レイヤの入力画像を予測した予測画像を、少なくとも、他の参照レイヤの復号画像に対してフィルタ処理を行ったリサンプル画像を参照して、レイヤ間予測により生成し、(2)前記フィルタ係数決定手段は、前記符号化対象レイヤの入力画像と、前記参照レイヤの復号画像とを参照して、最適なフィルタ係数セットを決定し、(3)前記リサンプリング手段は、前記フィルタ係数セットを用いて、前記参照レイヤの復号画像に対してフィルタ処理を行い、(4)前記符号化手段は、前記符号化対象レイヤの入力画像と前記予測画像との残差信号を符号化することを特徴とする。 According to a fifth aspect of the present invention, there is provided a video encoding method performed by a video encoding apparatus that hierarchically encodes images of a plurality of layers, comprising: prediction means, filter coefficient determination means, resampling means, and encoding means; (1) The prediction means generates a prediction image obtained by predicting an input image of the encoding target layer by inter-layer prediction with reference to at least a resampled image obtained by performing filtering on a decoded image of another reference layer. (2) The filter coefficient determining means determines an optimum filter coefficient set with reference to the input image of the encoding target layer and the decoded image of the reference layer, and (3) the resampling means And (4) the encoding unit performs a filtering process on the decoded image of the reference layer using the filter coefficient set; Wherein the encoding the residual signal between the prediction image.
第6の本発明は、階層符号化された符号化データを復号する映像復号装置が行う映像復号方法において、予測手段、復号手段、及びリサンプリング手段を備え、(1)前記予測手段は、復号対象レイヤの対象画像を予測した予測画像を、少なくとも、他の参照レイヤの復号画像に対してフィルタ処理を行ったリサンプル画像を参照して、レイヤ間予測により生成し、(2)前記復号手段は、階層符号化された符号化データに含まれるフィルタ係数セットを復号し、(3)前記リサンプリング手段は、前記復号手段により復号された前記フィルタ係数セットを用いて、前記参照レイヤの復号画像に対してフィルタ処理を行うことを特徴とする。 According to a sixth aspect of the present invention, in the video decoding method performed by the video decoding apparatus for decoding the hierarchically encoded data, the video decoding device includes a prediction unit, a decoding unit, and a resampling unit. (1) A prediction image obtained by predicting a target image of the target layer is generated by inter-layer prediction with reference to at least a resampled image obtained by performing filtering on a decoded image of another reference layer; (2) the decoding unit (3) The resampling means uses the filter coefficient set decoded by the decoding means to decode the decoded image of the reference layer. A filtering process is performed on.
第7の本発明の映像伝送システムは、複数レイヤの画像を階層符号化する映像符号化装置と、前記映像符号化装置により階層符号化された符号化データを復号する映像復号装置とを備える映像伝送システムにおいて、前記映像符号化装置として第1の本発明の映像符号化装置を適用し、前記映像復号装置として第2の本発明の映像復号装置を適用したことを特徴とする。 A video transmission system according to a seventh aspect of the present invention is a video comprising: a video encoding device that hierarchically encodes images of a plurality of layers; and a video decoding device that decodes encoded data hierarchically encoded by the video encoding device. In the transmission system, the video encoding device of the first invention is applied as the video encoding device, and the video decoding device of the second invention is applied as the video decoding device.
本発明によれば、レイヤ間予測処理(リンサンプリング処理)を伴う映像符号化処理及び映像復号処理を行う際に、画質劣化を低減し、かつ、符号化効率を高めることができる。 ADVANTAGE OF THE INVENTION According to this invention, when performing the video encoding process and video decoding process accompanying an inter-layer prediction process (phosphorus sampling process), image quality degradation can be reduced and encoding efficiency can be improved.
(A)主たる実施形態
以下、本発明による映像符号化装置、プログラム及び方法、並びに、映像復号装置、プログラム及び方法、並びに、映像伝送システムの実施形態を、図面を参照しながら詳述する。
(A) Main Embodiments Hereinafter, embodiments of a video encoding device, a program and a method, a video decoding device, a program and a method, and a video transmission system according to the present invention will be described in detail with reference to the drawings.
(A−1)実施形態の構成
(A−1−1)全体構成
図3は、この実施形態の映像伝送システム1の全体構成を示すブロック図である。
(A-1) Configuration of Embodiment (A-1-1) Overall Configuration FIG. 3 is a block diagram showing the overall configuration of the
図3に示す映像伝送システム1では、符号化対象映像(入力映像)を構成する符号化対象画像(入力画像)を階層(レイヤ)毎に符号化して、レイヤ毎の符号化ストリームを多重化したマルチレイヤストリームを出力する映像符号化装置10と、マルチレイヤストリームを複数のレイヤ毎の符号化ストリームに戻し、レイヤ毎の符号化ストリームを復号して、復号映像を構成する復号画像を得る映像復号装置20が配置されている。
In the
この実施形態では、映像符号化装置10は、階層的符号化と呼ばれる符号化方式を採用し、基本レイヤのエンコーダと、1又は2以上の拡張レイヤのエンコーダとから構成される。また、映像復号装置20も、同様に、基本レイヤのデコーダと、1又は2以上の拡張レイヤのデコーダとから構成される。
In this embodiment, the
映像伝送システム1では、映像符号化装置10と映像復号装置20との間の接続構成については限定されないものであり、例えば、ネットワークを介して通信により伝送するようにしてもよいし、オフラインでデータ供給(例えば、DVDやHDD等のデータ記録媒体で供給)するようにしてもよい。また、映像符号化装置10で符号化したマルチレイヤストリームの内、映像復号装置20が要求する映像品質(映像表現)となるレイヤまでが復号可能となる一部レイヤのストリームのみが伝送されるようにしてもよい。
In the
(A−1−2)映像符号化装置(拡張レイヤのエンコーダ)の詳細な構成
図1は、映像符号化装置における拡張レイヤのエンコーダの構成を示すブロック図である。この実施形態の拡張レイヤのエンコーダは、図1に示す各構成部を搭載した専用のICチップ等のハードウェアとして構成しても良いし、又は、CPUと、CPUが実行するプログラムを中心としてソフトウェア的に構成して良いが、機能的には、図1で表すことができる。
(A-1-2) Detailed Configuration of Video Encoding Device (Enhancement Layer Encoder) FIG. 1 is a block diagram showing a configuration of an enhancement layer encoder in the video encoding device. The enhancement layer encoder of this embodiment may be configured as hardware such as a dedicated IC chip on which the components shown in FIG. 1 are mounted, or may be software centered on a CPU and a program executed by the CPU. Although functionally configured, it can be functionally represented in FIG.
図1において、拡張レイヤのエンコーダ100は、差分処理部101、変換量子化部102、エントロピー符号化部103、逆量子化逆変換部104、加算部105、ループ内フィルタ部106、参照画像バッファ107、インター予測部108、イントラ予測部109、切り替え部110、リサンプリング部120、フィルタ係数記憶部130、及びフィルタ係数決定部131を有する。
In FIG. 1, an
拡張レイヤのエンコーダ100は、レイヤiに入力された映像(レイヤi入力映像)を所定の符号化方式で符号化して、レイヤiの符号化ストリーム(レイヤiストリーム)を出力するものである。また、拡張レイヤのエンコーダ100は、従来技術の映像符号化装置の拡張レイヤのエンコーダ(先述の図10のエンコーダ)と同様に、入力された符号化対象レイヤの画像(レイヤiの入力画像)を、符号化ユニット等の所定の単位(例えば、所定のサイズのブロック)の領域(以下、「処理単位領域」と呼ぶ)ごとに処理を行う。この実施形態ではレイヤiの入力画像がそれぞれ個別に入力されているように説明するが、これらは、もともとの入力画像から、ダウンサンプル等の画像処理により各レイヤに応じた画像表現がレイヤiの入力画像として生成されるように構成可能である。
The
この実施形態では、符号化方式がH.265/MPEG−H HEVCの規格化技術等を基調として拡張した符号化方式である場合を例示するが、これに限らず、類似する種々様々な符号化方式にも適用可能である。 In this embodiment, the encoding method is H.264. The case where the encoding method is expanded based on the standardization technology of H.265 / MPEG-H HEVC and the like is illustrated, but the present invention is not limited to this, and the present invention can be applied to various similar encoding methods.
差分処理部101は、予測残差信号を求めるために、所定の処理単位領域ごとの入力画像と、インター予測部108若しくはイントラ予測部109からの、上記処理単位領域に対応する予測画像との差分を求め、その差分を予測残差信号として変換量子化部102に与えるものである。
The difference processing unit 101 calculates a difference between an input image for each predetermined processing unit region and a predicted image corresponding to the processing unit region from the
変換量子化部102は、入力された予測残差信号を、DCT(離散コサイン変換)やDST(離散サイン変換)等によって変換係数に変換し、得られた変換係数に対して量子化を行うものである。
The
エントロピー符号化部103は、符号の出現確率の偏りを圧縮するために、変換量子化部102からの量子化された変換係数等(符号化モード情報、動きベクトル情報等を含む)をエントロピー符号化して、当該レイヤの符号ストリームとして出力するものである。なお、後述するフィルタ係数決定部131で決定したフィルタ係数(フィルタ係数記憶部130に記憶したフィルタ係数)も、量子化された変換係数等と同様にエントロピー符号化されてマルチレイヤストリームに多重化される。
The
エントロピー符号化部103から出力される符号化ストリーム(レイヤiストリーム)は、他のレイヤの符号化ストリームと多重化されて、映像符号化装置10の符号化処理結果であるマルチレイヤストリームとして出力される。また、フィルタ係数決定部131で決定したフィルタ係数(フィルタ係数記憶部130に記憶したフィルタ係数)も、符号化されて符号化結果のマルチレイヤストリームに多重化して出力される。
The encoded stream (layer i stream) output from the
逆量子化逆変換部104は、符号化信号から残差信号(残差画像)を復元するために、変換量子化部102からの量子化された変換係数を逆量子化及び逆変換して、加算部112に与えるものである。
The inverse quantization
加算部105は、逆量子化逆変換部104からの復元された残差信号に、切り替え部110を介してインター予測部108又はイントラ予測部109からの予測画像を加算して、再構成画像を求めるものである。加算部112は、再構成画像を、ループ内フィルタ部106及びイントラ予測部109に与える。
The adding
ループ内フィルタ部106は、符号化ループ内の量子化処理によって生じる符号化歪み(例えばブロック歪、リンギング歪等)を低減するために、加算部105からの再構成画像を復号画像としてフィルタリングするものである。この実施形態はHEVC等を適用する場合を例示しており、デブロッキングフィルタ等を用いて符号化歪みを低減する。ループ内フィルタ部106から出力される復号画像(レイヤi復号画像)は、インター予測部108での動き補償等のための参照画像として参照画像バッファ107に保持されると共に、他の拡張レイヤのエンコーダに供給される。
The in-loop filter unit 106 filters the reconstructed image from the
参照画像バッファ107は、ループ内フィルタ部106から出力される画像を、参照画像として保持するものである。ループ内フィルタ部106からの出力画像が、後続の入力画像の符号化時のインター予測の動き補償のための参照画像となる。
The
インター予測部108は、参照画像バッファ107に保持されている画像を参照して、インター予測を行うものである。
The
また、インター予測部108は、参照画像バッファ107に保持されている画像と共に、リサンプリング部120によってリサンプリングされた参照レイヤの復号画像を参照してインター予測(レイヤ間予測)を行うものでもある。レイヤ間予測は、他のレイヤの同時刻の画像(リサンプリングされた参照レイヤの復号画像)を予測画像として参照できるため、より符号化効率を改善することができる。変形例として、インター予測部108は、リサンプリング部120によってリサンプリングされた参照レイヤの復号画像のみを参照してインター予測(レイヤ間予測)を行っても良い。
The
イントラ予測部109は、加算部105から出力される画像(符号化済みの再構成画素等)を用いてイントラ予測を行うものである。
The
切り替え部110は、符号化モード(インター予測モード若しくはレイヤ間予測モード、又はイントラ予測モード)に応じて、インター予測部108又はイントラ予測部109の出力(予測画像)を切り替えるものである。
The
フィルタ係数決定部131は、リサンプリング部120で用いるフィルタ係数群(以下、「フィルタ係数セット」と呼ぶ)を決定する。フィルタ係数決定部131の詳細については動作の項で述べる。フィルタ係数セットは、複数のフィルタ係数により構成されている。
The filter
フィルタ係数記憶部130は、フィルタ係数決定部131で決定されたフィルタ係数セットを記憶するものである。
The filter
リサンプリング部120は、フィルタ係数記憶部130に記憶されたフィルタ係数セットを用いて、参照レイヤの復号画像(レイヤj復号画像)をリサンプリング(フィルター処理)するものである。リサンプリング部120の詳細については動作の項で述べる。
The
ここで、この実施形態の拡張レイヤのエンコーダ100と、先述の図10で説明した従来の拡張レイヤのエンコーダとの違いついて簡単に述べる。拡張レイヤのエンコーダ100のリサンプリング部120では、固定のフィルタ係数では無く、適宜決定したフィルタ係数セットを用いて、リサンプリング処理を行う点が従来のリサンプリング処理と異なる。また、このリサンプリング処理で用いるフィルタ係数セットを決定するフィルタ係数決定部131とフィルタ係数記憶部130を設けた点が従来の拡張レイヤのエンコーダと異なる。そして、フィルタ係数決定部131で決定したフィルタ係数セットはエントロピー符号化部103で符号化され、符号化結果のマルチレイヤストリームに多重化して出力される点が従来の拡張レイヤのエンコーダと異なる。
Here, the difference between the
映像符号化装置10に適用される基本レイヤのエンコーダ150は、従来技術と同様に拡張レイヤのエンコーダ100からレイヤ間予測処理に関わる構成要素を省略したものと同等である。
The
(A−1−3)映像復号装置(拡張レイヤのデコーダ)の詳細な構成
図2は、実施形態の映像復号装置における拡張レイヤのデコーダの構成を示すブロック図である。この実施形態の拡張レイヤのデコーダは、図2に示す各構成部を搭載した専用のICチップ等のハードウェアとして構成しても良いし、又は、CPUと、CPUが実行するプログラムを中心としてソフトウェア的に構成して良いが、機能的には、図2で表すことができる。
(A-1-3) Detailed Configuration of Video Decoding Device (Enhancement Layer Decoder) FIG. 2 is a block diagram illustrating a configuration of an enhancement layer decoder in the video decoding device of the embodiment. The enhancement layer decoder of this embodiment may be configured as hardware such as a dedicated IC chip on which the components shown in FIG. 2 are mounted, or software centered on a CPU and a program executed by the CPU. Although it may be configured in terms of function, it can be functionally represented in FIG.
図2において、拡張レイヤのデコーダ200は、エントロピー復号部203、逆量子化逆変換部204、加算部205、ループ内フィルタ部206、参照画像バッファ207、インター予測部208、イントラ予測部209、切り替え部210、リサンプリング部220、及びフィルタ係数記憶部230を有する。
In FIG. 2, the
拡張レイヤのデコーダ200は、拡張レイヤのエンコーダ100で符号化された拡張レイヤの符号化ストリームを、デコード(復号)処理を行って、拡張レイヤの復号画像を得るものである。なお、拡張レイヤのデコーダ200には、映像復号装置20に入力されたマルチレイヤストリームをデマルチプレックスしたレイヤごとの符号化ストリーム(レイヤiストリーム)が入力される。
The
エントロピー復号部203は、入力された符号化ストリームをエントロピー復号して復号データを取得する。復号データには、量子化された変換係数(予測残差信号がDCT等により変換され、さらに量子化されたデータ)が含まれている。また、符号化ストリームには、上述の通り、その他の付加情報が含まれている。付加情報には、符号化モード情報、動きベクトル情報、及びリサンプリング処理に用いるフィルタ係数セット(拡張レイヤのエンコーダ100のフィルタ係数決定部131で決定されたフィルタ係数セット)等が含まれるものとする。エントロピー復号部203は、復号により得た、量子化された変換係数を逆量子化逆変換部204に供給し、リサンプリング処理で用いるフィルタ係数セットをフィルタ係数記憶部230に供給する。
The
逆量子化逆変換部204は、符号化信号から残差信号(残差画像)を復元するために、エントロピー復号部203からの量子化された変換係数を逆量子化及び逆変換して、加算部205に与えるものである。
The inverse quantization
加算部205は、逆量子化逆変換部204からの復元された残差信号に、切り替え部210を介してインター予測部208又はイントラ予測部209からの予測画像を加算して、再構成画像を求めるものである。加算部205は、再構成画像を、ループ内フィルタ部206及びイントラ予測部209に与える。
The adding
ループ内フィルタ部206は、符号化ループ内の量子化処理によって生じる符号化歪み(例えばブロック歪、リンギング歪等)を低減するために、加算部205からの再構成画像を復号画像としてフィルタリングするものである。この実施形態はHEVC等を適用する場合を例示しており、デブロッキングフィルタ等を用いて符号化歪みを低減する。ループ内フィルタ部206から復号結果として出力される復号画像(レイヤi復号画像)は、インター予測部208での動き補償等のための参照画像として参照画像バッファ207に保持されると共に、他の拡張レイヤのデコーダに供給される。この実施形態では、それぞれのレイヤi復号画像がすべて復号結果として出力されるように説明するが、これらの内、復号処理として要求されている画像品質(画像表現)のレイヤの復号画像のみが映像復号装置20の復号結果として出力されるように構成してもよい。
The in-
参照画像バッファ207は、ループ内フィルタ部206から出力される画像を、参照画像として保持するものである。
The reference image buffer 207 holds the image output from the in-
インター予測部208は、参照画像バッファ207に保持されている画像と、リサンプリング部220によってリサンプリングされた参照レイヤの復号画像を参照してインター予測を行うものである。
The
イントラ予測部209は、加算部205から出力される画像(画面内の再構成画素等)を用いてイントラ予測を行うものである。
The
切り替え部210は、エントロピー復号部203により符号化ストリームから復元された符号化モード情報に応じて、インター予測部208又はイントラ予測部209の出力(予測画像)を切り替えるものである。
The
フィルタ係数記憶部230は、エントロピー復号部203から供給されたフィルタ係数セットを記憶するものである。
The filter
リサンプリング部220は、フィルタ係数記憶部230に記憶されたフィルタ係数セットを用いて、参照レイヤの復号画像(レイヤj復号画像)をリサンプリングするものである。
The
ここで、この実施形態の拡張レイヤのデコーダ200と、先述の図11で説明した従来の拡張レイヤのデコーダとの違いついて簡単に述べる。拡張レイヤのデコーダ200のリサンプリング部220では、固定のフィルタ係数では無く、映像符号化装置10からのストリームをエントロピー復号部203で復号して得られたフィルタ係数セットを用いて、リサンプリング部220でリサンプリング処理を行う点が従来のリサンプリング処理と異なる。また、このリサンプリング処理で用いるエントロピー復号部203で復号して得られたフィルタ係数セットを記憶するフィルタ係数記憶部230を設けた点が従来の拡張レイヤのデコーダと異なる。
Here, the difference between the
(A−2)実施形態の動作
次に、以上のような構成を有するこの実施形態における映像伝送システム1の動作(実施形態の映像符号化方法、および映像復号方法)を説明する。
(A-2) Operation of Embodiment Next, the operation (video encoding method and video decoding method of the embodiment) of the
以下では、本実施形態の特徴部分である拡張レイヤのエンコーダ100(拡張レイヤのデコーダ200)のリサンプリングに関わる処理(リサンプリング処理及びフィルタ係数決定処理)を中心に説明する。 The following description focuses on processing related to resampling (resampling processing and filter coefficient determination processing) of the enhancement layer encoder 100 (enhancement layer decoder 200), which is a characteristic part of the present embodiment.
(A−2−1)リサンプリング処理
上述の通り、リサンプリング部120(リサンプリング部220)では、フィルタ処理に用いるフィルタ係数を固定値ではなく可変値(拡張レイヤのエンコーダ100のフィルタ係数決定部131で決定したフィルタ係数セット)としている。
(A-2-1) Resampling Process As described above, in the resampling unit 120 (resampling unit 220), the filter coefficient used for the filter process is not a fixed value but a variable value (a filter coefficient determination unit of the enhancement layer encoder 100). The filter coefficient set determined in 131).
すなわち、リサンプリング部120(リサンプリング部220)は、フィルタ係数記憶部130(フィルタ係数記憶部230)に保持しているフィルタ係数セットを用いて、対象レイヤ上の画素位置に対応する参照レイヤ上での1/16画素精度の対象画素の位置(X,Y)に対して、整数位置(xR,yR)と整数位置からのずれである位相(xP,yP)を用いて、例えば、以下の(2−1)〜(2−6)式のように参照レイヤの復号画像(図1及び図2の例では、レイヤj復号画像)の画素値配列rから、対象画素の位置のリサンプルされた画素値pを求める。 In other words, the resampling unit 120 (resampling unit 220) uses the filter coefficient set stored in the filter coefficient storage unit 130 (filter coefficient storage unit 230) to perform the processing on the reference layer corresponding to the pixel position on the target layer. For example, using the phase (xP, yP) that is a deviation from the integer position (xR, yR) and the integer position with respect to the position (X, Y) of the target pixel with 1/16 pixel accuracy at As in equations (2-1) to (2-6), the position of the target pixel is resampled from the pixel value array r of the reference layer decoded image (layer j decoded image in the examples of FIGS. 1 and 2). The obtained pixel value p is obtained.
フィルタタップ数Nは、例えば輝度成分(輝度フィルタ)に対しては8、色差成分(色差フィルタ)に対しては4とするなど色成分ごとに異なる値を用いても良い。また、フィルタタップ数Nは上位シンタックスで指定可能としても良い。 The filter tap number N may be a different value for each color component, for example, 8 for a luminance component (luminance filter) and 4 for a color difference component (color difference filter). In addition, the number of filter taps N may be specified with the upper syntax.
上記の(2−1)〜(2−6)式では、b及びdのような定数項を所持する式となっている。なお、b及びdは、使用するプロファイル等によって使用しないよう制限(b=0,d=0)しても良い。また、水平方向で用いるフィルタ係数a、bと垂直方向で用いるフィルタ係数c、dを独立に設定可能としているが、同じ係数を用いるよう制限(a=c,b=d)しても良い。これらの制限により符号化すべきフィルタ係数の個数は削減可能である。 The above equations (2-1) to (2-6) are equations having constant terms such as b and d. It should be noted that b and d may be restricted (b = 0, d = 0) from being used depending on the profile used. Further, the filter coefficients a and b used in the horizontal direction and the filter coefficients c and d used in the vertical direction can be set independently. However, the same coefficient may be used (a = c, b = d). Due to these limitations, the number of filter coefficients to be encoded can be reduced.
映像符号化装置10(拡張レイヤのエンコーダ100)では、フィルタ係数決定部131で、リサンプリングのための最適なフィルタ係数セットの設計を行い、得られたフィルタ係数をリサンプリング部120で用いるフィルタ係数セットとしてフィルタ係数記憶部130に格納すると共に、エントロピー符号化部103で種々の符号化方法に従って符号化ストリームに多重化する。
In the video encoding device 10 (enhancement layer encoder 100), the filter
映像復号装置20(拡張レイヤのデコーダ200)では、エントロピー復号部203で、符号化ストリームに多重化されたリサンプリング処理で用いるフィルタ係数セットを復号し、リサンプリング部220で用いるフィルタ係数セットとしてフィルタ係数記憶部230に格納する。
In the video decoding device 20 (enhancement layer decoder 200), the
エントロピー符号化部103における、フィルタ係数セットの多重化方法としては、例えば、スライスヘッダやピクチャパラメーターセット等のパラメータセットのような上位シンタックスで符号化するようにしてもよい。
As a multiplexing method of the filter coefficient set in the
例えば、図12、図13で示したような既定のフィルタ係数を予め定めておき、エントロピー符号化部103は、既定のフィルタ係数からの変更がない場合は変更なしを表すフラグのみを上位シンタックス等でシグナリングする。なお、シグナリングとは、所望の情報を受信側(復号側)が取得できるように、伝達信号(符号化ストリーム)内に当該所望の情報を特定するための信号、又は、当該情報そのものを示す信号を含めることを意味する。
For example, predetermined filter coefficients as shown in FIGS. 12 and 13 are determined in advance, and the
また、変更がある場合には、エントロピー符号化部103は、位相ごとにフラグを設け、既定のフィルタ係数と異なるフィルタ係数を含む位相を示すフラグをシグナリングする。これにより、例えば、空間解像度を2×2倍に拡大するようなリサンプリングの場合には、位相としては0と8のフィルタのみが使用されるようなときが存在するが、エントロピー符号化部103は、これら特定の位相のフィルタ係数のみを効率的に符号化することができる。さらに、エントロピー符号化部103は、フィルタ係数の値も対応する既定のフィルタ係数の値と、変更後のフィルタ係数の値の差分値を符号化するように構成することにより、フィルタ係数値の符号化に必要となる符号量を削減するように構成しても良い。
When there is a change, the
映像復号装置20(拡張レイヤのデコーダ200)では、エントロピー復号部203は、上記のようにシグナリングされたフィルタ係数セットを復号する。また、既定のフィルタ係数の使用が指示された位相については、例えば、先述の図12、図13のような予め定められた既定のフィルタ係数と合せて、フィルタ係数記憶部230に記憶(格納)する。そして、リサンプリング部220では、フィルタ係数記憶部230に記憶されたフィルタ係数セットを用いて、上記の(2−1)〜(2−6)式に基づくリサンプリング処理を行うことで、対象レイヤの復号処理を行うことができる。
In the video decoding device 20 (enhancement layer decoder 200), the
(A−2−2)リサンプリング処理に用いる最適なフィルタ係数セットの設計(選択)について
次に、拡張レイヤのエンコーダ100のフィルタ係数決定部131におけるフィルタ係数セットの設計処理について説明する。
(A-2-2) Design (Selection) of Optimal Filter Coefficient Set Used for Resampling Process Next, the filter coefficient set design process in the filter
参照レイヤの復号画像をr、符号化対象レイヤの入力画像をqとして、フィルタ係数セット(フィルタ係数a〜d)によるリサンプル画像をpとすると、リサンプル画像pは、先述の(2−1)〜(2−6)式により求まる値である。これと、入力画像qの誤差が最少となるようなフィルタ係数a〜dを、フィルタ係数決定部131で設計する。
Assuming that the decoded image of the reference layer is r, the input image of the encoding target layer is q, and the resampled image by the filter coefficient set (filter coefficients a to d) is p, the resampled image p is (2-1) described above. ) To (2-6). The filter
例えば、フィルタ係数決定部131は、次の(3)式に示すような、リサンプル画像pと入力画像qの誤差の二乗和Eを、最小化するフィルタ係数a〜dを、最小二乗法を用いて求める。
For example, the filter
また、フィルタ係数決定部131は、例えば、図5に示すように符号化対象画像の画面全体に対して、レイヤ間予測を用いて符号化する領域(レイヤ間予測領域)が一部である場合には、図4に示すような手順でフィルタ係数を決定しても良い。
In addition, for example, when the filter
図4は、拡張レイヤのエンコーダ100において、リサンプリング処理で用いるフィルタ係数の決定処理を示すフローチャートである。
FIG. 4 is a flowchart showing determination processing of filter coefficients used in resampling processing in the
フィルタ係数決定部131は、既定のフィルタ係数(例えば、図12、図13で示したフィルタ係数)を用いて、参照レイヤの復号画像に対して、リサンプリング処理を行い、一旦仮のレイヤ間参照画像を作成する。そして、拡張レイヤのエンコーダ100は、このレイヤ間参照画像と、参照画像バッファの対象レイヤの参照画像とを用いて、各処理単位領域の符号化モード(イントラ予測、インター予測、レイヤ間予測)や参照される参照画像を選択する(S11)。
The filter
フィルタ係数決定部131は、符号化対象画像の内、レイヤ間予測が選択された領域(例えば、図5のレイヤ間予測領域)を抽出する(S12)。
The filter
フィルタ係数決定部131は、レイヤ間予測が選択された領域についてのみ、先述の(3)式により求まる誤差の二乗和Eを最小化するようなフィルタ係数a〜dを求める(S13)。すなわち誤差の二乗和Eを、レイヤ間予測が選択された領域の画素位置に限定して和を求めた式に基づいてフィルタ係数を求める。算出されたフィルタ係数a〜dは、フィルタ係数記憶部130に記憶される。
The filter
その後、リサンプリング部120では、フィルタ係数決定部131で決定されたフィルタ係数(フィルタ係数記憶部130に記憶されたフィルタ係数)を用いて、フィルタ処理が実行される(S14)。
Thereafter, in the
なお、先述のステップS11において、既定のフィルタ係数を用いたリサンプリング処理による仮のレイヤ間参照画像を用いる場合を説明したが、フィルタ係数決定部131は、画面全体の画素を用いて一旦フィルタ係数を設計し、このフィルタ係数を用いてリサンプリング処理を行って仮のレイヤ間参照画像を作成するよう構成しても良い。
In the above-described step S11, the case where the temporary inter-layer reference image using the re-sampling process using the predetermined filter coefficient has been described. However, the filter
次に、フィルタ設計のための最小二乗法の詳細について説明を行う。 Next, details of the least square method for filter design will be described.
先述の(3)式のような誤差の二乗和Eを最小化するフィルタ係数a〜dを求める場合、フィルタ係数決定部131は、誤差の二乗和Eを、a〜dで偏微分した式が0となるようなフィルタ係数a〜dを、例えば、次の(4)式のような連立方程式を解くことによって求める。
When obtaining the filter coefficients a to d that minimize the square sum E of the error as in the above-described equation (3), the filter
図6は、フィルタ係数決定部において、線形方程式の解法のみを用いてフィルタ係数を近似的に求める一例を示すフローチャートである。 FIG. 6 is a flowchart illustrating an example in which the filter coefficient determination unit approximately obtains the filter coefficient using only the solution of the linear equation.
フィルタ係数決定部131は、先述の(3)式のc、dが既定のフィルタ係数と同じ値であると仮定して、c、dに既定のフィルタ係数値を代入する。そして、フィルタ係数決定部131は、代入した(3)式の誤差の二乗和Eを、最小化するようなフィルタ係数a、bを求める(S21)。フィルタ係数決定部131は、c、dを定数とみなせば、(3)式のEのa、bによる偏微分(4−1)、(4−2)式は、a、bに関する1次式となり、簡単な線形方程式の解法を用いてa、bを求めることができる。
The filter
フィルタ係数決定部131は、先述のステップS21で求めたa、bを、定数とみなして代入した(3)式のEを、最小化するような係数c、dを(4−3)、(4−4)式より求める(S22)。フィルタ係数決定部131は、先述のステップS21と同様に線形方程式の解法で処理可能である。
The filter
なお、フィルタ係数決定部131は、ステップS21において係数c、dを先に求め、その後、ステップS22において係数a、bを決定しても良い。
Note that the filter
また、例えば、水平方向と垂直方向で同じフィルタ係数を用いる制約(a=c、b=d)を設ける場合には、フィルタ係数決定部131は、一方のフィルタ係数を定数と仮定して他方のフィルタ係数を求める処理を繰り返すことによってフィルタ係数を求める処理(図7)を行っても良い。
Also, for example, in the case of providing a constraint (a = c, b = d) that uses the same filter coefficient in the horizontal direction and the vertical direction, the filter
フィルタ係数決定部131は、フィルタ係数c、dを既定のフィルタ係数で初期化する(S31)。
The filter
フィルタ係数決定部131は、フィルタ係数c、dを定数とみなして、先述の(3)式の誤差の二乗和Eを、最小化するようなフィルタ係数a、bの決定処理を行う(S32)。
The filter
フィルタ係数決定部131は、先述のステップS32で求めた係数a、bを定数とみなして、同様に(3)式の誤差の二乗和Eを、最小化するような係数c、dの決定処理を行う(S33)。
The filter
フィルタ係数決定部131は、求めたフィルタ係数c、dを利用するか否か判断し、利用しない場合にはステップS32から再度決定処理を行う(S34)。一方、フィルタ係数決定部131は、求めたフィルタ係数c、dを利用する場合(係数値が収束したと判断した場合)には、決定処理の打ち切りを行う。
The filter
以上のように、フィルタ係数決定部131は、レイヤ間予測領域に対して最適設計したフィルタ係数セットを求め、リサンプリング部120(フィルタ係数記憶部130)及び映像復号装置20側に供給する。
As described above, the filter
(A−3)実施形態の効果
この実施形態によれば、以下のような効果を奏することができる。
(A-3) Effects of Embodiment According to this embodiment, the following effects can be achieved.
この実施形態では、拡張レイヤのエンコーダ100のリサンプリング部120、及び拡張レイヤのデコーダ200のリサンプリング部220で用いるフィルタ係数セットを、適切なものに設定可能(フィルタ係数セットを任意に変更可能)とした。これにより、この実施形態の映像符号化装置10(拡張レイヤのエンコーダ100)では、符号化対象の画像の性質に応じた最適なフィルタ処理を施すことが可能となり、画質劣化が低減できるとともに、より符号化効率の高い符号化ストリームを生成することができる。
In this embodiment, filter coefficient sets used in the
また、フィルタ係数決定部131は、既定のリサンプリングフィルタ係数と異なるフィルタ係数のみを符号化するように構成したので、フィルタ係数の符号化に要する符号量を削減することができる。
Further, since the filter
さらに、拡張レイヤのエンコーダ100(拡張レイヤのデコーダ200)は、位相0のフィルタ係数も指定可能としているので、空間解像度変換を伴わないようなレイヤ間参照(参照レイヤと対象レイヤが同じ空間解像度)の場合や、ステレオ3D画像符号化のような、多視点符号化拡張を用いる符号化の場合の視点間参照予測(ビュー間予測)の場合に、リサンプリング部120(リサンプリング部220)を、参照レイヤからの参照画像に対する画質改善フィルタとして機能させることも可能である。
Furthermore, since the enhancement layer encoder 100 (enhancement layer decoder 200) can also specify a filter coefficient of
(B)他の実施形態
本発明は、上記実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(B) Other Embodiments The present invention is not limited to the above-described embodiments, and may include modified embodiments as exemplified below.
上記の実施形態では、本発明を映像伝送システム(映像符号化装置及び映像復号装置)に適用する例について説明したが、その他のさまざまな符号化処理に利用可能である。例えば、上記の実施形態のリンサンプリング処理以外の符号化に関わる予測処理や変換量子化処理については、上記の実施形態で説明したような構成に限定されるものではなく、様々な符号化ツールを組み合わせたような符号化処理にも利用可能である。 In the above embodiment, an example in which the present invention is applied to a video transmission system (video encoding device and video decoding device) has been described. However, the present invention can be used for various other encoding processes. For example, the prediction process and transform quantization process related to encoding other than the phosphorus sampling process of the above embodiment are not limited to the configuration described in the above embodiment, and various encoding tools can be used. The present invention can also be used for a combination of encoding processes.
1…映像伝送システム、10…映像符号化装置、20…映像復号装置、100…拡張レイヤのエンコーダ、101…差分処理部、102…変換量子化部、103…エントロピー符号化部、104…逆量子化逆変換部、105…加算部、106…ループ内フィルタ部、107…参照画像バッファ、108…インター予測部、109…イントラ予測部、110…切り替え部、112…加算部、120…リサンプリング部、130…フィルタ係数記憶部、131…フィルタ係数決定部、200…拡張レイヤのデコーダ、203…エントロピー復号部、204…逆量子化逆変換部、205…加算部、206…ループ内フィルタ部、207…参照画像バッファ、208…インター予測部、209…イントラ予測部、210…切り替え部、220…リサンプリング部、230…フィルタ係数記憶部。
DESCRIPTION OF
Claims (16)
符号化対象レイヤの入力画像を予測した予測画像を、少なくとも、他の参照レイヤの復号画像に対してフィルタ処理を行ったリサンプル画像を参照して、レイヤ間予測により生成する予測手段と、
前記符号化対象レイヤの入力画像と、前記参照レイヤの復号画像とを参照して、最適なフィルタ係数セットを決定するフィルタ係数決定手段と、
前記フィルタ係数セットを用いて、前記参照レイヤの復号画像に対してフィルタ処理を行うリサンプリング手段と、
前記符号化対象レイヤの入力画像と前記予測画像との残差信号を符号化する符号化手段と
を有することを特徴とする映像符号化装置。 In a video encoding device that hierarchically encodes images of a plurality of layers,
A prediction unit that generates a prediction image obtained by predicting an input image of an encoding target layer by performing inter-layer prediction with reference to at least a resampled image obtained by performing filtering on a decoded image of another reference layer;
Filter coefficient determining means for determining an optimum filter coefficient set with reference to the input image of the encoding target layer and the decoded image of the reference layer;
Resampling means for performing a filtering process on the decoded image of the reference layer using the filter coefficient set;
A video encoding device comprising: encoding means for encoding a residual signal between an input image of the encoding target layer and the predicted image.
tj=(Σia[xP,i]*r[xR+i−N/2+1,yR+j−N/2+1]+b)>>s1 …(A1)
p=(Σjc[yP,j]*tj+d+o)>>s2 …(A2)
(A1)式及び(A2)式において、a、b、c、dは前記フィルタ係数セットを構成するフィルタ係数であって、s1,s2,oは画素値のビット深度に応じたシフト値と丸め値である。また、(A1)式及び(A2)式において、Nはフィルタのタップ数であって、i及びjは、水平方向及び垂直方向に用いるフィルタのタップ位置である。 The re-sampling means has an integer position (xR, yR) with respect to the position (X, Y) of the target pixel of the decoded image of the reference layer corresponding to the pixel position of the input image of the encoding target layer. The pixel value p resampled from the pixel value array r of the decoded image of the reference layer according to the following expressions (A1) and (A2) using the phase (xP, yP) that is a deviation from the integer position: The video encoding apparatus according to claim 1, wherein the video encoding apparatus is obtained.
t j = (Σ i a [xP, i] * r [xR + i−N / 2 + 1, yR + j−N / 2 + 1] + b) >> s 1 (A1)
p = (Σ j c [yP, j] * t j + d + o) >> s 2 (A2)
In the expressions (A1) and (A2), a, b, c, d are filter coefficients constituting the filter coefficient set, and s 1 , s 2 , o are shift values according to the bit depth of the pixel value. And rounded value. In equations (A1) and (A2), N is the number of filter taps, and i and j are filter tap positions used in the horizontal and vertical directions.
xR=X>>4 …(B1)
xP=X%16 …(B2)
yR=Y>>4 …(B3)
yP=Y%16 …(B4) The resampling means expresses the position (X, Y) of the target pixel of the decoded image of the reference layer with 1/16 pixel accuracy, and the integer position (xR, yR) of the target pixel of the decoded image of the reference layer 3. The video according to claim 2, wherein the filter coefficient set is set as a filter coefficient with respect to 16 phases by calculating the phase and the phase (xP, yP) according to the following expressions (B1) to (B4): Encoding device.
xR = X >> 4 (B1)
xP = X% 16 (B2)
yR = Y >> 4 (B3)
yP = Y% 16 (B4)
前記符号化手段は、前記フィルタ係数決定手段が前記既定のフィルタ係数と異なる値のフィルタ係数を決定したか否かを示すフラグをシグナリングすることにより符号化すべきデータ量を削減する
ことを特徴とする請求項2〜6のいずれかに記載の映像符号化装置。 A predetermined filter coefficient for each phase of the target pixel position of the decoded image of the reference layer used in the resampling means;
The encoding means reduces the amount of data to be encoded by signaling a flag indicating whether or not the filter coefficient determination means has determined a filter coefficient having a value different from the predetermined filter coefficient. The video encoding device according to claim 2.
ことを特徴とする請求項7に記載の映像符号化装置。 The encoding unit reduces a data amount to be encoded by encoding a difference value between the filter coefficient determined by the encoding unit and the corresponding predetermined filter coefficient. 8. The video encoding device according to 7.
前記フィルタ係数決定手段は、前記仮のレイヤ間参照画像と、インター予測のために参照されるインター予測参照画像とを参照して、前記符号化対象レイヤの入力画像の内、レイヤ間予測を行うレイヤ間予測領域を決定し、
前記レイヤ間予測領域のみに関する、前記リサンプル画像と前記符号化対象レイヤの入力画像の誤差の二乗和を最小化するような前記フィルタ係数セットの決定処理を行う
ことを特徴とする請求項9に記載の映像符号化装置。 The filter coefficient determining unit generates a temporary inter-layer reference image by performing a filtering process on the decoded image of the reference layer using the resampling unit and the predetermined filter coefficient,
The filter coefficient determination means performs inter-layer prediction among input images of the encoding target layer with reference to the temporary inter-layer reference image and an inter prediction reference image referred to for inter prediction. Determine the inter-layer prediction region,
The filter coefficient set determination process is performed so as to minimize a sum of squares of errors between the resampled image and the input image of the encoding target layer relating to only the inter-layer prediction region. The video encoding device described.
復号対象レイヤの対象画像を予測した予測画像を、少なくとも、他の参照レイヤの復号画像に対してフィルタ処理を行ったリサンプル画像を参照して、レイヤ間予測により生成する予測手段と、
階層符号化された符号化データに含まれるフィルタ係数セットを復号する復号手段と、
前記復号手段により復号された前記フィルタ係数セットを用いて、前記参照レイヤの復号画像に対してフィルタ処理を行うリサンプリング手段と
を有することを特徴とする映像復号装置。 In a video decoding device that decodes hierarchically encoded data,
A prediction unit that generates a predicted image obtained by predicting a target image of a decoding target layer by performing inter-layer prediction with reference to at least a resampled image obtained by performing filtering on the decoded image of another reference layer;
Decoding means for decoding a filter coefficient set included in the hierarchically encoded data;
A video decoding device comprising: a resampling unit that performs a filtering process on a decoded image of the reference layer using the filter coefficient set decoded by the decoding unit.
符号化対象レイヤの入力画像を予測した予測画像を、少なくとも、他の参照レイヤの復号画像に対してフィルタ処理を行ったリサンプル画像を参照して、レイヤ間予測により生成する予測手段と、
前記符号化対象レイヤの入力画像と、前記参照レイヤの復号画像とを参照して、最適なフィルタ係数セットを決定するフィルタ係数決定手段と、
前記フィルタ係数セットを用いて、前記参照レイヤの復号画像に対してフィルタ処理を行うリサンプリング手段と、
前記符号化対象レイヤの入力画像と前記予測画像との残差信号を符号化する符号化手段と
して機能させることを特徴とする映像符号化プログラム。 A computer mounted on a video encoding device that hierarchically encodes images of multiple layers,
A prediction unit that generates a prediction image obtained by predicting an input image of an encoding target layer by performing inter-layer prediction with reference to at least a resampled image obtained by performing filtering on a decoded image of another reference layer;
Filter coefficient determining means for determining an optimum filter coefficient set with reference to the input image of the encoding target layer and the decoded image of the reference layer;
Resampling means for performing a filtering process on the decoded image of the reference layer using the filter coefficient set;
A video encoding program that functions as an encoding unit that encodes a residual signal between an input image of the encoding target layer and the predicted image.
復号対象レイヤの対象画像を予測した予測画像を、少なくとも、他の参照レイヤの復号画像に対してフィルタ処理を行ったリサンプル画像を参照して、レイヤ間予測により生成する予測手段と、
階層符号化された符号化データに含まれるフィルタ係数セットを復号する復号手段と、
前記復号手段により復号された前記フィルタ係数セットを用いて、前記参照レイヤの復号画像に対してフィルタ処理を行うリサンプリング手段と
して機能させることを特徴とする映像復号プログラム。 A computer mounted on a video decoding device that decodes hierarchically encoded data,
A prediction unit that generates a predicted image obtained by predicting a target image of a decoding target layer by performing inter-layer prediction with reference to at least a resampled image obtained by performing filtering on the decoded image of another reference layer;
Decoding means for decoding a filter coefficient set included in the hierarchically encoded data;
A video decoding program that functions as resampling means for performing filter processing on a decoded image of the reference layer, using the filter coefficient set decoded by the decoding means.
予測手段、フィルタ係数決定手段、リサンプリング手段、及び符号化手段を備え、
前記予測手段は、符号化対象レイヤの入力画像を予測した予測画像を、少なくとも、他の参照レイヤの復号画像に対してフィルタ処理を行ったリサンプル画像を参照して、レイヤ間予測により生成し、
前記フィルタ係数決定手段は、前記符号化対象レイヤの入力画像と、前記参照レイヤの復号画像とを参照して、最適なフィルタ係数セットを決定し、
前記リサンプリング手段は、前記フィルタ係数セットを用いて、前記参照レイヤの復号画像に対してフィルタ処理を行い、
前記符号化手段は、前記符号化対象レイヤの入力画像と前記予測画像との残差信号を符号化する
ことを特徴とする映像符号化方法。 In a video encoding method performed by a video encoding device that hierarchically encodes images of a plurality of layers,
A prediction unit, a filter coefficient determination unit, a resampling unit, and an encoding unit;
The prediction means generates a prediction image obtained by predicting an input image of the encoding target layer by inter-layer prediction with reference to at least a resampled image obtained by performing filtering on a decoded image of another reference layer. ,
The filter coefficient determination means determines an optimal filter coefficient set with reference to the input image of the encoding target layer and the decoded image of the reference layer,
The resampling means performs a filtering process on the decoded image of the reference layer using the filter coefficient set,
The video encoding method, wherein the encoding means encodes a residual signal between an input image of the encoding target layer and the predicted image.
予測手段、復号手段、及びリサンプリング手段を備え、
前記予測手段は、復号対象レイヤの対象画像を予測した予測画像を、少なくとも、他の参照レイヤの復号画像に対してフィルタ処理を行ったリサンプル画像を参照して、レイヤ間予測により生成し、
前記復号手段は、階層符号化された符号化データに含まれるフィルタ係数セットを復号し、
前記リサンプリング手段は、前記復号手段により復号された前記フィルタ係数セットを用いて、前記参照レイヤの復号画像に対してフィルタ処理を行う
ことを特徴とする映像復号方法。 In a video decoding method performed by a video decoding device that decodes hierarchically encoded data,
A prediction unit, a decoding unit, and a resampling unit;
The prediction unit generates a prediction image obtained by predicting a target image of a decoding target layer by performing inter-layer prediction with reference to at least a resampled image obtained by performing filtering on a decoded image of another reference layer,
The decoding means decodes a filter coefficient set included in the hierarchically encoded data,
The video decoding method, wherein the resampling means performs a filtering process on the decoded image of the reference layer using the filter coefficient set decoded by the decoding means.
In a video transmission system comprising a video encoding device that hierarchically encodes images of a plurality of layers and a video decoding device that decodes encoded data hierarchically encoded by the video encoding device, the video encoding device is claimed as the video encoding device. 12. A video transmission system, wherein the video encoding device according to claim 1 is applied, and the video decoding device according to claim 11 is applied as the video decoding device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016162234A JP2018032913A (en) | 2016-08-22 | 2016-08-22 | Video encoder, program and method, and video decoder, program and method, and video transmission system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016162234A JP2018032913A (en) | 2016-08-22 | 2016-08-22 | Video encoder, program and method, and video decoder, program and method, and video transmission system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018032913A true JP2018032913A (en) | 2018-03-01 |
Family
ID=61303593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016162234A Pending JP2018032913A (en) | 2016-08-22 | 2016-08-22 | Video encoder, program and method, and video decoder, program and method, and video transmission system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018032913A (en) |
-
2016
- 2016-08-22 JP JP2016162234A patent/JP2018032913A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111869212B (en) | Video decoding method, device and readable medium | |
US9955176B2 (en) | Efficient and scalable intra video/image coding using wavelets and AVC, modified AVC, VPx, modified VPx, or modified HEVC coding | |
US8155181B2 (en) | Multilayer-based video encoding method and apparatus thereof | |
JP6432662B2 (en) | Video encoding apparatus, video encoding method, and program | |
JP6333942B2 (en) | Apparatus and method for scalable coding of video information | |
KR102616143B1 (en) | Method and apparatus for scalable video coding using intra prediction mode | |
EP2201770A1 (en) | Method, medium, and apparatus for encoding and/or decoding video | |
JP2015065688A (en) | Method and device of estimating and resampling texture for scalable video coding | |
US8306342B2 (en) | Method and apparatus to encode/decode image efficiently | |
WO2014050741A1 (en) | Video encoding method and device, video decoding method and device, and program therefor | |
KR100880640B1 (en) | Method for scalably encoding and decoding video signal | |
JP2015529410A (en) | Video decoding method and apparatus using the same | |
CN109644278B (en) | Video decoding device, video decoding method, video encoding device, video encoding method, and computer-readable storage medium | |
WO2013145021A1 (en) | Image decoding method and image decoding apparatus | |
JP4844455B2 (en) | Video signal hierarchical decoding device, video signal hierarchical decoding method, and video signal hierarchical decoding program | |
WO2010055675A1 (en) | Moving image encoding apparatus and moving image decoding apparatus | |
US10218970B2 (en) | Resampling filters for scalable video coding with phase offset adjustment and signaling of same | |
JP2018032913A (en) | Video encoder, program and method, and video decoder, program and method, and video transmission system | |
CN108432251B (en) | Bit stream conversion device, bit stream conversion method, distribution system, distribution method, and computer-readable storage medium | |
KR20150056679A (en) | Apparatus and method for construction of inter-layer reference picture in multi-layer video coding | |
KR20110087871A (en) | Method and apparatus for image interpolation having quarter pixel accuracy using intra prediction modes | |
CN116998153A (en) | Cross channel prediction based on multiple prediction modes | |
JP2010288181A (en) | Moving image encoding method, moving image encoding apparatus, and moving image encoding program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200630 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210202 |