JP2017073602A - 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム - Google Patents

動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム Download PDF

Info

Publication number
JP2017073602A
JP2017073602A JP2015197681A JP2015197681A JP2017073602A JP 2017073602 A JP2017073602 A JP 2017073602A JP 2015197681 A JP2015197681 A JP 2015197681A JP 2015197681 A JP2015197681 A JP 2015197681A JP 2017073602 A JP2017073602 A JP 2017073602A
Authority
JP
Japan
Prior art keywords
encoding
prediction
pixel
block
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015197681A
Other languages
English (en)
Inventor
智史 島田
Tomohito Shimada
智史 島田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015197681A priority Critical patent/JP2017073602A/ja
Publication of JP2017073602A publication Critical patent/JP2017073602A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】符号化前の画素の値を参照してイントラ予測符号化モードの適用を決定した場合の符号化効率の低下を抑制可能な動画像符号化装置を提供する。【解決手段】動画像符号化装置1は、予測ブロックの生成単位となる複数の第1のブロックのうち、符号化対象ピクチャの未符号化の画素を参照して設定された、イントラ予測符号化モードが適用される第1のブロックについての予測モードを決定する際に参照される被参照画素を特定する被参照画素判定部17と、直交変換の単位となる複数の第2のブロックのうち、被参照画素を含む第2のブロックについて、被参照画素の符号化誤差が、イントラ予測符号化モードが適用される第1のブロックについての予測ブロックの生成の際にその被参照画素が参照されない場合の符号化誤差より低減するように、各第2のブロックについて、対応する予測ブロックとの誤差を符号化する予測符号化部10とを有する。【選択図】図2

Description

本発明は、例えば、動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラムに関する。
動画像データは、一般に非常に大きなデータ量を有する。そのため、動画像データを扱う装置は、動画像データを他の装置へ送信しようとする場合、あるいは、動画像データを記憶装置に記憶しようとする場合、動画像データを符号化することにより圧縮する。代表的な動画像の符号化方式として、Moving Picture Experts Group phase 2(MPEG-2)、MPEG-4、あるいはH.264 MPEG-4 Advanced Video Coding(H.264 MPEG-4 AVC)が広く利用されている。特に、ISO/IECとITU-Tが共同で標準化した、High Efficiency Video Coding(HEVC)(例えば、非特許文献1を参照)は、H.264/MPEG-4 AVCの2倍近い圧縮効率を達成する。
HEVCでは、動画像データに含まれる各ピクチャは複数の段階で分割される。図1は、HEVCによる、ピクチャの分割の一例を示す図である。
図1に示されるように、ピクチャ100は、符号化処理の単位であるCoding Tree Unit(CTU)単位で分割され、各CTU101は、ラスタスキャン順に符号化される。CTU101のサイズは、64x64〜16x16画素の中から選択できる。
CTU101は、さらに、四分木構造で複数のCoding Unit(CU)102に分割される。一つのCTU101内の各CU102は、Zスキャン順に符号化される。CU102のサイズは可変であり、そのサイズは、CU分割モード8x8〜64x64画素の中から選択される。CU102は、符号化モードであるイントラ予測符号化モードとインター予測符号化モードを選択する単位となる。なお、イントラ予測符号化モードは、符号化対象ピクチャの情報を参照して、符号化対象ピクチャの符号化対象ブロックを予測符号化する符号化モードである。一方、インター予測符号化モードは、符号化対象ピクチャの符号化対象ブロックを、符号化済みの他のピクチャの情報を参照して予測符号化する符号化モードである。
CU102は、Prediction Unit(PU)103単位またはTransform Unit(TU)104単位で個別に処理される。PU103は、符号化モードに応じた予測が行われる、予測ブロックの生成単位となる。例えば、PU103は、イントラ予測符号化モードでは、予測ブロックの生成の際に参照される画素及び予測ブロックの生成方法を規定する予測モードが適用される単位となる。一方、インター予測符号化モードでは、PU103は、動き補償を行う単位となる。PU103のサイズは、例えば、イントラ予測符号化モードが適用される場合、2Nx2NとNxN(Nは、CUサイズ/2)から選択可能である。一方、TU104は、直交変換の単位であり、TUごとに離散コサイン変換(Discrete Cosine Transform, DCT)あるいは離散サイン変換(Discrete Sine Transform, DST)される。TU104のサイズは、4x4画素〜32x32画素の中から選択される。TU104は、四分木構造で分割され、Zスキャン順に処理される。
HEVCでは、イントラ予測モードとして、35種類の予測モードが用意されている。このように、多数の予測モードが用意されているため、最適な予測モードを選択するための演算量も多い。また、符号化対象ブロックに隣接する符号化済みの画素を参照して予測モードを選択する場合、その符号化済みの画素を復号する必要が有る。そのため、動画像符号化処理を実行するプロセッサの処理能力が低いと、予測モードの選択に時間が掛かり過ぎてしまい、リアルタイム性が要求されるような場合では、符号化処理が間に合わないおそれがある。
一方、イントラ予測対象のブロックについて、予測ブロックを生成する際に、そのブロックに隣接する左側のブロックの右端の画素の符号化前のデータを、イントラ予測する際に利用する技術が提案されている(例えば、特許文献1を参照)。
特開2007−150913号公報
ISO/IEC 23008-2 / ITU-T H.265
HEVCでは、4x4画素サイズのTUについて、直交変換/逆直交変換を行わず、符号化対象のTUと予測ブロック間の予測誤差信号に対して、量子化/逆量子化を直接適用するTransform Skipというモードが規定されている。DCTのような直交変換は、量子化誤差に起因する符号化歪みをブロック全体に拡散する。そのため、ブロック内に符号化歪みが生じ易い強いエッジ状の模様が含まれると、モスキートノイズと呼ばれる圧縮ノイズが視覚上目立ってしまうことがある。そこで、そのようなブロックに対して直交変換を施さないTransform Skipを用いることで、モスキートノイズの発生が抑制される。
一般に、直交変換により得られる直交変換係数のうち、高周波数の成分に相当する係数ほど、画質に与える影響は小さい。そこで量子化処理では、高周波数の成分に相当する係数ほど、適用される量子化幅は広くなる。そしてTUに対して直交変換が行われる場合、TUの右下に近い直交変換係数ほど、高周波数の成分に相当する。一方、HEVCにおいて、Transform Skipが適用される場合の量子化処理も、Transform Skipが適用されない場合の量子化処理と同一の処理である。そのため、Transform Skipが適用されたTUでは、右下に近い画素ほど、粗い量子化が行われることになる。
そのため、特許文献1に記載の技術のように、符号化対象ブロックについて、符号化前の画素を参照して予測モードが選択される場合、参照される画素がTransform Skipが適用されたTUに含まれることがある。このような場合、予測モードの選択の際に参照した画素の値と、実際に予測ブロックを生成する際に参照される局所復号ブロック中の対応画素の値との符号化誤差が大きいために、予測誤差が大きくなってしまうことがある。そして予測誤差が大きくなると、符号化効率が低下してしまう。
一つの側面では、本発明は、符号化前の画素の値を参照してイントラ予測符号化モードの適用を決定した場合の符号化効率の低下を抑制可能な動画像符号化装置を提供することを目的とする。
一つの実施形態によれば、動画像データに含まれる符号化対象ピクチャを符号化する動画像符号化装置が提供される。この動画像符号化装置は、符号化対象ピクチャを分割した、予測ブロックの生成単位となる複数の第1のブロックのうち、符号化対象ピクチャの未符号化の画素を参照して設定された、イントラ予測符号化モードが適用される第1のブロックについての予測モードを決定する際に参照される符号化対象ピクチャ上の被参照画素を特定する被参照画素判定部と、符号化対象ピクチャを分割した、直交変換の単位となる複数の第2のブロックのうち、被参照画素を含む第2のブロックについて、被参照画素の符号化誤差が、イントラ予測符号化モードが適用される第1のブロックについての予測ブロックの生成の際にその被参照画素が参照されない場合の符号化誤差より低減するように、複数の第2のブロックのそれぞれについて、対応する予測ブロックとの誤差を符号化する予測符号化部とを有する。
符号化前の画素の値を参照してイントラ予測符号化モードの適用を決定した場合の符号化効率の低下を抑制できる。
HEVCによる、ピクチャの分割の一例を示す図である。 一つの実施形態に係る動画像符号化装置の概略構成図である。 HEVCにおいて用意される予測モードを示す図である。 被参照画素の一例を示す図である。 動画像符号化処理の動作フローチャートである。 実施形態またはその変形例による動画像符号化装置の各部の機能を実現するコンピュータプログラムが動作することにより、動画像符号化装置として動作するコンピュータの構成図である。
以下、図を参照しつつ、一つの実施形態による、動画像符号化装置について説明する。この動画像符号化装置は、イントラ予測符号化モードの予測モードを選択する際に、符号化されていない画素の値を参照する。そしてこの動画像符号化装置は、各TUについて、そのTUに含まれる画素がイントラ予測符号化モードが適用される周囲のPUにおいて参照される場合に、その画素の符号化誤差を低下させるよう、量子化パラメータ等を調整する。これにより、この動画像符号化装置は、予測モード選択時に参照される画素の値と、実際に予測ブロックを生成する際に参照される局所復号ブロック中の対応画素の値との差を少なくする。
本実施形態では、動画像符号化装置は、HEVCに準拠するものとする。しかし、動画像符号化装置は、Transform Skipを適用可能な他の動画像符号化規格、例えば、予測ブロックの生成単位となるブロックと直交変換の単位となるブロックが共通する動画像符号化規格に準拠してもよい。
なお、ピクチャは、フレームまたはフィールドの何れであってもよい。フレームは、動画像データ中の一つの静止画像であり、一方、フィールドは、フレームから奇数行のデータあるいは偶数行のデータのみを取り出すことにより得られる静止画像である。
図2は、一つの実施形態による動画像符号化装置の概略構成図である。動画像符号化装置1は、予測符号化部10と、被参照画素判定部17と、量子化パラメータ補正部18と、復号部19と、記憶部20と、エントロピー符号化部21とを有する。また、予測符号化部10は、動き探索部11と、符号化モード判定部12と、予測ブロック生成部13と、予測誤差算出部14と、直交変換部15と、量子化部16とを有する。
動画像符号化装置1が有するこれらの各部は、例えば、それぞれ、別個の回路として実装される。あるいは、動画像符号化装置1が有するこれらの各部は、その各部の機能を実現する一つまたは複数の集積回路として動画像符号化装置1に実装されてもよい。あるいは、動画像符号化装置1が有するこれらの各部は、動画像符号化装置1が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
符号化対象となるピクチャは、例えば、動画像符号化装置1全体を制御する制御部(図示せず)により複数のCTUに分割される。そして動画像符号化装置1には、各CTUが、例えばラスタスキャン順で入力される。そして動画像符号化装置1は、CTUごとに符号化する。以下、動画像符号化装置1が有する各部について説明する。
予測符号化部10は、CTUを、符号化コストが最小となるようにCU及びPUの分割モードに従って分割し、PUごとに設定した符号化モードに従って予測ブロックを生成する。そして予測符号化部10は、CTU内の各PUと対応する予測ブロック間の予測誤差信号を、TUごとに、直交変換して得られる直交変換係数または予測誤差信号そのものを量子化することで、そのCTUを予測符号化する。以下、予測符号化部10の各部について説明する。
動き探索部11は、符号化対象のピクチャがインター予測符号化モードが適用可能なPピクチャまたはBピクチャである場合、符号化対象CTUについて適用可能なPUごとに動きベクトルを算出する。なお、Pピクチャは、一方向のインター予測符号化モードを適用可能なピクチャであり、Bピクチャは、双方向のインター予測符号化モードを適用可能なピクチャである。なお、符号化対象ピクチャの種別は、例えば、制御部(図示せず)が符号化対象の動画像データに適用するGroup Of Pictures(GOP)の構造及び符号化対象ピクチャのGOP内での位置に基づいて決定される。
動き探索部11は、符号化対象CTUの着目するPUについて、局部復号ピクチャについての参照可能な領域に対してブロックマッチングを行って、着目するPUと最も一致する参照ブロックを特定する。そして動き探索部11は、着目するPUと参照ブロック間の移動量を表すベクトルを動きベクトルとして算出する。動き探索部11は、各PUの動きベクトルを、符号化モード判定部12へ通知する。
符号化モード判定部12は、符号化対象CTUを分割するCU、PU及びTUの分割モード及びCUごとに適用される符号化モードを決定する。符号化モード判定部12は、例えば、図示しない制御部から取得した、符号化対象CTUが含まれる符号化対象のピクチャのタイプを示す情報に基づいて、そのCTUの符号化モードを決定する。符号化対象のピクチャのタイプがイントラ予測符号化モードのみが適用可能なIピクチャであれば、符号化モード判定部12は、適用される符号化モードとしてイントラ予測符号化モードを選択する。また、符号化対象のピクチャのタイプが、PピクチャまたはBピクチャであれば、符号化モード判定部12は、例えば、適用される符号化モードとして、インター予測符号化モード及びイントラ予測符号化モードの何れかを選択する。
符号化モード判定部12は、適用可能な符号化モードについての符号化対象CTUの符号化されたデータ量の評価値である符号化コストをCU単位でそれぞれ算出する。例えば、符号化モード判定部12は、インター予測符号化モードについては、CTUを分割するCU分割モード、PU分割モード及び動きベクトルの予測ベクトルの生成方法を規定するベクトルモードの組み合わせごとに符号化コストを算出する。なお、符号化モード判定部12は、ベクトルモードとして、例えば、Adaptive Motion Vector Prediction(AMVP)モード、及び、Mergeモードの何れかを利用できる。
また、イントラ予測符号化モードについては、符号化モード判定部12は、CTUを分割するCU分割モード、PU分割モード及び予測モードの組み合わせごとに符号化コストを算出する。本実施形態では、符号化モード判定部12は、着目するPUについて、局所復号ブロックでなく、そのPUの左側または上側に隣接する、符号化前の画素の値を参照して、符号化コストを算出する。
符号化モード判定部12は、符号化コストを算出するために、例えば、着目するPUについて、次式に従って、予測誤差、すなわち画素差分絶対値和SADを算出する。
SAD=Σ|OrgPixel-PredPixel|
ここで、OrgPixelは着目するPUに含まれる画素の値であり、PredPixelは着目するブロックに対応する、符号化コストの算出対象となる符号化モードに従って生成された予測ブロックに含まれる画素の値である。
そして符号化モード判定部12は、例えば、次式に従って、着目するCUについての符号化コストCostを算出する。
Cost=ΣSAD + λ*B
ここで、ΣSADは、着目するCUに含まれる各PUについて算出されたSADの総和である。またBは、動きベクトル、予測モードを表すフラグなど、予測誤差以外の項目についての符号量の推定値である。そしてλはラグランジュの未定乗数である。
なお、符号化モード判定部12は、SADの代わりに、着目するPUと予測ブロックとの差分画像をアダマール変換した後の各画素の絶対値和SATDなどを算出してもよい。
符号化モード判定部12は、符号化対象CTUについて、例えば、取り得るCUサイズの中でサイズが大きい方から順に着目するCUを設定する。そして符号化モード判定部12は、着目するCUについて、イントラ予測符号化モードに関してそのCU内のPU分割モードごとにコストが最小となる予測モードを選択する。また、符号化モード判定部12は、着目するCUについて、インター予測符号化モードに関してそのCU内のPU分割モードごとにコストが最小となるベクトルモードを選択する。さらに、符号化モード判定部12は、同サイズのCUごとに、イントラ予測符号化モードとインター予測符号化モードのうちで、符号化コストが小さい方を、そのCUについて適用する符号化モードとして選択する。
さらに、符号化モード判定部12は、着目するCUを4分割したCUのそれぞれを、次に着目するCUとして、同様の処理を実行して、最小符号化コストを算出する。そして符号化モード判定部12は、4分割したCUのそれぞれについて算出された、最小符号化コストの総和と、着目するCUについての最小符号化コストよりも小さければ、着目するCUを4分割する。符号化モード判定部12は、各CUが分割されなくなるまで、上記の処理を繰り返すことで、符号化対象CTUに適用されるCU分割モード及びPU分割モードを決定する。
さらに、符号化モード判定部12は、上記のようにして決定したCU分割モードに従ったCUごとに、TU分割モードを決定する。その際、符号化モード判定部12は、適用可能なTU分割モードごとに、次式に従ってRDコストCostを算出する。
Figure 2017073602
ここで、org(i)は、着目するCUに含まれる画素の値であり、ldec(i)は、着目するTU分割モードを用いてそのCUを符号化し、さらに復号して得られる復号画素の値を表す。またbitは、そのCUを着目するTU分割モードを用いて符号化したときの符号量を表す。(1)式の右辺の第一項は、符号化歪みを表し、右辺の第二項は符号量を表す。そのため、RDコストが最小となるTU分割モードでは、符号化歪みと符号量が最適なバランスとなっている。
そこで、符号化モード判定部12は、RDコストCostが最小となるTU分割モードを選択する。
なお、符号化モード判定部12は、少なくとも、着目するCTUの左上方に位置するCTUについての被参照画素判定部17の処理が開始される前に、着目するCTUについてCU及びPUの分割モード及びCUごとに適用される符号化モードを決定することが好ましい。これにより、被参照画素判定部17は、遅滞なく、イントラ予測符号化モードが適用されるPUについての予測ブロック生成の際に参照される画素を特定できる。なお、被参照画素判定部17の処理の詳細については後述する。また、以下では、説明の便宜上、イントラ予測符号化モードが適用されるPUについての予測ブロック生成の際に参照される画素を、単に被参照画素と呼ぶ。
符号化モード判定部12は、符号化対象CTUについて選択したCU及びPUの分割モード及び符号化モードの組み合わせを予測ブロック生成部13に通知する。また符号化モード判定部12は、符号化対象CTUについて選択したCU、PU及びTUの分割モード及び符号化モードの組み合わせを記憶部20に保存する。
予測ブロック生成部13は、符号化対象CTUについて選択されたCU、PU及びTUのサイズ及び符号化モードの組み合わせに従ってPUごとに予測ブロックを生成する。予測ブロック生成部13は、例えば、着目するCUがインター予測符号化される場合、そのCU内のPUごとに、記憶部20から読み出した局所復号ピクチャを、そのPUについて算出された動きベクトルに基づいて動き補償することで予測ブロックを生成する。
また予測ブロック生成部13は、着目するCUがイントラ予測符号化される場合、そのCU内のPUごとに選択された予測モードに従って参照される、そのPUの周囲の局所復号ブロック内の画素の値に基づいて予測ブロックを生成する。なお、予測モード選択の際には未符号化の画素の値が参照される場合でも、CTUを正常に復号可能とするために、予測ブロックの生成の際には、CTUを一旦符号化されてから復号して得られる局所復号ブロックが参照されることに留意されたい。
予測ブロック生成部13は、生成された予測ブロックを予測誤差算出部14へ渡す。
予測誤差算出部14は、符号化対象CTU内の各画素について、予測ブロック生成部13により生成された予測ブロックの対応画素との差分演算を実行する。そして予測誤差算出部14は、各TUについて、その差分演算により得られたTU内の各画素に対応する差分値を、そのTUの予測誤差信号とする。予測誤差算出部14は、符号化対象CTU内の各TUのうち、4x4画素サイズよりも大きいサイズを持つTU、すなわち、Transform Skipが適用されないTUについての予測誤差信号を直交変換部15へわたす。一方、予測誤差算出部14は、符号化対象CTU内の各TUのうち、4x4画素サイズを持つTU、すなわち、Transform Skipが適用されるTUについての予測誤差信号を量子化部16へわたす。
なお、予測誤差算出部14は、4x4画素サイズを持つTUのうち、画素ごとの予測誤差信号のうちの最小値と最大値の差が所定の閾値以上となるTUについてのみ、Transform Skipが適用されるTUとしてもよい。そして予測誤差算出部14は、Transform Skipが適用されるTUの予測誤差信号を量子化部16へ直接わたしてもよい。
直交変換部15は、符号化対象CTU内のTransform Skipが適用されない各TUについて、そのTUの予測誤差信号を直交変換することで予測誤差信号の水平方向の周波数成分及び垂直方向の周波数成分を表す直交変換係数を求める。例えば、直交変換部15は、予測誤差信号に対して、直交変換処理としてDCTを実行することにより、直交変換係数として、DCT係数の組を得る。
直交変換部15は、Transform Skipが適用されない各TUについての直交変換係数を量子化部16へわたす。
量子化部16は、Transform Skipが適用されないTUごとの直交変換係数を、量子化幅を指定するqp値などを含む量子化パラメータに従って量子化することにより、量子化された直交変換係数を算出する。また、量子化部16は、Transform Skipが適用されるTUごとの予測誤差信号を量子化パラメータに従って量子化することにより、量子化された予測誤差信号を算出する。なお、以下では、量子化された直交変換係数及び量子化された予測誤差信号を、単に量子化係数と呼ぶことがある。
量子化部16は、例えば、位置(i,j)の量子化前の値cijを、量子化値qpに基づいて量子化後の値c'ijを求める場合、次式に従って、量子化処理を実行する。
Figure 2017073602
ここで、Abs()は、絶対値を出力する関数である。またSign()は、正負の符号を出力する関数である。そして演算子'a>>b'は、パラメータaを下位方向へbビットシフトさせるシフト演算子である。また、QuantScale(qp,i,j)は、qp値と座標(i,j)の組み合わせごとに予め設定される量子化スケールである。そしてoffset(i,j)は、座標(i,j)ごとに設定される、丸め閾値である。丸め閾値offset(i,j)を調整することで、切り捨て、切り上げの度合を調整することが可能となる。なお、“>>9”は、量子化幅512で除算することに相当し、(512―171)/512≒2/3、(512―85)/512≒5/6である。
本実施形態では、量子化部16は、Transform Skipが適用されるTU内の被参照画素については、量子化パラメータ補正部18により補正された丸め閾値offset'(i,j)を使用し、その他の画素については、予め設定された丸め閾値offset(i,j)を使用する。後述するように、補正された丸め閾値offset'(i,j)は、元の丸め閾値offset(i,j)よりも、量子化幅の中心に近い値となる。これにより、量子化部16は、量子化による、被参照画素の量子化誤差を抑制できる。そのため、量子化部16は、被参照画素について生じる符号化誤差を抑制できる。
量子化部16は、量子化された直交変換係数を復号部19及びエントロピー符号化部21へ出力する。
被参照画素判定部17は、符号化対象CTUの各TUについて、そのTUに含まれる画素のうち、そのTUの周囲に位置するイントラ予測符号化モードが適用されるPUにより、適用する予測モードの決定の際に参照される被参照画素を特定する。
図3は、HEVCにおいて用意される予測モードを示す図である。図3において、矢印300のそれぞれは、対応する予測モードにおける予測方向を表す。そして矢印300の先端に示された数値は、予測モードの番号を表す。HEVCでは、各矢印300で示される、33種類の互いに異なる予測方向を持つ、方向性の予測モードと、DC予測モード及びPlanar予測モードが用意されている。したがって、予測モードとその予測モードが適用されるPUのサイズに応じて、参照される画素が特定される。例えば、予測モード10では、PUの左側に隣接する各画素が参照される。また、予測モード26では、PUの上側に隣接する各画素が参照される。
被参照画素判定部17は、着目するTUについて、そのTUを含むCTU、及び、そのTUをイントラ予測符号化モードで参照する可能性のある他のCTUについて、選択されたPUの分割モード及び符号化モードの組み合わせを記憶部20から読み込む。なお、そのTUをイントラ予測符号化モードで参照する可能性のあるCTUは、そのCTU内の各PUについて適用可能な予測モードの参照範囲から特定される。
被参照画素判定部17は、そのTUを含むCTU、及び、そのTUをイントラ予測符号化モードで参照する可能性のある他のCTU内で、イントラ予測符号化モードが適用されるPUを特定する。そして被参照画素判定部17は、特定されたPUのそれぞれについて、そのPUのサイズ及びそのPUに適用される予測モードを参照して、参照する画素の範囲を特定する。被参照画素判定部17は、特定された画素の範囲と着目するTUとが重なっている領域に含まれる各画素を被参照画素とする。
図4は、被参照画素の一例を示す図である。TU400の右側に隣接する二つのPU411、PU412に対して、それぞれイントラ予測符号化モードが適用されるものとする。なお、PU411、PU412は、TU400よりも右側に位置しているので、PU411、PU412に対しては、予測ブロックの生成以降の処理は行われていない。すなわち、PU411、PU412は、TU400の被参照ブロックの特定の際には、符号化されていない。
このうち、PU411には、矢印421に示されるように、PU411の左側に隣接する各画素を参照する予測モードが適用されているとする。一方、PU412には、矢印422に示されるように、PU412の右斜め上方の各画素を参照する予測モードが適用されているとする。この場合、PU411で参照される範囲431は、TU400と重なっているので、範囲431に含まれる各画素が被参照画素432となる。
なお、被参照画素判定部17は、符号化対象CTU内で、Transform Skipが適用されるTUについてのみ、被参照画素を特定してもよい。
被参照画素判定部17は、符号化対象CTUの各TUについての被参照画素を表す情報を生成する。被参照画素を表す情報は、例えば、各TU内での被参照画素の座標のリストとすることができる。そして被参照画素判定部17は、符号化対象CTUの各TUについての被参照画素を表す情報を量子化パラメータ補正部18へ通知する。
量子化パラメータ補正部18は、符号化対象CTUの各TUについて、被参照画素の符号化誤差を低減するよう、量子化パラメータを調整する。
本実施形態では、量子化パラメータ補正部18は、被参照画素がTransform Skipが適用されるTUに含まれる場合、被参照画素について、量子化処理による被参照画素の符号化誤差を低減するように調整する。
Transform Skipが適用されるTUについては、予測誤差信号は直交変換されないため、単に予測誤差信号の各画素の値を量子化して得られた値の量子化誤差が、そのままその画素の歪となる。このことから、量子化パラメータ補正部18は、被参照画素を表す情報に基づき、被参照画素の値の量子化誤差が小さくなるように、量子化パラメータを調整することで歪みを低減できる。
一般に、符号化効率が向上を目的として、量子化処理においては、量子化幅未満、すなわち、小数点以下の値を丸める際の丸め閾値を、四捨五入よりも、切り捨てられる値の範囲が広くなるように調整される。例えば、H.264/AVCの参照ソフトであるJMでは、イントラ予測符号化モードが適用される場合、量子化幅をQとすると、[nQ,(n+1)Q]の範囲に含まれる値のうち、[nQ,(n+2/3)Q]の範囲に含まれる値はnに量子化される。一方、((n+2/3)Q,(n+1)Q]の範囲に含まれる値は(n+1)に量子化される。また、インター予測符号化モードが適用される場合、同様に、[nQ,(n+1)Q]の範囲に含まれる値のうち、[nQ,(n+5/6)Q]に含まれる値はnに量子化される。一方、((n+5/6)Q,(n+1)Q]の範囲に含まれる値は(n+1)に量子化される。[nQ,(n+1)Q]の範囲内で、値の分布が均一であるならば、丸め閾値は、四捨五入に相当する値に近いほど、量子化誤差が小さくなる確率が高くなる。
そこで、量子化パラメータ補正部18は、被参照画素に適用される丸め閾値offset(i,j)を、被参照画素以外に適用されるoffset(i,j)の値よりも量子化幅の1/2に近くなるよう調整する。例えば、量子化パラメータ補正部18は、被参照画素についての調整された丸め閾値offset'(i,j)を256に設定することで、平均的な量子化誤差を低減する。
なお、上記のように丸め閾値offset(i,j)を補正することで、量子化誤差が小さくなるかわりに、符号量が多くなる可能性がある。そのため、丸め閾値offset(i,j)の補正により量子化誤差を低減するのは、被参照画素のうち、符号化効率の向上に貢献する画素に限定するのが符号化効率向上の観点から好ましい。そこで、量子化パラメータ補正部18は、被参照画素を参照するPUについて、予測ブロックを、被参照画素の元の値を用いて生成した場合の符号量と、その元の値に被参照画素についての量子化幅だけ加算または減算した値を用いて生成した場合の符号量を推定する。そして量子化パラメータ補正部18は、その二つの符号量の推定値の差が所定値以上となる場合についてのみ、その被参照画素についての丸め閾値offset(i,j)を補正してもよい。
量子化パラメータ補正部18は、被参照画素の座標及び調整後の丸め閾値offset'(i,j)を量子化部16へ通知する。
復号部19は、符号化対象CTU内の各TUの量子化係数から、そのTUよりも後のCUなどを符号化するために参照される局所復号ブロックを生成し、その局所復号ブロックを記憶部20に記憶する。
そのために、復号部19は、各TUの量子化された量子化係数を逆量子化することで、量子化前の直交変換係数または予測誤差信号を復元する。
復号部19は、Transform Skipが適用されていないTUごとに、復元された直交変換係数に対して逆直交変換を行う。例えば、直交変換部15が直交変換としてDCTを用いている場合、復号部19は、逆直交変換として逆DCT処理を実行する。これにより、復号部19は、TUごとに、符号化前の予測誤差信号と同程度の情報を有する予測誤差信号を復元する。なお、Transform Skipが適用されたTUについては、復号部19は、逆直交変換を行わなくてもよい。
復号部19は、TUごとに、そのTUの予測ブロックの各画素値に、復元された予測誤差信号を加算することで、局所復号ブロックを生成する。
復号部19は、局所復号ブロックを生成する度に、その局所復号ブロックを記憶部20に記憶させる。
また、復号部19は、記憶部20に記憶されている各局所復号ブロックに対して、デブロッキングフィルタ処理、あるいは、sample adaptive offset処理といったループ内フィルタ処理を行ってもよい。
記憶部20は、復号部19から受け取った局所復号ブロックを一時的に記憶する。なお、局所復号ピクチャは、各CTUの符号化順序にしたがって、1枚のピクチャ分の局所復号ブロックを結合することで得られる。記憶部20は、動き探索部11、符号化モード判定部12及び予測ブロック生成部13に、局所復号ピクチャまたは局所復号ブロックを供給する。なお、記憶部20は、符号化対象ピクチャが参照する可能性がある、予め定められた所定枚数分の局所復号ピクチャを記憶し、局所復号ピクチャの枚数がその所定枚数を超えると、符号化順序が古い局所復号ピクチャから順に破棄する。
さらに、記憶部20は、インター予測符号化された局所復号ブロックのそれぞれについての動きベクトルを記憶する。さらにまた、記憶部20は、各CTUについて選択したCU、PU及びTUの分割モード及び符号化モードの組み合わせを記憶する。
エントロピー符号化部21は、符号化対象CTUの各TUの量子化係数及び各PUの動きベクトルの予測誤差信号及びシンタックスなどをエントロピー符号化する。本実施形態では、エントロピー符号化部21は、エントロピー符号化方式として、Context-based Adaptive Binary Arithmetic Coding(CABAC)といった算術符号化処理を用いる。そしてエントロピー符号化部21は、エントロピー符号化により得られたビットストリームを所定の順序で結合し、HEVCで規定されるヘッダ情報などを付加することで、符号化された動画像データを含む符号化ビットストリームを求める。そしてエントロピー符号化部21は、符号化ビットストリームを出力する。
図5は、動画像符号化装置1により実行される動画像符号化処理の動作フローチャートである。動画像符号化装置1は、CTUごとに以下に示される動作フローチャートに従って動画像符号化処理を実行する。
動き探索部11は、符号化対象CTU内の適用可能な各PUについて動きベクトルを算出する(ステップS101)。そして動き探索部11は、各PUの動きベクトルを符号化モード判定部12へ通知する。なお、符号化対象CTUが含まれる符号化対象ピクチャがIピクチャである場合には、ステップS101の処理は省略されてもよい。
符号化モード判定部12は、符号化対象CTUについて、CU、PU及びTUのそれぞれの分割モード及び適用される符号化モードを決定する(ステップS102)。その際、符号化モード判定部12は、イントラ予測符号化モードに関しては、未符号化の画素の値を参照して、適用する予測モードを選択する。そして符号化モード判定部12は、CU、PU及びTUのそれぞれの分割モード及び適用される符号化モードを、予測ブロック生成部13に通知するとともに、記憶部20に記憶する。
予測ブロック生成部13は、決定されたCU及びPUの分割モード及び適用される符号化モードに応じて予測ブロックを生成する(ステップS103)。そして予測ブロック生成部13は、生成した予測ブロックを予測誤差算出部14へわたす。
予測誤差算出部14は、符号化対象CTUと予測ブロック間の予測誤差信号を算出する(ステップS104)。そして予測誤差算出部14は、符号化対象CTUの各TUのうち、4x4画素よりも大きいサイズを持つTU、すなわち、Transform Skipが適用されないTUの予測誤差信号を直交変換部15へわたす。また、予測誤差算出部14は、4x4画素サイズを持つTU、すなわち、Transform Skipが適用されるTUの予測誤差信号を量子化部16へわたす。
直交変換部15は、Transform Skipが適用されない各TUの予測誤差信号を直交変換することで、直交変換係数を算出する(ステップS105)。そして直交変換部15は、Transform Skipが適用されない各TUの直交変換係数を量子化部16へわたす。
被参照画素判定部17は、符号化対象CTUの各TUについて、そのTUに含まれる画素のうち、そのTUの周囲に位置するイントラ予測符号化モードが適用されるPUにより参照される被参照画素を特定する(ステップS106)。そして被参照画素判定部17は、各TUについての被参照画素を表す情報を量子化パラメータ補正部18へわたす。
量子化パラメータ補正部18は、Transform Skipが適用される各TUについて、被参照画素の符号化誤差を低減するよう、被参照画素についての量子化パラメータを補正する(ステップS107)。そして量子化パラメータ補正部18は、各TUの被参照画素についての調整後の量子化パラメータを量子化部16へわたす。
量子化部16は、符号化対象CTUの各TUのうち、Transform Skipが適用されないTUについて、直交変換係数を量子化する(ステップS108)。また、量子化部16は、符号化対象CTUの各TUのうち、Transform Skipが適用されるTUについて、被参照画素については補正された量子化パラメータを適用して、予測誤差信号を直接量子化する(ステップS109)。そして量子化部16は、各TUの量子化された直交変換係数または量子化された予測誤差信号を復号部19及びエントロピー符号化部21へ出力する。
復号部19は、符号化対象CTUの各TUについての量子化された直交変換係数または量子化された予測誤差信号から、そのCTUに対応する局所復号ブロックを生成する(ステップS110)。そして復号部19は、局所復号ブロックを記憶部20に記憶する。
エントロピー符号化部21は、符号化対象CTUの各TUについての量子化された直交変換係数または量子化された予測誤差信号及び動きベクトルについての予測誤差などをエントロピー符号化する(ステップS111)。エントロピー符号化部21は、得られたビットストリームを出力する。そして動画像符号化装置1は、一つのCTUに対する動画像符号化処理を終了する。なお、ステップS103〜S105の処理と、ステップS106及びステップS107の処理は並列に実行されてもよい。あるいは、ステップS103〜S105の処理よりも前に、ステップS106及びステップS107の処理は実行されてもよい。また、ステップS108の処理とステップS109の処理は、CTU内のTUの処理順序に従って実行されればよい。
以上に説明してきたように、この動画像符号化装置は、イントラ予測符号化モードの予測モードを選択する際に、符号化前の画素の値を参照する。そしてこの動画像符号化装置は、各TUについて、そのTUに含まれる画素がイントラ予測符号化モードが適用される周囲のPUにおいて参照される場合に、その画素の量子化誤差を低下させるよう、量子化パラメータ等を調整する。これにより、この動画像符号化装置は、予測モード選択時のその画素の値と、実際に予測ブロックを生成する際の、局所復号ブロックにおける対応画素の値との差を少なくして、イントラ予測符号化モードが適用されるブロックについて生じる予測誤差を低減する。その結果として、この動画像符号化装置は、予測モードの選択の際に未符号化の画素を参照することによる符号化効率の低下を抑制できる。
なお、変形例によれば、量子化パラメータ補正部18は、被参照画素を含む全てのTUについて、そのTU内の各画素の丸め閾値offset(i,j)を、量子化幅の中心に近づくように補正してもよい。そして量子化部16は、被参照画素を含む全てのTUについて、補正された丸め閾値offset'(i,j)を用いて量子化処理を実行してもよい。これにより、量子化部16は、Transform Skipが適用されていないTUに含まれる参照画素についても符号化誤差を抑制できる。
また他の変形例によれば、符号化モード判定部12は、符号化対象CTUのTU分割モードを決定する際に、そのCTU内の被参照画素の影響を他の画素よりも大きくすることで、被参照画素の符号化誤差を抑制してもよい。この場合、符号化モード判定部12は、例えば、上記の実施形態と同様の方法により、CU分割モード、PU分割モード及び適用される符号化モードを決定する。
そして符号化モード判定部12は、例えば、全てのCTUについてCU及びPUの分割モード及び適用される符号化モードを決定した後に、各CTUについてTU分割モードを決定する。その際、符号化モード判定部12は、適用されるCU分割モードに従って設定される各CUについて、TU分割モードごとに、(1)式の代わりに次式に従ってRDコストCost'を算出する。
Figure 2017073602
ここで、w(i)は、着目するCU内の画素iについての重み係数であり、被参照画素についての重み係数w(i)の値(例えば、2)は、被参照画素以外の画素についての重み係数w(i)の値(例えば、1)よりも大きな値に設定される。
符号化モード判定部12は、(3)式に従って算出したRDコストCost'が最小となるTU分割モードを設定する。(3)式から明らかなように、org(i)とldec(i)の差が小さいほど、RDコストCost'も小さくなり、かつ、被参照画素についての重み係数の方が他の画素の重み係数よりも大きいので、被参照画素についての符号化誤差が少ないTU分割モードが選択される。この変形例では、動画像符号化装置1は、図5に示される動作フローチャートにおいて、ステップS106における被参照画素の特定を、ステップS102における処理のうち、CU及びPU分割モードの特定及び符号化モードの決定の次に実行すればよい。そして動画像符号化装置1は、被参照画素が特定された後に、ステップS102における処理のうち、TU分割モードの決定を行えばよい。
なお、この変形例では、TU分割モードを最適化することで、被参照画素の符号化誤差が抑制されているので、量子化パラメータ補正部18は省略されてもよい。そして量子化部16は、Transform Skipが適用される各TUの被参照画素についても、補正されていない丸め閾値offset(i,j)を使用して、量子化処理を実行してもよい。
この変形例によれば、動画像符号化装置は、RDコスト算出の際の被参照画素の重みを重くしてTU分割モードを設定するので、被参照画素の符号化誤差を抑制するTU分割モードを設定できる。その結果として、この動画像符号化装置は、Transform Skipが適用されないTUに含まれる被参照画素を参照するPUについても予測誤差信号を小さくできるので、予測モード選択の際の未符号化の画素の値の参照による符号化効率の低下を抑制できる。
さらに他の変形例によれば、量子化パラメータ補正部18は、被参照画素を含む各TUについて、そのTUに適用されるQP値を、そのTUにおける量子化幅を小さくするように補正してもよい。例えば、量子化パラメータ補正部18は、被参照画素を含むTUに適用されるQP値を、元のQP値から所定値(例えば、1)を減じた値に補正する。そして量子化パラメータ補正部18は、被参照画素を含む各TUについての補正されたQP値を量子化部16へわたす。そして量子化部16は、被参照画素を含む各TUについて、補正されたQP値を用いて量子化処理を実行する。
なお、この変形例が適用される場合、動画像復号装置も、被参照画素判定部17と同様の処理を行って被参照画素を含むTUを特定し、被参照画素を含むTUについては、量子化パラメータ補正部18と同様に、元のQP値から所定値を減じた値に補正する。そして動画像復号装置は、その補正したQP値を用いて逆量子化処理を実行する。
この変形例では、被参照画素だけでなく、被参照画素を含むTU全体について量子化幅が小さくなるので、被参照画素を含むTU全体について量子化誤差が低減される。そしてこの変形例による動画像符号化装置は、被参照画素を含むTUに対してTransform Skipが適用されない場合にも、被参照画素の量子化誤差を抑制できる。その結果として、この動画像符号化装置は、Transform Skipが適用されないTUに含まれる被参照画素を参照するPUについても予測誤差信号を小さくできるので、予測モード選択の際の未符号化の画素の値の参照による符号化効率の低下を抑制できる。
図6は、上記の実施形態またはその変形例による動画像符号化装置の各部の機能を実現するコンピュータプログラムが動作することにより、動画像符号化装置として動作するコンピュータの構成図である。
コンピュータ100は、ユーザインターフェース部101と、通信インターフェース部102と、記憶部103と、記憶媒体アクセス装置104と、プロセッサ105とを有する。プロセッサ105は、ユーザインターフェース部101、通信インターフェース部102、記憶部103及び記憶媒体アクセス装置104と、例えば、バスを介して接続される。
ユーザインターフェース部101は、例えば、キーボードとマウスなどの入力装置と、液晶ディスプレイといった表示装置とを有する。または、ユーザインターフェース部101は、タッチパネルディスプレイといった、入力装置と表示装置とが一体化された装置を有してもよい。そしてユーザインターフェース部101は、例えば、ユーザの操作に応じて、符号化する動画像データを選択する操作信号をプロセッサ105へ出力する。
通信インターフェース部102は、コンピュータ100を、動画像データを生成する装置、例えば、ビデオカメラと接続するための通信インターフェース及びその制御回路を有してもよい。そのような通信インターフェースは、例えば、High-Definition Multimedia Interface(HDMI)(登録商標)、またはUniversal Serial Bus(USB)とすることができる。
さらに、通信インターフェース部102は、イーサネット(登録商標)などの通信規格に従った通信ネットワークに接続するための通信インターフェース及びその制御回路を有してもよい。
この場合には、通信インターフェース部102は、通信ネットワークに接続された他の機器から、符号化する動画像データを取得し、それらのデータをプロセッサ105へ渡す。また通信インターフェース部102は、プロセッサ105から受け取った、符号化動画像データを通信ネットワークを介して他の機器へ出力してもよい。
記憶部103は、例えば、読み書き可能な半導体メモリと読み出し専用の半導体メモリとを有する。そして記憶部103は、プロセッサ105上で実行される、動画像符号化処理を実行するためのコンピュータプログラム、及びこれらの処理の途中または結果として生成されるデータを記憶する。
記憶媒体アクセス装置104は、例えば、磁気ディスク、半導体メモリカード及び光記憶媒体といった記憶媒体106にアクセスする装置である。記憶媒体アクセス装置104は、例えば、記憶媒体106に記憶されたプロセッサ105上で実行される、動画像符号化処理用のコンピュータプログラムを読み込み、プロセッサ105に渡す。
プロセッサ105は、上記の実施形態または変形例による動画像符号化処理用コンピュータプログラムを実行することにより、符号化動画像データを生成する。そしてプロセッサ105は、生成された符号化動画像データを記憶部103に保存し、または通信インターフェース部102を介して他の機器へ出力する。
なお、動画像符号化装置1の各部の機能をプロセッサ上で実行可能なコンピュータプログラムは、コンピュータによって読み取り可能な媒体に記録された形で提供されてもよい。ただし、そのような記録媒体には、搬送波は含まれない。
ここに挙げられた全ての例及び特定の用語は、読者が、本発明及び当該技術の促進に対する本発明者により寄与された概念を理解することを助ける、教示的な目的において意図されたものであり、本発明の優位性及び劣等性を示すことに関する、本明細書の如何なる例の構成、そのような特定の挙げられた例及び条件に限定しないように解釈されるべきものである。本発明の実施形態は詳細に説明されているが、本発明の精神及び範囲から外れることなく、様々な変更、置換及び修正をこれに加えることが可能であることを理解されたい。
以上説明した実施形態及びその変形例に関し、更に以下の付記を開示する。
(付記1)
動画像データに含まれる符号化対象ピクチャを符号化する動画像符号化装置であって、
前記符号化対象ピクチャを分割した、予測ブロックの生成単位となる複数の第1のブロックのうち、前記符号化対象ピクチャの未符号化の画素を参照して設定された、イントラ予測符号化モードが適用される第1のブロックについての予測モードを決定する際に参照される前記符号化対象ピクチャ上の被参照画素を特定する被参照画素判定部と、
前記符号化対象ピクチャを分割した、直交変換の単位となる複数の第2のブロックのうち、前記被参照画素を含む第2のブロックについて、前記被参照画素の符号化誤差が、前記イントラ予測符号化モードが適用される第1のブロックについての予測ブロックの生成の際に前記被参照画素が参照されない場合の符号化誤差より低減するように、前記複数の第2のブロックのそれぞれについて、対応する前記予測ブロックとの誤差を符号化する予測符号化部と、
を有する動画像符号化装置。
(付記2)
前記複数の第2のブロックのうち、前記被参照画素を含む第2のブロックに用いられる、量子化幅を指定するパラメータを含む量子化パラメータを、前記被参照画素の符号化誤差が低減するよう補正する量子化パラメータ補正部をさらに有し、
前記予測符号化部は、
前記複数の第1のブロックのそれぞれについて、前記適用される符号化モードに従って前記予測ブロックを生成する予測ブロック生成部と、
前記複数の第1のブロックのそれぞれについて、当該第1のブロックと対応する前記予測ブロック間の予測誤差信号を算出する予測誤差算出部と、
前記複数の第2のブロックのうち、前記被参照画素を含む第2のブロックの前記予測誤差信号、または当該予測誤差信号を直交変換して得られる直交変換係数を、前記補正された量子化パラメータに従って量子化することで量子化係数を算出する量子化部と、を有する、付記1に記載の動画像符号化装置。
(付記3)
前記量子化パラメータは、前記量子化における量子化幅未満の値を丸めるための丸め閾値をさらに含み、
前記量子化パラメータ補正部は、前記被参照画素についての前記丸め閾値を、前記被参照画素以外の画素についての前記丸め閾値よりも前記量子化幅の中心に近い値に補正する、付記2に記載の動画像符号化装置。
(付記4)
前記量子化部は、前記被参照画素を含む前記第2のブロックのサイズが所定サイズ以下である場合に前記被参照画素について前記補正された丸め閾値を用いて前記予測誤差信号を量子化する、付記3に記載の動画像符号化装置。
(付記5)
前記量子化パラメータ補正部は、前記被参照画素を含む前記第2のブロックについての前記量子化幅を指定するパラメータを、当該第2のブロックが前記被参照画素を含まない場合における前記量子化幅を指定するパラメータよりも前記量子化幅が小さくなるように補正する、付記2に記載の動画像符号化装置。
(付記6)
前記予測符号化部は、前記複数の第1のブロックのそれぞれについて、インター予測符号化モード及びイントラ予測符号化モードの中から、前記イントラ予測符号化モードについては前記符号化対象ピクチャの符号化されていない画素の値を参照して、適用する符号化モードを決定する符号化モード判定部をさらに有する、付記1〜5の何れかに記載の動画像符号化装置。
(付記7)
前記符号化モード判定部は、前記符号化対象ピクチャを分割した複数の第3のブロックのそれぞれについて、当該第3のブロックを複数の分割モードのそれぞれにしたがって前記複数の第2のブロックに分割した際の当該第3のブロックの符号化コストを、符号化前の画素の値と符号化してから復号して得られる対応画素間の誤差の重み付け和に基づいて算出し、前記複数の分割モードのうち、当該符号化コストが最小となる分割モードに応じて当該第3のブロックを前記複数の第2のブロックに分割し、前記符号化コストを算出する際における前記被参照画素についての前記誤差に対する重みを前記被参照画素以外の画素についての前記重みよりも重くする、付記6に記載の動画像符号化装置。
(付記8)
動画像データに含まれる符号化対象ピクチャを符号化する動画像符号化方法であって、
前記符号化対象ピクチャを分割した、予測ブロックの生成単位となる複数の第1のブロックのうち、前記符号化対象ピクチャの未符号化の画素を参照して設定された、イントラ予測符号化モードが適用される第1のブロックについての予測モードを決定する際に参照される前記符号化対象ピクチャ上の被参照画素を特定し、
前記符号化対象ピクチャを分割した、直交変換の単位となる複数の第2のブロックのうち、前記被参照画素を含む第2のブロックについて、前記被参照画素の符号化誤差が、前記イントラ予測符号化モードが適用される第1のブロックについての予測ブロックの生成の際に前記被参照画素が参照されない場合の符号化誤差より低減するように、前記複数の第2のブロックのそれぞれについて、対応する前記予測ブロックとの誤差を符号化する、
ことを含む動画像符号化方法。
(付記9)
動画像データに含まれる符号化対象ピクチャをコンピュータに符号化させるための動画像符号化用コンピュータプログラムであって、
前記符号化対象ピクチャを分割した、予測ブロックの生成単位となる複数の第1のブロックのうち、前記符号化対象ピクチャの未符号化の画素を参照して設定された、イントラ予測符号化モードが適用される第1のブロックについての予測モードを決定する際に参照される前記符号化対象ピクチャ上の被参照画素を特定し、
前記符号化対象ピクチャを分割した、直交変換の単位となる複数の第2のブロックのうち、前記被参照画素を含む第2のブロックについて、前記被参照画素の符号化誤差が、前記イントラ予測符号化モードが適用される第1のブロックについての予測ブロックの生成の際に前記被参照画素が参照されない場合の符号化誤差より低減するように、前記複数の第2のブロックのそれぞれについて、対応する前記予測ブロックとの誤差を符号化する、
ことをコンピュータに実行させるための動画像符号化用コンピュータプログラム。
1 動画像符号化装置
10 予測符号化部
11 動き探索部
12 符号化モード判定部
13 予測ブロック生成部
14 予測誤差算出部
15 直交変換部
16 量子化部
17 被参照画素判定部
18 量子化パラメータ補正部
19 復号部
20 記憶部
21 エントロピー符号化部
100 コンピュータ
101 ユーザインターフェース部
102 通信インターフェース部
103 記憶部
104 記憶媒体アクセス装置
105 プロセッサ
106 記録媒体

Claims (8)

  1. 動画像データに含まれる符号化対象ピクチャを符号化する動画像符号化装置であって、
    前記符号化対象ピクチャを分割した、予測ブロックの生成単位となる複数の第1のブロックのうち、前記符号化対象ピクチャの未符号化の画素を参照して設定された、イントラ予測符号化モードが適用される第1のブロックについての予測モードを決定する際に参照される前記符号化対象ピクチャ上の被参照画素を特定する被参照画素判定部と、
    前記符号化対象ピクチャを分割した、直交変換の単位となる複数の第2のブロックのうち、前記被参照画素を含む第2のブロックについて、前記被参照画素の符号化誤差が、前記イントラ予測符号化モードが適用される第1のブロックについての予測ブロックの生成の際に前記被参照画素が参照されない場合の符号化誤差より低減するように、前記複数の第2のブロックのそれぞれについて、対応する前記予測ブロックとの誤差を符号化する予測符号化部と、
    を有する動画像符号化装置。
  2. 前記複数の第2のブロックのうち、前記被参照画素を含む第2のブロックに用いられる、量子化幅を指定するパラメータを含む量子化パラメータを、前記被参照画素の符号化誤差が低減するよう補正する量子化パラメータ補正部をさらに有し、
    前記予測符号化部は、
    前記複数の第1のブロックのそれぞれについて、前記適用される符号化モードに従って前記予測ブロックを生成する予測ブロック生成部と、
    前記複数の第1のブロックのそれぞれについて、当該第1のブロックと対応する前記予測ブロック間の予測誤差信号を算出する予測誤差算出部と、
    前記複数の第2のブロックのうち、前記被参照画素を含む第2のブロックの前記予測誤差信号、または当該予測誤差信号を直交変換して得られる直交変換係数を、前記補正された量子化パラメータに従って量子化することで量子化係数を算出する量子化部と、を有する、請求項1に記載の動画像符号化装置。
  3. 前記量子化パラメータは、前記量子化における量子化幅未満の値を丸めるための丸め閾値をさらに含み、
    前記量子化パラメータ補正部は、前記被参照画素についての前記丸め閾値を、前記被参照画素以外の画素についての前記丸め閾値よりも前記量子化幅の中心に近い値に補正する、請求項2に記載の動画像符号化装置。
  4. 前記量子化部は、前記被参照画素を含む前記第2のブロックのサイズが所定サイズ以下である場合に前記被参照画素について前記補正された丸め閾値を用いて前記予測誤差信号を量子化する、請求項3に記載の動画像符号化装置。
  5. 前記予測符号化部は、前記複数の第1のブロックのそれぞれについて、インター予測符号化モード及びイントラ予測符号化モードの中から、前記イントラ予測符号化モードについては前記符号化対象ピクチャの符号化されていない画素の値を参照して、適用する符号化モードを決定する符号化モード判定部をさらに有する、請求項1〜4の何れか一項に記載の動画像符号化装置。
  6. 前記符号化モード判定部は、前記符号化対象ピクチャを分割した複数の第3のブロックのそれぞれについて、当該第3のブロックを複数の分割モードのそれぞれにしたがって前記複数の第2のブロックに分割した際の当該第3のブロックの符号化コストを、符号化前の画素の値と符号化してから復号して得られる対応画素間の誤差の重み付け和に基づいて算出し、前記複数の分割モードのうち、当該符号化コストが最小となる分割モードに応じて当該第3のブロックを前記複数の第2のブロックに分割し、前記符号化コストを算出する際における前記被参照画素についての前記誤差に対する重みを前記被参照画素以外の画素についての前記重みよりも重くする、請求項5に記載の動画像符号化装置。
  7. 動画像データに含まれる符号化対象ピクチャを符号化する動画像符号化方法であって、
    前記符号化対象ピクチャを分割した、予測ブロックの生成単位となる複数の第1のブロックのうち、前記符号化対象ピクチャの未符号化の画素を参照して設定された、イントラ予測符号化モードが適用される第1のブロックについての予測モードを決定する際に参照される前記符号化対象ピクチャ上の被参照画素を特定し、
    前記符号化対象ピクチャを分割した、直交変換の単位となる複数の第2のブロックのうち、前記被参照画素を含む第2のブロックについて、前記被参照画素の符号化誤差が、前記イントラ予測符号化モードが適用される第1のブロックについての予測ブロックの生成の際に前記被参照画素が参照されない場合の符号化誤差より低減するように、前記複数の第2のブロックのそれぞれについて、対応する前記予測ブロックとの誤差を符号化する、
    ことを含む動画像符号化方法。
  8. 動画像データに含まれる符号化対象ピクチャをコンピュータに符号化させるための動画像符号化用コンピュータプログラムであって、
    前記符号化対象ピクチャを分割した、予測ブロックの生成単位となる複数の第1のブロックのうち、前記符号化対象ピクチャの未符号化の画素を参照して設定された、イントラ予測符号化モードが適用される第1のブロックについての予測モードを決定する際に参照される前記符号化対象ピクチャ上の被参照画素を特定し、
    前記符号化対象ピクチャを分割した、直交変換の単位となる複数の第2のブロックのうち、前記被参照画素を含む第2のブロックについて、前記被参照画素の符号化誤差が、前記イントラ予測符号化モードが適用される第1のブロックについての予測ブロックの生成の際に前記被参照画素が参照されない場合の符号化誤差より低減するように、前記複数の第2のブロックのそれぞれについて、対応する前記予測ブロックとの誤差を符号化する、
    ことをコンピュータに実行させるための動画像符号化用コンピュータプログラム。
JP2015197681A 2015-10-05 2015-10-05 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム Pending JP2017073602A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015197681A JP2017073602A (ja) 2015-10-05 2015-10-05 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015197681A JP2017073602A (ja) 2015-10-05 2015-10-05 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2017073602A true JP2017073602A (ja) 2017-04-13

Family

ID=58537926

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015197681A Pending JP2017073602A (ja) 2015-10-05 2015-10-05 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2017073602A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109429071A (zh) * 2017-08-23 2019-03-05 富士通株式会社 图像编码装置、图像解码装置及图像处理方法
CN114342396A (zh) * 2019-09-06 2022-04-12 索尼集团公司 图像处理装置和方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109429071A (zh) * 2017-08-23 2019-03-05 富士通株式会社 图像编码装置、图像解码装置及图像处理方法
CN109429071B (zh) * 2017-08-23 2023-09-08 富士通株式会社 图像编码装置、图像解码装置及图像处理方法
CN114342396A (zh) * 2019-09-06 2022-04-12 索尼集团公司 图像处理装置和方法
EP4013054A4 (en) * 2019-09-06 2022-10-26 Sony Group Corporation IMAGE PROCESSING DEVICE AND METHOD

Similar Documents

Publication Publication Date Title
KR102329587B1 (ko) 인트라 예측 방법 및 그 장치
KR102412934B1 (ko) 인트라 예측 방법 및 그 장치
WO2013042888A2 (ko) 머지 후보 블록 유도 방법 및 이러한 방법을 사용하는 장치
JP6244864B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
KR20170108367A (ko) 인트라 예측 기반의 비디오 신호 처리 방법 및 장치
JP6476900B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
US10638155B2 (en) Apparatus for video encoding, apparatus for video decoding, and non-transitory computer-readable storage medium
JP6459761B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
US11089326B2 (en) Moving image encoding device, moving image encoding method, moving image decoding device, and moving image decoding method
JP6528635B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2015211386A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2017073602A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
WO2023055300A9 (en) Improved residual sign prediction of transform coefficients in video coding
JP6248783B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
CN108259899B (zh) 视频编码及解码设备和方法、计算机可读存储介质
JP6435822B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
KR20240089081A (ko) 비디오 코딩에서 변환 계수의 개선된 잔차 부호 예측
KR20220007523A (ko) 영상 부호화/복호화 방법 및 장치
JP2015226263A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2017168955A (ja) 画像復号装置、画像復号プログラム及びチップ
KR20130107611A (ko) 상향식 예측 모드 방법을 사용한 영상 부복호화 방법 및 이러한 방법을 사용하는 장치