JP6497100B2 - 映像符号化装置、方法及びプログラム - Google Patents

映像符号化装置、方法及びプログラム Download PDF

Info

Publication number
JP6497100B2
JP6497100B2 JP2015023563A JP2015023563A JP6497100B2 JP 6497100 B2 JP6497100 B2 JP 6497100B2 JP 2015023563 A JP2015023563 A JP 2015023563A JP 2015023563 A JP2015023563 A JP 2015023563A JP 6497100 B2 JP6497100 B2 JP 6497100B2
Authority
JP
Japan
Prior art keywords
unit
encoding
quantization
coding
transform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015023563A
Other languages
English (en)
Other versions
JP2016146602A (ja
Inventor
中川 聰
聰 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2015023563A priority Critical patent/JP6497100B2/ja
Publication of JP2016146602A publication Critical patent/JP2016146602A/ja
Application granted granted Critical
Publication of JP6497100B2 publication Critical patent/JP6497100B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、映像符号化装置、方法及びプログラムに関し、例えば、複数の異なるサイズの処理単位をツリー状に組み合わせて利用可能な映像符号化方式を用いる映像符号化装置、方法及びプログラムに適用し得るものである。
例えば、H.264/MPEG−4 AVC(Advanced Video Coding:以下、「AVC」とも呼ぶ。)やH.265/MPEG−H HEVC(High Efficiency Video Coding:以下、「HEVC」と呼ぶ。)等に代表される映像符号化方式による映像情報の圧縮符号化処理は、入力された対象画像を分割した処理単位ごとに、イントラ予測や動き補償予測等のインター予測を行った予測画像と、入力された対象画像との差分である予測残差信号に、離散コサイン変換等の空間変換を施した変換係数を量子化して、これをエントロピー符号化することによって高効率の映像圧縮を実現している。
図2は、従来の映像符号化装置の構成を示すブロック図である。図2において、例えばH.265/MPEG−H HEVCのような符号化技術を用いる場合、入力映像が映像符号化装置100に入力される。入力された符号化対象画像は、画面分割部101により処理単位領域ごとに画面分割されて差分処理部111に与えられる。処理単位領域ごとに分割された入力画像は、差分処理部111により、動き補償を伴うインター予測部109による予測画像、若しくは、イントラ予測部110による予測画像との差分である予測残差信号が求められる。そして、予測残差信号は、変換部102により、DCT(離散コサイン変換)やDST(離散サイン変換)されて、得られた変換係数が量子化部103により量子化される。エントロピー符号化部104では、量子化された変換係数を、可変長符号や算出符号等のようなエントロピー符号化して符号化ストリームとして出力する。
量子化された変換係数は、逆量子化部105で逆量子化、逆変換部106で逆変換されて、加算部112で予測画像と加算することによって復号側で生成される復号画像を得る。
さらに、HEVC等の映像符号化方式の場合、復号画像は、ブロック歪を軽減するデブロッキングフィルタなどのループ内フィルタ107が適用され、後続の画像の符号化時のインター予測の動き補償のための参照画像として参照画像バッファ108に保持される。
量子化を伴う符号化方式の場合、量子化処理により量子化雑音が発生し、復号側で再生される復号画像に歪が生じる。一方で、量子化することによって、符号化すべき情報量が削減され、高効率の圧縮が実現される。
このような歪とレート(符号量)のトレードオフを評価し、符号化モード選択等に利用する技術としてレート歪最適化技術がある。つまり、符号量を多くすることで画像の歪を軽減することができるが、符号量が多くなって圧縮率が低下するとともに符号化に係る演算処理の負荷が大きくなる。そのため、画像の歪と圧縮率に係る符号量との最適化を図るために、レート歪最適化技術がある。
レート歪最適化技術は、複数の符号化モード等の選択肢について、その選択肢を選択した場合に得られる復号画像の歪Dと、その選択肢で符号化するときに発生する符号量Rと、ラグランジュ乗数λとで表されるレート歪コストJ=D+λ・Rを最小化するような選択をすることによって、レートと歪とのトレードオフが最適な符号化をする方法である。
非特許文献1には、このレート歪最適化技術を変換係数の量子化に利用するレート歪最適量子化(RDOQ)の方法が開示されている。レート歪最適量子化は、個々の変換係数ごとに量子化レベル候補に量子化した場合の歪と、量子化レベル候補をエントロピー符号化するのに必要となる符号量(レート)とのトレードオフを評価し、レート歪コストが最適となる量子化レベルを選択することで、符号化効率が最適となるような量子化を行う方法である。HEVCにおいても、符号化効率向上のための量子化技術としてレート歪最適量子化が用いられている。
HEVCでは、図3に示すように、これまでのAVC等の映像符号化方式における符号化単位となる16×16画素単位のマクロブロックを拡張して、最大64×64画素の符号化ツリー単位(以下、「CTU」とも呼ぶ。)を、8×8画素から64×64画素まで(すなわち、8×8、16×16、32×32、64×64の画素)の符号化単位であるコーディングユニット(以下、「CU」とも呼ぶ。)の4分木構造の「符号化ツリー」として、表現することが可能となっており、多様なブロックサイズでの符号化が可能となっている。
さらに、コーディングユニット(CU)は、4×4画素から32×32画素まで(すなわち、4×4、8×8、16×16、32×32画素)の変換単位である変換ユニット(以下、「TU」とも呼ぶ。)に、4分木構造の「残差ツリー」として分割可能であり、コーディングユニット(CU)の予測残差信号を様々なサイズの変換単位を組み合わせて変換・量子化して符号化することが可能となっている。図3において、実線部分がコーディングユニット(CU)を示し、破線部分が変換ユニット(TU)を示している。言い換えれば、実線部分は、符号化ツリーであり、破線部分は、残差ツリーとも言える。
また、コーディングユニット(CU)は、垂直/水平方向に分割した予測ユニット(以下、「PU」とも呼ぶ。)に分割可能である。例えば、動き補償予測等は、図4に示すように、コーディングユニット(CU)のサイズ2N×2Nに対して、2N×2N、2N×N、N×2N、N×Nや非対称な分割形状などに分割した領域単位(予測単位)での予測が可能となっている。
HEVCを符号化方式として用いる場合、多様なコーディングユニット(CU)、変換ユニット(TU)、予測ユニット(PU)の組み合わせが可能であるため、符号化ツリーや残差ツリー及び符号化モード(イントラモード、インターモード、スキップモード等)の組み合わせの中から最適な組み合わせを選択することが符号化効率に大きな影響を与える。
最適な組み合わせを選択するためには、非常に多くの組み合わせの符号化候補に対して、レート歪コストを評価する必要があり、この探索処理を効率的に行う技術が求められている。例えば、非特許文献2には、残差ツリーをさらに分割するかを量子化パラメータ依存の閾値から判断して、閾値以下の変換係数しか存在しない場合に、より小さな変換サイズに分割する探索処理を省略する方法が開示されている。
M.Karczewicz,et al."Rate Distortion Optimized Quantization",JVT−AA026.(http://ftp3.itu.int/av−arch/jvt−site/2008_04_Geneva/JVT−AA026.zip) M.Siekmann,et al."Fast encoder control for RQT,"JCTVC−E425(http://phenix.it−sudparis.eu/jct/doc_end_user/documents/5_Geneva/wg11/JCTVC−E425−v3.zip)
しかしながら、レート歪最適量子化処理は、演算処理量が多く、HEVCの様に利用可能な変換単位の組み合わせや利用可能な符号化単位と符号化モードの組み合わせが膨大にある場合、最適な量子化結果を得るための処理量は膨大なものとなる。
そのため、符号化ツリー単位を符号化する際に、符号化ツリーや残差ツリーと符号化モードの組み合わせを探索するときの量子化処理にかかわる処理量を削減することができる映像符号化装置、方法及びプログラムが求められている。
第1の本発明は、入力画像の符号化ツリー単位を複数の異なるサイズの符号化単位に分割し、上記各符号化単位を、複数の異なるサイズの変換単位に分割する木構造で示した変換単位の組み合わせを利用して入力画像を符号化する映像符号化装置において、(1)利用可能な上記変換単位毎に、入力画像と予測画像との差分である予測残差を変換した変換係数を、量子化オフセットにより量子化する仮量子化手段と、(2)上記仮量子化手段による仮量子化結果に基づいて、符号化コストを評価する符号化コスト判定手段と、(3)上記各符号化単位、上記各符号化単位のモード、及び上記変換単位の組み合わせで構成される上記符号化ツリー単位の符号化候補の内、最適な符号化コストの当該符号化候補を選択する符号化候補選択手段と、(4)選択された上記符号化候補に対する変換係数に対してレート歪最適量子化処理を行う量子化手段とを有し、(5)上記量子化手段は、上記符号化候補のルートノードから再帰的に、木構造の各ノードに対する量子化処理を行うが、一方、上記仮量子化結果に基づき、残差なしとする上記変換単位又は上記符号化単位に対しては、量子化処理を行わず、(6)上記各符号化単位のモードは、上記各符号化単位がイントラ符号化単位又はインター符号化単位のいずれかを示すモードであり、上記量子化手段は、量子化対象の上記変換単位が上記イントラ符号化単位に含まれる場合には、入力画像と再度イントラ予測処理を行った予測画像との差分である予測残差を変換した変換係数に対して量子化処理を行うことを特徴とする。
第2の本発明は、入力画像の符号化ツリー単位を複数の異なるサイズの符号化単位に分割し、上記各符号化単位を、複数の異なるサイズの変換単位に分割する木構造で示した変換単位の組み合わせを利用して入力画像を符号化する映像符号化方法において、(1)仮量子化手段が、利用可能な上記変換単位毎に、入力画像と予測画像との差分である予測残差を変換した変換係数を、量子化オフセットにより量子化し、(2)符号化コスト判定手段が、上記仮量子化手段による仮量子化結果に基づいて、符号化コストを評価し、(3)符号化候補選択手段が、上記各符号化単位、上記各符号化単位のモード、及び上記変換単位の組み合わせで構成される上記符号化ツリー単位の符号化候補の内、最適な符号化コストの当該符号化候補を選択し、(4)量子化手段が、選択された上記符号化候補に対する変換係数に対してレート歪最適量子化処理を行い、(5)上記量子化手段は、上記符号化候補のルートノードから再帰的に、木構造の各ノードに対する量子化処理を行うが、一方、上記仮量子化結果に基づき、残差なしとする上記変換単位又は上記符号化単位に対しては、量子化処理を行わず、(6)上記各符号化単位のモードは、上記各符号化単位がイントラ符号化単位又はインター符号化単位のいずれかを示すモードであり、上記量子化手段は、量子化対象の上記変換単位が上記イントラ符号化単位に含まれる場合には、入力画像と再度イントラ予測処理を行った予測画像との差分である予測残差を変換した変換係数に対して量子化処理を行うことを特徴とする。
第3の本発明の映像符号化プログラムは、入力画像の符号化ツリー単位を複数の異なるサイズの符号化単位に分割し、上記各符号化単位を、複数の異なるサイズの変換単位に分割する木構造で示した変換単位の組み合わせを利用して入力画像を符号化する映像符号化装置に搭載されるコンピュータを、(1)利用可能な上記変換単位毎に、入力画像と予測画像との差分である予測残差を変換した変換係数を、量子化オフセットにより量子化する仮量子化手段と、(2)上記仮量子化手段による仮量子化結果に基づいて、符号化コストを評価する符号化コスト判定手段と、(3)上記各符号化単位、上記各符号化単位のモード、及び上記変換単位の組み合わせで構成される上記符号化ツリー単位の符号化候補の内、最適な符号化コストの当該符号化候補を選択する符号化候補選択手段と、(4)選択された上記符号化候補に対する変換係数に対してレート歪最適量子化処理を行う量子化手段として機能させ、(5)上記量子化手段は、上記符号化候補のルートノードから再帰的に、木構造の各ノードに対する量子化処理を行うが、一方、上記仮量子化結果に基づき、残差なしとする上記変換単位又は上記符号化単位に対しては、量子化処理を行わず、(6)上記各符号化単位のモードは、上記各符号化単位がイントラ符号化単位又はインター符号化単位のいずれかを示すモードであり、(7)上記量子化手段は、量子化対象の上記変換単位が上記イントラ符号化単位に含まれる場合には、入力画像と再度イントラ予測処理を行った予測画像との差分である予測残差を変換した変換係数に対して量子化処理を行うことを特徴とする。
本発明によれば、符号化ツリー単位を符号化する際に、符号化ツリーや残差ツリーと符号化モードの組み合わせを探索するときの量子化処理にかかわる処理量を削減することができる。
第1の実施形態に係る映像符号化装置の内部構成を示すブロック図である。 従来の映像符号化装置の構成を示すブロック図である。 4分木構造による符号化単位への分割及び変換単位への分割を説明する説明図である。 符号化単位から予測単位への分割を説明する説明図である。 第1の実施形態に係る符号化ツリー単位(CTU)毎の符号化処理を示すフローチャートである。 第1の実施形態に係るコーディングユニット(CU)毎の量子化処理を示すフローチャートである。 第1の実施形態に係る変換ユニット(TU)毎の量子化処理を示すフローチャートである。
(A)第1の実施形態
以下では、本発明に係る映像符号化装置、方法及びプログラムの第1の実施形態を、図面を参照しながら詳細に説明する。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る映像符号化装置の内部構成を示すブロック図である。第1の実施形態に係る映像符号化装置1は、図1に示す各構成部を搭載した専用のICチップ等のハードウェアとして構成しても良いし、又は、CPUと、CPUが実行するプログラムを中心としてソフトウェア的に構成して良いが、機能的には、図1で表すことができる。
図1において、第1の実施形態に係る映像符号化装置1は、画面分割部101、変換部102、エントロピー符号化部104、逆量子化部105、逆変換部106、ループ内フィルタ部107、参照画像バッファ108、インター予測部109、イントラ予測部110、差分処理部111、加算部112、切り替え部113、量子化部203、仮量子化部220及び符号化コスト判定部221を有する。
映像符号化装置1は、入力映像を所定の符号化方式で符号化して、符号化映像ストリームを出力するものである。
第1の実施形態では、符号化方式がH.265/MPEG−H HEVCで規格化されている符号化方式である場合を例示する。しかし、符号化方式は、H.265/MPEG−H HEVCに限定されるものではなく、符号化単位であるコーディングユニット(CU)の予測残差信号を様々なサイズの変換単位に分割することができ、その変換単位の組み合わせにより量子化して符号化を行うことができるものであれば、様々な符号化方式を適用できる。符号化方式は、H.265/MPEG−H HEVCに限定されず、例えば、H.264/MPEG−4 AVCの規格化技術やH.265/MPEG−H HEVCの規格化技術等を基調として拡張した符号化方式にも適用可能である。
画面分割部101は、符号化対象画像を所定の処理単位に分割するために、入力映像の符号化対象画像を、コーディングユニット等の所定の処理単位領域ごとに分割して、差分処理部111に与えるものである。
差分処理部111は、予測残差信号を求めるために、画面分割部101からの所定の処理単位領域に分割された入力画像と、インター予測部109若しくはイントラ予測部110からの、上記処理単位領域に対応する予測画像との差分を求め、その差分を予測残差信号として変換部102に与えるものである。
変換部102は、入力された予測残差信号を変換係数に変換するものである。変換部102は、利用することが可能な変換単位毎の変換係数を求めるものである。
利用することが可能な変換単位は映像符号化装置1における符号化単位(CUのサイズ)によるが、例えば、符号化単位が64×64画素の場合、変換単位は4×4画素、8×8画素、16×16画素、32×32画素とすることができ、変換部102は、上記それぞれの変換単位の変換係数を求める。なお、変換部102による予測残差信号の変換手法は、既存の変換手法を広く適用することができ、例えば、DCT(離散コサイン変換)やDST(離散コサイン変換)等を適用できる。変換部102は、変換した変換係数を仮量子化部220及び量子化部203に与える。
仮量子化部220は、変換部102により変換された各変換単位の各変換係数を、演算処理の負荷が比較的少ない量子化処理で、量子化するものである。
第1の実施形態では、仮量子化部220が量子化オフセットを用いて、各変換単位の各変換係数を量子化するものとする。また、仮量子化部220は、量子化した各変換単位の各変換係数を符号化コスト判定部221に与えるものである。仮量子化部220による量子化処理の例については動作の項で詳細に説明する。
符号化コスト判定部221は、仮量子化部220による仮量子化結果(量子化した各変換単位の各変換係数)を用いて符号化コストを評価するものである。符号化コスト判定部221は、符号化コストの評価により最終的に最適な符号化コストと評価された符号化候補を選択するが、この処理の詳細については動作の項で説明する。
量子化部203は、符号化コスト判定部221により選択(抽出)された符号化候補に基づいて、その処理単位の組み合わせの各変換単位の変換係数を変換部102から取得し、その取得した変換係数に対してレート歪最適量子化処理を用いて量子化を行う。量子化部203は、得られた量子化された変換係数をエントロピー符号化部104及び逆量子化部105に出力する。
エントロピー符号化部104は、符号の出現確率の偏りを圧縮するために、量子化部203からの量子化された変換係数等をエントロピー符号化して、符号化映像ストリームを出力するものである。
逆量子化部105は、符号化信号から残差信号(残差画像)を復元するために、量子化部203からの量子化された変換係数を逆量子化するものである。
逆変換部106は、逆量子化部105により逆量子化された信号を逆変換して残差信号(残差画像)を復元して、加算部112に与えるものである。
加算部112は、逆変換部106からの復元された残差信号に、切り替え部113を介してインター予測部109又はイントラ予測部110からの予測画像を加算して、復号側で復号される復号画像を求めるものである。加算部112は、復号画像を、ループ内フィルタ部107及びイントラ予測部110に与えるものである。
ループ内フィルタ部107は、符号化ループ内の量子化処理によって生じる符号化歪み(例えばブロック歪、リンギング歪等)を低減するために、加算部112からの復号画像をフィルタリングするものである。第1の実施形態はHEVC等を適用する場合を例示しており、デブロッキングフィルタ等のループ内フィルタ部107を用いて符号化歪みを低減する。
参照画像バッファ108は、ループ内フィルタ部107から出力される画像を、参照画像として保持するものである。ループ内フィルタ部107からの出力画像が、後続の入力画像の符号化時のインター予測の動き補償のための参照画像となる。
インター予測部109は、参照画像バッファ108に保持されている画像を参照画像として取得して動き補償予測を行うものである。
イントラ予測部110は、加算部112から出力される画像(画面内の符号化済み画素等)を用いてイントラ予測を行うものである。
切り替え部113は、符号化モード(イントラモード又はインターモード)に応じて、インター予測部109又はイントラ予測部110の出力を切り替えるものである。
以下に、この実施形態における符号化処理の単位について説明する。
図3は、4分木構造による符号化単位への分割及び変換単位への分割を説明する説明図である。
図3(A)は、最も大きい実線の四角形が符号化ツリー単位(CTU)(例えば64×64画素サイズ)の画像の模式図であり、実線は符号化単位(CU)への分割領域を示しており、破線は符号化単位の変換単位(TU)への分割を示している。図3(B)は、図3(A)の分割領域を4分木構造で表現したものである。図3(B)の頂点は64×64画素サイズとしており、頂点からの4個の分枝は、64×64画素サイズを4分割したときの各分割領域を示しており、左から順番に、左上領域、右上領域、左下領域、右下領域に対応している。なお、32×32サイズ以降の分枝も同様に各領域を示している。つまり、図3(B)は、符号化単位への分割と変換単位への分割を4分木構造で示しているため、ツリー構造の終端が各変換単位であることを意味する。
図4は、符号化単位(CU)から予測単位(PU)への分割を説明する説明図である。図4において、分割された各領域は、予測単位を示す。この実施形態では、符号化モードに応じてCUを複数種類の矩形領域である予測単位に分割し、それぞれの予測単位で予測処理が行われる。インター予測におけるPUは、8種類であり、イントラ予測は2種類である。分割された各PUについて先述のインター予測部109によるインター予測、イントラ予測部110によるイントラ予測が行われる。なお、残差信号を符号化しないスキップCU(図4中の「Skip」)の予測単位は、CU全体である。
(A−2)第1の実施形態の動作
次に、第1の実施形態に係る映像符号化装置1における符号化処理を、図面を参照しながら詳細に説明する。
図1において、映像符号化装置1に入力した入力映像が画面分割部101に入力されると、符号化対象映像は、画面分割部101により符号化処理単位領域ごとに分割されて差分処理部111に与えられる。
インター予測部109では、参照画像バッファ108に保持されている画像を参照画像として動き補償を伴うインター予測画像が予測され、その動き補償を伴う予測画像が生成される。また、イントラ予測部110では、画面内の符号化済みの画素等に基づいてイントラ予測画像が生成される。
切り替え部113は、符号化モードに応じて、インター予測部109又はイントラ予測部110のいずれかに切り替え、インター予測画像又はイントラ予測画像のいずれを差分処理部111に与える。
差分処理部111では、符号化処理単位領域に対して、入力画像と予測画像との差分が求められ、その差分が予測残差信号として、変換部102に出力される。
予測残差信号は変換部102に入力され、DCT(離散コサイン変換)やDST(離散サイン変換)によって変換係数に変換される。なお、変換係数は、後述する符号化候補に応じて出力される。
得られた変換係数は、仮量子化部220に入力され、演算処理の軽量な量子化オフセットを用いる量子化処理によって量子化される。
符号化コスト判定部221では、仮量子化結果の量子化された変換係数をもとに、量子化に伴う歪Dや量子化された変換係数をエントロピー符号化するのに必要となる符号量Rを計算して符号化コストを評価し、符号化ツリーや残差ツリーと符号化モードの組み合わせを選択する。選択された組み合わせ(符号化候補)は、量子化部203に出力される。
選択された符号化候補は、量子化部203でレート歪最適量子化技術を用いて量子化が行われる。
そして、量子化された変換係数は、符号化モード情報、動きベクトル情報、イントラ予測モード情報等とともにエントロピー符号化部104により、エントロピー符号化され、符号化ストリームとして出力される。
一方、逆量子化部105及び逆変換部106において、量子化部203で量子化された変換係数は、逆量子化・逆変換され(残差信号を復元)、加算部112により逆量子化・逆変換された信号が予測画像と加算されて、復号画像が復元される。復元された復号画像は、ループ内フィルタ部107及び画面内の後続のイントラ予測単位のイントラ予測のための隣接領域の参照画素としてイントラ予測部110に与えられる。
ループ内フィルタ部107において、復号画像はブロッキングフィルタ等のフィルタ処理が施されて、符号化歪みが軽減されて、参照画像バッファ108に保持される。
また、加算部112による復元された復号画像は、イントラ予測部110に与えられて、画面内の後続のイントラ予測単位のイントラ予測のための隣接領域の参照画素として利用される。
次に、第1の実施形態に係る仮量子化部220、符号化コスト判定部221及び量子化部203におけるより詳細な動作を、図5を参照しながら説明する。
図5は、第1の実施形態に係る符号化ツリー単位(CTU)毎の符号化処理を示すフローチャートである。
本実施形態では、符号化候補はCTUごとに選択される。そして、選択された符号化候補に対してレート歪最適量子化が行われる。
符号化候補の選択は、CUの分割、CUの符号化モード、PUの分割、TUの分割を各要素として、その各要素の組み合わせて定まる符号化候補について、変換単位毎に変換し仮量子化部220で量子化した仮量子化結果に基づき、符号化候補の符号化コストを評価することにより決定される(S11)。なお、符号化候補の探索の戦略については、さまざまな探索方法を用いることができる。以下に、仮量子化部220と符号化コスト判定部221でのより詳細な動作を説明する。
仮量子化部220では、変換部102により変換された各変換単位の各変換係数に対して、演算処理の軽量な量子化オフセットを用いて量子化する。
ここで、仮量子化部220は、各変換単位の各変換係数dの絶対値に対して量子化ステップ幅qを除算するのではなく、除算を乗算とビットシフトで近似した式(1)に従って、各変換係数dの絶対値|d|にスケール係数aを乗算してsビットの固定少数で近似した量子化オフセット値を加算することで、各変換係数dの絶対値|d|に対する量子化された変換係数cの絶対値|c|を求める。
|c|=(a×|d|+f)>>s …(1)
式(1)において、fは、量子化ステップ幅に対する量子化オフセット値である。仮量子化部220は、例えば量子化ステップ幅qに対する量子化オフセット値fを用いて量子化に係る演算処理量を軽減して、各変数係数を量子化する。
例えば、量子化ステップ幅qに関して、イントラ画像(イントラピクチャ)のときには量子化オフセットがq/3となるように量子化オフセット値f=2/3とし、またインター画像(インターピクチャ)のときには量子化オフセットがq/6となるように量子化オフセット値f=2/6等のようにする。仮量子化部220は、変換部102により変換された各変換単位の各変数係数の絶対値|d|にスケール係数aを乗算し、量子化オフセット値fを加算するという、演算処理量の少ない量子化オフセットを用いて量子化を行う。
なお、上記の例では、量子化ステップ幅qとする場合に、イントラ画像のときにはf=2/3とし、またインター画像のときにはf=2/6を用いる場合を例示したが、量子化オフセットの値は上記値に限定するものではない。
次に、仮量子化部220によって変換単位毎に量子化された各変換係数は、符号化コスト判定部221に与えられる。
符号化コスト判定部221では、仮量子化部221で量子化された変換係数に基づいて、符号化候補の量子化に伴う歪Dと量子化された変換係数をエントロピー符号化するのに必要となる符号量Rを計算して符号化コストJ=D+λRを評価する。ここで、λは量子化パラメータなどから求められるラグランジュ乗数である。歪Dの評価については、得られた仮量子化結果の変換係数を逆量子化・逆変換して予測画像に加算して得られる復号画像の入力画像に対する歪で評価する。なお、歪Dを求める方法としては逆変換を用いずに、量子化前の変換係数と仮量子化後の変換係数を逆量子化した係数との間の歪を用いて算出しても良い。
以上のステップS11の処理で選択された符号化候補に対してのみ、量子化部203によるレート歪最適量子化技術を用いて量子化(再量子化)を行う(S12)。
まず、ステップS102の処理は、選択された符号化候補(CTU)について、その構成要素であるコーディングユニット(CU)毎に行われる。さらに、コーディングユニット(CU)が、変換ユニット(TU)で構成されていた場合には、変換ユニット(TU)毎に処理が行われる(この処理の詳細な説明は、後述する図7の説明において行う)。
図6は、第1の実施形態に係るコーディングユニット(CU)毎の量子化処理を示すフローチャートである。CUは、ツリー状に再帰的に4分割可能なため、図6に示す処理は、CUが分割されていた場合には再帰的に処理を行う。
まず、処理対象のCUが分割されているか否かを判定する(S21)。
先述のステップS21の処理において、処理対象のCUが分割されていたと判定された場合には、分割された4つのサブCUに対して、図6で示すCU毎の量子化処理を再帰的に行う(S22)。
先述のステップS21の処理において、CUが分割されていなかったと判定された場合には、処理対象CUがスキップCUとして選択されていたかどうかを判定する(S23)。なお、スキップCUとは動きベクトルも残差情報も符号化しない特別なインターCUモードであり、先述の仮量子化部221での量子化処理で残差なしと判断されたCUである。よって、スキップCUの場合には、以下の量子化処理は行わない(当該CUについて、図6で示す処理を終了する)。
先述のステップS23の処理において、スキップCU以外のCUと判定されたCUについては、量子化部203による量子化処理を行う(S24)。具体的には、処理対象のTU(言い換えれば、残差ツリーのルートノードであるCU)から、再帰的に図7で示すTUごとの量子化処理を行う。
図7は、第1の実施形態に係る変換ユニット(TU)毎の量子化処理を示すフローチャートである。TUは、ツリー状に再帰的に4分割可能なため、図7に示す処理は、TUが分割されていた場合は再帰的に処理を行う。
まず、処理対象のTUが、分割されている否かを判定する(S31)。
先述のステップS31の処理において、処理対象のTUが分割されていると判定された場合には、分割された4つのサブTUに対して、図7で示すTUごとの量子化処理を再帰的に行う(S32)。
先述のステップS31の処理において、処理対象のTUが分割されていないと判定された場合には、処理対象TUを含むCUとしてイントラCUが選択されていたか否かを判定する(S33)。
先述のステップS33の処理において、処理対象TUを含むCUがイントラCUであった場合には、イントラ予測により参照される隣接する領域の画素が、再量子化によって変化している可能性があるため、イントラ予測部110、差分処理部111及び変換部102を用いて変換係数を再生成する(S34)。なお、処理対象TUのイントラ予測時に参照する隣接参照画素が、仮量子化処理時から変化していないと判断できる場合には、ステップS34の処理を省略しても良い。
先述のステップS33の処理において、処理対象TUを含むCUがイントラCUでなかった場合には、処理対象のTUが仮量子化部221での量子化処理で残差なしと判断されていたか否かを判定する(S35)。残差なしと判断されていた場合には、処理対象のTUは、以下の量子化処理は行わない(当該TUについて、図7で示す処理を終了する)。なお、ステップS35(ステップS23も同様)の処理結果により、後続の量子化処理を省略する処理は、ユーザ設定等により禁止しても良い。すなわち、仮量子化部221で残差なしと判断された処理対象についても、量子化部203で再度量子化を試みることも可能とするような構成としても良い。
最終的に、処理対象のTUは、量子化部203によりレート歪最適量子化技術を用いた量子化処理が行われる(S36)。すなわち、量子化処理は、変換単位(TU)内の各変換係数に対して、個々の変換係数を量子化レベル候補に量子化した場合の歪みと量子化レベル候補をエントロピー符号化するのに必要となる符号量を評価し、レート歪コストが最適となる量子化レベルを選択することで行われる。量子化対象の変換係数は、ステップS11の処理で選択された符号化候補について、変換部102から仮量子化部221に供給された変換係数を記憶しておいたもの、若しくはステップS34の処理で再生成した変換係数である。
なお、この実施形態では、ステップS33及びS34の処理において、処理対象TUを含むCUがイントラCUであった場合には、変換係数を再生成するものとしているが、当該CUがインターCU(インター予測を用いたCU)であった場合も同様に、インター予測部109、差分処理部111、変換部102を用いて変換係数を再生成するようにしても良い。この場合、変換部102から仮量子化部221に供給された変換係数を記憶しない構成や、変換係数の代替えとして、予測画像もしくは予測残差信号を記憶しておき、変換係数を再生成する構成としても良い。
以上の処理によって生成された符号化ツリー単位(CTU)の量子化された変換係数を、選択された符号化候補に関する符号化モード情報、動きベクトル情報、イントラ予測モード情報等とともにエントロピー符号化部104でエントロピー符号化して符号化ストリームとして出力する。
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、以下のような効果を奏することができる。
符号化ツリー単位で符号化する場合であって、符号化ツリー、残差ツリー、符号化モードの組み合わせを探索する際に、量子化処理の処理量を削減することができ、また、従来技術のように符号化候補探索時にもレート歪最適量子化技術を用いるのと同等の符号化効率を得ることが可能となる。
(B)他の実施形態
上記実施形態に加えて、さらに、以下に例示するような変形実施形態も挙げることができる。
(B−1)本発明は、上記実施形態に限定されず、その他のさまざまな符号化処理に利用可能である。すなわち、上述した各実施形態では符号化方式がHEVCの場合に例示したが、符号化方式はHEVCに限定されるものではなく、複数の異なるサイズの処理単位をツリー状に組み合わせて利用可能なその他のさまざまな符号化方式において、同様の処理を行うことで処理量を低減することができる。
(B−2)上記実施形態では、符号化候補の探索時の量子化処理には仮量子化しか用いない動作について説明したが、このような動作モードのほかに、符号化候補の探索時にもレート歪最適量子化を用いる等複数の動作モードを有し、設定により処理量や符号化効率の異なる動作モードを選択できるような構成としても良い。
1…映像符号化装置、101…画面分割部、102…変換部、104…エントロピー符号化部、105…逆量子化部、106…逆変換部、107…ループ内フィルタ部、108…参照画像バッファ、109…インター予測部、110…イントラ予測部、111…差分処理部、112…加算部、113…切り替え部、203…量子化部、220…仮量子化部、221…符号化コスト判定部。

Claims (8)

  1. 入力画像の符号化ツリー単位を複数の異なるサイズの符号化単位に分割し、上記各符号化単位を、複数の異なるサイズの変換単位に分割する木構造で示した変換単位の組み合わせを利用して入力画像を符号化する映像符号化装置において、
    利用可能な上記変換単位毎に、入力画像と予測画像との差分である予測残差を変換した変換係数を、量子化オフセットにより量子化する仮量子化手段と、
    上記仮量子化手段による仮量子化結果に基づいて、符号化コストを評価する符号化コスト判定手段と、
    上記各符号化単位、上記各符号化単位のモード、及び上記変換単位の組み合わせで構成される上記符号化ツリー単位の符号化候補の内、最適な符号化コストの当該符号化候補を選択する符号化候補選択手段と、
    選択された上記符号化候補に対する変換係数に対してレート歪最適量子化処理を行う量子化手段とを有し、
    上記量子化手段は、上記符号化候補のルートノードから再帰的に、木構造の各ノードに対する量子化処理を行うが、一方、上記仮量子化結果に基づき、残差なしとする上記変換単位又は上記符号化単位に対しては、量子化処理を行わず、
    上記各符号化単位のモードは、上記各符号化単位がイントラ符号化単位又はインター符号化単位のいずれかを示すモードであり、
    上記量子化手段は、量子化対象の上記変換単位が上記イントラ符号化単位に含まれる場合には、入力画像と再度イントラ予測処理を行った予測画像との差分である予測残差を変換した変換係数に対して量子化処理を行う
    ことを特徴とする映像符号化装置。
  2. 上記符号化コスト判定手段が、符号化コストが最適であると判断した上記変換単位に対する変換係数を記憶しておき、
    上記量子化手段が、上記記憶されている変換係数を用いて量子化処理を行う
    ことを特徴とする請求項1に記載の映像符号化装置。
  3. 上記量子化手段は、上記イントラ予測に用いる隣接参照画素が上記仮量子化手段による仮量子化時に用いた画素から変化していない場合には、当該仮量子化時に用いた変換係数を用いることを特徴とする請求項1又は2に記載の映像符号化装置。
  4. 上記符号化コスト判定手段が、符号化コストに用いる歪の算出時には、逆変換を用いずに変換係数領域で歪を評価することを特徴とする請求項1〜のいずれかに記載の映像符号化装置。
  5. 画像の符号化に用いる符号化方式がH.265/MPEG−H HEVCであることを特徴とする請求項1〜のいずれかに記載の映像符号化装置。
  6. 画像の符号化に用いる符号化方式がH.264/MPEG−4 AVCであることを特徴とする請求項1〜のいずれかに記載の映像符号化装置。
  7. 入力画像の符号化ツリー単位を複数の異なるサイズの符号化単位に分割し、上記各符号化単位を、複数の異なるサイズの変換単位に分割する木構造で示した変換単位の組み合わせを利用して入力画像を符号化する映像符号化方法において、
    仮量子化手段が、利用可能な上記変換単位毎に、入力画像と予測画像との差分である予測残差を変換した変換係数を、量子化オフセットにより量子化し、
    符号化コスト判定手段が、上記仮量子化手段による仮量子化結果に基づいて、符号化コストを評価し、
    符号化候補選択手段が、上記各符号化単位、上記各符号化単位のモード、及び上記変換単位の組み合わせで構成される上記符号化ツリー単位の符号化候補の内、最適な符号化コストの当該符号化候補を選択し、
    量子化手段が、選択された上記符号化候補に対する変換係数に対してレート歪最適量子化処理を行い、
    上記量子化手段は、上記符号化候補のルートノードから再帰的に、木構造の各ノードに対する量子化処理を行うが、一方、上記仮量子化結果に基づき、残差なしとする上記変換単位又は上記符号化単位に対しては、量子化処理を行わず、
    上記各符号化単位のモードは、上記各符号化単位がイントラ符号化単位又はインター符号化単位のいずれかを示すモードであり、
    上記量子化手段は、量子化対象の上記変換単位が上記イントラ符号化単位に含まれる場合には、入力画像と再度イントラ予測処理を行った予測画像との差分である予測残差を変換した変換係数に対して量子化処理を行う
    ことを特徴とする映像符号化方法。
  8. 入力画像の符号化ツリー単位を複数の異なるサイズの符号化単位に分割し、上記各符号化単位を、複数の異なるサイズの変換単位に分割する木構造で示した変換単位の組み合わせを利用して入力画像を符号化する映像符号化装置に搭載されるコンピュータを、
    利用可能な上記変換単位毎に、入力画像と予測画像との差分である予測残差を変換した変換係数を、量子化オフセットにより量子化する仮量子化手段と、
    上記仮量子化手段による仮量子化結果に基づいて、符号化コストを評価する符号化コスト判定手段と、
    上記各符号化単位、上記各符号化単位のモード、及び上記変換単位の組み合わせで構成される上記符号化ツリー単位の符号化候補の内、最適な符号化コストの当該符号化候補を選択する符号化候補選択手段と、
    選択された上記符号化候補に対する変換係数に対してレート歪最適量子化処理を行う量子化手段として機能させ
    上記量子化手段は、上記符号化候補のルートノードから再帰的に、木構造の各ノードに対する量子化処理を行うが、一方、上記仮量子化結果に基づき、残差なしとする上記変換単位又は上記符号化単位に対しては、量子化処理を行わず、
    上記各符号化単位のモードは、上記各符号化単位がイントラ符号化単位又はインター符号化単位のいずれかを示すモードであり、
    上記量子化手段は、量子化対象の上記変換単位が上記イントラ符号化単位に含まれる場合には、入力画像と再度イントラ予測処理を行った予測画像との差分である予測残差を変換した変換係数に対して量子化処理を行う
    ことを特徴とする映像符号化プログラム。
JP2015023563A 2015-02-09 2015-02-09 映像符号化装置、方法及びプログラム Active JP6497100B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015023563A JP6497100B2 (ja) 2015-02-09 2015-02-09 映像符号化装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015023563A JP6497100B2 (ja) 2015-02-09 2015-02-09 映像符号化装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2016146602A JP2016146602A (ja) 2016-08-12
JP6497100B2 true JP6497100B2 (ja) 2019-04-10

Family

ID=56685623

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015023563A Active JP6497100B2 (ja) 2015-02-09 2015-02-09 映像符号化装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6497100B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2681209T3 (es) * 2009-09-10 2018-09-12 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Técnicas de aceleración para una cuantificación optimizada de tasa de distorsión
US20120307890A1 (en) * 2011-06-02 2012-12-06 Microsoft Corporation Techniques for adaptive rounding offset in video encoding
US10085024B2 (en) * 2012-04-13 2018-09-25 Qualcomm Incorporated Lookup table for rate distortion optimized quantization
JP6402520B2 (ja) * 2014-07-22 2018-10-10 沖電気工業株式会社 符号化装置、方法、プログラム及び機器

Also Published As

Publication number Publication date
JP2016146602A (ja) 2016-08-12

Similar Documents

Publication Publication Date Title
US20240348839A1 (en) Video encoding method for encoding division block, video decoding method for decoding division block, and recording medium for implementing the same
CN110024392B (zh) 用于视频译码的低复杂度符号预测
WO2018061588A1 (ja) 画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラム
US9497472B2 (en) Parallel context calculation in video coding
CN107396117B (zh) 视频编码和解码方法及非暂时性计算机可读存储介质
JP5566529B2 (ja) 辞書を用いてビデオをコード化する方法
CA2796778C (en) Methods and devices for encoding and decoding transform domain filters
JP7150861B2 (ja) ビデオコーディングのための空間変動変換
JP2010135864A (ja) 画像符号化方法及び装置並びに画像復号化方法及び装置
KR20120051639A (ko) 화상 처리 장치 및 방법
KR20120116936A (ko) 영상 블록 코딩 및 재구성 방법
KR20140046055A (ko) 계수들의 직사각형 블록의 양자화 및 역양자화를 위한 방법들 및 장치
KR20120009693A (ko) 다중 예측 필터를 이용하는 경쟁기반 인트라 예측 부호화/복호화 장치 및 방법
US20210014489A1 (en) Intra prediction device, image encoding device, image decoding device and program
JP6708211B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体
JP6528635B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2014207713A (ja) 動画像復号化方法
JP6402520B2 (ja) 符号化装置、方法、プログラム及び機器
US20120027080A1 (en) Encoder and encoding method using coded block pattern estimation
JP6497100B2 (ja) 映像符号化装置、方法及びプログラム
KR102062894B1 (ko) 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체
KR20170122351A (ko) 화면 내 예측 방향성에 따른 적응적 부호화 순서를 사용하는 비디오 코딩 방법 및 장치
KR101796876B1 (ko) 움직임 추정을 이용한 영상 부호화 방법 및 장치
CN105049846A (zh) 图像和视频编解码的方法和设备
JP6485045B2 (ja) インデックス演算装置、プログラム及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180710

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190225

R150 Certificate of patent or registration of utility model

Ref document number: 6497100

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150