JP6341202B2 - 動画像符号化装置、動画像符号化方法、およびプログラム - Google Patents

動画像符号化装置、動画像符号化方法、およびプログラム Download PDF

Info

Publication number
JP6341202B2
JP6341202B2 JP2015522495A JP2015522495A JP6341202B2 JP 6341202 B2 JP6341202 B2 JP 6341202B2 JP 2015522495 A JP2015522495 A JP 2015522495A JP 2015522495 A JP2015522495 A JP 2015522495A JP 6341202 B2 JP6341202 B2 JP 6341202B2
Authority
JP
Japan
Prior art keywords
picture
quantization step
macroblock
target
complexity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015522495A
Other languages
English (en)
Other versions
JPWO2014199566A1 (ja
Inventor
芙美代 鷹野
芙美代 鷹野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2014199566A1 publication Critical patent/JPWO2014199566A1/ja
Application granted granted Critical
Publication of JP6341202B2 publication Critical patent/JP6341202B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Description

本発明は、動画像処理技術、より具体的には、動画像の符号化技術に関する。
MPEG(Moving Pictures Expert Group)規格により代表される動き補償とDCT(Discrete Cosine Transform)を組み合わせる画像圧縮方式では、伝送路に送出されるビットスストリームが所望のレートになるように、符号量制御が行われている。
図4は、MEPGのレイヤ構造を示す。MPEGでは、シーケンス層、GOP(Group Of Picture)層、ピクチャ層、スライス層、マクロブロック(MB)層からなる階層構造が規定されている。スライス層や、マクロブロック層に含まれるデータ(Qスケール)で量子化ステップを変化させることにより、所定期間で発生する符号量を調整することができる。なお、Qスケールの値が大きいほど、量子化ステップが大きくなるようにされている。以下の説明において、量子化ステップをQで表記する。
図5は、発生符号量と量子化ステップとの関係を示す。図示の例では、量子化ステップがQ1〜Q31の31個の値をとる。図示のように、発生符号量は、量子化ステップとほぼ反比例の関係を有する。そのため、量子化ステップが大きいほど、量子化が粗くなり、発生符号量が少なくなる。逆に、量子化ステップが小さいほど、量子化が細かくなり、発生符号量が多くなる。
符号量制御では、所定の等長化単位(所定数のピクチャ群)毎に、発生符号量の総和(総符号量)が所定の符号量になるように制御が行われる。
符号量制御の方式としては、例えば、MPEG−2 TEST MODEL 5(以下「TM5」という)における制御方式が知られている。
ここで、TM5における符号量制御を説明する。
該手法は、まず、注目ピクチャ群(現在の符号化対象となる、1等長化単位のピクチャ群)の目標符号量を該注目ピクチャ群内の各ピクチャに割り当てる。以下において、1等長化単位のピクチャ群の目標符号量を「Sg」で表記し、1ピクチャの目標符号量を「Sp」で表記する。
図6に示すように、参照画像として使用されるIピクチャ及びPピクチャは、多くの目標符号量Spが割り当てられ、参照画像として使用されないBピクチャは、IピクチャやPピクチャよりも少ない目標符号量Spが割り当てられるようになっている。
その後、注目ピクチャの符号化、符号化されたピクチャの発生符号量に応じた注目ピクチャ群内の残りのピクチャに対する目標符号量Spの再割当てを繰り返すことにより、該注目ピクチャ群内のピクチャの符号化をしていく。
注目ピクチャの量子化ステップQは推定複雑度Xestを用いて、式(1)に従って算出される。
複雑度は、符号化対象の符号化の困難さを示す指標である。該手法は、それまでに符号化した、注目ピクチャと同一のピクチャタイプのピクチャの発生符号量と平均量子化ステップとの積を、注目ピクチャの複雑度Xestとして推定する。
Q=Xest/ Sp(1)
1ピクチャの符号化は、マクロブロック毎に行われる。具体的には、注目ピクチャの1つ目のマクロブロックについては、式(1)により算出した量子化ステップQを適用する。2つ目以降の各マクロブロックについては、既に符号化したマクロブロックの発生符号量の総和と目標符号量Spとの差分に基づいて、該注目ピクチャの総符号量が目標符号量Spに近付くように、量子化ステップQを調整して該マクロブロックに適用する。
なお、図5に示すように、量子化ステップが離散的な値であるため、式(1)に従って算出した量子化ステップQは、Q1〜Q31のいずれかの値に完全に一致するとは限らない。例えば、式(1)に従って算出した量子化ステップQがQ5とQ6の間にある場合には、該ピクチャの総符号量が目標符号量Spを超えないことを保障するためには、量子化ステップQの値としては、大きいほうのQ6が採用される。この点について、以下においても同様であり、説明を繰り返さない。
注目ピクチャの符号化が完了すると、該手法は、発生符号量に基づいて、注目ピクチャ群の総符号量が目標符号量Sgにほぼ一致するように、該ピクチャ群内のまだ符号化されていない各ピクチャに対して、目標符号量の再割当てをし、それらの目標符号量Spを修正する。
そして、次の注目ピクチャに対して、複雑度Xestを推定すると共に、推定した複雑度Xestと修正された該注目ピクチャの目標符号量Spとを用いて、式(1)により量子化ステップQを算出して、該ピクチャを符号化する。
このように、該符号量制御手法は、過去の量子化ステップと総符号量の関係を用いて、現在の平均レートに対してフィードバックする。その結果、短い期間で見た場合に単位時間の平均符号量(平均レート)が増減するものの、長いスパンで見た場合には単位時間の平均符号量が目標符号量になっている。
なお、編集等を前提としたVTR(Videotape Recorder)のようなアプリケーションでは、例えばフレーム毎での編集といった操作があるため、編集単位でその総符号量が一定量を絶対に越えないような制御が必要である。このようなアプリケーションの場合、その発生符号量が上記一定量を超えないことを保障するために、各ピクチャに対して目標符号量を設定する際に、マージンをとる(小さくする)必要がある。
上述した符号量制御手法では、1ピクチャ内のマクロブロック間で比較すると、前段のマクロブロックの予測符号量よりも実際の発生符号量が多い場合には、該ピクチャの予測符号量(目標符号量Spに該当する)を達成するために、後段のマクロブロックは、割り当てられた符号量が減少し、画質が劣化してしまう。また、マクロブロック間で量子化ステップが変動するため、粗く量子化された領域が目立ち主観画質が劣化する。
また、1等長化単位のピクチャ群内のピクチャ間で比較すると、前段のピクチャの予測符号量よりも実際の発生符号量が多い場合には、後段のピクチャは、割り当てられた符号量が減少し、画質が劣化してしまう。後段のピクチャの割り当てられた符号量が減少する理由は、該ピクチャ群の目標符号量Sgを達成する必要があるためである。また、ピクチャ間で量子化ステップが変動するため、粗く量子化されたピクチャが目立ち主観画質が劣化する。
後述する「適応量子化」によりマクロブロックに対して求められた量子化ステップと区別するために、上記の手法によりマクロブロックに対して求められる量子化ステップを「基準量子化ステップ」という。すなわち、基準量子化ステップは、注目ピクチャの1つ目のマクロブロックについては、式(1)により算出された量子化ステップQであり、2つ目以降の各マクロブロックについては、既に符号化したマクロブロックの発生符号量に基づいて量子化ステップQを調整したものである。
TM5では、人間の視覚特性に合わせて上述した基準量子化ステップに重み付けを行って該マクロブロックの量子化に適用することで画質を改善する「適応量子化」の手法が用いられている。該手法は、劣化の目立ちやすい部分(例えば平坦部)ではより細かく量子化し、劣化の目立ちにくい部分(例えば絵柄の複雑な部分)では粗く量子化するように、視覚特性を示すパラメータとしてアクティビティを用いて基準量子化ステップに重み付けを行うことで、同程度の符号量で主観画質を向上することができる。この量子化ステップの変更は視覚特性に応じてなされているため、前述のような量子化ステップの変動による主観画質の劣化を回避できる。
適応量子化で視覚特性を示すパラメータとして用いられるアクティビティは、例えば、TM5で採用されているブロックの輝度値の分散を特徴量として用いることにより算出されることが知られている。TM5では、具体的には、下記のように、アクティビティを用いて各マクロブロックの量子化ステップを決定する。
まず、式(2)に従って、16×16画素で構成されるマクロブロック(MBj)のアクティビティact_jを、マクロブロック内の4つの8×8画素のサブブロックの輝度値の分散vblk_n(1<=n<=4)の最小値から求める。
act_j=1+min(vblk_1,vblk_2,vblk_3,vblk_4) (2)
次に、式(3)に従って、同一のピクチャ内の全てのマクロブロックのact_jの平均値avg_actを用いてマクロブロックMBjの正規化アクティビティNact_jを求める。
Nact_j=(2×act_j+avg_act)/(act_j+2×avg_act) (3)
そして、式(4)に従って、適応量子化に基づいたマクロブロックMBjの量子化ステップQact_jを算出する。式(4)において、Qbaseは、上述した基準量子化ステップであり、Nact_jは、式(3)により算出された該マクロブロックMBjの正規化アクティビティである。
Qact _j=Qbase×Nact_j(4)
なお、視覚特性に応じた高い主観画質を達成するためには、各マクロブロックの量子化ステップQact間にアクテビティに応じた差があること、アクティビティが同一ならば同一の量子化ステップが使用されること、の双方を満たすことが望ましいとされている。
なお、上記手法では、輝度値の分散に基づいてアクティビティを算出しているが、例えば、特許文献4に開示されたように、輝度成分と色差成分に基づいてアクティビティを算出することも知られている。
ところが、適応量子化を用いると、マクロブロックに適用される量子化ステップがQbaseからQactへと変更してしまうため、適応量子化を用いない場合より、発生符号量と予測符号量との乖離量が大きくなる。そのため、発生符号量が予測符号量よりも多い場合には、後続の領域(マクロブロックまたはピクチャ)に割り当てられる符号量が少なくなり、後続の領域の画質が劣化する。反対に発生符号量が予測符号量よりも少ない場合には、当該領域の画質は余剰符号量の分損われることになる。
特許文献1には、この問題を回避するための技術が開示されている。該技術は、注目マクロブロックの量子化ステップを決定する際に、仮想バッファに蓄積された発生符号量と予測符号量との差に応じて注目マクロブロックのアクティビティに重みを付ける。具体的には、発生符号量と予測符号量との差が大きいほど、注目マクロブロックのアクティビティの重みを小さくする(請求項6、第2の実施の形態等)。そして、式(4)に対して、重み付けられたアクティビティをNact_jの代りに用いて該マクロブロックの量子化ステップを決定する。
該技術は、発生符号量と予測符号量との差に応じて注目マクロブロックのアクティビティに重みを付けることで総符号量を目標符号量に近付けることができる。しかしながら、アクティビティの重みを変更すると、アクティビティが同一であるマクロブロックでも異なる量子化ステップで符号化されてしまうため、適応量子化の効果が小さくなり、画質が低下するという問題がある。
特許文献2には、アクティビティが同一である領域を同一の量子化ステップで符号化するための技術が開示されている。該技術は、1ピクチャの符号化中において、式(4)における基準量子化ステップQbaseを変化させず、各マクロブロックについて同一の値を用いる。こうすることにより、1つのピクチャにおいて、アクティビティNact_jが同一である各マクロブロックは、量子化ステップQact_jが同一となる。
この技術では、発生符号量が目標符号量と一致しなくなるため、特許文献2には、目標符号量について、20%のマージンをみて決定することが望ましいと記載されている。
特許文献3には、推定した複雑度に基づいて符号量制御を制御する際に、複雑度の推定精度を高める技術が開示されている。TM5の手法は、過去のピクチャの発生符号量と平均量子化ステップとの積を注目ピクチャの複雑度Xestとして推定して、注目ピクチャの発生符号量を予測している。そのため、過去のピクチャとの絵柄が大きく変化している場合や、シーンの切替えが生じた場合など、注目ピクチャと過去のピクチャとの間の相関が低い場合には、注目ピクチャの発生符号量の予測が大きく外れてしまい、符号量の配分が不正確になり、符号化効率が低下するという問題が生じる。
特許文献3に開示された手法は、例えば、段落「0027」〜段落「0032」に記載されたように、シーンチェンジ後初めて符号化するIピクチャについては、その分散値から複雑度Xestを推定し、シーンチェンジ後初めて符号化するPピクチャ及びBピクチャについては、該ピクチャとその参照ピクチャとの間の動きベクトル探索結果の予測誤差値から複雑度Xestを推定する。これらのピクチャの複雑度Xestの推定に際して、下記の式(5)が用いられる。
Xest=a×F2+b×F+c (5)
式(5)において、a、b、cは、ピクチャタイプ毎に夫々定められた固定値である。また、特徴量Fは、Iピクチャの場合においては、該ピクチャの分散値であり、PピクチャまたはBピクチャの場合においては、該ピクチャとその参照ピクチャとの間の動きベクトル探索結果の予測誤差値である。
なお、上記に該当しない各ピクチャについては、TM5の手法と同様に、前に符号化し同タイプのピクチャの発生符号量と平均量子化ステップから複雑度を推定する。
また、特許文献3には、さらに、式(5)に従って推定した複雑度と、符号化結果から得られた複雑度(符号化したピクチャの発生符号量と平均量子化ステップとの積)との関係をピクチャタイプ毎に過去数ピクチャ分蓄積し、蓄積したデータから、ピクチャタイプ毎に、式(5)における各係数を修正することも開示されている。この処理により、複雑度の推定精度をより向上させている。
特開2007−235928号公報 特開平10−224786号公報 特開2002−247584号公報 特開2009−135902号公報
動画像を高画質に符号化するために、アクティビティが同一である部分の量子化ステップをなるべく同一にし、かつ、アクティビティの差に応じて量子化ステップを変化させる必要がある。
特許文献1に開示された技術では、発生符号量を目標符号量に近付けることはできる。しかし、該技術では、アクティビティそのものに重付けをするため、実際のアクティビティが同一であるマクロブロックでも量子化ステップが異なると共に、実際のアクティビティの差が量子化ステップの差にも反映されず、画質が低下するという問題がある。
また、特許文献2に開示された技術は、ピクチャの発生符号量を目標符号量Spに一致させるために、目標符号量Spについて20%のマージンをとる必要がある。しかし、20%の符号量の余剰は視認できる大きな画質劣化をもたらすことが一般的に知られており、この技術では、高画質化の達成が難しい。特に編集を前提としたアプリケーションなど、1フレームなどの狭い領域の発生符号量が一定量を超えることが許可されない場合には、安全のために目標符号量Spのマージンをより大きくとる必要がある。そのため、画質は大きく劣化する。
特許文献3に開示された技術は、注目ピクチャの複雑度の推定精度を高めることができるものの、上述した問題を解決することができない。
本発明は、上記事情に鑑みてなされたものであり、符号化により得られたビットストリームのビットレートが所定の目標レートになるように符号量制御を行う際に、動画像を高画質に符号化する技術を提供する。
本発明の1つの態様は、出力するビットスストリームが目標レートになるように符号量制御を行う動画像符号化装置である。該動画像符号化装置は、注目ピクチャを直交変換して直交変換係数を得る直交変換部と、前記注目ピクチャのマクロブロック毎に、前記直交変換係数を量子化する量子化部と、前記マクロブロックの量子化ステップを算出して前記量子化部に供する量子化ステップ算出部とを備える。
量子化ステップ算出部は、注目ピクチャにおける注目マクロブロックに対して、該注目ピクチャに対して設定された目標符号量に該注目ピクチャの発生符号量を一致させるための変数である基準量子化ステップを求めると共に、算出した前記基準量子化ステップを、前記注目マクロブロックのアクティビティで重み付けることにより、該マクロブロックの量子化に適用される量子化ステップを決定して前記量子化部に供する。
該量子化ステップ算出部は、複雑度推定部と、複雑度補正部と、基準量子化ステップ算出部とを有する。
前記複雑度推定部は、注目ピクチャの各マクロブロックに対して、符号化の困難さを示す複雑度を推定する。
複雑度補正部は、注目ピクチャの各マクロブロックについて、アクティビティが大きいほど補正複雑度が小さくなるように、該マクロブロックのアクティビティで、前記複雑度推定部により推定された前記複雑度を補正して該マクロブロックの前記補正複雑度を求める。
基準量子化ステップ算出部は、注目ピクチャの各マクロブロックの前記補正複雑度の総和を前記目標符号量で除算することにより前記基準量子化ステップを算出する。
なお、上記態様の動画像符号化装置をシステムや方法に置き換えて表現したもの、コンピュータを該装置として実行せしめるプログラム、該プログラムを記録した記録媒体なども、本発明の態様としては有効である。
本発明にかかる技術によれば、動画像を符号化して得たビットストリームのビットレートが所定の目標レートになるように符号量制御を行う際に、高画質の符号化を実現することができる。
本発明の第1の実施の形態にかかる動画像符号化装置を示す図である。 図1に示す動画像符号化装置における量子化ステップ算出部を示す図である。 図2に示す量子化ステップ算出部による処理を示すフローチャートである。 MPEGのレイヤ構造を示す図である。 量子ステップと発生符号量の関係を示す図である。 ピクチャの目標符号量の割当てを示す図である。
以下、図面を参照して本発明の実施の形態について説明する。説明の明確化のため、以下の記載及び図面は、適宜、省略、及び簡略化がなされている。また、様々な処理を行う機能ブロックとして図面に記載される各要素は、ハードウェアとソフトウェア(プログラム)の組合せによっていろいろな形で実現できることは当業者には理解されるところであり、ハードウェアとソフトウェアのいずれかに限定されるものではない。例えば、CPU(Central Processing Unit)にソフトウェアを実行させることにより、本発明の処理を実現することも可能である。なお、各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。
また、上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non−transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
<第1の実施の形態>
図1は、本発明の第1の実施の形態にかかる動画像符号化装置100を示す。動画像符号化装置100は、動画像MPを例えばMPEG方式で可変レートで符号化してビットストリームBSを得て出力するものであり、演算器102、直交変換部104、量子化部106、符号化部108、バッファ110、逆量子化部112、逆直交変換部114、演算器116、フレーム内予測部118、フレーム間予測部120、スイッチ122、量子化ステップ算出部200を備える。
動画像MPのデータは、演算器102により入力される。演算器102は、入力された動画像MPのマクロブロック毎に、そのデータと、スイッチ122を介してフレーム内予測部118またはフレーム間予測部120から入力された該マクロブロックの予測画像のデータとの差分を算出して、直交変換部104に出力する。
直交変換部104は、演算器102の出力に対してDCT処理を施し、その結果で得られるDCT係数を量子化部106に出力する。
量子化部106は、注目マクロブロックのDCTに対して、量子化ステップ算出部200からの量子化ステップ(「適応量子化ステップ」という)Qmbで量子化して符号化部108に出力する。以下、量子化部106の出力を「量子化値」ともいう。
符号化部108は、量子化部106からの量子化値を例えばハフマン符号などの可変長符号に変換してバッファ110に出力する。
バッファ110は、符号化部108からのデータを一時蓄積したのち、ビットストリームBSとして出力する。なお、符号化部108におけるデータの蓄積量は、発生符号量Srとして、量子化ステップ算出部200に出力される。
量子化部106が得た量子化値は、符号化部108以外に、逆量子化部112にも出力される。逆量子化部112は、量子化部106からの量子化値を、量子化部106が使用した適応量子化ステップQmbで逆量子化することにより、DCT係数を得て逆直交変換部114に出力する。
逆直交変換部114は、逆量子化部112からのDCT係数に対して逆DCT処理を施し、予測残差を得て演算器116に出力する。
演算器116には、逆直交変換部114からの予測残差と、演算器102に供された予測画像と同一のデータとが入力される。演算器116は、それらを加算する局所復号によりローカルデコード画像を得て、フレーム内予測部118とフレーム間予測部120に出力する。
なお、ローカルデコード画像は、ビットストリームBSを受信した側において得られる復号画像と同一のものである。
フレーム内予測部118は、注目ピクチャ内で隣接ブロックの画素から予測画像を得てスイッチ122に出力する。フレーム間予測部120は、注目ピクチャの参照ピクチャを用いて、動きベクトルの検出や動き補償などを行い、参照画像を得てスイッチ122に出力する。
スイッチ122は、注目ピクチャのタイプ(Iピクチャ、Pピクチャ、Bピクチャ)に応じて設定された符号化モードに基づいて、フレーム内予測部118とフレーム間予測部120の出力を選択的に演算器102に出力する。
量子化ステップ算出部200を除き、動画像符号化装置100の各機能ブロックは、この種の動画像符号化装置の相対応する機能ブロックと同様のものであり、これらのブロックについて、これ以上の詳細な説明を省略する。
量子化ステップ算出部200は、注目マクロブロックに対して、その量子化に適用される量子化ステップである適応量子化ステップQmbを算出して量子化部106に供する。
図2は、量子化ステップ算出部200を示す。量子化ステップ算出部200は、複雑度推定部202、アクティビティ算出部204、複雑度補正部206、基準量子化ステップ算出部208、量子化ステップ適応化部210を備える。
複雑度推定部202は、注目ピクチャの各マクロブロックに対して、符号化の困難さを示す複雑度Xmbを推定して複雑度補正部206に出力する。
複雑度推定部202は、具体的には、例えば、MPEG−2のTM5に記載されたように、最後に符号化した、注目ピクチャと同一のタイプのピクチャの発生符号量と平均量子化ステップとの積を注目ピクチャの複雑度Xestとして推定する。複雑度推定部202は、推定した複雑度Xestを、1ピクチャ当たりのマクロブロックの総数nで除算することにより、注目ピクチャの各マクロブロックの複雑度Xmbを得る。
アクティビティ算出部204は、注目ピクチャの各マクロブロックのアクティビティを夫々算出すると共に正規化することにより正規化アクティビティACTmbを得て、複雑度補正部206と量子化ステップ適応化部210に正規化アクティビティACTmbを出力する。
アクティビティ算出部204によるアクティビティの算出は、TM5に記載された、マクロブロックの各サブブロックの輝度値の分散を用いる(式(2))手法や、特許文献4に記載された、輝度成分と色差成分を用いる手法など、従来知られている方法を用いればよい。
なお、正規化については、注目ピクチャ内の全てのマクロブロックのアクティビティの平均値を用いて、式(3)に示すように行えばよい。
複雑度補正部206は、注目ピクチャの各マクロブロックについて、アクティビティ算出部204が得た正規化アクティビティACTmbで、複雑度推定部202が得た複雑度Xmbを補正して補正複雑度TXmbを得る。複雑度補正部206は、得た基準量子化ステップ算出部208に出力する。
複雑度補正部206は、正規化アクティビティACTmbが大きいほど補正複雑度TXmbが小さくなるように、複雑度Xmbを補正する。例えば、複雑度補正部206は、下記の式(6)を用いて、複雑度Xmbを補正する。式(6)におけるjは、マクロブロックの番号である。
TXmb(j)=Xmb(j)/ACTmb(j) (6)
基準量子化ステップ算出部208は、式(7)に従って、複雑度補正部206により得られた注目ピクチャの各マクロブロックの補正複雑度TXmbの総和を、注目ピクチャの補正複雑度TXpとして求める。また、基準量子化ステップ算出部208は、式(8)に従って、注目ピクチャの発生符号量の総和を目標符号量Spに一致させるための変数である基準量子化ステップQbaseを算出する。
TXp=TXmb(1)+TXmb(2)+・・・+TXmb(n) (7)
但し,n:1ピクチャ内のマクロブロックの総数
Qbase=TXp/Sp (8)
式(8)を上述した式(1)に比較すると分かるように、本実施の形態において、基準量子化ステップQbaseを算出する際に、注目ピクチャの同一タイプの符号化済みピクチャの推定された複雑度Xestの代りに補正複雑度TXpが用いられるようになっている。
基準量子化ステップ算出部208は、注目ピクチャの全てのマクロブロックについて、式(8)で算出した基準量子化ステップQbaseを量子化ステップ適応化部210に出力する。または、基準量子化ステップ算出部208は、基準量子化ステップQbaseを量子化ステップ適応化部210に次のように出力してもよい。基準量子化ステップ算出部208は、注目ピクチャの1つ目のマクロブロックについては、式(8)で算出した基準量子化ステップQbaseを出力する。基準量子化ステップ算出部208は、2つ目以降の各マクロブロックについては、該注目ピクチャの既に符号化済みのマクロブロックの発生符号量Srに基づき、該注目ピクチャの発生符号量の総和が目標符号量Spに近付くように、式(8)で算出した基準量子化ステップQbaseを調整して量子化ステップ適応化部210に出力する。
量子化ステップ適応化部210は、視覚特性に適応するように、式(9)に従って、注目マクロブロックについて、基準量子化ステップ算出部208からの基準量子化ステップQbaseを、アクティビティ算出部204からの正規化アクティビティACTmbで重み付ける。この重み付けは、TM5の「適応量子化」の手法に従ったものである。これにより、量子化ステップ適応化部210は、注目マクロブロックの量子化に適用される量子化ステップ(適応量子化ステップQmb)を得る。なお、式(9)において、基準量子化ステップQbase(j)は、注目マクロブロックとなるj番目のマクロブロックの基準量子化ステップである。基準量子化ステップQbase(j)は、式(8)で算出した値、または、符号化済みのマクロブロックの発生符号量Srに基づいて、式(8)で算出した値を調整して得たものである。
Qmb(j)=Qbase(j)×ACTmb(j) (9)
図3のフローチャートを参照して、量子化ステップ算出部200による注目ピクチャの各マクロブロックの適応量子化ステップQmbの算出処理の流れを説明する。
量子化ステップ算出部200は、まず、注目ピクチャの全てのマクロブロック(MB)について、複雑度推定部202により複雑度Xmbを推定すると共に、アクティビティ算出部204により正規化アクティビティACTmbを算出する(S100、S102)。
次に、全てのマクロブロックについて、複雑度補正部206により、アクティビティ算出部204からの正規化アクティビティACTmbで複雑度推定部202からの複雑度Xmbを補正して、補正複雑度TXmbを得る(S104)。
そして、基準量子化ステップ算出部208により、1つ目の注目マクロブロックに対して、複雑度補正部206からの各マクロブロックの補正複雑度TXmbの総和である補正複雑度TXpと、該注目ピクチャに対して設定された目標符号量Spとを用いて、式(8)に従って、基準量子化ステップQbaseを算出する(S106)。
次いで、量子化ステップ適応化部210により、1つ目の注目マクロブロックに対して、正規化アクティビティACTmbで基準量子化ステップQbaseを重み付けることにより適応量子化ステップQmbを算出して量子化部106に出力する(S108)。
量子化ステップ算出部200は、最後の注目マクロブロックの適応量子化ステップQmbが算出される(S110:Yes)まで、ステップS112、S106、S108の処理を繰り返す(S110:No、S112、S106、S108)ことにより、注目ピクチャの全てのマクロブロックの適応量子化ステップQmbを夫々算出する。
なお、注目ピクチャ内の全てのマクロブロックに対して同一の基準量子化ステップQbaseを用いる場合には、ステップS106では、基準量子化ステップ算出部208は、全てのマクロブロックについて、1つ目のマクロブロックに対して算出した基準量子化ステップQbaseを出力する。または、基準量子化ステップ算出部208は、注目ピクチャの1つ目のマクロブロックに対して、式(8)に従って基準量子化ステップQbaseを算出し、量子化ステップ適応化部210に出力した後は、他のマクロブロックについては基準量子化ステップQbaseの出力をしなくともよい。このとき、量子化ステップ適応化部210は、該注目ピクチャの全てのマクロブロックについて、1つ目のマクロブロックのときに基準量子化ステップ算出部208から出力された基準量子化ステップQbaseを用いて上述の処理を行う。
また、同一のピクチャ内の既に符号化されたマクロブロックの発生符号量Srをフィードバックして残りのマクロブロックの基準量子化ステップQbaseを調整する場合には、基準量子化ステップ算出部208は、マクロブロック毎に、その基準量子化ステップQbaseの算出(または調整)を行う。
本実施の形態の動画像符号化装置100は、各マクロブロックに対して推定した複雑度Xmbを、その正規化アクティビティACTmbで補正して、補正複雑度TXmbを得る。動画像符号化装置100は、注目ピクチャの各マクロブロックに対して、該注目ピクチャに対して設定された目標符号量に該注目ピクチャの発生符号量を一致させるための変数である基準量子化ステップQbaseを求める際に、補正複雑度TXmbの総和を注目ピクチャの複雑度として推定して用いる。こうすることにより、後に量子化ステップ適応化部210による基準量子化ステップQbaseの適応量子化による発生符号量の変化を、基準量子化ステップQbaseを決定する段階に含有させることができる。このため、発生符号量を目標符号量に近付けることができ、ひいては、発生符号量と目標符号量の乖離に起因する画質の劣化を軽減することができる。
特に、フレーム単位でビット量の上限が定められているAVC−Intraなど、マクロブロック単位などの狭い領域範囲で厳密な符号量の制御が必要な規格においても、本実施の形態の動画像符号化装置100によれば、発生符号量の推定精度の向上により、目標符号量のマージンを小さくとることができ、高画質の符号化を実現することができる。
<第2の実施の形態>
上述した第1の実施の形態の動画像符号化装置100において、量子化ステップ算出部200の複雑度推定部202は、TM5の手法により、注目ピクチャと同一のタイプの符号化済みピクチャの発生符号量と平均量子化ステップとの積を注目ピクチャの複雑度Xestとして推定する。そして、複雑度推定部202は、推定した複雑度Xestをマクロブロックの総数nで除算することにより各マクロブロックの複雑度Xmbを算出している。
複雑度推定部202における注目ピクチャの複雑度の推定は、例えば、特許文献3に開示された手法を用いるようにしてもよい。具体的には、シーンチェンジ後初めて符号化するIピクチャについては、その分散値から複雑度Xestを推定し、シーンチェンジ後初めて符号化するPピクチャ及びBピクチャについては、該ピクチャとその参照ピクチャとの間の動きベクトル探索結果の予測誤差値から複雑度Xestを推定する。これらの推定に際しては、式(5)が用いられる。上記に該当しない各ピクチャについては、TM5の手法と同様に、前に符号化し同タイプのピクチャの発生符号量と平均量子化ステップから複雑度を推定する。
なお、式(5)は、1例として2次多項式であるが、1次多項式や、3次以上の多項式であってもよい。
さらに、式(5)の各係数について、全ての注目ピクチャに対して、予め定められた固定値を用いるようにしてもよいし、重回帰分析などにより動的に調整するようにしてもよい。具体的には、複雑度推定部202は、式(5)に従って推定した複雑度と、符号化結果から得られた複雑度(符号化したピクチャの発生符号量と平均量子化ステップとの積)との関係をピクチャタイプ毎に過去数ピクチャ分蓄積し、蓄積したデータから、ピクチャタイプ毎に、式(5)における各係数を修正する。
こうすることにより、複雑度推定部202における注目ピクチャの複雑度の推定精度を高めることができるため、注目ピクチャの各マクロブロックの複雑度複雑度Xmbの推定精度も向上する。結果としては、基準量子化ステップ算出部208により算出された基準量子化ステップQbase乃至量子化ステップ適応化部210により算出された適応量子化ステップQmbが、より注目ピクチャの実際の複雑度に適応したものとなるため、発生符号量をより目標符号量に近づけ、画質を一層高めることができる。
<第3の実施の形態>
上述した第1と第2の実施の形態において、注目ピクチャの複雑度を推定して、推定した複雑度をマクロブロックの総数で除算することにより、各マクロブロックに対して同一の複雑度Xmbを算出しているが、マクロブロック毎に複雑度Xmbを算出するようにしてもよい。
その際、複雑度Xmbの算出は、例えば下記の式(10)を用いることができる。
Xmb=a×(Fmb)2+b×Fmb+c(10)
式(10)は、式(5)に対して、注目ピクチャ全体の特徴量Fを、当該マクロブロックの特徴量Fmbに変更したものである。特徴量Fと特徴量Fmbは、同一の種類のものである。
勿論、式(10)における各係数についても、予め定められた固定値を用いるようにしてもよいし、重回帰分析などにより動的に調整するようにしてもよい。
以上、実施の形態をもとに本発明を説明した。実施の形態は例示であり、本発明の主旨(スコープ)から逸脱しない限り、上述した各実施の形態に対してさまざまな変更、増減、組合せを行ってもよい。これらの変更、増減、組合せが行われた変形例も本発明の範囲にあることは、当業者に理解されるところである。
この出願は、2013年6月13日に出願された日本出願特願2013−124658を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明は、動画像の符号化に適用することができる。
100 動画像符号化装置
102 演算器
104 直交変換部
106 量子化部
108 符号化部
110 バッファ
112 逆量子化部
114 逆直交変換部
116 演算器
118 フレーム内予測部
120 フレーム間予測部
122 スイッチ
200 量子化ステップ算出部
202 複雑度推定部
204 アクティビティ算出部
206 複雑度補正部
208 基準量子化ステップ算出部
210 量子化ステップ適応化部
ACTmb 正規化アクティビティ
BS ビットストリーム
MP 動画像
Qbase 基準量子化ステップ
Qmb 適応量子化ステップ
Sg 目標符号量
Sp 目標符号量
Sr 発生符号量
TXmb 補正複雑度
TXp 補正複雑度
Xest 複雑度
Xmb 複雑度

Claims (3)

  1. 注目ピクチャを直交変換して直交変換係数を得る直交変換手段と、
    前記注目ピクチャのマクロブロック毎に、前記直交変換係数を量子化する量子化手段と、
    前記注目ピクチャにおける注目マクロブロックに対して、該注目ピクチャに対して設定された目標符号量に該注目ピクチャの発生符号量を一致させるための変数である基準量子化ステップを求めると共に、算出した前記基準量子化ステップを、前記注目マクロブロックのアクティビティで重み付けることにより、該注目マクロブロックの量子化に適用される量子化ステップを決定して前記量子化手段に供する量子化ステップ算出手段とを備え
    前記量子化ステップ算出手段は、
    前記注目ピクチャの各マクロブロックに対して、符号化の困難さを示す複雑度を推定する複雑度推定手段と、
    各前記マクロブロックについて、アクティビティが大きいほど補正複雑度が小さくなるように、前記アクティビティで前記複雑度を補正して該マクロブロックの前記補正複雑度を求める複雑度補正手段と、
    各前記マクロブロックの前記補正複雑度の総和を前記目標符号量で除算することにより前記基準量子化ステップを算出する基準量子化ステップ算出手段とを有する、
    動画像符号化装置。
  2. 出力するビットスストリームが目標レートになるように符号量制御を行う動画像符号化方法において、
    注目ピクチャを直交変換して直交変換係数を得て、
    前記注目ピクチャのマクロブロック毎に、前記直交変換係数を量子化し、
    前記注目ピクチャにおける注目マクロブロックに対して、該注目ピクチャに対して設定された目標符号量に該注目ピクチャの発生符号量を一致させるための変数である基準量子化ステップを求めると共に、算出した前記基準量子化ステップを、前記注目マクロブロックのアクティビティで重み付けることにより、該注目マクロブロックの量子化に適用される量子化ステップを決定して前記直交変換係数を量子化することに供し、
    前記量子化ステップの決定においては、
    前記注目ピクチャの各マクロブロックに対して、符号化の困難さを示す複雑度を推定すること、
    各前記マクロブロックについて、アクティビティが大きいほど補正複雑度が小さくなるように、前記アクティビティで前記複雑度を補正して該マクロブロックの前記補正複雑度を求めること、及び
    各前記マクロブロックの前記補正複雑度の総和を前記目標符号量で除算することにより前記基準量子化ステップを算出することを備える、
    動画像符号化方法。
  3. 出力するビットスストリームが目標レートになるように符号量制御を行う動画像符号化に際して、
    注目ピクチャを直交変換して直交変換係数を得て、
    前記注目ピクチャのマクロブロック毎に、前記直交変換係数を量子化し、
    前記注目ピクチャにおける注目マクロブロックに対して、該注目ピクチャに対して設定された目標符号量に該注目ピクチャの発生符号量を一致させるための変数である基準量子化ステップを求めると共に、算出した前記基準量子化ステップを、前記注目マクロブロックのアクティビティで重み付けることにより、該注目マクロブロックの量子化に適用される量子化ステップを決定して前記直交変換係数を量子化することに供することをコンピュータに実行せしめ、
    前記量子化ステップの決定においては、
    前記注目ピクチャの各マクロブロックに対して、符号化の困難さを示す複雑度を推定すること、
    各前記マクロブロックについて、アクティビティが大きいほど補正複雑度が小さくなるように、前記アクティビティで前記複雑度を補正して該マクロブロックの前記補正複雑度を求めること、及び
    各前記マクロブロックの前記補正複雑度の総和を前記目標符号量で除算することにより前記基準量子化ステップを算出することを前記コンピュータに実行せしめる、
    プログラム。
JP2015522495A 2013-06-13 2014-05-19 動画像符号化装置、動画像符号化方法、およびプログラム Expired - Fee Related JP6341202B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013124658 2013-06-13
JP2013124658 2013-06-13
PCT/JP2014/002610 WO2014199566A1 (ja) 2013-06-13 2014-05-19 動画像符号化装置及び動画像符号化方法並びにプログラムが格納された非一時的なコンピュータ可読媒体

Publications (2)

Publication Number Publication Date
JPWO2014199566A1 JPWO2014199566A1 (ja) 2017-02-23
JP6341202B2 true JP6341202B2 (ja) 2018-06-13

Family

ID=52021888

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015522495A Expired - Fee Related JP6341202B2 (ja) 2013-06-13 2014-05-19 動画像符号化装置、動画像符号化方法、およびプログラム

Country Status (3)

Country Link
US (1) US10264260B2 (ja)
JP (1) JP6341202B2 (ja)
WO (1) WO2014199566A1 (ja)

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3872849B2 (ja) * 1996-11-28 2007-01-24 松下電器産業株式会社 動画像符号化装置
JPH10224786A (ja) 1997-02-06 1998-08-21 Sony Corp 画像符号化装置および画像符号化方法、画像伝送装置および画像伝送方法、並びに記録媒体
JPH11346365A (ja) 1998-04-03 1999-12-14 Matsushita Electric Ind Co Ltd 符号化圧縮方法、および符号化圧縮装置
JP4362794B2 (ja) 1999-07-05 2009-11-11 日本ビクター株式会社 動画像符号化装置及びその方法
JP2002247584A (ja) 2001-02-15 2002-08-30 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法および装置、並びに、画像符号化処理用プログラム及びそのプログラムの記録媒体
US7095784B2 (en) * 2003-04-14 2006-08-22 Silicon Intergrated Systems Corp. Method and apparatus for moving picture compression rate control using bit allocation with initial quantization step size estimation at picture level
JP4249672B2 (ja) * 2004-08-16 2009-04-02 Kddi株式会社 ビデオ情報複数同時符号化装置
JP4399794B2 (ja) 2004-09-16 2010-01-20 日本ビクター株式会社 画像符号化装置及び画像符号化方法
JP4795223B2 (ja) 2006-01-31 2011-10-19 キヤノン株式会社 画像処理装置
JP5078837B2 (ja) 2007-10-29 2012-11-21 キヤノン株式会社 符号化装置、符号化装置の制御方法及びコンピュータプログラム
US9152875B2 (en) * 2009-06-11 2015-10-06 Texas Instruments Incorporated Preserving text quality in video encoding

Also Published As

Publication number Publication date
JPWO2014199566A1 (ja) 2017-02-23
US20160127729A1 (en) 2016-05-05
US10264260B2 (en) 2019-04-16
WO2014199566A1 (ja) 2014-12-18

Similar Documents

Publication Publication Date Title
US9071840B2 (en) Encoder with adaptive rate control for H.264
Guo et al. Optimal bit allocation at frame level for rate control in HEVC
CN109068137B (zh) 兴趣区域感知的视频编码
US9426475B2 (en) Scene change detection using sum of variance and estimated picture encoding cost
US20100111163A1 (en) Method for p-domain frame level bit allocation for effective rate control and enhanced video encoding quality
US8681858B2 (en) Rate control for two-pass encoder
JP5411144B2 (ja) ビデオ・エンコードおよびデコードにおけるレート制御の精度のための方法および装置
KR101603747B1 (ko) 비디오 인코딩에서 속도 제어 정확성을 위한 방법 및 장치
JP2007089035A (ja) 動画像符号化方法、装置及びプログラム
JP2001510311A (ja) 符号化方式におけるオブジェクトベースのレート制御装置及びその方法
JP2001512643A (ja) コード化システムにおけるレート制御を最適化するための装置および方法
Rehman et al. SSIM-inspired perceptual video coding for HEVC
US20100111180A1 (en) Scene change detection
US9955168B2 (en) Constraining number of bits generated relative to VBV buffer
JP5618128B2 (ja) 符号化装置、符号化方法、およびプログラム
JP7343817B2 (ja) 符号化装置、符号化方法、及び符号化プログラム
JP5649296B2 (ja) 画像符号化装置
JP6341202B2 (ja) 動画像符号化装置、動画像符号化方法、およびプログラム
JPH07203430A (ja) 画像符号化装置
JP5136470B2 (ja) 動画像符号化装置及び動画像符号化方法
JP4942208B2 (ja) 符号化装置
JP2011244334A (ja) 動画像符号化装置、動画像符号化方法及びプログラム
CN102202220B (zh) 编码设备及其控制方法
KR100918560B1 (ko) 실시간 h.263 영상 부호율 제어를 위한 비트량 예측 장치및 그 방법
KR101197094B1 (ko) H.264/avc를 위한 통계 모델 기반의 비트율 제어 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170414

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180227

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180405

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180417

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180430

R150 Certificate of patent or registration of utility model

Ref document number: 6341202

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees