JP5879555B2 - 動画像符号化装置 - Google Patents

動画像符号化装置 Download PDF

Info

Publication number
JP5879555B2
JP5879555B2 JP2011040744A JP2011040744A JP5879555B2 JP 5879555 B2 JP5879555 B2 JP 5879555B2 JP 2011040744 A JP2011040744 A JP 2011040744A JP 2011040744 A JP2011040744 A JP 2011040744A JP 5879555 B2 JP5879555 B2 JP 5879555B2
Authority
JP
Japan
Prior art keywords
amount
buffer
control amount
code
vbv
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011040744A
Other languages
English (en)
Other versions
JP2011259408A (ja
Inventor
浩二 松井
浩二 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2011040744A priority Critical patent/JP5879555B2/ja
Publication of JP2011259408A publication Critical patent/JP2011259408A/ja
Application granted granted Critical
Publication of JP5879555B2 publication Critical patent/JP5879555B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Description

本発明は、符号バッファを用いる動画像符号化装置、動画像符号化方法および動画像符号化プログラムに関する。
近年、デジタル映像の蓄積や伝送に用いられる動画像符号化方式として、MPEG方式またはH.264方式などが知られており、復号装置側の符号バッファ(例えばMPEG2規格におけるVideo Buffer Verifier(VBV)バッファ、H.264規格におけるCoded Picture Buffer(CPB))の動作を規定することで、復号装置間における互換性を確保している。
このような動画像符号化方式においては、この規定に従って、符号化装置側では、復号装置側の符号バッファが破綻状態に至らないようにビットストリームを生成することが求められる。
この符号バッファの破綻状態には、アンダーフロー(バッファアンダーフロー)とオーバーフロー(バッファオーバーフロー)とがある。バッファアンダーフローとは、ピクチャ符号量が過多になることで、復号装置側の符号バッファにおけるバッファ占有量がゼロになることである。また、バッファオーバーフローとは、ピクチャ符号量が過小となることで、バッファ占有量が符号バッファの最大量を超えることである。
そこで、従来の符号化装置は、上記のような符号バッファの破綻状態が発生しないように、復号装置側の符号バッファの占有量を模擬(シミュレーション)するバッファモデル(仮想バッファモデル)を備えている。そして、従来の符号化装置では、バッファモデルの結果をビットレート制御に反映してピクチャ符号量を制御することによって符号バッファの規格適合を保証している。
この種の従来の動画像符号化装置について、図5を用いて説明する。図5は、MPEG2規格における従来の動画像符号化装置の構成を示すブロック図である。
図5に示すように、従来の動画像符号化装置100は、DCT部101と、量子化部102と、符号化部103と、VBVモデル部104と、ビットレート制御部105とを備える。
DCT部101は、入力画像111を直交変換し、DCT係数112を出力する。量子化部102は、ビットレート制御部105から得る量子化スケール117に基づいて、DCT係数112を量子化して量子化係数113を出力する。符号化部103は、量子化係数113と量子化スケール117等の付加情報を情報源符号化し、ビットストリーム114を出力する。
また、VBVモデル部104は、符号化部103で生じた発生符号量115に基づいてMPEG2方式における符号バッファであるVBVバッファをシミュレーションし、バッファ占有量(VBVバッファ占有量116)をビットレート制御部105に出力する。
MPEG2規格においてはビットストリーム114の符号量制御手段は規定されていない。ビットストリームを所望の符号量に制御するために、一般的にはビットレート制御部105は、発生符号量115とバッファ占有量(VBVバッファ占有量116)とに基づいて、符号バッファの破綻状態が発生しないように量子化スケール117を決定する。
さらに、VBVバッファのアンダーフローを抑制しつつ安定した画質で符号化を行う技術が特許文献1に開示されている。特許文献1に開示された動画像符号化装置では、ビットレート制御部105において、これまでに発生した符号量と目標ビットレートとの誤差を最小化するための第1の量子化スケールと、アンダーフローを回避するための第2の量子化スケールとを算出する。第2の量子化スケールは、次の参照ピクチャの符号化後までに使用可能な符号量を下回るように決定される。ビットレート制御部105は、この第1と第2の量子化スケールのうち最大値の方を量子化スケール117として選択し、量子化部102に出力する。
特開2006−295535号公報
上述のように、従来の動画像符号化装置は、バッファアンダーフローまたはバッファオーバーフローが発生しないように動作する。
バッファアンダーフローを回避するためには、発生符号量がバッファ占有量を上回らないように、符号化部で発生する符号量を抑制する必要がある。具体的には、バッファ占有量に基づいて量子化スケールを増加させて量子化係数を削減する方法と、DCT係数の符号化をスキップして量子化係数をスキップする方法とがある。
しかしながら、従来の動画像符号化装置では、符号バッファの破綻状態直前において当該破綻状態が発生しないように量子化スケールが決定されるので、画質が劣化してしまうという問題がある。また、量子化係数を削減またはスキップする場合も、画質が劣化してしまうという問題がある。
また、特許文献1に開示された動画像符号化装置では、2つの量子化スケールの最大値を用いて発生符号量を削減してバッファアンダーフローを回避しているが、特許文献1の構成では、量子化スケールの最大値の選択が切り替わる前後で、ピクチャ間の画質が不連続に変化して主観画質を損なうという課題がある。特に、特許文献1の構成では、第1と第2の量子化スケールがそれぞれ独立して決定されるため、第1の量子化スケールで符号量を増加させる制御量と、第2の量子化スケールで符号量を減少させる制御量とが同時に存在する場合がある。この二つの制御量が相反するような場合に、ピクチャ間において不連続な画質差が生じやすい。
さらに、特許文献1では、符号バッファが漸減するような入力画像の場合であっても、当初はバッファアンダーフローに至らないために第1の量子化スケールを選択する。この状況が継続してバッファ占有量が前述の使用可能な符号量を下回るときに、バッファアンダーフローを回避しようとして第2の量子化スケールが大きく増加する。そして、この第2の量子化スケールを最大値として選択して量子化スケールが急変することで、不連続な画質差が生じるという課題をも有している。
このように、従来の動画像符号化装置においては、バッファ占有量に応じて量子化スケールを変更してバッファアンダーフローを回避しようとしているが、不連続な画質変化により主観画質の劣化を伴うという問題がある。
なお、バッファオーバーフローを回避するためには、量子化スケールを小さくしたり、符号化部で無効データを付加するなどしてピクチャ符号量を増加させたりする方法があるが、量子化スケールを小さくすることは画質を向上させることになり、また、無効データは画像信号とは無関係の符号であるので画質の向上に寄与しない。さらに、一般的な可変ビットレート(VBR)符号化においては、符号バッファにビットストリームを供給するビットレートを減少させたり、ビットストリームの供給を一時中断できたりするので、無効データを付加せずともオーバーフローを回避可能である。このように、バッファオーバーフローを回避する動作では、画質が低下することはない。
本発明は、上記の課題を解決するためになされたものであり、主観画質の劣化を伴うことなく符号バッファの破綻状態を防ぐことができる動画像符号化装置または動画像符号化方法を提供することを目的とする。
上記課題を解決するために、本発明に係る動画像符号化装置の一態様は、動画像を符号化する動画像符号化装置であって、復号における符号バッファの占有量をシミュレーションするバッファモデル部と、前記符号バッファの占有量の変化速度を算出し、当該変化速度を用いて前記符号バッファのアンダーフローに至るまでのピクチャ数を求め、当該ピクチャ数を経過するまでの間に前記符号バッファの占有量を増加させて前記アンダーフローに至らないように前記符号バッファを保護するための第1制御量を算出する制御量算出部と、前記第1の制御量を用いて量子化幅を決定するビットレート制御部とを備えるものである。
本態様によれば、符号バッファの占有量の変化速度から符号バッファの破綻状態を予測して、符号バッファの占有量に応じて所望の量子化幅を決定することができる。これにより、主観画質の劣化を伴うことなく符号バッファの破綻状態を回避することができる。
さらに、本発明に係る動画像符号化装置の一態様において、前記制御量算出部は、前記変化速度が0より小さい場合において、前記変化速度の絶対値が大きいほど前記量子化幅が大きくなるように、前記第1の制御量を算出することが好ましい。
本態様によれば、変化速度が0より小さい場合、すなわち、符号バッファの占有量が減少傾向にある場合において、変化速度の絶対値が大きくなればなるほど量子化幅が大きくなるように第1の制御量を算出する。これにより、バッファアンダーフローによるバッファ破綻を回避することができる。
さらに、本発明に係る動画像符号化装置の一態様において、前記制御量算出部は、移動平均法あるいは最小二乗法を用いて、前記符号バッファの占有量の履歴から前記変化速度を求めることが好ましい。
本態様によれば、移動平均法あるいは最小二乗法を用いて、符号バッファの占有量の履歴から変化速度を容易に求めることができる。
さらに、本発明に係る動画像符号化装置の一態様において、前記ビットレート制御部は、符号化するピクチャの符号量を制御する第2の制御量を算出し、前記第1の制御量とともに前記第2の制御量を用いて、前記量子化幅を決定することが好ましい。
本態様によれば、バッファ占有量を制御するための第1の制御量だけではなく、符号化するピクチャの符号量を制御するための第2の制御量をも用いて量子化幅を決定する。これにより、画質を急変させることなく符号バッファの破綻状態を防ぐことができる。
また、本発明に係る動画像符号化装置の一態様は、動画像を符号化する動画像符号化装置であって、復号における符号バッファの占有量をシミュレーションするバッファモデル部と、前記符号バッファの占有量の変化速度に応じて量子化幅を決定するビットレート制御部と、前記符号バッファの占有量の変化速度を算出するとともに、前記変化速度に基づいて前記符号バッファの占有量を増加させる第1の制御量を算出する制御量算出部とを備え、前記ビットレート制御部は、符号化開始時点からの平均符号量を制御する平均符号量制御量として、符号化するピクチャの符号量を制御する第2の制御量を算出し、前記第1の制御量および前記第2の制御量を、前記符号バッファの占有量の割合を示す占有率により加重平均して得られる第3の制御量を用いて、前記量子化幅を決定するものである。
本態様によれば、第2の制御量として符号化開始時点からの平均符号量を制御するための平均符号量制御量を用い、第1の制御量および第2の制御量を符号バッファの占有量の割合を示す占有率により加重平均して得られる第3の制御量を用いて量子化幅を決定する。これにより、平均ビットレート制御とバッファ制御の優劣関係をバッファ占有量によって連続的に制御することができるので、画質を急変させることなくバッファ破綻を回避することが可能となる。
さらに、本発明に係る動画像符号化装置の一態様において、前記符号バッファの占有量に最小マージンが設定されていることが好ましい。
本態様によれば、符号バッファの占有量に最小マージンが設定されているので、バッファ制御に余裕を持たせることができる。
また、本発明に係る動画像符号化方法の一態様は、動画像を符号化する動画像符号化方法であって、復号における符号バッファの占有量をシミュレーションするバッファモデルステップと、前記符号バッファの占有量の変化速度に応じて量子化幅を決定するビットレート制御ステップと、を含むものである。
本態様によれば、符号バッファの占有量の変化速度から符号バッファの破綻状態を予測して所望の量子化幅を決定することができるので、主観画質の劣化を伴うことなく符号バッファの破綻状態を回避することができる。
また、本発明に係る動画像符号化プログラムの一態様は、動画像を符号化する動画像符号化プログラムであって、復号における符号バッファの占有量をシミュレーションするバッファモデルステップと、前記符号バッファの占有量の変化速度に応じて量子化幅を決定するビットレート制御ステップと、をコンピュータに実行させるものである。
このように、本発明に係る動画像符号化方法は、動画像符号化プログラムとしても実現することができる。
また、本発明に係る記録媒体の一態様は、上記の動画像符号化プログラムが記録されたコンピュータに読み取り可能な記録媒体である。
このように、本発明は、動画像符号化プログラムが記録されたコンピュータに読み取り可能な記録媒体として実現することもできる。
本発明によれば、主観画質の劣化を伴うことなく符号バッファの破綻状態を防いで、規格に適合するビットストリームを生成することができる。
図1は、実施の形態1に係る動画像符号化装置の構成を示すブロック図である。 図2は、実施の形態1においてVBV保護制御量を算出するための制御量算出ステップにおけるフローチャートである。 図3は、実施の形態1において符号バッファの占有量変化と制御区間とを示す図である。 図4は、実施の形態2において符号バッファの占有量変化と制御区間とを示す図である。 図5は、従来の動画像符号化装置の構成を示すブロック図である。
以下、本発明を実施するための形態について、図面を参照しながら説明する。
(実施の形態1)
まず、実施の形態1に係る動画像符号化装置10の構成について、図1を用いて説明する。図1は、実施の形態1に係る動画像符号化装置の構成を示すブロック図である。なお、本実施の形態は、従来のMPEG2方式において入力画像を画面(フレーム)内符号化する符号化装置に適用したものである。
図1に示すように、実施の形態1に係る動画像符号化装置10は、復号における仮想バッファモデルに基づいて動画像を符号化する動画像符号化装置であって、DCT(Discrete Cosine Transform)部1と、量子化部2と、符号化部3と、VBVモデル部4と、ビットレート制御部5と、VBV保護制御量算出部6とを備える。
DCT部1は、入力画像(入力信号)11を直交変換し、係数データとしてDCT係数12を量子化部2に出力する。例えば、DCT部1には、入力画像11として動画像データ(ピクチャ)が入力され、DCT部1は、入力画像11に対して、8画素×8画素のブロック単位でDCT(離散コサイン変換)処理を行う。
量子化部2は、DCT部1の出力データを量子化して量子化係数を出力する。本実施の形態において、量子化部2は、ビットレート制御部5から得られる量子化スケール18に基づいて、DCT部1から得られるDCT係数12を量子化し、量子化係数13を符号化部3に出力する。この量子化スケール18が大きいほど、DCT係数12の情報量を削減して発生符号量15を小さくすることができる。
符号化部3は、量子化部2の出力データを可変長符号化処理して符号化データを出力する。本実施の形態において、符号化部3は、量子化部2から得られる量子化係数13と量子化スケール18等の付加情報とを情報源符号化し、ビットストリーム14を出力する。
VBVモデル部4は、復号における符号バッファの占有量をシミュレーションして仮想の符号バッファを算出する仮想バッファモデル部であって、符号化部3で生じた符号量(発生符号量15)に基づいて復号装置側における符号バッファの占有量をシミュレーションする。本実施の形態におけるVBVモデル部4は、MPEG2方式における符号バッファであるVBVバッファの占有量(VBVバッファ占有量16)をシミュレーションして求め、シミュレーションによって求められたVBVバッファ占有量16をビットレート制御部5とVBV保護制御量算出部6とに出力する。
ビットレート制御部5は、量子化部2の量子化幅(量子化ステップ)を制御してビットレート制御を行う機能を有し、符号バッファの占有量の変化速度に応じて量子化幅を決定する。本実施の形態において、ビットレート制御部5は、符号バッファの占有量を増加させてバッファを保護するための第1の制御量(バッファ保護制御量)を用いて量子化幅を決定して量子化部2に出力する。
より具体的には、ビットレート制御部5は、第1の制御量としてVBV保護制御量算出部6からVBV保護制御量17(ΔRvbv)を得て、VBV保護制御量17(ΔRvbv)と目標とするピクチャ目標符号量R[i]とに基づいて、量子化幅として量子化スケール18を決定し、量子化部2に出力する。
さらに、本実施の形態において、ビットレート制御部5は、符号化が完了しているピクチャの符号量を用いて、次に動作するまでに符号化するピクチャの符号量を制御するための第2の制御量を算出し、第1の制御量とともに第2の制御量を用いて量子化スケール18を決定する。
具体的に、ビットレート制御部5は、第2の制御量として、符号化開始時点からの平均符号量を制御する平均符号量制御量(ΔRrate)をピクチャ毎に算出する。そして、ビットレート制御部5は、当該平均符号量制御量(ΔRrate)とVBV保護制御量算出部6から得られるVBV保護制御量(ΔRvbv)とをVBVバッファ占有量の割合を示すVBVバッファ占有率により加重平均して第3の制御量を算出し、これを用いてピクチャ目標符号量R[i]を更新して量子化スケール18を決定する。ここで、R[i]のiはピクチャ番号を表している。
VBV保護制御量算出部6は、符号バッファの占有量の変化速度を算出するとともに、当該変化速度に基づいて上記の第1の制御量(バッファ保護制御量)を算出するための制御量算出部である。すなわち、VBV保護制御量算出部6は、復号における符号バッファの破綻状態を回避するためのバッファ保護制御量を算出するバッファ保護制御量算出部である。
本実施の形態において、VBV保護制御量算出部6は、VBVモデル部4の動作状態を常時監視し、シミュレーションによって算出されたVBVバッファ占有量16とその変化速度(傾き)とに基づいてVBVバッファの破綻状態を予測して、その予測結果に基づいて変化速度(傾き)に応じてVBVバッファの破綻状態を回避するための制御量としてVBV保護制御量17を算出する。
具体的に、VBV保護制御量算出部6は、VBVモデル部4から得られるVBVバッファ占有量16の履歴を蓄積しておき、このVBVバッファ占有量16の履歴を用いてVBVバッファ占有量16の変化速度Vを算出する。
そして、VBV保護制御量算出部6は、VBVバッファ占有量16の変化速度Vに基づいてVBVバッファが破綻するピクチャ数を予測し、バッファ破綻を回避するように、VBVバッファ占有量を増加させる第1の制御量としてVBV保護制御量17(ΔRvbv)を決定し、ビットレート制御部5に出力する。
ここで、VBV保護制御量17(ΔRvbv)は、0以下の値であり、小さい値ほど(絶対値が大きいほど)ピクチャ目標符号量R[i]を減少させてVBVバッファを増加(回復)させる効果を持つ。なお、ΔRvbv=0の場合は、目標符号量を制御しないことを意味する。
本実施の形態において、VBV保護制御量17(ΔRvbv)は、変化速度Vが0より小さい場合、すなわち、符号バッファの占有量が減少傾向にある場合において、変化速度Vの絶対値が大きいほど量子化スケール18が大きくなるような制御量が算出されることが好ましい。これにより、VBVバッファ占有量16が増加するので、バッファアンダーフローを回避することができる。
また、ピクチャ間の不連続な画質差を極力なくすために、連続するピクチャにおける各ピクチャにおけるVBV保護制御量17(ΔRvbv)の絶対値の差は可能な限り小さくすることが好ましい。すなわち、現時点からVBVバッファが破綻するまでのピクチャの数を予測したときに、破綻するまでのピクチャ数の各ピクチャにおけるVBV保護制御量17(ΔRvbv)は互いに異ならせることもできるが、均等にすることが好ましい。
次に、実施の形態1に係る動画像符号化方法について、図1を参照しながら、図2および図3を用いて説明する。図2は、実施の形態1においてVBV保護制御量(第1の制御量)を算出するための制御量算出ステップにおけるフローチャートであって、VBV保護制御量算出部6の動作を示している。また、図3は、実施の形態1において符号バッファ占有量(VBVバッファ占有量)の変化と制御区間とを示す図である。
まず、DCT部1において、入力画像11が直交変換されてDCT係数12が量子化部2に出力される。次に、量子化部2において、ビットレート制御部5からの量子化スケール18に基づいてDCT係数12が量子化され、量子化係数13が符号化部3に出力される。次に、符号化部3において、量子化係数13が符号化されてビットストリーム14が出力される。
次に、VBVモデル部4において、符号化部3で生じた発生符号量15に基づいて、復号におけるVBVバッファ占有量16をシミュレーションにより算出する(バッファモデルステップ)。シミュレーションによって算出されたVBVバッファ占有量16は、VBV保護制御量算出部6に出力される。
次に、VBV保護制御量算出部6において、符号バッファの占有量を増加させるための第1の制御量であるVBV保護制御量17(ΔRvbv)を算出する(制御量算出ステップ)。
具体的には、まず、図3に示すように、VBV保護制御量算出部6において、ピクチャ番号と、VBVモデル部4から入力されたVBVバッファ占有量16との履歴を蓄積する(S101)。なお、VBVバッファ占有量16は、例えばVBV保護制御量算出部6の記憶部に記録される。
ここで、図3において、横軸はピクチャ番号(時間)を表しており、右に進むほどピクチャ番号が大きくなるとともに時間が経過することを示している。また、図3において、縦軸はVBVバッファ占有量を表しており、VBVバッファ占有量がVBVバッファ占有量の最大値であるVBVsizeを超えるとオーバーフロー状態となり、VBVバッファ占有量がゼロを下回るとアンダーフロー状態となる。
また、図3では、ピクチャ番号がkにおけるVBVバッファ占有量を示しており、符号化開始時点からピクチャ番号がkにおける符号化時点までの履歴を示している。さらに、図3において、VBVバッファ占有量が増加している期間(右上がりの実線部分)は、伝送路等からビットストリームが供給されている期間を示しており、規格によって一定に定められた期間である。また、VBVバッファ占有量が減少している期間(垂直の実線部分)は、1ピクチャ復号したことを示しており、垂直方向の長さは復号装置におけるバッファ部からビットストリームが取り出された量を表している。すなわち、1ピクチャあたりの符号量が大きいと、復号装置のバッファ部から取り出されるビットストリームの量が大きくなり、VBVバッファ占有量が小さくなる。
続いて、VBV保護制御量算出部6は、図3に示すように、例えばNピクチャの区間において蓄積されたVBVバッファ占有量に基づいて、Nピクチャ区間についてのVBVバッファ占有量の変化速度Vを求める(S102)。
なお、Nは、ピクチャ数であり、例えばVBVバッファの最大値VBVsizeと1ピクチャあたりの目標符号量Bit_Per_Pictureとを用いて、以下の(式1)のように定義することができる。
Figure 0005879555
ここで、(式1)において、floor(x)は実数x以下となる最大の整数を与える床関数である。
次に、(式1)で求めたNを用いてVBVバッファ占有量の変化速度Vを求める。変化速度Vは、VBVバッファ占有量の履歴に基づいて、符号化済みのピクチャにおけるVBVバッファ占有量の大局的な変化を捉えるようにして算出される。このような変化速度Vは、移動平均法や最小二乗法などを用いて算出することができる。例えば一次方程式に近似した最小二乗法の場合、比例定数を変化速度Vとすることができる。
本実施の形態において、変化速度Vは、以下の(式2)のように定義する。ここで、(式2)において、kは直近に符号化済みのピクチャ番号、VBV[j]はピクチャ番号jにおけるVBVバッファ占有量である。
Figure 0005879555
次に、VBV保護制御量算出部6は、変化速度Vの大きさを評価する(S103)。具体的には、変化速度Vが0以上であるか、0よりも小さいかを評価する。
このとき、変化速度Vが0以上の場合、VBVバッファ占有量は、Nピクチャ間にわたって変動していない状態である(V=0)か、回復中の状態である(V>0)。したがって、変化速度Vが0以上の場合(S103において、FALSE)は、バッファアンダーフローに至ることはないので、VBV保護制御量17(ΔRvbv)=0とする(S104)。
一方、変化速度Vが0より小さい場合(S103において、TRUE)は、VBVバッファ占有量が減少している状態である。このとき、入力画像の符号化特性が大きく変わらないという仮定の下で、VBV保護制御量算出部6は、図3に示すように、ピクチャ番号kからアンダーフローに至るまでのピクチャ数Wbufを、以下の(式3)により算出する(S105)。
Figure 0005879555
続いて、VBV保護制御量算出部6は、符号バッファの占有量を増加させるための第1の制御量としてVBV保護制御量17(ΔRvbv)を算出する(S106)。
本実施の形態において、VBV保護制御量17(ΔRvbv)は、符号化対象ピクチャからWbufピクチャ経過する間に、VBVバッファ占有量を減少傾向から回復傾向とするための補正量として、以下の(式4)のように定義する。すなわち、VBV保護制御量17(ΔRvbv)は、バッファアンダーフローを回避するために、Wbufの区間において1ピクチャあたりのVBVバッファを回復させるための制御量を表している。
Figure 0005879555
次に、VBV保護制御量算出部6は、上記のように算出したVBV保護制御量17(ΔRvbv)を、ピクチャ毎にビットレート制御部5に出力する(S107)。
以上のようにして、VBV保護制御量17(ΔRvbv)が算出及び出力される。
その後、ビットレート制御部5において、第1の制御量であるVBV保護制御量17(ΔRvbv)を用いて量子化スケール18を決定する(ビットレート制御ステップ)。
具体的に、まず、ビットレート制御部5は、以下の(式5)を用いて、ピクチャ毎に、第2の制御量である平均符号量制御量(ΔRrate)を求める。平均符号量制御量(ΔRrate)は、平均ビットレートに近づけるための制御量を表している。
ここで、(式5)において、Wrateは平均ビットレートを求めるピクチャ数を表し、S[j]はピクチャ番号jにおけるピクチャ発生符号量を表している。なお、Wrateは任意の値であり、例えば所望の時定数に応じて設定すればよく、Wrateが大きいほど緩やかに符号量が制御される。
Figure 0005879555
次に、ビットレート制御部5は、VBV保護制御量17(ΔRvbv)および平均符号量制御量(ΔRrate)の2種類の制御量を用いて、ピクチャ目標符号量R[i]を更新する。
具体的に、ビットレート制御部5は、以下の(式6)に示すように、第3の制御量として、VBV保護制御量17(ΔRvbv)と平均符号量制御量(ΔRrate)とをVBVバッファ占有率に応じた割合で加重平均を求め、1つ前のピクチャ目標符号量R[i−1]に加算してピクチャ目標符号量R[i]を算出する。なお、R[i]の初期値R[0]は任意の値でよく、例えば平均ビットレートを1秒あたりのピクチャ数で割ることで得られるピクチャあたりの符号量にすればよい。ここで、VBVバッファの占有率とは、VBVバッファ占有量の最大値であるVBVsizeに対するVBVバッファ占有量VBV[k]の割合である。
Figure 0005879555
このように、VBVバッファ占有率に応じた割合で加重平均を求めることにより、VBVバッファ占有量が多い場合には、VBV保護制御量(ΔRvbv)よりも平均符号量制御量(ΔRrate)を優先させて制御することでき、また、VBVバッファ占有量が少なくバッファアンダーフローを回避する必要がある場合には、平均符号量制御量(ΔRrate)よりもVBV保護制御量(ΔRvbv)を優先させて制御することができる。
したがって、平均ビットビットレート制御とバッファ制御の優劣関係をVBVバッファ占有量によって連続的に制御することができるので、VBVバッファの占有量を急激に変化させることなくピクチャ目標符号量R[i]を算出することができる。これにより、平均ビットレートや量子化スケールが急激に変化することを抑制することができるので、画質を急変させることなくバッファ破綻を回避することが可能となる。
なお、これは可変ビットレート(VBR)制御のように、平均符号量制御量(ΔRrate)とVBV保護制御量(ΔRvbv)が相反する局面が生じやすい方式において、特に効果的である。
次に、ビットレート制御部5は、量子化スケール18を決定する。本実施の形態では、特許文献1に示されるように、”global complexity”(複雑度)と呼ばれるパラメータとして定義されたXに基づいて、以下の(式7)を用いて量子化スケール18(Q)を決定し、量子化部2に出力する。
Figure 0005879555
ここで、(式7)において、iは符号化対象のピクチャ番号、Xは過去のピクチャの発生符号量Sとその量子化スケールQの積(X=Q×S)で定義される。
以上のようにして、VBV保護制御量17(ΔRvbv)を用いて量子化スケール18が決定される。
以上、実施の形態1に係る動画像符号化装置および動画像符号化方法によれば、符号バッファの占有量(VBVバッファ占有量)の変化速度を用いることによって、アンダーフローに到達するピクチャ数を予測してバッファ破綻を回避するように量子化スケールを決定することができる。このとき、本実施の形態では、バッファ破綻の回避に必要十分な第1の制御量(VBV保護制御量)を求め、この第1の制御量を用いて量子化スケールを決定している。これにより、主観画質の劣化を伴うことなく符号バッファの破綻状態が回避することができる。
さらに、本実施の形態によれば、バッファ破綻を予測することができるので、現時点からバッファ破綻までのピクチャ数に応じて、量子化スケール18が漸次変化するようにして複数の第1の制御量(VBV保護制御量)を算出することもできる。これにより、ピクチャ間に不連続な画質差が発生することを抑制してピクチャ間の画質を連続的に変化させて主観的に優れた画質で符号化することができる。例えば、現時点からバッファ破綻までのピクチャ数の分だけ、VBV保護制御量(ΔRvbv)を算出することができる。
また、本実施の形態において、第1の制御量とVBVバッファ占有量に応じて平均符号量を制御する第2の制御量との加重平均である第3の制御量を求めて量子化スケールを決定することにより、量子化スケールの時間方向の急激な変化を抑制することが可能となる。これにより、平均ビットビットレート制御とバッファ制御の優劣関係をVBVバッファ占有量によって連続的に制御することができるので、画質を急変させることなく符号バッファの破綻状態を防ぐことができる。したがって、主観画質を安定的に保つことができる動画像符号化装置を実現できる。
なお、本実施の形態において、符号バッファ(VBVバッファ)を蓄積するためのピクチャ数は前述のピクチャ数N以上であれば良く、リングバッファなどを用いて記憶領域を管理しても良い。また、ピクチャ数Nは短いほど短期的な符号バッファの変化を捉えることが可能であるが、ピクチャ数Nを短くし過ぎると、VBV保護制御量(ΔRvbv)も短期的に変化してしまうため画質が安定しない場合がある。したがって、ピクチャ数Nは、(式1)のように、符号バッファの総量から換算した長さに近い値を設定することが望ましい。
さらに、本実施の形態では画面内符号化ピクチャについて説明したが、これに限らない。本実施の形態は、動き補償を用いた画面間符号化ピクチャについても同様に適用可能である。特に、GOP(Group Of Picture)構造など、Iピクチャ、PピクチャおよびBピクチャが周期的に現れる場合には、ピクチャ数Nを1GOP以上とすると効果的である。また、本実施の形態は、MPEG2方式に限らず、符号バッファを備えたMPEG−4AVCまたはH.264に代表される他の符号化方式にも適用可能である。
(実施の形態2)
次に、実施の形態2について、図4を用いて説明する。図4は、実施の形態2において符号バッファの占有量変化と制御区間とを示す図である。なお、実施の形態2に係る動画像符号化装置の構成要素は、図1に示す実施の形態1に係る動画像符号化装置10の構成要素と同様であるので、その説明は省略する。
実施の形態2に係る動画像符号化装置は、実施の形態1に対して、符号バッファの占有量(VBVバッファ占有量)に最小マージン(下限値)が設定されたものである。すなわち、本実施の形態では、VBV保護制御量(ΔRvbv)を求める際に、VBVバッファ占有量の最小マージンが設定されている。例えば、図4に示すようにVBVバッファ占有量に最小マージン(VBVmin)を設定した場合、上記の(式4)は、以下の(式8)のようにして表すことができ、これにより、VBV保護制御量(ΔRvbv)を算出することができる。
Figure 0005879555
なお、本実施の形態における動画像符号化方法は、実施の形態1と同様である。
以上、実施の形態2に係る動画像符号化装置および動画像符号化方法によれば、VBVバッファ占有量に最小マージンが与えられているので、バッファ制御に余裕を持たせることができる。これにより、シーンチェンジやストロボが発光するようなピクチャ間で絵柄が大きく変化する入力画像など、実施の形態1で述べたピクチャ数Wbufを求める際の仮定が成立しない場合においても対応することができる。
以上、本発明に係る動画像符号化装置および動画像符号化方法について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。
例えば、上記実施の形態に係る動画像符号化方法については、コンピュータによって実行させるコンピュータプログラムによって実現することもできる。また、当該動画像符号化方法に関するコンピュータプログラムについては、コンピュータによって読み取り可能非一時的な記録媒体に記録されていてもよい。記憶媒体としては、磁気ディスク、光ディスク、光磁気ディスク、ICカード、半導体メモリ等があり、例えば、フレキシブルディスク、ハードディスク、CD−ROM、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray Disc)(登録商標)がある。
また、上記の実施の形態に係る動画像符号化装置における機能は、種々の態様により提供可能である。例えば、LSI等のハードウェアであってもよいし、コンピュータに組み込まれるプログラムであってもよい。
その他、本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施した形態も、本発明の範囲内に含まれる。
本発明に係る動画像符号化装置および動画像符号化方法は、カメラレコーダやビデオレコーダに代表される映像記録装置あるいは映像中継装置等において広く適用可能であり、または、コンピュータ上の符号化プログラム等にも適用可能である。
1、101 DCT部
2、102 量子化部
3、103 符号化部
4、104 VBVモデル部
5、105 ビットレート制御部
6 VBV保護制御量算出部
10、100 動画像符号化装置
11、111 入力画像
12、112 DCT係数
13、113 量子化係数
14、114 ビットストリーム
15、115 発生符号量
16、116 VBVバッファ占有量
17 VBV保護制御量
18、117 量子化スケール

Claims (6)

  1. 動画像を符号化する動画像符号化装置であって、
    復号における符号バッファの占有量をシミュレーションするバッファモデル部と、
    前記符号バッファの占有量の変化速度を算出し、当該変化速度を用いて前記符号バッファのアンダーフローに至るまでのピクチャ数を求め、当該ピクチャ数を経過するまでの間に前記符号バッファの占有量を増加させて前記アンダーフローに至らないように前記符号バッファを保護するための第1制御量を算出する制御量算出部と、
    前記第1の制御量を用いて量子化幅を決定するビットレート制御部とを備える
    動画像符号化装置。
  2. 前記制御量算出部は、
    前記変化速度が0より小さい場合において、前記変化速度の絶対値が大きいほど前記量子化幅が大きくなるように、前記第1の制御量を算出する
    請求項1に記載の動画像符号化装置。
  3. 前記制御量算出部は、
    移動平均法あるいは最小二乗法を用いて、前記符号バッファの占有量の履歴から前記変化速度を求める
    請求項1または2に記載の動画像符号化装置。
  4. 前記ビットレート制御部は、
    符号化するピクチャの符号量を制御する第2の制御量を算出し、前記第1の制御量とともに前記第2の制御量を用いて、前記量子化幅を決定する
    請求項1〜3のいずれか1項に記載の動画像符号化装置。
  5. 動画像を符号化する動画像符号化装置であって、
    復号における符号バッファの占有量をシミュレーションするバッファモデル部と、
    前記符号バッファの占有量の変化速度に応じて量子化幅を決定するビットレート制御部と、
    前記符号バッファの占有量の変化速度を算出するとともに、前記変化速度に基づいて前記符号バッファの占有量を増加させる第1の制御量を算出する制御量算出部とを備え、
    前記ビットレート制御部は、
    符号化開始時点からの平均符号量を制御する平均符号量制御量として、符号化するピクチャの符号量を制御する第2の制御量を算出し、
    前記第1の制御量および前記第2の制御量を、前記符号バッファの占有量の割合を示す占有率により加重平均して得られる第3の制御量を用いて、前記量子化幅を決定する
    動画像符号化装置。
  6. 前記符号バッファの占有量に最小マージンが設定されている
    請求項1〜5のいずれか1項に記載の動画像符号化装置。
JP2011040744A 2010-05-10 2011-02-25 動画像符号化装置 Active JP5879555B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011040744A JP5879555B2 (ja) 2010-05-10 2011-02-25 動画像符号化装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010107841 2010-05-10
JP2010107841 2010-05-10
JP2011040744A JP5879555B2 (ja) 2010-05-10 2011-02-25 動画像符号化装置

Publications (2)

Publication Number Publication Date
JP2011259408A JP2011259408A (ja) 2011-12-22
JP5879555B2 true JP5879555B2 (ja) 2016-03-08

Family

ID=44901907

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011040744A Active JP5879555B2 (ja) 2010-05-10 2011-02-25 動画像符号化装置

Country Status (2)

Country Link
US (1) US9510003B2 (ja)
JP (1) JP5879555B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10812829B2 (en) 2012-10-03 2020-10-20 Avago Technologies International Sales Pte. Limited 2D block image encoding
US9883180B2 (en) 2012-10-03 2018-01-30 Avago Technologies General Ip (Singapore) Pte. Ltd. Bounded rate near-lossless and lossless image compression
CN104718753B (zh) * 2012-10-03 2018-05-11 安华高科技通用Ip(新加坡)公司 利用切片速率控制的有界率压缩
JP6699881B2 (ja) * 2015-04-24 2020-05-27 株式会社東芝 送信装置、受信装置および伝送システム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6054581A (ja) * 1983-09-06 1985-03-29 Nec Corp 差分符号化装置
JPH0413390A (ja) * 1990-05-02 1992-01-17 Oki Electric Ind Co Ltd 画像パケット多重化装置
JP3158608B2 (ja) * 1992-03-11 2001-04-23 ソニー株式会社 レートバッファ制御装置
US5650860A (en) * 1995-12-26 1997-07-22 C-Cube Microsystems, Inc. Adaptive quantization
JP3952509B2 (ja) * 1996-04-12 2007-08-01 ソニー株式会社 画像符号化装置、画像符号化方法及び画像符号化プログラムを記録した媒体
JPH10174103A (ja) * 1996-12-13 1998-06-26 Matsushita Electric Ind Co Ltd 画像符号化装置、符号化画像記録媒体、画像復号化装置、画像符号化方法、および符号化画像伝送方法
JPH1169344A (ja) * 1997-08-20 1999-03-09 Matsushita Electric Ind Co Ltd 動画像符号化装置および動画像復号化システム
US6192154B1 (en) * 1998-01-26 2001-02-20 International Business Machines Corporation Two-pass encoding method of digital motion video sequences for constant-or variable bit rate
JP2001169281A (ja) * 1999-12-13 2001-06-22 Matsushita Electric Ind Co Ltd 動画像符号化装置、および動画像符号化方法
JP4256574B2 (ja) * 2000-08-04 2009-04-22 富士通株式会社 画像信号符号化方法および画像信号符号化装置
US6937770B1 (en) * 2000-12-28 2005-08-30 Emc Corporation Adaptive bit rate control for rate reduction of MPEG coded video
JP3714302B2 (ja) * 2002-07-08 2005-11-09 ソニー株式会社 画像データ処理装置及び方法
JP4007594B2 (ja) * 2002-09-26 2007-11-14 株式会社東芝 動画像符号化装置及び方法、動画像符号化方式変換装置及び方法
JP4179917B2 (ja) * 2003-04-22 2008-11-12 株式会社東芝 動画像符号化装置及び方法
JP4224778B2 (ja) * 2003-05-14 2009-02-18 ソニー株式会社 ストリーム変換装置および方法、符号化装置および方法、記録媒体、並びに、プログラム
US7720145B2 (en) * 2004-05-13 2010-05-18 Ittiam Systems (P) Ltd. Model based bit rate control for a macroblock encoder
JP2006295535A (ja) 2005-04-11 2006-10-26 Toshiba Corp 動画像符号化装置および方法
JP4720284B2 (ja) * 2005-05-16 2011-07-13 Kddi株式会社 画像圧縮符号化装置
JP4456064B2 (ja) * 2005-12-21 2010-04-28 日本電信電話株式会社 パケット送信装置、受信装置、システム、およびプログラム

Also Published As

Publication number Publication date
US9510003B2 (en) 2016-11-29
US20110274160A1 (en) 2011-11-10
JP2011259408A (ja) 2011-12-22

Similar Documents

Publication Publication Date Title
JP4203707B2 (ja) 事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。
KR101391661B1 (ko) 동화상 부호화 제어 방법, 동화상 부호화 장치 및 동화상 부호화 프로그램
JP4358215B2 (ja) 動画像符号化装置及びその方法
US8798162B2 (en) Encoding method, decoding method, encoder, and decoder
JP4532980B2 (ja) 動画像符号化装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP5879555B2 (ja) 動画像符号化装置
KR101389919B1 (ko) 동화상 부호화 제어 방법, 동화상 부호화 장치 및 동화상 부호화 프로그램
JP4795223B2 (ja) 画像処理装置
US9615095B2 (en) Coding device, imaging device, coding transmission system, and coding method
JP2006197560A (ja) 画像符号化装置、画像符号化方法、プログラム及び記憶媒体
JP2006295535A (ja) 動画像符号化装置および方法
JP2011029954A (ja) 画像符号化装置と画像符号化方法
JP6947010B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2007318617A (ja) 画像符号化装置、及び画像符号化プログラム
WO2000045605A1 (en) Bit rate control for video data compression
JP4708821B2 (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム及び記憶媒体
JP2004328150A (ja) 動画像符号化装置及び方法
JP4609411B2 (ja) 動画像符号化装置及び動画像符号化プログラム
JP2009206543A (ja) トランスコーダ
JP4285431B2 (ja) ビデオ情報編集装置、方法及びプログラム
JP4254784B2 (ja) 動画像符号化装置、方法及びプログラム
JP6740533B2 (ja) 符号化装置、復号装置及びプログラム
JPWO2020008858A1 (ja) 動画像符号化装置、動画像符号化方法、プログラム
JP4823150B2 (ja) 符号化装置並びに符号化方法
JP2007081744A (ja) 動画像符号化装置及び動画像符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131226

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20141008

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141111

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150728

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150819

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150915

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151002

R151 Written notification of patent or utility model registration

Ref document number: 5879555

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151