JP4293112B2 - 画像符号化装置と方法 - Google Patents

画像符号化装置と方法 Download PDF

Info

Publication number
JP4293112B2
JP4293112B2 JP2004316413A JP2004316413A JP4293112B2 JP 4293112 B2 JP4293112 B2 JP 4293112B2 JP 2004316413 A JP2004316413 A JP 2004316413A JP 2004316413 A JP2004316413 A JP 2004316413A JP 4293112 B2 JP4293112 B2 JP 4293112B2
Authority
JP
Japan
Prior art keywords
image
scene change
buffer
encoding
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004316413A
Other languages
English (en)
Other versions
JP2006129214A (ja
Inventor
安弘 橋本
正道 名郷根
光章 白神
寛和 石田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2004316413A priority Critical patent/JP4293112B2/ja
Publication of JP2006129214A publication Critical patent/JP2006129214A/ja
Application granted granted Critical
Publication of JP4293112B2 publication Critical patent/JP4293112B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は画像処理技術に関するものであり、特に、連続する画像にシーンチェンジがあった場合にバッファにアンダーフローまたはオーバーフローなどの破綻を起こさせず、さらに好適には符号化画像の画質の劣化なく処理可能にした画像処理装置とその方法に関する。
通常、画像符号化装置において、固定符号化レート(CBR:Constant Bit Rate)または可変符号化レート(VBR:Variable Bit Rate)で画像信号を符号化してビットストリームとして出力する。
CBRで符号化されたビットストリームは、一定のビットレートを有し、目標ビットレートを大きく逸脱することはない。これに対して、VBRで符号されたビットストリームは、符号化対象となる画像信号の特徴などに応じて変化するからビットレートが一定ではない。ただし、この場合においても、規格によって定められた最大ビットレートを越えない範囲内において画像信号に対して圧縮符号化処理が行われる。
ディジタル化した動画像信号を符号化する場合、符号化ビットレート制御が行われる。符号化ビットレート制御とは、符号化によって発生する符号系列をある一定の時間幅でみたときに所望のビットレートになるよう制御することである。
これまで、動画像を高能率で圧縮符号化するための規格が複数提案されている。そのなか、MPEG2規格が動画像符号化の標準規格として現在通信、放送および記録媒体への蓄積など様々な応用分野で注目を集め、実用化されつつある。その一つの応用例であるDVD(Digital Versatile Disc)は、MPEG2規格に準じて動画像を圧縮符号化したデータを保存する記録媒体として、大容量、低コストかつ扱いが簡単なため、今後ますますの普及が期待されている。
MPEG2規格では、ビットレートを制御する符号化制御について規定されていない。このため、符号化情報量は規格によって定められた範囲内にあればよい。
特許文献1は、実時間処理が要求されるアプリケーションにおいて可変符号化レートでの動画像の圧縮符号化処理を実現できる画像符号化装置及びその処理方法を開示している。特許文献1に開示されている技術は、要約すれば、量子化(Q)スケールを制御することにより行なうVBRレート制御技術である。
また特許文献1に開示された技術は、画像全体の平均ビットレートが一定の基準になるように、GOP単位、たとえば、15ピクチャ以上の単位で符号化レート制御を行う。GOP毎の目標ビット量を予め設定し、各GOPの発生ビット量が目標ビット量からのずれに応じて、Qスケールを制御することにより、QスケールがGOP単位に緩やかに変化し、かつ画像全体のビットレートが目標ビットレートから大きく逸脱しない範囲内に保持される。
しかしながら、連続するピクチャにおいて、画像内容が大きく変化すると、前のピクチャと今回のピクチャとの変化分を抽出するのではなく、たとえば、大きく変化したピクチャ(フレーム)全体を符号化する。
そのため、連続するピクチャについて、画像内容が大きく変化したこと、すなわち、シーンチェンジ(SC)を検出する。
シーンチェンジを検出した後の処理の方法を例示する。
シーンチェンジが起きると前後のフレームの画像(ピクチャ)間の相関が低くなり圧縮効率が稼げなくなるため、目標ビット量を固定した同一発生ビット量のレート制御、すなわち、固定ビットレート(CBR)方式によるレート制御では、符号化画像に画質劣化が生じる。
そこで、シーンチェンジでの符号化画像の画質劣化を抑える処理として、一般的に、可変ビットレート(VBR)方式に基づき、符号化によって発生するビットの目標値、すなわち、目標ビット量を増加させることにより発生ビット量を増加することを許容して、符号化処理して、符号化画像の画質劣化を防いでいる。
WO00/65842(PCT/JP00/02592)
しかし、たとえば、アニメーション映画の戦闘シーンなどのように動きが早いピクチャが連続する場合とか、フラッシュが多いシーンが連続する場合とか、撮像装置のカメラの切替えが多いときなど、シーンチェンジが連続して発生した場合、上述した目標ビット量を変換させる方法でシーンチェンジのたびに発生ビット量を増加し続けると、目標とする発生ビット量からの逸脱が大きくなり、可変ビットレート(VBR)方式によるレート制御といえども、発生ビット量を抑える制限が必要になってくる。
たとえば、シーンチェンジが発生したとき、上述した目標ビット量からのずれ修正以外にも、発生ビット量が多すぎることにより生じる画像符号化装置内のVBVバッファ(図1を参照して後述する)のアンダーフロー等の画像符号化装置におけるシステム破綻回避処理としても、発生ビット量を抑える必要が生じてくる。
発生ビット量を抑える方法としては、画像符号化装置内の画像圧縮符号化部におけるDCT係数を強制的にカットして0に置き換えることや、符号化対象の画像のうちシンタックス(文脈)的に必要な最小限のストリームに置き換えることにより、連続するピクチャのうち、あるピクチャをスキップさせてしまうことが考えられる。
しかし、これらの処理により生じる符号化画像の画質劣化は大きく、シーンチェンジに応じて発生ビット量を増やして改善したシーンチェンジでの画質のメリットに比べ、デメリットの方が大きいと言う問題がある。
本発明は、連続する画像にシーンチェンジがあった場合にバッファにアンダーフローまたはオーバーフローなどの破綻を起こさせない、画像符号化装置とその方法を提供することを目的とする。
本発明はさらに、バッファにアンダーフローまたはオーバーフローなどの破綻を起こさせず、符号化画像の画質の劣化なく処理可能にした画像処理装置とその方法を提供することを目的とする。
本発明の第1の観点によれば、連続する画像信号を圧縮符号化する画像圧縮符号化手段と、連続する画像信号についてシーンチェンジを検出し、さらにシーンチェンジが連続していることを検出する、シーンチェンジ検出・連続シーンチェンジ判定手段と、上記シーンチェンジ検出・連続シーンチェンジ判定手段において、シーンチェンジが連続していると判定したとき、上記画像圧縮符号化手段においてシーンチェンジに対して通常のレート制御で発生するビット量以上に発生ビット量を増加させて符号化処理する、上記増加させる発生ビット量を所定の増減ビットレートで徐々に減少させ、その後、シーンチェンジがなくなれば次にシーンチェンジが発生したときに上記画像圧縮符号化手段における増加させる発生ビット量を上記所定の増減ビットレートで徐々に回復させる目標ビット量増加量演算手段とを有し、上記画像圧縮符号化手段の符号化状態を記憶するバッファの破綻を防止する、画像符号化装置が提供される。
好適には、上記バッファの占有量を監視し、上記画像圧縮符号化手段におけるシーンチェンジに起因する発生ビット量が増加しすぎることにより生じるバッファの破綻が予測される場合には、上記画像圧縮符号化手段における発生ビット量が増加するシーンチェンジ対策処理を停止させる、シーンチェンジ処理オン・オフ判定手段をさらに有する。
本発明の第2の観点によれば、(a)連続する画像信号についてシーンチェンジを検出し、(b)シーンチェンジが連続したとき、シーンチェンジに対して通常のレート制御で発生するビット量以上に発生ビット量を増加させる、可変ビットレート方式のビットレート制御を行う画像圧縮符号化手段に対して、上記増加させる発生ビット量を所定の増減ビットレートで徐々に減少させ、(c)その後、シーンチェンジがなくなれば次にシーンチェンジが発生したときに上記画像圧縮符号化手段における増加させる発生ビット量を上記所定の増減ビットレートで徐々に回復させ、上記画像圧縮符号化手段の符号化状態を記憶するバッファの破綻を防止する、画像符号化方法が提供される。
好適には、上記バッファの占有量を監視し、上記画像圧縮符号化手段におけるシーンチェンジに起因する発生ビット量が増加しすぎることにより生じるバッファの破綻が予測される場合には、上記画像圧縮符号化手段における発生ビット量が増加するシーンチェンジ対策処理を停止させる。
本発明によれば、シーンチェンジが連続して発生する画像が入力された場合には、発生ビット量を徐々に減少させるようにして、発生ビット量が増加しすぎることによるバッファ破綻あるいはバッファ破綻回避処理を未然に防止することができる。
また本発明によれば、シーンチェンジに対する処理により破綻が起きうるバッファの状態を監視し、破綻の危険性が高まれば発生ビット量が増加するシーンチェンジ処理をオフにして、バッファ破綻またはバッファ破綻処理を確実に回避することができる。
このように、本発明によれば、バッファが破綻することによる画像符号化装置のシステム的な問題、あるいは、バッファが破綻しないまでも、破綻を回避する処理に起因する符号化画質の劣化を防止することができる。
画像符号化装置
図1は、本発明の画像符号化装置の実施の形態の画像符号化装置1の構成図である。
画像符号化装置1は、制御処理部10と、画像圧縮符号化部20と、SC検出部30と、連続シーンチェンジ(SC)判定部40と、目標ビット量増加量演算部50と、仮想バッファ確認用バッファ(VBV:Virtual Buffer Verifier)60と、シーンチェンジ(SC)処理オン・オフ判定部70と、可変ビットレート(VBR:Variable Bit Rate )バッファ80とを有する。
画像符号化装置1における画像入力部分としては、たとえば、ビデオカメラなどの撮像装置、または、他の記録媒体から画像信号を再生する画像再生装置などであり、何らかの手段で画像信号を生成し、かつ、アナログ形式の画像信号をディジタル信号に変換する機能を有するものであればよい。
以下、画像符号化装置1の各部の構成と処理内容について述べる。
制御処理部
制御処理部10は本発明の制御処理手段を構成しており、入力画像信号S1を入力し、入力画像信号S1の特徴などに応じて画像圧縮符号化部20に符号化パラメータP10および制御信号S10を出力する。
なお、符号化パラメータP10は、目標符号化レート、最大符号化レート、可変ビットレート指示信号、量子化スケールQSCなどを含む。
画像圧縮符号化部(エンコーダ)
画像圧縮符号化部(エンコーダ)20は、本発明の符号化手段に該当しており、制御処理部10からの符号化パラメータP10および制御信号S10に応じて、ディジタル入力画像信号S1を所定のアルゴリズム、たとえば、MPEG2規格に基づくアルゴリズムに基づいて圧縮符号化して、ビットストリームS20を出力する。
ビットストリームS20は、たとえば、記録再生装置に出力する。ビットストリームS20は記録再生装置により記録媒体、たとえば、DVDに記録される。
シーンチェンジ(SC)検出部
SC検出部30は、入力画像信号S1について連続するピクチャを比較してシーンチェンジを検出する。
連続シーンチェンジ(SC)判定部
連続SC判定部40は、SC検出部30がシーンチェンジを検出したとき、シーンチェンジが連続しているか否かを判定する。
目標ビット量増加量演算部
目標ビット量増加量演算部50は、連続SC判定部40においてシーンチェンジが連続している判定したとき、所定の増減ビットレートbrで目標ビット量TBを変化させて、画像圧縮符号化部20に指示する。
VBVバッファ
VBVバッファ60は、画像圧縮符号化部20における入力画像信号S1のエンコード(符号化)の際に、符号化した画像をデコードする(復号する)時のデコーダバッファの状態を仮想的に求め、デコーダバッファが破綻しないように、画像圧縮符号化部20における各フレームの発生ビット量を制御するためのバッファである。
VBRバッファ
VBRバッファ80は、可変ビットレート(VBR)に基づく符号化レート制御を行うため、1GOP(Group Of Picture) の目標ビット量TBに対する、実際に発生したビット量の差を積算した値を記憶するためのバッファである。
シーンチェンジ(SC)処理オン・オフ判定部
SC処理オン・オフ判定部70は、VBVバッファ60の占有量、および、VBRバッファ80の占有量を監視して、これらバッファに破綻が起きないように、画像圧縮符号化部20におけるシーンチェンジに基づく発生ビット量の処理をオンまたはオフさせる。
画像圧縮符号化部
図2は画像圧縮符号化部20の一構成を示す図である。
画像圧縮符号化部20は、加算器201、離散コイサン変換処理部(DCT(Discrete Cosine Transform )処理部)202、量子化部203、可変長符号化部(VLC)204、逆量子化部205、逆DCT部206、加算器207、フレームメモリ208、動き検出部209、動き補償部210、切り換え回路211および符号化制御部212を有する。
画像圧縮符号化部20に入力されたディジタル画像信号S1は、加算器201において切り換え回路211から入力される以前の再生画像信号との差分が求められ、その差分がDCT部202に出力される。
イントラピクチャ(Iピクチャ)モードの時には、切り換え回路211からは有意な画像が入力されないので(図2では、このモードにおける切り換え回路211からの出力を0としている)、加算器201に入力された画像データがそのままDCT部202に出力される。
動き補償予測モードの時には、切り換え回路211からはその前の再生画像に基づいた画像データが入力されるので、その差分を加算器201で求め、その誤差をDCT部202に入力する。
DCT部202は、加算器201から入力された画像信号に対して、離散コサイン変換を行い、画像データの空間的冗長性を削減する。DCTによって得られた変換係数は、量子化部203に入力される。
量子化部203は、符号化制御部212を介して入力される制御処理部10からの量子化スケールQSCに従って、DCT部202により得られた変換係数の量子化を行い、可変長符号化部204および逆量子化部205に出力する。このように、量子化部203の量子化スケールは制御処理部10から量子化スケールQSCを入力した符号化制御部212により制御される。
可変長符号化部204は、量子化部203において量子化された変換係数を可変長符号化し、符号化ビット列、すなわち、ビットストリームS20を生成し、順次出力する。
符号化制御部212は、量子化部203の量子化レート(Qスケール)、フレームメモリ208への画像データの記録および切り換え回路211の切り換えなどを制御する。なお、符号化制御部212は、本発明のシーンチェンジに関する処理を行うが、その詳細は後述する。
符号化制御部212は、たとえば、制御回路10から入力される目標ビットレートBRobj、最大ビットレートBRmax、VBR指示信号VBDおよび量子化スケールQS
Cに応じて、量子化部203に所定の量子化スケールを設定し、量子化部203における量子化レートを制御する。
量子化部203で量子化された変換係数は逆量子化部205に入力される。量子化された変換係数は、逆量子化部205において逆量子化され、さらに、逆DCT部206において逆離散コサイン変換(逆DCT)が行われる。
動き補償予測を行うモードの時には、加算器207で、逆DCTが行われた画像信号と前記動き補償予測により得られた画像信号を加算して元の画像信号に戻し、フレームメモリ208に記録する。
イントラ(I)ピクチャモードの時には、逆DCT部206で逆DCTされた画像信号がそのままフレームメモリ208に記録される。
動き補償予測を行う場合には、フレームメモリ208に記録されている画像信号が用いられる。すなわち、フレームメモリ208に記録されている画像信号に基づいて、次の画像ソース信号より動き検出部209において動き検出を行い、動きベクトルを検出する。さらに、その動きベクトルに基づいて、動き補償部210において動き補償予測を行う。この動き補償予測により得られた画像信号を切り換え回路211を介して加算器201に出力し、入力された画像ソース信号の差分を求める。
このように、画像圧縮符号化部20によって、入力されたディジタル画像データS1が符号化され、ビットストリームS20が生成される。
好適には、マクロブロック(MB)毎に量子化スケールが設定されると、画像圧縮符号化部20は、これをベースに、たとえば、MPEG2のTM(テストモデル)5における符号化レート制御のステップ3に基づいた視覚効果を狙った量子化スケールの変更を行い、これを量子化に用いる。そしてMB毎に発生されるビットストリームを出力する。
以上のように、画像圧縮符号化部20は、制御処理部10から符号化パラメータP10として出力される、目標ビットレートBRobj、最大ビットレートBRmax、VBR
指示信号VBD、および、量子化スケールQSCに応じて、入力ディジタル画像信号S1を、たとえば、MPEG2規格に基づいて、圧縮符号化し、ビットストリームS20を出力する。さらに、画像圧縮符号化部20は、圧縮符号化で生成したビット量を示す発生ビット量BQTおよび画像符号化種類を示すPCT信号を生成する。
このように、画像圧縮符号化部20は、入力画像信号S1の特徴、画像の変化にあわせて最適な符号化レートを求め、その符号化レート(量子化スケールQSC)に基づいて、画像の複雑さ、連続する画像の変化に則して、画像全体の画質の均一化と圧縮効率の向上を図る。
画像圧縮符号化部20により画像データが圧縮符号化された結果、ビットストリームS20のデータ量が圧縮符号化前の入力画像信号S1に比べてはるかに低減される。このため、画像圧縮符号化部20により圧縮符号化したビットストリームS20を情報伝送、蓄積することによって、伝送路の伝送容量又は画像記録媒体の記憶容量を大幅に低減できる。
画像圧縮符号化部20の符号化制御部212は、量子化スケールによる符号化レート制御がうまくいかず、VBVバッファ60がアンダーフローしそうになるとき、DCT係数を強制的にカットするなどしてこれを防止するなど、通常のMPEG2の画像符号化装置としての一般的な機能も有する。
この詳細は後述する。
シーンチェンジ(SC)検出部
シーンチェンジ(SC)検出部30は、フレームごと連続して入力されるディジタル画像信号(ピクチャ)S1について、時間的に隣り合う(フレームが連続する)2枚のピクチャを比較し、2枚のピクチャに相関がなければその2枚のピクチャの間でシーンチェンジ(SC)が発生したと検出し、SCを示すSC検出結果を出力する。SC検出結果は、画像圧縮符号化部20および連続シーンチェンジ(SC)判定部40に入力される。
SC検出部30における、上記比較および相関の有無の判定方法としては、たとえば、2枚のピクチャのヒストグラムを求め、両者のヒストグラムの差を求め、ヒストグラムの差がしきい値を越えたか否かにより、SCが発生したか否かを判定する。
連続シーンチェンジ(SC)判定部
連続シーンチェンジ(SC)判定部40は、シーンチェンジ(SC)検出部30からSC検出結果が入力されるたびに、シーンチェンジが連続しているか否かを判定する。
連続SC判定部40において、連続シーンチェンジと判定する基準は、第1判定基準として、フレーム単位でシーンチェンジが連続している場合(イントラ・ピクチャのシーンチェンジ)の場合、および、第2判定基準として、フレームごとのシーンチェンジを検出する第1判定基準に限らず、たとえば、図3に図解したように、シーンチェンジがあったフレーム(ピクチャ)の次のPピクチャに対してシーンチェンジ処理を行なう場合も対象とする。
図3はシーンチェンジの検出状態を示す図である。
図3において、BはBピクチャ、すなわち、双方向予測ピクチャを示し、IはIピクチャ、すなわち、イントラピクチャを示し、PはPピクチャ、すなわち、前方向予測ピクチャを示す。このようなピクチャが複数集合したものが、1GOPを構成する。
連続SC判定部40は、第2判定基準のシーンチェンジ判定に関して、Pピクチャに対して連続してシーンチェンジ処理が行なわれる場合、連続シーンチェンジと判定する。
連続SC判定部40における連続シーンチェンジの判定結果は、第1判定基準による場合も第2判定基準による場合も、目標ビット量増加量演算部50に入力される。
なお、連続シーンチェンジ(SC)判定部40は、アップ・ダウンカウンタを有しており、シーンチェンジ(SC)検出部30からSC検出結果が入力されると、アップ・ダウンカウンタの値を1増加させ、次のフレームでSC検出結果が入力されないと、アップ・ダウンカウンタの値を1つ減じる。
このように、連続SC判定部40はシーンチェンジが連続する数を把握している。
画像圧縮符号化部の符号化制御部
画像圧縮符号化部20の符号化制御部212は、シーンチェンジ検出部30からシーンチェンジが検出されたことを示すSC結果情報が入力されると、たとえば、画像圧縮符号化部20内で、次のPピクチャをエンコードする時に、シーンチェンジ処理として以下の処理を行なう。ただし、次フレームのPピクチャをエンコードする前にI(イントラ)ピクチャをエンコードする場合は、シーンチェンジ処理は行なわないとする。
(1)マクロブロック(MB)タイプをすべてイントラ(I)マクロブロックにする。
(2)発生ビット量を増加させる。
発生ビット量の増加方法としては、本実施の形態の可変ビットレート(VBR)では最大(MAX)と最小(MIN)のビットレートを固定ビットレート(CBR)で制限を加えているが、最大と最小のビットレートを制限するCBRの、そのフレームに対する目標ビット量TBを増加させる。
増加させて設定する量は、たとえば、Iピクチャをエンコードする際に設定する目標ビット量TBと同じ値とすることで、Iピクチャ程度のビット量が発生するようにする。
ただし、シーンチェンジが連続する場合は、図4を参照して述べるように、増加量を徐々に減少させるようにする。
目標ビット量増加量演算部
連続シーンチェンジ判定部40において、シーンチェンジが連続しているかどうかを判定したとき、その判定結果に基づき、目標ビット量増加量演算部50において、目標ビット量TBとして、100%からの所定の増減ビットレートbr、たとえば、br=3%ずつの減少、あるいは、3%ずつの回復の演算を行なう。
図4はシーンチェンジの発生状況と目標ビット量との関係を示すグラフである。
図4に示すように、目標ビット量増加量演算部50は、たとえば、画像圧縮符号化部20においてIピクチャをエンコードする際に設定する目標ビット量TBを100%とし、シーンチェンジが検出されない場合にPピクチャに設定する目標ビット量TBを0%とする。
目標ビット量増加量演算部50は、シーンチェンジ(SC)検出部30においてシーンチェンジが検出された場合の目標ビット量TBの設定値は100%とするが、連続シーンチェンジ(SC)判定部40で判定した結果シーンチェンジが連続する場合は設定する目標ビット量TBを所定の比率の増減ビットレートbr、たとえば、br=3%ずつ減少させる。
シーンチェンジ検出部30においてシーンチェンジが検出されなくなった場合は、目標ビット量増加量演算部50は、次にシーンチェンジが検出された場合に設定する目標ビット量TBは上記所定の増減ビットレートbr、たとえば、br=3%で回復(増加)させるが、このときはシーンチェンジが検出されていないので、実際に設定する目標ビット量TBは0%となる。また回復させる目標ビット量TBは上限を100%とする。
連続シーンチェンジ判定部40における判定の結果、シーンチェンジの連続が続き、設定する目標ビット量TBが0%を下回る時は、目標ビット量増加量演算部50は、目標ビット量TBの下限を0%に制限する。
画像圧縮符号化部20の符号化制御部212において、シーンチェンジ検出部30からシーンチェンジを検出したことを示すSC結果信号が入力されると、目標ビット量増加量演算部50から出力される増減ビットレートbr(%)の値に相当する目標ビット量TBを設定する。
逆に、シーンチェンジ検出部30からシーンチェンジが検出されたことを示すSC結果信号が入力されないと、画像圧縮符号化部20の符号化制御部212において、目標ビット量TBとして0%に相当する値を設定する。
このように、連続シーンチェンジに対する対策を行なうことにより、シーンチェンジ処理として目標ビット量TBを強制的に増加させる処理が連続し発生ビット量が増加しすぎることによる、VBVバッファ60のアンダーフロー、VBRバッファ80のオーバーフローなどのバッファ破綻を未然に防ぐことが可能となる。
バッファ破綻処理
しかし、以上の処理だけでは確実に上述したVBVバッファ60と、VBRバッファ80のバッファ破綻を回避できるとは限らないので、本実施の形態の画像符号化装置1においては、実際に破綻を起こす可能性があるバッファの占有量(記憶量)により、シーンチェンジ処理のオン・オフの切り替えを行なう。
破綻を起こす可能性があるバッファの一つとして、図1に示すVBVバッファ60がある。
VBVバッファ60は、上述したように、画像圧縮符号化部20における入力画像信号S1のエンコードの際にデコード時のデコーダバッファの状態を仮想的に求め、デコーダバッファが破綻しないように、画像圧縮符号化部20に対して各フレームの発生ビット量を制御するバッファである。
可変ビットレート(VBR)制御ではVBVバッファ60のオーバーフローは問題にならないが、画像圧縮符号化部20の符号化制御部212において、アンダーフローに対しては絶対起きないように制御が行なわれる。
すなわち、VBVバッファ60のアンダーフローが起きそうになると、符号化制御部212は、画像圧縮符号化部20の量子化部203における量子化(Q)スケールを極端に大きな値へ置き換える処理や、あるいはマクロブロックをスキップマクロブロックにするなどして、発生ビット量を抑える制御を行う。
符号化制御部212において、このような破綻回避処理が行なわれると、即座に符号化画像の画質劣化につながるので、VBVバッファ60のアンダーフローが起きることはないにしても、そのためのVBVバッファ60のアンダーフロー回避処理が働くことは望ましくない。
シーンチェンジ処理オン・オフ判定部
そこで、本実施の形態の画像符号化装置1においては、シーンチェンジ(SC)処理オン・オフ判定部70において、図5に示すように、VBVバッファ60の占有量(記憶量)に閾値を設け、VBVバッファ60の占有量がこの閾値以下になれば発生ビット量を強制的に増加させるシーンチェンジ処理は行なわないように管理する。
図5はSC処理オン・オフ判定部70が図1に図解したVBVバッファ60の占有量を管理する状態を示すグラフである。
このオン・オフを切り替えるSC処理オン・オフ判定部70におけるシーンチェンジ処理としては、直接的な発生ビット量の増加処理以外にも、発生ビット量増加につながるマクロブロックを全てイントラ(I)マクロブロックにする処理を加えても良い。
SC処理オン・オフ判定部70におけるシーンチェンジ処理のオン・オフを決定するVBVバッファ60の占有量の閾値は、固定値でも良いが、図6に示すように、ビットレート応じて変化させても良い。
図6は、画像符号化装置1に図解したシーンチェンジ処理オン・オフ判定部70が判定する、ビットレート(横軸)とVBVバッファ60の占有量(縦軸)との関係を示すグラフである。
すなわち、ビットレートが高くなるに従い1フレームの発生ビット量は増えるため、VBVバッファ60のアンダーフローが起き易くなる。SC処理オン・オフ判定部70は、画像圧縮符号化部20の符号化制御部212のバッファ制御処理を継続させ、符号化制御部212は、ビットレートが高いほどVBVバッファ60の占有量の閾値を高く設定するようにする。
シーンチェンジ処理により破綻する可能性があるバッファとしては、VBVバッファ60以外にも本実施の形態では図1に示すVBRバッファ80がある。
図7は図1に図解した画像符号化装置1におけるVBRバッファ80の占有(記憶)状態を示すグラフである。
VBRバッファ80は、可変ビットレート(VBR)制御において、1GOPの目標ビット量TBに対する、実際に発生したビット量の差を積算したものである。
VBRバッファ80の占有量(記憶量)が増加しているということは過剰にビットが発生している状態であり、画像圧縮符号化部20における以降のエンコードにおいて発生ビット量を抑える必要がある。
逆に、VBRバッファ80の占有量(記憶量)が減少しているということは過少にビットが発生している状態であり、画像圧縮符号化部20における以降のエンコードにおいて発生ビット量を増加させる必要がある。
このようなVBRバッファ80のための発生ビット量の制御を行なうため、画像圧縮符号化部20の符号化制御部212において、VBRバッファ80の占有量を「リアクタ値」と呼ぶ係数で割った値を量子化(Q)スケールコードとしてエンコードに用い、かつ、この操作をある長い期間、たとえば、1GOP毎に行なうことで、本実施の形態では可変ビットレート(VBR)制御を行なっている。
VBRバッファ80の記憶量が増加を続け、リアクタ値で割った値が、31を超えるような場合、MPEG2規格ではQスケールコードの上限が31であるため、発生ビット量を十分抑えられなくなる。
このような状態に陥ると、すなわち発生ビット量の誤差が過剰になると、たとえば、画像圧縮符号化部20のビットストリームS20を、たとえば、ある決められた記録容量の記録媒体、たとえば、DVDに記録できる時間が、目標としていたものに比べはるかに短くなるなどの不都合が生じる。
このような問題に対する対策として、たとえば、VBRバッファ80の占有量がQスケールコードに換算して31を超えるような場合、画像圧縮符号化部(エンコーダ)20の符号化制御部212は、1フレームの、たとえば、Bピクチャのビットストリームを、符号化画像の画質は無視して、MPEG2規格を満たすために必要な最小限のビットストリームに置き換える(スキップフレーム)などを行い、VBRバッファ80がそれ以上増加しないようにする。
このような処理を行なうと、VBRバッファ80についても、VBVバッファ60の場合と同様に符号化画像の画質劣化につながるため、VBRバッファ80の占有量がQスケールコード換算で31に近い値まで増加しないような制御を行なうべきである。
シーンチェンジ(SC)処理オン・オフ判定部
その制御の一つとして、シーンチェンジ(SC)処理オン・オフ判定部70において、VBRバッファ80の占有量の値に応じて、発生ビット量の増加につながるシーンチェンジ処理のオン・オフの切り替えを行なう。
図8(A)、(B)は、図1に図解した画像符号化装置におけるVBRバッファの制御方法を示すグラフである。
たとえば、図8(A)に示すように、ある可変の設定閾値をVBRバッファ80の占有量が超えると、SC処理オン・オフ判定部70は、シーンチェンジ処理の一つである、画像圧縮符号化部20の符号化制御部212における、発生ビット量を強制的に増加させる処理をオフにして、その処理を終了させる。
これとは別の固定の閾値をVBRバッファ80の占有量が超えると、シーンチェンジ処理のもう一つである、画像圧縮符号化部20の符号化制御部212における、マクロブロックを強制的に全てイントラ(I)マクロブロックに置き換える処理をオフにする。
ただし、各閾値の固定、可変の組み合わせは例示であり、これに限るものではなく、また2つの処理両方に対してオンとオフの制御を行なわなければならないわけではなく、どちらか一方でも構わない。
また、図8(B)に示すように、発生ビット量の増加オン・オフの切替えの閾値が高く設定された場合は、SC処理オン・オフ判定部70は画像圧縮符号化部20の符号化制御部212を介して、イントラ(I)マクロブロック化の閾値もこれに合わせ、固定値の閾値は無視して設定された閾値によりオン・オフを制御するようにしてもよい。
これらの処理により、画像圧縮符号化部20における符号化制御部212の制御のもとでの、シーンチェンジ処理がオフになると、画像圧縮符号化部20における符号化画像について、シーンチェンジ時の画質改善が行なわれなくなるが、シーンチェンジ処理がオフになる場合はQスケールコードが高い状態であり、符号化した画像の画質がある程度劣化している状態であるので、シーンチェンジによる画質劣化があっても実質的に大きな問題とはならない。
シーンチェンジ時の画質劣化を改善する処理の副作用として、新たな画質劣化が発生する可能性があるが、本実施の形態の画像符号化装置1によれば、これを未然に防ぐことが可能となり、シーンチェンジ処理を有効に活用することが可能となる。
以上述べたように、本実施の形態は、可変ビットレート(VBR)によるレート制御として、入力画像にシーンチェンジ(SC)があったとき、マクロブロック(MB)タイプや目標ビット量TBを操作して、発生ビット量を特別に増加させる処理を行う、画像符号化装置、好適には、動画像符号化装置における処理として、シーンチェンジを検出し、シーンチェンジが連続して発生する画像が入力された場合には、発生ビット量を徐々に減少させるようにして、発生ビット量が増加しすぎることによるバッファ破綻あるいはバッファ破綻回避処理を未然に防ぐことができる。
さらに本実施の形態は、シーンチェンジに対する処理により破綻が起きうるバッファの状態を監視し、破綻の危険性が高まれば発生ビット量が増加するシーンチェンジ処理をオフにして、バッファ破綻またはバッファ破綻処理を確実に回避する。
本実施の形態は、以上の処理により、VBVバッファ60または、VBRバッファ80などのバッファがオーバーフローするとか、アンダーフローするなどのバッファが破綻することによる画像符号化装置のシステム的な問題、あるいは、バッファが破綻しないまでも、破綻を回避する処理に起因する符号化画質の劣化を防止することができる。
本発明の画像符号化装置の実施に際して、図1に図解した構成および上述して各構成要素における処理の分担は、例示である。
たとえば、シーンチェンジ(SC)検出部30は連続シーンチェンジ(SC)判定部40とを一体構成することもできる。
また、シーンチェンジ(SC)検出部30と、連続シーンチェンジ(SC)判定部40と、目標ビット量増加量演算部50と、画像圧縮符号化部20内の符号化制御部212と、シーンチェンジ(SC)処理オン・オフ判定部70とを1つのコンピュータなどで実現することもできる。このように、上述した機能分担または処理分担は例示に過ぎず、画像符号化装置1全体として上述した処理が遂行されればよい。
画像圧縮符号化部20における符号化方式として、MPEG2を例示したが、本発明の画像符号化装置はMPEG2規格に限定されず、他のMPEG規格、たとえば、MPEG4規格、あるいは、さらに他の符号化方式を適用することもできる。
図1は本発明の実施の形態の画像符号化装置の構成図である。 図2は図1に図解した画像圧縮符号化部(エンコーダ)の構成を示す図である。 図3はシーンチェンジの検出状態を示す図である。 図4はシーンチェンジの発生状況と目標ビット量との関係を示すグラフである。 図5は図1に図解したVBVバッファの占有量を管理する状態を示すグラフである。 図6は、画像符号化装置に図解したシーンチェンジ処理オン・オフ判定部が判定する、ビットレート(横軸)とVBVバッファの占有量(縦軸)との関係を示すグラフである。 図7は図1に図解した画像符号化装置におけるVBRバッファの占有状態を示すグラフである。 図8(A)、(B)は、図1に図解した画像符号化装置におけるVBRバッファの制御方法を示すグラフである。
符号の説明
1…画像符号化装置
10…制御処理部
20…画像圧縮符号化部(エンコーダ)
212…符号化制御部
30…シーンチェンジ(SC)検出部
40…連続シーンチェンジ(SC)判定部
50…目標ビット量増加量演算部
60…VBVバッファ
70…シーンチェンジ(SC)処理オン・オフ判定部
80…VBRバッファ

Claims (12)

  1. 連続する画像信号を圧縮符号化する画像圧縮符号化手段と、
    連続する画像信号についてシーンチェンジを検出し、さらにシーンチェンジが連続していることを検出する、シーンチェンジ検出・連続シーンチェンジ判定手段と、
    上記シーンチェンジ検出・連続シーンチェンジ判定手段において、シーンチェンジが連続していると判定したとき、上記画像圧縮符号化手段においてシーンチェンジに対して通常のレート制御で発生するビット量以上に発生ビット量を増加させて符号化処理する、上記増加させる発生ビット量を所定の増減ビットレートで徐々に減少させ、その後、シーンチェンジがなくなれば次にシーンチェンジが発生したときに上記画像圧縮符号化手段における増加させる発生ビット量を上記所定の増減ビットレートで徐々に回復させる目標ビット量増加量演算手段と
    を有し、
    上記画像圧縮符号化手段の符号化状態を記憶するバッファの破綻を防止する、
    画像符号化装置。
  2. 上記目標ビット量増加量演算手段における上記所定の増減ビットレートは、上記画像圧縮符号化手段の符号化状態を示すデータを記憶するバッファの占有量に応じて規定する、
    請求項1に記載の画像符号化装置。
  3. 上記バッファの占有量を監視し、上記画像圧縮符号化手段におけるシーンチェンジに起因する発生ビット量が増加しすぎることにより生じるバッファの破綻が予測される場合には、上記画像圧縮符号化手段における発生ビット量が増加するシーンチェンジ対策処理を停止させる、シーンチェンジ処理オン・オフ判定手段をさらに有する、
    請求項1または2に記載の画像符号化装置。
  4. 上記バッファは、仮想バッファ確認用のVBVバッファである、
    請求項1〜3のいずれかに記載の画像符号化装置。
  5. 上記バッファは、可変ビットレート制御用VBRバッファである、
    請求項1〜4のいずれかに記載の画像符号化装置。
  6. 上記画像圧縮符号化手段は、MPEG規格に基づく符号化処理を行う、
    請求項1〜5のいずれかに記載の画像符号化装置。
  7. 連続する画像信号についてシーンチェンジを検出し、
    シーンチェンジが連続したとき、シーンチェンジに対して通常のレート制御で発生するビット量以上に発生ビット量を増加させる、可変ビットレート方式のビットレート制御を行う画像圧縮符号化手段に対して、上記増加させる発生ビット量を所定の増減ビットレートで徐々に減少させ、
    その後、シーンチェンジがなくなれば次にシーンチェンジが発生したときに上記画像圧縮符号化手段における増加させる発生ビット量を上記所定の増減ビットレートで徐々に回復させ、
    上記画像圧縮符号化手段の符号化状態を記憶するバッファの破綻を防止する、
    画像符号化方法。
  8. 上記所定の増減ビットレートは、上記画像圧縮符号化手段の符号化状態を示すデータを記憶するバッファの占有量に応じて規定する、
    請求項7に記載の画像符号化方法。
  9. 上記バッファの占有量を監視し、上記画像圧縮符号化手段におけるシーンチェンジに起因する発生ビット量が増加しすぎることにより生じるバッファの破綻が予測される場合には、上記画像圧縮符号化手段における発生ビット量が増加するシーンチェンジ対策処理を停止させる、
    請求項7に記載の画像符号化方法。
  10. 上記バッファは、仮想バッファ確認用のVBVバッファである、
    請求項7〜9のいずれかに記載の画像符号化方法。
  11. 上記バッファは、可変ビットレート制御用VBRバッファである、
    請求項7〜10のいずれかに記載の画像符号化方法。
  12. 上記画像圧縮符号化手段は、MPEG規格に基づく符号化処理を行う、
    請求項7〜11のいずれかに記載の画像符号化方法。
JP2004316413A 2004-10-29 2004-10-29 画像符号化装置と方法 Expired - Fee Related JP4293112B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004316413A JP4293112B2 (ja) 2004-10-29 2004-10-29 画像符号化装置と方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004316413A JP4293112B2 (ja) 2004-10-29 2004-10-29 画像符号化装置と方法

Publications (2)

Publication Number Publication Date
JP2006129214A JP2006129214A (ja) 2006-05-18
JP4293112B2 true JP4293112B2 (ja) 2009-07-08

Family

ID=36723391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004316413A Expired - Fee Related JP4293112B2 (ja) 2004-10-29 2004-10-29 画像符号化装置と方法

Country Status (1)

Country Link
JP (1) JP4293112B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4249218B2 (ja) * 2006-12-18 2009-04-02 Nttエレクトロニクス株式会社 画像符号化装置

Also Published As

Publication number Publication date
JP2006129214A (ja) 2006-05-18

Similar Documents

Publication Publication Date Title
JP3224465B2 (ja) 画像符号化装置
JP3436507B2 (ja) ビットレート制御方法
JP3711571B2 (ja) 画像符号化装置及び画像符号化方法
US6937771B2 (en) Image coding apparatus
TWI478584B (zh) 一種視訊編解碼的方法及其裝置
US6167088A (en) Method and apparatus for performing adaptive encoding rate control of a video information stream including 3:2 pull-down video information
JP2002511669A (ja) 映像データストリームの適応的符号化方法と装置
JP4706104B2 (ja) 画像符号化装置及びその方法
JP2005515732A (ja) 計算量制約データ圧縮における動的制御
JP3907875B2 (ja) 符号化レート制御装置及び情報符号化装置
US9615095B2 (en) Coding device, imaging device, coding transmission system, and coding method
JP4795223B2 (ja) 画像処理装置
US6993080B2 (en) Signal processing
JP4179917B2 (ja) 動画像符号化装置及び方法
US7876816B2 (en) Moving picture coding program, program storage medium, and coding apparatus
JP4293112B2 (ja) 画像符号化装置と方法
EP1089569A1 (en) Image encoding device and its method
JP4718736B2 (ja) 動画像符号化装置
Bozoki et al. Scene adaptive rate control in a distributed parallel MPEG video encoder
JP2004241879A (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP4604757B2 (ja) 画像符号化装置および画像符号化方法
JP2000013802A (ja) フレーム間予測を用いた映像信号符号化装置
JP2001157210A (ja) 符号化装置及び符号化方法
JP2003230147A (ja) 映像信号符号化装置およびその方法
JP4152570B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化プログラムが記録された記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070426

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090317

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090330

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140417

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees