JP4362795B2 - 動画像符号化装置及びその方法 - Google Patents

動画像符号化装置及びその方法 Download PDF

Info

Publication number
JP4362795B2
JP4362795B2 JP19867299A JP19867299A JP4362795B2 JP 4362795 B2 JP4362795 B2 JP 4362795B2 JP 19867299 A JP19867299 A JP 19867299A JP 19867299 A JP19867299 A JP 19867299A JP 4362795 B2 JP4362795 B2 JP 4362795B2
Authority
JP
Japan
Prior art keywords
image
code amount
picture
encoding
screen complexity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP19867299A
Other languages
English (en)
Other versions
JP2001028753A (ja
Inventor
一彦 森田
光章 藤原
隆幸 菅原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP19867299A priority Critical patent/JP4362795B2/ja
Publication of JP2001028753A publication Critical patent/JP2001028753A/ja
Application granted granted Critical
Publication of JP4362795B2 publication Critical patent/JP4362795B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【0001】
【発明の属する技術分野】
動画像の高能率符号化に係り、特に、可変ビットレート符号化を行う際に好適な符号量制御装置及びその方法に関する。
【0002】
【従来の技術】
TV信号などの動画像を高能率に符号化する技術の国際標準として既にMPEG2が規定されている。
MPEG2は、動画像を構成する「フレーム」画像を「マクロブロック」と呼ばれる16×16画素のブロックに分割し、各マクロブロック単位に、時間的に前または後に所定の数フレーム離れた参照画像と符号化画像の間で「動きベクトル」と呼ばれる動き量を求め、この動き量を基に参照画像から符号化画像を構成する「動き補償予測」技術と、動き補償予測の誤差信号または符号化画像そのものに対して、直交変換の一種であるDCT(離散コサイン変換)を用いて情報量を圧縮する「変換符号化」技術の2つの画像符号化の要素技術をベースに規定されている。
【0003】
従来のMPEG2の動画像符号化装置の一構成例を図7に、また、符号化ピクチャ構造の一例を図6に示す。
動き補償予測では、図7に示した符号化ピクチャ構造のように、 Iピクチャ(フレーム内符号化)、Pピクチャ(順方向予測符号化)、Bピクチャ(双方向予測符号化)と呼ばれる、予測方法の異なる3種類のピクチャの組合せによって構成される。
図7に示されるように、変換符号化では、Iピクチャでは符号化画像そのものに対し、P,Bピクチャでは動き補償予測器77による動き補償予測の誤差信号である減算器71の出力に対して、DCTがDCT器72で施される。
【0004】
このDCT器72で得られたDCT係数に対して量子化が、符号量制御部90の出力により制御して量子化器73によってなされた後に、動きベクトル等のその他の付帯情報と共に可変長符号化が可変長符号化器75でなされ、符号列が「ビットストリーム」としてバッファ76に記憶された後に出力される。
この際、バッファ76の充足度に応じて符号量制御部90で量子化スケールが制御される。
一方、量子化器73の出力係数は、逆量子化器77、IDCT器78に供給さて、局部復号されてブロック毎にフレームメモリ81に貯えられる。
【0005】
MPEG2は可変長符号化であるため、単位時間当りの発生符号量(ビットレート)は一定ではない。
そこで、量子化器73での量子化の際の量子化スケールをマクロブロック単位に適宜変更することにより、所要のビットレートに制御することが可能になっている。
MPEG2 Test Model 5では、GOP単位で発生符号量を一定にする固定ビットレート制御方法が提案されている。
【0006】
Test Model 5ではピクチャタイプによって異なる符号量割当が行われる。フレーム内符号化が行われるIピクチャに対しては最も多くの符号量を割り当てる一方、復号画像が再度予測に使われることのないBピクチャの量子化スケールをI及びPピクチャの1.4倍にして、割り当てる符号量を一層少なくすることによって、Bピクチャに対する符号量を削減し、その分を復号画像が予測に使われるI及びPピクチャに多く割り当てて、復号画像の画質がピクチャタイプ間で一定になるように、ピクチャタイプによる符号量割当の最適化を図っている。
【0007】
このTest Model 5における固定ビットレート制御方法は、一定の転送レートが要求される用途に対しては有効な方法である。
しかし、動画像シーケンスのどの部分に対してもほぼ同じ符号量が割り当てられるため、情報量を多く含む複雑なシーンに対しては十分な符号量が与えられずに画質劣化が生じてしまう。
これに対して、情報量が少ない単純なシーンの場合には符号量が余剰になって無駄が生じ、DVD-Videoのように可変転送レートが可能な用途に対しては、適切なレート制御方法とは言えなかった。
【0008】
以上のような問題を解決するレート制御方法が可変ビットレート制御方法である。特開平6−141298号公報には、可変ビットレート制御による符号化装置が開示されている。
この装置では、最初に、入力動画像に対して固定量子化スケールによって仮符号化を行い、単位時間毎に発生符号量がカウントされる。つぎに、入力動画像全体の発生符号量が所要値になるように、仮符号化時の発生符号量に基づいて各部分の目標転送レートを設定する。そしてこの目標転送レートに合致するように制御を行いながら、入力動画像に対して2回目の符号化、言い換えると実符号化が行われる。
【0009】
しかし、上記従来例では、出力ビットストリームを得るためには少なくとも2回の符号化を行わなければならず、リアルタイム性を要求されるような用途ではこの装置のような2パス方式の可変ビットレート制御は使用出来ない。
【0010】
これに対し、動画像をほぼリアルタイムで符号化するための可変ビットレート制御方法、すなわち1パス方式の可変ビットレート制御方法も存在する。特開平10−164577号公報には、1パス方式の可変ビットレート制御方法による符号化装置が前記公報の図6等に開示されている。
【0011】
この従来例における動画像符号化装置の一構成例を図8に示す。
なお、図7と同一構成部に対しては同一符号を付してその説明は省略する。
この従来例の装置では、バッファ76に記憶した符号量を発生符号量検出器83に供給し、この発生符号量検出器83による発生符号量と、量子化器73からの量子化スケールを平均量子化スケール検出器82に供給し、この平均量子化スケール検出器82による画面内の量子化スケールの平均値との積を「画面複雑度」として画面複雑度算出器84で求め、過去の画面複雑度の平均値に対する現在の画面複雑度の割合を基に、画面の目標発生符号量または目標量子化スケールを決定することにより、可変ビットレート制御を符号量制御器74で実現している。
【0012】
【発明が解決しようとする課題】
しかしながら可変ビットレート制御の場合、多くの場合は最大転送レートによる制限を受ける。目標平均ビットレートが最大転送レートより充分に小さい場合は、Test Model 5のようにBピクチャに対する符号量割当をI及びPピクチャよりも小さくして、ピクチャタイプ間の符号量割当を最適化することが可能である。
【0013】
目標平均ビットレートが最大転送レートに近くなると、I及びPピクチャの割当符号量が最大転送レートによる制限を受けるようになり、Bピクチャとの割当符号量の差が縮小し、時には割当符号量がピクチャタイプ間でほとんど同じになってしまう。
割当符号量の差が小さくなってしまうと、Bピクチャに比べ、I及びPピクチャの画質が相対的に悪くなり、目標平均ビットレートが高いにもかかわらず、不適切な符号量配分に起因する画質の差によって画質劣化が知覚されてしまうといった問題があった。
【0014】
そこで本発明は、動画像符号化装置における1パス及び2パス方式の可変ビットレート制御方法において、目標平均ビットレートが最大転送レートに近い場合においても、ピクチャタイプ間でより適切な符号量割当を実現する方法を提供することを目的とする。
【0015】
【課題を解決するための手段】
そこで、本発明は、上記課題を解決するために以下の装置及び方法を提供するものである。
(1)入力動画像を、動き補償予測手段、直交変換手段、量子化手段、及び可変長符号化手段によって符号化を行う動画像符号化装置において、
前記入力動画像を構成する各画像の符号化時において、前記各画像毎の発生符号量を検出する手段と、
前記入力動画像を構成する各画像の符号化時において、前記各画像毎の平均量子化スケールを検出する手段と、
前記入力動画像を構成する各画像の符号化時において、前記各画像毎のアクティビティを検出する手段と、
前記各画像毎の発生符号量と前記各画像毎の平均量子化スケールとの積に対して所定の変換を施すことによって、前記各画像毎の画面複雑度を算出するとともに、予め設定される第1の所定期間毎に、前記各画像毎の画面複雑度を加算平均して平均画面複雑度を算出する手段と、
前記入力動画像を構成する各画像のうち、これから符号化を行なう画像である符号化対象画像の前記アクティビティを、前記符号化対象画像の直前に符号化された画像の前記アクティビティで除した値に、前記符号化対象画像の直前に符号化された画像の画面複雑度を乗じることで、前記符号化対象画像の画面複雑度を算出する手段と、
符号化単位である第2の所定期間毎に予め決定される平均割当符号量に、前記符号化対象画像の画面複雑度を前記平均画面複雑度で除した値を乗ずることで、前記第2の所定期間毎の割当符号量を算出するとともに、この算出した割当符号量から、既知の方法により、前記符号化対象画像の第1の割当符号量を算出する第1の符号量制御手段と、
前記第2の所定期間毎に、前記符号化対象画像の画面複雑度を因数とする所定の関数によって算出される最大割当符号量から、既知の方法により、前記符号化対象画像の第2の割当符号量を算出する第2の符号量制御手段と、
記第1の割当符号量を、前記第2の割当符号量でリミッタをかけた値を目標割当符号量とするとともに、この目標割当符号量と各マクロブロックの発生符号量とから、既知の方法により、各マクロブロックの量子化スケールを決定する手段と、
を備えたことを特徴とする動画像符号化装置。
(2)上記(1)に記載された動画像符号化装置において、
前記第1の符号量制御手段は、
前記第1の割当符号量を、ピクチャタイプ(Iピクチャ、Pピクチャ、Bピクチャ)別に算出し、
前記第2の符号量制御手段は、
前記第2の割当符号量を、ピクチャタイプ(Iピクチャ、Pピクチャ、Bピクチャ)別に算出することを特徴とする動画像符号化装置。
(3)入力動画像を、動き補償予測ステップ、直交変換ステップ、量子化ステップ、及び可変長符号化ステップによって符号化を行う動画像符号化方法において、
前記入力動画像を構成する各画像の符号化時において、前記各画像毎の発生符号量を検出するステップと、
前記入力動画像を構成する各画像の符号化時において、前記各画像毎の平均量子化スケールを検出するステップと、
前記入力動画像を構成する各画像の符号化時において、前記各画像毎のアクティビティを検出するステップと、
前記各画像毎の発生符号量と前記各画像毎の平均量子化スケールとの積に対して所定の変換を施すことによって、前記各画像毎の画面複雑度を算出するとともに、予め設定される第1の所定期間毎に、前記各画像毎の画面複雑度を加算平均して平均画面複雑度を算出するステップと、
前記入力動画像を構成する各画像のうち、これから符号化を行なう画像である符号化対象画像の前記アクティビティを、前記符号化対象画像の直前に符号化された画像の前記アクティビティで除した値に、前記符号化対象画像の直前に符号化された画像の画面複雑度を乗じることで、前記符号化対象画像の画面複雑度を算出するステップと、
符号化単位である第2の所定期間毎に予め決定される平均割当符号量に、前記符号化対象画像の画面複雑度を前記平均画面複雑度で除した値を乗ずることで、前記第2の所定期間毎の割当符号量を算出するとともに、この算出した割当符号量から、既知の方法により、前記符号化対象画像の第1の割当符号量を算出する第1の符号量制御ステップと、
前記第2の所定期間毎に、前記符号化対象画像の画面複雑度を因数とする所定の関数によって算出される最大割当符号量から、既知の方法により、前記符号化対象画像の第2の割当符号量を算出する第2の符号量制御ステップと、
記第1の割当符号量を、前記第2の割当符号量でリミッタをかけた値を目標割当符号量とするとともに、この目標割当符号量と各マクロブロックの発生符号量とから、既知の方法により、各マクロブロックの量子化スケールを決定するステップとを備えたことを特徴とする動画像符号化方法。
(4)上記(3)に記載された動画像符号化方法において、
前記第1の符号量制御ステップは、
前記第1の割当符号量を、ピクチャタイプ(Iピクチャ、Pピクチャ、Bピクチャ)別に算出し、
前記第2の符号量制御ステップは、
前記第2の割当符号量を、ピクチャタイプ(Iピクチャ、Pピクチャ、Bピクチャ)別に算出することを特徴とする動画像符号化方法。
【0018】
【発明の実施の形態】
本発明の動画像符号化装置の第1の実施例について、図1と共に以下に説明する。
図1に示したように、本発明の動画像符号化装置及びその方法の第1の実施例は、減算器11、DCT器12、量子化器13、可変長符号化器15、バッファ16、逆量子化器17、IDCT器18、動き補償予測器19、加算器20、フレームメモリ21、平均量子化スケール検出器22、発生符号量検出器23、画面複雑度算出器24、画像特性検出器25、VBR符号量制御器51、及びCBR符号量制御器52より構成されている。
【0019】
原動画像は画像ブロック分割器(図示せず)によって、予めマクロブロック単位に分割されているものとする。
分割された原動画像は、Iピクチャについては動き補償予測が行われず、原動画像ブロックそのものが減算器11を介して直交変換器の一種であるDCT器12に送られ、DCTされた後に量子化器13で符号量制御器14から送られる量子化スケールによって量子化される。
【0020】
その量子化された信号は、可変長符号化器15で符号に変換されて、つぎのバッファ16で調整された後に符号が出力される。
一方、量子化器13の出力係数は、逆量子化器17、IDCT器18で局部復号されて、動き補償予測器19の出力が加算器20で加算されることなく、ブロック毎にフレームメモリ21に貯えられる。
【0021】
P及びBピクチャについては、分割された原動画像とフレームメモリ21に貯えられた所定の局部復号画像ブロックが動き補償予測器19に供給され、ここで動きベクトル検出及び動き補償が行われて、予測画像ブロックが減算器11で原画像ブロックとの間で画素間差分が取られ、差分値である誤差画像ブロックがDCT器12に送られる。
【0022】
この後はIピクチャと同様にして、DCT器12で差分値がDCTされ、量子化器13で符号量制御器14から送られる量子化スケールによって量子化された後に、可変長符号化器15で符号に変換されて、つぎのバッファ16で調整された後に符号が出力される。
【0023】
量子化器13の出力係数は、逆量子化器17とIDCT器18とで局部復号された後に、動き補償予測器19からの前記予測画像ブロックが加算器20によって画素毎に加算され、ブロック毎にフレームメモリ21に貯えられる。
また、各ピクチャについて、量子化器13からマクロブロック毎の量子化スケールが平均量子化スケール検出器22に送られ、そこで1フレーム分の量子化スケールが加算され、1フレームの平均量子化スケールが算出される。
【0024】
一方、バッファ16においては、発生符号量が監視され、その値が発生符号量検出器23に送られる。
この発生符号量検出器23において、発生符号量がフレーム単位に加算され、1フレームの発生符号量が検出される。
フレーム毎について検出された平均量子化スケール、発生符号量は画面複雑度算出器24とCBR符号量制御器52に夫々送られる。
【0025】
一方、画像特性検出器25では、分割された原画像が入力され、原画像の各フレームについてマクロブロック単位に画像特性を示すパラメータ、すなわちアクティビティが検出され、フレーム単位に加算されてその結果が画面複雑度算出器24に送られる。
【0026】
すなわち、画像特性検出器25への入力は、Iピクチャの場合は動き補償予測が行われないため、マクロブロック単位に分割された原動画像のみが入力され、マクロブロック単位に画像特性を示すパラメータであるアクティビティ(ACTcur)が検出され、フレーム単位に加算され、IピクチャのアクティビティACTiとして画面複雑度算出器24に送られる。
【0027】
アクティビティ(ACTcur)としては輝度値の分散、画素間差分値などが考えられるが、画像特性を示すものであればその他のパラメータでも良い。
【0028】
一方、図1に示す画像特性検出器25への入力は、P及びBピクチャの場合は、分割された原動画像の他に、マクロブロック単位の動き補償予測における誤差画像または動きベクトル検出における符号化画像と参照画像との差分画像と、動き補償予測で使用した動きベクトルが動き補償予測器19から入力される。
分割された原動画像からはIピクチャの場合と同様にマクロブロック単位に(原画像)アクティビティACTcurが検出される。
【0029】
一方、マクロブロック単位の動き補償予測における誤差画像または動きベクトル検出における符号化画像と参照画像との差分画像は、その中で絶対値和または2乗誤差和がとられ、予測アクティビティACTpredとして検出される。
さらに、動き補償予測で使用した動きベクトルの方は、隣接マクロブロックとの間で各成分毎に差分の絶対値がとられ、ACTmvとして検出される。
【0030】
そして、各マクロブロック毎に次式(1)の演算により、ACTmbが算出され、それが1フレーム分加算されて、P及びBピクチャのアクティビティACTp及びACTbとして画面複雑度算出器24に送られる。
【0031】
Figure 0004362795
【0032】
なお、各定数a、b、cの値はピクチャ別、マクロブロックの予測モード別(イントラか片方向予測か双方向予測か)などで変化させる。
例えば、イントラの場合はIピクチャと同様に予測を行わないので、b=c=0となり、予測を行うブロックに比べて発生符号量が多くなると考えられるので、aの値を大きくする。
【0033】
このように、予測モード等に即したアクティビティ検出を行うことにより、より符号化特性に即した画面複雑度の推定が可能になる。
【0034】
画面複雑度算出器24では供給された各フレームの平均量子化スケールと発生符号量が乗算された後に乗算結果に所定の変換が施されて、各フレームの(過去の)画面複雑度として求められる。
画面複雑度は符号化ピクチャタイプ別に一定期間内の値が加算された後にその期間内の同じピクチャタイプのフレーム数で除算されて、各ピクチャタイプの平均画面複雑度 Xi-ave, Xp-ave, Xb-ave が算出される。
【0035】
ここで言う一定期間内は、符号化の終了したばかりの画像から時間的に前に予め定めるフレーム数、例えば15フレームとか、300フレームといった一定のフレーム数の場合もあり、符号化開始フレームから符号化の終了したばかりの画像までのように、順次フレーム数が増加する場合もある。
なお、前者の一定フレーム数の場合でも、符号化したフレーム数が定めた一定期間を満たさない場合は後者と同様に順次フレーム数が増加していくことになる。
【0036】
これから符号化する現在の画像の画面複雑度Xk-c (k= i, p, b) は、現在の画像のアクティビティをACTk (k= i, p, b)、直前に符号化した同じピクチャタイプの画像の画面複雑度 Xk-p (k= i, p, b)、アクティビティACTk-p (k= i, p, b)より下記の式(2)で推定出来る。
【0037】
Figure 0004362795
【0038】
なお、初期状態において、同じピクチャタイプの符号化の終了したフレームが存在しない場合は予めいくつかの画像で各ピクチャタイプの画像の画面複雑度とアクティビティを求めておき、それを平均的な動画像の発生頻度に合わせて統計的に平均してそれを初期値とすればよい。
【0039】
各ピクチャタイプの平均画面複雑度 Xi-ave, Xp-ave, Xb-aveと、これから符号化する現在の画像の推定画面複雑度 Xi-c, Xp-c, Xb-c はVBR符号量制御器51に送られ、ここで可変ビットレート制御のための量子化スケールの設定が行われる。
目標平均ビットレートをBitRate、1秒当りのフレーム数をPictureRate、1つの符号化単位である1GOP(通常はIピクチャの間隔)のフレーム数をNとすると、1GOPの平均割当符号量Raveは次式(3)で与えられる。
【0040】
Figure 0004362795
【0041】
上式のRaveは平均画面複雑度の時の1GOPの必要割当符号量とすると、これから符号化する現在の画像を含む1GOPの画像が一様に前記画面複雑度算出器24で求めた現在の画像の推定画面複雑度に等しいと仮定すると、画質を一定に保持す場合に必要な1GOPの必要割当符号量Rck (k= i, p, b) は次式(4)で与えられる。
【0042】
Figure 0004362795
【0043】
上式のRck (k= i, p, b)を1GOPの各ピクチャに適切に割り振ることにより、これから符号化する現在の画像の第1の符号量制御手段における目標符号量を算出する。例としてMPEG2 Test Model 5の目標符号量割当方法を以下に挙げるが、これ以外の方法を用いてもよい。
【0044】
1GOPに含まれるP、Bピクチャのフレーム数をNp、Nb、Iピクチャに対するP、Bピクチャの量子化スケールの設定比率をKp、Kbとする。この時、各ピクチャタイプの目標割当符号量Ti, Tp, Tbは次式(5)(6)(7)で与えられる。
なお、MAX[a, b]はaとbのいずれか大きい方を選択する動作を示す。
また、Xi, Xp, Xbはここでは直前に符号化したピクチャの画面複雑度(当該ピクチャの平均量子化スケールと発生符号量の積)である。
【0045】
(Iピクチャ)
Figure 0004362795
【0046】
(Pピクチャ)
Figure 0004362795
【0047】
(Bピクチャ)
Figure 0004362795
【0048】
一方、CBR符号量制御器52ではフレーム単位の平均量子化スケール、発生符号量が入力され、両者の積から直前に符号化したピクチャの画面複雑度Xi, Xp, Xbを求めて、BitRateが最高転送レート(BitRateMax)の時の各ピクチャタイプの目標割当符号量Ti-max, Tp-max, Tb-maxを第1の符号量制御手段における目標割当符号量Ti, Tp, Tbと同様に求める。
ここで、1GOPの平均割当符号量Rav-maxは各ピクチャ共通で、次式(8)で与えられる。
【0049】
Figure 0004362795
よって、
【0050】
(Iピクチャ)
Figure 0004362795
【0051】
(Pピクチャ)
Figure 0004362795
【0052】
(Bピクチャ)
Figure 0004362795
【0053】
上式のTi-max, Tp-max, Tb-maxは、すなわち、第2の符号量制御手段における目標割当符号量の上限であり、これらの値はVBR符号量制御器51に送られて、前記した符号化する現在の画像の当該ピクチャタイプについて、前記したTi, Tp, Tbの値はTi-max, Tp-max, Tb-maxの値でリミッタがかけられ、現在の画像の目標割当符号量が決定する。
【0054】
上のようにして決定した目標割当符号量と、バッファ16で検出される各マクロブロックの発生符号量をもとに、MPEG2 Test Model 5の方法を用いて各マクロブロックの量子化スケールを決定する。
【0055】
なお、画像特性検出器25からは符号量制御器51へも各マクロブロックのアクティビティACTcurが送られ、MPEG2 Test Model 5におけるアクティビティに基づいて各マクロブロックの量子化スケールを変更する適応量子化制御に使用されるが、この適応量子化制御は行わなくてもよい。またこれとは全く異なる方法で各マクロブロックの量子化スケールを決定してもよい。
【0056】
符号量制御器51から出力される各マクロブロックの量子化スケールが量子化器13に送られ、現在の画像(DCT後の分割された原画像または動き補償予測の誤差画像ブロック)がこの量子化スケールで量子化され、可変長符号化されてバッファ16で調整された後に符号が出力される。
【0057】
マクロブロック毎の量子化スケール、バッファ16で監視される発生符号量がそれぞれ、平均量子化スケール検出器22、発生符号量検出器23に送られ、次のピクチャの符号量制御に使用される。
【0058】
なお、上の説明では、CBR符号量制御器52における1GOPの平均割当符号量Rav-maxを、単純に最高転送レート(BitRateMax)の時に1GOPに割当てられる符号量として計算していた。
これに対して、これから符号化する現在の画像の推定画面複雑度Xk-c (k= i, p, b)を因数とする、図2 (a)のような所定の関数、例えば、現在の画像の推定画面複雑度Xk-cが増大するとその値が限りなく1に近付く関数f(Xk-c)を設定する。
【0059】
ピクチャタイプ毎にこの関数を乗算した次式(12)のRav-max'をRav-maxの代りに使用することにより、図2(b)に示されるように、各ピクチャタイプの最高転送レートに近い場合の発生符号量を徐々に押さえると共に、最高転送レートを超えた点で画面複雑度と割当符号量の関係が不連続になることから生ずる、当該ピクチャタイプの画質劣化が顕著になる問題を押えることも可能となる。
【0060】
Figure 0004362795
【0061】
つぎに、本発明の動画像符号化装置の第2の実施例について、以下に図3と共に説明する。
第2の実施例では、2パス方式の可変ビットレート符号量制御に本発明を適用した場合である。原画像入力〜可変長符号化器15で符号に変換されるまでの基本的な符号化部分は第1の実施例と同一である。
大きく異なるのは1つの画像について、符号化動作が2回(またはそれ以上)行われ、最初に仮符号化が行われ、その発生符号量の結果を基に2回目の符号化が行われるため、両者の符号化動作に異なる部分があることである。
【0062】
1回目の符号化では、量子化器13に送られる量子化スケールはVBR符号量制御器51から送られるのではなく、スイッチSW1を介して仮符号化量子化スケール設定器56から一定の値(6とか8といった値)が送られ、これにより固定値の量子化が行われる。
そして可変長符号化器15において可変長符号化が行われた後のビットストリームはそれを外部に出力するためのバッファ16に送られず、スイッチSW2を介して仮符号化発生符号量検出器53に送られて、1回目の符号化における各画像の発生符号量が検出される。
【0063】
発生符号量は順次仮符号化発生符号量検出器53から仮転送レートメモリ54に送られ、所定期間毎に加算されて、仮転送レートが算出される。
この操作が1つの画像シーケンスの符号化が終了するまで行われ、仮転送レートメモリ54には所定期間毎の仮転送レートが蓄積される。
【0064】
1回目の符号化が終了すると、画像シーケンス全体の仮発生符号量または平均仮転送レートが算出され、この値と所定期間毎の仮転送レートが目標転送レート算出器55に送られ、2回目の符号化(実符号化)における所定期間毎の目標転送レートが算出される。
【0065】
なお、1回目の符号化における所定期間毎の仮転送レートRtと2回目の符号化の目標転送レートRとの関係は、予め所定の関数を設定しておく。
例えば次の(13)のような関数が考えられる。
【0066】
Figure 0004362795
【0067】
1回目の仮符号化が終了し、2回目の符号化の目標転送レートが決定するとその目標転送レートに従って2回目の符号化(実符号化)が開始される。
2回目の符号化では、量子化器13に送られる量子化スケールはVBR符号量制御器51で得られた値が送られる。
【0068】
ここで、VBR符号量制御器51では、平均量子化スケール検出器22、発生符号量検出器23で検出された各フレームの平均量子化スケール、発生符号量と、目標転送レート算出器55で仮符号化結果から算出された所定期間毎の目標転送レートから、これから符号化する画像の目標割当符号量が求められる。
【0069】
一方、CBR符号量制御器52で算出された(第2の符号量制御手段における)目標割当符号量の上限もVBR符号量制御器51に入力され、前記目標割当符号量にリミッタがかけられ、目標割当符号量が決定する。
CBR符号量制御器52における目標割当符号量の上限は第1の実施例における (Rav-maxによる) Ti-max, Tp-max, Tb-maxと同一である。
【0070】
以上のようにして決定した目標割当符号量と、バッファ16で検出される各マクロブロックの発生符号量をもとに、第1の実施例と同様にMPEG2 Test Model 5等の方法を用いて各マクロブロックの量子化スケールを決定する。
【0071】
このようにして決定された各マクロブロックの量子化スケールが量子化器13に送られ、これから符号化する画像(DCT後の分割された原画像または動き補償予測の誤差画像ブロック)がこの量子化スケールで量子化され、可変長符号化される。
【0072】
ここで発生するビットストリームは、2回目の符号化ではバッファ16に供給され、ここで目標転送レート算出器55で算出された所定期間毎の目標転送レートによって調整された後に符号が出力される。
マクロブロック毎の量子化スケール、バッファ16で監視される発生符号量がそれぞれ、平均量子化スケール検出器22、発生符号量検出器23に送られ、次のピクチャの符号量制御に使用される。
【0073】
更に、本発明の動画像符号化装置の第3の実施例について、以下に図4、図5と共に説明する。
以上の第1及び第2の実施例は可変ビットレート符号量制御に本発明を適用した場合であるが、本発明はそれに限定されず、幅広い応用が可能である。
図4に示される動画像符号化装置のように、バッファ16の出力の符号化ビットストリームをストリーム分割器59で2つに分ける。
その一方の出力は図5のようなI,P,Bピクチャ全てを使用した符号化ビットストリーム全体を出力し、もう一方はそのうちIとPピクチャのみを使用した符号化ビットストリームを出力する。
【0074】
I,Pピクチャのみの出力は、ここでは図示していないヘッダ変換器で、ヘッダ部分のパラメータ等が適切な値に書き換えられているものとする。
図4の符号量制御器1(51A)はビットストリーム全体の符号量を制御し、符号量制御器2(52A)はIとPピクチャのみのビットストリームの符号量を制御する。
【0075】
ここで、符号量制御器1(51A)と符号量制御器2(52A)で各ピクチャタイプの平均割当符号量が比較的近い値となるように、両者の平均ビットレートが設定されているものとする。
2つのビットストリームの符号量制御を同時に満足するために、符号量制御器2(52A)におけるI,Pピクチャの符号量割当結果を符号量制御器1(51A)に送り、符号量制御器1(51A)ではI,Pピクチャについては符号量制御器2(52A)の結果のI,Pピクチャの符号量割当をそのまま適用し、Bピクチャについては新たに符号量割当を行って、符号量制御器1(51A)の制御を実現する。
【0076】
これによりビットストリーム全体では符号量制御器1(51A)による制御が行われると同時に、ストリーム分割器59でビットストリームのI,Pピクチャ部分を取り出した場合は符号量制御器2(52A)で制御されたビットストリームを得ることが出来る。
【0077】
なお、ストリーム分割器59でIとPピクチャのみのビットストリームを出力する必要のない場合は、符号量制御器2(52A)による符号量割当は行わずに、符号量制御器1(51A)において、I、P、Bピクチャ各々について、通常の符号量割当を行う。
符号量制御器2(52A)による符号量割当は行わない場合は、それを示す信号をストリーム分割器59に送り、そこでIとPピクチャのみのビットストリームを出力を止める。
【0078】
図4の実施例に限らず、本発明は2つの符号量制御器を有する符号量制御形態において、主たる方の符号量制御器51Aに対して、従なる方の符号量制御器52Aの各ピクチャタイプ毎の符号量割当結果によって制限を加えることによって、各ピクチャタイプの符号量割当の適正化を図り、もしくは1つの符号化ビットストリームに対して2つの復号系に対応した、動画像符号化装置を実現することが出来る。
【0079】
【発明の効果】
以上のように本発明によると、符号化画像の割当符号量を決定する第1の符号量制御手段と、第1の符号量制御手段の符号量割当に制限を加える第2の符号量制御手段を有し、例えば可変ビットレート制御の場合、第1の符号量制御手段では可変ビットレート制御、第2の符号量制御手段では最高転送レートの固定ビットレート制御により割当符号量を求め、実際の割当符号量は、第1の符号量制御手段で得られる割当符号量が第2の符号量制御手段で得られる割当符号量を上回った場合のみ、第2の符号量制御手段で得られる割当符号量を適用し、それ以外の場合は第1の符号量制御手段で得られる割当符号量を適用する。
これによって、目標平均ビットレートが最大転送レートに近い場合においても、Bピクチャに不必要に多くの符号量を与えることもなく、ピクチャタイプ間の符号量割当を最適に保持することが可能になる。
【0080】
また、1パス方式の可変ビットレート制御で、各画像の発生符号量と平均量子化スケールの積に所定の操作を施して得られる画面複雑度を用いた制御を行う場合、画面複雑度を因数とする所定の関数を設定し、この関数を前記の第2の符号量制御手段で得られる割当符号量の上限に乗じて割当符号量の上限を変更することにより、割当符号量の上限に近い部分における符号量の増大を抑制すると共に、割当符号量の上限を超えた点での画質変動を緩和することが可能になる。
【図面の簡単な説明】
【図1】本発明の動画像符号化装置及びその方法の第1の実施例を示したブロック構成図である。
【図2】本発明の第1の実施例のRav-max'算出の際の関数及びXk-cと割当符号量の関係を示した図である。
【図3】本発明の動画像符号化装置及びその方法の第2の実施例を示したブロック構成図である。
【図4】本発明の動画像符号化装置及びその方法の第3の実施例を示したブロック構成図である。
【図5】本発明の第3の実施例のストリーム分割手段によるビットストリーム分割の様子を示した図である。
【図6】符号化ピクチャ構造の一例を示した図である。
【図7】一般的な動画像符号化装置の一構成例を示した図である。
【図8】従来の動画像符号化装置の一構成例を示した図である。
【符号の説明】
11 減算器
12 DCT器(直交変換器)
13 量子化器
14 符号量制御器
15 可変長符号化器
16 バッファ
17 逆量子化器
18 IDCT器
19 動き補償予測器
20 加算器
21 フレームメモリ
22 平均量子化スケール検出器
23 発生符号量検出器
24 画面複雑度算出器
25 画像特性検出器
51 VBR符号量制御器
52 CBR符号量制御器
51A 符号量制御器1
52A 符号量制御器2
53 仮符号化発生符号量検出器
54 仮転送レートメモリ
55 目標転送レート算出器
56 仮符号化量子化スケール設定器
59 ストリーム分割器
Rav-max BitRateが最高転送レート(BitRateMax)の時の1GOPの平均割当符号量
Rck 1GOPの必要割当符号量(k= i, p, b)
SW1,SW2 スイッチ
Tk 各ピクチャタイプの目標割当符号量(k= i, p, b)
Tk-max BitRateが最高転送レート(BitRateMax)の時の各ピクチャタイプ
の目標割当符号量(k= i, p, b)
Xk 現在の画像の画面複雑度(k= i, p, b)
Xk-c 現在の画像の推定画面複雑度(k= i, p, b)

Claims (4)

  1. 入力動画像を、動き補償予測手段、直交変換手段、量子化手段、及び可変長符号化手段によって符号化を行う動画像符号化装置において、
    前記入力動画像を構成する各画像の符号化時において、前記各画像毎の発生符号量を検出する手段と、
    前記入力動画像を構成する各画像の符号化時において、前記各画像毎の平均量子化スケールを検出する手段と、
    前記入力動画像を構成する各画像の符号化時において、前記各画像毎のアクティビティを検出する手段と、
    前記各画像毎の発生符号量と前記各画像毎の平均量子化スケールとの積に対して所定の変換を施すことによって、前記各画像毎の画面複雑度を算出するとともに、予め設定される第1の所定期間毎に、前記各画像毎の画面複雑度を加算平均して平均画面複雑度を算出する手段と、
    前記入力動画像を構成する各画像のうち、これから符号化を行なう画像である符号化対象画像の前記アクティビティを、前記符号化対象画像の直前に符号化された画像の前記アクティビティで除した値に、前記符号化対象画像の直前に符号化された画像の画面複雑度を乗じることで、前記符号化対象画像の画面複雑度を算出する手段と、
    符号化単位である第2の所定期間毎に予め決定される平均割当符号量に、前記符号化対象画像の画面複雑度を前記平均画面複雑度で除した値を乗ずることで、前記第2の所定期間毎の割当符号量を算出するとともに、この算出した割当符号量から、既知の方法により、前記符号化対象画像の第1の割当符号量を算出する第1の符号量制御手段と、
    前記第2の所定期間毎に、前記符号化対象画像の画面複雑度を因数とする所定の関数によって算出される最大割当符号量から、既知の方法により、前記符号化対象画像の第2の割当符号量を算出する第2の符号量制御手段と、
    記第1の割当符号量を、前記第2の割当符号量でリミッタをかけた値を目標割当符号量とするとともに、この目標割当符号量と各マクロブロックの発生符号量とから、既知の方法により、各マクロブロックの量子化スケールを決定する手段と、
    を備えたことを特徴とする動画像符号化装置。
  2. 請求項1に記載された動画像符号化装置において、
    前記第1の符号量制御手段は、
    前記第1の割当符号量を、ピクチャタイプ(Iピクチャ、Pピクチャ、Bピクチャ)別に算出し、
    前記第2の符号量制御手段は、
    前記第2の割当符号量を、ピクチャタイプ(Iピクチャ、Pピクチャ、Bピクチャ)別に算出することを特徴とする動画像符号化装置。
  3. 入力動画像を、動き補償予測ステップ、直交変換ステップ、量子化ステップ、及び可変長符号化ステップによって符号化を行う動画像符号化方法において、
    前記入力動画像を構成する各画像の符号化時において、前記各画像毎の発生符号量を検出するステップと、
    前記入力動画像を構成する各画像の符号化時において、前記各画像毎の平均量子化スケールを検出するステップと、
    前記入力動画像を構成する各画像の符号化時において、前記各画像毎のアクティビティを検出するステップと、
    前記各画像毎の発生符号量と前記各画像毎の平均量子化スケールとの積に対して所定の変換を施すことによって、前記各画像毎の画面複雑度を算出するとともに、予め設定される第1の所定期間毎に、前記各画像毎の画面複雑度を加算平均して平均画面複雑度を算出するステップと、
    前記入力動画像を構成する各画像のうち、これから符号化を行なう画像である符号化対象画像の前記アクティビティを、前記符号化対象画像の直前に符号化された画像の前記アクティビティで除した値に、前記符号化対象画像の直前に符号化された画像の画面複雑度を乗じることで、前記符号化対象画像の画面複雑度を算出するステップと、
    符号化単位である第2の所定期間毎に予め決定される平均割当符号量に、前記符号化対象画像の画面複雑度を前記平均画面複雑度で除した値を乗ずることで、前記第2の所定期間毎の割当符号量を算出するとともに、この算出した割当符号量から、既知の方法により、前記符号化対象画像の第1の割当符号量を算出する第1の符号量制御ステップと、
    前記第2の所定期間毎に、前記符号化対象画像の画面複雑度を因数とする所定の関数によって算出される最大割当符号量から、既知の方法により、前記符号化対象画像の第2の割当符号量を算出する第2の符号量制御ステップと、
    記第1の割当符号量を、前記第2の割当符号量でリミッタをかけた値を目標割当符号量とするとともに、この目標割当符号量と各マクロブロックの発生符号量とから、既知の方法により、各マクロブロックの量子化スケールを決定するステップとを備えたことを特徴とする動画像符号化方法。
  4. 請求項3に記載された動画像符号化方法において、
    前記第1の符号量制御ステップは、
    前記第1の割当符号量を、ピクチャタイプ(Iピクチャ、Pピクチャ、Bピクチャ)別に算出し、
    前記第2の符号量制御ステップは、
    前記第2の割当符号量を、ピクチャタイプ(Iピクチャ、Pピクチャ、Bピクチャ)別に算出することを特徴とする動画像符号化方法。
JP19867299A 1999-07-13 1999-07-13 動画像符号化装置及びその方法 Expired - Lifetime JP4362795B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19867299A JP4362795B2 (ja) 1999-07-13 1999-07-13 動画像符号化装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19867299A JP4362795B2 (ja) 1999-07-13 1999-07-13 動画像符号化装置及びその方法

Publications (2)

Publication Number Publication Date
JP2001028753A JP2001028753A (ja) 2001-01-30
JP4362795B2 true JP4362795B2 (ja) 2009-11-11

Family

ID=16395137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19867299A Expired - Lifetime JP4362795B2 (ja) 1999-07-13 1999-07-13 動画像符号化装置及びその方法

Country Status (1)

Country Link
JP (1) JP4362795B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003023637A (ja) * 2001-07-06 2003-01-24 Sony Corp 画像符号化方法および画像符号化装置
AU2003283028A1 (en) 2002-11-15 2004-06-15 Thomson Licensing S.A. Method and system for staggered statistical multiplexing
WO2005076632A2 (en) 2004-01-30 2005-08-18 Thomson Licensing Encoder with adaptive rate control for h.264
US8116577B2 (en) 2005-03-07 2012-02-14 Sony Corporation Encoding method, encoding device, encoding process program, and recording medium on which encoding process program is recorded
JP4543971B2 (ja) * 2005-03-07 2010-09-15 ソニー株式会社 符号化方法、符号化装置、符号化処理のプログラム及び符号化処理のプログラムを記録した記録媒体
JP4517963B2 (ja) * 2005-07-15 2010-08-04 ソニー株式会社 符号化装置、符号化方法、プログラムおよび記録媒体
JP4648805B2 (ja) * 2005-09-09 2011-03-09 パナソニック株式会社 動画像圧縮装置
JP4794987B2 (ja) * 2005-11-09 2011-10-19 キヤノン株式会社 映像信号処理装置
EP2003892A4 (en) 2006-03-30 2010-10-06 Fujitsu Ltd METHOD AND APPARATUS FOR TRANSFERRING DATA
JP4527756B2 (ja) * 2007-08-27 2010-08-18 日本電信電話株式会社 映像符号化制御装置、映像符号化制御方法、映像符号化制御プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
CN102893605B (zh) * 2010-05-12 2015-07-08 日本电信电话株式会社 码量控制方法及装置
EP2648409B1 (en) * 2011-03-10 2016-08-17 Nippon Telegraph And Telephone Corporation Quantization control device and method, and quantization control program

Also Published As

Publication number Publication date
JP2001028753A (ja) 2001-01-30

Similar Documents

Publication Publication Date Title
US6141380A (en) Frame-level rate control for video compression
JP3954656B2 (ja) 画像符号化装置及び方法
KR100471956B1 (ko) 화상압축부호화장치및방법
US7903732B2 (en) Method and apparatus for encoding a moving-picture signal by calculating the complexity of the moving-picture signal
JPH07184196A (ja) 画像符号化装置
MXPA05002511A (es) Un metodo y un aparato para controlar la velocidad de una secuencia de video; un dispositivo que codifica un video.
JPH10336663A (ja) Mpeg2符号化用の前処理装置
JP3259702B2 (ja) 動画像可変ビットレート符号化装置および方法
JP4362795B2 (ja) 動画像符号化装置及びその方法
JP2001008215A (ja) 動画像符号化装置及びその方法
JP3508916B2 (ja) 動画像可変ビットレート符号化方法および装置
JPH10164577A (ja) 動画像符号化装置
KR100588795B1 (ko) 부호화 장치 및 부호화 방법
JP4362794B2 (ja) 動画像符号化装置及びその方法
JP3173369B2 (ja) 画像圧縮符号化装置
JP3812267B2 (ja) 動画像符号化装置及びその方法
JP4362793B2 (ja) 動画像符号化装置及びその方法
JP3812269B2 (ja) 動画像符号化装置及びその方法
JP3858520B2 (ja) 動画像符号化装置及びその方法
JP2007116655A (ja) 動画像符号化装置
KR0123243B1 (ko) 장면 전환시의 비트율 제어 방법
KR100949755B1 (ko) 비디오 시퀀스의 레이트를 제어하는 방법 및 장치, 비디오부호화 장치
JP4035747B2 (ja) 符号化装置および符号化方法
JP2004165894A (ja) 符号化器のビットレート制御方法
JP2008078978A (ja) 動画像符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060331

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080226

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090428

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090724

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090806

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4362795

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130828

Year of fee payment: 4

EXPY Cancellation because of completion of term