JP4179917B2 - 動画像符号化装置及び方法 - Google Patents

動画像符号化装置及び方法 Download PDF

Info

Publication number
JP4179917B2
JP4179917B2 JP2003117293A JP2003117293A JP4179917B2 JP 4179917 B2 JP4179917 B2 JP 4179917B2 JP 2003117293 A JP2003117293 A JP 2003117293A JP 2003117293 A JP2003117293 A JP 2003117293A JP 4179917 B2 JP4179917 B2 JP 4179917B2
Authority
JP
Japan
Prior art keywords
code amount
value
encoding
buffer
bit rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003117293A
Other languages
English (en)
Other versions
JP2004328150A (ja
Inventor
淳 松村
知也 児玉
昇 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003117293A priority Critical patent/JP4179917B2/ja
Priority to US10/821,864 priority patent/US20040213346A1/en
Publication of JP2004328150A publication Critical patent/JP2004328150A/ja
Application granted granted Critical
Publication of JP4179917B2 publication Critical patent/JP4179917B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

【0001】
【発明の属する技術分野】
本発明は、リアルタイムにビットレートを変動しながら動画像を符号化する装置及び方法に関する。
【0002】
【従来の技術】
動画像を可変ビットレートで符号化する方式には、例えばMPEG−1(Moving Picture Expert Group phase−1)、MPEG−2、MPEG−4がある。MPEG(MPEG−1、MPEG−2、MPEG−4)では、エントロピー符号化を用いているので、入力動画像の解像度や動きの激しさ等に応じて、一定の画質を得るために必要な符号量が変化する。可変ビットレートの符号化を採用し、動画像の性質に合わせてビットレートを変動させることで、固定ビットレートの符号化に比べて符号量を少なくすることができる。
【0003】
従来、可変ビットレートで符号化する手法として、事前に符号化対象となる動画像の特性を調査し、特性に基づいて可変ビットレートで符号化を行う2パス可変ビットレート符号化方式やマルチパス可変ビットレート符号化方式がある(例えば、特許文献1)。
【0004】
2パス可変ビットレート符号化方式やマルチパス可変ビットレート符号化方式では、まず1パス目で符号化難易度、発生符号量、フレームスキップ等の様々な符号化情報を検出する。検出した符号化情報を用いて各シーンに応じた割り当て符号量を算出する。それから、算出した割り当て符号量に基づいて符号化処理を行う。
【0005】
特許文献1では、1パス目では固定ビットレートで各フレームを符号化して発生符号量を含む統計量を求め、2パス目では得られた統計量に従って各フレームに対して符号量の割り当て及び量子化スケールを決定し、さらには各フレームのフレームスキップの有無も考慮して実際の符号化を行っている。
【0006】
これらの符号化方式では、実際の符号化の前に1パス目の前処理が必要となるのでリアルタイムな符号化は行えない。
【0007】
これに対して1パス可変ビットレート符号化方式では、直前の符号化結果に基づいて次に符号化するシーンに割り当てる符号量を求めて1パスで符号化処理を行う(例えば、特許文献2)。
【0008】
1パス可変ビットレート符号化方式ならばリアルタイムに符号化を行えるが、予測の困難さから2パス可変ビットレート符号化方式に比べると画質が劣りやすく、しかも、符号量を効率良く割り当てることが難しい。
【0009】
例えば、特許文献2では符号化の困難さが特定の範囲内の場合は目標ビットレートより例えば10%低いビットレートで固定レート符号化を行い、その分生まれた符号量の余裕分を符号化が困難な場面に割り当てるようにしている。
【0010】
【特許文献1】
特開2003−18603公報
【特許文献2】
特開2001−69463公報
【0011】
【発明が解決しようとする課題】
しかし、符号化の困難さが特定の範囲にあるシーンとはいえ、一律に目標ビットレートより低い固定ビットレートで符号化したのでは、各シーンに対して適切な符号量を割り当てることはできない。符号化が楽なシーンでは画質が不必要に良くなり、符号化が困難なシーンでは画質が悪くなるという問題がある。
【0012】
本発明は上記の問題点に着目してなされたものである。符号化が楽なシーンに割り当てる符号量を減らし、その分の符号量を符号化が困難なシーンに割り当てることにより、符号化が楽なシーンの画質を必要十分なレベルで確保するとともに、符号化が困難なシーンの画質を向上させ、動画像全体の画質を安定させた1パス可変ビットレート方式の動画像符号化装置及び方法を提供することを目的とする。
【0013】
【課題を解決するための手段】
上記課題を解決するために本発明の動画像符号化装置は、動画像の各フレームを圧縮符号化する符号化部と、前記符号化部で生成された符号が、仮想的な復号化装置の入力バッファに第1のビットレートで供給されるとしたら当該バッファが保持するであろうと予測される第1の符号量を求める第1の検証部と、前記符号化部で生成された符号が、仮想的な復号化装置の入力バッファに前記第1のビットレートより低い第2のビットレートで供給されるとしたら当該バッファが保持するであろうと予測される第2の符号量及び前記第2の符号量の変化率を求める第2の検証部と、前記第1の符号量が予め定めた条件を満たす場合に、前記符号化部が1枚のフレームの全体若しく一部分を「符号化不要」として符号化するように、前記符号化部を制御する第1の制御部と、前記第1の符号量、前記第2の符号量及び前記変化率に基づき、前記符号化部の符号化ビットレートを変える第2の制御部とを備える。
【0014】
本発明の動画像符号化方法は、動画像の各フレームを圧縮符号化し、生成された符号が、仮想的な復号化装置の入力バッファに第1のビットレートで供給されるとしたら当該入力バッファが保持するであろうと予測される第1の符号量を検証し、生成された符号が、仮想的な復号化装置の入力バッファに前記第1のビットレートより低い第2のビットレートで供給されるとしたら当該入力バッファが保持するであろうと予測される第2の符号量及び前記第2の符号量の変化率を検証し、前記第1の符号量が予め定めた条件を満たした場合に、前記圧縮符号化において、1枚のフレームの全体若しく一部分が「符号化不要」として符号化されるように制御し、前記第1の符号量、前記第2の符号量及び変化率に基づき、前記圧縮符号化における符号化ビットレートを制御する。
【0015】
【発明の実施の形態】
以下、図面を参照して本発明の一実施形態の動画像符号化装置について説明する。
【0016】
(概要)本実施形態の動画像符号化装置は、動画像をMPEG−4方式で1パス可変ビットレート符号化するものである。
【0017】
特にDVD(Digital Versatile Disc)に代表される可変ビットレートのデータ読み出しが可能な蓄積メディアに記録する動画像データを生成するのに好適な装置である。
【0018】
(構成)図1は本実施形態の動画像符号化装置の概略構成を説明する図である。
【0019】
本装置は、外部から入力された動画像信号からMPEG−4方式の符号を可変ビットレートで生成する符号化部101と、符号化部101で生成された符号の量に基づいて仮想的な復号化装置の入力バッファ(仮想入力バッファ)の符号量を求めるVBV102と、符号化部101で生成された符号の量に基づいて仮想的な復号化装置の入力バッファ(仮想入力バッファ)の符号量及び符号量の変化率を求める仮想VBV103を備える。
【0020】
さらに、VBV102及び仮想VBV103でそれぞれ求めた符号量と仮想VBV103で求めた符号量の変化率とに基づいて符号化部101における量子化スケールQpの値の上限値と下限値を設定する量子化スケール値域制御部104と、符号化部101の符号化ビットレートを制御するレート制御部105と、フレームスキップの制御を行うスキップ制御部106とを備える。
【0021】
尚、上述した量子化スケールQpの上限値及び下限値は、量子化スケールの最大値及び最小値(例えばMPEG−4ならば最大値が31で最小値が1)の範囲内で設定する。
【0022】
(動作)図1に基づいて、本実施形態の動画像符号化装置の動作の概略を説明する。尚、説明を簡単にするため、双方向予測符号化を用いない場合を例に説明する。
【0023】
まず、動画像がフレーム毎に入力される。MPEG−4の場合、各フレームはGOPと呼ばれるフレームの束に所属することになる。そこで、J番目のGOPにおけるK番目のフレームを「GOP(J)::Fr(K)」と表す。
【0024】
フレームGOP(J)::Fr(K)が入力されると、符号化部101で符号化され、符号GOP(J)::Fr(K)が出力される。
【0025】
VBV102及び仮想VBV103は、符号GOP(J)::Fr(K)の符号量をカウントし、各々の仮想入力バッファの符号量を変化させる。
【0026】
スキップ制御部106は、VBV102の仮想入力バッファを監視し、アンダーフローする可能性が高い場合は、フレームGOP(J)::Fr(K)の次のフレームGOP(J)::Fr(K+1)の符号化をスキップするように符号化部101を制御する。
【0027】
量子化スケール値域制御部104は、VBV102の仮想入力バッファの符号量と、仮想VBV103の仮想入力バッファの符号量及び変化率に基づいて、量子化スケールの値域を決定する。
【0028】
レート制御部105は、量子化スケール値域制御部104で決定された量子化スケールの値域と、仮想VBV103の仮想入力バッファの符号量及び変化率に基づいて、フレームGOP(J)::Fr(K)が属するGOP(J)の次のGOPであるGOP(J+1)における符号化ビットレートを決定し、符号化部101を制御する。
【0029】
符号化部101は、レート制御部105で決定された符号化ビットレートに従ってGOP(J+1)の符号化を行う。
【0030】
(符号化部101)符号化部101は、動画像をMPEG−4方式でフレーム単位で符号化する。符号化部101の構成を図2を用いて説明する。
【0031】
符号化部101は、入力された動画像を順次記憶するフレームメモリ201と、動き検出に用いる参照フレームを記憶するフレームメモリ202と、動きベクトルを求める動き検出器203と、動き補償を行う動き補償器204と、動き補償後のフレームと符号化対象フレームとの差分を求める減算器217とを備える。
【0032】
さらに、離散コサイン変換(DCT)を行う離散コサイン変換器207と、量子化を行う量子化器208と、逆量子化を行う逆量子化器206と、逆離散コサイン変換(IDCT)を行う逆離散コサイン変換器205と、動き補償後のフレームと逆離散コサイン変換によって得られるフレームとの加算を行う加算器216と、動きベクトル用可変長符号化器209と、DCT係数用可変長符号化器210と、ビットストリーム多重化器211とを備える。
【0033】
動き検出器203は、外部からフレームスキップ制御を受けた場合にはフレームスキップを行い、そのフレームについては符号化を行わないようにする。
【0034】
量子化器208は、外部から与えられる量子化スケール(Qp)という量子化の粗さを表すパラメータを用いて量子化を行う。MPEG−4の場合は量子化スケールQpの最小値が1で最大値が31である。
【0035】
量子化スケールQpは、値が大きくなるほど量子化が粗くなり画質が低下するが、符号化処理で生成される符号量は減少する。一方、量子化スケールQpの値が小さくなるほど量子化が細かくなり画質が向上するが、符号化処理で生成される符号量は増加する。
【0036】
(VBV102)VBV102は、符号化部101で生成された符号を、仮想的な復号化装置に最高のビットレート(ピークビットレート)で入力した場合に、仮想的な復号化装置が備える入力バッファ(仮想入力バッファ)が保持するであろうと予測される符号量を求める。
【0037】
一般的な復号化装置では、あるビットレートで供給された符号は一旦入力バッファに蓄積される。一定時間(例えば1/30秒)ごとに入力バッファに蓄積された符号を使用して復号化処理が行われる。
【0038】
入力バッファが保持する符号量は次のように変化する。
(W)ビットレートの高さに応じて「一定時間」増加する。
(X)「一定時間」ごとに復号化処理で使用された量だけ減少する。
(Y)以後、(W)(X)を繰り返す。
【0039】
VBV102は、実際に復号化処理を行うものではない(勿論、復号化処理を実際に行っても構わないが実用的ではないだろう)し、実際にバッファリングを行うものでもない(勿論、実際にバッファリングを行っても構わないが実用的ではないだろう)。VBV102は、仮想的な復号化装置の入力バッファが保持するであろう符号量の時間推移を求めるものである。
【0040】
本実施形態のVBV102の構成を図7(A)を用いて説明する。VBV102は、仮想入力バッファが保持するであろう符号量を記憶するカウンタ702と、カウンタ702の値を増減させる制御部701とを備える。
【0041】
VBV102の仮想入力バッファの符号量は次のように変化する。
(1)ピークビットレートに相当する速さで「一定時間」増加する
(2)「一定時間」ごとに復号化処理で使用されると想定される量だけ減少する。
(3)以後、(1)(2)を繰り返す。
【0042】
上述(2)の「復号化処理で使用されると想定される量」は、符号化部101で各フレーム毎に生成された符号の量を用いる。
【0043】
VBV102の仮想入力バッファがオーバーフローしそうな場合は、符号量の増加を仮想入力バッファの最大容量を限度に頭打ちにさせて(図3(A))回避する。これは、実際のバッファで言うと、符号の入力を停止させることに相当し、一般的なフロー制御で行える。尚、アンダーフローについては後述するスキップ制御部106等で回避する。
【0044】
(スキップ制御部106)スキップ制御部106はVBV102の仮想入力バッファを監視し、アンダーフローするのを回避する。
【0045】
VBV102の仮想入力バッファはアンダーフローもオーバーフローも許容しない。オーバーフローについては前述したようにVBV102において一般的なフロー制御により回避する。
【0046】
図3(A)はアンダーフローしそうになった場合のスキップ制御部106の挙動を説明する図である。スキップ制御部106は、VBV102の仮想入力バッファがアンダーフローする可能性が高い場合に、符号化部101(特に動き検出器203)を制御してフレームスキップを発生させる。フレームスキップにより符号化部101で生成される符号量を減少すると、復号化で使用される符号量も減るので、VBV102で扱う仮想入力バッファが保持する符号量は増加しやすくなる。
【0047】
尚、アンダーフローする可能性が高い場合とは、例えば、保持する符号量がある閾値以下になった場合や、あるフレームを復号化するのに必要な符号量を保持できていない場合が考えられる。
【0048】
(仮想VBV103)仮想VBV103は、仮想的な復号化装置に、符号化部101で生成された符号を目標ビットレートで入力した場合に、仮想的な復号化装置が備える入力バッファ(仮想入力バッファ)が保持するであろうと予測される符号量及び符号量の変化率を求める。
【0049】
目標ビットレートとは、符号化部101で動画像を符号化する際の平均ビットレートの目標値である。目標値は、例えば、本実施形態の動画像符号化装置の利用者が指定する。
【0050】
仮想VBV103はビットレートを除いてVBV102と同様にして時間推移を求める。仮想VBV103もまた、実際に復号化処理を行うものではないし、実際にバッファリングを行うものでもない。仮想VBV103は、仮想入力バッファが保持する符号量の時間推移を求めるものである。
【0051】
本実施形態の仮想VBV103の構成を図7(B)を用いて説明する。仮想VBV103は、仮想入力バッファが保持するである符号量を記憶するカウンタ712と、ある決まったタイミングでの符号量を過去一定時間分記憶する履歴記憶部713と、カウンタ712の値を増減させるとともに符号量の変化率を求める制御部711と、求めた変化率を記憶する変化率記憶部714とを備えるものとして実現する。
【0052】
仮想VBV103の仮想入力バッファの符号量の変化は次のようになる。
(1)目標ビットレートに相当する速さで「一定時間」増加する
(2)「一定時間」ごとに復号化処理で使用されると想定される量だけ減少する。
(3)以後、(1)(2)を繰り返す。
【0053】
上述(2)の「復号化処理で使用されると想定される量」は、符号化部101で各フレーム毎に生成された符号の量を用いる。
【0054】
仮想VBV103は、履歴記憶部713が記憶する過去一定時間内の符号量を用いて符号量の変化率を求める。本実施形態では、履歴記憶部713は、上述(2)の減少後のタイミングにおける符号量を過去1秒間分記憶しておく。
【0055】
尚、VBV102の仮想入力バッファと異なり、仮想VBV103の仮想入力バッファはオーバーフローとアンダーフローとをある一定の範囲で許容する。図3(B)は仮想VBV103がアンダーフローになった状態を説明する図である。また図4(B)は仮想VBV103がオーバーフローになった状態を説明する図である。
【0056】
(量子化スケール値域制御部104)量子化スケール値域制御部104は、レート制御部105で量子化スケールQpの値を変化させることのできる範囲(上限値、下限値)を決定する。
【0057】
量子化スケール値域制御部104は、量子化スケールQpの上限値(上限Qp)及び下限値(下限Qp)を、仮想VBV103の仮想入力バッファの符号量及び符号量の変化率(増加率、減少率)とVBV102の仮想入力バッファの符号量とに基づいて決定する。
【0058】
量子化スケールの上限値及び下限値の制御を、図6を用いて説明する。
【0059】
VBV102はアンダーフローさせてはならない。従って、VBV102の仮想入力バッファの符号量を調べ(S601)、符号量が閾値1(予め定めておいたアンダーフローの警戒水準)以下になった場合は上限Qpの値を大きくする(S608)。
【0060】
次に、仮想VBV103の仮想入力バッファの符号量及び変化率から、次式を用いて評価値を求める(S602)。次式では、評価値をS、符号量をC、変化率をV、仮想VBV103の仮想入力バッファの最大容量をCmax(すなわち、符号量がこの値より大きくなるとオーバーフロー状態となる)、重み付けの係数α・βとする。
【0061】
【数1】
Figure 0004179917
【0062】
求めた評価値Sを閾値と比較し(S603、S604)、比較した結果に応じて上限Qp及び下限Qpを修正する。
【0063】
(1)評価値Sが閾値2より小さい場合は、仮想VBV103の仮想入力バッファがアンダーフロー中か、若しくは、符号化が困難なシーンで仮想VBV103の仮想入力バッファの符号量が急激に減少中であると考えられる。この場合は、(閾値2−評価値)の値が大きくなるほど上限Qpが大きくなるように上限Qpを修正する(S605)。ただし、上限Qpは量子化スケールQpの最大値以下の範囲で修正される。
【0064】
(2)評価値Sが閾値3(ただし、閾値3は閾値2以上とする)より大きい場合は、仮想VBV103の仮想入力バッファがオーバーフロー中か、若しくは、符号化が楽なシーンで仮想VBV103の仮想入力バッファの符号量が急激に増加中であると考えられる。この場合は、(評価値−閾値3)の値が大きくなるほど下限Qpが小さくなるように、下限Qpを修正する(S606)。ただし、下限Qpは量子化スケールQpの最小値以上の範囲で修正される。
【0065】
(3)上記(1)(2)いずれにも該当しない場合、すなわち評価値Sが閾値2以上で閾値3以下の場合は、上限Qp及び下限Qpは修正しない(S607)。
【0066】
上述した制御では、多少のオーバーフローやアンダーフローでは量子化スケールQpの値域を大幅に変化させない。また、仮想VBV103の仮想バッファが保持する符号量の変化率も考慮している。
【0067】
これにより、仮想VBV103がアンダーフロー中に符号化が楽なシーンが発生した場合でも、必要以上に量子化スケールQpを高く保つことがなくなるので画質が安定する。また、仮想VBV103がオーバーフロー中に符号化が厳しいシーンが発生した場合でも、必要以上に量子化スケールQpを低く保つことがなくなるので画質が安定する。
【0068】
(レート制御部105)レート制御部105は、量子化スケールQpの値を変化させて符号化のビットレートを制御する。
【0069】
レート制御部105は、仮想VBV103の仮想入力バッファの符号量と符号量の変化率とを用いて、GOP単位の目標符号量を求める。
【0070】
GOP単位の目標符号量は次のようにして定める。
(1)目標ビットレートで固定して符号化を行うと仮定して、GOP1つ当たりの符号量(基準符号量)を計算する。最初のGOPについてはここで求めた基準符号量が目標符号量となる。
(2)目標符号量から、実際に発生した符号量を減算して差分を求める。
(3)次のGOPの目標符号量を、基準符号量に差分を加えた値に設定する。
(4)以下、(2)と(3)とを繰り返して、各GOPの目標符号量を定める。
【0071】
求めたGOP単位の目標符号量に応じた適切な量子化スケールQpの値を、量子化スケール値域制御部104で決定された上限Qpと下限Qpの範囲内で決定する。
【0072】
目標符号量が多い時は量子化スケールQpの値を小さくして符号化部101で生成される符号量を増加させ、逆に目標符号量が少ない時は量子化スケールQpの値を大きくして符号化部101で生成される符号量を減少させる。
【0073】
(本実施形態の効果)以上、本実施形態の動画像符号化装置ならば、可変ビットレートで符号化を行っているので、符号化が楽なシーンを少ない符号で符号化し、その分符号化が厳しいシーンに多くの符号を割り当てることが可能となる。
【0074】
また、目標ビットレートとピークビットレートとの2種類で復号化装置側の入力バッファのシミュレーションを行い、その結果に基づいて符号化のレート制御を行っている。これにより、符号量割り当ての自由度が高くできるので、画質を安定させることが可能となる。
【0075】
目標ビットレートとピークビットレートの差が大きいほど画質を安定させやすくなる。例えば、DVDに代表される高速データ読み出しが可能な記憶媒体向けの符号化データを、本実施形態の動画像符号化装置で生成すれば、絶大な画質安定効果を得られる。
【0076】
(変形例)尚、本実施形態ではMPEG−4を例に説明したが、例えばMPEG−1、MPEG−2、H.264等の動画像符号化方式に応用することも可能である。
【0077】
MPEG−1、MPEG−2の場合、スキップ制御部106は符号化しているフレームのマクロブロックの符号化スキップを制御することになる。
【0078】
また、本実施形態では仮想VBV103のアンダーフロー及びオーバーフローに関する制限は特に設けなかったが、制限を設けても良い。
【0079】
制限の一例として、アンダーフローに対して下限を設けることが考えられる。そして、仮想VBVの符号量が下限を下回った場合は、例えば上限Qpを最大値に制御して、仮想VBV103の仮想入力バッファの符号量を回復させると良い。
【0080】
また、制限の別の例として、オーバーフローに対して上限を設けても良い。仮想VBVの符号量が上限を超えた場合は、例えば下限Qpを引き下げて符号化部101で生成される符号の量を増加させて画質を良くすると良い。
【0081】
【発明の効果】
本発明によれば、安定した画質で動画像を符号化することが可能となる。
【図面の簡単な説明】
【図1】 第1の実施形態の動画像符号化装置の概略構成を説明する図。
【図2】 第1の実施形態の動画像符号化装置の構成を説明する図。
【図3】 (A)アンダーフローを起こしそうな場面でのVBVの挙動。(B)アンダーフローを起こした場面での仮想VBVの挙動。
【図4】 (A)オーバーフローを起こしそうな場面でのVBVの挙動。(B)オーバーフローを起こした場面での仮想VBVの挙動。
【図5】 (A)仮想VBVがアンダーフロー中に急速に符号量が増えた場合の図。(B)仮想VBVがオーバーフロー中に急速に符号量が減った場合の図。
【図6】 量子化スケールの制御を説明するフローチャート。
【図7】 (A)VBV102の構成を説明する図。(B)仮想VBV103の構成を説明する図。
【符号の説明】
101 符号化部
102 VBV
103 仮想VBV
104 量子化スケール値域制御部
105 レート制御部
106 スキップ制御部
201、202 フレームメモリ
203 動き検出器
204 動き補償器
205 逆離散コサイン変換器
206 逆量子化器
207 離散コサイン変換器
208 量子化器
209 動きベクトル用可変長符号化器
210 DCT係数用可変長符号化器
211 ビットストリーム多重化器

Claims (10)

  1. 動画像の各フレームを量子化を伴う圧縮符号化により圧縮符号化する符号化部と、
    仮想的な復号化装置の入力バッファである第1のバッファに前記符号化部で生成された符号を第1のビットレートで供給した場合の、前記第1のバッファが保持する符号量の予測値である第1の符号量を求める第1の検証部と、
    仮想的な復号化装置の入力バッファである第2のバッファに前記符号化部で生成された符号を前記第1のビットレートより低い第2のビットレートで供給した場合の、前記第2のバッファが保持する符号量の予測値である第2の符号量及び前記第2の符号量の変化率を求める第2の検証部と、
    前記第1の符号量が前記第1のバッファのアンダーフローを回避すべき条件を満たす場合に、1枚のフレームの全体若しく一部分の符号化をスキップするように前記符号化部を制御するスキップ制御部と、
    前記第2の符号量及び前記変化率に基づき、1または複数のフレームに割り当てる符号量を算出する割り当て符号量算出部と、
    前記第1の符号量、前記第2の符号量及び前記変化率に基づいて、量子化の粗さを決めるパラメータである量子化スケールの、上限値及び下限値を決定する決定部と、
    前記割り当て符号量に基づいて、前記符号化部が量子化に用いる量子化スケールの値を、前記量子化スケールの上限値から下限値までの範囲で変更制御する変更制御部と、
    を備え、
    前記決定部は、
    (A)前記第1の符号量が第1の閾値以下の場合には前記上限値を引き上げる手段と、
    (B)前記第2の符号量と前記変化率とを用いて、前記第2の符号量の推移の傾向を示し、前記第2の符号量が多いほど大きい値になり、また、前記第2の符号量の増加率が高いほど大きい値になる評価値を求める手段と、
    (C)前記第2のバッファがアンダーフローの状態、または、前記第2のバッファの符号量が急激に減少している状態を検出するための第2の閾値よりも前記評価値が小さい場合には、前記評価値の前記第2の閾値からの乖離が大きくなるほど前記上限値が大きくなるように前記上限値を修正する手段と、
    (D)前記第2のバッファがオーバーフローの状態、または、前記第2のバッファの符号量が急激に増加している状態を検出するための第3の閾値であって、前記第2の閾値以上である前記第3の閾値より前記評価値が大きい場合に、前記評価値の前記第3の閾値からの乖離が大きくなるほど前記下限値が小さくなるように前記下限値を修正する手段と、
    を備える動画像符号化装置。
  2. 前記変更制御部は、前記第2の符号量が、前記第2の符号量に関する下限値以上で変動するように前記量子化スケールの値を変える、請求項1に記載の動画像符号化装置。
  3. 前記変更制御部は、前記第2の符号量に関する前記下限値を変える手段を備える、請求項2に記載の動画像符号化装置。
  4. 前記第1の検証部は、前記第1のビットレートとして、前記仮想的な符号化装置の入力ビットレートの最高値を用いる、
    請求項1から請求項3までのいずれか1項に記載の動画像符号化装置。
  5. 前記第2の検証部は、前記第2のビットレートとして、前記符号化部で生成される符号の平均ビットレートの目標値を用いる、請求項1から請求項4までのいずれか1項に記載の動画像符号化装置。
  6. 動画像の各フレームを量子化を伴う圧縮符号化により圧縮符号化する符号化ステップと、
    仮想的な復号化装置の入力バッファである第1のバッファに前記圧縮符号化により生成された符号を第1のビットレートで供給した場合の、前記第1のバッファが保持する符号量の予測値である第1の符号量を検証する第1の検証ステップと、
    仮想的な復号化装置の入力バッファである第2のバッファに前記圧縮符号化により生成された符号を前記第1のビットレートより低い第2のビットレートで供給した場合の、前記第2のバッファが保持する符号量の予測値である第2の符号量及び前記第2の符号量の変化率を検証する第2の検証ステップと、
    前記第1の符号量が前記第1のバッファのアンダーフローを回避すべき条件を満たす場合に、1枚のフレームの全体若しく一部分の圧縮符号化をスキップするように前記圧縮符号化を制御するスキップ制御ステップと、
    前記第2の符号量及び前記時間変化に基づいて、1または複数のフレームに割り当てる符号量を算出する符号量算出ステップと、
    前記第1の符号量、前記第2の符号量及び前記時間変化に基づいて、量子化の粗さを決めるパラメータである量子化スケールの上限値及び下限値を決定する決定ステップと、
    前記割り当て符号量に基づいて、前記量子化スケールの上限値から下限値までの範囲で前記圧縮符号化が量子化に用いる量子化スケールの値を変更する変更制御ステップと、
    を備え、
    前記決定ステップは、
    (A)前記第1の符号量が第1の閾値以下の場合には前記上限値を引き上げるステップと、
    (B)前記第2の符号量と前記変化率とを用いて、前記第2の符号量の推移の傾向を示し、前記第2の符号量が多いほど大きい値になり、また、前記第2の符号量の増加率が高いほど大きい値になる評価値を求めるステップと、
    (C)前記第2のバッファがアンダーフローの状態、または、前記第2のバッファの符号量が急激に減少している状態を検出するための第2の閾値よりも前記評価値が小さい場合には、前記評価値の前記第2の閾値からの乖離が大きくなるほど前記上限値が大きくなるように前記上限値を修正するステップと、
    (D)前記第2のバッファがオーバーフローの状態、または、前記第2のバッファの符号量が急激に増加している状態を検出するための第3の閾値であって、前記第2の閾値以上である前記第3の閾値より前記評価値が大きい場合に、前記評価値の前記第3の閾値からの乖離が大きくなるほど前記下限値が小さくなるように前記下限値を修正するステップと、
    を備える動画像符号化方法。
  7. 前記変更制御ステップでは、前記第2の符号量が、前記第2の符号量に関する下限値以上で変動するように量子化スケールの値を変える、請求項6に記載の動画像符号化方法。
  8. 前記変更制御ステップでは、前記第2の符号量に関する前記下限値を変える、請求項7に記載の動画像符号化方法。
  9. 前記第1の検証ステップでは、前記第1のビットレートとして、前記仮想的な符号化装置の入力ビットレートの最高値を用いる、請求項6から請求項8までのいずれか1項に記載の動画像符号化方法
  10. 前記第2の検証ステップでは、前記第2のビットレートとして、前記符号化ステップで生成される符号の平均ビットレートの目標値を用いる、請求項6から請求項9までのいずれか1項に記載の動画像符号化方法
JP2003117293A 2003-04-22 2003-04-22 動画像符号化装置及び方法 Expired - Fee Related JP4179917B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003117293A JP4179917B2 (ja) 2003-04-22 2003-04-22 動画像符号化装置及び方法
US10/821,864 US20040213346A1 (en) 2003-04-22 2004-04-12 Moving image coding apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003117293A JP4179917B2 (ja) 2003-04-22 2003-04-22 動画像符号化装置及び方法

Publications (2)

Publication Number Publication Date
JP2004328150A JP2004328150A (ja) 2004-11-18
JP4179917B2 true JP4179917B2 (ja) 2008-11-12

Family

ID=33296296

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003117293A Expired - Fee Related JP4179917B2 (ja) 2003-04-22 2003-04-22 動画像符号化装置及び方法

Country Status (2)

Country Link
US (1) US20040213346A1 (ja)
JP (1) JP4179917B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007166192A (ja) * 2005-12-13 2007-06-28 Toshiba Corp 情報処理装置、制御方法およびプログラム
WO2008084641A1 (ja) 2006-12-22 2008-07-17 Panasonic Corporation スピーカ用振動板と、スピーカ用フレームと、スピーカ用ダストキャップと、これらを用いたスピーカと装置と、スピーカ用部品の製造方法
JP4765927B2 (ja) * 2006-12-22 2011-09-07 パナソニック株式会社 スピーカ用ダストキャップおよびこれを用いたスピーカならびにこのスピーカを用いた電子機器および装置
US8050320B2 (en) * 2007-02-09 2011-11-01 Ericsson Television, Inc. Statistical adaptive video rate control
US8295344B2 (en) * 2007-10-22 2012-10-23 Broadcom Corporation Adaptive rate control for encoding of variable frame rate video sources
US9872066B2 (en) * 2007-12-18 2018-01-16 Ibiquity Digital Corporation Method for streaming through a data service over a radio link subsystem
CN102027745A (zh) * 2008-05-16 2011-04-20 夏普株式会社 视频记录装置
JP5879555B2 (ja) * 2010-05-10 2016-03-08 パナソニックIpマネジメント株式会社 動画像符号化装置
JP4924746B2 (ja) * 2010-08-13 2012-04-25 カシオ計算機株式会社 符号量制御装置、符号量制御方法、符号量制御プログラム、動画記録装置
JP2014179707A (ja) 2013-03-13 2014-09-25 Toshiba Corp 画像符号化装置、及びその方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5929916A (en) * 1995-12-26 1999-07-27 Legall; Didier J. Variable bit rate encoding
DE69738878D1 (de) * 1996-04-12 2008-09-11 Sony Corp Bildkodierung mit Pufferunterlaufvermeidung
EP1182888A3 (en) * 1996-04-25 2004-11-03 Matsushita Electric Industrial Co., Ltd. Video coding with bit rate dependent quantisation
GB2337392B (en) * 1997-12-08 2002-04-17 Sony Corp Coding device and method
DE69816875T2 (de) * 1998-05-30 2004-04-22 Stmicroelectronics Asia Pacific Pte Ltd. Sequenzadaptive bit-zuordnung zur codierung von bildern
US6470051B1 (en) * 1999-01-25 2002-10-22 International Business Machines Corporation MPEG video decoder with integrated scaling and display functions
US6330286B1 (en) * 1999-06-09 2001-12-11 Sarnoff Corporation Flow control, latency control, and bitrate conversions in a timing correction and frame synchronization apparatus
GB2353653B (en) * 1999-08-26 2003-12-31 Sony Uk Ltd Signal processor
JP2001148858A (ja) * 1999-11-18 2001-05-29 Sony Corp 画像情報変換装置及び画像情報変換方法
JP3889552B2 (ja) * 2000-06-09 2007-03-07 パイオニア株式会社 符号量割り当て装置および方法
US6763067B2 (en) * 2000-10-10 2004-07-13 Sarnoff Corporation Rate control for bitstream re-encoding
JP2002164790A (ja) * 2000-11-28 2002-06-07 Canon Inc 圧縮ストリーム復号化装置及び方法並びに記憶媒体
JP3866538B2 (ja) * 2001-06-29 2007-01-10 株式会社東芝 動画像符号化方法及び装置

Also Published As

Publication number Publication date
JP2004328150A (ja) 2004-11-18
US20040213346A1 (en) 2004-10-28

Similar Documents

Publication Publication Date Title
US7092441B1 (en) Moving pictures encoding with constant overall bit rate
JP4256574B2 (ja) 画像信号符号化方法および画像信号符号化装置
US6654417B1 (en) One-pass variable bit rate moving pictures encoding
US7688234B2 (en) Coding apparatus, coding method, program for executing the method, and recording medium storing the program
EP0892555A2 (en) Adaptive video coding method
EP1551186B1 (en) Video coding apparatus with resolution converter
EP1063851B1 (en) Apparatus and method of encoding moving picture signal
TW416218B (en) Method and apparatus for performing adaptive encoding rate control of a video information stream including 3:2 pull-down video information
US8948242B2 (en) Encoding device and method and multimedia apparatus including the encoding device
JP2002010259A (ja) 画像符号化装置及び画像符号化方法及び画像符号化プログラムを記録した記録媒体
JP2000102008A (ja) ビットレ―ト制御方法
US5717464A (en) Rate control for a video encoder
JP4179917B2 (ja) 動画像符号化装置及び方法
JP2004274236A (ja) 符号化装置および符号化方法、プログラム、並びに記録媒体
JP5618128B2 (ja) 符号化装置、符号化方法、およびプログラム
US8081679B2 (en) Image processing apparatus
JP3508916B2 (ja) 動画像可変ビットレート符号化方法および装置
US8792562B2 (en) Moving image encoding apparatus and method for controlling the same
JP2006352198A (ja) 画像符号化装置及び画像符号化プログラム
US8116577B2 (en) Encoding method, encoding device, encoding process program, and recording medium on which encoding process program is recorded
KR20070034869A (ko) 동영상 부호화기의 비트율 제어 장치 및 방법
JP4586340B2 (ja) 符号化装置、および、符号化方法、並びに、プログラム
JP2005045736A (ja) 画像信号符号化方法及び装置、符号化制御装置並びにプログラム
JP4254784B2 (ja) 動画像符号化装置、方法及びプログラム
US20110075731A1 (en) Transcoder

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040901

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050415

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060907

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070727

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080822

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080826

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110905

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110905

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120905

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees