JP4039634B2 - 動画像符号化方式 - Google Patents

動画像符号化方式 Download PDF

Info

Publication number
JP4039634B2
JP4039634B2 JP2004157526A JP2004157526A JP4039634B2 JP 4039634 B2 JP4039634 B2 JP 4039634B2 JP 2004157526 A JP2004157526 A JP 2004157526A JP 2004157526 A JP2004157526 A JP 2004157526A JP 4039634 B2 JP4039634 B2 JP 4039634B2
Authority
JP
Japan
Prior art keywords
coding
bits
code
path
truncation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004157526A
Other languages
English (en)
Other versions
JP2005341236A (ja
Inventor
整 内藤
淳 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2004157526A priority Critical patent/JP4039634B2/ja
Publication of JP2005341236A publication Critical patent/JP2005341236A/ja
Application granted granted Critical
Publication of JP4039634B2 publication Critical patent/JP4039634B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像符号化方式に関し、特に、フレーム内符号化処理、フィールド内符号化処理、フレーム内−フィールド内適応符号化処理のいずれかを行う動画像符号化方式において、コードブロック間のコーディングパス数の開きによる画質劣化を解消できる動画像符号化方式に関する。
図5は、静止画像を対象とした従来の画像符号化方式を示すブロック図である。画像S(x,y)はフレームメモリ1とコードタイプ決定部2に入力される。フレームメモリ1から読み出された画像S(x,y)は離散ウエーブレット変換部(DWT)3に入力される。コードタイプ決定部2は、処理効率を考慮してフレームとフィールドのいずれの処理単位で離散ウエーブレット変換するか、つまりフレーム内符号化処理を行うかフィールド内符号化処理を行うかフレーム内−フィールド内適応符号化処理を行うかを決定する。DWT3は、フレームメモリ1から入力された画像S(x,y)をコードタイプ決定部2で決定された処理単位で離散ウエーブレット変換してコードデータ(変換係数)を出力する。
DWT3から出力されたコードデータは量子化器4−1に入力される。量子化器4−1はポスト量子化器4−2とともにレート制御部4として機能し、入力されたコードデータのビット数を回線速度で決まる目標ビット数に合わせ込む。パケット化部5は目標ビット数に合わせ込まれたコードデータをパケット化して回線に送出する。
図6は、JPEG2000(静止画像符号化)の場合のポスト量子化器4−2での処理の概念を示す図である。量子化器4−1は目標ビット数より若干多目のビット数のコードデータを出力する。ポスト量子化器4−2は算術符号化器を有し、目標ビット数に合わせ込まれたビット数のコードデータを出力する。
図6に示すように、1つのコードブロックについて量子化器4−1から出力されるコードデータのビットプレーンLSB〜MSBをplane,plane,・・・,planeM−2,planeM−1とすると、ポスト量子化器4−2は、ビットプレーンplaneに対するコードデータP0,1,P0,2,P0,3、・・・、ビットプレーンplaneM−2に対するコードデータPM−2,1,PM−2,2,PM−2,3、ビットプレーンplaneM−1に対するコードデータPM−1,1,PM−12,2,PM−1,3を算出する。ここで、Pm,kは、各ビットプレーンでのコーディングパスk(k=1:Significance pass ,k=2:Refinement pass ,k=3:Cleanup pass)のコードデータを表す。
さらに、ポスト量子化器4−2は、コーディングパス単位(k=1,2,3)で3段階に、LSB側から順にビットプレーンを切り捨てることによりコードデータのビット数を目標ビット数に合わせ込む。ポスト量子化器4−2での切り捨ての規範としてはMSE(平均自乗誤差)最小化を用いるのが一般的である。
図7は、4つのコードブロックについて従来のレート制御によりコードデータを目標ビット数に合わせ込む概念を示す図である。図7では上側になるほど上位のビットプレーンを表し、各コードブロックにおいて網目部分より下位側のビットプレーンがコーディングパス単位で切り捨てられることを表している。
切り捨てに際しては、R−D(レート−歪)勾配最大化を規範とし、R−D勾配の値が小さいコードブロックのコーディングパスから、つまり、そのコードブロックのコーディングパスを切り捨てても歪み発生が少ないコードブロックのコーディングパスから順に切り捨てる。
これにより目標ビット数に合わせ込まれたコードデータは、MSEを最小化するものであるが、サブバンド内でコードブロックごとに符号化されたコーディングパス数に開きがある。このとき、実効的な量子化ステップサイズq_ step_ sizeは、下記(1)式で表される。なお、Δは量子化器4−1による量子化ファクタである。また、nLはポスト量子化器4−2で切り捨てられたビットプレーン数であり、コードブロックごとにまちまちな値になる。

q_ step_ size=Δ×2nL (1)

特開2003−153228号公報 特開2002−165098号公報 特開2001−112004号公報
上記の従来のレート制御は、静止画像に対しては良好な結果を与えるが、コードブロック間で切り捨てられたコーディングパス数に開きがあるため、これを動画像に適用すると空間的に意図しない画質変動(フリッカ)が生じ、主観的画質が劣化されるという課題がある。
本発明の目的は、フレーム内またはフィールド内適応符号化処理を行う動画像符号化方式において、コードブロック間のコーディングパス数の開きによる画質劣化を解消できる動画像符号化方式を提供することにある。
上記課題を解決するために、本発明は、入力される動画像を、フレーム内符号化、フィールド内符号化、フレーム内−フィールド内適応符号化のいずれかで離散ウエーブレット変換し、これにより得られるコードデータのビット数を、コードブロックごとにコーディングパスの切り捨てを下位のビットプレーンより順次行って符号化割り当てビット数の範囲内とする動画像符号化方式において、ードブロックごとにコーディングパスの切り捨てを行う際に、切り捨てられるコーディングパス数がコードブロック間で均等になるように制御する制御手段を備え、前記制御手段は、下位のビットプレーンよりコードブロック間で均等にコーディングパスを逐次切り捨てる際に符号化ビット数が割り当てビット数を初めて下回るコーディングパスの位置を探索し、該コーディングパスに対してはコードブロックごとに切り捨てを行って符号化ビット数が割り当てビット数内に収まるように制御する点に第1の特徴がある。
また、本発明は、前記制御手段が、コードブロックごとに切り捨てを行う際に、該当するコーディングパスのレート−歪みの勾配が小さいものから切り捨てる点に第の特徴がある。
また、本発明は、前記制御手段が、コードブロックごとに切り捨てを行う際に、該当するコーディングパスの切り捨てに伴い発生する歪み量が小さいものから切り捨てる点に第の特徴がある。
さらに、本発明は、前記制御手段が、1画面単位あるいは1画面を複数に分割したセグメント単位で制御を行う点に第の特徴がある。
本発明の第1の特徴によれば、切り捨てられるビットプレーン数がコードブロック間で均等になり、さらに、コーディングパス数単位で切り捨てが行われるので、動画像符号化の際に意図しない画質変動(フリッカ)が生じなく、主観的画質の劣化が防止されるとともに、高精度の符号量制御が可能になる。また、各コードブロックでコーディングパスを均等に切り捨てた結果、割り当てビット数までに多少の空きがある場合、下位のビットプレーンのコードデータをコードブロックごとに選択して割り当てビット数に合わせ込むので、さらに高精度の符号量制御が可能になる。
また、第および第の特徴によれば、画質の歪み少なくしてコードブロックごとの切り捨てを行うことができる。
さらに、第の特徴によれば、セグメント単位での処理とすることにより高画質化とともに低遅延の符号化が可能になる。
以下、図面を参照して本発明を説明する。図1は、本発明に係る動画像符号化方式を示すブロック図であり、バッファ6をレート制御部4とパケット化部5の間に備える点、レート制御手法において従来の方式と異なる。
DWT変換符号化におけるサブバンドは周波数成分を示し、サブバンドごとにピクチャレベルで量子化精度を変えるようにすれば主観画質の劣化を防ぎつつ、レート制御できるという点にかんがみ、本発明では、まず、量子化器4−1でサブバンドごとに異なる量子化ファクタで量子化してコードデータのビット数を目標ビット数を若干上回るように制御する。
サブバンドごとに異なるファクタをdqt[band]とし、各サブバンドに一律に適用される重み係数をcqとすると、量子化器4−1は下記(2)式で表される量子化ファクタdelta[band]で量子化する。重み係数cqの決定手法については後述する。

delta[band]=dqt[band]×cq (2)
次に、ポスト量子化器4−2において、ビットプレーンの下位、つまり比較的重要でないビットプレーンから順にコーディングパスを切り捨ててコードデータのビット数を目標ビット数へ合わせ込む。ここで切り捨てるコーディングパス数は全コードブロックで同一とする。なお、コーディングパスの切り捨ては、コードブロック間のコーディングパスが均等になるようにコーディングパス数単位で行うことにより、高精度に符号量を制御する。
以上のように、本発明に係る動画像符号化方式では、コードブロックごとにコーディングパスの切り捨てを行う際に、切り捨てられるコーディングパス数がコードブロック間で均等になるように制御し、さらに後述するようにして、符号化ビット数が目標ビット数内に収まるように制御する。これによりコードブロック間の量子化誤差が均等になり、主観画質の低下を防止でき、また、高精度に符号量を制御できる。
以下に、本発明を具体化した第1の実施形態について説明する。本発明は動画像を符号化の対象としており、動画像ではピクチャ1枚ごとに符号化ビット数が異なるので、回線に送出する符号化ビット数を一定にして低遅延のCBR(constant bit rate)符号化を実現するためにはバッファモデルの導入が必須であり、そのためにバッファ6を備えている。
図2は、本発明におけるレート制御の手順を示すフローチャートである。まず、CBR符号化を実現するために今回のフレームあるいはフィールドに何ビットを与えればいいかの目標符号化ビット数を算出する(S1)。次に、この目標符号化ビット数を若干上回るビット数が得られるように重み係数cqを算出(S2)する。次に、量子化器4−1でコードデータを量子化する(S3)。最後に、ポスト量子化によりコードデータのビット数をを目標符号化ビット数へ合わせ込む(S4)。以上のS1〜S4の処理が1ピクチャ分の処理に相当し、これを繰り返し実行する。
S1での目標符号化ビット数の算出は以下のようにしてできる。バッファモデル上で、当該ピクチャtの引き抜きが開始される際のバッファ占有量の理想値に対する差をDiff(t)とおくと、Diff(t)は下記(3)式で表される。なお、先頭のピクチャをt=0とする。
Figure 0004039634
ここで、Bはビットレート(bit_rate)/ピクチャレート(picture_rate)であり、例えばテレビの動画像を50Mbpsの回線に送出するものとすると834,167bitとなる。vは先頭ピクチャの引き抜きが開始される際のバッファ占有量であり、vは理想とするバッファ占有量である。
Diff(t)を後続のL枚のピクチャ符号化により吸収するという目標をおき、当該ピクチャtの符号化ビット数R(t)を下記(4)式で算出する。算出された符号化ビット数R(t)が当該ピクチャtの目標符号化ビット数となる。ここでLはレート制御のウインドウ長を意味し、例えばピクチャ枚数15に設定する。
Figure 0004039634
また、S2での重み係数cqの算出は以下のようにしてできる。まず、重み係数cqの初期値として従来と同様の固定値を与える。それ以後はピクチャに対して行ったレート制御の結果を基に、サブバンドごとの重み係数を一律にしたまま発生符号ビット数に応じて重み係数cqの更新を行う。
当該ピクチャtにおける切り捨てコーディングパス数npと該コーディングパス数npに対する総符号化ビット数r(t,np)の実測結果より、均等にどれだけコーディングパス数を切り捨てれば発生ビットがいくつになるかの統計が得られるので、それを基に最小二乗法を用いて、切り捨てられるコーディングパス数npに相当する量子化ステップサイズxと発生ビット数yの関係を表す関数fを下記(5)式で定義する。
Figure 0004039634
次に、次のピクチャ(t+1)を符号化する際に、上記(4)式で算出した符号化ビット数R(t+1)を達成するために重み係数cq(t+1)をいくつにすべきかを算出する。そのために、まず、上記(5)式で定義した関数fを用いて下記(6)式により目標量子化ステップサイズxを求め、続いて、重み係数cq(t)更新後の重み係数cq(t+1)を下記(7)式により求める。
なお、下記(7)式において目標量子化ステップサイズxにかかる係数1/2は発生ビット数が目標符号化ビット数より若干上回るようにして割り当てビット数の不足を防止するためのものである。このようにすることにより重み係数cqはnp=3を基準に更新され、x=2である場合に限り更新されない。
Figure 0004039634
Figure 0004039634
上記のようにして、量子化器4−1は、符号化ビット数R(t)より若干上回るビット数になるようにコードデータを量子化する(S3)。その後、ポスト量子化器4−2が目標符号化ビット数への合わせ込みを行う(S4)。目標符号化ビット数への合わせ込みは、コーディングパス数npの選択により行う。ここで、コーディングパス数npは全てのコードブロックで同一とする。
当該ピクチャtに対し、コーディングパス数npに対する総符号化ビット数r(t,np)は予め算出可能であるので、|r(t,np)−R(t)|を最小とするコーディングパス数npを選択すればよい。
図3は、本発明におけるレート制御により4つのコードブロックについてのコードデータを目標符号化ビット数に合わせ込む概念を示している。図7の従来のレート制御と異なり、割り当てられたビット数の範囲内で各コードブロックに共通の切り捨てコーディングパス数npを決定する。
上記第1の実施形態は、画面(ピクチャ)単位で符号化処理し、1画面全体の符号化処理を待って伝送するものであるが、伝送までの遅延を少なくするために1画面全体の処理を待たずに伝送し得るようにした第2の実施形態について以下に説明する。
第2の実施形態では、走査方向に画面を複数のセグメント(タイル)に分割し、セグメント単位で符号化処理を行う。これにより1つのセグメントの処理が終わればその時点で当該セグメントについてのコードデータを伝送することができるので遅延を少なくすることができる。図4はその概念を示し、同図(a)は1画面単位で符号化処理を行う場合、同図(b)はセグメント単位で符号化処理を行う場合を示している。
セグメント単位での符号化処理について具体的に説明すると、符号化ビット数R(t)の算出および重み係数cqの更新はピクチャレベルで行うので、第1の実施形態と何ら変わりなく行うことができる。ピクチャレベルで更新された重み係数cqは、タイル化歪みを抑制するために全タイルに共通に適用することとする。
また、ポスト量子化では、下記(8)式により符号化ビット数R(t+1)を各タイルに分配した上で、各タイルで独立に切り捨てコーディングパス数npを決定する。
Figure 0004039634
ここでは、タイルを0 〜cnt-1に分割するものとし、各タイルに分配される符号化ビット数をR(t+1)[tile]、各タイルにおけるコーディングパス数npに対する総符号化ビット数をr(t,np)[tile]で表している。
本発明では、さらに、各コードブロックでコーディングパスを均等に切り捨てた結果、目標ビット数までに多少の空きがある場合、さらに下位のビットプレーンのコードデータをコードブロックごとに選択して目標ビット数に合わせ込むようにし、これによりさらに高精度に符号量を制御する。これは、下位のビットプレーンよりコードブロック間で均等にコーディングパスを逐次切り捨て、その際に符号化ビット数が目標ビット数を初めて下回るコーディングパスの位置を探索し、そのコーディングパスに対してはコードブロックごとに切り捨てを行って符号化ビット数が目標ビット数内に収まるように制御することにより実現できる。
その場合のコードブロックごとに切り捨ては、コーディングパスのレート−歪みの勾配が小さいものから切り捨て、あるいは切り捨てに伴い発生する歪み量が小さいものから切り捨てるようにすればよい。
本発明は、Motion JPEG2000などHDTVを含む高精細動画像の符号化を扱うシステム、例えば放送局向け映像サービスやFTTHなどのブロードバンド系映像サービスなどに適用可能であり、高画質の動画像伝送システムの実現を可能にする。
本発明に係る動画像符号化方式を示すブロック図である。 本発明におけるレート制御の手順を示すフローチャートである。 本発明における目標符号化ビット数への合わせ込みの概念を示す図である。 画面(ピクチャ)単位での符号化処理とセグメント単位での符号化処理の説明図である。 従来の画像符号化方式を示すブロック図である。 図5のポスト量子化器での処理の概念を示す図である。 従来のレート制御による目標ビット数への合わせ込みの概念を示す図である。
符号の説明
1・・・フレームメモリ、2・・・コードタイプ決定部、3・・・離散ウエーブレット変換部(DWT)、4・・・レート制御部、4−1・・・量子化器、4−2・・・ポスト量子化器、5・・・パケット化部、6・・・バッファ

Claims (4)

  1. 入力される動画像を、フレーム内符号化、フィールド内符号化、フレーム内−フィールド内適応符号化のいずれかで離散ウエーブレット変換し、これにより得られるコードデータのビット数を、コードブロックごとにコーディングパスの切り捨てを下位のビットプレーンより順次行って符号化割り当てビット数の範囲内とする動画像符号化方式において、
    ードブロックごとにコーディングパスの切り捨てを行う際に、切り捨てられるコーディングパス数がコードブロック間で均等になるように制御する制御手段を備え、
    前記制御手段は、下位のビットプレーンよりコードブロック間で均等にコーディングパスを逐次切り捨てる際に符号化ビット数が割り当てビット数を初めて下回るコーディングパスの位置を探索し、該コーディングパスに対してはコードブロックごとに切り捨てを行って符号化ビット数が割り当てビット数内に収まるように制御することを特徴とする動画像符号化方式。
  2. 前記制御手段は、コードブロックごとに切り捨てを行う際に、該当するコーディングパスのレート−歪みの勾配が小さいものから切り捨てることを特徴とする請求項1に記載の動画像符号化方式。
  3. 前記制御手段は、コードブロックごとに切り捨てを行う際に、該当するコーディングパスの切り捨てに伴い発生する歪み量が小さいものから切り捨てることを特徴とする請求項1に記載の動画像符号化方式。
  4. 前記制御手段は、1画面単位あるいは1画面を複数に分割したセグメント単位で制御を行うことを特徴とする請求項1ないし3のいずれかに記載の動画像符号化方式。
JP2004157526A 2004-05-27 2004-05-27 動画像符号化方式 Expired - Fee Related JP4039634B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004157526A JP4039634B2 (ja) 2004-05-27 2004-05-27 動画像符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004157526A JP4039634B2 (ja) 2004-05-27 2004-05-27 動画像符号化方式

Publications (2)

Publication Number Publication Date
JP2005341236A JP2005341236A (ja) 2005-12-08
JP4039634B2 true JP4039634B2 (ja) 2008-01-30

Family

ID=35494287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004157526A Expired - Fee Related JP4039634B2 (ja) 2004-05-27 2004-05-27 動画像符号化方式

Country Status (1)

Country Link
JP (1) JP4039634B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111264062A (zh) * 2019-02-21 2020-06-09 深圳市大疆创新科技有限公司 编码器、编码系统和编码方法

Also Published As

Publication number Publication date
JP2005341236A (ja) 2005-12-08

Similar Documents

Publication Publication Date Title
US6690833B1 (en) Apparatus and method for macroblock based rate control in a coding system
JP4444790B2 (ja) 画像圧縮方法、画像圧縮装置、画像圧縮システム、プログラム
CA2295689C (en) Apparatus and method for object based rate control in a coding system
CN1151685C (zh) 编码系统中用于优化速率控制的装置和方法
EP0857394B1 (en) Apparatus and method for optimizing the rate control in a coding system
US6912255B2 (en) Bit rate control through selective modification of DCT coefficients
US7426309B2 (en) Method of controlling encoding rate, method of transmitting video data, encoding rate controller for video encoder, and video data transmission system using the encoding rate controller
KR100304103B1 (ko) 비트율이급변되는재양자화계단크기선택방법및그를이용한비트율제어방법
US20020168007A1 (en) Apparatus and method for allocating bits temporaly between frames in a coding system
KR101065520B1 (ko) 라인-기반 비디오 레이트 제어 및 압축
JPH0595536A (ja) 高能率符号化信号処理装置
US20050036549A1 (en) Method and apparatus for selection of scanning mode in dual pass encoding
US20050141773A1 (en) Compression encoder
US20080025392A1 (en) Method and apparatus for controlling video encoding data rate
Masuzaki et al. JPEG2000 adaptive rate control for embedded systems
JP4039634B2 (ja) 動画像符号化方式
US7106796B2 (en) Apparatus and method for adaptively controlling bit rate of video transcoder
JP3902948B2 (ja) 動画像符号化装置
US7944969B2 (en) Method and system for sampling video data
JP3297471B2 (ja) 画像符号化装置
JPH09107293A (ja) 符号量制御方法、及びその装置
JPH0678282A (ja) 動画像符号化装置
JPH07312753A (ja) 符号化制御方法
JPH0678281A (ja) 動画像符号化装置
WO2008047714A1 (en) Code conversion method, transcoder, and integrated circuit thereof

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070110

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070808

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071102

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101116

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111116

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121116

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131116

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees