WO2001063938A1

WO2001063938A1 - Video encoding apparatus and video encoding method

Info

Publication number: WO2001063938A1
Application number: PCT/JP2001/001514
Authority: WO
Inventors: Yuji Kawashima; Atsushi Asano
Original assignee: Kabushiki Kaisha Toshiba
Priority date: 2000-02-28
Filing date: 2001-02-28
Publication date: 2001-08-30
Also published as: DE60104616T2; EP1185108B1; US20020186767A1; JP2001245296A; EP1185108A4; US6819712B2; JP4170555B2; EP1185108A1; DE60104616D1

Description

明細書

映像符号化装置及び映像符号化方法技術分野

この発明は、ディジタル動画像の信号を符号化する映像符号化装置に係り、特に、ディジタル動画像等の映像信号を所定の符号化方式で信号処理する際に信号処理されたビットストリームに所定のスタッフイングビットを挿入する映像符号化装置に関する。背景技術

一般に、ビデオ信号、即ち、映像信号を符号化する映像符号化装置では、映像信号を所定の方式で符号化して所定の符号量を有する単位に区分され、この単位を有するビットストリームを出力しなければならないとされている。即ち、ビットストリームを受ける受信側の複号化装置におけるバッファにおいて、オーバーフロー、或いは、アンダーフローが生じないようにするために、ビットストリームの出力側の符号化装置においては、そのビットストリームの符号量が制御されることが要求されている。このオーバーフローを防ぐ一般的な方法としては、量子化パラメータの制御及び符号化フレームの制御等があり、これらの制御によって符号量が所定の符号量に調整されている。また、アンダーフローを防ぐ方法としては、スタッフイングを挿入する方法がある。この方法では、受信側における復号処理で捨て去られる冗長ビットがスタツフィングとしてビットストリームの所定の箇所に揷入される。尚、スタッフイング自体は、揷入を意味し、スタッフイングの挿入は、正確にはスタッフイングビットの揷入を意味している。（単に省略してスタッフイングの挿入と表現されることもある。）

映像信号符号化方式として近年 M P E G - 4 が提案され、実用化されつつある。この M P E G- 4 の規格においては、一例としてマクロブロック M B (Macro-block) 単位でスタッフィングが挿入される。（このマクロブ口ック M B単位で挿入されたスタッフィングは、 M B スタッフィングと称せられる。） M B スタッフイングであれば、マクロブロック M Bの符号化方法が特定され、その符号化方法は、 M B タイプとして定義される。 M B タイプでは、イントラ（ I n t r a ) 、或いは、インター（ I n t e r ) 、差分量子化スケール（ D Q u a n t ) の有無を表す M B タイプが現れるまで何個でも繰り返しスタッフイングビットを揷入することができる。尚、揷入するスタッフイングビットの 1 単位は、 9 ビットの符号列に定められている。

前述したように、スタッフイングは、復号化装置におけるバッファアンダーフローを防ぐための方法であり、通常、ビットストリーム中でマクロプロック M B (M B ) 毎に不足している符号量が求められ、その符号量に相当する M B スタッフイングが実施される。即ち、映像信号が所定の方式で信号処理され、この信号処理された信号が可変長符号化処理され、可変長符号化処理された信号の発生符号量が所定の符号量に達していない場合において、スタッフィングが実行される。このスタッフイングにおいて、挿入すべき符号量は、その不足している符号量が求められ、その符号量に対応するスタツフイングがなされる。

M B情報が可変長符号化された後、ビットストリームにマクロブロック M B ( M B ) スタッフイングを揷入するには、可変長符号化処理されたマクロブ口ック M B毎にスタッフィングを挿入する方法が考えられる。このため、ビットストリームを送信する送信バッファの前段にスタッフィングを揷入するための装置を追加することが必要とされる。この追加する装置としては、例えば、 M Bスタッフイングを有しないビットストリームを一時的に格納するノッファ、或いは、ビットストリーム中に M Bスタッフイングを挿入可能なようにその揷入箇所を示す装置が予想される。

ビットストリーム中に M Bスタッフイングを挿入するには、バッファとしてのメモリが必要され、この装置の消費電力が大きくなる問題点がある。また、追加する装置を必要とすることから、回路が大きくなり、消費電力も増大し、信号処理に遅延が生じる虞がある問題がある。

発明の開示

この発明の目的は、可変長符号化処理前に符号化すべきデータに対してスタッフイング量を推定し、この符号化すべきデータにスタッフィングを挿入して符号化することが可能な映像符号化装置及び映像符号化方法を提供するにある。

また、この発明の目的は、符号化すべきデータにスタッフィングが挿入された後に可変長符号化処理がなされることで、回路を増やすことなく、また、遅延を生じさせることなく、所定のビットストリームを出力することができる映像符号化装置及び映像符号化方法を提供するにある。

この発明によれば、

ある単位の映像信号をこの映像信号を構成するプロック毎に直交変換し、量子化してプロック情報生成する信号処理手段と、

このブロック情報を一定の方式に従って統合して統合情報を生成する統合手段と、

この統合情報のブロック情報に対してブロック情報毎に可変長符号化する符号化手段と、

から構成される映像符号化装置において、

前記統合されたプロック情報から可変長符号化後の発生符号量を推定してブロク毎に揷入すべきスタッフィングビットを算出する推定算出手段を具備し、前記統合手段においてこの算出されたスタッフイングビットを統合情報の所定の箇所に揷入させ、前記符号化手段にこのスタッフイングビットが付加されたプロック情報を可変長符号化させる映像符号化装置が提供される。

この発明によれば、上述した発明において、

前記推定算出手段は、

前記信号処理手段から出力される符号化前プロック情報に含まれる量子化 D C T係数をカウントする第 1 のカウント手段と、

前記符号化手段から出力される符号化された符号列の発生符号量をカウントする第 2のカウント手段と、

第 1 及び第 2 のカウント手段からの出力に基づいて前記ブロック情報を符号化した際のプロック情報の平均符号語長を算出する平均符号語長算出手段と、

前記信号処理手段から前記統合手段に入力されるあるプロック情報が符号化された際の発生符号量の推定する推定手段と、

を更に具備する映像符号化装置が提供される。

また、この発明によれば、上述した発明において、

前記推定手段は、

(平均符号語長） X (量子化 D C T係数の総数）の推定式を基に発生符号量を推定する映像符号化装置が提供される。

更に、この発明によれば、上述した発明において、前記平均符号語長算出手段は、

前記第 2 カウント手段からの可変長符号化後の累積発生符号量及び前記第 2 カウント手段からの前記統合情報内のプロック情報の量子化 D C T係数の総数から

(累積発生符号量） / (量子化 D C T係数の累積数）に基づいて平均符号語長を算出する映像符号化装置が提供される。

更にまた、この発明によれば、上述した発明において、

前記推定算出手段は、

前記推定された発生符号量と前記第 2 の力ゥント手段で力ゥントされた符号量を累積した符号化累積数を比較してスタッフィング量を決定するスタッフィング算出部を更に具備する映像符号化装置が提供される。また、更にこの発明によれば、

ある単位の映像信号をこの映像信号を構成するブロック毎に直交変換し、量子化してプロック情報生成する信号処理工程と、

このブロック情報を一定の方式に従って統合して統合情報を生成する統合工程と、

この統合情報のブロック情報に対してプロック情報毎に可変長符号化する符号化工程と、

から構成される映像符号化方法において、

前記統合されたプロック情報から可変長符号化後の発生符号量を推定してブロク毎に挿入すべきスタッフィングビットを算出する推定算出工程を具備し、前記統合工程においてこの算出されたスタッフイングビットを統合情報の所定の箇所に揷入させ、前記符号化工程において、このスタッフイングビットが付加されたプロック情報を可変長符号化させる映像符号化方法が提供される。

この発明においては、複号化装置におけるバッファアンダ一フローを防ぐために行うスタッフィングに関して、新たに追加する回路および処理が極力少ないので、消費電力も抑えられ、リアルタイム性も保つことができる。図面の簡単な説明

図 1 は、この発明の一実施例に係る映像符号化装置の構成を示すブロック図である。

図 2 は、図 1 に示した信号処理部 1 0の構成を示すブロック図である。

図 3 は、図 1 に示された発生符号量推定部における処理を示す機能ブロック図である。

図 4は、図 1 に示したスタッフイング量算出部 1 7 において、目標ビットレート T br、目標フレームレート T f r及び信号処理部 1 0 で処理された信号処理済のマクロブ口ック M B (M B ) 数 Nmb(x)から目標発生符号量 T code (X)を算出する過程を示すフローチャートである。

図 5 は、図 1 に示したスタッフイング量算出部 1 7 において、図 1 に示された発生符号量カウント部 1 4でカウントされた可変長符号化済のマクロブロック M B (M B ) の発生符号量 C (x)、図 4 に示された処理で求められた目標発生符号量 T code(x), 図 3 に示した処理で算出された推定発生符号量 E (X)からスタッフィング量 S (X)を求める過程を示すフローチヤートである。

図 6 は、スタッフィングが挿入される場合におけるマク口プロック M B情報を符号化して図 1 に示される装置から出力されるビットストリームに変換する過程及びマクロプロック M Bのデータを含むビットストリームの構造を示す説明図でめる。

図 7は、スタッフィングが揷入されない場合におけるマクロブロック M B情報を符号化して図 1 に示される装置から出力されるビットストリームに変換する過程及びマクロブロック M Bのデータを含むビットストリームの構造を示す説明図である。図 8 A及ぴ 8 Bは、ビデオオブジェクトプレーンの符号化順序を説明する平面図及び符号化済みマクロブロック M B と符号化マクロブ口ック M B との関係を示す平面図である。

図 9 は、この発明の変形実施例に係るスタッフイング量を求める過程を示すフローチヤ一トであって、図 1 に示したスタツフィング量算出部において、発生符号量カウント部 1 4 でカウントされた可変長符号化済のマクロブ口ック M B (M B ) の発生符号量 C (x)、図 4 に示された処理と同様の処理で求められる符号化ビデオパケットの目標符号量 T code (x)、図 3 に示した処理と同様の処理で算出された符号化ビデオパケットの推定符号量 E (X)からビデオパケットに揷入されるスタッフイング量 S (X)を求める過程を示すフローチヤ一トである , 図 1 0 A、 1 0 B、 1 0 〇及び 1 0 0は、この発明の変形実施例に係る図 1 に示されるシステムから出力されるデータパーティショユングモードにおけるのビット.ストリームにスタツフイングが挿入されている場合のデータ構造を示す説明図である。 . 発明を実施するための最良の形態

以下、図面を参照してこの発明の一実施例に係る映像符号化装置を説明する。

図 1 には、この発明の一実施例に係る映像信号、即ち、ビデォ信号を可変長符号化する映像符号化装置のプロック図が示されている。この図 1 に示される装置は、この装置内の各部を制御する装置制御部 2 0及びビデオオブジェクトプレーン（ V O P ) の単位で、付帯的には、フレーム或いはフィールド単位で入力されるディジタル化映像信号を所定の映像信号圧縮方式（M P E G- 4方式、或いは、 I T U— T勧告の H . 2 6 3方式、又は、これらを変更した方式）に従って所定のブロック、即ち、マクロブロック M B に分割し、マクロプロック M B を信号処理して圧縮する信号処理部 1 0 を備えている。

この信号処理部 1 0 は、図 2 に示されるように量子化 D C T係数 (Discrete Cosine Transform：離散コサイン変換）部 2 4及び量子化部 2 5 を含んでいる.。制御装置 2 0 の制御に従って入力されたディジタル化映像信号は、 D C T部 2 4 において、フレーム或いはフィールドの最小単位であるマクロブロック M B毎に直交変換、即ち、 D C T演算され、得られた D C T係数が量子化部 2 5 において D C (直流）成分及ぴ A C (交流）成分毎に独立して量子化され、量子化された D C T係数は、テクスチャ（量子化 D C T係数）として図 1 に示されるシンタックス生成部 1 2に出力される。

図 2 に示される信号処理部 1 0 は、更に量子化されたビットストリームを逆量子化する逆量子化部 2 6 、逆量子化された D C T係数を逆 D C T変換する逆 D C T部 2 7及びマクロプロック M B単位で次のフレームと比較する動き補償部、即ち、 M C (Motion Compensation) ¾ 2 9 力ら構成されている。この信号処理部 1 0 においては、 D C T係数が逆 D C T変換されて符号 2 8 で示すように複号化画像が再現され、この復号化画像が次に入力されるフレーム或いはフィールドとマクロブロック M B単位で M C部 2 9 において比較され、その両者の比較から動きベクトル及び予測参照画像がこの M C部 2 9 カゝら出力される。動きべクトルは、テクスチャ（量子化 D C T係数）と同様に図 1 に示されるシンタックス生成部 1 2 に出力される。また、予測参照画像は、 D C T変換される前に次のフレーム画像と比較されてその差分が D C T部 2 4 において D C T変換され、 D C T係数が量子化されてマクロブ口ック M B毎にシンタックス生成部 1 2 に出力される。

シンタックス生成部 1 2 においては、入力されたテクスチャ（量子化 D C T係数）及び動きべクトルを含むマクロブロック M B ( M B ) 情報及び後に説明するスタッフイング量から、 M P E G - 4 の規格に基づく符号化モードに従ったシンタックスが生成され、このシンタックスが可変長符号化部 1 3 に入力される。尚、この符号化モードの制御は装置制御部 2 0で設定される。

シンタックス生成部 1 2 力らのシンタックスは、可変長符号化処理部 1 3 において、順次可変長で符号化され、可変長符号化されたビットストリームは、送信バッファ 2 2 に与えられ、装置制御部 1 0 で設定された目標ビットレートに従つて送信される。

図 1 に示される映像符号化装置は、更に量子化 D C T (離散コサイン変換）係数カウント部 2 1 、可変長符号化処理部 1 3 、発生符号量カウント部 1 4 、平均符号語長算出部 1 5 、発生符号量推定部 1 6及びスタッフイング量算出部 1 7 を備えている。尚、装置制御部 2 0 は、これらの各部を制御すると共に装置に入力される映像信号を制御し、装置が出力すベきビットストリームを制御している'。ここで、ビットストリームの制御とは、目標となる発生符号量（目標ビットレート）或いはフレーム数（目標フレームレート）の設定、レート制御或いは誤り耐性などの符号化モードの設定等を含んでいる。

可変長符号化部 1 3 の出力は、発生符号量カウント部 1 6 に与えられ、この発生符号量カウント部 1 6 において、その符号量がカウントされ、そのカウント値がスタッフイング量算出部 1 7及び平均符号語長算出部 1 5 に与えられる。

量子化 D C T係数カウント部 2 1 には、信号処理部 1 0 で生成された M B情報に含まれる量子化 D C T係数がカウントされ、そのカウント値が平均符号語長算出部 1 5及び発生符号量推定部 1 6 に与えられる。

平均符号語長算出部 1 5 は、量子化 D C T係数カウント部 2 1 でカウントされた量子化 D C T係数の累積数と発生符号量カウント部 1 4 でカウントされた符号量の累積数から、量子化 D C T係数の平均符号語長 Lを算出し、この平均符号語長 L を符号量推定部 1 6 に与えている。累積発生符号量を C sura, 量子化 D C T係数の累積数を N sumとすると、平均符号語長 Lは、 C sum/ N sumとなる。ここで、平均符号語長として可変値ではなく固定値を用いても良い。例えば、平均符号語長として固定値 L = 8 に定めても良い。また、累積数は、あるフレームの入力開始力らその内の該当するマクロブ口ック M B の処理までの発生符号量或いは量子化 D C T係数の総数に相当している。

発生符号量推定部 1 6 は、図 3 に示すように量子化 D C T 係数カウント部 2 1 でカウントされるあるマクロプロック M B の量子化 D C T係数 N coef と、平均符号語長算出部 1 6 で算出される量子化 D C T係数の平均符号語長から、当該マクロブ口ック M B に関して可変長符号化処理部 1 3 で発生されると予想される符号量の推定値を算出している。可変長符号化処理部 1 3 において、シンタックス生成部からのシンタックス出力が可変長符号化処理される前にこの推定値が算出される。

推定発生符号量 E (X)は、

E (x) = N coef X L

となる。ここで、 Xは、ビデオオブジェクトプレーン（ V O P ： V i d e o O b j e c t P l a n e ) 、即ち、フレ一ム或レヽはフィールド内でのマク口プロック M B の番号を示す正の整数とする。

スタッフイング量算出部 1 7 は、装置制御部 1 0 で設定される目標となる発生符号量（目標ビットレート） T br、フレーム数（目標フレームレート） T fr、信号処理部 1 1 で得られる 1 フレーム内における信号処理済のマクロブロック M B (M B ) 数 Nmb(x)から、目標発生符号量 T code ）を算出している。ここで、予め定まっている 1 V O P 当たりのマクロブロック M B (M B ) の総数を Nvopとすると、目標発生符号量 T code (x)は、

T code (x) = ( T br/ Τ fr) X ( Ν mb (χ) / Ν νορ) となる。ここで、（ T br/ T fr) は、 1 フレーム当たりの目標ビットレート、即ち、 1 ビデオオブジェクトプレーン内における目標符号量である。また、 ( Nmb(x)/ N vop) は、 1 ビデオオブジェクトプレーン内における全体のマクロプロック M B数に対する信号済マクロブ口ック M B数の割合である。この目標発生符号量 T code(x)は、上記式から明らかなように信号処理の対象とされる X番目マクロブ口ック M Bが符号化された後に 1 ビデオオブジェクトプレーン内において累積的に発生されるべき目標とする符号量として定義される。

この目標発生符号量 T code (X) と発生符号量カウント部 1

4 で得られる可変長符号化済のマクロブロック M Bの発生符号量 C (X)を用いて、現在符号化しているマクロブ口ック M B

(以下、符号化 M B と呼ぶ）の目標発生符号量 Tmb(_X)が

x-1

Tmb (X) = Tcode (x)— C (i)

i=0

で算出される。ただし、 C (0) = 0。

この目標発生符号量 Tmb (x)と発生符号量推定部 1 6 で得ら ' れる推定発生符号量 E ）から予測、即ち、推定される不足符号量 S (X)が以下の通りに算出される。

( 1 ) 推定発生符号量 T mb (X)が目標発生符号量 E ）より小さいとき、

S (x) = T mb (x)一 E (x) if T mb (x) > E (x) とする。

( 2 ) 他方、 ί|定発生符号量 T mb (x)が目標発生符号量 E ）より大きい場合、 S (x) = 0 if T mb (x) < = E (x)

とする。この S (x)がスタッフイング量となり、この値をシンタックス生成部 2 に与えられる。尚、このスタッフイング量は、 9 ビットを 1 単位としてその整数倍に定められる。

図 1 に示された映像符号化装置における動作について図 3 から図 8 Bを参照して説明する。

信号処理部 1 0 には、図 8 Aに示すようにビデオオブジェクトプレーン内の画像信号が矢印で示すように順次入力される。この信号処理部 1 0 に映像信号が与えられると、映像信号は、信号処理部 1 0 において、図 6 及び図 7 に示すようにマクロブ口ック M B単位で信号処理されてテクスチャ（量子化 D C T係数）及び動きべクトルを含むマクロブロック M B 情報が生成される。テクスチャ（量子化 D C T係数）の D C T係数が D C T係数カウント部 2 1 でカウントされて符号量が算出される。 D C T係数カウント部 2 1 でカウントされた符号量の累積値が量子化 D C T係数の累積数 N sumとして平均符号語長算出部 1 5 に与えられる。また、マクロブロック M B情報を基にしてシンタックス生成部 1 2 でシンタックスが生成され、このシンタックスが可変長符号化部' 1 3 で可変長符号化される。この符号化されたビットストリームの符号量が発生符号量カウント部 1 4 でカウントされ、発生符号量の累積値が累積発生符号量 C sumとして同様に平均符号語長算出部 1 5 に与えられる。この累積発生符号量 C sumは、図 8 Bに示すビデオオブジェクトプレーン内において斜線で示す領域のマクロブロック M B を可変長符号化後に発生される発生符号量の総数に相当する。

平均符号語長算出部 1 5 において、与えられた累積発生符号量 C sum及び量子化 D C T係数の累積数 N sumから、平均符号語長 L ( L = C sum/ N sum) が算出される。この平均符号語長 Lは、発生符号量推定部 1 6 に与えられる.。ここで、発生符号量推定部 1 6 には、マクロブロック M B毎の D C T係数 N coefが量子化 D C T係数カウント部 2 1 から次々と与えられることから、図 3 に示すように推定発生符号量 E (x) ( E (x) = N coef X L ) が求められる。

推定発生符号量 E (_X)は、スタッフイング量算出部 1 7 に与えられる。このスタッフイング量算出部 1 7 には、装置制御部 2 0 力、ら図 4 のステップ S 4 1 及ぴ S 4 2 で示すように目標ビットレート T br及び目標フレームレート T f r並ぴに 1 ォブジェクトプレーン V O P 当たりのマクロブロック M B (M B ) の総数を Nvopが与えられ、また、図 4 のステップ S 4 4 に示すように信号処理部 1 0 から 1 ォブジェクトプレーン V 〇 Ρ内における信号処理済のマクロブロック M B (M B ) 数 N mb (X)が与えられている。従って、ステップ S 4 3 に示すように 1 ビデオオブジェクトプレーン内における目標符号量 ( T br/ T fr) が求められ、ステップ S 4 5 に示すように 1 ビデオオブジェクトプレーン内における信号処理済マクロブロック M B (M B ) 率（ N mb (X) Z N vop) が求められる。ステツプ S 4 7 に示すようにこの目標符号量 .（ T br/ T fr) 及び信号処理済マクロブロック M B (M B ) 率（ Nmb(x) Z N vop) から次式で定められる信号処理済みのマクロプロック M Bの目標発生符号量 T code (x)が求められる。

T code (x) = (TbrZTfr) X ( Nmb (x) / N vop) この目標発生符号量 T code (x)は、 x番目のマクロブロック M B を可変長符号化処理部 1 3 で符号化する場合、 X番目のマク口プロック M Bまでに発生される、符号化しているビデォォブジェクトプレーン V O P における目標とする総符号量に該当する。

図 5 のステップ 5 1 に示すようにこの目標発生符号量 T code(x)が定まると、発生符号量カウント部 1 4 から与えられる可変長符号化済のマクロブ口ック M Bの発生符号量 C ）と比較され、図 8 B に示すようにその差に相当する現在符号化している X番目のマクロブロック M B (M B ) の目標とする発生符号量 T mb (X)が求められる。

また、ステップ S 5 4及びステップ S 5 6 に示すように算出された平均符号長 L及ぴ符号化マクロブ口ック M Bの量子化 D C T係数の総数 N coefからステップ S 5 5 に示すように符号化されたマクロブロック M B の推定符号量 E ( X ) が演算される。ステップ S 5 7 で示すようにこの発生符号量 T mb(x)と推定符号量 E ( X ) とが比較され、推定発生符号量が目標発生符号量より小さいときには、ステップ S 5 8 に示すようにその差がスタッフイングすべき量 S (X)として設定される。この場合、その量 S (X)を基準にスタッフイングが図 6 に示すようにマクロブ口ック M B情報毎にマク口プロック M B タイプ（M B タイプ）として挿入され、そのマクロブロック M B情報が図 1 に示すように可変長符号化処理.部で可変長符号化され、送信バッファに出力される。これに対して、ステップ S 5 9 に示すように、推定発生符号量 T mb (X)が目標発生符号量 E (X)より大きい場合には、図 7 に示すようにスタッフイングが挿入されることなく、図 7 に示すようにマクロプロック M B情報が可変長符号化される。

図 6 は、マクロブロック M B にスタッフイングが挿入されたマクロブロック M Bデータの構造を示し、図 7 は、マクロブロック M B にスタッフィングが挿入されてレヽないマクロブ口ック M Bデータの構造を示している。マクロブ口ック M B データには、可変長符号化されたマクロプロック M B情報が複数個連続して配置され、図 6 に示すようにスタッフィング、動きべクトル（MV ) 及びテクスチャ（量子化 D C T係数）の順序で各マクロブ口ック M B情報が構成されている。これに対して、図 7 に示す構造では、スタッフイングが不要とされたこと力ゝら、各マクロプロック M B情報には、動きべタトル（MV ) 及びテクスチャ (量子化 D C T係数）のみが配置されている。

尚、 1 オブジェクトプレーン内の全てのマクロブロック M Bが可変長符号化された後に、量子.化 D C T係数カウント部 2 1 及び発生符号量カウント部 1 4 がクリアされ、再び次のビデオオブジェクトプレーンの為の上述した処理が開始される。

上述した実施例においては、マクロブロック M B (M B ) 単位で随時スタッフィングを揷入する方法を示したが、すべてのマクロブロック M B (M B ) に対してスタッフイングするか否かを決定してスタッフィングの必要がある毎にマク口ブロック M B にスタッフイングを揷入しなくとも良い。例えば、ある時点まで符号化信号量の総数を計測し、ビデオォブジェクトプレーン（ V O P ) の最後列、或いは、. 最後のマクロブ口ック M B に対してのみスタッフィングが上述の方法で挿入されても良い。

また、上述した実施例においては、マクロブロック M B (M B ) 単位でスタッフイングする方法を示したが、 M P E G - 4 で規定されているビデオバケツト（VP: Video Packet)単位でスタッフイングがなされても良い。ビデオバケツト V P は、まとめて符号化する隣接する M B を少なくとも 1 つ含んでいる。ビデオパケット V P単位でスタッフイングを行う場合、発生符号量もビデオパケット V P単位で推定することになる。ビデオパケット V P単位で発生符号量を推定すると、推定精度は少し落ちるが、推定回数が減り、全体の処理量が減るためリアルタイム処理に有効である。また、後記データ ' ノ一ティシショニングモード (Data Partitioning Mode) の符号化では、ビデオパケット V P単位に可変長符号化処理を行うので特に有効である。具体的な変更は、上記で設定した M B番号 Xを V P番号 Xとし、符号化 M B の目標発生符号量 T mb ）を符号化 V P の目標発生符号量 T vp ）とする。推定に関する計算はすべて同一である。

以下、 V P単位のスタッフイングの方法を M B単位のときと変更がある箇所、発生符号量推定部 1 6 とスタッフイング量算出部 1 7 の動作について説明する。発生符号量推定部 1 6 は、図 9 のステップ S 9 6 で示される量子化 D C T係数カウント部 2 1 で得られる数 N coef (j) (ビデオノケット V P内のすべてのマク口プロック M B の量子化 D C T係数の総数）と、図 9 のステップ S 9 4 で示される平均符号語長算出部 1 6 で算出される量子化 D C T係数の平均符号語長から、図 9 のステップ S 9 5 で示されるように可変長符号化処理部 1 3 で発生される符号量の推定値 E ( X ) が可変長符号化処理前に算出される。

ビデオバケツト V P番号 j の V Pの推定発生符号量 E ( j)は、

E (j) = N coef (j) X L

となる。ただし、 jは、ビデオオブジェクトプレーン (VOP: Video Object Plane)内でのビデオノケッ卜 V Pの番号を示す正の整数とする。 X ( j ) は番号 j のビデオパケット V P に含まれる最後のマクロブ口ック M B の番号を示す正の整数とする。

スタッフイング量算出部 1 7 は、装置制御部 2 0 で設定される目標ビットレート T br、目標フレームレート T fr、信号処理部 1 0 で得られる信号処理済の M B数 N mb (X ( j) )から、図 9 のステップ S 9 1 に示すように目標発生符号量 T code (x(j))を算出する。ここで、 1 V O P あたりの総マクロブロック M B (M B ) 数を Nvopとすると、目標発生符号量 Τ code (x ( j) )は

T code(x(j)) = ( T br/ T fr ) X ( N mb(x(j)) / N vop)

となる。この T code (x (j) ).と図 9 のステップ S 9 2 に示される発生符号量カウント部 1 4 で得られる可変長符号化済の V P の発生符号量 C (j)を用いて、ステップ S 9 3 に示されるように現在符号化しているビデオパケット V P (以下、符号化 V P と呼ぶ）の目標発生符号量 T vp(x(j))が

x(j-l)

T vp(j) = T code(x(j)) -∑C (i)

i = 0

と算出される。ただし、 C (0) = 0。

この符号化ビデオバケツト V P の目標発生符号量 T vp ( j) と発生符号量推定部 1 6 で得られる推定発生符号量 E (j)からステツプ S 9 7 に示されるように予測、即ち、推定される不足符号量 S (j)が以下の通り算出される。

推定発生符号量が目標発生符号量より小さいとき、

S (j) = T vp(j) - E (j) if T vp(j) > Ε (j)

とする。他方、推定発生符号量が目標発生符号量より大きい場合、ステップ S 9 7 に示すように

S (j) = 0 if T vp (j) < = E (j)

とする。この S (j)がスタッフイング量となり、この値をシンタックス生成部 2へと与える。

ここで、映像信号符号化方式 M P E G - 4 においては、ステップ S 9 8 に示されるようにビデオパケット V P のサイズに上限がある。そのため、この不足符号量 S (j)を制限なしにスタツフイングとして揷入すると、ビデオバケツト V P のサイズの上限を超えてしまうことがある。そこで、ビデオバケツト V Pのサイズの上限値 V P maxをもとに目標ビデオバケツト V P のサイズ V P target ( < V P max) を装置制御部 2 0 で設定する。この目標ビデオパケット V Pのサイズは、ステップ S 9 9 に示されるようにビデオバケツト V P のサイズの'上限値 V P maxより小さく、かつ発生符号量の推定精度にもよるが推定誤差を考慮した数値、例えば、上限値の半分に設定される。

これらを考慮して、ステップ S 9 9 に示すようにビデオパケット V P単位に符号化を行う場合のスタッフィング量は、前記不足符号量 S (j)と前記推定発生符号量 E (j)の和が目標 V Pサイズが V P targetを超えないようにしている。つまり符号化 V P の目標発生符号量 T vp(j) と目標 V P サイズ V P targetを比較して、小さい値から符号化 V P の推定発生符号量 E (j)を減算した値をスタッフイング量 S (j)とする。このスタッフィング量 S (j)をシンタックス生成部 2 1 に与えている。

S (j) = S (j)

if T vp ( j) < = V P target

S (j) = V P target- E (j)

if T vp (j)〉 V P target、且つ、 V P target > E

(j)

S (j) = 0 if V P targetく = E (j)

即ち、ステップ S 1 0 1 に示すように目標 V Pサイズが V P targetを超えない場合には、スタッフイング量 S (j)は、目標 V Pサイズと V P targetとの差に定められる。また、ステップ S 1 0 0 に示すように目標 V Pサイズが V P targetを超え、しかも、推定発生符号量 E (j)が V P targetよりも小さい場合には、スタッフイング量 S (j)は、目標 V Pサイズと推定発生符号量 E (j)との差に定められる。また、目標 V Pサイズが V P targetを超え、しかも、推定発生符号量 E ( j )が V P targetよりも小さい場合には、スタッフイング量 S (j)は、ゼ口としてスタッフイングが与えられないこととなる。

上述したスタッフィング量を決定する方法は、データパーティショユング（Data Partitioning)モードにおける符号ィ匕方法についても同様に適用することができる。

図 1 0 A〜 1 0 D は、データノーティショユング（Data Partitioning)モードにおけるのビットストリームを示している。データノヽ⁰ —ティショユング (Data Partitioning)モードの符号化とは、図 1 0 Dに示すような 1 つ以上のマクロブロック M B のマクロブロック M B (M B ) 情報（動きべクトルやテクスチャ（量子化 D C T係数））を

1 . (M Bタイプ及び動きベクトル）

2. (テクスチャ）

とに統合して、図 1 0 Cに示すように可変長符号化する方法である。上記 1 と 2 は、図 1 0 B に示すようにモーションマーカー（Motion Marker)を挿入し分割される。前記の通りスタツフィングビットは、マクロブロック M B (M B ) タイプの位置に揷入される。ビデオパケット V P は、図 1 0 Aに示すように互いに再同期マーカー（Resync Marker)により区切られてレヽる。このようなデータノーティショユング（Data Partitioning)モードにおけるのビットストリームの構造においても同様に上述した方法を適用して図 1 0 B に示す M B スタッフィングの符号量が決定される。

尚、図 1 0 Aに示すように、ノケットのヘッダには、再同期マーカー、マクロブロック M B番号、量子化スケール及び H E C ( Header Extension Code) 等が記述され、これに続いてマクロブ口ック M Bデータが配置されている。産業上の利用可能性

上述したように、この発明によれば、可変長符号化処理前にスタッフィング量が推定され、スタッフィングがなされてから可変長符号化処理がなされることで、回路を増やすことなく、また遅延も生じることなく、所定のビットストリームを出力することができる。したがって、ビットストリームの再構成のために、新たなメモリが必要となる問題、或いは、処理量が増加することにより遅延が生じ、リアルタイム性を損なう問題を解消することができる。

Claims

請求の範囲

1 . ある単位の映像信号をこの映像信号を構成するプロック毎に直交変換し、量子化してブロック情報を生成する信号処理手段と、

このプロック情報を一定の方式に従って統合して統合情報を生成する統合手段と、

この統合情報のプロック情報に対してプロック情報毎に可変長符号化する符号化手段と、

から構成される映像符号化装置において、

前記統合されたプロック情報から可変長符号化後の発生符号量を推定してブロク毎に挿入すべきスタッフィングビットを算出する推定算出手段を具備し、前記統合手段においてこの算出されたスタッフイングビットを統合情報の所定の箇所に挿入させ、前記符号化手段にこのスタッフイングビットカ S 付加されたプロック情報を可変長符号化させる映像符号化装

2 . 前記推定算出手段は、

第 1 及び第 2 のカウント手段からの出力に基づいて前記プロック情報を符号化した際のプロック情報の平均符号語長を算出する平均符号語長算出手段と、前記信号処理手段から前記統合手段に入力されるあるプロック情報が符号化された際の発生符号量の推定する推定手段と、

を更に具備する請求項 1 の映像符号化装置。

3 . 前記推定手段は、

(平均符号語長） X (量子化 D C T係数の総数）の推定式を基に発生符号量を推定する請求項 2 の映像符号化装置。

4 . 前記平均符号語長算出手段は、

前記第 2 のカウント手段からの可変長符号化後の累積発生符号量及び前記第 1 の力ゥント手段からの前記統合情報内のプロック情報に関する量子化 D C T係数の総数から

(累積発生符号量） / (量子化 D C T係数の累積数）

に基づいて平均符号語長を算出する請求項 2 の映像符号化装置。

5 . 前記推定算出手段は、

前記推定された発生符号量と前記第 2 のカウント手段で力ゥントされた符号量を累積した符号化累積数を比較してスタツフィング量を決定するスタッフイング算出部を更に具備する請求項 2 の映像符号化装置。

6 . 前記スタッフイングビットは、前記ブロック情報毎に付加される請求項 1 の映像符号化装置。.

7 . 前記スタッフイングビットは、前記ブロック情報の集合に対して付加される請求項 1 の映像符号化装置。

8 . ある単位の映像信号をこの映像信号を構成するブロック毎に直交変換し、量子化してプロック情報生成する信号処理工程と、

このプロック情報を一定の方式に従って統合して統合情報を生成する統合工程と、

この統合情報のブロック情報に対してブロック情報毎に可変長符号化する符号化工程と、

から構成される映像符号化方法において、

前記統合されたプロック情報から可変長符号化後の発生符号量を推定してプロク毎に挿入すべきスタッフィングビットを算出する推定算出工程を具備し、前記統合工程においてこの算出されたスタッフイングビットを統合情報の所定の箇所に挿入させ、前記符号化工程において、このスタッフイングビットが付加されたブロック情報を可変長符号化させる映像符号化方法。

9 . 前記推定算出工程は、

前記信号処理工程において、出力される符号化前ブロック情報に含まれる量子化 D C T係数をカウントする第 1 のカウント工程と、

前記符号化工程において、出力される符号化された符号列の発生符号量をカウントする第 2 のカウント工程と、

第 1 及び第 2 の力ゥント工程における出力に基づいて前記ブロック情報を符号化した際のプロック情報の平均符号語長を算出する平均符号語長算出工程と、

前記信号処理工程から前記統合工程に入力されるあるプロック情報が符号化された際の発生符号量の推定する推定工程と、を更に具備する請求項 8 の映像符号化方法。

1 0 . 前記推定工程では、

(平均符号語長） X (量子化 D C T係数の総数）の推定式を基に発生符号量を推定する請求項 8 の映像符号化方法。

1 1 . 前記平均符号語長算出工程では、

前記第 2 カウント工程における可変長符号化後の累積発生符号量及び前記第 1 カウント工程における前記統合情報内のブロック情報に関する量子化 D C T係数の総数から

(累積発生符号量） / (量子化 D C T係数の累積数）に基づいて平均符号語長を算出する請求項 8 の映像符号化方法。

1 2 . 前記推定算出工程では、

前記推定された発生符号量と前記第 2 のカウント工程において力ゥントされた符号量を累積した符号化累積数を比較してスタッフィング量を決定するスタッフィング算出工程を更に具備する請求項 8 の映像符号化方法。

1 3 . 前記スタッフイングビットは、前記ブロック情報毎に付加される請求項 8 の映像符号化方法。

1 4 . 前記スタッフイングビットは、前記ブロック情報の集合に対して付加される請求項 8 の映像符号化方法。