JP3954136B2

JP3954136B2 - 画像シーケンスを表すディジタルデータの符号器の出力流量制御方法

Info

Publication number: JP3954136B2
Application number: JP17020696A
Authority: JP
Inventors: ハムディマーエル; ロランピエール; ロベールジェームズ
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 1995-07-10
Filing date: 1996-06-28
Publication date: 2007-08-08
Anticipated expiration: 2016-06-28
Also published as: EP0753831B1; US5724099A; CA2179876A1; FR2736743A1; EP0753831A1; DE69611488T2; CA2179876C; DE69611488D1; JPH0937253A; FR2736743B1

Description

【０００１】
【発明の属する技術分野】
本発明は一連の画像を表すディジタルデータの符号器(coder) の出力流量を制御する方法に関する。本発明の分野はマルチメディアの適用にあり、特に例えば記録されるか又は実時間によるＭｐｅｇ−２として一般的に知られている規定されたアルゴリズムに基づいて圧縮されたアニメ化画像のＡＴＭタイプの高定格ネットワークによる伝送に適用される。
【０００２】
【従来の技術】
ビデオ圧縮はアニメ化画像(animated image)を特徴付ける情報の冗長性を処理することに基づいている。情報の冗長性には二つの形態、即ち、空間的及び時間的なものがる。空間的冗長性は同じ画像内に存在し、更に、画像の近接画素が輝度、及び／又はクロミナンス(chrominance) の極めて接近した値を有する傾向にあるという事実である。時間的冗長性に関しては、連続画像間に存在し、また、二つの近接する画像中の同じ位置を有する画素が輝度、及び／又はクロミナンスの極めて接近する値を有する傾向にあるという事実である。
【０００３】
説明中において、空間的相関と直接関連する大きさを空間的アクティビティ又は空間的な複雑性と呼ぶことにする。空間的複雑性が大きい時は、相関関係が小さくまたこれとは逆になる。実際にビデオ圧縮は、冗長性を処理して基本ビデオ信号よりも少ないデータ量を生成するコーディング(coding)技術からなる。
【０００４】
多数のリサーチ操作は、その特性が相当異なる画像を圧縮するためのアルゴリズムとなる。それでも全ての場合において、圧縮画像は少なからず重要なサイズを有するとともに画像毎に変化する構成ブロックに形成されている。
【０００５】
空間的冗長性の縮小は量子化段階で実質上実行される。画像の各ブロックに対してコサインへの個別の変換が実行された後、得られた係数が量子化マトリックスによって与えられた整数値で割算される。この整数除法は、ハフマン符号(Huffman coding)の後を表すのもではないゼロの値の数を増やす目的を有している。この整数除法のために、この操作はエラーを記憶値に導入する。多少大きめの圧縮を実行するために、量子化マトリックスが量子化パラメータ（普通Ｑで表わされる）として知られた係数で重り付けされる。このパラメータの値が大きくなればなるほど、縮小利得の重要性がますます高くなり、又は、この逆となる。従って、記憶画像の視覚上の低下に対する量子化パラメータのインパクトは、画像の空間的複雑さに左右される。換言すれば、等価な視覚上の質をもたせるためには、多数の小さいディテールを含んでいる画像が圧縮される時に使用される量子化パラメータは、比較的均一な画像を圧縮するのに使用される量子化パラメータよりも小さい。
【０００６】
同様にして、一定流量にするために、多数の小さいディテールを含んでいる画像が圧縮される時に使用される量子化パラメータは、比較的均一な画像の圧縮に使用される量子化パラメータよりも大きい。
【０００７】
最後に、一定値の量子化パラメータのために、強い空間的複雑性又は大きい空間的アクティビティを有する画像の圧縮は、空間的複雑性の小さい画像を圧縮するよりもより多くのデータを生成する。
【０００８】
時間的冗長性を減少させるのに使用される技術は、運動の推定と補償である。連続する画像中の一つの画像の各ブロック又はマクロブロックの位置を決定することに問題がある。連続する画像中のサーチ窓の大きさは、計算の複雑さの事実によって限定される。サーチされるマクロブロックがサーチ窓で見つかれば、運動ベクトルはマクロブロックの運動を表すものとして規定される。これが運動の推定である。
【０００９】
概して、見つかったマクロブロックは元のマクロブロックとぴったり一致せず一つのエラー毎に数画素だけ異なる。従って、このエラーの修正は二つのマクロブロック間の画素によって異なる画素をコーディングすることで実行される。これが運動の補償である。
【００１０】
マクロブロックがサーチ窓で見つからなければ、既に説明したように転換と量子化によってコーディングされる。
【００１１】
従って、時間的複雑さが大きければ、即ち、一つの画像から他の画像へのマクロブロックの運動が、例えば時間経過によるシーンの変化がある時に、カメラ等の高速ズームが相当大きければ、運動ベクトルの推定が不能になり、また、大量のデータがシーンのコーディングのために発生される。
【００１２】
一つのシーンはビデオ・シーケンス内で多少同じ内容を有する連続した画像である。このシーンには、例えば、静止した背景の前方で話をしている人物とか、或いは静止したショット(shot)などを含んでいる。
【００１３】
説明中において、空間的及び時間的にかなり複雑なシーンであり、従って、その伝送に全ビデオ・シーケンスを伝送するのに平均流量より多い流量を必要とするシーンはアクティブなシーンと呼ばれる。他方において、空間的及び時間的にあまり複雑でないシーンであり、従って、その伝送に全ビデオ・シーケンスを伝送するのに平均流量より少ない流量を必要とするシーンはインアクティブなシーンと呼ばれる。
【００１４】
ここで、流量とは単位時間あたりに伝送されるデータの量である。
【００１５】
一定流量でネットワーク・サービスによりその情報を伝送できるようにするために、圧縮アルゴリズムは概して、メカニズムを統合して符号器の出力において流量をほぼ一定に保持する。
【００１６】
非同期切換方法ＡＴＭを用いるネットワークは、異なる量のサービスで異なるタイプのトラヒック(traffic) を伝送することができるように設計されている。これらのネットワークは、４８オクテットのデータと５オクテットの見出し(heading) からなる小サイズのセルの伝送に基づいている。原則的に、この種のネットワークは時間に対して可変な流量に接続することができる。
【００１７】
圧縮画像データを伝送するために、符号器の出力における流量の変化が許容されるという事実が、変化する自然な画像の複雑さによりよく適用でき、従って、一定流量でのコーディングよりもよりビジュアルな質を高めることができる。
【００１８】
従って、本発明の適用分野は変化する流量での画像データをコーディングする分野である。
【００１９】
サービスの質は、画像を伝送するためのこれらの適用例におけるデータの損失及び伝送遅延の点でどうしても避けられないネットワークの傾向として捕えられる。例えば、広帯域ネットワークへのアクセスはトラヒック契約の原則とサービスの質の保証に基づいている。従って、ネットワークの設計はトラヒックの各タイプに適用された管理と資金の割当てのメカニズムを必要とし、これにはトラヒック・ディスクリプタによって規定された必要とされるサービスの質に要する資金の調整がなされる。この点において、トラヒック契約によって公表されたディスクリプタとの一致が実証されるように、ネットサークはビデオ符号器によって伝送されたトラヒックの連続監視を実行する。ユーザがそのトラヒック契約を越えた時に、この超過セルは拒絶される。
【００２０】
ピーク流量とは別にして、二つのパラメータが可変流量を伴うトラヒックのディスクリプタの一部として現在要求されている。即ち、維持された流量、又は、持続可能セル流量（Sustainable Cell Rate ：ＳＣＲ）及びジッター許容差又はバースト許容差（Burst Tolerance ：ＢＴ）である。正確な標準的なメカニズムであるリッキーバケットとして知られているメカニズムに基づいたＧＣＲＡとして公知のアルゴリズムが、これらのパラメータの制御を許容する。これらのパラメータとの一致は対応するリッキーバケットとの一致に相当する。二つのパラメータＳＣＲとＢＴはリッキーバケットの二つのパラメータに対応する。従って、情報のいかなるロスもなくトラヒック圧縮に応じて持続するために符号器の出力において流量の制限を監視しこれを可能にするための符号器に制御機構があることが重要である。
【００２１】
圧縮フラックスの伝送に使用されるネットワークが、一定流量で接続がなされると、符号器の出力流量が一定に維持されるのを保証するのにアルゴリズムを制御する流量が使用されなければならない。この方法は量子化パラメータＱを一つの画像から他の画像に、また、同じ画像内で一定流量の強制を満足するように変えることからなる。このタイプのアルゴリズムに使用される原則は、符号器とネットワーク・チャネル間に維持され、このチャネルにあるバッファに圧縮データが記録される。このバッファはネットワーク・チャネルの流量をずっと空にする。流量制御アルゴリズムはバッファがオーバーフローしたり、又は空になったりするのを回避しなければならない。量子化パラメータＱは、バッファの充填率に比例するように変化する。このコーディングの欠点は、全てのシーンに対して同じ流量を発生し、これによって異なる視覚上の特性を有するように強要することである。
【００２２】
符号器の出力において演繹的に特定された流量に等しくなるように流量を許容する制御アルゴリズムに関する記述の一例は、規格Ｍｐｅｇによって与えられる。
【００２３】
量子化パラメータが全ビデオ・シーケンス中ずっと一定であれば、符号器の出力における流量は変化する。符号器は開ループで関数化されると言われる。
【００２４】
本発明の目的は、リッキーバケットのバージョン(version) と一致するビデオ符号器の出力流量を制御するための方法を提供することである。
【００２５】
この種の方法は既に公知であって、1992年12月発行のジャーナルIＥＥＥのビデオ技術、２５４）に関する回路及びシステムの報告361-371 頁に見られるＡ．Ｒ．Ｒｅiｂｍａｎ及びＢ．Ｇ．Ｈａｓｋｅｌｌによる「ＡＴＭネットワークの可変ビット・レート・ビデオ」と称する文献を参照できる。この文献において、ＲｅiｂｍａｎとＨａｓｋｅｌｌはバッファを備えたビデオ符号器及びネットワークに伝送される流量を制御するように設計された装置とを含んでいるシステムを紹介している。この方法を実行するために、彼らはリッキーバケットのバージョンを使用して、バッファ及びバケットの充填率に関する量子化パラメータＱを変化させた。より詳しく説明すると、リッキーバケットはその大きさがＭ、またその漏れ率(leakage rate)をトラヒックの平均所望流量に等しくなるように考慮されている。Ｘ（ｔ）をある瞬時ｔにおけるバケットの充填とし、Ｂd ｍａｘをデコーダーのバッファの最大サイズ、Ｂd （ｔ）をある時間ｔにおけるそのサイズとし、更に瞬時ｔにおいてある画像を瞬時ｔ＋Ｔでデコードされるべく実行してコーディングしたい場合に、量子化パラメータＱは、バケットの充填とデ符号器のバッファとに比例して使用される。この結果、流量が量子化パラメータに反比例することになり、従って、バケットとバッファがもっといっぱいになればなるほど、発生される流量がますます少なくなる。これによってネットワークに伝送されるべき流量として許容された最大値内に流量を保持することができる。
量子化パラメータＱは次式で与えられる。
【数１】

ここで、IＮＴは「全体の部分」を表す。
【００２６】
この第１式から始めると、Ｒｅiｂｍａｎは量子化パラメータＱをプリフィックスの付いた値Ｑｍiｎによって換算するように処理し、量子化パラメータＱの低すぎる値がバケットを必要以上に充填される極めて重要な流量を発生させることを回避する。
【数２】

【００２７】
このアルゴリズムの欠点は、量子化パラメータＱの選択がバケットの充填に依存しているだけで、進行中のシーンの複雑さが考慮されていないことである。実際において、バケットが空であれば、たとえ画像がまったくインアクティブであり、かつ、平均値の流量よりも低い伝送流量を満足することができれば、アルゴリズムは画像の流量を増大する。従って、バケットは生じた高い流量のためにいっぱいにされるが、これがインアクティブであればシーンの特性が改良されるように高められることはない。バケットがいっぱいであるという事実のために次のシーンが強制されることになり平均流量が発生し、或いは、このシーンがアクティブなシーンであるより低い流量であれば、画像は劣化する結果となることは明白である。
【００２８】
更に、ＲｅiｂｕｍａｎとＨａｓｋｅｌｌによって説明されたアルゴリズムは、符号器のバッファ及び制御工程のバケットの制御を許容するが、シーンの複雑さに関する流量の分布を監視することでは満足できない。
【００２９】
【発明が解決しようとする課題】
本発明の目的は、この欠点を改善することにあり、従って、シーンの複雑さを考慮しながらバケットの非オーバーフロー状態を維持した流量に制御する方法を提供することである。
【００３０】
【課題を解決するための手段】
この目的を達成するために、本発明は画像シーケンスを表すディジタル・データの符号器の出力流量を制御する方法を提供する。前記符号器によって実行される符号器化には量子化パラメータＱの量子化工程を含んでおり、前記画像シーケンスは連続する一連の画像を形成する。前記工程は、符号器の出力において画像のi番目のグループの存在する時点で、画像の（i＋１）番目のグループをコーディングするための量子化パラメータＱ（i＋１）を決定することからなり、これによって前記符号器の出力における流量はサイズＭ及び漏れ率λとによって規定されたリッキーバケットのバージョンと一致する。
【００３１】
特徴とするところは、画像のi番目のグループによって表されたシーンのアクティビティの点から画像の（i＋１）番目のグループのコーディングのために、前記量子化パラメータＱ（i＋１）を決定することからなり、開ループがリッキーバケットの漏れ率λよりも大きい時に、画像の前記i番目のグループのシーンをアクティブであると呼び、また、これが小さい時にインアクティブという。選択された一定量子化パラメータＱｏで量子化されその画像の前記ブロックの属する画像の全シーケンスに渡たる平均流量Ｄが、前記リッキーバケットの漏れ率に等しければ、画像のある一つのグループの開ループの前記流量が、前記符号器の出力において保有される画像の前記ブロックの流量となる。
【００３２】
都合のよいことに、量子化パラメータＱ（i＋１）が次のように決定されることを含んでいる。即ち、符号器の出力における流量が、アクティブなシーンの場合においては、バケットの充填率がゼロの場合の開ループ内の流量に等しいか、又はバケットの充填率が前記バケットの最高充填率に等しい時に、前記リッキーバケットの漏れ率に等しいか、前記バケットの充填率がその最高充填率よりも低い非ゼロ値となる時に、開ループの流量と漏れ率との間に含まれる値に等しくなるように、更にインアクティブなシーンの場合においては、バケットの充填率がゼロの時に、前記リッキーバケットの漏れ率に等しいか、又はバケットの充填率が前記バケットの最高充填率に等しい時に開ループ内の流量に等しいか、或いは前記バケットの充填率がその最高充填率よりも低い非ゼロ値となる時に漏れ率と開ループ内の流量との間に含まれる値に等しくなる。
【００３３】
都合のよいことに、量子化パラメータが次の計算によって決定されることを含んでいる。即ち、アクティブなシーンの場合においては、変数としてリッキーバケットの充填率を、また、パラメータとして前記バケットの漏れ率と前記バケットの最高充填率及び所定の量子化パラメータとを有する関数を計算し、また、インアクティブなシーンの場合においては、同じ変数と同じパラメータとを有する他の関数を計算する。
【００３４】
符号器の出力における流量が次のように等しくなるように量子化パラメータを決定することからなる。即ち、アクティブなシーンの場合においては、開ループ内の流量がバケットの充填率のゼロ値に等しくなる値となるリッキーバケットの充填率を変数として有する連続減少関数(continuous decreasing function)ｆの計算結果と、また、前記バケットの最高充填率に等しいバケットの充填率の値となる前記リッキーバケットの漏れ率に等しい値と、更に開ループの流量と充填率の中間値としての漏れ率との間に含まれる値に等しくなるように、また、インアクティブなシーンの場合においては、バケットの充填率のゼロ値となる前記リッキーバケットの漏れ率に等しい値か、或いは前記バケットの最高充填率に等しいバケットの充填率の値としての開ループ内の流量に等しい値か、更に漏れ率と充填率の中間値として開ループ内の流量との間に含まれる値に等しい値をとるリッキーバケットの充填率を変数として有する連続減少関数ｇの計算結果に等しくなるようにする。
【００３５】
【発明の実施の形態】
本発明のこれまでに説明した特性をはじめ他の特性についても実施例の次なる説明を読むことによって明確となろう。前記説明は添付の図面を参照して行う。
【００３６】
本発明の実際の説明をする前に、トラヒック及びリッキーバケットのバージョンとの一致の概念を規定する。
【００３７】
符号器の出力トラヒックはこれがその出力に伝送する一連の画像を基準にして規定される。｛Ｇ｝と書かれるこのトラヒックはビデオ・シーケンスのi番目のグループ画像の圧縮によって発生されたビット数を計測するシーケンス数Ｇ（i）によって規定される。各グループの画像の周期はτと書かれる。ｎ番目グループの画像に等しいサイズのビデオ・シーケンスを越える平均流量Ｄは次式で規定される。
【数３】

【００３８】
リッキーバケットのバージョンは、数種の方法で全て同じものを表すように規定できる。二つのパラメータがリッキーバケットを規定する働きをする。即ち、Ｍ（ビットによる）で表されるバケットのサイズとλ（１秒当たりのビットによる）で表される漏れ率である。トラヒック｛Ｇ｝は、次式を立証できれば、パラメータＭ及びλのリッキーバケットのバージョンと一致する。
【数４】

【００３９】
【実施例】
ここで詳細に説明すると、本発明による工程を概略的に示した図１について検討する。図１は符号器１０を示し、この符号器がその入力に現れるビデオ・シーケンスのコーディングを保証し、各ビデオ・シーケンスにおいて１からｎまで変化するインデックスが各々付けられた画像の連続するブロックを出力する。ここでｎは前記シーケンスの画像のグループ数である。従って、一つのシーケンスの画像のi番目のブロックはインデックスiを有する。コーディングはＱ（i）で表わされる量子化パラメータを有する画像の各ブロックの量子化によって実行され、かつ、Ｇ（i）で表される画像のこのブロックに対するビット率を発生する。
【００４０】
更に、図１にリッキーバケット２０を概略的に示す。その入力２１で流量Ｇ（i）を有する画像の各グループを入力する。このリッキーバケット２０は二つのパラメータによって規定される。即ち、Ｍ（ビットによる）で表わされるサイズ及びλ（１秒当たりのビットによる）で表される漏れ率である。その入力に現れる流量Ｇ（i）の値に関して、サイズＭのパラメータと漏れ率のパラメータλにより、リッキーバケット２０が画像のi番目のブロックの瞬時におけるバケット２０のビット数に対応してＸ（i）で示された情報の項が算出される。
【００４１】
図１において、本発明の工程を実行する制御装置３０を更に示す。画像のi番目のブロックを処理する瞬時において、その入力にバケット２０に現れるビット数に関する情報Ｘ（i）を受信し、また、符号器１０の出力にビット率Ｇ（i）の値も受信する。制御装置３０は符号器１０に量子化パラメータＱ（i＋）の値を出力し、後者が処理中ビデオ・シーケンスの（i＋１）番目の画像ブロックに印加される。
【００４２】
説明の途中で明白となろうが、符号器１０で予め定められた一定の量子化パラメータＱｏで量子化されれば、本発明の工程は流量Ｇｏ（i）がi番目の画像ブロックとなる流量によって評価された値を必要とする。パラメータＱｏは、全ビデオ・シーケンスに渡りその平均流量Ｄにおいて各グループの画像がその一定パラメータＱｏで量子化されるように選ばれなければならない。この一定パラメータはバケット２０の漏れ率λに等しい。従って、次式を証明するＤを得る:
【数５】

【００４３】
従って、符号器１０は開ループの関数と呼ばれる。各流量の値Ｇｏ（i）は符号器１０によって与えられるか、又は、本発明の特定する実施例に示すように、制御装置３０によって計算される。
【００４４】
本発明の目的は、開ループ内でのコーディングによって提供される最も近い可能性のある特性を維持することである。ここで開ループ内のコーディングによって生じたトラヒックはリッキーバケットＬＢ（Ｍ，λ）のバージョンとの一致を保証し、これは流量として限定されないからである。
【００４５】
一般的に、アクティブなシーンはバケットを満たす傾向を有している。これは当然開ループ中で平均流量Ｄよりも大きいバケットの漏れ率λに等しい流量が発生するからである。他方において、低いアクティビティのシーンはバケットを空にする傾向にある。これは漏れ率λよりも大きい流量が発生するからである。アクティブなシーンが非常に長い場合、Ｍ容量を有するバケットがオーバーフローする。
【００４６】
この問題を解決するために、本発明は量子化パラメータＱを操作して流量に関するこの強制(constraint)を満足するようにする。しかし、帰還口の利得率はアリゴリズムの利得率よりもずっと低く、符号器の出力における流量は一定に保持される。
【００４７】
ここで二つの極端な場合について考察してみる。即ち、一方においてバケットがいっぱい（Ｘ（i）＝Ｍ）、他方においてバケットが空（Ｘ（i）＝０）の場合である。
【００４８】
最初の場合において、シーンがアクティブな時、即ち、Ｇｏ（i）＞λの時、量子化因子Ｑ（i＋１）は、流量Ｇ（i＋１）がバケットの漏れ率λに等しくなるように選ばれる。シーンがインアクティブな時、即ち、Ｇｏ（i）＜λの時、選ばれた量子化因子Ｑ（i＋１）は開ループの因子、つまり、Ｑｏとなる。従って、流量Ｇ（i）は開ループの流量Ｇｏ（i）に等しくなる。
【００４９】
従って、バケットがいっぱいの時、アクティブなシーンは流量λを越えず、バケットはオーバーフローしない。インアクティブなシーンに関する限り、これらのシーンは開ループ中でコーディングされ、その低い流量がバケットを空にせしめる。従って、目に見える特性はアクティブなシーンについては一定流量で少なくともコーディングされ、インアクティブなシーンについては開ループ内でコーディングされるのと同然に処理される。
【００５０】
第２の場合（Ｘ（i）＝０）において、シーンがアクティブな時に、即ち、Ｇｏ（i）＞λの時、量子化因子Ｑ（i＋１）＝Ｑｏが選ばれ、流量Ｇ（i＋１）が得られるようにされ、この流量は開ループ流量、即ち、Ｇｏ（i）に等しい。他方において、シーンがインアクティブな時、即ち、Ｇｏ（i）＜λの時、選ばれた量子化因子Ｑ（i＋１）はバケットの漏れ率に等しい、即ち、λに等しい流量Ｇ（i）が得られることが許容される。
【００５１】
従って、バケットが完全にいっぱいでない場合に、インアクティブなシーンにおける画像グループiの特性が、流量λよりも低く発生された開ループコーディング自体によって得られたものと少なくとも同じである。他方、アクティブなシーンはλよりも大きい流量を発生し、従って、バケットがいっぱいにされる。
【００５２】
下表はこれら四つの条件をまとめたものである。量子化パラメータはＱ（i＋１）で示され、λに等しいi番目のブロック画像に対して流量Ｇ（i）が得られることが許容される。
【表１】

【００５３】
バケットの充填の値が中間である場合に、量子化パラメータＱ（i＋１）の選ばれた値は、アクティブなシーンの場合にはＧｏ（i）とλとの間に、またインアクティブな場合にはλとＧｏ（i）との間にそれぞれ含まれるように流量Ｇ（i）が得られることが許容される。次の関係式で表すことができる。
アクティブなシーンの場合
Ｇ（i）＝ｆ（Ｇｏ（i），λ，Ｘ（i））
ｆ（Ｇｏ（i），λ，０）＝Ｇｏ（i）
及びｆ（Ｇｏ（i），λ，Ｍ）＝λとする。
インアクティブなシーンの場合
Ｇ（i）＝ｇ（Ｇｏ（i），λ，Ｘ（i））
ｇ（Ｇｏ（i），λ，０）＝λ
及びｇ（Ｇｏ（i），λ，Ｍ）＝Ｇｏ（i）とする。
【００５４】
「レートゆがみ理論、データ圧縮のための数学的基本」と題する１９７１年、エングルウッド、クリフス、ニュージャージ：ＰｒｅｎｔiｖｃｅＨａｌｌでＴ．Ｂｅｒｇｅｒによるような画像を処理する理論によれば、現在流量の関数及び画像の歪みの関数は互いに相反する方向に変化しており、ビデオ・シーケンスの流量ー歪み関係はシーンのアクティビティに依存している。量子化パラメータＱは画像の歪みに直接関係していることが分かっている。実際に、その値が高くなればなるほど、画像はますます歪み、またこれと逆になる。従って、このことから量子化パラメータＱ及びこの量子化からの結果による流量Ｇは互いに逆の方向に変化することが推論できる。
【００５５】
パラメータＱと流量Ｇとを結ぶ関係は、簡単には定義できず、詳細な調査の対象になっている。しかし、全てのこの調査はアルゴリズムを一定流量でコーディングする必要があるためにマクロブックのスケールで有効となる厳密で正確な関係にある。
【００５６】
ここで本発明において、マクロブックのレベルでなはく、画像グループのレベルで作用する別のタイプの制御に関心が向けられている。従って、量子化パラメータＱと流量Ｇとを結ぶ関係は、そのどちらか一方が画像のグループと関連があれば、画像のグループ全体に渡り平均化され、より簡単に概算できる。これは画像内の細かい変化を最早考慮する必要がないからである。
【００５７】
実験的関数が量子化パラメータＱと流量Ｇとの間に設定される。これを実行するために、５００個の画像を収容しているビデオ・シーケンスがアルゴリズムＭｐｅｇー１を用いてＣIＦフォーマットに圧縮された。５個の開ループ圧縮が、量子化パラメータＱｏの５個の異なる値に対して実行され（量子化パラメータの値は一定で、かつ、Ｑｏに等しい）、また、別の５個の開ループ圧縮が一定平均流量Ｄの５個の値を有する流量値Ｇｏに対して実行された。
【００５８】
次表は開ループでのコーディングに対する流量平均と一定平均流量でコーディングされた量子化パラメータの平均とを示す。
【表２】

【００５９】
量子化パラメータＱの値と平均流量Ｄとの積は、２３±３％とほぼ一定であり、量子化パラメータＱによって求められた値だけでなくコーディングの特性（開ループ又は一定平均流量）とは無関係であることが分かる。
【００６０】
図２は画像数のに関してＤ×Ｑλ（i）の積及びＧｏ（i）×Ｑｏの積とによって与えられた値を示す。更に、これらの二つの積は全ての画像グループで等しく、従って、処理されるべき画像にのみ左右され、その変化はシーンのアクティビティを表す。
【００６１】
上述の説明から、次式が得られる。
【数６】

【００６２】
上式からＱ（i＋１）の値を与えられた帰納的関係が得られる。
Ｑ（i＋１）＝Ｑｏ×Ｇｏ（i）／Ｇ（i）
【００６３】
上式を頭に入れておいて、アクティブなシーンの場合には、
Ｑ（i＋１）＝Ｑｏ×Ｇｏ（i）／ｆ（Ｇｏ（i），λ，Ｘ（i））と書くことができる。
また、インアクティブなシーンの場合には、
Ｑ（i＋１）＝Ｑｏ×Ｇｏ（i）／ｇ（Ｇｏ（i），λ，Ｘ（i））と書くことができる。
【００６４】
注意しなければならないのは、関数ｆ（Ｇｏ（i），λ，Ｘ（i））及び
ｇ（Ｇｏ（i），λ，Ｘ（i））はパラメータＭ、λ及びＧｏ（i）又はＱｏの項（関数）、単独で表すことができるということである。
【００６５】
従って、関連するパラメータはλ、Ｍ及びＱｏであることが分かる。最初の二つのパラメータは、リッキーバケットのものであり、従って、ネットワーク圧縮と接続されているか、及び／又は所望の特性の画像と結合されているという理由に基づいて固定される。パラメータＱｏに関する限り、パラメータＱｏの開ループ・コーディングによって発生されたトラヒックの平均流量Ｄは正確にλに等しくなるように選ばれなければならない。
【００６６】
画像の任意のグループに用意された流量Ｇ（i）は、シーンのアクティビティだけでなくバケットＸ（i）の充填状態に依存する。安定性をはじめとし視覚的特性に関して本発明の処理の性能は、バケットＸ（i）の充填状態に伴って変化する流量Ｇ（i）に左右される。
【００６７】
特に有利である関数Ｘ（i）にＧ（i）の式を探してきた。図３はアクティブなシーンの場合とインアクティブなシーンの場合におけるＸ（i）に関するＧ（i）の変化のカーブを示す。これらのカーブの形状は、アクティブなシーン中バケットの充填を刺激し、またインアクティブなシーンの時、これを空にすべく激励するように選択される。実際において、Ｇｏ（i）＜λで識別された小さいアクティビティのシーンに対しては、半分充填されたバケットがそれでもほぼ満杯のように見なされる。従って、このシーンの画像のグループによって発生された流量は、Ｇｏ（i）に接近しており、バケットがもっと早く空になる。これとは逆に、Ｇｏ（i）＞λで識別される極めてアクティブなシーンに対しては、半分充填されたバケットはほぼ空のように見なされる。従って、発生された流量は、このシーンの視覚的な特性をバケットのサイズの限度内でできるだけ可能な長時間維持するようには制限されない。従って、Ｇ（i）の割り当ては次のように書くことができる。
【数７】

ここで、ｘ＝Ｘ（i）／Ｍはバケットの標準充填を表す。
【００６８】
図４は関数εｋ（ｘ）を示す。
選ばれた陽関数は次式である。
【数８】

【００６９】
これらの式をＱ（i＋１）で与えられるように変換すると、Ｇｏ（i）＞λであれば次式が得られる。
【数９】

また、Ｇｏ（i）≦λであれば次式が得られる。
【数１０】

ここで、Ｇｏ（i）＝Ｇ（i）Ｑ（i）／Ｑｏであり、ｘ＝Ｘ（i）／Ｍである。
【００７０】
上述のアルゴリズムは、カリフォルニア大学バークレイ校によって流通されたコーディング・ソフトＭｐｅｇに注入され、試験される。
【００７１】
２０００個の画像シーケンスが、一方で３５に等しい一定量子化パラメータを用いて開ループでコーディングされ、他方で１８個の画像を記憶する平均サイズと量子化パラメータＱｏ＝３５と等価なパラメータλ＝０．７８Ｍｂiｔｓ／ｓとＭ＝５６４７１０ビットによる本発明のアルゴリズムを用いてコーディングされた。各画像のグループのサイズは１２画像である。
【００７２】
図５はこれら二つのコーディングによってそれぞれ発生された流量を示す。この図から本発明のアルゴリズムは極めてアクティブなシーン（画像１から１５０及び９００から１０００）に対する開ループコーディングよりもトラヒックが少なく、またインアクティブなシーン（例えば画像２００から３００及び１４００から１５００参照）に対するコーディングよりもトラヒックが多く発生されることが分かる。従って、流量の変化性はシーンの複雑さを維持し、これに比例する。バケットＸ（i）の充填率における変化を図６に示す。バケットの充填力学が表していることは、インアクティブなシーン中バケットが空になり、アクティブなシーン中これがいっぱいになり、これによって視覚的特性がよりよくなるといった本発明のアルゴズムのこの点で許容された変化性が完全に改善されることである。この特性は従来技術のアルゴリズムによっては達成できない。
【図面の簡単な説明】
【図１】本発明による工程のブロック図である。
【図２】Ｇを次に規定する流量とした時に積Ｇ×Ｑの一定値を見ることができる二つの曲線を示すグラフである。
【図３】リッキーバケットの充填率に関する符号器の出力での流量変化を、アクティブなシーンとインアクティブなシーンについて表す二つの曲線を示す。
【図４】本発明の工程によって使用される関数を表すグラフである。
【図５】本発明の工程の効率を表すグラフである。
【図６】画像の任意のシーケンスのための画像番号に関するリッキーバケットの充填率の変化を示すグラフである。

Claims

画像シーケンスを表すディジタルデータの符号器の出力流量制御方法であって、前記符号器は量子化パラメータＱを含む量子化段階を含み、前記画像シーケンスは、連続する画像グループで構成され、
前記制御方法は、画像の（ i ＋１）番目のグループをコーディングするための量子化パラメータＱ（ i ＋１）をセットすることにより、前記符号器の出力における流量が、サイズＭと漏れ率λとによって規定されたリッキーバケットのバージョンと一致するステップと、及び、
画像の i 番目のグループによって表されたシーンのアクティビティの点から画像の（ i ＋１）番目のグループのコーディングのために、前記量子化パラメータＱ（ i ＋１）をセットし、その開ループ流量がリッキ−バケットの漏れ率λよりも大きい時に、画像の前記 i 番目のシーンがアクティブであるとされ、またこれよりも小さい時はインアクティブであるとされ、一定量子化パラメータＱｏで量子化され前記画像のシーンが属する全画像シーケンスに渡る平均流量Ｄが前記リッキ−バケットの漏れ率に等しければ、画像の前記グループの前記開ループの流量は、前記画像のシーンが前記符号器の出力において保有される流量となる前記量子化パラメータＱ（ i ＋１）を有するステップを含む、
ディジタルデータの符号器の出力流量制御方法。
前記量子化パラメータＱ（ i ＋１）をセットするステップが、
アクティブなシーンにおいては、
（ａ）バケットの充填率がゼロの時に開ループ内の流量に等しいか、
（ｂ）バケットの充填率が前記バケットの最高充填率に等しい時に、前記リッキ−バケットの漏れ率に等しいか、或いは、
（ｃ）前記バケットの充填率がその最高充填率よりも低い非ゼロ値となる時に開ループの流量と漏れ率との間の値と等しい
前記符号器の出力における流量を有し、更に、
インアクティブなシーンにおいては
（ｄ）バケットの充填率がゼロの時に、前記リッキ−バケットの漏れ率に等しいか、
（ｅ）バケットの充填率が前記バケットの最高充填率に等しい時に開ループ内の流量に等しいか、或いは、
（ｆ）前記バケットの充填率がその最高充填率よりも低い非ゼロ値となる時に漏れ率と開ループ内の流量との間に含まれる値と等しい
前記符号器の出力における流量を有する
請求項１記載の方法。
（ａ）リッキーバケットＸ（ i ）の充填率と等しいアクティブなシーンの変数と、
（ｂ）前記バケットの漏れ率λによるパラメータと、
（ｃ）前記バケットＭの最高充填率、及び、
（ｄ）前記一定量子化パラメータＱｏ
を有する関数を計算することによって、アクティブなシーンの量子化パラメータがセットされるステップと、
同じ変数とパラメータとを有する他の関数を用いることによりインアクティブなシーンの量子化パラメータがセットされるステップとを有する
請求項１または２記載の方法。
（ a ）前記リッキ−バケットの充填レベルに対応した変数を有する連続減少関数ｆの計算結果と前記符号器の出力でのアクティブなシーンの流量Ｇ（ i ）が等しく、
前記リッキ−バケットが、
（ i ）前記バケットＸ（ i ）の充填レベルに対応するゼロ値に対する開ループの流量に等しい値と、
（ ii ）前記バケットの最高充填レベルに等しい前記バッケトの充填レベルにたいする前記リッキ−バケットの漏れ率λに等しい値と、
（ iii ）前記充填レベルの中間値に対する前記開ループの流量及び前記漏れ率の間に含まれる値、を取る量子化パラメーター、及び、
（ b ）前記リッキ−バケットの充填レベルに対応した変数を有する連続減少関数ｆの計算結果と、前記符号器の出力でのインアクティブなシーンの流量Ｇ（ i ）が等しく、
前記リッキ−バケットが、
（ i ）充填レベルのゼロ値に対して前記リッキ−バケットの漏れ率λに等しい値と、
（ ii ）前記バケットの最高充填レベルに等しい前記バッケトの充填レベルの値に対する開ループの流量Ｇｏ（ i ）に等しい値と、
（ iii ）充填レベルＸ（ i ）の中間値として前記開ループの流量及び前記漏れ率の間に含まれる値、を取る量子化パラメーター、
をセットするステップを有する請求項１または２記載の方法。
Ｇｏ（ i ）は開ループの流量、及び（ i ）は画像のグループであって、
次の関数、
a)アクティブなシーンの場合において、
Ｑ（i＋１）＝Ｑ×Ｇｏ（i）／ｆ（Ｇｏ（i），λ，Ｘ（i））
b)インアクティブなシーンの場合において、
Ｑ（i＋１）＝Ｑ×Ｇｏ（i）／ｇ（Ｇｏ（i），λ，Ｘ（i））
の計算によって量子化パラメータを決定することからなることを特徴とする請求項４記載の方法。
バケットの充填率に伴って値が減少する導関数ｆを有し、また前記バケットの充填率に伴って値が減少する関数ｇを有することを特徴とする請求項４記載の方法。
バケットの充填率に伴って値が減少する導関数ｆを有し、また前記バケットの充填率に伴って値が減少する関数ｇを有することを特徴とする請求項５記載の方法。
ε 1 （ｘ）及びε 2 （ｘ）は、任意の関数、及びｘは前記バケット及び前記バケットのサイズにおいて存在するビットの数に関する情報に基づいてバケットの充填を限定し、
関数ｆが、
ｆ＝Ｇｏ（ i ）（１−ε 1 （ｘ））＋λε 1 （ｘ））
及び関数ｇが、
ｇ＝λ（１−ε 2 （ｘ））＋Ｇｏ（ i ）ε 2 （ｘ））
と書かれることを特徴とする請求項６記載の方法。
ε 1 （ｘ）及びε 2 （ｘ）は、任意の関数、及びｘは前記バケット及び前記バケットのサイズにおいて存在するビットの数に関する情報に基づいてバケットの充填を限定し、
関数ｆが、
ｆ＝Ｇｏ（ i ）（１−ε 1 （ｘ））＋λε 1 （ｘ））
及び関数ｇが、
ｇ＝λ（１−ε 2 （ｘ））＋Ｇｏ（ i ）ε 2 （ｘ））
と書かれることを特徴とする請求項７記載の方法。