JP3954136B2 - 画像シーケンスを表すディジタルデータの符号器の出力流量制御方法 - Google Patents

画像シーケンスを表すディジタルデータの符号器の出力流量制御方法 Download PDF

Info

Publication number
JP3954136B2
JP3954136B2 JP17020696A JP17020696A JP3954136B2 JP 3954136 B2 JP3954136 B2 JP 3954136B2 JP 17020696 A JP17020696 A JP 17020696A JP 17020696 A JP17020696 A JP 17020696A JP 3954136 B2 JP3954136 B2 JP 3954136B2
Authority
JP
Japan
Prior art keywords
bucket
rate
flow rate
equal
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP17020696A
Other languages
English (en)
Other versions
JPH0937253A (ja
Inventor
ハムディ マーエル
ロラン ピエール
ロベール ジェームズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of JPH0937253A publication Critical patent/JPH0937253A/ja
Application granted granted Critical
Publication of JP3954136B2 publication Critical patent/JP3954136B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は一連の画像を表すディジタルデータの符号器(coder) の出力流量を制御する方法に関する。本発明の分野はマルチメディアの適用にあり、特に例えば記録されるか又は実時間によるMpeg−2として一般的に知られている規定されたアルゴリズムに基づいて圧縮されたアニメ化画像のATMタイプの高定格ネットワークによる伝送に適用される。
【0002】
【従来の技術】
ビデオ圧縮はアニメ化画像(animated image)を特徴付ける情報の冗長性を処理することに基づいている。情報の冗長性には二つの形態、即ち、空間的及び時間的なものがる。空間的冗長性は同じ画像内に存在し、更に、画像の近接画素が輝度、及び/又はクロミナンス(chrominance) の極めて接近した値を有する傾向にあるという事実である。時間的冗長性に関しては、連続画像間に存在し、また、二つの近接する画像中の同じ位置を有する画素が輝度、及び/又はクロミナンスの極めて接近する値を有する傾向にあるという事実である。
【0003】
説明中において、空間的相関と直接関連する大きさを空間的アクティビティ又は空間的な複雑性と呼ぶことにする。空間的複雑性が大きい時は、相関関係が小さくまたこれとは逆になる。実際にビデオ圧縮は、冗長性を処理して基本ビデオ信号よりも少ないデータ量を生成するコーディング(coding)技術からなる。
【0004】
多数のリサーチ操作は、その特性が相当異なる画像を圧縮するためのアルゴリズムとなる。それでも全ての場合において、圧縮画像は少なからず重要なサイズを有するとともに画像毎に変化する構成ブロックに形成されている。
【0005】
空間的冗長性の縮小は量子化段階で実質上実行される。画像の各ブロックに対してコサインへの個別の変換が実行された後、得られた係数が量子化マトリックスによって与えられた整数値で割算される。この整数除法は、ハフマン符号(Huffman coding)の後を表すのもではないゼロの値の数を増やす目的を有している。この整数除法のために、この操作はエラーを記憶値に導入する。多少大きめの圧縮を実行するために、量子化マトリックスが量子化パラメータ(普通Qで表わされる)として知られた係数で重り付けされる。このパラメータの値が大きくなればなるほど、縮小利得の重要性がますます高くなり、又は、この逆となる。従って、記憶画像の視覚上の低下に対する量子化パラメータのインパクトは、画像の空間的複雑さに左右される。換言すれば、等価な視覚上の質をもたせるためには、多数の小さいディテールを含んでいる画像が圧縮される時に使用される量子化パラメータは、比較的均一な画像を圧縮するのに使用される量子化パラメータよりも小さい。
【0006】
同様にして、一定流量にするために、多数の小さいディテールを含んでいる画像が圧縮される時に使用される量子化パラメータは、比較的均一な画像の圧縮に使用される量子化パラメータよりも大きい。
【0007】
最後に、一定値の量子化パラメータのために、強い空間的複雑性又は大きい空間的アクティビティを有する画像の圧縮は、空間的複雑性の小さい画像を圧縮するよりもより多くのデータを生成する。
【0008】
時間的冗長性を減少させるのに使用される技術は、運動の推定と補償である。連続する画像中の一つの画像の各ブロック又はマクロブロックの位置を決定することに問題がある。連続する画像中のサーチ窓の大きさは、計算の複雑さの事実によって限定される。サーチされるマクロブロックがサーチ窓で見つかれば、運動ベクトルはマクロブロックの運動を表すものとして規定される。これが運動の推定である。
【0009】
概して、見つかったマクロブロックは元のマクロブロックとぴったり一致せず一つのエラー毎に数画素だけ異なる。従って、このエラーの修正は二つのマクロブロック間の画素によって異なる画素をコーディングすることで実行される。これが運動の補償である。
【0010】
マクロブロックがサーチ窓で見つからなければ、既に説明したように転換と量子化によってコーディングされる。
【0011】
従って、時間的複雑さが大きければ、即ち、一つの画像から他の画像へのマクロブロックの運動が、例えば時間経過によるシーンの変化がある時に、カメラ等の高速ズームが相当大きければ、運動ベクトルの推定が不能になり、また、大量のデータがシーンのコーディングのために発生される。
【0012】
一つのシーンはビデオ・シーケンス内で多少同じ内容を有する連続した画像である。このシーンには、例えば、静止した背景の前方で話をしている人物とか、或いは静止したショット(shot)などを含んでいる。
【0013】
説明中において、空間的及び時間的にかなり複雑なシーンであり、従って、その伝送に全ビデオ・シーケンスを伝送するのに平均流量より多い流量を必要とするシーンはアクティブなシーンと呼ばれる。他方において、空間的及び時間的にあまり複雑でないシーンであり、従って、その伝送に全ビデオ・シーケンスを伝送するのに平均流量より少ない流量を必要とするシーンはインアクティブなシーンと呼ばれる。
【0014】
ここで、流量とは単位時間あたりに伝送されるデータの量である。
【0015】
一定流量でネットワーク・サービスによりその情報を伝送できるようにするために、圧縮アルゴリズムは概して、メカニズムを統合して符号器の出力において流量をほぼ一定に保持する。
【0016】
非同期切換方法ATMを用いるネットワークは、異なる量のサービスで異なるタイプのトラヒック(traffic) を伝送することができるように設計されている。これらのネットワークは、48オクテットのデータと5オクテットの見出し(heading) からなる小サイズのセルの伝送に基づいている。原則的に、この種のネットワークは時間に対して可変な流量に接続することができる。
【0017】
圧縮画像データを伝送するために、符号器の出力における流量の変化が許容されるという事実が、変化する自然な画像の複雑さによりよく適用でき、従って、一定流量でのコーディングよりもよりビジュアルな質を高めることができる。
【0018】
従って、本発明の適用分野は変化する流量での画像データをコーディングする分野である。
【0019】
サービスの質は、画像を伝送するためのこれらの適用例におけるデータの損失及び伝送遅延の点でどうしても避けられないネットワークの傾向として捕えられる。例えば、広帯域ネットワークへのアクセスはトラヒック契約の原則とサービスの質の保証に基づいている。従って、ネットワークの設計はトラヒックの各タイプに適用された管理と資金の割当てのメカニズムを必要とし、これにはトラヒック・ディスクリプタによって規定された必要とされるサービスの質に要する資金の調整がなされる。この点において、トラヒック契約によって公表されたディスクリプタとの一致が実証されるように、ネットサークはビデオ符号器によって伝送されたトラヒックの連続監視を実行する。ユーザがそのトラヒック契約を越えた時に、この超過セルは拒絶される。
【0020】
ピーク流量とは別にして、二つのパラメータが可変流量を伴うトラヒックのディスクリプタの一部として現在要求されている。即ち、維持された流量、又は、持続可能セル流量(Sustainable Cell Rate :SCR)及びジッター許容差又はバースト許容差(Burst Tolerance :BT)である。正確な標準的なメカニズムであるリッキーバケットとして知られているメカニズムに基づいたGCRAとして公知のアルゴリズムが、これらのパラメータの制御を許容する。これらのパラメータとの一致は対応するリッキーバケットとの一致に相当する。二つのパラメータSCRとBTはリッキーバケットの二つのパラメータに対応する。従って、情報のいかなるロスもなくトラヒック圧縮に応じて持続するために符号器の出力において流量の制限を監視しこれを可能にするための符号器に制御機構があることが重要である。
【0021】
圧縮フラックスの伝送に使用されるネットワークが、一定流量で接続がなされると、符号器の出力流量が一定に維持されるのを保証するのにアルゴリズムを制御する流量が使用されなければならない。この方法は量子化パラメータQを一つの画像から他の画像に、また、同じ画像内で一定流量の強制を満足するように変えることからなる。このタイプのアルゴリズムに使用される原則は、符号器とネットワーク・チャネル間に維持され、このチャネルにあるバッファに圧縮データが記録される。このバッファはネットワーク・チャネルの流量をずっと空にする。流量制御アルゴリズムはバッファがオーバーフローしたり、又は空になったりするのを回避しなければならない。量子化パラメータQは、バッファの充填率に比例するように変化する。このコーディングの欠点は、全てのシーンに対して同じ流量を発生し、これによって異なる視覚上の特性を有するように強要することである。
【0022】
符号器の出力において演繹的に特定された流量に等しくなるように流量を許容する制御アルゴリズムに関する記述の一例は、規格Mpegによって与えられる。
【0023】
量子化パラメータが全ビデオ・シーケンス中ずっと一定であれば、符号器の出力における流量は変化する。符号器は開ループで関数化されると言われる。
【0024】
本発明の目的は、リッキーバケットのバージョン(version) と一致するビデオ符号器の出力流量を制御するための方法を提供することである。
【0025】
この種の方法は既に公知であって、1992年12月発行のジャーナルIEEEのビデオ技術、254)に関する回路及びシステムの報告361-371 頁に見られるA.R.Reibman及びB.G.Haskellによる「ATMネットワークの可変ビット・レート・ビデオ」と称する文献を参照できる。この文献において、ReibmanとHaskellはバッファを備えたビデオ符号器及びネットワークに伝送される流量を制御するように設計された装置とを含んでいるシステムを紹介している。この方法を実行するために、彼らはリッキーバケットのバージョンを使用して、バッファ及びバケットの充填率に関する量子化パラメータQを変化させた。より詳しく説明すると、リッキーバケットはその大きさがM、またその漏れ率(leakage rate)をトラヒックの平均所望流量に等しくなるように考慮されている。X(t)をある瞬時tにおけるバケットの充填とし、Bd maxをデコーダーのバッファの最大サイズ、Bd (t)をある時間tにおけるそのサイズとし、更に瞬時tにおいてある画像を瞬時t+Tでデコードされるべく実行してコーディングしたい場合に、量子化パラメータQは、バケットの充填とデ符号器のバッファとに比例して使用される。この結果、流量が量子化パラメータに反比例することになり、従って、バケットとバッファがもっといっぱいになればなるほど、発生される流量がますます少なくなる。これによってネットワークに伝送されるべき流量として許容された最大値内に流量を保持することができる。
量子化パラメータQは次式で与えられる。
【数1】
Figure 0003954136
ここで、INTは「全体の部分」を表す。
【0026】
この第1式から始めると、Reibmanは量子化パラメータQをプリフィックスの付いた値Qminによって換算するように処理し、量子化パラメータQの低すぎる値がバケットを必要以上に充填される極めて重要な流量を発生させることを回避する。
【数2】
Figure 0003954136
【0027】
このアルゴリズムの欠点は、量子化パラメータQの選択がバケットの充填に依存しているだけで、進行中のシーンの複雑さが考慮されていないことである。実際において、バケットが空であれば、たとえ画像がまったくインアクティブであり、かつ、平均値の流量よりも低い伝送流量を満足することができれば、アルゴリズムは画像の流量を増大する。従って、バケットは生じた高い流量のためにいっぱいにされるが、これがインアクティブであればシーンの特性が改良されるように高められることはない。バケットがいっぱいであるという事実のために次のシーンが強制されることになり平均流量が発生し、或いは、このシーンがアクティブなシーンであるより低い流量であれば、画像は劣化する結果となることは明白である。
【0028】
更に、ReibumanとHaskellによって説明されたアルゴリズムは、符号器のバッファ及び制御工程のバケットの制御を許容するが、シーンの複雑さに関する流量の分布を監視することでは満足できない。
【0029】
【発明が解決しようとする課題】
本発明の目的は、この欠点を改善することにあり、従って、シーンの複雑さを考慮しながらバケットの非オーバーフロー状態を維持した流量に制御する方法を提供することである。
【0030】
【課題を解決するための手段】
この目的を達成するために、本発明は画像シーケンスを表すディジタル・データの符号器の出力流量を制御する方法を提供する。前記符号器によって実行される符号器化には量子化パラメータQの量子化工程を含んでおり、前記画像シーケンスは連続する一連の画像を形成する。前記工程は、符号器の出力において画像のi番目のグループの存在する時点で、画像の(i+1)番目のグループをコーディングするための量子化パラメータQ(i+1)を決定することからなり、これによって前記符号器の出力における流量はサイズM及び漏れ率λとによって規定されたリッキーバケットのバージョンと一致する。
【0031】
特徴とするところは、画像のi番目のグループによって表されたシーンのアクティビティの点から画像の(i+1)番目のグループのコーディングのために、前記量子化パラメータQ(i+1)を決定することからなり、開ループがリッキーバケットの漏れ率λよりも大きい時に、画像の前記i番目のグループのシーンをアクティブであると呼び、また、これが小さい時にインアクティブという。選択された一定量子化パラメータQoで量子化されその画像の前記ブロックの属する画像の全シーケンスに渡たる平均流量Dが、前記 ッキーバケットの漏れ率に等しければ、画像のある一つのグループの開ループの前記流量が、前記符号器の出力において保有される画像の前記ブロックの流量となる。
【0032】
都合のよいことに、量子化パラメータQ(i+1)が次のように決定されることを含んでいる。即ち、符号器の出力における流量が、アクティブなシーンの場合においては、バケットの充填率がゼロの場合の開ループ内の流量に等しいか、又はバケットの充填率が前記バケットの最高充填率に等しい時に、前記リッキーバケットの漏れ率に等しいか、前記バケットの充填率がその最高充填率よりも低い非ゼロ値となる時に、開ループの流量と漏れ率との間に含まれる値に等しくなるように、更にインアクティブなシーンの場合においては、バケットの充填率がゼロの時に、前記リッキーバケットの漏れ率に等しいか、又はバケットの充填率が前記バケットの最高充填率に等しい時に開ループ内の流量に等しいか、或いは前記バケットの充填率がその最高充填率よりも低い非ゼロ値となる時に漏れ率と開ループ内の流量との間に含まれる値に等しくなる。
【0033】
都合のよいことに、量子化パラメータが次の計算によって決定されることを含んでいる。即ち、アクティブなシーンの場合においては、変数としてリッキーバケットの充填率を、また、パラメータとして前記バケットの漏れ率と前記バケットの最高充填率及び所定の量子化パラメータとを有する関数を計算し、また、インアクティブなシーンの場合においては、同じ変数と同じパラメータとを有する他の関数を計算する。
【0034】
符号器の出力における流量が次のように等しくなるように量子化パラメータを決定することからなる。即ち、アクティブなシーンの場合においては、開ループ内の流量がバケットの充填率のゼロ値に等しくなる値となるリッキーバケットの充填率を変数として有する連続減少関数(continuous decreasing function)fの計算結果と、また、前記バケットの最高充填率に等しいバケットの充填率の値となる前記リッキーバケットの漏れ率に等しい値と、更に開ループの流量と充填率の中間値としての漏れ率との間に含まれる値に等しくなるように、また、インアクティブなシーンの場合においては、バケットの充填率のゼロ値となる前記リッキーバケットの漏れ率に等しい値か、或いは前記バケットの最高充填率に等しいバケットの充填率の値としての開ループ内の流量に等しい値か、更に漏れ率と充填率の中間値として開ループ内の流量との間に含まれる値に等しい値をとるリッキーバケットの充填率を変数として有する連続減少関数gの計算結果に等しくなるようにする。
【0035】
【発明の実施の形態】
本発明のこれまでに説明した特性をはじめ他の特性についても実施例の次なる説明を読むことによって明確となろう。前記説明は添付の図面を参照して行う。
【0036】
本発明の実際の説明をする前に、トラヒック及びリッキーバケットのバージョンとの一致の概念を規定する。
【0037】
符号器の出力トラヒックはこれがその出力に伝送する一連の画像を基準にして規定される。{G}と書かれるこのトラヒックはビデオ・シーケンスのi番目のグループ画像の圧縮によって発生されたビット数を計測するシーケンス数G(i)によって規定される。各グループの画像の周期はτと書かれる。n番目グループの画像に等しいサイズのビデオ・シーケンスを越える平均流量Dは次式で規定される。
【数3】
Figure 0003954136
【0038】
リッキーバケットのバージョンは、数種の方法で全て同じものを表すように規定できる。二つのパラメータがリッキーバケットを規定する働きをする。即ち、M(ビットによる)で表されるバケットのサイズとλ(1秒当たりのビットによる)で表される漏れ率である。トラヒック{G}は、次式を立証できれば、パラメータM及びλのリッキーバケットのバージョンと一致する。
【数4】
Figure 0003954136
【0039】
【実施例】
ここで詳細に説明すると、本発明による工程を概略的に示した図1について検討する。図1は符号器10を示し、この符号器がその入力に現れるビデオ・シーケンスのコーディングを保証し、各ビデオ・シーケンスにおいて1からnまで変化するインデックスが各々付けられた画像の連続するブロックを出力する。ここでnは前記シーケンスの画像のグループ数である。従って、一つのシーケンスの画像のi番目のブロックはインデックスiを有する。コーディングはQ(i)で表わされる量子化パラメータを有する画像の各ブロックの量子化によって実行され、かつ、G(i)で表される画像のこのブロックに対するビット率を発生する。
【0040】
更に、図1にリッキーバケット20を概略的に示す。その入力21で流量G(i)を有する画像の各グループを入力する。このリッキーバケット20は二つのパラメータによって規定される。即ち、M(ビットによる)で表わされるサイズ及びλ(1秒当たりのビットによる)で表される漏れ率である。その入力に現れる流量G(i)の値に関して、サイズMのパラメータと漏れ率のパラメータλにより、リッキーバケット20が画像のi番目のブロックの瞬時におけるバケット20のビット数に対応してX(i)で示された情報の項が算出される。
【0041】
図1において、本発明の工程を実行する制御装置30を更に示す。画像のi番目のブロックを処理する瞬時において、その入力にバケット20に現れるビット数に関する情報X(i)を受信し、また、符号器10の出力にビット率G(i)の値も受信する。制御装置30は符号器10に量子化パラメータQ(i+)の値を出力し、後者が処理中ビデオ・シーケンスの(i+1)番目の画像ブロックに印加される。
【0042】
説明の途中で明白となろうが、符号器10で予め定められた一定の量子化パラメータQoで量子化されれば、本発明の工程は流量Go(i)がi番目の画像ブロックとなる流量によって評価された値を必要とする。パラメータQoは、全ビデオ・シーケンスに渡りその平均流量Dにおいて各グループの画像がその一定パラメータQoで量子化されるように選ばれなければならない。この一定パラメータはバケット20の漏れ率λに等しい。従って、次式を証明するDを得る:
【数5】
Figure 0003954136
【0043】
従って、符号器10は開ループの関数と呼ばれる。各流量の値Go(i)は符号器10によって与えられるか、又は、本発明の特定する実施例に示すように、制御装置30によって計算される。
【0044】
本発明の目的は、開ループ内でのコーディングによって提供される最も近い可能性のある特性を維持することである。ここで開ループ内のコーディングによって生じたトラヒックはリッキーバケットLB(M,λ)のバージョンとの一致を保証し、これは流量として限定されないからである。
【0045】
一般的に、アクティブなシーンはバケットを満たす傾向を有している。これは当然開ループ中で平均流量Dよりも大きいバケットの漏れ率λに等しい流量が発生するからである。他方において、低いアクティビティのシーンはバケットを空にする傾向にある。これは漏れ率λよりも大きい流量が発生するからである。アクティブなシーンが非常に長い場合、M容量を有するバケットがオーバーフローする。
【0046】
この問題を解決するために、本発明は量子化パラメータQを操作して流量に関するこの強制(constraint)を満足するようにする。しかし、帰還口の利得率はアリゴリズムの利得率よりもずっと低く、符号器の出力における流量は一定に保持される。
【0047】
ここで二つの極端な場合について考察してみる。即ち、一方においてバケットがいっぱい(X(i)=M)、他方においてバケットが空(X(i)=0)の場合である。
【0048】
最初の場合において、シーンがアクティブな時、即ち、Go(i)>λの時、量子化因子Q(i+1)は、流量G(i+1)がバケットの漏れ率λに等しくなるように選ばれる。シーンがインアクティブな時、即ち、Go(i)<λの時、選ばれた量子化因子Q(i+1)は開ループの因子、つまり、Qoとなる。従って、流量G(i)は開ループの流量Go(i)に等しくなる。
【0049】
従って、バケットがいっぱいの時、アクティブなシーンは流量λを越えず、バケットはオーバーフローしない。インアクティブなシーンに関する限り、これらのシーンは開ループ中でコーディングされ、その低い流量がバケットを空にせしめる。従って、目に見える特性はアクティブなシーンについては一定流量で少なくともコーディングされ、インアクティブなシーンについては開ループ内でコーディングされるのと同然に処理される。
【0050】
第2の場合(X(i)=0)において、シーンがアクティブな時に、即ち、Go(i)>λの時、量子化因子Q(i+1)=Qoが選ばれ、流量G(i+1)が得られるようにされ、この流量は開ループ流量、即ち、Go(i)に等しい。他方において、シーンがインアクティブな時、即ち、Go(i)<λの時、選ばれた量子化因子Q(i+1)はバケットの漏れ率に等しい、即ち、λに等しい流量G(i)が得られることが許容される。
【0051】
従って、バケットが完全にいっぱいでない場合に、インアクティブなシーンにおける画像グループiの特性が、流量λよりも低く発生された開ループコーディング自体によって得られたものと少なくとも同じである。他方、アクティブなシーンはλよりも大きい流量を発生し、従って、バケットがいっぱいにされる。
【0052】
下表はこれら四つの条件をまとめたものである。量子化パラメータはQ(i+1)で示され、λに等しいi番目のブロック画像に対して流量G(i)が得られることが許容される。
【表1】
Figure 0003954136
【0053】
バケットの充填の値が中間である場合に、量子化パラメータQ(i+1)の選ばれた値は、アクティブなシーンの場合にはGo(i)とλとの間に、またインアクティブな場合にはλとGo(i)との間にそれぞれ含まれるように流量G(i)が得られることが許容される。次の関係式で表すことができる。
アクティブなシーンの場合
G(i)=f(Go(i),λ,X(i))
f(Go(i),λ,0)=Go(i)
及びf(Go(i),λ,M)=λとする。
インアクティブなシーンの場合
G(i)=g(Go(i),λ,X(i))
g(Go(i),λ,0)=λ
及びg(Go(i),λ,M)=Go(i)とする。
【0054】
「レートゆがみ理論、データ圧縮のための数学的基本」と題する1971年、エングルウッド、クリフス、ニュージャージ:Prentivce HallでT.Bergerによるような画像を処理する理論によれば、現在流量の関数及び画像の歪みの関数は互いに相反する方向に変化しており、ビデオ・シーケンスの流量ー歪み関係はシーンのアクティビティに依存している。量子化パラメータQは画像の歪みに直接関係していることが分かっている。実際に、その値が高くなればなるほど、画像はますます歪み、またこれと逆になる。従って、このことから量子化パラメータQ及びこの量子化からの結果による流量Gは互いに逆の方向に変化することが推論できる。
【0055】
パラメータQと流量Gとを結ぶ関係は、簡単には定義できず、詳細な調査の対象になっている。しかし、全てのこの調査はアルゴリズムを一定流量でコーディングする必要があるためにマクロブックのスケールで有効となる厳密で正確な関係にある。
【0056】
ここで本発明において、マクロブックのレベルでなはく、画像グループのレベルで作用する別のタイプの制御に関心が向けられている。従って、量子化パラメータQと流量Gとを結ぶ関係は、そのどちらか一方が画像のグループと関連があれば、画像のグループ全体に渡り平均化され、より簡単に概算できる。これは画像内の細かい変化を最早考慮する必要がないからである。
【0057】
実験的関数が量子化パラメータQと流量Gとの間に設定される。これを実行するために、500個の画像を収容しているビデオ・シーケンスがアルゴリズムMpegー1を用いてCIFフォーマットに圧縮された。5個の開ループ圧縮が、量子化パラメータQoの5個の異なる値に対して実行され(量子化パラメータの値は一定で、かつ、Qoに等しい)、また、別の5個の開ループ圧縮が一定平均流量Dの5個の値を有する流量値Goに対して実行された。
【0058】
次表は開ループでのコーディングに対する流量平均と一定平均流量でコーディングされた量子化パラメータの平均とを示す。
【表2】
Figure 0003954136
【0059】
量子化パラメータQの値と平均流量Dとの積は、23±3%とほぼ一定であり、量子化パラメータQによって求められた値だけでなくコーディングの特性(開ループ又は一定平均流量)とは無関係であることが分かる。
【0060】
図2は画像数のに関してD×Qλ(i)の積及びGo(i)×Qoの積とによって与えられた値を示す。更に、これらの二つの積は全ての画像グループで等しく、従って、処理されるべき画像にのみ左右され、その変化はシーンのアクティビティを表す。
【0061】
上述の説明から、次式が得られる。
【数6】
Figure 0003954136
【0062】
上式からQ(i+1)の値を与えられた帰納的関係が得られる。
Q(i+1)=Qo×Go(i)/G(i)
【0063】
上式を頭に入れておいて、アクティブなシーンの場合には、
Q(i+1)=Qo×Go(i)/f(Go(i),λ,X(i))と書くことができる。
また、インアクティブなシーンの場合には、
Q(i+1)=Qo×Go(i)/g(Go(i),λ,X(i))と書くことができる。
【0064】
注意しなければならないのは、関数f(Go(i),λ,X(i)) 及び
g(Go(i),λ,X(i))はパラメータM、λ及びGo(i)又はQoの項(関数)、単独で表すことができるということである。
【0065】
従って、関連するパラメータはλ、M及びQoであることが分かる。最初の二つのパラメータは、リッキーバケットのものであり、従って、ネットワーク圧縮と接続されているか、及び/又は所望の特性の画像と結合されているという理由に基づいて固定される。パラメータQoに関する限り、パラメータQoの開ループ・コーディングによって発生されたトラヒックの平均流量Dは正確にλに等しくなるように選ばれなければならない。
【0066】
画像の任意のグループに用意された流量G(i)は、シーンのアクティビティだけでなくバケットX(i)の充填状態に依存する。安定性をはじめとし視覚的特性に関して本発明の処理の性能は、バケットX(i)の充填状態に伴って変化する流量G(i)に左右される。
【0067】
特に有利である関数X(i)にG(i)の式を探してきた。図3はアクティブなシーンの場合とインアクティブなシーンの場合におけるX(i)に関するG(i)の変化のカーブを示す。これらのカーブの形状は、アクティブなシーン中バケットの充填を刺激し、またインアクティブなシーンの時、これを空にすべく激励するように選択される。実際において、Go(i)<λで識別された小さいアクティビティのシーンに対しては、半分充填されたバケットがそれでもほぼ満杯のように見なされる。従って、このシーンの画像のグループによって発生された流量は、Go(i)に接近しており、バケットがもっと早く空になる。これとは逆に、Go(i)>λで識別される極めてアクティブなシーンに対しては、半分充填されたバケットはほぼ空のように見なされる。従って、発生された流量は、このシーンの視覚的な特性をバケットのサイズの限度内でできるだけ可能な長時間維持するようには制限されない。従って、G(i)の割り当ては次のように書くことができる。
【数7】
Figure 0003954136
ここで、x=X(i)/Mはバケットの標準充填を表す。
【0068】
図4は関数εk(x)を示す。
選ばれた陽関数は次式である。
【数8】
Figure 0003954136
【0069】
これらの式をQ(i+1)で与えられるように変換すると、Go(i)>λであれば次式が得られる。
【数9】
Figure 0003954136
また、Go(i)≦λであれば次式が得られる。
【数10】
Figure 0003954136
ここで、Go(i)=G(i)Q(i)/Qoであり、x=X(i)/Mである。
【0070】
上述のアルゴリズムは、カリフォルニア大学バークレイ校によって流通されたコーディング・ソフトMpegに注入され、試験される。
【0071】
2000個の画像シーケンスが、一方で35に等しい一定量子化パラメータを用いて開ループでコーディングされ、他方で18個の画像を記憶する平均サイズと量子化パラメータQo=35と等価なパラメータλ=0.78Mbits/sとM=564710ビットによる本発明のアルゴリズムを用いてコーディングされた。各画像のグループのサイズは12画像である。
【0072】
図5はこれら二つのコーディングによってそれぞれ発生された流量を示す。この図から本発明のアルゴリズムは極めてアクティブなシーン(画像1から150及び900から1000)に対する開ループコーディングよりもトラヒックが少なく、またインアクティブなシーン(例えば画像200から300及び1400から1500参照)に対するコーディングよりもトラヒックが多く発生されることが分かる。従って、流量の変化性はシーンの複雑さを維持し、これに比例する。バケットX(i)の充填率における変化を図6に示す。バケットの充填力学が表していることは、インアクティブなシーン中バケットが空になり、アクティブなシーン中これがいっぱいになり、これによって視覚的特性がよりよくなるといった本発明のアルゴズムのこの点で許容された変化性が完全に改善されることである。この特性は従来技術のアルゴリズムによっては達成できない。
【図面の簡単な説明】
【図1】 本発明による工程のブロック図である。
【図2】 Gを次に規定する流量とした時に積G×Qの一定値を見ることができる二つの曲線を示すグラフである。
【図3】 リッキーバケットの充填率に関する符号器の出力での流量変化を、アクティブなシーンとインアクティブなシーンについて表す二つの曲線を示す。
【図4】 本発明の工程によって使用される関数を表すグラフである。
【図5】 本発明の工程の効率を表すグラフである。
【図6】 画像の任意のシーケンスのための画像番号に関するリッキーバケットの充填率の変化を示すグラフである。

Claims (9)

  1. 画像シーケンスを表すディジタルデータの符号器の出力流量制御方法であって、前記符号器は量子化パラメータQを含む量子化段階を含み、前記画像シーケンスは、連続する画像グループで構成され、
    前記制御方法は、画像の( i +1)番目のグループをコーディングするための量子化パラメータQ( i +1)をセットすることにより、前記符号器の出力における流量が、サイズMと漏れ率λとによって規定されたリッキーバケットのバージョンと一致するステップと、及び、
    画像の i 番目のグループによって表されたシーンのアクティビティの点から画像の( i +1)番目のグループのコーディングのために、前記量子化パラメータQ( i +1)をセットし、その開ループ流量がリッキ−バケットの漏れ率λよりも大きい時に、画像の前記 i 番目のシーンがアクティブであるとされ、またこれよりも小さい時はインアクティブであるとされ、一定量子化パラメータQoで量子化され前記画像のシーンが属する全画像シーケンスに渡る平均流量Dが前記リッキ−バケットの漏れ率に等しければ、画像の前記グループの前記開ループの流量は、前記画像のシーンが前記符号器の出力において保有される流量となる前記量子化パラメータQ( i +1)を有するステップを含む、
    ディジタルデータの符号器の出力流量制御方法。
  2. 前記量子化パラメータQ( i +1)をセットするステップが、
    アクティブなシーンにおいては、
    (a)バケットの充填率がゼロの時に開ループ内の流量に等しいか、
    (b)バケットの充填率が前記バケットの最高充填率に等しい時に、前記リッキ−バケットの漏れ率に等しいか、或いは、
    (c)前記バケットの充填率がその最高充填率よりも低い非ゼロ値となる時に開ループの流量と漏れ率との間の値と等しい
    前記符号器の出力における流量を有し、更に、
    インアクティブなシーンにおいては
    (d)バケットの充填率がゼロの時に、前記リッキ−バケットの漏れ率に等しいか、
    (e)バケットの充填率が前記バケットの最高充填率に等しい時に開ループ内の流量に等しいか、或いは、
    (f)前記バケットの充填率がその最高充填率よりも低い非ゼロ値となる時に漏れ率と開ループ内の流量との間に含まれる値と等しい
    前記符号器の出力における流量を有する
    請求項1記載の方法。
  3. (a)リッキーバケットX( i )の充填率と等しいアクティブなシーンの変数と、
    (b)前記バケットの漏れ率λによるパラメータと、
    (c)前記バケットMの最高充填率、及び、
    (d)前記一定量子化パラメータQo
    を有する関数を計算することによって、アクティブなシーンの量子化パラメータがセットされるステップと、
    同じ変数とパラメータとを有する他の関数を用いることによりインアクティブなシーンの量子化パラメータがセットされるステップとを有する
    請求項1または2記載の方法。
  4. a )前記リッキ−バケットの充填レベルに対応した変数を有する連続減少関数fの計算結果と前記符号器の出力でのアクティブなシーンの流量G( i )が等しく、
    前記リッキ−バケットが、
    i )前記バケットX( i )の充填レベルに対応するゼロ値に対する開ループの流量に等し い値と、
    ii )前記バケットの最高充填レベルに等しい前記バッケトの充填レベルにたいする前記リッキ−バケットの漏れ率λに等しい値と、
    iii )前記充填レベルの中間値に対する前記開ループの流量及び前記漏れ率の間に含まれる値、を取る量子化パラメーター、及び、
    b )前記リッキ−バケットの充填レベルに対応した変数を有する連続減少関数fの計算結果と、前記符号器の出力でのインアクティブなシーンの流量G( i )が等しく、
    前記リッキ−バケットが、
    i )充填レベルのゼロ値に対して前記リッキ−バケットの漏れ率λに等しい値と、
    ii )前記バケットの最高充填レベルに等しい前記バッケトの充填レベルの値に対する開ループの流量Go( i )に等しい値と、
    iii )充填レベルX( i )の中間値として前記開ループの流量及び前記漏れ率の間に含まれる値、を取る量子化パラメーター、
    をセットするステップを有する請求項1または2記載の方法。
  5. Go( i )は開ループの流量、及び( i )は画像のグループであって、
    次の関数、
    a)アクティブなシーンの場合において、
    Q(i+1)=Q×Go(i)/f(Go(i),λ,X(i))
    b)インアクティブなシーンの場合において、
    Q(i+1)=Q×Go(i)/g(Go(i),λ,X(i))
    の計算によって量子化パラメータを決定することからなることを特徴とする請求項4記載の方法。
  6. バケットの充填率に伴って値が減少する導関数fを有し、また前記バケットの充填率に伴って値が減少する関数gを有することを特徴とする請求項4記載の方法。
  7. バケットの充填率に伴って値が減少する導関数fを有し、また前記バケットの充填率に伴って値が減少する関数gを有することを特徴とする請求項5記載の方法。
  8. ε 1 (x)及びε 2 (x)は、任意の関数、及びxは前記バケット及び前記バケットのサイズにおいて存在するビットの数に関する情報に基づいてバケットの充填を限定し、
    関数fが、
    f=Go( i )(1−ε 1 (x))+λε 1 (x))
    及び関数gが、
    g=λ(1−ε 2 (x))+Go( i )ε 2 (x))
    と書かれることを特徴とする請求項6記載の方法。
  9. ε 1 (x)及びε 2 (x)は、任意の関数、及びxは前記バケット及び前記バケットのサイズにおいて存在するビットの数に関する情報に基づいてバケットの充填を限定し、
    関数fが、
    f=Go( i )(1−ε 1 (x))+λε 1 (x))
    及び関数gが、
    g=λ(1−ε 2 (x))+Go( i )ε 2 (x))
    と書かれることを特徴とする請求項7記載の方法。
JP17020696A 1995-07-10 1996-06-28 画像シーケンスを表すディジタルデータの符号器の出力流量制御方法 Expired - Lifetime JP3954136B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9508581 1995-07-10
FR9508581A FR2736743B1 (fr) 1995-07-10 1995-07-10 Procede de controle de debit de sortie d'un codeur de donnees numeriques representatives de sequences d'images

Publications (2)

Publication Number Publication Date
JPH0937253A JPH0937253A (ja) 1997-02-07
JP3954136B2 true JP3954136B2 (ja) 2007-08-08

Family

ID=9481021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17020696A Expired - Lifetime JP3954136B2 (ja) 1995-07-10 1996-06-28 画像シーケンスを表すディジタルデータの符号器の出力流量制御方法

Country Status (6)

Country Link
US (1) US5724099A (ja)
EP (1) EP0753831B1 (ja)
JP (1) JP3954136B2 (ja)
CA (1) CA2179876C (ja)
DE (1) DE69611488T2 (ja)
FR (1) FR2736743B1 (ja)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6581170B1 (en) 1997-10-23 2003-06-17 Sony Corporation Source coding to provide for robust error recovery during transmission losses
US6212663B1 (en) 1997-10-23 2001-04-03 Sony Corporation Apparatus and method for recovery of quantization codes in a lossy transmission environment
US6282684B1 (en) 1997-10-23 2001-08-28 Sony Corporation Apparatus and method for recovery of data in a lossy transmission environment
US6278735B1 (en) 1998-03-19 2001-08-21 International Business Machines Corporation Real-time single pass variable bit rate control strategy and encoder
US6170074B1 (en) 1999-02-12 2001-01-02 Sony Corporation Source coding to provide for robust error recovery
US7010737B2 (en) * 1999-02-12 2006-03-07 Sony Corporation Method and apparatus for error data recovery
US6519369B1 (en) 1999-02-12 2003-02-11 Sony Corporation Method and apparatus for filter tap expansion
US6363118B1 (en) 1999-02-12 2002-03-26 Sony Corporation Apparatus and method for the recovery of compression constants in the encoded domain
US6591398B1 (en) 1999-02-12 2003-07-08 Sony Corporation Multiple processing system
US6307979B1 (en) 1999-02-12 2001-10-23 Sony Corporation Classified adaptive error recovery method and apparatus
US6621936B1 (en) 1999-02-12 2003-09-16 Sony Corporation Method and apparatus for spatial class reduction
US6535148B1 (en) 1999-02-12 2003-03-18 Sony Corporation Method and apparatus for truncated decoding
US6418548B1 (en) * 1999-02-12 2002-07-09 Sony Corporation Method and apparatus for preprocessing for peripheral erroneous data
US6307560B1 (en) 1999-02-12 2001-10-23 Sony Corporation Classified adaptive spatio-temporal format conversion method and apparatus
US6567379B1 (en) * 1999-06-09 2003-05-20 Cisco Technology, Inc. Traffic monitor using leaky bucket with variable fill
US6473876B1 (en) 1999-06-29 2002-10-29 Sony Corporation Method and apparatus for encoding of bitstreams using rotation
US6389562B1 (en) 1999-06-29 2002-05-14 Sony Corporation Source code shuffling to provide for robust error recovery
US6549672B1 (en) * 1999-06-29 2003-04-15 Sony Corporation Method and apparatus for recovery of encoded data using central value
US6493842B1 (en) 1999-06-29 2002-12-10 Sony Corporation Time-varying randomization for data synchronization and implicit information transmission
US6351494B1 (en) 1999-09-24 2002-02-26 Sony Corporation Classified adaptive error recovery method and apparatus
US6522785B1 (en) 1999-09-24 2003-02-18 Sony Corporation Classified adaptive error recovery method and apparatus
US6539517B1 (en) 1999-11-09 2003-03-25 Sony Corporation Data transformation for explicit transmission of control information
US6754371B1 (en) 1999-12-07 2004-06-22 Sony Corporation Method and apparatus for past and future motion classification
JP2002330165A (ja) * 2001-04-27 2002-11-15 Fujitsu Ltd 輻輳制御装置
US7543073B2 (en) * 2004-12-10 2009-06-02 Microsoft Corporation System and process for performing an exponentially weighted moving average on streaming data to establish a moving average bit rate
US20060143678A1 (en) * 2004-12-10 2006-06-29 Microsoft Corporation System and process for controlling the coding bit rate of streaming media data employing a linear quadratic control technique and leaky bucket model
US7536469B2 (en) * 2004-12-10 2009-05-19 Microsoft Corporation System and process for controlling the coding bit rate of streaming media data employing a limited number of supported coding bit rates
US9338463B2 (en) * 2011-10-06 2016-05-10 Synopsys, Inc. Visual quality measure for real-time video processing
CN109905711B (zh) * 2019-02-28 2021-02-09 深圳英飞拓智能技术有限公司 一种图像的处理方法、系统及终端设备
CN110519571A (zh) * 2019-09-19 2019-11-29 天津英田视讯科技有限公司 一种基于场景复杂度动态调整编码器参数的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5159447A (en) * 1991-05-23 1992-10-27 At&T Bell Laboratories Buffer control for variable bit-rate channel
US5231484A (en) * 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
US5331348A (en) * 1992-07-27 1994-07-19 At&T Bell Laboratories Adaptive leak HDTV encoder
US5426463A (en) * 1993-02-22 1995-06-20 Rca Thomson Licensing Corporation Apparatus for controlling quantizing in a video signal compressor
US5543853A (en) * 1995-01-19 1996-08-06 At&T Corp. Encoder/decoder buffer control for variable bit-rate channel

Also Published As

Publication number Publication date
EP0753831B1 (fr) 2001-01-10
US5724099A (en) 1998-03-03
CA2179876A1 (en) 1997-01-11
FR2736743A1 (fr) 1997-01-17
EP0753831A1 (fr) 1997-01-15
DE69611488T2 (de) 2001-06-07
CA2179876C (en) 2007-01-09
DE69611488D1 (de) 2001-02-15
JPH0937253A (ja) 1997-02-07
FR2736743B1 (fr) 1997-09-12

Similar Documents

Publication Publication Date Title
JP3954136B2 (ja) 画像シーケンスを表すディジタルデータの符号器の出力流量制御方法
JP3093233B2 (ja) 画像符号化装置及びその方法
KR100919074B1 (ko) 매개 방정식을 이용한 비디오 인코딩을 위한 레이트 제어
JP2963416B2 (ja) 量子化活動度を用いてビット発生量を制御する映像符号化方法及び装置
US20060062481A1 (en) Apparatuses, computer program product and method for bit rate control of digital image encoder
JPH07184196A (ja) 画像符号化装置
CN1102030A (zh) 可按照频域能量特性改变量化级的编码方法及其装置
JP2004511976A (ja) ディジタルビデオ記録のためのビデオビットレート制御方法及び装置
JP3259702B2 (ja) 動画像可変ビットレート符号化装置および方法
JP3907875B2 (ja) 符号化レート制御装置及び情報符号化装置
JPH08102938A (ja) 画像符号化装置
JP2948562B2 (ja) ファジィ制御を用いるmpeg映像信号の伝送率制御装置
US20050063461A1 (en) H.263/MPEG video encoder for efficiently controlling bit rates and method of controlling the same
JPH07240917A (ja) データ圧縮方法
JPH10164577A (ja) 動画像符号化装置
JP2894137B2 (ja) 動画像符号化におけるプリフィルタ制御方法および装置
JPH06237454A (ja) 可変長符号化を考慮した動作推定装置
JP2001028753A (ja) 動画像符号化装置及びその方法
US5751357A (en) Method and arrangement for coding and decoding a video data stream for all picture elements of the video data stream
CN111770335B (zh) 数据编码方法及装置
JP3812269B2 (ja) 動画像符号化装置及びその方法
JP2000041240A (ja) 可変ビットレート符号化装置および方法
JPH10164588A (ja) 映像信号符号化方法、映像信号符号化装置及び記録媒体
Lin et al. Gradient-based buffer control technique for MPEG
JP3937248B2 (ja) 映像信号符号化方法及び映像信号符号化装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050802

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20051027

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20051107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060228

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070403

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070426

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120511

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130511

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130511

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term