JP4517475B2 - 画像情報変換装置及び方法並びに符号化装置及び方法 - Google Patents

画像情報変換装置及び方法並びに符号化装置及び方法 Download PDF

Info

Publication number
JP4517475B2
JP4517475B2 JP2000225846A JP2000225846A JP4517475B2 JP 4517475 B2 JP4517475 B2 JP 4517475B2 JP 2000225846 A JP2000225846 A JP 2000225846A JP 2000225846 A JP2000225846 A JP 2000225846A JP 4517475 B2 JP4517475 B2 JP 4517475B2
Authority
JP
Japan
Prior art keywords
image
compression information
information
activity
image compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000225846A
Other languages
English (en)
Other versions
JP2002044668A (ja
Inventor
数史 佐藤
武文 名雲
邦明 高橋
輝彦 鈴木
陽一 矢ケ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2000225846A priority Critical patent/JP4517475B2/ja
Publication of JP2002044668A publication Critical patent/JP2002044668A/ja
Application granted granted Critical
Publication of JP4517475B2 publication Critical patent/JP4517475B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像情報を変換する画像情報変換装置及び方法に関し、詳しくは、離散コサイン変換等の直交変換と動き補償によって圧縮されたMPEG等の画像情報(ビットストリーム)を衛星放送、ケーブルTV、インターネット等のネットワークメディアを介して受信する際に、若しくは光、磁気ディスクのような記憶メディア上で処理する際に用いられる画像情報を変換する画像情報変換装置及び方法に関する。
【0002】
【従来の技術】
近年、画像情報をディジタルとして取り扱い、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮するMPEGなどの画像情報圧縮方式が提供されている。そして、このような画像情報圧縮方法に準拠した装置は、放送局などの情報配信、及び一般家庭における情報受信の双方において普及しつつある。
【0003】
特に、MPEG2(ISO/IEC 13818−2)は、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する、汎用画像符号化方式として定義されている。
【0004】
すなわち、MPEG2符号化圧縮方式によれば、例えば、720×480画素を持つ標準解像度の飛び越し走査画像に4〜8Mbpsの符号量(ビットレート)を割り当て、1920×1088画素を持つ高解像度の飛び越し走査画像に対して18〜22Mbpsの符号量(ビットレート)を割り当てることにより、高い圧縮率と良好な画質の実現が可能となる。
【0005】
このようなことから、MPEG2は、プロフェッショナル用途及びコンシューマー用途の広範なアプリケーションに今後とも用いられるものと予想される。 しかし、MPEG2は、主として放送用に適合する高画質符号化を対象としており、例えばMPEG1より低い符号量(ビットレート)、つまりより高い圧縮率の符号化方式には対応していなかった。
【0006】
一方で、近年の携帯端末の普及により、今後とも高い圧縮率の符号化方式のニーズは高まると思われ、これに対応して、高い圧縮率を有するMPEG4符号化方式の標準化が行われている。この画像符号化方式に関しては、1998年12月にISO/IEC 14496−2として国際標準の規格が承認された。
【0007】
ところで、ディジタル放送用に一度符号化されたMPEG2画像圧縮情報(ビットストリーム)を、携帯端末上等で処理するのにより適した、より低い符号量(ビットレート)の画像圧縮情報(ビットストリーム)に変換したいというニーズがある。
【0008】
かかる目的を達成するために、“Field-to-Frame Transcoding with Spatial and Temporal Downsampling”(Susie L Wee, John G. Apostolopoulos, and Nick Feamster, ICIP 99、以下これを文献1と呼ぶ)において画像情報変換装置(トランスコーダ)が提供されている。
【0009】
この文献1において提供された画像情報変換装置(トランスコーダ)は、図5に示すように、ピクチャタイプ判別部1と、MPEG2画像情報復号化部(I/Pピクチャ)2と、間引き部3と、MPEG4画像情報符号化部(I/P−VOP)4と、動きベクトル合成部5と、動きベクトル検出部6とから構成されている。
【0010】
この画像情報変換装置には、フレーム内で符号化されたイントラ符号化画像(Iピクチャ;I)、表示順序で順方向を参照して予測符号化された順方向予測符号化画像(Pピクチャ;P)及び表示順序で順方向及び逆方向を参照して予測符号化された双方向予測符号化画像(Bピクチャ;B)から構成される飛び越し走査のMPEG2画像圧縮情報(ビットストリーム)が入力される。
【0011】
このMPEG2画像圧縮情報(ビットストリーム)は、ピクチャタイプ判別部1において、I/Pピクチャに関するものか、Bピクチャに関するものであるかを判別され、I/Pピクチャのみ後続のMPEG2画像情報復号化部(I/Pピクチャ)2に出力され、Bピクチャは破棄される。
【0012】
MPEG2画像情報復号化部(I/Pピクチャ)2における処理は通常のMPEG2画像情報復号化装置と同様に、MPEG2画像圧縮情報(ビットストリーム)を画像信号に復号するものである。
【0013】
MPEG2画像情報復号化部(I/Pピクチャ)2の出力となる画素値は、間引き部3に入力される。間引き部3は、水平方向には1/2の間引き処理を施し、垂直方向には、第一フィールド若しくは第二フィールドのどちらか一方のデータのみを残し、もう一方を廃棄する。このような間引きによって、入力となる画像情報の1/4の大きさを持つ順次走査画像を生成する。
【0014】
間引き部3によって生成された順次走査画像はMPEG4画像情報符号化部(I/P−VOP)4によってフレーム内で符号化されたI−VOP及び表示順序で順方向を参照して予測符号化されたP−VOPに符号化され、MPEG4画像圧縮情報(ビットストリーム)として出力される。尚、VOPはVideo object Planeを意味し、MPEG2におけるフレームに相当するものである。
【0015】
その際、入力となるMPEG2画像圧縮情報(ビットストリーム)中の動きベクトル情報は、動きベクトル合成部5において間引き後の画像情報に対する動きベクトルにマッピングされ、動きベクトル検出部6においては、動きベクトル合成部5において合成された動きベクトル値を元に高精度の動きベクトルを検出する。
【0016】
文献1は、入力となるMPEG2画像圧縮情報(ビットストリーム)の1/2×1/2の大きさを持つ順次走査画像のMPEG4画像圧縮情報(ビットストリーム)を生成する画像情報変換装置に関して記述している。すなわち、例えば入力となるMPEG2画圧縮情報(ビットストリーム)がNTSC(National Television System Committee)の規格に準拠したものであった場合、出力となるMPEG4画像圧縮情報はSIFサイズ(352×240画素)ということになる。
【0017】
ところで、図5に示した画像情報変換装置においては、MPEG4画像情報符号化部(I/P−VOP)4における符号量制御が、出力となるMPEG4画像圧縮情報(ビットストリーム)における画質を決定する大きな要因となる。ISO/IEC 14496−2においては、符号量制御の方式に関しては特に規定されておらず、各ベンダが、アプリケーションに応じて、演算量及び出力画質の観点から最適と考えられる方式を用いることが出来る。以下では、代表的な符号量制御方式として、MPEG2 Test Model 5(ISO/IEC JTC1/SC29/WG11 N0400)で述べられている方式について述べる。
【0018】
この符号量制御のフローを図6に示すフローを用いて説明する。最初のステップS11において、画像情報符号化部(I/P−VOP)4は、目標符号量(ターゲットビットレート)、及び、GOP(group of pictures)構成を入力変数として、各ピクチャへのビット配分を行う。ここで、GOPとは、ランダムアクセス可能なピクチャの組である。
【0019】
すなわち、ステップS11において、画像情報符号化部(I/P−VOP)4は、GOP内の各ピクチャに対する割り当てビット量を、割り当て対象ピクチャを含めGOP内でまだ復号化されていないピクチャに対して割り当てられるビット量(以下、これをRとする)を基に配分する。この配分をGOP内の符号化ピクチャ順に繰り返す。その際、以下に述べる2つの仮定を用いて各ピクチャへの符号量割り当てを行う。
【0020】
まず、第一に、各ピクチャを符号化する際に用いる平均量子化スケールコードと発生符号量の積は、画面が変化しない限り、ピクチャタイプ毎に一定値となると仮定する。そこで、各ピクチャを符号化した後、各ピクチャタイプ毎に、画面の複雑さを示す変数Xi,Xp,Xb(grobal complelxity measure)を次の式(1)によって更新する。
【0021】
【数7】
Figure 0004517475
【0022】
ここでSi,Sp,Sbはピクチャ符号化時の発生符号ビット量であり、Qi,Qp,Qbは、ピクチャ符号化時の平均量子化スケールコードである。また、初期値は、目標符号量(ターゲットビットレート)bit_rate[bits/sec]を用いて、式(2)で示される値とする。
【0023】
【数8】
Figure 0004517475
【0024】
第二に、Iピクチャの量子化スケールコードを基準としたP,Bピクチャの量子化スケールコードの比率Kp,Kbが式(3)に定めた値となる場合に常に全体の画質が最適化されると仮定する。
【0025】
【数9】
Figure 0004517475
【0026】
すなわち、Bピクチャの量子化スケールコードは、I,Pピクチャの量子化スケールコードの常に1.4倍としている。これは、BピクチャをI,Pピクチャに比較して多少粗めに符号化することにより、Bピクチャで節約できる符号量をI,Pピクチャに加えると、I,Pピクチャの画質が改善され、これを参照するBピクチャの画質も改善されることを想定している。
【0027】
上記2つの仮定より、GOPの各ピクチャに対する割り当てビット量(Ti,Tp,Tb)は式(4)に示す値とする。
【0028】
【数10】
Figure 0004517475
【0029】
ここでNp,NbはGOP内でまだ符号化されていないP,Bピクチャの枚数である。
【0030】
このようにして求めた割当符号量を基にして、各ピクチャをステップS11,S12に従って符号化する毎に、GOP内の未符号化ピクチャに対して割り当てられるビット量Rを式(5)で更新する。
【0031】
【数11】
Figure 0004517475
【0032】
また、GOPの最初のピクチャを符号化する際には、式(6)によりRを更新する。
【0033】
【数12】
Figure 0004517475
【0034】
NはGOP内のピクチャ数である。また、シーケンスの最初でのRの初期値は0とする。
【0035】
次に、ステップS12において、画像情報符号化装置(I/P−VOP)4は、仮想バッファを用いたレート制御を行う。すなわち、ステップS12において、画像情報符号化装置(I/P−VOP)4は、ステップS11で式(4)により求められた各ピクチャに対する割当ビット量(Ti,Tp,Tb)と、実際の発生符号量を一致させるため、各ピクチャ毎に独立に設定した3種類の仮想バッファの容量を基に、量子化スケールコードを、マクロブロック単位のフィードバック制御で求める。
【0036】
まず、j番目のマクロブロック符号化に先立ち、仮想バッファの占有量を式(7)によって求める。
【0037】
【数13】
Figure 0004517475
【0038】
ここで、d0 i,d0 p,d0 bは各仮想バッファの初期占有量、Bjはピクチャの先頭からj番目のマクロブロックまでの発生ビット量、MB_cntは1ピクチャ内のマクロブロック数である。各ピクチャ符号化終了時の仮想バッファ占有量(dMB_cnt i,dMB_cnt p,dMB_cnt b)は、それぞれ同一のピクチャタイプで、次のピクチャに対する仮想バッファ占有量の初期値(d0 i,d0 p,d0 b)として用いられる。
【0039】
次に、j番目のマクロブロックに対する量子化スケールコードを式(8)により計算する。
【0040】
【数14】
Figure 0004517475
【0041】
ここで、rはリアクションパラメーターと呼ばれるフィードバックループの応答を制御する変数であり、式(9)により与えられる。
【0042】
【数15】
Figure 0004517475
【0043】
尚、符号化開始時における仮想バッファの初期値は式(10)で与えられる。
【0044】
【数16】
Figure 0004517475
【0045】
最後に、ステップS13において、画像情報符号化装置(I/P−VOP)4は、視覚特性を考慮したマクロブロック毎の適応量子化を行う。すなわち、ステップS13において、画像情報符号化部(I/P−VOP)4は、ステップS12で求められた量子化スケールコードを、視覚的に劣化の目立ちやすい平坦部でより細かく量子化し、劣化の比較的目立ちにくい絵柄の複雑な部分で粗く量子化するように、各マクロブロック毎のアクティビティと呼ばれる変数によって変化させている。
【0046】
アクティビティは、原画の輝度信号画素値を用い、フレーム離散コサイン変換モードにおける4個のブロックと、フィールド離散コサイン変換モードにおける4個のブロックとの、合計8ブロックの画素値を用いて式(11)で与えられる。
【0047】
【数17】
Figure 0004517475
【0048】
ここで、Pkは原画の輝度信号ブロック内画素値である。式(11)において最小値を採るのは、マクロブロック内の一部だけでも平坦部分のある場合には量子化を細かくするためである。
【0049】
更に、式(12)によりその値が0.5〜2の範囲を取る正規化アクティビティNactjを求める。
【0050】
【数18】
Figure 0004517475
【0051】
ここで、avg_actは、直前に符号化したピクチャでのactjの平均値である。
【0052】
視覚特性を考慮した量子化スケールコードmquantjはステップS12で得られた量子化スケールコードQjを基に式(13)で与えられる。
【0053】
【数19】
Figure 0004517475
【0054】
MPEG2 Test Model 5において定められた上記符号量制御方式には以下の制限のあることが知られており、実際の制御を行う場合には、これらの制限に対する対策が必要となる。すなわち、第一の制限は、第一ステップS11はシーンチェンジに対応出来ず、また、シーンチェンジ後には第三ステップS13で用いる媒介変数avg_actが間違った値となるということである。第二の制限は、MPEG2及びMPEG4において規定されているVBV(Video Buffer Verifier)の拘束条件を満たす保証がないことである。
【0055】
ところで、文献”MPEG圧縮効率の理論解析とその符号量制御への応用”(信学技報、IE−95, DSP95−10, 1995年5月、以下これを文献2と呼ぶ)でも述べられている通り、Test Model 5で定められている符号量制御方式は、MPEG−2画像符号化装置において、必ずしも良好な画質を与えるものではない。
【0056】
この文献2では、特に、良好な画質を与えるための、GOP内における各フレーム毎の最適な符号量配分を与える手法として以下の方式を提案している。すなわち、NI,NP,NBを、GOP内においてまだ符号化されていないI,P,Bピクチャの枚数として、これらに割り当てられる符号量をRI,RP,RBとする。また、式(14)で与えられる固定レート条件の下に、それぞれにおける量子化ステップサイズをQI,QP,QBとし、mを、量子化ステップサイズと再生誤差分散を関係付ける次数(すなわち、量子化ステップサイズをm乗したものの平均値の最小化が再生誤差分散を最低にすると仮定する)とする。そして、式(15)を最小にすることを考える。
【0057】
【数20】
Figure 0004517475
【0058】
【数21】
Figure 0004517475
【0059】
尚、それぞれのフレームにおける平均量子化スケールQ、及び符号量Rは、Test Model 5でも用いられる媒体変数である各フレームのコンプレキシティXと、式(16)のように関係づけられる。
【0060】
【数22】
Figure 0004517475
【0061】
式(16)の関係も考慮しつつ、式(14)の拘束条件の元に式(15)を最小にするRI,RP,RBを、ラグランジェの未定乗数法を用いて算出すると、最適なRI,RP,RBとして以下の式のような値が求められる。
【0062】
【数23】
Figure 0004517475
【0063】
α=1として、式(17)と、MPEG2 Test Model 5で定められた符号量制御方式における式(4)との関係は以下の通りであると言える。すなわち、式(17)は、符号量制御の媒介変数であるKp,Kbを、各フレームのコンプレキシティXI,XP,XBに応じて、式(18)のように適応的に算出していることに他ならない。
【0064】
【数24】
Figure 0004517475
【0065】
文献2では、1/(1+m)の値として、0.6〜1.2程度に設定することで良好な画質が得られることが示されている。
【0066】
図5に示した画像情報変換装置内で、MPEG4画像情報符号化装置(I/P−VOP)4において、MPEG2 Test Model 5において定められたのと同様な手法を用いて符号量制御を行った場合、シーンチェンジ等に起因する、GOP内でのコンプレキシティの変化に対応することが不可能であるため、安定した符号量制御が困難となり、画質劣化を引き起こすことが考えられる。MPEG2画像情報復号化部(I/Pピクチャ)2において抽出される、入力となるMPEG2画像圧縮情報(ビットストリーム)内の情報をMPEG4画像圧縮情報符号化部(I/P−VOP)4において利用することでこの問題を回避することが可能であると期待される。
【0067】
かかる問題を解決するため、本願出願人は、先に図7に示すような画像情報変換装置を提案した。
【0068】
この画像情報変換装置は、ピクチャタイプ判別部7と、圧縮情報解析部8と、MPEG2画像情報復号化部(I/Pピクチャ)9と、間引き部10と、MPEG4画像情報符号化部(I/P−VOP)11と、動きベクトル合成部12と、動きベクトル検出部13と、情報バッファ14と、コンプレキシティ算出部15とから構成される。
【0069】
この画像情報変換装置は、圧縮情報解析部8、情報バッファ14、コンプレキシティ算出部15及びMPEG4画像情報符号化部(I/P−VOP)11における符号量制御以外の動作原理については、図5に示した画像情報変換装置と同様であるため、以下では、圧縮情報解析部8、情報バッファ14、コンプレキシティ算出部15における動作原理及びMPEG4画像情報符号化部(I/P−VOP)11における符号量制御について述べることにする。
【0070】
圧縮情報解析部8において、復号処理に用いられた量子化スケールのフレーム全体に渡る平均値Q、及び、入力となるMPEG2画像圧縮情報(ビットストリーム)において、当該フレームに割り当てられた総符号量(ビット数)Bは、情報バッファ14に格納される。
【0071】
コンプレキシティ算出部15においては、情報バッファ14に格納されたフレーム毎の情報Q及びBから、当該フレームに対するコンプレキシティXを式(19)により算出する。
【0072】
【数25】
Figure 0004517475
【0073】
式(19)によって算出された、当該フレームに対するコンプレキシティXは、1GOV(group of VOPs)分バッファリングされた後、MPEG4画像情報符号化部(I/P−VOP)11に符号量制御のための媒介変数として伝送される。このため、1GOV分の遅延が必要となる。この遅延は図示しない遅延バッファを用いて実現される。ここで、GOVとは、ランダムアクセス可能なVOPの組である。
【0074】
以下では、式(19)において算出された、GOV内の各フレームに対するコンプレキシティXが、MPEG4画像情報符号化部(I/P−VOP)11においてどのように用いられるかについて述べる。尚、以下では、ピクチャタイプ判別部7がこの画像情報変換装置内に存在せず、フレームレートの変換を行わない場合をも考慮することにする。
【0075】
式(18)によって求められたKP,KBの意味するところは、I−VOPに対する理想的な平均量子化スケールQi_idealに対するP−VOP/B−VOPに対する理想的な平均量子化スケールQp_ideal,Qb_idealの比が、式(20)によって与えられるということである。
【0076】
【数26】
Figure 0004517475
【0077】
MPEG2 Test Model 5においては、式(18)のように適応的にKp,Kbを算出することを行わず、式(3)に示したような固定値を用いている。
【0078】
式(18)及び式(20)から、或るVOP1と、或るVOP2に対するコンプレキシティをそれぞれX1,X2とし、理想的な量子化スケールをQ1_ideal,Q2_idealとすれば、式(21)のようになる。
【0079】
【数27】
Figure 0004517475
【0080】
或いはまた、MPEG2 Test Model 5のように、式(3)に示した固定値を用いたい場合には、式(21)に代えて、式(22)のようにすれば良い。
【0081】
【数28】
Figure 0004517475
【0082】
今、GOV内の未符号化されたVOPに対して割り当てられる総符号量(ビット数)をRとし、Rが、各VOPに対して、R1,R2,…Rnといったように割り当てられる時、当該GOVに対する画質が最適化されるものとする。ここでRとR1,R2,…Rnの間には式(23)のような関係式が成り立つ。
【0083】
【数29】
Figure 0004517475
【0084】
或るVOPkに対する平均量子化スケールQk、割当符号量Rk、コンプレキシティXkの間には式(24)なる関係があることにも注意して、式(23)を変形すれば式(25)が得られる。
【0085】
【数30】
Figure 0004517475
【0086】
【数31】
Figure 0004517475
【0087】
式(25)において、K(X1,X2)に関しては、式(21)に示した値を用いても、式(22)に示した値を用いても良いが、前者の方が、画像に応じた、より最適な符号量配分を実現することが可能である。その際、1/(1+m)の値を1.0と設定することで、指数演算を行うことが不要となり、高速な実行が可能となる。また、1/(1+m)の値を1.0以外に設定する場合にも、予めテーブルを持ち、これを参照して指数演算を行うことで高速な実行が可能となる。
【0088】
式(25)における各VOPに対するコンプレキシティXkはMPEG4画像符号化によるものであるが、MPEG2画像符号化による各フレームに対するコンプレキシティと、MPEG4画像符号化による各フレームに対するコンプレキシティが等しいと仮定すれば、コンプレキシティ算出部15に格納されたXkを用いることで、式(25)によって当該VOPに対する目標符号量を算出することが可能である。
【0089】
この目標符号量の算出のフローを図8に示す。最初のステップS21において、圧縮情報解析部8は、MPEG2画像情報復号化部9における復号処理に用いられるGOP内の各フレームに対する平均量子化スケールQ,及び割当符号量(ビット数)Bを抽出する。
【0090】
ステップS22において、コンプレキシティ算出部15は、平均量子化スケールQ及び割当符号量(ビット数)Bの積で与えられるコンプレキシティXを算出する。
【0091】
ステップS23において、MPEG4画像符号化部(I/P−VOP)11は、コンプレキシティXに応じた目標符号量(ターゲットビット)を算出する。
【0092】
MPEG2 Test Model 5では、GOP内におけるI,P,Bピクチャに対するコンプレキシティXi,Xp,Xbは一定であると仮定しているが実際にはシーンチェンジをGOP内に含む場合や、GOP内で背景が著しく変化する場合等ではこの仮定が成り立たず、安定した符号量制御の妨げとなり、画質劣化の要因ともなる。図7に示した画像情報変換装置においては、そのような場合にも、入力となるMPEG2画像圧縮情報(ビットストリーム)における、各フレームに対するコンプレキシティに基づいた符号量制御を行うため、画質劣化を引き起こすことなく、安定した符号量制御を行うことが可能である。
【0093】
【発明が解決しようとする課題】
ところで、図6に示した符号量制御方式において、ステップS13における適応量子化が有効に作用するためには、j番目のマクロブロックに対する量子化スケールコード、つまり式(8)におけるQjがフレーム全体に渡って均一な値を取ることが望ましい。そこで、CCIR(Comite Consultantif Internationale des Radio Communications)テストシーケンスの一つである“Flower Garden”を、n=15;m=3の条件の元、4Mbpsに圧縮したMPEG2画像圧縮情報(ビットストリーム)を、図7に示した画像情報変換装置を用いて、n=5;m=1のMPEG4画像圧縮情報(ビットストリーム)に変換する際の、あるVOPに対するQjがどのような値を取るかを図9に示す。
【0094】
先述の通り、理想的にはQjがVOP全体に渡って均―な値を取ることが望ましいが、実際には、式(7)における仮想バッファ占有量(dj i,dj p,dj b)がマクロブロック毎に変化するため、VOP全体に渡って均一な値とならない。
【0095】
本発明は、上述の実情に鑑みて提案されるものであって、Qjの変動を抑制して符号量を制御するような画像情報変換装置及び方法を提供することを目的とする。
【0096】
【課題を解決するための手段】
上述の課題を解決するために、本発明は、第1の圧縮符号化方式で圧縮された飛び越し走査の入力画像圧縮情報を、第2の圧縮符号化方式で圧縮された順次走査の出力画像圧縮情報に変換するものであって、上記入力画像圧縮情報及び上記出力画像圧縮情報を構成する符号化画像は、それぞれ複数の画素からなる画素ブロックから構成され、上記入力画像圧縮情報における画素ブロックの第1のアクティビティに基づいて、上記出力画像圧縮情報における画素ブロックの第2のアクティビティの推定値を算出するアクティビティ算出手段と、上記アクティビティ算出手段で算出した第2のアクティビティの推定値を利用し、仮想バッファのバッファ占有量に基づいて上記出力画像圧縮情報の各符号化画像での参照量子化スケールを均一化するレート制御を行い、画像情報を上記出力画像圧縮情報に変換する変換手段とを有し、上記アクティビティ算出手段は、上記第1のアクティビティを、上記入力画像圧縮情報の符号化画像を構成する画素ブロックに対する量子化スケールと、割当ビット量との積により算出し、上記第2のアクティビティの推定値を、上記出力画像圧縮情報の画素ブロックに対応する上記入力画像圧縮情報の複数の画素ブロックのアクティビティの関数により算出する。
また、本発明にかかる符号化装置は、第1の圧縮符号化方式で圧縮された飛び越し走査の入力画像圧縮情報を復号して得られる画像情報を、第2の圧縮符号化方式で圧縮された順次走査の出力画像圧縮情報に符号化する符号化装置において、上記入力画像圧縮情報及び上記出力画像圧縮情報を構成する符号化画像は、それぞれ複数の画素からなる画素ブロックから構成され、上記入力画像圧縮情報における画素ブロックの第1のアクティビティに基づいて算出された、上記出力画像圧縮情報における画素ブロックの第2のアクティビティの推定値を受け取る受け取り手段と、上記受け取り手段からの第2のアクティビティの推定値を利用し、仮想バッファのバッファ占有量に基づいて上記出力画像圧縮情報の各符号化画像での参照量子化スケールを均一化するレート制御を行い、画像情報を上記出力画像圧縮情報に符号化する符号化手段とを有し、上記受け取り手段は、上記入力画像圧縮情報の符号化画像を構成する画素ブロックに対する量子化スケールと、割当ビット量との積により算出された上記第1のアクティビティと、上記出力画像圧縮情報の画素ブロックに対応する上記入力画像圧縮情報の複数の画素ブロックのアクティビティの関数により算出された上記第2のアクティビティの推定値とを受け取る。
【0097】
本発明は、飛び越し走査のMPEG2画像圧縮情報(ビットストリーム)を入力画像圧縮情報とし、順次操作のMPEG4画像圧縮情報(ビットストリーム)を出力画像圧縮情報とする。これらMPEG2画像圧縮情報(ビットストリーム)及びMPEG4画像圧縮情報は、複数の画素から構成される画素ブロックすなわちマクロブロックから構成されている。また、MPEG2画像圧縮情報(ビットストリーム)及びMPEG4画像圧縮情報(ビットストリーム)は、画像群すなわちGOP(group of pictures)及びGOV(group of VOPs)からそれぞれ構成されている。そして、画像群であるGOP及びGOVは、複数の符号化画像すなわちピクチャ(picture)及びVOP(video object plane)からそれぞれ構成されている。
【0098】
すなわち、本発明は、上述した課題を解決するために、飛び越し走査のMPEG2画像情報圧縮情報(ビットストリーム)を入力とし、ピクチャタイプ判別部、圧縮情報解析部、MPEG2画像情報復号化部(I/Pピクチャ)、間引き部、MPEG4画像情報符号化部(I/P−VOP)、動きベクトル合成部、動きベクトル検出部、情報バッファ、VOPコンプレキシティ算出部、マクロブロックアクティビティ算出部、VOP目標符号量算出部及び仮想バッファを兼ね備え、MPEG4画像情報符号化部における符号量制御の過程において、入力となるMPEG2画像圧縮情報(ビットストリーム)における、各マクロブロックに対するアクティビティ情報から、出力となるMPEG4画像圧縮情報(ビットストリーム)における各マクロブロックに対するアクティビティ情報の推定値を算出し、これを仮想バッファの更新において利用することで、符号量制御のステップに伴う参照量子化スケールの変動を最小限に抑え、各マクロブロックに対する符号量割当が画像に対して最適化された状態で、順次走査のMPEG4画像圧縮情報(ビットストリーム)を出力する手段を提供するものである。
【0099】
上記構成において、ピクチャタイプ判別部は、入力となるMPEG2画像圧縮情報(ビットストリーム)内で、I/Pピクチャに関するものだけ残してBピクチャに関するものは廃棄する。圧縮情報解析装置は、1GOP分の遅延を実現すると同時に、入力となるMPEG2画像圧縮情報(ビットストリーム)内で、各フレームに対して割り当てられた符号量(ビット数)及び各フレームにおける平均量子化スケール、並びに、各フレームにおいて、後段のMPEG4画像圧縮情報でそれぞれの擬似スライスを構成するマクロブロック全体に渡る平均量子化スケール及び発生符号量(ビット数)を抽出する。MPEG2画像情報復号化装置(I/Pピクチャ)は、ピクチャタイプ判別部の出力となる、I/Pピクチャに関する圧縮情報(ビットストリーム)を、水平方向垂直方向ともに、8次の離散コサイン係数全てを用いた、若しくはその低域成分のみを用いた復号処理を行う。間引き部は、MPEG2画像情報復号化部(l/Pピクチャ)の出力である画像情報の第一フィールド若しくは第二フイールドのみを取り出して順次走査画像への変換を行うと同時に、所望の画枠サイズに変換するためのダウンサンプリングを行う。MPEG4画像情報符号化部(I/P−VOP)は、間引き部の出力となる画像情報をMPEG4符号化方式により符号化する。動きベクトル合成部は、MPEG2画像情報復号化部(I/Pピクチャ)で検出された、入力となる画像圧縮情報(ビットストリーム)内の動きベクトル値を元に、走査変換後の画像データに対する動きベクトル値にマッピングを行う。動きベクトル検出装置は、動きベクトル合成部から出力される動きベクトル値を元に、高精度の動きベクトル検出を行う。情報バッファは、圧縮情報解析部において抽出された、入力となるMPEG2画像圧縮情報(ビットストリーム)における各フレームに割り当てられた符号量(ビット数)及び各フレームに対する平均量子化スケール、並びに、各マクロブロックに対する量子化スケール及び発生符号量(ビット数)を格納する。VOPコンプレキシティ算出部は、情報バッファに格納された、入力となるMPEG2画像圧縮情報(ビットストリーム)における、各フレームに割り当てられた符号量(ビット数)、及び各フレームに対する平均量子化スケールから、出力となるMPEG4画像圧縮情報(ビットストリーム)における各VOPに対するコンプレキシティの推定値を算出する。マクロブロックアクティビティ算出部は、情報バッファに格納された、入力となるMPEG2画像圧縮情報(ビットストリーム)における、各マクロブロックに対する符号量(ビット数)及び量子化スケールから、出力となるMPEG4画像圧縮情報(ビットストリーム)における各マクロブロックに対するアクティビティの推定値を算出する。VOP目標符号量算出部は、VOPコンプレキシティ算出部において算出された、各VOPに対するコンプレキシティに基づいて各VOPに対する目標符号量(ターゲットビット)の算出を行う。仮想バッファは、VOP目標符号量算出部において算出された、当該VOPに対する目標符号量(ターゲットビット)及びマクロブロックアクティビティ算出部において算出された、出力となるMPEG4画像圧縮情報(ビットストリーム)内の各マクロブロックに対するアクティビティの推定値から、各VOPに対する仮想バッファ占有量を算出し、その情報をMPEG4画像情報符号化部(I/P−VOP)に伝送する。
【0100】
なお、ピクチャタイプ判別部を持たず、フレームレートの変換を行わない装置構成も可能である。また、VOP目標符号量算出部において、入力となるMPEG2画像圧縮情報(ビットストリーム)における各フレームに対するコンプレキシティを用いず、MPEG2 Test Mode1 5に定められているのと同様の方式により各VOPに対する目標符号量を算出する装置構成も考えられる。
【0101】
【発明の実施の形態】
以下、図面を参照し、本発明の実施例について説明する。
【0102】
まず、本発明を適用した第1の実施の形態の画像情報変換装置について、図1を参照して説明する。
【0103】
この画像情報変換装置は、ピクチャタイプ判別部16と、圧縮情報解析部17と、MPEG2画像情報復号化部(I/Pピクチャ)18と、間引き部19と、MPEG4画像情報符号化部(I/P−VOP)20と、動きベクトル合成部21と、動きベクトル検出部22と、情報バッファ23と、VOPコンプレキシティ算出部24と、マクロブロックアクティビティ算出部25と、VOP目標符号量算出部26と、仮想バッファ27とから構成されている。
【0104】
この画像情報変換装置には、フレーム内で符号化されたイントラ符号化画像(Iピクチャ;I)、表示順序で順方向を参照して予測符号化された順方向予測符号化画像(Pピクチャ;P)及び表示順序で順方向及び逆方向を参照して予測符号化された双方向予測符号化画像(Bピクチャ;B)から構成される飛び越し走査のMPEG2画像圧縮情報(ビットストリーム)が入力される。
【0105】
このMPEG2画像圧縮情報(ビットストリーム)は、ピクチャタイプ判別部16において、I/Pピクチャに関するものか、Bピクチャに関するものであるかを判別され、I/Pピクチャのみ後続の圧縮情報解析部17に出力され、Bピクチャは破棄される。
【0106】
圧縮情報解析部17において、MPEG2画像情報復号化装置(I/Pピクチャ)18における復号処理に用いられる量子化スケールのフレーム全体に渡る平均値Q、及び、入力となるMPEG2画像圧縮情報(ビットストリーム)において、当該フレームに割り当てられた総符号量(ビット数)Bは、情報バッファ23に格納される。
【0107】
MPEG2画像情報復号化部(I/Pピクチャ)18における処理は通常のMPEG2画像情報復号化装置と同様に、MPEG2画像圧縮情報(ビットストリーム)を画像信号に復号するものである。ここで、Bピクチャに関するデータはピクチャタイプ判別部16において廃棄されているので、MPEG2画像情報復号化部(I/Pピクチャ)18は、I/Pピクチャのみを復号化出来る機能を有すればよい。
【0108】
MPEG2画像情報復号化部(I/Pピクチャ)18の出力となる画素値は、間引き部19に入力される。間引き部19は、水平方向には1/2の間引き処理を施し、垂直方向には、第一フィールド若しくは第二フィールドのどちらか一方のデータのみを残し、もう一方を廃棄する。このような間引きによって、入力となる画像情報の1/4の大きさを持つ順次走査画像を生成する。
【0109】
ところで、間引き部19から出力された画像をMPEG4画像情報符号化部(I/P−VOP)20において16×16画素で構成されるマクロブロック単位で符号化するためには、水平方向、垂直方向ともに、その画素数が16の倍数である必要が有る。間引き部19においては、このための画素の補填若しくは廃棄を、間引きと同時に行う。
【0110】
例えば、入力となるMPEG2画像圧縮情報(ビットストリーム)がNTSC(National Television System Committee)の規格に準拠したもの、つまり720×480画素、30Hzの飛び越し走査画像であった場合、間引き後の画枠はSIF(360×240画素)サイズということになる。この画像に対して、間引き部19において、例えば水平方向の右端若しくは左端の8ラインを廃棄して352×240画素とする。
【0111】
なお、間引き部19における動作の変更を行うことで、これ以外の画枠、例えば上記の例で、約1/4×1/4の画枠であるQSIF(176×112画素)サイズの画像に変換することも可能である。
【0112】
更に、上述した文献1は、MPEG2画像情報復号化部(I/Pピクチャ)18における処理として、水平方向、垂直方向それぞれについて、入力となるMPEG2画像圧縮情報(ビットストリーム)内の、8次の離散コサイン変換係数すべてを用いた復号処理を行う画像情報変換装置について述べられているが、図1に示した装置に関してはその限りではなく、水平方向のみ、或いは水平方向、垂直方向ともに、8次の離散コサイン変換係数のうちの低域成分のみを用いた復号処理を行い、画質劣化を最小限に抑えながら、復号処理に伴う演算量とビデオメモリ容量を削減することが可能である。
【0113】
間引き部19によって生成された順次走査画像はMPEG4画像情報符号化部(I/P−VOP)20によってフレーム内で符号化されたI−VOP及び表示順序で順方向を参照して予測符号化されたP−VOPに符号化され、MPEG4画像圧縮情報(ビットストリーム)として出力される。
【0114】
尚、VOPはVideo object Planeを意味し、MPEG2におけるフレームに相当するものである。また、I−VOPはIピクチャに対応するイントラ符号化VOP、P−VOPはPピクチャに対応する順方向予測符号化VOP、B−VOPはBピクチャに対応する双方向予測符号化VOPである。
【0115】
MPEG4画像情報符号化部(I/P−VOP)20における符号化の際には、入力となるMPEG2画像圧縮情報(ビットストリーム)中の動きベクトル情報は、動きベクトル合成部21において間引き後の画像情報に対する動きベクトルにマッピングされ、動きベクトル検出部22においては、動きベクトル合成部21において合成された動きベクトル値を元に高精度の動きベクトルを検出する。
【0116】
図1における圧縮情報解析部17で抽出された、入力となるMPEG2画像圧縮情報(ビットストリーム)における各フレームに割り当てられた符号量(ビット数)及び各フレームに対する平均量子化スケールが情報バッファ17に格納され、出力となるMPEG4画像圧縮情報(ビットストリーム)における当該VOPに対する目標符号量を算出する際に用いられるが、同時に、入力となるMPEG2画像圧縮情報(ビットストリーム)における、各マクロブロックに対する割当符号量及び量子化スケールもまた、情報バッファ17に格納される。
【0117】
今、図1に示した画像情報変換装置を用いて、入力となる飛び越し走査のMPEG2画像圧縮情報(ビットストリーム)の、1/2×1/2の画枠サイズを持つ、順次走査のMPEG4画像圧縮情報(ビットストリーム)が出力される場合を考える。この時、入力となるMPEG2画像圧縮情報(ビットストリーム)におけるマクロブロックと、出力となるMPEG4画像圧縮情報(ビットストリーム)におけるマクロブロックの対応関係を図2に示す。すなわち、入力となるMPEG2画像圧縮情報(ビットストリーム)における4つのマクロブロックMB0,MB1,MB2m,MB2m+1により構成される領域aが、出力となるMPEG4画像圧縮情報(ビットストリーム)においては、1つのマクロブロックMb0に対応する。
【0118】
このような対応関係に応じて、マクロブロックアクティビティ算出部25においては、まず、入力となるMPEG2画像圧縮情報(ビットストリーム)内での各マクロブロックに対するアクティビティを算出する。すなわち、入力となるMPEG2画像圧縮情報(ビットストリーム)において、マクロブロックMBkに割り当てられた符号量(ビット数)をBMBk量子化スケールをQMBkとすれば、当該マクロブロックに対するコンプレキシティXMBkは、次の式(26)によって与えられる。
【0119】
【数32】
Figure 0004517475
【0120】
次に、マクロブロックアクティビティ算出部25において、式(26)によって算出された、入力となるMPEG2画像圧縮情報(ビットストリーム)内での各マクロブロックMb1に対するアクティビティXMb1から、出力となるMPEG4画像圧縮情報(ビットストリーム)内での各マクロブロックMb1に対するアクティビティXMb1を算出し、仮想バッファ27に伝送する。図2の例においては、次の式(27)によって与えられる。
【0121】
【数33】
Figure 0004517475
【0122】
fとして平均値を用いる場合には、次の式(28)となる。
【0123】
【数34】
Figure 0004517475
【0124】
fに関しては式(28)に限らず、例えば入力となる複数のデータの最小値を取る関数等でも良い。
【0125】
更に、また、マクロブロックアクティビティ算出部25においては、当該VOP全体に渡るXMbkの合計Xtotalを次の式(29)のように算出し、仮想バッファ27に伝送する。ここでΩは当該VOP全体を意味する。
【0126】
【数35】
Figure 0004517475
【0127】
仮想バッファ27においては、式(7)に対応して、仮想バッファ(dj i,dj p,dj b)の占有量を式(30)のように求める。
【0128】
【数36】
Figure 0004517475
【0129】
各VOP符号化終了時の仮想バッファ占有量(dMB_cnt i,dMB_cnt p,dMB_cnt b)はそれぞれ同一のピクチャタイプで、次のVOPに対する仮想バッファ占有量の初期値(d0 i,d0 p,d0 b)として用いられる。
【0130】
以上、MPEG4画像情報符号化部(I/P−VOP)20における符号量制御の動作フローを図3に示す。
【0131】
最初のステップS31において、圧縮情報解析部17は、ピクチャタイプ判別部16を介して入力されたMPEG2画像圧縮情報(ビットストリーム)の構文を解析し、各フレームに対する割当符号量(ビット数)及び各フレームにおける平均量子化スケールに関する情報を抽出し、情報バッファ23に格納する。同時に、入力となるMPEG2画像圧縮情報(ビットストリーム)における、各マクロブロックに対する割当符号量及び量子化スケールも格納する。
【0132】
ステップS32において、VOPコンプレキシティ算出部24は、情報バッファ23に格納された、入力となるMPEG2画像圧縮情報(ビットストリーム)内の、各フレームに対する割当符号量(ビット数)及び各フレームにおける平均量子化スケールに関する情報から、各VOPに対するコンプレキシティの推測値を1GOV分算出する。
【0133】
ステップS33において、VOP目標符号量算出部26は、各VOPに対する目標符号量(ターゲットビット)を算出し、仮想バッファ27に転送する。
【0134】
ステップS34において、マクロブロックアクティビティ算出部25は、入力となるMPEG2画像圧縮情報(ビットストリーム)内での各マクロブロックに対するアクティビティを算出する。
【0135】
ステップS35において、マクロブロックアクティビティ算出部25は、各VOP内でのマクロブロックに対するアクティビティの推定値を算出し、仮想バッファ27に転送する。
【0136】
ステップS36において、仮想バッファ(dj i,dj p,dj b)の占有量を求める。そして、ステップS37において、MPEG4画像情報符号化部(I/P−VOP)部20は、視覚特性を考慮したマクロブロックごとの適応量子化を行う。
【0137】
次に、本発明を適用した第2の実施の形態の画像情報変換装置について、図4を参照して説明する。
【0138】
この画像情報変換装置は、ピクチャタイプ判別部28と、圧縮情報解析部29と、MPEG2画像情報復号化部(I/Pピクチャ)30と、間引き部31と、MPEG4画像情報符号化部(I/P−VOP)32と、動きベクトル合成部33と、動きベクトル検出部34と、情報バッファ34と、マクロブロックアクティビティ算出部36と、VOP目標符号量算出部37と、仮想バッファ38とから構成されている。
【0139】
図1に示した画像情報変換装置と図4に示した画像情報変換装置における相違点は、図1に示した画像情報変換装置においては、MPEG4画像情報符号化装置(I/P−VOP)20における、各VOPに対する目標符号量(ターゲットビット)を式(25)により算出するのに対し、図4に示した画像情報変換部においては、MPEG4画像情報符号化部(I/P−VOP)32における、各VOPに対する目標符号量(ターゲットビット)を式(4)により算出する点にある。すなわち、図4に示した画像情報変換装置においては、圧縮情報解析部29において、入力となるMPEG2画像圧縮情報(ビットストリーム)におけるGOP構造を抽出してこれを情報バッファ35に格納し、これより、VOP目標符号量算出部37においては、出力となるMPEG4画像圧縮情報(ビットストリーム)におけるGOV構造を決定し、式(4)に基づいて各VOPに対する目標符号量(ターゲットビット)の算出を行う。
【0140】
以上、入力としてMPEG2画像圧縮情報(ビットストリーム)を、出力としてMPEG4画像圧縮情報(ビットストリーム)を対象としてきたが、入力、出力ともこれに限らず、例えばMPEG−1やH.263などの画像圧縮情報(ビットストリーム)でも良い。
【0141】
【発明の効果】
以上述べてきた様に、本発明は、飛び越し走査のMPEG2画像圧縮情報(ビットストリーム)を入力とし、入力となるMPEG2画像圧縮情報(ビットストリーム)内での各マクロブロックに対するアクティビティ情報から、出力となるMPEG4画像圧縮情報(ビットストリーム)内での各マクロブロックに対するアクティビティ情報の推定値を算出し、これを用いて、MPEG4画像符号化における仮想バッファの更新を行うことで、符号量制御におけるコンプレキシティを算出するステップに伴う参照量子化スケールの変動を最小限に抑え、各マクロブロックに対する符号量割当が画像に対して最適化された状態で順次走査のMPEG4画像圧縮情報(ビットストリーム)に変換して出力する手段を提供するものである。
【図面の簡単な説明】
【図1】第1の実施の形態の画像情報変換装置の構成を示すブロック図である。
【図2】MPEG2画像圧縮情報(ビットストリーム)及びMPEG4画像圧縮情報(ビットストリーム)におけるマクロブロックの対応関係を示す図である。
【図3】コンプレキシティを用いて符号量制御を行う動作フローを示す図である。
【図4】第2の実施の形態の画像情報変換装置の構成を示すブロック図である。
【図5】従来の画像情報変換装置の構成を示すブロック図である。
【図6】MPEG2 Test Mode1 5(ISO/IEC JTC1/SC29/WG11 N0400)で述べられている符号量制御方式の動作原理を示すフローチャートである。
【図7】本願出願人が提案した画像情報変換装置の構成を示す図である。
【図8】図7の画像情報変換装置における符号量制御の動作を示すフローチャートである。
【図9】CCIRテストシーケンスの一つである“Flower Garden”を、n=15;m=3の条件の元で変換する際の、あるVOPに対するQjがどのような値を取るかを示した図である。
【符号の説明】
16 ピクチャタイプ判別部、17 圧縮情報解析部、18 MPEG2画像情報復号化部(I/Pピクチャ)、19 間引き部、20 MPEG4画像情報符号化部(I/P−VOP)、21 動きベクトル合成部、22 動きベクトル検出部、23 情報バッファ、24 VOPコンプレキシティ算出部、25 擬似スライスコンプレキシティ算出部、26 VOP目標符号量算出部、27 擬似スライス目標符号量算出部

Claims (13)

  1. 第1の圧縮符号化方式で圧縮された飛び越し走査の入力画像圧縮情報を、第2の圧縮符号化方式で圧縮された順次走査の出力画像圧縮情報に変換する画像情報変換装置において、
    上記入力画像圧縮情報及び上記出力画像圧縮情報を構成する符号化画像は、それぞれ複数の画素からなる画素ブロックから構成され、
    上記入力画像圧縮情報における画素ブロックの第1のアクティビティに基づいて、上記出力画像圧縮情報における画素ブロックの第2のアクティビティの推定値を算出するアクティビティ算出手段と、
    上記アクティビティ算出手段で算出した第2のアクティビティの推定値を利用し、仮想バッファのバッファ占有量に基づいて上記出力画像圧縮情報の各符号化画像での参照量子化スケールを均一化するレート制御を行い、画像情報を上記出力画像圧縮情報に変換する変換手段とを有し、
    上記アクティビティ算出手段は、上記第1のアクティビティを、上記入力画像圧縮情報の符号化画像を構成する画素ブロックに対する量子化スケールと、割当ビット量との積により算出し、上記第2のアクティビティの推定値を、上記出力画像圧縮情報の画素ブロックに対応する上記入力画像圧縮情報の複数の画素ブロックのアクティビティの関数により算出する
    画像情報変換装置。
  2. 上記アクティビティ算出手段は、上記第1のアクティビティを次の式によって算出する請求項1記載の画像情報変換装置。
    Figure 0004517475
    ただし、上記入力画像圧縮情報の符号化画像を構成する画素ブロックMBに対する量子化スケールをQMBkと、割当ビット量をBMBkと、アクティビティをXMBkとする。
  3. 上記アクティビティ算出手段は、上記第2のアクティビティの推定値を次の式によって算出する請求項2記載の画像情報変換装置。
    Figure 0004517475
    ただし、上記入力画像圧縮情報の符号化画像を構成する画素ブロックMB,MBk+1,…のアクティビティをXMBk,XMBk+1,…と、上記出力画像圧縮情報の符号化画像を構成する画素ブロックの内の上記画素ブロックMB,MBk+1,…に対応する画素ブロックMbのアクティビティをXMblとする。また、関数をfとする。
  4. 上記関数fとして、入力データの平均値を出力する関数を用いる請求項3記載の画像情報変換装置。
  5. 上記関数fとして、入力データの最小値を出力する関数を用いる請求項3記載の画像情報変換装置。
  6. 上記アクティビティ算出手段は、上記出力画像圧縮情報の符号化画像を構成する画素ブロックの第2のアクティビティの総和を次の式によって算出し、
    Figure 0004517475
    (ただし、上記出力画像圧縮情報の符号化画像に含まれる全ての画素ブロックの集合をΩと、上記符号化画像のアクティビティの総和をXtotalとする。)
    上記出力画像圧縮情報は、フレーム内で符号化するイントラ符号化画像、表示順序で順方向を参照する順方向予測符号化画像、表示順序で順方向及び逆方向を参照する双方向予測符号化画像から構成され、上記変換手段は上記符号化画像の画素ブロックにおける仮想バッファの占有量を次の式によって与える請求項3記載の画像情報変換装置。
    Figure 0004517475
    (ただし、上記出力画像圧縮情報を構成するイントラ符号化画像、順方向予測符号化画像及び双方向予測符号化画像に対して、それぞれ、目標符号量をT,T,Tと、仮想バッファの占有量の初期値をd 、d 、d と、各符号化画像内でj番目の画素ブロックにおける仮想バッファの占有量をd ,d ,d とする。また、各符号化画像内で先頭からj番目の画素ブロックまでの発生ビット量をBとする。)
  7. 上記変換手段は、イントラ符号化画像、順方向予測符号化画像及び双方向予測符号化画像のそれぞれの種類について、直前に変換した符号化画像の処理終了時における値を、同一の種類の新規な符号化画像の仮想バッファの占有量の初期値とする請求項6記載の画像情報変換装置。
  8. 上記出力画像圧縮情報は、フレーム内で符号化するイントラ符号化画像、表示順序で順方向を参照する順方向予測符号化画像、表示順序で順方向及び逆方向を参照する双方向予測符号化画像から構成され、上記イントラ符号化画像及び上記順方向予測符号化画像を通過させるが、上記双方向予測符号化画像を破棄する判別手段を有する請求項1記載の画像情報変換装置。
  9. 上記第1の圧縮符号化方式はMPEG2であり、上記第2の圧縮符号化方式はMPEG4である請求項1記載の画像情報変換装置。
  10. 第1の圧縮符号化方式で圧縮された飛び越し走査の入力画像圧縮情報を、第2の圧縮符号化方式で圧縮された順次走査の出力画像圧縮情報に変換する画像情報変換方法において、
    上記入力画像圧縮情報及び上記出力画像圧縮情報を構成する符号化画像は、それぞれ複数の画素からなる画素ブロックから構成され、
    上記入力画像圧縮情報における画素ブロックの第1のアクティビティに基づいて、上記出力画像圧縮情報における画素ブロックの第2のアクティビティの推定値を算出し、
    上記第2のアクティビティの推定値を利用し、仮想バッファのバッファ占有量に基づいて上記出力画像圧縮情報の各符号化画像での参照量子化スケールを均一化するレート制御を行い、画像情報を上記出力画像圧縮情報に変換し、
    上記第1のアクティビティを、上記入力画像圧縮情報の符号化画像を構成する画素ブロックに対する量子化スケールと、割当ビット量との積により算出し、上記第2のアクティビティの推定値を、上記出力画像圧縮情報の画素ブロックに対応する上記入力画像圧縮情報の複数の画素ブロックのアクティビティの関数により算出する
    画像情報変換方法。
  11. 上記第1のアクティビティを次の式によって算出すると共に、
    Figure 0004517475
    (ただし、上記入力画像圧縮情報の符号化画像を構成する画素ブロックMBに対する量子化スケールをQMBkと、割当ビット量をBMBkと、アクティビティをXMBkとする。)
    上記第2のアクティビティの推定値を次の式によって算出する
    請求項10記載の画像情報変換方法。
    Figure 0004517475
    (ただし、上記入力画像圧縮情報の符号化画像を構成する画素ブロックMB,MBk+1,…のアクティビティをXMBk,XMBk+1,…と、上記出力画像圧縮情報の符号化画像を構成する画素ブロックの内の上記画素ブロックMB,MBk+1,…に対応する画素ブロックMbのアクティビティをXMblとする。また、関数をfとする。)
  12. 第1の圧縮符号化方式で圧縮された飛び越し走査の入力画像圧縮情報を復号して得られる画像情報を、第2の圧縮符号化方式で圧縮された順次走査の出力画像圧縮情報に符号化する符号化装置において、
    上記入力画像圧縮情報及び上記出力画像圧縮情報を構成する符号化画像は、それぞれ複数の画素からなる画素ブロックから構成され、
    上記入力画像圧縮情報における画素ブロックの第1のアクティビティに基づいて算出された、上記出力画像圧縮情報における画素ブロックの第2のアクティビティの推定値を受け取る受け取り手段と、
    上記受け取り手段からの第2のアクティビティの推定値を利用し、仮想バッファのバッファ占有量に基づいて上記出力画像圧縮情報の各符号化画像での参照量子化スケールを均一化するレート制御を行い、画像情報を上記出力画像圧縮情報に符号化する符号化手段とを有し、
    上記受け取り手段は、上記入力画像圧縮情報の符号化画像を構成する画素ブロックに対する量子化スケールと、割当ビット量との積により算出された上記第1のアクティビティと、上記出力画像圧縮情報の画素ブロックに対応する上記入力画像圧縮情報の複数の画素ブロックのアクティビティの関数により算出された上記第2のアクティビティの推定値とを受け取る
    符号化装置。
  13. 第1の圧縮符号化方式で圧縮された飛び越し走査の入力画像圧縮情報を復号して得られる画像情報を、第2の圧縮符号化方式で圧縮された順次走査の出力画像圧縮情報に符号化する符号化方法において、
    上記入力画像圧縮情報及び上記出力画像圧縮情報を構成する符号化画像は、それぞれ複数の画素からなる画素ブロックから構成され、
    上記入力画像圧縮情報における画素ブロックの第1のアクティビティに基づいて算出された、上記出力画像圧縮情報における画素ブロックの第2のアクティビティの推定値を受け取る受け取り工程と、
    上記受け取り工程からの第2のアクティビティの推定値を利用し、仮想バッファのバッファ占有量に基づいて上記出力画像圧縮情報の各符号化画像での参照量子化スケールを均一化するレート制御を行い、画像情報を上記出力画像圧縮情報に符号化する符号化工程とを有し、
    上記受け取り工程では、上記入力画像圧縮情報の符号化画像を構成する画素ブロックに対する量子化スケールと、割当ビット量との積により算出された上記第1のアクティビティと、上記出力画像圧縮情報の画素ブロックに対応する上記入力画像圧縮情報の複数の画素ブロックのアクティビティの関数により算出された上記第2のアクティビティの推定値とを受け取る
    符号化方法。
JP2000225846A 2000-07-26 2000-07-26 画像情報変換装置及び方法並びに符号化装置及び方法 Expired - Fee Related JP4517475B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000225846A JP4517475B2 (ja) 2000-07-26 2000-07-26 画像情報変換装置及び方法並びに符号化装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000225846A JP4517475B2 (ja) 2000-07-26 2000-07-26 画像情報変換装置及び方法並びに符号化装置及び方法

Publications (2)

Publication Number Publication Date
JP2002044668A JP2002044668A (ja) 2002-02-08
JP4517475B2 true JP4517475B2 (ja) 2010-08-04

Family

ID=18719560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000225846A Expired - Fee Related JP4517475B2 (ja) 2000-07-26 2000-07-26 画像情報変換装置及び方法並びに符号化装置及び方法

Country Status (1)

Country Link
JP (1) JP4517475B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4747494B2 (ja) * 2004-03-03 2011-08-17 ソニー株式会社 データ処理装置およびその方法と符号化装置
CN101171843B (zh) 2005-03-10 2010-10-13 高通股份有限公司 用于多媒体处理的内容分类
US8879635B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Methods and device for data alignment with time domain boundary
US8948260B2 (en) 2005-10-17 2015-02-03 Qualcomm Incorporated Adaptive GOP structure in video streaming
US9131164B2 (en) 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus
JP4788653B2 (ja) * 2007-05-14 2011-10-05 Kddi株式会社 画像データトランスコーディング装置及びトランスコーディング方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09512410A (ja) * 1995-02-15 1997-12-09 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ ビデオ信号の符号変換方法および装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09512410A (ja) * 1995-02-15 1997-12-09 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ ビデオ信号の符号変換方法および装置

Also Published As

Publication number Publication date
JP2002044668A (ja) 2002-02-08

Similar Documents

Publication Publication Date Title
JP4517495B2 (ja) 画像情報変換装置及び画像情報変換方法並びに符号化装置及び符号化方法
US7170938B1 (en) Rate control method for video transcoding
EP1549074A1 (en) A bit-rate control method and device combined with rate-distortion optimization
JP4391809B2 (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
US9113194B2 (en) Method and system for interleaving video and data for transmission over a network at a selected bit rate
JPH07264580A (ja) 映像信号伝送方法並びに映像信号送信装置及び映像信号受信装置
JPH07322269A (ja) ビデオデータを有するビットストリームを符号変換する方法および装置
MXPA04008889A (es) Metodo para la codificacion de movimiento en una secuencia de video.
JP2002152759A (ja) 画像情報変換装置および画像情報変換方法
US7092442B2 (en) System and method for adaptive field and frame video encoding using motion activity
EP1575294A1 (en) Method and apparatus for improving the average image refresh rate in a compressed video bitstream
JP4517475B2 (ja) 画像情報変換装置及び方法並びに符号化装置及び方法
JP2000236547A (ja) 画像情報変換装置及び画像情報変換方法
JP4517453B2 (ja) 画像情報変換装置及び方法並びに符号化装置及び方法
JP4608801B2 (ja) 画像情報変換装置及び方法
US6040875A (en) Method to compensate for a fade in a digital video input sequence
JP4517465B2 (ja) 画像情報変換装置及び方法並びに符号化装置及び方法
JP2002125227A (ja) 画像情報変換装置及び方法
Yang et al. A rate control algorithm for MPEG-2 to H. 264 real-time transcoding
JP4517468B2 (ja) 画像情報変換装置及び方法並びに符号化装置及び方法
KR100770873B1 (ko) 영상 부호화시 비트율 제어 방법 및 장치
JP4292659B2 (ja) 画像情報変換装置及び画像情報変換方法
JP2001346214A (ja) 画像情報変換装置及び方法
US7012959B2 (en) Picture information conversion method and apparatus
Xin Improved standard-conforming video transcoding techniques

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081202

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100510

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees