JP4517465B2 - Image information converting apparatus and method, and encoding apparatus and method - Google Patents

Image information converting apparatus and method, and encoding apparatus and method Download PDF

Info

Publication number
JP4517465B2
JP4517465B2 JP2000190056A JP2000190056A JP4517465B2 JP 4517465 B2 JP4517465 B2 JP 4517465B2 JP 2000190056 A JP2000190056 A JP 2000190056A JP 2000190056 A JP2000190056 A JP 2000190056A JP 4517465 B2 JP4517465 B2 JP 4517465B2
Authority
JP
Japan
Prior art keywords
image
information
encoded
scene change
compression information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000190056A
Other languages
Japanese (ja)
Other versions
JP2002010266A (en
Inventor
数史 佐藤
武文 名雲
邦明 高橋
輝彦 鈴木
陽一 矢ケ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2000190056A priority Critical patent/JP4517465B2/en
Publication of JP2002010266A publication Critical patent/JP2002010266A/en
Application granted granted Critical
Publication of JP4517465B2 publication Critical patent/JP4517465B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、画像情報を変換する画像情報変換装置及び方法並びに符号化装置及び方法に関し、詳しくは、離散コサイン変換等の直交変換と動き補償によって圧縮されたMPEG等の画像情報(ビットストリーム)を衛星放送、ケーブルTV、インターネット等のネットワークメディアを介して受信する際に、若しくは光、磁気ディスクのような記憶メディア上で処理する際に用いられる画像情報を変換する画像情報変換装置及び方法並びに符号化装置及び方法に関する。
【0002】
【従来の技術】
近年、画像情報をディジタルとして取り扱い、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮するMPEGなどの画像情報圧縮方式が提供されている。そして、このような画像情報圧縮方法に準拠した装置は、放送局などの情報配信、及び一般家庭における情報受信の双方において普及しつつある。
【0003】
特に、MPEG2(ISO/IEC 13818−2)は、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する、汎用画像符号化方式として定義されている。
【0004】
すなわち、MPEG2符号化圧縮方式によれば、例えば、720×480画素を持つ標準解像度の飛び越し走査画像に4〜8Mbpsの符号量(ビットレート)を割り当て、1920×1088画素を持つ高解像度の飛び越し走査画像に対して18〜22Mbpsの符号量(ビットレート)を割り当てることにより、高い圧縮率と良好な画質の実現が可能となる。
【0005】
このようなことから、MPEG2は、プロフェッショナル用途及びコンシューマー用途の広範なアプリケーションに今後とも用いられるものと予想される。 しかし、MPEG2は、主として放送用に適合する高画質符号化を対象としており、例えばMPEG1より低い符号量(ビットレート)、つまりより高い圧縮率の符号化方式には対応していなかった。
【0006】
一方で、近年の携帯端末の普及により、今後とも高い圧縮率の符号化方式のニーズは高まると思われ、これに対応して、高い圧縮率を有するMPEG4符号化方式の標準化が行われている。この画像符号化方式に関しては、1998年12月にISO/IEC 14496−2として国際標準の規格が承認された。
【0007】
ところで、ディジタル放送用に一度符号化されたMPEG2画像圧縮情報(ビットストリーム)を、携帯端末上等で処理するのにより適した、より低い符号量(ビットレート)の画像圧縮情報(ビットストリーム)に変換したいというニーズがある。
【0008】
かかる目的を達成するために、“Field-to-Frame Transcoding with Spatial and Temporal Downsampling”(Susie L Wee, John G. Apostolopoulos, and Nick Feamster, ICIP 99、以下これを文献1と呼ぶ)により、図8に示すような画像情報変換装置(トランスコーダ)が提供されている。
【0009】
この文献1において提供された画像情報変換装置(トランスコーダ)は、図8に示すように、ピクチャタイプ判別部1と、MPEG2画像情報復号化部(I/Pピクチャ)2と、間引き部3と、MPEG4画像情報符号化部(I/P−VOP)4と、動きベクトル合成部5と、動きベクトル検出部6とから構成されている。
【0010】
この画像情報変換装置には、フレーム内で符号化されたイントラ符号化画像(Iピクチャ;I)、表示順序で順方向を参照して予測符号化された順方向予測符号化画像(Pピクチャ;P)及び表示順序で順方向及び逆方向を参照して予測符号化された双方向予測符号化画像(Bピクチャ;B)から構成される飛び越し走査のMPEG2画像圧縮情報(ビットストリーム)が入力される。
【0011】
このMPEG2画像圧縮情報(ビットストリーム)は、ピクチャタイプ判別部1において、I/Pピクチャに関するものか、Bピクチャに関するものであるかを判別され、I/Pピクチャのみ後続のMPEG2画像情報復号化部(I/Pピクチャ)2に出力され、Bピクチャは破棄される。
【0012】
MPEG2画像情報復号化部(I/Pピクチャ)2における処理は通常のMPEG2画像情報復号化装置と同様に、MPEG2画像圧縮情報(ビットストリーム)を画像信号に復号するものである。
【0013】
MPEG2画像情報復号化部(I/Pピクチャ)2の出力となる画素値は、間引き部3に入力される。間引き部3は、水平方向には1/2の間引き処理を施し、垂直方向には、第一フィールド若しくは第二フィールドのどちらか一方のデータのみを残し、もう一方を廃棄する。このような間引きによって、入力となる画像情報の1/4の大きさを持つ順次走査画像を生成する。
【0014】
間引き部3によって生成された順次走査画像はMPEG4画像情報符号化部(I/P−VOP)4によってフレーム内で符号化されたI−VOP及び表示順序で順方向を参照して予測符号化されたP−VOPに符号化され、MPEG4画像圧縮情報(ビットストリーム)として出力される。尚、VOPはVideo object Planeを意味し、MPEG2におけるフレームに相当するものである。
【0015】
その際、入力となるMPEG2画像圧縮情報(ビットストリーム)中の動きベクトル情報は、動きベクトル合成部5において間引き後の画像情報に対する動きベクトルにマッピングされ、動きベクトル検出部6においては、動きベクトル合成部5において合成された動きベクトル値を元に高精度の動きベクトルを検出する。
【0016】
文献1は、入力となるMPEG2画像圧縮情報(ビットストリーム)の1/2×1/2の大きさを持つ順次走査画像のMPEG4画像圧縮情報(ビットストリーム)を生成する画像情報変換装置に関して記述している。すなわち、例えば入力となるMPEG2画圧縮情報(ビットストリーム)がNTSC(National Television System Committee)の規格に準拠したものであった場合、出力となるMPEG4画像圧縮情報はSIFサイズ(352×240画素)ということになる。
【0017】
ところで、図8に示した画像情報変換装置においては、MPEG4画像情報符号化部(I/P−VOP)4における符号量制御が、出力となるMPEG4画像圧縮情報(ビットストリーム)における画質を決定する大きな要因となる。ISO/IEC 14496−2においては、符号量制御の方式に関しては特に規定されておらず、各ベンダが、アプリケーションに応じて、演算量及び出力画質の観点から最適と考えられる方式を用いることが出来る。以下では、代表的な符号量制御方式として、MPEG2 Test Model 5(ISO/IEC JTC1/SC29/WG11 N0400)で述べられている方式について述べる。
【0018】
この符号量制御のフローを図9に示すフローを用いて説明する。最初のステップS11において、画像情報符号化部(I/P−VOP)4は、目標符号量(ターゲットビットレート)、及び、GOP(group of pictures)構成を入力変数として、各ピクチャヘのビット配分を行う。ここで、GOPとは、ランダムアクセス可能なピクチャの組である。
【0019】
すなわち、ステップS11において、画像情報符号化部(I/P−VOP)4は、GOP内の各ピクチャに対する割り当てビット量を、割り当て対象ピクチャを含めGOP内でまだ復号化されていないピクチャに対して割り当てられるビット量(以下、これをRとする)を基に配分する。この配分をGOP内の符号化ピクチャ順に繰り返す。その際、以下に述べる2つの仮定を用いて各ピクチャヘの符号量割り当てを行う。
【0020】
まず、第一に、各ピクチャを符号化する際に用いる平均量子化スケールコードと発生符号量の積は、画面が変化しない限り、ピクチャタイプ毎に一定値となると仮定する。そこで、各ピクチャを符号化した後、各ピクチャタイプ毎に、画面の複雑さを示す変数Xi,Xp,Xb(grobal complelxity measure)を次の式(1)によって更新する。
【0021】
【数4】

Figure 0004517465
【0022】
ここでSi,Sp,Sbはピクチャ符号化時の発生符号ビット量であり、Qi,Qp,Qbは、ピクチャ符号化時の平均量子化スケールコードである。また、初期値は、目標符号量(ターゲットビットレート)bit_rate[bits/sec]を用いて、式(2)で示される値とする。
【0023】
【数5】
Figure 0004517465
【0024】
第二に、Iピクチャの量子化スケールコードを基準としたP,Bピクチャの量子化スケールコードの比率Kp,Kbが式(3)に定めた値となる場合に常に全体の画質が最適化されると仮定する。
【0025】
【数6】
Figure 0004517465
【0026】
すなわち、Bピクチャの量子化スケールコードは、I,Pピクチャの量子化スケールコードの常に1.4倍としている。これは、BピクチャをI,Pピクチャに比較して多少粗めに符号化することにより、Bピクチャで節約できる符号量をI,Pピクチャに加えると、I,Pピクチャの画質が改善され、これを参照するBピクチャの画質も改善されることを想定している。
【0027】
上記2つの仮定より、GOPの各ピクチャに対する割り当てビット量(Ti,Tp,Tb)は式(4)に示す値とする。
【0028】
【数7】
Figure 0004517465
【0029】
ここでNp,NbはGOP内でまだ符号化されていないP,Bピクチャの枚数である。
【0030】
このようにして求めた割当符号量を基にして、各ピクチャをステップS11,S12に従って符号化する毎に、GOP内の未符号化ピクチャに対して割り当てられるビット量Rを式(5)で更新する。
【0031】
【数8】
Figure 0004517465
【0032】
また、GOPの最初のピクチャを符号化する際には、式(6)によりRを更新する。
【0033】
【数9】
Figure 0004517465
【0034】
NはGOP内のピクチャ数である。また、シーケンスの最初でのRの初期値は0とする。
【0035】
次に、ステップS12において、画像情報符号化装置(I/P−VOP)4は、仮想バッファを用いたレート制御を行う。すなわち、ステップS12において、画像情報符号化装置(I/P−VOP)4は、ステップS11で式(4)により求められた各ピクチャに対する割当ビット量(Ti,Tp,Tb)と、実際の発生符号量を一致させるため、各ピクチャ毎に独立に設定した3種類の仮想バッファの容量を基に、量子化スケールコードを、マクロブロック単位のフィードバック制御で求める。
【0036】
まず、j番目のマクロブロック符号化に先立ち、仮想バッファの占有量を式(7)によって求める。
【0037】
【数10】
Figure 0004517465
【0038】
ここで、d0 i,d0 p,d0 bは各仮想バッファの初期占有量、Bjはピクチャの先頭からj番目のマクロブロックまでの発生ビット量、MB_cntは1ピクチャ内のマクロブロック数である。各ピクチャ符号化終了時の仮想バッファ占有量(dMB_cnt i,dMB_cnt p,dMB_cnt b)は、それぞれ同一のピクチャタイプで、次のピクチャに対する仮想バッファ占有量の初期値(d0 i,d0 p,d0 b)として用いられる。
【0039】
次に、j番目のマクロブロックに対する量子化スケールコードを式(8)により計算する。
【0040】
【数11】
Figure 0004517465
【0041】
ここで、rはリアクションパラメーターと呼ばれるフィードバックループの応答を制御する変数であり、式(9)により与えられる。
【0042】
【数12】
Figure 0004517465
【0043】
尚、符号化開始時における仮想バッファの初期値は式(10)で与えられる。
【0044】
【数13】
Figure 0004517465
【0045】
最後に、ステップS13において、画像情報符号化装置(I/P−VOP)4は、視覚特性を考慮したマクロブロック毎の適応量子化を行う。すなわち、ステップS13において、画像情報符号化部(I/P−VOP)4は、ステップS12で求められた量子化スケールコードを、視覚的に劣化の目立ちやすい平坦部でより細かく量子化し、劣化の比較的目立ちにくい絵柄の複雑な部分で粗く量子化するように、各マクロブロック毎のアクティビティと呼ばれる変数によって変化させている。
【0046】
アクティビティは、原画の輝度信号画素値を用い、フレーム離散コサイン変換モードにおける4個のブロックと、フィールド離散コサイン変換モードにおける4個のブロックとの、合計8ブロックの画素値を用いて式(11)で与えられる。
【0047】
【数14】
Figure 0004517465
【0048】
ここで、Pkは原画の輝度信号ブロック内画素値である。式(11)において最小値を採るのは、マクロブロック内の一部だけでも平坦部分のある場合には量子化を細かくするためである。
【0049】
更に、式(12)によりその値が0.5〜2の範囲を取る正規化アクティビティNactjを求める。
【0050】
【数15】
Figure 0004517465
【0051】
ここで、avg_actは、直前に符号化したピクチャでのactjの平均値である。
【0052】
視覚特性を考慮した量子化スケールコードmquantjはステップS12で得られた量子化スケールコードQjを基に式(13)で与えられる。
【0053】
【数16】
Figure 0004517465
【0054】
MPEG2 Test Model 5において定められた上記符号量制御方式には以下の制限のあることが知られており、実際の制御を行う場合には、これらの制限に対する対策が必要となる。すなわち、第一の制限は、第一ステップS11はシーンチェンジに対応出来ず、また、シーンチェンジ後には第三ステップS13で用いる媒介変数avg_actが間違った値となるということである。第二の制限は、MPEG2及びMPEG4において規定されているVBV(Video Buffer Verifier)の拘束条件を満たす保証がないことである。
【0055】
ところで、文献”MPEG圧縮効率の理論解析とその符号量制御への応用”(信学技報、IE−95, DSP95−10, 1995年5月、以下これを文献2と呼ぶ)でも述べられている通り、Test Model 5で定められている符号量制御方式は、MPEG−2画像符号化装置において、必ずしも良好な画質を与えるものではない。
【0056】
この文献2では、特に、良好な画質を与えるための、GOP内における各フレーム毎の最適な符号量配分を与える手法として以下の方式を提案している。すなわち、NI,NP,NBを、GOP内においてまだ符号化されていないI,P,Bピクチャの枚数として、これらに割り当てられる符号量をRI,RP,RBとする。また、式(14)で与えられる固定レート条件の下に、それぞれにおける量子化ステップサイズをQI,QP,QBとし、mを、量子化ステップサイズと再生誤差分散を関係付ける次数(すなわち、量子化ステップサイズをm乗したものの平均値の最小化が再生誤差分散を最低にすると仮定する)とする。そして、式(15)を最小にすることを考える。
【0057】
【数17】
Figure 0004517465
【0058】
【数18】
Figure 0004517465
【0059】
尚、それぞれのフレームにおける平均量子化スケールQ、及び符号量Rは、Test Model 5でも用いられる媒体変数である各フレームのコンプレキシティXと、式(16)のように関係づけられる。
【0060】
【数19】
Figure 0004517465
【0061】
式(16)の関係も考慮しつつ、式(14)の拘束条件の元に式(15)を最小にするRI,RP,RBを、ラグランジェの未定乗数法を用いて算出すると、最適なRI,RP,RBとして以下の式のような値が求められる。
【0062】
【数20】
Figure 0004517465
【0063】
α=1として、式(17)と、MPEG2 Test Model 5で定められた符号量制御方式における式(4)との関係は以下の通りであると言える。すなわち、式(17)は、符号量制御の媒介変数であるKp,Kbを、各フレームのコンプレキシティXI,XP,XBに応じて、式(18)のように適応的に算出していることに他ならない。
【0064】
【数21】
Figure 0004517465
【0065】
文献2では、1/(1+m)の値として、0.6〜1.2程度に設定することで良好な画質が得られることが示されている。
【0066】
図8に示した画像情報変換装置内で、MPEG4画像情報符号化装置(I/P−VOP)4において、MPEG2 Test Model 5において定められたのと同様な手法を用いて符号量制御を行った場合、シーンチェンジ等に起因する、GOP内でのコンプレキシティの変化に対応することが不可能であるため、安定した符号量制御が困難となり、画質劣化を引き起こすことが考えられる。MPEG2画像情報復号化部(I/Pピクチャ)2において抽出される、入力となるMPEG2画像圧縮情報(ビットストリーム)内の情報をMPEG4画像圧縮情報符号化部(I/P−VOP)4において利用することでこの問題を回避することが可能であると期待される。
【0067】
かかる問題を解決するため、本願出願人は、先に図10に示すような画像情報変換装置を提案した。
【0068】
この画像情報変換装置は、ピクチャタイプ判別部7と、圧縮情報解析部8と、MPEG2画像情報復号化部(I/Pピクチャ)9と、間引き部10と、MPEG4画像情報符号化部(I/P−VOP)11と、動きベクトル合成部12と、動きベクトル検出部13と、情報バッファ14と、コンプレキシティ算出部15とから構成される。
【0069】
この画像情報変換装置は、圧縮情報解析部8、情報バッファ14、コンプレキシティ算出部15及びMPEG4画像情報符号化部(I/P−VOP)11における符号量制御以外の動作原理については、図8に示した画像情報変換装置と同様であるため、以下では、圧縮情報解析部8、情報バッファ14、コンプレキシティ算出部15における動作原理及びMPEG4画像情報符号化部(I/P−VOP)11における符号量制御について述べることにする。
【0070】
圧縮情報解析部8において、復号処理に用いられた量子化スケールのフレーム全体に渡る平均値Q、及び、入力となるMPEG2画像圧縮情報(ビットストリーム)において、当該フレームに割り当てられた総符号量(ビット数)Bは、情報バッファ14に格納される。
【0071】
コンプレキシティ算出部15においては、情報バッファ14に格納されたフレーム毎の情報Q及びBから、当該フレームに対するコンプレキシティXを式(19)により算出する。
【0072】
【数22】
Figure 0004517465
【0073】
式(19)によって算出された、当該フレームに対するコンプレキシティXは、1GOV(group of VOPs)分バッファリングされた後、MPEG4画像情報符号化部(I/P−VOP)11に符号量制御のための媒介変数として伝送される。このため、1GOV分の遅延が必要となる。この遅延は図示しない遅延バッファを用いて実現される。ここで、GOVとは、ランダムアクセス可能なVOPの組である。
【0074】
以下では、式(19)において算出された、GOV内の各フレームに対するコンプレキシティXが、MPEG4画像情報符号化部(I/P−VOP)11においてどのように用いられるかについて述べる。尚、以下では、ピクチャタイプ判別部7がこの画像情報変換装置内に存在せず、フレームレートの変換を行わない場合をも考慮することにする。
【0075】
式(18)によつて求められたKP,KBの意味するところは、I−VOPに対する理想的な平均量子化スケールQi_idealに対するP−VOP/B−VOPに対する理想的な平均量子化スケールQp_ideal,Qb_idealの比が、式(20)によって与えられるということである。
【0076】
【数23】
Figure 0004517465
【0077】
MPEG2 Test Model 5においては、式(18)のように適応的にKp,Kbを算出することを行わず、式(3)に示したような固定値を用いている。
【0078】
式(18)及び式(20)から、或るVOP1と、或るVOP2に対するコンプレキシティをそれぞれX1,X2とし、理想的な量子化スケールをQ1_ideal,Q2_idealとすれば、式(21)のようになる。
【0079】
【数24】
Figure 0004517465
【0080】
或いはまた、MPEG2 Test Model 5のように、式(3)に示した固定値を用いたい場合には、式(21)に代えて、式(22)のようにすれば良い。
【0081】
【数25】
Figure 0004517465
【0082】
今、GOV内の未符号化されたVOPに対して割り当てられる総符号量(ビット数)をRとし、Rが、各VOPに対して、R1,R2,…Rnといったように割り当てられる時、当該GOVに対する画質が最適化されるものとする。ここでRとR1,R2,…Rnの間には式(23)のような関係式が成り立つ。
【0083】
【数26】
Figure 0004517465
【0084】
或るVOPkに対する平均量子化スケールQk、割当符号量Rk、コンプレキシティXkの間には式(24)なる関係があることにも注意して、式(23)を変形すれば式(25)が得られる。
【0085】
【数27】
Figure 0004517465
【0086】
【数28】
Figure 0004517465
【0087】
式(25)において、K(X1,X2)に関しては、式(21)に示した値を用いても、式(22)に示した値を用いても良いが、前者の方が、画像に応じた、より最適な符号量配分を実現することが可能である。その際、1/(1+m)の値を1.0と設定することで、指数演算を行うことが不要となり、高速な実行が可能となる。また、1/(1+m)の値を1.0以外に設定する場合にも、予めテーブルを持ち、これを参照して指数演算を行うことで高速な実行が可能となる。
【0088】
式(25)における各VOPに対するコンプレキシティXkはMPEG4画像符号化によるものであるが、MPEG2画像符号化による各フレームに対するコンプレキシティと、MPEG4画像符号化による各フレームに対するコンプレキシティが等しいと仮定すれば、コンプレキシティ算出部15に格納されたXkを用いることで、式(25)によって当該VOPに対する目標符号量を算出することが可能である。
【0089】
この目標符号量の算出のフローを図11に示す。最初のステップS21において、圧縮情報解析部8は、MPEG2画像情報復号化部9における復号処理に用いられるGOP内の各フレームに対する平均量子化スケールQ,及び割当符号量(ビット数)Bを抽出する。
【0090】
ステップS22において、コンプレキシティ算出部15は、平均量子化スケールQ及び割当符号量(ビット数)Bの積で与えられるコンプレキシティXを算出する。
【0091】
ステップS23において、MPEG4画像符号化部(I/P−VOP)11は、コンプレキシティXに応じた目標符号量(ターゲットビット)を算出する。
【0092】
MPEG2 Test Model 5では、GOP内におけるI,P,Bピクチャに対するコンプレキシティXi,Xp,Xbは一定であると仮定しているが実際にはシーンチェンジをGOP内に含む場合や、GOP内で背景が著しく変化する場合等ではこの仮定が成り立たず、安定した符号量制御の妨げとなり、画質劣化の要因ともなる。図10に示した画像情報変換装置においては、そのような場合にも、入力となるMPEG2画像圧縮情報(ビットストリーム)における、各フレームに対するコンプレキシティに基づいた符号量制御を行うため、画質劣化を引き起こすことなく、安定した符号量制御を行うことが可能である。
【0093】
【発明が解決しようとする課題】
ところで、CCIR(Comite Consultantif Internationale des Radio Communications )テストシーケンスの一つである“Table Tennis”をMPEG2符号化方式によって、n=15;m=3の条件の元、4Mbps に圧縮した画像圧縮情報(ビットストリーム)を、図10に示した画像情報変換装置を用いて、n=5;m=1、600kbpsのMPEG4画像圧縮情報(ビットストリーム)に変換した時のpSNRを図12に示す。 pSNRは次の式(26)により計算される。
【0094】
【数29】
Figure 0004517465
【0095】
この式(26)において、MSEは、MPEG4画像情報符号化装置(I/P−VOP)11の、各フレームに対する入力信号と出力信号の平均2乗誤差である。
【0096】
図12において、第21フレーム及び第31フレームのP−VOPにはシーンチェンジが含まれる。図10に示した画像情報変換装置を用いることにより、これらのワレームには通常のP−VOPより多くの符号量(ビット数)が割り当てられることになり、その画質劣化を最小限に抑えることを可能としている。しかしながら、これらのP−VOPにより多くの符号量(ビット数)を割り当てるため、当該GOV内の他のI−VOP及びP−VOPに対して割り当てられる符号量(ビット数)が減少し、GOV全体の画質劣化が他のGOVにおける画質劣化に比べて大きくなってしまうという問題点を有する。
【0097】
本発明は、上述の実情に鑑みて提案されるもので、シーンチェンジを含む場合にも画質劣化を抑制するような画像情報変換装置及び方法並びに符号化装置及び方法を提供することを目的とする。
【0098】
【課題を解決するための手段】
上述の課題を解決するために、本発明は、第1の圧縮符号化方式で圧縮された飛び越し走査の入力画像圧縮情報を、第2の圧縮符号化方式で圧縮された順次走査の出力画像圧縮情報に変換するものであって、上記入力画像圧縮情報及び上記出力画像圧縮情報の画像群は、フレーム内で符号化されたイントラ符号化画像、表示順序で順方向を参照して符号化された順方向予測符号化画像及び表示順序で順方向及び逆方向を参照して符号化された双方向予測符号化画像を含み、上記入力画像圧縮情報及び上記出力画像圧縮情報は複数の符号化画像からなる画像群を単位として構成され、上記出力画像圧縮情報におけるシーンチェンジを検出するシーンチェンジ検出手段と、上記入力画像圧縮情報の各フレームのコンプレキシティを検出するコンプレキシティ検出手段と、上記コンプレキシティ検出手段で検出したコンプレキシティに基づいて上記出力画像圧縮情報に画像情報の符号量を配分する際に、上記シーンチェンジ検出手段で検出したシーンチェンジに応じて上記出力画像圧縮情報における画像群の構造を変換する変換手段とを有し、上記変換手段は、上記出力画像圧縮情報の2画像群に相当する時間に亘って画像情報を遅延させる遅延手段を有し、上記出力画像圧縮情報において、シーンチェンジを含む画像群の直後の画像群の先頭のイントラ符号化画像を順方向予測符号化画像に変換し、上記イントラ符号化画像を順方向予測符号化画像に変換する際の動きベクトル情報を、当該イントラ符号化画像の前後の順方向予測符号化画像における動きベクトル情報を利用して求めると共に、上記イントラ符号化画像を順方向予測符号化画像に変換する際のコンプレキシティを、上記イントラ符号化画像の前後の順方向予測符号化画像におけるコンプレキシティを利用して求める。
また、本発明に係る画像情報変換装置は、第1の圧縮符号化方式で圧縮された飛び越し走査の入力画像圧縮情報を、第2の圧縮符号化方式で圧縮された順次走査の出力画像圧縮情報に変換する画像情報変換装置において、上記入力画像圧縮情報及び上記出力画像圧縮情報の画像群は、フレーム内で符号化されたイントラ符号化画像、表示順序で順方向を参照して符号化された順方向予測符号化画像及び表示順序で順方向及び逆方向を参照して符号化された双方向予測符号化画像を含み、上記入力画像圧縮情報及び上記出力画像圧縮情報は複数の符号化画像からなる画像群を単位として構成され、上記出力画像圧縮情報におけるシーンチェンジを検出するシーンチェンジ検出手段と、上記入力画像圧縮情報の各フレームのコンプレキシティを検出するコンプレキシティ検出手段と、上記コンプレキシティ検出手段で検出したコンプレキシティに基づいて上記出力画像圧縮情報に画像情報の符号量を配分する際に、上記シーンチェンジ検出手段で検出したシーンチェンジに応じて上記出力画像圧縮情報における画像群の構造を変換する変換手段とを有し、上記変換手段は、上記出力画像圧縮情報において、シーンチェンジを含む画像群の直後の画像群の先頭のイントラ符号化画像を順方向予測符号化画像に変換し、上記イントラ符号化画像を順方向予測符号化画像に変換する際の動きベクトル情報を、当該イントラ符号化画像の前後の順方向予測符号化画像における動きベクトル情報を利用して求めると共に、上記イントラ符号化画像を順方向予測符号化画像に変換する際のコンプレキシティを、上記イントラ符号化画像の前後の順方向予測符号化画像におけるコンプレキシティを利用して求める。
次に、本発明に係る符号化装置は、第1の圧縮符号化方式で圧縮された飛び越し走査の入力画像圧縮情報を復号して得られる画像情報を、第2の圧縮符号化方式で圧縮された順次走査の出力画像圧縮情報に符号化する符号化装置において、上記入力画像圧縮情報及び上記出力画像圧縮情報の画像群は、フレーム内で符号化されたイントラ符号化画像、表示順序で順方向を参照して符号化された順方向予測符号化画像及び表示順序で順方向及び逆方向を参照して符号化された双方向予測符号化画像を含み、上記入力画像圧縮情報及び上記出力画像圧縮情報は複数の符号化画像からなる画像群を単位として構成され、上記出力画像圧縮情報におけるシーンチェンジを検出して得られたシーンチェンジを受け取る受け取り手段と、上記入力画像圧縮情報の各フレームのコンプレキシティを検出するコンプレキシティ検出手段と、上記コンプレキシティ検出手段で検出したコンプレキシティに基づいて上記出力画像圧縮情報に画像情報の符号量を配分する際に、上記受け取り手段からのシーンチェンジに応じて上記出力画像圧縮情報における画像群の構造を変換する変換手段とを有し、上記変換手段は、上記出力画像圧縮情報において、シーンチェンジを含む画像群の直後の画像群の先頭のイントラ符号化画像を順方向予測符号化画像に変換し、上記イントラ符号化画像を順方向予測符号化画像に変換する際の動きベクトル情報を、当該イントラ符号化画像の前後の順方向予測符号化画像における動きベクトル情報を利用して求めると共に、上記イントラ符号化画像を順方向予測符号化画像に変換する際のコンプレキシティを、上記イントラ符号化画像の前後の順方向予測符号化画像におけるコンプレキシティを利用して求める。
【0099】
本発明は、飛び越し走査のMPEG2画像圧縮情報(ビットストリーム)を入力画像圧縮情報とし、順次操作のMPEG4画像圧縮情報(ビットストリーム)を出力画像圧縮情報とする。ここで、MPEG2画像圧縮情報(ビットストリーム)は符号化画像であるピクチャ(picture)からなる画像群であるGOP(group of pictures)から構成され、MPEG4画像圧縮情報(ビットストリーム)は符号化画像であるVOP(vide object plain)からなる画像群であるGOV(group of VOPs)から構成されている。そして、上記画像群の符号化画像は、複数の画素から構成される画素ブロックすなわちマクロブロックから構成されている。
【0100】
すなわち、本発明は、飛び越し走査のMPEG2画像圧縮情報(ビットストリーム)を入力とし、ピクチャタイプ判別部、圧縮情報解析部、MPEG2画像情報復号化部(I/Pピクチャ)、間引き部、MPEG4画像情報符号化部(I/P−VOP)、動きベクトル合成部、動きベクトル検出部、情報バッファ、コンプレキシティ算出部、シーンチェンジ検出部、及びGOV構造変換部を兼ね備え、入力となるMPEG2画像圧縮情報(ビットストリーム)における各フレームに対するコンプレキシティを元にしてMPEG4画像情報符号化部で符号量制御を行う際、シーンチェンジが検出されたGOVに対しては、直後のGOVにおける最初のI−VOPをP−VOPに変換することによりGOV構造の変換を行うことで当該GOVにおける画質劣化を低減し、各フレームに対する符号量割当が画像に対して最適化された状態で、順次走査のMPEG4画像圧縮情報(ビットストリーム)を出力する手段を提供するものである。
【0101】
上記構成において、ピクチャタイプ判別部は、入力となるMPEG2画像圧縮情報(ビットストリーム)内で、I/Pピクチャに関するものだけ残してBピクチャに関するものは廃棄する。圧縮情報解析部は、2GOP分の遅延を実現し、また、入力となるMPEG2画像圧縮情報(ビットストリーム)内で、各フレームに対して割り当てられた符号量(ビット数)及び各フレームにおける平均量子化スケールを抽出する。MPEG2画像情報復号化部(I/Pピクチャ)は、ピクチャタイプ判別部の出力となる、I/Pピクチャに関する圧縮情報(ビットストリーム)を、水平方向垂直方向ともに、8次の離散コサイン係数全てを用いた、若しくはその低域成分のみを用いた復号処理を行う。間引き部は、MPEG2画像情報復号化部(I/Pピクチャ)の出力である画像情報の第一フィールド若しくは第二フイールドのみを取り出して順次走査画像への変換を行うと同時に、所望の画枠サイズに変換するためのダウンサンプリングを行う。MPEG4画像情報符号化部(I/P−VOP)は、間引き部の出力となる画像情報をMPEG4符号化方式により符号化する。動きベクトル合成部は、MPEG2画像情報復号化部(I/Pピクチャ)で検出された、入力となる画像圧縮情報(ビットストリーム)内の動きベクトル値を元に、走査変換後の画像データに対する動きベクトル値にマッピングを行う。動きベクトル検出部は、動きベクトル合成部から出力される動きベクトル値を元に、高精度の動きベクトル検出を行い、情報パフファにおいては、圧縮情報解析部において抽出された、入力となるMPEG2画像圧縮情報(ビットストリーム)における各フレームに割り当てられた符号量(ビット数)及び各フレームに対する平均量子化スケールを格納する。コンプレキシティ算出部は、情報バッファに格納された、入力となる画像圧縮情報(ビットストリーム)における、各フレームに割り当てられた符号量(ビット数)、及び各フレームに対する平均量子化スケールから、各フレームに対するコンプレキシティを算出し、MPEG4画像情報符号化部(I/P−VOP)へ、符号量制御のための媒介変数として伝送する。シーンチェンジ検出部は、コンプレキシティ算出部に格納された、入力となるMPEG2画像圧縮情報(ビットストリーム)における各フレームに対するコンプレキシティからシーンチェンジが当該GOPに含まれているかどうかの検出を行う。GOV構造変換部は、シーンチェンジ検出部においてシーンチェンジが検出された場合、MPEG4画像情報符号化部(I/P−VOP)において符号化制御情報として与えられるGOV構造の変換を行ってその情報をMPEG4画像情報符号化部(I/P−VOP)に伝送する。シーンチェンジ検出は、コンプレキシティ算出部に格納された情報ではなく、圧縮情報解析部において抽出される、各フレームにおけるイントラマクロブロックの数等の情報を用いて行っても良い。また、間引き部の後段にフレームバッファを兼ね備え、ここでシーンチェンジ検出を行っても良い。
【0102】
【発明の実施の形態】
以下、本発明の実施の形態について、図面を参照して説明する。
【0103】
まず、本発明を適用した第1の実施の形態として、画像情報変換装置を説明する。
【0104】
この画像情報変換装置は、図1に示すように、ピクチャタイプ判別部16と、圧縮情報解析部17と、MPEG2画像情報復号化部(I/Pピクチャ)18と、間引き部19と、MPEG4画像情報符号化部(I/P−VOP)20と、動きベクトル合成部21と、動きベクトル検出部22と、情報バッファ23と、コンプレキシティ算出部24と、シーンチェンジ検出部25と、GOV構造変換部26とから構成されている。
【0105】
なお、ピクチャタイプ判別部16を持たず、フレームレートの変換を行わない装置構成も考えられるが、以下では説明を簡単にするため、ピクチャタイプ判別部16を兼ね備えた装置構成について述べることとする。
【0106】
この画像情報変換装置には、フレーム内で符号化されたイントラ符号化画像(Iピクチャ;I)、表示順序で順方向を参照して予測符号化された順方向予測符号化画像(Pピクチャ;P)及び表示順序で順方向及び逆方向を参照して予測符号化された双方向予測符号化画像(Bピクチャ;B)から構成される飛び越し走査のMPEG2画像圧縮情報(ビットストリーム)が入力される。
【0107】
このMPEG2画像圧縮情報(ビットストリーム)は、ピクチャタイプ判別部16において、I/Pピクチャに関するものか、Bピクチャに関するものであるかを判別され、I/Pピクチャのみ後続の圧縮情報解析部17に出力され、Bピクチャは破棄される。
【0108】
圧縮情報解析部17において、MPEG2画像情報復号化装置(I/Pピクチャ)18における復号処理に用いられる量子化スケールのフレーム全体に渡る平均値Q、及び、入力となるMPEG2画像圧縮情報(ビットストリーム)において、当該フレームに割り当てられた総符号量(ビット数)Bは、情報バッファ23に格納される。
【0109】
MPEG2画像情報復号化部(I/Pピクチャ)18における処理は通常のMPEG2画像情報復号化装置と同様に、MPEG2画像圧縮情報(ビットストリーム)を画像信号に復号するものである。ここで、Bピクチャに関するデータはピクチャタイプ判別部16において廃棄されているので、MPEG2画像情報復号化部(I/Pピクチャ)18は、I/Pピクチャのみを復号化出来る機能を有すればよい。
【0110】
MPEG2画像情報復号化部(I/Pピクチャ)18の出力となる画素値は、間引き部19に入力される。間引き部19は、水平方向には1/2の間引き処理を施し、垂直方向には、第一フィールド若しくは第二フィールドのどちらか一方のデータのみを残し、もう一方を廃棄する。このような間引きによって、入力となる画像情報の1/4の大きさを持つ順次走査画像を生成する。
【0111】
ところで、間引き部19から出力された画像をMPEG4画像情報符号化部(I/P−VOP)20において16×16画素で構成されるマクロブロック単位で符号化するためには、水平方向、垂直方向ともに、その画素数が16の倍数である必要が有る。間引き部19においては、このための画素の補填若しくは廃棄を、間引きと同時に行う。
【0112】
例えば、入力となるMPEG2画像圧縮情報(ビットストリーム)がNTSC(National Television System Committee)の規格に準拠したもの、つまり720×480画素、30Hzの飛び越し走査画像であった場合、間引き後の画枠はSIF(360×240画素)サイズということになる。この画像に対して、間引き部19において、例えば水平方向の右端若しくは左端の8ラインを廃棄して352×240画素とする。
【0113】
なお、間引き部19における動作の変更を行うことで、これ以外の画枠、例えば上記の例で、約1/4×1/4の画枠であるQSIF(176×112画素)サイズの画像に変換することも可能である。
【0114】
更に、上述した文献1は、MPEG2画像情報復号化部(I/Pピクチャ)18における処理として、水平方向、垂直方向それぞれについて、入力となるMPEG2画像圧縮情報(ビットストリーム)内の、8次の離散コサイン変換係数すべてを用いた復号処理を行う画像情報変換装置について述べられているが、図1に示した装置に関してはその限りではなく、水平方向のみ、或いは水平方向、垂直方向ともに、8次の離散コサイン変換係数のうちの低域成分のみを用いた復号処理を行い、画質劣化を最小限に抑えながら、復号処理に伴う演算量とビデオメモリ容量を削減することが可能である。
【0115】
間引き部19によって生成された順次走査画像はMPEG4画像情報符号化部(I/P−VOP)20によってフレーム内で符号化されたI−VOP及び表示順序で順方向を参照して予測符号化されたP−VOPに符号化され、MPEG4画像圧縮情報(ビットストリーム)として出力される。
【0116】
尚、VOPはVideo object Planeを意味し、MPEG2におけるフレームに相当するものである。また、I−VOPはIピクチャに対応するイントラ符号化VOP、P−VOPはPピクチャに対応する順方向予測符号化VOP、B−VOPはBピクチャに対応する双方向予測符号化VOPである。
【0117】
MPEG4画像情報符号化部(I/P−VOP)20における符号化の際には、入力となるMPEG2画像圧縮情報(ビットストリーム)中の動きベクトル情報は、動きベクトル合成部21において間引き後の画像情報に対する動きベクトルにマッピングされ、動きベクトル検出部22においては、動きベクトル合成部21において合成された動きベクトル値を元に高精度の動きベクトルを検出する。
【0118】
また、MPEG4画像情報符号化部(I/P−VOP)20は、コンプレキシティ算出部24からコンプレキシティの近似値が与えられるので、この近似値に基づいて各VOPに対する目標符号量(ターゲットビット)を算出し、この目標符号量(ターゲットビット)に応じて符号化する際に、GOV構造変換部26からのGOV構造に変換を行うことで、当該GOVにおいて生じる画質劣化を低減し、符号量配分を最適化する。
【0119】
シーンチェンジ検出部25においては、コンプレキシティ算出部24に格納された、入力となるMPEG2画像圧縮情報(ビットストリーム)における当該GOP内の各フレームに対するコンプレキシティからシーンチェンジが当該GOPに含まれているかどうかの判断を行う。当該GOPに対するIピクチャ及びPピクチャのコンプレキシティをそれぞれXi及びXp1,Xp2,…Xpnとすれば、予め定められた閾値Xthresholdに対し、次の式(27)が一つでも成り立つ時、このGOPにはシーンチェンジが含まれていると判断する。
【0120】
【数30】
Figure 0004517465
【0121】
図2に、シーンチェンジ検出装置25においてシーンチェンジが検出された場合の、GOV構造変換部26における動作原理の一例を示す。
【0122】
図2の例では、入力となるMPEG2画像圧縮情報(ビットストリーム)のGOP構造がn=15;m=3の場合を想定している。すなわち、図2のAに示すように、入力MPEG2画像圧縮情報(ビットストリーム)は、I0,B0,B1,P0,B2,B3,P1,B4,B5,P2,B6,B7,P3,B8,B9からなるGOP0及びI1,B10,B11,P4,B12,B13,P5,B14,B15,P6,B16,B17,P7,B18、B19からなるGOP1から構成されている。
【0123】
この時、GOV構造変換前には、出力となるMPEG4画像圧縮情報(ビットストリーム)におけるGOV構造がn=5;m=1となる。すなわち、図2のBに示すように、変換前の出力MPEG4画像圧縮情報(ビットストリーム)は、I0,P0,P1,P2,P3からなるGOP0及びI1,P4,P5,P6,P7からなるGOP1から構成されている。
【0124】
ここで、式(27)により、P1にシーンチェンジが検出されたとする。この時、変換前のGOV0にはシーンチェンジが含まれるとして、GOV1の先頭に存在するI−VOPであるI1はP−VOPであるP4へ変換され、GOV0及びGOV1は統合されて一つのGOVとなる。すなわち、図2のCに示すように変換後の出力MPEG4画像圧縮情報(ビットストリーム)は、I0,P0,P1,P2,P3,P4,P5,P6,P7,P8からなるGOV0から構成されている。なお、図2のCにおけるP4,P5,P6,…は、図2のBにおけるI1,P4,P5,…の位置に対応している。
【0125】
図3に、シーンチェンジ検出部25及びGOV構造変換部26における一連の動作フローを示す。この動作を実現するためには、圧縮情報解析部17において2GOV分の遅延を実現する必要がある。
【0126】
最初のステップS31において、シーンチェンジ検出部25は、コンプレキシティ算出部24から当該GOVにおける各フレームに対するコンプレキシティ情報を読み出す。
【0127】
ステップS32において、シーンチェンジ検出部25は、当該GOVにシーンチェンジが含まれるかどうかを調べ、その結果に応じて処理の手順を分岐させる。
【0128】
すなわち、当該GOVにシーンチェンジが含まれている場合にはステップS33に処理を進めるが、当該GOVにシーンチェンジが含まれていない場合にはステップS34に処理を進める。
【0129】
ステップS33において、GOV構造変換部26は、シーンチェンジ検出部25で検出したシーンチェンジに応じてGOV構造を変換する。
【0130】
ステップS34においては、MPEG4画像情報符号化部(I/P−VOP)20はMPEG4画像圧縮情報(ビットストリーム)への符号化を行う。ここで、ステップS33でGOV構造を変換した場合には、これに応じた符号化を行う。
【0131】
このような一連の処理により、たとえ入力となるMPEG2画像圧縮情報(ビットストリーム)が固定GOV構造であっても、出力となるMPEG4画像圧縮情報(ビットストリーム)が可変となりうる。このことを、図4を用いて説明する。図4で、変換前の固定GOV構造において、GOV1及びGOV6にシーンチェンジのあることが、シーンチェンジ検出装置25によって検出されたとする。すなわち、図4のAにおいて、変換前の固定GOV構造GOV1,GOPV2,GOV3,GOV4,GOV5,GOV6,GOV7,GOV8の内、シーンチェンジ検出部35によりGOV1及びGOV6にシーンチェンジが検出されたものとする。
【0132】
この場合、GOV1とGOV2、及びGOV6とGOV7をそれぞれ統合することにより、図4のBに示すように、GOV0,GOV1,GOV2、GOV3,GOV4,GOV5,GOV6のようなGOV構造に変換される。変換後において、GOV1及びGOV5は他のGOVに比べて2倍の長さを持つことになる。すなわち、このMPEG4画像圧縮情報(ビットストリーム)は可変GOV構造となる。
【0133】
ここで、図4のBに示す変換後のGOV2,GOV3,GOV4,GOV6は、図4のAに示す変換前のGOV3,GOV4,GOV5,GOV8の位置にそれぞれ対応している。
【0134】
尚、I−VOPをP−VOPに変換するためには、当該フレームに対する動きベクトル情報が必要となる。このため、当該フレームに対する動きベクトルは全て0とするか、或いはまた、動きベクトル検出装置22を用いて動きベクトルの検出を行っても良いが、前後のP−VOPにおける動きベクトル情報を利用することも考えられる。また、式(25)に基づいて、当該VOPに対する目標符号量(ターゲットビット)を算出するには、I−VOPからP−VOPに変換されたVOPに対するコンプレキシティを推定する必要がある。このための処理の一例を図5に示す。図5には、I0,P0,P1,P2,P3からなるGOV0及びI1,P4,P5,P6,P7からなるGOV1が例示されている。
【0135】
図5のAは、GOV内において、最後のP−VOP以外のP−VOPでシーンチェンジが検出された場合の例である。すなわち、ここではGOVのP1においてシーンチェンジが検出されたものとする。この場合のI1に対する動きベクトル情報としては、P3若しくはP4で用いられた動きベクトル情報をそのまま用いる、或いは、P3若しくはP4で用いられた動きベクトル情報を元に動きベクトル検出装置22を用いて動きベクトル情報の高精度化を行う。或いはまた、各マクロブロックに対して、P3若しくはP4で用いられた動きベクトル情報を用いて予測を行った場合と、動きベクトルを0として予測を行った場合とを比較して、符号化効率の高い方を選択するといったことが考えられる。
【0136】
コンプレキシティに関しては、直前のP−VOPであるP3、若しくは直後のP−VOPであるP4で用いられたコンプレキシティXp3若しくはXp4をそのまま使つても良い。或いは、次の式(28)で与えられる両者の平均値を用いても良い。
【0137】
【数31】
Figure 0004517465
【0138】
或いは、次の式(29)で与えられるシーンチェンジ後の全てのP−VOPに対する平均値を用いても良い。
【0139】
【数32】
Figure 0004517465
【0140】
元のI−VOPのコンプレキシティXi1及びXpk(k=2,…,7)から当該VOPに対するコンプレキシティの推測値を算出しても良い。
【0141】
図5のBは、GOV内において、最後のP−VOPでシーンチェンジが検出された場合の例である。すなわち、ここではGOV0のP3においてシーンチェンジが検出されたものとする。この時、直前のP−VOPであるP3における動きベクトル情報は、I1をP−VOPに変換する場合の動きベクトル情報との相関が低いと考えられる。そこで、直後のP−VOPであるP4における動きベクトル情報をそのまま用いる。或いは、P4で用いられた動きベクトル情報を元に動きベクトル検出装置22を用いて動きベクトル情報の高精度化を行う。或いはまた、各マクロブロックに対して、P4で用いられた動きベクトル情報を用いて予測を行った場合と、動きベクトルを0として予測を行った場合とを比較して、符号化効率の高い方を選択するといったことが考えられる。
【0142】
コンプレキシティに関しても、P3におけるコンプレキシティXp3と、I1をP−VOPに変換した時のコンプレキシティXとの間の相関は低いと考えられる。そこで、P4におけるコンプレキシティXp4の値をそのまま用いるか、或いは次の式(30)で与えられるシーンチェンジ後の全てのP−VOPに対する平均値を用いる。
【0143】
【数33】
Figure 0004517465
【0144】
或いは、元のI−VOPのコンプレキシティXi1及びXpk(k=4,…,7)から当該VOPに対するコンプレキシティの推測値を算出しても良い。
【0145】
次に、本発明を適用した第2の実施の形態の画像情報変換装置について、図6を参照して説明する。
【0146】
この画像情報変換装置は、ピクチャタイプ判別部27と、圧縮情報解析部28と、MPEG2画像情報復号化部(I/Pピクチャ)29と、間引き部30と、MPEG4画像情報符号化部(I/P−VOP)31と、動きベクトル合成部32と、動きベクトル検出部33と、情報バッファ34と、コンプレキシティ算出部35と、シーンチェンジ検出部36と、GOV構造変換部37とから構成されている。
【0147】
図6に示した画像情報変換装置と、図1に示した画像情報変換装置の違いは、図1に示した画像情報変換装置においては、コンプレキシティ算出装置34において算出された、入力となる画像圧縮情報(ビットストリーム)における、各フレームに対するコンプレキシティを元にシーンチェンジ検出が行われるのに対し、図6に示した画像圧縮情報解析装置においては、シーンチェンジ検出部36は、圧縮情報解析装置28において抽出される情報を元にシーンチェンジ検出を行う点にある。例えば、圧縮情報解析装置28において、Pピクチャ内のイントラマクロブロックの個数Nintraを算出し、これが予め定められた閥値Nthresholdに対して、次の式(31)で与えられる関係が成り立つ時、シーンチェンジが検出されたとしてその後の処理を行う。
【0148】
【数34】
Figure 0004517465
【0149】
次に、本発明を適用した第3の実施の形態の画像情報変換装置について、図7を参照して説明する。
【0150】
この画像情報変換装置は、ピクチャタイプ判別部38と、圧縮情報解析部39と、MPEG2画像情報復号化部(I/Pピクチャ)40と、間引き部41と、フレームバッファ42と、MPEG4画像情報符号化部(I/P−VOP)43と、動きベクトル合成部44と、動きベクトル検出部45と、情報バッファ46と、コンプレキシティ算出部47と、シーンチェンジ検出部48と、GOV構造変換部49とから構成されている。
【0151】
図7に示した画像情報変換装置と、図1に示した画像情報変換装置の違いは、図1に示した画像情報変換装置においては、コンプレキシティ算出装置34において算出された、入力となる画像圧縮情報(ビットストリーム)における、各フレームに対するコンプレキシティを元にシーンチェンジ検出が行われるのに対し、図7に示した画像情報変換装置においては、シーンチェンジ検出部48によりフレームバッファ42に格納された画像情報を元にシーンチェンジ検出が行われる。すなわち、例えば、ベースバンドにおける1フレームの特徴量(例えば画素の平均値、分散値等)αを算出し、1フレーム前の特微量であるαprev、及び予め定められた閥値αthresholdに対して、式(32)で与えられる関係が成り立つ時、シーンチェンジが検出されたとしてその後の処理を行う。
【0152】
【数35】
Figure 0004517465
【0153】
以上、入力としてMPEG2画像圧縮情報(ビットストリーム)を、出力としてMPEG4画像圧縮情報(ビットストリーム)を対象としてきたが、入力、出力ともこれに限らず、例えばMPEG−1やH.263などの画像圧縮情報(ビットストリーム)でも良い。
【0154】
【発明の効果】
以上述べてきた様に、本発明は、飛び越し走査のMPEG2画像圧縮情報(ビットストリーム)を入力とし、入力となるMPEG2画像圧縮情報(ビットストリーム)における各フレームに対するコンプレキシティを元にしてMPEG4画像情報符号化部で符号量制御を行う際、シーンチェンジが検出されたGOVに対しては、直後のGOVにおける最初のI−VOPをP−VOPに変換することでGOV構造の変換を行うことで当該GOVにおける画質劣化を低減し、各フレームに対する符号量割当が画像に対して最適化された状態で順次走査のMPEG4画像圧縮情報(ビットストリーム)に変換して出力する手段を提供するものである。
【図面の簡単な説明】
【図1】第1の実施の形態の画像情報変換装置の構成を示すブロック図である。
【図2】シーンチェンジ検出部及びGOV構造変換部における動作原理を説明する図である。
【図3】シーンチェンジ検出部及びGOV構造変換部における一連の動作を示すフローチャートである。
【図4】固定GOV構造から可変OPV構造の変換を示す図である。
【図5】図6において、I−VOPをP―VOPに変換する処理を示す図である。
【図6】第2の実施の形態の画像情報変換装置の構成を示すブロック図である。
【図7】第3の実施の形態の画像情報変換装置の構成を示すブロック図である。
【図8】従来の画像情報変換装置の構成を示すブロック図である。
【図9】MPEG2 Test Mode1 5(ISO/IEC JTC1/SC29/WG11 N0400)で述べられている符号量制御方式の動作原理を示すフローチャートである。
【図10】本願出願人が提案した画像情報変換装置の構成を示す図である。
【図11】図10の画像情報変換装置における符号量制御の動作を示すフローチャートである。
【図12】CCIRテストシーケンスの一つである“Table Tennis”をMPEG2符号化方式によって、MPEG4画像圧縮情報(ビットストリーム)に変換した時のpSNRを示した図である。
【符号の説明】
16 ピクチャタイプ判別部、17 圧縮情報解析部、18 MPEG2画像情報復号化部(I/Pピクチャ)、19 間引き部、20 MPEG4画像情報符号化部(I/P−VOP)、21 動きベクトル合成部、22 動きベクトル検出部、23 情報バッファ、24 コンプレキシティ算出部、25 シーンチェンジ検出部、26 GOV構造変換部[0001]
BACKGROUND OF THE INVENTION
  The present invention relates to an image information conversion apparatus and method for converting image information.And encoding apparatus and methodSpecifically, when receiving image information (bitstream) such as MPEG compressed by orthogonal transform such as discrete cosine transform and motion compensation via network media such as satellite broadcasting, cable TV, the Internet, or optical Image information conversion apparatus and method for converting image information used when processing on a storage medium such as a magnetic diskAnd encoding apparatus and methodAbout.
[0002]
[Prior art]
In recent years, image information such as MPEG that handles image information as digital, compresses by orthogonal transform such as discrete cosine transform and motion compensation, utilizing the unique redundancy of image information for the purpose of efficient transmission and storage of information. A compression scheme is provided. And an apparatus conforming to such an image information compression method is becoming widespread in both information distribution such as broadcasting stations and information reception in general households.
[0003]
In particular, MPEG2 (ISO / IEC 13818-2) is defined as a general-purpose image encoding method that covers both interlaced scanning images and progressive scanning images, as well as standard resolution images and high-definition images.
[0004]
That is, according to the MPEG2 coding compression method, for example, a code amount (bit rate) of 4 to 8 Mbps is assigned to a standard resolution interlaced scan image having 720 × 480 pixels, and a high resolution interlace scan having 1920 × 1088 pixels is assigned. By assigning a code amount (bit rate) of 18 to 22 Mbps to an image, a high compression rate and good image quality can be realized.
[0005]
For this reason, MPEG2 is expected to be used in a wide range of applications for professional use and consumer use. However, MPEG2 is mainly intended for high-quality encoding suitable for broadcasting, and for example, does not support encoding methods with a lower code amount (bit rate) than MPEG1, that is, a higher compression rate.
[0006]
On the other hand, with the spread of mobile terminals in recent years, it seems that the need for an encoding method with a high compression rate will continue to increase, and in response to this, standardization of an MPEG4 encoding method with a high compression rate is being carried out. . Regarding this image encoding system, an international standard was approved as ISO / IEC 14496-2 in December 1998.
[0007]
By the way, MPEG2 image compression information (bit stream) once encoded for digital broadcasting is converted into image compression information (bit stream) having a lower code amount (bit rate) that is more suitable for processing on a portable terminal or the like. There is a need to convert.
[0008]
In order to achieve this purpose, “Field-to-Frame Transcoding with Spatial and Temporal Downsampling” (Susie L Wee, John G. Apostolopoulos, and Nick Feamster, ICIP 99, hereinafter referred to as Reference 1) is used. An image information conversion device (transcoder) as shown in FIG.
[0009]
As shown in FIG. 8, the image information conversion apparatus (transcoder) provided in this document 1 includes a picture type determination unit 1, an MPEG2 image information decoding unit (I / P picture) 2, a thinning unit 3, and , An MPEG4 image information encoding unit (I / P-VOP) 4, a motion vector synthesis unit 5, and a motion vector detection unit 6.
[0010]
This image information conversion apparatus includes an intra-encoded image (I picture; I) encoded within a frame, and a forward predictive encoded image (P picture; encoded with reference to the forward direction in the display order). P) and interlaced scanning MPEG2 image compression information (bitstream) composed of bi-predictive encoded images (B pictures; B) that are predictively encoded with reference to the forward and reverse directions in the display order are input. The
[0011]
This MPEG2 image compression information (bitstream) is determined by the picture type determination unit 1 as to whether it is related to an I / P picture or a B picture. Only the I / P picture is followed by an MPEG2 image information decoding unit. (I / P picture) 2 is output, and the B picture is discarded.
[0012]
The processing in the MPEG2 image information decoding unit (I / P picture) 2 is to decode MPEG2 image compression information (bitstream) into an image signal in the same manner as a normal MPEG2 image information decoding apparatus.
[0013]
The pixel value to be output from the MPEG2 image information decoding unit (I / P picture) 2 is input to the thinning unit 3. The thinning unit 3 performs a half thinning process in the horizontal direction, leaves only data in either the first field or the second field in the vertical direction, and discards the other. By such decimation, a sequentially scanned image having a size that is 1/4 of the input image information is generated.
[0014]
The progressive scan image generated by the thinning unit 3 is predictively encoded with reference to the forward direction in the I-VOP encoded in the frame and the display order by the MPEG4 image information encoding unit (I / P-VOP) 4. Encoded into P-VOP and output as MPEG4 image compression information (bitstream). VOP means Video object Plane and corresponds to a frame in MPEG2.
[0015]
At that time, the motion vector information in the input MPEG2 image compression information (bitstream) is mapped to the motion vector for the image information after the thinning by the motion vector synthesizing unit 5, and the motion vector detecting unit 6 A highly accurate motion vector is detected based on the motion vector value synthesized in the unit 5.
[0016]
Reference 1 describes an image information conversion apparatus that generates MPEG4 image compression information (bitstream) of a progressively scanned image having a size of 1/2 × 1/2 of the input MPEG2 image compression information (bitstream). ing. That is, for example, when the input MPEG2 image compression information (bitstream) conforms to the NTSC (National Television System Committee) standard, the output MPEG4 image compression information is called SIF size (352 × 240 pixels). It will be.
[0017]
By the way, in the image information conversion apparatus shown in FIG. 8, the code amount control in the MPEG4 image information encoding unit (I / P-VOP) 4 determines the image quality in the MPEG4 image compression information (bit stream) to be output. It becomes a big factor. In ISO / IEC 14496-2, the code amount control method is not specified in particular, and each vendor can use a method that is considered optimal from the viewpoint of calculation amount and output image quality, depending on the application. . Hereinafter, as a typical code amount control method, a method described in MPEG2 Test Model 5 (ISO / IEC JTC1 / SC29 / WG11 N0400) will be described.
[0018]
This code amount control flow will be described with reference to the flow shown in FIG. In the first step S11, the image information encoding unit (I / P-VOP) 4 uses the target code amount (target bit rate) and the GOP (group of pictures) configuration as input variables to allocate bits to each picture. Do. Here, GOP is a set of randomly accessible pictures.
[0019]
That is, in step S11, the image information encoding unit (I / P-VOP) 4 determines the allocation bit amount for each picture in the GOP for pictures that have not yet been decoded in the GOP including the allocation target picture. Allocation is performed based on the allocated bit amount (hereinafter referred to as R). This distribution is repeated in the order of the coded pictures in the GOP. At that time, the code amount allocation to each picture is performed using the following two assumptions.
[0020]
First, it is assumed that the product of the average quantization scale code used when encoding each picture and the generated code amount is a constant value for each picture type unless the screen changes. Therefore, after encoding each picture, for each picture type, a variable X indicating the complexity of the screen.i, Xp, Xb(Global complelxity measure) is updated by the following equation (1).
[0021]
[Expression 4]
Figure 0004517465
[0022]
Where Si, Sp, SbIs the amount of generated code bits at the time of picture encoding, and Qi, Qp, QbIs an average quantization scale code at the time of picture encoding. The initial value is set to a value represented by Expression (2) using a target code amount (target bit rate) bit_rate [bits / sec].
[0023]
[Equation 5]
Figure 0004517465
[0024]
Second, the ratio K of the quantization scale code of the P and B pictures based on the quantization scale code of the I picturep, KbAssume that the overall image quality is always optimized when becomes the value defined in equation (3).
[0025]
[Formula 6]
Figure 0004517465
[0026]
That is, the quantization scale code for B pictures is always 1.4 times the quantization scale code for I and P pictures. This is because the B picture is encoded somewhat coarsely compared to the I and P pictures, and when the code amount that can be saved in the B picture is added to the I and P pictures, the image quality of the I and P pictures is improved. It is assumed that the image quality of the B picture that refers to this is also improved.
[0027]
Based on the above two assumptions, the allocated bit amount (Ti, Tp, Tb) Is a value shown in Equation (4).
[0028]
[Expression 7]
Figure 0004517465
[0029]
Where Np, NbIs the number of P and B pictures that are not yet encoded in the GOP.
[0030]
Based on the allocated code amount obtained in this manner, the bit amount R allocated to the uncoded picture in the GOP is updated by Expression (5) every time each picture is encoded according to steps S11 and S12. To do.
[0031]
[Equation 8]
Figure 0004517465
[0032]
In addition, when the first picture of the GOP is encoded, R is updated by Expression (6).
[0033]
[Equation 9]
Figure 0004517465
[0034]
N is the number of pictures in the GOP. The initial value of R at the beginning of the sequence is 0.
[0035]
Next, in step S12, the image information encoding device (I / P-VOP) 4 performs rate control using a virtual buffer. That is, in step S12, the image information encoding device (I / P-VOP) 4 assigns the allocated bit amount (Ti, Tp, Tb) And the actual generated code amount, the quantization scale code is obtained by macroblock unit feedback control based on the capacities of three types of virtual buffers set independently for each picture.
[0036]
First, prior to encoding the j-th macroblock, the occupancy amount of the virtual buffer is obtained by Expression (7).
[0037]
[Expression 10]
Figure 0004517465
[0038]
Where d0 i, D0 p, D0 bIs the initial occupancy of each virtual buffer, BjIs the amount of generated bits from the beginning of the picture to the jth macroblock, and MB_cnt is the number of macroblocks in one picture. Virtual buffer occupancy at the end of each picture encoding (dMB_cnt i, DMB_cnt p, DMB_cnt b) Are the same picture type, and the initial virtual buffer occupancy for the next picture (d0 i, D0 p, D0 b).
[0039]
Next, the quantization scale code for the j-th macroblock is calculated according to equation (8).
[0040]
## EQU11 ##
Figure 0004517465
[0041]
Here, r is a variable that controls the response of the feedback loop, called a reaction parameter, and is given by equation (9).
[0042]
[Expression 12]
Figure 0004517465
[0043]
The initial value of the virtual buffer at the start of encoding is given by equation (10).
[0044]
[Formula 13]
Figure 0004517465
[0045]
Finally, in step S13, the image information encoding device (I / P-VOP) 4 performs adaptive quantization for each macroblock in consideration of visual characteristics. That is, in step S13, the image information encoding unit (I / P-VOP) 4 finely quantizes the quantization scale code obtained in step S12 with a flat part that is visually noticeable, and the deterioration It is changed by a variable called activity for each macroblock so that it is roughly quantized in a complicated part of a relatively inconspicuous pattern.
[0046]
The activity uses the luminance signal pixel value of the original picture, and uses the pixel values of a total of 8 blocks of 4 blocks in the frame discrete cosine transform mode and 4 blocks in the field discrete cosine transform mode. Given in.
[0047]
[Expression 14]
Figure 0004517465
[0048]
Where PkIs the pixel value in the luminance signal block of the original image. The reason why the minimum value is taken in equation (11) is to make the quantization fine when only a part of the macroblock has a flat part.
[0049]
Furthermore, the normalized activity Nact whose value is in the range of 0.5 to 2 according to equation (12)jAsk for.
[0050]
[Expression 15]
Figure 0004517465
[0051]
Here, avg_act is the act in the picture encoded immediately beforejIs the average value.
[0052]
Quantization scale code mquant considering visual characteristicsjIs the quantization scale code Q obtained in step S12.jIs given by formula (13).
[0053]
[Expression 16]
Figure 0004517465
[0054]
It is known that the code amount control method defined in the MPEG2 Test Model 5 has the following restrictions. When actual control is performed, measures against these restrictions are required. That is, the first limitation is that the first step S11 cannot cope with the scene change, and the parameter avg_act used in the third step S13 becomes an incorrect value after the scene change. The second limitation is that there is no guarantee that satisfies the constraint conditions of VBV (Video Buffer Verifier) defined in MPEG2 and MPEG4.
[0055]
By the way, it is also described in the document "Theoretical analysis of MPEG compression efficiency and its application to code amount control" (Science Technical Report, IE-95, DSP 95-10, May 1995, hereinafter referred to as Document 2). As described above, the code amount control method defined in Test Model 5 does not necessarily provide a good image quality in the MPEG-2 image encoding device.
[0056]
This reference 2 proposes the following method as a method for giving an optimal code amount distribution for each frame in a GOP, in particular, in order to give good image quality. That is, NI, NP, NBIs the number of I, P and B pictures that have not yet been encoded in the GOP, and the code amount assigned to them is RI, RP, RBAnd Further, under the fixed rate condition given by Equation (14), the quantization step size in each is expressed as QI, QP, QBAnd m is the order relating the quantization step size and the reproduction error variance (that is, assuming that minimizing the average value of the quantization step size raised to the mth power minimizes the reproduction error variance). Then, consider minimizing equation (15).
[0057]
[Expression 17]
Figure 0004517465
[0058]
[Expression 18]
Figure 0004517465
[0059]
The average quantization scale Q and the code amount R in each frame are related to the complexity X of each frame, which is a medium variable also used in Test Model 5, as shown in Expression (16).
[0060]
[Equation 19]
Figure 0004517465
[0061]
R which minimizes the expression (15) under the constraint condition of the expression (14) while considering the relationship of the expression (16)I, RP, RBIs calculated using the Lagrange's undetermined multiplier method, the optimal RI, RP, RBAs such, a value like the following formula is obtained.
[0062]
[Expression 20]
Figure 0004517465
[0063]
With α = 1, it can be said that the relationship between the equation (17) and the equation (4) in the code amount control method defined in the MPEG2 Test Model 5 is as follows. That is, Equation (17) is a parameter for controlling the amount of code, Kp, KbFor each frame complexity XI, XP, XBAccordingly, the calculation is adaptively performed as shown in Expression (18).
[0064]
[Expression 21]
Figure 0004517465
[0065]
Document 2 shows that a good image quality can be obtained by setting the value of 1 / (1 + m) to about 0.6 to 1.2.
[0066]
In the image information conversion apparatus shown in FIG. 8, the MPEG4 image information encoding apparatus (I / P-VOP) 4 performs code amount control using a method similar to that defined in the MPEG2 Test Model 5. In this case, since it is impossible to cope with a change in complexity within the GOP caused by a scene change or the like, it is difficult to stably control the amount of code, which may cause image quality deterioration. Information in the input MPEG2 image compression information (bitstream) extracted in the MPEG2 image information decoding unit (I / P picture) 2 is used in the MPEG4 image compression information encoding unit (I / P-VOP) 4. It is expected that this problem can be avoided.
[0067]
In order to solve this problem, the applicant of the present application has previously proposed an image information conversion apparatus as shown in FIG.
[0068]
This image information conversion apparatus includes a picture type determination unit 7, a compression information analysis unit 8, an MPEG2 image information decoding unit (I / P picture) 9, a thinning unit 10, and an MPEG4 image information encoding unit (I / P). P-VOP) 11, a motion vector synthesis unit 12, a motion vector detection unit 13, an information buffer 14, and a complexity calculation unit 15.
[0069]
This image information conversion apparatus has an operation principle other than the code amount control in the compression information analysis unit 8, the information buffer 14, the complexity calculation unit 15, and the MPEG4 image information encoding unit (I / P-VOP) 11. Since this is the same as the image information conversion apparatus shown in FIG. 8, the operation principle in the compression information analysis unit 8, the information buffer 14, and the complexity calculation unit 15 and the MPEG4 image information encoding unit (I / P-VOP) are described below. 11 will be described.
[0070]
In the compression information analysis unit 8, in the average value Q over the entire quantization scale frame used in the decoding process, and the MPEG2 image compression information (bit stream) to be input, the total code amount ( The number of bits (B) is stored in the information buffer 14.
[0071]
The complexity calculation unit 15 calculates the complexity X for the frame from the information Q and B for each frame stored in the information buffer 14 using Equation (19).
[0072]
[Expression 22]
Figure 0004517465
[0073]
The complexity X for the frame calculated by equation (19) is buffered by 1 GOV (group of VOPs), and then the MPEG4 image information encoding unit (I / P-VOP) 11 performs code amount control. Is transmitted as a parameter for For this reason, a delay of 1 GOV is required. This delay is realized using a delay buffer (not shown). Here, GOV is a set of randomly accessible VOPs.
[0074]
Hereinafter, how the complexity X calculated for each frame in the GOV calculated in Expression (19) is used in the MPEG4 image information encoding unit (I / P-VOP) 11 will be described. In the following, the case where the picture type determination unit 7 does not exist in the image information conversion apparatus and the frame rate is not converted will be considered.
[0075]
K determined by equation (18)P, KBMeans the ideal average quantization scale Q for I-VOPi_idealIdeal average quantization scale Q for P-VOP / B-VOPp_ideal, Qb_idealIs given by equation (20).
[0076]
[Expression 23]
Figure 0004517465
[0077]
In MPEG2 Test Model 5, K is adaptively expressed as Equation (18).p, KbIs not calculated, and a fixed value as shown in Expression (3) is used.
[0078]
From the equations (18) and (20), the complexity for a certain VOP1 and a certain VOP2 is expressed as X1, X2And the ideal quantization scale is Q1_ideal, Q2_idealThen, the equation (21) is obtained.
[0079]
[Expression 24]
Figure 0004517465
[0080]
Alternatively, when it is desired to use the fixed value shown in Equation (3) as in MPEG2 Test Model 5, it may be changed to Equation (22) instead of Equation (21).
[0081]
[Expression 25]
Figure 0004517465
[0082]
Now, let R be the total code amount (number of bits) allocated to unencoded VOPs in the GOV, and R is R for each VOP.1, R2, ... RnIt is assumed that the image quality for the GOV is optimized. Where R and R1, R2, ... RnA relational expression such as Expression (23) is established between.
[0083]
[Equation 26]
Figure 0004517465
[0084]
A VOPkMean quantization scale Q fork, Assigned code amount Rk, Complexity XkNote that there is a relationship of formula (24) between the two, and if formula (23) is modified, formula (25) is obtained.
[0085]
[Expression 27]
Figure 0004517465
[0086]
[Expression 28]
Figure 0004517465
[0087]
In formula (25), K (X1, X2), The value shown in Equation (21) or the value shown in Equation (22) may be used, but the former realizes more optimal code amount distribution according to the image. Is possible. At that time, by setting the value of 1 / (1 + m) to 1.0, it is not necessary to perform exponential calculation, and high-speed execution is possible. Even when the value of 1 / (1 + m) is set to a value other than 1.0, high-speed execution is possible by having a table in advance and performing exponential operation with reference to this table.
[0088]
Complexity X for each VOP in equation (25)kIs based on MPEG4 image coding, but if the complexity for each frame by MPEG2 image coding and the complexity for each frame by MPEG4 image coding are assumed to be equal, they are stored in the complexity calculation unit 15. XkBy using, it is possible to calculate the target code amount for the VOP by the equation (25).
[0089]
FIG. 11 shows a flow for calculating the target code amount. In the first step S21, the compression information analysis unit 8 extracts the average quantization scale Q and the allocated code amount (number of bits) B for each frame in the GOP used for the decoding process in the MPEG2 image information decoding unit 9. .
[0090]
In step S <b> 22, the complexity calculation unit 15 calculates the complexity X given by the product of the average quantization scale Q and the assigned code amount (number of bits) B.
[0091]
In step S23, the MPEG4 image encoding unit (I / P-VOP) 11 calculates a target code amount (target bit) corresponding to the complexity X.
[0092]
In MPEG2 Test Model 5, complexity X for I, P, B pictures in GOPi, Xp, XbHowever, this assumption does not hold when scene changes are included in the GOP, or when the background changes significantly in the GOP, which hinders stable code amount control. It becomes a factor of deterioration. In the image information conversion apparatus shown in FIG. 10, even in such a case, the code amount control based on the complexity for each frame in the input MPEG2 image compression information (bit stream) is performed. It is possible to perform stable code amount control without causing any problems.
[0093]
[Problems to be solved by the invention]
By the way, image compression information (bits) obtained by compressing “Table Tennis”, which is one of the CCIR (Comite Consultantif Internationale des Radio Communications) test sequences, to 4 Mbps under the condition of n = 15; FIG. 12 shows the pSNR when the stream) is converted into MPEG4 image compression information (bit stream) of n = 5; m = 1, 600 kbps using the image information conversion apparatus shown in FIG. The pSNR is calculated by the following equation (26).
[0094]
[Expression 29]
Figure 0004517465
[0095]
In this equation (26), MSE is the mean square error of the input signal and output signal for each frame of the MPEG4 image information encoding device (I / P-VOP) 11.
[0096]
In FIG. 12, scene changes are included in the P-VOPs of the 21st and 31st frames. By using the image information conversion apparatus shown in FIG. 10, a larger code amount (number of bits) than those of a normal P-VOP is allocated to these wallets, and it is possible to minimize deterioration in image quality. It is possible. However, since a larger amount of code (number of bits) is allocated to these P-VOPs, the amount of code (number of bits) allocated to other I-VOPs and P-VOPs in the GOV decreases, and the entire GOV The image quality deterioration of the image quality becomes larger than the image quality deterioration in other GOVs.
[0097]
  The present invention is proposed in view of the above circumstances, and an image information conversion apparatus and method for suppressing image quality degradation even when a scene change is included.And encoding apparatus and methodThe purpose is to provide.
[0098]
[Means for Solving the Problems]
  In order to solve the above-described problems, the present invention is directed to interlaced scanning input image compression information compressed by the first compression coding method, and progressive scanning output image compression compressed by the second compression coding method. The image group of the input image compression information and the output image compression information is an intra-encoded image encoded within a frame, and is encoded with reference to the forward direction in the display order. A forward prediction encoded image and a bidirectional prediction encoded image encoded with reference to the forward direction and the reverse direction in the display order, and the input image compression information and the output image compression information are obtained from a plurality of encoded images. A scene change detection means for detecting a scene change in the output image compression information, and a complex for detecting the complexity of each frame of the input image compression information. When the code amount of the image information is allocated to the output image compression information based on the complexity detected by the complexity detecting unit and the complexity detecting unit, the scene change detected by the scene change detecting unit Conversion means for converting the structure of the image group in the output image compression information, and the conversion means includes delay means for delaying the image information over a time corresponding to two image groups of the output image compression information. Then, in the output image compression information, the first intra encoded image of the image group immediately after the image group including the scene change is converted into a forward prediction encoded image, and the intra encoded image is converted into the forward predictive encoded image. Vector information at the time of conversion to is obtained by using motion vector information in forward prediction encoded images before and after the intra encoded imageAt the same time, the complexity for converting the intra-coded image into the forward-predicted coded image is obtained using the complexity of the forward-predicted coded images before and after the intra-coded image.
  In addition, the image information conversion apparatus according to the present invention uses the interlaced scan input image compression information compressed by the first compression encoding method and the progressive scan output image compression information compressed by the second compression encoding method. In the image information conversion apparatus for converting to image information, the image group of the input image compression information and the output image compression information is an intra-encoded image encoded within a frame, and is encoded with reference to a forward direction in a display order. A forward prediction encoded image and a bidirectional prediction encoded image encoded with reference to the forward direction and the reverse direction in the display order, and the input image compression information and the output image compression information are obtained from a plurality of encoded images. A scene change detecting means configured to detect a scene change in the output image compression information,Complexity detecting means for detecting the complexity of each frame of the input image compression information, and complexity detected by the complexity detecting means.Conversion means for converting the structure of the image group in the output image compression information according to the scene change detected by the scene change detection means when allocating the code amount of the image information to the output image compression information based on And the conversion means converts, in the output image compression information, an intra encoded image at the head of an image group immediately after an image group including a scene change into a forward prediction encoded image, and converts the intra encoded image into The motion vector information for conversion to the forward predictive encoded image is obtained using the motion vector information in the forward predictive encoded images before and after the intra encoded image.At the same time, the complexity for converting the intra-coded image into the forward-predicted coded image is obtained using the complexity of the forward-predicted coded images before and after the intra-coded image.
  Next, an encoding apparatus according to the present invention compresses image information obtained by decoding interlaced scanning input image compression information compressed by the first compression encoding method using the second compression encoding method. In the encoding device that encodes the output image compression information of progressive scanning, the input image compression information and the image group of the output image compression information are intra-encoded images encoded in a frame, forward in the display order. The input image compression information and the output image compression including a forward prediction encoded image encoded with reference to a forward prediction encoded image encoded with reference to a forward direction and a reverse direction in display order. The information is configured in units of an image group composed of a plurality of encoded images, and receiving means for receiving a scene change obtained by detecting a scene change in the output image compression information,Complexity detecting means for detecting the complexity of each frame of the input image compression information, and complexity detected by the complexity detecting means.Conversion means for converting the structure of the image group in the output image compression information according to a scene change from the receiving means when allocating the code amount of the image information to the output image compression information based on The converting means converts, in the output image compression information, an intra encoded image at the head of an image group immediately after an image group including a scene change into a forward prediction encoded image, and the intra encoded image is converted into a forward prediction image. Motion vector information for conversion to a coded image is obtained by using motion vector information in forward prediction coded images before and after the intra coded image.At the same time, the complexity for converting the intra-coded image into the forward-predicted coded image is obtained using the complexity of the forward-predicted coded images before and after the intra-coded image.
[0099]
In the present invention, MPEG2 image compression information (bitstream) for interlaced scanning is used as input image compression information, and MPEG4 image compression information (bitstream) for sequential operation is used as output image compression information. Here, MPEG2 image compression information (bitstream) is composed of GOP (group of pictures) which is a group of pictures consisting of pictures as encoded images, and MPEG4 image compression information (bitstream) is encoded images. It consists of GOV (group of VOPs) which is an image group consisting of a certain VOP (vide object plain). The encoded image of the image group is composed of pixel blocks composed of a plurality of pixels, that is, macroblocks.
[0100]
That is, the present invention receives interlaced scanning MPEG2 image compression information (bitstream) as an input, and includes a picture type determination unit, compression information analysis unit, MPEG2 image information decoding unit (I / P picture), thinning unit, and MPEG4 image information. MPEG2 image compression information to be input, which includes an encoding unit (I / P-VOP), a motion vector synthesis unit, a motion vector detection unit, an information buffer, a complexity calculation unit, a scene change detection unit, and a GOV structure conversion unit When the code amount control is performed by the MPEG4 image information encoding unit based on the complexity for each frame in the (bitstream), the first I-VOP in the immediately following GOV is applied to the GOV in which the scene change is detected. Is converted into P-VOP, and the GOV structure is converted into the GOV by converting the GOV structure. That the image quality degradation is reduced, while the code amount allocation for each frame is optimized for the image, and provides a means for outputting an MPEG4 image compression information progressive scan (bit stream).
[0101]
In the above configuration, the picture type determination unit leaves only the one relating to the I / P picture and discarding the one relating to the B picture in the input MPEG2 image compression information (bitstream). The compression information analysis unit realizes a delay of 2 GOP, and in the input MPEG2 image compression information (bit stream), the code amount (number of bits) assigned to each frame and the average quantum in each frame Extraction scale. The MPEG2 image information decoding unit (I / P picture) outputs the compression information (bitstream) related to the I / P picture, which is the output of the picture type discrimination unit, all the 8th order discrete cosine coefficients in both the horizontal and vertical directions. The decoding process which used or used only the low-frequency component is performed. The decimation unit extracts only the first field or the second field of the image information that is the output of the MPEG2 image information decoding unit (I / P picture) and converts it into a sequentially scanned image, and at the same time, the desired image frame size Downsampling to convert to. The MPEG4 image information encoding unit (I / P-VOP) encodes the image information that is output from the thinning unit using the MPEG4 encoding method. The motion vector synthesizing unit performs motion on the image data after the scan conversion based on the motion vector value in the input image compression information (bit stream) detected by the MPEG2 image information decoding unit (I / P picture). Map to a vector value. The motion vector detection unit performs high-precision motion vector detection based on the motion vector value output from the motion vector synthesis unit. In the information puffer, the compressed MPEG2 image compressed by the compression information analysis unit is input. The code amount (number of bits) assigned to each frame in the information (bit stream) and the average quantization scale for each frame are stored. The complexity calculation unit stores each code amount (number of bits) assigned to each frame in the input image compression information (bit stream) stored in the information buffer, and an average quantization scale for each frame. The complexity for the frame is calculated and transmitted to the MPEG4 image information encoding unit (I / P-VOP) as a parameter for controlling the amount of code. The scene change detection unit detects whether a scene change is included in the GOP from the complexity of each frame in the input MPEG2 image compression information (bitstream) stored in the complexity calculation unit. . When a scene change is detected by the scene change detection unit, the GOV structure conversion unit converts the GOV structure given as encoding control information in the MPEG4 image information encoding unit (I / P-VOP) It is transmitted to the MPEG4 image information encoding unit (I / P-VOP). The scene change detection may be performed using information such as the number of intra macroblocks in each frame extracted by the compression information analysis unit, not the information stored in the complexity calculation unit. Further, a frame buffer may be provided after the thinning-out unit, and scene change detection may be performed here.
[0102]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings.
[0103]
First, an image information conversion apparatus will be described as a first embodiment to which the present invention is applied.
[0104]
As shown in FIG. 1, the image information conversion apparatus includes a picture type determination unit 16, a compression information analysis unit 17, an MPEG2 image information decoding unit (I / P picture) 18, a thinning unit 19, and an MPEG4 image. Information encoding unit (I / P-VOP) 20, motion vector synthesis unit 21, motion vector detection unit 22, information buffer 23, complexity calculation unit 24, scene change detection unit 25, and GOV structure The conversion part 26 is comprised.
[0105]
An apparatus configuration that does not have the picture type determination unit 16 and that does not convert the frame rate is also conceivable. However, in order to simplify the description, an apparatus configuration that also has the picture type determination unit 16 will be described below.
[0106]
This image information conversion apparatus includes an intra-encoded image (I picture; I) encoded within a frame, and a forward predictive encoded image (P picture; encoded with reference to the forward direction in the display order). P) and interlaced scanning MPEG2 image compression information (bitstream) composed of bi-predictive encoded images (B pictures; B) that are predictively encoded with reference to the forward and reverse directions in the display order are input. The
[0107]
The MPEG2 image compression information (bitstream) is discriminated in the picture type discrimination unit 16 as to whether it relates to an I / P picture or B picture, and only the I / P picture is sent to the subsequent compression information analysis unit 17. The B picture is output and discarded.
[0108]
In the compression information analysis unit 17, the average value Q over the entire frame of the quantization scale used for the decoding process in the MPEG2 image information decoding device (I / P picture) 18, and the MPEG2 image compression information (bitstream) as input ), The total code amount (number of bits) B allocated to the frame is stored in the information buffer 23.
[0109]
The processing in the MPEG2 image information decoding unit (I / P picture) 18 is to decode MPEG2 image compression information (bitstream) into an image signal in the same manner as a normal MPEG2 image information decoding apparatus. Here, since the data relating to the B picture is discarded in the picture type determination unit 16, the MPEG2 image information decoding unit (I / P picture) 18 only needs to have a function capable of decoding only the I / P picture. .
[0110]
The pixel value that is output from the MPEG2 image information decoding unit (I / P picture) 18 is input to the thinning unit 19. The thinning unit 19 performs a half thinning process in the horizontal direction, leaves only the data of either the first field or the second field in the vertical direction, and discards the other. By such decimation, a sequentially scanned image having a size that is 1/4 of the input image information is generated.
[0111]
By the way, in order to encode the image output from the thinning unit 19 in units of macroblocks composed of 16 × 16 pixels in the MPEG4 image information encoding unit (I / P-VOP) 20, the horizontal direction and the vertical direction In both cases, the number of pixels needs to be a multiple of 16. The thinning unit 19 performs pixel compensation or discarding simultaneously with the thinning.
[0112]
For example, if the input MPEG2 image compression information (bitstream) is based on the NTSC (National Television System Committee) standard, that is, a 720 × 480 pixel, 30 Hz interlaced scanned image, the image frame after decimation is This is the SIF (360 × 240 pixels) size. For this image, the thinning unit 19 discards, for example, 8 lines at the right end or left end in the horizontal direction to obtain 352 × 240 pixels.
[0113]
It should be noted that by changing the operation in the thinning-out unit 19, other image frames, for example, in the above example, an image of QSIF (176 × 112 pixels) size, which is an image frame of about 1/4 × 1/4, is obtained. It is also possible to convert.
[0114]
Furthermore, the above-mentioned document 1 describes the 8th order in the MPEG2 image compression information (bit stream) as input in the horizontal direction and the vertical direction as processing in the MPEG2 image information decoding unit (I / P picture) 18. An image information conversion apparatus that performs a decoding process using all the discrete cosine transform coefficients is described. However, the apparatus shown in FIG. 1 is not limited to this, and only the horizontal direction or the eighth order in both the horizontal direction and the vertical direction is described. It is possible to reduce the amount of calculation and the video memory capacity associated with the decoding process while performing the decoding process using only the low-frequency component of the discrete cosine transform coefficients and minimizing image quality degradation.
[0115]
The progressive scan image generated by the thinning-out unit 19 is predictively encoded with reference to the forward direction in the I-VOP encoded in the frame and the display order by the MPEG4 image information encoding unit (I / P-VOP) 20. Encoded into P-VOP and output as MPEG4 image compression information (bitstream).
[0116]
VOP means Video object Plane and corresponds to a frame in MPEG2. Further, I-VOP is an intra-coded VOP corresponding to an I picture, P-VOP is a forward predictive coded VOP corresponding to a P picture, and B-VOP is a bi-directional predictive coded VOP corresponding to a B picture.
[0117]
When encoding in the MPEG4 image information encoding unit (I / P-VOP) 20, the motion vector information in the input MPEG2 image compression information (bitstream) is converted into an image after decimation in the motion vector synthesis unit 21. The motion vector is mapped to the motion vector for the information, and the motion vector detection unit 22 detects a highly accurate motion vector based on the motion vector value synthesized by the motion vector synthesis unit 21.
[0118]
Also, since the MPEG4 image information encoding unit (I / P-VOP) 20 is given an approximate value of complexity from the complexity calculating unit 24, the target code amount (target) for each VOP is based on this approximate value. Bit), and when encoding according to the target code amount (target bit), conversion to the GOV structure from the GOV structure conversion unit 26 reduces image quality degradation that occurs in the GOV, Optimize quantity distribution.
[0119]
In the scene change detection unit 25, a scene change is included in the GOP from the complexity for each frame in the GOP in the MPEG2 image compression information (bitstream) to be input, which is stored in the complexity calculation unit 24. Judge whether or not. The complexity of I picture and P picture for the GOP is XiAnd Xp1, Xp2, ... XpnThen, a predetermined threshold value XthresholdOn the other hand, when at least one of the following expressions (27) holds, it is determined that this GOP includes a scene change.
[0120]
[30]
Figure 0004517465
[0121]
FIG. 2 shows an example of the operating principle of the GOV structure conversion unit 26 when a scene change is detected by the scene change detection device 25.
[0122]
In the example of FIG. 2, it is assumed that the GOP structure of the input MPEG2 image compression information (bitstream) is n = 15; m = 3. That is, as shown in FIG. 2A, the input MPEG2 image compression information (bit stream) is I0, B0, B1, P0, B2, BThree, P1, BFour, BFive, P2, B6, B7, PThree, B8, B9GOP0 and I consisting of1, BTen, B11, PFour, B12, B13, PFive, B14, B15, P6, B16, B17, P7, B18, B19It is comprised from GOP1 which consists of.
[0123]
At this time, before the GOV structure conversion, the GOV structure in the MPEG4 image compression information (bit stream) to be output is n = 5; m = 1. That is, as shown in FIG. 2B, the output MPEG4 image compression information (bitstream) before conversion is I0, P0, P1, P2, PThreeGOP0 and I consisting of1, PFour, PFive, P6, P7It is comprised from GOP1 which consists of.
[0124]
Here, according to the equation (27), P1Suppose a scene change is detected. At this time, assuming that the scene change is included in the pre-conversion GOV0, the I-VOP I-VOP existing at the head of GOV11Is P-VOP PFourAnd GOV0 and GOV1 are integrated into one GOV. That is, as shown in C of FIG. 2, the converted output MPEG4 image compression information (bit stream) is I0, P0, P1, P2, PThree, PFour, PFive, P6, P7, P8It is comprised from GOV0 which consists of. Note that P in C of FIG.Four, PFive, P6,... Are I in B of FIG.1, PFour, PFiveIt corresponds to the position of.
[0125]
FIG. 3 shows a series of operation flows in the scene change detection unit 25 and the GOV structure conversion unit 26. In order to realize this operation, the compressed information analysis unit 17 needs to realize a delay of 2 GOV.
[0126]
In the first step S <b> 31, the scene change detection unit 25 reads the complexity information for each frame in the GOV from the complexity calculation unit 24.
[0127]
In step S32, the scene change detection unit 25 checks whether or not a scene change is included in the GOV, and branches the processing procedure according to the result.
[0128]
That is, when the scene change is included in the GOV, the process proceeds to step S33, but when the GOV does not include a scene change, the process proceeds to step S34.
[0129]
In step S <b> 33, the GOV structure conversion unit 26 converts the GOV structure according to the scene change detected by the scene change detection unit 25.
[0130]
In step S34, the MPEG4 image information encoding unit (I / P-VOP) 20 performs encoding into MPEG4 image compression information (bitstream). Here, if the GOV structure is converted in step S33, the encoding is performed accordingly.
[0131]
Through such a series of processing, even if the input MPEG2 image compression information (bit stream) has a fixed GOV structure, the output MPEG4 image compression information (bit stream) can be variable. This will be described with reference to FIG. In FIG. 4, it is assumed that the scene change detection device 25 detects that there is a scene change in the GOV 1 and the GOV 6 in the fixed GOV structure before conversion. That is, in FIG. 4A, the scene change detector 35 detects a scene change in GOV1 and GOV6 among the fixed GOV structures GOV1, GOPV2, GOV3, GOV4, GOV5, GOV6, GOV7, and GOV8 before conversion. To do.
[0132]
In this case, by integrating GOV1 and GOV2, and GOV6 and GOV7, respectively, as shown in FIG. 4B, it is converted into a GOV structure such as GOV0, GOV1, GOV2, GOV3, GOV4, GOV5, and GOV6. After the conversion, GOV1 and GOV5 have a length twice that of other GOVs. That is, this MPEG4 image compression information (bit stream) has a variable GOV structure.
[0133]
Here, the converted GOV2, GOV3, GOV4, and GOV6 shown in B of FIG. 4 respectively correspond to the positions of GOV3, GOV4, GOV5, and GOV8 before the conversion shown in A of FIG.
[0134]
Note that in order to convert an I-VOP to a P-VOP, motion vector information for the frame is required. For this reason, all the motion vectors for the frame are set to 0, or the motion vector may be detected using the motion vector detection device 22, but the motion vector information in the preceding and following P-VOPs is used. Is also possible. Further, in order to calculate the target code amount (target bit) for the VOP based on the equation (25), it is necessary to estimate the complexity for the VOP converted from the I-VOP to the P-VOP. An example of processing for this is shown in FIG. In FIG.0, P0, P1, P2, PThreeGOV0 and I consisting of1, PFour, PFive, P6, P7A GOV1 consisting of is illustrated.
[0135]
FIG. 5A shows an example when a scene change is detected in a P-VOP other than the last P-VOP in the GOV. That is, here the GOV P1Assume that a scene change has been detected at. I in this case1The motion vector information for PThreeOr PFourThe motion vector information used in the above is used as it is, or PThreeOr PFourBased on the motion vector information used in the above, the motion vector detection device 22 is used to improve the accuracy of the motion vector information. Alternatively, for each macroblock, PThreeOr PFourThe case where the prediction is performed using the motion vector information used in the above and the case where the prediction is performed with the motion vector set to 0 may be compared to select the one having the higher coding efficiency.
[0136]
For complexity, P is the previous P-VOP.ThreeOr P which is the P-VOP just afterFourComplexity X used inp3Or Xp4May be used as is. Or you may use the average value of both given by the following formula | equation (28).
[0137]
[31]
Figure 0004517465
[0138]
Or you may use the average value with respect to all the P-VOPs after the scene change given by the following formula | equation (29).
[0139]
[Expression 32]
Figure 0004517465
[0140]
Original I-VOP Complexity Xi1And XpkAn estimated value of complexity for the VOP may be calculated from (k = 2,..., 7).
[0141]
FIG. 5B shows an example when a scene change is detected in the last P-VOP in the GOV. That is, here P of GOV0ThreeAssume that a scene change has been detected at. At this time, P which is the immediately preceding P-VOPThreeThe motion vector information at1It is considered that the correlation with the motion vector information when converting to P-VOP is low. Therefore, the P-VOP immediately after PFourThe motion vector information in is used as it is. Or PFourBased on the motion vector information used in the above, the motion vector detection device 22 is used to improve the accuracy of the motion vector information. Alternatively, for each macroblock, PFourThe case where the prediction is performed using the motion vector information used in the above and the case where the prediction is performed with the motion vector set to 0 may be compared to select the one having the higher coding efficiency.
[0142]
As for complexity, PThreeComplexity Xp3And I1It is considered that the correlation between the complexity X and the P-VOP is low. So PFourComplexity Xp4Or the average value for all P-VOPs after the scene change given by the following equation (30).
[0143]
[Expression 33]
Figure 0004517465
[0144]
Or the original I-VOP complexity Xi1And XpkAn estimated value of complexity for the VOP may be calculated from (k = 4,..., 7).
[0145]
Next, an image information conversion apparatus according to a second embodiment to which the present invention is applied will be described with reference to FIG.
[0146]
This image information conversion apparatus includes a picture type determination unit 27, a compression information analysis unit 28, an MPEG2 image information decoding unit (I / P picture) 29, a thinning unit 30, and an MPEG4 image information encoding unit (I / P). P-VOP) 31, a motion vector synthesis unit 32, a motion vector detection unit 33, an information buffer 34, a complexity calculation unit 35, a scene change detection unit 36, and a GOV structure conversion unit 37. ing.
[0147]
The difference between the image information conversion apparatus shown in FIG. 6 and the image information conversion apparatus shown in FIG. 1 is the input calculated by the complexity calculation apparatus 34 in the image information conversion apparatus shown in FIG. While scene change detection is performed based on the complexity for each frame in the image compression information (bitstream), in the image compression information analysis apparatus shown in FIG. The point is that scene change detection is performed based on information extracted by the analysis device 28. For example, in the compressed information analysis device 28, the number N of intra macroblocks in a P pictureintraAnd this is a predetermined threshold value NthresholdOn the other hand, when the relationship given by the following equation (31) holds, the subsequent processing is performed assuming that a scene change has been detected.
[0148]
[Expression 34]
Figure 0004517465
[0149]
Next, an image information conversion apparatus according to a third embodiment to which the present invention is applied will be described with reference to FIG.
[0150]
The image information conversion apparatus includes a picture type determination unit 38, a compression information analysis unit 39, an MPEG2 image information decoding unit (I / P picture) 40, a thinning unit 41, a frame buffer 42, and an MPEG4 image information code. (I / P-VOP) 43, motion vector synthesis unit 44, motion vector detection unit 45, information buffer 46, complexity calculation unit 47, scene change detection unit 48, and GOV structure conversion unit 49.
[0151]
The difference between the image information conversion apparatus shown in FIG. 7 and the image information conversion apparatus shown in FIG. 1 is the input calculated by the complexity calculation apparatus 34 in the image information conversion apparatus shown in FIG. While scene change detection is performed based on the complexity of each frame in the compressed image information (bitstream), in the image information conversion apparatus shown in FIG. Scene change detection is performed based on the stored image information. That is, for example, a feature amount (for example, an average value of pixels, a variance value, etc.) α of one frame in the baseband is calculated, and α is a feature amount one frame before.prev, And a predetermined threshold value αthresholdOn the other hand, when the relationship given by equation (32) holds, the subsequent processing is performed assuming that a scene change is detected.
[0152]
[Expression 35]
Figure 0004517465
[0153]
As described above, MPEG2 image compression information (bit stream) is used as an input and MPEG4 image compression information (bit stream) is used as an output. However, input and output are not limited to this. It may be image compression information (bit stream) such as H.263.
[0154]
【The invention's effect】
As described above, according to the present invention, MPEG2 image compression information (bitstream) for interlaced scanning is input, and MPEG4 image is based on the complexity for each frame in the input MPEG2 image compression information (bitstream). When the amount of code is controlled by the information encoding unit, for the GOV in which a scene change is detected, the GOV structure is converted by converting the first I-VOP in the immediately following GOV to the P-VOP. The present invention provides means for reducing the image quality deterioration in the GOV, and converting and outputting to MPEG4 image compression information (bitstream) for progressive scanning in a state where the code amount allocation for each frame is optimized for the image. .
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration of an image information conversion apparatus according to a first embodiment.
FIG. 2 is a diagram for explaining an operation principle in a scene change detection unit and a GOV structure conversion unit.
FIG. 3 is a flowchart showing a series of operations in a scene change detection unit and a GOV structure conversion unit.
FIG. 4 is a diagram illustrating conversion from a fixed GOV structure to a variable OPV structure.
FIG. 5 is a diagram showing processing for converting I-VOP to P-VOP in FIG. 6;
FIG. 6 is a block diagram illustrating a configuration of an image information conversion apparatus according to a second embodiment.
FIG. 7 is a block diagram illustrating a configuration of an image information conversion apparatus according to a third embodiment.
FIG. 8 is a block diagram showing a configuration of a conventional image information conversion apparatus.
FIG. 9 is a flowchart showing an operation principle of a code amount control system described in MPEG2 Test Mode 1 5 (ISO / IEC JTC1 / SC29 / WG11 N0400).
FIG. 10 is a diagram showing a configuration of an image information conversion apparatus proposed by the present applicant.
11 is a flowchart showing an operation of code amount control in the image information conversion apparatus of FIG.
FIG. 12 is a diagram showing a pSNR when “Table Tennis”, which is one of CCIR test sequences, is converted into MPEG4 image compression information (bitstream) by the MPEG2 encoding method.
[Explanation of symbols]
16 picture type determination unit, 17 compression information analysis unit, 18 MPEG2 image information decoding unit (I / P picture), 19 decimation unit, 20 MPEG4 image information encoding unit (I / P-VOP), 21 motion vector synthesis unit , 22 Motion vector detection unit, 23 Information buffer, 24 Complexity calculation unit, 25 Scene change detection unit, 26 GOV structure conversion unit

Claims (16)

第1の圧縮符号化方式で圧縮された飛び越し走査の入力画像圧縮情報を、第2の圧縮符号化方式で圧縮された順次走査の出力画像圧縮情報に変換する画像情報変換装置において、
上記入力画像圧縮情報及び上記出力画像圧縮情報の画像群は、フレーム内で符号化されたイントラ符号化画像、表示順序で順方向を参照して符号化された順方向予測符号化画像及び表示順序で順方向及び逆方向を参照して符号化された双方向予測符号化画像を含み、
上記入力画像圧縮情報及び上記出力画像圧縮情報は複数の符号化画像からなる画像群を単位として構成され、
上記出力画像圧縮情報におけるシーンチェンジを検出するシーンチェンジ検出手段と、
上記入力画像圧縮情報の各フレームのコンプレキシティを検出するコンプレキシティ検出手段と、
上記コンプレキシティ検出手段で検出したコンプレキシティに基づいて上記出力画像圧縮情報に画像情報の符号量を配分する際に、上記シーンチェンジ検出手段で検出したシーンチェンジに応じて上記出力画像圧縮情報における画像群の構造を変換する変換手段とを有し、
上記変換手段は、上記出力画像圧縮情報の2画像群に相当する時間に亘って画像情報を遅延させる遅延手段を有し、上記出力画像圧縮情報において、シーンチェンジを含む画像群の直後の画像群の先頭のイントラ符号化画像を順方向予測符号化画像に変換し、
上記イントラ符号化画像を順方向予測符号化画像に変換する際の動きベクトル情報を、当該イントラ符号化画像の前後の順方向予測符号化画像における動きベクトル情報を利用して求めると共に、上記イントラ符号化画像を順方向予測符号化画像に変換する際のコンプレキシティを、上記イントラ符号化画像の前後の順方向予測符号化画像におけるコンプレキシティを利用して求める
画像情報変換装置。
In an image information conversion apparatus for converting input image compression information of interlaced scanning compressed by a first compression encoding method into output image compression information of sequential scanning compressed by a second compression encoding method.
The image group of the input image compression information and the output image compression information includes an intra encoded image encoded within a frame, a forward prediction encoded image encoded with reference to a forward direction in a display order, and a display order. Including a bi-predictive encoded image encoded with reference to the forward and reverse directions,
The input image compression information and the output image compression information are configured in units of an image group composed of a plurality of encoded images,
Scene change detection means for detecting a scene change in the output image compression information;
Complexity detection means for detecting the complexity of each frame of the input image compression information;
The output image compression information according to the scene change detected by the scene change detection means when allocating the code amount of the image information to the output image compression information based on the complexity detected by the complexity detection means. Conversion means for converting the structure of the image group in
The converting means includes delay means for delaying image information for a time corresponding to two image groups of the output image compression information, and in the output image compression information, an image group immediately after an image group including a scene change. Is converted into a forward prediction encoded image,
Motion vector information for converting the intra-coded image into a forward-predicted encoded image is obtained using motion vector information in forward-predicted encoded images before and after the intra-coded image, and the intra code Information conversion apparatus that obtains complexity when converting an encoded image into a forward prediction encoded image by using the complexity of the forward prediction encoded images before and after the intra encoded image .
第1の圧縮符号化方式で圧縮された飛び越し走査の入力画像圧縮情報を、第2の圧縮符号化方式で圧縮された順次走査の出力画像圧縮情報に変換する画像情報変換装置において、
上記入力画像圧縮情報及び上記出力画像圧縮情報の画像群は、フレーム内で符号化されたイントラ符号化画像、表示順序で順方向を参照して符号化された順方向予測符号化画像及び表示順序で順方向及び逆方向を参照して符号化された双方向予測符号化画像を含み、
上記入力画像圧縮情報及び上記出力画像圧縮情報は複数の符号化画像からなる画像群を単位として構成され、
上記出力画像圧縮情報におけるシーンチェンジを検出するシーンチェンジ検出手段と、
上記入力画像圧縮情報の各フレームのコンプレキシティを検出するコンプレキシティ検出手段と、
上記コンプレキシティ検出手段で検出したコンプレキシティに基づいて上記出力画像圧縮情報に画像情報の符号量を配分する際に、上記シーンチェンジ検出手段で検出したシーンチェンジに応じて上記出力画像圧縮情報における画像群の構造を変換する変換手段とを有し、
上記変換手段は、上記出力画像圧縮情報において、シーンチェンジを含む画像群の直後の画像群の先頭のイントラ符号化画像を順方向予測符号化画像に変換し、
上記イントラ符号化画像を順方向予測符号化画像に変換する際の動きベクトル情報を、当該イントラ符号化画像の前後の順方向予測符号化画像における動きベクトル情報を利用して求めると共に、上記イントラ符号化画像を順方向予測符号化画像に変換する際のコンプレキシティを、上記イントラ符号化画像の前後の順方向予測符号化画像におけるコンプレキシティを利用して求める
画像情報変換装置。
In an image information conversion apparatus for converting input image compression information of interlaced scanning compressed by a first compression encoding method into output image compression information of sequential scanning compressed by a second compression encoding method.
The image group of the input image compression information and the output image compression information includes an intra encoded image encoded within a frame, a forward prediction encoded image encoded with reference to a forward direction in a display order, and a display order. Including a bi-predictive encoded image encoded with reference to the forward and reverse directions,
The input image compression information and the output image compression information are configured in units of an image group composed of a plurality of encoded images,
Scene change detection means for detecting a scene change in the output image compression information;
Complexity detection means for detecting the complexity of each frame of the input image compression information;
The output image compression information according to the scene change detected by the scene change detection means when allocating the code amount of the image information to the output image compression information based on the complexity detected by the complexity detection means. Conversion means for converting the structure of the image group in
The conversion means converts, in the output image compression information, an intra encoded image at the head of an image group immediately after an image group including a scene change into a forward prediction encoded image,
Motion vector information for converting the intra-coded image into a forward-predicted encoded image is obtained using motion vector information in forward-predicted encoded images before and after the intra-coded image, and the intra code Information conversion apparatus that obtains complexity when converting an encoded image into a forward prediction encoded image by using the complexity of the forward prediction encoded images before and after the intra encoded image .
上記入力画像圧縮情報の内、イントラ符号化画像及び順方向予測符号化画像を通過させるが、双方向予測符号化画像を破棄する判別手段を有する請求項2記載の画像情報変換装置。  The image information conversion apparatus according to claim 2, further comprising: a determination unit that allows the intra-coded image and the forward prediction encoded image to pass through the input image compression information but discards the bidirectional predictive encoded image. 上記変換手段は、上記出力画像圧縮情報の2画像群に相当する時間に亘って画像情報を遅延させる遅延手段を有する請求項記載の画像情報変換装置。The image information conversion apparatus according to claim 2 , wherein the conversion means includes delay means for delaying image information over a time corresponding to two image groups of the output image compression information. 上記シーンチェンジ検出手段は、上記コンプレキシティ検出手段で検出した上記入力画像圧縮情報の各フレームに対するコンプレキシティを利用してシーンチェンジを検出する請求項2記載の画像情報変換装置。 The scene change detection means, the image information converting apparatus according to claim 2, wherein detecting the scene change by using the complexity of each frame of the detected said input image compression information in the complexity detecting means. 上記シーンチェンジ検出手段は、次の式が成立すると順方向予測符号化画像におけるシーンチェンジを検出したと判断する請求項記載の画像情報変換装置。
Figure 0004517465
ただし、順方向予測符号化画像に対するコンプレキシティをX、順方向予測符号化画像を含む画像群の先頭のイントラ符号化画像に対するコンプレキシティをXと、予め設定された閾値をXthresholdとする。
6. The image information conversion apparatus according to claim 5 , wherein the scene change detection means determines that a scene change has been detected in a forward prediction encoded image when the following expression is established.
Figure 0004517465
However, the complexity for the forward predictive encoded image is X p , the complexity for the first intra encoded image of the image group including the forward predictive encoded image is X i, and a preset threshold is X threshold And
上記シーンチェンジ検出手段は、上記入力画像圧縮情報を復号する際に、この入力画像圧縮情報を解析して得られた情報に基づいてシーンチェンジを検出し、次の式が成立すると順方向予測符号化画像におけるシーンチェンジを検出したと判断する請求項2記載の画像情報変換装置。
Figure 0004517465
ただし、上記出力画像圧縮情報の各画像を構成する画素ブロックについて、フレーム内で符号化された画素ブロックの個数をNintraと、予め設定された閾値を threshold とする。
When the input image compression information is decoded, the scene change detection means detects a scene change based on information obtained by analyzing the input image compression information. The image information conversion apparatus according to claim 2, wherein it is determined that a scene change has been detected in the digitized image.
Figure 0004517465
However, for the pixel blocks constituting each image of the output image compression information, the number of pixel blocks encoded in the frame is N intra and the preset threshold is N threshold .
1フレームの画像情報を格納するフレームバッファを有し、上記シーンチェンジ検出手段は、上記フレームバッファに格納された画像情報からシーンチェンジを検出する請求項2記載の画像情報変換装置。  3. The image information conversion apparatus according to claim 2, further comprising a frame buffer for storing image information of one frame, wherein the scene change detection means detects a scene change from the image information stored in the frame buffer. 上記シーンチェンジ検出手段は、次の式が成立すると順方向予測符号化画像におけるシーンチェンジを検出したと判断する請求項記載の画像情報変換装置。
Figure 0004517465
ただし、1フレームの特徴量をαと、1フレーム前の特徴量をαprevと、予め設定された閾値をαthresholdとする。
9. The image information conversion apparatus according to claim 8 , wherein the scene change detection means determines that a scene change has been detected in a forward prediction encoded image when the following expression is established.
Figure 0004517465
However, a feature amount of one frame is α, a feature amount of one frame before is α prev, and a preset threshold value is α threshold .
上記特徴量は、画素値の平均値又は分散値である請求項記載の画像情報変換装置。The image information conversion apparatus according to claim 9 , wherein the feature amount is an average value or a variance value of pixel values. 上記出力画像圧縮情報を構成する画像群において、上記シーンチェンジ検出手段によりイントラ符号化画像の直前に位置する順方向予測符号化画像以外の順方向予測符号化画像におけるシーンチェンジが検出された際に、上記イントラ符号化画像の直前又は直後の順方向予測符号化画像における動きベクトル情報に基づいて動きベクトル情報を求め、上記イントラ符号化画像を順方向予測符号化画像に変換する際の動きベクトル情報として用いる請求項2記載の画像情報変換装置。  When a scene change is detected in the forward predictive encoded image other than the forward predictive encoded image located immediately before the intra encoded image by the scene change detection means in the image group constituting the output image compression information. Motion vector information obtained when motion vector information is obtained based on motion vector information in a forward prediction encoded image immediately before or after the intra encoded image, and the intra encoded image is converted into a forward predicted encoded image The image information conversion apparatus according to claim 2, wherein the image information conversion apparatus is used as an image information conversion apparatus. 上記出力画像圧縮情報を構成する画像群において、上記シーンチェンジ検出手段によりイントラ符号化画像の直前に位置する順方向予測符号化画像以外の順方向予測符号化画像におけるシーンチェンジが検出された際に、複数の画素で構成される各画素ブロックに対して、上記イントラ符号化画像の直前又は直後の順方向予測符号化画像における動きベクトル情報と、動きベクトルを0とした場合のうち、符号化効率の良いものを、上記イントラ符号化画像を順方向予測符号化画像に変換する際の動きベクトル情報として用いる請求項2記載の画像情報変換装置。  When a scene change is detected in the forward predictive encoded image other than the forward predictive encoded image located immediately before the intra encoded image by the scene change detection means in the image group constituting the output image compression information. For each pixel block composed of a plurality of pixels, the encoding efficiency of the motion vector information in the forward prediction encoded image immediately before or immediately after the intra encoded image and the motion vector is 0 The image information conversion apparatus according to claim 2, wherein an image having a good quality is used as motion vector information when the intra-coded image is converted into a forward prediction encoded image. 上記出力画像圧縮情報を構成する画像群において、上記シーンチェンジ検出手段によりイントラ符号化画像の直前に位置する順方向予測符号化画像においてシーンチェンジが検出された際に、上記イントラ符号化画像の直後の順方向予測符号化画像における動きベクトル情報に基づいて動きベクトル情報を求め、上記イントラ符号化画像を順方向予測符号化画像に変換する際の動きベクトル情報として用いる請求項2記載の画像情報変換装置。  Immediately after the intra coded image when a scene change is detected in the forward predictive coded image located immediately before the intra coded image by the scene change detection means in the image group constituting the output image compression information. The image information conversion according to claim 2, wherein motion vector information is obtained based on motion vector information in a forward prediction encoded image and used as motion vector information when the intra encoded image is converted into a forward prediction encoded image. apparatus. 第1の圧縮符号化方式で圧縮された飛び越し走査の入力画像圧縮情報を、第2の圧縮符号化方式で圧縮された順次走査の出力画像圧縮情報に変換する画像情報変換方法において、
上記入力画像圧縮情報及び上記出力画像圧縮情報の画像群は、フレーム内で符号化されたイントラ符号化画像、表示順序で順方向を参照して符号化された順方向予測符号化画像及び表示順序で順方向及び逆方向を参照して符号化された双方向予測符号化画像を含み、
上記入力画像圧縮情報及び上記出力画像圧縮情報は複数の符号化画像からなる画像群を単位として構成され、
上記出力画像圧縮情報におけるシーンチェンジを検出するシーンチェンジ検出工程と、
上記入力画像圧縮情報の各フレームのコンプレキシティを検出するコンプレキシティ検出工程と、
上記コンプレキシティ検出工程にて検出したコンプレキシティに基づいて上記出力画像圧縮情報に画像情報の符号量を配分する際に、上記シーンチェンジ検出工程で検出したシーンチェンジに応じて上記出力画像圧縮情報における画像群の構造を変換する変換工程とを有し、
上記変換工程は、上記出力画像圧縮情報において、シーンチェンジを含む画像群の直後の画像群の先頭のイントラ符号化画像を順方向予測符号化画像に変換し、
上記イントラ符号化画像を順方向予測符号化画像に変換する際の動きベクトル情報を、当該イントラ符号化画像の前後の順方向予測符号化画像における動きベクトル情報を利用して求めると共に、上記イントラ符号化画像を順方向予測符号化画像に変換する際のコンプレキシティを、上記イントラ符号化画像の前後の順方向予測符号化画像におけるコンプレキシティを利用して求める
画像情報変換方法。
In an image information conversion method for converting input image compression information of interlaced scanning compressed by a first compression encoding method into output image compression information of sequential scanning compressed by a second compression encoding method,
The image group of the input image compression information and the output image compression information includes an intra encoded image encoded within a frame, a forward prediction encoded image encoded with reference to a forward direction in a display order, and a display order. Including a bi-predictive encoded image encoded with reference to the forward and reverse directions,
The input image compression information and the output image compression information are configured in units of an image group composed of a plurality of encoded images,
A scene change detection step for detecting a scene change in the output image compression information;
A complexity detection step of detecting the complexity of each frame of the input image compression information;
When the code amount of the image information is allocated to the output image compression information based on the complexity detected in the complexity detection step, the output image compression is performed according to the scene change detected in the scene change detection step. A conversion step of converting the structure of the image group in the information,
In the output image compression information, the conversion step converts the first intra encoded image of the image group immediately after the image group including the scene change into a forward prediction encoded image,
Motion vector information for converting the intra-coded image into a forward-predicted encoded image is obtained using motion vector information in forward-predicted encoded images before and after the intra-coded image, and the intra code Information conversion method for obtaining complexity at the time of converting an encoded image into a forward predictive encoded image by using the complexity in the forward predictive encoded images before and after the intra encoded image .
第1の圧縮符号化方式で圧縮された飛び越し走査の入力画像圧縮情報を復号して得られる画像情報を、第2の圧縮符号化方式で圧縮された順次走査の出力画像圧縮情報に符号化する符号化装置において、
上記入力画像圧縮情報及び上記出力画像圧縮情報の画像群は、フレーム内で符号化されたイントラ符号化画像、表示順序で順方向を参照して符号化された順方向予測符号化画像及び表示順序で順方向及び逆方向を参照して符号化された双方向予測符号化画像を含み、
上記入力画像圧縮情報及び上記出力画像圧縮情報は複数の符号化画像からなる画像群を単位として構成され、
上記出力画像圧縮情報におけるシーンチェンジを検出して得られたシーンチェンジを受け取る受け取り手段と、
上記入力画像圧縮情報の各フレームのコンプレキシティを検出するコンプレキシティ検出手段と、
上記コンプレキシティ検出手段で検出したコンプレキシティに基づいて上記出力画像圧縮情報に画像情報の符号量を配分する際に、上記受け取り手段からのシーンチェンジに応じて上記出力画像圧縮情報における画像群の構造を変換する変換手段とを有し、
上記変換手段は、上記出力画像圧縮情報において、シーンチェンジを含む画像群の直後の画像群の先頭のイントラ符号化画像を順方向予測符号化画像に変換し、
上記イントラ符号化画像を順方向予測符号化画像に変換する際の動きベクトル情報を、当該イントラ符号化画像の前後の順方向予測符号化画像における動きベクトル情報を利用して求めると共に、上記イントラ符号化画像を順方向予測符号化画像に変換する際のコンプレキシティを、上記イントラ符号化画像の前後の順方向予測符号化画像におけるコンプレキシティを利用して求める
符号化装置。
The image information obtained by decoding the interlaced scan input image compression information compressed by the first compression encoding method is encoded into the progressive scan output image compression information compressed by the second compression encoding method. In the encoding device,
The image group of the input image compression information and the output image compression information includes an intra encoded image encoded within a frame, a forward prediction encoded image encoded with reference to a forward direction in a display order, and a display order. Including a bi-predictive encoded image encoded with reference to the forward and reverse directions,
The input image compression information and the output image compression information are configured in units of an image group composed of a plurality of encoded images,
Receiving means for receiving a scene change obtained by detecting a scene change in the output image compression information;
Complexity detection means for detecting the complexity of each frame of the input image compression information;
When allocating the code amount of the image information to the output image compression information based on the complexity detected by the complexity detection means, an image group in the output image compression information according to a scene change from the receiving means Conversion means for converting the structure of
The conversion means converts, in the output image compression information, an intra encoded image at the head of an image group immediately after an image group including a scene change into a forward prediction encoded image,
Motion vector information for converting the intra-coded image into a forward-predicted encoded image is obtained using motion vector information in forward-predicted encoded images before and after the intra-coded image, and the intra code The encoding apparatus which calculates | requires the complexity at the time of converting a conversion image into a forward prediction encoding image using the complexity in the forward prediction encoding image before and behind the said intra encoding image .
第1の圧縮符号化方式で圧縮された飛び越し走査の入力画像圧縮情報を復号して得られる画像情報を、第2の圧縮符号化方式で圧縮された順次走査の出力画像圧縮情報に符号化する符号化方法において、
上記入力画像圧縮情報及び上記出力画像圧縮情報の画像群は、フレーム内で符号化されたイントラ符号化画像、表示順序で順方向を参照して符号化された順方向予測符号化画像及び表示順序で順方向及び逆方向を参照して符号化された双方向予測符号化画像を含み、
上記入力画像圧縮情報及び上記出力画像圧縮情報は複数の符号化画像からなる画像群を単位として構成され、
上記出力画像圧縮情報におけるシーンチェンジを検出して得られたシーンチェンジを受け取る受け取り工程と、
上記入力画像圧縮情報の各フレームのコンプレキシティを検出するコンプレキシティ検出工程と、
上記コンプレキシティ検出工程にて検出したコンプレキシティに基づいて上記出力画像圧縮情報に画像情報の符号量を配分する際に、上記受け取り工程からのシーンチェンジに応じて上記出力画像圧縮情報における画像群の構造を変換する変換工程とを有し、
上記変換工程では、上記出力画像圧縮情報において、シーンチェンジを含む画像群の直後の画像群の先頭のイントラ符号化画像を順方向予測符号化画像に変換し、
上記イントラ符号化画像を順方向予測符号化画像に変換する際の動きベクトル情報を、当該イントラ符号化画像の前後の順方向予測符号化画像における動きベクトル情報を利用して求めると共に、上記イントラ符号化画像を順方向予測符号化画像に変換する際のコンプレキシティを、上記イントラ符号化画像の前後の順方向予測符号化画像におけるコンプレキシティを利用して求める
符号化方法。
The image information obtained by decoding the interlaced scan input image compression information compressed by the first compression encoding method is encoded into the progressive scan output image compression information compressed by the second compression encoding method. In the encoding method,
The image group of the input image compression information and the output image compression information includes an intra encoded image encoded within a frame, a forward prediction encoded image encoded with reference to a forward direction in a display order, and a display order. Including a bi-predictive encoded image encoded with reference to the forward and reverse directions,
The input image compression information and the output image compression information are configured in units of an image group composed of a plurality of encoded images,
A receiving step of receiving a scene change obtained by detecting a scene change in the output image compression information;
A complexity detection step of detecting the complexity of each frame of the input image compression information;
When distributing the code amount of the image information to the output image compression information based on the complexity detected in the complexity detection step , the image in the output image compression information according to the scene change from the reception step A conversion process for converting the structure of the group,
In the conversion step, in the output image compression information, the first intra encoded image of the image group immediately after the image group including the scene change is converted into a forward prediction encoded image,
Motion vector information for converting the intra-coded image into a forward-predicted encoded image is obtained using motion vector information in forward-predicted encoded images before and after the intra-coded image, and the intra code Coding method for obtaining complexity when converting a coded image into a forward prediction coded image by using the complexity of forward predicted coded images before and after the intra coded image .
JP2000190056A 2000-06-23 2000-06-23 Image information converting apparatus and method, and encoding apparatus and method Expired - Fee Related JP4517465B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000190056A JP4517465B2 (en) 2000-06-23 2000-06-23 Image information converting apparatus and method, and encoding apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000190056A JP4517465B2 (en) 2000-06-23 2000-06-23 Image information converting apparatus and method, and encoding apparatus and method

Publications (2)

Publication Number Publication Date
JP2002010266A JP2002010266A (en) 2002-01-11
JP4517465B2 true JP4517465B2 (en) 2010-08-04

Family

ID=18689588

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000190056A Expired - Fee Related JP4517465B2 (en) 2000-06-23 2000-06-23 Image information converting apparatus and method, and encoding apparatus and method

Country Status (1)

Country Link
JP (1) JP4517465B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4211023B2 (en) * 2002-02-22 2009-01-21 富士通株式会社 Moving image processing method and moving image processing apparatus
JP5141656B2 (en) * 2009-09-07 2013-02-13 ブラザー工業株式会社 COMMUNICATION CONTROL DEVICE, COMMUNICATION CONTROL METHOD, AND COMMUNICATION CONTROL PROGRAM
WO2016203539A1 (en) * 2015-06-16 2016-12-22 三菱電機株式会社 Image encoding scheme conversion device and image encoding scheme conversion method

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0654315A (en) * 1992-07-31 1994-02-25 Canon Inc Method and device for encoding animation picture
JPH0870458A (en) * 1994-08-29 1996-03-12 Sanyo Electric Co Ltd Method for controlling encoding quantity
JPH09512410A (en) * 1995-02-15 1997-12-09 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ Video signal transcoding method and apparatus
JPH1066092A (en) * 1996-04-23 1998-03-06 Sony Corp Video data compressor and its method
JP2000115786A (en) * 1998-07-22 2000-04-21 Matsushita Electric Ind Co Ltd Coder, recorder and coding method
JP2000165887A (en) * 1998-11-30 2000-06-16 Nippon Telegr & Teleph Corp <Ntt> Re-cording method for image coding data and its program recording medium

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0654315A (en) * 1992-07-31 1994-02-25 Canon Inc Method and device for encoding animation picture
JPH0870458A (en) * 1994-08-29 1996-03-12 Sanyo Electric Co Ltd Method for controlling encoding quantity
JPH09512410A (en) * 1995-02-15 1997-12-09 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ Video signal transcoding method and apparatus
JPH1066092A (en) * 1996-04-23 1998-03-06 Sony Corp Video data compressor and its method
JP2000115786A (en) * 1998-07-22 2000-04-21 Matsushita Electric Ind Co Ltd Coder, recorder and coding method
JP2000165887A (en) * 1998-11-30 2000-06-16 Nippon Telegr & Teleph Corp <Ntt> Re-cording method for image coding data and its program recording medium

Also Published As

Publication number Publication date
JP2002010266A (en) 2002-01-11

Similar Documents

Publication Publication Date Title
JP4517495B2 (en) Image information conversion apparatus, image information conversion method, encoding apparatus, and encoding method
US7266148B2 (en) Video transcoding apparatus
US7515636B2 (en) Image information conversion apparatus and image information conversion method
US6870886B2 (en) Method and apparatus for transcoding a digitally compressed high definition television bitstream to a standard definition television bitstream
JP2003527005A (en) Apparatus and method for generating reduced transcoding hint metadata
JPH07264580A (en) Method for transmitting video signal and video signal transmitter and receiver
EP1575294A1 (en) Method and apparatus for improving the average image refresh rate in a compressed video bitstream
JP2004289796A (en) System and method for adaptively encoding sequence of image
JP4517475B2 (en) Image information converting apparatus and method, and encoding apparatus and method
JP4517453B2 (en) Image information converting apparatus and method, and encoding apparatus and method
JP2000236547A (en) Image information converter and image information conversion method
JP4517465B2 (en) Image information converting apparatus and method, and encoding apparatus and method
JP2002125227A (en) Image information converter and image information converting method
JP4608801B2 (en) Image information conversion apparatus and method
JP4517468B2 (en) Image information converting apparatus and method, and encoding apparatus and method
KR100770873B1 (en) Method and apparatus of controling bit rate in image encoding
JP2001346214A (en) Image information transform device and method
US7012959B2 (en) Picture information conversion method and apparatus
JP2001148852A (en) Image information converter and image information conversion method
JP4505992B2 (en) Image information conversion apparatus and method
JP2001339720A (en) Image information conversion apparatus and method for same
JP4507418B2 (en) Image information conversion apparatus and image information conversion method
JP2002232891A (en) Image information converter and method
JP2002125234A (en) Image information converter and method
JP2002152728A (en) Image information conversion apparatus and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081202

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100303

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100510

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees