JP4517495B2 - 画像情報変換装置及び画像情報変換方法並びに符号化装置及び符号化方法 - Google Patents

画像情報変換装置及び画像情報変換方法並びに符号化装置及び符号化方法 Download PDF

Info

Publication number
JP4517495B2
JP4517495B2 JP2000344490A JP2000344490A JP4517495B2 JP 4517495 B2 JP4517495 B2 JP 4517495B2 JP 2000344490 A JP2000344490 A JP 2000344490A JP 2000344490 A JP2000344490 A JP 2000344490A JP 4517495 B2 JP4517495 B2 JP 4517495B2
Authority
JP
Japan
Prior art keywords
image
information
quantization scale
compression information
image compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000344490A
Other languages
English (en)
Other versions
JP2002152727A (ja
Inventor
数史 佐藤
邦明 高橋
輝彦 鈴木
陽一 矢ヶ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2000344490A priority Critical patent/JP4517495B2/ja
Priority to US09/986,436 priority patent/US6950468B2/en
Publication of JP2002152727A publication Critical patent/JP2002152727A/ja
Application granted granted Critical
Publication of JP4517495B2 publication Critical patent/JP4517495B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像情報変換装置及び画像情報変換方法並びに符号化装置及び符号化方法に関し、特に、離散コサイン変換等の直交変換と動き補償とによって圧縮された画像情報(ビットストリーム)を衛星放送、ケーブルTV、インターネット等のネットワークメディアを介して受信する際、あるいは、光ディスク及び光磁気ディスク等の記録媒体上で処理する際に用いられる画像情報変換装置及び画像情報変換方法並びに符号化装置及び符号化方法に関するものである。
【0002】
【従来の技術】
近年、画像情報をディジタルデータとして取り扱い、その際、画像情報特有の冗長性を利用し、効率の高い情報の伝送及び蓄積を目的とした、例えば離散コサイン変換等の直交変換と動き補償により圧縮する方式に準拠した装置が、放送局などの情報配信及び一般家庭における情報受信の双方において普及しつつある。
【0003】
特に、MPEG(Moving Picture Experts Group:動画像符号化専門家会合)によって標準化されているMPEG2は、汎用画像符号化方式としてISO/IEC 13818−2に定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅している。そのためMPEG2は、プロフェッショナル用途からコンシューマ用途まで、広範なアプリケーションに今後とも用いられるものと予想される。
【0004】
このようなMPEG2圧縮方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4〜8Mbpsの符号量(以下、ビットレートと記す。)を、1920×1088画素を持つ高解像度の飛び越し走査画像であれば18〜22Mbpsのビットレートを割り当てることで、高い圧縮率と良好な画質の実現が可能である。
【0005】
MPEG2は、主として放送用に適合する高画質符号化を対象としていたが、MPEG1よりも低いビットレート、つまり、より高い圧縮率の符号化方式には対応していなかった。ところが携帯端末の普及とともに、今後より高い圧縮率の符号化方式のニーズは高まると予想されたことからMPEG4符号化方式の標準化が行われ、画像符号化方式に関しては、1998年12月にISO/IEC 14496−2として国際標準に承認されている。
【0006】
ところで、ディジタル放送に対応するように一旦符号化されたMPEG2画像圧縮情報(以下、MPEG2ビットストリームと記す。)を携帯端末等で処理するためには、より低いビットレートのMPEG4画像圧縮情報(以下、MPEG4ビットストリームと記す。)に変換することが要求される。
【0007】
かかる要求に応える画像情報変換装置(トランスコーダ)として、“Field-to-Frame Transcoding with Spatial and Temporal Downsampling”(Susie J Wee,John G.Apostlopoulos,and Nick Feamster,ICIP'99、これを以下、文献1と呼ぶ)において、図4示す装置が提案されている。
【0008】
図4に示す画像情報変換装置100は、ピクチャタイプ判別部101と、MPEG2画像情報(I/Pピクチャ)復号化部102と、間引き部103と、ビデオメモリ104と、MPEG4画像情報(I/P−VOP)符号化部105と、動きベクトル合成部106と、動きベクトル検出部107とを備えている。ここで、MPEG4におけるVOP(Video Object Plane)とは、MPEG2におけるフレームに相当するものである。
【0009】
まず、ピクチャタイプ判別部101は、飛び越し走査のMPEG2画像圧縮情報(以下、MPEG2ビットストリームと記す。)における各フレームのデータを入力し、MPEG2画像情報(以下、I/Pピクチャと記す。)に関するものか、Bピクチャに関するものであるかを判別する。ピクチャタイプ判別部101は、前者のみを後続のMPEG2画像情報復号化部102へと出力する。
【0010】
MPEG2画像情報復号化部102における処理は、通常のMPEG2画像情報復号化部と同様であるが、Bピクチャに関するデータはピクチャタイプ判別部101において廃棄されるため、MPEG2画像情報復号化部102における機能としてはI/Pピクチャのみを復号可能であればよい。
【0011】
間引き部103は、MPEG2画像情報復号化部102からの画像値を入力し、水平方向に1/2の間引き処理を施し、垂直方向に第1フィールド、も
しくは第2フィールドのどちらか一方のデータのみを残し、他方を廃棄する処理を施すことによって、入力した画像情報の1/4の大きさを持つ順次走査画像を生成する。
【0012】
ところで、例えば、MPEG2画像情報復号化部102から入力したMPEG2ビットストリームがNTSC(National Television System Committee)の規格に準拠した画像、つまり720×480画素、30Hzの飛び越し走査画像であった場合、間引き部103における間引き処理後の画枠は360×240画素になる。ところが、後続のMPEG4画像情報符号化部105において符号化を行う際、マクロブロック単位の処理を行うには、水平方向、垂直方向ともに、その画素数が16の倍数である必要がある。したがって、間引き部103は、さらに、そのための画素の補填または廃棄を行う。すなわち、上記の場合においては、例えば、水平方向の右端、もしくは左端の8ラインを廃棄して352×240画素とする。
【0013】
間引き部103によって生成された順次走査画像は、ビデオメモリ104に蓄積された後、MPEG4画像情報符号化部105によって符号化処理が施され、MPEG4ビットストリームとして出力される。
【0014】
入力となるMPEG2ビットストリーム中の動きベクトル情報は、動きベクトル合成部106に供給されて、間引き後の画像情報に対する動きベクトルにマッピングされる。
【0015】
動きベクトル検出部107は、動きベクトル合成部106において合成された動きベクトル値に基づいて、高精度の動きベクトルを検出する。
【0016】
文献1に示される画像情報変換装置100は、入力されたMPEG2ビットストリームの1/2×1/2の大きさを持つ順次走査画像のMPEG4ビットストリームを生成する装置である。すなわち、例えば入力となるMPEG2ビットストリームがNTSC規格に準拠している場合、出力されるMPEG4ビットストリームは、SIFサイズ(352×240)となっている。画像情報変換装置100は、間引き部103における動作の変更を行うことで、これ以外の画枠、例えば上記の例で、約1/4×1/4の画枠であるQSIF(176×112画素)サイズの画像に変換することも可能である。
【0017】
さらに、また、画像情報変換装置100は、MPEG2画像情報復号化部102における処理として、水平方向、垂直方向それぞれについて入力したMPEG2ビットストリーム内の8次の離散コサイン変換係数のうちのすべてを用いた復号処理を行うほか、水平方向のみ、あるいは水平方向、垂直方向ともに8次の離散コサイン変換係数のうちの低域成分のみを用いた復号処理を行い、画質劣化を最小限に抑えながら復号処理に伴う演算量とビデオメモリ容量とを削減している。
【0018】
ところで、図4に示した画像情報変換装置100においては、MPEG4画像情報符号化部105における符号量制御がMPEG4ビットストリームにおける画質を決定する大きな要因となる。ISO/IEC 14496−2においては、符号量制御の方式は、特に規定されておらず、各ベンダがアプリケーションに応じて演算量及び出力画質の観点から最適と考えられる方式を用いることができる。以下では、代表的な符号量制御方式として、MPEG2 Test Model5(ISO/IEC JTC1/SC29/WG11 N0400)に規定されている方式について説明する。
【0019】
符号量制御の動作は、目標符号量(ターゲットビットレート)、及びGOP(Group Of Pictures)構成を入力変数として、まず、第1ステップとして各ピクチャヘのビット配分を行い、次に、仮想バッファを用いたレート制御を行い、最後に、視覚特性を考慮したマクロブロック毎の適応量子化を行う。この符号量制御の動作を図5に示す。
【0020】
ステップS101において、MPEG4画像情報符号化部105は、GOP内の各ピクチャに対する割り当てビット量を、割り当て対象ピクチャを含め、まだ復号化されていないピクチャに対して割り当てられるビット量(以下、これをRとする)に基づいて配分する。この配分をGOP内の符号化ピクチャ順に繰り返す。この際、以下に述べる2つの仮定を用いて各ピクチャヘの符号量割り当てを行う。
【0021】
まず第1に、各ピクチャを符号化する際に用いる平均量子化スケールコードと発生符号量との積は、画面が変化しない限りピクチャタイプ毎に一定値となると仮定する。そこで、各ピクチャを符号化した後、各ピクチャタイプ毎に、画面の複雑さを示す変数X、X、及びX(grobal complexity measure)を以下に示す式(1)乃至(3)により更新する。
【0022】
【数1】
Figure 0004517495
【0023】
ここでS、S、及びSは、ピクチャ符号化時の発生符号ビット量であり、Q、Q、及びQは、ピクチャ符号化時の平均量子化スケールコードである。また、初期値は、目標符号量(ターゲットビットレート)bit_rate[bits/sec]を用いて、以下に示す式(4)乃至(6)で表される値とする。
【0024】
【数2】
Figure 0004517495
【0025】
第2に、Iピクチャの量子化スケールコードを基準としたP、Bピクチャの量子化スケールコードの比率K、Kが式(7)に定めた値となる場合に常に全体の画質が最適化されると仮定する。
【0026】
【数3】
Figure 0004517495
【0027】
すなわち、Bピクチャの量子化スケールコードは、I及びPピクチャの量子化スケールコードの常に1.4倍である。これは、BピクチャをI及びPピクチャに比較して多少粗めに符号化することにより、Bピクチャで節約できる符号量をI,Pピクチャに加えると、I,Pピクチャの画質が改善され、これを参照するBピクチャの画質も改善されることを想定している。
【0028】
上記2つの仮定より、GOPの各ピクチャに対する割り当てビット量(T,T,T)は、式(8)乃至(10)に示す値とする。
【0029】
【数4】
Figure 0004517495
【0030】
ここで、N及びNは、GOP内でまだ符号化されていないP,Bピクチャの枚数である。
【0031】
このようにして求めた割当符号量に基づいて、各ピクチャをステップS101及び102にしたがってって符号化する毎にGOP内の未符号化ピクチャに対して割り当てられるビット量Rを、以下に示す式(11)によって更新する。
【0032】
【数5】
Figure 0004517495
【0033】
また、GOPの最初のピクチャを符号化する際には、式(12)によりRを更新する。式(12)において、Nは、GOP内のピクチャ数を表している。シーケンスの最初におけるRの初期値は、0とする。
【0034】
【数6】
Figure 0004517495
【0035】
ステップS102では、ステップS101において式(8)乃至(10)により求められた各ピクチャに対する割当ビット量(T,T,T)と、実際の発生符号量を一致させるため、各ピクチャ毎に独立に設定した3種類の仮想バッファの容量に基づいて、量子化スケールコードをマクロブロック単位のフィードバック制御で求める。まず、j番目のマクロブロック符号化に先立ち、仮想バッファの占有量を式(13)乃至(15)によって求める。
【0036】
【数7】
Figure 0004517495
【0037】
式(13)乃至(15)において、d 、d 、及びd は、各仮想バッファの初期占有量を示し、Bは、ピクチャの先頭からj番目のマクロブロックまでの発生ビット量を示し、MB_cntは、1ピクチャ内のマクロブロック数を示している。各ピクチャ符号化終了時の仮想バッファ占有量(dMB_cnt ,dMB_cnt ,dMB_cnt )は、それぞれ同一のピクチャタイプであり、次のピクチャに対する仮想バッファ占有量の初期値(d ,d ,d )として用いられる。
【0038】
次に、j番目のマクロブロックに対する量子化スケールコードを式(16)により計算する。
【0039】
【数8】
Figure 0004517495
【0040】
式(16)において、rは、リアクションパラメータと呼ばれるフィードバックループの応答を制御する変数であり、続いて示す式(17)により与えられる。
【0041】
【数9】
Figure 0004517495
【0042】
なお、符号化開始時における仮想バッファの初期値は、式(18)乃至(20)に示す値である。
【0043】
【数10】
Figure 0004517495
【0044】
ステップS103では、ステップS102で求められた量子化スケールコードを視覚的に劣化の目立ちやすい平坦部において、より細かく量子化し、比較的劣化の目立ちにくい絵柄の複雑な部分で粗く量子化するように各マクロブロック毎のアクティビィティと呼ばれる変数によって変化させている。
【0045】
アクティビティは、原画の輝度信号画素値を用い、フレーム離散コサイン変換モードにおける4個のブロックと、フィールド離散コサイン変換モードにおける4個のブロックとの、合計8ブロックの画素値を用いて、以下に示す式(21)で与えられる。
【0046】
【数11】
Figure 0004517495
【0047】
ここで、Pは、原画の輝度信号ブロック内画素値である。式(21)において最小値を採るのは、マクロブロック内の一部だけでも平坦部分のある場合には量子化を細かくするためである。
【0048】
さらに、以下に示す式(22)により、その値が0.5〜2の範囲である正規化アクティビティNactを求める。
【0049】
【数12】
Figure 0004517495
【0050】
式(22)において、avg−actは、直前に符号化したピクチャでのactの平均値を示している。
【0051】
視覚特性を考慮した量子化スケールコードmquantは、ステップS102で得られた量子化スケールコードQに基づいて、以下に示す式(23)で与えられる。
【0052】
【数13】
Figure 0004517495
【0053】
ところで、「MPEG圧縮効率の理論解析とその符号量制御への応用」(信学技報、IE−95,DSP95−10,1995年5月、以下、これを文献2と記す。)にも記述されているように、Test Model5で定められている符号量制御方式は、MPEG2画像符号化部において、必ずしも良好な画質を与えるものではない。
【0054】
文献2では、特に、良好な画質を与えるためのGOP内における各フレーム毎の最適な符号量配分を与える手法として、以下の方式を提案している。
【0055】
,N,及びNをGOP内においてまだ符号化されていないI,P及びBピクチャの枚数とし、これらに割り当てられる符号量をR,R,Rとすれば、以下の式(24)に示すような固定レート条件が成立する。
【0056】
【数14】
Figure 0004517495
【0057】
それぞれのフレームにおける量子化ステップサイズをQ,Q,Qとし、mを量子化ステップサイズと再生誤差分散を関係付ける次数とすれば、すなわち、量子化ステップサイズをm乗したものの平均値の最小化が再生誤差分散を最低にすると仮定すれば、以下に示す式(25)を最小にすることによって、GOP内における各フレーム毎の最適な符号量配分を与える。
【0058】
【数15】
Figure 0004517495
【0059】
なお、それぞれのフレームにおける平均QスケールQ、及び符号量Rは、Test Model5においても用いられる媒体変数としての各フレームのコンプレキシティXと、以下に示す式(26)のように関係付けられる。
【0060】
【数16】
Figure 0004517495
【0061】
したがって、式(24)の拘束条件の下で式(26)を考慮に入れて、式(25)を最小にするようなR,R,Rをラグランジェの未定乗数法を用いて算出すると、最適なR,R,Rとして、以下に示す式(27)乃至(29)のような値が求められる。
【0062】
【数17】
Figure 0004517495
【0063】
α=1として、式(27)乃至(29)と、MPEG2 Test Model5で定められた符号量制御方式における上述の式(8)乃至(9)との関係は、以下の通りである。すなわち、式(27)乃至(29)は、符号量制御の媒介変数であるK,Kを各フレームのコンプレキシティX,X、Xに応じて、以下に示す式(30)のように適応的に算出している。
【0064】
【数18】
Figure 0004517495
【0065】
文献2では、1/(1+m)の値として、0.6〜1.2程度に設定することで良好な画質が得られることが示されている。
【0066】
【発明が解決しようとする課題】
ところが、MPEG2 Test Model5において定められた上記符号量制御方式には、以下の制限のあることが知られている。
【0067】
第1の制限は、図5におけるステップS101は、シーンチェンジに対応できず、また、シーンチェンジ後にステップS103で用いる媒介変数avg_actが間違った値となるということである。また、第2の制限は、MPEG2及びMPEG4において規定されているVBV(Video Buffer Verifier)の拘束条件を満たす保証がないことである。
【0068】
したがって、実際、符号量制御を行う場合には、これらの制限に対する対策が必要となる。
【0069】
また、式(18)では、最初のI−VOPにおける参照量子化スケールの初期値を10としているが、この初期値は、絵柄とビットレートによっては必ずしも適切な値であるとは限らない。特に、SIF,QSIFといった画像では、マクロブロックの数が少ないため、符号量制御のフィードバックループが安定するまでに数VOPを要することもある。そのため、Video Object初期における画質劣化が参照量子化スケールの初期値に起因する場合がある。
【0070】
そこで本発明は、このような従来の実情に鑑みて提案されたものであり、MPEG2画像圧縮情報から抽出される情報に基づいてMPEG4画像符号化における符号量制御を行う際、初期値設定に伴う画質劣化を回避する画像情報変換装置及び画像情報変換方法並びに符号化装置及び符号化方法を提供することを目的とする。
【0071】
【課題を解決するための手段】
本発明にかかる画像情報変換装置は、第1の画像圧縮情報を第2の画像圧縮情報に変換する画像情報変換装置であって、上記第1の画像圧縮情報と上記第1の画像圧縮情報の画像内符号化画像における平均量子化スケールとを受け取る受け取り手段と、上記受け取り手段により受け取られた平均量子化スケールを用いて、上記第2の画像圧縮情報に変換する際の参照量子化スケールの初期値を決定する量子化スケール決定手段と、上記量子化スケール決定手段により決定された参照量子化スケールの初期値と上記第2の画像圧縮情報に変換する際に使用する量子化スケールを表す整数の最大値とを乗算した値と、ビットレートとピクチャレートとの比に基づく変数と、の比率に従って、上記第2の画像圧縮情報を画像内符号化画像として変換する際の仮想バッファ占有量の初期値を決定する決定手段と、上記決定手段により決定された仮想バッファ占有量の初期値に従って、上記受け取り手段により受け取られた上記第1の画像圧縮情報を上記第2の画像圧縮情報に変換する変換手段とを備えることにより、上述した課題を解決する。
【0072】
また、本発明にかかる画像情報変換方法は、第1の画像圧縮情報を第2の画像圧縮情報に変換する画像情報変換方法であって、上記第1の画像圧縮情報と上記第1の画像圧縮情報の画像内符号化画像における平均量子化スケールとを受け取る受け取り工程と、上記受け取り工程により受け取られた平均量子化スケールを用いて、上記第2の画像圧縮情報に変換する際の参照量子化スケールの初期値を決定する量子化スケール決定工程と、上記量子化スケール決定工程により決定された参照量子化スケールの初期値と上記第2の画像圧縮情報に変換する際に使用する量子化スケールを表す整数の最大値とを乗算した値と、ビットレートとピクチャレートとの比に基づく変数と、の比率に従って、上記第2の画像圧縮情報を画像内符号化画像として変換する際の仮想バッファ占有量の初期値を決定する決定工程と、上記決定工程により決定された仮想バッファ占有量の初期値に従って、上記受け取り工程により受け取られた上記第1の画像圧縮情報を上記第2の画像圧縮情報に変換する変換工程とを備えることにより、上述した課題を解決する。
【0073】
ここで、第1の画像圧縮情報から抽出される情報として、第1の画像圧縮情報の最初の画像内符号化画像における平均量子化スケールを用いることがあげられる。
【0074】
【発明の実施の形態】
以下、図面を参照しながら、本発明の実施の形態について具体的に説明する。
【0075】
本発明にかかる画像情報変換装置は、入力されるMPEG2画像圧縮情報から抽出される情報に基づいて、MPEG4画像符号化を行う際の参照量子化スケールの初期値を算出し、これを用いて仮想バッファ占有量の初期値を算出することで、参照量子化スケールが不適切な値であることに起因する画質劣化を回避するものである。
【0076】
本発明の第1の実施の形態として、図1に示す画像情報変換装置1は、ピクチャタイプ判別部10、圧縮情報解析部11、MPEG2画像情報復号化部12、間引き部13、ビデオメモリ14、MPEG4画像情報(I/P−VOP)符号化部15、動きベクトル合成部16、動きベクトル検出部17、情報バッファ18、コンプレキシティ算出部19とを備えている。
【0077】
ピクチャタイプ判別部10は、飛び越し走査のMPEG2画像圧縮情報(以下、MPEG2ビットストリームと記す。)における各フレームのデータを入力し、画像内符号化画像(以下、Iピクチャと記す。)、画像間予測符号化画像(以下、Pピクチャと記す。)、双方向予測符号化画像(以下、Bピクチャと記す。)の何れのピクチャに関するものであるかを判別する。ピクチャタイプ判別部10は、Iピクチャ及びPピクチャ(以下、I/Pピクチャと記す。)に関する情報は、後段の圧縮情報解析部12に伝送するが、Bピクチャに関する情報は破棄する。
【0078】
圧縮情報解析部11は、復号処理に用いられた量子化スケールのフレーム全体にわたる平均値Qと、MPEG2ビットストリームにおいて当該フレームに割り当てられた総符号量(ビット数)Bとを解析し、必要な情報を情報バッファ18に伝送する。
【0079】
情報バッファ18は、MPEG2ビットストリームにおけるI/Pピクチャの発生符号量(ビット数)及び平均量子化スケールを蓄積する。
【0080】
コンプレキシティ算出装置19は、情報バッファ18に格納されたフレーム毎の情報Q及びBから、MPEG4画像圧縮情報(以下、MPEG4ビットストリームと記す。)の各VOPに対するコンプレキシティXの推定値を上述した式(20)により算出する。
【0081】
MPEG2画像情報復号化部12は、MPEG2ビットストリームにおけるI/Pピクチャに関する情報の復号処理を行う。MPEG2画像情報復号化部12は、通常のMPEG2画像情報復号化部と同様であるが、Bピクチャに関するデータは、ピクチャタイプ判別部10において廃棄されるため、MPEG2画像情報復号化部12は、少なくともI/Pピクチャを復号可能であればよい。
【0082】
間引き部13は、MPEG2画像情報復号化部12からの画像値を入力し、水平方向に1/2の間引き処理を施し、垂直方向に第1フィールド、もしくは第2フィールドのどちらか一方のデータのみを残し、他方を廃棄する処理を施すことによって、入力した画像情報の1/4の大きさを持つ順次走査画像を生成する。
【0083】
ところで、例えば、MPEG2画像情報復号化部12から入力したMPEG2ビットストリームがNTSC(National Television System Committee)の規格に準拠した画像、つまり720×480画素、30Hzの飛び越し走査画像であった場合、間引き部13における間引き処理後の画枠は360×240画素になる。ところが、後続のMPEG4画像情報符号化部15において符号化を行う際、マクロブロック単位の処理を行うには、水平方向、垂直方向ともに、その画素数が16の倍数である必要がある。したがって、間引き部13は、さらに、そのための画素の補填または廃棄を行う。すなわち、上記の場合においては、例えば、水平方向の右端、もしくは左端の8ラインを廃棄して352×240画素とする。ここで、MPEG4画像情報をI/P−VOPと記すものとする。VOP(Video Object Plane)は、MPEG2におけるフレームに相当するものである。
【0084】
間引き部13によって生成された順次走査画像は、ビデオメモリ14に蓄積された後、MPEG4画像情報符号化部15によって符号化処理が施され、MPEG4ビットストリームとして出力される。
【0085】
入力となるMPEG2ビットストリーム中の動きベクトル情報は、動きベクトル合成部16に供給されて、間引き後の画像情報に対する動きベクトルにマッピングされる。
【0086】
動きベクトル検出部17は、動きベクトル合成部16において合成された動きベクトル値に基づいて、高精度の動きベクトルを検出する。
【0087】
画像情報変換装置1は、入力されたMPEG2ビットストリームの1/2×1/2の大きさを持つ順次走査画像のMPEG4ビットストリームを生成する装置である。すなわち、例えば入力となるMPEG2ビットストリームがNTSC規格に準拠している場合、出力されるMPEG4ビットストリームは、SIFサイズ(352×240)となっている。画像情報変換装置1は、間引き部13における動作の変更を行うことで、これ以外の画枠、例えば上記の例で、約1/4×1/4の画枠であるQSIF(176×112画素)サイズの画像に変換することも可能である。
【0088】
さらに、また、画像情報変換装置1は、MPEG2画像情報復号化部12における処理として、水平方向、垂直方向それぞれについて入力したMPEG2ビットストリーム内の8次の離散コサイン変換係数のうちのすべてを用いた復号処理を行うほか、水平方向のみ、あるいは水平方向、垂直方向ともに8次の離散コサイン変換係数のうちの低域成分のみを用いた復号処理を行い、画質劣化を最小限に抑えながら復号処理に伴う演算量とビデオメモリ容量とを削減している。
【0089】
圧縮情報解析部11において、復号処理に用いられた量子化スケールのフレーム全体にわたる平均値Q、及びMPEG2ビットストリームにおいて、当該フレームに割り当てられた総符号量(ビット数)Bは、情報バッファ18に格納される。
【0090】
コンプレキシティ算出部19においては、情報バッファ18に格納されたフレーム毎の情報Q及びBから、当該フレームに対するコンプレキシティXを以下の式(31)により算出する。
【0091】
【数19】
Figure 0004517495
【0092】
上述の式(31)によって算出された当該フレームに対するコンプレキシティXは、1GOV分バッファリングされた後、MPEG4画像情報符号化部15に符号量制御のための媒介変数として伝送される。このため、1GOV分の遅延が必要となる。この遅延は遅延バッファを用いて実現される。
【0093】
以下では、式(31)において算出されたGOV内の各フレームに対するコンプレキシティXがMPEG4画像情報符号化部15においてどの様に用いられるかについて述べる。なお、以下では、ピクチャタイプ判別部10が装置内に存在せず、フレームレートの変換を行わない場合も考慮することにする。
【0094】
式(30)によって求められたK、Kは、I−VOPに対する理想的な平均量子化スケールQi_idealに対するP−VOP/B−VOPに対する理想的な平均量子化スケールQp_idealとQb_idealとの比が、以下の式(32)であることである。
【0095】
【数20】
Figure 0004517495
【0096】
MPEG2 Test Model5においては、式(30)のように適応的にK、Kを算出することを行わず、式(7)に示したような固定値を用いている。
【0097】
式(30)及び式(32)から、任意のVOP1と、任意のVOP2とに対するコンプレキシティをそれぞれX,Xとし、理想的な量子化スケールをQ1_ideal、Q2_idealとすれば、以下の式(33)に示すようになる。
【0098】
【数21】
Figure 0004517495
【0099】
あるいはまた、MPEG2 Test Model5のように式(7)に示した固定値を用いたい場合には、式(33)に代えて以下の式(34)を用いればよい。
【0100】
【数22】
Figure 0004517495
【0101】
ここで、GOV内の未符号化されたVOPに対して割り当てられる総符号量(ビット数)をRとし、Rが各VOPに対して、R、R、・・・、Rと割り当てられるとき、当該GOVに対する画質が最適化されるものとする。このとき、RとR、R、・・・、Rの間には、以下の式(35)に示す関係式が成り立つ。
【0102】
【数23】
Figure 0004517495
【0103】
任意のVOPkに対する平均量子化スケールQ、割当符号量R,コンプレキシティXの間には、以下に示す式(36)で表される関係が成り立つ。
【0104】
【数24】
Figure 0004517495
【0105】
ここで、式(36)を考慮して、式(35)を変形すると以下に示す式(37)を得る。
【0106】
【数25】
Figure 0004517495
【0107】
式(37)において、K(X,X)は、式(33)に示した値を用いても、式(34)に示した値を用いてもよいが、前者の方が画像に応じたより最適な符号量配分を実現することが可能である。
【0108】
その際、1/(1+m)の値を1.0と設定することで、指数演算を行うことが不要となるため、高速な実行が可能となる。また、1/(1+m)の値を1.0以外に設定する場合にも、予めテーブルを持ち、これを参照して指数演算を行うことで高速な実行が可能となる。
【0109】
式(37)における各VOPに対するコンプレキシティXは、MPEG4画像符号化によるものであるが、MPEG2画像符号化による各フレームに対するコンプレキシティと、MPEG4画像符号化による各フレームに対するコンプレキシティが等しいと仮定すれば、コンプレキシティ算出装置17に格納されたXを用いることで、式(37)によって当該VOPに対する目標符号量を算出することを可能としている。
【0110】
図2に、画像情報変換装置1が目標符号量を算出する際の処理フローを示す。
【0111】
ステップS1において、MPEG2画像情報復号化部12は、GOP内の各フレームに対する平均量子化スケールQ、及び割当符号量(ビット数)Bを抽出する。
【0112】
ステップS2において、コンプレキシティ算出部19は、コンプレキシティXを算出する。
【0113】
続いて、ステップS3において、MPEG4画像情報符号化部15は、コンプレキシティXに応じた目標符号量(ターゲットビットレート)の算出を行う。
【0114】
MPEG2 Test Model5では、GOP内におけるI,P,Bピクチャに対するコンプレキシティX、X、Xは、一定であると仮定しているが、実際には、GOP内にシーンチェンジを含む場合やGOP内で背景が著しく変化する場合等はこの仮定が成り立たず、安定した符号量制御の妨げとなり、画質劣化の要因ともなる。図1に示した画像情報変換装置1によれば、入力されたMPEG2ビットストリームにおける各フレームに対するコンプレキシティに基づいた符号量制御を行うため、画質劣化を引き起こすことなく、安定した符号量制御を行うことを可能としている。
【0115】
続いて、本発明の第2の実施の形態として示す画像情報変換装置2を、図3を参照にして具体的に説明する。
【0116】
図3に示す画像情報変換装置2は、ピクチャタイプ判別部20と、圧縮画像解析部21と、MPEG2画像情報復号化部22と、間引き部23と、ビデオメモリ24と、MPEG4画像情報符号化部25と、動きベクトル合成部26と、動きベクトル検出部27と、情報バッファ28と、コンプレキシティ算出部29と、初期参照量子化スケール決定部30とを備えている。
【0117】
ピクチャタイプ判別部20は、飛び越し走査のMPEG2画像圧縮情報(以下、MPEG2ビットストリームと記す。)における各フレームのデータを入力し、MPEG2画像情報(以下、I/Pピクチャと記す。)に関するものか、Bピクチャに関するものであるかを判別する。ピクチャタイプ判別部20は、I/Pピクチャに関する情報は後段の圧縮画像解析部21に伝送するが、Bピクチャに関する情報は破棄する。
【0118】
圧縮情報解析部21は、復号処理に用いられた量子化スケールのフレーム全体にわたる平均値Qと、MPEG2ビットストリームにおいて当該フレームに割り当てられた総符号量(ビット数)Bとを解析し、必要な情報を情報バッファ28に伝送する。
【0119】
情報バッファ28は、MPEG2ビットストリームにおけるI/Pピクチャの発生符号量(ビット数)及び平均量子化スケールを蓄積する。
【0120】
コンプレキシティ算出装置20は、情報バッファ28に格納されたフレーム毎の情報Q及びBから、MPEG4画像圧縮情報(以下、MPEG4ビットストリームと記す。)の各VOPに対するコンプレキシティXの推定値を上述した式(20)により算出する。
【0121】
MPEG2画像情報復号化部22は、MPEG2ビットストリームにおけるI/Pピクチャに関する情報の復号処理を行う。MPEG2画像情報復号化部22は、通常のMPEG2画像情報復号化部と同様であるが、Bピクチャに関するデータは、ピクチャタイプ判別部20において廃棄されるため、MPEG2画像情報復号化部12は、少なくともI/Pピクチャを復号可能であればよい。
【0122】
間引き部23は、MPEG2画像情報復号化部22からの画像値を入力し、水平方向に1/2の間引き処理を施し、垂直方向に第1フィールド、もしくは第2フィールドのどちらか一方のデータのみを残し、他方を廃棄する処理を施すことによって、入力した画像情報の1/4の大きさを持つ順次走査画像を生成する。
【0123】
ところで、例えば、MPEG2画像情報復号化部22から入力したMPEG2ビットストリームがNTSC(National Television System Committee)の規格に準拠した画像、つまり720×480画素、30Hzの飛び越し走査画像であった場合、間引き部23における間引き処理後の画枠は360×240画素になる。ところが、後続のMPEG4画像情報符号化部15において符号化を行う際、マクロブロック単位の処理を行うには、水平方向、垂直方向ともに、その画素数が16の倍数である必要がある。したがって、間引き部13は、さらに、そのための画素の補填または廃棄を行う。すなわち、上記の場合においては、例えば、水平方向の右端、もしくは左端の8ラインを廃棄して352×240画素とする。ここで、MPEG4画像情報をI/P−VOPと記すものとする。VOP(Video Object Plane)は、MPEG2におけるフレームに相当するものである。
【0124】
間引き部23によって生成された順次走査画像は、ビデオメモリ14に蓄積された後、MPEG4画像情報符号化部25によって符号化処理が施され、MPEG4ビットストリームとして出力される。
【0125】
入力となるMPEG2ビットストリーム中の動きベクトル情報は、動きベクトル合成部26に供給されて、間引き後の画像情報に対する動きベクトルにマッピングされる。
【0126】
動きベクトル検出部27は、動きベクトル合成部26において合成された動きベクトル値に基づいて、高精度の動きベクトルを検出する。
【0127】
画像情報変換装置2は、入力されたMPEG2ビットストリームの1/2×1/2の大きさを持つ順次走査画像のMPEG4ビットストリームを生成する装置である。すなわち、例えば入力となるMPEG2ビットストリームがNTSC規格に準拠している場合、出力されるMPEG4ビットストリームは、SIFサイズ(352×240)となっている。画像情報変換装置2は、間引き部13における動作の変更を行うことで、これ以外の画枠、例えば上記の例で、約1/4×1/4の画枠であるQSIF(176×112画素)サイズの画像に変換することも可能である。
【0128】
さらに、また、画像情報変換装置2は、MPEG2画像情報復号化部22における処理として、水平方向、垂直方向それぞれについて入力したMPEG2ビットストリーム内の8次の離散コサイン変換係数のうちのすべてを用いた復号処理を行うほか、水平方向のみ、あるいは水平方向、垂直方向ともに8次の離散コサイン変換係数のうちの低域成分のみを用いた復号処理を行い、画質劣化を最小限に抑えながら復号処理に伴う演算量とビデオメモリ容量とを削減している。
【0129】
初期参照量子化スケール決定部30は、まず、予め定められたMPEG2ビットストリーム、MPEG4ビットストリームに含まれるマクロブロックの個数、情報バッファ28に格納されたMPEG2ビットストリームの第1番目のIピクチャに割り当てられた符号量(ビット数)、平均量子化スケールQMPEG2, I0、及びMPEG4画像情報符号化部25において算出されるMPEG4ビットストリームの第1番目のI−VOPに対する目標符号量(ターゲットビット)から参照量子化スケールの初期値を決定し、仮想バッファ占有量の初期値の算出を行う。
【0130】
以上のような画像情報変換装置2は、以下に示すようにして、出力となるMPEG4ビットストリームの最初のI−VOPに対する参照量子化スケールの初期値refQI0を決定する。
【0131】
第1の方法は、画像情報変換装置2に入力されるMPEG2ビットストリーム及び画像情報変換装置2から出力されるMPEG4ビットストリームのビットレートをbit_rateMPEG2、bit_rateMPEG4、フレームレートをframe_rateMPEG2、frame_rateMPEG4として、以下に示す式(38)によって参照量子化スケールの初期値refQI0を表す方法である。
【0132】
【数26】
Figure 0004517495
【0133】
式(38)において、1/2とするのは、MPEG2における量子化スケールコード62がMPEG4量子化スケールコード31に相当するためである。
【0134】
第2の方法は、入力となるMPEG2ビットストリームの最初のIピクチャに割り当てられた符号量(ビット数)をBMPEG2,I0とし、式(8)乃至(10)、もしくは式(37)によって計算される、出力されるMPEG4ビットストリームの最初の1−VOPに対する目標符号量(ターゲットビット)をTI0とし、入力となるMPEG2ビットストリームの1フレームあたり、及び出力となるMPEG4ビットストリームの1VOPあたりに含まれるマクロブロックの個数をそれぞれMB_cntMPEG2、MB_cntMPEG4として、以下に示す式(39)によって参照量子化スケールの初期値refQI0を表す方法である。
【0135】
【数27】
Figure 0004517495
【0136】
以上示した式(38)及び(39)において、MPEG4符号化における量子化スケールは、1から31の整数値以外の値を取ることができない。そのため、式(38)もしくは(39)で計算されるrefQI0に対し、1から31の整数値で最も近い値を、その後の処理で用いるrefQI0として採用する。
【0137】
I−VOPに対する仮想バッファ占有量の初期値d は、以下に示す式(40)を用いて求められる。
【0138】
【数28】
Figure 0004517495
【0139】
以下では、ピクチャタイプ判別部20を用いて、Bピクチャを破棄し、フレームレートの変換を行わない場合も考慮する。このとき、P/B−VOPに対する仮想バッファ占有量の初期値d 、d は、以下に示す何れの方法を用いて算出してもよい。
【0140】
まず、第1の方法は、式(40)において求められたd に対して、K及びKを上述の式(7)で与えられる定数としたとき、以下に示す式(41)のように算出する方法である。
【0141】
【数29】
Figure 0004517495
【0142】
続いて第2の方法は、式(38)と同様に、まず、refQP0、refQB0を以下に示す式(42)及び(43)のように算出する。
【0143】
【数30】
Figure 0004517495
【0144】
あるいは式(39)と同様に、refQP0,refQB0を以下に示す式(44)及び式(45)のように算出する。
【0145】
【数31】
Figure 0004517495
【0146】
そして、上記refQP0及びrefQB0を用いて、仮想バッファ占有量の初期値d 、d を以下に示す式(46)及び(47)のように算出する。
【0147】
【数32】
Figure 0004517495
【0148】
以上詳細に説明したように、画像情報変換装置2は、初期参照量子化スケール決定部30において、入力されたMPEG2ビットストリーム(ビットストリーム)から抽出される情報に基づいてMPEG4画像符号化を行う際の参照量子化スケールの初期値を算出し、これを用いて仮想バッファ占有量の初期値を算出することによって、参照量子化スケールが不適切な値であることに起因する画質劣化を回避することが可能である。
【0149】
なお、上記初期参照量子化スケール決定部30は、参照量子化スケールの初期値の決定する際、情報バッファに格納されたMPEG2ビットストリームにおける第1番目のIピクチャに対する平均量子化スケールコード及びMPEG2ビットストリーム、並びにMPEG4ビットストリームのフレームレート及びビットレートから決定してもよい。
【0150】
また、上述の説明では、MPEG2ビットストリームを入力し、MPEG4ビットストリームを出力する場合について示したが、入力及び出力ともこの場合に限らず、画像圧縮情報は、例えばMPEG−1やH.263等の画像圧縮情報であってもよい。
【0151】
【発明の効果】
以上詳細に説明したように、本発明にかかる画像情報変換装置は、第1の画像圧縮情報を入力し、第2の画像圧縮情報を出力する画像情報変換装置であって、第1の画像圧縮情報及び第2の画像圧縮情報は、少なくとも画像内符号化画像と画像間予測符号化画像とを有し、第1の画像圧縮情報から抽出される情報を用いて第2の画像圧縮情報の画像内符号化画像を生成するときの参照量子化スケールの初期値を決定し、第2の画像圧縮情報の最初の画像内符号化画像を生成するときの参照量子化スケールの初期値に基づいて画像内符号化画像に対する仮想バッファ占有量の初期値を決定する量子化スケール決定手段を備える。
【0152】
ここで、第1の画像圧縮情報から抽出される情報として、第1の画像圧縮情報の最初の画像内符号化画像における平均量子化スケールを用いることがあげられる。
【0153】
したがって、本発明にかかる画像情報変換装置は、飛び越し走査のMPEG2画像圧縮情報に基づいて、MPEG4符号化における符号量制御を行う際の参照量子化スケールコードの初期値を決定し、これを用いて仮想バッファ占有量の初期値を算出することによって、参照量子化スケールコードの初期値設定に伴う画像劣化を回避した状態で順次操作のMPEG4ビットストリームを出力することを可能にする。
【0154】
また、本発明にかかる画像情報変換方法は、第1の画像圧縮情報を入力し、第2の画像圧縮情報を出力する画像情報変換方法であって、第1の画像圧縮情報及び第2の画像圧縮情報は、少なくとも画像内符号化画像と画像間予測符号化画像とを有し、第1の画像圧縮情報から抽出される情報を用いて第2の画像圧縮情報の画像内符号化画像を生成するときの参照量子化スケールの初期値を決定し、第2の画像圧縮情報の最初の画像内符号化画像を生成するときの参照量子化スケールの初期値に基づいて画像内符号化画像に対する仮想バッファ占有量の初期値を決定する。
【0155】
ここで、第1の画像圧縮情報から抽出される情報として、第1の画像圧縮情報の最初の画像内符号化画像における平均量子化スケールを用いることがあげられる。
【0156】
したがって、本発明にかかる画像情報変換方法は、飛び越し走査のMPEG2画像圧縮情報に基づいて、MPEG4符号化における符号量制御を行う際の参照量子化スケールコードの初期値を決定し、これを用いて仮想バッファ占有量の初期値を算出することによって、参照量子化スケールコードの初期値設定に伴う画像劣化を回避した状態で順次操作のMPEG4ビットストリームを出力することを可能にする。
【図面の簡単な説明】
【図1】本発明の実施の形態として示す画像情報変換装置の構成を示すブロック図である。
【図2】本発明の実施の形態として示す画像情報変換装置が画像情報を変換する動作を示すフローチャートである。
【図3】本発明の実施の形態として示す画像情報変換装置の構成を示すブロック図である。
【図4】従来の画像情報変換装置の構成を示すブロック図である。
【図5】MPEG4画像情報符号化部が、MPEG2画像情報復号化部で抽出される各フレームに対するコンプレキシティXを用いて、符号量制御を行う処理を示すフローチャートである。
【符号の説明】
1,2 画像情報変換装置、10,20 ピクチャタイプ判別部、11,21圧縮情報解析部、12,22 MPEG2画像情報復号化部、13,23 間引き部、14,24 ビデオメモリ、15,25 MPEG4画像情報符号化部、16,26 動きベクトル合成部、17,27 動きベクトル検出部、18,28 情報バッファ、19,29 コンプレキシティ算出部、30 初期量子化スケール決定部

Claims (11)

  1. 第1の画像圧縮情報を第2の画像圧縮情報に変換する画像情報変換装置であって、
    上記第1の画像圧縮情報と上記第1の画像圧縮情報の画像内符号化画像における平均量子化スケールとを受け取る受け取り手段と、
    上記受け取り手段により受け取られた平均量子化スケールを用いて、上記第2の画像圧縮情報に変換する際の参照量子化スケールの初期値を決定する量子化スケール決定手段と、
    上記量子化スケール決定手段により決定された参照量子化スケールの初期値と上記第2の画像圧縮情報に変換する際に使用する量子化スケールを表す整数の最大値とを乗算した値と、ビットレートとピクチャレートとの比に基づく変数と、の比率に従って、上記第2の画像圧縮情報を画像内符号化画像として変換する際の仮想バッファ占有量の初期値を決定する決定手段と、
    上記決定手段により決定された仮想バッファ占有量の初期値に従って、上記受け取り手段により受け取られた上記第1の画像圧縮情報を上記第2の画像圧縮情報に変換する変換手段と
    を備える画像情報変換装置。
  2. 上記第1の画像圧縮情報及び上記第2の画像圧縮情報は、少なくとも画像内符号化画像と画像間予測符号化画像とを有し、上記画像間予測符号化画像は、前方予測符号化画像と双方向予測符号化画像とからなり、
    上記画像内符号化画像に対する仮想バッファ占有量の初期値と、第1の定数との積の演算により、上記前方予測符号化画像に対する仮想バッファ占有量の初期値を求め、
    上記前方予測符号化画像に対する仮想バッファ占有量の初期値と、第2の定数との積の演算により、上記双方向予測符号化画像に対する仮想バッファ占有量の初期値を求める請求項1記載の画像情報変換装置。
  3. 上記第2の画像圧縮情報の符号量に対する上記第1の画像圧縮情報の符号量の割合と、上記第1の画像圧縮情報のフレームレートに対する上記第2の画像圧縮情報のフレームレートの割合と、上記第1の画像圧縮情報の最初の画像内符号化画像における平均量子化スケールとの積の演算により、上記第2の画像圧縮情報の最初の画像内符号化画像を生成するときの参照量子化スケールの初期値を求める請求項1記載の画像情報変換装置。
  4. 上記第2の画像圧縮情報の符号化に使用される量子化スケールを表す整数のうち上記演算による値に最も近い整数を上記第2の画像圧縮情報の最初の画像内符号化画像を生成するときの参照量子化スケールの初期値とする請求項記載の画像情報変換装置。
  5. 上記第2の画像圧縮情報の最初の画像内符号化画像の目標符号量に対する上記第1の画像圧縮情報の最初の画像内符号化画像に割り当てられた符号量の割合と、上記第1の画像圧縮情報の1フレームあたりに含まれる所定の符号化単位の個数に対する上記第2の画像圧縮情報の1フレームあたりに含まれる所定の符号化単位の個数の割合と、上記第1の画像圧縮情報の最初の画像内符号化画像における平均量子化スケールとの積の演算により、上記第2の画像圧縮情報の最初の画像内符号化画像に対する参照量子化スケールの初期値を求める請求項1記載の画像情報変換装置。
  6. 上記第2の画像圧縮情報の符号化に使用される量子化スケールを表す整数のうち上記演算による値に最も近い整数を上記第2の画像圧縮情報の最初の画像内符号化画像を生成するときの参照量子化スケールの初期値とする請求項記載の画像情報変換装置。
  7. 上記第1の画像圧縮情報は、MPEG−2規格に準じて符号化された情報である請求項1記載の画像情報変換装置。
  8. 上記第2の画像圧縮情報は、MPEG−4規格に準じて符号化された情報である請求項1記載の画像情報変換装置。
  9. 第1の画像圧縮情報を第2の画像圧縮情報に変換する画像情報変換方法であって、
    上記第1の画像圧縮情報と上記第1の画像圧縮情報の画像内符号化画像における平均量子化スケールとを受け取る受け取り工程と、
    上記受け取り工程により受け取られた平均量子化スケールを用いて、上記第2の画像圧縮情報に変換する際の参照量子化スケールの初期値を決定する量子化スケール決定工程と、
    上記量子化スケール決定工程により決定された参照量子化スケールの初期値と上記第2の画像圧縮情報に変換する際に使用する量子化スケールを表す整数の最大値とを乗算した値と、ビットレートとピクチャレートとの比に基づく変数と、の比率に従って、上記第2の画像圧縮情報を画像内符号化画像として変換する際の仮想バッファ占有量の初期値を決定する決定工程と、
    上記決定工程により決定された仮想バッファ占有量の初期値に従って、上記受け取り工程により受け取られた上記第1の画像圧縮情報を上記第2の画像圧縮情報に変換する変換工程と
    を備える画像情報変換方法。
  10. 画像圧縮情報を復号して得られる画像情報を符号化する符号化装置において、
    上記画像情報と上記画像圧縮情報の画像内符号化画像における平均量子化スケールとを受け取る受け取り手段と、
    上記受け取り手段により受け取られた平均量子化スケールを用いて、上記受け取り手段により受け取られた画像情報を符号化する際の参照量子化スケールの初期値を決定する量子化スケール決定手段と、
    上記量子化スケール決定手段により決定された参照量子化スケールの初期値と上記受け取り手段により受け取られた画像情報を符号化する際に使用する量子化スケールを表す整数の最大値とを乗算した値と、ビットレートとピクチャレートとの比に基づく変数と、の比率に従って、上記受け取り手段により受け取られた画像情報を画像内符号化画像として符号化する際の仮想バッファ占有量の初期値を決定する決定手段と、
    上記決定手段により決定された仮想バッファ占有量の初期値に従って、上記受け取り手段により受け取られた画像情報を符号化する符号化手段と
    を備える符号化装置。
  11. 画像圧縮情報を復号して得られる画像情報を符号化する符号化方法において、
    上記画像情報と上記画像圧縮情報の画像内符号化画像における平均量子化スケールとを受け取る受け取り工程と、
    上記受け取り工程により受け取られた平均量子化スケールを用いて、上記受け取り工程により受け取られた画像情報を符号化する際の参照量子化スケールの初期値を決定する量子化スケール決定工程と、
    上記量子化スケール決定工程により決定された参照量子化スケールの初期値と上記受け取り工程により受け取られた画像情報を符号化する際に使用する量子化スケールを表す整数の最大値とを乗算した値と、ビットレートとピクチャレートとの比に基づく変数と、の比率に従って、上記受け取り工程により受け取られた画像情報を画像内符号化画像として符号化する際の仮想バッファ占有量の初期値を決定する決定工程と、
    上記決定工程により決定された仮想バッファ占有量の初期値に従って、上記受け取り工程により受け取られた画像情報を符号化する符号化工程と
    を備える符号化方法。
JP2000344490A 2000-11-10 2000-11-10 画像情報変換装置及び画像情報変換方法並びに符号化装置及び符号化方法 Expired - Fee Related JP4517495B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000344490A JP4517495B2 (ja) 2000-11-10 2000-11-10 画像情報変換装置及び画像情報変換方法並びに符号化装置及び符号化方法
US09/986,436 US6950468B2 (en) 2000-11-10 2001-11-08 Image formation conversion apparatus and image information conversion method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000344490A JP4517495B2 (ja) 2000-11-10 2000-11-10 画像情報変換装置及び画像情報変換方法並びに符号化装置及び符号化方法

Publications (2)

Publication Number Publication Date
JP2002152727A JP2002152727A (ja) 2002-05-24
JP4517495B2 true JP4517495B2 (ja) 2010-08-04

Family

ID=18818678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000344490A Expired - Fee Related JP4517495B2 (ja) 2000-11-10 2000-11-10 画像情報変換装置及び画像情報変換方法並びに符号化装置及び符号化方法

Country Status (2)

Country Link
US (1) US6950468B2 (ja)
JP (1) JP4517495B2 (ja)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002152759A (ja) * 2000-11-10 2002-05-24 Sony Corp 画像情報変換装置および画像情報変換方法
US7602847B1 (en) 2001-03-27 2009-10-13 Vixs Systems, Inc. Device and method for compression of a video stream
US8107524B2 (en) * 2001-03-30 2012-01-31 Vixs Systems, Inc. Adaptive bandwidth footprint matching for multiple compressed video streams in a fixed bandwidth network
US20070053428A1 (en) * 2001-03-30 2007-03-08 Vixs Systems, Inc. Managed degradation of a video stream
US7675972B1 (en) 2001-07-30 2010-03-09 Vixs Systems, Inc. System and method for multiple channel video transcoding
US6959348B1 (en) * 2001-07-30 2005-10-25 Vixs Systems, Inc. Method and system for accessing data
US7139330B1 (en) 2001-10-31 2006-11-21 Vixs Systems, Inc. System for signal mixing and method thereof
US7596127B1 (en) 2001-10-31 2009-09-29 Vixs Systems, Inc. System for allocating data in a communications system and method thereof
US7106715B1 (en) 2001-11-16 2006-09-12 Vixs Systems, Inc. System for providing data to multiple devices and method thereof
US7403564B2 (en) * 2001-11-21 2008-07-22 Vixs Systems, Inc. System and method for multiple channel video transcoding
US7356079B2 (en) 2001-11-21 2008-04-08 Vixs Systems Inc. Method and system for rate control during video transcoding
US7165180B1 (en) 2001-11-27 2007-01-16 Vixs Systems, Inc. Monolithic semiconductor device for preventing external access to an encryption key
US7310679B1 (en) 2002-04-29 2007-12-18 Vixs Systems Inc. Method and system for transmitting video content while preventing other transmissions in a contention-based network
US7120253B2 (en) 2002-05-02 2006-10-10 Vixs Systems, Inc. Method and system for protecting video data
JP4275358B2 (ja) * 2002-06-11 2009-06-10 株式会社日立製作所 画像情報変換装置およびビットストリーム変換機ならびに画像情報変換送信方法
JP4354402B2 (ja) * 2002-07-11 2009-10-28 パナソニック株式会社 Avデータ変換装置および方法
US20040141555A1 (en) * 2003-01-16 2004-07-22 Rault Patrick M. Method of motion vector prediction and system thereof
US7408989B2 (en) * 2003-01-16 2008-08-05 Vix5 Systems Inc Method of video encoding using windows and system thereof
US7606305B1 (en) 2003-02-24 2009-10-20 Vixs Systems, Inc. Method and system for transcoding video data
US7133452B1 (en) 2003-02-24 2006-11-07 Vixs Systems, Inc. Method and system for transcoding video data
US7327784B2 (en) * 2003-02-24 2008-02-05 Vixs Systems, Inc. Method and system for transcoding video data
US7130350B1 (en) 2003-02-28 2006-10-31 Vixs Systems, Inc. Method and system for encoding and decoding data in a video stream
US20040247030A1 (en) * 2003-06-09 2004-12-09 Andre Wiethoff Method for transcoding an MPEG-2 video stream to a new bitrate
US7739105B2 (en) 2003-06-13 2010-06-15 Vixs Systems, Inc. System and method for processing audio frames
US7277101B2 (en) 2003-09-29 2007-10-02 Vixs Systems Inc Method and system for scaling images
US7668396B2 (en) 2003-09-29 2010-02-23 Vixs Systems, Inc. Method and system for noise reduction in an image
US7675970B2 (en) * 2004-01-12 2010-03-09 General Instrument Corporation Method and apparatus for processing a bitstream in a digital video transcoder
US7406598B2 (en) * 2004-02-17 2008-07-29 Vixs Systems Inc. Method and system for secure content distribution
JP4528043B2 (ja) * 2004-07-12 2010-08-18 株式会社日立製作所 映像信号変換装置、変換方法及びこれを用いた映像信号記録装置
US7421048B2 (en) * 2005-01-20 2008-09-02 Vixs Systems, Inc. System and method for multimedia delivery in a wireless environment
US7609766B2 (en) 2005-02-08 2009-10-27 Vixs Systems, Inc. System of intra-picture complexity preprocessing
US8949920B2 (en) 2005-03-17 2015-02-03 Vixs Systems Inc. System and method for storage device emulation in a multimedia processing system
US7400869B2 (en) * 2005-03-22 2008-07-15 Vixs Systems Inc. System and method for adaptive DC offset compensation in wireless transmissions
US8385427B2 (en) * 2005-04-15 2013-02-26 Apple Inc. Reduced resolution video decode
US7707485B2 (en) 2005-09-28 2010-04-27 Vixs Systems, Inc. System and method for dynamic transrating based on content
US20070112826A1 (en) * 2005-11-10 2007-05-17 Vixs Systems, Inc. Multimedia transcoding based on remaining storage capacity
US8131995B2 (en) * 2006-01-24 2012-03-06 Vixs Systems, Inc. Processing feature revocation and reinvocation
KR101422006B1 (ko) * 2007-09-17 2014-07-23 엘지전자 주식회사 데이터의 인코딩/디코딩 방법, 데이터의 검출방법 및데이터의 기록/재생 방법
US20150036753A1 (en) * 2012-03-30 2015-02-05 Sony Corporation Image processing device and method, and recording medium
US9307235B2 (en) * 2012-12-03 2016-04-05 Vixs Systems, Inc. Video encoding system with adaptive hierarchical B-frames and method for use therewith
US9743091B2 (en) * 2012-12-17 2017-08-22 Lg Electronics Inc. Method for encoding/decoding image, and device using same

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09512410A (ja) * 1995-02-15 1997-12-09 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ ビデオ信号の符号変換方法および装置
JP2000261800A (ja) * 1999-03-11 2000-09-22 Nec Corp 動画像可変ビットレート符号化方法および装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6674911B1 (en) * 1995-09-14 2004-01-06 William A. Pearlman N-dimensional data compression using set partitioning in hierarchical trees
US6085223A (en) * 1995-10-20 2000-07-04 Ncr Corporation Method and apparatus for providing database information to non-requesting clients
US5930786A (en) * 1995-10-20 1999-07-27 Ncr Corporation Method and apparatus for providing shared data to a requesting client
US6480539B1 (en) * 1999-09-10 2002-11-12 Thomson Licensing S.A. Video encoding method and apparatus
US6647061B1 (en) * 2000-06-09 2003-11-11 General Instrument Corporation Video size conversion and transcoding from MPEG-2 to MPEG-4

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09512410A (ja) * 1995-02-15 1997-12-09 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ ビデオ信号の符号変換方法および装置
JP2000261800A (ja) * 1999-03-11 2000-09-22 Nec Corp 動画像可変ビットレート符号化方法および装置

Also Published As

Publication number Publication date
US20020106022A1 (en) 2002-08-08
US6950468B2 (en) 2005-09-27
JP2002152727A (ja) 2002-05-24

Similar Documents

Publication Publication Date Title
JP4517495B2 (ja) 画像情報変換装置及び画像情報変換方法並びに符号化装置及び符号化方法
US7421023B2 (en) Image information conversion apparatus and image information conversion method
JP3979897B2 (ja) 映像圧縮ビットストリームのトランスコーディング方法
US20050243919A1 (en) Picture encoding system conversion device and encoding rate conversion device
JP2005526457A (ja) ビデオ・トランスコーダ
JP2005260935A (ja) 圧縮ビデオ・ビットストリームにおいて平均イメージ・リフレッシュ・レートを増加させる方法及び装置
JP2001145113A (ja) 画像情報変換装置及び方法
JPH10336670A (ja) 画像伝送装置および画像伝送方法、提供媒体
JP4517453B2 (ja) 画像情報変換装置及び方法並びに符号化装置及び方法
JP2000236547A (ja) 画像情報変換装置及び画像情報変換方法
JP4517475B2 (ja) 画像情報変換装置及び方法並びに符号化装置及び方法
JP2002125227A (ja) 画像情報変換装置及び方法
JP4608801B2 (ja) 画像情報変換装置及び方法
JP4517465B2 (ja) 画像情報変換装置及び方法並びに符号化装置及び方法
JP4292659B2 (ja) 画像情報変換装置及び画像情報変換方法
JP4517468B2 (ja) 画像情報変換装置及び方法並びに符号化装置及び方法
US7012959B2 (en) Picture information conversion method and apparatus
JP2001346214A (ja) 画像情報変換装置及び方法
JP3652889B2 (ja) 映像符号化方法、映像符号化装置、記録媒体、及び映像通信システム
JP4505992B2 (ja) 画像情報変換装置及び方法
JP2004147104A (ja) 動画像符号化装置
JP4507418B2 (ja) 画像情報変換装置及び画像情報変換方法
JP2001339720A (ja) 画像情報変換装置及び方法
JP4292658B2 (ja) 画像情報変換装置及び画像情報変換方法
JP2003259376A (ja) 動画像符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070308

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100510

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees