JP4105676B2 - メディアストリームを非ブロック化しコード変換する方法 - Google Patents

メディアストリームを非ブロック化しコード変換する方法 Download PDF

Info

Publication number
JP4105676B2
JP4105676B2 JP2004301491A JP2004301491A JP4105676B2 JP 4105676 B2 JP4105676 B2 JP 4105676B2 JP 2004301491 A JP2004301491 A JP 2004301491A JP 2004301491 A JP2004301491 A JP 2004301491A JP 4105676 B2 JP4105676 B2 JP 4105676B2
Authority
JP
Japan
Prior art keywords
coefficient
quantization
coefficients
step size
deblocking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2004301491A
Other languages
English (en)
Other versions
JP2005167991A (ja
Inventor
ボー・シェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of JP2005167991A publication Critical patent/JP2005167991A/ja
Application granted granted Critical
Publication of JP4105676B2 publication Critical patent/JP4105676B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

本発明は、デジタルメディアの分野に関連する。詳細には、本発明の実施形態は、メディアストリームを非ブロック化(deblock)しコード変換(transcode)する方法およびシステムに関する。
重要なビデオコード変換応用の1つは、ビットレート削減コード変換である。レート削減コード変換は、通常、打ち切りベースのコード変換を使用して、または再量子化ベースのコード変換により実現される。選択的係数打ち切りコード変換は、通常、比較的小さなビットレート削減にしか結び付かず、多くの場合、通常のビデオコード変換応用ではまれにしか使用されない。
再量子化ベースのコード変換は、より粗い量子化ステップを使用して再量子化することによってレート削減を実現する。変換領域係数は粗く量子化されるため、ブロッキングアーチファクトが生成され得る。特に、ブロッキングアーチファクトは、独立して圧縮されている各ブロックの結果として生じる。ブロッキングアーチファクトはエッジとして見える場合もあれば、またブロック間にリンギングを生じさせる場合もある。
復号化済みのピクセルブロックのブロッキングアーチファクトを低減する多くの方法が開発されている。具体的には、現行の非ブロック化では、通常、ピクセルブロックを復号化し、復号化した後にピクセルブロックを非ブロック化し再符号化する。しかし、コード変換を用いる場合、復号化および再符号化サイクルはブロッキングアーチファクトの増大につながり得る。これは、復号化および再符号化が利用可能ではない情報に依拠し得るためである。さらに、コード変換応用により提供される高い圧縮により、ブロッキングアーチファクトは、圧縮が大きくなるにつれて悪化する。たとえば、再量子化ベースのコード変換は、費用のかかる逆変換が回避されるように再量子化を変換領域係数に適用する。現在、非ブロック化は、変換領域のコード変換と併せて実行することはできない。
本発明であるメディアストリームを非ブロック化(deblock)しコード変換する方法の各種実施形態について述べる。メディアストリームのピクセルブロックに関連する係数が受け取られる。係数に対して非ブロック化操作が実行されて、第2の係数が生成される。第2の係数に量子化が実行されて、コード変換済み係数が生成される。
本明細書に組み込まれ、その一部を成す添付図面は本発明の実施形態を示し、説明とともに本発明の原理を説明する役割を果たす。
これより、例を添付図面に示す本発明の各種実施形態を詳細に参照する。本発明についてこれら実施形態と併せて説明するが、本発明をこれら実施形態に限定する意図はないことが理解されよう。対照的に、本発明は、併記の特許請求の範囲に規定される本発明の精神および範囲内に包含し得る代替、変更、および等価物を包含するものである。さらに、本発明の以下の説明では、本発明の完全な理解を提供するために多くの特定の詳細が記されている。一方、本発明の態様を不必要に曖昧にしないように、周知の方法、手順、構成要素、および回路については詳細に説明していない。
本発明の態様は、一般に情報および命令を処理するプロセッサ、情報および命令を記憶するランダムアクセス(揮発性)メモリ(RAM)、静的な情報および命令を記憶する読み取り専用(不揮発性)メモリ(ROM)、情報および命令を記憶する、磁気ディスク、光ディスクおよびディスクドライブ等のデータ記憶装置、情報をコンピュータユーザに表示する表示装置(たとえば、モニタ)等の任意選択のユーザ出力装置、情報およびコマンド選択をプロセッサに伝達する、英数字キーおよび機能キーを含む任意選択のユーザ入力装置(たとえば、キーボード)、ならびにユーザ入力情報およびコマンド選択をプロセッサに伝達する、カーソル制御装置(たとえば、マウス)等の任意選択のユーザ入力装置を備えたコンピュータシステムで実施することができる。
[メディアストリームを非ブロック化しコード変換する方法およびシステム]
図1は、本発明の一実施形態によるコード変換システム100のブロック図を示す。コード変換システム100は、ビットレート削減コード変換に再量子化を利用し、非ブロック化機能を有する。コード変換システム100は3つのモジュールである逆量子化器105と、非ブロック化メカニズム110と、トランスコーダ115とを含む。コード変換システム100はコンピュータシステム上で実施できる。
コード変換システム100は、メディアストリームのピクセルブロックに関連する係数を受け取る。本発明の実施形態は、ビデオストリーム等のグラフィックスデータを送信するメディアストリームに関する。簡潔明瞭にするために、ビデオストリームという語を本願において使用する。一実施形態では、係数は量子化係数Cqである。一実施形態では、量子化係数Cqは圧縮されたビデオストリームから受け取られる。一実施形態では、量子化係数Cqは離散コサイン変換(DCT)係数である。
逆量子化器105は、量子化ステップサイズs1を使用して、量子化係数Cqに対して逆量子化操作(Q1 -1)を実行するように動作可能である。逆量子化器105は逆量子化係数Cを出力する。元の係数についての情報が利用可能ではない場合があることから、逆量子化係数Cの正確性はわからない場合があることを認識されたい。これは不可逆的再構築であるため、逆量子化係数Cは再構築されたピクチャにブロッキングアーチファクトをもたらし得る。本発明の実施形態は、コード変換システム100において受け取った係数がすでに逆量子化されている場合には、逆量子化器105を必要としなくてもよいことも認識されたい。
非ブロック化メカニズム110は、逆量子化係数Cに対して非ブロック化操作を実行するように動作可能である。一実施形態では、DCT領域非ブロック化操作が実行されて、第2の係数C’が得られる。DCT領域非ブロック化操作は、サブバンド中の隣接係数に応じてDCT係数を変更する。DCT領域非ブロック化操作は当分野において理解されているものである。DCT領域非ブロック化操作の一例が、Triantafyllidis他、「Blocking Artifact Reduction in Frequency Domain」、Proc. ICIP2001, pp269-272, 2001に述べられている。
トランスコーダ115は、量子化ステップサイズs2を使用して第2の係数C’を再量子化するように動作可能であり、結果としてコード変換済み係数Cq’(たとえば、再量子化済み係数)を生成する。一実施形態では、量子化ステップサイズs2は、ブロック複雑性測定および現在のビット消費状態に応じて、各マクロブロックに対するビット配分を調整するトランスコーダ115のレート制御モジュールにより生成される。一実施形態では、量子化ステップサイズs2は量子化ステップサイズs1よりも小さい。したがって、コード変換済み係数Cq’は量子化済み係数Cq以下であり、おそらく、コード変換済み係数Cq’の符号化に必要なビットはより少数である。したがって、ビットレートの削減が達成される。
ビデオコード変換では、非ブロック化操作後に変更された係数はなおコード変換の対象であり(たとえば、再量子化)、非ブロック化変更を非効率にすることがある。特に、係数によっては、非ブロック化操作に応答するものもあれば、応答しないものもある。
本発明の実施形態は、コード変換の際の非ブロック化操作を加速するために、係数が非ブロック化に応答するか否かを判定することを対象とする。図2は、係数によっては非ブロック化操作に応答するものもあれば、応答しないものもあることを示す一例である。具体的には、図2は、本発明の一実施形態による2つの量子化器の例示的な量子化ビン(quantization bin)のグラフ200を示す。一実施形態では、量子化器Q1および量子化器Q2は両方とも均一スカラ量子化器であり、グラフ200は2つの異なる量子化ステップを使用して生成された2つの異なるビン(bin)の集合を示す。量子化器Q1の元の量子化ステップサイズは量子化ステップサイズs1であり、量子化器Q2のコード変換ステップサイズは量子化ステップサイズs2である。
例示のために、入力係数が量子化器Q1のビンaに入る場合、再構築される係数は、矢印で表されるようにビンaの中間値で表される。非ブロック化後、調整済み係数は、ビンaの範囲内で可変である。したがって、再量子化結果は量子化器Q2のビンAまたはビンBに入り得る。非ブロック化後係数は、Q2の異なるビンにある状態になり得る場合、非ブロック化に応答する。もしくは、入力係数がビンanに入る場合、非ブロック化後の係数は、anの全範囲がC内にあるため、非ブロック化プロセスがどのようにanを変更するかに関わりなく常にビンCに入る。入力係数は非ブロック化に応答しない。したがって、非応答係数については非ブロック化の効果がないため、非ブロック化操作を適用する必要はない。
非応答係数の値は、量子化器関数f、量子化ステップs1およびs2の場合に以下のように導き出すことができる。直近への丸めを用いる均一スカラ量子化器を想定して、逆量子化関数fIを考える。入力DCT係数(量子化DCT係数) q=nの場合、再構築済み係数はCn=fI q ,s)である。但し、sは量子化ステップサイズである。Cnの量子化下限は、
と定義され、上限は、
と定義される。直近への丸め量子化(0.5の値はより大きな大きさに丸められる)は、式1および式2における切り捨てて丸められる項をもたらすことに注意すべきである。Cqに属するiを入力係数の集合とし、Cq’に属するjを再量子化後の係数の集合とすると、CqおよびCq’は整数の部分集合であり、式1および式2から、
になる。非応答係数の集合は、
と定義される。式3を式4の条件項に代入し、
であることに留意すると、量子化理論が導き出される。具体的には、均一スカラ量子化器(直近丸め量子化)の場合、第1の量子化ステップサイズs1および再量子化器ステップサイズs2の場合、Cqに属する非応答係数iの大きさは、
を満足するものであり、応答係数i’の大きさは、
により定義される間隔に入る。但し、jはCq’に属する。
もしくは、量子化に際して丸め計算ではなく切り捨て計算を考える場合、応答係数の間隔は、
になる。式7は、均一スカラ量子化器のみを使用する切り捨て方式を考慮している。ここで、他のスカラ量子化器を使用してもよいのである。たとえば、デッドゾーン(dead zone)量子化器を(MPEGにおけるフレーム間ピクチャの量子化に)使用する切り捨て方式も同様に評価することができる。
一般に、任意の(s1,s2)対の場合、量子化操作(たとえば、量子化関数f)に従って、或る範囲の係数の応答係数および非応答係数を記録する係数応答性テーブルを得ることができる。たとえば、量子化係数がMPEG−2ビデオストリームから得られる場合、範囲R=[0,1024]である。ここで、範囲はMEPG、H.26x、およびJPEG等のメディアストリームの符号化に依存するのである。
一実施形態では、量子化操作は、式6に示すような丸め計算を用いる均一スカラ量子化器である。別の実施形態では、量子化器操作は、式7に示すような切り捨て計算を用いる均一スカラ量子化器である。説明を容易にするために、式6および式7の左辺をLjと表し、右辺をUjと表す。式6および式7の両方に対して、Lj−Uj=1であることを証明することができる。言い換えれば、各間隔にせいぜい1つの応答係数しかない。したがって、式6および式7を使用して、係数の応答性を示す係数応答性テーブルを生成することができる。
図3は、本発明の一実施形態による、メディアストリームの係数の応答性を判定するプロセス300のフローチャートを示す。一実施形態では、プロセス300は、コンピュータ可読かつコンピュータ実行可能な命令の制御下でプロセッサおよび電子構成要素(たとえば、コンピュータシステム)によって実行される。特定のステップをプロセス300において明らかにするが、このようなステップは例示的なものである。すなわち、本発明の実施形態は、他の様々なステップまたは図3に示すステップの変形の実行に適している。
ステップ310において、複数のピクセルブロックに関連する複数の第1の係数および複数の第2の係数、第1の量子化ステップサイズ、第2の量子化ステップサイズ、ならびに量子化操作を受け取る。一実施形態では、複数の第1の係数は量子化係数であり、複数の第2の係数はコード変換済み係数である。一実施形態では、量子化操作は丸め計算を用いる均一スカラ量子化器である。別の実施形態では、量子化操作は切り捨て計算を用いる均一スカラ量子化器である。
ステップ320において、量子化操作が、複数の第1の係数の中の第1の係数および複数の第2の係数の中の第2の係数に対して実行される。量子化操作は、第1の量子化ステップサイズ、第2の量子化ステップサイズ、および第2の係数を利用する。一実施形態では、量子化操作は、第1の係数が第1の量子化ステップサイズ、第2の量子化ステップサイズ、および第2の係数によって画定される間隔内にあるか否かを判定する。
ステップ330において、第1の係数が量子化操作に基づいて応答性を有するか否かが判定される。一実施形態では、係数が量子化操作により画定される間隔内に入る場合、第1の係数は応答性があると識別される。もしくは、係数が量子化操作により画定される間隔内に入らない場合、第1の係数は非応答性であると識別される。一実施形態では、量子化操作は下限および上限を定める。第1の量子化ステップサイズ、第2の量子化ステップサイズ、および第2の係数に基づいて、下限および上限が求められる。下限が第1の係数未満であり、かつ上限が第1の係数を上回る場合、第1の係数は応答性を有するものとして示される。
ステップ340において、量子化操作により処理する必要のある係数がまだあるか否かを判定する。一実施形態では、量子化操作が、複数の第1の係数の中の第1の係数および複数の第2の係数の中の第2の係数のあらゆる組み合わせに対して実行されたか否かが判定される。量子化操作により処理する必要のある係数がまだある場合、プロセス300は、次の第1の係数および第2の係数の組み合わせを使用して、ステップ320に戻る。あるいは、量子化操作により処理する必要のある係数がもうない場合、プロセス300はステップ350に進む。
ステップ350において、第1の量子化ステップサイズに対する複数の第1の係数の応答性の分布を含む係数応答性テーブルが生成される。係数応答性テーブルの第1の軸は複数の第1の係数に対応し、第2の軸は第2の量子化ステップサイズに対応する。ここで、係数応答性テーブルは、ステップ340の完了前に生成し得るのである。すなわち、係数応答性テーブルは、ステップ330において第1の係数の応答性が判定されると、その応答性が係数応答性テーブルに示されるように、1度に1つの係数ずつ生成することができる。
図4は、本発明の一実施形態による、丸め計算を用いる均一スカラ量子化器を使用してメディアストリームの係数の応答性(responsiveness)を判定するプロセス400のフローチャートを示す。一実施形態では、プロセス400は、コンピュータ可読かつコンピュータ実行可能な命令の制御下でプロセッサおよび電子構成要素(たとえば、コンピュータシステム)によって実行される。特定のステップをプロセス400において明らかにするが、このようなステップは例示的なものである。すなわち、本発明の実施形態は、他の様々なステップまたは図4に示すステップの変形の実行に適している。
図4のステップ402において、可能なすべての量子化係数を非応答性(unresponsive)として設定する。ステップ404において、複数のコード変換済み係数の中のコード変換済み係数が1(たとえば、j=1)に設定されている第1の間隔から始まって、Lj(たとえば、式6の右辺)およびUj(たとえば、式6の左辺)が求められる。ステップ406において、複数の量子化係数の中の第1の可能な量子化係数は1に等しく(たとえば、i=1)設定される。
ステップ408において、量子化係数に関して式6が満たされるか否かが判定される。言い換えれば、量子化係数がLjとUjの間隔内に入るか否かが判定される。量子化係数がLjとUjの間隔内に入る場合、ステップ410に示すように、量子化係数は応答性(responsive)であるとして設定され、プロセス400はステップ412に進む。もしくは、量子化係数がLjとUjの間隔内に入らない場合、プロセス400はステップ412に進む。
ステップ412において、量子化係数のすべての値がステップ408において処理されたか否かが判定される。量子化係数の値がまだすべては処理されていない場合、ステップ414に示すように、次の可能な量子化係数が選択され、プロセス400はステップ408に進む。もしくは、量子化係数のすべての値が処理されている場合、プロセス400はステップ416に進む。
ステップ416において、LjとUjの間隔すべてがステップ408において処理されたか否かが判定される。間隔がすべては処理されていない場合、ステップ418に示すように、次の可能なコード変換済み係数が選択され、プロセス400はステップ408に進む。もしくは、すべての間隔が処理されている場合、プロセス400はステップ420に進む。ステップ420において、プロセス400は終了する。
図5Aは、本発明の一実施形態による、丸め計算を用いる均一スカラ量子化器を使用する応答性の係数および非応答性の係数の例示的な分布のグラフ500を示す。グラフ500は、第1の量子化ステップサイズ3(s1=3)を有するMPEG−2ビデオストリームの応答性の係数および非応答性の係数の実際の分布を示す。縦軸は、MPEG−2ビデオストリームの場合は1〜31の範囲を有する第2の量子化ステップサイズs2を示し、横軸は、MPEG−2ビデオストリームの場合は1〜1024の範囲を有する量子化係数Cq(たとえば、第1の係数)を示す。簡略にするため、グラフ500は最初の30個のみの量子化係数を示している。図示のように、「o」は応答性の係数(responsive coefficient)を示し、「x」は非応答性の係数(unresponsive coefficient)を示す。また、第2の量子化ステップサイズは第1の量子化ステップサイズよりも大きいことから、応答性は4〜31の第2の量子化ステップサイズに対してのみ判定されることを理解されたい。一実施形態では、グラフ500は第1の量子化ステップサイズそれぞれに生成される。しかし、ここで第1の量子化ステップサイズ、第2の量子化ステップサイズ、および量子化係数をすべて含む三次元テーブルを生成してもよいのである。
図5Bは、本発明の一実施形態による、切り捨て計算を用いる均一スカラ量子化器を使用した応答性の係数および非応答性の係数の例示的な分布のグラフ510を示す。グラフ510は図5Aのグラフ500と同様にして生成され、第1の量子化ステップサイズ3を有するMEPG−2ビデオストリームの場合のものである。異なる量子化器が使用されていることにより、係数の応答性はグラフ500にて使用された量子化器と異なる。
ここで、第2の量子化ステップサイズs2は通常、第1の量子化ステップサイズs1以上となるのである。したがって、コード変換済み係数は入力量子化係数よりも小さい。ビットレート削減コード変換では、Cqに属する任意所与のiに関して、非ブロック化後、せいぜい2つの可能な再量子化出力しかない。この情報を使用して、応答性の係数に対してのみ非ブロック化操作を実行し、そうして入力係数の処理能力の効率化を促す非ブロック化可能なトランスコーダを実施することが可能である。
図6は、本発明の一実施形態による、応答性の係数を非ブロック化するコード変換システム600のブロック図を示す。コード変換システム600は、ビットレート削減コード変換に再量子化を利用し、非ブロック化機能を有する。コード変換システム600は、逆量子化器605、係数応答性テーブル610、応答性セレクタ620、非ブロック化メカニズム610、およびトランスコーダ615を備える。ここで、コード変換システム600はコンピュータシステム内で実施し得るのである。
コード変換システム600は、メディアストリームのピクセルブロックに関連する係数を受け取る。一実施形態では、係数は量子化係数Cqである。一実施形態では、量子化係数Cqは圧縮されたビデオストリームから受け取られる。一実施形態では、量子化係数Cqは離散コサイン変換(DCT)係数である。逆量子化器605は、量子化ステップサイズs1を使用して、量子化係数Cqに対して逆量子化操作(Q1 -1)を実行するように動作可能である。逆量子化器605は逆量子化係数Cを出力する。一実施形態では、逆量子化器は図1の逆量子化器105と同じ様式で動作する。
逆量子化係数Cはトランスコーダ615に送られる。トランスコーダ615は、量子化ステップサイズs2を使用して、逆量子化係数Cに対してコード変換(たとえば、量子化)操作(Q2)を実行するように動作可能である。トランスコーダ615は、コード変換済み係数Cq’を出力する。一実施形態では、トランスコーダ615は図1のトランスコーダ115と同じ様式で動作する。
応答性セレクタ630は、量子化係数Cqを入力として使用し、ならびに量子化ステップサイズs1およびs2を使用してテーブル参照動作を実行する。一実施形態では、テーブル参照動作は、予め生成されている係数応答性テーブル620に基づく。一実施形態では、係数応答性テーブル620が、図3のプロセス300または図4のプロセス400に説明したように生成される。レート制御モジュールにより提案される量子化ステップサイズs2に基づいて、入力係数iが係数応答性テーブル620の対応するCq’にマッピングされる。
応答性セレクタ630はテーブル参照動作を実行し、630の出力を使用して、スイッチ矢印635を制御する。Cqに属するiが係数応答性テーブル620に従って非応答である場合、スイッチ矢印635は非応答ノード640に接続され、コード変換済み係数Cq’が出力される。代替として、iが係数応答性テーブル620に従って応答である場合、スイッチ矢印635は応答ノード645に接続される。その後、非ブロック化メカニズム610の非ブロック化プロセスが、逆量子化係数Cに従ってコード変換済み係数Cq’に適用される。コード変換済み係数Cq’は±1または0だけ変更され、Cq’’として出力される。一実施形態では、非ブロック化メカニズム610は、図1の非ブロック化メカニズム101と同じ様式で動作する。一実施形態では、コード変換システム600のメモリユニットを使用して、逆量子化係数Cを非ブロック化メカニズム610に渡す。
[メディアストリームのコード変換に最適な量子化ステップサイズを求める方法]
量子化ステップサイズs1が小さい場合、通常、ビデオストリームに導入されるブロッキングは最小である。しかし、量子化ステップサイズs2が量子化ステップサイズs1よりもはるかに大きい場合、実質的なブロッキングアーチファクトが導入され得る。応答性の係数の分布は、量子化ステップサイズs2が増大するに伴って疎になり得る。式5における下限と上限の間の間隔がs2/s1−1に等しいことに留意すると、以下の推論を導き出すことができる。一般に、均一スカラ量子化器の場合、第1の量子化ステップサイズs1および第2の量子化ステップサイズs2の場合、非応答性の係数の数は、s2/s1が増大するときに増大する。この推論は、再量子化がはるかに粗い場合に非ブロック化操作の影響が限られることを示す。いくつかの特殊な場合では、利用可能な応答性の係数がまったくない。図5Aの例から、s2=9のときに応答係数がないことに留意する。
一般に、均一スカラ量子化器の場合、第1の量子化ステップサイズs1および第2の量子化ステップサイズs2の場合、
(但し、k=(1,2,・・・))、応答性の係数はない。
したがって、非ブロック化可能なトランスコーダが望まれる場合、式8のような第2の量子化ステップサイズs2の選択を避けることが重要である。図5Aに示す例から、第2の量子化ステップサイズs2=8または10の場合、より多くの応答性の係数がある。したがって、第2の量子化ステップサイズs2の選択を変更することにより応答性の係数の数を増大させることが可能であり、よって非ブロック化をより効率的に行うことができる。
一実施形態では、量子化ステップサイズs2近傍のより大きな、またはより小さな量子化ステップサイズが選択され、おそらくより多くの応答性の係数につながる。適切な量子化ステップサイズを選択するために、量子化誤差のプロットが生成される。一実施形態では、量子化誤差は、MPEG規格に採用されている標準TM5量子化手順に基づいてプロットされる。量子化ステップサイズs2の範囲が1〜31であり、DCT係数の可能な大きさが0〜2048である場合、各(s2,Cq)対に考えられるすべての量子化誤差を含む量子化誤差テーブルを生成することができる。
図7は、本発明の一実施形態による例示的な量子化誤差テーブル700を示す。具体的には、量子化誤差テーブル700は、MPEG規格を使用して0〜1028の値のDCT係数の量子化誤差を示している。簡略にするために、最初の64個の係数のみを示している。MEPGにおいて使用される量子化器関数およびデフォルト量子化器内行列をここで考える。テーブルを視覚化したものは、(0,1)、(1,0)、および(1,1)係数のみの結果を示している(デフォルト量子化器行列中のこれらエントリの値は16である)。谷(より暗いセル)は、より小さな量子化誤差を示す。図7における縦線(たとえば、係数値40の縦線)に複数の谷が見られ、これは、量子化ステップサイズs2値を高くしても、必ずしも量子化誤差が増大するわけではないことを示している。逆に、量子化ステップサイズs2が入念に選択される場合、量子化誤差を維持、またはさらに低減し得る。
上に述べた量子化属性は、非ブロック化可能なトランスコーダの有用性を証明する。最適な量子化ステップサイズs2を選択して応答性の係数の数を増大させ、したがって非ブロック化メカニズム(たとえば、図1の非ブロック化メカニズム110、または図6の非ブロック化メカニズム610)をより効率的にすることができる。さらに、量子化ステップサイズを変更することにより、ビットレートおよび符号化ピクチャの品質が保たれる。これに基づいて、非ブロック化機能を強化した非ブロック化可能なトランスコーダを実施することが可能である。強化された非ブロック化機能は、最適な第2の量子化ステップサイズs2を選択することにより、図1のコード変換システム100または図6のコード変換システム600において実施することができる。
図8は、本発明の一実施形態による、最適な量子化ステップサイズを求めるプロセス800のフローチャートを示す。一実施形態では、プロセス800は、コンピュータ可読かつコンピュータ実行可能な命令の制御下でプロセッサおよび電子構成要素(たとえば、コンピュータシステム)によって実行される。特定のステップをプロセス800において明らかにするが、このようなステップは例示的なものである。すなわち、本発明の実施形態は、他の様々なステップまたは図8に示すステップのバリエーションに適している。
ステップ810において、マクロブロックの入力量子化ステップサイズおよび複数の係数を受け取る。一実施形態では、ブロック群(たとえば、JPEG符号化の場合)の入力量子化ステップサイズおよび複数の係数を受け取る。
ステップ820において、複数の係数の非ゼロ係数の大きさ分布が求められる。
ステップ830において、第1のテーブルに基づいて複数の候補量子化ステップサイズが求められる。一実施形態では、第1のテーブルは量子化誤差テーブルである。
ステップ840において、入力量子化ステップサイズを含む或る範囲の量子化ステップサイズの量子化誤差が求められる。一実施形態では、量子化ステップサイズの範囲は、入力量子化ステップサイズに3を加えたものと、入力量子化ステップサイズから3を引いたものの間のすべての量子化ステップサイズを含む。言い換えれば、量子化ステップサイズs2に関して、量子化ステップサイズの範囲はs2−3〜s2+3の範囲を有する。
ステップ850において、複数の候補量子化ステップサイズが、量子化ステップサイズの範囲から選択される。一実施形態では、複数の候補量子化ステップサイズは、入力量子化ステップサイズに関連する量子化誤差以下の量子化誤差をもたらす。
ステップ860において、第2のテーブルに基づいて、上記複数の量子化ステップサイズから最適な量子化ステップサイズが決定される。一実施形態では、第2のテーブルは係数応答性テーブルである。一実施形態では、最適な量子化ステップサイズは、複数の量子化ステップサイズの中の、係数応答性テーブルに従って最高数の応答係数を有する量子化ステップサイズとして選択される。
MPEGの場合、1つの量子化ステップサイズs2がマクロブロック中の6〜12個のブロックの量子化に適用されることを認められたい。非ゼロ係数の分布は、すべてのブロックを考慮して得られる。再構築品質に対するそれぞれの重要性に応じて、重み付け係数を異なる頻度の係数に割り当てることができる。一実施形態では、より頻度の低い係数(たとえば、ブロック中の左上の2×2にある係数)の使用も実施することができる。
本発明の各種実施形態は、ビデオコード変換プロセスにおいて非ブロック化に応答する変換係数を識別する解析モデルを提供する。トランスコーダがコード変換プロセスに際して不必要な非ブロック化操作を回避できるようにする方法が提供されている。応答性の係数の数を増大させ、よってトランスコーダの非ブロック化機能を強化する最適量子化器選択方法もまた提供されている。
メディアストリームを非ブロック化しコード変換する方法である本発明の実施形態を上に説明した。本発明について特定の実施形態において説明したが、本発明はこのような実施形態により限定されると解釈されるべきではなく、添付の特許請求の範囲に従って解釈されるべきであることを認められたい。
本発明の一実施形態によるトランスコードシステムのブロック図を示す。 本発明の一実施形態による2つの量子化器の例示的な量子化ビンのグラフを示す。 本発明の一実施形態による、メディアストリームの係数の応答性を判定するプロセスのフローチャートを示す。 本発明の一実施形態による、丸め計算を用いる均一スカラ量子化器を使用してメディアストリームの係数の応答性を判定するプロセスのフローチャートを示す。 本発明の一実施形態による、丸め計算を用いる均一スカラ量子化器を使用した応答性の係数および非応答性の係数の分布の一例のグラフを示す。 本発明の一実施形態による、切り捨て計算を用いる均一スカラ量子化器を使用した応答性の係数および非応答性の係数の分布の一例のグラフを示す。 本発明の一実施形態による、応答的な係数を非ブロック化するトランスコードシステムのブロック図を示す。 本発明の一実施形態による例示的な量子化誤差テーブルを示す。 本発明の一実施形態による最適な量子化ステップサイズを求めるプロセスのフローチャートを示す。
符号の説明
105 逆量子化器
110 非ブロック化メカニズム(deblocking mechanism)
115 トランスコーダ
605 逆量子化器
610 非ブロック化メカニズム
615 トランスコーダ
620 係数応答性テーブル
630 応答性セレクタ

Claims (2)

  1. メディアストリームのピクセルのブロックに関連する量子化係数(C q )を予め符号化されたビットストリームから受け取ることと、
    第1の逆量子化係数(C)を生成するように、前記量子化係数(C q )に対して第1のステップサイズ(s 1 )を有する逆量子化を実行することと、
    第2の係数(C')を生成するように、前記第1の逆量子化係数(C)に対して非ブロック化操作を実行することと、
    コード変換済み係数(Cq')を生成するように、前記第2の係数(C')に対して量子化を実行することと、
    を含み、
    前記非ブロック化操作を実行することは、
    前記第1の逆量子化係数(C)が応答的であるか否かを判定することであって、前記第1のステップサイズ(s 1 )に基づいて、該第1のステップサイズよりも大きい第2のステップサイズ(s 2 )に基づく少なくとも1つの前記非ブロック化操作に応答する係数を示す応答係数の分布を含むテーブルにアクセスすることと、前記第2のステップサイズ(s 2 )における前記第1の逆量子化係数(C)が応答的であるか否かを判定することとを含む、判定することと、
    前記第1の逆量子化係数が応答的である場合に、前記第2の係数(C')が非ブロック化係数となるように前記第1の逆量子化係数(C)を非ブロック化することと、
    前記第1の逆量子化係数(C)が応答的ではない場合に、前記第2の係数(C')を前記第1の逆量子化係数(C)とすることと、
    を含み、
    前記量子化は、前記第1のステップサイズ(s 1 )よりも大きい第2のステップサイズ(s 2 )を有する、
    メディアストリームを非ブロック化しコード変換する方法。
  2. 前記量子化係数(Cq)は、離散コサイン変換(DCT)係数である、請求項1に記載のメディアストリームを非ブロック化しコード変換する方法。
JP2004301491A 2003-10-17 2004-10-15 メディアストリームを非ブロック化しコード変換する方法 Active JP4105676B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/688,082 US7570818B2 (en) 2003-10-17 2003-10-17 Method for deblocking and transcoding a media stream

Publications (2)

Publication Number Publication Date
JP2005167991A JP2005167991A (ja) 2005-06-23
JP4105676B2 true JP4105676B2 (ja) 2008-06-25

Family

ID=34521099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004301491A Active JP4105676B2 (ja) 2003-10-17 2004-10-15 メディアストリームを非ブロック化しコード変換する方法

Country Status (3)

Country Link
US (1) US7570818B2 (ja)
JP (1) JP4105676B2 (ja)
DE (1) DE102004029086B4 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7458312B2 (ja) 2020-12-18 2024-03-29 株式会社オカムラ オイル供給制御装置、伝動ユニットおよび動力システム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005038295A1 (de) * 2005-08-12 2007-02-15 Siemens Ag Verfahren zum Korrigieren eines quantisierten Datenwerts sowie eine dazugehörige Vorrichtung
WO2008090793A1 (ja) * 2007-01-22 2008-07-31 Nec Corporation 画像再符号化装置、画像再符号化方法及び画像符号化プログラム
US20090060027A1 (en) * 2007-08-30 2009-03-05 Tektronix, Inc. Compressed Signal Subjective Quality Ratings Prediction

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4751742A (en) * 1985-05-07 1988-06-14 Avelex Priority coding of transform coefficients
US4754492A (en) * 1985-06-03 1988-06-28 Picturetel Corporation Method and system for adapting a digitized signal processing system for block processing with minimal blocking artifacts
US5086488A (en) * 1989-08-19 1992-02-04 Mitsubishi Denki Kabushiki Kaisha Transform coding apparatus
JP2586260B2 (ja) * 1991-10-22 1997-02-26 三菱電機株式会社 適応的ブロッキング画像符号化装置
JP2518524B2 (ja) * 1993-06-21 1996-07-24 日本電気株式会社 画像デ―タの圧縮/伸長方法
US5563718A (en) * 1993-11-30 1996-10-08 Polaroid Corporation Image coding by use of discrete cosine transforms
KR970010087B1 (en) * 1994-04-30 1997-06-21 Daewoo Electronics Co Ltd Postprocessing method for digital image
US5654759A (en) * 1995-02-15 1997-08-05 Hitachi America Ltd. Methods and apparatus for reducing blockiness in decoded video
US5737451A (en) * 1996-04-10 1998-04-07 Eastman Kodak Company Method and apparatus for suppressing blocking artifacts in block-transform coded images
KR100304103B1 (ko) * 1998-05-29 2001-09-24 이계철 비트율이급변되는재양자화계단크기선택방법및그를이용한비트율제어방법
EP1067798A3 (en) * 1999-06-30 2005-11-30 Media Glue Corporation Apparatus, method and computer program product for transcoding a coded moving picture sequence
EP1175787A1 (en) * 2000-02-04 2002-01-30 Koninklijke Philips Electronics N.V. Quantization method for bit rate transcoding applications
JP2002223443A (ja) * 2001-01-24 2002-08-09 Yamaha Corp トランスコーディング方法およびトランスコーディング装置
US20020186769A1 (en) * 2001-06-12 2002-12-12 O'brien Royal System and method for transcoding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7458312B2 (ja) 2020-12-18 2024-03-29 株式会社オカムラ オイル供給制御装置、伝動ユニットおよび動力システム

Also Published As

Publication number Publication date
DE102004029086B4 (de) 2009-11-19
JP2005167991A (ja) 2005-06-23
DE102004029086A1 (de) 2005-05-25
US20050084157A1 (en) 2005-04-21
US7570818B2 (en) 2009-08-04

Similar Documents

Publication Publication Date Title
JP5027936B2 (ja) 適応スキャン順序付けのための方法、記録媒体、プログラム、及び処理装置。
JP5606591B2 (ja) ビデオ圧縮方法
US9258568B2 (en) Quantization method and apparatus in encoding/decoding
US20060088105A1 (en) Method and system for generating multiple transcoded outputs based on a single input
US20130083855A1 (en) Adaptive color space selection for high quality video compression
US20080008246A1 (en) Optimizing video coding
WO2012042646A1 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
JP2008099322A (ja) ビデオ信号圧縮装置
JPH05145773A (ja) ビデオ画像の符号化装置と方法
US5719961A (en) Adaptive technique for encoder and decoder signal transformation
US7177356B2 (en) Spatially transcoding a video stream
US9077960B2 (en) Non-zero coefficient block pattern coding
JP2003179925A (ja) ディジタルビデオ信号を圧縮するプロセスおよびシステムとプログラム製品
JPH08256335A (ja) 量子化パラメータ決定装置及び方法
KR100651316B1 (ko) 정보 스트림 디코더에서 메모리 자원 이용을 증가시키는 방법 및 장치
WO1999056472A1 (en) N-bit video coder and method of extending an 8-bit mpeg video coder
JPH09200758A (ja) 画像符号化装置
JP2000115548A (ja) デジタル画像の圧縮方法及び圧縮解除方法
JP4105676B2 (ja) メディアストリームを非ブロック化しコード変換する方法
JPH0787491A (ja) 量子化装置、逆量子化装置及び画像処理装置並びに量子化方法、逆量子化方法及び画像処理方法
CN103154970A (zh) 视觉优化量化
DK1639831T3 (en) PROCEDURE FOR DATA COMPRESSION
JP4762486B2 (ja) マルチ・リゾルーション・ビデオ符号化および復号化
KR20160040930A (ko) 이미지 재부호화 방법 및 그 장치
KR100219133B1 (ko) 변환부호화시스템의 변환계수선택방법및그장치

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061017

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070116

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070119

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080327

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110404

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120404

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120404

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130404

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140404

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250