JP2004520771A - ドリフト補正を備えたビデオトランスコーダ - Google Patents
ドリフト補正を備えたビデオトランスコーダ Download PDFInfo
- Publication number
- JP2004520771A JP2004520771A JP2002590678A JP2002590678A JP2004520771A JP 2004520771 A JP2004520771 A JP 2004520771A JP 2002590678 A JP2002590678 A JP 2002590678A JP 2002590678 A JP2002590678 A JP 2002590678A JP 2004520771 A JP2004520771 A JP 2004520771A
- Authority
- JP
- Japan
- Prior art keywords
- drift
- macroblock
- mode
- block
- dct
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【選択図】図7
Description
[技術分野]
本発明は包括的に、ビットストリームをトランスコードする分野に関し、詳細にはビデオビットストリームをトランスコードしながらドリフトを低減することに関する。
【0002】
[背景技術]
映像を圧縮することは、少ない記憶装置、ネットワークおよびプロセッサリソースを用いて、視覚情報を格納し、伝送し、処理することを可能にする。最も幅広く用いられている映像圧縮標準規格には、動画の記憶および検索のためのMPEG−1と、デジタルテレビのためのMPEG−2と、テレビ会議のためのH.263とが含まれる。ISO/IEC 11172−2: 1993, ”Information Technology − Coding of Moving Pictures and Associated Audio for Digital Storage Media up to about 1.5 Mbit/s − Part 2: Video”, D. LeGall, ”MPEG: A Video Compression Standard for Multimedia Applications,” Communications of the ACM, Vol. 34, No. 4, pp. 46−58, 1991, ISO/IEC 13818−2: 1996, ”Information Technology − Generic Coding of Moving Pictures and Associated Audio Information − Part 2: Video”, 1994, ITU−T SG XV, DRAFT H.263, ”Video Coding for Low Bitrate Communication”, 1996, ITU−T SG XVI, DRAFT13 H.263+Q15−A−60 rev. 0, ”Video Coding for Low Bitrate Communication,” 1997を参照されたい。
【0003】
これらの標準規格は、主に画像あるいはフレームの空間的圧縮と、フレームのシーケンスの空間的および時間的圧縮とを取り扱う比較的低い水準の仕様である。共通の特徴として、これらの標準規格はフレーム毎に圧縮を実行する。これらの標準規格を用いる場合、幅広い応用形態に対して高い圧縮比を達成することができる。
【0004】
マルチメディアの応用形態のためのMPEG−4のような、より新しい映像符号化標準規格によれば、任意の形状の物体が個別の映像物体面(VOP)として符号化および復号化されることができる。ISO/IEC 14496−2: 1999, ”Information technology − coding of audio/ visual objects, Part 2: Visual”を参照されたい。その物体には映像、音声、自然、合成、基本形状(プリミティブ)、複合物あるいはその組み合わせを用いることができる。また、無線チャネルのような誤りを生じやすいチャネルにおいて誤りに耐え得る伝送を可能にするために、この標準規格には数多くの誤り回復機能が組み込まれている。
【0005】
新たに現れたMPEG−4標準規格は、双方向テレビのようなマルチメディアの応用形態を可能にすることが意図されており、その規格では自然物および合成物が統合され、アクセスに汎用性がある。映像伝送に関して言えば、これらの圧縮標準規格はネットワーク上の帯域幅の量を低減するために必要とされる。ネットワークには無線あるいはインターネットを用いることができる。いずれの場合でも、ネットワークの容量は制限されており、逼迫したリソースの競合は最小限に抑えられるべきである。
【0006】
装置がコンテンツを確実に(robustly)伝送し、かつコンテンツの品質を利用可能なネットワークリソースに適合させることができるようにするシステムおよび方法を得るために多大な努力が払われている。コンテンツが符号化されるとき、時折、より低いビットレートあるいは解像度でネットワークを通して伝送できるようにする前に、ビットストリームをさらに復号化する必要がある。
【0007】
図1に示されるように、これはトランスコーダ100によって成し遂げることができる。最も簡単な実装形態では、トランスコーダ100はカスケード接続されたデコーダ110とエンコーダ120とを含む。圧縮された入力ビットストリーム101は入力ビットレートRinで完全に復号化され、その後出力ビットレートRout102で符号化されて、出力ビットストリーム103が生成される。通常、出力レートは入力レートより低い。実際には、復号化されたビットストリームを符号化することが非常に複雑であることに起因して、トランスコーダで完全な復号化および完全な符号化は行われない。
【0008】
MPEG−2トランスコーディングに関する初期の研究は、Sun等による「Architectures for MPEG compressed bitstream scaling」(IEEE Transactions on Circuits and Systems for Video Technology, April 1996)によって発表されている。そこでは、複雑さおよびアーキテクチャが異なる4つのレート低減方法が記載された。
【0009】
図2は開ループアーキテクチャと呼ばれる第1の例による方法200を示す。このアーキテクチャでは、入力ビットストリーム210の一部だけが復号化される。より具体的には、入力ビットストリームのマクロブロックが可変長復号化(VLD)され(210)、細かい量子化器Q1で逆量子化されて(220)、離散コサイン変換(DCT)係数が生成される。所望の出力ビットレート202が与えられるとき、DCTブロックは量子化器230のうちのより粗いレベルの量子化器Q2によって再量子化される。その後、これらの再量子化されたブロックは可変長符号化(VLC)され(240)、低ビットレートで新たな出力ビットストリーム203が形成される、この方式は図1に示される方式よりも著しく簡単である。なぜなら、動きベクトルが再利用され、逆DCT操作が必要とされないためである。ここでのQ1およびQ2の選択はビットストリームのレート特性に厳密に依存することに留意されたい。おそらくビットストリームの空間特性のような他の要因は考慮されない。
【0010】
図3は第2の例による方法300を示す。その方法は閉ループアーキテクチャと呼ばれる。この方法では、入力ビデオストリームが再び部分的に復号化される。すなわち、入力ビットストリームのマクロブロックが可変長復号化(VLD)され(310)、Q1で逆量子化されて(320)、離散コサイン変換(DCT)係数が生成される(321)。上記の第1の例による方法とは対照的に、入力されるDCT係数321に補正DCT係数332が加算され(330)、再量子化によって生成される不一致が補償される。この補正は、最終的に復号化のために用いられることになる基準フレームの品質を高める。補正が加算された後、新たなレートを満足するために新たに形成されたブロックがQ2で再量子化され(340)、上記のように可変長符号化される(350)。再びQ1およびQ2はレートに基づくことに留意されたい。
【0011】
補正成分332を得るために、再量子化されたDCT係数が逆量子化され(360)、元の部分的に復号化されたDCT係数から減算される(370)。この係数は逆DCT(IDCT)365を通して空間領域に変換され、フレームメモリ380に格納される。その後、入力される各ブロックに関連する動きベクトル381を用いて、たとえば動き補償290において対応する差分ブロックが呼び出される。その後、対応するブロックはDCT332を通して変換され、補正成分が生成される。図3に示される方法の導出は、Assuncao等による「A frequency domain video transcoder for dynamic bit−rate reduction of MPEG−2 bitstreams(IEEE Transaction on Circuits and Systems for Video Technology, pp. 953−957, 1998)に記載される。
【0012】
Assuncao等は同じタスクを達成するための別の方法も記載した。その別の方法では、ドリフト補償のために周波数領域において動作する動き補償(MC)ループが用いられた。周波数領域においてMCブロックを高速に計算するために近似的な行列が導出された。ラグランジュの最適化を用いて、トランスコーディングのための最良の量子化スケールが計算された。その別の方法はIDCT/DCT構成要素を不要にした。
【0013】
従来技術の圧縮標準規格によれば、テクスチャ情報を符号化するために割り当てられるビット数は量子化パラメータ(QP)によって制御された。上記の方法は、元のビットストリームに含まれる情報に基づいてQPを変更することにより、テクスチャビットのビットレートが低減される点で類似である。ある効率的な実装形態の場合、その情報は通常、圧縮された領域から直に抽出され、マクロブロックの動きあるいはDCTブロックの残留エネルギーに関連する指標を含むことができる。上記の方法はビットレート低減を得るためにのみ適用することができる。
【0014】
ビットレートを低減する他に、他のタイプのビットストリームの変換も実行することができる。たとえば、オブジェクトに基づいた変換が、2000年2月14日に出願の「Object−Based Bitstream Transcoder」というタイトルのVetro等による米国特許出願第09/504,323号に記載されている。空間解像度に関する変換が、ShanablehおよびGhanbariによる「Heterogeneous video transcoding to lower spatio−temporal resolutions, and different coding formats」(IEEE Transaction on Multimedia, June 2000)に記載されている。
【0015】
これらの方法は、品質を低下させる低い空間解像度でビットストリームを生成するか、あるいは非常に複雑な処理により達成されることに留意されたい。また、再構成されたマクロブロックが形成される手段に対して適当な考慮がなされていない。これは品質および複雑さの両方に影響を与えるようになり、2倍以外の低減率を考慮する際に特に重要である。さらに、これらの方法はアーキテクチャの細部を全く規定しない。留意点のほとんどが2倍だけ動きベクトルをスケーリングする種々の手段に費やされる。
【0016】
図4は低い空間解像度で入力ビットストリームを出力ビットストリーム402トランスコードするための方法400の詳細を示す。この方法は図1に示される方法を拡張したものであるが、デコーダ110およびエンコーダ120の細部が示されており、復号化処理と符号化処理との間にダウンサンプリングブロック410が存在する。デコーダ110はビットストリームの空間符号化を実行する。ダウンサンプラは、部分的にマクロブロックからなるグループの空間解像度を低減する。デコーダ内の動き補償420は最大解像度動きベクトルmvf421を利用し、一方、エンコーダ内の動き補償430は低解像度動きベクトルmvr431を利用する。低解像度動きベクトルは、ダウンサンプリングされた空間領域フレームyn l403から推定されるか、あるいは最大解像度動きベクトルからマッピングされるかのいずれかである。トランスコーダ400の更に細かい部分が以下に記載される。
【0017】
図5は低い空間解像度で入力ビットストリーム501から出力ビットストリーム502にトランスコードするための開ループ方法500の詳細を示す。この方法では、ビデオビットストリームが再び部分的に復号化される。すなわち入力ビットストリームのマクロブロックが可変長復号化(VLD)され(510)、逆量子化されて(520)、離散コサイン変換(DCT)係数が生成される。これらのステップは既知である。
【0018】
その後、DCTマクロブロックは、16×16(24×24)マクロブロックにおいてそれぞれ8×8(23×23)輝度ブロックの高周波係数をマスキングし、4つの4×4DCTブロックを生成することにより、2分の1にダウンサンプリングされる(530)。1993年11月16日にNgに付与された米国特許第5,262,854号「Low−resolution HDTV receivers」を参照されたい。言い換えると、ダウンサンプリングによって、ブロック、たとえば4つのブロックのグループが、より小さなサイズの4つのブロックのグループになる。
【0019】
トランスコーダにおいてダウンサンプリングを実行することにより、トランスコーダは、仕様に準拠した16×16マクロブロックを再形成するために付加的なステップを行わなければならない。付加的なステップは空間領域に変換し、その後再びDCT領域に変換することを含む。ダウンサンプリングの後、同じ量子化レベルを用いてブロックが再量子化され(540)、その後、可変長符号化される(550)。解像度を低減されたブロックにおいてレート制御を実行するための方法は記載されていない。
【0020】
最大動きベクトル559から低減された動きベクトル561への動きベクトルマッピング(560)を実行するために、フレームに基づく動きベクトルのために適したいくつかの方法が従来技術において記載されてきた。フレームに基づく4つの動きベクトル、すなわち1つのグループにおいて各マクロブロックに対して1つの動きベクトルから、新たに形成された16×16マクロブロックに対して1つの動きベクトルにマッピングするために、簡単な平均化あるいはメディアンフィルタを適用することができる。これは4:1マッピングと呼ばれる。
【0021】
しかしながら、MPEG−4およびH.263のようなある特定の圧縮標準規格は、8×8ブロック当たり1つの動きベクトルを可能にする進んだ予測モードに対応する。この場合に、各動きベクトルは元の解像度における16×16マクロブロックから解像度を低減されたマクロブロックにおける8×8ブロックにマッピングされる。これは1:1マッピングと呼ばれる。
【0022】
図6は、4つの16×16マクロブロックの1つのグループ601から、1つの16×16マクロブロック602あるいは4つの8×8マクロブロック603のいずれかへの動きベクトルの実現可能なマッピング600を示す。4つの動きベクトルを符号化するためにはさらに多くのビットが用いられるので、1:1マッピングを常に用いるのは効率が悪い。また、一般に、インターレース画像のためのフィールドに基づく動きベクトルへの拡張は重要である。ダウンサンプリングされたDCT係数とマッピングされた動きベクトルとが与えられるとき、データに対して可変長符号化が行われ、周知のように、解像度が低減されたビットストリームを形成することができる。
【0023】
空間解像度を低減するための従来技術の方法の問題点を解消する、ビットストリームをトランスコードするための方法を提供することが望ましい。さらに、トランスコーダにおいて複雑さと品質との間のバランスをとることが望ましい。さらに、ドリフトを補償し、トランスコーディング中にさらに良好なアップサンプリング技術を提供することが望ましい。
【0024】
[発明の開示]
部分的に復号化された入力ビットストリームのマクロブロックのドリフトを補償する方法が提供される。そのマクロブロックはイントラ(フレーム内予測)モードおよびインター(フレーム間予測)モード・マクロブロックを含み、各マクロブロックはDCT係数と、少なくとも1つの動きベクトルとを含む。ドリフトの推定値は、部分的に復号化された入力ビットストリームにおいて測定される。推定されたドリフトはイントラ・リフレッシュレートに変換される。インターモード・マクロブロックのモードが、そのリフレッシュレートにしたがってインターモード・マクロブロックにマッピングされる。変更された各マクロブロックのためのDCT係数および動きベクトルが、変更された各マクロブロックのためのマッピングにしたがって変更される。
【0025】
[発明を実施するための最良の形態]
序論
本発明は、デジタルビデオ信号の圧縮されたビットストリームを、ドリフトを最小限に抑えた、低減された空間解像度にトランスコードするためのシステムおよび方法を提供する。最初に、本発明にしたがってトランスコーダを用いることができるコンテンツを配信するためのいくつかの応用形態が記載される。次に、低空間解像度のビットストリームを生成するための基本的な方法の解析が与えられる。この解析に基づいて、基本的な方法に対するいくつかの代替形態および各代替形態に関連する対応するアーキテクチャが記載される。
【0026】
図9に示される第1の代替形態は開ループアーキテクチャを利用する。一方、図10および図11A、Bに示される他の3つの代替形態は、ダウンサンプリング、再量子化および動きベクトルの打切りによって被るドリフトを補償する手段を提供する閉ループアーキテクチャに対応する。閉ループアーキテクチャのうちの1つは低減された解像度においてこの補償を実行し、一方、他のアーキテクチャは、より良好な品質を得るために、DCT領域の元の解像度においてこの補償を実行する。
【0027】
以下にさらに詳細に記載されるように、図9の開ループアーキテクチャはあまり複雑ではない。再構成ループ、DCT/IDCTブロック、フレーム記憶装置は存在せず、低画像解像度およびビットレートの場合に適度な品質を有する。このアーキテクチャはインターネットの応用形態およびソフトウエアの実装形態のために適している。図10の第1の閉ループアーキテクチャもあまり複雑ではない。それは、再構成ループ、IDCT/DCTブロックおよびフレーム記憶装置を含む。ここでは、低減された解像度領域においてドリフトを補償して品質を改善することができる。図11Aの第2の閉ループアーキテクチャはあまり複雑ではない。それは、再構成ループ、IDCT/DCTブロックおよびフレーム記憶装置を含む。元の解像度領域においてドリフトを補償して品質を改善することができ、それには低減された解像度のフレームのアップサンプリングを必要とする。第3の閉ループアーキテクチャは、低減された解像度領域において得られる補正信号を用いる。
【0028】
本発明によるアーキテクチャを支援するために、本発明を用いなければ、低減された解像度において「混在する」モードのマクロブロックのグループを有することになるブロックを処理するためのいくつかの付加的な技術も開示される。
【0029】
ダウンサンプリングされることになるブロックのグループがイントラモードおよびインターモードの両方において符号化されるブロックを含むとき、そのダウンサンプリングされることになるブロック、たとえば4ブロックからなるグループは「混在する」ブロックと見なされる。MPEG標準規格では、Iフレームはイントラモードにしたがって符号化されるマクロブロックのみを含み、Pフレームはイントラモードおよびインターモードで符号化されるブロックを含むことができる。これらのモードは特にダウンサンプリング中に配慮される必要があり、配慮されない場合には出力の品質が劣化し得ることになる。
【0030】
またドリフト補償のための方法およびDCTに基づくデータをアップサンプリングするための方法も記載される。これらの方法は、アップサンプリング後の動作が、適当に、かつ付加的な変換ステップを用いることなく実行できるように、第2および第3の閉ループアーキテクチャの場合に有用である。
【0031】
低減された空間解像度のトランスコーディングのための応用形態
本発明が主に目的とする応用形態は、無線電話、ページャおよび個人情報端末のような低解像度ディスプレイを備える装置へのデジタルテレビ(DTV)放送およびインターネットコンテンツの配信である。
【0032】
MPEG−2は現在、DTV放送およびDVD記録のための圧縮フォーマットとして用いられており、MPEG−1コンテンツはインターネット上で利用可能である。
【0033】
MPEG−4は移動体ネットワーク上の映像伝送のための圧縮フォーマットとして採用されているので、本発明は、MPEG−1/2コンテンツを低解像度のMPEG−4コンテンツにトランスコードするための方法を取り扱う。
【0034】
図7は本発明を用いるマルチメディアコンテンツ配信システム700の第1の例を示す。システム700は、外部ネットワーク703を介してクライアント702に接続される適応サーバ701を含む。1つの特徴として、クライアントは小型のディスプレイを有するか、あるいは低ビットレートのチャネルによって接続される。それゆえ、クライアント702に配信される全てのコンテンツの解像度は低減される必要がある。
【0035】
入力源マルチメディアコンテンツ704がデータベース710に格納される。そのコンテンツに対して、特徴抽出および指標作成プロセス720が実施される。データベースサーバ740によって、クライアント702は、データベース710のコンテンツをブラウジングし、かつ特定のコンテンツを要求できるようになる。サーチエンジン730は、マルチメディアコンテンツの位置を特定するために用いることができる。所望のコンテンツの位置が特定された後、データベースサーバ740は本発明にしたがってマルチメディアコンテンツをトランスコーダ750に転送する。
【0036】
トランスコーダ750はネットワークおよびクライアントの特性を読み取る。コンテンツの空間解像度がクライアントのディスプレイ特性よりも高い場合には、本発明による方法を用いて、クライアントのディスプレイ特性と一致するようにクライアントの解像度が低減される。また、ネットワークチャネル上のビットレートがコンテンツのビットレートより低い場合にも、本発明を用いることができる。
【0037】
図8はコンテンツ配信システム800の第2の例を示す。システム800はローカル「ホーム」ネットワーク801と、外部ネットワーク703と、放送ネットワーク803と、図7の場合に示されるような適応サーバ701とを含む。この応用形態では、高品質入力源コンテンツ804は、放送ネットワーク803、たとえばケーブル、地上放送あるいは衛星を介してホームネットワーク801に接続されるクライアント805に移送することができる。そのコンテンツはセットトップボックスあるいはゲートウエイ802によって受信され、ローカルメモリあるいはハードディスクドライブ(HDD)830に格納される。受信されたコンテンツはホーム内のクライアント805に配信することができる。さらに、そのコンテンツは、最大解像度のコンテンツを復号化/表示するための能力を持たない全てのクライアントに適応させるためにトランスコードすることができる(850)。これは、ハイビジョンテレビ(HDTV)ビットストリームが、標準解像度のテレビ用の映像として受信される場合に相当することができる。それゆえ、そのコンテンツはホーム内のクライアントの能力を満足するようにトランスコードされることになる。
【0038】
さらに、低解像度の外部クライアント806が外部ネットワーク802を介してHDD830上に格納されるコンテンツへのアクセスを望む場合には、トランスコーダ850を用いて、このクライアントに低解像度のマルチメディアコンテンツを配信することもできる。
【0039】
基本的な方法の解析
複雑さと品質とを変更することができるトランスコーダを設計するために、図4の方法によって生成される信号がさらに説明され、解析される。式中の表記に関しては、小文字の変数が空間領域の信号を示し、一方、大文字の変数がDCT領域内の等価な信号を示す。変数に付される下付き文字は時間を示し、一方、1に等しい上付き文字はドリフトを有する信号を示し、一方、2に等しい上付き文字はドリフトのない信号を示す。ドリフトは、再量子化、動きベクトルの打切りあるいはダウンサンプリングのような損失のあるプロセスを通して導入される。ドリフトを補償するための方法が以下に記載される。
【0040】
Iフレーム
Iフレームのための動き補償された予測は存在しない、すなわち、
【0041】
【数1】
【0042】
であるので、その信号はダウンサンプリングされる(410)。
【0043】
【数2】
【0044】
その際、エンコーダ120では以下の式が成り立つ。
【0045】
【数3】
【0046】
信号gn 2に対してDCT440が行われ、その後、量子化パラメータQ2で量子化される(450)。量子化された信号coutは可変長符号化され(460)、トランスコードされたビットストリーム402に書き込まれる。エンコーダにおける動き補償ループの一部として、coutは逆量子化され(470)、IDCTにかけられる(480)。低減された解像度基準信号yn 2481は、将来のフレーム予測のための基準信号としてフレームバッファに格納される(490)。
【0047】
Pフレーム
Pフレームの場合には、恒等式
【0048】
【数4】
【0049】
によって再構成された最大解像度画像が生成される。Iフレームの場合のように、その後、この信号は式(2)を用いてダウンコンバートされる。その後、低減された解像度の残留信号が以下の式から生成される。
【0050】
【数5】
【0051】
その式は同じく以下の式で表される。
【0052】
【数6】
【0053】
式(6)によって与えられる信号は、本発明によって記載されるアーキテクチャが近似する基準信号を表す。この基準信号を生成することは非常に複雑であるため、複雑さを著しく低減しながら、その特性(quality)を近似することが望ましいことに特に留意されたい。
【0054】
開ループアーキテクチャ
以下の式、
【0055】
【数7】
【0056】
を用いて近似すると、式(6)の低減された解像度の残留信号は以下のように表される。
【0057】
【数8】
【0058】
上記の式は図9に示されるようなトランスコーダ900のための開ループアーキテクチャを示唆する。
【0059】
トランスコーダ900では、入力されるビットストリーム901信号が可変長符号化され(910)、逆量子化されたDCT係数911と、最大解像度動きベクトルmvf902とが生成される。最大解像度動きベクトルはMVマッピングによって低減された解像度の動きベクトルmvr903にマッピングされる(920)。量子化されたDCT係数911は量子化器Q1で逆量子化され(930)、信号En 1が生成される(931)。その後、この信号は、以下にさらに詳細に記載されるようにブロックグループプロセッサ(a group of blocks processor)1300に入力される。プロセッサ1300の出力はダウンサンプリングされ(950)、信号Gn 2が生成される(951)。ダウンサンプリングの後、その信号は量子化器Q2960で量子化される。最後に、低減された解像度の再量子化されたDCT係数および動きベクトルが可変長符号化され(970)、トランスコードされた出力ビットストリームに書き込まれる(902)。
【0060】
ブロックグループプロセッサ1300の詳細および好ましい実施形態が以下に記載されるが、簡単に述べると、ブロックグループプロセッサの目的は、マクロブロックの選択されたグループを予備処理して、ダウンサンプリングプロセス950が、そのサブブロックが種々の符号化モード、たとえばインター・ブロックおよびイントラ・ブロックの両方を有するマクロブロックのグループを生成しないことを確実にすることである。マクロブロックにおける混在符号化モードに対応する既知の映像符号化標準規格は存在しない。
【0061】
低減された解像度におけるドリフト補償
式(7b)によって与えられる近似のみを与えるとき、式(6)の低減された解像度の残留信号は以下のように表される。
【0062】
【数9】
【0063】
上記の式は、低減された解像度におけるドリフトを補償する、図10に示される閉ループアーキテクチャ1000を示唆する。
【0064】
このアーキテクチャでは、入力される信号1001は可変長復号化され(1010)、量子化されたDCT係数1011と、最大解像度動きベクトルmvf1012とが生成される。最大解像度動きベクトル1012はMVマッピングによってマッピングされ(1020)、1組の低減された解像度の動きベクトルmvr1021が生成される。量子化されたDCT係数は量子化器Q1で逆量子化され(1030)、信号En 11031が生成される。その後、この信号はブロックグループプロセッサ1300において処理され、ダウンサンプリングされる(1050)。ダウンサンプリングされた(1050)後、低減された解像度のドリフト補償信号1051がDCT領域の低解像度残留信号1052に加算される(1060)。
【0065】
信号1061は空間量子化器Q2で量子化される(1070)。最後に、低減された解像度の再量子化されたDCT係数1071および動きベクトル1021が可変長符号化され(1080)、トランスコードされた出力ビットストリーム1002が生成される。
【0066】
低減された解像度のドリフト補償信号が生成される基準フレームが再量子化器残留信号Gn 21071の逆量子化1090によって得られ、それはその後、ダウンサンプリングされた残留信号Gn 11052から減算される(1092)。この差分信号はIDCT1094にかけられ、その後、フレーム記憶装置1091に格納される以前のマクロブロックの低解像度予測成分1096に加算される(1095)。この新たな信号は差(yn−1 1−yn−1 2)1097を表しており、現在のブロックのための低解像度動き補償のための基準として用いられる。
【0067】
格納された基準信号が与えられるとき、低解像度動き補償1098が実行され、その予測がDCT1099にかけられる。このDCT領域信号は低減された解像度のドリフト補償信号1051である。この動作は、その1組の低解像度の動きベクトルmvr1021を用いてマクロブロック毎に実行される。
【0068】
元の解像度においてドリフト補償する第1の方法
以下の近似の場合に、
【0069】
【数10】
【0070】
式(6)の低減された解像度の残留信号は以下のように表される。
【0071】
【数11】
【0072】
上記の式は、元の解像度のビットストリームにおけるドリフトを補償する、図11に示される閉ループアーキテクチャ1100を示唆する。
【0073】
このアーキテクチャでは、入力される信号1001が可変長復号化され(1110)、量子化されたDCT係数1111と、最大解像度動きベクトルmvf1112とが生成される。量子化されたDCT係数1111は量子化器Q1で逆量子化され(1130)、信号En 11131が生成される。その後、この信号はブロックグループプロセッサ1300において処理される。ブロックグループプロセッサ1300の後、元の解像度のドリフト補償信号1151が、DCT領域の残留信号1141に加算される(1160)。その後、信号1162がダウンサンプリングされ(1150)、量子化器Q2で量子化される(1170)。最後に、低減された解像度の再量子化されたDCT係数1171および動きベクトル1121が可変長符号化され(1180)、トランスコードされたビットストリームに書き込まれる(1102)。
【0074】
元の解像度のドリフト補償信号1151が生成される基準フレームが、再量子化器残留信号Gn 21171の逆量子化1190によって生成され、その後アップサンプリングされる(1191)。ここで、アップサンプリングされた後、そのアップサンプリングされた信号は、元の解像度の残留信号1161から減算される(1192)。この基準信号はIDCT1194にかけられ、以前のマクロブロックの元の解像度の予測成分1196に加算される(1195)。この新たな信号は差(xn−1 1−xn−1 2)1197を表しており、元の解像度の現在のマクロブロックの動き補償のための基準として用いられる。
【0075】
フレームバッファ1181に格納される基準信号が与えられるとき、元の解像度の動き補償1198が実行され、その予測がDCT1199にかけられる。このDCT領域信号は元の解像度のドリフト補償信号1151である。この動作はその1組の元の解像度の動きベクトルmvf1121を用いてマクロブロック毎に実行される。
【0076】
元の解像度においてドリフト補償する第2の方法
図11Bは図11Aの閉ループアーキテクチャの別の実施形態を示す。ここでは、再量子化器残留信号Gn 21172の逆量子化1190の出力が、アップサンプリングする(1191)前に、低減された解像度の信号から減算される(1192)。
【0077】
元の解像度におけるドリフト補償アーキテクチャはいずれもドリフト補償信号1151を生成する際に動きベクトル近似を用いない。これはアップサンプリング1191を用いることにより達成される。2つの別形態のアーキテクチャは主に、差分信号を生成するために用いられる信号の選択において異なる。第1の方法では、差分信号は再量子化および解像度変換に起因する誤差を表し、一方、第2の方法の差分信号は再量子化に起因する誤差のみを考慮する。
【0078】
アップサンプリングされた信号はトランスコードされたビットストリームを将来に復号化することを考慮に入れないので、ドリフト補償信号において連続してダウンサンプリングおよびアップサンプリングすることにより測定されるあらゆる誤差を排除するのに適している。しかしながら、アップサンプリングは依然として2つの理由のために、すなわちさらに近似することを避けるために最大解像度動きベクトル1121を利用するためと、ドリフト補償信号が元の解像度にあり、ダウンサンプリング1150前に入力される残留信号1161に加算する(1160)ことができるようにするためとに用いられる。
【0079】
混在ブロックプロセッサ(Mixed Block Processor)
ブロックグループプロセッサ1300の目的は、選択されたマクロブロックを予備処理して、ダウンサンプリングプロセスが、そのサブブロックが種々の符号化モード、たとえばインター・ブロックおよびイントラ・ブロックを有するマクロブロックを生成しないようにすることである。マクロブロックにおける混在符号化モードに対応する既知の映像符号化標準規格は存在しない。
【0080】
図12は、トランスコード1203の後に、低減された解像度のブロックのグループ1202に導くことができるマクロブロックのグループ1201の一例を示す。ここでは、3つのインターモード・ブロックと、1つのイントラモード・ブロックとが存在する。イントラモード・ブロックの場合の動きベクトル(MV)は0であることに留意されたい。ブロックの特定のグループが混在するグループであるが否かを判定することは、マクロブロックモードに依存する。ブロックグループプロセッサ1300は、低減された解像度において1つのマクロブロック1202を形成する、4つのマクロブロックからなるグループ1201を考慮する。言い換えると、輝度成分の場合、MB(0)1210が低減された解像度のマクロブロック1202のサブブロックb(0)1220に対応し、同様に、MB(1)1211がb(1)1221に対応し、MB(k)1212がb(2)1222に対応し、MB(k+1)1213がb(3)1223に対応する。ただし、kは元の解像度の行当たりのマクロブロックの数である。色差成分は輝度モードと矛盾しない類似の態様で取り扱われる。
【0081】
MBモードのグループは、ブロックグループプロセッサ1300が特定のMBを処理することになるか否かを決定する。そのブロックのグループは、そのグループが少なくとも1つのイントラモード・ブロックと、少なくとも1つのインターモード・ブロックとを含む場合に処理される。1つのマクロブロックが選択された後、そのDCT係数および動きベクトルデータが変更処理にかけられる。
【0082】
図13はブロックグループプロセッサ1300の構成要素を示す。混在ブロック1301からなる選択されたブロックの場合、ブロックグループプロセッサはモードマッピング1310と、動きベクトル変更1320と、DCT係数変更1330とを実行し、非混在出力ブロック1302を生成する。ブロックのグループ1301が特定されたなら、全てのマクロブロックが同じになるようにマクロブロックのモードが変更される。これは、低減された解像度のブロック内の各サブブロックのモードを一致させるために予め指定された方式にしたがって行われる。
【0083】
選択されたモードマッピングにしたがって、その後MVデータが変更1320にかけられる。対応するモードマッピングと一致する実現可能な変更が図14A〜Cの場合に以下に詳述される。最後に、新たなMBモードおよびMVデータの両方が与えられるとき、その対応するDCT係数もそのマッピングと一致するように変更される(1330)。
【0084】
図14Aに示されるブロックグループプロセッサの第1の実施形態では、ブロックのグループ1301のMBモードが、モードマッピング1310によってインターモードになるように変更される。それゆえ、イントラ・ブロックのためのMVデータは動きベクトル処理によって0にリセットされ、イントラ・ブロックに対応するDCT係数もDCT処理1330によって0にリセットされる。このようにして、変更されたそのようなサブブロックが、基準フレーム内の対応するブロックからのデータで繰り返される。
【0085】
図14Bに示されるブロックグループプロセッサの第2の実施形態では、混在するブロックからなるグループのMBモードが、マッピング1310によってインター・モードになるように変更される。しかしながら、第1の好ましい実施形態とは対照的に、イントラMBのためのMVデータが予測される。その予測は、テクスチャおよび動きデータの両方を含むことができる、隣接するブロック内のデータに基づく。この予測された動きベクトルに基づいて、変更されたブロックのための新たな残留信号が計算される。最後のステップ1320はインターDCT係数をイントラDCT係数にリセットする。
【0086】
図14Cに示される第3の実施形態では、ブロックのグループのMBモードはイントラ・モードに変更される(1310)。この場合に、低減された解像度のマクロブロックに関連する動き情報は存在せず、それゆえ全ての関連する動きベクトルデータが0にリセットされる(1320)。隣接するブロックの動きベクトルがこのブロックの動きから予測されるので、これはトランスコーダにおいて実行する必要がある。デコーダにおいて適当な再構成を確保するために、ブロックのグループのためのMVデータがトランスコーダにおいて0にリセットされなければならない。最後のステップ1330は、上記のようにインターDCT係数を置き換えるためにイントラDCT係数を生成する。
【0087】
上記の第2および第3の実施形態を実施するために、最大解像度に再構成する復号化ループを用いることができることに留意されたい。この再構成されたデータは、イントラモードとインターモードとの間、あるいはインターモードとイントラモードとの間でDCT係数を変換するための基準として用いられることができる。しかしながら、そのような復号化ループを用いることは必ずしも必要ではない。他の実装形態は、ドリフト補償ループにおいて変換を実行することができる。
【0088】
フレームのシーケンスがわずかな動きと低レベルの細部とを含む場合、図14Aの複雑でない方式を用いることができる。他の場合には、図14bあるいは図14cのいずれかの同等に複雑な方式が用いられることになる。図14cの方式は最良の品質を提供する。
【0089】
ブロック処理を用いるドリフト補償
ブロックグループプロセッサ1300は、ドリフトを制御するか、あるいは最小限に抑えるために用いることもできることに留意されたい。イントラ符号化されたブロックはドリフトの影響を受けにくいので、インター符号化されたブロックのイントラ符号化されたブロックへの変換はドリフトの影響を低減する。
【0090】
図14Cの第1のステップ1350として、圧縮されたビットストリームにおいてドリフトの量が測定される。閉ループアーキテクチャでは、ドリフトは、1092および1192によって生成される差分信号のエネルギーにしたがって、あるいは1091および1191に格納されるドリフト補償信号によって測定することができる。信号のエネルギーを計算する方法はよく知られている。計算されるエネルギーは、再量子化、ダウンサンプリングおよび動きベクトルの打切りを含む種々の近似を説明する。
【0091】
開ループアーキテクチャにも適用することができる、ドリフトを計算するための別の方法は、打ち切られた動きベクトルによって被る誤差を推定する。元の解像度における半画素動きベクトルによって、解像度が低減される際に大きな再構成誤差が生じることが知られている。最大画素動きベクトルは依然として半画素位置に正確にマッピングされることができるので、最大画素動きベクトルはそのような誤差の影響を受けにくい。この場合に、ドリフトを測定するための1つの可能性は、半画素動きベクトルのパーセンテージを記録することである。しかしながら、動きベクトル近似の影響はコンテンツの複雑さに依存するので、別の可能性は、測定されたドリフトが、半画素動きベクトルを有するブロックに関連付けられる残留成分の関数になることである。
【0092】
差分信号のエネルギーおよび動きベクトルデータを用いてドリフトを測定する方法は組み合わせて用いられることができ、フレーム内の小領域上で考慮することもできる。フレーム内の小領域を考慮することは、ドリフト補償方法によって最も利益を受けるマクロブロックの位置を特定することができるので有利である。これらの方法を組み合わせて用いるために、差分信号のエネルギー、あるいは元の解像度の半画素動きベクトルを有するマクロブロックのためのドリフト補償信号によってドリフトが測定される。
【0093】
第2のステップとして、ドリフトの測定された値が、ブロックグループプロセッサ1300への入力として用いられる「イントラ・リフレッシュレート」1351に変換される。イントラ符号化されたブロックのパーセンテージを制御することは、従来技術において誤り回復伝送のための映像符号化の場合に考慮されてきた。たとえば、Stuhlmuller等による「Analysis of Video Transmission over Lossy Channels」(Journal of Selected Area of Communications, 2000)を参照されたい。その研究では、受信機からエンコーダへの戻りチャネルが、伝送チャネルによって被られる損失の量を伝達するものと想定され、イントラ符号化されたブロックの符号化がデータ源から直に実行されて、予測符号化方式において失われたデータに起因する誤り伝搬を防ぐ。
【0094】
対照的に、本発明は既に符号化された映像の場合の圧縮された領域において新たなイントラ・ブロックを生成し、インター・ブロックからイントラ・ブロックへの変換がブロックグループプロセッサ1300によって行われる。
【0095】
ドリフトがドリフト量の閾値を超える場合には、図14cのブロックグループプロセッサ1300が呼び出され、インターモード・ブロックがイントラモード・ブロックに変換される。この場合に、その変換は固定され、予め指定されたイントラ・リフレッシュレートで実行される。別法では、変換は、測定されたドリフト量に比例するイントラ・リフレッシュレートでなされることができる。また、イントラ・リフレッシュレートと、イントラ・ブロックおよびインター・ブロックを符号化するために用いられる量子化器との間の適当なトレードオフを得るために、信号のレート歪み特性も考慮することができる。
【0096】
本発明は圧縮された領域において新たなイントラ・ブロックを生成し、この形態のドリフト補償は解像度低減を用いるトランスコーダ、あるいは用いないトランスコーダのいずれにおいても実行されることができることに留意されたい。
【0097】
ダウンサンプリング
本発明によるトランスコーダはあらゆるダウンサンプリング方法を用いることができる。しかしながら、好ましいダウンサンプリング方法は、1998年11月10日にSun等に付与された「Method and apparatus for down−converting a digital signal」というタイトルの米国特許第5,885,151号による方法であり、その特許は参照により本明細書に援用される。
【0098】
このダウンサンプリング方法の概念が図15Aに示される。1つのグループが4つの2N×2NDCTブロック1501を含む。すなわち、そのグループのサイズは2N+1×2N+1である。1つの2N×2NDCTブロック1511を生成するために、ブロックのグループに「周波数合成」あるいはフィルタリング1510が適用される。この合成されたブロックから、ダウンサンプリングされたDCTブロック1512を抽出することができる。
【0099】
この演算は、2D演算を用いるDCT領域の場合に記載されてきたが、分離可能な1Dフィルタを用いて実行されることもできる。また、その演算は空間領域において完全に実行されることができる。参照して本明細書に援用される、Vetro等による1998年3月6日出願の「Three layer scalable decoder and method of decoding」というタイトルの米国特許出願第09/035,969号に記載される方法を用いて、等価空間領域フィルタを導出することができる。
【0100】
本発明によるトランスコーダにおいてダウンサンプリング方法を用いる主な利点は、マクロブロック内のサブブロックの正確な大きさが、たとえば4つの8×8DCTブロックから直に求められ、1つの8×8ブロックを形成することができることである。一方、ダウンサンプリングのための別の従来技術の方法は、1つのマクロブロックの出力されるサブブロックの必要とされる大きさに等しくない大きさにおいてダウンサンプリングされたデータを生成し、たとえば4つの8×8DCTブロックから4つの4×4DCTブロックが得られる。その後、1つの8×8DCTブロックを構成するために付加的なステップが必要とされる。
【0101】
上記のフィルタはアップサンプリングを必要とする図11に示されるアーキテクチャを効率的に実装するために有用な構成要素である。より一般的には、ここで導出されるフィルタは、解像度低減あるいはドリフト補償を行うか、行わないかにかかわらず、アップサンプリングされたDCTデータデータにおいて算術演算を必要とする任意のシステムに適用されることができる。
【0102】
アップサンプリング
本発明において従来技術のアンプサンプリングの任意の手段を用いることができる。しかしながら、上記のVetro等による「Three layer scalable decoder and method of decoding」という米国特許出願では、最適なアップサンプリング方法がダウンサンプリングの方法に依存することを述べている。それゆえ、ダウンサンプリングフィルタxdに対応するアップサンプリングフィルタxuを用いることが好ましい。ただし、2つのフィルタ間の関係は以下の式によって与えられる。
【0103】
【数12】
【0104】
上記の式から導出されるフィルタには関連する2つの問題がある。第1に、DCTフィルタは逆にすることができないので、そのフィルタは空間領域においてのみ適用することができる。しかし、対応する空間領域フィルタが導出され、その後DCT領域に変換されることができるので、これは大きな問題ではない。
【0105】
しかしながら、第2の問題は、このようにして得られるアップサンプリングフィルタが図15Bに示されるプロセスに対応するというものである。このプロセスでは、たとえば2N×2Nブロック1502がアップサンプリングされ(1520)、1つの2N+1×2N+1ブロック1530が生成される。アップサンプリングが空間領域において完全に実行される場合には、問題は生じない。しかしながら、アップサンプリングがDCT領域において実行される場合には、2N+1×2N+1DCTブロックを有し、すなわち1つのDC成分を取り扱う。これは、アップサンプリングされたDCTブロックが標準的なMBフォーマット、すなわちNが4の場合に4つの2N×2NDCTブロックであることを必要とする演算の場合に適していない。すなわち、アップサンプリングされたブロックは元のブロックと同じフォーマットあるいは次元を有し、実際に元のブロックより多くのブロックが存在する。
【0106】
DCT領域におけるアップサンプリングの上記の方法は、本発明に記載されるトランスコーダにおいて用いるのに適していない。図11Aでは、アップサンプリングされたDCTデータが、混在ブロックプロセッサ1300からのDCT出力データから減算される。2つのブロックの2つのDCTデータは同じフォーマットを持たなければならない。それゆえ、図15Cに示されるアップサンプリングを実行できるフィルタが必要とされる。ここでは、1つの2N×2Nブロック1502がアップサンプリングされて(1540)、4つの2N×2Nブロック1550が生成される。そのようなフィルタはこれまで考えられたことがなく、既知の従来技術においては存在しないので、1Dの場合の式が以下において導出される。
【0107】
以下の式の表記に関しては、下付き文字の変数は空間領域信号を指示し、一方、上付き文字の変数はDCT領域における等価な信号を表す。
【0108】
図16に示されるように、C1601はDCT領域においてアップサンプリングされることになるDCTブロックを表し、c1602は空間領域における等価なブロックを表す。2つのブロックはN−ptDCTおよびIDCT1603の定義を通して互いに関連付けられる。RaoおよびYipによる「Discrete Cosine Transform: Algorithms, Advantages and Applications」(Academic, Boston, 1990)を参照されたい。便宜上、その式が以下にも与えられる。
【0109】
DCT定義は以下の通りである。
【0110】
【数13】
【0111】
IDCT定義は以下の通りである。
【0112】
【数14】
【0113】
ただし、以下の条件が成り立つ。
【0114】
【数15】
【0115】
上記の式が与えられるとき、ブロックE1610はXu1611でCをフィルタリングすることに基づくアップサンプリングされたDCTブロックを表し、eは、式(12)によって与えられるxu1621でcをフィルタリングすることに基づくアップサンプリングされた空間領域ブロックを表す。eおよびEは2N−ptDCT/IDCT1630を通して関係付けられることに留意されたい。フィルタリングされた入力の入力−出力関係は以下の式によって与えられる。
【0116】
【数16】
【0117】
図16に示されるように、所望のDCTブロックはA1611およびB1612によって示される。この導出の目的は、CからAおよびBをそれぞれ直に計算するために用いることができるフィルタXca1641およびXcb1642を導出することである。
【0118】
最初のステップとして、式(14)が式(16b)に代入される。その結果として得られる式はDCT入力Cの関数としての空間領域出力eであり、それは以下の式によって与えられる。
【0119】
【数17】
【0120】
式(17)を用いてCに関してAおよびBを表すために、a、bおよびeの間の空間領域の関係が以下の式によって与えられる。
【0121】
【数18】
【0122】
ただし、上記の式におけるiは空間領域指数を表す。aのためのDCT領域の式が以下に与えられる。
【0123】
【数19】
【0124】
式(17)〜(19)を用いて、以下の式が与えられる。
【0125】
【数20】
【0126】
その式は以下の式と等価である。
【0127】
【数21】
【0128】
ただし、以下の式が成り立つ。
【0129】
【数22】
【0130】
同様に、以下の式が与えられる。
【0131】
【数23】
【0132】
その式は以下の式と等価である。
【0133】
【数24】
【0134】
ただし、以下の式が成り立つ。
【0135】
【数25】
【0136】
その後、上記のフィルタを用いて、所与の大きさの1つのブロックをより大きな数のブロックにアップサンプリングすることができ、そのブロックはそれぞれもとのブロックと同じ次元を有する。より一般的には、ここで導出されたフィルタは、アップサンプリングされたDCTデータにおいて算術演算を必要とする任意のシステムに適用されることができる。
【0137】
式(22)および(25)によって与えられるフィルタを実装するために、各式がフィルタタップのk×qの行列を与えることに留意されたい。ただし、kは出力画素の指数であり、qは入力画素の指数である。1Dデータの場合、出力画素は行列の乗算として計算される。2Dデータの場合、2つのステップが行われる。第1に、そのデータが第1の方向、たとえば水平方向にアップサンプリングされる。その後、水平方向にアップサンプリングされたデータが第2の方向、たとえば垂直方向にアップサンプリングされる。アップサンプリングするための方向の順序は結果に影響を及ぼすことなく逆にすることができる。
【0138】
水平方向のアップサンプリングの場合、1つのブロック内の各行は独立して演算され、N次元の入力ベクトルとして取り扱われる。各入力ベクトルは式(21)および(24)にしたがってフィルタリングされる。このプロセスの出力は2つの標準的なDCTブロックになるであろう。
【0139】
垂直方向のアップサンプリングの場合、1つのブロック内の各列は独立して演算され、再びN次元の入力ベクトルとして取り扱われる。水平方向のアップサンプリングの場合のように、各入力ベクトルは式(21)および(24)にしたがってフィルタリングされる。このプロセスの出力は、図15Cに示されるような4つの標準的なDCTブロックになるであろう。
【0140】
構文変換
本発明によるトランスコーダの上記の応用形態の場合に述べられたように、本発明のための重要な応用形態のうちの1つはMPEG−2からMPEG−4への変換である。これまで主に、より低い空間解像度にトランスコードする際のドリフト補償と、より低い空間解像度への変換を支援する付加的な技術とのために用いられるアーキテクチャに焦点が当てられた。
【0141】
しかしながら、標準的な符号化方式間の構文変換は別の重要な課題である。これは既に係属中の特許出願によって記載されているものと考えているので、この部分においてさらに詳細には与えない。
【0142】
本発明は好ましい実施形態の例を用いて記載されてきたが、本発明の精神および範囲内で種々の他の適合形態および変更形態が実施できることは理解されたい。それゆえ、併記の特許請求の範囲の目的は、本発明の真の精神および範囲に入るような全てのそのような変形および変更を網羅することである。
【図面の簡単な説明】
【図1】従来のカスケード接続されたトランスコーダのブロック図である。
【図2】ビットレートを低減するための従来技術の開ループトランスコーダのブロック図である。
【図3】ビットレートを低減するための従来技術の閉ループトランスコーダのブロック図である。
【図4】空間解像度を低減するための従来のカスケード接続されたトランスコーダのブロック図である。
【図5】空間解像度を低減するための従来技術の開ループトランスコーダのブロック図である。
【図6】従来技術の動きベクトルマッピングのブロック図である。
【図7】本発明による、ビットストリームを低減された空間解像度にトランスコードする第1の応用形態のブロック図である。
【図8】本発明による、ビットストリームを低減された空間解像度にトランスコードする第2の応用形態のブロック図である。
【図9】本発明による、空間解像度を低減するための開ループトランスコーダのブロック図である。
【図10】本発明による、低減された解像度におけるドリフト補償を有する、空間解像度を低減するための第1の閉ループトランスコーダのブロック図である。
【図11A】本発明による、元の解像度におけるドリフト補償を有する、空間解像度を低減するための第2の閉ループトランスコーダのブロック図である。
【図11B】本発明による、元の解像度におけるドリフト補償を有する、空間解像度を低減するための第3の閉ループトランスコーダのブロック図である。
【図12】マクロブロックモードと、DCT係数と、対応する動きベクトルデータとを含むマクロブロックのグループの一例を示す図である。
【図13】本発明によるブロックグループプロセッサのブロック図である。
【図14A】本発明によるブロックグループ処理のための第1の方法のブロック図である。
【図14B】本発明によるブロックグループ処理のための第2の方法のブロック図である。
【図14C】本発明によるブロックグループ処理のための第3の方法のブロック図である。
【図15A】DCTあるいは空間領域におけるダウンサンプリングの従来技術の概念を示す図である。
【図15B】DCTあるいは空間領域における従来技術のアップサンプリングのブロック図である。
【図15C】本発明によるDCT領域におけるアップサンプリングのブロック図である。
【図16】本発明によるDCT領域におけるアップサンプリングの図である。
Claims (9)
- 部分的に復号化された入力ビットストリームのマクロブロックにおいてドリフトを補償するための方法であって、前記マクロブロックはイントラモードおよびインターモードのマクロブロックを含み、前記マクロブロックはそれぞれDCT係数と動きベクトルとを含み、前記方法は、
前記部分的に復号化された入力ビットストリームにおいてドリフトの推定値を測定すること、
ドリフトの前記推定値をイントラ・リフレッシュレートに変換すること、
前記リフレッシュレートにしたがってインターモード・マクロブロックのモードをインターモード・マクロブロックにマッピングすること、および、
ドリフトを補償するために、変更された各マクロブロックのためのマッピングにしたがって前記変更された各マクロブロックのための前記DCT係数と前記動きベクトルとを変更すること
を含む方法。 - 量子化の前後に前記DCT係数から差分信号を生成すること、および、
前記ドリフトの前記推定値を決定するために前記差分信号のエネルギーを測定すること
をさらに含む請求項1に記載の方法。 - ダウンサンプリングされた各マクロブロックのための最大解像度ドリフト補償信号を生成すること、および、
前記ドリフトの推定値を決定するために前記最大解像度ドリフト補償信号のエネルギーを測定すること
をさらに含む請求項1に記載の方法。 - 打ち切られた動きベクトルの誤差を測定することをさらに含む請求項1に記載の方法。
- ダウンサンプリングされた各マクロブロックのための最大解像度ドリフト補償信号を生成すること、
前記ドリフトの推定値を決定するために前記最大解像度ドリフト補償信号のエネルギーを測定すること、および、
打ち切られた動きベクトルの誤差を測定すること
をさらに含む請求項1に記載の方法。 - 所定の閾値にしたがって変換することをさらに含む請求項1に記載の方法。
- 前記変換は、前記ドリフトの前記推定値に比例する請求項1に記載の方法。
- 前記変換は、前記マクロブロックのレート歪み特性に依存する請求項1に記載の方法。
- 部分的に復号化された入力ビットストリームのマクロブロックにおいてドリフトを補償するための装置であって、前記マクロブロックはイントラモードおよびインターモード・マクロブロックを含み、前記マクロブロックはそれぞれDCT係数と動きベクトルとを含み、前記装置は、
前記部分的に復号化された入力ビットストリームにおいてドリフトの推定値を測定するための手段と、
ドリフトの前記推定値をイントラ・リフレッシュレートに変換するための手段と、
前記リフレッシュレートにしたがってインターモード・マクロブロックのモードをインターモード・マクロブロックにマッピングするための手段と、
ドリフトを補償するために、変更された各マクロブロックのためのマッピングにしたがって前記変更された各マクロブロックのための前記DCT係数と前記動きベクトルとを変更するための手段と
を含む装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/854,020 US7088780B2 (en) | 2001-05-11 | 2001-05-11 | Video transcoder with drift compensation |
PCT/JP2002/004328 WO2002093937A2 (en) | 2001-05-11 | 2002-04-30 | Video transcoder with drift compensation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004520771A true JP2004520771A (ja) | 2004-07-08 |
JP4163006B2 JP4163006B2 (ja) | 2008-10-08 |
Family
ID=25317520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002590678A Expired - Fee Related JP4163006B2 (ja) | 2001-05-11 | 2002-04-30 | ドリフト補正を備えたビデオトランスコーダ |
Country Status (5)
Country | Link |
---|---|
US (1) | US7088780B2 (ja) |
EP (1) | EP1386494A2 (ja) |
JP (1) | JP4163006B2 (ja) |
CN (1) | CN1240226C (ja) |
WO (1) | WO2002093937A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014509120A (ja) * | 2011-01-21 | 2014-04-10 | トムソン ライセンシング | コンテンツプロファイルを用いる高度化された遠隔トランスコーディングのためのシステム及び方法 |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19963817C2 (de) * | 1999-12-30 | 2002-09-26 | Siemens Ag | Verfahren und Vorrichtung zur Umsetzung eines bidirektionalen Datenstroms über eine S2m-Schnittstelle für eine Übermittlung über ein Niederspannungsstromnetz |
JP2002152759A (ja) * | 2000-11-10 | 2002-05-24 | Sony Corp | 画像情報変換装置および画像情報変換方法 |
US6671322B2 (en) * | 2001-05-11 | 2003-12-30 | Mitsubishi Electric Research Laboratories, Inc. | Video transcoder with spatial resolution reduction |
US7330509B2 (en) * | 2003-09-12 | 2008-02-12 | International Business Machines Corporation | Method for video transcoding with adaptive frame rate control |
US20050175099A1 (en) * | 2004-02-06 | 2005-08-11 | Nokia Corporation | Transcoder and associated system, method and computer program product for low-complexity reduced resolution transcoding |
EP1631089A1 (en) * | 2004-08-30 | 2006-03-01 | Matsushita Electric Industrial Co., Ltd. | Video coding apparatus and decoding apparatus |
EP1662800A1 (en) * | 2004-11-30 | 2006-05-31 | Humax Co., Ltd. | Image down-sampling transcoding method and device |
DE102005016858A1 (de) * | 2005-04-12 | 2006-10-19 | Siemens Ag | Verfahren und Vorrichtung zur Reduktion eines Quantisierungsfehlers |
US20070160134A1 (en) * | 2006-01-10 | 2007-07-12 | Segall Christopher A | Methods and Systems for Filter Characterization |
US8087044B2 (en) * | 2006-09-18 | 2011-12-27 | Rgb Networks, Inc. | Methods, apparatus, and systems for managing the insertion of overlay content into a video signal |
US7801213B2 (en) * | 2006-09-18 | 2010-09-21 | Rgb Networks, Inc. | Method and apparatus for modifying a data rate of a video signal |
US7688889B2 (en) * | 2006-09-18 | 2010-03-30 | Rgb Networks, Inc. | Methods, apparatus, and systems for insertion of overlay content into a video signal with transrating capabilities |
US7995850B2 (en) | 2007-06-04 | 2011-08-09 | Research In Motion Limited | Method and device for selecting transform matrices for down-sampling DCT image using learning with forgetting algorithm |
EP2153403B1 (en) | 2007-06-04 | 2013-04-03 | Research In Motion Limited | Method and device for down-sampling a dct image in the dct domain |
US7978934B2 (en) * | 2007-06-04 | 2011-07-12 | Research In Motion Limited | Method and device for selecting optimal transform matrices for down-sampling DCT image |
WO2009034488A2 (en) * | 2007-09-10 | 2009-03-19 | Nxp B.V. | Method an apparatus for line based vertical motion estimation and compensation |
US20100278236A1 (en) * | 2008-01-17 | 2010-11-04 | Hua Yang | Reduced video flicker |
US8798137B2 (en) * | 2008-02-29 | 2014-08-05 | City University Of Hong Kong | Bit rate estimation in data or video compression |
US8831101B2 (en) * | 2008-08-02 | 2014-09-09 | Ecole De Technologie Superieure | Method and system for determining a metric for comparing image blocks in motion compensated video coding |
US8295345B2 (en) * | 2008-09-22 | 2012-10-23 | Smith Micro Software, Inc. | Transcoder unit and method |
KR20100095992A (ko) | 2009-02-23 | 2010-09-01 | 한국과학기술원 | 비디오 부호화에서의 분할 블록 부호화 방법, 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체 |
US9100656B2 (en) | 2009-05-21 | 2015-08-04 | Ecole De Technologie Superieure | Method and system for efficient video transcoding using coding modes, motion vectors and residual information |
US8755438B2 (en) | 2010-11-29 | 2014-06-17 | Ecole De Technologie Superieure | Method and system for selectively performing multiple video transcoding operations |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5614952A (en) * | 1994-10-11 | 1997-03-25 | Hitachi America, Ltd. | Digital video decoder for decoding digital high definition and/or digital standard definition television signals |
US5940130A (en) * | 1994-04-21 | 1999-08-17 | British Telecommunications Public Limited Company | Video transcoder with by-pass transfer of extracted motion compensation data |
US5825927A (en) * | 1996-01-16 | 1998-10-20 | Hitachi America, Ltd. | Methods and apparatus for encoding video data in a manner that is well suited for decoding by regular or downconverting decoders |
US5737019A (en) * | 1996-01-29 | 1998-04-07 | Matsushita Electric Corporation Of America | Method and apparatus for changing resolution by direct DCT mapping |
KR100240770B1 (ko) * | 1997-07-11 | 2000-01-15 | 이형도 | 에너지보상/역보상기능을개선한스케러블부호화기및그방법 |
US6466623B1 (en) * | 1998-03-27 | 2002-10-15 | Industrial Technology Research Institute | Method and apparatus for motion estimation for high performance transcoding |
US6226328B1 (en) * | 1998-05-01 | 2001-05-01 | Boom Corporation | Transcoding apparatus for digital video networking |
US6590938B1 (en) * | 1999-09-30 | 2003-07-08 | Conexant Systems, Inc. | DCT domain conversion of a higher definition signal to lower definition signal |
US6510178B1 (en) * | 1999-12-15 | 2003-01-21 | Zenith Electronics Corporation | Compensating for drift in the down conversion of high definition sequences to lower resolution sequences |
US6493386B1 (en) * | 2000-02-02 | 2002-12-10 | Mitsubishi Electric Research Laboratories, Inc. | Object based bitstream transcoder |
US6671322B2 (en) * | 2001-05-11 | 2003-12-30 | Mitsubishi Electric Research Laboratories, Inc. | Video transcoder with spatial resolution reduction |
-
2001
- 2001-05-11 US US09/854,020 patent/US7088780B2/en not_active Expired - Fee Related
-
2002
- 2002-04-30 EP EP02722905A patent/EP1386494A2/en not_active Withdrawn
- 2002-04-30 CN CNB028023625A patent/CN1240226C/zh not_active Expired - Fee Related
- 2002-04-30 JP JP2002590678A patent/JP4163006B2/ja not_active Expired - Fee Related
- 2002-04-30 WO PCT/JP2002/004328 patent/WO2002093937A2/en active Application Filing
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014509120A (ja) * | 2011-01-21 | 2014-04-10 | トムソン ライセンシング | コンテンツプロファイルを用いる高度化された遠隔トランスコーディングのためのシステム及び方法 |
US9681091B2 (en) | 2011-01-21 | 2017-06-13 | Thomson Licensing | System and method for enhanced remote transcoding using content profiling |
Also Published As
Publication number | Publication date |
---|---|
JP4163006B2 (ja) | 2008-10-08 |
WO2002093937A3 (en) | 2003-09-12 |
CN1516975A (zh) | 2004-07-28 |
US20020176495A1 (en) | 2002-11-28 |
EP1386494A2 (en) | 2004-02-04 |
WO2002093937A2 (en) | 2002-11-21 |
US7088780B2 (en) | 2006-08-08 |
CN1240226C (zh) | 2006-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4313543B2 (ja) | 部分的に復号された入力ビットストリームのマクロブロック群を変換符号化する方法及び装置 | |
US7170932B2 (en) | Video transcoder with spatial resolution reduction and drift compensation | |
JP4163006B2 (ja) | ドリフト補正を備えたビデオトランスコーダ | |
US7391807B2 (en) | Video transcoding of scalable multi-layer videos to single layer video | |
US6526099B1 (en) | Transcoder | |
US7110451B2 (en) | Bitstream transcoder | |
AU2007231799B8 (en) | High-performance video transcoding method | |
US20060280372A1 (en) | Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction | |
Youn et al. | Video transcoder architectures for bit rate scaling of H. 263 bit streams | |
US8155211B2 (en) | Digital stream transcoder | |
JP2004504739A (ja) | Mpeg−2からmpeg−4へのビデオサイズの変換およびトランスコード化 | |
KR20060045719A (ko) | 고충실도 트랜스코딩 | |
JP2001145113A (ja) | 画像情報変換装置及び方法 | |
JP4209134B2 (ja) | 圧縮ビットストリームをアップサンプリングする方法および装置 | |
JP4318019B2 (ja) | 画像処理装置および方法、記録媒体、並びにプログラム | |
KR100364748B1 (ko) | 영상 변환 부호화 장치 | |
JP4339784B2 (ja) | 複数個のブロックとして符号化された圧縮ビットストリーム符号化ビデオを復号する方法。 | |
WO2006132509A1 (en) | Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction | |
KR20030000310A (ko) | 영상 변환 부호화 장치 | |
Hashemi et al. | Macroblock type selection for compressed domain down-sampling of MPEG video | |
Akujuobi | Application of Wavelets to Video Compression | |
JP2001016589A (ja) | 画像情報変換装置、画像情報伝達システム及び画像情報変換方法 | |
Wu | Reducing inverse quantization numbers for video transcoding | |
JP2003219430A (ja) | ビデオ信号のフレームのシーケンスの圧縮されたビットストリームを低減された空間解像度にトランスコードするための方法および閉ループトランスコーダ | |
JP2001145108A (ja) | 画像情報変換装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050415 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20070530 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070828 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071225 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080229 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080401 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080625 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080722 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080723 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110801 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120801 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130801 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |