JP2003061091A - 圧縮ビットストリームをアップサンプリングする方法および装置 - Google Patents

圧縮ビットストリームをアップサンプリングする方法および装置

Info

Publication number
JP2003061091A
JP2003061091A JP2002135820A JP2002135820A JP2003061091A JP 2003061091 A JP2003061091 A JP 2003061091A JP 2002135820 A JP2002135820 A JP 2002135820A JP 2002135820 A JP2002135820 A JP 2002135820A JP 2003061091 A JP2003061091 A JP 2003061091A
Authority
JP
Japan
Prior art keywords
dct
macroblock
block
upsampled
resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002135820A
Other languages
English (en)
Other versions
JP4209134B2 (ja
Inventor
Vetro Anthony
アンソニー・ヴェトロ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Research Laboratories Inc
Original Assignee
Mitsubishi Electric Research Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Research Laboratories Inc filed Critical Mitsubishi Electric Research Laboratories Inc
Publication of JP2003061091A publication Critical patent/JP2003061091A/ja
Application granted granted Critical
Publication of JP4209134B2 publication Critical patent/JP4209134B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4084Transform-based scaling, e.g. FFT domain scaling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 (修正有) 【課題】空間解像度の低下の問題、トランスコーダーに
おける複雑性と画質との間の均衡に関する問題及びトラ
ンスコーディング中に於けるアップサンプリングの問題
を解決する。 【解決手段】 方法は、圧縮ビットストリームをアップ
サンプリングする。圧縮ビットストリームは、部分的に
復号化されることによりマクロブロックをもたらす。各
マクロブロックは、マクロブロックの所定次元に従うD
CT係数を有する。各マクロブロックのDCT係数にD
CTフィルタが適用されることにより、各マクロブロッ
クのアップサンプリングされたマクロブロックがもたら
され、各フィルタにより1つのアップサンプリングされ
たマクロブロックが生成される。生成されたアップサン
プリングされたマクロブロックの各々は、所定次元を有
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、概してビットス
トリームをトランスコードする技術分野に関し、特に、
ビデオビットストリームをトランスコードしている間に
アップサンプリングを行うことに関する。
【0002】
【従来の技術】ビデオ圧縮は、視覚情報を、記憶域、ネ
ットワークおよびプロセッサリソースをより少ないリソ
ースで格納し、送信し、処理することを可能にする。最
も広く使用されるビデオ圧縮規格には、動画の格納およ
び検索のためのMPEG−1と、デジタルテレビのため
のMPEG−2と、ビデオ会議のためのH.263と、
がある。ISO/IEC 11172−2:1993、
「Information Technology-Coding of Moving Pictures
and Associated Audio for Digital Storage Media up
to about 1.5 Mbits/s-Part2:Video」、D.LeGallによ
る「MPEG:A VideoCompression Standard for Multimedi
a Applications」、Communications of the ACM、Vo
l.34、No.4、pp.46〜58、1991、I
SO/IEC 13818−2:1996、「Informat
ion Technology-Generic Coding ofMoving Pictures an
d Associated Audio Information-Part2:Video」、19
94、ITU−T SG XV、DRAFT H.26
3、「Video Coding for Low Bitrate Communicatio
n」、1996、ITU−T SG XVI、DRAF
T13 H.263+Q15−A−60rev.0、
「Video Coding for Low Bitrate Communication」、1
997を参照のこと。
【0003】これら規格は、本来、画像またはフレーム
の空間的圧縮と、フレームのシーケンスの空間的および
時間的圧縮とを扱う比較的低レベルの仕様である。共通
の特徴として、これら規格は、フレームベース毎で圧縮
を実行する。これら規格により、多種多様のアプリケー
ションに対して高圧縮率を達成することができる。
【0004】マルチメディアアプリケーションのための
MPEG−4等、より新しいビデオ符号化規格(ISO
/IEC 14496−2:1999、「Information
technology-coding of audio/visual objects、Part2:Vi
sual」参照)では、任意形状オブジェクトを、別個のビ
デオオブジェクトプレーン(video object plane(VO
P))として符号化および復号化することが可能であ
る。オブジェクトは、視覚、音声、自然、合成、基本、
複合またはそれらの組合せとすることができる。また、
この規格には、無線チャネル等のエラーを起しやすいチ
ャネルに亙る頑強な送信を可能にするために、非常に多
くのエラー回復機能が組込まれている。
【0005】新しいMPEG−4規格は、自然材料と合
成材料とが統合されアクセスがユニバーサルであるイン
タラクティブテレビ等、マルチメディアアプリケーショ
ンを可能にすることが意図されている。ビデオ送信のコ
ンテキストでは、これら圧縮規格は、ネットワーク上で
帯域幅の量を低減するために必要とされる。ネットワー
クは、無線であってもインタネットであってもよい。い
ずれの場合も、ネットワークは容量が制限されており、
乏しいリソースに対する競合は最小限にされなければな
らない。
【0006】装置が、コンテンツを強固に送信し、コン
テンツの品質を、利用可能なネットワークリソースに適
合させることができるようにする、システムおよび方法
に対し、非常に多くの努力がなされてきた。コンテンツ
が符号化される場合、時に、ビットストリームを、低い
ビットレートまたは解像度でネットワークによって送信
することができるようになる前に、更に復号化すること
が必要な場合がある。
【0007】これは、図1に示すように、トランスコー
ダ100によって達成することができる。最も単純な実
現では、トランスコーダ100は、カスケード接続され
たデコーダ110とエンコーダ120とを有する。圧縮
入力ビットストリーム101は、入力ビットレートRin
で完全に復号化され出力ビットレートRout102で符
号化されて、出力ビットストリーム103をもたらす。
通常、出力レートは入力レートより低い。実際には、ト
ランスコーダにおける完全な復号化および完全な符号化
は、復号化されたビットストリームを符号化することが
非常に複雑であるため行われない。
【0008】MPEG−2トランスコーディングに対す
る初期の研究は、Sun等により、「Architectures fo
r MPEG compressed bitstream scaling」、IEEE Transa
ctionson Circuits and Systems for Video Technolog
y、April 1996において発表されている。そこでは、種々
の複雑性およびアーキテクチャによるレート低減の4つ
の方法が述べられている。
【0009】図2は、開ループアーキテクチャと呼ばれ
る第1の方法例200を示す。このアーキテクチャで
は、入力ビットストリーム201は部分的にしか復号化
されない。より詳細には、入力ビットストリームのマク
ロブロックは、可変長復号化(variable-length decode
d)(VLD)され210、精細な量子化器Q1によって
逆量子化される220ことにより、離散コサイン変換
(discrete cosine transform)(DCT)係数をもた
らす。所望の出力ビットレート202が与えられると、
DCTブロックは、量子化器230のより粗いレベルの
量子化器Q2によって再量子化される。そして、これら
再量子化されたブロックは、可変長符号化(variable-l
ength code)(VLC)され240、より低いレートの
新たな出力ビットストリーム203が形成される。この
方式は、動きベクトルが再使用され逆DCT操作が必要
でないため、図1に示す方式よりずっと単純である。な
お、ここでQ1およびQ2の選択は、厳密にビットストリ
ームのレート特性によって決まる。おそらくはビットス
トリームの空間特性等、他の要素は考慮されない。
【0010】図3は、第2の方法例300を示す。この
方法は、閉ループアーキテクチャと呼ばれる。この方法
では、入力ビデオビットストリームは、同様に部分的に
復号化され、すなわち、入力ビットストリームのマクロ
ブロックは、可変長復号化(VLD)され310、Q1
によって逆量子化される320ことにより、離散コサイ
ン変換(DCT)係数321をもたらす。上述した第1
の方法例とは対照的に、入力DCT係数321に対し補
正DCT係数332が加算される330ことにより、再
量子化によってもたらされる不一致が補償される。この
補正により、最終的に復号化に使用される参照フレーム
の品質が向上する。補正が加算された後、新たに形成さ
れたブロックは、Q2によって再量子化される340こ
とにより新たなレートを満足し、上述したように可変長
符号化される350。なお、この場合も、Q1およびQ2
はレートに基づく。
【0011】補正成分332を取得するため、再量子化
されたDCT係数は、逆量子化され360、元の部分的
に復号化されたDCT係数から減算される370。この
差分は、逆DCT(IDCT)365を介して空間領域
に変換され、フレームメモリ380に格納される。そし
て、動き補償390等において、対応する差分ブロック
を回復させるために、各入力ブロックに関連する動きベ
クトル381が使用される。そして、対応ブロックがD
CT332を介して変換されることにより、補正成分が
もたらされる。図3に示す方法の派生は、Assuncao等に
よる「A frequency domain video transcoder for dyna
mic bit-rate reduction of MPEG-2 bitstreams」、IEEE
Transactions on Circuits and Systems for Video Tec
hnology、pp.953〜957、1998に述べられ
ている。
【0012】また、Assunca等は、同じタスクに対する
代替方法も述べている。代替方法では、彼らは、ドリフ
ト補償のために周波数領域で動作する動き補償(motion
compensation)(MC)ループを使用した。周波数領
域におけるMCブロックの高速計算のために、近似行列
が導出された。トランスコーディングに対し最適な量子
化器スケールを計算するために、ラグランジュ最適化が
使用された。その代替方法により、IDCT/DCTコ
ンポーネントが不要となった。
【0013】従来技術による圧縮規格よると、テクスチ
ャ情報を符号化するために割付けられるビットの数は、
量子化パラメータ(QP)によって制御される。上記方
法は、元のビットストリームに含まれる情報に基づいて
QPを変更することによりテクスチャビットのレートが
低減する、という点で類似している。効率的な実現のた
めに、情報は、通常圧縮領域から直接抽出され、DCT
ブロックのマクロブロックかまたはDCTブロックの残
差エネルギの動きに関連する基準を含むことができる。
上述した方法は、ビットレート低減に対してのみ適用可
能である。
【0014】ビットレート低減のほかに、他のタイプの
ビットストリームの変換もまた実行することができる。
例えば、オブジェクトベースの変換が、Vetro等により
2000年2月14日に出願された米国特許出願第09
/504,323号、「Object-Based Bitstream Trans
coder」に述べられている。空間解像度に対する変換
は、ShanablehおよびGhanbariより「Heterogeneous vid
eo transcoding to lower spatio-temporal resolution
s,and different encoding formats」、IEEETransa
ction on Multimedia、June 2000において述べられてい
る。
【0015】なお、これら方法は、品質が十分でない低
減された空間解像度低減でビットストリームをもたらす
か、または非常に複雑に達成される、ということが留意
されなければならない。また、再構成されるマクロブロ
ックが形成される際に用いられる手段に対し、適当な考
慮がなされてこなかった。これは、品質と複雑性との両
方に対して悪影響を与える可能性があり、2以外の低減
ファクタを考慮する場合に特に重要である。更に、これ
らの方法は、いかなるアーキテクチャ上の詳細も指定し
ない。大抵、ファクタ2により動きベクトルをスケーリ
ングするあらゆる手段が留意される。
【0016】図4は、入力ビットストリームをより低い
空間解像度の出力ビットストリーム402にトランスコ
ードする方法400の詳細を示す。この方法は、図1に
示す方法の拡張であるが、デコーダ110およびエンコ
ーダ120の詳細が示されており、復号化プロセスと符
号化プロセスとの間にダウンサンプリングブロック41
0がある。デコーダ110は、ビットストリームの部分
的復号化を実行する。ダウンサンプラは、部分的マクロ
ブロックのグループの空間解像度を低減する。デコーダ
における動き補償420は、フル解像度動きベクトルm
f421を使用し、エンコーダにおける動き補償43
0は、低解像度動きベクトルmvr431を使用する。
低解像度動きベクトルは、ダウンサンプリングされた空
間領域フレームy1 n403から推定されるかまたはフル
解像度動きベクトルからマッピングされる。トランスコ
ーダ400の更なる詳細については後述する。
【0017】図5は、入力ビットストリーム501をよ
り低い空間解像度の出力ビットストリーム502にトラ
ンスコードする開ループ方法500の詳細を示す。この
方法では、ビデオビットストリームは再び部分的に復号
化され、すなわち、入力ビットストリームのマクロブロ
ックは、可変長復号化(VLD)され510、逆量子化
される520ことにより、離散コサイン変換(DCT)
係数をもたらす。これらステップは周知である。
【0018】そして、DCTマクロブロックは、16×
16(24×24)マクロブロックにおいて各8×8(2
3×23)輝度ブロックの高周波数係数をマスクすること
によってファクタ2でダウンサンプリングされる530
ことにより、4つの4×4DCTブロックをもたらす。
1993年11月16日にNgに発行された米国特許第
5,262,854号、「Low-resolution HDTV receiv
ers」を参照のこと。言換えれば、ダウンサンプリング
は、例えば4つのブロックのグループを、よりサイズの
小さい4つのブロックのグループにする。
【0019】トランスコーダにおいてダウンサンプリン
グを実行することにより、トランスコーダは、コンプラ
イアントな16×16マクロブロックを再形成する追加
のステップを取らなければならず、それは、空間領域へ
戻す変換と、その後の更なるDCT領域への変換と、を
含む。ダウンサンプリング後、ブロックは、同じ量子化
レベルを用いて再量子化され540、その後、可変長符
号化される550。低減された解像度のブロックに対す
るレート制御を実行するいかなる方法も述べられていな
い。
【0020】完全な動きベクトル559から低減された
動きベクトル561への動きベクトルマッピング560
を実行するために、従来技術では、フレームベースの動
きベクトルに適したいくつかの方法が述べられている。
4つのフレームベースの動きベクトル、すなわち、グル
ープの各マクロブロックに対して1つから、新たに形成
された16×16マクロブロックに対して1つの動きベ
クトルにマッピングするために、単純な平均化またはメ
ディアンフィルタを採用することができる。これは、
4:1マッピングと呼ばれる。
【0021】しかしながら、MPEG−4およびH.2
63等のいくつかの圧縮規格は、8×8ブロックに対し
て1つの動きベクトルを可能にする拡張された予測モー
ドをサポートする。この場合、各動きベクトルは、元の
解像度の16×16マクロブロックから低減された解像
度のマクロブロックにおける8×8ブロックへマッピン
グされる。これは、1:1マッピングと呼ばれる。
【0022】図6は、4つの16×16マクロブロック
のグループ601から1つの16×16マクロブロック
602かまたは4つの8×8マクロブロック603への
動きベクトルの可能なマッピング600を示す。通常
1:1マッピングを使用することは、4つの動きベクト
ルを符号化するためにより多くのビットが使用されるた
め、非効率である。また、概して、インタレースされた
画像のフィールドベースの動きベクトルへの拡張は、単
純ではない。ダウンサンプリングされたDCT係数とマ
ッピングされた動きベクトルとが与えられると、データ
は可変長符号化され、低減された解像度のビットストリ
ームを周知のように形成することができる。
【0023】
【発明が解決しようとする課題】空間解像度低減のため
の従来技術による方法の問題を解決する、ビットストリ
ームをトランスコードする方法を提供することが望まし
い。更に、トランスコーダにおいて複雑性と品質との間
の均衡を提供することが望ましい。更に、ドリフトを補
償し、トランスコーディング中により適切なアップサン
プリング技術を提供することが望ましい。
【0024】
【課題を解決するための手段】方法は、圧縮ビットスト
リームをアップサンプリングする。圧縮ビットストリー
ムは、部分的に復号化されることによりマクロブロック
をもたらす。各マクロブロックは、マクロブロックの所
定次元に従うDCT係数を有する。各マクロブロックの
DCT係数にDCTフィルタが適用されることにより、
各マクロブロックに対するアップサンプリングされたマ
クロブロックが生成され、各フィルタによって1つのア
ップサンプリングされたマクロブロックが生成される。
生成されたアップサンプリングされたマクロブロックの
各々は、所定次元を有する。
【0025】
【発明の実施の形態】概論 この発明は、最小ドリフトで、デジタルビデオ信号の圧
縮ビットストリームを低減された空間解像度にトランス
コードする、システムおよび方法を提供する。まず、こ
の発明によるトランスコーダを使用することができるコ
ンテンツ配信のためのいくつかのアプリケーションを説
明する。次に、より低い空間解像度のビットストリーム
を生成する基本的な方法を分析する。この分析に基づい
て、基本的な方法に対するいくつかの代替例と、各代替
例に関連する対応するアーキテクチャとを説明する。
【0026】第1の代替例(図9参照)は開ループアー
キテクチャを使用し、他の3つの代替例(図10および
図11Aないし図11B)は、ダウンサンプリング、再
量子化および動きベクトル打切りによってもたらされる
ドリフトを補償する手段を提供する閉ループアーキテク
チャに対応する。閉ループアーキテクチャのうちの1つ
は、低減された解像度でこの補償を実行し、他は、より
よい品質のためにDCT領域において元の解像度でこの
補償を実行する。
【0027】後により詳細に説明するように、図9の開
ループアーキテクチャは複雑性が低い。再構成ループ
も、DCT/IDCTブロックも、フレームストアも無
く、その品質は、低ピクチャ解像度およびビットレート
に対しては妥当である。このアーキテクチャは、インタ
ネットアプリケーションおよびソフトウェア実現に対し
て適している。図10の第1の閉ループアーキテクチャ
もまた、複雑性は中位である。それは、再構成ループ
と、IDCT/DCTブロックと、フレームストアと、
を含む。ここでは、低減された解像度領域におけるドリ
フト補償により品質を向上させることができる。図11
Aの第2の閉ループアーキテクチャは、複雑性が中位で
ある。それは、再構成ループと、IDCT/DCTブロ
ックと、フレームストアと、を含む。元の解像度領域に
おけるドリフト補償により品質を向上させることがで
き、その品質には、低減された解像度のフレームのアッ
プサンプリングが必要である。第3の閉ループアーキテ
クチャは、低減された解像度領域において取得される補
正信号を使用する。
【0028】この発明によるアーキテクチャをサポート
するために、本来ならば、低減された解像度で「混合(m
ixed)」モードでのマクロブロックのグループを有する
ことになるブロックを処理する、いくつかの追加の技術
もまた説明する。
【0029】ダウンサンプリングされる例えば4つのブ
ロックグループ(グループオブブロック、group of blo
cks)は、ダウンサンプリングされるブロックグループ
がイントラモードとインターモードとの両方において符
号化されるブロックを含む場合、「混合(mixed)」ブロ
ックとみなされる。MPEG規格では、Iフレームは、
イントラモードに従って符号化されたマクロブロックの
みを含み、Pフレームは、イントラモードおよびインタ
ーモードで符号化されたブロックを含むことができる。
これらモードは、特にダウンサンプリング中に考慮され
る必要があり、そうでなければ出力の品質が劣化する可
能性がある。
【0030】また、ドリフト補償とDCTベースのデー
タのアップサンプリングとのための方法を説明する。こ
れら方法は、アップサンプリング後の動作を適当にかつ
追加の変換ステップ無しに実行することができるよう
に、第2および第3の閉ループアーキテクチャに対して
有用である。
【0031】低減された空間解像度のトランスコーディ
ングのアプリケーション この発明の主なターゲットアプリケーションは、無線電
話、ページャおよび携帯情報端末等の低解像度ディスプ
レイを有する装置に対するデジタルテレビ(DTV)放
送とインタネットコンテンツの配信である。目下、DT
V放送およびDVD記録用の圧縮フォーマットとしてM
PEG−2が使用されており、インタネットによりMP
EG−1コンテンツが利用可能である。
【0032】移動体ネットワークによるビデオ送信用の
圧縮フォーマットとしてMPEG−4が採用されてきた
ため、この発明は、MPEG1/2コンテンツをより解
像度の低いMPEG−4コンテンツにトランスコードす
る方法を扱う。
【0033】図7は、この発明を使用するマルチメディ
アコンテンツ配信システム700の第1の実施例を示
す。システム700は、外部ネットワーク703を介し
てクライアント702に接続された適応サーバ701を
含む。特性として、クライアントは、小型ディスプレイ
を有するか、または低ビットレートチャネルによって接
続されている。従って、クライアント702に配信され
るいかなるコンテンツも解像度を低減する必要がある。
【0034】入力ソースマルチメディアコンテンツ70
4がデータベース710に格納される。コンテンツに
は、特徴抽出およびインデクシングプロセス720が行
われる。データベースサーバ740により、クライアン
ト702は、データベース710のコンテンツをブラウ
ズし、特定のコンテンツに対する要求を行うことができ
る。マルチメディアコンテンツの位置を確定するため
に、検索エンジン730を使用することができる。所望
のコンテンツの位置が確定された後、データベースサー
バ740は、この発明によるトランスコーダ750にマ
ルチメディアコンテンツを転送する。
【0035】トランスコーダ750は、ネットワークお
よびクライアントの特性を読取る。コンテンツの空間解
像度が、クライアントの表示特性より高い場合、この発
明による方法を使用して、コンテンツの解像度を低減す
ることによりクライアントの表示特性に一致させる。ま
た、ネットワークチャネル上のビットレートがコンテン
ツのビットレートより低い場合も、この発明を使用する
ことができる。
【0036】図8は、コンテンツ配信システム800の
第2の実施例を示す。システム800は、ローカル「ホ
ーム」ネットワーク801と、外部ネットワーク703
と、放送ネットワーク803と、図7で説明したような
適応サーバ701と、を有する。このアプリケーション
では、高品質入力ソースコンテンツ804を、放送ネッ
トワーク803、例えばケーブル、地上波または衛星を
介してホームネットワーク801に接続されたクライア
ント805に転送することができる。コンテンツは、セ
ットトップボックスまたはゲートウェイ820によって
受信され、ローカルメモリまたはハードディスクドライ
ブ(HDD)830に格納される。受信されたコンテン
ツは、ホーム内のクライアント805に配信することが
可能である。更に、コンテンツを、フル解像度のコンテ
ンツを復号化/表示する能力を有していないあらゆるク
ライアントに適応するためにトランスコードする850
ことができる。これは、高品位テレビ(high-definitio
n)(HDTV)ビットストリームが標準品位テレビセ
ットに対して受信された場合である可能性がある。従っ
て、コンテンツは、ホーム内のクライアントの能力を満
足するようトランスコードされなければならない。
【0037】更に、HDD830に格納されるコンテン
ツに対するアクセスが、外部ネットワーク802を介し
て低解像度の外部クライアント806によって望まれる
場合もまた、トランスコーダ850を使用して、このク
ライアントに対し低解像度マルチメディアコンテンツを
配信することができる。
【0038】基本的な方法の分析 種々の複雑性および品質を有するトランスコーダを設計
するために、図4の方法によって生成される信号を更に
説明し分析する。式における表記法に関し、小文字変数
は、空間領域信号を示し、大文字変数は、DCT領域に
おける等価な信号をあらわす。変数の下付き文字は時間
を示し、1に等しい上付き文字はドリフトを有する信号
を示し、2に等しい上付き文字はドリフトのない信号を
示す。ドリフトは、再量子化、動きベクトル打切りまた
はダウンサンプリング等の損失の多いプロセスによって
もたらされる。ドリフト補償の方法については後述す
る。
【0039】Iフレーム Iフレームに対する動き補償は無い、すなわち
【数1】 であるため、信号はダウンサンプリングされ410、
【数2】 となる。そして、エンコーダ120において、
【数3】 となる。
【0040】信号g2 nは、DCT440が施され、その
後量子化パラメータQ2を用いて量子化される450。
量子化された信号coutは、可変長符号化され460、
トランスコードされたビットストリーム402に書込ま
れる。エンコーダにおける動き補償ループの一部とし
て、coutは逆量子化され470、IDCT480が施
される。低減された解像度の参照信号y2 n481は、将
来のフレーム予測のための参照信号としてフレームバッ
ファ490に格納される。
【0041】Pフレーム Pフレームの場合、恒等式
【数4】 により、再構成されたフル解像度ピクチャがもたらされ
る。Iフレームと同様に、この信号はその後、式(2)
によりダウンコンバートされる。そして、
【数5】 に従って、低減された解像度の残差が生成される。それ
は、等価に、
【数6】 として表現される。
【0042】式(6)によって与えられる信号は、この
発明によって説明するアーキテクチャが近似を求める参
照信号を表す。この参照信号を生成する際の複雑性は高
く、大幅な複雑性の低減を達成する一方で、品質を近似
させることが望ましい、ということが強調されなければ
ならない。
【0043】開ループアーキテクチャ 近似値
【数7a】
【数7b】 が与えられると、式(6)における低減された解像度の
残差信号は、
【数8】 として表される。上記式は、図9に示すトランスコーダ
900の開ループアーキテクチャを示唆している。
【0044】トランスコーダ900では、入力ビットス
トリーム901信号は、可変長復号化される910こと
により、逆量子化DCT係数911とフル解像度動きベ
クトルmvf901とを生成する。フル解像度動きベク
トルは、MVマッピング920によって低減された解像
度の動きベクトルmvr903にマッピングされる。量
子化DCT係数911は、量子化器Q1930を用いて
逆量子化され、信号E1 n931をもたらす。そして、こ
の信号は、後により詳細に説明するようにブロックグル
ーププロセッサ1300に処理される。プロセッサ13
00の出力はダウンサンプリングされる950ことによ
り信号G2 n951をもたらす。ダウンサンプリング後、
信号は、量子化器Q2960によって量子化される。最
後に、低減された解像度の再量子化されたDCT係数お
よび動きベクトルは、可変長符号化され970、トラン
スコードされた出力ビットストリーム902に書込まれ
る。
【0045】ブロックグループプロセッサ1300の詳
細および好ましい実施の形態を後に説明するが、簡単
に、ブロックグループプロセッサの目的は、マクロブロ
ックの選択されたグループを前処理することにより、ダ
ウンサンプリングプロセス950が、サブブロックが異
なる符号化モード、例えばインターブロックとイントラ
ブロックとの両方を有するマクロブロックのグループを
生成しないことを確実にする、ということである。マク
ロブロック内の混合符号化モードは、いかなる既知のビ
デオ符号化規格によってもサポートされていない。
【0046】低減された解像度でのドリフト補償 式(7b)によって与えられる近似値のみが与えられる
と、式(6)の低減された解像度の残差信号は、
【数9】 として表される。上記式は、低減された解像度でドリフ
トを補償する、図10に示す閉ループアーキテクチャ1
000を示唆している。
【0047】このアーキテクチャでは、入力信号100
1は、可変長復号化1010されることにより、量子化
DCT係数1011とフル解像度動きベクトルmvf
012とをもたらす。フル解像度動きベクトル1012
は、MVマッピング1020によりマップされることに
より、解像度が低減された動きベクトルmvr1021
のセットをもたらす。量子化DCT係数は、量子化器Q
1によって逆量子化1030されることにより、信号E1
n1031をもたらす。そして、この信号は、ブロック
グループプロセッサ1300によって処理されダウンサ
ンプリング1050される。ダウンサンプリング105
0後、低減された解像度のドリフト補償信号1051
は、DCT領域において低解像度残差1052に加算1
060される。
【0048】信号1061は、空間量子化器Q2107
0によって量子化される。最後に、低減された解像度の
再量子化DCT係数1071と動きベクトル1021と
が可変長符号化1080されることにより、出力トラン
スコードビットストリーム1002が生成される。
【0049】低減された解像度のドリフト補償信号が生
成される元の参照フレームが、再量子化器残差G2 n10
71の逆量子化1090によって取得され、それはその
後、ダウンサンプリングされた残差G1 n1052から減
算1092される。この差分信号は、IDCT1094
によって処理され、フレームストア1091に格納され
ている先のマクロブロックの低解像度予測成分1096
に加算1095される。この新たな信号は、差分(y1
n-1−y2 n-1)1097を表し、現ブロックの低解像度
動き補償に対する参照として使用される。
【0050】格納された参照信号が与えられると、低解
像度動き補償1098が実行され、予測値はDCT10
99によって処理される。このDCT領域信号は、低減
された解像度のドリフト補償信号1051である。この
動作は、低解像度動きベクトルmvr1021のセット
を使用してマクロブロック毎に実行される。
【0051】元の解像度でのドリフト補償の第1の方法 近似値
【数10】 の場合、式(6)の低減された解像度の残差信号は、
【数11】 として表される。上記式は、元の解像度のビットストリ
ームでドリフトを補償する、図11に示す閉ループアー
キテクチャ1100を示唆している。
【0052】このアーキテクチャでは、入力信号110
1は、可変長復号化される1110ことにより量子化D
CT係数1111とフル解像度動きベクトルmvf11
12をもたらす。量子化DCT係数1111は、量子化
器Q1により逆量子化される1130ことにより、信号
1 n1131をもたらす。そして、この信号は、ブロッ
クグループプロセッサ1300によって処理される。ブ
ロックグループ処理1300後、DCT領域において残
差1141に対し元の解像度のドリフト補償信号115
1が加算される1160。そして、信号1162はダウ
ンサンプリングされ1150、量子化器Q2によって量
子化される1170。最後に、低減された解像度の再量
子化DCT係数1171と動きベクトル1121とが可
変長符号化され1180、トランスコードされたビット
ストリーム1102に書込まれる。
【0053】元の解像度のドリフト補償信号1151が
生成される元の参照フレームは、再量子化器残差G2 n
171の逆量子化1190によって生成され、それはそ
の後アップサンプリングされる1191。ここで、アッ
プサンプリング後、アップサンプリングされた信号は、
元の解像度の残差1161から減算される1192。こ
の差分信号は、IDCT1194によって処理され、先
のマクロブロックの元の解像度の予測成分1196に加
算される1195。この新たな信号は、差分(x1 n-1
2 n-1)1197を表し、元の解像度での現マクロブロ
ックの動き補償のための参照として使用される。
【0054】フレームバッファ1181に格納される参
照信号が与えられると、元の解像度の動き補償1198
が実行され、予測値はDCT1199によって処理され
る。このDCT領域信号は、元の解像度のドリフト補償
信号1151である。この動作は、元の解像度の動きベ
クトルmvf1121のセットを使用してマクロブロッ
ク毎に実行される。
【0055】元の解像度におけるドリフト補償の第2の
方法 図11Bは、図11Aの閉ループアーキテクチャの代替
実施の形態を示す。ここでは、再量子化器残差G2 n11
72の逆量子化1190の出力は、アップサンプリング
1191前に、低減された解像度の信号から減算される
1192。
【0056】元の解像度におけるドリフト補償の両アー
キテクチャは、ドリフト補償信号1151を生成する際
に動きベクトル近似値を使用しない。これは、アップサ
ンプリング1191の使用によって達成される。2つの
代替アーキテクチャは、主に、差分信号を生成するため
に使用される信号の選択が異なる。第1の方法では、差
分信号は、再量子化と解像度変換とによる誤差を表す
が、第2の方法での差分信号は、再量子化による誤差の
みを考慮する。
【0057】トランスコードされたビットストリームの
将来の復号化においてアップサンプリングされた信号が
考慮されないため、ドリフト補償信号における連続した
ダウンサンプリングとアップサンプリングとによって測
定されるいかなる誤差も排除することが妥当である。し
かしながら、2つの理由により、アップサンプリングは
まだ採用される。すなわち、フル解像度動きベクトル1
121を利用していかなる更なる近似をも避けるため
と、ドリフト補償信号が元の解像度であり、ダウンサン
プリング1150前に入力残差1161に加算する11
60ことができるようにするためである。
【0058】混合ブロックプロセッサ ブロックグループプロセッサ1300の目的は、選択さ
れたマクロブロックを前処理することにより、ダウンサ
ンプリングプロセスは、サブブロックが異なる符号化モ
ード、例えばインターブロックとイントラブロックとを
有するマクロブロックを生成しないことを確実にする、
ということである。マクロブロック内の混合符号化モー
ドは、いかなる既知のビデオ符号化規格によってもサポ
ートされていない。
【0059】図12は、トランスコーディング1203
後、低減された解像度のブロックグループ1202にな
ることができるマクロブロックのグループ1201の実
施例を示す。ここでは、3つのインターモードブロック
と1つのイントラモードブロックとがある。なお、イン
トラモードブロックの動きベクトル(MV)は0であ
る。特定のブロックグループが混合グループであるか否
かを決定することは、マクロブロックモードのみによっ
て決まる。ブロックグループプロセッサ1300は、低
減された解像度の単一のマクロブロック1202を形成
する4つのマクロブロック1201のグループを考慮す
る。言い換えれば、輝度成分に対し、MB(0)121
0は、低減された解像度のマクロブロック1202のサ
ブブロックb(0)1220に対応し、同様に、MB
(1)1211はb(1)1221に対応し、MB
(k)1212はb(2)1222に対応し、MB(k
+1)1213はb(3)1223に対応する。なお、
kは、元の解像度の行毎のマクロブロックの番号であ
る。輝度成分は、輝度モードと一貫する同様の方法で処
理される。
【0060】MBグループモードは、ブロックグループ
プロセッサ1300が特定のMBを処理すべきか否かを
判断する。ブロックグループは、グループが少なくとも
1つのイントラモードブロックと少なくとも1つのイン
ターモードブロックとを有する場合に処理される。マク
ロブロックが選択された後、そのDCT係数と動きベク
トルデータとに対し変更がなされる。
【0061】図13は、ブロックグループプロセッサ1
300のコンポーネントを示す。選択された混合ブロッ
クグループ1301に対し、ブロックグループプロセッ
サは、モードマッピング1310と、動きベクトル変更
1320と、DCT係数変更1330と、を実行するこ
とにより、出力非混合ブロック1302をもたらす。ブ
ロックグループ1301が識別されたとすると、マクロ
ブロックのモードは、すべてのマクロブロックが同じで
あるように変更される。これは、低減された解像度のブ
ロックにおける各サブブロックのモードを一致させるた
めに事前指定された戦略に従って行われる。
【0062】選択されたモードマッピングにより、MV
データにはその後、変更がなされる1320。対応する
モードマッピングに合致する可能な変更を、図14Aな
いし図14Cについて下に詳細に説明する。最後に、新
たなMBモードとMVデータとが共に与えられると、対
応するDCT係数もまたマッピングに合致するように変
更される1330。
【0063】図14Aに示すブロックグループプロセッ
サの第1実施の形態では、ブロックグループ1301の
MBモードは、モードマッピング1310によってイン
ターモードに変更される。従って、イントラブロックの
MVデータは、動きベクトル処理によって0にリセット
され、イントラブロックに対応するDCT係数もまた、
DCT処理1330によって0にリセットされる。この
ように、変換されたかかるサブブロックは、参照フレー
ムの対応するブロックからのデータを用いて複製され
る。
【0064】図14Bに示すブロックグループプロセッ
サの第2実施の形態では、混合ブロックグループのMB
モードは、マッピング1310によってインターモード
に変更される。しかしながら、第1の好ましい実施の形
態とは対照的に、イントラMBのMVデータが予測され
る。予測は、テクスチャと動きデータとの両方を含むこ
とができる、近傍ブロックのデータに基づく。この予測
された動きベクトルに基づいて、変更されたブロックの
新たな残差が計算される。最終ステップ1320は、イ
ンターDCT係数をイントラDCT係数にリセットす
る。
【0065】図14Cに示す第3の実施の形態では、ブ
ロックグループのMBモードは、イントラモードに変更
される1310。この場合、低減された解像度のマクロ
ブロックに関連する動き情報は無く、従って、すべての
関連する動きベクトルデータは0にリセットされる13
20。これは、近傍ブロックの動きベクトルがこのブロ
ックの動きから予測されるため、トランスコーダで実行
する必要がある。デコーダにおいて適当な再構成を確実
にするために、ブロックグループのMVデータは、トラ
ンスコーダにおいてゼロにリセットされなければならな
い。最終ステップ1330は、上述したようにインター
DCT係数に取って代るためにイントラDCT係数を生
成する。
【0066】なお、上述した第2および第3の実施の形
態を実現するために、フル解像度に再構成する復号化ル
ープを使用することができる、ということは留意されな
ければならない。この再構成されたデータを、DCT係
数をイントラモードとインターモードかまたはインター
モードとイントラモードとの間で変換するための参照と
して使用することができる。しかしながら、かかる復号
化ループの使用は必要ではない。他の実現では、ドリフ
ト補償ループ内で変換を実行することができる。
【0067】動きの量がわずかであり詳細が低レベルで
あるフレームのシーケンスの場合、図14Aの複雑性の
低い戦略を使用することができる。そうでない場合、図
14bかまたは図14cの等しく複雑な戦略が使用され
るべきである。図14cの戦略は最良の品質を提供す
る。
【0068】ブロック処理を伴うドリフト補償 ブロックグループプロセッサ1300を、ドリフトを制
御または最小化するために使用することも可能である、
ということは留意されなければならない。イントラ符号
化されたブロックにはドリフトがもたらされないため、
インター符号化ブロックのイントラ符号化への変換によ
り、ドリフトの悪影響が低減される。
【0069】図14Cの第1ステップ1350として、
圧縮ビットストリームにおけるドリフトの量が測定され
る。閉ループアーキテクチャでは、1092および11
92によって生成される差分信号かまたは1091およ
び1191において格納されるドリフト補償信号のエネ
ルギに従って、ドリフトを測定することができる。信号
のエネルギを計算することは、周知の方法である。計算
されるエネルギは、再量子化、ダウンサンプリングおよ
び動きベクトル打切りを含む、あらゆる近似の根拠とな
る。
【0070】開ループアーキテクチャにも適用可能であ
るドリフトを計算する他の方法は、打切られた動きベク
トルによってもたらされる誤差を推定する。解像度が低
減されると、元の解像度の半画素動きベクトルが大きい
再構成誤差をもたらす、ということは周知である。フル
画素動きベクトルはまだ半画素位置に正確にマッピング
されることが可能であるため、それらにはかかる誤差が
もたらされない。この場合、ドリフトを測定する1つの
可能性は、半画素動きベクトルの割合を記録することで
ある。しかしながら、動きベクトル近似の悪影響は、コ
ンテンツの複雑性によって決まるため、他の可能性は、
測定されたドリフトが、半画素動きベクトルを有するブ
ロックに関連する残差成分の関数である、ということで
ある。
【0071】ドリフトを測定するために差分信号のエネ
ルギと動きベクトルデータとを使用する方法を、組合せ
て使用することができ、またフレームのサブ領域に亙っ
て考慮することも可能である。フレームのサブ領域を考
慮することは、ドリフト補償方法によって最も利益を得
るマクロブロックの位置を識別することができるため有
利である。これら方法を組合せで使用するために、ドリ
フトは、差分信号のエネルギか、または元の解像度の半
画素動きベクトルを有するマクロブロックに対するドリ
フト補償信号によって測定される。
【0072】第2のステップとして、ドリフトの測定さ
れた値は、ブロックグループプロセッサ1300に対す
る入力として使用される「イントラリフレッシュレー
ト」1351に変換される。イントラ符号化ブロックの
割合を制御することは、エラー回復力のある送信に対す
るビデオの符号化のための従来技術において考慮されて
きた。例えば、Stuhlmuller等による「Analysis of Vid
eo Transmission over Lossy Channels」、Journal of
Selected Areas of Communications、2000を参照のこ
と。その論文では、受信機からエンコーダへのバックチ
ャネルが、送信チャネルによってもたらされる損失の量
を通信するものと仮定され、イントラ符号化ブロックの
符号化は、予測符号化方式においてデータが喪失するこ
とによる誤差伝播を防止するために、ソースから直接実
行される。
【0073】対照的に、この発明は、すでに符号化され
たビデオに対し圧縮領域において新たなイントラブロッ
クを生成し、インターモードからイントラモードへの変
換は、ブロックグループプロセッサ1300によって達
成される。ドリフトがドリフト閾値量を超える場合、イ
ンターモードブロックをイントラモードブロックに変換
するために、図14cのブロックグループプロセッサ1
300が呼出される。この場合、変換は、一定の事前指
定されたイントラリフレッシュレートで実行される。代
替的に、変換を、測定されたドリフトの量に比例するイ
ントラリフレッシュレートで行うことができる。また、
イントラリフレッシュレートとイントラおよびインター
ブロックを符号化するために使用される量子化器との間
で適当なトレードオフを行うために、信号のレート歪み
特性を考慮することができる。
【0074】この発明が圧縮領域において新たなイント
ラブロックを生成することは留意されなければならず、
ドリフト補償のこの形態を、解像度低減の有無に関らず
あらゆるトランスコーダで実行することができる。
【0075】ダウンサンプリング この発明によるトランスコーダにより、あらゆるダウン
ランプリング方法を使用することができる。しかしなが
ら、好ましいダウンサンプリング方法は、引用をもって
開示内容がすべて本明細書内に包含されたものとする、
Sun等に対し1998年11月10日に発行された米
国特許第5,855,151号、「Method and apparat
us for down-converting a digital signal」による。
【0076】このダウンランプリング方法の概念を、図
15Aに示す。グループは、4つの2N×2NDCTブロ
ック1501を含む。すなわち、グループのサイズは、
N+ 1×2N+1である。「周波数合成」またはフィルタリ
ング1510が、ブロックグループに適用されることに
より、1つの2N×2NDCTブロック1511が生成さ
れる。この合成ブロックから、ダウンサンプリングされ
たDCTブロック1512を抽出することができる。
【0077】この動作を、2D演算を使用してDCT領
域について説明したが、別個の1Dフィルタを使用して
実行することも可能である。また、その演算を、空間領
域において完全に実行することも可能である。等価な空
間領域フィルタを、引用をもって開示内容がすべて本明
細書内に包含されたものとする、Vetro等により199
8年3月6日に出願された米国特許出願第09/03
5,969号、「Threelayer scalable decoder and me
thod of decoding」に述べられている方法を使用するこ
とにより、導出することができる。
【0078】この発明によるトランスコーダにおいてダ
ウンサンプリング方法を使用する主な利点は、マクロブ
ロックのサブブロックの正確な次元が直接取得される、
例えば、4つの8×8DCTブロックから1つの8×8
ブロックを形成することができる、ということである。
一方、ダウンサンプリングの代替的な従来技術による方
法は、マクロブロックの出力サブブロックの必要な次元
と等しくない次元のダウンサンプリングされたデータを
もたらし、例えば、4つの8×8DCTブロックから、
4つの4×4DCTブロックが取得される。そして、1
つの8×8DCTブロックを構成するために追加のステ
ップが必要とされる。
【0079】上記フィルタは、アップサンプリングを必
要とする、図11に示すアーキテクチャを効率的に実現
するための有用なコンポーネントである。より一般的
に、ここで導出されるフィルタを、解像度低減またはド
リフト補償の有無に関らず、アップサンプリングされた
DCTデータに対する算術演算を必要とするあらゆるシ
ステムに適用することができる。
【0080】アップサンプリング 従来技術によるアップサンプリングのあらゆる手段を、
この発明において使用することができる。しかしなが
ら、米国特許出願「Three layer scalable decoder and
method of decoding」(上記参照)において、Vetro等
は、最適なアップサンプリング方法はダウンサンプリン
グの方法によって決まると述べている。従って、ダウン
サンプリングフィルタxdに対応するアップサンプリン
グフィルタxuを使用することが好ましく、その場合、
2つのフィルタ間の関係は、
【数12】 によって与えられる。
【0081】上記式から導出されるフィルタに関連して
2つの問題がある。第1に、DCTフィルタは反転可能
でないため、それらフィルタは空間領域フィルタでしか
適用可能でない。しかしながら、対応する空間領域フィ
ルタを導出し、その後DCT領域に変換することができ
るため、これは小さい問題である。
【0082】一方、第2の問題は、このように取得され
るアップサンプリングフィルタが、図15Bに示すプロ
セスに対応する、ということである。このプロセスで
は、例えば、2N×2Nブロック1502が1つの2N+1
×2N+1ブロック1530にアップサンプリングされる
1520。アップサンプリングが空間領域において完全
に実行される場合、問題はない。しかしながら、アップ
サンプリングがDCT領域で実行される場合、扱うべき
N+1×2N+1DCTブロックがあり、すなわち1つのD
C成分がある。これは、アップサンプリングされたDC
Tブロックが標準MBフォーマットである、すなわち、
Nが4である場合の4つの2N×2NDCTブロックであ
ることを必要とする動作には、適当ではない。すなわ
ち、アップサンプリングされたブロックは、元のブロッ
クと同じフォーマットまたは次元を有し、元のブロック
より非常に多い。
【0083】DCT領域においてアップサンプリングす
る上記方法は、この発明において述べるトランスコーダ
での使用には適していない。図11Aにおいて、アップ
サンプリングされたDCTデータは、混合ブロックプロ
セッサ1300から出力されるDCTデータから減算さ
れる。2つのブロックの2つのDCTデータは、同じフ
ォーマットを有していなければならない。従って、図1
5Cに示されているアップサンプリングを実行すること
ができるフィルタが必要である。ここでは、1つの2N
×2Nブロック1502が、4つの2N×2Nブロック1
550にアップサンプリングされる1540。かかるフ
ィルタは、今まで考慮されておらず、周知の従来技術に
おいて存在しないため、1Dの場合の式は、以下のよう
に導出される。以下の式における表記法に関して、小文
字の変数は空間領域信号を示し、大文字変数はDCT領
域における等価な信号を表す。
【0084】図16に示すように、C1601は、DC
T領域においてアップサンプリングされるDCTブロッ
クを表し、c1602は、空間領域における等価なブロ
ックを表す。2つのブロックは、N−ptDCTおよび
IDCT1603の定義を通して互いに関連する。Rao
およびYipによる「Discrete Cosine Transform:Algorit
hms,Advantages and Applications」、Academic、Bosto
n、1990を参照のこと。また便宜上、式を下に示す。
【0085】DCT定義は、
【数13】 であり、IDCT定義は、
【数14】 であって、
【数15】 である。
【0086】上記式が与えられると、ブロックE161
0は、Xu1611でのCのフィルタリングに基づいて
アップサンプリングされたDCTブロックを表し、e
は、式(12)で与えられたxu1621でのcのフィ
ルタリングに基づいてアップサンプリングされた空間領
域ブロックを表す。なお、eおよびEは、2N−ptD
CT/IDCT1630を通して関連する。フィルタリ
ングされた入力の入出力関係は、
【数16a】
【数16b】 によって与えられる。
【0087】図16に示すように、所望のDCTブロッ
クは、A1611およびB1612によって示される。
この導出の目的は、Cから直接AおよびBをそれぞれ計
算するために使用することができるフィルタXca164
1およびXcb1642を導出することである。
【0088】第1のステップとして、式(14)が式
(16b)に置換される。結果の表現は、DCT入力C
の関数としての空間領域出力eであり、それは、
【数17】 によって与えられる。式(17)を使用してCについて
AおよびBを表すために、a、bおよびe間の空間領域
関係は、
【数18】 であり、上記iは空間領域インデクスを示す。aに対す
るDCT領域表現は、
【数19】 によって与えられる。
【0089】式(17)〜(19)を使用することによ
り、
【数20】 が得られ、それは、等価に、
【数21】 として表され、この場合、
【数22】 となる。
【0090】同様に、
【数23】 であり、それは、等価に、
【数24】 として表され、この場合、
【数25】 となる。
【0091】そして、上記フィルタを、所与の次元の1
つのブロックを各々が元のブロックと同じ次元を有する
より多くのブロックにアップサンプリングするために使
用することができる。より一般的には、ここで導出され
るフィルタを、アップサンプリングされたDCTデータ
に対する算術演算を必要とするあらゆるシステムに適用
することができる。
【0092】式(22)および(25)によって与えら
れるフィルタを実現するために、kが出力画素のインデ
クスであり、qが入力画素のインデクスである場合、各
表現は、フィルタタップのk×q行列を提供する。1D
データの場合、出力画素は、行列乗算として計算され
る。2Dデータの場合、2つのステップがとられる。ま
ず、データは、第1の方向、例えば水平にアップサンプ
リングされる。そして、水平にアップサンプリングされ
たデータは、第2の方向、例えば垂直にアップサンプリ
ングされる。アップサンプリングの方向の順序は、結果
にいかなる影響を与えることもなく逆転させることがで
きる。
【0093】水平アップサンプリングの場合、ブロック
の各行は独立して操作され、N次元入力ベクトルとして
扱われる。各入力ベクトルは、式(21)および(2
4)に従ってフィルタリングされる。このプロセスの出
力は、2つの標準DCTブロックとなる。垂直アップサ
ンプリングの場合、各列は、独立して操作され、この場
合もN次元入力ベクトルとして扱われる。水平アップサ
ンプリングと同様に、各入力ベクトルは、式(21)お
よび(24)に従ってフィルタリングされる。このプロ
セスの出力は、図15Cに示すように4つの標準DCT
ブロックとなる。
【0094】構文変換この発明によるトランスコーダの
上記アプリケーションについて述べたように、この発明
の重要なアプリケーションのうちの1つは、MPEG−
2からMPEG−4への変換である。これまでは、主
に、より低い空間解像度にトランスコードする場合のド
リフト補償に使用されるアーキテクチャと、より低い空
間解像度への変換をサポートする追加の技術と、に対し
て焦点が合せられていた。
【0095】しかしながら、標準符号化方式間の構文変
換は、別の重要な問題である。これは、すでに係属中の
特許出願によって述べられていると思われるため、この
部分に対しこれ以上詳述しない。
【0096】この発明を、好ましい実施の形態を用いて
説明したが、他のあらゆる適応および変更を、この発明
の精神および範囲内で行うことが可能である、というこ
とが理解されなければならない。従って、併記の特許請
求の範囲の目的は、この発明の真の精神および範囲内に
あるかかる変形および変更のすべてを包含するというこ
とである。
【図面の簡単な説明】
【図1】 従来技術によるカスケード接続されたトラン
スコーダのブロック図である。
【図2】 ビットレート低減のための従来技術による開
ループトランスコーダのブロック図である。
【図3】 ビットレート低減のための従来技術による閉
ループトランスコーダのブロック図である。
【図4】 空間解像度低減のための従来技術によるカス
ケード接続されたトランスコーダのブロック図である。
【図5】 空間解像度低減のための従来技術による開ル
ープトランスコーダのブロック図である。
【図6】 従来技術による動きベクトルマッピングのブ
ロック図である。
【図7】 この発明によりビットストリームを低減され
た空間解像度にトランスコードする第1のアプリケーシ
ョンのブロック図である。
【図8】 この発明によりビットストリームを低減され
た空間解像度にトランスコードする第2のアプリケーシ
ョンのブロック図である。
【図9】 この発明による空間解像度低減のための開ル
ープトランスコーダのブロック図である。
【図10】 この発明による低減された解像度における
ドリフト補償を伴う空間解像度低減のための第1の閉ル
ープトランスコーダのブロック図である。
【図11A】 この発明による元の解像度におけるドリ
フト補償を伴う空間解像度低減のための第2の閉ループ
トランスコーダのブロック図である。
【図11B】 この発明による元の解像度におけるドリ
フト補償を伴う空間解像度低減のための第3の閉ループ
トランスコーダのブロック図である。
【図12】 マクロブロックモードと、DCT係数デー
タと、対応する動きベクトルデータと、を含むマクロブ
ロックのグループの実施例である。
【図13】 この発明によるブロックグループプロセッ
サのブロック図である。
【図14A】 この発明によるブロックグループ処理の
第1の方法のブロック図である。
【図14B】 この発明によるブロックグループ処理の
第2の方法のブロック図である。
【図14C】 この発明によるブロックグループ処理の
第3の方法のブロック図である。
【図15A】 DCTまたは空間領域におけるダウンサ
ンプリングの従来技術による概念を示す。
【図15B】 DCTまたは空間領域における従来技術
によるアップサンプリングのブロック図である。
【図15C】 この発明によるDCT領域におけるアッ
プサンプリングのブロック図である。
【図16】 この発明によるDCT領域におけるアップ
サンプリングの図である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 アンソニー・ヴェトロ アメリカ合衆国、ニューヨーク州、ステー トン・アイランド、レジス・ドライブ 113 Fターム(参考) 5C059 KK41 LB05 MA00 MA05 MA23 MC11 ME01 NN01 SS10 UA02 UA33 UA38 5J064 AA01 AA02 BA08 BA16 BB01 BB03 BC12 BC16 BC24 BC25 BD02

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 圧縮ビットストリームをアップサンプリ
    ングする方法であって、 該圧縮ビットストリームを部分的に復号化することによ
    り複数のマクロブロックをもたらし、各マクロブロック
    が該マクロブロックの所定次元に従うDCT係数を有す
    るものであることと、 複数のDCTフィルタを各マクロブロックの該DCT係
    数に適用することにより、各マクロブロックの複数のア
    ップサンプリングされたマクロブロックを、各フィルタ
    によって1つのアップサンプリングされたマクロブロッ
    クが生成されるように生成し、各アップサンプリングさ
    れたマクロブロックが前記所定次元を有するものである
    ことと、 を含む方法。
  2. 【請求項2】 前記マクロブロックと各アップサンプリ
    ングされたマクロブロックとは、行および列に配置され
    た2個の画素を有する請求項1記載の方法。
  3. 【請求項3】 2つのDCTフィルタを各マクロブロッ
    クの画素の前記行に適用することにより、2つの水平に
    配置されたアップサンプリングされたマクロブロックを
    生成することと、 前記2つのDCTフィルタを水平に配置されたアップサ
    ンプリングされたマクロブロックの各々の画素の前記列
    に適用することにより、合計4つのアップサンプリング
    されたマクロブロックに対し水平に配置されたアップサ
    ンプリングされたマクロブロックの各々について2つの
    垂直に配置されたアップサンプリングされたブロックを
    生成することと、 を更に含む請求項1記載の方法。
  4. 【請求項4】 前記アップサンプリングされたマクロブ
    ロックの画素は、行列乗算によって確定される請求項3
    記載の方法。
  5. 【請求項5】 各フィルタは、kが出力画素のインデク
    スであり、qが入力画素のインデクスである場合、フィ
    ルタタップのk×q行列の形態である請求項4記載の方
    法。
  6. 【請求項6】 圧縮ビットストリームをアップサンプリ
    ングする装置であって、 該圧縮ビットストリームを部分的に復号化することによ
    り複数のマクロブロックをもたらす手段であって、各マ
    クロブロックが該マクロブロックの所定次元に従うDC
    T係数を有するものである手段と、 複数のDCTフィルタを各マクロブロックの該DCT係
    数に適用することにより、各マクロブロックの複数のア
    ップサンプリングされたマクロブロックを、各フィルタ
    によって1つのアップサンプリングされたマクロブロッ
    クが生成されるように生成する手段であって、各アップ
    サンプリングされたマクロブロックが前記所定次元を有
    するものである手段と、を具備する装置。
JP2002135820A 2001-05-11 2002-05-10 圧縮ビットストリームをアップサンプリングする方法および装置 Expired - Fee Related JP4209134B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/853801 2001-05-11
US09/853,801 US6898241B2 (en) 2001-05-11 2001-05-11 Video transcoder with up-sampling

Publications (2)

Publication Number Publication Date
JP2003061091A true JP2003061091A (ja) 2003-02-28
JP4209134B2 JP4209134B2 (ja) 2009-01-14

Family

ID=25316947

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002135820A Expired - Fee Related JP4209134B2 (ja) 2001-05-11 2002-05-10 圧縮ビットストリームをアップサンプリングする方法および装置

Country Status (2)

Country Link
US (1) US6898241B2 (ja)
JP (1) JP4209134B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1429564A4 (en) * 2001-08-28 2012-07-25 Ntt Docomo Inc MOVING IMAGE AND TRANSMISSION SYSTEM, MOVE IMAGE AND TRANSMISSION METHOD, AND CODING DEVICE, DECODING DEVICE, CODING METHOD, DECODING METHOD, AND PROGRAM THEREFOR
US6917713B2 (en) * 2002-05-29 2005-07-12 Koninklijke Philips Electronics N.V. System and method for enhancing videos from drift-free scalable bitstream
US20040131122A1 (en) * 2002-12-09 2004-07-08 Kei Kudo Encoding device and encoding method
US7881546B2 (en) * 2004-09-08 2011-02-01 Inlet Technologies, Inc. Slab-based processing engine for motion video
JP2006232093A (ja) * 2005-02-24 2006-09-07 Honda Motor Co Ltd 車両の燃料充填部構造
US8023569B2 (en) 2005-12-15 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for block-based residual upsampling
US20100271554A1 (en) * 2007-09-10 2010-10-28 Volker Blume Method And Apparatus For Motion Estimation In Video Image Data
US9131007B2 (en) * 2009-05-19 2015-09-08 Vitrual World Computing, Inc. System and method for dynamically transcoding data requests
US8902973B2 (en) * 2011-04-05 2014-12-02 Dialogic Corporation Perceptual processing techniques for video transcoding
CN110418197B (zh) * 2018-05-11 2022-03-08 腾讯科技(深圳)有限公司 一种视频转码方法、装置和计算机可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3466032B2 (ja) * 1996-10-24 2003-11-10 富士通株式会社 動画像符号化装置および復号化装置
WO1999057673A2 (en) * 1998-04-30 1999-11-11 Koninklijke Philips Electronics N.V. Transcoding of a data stream
US6249549B1 (en) * 1998-10-09 2001-06-19 Matsushita Electric Industrial Co., Ltd. Down conversion system using a pre-decimation filter
US6310915B1 (en) * 1998-11-20 2001-10-30 Harmonic Inc. Video transcoder with bitstream look ahead for rate control and statistical multiplexing
US6647061B1 (en) * 2000-06-09 2003-11-11 General Instrument Corporation Video size conversion and transcoding from MPEG-2 to MPEG-4

Also Published As

Publication number Publication date
US6898241B2 (en) 2005-05-24
JP4209134B2 (ja) 2009-01-14
US20020181587A1 (en) 2002-12-05

Similar Documents

Publication Publication Date Title
EP1257127B1 (en) Video transcoder with spatial resolution reduction
US7170932B2 (en) Video transcoder with spatial resolution reduction and drift compensation
JP4163006B2 (ja) ドリフト補正を備えたビデオトランスコーダ
US7330509B2 (en) Method for video transcoding with adaptive frame rate control
US6434197B1 (en) Multi-functional transcoder for compressed bit streams
US6081295A (en) Method and apparatus for transcoding bit streams with video data
US7110451B2 (en) Bitstream transcoder
AU2007231799B8 (en) High-performance video transcoding method
US20120076203A1 (en) Video encoding device, video decoding device, video encoding method, and video decoding method
US20060280372A1 (en) Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction
KR20060109290A (ko) 화상 복호 장치 및 화상 복호 방법과 화상 복호 프로그램
JP2001145113A (ja) 画像情報変換装置及び方法
US20060250520A1 (en) Video coding method and apparatus for reducing mismatch between encoder and decoder
US20050135486A1 (en) Transcoding method, medium, and apparatus
US8243798B2 (en) Methods and apparatus for scalable video bitstreams
JP4209134B2 (ja) 圧縮ビットストリームをアップサンプリングする方法および装置
JP4660408B2 (ja) 符号化方法
JP4318019B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
WO2006132509A1 (en) Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction
Li et al. A fast downsizing video transcoder based on H. 264/AVC standard
US20120002720A1 (en) Video encoder with video decoder reuse and method for use therewith
Wu Reducing inverse quantization numbers for video transcoding
JP2003219430A (ja) ビデオ信号のフレームのシーケンスの圧縮されたビットストリームを低減された空間解像度にトランスコードするための方法および閉ループトランスコーダ
Joch H. 26l: analysis and real-time encoding algorithms
Karunaratne Pre-processing and post-processing methods for video compression

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080624

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080924

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081021

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081022

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121031

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131031

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees