JP4313543B2 - 部分的に復号された入力ビットストリームのマクロブロック群を変換符号化する方法及び装置 - Google Patents
部分的に復号された入力ビットストリームのマクロブロック群を変換符号化する方法及び装置 Download PDFInfo
- Publication number
- JP4313543B2 JP4313543B2 JP2002132740A JP2002132740A JP4313543B2 JP 4313543 B2 JP4313543 B2 JP 4313543B2 JP 2002132740 A JP2002132740 A JP 2002132740A JP 2002132740 A JP2002132740 A JP 2002132740A JP 4313543 B2 JP4313543 B2 JP 4313543B2
- Authority
- JP
- Japan
- Prior art keywords
- macroblock
- mode
- dct
- resolution
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 83
- 239000013598 vector Substances 0.000 claims description 78
- 230000002829 reductive effect Effects 0.000 claims description 41
- 238000013507 mapping Methods 0.000 claims description 25
- 230000009467 reduction Effects 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 15
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 230000000873 masking effect Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 16
- 230000006835 compression Effects 0.000 description 14
- 238000007906 compression Methods 0.000 description 14
- 238000013139 quantization Methods 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- OVSKIKFHRZPJSS-UHFFFAOYSA-N 2,4-D Chemical compound OC(=O)COC1=CC=C(Cl)C=C1Cl OVSKIKFHRZPJSS-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000012237 artificial material Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4084—Scaling of whole images or parts thereof, e.g. expanding or contracting in the transform domain, e.g. fast Fourier transform [FFT] domain scaling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、一般にビットストリームのトランスコーディング(transcoding)もしくは変換符号化の技術分野に係わり、特に、ビデオビットストリームのトランスコーディング、即ち符号変換中に空間解像度を縮減する技術に関する。殊に、本発明は、空間解像度の縮減機能を有するビデオトランスコーダ(変換符号化器或いは変換符号化装置)に関する。
【0002】
[発明の背景]
ビデオ圧縮は、少ない記憶、ネットワーク及びプロセッサ資源で画像情報の記憶、伝送及び処理を可能にする。最も広範に用いられているビデオ圧縮規格には、動画の記憶及び検索のためのMPEG−1、ディジタルテレビジョン用のMPEG−2及びビデオ会議用のH.263がある。これ等については、ISO/IEC 11172-2: 1993 「Information Technology - Coding of Moving Pictures and Associated Audio for Digital Storage Media up to about 1.5 Mbit/s Part 2: Video」、D. LeGallの「MPEG: A Video Compression Standard for Multimedia Applications」、 Communications of the ACM, Vol. 34, No. 4, pp. 46-58, 1991, ISO/IEC 13818-2: 1996, 「Information Technology Generic Coding of Moving Pictures and Associated Audio Information Part 2: Video」、1994, ITU-T SG XV, DRAFT H. 263, 「Video Coding for Low Bitrate Communication」1996, ITU-T SG XVI, DRAFT13 H. 263 + Q15-A-60 rev. 0, 「Video Coding for Low Bitrate Communication」1997を参照されたい。
【0003】
上述の規格は、主に画像或いはフレームの空間圧縮並びにフレームシーケンスの空間及び時間圧縮を取り扱う比較的低レベルの仕様である。共通の特徴として、これら規格はフレームベースで圧縮を行う。これら規格によれば、広範囲の用途に対して高い圧縮率を達成することができる。
【0004】
マルチメディア用途のためのMPEG−4のような新たなビデオ符号化規格(ISO/IEC 14496-2: 1999, 「Information technology-coding of audio/visual objects, Part 2: Visual」、参照)の出現で、任意の形状のオブジェクトを別個のビデオオブジェクト平面(VOP)として符号化したり或いは復号することが可能である。この場合オブジェクトとしては、ビジュアルオブジェクト、オーディオオブジェクト、自然オブジェクト、人工オブジェクト、原始オブジェクト、混成オブジェクト或いはそれらの組み合わせからなるオブジェクトがある。また、無線チャンネルのようなエラーの起こりがちなチャンネルを介して堅実な(即ち、ロバストな)伝送を可能にするために相当量の耐エラー対策が組み込まれている。
【0005】
新たに出現したMPEG−4規格は、インタラクチブビデオのようなマルチメディア用途、即ち、自然及び人工材料が統合され、アクセスが普遍(一方的ではない)であるマルチメディアへの適用を可能にするように企図されている。ビデオ伝送と関連して、ネットワーク上での帯域幅の大きさを減少もしくは縮減するのに圧縮規格が必要とされる。この場合ネットワークは無線でもインターネットでも良い。いずれにせよ、ネットワークの容量には制限があり、従って、少ない資源に対する競合は最小に抑止すべきである。
【0006】
装置がコンテンツをロバストに、即ち堅実に伝送したりコンテンツの品質を利用可能なネットワーク資源に適合することを可能にするシステム及び方法に関して多大な努力が払われている。これと関連し、コンテンツをエンコードもしくは符号化する場合、低ビットレート或いは低解像度でネットワークを介しビットストリームを伝送できるようにするために先ず前に該ビットストリームを復号(デコーディング)する必要がある場合がある。
【0007】
これは、図1に示すように、変換符号化器(トランスコーダ)100により達成することができる。最も単純な構成において、該変換符号化器100は、カスケード接続されたデコーダ(復号器)110及びエンコーダ(符号化器)120を有する。圧縮された入力ビットストリーム101は入力ビット・レート
【数4】
で完全に復号され、次いで、再符号化されビットレート
【数5】
の出力ビットストリーム103が生成される。通常、出力ビットレートは入力ビットレートよりも小さい。しかしながら、実際例では、復号されたビットストリームの再符号化が非常に複雑であるために変換符号化器で完全な復号化及び完全な再符号化は行われていない。
【0008】
MPEG−2規格の変換符号化(トランスコーディング)に関する初期の研究として、Sun外により公表された論文「Architectures for MPEG compressed bitstream scaling」、IEEE Transactions on Circuits and Systems for Video Technology(1996年4月)がある。この論文には、複雑性及びアーキテクチャの変更に伴い4つのレート縮減方法が記述されている。
【0009】
図2は、開ループアーキテクチャと称する第1の方法例200を示している。このアーキテクチャにおいては、入力ビットストリーム201は部分的にのみ復号されるだけである。具体的に述べると、入力ビットストリームのマクロブロックは可変長復号(VLD)210及び微細量子化器
【数6】
での逆量子化220を受け、それにより離散コサイン変換(DCT)係数が生成される。所与の所望の出力ビット・レート202に対し、DCTブロックは、量子化器230の粗レベル量子化
【数7】
で再量子化される。これら再量子化されたブロックは、次いで240で示すように可変長符号化(VLC)され、その結果として低ビットレートで新たな出力ビットストリーム203が形成される。この方式は、図1に示した方式よりも相当に単純である。その理由は、運動ベクトルが再使用され、逆DCT演算が不必要であるからである。ここで、
【数8】
及び
【数9】
の選択は厳密にビットストリームのビットレート特性に依存する。場合によりあり得る他の要因、例えばビットストリームの空間特性のようなファクタ(要因)は考慮されない。
【0010】
図3は、第2の方法例300を示す。この方法は閉ループアーキテクチャと称されている。この方法においては、入力ビデオビットストリームが再び部分的に復号され、即ち、入力ビットストリームのマクロブロックが可変長復号(VLD)310並びに量子化器
【数10】
での逆量子化320を受け、それにより離散コサイン変換(DCT)係数321が生成される。上述した第1の方法例とは対照的に、入力DCT係数321に対して補正DCT係数332が加算(330参照)され、それにより、再量子化によって生じた不整合(ミスマッチ)が補償される。この補正により、終局的に復号もしくはデコーディングに用いられる基準フレームの品質、即ちクオリティが改善される。補正を行った後、新たに形成されたブロックは、新たなビットレートとなるように
【数11】
で再量子化(340)されると共に既述のように可変長符号化(350)される。この場合にも、
【数12】
及び
【数13】
はビットレートに基づいて定められることを注記しておく。
【0011】
補正コンポーネント(成分)332を得るために、再量子化されたDCT係数は逆量子化(360)され、元の部分的に復号されたDCT係数から減算(370)される。この減算から得られる差は、逆DCT(IDCT)365を介して空間ドメインに変換されてフレームメモリ380に記憶される。ここで、各入力ブロックと関連の運動ベクトル381が、運動補償(390)を行うために対応の差ブロックを再読み出しするのに用いられる。そこで、対応のブロックは、DCT332を介して変換され、それにより補正コンポーネントが生成される。図3に示した方法の派生例が、Assuncao外の論文「A frequency domain video transcoder for dynamic bit-rate reduction of MPEG-2 bitstreams」、IEEE Transaction on Circuits and System for Video Technology, pp. 953-957, 1998に記述されている。
【0012】
即ち、Assuncao外はまた、同じタスクのための別の方法をも提案している。この別の方法においては、ドリフト補償の目的で、周波数ドメインで動作する運動補償(MC)ループを用いている。周波数ドメインでMCブロックの高速計算を行うために近似行列(マトリックス)が導出される。変換符号化(transcoding)に対し最良の量子化スケールを算出するためにラグランジェの最適化が採用されている。この方法によれば、IDCT/DCTコンポーネントに対する必要性が除かれる。
【0013】
従来の圧縮規格に従えば、テクスチャ情報の符号化に割り当てられるビット数は、量子化パラメータ(QP)により制御される。上に述べた方法は、元のビットストリームに含まれている情報をベースとするQP、即ち量子化パラメータを変えることによりテクスチャ・ビットレートを縮減する点で類似性を有している。効率的に実施するために、情報は通常、圧縮されたドメインから直接抽出され、マクロブロックの運動またはDCTブロックの残存エネルギーに関する尺度を含むことができる。上述の方法はビットレートの縮減に対してのみ適用可能である。
【0014】
ビットレートの縮減に加えて、他の形式のビットストリームの変換をも行うことができる。例えば、オブジェクトベースの変換が、Vetro外の2000年2月14日付けの米国特許出願09/504,323号明細書(発明の名称:Object-Based Bitstream Transcoder)に記述されている。また、空間解像度に関する変換が、Shanableh及びGhanbariの論文「Heterogeneous video transcoding to lower spatio-temporal resolution, and different encoding formats」、IEEE Transaction on Multimedia(June 2000)に記述されている。
【0015】
これらの方法では、品質の面で不満がある低い空間解像度でビットストリームが生成され、品質を高めようとすれば複雑性が増加する。また、再構成マクロブロックを形成する手段に関し適切な考慮が払われいない。これは、品質及び複雑性双方に関し大きなインパクトを与えるばかりでなく2とは異なる縮減因数を考慮した場合に特に問題となる。更にまた、これらの方法には具体的なアーキテクチャの詳細が伴っていない。関心の多くは因数「2」による運動ベクトルの種々なスケーリング手段に注がれている。
【0016】
図4は、入力ビットストリームを低い空間解像度で出力ビットストリーム402に変換符号化(transcoding)する方法400の詳細を示す。この方法は、図1に示した方法を拡張したものに対応するが、デコーダ110及びエンコーダ120の詳細を示すと共に、復号化プロセス及び符号化プロセス間にダウンサンプリング・ブロック410を有する。デコーダ110は、ビットストリームの部分的復号を行う。ダウンサンプリング・ブロック410は、部分的にマクロブロックを含む群の空間解像度を縮減する。デコーダにおける運動補償420では全解像度の運動ベクトル
【数14】
421が用いられ、他方、エンコーダにおける運動補償430では低解像度の運動ベクトル
【数15】
431が用いられる。低解像度の運動ベクトルはダウンサンプリングした空間ドメインフレーム
【数16】
403から推定されるか或いは全解像度の運動ベクトルからマップされる。変換符号化器(トランスコーダ)400の詳細について更に下に説明する。
【0017】
図5は、入力ビットストリーム501を低空間解像度で出力ビットストリーム502にトランスコード即ち変換符号化するための開ループ方法500の詳細を示す。この方法においては、ビットストリーム101はやはり部分的に復号される。即ち、入力ビットストリームのマクロブロックが可変長復号(VLD)(510)及び逆量子化(520)され、それにより離散コサイン変換(DCT)係数が生成される。なお、これらの処理ステップは周知のものである。
【0018】
次いで、DCTマクロブロックは、16×16(24×24) マクロブロック内の各8×8 (23×23) ルミナンスブロックの高周波係数をマスキングすることにより「2」の因数でダウンサンプリング(530)され、それにより4つの4×4DCTブロックが生成される。これに関しては、1993年11月16日付けのNgの米国特許第5,262,854号「Low-resolution HDTV receivers」を参照されたい。言い換えるならば、ダウンサンプリングにより、例えば、4個のブロックからなるブロック群は、小さいサイズの4ブロックからなるグループ、即ちブロック群に変換される。
【0019】
変換符号化器においてダウンサンプリングを行うことにより、変換符号化器は、従属16×16マクロブロックを再形成するための付加的なステップを取らなければならない。即ち、空間ドメインへの逆変換と、それに続くDCTドメインへの再変換である。ダウンサンプリング後、ブロックは、同じ量子化レベルを用いて再量子化され(540)、次いで、可変長符号化される(550)。なお、縮減された解像度ブロックに関するビットレート制御の実施に関する方法は何ら記載されていない。
【0020】
全運動ベクトル559から縮減運動ベクトル561への運動ベクトルマッピング560を行うのに、従来、フレームベースの運動ベクトルに対し幾つかの適切な方法が提案されている。4個のフレームベースの運動ベクトルを、1つの群内の各マクロブロックに対し1つづつ、新たに形成される16×16マクロブロックに対する1つの運動ベクトルに写像するため、単純な平均化もしくはメディアン・フィルタを適用することができる。これは、4:1マッピングと称されている。
【0021】
しかしながら、MPEG−4及びH.263のような或る圧縮規格では、8×8ブロック毎に1つの運動ベクトルを許容する高度な予測モードを支持している。この場合、各運動ベクトルは、元の解像度での16×16マクロブロックから、縮減された解像度マクロブロックでの8×8ブロックに写像される。これは、1:1マッピングと称されている。
【0022】
図6は、4つの16×16マクロブロック群601から1つの16×16マクロブロック602または4つの8×8マクロブロック群603のいずれかに運動ベクトルを写像、即ちマッピングする(600)例が示してある。常に1:1マッピングを用いるのは、4つの運動ベクトルを符号化するのに多くのビットが用いられるため非効率である。また、一般に、インターレースされた画像のためのフィールドベースの運動ベクトルへの拡張は無意味ではない。周知のように、ダウンサンプリングされたDCT係数及びマッピングされた運動ベクトルについては、データを可変長符号化し、縮減された解像度のビットストリームを形成することが可能である。
【0023】
更にまた、ドリフトを補償したり変換符号化もしくはトランスコーディング処理中良好なアプサンプリング技術を採用するのが望ましい。
【0024】
【発明の概要】
本発明は、圧縮されたビットストリームをアプサンプリング(up-sampling)する方法を提供する。圧縮されたビットストリームを部分的に復号してマクロブロックを生成する。各マクロブロックは、該マクロブロックの予め定められた次元(dimensionality)に従いDCT係数を有する。
【0025】
DCTフィルタを各マクロブロックのDCT係数に適用して各マクロブロックに対しアプサンプリングされたマクロブロックを生成する。ここで、1つのアプサンプリングされたマクロブロックは各フィルタによって生成される。各アプサンプリングされ生成されたマクロブロックは予め定められた次元を有する。
【0026】
[好適な実施の形態の詳細な説明]
導入
本発明は、ディジタルビデオ信号の圧縮されたビットストリームを最小のドリフトで縮減した空間解像度にトランスコーディング、即ち、変換符号化するシステム及び方法を提供するものである。先ず、本発明による変換符号化器もしくはトランスコーダを使用することができるコンテンツの配信に関する幾つかの用途例について説明する。次に、低空間解像度でビットストリームを発生するための基本的な方法について解析的に説明する。この解析に基づき、基本的な方法に対する幾つかの実施例並びに各実施例と関連する対応のアーキテクチャについて述べる。
【0027】
第1の実施例(図9参照)においては、開ループアーキテクチャが採用され、他方、他の3つの実施例(図10及び図11A乃至図11B参照)は、ダウンサンプリング、再量子化及び運動ベクトル打ち切りにより生ずるドリフトを補償する手段を構成する閉ループアーキテクチャに対応するものである。なお、これら閉ループアーキテクチャの内の1つは上記補償を縮減解像度で行い、他方、他の2つの閉ループアーキテクチャは上記補償を良好な品質を確保するためにDCTドメインで元解像度で行う。
【0028】
追って詳細に説明するように、図9の開ループアーキテクチャはあまり複雑ではない。復元ループも存在しなければDCT/IDCTブロックも存在せず、またフレームメモリも設けられておらず、従って、品質は低い画像解像度及びビット・レートに相応のものである。このアーキテクチャは、インターネットでの使用及びソフトウエアでの実現に適している。図10に示した第1の閉ループアーキテクチャも複雑性は中程度のものである。この第1の閉ループアーキテクチャは、復元ループ、IDCT/DCTブロック及びフレームメモリを備えている。このアーキテクチャによれば、縮減解像度ドメインでドリフトを補償し品質を改善することができる。図11Aに示した第2の閉ループアーキテクチャの複雑性も中程度である。この第2のアーキテクチャは、復元ループ、IDCT/DCTブロック及びフレームメモリを備えている。このアーキテクチャによれば、元解像度ドメインでドリフトを補償し品質を改善することができるが、縮減解像度のフレームのアプサンプリング(up-sampling)が要求される。第3の閉ループアーキテクチャでは、縮減解像度ドメインで得られる補正信号が用いられる。
【0029】
本発明によるアーキテクチャについて深い理解を得るために、縮減解像度で「混合モード(mixed mode)」のマクロブロック群を有するブロックを処理するための幾つかの付加的な技術についても説明する。
【0030】
ダウンサンプリング(down-sampling)すべき1群のブロック、例えば、4つのブロックは、これらブロック群がイントラモード(intra-mode)及びインターモード(inter-mode)の双方で符号化されたブロックを含む場合に「混合ブロック(mixed block)」と称する。MPEG規格においては、I−フレームはイントラモードに従って符号化されたマクロブロックだけを含むが、P−フレームはイントラモード及びインターモードで符号化されたブロックを含み得る。これらモードは、特にダウンサンプリングに際して考慮する必要がある。然もなければ、出力の品質、即ち画質が劣化する可能性があるからである。
【0031】
また、ドリフト補償並びにDCTベース・データのアプサンプリング方法についても説明する。これら方法は、アプサンプリング後の動作もしくは演算を付加的な変換ステップを伴うことなく適切に行うことができ、第2及び第3の閉ループアーキテクチャにとって有用である。
【0032】
縮減空間解像度の変換符号化(transcoding)への適用
本発明の目標とする主たる用途は、ディジタルテレビジョン(DTV)放送及びインターネットのコンテンツを、例えば無線電話、ページャ及びPDA(personal digital assistance)のような低解像度のディスプレイを有するデバイスもしくは装置へ配布もしくは配信することである。現在、DTV放送及びDVD記録のための圧縮フォーマットとしてMPEG−2が採用されており、インターネットを介してMPEG−1コンテンツが利用可能である。
【0033】
MPEG−4は、移動ネットワークを介してのビデオ伝送用の圧縮フォーマットとして採用されていたものであるので、本発明では、MPEG−1/2コンテンツを低解像度のMPEG−4コンテンツに変換符号化する方法を取り上げる。
【0034】
図7は、本発明を利用したマルチメディア・コンテンツ分配システム700の第1の例を示す。システム700は、外部ネットワーク703を介してクライアント702に接続された適応型サーバ701を有する。このシステムの1つの特徴は、クライアントのディスプレイはサイズが小さく、また、低いビットレートのチャンネルで接続されていることである。従って、クライアント702に配信されるコンテンツの解像度を縮減する必要がある。
【0035】
マルチメディアコンテンツの入力ソース704はデータベース710に格納される。コンテンツは特徴抽出及びインデキシング処理(指標付け処理)720を受ける。データベースサーバ740により、クライアント702は、データベース710のコンテンツを走査検索し特定のコンテンツに対する要求を行うことができる。マルチメディアコンテンツを探索するのにサーチエンジン730を使用することができる。所望のコンテンツが検索されたならば、データベースサーバ740はマルチメディアコンテンツを本発明による変換符号化器(トランスコーダ)750に送る。
【0036】
変換符号化器750は、ネットワーク及びクライアントの特性を読み取る。コンテンツの空間解像度がクライアントのディスプレイの特性よりも高い場合には、本発明による方法を用いて、コンテンツの解像度をクライアントのディスプレイ特性と整合するように縮減する。また、ネットワークチャンネル上のビット・レートがコンテンツのビット・レートよりも小さい場合にも本発明を適用することができる。
【0037】
図8は、コンテンツ配信システム800の第2の実施例を示す。このシステム800はローカルな「ホーム(home)」ネットワーク801、外部ネットワーク703、放送ネットワーク803及び図7と関連して説明した適応型サーバ701を具備する。この実施例においては、高品質の入力ソースコンテンツ804を、放送ネットワーク803、例えば、ケーブル、地上或いは衛星放送のネットワークを介してホームネットワーク801に接続されているクライアント805に転送することができる。コンテンツはセットトップ・ボックスもしくはゲートウエイ820により受信されてローカルメモリ或いはハードディスクドライブ(HDD)830に格納される。受信したコンテンツは、ホーム即ち家庭内のクライアント805に配送することができる。加えて、コンテンツは、全解像度のコンテンツを復号したり表示する能力を有しないクライアントにも利用可能なように変換符号化(850)を行うことができる。これは、例えば、ハイデフィニションテレビジョン(HDTV)のビットストリームを標準デフィニションのテレビジョンセットで受信する場合に相当する。従って、コンテンツは、ホーム(家庭)内のクライアントの能力を満足するようにトランスコード、即ち変換符号化すべきである。
【0038】
更にまた、外部ネットワーク802を介し低解像度の外部クライアント806よりローカルメモリ(HDD)830に格納されているコンテンツへのアクセスが要求された場合には、変換符号化器850を用いて当該クライアントに対して低解像度のマルチメディアコンテンツを配布することができる。
【0039】
基本的方法の分析
複雑性及び品質が可変である変換符号化器を設計するために図4に示した方法で発生される信号について更に分析し説明することにする。なお、式中の表記法と関連し、小文字の変数は空間ドメインの信号を表し、他方、大文字の変数はDCTドメインにおける等価の信号を表すものとする。また、変数に付した下付け文字は時間を、他方、1に等しい上付け文字はドリフトを有する信号を表し、そして2に等しい上付け文字はドリフトの無い信号を表すものとする。なお、ドリフトは、例えば再量子化、運動ベクトルの打ち切り(丸め)或いはダウンサンプリングのようなロスの多いプロセスで生じ得る。ドリフトの補償方法については追って説明する。
【0040】
I−フレイム
I−フレームについては運動補償予測は不可能である。即ち、
【数17】
であり、従って、信号はダウンサンプリングされる(410)。即ち、
【数18】
である。次いで、符号化器もしくはエンコーダ120で次式に従い符号化される。
【数19】
【0041】
信号
【数20】
はDCT440を受け、次いで、量子化パラメータ
【数21】
で量子化される(450)。量子化された信号
【数22】
は可変長符号化され(460)、符号変換されたビットストリーム(transcoded bitstream)402に書き込まれる。エンコーダにおける運動補償ループの一部分として
【数23】
は逆量子化され(470)、IDCT480を受ける。このようにして、縮減された解像度の基準信号
【数24】
481がフレームバッファ490に、将来のフレーム予測に対する基準信号として格納される。
【0042】
P−フレーム
P−フレームの場合には、下式
【数25】
から、再構成もしくは復元された全解像度の画像が生成される。I−フレームの場合と同様に、この信号は次いで式(2)に従いダウン変換(縮減変換)される。次いで、下式(5)に従い縮減解像度残留分(reduced resolution residual)が生成される。
【数26】
上式(5)は、等価的に次のように表される。
【数27】
【0043】
式(6)によって与えられる信号は、本発明によるアーキテクチャが近似する基準信号を表す。なお、この基準信号の発生における複雑性は高く、従って複雑性を相当に低減しつつ品質の近似を実現するのが望ましいことは言うまでもない。
【0044】
開ループアーキテクチャ
近似として、
【数28】
とすると、式(6)の縮減解像度残留分信号は下式で表される。
【数29】
【0045】
上式は、図9に示した変換符号化器900のための開ループアーキテクチャを示唆する。
【0046】
変換符号化器900において、入力ビットストリーム901の信号は、可変長復号され(910)、それにより逆量子化DCT係数911及び全解像度の運動ベクトル
【数30】
902が生成される。全解像度の運動ベクトルは、MVマッピング(MV写像)920によって縮減解像度の運動ベクトル
【数31】
903に写像、即ちマップされる。量子化されたDCT係数911は、量子化
【数32】
930で逆量子化され、信号
【数33】
931が生成される。次いで、この信号は、追って詳述するように、ブロック群のプロセッサ1300に供給される。プロセッサ1300の出力は、ダウンサンプリング(950)され、それにより信号
【数34】
951が生成される。ダウンサンプリング後、この信号は量子化
【数35】
(960)される。最後に、縮減解像度の再量子化されたDCT係数及び運動ベクトルは、可変長符号化(970)されて、変換符号化された出力ビット902に書き込まれる。
【0047】
ブロック群プロセッサ1300の好適な実施例に関する詳細については追って説明するが、ここでは簡単に、このプロセッサの目的は、ダウンサンプリングプロセス950で、サブブロックが異なった符号化モード、例えば、インターブロック及びイントラブロックモードを有するマクロブロック群が発生することのないように、選択されたマクロブロック群を予備処理することにあることを述べておく。なお、マクロブロック内の混合符号化モード(ミックストコーディングモード)は公知のいずれのビデオ符号化規格によっても支持されていない。
【0048】
縮減解像度におけるドリフト補償
式(7b)で与えられた近似だけだとすると、式(6)の縮減解像度残留信号は下式で表される。
【数36】
【0049】
上式は、縮減解像度でのドリフト補償を行う図10に示した閉ループアーキテクチャ1000を示唆している。
【0050】
このアーキテクチャにおいては、入力信号1001は、可変長復号(1010)され、それにより、量子化されたDCT係数1011及び全解像度の運動ベクトル
【数37】
1012が生成される。全解像度の運動ベクトル1012はMVマッピング1020によってマップされる。それにより縮減解像度の運動ベクトル
【数38】
の集合1021が生成される。量子化されたDCT係数は量子化
【数39】
で逆量子化され(1030)、それにより信号
【数40】
1031が生成される。この信号は次いでブロック群プロセッサ1300に供給されてダウンサンプリング(1050)される。ダウンサンプリング1050後、縮減解像度ドリフト補償信号1051がDCTドメインの低解像度残留信号1052に加算される(1060)。
【0051】
信号1061は空間量子化器
【数41】
1070で量子化される。最後に、縮減解像度の再量子化されたDCT係数1071及び運動ベクトル1021が可変長符号化(1080)されて、変換符号化された出力ビットストリーム1002が生成される。
【0052】
縮減解像度ドリフト補償信号が生成される基準フレームは、再量子化残留分
【数42】
1071を逆量子化(1090)し、ダウンサンプリングされた残留分
【数43】
1052から減算(1092)することにより得られる。この差信号は、IDCT1094に与えられて、フレームメモリ1091に格納されている前のマクロブロックの低解像度予測コンポーネント1096に加算(1095)される。この新しい信号は、差
【数44】
1097を表し、現在のブロックに対する低解像度の運動補償のための基準として用いられる。
【0053】
格納された基準信号に対して、低解像度の運動補償1098が行われ、DCT1099に対し予測がなされる。このDCTドメイン信号は、縮減解像度ドリフト補償信号1051である。この動作は、低解像度の運動ベクトル集合
【数45】
1021を用いてマクロブロックベースで行われる。
【0054】
元解像度での第1のドリフト補償方法
近似
【数46】
に対し、式(6)の縮減解像度残留信号は下記のように表される。
【数47】
【0055】
上式は、元解像度のビットストリームにおけるドリフトを補償する図11に示した閉ループアーキテクチャ1100を示唆している。
【0056】
このアーキテクチャにおいて、入力信号1001は、可変長復号(1110)され、量子化されたDCT係数1111及び全解像度の運動ベクトル
【数48】
1112が生成される。量子化されたDCT係数1111は量子化器
【数49】
で逆量子化され(1130)、それにより信号
【数50】
1131が生成される。この信号は次いでブロック群プロセッサ1300に供給される。ブロック群処理(1300)後、元解像度ドリフト補償信号1151がDCTドメインの残留信号1141に加算される(1160)。次いで信号1162はダウンサンプリング(1150)され、量子化器
【数51】
で量子化(1170)される。最後に、縮減解像度の復元されたDCT係数1171及び運動ベクトル1121は可変長符号化(1180)されて、変換符号化された(transcoded)ビットストリーム1102に書き込まれる。
【0057】
元解像度ドリフト補償信号1151が生成される基準フレームは、再量子化残留分
【数52】
1171を逆量子化(1190)し、アプサンプリング(1191)することにより得られる。この例では、アプサンプリング後にアプサンプリングされた信号は元解像度残留分1161から減算(1192)される。この差信号は、IDCT1194に与えられて、前のマクロブロックの元解像度予測コンポーネント1196に加算(1195)される。この新しい信号は、差
【数53】
1197を表し、元解像度における現在のマクロブロックに対する運動補償のための基準として用いられる。
【0058】
フレームバッファ1181に格納された基準信号に対して、元解像度での運動補償1198が行われ、DCT1199に対し予測がなされる。このDCTドメイン信号は、元解像度のドリフト補償信号1151である。この演算は、元解像度の運動ベクトル集合
【数54】
1121を用いてマクロブロック・ベースで行われる。
【0059】
元解像度での第2のドリフト補償方法
図11Bは図11Aに示した閉ループアーキテクチャの別の変形例を示す。この実施例においては、再量子化残留分
【数55】
1172の逆量子化出力1190がアプサンプリング1191前に縮減解像度信号から減算(1192)される。
【0060】
元解像度における上述の2つのドリフト補償アーキテクチャでは、ドリフト補償信号1151を発生するのに運動ベクトル近似を用いていない。これは、アプサンプリング(up-sampling)1191を採用することにより実現可能である。上述の2つの代替アーキテクチャは、主として、差信号を発生するのに用いられる信号の選択において異なる。第1番目の方法においては、差信号は再量子化及び解像度変換に起因するエラーを表し、他方、第2番目の方法における差信号においては再量子化に起因するエラーだけが考慮される。
【0061】
アプサンプリングされた信号は、変換符号化ビットストリームの将来の復号もしくはデコーディングにおいて考慮されることはないので、ドリフト補償信号における連続的なダウンサンプリング及びアプサンプリングによって計測される如何なるエラーをも排除しておくのが合理的である。しかしながら、アプサンプリングが2つの理由から採用される。即ち、以降の近似を回避するために全解像度の運動ベクトル1121を利用し、ドリフト補償信号を元解像度にしてダウンサンプリング1150前に入力残留分1161に加算(1160)できるようにするためである。
【0062】
混合ブロックプロセッサ
ブロック群プロセッサ1300の目的は、ダウンサンプリングによって、サブブロックが異なった符号化モード、例えばインターブロックモード及びイントラブロックモードを有するマクロブロックが発生されないように選択されたマクロブロックを予備処理することである。マクロブロック内に混在する符号化モードは周知の如何なるビデオ符号化規格によっても支持されていない。
【0063】
図12は、変換符号化1203後に縮減解像度でブロック群1202を生成することができるマクロブロック群1201の一例を示す。この例においては、3つのインターモードブロックと1つのイントラモードブロックが存在する。イントラモードブロックの運動ベクトル(MV)は零(ゼロ)であることを注記しておく。特定のブロック群が混合モード群(ミックストモード群)であるか否かの判定はもっぱらマクロブロックモードに依存する。ブロック群プロセッサ1300は、縮減解像度で単一のマクロブロック1202を形成している4つのマクロブロック群1201を取り扱う。換言すれば、ルミナンス成分に対し、MB(0)1210は、縮減解像度のマクロブロック1202内のサブブブロックb(0)1220に対応し、同様に、MB(1)1211はb(1)1221に対応し、MB(k)1212はb(2)1222に対応し、そしてMB(k+1)1213はb(3)1223に対応する。なお、ここでkは元解像度における列毎のマクロブロック数を表す。クロミナンス成分も、ルミナンスモードと整合する類似の仕方で処理される。
【0064】
MBモードの群は、ブロック群プロセッサ1300が特定のMB(マルチブロック)を処理すべきか否かを決定する。ブロック群が少なくとも1つのイントラモードブロック及び少なくとも1つのインターモードブロックを含んでいる場合にはブロック群の処理が行われる。マクロブロックの選択後、そのDCT係数及び運動ベクトルデータは修正もしくは変更される。
【0065】
図13は、ブロック群プロセッサ1300の構成要素、即ちコンポーネントを示す。選択された混合ブロック群1301に対し、ブロック群プロセッサは、モードマッピング1310、運動ベクトル修正1320及びDCT係数修正1330を行い、非混合モードブロック出力1302を生成する。ブロック群1301が識別もしくは同定されている場合には、マクロブロックのモードを全てのマクロブロックが同じになるように変更する。これは、縮減解像度ブロックにおける各サブブロックのモードを整合する予め特定されたストラティジに従って行われる。
【0066】
選択されたモード写像に従い、MVデータは次いで修正もしくは変更処理1320を受ける。対応のモード写像に適合する可能な修正もしくは変更について、下に図14A乃至図14Cを参照し詳細に説明する。なお、この場合、新しいMB(マクロブロック)モード及びMV(運動ベクトル)データに対し、対応のDCT係数も写像と適合するように修正もしくは変更される(1330)。
【0067】
図14Aに示してあるブロック群プロセッサの第1の実施例においては、ブロック群1301のMBモードをモード写像1310によりインターモードに変更する。従って、イントラブロックのMVデータは運動ベクトル処理により零にリセットされ、イントラブロックに対応するDCT係数もDCT処理1330により零にリセットされる。このようにして、変換されたブロックは基準フレーム内の対応のブロックからのデータで複製される。
【0068】
図14Bに示したブロック群プロセッサの第2の実施例においては、混合モードブロック群のMBモードは、写像、即ちマッピング1310によりインターモードに変更される。従って、第1の好適な実施例とは異なり、イントラMB(マクロブロック)用のMV(運動ベクトル)データは推定されることになる。この推定は、テクスチャ及び運動データ(運動ベクトル)の双方を含み得る隣接のブロック内のデータに基づいて行なわれる。そして、この推定された運動ベクトルに基づき、修正されたブロックに対する新しい残留分が算出される。最終ステップ1320でインターDCT(離散コサイン変換)係数がイントラDCT係数にリセットされる。
【0069】
図14Cに示した第3の実施例においては、ブロック群のMBモードはイントラモードに変更される(1310)。この場合、縮減解像度のマクロブロックと関連する運動情報は存在しないので、全ての関連の運動ベクトルデータは零にリセットされる(1320)。これは、変換符号化器において行う必要がある。その理由は、隣接ブロックの運動ベクトルがこのブロックの運動から推定もしくは予測されるからである。デコーダにおいて適切な復元を確保するためには、ブロック群のMVデータを変換符号化器において零にリセットしなければならない。最終ステップ1330においては、上述のように、インターDCT係数と入れ替わるべきイントラDCT係数が発生される。
【0070】
上に述べた第2及び第3の実施例を実現するために、全解像度に再生する復号ループ(レコーディングループ)を用いることができる。この再生されたデータは、DCT係数をイントラモードとインターモード間或いはインターモードとイントラモード間で変換するための基準データとして用いることができる。しかしながら、そのための符号化ループの使用は必ずしも要求されない。別法として、ドリフト補償ループ内で変換を行うことができるからである。
【0071】
運動の大きさが小さくディティルが低レベルである一連のフレームに対しては、図14Aに示す複雑性が小さいストラティジを使用することができる。それ以外の場合には、図14B或いは図14Cに示した応分の複雑性を有するストラティジを採用すべきである。なお、図14Cに示したストラティジが最良の品質を保証することを付記する。
【0072】
ブロック処理でのドリフト補償
ブロック群プロセッサ1300はまた、ドリフトを制御或いは最小化するのにも使用することができる。イントラ符号化ブロック(intra-coded block)は、ドリフトを受けないので、インター符号化ブロック(inter-coded block)をイントラ符号化ブロックに変換することによりドリフトの影響を軽減できる。
【0073】
図14Cの第1のステップ1350において、圧縮ビットストリームにおけるドリフト量を測定する。閉ループアーキテクチャの場合には、このドリフトは、1092及び1192によって発生される差信号のエネルギー或いは1091及び1191に格納されているドリフト補償信号のエネルギーに従って計測することができる。なお、信号のエネルギーの計算には周知の方法を用いることができる。計算されたエネルギーは、再量子化、ダウンサンプリング及び運動ベクトル打ち切り(丸め)を含む各種近似に当たって考慮される。
【0074】
開ループアーキテクチャにも適用可能であるドリフトの別の計算方法では、運動ベクトルの打ち切りもしくは丸めによってもたらされるエラーを推定する。元解像度での半ピクセル運動ベクトルは、解像度を縮減した場合に大きな再生エラーを招来することは知られている。これに対して、全ピクセル運動ベクトルにはこのようなエラーは生じない。と言うのは、全ピクセル運動ベクトルは半ピクセル領域に正しくマッピングすることができるからである。従って、ドリフトを計測する1つの可能な方法は、半ピクセル運動ベクトルの百分率もしくはパーセンテージを記録することである。しかしながら、運動ベクトル近似のインパクドはコンテンツの複雑性に依存するので、計測されたドリフトが半ピクセル運動ベクトルを有するブロックと関連する残留コンポーネントの関数となる可能性もある。
【0075】
ドリフトの測定の目的で差信号のエネルギー及び運動ベクトルデータを利用する方法は組み合わせて実施することもできるし、また、フレーム内の部分領域に亘って採用することも可能である。ドリフト補償方法により最も利便的なマクロブロックの位置を同定もしくは識別することができるので、フレーム内の部分領域について上記方法を適用するのが有利である。上記の方法を組み合わせて用いるためには、差信号または元解像度で半ピクセル運動ベクトルを有するマクロブロックに対するドリフト補償信号のエネルギーによりドリフトを計測する。
【0076】
第2のステップで、ドリフトの測定値は、ブロック群プロセッサ1300に対して入力として用いられる「イントラ再生率(intra refresh rate)」1351に変換される。イントラ符号化ブロックの百分率の制御は、従来、エラー常駐伝送でビデオを符号化するのに当たり考慮されていた。例えば、「Analysis of Video Transmission over Lossy Channels」Journal of Selected Areas of Communications, by Stuhlmuller, et al, 2000を参照されたい。この論文においては、受信部からエンコーダへの逆チャンネルで、伝送チャンネルによってもたらされる損失量を伝達し、予測符号化方式における損失データに起因するエラー率を阻止するために、ソース側からイントラ符号化ブロックの符号化が直接行われている。
【0077】
これとは対照的に、本発明では、既に符号化されているビデオに対し圧縮ドメインに新たなイントラブロックが生成され、インターモードからイントラモードへの変換はブロック群プロセッサ1300によって達成される。
【0078】
ドリフトがドリフト閾値量を越えると、図14Cに示してあるブロック群プロセッサ1300が起動してインターモードブロックをイントラモードブロックに変換する。この場合、変換は、予め特定された固定のイントラリフレッシュレート(intra refrech rate)で行われる。別法として、上記変換は、測定ドリフト量に比例するイントラリフレッシュレートで行うこともできる。また、信号のレート歪み特性を考慮して、イントラリフレッシュレートと、イントラブロック及びインターブロックの符号化に用いられる量子化器との間で適当な妥協を設定することも可能である。
【0079】
ここで、本発明は新しいイントラブロックを圧縮ドメインにおいて発生するものであり、そしてこのドリフト補償方式は解像度の縮減を伴い或いは伴わずに任意のトランスコーダ即ち変換符号化器で行うことができる。
【0080】
ダウンサンプリング
本発明による変換符号化器では、任意のダウンサンプリング方法を採用することができる。しかしながら、好適なダウンサンプリング方法は、Sun外の1999年11月10日付けの米国特許第5,855,151号「Method and apparatus for down-converting a digital signal」に記載されているダウンサンプリング方法が有利である。なお、この米国特許明細書の開示内容は本明細書において参考のために援用する。
【0081】
このダウンサンプリング方法の概念は図15Aに示してある。1つの群は4つの
【数56】
DCTブロック1501を含む。即ち、群の大きさもしくはサイズは、
【数57】
である。ブロック群に周波数合成もしくはフィルタリング1510を適用して単一の
【数58】
DCTブロック1511を発生する。この合成されたブロックからダウンサンプリングされたDCTブロック1512を抽出することができる。
【0082】
上記動作は、2D演算を用いるDCTドメインに関して説明したが、しかしながら、演算はまた分離可能な1Dフィルタを用いて行うことも可能である。更にまた、演算は、完全に空間ドメイン内で行うこともできる。また、Vetro外の1998年3月6日付けの米国特許願Sn. 09/135,969「Three layer scalable decoder and method of decoding」に記述されている方法を用いて等価な空間ドメインフィルタを導出することができる。なお、この米国特許願明細書の開示内容も参考のために本明細書において援用する。
【0083】
本発明による変換符号化器においてダウンサンプリング方法を使用する主たる利点は、マクロブロック内のサブブロックの正しい次元(dimension)が直接得られることである。例えば、4つの8×8DCTブロックから単一の8×8ブロックを形成することができる。他方、従来のダウンサンプリング方法では、マクロブロックの出力サブブロックにおいて所要の次元に等しくない次元でダウンサンプリングされたデータが生成されている。例えば、8×8DCTブロックから、4つの4×4DCTブロックを得ている。従って、従来方法では、単一の8×8DCTブロックを構成するために付加的なステップが必要とされることになる。
【0084】
上述のフィルタは、アプサンプリングを必要とする図11に示したアーキテクチャを効率的に実現する上に有用なコンポーネントである。一般に、ここで導出されるフィルタは、解像度縮減或いはドリフト補償を伴う或いは伴わずに、アプサンプリングされたDCTデータに対し演算を必要とする任意のシステムに適用可能である。
【0085】
アプサンプリング
本発明においては、従来の任意のアプサンプリング手段を使用することができる。しかしながら、先に引用したVetro外の米国特許願「Three layer scalable decoder and method of decoding」には、最適なアプサンプリング方法は、ダウンサンプリング方法に依存することが述べられている。従って、ダウンサンプリングフィルタ
【数59】
に対応するアプサンプリングフィルタ
【数60】
を使用するのが有利である。なお、上記2つのフィルタ間の関係は次式で与えられる。
【数61】
【0086】
上式から導出されるフィルタに関連し2つの問題がある。第1の問題は、DCTフィルタが反転可能ではないために、これらフィルタは空間ドメインフィルタにしか適用できないことである。しかしながら、対応の空間ドメインフィルタを導出してDCTドメインに変換することはできるので、これはそれほど大きな問題とはならない。
【0087】
しかしながら、第2の問題は、このようにして得られるアプサンプリングフィルタが図15Bに示すプロセスに対応する点で事情は異なってくる。このプロセスにおいて、例えば、
【数62】
ブロック1502は単一の
【数63】
ブロック1530にアプサンプリング(1520)される。アプサンプリングが全て空間ドメイン内で行われる場合には問題は生じない。しかしながら、アプサンプリングがDCTドメインで行われる場合には1つの
【数64】
DCTブロック、即ち、1つのDCTコンポーネントに対処しなければならない。これは、アプサンプリングされるDCTブロックが標準のMBフォーマット、即ち、4つの
【数65】
DCTブロック(但し、N=4)であることを要求する演算には適さない。即ち、アプサンプリングされたブロックはそれより大きな数の元ブロックと同じフォーマット或いは次元を有する。
【0088】
DCTドメインにおける上述のアプサンプリング方法は、本発明と関連して述べた変換符号化器での使用には適していない。図11Aを参照するに、アプサンプリングされたDCTデータは混合ブロックプロセッサ1300から出力されるDCTデータから減算される。これら2つのブロックの2つのDCTデータは同じフォーマットを有さねばならない。従って、図15Cに示したアプサンプリングを行うことが可能なフィルタが要求される。ここで、単一の
【数66】
ブロック1502は4つの
【数67】
ブロック1550にアプサンプリング(1540)されている。このようなフィルタは従来考慮されていなかったし、また従来技術としても存在しないので、1Dの事例についての式を以下に説明する。
【0089】
なお、以下に述べる式における表記法と関連し、小文字の変数は空間ドメインの信号を表し、他方、大文字の変数はDCTドメインにおける等価信号を表すものとする。
【0090】
図16に示すように、C1601はDCTドメインでアプサンプリングすべきDCTブロックを表し、c1602は空間ドメインにおける等価ブロックを表す。これら2つのブロックはN−ptDCT及びIDCT1603の定義により互いに関連付けられる。例えば、Rao及びYipの「Discrete Cosine Transform: Algorithms, Advantages and Applications」Academic, Boston, 1990を参照されたい。便宜上、下に数式で表す。
【0091】
DCTの定義は、下式で与えられる。
【数68】
また、IDCTの定義は、下式で与えられる。
【数69】
上式(13)及び(14)において、
【数70】
である。
【0092】
上から、ブロックE1610は
【数71】
1611でのフィルタリングCに基づくアプサンプリングされたDCTブロックを表し、eは式(12)で与えられる
【数72】
1621でのフィルタリングcに基づくアプサンプリングされた空間ドメインブロックを表す。e及びEは2N−ptDCT/IDCT1630により関連付けられる点に注意されたい。フィルタリングされる入力の入/出力関係は次式で与えられる。
【数73】
【0093】
図16を参照するに、所望のDCTブロックはA1611及びB1612で表されている。この目的とするところは、Cから直接それぞれA及びBを計算するのに使用することができるフィルタ
【数74】
1641及び
【数75】
1642を導出することである。
【0094】
第1番目のステップで、式(14)を式(16b)に代入する。
【0095】
これによって得られる式は、DCT入力Cの関数としての空間ドメイン出力eの式であり、次式のように表される。
【数76】
【0096】
式(17)を用いCでA及びBを表すと、a、b及びe間の空間ドメイン関係は次のようになる。
【数77】
上式中iは空間ドメイン指標(インデックス)を表す。aに関するDCTドメイン表現式は次式で与えられる。
【数78】
【0097】
式(17)乃至(19)から次式が得られる。
【数79】
上式は等価的に次のように表される。
【数80】
上式中、
【数81】
である。同様にして、下式が成り立つ。
【数82】
上式は等価的に下式で表される。
【数83】
上式中、
【数84】
である。
【0098】
次いで、上記のフィルタは、所与の次元もしくは大きさの単一のブロックを、それぞれが元ブロックと同じ次元を有する多数のブロックにアプサンプリングするのに用いることができる。一般に、ここで導出したフィルタは、アプサンプリングされるDCTデータに演算が要求される任意のシステムに適用可能である。
【0099】
式(22)及び(25)によって与えられるフィルタを実現するために、フィルタタップのk×q行列を考える。ここでkは出力ピクセルの指標(インデックス)であり、qは入力ピクセルの指標(インデックス)である。1Dデータに対しては、出力ピクセルは行列乗算として計算される。2Dデータに対しては2つのステップが取られる。先ず第1に、データを第1の方向、例えば水平方向にアプサンプリングする。次いで、水平方向にアプサンプリングしたデータを第2の方向、例えば垂直方向にアプサンプリングする。アプサンプリングのための方向の順序は、逆にしてもその結果には影響はない。
【0100】
水平方向のアプサンプリングの場合には、ブロック内の各列が個別に演算操作され、N次元の入力ベクトルとして取り扱われる。各入力ベクトルは、式(21)及び(24)に従ってフィルタリング処理を受ける。このプロセスの出力として2つの標準のDCTブロックが得られる。
【0101】
垂直方向のアプサンプリングでは、ブロック内の各行が個別に演算操作され、N次元の入力ベクトルとして取り扱われる。水平方向におけるアプサンプリングの場合と同様に、各入力ベクトルは、式(21)及び(24)に従ってフィルタリング処理を受ける。このプロセスの出力として図15Cに示すように4つの標準のDCTブロックが得られる。
【0102】
構文変換
本発明による変換符号化器もしくはトランスコーダの用途もしくは適用に関する以上の説明から明らかなように、本発明の主要な用途の1つはMPEG−2からMPEG−4への変換である。従って、力点は主に、低空間解像度への変換符号化の際のドリフト補償に用いられるアーキテクチャ並びに低空間解像度への変換を支持する付加的な技術に置いた。
【0103】
しかしながら、標準の符号化方式間の構文変換も別の重要な対象である。しかしながら、このことについては、既に出願中の米国特許明細書に記述されているところであるので、ここでは詳細に立ち入らないことにする。
【0104】
以上、好適な実施例と関連して本発明について説明したが、本発明の精神及び範囲内で種々な他の適応及び変更が可能であることは理解されるでべきである。従って、特許請求の範囲に記載の対象は、上記のような変形及び変更例をも包摂するものであることを付記する。
【図面の簡単な説明】
【図1】 従来のカスケード接続の変換符号化器もしくはトランスコーダのブロックダイヤグラムである。
【図2】 ビットレート縮減用の従来の開ループ変換符号化器のブロックダイヤグラムである。
【図3】 ビットレート縮減用の従来の閉ループ変換符号化器のブロックダイヤグラムである。
【図4】 空間解像度縮減用の従来のカスケード接続の変換符号化器のブロックダイヤグラムである。
【図5】 空間解像度縮減のための従来の開ループ変換符号化器のブロックダイヤグラムである。
【図6】 従来の運動ベクトル写像もしくはマッピングのブロックダイヤグラムである。
【図7】 本発明による第1のビットストリーム変換符号化を空間解像度縮減に適用した本発明の第1の実施例を示すブロックダイヤグラムである。
【図8】 本発明によるビットストリームの縮減空間解像度への変換符号化を適用した本発明の第2の実施例を示すブロックダイヤグラムである。
【図9】 本発明による空間解像度縮減のための開ループ変換符号化器のブロックダイヤグラムである。
【図10】 本発明による縮減解像度でドリフト補償を行う空間解像度縮減用の第1の閉ループ変換符号化器のブロックダイヤグラムである。
【図11A】 本発明による元の解像度でドリフト補償を行う空間解像度縮減用の第2の閉ループ変換符号化器のブロックダイヤグラムである。
【図11B】 本発明による元の解像度でドリフト補償を行う空間解像度縮減用の第3の閉ループ変換符号化器のブロックダイヤグラムである。
【図12】 マクロブロックモード、DCT係数データ及び対応の運動ベクトルデータを含むマクロブロック群の一例を示す図である。
【図13】 本発明によるブロック群プロセッサのブロックダイヤグラムである。
【図14A】 本発明による第1のブロック群処理方法を図解するブロックダイヤグラムである。
【図14B】 本発明による第2のブロック群処理方法を図解するブロックダイヤグラムである。
【図14C】 本発明による第3のブロック群処理方法を図解するブロックダイヤグラムである。
【図15A】 DCTもしくは空間ドメインにおけるダウンサンプリングの従来の考え方を図解する図である。
【図15B】 DCTもしくは空間ドメインにおける従来のアプサンプリングを図解するブロックダイヤグラムである。
【図15C】 本発明によるDCTドメインにおけるアプサンプリングを図解するブロックダイヤグラムである。
【図16】 本発明によるDCTドメインにおけるアプサンプリングを図解するダイヤグラムである。
Claims (8)
- イントラモードマクロブロック及びインターモードマクロブロックを含み、各マクロブロックがDCT係数及び運動ベクトルを含む部分的に復号された入力ビットストリームのマクロブロック群を変換符号化する方法において、
解像度縮減時に単一マクロブロックに写像されるようなマクロブロックの集合からなる前記マクロブロック群内に、インターモードマクロブロックが存在し且つイントラモードマクロブロックが存在する場合にのみ、該マクロブロック群のモードが同じになるように前記イントラモードマクロブロック及び前記インターモードマクロブロックの一方のモードを他方のモードにマッピングし、且つ前記DCT係数及び運動ベクトルを各変更されたマクロブロックに対しマッピングに従い修正し、
DCTドメインにおいて高周波係数をマスキングすることにより、前記各マクロブロック群をダウンサンプリングして縮減された解像度のマクロブロックを生成し、圧縮されたビットストリーム出力とする変換符号化方法であって、
前記入力ビットストリームを可変長復号して逆量子化DCT係数及び全解像度の運動ベクトルを生成するステップと、
前記逆量子化DCT係数を逆量子化して、マクロブロック群を混合ブロック群から非混合ブロック群にするための混合ブロックプロセッサを介した後に、ダウンサンプリングして再量子化されたDCT係数を生成するステップと、
前記全解像度の運動ベクトルをマッピングして縮減解像度の運動ベクトルを生成するステップと、
前記再量子化されたDCT係数及び前記縮減解像度の運動ベクトルを可変長符号化して前記圧縮されたビットストリーム出力とするステップと
を含むことを特徴とする変換符号化方法。 - 各変更されたマクロブロックのモードをインターモードにマッピングし、各変更されたマクロブロックの運動ベクトル及びDCT係数を、ビットストリームに含まれる運動ベクトルが比較的小さい場合に、零にセットすることを特徴とする請求項1に記載の方法。
- 各変更されたマクロブロックのモードをインターモードにマッピングし且つ変更されたブロックの運動ベクトルを、テクスチャ及び運動ベクトルを含み得る隣接のブロック内のデータに基づいて予測し、ビットストリームに含まれる運動ベクトルが比較的大きい場合に、前記変更されたマクロブロックのDCT係数をインターモードの写像と適合するように変換することを特徴とする請求項1に記載の方法。
- 各変更されたマクロブロックのモードをイントラモードにマッピングし且つ変更されたマクロブロックの運動ベクトルを零にセットし、ビットストリームが所定量よりも大きい運動量を有する場合に前記変更されたマクロブロックのDCT係数をイントラモードの写像と適合するように変換することを特徴とする請求項1に記載の方法。
- 部分的に復号された入力ビットストリームがMPEG−2フォーマットであり、圧縮された出力ビットストリームがMPEG−4フォーマットであることを特徴とする請求項1に記載の方法。
- マルチメディアコンテンツ配布システムの適応型サーバで符号変換(transcoding)を行うことを特徴とする請求項1に記載の方法。
- 符号変換を家庭用ネットワークのトランスコーダにおいて行うことを特徴とする請求項1に記載の方法。
- イントラモードマクロブロック及びインターモードマクロブロックを含むマクロブロックの群であって、前記各マクロブロックがDCT係数及び運動ベクトルを含む部分的に復号された入力ビットストリームのマクロブロック群を変換符号化する装置において、
解像度縮減時に単一マクロブロックに写像されるようなマクロブロックの集合からなる前記マクロブロック群内に、インターモードマクロブロックが存在し且つイントラモードマクロブロックが存在する場合にのみ、該マクロブロック群のモードが同じになるように前記イントラモードマクロブロック及び前記インターモードマクロブロックの一方のモードを他方のモードにマッピングし、且つ前記DCT係数及び運動ベクトルを各変更されたマクロブロックに対するマッピングに従って修正し、
DCTドメインにおいて高周波係数をマスキングすることにより、前記各マクロブロック群をダウンサンプリングして縮減された解像度のマクロブロックを生成し、圧縮された出力ビットストリームを発生する変換符号化装置であって、
前記入力ビットストリームを可変長復号して逆量子化DCT係数及び全解像度の運動ベクトルを生成する手段と、
前記逆量子化DCT係数を逆量子化して、マクロブロック群を混合ブロック群から非混合ブロック群にするための混合ブロックプロセッサを介した後に、ダウンサンプリングして再量子化されたDCT係数を生成する手段と、
前記全解像度の運動ベクトルをマッピングして縮減解像度の運動ベクトルを生成する手段と、
前記再量子化されたDCT係数及び前記縮減解像度の運動ベクトルを可変長符号化して前記圧縮されたビットストリーム出力とする手段と
を含むことを特徴とする変換符号化装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/853,394 US6671322B2 (en) | 2001-05-11 | 2001-05-11 | Video transcoder with spatial resolution reduction |
US09/853394 | 2001-05-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003032682A JP2003032682A (ja) | 2003-01-31 |
JP4313543B2 true JP4313543B2 (ja) | 2009-08-12 |
Family
ID=25315924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002132740A Expired - Lifetime JP4313543B2 (ja) | 2001-05-11 | 2002-05-08 | 部分的に復号された入力ビットストリームのマクロブロック群を変換符号化する方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6671322B2 (ja) |
EP (1) | EP1257127B1 (ja) |
JP (1) | JP4313543B2 (ja) |
Families Citing this family (86)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR0015959A (pt) | 1999-12-14 | 2002-08-06 | Scientific Atlanta | Sistema e método para o processamento de vìdeo adaptativo com alocação de recursos coordenados |
US8724485B2 (en) | 2000-08-30 | 2014-05-13 | Broadcom Corporation | Home network system and method |
JP2004525533A (ja) * | 2000-08-30 | 2004-08-19 | ティアリス, インコーポレイテッド | 家庭用ネットワークシステムおよび方法 |
US9094226B2 (en) | 2000-08-30 | 2015-07-28 | Broadcom Corporation | Home network system and method |
US6934334B2 (en) * | 2000-10-02 | 2005-08-23 | Kabushiki Kaisha Toshiba | Method of transcoding encoded video data and apparatus which transcodes encoded video data |
JP2004512784A (ja) * | 2000-10-24 | 2004-04-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | エンベッドフィルタによるトランスコーディング方法及びトランスコーディング装置 |
US7088780B2 (en) * | 2001-05-11 | 2006-08-08 | Mitsubishi Electric Research Labs, Inc. | Video transcoder with drift compensation |
US7054362B1 (en) | 2001-05-29 | 2006-05-30 | Cisco Technology, Inc. | Methods and apparatus for updating a reduction ratio |
US6868124B2 (en) * | 2001-06-18 | 2005-03-15 | Webtv Networks Inc. (Microsoft) | Method and systems for compressing a video stream with minimal loss after subsampled decoding |
JP2003087785A (ja) * | 2001-06-29 | 2003-03-20 | Toshiba Corp | 動画像符号化データの形式変換方法及び装置 |
KR20030006641A (ko) * | 2001-07-13 | 2003-01-23 | 전자부품연구원 | 트랜스코더 및 그의 트랜스 코딩 방법 |
US7145946B2 (en) * | 2001-07-27 | 2006-12-05 | Sony Corporation | MPEG video drift reduction |
EP1294195A1 (en) * | 2001-09-14 | 2003-03-19 | STMicroelectronics S.r.l. | A process for the format conversion of MPEG bitstreams, a system and computer program product therefor |
JP4574090B2 (ja) * | 2001-09-21 | 2010-11-04 | 三菱電機株式会社 | 動画データ変換装置および動画データ変換プログラム |
US7197077B2 (en) | 2001-12-20 | 2007-03-27 | Sbc Technologies Resources, Inc. | Multilevel data compression using a single compression engine |
US7274857B2 (en) | 2001-12-31 | 2007-09-25 | Scientific-Atlanta, Inc. | Trick modes for compressed video streams |
US7177356B2 (en) * | 2002-01-11 | 2007-02-13 | Webtv Networks, Inc. | Spatially transcoding a video stream |
US7596179B2 (en) * | 2002-02-27 | 2009-09-29 | Hewlett-Packard Development Company, L.P. | Reducing the resolution of media data |
JP3874179B2 (ja) * | 2002-03-14 | 2007-01-31 | Kddi株式会社 | 符号化動画像変換装置 |
US20030215011A1 (en) * | 2002-05-17 | 2003-11-20 | General Instrument Corporation | Method and apparatus for transcoding compressed video bitstreams |
JP4275358B2 (ja) * | 2002-06-11 | 2009-06-10 | 株式会社日立製作所 | 画像情報変換装置およびビットストリーム変換機ならびに画像情報変換送信方法 |
US7944971B1 (en) * | 2002-07-14 | 2011-05-17 | Apple Inc. | Encoding video |
US8311095B2 (en) * | 2002-07-17 | 2012-11-13 | Onmobile Global Limited | Method and apparatus for transcoding between hybrid video codec bitstreams |
US20040057521A1 (en) * | 2002-07-17 | 2004-03-25 | Macchina Pty Ltd. | Method and apparatus for transcoding between hybrid video CODEC bitstreams |
US20040177381A1 (en) * | 2002-09-05 | 2004-09-09 | Tiaris, Inc. | Home network system which supports legacy digital set top box devices |
US7142601B2 (en) * | 2003-04-14 | 2006-11-28 | Mitsubishi Electric Research Laboratories, Inc. | Transcoding compressed videos to reducing resolution videos |
US9612965B2 (en) * | 2003-06-24 | 2017-04-04 | Hewlett-Packard Development Company, L.P. | Method and system for servicing streaming media |
US7330509B2 (en) * | 2003-09-12 | 2008-02-12 | International Business Machines Corporation | Method for video transcoding with adaptive frame rate control |
US7966642B2 (en) * | 2003-09-15 | 2011-06-21 | Nair Ajith N | Resource-adaptive management of video storage |
JP4470431B2 (ja) * | 2003-10-01 | 2010-06-02 | ソニー株式会社 | データ処理装置およびその方法 |
KR20050049964A (ko) * | 2003-11-24 | 2005-05-27 | 엘지전자 주식회사 | 압축 동영상의 고속 해상도 변환 장치 |
US20050175099A1 (en) * | 2004-02-06 | 2005-08-11 | Nokia Corporation | Transcoder and associated system, method and computer program product for low-complexity reduced resolution transcoding |
US8600217B2 (en) * | 2004-07-14 | 2013-12-03 | Arturo A. Rodriguez | System and method for improving quality of displayed picture during trick modes |
KR100681258B1 (ko) * | 2004-10-02 | 2007-02-09 | 삼성전자주식회사 | 트랜스코딩을 위한 움직임벡터 정밀화 기반 출력움직임벡터 추정방법 및 이를 이용한 트랜스코더 |
US8948266B2 (en) * | 2004-10-12 | 2015-02-03 | Qualcomm Incorporated | Adaptive intra-refresh for digital video encoding |
US8199825B2 (en) * | 2004-12-14 | 2012-06-12 | Hewlett-Packard Development Company, L.P. | Reducing the resolution of media data |
JP2006203682A (ja) * | 2005-01-21 | 2006-08-03 | Nec Corp | 動画像圧縮符号化ビットストリームシンタックス変換装置及び動画像通信システム |
US8447121B2 (en) * | 2005-09-14 | 2013-05-21 | Microsoft Corporation | Efficient integrated digital video transcoding |
US20070058713A1 (en) * | 2005-09-14 | 2007-03-15 | Microsoft Corporation | Arbitrary resolution change downsizing decoder |
WO2007124491A2 (en) * | 2006-04-21 | 2007-11-01 | Dilithium Networks Pty Ltd. | Method and system for video encoding and transcoding |
US7782850B2 (en) * | 2006-11-20 | 2010-08-24 | Broadcom Corporation | MAC to PHY interface apparatus and methods for transmission of packets through a communications network |
US7742495B2 (en) * | 2006-11-20 | 2010-06-22 | Broadcom Corporation | System and method for retransmitting packets over a network of communication channels |
US7697522B2 (en) | 2006-11-20 | 2010-04-13 | Broadcom Corporation | Systems and methods for aggregation of packets for transmission through a communications network |
US8090043B2 (en) | 2006-11-20 | 2012-01-03 | Broadcom Corporation | Apparatus and methods for compensating for signal imbalance in a receiver |
US8345553B2 (en) | 2007-05-31 | 2013-01-01 | Broadcom Corporation | Apparatus and methods for reduction of transmission delay in a communication network |
US7962640B2 (en) * | 2007-06-29 | 2011-06-14 | The Chinese University Of Hong Kong | Systems and methods for universal real-time media transcoding |
CN101803363B (zh) * | 2007-09-10 | 2013-09-18 | 英属开曼群岛商泰鼎微系统股份有限公司 | 用于视频图像数据中的基于行的运动估计的方法和装置 |
US20090165070A1 (en) * | 2007-12-19 | 2009-06-25 | Broadcom Corporation | SYSTEMS AND METHODS FOR PROVIDING A MoCA COMPATABILITY STRATEGY |
US8098770B2 (en) * | 2008-05-06 | 2012-01-17 | Broadcom Corporation | Unbiased signal-to-noise ratio estimation for receiver having channel estimation error |
JP5250824B2 (ja) * | 2008-05-30 | 2013-07-31 | 株式会社メガチップス | トランスコーダ |
AU2009258316A1 (en) * | 2008-06-11 | 2009-12-17 | National University Of Singapore | CMOS amplifier with integrated tunable band-pass function |
US8300696B2 (en) * | 2008-07-25 | 2012-10-30 | Cisco Technology, Inc. | Transcoding for systems operating under plural video coding specifications |
US9112717B2 (en) | 2008-07-31 | 2015-08-18 | Broadcom Corporation | Systems and methods for providing a MoCA power management strategy |
US8831101B2 (en) * | 2008-08-02 | 2014-09-09 | Ecole De Technologie Superieure | Method and system for determining a metric for comparing image blocks in motion compensated video coding |
EP2200321A1 (en) | 2008-12-19 | 2010-06-23 | Thomson Licensing | Method for browsing video streams |
US8213309B2 (en) * | 2008-12-22 | 2012-07-03 | Broadcom Corporation | Systems and methods for reducing latency and reservation request overhead in a communications network |
US8254413B2 (en) * | 2008-12-22 | 2012-08-28 | Broadcom Corporation | Systems and methods for physical layer (“PHY”) concatenation in a multimedia over coax alliance network |
US8238227B2 (en) | 2008-12-22 | 2012-08-07 | Broadcom Corporation | Systems and methods for providing a MoCA improved performance for short burst packets |
US8553547B2 (en) | 2009-03-30 | 2013-10-08 | Broadcom Corporation | Systems and methods for retransmitting packets over a network of communication channels |
US20100254278A1 (en) | 2009-04-07 | 2010-10-07 | Broadcom Corporation | Assessment in an information network |
US9083986B2 (en) * | 2009-05-01 | 2015-07-14 | Broadcom Corporation | Method and system for adaptive rate video compression and transmission |
US8730798B2 (en) * | 2009-05-05 | 2014-05-20 | Broadcom Corporation | Transmitter channel throughput in an information network |
US9100656B2 (en) | 2009-05-21 | 2015-08-04 | Ecole De Technologie Superieure | Method and system for efficient video transcoding using coding modes, motion vectors and residual information |
US8867355B2 (en) | 2009-07-14 | 2014-10-21 | Broadcom Corporation | MoCA multicast handling |
US8942250B2 (en) | 2009-10-07 | 2015-01-27 | Broadcom Corporation | Systems and methods for providing service (“SRV”) node selection |
KR101234495B1 (ko) * | 2009-10-19 | 2013-02-18 | 한국전자통신연구원 | 화상회의 시스템을 위한 단말, 중계 노드 및 스트림 처리 방법 |
US20110090952A1 (en) * | 2009-10-21 | 2011-04-21 | Cohen Robert A | Directional Transforms for Video and Image Coding |
US8315310B2 (en) * | 2010-01-08 | 2012-11-20 | Research In Motion Limited | Method and device for motion vector prediction in video transcoding using full resolution residuals |
US8358698B2 (en) * | 2010-01-08 | 2013-01-22 | Research In Motion Limited | Method and device for motion vector estimation in video transcoding using full-resolution residuals |
US8340188B2 (en) * | 2010-01-08 | 2012-12-25 | Research In Motion Limited | Method and device for motion vector estimation in video transcoding using union of search areas |
US8559519B2 (en) * | 2010-01-08 | 2013-10-15 | Blackberry Limited | Method and device for video encoding using predicted residuals |
US20110206132A1 (en) * | 2010-02-19 | 2011-08-25 | Lazar Bivolarsky | Data Compression for Video |
US9609342B2 (en) * | 2010-02-19 | 2017-03-28 | Skype | Compression for frames of a video signal using selected candidate blocks |
US9819358B2 (en) * | 2010-02-19 | 2017-11-14 | Skype | Entropy encoding based on observed frequency |
US20110206118A1 (en) * | 2010-02-19 | 2011-08-25 | Lazar Bivolarsky | Data Compression for Video |
US9313526B2 (en) * | 2010-02-19 | 2016-04-12 | Skype | Data compression for video |
US8611327B2 (en) | 2010-02-22 | 2013-12-17 | Broadcom Corporation | Method and apparatus for policing a QoS flow in a MoCA 2.0 network |
US8514860B2 (en) * | 2010-02-23 | 2013-08-20 | Broadcom Corporation | Systems and methods for implementing a high throughput mode for a MoCA device |
RU2010135495A (ru) * | 2010-08-24 | 2012-02-27 | ЭлЭсАй Корпорейшн (US) | Видеотранскодер с гибким управлением качеством и сложностью |
US8755438B2 (en) * | 2010-11-29 | 2014-06-17 | Ecole De Technologie Superieure | Method and system for selectively performing multiple video transcoding operations |
US9749657B2 (en) | 2011-01-21 | 2017-08-29 | Sharp Kabushiki Kaisha | Buffer compression for motion vector competition |
US9432704B2 (en) * | 2011-11-06 | 2016-08-30 | Akamai Technologies Inc. | Segmented parallel encoding with frame-aware, variable-size chunking |
US9998750B2 (en) | 2013-03-15 | 2018-06-12 | Cisco Technology, Inc. | Systems and methods for guided conversion of video from a first to a second compression format |
US9485456B2 (en) | 2013-12-30 | 2016-11-01 | Akamai Technologies, Inc. | Frame-rate conversion in a distributed computing system |
FR3016764B1 (fr) * | 2014-01-17 | 2016-02-26 | Sagemcom Broadband Sas | Procede et dispositif de transcodage de donnees video de h.264 vers h.265 |
TWI721089B (zh) * | 2017-01-23 | 2021-03-11 | 香港商阿里巴巴集團服務有限公司 | 轉碼方法及裝置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6091460A (en) * | 1994-03-31 | 2000-07-18 | Mitsubishi Denki Kabushiki Kaisha | Video signal encoding method and system |
US5737019A (en) * | 1996-01-29 | 1998-04-07 | Matsushita Electric Corporation Of America | Method and apparatus for changing resolution by direct DCT mapping |
SE515535C2 (sv) * | 1996-10-25 | 2001-08-27 | Ericsson Telefon Ab L M | En transkoder |
US5870146A (en) * | 1997-01-21 | 1999-02-09 | Multilink, Incorporated | Device and method for digital video transcoding |
US6434196B1 (en) * | 1998-04-03 | 2002-08-13 | Sarnoff Corporation | Method and apparatus for encoding video information |
US6310915B1 (en) * | 1998-11-20 | 2001-10-30 | Harmonic Inc. | Video transcoder with bitstream look ahead for rate control and statistical multiplexing |
US6275536B1 (en) * | 1999-06-23 | 2001-08-14 | General Instrument Corporation | Implementation architectures of a multi-channel MPEG video transcoder using multiple programmable processors |
US6498814B1 (en) * | 1999-07-20 | 2002-12-24 | Koninklijke Philips Electronics N.V. | Drift-free transcoder and related method |
US6441754B1 (en) * | 1999-08-17 | 2002-08-27 | General Instrument Corporation | Apparatus and methods for transcoder-based adaptive quantization |
JP2001112000A (ja) * | 1999-10-07 | 2001-04-20 | Matsushita Electric Ind Co Ltd | 映像信号符号化装置 |
US6404814B1 (en) * | 2000-04-28 | 2002-06-11 | Hewlett-Packard Company | Transcoding method and transcoder for transcoding a predictively-coded object-based picture signal to a predictively-coded block-based picture signal |
US7088780B2 (en) * | 2001-05-11 | 2006-08-08 | Mitsubishi Electric Research Labs, Inc. | Video transcoder with drift compensation |
-
2001
- 2001-05-11 US US09/853,394 patent/US6671322B2/en not_active Expired - Lifetime
-
2002
- 2002-05-07 EP EP02010348.7A patent/EP1257127B1/en not_active Expired - Lifetime
- 2002-05-08 JP JP2002132740A patent/JP4313543B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP1257127A2 (en) | 2002-11-13 |
US6671322B2 (en) | 2003-12-30 |
JP2003032682A (ja) | 2003-01-31 |
US20030016751A1 (en) | 2003-01-23 |
EP1257127A3 (en) | 2003-06-04 |
EP1257127B1 (en) | 2014-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4313543B2 (ja) | 部分的に復号された入力ビットストリームのマクロブロック群を変換符号化する方法及び装置 | |
JP4163006B2 (ja) | ドリフト補正を備えたビデオトランスコーダ | |
US7170932B2 (en) | Video transcoder with spatial resolution reduction and drift compensation | |
US20060280372A1 (en) | Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction | |
JP3861698B2 (ja) | 画像情報符号化装置及び方法、画像情報復号装置及び方法、並びにプログラム | |
US7110451B2 (en) | Bitstream transcoder | |
AU2007231799B2 (en) | High-performance video transcoding method | |
US20060291562A1 (en) | Video coding method and apparatus using multi-layer based weighted prediction | |
KR20060045719A (ko) | 고충실도 트랜스코딩 | |
WO2005062622A1 (ja) | 画像復号装置及び画像復号方法並びに画像復号プログラム | |
JP2001145113A (ja) | 画像情報変換装置及び方法 | |
US20060250520A1 (en) | Video coding method and apparatus for reducing mismatch between encoder and decoder | |
KR100386583B1 (ko) | 영상 변환 부호화 장치 및 방법 | |
JP2003116104A (ja) | 情報処理装置及び情報処理方法 | |
US8243798B2 (en) | Methods and apparatus for scalable video bitstreams | |
JP4209134B2 (ja) | 圧縮ビットストリームをアップサンプリングする方法および装置 | |
JP4660408B2 (ja) | 符号化方法 | |
KR100364748B1 (ko) | 영상 변환 부호화 장치 | |
JP4339784B2 (ja) | 複数個のブロックとして符号化された圧縮ビットストリーム符号化ビデオを復号する方法。 | |
JP2004056616A (ja) | 符号化信号復号装置、符号化信号復号方法および符号化信号復号プログラム | |
JP2003219430A (ja) | ビデオ信号のフレームのシーケンスの圧縮されたビットストリームを低減された空間解像度にトランスコードするための方法および閉ループトランスコーダ | |
US20120002720A1 (en) | Video encoder with video decoder reuse and method for use therewith | |
JP2001016589A (ja) | 画像情報変換装置、画像情報伝達システム及び画像情報変換方法 | |
KR20030006641A (ko) | 트랜스코더 및 그의 트랜스 코딩 방법 | |
JP4390009B2 (ja) | 符号化装置及び方法、画像処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080624 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080924 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20081008 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20081024 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20081029 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090415 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090512 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090515 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120522 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4313543 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120522 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130522 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |