JP2009508445A - 効率的な統合デジタルビデオトランスコーディング - Google Patents

効率的な統合デジタルビデオトランスコーディング Download PDF

Info

Publication number
JP2009508445A
JP2009508445A JP2008531271A JP2008531271A JP2009508445A JP 2009508445 A JP2009508445 A JP 2009508445A JP 2008531271 A JP2008531271 A JP 2008531271A JP 2008531271 A JP2008531271 A JP 2008531271A JP 2009508445 A JP2009508445 A JP 2009508445A
Authority
JP
Japan
Prior art keywords
computer
transcoding
implemented method
bitstream
transcoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008531271A
Other languages
English (en)
Other versions
JP4955686B2 (ja
Inventor
シェン グオビン
リー シーペン
ツァオ ワンヨン
ホー ユーウェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2009508445A publication Critical patent/JP2009508445A/ja
Application granted granted Critical
Publication of JP4955686B2 publication Critical patent/JP4955686B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23608Remultiplexing multiplex streams, e.g. involving modifying time stamps or remapping the packet identifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/127Prioritisation of hardware or computational resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4344Remultiplexing of multiplex streams, e.g. by modifying time stamps or remapping the packet identifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

効率的な統合デジタルビデオトランスコーディングについて説明される。一態様では、統合トランスコーダは、符号化されたビットストリームを受信する。統合トランスコーダは、第1のメディアデータ形式に関連付けられている第1の変換に基づいて符号化されたビットストリームを部分的に復号化することにより符号化されたビットストリームをトランスコードする。この復号化オペレーションは、中間データストリームを生成する。次いで、統合トランスコーダは、第2のメディアデータ形式に関連付けられている第2の変換を使用して中間データストリームを符号化する。第1および第2の変換は同じでない。

Description

本発明は、効率的な統合デジタルビデオトランスコーディングに関する。
デジタルビデオコンテンツは、典型的には、特定のデータ形式を対象として生成される。ビデオデータ形式は、一般に、特定のビットレート、空間分解能、フレームレートなど有する、特定のビデオ符号化標準または専用符号化アルゴリズムに準拠する。このような符号化標準としては、MPEG−2およびWINDOWS(登録商標) Media Video(WMV)がある。ほとんどの既存のデジタルビデオコンテンツは、MPEG−2データ形式に従って符号化されている。WMVは、ストリーミング技術分野における公認コーデックとして広く受け入れられ、インターネット上に広く展開され、HD−DVDコンソーシアムにより採用され、現在は、SMPTE標準とみなされている。ビデオ符号化標準が異なれば、圧縮能力および画質も変わる。
トランスコーディングとは、ある圧縮ビットストリームを他の圧縮ビットストリームに変換する一般的プロセスのことである。多くの場合、デバイスの能力と配布ネットワークとを一致させるために、MPEG−2からWMV、H.264、さらにはスケーラブル形式への変換など、ある符号化形式から他の符号化形式への変換をビットストリームに対し実行することが望ましい。トランスコーティングは、無線チャネル上での伝送用のビットストリームのVCR類似機能、ロゴ挿入、または拡張誤り耐性能力能力などの何らかの特定の機能を実現するためにも使用できる。
図1は、従来のCascaded Pixel−Domain Transcoder(CPDT)システムを示しており、このシステムは、入力ビットストリームを復号化するフロントエンドデコーダと、異なる符号化パラメータセットまたは新しい形式の新しいビットストリームを生成するエンコーダとをカスケード接続したものである。この従来のトランスコーディングアーキテクチャの欠点の1つは、実用的展開に関して、典型的にはその複雑さが障害となっている点である。その結果、図1のCPDTトランスコーディングアーキテクチャは、典型的には、改善されたスキームの性能ベンチマークとして使用される。
図2は、従来のカスケードDCT領域トランスコーダ(CDDT)アーキテクチャを示しており、これは、図1のCPDTアーキテクチャを簡素化したものである。図2のシステムは、機能を空間的/時間的分解能のダウンスケーリングおよび符号化パラメータ変更に制限する。CDDTを使用すると、図1のCPDTトランスコーダにより実装されるDCT/IDCTプロセスが不要になる。それでも、CDDTは、DCT領域内でMCを実行するが、これは、典型的には、多大な時間を必要とし、また大量の計算を必要とするオペレーションである。これは、DCTブロックがMCブロックと重なり合うことが多いためである。その結果、CDDTアーキテクチャは、典型的には、DCT領域内でMCを実行するために複雑な、大量の計算を必要とする浮動小数点行列オペレーションを適用する必要がある。さらに、動きベクトル(MV)の微調整は、典型的には、CDDTアーキテクチャを使用したのでは実行不可能である。
ここでは、後でさらに説明される概念の抜粋を簡素化された形式で紹介する。ここでは、特許請求された主題の重要な特徴または本質的な特徴を識別することを意図されていないし、また特許請求された主題の範囲を決定する補助手段として使用されることも意図されていない。
上記に関して、効率的な統合デジタルビデオトランスコーディングについて説明する。一態様では、統合トランスコーダは、符号化されたビットストリームを受信する。統合トランスコーダは、第1のメディアデータ形式に関連付けられている圧縮技術の第1のセットに基づいて符号化されたビットストリームを部分的に復号化することにより符号化されたビットストリームをトランスコードする。この復号化オペレーションは、中間データストリームを生成する。次いで、統合トランスコーダは、第2のメディアデータ形式に関連付けられている圧縮技術の第2のセットを使用して中間データストリームを符号化する。圧縮技術の第1のセットおよび第2のセットは同じでない。
図中、コンポーネントの参照番号の一番左の数字は、そのコンポーネントが最初に出現する特定の図面であることを示す。
説明および例示のために、図の中で色を使用して、以下の規約を示す。青色の実線矢印は、実際の、または残りの画像データに関するピクセル領域信号を表す。赤色の実線の矢印は、DCT領域内の信号を表す。オレンジ色の破線の矢印は、動き情報を表す。
[概要]
効率的なデジタルビデオトランスコーディングのシステムおよび方法を図4から14を参照して以下に説明する。これらのシステムおよび方法では、入力ビットストリーム内の情報を使用することで、アプリケーションに、誤差伝搬の動的な制御、およびそれによる、ビデオビットストリームトランスコーディングの速度と品質の選択的な制御を実行させることができる。この選択的制御により、アプリケーションは、閉ループトランスコーディング(高速トランスコーディングプロファイル)から開ループ(高品質トランスコーディングプロファイル)へのトランスコーディング方式の継ぎ目のないスケーリングが可能になる。従来のトランスコーディングアーキテクチャ(例えば、図1のCPDTおよび図2のCDDT)とは対照的に、効率的なデジタルビデオトランスコーディングのアーキテクチャは、統合され、これにより異なる種類の離散コサイン変換(DCT)またはDCT類似変換を組み合わせて1つのトランスコーディングモジュールが形成される。効率的なビデオトランスコーディングを行うシステムおよび方法は、高速ルックアップテーブルで再量子化処理を実装し、三重閾値アルゴリズムを使用して精細ドリフト制御メカニズムを実現する。
一実装では、効率的なデジタルビデオトランスコーディングで、ビットストリームデータ形式(例えば、MPEG−2など)をWMVにトランスコードする場合、高品質プロファイルトランスコーディングオペレーションは、WMVの高度な符号化機能をサポートする。一実装では、高速プロファイルトランスコーディングオペレーションは、任意分解能2段階的縮小(例えば、高精細度(HD)から標準精細度(SD)にトランスコードする場合)を実行する。このような2段階的縮小オペレーションでは、縮小比の一部は、DCT領域内で効率よく得られるが、縮小比オペレーションは、実質的に分解能を低くして空間領域内において実行される。
[例示的な概念的基礎]
図3は、MPEG−2をWMVに変換する例示的な非統合カスケードピクセル領域トランスコーディング分割アーキテクチャ300を示す。この分割アーキテクチャは、復号化および符号化のオペレーションを別々のモジュールがそれぞれ実行するため、統合されない。図3の分割アーキテクチャは、効率的なデジタルビデオトランスコーディングのための統合されたシステムおよび方法について続いて説明するための概念的基礎をなす。表1は、図3の説明のため、シンボルおよびそれぞれの意味をまとめたものである。
Figure 2009508445
説明および例示のために、システム300は、ビットレートの低減、空間分解能の低減、およびその組合せとともにMPEG−2からWMVへのトランスコーディングに関して説明される。多くの既存のデジタルビデオコンテンツは、MPEG−2データ形式により符号化される。WMVは、ストリーミング技術分野における公認コーデックとして広く受け入れられ、インターネット上に広く展開され、HD−DVDコンソーシアムにより採用され、現在は、SMPTE標準とみなされている。
MPEG−2およびWMVは、圧縮および画質に関する様々な能力を備える。例えば、MPEG−2およびWMVによりそれぞれ使用される圧縮技術は、非常に異なる。例えば、動きベクトル(MV)精度および動き補償(MC)フィルタリング技術は、異なる。MPEG−2では、動き精度は、最大でも1/2ピクセル精度でしかなく、また補間法は、双一次フィルタリングである。対照的に、WMVでは、動き精度は、最大1/4ピクセル精度まで高められ、2つの補間法、つまり、双一次フィルタリングおよび双三次フィルタリングがサポートされる。さらに、フィルタリングプロセスに関わる丸め制御パラメータがある。WMVを使用すると、MPEG−2ビットレートに比べて、ビデオビットレートは最大50%まで低減され、しかも画質低下は無視できるくらい小さい。
他の実施例では、MPEG−2およびWMVにより使用される変換は、異なる。例えば、MPEG−2は、標準DCT/IDCTを使用し、変換サイズは、8×8に固定される。対照的に、WMVでは、変換カーネル行列の成分がすべての小さな整数である整数変換(VC1−T)を使用する。さらに、変換サイズは、8×8、8×4、4×8、および4×4のいずれかを使用してブロックからブロックへのWMVを使用することで変更することができる。MPEG−2は、フレームレベルの最適化をサポートしない。その一方で、WMVは、性能最適化のため様々なフレームレベル構文をサポートする。WMVは、強度補正、範囲低減、および動的分解能変更などの他の多くの高度な符号化機能をサポートする。
上記を考慮し、分解能の変更なしでビットレート低減を行うために、図3に示されているMPEG−2デコーダとWMVエンコーダのブリッジとなるフィルタリングプロセスは、全域通過フィルタである(つまり、効果がない)。したがって、フレーム(i+1)に対するエンコーダへの入力は、
Figure 2009508445
で表される。
この実装では、図3のWMV符号化効率は、より精細な動き精度から得られる。WMVでは、MPEG−2の場合のように共通の1/2ピクセル精度のほかに1/4ピクセル動き精度が許される。さらに、WMVでは、MCフィルタリングに対する双三次補間と呼ばれるより適切な、より複雑な補間が可能である。双一次補間は、1/2ピクセルMCに対するMCモジュール(MCmp2)においてMPEG−2に使用される。双一次補間法は、MPEG−2双一次補間が丸め制御を行わないことを除き、WMVで使用されるのと似た方法である。高速化するために、1/2ピクセルの動き精度をエンコーダ部分に実現することができる。これに対する理由の1つは、絶対的なオリジナルフレームの欠如である(つまり、ビットストリーム入力データ(BS_IN)は、すでに圧縮されている)。したがって、この実施例では、より正確な、しかも意味のある動きベクトルを得ることは難しい。その一方で、MPEG−2デコーダから得られる動き情報(つまり、MVvc1=MVmp2)は、直接再利用できる。分解能変更はないため、この仮定ではMV精度の低下はない。エンコーダが、さらに、双一次補間を使用し、丸め制御パラメータを常にオフに強制するように制約されている場合、動き補償が線形オペレーションであるとの妥当な仮定の下で、丸め誤差を無視すると(つまり、MCvc9=MCmp2)、式1は、
Figure 2009508445
のように簡略化される。式2により、図3の基準CPDTトランスコーダを簡素化できる。このような簡素化されたアーキテクチャは、図5を参照しつつ以下で説明される。簡素化されたアーキテクチャについて説明する前に、効率的なデジタルビデオトランスコーディングを行う例示的なシステムについて、最初に説明する。
[例示的なシステム]
必要というわけではないが、パーソナルコンピュータなどのコンピューティングデバイスによって実行されるコンピュータ−プログラム命令の一般的背景状況において効率的なデジタルビデオトランスコーディングについて説明する。一般に、プログラムモジュールは、特定のタスクを実行する、または特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。これらのシステムおよび方法は、前記の文脈において説明されているが、以下で説明される活動およびオペレーションは、ハードウェアでも実装することができる。
図4は、効率的なデジタルビデオトランスコーディングを行う例示的なシステム400を示している。この実装では、システム400のオペレーションは、ハイブリッドDCTおよびブロックベース動き補償(MC)ビデオ符号化方式に関して説明され、多くのビデオ符号化標準および専用形式がこの方式に基づく。より具体的には、システム400は、MPEG−2からWMVにトランスコードするために使用されるアーキテクチャ、コンポーネント、およびオペレーションと併せて説明される。しかし、MPEG−2をWMVにトランスコードするためのシステム400により具現化されるスケーラブルな複雑度および効率のトランスコーディングについて説明されるアーキテクチャ、コンポーネント、およびオペレーションは、さらに、MPEG−2およびWMVに加えて他のビットストリームデータ形式変換に適用することもできることは理解されうる。例えば、一実装では、システム400を使用して、MPEG−2ビットストリームをMPEG−4ビットストリームにトランスコードし、MPEG−4ビットストリームデータをWMVビットストリームデータにトランスコードするといったことを行う。このような代替え実施形態では、システム400の以下で説明されるトランスコーディングアーキテクチャ(コンポーネントおよびそれに関連するオペレーションを含む)では、復号化され、符号化され、それぞれのデータ形式であるビットストリームデータの種類を考慮する。
この実装では、システム400は、汎用コンピューティングデバイス402を含む。コンピューティングデバイス402は、パーソナルコンピュータ、ラップトップ、サーバ、ハンドヘルドまたはモバイルコンピューティングデバイスなどのどれかのタイプのコンピューティングデバイスを表す。コンピューティングデバイス402は、第1のデータ形式(例えば、MPEG−2)で符号化されたビットストリームを異なるデータ形式(例えば、WMV)で符号化されたビットストリームにトランスコードするプログラムモジュール404およびプログラムデータ406を備える。プログラムモジュール404は、例えば、効率的なデジタルビデオトランスコーディングモジュール408(「トランスコーディングモジュール408」)および他のプログラムモジュール410を含む。トランスコーディングモジュール408は、符号化されたメディア412(例えば、MPEG−2メディア)を、トランスコードされたメディア414(例えば、WMVメディア)にトランスコードする。他のプログラムモジュール410としては、例えば、オペレーティングシステムおよびトランスコーディングモジュール408のビデオビットストリームトランスコーディング機能を利用するアプリケーションなどがある。一実装では、このアプリケーションは、オペレーティングシステムの一部である。一実装では、トランスコーディングモジュール408は、そのトランスコーディング機能を、アプリケーションプログラミングインターフェース(API)416を介してアプリケーションに公開する。
[高速プロファイルトランスコーディング]
図5は、誤差伝搬のない例示的な簡素化された統合閉ループカスケードピクセル領域トランスコーダを示す。説明および例示のために、図5のコンポーネントは、図4のコンポーネント参照しつつ説明される。例えば、図5のアーキテクチャは、図4のトランスコーディングモジュール408の例示的なアーキテクチャの一実装を表す。図3のアーキテクチャと比較して図5のアーキテクチャを参照し、これが、独立したエンコーダおよびデコーダコンポーネントを持たない統合アーキテクチャであることに留意されたい。さらに、MV微調整動き推定モジュールが、MPEG−2デコーダ内のMCから取り除かれることに留意されたい。さらに、WMVエンコーダ内のMCは、累積再量子化誤差に作用するMCにマージされる。このようにして、図5のトランスコーディングアーキテクチャは、プログレッシブおよびインターレースのビデオデータ形式の高速トランスコーディングに関わる計算の複雑さを大幅に低減する。
WMV変換は、MPEG−2で使用されているのと異なることに留意されたい。MPEG−2では、標準浮動小数点DCT/IDCTが使用されるが、WMVでは、エネルギーパッキング特性がDCTに類似している整数変換が採用される。その結果、MPEG−2デコーダのIDCTとWMVエンコーダのVC1−Tは、互いに相殺することはない。WMVの整数変換は、DCT/IDCTの整数実装と異なる。WMV整数変換は、すべての変換係数が小さな整数であるように慎重に設計される。従来のトランスコーダは、第1の変換に関して符号化されたビットストリームを第1の変換と同じではない第2の変換にトランスコードするように統合されていない。
式3は、8×8VC1−Tの例示的な変換行列を示している。
Figure 2009508445
式3と後述の式4および5との組合せは、2つの異なる変換が、トランスコーディングモジュール408のスケーリングコンポーネント内にどのように実装されるかを示している(図4)。一実装では、VC1−Tの精度は、16ビット精度であり、これは、MMX実装に非常に適している。その結果、コーデックの複雑さを大幅に低減できる。
図6は、例示的な簡素化された閉ループDCT領域トランスコーダを示している。図6のアーキテクチャは、トランスコーディングモジュール408の例示的なアーキテクチャの一実装を表す(図4)。図6のアーキテクチャ600は、図5のアーキテクチャ500と比較して簡素化されているアーキテクチャである。図6を参照し、C8を標準DCT変換行列、Bを逆量子化MPEG−2 DCTブロック、bをBのDCTとすると、MPEG−2 IDCTは、
Figure 2009508445
のように計算される。そこで、
Figure 2009508445
をbのVC1−Tとすると、
Figure 2009508445
Figure 2009508445
として計算され、ただし、oは、2つの行列の成分毎の乗算を表し、N88は、VC1−T変換の正規化行列であり、これは、
8=[8/288 8/289 8/292 8/298 8/288 8/289 8/292 8/298]
として、
Figure 2009508445
のように計算される。
Figure 2009508445
は、Bから直接計算され、その際に、式
Figure 2009508445
を使用する。
Figure 2009508445
および
Figure 2009508445
が対角行列に非常に近いことを検証するために、近似を適用する場合、式4は、行列Bの要素毎のスケーリングとなる。つまり、
Figure 2009508445
として、
Figure 2009508445
となる。
式5は、WMVエンコーダのVC1−TとMPEG−2デコーダのIDCTをマージできることを示している。その結果、図5のアーキテクチャは、図6に示されているアーキテクチャにさらに簡素化されうる。詳細な比較を行うと、2つのDCT/IDCTモジュールは、2つのCV1−Tおよび逆VC1−Tモジュールで置き換えられることがわかる。一実装では、単純なスケーリングモジュールも加えられる。このアーキテクチャでは、2つのスイッチが、アクティビティマスクとともに埋め込まれる。これらの埋め込まれたコンポーネントは、後述のように、トランスコーダ408のトランスコーディングコーティングオペレーションの複雑さを動的に制御するために使用される(図4)。この時点で、これらのコンポーネントは、接続されている。WMV変換の16ビット算術オペレーション特性は、PCおよびDSPの並列処理に役立つ。したがって、計算の複雑さは、大幅に低減される。さらに、スケーリング行列S88のすべての成分は、互いに関して実質的に近接しているため、この計算、および一実装は、スカラー乗算で置き換えられる。
図5および6は、フィードバックループが関与するそれぞれの例示的な閉ループトランスコーディングアーキテクチャを示している。この実装では、VC−1逆量子化、VC−1逆変換、残誤差累積、および累積誤差に対するMCを含む、フィードバックループは、VC−1再量子化プロセスによりもたらされる誤差を補償する。再量子化誤差は、図1に示されているような、ビットレート削減トランスコーダに対するドリフト誤差の主原因である。図5および6のトランスコーディングアーキテクチャは、誤差補償があっても完全にドリフト誤差をなくすわけでないが、ドリフト誤差は非常に小さい。これは、動き補償フィルタリングの際のドリフト誤差の残りの原因が丸め誤差であるからである。残誤差補償のメリットの1つは、図5および6のアーキテクチャは、表2に関して後述のように、補償プロセスを動的にオンまたはオフにする機能を実現することである。図6のトランスコーディングアーキテクチャでは、実質的に最適な方法で、SDからSDへの、またはHDからHDへの変換など、MPEG−2からWMVへの純粋なビットレート削減トランスコーディングを実行する。
より具体的には、従来のカスケードトランスコーダアーキテクチャ(例えば、図1および2のアーキテクチャ)は、複雑度柔軟性を欠いている。計算量削減に関して、そのような従来のアーキテクチャが達成できる大半のことは、MV再利用およびモードマッピングを介してのものである。その一方で、累積残誤差補償アーキテクチャ、例えば、図6のアーキテクチャ(および後述の図8と10のアーキテクチャ)は、複雑度に関するスケーラビリティを組み込んでいる。表2は、図6のスイッチの例示的な意味を示している。
Figure 2009508445
図4のトランスコーディングモジュール408がドリフトのない簡素化を実装した後、アプリケーションは、複雑度とトランスコーディング速度を加速する品質との間のトレードオフの関係を動的に設定することができる。この実装では、品質は、速度を引き換えに、速度は、品質を引き換えに設定することができる。言い換えると、ある種のドリフト誤差は、他の簡素化されたトランスコーダにおいて許容されることがあるということである。この戦略では、高速な方法で持ち込まれるドリフト誤差は、制限され、完全に制御可能である。この考慮事項に基づき、3つのスイッチ(S0、S1、およびS2)は、図6、8、および10のアーキテクチャで実現される。これらのスイッチは、残誤差補償ベースのアーキテクチャにのみ使用される。これらのスイッチは、いくつかの時間のかかるオペレーションを選択的にスキップし、複雑度を実質的に低減するが、誤差はごくわずかしか入り込まない。様々なスイッチの意味は、表2にまとめられている。これらのスイッチに関連付けられている計算決定は、それぞれのスイッチに関して後述の基準により効率的に得られる。
スイッチS0は、いつブロックの再量子化誤差を累積して残誤差バッファに入れるべきかを制御する。標準再構成セレクタと比較して、スイッチS0の役割は、高速ルックアップテーブルベースの再量子化プロセスを採用し、三重閾値アルゴリズムを介してより精密なドリフト制御メカニズムを実現することにより改善される。その結果、スイッチS0に関して得られる観察結果はすべて、考慮される。例えば、一実装では、DCT領域エネルギー差をインジケータとして使用することができる。
スイッチS1は、最も時間のかかるモジュールの実行時期、累積残誤差のMCを制御する。一実装では、スイッチS1はオンである。基準フレームに対し、2値アクティビティマスクが作成される。アクティビティマスクのそれぞれの要素は、
Figure 2009508445
により決定されるように、8×8ブロックのアクティブ性に対応するが、ただし、Energy(blocki)は、累積残誤差バッファ内のブロックのエネルギーである。一実装では、Energy(blocki)は、計算された空間領域またはDCT領域である。Energy(blocki)は、絶対値の総和により近似することができる。MVが、低アクティビティの領域に属しているブロックを指している場合、その特定のブロックに対する累積残誤差のMCは、スキップされる。
スイッチS2は、早期検出を実行して、ブロック誤差を符号化すべきかどうかを決定する。これは、エンコーダが粗い量子化ステップサイズを適用する場合にアプリケーションをトランスレートするのに特に有用である。この実装では、入力信号(累積残誤差のMCとMPEG−2デコーダから再構成された残差の総和)が、閾値よりも弱い場合、誤差が符号化されないようにスイッチS2はオフにされる。
一実装では、スイッチS0、S1、およびS2に対する閾値は、前の方の基準フレームが高い品質、遅い速度で処理されるように調節される。これは、スイッチの目的が、品質と速度との間のトレードオフの関係を高めることであり、また予測符号化の特性があるからである。
[高品質プロファイルトランスコーダ]
ビットレート変更が大きな変更でないか、または入力ソース品質があまり高くない場合、図6のアーキテクチャでは、MPEG−2ビットストリームをWMVビットストリームに変換する際にビットレート削減を実質的に最適化する。他方、入力ソースが高品質であり、高品質出力が望ましく、さらにトランスコーディングの速度は、中程度の要求条件(例えば、リアルタイム)としてよい。MV微調整が行われる図3のカスケードピクセル領域トランスコーダ(CDPT)などの高品質プロファイルトランスコーダは、これらの基準を満たす。このアーキテクチャを使用すると、最高の符号化効率が必ず達成されるように、WMVエンコーダのすべての拡張符号化機能をオンにすることができる。
[分解能変更]
従来のメディアトランスコーディングシステムでは、一般に、空間分解能縮小機能でトランスコードする際に3つの誤差源がある。これらの誤差は、以下のとおりである。
・ 縮小:縮小されたビデオを得る際に生じる誤差。典型的には、画質と複雑度との間のトレードオフの関係を考慮するように縮小フィルタのオペレーションを設計する場合、特に空間領域において縮小する場合に、ハード配線を選択する。
・ 再量子化誤差:純粋なビットレート削減トランスコーディングプロセスの場合と同様に、これは、再量子化ステップサイズが粗い再量子化による誤差である。
・ MV誤差:MVが不正であると、動き補償予測は誤ることになる。その結果、再量子化誤差がどれだけ補償されようと、またビットレートがどの程度高かろうと、新しいMVおよびモードに基づいて動き補償を再計算しなければ完全な結果を得ることは困難である。WMVがBフレームに対するMVモードを1つかサポートしないので、これは、Bフレームをトランスコードする従来のシステムの問題である。これは、最適化を実行する必要がある場合に、符号化モードが変更される、例えば、4MVモードから1MVモードに変わるため、問題となる可能性もある。さらに、一般的に、クロミナンス成分に対する問題が存在するが、それは、典型的には単一のMVで補償されるからである。(これは、Pフレームに適用される場合には説明されている効率的なデジタルビデオトランスコーディングアーキテクチャの問題ではない。これに対する理由の1つは、WMVがPフレームに対する4MV符号化モードをサポートすることである。)
トランスコーディングモジュール408(図4)のオペレーションでは、ここで説明されるように、最後の2つの誤差発生源を解消する。
[再量子化誤差補償]
Dはダウンサンプリングフィルタリングを表すものとする。図3のアーキテクチャを参照すると、フレーム(i+1)に対するVC−1エンコーダへの入力は、
Figure 2009508445
に従って導かれることがわかる。MCvc1=MCmp2、mvmp2=mvvc1=MVmp2/2であると仮定する。近似は、
Figure 2009508445
である。式6は、
Figure 2009508445
に簡素化される。
式8の第1の項
Figure 2009508445
は、復号化されたMPEG−2残留信号の縮小プロセスを指している。この第1の項は、空間領域ローパスフィルタリングおよびデシメーションを使用して決定することができる。しかし、DCT領域縮小機能を使用してこの項を求めることで、複雑度が低減され、PSNRおよび画質が向上する。DCT領域縮小結果は、係数(−1,0,9,16,9,0,−1)/32を使用する空間領域双一次フィルタリングまたは空間領域7タップフィルタリングを通じて得られる結果よりも実質的によい。この実装では、DCT領域縮小機能は、左上4×4低周波DCT係数のみを保持する。つまり、保持されているDCT係数上で標準4×4IDCTを適用すると、空間的2:1縮小画像(つまり、図4のトランスコードされたメディア414)が得られる。
式8の第2の項
Figure 2009508445
は、縮小分解能に対する再量子化誤差補償を意味する。この実装では、MPEG−2デコーダのMCおよびWMVエンコーダのMCは、低減された分解能で累積再量子化誤差に作用する単一MCプロセスにマージされる。
図7は、4つの4×4DCTブロックのオペレーションを1つの8×8DCTブロックにマージする例示的なマージオペレーションを示している。実用上の問題が1つ残っている。DCT領域縮小では、4つの8×8DCT(元の分解能のMPEG−2マクロブロック(MB)内のブロックB1からB4)は、低減された分解能で、そのままDCT領域において、新しいMBの8×8ブロックの4つの4×4サブブロックにマッピングされる(例えば、図7を参照)。WMVでは、PフレームおよびBフレームに対し、4×4変換タイプが許される。その結果、上述のスケーリングを除き、ほかにする必要はない。しかし、Iフレームについては、8×8変換タイプのみが許される。そのため、Iフレームを扱うときには、トランスコーディングモジュール408(図4)は、4つの4×4低周波DCTサブブロックを8×8DCTブロック1個
Figure 2009508445
に変換する。一実装では、これは、4つの4×4DCTサブブロックをピクセル領域に逆変換し、次いで、新しい8×8VC1−Tを適用することにより行われる。一実装では、計算の複雑度を低減するために、これはDCT領域内で行われる。
例えば、
Figure 2009508445
および
Figure 2009508445
は、それぞれB1、B2、B3、およびB4の4つの4×4低周波サブブロックを表すものとし、C4は、4×4標準IDCT変換行列であり、T8は、整数WMV変換行列であり、さらに、T8[TL,TR]とし、TLおよびTRは8×4行列である。このシナリオでは、
Figure 2009508445
は、
Figure 2009508445
および
Figure 2009508445
から、式
Figure 2009508445
を使用して直接計算される。何らかの操作をした後、
Figure 2009508445
は、
Figure 2009508445
のように効率的に計算されるが、ただし、
Figure 2009508445
である。一実装では、上記の式のCおよびDは両方とも、事前に計算される。最終結果は、N88で正規化される。
図8は、簡素化されたDCT領域数値2:1分解能縮小トランスコーダに対する例示的なアーキテクチャ800を示している。一実装では、図4のトランスコーディングモジュール408は、例示的なアーキテクチャ800を実装するものである。このアーキテクチャのスイッチは、表2を参照しつつ上で説明されているように、図6のと同じ機能を有する。図8、および一実装を参照すると、第1の2つのモジュール(MPEG−2 VLDおよび逆量子化)は、図6に示されているのと比べて簡素化されていることがわかる。これは、トランスコーディングモジュール408は、8×8ブロックから左上4×4部分のみを取り出す。
ドリフト誤差補償が低減された分解能で行われる従来の低ドリフトのトランスコーダと比べて、図6および8のトランスコーダは、混合ブロック処理モジュールを含まない。これは、WMVが、インター符号化されたマクロブロック内の8×8ブロックに対するイントラ符号化モードをサポートしているからである。言い換えると、元の分解能のイントラMBは、低減された分解能のインターMBのイントラ8×8ブロックにマッピングされるということである。したがって、MBモードマッピング規則は、
Figure 2009508445
に示されているように、非常に単純な規則になる。既存の混合ブロック処理オペレーションは、典型的には、完全分解能の画像を再構成するために復号化ループを必要とする。したがって、混合ブロック処理を取り除くと、従来のシステムに比べて計算量を実質的に削減できる。
簡素化されたDCT領域2:1分解能縮小トランスコーディングアーキテクチャ800は、Pフレームについては実質的にドリフトを含まない。これは、4MV符号化モードの結果である。ドリフト誤差の唯一の原因は、縮小フィルタリングを使用するCPDTアーキテクチャと比べると、MVを1/4分解能から1/2分解能に丸めること(mvmp2=mvvc1を保証する)とMCおよび縮小の非可換的特性である。そのような残りの誤差は、ローパス縮小フィルタリングのせいで無視できるくらい小さい(例えば、DCT領域またはピクセル領域内で達成される)。
図9は、一実施形態による、2:1空間分解能縮小トランスコーディングオペレーションのインターレースメディアに対し4つの4×4DCTブロックのオペレーションを1つの8×8DCTブロックにマージする実施例を示す。2:1縮小は、元のフレームの分解能を、水平方向と垂直方向の両方において2だけ変更する。一実装では、このインターレースプロセスは、図4のトランスコーディングモジュール408により実装される。より具体的には、インターレース符号化コンテンツでは、すべてのMB内の左上8×4サブブロックは、ショートカットMPEG−2デコーダにより再構成され、両方のフィールドは、垂直方向でローパスフィルタにより平滑化され、次いで1つのフィールドが、WMV符号化プロセスの前に削除される。
[MV誤差補償]
WMVは、4MV符号化モードをサポートするが、典型的には、Pフレームを符号化することのみ対象とする。その結果、システム400(図4)は、入力MPEG−2ストリーム内にBフレームがないか、またはより低い時間的分解能に向けてトランスコーダ実行時にBフレームが破棄される場合に、図6のアーキテクチャを実行する。これに対する理由の1つは、WMVがBフレームについてMB毎にMVを1つしか許さないという点である。このようなシナリオでは、トランスコーディング408(図4)は、元の分解能でMBに関連付けられている4つのMVから新しい動きベクトルを合成する。前述のMV合成方法のそれぞれは、互換性を有する。一実装では、トランスコーディングモジュール408は、中央値フィルタリングを実行する。説明されているように、MVが不正であると、動き補償予測は誤ることになる。さらに悪いことに、再量子化誤差がどれだけ補償されようと、またビットレートがどの程度高かろうと、新しいMVに基づいて動き補償を再実行しない場合に完全な結果を得ることは困難である。そこで、このような動き誤差を補償できるアーキテクチャを実現する。
再び、図3のアーキテクチャを参照すると、Bフレームであると仮定される、フレーム(i+1)に対するVC−1への入力は、
Figure 2009508445
のように導かれ、近似は
Figure 2009508445
である。
式9は、
Figure 2009508445
に簡素化される。式11に関して、
Figure 2009508445
が得られる。
式12の中の角かっこ内の2つの項は、矛盾したMV(つまり、mvmp2は、mvvc1と異なる)により引き起こされるか、またはMPEG−2とWMVとの間の異なるMCフィルタリング法により引き起こされる動き誤差を補償する。この目的に対する対応するモジュールは、ハイライトされ、図10では、淡黄色ブロックにまとめられる。
図10は、一実施形態による、完全なドリフト補償が行われる例示的な簡素化された2:1縮小トランスコーダアーキテクチャを示している。一実装では、図4のトランスコーディングモジュール408は、図10の例示的なアーキテクチャを実行する。式12を参照する際に、
Figure 2009508445
は、元のインターMBに対応するすべての8×8ブロック、および1/4ピクセル精度を有するmvmp2=MVmp2/2について実行されることに留意されたい。VC−1エンコーダで使用されるMVは、単一のMV:mvvc1=median(MVmp2)/2である。動き誤差補償モジュールに関して、mvvc1の精度は、1/4ピクセルレベルになりうることに留意されたい。式12の最後の項は、基準フレームの再量子化誤差を補償する。Bフレームは、他のフレームの基準ではないため、誤差に強い。その結果、アプリケーション側で、高速化を達成するため誤差補償機能を安全にオフにすることができる。ここでもまた、このような近似は、Bフレームのみを対象としたものである。動き誤差補償に対するMCは、再構成されたピクセルバッファに作用するが、再量子化誤差補償に対するMCは、累積残誤差バッファに作用することに留意されたい。
MCに関して、イントラ−インター、またはインター−イントラの変換を適用することができる。これは、MPEG−2デコーダがBフレームおよび基準フレームを再構成したからである。この実装では、この変換は、図10の混合ブロック処理モジュール内で実行される。2つのモード合成法が可能である。一実装では、基本モードが合成モードとして選択される。例えば、元の分解能の4つのMBのモードが、2つの双方向予測モード、1つの逆方向予測モードと1つの順方向予測モードである場合、双方向予測モードが、低減された分解能のMBに対するモードとして選択される。他の実装では、最大の誤差をもたらすモードが選択される。この実施例に関して、逆方向モードを使用すると、最大の誤差が生じる。このシナリオでは、誤差を補償できるように逆方向モードが選択される。結果から、後者の技術は、前者のモード選択技術に比べてわずかに優れた品質を示すことがわかる。
式12による例示的なアーキテクチャが、図10に示されている。表3に示されているように、特にこのアーキテクチャに対する4つのフレームレベルのスイッチがある。
Figure 2009508445
4つのフレームレベルのスイッチにより、異なるフレームタイプに異なる符号化経路が確実なものとされる。特に、アーキテクチャは、Bフレーム(SIP)に対する残誤差累積を実行せず、IおよびPフレーム(SB)に対するMV誤差補償を実行せず、生成すべきBフレーム(SIP/B)がない場合には基準フレームを再構成しない。対応する4つの元のMVが著しく矛盾する場合のみMV誤差が補償される必要があるため、フレームレベルスイッチSBはブロックレベルスイッチに変えることができることに留意されたい。
より具体的には、スイッチSIPは、IフレームまたはPフレームのみについて閉じられ、スイッチSPは、Pフレームのみについて閉じられ、スイッチSBは、Bフレームについてのみ閉じられる。結果として得られるアーキテクチャは、図3の基準カスケードピクセル領域トランスコーダほど複雑ではない。これに対する理由の1つは、明示的なピクセル領域縮小プロセスが回避されることである。その代わりに、ピクセル領域縮小は、高いDCT係数を単純に破棄することによりDCT領域において暗黙のうちに実行される。このアーキテクチャでは、表2に関して上で説明されているように、様々なスイッチを使用することにより優れた複雑度スケーラビリティが実現される。
超高速のトランスコーディング速度を必要とするアプリケーションでは、図10のアーキテクチャは、すべてのスイッチをオフにすることにより開ループ内に構成されうる。この開ループアーキテクチャは、さらに、MPEG−2の逆量子化プロセスとWMVの再量子化プロセスをマージすることにより最適化されうる。また、MPEG−2の逆ジグザグスキャンモジュール(VLD内)をWMVエンコーダ内のモジュールと組み合わせることもできる。
[クロミナンス成分]
MPEG−2およびWMVのクロミナンス成分に関して、クロミナンス成分(UV)のMVおよび符号化モードは、ルミナンス成分(Y)から導かれる。低減された分解能のMBに対応する元の分解能の4つのMBすべてが、矛盾しない符号化モードを持つ場合(つまり、すべてのインター符号化またはすべてのイントラ符号化)、問題はない。しかし、その場合でなければ、MPEG−2およびWMVの異なる派生規則により問題が生じる。MPEG−2では、MBがインターモードで符号化される場合に、UVブロックはインター符号化される。しかし、WMVでは、MBがインターモードで符号化され、イントラ符号化された8×8Yブロックが3個未満である場合にのみ、UVブロックはインター符号化される。この問題は、PフレームとBフレームの両方に存在する。図4のトランスコーディングモジュール408は、以下のようにこれらの問題を解消する。
・ インター−イントラ変換:インター符号化されたMBが3つのイントラ符号化された8×8Yブロックを持つ場合(インター符号化されたMBで4つすべての8×8Yブロックをイントラ符号化することは不可能である)、UVブロックはイントラ符号化される。この場合、元の分解能の1つのMBは、対応するUVブロックとともにインター符号化される。これらのUVブロックは、インターモードからイントラモードに変換される。人視覚系(HVS)は、クロミナンス信号に対する感度が弱いため、トランスコーディングモジュール408では、空間的隠し技術を使用して、8×8UVブロックをインターモードからイントラモードに変換する。一実装では、DC距離は、隠し方向を決定するためのインジケータとして使用される。隠しは、単純なコピーまたは他の補間法を介して行われる。
・ イントラ−インター変換:インター符号化されたMBが1つまたは2つのイントラ符号化された8×8Yブロックを有している場合、トランスコーディングモジュール408は、UVブロックをインター符号化する。このシナリオでは、元の分解能の4つの対応するMBのうちに1つまたは2つのイントラ符号化されたMBがある。これらのUVブロックは、イントラモードからインターモードに変換される。この実装では、トランスコーディングモジュール408は、ゼロ設定法と呼ばれる時間的隠し技術を使用して、これらのブロックを処理し、これにより復号化ループを回避する。
誤差隠しオペレーションを使用してクロミナンス成分のモード変換を処理すると、現在のフレームに持ち込まれた誤差は無視できるくらい小さく、したがって無視できるが、ただし、その後のフレームで色ずれを生じることがある。クロミナンス成分に対するドリフトは、典型的には、不正な動きにより生じる。これに対処し、品質を向上させるために、一実装では、トランスコーディングモジュール408は、クロミナンス成分に再構成ベースの補償を使用する(つまり、クロミナンス成分に対し淡黄色モジュールを常に適用する)。
[レート制御]
図11は、デコーダに対する例示的な仮想バッファベリファイヤバッファ(VBV)を示す。図11のVBVモデルに基づくデコーダは、典型的には、既存のMPEG−2ビットストリームを検証する。この実装では、ビデオレートが入力レートに比例して減少する場合、トランスコードされたWMVビットストリームは、自動的に、VBVの要求条件を満たすことになる。この点で、本明細書の効率的なデジタルビデオトランスコーディングアーキテクチャでは、すべてのフレームに対し、符号化されたフレームサイズが入力フレームサイズに比例する。これらの新規性のあるアーキテクチャでは、目標フレームサイズと実際の結果として得られるフレームサイズとの累積された差を継続的に補償し、学習を介して、異なるビットレート範囲について直線量子化ステップ(QP)マッピング規則を構成する。
高いビットレートでは、符号化ビット(B)とMPEG−2 TM−5レート制御法でも使用される量子化ステップ(QP)との間に近似式がある。
Figure 2009508445
ただし、Sは、フレームの複雑度であり、Xは、モデルパラメータである。フレームの複雑度は異なるコーデックでも同じままであると仮定すると、
Figure 2009508445
となるが、ただし、QPvc1は、WMV再量子化で使用されるQP値であり、QPmp2は、MPEG−2量子化のQP値であり、kは、目標ビットレートに関係するモデルパラメータである。一実装では、線形モデル
QPvc1/QPmp2=k・(Bmp2/Bvc1)+t (14)
が使用される。低、中、および高ビットレートの場合のパラメータkおよびtの値は、直線回帰法を使用して表4にまとめられている。
Figure 2009508445
式14に基づく例示的な詳細レート制御アルゴリズムが、表5に示されており、表5に示されているアルゴリズム内の様々なシンボルの意味は、以下の表6において定義されている。
Figure 2009508445
Figure 2009508445
[任意分解能変更]
例えば、レガシーSD受信機/プレーヤをサポートするため行われるHD分解能からSD分解能へのコンテンツの変換は有用である。HD形式の典型的な分解能は、1920×1080iおよび1280×720pであるが、SDに対しては、720×480i、NTSCに対しては720×480pである。1920×1080iから720×480iまでの水平および垂直の縮小比は、それぞれ、8/3および9/4である。アスペクト比を保つために、最終縮小比は、8/3となるように選択され、その結果得られる画像サイズは、720×404となる。同様に、1280×720pから720×480pでは、縮小比は、16/9となるように選択され、その結果得られる画像サイズは、720×404となる。デコーダ/プレーヤにより、720×480の完全画像となるように黒色バナーが挿入される(ビットストリームにパディングされる代わりに)。
デジタル信号処理理論によれば、縮小比m/nに対する実質的に最適な縮小方法は、最初に、信号をn倍でアップサンプリングし(つまり、元のサンプルとサンプルとの間にn−1個のゼロを挿入し)、ローパスフィルタ(例えば、多数のタップを有するサイン関数)を適用し、次いでその結果得られた信号をm倍でデシメートすることである。このようなオペレーションを実行することで、縮小により入り込むスペクトルエイリアシングは、最大限抑制される。しかし、このプロセスは、非常に多量の計算を必要とし、入力信号が高品位であるためリアルタイムで実行することが困難である。この計算複雑度を低減するために、新規性のある2段階縮小戦略がとられる。
図12は、一実施形態による、任意空間分解能縮小機能を持つトランスコーダを示している。一実装では、図4のトランスコーディングモジュール408は、図12のアーキテクチャを実行する。一実装では、任意縮小トランスコーダは、図12などの非統合トランスコーダである。他の実装では、図12に関して後述される、以下の任意縮小トランスコーディングオペレーションは、図5、6、8、および/または10に示されているような統合トランスコーダで実行される。
図12を参照すると、システム1200は、任意縮小目標を得るために2段階縮小オペレーションを実行する。第1段階縮小の結果は、復号化ループ内に埋め込まれる。これにより、復号化オペレーションの複雑度が低減される。例えば、8/3の縮小比を得るために、縮小オペレーションが最初に実行され、2/1に縮小する。この第1段階縮小の結果は、復号化ループ内に入力され、そこで、第2段階縮小が、空間領域内で実行される。この実施例では、第2段階縮小オペレーションは、4/3の縮小を行い、8/3縮小比を得る。他の実施例では、システム1200により、4/3縮小を2回適用して(2段階で)、縮小比16/9が得られる。この2段階縮小方法では、すでに説明されているDCT領域縮小戦略を使用し、第1段階縮小結果を復号化ループ内に完全に埋め込む。分解能は、第1段階縮小後に著しく低減されるため、ピクセル領域上で最適な縮小方法を適用し続けることができる。
図12を参照する際に、複数のMV
Figure 2009508445
が新しいMB(MVスケーリングおよびフィルタリングモジュール)に関連付けられていることに留意されたい。
[例示的な手順]
図13は、一実施形態による、効率的なデジタルビデオトランスコーディングを行う手順1300を例示する。一実装では、図4のトランスコーディングモジュール408は、手順1300のオペレーションを実行する。図13を参照すると、ブロック1302において、この手順は符号化されたビットストリーム(例えば、図4の符号化されたメディア412)を受け取る。ブロック1304で、この手順は、第1のメディアデータ形式(例えば、MPEG−2、MPEG−4など)に関連する圧縮技術の第1のセットに従って符号化されたビットストリームを部分的に復号化する。この部分的復号化オペレーションで、中間データストリームを生成する。統合トランスコーダは、完全な復号化を実行しない。例えば、「概念的な」MPEG−2デコーダのMCが、WMVエンコーダのMCとマージされる場合、復号化オペレーションを、MPEG−2復号化を実行するものとして記述することは難しい。ブロック1306で、中間データストリームの縮小が望ましい場合、この手順は、第1の縮小段階において符号化されたビットストリームに関連付けられているデータを縮小する。第1の縮小段階は、復号化ループのDCT領域内で実行される。ブロック1308で、2段階縮小が望ましい場合、この手順は、さらに、空間領域において、DCT領域内で縮小されたデータを縮小する(ブロック1306を参照)。
ブロック1310で、圧縮技術の第1のセットに従って復号化されたデータは、圧縮技術の第2のセットにより符号化される。一実装では、手順1300は、図に示され、また図12および14に関して説明されているような非統合トランスコーディングアーキテクチャ内に実装される。この実装では、圧縮技術の第2のセットは、圧縮技術の第1のセットと同じである。他の実装では、手順1300は、図に示され、また図5〜11および14に関して説明されているような統合トランスコーディングアーキテクチャ内に実装される。この実装では、圧縮技術の第2のセットは、圧縮技術の第1のセットと同じでない。例えば、一実装では、圧縮技術の第1のセットは、MPEG−2に関連付けられ、圧縮技術の第2のセットは、WMVに関連付けられる。
[例示的な動作環境]
図14は、効率的なデジタルビデオトランスコーディングを完全にまたは部分的に実装できる好適なコンピューティング環境の一実施例を示している。例示的なコンピューティング環境1400は、図4の例示的なシステム400の好適なコンピューティング環境の一例にすぎず、本明細書で説明されているシステムおよび方法の使用または機能性の範囲に関する制限を示唆する意図はない。コンピューティング環境1400は、コンピューティング環境1400に示されている1つのコンポーネントまたはその組合せに関係する何らかの依存関係または要求条件がその環境にあるものと解釈すべきでない。
本明細書で説明されている方法およびシステムは、他の数多くの汎用または専用コンピューティングシステム、環境、または構成で動作する。使用に適していると思われるよく知られているコンピューティングシステム、環境、および/または構成の実施例として、限定はしないが、パーソナルコンピュータ、サーバコンピュータ、マルチプロセッサシステム、マイクロプロセッサベースのシステム、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記システムまたはデバイスを含む分散コンピューティング環境などがある。フレームワークのコンパクト版またはサブセット版も、ハンドヘルドコンピュータまたは他のコンピューティングデバイスなどの資源の限られているクライアント内に実装することができる。本発明は、通信ネットワークを通じてリンクされているリモート処理デバイスによりタスクが実行されるネットワーク接続コンピューティング環境内で実施される。
図14を参照すると、効率的なデジタルビデオトランスコーディングアーキテクチャを備える例示的なシステムは、例えば、図1のコンピューティングデバイス102に関連付けられているイニシエータオペレーションを実行するコンピュータ1410の形態の汎用コンピューティングデバイスを備える。コンピュータ1410が備えるコンポーネントとしては、限定はしないが、(複数の)演算処理装置1418、システムメモリ1430、およびシステムメモリを備える様々なシステムコンポーネントを演算処理装置1418に結合するシステムバス1421などがある。システムバス1421は、メモリバスまたはメモリコントローラ、周辺機器バス、および様々なバスアーキテクチャを使用するローカルバスを含む数種類のバス構造のうちのいずれでもよい。例えば、限定はしないが、このようなアーキテクチャとしては、Industry Standard Architecture(ISA)バス、Micro Channel Architecture(MCA)バス、Enhanced ISA(EISA)バス、Video Electronics Standards Association(VESA)ローカルバス、およびMezzanineバスとも呼ばれるPeripheral Component Interconnect(PCI)バスがある。
コンピュータ1410は、通常、様々なコンピュータ可読媒体を含む。コンピュータ可読媒体は、揮発性および不揮発性媒体、取り外し可能および取り外し不可能媒体を含む、コンピュータ1410によってアクセスされることができる媒体であればどのような媒体でも使用可能である。例えば、限定はしないが、コンピュータ可読媒体は、コンピュータ記憶媒体および通信媒体を含むことができる。コンピュータ記憶媒体は、コンピュータ可読命令、データ構造体、プログラムモジュール、またはその他のデータなどの情報を格納する方法または技術で実装される揮発性および不揮発性、取り外し可能および取り外し不可能媒体を含む。コンピュータ記憶媒体としては、限定はしないが、RAM、ROM、EEPROM、フラッシュメモリまたはその他のメモリ技術、CD−ROM、デジタル多目的ディスク(DVD)またはその他の光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置またはその他の磁気記憶デバイス、または所望の情報を格納するために使用することができ、しかもコンピュータ1410によりアクセスできるその他の媒体がある。
通信媒体は、通常、コンピュータ可読命令、データ構造体、プログラムモジュール、または搬送波もしくはその他のトランスポートメカニズムなどの変調データ信号によるその他のデータを具現するものであり、任意の情報配信媒体を含む。「変調データ信号」という用語は、信号内に情報を符号化するような方法で特性のうちの1つまたは複数が設定または変更された信号を意味する。例えば、限定はしないが、通信媒体としては、有線ネットワークまたは直接配線接続などの有線媒体、および、音響、RF、赤外線、およびその他の無線媒体などの無線媒体がある。上記のいずれの組合せもコンピュータ可読媒体の範囲に収まらなければならない。
システムメモリ1430は、読み取り専用メモリ(ROM)1431およびランダムアクセスメモリ(RAM)1432などの揮発性および/または不揮発性メモリの形態のコンピュータ記憶媒体を含む。起動時などにコンピュータ1410内の要素間の情報伝送を助ける基本ルーチンを含む基本入出力システム1433(BIOS)は、通常、ROM 1431に格納される。通常、RAM 1432は、演算処理装置1418に直接アクセス可能な、および/または演算処理装置1418によって現在操作されているデータおよび/またはプログラムモジュールを格納する。例えば、限定はしないが、図14は、オペレーティングシステム1434、アプリケーションプログラム1435、その他のプログラムモジュール1436、およびプログラムデータ1437を例示している。
コンピュータ1410はさらに、その他の取り外し可能/取り外し不可能な揮発性/不揮発性コンピュータ記憶媒体を備えることもできる。例にすぎないが、図14は、取り外し不可能な不揮発性磁気媒体の読み書きを行うハードディスクドライブ1441、取り外し可能な不揮発性磁気ディスク1452の読み書きを行う磁気ディスクドライブ1451、およびCDROMまたはその他の光媒体などの取り外し可能な不揮発性光ディスク1456の読み書きを行う光ディスクドライブ1455を例示している。例示的な動作環境において使用できる他の取り外し可能/取り外し不可能な揮発性/不揮発性コンピュータ記憶媒体としては、限定はしないが、磁気テープカセット、フラッシュメモリカード、デジタル多目的ディスク、デジタルビデオテープ、ソリッドステートRAM、ソリッドステートROMなどがある。ハードディスクドライブ1441は、典型的には、インターフェース1440などの取り外し不可能メモリインターフェースを介してシステムバス1421に接続され、磁気ディスクドライブ1451および光ディスクドライブ1455は、典型的には、インターフェース1450などの取り外し可能メモリインターフェースによりシステムバス1421に接続される。
図14に例示されている上記のドライブおよび関連コンピュータ記憶媒体は、コンピュータ1410用のコンピュータ可読命令、データ構造体、プログラムモジュール、およびその他のデータを格納する機能を備える。例えば、図14では、ハードディスクドライブ1441は、オペレーティングシステム1444、アプリケーションプログラム1445、その他のプログラムモジュール1446、およびプログラムデータ1447を格納するものとして例示されている。これらのコンポーネントは、オペレーティングシステム1434、アプリケーションプログラム1435、その他のプログラムモジュール1436、およびプログラムデータ1437と同じである場合もあれば異なる場合もあることに留意されたい。オペレーティングシステム1444、アプリケーションプログラム1445、その他のプログラムモジュール1446、およびプログラムデータ1447に対しては、ここで、異なる番号を割り当てて、それらが少なくとも異なるコピーであることを示している。
ユーザは、キーボード1462、およびマウス、トラックボール、またはタッチパッドと一般に呼ばれるポインティングデバイス1461などの入力デバイスを介してコンピュータ1410にコマンドおよび情報を入力できる。他の入力デバイス(図に示されていない)としては、マイク、ジョイスティック、ペンタブレット、衛星放送受信アンテナ、スキャナなどがある。これらの入力デバイスおよびその他の入力デバイスは、システムバス1421に結合されているユーザ入力インターフェース1460を通じて演算処理装置1418に接続されることが多いが、パラレルポート、ゲームポート、またはユニバーサルシリアルバス(USB)などの他のインターフェースおよびバス構造により接続されることも可能である。この実装では、モニタ1491またはその他の種類のユーザインターフェースデバイスは、さらに、例えばビデオインターフェース1490などのインターフェースを介してシステムバス1421に接続される。
コンピュータ1410は、リモートコンピュータ1480などの1つまたは複数のリモートコンピュータへの論理接続を使用してネットワーク接続環境で動作する。一実装では、リモートコンピュータ1480は、図1に示されているように、応答側のコンピューティングデバイス106を表している。リモートコンピュータ1480は、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピアデバイス、または他の共通ネットワークノードでもよく、特定の実装に応じて、コンピュータ1410に関係する上述の要素の多くまたはすべてを含むが、メモリ記憶デバイス1481だけが図14に例示されている。図14に示されている論理接続は、ローカルエリアネットワーク(LAN)1481およびワイドエリアネットワーク(WAN)1473を含むが、他のネットワークを含むこともできる。このようなネットワーキング環境は、オフィス、企業全体にわたるコンピュータネットワーク、イントラネット、およびインターネットでは一般的である。
LANネットワーキング環境で使用される場合、コンピュータ1410は、ネットワークインターフェースまたはアダプタ1470を介してLAN 1471に接続される。WANネットワーキング環境で使用される場合、コンピュータ1410は、典型的には、インターネットなどのWAN 1473上で通信を確立するためモデム1472またはその他の手段を備える。モデム1472は、内蔵でも外付けでもよいが、ユーザ入力インターフェース1460またはその他の適切なメカニズムを介してシステムバス1421に接続されうる。ネットワーク接続環境では、コンピュータ1410またはその一部に関して示されているプログラムモジュールは、リモートメモリ記憶装置デバイスに格納されうる。例えば、限定はしないが、図14はリモートアプリケーションプログラム1485をメモリデバイス1481に置かれているものとして例示している。図に示されているネットワーク接続は例示的であり、コンピュータ間の通信リンクを確立するのに他の手段も使用可能である。
[結び]
上の節では構造的特徴および/または方法論的なオペレーションまたはアクションに固有の言語で効率的なデジタルビデオトランスコーディングアーキテクチャについて説明しているが、付属の特許請求の範囲で定められている実装は、説明された特定の特徴またはアクションに必ずしも限られない。むしろ、説明されている効率的な統合デジタルビデオトランスコーディングアーキテクチャの特定の特徴およびオペレーションは、請求されている主題を実施するための複数の例示的な実装形態として開示されている。
例えば、一実装では、説明されている高速および高品質トランスコーディングシステムおよび方法は、トランスコーディング、任意サイズ縮小、レート削減を含めて、MPEG−2からMPEG−4へのトランスコーディング、およびMPEG−4からWMVへのトランスコーディングに使用される。例えば、図6の簡素化された閉ループDCT領域トランスコーダは、MPEG−4をWMVにトランスコードするために使用することができる。MPEG−2(IS−13818 Part.2)との違いは、MPEG−2では、MCにおいて1/2ピクセル要素(pel)MV精度および双一次補間のみを使用することであり、WMVには、そのような同じモード(1/2pel双一次)がある。しかし、MPEG−4では、1/2pelと1/4pelの両方のMV精度とともに、1/4pel位置(WMVのとは異なる)に対する補間もサポートする。この違いに対処するために、1/2pel MVがMPEG−4ビデオで使用される場合、トランスコーディングプロセスは、上述のようにMPEG−2からWMVトランスコーディングと同じである。さらに、1/4pel MVがMPEG−4ビデオに含まれる場合、図6に関して上で説明されているようにMCにおける補間法が異なることで誤差が入り込む。さらに、図10に関して上で説明されている完全ドリフト補償がある簡素化された2:1縮小トランスコーダは、変更と無関係にMPEG−4からWMVへの2:1サイズ縮小トランスコーディングに適用可能である。さらに、図12の上で説明されているレート削減および任意縮小トランスコーディングオペレーションを含む、高品質トランスコーディングは、MPEG−4からWMVトランスコーディングに効果的である。
入力ビットストリームを復号化するフロントエンドデコーダと、異なる符号化パラメータセットまたは新しい形式の新しいビットストリームを生成するエンコーダとをカスケード接続する、従来のカスケードピクセル領域トランスコーダ(CPDT)システムを示す図である。 図1のCPDTアーキテクチャを簡素化した、従来のカスケードDCT領域トランスコーダ(CDDT)アーキテクチャを示す図である。 一実施形態により、MPEG−2をWMVにトランスコードする例示的な非統合ピクセル領域トランスコーディング分割アーキテクチャを示す図である。より具体的には、この分割アーキテクチャは、効率的な統合デジタルビデオトランスコーディングの概念的基礎を形成するものである。 一実施形態による、効率的な統合デジタルビデオトランスコーディングを行う例示的なシステムを示す図である。 一実施形態による、例示的な簡素化された閉ループカスケードピクセル領域トランスコーダを示す図である。 一実施形態による、例示的な簡素化された閉ループDCT領域トランスコーダを示す図である。 一実施形態による、4つの4×4DCTブロックの1つの8×8DCTブロックへの例示的なマージオペレーションを示す図である。このマージオペレーションは、効率的ビデオコンテンツトランスコーディングの際に実行される。 一実施形態による、簡素化されたDCT領域数値2:1分解能縮小トランスコーダに対する例示的なアーキテクチャを示す図である。 一実施形態による、2:1空間分解能縮小トランスコーディングオペレーションのインターレースメディアに対する4つの4×4DCTブロックのオペレーションを1つの8×8DCTブロックにマージする実施例を示す図である。 一実施形態による、ドリフト補償が十分な例示的な簡素化された2:1縮小トランスコーダアーキテクチャを示す図である。 デコーダに対する例示的な標準仮想バッファベリファイヤバッファ(VBV)モデルを示す図である。 一実施形態による、任意空間分解能縮小機能を持つトランスコーダを示す図である。 一実施形態による、効率的な統合デジタルビデオトランスコーディングオペレーションの例示的な手順を示す図である。 一実施形態により、効率的な統合デジタルビデオトランスコーディングを部分的にまたは完全に実装できる例示的な環境を示す図である。

Claims (20)

  1. コンピュータ実装方法であって、
    統合トランスコーダにより、符号化されたビットストリームを受信するステップと、
    前記統合トランスコーダにより、前記符号化されたビットストリームをトランスコードするステップであって、
    前記統合トランスコーダにより、前記符号化されたビットストリームを部分的に復号化して中間データストリーム生成し、前記符号化されたビットストリームは前記第1のメディア形式に関連付けられている圧縮技術の第1のセットにより符号化され、
    前記統合トランスコーダにより、圧縮技術の第2のセットを使用して前記中間データストリームを符号化してトランスコードされたビットストリームを生成し、圧縮技術の前記第2のセットは前記第2のメディア形式に対応するように、トランスコードするステップと
    を有することを特徴とするコンピュータ実装方法。
  2. 前記第1のメディア形式は、MPEG−2であり、前記第2のメディア形式は、WMVであることを特徴とする請求項1に記載のコンピュータ実装方法。
  3. 前記第1のメディア形式は、MPEG−2であり、前記第2のメディア形式は、MPEG−4であることを特徴とする請求項1に記載のコンピュータ実装方法。
  4. 前記統合トランスコーダは、適切な誤差補償を介して誤差伝搬を防ぐ閉ループトランスコーダであることを特徴とする請求項1に記載のコンピュータ実装方法。
  5. 前記統合トランスコーダは、誤差伝搬を防がない開ループトランスコーダであることを特徴とする請求項1に記載のコンピュータ実装方法。
  6. 前記統合トランスコーダは、スケーリングコンポーネントにおいて第1および第2のメディア形式にそれぞれ関連付けられている第1および第2の変換をマージすることを特徴とする請求項1に記載のコンピュータ実装方法。
  7. トランスコードするステップは、さらに、前記トランスコーディングの品質または速度をそれぞれ高めるために残誤差補償に関連付けられている1つまたは複数のオペレーションを動的にオンまたはオフにするステップを有することを特徴とする請求項1に記載のコンピュータ実装方法。
  8. トランスコードするステップは、残誤差補償を実行し、トランスコードするステップは、さらに、
    早期基準フレームが処理されていると判定したことに応答して、1つまたは複数のオペレーションを動的に調節して前記早期基準フレームを高い品質でかつ遅い速度でトランスコードするステップを有し、
    前記オペレーションは、ブロック再量子化誤差累積、累積誤差の動き補償、および特定のブロックが符号化されているかどうかを判定する早期検出を有すること
    を特徴とする請求項1に記載のコンピュータ実装方法。
  9. トランスコードするステップは、残誤差補償を実行し、トランスコードするステップは、さらに、
    閾値ベースのドリフト制御メカニズムに応答して、残誤差バッファへのブロック再量子化誤差累積を動的にオンまたはオフにするステップと、
    ブロックアクティビティの評価に応答して、残誤差バッファ内の累積された誤差の動き補償を動的にオンまたはオフにするステップと、
    前記部分的復号化からの動き補償累積残誤差と再構成された残との総和に基づく決定に応答して、早期検出を動的にオンまたはオフにしてブロックが符号化されるかどうかを決定するステップと
    のうちの1つまたは複数を有することを特徴とする請求項1に記載のコンピュータ実装方法。
  10. 部分的に復号化するステップは、さらに、
    すべてのフレームについて入力フレームサイズに比例する符号化フレームサイズでレート制御を実行するステップを有し、
    前記レート制御では目標フレームサイズと実際の結果として得られるフレームサイズとの間の累積された差を継続的に補償すること
    を特徴とする請求項1に記載のコンピュータ実装方法。
  11. 前記方法は、さらに、
    高い離散コサイン変換(DCT)係数を破棄して、DCT領域内の前記中間データストリームを縮小するステップを有し、
    明示的なピクセル領域縮小は、実行されないこと
    を特徴とする請求項1に記載のコンピュータ実装方法。
  12. トランスコードするステップは、さらに、混合ブロック処理および対応する復号化ループと無関係に前記符号化されたビットストリームから完全な分解能の画像の再構成により前記符号化されたビットストリームのブロックを縮小するステップを有することを特徴とする請求項1に記載のコンピュータ実装方法。
  13. トランスコードするステップは、さらに、任意縮小目標比を得るために2段階縮小オペレーションを実行するステップを有することを特徴とする請求項1に記載のコンピュータ実装方法。
  14. 前記2段階縮小オペレーションは、さらに、
    DCT領域復号化ループ内で第1段階縮小オペレーションを実行するステップと、
    ピクセル領域内の前記復号化ループの外部で第2段階縮小オペレーションを実行するステップと
    を有することを特徴とする請求項13に記載のコンピュータ実装方法。
  15. 前記2段階縮小オペレーションは、さらに、
    第1段階縮小オペレーションを実行して、前記任意縮小目標比の中間である第1の結果を得るステップと、
    前記第1の結果を復号化ループ内に入力するステップと、
    空間領域内で第2段階縮小オペレーションを実行して、前記任意縮小目標比を得るステップと
    を有することを特徴とする請求項13に記載のコンピュータ実装方法。
  16. コンピュータ実装方法であって、
    統合トランスコーダにより、符号化されたビットストリームをトランスコードするステップであって、
    前記統合トランスコーダにより、前記符号化されたビットストリームを部分的に復号化して中間データストリーム生成し、前記符号化されたビットストリームは前記第1のメディア形式に関連付けられている圧縮技術の第1のセットにより符号化され、
    前記統合トランスコーダにより、圧縮技術の第2のセットを使用して前記中間データストリームを符号化し、トランスコードされたビットストリームを生成し、前記第2の変換は前記第2のメディア形式に対応するように、トランスコードするステップを有し、
    前記統合トランスコーダは、スケーリングコンポーネントにおいて前記第1および第2のメディア形式にそれぞれ関連付けられている第1および第2の変換をマージすること
    を特徴とするコンピュータ実装方法。
  17. 前記第1のメディア形式は、MPEG−2であり、前記第2のメディア形式は、WMVであることを特徴とする請求項16に記載のコンピュータ実装方法。
  18. トランスコードするステップは、さらに、
    残誤差補償に関連付けられている1つまたは複数のオペレーションを動的にオンまたはオフにすることで、前記トランスコーディングの品質または速度をそれぞれ高めるステップを有し、
    前記1つまたは複数のオペレーションは、
    閾値ベースのドリフト制御メカニズム、
    ブロックアクティビティレベルの評価、
    復号化オペレーションからの動き補償累積残誤差および再構成された残の総和
    のうちの1つまたは複数に基づいてオンまたはオフに切り替えられることを特徴とする請求項16に記載のコンピュータ実装方法。
  19. 前記方法は、さらに、
    前記符号化されたビットストリームに関連付けられているデータを復号化ループのDCT領域内で縮小するステップ、または
    前記データを2段階縮小プロセスで縮小するステップであって、前記2段階縮小プロセスは、
    第1段階で、前記データを前記DCT領域内で縮小するステップと、
    前記空間領域内で前記第1段階の縮小された結果の分解能を低減するステップとを有するステップ
    を有することを特徴とする請求項16に記載のコンピュータ実装方法。
  20. コンピュータ実装方法であって、
    統合トランスコーダにより、符号化されたビットストリームを部分的に復号化して中間データストリームを生成するステップであって、前記符号化されたビットストリームは前記第1のメディア形式に関連付けられている圧縮技術の第1のセットにより符号化され、前記部分的に復号化するステップは、
    復号化ループのDCT領域内でビットストリームデータを縮小することを有するステップと、
    空間領域内の前記復号化ループの外部で前記ビットストリームデータをさらに低減するかどうかを決定するステップであって、前記決定するステップは、
    前記空間領域内でDCT領域縮小ビットストリームデータの分解能を低減するステップ、または
    さらに分解能低減を行うことなく前記DCT領域縮小ビットストリームデータを通過させるステップを有するステップと、
    前記統合トランスコーダにより、圧縮技術の第2のセットを使用して前記中間データストリームを符号化してトランスコードされたビットストリームを生成するステップであって、圧縮技術の前記第2のセットは前記第2のメディア形式に対応するようにするステップと
    を有することを特徴とするコンピュータ実装方法。
JP2008531271A 2005-09-14 2006-09-13 効率的な統合デジタルビデオトランスコーディング Active JP4955686B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/226,590 US8447121B2 (en) 2005-09-14 2005-09-14 Efficient integrated digital video transcoding
US11/226,590 2005-09-14
PCT/US2006/035640 WO2007033242A1 (en) 2005-09-14 2006-09-13 Efficient integrated digital video transcoding

Publications (2)

Publication Number Publication Date
JP2009508445A true JP2009508445A (ja) 2009-02-26
JP4955686B2 JP4955686B2 (ja) 2012-06-20

Family

ID=37855070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008531271A Active JP4955686B2 (ja) 2005-09-14 2006-09-13 効率的な統合デジタルビデオトランスコーディング

Country Status (9)

Country Link
US (1) US8447121B2 (ja)
EP (1) EP1925163B1 (ja)
JP (1) JP4955686B2 (ja)
KR (1) KR101279755B1 (ja)
CN (1) CN101263718B (ja)
AU (1) AU2006291017A1 (ja)
BR (1) BRPI0616823A2 (ja)
CA (1) CA2621423C (ja)
WO (1) WO2007033242A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10171865B2 (en) 2013-10-15 2019-01-01 Kabushiki Kaisha Toshiba Electronic device and communication control method

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7136417B2 (en) 2002-07-15 2006-11-14 Scientific-Atlanta, Inc. Chroma conversion optimization
US20050232497A1 (en) * 2004-04-15 2005-10-20 Microsoft Corporation High-fidelity transcoding
US7676590B2 (en) * 2004-05-03 2010-03-09 Microsoft Corporation Background transcoding
US7669121B2 (en) * 2005-01-19 2010-02-23 Microsoft Corporation Transcode matrix
US7558463B2 (en) * 2005-04-18 2009-07-07 Microsoft Corporation Retention of information about digital-media rights in transformed digital media content
US7738766B2 (en) * 2005-04-18 2010-06-15 Microsoft Corporation Sanctioned transcoding of digital-media content
US9363481B2 (en) 2005-04-22 2016-06-07 Microsoft Technology Licensing, Llc Protected media pipeline
US9436804B2 (en) 2005-04-22 2016-09-06 Microsoft Technology Licensing, Llc Establishing a unique session key using a hardware functionality scan
US7924913B2 (en) * 2005-09-15 2011-04-12 Microsoft Corporation Non-realtime data transcoding of multimedia content
US8102916B1 (en) 2006-01-12 2012-01-24 Zenverge, Inc. Dynamically changing media compression format in compressed domain
US7830800B1 (en) 2006-01-12 2010-11-09 Zenverge, Inc. Architecture for combining media processing with networking
KR20080096768A (ko) * 2006-02-06 2008-11-03 톰슨 라이센싱 사용 가능한 움직임 정보를 비디오 인코딩을 위한 움직임추정 예측자로서 재사용하는 방법 및 장치
EP1993286A4 (en) * 2006-03-07 2011-08-31 Nec Corp DYNAMIC IMAGE DISTRIBUTION SYSTEM AND CONVERSION DEVICE
US8311114B1 (en) 2006-12-06 2012-11-13 Zenverge, Inc. Streamlined transcoder architecture
TW200836130A (en) * 2007-02-16 2008-09-01 Thomson Licensing Bitrate reduction method by requantization
US20130101023A9 (en) * 2007-03-12 2013-04-25 Vixs Systems, Inc. Video encoder with video decoder reuse and method for use therewith
US8457958B2 (en) * 2007-11-09 2013-06-04 Microsoft Corporation Audio transcoder using encoder-generated side information to transcode to target bit-rate
US8265168B1 (en) 2008-02-01 2012-09-11 Zenverge, Inc. Providing trick mode for video stream transmitted over network
WO2009097284A1 (en) * 2008-02-01 2009-08-06 Zenverge, Inc. Intermediate compression of reference frames for transcoding
JP2009260818A (ja) * 2008-04-18 2009-11-05 Nec Corp サーバ装置とコンテンツ配信方法とプログラム
US8831101B2 (en) * 2008-08-02 2014-09-09 Ecole De Technologie Superieure Method and system for determining a metric for comparing image blocks in motion compensated video coding
US8295345B2 (en) 2008-09-22 2012-10-23 Smith Micro Software, Inc. Transcoder unit and method
US8279925B2 (en) 2008-09-22 2012-10-02 Smith Micro Software, Inc. Video streaming apparatus with quantization and method thereof
EP2335417A4 (en) * 2008-09-22 2012-04-04 Avot Media Inc QUANTIFICATION DIRECT VIDEO-TRANSMITTING APPARATUS AND CORRESPONDING METHOD
US8345746B2 (en) 2008-09-22 2013-01-01 Smith Micro Software, Inc. Video quantizer unit and method thereof
US8645822B2 (en) * 2008-09-25 2014-02-04 Microsoft Corporation Multi-platform presentation system
US8311115B2 (en) * 2009-01-29 2012-11-13 Microsoft Corporation Video encoding using previously calculated motion information
US8396114B2 (en) * 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
US8687685B2 (en) 2009-04-14 2014-04-01 Qualcomm Incorporated Efficient transcoding of B-frames to P-frames
CN102422642B (zh) * 2009-05-11 2015-03-25 株式会社Ntt都科摩 动态图像编码装置、方法和程序以及动态图像解码装置、方法和程序
US8494056B2 (en) * 2009-05-21 2013-07-23 Ecole De Technologie Superieure Method and system for efficient video transcoding
US9100656B2 (en) 2009-05-21 2015-08-04 Ecole De Technologie Superieure Method and system for efficient video transcoding using coding modes, motion vectors and residual information
WO2010141025A1 (en) * 2009-06-05 2010-12-09 Hewlett-Packard Development Company, L.P. Applying transcodings in a determined order to produce output files from a source file
US8270473B2 (en) * 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
TWI401972B (zh) * 2009-06-23 2013-07-11 Acer Inc 時間性錯誤隱藏方法
US8340191B2 (en) * 2009-09-25 2012-12-25 General Instrument Corporation Transcoder from first MPEG stream to second MPEG stream
KR101675118B1 (ko) 2010-01-14 2016-11-10 삼성전자 주식회사 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
US8553763B2 (en) 2010-06-10 2013-10-08 Sony Corporation Iterative computation of adaptive interpolation filter
US8705616B2 (en) 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
US8755438B2 (en) 2010-11-29 2014-06-17 Ecole De Technologie Superieure Method and system for selectively performing multiple video transcoding operations
US20120307889A1 (en) * 2011-06-01 2012-12-06 Sharp Laboratories Of America, Inc. Video decoder with dynamic range adjustments
US8571099B2 (en) * 2011-06-01 2013-10-29 Sharp Laboratories Of America, Inc. Decoder with dynamic range compensation
US9591318B2 (en) 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US9432704B2 (en) * 2011-11-06 2016-08-30 Akamai Technologies Inc. Segmented parallel encoding with frame-aware, variable-size chunking
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
US8812740B2 (en) * 2012-03-30 2014-08-19 Broadcom Corporation Communication over bandwidth-constrained network
US9998750B2 (en) * 2013-03-15 2018-06-12 Cisco Technology, Inc. Systems and methods for guided conversion of video from a first to a second compression format
US9485456B2 (en) 2013-12-30 2016-11-01 Akamai Technologies, Inc. Frame-rate conversion in a distributed computing system
FR3016764B1 (fr) * 2014-01-17 2016-02-26 Sagemcom Broadband Sas Procede et dispositif de transcodage de donnees video de h.264 vers h.265
US9438910B1 (en) 2014-03-11 2016-09-06 Google Inc. Affine motion prediction in video coding
US10136147B2 (en) 2014-06-11 2018-11-20 Dolby Laboratories Licensing Corporation Efficient transcoding for backward-compatible wide dynamic range codec
US20160041993A1 (en) * 2014-08-05 2016-02-11 Time Warner Cable Enterprises Llc Apparatus and methods for lightweight transcoding
US10958948B2 (en) 2017-08-29 2021-03-23 Charter Communications Operating, Llc Apparatus and methods for latency reduction in digital content switching operations
US11368692B2 (en) * 2018-10-31 2022-06-21 Ati Technologies Ulc Content adaptive quantization strength and bitrate modeling
CN114946186A (zh) 2019-12-26 2022-08-26 字节跳动有限公司 视频编解码中的解码参数集
US11503322B2 (en) 2020-08-07 2022-11-15 Samsung Display Co., Ltd. DPCM codec with higher reconstruction quality on important gray levels
US11509897B2 (en) 2020-08-07 2022-11-22 Samsung Display Co., Ltd. Compression with positive reconstruction error

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1173410A (ja) * 1997-06-16 1999-03-16 Sony Corp ディジタル信号変換方法及び装置並びに変換行列作成方法
JP2001145113A (ja) * 1999-11-17 2001-05-25 Sony Corp 画像情報変換装置及び方法
JP2003189309A (ja) * 2001-12-18 2003-07-04 Nec Corp 圧縮動画像の再符号化方法及び装置
JP2004015744A (ja) * 2002-06-11 2004-01-15 Hitachi Ltd 画像情報変換装置およびビットストリーム変換機ならびに画像情報変換送信方法
JP2004504739A (ja) * 2000-06-09 2004-02-12 ジェネラル・インスツルメント・コーポレイション Mpeg−2からmpeg−4へのビデオサイズの変換およびトランスコード化

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE9703849L (sv) 1997-03-14 1998-09-15 Ericsson Telefon Ab L M Nedskalning av bilder
JPH11275592A (ja) 1998-01-22 1999-10-08 Victor Co Of Japan Ltd 動画像符号列変換装置及びその方法
US6104441A (en) * 1998-04-29 2000-08-15 Hewlett Packard Company System for editing compressed image sequences
JP3821415B2 (ja) 1998-09-30 2006-09-13 日本ビクター株式会社 動画像フォーマット変換装置及びその方法
KR100312421B1 (ko) 1998-11-25 2001-12-12 오길록 영상시스템에서의압축동영상변환장치및그방법
US6618442B1 (en) 1998-12-29 2003-09-09 Intel Corporation Method and apparatus for transcoding digital video signals
KR20020001760A (ko) 2000-01-12 2002-01-09 요트.게.아. 롤페즈 영상 데이터 압축
US7266148B2 (en) 2001-01-05 2007-09-04 Lg Electronics Inc. Video transcoding apparatus
GB2369952B (en) * 2001-03-10 2002-12-04 Ericsson Telefon Ab L M Transcoding of video signals
US6671322B2 (en) 2001-05-11 2003-12-30 Mitsubishi Electric Research Laboratories, Inc. Video transcoder with spatial resolution reduction
US20030043908A1 (en) 2001-09-05 2003-03-06 Gao Cheng Wei Bandwidth scalable video transcoder
DE602004008763T2 (de) 2003-04-17 2008-06-12 Koninklijke Philips Electronics N.V. Videotranskodierung
US20050132264A1 (en) * 2003-12-15 2005-06-16 Joshi Ajit P. System and method for intelligent transcoding
US7391809B2 (en) * 2003-12-30 2008-06-24 Microsoft Corporation Scalable video transcoding
TWI230547B (en) 2004-02-04 2005-04-01 Ind Tech Res Inst Low-complexity spatial downscaling video transcoder and method thereof
US20050175099A1 (en) * 2004-02-06 2005-08-11 Nokia Corporation Transcoder and associated system, method and computer program product for low-complexity reduced resolution transcoding
US20050232497A1 (en) 2004-04-15 2005-10-20 Microsoft Corporation High-fidelity transcoding
US20060140274A1 (en) * 2004-12-29 2006-06-29 Mediatek Incorporation Transcoder and method used therein

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1173410A (ja) * 1997-06-16 1999-03-16 Sony Corp ディジタル信号変換方法及び装置並びに変換行列作成方法
JP2001145113A (ja) * 1999-11-17 2001-05-25 Sony Corp 画像情報変換装置及び方法
JP2004504739A (ja) * 2000-06-09 2004-02-12 ジェネラル・インスツルメント・コーポレイション Mpeg−2からmpeg−4へのビデオサイズの変換およびトランスコード化
JP2003189309A (ja) * 2001-12-18 2003-07-04 Nec Corp 圧縮動画像の再符号化方法及び装置
JP2004015744A (ja) * 2002-06-11 2004-01-15 Hitachi Ltd 画像情報変換装置およびビットストリーム変換機ならびに画像情報変換送信方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10171865B2 (en) 2013-10-15 2019-01-01 Kabushiki Kaisha Toshiba Electronic device and communication control method

Also Published As

Publication number Publication date
KR20080055820A (ko) 2008-06-19
EP1925163A1 (en) 2008-05-28
CA2621423A1 (en) 2007-03-22
WO2007033242A1 (en) 2007-03-22
EP1925163B1 (en) 2017-11-29
AU2006291017A1 (en) 2007-03-22
JP4955686B2 (ja) 2012-06-20
CN101263718A (zh) 2008-09-10
CA2621423C (en) 2014-12-09
EP1925163A4 (en) 2010-02-03
KR101279755B1 (ko) 2013-07-04
US8447121B2 (en) 2013-05-21
BRPI0616823A2 (pt) 2011-07-05
CN101263718B (zh) 2010-12-08
US20070058718A1 (en) 2007-03-15

Similar Documents

Publication Publication Date Title
JP4955686B2 (ja) 効率的な統合デジタルビデオトランスコーディング
JP2009508452A (ja) 任意分解能変更サイズ縮小デコーダ
JP5378791B2 (ja) 適応補間を使用する映像符号化及び復号化の方法と装置
JP4633417B2 (ja) ビットストリーム制御後処理フィルタリング
KR101044934B1 (ko) 움직임 벡터 추정방법 및 부호화 모드 결정방법
TWI478584B (zh) 一種視訊編解碼的方法及其裝置
US7782955B2 (en) Transcoder and transcoding method operating in a transform domain for video coding schemes possessing different transform kernels
US20070086520A1 (en) Intra-base-layer prediction method satisfying single loop decoding condition, and video coding method and apparatus using the prediction method
JP4425563B2 (ja) フェーディング補償のためのパラメータ化
JP2005507589A (ja) 空間拡張可能圧縮
JP2006279573A (ja) 符号化装置と方法、ならびに復号装置と方法
Sheng et al. Feedback-free rate-allocation scheme for transform domain Wyner–Ziv video coding
JP2005318297A (ja) 動画像符号化・復号方法及び装置
JP4776505B2 (ja) 画像符号化装置、画像復号装置及び画像処理プログラム
JP4209134B2 (ja) 圧縮ビットストリームをアップサンプリングする方法および装置
JP4762486B2 (ja) マルチ・リゾルーション・ビデオ符号化および復号化
JP2005236584A (ja) 動画像情報変換符号化装置
JP4125885B2 (ja) 画像符号化方法及びその装置と、画像符号化プログラム及びそのプログラムを記録した記録媒体
JP2005507620A (ja) 圧縮
KR20040097028A (ko) 다차원 비트율 조절에 따른 비디오 트랜스코딩 방법 및 그장치
Segall Framework for the post-processing, super-resolution and deblurring of compressed video
Shen et al. Complexity Scalable 2: 1 Resolution Downscaling MPEG-2 to WMV Transcoder with Adaptive Error Compensation
JP2007295233A (ja) 動画像再符号化装置、動画像編集装置、プログラム、及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090907

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120309

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120315

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4955686

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150323

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250