JP2008501250A - 第1の変換カーネルに基づく入力ビデオを第2の変換カーネルに基づく出力ビデオにトランスコードする方法、及び入力形式を有する入力ビデオを出力形式を有する出力ビデオに変換するトランスコーダ - Google Patents
第1の変換カーネルに基づく入力ビデオを第2の変換カーネルに基づく出力ビデオにトランスコードする方法、及び入力形式を有する入力ビデオを出力形式を有する出力ビデオに変換するトランスコーダ Download PDFInfo
- Publication number
- JP2008501250A JP2008501250A JP2006519584A JP2006519584A JP2008501250A JP 2008501250 A JP2008501250 A JP 2008501250A JP 2006519584 A JP2006519584 A JP 2006519584A JP 2006519584 A JP2006519584 A JP 2006519584A JP 2008501250 A JP2008501250 A JP 2008501250A
- Authority
- JP
- Japan
- Prior art keywords
- video
- output
- input
- conversion
- coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Complex Calculations (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】方法及びシステムは、第1の変換カーネルに基づく入力ビデオを第2の変換カーネルに基づく出力ビデオにトランスコードする。
【解決手段】第1の変換カーネルと第2の変換カーネルは異なり、トランスコーディングは完全に変換領域で行われる。1つの変換カーネル行列の係数を求める。次に、この1つの変換カーネル行列のみを用いて入力ビデオの入力係数を出力ビデオの出力係数に変換する。入力ビデオはDCT係数に基づくものとすることができ、出力ビデオはHT係数に基づくものとすることができる。別法として、入力ビデオはHT係数に基づくものとすることができ、出力ビデオはDCT係数に基づくものとすることができる。さらに、出力ビデオの空間分解能を入力ビデオよりも低くすることができる。
【解決手段】第1の変換カーネルと第2の変換カーネルは異なり、トランスコーディングは完全に変換領域で行われる。1つの変換カーネル行列の係数を求める。次に、この1つの変換カーネル行列のみを用いて入力ビデオの入力係数を出力ビデオの出力係数に変換する。入力ビデオはDCT係数に基づくものとすることができ、出力ビデオはHT係数に基づくものとすることができる。別法として、入力ビデオはHT係数に基づくものとすることができ、出力ビデオはDCT係数に基づくものとすることができる。さらに、出力ビデオの空間分解能を入力ビデオよりも低くすることができる。
Description
本発明は、包括的には圧縮ビデオのトランスコーディングに関し、より具体的には、異なる変換カーネルに基づく圧縮ビデオのトランスコーディングに関する。
MPEG−2は、ISO/IECのMotion Picture Expert Group (MPEG)が開発したビデオ符号化規格である。これは、現在最も広く使用されているビデオ符号化規格である。その用途には、デジタルテレビ放送、直接衛星放送、DVD、ビデオ監視等がある。MPEG−2及び様々な他のビデオ符号化規格で用いられる変換は、離散コサイン変換(DCT)である。したがって、MPEG符号化ビデオはDCT係数を用いる。
H.264/AVC規格に従う高度なビデオ符号化は、MPEG−2を含む以前の規格よりも大幅に圧縮効率を高めることを目的とする。この規格には、効率的なビデオ記憶、ビデオ会議、及びデジタル加入者リンク(DSL)によるビデオ放送を含む広範な用途が見込まれる。AVC規格は、複雑度の低い整数変換(以下、HTと呼ぶ)を用いる。したがって、符号化AVCビデオはHT係数を用いる。
H.264/AVCの例えばモバイル放送への導入に伴い、MPEG−2形式のビデオをH.264/AVC形式のビデオに変換することが必要とされている。これにより、より効率的なネットワーク送信及び記憶が可能になる。さらに、従来のMPEG−2機器が後出のH.264/AVC形式に従って符号化されたビデオを処理できるよう、H.264/AVCビデオからMPEG−2ビデオに変換することも必要とされている。
トランスコーダは、入力形式の符号化入力ビデオを単純に復号化して、元のビデオの画素を復元(reconstruct)した後、復号化したビデオを出力形式に再符号化する。これを画素領域におけるトランスコーディングと呼ぶ。この画素領域におけるトランスコーディングを用いる場合、変換係数を元の形式から目的の形式にマッピングしなければならない。
図1は従来技術による、変換係数のMPEG−2形式からH.264/AVC形式への画素領域における変換、すなわちDCT−HT変換を示す。入力は8×8のDCT係数ブロック(X)101である。逆DCT(IDCT)110をブロック101に適用して、8×8の元の画素ブロック(x)102を復元する。
8×8の画素ブロック102を4つの4×4ブロック(x1、x2、x3、x4)103に等分する。4つのブロック103をそれぞれ、対応するHT120に送り、4つの4×4の変換係数ブロックY1、Y2、Y3及びY4104を生成する。4つの変換係数ブロックを結合して、1つの8×8ブロック(Y)105を形成する。これをビデオの全ブロックについて繰り返す。
図2は、変換係数のAVC形式からMPEG形式への画素領域における変換、すなわちHT−DCT変換を示す。4つの4×4のHT係数ブロックYY1、YY2、YY3及びYY4201にそれぞれ逆HT210を施し、4つの4×4の画素ブロックxx1、xx2、xx3及びxx4を生成し、これらを結合して、1つの8×8の画素ブロック202を形成する。次に、画素ブロックxxをスケーリング220して、DCT230を施し、8×8のDCT係数ブロック(XX)203を生成する。これをビデオの全ブロックについて繰り返す。
トランスコーディングは完全に圧縮領域又は変換領域で行うことが望ましい。そうすることで、画素の復元が回避される。変換領域におけるトランスコーディングは、完全な復号化及び再符号化が不要となるため、従来技術による画素領域におけるトランスコーディングよりも効率を高めることができる。
変換領域におけるトランスコーディングは、入力ビデオ形式及び出力ビデオ形式の入力変換係数及び出力変換係数間での変換を必要とする。この変換は、入力形式と出力形式が同じである場合、両形式が同じ変換カーネルに基づくため、ほとんど問題にならない。
しかし、これまでのところ、異なる変換カーネルに基づく変換係数を直接変換する方法は存在しないため、異なる変換カーネルを有する異なる入力形式及び出力形式間の変換領域におけるトランスコーディングは不可能であった。
したがって、異なる変換カーネルを有するビデオの変換係数間の直接変換を提供することが必要とされている。
本発明は、第1の変換カーネルに基づく入力ビデオを第2の変換カーネルに基づく出力ビデオにトランスコードする。第1の変換カーネルと第2の変換カーネルは異なり、トランスコーディングは完全に変換領域で行われる。1つの変換カーネル行列の係数を求める。次に、この1つの変換カーネル行列のみを用いて入力ビデオの入力係数を出力ビデオの出力係数に変換する。
入力ビデオはDCT係数に基づくものとすることができ、出力ビデオはHT係数に基づくものとすることができる。別法として、入力ビデオはHT係数に基づくものとすることができ、出力ビデオはDCT係数に基づくものとすることができる。さらに、出力ビデオの空間分解能を入力ビデオよりも低くすることができる。
本発明は、第1の変換カーネルに基づく入力ビデオ形式を第2の変換カーネルに基づく出力ビデオ形式にトランスコードする方法及びシステムを提供し、第1の変換カーネルと第2の変換カーネルは異なり、トランスコーディングは完全に変換領域で行われる。このようなトランスコーディングは、MPEG−2形式及びH.264/AVC形式間のトランスコーディングに適用することができる。
本明細書では、直接DCT−HT変換方法、直接HT−DCT変換方法、及びより低い分解能へのダウンサンプリングを伴う直接DCT−HT変換方法を記載する。さらに、これらの様々な変換を計算するための高速アルゴリズム及び整数近似を記載する。
本明細書では、これらの変換の各々を使用するいくつかのトランスコーディングシステムを記載する。
DCT−HT変換
図3は、変換領域におけるDCTからHTへの変換係数の変換を示す。MPEG形式の入力ビデオの入力DCT係数(X)301にS変換310を適用して、AVC形式の出力ビデオの出力HT係数(Y)302を生成する。
図3は、変換領域におけるDCTからHTへの変換係数の変換を示す。MPEG形式の入力ビデオの入力DCT係数(X)301にS変換310を適用して、AVC形式の出力ビデオの出力HT係数(Y)302を生成する。
S変換は、8×8行列である変換カーネル行列Sにより次のように表すことができる。
ここで、STはSの転置である。この変換をS変換と呼び、以下でさらに詳述する。
導出において使用する表記は以下の通りである。
X − 8×8行列の形式の入力DCT係数
Y − 8×8行列の形式の出力HT係数
Y1、Y2、Y3、Y4 − Yの4つの4×4サブブロック
x − XのIDCT
x1、x2、x3、x4 − xの4つの4×4サブブロック
× − 乗算
(●)T − 行列転置
H − H.264/AVC変換カーネル行列
X − 8×8行列の形式の入力DCT係数
Y − 8×8行列の形式の出力HT係数
Y1、Y2、Y3、Y4 − Yの4つの4×4サブブロック
x − XのIDCT
x1、x2、x3、x4 − xの4つの4×4サブブロック
× − 乗算
(●)T − 行列転置
H − H.264/AVC変換カーネル行列
T8 −8×8のDCT変換カーネル行列
S変換の導出を以下で説明する。
x1、x2、x3、及びx4のHT変換はY1、Y2、Y3、及びY4である。すなわち、次のように表すことができる。
である場合、式(3.1)〜(3.4)を次の1つの式に書き換えることができる。
ここで、xはXのIDCTである。すなわち、次のように表すことができる。
すると、次式が導かれる。
式(6)を式(1)と比較すると、次式が得られる。
直接DCT−HT変換は式(1)によって与えられ、その変換カーネル行列Sを小数点第4位で丸めたものを以下に示す。
HT−DCT変換
図4は、HT係数YY302からDCT係数XX301への直接マッピングによる、変換領域におけるHTからDCTへの係数マッピングを示す。このマッピングは、YYからXXへの変換410として次のように表される。
図4は、HT係数YY302からDCT係数XX301への直接マッピングによる、変換領域におけるHTからDCTへの係数マッピングを示す。このマッピングは、YYからXXへの変換410として次のように表される。
この変換を本発明ではR変換と呼ぶ。
R変換はS変換の逆変換ではない。すなわち、行列Rは、Sの逆行列である行列S−1には等しくない。この理由は、逆HTの変換カーネル行列がHT変換カーネル行列Hの逆行列ではなく、整数での実施を容易にするようにH−1をスケーリングしたものであるためである。したがって、本発明では、この区別を保つために、逆S変換ではなくR変換を用いる。
以下は、いくつかの追加表記である。
YY − 8×8行列の形式の入力HT係数
XX − 8×8行列の形式の出力DCT係数
YY1、YY2、YY3、YY4 − YYの4つの4×4サブブロック
xx1、xx2、xx3、xx4 − 4×4行列である、YY1、YY2、YY3及びYY4の逆HT
xx − xx1、xx2、xx3及びxx4から結合したもの
YY − 8×8行列の形式の入力HT係数
XX − 8×8行列の形式の出力DCT係数
YY1、YY2、YY3、YY4 − YYの4つの4×4サブブロック
xx1、xx2、xx3、xx4 − 4×4行列である、YY1、YY2、YY3及びYY4の逆HT
xx − xx1、xx2、xx3及びxx4から結合したもの
R変換の導出を以下で説明する。
(〜)Hinvを逆HT変換カーネル行列とする。(なお、(〜)Hは、Hの上に〜があることを表す。)すなわち、次のように表すことができる。
すると、次式が導かれる。
逆HTとDCTの間の「スケーリング」演算は、除算演算で近似することができる。したがって、次式が得られる。
式(12)を式(8)と比較することによって、次式が得られる。
直接HT−DCT変換は式(8)によって与えられ、その変換カーネル行列Rを小数点第4位で丸めたものを以下に示す。
高速DCT−HT変換
Sのスパース性及び対称性を利用して、S変換の高速計算を行うことができる。値a、...、sを
Sのスパース性及び対称性を利用して、S変換の高速計算を行うことができる。値a、...、sを
とすると、次式が得られる。
式(1)によって示唆されるように、2DのS変換は分離可能な(separable)変換である。したがって、これは、1D変換(すなわち、列変換とそれに続く行変換)により達成することができる。よって、本明細書では、1D変換の計算のみを説明した。
zを8点の列ベクトルとし、行列Zをzの1DのS変換とする。以下のステップは、Zをzから効率的に求める方法を提供する。
図5は、上述のような値a、...、sを用いたこの方法のステップを示す。
この方法は、22回の乗算及び22回の加算を必要とする。その結果、2DのS変換は、352(16×22)回の乗算及び352(16×22)回の加算を必要とし、合計で704回の演算となる。
図1に示すような画素領域における実施態様は、1回のIDCT変換及び4回のHT変換を含む(W.H. Chen、C.H. Smith、及びS.C. Fralick著「A Fast Computational Algorithm for the Discrete Cosine Transform」(IEEE Trans. on Communications, Vol. COM-25, pp. 1004-1009, 1997)を参照)。この実施態様は、しばしば基準(reference)IDCTと呼ばれ、256(16×16)回の乗算及び416(16×26)回の加算を必要とする。各HT変換は16(2×8)回のシフト及び64(4×4)回の加算を必要とする。4回のHT変換は64回のシフト及び256回の加算を必要とする。その結果、画素領域における処理の全計算要件は、256回の乗算、64回のシフト及び672回の加算となり、合計で992回の演算となる。
したがって、本発明による高速S変換は、従来技術による画素領域における実施態様と比較した場合、演算を約30%削減する。さらに、S変換はたった2段階で実施することができる一方で、従来技術による、基準IDCTを用いた画素領域における処理は6段階を必要とする。
高速HT−DCT変換
S変換の場合と同様に、
S変換の場合と同様に、
とすると、次式が得られる。
式(8)から分かるように、この2DのR変換も分離可能である。これは、1D変換(すなわち、列変換とそれに続く行変換)により計算することができる。したがって、本明細書では、1D変換の計算のみを示す。ZZを8点の列ベクトルとし、zzをZZの1DのR変換とする。以下のステップは、ZZからzzを求める方法のものである。
図6は、この方法のフローグラフ表現を示す。これは実際には、図5と同じノード及び連結を有するが、逆のフロー方向及び異なる利得を有する。したがって、R変換の複雑度はS変換と同じである。
高速DCT−HT変換の整数近似
浮動小数点演算は通常、整数演算よりも実施費用が高い。したがって、本発明は、S変換の整数近似も提供する。
浮動小数点演算は通常、整数演算よりも実施費用が高い。したがって、本発明は、S変換の整数近似も提供する。
Sに2のべき乗である整数を乗算し、整数変換カーネル行列を使用して、整数演算を用いて演算を行う。次に、結果として得られる係数をシフトによりスケールダウンする。ビデオトランスコーディング用途では、シフト演算は量子化中に吸収させることができる。したがって、整数演算を使用するために追加の計算は必要ない。
大きな整数を選択するほど、高い精度を達成することができる。多くの用途において、数は、トランスコーディングを行うマイクロプロセッサにより制限される。本明細書では、32ビット演算を用いて計算を行うことができ、ほとんどのマイクロプロセッサの能力範囲内である数の選択方法を説明する。
DCT−HT変換の場合、DCT係数は[−2048〜2047]の範囲にある。このダイナミックレンジは4096であり、表現に12ビットを要する。2DのS変換の利得は多くても42であり、これはlog2(42)=5.4ビットを要する。したがって、最終的なS変換の結果を表現するには17.4ビットが必要となる。32ビット演算を使用できるようにするために、スケーリングファクタを(2(32−17.4))の平方根よりも小さくする。2のべき乗でこの条件を満たす最大の整数は128である。
したがって、整数変換カーネル行列は次のようになる。
SIをSと比較すると、ゼロ要素の数及び対称性は変わっていないことに気付く。したがって、値a〜sを行列Sの代わりに行列SIの対応する要素に交換すれば、S変換について導出した方法及びフローグラフを整数近似にも適用することができる。
高速HT−DCT変換の整数近似
本発明は、R変換の方法の整数近似も提供する。Rに2のべき乗である整数を乗算し、整数変換カーネルを使用して、整数演算を用いて演算を行う。次に、結果として得られる係数をシフトによりスケールダウンする。
本発明は、R変換の方法の整数近似も提供する。Rに2のべき乗である整数を乗算し、整数変換カーネルを使用して、整数演算を用いて演算を行う。次に、結果として得られる係数をシフトによりスケールダウンする。
HT−DCT変換の場合、HT係数のダイナミックレンジは12ビットである。2DのR変換の利得は多くても0.3416であり、これは実際には、ダイナミックレンジを11ビットに減らす。32ビット演算を使用できるようにするために、スケーリングファクタを(2(31−11))の平方根よりも小さくしなければならない。2のべき乗でこの条件を満たす最大の整数は1024である。
したがって、整数変換カーネル行列は次のようになる。
RIをRと比較すると、ゼロ要素の数及び対称性は変わっていないことに気付く。したがって、値aa〜ssを行列Rの代わりに行列RIの対応する要素に交換すれば、R変換について導出した方法及びフローグラフを整数近似にも適用することができる。
DCT−HTダウンサンプリング変換
空間分解能の低下を伴うMPEG−2からH.264/AVCへのトランスコーディングの場合、ダウンサンプリングを伴うDCT−HT係数変換が役立つ。
空間分解能の低下を伴うMPEG−2からH.264/AVCへのトランスコーディングの場合、ダウンサンプリングを伴うDCT−HT係数変換が役立つ。
図7は、従来技術によるダウンサンプリングを伴う画素領域におけるDCTからHTへの係数変換の図を示す。左上の4×4ブロック701、すなわち入力DCT係数702の低周波係数X1に逆DCT変換710を施して、4×4の画素ブロックx1703を生成し、次にこれにHT変換720を施して、HT係数ブロックYd704を生成する。
図8は、ダウンサンプリングを伴う変換領域におけるDCT−HT変換、及び8×8ブロックであるDCT係数Xの、4×4ブロックであるHT係数Ydへの変換を示す。画素領域と同様に、X802の左上の4×4ブロックX1801のみを用い、他の3つのブロックは全て廃棄する。DCT−HTダウンサンプリング変換は、4×4行列である変換カーネル行列Sdを用いたX1からYd803への変換810として次のように表すことができる。
この変換をSd変換と呼び、以下でさらに詳述する。
導出において用いるいくつかの表記は次の通りである。
X − 8×8行列である入力DCT係数
Yd − 4×4行列である目標HT係数
X1、X2、X3、X4 − Xの4つの4×4サブブロック
x1 − X1のIDCT
T4 − 4×4のDCT変換カーネル行列
X − 8×8行列である入力DCT係数
Yd − 4×4行列である目標HT係数
X1、X2、X3、X4 − Xの4つの4×4サブブロック
x1 − X1のIDCT
T4 − 4×4のDCT変換カーネル行列
Sd変換の導出を以下に記載する。
X1の逆DCTはx1である。すなわち、次のように表すことができる。
x1のHT変換はYdである。すなわち、次のように表すことができる。
式(15)を式(14)と比較すると、次式が得られる。
ダウンサンプリングDCT−HT変換は式(14)によって与えられ、その変換カーネル行列Sdを小数点第4位で丸めたものを以下に示す。
S変換と同じ原理に従って、対称性及び変換カーネル行列Sdのスパース性に基づく方法を導出する。
図9は、1DのSd変換方法のフローグラフを示す。この2D変換も分離可能であるため、1D変換を用いて実施することができる。
DCT係数は12ビットのダイナミックレンジを持つ。2DのSd変換の利得は多くて11.42であり、これはダイナミックレンジを15.52ビットに増やす。32ビット演算を使用できるようにするために、スケーリングファクタを(2(32−15.52))の平方根よりも小さくしなければならない。2のべき乗でこの条件を満たす最大の整数は256である。
したがって、32ビット演算を考慮した整数変換カーネル行列が以下のように与えられる。
Sd変換方法は、値α〜γを行列Sdの代わりに行列SIdの対応する要素に交換すれば、整数近似にも適用可能である。
トランスコーディング
図10A〜図10Cは、本発明において説明する変換を用いてイントラフレームをトランスコードする方法を示す。
図10A〜図10Cは、本発明において説明する変換を用いてイントラフレームをトランスコードする方法を示す。
図10Aは、入力MPEG−2形式1001から出力H.264/AVC形式1002へのイントラフレームトランスコーディングのブロック図を示す。入力をエントロピー復号化1003及び逆量子化1004して、DCT係数を復元する。このDCT係数を、S変換310を用いてHT係数に変換する。次に、このHT係数に量子化1005及びエントロピー符号化1006を施し、出力H.264/AVCビットストリーム1002を生成する。
図10Bは、入力H.264/AVC形式1011から出力MPEG−2形式1012へのイントラフレームトランスコーディングのブロック図を示す。入力をエントロピー復号化1013及び逆量子化1014して、HT係数を復元する。このHT係数を、R変換410を用いてDCT係数に変換する。次に、このDCT係数に量子化1015及びエントロピー符号化1016を施し、出力MPEG−2ビットストリーム1012を生成する。
図10Cは、入力MPEG−2形式1021から空間分解能のより低い出力H.264/AVC形式1022へのイントラフレームトランスコーディングのブロック図を示す。入力をエントロピー復号化1023及び逆量子化1024して、DCT係数を復元する。次に、このDCT係数を、Sd変換810を用いて空間分解能のより低いHT係数に変換する。このHT係数に、量子化1025及びエントロピー符号化1026を施し、出力H.264/AVCビットストリーム1022を生成する。
本発明を、好ましい実施形態の例として記載してきたが、本発明の精神及び範囲内で様々な他の適応及び変更を行ってもよいことが理解される。したがって、添付の特許請求の範囲の目的は、本発明の真の精神及び範囲に入るそのような変形及び変更をすべて網羅することである。
Claims (10)
- 第1の変換カーネルに基づく入力ビデオを第2の変換カーネルに基づく出力ビデオにトランスコードする方法であって、
前記第1の変換カーネルと前記第2の変換カーネルは異なり、
1つの変換カーネル行列の係数を求めること、
及び
前記1つの変換カーネル行列のみを用いて完全に変換領域で前記入力ビデオの入力係数を前記出力ビデオの出力係数に変換すること
を含む方法。 - 前記入力ビデオは、DCT係数に基づき、前記出力ビデオは、HT係数に基づく
請求項1記載の方法。 - 前記入力ビデオは、HT係数に基づき、前記出力ビデオは、DCT係数に基づく
請求項1記載の方法。 - 前記入力ビデオは、MPEG−2符号化形式を有し、前記出力ビデオは、AVC符号化形式を有する
請求項1記載の方法。 - 前記入力ビデオは、AVC符号化形式を有し、前記出力ビデオは、MPEG−2符号化形式を有する
請求項1記載の方法。 - 変換中に空間分解能を下げることをさらに含む
請求項1記載の方法。 - 前記1つの変換カーネル行列の前記係数を整数値で近似することをさらに含む
請求項1記載の方法。 - 前記1つの変換カーネル行列の前記係数をスケーリングすること、
及び
前記スケーリングした係数を丸めることをさらに含む
請求項7記載の方法。 - 前記入力ビデオはイントラフレームを有し、
前記入力ビデオの前記イントラフレームをエントロピー復号化すること、
前記復号化したイントラフレームを逆量子化して、前記入力係数を復元すること、
前記出力係数を量子化すること、
及び
前記量子化された出力係数をエントロピー符号化し、前記出力ビデオのイントラフレームを生成することをさらに含む
請求項1記載の方法。 - 入力形式を有する入力ビデオを出力形式を有する出力ビデオに変換するトランスコーダであって、
前記入力形式と前記出力形式は異なり、
1つの変換カーネル行列と、
及び
前記1つの変換カーネル行列のみを用いて完全に変換領域で前記入力ビデオの入力係数を前記出力ビデオの出力係数にマッピングする手段と
を備えるトランスコーダ。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/858,109 US20050265445A1 (en) | 2004-06-01 | 2004-06-01 | Transcoding videos based on different transformation kernels |
PCT/JP2005/010284 WO2005120076A1 (en) | 2004-06-01 | 2005-05-30 | Method and apparatus for transcoding input video based on first transformation kernel to output viedo based on second transformation kernel |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008501250A true JP2008501250A (ja) | 2008-01-17 |
Family
ID=34968839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006519584A Pending JP2008501250A (ja) | 2004-06-01 | 2005-05-30 | 第1の変換カーネルに基づく入力ビデオを第2の変換カーネルに基づく出力ビデオにトランスコードする方法、及び入力形式を有する入力ビデオを出力形式を有する出力ビデオに変換するトランスコーダ |
Country Status (5)
Country | Link |
---|---|
US (1) | US20050265445A1 (ja) |
EP (1) | EP1769641A1 (ja) |
JP (1) | JP2008501250A (ja) |
CN (1) | CN1860795A (ja) |
WO (1) | WO2005120076A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107592938A (zh) * | 2015-03-09 | 2018-01-16 | 弗劳恩霍夫应用研究促进协会 | 用于对编码音频信号进行解码的解码器和用于对音频信号进行编码的编码器 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060109900A1 (en) * | 2004-11-23 | 2006-05-25 | Bo Shen | Image data transcoding |
US20060245491A1 (en) * | 2005-04-28 | 2006-11-02 | Mehrban Jam | Method and circuit for transcoding transform data |
JP2007096431A (ja) * | 2005-09-27 | 2007-04-12 | Matsushita Electric Ind Co Ltd | 任意の変換比率を有するデジタル・ビデオ・フォーマット下方変換装置及び方法 |
CN100539704C (zh) * | 2005-12-08 | 2009-09-09 | 香港中文大学 | 视频信号的编码系数的转换装置及其方法 |
US20070147496A1 (en) * | 2005-12-23 | 2007-06-28 | Bhaskar Sherigar | Hardware implementation of programmable controls for inverse quantizing with a plurality of standards |
US8320450B2 (en) * | 2006-03-29 | 2012-11-27 | Vidyo, Inc. | System and method for transcoding between scalable and non-scalable video codecs |
WO2009047684A2 (en) * | 2007-10-08 | 2009-04-16 | Nxp B.V. | Video decoding |
US8255445B2 (en) | 2007-10-30 | 2012-08-28 | The Chinese University Of Hong Kong | Processes and apparatus for deriving order-16 integer transforms |
US8175165B2 (en) | 2008-04-15 | 2012-05-08 | The Chinese University Of Hong Kong | Methods and apparatus for deriving an order-16 integer transform |
US8102918B2 (en) * | 2008-04-15 | 2012-01-24 | The Chinese University Of Hong Kong | Generation of an order-2N transform from an order-N transform |
KR20100083271A (ko) * | 2009-01-13 | 2010-07-22 | 삼성전자주식회사 | 휴대 방송 서비스 공유 방법 및 장치 |
US9635368B2 (en) * | 2009-06-07 | 2017-04-25 | Lg Electronics Inc. | Method and apparatus for decoding a video signal |
US20130041828A1 (en) * | 2011-08-10 | 2013-02-14 | Cox Communications, Inc. | Systems, Methods, and Apparatus for Managing Digital Content and Rights Tokens |
CN108200439B (zh) * | 2013-06-14 | 2020-08-21 | 浙江大学 | 提高数字信号变换性能的方法及数字信号变换方法和装置 |
CN104469388B (zh) * | 2014-12-11 | 2017-12-08 | 上海兆芯集成电路有限公司 | 高阶视频编解码芯片以及高阶视频编解码方法 |
US10841601B2 (en) * | 2015-06-23 | 2020-11-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements for transcoding |
TWI794129B (zh) * | 2017-07-13 | 2023-02-21 | 美商松下電器(美國)知識產權公司 | 編碼裝置、編碼方法、解碼裝置、解碼方法及電腦可讀取之非暫時性媒體 |
CN111669579B (zh) * | 2019-03-09 | 2022-09-16 | 杭州海康威视数字技术股份有限公司 | 进行编码和解码的方法、编码端、解码端和系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7330509B2 (en) * | 2003-09-12 | 2008-02-12 | International Business Machines Corporation | Method for video transcoding with adaptive frame rate control |
US7379500B2 (en) * | 2003-09-30 | 2008-05-27 | Microsoft Corporation | Low-complexity 2-power transform for image/video compression |
-
2004
- 2004-06-01 US US10/858,109 patent/US20050265445A1/en not_active Abandoned
-
2005
- 2005-05-30 EP EP05745826A patent/EP1769641A1/en not_active Withdrawn
- 2005-05-30 WO PCT/JP2005/010284 patent/WO2005120076A1/en not_active Application Discontinuation
- 2005-05-30 JP JP2006519584A patent/JP2008501250A/ja active Pending
- 2005-05-30 CN CN200580001040.7A patent/CN1860795A/zh active Pending
Non-Patent Citations (3)
Title |
---|
JPN6010065870, Vetro A et al., "Video transcoding architectures and techniques: an overview", IEEE Signal Processing Magazine, 200303, Vol.20, No.2, pp.18−29, IEEE * |
JPN6010065872, Malvar, H.S. et al., "Low−complexity transform and quantization in H.264/AVC", Circuits and Systems for Video Technology, IEEE Transactions on, 200307, Vol.13, No.7, pp.598−603, IEEE * |
JPN7010003757, Yuh−Jue Chuang et al., "Direct Splitting and Merging of 2−D DCT in the DCT Domain", International Conference on Software, Telecommunications and Computer Networks SoftCOM 2003, 20031007, pp.832−836 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107592938A (zh) * | 2015-03-09 | 2018-01-16 | 弗劳恩霍夫应用研究促进协会 | 用于对编码音频信号进行解码的解码器和用于对音频信号进行编码的编码器 |
US10706864B2 (en) | 2015-03-09 | 2020-07-07 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Decoder for decoding an encoded audio signal and encoder for encoding an audio signal |
US11335354B2 (en) | 2015-03-09 | 2022-05-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Decoder for decoding an encoded audio signal and encoder for encoding an audio signal |
US11854559B2 (en) | 2015-03-09 | 2023-12-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Decoder for decoding an encoded audio signal and encoder for encoding an audio signal |
Also Published As
Publication number | Publication date |
---|---|
CN1860795A (zh) | 2006-11-08 |
WO2005120076A1 (en) | 2005-12-15 |
US20050265445A1 (en) | 2005-12-01 |
EP1769641A1 (en) | 2007-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008501250A (ja) | 第1の変換カーネルに基づく入力ビデオを第2の変換カーネルに基づく出力ビデオにトランスコードする方法、及び入力形式を有する入力ビデオを出力形式を有する出力ビデオに変換するトランスコーダ | |
US7242713B2 (en) | 2-D transforms for image and video coding | |
KR101348365B1 (ko) | 영상의 부호화 방법 및 장치, 복호화 방법 및 장치 | |
TWI382767B (zh) | 反向離散餘弦轉換計算中之誤差減少 | |
JPH1175186A (ja) | スケーリングされた順方向および逆方向の離散コサイン変換と、これを使用するビデオ圧縮伸長システム | |
KR101313952B1 (ko) | 부호화된 데이터의 압축 이득을 위한 피압축 도메인 시스템 및 방법 | |
US7634148B2 (en) | Image signal transforming and inverse-transforming method and computer program product with pre-encoding filtering features | |
JPH09247673A (ja) | 符号化動画像再生装置 | |
US20230421815A1 (en) | Transformations for signal enhancement coding | |
KR20120034582A (ko) | 영상/화상을 부호화하기 위한 장치 및 방법 | |
KR100651316B1 (ko) | 정보 스트림 디코더에서 메모리 자원 이용을 증가시키는 방법 및 장치 | |
JP2002531973A (ja) | 画像の圧縮及び伸張 | |
US6760479B1 (en) | Super predictive-transform coding | |
CN100440978C (zh) | 一种视频图像编码方法 | |
CN101193285A (zh) | 影像压缩编码及解码的方法和装置 | |
JP2005524354A (ja) | 複数基準フレームに基づいた動き補償時間的フィルタ化を行うウェーブレット・ベース符号化 | |
JP4913349B2 (ja) | 符号化動画像変換装置 | |
JP4363615B2 (ja) | 符号化動画像変換装置 | |
JP6846134B2 (ja) | 映像符号化装置及び映像復号装置 | |
US20100014764A1 (en) | Image encoding/decoding devices and image band decomposing/composing devices | |
KR100669635B1 (ko) | 상관성 기반 움직임 보상방법 | |
KR100946925B1 (ko) | 다수의 기본 블록들을 이용한 다차원 변환 및 양자화 방법,그리고 그 장치 | |
KR20070099911A (ko) | 디지털 영상 압축 방법 및 상기 방법을 실행시키기 위한컴퓨터 판독 가능한 프로그램을 기록한 매체 | |
JPH1051777A (ja) | 直交変換符号化方式 | |
Lubobya et al. | Optimization of 4x4 Integer DCT in H. 264/AVC Encoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101116 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110426 |