JP5457199B2 - 変換ベースのデジタル・メディア・コーデックにおける計算の複雑性及び精度の制御 - Google Patents

変換ベースのデジタル・メディア・コーデックにおける計算の複雑性及び精度の制御 Download PDF

Info

Publication number
JP5457199B2
JP5457199B2 JP2009550994A JP2009550994A JP5457199B2 JP 5457199 B2 JP5457199 B2 JP 5457199B2 JP 2009550994 A JP2009550994 A JP 2009550994A JP 2009550994 A JP2009550994 A JP 2009550994A JP 5457199 B2 JP5457199 B2 JP 5457199B2
Authority
JP
Japan
Prior art keywords
digital media
decoder
accuracy
transform
scaling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009550994A
Other languages
English (en)
Other versions
JP2010519858A (ja
Inventor
スリニバサン,スリダー
ツ,チェンジー
レグナサン,シャンカー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2010519858A publication Critical patent/JP2010519858A/ja
Application granted granted Critical
Publication of JP5457199B2 publication Critical patent/JP5457199B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/654Transmission by server directed to the client
    • H04N21/6547Transmission by server directed to the client comprising parameters, e.g. for client setup
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Description

ブロック変換ベースの符号化
変換(transform)符号化は、多くのデジタル・メディア(例えば、音声、画像及びビデオ)圧縮システムにおいて使用される圧縮技術である。圧縮されていないデジタル画像及びビデオは、一般に、2次元(2D)グリッドとして配列された画像又はビデオフレーム中の場所における画素又は色のサンプルとして表わされ、又は取り込まれる。これは、画像又はビデオの空間領域表現と呼ばれる。例えば、画像での一つの典型的な形式は、グリッドとして配列された24ビットの色画素サンプルのストリームからなる。各サンプルは、特にRGBやYIQといった色空間内におけるグリッド中の或る画素位置における色成分を表す数である。様々な画像及びビデオシステムが、サンプリングの様々な異なる色、空間及び時間分解能を使用し得る。同様に、デジタル音声は、一般に、時間サンプリングされた音声信号ストリームとして表わされる。例えば、一つの典型的な音声形式は、規則的な時間間隔で採取された音声信号の16ビット振幅サンプルのストリームからなる。
圧縮されていないデジタル音声、画像及びビデオ信号は、少なからぬ記憶及び伝送容量を消費し得る。変換符号化は、信号の空間領域表現を周波数領域(又は、他の同様な変換領域)表現に変換し、次いで、その変換領域表現の特定の、一般にはより知覚されにくい周波数成分の分解能を低減することによって、デジタル音声、画像及びビデオのサイズを縮小する。これは、一般に、空間領域における画像又はビデオ、或いは時間領域における音声の色又は空間分解能を低減するのと比べて、比較的知覚されにくいデジタル信号の劣化を生じさせる。
より具体的に、図1に示される典型的なブロック変換ベースの符号器/復号器システム100(以下、「コーデック」とも呼ぶ)は、圧縮されていないデジタル画像の画素を、各ブロックが他のブロックと重なり合うこともある固定サイズの二次元ブロック(X、・・・、X)に分割する。空間周波数分析を行う線形変換120〜121が各ブロックに適用され、ブロック内の離隔されたサンプルが、該ブロック間隔にわたる、対応する周波数帯域でのデジタル信号の強さを一般に表す1組の周波数(又は変換)係数に変換される。圧縮のために、これらの変換係数が選択的に量子化され(130)(すなわち、係数値の最下位ビットを除去し、或いは別の方法により、より高い分解能数セット中の値をより低い分解能にマッピングすることによって、分解能が低減され)、さらに、圧縮データストリームへと、エントロピー符号化又は可変長符号化され得る(130)。復号化時に、変換係数は、色/空間サンプリングされた元の画像/ビデオ信号をほぼ再構成するように逆変換される(170〜171)(再構成されたブロック
)。
ブロック変換120〜121は、サイズNのベクトルxに対する数学演算として定義され得る。ほとんどの場合、この演算は線形乗算であり、変換領域出力y=Mxを生じる。ただしMは変換行列である。入力データが任意の長さであるとき、該データはサイズNのベクトルに区分化され、ブロック変換が各区分に適用される。データ圧縮のために、可逆ブロック変換が選択される。言い換えると、行列Mは反転可能である。(例えば画像やビデオなどに対する)多次元において、ブロック変換は、一般に、分離可能な演算として実施される。行列乗算は、データの各次元(すなわち行と列の両方)に従って分離可能に適用される。
圧縮のために、変換係数(ベクトルyの成分)が選択的に量子化され(すなわち、係数値の最下位ビットを除去し、或いは別の方法で、より高い分解能数セット中の値をより低い分解能にマッピングすることによって、分解能が低減され)、さらに、圧縮データストリームへと、エントロピー符号化又は可変長符号化され得る。
復号器150における復号時には、図1に示すように、復号器150側で、これらの演算の逆(逆量子化/エントロピー復号化160及び逆ブロック変換170〜171)が適用される。データを再構成する間に、逆行列M−1( 逆変換170〜171)が、乗数として変換領域データに適用される。変換領域データに適用されると、この逆変換は、元の時間領域又は空間領域デジタル・メディアをほぼ再構成する。
多くのブロック変換ベースの符号化のアプリケーションにおいて、変換は、量子化係数に応じて、損失有り及び損失無しの圧縮をサポートするように、可逆的であることが望ましい。例えば、(一般に、量子化係数1として表される)量子化無しの場合、可逆変換を利用するコーデックは、復号時に入力データを正確に再現することができる。しかしながら、これらのアプリケーションにおける可逆性の要件は、コーデックが設計され得る変換の選択を制約する。
MPEGやWindows(登録商標)Mediaなどの多くの画像及びビデオ圧縮システムは、特に、離散コサイン変換(DCT)に基づく変換を利用する。DCTは、ほぼ最適なデータ圧縮を生じる好適なエネルギー圧縮特性を持つことが知られている。これらの圧縮システムでは、個々の画像ブロックを再構成するために、圧縮システムの符号器及び復号器の再構成ループにおいて、逆DCT(IDCT)が用いられる。
量子化
量子化は、大部分の画像及びビデオコーデックにとって、圧縮画像品質及び圧縮率を制御するための主要なメカニズムである。一つの可能な定義によれば、量子化は、損失有りの圧縮に一般的に用いられる近似不可逆マッピング機能のために用いられる用語であって、取り得る出力値の特定の組が存在し、該取り得る出力値の組における個々の数値が、その特定の出力値の選択をもたらし得る、関連付けられた入力値の組を有している。スカラー量子化又はベクトル量子化、線形量子化又は非線形量子化、デッドゾーン付き量子化又はデッドゾーン無し量子化、及び、適応量子化又は非適応量子化を含む様々な量子化技術が開発されてきている。
量子化演算は、本質的には、エンコーダにおいて実行される、量子化パラメータQPによるバイアスされた除算である。逆量子化又は乗算演算は、デコーダにおいて実行されるQPによる乗算である。これらの処理は、ともに、元の変換係数データの損失を招き、復号化された画像における圧縮誤差又は画像乱れとして現れる。
以下の詳細な説明は、デジタル・メディア・コーデックによる符号化の計算の複雑性及び精度を制御する装置及び技術を提示する。本技術の一つの態様において、符号器は、復号器で使用されるために、スケーリング有り又はスケーリング無しの精度モードのうちいずれか一つを伝達する。スケーリング有りの精度モードでは、入力画像が号器において予め(例えば8によって)乗算される。復号器における出力もまた、丸め除算によってスケーリングされる。スケーリング無しの精度モードの場合、そのようなスケーリング演算は適用されない。スケーリング無し精度モードの場合、符号器及び復号器は、変換係数に対して、より小さなダイナミック・レンジを扱い、それによって計算の複雑性が低減される。
本技術の他の態様において、コーデックは、また、変換演算を実行するために必要とされる精度を復号器に伝達し得る。一つの実施形態において、ビットストリームの構文要素のうちの一つの要素は、復号器における変換に、低めの精度の数学演算を用いるか否かを伝達する。
この発明概要は、以下の発明の詳細な説明において更に説明する単純化された形態の発明構想のうちの選択されたものを紹介するためのものである。本発明概要には、請求項に記載された発明の主要な特徴又は必要不可欠な特徴を特定する意図はなく、請求項に記載された発明の範囲の決定を助けることを意図するものでもない。本発明の更なる特徴及び利点は、添付の図面を参照して行われる以下の本発明の実施形態の詳細な説明から明らかにされる。
図1は、従来技術におけるブロック変換ベースのコーデックのブロック図である。 図2は、ブロック・パターン符号化を組み込む代表的な符号器のフロー図である。 図3は、ブロック・パターン符号化を組み込む代表的な復号器のフロー図である。 図4は、図2及び3の代表的な符号器/復号器の一つの実施形態における、コア変換及びポストフィルター(重ね合わせ)演算を含む逆重ね合わせ変換の図である。 図5は、変換演算のための入力データ点を示す図である。 図6は、図2及び3のメディア符号器/復号器を実現するのに適切なコンピューティング環境のブロック図である。
発明の詳細な説明
以下の説明は、変換ベースのデジタル・メディア・コーデックの精度及び計算の複雑性を制御する技術に関する。以下の説明では、デジタル・メディアの圧縮システム又はコーデックにおける、本技術の例としての実施形態を記述する。デジタル・メディア・システムは、伝送及び記憶のためにデジタル・メディア・データを圧縮された形態に符号化し、再生又はその他の処理のために該データを復号化する。説明のために、計算の複雑性及び精度の制御を組み込んだ例としての本圧縮システムは、画像又はビデオ圧縮システムである。代替として、本技術は、他のデジタル・メディア・データ圧縮システム又はコーデックに組み込まれてもよい。計算の複雑性及び精度の制御技術は、デジタル・メディア圧縮システムが圧縮されるデジタル・メディア・データを、特定の符号化形式で符号化することを必要としない。
1.符号器/復号器
図2及び3は、代表的な2次元(2D)データ符号器200及び復号器300において用いられるプロセスの一般化された図である。これらの図は、計算の複雑性及び精度の制御技術を用いた圧縮を実行する2Dデータ符号器及び復号器を組み込んだ圧縮システムの一般化又は簡略化された例を示している。この制御技術を用いる代替の圧縮システムにおいては、2Dデータ圧縮のために、この代表的な符号器及び復号器に示すものより多い又は少ないプロセスも用いられ得る。例えば、いくつかの符号器/復号器は、更に、色変換(color conversion)、色フォーマット、拡張可能符号化、損失無し符号化、マクロブロック・モード等も含み得る。圧縮システム(符号器及び復号器)は、損失無しから損失有りまで変化する量子化パラメータに基づき得る量子化に応じて、2Dデータの損失有り及び/又は損失無しの圧縮を提供することができる。
2Dデータ符号器200は、符号器への入力として提供される2Dデータ210の、(典型的な入力のための)より容量の小さい表現である圧縮ビットストリーム220を生成する。例えば、該2Dデータ入力は、画像、ビデオ・シーケンスのフレーム、或いは、2次元を有する他のデータであり得る。2Dデータ符号器は、入力データのフレームをブロックに分割し(図2に分割230として一般的に示される)、該ブロックは、図示された実施形態において、フレーム面を覆う規則的パターンを形成する、互いに重ならない4×4画素のブロックである。該ブロックは、この代表的な符号器においては16×16画素のサイズである、マクロブロックと呼ばれる束へとグループ化される。次に、マクロブロックは、タイルと呼ばれる規則的な構造にグループ化される。タイルは、また、水平方向の行における複数のタイルが同一の高さを有して整列され、垂直方向の列における複数のタイルが同一の幅を有して整列されるように、画像を覆う規則的なパターンを形成する。この代表的な符号器において、タイルは、水平及び/又は垂直方向において、16の倍数である任意のサイズを取り得る。代替的な符号器の実施形態では、画像を、ブロック、マクロブロック、タイル、又は他の大きさ及び構造を有する他の単位に分割してもよい。
「順方向重ね合わせ」(forward overlap)演算子240は、ブロック間の各エッジに適用され、その後に、各4×4のブロックが、ブロック変換250を用いて変換される。このブロック変換250は、スリニヴァサンにより2004年12月17日に出願された、「損失有り及び損失無し2Dデータ圧縮のための可逆変換」という名称の米国特許出願第11/015707号に記載されている可逆且つスケール無しの(scale−free)変換であってもよい。重ね合わせ演算子240は、チューらにより2004年12月17日に出願された、「効率的な損失無しデータ圧縮のための可逆重ね合わせ演算子」という名称の米国特許出願第11/015148号、及び、チューらにより2005年1月14日に出願された、「重ね合わせ双直交変換のための可逆2次元プリ/ポストフィルタリング」という名称の米国特許出願第11/035991号に記載された可逆重ね合わせ演算子であってもよい。代替として、離散コサイン変換又は他のブロック変換と、重ね合わせ演算子とが使用され得る。この変換に続き、各4×4変換ブロックのDC係数260が、同様の処理連鎖(タイル化、順方向重ね合わせ、次いで4×4ブロック変換)を施される。結果として生じたDC変換係数及びAC変換係数は、量子化270され、エントロピー符号化280されてパケット化290される。
復号器は逆のプロセスを実行する。復号器側では、変換係数ビットがそれぞれのパケットから抽出310され、そこから、係数自体が復号化320され、逆量子化330される。DC係数340は、逆変換を適用することにより再生成され、DC係数の平面が、DCブロックのエッジにまたがって適用される適切な平滑化演算子を用いて「逆重ね合わせ」される。その後、DC係数と、ビットストリームから復号化されたAC係数342とに、4×4逆変換350を適用することにより、データ全体が再生成される。最後に、結果として生じる画像平面のブロックエッジが逆重ね合わせフィルタリング360される。これにより、再構成された2Dデータ出力が生成される。
例としての実施形態において、符号器200(図2)は、入力画像を圧縮して圧縮されたビットストリーム220(例えば、ファイル)にし、デコーダ300(図3)は、損失無し又は損失有りのいずれの符号化が行われているかによって、元の入力又はその近似値を再構成する。符号化のプロセスは、以下に説明する順方向重ね合わせ変換(LT)の適用を含み、これは、やはり以下に更に詳しく説明する可逆2次元プリ/ポストフィルタリングによって実現される。復号化のプロセスは、可逆2次元プリ/ポストフィルタリングを用いる逆重ね合わせ変換(ILT)の適用を含む。
上記のLT及びILTは互いの逆であり、厳密には、2つ合わせて可逆重ね合わせ変換と呼ばれ得る。可逆変換として、LT及びILTの組み合わせは、損失無しの画像圧縮に用いられ得る。
上記の符号器200/復号器300によって圧縮される入力データ210は、様々な色フォーマットの画像(例えば、RGB/YUV4:4:4、YUV4:2:2、又はYUV4:2:0の色画像フォーマット)であってよい。典型的には、入力画像は常に輝度(Y)成分を有する。RGB/YUV4:4:4、YUV4:2:2、又はYUV4:2:0画像である場合、画像は、更に、U成分及びV成分のようなクロミナンス成分を有する。画像の個々の色平面又は色成分は、異なる空間分解能を備え得る。入力画像が例えばYUV4:2:0色フォーマットである場合、U成分及びV成分は、Y成分の半分の幅及び高さを有する。
上記の通り、符号器200は、入力画像又は写真をタイル状のマクロブロックにする。例としての実施形態において、符号器200は、入力画像を、Yチャンネルにおいて、16×16画素領域(「マクロブロック」と呼ばれる)へとタイル状にする(これは、色フォーマットに依存して、Uチャンネル及びVチャンネルでは16×16、16×8、又は8×8領域であり得る)。個々のマクロブロック色平面は、4×4画素領域又はブロックへとタイル状にされる。従って、マクロブロックは、この例としての符号器の実施形態において、以下の方法により、様々な色フォーマットに対して構成される。
1.グレースケール画像については、各マクロブロックが16個の4×4輝度(Y)ブロックを有する。
2.YUV4:2:0フォーマットの色画像については、各マクロブロックが16個の4×4Yブロックと、それぞれ4個の4×4クロミナンス(U及びV)ブロックとを有する。
3.YUV4:2:2フォーマットの色画像については、各マクロブロックが16個の4×4Yブロックと、それぞれ8個の4×4クロミナンス(U及びV)ブロックとを有する。
4.RGB又はYUV4:4:4の色画像については、各マクロブロックがY、U及びVチャンネルそれぞれについて16ブロックを有する。
従って、変換後、この代表的な符号器200/復号器300におけるマクロブロックは、3つの周波数サブバンド、即ち、DCサブバンド(DCマクロブロック)、低域通過サブバンド(低域通過マクロブロック)及び高域通過サブバンド(高域通過マクロブロック)を有する。代表的なシステムにおいて、低域通過及び/又は高域通過サブバンドは、ビットストリームにおいて任意であり、これらのサブバンドは完全に除去されてもよい。
更に、圧縮データは、空間順及び周波数順のうちいずれかの順序付けにより、ビットストリームにパケット化され得る。空間順である場合、一つのタイル内における同一マクロブロックの異なるサブバンドが一緒に並べられ、各タイルの結果として生じるビットストリームは、一つのパケットに書き込まれる。周波数順である場合、一つのタイル内における異なるマクロブロックの同一サブバンドが一緒にグループ化され、一つのタイルのビットストリームが、DCタイルパケット、低域通過タイルパケット及び高域通過タイルパケットの3つのパケットに書き込まれる。更に、他のデータ層も存在し得る。
従って、代表的なシステムにおいて、画像は以下の「次元」で組織化される。即ち、
空間次元:フレーム→タイル→マクロブロック、
周波数次元:DC|低域通過|高域通過、
チャンネル次元:輝度|クロミナンス_0|クロミナンス_1…(例えば、Y|U|Vとして)。なお、上記矢印は階層を示し、垂直線は区切りを示す。
代表的なシステムは、圧縮デジタル・メディア・データを空間、周波数及びチャンネル次元において組織化するが、ここで説明された柔軟な量子化手法は、より少ない又は多い次元或いは他の次元に沿ってデータを組織化する代替としての符号器/復号器システムに適用されてもよい。例えば、柔軟な量子化手法は、より多くの周波数帯、色チャンネルの他のフォーマット(例えば、YIQ、RGB等)、更なる画像チャンネル(例えば、ステレオ・ビジョン又は他の複数のカメラ配列)を用いる符号化に適用され得る。
2.逆コア変換及び逆重ね合わせ変換
概要
符号器200/復号器300の一つの実施形態において、復号器側における逆変換は、二段階重ね合わせ変換の形態を取り得る。そのステップは以下の通りである。
DC平面として知られる平面に配列された再構成されたDC係数及び低域通過係数に対応して、各4×4ブロックに逆コア変換(ICT)が適用される。DC平面のブロックに均一にまたがる4×4領域にポストフィルタリング演算が選択的に適用される。更に、境界の2×4及び4×2領域にポストフィルタリングが適用され、4つの2×2の角領域はそのままに残される。結果として生じる配列は、第一段階変換に対応する4×4ブロックのDC係数を含む。DC係数は、より大きな配列に(比喩として)コピーされ、再構成された高域通過係数が残りの位置に埋められる。各4×4ブロックにICTが適用される。DC平面のブロックに均一にまたがる4×4領域にポストフィルタリング演算が選択的に適用される。更に、境界の2×4及び4×2領域にポストフィルタリングが適用され、4つの2×2の角領域はそのままに残される。このプロセスは図4に示される。
ポストフィルタリングの適用は、圧縮ビットストリーム220内のOVERLAP_INFO構文要素に支配される。OVERLAP_INFOは、3つの値を取り得る。OVERLAP_INFO=0のとき、ポストフィルタリングは実行されない。OVERLAP_INFO=1のとき、外側のポストフィルタリングのみが実行される。OVERLAP_INFO=2のとき、内側及び外側のポストフィルタリングが実行される。
逆コア変換
コア変換(CT)は、従来から知られている4×4離散コサイン変換(DCT)から着想されたものであるが、根本的に異なる。第一の主要な差異は、DCTが線形であるのに対し、CTは非線形であることである。第二の主要な差異は、実数に定義されているという事実のために、DCTは、整数から整数への空間において損失無し演算ではないことである。CTは整数上で定義されているため、この空間において損失無しである。第三の主要な差異は、2DのDCTは分離可能な演算であることである。CTは設計により分離することはできない。
逆変換の全プロセスは、以下の3つの基本的な変換演算のつながりとして記載することができ、それは、
2×2アダマール変換:T_h
逆1D回転:InvT_odd
逆2D回転:InvT_odd_odd
である。これらの変換は、分離不可能な演算として実現され、ICT全体の説明に続き、最初に説明される。
2D 2×2アダマール変換T_h
符号器/復号器は、2D 2×2アダマール変換:T_hを、以下の擬似コード表に示すように実装する。
Rは、0又は1の値のみを取り得る丸め係数である。T_hはインボリュートリ(involutory)である(即ち、データベクトル[a b c d]に対しT_hを2回適用すると、Rがその2回の適用間で不変である場合に、[a b c d]の元の値を再構成することができる)。T_hの逆数はT_h自体である。
逆1D回転InvT_odd
T_oddの損失無し逆数は、以下の表において擬似コードで定義される。
逆2D回転InvT_odd_odd
逆2D回転InvT_odd_oddは、以下の表において擬似コードで定義される。
ICT演算
2×2データと先に列挙された擬似コードとの対応が、図5に示される。ここでは、次章における変換の説明を容易にするために、4つのデータ点を示す4段階のグレーレベルを用いた色符号化が用いられる。
2D 4×4点ICTは、T_h、逆T_odd及び逆T_odd_oddを用いて構築される。逆T_hはT_h自体であることに注意されたい。ICTは、以下の擬似コードで示される二段階で構成される。各段階は、該段階内において任意の順序で又は同時に実行され得る4つの2×2変換によって構成される。
入力データブロックが、
である場合、4×4_IPCT_1stStage()及び4×4_IPCT_2ndStage()は、
として定義される。関数2×2_ICTは、T_hと同じである。
ポストフィルタリングの概要
4つの演算子が、逆重ね合わせ変換において使用されるポストフィルタを決定する。それらは、
4×4ポストフィルタ
4点ポストフィルタ
2×2ポストフィルタ
2点ポストフィルタ
である。
ポストフィルタは、T_h、InvT_odd_odd、invScale及びinvRotateを用いる。invRotate及びinvScaleは、それぞれ以下の表において定義される。
4×4ポストフィルタ
最初に、OVERLAP_INFOが1又は2である場合、4×4ポストフィルタが、すべての色平面におけるブロック接合部(4つのブロックに均等にまたがる領域)に適用される。また、4×4ポストフィルタは、OVERLAP_INFOが2である場合にはすべての平面について、また、OVERLAP_INFOが2であり且つ色フォーマットがYUV4:2:0又はYUV4:2:2である場合にはルマ平面(luma plane)のみについて、DC平面におけるすべてのブロック接合部に適用される。
入力データブロックが、
である場合、4×4ポストフィルタ4×4PostFilter(a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p)は、以下の表において定義される。
4点ポストフィルタ
線形4点フィルタは、画像の境界部において、2×4領域及び4×2領域にまたがるエッジに適用される。入力データが[a b c d]である場合、4点ポストフィルタ4PostFilter(a,b,c,d)は、以下の表において定義される。
2×2ポストフィルタ
2×2ポストフィルタは、YUV4:2:0及びYUV4:2:2データのクロマ・チャンネルに対し、DC平面におけるブロックをまたがる領域に適用される。入力データが
である場合、2×2ポストフィルタ2×2PostFilter(a,b,c,d)は、以下の表において定義される。
2点ポストフィルタ
2点ポストフィルタは、ブロックをまたがる境界部の2×1及び1×2サンプルに適用される。2点ポストフィルタ2PostFilter(a,b)は、以下の表において定義される。
上記の重ね合わせ変換の変換演算を実行するために要求される精度の伝達は、圧縮された画像構造のヘッダーにおいて実行することができる。例としての実施形態において、LONG_WORD_FLAG及びNO_SCALED_FLAGSは、復号器において適用されるべき精度及び計算の複雑性を伝達するために、圧縮ビットストリーム内で(例えば、画像ヘッダー内で)伝達される構文要素である。
3.精度及びワード長
例としての符号器/復号器は、整数演算を実行する。更に、例としての符号器/復号器は、損失無しの符号化及び復号化をサポートする。そのため、例としての符号器/復号器に要求される第一のマシン精度は整数である。
しかしながら、例としての符号器/復号器において定義される整数演算は、損失有りの符号化における丸め誤差につながる。これらの誤差は意図的に小さくされるが、レート歪み曲線の劣化を招く。丸め誤差を減らして符号化性能を向上させるために、例としての符号器/復号器は、第二のマシン精度を定義する。このモードでは、入力に予め8が乗じられ(即ち、3ビットだけ左にシフトし)、最終的な出力を8で丸め除算する(即ち、3ビットだけ右にシフトする)。これらの演算は、符号器のフロントエンド及び復号器のリアエンドで実行され、プロセスの他の部分からは大部分が隠される。更に、第一のマシン精度で作成され第二のマシン精度で復号化された(又はその逆の)ストリームが許容範囲内の画像を生成するように、それに応じて量子化レベルがスケーリングされる。
第二のマシン精度は、損失無しの圧縮が所望される場合には使用できない。圧縮ファイルを作成する際に用いられるマシン精度は、ヘッダー内に明示的に記される。
第二のマシン精度は、コーデックにおいてスケーリング有りの計算を使用することと等価であり、そのため、このモードをScaledと呼ぶ。第一のマシン精度はUnscaledと呼ばれる。
例としての符号器/復号器は、優れた符号化及び復号化速度を提供するように設計される。例としての符号器/復号器の設計目標は、符号器及び復号器のデータ値が、8ビット入力に対して符号付き16ビットを超えないことである(しかしながら、変換段階における中間の演算ではこの数値を越え得る)。これは両方のマシン精度モードに当てはまる。逆に、第二のマシン精度が選択された場合、中間値の拡張幅は8ビットまでである。第一のマシン精度は8による事前の乗算を避けるため、拡張幅は8−3=5ビットである。第一の例としての符号器/復号器は、中間値として2つの異なるワード長を用いる。これらのワード長は、16ビット及び32ビットである。
第二の例としてのビットストリーム構文及び解釈
第二の例としてのビットストリーム構文及び解釈は階層的であり、以下の層、即ち、画像、タイル、マクロブロック及びブロックからなる。
第二の例としてのビットストリーム構文及び解釈から選択されたいくつかのビットストリーム要素が、以下に定義される。
(1)ロング・ワード・フラグ(LONG_WORD_FLAG)(1ビット):
LONG_WORD_FLAGは1ビットの構文要素であり、16ビット整数が変換計算に利用されるか否かを特定する。この第二の例としてのビットストリーム構文において、LONG_WORD_FLAG==0(FALSE)の場合、16ビット整数の数字及び配列が、変換計算の外側段階に利用され得る((例えば(3a+1)>>1のような)変換内における中間演算が、より高い正確性で実行される)。LONG_WORD_FLAG==TRUEの場合、32ビット整数の数字及び配列が変換計算に利用されることになる。
注:32ビット計算は、LONG_WORD_FLAGの値に関わらず、画像の復号化に利用され得る。この構文要素は、最も効率的なワード長を選択して実装するために、復号器によって利用され得る。
(2)スケーリング無し計算フラグ(NO_SCALED_FLAG)(1ビット)
NO_SCALED_FLAGは、変換がスケーリングを用いるか否かを特定する1ビットの構文要素である。NO_SCALED_FLAG==1の場合、スケーリングは実行されない。NO_SCALED_FLAG==0の場合、スケーリングが用いられる。この場合、スケーリングは、最終段階(色変換)の出力を適切に3ビットだけ切り捨てることにより実行される。
注:損失無しの符号化が所望される場合、たとえ損失無しの符号化が画像の小部分のみに用いられるとしても、NO_SCALED_FLAGはTRUEにセットされる。損失有りの符号化は、いずれのモードを用いてもよい。
注:損失有りの符号化におけるレート歪み性能は、スケーリングが用いられる場合(即ち、NO_SCALED_FLAG==FALSEの場合)、特に低いQPの場合に優れたものとなる。
4.ロング・ワード・フラグの伝達及び使用
代表的な符号器/復号器に対する一つの例としての画像フォーマットは、高いダイナミック・レンジ及び広い音域フォーマットを含む幅広い画素フォーマットをサポートする。サポートされているデータ種別には、符号付き整数、符号無し整数、固定小数点型小数、浮動小数点型小数が含まれる。サポートされているビット深度には、色チャンネルあたり8、16、24及び32ビットが含まれる。例としての画像フォーマットは、色チャンネルあたり24ビットまでを使用する画像の損失無しの圧縮と、色チャンネルあたり32ビットまでを使用する画像の損失有りの圧縮とを可能とする。同時に、例としての画像フォーマットは、高品質な画像及び効率的な圧縮を提供し、簡易な符号化及び復号化の実現を可能とするように設計される。
複雑性の低い実装をサポートするために、例としての画像フォーマットにおける変換は、ダイナミック・レンジの拡張を最小化するように設計される。二段階変換は、ダイナミック・レンジをわずか5ビットしか増加させない。従って、画像のビット深度が色チャンネルあたり8ビットである場合、復号器における全ての変換演算の実行には、16ビットの計算で恐らくは十分である。他のビット深度については、変換演算のために、より高精度の計算が必要となり得る。
特定のビットストリームを復号化する際の計算の複雑性は、変換演算の実行に必要な精度が復号器において分かっている場合には減らすことができる。この情報は、構文要素(例えば、画像ヘッダー内の1ビットのフラグ)を用いて復号器に伝達されることができる。説明する伝達技術及び構文要素により、ビットストリームを復号化する際の計算の複雑性を低減することができる。
一つの例としての実施形態において、1ビットの構文要素LONG_WORD_FLAGが利用される。例えば、LONG_WORD_FLAG==FALSEである場合、16ビット整数の数値及び配列が変換計算の外側段階で利用され得るが、LONG_WORD_FLAG==TRUEである場合、32ビット整数の数値及び配列が変換計算に利用されることになる。
代表的な符号器/復号器の一つの実施形態において、インプレース(in−place)変換演算は16ビットで実行され得るが、変換中の中間演算(例えば、b+=(3a+1)>>1によって与えられる「リフティング」ステップのための積3*aの計算)は、より高い精度(例えば、18ビット又はそれより高い精度)で行われる。しかしながら、この例において、中間計算値a及びb自体は16ビット整数において格納され得る。
画像の復号化には、LONG_WORD_FLAG要素の値に関係なく、32ビット計算が利用され得る。LONG_WORD_FLAG要素は、実装に最も効率的なワード長を選択するために、符号器/復号器によって利用され得る。例えば、符号器は、16ビット及び32ビット精度の変換ステップが同一の出力値をもたらすことが確認できる場合、LONG_WORD_FLAG要素をFALSEにセットすることを選択し得る。
5.NO_SCALED_FLAGの伝達及び利用
代表的な符号器/復号器に対する一つの例としての画像フォーマットは、高いダイナミック・レンジ及び広い音域フォーマットを含む幅広い画素フォーマットをサポートする。同時に、代表的な符号器/復号器の設計は、画像品質及び圧縮効率を最大限にし、複雑性の低い符号化及び復号化の実現を可能とする。
上記の通り、代表的な符号器/復号器は、二段階の階層的なブロックベースの変換を利用し、全ての変換ステップは整数演算である。これらの整数演算中に表われる小さな丸め誤差は、損失有りの圧縮期間での圧縮効率の低下につながる。この問題を克服するために、代表的な符号器/復号器の一つの実施形態では、復号器での演算のために2つの異なる精度モード、即ち、スケーリング有りのモードとスケーリング無しのモードとが定義される。
スケーリング有りの精度モードでは、符号器において入力画像に予め8が乗じられ(即ち、3ビットだけ左にシフトされる)、復号器における最終出力が8で丸め除算される(即ち、3ビットだけ右にシフトされる)。スケーリング有りの精度モードにおける演算は、丸め誤差を最小化し、結果としてレート歪み性能を向上させる。
スケーリング無しの精度モードには、そのようなスケーリングは存在しない。スケーリング無しの精度モードで動作する符号器又は復号器は、変換係数に対して、より小さなダイナミック・レンジを扱わなければならず、したがって計算の複雑性が低い。しかしながら、このモードでの動作には、圧縮効率に若干の損失がある。(量子化無しの、即ち、量子化パラメータQPを1にセットした)損失無しの符号化では、可逆性を保証するために、スケーリング無しの精度モードしか利用することができない。
圧縮ファイルを作成する際に符号器によって利用された精度モードは、圧縮ビットストリーム220(図2)の画像ヘッダー内において、NO_SCALED_FLAGを用いて明示的に伝達される。復号器300は、演算に同じ精度モードを利用することが推奨される。
NO_SCALED_FLAGは、次のように精度モードを特定する、1ビットの構文要素である。すなわち、NO_SCALED_FLAG==TRUEである場合、復号器での演算にはスケーリング無しのモードが利用される。NO_SCALED_FLAG==FALSEである場合、スケーリングが使用される。この場合、最終段階(色変換)の出力を適切に3ビットだけ切り捨てることにより、演算にスケーリング有りのモードが利用される。
損失有りの符号化におけるレート歪み性能は、スケーリング無しのモードが使用される場合(即ち、NO_SCALED_FLAG==FALSEである場合)、特に低いQPの場合に優れたものとなる。しかしながら、2つの理由から、スケーリング無しのモードが使用される場合のほうが、計算の複雑性が小さい。
スケーリング無しのモードの方がダイナミック・レンジの拡張が小さいことは、特に“LONG_WORD_FLAG”と組み合わされて、変換計算のために、より短いワードが利用され得ることを意味する。VLSI実装においては、ダイナミック・レンジの拡張が低減されることは、より上位のビットを実行するゲート・ロジックでの電力消費が低減されることを意味する。
スケーリング有りのモードは、復号器側にて、(8による丸め除算を実現する)追加の3ビットの右ビットシフトを必要とする。符号器側では、3ビットの左ビットシフトが必要になる。これは、スケーリング無しのモードよりも計算的にはわずかに厳しい。
更に、スケーリング無しのモードは、スケーリング有りのモードよりも上位のビットの圧縮を可能とする。例えば、スケーリング無しのモードは、32ビット計算を用いて、サンプルあたり27までの上位ビットの損失無し圧縮(及び圧縮解除)を許容する。これに対し、スケーリング有りのモードでは、24ビットしか可能でない。これは、スケーリング処理によりダイナミック・レンジに3つの追加ビットが加えられるためである。
復号器におけるデータ値は、両方の精度モードについて、8ビットの入力に対して符号付き16ビットを超えない。(しかしながら、変換段階内の中間演算はこの数字を超え得る。)
注:損失無しの符号化が所望される場合(QP=1)、たとえ画像の一部分のみに損失無しの符号化が必要な場合であっても、符号器によってNO_SCALED_FLAGがTRUEにセットされる。
符号器は、損失有りの圧縮のために、両方のモードを使用し得る。復号器は、その演算に、NO_SCALED_MODEによって指示される精度モードを利用することが推奨される。しかしながら、スケーリング有りの精度モードによって作成されスケーリング無しの精度モードを用いて復号化された(又はその逆の)ストリームが、多くの場合、許容範囲内の画像を生成するように、量子化レベルがスケーリングされる。
6.正確性を高めるためのスケーリング計算
代表的な符号器/復号器の一つの実施形態において、変換(色変換を含む)は整数変換であり、一連のリフティング・ステップにより実現される。それらのリフティング・ステップにおいては、切り捨て誤差が変換性能を損なう。損失有りの圧縮の場合、切り捨て誤差による損失を最小化し、変換性能を最大化するために、変換への入力データを数ビット左にシフトする必要がある。しかしながら、他の非常に望ましい特徴として、入力画像が8ビットである場合、各変換の出力は16ビット以内でなければならない。従って、左シフトのビット数を大きくすることはできない。代表的な復号器は、両方の目的を達成するためのスケーリング計算技術を実施する。該スケーリング計算技術は、切り捨て誤差による損失を最小化することにより変換性能を最大化し、入力画像が8ビットの場合に各変換ステップの出力を依然として16ビット以内に制限する。これにより、簡易な16ビットでの実施が可能となる。
代表的な符号器/復号器において用いられる変換は整数変換であり、リフティング・ステップにより実現される。大部分のリフティング・ステップは右シフトを含み、それにより切り捨て誤差が生じる。変換は一般に多くのリフティング・ステップを含み、累積した切り捨て誤差が変換性能を明らかに損なう。
切り捨て誤差による損失を減らす一つの方法は、符号器において変換前に入力データを左にシフトし、復号器において(量子化と結合された)変換後に同じビット数だけ右にシフトすることである。上記の通り、代表的な符号器/復号器は、二段階の変換構造、即ち、オプションとしての第一段階重ね合わせと、第一段階CTと、オプションとしての第二段階重ね合わせと、第二段階CTとを有する。実験によれば、切り下げ誤差を最小化するには、3ビットの左シフトが必要である。従って、損失有りの場合、色変換の前に、入力データが3ビットだけ左にシフトされ、即ち、8の因数により乗算即ちスケーリングされる(例えば、上記のスケーリング有りのモードにおいて)。
しかしながら、色変換(color conversion)及び変換(transform)はデータを拡張する。入力データが3ビットだけシフトされる場合、入力データが8ビットであれば、第二段階4×4DCTの出力は17ビットのダイナミック・レンジを有する(他の各変換の出力は依然として16ビット以内である)。これは、非常に望ましい特徴である16ビットでの実施を妨げるため、極めて好ましくない。これを回避するため、第二段階4×4CTの前に、入力データを1ビットだけ右にシフトさせると、出力データも16ビット以内になる。第二段階4×4CTはデータの16分の1(第一段階DCTのDC変換係数)のみに適用され、該データはすでに第一段階変換により拡大方向にスケーリングされているため、ここでの切り捨て誤差による損失が最小化される。
従って、8ビット画像について損失有りの場合、符号器側では、入力が色変換前に3ビットだけ左にシフトされ、第二段階4×4CTの前に1ビット右にシフトされる。復号器側では、第一段階4×4IDCTの前に入力が1ビットだけ左にシフトされ、色変換の後に3ビットだけ右にシフトされる。
7.コンピューティング環境
デジタル・メディア・コーデックにおける計算の正確性及び精度の伝達のための上記処理技術は、例えば、特に(サーバー、デスクトップ、ラップトップ、ハンドヘルド等を含む様々な形態を取る)コンピューター、デジタル・メディア・レコーダー及びプレイヤ、(カメラ、スキャナー等の)画像及びビデオ・キャプチャー装置、(電話、携帯電話、会議装置等の)通信装置、ディブプレイ、プリンター又は他の表示装置等を含む、様々なデジタル・メディアの符号化及び/又は復号化システムのうちの任意の一つにより実現され得る。デジタル・メディア・コーデックにおける計算の正確性及び精度の伝達技術は、図6に示されるようなコンピューター又は他のコンピューティング環境内で動作する通信ソフトウェアにおいてだけではなく、ハードウェア回路や、ファームウェア制御のデジタル・メディア処理ハードウェアにおいても実現され得る。
図6は、上記の実施形態が実現され得る適切なコンピューティング環境(600)の一般化された例を示す。コンピューティング環境(600)は、本発明の用途又は機能の範囲の如何なる限定をも示唆するものではなく、本発明は、多様な汎用又は専用のコンピューティング環境で実現され得る。
図6について、コンピューティング環境(600)は、少なくとも一つの処理装置(610)と、メモリー(620)とを備える。図6では、この最も基本的な構成(630)が、点線内に含まれる。処理装置(610)は、コンピューター実行可能な命令を実行するものであり、実プロセッサーとすることも、仮想プロセッサーとすることもできる。多重処理システムにおいては、処理能力を増大させるために、複数の処理装置がコンピューター実行可能な命令を実行する。メモリー(620)は、揮発性メモリー(例えば、レジスター、キャッシュ、RAM)であっても、不揮発性メモリー(例えば、ROM、EEPROM、フラッシュメモリー等)であっても、又はこの2つの何らかの組み合わせであってもよい。メモリー(620)は、計算の正確性及び精度の伝達技術を備える上記のデジタル・メディア符号化/復号化を実現するソフトウェア(680)を記憶する。
コンピューティング環境は更なる特徴を有し得る。例えば、コンピューティング環境(600)は、記憶装置(640)、1つ又は複数の入力装置(650)、1つ又は複数の出力装置(660)、及び1つ又はそれ以上の通信接続(670)を備える。バス、コントローラー、ネットワークなどの相互接続機構(図示せず)がコンピューティング環境(600)の要素を互いに接続する。一般に、オペレーティング・システム・ソフトウェア(図示せず)は、コンピューティング環境(600)において動作する他のソフトウェアに動作環境を提供し、コンピューティング環境(600)の構成要素の活動を調整する。
記憶装置(640)は着脱式でも固定式でもよく、磁気ディスク、磁気テープ又はカセット、CD−ROM、CD−RW、DVD、又は、情報の記憶に用いることができ、コンピューティング環境(600)内でアクセスできる任意の他の媒体を含む。記憶装置(640)は、計算の正確性及び精度の伝達技術により上記のデジタル・メディア符号化/復号化を実現するソフトウェア(680)への命令を記憶する。
入力装置(650)は、キーボード、マウス、ペン、トラックボールなどのタッチ入力装置、音声入力装置、スキャナー装置、又は、コンピューティング環境(600)に入力を提供する他の装置であってよい。音声に対しては、入力装置(650)は、マイク又はマイク配列からアナログ又はデジタル形式で音声入力を受け入れるサウンド・カード又は類似の装置、或いはコンピューティング環境に音声サンプルを提供するCD−ROMリーダーとすることができる。出力装置(660)は、ディスプレイ、プリンター、スピーカー、CDライター、又は、コンピューティング環境(600)からの出力を提供する他の装置であってよい。
通信接続(670)は、他のコンピューティング・エンティティとの通信媒体を介した通信を可能とする。通信媒体は、コンピューター実行可能な命令、圧縮音声又はビデオ情報、又は他のデータなどの情報を、変調データ信号として伝達する。変調データ信号とは、その特性の1つ又は複数が、信号内の情報を符号化するような方式で設定又は変更されている信号である。限定的ではない例として、通信媒体には、電気、光、RF、赤外線、音声又はその他の搬送波を用いて実現される有線又は無線技術が含まれる。
柔軟な量子化技術を有する上記のデジタル・メディア符号化/復号化は、本明細書において、コンピューター読み取り可能媒体の一般的状況において説明される。コンピューター読み取り可能媒体は、コンピューティング環境内でアクセスされ得る任意の入手可能な媒体であってよい。限定的ではない例として、コンピューティング環境(600)におけるコンピューター読み取り可能媒体は、メモリー(620)、記憶装置(640)、通信媒体、及びそれらの任意の組み合わせを含む。
上記の計算の正確性及び精度の伝達技術を有するデジタル・メディア符号化/復号化は、本明細書において、コンピューティング環境においてターゲットの実プロセッサー又は仮想プロセッサーで実行される、プログラム・モジュールに含まれるもののようなコンピューター実行可能な命令の一般的状況において説明される。一般に、プログラム・モジュールは、特定のタスクを実行し、又は特定の抽象データ型を実装するルーチン、プログラム、ライブラリー、オブジェクト、クラス、コンポネント、データ構造等を含む。プログラム・モジュールの機能は、様々な実施形態において、所望の通りに組み合わされ、又は複数のプログラム間で分割され得る。プログラム・モジュールに対するコンピューター実行可能な命令は、ローカルのコンピューティング環境又は分散コンピューティング環境内で実行され得る。
説明のために、発明の詳細な説明では、「決定する」、「生成する」、「調整する」及び「適用する」といった用語を利用して、コンピューティング環境におけるコンピューター動作を記述している。これらの用語は、コンピューターにより実行される動作の高度な抽象化であり、人間によって実行される動作と混同してはならない。これらの用語に対応する実際のコンピューター動作は、実装によって異なる。
本発明の原理が適用され得る多くの可能な実施形態を考慮して、出願人は、以下の特許請求の範囲及びその均等物の範囲及び趣旨に含まれ得るそのような全ての実施形態を本発明として特許請求するものである。

Claims (14)

  1. デジタル・メディアの復号化方法であって、
    デジタル・メディア復号器圧縮デジタル・メディア・ビットストリームを受信するステップと、
    前記デジタル・メディア復号器が、前記ビットストリームから、デジタル・メディア・データの処理中における変換計算に利用する計算精度の程度を伝達する第1の構文要素、及び、前記ビットストリームから、前記デジタル・メディア・データの処理期間における変換計算のための精度モードの選択を伝達する第2の構文要素を解析するステップと、
    スケーリングを用いる第一の精度モードが前記第2の構文要素により伝達された場合に、最終段階の出力前記デジタル・メディア復号器がスケーリングするステップと、
    スケーリングをしない第二の精度モードが前記第2の構文要素により伝達された場合に、前記デジタル・メディア復号器が前記最終段階の出力へのスケーリングの適用を省略するステップと、
    前記デジタル・メディア復号器が再構成された画像を出力するステップと、
    を含み、
    前記第1の構文要素が、高い計算精度と低い計算精度とのうちの一方を用いることを伝達する、方法。
  2. 請求項1記載のデジタル・メディアの復号化方法であって、前記高い計算精度が32ビット数字処理であり、前記低い計算精度が16ビット数字処理である方法。
  3. 請求項1記載のデジタル・メディアの復号化方法であって、更に、
    前記デジタル・メディア復号器が前記圧縮デジタル・メディア・ビットストリームから変換係数のブロックを復号化するステップと、
    前記第1の構文要素信号が前記高い計算精度の利用を伝達する場合に、前記デジタル・メディア復号器が前記変換係数に高い計算精度の処理を用いる逆変換を適用するステップと、
    前記第1の構文要素信号が前記低い計算精度の利用を伝達する場合に、前記デジタル・メディア復号器が前記変換係数に低い計算精度の処理を用いる逆変換を適用するステップと、
    を含む方法。
  4. 請求項3記載のデジタル・メディアの復号化方法であって、前記高い計算精度が32ビット数字処理であり、前記低い計算精度が16ビット数字処理である、方法。
  5. 請求項1又は2記載のデジタル・メディアの復号化方法であって、更に、
    前記デジタル・メディア復号器が前記圧縮デジタル・メディア・ビットストリームから変換係数のブロックを復号化するステップと、
    前記デジタル・メディア復号器が前記構文要素によって伝達された計算精度の程度に関わりなく、前記変換係数に高い計算精度の処理を用いる逆変換を適用するステップと、
    を含む方法。
  6. 請求項1又は2記載のデジタル・メディアの復号化方法であって、前記復号器の出力をスケーリングする前記ステップが、前記出力の或る数による丸め除算を含む方法。
  7. 請求項6記載のデジタル・メディアの復号化方法であって、前記出力の丸め除算が8による丸め除算である、方法。
  8. 請求項1又は2記載のデジタル・メディアの復号化方法であって、更に、
    前記デジタル・メディア復号器が前記圧縮デジタル・メディア・ビットストリームから変換係数のブロックを復号化するステップと、
    スケーリング無しの前記第二の精度モードと、低計算精度の使用とが伝達された場合に、前記デジタル・メディア復号器が前記低計算精度を用いて前記変換係数の逆変換処理を実行するステップと、
    を含む方法。
  9. 請求項8記載のデジタル・メディアの復号化方法であって、前記低計算精度が16ビットの計算精度である、方法。
  10. 請求項1又は2記載のデジタル・メディアの復号化方法であって、
    前記デジタル・メディア・データ、第一段階変換と、前記第一段階変換を経たDC係数のそれに続く第二段階変換とを有する二段階変換構造を用いて、デジタル・メディア符号器が符号化し、
    該デジタル・メディア復号化方法が、更に、
    前記デジタル・メディア復号器が前記デジタル・メディア・ビットストリームからデジタル・メディア・データを復号化するステップと、
    前記デジタル・メディア復号器が前記デジタル・メディア・データに逆第二段階変換を適用するステップと、
    前記デジタル・メディア復号器が前記デジタル・メディア・データに逆第一段階変換を適用するステップと、
    前記デジタル・メディア復号器が前記デジタル・メディア・データの色変換を実行するステップと、
    を含み、前記最終段階の出力前記デジタル・メディア復号器がスケーリングする前記ステップが、スケーリングを用いる前記第一の精度モードが伝達された場合に、
    前記デジタル・メディア復号器が、入力を、前記逆第一段階変換への入力前に、1ビットだけ左にシフトするステップと、
    前記デジタル・メディア復号器が、前記最終段階の出力を、前記色変換後に3ビットだけ右にシフトするステップと、
    を含む方法。
  11. 請求項1又は2記載のデジタル・メディアの復号化方法であって、
    デジタル・メディア符号器が、前記圧縮デジタル・メディア・ビットストリームを、画像のそれぞれ別個の主要画像平面とアルファ画像平面とを定義する構文スキームに従って符号化、前記第2の構文要素により画像平面ごとの精度モードの選択を伝達し、それにより、前記主要画像平面と前記アルファ画像平面との精度モードが独立して伝達され、
    前記復号化方法が、
    前記デジタル・メディア復号器が各画像平面に対する精度モードの選択を伝達する前記構文要素を解析する前記動作を実行するステップと、
    個々の画像平面に対し、スケーリングを用いる前記第一の精度モードが伝達された場合に、前記デジタル・メディア復号器が前記個々の画像平面に対して前記復号器の出力をスケーリングするステップと、
    をさらに含む方法。
  12. 請求項1又は2記載のデジタル・メディアの復号化方法において、前記方法がハンドヘルド・コンピューティング・デバイスにおいて実行される、方法。
  13. デジタル・メディアの符号化方法であって、
    デジタル・メディア符号器デジタル・メディア・データを受信するステップと、
    前記デジタル・メディア符号器が、前記デジタル・メディア・データの処理中の変換計算のために低い計算精度を使用するか否かの第1の決定を行うステップと、
    前記デジタル・メディア符号器が、符号化されたビットストリーム内の第1の構文要素により、前記デジタル・メディア・データの処理中の変換計算のために低い計算精度を使用するか否かの前記第1の決定を表現するステップと、
    前記デジタル・メディア符号器が、変換符号化に先立って前記入力デジタル・メディア・データのスケーリングを適用するか否かの第2の決定を行うステップと、
    前記デジタル・メディア符号器が、前記符号化されたビットストリーム内の第2の構文要素により、前記スケーリングを適用するか否かの前記第2の決定を表現するステップと、
    前記デジタル・メディア符号器が、前記符号化されたビットストリームを出力するステップと、
    を含む方法。
  14. コンピュータにより実行されるとコンピュータに請求項1〜13の何れか1項に記載の方法を実行させるコンピュータ実行可能命令を格納したコンピュータ可読記録媒体。
JP2009550994A 2007-02-21 2008-02-20 変換ベースのデジタル・メディア・コーデックにおける計算の複雑性及び精度の制御 Active JP5457199B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US89103107P 2007-02-21 2007-02-21
US60/891,031 2007-02-21
US11/772,076 US8942289B2 (en) 2007-02-21 2007-06-29 Computational complexity and precision control in transform-based digital media codec
US11/772,076 2007-06-29
PCT/US2008/054473 WO2008103766A2 (en) 2007-02-21 2008-02-20 Computational complexity and precision control in transform-based digital media codec

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013231190A Division JP2014078952A (ja) 2007-02-21 2013-11-07 変換ベースのデジタル・メディア・コーデックにおける計算の複雑性及び精度の制御

Publications (2)

Publication Number Publication Date
JP2010519858A JP2010519858A (ja) 2010-06-03
JP5457199B2 true JP5457199B2 (ja) 2014-04-02

Family

ID=41556839

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2009550994A Active JP5457199B2 (ja) 2007-02-21 2008-02-20 変換ベースのデジタル・メディア・コーデックにおける計算の複雑性及び精度の制御
JP2013231190A Withdrawn JP2014078952A (ja) 2007-02-21 2013-11-07 変換ベースのデジタル・メディア・コーデックにおける計算の複雑性及び精度の制御

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2013231190A Withdrawn JP2014078952A (ja) 2007-02-21 2013-11-07 変換ベースのデジタル・メディア・コーデックにおける計算の複雑性及び精度の制御

Country Status (11)

Country Link
US (1) US8942289B2 (ja)
EP (1) EP2123045B1 (ja)
JP (2) JP5457199B2 (ja)
KR (2) KR101507183B1 (ja)
CN (1) CN101617539B (ja)
BR (1) BRPI0807465B1 (ja)
HK (1) HK1140341A1 (ja)
IL (1) IL199994A (ja)
RU (1) RU2518417C2 (ja)
TW (1) TWI471013B (ja)
WO (1) WO2008103766A2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6882685B2 (en) * 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
US7949054B2 (en) * 2006-06-01 2011-05-24 Microsoft Corporation Flexible data organization for images
US8942289B2 (en) * 2007-02-21 2015-01-27 Microsoft Corporation Computational complexity and precision control in transform-based digital media codec
US8275209B2 (en) * 2008-10-10 2012-09-25 Microsoft Corporation Reduced DC gain mismatch and DC leakage in overlap transform processing
JP5340091B2 (ja) * 2008-12-19 2013-11-13 キヤノン株式会社 画像符号化装置及びその制御方法
US8676849B2 (en) * 2009-03-12 2014-03-18 Microsoft Corporation Storing lossless transforms of data
KR20110135786A (ko) * 2010-06-11 2011-12-19 삼성전자주식회사 깊이 전이 데이터를 이용한 3d 비디오 인코딩/디코딩 장치 및 방법
EP2993905B1 (en) 2011-02-21 2017-05-24 Dolby Laboratories Licensing Corporation Floating point video coding
US8781238B2 (en) 2011-09-08 2014-07-15 Dolby Laboratories Licensing Corporation Efficient decoding and post-processing of high dynamic range images
US11184623B2 (en) 2011-09-26 2021-11-23 Texas Instruments Incorporated Method and system for lossless coding mode in video coding
KR20130040132A (ko) * 2011-10-13 2013-04-23 한국전자통신연구원 이종 ip 네트워크를 통한 미디어 코덱에 독립적인 미디어 데이터 전송 방법
JP6157114B2 (ja) * 2012-12-28 2017-07-05 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US8817179B2 (en) * 2013-01-08 2014-08-26 Microsoft Corporation Chroma frame conversion for the video codec
GB2521349A (en) * 2013-12-05 2015-06-24 Sony Corp Data encoding and decoding
JP6220722B2 (ja) * 2014-04-17 2017-10-25 アンリツ株式会社 ミリ波帯用電波ハーフミラーおよびその透過係数平坦化方法
CN106664448A (zh) * 2014-07-11 2017-05-10 Lg 电子株式会社 用于发送和接收广播信号的方法和设备
KR20170007333A (ko) 2014-07-11 2017-01-18 엘지전자 주식회사 방송 신호 송수신 방법 및 장치
WO2016017961A1 (ko) 2014-07-29 2016-02-04 엘지전자 주식회사 방송 신호 송수신 방법 및 장치
JP6324590B2 (ja) * 2017-05-25 2018-05-16 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
JP6915483B2 (ja) * 2017-09-27 2021-08-04 富士フイルムビジネスイノベーション株式会社 画像処理装置、画像処理システムおよびプログラム
EP3471271A1 (en) * 2017-10-16 2019-04-17 Acoustical Beauty Improved convolutions of digital signals using a bit requirement optimization of a target digital signal
CN111742554B (zh) * 2018-02-01 2021-08-06 联发科技股份有限公司 具有视频数据自适应量化的视频编码或解码方法和装置
JP2018142969A (ja) * 2018-04-11 2018-09-13 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム

Family Cites Families (112)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63219066A (ja) 1987-03-06 1988-09-12 Matsushita Electric Ind Co Ltd 直交変換装置
US4922537A (en) * 1987-06-02 1990-05-01 Frederiksen & Shu Laboratories, Inc. Method and apparatus employing audio frequency offset extraction and floating-point conversion for digitally encoding and decoding high-fidelity audio signals
US5357594A (en) * 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
US5379351A (en) * 1992-02-19 1995-01-03 Integrated Information Technology, Inc. Video compression/decompression processing and processors
US5319724A (en) 1990-04-19 1994-06-07 Ricoh Corporation Apparatus and method for compressing still images
JP2945487B2 (ja) * 1990-12-26 1999-09-06 株式会社日立製作所 行列乗算器
JPH04282988A (ja) 1991-03-12 1992-10-08 Sony Corp データ変換装置及び方法
US5168375A (en) * 1991-09-18 1992-12-01 Polaroid Corporation Image reconstruction by use of discrete cosine and related transforms
KR0150955B1 (ko) * 1992-05-27 1998-10-15 강진구 비트고정을 위한 영상압축방법과 신장방법 및 그 장치
US5394349A (en) * 1992-07-10 1995-02-28 Xing Technology Corporation Fast inverse discrete transform using subwords for decompression of information
JPH0645948A (ja) 1992-07-27 1994-02-18 Victor Co Of Japan Ltd 直交変換装置及び逆直交変換装置
JPH0645949A (ja) 1992-07-27 1994-02-18 Victor Co Of Japan Ltd 直交変換装置及び逆直交変換装置
JPH0654307A (ja) 1992-07-29 1994-02-25 Casio Comput Co Ltd データ圧縮装置
JPH06105296A (ja) 1992-09-18 1994-04-15 Sony Corp 可変長符号化および復号化方法
JP3348310B2 (ja) * 1992-09-28 2002-11-20 ソニー株式会社 動画像符号化方法および動画像符号化装置
JP3069455B2 (ja) * 1992-12-22 2000-07-24 富士写真フイルム株式会社 画像データ圧縮伸張装置における量子化・逆量子化回路
US5995539A (en) * 1993-03-17 1999-11-30 Miller; William J. Method and apparatus for signal transmission and reception
JP3697717B2 (ja) * 1993-09-24 2005-09-21 ソニー株式会社 2次元離散コサイン変換装置および2次元逆離散コサイン変換装置
US5587708A (en) * 1994-01-19 1996-12-24 Industrial Technology Research Institute Division technique unified quantizer-dequantizer
JP3046224B2 (ja) * 1994-07-26 2000-05-29 三星電子株式会社 固定ビット率の符号化方法および装置とこれを利用した高速探索のためのトラッキング方法
EP0714212A3 (en) * 1994-11-21 1999-03-31 SICAN, GESELLSCHAFT FÜR SILIZIUM-ANWENDUNGEN UND CAD/CAT NIEDERSACHSEN mbH Video decoder using concurrent processing and resource sharing
US5864637A (en) * 1995-04-18 1999-01-26 Advanced Micro Devices, Inc. Method and apparatus for improved video decompression by selective reduction of spatial resolution
US6002801A (en) * 1995-04-18 1999-12-14 Advanced Micro Devices, Inc. Method and apparatus for improved video decompression by selection of IDCT method based on image characteristics
JP2778622B2 (ja) * 1995-06-06 1998-07-23 日本電気株式会社 2次元dct回路
JP2914226B2 (ja) 1995-06-16 1999-06-28 日本電気株式会社 可逆変換を可能にするディジタル信号の変換符号化方式
JP3274593B2 (ja) * 1995-09-27 2002-04-15 日本電気株式会社 可逆変換可能な変換装置及び逆変換装置
US5995670A (en) * 1995-10-05 1999-11-30 Microsoft Corporation Simplified chain encoding
JP3063859B2 (ja) * 1996-01-08 2000-07-12 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン マルチメディア・ファイルを配信する方法およびファイル・サーバ
US6957350B1 (en) * 1996-01-30 2005-10-18 Dolby Laboratories Licensing Corporation Encrypted and watermarked temporal and resolution layering in advanced television
JP3168922B2 (ja) * 1996-08-27 2001-05-21 日本ビクター株式会社 デジタル画像情報の記録再生装置
JPH1091614A (ja) 1996-09-13 1998-04-10 Hitachi Ltd Idctの整数化法
JPH10107644A (ja) * 1996-09-26 1998-04-24 Sony Corp 量子化装置および方法、並びに、符号化装置および方法
SG54383A1 (en) * 1996-10-31 1998-11-16 Sgs Thomson Microelectronics A Method and apparatus for decoding multi-channel audio data
US5883823A (en) 1997-01-15 1999-03-16 Sun Microsystems, Inc. System and method of a fast inverse discrete cosine transform and video compression/decompression systems employing the same
US5974184A (en) * 1997-03-07 1999-10-26 General Instrument Corporation Intra-macroblock DC and AC coefficient prediction for interlaced digital video
US6351570B1 (en) * 1997-04-01 2002-02-26 Matsushita Electric Industrial Co., Ltd. Image coding and decoding apparatus, method of image coding and decoding, and recording medium for recording program for image coding and decoding
US6058215A (en) * 1997-04-30 2000-05-02 Ricoh Company, Ltd. Reversible DCT for lossless-lossy compression
US6134270A (en) * 1997-06-13 2000-10-17 Sun Microsystems, Inc. Scaled forward and inverse discrete cosine transform and video compression/decompression systems employing the same
US6057855A (en) * 1997-07-02 2000-05-02 Hewlett-Packard Company Method and apparatus for providing polygon pixel sub-sample information using incremental means
JPH11122624A (ja) * 1997-10-16 1999-04-30 Matsushita Electric Ind Co Ltd ビデオデコーダ処理量を低減する方法および装置
US6006179A (en) * 1997-10-28 1999-12-21 America Online, Inc. Audio codec using adaptive sparse vector quantization with subband vector classification
US6137916A (en) * 1997-11-17 2000-10-24 Sony Electronics, Inc. Method and system for improved digital video data processing using 8-point discrete cosine transforms
WO1999029112A1 (en) * 1997-12-01 1999-06-10 Matsushita Electric Industrial Co., Ltd. Image processor, image data processor and variable length encoder/decoder
ES2251116T3 (es) * 1997-12-19 2006-04-16 Infineon Technologies Ag Dispositivo para la multiplicacion con factores constantes y su utilizacion para la compresion de video (mpeg).
RU2201654C2 (ru) 1997-12-23 2003-03-27 Томсон Лайсенсинг С.А. Способ низкошумового кодирования и декодирования
JP3953183B2 (ja) 1998-03-27 2007-08-08 パナソニック コミュニケーションズ株式会社 画像通信方法および画像通信装置
US6029126A (en) * 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6073153A (en) * 1998-06-03 2000-06-06 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6154762A (en) * 1998-06-03 2000-11-28 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6301304B1 (en) * 1998-06-17 2001-10-09 Lsi Logic Corporation Architecture and method for inverse quantization of discrete cosine transform coefficients in MPEG decoders
GB9819648D0 (en) * 1998-09-10 1998-11-04 Nds Ltd Determining visually noticeable differences between two images
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
DE69813912T2 (de) * 1998-10-26 2004-05-06 Stmicroelectronics Asia Pacific Pte Ltd. Digitaler audiokodierer mit verschiedenen genauigkeiten
US7194138B1 (en) * 1998-11-04 2007-03-20 International Business Machines Corporation Reduced-error processing of transformed digital data
US6421464B1 (en) * 1998-12-16 2002-07-16 Fastvdo Llc Fast lapped image transforms using lifting steps
US6363117B1 (en) * 1998-12-31 2002-03-26 Sony Corporation Video compression using fast block motion estimation
US6473534B1 (en) * 1999-01-06 2002-10-29 Hewlett-Packard Company Multiplier-free implementation of DCT used in image and video processing and compression
US6496795B1 (en) * 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding
US6487574B1 (en) * 1999-02-26 2002-11-26 Microsoft Corp. System and method for producing modulated complex lapped transforms
US6370502B1 (en) * 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
US6574651B1 (en) * 1999-10-01 2003-06-03 Hitachi, Ltd. Method and apparatus for arithmetic operation on vectored data
US6507614B1 (en) * 1999-10-19 2003-01-14 Sony Corporation Efficient de-quantization in a digital video decoding process using a dynamic quantization matrix for parallel computations
US7028063B1 (en) * 1999-10-26 2006-04-11 Velocity Communication, Inc. Method and apparatus for a DFT/IDFT engine supporting multiple X-DSL protocols
AU2063401A (en) 1999-12-06 2001-06-12 Hrl Laboratories, Llc Variable precision wavelets
EP1172008A1 (en) * 2000-01-12 2002-01-16 Koninklijke Philips Electronics N.V. Image data compression
JP3593944B2 (ja) * 2000-03-08 2004-11-24 日本電気株式会社 画像データ処理装置及びそれに用いる動き補償処理方法
JP4560694B2 (ja) 2000-04-05 2010-10-13 ソニー株式会社 符号化装置及びその方法
US6606725B1 (en) * 2000-04-25 2003-08-12 Mitsubishi Electric Research Laboratories, Inc. MAP decoding for turbo codes by parallel matrix processing
SE522261C2 (sv) * 2000-05-10 2004-01-27 Global Ip Sound Ab Kodning och avkodning av en digital signal
FR2818053B1 (fr) * 2000-12-07 2003-01-10 Thomson Multimedia Sa Procede et dispositif de codage pour l'affichage d'un zoom d'une image codee mpeg2
US8374237B2 (en) * 2001-03-02 2013-02-12 Dolby Laboratories Licensing Corporation High precision encoding and decoding of video images
JP4063508B2 (ja) * 2001-07-04 2008-03-19 日本電気株式会社 ビットレート変換装置およびビットレート変換方法
US20030112873A1 (en) 2001-07-11 2003-06-19 Demos Gary A. Motion estimation for video compression systems
US7123655B2 (en) * 2001-08-09 2006-10-17 Sharp Laboratories Of America, Inc. Method for reduced bit-depth quantization
US7185037B2 (en) * 2001-08-23 2007-02-27 Texas Instruments Incorporated Video block transform
KR100433709B1 (ko) 2001-08-31 2004-05-31 (주)씨앤에스 테크놀로지 행렬 변화를 통한 분산산술처리 방식의 이산여현변환 방법
US6882685B2 (en) * 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
US7295609B2 (en) * 2001-11-30 2007-11-13 Sony Corporation Method and apparatus for coding image information, method and apparatus for decoding image information, method and apparatus for coding and decoding image information, and system of coding and transmitting image information
ES2610430T3 (es) * 2001-12-17 2017-04-27 Microsoft Technology Licensing, Llc Codificación por omisión de macrobloques
EP1469682A4 (en) * 2002-01-24 2010-01-27 Hitachi Ltd SIGNAL CODING METHOD FOR MOVABLE IMAGES, DECODING METHOD, CODING DEVICE AND DECODING DEVICE
US7379498B2 (en) * 2002-03-11 2008-05-27 Broadcom Corporation Reconstructing a compressed still image by transformation to a compressed moving picture image
JP2003348598A (ja) 2002-04-12 2003-12-05 Seiko Epson Corp メモリ効率のいい圧縮領域ビデオ処理のための且つ因数分解及び整数近似法を用いる高速逆動き補償のための方法並びに装置
US7242713B2 (en) 2002-05-02 2007-07-10 Microsoft Corporation 2-D transforms for image and video coding
US6944224B2 (en) * 2002-08-14 2005-09-13 Intervideo, Inc. Systems and methods for selecting a macroblock mode in a video encoder
US7197525B2 (en) * 2002-11-26 2007-03-27 Analog Devices, Inc. Method and system for fixed point fast fourier transform with improved SNR
US7075530B2 (en) * 2003-02-27 2006-07-11 International Business Machines Corporation Fast lighting processors
US7330866B2 (en) * 2003-07-01 2008-02-12 Nvidia Corporation System for frequency-domain scaling for discrete cosine transform
US7502415B2 (en) * 2003-07-18 2009-03-10 Microsoft Corporation Range reduction
US8218624B2 (en) * 2003-07-18 2012-07-10 Microsoft Corporation Fractional quantization step sizes for high bit rates
JP4617644B2 (ja) * 2003-07-18 2011-01-26 ソニー株式会社 符号化装置及び方法
US7609763B2 (en) * 2003-07-18 2009-10-27 Microsoft Corporation Advanced bi-directional predictive coding of video frames
US7499495B2 (en) * 2003-07-18 2009-03-03 Microsoft Corporation Extended range motion vectors
US7688895B2 (en) * 2003-07-22 2010-03-30 Lsi Corporation Method and/or circuit for binary arithmetic decoding decisions before termination
US20050036548A1 (en) * 2003-08-12 2005-02-17 Yong He Method and apparatus for selection of bit budget adjustment in dual pass encoding
US8014450B2 (en) * 2003-09-07 2011-09-06 Microsoft Corporation Flexible range reduction
KR100965881B1 (ko) 2003-10-10 2010-06-24 삼성전자주식회사 비디오 데이터 인코딩 시스템 및 디코딩 시스템
US7933327B2 (en) 2004-01-30 2011-04-26 Panasonic Corporation Moving picture coding method and moving picture decoding method
US20050213835A1 (en) * 2004-03-18 2005-09-29 Huazhong University Of Science & Technology And Samsung Electronics Co., Ltd. Integer transform matrix selection method in video coding and related integer transform method
US20050259729A1 (en) 2004-05-21 2005-11-24 Shijun Sun Video coding with quality scalability
JP4241517B2 (ja) 2004-06-15 2009-03-18 キヤノン株式会社 画像符号化装置及び画像復号装置
JP4074868B2 (ja) * 2004-12-22 2008-04-16 株式会社東芝 画像符号化制御方法及びその装置
EP1869894A1 (en) 2005-04-14 2007-12-26 Thomson Licensing Method and apparatus for slice adaptive motion vector coding for spatial scalable video encoding and decoding
CA2610276C (en) * 2005-07-22 2013-01-29 Mitsubishi Electric Corporation Image encoder and image decoder, image encoding method and image decoding method, image encoding program and image decoding program, and computer readable recording medium recorded with image encoding program and computer readable recording medium recorded with image decoding program
CN100539437C (zh) * 2005-07-29 2009-09-09 上海杰得微电子有限公司 一种音频编解码器的实现方法
US8548265B2 (en) * 2006-01-05 2013-10-01 Fastvdo, Llc Fast multiplierless integer invertible transforms
US20070271321A1 (en) * 2006-01-11 2007-11-22 Qualcomm, Inc. Transforms with reduce complexity and/or improve precision by means of common factors
US8942289B2 (en) * 2007-02-21 2015-01-27 Microsoft Corporation Computational complexity and precision control in transform-based digital media codec
US8358703B2 (en) * 2007-03-23 2013-01-22 Thomson Licensing Modifying a coded bitstream
JP5467651B2 (ja) * 2007-06-14 2014-04-09 トムソン ライセンシング 符号化ビット・ストリームの修正
US20120014431A1 (en) * 2010-07-14 2012-01-19 Jie Zhao Methods and Systems for Parallel Video Encoding and Parallel Video Decoding
US9313514B2 (en) * 2010-10-01 2016-04-12 Sharp Kabushiki Kaisha Methods and systems for entropy coder initialization

Also Published As

Publication number Publication date
BRPI0807465A8 (pt) 2017-01-17
WO2008103766A3 (en) 2008-11-27
KR20150003400A (ko) 2015-01-08
KR101507183B1 (ko) 2015-03-30
RU2518417C2 (ru) 2014-06-10
KR20090115726A (ko) 2009-11-05
BRPI0807465A2 (pt) 2014-06-03
EP2123045A4 (en) 2013-03-13
HK1140341A1 (en) 2010-10-08
JP2010519858A (ja) 2010-06-03
US8942289B2 (en) 2015-01-27
TW200843515A (en) 2008-11-01
JP2014078952A (ja) 2014-05-01
EP2123045A2 (en) 2009-11-25
BRPI0807465B1 (pt) 2020-05-26
IL199994A (en) 2015-11-30
KR101550166B1 (ko) 2015-09-03
IL199994A0 (en) 2010-04-15
TWI471013B (zh) 2015-01-21
WO2008103766A2 (en) 2008-08-28
CN101617539A (zh) 2009-12-30
US20080198935A1 (en) 2008-08-21
CN101617539B (zh) 2013-02-13
RU2009131599A (ru) 2011-02-27
EP2123045B1 (en) 2018-10-17

Similar Documents

Publication Publication Date Title
JP5457199B2 (ja) 変換ベースのデジタル・メディア・コーデックにおける計算の複雑性及び精度の制御
JP5065272B2 (ja) 画像圧縮に関する変換係数の予測
JP6054920B2 (ja) 柔軟量子化
JP5149310B2 (ja) クロマ・サンプル位置決め情報のシグナリングおよび使用
US9123089B2 (en) Signaling and uses of windowing information for images
JP5306469B2 (ja) オーバーラップ変換処理におけるdc利得不整合およびdc漏れの低減

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120511

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120809

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120816

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121011

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121211

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130311

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130318

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130607

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130710

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131107

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20131115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140109

R150 Certificate of patent or registration of utility model

Ref document number: 5457199

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250