JP2010531608A - 映像符号化装置及び方法と、映像復号化装置及び方法 - Google Patents

映像符号化装置及び方法と、映像復号化装置及び方法 Download PDF

Info

Publication number
JP2010531608A
JP2010531608A JP2010514609A JP2010514609A JP2010531608A JP 2010531608 A JP2010531608 A JP 2010531608A JP 2010514609 A JP2010514609 A JP 2010514609A JP 2010514609 A JP2010514609 A JP 2010514609A JP 2010531608 A JP2010531608 A JP 2010531608A
Authority
JP
Japan
Prior art keywords
video
bitstream
level
bit depth
extended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010514609A
Other languages
English (en)
Other versions
JP5180298B2 (ja
Inventor
チョウ,デ−ソン
キム,デ−ヒ
チェー,ウン−イル
ジョン,ジェ−ウ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2010531608A publication Critical patent/JP2010531608A/ja
Application granted granted Critical
Publication of JP5180298B2 publication Critical patent/JP5180298B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

少なくとも2つのビットデプスを支援しつつ、フォワード互換性を有するスケーラブル・ビットストリームを生成する映像符号化及び/または復号化方法、記録媒体及び装置において、スケーラブル・ビットストリームは、基本量子化レベルと、基本ビットデプスによる基本量子化係数とを含む基本階層ビットストリーム、及び拡張量子化レベルと、前記基本量子化レベルから予測された補正量子化レベルとの間の残差と、前記基本ビットデプスと拡張ビットデプスとの差を補正するための補正量子化係数とを含む拡張階層ビットストリームからなる。

Description

本発明は、映像符号化装置及び方法と、映像復号化装置及び方法とに係り、さらに詳細には、少なくとも2つのビットデプス(bit-depth)を支援しつつ、フォワード互換性(forward compatibility)を有するスケーラブル・ビットストリームを生成したり復号化する映像符号化装置及び方法と、映像復号化装置及び方法とに関する。
一般的なビデオコーデック(codec)において、例えば、VC−1エンコーダのような基本エンコーダのビットデプスを、8ビットから10ビットに変更する場合、VC−1デコーダは、ビットデプスが拡張された改善されたエンコーダから生成されるビットストリームを読み取って再生することが不可能である。最近、このように固定されたビットデプスだけではなく、多様なビットデプスで符号化されたビットストリームを、VC−1デコーダ及び他の改善されたデコーダで復元させるフォワード互換性が保証されるビデオコーデックに係わる開発の必要性が高く叫ばれている。
すなわち、フォワード互換性が保証されない新しいビデオコーデックは、既存のビデオコーデックのみ有する端末機を支援できないために、互いに異なるスペックを有する端末機間のコンテンツ再使用などが不可能になる。また、すでに構築しておいたビデオコーデック市場を克服しなければならないので、新しいビデオコーデックが市場で定着するまで、多くの時間がかかるという短所がある。
本発明の一つ以上の実施形態がなそうとする技術的課題は、少なくとも2つのビットデプスを支援しつつ、フォワード互換性を有するスケーラブル・ビットストリームを生成する映像符号化装置及び方法を提供するところにある。
本発明の一つ以上の実施形態がなそうとする他の技術的課題は、少なくとも2つのビットデプスを支援しつつ、フォワード互換性を有するスケーラブル・ビットストリームを復号化する映像復号化装置及び方法を提供するところにある。
前記技術的課題を達成するために本発明は、少なくとも2つのビットデプスを支援しつつ、フォワード互換性を有するスケーラブル・ビットストリームを生成する映像符号化方法において、前記スケーラブル・ビットストリームは、基本量子化レベルと、基本ビットデプスによる基本量子化係数とを含む基本階層ビットストリーム;拡張量子化レベルと、前記基本量子化レベルから予測された補正量子化レベルとの間の残差と、前記基本ビットデプスと拡張ビットデプスとの差を補正するための補正量子化係数とを含む拡張階層ビットストリームからなる。
前記技術的課題を達成するために本発明は、少なくとも2つのビットデプスを支援しつつ、フォワード互換性を有するスケーラブル・ビットストリームを生成する映像符号化装置において、基本量子化レベルと、基本ビットデプスによる基本量子化係数とを含む基本階層ビットストリームを生成する基本階層符号化部;拡張量子化レベルと、前記基本量子化レベルから予測された補正量子化レベルとの間の残差と、前記基本ビットデプスと拡張ビットデプスとの差を補正するための補正量子化係数とを含む拡張階層ビットストリームを生成する拡張階層符号化部を含んでなる。
前記技術的課題を達成するために本発明による映像復号化方法は、ビットストリームが拡張階層識別子を含んでいるか否かを検査する段階と、前記ビットストリームが前記拡張階層識別子を含まない場合、前記ビットストリームをそのまま復号化し、基本ビットデプスの復元映像を生成する段階と、前記ビットストリームが前記拡張階層識別子を含む場合、前記ビットストリームのうち、基本階層ビットストリームから基本階層の基本量子化レベルを求め、前記基本量子化レベルから予測された補正量子化レベルと拡張量子化レベルとの残差と、前記基本ビットデプスと拡張ビットデプスとの差を補正するための補正量子化係数とを復号化し、前記残差を前記補正量子化レベルに加算することによって、拡張ビットデプスの復元映像を生成する段階を含んでなされる。
前記技術的課題を達成するために、本発明による映像復号化装置は、受信されたビットストリームから基本量子化レベルと、基本ビットデプスによる基本量子化係数とを含む基本階層ビットストリームを復号化し、基本復元映像を生成する基本階層復号化部;前記受信されたビットストリームから、拡張量子化レベルと、前記基本量子化レベルから予測された補正量子化レベルとの間の残差と、前記基本ビットデプスと拡張ビットデプスとの差を補正するための補正量子化係数とを含む拡張階層ビットストリームを復号化し、復元された基本量子化レベルから予測された補正量子化レベルを前記残差に加算し、拡張復元映像を生成する拡張階層復号化部を含んでなる。
前記技術的課題を達成するために、本発明による他の映像復号化方法は、ビットストリームが拡張階層識別子を含んでいるか否かを検査する段階と、前記ビットストリームが前記拡張階層識別子を含まない場合、復号化のために前記ビットストリームをデコーダに送る段階と、前記ビットストリームが前記拡張階層識別子を含まない場合、前記ビットストリームから基本階層ビットストリームを抽出し、前記基本階層ビットストリームを前記デコーダに送る段階とを含む。
前記技術的課題を達成するために、本発明による映像復号化方法は、ビットストリームが拡張階層識別子を含んでいるか否かを検査する段階と、検査結果に基づいて適応的に復号化する段階とを含む。
前記技術的課題を達成するために、本発明によるコンピュータで読取り可能な記録媒体は、少なくとも2つのビットデプスを支援しつつ、フォワード互換性を有するスケーラブル・ビットストリームを生成する映像符号化方法において、前記スケーラブル・ビットストリームは、基本量子化レベルと、基本ビットデプスによる基本量子化係数とを含む基本階層ビットストリーム;拡張量子化レベルと、前記基本量子化レベルから予測された補正量子化レベルとの間の残差と、前記基本ビットデプスと拡張ビットデプスとの差を補正するための補正量子化係数とを含む拡張階層ビットストリームからなる方法のプログラムを記録する。
前記技術的課題を達成するために、本発明によるコンピュータで読取り可能な記録媒体は、ビットストリームが拡張階層識別子を含んでいるか否かを検査する段階と、前記ビットストリームが前記拡張階層識別子を含まない場合、前記ビットストリームをそのまま復号化し、基本ビットデプスの復元映像を生成する段階と、前記ビットストリームが前記拡張階層識別子を含む場合、前記ビットストリームのうち、基本階層ビットストリームから基本階層の基本量子化レベルを求め、前記基本量子化レベルから予測された補正量子化レベルを拡張階層の拡張量子化レベルに加算した結果を復号化することによって、拡張ビットデプスの復元映像を生成する段階とを含むプログラムを記録する。
本発明によるビデオコーデックは、フォワード互換性を提供するので、モバイル電話、DVDプレーヤ、携帯用ミュージックプレーヤあるいはカーステレオのような、有線あるいは無線の電子機器に搭載された改善されたビデオコーデックだけではなく、既存の基本ビデオコーデックにも採用されるなど、支援するビットデプスに関係なしに多様なビデオコーデックに適用できるメリットがある。
本発明による映像符号化装置及び映像復号化装置の概念を説明するための図である。 本発明による映像符号化装置から得られるスケーラブル・ビットストリームのシンタックスの一例を示す図である。 図2に図示された各レベルに含まれる情報の例を示す図である。 図2に図示された各レベルに含まれる情報の例を示す図である。 図2に図示された各レベルに含まれる情報の例を示す図である。 図2に図示された各レベルに含まれる情報の例を示す図である。 本発明による映像符号化装置で、拡張階層識別子をローディングための区間であって、スタートコードの例を示す図である。 本発明による映像符号化装置の第1実施形態による構成を示したブロック図である。 本発明による映像復号化装置の第1実施形態による構成を示したブロック図である。 本発明の第1実施形態による符号化装置において、階層間あるいは階層内での予測方法を説明する図である。 本発明の第1実施形態による復号化装置において、階層間あるいは階層内での予測方法を説明する図である。 本発明による映像符号化装置の第2実施形態による構成を示したブロック図である。 本発明による映像復号化装置の第2実施形態による構成を示したブロック図である。 本発明の第2実施形態による符号化装置において、階層間あるいは階層内での予測方法を説明する図である。 本発明の第2実施形態による復号化装置において、階層間あるいは階層内での予測方法を説明する図である。 本発明よるスケーラブル・ビットストリームを復号化するための既存のVC−1デコーダの構成を示したブロック図である。
以下、添付された図面を参照しつつ、本発明の望ましい実施形態について詳細に説明する。
図1は、本発明による映像符号化装置及び映像復号化装置の概念を説明するためのものであり、エンコーダパートは、基本エンコーダの役割を行う第1エンコーダ113と、改善されたエンコーダの役割を行う第2エンコーダ117とを例にとり、デコーダパートは、基本デコーダの役割を行い、第1エンコーダ113に対応する第1デコーダ153と、改善されたデコーダの役割を行い、第2エンコーダ117に対応する第2デコーダ157とを例にとる。一実施形態で、第1エンコーダ113は、基本ビットデプスによるビットストリームを生成し、第2エンコーダ117は、基本ビットデプスを支援しつつ、拡張ビットデプスによるスケーラブル・ビットストリームを生成する。
説明の便宜のために、基本ビットデプスは8ビット、拡張ビットデプスは10ビットを例にとる。これによれば、第1エンコーダ113の一例として、8ビットのビットデプスを支援するVC−1エンコーダが採択されうる。
図1を参照するに、第1エンコーダ113で生成されたビットストリーム131は、第1デコーダ153だけではなく、第2デコーダ157で復号化が遂行されうる。第2エンコーダ117で生成されたスケーラブル・ビットストリーム137は、第2デコーダ157で復号化が行われ、第1デコーダ153では、スケーラブル・ビットストリームに含まれた拡張階層ビットストリームを無視した状態で、基本階層ビットストリームに対して復号化が遂行されうる。かようなフォワード互換性(forward compatibility)を提供できる第2エンコーダ117が本発明の映像符号化装置に該当し、第2デコーダ157が本発明の映像復号化装置に該当する。
図2は、本発明による映像符号化装置から得られるスケーラブル・ビットストリームのシンタックスの一例を示すものであり、基本階層ビットストリームと拡張階層ビットストリームとからなる。
図2を参照するに、スケーラブル・ビットストリームは、具体的に、基本階層のシーケンスレベル211、拡張階層のシーケンスレベル213、基本階層のGOP(group of pictures)レベル215、拡張階層のGOPレベル217、拡張階層のピクチャレベル219、基本階層のピクチャレベル221、基本階層のピクチャデータレベル223及び拡張階層のピクチャデータレベル225を含んでなる。ここで、拡張階層のピクチャレベル219が、基本階層のピクチャレベル221の前に位置しているが、拡張階層のピクチャレベル219が基本階層のピクチャレベル221の後に位置することも可能である。一方、基本階層のGOPレベル215と拡張階層のGOPレベル217は、オプションとして備わりうる。
ここで、シーケンスは、少なくとも一つ以上の符号化されたピクチャ、あるいは少なくとも一つ以上のGOPから構成される。GOPは、少なくとも一つ以上の符号化されたピクチャによって構成され、VC−1コーデックの場合、エントリポイント(entry-point)が使われもする。ここで、各GOPで最初のピクチャは、ランダムアクセスを提供できる。一方、ピクチャは、複数のマクロブロックに分解され、映像フォーマットが4:2:0である場合、各マクロブロックは、4個の輝度ブロックと2個の色差ブロックとからなる。
図3Aないし図3Dは、図2に図示された各レベルに含まれる情報の例を示すものであり、図3Aは、拡張階層のシーケンスレベル213に含まれる情報であり、拡張階層で提供できる付加プロファイル及びレベル311、拡張階層で支援できるビットデプス313を含む。ここで、映像フォーマット315は、基本階層のシーケンスレベル211で定義することが可能である場合、拡張階層のシーケンスレベル213に含めなくともよい。図3Bは、拡張階層のピクチャレベル219に含まれる情報であり、基本階層では表現できない拡張ビットデプスを考慮し、基本ビットデプスと拡張ビットデプスとの差を補正するための補正量子化係数(Refined QP、以下、Rとする)を含む。
図3Cは、基本階層ピクチャレベル221に含まれる情報であり、第1エンコーダ113の基本量子化係数を含む。図3Dは、拡張階層ピクチャデータレベル225に含まれる情報であり、基本階層の基本量子化レベルから予測を介して得られる拡張階層の拡張量子化レベルの残差(residue)を示す。
図4は、本発明による映像符号化装置から得られるスケーラブル・ビットストリームにおいて、拡張階層識別子を含み、拡張階層と関連した情報をローディングための領域を説明するためのものである。第1エンコーダ113がVC−1エンコーダである場合、一実施形態では、4バイト単位のスタートコード(start code)を使用する。VC−1エンコーダの場合、スタートコードは、アドバンストプロファイル(advanced profile)以上で支援されうる。一方、スタートコードは、各レベルのヘッダの最初の領域に含まれうる。
図4を参照しつつ、一実施形態として使われたVC−1のスタートコードで、拡張階層と関連した情報をローディングする過程について説明する。スタートコードにおいて、サフィックス(suffix)に定義されるBDU(Bitstream Data Unit)タイプ(type)のうち、未来の使用のために予約された予備領域(reserved area)451,452,453,454が、拡張階層と関連した情報をローディングするために使用する。ここで、BDUは、同じ階層レベルにある他の情報とは独立してパージングされうる圧縮データ単位を意味し、例えば、シーケンスヘッダ、エントリポイントヘッダ、符号化されたピクチャ、あるいはスライスでありうる。スタートコードのサフィックスに定義されるBDUタイプのうち、禁止(forbidden)領域422以外の残りの領域411〜421は、基本階層と関連した情報をローディングするためのものである。ここで、スタートコードは一例に過ぎず、ビットストリームの構成要素のうち、他の部分を使用することもできる。
一方、拡張階層は、シーケンスレベル(sequence level)、GOPレベル、フレームレベル(frame level)、フィールドレベル(field level)及びスライスレベル(slice level)を含む。拡張階層の情報は、一実施形態で、第2予備領域452及び第4予備領域454のうち、いずれか一つに含まれうる。具体的に述べれば、第2予備領域452のうち、「0x09」、あるいは第4予備領域454のうち、「0x40」の拡張階層のシーケンスレベルに係わるヘッダに、スタートコードが含まれ、第2予備領域452のうち、「0x08」、あるいは第4予備領域454のうち、「0x3F」の拡張階層のGOPレベルに係わるヘッダに、スタートコードが含まれ、第2予備領域452中のうち、「0x07」、あるいは第4予備領域454のうち、「0x3E」の拡張階層のフレームレベルに係わるヘッダに、スタートコードが含まれ、第2予備領域452のうち、「0x06」、あるいは第4予備領域454のうち、「0x3D」の拡張階層のフィールドレベルに係わるヘッダに、スタートコードが含まれ、第2予備領域452のうち、「0x06」、あるいは第4予備領域454のうち、「0x3C」の拡張階層のデータに係わるヘッダに、拡張階層の色差データのためのスタートコードが含まれる。
これについてさらに細部的に説明すれば、次の通りである。
第2予備領域452のうち、「0x09」として定義される拡張階層シーケンスレベルに係わるヘッダのスタートコードに含めることができる情報としては、基本階層以外に、拡張階層によって達成できる付加的なプロファイル並びにレベル情報、及びビットデプス情報を挙げることができる。具体的に、基本階層のシーケンスレベルではプロファイルは、2ビットで定義され、「3」は、アドバンストプロファイルを、「0−2」は、予備領域を示す。一方、レベルは、3ビットで定義され、「000」はAP@LO、「001」はAP@L1、「010」はAP@L2、「011」はAP@L3、「100」はAP@L4、「101−111」は予備領域を示す。拡張階層によって達成されうるビットデプス情報は、「N−8」(ここで、Nは拡張ビットデプス)の値で示すことができ、基本階層に対応する第1エンコーダ113(図1)の基本ビットデプスによって、8以外の値を使用できる。一方、拡張階層に係わる情報としては、変更された映像フォーマット情報が含まれうるが、映像フォーマット情報は、基本階層のシーケンスレベルに含まれる変数、例えば、VC−1エンコーダである場合、「COLORDIFF」変数を活用して示したり、第2予備領域452のうち、「0x09」に含めることができる。すなわち、基本階層の変数を活用する場合、拡張階層では、変更される映像フォーマット情報を別途に伝送する必要がない。「COLORDIFF」変数の例について述べれば、「1」は、4:2:0映像フォーマットを定義するのに使用し、「2」と「3」は、予備領域として指定されているので、望ましくは、4:2:2映像フォーマットと4:4:4映像フォーマットとを定義するのに使用できる。一方、拡張階層に係わる情報として、付加的なHRD(Hypothetical Reference Decoder)変数が含まれうる。HRD変数は、仮想ビデオバッファ変数であり、デコーダでバッファ運用のために参考にする変数である。
第2予備領域452のうち、「0x08」として定義される拡張階層GOPレベルに係わるヘッダのスタートコードは、ビットデプスあるいは映像フォーマットがGOP単位に変更されない場合には不要であるので、予備領域として指定され、ビットデプスあるいは映像フォーマットがGOP単位に変更される場合、必要となる。
第2予備領域452のうち、「0x07」及び「0x06」として定義される拡張階層のピクチャレベル、すなわち、フレームレベル及びフィールドレベルのヘッダに係わるスタートコードは、順次(progressive)走査、あるいは飛越(interlaced)走査によって、基本階層では表現できない拡張階層の残りのビットデプスを示すための補正量子化係数(R)を含み、一実施形態では、第1エンコーダ113のビットデプスが8ビットである場合、「N−8」(ここで、Nは、第2エンコーダ117のビットデプスを示す)に係わる補正量子化係数(R)の値を定義する。この場合は、ピクチャ単位で補正量子化係数(R)を使用するので、ピクチャレベルに含めたり、他の実施形態によれば、スライス単位で補正量子化係数(R)を使用する場合には、スライスレベルに、マクロブロック単位で補正量子化係数(R)を使用する場合には、マクロブロックレベルに、ブロック単位で補正量子化係数(R)を使用する場合には、ブロックレベルに含める。各スライス、各マクロブロックあるいは各ブロックに係わる補正量子化係数(R)を算出するためには、後述するピクチャレベルの補正量子化係数(R)を算出する過程を適用できる。
第2予備領域452のうち、「0x05」に定義される拡張階層のデータのヘッダに係わるスタートコードは、基本階層と比較して、拡張階層の映像フォーマットが変更されない場合に不要なので、予備領域として指定される。すなわち、基本階層と拡張階層との映像フォーマットが4:2:0と同じ場合、1つのマクロブロックをなす4個の輝度ブロックと2個の色差ブロックとに係わるデータは、基本階層から伝送される。一方、基本階層と拡張階層との映像フォーマットが互いに異なる場合、例えば、基本階層の映像フォーマットが4:2:0であり、拡張階層の映像フォーマットが4:2:2であるか、または基本階層の映像フォーマットが4:2:0であり、拡張階層の映像フォーマットが4:4:4である場合、4個の輝度ブロックと2個の色差ブロックとに係わるデータを基本階層から伝送すると同時に、拡張階層では、変更された映像フォーマットを支援できるように、映像フォーマットに対応する色差差ブロックに係わるデータを伝送する。一方、4個の輝度ブロックに係わるデータは、映像フォーマットに関係なしに同一であるので、拡張階層から別途のデータを伝送する必要はない。
一方、前記拡張階層と関連した情報は、図4に記載されたスタートコードに制限されることなく、シーケンスレベル、GOPレベル、ピクチャレベル、マクロブロックレベル、ブロックレベルで、未来の使用のために残した予備領域に含まれうる。また、ビットストリームを伝送するために、映像ビットストリームをペイロード(payload)とし、これをパッケージングするシステム階層や、ネットワークプロトコルの多様な階層に多様な形態で拡張階層識別子を含むこともできる。
以下、ビットデプスを拡張することによるスケーラブル・ビットストリームを得る過程について、図1を参照しつつ説明すれば、次の通りである。
第1エンコーダ113が8ビットエンコーダであり、第2エンコーダ117がNビットエンコーダをであることを例にとれば、第2エンコーダ117から得られるスケーラブル・ビットストリームに含まれる拡張階層ビットストリームのピクチャレベルのスタートコードは、第1エンコーダ113で表現できない拡張ビットデプスの残りの部分を表現するために使われる。例えば、拡張ビットデプスがNビットであり、このとき、拡張量子化係数をQPとし、基本ビットデプスが8ビットであり、このとき、基本量子化係数をQPとする。Nビット原映像、すなわち、拡張ビットデプスがNビットである原映像を8ビット・ビデオコーデック、すなわち、基本ビットデプスが8ビットであるビデオコーデックで符号化するならば、2つの量子化係数間には、次の式(1)のような関係が成立する。
Figure 2010531608
すなわち、Nビット原映像を拡張量子化係数QPで量子化した結果と、8ビット原映像を基本量子化係数QPで量子化した結果は、互いにダイナミック・レンジが同じでなければならない。その理由は、ビデオコーデックの特別の変更なしに、既存の方式でNビット原映像を符号化及び復号化できるためである。しかし、その場合、Nビット原映像から復元される映像の品質が、8ビット原映像から復元される映像の品質と差がなくなるので、高い明暗比(contrast ratio)を提供するNビット原映像の長所がなくなる。
これを改善するために、Nビット原映像の場合、基本量子化係数QP及び補正量子化係数Rを使用し、次の式(2)のように示すことができる。ここで、拡張量子化係数QP、あるいは基本量子化係数QPは、VC−1エンコーダの場合、「PQINDEX」から誘導される。
Figure 2010531608
前記式(2)によって、補正量子化係数Rは、次の式(3)によって求められる。
Figure 2010531608
Nビット原映像を、式(1)の量子化係数を利用して量子化一データは、基本階層のビットストリームを形成し、式(2)の量子化係数を利用して量子化一データは、拡張階層のビットストリームを形成し、2つのビットストリームに拡張階層識別子を含め、スケーラブル・ビットストリームを生成する。かようなスケーラブル・ビットストリームは、既存の8ビットデコーダだけではなく、Nビットデコーダでいずれも復号化できる。
図5は、本発明の第1実施形態によるスケーラブル映像符号化装置の構成を示すブロック図であり、第1残差映像生成部510、第1変換部520、第1基本階層損失符号化部530、第1拡張階層損失符号化部540及び第1ビットストリーム結合部550を含んでなる。第1残差映像生成部510は、第1減算部511、第1逆量子化部513、第1逆変換部515、第1加算部517及び第1予測部519からなる。第1基本階層損失符号化部530は、第1量子化部531と、第1エントロピ符号化部533とからなり、第1拡張階層損失符号化部540は、第2量子化部541、第1乗算部543、第2減算部545及び第2エントロピ符号化部547からなる。この場合、第1残差生成部510、第1変換部520、第1基本階層符号化部530、第1拡張階層符号化部540及び第1ビットストリーム結合部550は、少なくとも1つのプロセッサ(図示せず)でもって具現されうる。
図5を参照するに、第1残差生成部510は、Nビット参照映像の時間/空間上予測によって得られるNビット復元映像とNビット原映像との残差を生成する。かような残差生成のためには、公知された多様な映像圧縮に使われるプロセスを使用するので、細部的な説明は省略する。
第1変換部520は、第1残差生成部510から提供される残差を変換し、変換係数を生成する。一例として、DCT(discrete cosine transformation)を使用する。
第1基本階層符号化部530は、第1変換部520から提供される変換係数に対し、式(1)の基本量子化係数で量子化し、基本階層の量子化された変換係数、すなわち、量子化レベルをエントロピ符号化し、基本階層ビットストリームを生成する。具体的に、変換係数をcoefとすれば、基本階層の基本量子化レベルLEVELは、次の式(4)のように示すことができる。
Figure 2010531608
式(4)から得られる基本階層の基本量子化レベルLEVELは、既存の8ビット・ビデオコーデックで復元できるように、そのままエントロピ符号化する。
第1拡張階層符号化部540は、第1変換部520から提供される変換係数に対して式(2)の拡張量子化係数で量子化し、拡張階層の量子化された変換係数、すなわち、量子化レベルをエントロピ符号化し、拡張階層ビットストリームを生成する。具体的に、変換係数をcoefとすれば、拡張階層の拡張量子化レベルLEVELは、次の式(5)のように示すことができる。
Figure 2010531608
式(5)から得られる拡張階層の拡張量子化レベルLEVELは、そのままエントロピ符号化せずに、基本階層の基本量子化レベルLEVELから拡張量子化レベルを予測することによって得られる量子化レベルの残差をエントロピ符号化する。すなわち、基本階層の基本量子化レベルLEVELと、拡張階層の拡張量子化レベルLEVELは、非常に類似しているので、第1乗算部543と第2減算部545とを介して、基本階層の基本量子化レベルLEVELから予測符号化を行い、拡張階層の拡張量子化レベルの残差を求める。具体的に、第1乗算部543は、量子化レベルのダイナミック・レンジを補正するためのものであり、次の式(6)によって、基本階層の基本量子化レベルLEVELが、拡張階層の量子化レベルLEVELと同じダイナミック・レンジを有するようにし、拡張階層の補正量子化レベルLEVEL’を出力する。
Figure 2010531608
第2減算部545は、次の式(7)のように、拡張階層の拡張量子化レベルLEVELと、拡張階層の補正量子化レベルLEVEL’との差を求め、量子化レベル残差LEVELを生成する。
Figure 2010531608
かような拡張階層の量子化レベル残差LEVELをエントロピ符号化することによって、拡張階層ビットストリームに含まれるデータ量を大幅に減らすことができる。
第1ビットストリーム結合部550は、基本階層ビットストリーム及び拡張階層ビットストリームを結合し、拡張階層識別子を含んでスケーラブル・ビットストリームを生成する。
前記の映像符号化装置の構成によれば、フォワード互換性が達成されうる。
図6は、図5に図示された映像符号化装置に対応し、本発明による映像復号化装置の第1実施形態による構成を示したブロック図であり、第1拡張階層識別子検査部610、第1基本階層復号化部620及び第1拡張階層復号化部640からなる。第1基本階層復号化部620は、第1エントロピ復号化部621、第2逆量子化部623、第2逆変換部625、第2予測部627及び第2加算部629からなる。第1拡張階層復号化部640は、第2エントロピ復号化部641、第3エントロピ復号化部642、第2乗算部643、第3加算部644、第3逆量子化部645、第3逆変換部646、第3予測部647及び第4加算部648からなる。この場合、第1拡張階層識別子検査部610、第1基本階層復号化部620及び第1拡張階層復号化部640は、少なくとも1つのプロセッサ(図示せず)でもって具現されうる。
図6を参照するに、第1拡張階層識別子検査部610は、ビットストリームが拡張階層識別子を含んでいるか否かを検査し、拡張階層識別子を含まない場合、入力されたビットストリーム、すなわち、基本階層ビットストリームを、そのまま第1基本階層復号化部620に提供する。一方、拡張階層識別子を含む場合、入力されるビットストリーム、すなわち、スケーラブル・ビットストリームから、拡張階層ビットストリームと基本階層ビットストリームとを分離し、それぞれ第1拡張階層復号化部640の第2エントロピ復号化部641と第3エントロピ復号化部642とに提供する。
第1基本階層復号化部620は、第1拡張階層識別子検査部610から提供される基本階層ビットストリームに対して復号化を行い、8ビット復元映像を生成する。具体的に、入力されるビットストリームに含まれた基本階層の基本量子化レベルLEVELを、次の式(8)のように、基本量子化係数QPを利用して変換係数coefを復元する。
Figure 2010531608
復元された変換係数coef8は、逆変換を行って残差を復元し、復元された残差に、8ビット参照映像の時間/空間上予測によって得られる8ビット復元映像を加算し、最終8ビット復元映像を生成する。
第1拡張階層復号化部640は、第1拡張階層識別子検査部610から提供される基本階層ビットストリームと拡張階層ビットストリームとに対して復号化を行い、Nビット復元映像を生成する。具体的に、基本階層の復元された基本量子化レベルLEVELを式(6)を利用して補正し、拡張階層の復元された補正量子化レベルLEVEL’を得る。拡張階層の復元された補正量子化レベルLEVEL’と拡張階層の復元された量子化レベル残差LEVELとを、次の式(9)のように加算し、拡張階層の復元された拡張量子化レベルLEVELを得る。
Figure 2010531608
拡張階層の復元された拡張量子化レベルLEVELは、次の式(10)のように、拡張量子化係数QPを利用して変換係数coefを復元する。
Figure 2010531608
復元された変換係数coefは、逆変換を行って残差を復元し、復元された残差は、ビット参照映像の時間/空間上予測によって得られるNビット復元映像を加算し、最終Nビット復元映像を生成するところに使用する。
図7A及び図7Bは、本発明の第1実施形態による符号化装置(図5)と、復号化装置(図6)とにおいて、階層間あるいは階層内の予測方法について説明する図であり、これによれば、Nビット映像に係わる効率的な符号化のために、時間/空間上予測時に使われる参照映像として、Nビット復元映像を使用する。代わりに、8ビット映像の場合には、符号化装置と復号化装置とで、時間/空間上予測時に使われる参照映像が互いに異なり、デコーダでの最終8ビット復元映像の画質が低下されうる。しかし、階層構造で符号化する主な理由は、Nビット映像を復元すると共に、既存に使われた8ビット・ビデオコーデックを支援するためである。従って、最終8ビット復元映像は、画質が低下しない。
図8は、本発明による映像符号化装置の第2実施形態による構成を示したブロック図であり、図5及び図6でのように、符号化装置と復号化装置とで、時間/空間上予測時に使われる参照映像が互いに異なることによって、最終8ビット復元映像の画質低下が発生することを防止するためのものである。図8に図示された映像符号化装置は、第2残差生成部810、第2変換部820、第2基本階層符号化部830、第2拡張階層符号化部840及び第2ビットストリーム結合部850を含んでなる。第2残差生成部810は、第3減算部811、第4逆量子化部813、第4逆変換部815、第5加算部817及び第4予測部819からなる。第2基本階層符号化部830は、第3量子化部831及び第3エントロピ符号化部833からなり、第2拡張階層符号化部840は、第4量子化部841、第3乗算部843、第4減算部845及び第4エントロピ符号化部847からなる。この場合、第2残差生成部810、第2変換部820、第2基本階層符号化部830、第2拡張階層符号化部840及び第2ビットストリーム結合部850は、少なくとも1つのプロセッサ(図示せず)でもって具現されうる。
図5に図示された第1実施形態の映像符号化装置と比較してみれば、図8に図示された第2実施形態の映像符号化装置は、8ビット量子化係数、すなわち、基本量子化係数で量子化した後、復元される映像を参照映像として使用し、時間/空間上予測を遂行するところに差異点がある。この場合、基本階層、すなわち、8ビット映像の場合には、符号化装置並びに復号化装置で、時間/空間上予測時に使われる参照映像が同一であるので、デコーダでの最終8ビット復元映像の画質低下を防止できる。一方、Nビット映像の場合には、8ビット量子化係数で量子化した後、復元される映像を参照映像として使用し、時間/空間上予測を遂行するので、図5の映像符号化装置に比べて、符号化しなければならないデータの量が増加しうる。
図9は、図8に図示された映像符号化装置に対応し、本発明による映像復号化装置の第2実施形態による構成を示したブロック図であり、第2拡張階層識別子検査部910、第2基本階層復号化部920及び第2拡張階層復号化部940からなる。第2基本階層復号化部920は、第4エントロピ復号化部921、第5逆量子化部923、第5逆変換部925、第5予測部927及び第6加算部929からなる。第2拡張階層復号化部940は、第5エントロピ復号化部931、第6エントロピ復号化部932、第4乗算部933、第7加算部934、第6逆量子化部935、第6逆変換部936、第7逆量子化部937、第7逆変換部938、第8加算部939、第6予測部940及び第9加算部641からなる。この場合、第2拡張階層識別子検査部910、第2基本階層復号化部920及び第2拡張階層復号化部940は、少なくとも1つのプロセッサ(図示せず)でもって具現されうる。
図6に図示された第1実施形態の映像復号化装置と比較すれば、図9に図示された第2実施形態の映像復号化装置は、8ビット量子化係数を利用して復元された参照映像から、時間/空間上予測を遂行するところに差異点がある。
図10A及び図10Bは、本発明の第2実施形態による符号化装置(図8)と復号化装置(図9)とにおいて、階層間あるいは階層内の予測方法について説明する図であり、図7A及び図7Bと異なり、符号化装置並びに復号化装置で、時間/空間上予測のために使われる参照映像が互いに同じであり、8ビット映像の場合、復元映像の画質低下は発生しないが、Nビット映像の場合、復元映像の画質低下が発生しうる。
図11は、本発明によるスケーラブル・ビットストリームを復号化するための改善されたVC−1デコーダの構成を示したブロック図であり、第3拡張階層識別子検査部1110及び第3基本階層復号化部1120からなる。第3基本階層復号化部1120は、第7エントロピ復号化部1121、第8逆量子化部1123、第8逆変換部1125、第7予測部1127及び第10加算部1129からなる。第3基本階層復号化部1120は、図6及び図9に図示された第1基本階層復号化部620及び第2基本階層復号化部920と同一であるので、その細部的な動作説明は省略する。
図11を参照するに、第3拡張階層識別子検査部1110は、ビットストリームが拡張階層識別子を含んでいるか否かを検査し、拡張階層識別子を含まない場合、入力されたビットストリーム、すなわち、基本階層ビットストリームを、そのまま第3基本階層復号化部1120に提供する。一方、拡張階層識別子を含む場合、入力されるビットストリーム、すなわち、スケーラブル・ビットストリームから基本階層ビットストリームだけ抽出し、第3基本階層復号化部1120に提供する。
これによれば、図11に図示された改善されたVC−1デコーダは、一般的なVC−1エンコーダから提供されたビットストリームに対して復元できるだけではなく、スケーラブル・ビットストリームが入力されても、基本階層ビットストリームだけ抽出して復元できるので、フォワード互換性を提供する。
前記の実施形態で適用されたビデオコーデックは、MPEG−2、MPEG−4、H.264などに広く使われるMC−DCT(Motion-Compensated Discrete Cosine Transform)ビデオコーデックを示し、これに限定されるものではなく、応用によって修正あるいは変形が加えれうる。一方、適用されたビデオコーデックについては、広く公知されているので、本発明によって修正あるいは追加された構成要素を除外した公知された構成要素の細部的な動作説明を省略する。
前記の実施形態では、スケーラブル・ビットストリームの形態を1つの基本階層ビットストリームと1つの拡張階層ビットストリームとから構成した実施形態に基づいて、ビットデプスが互いに異なる二種のコーデックを支援することについて説明しているが、拡張階層ビットストリームを複数個として置くことによって、二種以上のコーデックを支援することも可能である。また、本実施形態では、基本ビットデプスが拡張ビットデプスより大きい値を例にとっているが、基本ビットデプスが拡張ビットデプスより小さい値である場合にも、多様な設計変更が可能である。また、本実施形態では、ピクチャレベル別に補正量子化係数Rを割り当てているが、必要によって、スライスレベル別、マクロブロックレベル別、あるいはブロックレベル別に補正量子化係数Rを割り当てることができる。
本発明はまた、コンピュータで読取り可能な記録媒体に、コンピュータで読取り可能なコードとして具現することが可能である。コンピュータで読取り可能な記録媒体は、コンピュータシステムによって読取り可能なデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読取り可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがある。また、コンピュータで読取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散され、分散方式でコンピュータで読取り可能なコードが保存されて実行されうる。そして、本発明を具現するための機能的な(functional)プログラム、コード及びコードセグメントは、本発明が属する技術分野のプログラマらによって容易に推論されうる。
以上、本発明によれば、フォワード互換性が保証される新しいビデオコーデックを提供するために、スケーラブルビデオエンコーダは、基本階層ビットストリームと拡張階層ビットストリームとからなるスケーラブル・ビットストリームを生成し、スケーラブル・ビットストリームを受信する既存の基本デコーダは、スケーラブル・ビットストリームから得られる基本階層ビットストリームを利用して復号化を行い、スケーラブルビデオデコーダは、スケーラブル・ビットストリームに含まれた基本階層ビットストリームと拡張階層ビットストリームとをいずれも利用して復号化を行うことによって、改善されたビデオコーデックと既存のビデオコーデックとが互いに融化されて共存できるメリットがある。よって、具体的に、既存のWMV(Window Media Video)コーデックあるいはVC−1コーデックと、新しいビットデプスを支援するビデオコーデックとが共に使われうるメリットがある。
以上、図面と明細書とで最適実施形態を開示した。ここで、特定の用語が使われたが、それらは単に本発明について説明するための目的で使われたものであり、意味限定や特許請求の範囲に記載された本発明の範囲を制限するために使われたものではない。従って、本技術分野の当業者であるならば、それらから多様な変形及び均等な他実施形態が可能であるという点を理解することが可能であろう。従って、本発明の真の技術的保護範囲は、特許請求の範囲の技術的思想によって決まるのである。

Claims (25)

  1. 少なくとも2つのビットデプスを支援しつつ、フォワード互換性を有するスケーラブル・ビットストリームを生成する映像符号化方法において、
    前記スケーラブル・ビットストリームは、
    基本量子化レベルと、基本ビットデプスによる基本量子化係数とを含む基本階層ビットストリームと、
    拡張量子化レベルと、前記基本量子化レベルから予測された補正量子化レベルとの間の残差と、前記基本ビットデプスと拡張ビットデプスとの差を補正するための補正量子化係数とを含む拡張階層ビットストリームとからなる映像符号化方法。
  2. 前記スケーラブル・ビットストリームは、拡張階層識別子をさらに含むことを特徴とする請求項1に記載の映像符号化方法。
  3. 前記拡張階層識別子は、前記スケーラブル・ビットストリームのシーケンスレベル、GOPレベル、ピクチャレベル、マクロブロックレベル及びブロックレベルのうち、少なくとも1つのレベルに含まれることを特徴とする請求項2に記載の映像符号化方法。
  4. 前記拡張階層識別子は、前記スケーラブル・ビットストリームに存在する予備領域に含まれることを特徴とする請求項2に記載の映像符号化方法。
  5. 前記方法は、前記拡張ビットデプスの復元映像を参照映像として使用して時間/空間上予測を行い、その結果として得られる予測映像を利用し、前記基本階層ビットストリームと前記拡張階層ビットストリームとを生成することを特徴とする請求項1に記載の映像符号化方法。
  6. 前記方法は、前記基本ビットデプスの復元映像を変換して得られる前記拡張ビットデプスの復元映像を参照映像として使用して時間/空間上予測を行い、その結果として得られる予測映像を利用し、前記基本階層ビットストリームと前記拡張階層ビットストリームとを生成することを特徴とする請求項1に記載の映像符号化方法。
  7. 少なくとも2つのビットデプスを支援しつつ、フォワード互換性を有するスケーラブル・ビットストリームを生成する映像符号化装置において、
    基本量子化レベルと、基本ビットデプスによる基本量子化係数とを含む基本階層ビットストリームを生成する基本階層符号化部と、
    拡張量子化レベルと、前記基本量子化レベルから予測された補正量子化レベルとの間の残差と、前記基本ビットデプスと拡張ビットデプスとの差を補正するための補正量子化係数とを含む拡張階層ビットストリームを生成する拡張階層符号化部と、
    前記基本階層ビットストリーム及び前記拡張階層ビットストリームを結合してスケーラブル・ビットストリームを生成するビットストリーム結合部とを含んでなるスケーラブル映像符号化装置。
  8. 前記スケーラブル・ビットストリームは、拡張階層識別子をさらに含むことを特徴とする請求項7に記載の映像符号化装置。
  9. 前記拡張階層識別子は、前記スケーラブル・ビットストリームのシーケンスレベル、GOPレベル、ピクチャレベル、マクロブロックレベル及びブロックレベルのうち、少なくとも1つのレベルに含まれることを特徴とする請求項8に記載の映像符号化装置。
  10. 前記拡張階層識別子は、前記スケーラブル・ビットストリームに存在する予備領域に含まれることを特徴とする請求項8に記載の映像符号化装置。
  11. 前記装置は、前記拡張ビットデプスの復元映像を参照映像として使用して時間/空間上予測を行い、その結果として得られる予測映像を利用し、前記基本階層ビットストリームと前記拡張階層ビットストリームとを生成することを特徴とする請求項7に記載の映像符号化装置。
  12. 前記装置は、前記基本ビットデプスの復元映像を変換して得られる前記拡張ビットデプスの復元映像を参照映像として使用して時間/空間上予測を行い、その結果として得られる予測映像を利用し、前記基本階層ビットストリームと前記拡張階層ビットストリームとを生成することを特徴とする請求項7に記載の映像符号化装置。
  13. 受信されたビットストリームから、基本量子化レベルと、基本ビットデプスによる基本量子化係数とを含む基本階層ビットストリームを復号化し、基本復元映像を生成する基本階層復号化部と、
    前記受信されたビットストリームから、拡張量子化レベルと、前記基本量子化レベルから予測された補正量子化レベルとの間の残差と、前記基本ビットデプスと拡張ビットデプスとの差を補正するための補正量子化係数とを含む拡張階層ビットストリームを復号化し、復元された基本量子化レベルから予測された補正量子化レベルを前記残差に加算し、拡張復元映像を生成する拡張階層復号化部とを含む映像復号化装置。
  14. 前記装置は、前記拡張ビットデプスの復元映像を参照映像として使用して時間/空間上予測を行い、その結果として得られる予測映像を利用し、前記拡張階層ビットストリームを復号化することを特徴とする請求項13に記載の映像復号化装置。
  15. 前記装置は、前記基本ビットデプスの復元映像を変換して得られる前記拡張ビットデプスの復元映像を参照映像として使用して時間/空間上予測を行い、その結果として得られる予測映像を利用し、前記拡張階層ビットストリームを復号化する請求項13に記載の映像復号化装置。
  16. 前記装置は、前記受信されたビットストリームが拡張階層識別子を含んでいるか否かを検査する拡張階層識別子検査部をさらに含むことを特徴とする請求項13に記載の映像復号化装置。
  17. 前記拡張階層識別子は、前記スケーラブル・ビットストリームのシーケンスレベル、GOPレベル、ピクチャレベル、マクロブロックレベル及びブロックレベルのうち、少なくとも1つのレベルに含まれることを特徴とする請求項16に記載の映像復号化装置。
  18. 前記拡張階層識別子は、前記スケーラブル・ビットストリームに存在する予備領域に含まれることを特徴とする請求項16に記載の映像復号化装置。
  19. ビットストリームが拡張階層識別子を含んでいるか否かを検査する段階と、
    前記ビットストリームが前記拡張階層識別子を含まない場合、前記ビットストリームを、そのまま復号化し、基本ビットデプスの復元映像を生成する段階と、
    前記ビットストリームが前記拡張階層識別子を含む場合、前記ビットストリームのうち、基本階層ビットストリームから基本階層の基本量子化レベルを求め、前記基本量子化レベルから予測された補正量子化レベルと拡張量子化レベルとの残差と、前記基本ビットデプスと拡張ビットデプスとの差を補正するための補正量子化係数とを復号化し、前記残差を前記補正量子化レベルに加算することによって、拡張ビットデプスの復元映像を生成する段階とを含む映像復号化方法。
  20. 前記装置は、前記拡張ビットデプスの復元映像を参照映像として使用して時間/空間上予測を行い、その結果として得られる予測映像を利用し、前記拡張階層ビットストリームを復号化する請求項19に記載の映像復号化方法。
  21. 前記装置は、前記基本ビットデプスの復元映像を変換して得られる前記拡張ビットデプスの復元映像を参照映像として使用して時間/空間上予測を行い、その結果として得られる予測映像を利用し、前記拡張階層ビットストリームを復号化することを特徴とする請求項19に記載の映像復号化方法。
  22. 前記装置は、前記受信されたビットストリームが拡張階層識別子を含んでいるか否かを検査する拡張階層識別子検査部をさらに含むことを特徴とする請求項19に記載の映像復号化方法。
  23. 前記拡張階層識別子は、前記スケーラブル・ビットストリームのシーケンスレベル、GOPレベル、ピクチャレベル、マクロブロックレベル及びブロックレベルのうち、少なくとも1つのレベルに含まれることを特徴とする請求項19に記載の映像復号化方法。
  24. 前記拡張階層識別子は、前記スケーラブル・ビットストリームに存在する予備領域に含まれることを特徴とする請求項19に記載の映像復号化方法。
  25. ビットストリームが拡張階層識別子を含んでいるか否かを検査する段階と、
    検査結果に基づいて適応的に復号化する段階とを含むことを特徴とする映像復号化方法。
JP2010514609A 2007-06-28 2008-06-23 映像符号化装置及び方法と、映像復号化装置及び方法 Expired - Fee Related JP5180298B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20070064602A KR101366249B1 (ko) 2007-06-28 2007-06-28 스케일러블 영상 부호화장치 및 방법과 그 영상 복호화장치및 방법
KR10-2007-0064602 2007-06-28
PCT/KR2008/003557 WO2009002060A1 (en) 2007-06-28 2008-06-23 Method, medium, and apparatus for encoding and/or decoding video

Publications (2)

Publication Number Publication Date
JP2010531608A true JP2010531608A (ja) 2010-09-24
JP5180298B2 JP5180298B2 (ja) 2013-04-10

Family

ID=40160458

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010514609A Expired - Fee Related JP5180298B2 (ja) 2007-06-28 2008-06-23 映像符号化装置及び方法と、映像復号化装置及び方法

Country Status (6)

Country Link
US (1) US8848786B2 (ja)
EP (1) EP2165539A4 (ja)
JP (1) JP5180298B2 (ja)
KR (1) KR101366249B1 (ja)
CN (1) CN101690223B (ja)
WO (1) WO2009002060A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015503873A (ja) * 2012-01-03 2015-02-02 ドルビー ラボラトリーズ ライセンシング コーポレイション 視覚ダイナミックレンジコード化動作及びパラメータの指定

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9681142B2 (en) * 2009-02-03 2017-06-13 Thomson Licensing Dtv Methods and apparatus for motion compensation with smooth reference frame in bit depth scalability
KR101457418B1 (ko) 2009-10-23 2014-11-04 삼성전자주식회사 계층적 부호화 단위의 크기에 따른 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
US9819358B2 (en) * 2010-02-19 2017-11-14 Skype Entropy encoding based on observed frequency
US9609342B2 (en) * 2010-02-19 2017-03-28 Skype Compression for frames of a video signal using selected candidate blocks
US9313526B2 (en) * 2010-02-19 2016-04-12 Skype Data compression for video
US8913661B2 (en) * 2010-02-19 2014-12-16 Skype Motion estimation using block matching indexing
US9078009B2 (en) * 2010-02-19 2015-07-07 Skype Data compression for video utilizing non-translational motion information
HUE047906T2 (hu) * 2010-06-04 2020-05-28 Sony Corp QP és delta QP kódolása egy minimális méretnél nagyobb képblokkoknál
WO2013049179A1 (en) * 2011-09-29 2013-04-04 Dolby Laboratories Licensing Corporation Dual-layer frame-compatible full-resolution stereoscopic 3d video delivery
TWI575933B (zh) 2011-11-04 2017-03-21 杜比實驗室特許公司 階層式視覺動態範圍編碼中之層分解技術
MX353742B (es) * 2012-01-30 2018-01-26 Samsung Electronics Co Ltd Método y aparato de codificación y decodificación de video de base de unidad de datos jerárquica que comprende la predicción del parámetro de cuantificación.
WO2014002375A1 (ja) * 2012-06-26 2014-01-03 三菱電機株式会社 動画像符号化・復号装置及び方法
CN109068136B (zh) * 2012-12-18 2022-07-19 索尼公司 图像处理装置和图像处理方法、计算机可读存储介质
KR20140122202A (ko) * 2013-04-05 2014-10-17 삼성전자주식회사 계층 식별자 확장에 따른 비디오 스트림 부호화 방법 및 그 장치, 계층 식별자 확장에 따른 따른 비디오 스트림 복호화 방법 및 그 장치
EP3090549A1 (en) * 2014-01-02 2016-11-09 VID SCALE, Inc. Methods and systems for scalable video coding with mixed interlace and progressive content
CN108293124B (zh) * 2015-11-30 2022-05-13 瑞典爱立信有限公司 视频中画面的编码
US10510628B2 (en) * 2017-05-11 2019-12-17 Siemens Medical Solutions Usa, Inc. Contact pads for electrical module assembly with multidimensional transducer arrays
KR102432486B1 (ko) * 2017-11-22 2022-08-12 삼성전자주식회사 비디오 복호화 장치 및 이를 포함하는 컴퓨팅 시스템 및 비디오 복호화 방법
US11457199B2 (en) 2020-06-22 2022-09-27 Electronics And Telecommunications Research Institute Method for processing immersive video and method for producing immversive video
CN114979772B (zh) * 2021-02-24 2023-05-12 腾讯科技(深圳)有限公司 解码器的配置方法、装置、介质以及电子设备
US20240196002A1 (en) * 2021-04-21 2024-06-13 Beijing Bytedance Network Technology Co., Ltd. Method, device, and medium for video processing

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004112808A (ja) * 2002-09-17 2004-04-08 Lg Electronics Inc 微細単位伸縮型符号化/復号化装置及びその方法
US20050259729A1 (en) * 2004-05-21 2005-11-24 Shijun Sun Video coding with quality scalability

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7145948B2 (en) 2002-05-29 2006-12-05 Koninklijke Philips Electronics N.V. Entropy constrained scalar quantizer for a Laplace-Markov source
US6917713B2 (en) 2002-05-29 2005-07-12 Koninklijke Philips Electronics N.V. System and method for enhancing videos from drift-free scalable bitstream
KR100965881B1 (ko) * 2003-10-10 2010-06-24 삼성전자주식회사 비디오 데이터 인코딩 시스템 및 디코딩 시스템
US8045614B2 (en) * 2005-05-11 2011-10-25 Dolby Laboratories Licensing Corporation Quantization control for variable bit depth
KR101014667B1 (ko) 2004-05-27 2011-02-16 삼성전자주식회사 스케일러블 동영상 인코딩, 디코딩 장치 및 그 방법
WO2006004331A1 (en) 2004-07-07 2006-01-12 Samsung Electronics Co., Ltd. Video encoding and decoding methods and video encoder and decoder
JP2008507194A (ja) 2004-07-15 2008-03-06 サムスン エレクトロニクス カンパニー リミテッド 動き情報符号化装置及び方法、動き情報復号化装置及び方法、これを採用したスケーラブル映像符号化装置及び方法とスケーラブル映像復号化装置及び方法
US7995656B2 (en) 2005-03-10 2011-08-09 Qualcomm Incorporated Scalable video coding with two layer encoding and single layer decoding
CN1674677A (zh) * 2005-04-21 2005-09-28 上海大学 改进的fgs视频编码方法及其编解码器
KR100746011B1 (ko) * 2005-08-24 2007-08-06 삼성전자주식회사 잔차 예측의 성능 개선 방법, 상기 방법을 이용한 비디오인코더 및 비디오 디코더
JP5039142B2 (ja) * 2006-10-25 2012-10-03 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 品質スケーラブルな符号化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004112808A (ja) * 2002-09-17 2004-04-08 Lg Electronics Inc 微細単位伸縮型符号化/復号化装置及びその方法
US20050259729A1 (en) * 2004-05-21 2005-11-24 Shijun Sun Video coding with quality scalability

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015503873A (ja) * 2012-01-03 2015-02-02 ドルビー ラボラトリーズ ライセンシング コーポレイション 視覚ダイナミックレンジコード化動作及びパラメータの指定

Also Published As

Publication number Publication date
US20090003437A1 (en) 2009-01-01
KR101366249B1 (ko) 2014-02-21
US8848786B2 (en) 2014-09-30
EP2165539A4 (en) 2011-12-21
CN101690223A (zh) 2010-03-31
WO2009002060A1 (en) 2008-12-31
EP2165539A1 (en) 2010-03-24
CN101690223B (zh) 2012-01-25
KR20090000496A (ko) 2009-01-07
JP5180298B2 (ja) 2013-04-10

Similar Documents

Publication Publication Date Title
JP5180298B2 (ja) 映像符号化装置及び方法と、映像復号化装置及び方法
KR101365596B1 (ko) 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법
US8331433B2 (en) Video encoding apparatus and method and video decoding apparatus and method
KR101365441B1 (ko) 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법
US8351502B2 (en) Method and apparatus for adaptively selecting context model for entropy coding
JP5335833B2 (ja) 複数層を使用するマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングのためのシステム及び方法
KR101365597B1 (ko) 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법
JP5238021B2 (ja) スケーラブル・ストリームの形でビデオ・コンテンツを符号化する装置および方法
EP2428042B1 (en) Scalable video coding method, encoder and computer program
JP2017216698A (ja) ビデオビットストリームをトランスコーディングする方法及び構成
EP1715693A2 (en) Method and apparatus for adaptively selecting context model for entropy coding
CN113678441A (zh) 跨分量滤波的方法和装置
KR20150126728A (ko) 조합된 공간 및 비트 심도 확장성
KR20110115172A (ko) 톤 매핑 및 톤 역매핑을 이용하는 비트 심도 스케일링 가능 비디오 인코딩 및 디코딩을 위한 방법 및 장치
CN115941954A (zh) 视频编码的方法和装置
EP1601205A1 (en) Moving image encoding/decoding apparatus and method
JP2005160084A (ja) SNR(signaltonoiseratio)スケーラビリティを実現するための動映像処理装置及びその方法
KR101291189B1 (ko) 스케일러블 영상 부호화장치 및 방법과 스케일러블 영상복호화장치 및 방법
KR101291192B1 (ko) 영상 부호화장치 및 방법과 영상 복호화장치 및 방법
CN118077200A (zh) 用于视频处理的方法、装置和介质
CN113748678A (zh) 非线性环路滤波的方法和装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120110

AA91 Notification of revocation by ex officio

Free format text: JAPANESE INTERMEDIATE CODE: A971091

Effective date: 20120124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120807

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130110

R150 Certificate of patent or registration of utility model

Ref document number: 5180298

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees