JP5547394B2 - 映像を階層的に符号化/復号化する方法及び装置 - Google Patents

映像を階層的に符号化/復号化する方法及び装置 Download PDF

Info

Publication number
JP5547394B2
JP5547394B2 JP2008294570A JP2008294570A JP5547394B2 JP 5547394 B2 JP5547394 B2 JP 5547394B2 JP 2008294570 A JP2008294570 A JP 2008294570A JP 2008294570 A JP2008294570 A JP 2008294570A JP 5547394 B2 JP5547394 B2 JP 5547394B2
Authority
JP
Japan
Prior art keywords
video
enhancement layer
quantization
restored
residue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008294570A
Other languages
English (en)
Other versions
JP2009141953A (ja
Inventor
大 熙 金
大 星 趙
雄 一 崔
鉉 文 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2009141953A publication Critical patent/JP2009141953A/ja
Application granted granted Critical
Publication of JP5547394B2 publication Critical patent/JP5547394B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

本発明は、映像を符号化または復号化する方法及び装置に係り、特に映像を階層的に符号化または復号化する方法及び装置に関する。
現在広く使用中のコーデック(codec)は、4:2:0映像またはビット深さ(bit depth)が8ビットである映像を再生できる。一方、映像フォーマットが4:4:4または4:2:2に拡張するか、ビット深さが10ビットに拡張した高画質の映像を再生できる新たなコーデックについての研究が活発に進んでいる。ところが、4:2:0映像またはビット深さが8ビットである映像を再生できる既存コーデック付き端末機は、4:4:4映像、4:2:2映像またはビット深さが10ビットである映像を再生できない。4:4:4映像、4:2:2映像またはビット深さが10ビットである映像が一般化されるならば、既存コーデック付き端末機はいずれも不要になる。これにより、一つの単一ストリームを、既存コーデック付き端末機と新たなコーデック付き端末機とを共に再生可能にする技術への要求が大きく浮び上がっている。
本発明が解決しようとする技術的課題は、一つの単一ストリームを、既存コーデック付き端末機と新たなコーデック付き端末機とが共に再生可能にすると同時に、人間の視覚特性を反映して階層的に映像を符号化または復号化可能にする方法及び装置を提供するところにある。また、前記の方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供するところにある。本発明が解決しようとする技術的課題は、前記のような技術的課題に限定されず、さらに他の技術的課題が存在できる。これは、当業者ならば下の記載から明確に理解できるであろう。
前記技術的課題を解決するための本発明による第1映像符号化方法は、原本映像をダウンサンプリングすることで基本映像を生成するステップと、前記生成された基本映像を符号化することによって基本階層ビットストリームを生成するステップと、前記基本映像の復元映像を生成するステップと、前記復元映像をアップサンプリングするステップと、前記原本映像と前記アップサンプリングされた復元映像間のレジデュー映像を、相異なる量子化パラメータを利用して符号化することによって、拡張階層ビットストリームを生成するステップとを含む。
前記他の技術的課題を解決するために、本発明は、前記第1映像符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
前記さらに他の技術的課題を解決するための本発明による第1映像符号化装置は、原本映像をダウンサンプリングすることで基本映像を生成するダウンサンプラーと、前記生成された基本映像を符号化することによって基本階層ビットストリームを生成する第1符号化部と、前記基本映像の復元映像を生成する生成部と、前記復元映像をアップサンプリングするアップサンプラーと、前記原本映像と前記アップサンプリングされた復元映像間のレジデュー映像を、相異なる量子化パラメータを利用して符号化することによって拡張階層ビットストリームを生成する第2符号化部とを備える。
前記さらに他の技術的課題を解決するための本発明による第1映像復号化方法は、基本階層ビットストリームを復号化することによって基本映像の復元映像を生成するステップと、前記生成された復元映像をアップサンプリングするステップと、拡張階層ビットストリームそれぞれを、相異なる量子化パラメータを利用して復号化することによって、原本映像と前記アップサンプリングされた復元映像間のレジデュー映像を復元するステップと、前記アップサンプリングされた復元映像に前記復元されたレジデュー映像を加えることによって原本映像の復元映像を生成するステップと、を含む。
前記さらに他の技術的課題を解決するために、本発明は、前記第1映像符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
前記さらに他の技術的課題を解決するための本発明による第1映像復号化装置は、基本階層ビットストリームを復号化することによって基本映像の復元映像を生成する第1復号化部と、前記生成された復元映像をアップサンプリングするアップサンプラーと、拡張階層ビットストリームそれぞれを、相異なる量子化パラメータを利用して復号化することによって原本映像と前記アップサンプリングされた復元映像間のレジデュー映像を復元する第2復号化部と、前記アップサンプリングされた復元映像に前記復元されたレジデュー映像を加えることによって原本映像の復元映像を生成する加算器とを備える。
前記さらに他の技術的課題を解決するための本発明による第2映像符号化方法は、原本映像をダウンサンプリングすることで基本映像を生成するステップと、前記生成された基本映像を符号化することによって基本階層ビットストリームを生成するステップと、前記基本映像の復元映像を生成するステップと、前記復元映像をアップサンプリングするステップと、前記原本映像と前記アップサンプリングされた復元映像間のレジデュー映像の予測映像を生成するステップと、前記レジデュー映像と前記生成された予測映像間のレジデュー映像を、相異なる量子化パラメータを利用して符号化することによって拡張階層ビットストリームを生成するステップと、を含む。
前記さらに他の技術的課題を解決するために、本発明は、前記第2映像符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
前記さらに他の技術的課題を解決するための本発明による第2映像符号化装置は、原本映像をダウンサンプリングすることで基本映像を生成するダウンサンプラーと、前記生成された基本映像を符号化することによって基本階層ビットストリームを生成する第1符号化部と、前記基本映像の復元映像を生成する第1生成部と、前記復元映像をアップサンプリングするアップサンプラーと、前記原本映像と前記アップサンプリングされた復元映像間のレジデュー映像の予測映像を生成する第2生成部と、前記レジデュー映像と前記生成された予測映像間のレジデュー映像を、相異なる量子化パラメータを用いて符号化することによって拡張階層ビットストリームを生成する第2符号化部とを備える。
前記さらに他の技術的課題を解決するための本発明による第2映像復号化方法は、基本階層ビットストリームを復号化することによって基本映像の復元映像を生成するステップと、前記生成された復元映像をアップサンプリングするステップと、原本映像と前記アップサンプリングされた復元映像間のレジデュー映像の予測映像を生成するステップと、拡張階層ビットストリームそれぞれを、相異なる量子化パラメータを利用して復号化することによって、前記レジデュー映像と前記予測映像間のレジデュー映像を復元するステップと、前記生成された予測映像に前記復元されたレジデュー映像を加えることによって前記レジデュー映像を復元するステップと、前記アップサンプリングされた復元映像に前記復元されたレジデュー映像を加えることによって前記原本映像の復元映像を生成するステップとを含む。
前記さらに他の技術的課題を解決するために、本発明は、前記第2映像符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
前記さらに他の技術的課題を解決するための本発明による第2映像復号化装置は、基本階層ビットストリームを復号化することによって基本映像の復元映像を生成する第1復号化部と、前記生成された復元映像をアップサンプリングするアップサンプラーと、原本映像と前記アップサンプリングされた復元映像間のレジデュー映像の予測映像を生成する生成部と、拡張階層ビットストリームそれぞれを、相異なる量子化パラメータを利用して復号化することによって前記レジデュー映像と前記予測映像間のレジデュー映像を復元する第2復号化部と、前記生成された予測映像に前記復元されたレジデュー映像を加えることで前記レジデュー映像を復元する第1加算器と、前記アップサンプリングされた復元映像に前記復元されたレジデュー映像を加えることによって前記原本映像の復元映像を生成する第2加算器とを備える。
前記さらに他の技術的課題を解決するための本発明による第3映像符号化方法は、原本映像をダウンサンプリングすることで基本映像を生成するステップと、前記生成された基本映像を符号化することによって基本階層ビットストリームを生成するステップと、前記基本映像の復元映像を生成するステップと、前記復元映像をアップサンプリングするステップと、前記原本映像と前記アップサンプリングされた復元映像間の第1レジデュー映像の第1予測映像を生成するステップと、前記第1レジデュー映像と前記生成された第1予測映像間の第2レジデュー映像を、第1量子化パラメータを利用して符号化することによって第1拡張階層ビットストリームを生成するステップと、前記第1レジデュー映像の第2予測映像を生成するステップと、前記第1レジデュー映像と前記第2予測映像間の第3レジデュー映像を、第2量子化パラメータを利用して符号化することによって第2拡張階層ビットストリームを生成するステップとを含む。
前記さらに他の技術的課題を解決するために、本発明は、前記第3映像符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
前記さらに他の技術的課題を解決するための本発明による第3映像符号化装置は、原本映像をダウンサンプリングすることで基本映像を生成するダウンサンプラーと、前記生成された基本映像を符号化することによって基本階層ビットストリームを生成する第1符号化部と、前記基本映像の復元映像を生成する第1生成部と、前記復元映像をアップサンプリングするアップサンプラーと、前記原本映像と前記アップサンプリングされた復元映像間の第1レジデュー映像の第1予測映像を生成する第2生成部と、前記第1レジデュー映像と前記生成された第1予測映像間の第2レジデュー映像を、第1量子化パラメータを利用して符号化することによって第1拡張階層ビットストリームを生成する第2符号化部と、前記第1レジデュー映像の第2予測映像を生成する第3生成部と、前記第1レジデュー映像と前記第2予測映像間の第3レジデュー映像を、第2量子化パラメータを利用して符号化することによって第2拡張階層ビットストリームを生成する第3符号化部とを備える。
前記さらに他の技術的課題を解決するための本発明による第3映像符号化方法は、基本階層ビットストリームを復号化することによって基本映像の復元映像を生成するステップと、前記生成された復元映像をアップサンプリングするステップと、原本映像と前記アップサンプリングされた復元映像間の第1レジデュー映像の第1予測映像を生成するステップと、第1拡張階層ビットストリームを、前記第1量子化パラメータを利用して復号化することによって、前記第1レジデュー映像と前記第1予測映像間の第2レジデュー映像を復元するステップと、前記生成された第1予測映像に前記復元された第2レジデュー映像を加えることによって前記第1レジデュー映像の第1復元映像を生成するステップと、前記第1レジデュー映像の第2予測映像を生成するステップと、第2拡張階層ビットストリームを、第2量子化パラメータを利用して復号化することによって、前記第1レジデュー映像と前記第2予測映像間の第3レジデュー映像を復元するステップと、前記生成された第2予測映像に前記復元された第3レジデュー映像を加えることによって前記第1レジデュー映像の第2復元映像を生成するステップと、前記アップサンプリングされた復元映像に、前記生成された第1復元映像及び第2復元映像のうち少なくとも一つを加算することによって前記原本映像の復元映像を生成するステップとを含む。
前記さらに他の技術的課題を解決するために、本発明は、前記第3映像復号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
前記さらに他の技術的課題を解決するための本発明による第3映像復号化装置は、基本階層ビットストリームを復号化することによって基本映像の復元映像を生成する第1復号化部と、前記生成された復元映像をアップサンプリングするアップサンプラーと、原本映像と前記アップサンプリングされた復元映像間の第1レジデュー映像の第1予測映像を生成する第1生成部と、第1拡張階層ビットストリームを、前記第1量子化パラメータを利用して復号化することによって前記第1レジデュー映像と前記第1予測映像間の第2レジデュー映像を復元する第2復号化部と、前記生成された第1予測映像に前記復元された第2レジデュー映像を加えることによって前記第1レジデュー映像の第1復元映像を生成する第1加算器と、前記第1レジデュー映像の第2予測映像を生成する第2生成部と、第2拡張階層ビットストリームを、第2量子化パラメータを利用して復号化することによって前記第1レジデュー映像と前記第2予測映像間の第3レジデュー映像を復元する第3復号化部と、前記生成された第2予測映像に前記復元された第3レジデュー映像を加えることによって前記第1レジデュー映像の第2復元映像を生成する第2加算器と、前記アップサンプリングされた復元映像に前記生成された第1復元映像及び第2復元映像のうち少なくとも一つを加算することによって前記原本映像の復元映像を生成する第3加算器とを備える。
本発明の少なくとも一つの実施形態によれば、一つの単一ストリームを、既存コーデック付き端末機と新たなコーデック付き端末機とが共に再生可能にすると同時に、人間の視覚特性を反映して階層的に映像を符号化または復号化できる。
以下では、図面を参照して本発明の実施形態を詳細に説明する。特に、以下に記載された“映像(image)”という用語は、ピクチャー、フレームのような同等な意味を持つ他の用語に代置して使われうるということを、当業者ならば理解できるであろう。
図1は、本発明の実施形態が適用されるスケーラブル映像処理環境を示す図である。図1を参照するに、スケーラブル映像処理環境は、第1符号化装置10、第1復号化装置20、第2符号化装置30及び第2復号化装置40で構成される。第1符号化装置10、第1復号化装置20は、4:2:0映像またはビット深さが8ビットである映像を再生できる既存コーデック付き装置であり、第2符号化装置30及び第2復号化装置40は、4:4:4映像、4:2:2映像またはビット深さが10ビットである映像を再生できる新たなコーデック付き装置である。
したがって、第1符号化装置10は、4:2:0映像またはビット深さが8ビットである映像を符号化し、その結果に該当するビットストリームを出力する。また、第2符号化装置30は、4:4:4映像、4:2:2映像またはビット深さが10ビットである映像を符号化し、その結果に該当するビットストリームを出力する。既存コーデック付き第1復号化装置20が、新たなコーデック付き第2符号化装置30から出力されたビットストリームを再生できる互換性を、順方向互換性という。また、新たなコーデック付き第2復号化装置40が、既存コーデック付き第1符号化装置10から出力されたビットストリームを再生できる互換性を、逆方向互換性という。特に、以下で説明される本発明の実施形態は順方向互換性を支援する。
図2は、本発明の実施形態によって階層的に符号化または復号化する態様を示す図である。図2を参照するに、第2符号化装置30がN個の階層ほど映像を階層的に符号化するならば、第2符号化装置30は、基本階層ビットストリーム、第1拡張階層ビットストリーム、第2拡張階層ビットストリーム、…、第N拡張階層ビットストリームを含むスケーラブルビットストリームを出力する。既存コーデック付き第1復号化装置20は、スケーラブルビットストリームのうち基本階層ビットストリームのみを選別して復号化する。一方、新たなコーデック付き第2復号化装置40は、スケーラブルビットストリーム全てを復号化する。もちろん、N個の拡張階層ビットストリームのうち一部のみを復号化する装置も可能である。
図3は、図2に示した第2符号化装置30から出力されたスケーラブルビットストリームのフォーマットを示す図である。前記のように、図3に示したスケーラブルビットストリームは、基本階層ビットストリーム、第1拡張階層ビットストリーム、第2拡張階層ビットストリーム、…、及び第N拡張階層ビットストリームで構成される。基本階層と拡張階層間には映像フォーマットまたはビット深さなどが変わるため、量階層間の画質差が非常に大きい。一方、拡張階層間に映像フォーマットまたはビット深さなどが同一であるため、拡張階層間の画質差が大きくない。これにより、前者の拡張性を“coarse grain scalability”と呼み、後者の拡張性を“median/fine grain scalability”と呼ぶ。特に、以下で説明される本発明の実施形態は、人間の視覚特性に基づいて量子化パラメータを各階層別に異ならせることによって、このように“median/fine grain scalability”を支援可能にしている。
図4は、本発明の一実施形態による映像符号化装置100の構成図である。図4を参照するに、本実施形態による映像符号化装置は、ダウンサンプラー101、動き推定部102、動き補償部103、第1減算器104、第1変換部105、量子化部106、エントロピー符号化部107、逆量子化部108、逆変換部109、加算器110、バッファ111、アップサンプラー112、第2減算器113、第2変換部114、第1拡張階層量子化部115、第2拡張階層量子化部117及び第N拡張階層量子化部121、第1拡張階層エントロピー符号化部116、第2拡張階層エントロピー符号化部120及び第N拡張階層エントロピー符号化部124、第1レベル推定部118及び第N−1レベル推定部122、第1レベル減算器119及び第N−1レベル減算器123及びビットストリーム生成部125で構成される。
ダウンサンプラー101は、動映像を構成する原本映像中映像符号化装置100に現在入力された原本映像をダウンサンプリングすることで基本映像を生成する。例えば、原本映像のフォーマットが4:4:4または4:2:2である場合、ダウンサンプラー101は、4:4:4原本映像または4:2:2原本映像をダウンサンプリングすることで4:2:0基本映像を生成する。もし、原本映像の解像度がHD(High Definition)またはCIF(Common Intermediate Format)である場合、ダウンサンプラー101は、HD原本映像またはCIF原本映像をダウンサンプリングすることで、SD(Standard Definition)基本映像またはQCIF(Quarter CIF)基本映像を生成する。もし、原本映像を構成する画素のカラー値を表すビットの数、すなわち、ビット深さが10ビットである場合、ダウンサンプラー101は、ビット深さが10ビットである原本映像をダウンサンプリングすることで、ビット深さが8ビットである基本映像を生成する。また、ダウンサンプラー101は、前記のような例のうち少なくとも二つ以上を同時に行う事も出来る。
動き推定部102は、バッファ111に保存された参照映像のうち少なくとも一つの参照映像を基準に、ダウンサンプラー101により生成された基本映像の動きを推定する。より詳細に説明すれば、動き推定部102は、基本映像を構成するブロックそれぞれに対して、バッファ111に保存された参照映像のうち、基本映像のブロックに最もよくマッチングする参照映像のブロックを決定し、このように決定された参照映像のブロックと基本映像のブロック間の変位を表す動きベクトルを算出する。本実施形態での映像の処理単位に該当するブロックのサイズは、最も一般的な16×16であると仮定する。このように16×16サイズのブロックを、いわゆるマクロブロックという。ただし、当業者ならば、前記16×16以外に16×8、8×16、8×8、4×4などの多様なサイズになりうるということを理解できるであろう。
動き補償部103は、動き推定部102による基本映像の動き推定を利用して、バッファ111に保存された参照映像のうち少なくとも一つの参照映像から基本映像の予測映像を生成する。より詳細に説明すれば、動き補償部103は、動き推定部102により算出された基本映像のブロックそれぞれの動きベクトルが指示する少なくとも一つの参照映像のブロック値を基本映像のブロック値に決定することによって、基本映像の予測映像を生成する。
前記動き推定部102及び動き補償部103による映像圧縮方式は、いずれか一つの動映像を構成するいろいろな映像間の時間的重複性を利用して映像を圧縮する方式であり、インター符号化方式という。いずれか一つの映像内の空間的重複性を利用して映像を圧縮する方式をイントラ符号化方式というが、本実施形態の説明が過度に長くなることを回避するために、本実施形態にインター符号化方式のみ適用されるように設計したが、当業者ならば、本実施形態にイントラ符号化方式も適用できるということを理解できるであろう。また、イントラ符号化方式は、映像符号化装置100に入力される映像に適用されてもよく、第1変換部105により変換された結果に適用されてもよい。
第1減算器104は、基本映像から動き補償部103により生成された予測映像を減算することで、基本映像と予測映像間のレジデュー映像(以下、“第1レジデュー映像”という)を生成する。より詳細に説明すれば、第1減算器104は、基本映像の各ブロックから各ブロックの動きベクトルが指示する少なくとも一つの予測映像のブロックを減算する。第1変換部105は、第1減算器104により生成された第1レジデュー映像を色空間から周波数空間に変換することによって、第1レジデュー映像の周波数係数を生成する。例えば、第1変換部105は、DHT(Discrete Hadamard Transform)、DCT(Discrete Cosine Transform)などを利用して、第1減算器104により生成された第1レジデュー映像を色空間から周波数空間に変換できる。
量子化部106は、第1変換部105により生成された周波数係数を量子化することで第1レジデュー映像の量子化レベルを生成する。より詳細に説明すれば、量子化部106は、第1変換部105により生成された周波数係数を量子化パラメータで割り、その結果を整数値に近似化する。すなわち、このように近似化された整数値を量子化レベルという。エントロピー符号化部107は、量子化部106により生成された量子化レベルをエントロピー符号化することによって基本階層ビットストリームを生成する。例えば、エントロピー符号化部107は、CAVLC(Context−Adaptive Variable−Length Coding)、CAVAC(Context−Adaptive Binary Arithmetic Coding)などを利用して、量子化部106により生成された量子化レベルをエントロピー符号化できる。また、エントロピー符号化部107は、動映像に該当する整数値以外に動映像復号化のための情報、例えばインター予測に使われた参照映像の索引情報、動きベクトル情報などをエントロピー符号化する。前記変換方式、量子化方式及びエントロピー符号化方式に関する詳細な説明は、以下でもそのまま適用されるため、以下ではこれら方式については簡略に説明する。
逆量子化部108は、量子化部106により生成された量子化レベルを逆量子化することで第1レジデュー映像の周波数係数を復元する。より詳細に説明すれば、逆量子化部108は、量子化部106により近似化された整数値に量子化パラメータを乗算することによって、第1レジデュー映像の周波数係数を復元する。逆変換部109は、逆量子化部108により復元された周波数係数を、周波数空間から色空間に変換することによって第1レジデュー映像を復元する。加算器110は、動き補償部103により生成された予測映像に、逆変換部109により復元された第1レジデュー映像を加えることによって基本映像の復元映像を生成し、この復元映像をバッファ111に保存する。バッファ111に現在保存された復元映像は、基本映像の以後に登場する未来の映像または基本映像以前に存在した過去の映像の参照映像として使われる。
アップサンプラー112は、加算器110により生成された復元映像をアップサンプリングする。例えば、加算器110により生成された復元映像のフォーマットが4:2:0である場合、アップサンプラー112は4:2:0復元映像をアップサンプリングすることで4:4:4または4:2:2映像を生成する。もし、加算器110により生成された復元映像の解像度がSDまたはQCIFである場合、アップサンプラー112は、SD復元映像またはQCIF復元映像をアップサンプリングすることでHD映像またはCIF映像を生成する。もし、加算器110により生成された復元映像を構成する画素のビット深さが8ビットである場合、アップサンプラー112は、ビット深さが8ビットである復元映像をアップサンプリングすることでビット深さが10ビットである映像を生成する。また、アップサンプラー112は、前記のような例のうち少なくとも二つ以上を同時に行ってもよい。
第2減算器113は、動映像を構成する原本映像のうち、映像符号化装置100に現在入力された原本映像からアップサンプラー112によりアップサンプリングされた復元映像を減算することで、原本映像とアップサンプラー112によりアップサンプリングされた復元映像間のレジデュー映像(以下、“第2レジデュー映像”という)を生成する。より詳細に説明すれば、第2減算器113は、原本映像の各ブロックから各ブロックと共通位置の復元映像のブロックを減算する。第2変換部114は、第2減算器113により生成された第2レジデュー映像を、色空間から周波数空間に変換することによって第2レジデュー映像の周波数係数を生成する。
第1拡張階層量子化部115は、第2変換部114により生成された周波数係数を、第1拡張階層量子化パラメータを利用して量子化することで、第2レジデュー映像の第1拡張階層量子化レベルを生成する。第1拡張階層エントロピー符号化部116は、第1拡張階層量子化部115により生成された第1拡張階層量子化レベルをエントロピー符号化することによって第1拡張階層ビットストリームを生成する。第2拡張階層量子化部117は、第2変換部114により生成された周波数係数を第2拡張階層量子化パラメータを利用して量子化することで、第2レジデュー映像の第2拡張階層量子化レベルを生成する。
第1レベル推定部118は、第1拡張階層量子化部115により生成された第1拡張階層量子化レベルから、第2拡張階層量子化部117により生成される第2拡張階層量子化レベルを推定する。より詳細に説明すれば、第1レベル推定部118は、第1拡張階層量子化部115により生成された第1拡張階層量子化レベルを、第1拡張階層量子化パラメータを利用して逆量子化することで第2レジデュー映像の周波数係数を復元し、この周波数係数を、第2拡張階層量子化パラメータを利用して量子化することで、第2拡張階層量子化部117により生成される第2拡張階層量子化レベルを推定する。すなわち、第2拡張階層量子化パラメータを利用して量子化された結果が、第2拡張階層量子化レベルの推定値である。
第1レベル減算器119は、第2拡張階層量子化部117により生成された第2拡張階層量子化レベルから、第1レベル推定部118により推定された第2拡張階層量子化レベルを減算することで、第2拡張階層量子化部117により生成された第2拡張階層量子化レベルと第1レベル推定部118により推定された第2拡張階層量子化レベル間の差値を生成する。第2拡張階層エントロピー符号化部120は、第1レベル減算器119により生成された差値をエントロピー符号化することによって第2拡張階層ビットストリームを生成する。
以上では本実施形態のうち、第1拡張階層と第2拡張階層に関する部分を説明した。以下では、本実施形態による量子化パラメータについての具体的な例を挙げて、第1拡張階層及び第2拡張階層を第x−1拡張階層及び第x拡張階層に一般化させて説明する。また、第x−1拡張階層及び第x拡張階層に該当する構成要素については、図4の複雑度を低めるために、この構成要素についての図示は省略する。
本実施形態によれば、第1拡張階層量子化パラメータは、第1拡張階層の量子化ステップサイズと量子化行列との積で定義できる。この場合、第x−1拡張階層量子化部は、次の式(1)によって、第2変換部114により生成された周波数係数の行列を、第x−1拡張階層の量子化ステップサイズと量子化行列との積で割り、その結果を整数値に近似化する。次の式(1)で“Coeffx−1”は、第2変換部114により生成された周波数係数の行列であり、“QEx−1”は、第x−1拡張階層の量子化ステップサイズであり、“Wx−1”は、第x−1拡張階層の量子化行列であり、“1/2(QEx−1×Wx−1)”は、“Coeffx−1”を“QEx−1×Wx−1”で割った結果値を四捨五入するための値である。また、“floor[]”は、[]内に記載された任意の実数値からこの値の少数点以下の値を切断(truncation)する関数であり、“Levelx−1”は、第x−1拡張階層量子化部により生成された第x−1拡張階層量子化レベルである。
Figure 0005547394
また、第x−1レベル推定部は、次の式(2)によって第x−1拡張階層量子化部により生成された第x−1拡張階層量子化レベルと、第x−1拡張階層の量子化ステップサイズと量子化行列との積とを乗算することによって、第2レジデュー映像の第x−1拡張階層周波数係数を復元する。次の式(2)で“Levelx−1”は、第x−1拡張階層量子化部により生成された第x−1拡張階層量子化レベルであり、“QEx−1”は、第x−1拡張階層の量子化ステップサイズであり、“Wx−1”は、第x−1拡張階層の量子化行列であり、“recCoeffx−1”は、第x−1レベル推定部により復元された周波数係数である。
Figure 0005547394
次いで、第x−1レベル推定部は、次の式(3)によってこのように復元された第x−1拡張階層周波数係数を、第x拡張階層の量子化ステップサイズと量子化行列との積で割り、その結果を整数値に近似化する。次の式(3)で“recCoeffx−1”は、第x−1レベル推定部により復元された周波数係数であり、“QEx”は、第x拡張階層の量子化ステップサイズであり、“W”は、第x拡張階層の量子化行列であり、“1/2(QEx×W)”は、“recCoeffx−1”を“QEx×W”で割った結果値を四捨五入するための値である。また、“estLevel”は、第x−1レベル推定部により推定された第x拡張階層量子化レベルである。
Figure 0005547394
また、第x−1レベル減算器は、次の式(4)によって、第x拡張階層量子化部により生成された第x拡張階層量子化レベルから、第x−1レベル推定部により推定された第x拡張階層量子化レベルを減算する。次の式(4)で、“Level”は、第x拡張階層量子化部により生成された第x拡張階層量子化レベルであり、“estLevelx−1”は、第x−1レベル推定部により推定された第x拡張階層量子化レベルである。また、“resLevel”は、第x拡張階層量子化部により生成された第x拡張階層量子化レベルと、第x−1レベル推定部により推定された第x拡張階層量子化レベルとの差値である。
Figure 0005547394
そうでなければ、第1拡張階層量子化パラメータは、第1拡張階層の量子化ステップサイズと量子化行列との和とも定義できる。この場合、第x−1拡張階層量子化部は、次の式(5)によって第2変換部114により生成された周波数係数の行列を、第1拡張階層の量子化ステップサイズと量子化行列との和で割り、その結果を整数値に近似化する。次の式(5)で、“Coeffx−1”は、第2変換部114により生成された周波数係数の行列であり、“QEx−1”は、第x−1拡張階層の量子化ステップサイズであり、“Wx−1”は、第x−1拡張階層の量子化行列であり、“1/2(QEx−1+Wx−1)”は、“Coeffx−1”を“QEx−1+Wx−1”で割った結果値を四捨五入するための値である。また、“Levelx−1”は、第x−1拡張階層量子化部により生成された第x−1拡張階層量子化レベルである。
Figure 0005547394
また、第x−1レベル推定部は、次の式(6)によって、第x−1拡張階層量子化部により生成された第x−1拡張階層量子化レベルと第x−1拡張階層の量子化ステップサイズと量子化行列との和を乗算することによって、第2変換部114により生成された周波数係数を復元する。次の式(6)で、“Levelx−1”は、第x−1拡張階層量子化部により生成された第x−1拡張階層量子化レベルであり、“QEx−1”は、第x−1拡張階層の量子化ステップサイズであり、“Wx−1”は、第x−1拡張階層の量子化行列であり、“recCoeffx−1”は、第x−1レベル推定部により復元された周波数係数である。
Figure 0005547394
次いで、第x−1レベル推定部は、次の式(7)によってこのように復元された周波数係数を、第x拡張階層の量子化ステップサイズと量子化行列との和で割り、その結果を整数値に近似化する。次の式(7)で“recCoeffx−1”は、第x−1レベル推定部により復元された周波数係数であり、“QEx”は、第x拡張階層の量子化ステップサイズであり、“W”は、第x拡張階層の量子化行列であり、“1/2(QEx+W)”は、“recCoeffx−1”を“QEx+W”で割った結果値を四捨五入するための値である。また、“estLevel”は、第x−1レベル推定部により推定された第x拡張階層量子化レベルである。
Figure 0005547394
前記例での第x−1レベル減算器は、量子化パラメータが量子化ステップサイズと量子化行列との積と定義される例と同一であるので、これについての説明は省略する。前記のような階層的符号化方式は、拡張階層のうち最上位階層の第N階層まで反復的に適用される。したがって、図4に示した構成要素のうち説明されていない構成要素、例えば、第N拡張階層量子化部121、第N拡張階層エントロピー符号化部124、第N−1レベル推定部122、第N−1レベル減算器123などについてはその説明を省略する。ただし、各拡張階層の量子化パラメータは相異なる値になりうる。特に、本実施形態では上位階層へ行くほど高画質の映像を提供せねばならないため、上位階層へ行くほど量子化ステップサイズは減少し、量子化行列の元素値全体または一部が減少する。
図5は、本発明の一実施形態による量子化行列を示す図である。第2変換部114により生成された周波数係数の行列それぞれの左側上段は、人間の視覚に敏感な低周波数領域であり、この行列それぞれの右側下段は、人間の視覚に鈍感な高周波数領域である。図5を参照するに、量子化行列は、左側上段へ行くほどさらに小さな値が配されており、右側下段へ行くほどさらに大きい値が配されていることが分かる。量子化ステップサイズは、映像データの全体的なサイズ減少を決定する値である一方、量子化行列は、人間の視覚に敏感な低周波数領域に対してはさらに小さな値を配し、人間の視覚に鈍感な高周波数領域に対してはさらに大きい値を配することによって、人間の視覚特性を反映した映像の周波数係数別サイズ減少を決定する値である。
特に、図5に示した量子化行列は、上位階層へ行くほど左側上段の元素値を減少させ、右側下段の元素値をそのまま維持する方式で設計された。これにより、上位階層は、下位階層より人間の視覚特性にさらに充実な画質を提供できるようになる。また、当業者ならば、人間の視覚特性を考慮して、図5に示した形態の量子化行列以外に多様な形態の量子化行列を容易に設計できるということを理解できるであろう。
ビットストリーム生成部125は、エントロピー符号化部107により生成された基本階層ビットストリームと、第1拡張階層エントロピー符号化部116及び第N拡張階層エントロピー符号化部124により生成された拡張階層ビットストリームとを組み合わせすることで、スケーラブルビットストリームを生成する。
図6は、本発明の一実施形態による映像復号化装置200の構成図である。図6を参照するに、本実施形態による映像符号化装置は、ビットストリームパーザ201、エントロピー符号化部202、逆量子化部203、第1逆変換部204、動き補償部205、第1加算器206、バッファ207、アップサンプラー208、第1拡張階層エントロピー復号化部209、第2拡張階層エントロピー復号化部211及び第N拡張階層エントロピー復号化部215、第1拡張階層逆量子化部210、第2拡張階層逆量子化部214−第N拡張階層逆量子化部218、第1レベル推定部212及び第N−1レベル推定部216、第1レベル加算器213及び第N−1レベル加算器217、第2逆変換部219及び第2加算器220で構成される。図6に示した映像復号化装置200の映像復元過程は、図4に示した映像符号化装置100の映像復元過程と同一である。したがって、以下省略された内容であっても、図4に示した動映像符号化装置100に関して以上で記述された内容は、本実施形態による動映像復号化装置200にも適用される。
ビットストリームパーザ201は、図4に示した映像符号化装置100から伝送されたスケーラブルビットストリームをパージングすることで、このスケーラブルビットストリームから基本階層ビットストリーム及び拡張階層ビットストリームを抽出する。
エントロピー符号化部202は、ビットストリームパーザ201により抽出された基本階層ビットストリームをエントロピー復号化することによって、基本映像と予測映像間のレジデュー映像(以下、“第1レジデュー映像”という)の量子化レベルと映像復号化のための情報などを復元する。逆量子化部203は、エントロピー符号化部202により復元された量子化レベルを逆量子化することで、第1レジデュー映像の周波数係数を復元する。第1逆変換部204は、逆量子化部203により復元された周波数係数を、周波数空間から色空間に変換することによって第1レジデュー映像を復元する。
動き補償部205は、バッファ207に保存された参照映像のうち少なくとも一つの参照映像基準の基本映像の動き推定を利用して、少なくとも一つの参照映像から基本映像の予測映像を生成する。より詳細に説明すれば、動き補償部103は、エントロピー符号化部202に復元された映像復号化のための情報のうち、基本映像のブロックそれぞれの動きベクトルが指示する少なくとも一つの参照映像のブロック値を基本映像のブロック値として決定することによって、基本映像の予測映像を生成する。第1加算器206は、動き補償部205により生成された予測映像に、逆変換部204により復元された第1レジデュー映像を加えることによって基本映像の復元映像を生成し、この復元映像をバッファ207に保存する。
アップサンプラー208は、加算器110により生成された復元映像をアップサンプリングする。第1拡張階層エントロピー復号化部209は、ビットストリームパーザ201により抽出された第1拡張階層ビットストリームをエントロピー復号化することによって、原本映像とアップサンプラー208によりアップサンプリングされた復元映像間のレジデュー映像(以下、“第2レジデュー映像”という)の第1拡張階層量子化レベルを復元する。第1拡張階層逆量子化部210は、第1拡張階層エントロピー復号化部209により復元された第1拡張階層量子化レベルを、第1量子化パラメータを利用して逆量子化することで、第2レジデュー映像の第1拡張階層周波数係数を復元する。第2拡張階層エントロピー復号化部211は、ビットストリームパーザ201により抽出された第2拡張階層ビットストリームをエントロピー復号化することによって、第2レジデュー映像の第2拡張階層量子化レベルとこの第2拡張階層量子化レベルとの推定値の差値を復元する。
第1レベル推定部212は、第1拡張階層エントロピー復号化部209により復元された第1拡張階層量子化レベルから、第2拡張階層エントロピー復号化部211により復元される第2拡張階層量子化レベルを推定する。より詳細に説明すれば、第1レベル推定部212は、第1拡張階層エントロピー復号化部209により復元された第1拡張階層量子化レベルを、第1拡張階層量子化パラメータを利用して逆量子化することで第2レジデュー映像の第1拡張階層周波数係数を復元し、この第1拡張階層周波数係数を、第2拡張階層量子化パラメータを利用して量子化することで、第2拡張階層エントロピー復号化部211により復元される第2拡張階層量子化レベルを推定する。すなわち、第2拡張階層量子化パラメータを利用して量子化された結果が、第2拡張階層量子化レベルの推定値である。
第1レベル加算器213は、第1レベル推定部212により推定された第2拡張階層量子化レベルに、第2拡張階層エントロピー復号化部211により復元された差値を加算することによって第2レジデュー映像の第2拡張階層量子化レベルを復元する。第2拡張階層逆量子化部214は、第1レベル加算器213により復元された第2拡張階層量子化レベルを、第2拡張階層量子化パラメータを利用して逆量子化することで第2レジデュー映像の第2拡張階層周波数係数を復元する。
以上では、本実施形態のうち、第1拡張階層及び第2拡張階層に関する部分を説明した。以下では、本実施形態による量子化パラメータについての具体的な例を挙げて、第1拡張階層及び第2拡張階層を第x−1拡張階層及び第x拡張階層に一般化させて説明する。また、第x−1拡張階層及び第x拡張階層に該当する構成要素については、図6の複雑度を低めるために、この構成要素についての図示は省略する。
本実施形態によれば、第1拡張階層量子化パラメータは、第1拡張階層の量子化ステップサイズと量子化行列との積と定義できる。この場合、第x−1レベル推定部は、前記式(2)によって、第x−1拡張階層エントロピー符号化部により復元された第x−1拡張階層量子化レベルと、第x−1拡張階層の量子化ステップサイズと量子化行列との積とを乗算することによって、第2レジデュー映像の第x−1拡張階層周波数係数を復元する。次いで、第x−1レベル推定部は、前記式(3)によってこのように復元された第x−1拡張階層周波数係数を、第x拡張階層の量子化ステップサイズと量子化行列との積で割り、その結果を整数値に近似化する。
また、第x−1レベル加算器は、次の式(8)によって、第x−1レベル推定部により推定された第x拡張階層量子化レベルに、第x拡張階層エントロピー符号化部により復元された差値を加算することによって、第2レジデュー映像の第x拡張階層量子化レベルを復元する。次の式(8)で“estLevelx−1”は、第x−1レベル推定部により推定された第x拡張階層量子化レベルであり、“resLevel”は、第2レジデュー映像の第x拡張階層量子化レベルとこの第x拡張階層量子化レベルとの推定値の差値であり、“recLevel”は、第x−1レベル加算器により復元された第x拡張階層量子化レベルである。
Figure 0005547394
また、第x階層逆量子化部は、次の式(9)によって第x−1レベル加算器により復元された第x拡張階層量子化レベルと、第x拡張階層の量子化ステップサイズと量子化行列との積とを乗算することによって、第2レジデュー映像の第x拡張階層周波数係数を復元する。次の式(9)で“recLevel”は、第x−1レベル加算器により復元された第x拡張階層量子化レベルであり、“QEx”は、第x拡張階層の量子化ステップサイズであり、“W”は、第x拡張階層の量子化行列であり、“recCoeff”は、第x−1レベル逆量子化部により復元された第x拡張階層周波数係数である。
Figure 0005547394
そうでなければ、第1拡張階層量子化パラメータは、第1拡張階層の量子化ステップサイズと量子化行列との和とも定義できる。この場合、第x−1レベル推定部は、前記式(6)によって、第x−1拡張階層エントロピー符号化部により復元された第x−1拡張階層量子化レベルと、第x−1拡張階層の量子化ステップサイズと量子化行列との和とを乗算することによって、第2レジデュー映像の第x−1拡張階層周波数係数を復元する。次いで、第x−1レベル推定部は、前記式(7)によってこのように復元された第x−1拡張階層周波数係数を、第x拡張階層の量子化ステップサイズと量子化行列との和で割り、その結果を整数値に近似化する。
前記の例での第x−1レベル加算器は、量子化パラメータが、量子化ステップサイズと量子化行列との積と定義される例と同一であるので、これについての説明は省略する。また、第x階層逆量子化部は、次の式(10)によって第x−1レベル加算器により復元された第x拡張階層量子化レベルと、第x拡張階層の量子化ステップサイズと量子化行列との和とを乗算することによって、第2レジデュー映像の第x拡張階層周波数係数を復元する。次の式(10)で“recLevel”は、第x−1レベル加算器により復元された第x拡張階層量子化レベルであり、“QEx”は、第x拡張階層の量子化ステップサイズであり、“W”は、第x拡張階層の量子化行列であり、“recCoeff”は、第x−1レベル逆量子化部により復元された第x拡張階層周波数係数である。
Figure 0005547394
前記のような階層的復号化方式は、拡張階層のうち最上位階層である第N階層まで反復的に適用されうる。したがって、図5に示した構成要素のうち、説明されていない構成要素、例えば、第N拡張階層エントロピー復号化部215、第N拡張階層逆量子化部218、第N−1レベル推定部216、第N−1レベル加算器217については、その説明を省略する。ただし、各拡張階層の量子化パラメータは相異なる値になりうる。上位階層へ行くほど量子化ステップサイズは減少し、量子化行列の元素値全体または一部が減少するという点は、図4に示した映像符号化装置100の場合と同一である。また、図5に示した量子化行列も本実施形態にそのまま適用される。
第2逆変換部219は、第1拡張階層逆量子化部210及び第N拡張階層逆量子化部218での逆量子化結果に該当する拡張階層周波数係数のうち、最高順位の拡張階層の周波数係数を周波数空間から色空間に変換することによって拡張階層レジデュー映像を復元する。例えば、第1拡張階層逆量子化部210及び第N拡張階層逆量子化部218での逆量子化結果に該当する拡張階層周波数係数のうち、最高順位の拡張階層が第3拡張階層ならば、第2逆変換部219は、第3拡張階層周波数係数を周波数空間から色空間に変換することによって拡張階層レジデュー映像を復元する。第1拡張階層逆量子化部210及び第N拡張階層逆量子化部218での逆量子化結果に該当する拡張階層周波数係数のうち、最高順位の拡張階層が第3拡張階層になる場合は、代表的に次の2つを挙げることができる。
まず、図4に示した映像符号化装置100から伝送されたスケーラブルビットストリームが、基本階層ビットストリームから第3拡張階層ビットストリームまで、またはそれ以上の上位拡張階層ビットストリームまで含んでいるが、第N拡張階層逆量子化部218が第3拡張階層逆量子化部である場合がこれに該当する。次いで、第N拡張階層逆量子化部218が、第3拡張階層またはそれ以上の上位拡張階層の逆量子化部や、図4に示した映像符号化装置100から伝送されたスケーラブルビットストリームが、基本階層ビットストリームから第3拡張階層ビットストリームまで含んでいる場合もここに該当する。
このように場合、第2逆変換部219での逆変換の対象にならない第1拡張階層周波数係数及び第2拡張階層周波数係数は、第1拡張階層逆量子化部210及び第2拡張階層逆量子化部214により復元される必要がないということが分かる。したがって、第2逆変換部219が常に第3拡張階層以上の順位の拡張階層の周波数係数を逆変換する環境ならば、第1拡張階層逆量子化部210及び第2拡張階層逆量子化部214は、映像復号化装置200の構成要素から除外されるように設計されうる。さらに、第2逆変換部219が常に最上位階層である第N拡張階層の周波数係数を逆変換する環境ならば、第1拡張階層逆量子化部210から第N−1拡張階層逆量子化部までは、映像復号化装置200の構成要素から除外されるように設計されうる。
第2加算器220は、アップサンプラー208によりアップサンプリングされた復元映像に、第2逆変換部219により復元された拡張階層レジデュー映像を加えることによって、原本映像の復元映像を生成する。
図7は、本発明の他の実施形態による映像符号化装置300の構成図である。図7を参照するに、本実施形態による映像符号化装置は、ダウンサンプラー301、第1動き推定部302、第1動き補償部303、第1減算器304、第1変換部305、量子化部306、エントロピー符号化部307、第1逆量子化部308、第1逆変換部309、第1加算器310、第1バッファ311、アップサンプラー312、第2減算器313、第2動き推定部314、第2動き補償部315、第3減算器316、第2変換部317、第1拡張階層量子化部318、第2拡張階層量子化部320、第N拡張階層量子化部324、第1拡張階層エントロピー符号化部319、第2拡張階層エントロピー符号化部323−第N拡張階層エントロピー符号化部327、第1レベル推定部321、第N−1レベル推定部325、第1レベル減算器322、第N−1レベル減算器326、第2逆量子化部328、第2逆変換部329、第2加算器330、第2バッファ331及びビットストリーム生成部332で構成される。
図7に示した映像符号化装置300は、図4に示した映像符号化装置100に、第1拡張階層のインター符号化に関連した構成要素が追加されたことを除いては、映像符号化装置100と同一である。したがって、以下省略された内容であっても、図4に示した映像符号化装置100に関して以上で記述された内容は、本実施形態による映像符号化装置300にも適用される。
ダウンサンプラー301は、動映像を構成する原本映像中映像符号化装置300に現在入力された原本映像をダウンサンプリングすることで基本映像を生成する。第1動き推定部302は、第1バッファ311に保存された参照映像のうち少なくとも一つの参照映像を基準に、ダウンサンプラー301により生成された基本映像の動きを推定する。第1動き補償部303は、第1動き推定部302による基本映像の動き推定を利用して、第1バッファ311に保存された参照映像のうち少なくとも一つの参照映像から基本映像の予測映像を生成する。
第1減算器304は、基本映像から第1動き補償部303により生成された予測映像を減算することで、基本映像と予測映像間のレジデュー映像(以下、“第1レジデュー映像”という)を生成する。第1変換部305は、第1減算器304により生成された第1レジデュー映像を、色空間から周波数空間に変換することによって第1レジデュー映像の周波数係数を生成する。量子化部306は、第1変換部305により生成された周波数係数を量子化することで第1レジデュー映像の量子化レベルを生成する。エントロピー符号化部307は、量子化部306により生成された量子化レベルをエントロピー符号化することによって基本階層ビットストリームを生成する。
第1逆量子化部308は、量子化部306により生成された量子化レベルを逆量子化することで第1レジデュー映像の周波数係数を復元する。第1逆変換部309は、第1逆量子化部308により復元された周波数係数を、周波数空間から色空間に変換することによって第1レジデュー映像を復元する。第1加算器310は、第1動き補償部303により生成された予測映像に、逆変換部309により復元された第1レジデュー映像を加えることによって基本映像の復元映像を生成し、この復元映像を第1バッファ311に保存する。
アップサンプラー312は、第1加算器310により生成された復元映像をアップサンプリングする。第2減算器313は、動映像を構成する原本映像のうち、映像符号化装置300に現在入力された原本映像から、アップサンプラー312によりアップサンプリングされた復元映像を減算することで、原本映像とアップサンプラー312によりアップサンプリングされた復元映像間のレジデュー映像(以下、“第2レジデュー映像”という)を生成する。
第2動き推定部314は、第2バッファ331に保存された参照映像のうち少なくとも一つの参照映像を基準に、第2減算器313により生成された第2レジデュー映像の動きを推定する。第2動き補償部315は、第2動き推定部314による第2レジデュー映像の動き推定を利用して、第2バッファ331に保存された参照映像のうち少なくとも一つの参照映像から第2レジデュー映像の予測映像を生成する。第3減算器316は、第2減算器313により生成された第2レジデュー映像から、第2動き補償部315により生成された予測映像を減算することで、第2レジデュー映像と予測映像間のレジデュー映像(以下、“第3レジデュー映像”という)を生成する。より詳細に説明すれば、第3減算器316は、第2レジデュー映像の各ブロックから、各ブロックの動きベクトルが指示する少なくとも一つの予測映像のブロックを減算する。第2変換部317は、第3減算器316により生成された第3レジデュー映像を、色空間から周波数空間に変換することによって第3レジデュー映像の周波数係数を生成する。
第1拡張階層量子化部318は、第2変換部317により生成された周波数係数を、第1拡張階層量子化パラメータを利用して量子化することで、第3レジデュー映像の第1拡張階層量子化レベルを生成する。第1拡張階層エントロピー符号化部319は、第1拡張階層量子化部318により生成された第1拡張階層量子化レベルをエントロピー符号化することによって、第1拡張階層ビットストリームを生成する。第2拡張階層量子化部320は、第2変換部317により生成された周波数係数を、第2拡張階層量子化パラメータを利用して量子化することで、第3レジデュー映像の第2拡張階層量子化レベルを生成する。
第1レベル推定部321は、第1拡張階層量子化部318により生成された第1拡張階層量子化レベルから、第2拡張階層量子化部320により生成される第2拡張階層量子化レベルを推定する。第1レベル減算器322は、第2拡張階層量子化部320により生成された第2拡張階層量子化レベルから、第1レベル推定部321により推定された第2拡張階層量子化レベルを減算することで、第2拡張階層量子化部320により生成された第2拡張階層量子化レベルと、第1レベル推定部321により推定された第2拡張階層量子化レベル間の差値を生成する。第2拡張階層エントロピー符号化部323は、第1レベル減算器322により生成された差値をエントロピー符号化することによって、第2拡張階層ビットストリームを生成する。
第2逆量子化部328は、第1拡張階層量子化部318により生成された第1拡張階層量子化レベルを逆量子化することで、第3レジデュー映像の第1拡張階層周波数係数を復元する。第2逆変換部329は、第2逆量子化部328により復元された第1拡張階層周波数係数を、周波数空間から色空間に変換することによって第3レジデュー映像を復元する。第2加算器330は、第2動き補償部315により生成された予測映像に、第2逆変換部329により復元された第3レジデュー映像を加えることによって第2レジデュー映像の復元映像を生成し、この復元映像を第2バッファ331に保存する。
ビットストリーム生成部332は、エントロピー符号化部307により生成された基本階層ビットストリームと、第1拡張階層エントロピー符号化部319及び第N拡張階層エントロピー符号化部327により生成された拡張階層ビットストリームとを組み合わせすることで、スケーラブルビットストリームを生成する。
図8は、本発明の他の実施形態による映像復号化装置400の構成図である。図8を参照するに、本実施形態による映像復号化装置400は、ビットストリームパーザ401、エントロピー符号化部402、逆量子化部403、第1逆変換部404、第1動き補償部405、第1加算器406、第1バッファ407、アップサンプラー408、第1拡張階層エントロピー復号化部409、第2拡張階層エントロピー復号化部411、第N拡張階層エントロピー復号化部415、第1拡張階層逆量子化部410、第2拡張階層逆量子化部414及び第N拡張階層逆量子化部418、第1レベル推定部412及び第N−1レベル推定部416、第1レベル加算器413及び第N−1レベル加算器417、第2逆変換部419、第2動き補償部420、第2加算器421、第2バッファ422、第3加算器424及び第4加算器425で構成される。
図8に示した映像復号化装置400は、図7に示した映像復号化装置200に第1拡張階層のインター復号化に関連した構成要素が追加されたことを除いて、映像復号化装置200と同一である。したがって、以下で省略された内容であっても、図6に示した映像復号化装置200に関して以上で記述された内容は、本実施形態による映像復号化装置400にも適用される。
ビットストリームパーザ401は、図7に示した映像符号化装置300から伝送されたスケーラブルビットストリームをパージングすることで、このスケーラブルビットストリームから基本階層ビットストリーム及び拡張階層ビットストリームを抽出する。エントロピー符号化部402は、ビットストリームパーザ401により抽出された基本階層ビットストリームをエントロピー復号化することによって、基本映像と予測映像間のレジデュー映像(以下、“第1レジデュー映像”という)の量子化レベルと映像復号化のための情報などを復元する。逆量子化部403は、エントロピー符号化部402により復元された量子化レベルを逆量子化することで、第1レジデュー映像の周波数係数を復元する。第1逆変換部404は、逆量子化部403により復元された周波数係数を、周波数空間から色空間に変換することによって第1レジデュー映像を復元する。
第1動き補償部405は、第1バッファ407に保存された参照映像のうち、少なくとも一つの参照映像基準の基本映像の動き推定を利用して、少なくとも一つの参照映像から基本映像の予測映像を生成する。第1加算器406は、第1動き補償部405により生成された予測映像に、第1逆変換部404により復元された第1レジデュー映像を加えることによって、基本映像の復元映像を生成し、この復元映像を第1バッファ407に保存する。
アップサンプラー408は、加算器110により生成された復元映像をアップサンプリングする。第1拡張階層エントロピー復号化部409は、ビットストリームパーザ401により抽出された第1拡張階層ビットストリームをエントロピー符号化することによって、原本映像とアップサンプラー408によりアップサンプリングされた復元映像間のレジデュー映像(以下、“第2レジデュー映像”という)と、予測映像間のレジデュー映像(以下、“第3レジデュー映像”という)との第1拡張階層量子化レベルを復元する。第1拡張階層逆量子化部410は、第1拡張階層エントロピー復号化部409により復元された第1拡張階層量子化レベルを、第1拡張階層量子化パラメータを利用して逆量子化することで、第3レジデュー映像の第1拡張階層周波数係数を復元する。第2拡張階層エントロピー復号化部411は、ビットストリームパーザ401により抽出された第2拡張階層ビットストリームをエントロピー符号化することによって、第3レジデュー映像の第2拡張階層量子化レベルとこの第2拡張階層量子化レベルとの推定値の差値を復元する。
第1レベル推定部412は、第1拡張階層エントロピー復号化部409により復元された第1拡張階層量子化レベルから、第2拡張階層エントロピー復号化部411により復元される第2拡張階層量子化レベルを推定する。より詳細に説明すれば、第1レベル推定部412は、第1拡張階層エントロピー復号化部409により復元された第1拡張階層量子化レベルを、第1拡張階層量子化パラメータを利用して逆量子化することで、第3レジデュー映像の周波数係数を復元し、この周波数係数を、第2拡張階層量子化パラメータを利用して量子化することで、第2拡張階層エントロピー復号化部411により復元される第2拡張階層量子化レベルを推定する。
第1レベル加算器413は、第1レベル推定部412により推定された第2拡張階層量子化レベルに、第2拡張階層エントロピー復号化部411により復元された差値を加算することによって、第3レジデュー映像の第2拡張階層量子化レベルを復元する。第2拡張階層逆量子化部414は、第1レベル加算器413により復元された第2拡張階層量子化レベルを、第2拡張階層量子化パラメータを利用して逆量子化することで、第3レジデュー映像の第2拡張階層周波数係数を復元する。
第2逆変換部419は、第1拡張階層逆量子化部410により復元された第1拡張階層周波数係数を、周波数空間から色空間に変換することによって第3レジデュー映像を復元する。第2動き補償部420は、第2バッファ422に保存された参照映像のうち少なくとも一つの参照映像基準の第2レジデュー映像の動き推定を利用して、少なくとも一つの参照映像から第2レジデュー映像の予測映像を生成する。第2加算器421は、第2動き補償部420により生成された予測映像に、第2逆変換部419により復元された第3レジデュー映像を加えることによって第2レジデュー映像の復元映像を生成し、この復元映像を第2バッファ422に保存する。
第3逆変換部423は、第2拡張階層逆量子化部414及び第N拡張階層逆量子化部418での逆量子化結果に該当する拡張階層周波数係数のうち、最高順位の拡張階層の周波数係数を、周波数空間から色空間に変換することによって拡張階層レジデュー映像を復元する。第3加算器424は、第2加算器421により生成された復元映像に、第2逆変換部419により復元された拡張階層レジデュー映像を加えることによって、さらに高画質の第2レジデュー映像の復元映像を生成する。第4加算器425は、アップサンプラー408によりアップサンプリングされた復元映像に、第3加算器424により生成された復元映像を加えることによって原本映像の復元映像を生成する。
図9は、本発明のさらに他の実施形態による映像符号化装置500の構成図である。図9を参照するに、本実施形態による映像符号化装置は、ダウンサンプラー501、第1動き推定部502、第1動き補償部503、第1減算器504、第1変換部505、量子化部506、エントロピー符号化部507、第1逆量子化部508、第1逆変換部509、第1加算器510、第1バッファ511、アップサンプラー512、第2減算器513、第2動き推定部514、第2動き補償部515、第3減算器516、第2変換部517、第1拡張階層量子化部518、第1拡張階層エントロピー符号化部519、第2逆量子化部520、第2逆変換部521、第2加算器522、第2バッファ523、第3動き推定部524、第3動き補償部525、第4減算器526、第3変換部527、第2拡張階層量子化部528、第1レベル推定部529、第1レベル減算器530、第2拡張階層エントロピー符号化部531、第3逆量子化部532、第3逆変換部533、第3加算器534及び第3バッファ535で構成される。
図9に示した映像符号化装置500は、図7に示した映像符号化装置300に第1拡張階層以外の他の拡張階層のインター符号化に関連した構成要素が追加されたことを除いて、映像符号化装置300と同一である。したがって、以下省略された内容であっても、図7に示した映像符号化装置300に関して以上で記述された内容は、本実施形態による映像符号化装置500にも適用される。特に、図9の複雑度を低めるために、第3拡張階層以上の上位階層についての図示は省略したが、第3拡張階層以上の上位階層にも以下に記述される内容が同じく適用されうる。
ダウンサンプラー501は、動映像を構成する原本映像のうち、映像符号化装置500に現在入力された原本映像をダウンサンプリングすることで基本映像を生成する。第1動き推定部502は、第1バッファ511に保存された参照映像のうち少なくとも一つの参照映像を基準に、ダウンサンプラー501により生成された基本映像の動きを推定する。第1動き補償部503は、第1動き推定部502による基本映像の動き推定を利用して、第1バッファ511に保存された参照映像のうち少なくとも一つの参照映像から基本映像の予測映像を生成する。
第1減算器504は、基本映像から、第1動き補償部503により生成された予測映像を減算することで、基本映像と予測映像間のレジデュー映像(以下、“第1レジデュー映像”という)を生成する。第1変換部505は、第1減算器504により生成された第1レジデュー映像を、色空間から周波数空間に変換することによって、第1レジデュー映像の周波数係数を生成する。量子化部506は、第1変換部505により生成された周波数係数を量子化することで、第1レジデュー映像の量子化レベルを生成する。エントロピー符号化部507は、量子化部506により生成された量子化レベルをエントロピー符号化することによって、基本階層ビットストリームを生成する。
第1逆量子化部508は、量子化部506により生成された量子化レベルを逆量子化することで、第1レジデュー映像の周波数係数を復元する。第1逆変換部509は、第1逆量子化部508により復元された周波数係数を、周波数空間から色空間に変換することによって第1レジデュー映像を復元する。第1加算器510は、第1動き補償部503により生成された予測映像に、第1逆変換部509により復元された第1レジデュー映像を加えることによって基本映像の復元映像を生成し、この復元映像を第1バッファ511に保存する。
アップサンプラー512は、第1加算器510により生成された復元映像をアップサンプリングする。第2減算器513は、動映像を構成する原本映像のうち、映像符号化装置500に現在入力された原本映像から、アップサンプラー512によりアップサンプリングされた復元映像を減算することで、原本映像とアップサンプラー512によりアップサンプリングされた復元映像間のレジデュー映像(以下、“第2レジデュー映像”という)を生成する。
第2動き推定部514は、第2バッファ523に保存された参照映像のうち少なくとも一つの参照映像を基準に、第2減算器513により生成された第2レジデュー映像の動きを推定する。第2動き補償部515は、第2動き推定部514による第2レジデュー映像の動き推定を利用して、第2バッファ523に保存された参照映像のうち少なくとも一つの参照映像から、第2レジデュー映像の予測映像を生成する。第3減算器516は、第2減算器513により生成された第2レジデュー映像から、第2動き補償部515により生成された予測映像を減算することで、第2レジデュー映像と予測映像間のレジデュー映像(以下、“第3レジデュー映像”という)を生成する。第2変換部517は、第3減算器516により生成された第3レジデュー映像を、色空間から周波数空間に変換することによって第3レジデュー映像の周波数係数を生成する。
第1拡張階層量子化部518は、第2変換部517により生成された周波数係数を、第1拡張階層量子化パラメータを利用して量子化することで、第3レジデュー映像の第1拡張階層量子化レベルを生成する。第1拡張階層エントロピー符号化部519は、第1拡張階層量子化部518により生成された第1拡張階層量子化レベルをエントロピー符号化することによって、第1拡張階層ビットストリームを生成する。
第2逆量子化部520は、第1拡張階層量子化部518により生成された第1拡張階層量子化レベルを逆量子化することで、第3レジデュー映像の第1拡張階層周波数係数を復元する。第2逆変換部521は、第2逆量子化部520により復元された第1拡張階層周波数係数を周波数空間から色空間に変換することによって、第3レジデュー映像を復元する。第2加算器522は、第2動き補償部515により生成された予測映像に、第2逆変換部521により復元された第3レジデュー映像を加えることによって、第2レジデュー映像の復元映像を生成し、この復元映像を第2バッファ523に保存する。
第3動き推定部524は、第3バッファ535に保存された参照映像のうち少なくとも一つの参照映像を基準に、第2減算器513により生成された第2レジデュー映像の動きを推定する。第3動き補償部525は、第3動き推定部524による第2レジデュー映像の動き推定を利用して、第3バッファ535に保存された参照映像のうち少なくとも一つの参照映像から、第2レジデュー映像の予測映像を生成する。第4減算器526は、第2減算器513により生成された第2レジデュー映像から、第3動き補償部525により生成された予測映像を減算することで、第3レジデュー映像を生成する。第3変換部527は、第4減算器526により生成された第3レジデュー映像を、色空間から周波数空間に変換することによって、第3レジデュー映像の周波数係数を生成する。
第2拡張階層量子化部528は、第3変換部527により生成された周波数係数を、第2拡張階層量子化パラメータを利用して量子化することで、第3レジデュー映像の第2拡張階層量子化レベルを生成する。第1レベル推定部529は、第1拡張階層量子化部518により生成された第1拡張階層量子化レベルから、第2拡張階層量子化部528により生成される第2拡張階層量子化レベルを推定する。第1レベル減算器530は、第2拡張階層量子化部528により生成された第2拡張階層量子化レベルから、第1レベル推定部529により推定された第2拡張階層量子化レベルを減算することで、第2拡張階層量子化部528により生成された第2拡張階層量子化レベルと、第1レベル推定部529により推定された第2拡張階層量子化レベル間の差値とを生成する。第2拡張階層エントロピー符号化部531は、第1レベル減算器530により生成された差値をエントロピー符号化することによって、第2拡張階層ビットストリームを生成する。
第3逆量子化部532は、第2拡張階層量子化部528により生成された第2拡張階層量子化レベルを逆量子化することで、第3レジデュー映像の第2拡張階層周波数係数を復元する。第3逆変換部533は、第3逆量子化部532により復元された第2拡張階層周波数係数を、周波数空間から色空間に変換することによって第3レジデュー映像を復元する。第3加算器534は、第3動き補償部525により生成された予測映像に、第3逆変換部533により復元された第3レジデュー映像を加えることによって、第2レジデュー映像の復元映像を生成し、この復元映像を第3バッファ535に保存する。
ビットストリーム生成部552は、エントロピー符号化部507により生成された基本階層ビットストリームと、第1拡張階層エントロピー符号化部519及び第2拡張階層エントロピー符号化部531により生成された拡張階層ビットストリームとを組み合わせすることで、スケーラブルビットストリームを生成する。
図10は、本発明の実施形態による映像復号化装置600の構成図である。図10を参照するに、本実施形態による映像復号化装置600は、ビットストリームパーザ601、エントロピー符号化部602、逆量子化部603、第1逆変換部604、第1動き補償部605、第1加算器606、第1バッファ607、アップサンプラー608、第1拡張階層エントロピー復号化部609、第1拡張階層逆量子化部610、第2逆変換部611、第2動き補償部612、第2加算器613、第2バッファ614、第2拡張階層エントロピー復号化部615、第1レベル推定部616、第1レベル加算器617、第2拡張階層逆量子化部618、第3逆変換部619、第3動き補償部620、第3加算器621、第3バッファ622及び第4加算器623で構成される。
図10に示した映像復号化装置600は、図8に示した映像復号化装置400に、第1拡張階層以外の他の拡張階層のインター復号化に関連した構成要素が追加されたことを除いて、映像復号化装置400と同一である。したがって、以下省略された内容であっても、図8に示した映像復号化装置400に関して以上で記述された内容は、本実施形態による映像復号化装置600にも適用される。特に、図10の複雑度を低めるために、第3拡張階層以上の上位階層についての図示は省略したが、第3拡張階層以上の上位階層にも以下に記述される内容が同じく適用されうる。
ビットストリームパーザ601は、図9に示した映像符号化装置500から伝送されたスケーラブルビットストリームをパージングすることで、このスケーラブルビットストリームから基本階層ビットストリーム及び拡張階層ビットストリームを抽出する。エントロピー符号化部602は、ビットストリームパーザ601により抽出された基本階層ビットストリームをエントロピー復号化することによって、基本映像と予測映像間のレジデュー映像(以下、“第1レジデュー映像”という)の量子化レベルと映像復号化のための情報などを復元する。逆量子化部603は、エントロピー符号化部602により復元された量子化レベルを逆量子化することで、第1レジデュー映像の周波数係数を復元する。第1逆変換部604は、逆量子化部603により復元された周波数係数を、周波数空間から色空間に変換することによって第1レジデュー映像を復元する。
第1動き補償部605は、第1バッファ607に保存された参照映像のうち、少なくとも一つの参照映像基準の基本映像の動き推定を利用して、少なくとも一つの参照映像から基本映像の予測映像を生成する。第1加算器606は、第1動き補償部605により生成された予測映像に、第1逆変換部604により復元された第1レジデュー映像を加えることによって基本映像の復元映像を生成し、この復元映像を第1バッファ607に保存する。
アップサンプラー608は、加算器110により生成された復元映像をアップサンプリングする。第1拡張階層エントロピー復号化部609は、ビットストリームパーザ601により抽出された第1拡張階層ビットストリームをエントロピー符号化することによって、原本映像とアップサンプラー608によりアップサンプリングされた復元映像間のレジデュー映像(以下、“第2レジデュー映像”という)と、予測映像間のレジデュー映像(以下、“第3レジデュー映像”という)との第1拡張階層量子化レベルを復元する。第1拡張階層逆量子化部610は、第1拡張階層エントロピー復号化部609により復元された第1拡張階層量子化レベルを、第1拡張階層量子化パラメータを利用して逆量子化することで、第3レジデュー映像の第1拡張階層周波数係数を復元する。
第2逆変換部611は、第1拡張階層逆量子化部610により復元された第1拡張階層周波数係数を、周波数空間から色空間に変換することによって第3レジデュー映像を復元する。第2動き補償部612は、第2バッファ614に保存された参照映像のうち、少なくとも一つの参照映像基準の第2レジデュー映像の動き推定を利用して、少なくとも一つの参照映像から第2レジデュー映像の予測映像を生成する。第2加算器613は、第2動き補償部612により生成された予測映像に、第2逆変換部611により復元された第3レジデュー映像を加えることによって第2レジデュー映像の復元映像を生成し、この復元映像を第2バッファ614に保存する。
第2拡張階層エントロピー復号化部615は、ビットストリームパーザ601により抽出された第2拡張階層ビットストリームをエントロピー符号化することによって、第3レジデュー映像の第2拡張階層量子化レベルと、この第2拡張階層量子化レベルとの推定値の差値を復元する。第1レベル推定部616は、第1拡張階層エントロピー復号化部609により復元された第1拡張階層量子化レベルから、第2拡張階層エントロピー復号化部615により復元される第2拡張階層量子化レベルを推定する。第1レベル加算器617は、第1レベル推定部616により推定された第2拡張階層量子化レベルに、第2拡張階層エントロピー復号化部615により復元された差値を加算することによって、第3レジデュー映像の第2拡張階層量子化レベルを復元する。第2拡張階層逆量子化部618は、第1レベル加算器617により復元された第2拡張階層量子化レベルを、第2拡張階層量子化パラメータを利用して逆量子化することで、第3レジデュー映像の第2拡張階層周波数係数を復元する。
第3逆変換部619は、第2拡張階層逆量子化部618により復元された第2拡張階層周波数係数を、周波数空間から色空間に変換することによって第3レジデュー映像を復元する。第3動き補償部620は、第3バッファ622に保存された参照映像のうち少なくとも一つの参照映像基準の第2レジデュー映像の動き推定を利用して、少なくとも一つの参照映像から第2レジデュー映像の予測映像を生成する。第3加算器621は、第3動き補償部620により生成された予測映像に、第3逆変換部619により復元された第3レジデュー映像を加えることによって、第2レジデュー映像の復元映像を生成し、この復元映像を第3バッファ622に保存する。
第4加算器623は、アップサンプラー608によりアップサンプリングされた復元映像に、第2加算器613により生成された復元映像及び第3加算器621により生成された復元映像のうち最高順位の拡張階層の復元映像、すなわち、第3加算器621により生成された復元映像を加えることによって、原本映像の復元映像を生成する。
図11は、本発明の一実施形態による映像符号化方法のフローチャートである。図11を参照するに、本実施形態による映像符号化方法は、図4に示した映像符号化装置100で時系列的に処理されるステップで構成される。したがって、以下省略された内容であっても、図4に示した映像符号化装置100に関して以上で記述された内容は、本実施形態による映像符号化方法にも適用される。特に、図11の複雑度を低めるために、図11には動映像を構成する原本映像のうちいずれか一つの原本映像の処理過程のみ図示されているが、図11に示した映像符号化方法は、動映像を構成する原本映像それぞれに反復的に適用される。
1001ステップで映像符号化装置100は、動映像を構成する原本映像のうち、映像符号化装置100に現在入力された原本映像をダウンサンプリングすることで基本映像を生成する。1002ステップで映像符号化装置100は、バッファ111に保存された参照映像のうち少なくとも一つの参照映像を基準に、ダウンサンプラー101により生成された基本映像の動きを推定し、この基本映像の動き推定を利用して、バッファ111に保存された参照映像のうち少なくとも一つの参照映像から基本映像の予測映像を生成する。
1003ステップで映像符号化装置100は、基本映像から、1002ステップで生成された予測映像を減算することで、基本映像と予測映像間のレジデュー映像(以下、“第1レジデュー映像”という)を生成する。1004ステップで映像符号化装置100は、1003ステップで生成された第1レジデュー映像を、色空間から周波数空間に変換することによって第1レジデュー映像の周波数係数を生成し、この周波数係数を量子化することで第1レジデュー映像の量子化レベルを生成する。1005ステップで映像符号化装置100は、1004ステップで生成された量子化レベルをエントロピー符号化することによって、基本階層ビットストリームを生成する。
1006ステップで映像符号化装置100は、1004ステップで生成された量子化レベルを逆量子化することで第1レジデュー映像の周波数係数を復元し、この周波数係数を、周波数空間から色空間に変換することによって第1レジデュー映像を復元し、1002ステップで生成された予測映像に復元された第1レジデュー映像を加えることによって基本映像の復元映像を生成し、この復元映像をバッファ111に保存する。
1007ステップで映像符号化装置100は、1006ステップで生成された復元映像をアップサンプリングする。1008ステップで映像符号化装置100は、動映像を構成する原本映像中映像符号化装置100に現在入力された原本映像から、1007ステップでアップサンプリングされた復元映像を減算することで、原本映像と、1007ステップでアップサンプリングされた復元映像間のレジデュー映像(以下、“第2レジデュー映像”という)を生成する。1009ステップで映像符号化装置100は、1008ステップで生成された第2レジデュー映像を、色空間から周波数空間に変換することによって第2レジデュー映像の周波数係数を生成する。
1010ステップで映像符号化装置100は、1009ステップで生成された周波数係数を、第1拡張階層量子化パラメータを利用して量子化することで、第2レジデュー映像の第1拡張階層量子化レベルを生成し、この第1拡張階層量子化レベルをエントロピー符号化することによって、第1拡張階層ビットストリームを生成する。また、1010ステップで映像符号化装置100は、1009ステップでより生成された周波数係数を、第2拡張階層量子化パラメータを利用して量子化することで、第2レジデュー映像の第2拡張階層量子化レベルを生成する。また、1010ステップで映像符号化装置100は、第1拡張階層量子化レベルから第2拡張階層量子化レベルを推定し、第2拡張階層量子化レベルと第2拡張階層量子化レベルとの推定値間の差値をエントロピー符号化することによって、第2拡張階層ビットストリームを生成する。前記1010ステップは、あらゆる拡張階層に対して反復的に適用される。
1011ステップで映像符号化装置100は、1005ステップで生成された基本階層ビットストリームと、1010ステップで生成された拡張階層ビットストリームとを組み合わせすることでスケーラブルビットストリームを生成する。
図12は、本発明の一実施形態による映像復号化方法のフローチャートである。図12を参照するに、本実施形態による映像復号化方法は、図6に示した映像復号化装置200で時系列的に処理されるステップで構成される。したがって、以下省略された内容であっても、図6に示した映像復号化装置200に関して以上で記述された内容は、本実施形態による映像復号化方法にも適用される。特に、図12の複雑度を低めるために、図12には、動映像を構成する原本映像のうちいずれか一つの原本映像の処理過程のみ図示されているが、図12に示した映像復号化方法は、動映像を構成する原本映像それぞれに反復的に適用される。
2001ステップで映像復号化装置200は、図4に示した映像符号化装置100から伝送されたスケーラブルビットストリームをパージングすることで、このスケーラブルビットストリームから基本階層ビットストリーム及び拡張階層ビットストリームを抽出する。
2002ステップで映像復号化装置200は、2001ステップで抽出された基本階層ビットストリームをエントロピー復号化することによって、基本映像と予測映像間のレジデュー映像(以下、“第1レジデュー映像”という)の量子化レベルと映像復号化のための情報などを復元し、この量子化レベルを逆量子化することで第1レジデュー映像の周波数係数を復元し、この周波数係数を周波数空間から色空間に変換することによって第1レジデュー映像を復元する。
2003ステップで映像復号化装置200は、バッファ207に保存された参照映像のうち少なくとも一つの参照映像基準の基本映像の動き推定を利用して、少なくとも一つの参照映像から基本映像の予測映像を生成する。2004ステップで映像復号化装置200は、2003ステップで生成された予測映像に、2002ステップで復元された第1レジデュー映像を加えることによって基本映像の復元映像を生成し、この復元映像をバッファ207に保存する。2005ステップで映像復号化装置200は、2004ステップで生成された復元映像をアップサンプリングする。
2006ステップで映像復号化装置200は、2001ステップで抽出された第1拡張階層ビットストリームをエントロピー復号化することによって、原本映像と2005ステップでアップサンプリングされた復元映像間のレジデュー映像(以下、“第2レジデュー映像”という)の第1拡張階層量子化レベルを復元し、この第1拡張階層量子化レベルを、第1拡張階層量子化パラメータを利用して逆量子化することで、第2レジデュー映像の第1拡張階層周波数係数を復元する。
また、2006ステップで映像復号化装置200は、2001ステップで抽出された第2拡張階層ビットストリームをエントロピー復号化することによって、第2レジデュー映像の第2拡張階層量子化レベルとこの第2拡張階層量子化レベルの推定値との差値を復元し、この第1拡張階層量子化レベルから、第2拡張階層エントロピー復号化部211により復元される第2拡張階層量子化レベルを推定し、第2拡張階層量子化レベルの推定値に復元された差値を加算することによって、第2レジデュー映像の第2拡張階層量子化レベルを復元する。また、2006ステップで映像復号化装置200は、復元された第2拡張階層量子化レベルを、第2拡張階層量子化パラメータを利用して逆量子化することで、第2レジデュー映像の第2拡張階層周波数係数を復元する。前記2006ステップは、あらゆる拡張階層に対して反復的に適用される。
2007ステップで映像復号化装置200は、2006ステップでの逆量子化結果に該当する拡張階層周波数係数のうち、最高順位の拡張階層周波数係数を、周波数空間から色空間に変換することによって拡張階層レジデュー映像を復元する。2008ステップで映像復号化装置200は、2005ステップでアップサンプリングされた復元映像に、2007ステップで復元された拡張階層レジデュー映像を加えることによって原本映像の復元映像を生成する。
図13は、本発明の他の実施形態による映像符号化方法のフローチャートである。図13を参照するに、本実施形態による映像符号化方法は、図7に示した映像符号化装置300で時系列的に処理されるステップで構成される。したがって、以下省略された内容であっても、図7に示した映像符号化装置300に関して以上で記述された内容は、本実施形態による映像符号化方法にも適用される。特に、図13の複雑度を低めるために、図13には、動映像を構成する原本映像のうちいずれか一つの原本映像の処理過程のみ図示されているが、図13に示した映像符号化方法は、動映像を構成する原本映像それぞれに反復的に適用される。
3001ステップで映像符号化装置300は、動映像を構成する原本映像のうち、映像符号化装置300に現在入力された原本映像をダウンサンプリングすることで、基本映像を生成する。3002ステップで映像符号化装置300は、第1バッファ311に保存された参照映像のうち少なくとも一つの参照映像を基準に、ダウンサンプラー301により生成された基本映像の動きを推定し、この基本映像の動き推定を利用して、第1バッファ311に保存された参照映像のうち少なくとも一つの参照映像から基本映像の予測映像を生成する。
3003ステップで映像符号化装置300は、基本映像から第1動き補償部303により生成された予測映像を減算することで、基本映像と予測映像間のレジデュー映像(以下、“第1レジデュー映像”という)を生成する。3004ステップで映像符号化装置300は、3003ステップで生成された第1レジデュー映像を、色空間から周波数空間に変換することによって第1レジデュー映像の周波数係数を生成し、この周波数係数を量子化することで第1レジデュー映像の量子化レベルを生成する。3005ステップで映像符号化装置300は、3004ステップで生成された量子化レベルをエントロピー符号化することによって、基本階層ビットストリームを生成する。
3006ステップで映像符号化装置300は、3004ステップで生成された量子化レベルを逆量子化することで、第1レジデュー映像の周波数係数を復元し、この周波数係数を周波数空間から色空間に変換することによって、第1レジデュー映像を復元し、3002ステップで生成された予測映像に復元された第1レジデュー映像を加えることによって基本映像の復元映像を生成し、この復元映像を第1バッファ311に保存する。
3007ステップで映像符号化装置300は、3006ステップで生成された復元映像をアップサンプリングする。3008ステップで映像符号化装置300は、動映像を構成する原本映像のうち、映像符号化装置300に現在入力された原本映像から、3007ステップでアップサンプリングされた復元映像を減算することで、原本映像と、3007ステップでアップサンプリングされた復元映像間のレジデュー映像(以下、“第2レジデュー映像”という)を生成する。
3009ステップで映像符号化装置300は、第2バッファ331に保存された参照映像のうち少なくとも一つの参照映像を基準に、3008ステップで生成された第2レジデュー映像の動きを推定し、この第2レジデュー映像の動き推定を利用して、第2バッファ331に保存された参照映像のうち少なくとも一つの参照映像から第2レジデュー映像の予測映像を生成する。3010ステップで映像符号化装置300は、3008ステップで生成された第2レジデュー映像から、3009ステップで生成された予測映像を減算することで、第2レジデュー映像と予測映像間のレジデュー映像(以下、“第3レジデュー映像”という)を生成する。3011ステップで映像符号化装置300は、3010ステップで生成された第3レジデュー映像を、色空間から周波数空間に変換することによって、第3レジデュー映像の周波数係数を生成する。
3012ステップで映像符号化装置300は、3011ステップで生成された周波数係数を、第1拡張階層量子化パラメータを利用して量子化することで、第3レジデュー映像の第1拡張階層量子化レベルを生成し、この第1拡張階層量子化レベルをエントロピー符号化することによって、第1拡張階層ビットストリームを生成する。また、3012ステップで映像符号化装置300は、3011ステップで生成された周波数係数を、第2拡張階層量子化パラメータを利用して量子化することで、第3レジデュー映像の第2拡張階層量子化レベルを生成する。また、3012ステップで映像符号化装置300は、第1拡張階層量子化レベルから第2拡張階層量子化レベルを推定し、第2拡張階層量子化レベルと第2拡張階層量子化レベルとの推定値間の差値をエントロピー符号化することによって第2拡張階層ビットストリームを生成する。前記になった3012ステップは、あらゆる拡張階層に対して反復的に適用される。
3013ステップで映像符号化装置300は、3011ステップで生成された第1拡張階層量子化レベルを逆量子化することで、第3レジデュー映像の第1拡張階層周波数係数を復元し、この第1拡張階層周波数係数を周波数空間から色空間に変換することによって第3レジデュー映像を復元し、3009ステップで生成された予測映像に復元された第3レジデュー映像を加えることによって第2レジデュー映像の復元映像を生成し、この復元映像を第2バッファ331に保存する。
3014ステップで映像符号化装置300は、3005ステップで生成された基本階層ビットストリームと、3012ステップで生成された拡張階層ビットストリームとを組み合わせすることで、スケーラブルビットストリームを生成する。
図14は、本発明の他の実施形態による映像復号化方法のフローチャートである。図14を参照するに、本実施形態による映像復号化方法は、図8に示した映像復号化装置400で時系列的に処理されるステップで構成される。したがって、以下省略された内容であっても、図8に示した映像復号化装置400に関して以上で記述された内容は、本実施形態による映像復号化方法にも適用される。特に、図14の複雑度を低めるために、図14には動映像を構成する原本映像のうちいずれか一つの原本映像の処理過程のみ図示されているが、図14に示した映像復号化方法は、動映像を構成する原本映像それぞれに反復的に適用される。
4001ステップで映像復号化装置400は、図6に示した映像符号化装置300から伝送されたスケーラブルビットストリームをパージングすることで、このスケーラブルビットストリームから基本階層ビットストリーム及び拡張階層ビットストリームを抽出する。4002ステップで映像復号化装置400は、4001ステップで抽出された基本階層ビットストリームをエントロピー復号化することによって、基本映像と予測映像間のレジデュー映像(以下、“第1レジデュー映像”という)の量子化レベルと映像復号化のための情報などを復元し、この量子化レベルを逆量子化することで第1レジデュー映像の周波数係数を復元し、この周波数係数を周波数空間から色空間に変換することによって第1レジデュー映像を復元する。
4003ステップで映像復号化装置400は、第1バッファ407に保存された参照映像のうち少なくとも一つの参照映像基準の現在映像の動き推定を利用して、少なくとも一つの参照映像から現在映像の予測映像を生成する。4004ステップで映像復号化装置400は、4003ステップで復元された予測映像に、4002ステップで復元された第1レジデュー映像を加えることによって、基本映像の復元映像を生成し、この復元映像を第1バッファ407に保存する。4005ステップで映像復号化装置400は、4004ステップで生成された復元映像をアップサンプリングする。
4006ステップで映像復号化装置400は、4001ステップで抽出された第1拡張階層ビットストリームをエントロピー符号化することによって、原本映像と4005ステップでアップサンプリングされた復元映像間のレジデュー映像(以下、“第2レジデュー映像”という)と予測映像間のレジデュー映像(以下、“第3レジデュー映像”という)との第1拡張階層量子化レベルを復元し、この第1拡張階層量子化レベルを、第1拡張階層量子化パラメータを利用して逆量子化することで、第3レジデュー映像の第1拡張階層周波数係数を復元する。
また、4006ステップで映像復号化装置400は、4001ステップで抽出された第2拡張階層ビットストリームをエントロピー符号化することによって、第3レジデュー映像の第2拡張階層量子化レベルとこの第2拡張階層量子化レベルとの推定値の差値を復元し、この第1拡張階層量子化レベルから第2拡張階層量子化レベルを推定し、第2拡張階層量子化レベルの推定値に復元された差値を加算することによって、第3レジデュー映像の第2拡張階層量子化レベルを復元する。また、4006ステップで映像復号化装置400は、復元された第2拡張階層量子化レベルを、第2拡張階層量子化パラメータを利用して逆量子化することで、第3レジデュー映像の第2拡張階層周波数係数を復元する。
4007ステップで映像復号化装置400は、4006ステップで復元された第1拡張階層周波数係数を、周波数空間から色空間に変換することによって第3レジデュー映像を復元する。4008ステップで映像復号化装置400は、第2バッファ422に保存された参照映像のうち少なくとも一つの参照映像基準の第2レジデュー映像の動き推定を利用して、少なくとも一つの参照映像から第2レジデュー映像の予測映像を生成する。4009ステップで映像復号化装置400は、4006ステップでの逆量子化結果に該当する拡張階層周波数のうち、最高順位の拡張階層の拡張階層周波数を、周波数空間から色空間に変換することによって拡張階層レジデュー映像を復元する。
4010ステップで映像復号化装置400は、4008ステップで生成された予測映像に、4007ステップで復元された第3レジデュー映像を加えることによって、第2レジデュー映像の復元映像を生成し、この復元映像を第2バッファ422に保存する。また、4010ステップで映像復号化装置400は、この復元映像に、4009ステップで復元された拡張階層レジデュー映像を加えることによって、さらに高画質の第2レジデュー映像の復元映像を生成する。4011ステップで映像復号化装置400は、4005ステップでアップサンプリングされた復元映像に、4010ステップで生成された復元映像を加えることによって、原本映像の復元映像を生成する。
図15A及び図15Bは、本発明のさらに他の実施形態による映像符号化方法のフローチャートである。図15A及び図15Bを参照するに、本実施形態による映像符号化方法は、図9に示した映像符号化装置500で時系列的に処理されるステップで構成される。したがって、以下省略された内容であっても、図9に示した映像符号化装置500に関して以上で記述された内容は、本実施形態による映像符号化方法にも適用される。特に、図15A及び図15Bの複雑度を低めるために、図15A及び図15Bには動映像を構成する原本映像のうちいずれか一つの原本映像の処理過程のみ示されているが、図15A及び図15Bに示した映像符号化方法は、動映像を構成する原本映像それぞれに反復的に適用される。
5001ステップで映像符号化装置500は、動映像を構成する原本映像のうち、映像符号化装置500に現在入力された原本映像をダウンサンプリングすることで基本映像を生成する。5002ステップで映像符号化装置500は、第1バッファ511に保存された参照映像のうち少なくとも一つの参照映像を基準に、ダウンサンプラー501により生成された基本映像の動きを推定し、基本映像の動き推定を利用して、第1バッファ511に保存された参照映像のうち少なくとも一つの参照映像から基本映像の予測映像を生成する。
5003ステップで映像符号化装置500は、基本映像から、5002ステップで生成された予測映像を減算することで、基本映像と予測映像間のレジデュー映像(以下、“第1レジデュー映像”という)を生成する。5004ステップで映像符号化装置500は、5003ステップで生成された第1レジデュー映像を、色空間から周波数空間に変換することによって第1レジデュー映像の周波数係数を生成し、この周波数係数を量子化することで第1レジデュー映像の量子化レベルを生成する。5005ステップで映像符号化装置500は、5004ステップで生成された量子化レベルをエントロピー符号化することによって、基本階層ビットストリームを生成する。
5006ステップで映像符号化装置500は、5004ステップで生成された量子化レベルを逆量子化することで第1レジデュー映像の周波数係数を復元し、この周波数係数を、周波数空間から色空間に変換することによって第1レジデュー映像を復元し、2002ステップで生成された予測映像に、第1逆変換部509により復元された第1レジデュー映像を加えることによって基本映像の復元映像を生成し、この復元映像を第1バッファ511に保存する。
5007ステップで映像符号化装置500は、5006ステップで生成された復元映像をアップサンプリングする。5008ステップで映像符号化装置500は、動映像を構成する原本映像のうち、映像符号化装置500に現在入力された原本映像から、5007ステップでアップサンプリングされた復元映像を減算することで、原本映像と、5007ステップでアップサンプリングされた復元映像間のレジデュー映像(以下、“第2レジデュー映像”という)を生成する。
5009ステップで映像符号化装置500は、第2バッファ523に保存された参照映像のうち少なくとも一つの参照映像を基準に、5008ステップで生成された第2レジデュー映像の動きを推定し、この第2レジデュー映像の動き推定を利用して、第2バッファ530に保存された参照映像のうち、少なくとも一つの参照映像から第2レジデュー映像の予測映像を生成する。5010ステップで映像符号化装置500は、5008ステップで生成された第2レジデュー映像から、5009ステップで生成された予測映像を減算することで、第2レジデュー映像と予測映像間のレジデュー映像(以下、“第3レジデュー映像”という)を生成する。
5011ステップで映像符号化装置500は、5010ステップで生成された第3レジデュー映像を色空間から周波数空間に変換することによって、第3レジデュー映像の周波数係数を生成し、この周波数係数を、第1拡張階層量子化パラメータを利用して量子化することで、第3レジデュー映像の第1拡張階層量子化レベルを生成し、この第1拡張階層量子化レベルをエントロピー符号化することによって第1拡張階層ビットストリームを生成する。
5012ステップで映像符号化装置500は、5011ステップで生成された第1拡張階層量子化レベルを逆量子化することで、第3レジデュー映像の第1拡張階層周波数係数を復元し、この第1拡張階層周波数係数を、周波数空間から色空間に変換することによって第3レジデュー映像を復元し、5009ステップで生成された予測映像に復元された第3レジデュー映像を加えることによって、第2レジデュー映像の復元映像を生成し、この復元映像を第2バッファ523に保存する。
5013ステップで映像符号化装置500は、第3バッファ535に保存された参照映像のうち少なくとも一つの参照映像を基準に、第2減算器513により生成された第2レジデュー映像の動きを推定し、この第2レジデュー映像の動き推定を利用して、第3バッファ535に保存された参照映像のうち、少なくとも一つの参照映像から第2レジデュー映像の予測映像を生成する。5014ステップで映像符号化装置500は、5008ステップで生成された第2レジデュー映像から、5013ステップで生成された予測映像を減算することで第3レジデュー映像を生成する。
5015ステップで映像符号化装置500は、5014ステップで生成された第3レジデュー映像を、色空間から周波数空間に変換することによって第3レジデュー映像の周波数係数を生成し、この周波数係数を、第2拡張階層量子化パラメータを利用して量子化することで、第3レジデュー映像の第2拡張階層量子化レベルを生成する。また、5015ステップで映像符号化装置500は、第1拡張階層量子化レベルから、第2拡張階層量子化部528により生成される第2拡張階層量子化レベルを推定し、第2拡張階層量子化レベルと第2拡張階層量子化レベルとの推定値間の差値をエントロピー符号化することによって、第2拡張階層ビットストリームを生成する。
5016ステップで映像符号化装置500は、5015ステップで生成された第2拡張階層量子化レベルを逆量子化することで、第3レジデュー映像の第2拡張階層周波数係数を復元し、この第2拡張階層周波数係数を、周波数空間から色空間に変換することによって第3レジデュー映像を復元し、5013ステップで生成された予測映像に、復元された第3レジデュー映像を加えることによって第2レジデュー映像の復元映像を生成し、この復元映像を第3バッファ535に保存する。
5017ステップで映像符号化装置500は、5005ステップで生成された基本階層ビットストリームと、5011ステップ及び5015ステップで生成された拡張階層ビットストリームとを組み合わせすることで、スケーラブルビットストリームを生成する。特に、前記になったステップのうち、5009ステップないし5016ステップは、あらゆる拡張階層に対して反復的に適用される。したがって、5017ステップで映像符号化装置500は、5011ステップ及び5015ステップ以外に他のステップで生成された拡張階層ビットストリームを組み合わせることができる。
図16は、本発明のさらに他の実施形態による映像復号化方法のフローチャートである。図16を参照するに、本実施形態による映像復号化方法は、図10に示した映像復号化装置600で時系列的に処理されるステップで構成される。したがって、以下省略された内容であっても、図10に示した映像復号化装置600に関して以上で記述された内容は、本実施形態による映像復号化方法にも適用される。特に、図16の複雑度を低めるために、図16には、動映像を構成する原本映像のうちいずれか一つの原本映像の処理過程のみ図示されているが、図10に示した映像復号化方法は、動映像を構成する原本映像それぞれに反復的に適用される。
6001ステップで映像復号化装置600は、図9に示した映像符号化装置500から伝送されたスケーラブルビットストリームをパージングすることで、このスケーラブルビットストリームから、基本階層ビットストリーム及び拡張階層ビットストリームを抽出する。6002ステップで映像復号化装置600は、6001ステップで抽出された基本階層ビットストリームをエントロピー復号化することによって、基本映像と予測映像間のレジデュー映像(以下、“第1レジデュー映像”という)の量子化レベルと映像復号化のための情報などを復元し、この量子化レベルを逆量子化することで第1レジデュー映像の周波数係数を復元し、この復元された周波数係数を、周波数空間から色空間に変換することによって第1レジデュー映像を復元する。
6003ステップで映像復号化装置600は、第1バッファ607に保存された参照映像のうち少なくとも一つの参照映像基準の基本映像の動き推定を利用して、少なくとも一つの参照映像から基本映像の予測映像を生成する。6004ステップで映像復号化装置600は、6003ステップで生成された予測映像に、6002ステップで復元された第1レジデュー映像を加えることによって基本映像の復元映像を生成し、この復元映像を第1バッファ607に保存する。6005ステップで映像復号化装置600は、6004ステップで生成された復元映像をアップサンプリングする。
6006ステップで映像復号化装置600は、6001ステップで抽出された第1拡張階層ビットストリームをエントロピー符号化することによって、原本映像と6005ステップでアップサンプリングされた復元映像間のレジデュー映像(以下、“第2レジデュー映像”という)と、予測映像間のレジデュー映像(以下、“第3レジデュー映像”という)との第1拡張階層量子化レベルを復元し、この第1拡張階層量子化レベルを、第1拡張階層量子化パラメータを利用して逆量子化することで第3レジデュー映像の第1拡張階層周波数係数を復元し、この第1拡張階層周波数係数を、周波数空間から色空間に変換することによって第3レジデュー映像を復元する。
6007ステップで映像復号化装置600は、第2バッファ614に保存された参照映像のうち少なくとも一つの参照映像基準の第2レジデュー映像の動き推定を利用して、少なくとも一つの参照映像から第2レジデュー映像の予測映像を生成し、この予測映像に、6006ステップで復元された第3レジデュー映像を加えることによって第2レジデュー映像の復元映像を生成し、この復元映像を第2バッファ614に保存する。
6008ステップで映像復号化装置600は、6001ステップで抽出された第2拡張階層ビットストリームをエントロピー符号化することによって、第3レジデュー映像の第2拡張階層量子化レベルと、この第2拡張階層量子化レベルとの推定値の差値を復元し、第1拡張階層量子化レベルから、第2拡張階層エントロピー復号化部615により復元される第2拡張階層量子化レベルを推定し、第2拡張階層量子化レベルの推定値に復元された差値を加算することによって、第3レジデュー映像の第2拡張階層量子化レベルを復元する。また、6008ステップで映像復号化装置600は、復元された第2拡張階層量子化レベルを、第2拡張階層量子化パラメータを利用して逆量子化することで第3レジデュー映像の第2拡張階層周波数係数を復元して、この第2拡張階層周波数係数を、周波数空間から色空間に変換することによって第3レジデュー映像を復元する。
6009ステップで映像復号化装置600は、第3バッファ622に保存された参照映像のうち少なくとも一つの参照映像基準の第2レジデュー映像の動き推定を利用して、少なくとも一つの参照映像から第2レジデュー映像の予測映像を生成し、この予測映像に、6008ステップで復元された第3レジデュー映像を加えることによって第2レジデュー映像の復元映像を生成し、この復元映像を第3バッファ622に保存する。
6010ステップで映像復号化装置600は、6005ステップでアップサンプリングされた復元映像に、6007ステップで生成された復元映像及び6009ステップで生成された復元映像のうち最高順位の拡張階層の復元映像、すなわち、6009ステップで生成された復元映像を加えることによって原本映像の復元映像を生成する。
一方、前述した本発明の実施形態は、コンピュータで実行できるプログラムで作成可能であり、コンピュータで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用ディジタルコンピューターで具現できる。また、前述した本発明の実施形態で使われたデータの構造は、コンピュータで読み取り可能な記録媒体にいろいろな手段を通じて記録されうる。前記コンピュータで読み取り可能な記録媒体は、マグネチック記録媒体(例えば、ROM、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CD−ROM、DVDなど)のような記録媒体を含む。
これまで本発明についてその実施形態を中心に説明した。当業者ならば、本発明が本発明の本質的な特性から逸脱しない範囲で変形された形態で具現されることを理解できるであろう。したがって、開示された実施形態は限定的な観点ではなく説明的な観点で考慮されねばならない。本発明の範囲は、前述した説明ではなく特許請求の範囲に現れており、それと同等な範囲内にあるあらゆる差異点は、本発明に含まれていると解釈されねばならない。
本発明の少なくとも一つの実施形態は、映像を符号化または復号化するコンピュータ、映像機器などに適用できる。
本発明の実施形態が適用されるスケーラブル映像処理環境を示す図である。 本発明の実施形態によって階層的に符号化または復号化する態様を示す図である。 図2に示した第2符号化装置30から出力されたスケーラブルビットストリームのフォーマットを示す図である。 本発明の一実施形態による映像符号化装置100の構成図である。 本発明の一実施形態による量子化行列を示す図である。 本発明の一実施形態による映像復号化装置200の構成図である。 本発明の他の実施形態による映像符号化装置300の構成図である。 本発明の他の実施形態による映像復号化装置400の構成図である。 本発明のさらに他の実施形態による映像符号化装置500の構成図である。 本発明の実施形態による映像復号化装置600の構成図である。 本発明の一実施形態による映像符号化方法のフローチャートである。 本発明の一実施形態による映像復号化方法のフローチャートである。 本発明の他の実施形態による映像符号化方法のフローチャートである。 本発明の他の実施形態による映像復号化方法のフローチャートである。 本発明のさらに他の実施形態による映像符号化方法のフローチャートである。 本発明のさらに他の実施形態による映像符号化方法のフローチャートである。 本発明のさらに他の実施形態による映像復号化方法のフローチャートである。
符号の説明
100 映像符号化装置
101 ダウンサンプラー
102 動き推定部
103 動き補償部
104 第1減算器
105 第1変換部
106 量子化部
107 エントロピー符号化部
108 逆量子化部
109 逆変換部
110 加算器
111 バッファ
112 アップサンプラー
113 第2減算器
114 第2変換部
115 第1拡張階層量子化部
116 第1拡張階層エントロピー符号化部
117 第2拡張階層量子化部
118 第1レベル推定部
119 第1レベル減算器
120 第2拡張階層エントロピー符号化部
121 第N拡張階層量子化部
122 第N−1レベル推定部
123 第N−1レベル減算器
124 第N拡張階層エントロピー符号化部
125 ビットストリーム生成部

Claims (25)

  1. 原本映像をダウンサンプリングすることで第1レベルの映像フォーマットまたは第2レベルのビット深さを有する基本映像を生成するステップと、
    前記生成された基本映像を符号化することによって基本階層ビットストリームを生成するステップと、
    前記基本映像の復元映像を生成するステップと、
    前記復元映像をアップサンプリングすることで前記第1レベルより高い映像フォーマットまたは前記第2レベルより深いビット深さを有するアップサンプリングされた復元映像を生成するステップと、
    前記原本映像と前記アップサンプリングされた復元映像間のレジデュー映像の周波数係数それぞれに相異なる量子化パラメータを適用して各階層に対する多数の量子化レベルを生成し、少なくとも一つの階層の量子化レベルの予測において他の階層の量子化レベルから推定された値を利用して前記レジデュー映像を符号化して前記レジデュー映像に対する拡張階層ビットストリームを生成するステップと、
    を含むことを特徴とする映像符号化方法。
  2. 前記拡張階層ビットストリームを生成するステップは、前記レジデュー映像の周波数係数それぞれを、第1拡張階層の量子化ステップサイズを利用して符号化することによって前記レジデュー映像に対する第1拡張階層ビットストリームを生成し、前記レジデュー映像の周波数係数それぞれを、前記第1拡張階層の量子化ステップサイズより小さな第2拡張階層の量子化ステップサイズを利用して符号化することによって前記レジデュー映像に対する第2拡張階層ビットストリームを生成する、
    ことを特徴とする請求項1に記載の映像符号化方法。
  3. 前記拡張階層ビットストリームを生成するステップは、前記レジデュー映像の周波数係数それぞれを第1拡張階層の量子化行列を利用して符号化することによって前記レジデュー映像に対する第1拡張階層ビットストリームを生成し、前記レジデュー映像の周波数係数それぞれを、前記第1拡張階層の量子化行列とは異なる第2階層の量子化行列を利用して符号化することによって前記レジデュー映像に対する第2拡張階層ビットストリームを生成する、
    ことを特徴とする請求項1に記載の映像符号化方法。
  4. 前記拡張階層ビットストリームを生成するステップは、前記レジデュー映像の周波数係数それぞれを、前記量子化パラメータである、第1量子化ステップサイズと第1量子化行列との積を利用して符号化することによって前記レジデュー映像に対する第1拡張階層ビットストリームを生成し、前記レジデュー映像の周波数係数それぞれを、第2量子化ステップサイズと第2量子化行列との積を利用して符号化することによって前記レジデュー映像に対する第2拡張階層ビットストリームを生成する、
    ことを特徴とする請求項1に記載の映像符号化方法。
  5. 前記拡張階層ビットストリームを生成するステップは、前記レジデュー映像の周波数係数それぞれを、前記量子化パラメータである、第1量子化ステップサイズと第1量子化行列との和を利用して符号化することによって
    前記レジデュー映像に対する第1拡張階層ビットストリームを生成し、前記レジデュー映像の周波数係数それぞれを、第2量子化ステップサイズと第2量子化行列の和を利用して符号化することによって前記レジデュー映像に対する第2拡張階層ビットストリームを生成する、
    ことを特徴とする請求項1に記載の映像符号化方法。
  6. 前記拡張階層ビットストリームを生成するステップは、
    前記レジデュー映像を変換することによって前記レジデュー映像の周波数係数を生成するステップと、
    前記生成された周波数係数を、第1拡張階層量子化パラメータを利用して量子化することで第1拡張階層量子化レベルを生成するステップと、
    前記生成された周波数係数を、第2拡張階層量子化パラメータを利用して量子化することで第2拡張階層量子化レベルを生成するステップと、
    前記生成された第1拡張階層量子化レベルから前記第2拡張階層量子化レベルを推定するステップと、
    前記生成された第2拡張階層量子化レベルと前記推定された第2拡張階層量子化レベルとの差値をエントロピー符号化するステップと、
    を含むことを特徴とする請求項1に記載の映像符号化方法。
  7. 前記第2拡張階層量子化レベルを推定するステップは、前記生成された第1拡張階層量子化レベルを逆量子化することで前記周波数係数を復元し、前記復元された周波数係数を、前記第2拡張階層量子化パラメータを利用して量子化することで前記第2拡張階層量子化レベルを推定する、
    ことを特徴とする請求項6に記載の映像符号化方法。
  8. 基本階層ビットストリームを復号化することによって第1レベルの映像フォーマットまたは第2レベルのビット深さを有する基本映像の復元映像を生成するステップと、
    前記生成された復元映像をアップサンプリングすることで前記第1レベルより高い映像フォーマットまたは前記第2レベルより深いビット深さを有するアップサンプリングされた復元映像を生成するステップと、
    レジデュー映像に対する拡張階層ビットストリームそれぞれについて、他の階層の量子化レベルから推定された量子化レベルを利用して少なくとも一つの階層の量子化レベルを復元するステップと、
    各階層の復元された量子化レベルに相異なる量子化パラメータを適用することによって前記レジデュー映像の周波数係数を復号化して、原本映像と前記アップサンプリングされた復元映像間のレジデュー映像を復元するステップと、
    前記アップサンプリングされた復元映像に前記復元されたレジデュー映像を加えることによって原本映像の復元映像を生成するステップと、
    を含むことを特徴とする映像復号化方法。
  9. 前記レジデュー映像を復元するステップは、第1拡張階層ビットストリームを、第1拡張階層の量子化ステップサイズを利用して復号化し、第2拡張階層ビットストリームを、前記第1拡張階層の量子化ステップサイズより小さな第2拡張階層の量子化ステップサイズを利用して復号化することによって拡張階層レジデュー映像を生成するステップを含む、
    ことを特徴とする請求項8に記載の映像復号化方法。
  10. 前記レジデュー映像を復元するステップは、第1拡張階層ビットストリームを、第1拡張階層の量子化行列を利用して復号化し、第2拡張階層ビットストリームを、前記第1拡張階層の量子化行列とは異なる第2階層の量子化行列を利用して復号化することによって拡張階層レジデュー映像を生成するステップを含む、
    ことを特徴とする請求項8に記載の映像復号化方法。
  11. 前記レジデュー映像を復元するステップは、第1拡張階層ビットストリームを、第1拡張階層の量子化ステップサイズと量子化行列との積を利用して復号化し、第2拡張階層ビットストリームを、第2拡張階層の量子化ステップサイズと量子化行列との積を利用して復号化することによって拡張階層レジデュー映像を生成するステップを含む、
    ことを特徴とする請求項8に記載の映像復号化方法。
  12. 前記レジデュー映像を復元するステップは、
    第1拡張階層ビットストリームを、第1拡張階層の量子化ステップサイズと量子化行列との和を利用して復号化し、第2拡張階層ビットストリームを、第2拡張階層の量子化ステップサイズと量子化行列との和を利用して復号化することによって拡張階層レジデュー映像を生成するステップを含む、
    ことを特徴とする請求項8に記載の映像復号化方法。
  13. 前記レジデュー映像を復元するステップは、
    第1拡張階層ビットストリームをエントロピー復号化することによって第1拡張階層量子化レベルを復元するステップと、
    第2拡張階層ビットストリームをエントロピー復号化することによって第2拡張階層量子化レベルと前記第2拡張階層量子化レベルとの推定値との差値を復元するステップと、
    前記復元された第1拡張階層量子化レベルから前記第2拡張階層量子化レベルを推定するステップと、
    前記推定された第2拡張階層量子化レベルに前記復元された差値を加算することによって前記第2拡張階層量子化レベルを復元するステップと、
    前記復元された第2拡張階層量子化レベルを、第2拡張階層量子化パラメータを利用して復号化することによって拡張階層レジデュー映像を生成するステップと、
    を含むことを特徴とする請求項8に記載の映像復号化方法。
  14. 前記第2拡張階層量子化レベルを推定するステップは、前記復元された第1拡張階層量子化レベルを、第1拡張階層量子化パラメータを利用して逆量子化することで第1拡張階層周波数係数を復元し、前記復元された第1拡張階層周波数係数を、前記第2拡張階層量子化パラメータを利用して量子化することで前記第2拡張階層量子化レベルを推定する、
    ことを特徴とする請求項13に記載の映像復号化方法。
  15. 原本映像をダウンサンプリングすることで第1レベルの映像フォーマットまたは第2レベルのビット深さを有する基本映像を生成するステップと、
    前記生成された基本映像を符号化することによって基本階層ビットストリームを生成するステップと、
    前記基本映像の復元映像を生成するステップと、
    前記復元映像をアップサンプリングすることで前記第1レベルより高い映像フォーマットまたは前記第2レベルより深いビット深さを有するアップサンプリングされた復元映像を生成するステップと、
    前記原本映像と前記アップサンプリングされた復元映像間のレジデュー映像の予測映像を生成するステップと、
    前記レジデュー映像と前記生成された予測映像間のレジデュー映像の周波数係数それぞれに、相異なる量子化パラメータを適用して各階層に対する多数の量子化レベルを生成するステップと、
    少なくとも一つの階層の量子化レベルの予測において他の階層の量子化レベルから推定された値を利用して前記レジデュー映像と前記生成された予測映像間のレジデュー映像を符号化して拡張階層ビットストリームを生成するステップと、
    を含むことを特徴とする映像符号化方法。
  16. 基本階層ビットストリームを復号化することによって第1レベルの映像フォーマットまたは第2レベルのビット深さを有する基本映像の復元映像を生成するステップと、
    前記生成された復元映像をアップサンプリングすることで前記第1レベルより高い映像フォーマットまたは前記第2レベルより深いビット深さを有するアップサンプリングされた復元映像を生成するステップと、
    原本映像と前記アップサンプリングされた復元映像間のレジデュー映像の予測映像を生成するステップと、
    前記レジデュー映像と前記生成された予測映像間のレジデュー映像に対する拡張階層ビットストリームそれぞれについて、他の階層の量子化レベルから推定された各階層の量子化レベルを利用して少なくとも一つの階層の量子化レベルを復元するステップと、
    各階層の復元された量子化レベルに相異なる量子化パラメータを適用して周波数係数を復号化することによって、前記レジデュー映像と前記予測映像間のレジデュー映像を復元するステップと、
    前記生成された予測映像に前記復元されたレジデュー映像を加えることによって前記レジデュー映像を復元するステップと、
    前記アップサンプリングされた復元映像に前記復元されたレジデュー映像を加えることによって前記原本映像の復元映像を生成するステップと、
    を含むことを特徴とする映像復号化方法。
  17. 基本階層ビットストリームを復号化することによって第1レベルの映像フォーマットまたは第2レベルのビット深さを有する基本映像の復元映像を生成するステップと、
    前記生成された復元映像をアップサンプリングすることで前記第1レベルより高い映像フォーマットまたは前記第2レベルより深いビット深さを有するアップサンプリングされた復元映像を生成するステップと、
    原本映像と前記アップサンプリングされた復元映像間の第1レジデュー映像の第1予測映像を生成するステップと、
    第1拡張階層ビットストリームを、第1量子化パラメータを利用して復号化することによって、前記第1レジデュー映像と前記第1予測映像間の第2レジデュー映像を復元するステップと、
    前記生成された第1予測映像に前記復元された第2レジデュー映像を加えることによって前記第1レジデュー映像の第1復元映像を生成するステップと、
    前記第1レジデュー映像の第2予測映像を生成するステップと、
    第2拡張階層ビットストリームを、第2量子化パラメータを利用して復号化することによって、前記第1レジデュー映像と前記第2予測映像間の第3レジデュー映像を復元するステップと、
    前記生成された第2予測映像に前記復元された第3レジデュー映像を加えることによって前記第1レジデュー映像の第2復元映像を生成するステップと、
    前記アップサンプリングされた復元映像に、前記生成された第1復元映像及び第2復元映像のうち少なくとも一つを加算することによって前記原本映像の復元映像を生成するステップと、を含み、
    前記第3レジデュー映像を復元するステップは、
    前記第2拡張階層ビットストリームについて、推定された第2拡張階層量子化レベルを利用して前記第2拡張階層量子化レベルを復元するステップと、
    前記復元された量子化レベルに第2拡張階層量子化パラメータを適用して前記第3レジデュー映像の第2拡張階層周波数係数を復元することによって前記第3レジデュー映像を復元するステップを含む
    ことを特徴とする映像復号化方法。
  18. ダウンサンプリングされた原本映像を符号化することによって第1レベルの映像フォーマットまたは第2レベルのビット深さを有する基本階層ビットストリームを生成する生成部と、
    前記ダウンサンプリングされた原本映像の復元映像をアップサンプリングすることで前記第1レベルより高い映像フォーマットまたは前記第2レベルより深いビット深さを有するアップサンプリングされた復元映像を生成するアップサンプリング部と、
    前記原本映像と前記アップサンプリングされた復元映像間のレジデュー映像の周波数係数それぞれに、相異なる量子化パラメータを適用して各階層に対する多数の量子化レベルを生成し、少なくとも一つの階層の量子化レベルの予測において他の階層の量子化レベルから推定された値を利用して前記レジデュー映像を符号化して前記レジデュー映像に対する拡張階層ビットストリームを生成する生成部と、を備えることを特徴とする映像符号化装置。
  19. 前記拡張階層ビットストリームのうち少なくとも一つは、各拡張階層に対してその拡張階層に関する量子化パラメータを使用して生成される、
    ことを特徴とする請求項18に記載の映像符号化装置。
  20. 前記生成部は、第1拡張階層に関してインター符号化する、
    ことを特徴とする請求項18に記載の映像符号化装置。
  21. 前記生成部は、第1拡張階層以外の他の拡張階層に関してインター符号化する、
    ことを特徴とする請求項18に記載の映像符号化装置。
  22. 復号化された基本階層ビットストリームから復元された第1レベルの映像フォーマットまたは第2レベルのビット深さを有する基本映像の復元映像をアップサンプリングすることで前記第1レベルより高い映像フォーマットまたは前記第2レベルより深いビット深さを有するアップサンプリングされた復元映像を生成するステップと、
    復号化された拡張階層ビットストリームから拡張階層残差映像を復元するステップと、
    前記アップサンプリングされた復元された基本映像の復元映像に拡張階層レジデュー映像を加えることによって原本映像の復元映像を生成するステップと、
    を含み、
    前記拡張階層レジデュー映像を復元するステップは、
    他の階層の量子化レベルから推定された各階層の量子化レベルを利用して少なくとも一つの階層の量子化レベルを復元するステップと、
    各階層の復元された量子化レベルに相異なる量子化パラメータを適用して周波数係数を復号化することによって前記拡張階層レジデュー映像を復元するステップを含むことを特徴とする映像復号化方法。
  23. 前記復元するステップは、拡張階層のうち最高順位の拡張階層の周波数係数を色ドメインに逆変換する、
    ことを特徴とする請求項22に記載の映像復号化方法。
  24. 前記逆変換された周波数係数は、拡張階層それぞれで行った逆量子化結果に対応する、
    ことを特徴とする請求項23に記載の映像復号化方法。
  25. 請求項1乃至7の何れか1項に記載の方法をコンピュータに実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
JP2008294570A 2007-12-06 2008-11-18 映像を階層的に符号化/復号化する方法及び装置 Expired - Fee Related JP5547394B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20070126377A KR101375663B1 (ko) 2007-12-06 2007-12-06 영상을 계층적으로 부호화/복호화하는 방법 및 장치
KR10-2007-0126377 2007-12-06

Publications (2)

Publication Number Publication Date
JP2009141953A JP2009141953A (ja) 2009-06-25
JP5547394B2 true JP5547394B2 (ja) 2014-07-09

Family

ID=40386030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008294570A Expired - Fee Related JP5547394B2 (ja) 2007-12-06 2008-11-18 映像を階層的に符号化/復号化する方法及び装置

Country Status (4)

Country Link
US (1) US20090148054A1 (ja)
EP (1) EP2068567A3 (ja)
JP (1) JP5547394B2 (ja)
KR (1) KR101375663B1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5690267B2 (ja) * 2008-08-22 2015-03-25 トムソン ライセンシングThomson Licensing コンテンツ配信のための方法およびシステム
KR101525713B1 (ko) * 2010-11-15 2015-06-03 엘지전자 주식회사 프레임 포맷 전환 방법 및 이러한 방법을 사용하는 장치
GB2488159B (en) * 2011-02-18 2017-08-16 Advanced Risc Mach Ltd Parallel video decoding
US20130208809A1 (en) * 2012-02-14 2013-08-15 Microsoft Corporation Multi-layer rate control
EP2822275B1 (en) * 2012-02-29 2018-09-12 Sony Corporation Image processing device and method
US9756327B2 (en) * 2012-04-03 2017-09-05 Qualcomm Incorporated Quantization matrix and deblocking filter adjustments for video coding
CN104620583A (zh) * 2012-05-14 2015-05-13 卢卡·罗萨托 基于支持信息的残差数据的编码和重构
CA2894637A1 (en) * 2012-12-18 2014-06-26 Sony Corporation Image processing device and image processing method
CN104853188A (zh) * 2015-03-12 2015-08-19 康佳集团股份有限公司 无线网络中svc快速编码模式的选择控制方法和系统
RU2605035C1 (ru) * 2015-05-25 2016-12-20 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для восстановления логической иерархии по меньшей мере двух двухмерных объектов
KR102444871B1 (ko) * 2015-09-25 2022-09-21 삼성전자주식회사 수신 장치 및 그의 복호 방법
GB2547934B (en) * 2016-03-03 2021-07-07 V Nova Int Ltd Adaptive video quality
US10986356B2 (en) 2017-07-06 2021-04-20 Samsung Electronics Co., Ltd. Method for encoding/decoding image and device therefor
WO2019009490A1 (ko) * 2017-07-06 2019-01-10 삼성전자 주식회사 영상을 부호화/복호화 하는 방법 및 그 장치
WO2020080765A1 (en) 2018-10-19 2020-04-23 Samsung Electronics Co., Ltd. Apparatuses and methods for performing artificial intelligence encoding and artificial intelligence decoding on image
WO2020080665A1 (en) 2018-10-19 2020-04-23 Samsung Electronics Co., Ltd. Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image
GB2623003A (en) * 2019-07-05 2024-04-03 V Nova Int Ltd Quantization of residuals in video coding
KR102436512B1 (ko) 2019-10-29 2022-08-25 삼성전자주식회사 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
KR102287942B1 (ko) 2020-02-24 2021-08-09 삼성전자주식회사 전처리를 이용한 영상의 ai 부호화 및 ai 복호화 방법, 및 장치
WO2022077489A1 (zh) * 2020-10-16 2022-04-21 深圳市大疆创新科技有限公司 数据处理方法、设备和存储介质
WO2022151053A1 (zh) * 2021-01-13 2022-07-21 深圳市大疆创新科技有限公司 数据处理方法、装置及系统、计算机存储介质

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04354488A (ja) * 1991-05-31 1992-12-08 Toshiba Corp 動画像符号化装置
US5539836A (en) * 1991-12-20 1996-07-23 Alaris Inc. Method and apparatus for the realization of two-dimensional discrete cosine transform for an 8*8 image fragment
GB9206860D0 (en) * 1992-03-27 1992-05-13 British Telecomm Two-layer video coder
US5742892A (en) * 1995-04-18 1998-04-21 Sun Microsystems, Inc. Decoder for a software-implemented end-to-end scalable video delivery system
WO1997001934A1 (en) * 1995-06-29 1997-01-16 Thomson Multimedia S.A. System for encoding and decoding layered compressed video data
JP3788823B2 (ja) * 1995-10-27 2006-06-21 株式会社東芝 動画像符号化装置および動画像復号化装置
US6167161A (en) * 1996-08-23 2000-12-26 Nec Corporation Lossless transform coding system having compatibility with lossy coding
US6269192B1 (en) * 1997-07-11 2001-07-31 Sarnoff Corporation Apparatus and method for multiscale zerotree entropy encoding
JP4332246B2 (ja) * 1998-01-14 2009-09-16 キヤノン株式会社 画像処理装置、方法、及び記録媒体
JP2000197045A (ja) * 1998-12-28 2000-07-14 Nec Corp デジタル放送再生システム
JP4018335B2 (ja) * 2000-01-05 2007-12-05 キヤノン株式会社 画像復号装置及び画像復号方法
US6700933B1 (en) * 2000-02-15 2004-03-02 Microsoft Corporation System and method with advance predicted bit-plane coding for progressive fine-granularity scalable (PFGS) video coding
JP2001309383A (ja) * 2000-04-18 2001-11-02 Matsushita Electric Ind Co Ltd 画像符号化装置および方法
JP2002315004A (ja) * 2001-04-09 2002-10-25 Ntt Docomo Inc 画像符号化方法及び装置、画像復号方法及び装置、並びに画像処理システム
JP2005506815A (ja) * 2001-10-26 2005-03-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間拡張可能圧縮のための方法及び装置
JP2004159157A (ja) * 2002-11-07 2004-06-03 Kddi R & D Laboratories Inc 階層符号化された動画像の復号装置
JP2004214740A (ja) * 2002-12-26 2004-07-29 Canon Inc 動画像符号化装置
JP4331992B2 (ja) * 2003-08-07 2009-09-16 日本電信電話株式会社 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,それらのプログラムおよびそれらのプログラム記録媒体
KR100565308B1 (ko) * 2003-11-24 2006-03-30 엘지전자 주식회사 에스엔알 스케일러빌리티를 위한 동영상 부호화 및 복호화 장치
JP3914214B2 (ja) 2004-03-15 2007-05-16 株式会社東芝 画像符号化装置および画像復号化装置
JP2005286863A (ja) * 2004-03-30 2005-10-13 Secom Co Ltd 符号化信号分離装置、符号化信号合成装置および符号化信号分離合成システム
CN1939066B (zh) * 2004-04-02 2012-05-23 汤姆森许可贸易公司 用于复杂度可伸缩视频解码器的方法和设备
US7689051B2 (en) * 2004-04-15 2010-03-30 Microsoft Corporation Predictive lossless coding of images and video
US20050259729A1 (en) * 2004-05-21 2005-11-24 Shijun Sun Video coding with quality scalability
JP4486560B2 (ja) * 2005-07-14 2010-06-23 日本電信電話株式会社 スケーラブル符号化方法および装置,スケーラブル復号方法および装置,並びにそれらのプログラムおよびその記録媒体
KR100772868B1 (ko) * 2005-11-29 2007-11-02 삼성전자주식회사 복수 계층을 기반으로 하는 스케일러블 비디오 코딩 방법및 장치
KR100772873B1 (ko) * 2006-01-12 2007-11-02 삼성전자주식회사 스무딩 예측을 이용한 다계층 기반의 비디오 인코딩 방법,디코딩 방법, 비디오 인코더 및 비디오 디코더
JP2007266750A (ja) * 2006-03-27 2007-10-11 Sanyo Electric Co Ltd 符号化方法
US8331433B2 (en) * 2006-08-31 2012-12-11 Samsung Electronics Co., Ltd. Video encoding apparatus and method and video decoding apparatus and method

Also Published As

Publication number Publication date
US20090148054A1 (en) 2009-06-11
KR20090059495A (ko) 2009-06-11
EP2068567A3 (en) 2013-02-13
KR101375663B1 (ko) 2014-04-03
JP2009141953A (ja) 2009-06-25
EP2068567A2 (en) 2009-06-10

Similar Documents

Publication Publication Date Title
JP5547394B2 (ja) 映像を階層的に符号化/復号化する方法及び装置
JP5318170B2 (ja) 加重予測を利用したビデオコーディング方法、このための装置
KR100791299B1 (ko) 다 계층 기반의 비디오 인코딩 방법 및 장치
KR100746011B1 (ko) 잔차 예측의 성능 개선 방법, 상기 방법을 이용한 비디오인코더 및 비디오 디코더
KR100703734B1 (ko) Dct 업샘플링을 이용한 다 계층 비디오 인코딩/디코딩방법 및 장치
US20060165302A1 (en) Method of multi-layer based scalable video encoding and decoding and apparatus for the same
KR101442608B1 (ko) 영상을 효율적으로 부호화/복호화하는 방법 및 장치
KR20060096230A (ko) 색 공간 스케일러블 비디오 코딩 및 디코딩 방법, 이를위한 장치
WO2006109985A1 (en) Method and apparatus for encoding and decoding video signals in intra-base-layer prediction mode by selectively applying intra-coding
AU2006225467B2 (en) Video coding and decoding method using weighted prediction and apparatus for the same
KR20100009718A (ko) 예측 방향을 이용한 영상 부호화/복호화 장치 및 방법
WO2006132509A1 (en) Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction
JP5063678B2 (ja) ビットストリームのビット率の調節のための優先権の割当て方法、ビットストリームのビット率の調節方法、ビデオデコーディング方法およびその方法を用いた装置
WO2006083107A1 (en) Method and apparatus for compressing multi-layered motion vector
JP2008270974A (ja) 動画像符号化装置及び動画像復号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111111

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120329

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121113

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130213

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130218

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130313

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131008

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140210

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140318

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140326

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140415

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140515

R150 Certificate of patent or registration of utility model

Ref document number: 5547394

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees