JP2018152883A - Sao復号化方法及び装置並びにsao符号化方法及び装置 - Google Patents
Sao復号化方法及び装置並びにsao符号化方法及び装置 Download PDFInfo
- Publication number
- JP2018152883A JP2018152883A JP2018090790A JP2018090790A JP2018152883A JP 2018152883 A JP2018152883 A JP 2018152883A JP 2018090790 A JP2018090790 A JP 2018090790A JP 2018090790 A JP2018090790 A JP 2018090790A JP 2018152883 A JP2018152883 A JP 2018152883A
- Authority
- JP
- Japan
- Prior art keywords
- sao
- information
- unit
- component
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 119
- 230000003044 adaptive effect Effects 0.000 claims abstract description 10
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 87
- 241000023320 Luma <angiosperm> Species 0.000 claims description 84
- 238000005192 partition Methods 0.000 description 143
- 238000006243 chemical reaction Methods 0.000 description 136
- 238000010586 diagram Methods 0.000 description 38
- 239000000523 sample Substances 0.000 description 33
- 238000004891 communication Methods 0.000 description 24
- 238000012545 processing Methods 0.000 description 23
- 238000000605 extraction Methods 0.000 description 16
- 238000013139 quantization Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 10
- 230000009466 transformation Effects 0.000 description 10
- 239000000284 extract Substances 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】原本映像と復元映像との誤差を最小化させるためのSAO(sample adaptive offset)パラメータを決定するSAO符号化方法及びSAO復号化方法を提供する。【解決手段】SAO復号化方法は、最大符号化単位のビットストリームから、コンテクストに基づいてエントロピー符号化された左向きSAO併合情報及び上向きSAO併合情報を獲得し、ビットストリームから、カラー成分別に、コンテクストに基づいてエントロピー符号化されたSAOオンオフ情報を獲得し、バイパスモードでエントロピー符号化されたSAOカテゴリー別オフセット絶対値情報を獲得し、バイパスモードでエントロピー符号化されたバンド位置情報及びエッジクラス情報のうち一つを獲得する。【選択図】図2B
Description
本発明は、ビデオ符号化及びビデオ復号化の動作において、原本映像と復元映像との誤差を最小化させるために、サンプルに適応的に決定されたオフセットほど復元ピクセル値を調整する方法に関する。
高解像度または高画質のビデオコンテンツを再生、保存することができるハードウェアの開発及び普及によって、高解像度または高画質のビデオコンテンツを効果的に符号化したり、あるいは復号化したりするビデオコーデックの必要性が増大している。既存のビデオコーデックによれば、ビデオは、所定サイズのマクロブロックに基づいて制限された符号化方式によって符号化されている。
周波数変換を利用して、空間領域の映像データは、周波数領域の係数に変換される。ビデオコーデックは、周波数変換の迅速な演算のために、映像を所定サイズのブロックに分割し、ブロックごとにDCT(discrete cosine transformation)変換を行い、ブロック単位の周波数係数を符号化する。空間領域の映像データに比べ、周波数領域の係数が、圧縮しやすい形態を有する。特に、ビデオコーデックのインター予測またはイントラ予測を介して、空間領域の映像画素値は、予測誤差で表現されるので、予測誤差に対して周波数変換が行われれば、多くのデータが0に変換される。ビデオコーデックは、連続的に反復して発生するデータを小サイズのデータに置換することにより、データ量を節減している。
本発明は、ビデオ符号化及びビデオ復号化の動作において、原本映像と復元映像との誤差を最小化させるために決定されたSAO(sample adaptive offset)パラメータのシグナリングに係わるものである。
本発明の一実施形態によるSAO(sample adaptive offset)復号化方法は、最大符号化単位のビットストリームから、コンテクスト(context)に基づいてエントロピー符号化された左向きSAO併合情報及び上向きSAO併合情報を獲得する段階と、前記ビットストリームから、カラー成分別に、コンテクストに基づいてエントロピー符号化されたSAOオンオフ(on/off)情報を獲得する段階と、前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記ビットストリームから、カラー成分別に、バイパスモード(bypass mode)でエントロピー符号化されたSAOカテゴリー別オフセット絶対値情報を獲得する段階と、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたバンド位置情報及びエッジクラス情報のうち一つを獲得する段階と、を含む。
本発明の多様な実施形態によるSAOパラメータの符号化方法及び復号化方法によって、SAOパラメータにおいて、SAO併合情報及びSAOオンオフ情報に対してのみ、コンテクストに基づいたエントロピー符号化/復号化が行われ、残りのビット列については、バイパスモードでエントロピー符号化/復号化が行われるので、SAOパラメータ復号化のための全体演算量が減少する。
また、SAOパラメータにおいてカラー成分別に、全て異なって決定されるパラメータだけでなく、第1クロマ成分及び第2クロマ成分については、同一に設定されるパラメータ、またはルマ成分、並びに第1クロマ成分及び第2クロマ成分いずれについても、同一に設定されるパラメータが利用されるので、SAOパラメータの全体ビット長が短くなり、パージングされるデータ量も減縮される。
また、コンテクスト符号化/復号化と、バイパス符号化/復号化との転換回数が減り、全体SAOパラメータに係わるエントロピー符号化/復号化動作の効率も向上する。
本発明の一実施形態によるSAO(sample adaptive offset)復号化方法は、最大符号化単位のビットストリームから、コンテクスト(context)に基づいてエントロピー符号化された左向きSAO併合情報及び上向きSAO併合情報を獲得する段階と、前記ビットストリームから、カラー成分別に、コンテクストに基づいてエントロピー符号化されたSAOオンオフ(on/off)情報を獲得する段階と、前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記ビットストリームから、カラー成分別に、バイパスモード(bypass mode)でエントロピー符号化されたSAOカテゴリー別オフセット絶対値情報を獲得する段階と、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたバンド位置情報及びエッジクラス情報のうち一つを獲得する段階と、を含む。
一実施形態による前記SAOオンオフ情報を獲得する段階は、前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたエッジバンド区別情報をさらに獲得する段階を含み、前記最大符号化単位のSAOタイプ情報のうち最初のビンである前記SAOオンオフ情報に対して、コンテクストに基づいてエントロピー復号化を行い、前記SAOタイプ情報のうち、前記SAOオンオフ情報を除いた残りのビットに対して、バイパスモードでエントロピー復号化を行うことができる。
一実施形態によって、前記バンド位置情報またはエッジクラス情報を獲得する段階は、前記獲得されたエッジバンド区別情報がバンドタイプを示すならば、前記ビットストリームから、カラー成分別に、前記バイパッドモードでエントロピー符号化されたバンド位置情報を獲得する段階を含み、前記バンド位置情報を獲得する段階は、前記SAOカテゴリー別に獲得されたオフセット絶対値情報が0でなければ、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたオフセット符号情報及び前記バンド位置情報を獲得する段階を含み、前記バンド位置情報は、前記最大符号化単位のSAOパラメータのうちから獲得される最後のパラメータでもある。
一実施形態によって、前記バンド位置情報またはエッジクラス情報を獲得する段階は、前記獲得されたエッジバンド区別情報がエッジタイプを示すならば、前記ビットストリームから、カラー成分別に、前記バイパスモードでエントロピー符号化されたエッジクラス情報を獲得する段階を含み、前記エッジクラス情報は、ルマ成分のためのエッジクラス情報、及び第1クロマ成分のためのエッジクラス情報を含み、前記第1クロマ成分のためのエッジクラス情報は、第2クロマ成分に同一に適用される。
一実施形態による第1クロマ成分のための前記SAOオンオフ情報、及び前記エッジバンド区別情報は、第2クロマ成分に同一に適用され、前記左向きSAO併合情報及び上向きSAO併合情報は、前記最大符号化単位のルマ成分、並びに第1クロマ成分及び第2クロマ成分に対して同一に適用される。
一実施形態によって、前記左向きSAO併合情報及び上向きSAO併合情報を獲得する段階は、前記左向きSAO併合情報のコンテクストに基づいた確率モデルを決定し、前記決定された左向きSAO併合情報の確率モデルを利用したエントロピー復号化を行い、前記左向きSAO併合情報を復元する段階と、前記上向きSAO併合情報のコンテクストに基づいた確率モデルを決定し、前記決定された上向きSAO併合情報の確率モデルを利用したエントロピー復号化を行い、前記上向きSAO併合情報を復元する段階と、を含み、前記SAOオンオフ情報を獲得する段階は、前記SAOオンオフ情報のコンテクストに基づいた確率モデルを決定し、前記決定されたSAOオンオフ情報の確率モデルを利用したエントロピー復号化を行い、前記SAOオンオフ情報を復元する段階を含んでもよい。
一実施形態による前記オフセット絶対値情報を獲得する段階は、前記オフセット絶対値情報のコンテクストに基づいた確率モデルを決定し、前記決定されたオフセット絶対値情報のコンテクストに基づいた確率モデルなしにエントロピー復号化を行い、前記オフセット絶対値情報を復元する段階を含み、前記オフセット符号情報及び前記バンド位置情報を獲得する段階は、前記オフセット符号情報のコンテクストに基づいた確率モデルなしにエントロピー復号化を行い、前記オフセット符号情報を復元する段階と、前記バンド位置情報のコンテクストに基づいた確率モデルなしにエントロピー復号化を行い、前記バンド位置情報を復元する段階と、を含んでもよい。
一実施形態によって、前記エッジクラス情報を獲得する段階は、前記エッジクラス情報のコンテクストに基づいた確率モデルなしにエントロピー復号化を行い、前記エッジクラス情報を復元する段階を含んでもよい。
本発明の一実施形態によるSAO符号化方法は、最大符号化単位の左向きSAO併合情報及び上向きSAO併合情報に対して、それぞれのコンテクストに基づいたエントロピー符号化を行って生成された前記左向きSAO併合情報の1ビット、及び前記上向きSAO併合情報の1ビットを出力する段階と、カラー成分別に、SAOオンオフ情報に対して、コンテクストに基づいたエントロピー符号化を行って生成されたSAOオンオフ情報の1ビットを出力する段階と、前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、カラー成分別に、SAOカテゴリー別オフセット絶対値情報に対して、バイパスモードでエントロピー符号化を行って生成されたオフセット絶対値情報のビット列を出力する段階と、カラー成分別に、バンド位置情報及びエッジクラス情報のうち一つに対して、バイパスモードでエントロピー符号化を行って生成された残りのビット列を出力する段階と、を含む。
一実施形態によって、前記SAOオンオフ情報の1ビットを出力する段階は、前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、カラー成分別に、エッジバンド区別情報に対して、バイパスモードでエントロピー符号化を行って生成されたエッジバンド区別情報の1ビットをさらに出力する段階を含み、前記最大符号化単位のSAOタイプ情報のうち最初のビンである前記SAOオンオフ情報に対して、コンテクストに基づいてエントロピー符号化を行い、前記SAOタイプ情報のうち、前記SAOオンオフ情報を除いた残りのビットに対して、バイパスモードでエントロピー符号化を行うことができる。
一実施形態によって、前記残りのビット列を出力する段階は、前記エッジバンド区別情報がバンドタイプを示すならば、カラー成分別に、前記バンド位置情報に対して、バイパッドモードでエントロピー符号化を行って生成された前記バンド位置情報のビット列を出力する段階を含み、前記バンド位置情報のビット列を出力する段階は、前記SAOカテゴリー別オフセット絶対値情報が0でなければ、オフセット符号情報に対して、バイパッドモードでエントロピー符号化を行って生成された前記オフセット符号情報のビット列と、前記生成されたバンド位置情報のビット列とを出力する段階を含み、前記バンド位置情報は、前記最大符号化単位のSAOパラメータのうちから獲得される最後のパラメータでもある。
一実施形態によって、前記残りのビット列を獲得する段階は、前記エッジバンド区別情報がエッジタイプを示すならば、カラー成分別に、前記エッジクラス情報に対して、バイパスモードでエントロピー符号化を行って生成された前記エッジクラス情報のビット列を出力する段階を含んでもよい。
本発明の一実施形態によるSAO復号化装置は、最大符号化単位のビットストリームから、コンテクストに基づいてエントロピー符号化された左向きSAO併合情報及び上向きSAO併合情報を獲得し、カラー成分別に、コンテクストに基づいてエントロピー符号化されたSAOオンオフ情報を獲得するSAOコンテクスト復号化部;前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたSAOカテゴリー別オフセット絶対値情報を獲得し、カラー成分別に、バイパスモードでエントロピー符号化されたバンド位置情報及びエッジクラス情報のうち一つを獲得するSAOバイパス復号化部;及び前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記獲得された情報を利用して、前記最大符号化単位の復元値を、前記SAOカテゴリー別に、オフセット絶対値情報に基づいて調整するSAO調整部;を含む。
本発明の一実施形態によるSAO符号化装置において、最大符号化単位に対してSAO動作を遂行するSAO遂行部;前記最大符号化単位の左向きSAO併合情報及び上向きSAO併合情報に対して、それぞれのコンテクストに基づいたエントロピー符号化を行い、前記左向きSAO併合情報のビット列、及び上向きSAO併合情報のビット列を生成し、カラー成分別に、SAOオンオフ情報に対して、コンテクストに基づいたエントロピー符号化を行い、前記SAOオンオフ情報の1ビットを生成して出力するSAOコンテクスト符号化部;及び前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、カラー成分別に、SAOカテゴリー別オフセット絶対値情報に対して、バイパスモードでエントロピー符号化を行い、前記オフセット絶対値情報のビット列を生成し、カラー成分別に、バンド位置情報及びエッジクラス情報のうち一つに対して、バイパスモードでエントロピー符号化を行い、残りのビット列を生成して出力するSAOバイパス符号化部;を含む。
本発明は、一実施形態による方法を具現するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体を含む。
以下、図1ないし図7Cを参照し、一実施形態による、ピクセル分類によるSAO調整を利用する、ビデオ符号化技法及びビデオ復号化技法を開示する。また、図8ないし図20を参照し、一実施形態による、ツリー構造の符号化単位に基づいた、ビデオ符号化技法及びビデオ復号化技法において、ピクセル分類によるSAO調整が利用される実施形態を開示する。以下、「映像」は、ビデオの静止映像や動画、すなわち、ビデオそのものを示す。
まず、図1ないし図7Cを参照し、一実施形態による、ピクセル分類によるSAO調整を利用する、ビデオ符号化技法及びビデオ復号化技法を開示する。また、図1A、図1B、図2A及び図2Bを参照して説明する一実施形態による、SAO符号化装置10及びSAO復号化装置20は、原本ピクセルと復元ピクセルとの誤差を最小化させるために、SAO調整を行い、SAO調整のためのSAOパラメータを送受信する。
一実施形態によるSAO調整を利用するSAO符号化装置10は、映像ブロックごとに、ピクセルを既定ピクセルグループに分類し、各ピクセルを、当該ピクセルグループに割り当て、同一ピクセルグループに含まれた、原本ピクセルと復元ピクセルとの誤差の平均値を示すオフセット値を符号化する。
SAO符号化装置10とSAO復号化装置20との間で、サンプルがシグナリングされる。すなわち、SAO符号化装置10は、ビデオ符号化を介して生成されたサンプルを符号化し、ビットストリームのタイプで伝送し、SAO復号化装置20は、受信したビットストリームから、サンプルをパージングして復元することができる。
一実施形態によって、SAO符号化装置10とSAO復号化装置20は、ピクセル分類を介して決定されたオフセットほど復元ピクセル値を調整し、原本ピクセルと復元ピクセルとの誤差を最小化させるために、SAO調整のためのSAOパラメータをシグナリングする。SAO符号化装置10及びSAO復号化装置20の間で、SAOパラメータとして、オフセット値が符号化されて伝送されて受信され、SAOパラメータからオフセット値が復号化される。
従って、一実施形態によるSAO復号化装置20は、受信されたビットストリームを復号化し、映像ブロックごとに復元ピクセルを生成し、ビットストリームからオフセット値を復元し、復元ピクセルを当該オフセットほど調整することにより、原本映像との誤差が最小化された復元映像を生成することができる。
以下、図1A及び図1Bを参照し、SAO調整を行うSAO符号化装置10の動作について詳細に説明し、図2A及び図2Bを参照し、SAO調整を行うSAO復号化装置20の動作について詳細に説明する。
図1A及び図1Bは、一実施形態によるSAO符号化装置10のブロック図と、SAO調整方法のフローチャートとを図示している。
一実施形態によるSAO符号化装置10は、SAO遂行部12、エントロピー符号化部14を含む。一実施形態によるエントロピー符号化部14は、SAOパラメータを符号化するためのSAOコンテクスト符号化部16及びSAOバイパス符号化部18を含む。
一実施形態によるSAO符号化装置10は、ビデオのスライスのような映像を入力され、それぞれの映像をブロックに区画し、ブロック別に符号化する。ブロックのタイプは、正方形または長方形でもあり、任意の幾何学的形態でもある。一定サイズのデータ単位に制限されるものではない。一実施形態によるブロックは、ツリー構造による符号化単位のうちでは、最大符号化単位(LCU:largest coding unit)、符号化単位(CU:coding unit)などでもある。ツリー構造による符号化単位に基づいたビデオ符号化/復号化方式については、図8ないし図20を参照して説明する。
一実施形態によるSAO符号化装置10は、それぞれの入力映像を最大符号化単位に区画し、最大符号化単位ごとに、サンプルに対して、予測、変換、エントロピー符号化を行って生成された結果データを、ビットストリームの形態で出力することができる。最大符号化単位のサンプルは、最大符号化単位に含まれたピクセルのピクセル値データでもある。
一実施形態によるSAO符号化装置10は、ピクチャの最大符号化単位ごとに、符号化を個別的に行うことができる。一実施形態によるSAO符号化装置10は、現在最大符号化単位から分割されたツリー構造の符号化単位を基に、現在最大符号化単位を符号化することができる。
一実施形態によるSAO符号化装置10は、現在最大符号化単位の符号化のために、現在符号化単位に含まれたツリー構造の符号化単位ごとに、イントラ予測、インター予測、変換、量子化を行い、サンプルを符号化することができる。
一実施形態によるSAO符号化装置10は、またツリー構造の符号化単位ごとに、符号化されたサンプルに対して、逆量子化、逆変換、インター予測または動き補償を介して復号化し、現在最大符号化単位に含まれたサンプルを復元することができる。符号化されたサンプルに対して、以前スライスに対して符号化していて復号化を行い、復元映像を生成することができる。現在スライスのインター予測のために、以前スライスの復元映像が参照される。
一実施形態によるSAO遂行部12は、現在最大符号化単位が符号化される前の原本ピクセルと、さらに復号化した後の復元ピクセルとの誤差を最小化させるために、原本ピクセルと復元ピクセルとの差値を示すオフセット値を決定することができる。
一実施形態によるSAO遂行部12は、カラー成分別に、SAO調整を行う。例えば、YCrCbカラー映像については、ルマ成分(Y成分)、並びに第1クロマ成分(Cr成分)及び第2クロマ成分(Cb成分)別にSAO調整が行われる。
一実施形態によるSAO遂行部12は、現在スライスのルマ成分に対して、SAO調整を行うか否かということを決定することができる。一実施形態によるSAO遂行部12は、現在スライスの第1クロマ成分及び第2クロマ成分に対して、SAO調整を行うか否かということを決定するが、同一に決定することができる。すなわち、第1クロマカラー成分に対して、SAO調整が行われるならば、第2クロマ成分に対しても、SAO調整が行われ、第1クロマカラー成分に対して、SAO調整が行われないならば、第2クロマ成分に対しても、SAO調整が行われない。
一実施形態によるエントロピー符号化部14は、現在スライスに係わるスライスSAOパラメータを生成し、現在スライスに係わるスライスヘッダに、SAOパラメータを含めることができる。
また、一実施形態によるSAO遂行部12は、最大符号化単位別に、SAO遂行いかんを決定することができる。一実施形態によるSAOコンテクスト符号化部16は、SAO遂行部12の決定により、ルマ成分に対して、SAO調整を行うか否かということを示すルマSAOオンオフ情報を生成することができる。また、一実施形態によるSAOコンテクスト符号化部16は、SAO遂行部16の決定によって、第1クロマ成分及び第2クロマ成分に対して、SAO調整を行うか否かということを示すクロマSAOオンオフ情報を生成することができる。
一実施形態によるSAOコンテクスト符号化部16は、ルマSAOオンオフ情報及びクロマSAOオンオフ情報を、最大符号化単位のSAOパラメータに含めることができる。
一実施形態によるSAO遂行部12は、最大符号化単位別に、オフセット値を決定することができる。オフセット値、SAOタイプ及びSAOクラスを含むSAOパラメータも、最大符号化単位別に決定することができる。
一実施形態によるSAO遂行部12は、現在最大符号化単位のピクセル値分類方式によって、SAOタイプを決定することができる。一実施形態によるSAOタイプは、エッジタイプまたはバンドタイプとして決定される。現在ブロックのピクセル値分類方式によって、現在ブロックをエッジタイプによってピクセルを分類するか、あるいはバンド形態によってピクセルを分類するのが適するかということが決定される。
一実施形態によるSAOタイプがエッジタイプである場合、現在最大符号化単位の復元ピクセルが、隣接ピクセルと形成するエッジの方向及び形態によって、復元ピクセルと原本ピクセルとのオフセットが決定される。
一実施形態によるSAOタイプがバンドタイプである場合、現在最大符号化単位の復元ピクセルのピクセル値の全範囲を分割した多数のバンドのうち、各バンドに属する復元ピクセルと原本ピクセルとのオフセットが決定される。場合によっては、バンドは、ピクセル値の全範囲を均等な間隔で分割するか、あるいは均等ではない間隔で分割することもできる。
従って、一実施形態によるSAO遂行部12は、現在最大符号化単位のピクセル値の空間的特性に基づいて、エッジタイプであるか、あるいはバンドタイプであるかということを示す現在最大符号化単位のSAOタイプを決定することができる。
一実施形態によるSAO遂行部12は、現在最大符号化単位のSAOタイプによって、復元ピクセルごとに、SAOクラスを決定することができる。一実施形態によるSAOクラスは、エッジクラスまたはバンドクラスとして決定される。
エッジタイプの場合、一実施形態によるエッジクラスは、復元ピクセルが隣接ピクセルと形成するエッジの方向を示すことができる。一実施形態によるエッジクラスは、0゜、90゜、45゜または135゜のエッジ方向を示すことができる。
一実施形態によるSAO遂行部12は、SAOタイプがエッジタイプである場合、現在最大符号化単位の復元ピクセルごとに エッジクラスを決定することができる。
バンドタイプの場合、現在最大符号化単位のピクセル値の全範囲が、所定個数の連続するピクセル値区間に分割されるとき、各ピクセル値区間をバンドと称することができる。一実施形態によるバンドクラスは、復元ピクセルのピクセル値が属するバンドを示すバンド位置を示すことができる。
例えば、一実施形態によるピクセル値が、8ビットであるサンプルである場合、ピクセル値の全範囲は、0ないし255であり、ピクセル値は、全32個のバンドに分割される。その場合、全32個のバンドのうちから、復元ピクセルのピクセル値が属する所定個数のバンドが決定される。一実施形態によるバンドクラスは、連続する所定個数のバンドの開始位置(左側開始地点)を示し、最も先立つバンドの位置は、0ないし31のバンドインデックスで表現される。
エッジタイプの場合、現在最大符号化単位の復元ピクセルは、隣接ピクセルと形成するエッジ形態によって、所定個数のカテゴリーに分類される。例えば、凹状エッジ(concave)の局部最低点(local valley)、凹状エッジの曲線コーナー(corner)、凸状エッジ(convex)の曲線コーナー、凸状エッジの局部最高点(local peak)の4種エッジ形態により、復元ピクセルが4個のカテゴリーに分類される。現在最大符号化単位の復元ピクセルごとに、いかなる形態のエッジを形成するかということにより、4個のカテゴリーのうち1つのカテゴリーに属すると決定される。
バンドタイプの場合、現在最大符号化単位の復元ピクセルのピクセル値が属するバンド位置によって、所定個数のカテゴリーに分類される。例えば、バンドクラスが示す開始位置、すなわち、最左側バンドの開始地点から連続する4個のバンドのバンドインデックスにより、復元ピクセルが4個のカテゴリーに分類される。現在最大符号化単位の復元ピクセルごとに、4個のバンドのうちいずれのバンドに属するかということにより、4個のカテゴリーのうち1つのカテゴリーに属すると決定される。
一実施形態によるSAO遂行部12は、現在最大符号化単位の復元ピクセルごとに、カテゴリーを決定することができる。一実施形態によるSAO遂行部12は、現在符号化単位において、同一カテゴリーに属する復元ピクセルに対して、復元ピクセルと原本ピクセルとの差値を利用して、オフセット値を決定することができる。各カテゴリーごとに、復元ピクセルと原本ピクセルとの差値の平均、すなわち、復元ピクセルの平均誤差を、現在カテゴリーに対応するオフセット値として決定することができる。一実施形態によるSAO遂行部12は、カテゴリーごとにオフセット値を決定し、現在最大符号化単位のためのオフセット値として、全てのカテゴリーのオフセット値を決定することができる。
例えば、現在最大符号化単位のSAOタイプがエッジタイプであり、エッジ形態によって、復元ピクセルが4個のカテゴリーに分類されるか、あるいは現在最大符号化単位のSAOタイプがバンドタイプであり、連続する4個のバンドのインデックスによって、復元ピクセルが4個のカテゴリーに分類される場合、一実施形態によるSAO遂行部12は、4個のカテゴリーごとに、属する復元ピクセルと原本ピクセルとの平均誤差を決定するので、4個のオフセット値を決定することができる。
一実施形態によるオフセット値は、それぞれ既設定の最小値より大きいか、あるいはそれと同じであり、既設定の最大値より小さいか、あるいはそれと同じである。
一実施形態によるエントロピー部符号化部14は、SAO遂行部12で決定された現在最大符号化単位のSAOタイプ、SAOクラス及びオフセット値を含むSAOパラメータを符号化して出力することができる。
各ブロックのSAOパラメータは、各ブロックのSAOタイプとオフセット値とを含んでもよい。SAOタイプとして、オフ(off)タイプ、エッジ(edge)タイプまたはバンド(band)タイプが出力される。
SAOタイプがオフタイプである場合、現在最大符号化単位について、SAO調整技法が適用されないということを示すことができる。その場合、現在最大符号化単位の残りのSAOパラメータも、それ以上符号化される必要がない。
SAOタイプがエッジタイプである場合、SAOパラメータは、エッジクラスのうち各エッジクラスごとに対応するオフセット値を含んでもよい。また、SAOタイプがバンドタイプである場合、SAOパラメータは、バンドのうち各バンドごとに対応するオフセット値を含んでもよい。
前述のところよって、一実施形態によるSAO遂行部12は、映像の最大符号化単位について、各最大符号化単位ごとに、SAO動作を遂行することができる。
一実施形態によるSAOパラメータは、エントロピー方式により、コンテクストに基づいたエントロピー符号化されるパラメータと、バイパスモードによってエントロピー符号化されるパラメータとに分類される。
一実施形態によるコンテクスト基盤のエントロピー符号化方式は、SAOパラメータのようなシンボルを、ビット列に変換する二進化動作と、ビット列に対して、コンテクスト基盤の算術符号化を行う算術符号化動作の一連の動作とによって遂行される。コンテクスト基盤の算術符号化を行う算術符号化方式として、CABAC(context adaptive binary arithmetic coding)などが広く利用されている。コンテクスト基盤の算術符号化/復号化によれば、シンボルビット列の各ビットが、コンテクストの各ビン(bin)になり、各ビット位置が空インデックスにマッピングされる。ビット列長、すなわち、ビンの長さは、シンボル値の大きさによって変わる。コンテクスト基盤の算術符号化/復号化のためには、シンボルのコンテクストに基づいた確率モデリングが必要である。
以前に符号化されたシンボルに基づいて、現在シンボルのコーディングビットを確率的に予測するという仮定下で、コンテクストに基づいた確率モデリングが必要である。コンテクストに基づいた確率モデリングのために、シンボルビット列のビット位置ごとに、すなわち、それぞれの空インデックスごとに、コンテクストを新たに更新する必要がある。ここで、確率モデリングは、各ビンにおいて、0または1が発生する確率を分析する過程である。これまでのコンテクストに対し、新たなブロックのシンボルのビット別確率を分析した結果を反映させてコンテクストを更新する過程が、ブロックごとに
反復される。そのような確率モデリングが反復されることにより、各ビンごとに、発生確率がマッチングされた確率モデルが決定される。
反復される。そのような確率モデリングが反復されることにより、各ビンごとに、発生確率がマッチングされた確率モデルが決定される。
従って、コンテクストに基づいた確率モデルを参照し、現在シンボルの二進化されたビット列の各ビットごとに、現在コンテクストに対応するコードを選択して出力する動作が遂行されることにより、コンテクストに基づいたエントロピー符号化が行われる。
一実施形態によるコンテクストに基づいたエントロピー符号化のために、シンボルの各ビンごとに、コンテクストに基づいた確率モデルを決定する動作は、多くの演算量及び演算時間を要求する。一方、バイパスモードによるエントロピー符号化動作は、シンボルのコンテクストを考慮しない確率モデルを利用するエントロピー符号化動作を意味する。
一実施形態によるエントロピー符号化部14は、SAOパラメータに対して、コンテクストに基づいたエントロピー符号化(以下、「コンテクスト符号化」)を行うSAOコンテクスト符号化部16と、バイパスモードによって、エントロピー符号化(以下、「バイパス符号化」)を行うSAOバイパス符号化部18と、を含んでもよい。
一実施形態によるSAOコンテクスト符号化部16は、最大符号化単位の左向きSAO併合情報、上向きSAO併合情報及びSAOオンオフ情報に対して、コンテクストに基づいたエントロピー符号化を行うことができる。
一実施形態によるSAOバイパス符号化部18は、カラー成分別に、オフセット絶対値情報、及びバンド位置情報またはエッジクラス情報に対して、バイパスモードでエントロピー符号化を行うことができる。
一実施形態によるSAOコンテクスト符号化部16及びSAOバイパス符号化部18が、SAOパラメータを出力する実施形態は、以下の図1BのSAO符号化方法のフローチャートを参照して詳細に説明する。
一実施形態によるSAO遂行部12は、現在スライスの最大符号化単位ごとに、SAOいかん及びSAO方式を決定し、SAOオフセットを決定することができる。
段階11で、SAOコンテクスト符号化部16は、現在最大符号化単位の左向きSAO併合情報に対して、コンテクストに基づいたエントロピー符号化を行い、左向きSAO併合情報の1ビットフラグを生成することができる。また、SAOコンテクスト符号化部16は、現在最大符号化単位の上向きSAO併合情報に対して、コンテクストに基づいたエントロピー符号化を行い、上向きSAO併合情報の1ビットフラグを出力することができる。
一実施形態によるSAO決定部14は、現在最大符号化単位の左側または上端に隣接する最大符号化単位のSAOパラメータを参照し、現在最大符号化単位のSAOパラメータを決定するか否かということを、カラー成分ごとに異なって決定するのではなく、ルマ成分及びクロマ成分について同一に決定することができる。
まず、左側最大符号化単位のSAOパラメータを利用して、現在最大符号化単位のSAOパラメータを予測するか否かということに基づいて、一実施形態によるSAO決定部14は、現在最大符号化単位のための左向きSAO併合情報を生成することができる。すなわち、ルマ成分、並びに第1クロマ成分及び第2クロマ成分の区別なしに、同一の左向きSAO併合情報が生成される。
次に、上端最大符号化単位のSAOパラメータを利用して、現在最大符号化単位のSAOパラメータを予測するか否かということに基づいて、一実施形態によるSAO決定部14は、現在最大符号化単位のための上向きSAO併合情報を生成することができる。ルマ成分、並びに第1クロマ成分及び第2クロマ成分の区別なしに、同一の上向きSAO併合情報が生成される。
段階13で、SAOコンテクスト符号化部16は、カラー成分別に、SAOオンオフ情報に対して、コンテクストに基づいたエントロピー符号化を行うことができる。一実施形態によるSAOコンテクスト符号化部16は、コンテクスト符号化によって生成されたSAOオンオフ情報の1ビットフラグを生成することができる。
一実施形態によるSAO遂行部12は、SAOタイプ情報のうち最初のビットを、現在最大符号化単位で、SAO調整を行うか否かということを示すSAOオンオフ情報に割り当てることができる。一実施形態によるSAOコンテクスト符号化部16は、SAOタイプ情報のうち最初のビンに対してのみ、コンテクストに基づいたCABAC符号化を行うことができる。
一実施形態によるSAOバイパス符号化部18は、SAOオンオフ情報が、SAO動作が遂行されるということを示せば、カラー成分別に、エッジバンド区別情報に対して、バイパスモードでエントロピー符号化を行うことができる。一実施形態によるSAOバイパス符号化部18は、バイパス符号化によって生成されたエッジバンド区別情報の1ビットを出力することができる。
一実施形態によるSAOバイパス符号化部18は、SAOタイプ情報のうち2番目のビットを、現在最大符号化単位について、エッジSAO調整及びバンドSAO調整のうちいずれを行うかということを示すエッジバンド区別情報に割り当てることができる。一実施形態によるSAOバイパス符号化部18は、SAOタイプ情報のうち2番目のビンについては、バイパスモードでCABAC符号化を行うことができる。
すなわち、一実施形態によるエントロピー符号化部14は、SAO動作が遂行されれば、SAOタイプ情報として、コンテクスト符号化されたSAOオンオフ情報のフラグに続いてバイパス符号化されたエッジバンド区別情報のフラグをさらに出力することができる。
一実施形態によるSAO遂行部12は、第1クロマ成分のためのSAOオンオフ情報を、第2クロマ成分に対して同一に適用することができる。また、一実施形態によるSAO遂行部12は、第1クロマ成分のためのエッジバンド区別情報を、第2クロマ成分に対して同一に適用することができる。従って、一実施形態によるエントロピー符号化部14は、ルマ成分及び第1クロマ成分のSAOオンオフ情報、並びにエッジバンド区別情報に対して、エントロピー符号化を行った後、第2クロマ成分のSAOオンオフ情報及びエッジバンド区別情報に対して、さらにエントロピー符号化を行わない。
段階15で、一実施形態によるSAOバイパス符号化部18は、SAOオンオフ情報が、SAO動作が遂行されるということを示せば、カラー成分別に、SAOカテゴリー別オフセット絶対値情報に対して、バイパスモードでエントロピー符号化を行うことができる。一実施形態によるSAOバイパス符号化部18は、バイパス符号化によって生成されたオフセット絶対値情報のビット列を出力することができる。
SAOバイパス符号化部18は、ルマ成分、並びに第1クロマ成分及び第2クロマ成分ごとに、オフセット絶対値情報に対して、バイパス符号化を行うことができる。また、各カラー成分ごとに、4種カテゴリー別に、オフセット絶対値情報に対して、バイパス符号化を行うことができる。
一実施形態によるSAO符号化装置10は、最大符号化単位SAOパラメータのうちオフセットの絶対値(absolute value)情報に対して、バイパスモードでCABAC符号化を行うことができる。オフセットの絶対値情報は、ビデオのビットデプスに基づく範囲以内の値を示すことができる。例えば、ビットデプスが8ビットである場合、オフセット絶対値は、0より大きいか、あるいはそれと同じであり、7より小さいか、あるいはそれと同じ値でもある。他の例として、ビットデプスが10ビットである場合、オフセット絶対値は、0より大きいか、あるいはそれと同じであり、31より小さいか、あるいはそれと同じ値でもある。
段階17で、一実施形態によるSAOバイパス符号化部18は、カラー成分別に、バンド位置情報及びエッジクラス情報のうち一つに対して、バイパスモードでエントロピー符号化を行うことができる。一実施形態によるSAOタイプ情報のビット列のうち、SAOオンオフ情報及びエッジバンド区別情報を除いた残りのビット列が、バンド位置情報またはエッジクラス情報に割り当てられる。一実施形態によるSAOバイパス符号化部18は、バイパス符号化によって生成されたバンド位置情報またはエッジクラス情報の残りのビット列を出力することができる。
エッジバンド区別情報がバンドタイプを示すならば、一実施形態によるSAOバイパス符号化部18は、カラー成分別に、バンド位置情報に対して、バイパッドモードでエントロピー符号化を行うことができる。一実施形態によるバンド位置情報は、バンドタイプのSAOクラスとして、バンドの左側開始地点を示す。一実施形態によるバンド位置情報は、固定ビットレングスのビット列として決定される。
SAOカテゴリー別オフセット絶対値情報が0ではなければ、一実施形態によるSAOバイパス符号化部18は、オフセット符号情報に対して、バイパッドモードでエントロピー符号化を行うことができる。従って、SAOバイパス符号化部18は、バンドSAOタイプであるSAOタイプ情報の残りのビット列として、バイパス符号化されたオフセット符号情報のビット列と、バンド位置情報のビット列とを出力することができる。一実施形態によるSAOバイパス符号化部18は、最大符号化単位のSAOパラメータのうちバンド位置情報を最も最後に出力することができる。
バンドSAOタイプのオフセット符号情報とバンド位置情報は、ルマ成分、並びに第1クロマ成分及び第2クロマ成分ごとに、それぞれ決定される。従って、SAOバイパス符号化部18は、ルマ成分、並びに第1クロマ成分及び第2クロマ成分ごとに、それぞれオフセット符号情報と、バンド位置情報とをバイパス符号化することができる。バイパス符号化によって生成されたバンドクラス情報のビット列が、SAOタイプ情報の残りのビット列として出力される。
エッジバンド区別情報がエッジタイプを示すならば、一実施形態によるSAOバイパス符号化部18は、カラー成分別に、エッジクラス情報に対して、バイパスモードでエントロピー符号化を行うことができる。バイパス符号化によって生成されたエッジクラス情報のビット列、がSAOタイプ情報の残りのビット列として出力される。
一実施形態によるエッジクラス情報は、ルマ成分及び第1クロマ成分別に決定される。第1クロマ成分のために決定されたエッジクラス情報は、第2クロマ成分に同一に適用される。従って、一実施形態によるSAOバイパス符号化部18は、ルマ成分及び第1クロマ成分に対して、エッジクラス情報を設定した後、第2クロマ成分に対して、さらにエッジクラス情報を設定しない。
一実施形態によるSAO符号化装置10は、SAO遂行部12、エントロピー部符号化部14、SAOコンテクスト符号化部16及びSAOバイパス符号化部18を総括的に制御する中央プロセッサ(図示せず)を含んでもよい。または、SAO遂行部12、エントロピー部符号化部14、SAOコンテクスト符号化部16及びSAOバイパス符号化部18が、それぞれの自体プロセッサ(図示せず)によって作動し、プロセッサ(図示せず)が相互有機的に作動することによって、SAO符号化装置10が全体的に作動することもできる。または、一実施形態によるSAO符号化装置10の外部プロセッサ(図示せず)の制御によって、SAO遂行部12、エントロピー部符号化部14、SAOコンテクスト符号化部16及びSAOバイパス符号化部18が制御されもする。
一実施形態によるSAO符号化装置10は、SAO遂行部12、エントロピー部符号化部14、SAOコンテクスト符号化部16及びSAOバイパス符号化部18の入出力データが保存される一つ以上のデータ保存部(図示せず)を含んでもよい。SAO符号化装置10は、データ保存部(図示せず)のデータ入出力を管轄するメモリ制御部(図示せず)を含んでもよい。
一実施形態によるSAO符号化装置10は、ビデオ符号化の結果を出力するために、内部に搭載されたビデオエンコーディング・プロセッサまたは外部ビデオエンコーディング・プロセッサと連繋して作動することにより、変換を含んだビデオ符号化動作を遂行することができる。一実施形態によるSAO符号化装置10の内部ビデオエンコーディング・プロセッサは、別個のプロセッサとして、ビデオ符号化動作を具現することができる。また、SAO符号化装置10、中央演算装置またはグラフィック演算装置が、ビデオエンコーディング・プロセッシング・モジュールを含むことにより、基本的なビデオ符号化動作を具現する場合も可能である。
図2A及び図2Bは一実施形態による、SAO復号化装置20のブロック図と、ビデオ復号化装置のSAO調整方法のフローチャートとを図示している。
一実施形態によるSAO復号化装置20は、エントロピー復号化部22及びSAO調整部28を含む。一実施形態によるSAOコンテクスト復号化部24及びSAOバイパス復号化部26を含む。
一実施形態によるSAO復号化装置20は、ビデオの符号化されたデータを含むビットストリームを受信する。SAO復号化装置20は、受信したビットストリームから、符号化されたビデオサンプルをパージングし、映像ブロック別に、エントロピー復号化、逆量子化、逆変換、予測及び動き補償を行い、復元ピクセルを生成することができる。
一実施形態によるSAO復号化装置20は、受信されたビットストリームから獲得された現在スライスの符号化サンプル、及び符号化情報を含む符号化シンボルに対して復号化を行い、現在スライスを復元することができる。結果として、復元映像が生成される。
また、一実施形態によるSAO復号化装置20は、原本ピクセルと復元ピクセルとの差値を示すオフセット値を受信し、SAO調整部28は、受信されたオフセット値を利用して、原本映像と復元映像との誤差を最小化させることができる。SAO復号化装置20は、ビデオの最大符号化単位別に符号化されたデータを受信し、それぞれの最大符号化単位から分割されたツリー構造の符号化単位を基に、それぞれの最大符号化単位を復元することができる。SAO調整部28は、最大符号化単位において、SAO動作も遂行することができる。
SAO復号化装置20がSAO調整を行うためには、まず、SAO動作を遂行したSAO符号化装置10で決定したSAOパラメータが必要である。一実施形態によるエントロピー復号化部22は、最大符号化単位のビットストリームから、SAOパラメータを獲得することができる。一実施形態によるSAOコンテクスト復号化部24は、最大符号化単位のビットストリームから、左向きSAO併合情報及び上向きSAO併合情報、カラー成分別SAOオンオフ情報を獲得することができる。
一実施形態によるSAOバイパス復号化部26は、SAOオンオフ情報が、SAO動作が遂行されるということを示せば、ビットストリームから、カラー成分別に、エッジバンド区別情報、SAOカテゴリー別オフセット絶対値情報、及びバンド位置情報またはエッジクラス情報を獲得することができる。
それにより、一実施形態によるSAO調整部28は、SAOオンオフ情報が、SAO動作が遂行されるということを示せば、SAOコンテクスト復号化部24及びSAOバイパス復号化部26によって獲得された情報を利用して、最大符号化単位の復元値をSAOカテゴリー別に、オフセット絶対値情報に基づいて調整することができる。
以下、現在最大符号化単位のサンプルを復元してオフセットを調整するためのSAOパラメータを獲得する方法について、図2Bを参照して詳細に説明する。
一実施形態によるSAO復号化装置20は、それぞれシンボルのコード確率モデルを利用して、最大符号化単位別、にシンボルに係わる算術復号化を行うことができる。また、一実施形態によるSAO復号化装置20は、最大符号化単位ごとに更新された確率モデルに基づいて、コンテクストに基づいた算術復号化(以下、「コンテクスト復号化」)を行うことができる。
また、一実施形態によるSAO復号化装置20は、コンテクストを考慮した確率モデルを決定せずに算術復号化を行うバイパスモードのエントロピー復号化(以下、「バイパス復号化」)も行うことができる。
段階21で、一実施形態によるSAOコンテクスト復号化部24は、最大符号化単位のビットストリームから、コンテクスト符号化された左向きSAO併合情報及び上向きSAO併合情報を獲得することができる。
一実施形態によるSAOコンテクスト復号化部24は、左向きSAO併合情報のコンテクストに基づいた確率モデルを決定し、左向きSAO併合情報の確率モデルを利用したエントロピー復号化を行い、左向きSAO併合情報を復元することができる。
一実施形態によるSAOコンテクスト復号化部24は、上向きSAO併合情報のコンテクストに基づいた確率モデルを決定し、上向きSAO併合情報の確率モデルを利用したエントロピー復号化を行い、上向きSAO併合情報を復元することができる。
左向きSAO併合情報が、左側最大符号化単位のSAOパラメータを利用して、現在SAOパラメータを予測するように表示しているならば、カラー成分ごとに、現在最大符号化単位のカラー成分別SAOパラメータとして、左側最大符号化単位に係わるカラー成分別SAOパラメータが採択される。
左向きSAO併合情報が、左側最大符号化単位のSAOパラメータを利用しないように表示されながら、上向きSAO併合情報が、上端最大符号化単位のSAOパラメータを利用して、現在SAOパラメータを予測するように表示しているならば、カラー成分ごとに、現在最大符号化単位のカラー成分別SAOパラメータとして、上端最大符号化単位に係わるカラー成分別SAOパラメータが採択される。
ただし、上向きSAO併合情報が、上端最大符号化単位のSAOパラメータを利用して、現在SAOパラメータを予測しないように表示しているならば、エントロピー復号化部22は、カラー成分ごとに、現在最大符号化単位のSAOパラメータを、ビットストリームから獲得することができる。
段階23で、一実施形態によるSAOコンテクスト復号化部24は、最大符号化単位のビットストリームから、カラー成分別に、コンテクスト符号化されたSAOオンオフ情報を獲得することができる。
一実施形態によるSAOオンオフ情報が、SAO動作が遂行されるということを示せば、一実施形態によるSAOバイパス復号化部26は、最大符号化単位のビットストリームから、カラー成分別に、バイパス符号化されたエッジバンド区別情報をさらに獲得することができる。
一実施形態によるSAOコンテクスト復号化部24は、SAOオンオフ情報のコンテクストに基づいた確率モデルを決定し、SAOオンオフ情報の確率モデルを利用したエントロピー復号化を行い、SAOオンオフ情報を復元することができる。
一実施形態による、第1クロマ成分のためのSAOオンオフ情報は、第2クロマ成分に同一に適用される。従って、一実施形態によるSAOコンテクスト復号化部24は、ルマ成分及び第1クロマ成分の各SAOオンオフ情報を獲得すれば、第2クロマ成分のためのSAOオンオフ情報をさらに獲得しない。
一実施形態による第1クロマ成分のためのエッジバンド区別情報は、第2クロマ成分に同一に適用される。従って、一実施形態によるSAOバイパス復号化部24は、ルマ成分及び第1クロマ成分の各エッジバンド区別情報を獲得すれば、第2クロマ成分のためのエッジバンド区別情報をさらに獲得しない。
段階23で獲得されたSAOオンオフ情報が、SAO動作が遂行されるということを示せば、段階25で、SAOバイパス復号化部26は、最大符号化単位のビットストリームから、カラー成分別に、バイパス符号化されたSAOカテゴリー別オフセット絶対値情報を獲得することができる。
一実施形態によるSAOバイパス復号化部26は、オフセット絶対値情報のコンテクストに基づいた確率モデルなしにエントロピー復号化を行い、オフセット絶対値情報を復元することができる。
段階26で、SAOバイパス復号化部26は、最大符号化単位のビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたバンド位置情報及びエッジクラス情報のうち一つを獲得することができる。
一実施形態によるエッジバンド区別情報がバンドタイプを示すならば、SAOバイパス復号化部26は、ビットストリームから、カラー成分別に、バイパッド符号化されたバンド位置情報を獲得することができる。SAOカテゴリー別に獲得されたオフセット絶対値情報が0ではなければ、SAOバイパス復号化部26、はビットストリームから、カラー成分別に、バイパス符号化されたオフセット符号情報及びバンド位置情報を獲得することができる。一実施形態によるSAOバイパス復号化部26は、最大符号化単位のSAOパラメータのうちバンド位置情報を最も最後に獲得することができる。
一実施形態によるエッジバンド区別情報がエッジタイプを示すならば、SAOバイパス復号化部26は、ビットストリームから、カラー成分別に、バイパス符号化されたエッジクラス情報を獲得することができる。一実施形態によるエッジクラス情報は、ルマ成分のためのエッジクラス情報、及び第1クロマ成分のためのエッジクラス情報を含んでもよい。一実施形態による第1クロマ成分のためのエッジクラス情報は、第2クロマ成分に同一に適用される。一実施形態によるSAOバイパス復号化部24は、ルマ成分及び第1クロマ成分の各エッジクラス情報を獲得すれば、第2クロマ成分のためのエッジクラス情報をさらに獲得しない。
一実施形態によるSAOバイパス復号化部26は、オフセット符号情報のコンテクストに基づいた確率モデルなしにエントロピー復号化を行い、オフセット符号情報を復元することができる。一実施形態によるSAOバイパス復号化部26は、バンド位置情報のコンテクストに基づいた確率モデルなしにエントロピー復号化を行い、バンド位置情報を復元することができる。一実施形態によるSAOバイパス復号化部26は、エッジクラス情報のコンテクストに基づいた確率モデルなしにエントロピー復号化を行い、エッジクラス情報を復元することができる。
一実施形態によるSAO調整部28は、SAO併合情報に基づいて、左側最大符号化単位または上端最大符号化単位のSAOパラメータを利用して、現在最大符号化単位のSAOパラメータを決定することができる。その場合、現在最大符号化単位のSAOパラメータが抽出されずにも、まず、復元された隣接最大符号化単位のSAOパラメータと同一に、現在最大符号化単位のSAOパラメータを復元することもできる。
一実施形態によるSAOコンテクスト復号化部24は、現在最大符号化単位のルマ成分、並びに第1クロマ成分及び第2クロマ成分のために、共通するSAO併合情報を抽出することができる。SAOコンテクスト復号化部24は、共通するSAO併合情報に基づいて、ルマ成分のSAOパラメータ、並びに第1クロマ成分のSAOパラメータ及び第2クロマ成分のSAOパラメータを、隣接する最大符号化単位のSAOパラメータと同一に復元するか否かということを決定することができる。
一実施形態によるエントロピー復号化部22によって獲得されたSAOタイプ情報から、オフタイプ、エッジタイプまたはバンドタイプが決定される。
一実施形態によるSAOタイプ情報のうち最初のビンであるSAOオンオフ情報が、SAOコンテクスト復号化部24によって復元されれば、SAOオンオフ情報に基づいて、現在最大符号化単位で、SAO動作が遂行されるか否かということを決定することができる。SAOタイプがオフタイプである場合、現在最大符号化単位で、SAO調整技法が適用されないということが決定される。その場合、現在最大符号化単位の残りのSAOパラメータも、それ以上パージングされる必要がない。
一実施形態によるSAOバイパス復号化部26は、各カラー成分ごと及び各カテゴリーごとに、オフセットの絶対値を決定することができる。それぞれのオフセット値は、既設定の最小値より大きいか、あるいはそれと同じであり、既設定の最大値より小さいか、あるいはそれと同じである。
一実施形態によるSAOタイプ情報が、バンドタイプを示す場合、SAOバイパス復号化部26は、それによって獲得されたバンド位置情報に基づいて、復元ピクセルのピクセル値が属するバンドの位置が決定される。
一実施形態によるSAOタイプ情報がバンドタイプを示す場合、SAOバイパス復号化部26は、オフセット絶対値が0と決定される場合、オフセット符号情報は、復元されない。SAOバイパス復号化部26は、オフセット絶対値が0ではないならば、オフセット符号情報を獲得し、オフセット値が正数であるか負数であるかということを決定することができる。また、SAOバイパス復号化部26は、オフセット符号情報を獲得した後、バンド位置情報を獲得することができる。
一実施形態によるSAOタイプ情報がバンドタイプを示す場合、SAOバイパス復号化部26は、オフセット絶対値が0と決定される場合、オフセット符号情報は、復元されない。SAOバイパス復号化部26は、オフセット絶対値が0ではないならば、オフセット符号情報を獲得し、オフセット値が正数であるか負数であるかということを決定することができる。また、SAOバイパス復号化部26は、オフセット符号情報を獲得した後、バンド位置情報を獲得することができる。
一実施形態によるSAOタイプ情報がエッジタイプを示す場合、SAOバイパス復号化部26によって獲得されたエッジクラス情報に基づいて、現在最大符号化単位内に含まれた復元ピクセルのエッジの方向が、0゜、90゜、45゜または135゜のうち一つに決定される。
一実施形態によるSAO調整部28は、ルマSAOタイプ情報の2番目ビットに基づいて、現在SAOタイプがエッジタイプであるか、あるいはバンドタイプであるかということ決定し、現在最大符号化単位のルマ成分に対して、エッジSAO調整及びバンドSAO調整のうちいずれか一つを行うことができる。
一実施形態によるSAO調整部28は、クロマSAOタイプ情報の2番目ビットに基づいて、現在SAOタイプがエッジタイプであるか、あるいはバンドタイプであるかということ決定し、現在最大符号化単位の第1クロマ成分及び第2クロマ成分に対して、共にエッジSAO調整を行うか、あるいは共にバンドSAO調整を行うことができる。
また、現在最大符号化単位の第1クロマ成分及び第2クロマ成分に対して、エッジSAO調整を行うと決定された場合、SAO調整部28は、クロマSAOタイプ情報に基づいて、現在最大符号化単位の第1クロマ成分及び第2クロマ成分が、同一エッジクラスを有することを決定することができる。
一実施形態によるSAOバイパス復号化部26によって、SAOパラメータのうちから獲得されたオフセットの絶対値情報は、ビデオのビットデプスに基づく限界値以下の値に制限される。ビデオのビットデプスに基づく範囲以内の値であるオフセット絶対値を示すことができる。例えば、8ビットビットデプスの場合、オフセット絶対値は、0以上7以下の値であり、10ビットビットデプスの場合、オフセット絶対値は、0以上31以下の値でもある。
また、SAOタイプ情報の2番目ビットから、現在最大符号化単位に対して、バンドSAO調整を行うと判読された場合、一実施形態によるSAOバイパス復号化部26は、SAOタイプ情報の2番目ビットの次に続く固定ビットレングスのビットに対して、バイパスモードでCABAC復号化を行うことができる。一実施形態によるSAOバイパス復号化部26は、ルマ成分及びクロマ成分別に、SAOタイプ情報の最後の固定ビットレングスのビットから、バンドの左側開始点に係わる情報が獲得される。
一実施形態によるSAOバイパス復号化部26によって復元されたエッジバンド識別タイプに基づいて、現在最大符号化単位のピクセル値分類方式が、エッジタイプであるか、あるいはバンドタイプであるかということ決定することができる。
一実施形態によるSAO調整部28は、現在最大符号化単位から分割されたツリー構造の符号化単位ごとに決定された差値ほど復元されたサンプルのピクセル値を調整することができる。
一実施形態によるSAO復号化装置20は、エントロピー復号化部22、SAOコンテクスト復号化部24、SAOバイパス復号化部26及びSAO調整部28を総括的に制御する中央プロセッサ(図示せず)を含んでもよい。または、エントロピー復号化部22、SAOコンテクスト復号化部24、SAOバイパス復号化部26及びSAO調整部28が、それぞれの自体プロセッサ(図示せず)によって作動し、プロセッサ(図示せず)が、相互有機的に作動することによって、SAO復号化装置20が全体的に作動することもできる。または、一実施形態によるSAO復号化装置20の外部プロセッサ(図示せず)の制御によって、エントロピー復号化部22、SAOコンテクスト復号化部24、SAOバイパス復号化部26及びSAO調整部28が制御されもする。
一実施形態によるSAO復号化装置20は、エントロピー復号化部22、SAOコンテクスト復号化部24、SAOバイパス復号化部26及びSAO調整部28の入出力データが保存される一つ以上のデータ保存部(図示せず)を含んでもよい。SAO復号化装置20は、データ保存部(図示せず)のデータ入出力を管轄するメモリ制御部(図示せず)を含んでもよい。
一実施形態によるSAO復号化装置20は、ビデオ復号化を介してビデオを復元するために、内部に搭載されたビデオデコーディング・プロセッサまたは外部ビデオデコーディング・プロセッサと連繋して作動することにより、ビデオ復号化動作を遂行することができる。一実施形態によるSAO復号化装置20の内部ビデオデコーディング・プロセッサは、別個のプロセッサでもって、基本的なビデオ復号化動作を具現することができる。また、SAO復号化装置20、中央演算装置またはグラフィック演算装置が、ビデオデコーディング・プロセッシング・モジュールを含むことにより、基本的なビデオ復号化動作を具現する場合も含んでもよい。
以下、図3を参照し、SAO技法を利用するビデオ復号化方式について詳細に説明する。図3は、一実施形態によるビデオ復号化装置30のブロック図を図示している。
ビデオ復号化装置30は、エントロピー復号化部31、逆量子化部32、逆変換部33、復元部34、イントラ予測部35、参照ピクチャバッファ36、動き補償部37、デブロッキング・フィルタリング部38、SAO部39を含む。
ビデオ復号化装置30は、符号化されたビデオデータを含むビットストリームを受信することができる。エントロピー復号化部31において、ビットストリームから、イントラモード情報(intra mode information)、インターモード情報(inter mode information)、SAO情報(sample adaptive offset information)、レジデュデータ(residues)がパージングされる。
エントロピー復号化部31によって抽出されたレジデュデータは、量子化された変換係数でもある。従って、逆量子化部32において、レジデュデータに対して逆量子化を行って変換係数を復元し、逆変換部33において、復元された復元係数に対して逆変換を行い、空間領域のレジデュ値を復元することができる。
空間領域のレジデュ値を予測復元するために、イントラ予測または動き補償が行われる。
エントロピー復号化部31において、イントラモード情報が抽出された場合には、イントラ予測部35が、イントラモード情報を利用して、現在サンプルに空間的に隣接する隣接サンプルのうちいずれかのサンプルを参照し、現在サンプルを復元するか否かということを決定することができる。参照する隣接サンプルを、復元部34によって、以前に復元されたサンプルのうちからも選択される。復元部34は、イントラモード情報に基づいて、決定された参照サンプルと、逆変換部33で復元されたレジデュ値とを利用して、現在サンプルを復元することができる。
エントロピー復号化部31において、インターモード情報が抽出された場合には、動き補償部37が、インターモード情報を利用して、現在ピクチャより先に復元されたピクチャのうちいずれかのサンプルを参照し、現在ピクチャの現在サンプルを復元するか否かということを決定することができる。インターモード情報は、動きベクトル、参照インデックスなどを含んでもよい。参照インデックスを利用して、現在ピクチャより先に復元され、参照ピクチャバッファ36に保存されたピクチャのうち、現在サンプルの動き補償のための参照ピクチャが決定される。動きベクトルを利用して、参照ピクチャのうち、現在ブロックの動き補償のための参照ブロックが決定される。復元部34は、インターモード情報に基づいて、決定された参照ブロックと、逆変換部33で復元されたレジデュ値とを利用して、現在サンプルを復元することができる。
復元部34でサンプルが復元され、復元ピクセルが出力される。復元部34は、最大符号化単位ごとに、ツリー構造の符号化単位を基に、復元ピクセルを生成することができる。
デブロッキング・フィルタリング部38で、最大符号化単位またはツリー構造の符号化単位ごとに、符号化単位の境界領域に位置するピクセルに対して、ブロッキング現象を軽減させるためのフィルタリングが行われる。
また、一実施形態によるSAO部39は、SAO技法によって、最大符号化単位別に、復元ピクセルのオフセットを調整することができる。SAO部39は、エントロピー復号化部31に抽出されたSAO情報から、現在最大符号化単位のための、SAOタイプ、SAOクラス、オフセット値を決定することができる。
エントロピー復号化部31において、SAO情報から抽出する動作は、SAO復号化装置20のSAOパラメータ抽出部22の動作に相応し、SAO部39の動作は、SAO復号化装置20のSAO決定部24及びSAO調整部26の動作に相応する。
SAO部39は、SAOオフセット値から、現在最大符号化単位の復元ピクセルごとに、オフセット値の符号及び差値を決定することができる。SAO部39は、復元ピクセルごとに、オフセット値から決定された差値ほど、ピクセル値を増加させたり、あるいは低減させることにより、復元ピクセルと原本ピクセルとの誤差を減らすことができる。
一実施形態によるSAO部39によって、オフセットが調整された復元ピクセルを含むピクチャが、参照ピクチャバッファ36に保存される。従って、一実施形態によるSAO技法によって、復元サンプルと原本ピクセルとの誤差が最小化された参照ピクチャを利用して、次のピクチャの動き補償が行われる。
一実施形態によるSAO技法によれば、復元ピクセルごとに、原本ピクセルとの差値を基に、復元ピクセルを含むピクセルグループのオフセットが決定される。まず、一実施形態によるSAO技法のために、復元ピクセルをピクセルグループに分類する実施形態について詳細に説明する。
一実施形態によるSAO技法によれば、(i)復元ピクセルが構成するエッジタイプによって、ピクセルが分類されるか、あるいは(ii)復元ピクセルのバンドタイプによって、ピクセルが分類される。一実施形態による、ピクセルが、エッジタイプによって分類されるか、あるいはバンドタイプによって分類されるかということは、SAOタイプによって定義される。
まず、一実施形態によるSAO技法によって、エッジタイプによって、ピクセルを分類する実施形態について詳細に説明する。
現在最大符号化単位に対して、エッジタイプのオフセットを決定する場合、現在最大符号化単位に含まれた各復元ピクセルのエッジクラスが決定される。すなわち、現在復元ピクセルと隣接ピクセルとのピクセル値を比較し、現在復元ピクセルのエッジクラスが定義される。エッジクラスが決定される一例について、図4を参照して説明する。
図4は、一実施形態によるエッジタイプのエッジクラスを図示している。
エッジクラス41,42,43,44のインデックスが、順に0、1、2、3と割り当てられる。エッジタイプの発生頻度が高いほど、エッジタイプのインデックスは、小さく割り当てられる。
エッジクラスは、現在復元ピクセルX0と隣接する2個の隣接ピクセルが形成する一次元エッジの方向を示すことができる。インデックス0のエッジクラス41は、現在復元ピクセルX0と水平方向に隣接する2個の隣接ピクセルX1,X2がエッジを形成する場合を示す。インデックス1のエッジクラス42は、現在復元ピクセルX0と垂直方向に隣接する2個の隣接ピクセルX3,X4がエッジを形成する場合を示す。インデックス2のエッジクラス43は、現在復元ピクセルX0に、135゜対角方向に隣接する2個の隣接ピクセルX5,X8がエッジを形成する場合を示す。インデックス3のエッジクラス44は、現在復元ピクセルX0に、45゜対角方向に隣接する2個の隣接ピクセルX6,X7がエッジを形成する場合を示す。
従って、現在最大符号化単位内に含まれた復元ピクセルのエッジ方向を分析し、現在最大符号化単位で、強いエッジの方向を決定することにより、現在最大符号化単位のエッジクラスが決定される。
各エッジクラスごとに、現在ピクセルのエッジ形態によって、カテゴリーが分類される。エッジ形態によるカテゴリーの一例について、図5A及び図5Bを参照して説明する。
図5A及び図5Bは、一実施形態によるエッジタイプのカテゴリーを図示している。
エッジカテゴリーは、現在ピクセルが凹状エッジの最低点であるか、凹状エッジの最低点周囲に位置する曲線コーナーのピクセルであるか、凸状エッジの最高点であるか、あるいは凸状エッジの最高点周囲に位置する曲線コーナーのピクセルであるかということを示す。
図5Aは、エッジのカテゴリーを決定するための条件を例示する。図5Bは、復元ピクセルと隣接ピクセルとのエッジ形態、及びピクセル値c,a,bのグラフを例示する。
cは、復元ピクセルのインデックス、a,bは、エッジ方向によって、現在復元ピクセルに両側に隣接する隣接ピクセルのインデックスを示す。Xa,Xb,Xcは、それぞれインデックスa,b,cである復元ピクセルのピクセル値を示す。図5Bのグラフのx軸は、復元ピクセルと、両側に接する隣接ピクセルとのインデックスを、y軸は、各サンプルのピクセル値を示す。
カテゴリー1は、現在サンプルが、凹状エッジの最低点、すなわち、ローカルバレー(local valley)地点である場合を示す(Xc<Xa && Xc<Xb)。グラフ51のように、隣接ピクセルa,b間で、現在復元ピクセルcが凹状エッジの最低点である場合、現在復元ピクセルは、カテゴリー1に分類される。
カテゴリー2は、現在サンプルが凹状エッジの最低点周辺に位置する曲線コーナー(concave corners)に位置する場合を示す(Xc<Xa && Xc==Xb||Xc==Xa && Xc<Xb)。グラフ52のように、隣接ピクセルa,b間で、現在復元ピクセルcが凹状エッジの下降カーブが終了する地点に位置するか(Xc<Xa && Xc==Xb)、あるいはグラフ53のように、現在復元ピクセルcが凹状エッジの上昇カーブが始まる地点に位置するか(Xc==Xa && Xc<Xb)というような場合、現在復元ピクセルは、カテゴリー2に分類される。
カテゴリー3は、現在サンプルが凸状エッジの最高点周辺に位置する曲線コーナー(convex corners)に位置する場合を示す(Xc>Xa && Xc==Xb||Xc==Xa && Xc>Xb)。グラフ54のように、隣接ピクセルa,b間で、現在復元ピクセルcが凹状エッジの下降カーブが始まる地点に位置するか(Xc==Xa &&
c>Xb)、あるいはグラフ55のように、現在復元ピクセルcが凹状エッジの上昇カーブが終了する地点に位置するか(Xc>Xa && Xc==Xb)というような場合、現在復元ピクセルは、カテゴリー3に分類される。
c>Xb)、あるいはグラフ55のように、現在復元ピクセルcが凹状エッジの上昇カーブが終了する地点に位置するか(Xc>Xa && Xc==Xb)というような場合、現在復元ピクセルは、カテゴリー3に分類される。
カテゴリー4は、現在サンプルが凸状エッジの最高点、すなわち、ローカルピーク(local peak)地点である場合を示す(Xc>Xa && Xc>Xb)。グラフ56のように、隣接ピクセルa,b間で、現在復元ピクセルcが凸状エッジの最高点である場合、現在復元ピクセルは、カテゴリー4に分類される。
現在復元ピクセルに対して、カテゴリー1,2,3,4の条件がいずれも充足されない場合には、エッジではないので、カテゴリー0に分類され、カテゴリー0に係わるオフセットは、別途に符号化される必要はない。
一実施形態によって、同一カテゴリーに該当する復元ピクセルに対して、復元ピクセルと原本ピクセルとの差値の平均値が、現在カテゴリーのオフセットとして決定される。また、各カテゴリーごとに、オフセットが決定される。
カテゴリー1,2の凹状エッジは、正数オフセット値によって、復元ピクセル値が調整されるならば、エッジが平坦になるスムージング(smoothing)効果が発生し、負数オフセット値によって、エッジの先鋭度(sharpeness)が高くなるシャープニング(sharpening)効果が生じる。カテゴリー3,4の凸状エッジは、負数オフセット値によって、エッジのスムージング効果が生じ、正数オフセット値によってエッジのシャープニング効果が生じる。
一実施形態によるSAO符号化装置10は、エッジのシャープニング効果を許容しない。その場合、は、カテゴリー1,2の凹状エッジについては、正数オフセット値が必要であり、カテゴリー3,4の凸状エッジについては、負数オフセット値が必要である。その場合、エッジのカテゴリーを知っているならば、オフセット値の符号を決定することができる。従って、SAO符号化装置10と、SAO復号化装置20は、オフセット値の符号は除き、オフセット値の絶対値さえ送受信すればよい。
従って、SAO符号化装置10は、現在エッジクラスのカテゴリーごとに、対応するオフセット値を符号化して送信し、SAO復号化装置20は、受信されたカテゴリー別オフセット値を利用して、復元ピクセルごとに、当該カテゴリーのオフセット値ほど調整することができる。
例えば、エッジタイプのオフセット値が0と決定される場合、SAO符号化装置10は、エッジクラス情報だけ伝送することができる。
例えば、エッジタイプのオフセット絶対値が0ではない場合には、SAO符号化装置10は、オフセット絶対値及びエッジクラス情報を伝送することができる。エッジタイプである場合には、オフセット符号情報を伝送する必要がない。
SAO復号化装置20は、受信されたオフセット絶対値が0ではないならば、エッジタイプのオフセット絶対値情報を判読することができる。オフセット値の符号は、復元ピクセルと隣接ピクセルとのエッジ形態によるエッジカテゴリーによって予測される。
従って、一実施形態によるSAO符号化装置10は、エッジ方向、エッジ形態によってピクセルを分類し、同一特性のピクセル間の平均誤差値をオフセット値として決定し、カテゴリー別に、オフセット値を決定することができる。SAO符号化装置10は、エッジタイプであるということを示すSAOタイプ情報、エッジ方向を示すSAOクラス情報、及びオフセット値を符号化して伝送することができる。
一実施形態によるSAO復号化装置20は、SAOタイプ情報、SAOクラス情報及びオフセット値を受信し、SAOタイプ情報及びSAOクラス情報によって、エッジ方向を決定することができる。SAO復号化装置20は、復元ピクセルごとに、エッジ方向によるエッジ形態に対応するカテゴリー別オフセット値を決定し、復元ピクセルのピクセル値を、オフセット値ほど調整することにより、原本映像と復元映像との誤差を最小化させることができる。
次に、一実施形態によるSAO技法によって、バンドタイプによって、ピクセルを分類する実施形態について詳細に説明する。
一実施形態によって、復元ピクセルのピクセル値は、それぞれバンドのうち一つに属する。例えば、ピクセル値の最小値Min及び最大値Maxは、pビットサンプリングによって、全範囲が0、…、2^(p−1)でもある。ピクセル値全範囲(Min,Max)は、K個のピクセル値区間に分割される場合、各ピクセル値区間をバンドと称する。Bkが、k番目バンドの最大値を示す場合、バンドは、[B0,B1−1]、[B1,B2−1]、[B2,B3−1]、…、[Bk−1,Bk]に分割される。現在復元ピクセルRec(x,y)のピクセル値が、[Bk−1,Bk]に属する場合、現在バンドは、kと決定される。バンドは、均等なタイプに分割されるか、あるいは均等ではないタイプに分割されもする。
例えば、ピクセル値分類タイプが、8ビットピクセルの均等バンドである場合、ピクセル値は、32個のバンドに分割される。具体的には、[0,7]、[8,15]、…、[240,247]、[248,255]のバンドに分類される。
バンドタイプによって分類された多数のバンドのうち、復元ピクセルごとに、それぞれのピクセル値が属するバンドが決定される。また、それぞれのバンドごとに、原本ピクセルと復元ピクセルとの誤差の平均を示すオフセット値が決定される。
従って、SAO符号化装置10及びSAO復号化装置20は、現在バンドタイプによって分類されたバンドごとに、対応するオフセットを符号化して送受信し、復元ピクセルを、オフセットほど調整することができる。
従って、一実施形態によるSAO符号化装置10及びSAO復号化装置20は、バンドタイプの場合、復元ピクセルを、それぞれのピクセル値が属するバンドによって分類し、同一バンドに属する復元ピクセル間の平均誤差値をオフセットとして決定し、復元ピクセルをオフセットほど調整することにより、原本映像と復元映像との誤差を最小化させることができる。
一実施形態によるSAO符号化装置10及びSAO復号化装置20は、バンドタイプによるオフセットを決定するとき、復元ピクセルを、バンド位置によるカテゴリーに分類することができる。例えば、ピクセル値の全範囲が、K個のバンドに分類される場合、k番目バンドを示すバンドインデックスkによって,カテゴリーがインデキシングされる。バンド個数に相応してカテゴリーの個数が決定される。
ただし、データ節減のために、SAO符号化装置10及びSAO復号化装置20は、SAO技法によってオフセットを決定するために利用されるカテゴリーの個数を制限することができる。例えば、所定開始位置のバンドから、バンドインデックスが増加する方向に連続する所定個数のバンドだけが、それぞれカテゴリーに割り当てられ、各カテゴリーに対してのみオフセットが決定される。
例えば、インデックス12であるバンドが、開始バンドとして決定される場合、開始バンドから4個のバンド、すなわち、インデックス12,13,14,15のバンドが、それぞれカテゴリー1,2,3,4に割り当てられる。従って、インデックス12のバンドに含まれる復元ピクセルの原本ピクセルとの平均誤差が、カテゴリー1のオフセットとして決定される。それと類似して、インデックス13のバンドに含まれる復元ピクセルの原本ピクセルとの平均誤差が、カテゴリー2のオフセットとして決定され、インデックス14のバンドに含まれる復元ピクセルの原本ピクセルとの平均誤差が、カテゴリー3のオフセットとして決定され、インデックス15のバンドに含まれる復元ピクセルの原本ピクセルとの平均誤差が、カテゴリー4のオフセットとして決定される。
そのような場合、カテゴリーに割り当てられるバンドの位置を決定するために、バンド範囲が始まる位置、すなわち、左側バンドの位置に係わる情報が必要である。従って、一実施形態によるSAO符号化装置10は、SAOクラスとして、左側バンドの位置を示す左側開始地点情報を符号化して送信することができる。SAO符号化装置10は、バンドタイプであるということを示すSAOタイプ、SAOクラス及びカテゴリー別オフセット値を符号化して伝送することができる。
一実施形態によるSAO復号化装置20は、SAOタイプ、SAOクラス及びカテゴリー別オフセット値を受信することができる。SAO復号化装置20は、受信されたSAOタイプがバンドタイプである場合、SAOクラスから、開始バンドの位置を判読することができる。SAO復号化装置20は、復元ピクセルが、開始バンドから、4個のバンドのうちいずれのバンドに属するかということを決定し、カテゴリー別オフセット値のうち現在バンドに割り当てられたオフセット値を決定し、復元ピクセル値をオフセット値ほど調整することができる。
以上、SAOタイプとして、エッジタイプ及びバンドタイプを紹介し、SAOタイプによるSAOクラス及びカテゴリーについて詳細に説明した。以下、SAO符号化装置10及びSAO復号化装置20が符号化して送受信するSAOパラメータについて詳細に説明する。
一実施形態によるSAO符号化装置10及びSAO復号化装置20は、最大符号化単位ごとに、復元ピクセルのピクセル分類方式によって、SAOタイプを決定することができる。
各ブロックの映像特性によって、SAOタイプが決定される。例えば、垂直エッジ、水平エッジ、対角エッジなどを含む最大符号化単位は、エッジ値修正のために、エッジタイプによって、ピクセル値を分類し、オフセット値を決定する方が有利である。エッジ領域ではない場合には、バンド分類によって、オフセット値を決定する方が有利でもある。従って、SAO符号化装置10及びSAO復号化装置20は、最大符号化単位ごとに、SAOタイプをシグナリングすることができる。
一実施形態によるSAO符号化装置10及びSAO復号化装置20は、最大符号化単位ごとに、SAOパラメータを決定することができる。すなわち、最大符号化単位の復元ピクセルのSAOタイプを決定し、最大符号化単位の復元ピクセルを、カテゴリー別に分類し、カテゴリー別にオフセット値が決定される。
SAO符号化装置10は、最大符号化単位に含まれた復元ピクセルのうち、同一カテゴリーに分類された復元ピクセルの平均誤差をオフセット値として決定することができる。各カテゴリーごとに、オフセット値が決定される。
一実施形態によるSAOパラメータは、SAOタイプ、オフセット値、SAOクラスを含んでもよい。SAO符号化装置10及びSAO復号化装置20は、最大符号化単位ごとに、決定されたSAOパラメータを送受信することができる。
一実施形態によるSAO符号化装置10は、最大符号化単位のSAOパラメータのうち、SAOタイプ及びオフセット値を符号化して伝送することができる。SAOタイプがエッジタイプである場合、一実施形態によるSAO符号化装置10は、SAOタイプ、カテゴリー別オフセット値に続いて、エッジ方向を示すSAOクラスをさらに伝送することができる。SAOタイプがバンドタイプである場合、一実施形態によるSAO符号化装置10は、SAOタイプ、カテゴリー別オフセット値に続いて、開始バンドの位置を示すSAOクラスをさらに伝送することができる。SAOクラスは、エッジタイプである場合には、エッジクラス情報に分類され、バンドタイプである場合には、バンド位置情報に分類される。
一実施形態によるSAO復号化装置20は、最大符号化単位ごとに、SAOタイプ、オフセット値及びをSAOクラスを含むSAOパラメータを受信することができる。また一実施形態によるSAO復号化装置20は、カテゴリー別オフセット値のうち、それぞれの復元ピクセルが属するカテゴリーのオフセット値を選択し、復元ピクセルごとに選択されたオフセット値ほど調整することができる。
一実施形態によるSAOパラメータのうち、オフセット値を送受信する実施形態については後述する。
一実施形態によるSAO符号化装置10は、オフセット値を伝送するために、符号情報、残りのオフセット絶対値をさらに伝送することもできる。
オフセット絶対値が0である場合には、符号情報や残りのオフセット値が、それ以上符号化される必要がない。ただし、オフセット絶対値が0ではない場合には、符号情報及び残りのオフセット絶対値がさらに伝送される。
ただし、前述のように、エッジタイプの場合、カテゴリーによって、オフセット値が正数であるか、あるいは負数であるかということが予測可能であるので、符号情報が伝送される必要ない。
一実施形態によるオフセット値(Off−set)は、オフセット値を決定する以前に、あらかじめ最小値(MinOffSet)及び最大値(MaxOffSet)の範囲に制限される。(MinOffSet≦Off−set≦MaxOffSet)
例えば、エッジタイプの場合、カテゴリー1,2の復元ピクセルに係わるオフセット値は、最小値0及び最大値7の範囲内で決定される。エッジタイプの場合、カテゴリー3,4の復元ピクセルに係わるオフセット値は、最小値−7及び最大値0の範囲内で決定される。
例えば、エッジタイプの場合、カテゴリー1,2の復元ピクセルに係わるオフセット値は、最小値0及び最大値7の範囲内で決定される。エッジタイプの場合、カテゴリー3,4の復元ピクセルに係わるオフセット値は、最小値−7及び最大値0の範囲内で決定される。
例えば、バンドタイプの場合、全てのカテゴリーの復元ピクセルに係わるオフセット値は、最小値−7ないし最大値7の範囲内で決定される。
一実施形態によるオフセット値に係わる伝送ビットを節減するために、残りのオフセット値(remainder)を、負数ではないpビット値に制限することができる。その場合、残りのオフセット値は、0より大きいか、あるいはそれと同じであるが、最大値と最小値との差値よりは小さいか、あるいはそれと同じである(0≦Remainder≦MaxOffSet−MinOffSet+1≦2^p)。SAO符号化装置10が、残りのオフセット値を伝送し、SAO復号化装置20が、オフセット値の最大値及び最小値のうち少なくとも一つを知ることができるならば、受信された残りのオフセット値だけで、原本オフセット値を復元することができる。
以下、一実施形態によるSAOパラメータのうち、SAO併合情報について詳細に説明する。
各ブロックのSAOタイプ及び/またはオフセット値は、隣接したブロック間で同一であるという可能性が高い。一実施形態によるSAO符号化装置10は、現在ブロックのSAOパラメータ、を隣接ブロックのSAOパラメータと比較し、SAOパラメータが同一である場合、現在ブロックと隣接ブロックとのSAOパラメータを一つに併合して符号化することができる。隣接ブロックのSAOパラメータが先に符号化されるならば、現在ブロックのSAOパラメータとして、隣接ブロックのSAOパラメータを採択することができる。従って、SAO符号化装置10は、現在ブロックのSAOパラメータを符号化せず、現在ブロックに対して、SAO併合情報だけ符号化することができる。
一実施形態によるSAO復号化装置20は、受信したビットストリームから、SAOパラメータをパージングする前に、SAO併合情報を先にパージングし、SAOパラメータのパージングいかんを決定することができる。SAO復号化装置20は、現在ブロックのSAO併合情報に基づいて、隣接ブロックのうち、現在ブロックと、SAOパラメータが同一であるブロックがあるか否かということを決定することができる。
例えば、SAO併合情報に基づいて、隣接ブロックのSAOパラメータのうち、現在ブロックとSAOパラメータが同一であるブロックがある場合、SAO復号化装置20は、現在ブロックのSAOパラメータをパージングせず、現在ブロックのSAOパラメータとして、隣接ブロックの復元されたSAOパラメータを採択することができる。従って、SAO復号化装置20は、隣接ブロックのSAOパラメータと同一に、現在ブロックのSAOパラメータを復元することができる。またS、AO併合情報に基づいて、隣接ブロックのうち、いずれか隣接ブロックのSAOパラメータを参照するか否かということも決定される。
例えば、SAO併合情報に基づいて、隣接ブロックのSAOパラメータが、現在ブロックのSAOパラメータと異なっている場合、SAO復号化装置20は、ビットストリームから、現在ブロックのSAOパラメータをパージングして復元することができる。
図6Aは、一実施形態による、SAOパラメータを併合するために参照される隣接最大符号化単位652,653を図示している。
一実施形態によるSAO符号化装置10は、現在最大符号化単位651より先行して復元された隣接最大符号化単位のうち、現在最大符号化単位のSAOパラメータの参照対象になる隣接最大符号化単位の候補リストを決定することができる。SAO符号化装置10は、候補リストの隣接最大符号化単位と、現在最大符号化単位とのSAOパラメータを比較することができる。
単純な例として、現在ブロック651と同一である、現在ピクチャ65に位置する左側最大符号化単位653、上端最大符号化単位652が候補リストに属することができる。
従って、一実施形態によるSAO符号化装置10は、候補リストに含まれた隣接最大符号化単位を参照順序によって、現在最大符号化単位と、それぞれのSAOパラメータが同一である否かということを比較することができる。例えば、左側最大符号化単位653、上端最大符号化単位652の順序によって、現在最大符号化単位と、SAOパラメータが比較される。比較された最大符号化単位653,652のうち、SAOパラメータが同一である最大符号化単位が参照最大符号化単位として決定される。
SAO符号化装置10及びSAO復号化装置20は、現在最大符号化単位のSAOパラメータを予測するために、同一の隣接最大符号化単位を参照することができる。また、いずれの最大符号化単位のSAOパラメータを参照するかということを示すSAO併合情報を送受信することができる。一実施形態によるビデオ復号化装置10は、SAO併合情報に基づいて、隣接する最大符号化単位のうち一つを選択し、選択された隣接最大符号化単位のSAOパラメータと同一に、現在最大符号化単位のSAOパラメータを復元することができる。
例えば、左側最大符号化単位653及び上端最大符号化単位652を参照する場合を想定する。一実施形態によるSAOパラメータ符号化部16は、SAO併合情報として、現在最大符号化単位651の左側最大符号化単位653のSAOパラメータが、現在最大符号化単位651のSAOパラメータと同一であるか否かということを示す左向きSAO併合情報と、上端最大符号化単位652のSAOパラメータが、現在最大符号化単位651のSAOパラメータと同一であるか否かということを示す上向きSAO併合情報と、を符号化することができる。その場合、まず、現在最大符号化単位651と、左側最大符号化単位653とのSAOパラメータが同一であるか否か比較し、その次に、現在最大符号化単位651と、上端最大符号化単位652とのSAOパラメータが同一であるか否か比較することができる。比較結果によって、SAO併合情報が決定される。
最大符号化単位ブロック653及び最大符号化単位ブロック652のうち少なくとも1つのSAOパラメータが、現在最大符号化単位651のSAOパラメータと同一であるならば、SAOパラメータ符号化部16は、当該左向きSAO併合情報及び上向きSAO併合情報だけ符号化し、現在最大符号化単位651のSAOパラメータは、符号化しない。
左側最大符号化単位653及び上端最大符号化単位652のSAOパラメータが、いずれも現在最大符号化単位651のSAOパラメータと異なっていれば、SAOパラメータ符号化部16は、当該左向きSAO併合情報及び上向きSAO併合情報と、現在最大符号化単位651のSAOパラメータと、を符号化することができる。
以下、カラー成分別SAOパラメータについて詳細に説明する。
一実施形態によるSAO符号化装置10及びSAO復号化装置20は、カラー成分の間に、SAOパラメータを相互予測することができる。
一実施形態によるSAO符号化装置10及びSAO復号化装置20は、YCrCbカラーフォーマットのルマブロック及びクロマブロックに対して、いずれもSAO調整を行うことができる。現在最大符号化単位のルマ(Y)成分、並びに第1クロマ(Cr)成分及び第2クロマ(Cb)成分ごとに、オフセット値が決定される。
例えば、現在最大符号化単位のY成分、Cr成分及びCb成分について共通するSAO併合情報が適用される。すなわち、1つのSAO併合情報に基づいて、Y成分のSAOパラメータが、隣接最大符号化単位のY成分のSAOパラメータと同一であるか否かということが決定され、Cr成分のSAOパラメータが、隣接最大符号化単位のCr成分のSAOパラメータと同一であるか否かということが決定され、Cb成分のSAOパラメータが、隣接最大符号化単位のCb成分のSAOパラメータと同一であるか否かということが決定される。
例えば、現在最大符号化単位のCr成分及びCb成分について共通するSAOタイプ情報が適用される。すなわち、1つのSAOタイプ情報に基づいて、Cr成分及びCb成分に対して、同時にSAO調整が行われるか、あるいは同時に行われないかということが決定される。また、1つのSAOタイプ情報に基づいて、Cr成分及びCb成分が、エッジタイプまたはバンドタイプによって、オフセット値が決定されるか否かということが分かる。1つのSAOタイプ情報に基づいて、SAOタイプがエッジタイプであるならば、Cr成分及びCb成分が同一であるエッジ方向を共有することができる。
すなわち、1つのSAOタイプ情報に基づいて、Cr成分及びCb成分がエッジタイプまたはバンドタイプによって、オフセット値が決定されるか否かということが分かる。
また、1つのSAOタイプ情報に基づいて、Cr成分及びCb成分が同一であるSAOクラスを共有することができる。1つのSAOタイプ情報に基づいて、SAOタイプがエッジタイプであるならば、Cr成分及びCb成分が同一であるエッジ方向を共有することができる。1つのSAOタイプ情報に基づいて、SAOタイプがバンドタイプであるならば、Cr成分及びCb成分が同一である左側バンド開始位置を共有することができる。
以下、図6B、図7Aないし図7Cを参照し、現在最大符号化単位のSAOパラメータが定義されたシンタックス構造について詳細に説明する。
図6Bは、他の実施形態によるSAOパラメータ60のエントロピー符号化方式を図示している。
SAO動作が最大符号化単位の各カラー成分別に行われるので、図6AのSAOパラメータ60は、カラー成分別に個別的に獲得される。ルマ成分、並びに第1クロマ成分及び第2クロマ成分を示すカラーインデックス「cIdx」が変更されることにより、別途のSAOパラメータ60が獲得される。
SAOパラメータ60は、左向きSAO併合情報を示すパラメータ「sao_merge_left_flag」、上向きSAO併合情報を示すパラメータ「sao_merge_up_flag」、SAOタイプ情報を示すパラメータ「sao_type_idx」、バンドタイプのバンド位置情報を示すパラメータ「sao_band_position」、オフセット絶対値情報を示すパラメータ「sao_offset_abs」、オフセット符号情報を示すパラメータ「sao_offset_sign」を含んでもよい。従って、カラーインデックス「cIdx」が0、1、2に設定されるたびに、「sao_merge_left_flag」、「sao_merge_up_flag」、「sao_type_idx」、「sao_band_position」、「sao_offset_abs」、「sao_offset_sign」がさらに獲得される。
特に、オフセット絶対値情報を示すパラメータ「sao_offset_abs」、オフセット符号情報を示すパラメータ「sao_offset_sign」は、4種のSAOカテゴリーごとに、別途に獲得される。従って、各カラー成分ごとに、4種のSAOカテゴリーごとに、「sao_offset_abs」及び「sao_offset_sign」が獲得される。
また、SAOパラメータ60のパラメータごとに、エントロピー符号化方式が異なる。獲得されたパラメータが、エントロピー符号化された方式によっ、てコンテクスト復号化またはバイパス復号化が行われる。
例えば、パラメータ「sao_merge_left_flag」を示す1個のビンがコンテクスト復号化され、パラメータ「sao_merge_up_flag」を示す1個のビンがコンテクスト復号化される。パラメータ「sao_type_idx」を示す6個のビンがコンテクスト復号化される。
また、パラメータ「sao_band_position」を示す5個のビンがバイパス復号化される。パラメータ「sao_offset_abs」を示す31個のビンがコンテクスト復号化され、パラメータ「sao_offset_sign」を示す1個のビンがバイパス復号化される。
各パラメータがカラー成分別に、3回ずつ獲得され、また一の部パラメータは、SAOカテゴリー別に、4回ずつ獲得されるという点を考慮すれば、下記数式(a)によって、最大423個のビンが獲得される。
3×(1+1+6+5+4×31+4×1)=396+27=423 (a)
特に、423個のビンのうち396個のビンは、コンテクスト復号化され、27個のビンは、バイパス復号化される。コンテクスト復号化のためには、各ビンごとに、コンテクストに基づいた確率モデリングが必要であるので、演算量が多く必要である。従って、SAOパラメータ60の全体ビット列のうち、バイパス復号化されるビンに比べ、コンテクスト復号化されるビンが相対的に多ければ、全体SAOパラメータ60を復号化するのに、演算量及び演算時間が相対的に増大する。
特に、423個のビンのうち396個のビンは、コンテクスト復号化され、27個のビンは、バイパス復号化される。コンテクスト復号化のためには、各ビンごとに、コンテクストに基づいた確率モデリングが必要であるので、演算量が多く必要である。従って、SAOパラメータ60の全体ビット列のうち、バイパス復号化されるビンに比べ、コンテクスト復号化されるビンが相対的に多ければ、全体SAOパラメータ60を復号化するのに、演算量及び演算時間が相対的に増大する。
また、バンド位置情報を示すパラメータ「sao_band_position」は、バイパス復号化され、SAOオフセット絶対値情報を示すパラメータ「sao_offset_abs」は、コンテクスト復号化され、SAOオフセット符号情報を示すパラメータ「sao_offset_sign」は、さらにバイパス復号化されなければならない。特に、SAOカテゴリーが、0、1、2、3と増大することにより、パラメータ「sao_offset_abs」に対するコンテクスト復号化動作と、パラメータ「sao_offset_sign」に対するバイパス復号化動作がかわるがわる遂行されなければならない。
互いに異なる方式のエントロピー復号化動作がかわるがわる遂行されるということは、同一方式のエントロピー復号化動作が連続的に遂行されることに比べ、非効率的である。従って、SAOパラメータ60から、パラメータ「sao_band_position」,「sao_offset_abs」,「sao_offset_sign」に対するコンテクスト復号化動作とバイパス復号化動作とが何回がかわるがわる遂行されることにより、全体的に、エントロピー復号化動作の効率が低下する。
図7Aは、一実施形態による符号化単位のSAOシンタックス70を図示している。図7Aで図示されたSAOシンタックス70は、最大符号化単位のシンタックスのうち、SAOパラメータと係わるシンタックスである。一実施形態によるSAO符号化装置10は、最大符号化単位のサンプルに対してSAO動作を遂行し、SAOパラメータを決定し、SAOパラメータに対してエントロピー符号化を行うことができる。また、SAO符号化装置10は、SAOシンタックス70の順序によって、SAOパラメータのビット列を収録したビットストリームを出力することができる。
一実施形態によるSAO復号化装置20は、図7Aで図示されたSAOシンタックス70をパージングし、SAOパラメータのビット列を獲得し、SAOパラメータに対してエントロピー復号化を行い、SAOパラメータを復元することができる。SAO復号化装置20は、復元されたSAOパラメータを利用して、最大符号化単位の復元サンプルに対して、SAO調整を行うことができる。
現在スライス内で、現在最大符号化単位に隣接する左側最大符号化単位が存在するならば、左向きSAO併合情報「sao_merge_left_flag」71が獲得される。また、現在スライス内で、現在最大符号化に隣接する上端最大符号化単位が存在し、左側最大符号化単位のSAOパラメータと併合しないのであるならば、上向きSAO併合情報「sao_merge_up_flag」72が獲得される。
一実施形態によるパラメータ「sao_merge_left_flag」71と、パラメータ「sao_merge_up_flag」72は、カラー成分の区別なしに獲得されるので、ルマ成分、並びに第1クロマ成分及び第2クロマ成分について共通的に適用される。3種カラー成分に係わる動き補償のための同一動きベクトルが利用される。従って、カラー成分の区別なしに、SAO併合情報が獲得されることにより、動き補償を行うコーデックに、左向きSAO併合情報71及び上向きSAO併合情報72を利用するSAO動作が効率的に統合(unification)される。
「sao_merge_left_flag」71及び「sao_merge_up_flag」72を除いた残りのSAOパラメータ741,743,751,753,77,781,782,791,793は、カラー成分によって区別されるので、カラーインデックス「cIdx」を0、1、2に増加する(73)ことによって獲得される。
現在カラーインデックスがルマ成分であるならば(74)、ルマSAOオンオフ情報「sao_on_off_flag_luma」741が獲得される。ルマ成分に対して、SAO動作が遂行されるであるならば、ルマエッジバンド区別情報「sao_eo_bo_flag_luma」743がさらに獲得される。
一方、現在カラーインデックスが、第1クロマ成分であるならば(75)、第1クロマ成分及び第2クロマ成分のためのクロマSAOオンオフ情報「sao_on_off_flag_chroma」751が獲得される。クロマ成分に対して、SAO動作が遂行されるであるならば、第1クロマ成分及び第2クロマ成分のためのクロマエッジバンド区別情報「sao_eo_bo_flag_chroma」753がさらに獲得される。カラーインデックスが、第1クロマ成分であるときだけ、「sao_on_off_flag_chroma」751及び「sao_eo_bo_flag_chroma」753が獲得され、第2クロマ成分であるときは獲得されない。
SAOタイプ情報のうちSAOオンオフ情報が「off」を示さないのであるならば(76)、SAOカテゴリー別に、SAOクラスに係わる情報と、オフセット値に係わる情報とが獲得される。「i」の増加によるforループ構文によって、SAOカテゴリー別に、SAOオフセット絶対値情報「sao_offset_abs」77、オフセット符号情報「sao_offset_sign」781、バンド位置情報「sao_band_position」783が個別的に獲得される。
まず、オフセット絶対値情報「sao_offset_abs」77が獲得され、SAOタイプ情報がバンドタイプであるならば(78)、バンド位置情報「sao_band_position」783が獲得される。特に、「sao_offset_abs」77が0ではないのであるならば、すなわち、オフセット絶対値が0ではないのであるならば、オフセット符号情報「sao_offset_sign」781が先に獲得された後、「sao_band_position」783が獲得される。
SAOタイプ情報がエッジタイプを示しているならば(79)、カラーインデックスがルマ成分である場合、ルマエッジクラス情報「sao_eo_class_luma」791が獲得され、第1クロマ成分である場合、第1クロマ成分及び第2クロマ成分のためのクロマエッジクラス情報「sao_eo_class_chroma」793が獲得される。カラーインデックスが第2クロマ成分であるときは、「sao_eo_class_chroma」793が獲得されない。
一実施形態によるSAOタイプ情報がエッジタイプである場合には、ルマエッジクラス情報791またはクロマエッジクラス情報793だけ獲得され、オフセット符号情報が獲得されない。それは、エッジクラスによって、エッジオフセット値の符号が決定されるからである。
前述のように、クロマSAOオンオフ情報「sao_on_off_flag_chroma」751、クロマエッジバンド区別情報「sao_eo_bo_flag_chroma」753及びクロマエッジクラス情報「sao_eo_class_chroma」793は、それぞれ、第1クロマ成分及び第2クロマ成分に対して、同一に適用されるパラメータである。
従って、第1クロマ成分及び第2クロマ成分について共通するクロマSAOオンオフ情報751、クロマエッジバンド区別情報753及びクロマエッジクラス情報793が獲得されることにより、クロマ成分のSAO動作のための単純化されたメモリアクセスが可能である。また、第1クロマ成分及び第2クロマ成分に係わる、イントラ予測、動き補償及び適応的ループフィルタリング(ALF:adaptive loop filtering)の各動作でも、第1クロマ成分及び第2クロマ成分を区別せずに、同一のパラメータが適用されるので、同一メモリに対するアクセスによって、各動作のためのパラメータやサンプルが獲得される。従って、イントラ予測、動き補償及び適応的ループフィルタリング動作を遂行するコーデックに、SAO動作が効率的に統合される。
以上、一実施形態によるSAO復号化装置20が、SAOシンタックス70をパージングし、SAOパラメータを獲得する動作について、順に詳細に説明した。以下、獲得されたSAOパラメータに対して、エントロピー復号化が行われる過程について詳細に説明する。
一実施形態によるSAO復号化装置20は、左向きSAO併合情報「sao_merge_left_flag」71及び上向きSAO併合情報「sao_merge_up_flag」72に対して、コンテクスト復号化を行うことができる。従って、左向きSAO併合情報71のビンのコンテクストに基づいた確率モデルを決定し、確率的に、1ビットの左向きSAO併合情報71を生成した1個のビン値を復元することができる。上向きSAO併合情報72に対しても、類似したコンテクスト復号化が行われる。
図6BのSAOパラメータ60とは異なり、一実施形態によるSAO復号化装置20は、SAOタイプ情報を、SAOオンオフ情報741,743、エッジバンド区別情報751,753、オフセット符号情報781、バンド位置情報783及びエッジクラス情報791,793に分離して復号化することができる。エッジタイプであるならば、エッジクラス情報791,793が獲得され、バンドタイプであるならば、オフセット符号情報781及びバンド位置情報783が獲得される。
図6BのSAOパラメータ60のSAOタイプ情報「sao_type_idx」の6個のビンのために、コンテクスト復号化が行われる。一方、一実施形態によるSAO復号化装置20は、SAOオンオフ情報741,743の1個のビンのために、コンテクスト復号化を行い、残りのパラメータについては、バイパス復号化を行うことができる。
例えば、エッジタイプである場合には、一実施形態によるSAO復号化装置20は、SAOオンオフ情報741,743の1個のビンのために、コンテクスト復号化を行い、エッジバンド区別情報751または753の1個のビン、及びエッジクラス情報791または793の2個のビンに対して、それぞれバイパス復号化を行うことができる。
従って、一実施形態によるSAO復号化装置20は、一部パラメータだけカラー成分別に、3回ずつ獲得され、SAOカテゴリー別に、4回ずつ獲得される点を考慮すれば、バンドタイプであるとき、数式(b)によって、最大405個のビンが獲得される。
1+1+2×(1+1)+3×(4×31+4×1+5)=4+401=405 (b)
特に、405個のビンのうち4個のビンは、コンテクスト復号化され、401個のビンは、バイパス復号化される。すなわち、相対的に多くの演算量が必要なコンテクスト復号化の動作回数が、バイパス復号化の動作回数に比べ、顕著に少ない。また、一部SAOパラメータは、カラー成分別に、同一パラメータが獲得されるので、SAOパラメータの全体ビット列の長さも短くなる。
特に、405個のビンのうち4個のビンは、コンテクスト復号化され、401個のビンは、バイパス復号化される。すなわち、相対的に多くの演算量が必要なコンテクスト復号化の動作回数が、バイパス復号化の動作回数に比べ、顕著に少ない。また、一部SAOパラメータは、カラー成分別に、同一パラメータが獲得されるので、SAOパラメータの全体ビット列の長さも短くなる。
従って、一実施形態によるSAO復号化装置20は、エッジバンド区別情報751または753、オフセット絶対値情報77、及びバンド位置情報783(または、エッジクラス情報791または793)をバイパス復号化し、カラー成分について共通するSAO併合情報71,72が獲得され、クロマ成分について共通するSAOオンオフ情報741または743、エッジバンド区別情報751または753、及びエッジクラス情報791または793が獲得されることにより、SAOパラメータ全体に対するエントロピー復号化動作の効率が向上する。
また、図6BのSAOパラメータ60とは異なり、一実施形態によるSAO復号化装置20は、バンド位置情報783を、オフセット絶対値情報77より遅く獲得することができる。それを介して、一実施形態によるSAO復号化装置20は、SAO併合情報71,72、SAOオンオフ情報741または743までコンテクスト復号化を行っていて、エッジバンド区別情報751または753から、オフセット絶対値情報77及びバンド位置情報783(または、エッジクラス情報791または793)までバイパス復号化を行うことができる。
従って、図6BのSAOパラメータ60に比べ、一実施形態によるSAO復号化装置20が、SAOシンタックス70を利用して、コンテクスト復号化とバイパス復号化とを交互に行う回数が減るので、SAOパラメータに対するエントロピー復号化動作の効率性が向上する。
図7B及び図7Cは、それぞれ異なる実施形態による符号化単位のSAOシンタックスを図示している。
図7BのSAOシンタックスは、図7AのSAOシンタックス70において、カラーインデックスをチェックする条件文(if構文)の個数を減らすために設計された形態のシンタックスである。条件文を利用した条件チェック回数が増加するほど、演算量が増加するからである。
図7BのSAOシンタックスでは、SAOオンオフ情報83,84を獲得するために、現在カラーインデックスが、ルマ成分であるか、あるいは第1クロマ成分であるかということをチェックするif構文が必要ない。図7Bのシンタックスによれば、ルマ成分のためのルマSAOオンオフ情報83、ルマエッジバンド区別情報831、ルマエッジクラス情報832が順に獲得され、次に、第1クロマ成分及び第2クロマ成分のためのクロマSAOオンオフ情報84、クロマエッジバンド区別情報841、クロマエッジクラス情報842が順に獲得される。
従って、図7BのSAOシンタックスによれば、図7AのSAOシンタックス70に比べ、カラーインデックスが、現在カラーインデックスがルマ成分であるか、あるいは第1クロマ成分であるかということをチェックする4個の条件文が除去されるので、条件チェック回数が4回減る。
図7BのSAOシンタックスでは、ルマSAOオンオフ情報83、ルマエッジバンド区別情報831、ルマエッジクラス情報832、クロマSAOオンオフ情報84、クロマエッジバンド区別情報841、クロマエッジクラス情報842が獲得された後、カラー成分及びカテゴリー別に、オフセット絶対値情報87及びオフセット符号情報881が獲得され、カラー成分別に、バンド位置情報883が獲得される。
このとき、ルマSAOオンオフ情報83については、コンテクスト復号化動作が遂行され、ルマエッジバンド区別情報831及びルマエッジクラス情報832に対するバイパス復号化動作が遂行され、またクロマSAOオンオフ情報84については、コンテクスト復号化動作が遂行され、クロマエッジバンド区別情報841及びクロマエッジクラス情報842については、バイパス復号化動作が遂行される。オフセット絶対値情報87、オフセット符号情報881及びバンド位置情報883については、バイパス復号化動作が遂行される。
従って、図7BのSAOシンタックスでは、コンテクスト復号化動作とバイパス復号化動作との転換回数が3回発生する。
図7CのSAOシンタックスは、図7AのSAOシンタックス70において、カラーインデックスをチェックする条件問い合わせ個数を減らした図7BのSAOシンタックスにおいて、さらに進んで、コンテクスト復号化とバイパス復号化との転換回数を減らすために設計された形態のシンタックスである。
図7CのSAOシンタックスでは、ルマSAOオンオフ情報83に続いて、クロマSAOオンオフ情報84が獲得される。その後、ルマSAOオンオフ情報83に基づいて、ルマエッジバンド区別情報831、ルマエッジクラス情報832が獲得され、クロマSAOオンオフ情報84に基づいて、クロマエッジバンド区別情報841、クロマエッジクラス情報842が獲得される。
従って、ルマSAOオンオフ情報83及びクロマSAOオンオフ情報84については、コンテクスト復号化動作が遂行され、ルマエッジバンド区別情報831、ルマエッジクラス情報832、クロマエッジバンド区別情報841及びクロマエッジクラス情報842については、バイパス復号化動作が遂行される。次に、オフセット絶対値情報87、オフセット符号情報881及びバンド位置情報883に対しても、バイパス復号化動作が遂行される。従って、図7CのSAOシンタックスでは、コンテクスト復号化動作からバイパス復号化動作に、エントロピー復号化方式が1回だけ転換され、交互に行われないので、エントロピー復号化動作の全体的な効率が向上する。
前述の実施形態によって、一実施形態によるSAO符号化装置10は、SAO動作のためのオフセット絶対値情報をバイパス符号化することができる。また、SAOタイプ情報を、SAOオンオフ情報、エッジバンド区別情報、バンド位置情報(または、エッジクラス情報)に分離し、SAOオンオフ情報だけコンテクスト符号化することができる。従って、SAOパラメータのうちコンテクスト復号化されるパラメータの数を減らし、バイパス復号化されるパラメータの数を増やすことにより、全体SAOパラメータに対するエントロピー符号化の効率が向上する。
また、SAOパラメータのうち、SAOオンオフ情報、エッジバンド区別情報及びエッジクラス情報は、第1クロマ成分及び第2クロマ成分のために、同一パラメータを利用することにより、SAO併合情報は、ルマ成分、並びに第1クロマ成分及び第2クロマ成分のために、同一パラメータを利用することにより、SAOパラメータの全体伝送量を減らすことができる。
また、コンテクスト符号化とバイパス符号化との転換回数を減らすことにより、エントロピー符号化動作の効率も向上させることができる。
また、一実施形態によるSAO復号化装置20は、SAOパラメータのうち、SAO併合情報及びSAOオンオフ情報に対してのみコンテクスト復号化を行い、残りのビット列については、バイパス復号化を行うことができるので、SAOパラメータ復号化のための全体演算量が顕著に減少する。
また、第1クロマ成分及び第2クロマ成分のためのSAOオンオフ情報、エッジバンド区別情報及びエッジクラス情報として、同一パラメータが獲得され、SAO併合情報は、ルマ成分、並びに第1クロマ成分及び第2クロマ成分のためのSAO併合情報として、同一パラメータが獲得されるので、SAOパラメータの全体ビット長が短くなり、パージングされるデータ量も減縮される。
また、コンテクスト復号化とバイパス復号化との転換回数が減り、全体SAOパラメータに対するエントロピー復号化動作の効率も向上する。
従って、一実施形態によるSAO調整を利用する、ビデオ符号化装置及びビデオ復号化装置は、最大符号化単位のエッジタイプまたはバンドタイプのような映像特性によってピクセル値を分類し、同一特性に分類されたピクセル値の平均誤差値であるオフセット値をシグナリングし、復元ピクセルのうち予想できないピクセル値をオフセット値ほど調整することにより、原本映像と復元映像との誤差を最小することができる。
一実施形態によるSAO符号化装置10及び、一実施形態によるSAO復号化装置20において、ビデオデータが分割されるブロックが最大符号化単位に分割され、最大符号化単位ごとに、ツリー構造の符号化単位を基に符号化/復号化され、最大符号化単位ごとに、ピクセル分類によるオフセット値が決定されるということは、前述の通りである。以下、図8ないし図20を参照し、一実施形態による、ツリー構造の符号化単位及び変換単位に基づいたビデオ符号化方法及びその装置、並びにビデオ復号化方法及びその装置を開示する。
図8は、本発明の一実施形態による、ツリー構造による符号化単位に基づいたビデオ符号化装置100のブロック図を図示している。
一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ符号化装置100は、最大符号化単位分割部110、符号化単位決定部120及び出力部130を含む。以下、説明の便宜のために、一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ符号化装置100は、「ビデオ符号化装置100」と縮約して称する。
最大符号化単位分割部110は、映像の現在ピクチャのための最大サイズの符号化単位である最大符号化単位に基づいて、現在ピクチャを区画することができる。現在ピクチャが最大符号化単位より大きければ、現在ピクチャの映像データは、少なくとも1つの最大符号化単位に分割される。一実施形態による最大符号化単位は、サイズ32x32,64x64,128x128,256x256などのデータ単位であり、縦横サイズが2の累乗である正方形のデータ単位でもある。映像データは、少なくとも1つの最大符号化単位別に、符号化単位決定部120に出力される。
一実施形態による符号化単位は、最大サイズ及び最大深度で特徴づけられる。深度とは、最大符号化単位から符号化単位が空間的に分割された回数を示し、深度が深くなるほど、深度別符号化単位は、最大符号化単位から最小符号化単位まで分割される。最大符号化単位の深度が最上位深度であり、最小符号化単位が最下位符号化単位と定義される。最大符号化単位は、深度が深くなるにつれ、深度別符号化単位の大きさは小さくなるので、上位深度の符号化単位は、複数個の下位深度の符号化単位を含んでもよい。
前述のように、符号化単位の最大サイズによって、現在ピクチャの映像データを最大符号化単位に分割し、それぞれの最大符号化単位は、深度別に分割される符号化単位を含んでもよい。一実施形態による最大符号化単位は、深度別に分割されるので、最大符号化単位に含まれた空間領域(spatial domain)の映像データが深度によって、階層的に分類される。
最大符号化単位の高さ及び幅を階層的に分割することができる総回数を制限する最大深度及び符号化単位の最大サイズがあらかじめ設定されている。
符号化単位決定部120は、深度ごとに、最大符号化単位の領域が分割された少なくとも1つの分割領域を符号化し、少なくとも1つの分割領域別に、最終符号化の結果が出力される深度を決定する。すなわち、符号化単位決定部120は、現在ピクチャの最大符号化単位ごとに、深度別符号化単位で映像データを符号化し、最小の符号化誤差が発生する深度を選択して符号化深度として決定する。決定された符号化深度及び最大符号化単位別映像データは、出力部130に出力される。
最大符号化単位内の映像データは、最大深度以下の少なくとも1つの深度によって、深度別符号化単位に基づいて符号化され、それぞれの深度別符号化単位に基づいた符号化の結果が比較される。深度別符号化単位の符号化誤差の比較結果、符号化誤差が最小である深度が選択される。それぞれの最大化符号化単位ごとに、少なくとも1つの符号化深度が決定される。
最大符号化単位の大きさは、深度が深くなるにつれ、符号化単位が階層的に分割されて分割され、符号化単位の個数は増加する。また、1つの最大符号化単位に含まれる同一深度の符号化単位であるとしても、それぞれのデータに係わる符号化誤差を測定し、下位深度への分割いかんが決定される。従って、1つの最大符号化単位に含まれるデータであるとしても、位置によって、深度別符号化誤差が異なるので、位置によって、符号化深度が異なって決定される。従って、1つの最大符号化単位について、符号化深度が一つ以上設定され、最大符号化単位のデータは、一つ以上の符号化深度の符号化単位によって区画される。
従って、一実施形態による符号化単位決定部120は、現在最大符号化単位に含まれるツリー構造による符号化単位が決定される。一実施形態による「ツリー構造による符号化単位」は、現在最大符号化単位に含まれる全ての深度別符号化単位のうち、符号化深度と決定された深度の符号化単位を含む。符号化深度の符号化単位は、最大符号化単位内で同一領域では、深度によって階層的に決定され、他の領域については、独立して決定される。同様に、現在領域に対する符号化深度は、他の領域に対する符号化深度と独立して決定される。
一実施形態による最大深度は、最大符号化単位から最小符号化単位までの分割回数と係わる指標である。一実施形態による第1最大深度は、最大符号化単位から最小符号化単位までの全分割回数を示すことができる。一実施形態による第2最大深度は、最大符号化単位から最小符号化単位までの深度レベルの総個数を示すことができる。例えば、最大符号化単位の深度が0であるとするとき、最大符号化単位が1回分割された符号化単位の深度は、1に設定され、2回分割された符号化単位の深度は、2に設定される。その場合、最大符号化単位から4回分割された符号化単位が最小符号化単位であるならば、深度0,1,2,3及び4の深度レベルが存在するので、第1最大深度は、4に設定され、第2最大深度は、5に設定される。
最大符号化単位の予測符号化及び変換も行われる。予測符号化及び変換も同様に、最大符号化単位ごとに、最大深度以下の深度ごとに、深度別符号化単位を基に行われる。
最大符号化単位が深度別に分割されるたびに、深度別符号化単位の個数が増加するので、深度が深くなるにつれ、生成される全ての深度別符号化単位について、予測符号化及び変換を含んだ符号化が行われなければならない。以下、説明の便宜のために、少なくとも1つの最大符号化単位のうち、現在深度の符号化単位を基に、予測符号化及び変換について説明する。
一実施形態によるビデオ符号化装置100は、映像データの符号化のためのデータ単位の大きさまたは形態を多様に選択することができる。映像データの符号化のためには、予測符号化、変換、エントロピー符号化などの段階を経るが、全ての段階にわたって、同一データ単位が使用され、段階別でデータ単位が変更されもする。
例えば、ビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位の映像データの予測符号化を行うために、符号化単位と異なるデータ単位を選択することができる。
最大符号化単位の予測符号化のためには、一実施形態による符号化深度の符号化単位、すなわち、それ以上さらに分割されない符号化単位を基に、予測符号化が行われる。以下、予測符号化の基になる、それ以上さらに分割されない符号化単位を「予測単位」とする。予測単位が分割されたパーティションは、予測単位及び予測単位の高さ及び幅のうち、少なくとも一つが分割されたデータ単位を含んでもよい。パーティションは、符号化単位の予測単位が分割された形態のデータ単位であり、予測単位は、符号化単位と同一サイズのパーティションでもある。
例えば、サイズ2Nx2N(ただし、Nは、正の整数)の符号化単位が、それ以上分割されない場合、サイズ2Nx2Nの予測単位になり、パーティションの大きさは、2Nx2N、2NxN、Nx2N、NxNなどである。一実施形態によるパーティションタイプは、予測単位の高さまたは幅が対称的な比率に分割された対称的パーティションだけではなく、1:nまたはn:1のように、非対称的な比率に分割されたパーティション、幾何学的なタイプに分割されたパーティション、任意的形態のパーティションなどを選択的に含んでもよい。
予測単位の予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも一つでもある。例えば、イントラモード及びインターモードは、2Nx2N,2NxN,Nx2N,NxNサイズのパーティションに対して遂行される。また、スキップモードは、2Nx2Nサイズのパーティションに対してのみ遂行される。符号化単位以内の1つの予測単位ごとに、独立して符号化が行われ、符号化誤差が最小である予測モードが選択される。
また、一実施形態によるビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位と異なるデータ単位を基に、符号化単位の映像データの変換を行うことができる。符号化単位の変換のためには、符号化単位より小さいか、あるいはそれと同じサイズの変換単位を基に変換が行われる。例えば、変換単位は、イントラモードのためのデータ単位、及びインターモードのための変換単位を含んでもよい。
一実施形態によるツリー構造による符号化単位と類似した方式で、符号化単位内の変換単位も、再帰的にさらに小サイズの変換単位に分割されながら、符号化単位のレジデュアルデータが変換深度によって、ツリー構造による変換単位によって区画される。
一実施形態による変換単位についても、符号化単位の高さ及び幅が分割され、変換単位に至るまでの分割回数を示す変換深度が設定される。例えば、サイズ2Nx2Nの現在符号化単位の変換単位の大きさが、2Nx2Nであるならば、変換深度0、変換単位の大きさが、NxNであるならば、変換深度1、変換単位の大きさが、N/2xN/2であるならば、変換深度2に設定される。すなわち、変換単位についても、変換深度によって、ツリー構造による変換単位が設定される。
符号化深度別符号化情報は、符号化深度だけでなく、予測関連情報及び変換関連情報が必要である。従って、符号化単位決定部120は、最小符号化誤差を発生させた符号化深度だけでなく、予測単位をパーティションに分割したパーティションタイプ、予測単位別予測モード、変換のための変換単位の大きさなどを決定することができる。
一実施形態による最大符号化単位のツリー構造による符号化単位及び予測単位/パーティション、並びに変換単位の決定方式については、図17ないし図19を参照し、詳細に説明する。
符号化単位決定部120は、深度別符号化単位の符号化誤差をラグランジュ乗数(Lagrangian multiplier)基盤の率・歪曲最適化技法(rate-distortion optimization)を利用して測定することができる。
出力部130は、符号化単位決定部120で決定された少なくとも1つの符号化深度に基づいて符号化された、最大符号化単位の映像データ及び深度別符号化モードに係わる情報をビットストリーム形態で出力する。
符号化された映像データは、映像のレジデュアルデータの符号化の結果でもある。
深度別符号化モードに係わる情報は、符号化深度情報、予測単位のパーティションタイプ情報、予測モード情報、変換単位のサイズ情報などを含んでもよい。
符号化深度情報は、現在深度で符号化せず、下位深度の符号化単位で符号化するか否かということを示す深度別分割情報を利用して定義される。現在符号化単位の現在深度が符号化深度であるならば、現在符号化単位は、現在深度の符号化単位で符号化されるので、現在深度の分割情報は、それ以上下位深度に分割されないように定義される。反対に、現在符号化単位の現在深度が、符号化深度でないのであるならば、下位深度の符号化単位を利用した符号化を試みなければならないので、現在深度の分割情報は、下位深度の符号化単位に分割されるように定義される。
現在深度が符号化深度でないのであるならば、下位深度の符号化単位に分割された符号化単位に対して符号化が行われる。現在深度の符号化単位内に、下位深度の符号化単位が一つ以上存在するので、それぞれの下位深度の符号化単位ごとに、反復して符号化が行われ、同一深度の符号化単位ごとに、再帰的(recursive)符号化が行われる。
1つの最大符号化単位内で、ツリー構造の符号化単位が決定され、符号化深度の符号化単位ごとに、少なくとも1つの符号化モードに係わる情報が決定されなければならないので、1つの最大符号化単位については、少なくとも1つの符号化モードに係わる情報が決定される。また、最大符号化単位のデータは、深度によって階層的に区画され、位置別に符号化深度が異なるので、データに対して、符号化深度、及び符号化モードに係わる情報が設定される。
従って、一実施形態による出力部130は、最大符号化単位に含まれている符号化単位、予測単位及び最小単位のうち少なくとも一つに対して、当該符号化深度及び符号化モードに係わる符号化情報が割り当てられる。
一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割された大きさの正方形のデータ単位である。一実施形態による最小単位は、最大符号化単位に含まれる全ての符号化単位、予測単位、パーティション単位及び変換単位内に含まれる最大サイズの正方形データ単位でもある。
例えば、出力部130を介して出力される符号化情報は、深度別符号化単位別符号化情報と、予測単位別符号化情報とに分類される。深度別符号化単位別符号化情報は、予測モード情報、パーティションサイズ情報を含んでもよい。予測単位別に伝送される符号化情報は、インターモードの推定方向に係わる情報、インターモードの参照映像インデックスに係わる情報、動きベクトルに係わる情報、イントラモードのクロマ成分に係わる情報、イントラモードの補間方式に係わる情報などを含んでもよい。
ピクチャ、スライスまたはGOP(group of picture)別に定義される符号化単位の最大サイズに係わる情報、及び最大深度に係わる情報は、ビットストリームのヘッダ、シーケンス・パラメータセットまたはピクチャ・パラメータセットなどに挿入される。
また、現在ビデオに対して許容される変換単位の最大サイズに係わる情報、及び変換単位の最小サイズに係わる情報も、ビットストリームのヘッダ、シーケンス・パラメータセットまたはピクチャ・パラメータセットなどを介して出力される。出力部130は、図1Aないし図7を参照して説明した、オフセット調整技法と係わるSAOパラメータを符号化して出力することができる。
ビデオ符号化装置100の最も簡単な形態の実施形態によれば、深度別符号化単位は、1階層上位深度の符号化単位の高さ及び幅を半分にした大きさの符号化単位である。すなわち、現在深度の符号化単位の大きさが、2Nx2Nであるならば、下位深度の符号化単位の大きさは、NxNである。また、2Nx2Nサイズの現在符号化単位は、NxNサイズの下位深度符号化単位を最大4個含んでもよい。
従って、ビデオ符号化装置100は、現在ピクチャの特性を考慮して決定された最大符号化単位の大きさ及び最大深度を基に、それぞれの最大符号化単位ごとに、最適の形態及び大きさの符号化単位を決定し、ツリー構造による符号化単位を構成することができる。また、それぞれの最大符号化単位ごとに、多様な予測モード、変換方式などで符号化することができるので、多様な映像サイズの符号化単位の映像特性を考慮し、最適の符号化モードが決定される。
従って、映像の解像度が非常に高いか、あるいはデータ量が非常に多い映像を既存マクロブロック単位で符号化するならば、ピクチャ当たりマクロブロックの数が過度に多くなる。それにより、マクロブロックごとに生成される圧縮情報も多くなるので、圧縮情報の伝送負担が大きくなり、データ圧縮効率が低下する傾向がある。従って、一実施形態によるビデオ符号化装置は、映像サイズを考慮し、符号化単位の最大サイズを増大させながら、映像特性を考慮し、符号化単位を調節することができるので、映像圧縮効率が上昇する。
図8のビデオ符号化装置100は、図1Aを参照して説明したSAO符号化装置10の動作を遂行することができる。
符号化単位決定部120は、ビデオ符号化装置10のSAOパラメータ決定部14の動作を遂行することができる。最大符号化単位ごとに、SAOタイプ、カテゴリー別オフセット値及びSAOクラスが決定される。
出力部130は、SAOパラメータ符号化部16の動作を遂行することができる。最大符号化単位ごとに決定されたSAOパラメータが出力される。現在最大符号化単位に隣接する左側及び上端の最大符号化単位のSAOパラメータを、現在SAOパラメータとして採用するか否かということを示す左向き/上向きSAO併合情報が一番最初に出力される。SAOタイプとして、オフタイプ、エッジタイプ、バンドタイプが出力される。オフセット絶対値情報が出力され、バンドタイプである場合には、符号情報、バンド位置情報が出力される。エッジタイプである場合、エッジクラス情報が出力され、オフセット値の符号情報は、出力されない。
一実施形態による出力部130は、最大符号化単位の左向きSAO併合情報及び上向きSAO併合情報に対して、それぞれコンテクスト符号化を行うことができる。一実施形態による出力部130は、ルマ成分及びクロマ成分別に、SAOオンオフ情報に対してコンテクスト符号化を行うことができる。
一実施形態による出力部130は、SAOオンオフ情報が、SAO動作が遂行されるということを示せば、ルマ成分及びクロマ成分別に、エッジバンド区別情報に対して、バイパス符号化を行うことができる。
SAOオンオフ情報が、SAO動作が遂行されるということを示せば、一実施形態による出力部130は、ルマ成分、並びに第1クロマ成分及び第2クロマ成分別に、SAOカテゴリー別オフセット絶対値情報に対して、バイパス符号化を行うことができる。バンドタイプである場合、一実施形態による出力部130は、ルマ成分、並びに第1クロマ成分及び第2クロマ成分別に、オフセット符号情報及びバンド位置情報に対して、バイパス符号化を行うことができる。エッジタイプである場合、一実施形態による出力部130は、ルマ成分及びクロマ成分別に、エッジクラス情報に対して、バイパス符号化を行うことができる。
一実施形態による、第1クロマ成分のためのエッジクラス情報は、第2クロマ成分に同一に適用され、第1クロマ成分のためのSAOオンオフ情報及びエッジバンド区別情報も、それぞれ第2クロマ成分に同一に適用される。
図9は、本発明の一実施形態による、ツリー構造による符号化単位に基づいたビデオ復号化装置200のブロック図を図示している。
一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ復号化装置200は、受信部210、映像データ及び符号化情報抽出部220及び映像データ復号化部230を含む。以下、説明の便宜のために、一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ復号化装置200は、「ビデオ復号化装置200」と縮約して称する。
一実施形態によるビデオ復号化装置200の復号化動作のための符号化単位、深度、予測単位、変換単位、各種符号化モードに係わる情報など各種用語の定義は、図8及びビデオ符号化装置100を参照して説明したところと同一である。
受信部210は、符号化されたビデオに係わるビットストリームを受信してパージングする。映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位によって、符号化単位ごとに符号化された映像データを抽出し、映像データ復号化部230に出力する。映像データ及び符号化情報抽出部220は、現在ピクチャに係わるヘッダ、シーケンス・パラメータセットまたはピクチャ・パラメータセットから、現在ピクチャの符号化単位の最大サイズに係わる情報を抽出することができる。
また、映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位に対する符号化深度、及び符号化モードに係わる情報を抽出する。抽出された符号化深度、及び符号化モードに係わる情報は、映像データ復号化部230に出力される。すなわち、ビット列の映像データを最大符号化単位に分割し、映像データ復号化部230をして、最大符号化単位ごとに、映像データを復号化させる。
最大符号化単位別符号化深度、及び符号化モードに係わる情報は、一つ以上の符号化深度情報に対して設定され、符号化深度別符号化モードに係わる情報は、当該符号化単位のパーティションタイプ情報、予測モード情報及び変換単位のサイズ情報などを含んでもよい。また、符号化深度情報として、深度別分割情報が抽出されもする。
映像データ及び符号化情報抽出部220が抽出した最大符号化単位別符号化深度、及び符号化モードに係わる情報は、一実施形態によるビデオ符号化装置100のように符号化端で、最大符号化単位別深度別符号化単位ごとに反復して符号化を行い、最小符号化誤差を発生させると決定された符号化深度、及び符号化モードに係わる情報である。従って、ビデオ復号化装置200は、最小符号化誤差を発生させる符号化方式によって、データを復号化して映像を復元することができる。
一実施形態による符号化深度、及び符号化モードに係わる符号化情報は、当該符号化単位、予測単位及び最小単位のうち所定データ単位に対して割り当てられているので、映像データ及び符号化情報抽出部220は、所定データ単位別に、符号化深度、及び符号化モードに係わる情報を抽出することができる。所定データ単位別に、当該最大符号化単位の符号化深度、及び符号化モードに係わる情報が記録されているならば、同一符号化深度、及び符号化モードに係わる情報を有している所定データ単位は、同一最大符号化単位に含まれるデータ単位と類推される。
映像データ復号化部230は、最大符号化単位別符号化深度、及び符号化モードに係わる情報に基づいて、それぞれの最大符号化単位の映像データを復号化し、現在ピクチャを復元する。すなわち、映像データ復号化部230は、最大符号化単位に含まれる、ツリー構造による符号化単位のうちそれぞれの符号化単位ごとに、判読された、パーティションタイプ、予測モード、変換単位に基づいて符号化された映像データを復号化することができる。復号化過程は、イントラ予測及び動き補償を含む予測過程及び逆変換過程を含んでもよい。
映像データ復号化部230は、符号化深度別符号化単位の予測単位のパーティションタイプ情報及び予測モード情報に基づいて、符号化単位ごとに、それぞれのパーティション及び予測モードによって、イントラ予測または動き補償を行うことができる。
また、映像データ復号化部230は、最大符号化単位別逆変換のために、符号化単位別に、ツリー構造による変換単位情報を判読し、符号化単位ごとに、変換単位に基づいた逆変換を行うことができる。逆変換を介して、符号化単位の空間領域の画素値が復元される。
映像データ復号化部230は、深度別分割情報を利用して、現在最大符号化単位の符号化深度を決定することができる。もし分割情報が、現在深度でそれ以上分割されないということを示しているならば、現在深度が符号化深度である。従って、映像データ復号化部230は、現在最大符号化単位の映像データに対して、現在深度の符号化単位を、予測単位のパーティションタイプ、予測モード及び変換単位サイズ情報を利用して、復号化することができる。
すなわち、符号化単位、予測単位及び最小単位のうち、所定データ単位に対して設定されている符号化情報を観察し、同一分割情報を含んだ符号化情報を保有しているデータ単位が集まり、映像データ復号化部230によって、同一符号化モードで復号化する1つのデータ単位と見なされる。そのように決定された符号化単位ごとに、符号化モードに係わる情報を獲得し、現在符号化単位の復号化が行われる。
また、図9のビデオ復号化装置200は、図2Aを参照して説明したSAO復号化装置20の動作を遂行することができる。
映像データ及び符号化情報抽出部220と受信部210は、SAO復号化装置20のSAOコンテクスト復号化部24及びSAOバイパス復号化部26の動作を遂行することができる。映像データ復号化部230は、ビデオ復号化装置20のSAO調整部28の動作を遂行することができる。
一実施形態による映像データ及び符号化情報抽出部220は、最大符号化単位のビットストリームから、SAOパラメータのビット列を獲得し、各ビット列に対して、エントロピー復号化を行い、各パラメータのシンボルを復元することができる。
左向きSAO併合情報及び上向きSAO併合情報を獲得し、左向きSAO併合情報及び上向きSAO併合情報に対して、それぞれコンテクスト復号化を行うことができる。一実施形態による映像データ及び符号化情報抽出部220は、ルマ成分及びクロマ成分別に、SAOオンオフ情報を1ビットずつ獲得することができる。映像データ及び符号化情報抽出部220は、ルマSAOオンオフ情報及びクロマSAOオンオフ情報に対して、コンテクスト復号化を行うことができる。
一実施形態による映像データ及び符号化情報抽出部220は、SAOオンオフ情報が、SAO動作が遂行されるということを示せば、ルマ成分及びクロマ成分別に、エッジバンド区別情報を獲得し、1ビットのエッジバンド区別情報バイパス復号化を行うことができる。
SAOオンオフ情報が、SAO動作が遂行されるということを示せば、一実施形態による映像データ及び符号化情報抽出部220は、ルマ成分、並びに第1クロマ成分及び第2クロマ成分別に、SAOカテゴリー別オフセット絶対値情報を獲得し、オフセット絶対値情報に対して、バイパス復号化を行うことができる。バンドタイプの場合、一実施形態による映像データ及び符号化情報抽出部220は、ルマ成分、並びに第1クロマ成分及び第2クロマ成分別に、オフセット符号情報及びバンド位置情報を獲得し、各パラメータに対して、バイパス復号化を行うことができる。エッジタイプの場合、一実施形態による映像データ及び符号化情報抽出部220は、ルマ成分及びクロマ成分別に獲得されたエッジクラス情報に対して、バイパス復号化を行うことができる。
一実施形態による、第1クロマ成分のためのエッジクラス情報は、第2クロマ成分に同一に適用され、第1クロマ成分のためのSAOオンオフ情報及びエッジバンド区別情報も、それぞれ第2クロマ成分に同一に適用される。
映像データ復号化部230は、復元されたSAOパラメータを利用して、オフセット調整対象になる、ピクセルとオフセット値とを決定することができる。映像データ復号化部230は、復元ピクセルに対応するオフセット値ほど、当該復元ピクセル値を調整することにより、原本ピクセルと誤差が最小化される復元ピクセルを生成することができる。最大符号化単位ごとにパージングされたSAOパラメータに基づいて、最大符号化単位の復元ピクセルのオフセットが調整される。
結局、ビデオ復号化装置200は、符号化過程において、最大符号化単位ごとに、再帰的に符号化を行い、最小符号化誤差を発生させた符号化単位に係わる情報を獲得し、現在ピクチャに係わる復号化に利用することができる。すなわち、最大符号化単位ごとに、最適符号化単位として決定された、ツリー構造による符号化単位の符号化された映像データの復号化が可能になる。
従って、高い解像度の映像、またはデータ量が過度に多い映像でも、符号化端から伝送された最適符号化モードに係わる情報を利用して、映像の特性に適応的に決定された符号化単位の大きさ及び符号化モードによって、効率的に映像データを復号化して復元することができる。
図10は、本発明の一実施形態による符号化単位の概念を図示している。
符号化単位の例は、符号化単位の大きさは、幅x高さで表現され、サイズ64x64である符号化単位から、サイズ32x32,16x16,8x8を含んでもよい。サイズ64x64の符号化単位は、サイズ64x64,64x32,32x64,32x32のパーティションに分割され、サイズ32x32の符号化単位は、サイズ32x32,32x16,16x32,16x16のパーティションに分割され、サイズ16x16の符号化単位は、サイズ16x16,16x8,8x16,8x8のパーティションに分割され、サイズ8x8の符号化単位は、サイズ8x8,8x4,4x8,4x4のパーティションに分割される。
ビデオデータ310については、解像度が1920x1080、符号化単位の最大サイズが64、最大深度が2に設定されている。ビデオデータ320については、解像度が1920x1080、符号化単位の最大サイズが64、最大深度が3に設定されている。ビデオデータ330については、解像度が352x288、符号化単位の最大サイズが16、最大深度が1に設定されている。図10に図示された最大深度は、最大符号化単位から最小符号化単位までの全分割回数を示す。
解像度が高いか、あるいはデータ量が多い場合、符号化効率の向上だけでなく、映像特性を正確に反映するために、符号化サイズの最大サイズが相対的に大きいことが望ましい。従って、ビデオデータ330に比べ、解像度が高いビデオデータ310,320は、符号化サイズの最大サイズが64に選択される。
ビデオデータ310の最大深度が2であるので、ビデオデータ310の符号化単位315は、長軸サイズが64である最大符号化単位から、2回分割されて深度が2階層深くなり、長軸サイズが32,16である符号化単位まで含んでもよい。一方、ビデオデータ330の最大深度が1であるので、ビデオデータ330の符号化単位335は、長軸サイズが16である符号化単位から、1回分割されて深度が1階層深くなり、長軸サイズが8である符号化単位まで含んでもよい。
ビデオデータ320の最大深度が3であるので、ビデオデータ320の符号化単位325は、長軸サイズが64である最大符号化単位から、3回分割されて深度が3階層深くなり、長軸サイズが32,16,8である符号化単位まで含んでもよい。深度が深くなるほど、細部情報の表現能が向上する。
図11は、本発明の一実施形態による符号化単位に基づいた映像符号化部400のブロック図を図示している。
一実施形態による映像符号化部400は、ビデオ符号化装置100の符号化単位決定部120において、映像データを符号化するのに経る作業を含む。すなわち、イントラ予測部410は、現在フレーム405において、イントラモードの符号化単位に対してイントラ予測を行い、動き推定部420及び動き補償部425は、インターモードの現在フレーム405及び参照フレーム495を利用して、インター推定及び動き補償を行う。
イントラ予測部410、動き推定部420及び動き補償部425から出力されたデータは、変換部430及び量子化部440を経て、量子化された変換係数として出力される。量子化された変換係数は、逆量子化部460、逆変換部470を介して、空間領域のデータに復元され、復元された空間領域のデータは、デブロッキング部480及びオフセット調整部490を経て後処理され、参照フレーム495として出力される。量子化された変換係数は、エントロピー符号化部450を経て、ビットストリーム455として出力される。
一実施形態によるビデオ符号化装置100に適用されるためには、映像符号化部400の構成要素である、イントラ予測部410、動き推定部420、動き補償部425、変換部430、量子化部440、エントロピー符号化部450、逆量子化部460、逆変換部470、デブロッキング部480及びオフセット調整部490が、いずれも最大符号化単位ごとに、最大深度を考慮し、ツリー構造による符号化単位のうちそれぞれの符号化単位に基づいた作業を遂行しなければならない。
特に、イントラ予測部410、動き推定部420及び動き補償部425は、現在最大符号化単位の最大サイズ及び最大深度を考慮し、ツリー構造による符号化単位のうち、それぞれの符号化単位のパーティション及び予測モードを決定し、変換部430は、ツリー構造による符号化単位のうち、それぞれの符号化単位内の変換単位の大きさを決定しなければならない。
オフセット調整部490は、参照フレーム495の最大符号化単位ごとに、エッジタイプ(または、バンドタイプ)によってピクセルを分類し、エッジ方向(または、開始バンド位置)を決定し、カテゴリーごとに、属する復元ピクセルの平均誤差値を決定することができる。最大符号化単位ごとに、それぞれのSAO併合情報、SAOタイプ及びオフセット値が符号化されてシグナリングされる。
エントロピー符号化部450は、SAO調整のためのSAO併合情報、SAOタイプ情報及びオフセット値を含むSAOパラメータに対して、CABAC符号化を行うことができる。例えば、SAOタイプ情報のためには、最初のビットに対してのみ、1つのコンテクストモデルを利用して、残りのビットについては、バイパスモードで符号化することができる。オフセット値については、2個のコンテクストモデルが利用され、左側SAO併合情報及び上端SAO併合情報については、それぞれ一つずつのコンテクストモデルが利用される。従って、SAOパラメータのCABAC符号化のために、総5個のコンテクストモデルが利用される。
図12は、本発明の一実施形態による、符号化単位に基づいた映像復号化部500のブロック図を図示している。
ビットストリーム505がパージング部510を経て、復号化対象である符号化された映像データ、及び復号化のために必要な符号化に係わる情報がパージングされる。符号化された映像データは、エントロピー復号化部520及び逆量子化部530を経て、逆量子化されたデータとして出力され、逆変換部540を経て、空間領域の映像データが復元される。
空間領域の映像データに対して、イントラ予測部550は、イントラモードの符号化単位に対してイントラ予測を行い、動き補償部560は、参照フレーム585を共に利用して、インターモードの符号化単位に対して動き補償を行う。
イントラ予測部550及び動き補償部560を経た空間領域のデータは、デブロッキング部570及びオフセット調整部580を経て後処理され、復元フレーム595として出力される。また、デブロッキング部570及びオフセット調整部580を経て後処理されたデータは、参照フレーム585として出力される。
ビデオ復号化装置200の映像データ復号化部230で、映像データを復号化するために、一実施形態による映像復号化部500のパージング部510以後の段階別作業が遂行される。
一実施形態によるビデオ復号化装置200に適用されるためには、映像復号化部500の構成要素である、パージング部510、エントロピー復号化部520、逆量子化部530、逆変換部540、イントラ予測部550、動き補償部560、デブロッキング部570及びオフセット調整部580が、いずれも最大符号化単位ごとに、ツリー構造による符号化単位に基づいて、作業を遂行しなければならない。
特に、イントラ予測部550、動き補償部560は、ツリー構造による符号化単位ごとに、それぞれパーティション及び予測モードを決定し、逆変換部540は、符号化単位ごとに、変換単位の大きさを決定しなければならない。
エントロピー復号化部520は、SAOパラメータに対してCABAC復号化を行い、SAOパラメータから、SAO調整のためのSAO併合情報、SAOタイプ情報及びオフセット値をパージングすることができる。例えば、SAOタイプ情報のためには、最初のビットに対してのみ、1つのコンテクストモデルを利用して、残りのビットについては、バイパスモードでCABAC復号化を行うことができる。オフセット値については、2個のコンテクストモデルが利用され、左側SAO併合情報及び上端SAO併合情報については、それぞれ一つずつのコンテクストモデルが利用される。従って、SAOパラメータのCABAC復号化のために、総5個のコンテクストモデルが利用される。
オフセット調整部580は、ビットストリームから最大符号化単位のSAOパラメータを抽出することができる。現在最大符号化単位のSAOパラメータのうち、SAO併合情報に基づいて、隣接する最大符号化単位のSAOパラメータと同一である現在SAOパラメータを復元することができる。現在最大符号化単位のSAOパラメータのうち、SAOタイプ及びオフセット値を利用して、復元フレーム595の最大符号化単位ごとに、復元ピクセルごとに、エッジタイプまたはバンドタイプによって、カテゴリーに対応するオフセット値ほど調整することができる。
図13は、本発明の一実施形態による深度別符号化単位及びパーティションを図示している。
一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200は、映像特性を考慮するために、階層的な符号化単位を使用する。符号化単位の最大高及び最大幅、最大深度は、映像の特性によって適応的に決定され、ユーザの要求によって、多様に設定されもする。既設定の符号化単位の最大サイズによって、深度別符号化単位の大きさが決定される。
一実施形態による符号化単位の階層構造600は、符号化単位の最大高及び最大幅が64であり、最大深度が4である場合を図示している。このとき、最大深度は、最大符号化単位から最小符号化単位までの全分割回数を示す。一実施形態による符号化単位の階層構造600の縦軸に沿って、深度が深くなるので、深度別符号化単位の高さ及び幅がそれぞれ分割される。また、符号化単位の階層構造600の横軸に沿って、それぞれの深度別符号化単位の予測符号化の基盤になる予測単位及びパーティションが図示されている。
すなわち、符号化単位610は、符号化単位の階層構造600において、最大符号化単位であり、深度が0であり、符号化単位の大きさ、すなわち、高さ及び幅が64x64である。縦軸に沿って深度が深くなり、サイズ32x32である深度1の符号化単位620、サイズ16x16である深度2の符号化単位630、サイズ8x8である深度3の符号化単位640が存在する。サイズ8x8である深度3の符号化単位640は、最小符号化単位である。
それぞれの深度別に、横軸に沿って、符号化単位の予測単位及びパーティションが配列される。すなわち、深度0のサイズ64x64の符号化単位610が予測単位であるならば、予測単位は、サイズ64x64の符号化単位610に含まれる、サイズ64x64のパーティション610、サイズ64x32のパーティション612、サイズ32x64のパーティション614、サイズ32x32のパーティション616に分割される。
同様に、深度1のサイズ32x32の符号化単位620の予測単位は、サイズ32x32の符号化単位620に含まれる、サイズ32x32のパーティション620、サイズ32x16のパーティション622、サイズ16x32のパーティション624、サイズ16x16のパーティション626に分割される。
同様に、深度2のサイズ16x16の符号化単位630の予測単位は、サイズ16x16の符号化単位630に含まれる、サイズ16x16のパーティション630、サイズ16x8のパーティション632、サイズ8x16のパーティション634、サイズ8x8のパーティション636に分割される。
同様に、深度3のサイズ8x8の符号化単位640の予測単位は、サイズ8x8の符号化単位640に含まれる、サイズ8x8のパーティション640、サイズ8x4のパーティション642、サイズ4x8のパーティション644、サイズ4x4のパーティション646に分割される。
一実施形態によるビデオ符号化装置100の符号化単位決定部120は、最大符号化単位610の符号化深度を決定するために、最大符号化単位610に含まれるそれぞれの深度の符号化単位ごとに、符号化を行わなければならない。
同一の範囲及び大きさのデータを含むための深度別符号化単位の個数は、深度が深くなるほど、深度別符号化単位の個数も増加する。例えば、深度1の符号化単位一つが含まれるデータに対して、深度2の符号化単位は、四つが必要である。従って、同一データの符号化の結果を深度別に比較するために、1つの深度1の符号化単位、及び4つの深度2の符号化単位を利用して、それぞれ符号化されなければならない。
それぞれの深度別符号化のためには、符号化単位の階層構造600の横軸に沿って、深度別符号化単位の予測単位ごとに符号化を行い、当該深度で最小の符号化誤差である代表符号化誤差が選択される。また、符号化単位の階層構造600の縦軸に沿って、深度が深くなり、それぞれの深度ごとに符号化を行い、深度別代表符号化誤差を比較し、最小符号化誤差が検索される。最大符号化単位610において、最小符号化誤差が発生する深度及びパーティションが、最大符号化単位610の符号化深度及びパーティションタイプに選択される。
図14は、本発明の一実施形態による、符号化単位及び変換単位の関係を図示している。
一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号化装置200は、最大符号化単位ごとに、最大符号化単位より小さいか、あるいはそれと同じ大きさの符号化単位で映像を符号化したり、あるいは復号化する。符号化過程において、変換のための変換単位の大きさは、それぞれの符号化単位ほど大きくないデータ単位を基に選択される。
例えば、一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号化装置200で、現在符号化単位710が64x64サイズであるとき、32x32サイズの変換単位720を利用して変換が行われる。
また、64x64サイズの符号化単位710のデータを、64x64サイズ以下の32x32,16x16,8x8,4x4サイズの変換単位でそれぞれ変換を行って符号化した後、原本との誤差が最小である変換単位が選択される。
図15は、本発明の一実施形態による深度別符号化情報を図示している。
一実施形態によるビデオ符号化装置100の出力部130は、符号化モードに係わる情報として、それぞれの符号化深度の符号化単位ごとに、パーティションタイプに係わる情報800、予測モードに係わる情報810、変換単位サイズに係わる情報820を符号化して伝送することができる。
パーティションタイプに係わる情報800は、現在符号化単位の予測符号化のためのデータ単位として、現在符号化単位の予測単位が分割されたパーティションのタイプに係わる情報を示す。例えば、サイズ2Nx2Nの現在符号化単位CU_0は、サイズ2Nx2Nのパーティション802、サイズ2NxNのパーティション804、サイズNx2Nのパーティション806、サイズNxNのパーティション808のうちいずれか1つのタイプに分割されて利用される。その場合、現在符号化単位のパーティションタイプに係わる情報800は、サイズ2Nx2Nのパーティション802、サイズ2NxNのパーティション804、サイズNx2Nのパーティション806、及びサイズNxNのパーティション808のうち一つを示すように設定される。
予測モードに係わる情報810は、それぞれのパーティションの予測モードを示す。例えば、予測モードに係わる情報810を介して、パーティションタイプに係わる情報800が示すパーティションが、イントラモード812、インターモード814及びスキップモード816のうち一つで予測符号化が行われるかということが設定される。
また、変換単位サイズに係わる情報820は、現在符号化単位について、いかなる変換単位を基に変換を行うかということを示す。例えば、変換単位は、第1イントラ変換単位サイズ822、第2イントラ変換単位サイズ824、第1インター変換単位サイズ826、第2インター変換単位サイズ828のうち一つである。
一実施形態によるビデオ復号化装置200の映像データ及び符号化情報抽出部210は、それぞれの深度別符号化単位ごとに、パーティションタイプに係わる情報800、予測モードに係わる情報810、変換単位サイズに係わる情報820を抽出し、復号化に利用することができる。
図16は、本発明の一実施形態による深度別符号化単位を図示している。
深度の変化を示すために、分割情報が利用される。分割情報は、現在深度の符号化単位が、下位深度の符号化単位に分割されるか否かということを示す。
深度0及び2N_0x2N_0サイズの符号化単位900の予測符号化のための予測単位910は、2N_0x2N_0サイズのパーティションタイプ912、2N_0xN_0サイズのパーティションタイプ914、N_0x2N_0サイズのパーティションタイプ916、N_0xN_0サイズのパーティションタイプ918を含んでもよい。予測単位が対称的な比率に分割されたパーティション912,914,916,918だけが例示されているが、前述のように、パーティションタイプは、それらに限定されるものではなく、非対称的パーティション、任意的形態のパーティション、幾何学的形態のパーティションなどを含んでもよい。
パーティションタイプごとに、1つの2N_0x2N_0サイズのパーティション、2つの2N_0xN_0サイズのパーティション、2つのN_0x2N_0サイズのパーティション、4つのN_0xN_0サイズのパーティションごとに、反復して予測符号化が行われなければならない。サイズ2N_0x2N_0、サイズN_0x2N_0、サイズ2N_0xN_0及びサイズN_0xN_0のパーティションについては、イントラモード及びインターモードで、予測符号化が行われる。スキップモードは、サイズ2N_0x2N_0のパーティションについてのみ予測符号化が行われる。
サイズ2N_0x2N_0のパーティションタイプ912,サイズ2N_0xN_0のパーティションタイプ914、及びN_0x2N_0のパーティションタイプ916のうち一つによる符号化誤差が最小であるならば、それ以上下位深度に分割する必要ない。
サイズN_0xN_0のパーティションタイプ918による符号化誤差が最小であるならば、深度0を1に変更しながら分割し(920)、深度2及びサイズN_0xN_0のパーティションタイプの符号化単位930に対して反復して符号化を行い、最小符号化誤差を検索していく。
サイズN_0xN_0のパーティションタイプ918による符号化誤差が最小であるならば、深度0を1に変更しながら分割し(920)、深度2及びサイズN_0xN_0のパーティションタイプの符号化単位930に対して反復して符号化を行い、最小符号化誤差を検索していく。
深度1及びサイズ2N_1x2N_1(=N_0xN_0)の符号化単位930の予測符号化のための予測単位940は、サイズ2N_1x2N_1のパーティションタイプ942、サイズ2N_1xN_1のパーティションタイプ944、サイズN_1x2N_1のパーティションタイプ946、サイズN_1xN_1のパーティションタイプ948を含んでもよい。
また、サイズN_1xN_1のパーティションタイプ948による符号化誤差が最小であるならば、深度1を深度2に変更しながら分割し(950)、深度2及びサイズN_2xN_2の符号化単位960に対して反復して符号化を行い、最小符号化誤差を検索していく。
最大深度がdである場合、深度別符号化単位は、深度d−1になるまで設定され、分割情報は、深度d−2まで設定される。すなわち、深度d−2から分割され(970)、深度d−1まで符号化が行われる場合、深度d−1及びサイズ2N_(d−1)x2N_(d−1)の符号化単位980の予測符号化のための予測単位990は、サイズ2N_(d−1)x2N_(d−1)のパーティションタイプ992、サイズ2N_(d−1)xN_(d−1)のパーティションタイプ994、サイズN_(d−1)x2N_(d−1)のパーティションタイプ996、サイズN_(d−1)xN_(d−1)のパーティションタイプ998を含んでもよい。
パーティションタイプのうち、1つのサイズ2N_(d−1)x2N_(d−1)のパーティション、2つのサイズ2N_(d−1)xN_(d−1)のパーティション、2つのサイズN_(d−1)x2N_(d−1)のパーティション、4つのサイズN_(d−1)xN_(d−1)のパーティションごとに、反復して予測符号化を介した符号化が行われ、最小符号化誤差が発生するパーティションタイプが検索される。
サイズN_(d−1)xN_(d−1)のパーティションタイプ998による符号化誤差が最小であるとしても、最大深度がdであるので、深度d−1の符号化単位CU_(d−1)は、それ以上下位深度への分割過程を経ず、現在最大符号化単位900に係わる符号化深度が深度d−1に決定され、パーティションタイプは、N_(d−1)xN_(d−1)に決定される。また、最大深度がdであるので、深度d−1の符号化単位980に対して、分割情報が設定されない。
データ単位999は、現在最大符号化単位に対する「最小単位」とされる。一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割された大きさの正方形のデータ単位でもある。そのような反復的符号化過程を介して、一実施形態によるビデオ符号化装置100は、符号化単位900の深度別符号化誤差を比較し、最小符号化誤差が発生する深度を選択し、符号化深度を決定し、当該パーティションタイプ及び予測モードが符号化深度の符号化モードに設定される。
そのように、深度0,1,…,d−1,dの全ての深度別最小符号化誤差を比較し、誤差が最小である深度が選択され、符号化深度として決定される。符号化深度、並びに予測単位のパーティションタイプ及び予測モードは、符号化モードに係わる情報として符号化されて伝送される。また、深度0から符号化深度に至るまで、符号化単位が分割されなければならないので、符号化深度の分割情報だけが「0」に設定され、符号化深度を除いた深度別分割情報は、「1」に設定されなければならない。
一実施形態によるビデオ復号化装置200の映像データ及び符号化情報抽出部220は、符号化単位900に係わる、符号化深度及び予測単位に係わる情報を抽出し、符号化単位912を復号化するのに利用することができる。一実施形態によるビデオ復号化装置200は、深度別分割情報を利用して、分割情報が「0」である深度を符号化深度として把握し、当該深度に係わる符号化モードに係わる情報を利用して、復号化に利用することができる。
図17、図18及び図19は、本発明の一実施形態による、符号化単位、予測単位及び変換単位の関係を図示している。
符号化単位1010は、最大符号化単位について、一実施形態によるビデオ符号化装置100が決定した符号化深度別符号化単位である。予測単位1060は、符号化単位1010において、それぞれの符号化深度別符号化単位の予測単位のパーティションであり、変換単位1070は、それぞれの符号化深度別符号化単位の変換単位である。
深度別符号化単位1010は、最大符号化単位の深度が0であるとすれば、符号化単位1012,1054は、深度が1、符号化単位1014,1016,1018,1028,1050,1052は、深度が2、符号化単位1020,1022,1024,1026,1030,1032,1048は、深度が3、符号化単位1040,1042,1044,1046は、深度が4である。
予測単位1060において、一部パーティション1014,1016,1022,1032,1048,1050,1052,1054は、符号化単位が分割された形態である。すなわち、パーティション1014,1022,1050,1054は、2NxNのパーティションタイプであり、パーティション1016,1048,1052は、Nx2Nのパーティションタイプであり、パーティション1032は、NxNのパーティションタイプである。深度別符号化単位1010の予測単位及びパーティションは、それぞれの符号化単位より小さいか、あるいはそれと同じである。
変換単位1070のうち一部の変換単位1052の映像データについては、符号化単位に比べ、小サイズのデータ単位に変換または逆変換が行われる。また、変換単位1014,1016,1022,1032,1048,1050,1052,1054は、予測単位1060のうち当該予測単位及びパーティションと比較すれば、互いに異なる大きさまたは形態のデータ単位である。すなわち、一実施形態によるビデオ符号化装置100、及び一実施形態で他のビデオ復号化装置200は、同一符号化単位に係わるイントラ予測/動き推定/動き補償作業、及び変換/逆変換作業であるとしても、それぞれ別個のデータ単位を基に遂行することができる。
それにより、最大符号化単位ごとに、領域別に、階層的な構造の符号化単位ごとに再帰的に符号化が行われ、最適符号化単位が決定されることにより、再帰的ツリー構造による符号化単位が構成される。符号化情報は、符号化単位に係わる分割情報、パーティションタイプ情報、予測モード情報、変換単位サイズ情報を含んでもよい。下記表1は、一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200で設定することができる一例を示す。
分割情報は、現在符号化単位が、下位深度の符号化単位に分割されるか否かということを示す。現在深度dの分割情報が0であるならば、現在符号化単位が、現在符号化単位が下位符号化単位にそれ以上分割されない深度が符号化深度であるので、符号化深度に対して、パーティションタイプ情報、予測モード、変換単位サイズ情報が定義される。分割情報によって、1段階さらに分割されなければならない場合には、分割された4個の下位深度の符号化単位ごとに、独立して符号化が行われなければならない。
予測モードは、イントラモード、インターモード及びスキップモードのうち一つで示すことができる。イントラモード及びインターモードは、全てのパーティションタイプで定義され、スキップモードは、パーティションタイプ2Nx2Nでのみ定義される。
パーティションタイプ情報は、予測単位の高さまたは幅が、対称的な比率に分割された対称的パーティションタイプ2Nx2N,2NxN,Nx2N及びNxNと、非対称的な比率に分割された非対称的パーティションタイプ2NxnU,2NxnD,nLx2N,nRx2Nと、を示すことができる。非対称的パーティションタイプ2NxnU及び2NxnDは、それぞれ高さが1:3及び3:1に分割された形態であり、非対称的パーティションタイプnLx2N及びnRx2Nは、それぞれ幅が1:3及び3:1に分割された形態を示す。
変換単位サイズは、イントラモードで2種の大きさに設定され、インターモードで2種の大きさに設定される。すなわち、変換単位分割情報が0であるならば、変換単位の大きさは、現在符号化単位のサイズ2Nx2Nに設定される。変換単位分割情報が1であるならば、現在符号化単位が分割された大きさの変換単位が設定される。また、サイズ2Nx2Nである現在符号化単位に係わるパーティションタイプが、対称形パーティションタイプであるならば、変換単位の大きさは、NxNに設定され、非対称形パーティションタイプであるならば、N/2xN/2に設定される。
一実施形態によるツリー構造による符号化単位の符号化情報は、符号化深度の符号化単位、予測単位及び最小単位単位のうち、少なくとも一つに対して割り当てられる。符号化深度の符号化単位は、同一符号化情報を保有している予測単位及び最小単位を一つ以上含んでもよい。
従って、隣接したデータ単位同士それぞれ保有している符号化情報を確認すれば、同一符号化深度の符号化単位に含まれるか否かということが確認される。また、データ単位が保有している符号化情報を利用すれば、当該符号化深度の符号化単位を確認することができるので、最大符号化単位内の符号化深度の分布が類推される。
従って、その場合、現在符号化単位が周辺データ単位を参照して予測する場合、現在符号化単位に隣接する深度別符号化単位内のデータ単位の符号化情報が直接参照されて利用される。
他の実施形態において、現在符号化単位が周辺符号化単位を参照して予測符号化が行われる場合、隣接する深度別符号化単位の符号化情報を利用して、深度別符号化単位内で、現在符号化単位に隣接するデータが検索されることにより、周辺符号化単位が参照されもする。
図20は、表1の符号化モード情報による、符号化単位、予測単位及び変換単位の関係を図示している。
最大符号化単位1300は、符号化深度の符号化単位1302,1304,1306,1312,1314,1316,1318を含む。そのうち1つの符号化単位1318は、符号化深度の符号化単位であるので、分割情報が0に設定される。サイズ2Nx2Nの符号化単位1318のパーティションタイプ情報は、パーティションタイプ2Nx2N 1322,2NxN 1324,Nx2N 1326,NxN 1328,2NxnU 1332,2NxnD 1334,nLx2N 1336及びnRx2N 1338のうち一つに設定される。
変換単位分割情報(TU size flag)は、変換インデックスの一種であり、変換インデックスに対応する変換単位の大きさは、符号化単位の予測単位タイプまたはパーティションタイプによって変更される。
例えば、パーティションタイプ情報が、対称形パーティションタイプ2Nx2N 1322,2NxN 1324,Nx2N 1326及びNxN 1328のうち一つに設定されている場合、変換単位分割情報が0であるならば、サイズ2Nx2Nの変換単位1342が設定され、変換単位分割情報が1であるならば、サイズNxNの変換単位1344が設定される。
パーティションタイプ情報が、非対称形パーティションタイプ2NxnU 1332,2NxnD 1334,nLx2N 1336及びnRx2N 1338のうち一つに設定された場合、変換単位分割情報(TU size flag)が0であるならば、サイズ2Nx2Nの変換単位1352が設定され、変換単位分割情報が1であるならば、サイズN/2xN/2の変換単位1354が設定される。
図20を参照して説明した変換単位分割情報(TU size flag)は、0または1の値を有するフラグであるが、一実施形態による変換単位分割情報は、1ビットのフラグに限定されるものではなく、設定によって、0、1、2、3、…などに増やし、変換単位が階層的に分割されもする。変換単位分割情報は、変換インデックスの一実施形態として利用される。
その場合、一実施形態による変換単位分割情報を、変換単位の最大サイズ、変換単位の最小サイズと共に利用すれば、実際に利用された変換単位の大きさが表現される。一実施形態によるビデオ符号化装置100は、最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報を符号化することができる。符号化された最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報は、シーケンス・パラメータセットに挿入される。一実施形態によるビデオ復号化装置200は、最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報を利用して、ビデオ復号化に利用することができる。
例えば、(a)現在符号化単位がサイズ64x64であり、最大変換単位サイズが32x32であるであるならば、(a−1)変換単位分割情報が0であるとき、変換単位の大きさは、32x32に設定され、(a−2)変換単位分割情報が1であるとき、変換単位の大きさは、16x16に設定され、(a−3)変換単位分割情報が2であるとき、変換単位の大きさは、8x8に設定される。
他の例として、(b)現在符号化単位がサイズ32x32であり、最小変換単位サイズが32x32であるならば、(b−1)変換単位分割情報が0であるとき、変換単位の大きさは、32x32に設定され、変換単位の大きさが32x32より小さいことがないので、それ以上の変換単位分割情報が設定されることがない。
さらに他の例として、(c)現在符号化単位がサイズ64x64であり、最大変換単位分割情報が1であるならば、変換単位分割情報は、0または1であり、他の変換単位分割情報が設定されることがない。
従って、最大変換単位分割情報を「MaxTransformSizeIndex」と定義し、最小変換単位サイズを「MinTransformSize」と定義し、変換単位分割情報が0である場合の変換単位サイズを「RootTuSize」と定義するとき、現在符号化単位で可能な最小変換単位サイズ「CurrMinTuSize」は、以下の数式(1)のように定義される。
CurrMinTuSize
=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex)) (1)
現在符号化単位で可能な最小変換単位サイズ「CurrMinTuSize」と比較し、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、システム上採択可能な最大変換単位サイズを示すことができる。すなわち、数式(1)によれば、「RootTuSize/(2^MaxTransformSizeIndex)」は、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」を、最大変換単位分割情報に相応する回数ほど分割した変換単位サイズであり、「MinTransformSize」は、最小変換単位サイズであるので、それらのうち小さい値が、現在現在符号化単位で可能な最小変換単位サイズ「CurrMinTuSize」でもある。
=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex)) (1)
現在符号化単位で可能な最小変換単位サイズ「CurrMinTuSize」と比較し、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、システム上採択可能な最大変換単位サイズを示すことができる。すなわち、数式(1)によれば、「RootTuSize/(2^MaxTransformSizeIndex)」は、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」を、最大変換単位分割情報に相応する回数ほど分割した変換単位サイズであり、「MinTransformSize」は、最小変換単位サイズであるので、それらのうち小さい値が、現在現在符号化単位で可能な最小変換単位サイズ「CurrMinTuSize」でもある。
一実施形態による最大変換単位サイズ「RootTuSize」は予測モードによって変わることもできる。
例えば、現在予測モードがインターモードであるならば「RootTuSize」は、下記数式(2によって決定される。数式(2)において、「MaxTransformSize」は、最大変換単位サイズを示し、「PUSize」は、現在予測単位大きさを示す。
例えば、現在予測モードがインターモードであるならば「RootTuSize」は、下記数式(2によって決定される。数式(2)において、「MaxTransformSize」は、最大変換単位サイズを示し、「PUSize」は、現在予測単位大きさを示す。
「RootTuSize」=min(MaxTransformSize,PUSize) (2)
すなわち、現在予測モードがインターモードであるならば、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、最大変換単位サイズ及び現在予測単位大きさのうち小さい値に設定される。
すなわち、現在予測モードがインターモードであるならば、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、最大変換単位サイズ及び現在予測単位大きさのうち小さい値に設定される。
現在パーティション単位の予測モードがイントラモードであるならば、「RootTuSize」は、下記数式(3)によって決定される。「PartitionSize」は、現在パーティション単位の大きさを示す。
RootTuSize=min(MaxTransformSize,PartitionSize) (3)
すなわち、現在予測モードがイントラモードであるならば、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、最大変換単位サイズ及び現在パーティション単位サイズのうち小さい値に設定される。
すなわち、現在予測モードがイントラモードであるならば、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、最大変換単位サイズ及び現在パーティション単位サイズのうち小さい値に設定される。
ただし、パーティション単位の予測モードによって変動する一実施形態による現在最大変換単位サイズ「RootTuSize」は、一実施形態であるのみ、現在最大変換単位サイズを決定する要因がそれに限定されるものではないということを留意しなければならない。
図8ないし図20を参照して説明したツリー構造の符号化単位に基づいたビデオ符号化技法によって、ツリー構造の符号化単位ごとに、空間領域の映像データが符号化され、ツリー構造の符号化単位に基づいたビデオ復号化技法によって、最大符号化単位ごとに復号化が行われながら、空間領域の映像データが復元され、ピクチャ及びピクチャシーケンスであるビデオが復元される。復元されたビデオは、再生装置によって再生されるか、記録媒体に保存されるか、あるいはネットワークを介して伝送される。
また、ピクチャごとに、スライスごとに、最大符号化単位ごとに、ツリー構造による符号化単位ごとに、符号化単位の予測単位ごとに、または符号化単位の変換単位ごとに、オフセットパラメータがシグナリングされる。一例として、最大符号化単位ごとに受信されたオフセットパラメータに基づいて復元されたオフセット値を利用して、最大符号化単位の復元ピクセル値を調整することにより、原本ブロックとの誤差が最小化される最大符号化単位が復元される。
説明の便宜のために、先の図1Aないし図20を参照して説明したサンプルオフセット調整によるビデオ符号化方法は、「本発明のビデオ符号化方法」とする。また、先の図1Aないし図20を参照して説明したサンプルオフセット調整によるビデオ復号化方法は、「本発明のビデオ復号化方法」とする
また、先の図1Aないし図20を参照して説明した、SAO符号化装置10、ビデオ符号化装置100または映像符号化部400で構成されたビデオ符号化装置は、「本発明のビデオ符号化装置」とする。また、先の図2Aないし図20を参照して説明した、SAO復号化装置20、ビデオ復号化装置200または映像復号化部500で構成されたビデオ復号化装置は、「本発明のビデオ復号化装置」とする。
また、先の図1Aないし図20を参照して説明した、SAO符号化装置10、ビデオ符号化装置100または映像符号化部400で構成されたビデオ符号化装置は、「本発明のビデオ符号化装置」とする。また、先の図2Aないし図20を参照して説明した、SAO復号化装置20、ビデオ復号化装置200または映像復号化部500で構成されたビデオ復号化装置は、「本発明のビデオ復号化装置」とする。
一実施形態によるプログラムが保存されるコンピュータで読み取り可能な記録媒体がディスク26000である実施形態について、以下で説明する。
図21は、一実施形態によるプログラムが保存されたディスク26000の物理的構造を例示する。記録媒体として述べたディスク26000は、ハードドライブ、CD(compact disc)−ROM(read only memory)ディスク、ブルーレイ(登録商標(Blu-ray))ディスク、DVD(digital versatile disk)ディスクでもある。ディスク26000は、多数の同心円のトラックTrから構成され、トラックは、円周方向に沿って、所定個数のセクタSeに分割される。前述の一実施形態によるプログラムを保存するディスク26000において特定領域に、前述の量子化パラメータ決定方法、ビデオ符号化方法及びビデオ復号化方法を具現するためのプログラムが割り当てられて保存される。
前述のビデオ符号化方法及びビデオ復号化方法を具現するためのプログラムを保存する記録媒体を利用して達成されたコンピュータシステムについて、図22を参照して説明する。
図22は、ディスク26000を利用して、プログラムを記録して判読するためのディスクドライブ26800を図示している。コンピュータ・システム26700は、ディスクドライブ26800を利用して、本発明のビデオ符号化方法及びビデオ復号化方法のうち少なくとも一つを具現するためのプログラムを、ディスク26000に保存することができる。ディスク26000に保存されたプログラムを、コンピュータシステム26700上で実行するために、ディスクドライブ26800によって、ディスク26000からプログラムが判読され、プログラムがコンピュータシステム26700に伝送される。
図21及び図22で例示されたディスク26000だけではなく、メモリカード、ROMカセット、SSD(solid state drive)にも、本発明のビデオ符号化方法及びビデオ復号化方法のうち少なくとも一つを具現するためのプログラムが保存される。
前述の実施形態によるビデオ符号化方法及びビデオ復号化方法が適用されたシステムについて説明する。
図23は、コンテンツ流通サービス(content distribution service)を提供するためのコンテンツ供給システム(content supply system)11000の全体的構造を図示している。通信システムのサービス領域は、所定サイズのセルに分割され、各セルに、ベースステションになる無線基地局11700,11800,11900,12000が設置される。
コンテンツ供給システム11000は、多数の独立デバイスを含む。例えば、コンピュータ12100、PDA(personal digital assistant)12200、ビデオカメラ12300及び携帯電話12500のような独立デバイスが、インターネットサービス・プロバイダ11200、通信網11400及び無線基地局11700,11800,11900,12000を経て、インターネット11100に連結される。
しかし、コンテンツ供給システム11000は、図24に図示された構造にのみ限定されるものではなく、デバイスは、選択的に連結される。独立デバイスが無線基地局11700,11800,11900,12000を経ず、通信網11400に直接連結されもする。
ビデオカメラ12300は、デジタルビデオカメラのように、ビデオ映像を撮影することができる撮像デバイスである。携帯電話12500は、PDC(personal digital communications)方式、CDMA(code division multiple access)方式、W−CDMA(wideband code division multiple access)方式、GSM(登録商標(global system for mobile communications))方式及びPHS(personal handyphone system)方式のような多様なプロトコルのうち、少なくとも1つの通信方式を採択することができる。
ビデオカメラ12300は、無線基地局11900及び通信網11400を経て、ストリーミングサーバ11300に連結される。ストリーミングサーバ11300は、ユーザが、ビデオカメラ12300を使用して伝送したコンテンツを、リアルタイム放送でストリーミング伝送することができる。ビデオカメラ12300から受信されたコンテンツは、ビデオカメラ12300またはストリーミングサーバ11300によって符号化される。ビデオカメラ12300に撮影されたビデオデータは、コンピュータ12100を経て、ストリーミングサーバ11300に伝送されもする。
カメラ12600で撮影されたビデオデータも、コンピュータ12100を経て、ストリーミングサーバ11300に伝送されもする。カメラ12600は、デジタルカメラのように、静止映像及びビデオ映像をいずれも撮影することができる撮像装置である。カメラ12600から受信されたビデオデータは、カメラ12600またはコンピュータ12100によって符号化される。ビデオ符号化及び復号化のためのソフトウェアは、コンピュータ12100がアクセスすることができるCD−ROMディスク、フロッピー(登録商標)ディスク、ハードディスクドライブ、SSD、メモリカードのようなコンピュータで読み取り可能な記録媒体に保存される。
また、携帯電話12500に搭載されたカメラによってビデオが撮影された場合、ビデオデータが、携帯電話12500から受信される。
ビデオデータは、ビデオカメラ12300、携帯電話12500またはカメラ12600に搭載されたLSI(largescale integrated circuit)システムによって符号化される。
一実施形態によるコンテンツ供給システム11000において、例えば、コンサートの現場録画コンテンツのように、ユーザがビデオカメラ12300、カメラ12600、携帯電話12500または他の撮像デバイスを利用して録画されたコンテンツが符号化され、ストリーミングサーバ11300に伝送される。ストリーミングサーバ11300は、コンテンツデータを要請した他のクライアントに、コンテンツデータをストリーミング伝送することができる。
クライアントは、符号化されたコンテンツデータを復号化することができるデバイスであり、例えば、コンピュータ12100、PDA
12200、ビデオカメラ12300または携帯電話12500でもある。従って、コンテンツ供給システム11000は、クライアントをして、符号化されたコンテンツデータを受信して再生させる。また、コンテンツ供給システム11000は、クライアントをして、符号化されたコンテンツデータを受信し、リアルタイムに復号化して再生させ、個人放送(personal broadcasting)を可能にする。
12200、ビデオカメラ12300または携帯電話12500でもある。従って、コンテンツ供給システム11000は、クライアントをして、符号化されたコンテンツデータを受信して再生させる。また、コンテンツ供給システム11000は、クライアントをして、符号化されたコンテンツデータを受信し、リアルタイムに復号化して再生させ、個人放送(personal broadcasting)を可能にする。
コンテンツ供給システム11000に含まれた独立デバイスの符号化動作及び復号化動作に、本発明のビデオ符号化装置及びビデオ復号化装置が適用される。
図24及び図25を参照し、コンテンツ供給システム11000において、携帯電話12500の一実施形態について詳細に説明される。
図24は、一実施形態による本発明のビデオ符号化方法及びビデオ復号化方法が適用される携帯電話12500の外部構造を図示している。携帯電話12500は、機能が制限されず、応用プログラムを介して。相当部分の機能を変更したり、あるいは拡張することができるスマートフォンでもある。
携帯電話12500は、無線基地局12000とRF(radio frequency)信号を交換するための内蔵アンテナ12510を含み、カメラ12530によって撮影された映像、またはアンテナ12510によって受信されて復号化された映像をディスプレイするためのLCD(liquid crystal display)画面、OLED(organic light emitting diodes)画面のようなディスプレイ画面12520を含む。スマートフォン12510は、制御ボタン、タッチパネルを含む動作パネル12540を含む。ディスプレイ画面12520がタッチスクリーンである場合、動作パネル12540は、ディスプレイ画面12520のタッチ感知パネルをさらに含む。スマートフォン12510は、音声、音響を出力するためのスピーカ12580)または他の形態の音響出力部と、音声及び音響が入力されるマイクロフォン12550、または他の形態の音響入力部を含む。スマートフォン12510は、ビデオ及び静止映像を撮影するためのCCD(charge coupled device)カメラのようなカメラ12530をさらに含む。また、スマートフォン12510は、カメラ12530によって撮影されたり、電子メール(E−mail)によって受信されたり、あるいは他の形態で獲得されたりするビデオや静止映像のように、符号化されたり、あるいは復号化されたりするデータを保存するための記録媒体12570と、記録媒体12570を携帯電話12500に装着するためのスロット12560と、を含んでもよい。記録媒体12570は、SDカードまたはプラスチックケースに内蔵されたEEPROM(electrically erasable and programmable read only memory)のような他の形態のフラッシュメモリでもある。
図25は、携帯電話12500の内部構造を図示している。ディスプレイ画面12520及び動作パネル12540で構成された携帯電話12500の各パートを組織的に制御するために、電力供給回路12700、動作入力制御部12640、映像符号化部12720、カメラ・インターフェース12630、LCD制御部12620、映像復号化部12690、マルチプレクサ/デマルチプレクサ(MUX/DEMUX:multiplexer/demultiplexer)12680、記録/判読部12670、変調/復調(modulation/demodulation)部12660及び音響処理部12650が、同期化バス12730を介して、中央制御部12710に連結される。
ユーザが電源ボタンを動作し、「電源オフ」状態から「電源オン」状態に設定すれば、電力供給回路12700は、バッテリパックから、携帯電話12500の各パートに電力を供給することにより、携帯電話12500が動作モードにセッティングされる。
中央制御部12710は、CPU(central processing unit)、ROM及びRAM(random access memory)を含む。
携帯電話12500が外部に通信データを送信する過程では、中央制御部12710の制御によって、携帯電話12500でデジタル信号が生成される、例えば、音響処理部12650では、デジタル音響信号が生成され、映像符号化部12720では、デジタル映像信号が生成され、動作パネル12540及び動作入力制御部12640を介して、メッセージのテキストデータが生成される。中央制御部12710の制御によって、デジタル信号が変調/復調部12660に伝達されれば、変調/復調部12660は、デジタル信号の周波数帯域を変調し、通信回路12610は、帯域変調されたデジタル音響信号に対して、D/A変換(digital−analog conversion)処理及び周波数変換(frequency conversion)処理を行う。通信回路12610から出力された送信信号は、アンテナ12510を介して、音声通信基地局または無線基地局12000に送出される。
例えば、携帯電話12500が通話モードであるとき、マイクロフォン12550によって獲得された音響信号は、中央制御部12710の制御によって、音響処理部12650において、デジタル音響信号に変換される。生成されたデジタル音響信号は、変調/復調部12660及び通信回路12610を経て送信信号に変換され、アンテナ12510を介して送出される。
データ通信モードにおいて、電子メールのようなテキストメッセージが伝送される場合、動作パネル12540を利用して、メッセージのテキストデータが入力され、テキストデータが、動作入力制御部12640を介して、中央制御部12610に伝送される。中央制御部12610の制御によって、テキストデータは、変調/復調部12660及び通信回路12610を介して送信信号に変換され、アンテナ12510を介して、無線基地局12000に送出される。
データ通信モードにおいて、映像データを伝送するために、カメラ12530によって撮影された映像データは、カメラ・インターフェース12630を介して、映像符号化部12720に提供される。カメラ12530によって撮影された映像データは、カメラ・インターフェース12630及びLCD制御部12620を介して、ディスプレイ画面12520に直ちにディスプレイされる。
映像符号化部12720の構造は、前述の本発明のビデオ符号化装置の構造と相応する。映像符号化部12720は、カメラ12530から提供された映像データを、前述の本発明のビデオ符号化方式によって符号化し、圧縮符号化された映像データに変換し、符号化された映像データを、多重化/逆多重化部(MUX/DEMUX)12680に出力することができる。カメラ12530の録画中に、携帯電話12500のマイクロフォン12550によって獲得された音響信号も、音響処理部12650を経て、デジタル音響データに変換され、デジタル音響データは、多重化/逆多重化部(MUX/DEMUX)12680に伝達される。
多重化/逆多重化部(MUX/DEMUX)12680は、音響処理部12650から提供された音響データと共に、映像符号化部12720から提供された符号化された映像データを多重化させる。多重化されたデータは、変調/復調部12660及び通信回路12610を介して伝送信号に変換され、アンテナ12510を介して送出される。
携帯電話12500が、外部から通信データを受信する過程では、アンテナ12510を介して受信された信号を、周波数復元(frequency recovery)処理及びA/D変換(analog−digita lconversion)処理を介して、デジタル信号を変換する。変調/復調部12660は、デジタル信号の周波数帯域を復調する。帯域復調されたデジタル信号は、種類によって、ビデオ復号化部12690、音響処理部12650またはLCD制御部12620に伝達される。
携帯電話12500は、通話モードであるとき、アンテナ12510を介して受信された信号を増幅し、周波数変換処理及びA/D変換(analog−digital conversion)処理を介して、デジタル音響信号を生成する。受信されたデジタル音響信号は、中央制御部12710の制御によって、変調/復調部12660及び音響処理部12650を経てアナログ音響信号に変換され、アナログ音響信号が、スピーカ12580を介して出力される。
データ通信モードにおいて、インターネットのウェブサイトからアクセスされたビデオファイルのデータが受信される場合、アンテナ12510を介して、無線基地局12000から受信された信号は、変調/復調部12660の処理結果、多重化されたデータを出力し、多重化されたデータは、多重化/逆多重化部(MUX/DEMUX)12680に伝達される。
アンテナ12510を介して受信した多重化されたデータを復号化するために、多重化/逆多重化部(MUX/DEMUX)12680は、多重化されたデータを逆多重化し、符号化されたビデオデータストリームと、符号化されたオーディオデータストリームとを分離する。同期化バス12730によって、符号化されたビデオデータストリームは、ビデオ復号化部12690に提供され、符号化されたオーディオデータストリームは、音響処理部12650に提供される。
映像復号化部12690の構造は、前述の本発明のビデオ復号化装置の構造と相応する。映像復号化部12690は、前述の本発明のビデオ復号化方法を利用して、符号化されたビデオデータを復号化し、復元されたビデオデータを生成し、復元されたビデオデータをLCD制御部12620を経て、ディスプレイ画面1252に、復元されたビデオデータを提供することができる。
それによって、インターネットのウェブサイトからアクセスされたビデオファイルのビデオデータが、ディスプレイ画面12520でディスプレイされる。それと同時に、音響処理部12650も、オーディオデータをアナログ音響信号に変換して、アナログ音響信号をスピーカ12580に提供することができる。それにより、インターネットのウェブサイトからアクセスされたビデオファイルに含まれたオーディオデータも、スピーカ12580で再生される。
携帯電話12500または他の形態の通信端末機は、本発明のビデオ符号化装置及びビデオ復号化装置をいずれも含む送受信端末機であるか、前述の本発明のビデオ符号化装置のみを含む送信端末機であるか、あるいは本発明のビデオ復号化装置のみを含む受信端末機でもある。
本発明の通信システムは、図24及び図25を参照して説明した構造に限定されるものではない。例えば、図26は、本発明による通信システムが適用されたデジタル放送システムを図示している。図26の一実施形態によるデジタル放送システムは、本発明のビデオ符号化装置及びビデオ復号化装置を利用して、衛星ネットワークまたは地上波ネットワークを介して伝送されるデジタル放送を受信することができる。
具体的に述べれば、放送局12890は、電波を介して、ビデオデータストリームを通信衛星または放送衛星12900に伝送する。放送衛星12900は、放送信号を伝送し、放送信号は、家庭にあるアンテナ12860によって、衛星放送受信機に受信される。各家庭で、符号化されたビデオストリームは、TV(television)受信機12810、セットトップボックス(set-top box)12870または他のデバイスによって復号化されて再生される。
再生装置12830で、本発明のビデオ復号化装置が具現されることにより、再生装置12830は、ディスク及びメモリカードのような記録媒体12820に記録された符号化されたビデオストリームを判読して復号化することができる。それによって、復元されたビデオ信号は、例えば、モニタ12840で再生される。
衛星/地上波放送のためのアンテナ12860、またはケーブルTV受信のためのケーブルアンテナ12850に連結されたセットトップボックス12870にも、本発明のビデオ復号化装置が搭載される。セットトップボックス12870の出力データも、TVモニタ12880で再生される。
他の例として、セットトップボックス12870の代わりに、TV受信機12810自体に、本発明のビデオ復号化装置が搭載されもする。
適切なアンテナ12910を具備した自動車12920が、衛星12800または無線基地局11700から送出される信号を受信することもできる。自動車12920に搭載された自動車ナビゲーションシステム12930のディスプレイ画面に、復号化されたビデオが再生される。
ビデオ信号は、本発明のビデオ符号化装置によって符号化されて記録媒体に記録されて保存される。具体的に述べれば、DVDレコーダによって、映像信号がDVDディスク12960に保存されるか、あるいはハードディスクレコーダ12950によって、ハードディスクに映像信号が保存される。他の例として、ビデオ信号は、SDカード12970に保存されもする。ハードディスクレコーダ12950が、一実施形態による本発明のビデオ復号化装置を具備すれば、DVDディスク12960、SDカード12970、または他の形態の記録媒体に記録されたビデオ信号が、モニタ12880で再生される。
自動車ナビゲーションシステム12930は、図25のカメラ12530、カメラ・インターフェース12630及び映像符号化部12720を含まないこともある。例えば、コンピュータ12100(図23)及びTV受信機12810も、図25のカメラ12530、カメラ・インターフェース12630及び映像符号化部12720を含まないこともある。
図27は、本発明の一実施形態による、ビデオ符号化装置及びビデオ復号化装置を利用するクラウドコンピューティングシステムのネットワーク構造を図示している。
本発明のクラウドコンピューティングシステムは、クラウドコンピューティングサーバ14100、ユーザDB(database)14100、コンピューティング資源14200及びユーザ端末機を含んでなる。
クラウドコンピューティングシステムは、ユーザ端末機の要請によって、インターネットのような情報通信網を介して、コンピューティング資源のオンデマンド・アウトソーシングサービスを提供する。クラウドコンピューティング環境において、サービスプロバイダは、互いに異なる物理的な位置に存在するデータセンターのコンピューディング資源を仮想化技術で統合し、ユーザが必要とするサービスを提供する。サービスユーザは、アプリケーション(application)、ストレージ(storage)、運用体制(OS)、保安(security)のようなコンピューティング資源を、各ユーザ所有の端末にインストールして使用するのではなく、仮想化技術を介して生成された仮想空間上のサービスを、所望時点に所望のほど選んで使用することができる。
特定サービスユーザのユーザ端末機は、インターネット及び移動通信網を含む情報通信網を介して、クラウドコンピューティングサーバ14100に接続する。ユーザ端末機は、クラウドコンピューティングサーバ14100から、クラウドコンピューティングサービス、特に、動画再生サービスを提供される。ユーザ端末機は、デスクトップPC(personal computer)14300、スマートTV 14400、スマートフォン14500、ノート型パソコン14600、PMP(portable multimedia player)14700、テブレットPC 14800など、インターネット接続が可能な全ての電子機器になることができる。
クラウドコンピューティングサーバ14100は、クラウド網に分散している多数のコンピューティング資源14200を統合し、ユーザ端末機に提供することができる。多数のコンピューティング資源14200は、さまざまなデータサービスを含み、ユーザ端末機からアップロードされたデータを含んでもよい。そのように、クラウドコンピューティングサーバ14100は、多くのところに分散している動画データベースを仮想化技術で統合し、ユーザ端末機が要求するサービスを提供する。
ユーザDB 14100には、クラウドコンピューティングサービスに加入しているユーザ情報が保存される。ここで、ユーザ情報は、ログイン情報、及び住所、氏名など個人信用情報を含んでもよい。また、ユーザ情報は、動画のインデックス(index)を含んでもよい。ここで、インデックスは、再生を完了した動画リストや、再生中の動画リストや、再生中の動画の停止時点などを含んでもよい。
ユーザDB 14100に保存された動画に係わる情報は、ユーザデバイス間に共有される。従って、例えば、ノート型パソコン14600から再生要請され、ノート型パソコン14600に、所定動画サービスを提供した場合、ユーザDB 14100に所定動画サービスの再生ヒストリーが保存される。スマートフォン14500から、同一動画サービスの再生要請が受信される場合、クラウドコンピューティングサーバ14100は、ユーザDB 14100を参照し、所定動画サービスを探して再生する。スマートフォン14500が、クラウドコンピューティングサーバ14100を介して、動画データストリームを受信する場合、動画データストリームを復号化してビデオを再生する動作は、先の図24及び図25を参照して説明した携帯電話12500の動作と類似している。
クラウドコンピューティングサーバ14100は、ユーザDB 14100に保存された所定動画サービスの再生ヒストリーを参照することもできる。例えば、クラウドコンピューティングサーバ14100は、ユーザ端末機からユーザDB 14100に保存された動画に対する再生要請を受信する。動画が、その以前に再生中であったならば、クラウドコンピューティングサーバ14100は、ユーザ端末機からの選択によって、最初から再生するか、以前の停止時点から再生するかということにより、ストリーミング方法が異なる。例えば、ユーザ端末機が、最初から再生するように要請した場合には、クラウドコンピューティングサーバ14100は、ユーザ端末機に、当該動画を最初のフレームからストリーミング伝送する。一方、端末機が、以前の停止時点から引き継いで再生するように要請した場合には、クラウドコンピューティングサーバ14100は、ユーザ端末機に、当該動画を停止時点のフレームからストリーミング伝送する。
そのとき、ユーザ端末機は、図1Aないし図20を参照して説明した本発明のビデオ復号化装置を含んでもよい。他の例として、ユーザ端末機は、図1Aないし図20を参照して説明した本発明のビデオ符号化装置を含んでもよい。また、ユーザ端末機は、図1Aないし図20を参照して説明した本発明のビデオ符号化装置及びビデオ復号化装置をいずれも含んでもよい。
図1Aないし図20を参照して説明した、本発明のビデオ符号化方法及びビデオ復号化方法、並びに本発明のビデオ符号化装置及びビデオ復号化装置が活用される多様な実施形態について、図21ないし図27で説明した。しかし、図1Aないし図20を参照して説明した本発明のビデオ符号化方法及びビデオ復号化方法が記録媒体に保存されたり、あるいは本発明のビデオ符号化装置及びビデオ復号化装置がデバイスで具現されたりする多様な実施形態は、図21ないし図27の実施形態に限定されるものではない。
本明細書で、「Aは、a1、a2及びa3のうち一つを含んでもよい」という記述は、Aというエレメント(element)に含まれる例示的なエレメントが、a1、a2またはa3であるという広い意味である。
前記記述によって、エレメントAを構成することができるエレメントは、必ずしもa1、a2またはa3に限られるというものではない。従って、Aを構成することができるエレメントが、a1、a2及びa3以外で例示されていない他のエレメントを排除するという意味で、排他的に解釈されるものではないということに留意しなければならない。
また、前記記述はは、Aがa1を含んでも、a2を含んでも、あるいはa3を含んでもよいという意味である。前記記述がAを構成するエレメントが、必ずしも所定集合内で選択的に決定されるということを意味しない。例えば、前記記述が、必ずしもa1、a2及びa3を含む集合から選択されたa1、a2、またはa3がコンポーネントAを構成するとして、制限的に解釈されるものではないということに留意しなければならない。
また、本明細書で、「a1、a2または(及び)a3のうち少なくとも一つ」という記述は、a1;a2;a3;a1及びa2;a1及びa3;a2及びa3;a1、a2及びa3のうち一つを示す。
従って、「a1のうち少なくとも一つ、a2のうち少なくとも一つまたは(及び)a3のうち少なくとも一つ」と明示上に記述しない以上、「a1、a2または(及び)a3のうち少なくとも一つ」という記述は、a1のうち少なくとも一つ、a2のうち少なくとも一つまたは(及び)a3のうち少なくとも一つ」と解釈されないということに留意しなければならない。
一方、前述の本発明の実施形態は、コンピュータで実行されるプログラムで作成可能であり、コンピュータで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用デジタルコンピュータで具現される。前記コンピュータで読み取り可能な記録媒体は、マグネチック記録媒体(例えば、ROM、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CD−ROM、DVDなど)のような記録媒体を含む。
以上、本発明について、その望ましい実施形態を中心に説明した。本発明が属する技術分野で当業者であるならば、本発明が、本発明の本質的な特性から外れない範囲で変形された形態で具現されるということを理解することができるであろう。従って、開示された実施形態は、限定的な観点ではなく、説明的な観点から考慮されなければならない。本発明の範囲は、前述の説明ではなく、特許請求の範囲に示されており、それと同等な範囲内にある全ての差異は、本発明に含まれたものであると解釈されなければならないのである。
以下、本願により教示される手段を例示的に列挙する。
以下、本願により教示される手段を例示的に列挙する。
(付記1)
SAO(sample adaptive offset)復号化方法において、
最大符号化単位のビットストリームから、コンテクストに基づいてエントロピー符号化された左向きSAO併合情報及び上向きSAO併合情報を獲得する段階と、
前記ビットストリームから、カラー成分別に、コンテクストに基づいてエントロピー符号化されたSAOオンオフ情報を獲得する段階と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたSAOカテゴリー別オフセット絶対値情報を獲得する段階と、
前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたバンド位置情報及びエッジクラス情報のうち一つを獲得する段階と、を含むことを特徴とするSAO復号化方法。
(付記2)
前記SAOオンオフ情報を獲得する段階は、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたエッジバンド区別情報をさらに獲得する段階を含み、
前記最大符号化単位のSAOタイプ情報のうち最初のビンである前記SAOオンオフ情報に対して、コンテクストに基づいてエントロピー復号化を行い、前記SAOタイプ情報のうち、前記SAOオンオフ情報を除いた残りのビットに対して、バイパスモードでエントロピー復号化を行うことを特徴とする付記1に記載のSAO復号化方法。
(付記3)
前記バンド位置情報またはエッジクラス情報を獲得する段階は、
前記獲得されたエッジバンド区別情報がバンドタイプを示すものであるならば、前記ビットストリームから、カラー成分別に、前記バイパッドモードでエントロピー符号化されたバンド位置情報を獲得する段階を含み、
前記バンド位置情報を獲得する段階は、前記SAOカテゴリー別に獲得されたオフセット絶対値情報が0でなければ、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたオフセット符号情報及び前記バンド位置情報を獲得する段階を含み、
前記バンド位置情報は、前記最大符号化単位のSAOパラメータのうち最後に獲得されることを特徴とする付記2に記載のSAO復号化方法。
(付記4)
前記バンド位置情報またはエッジクラス情報を獲得する段階は、
前記獲得されたエッジバンド区別情報がエッジタイプを示すものであるならば、前記ビットストリームから、カラー成分別に、前記バイパスモードでエントロピー符号化されたエッジクラス情報を獲得する段階を含み、
前記エッジクラス情報は、ルマ成分のためのエッジクラス情報、及び第1クロマ成分のためのエッジクラス情報を含み、前記第1クロマ成分のためのエッジクラス情報は、第2クロマ成分に同一に適用されることを特徴とする付記2に記載のSAO復号化方法。
(付記5)
第1クロマ成分のための前記SAOオンオフ情報、及び前記エッジバンド区別情報は、第2クロマ成分に同一に適用され、
前記左向きSAO併合情報及び上向きSAO併合情報は、前記最大符号化単位のルマ成分、並びに第1クロマ成分及び第2クロマ成分に対して同一に適用されることを特徴とする付記2に記載のSAO復号化方法。
(付記6)
前記左向きSAO併合情報及び上向きSAO併合情報を獲得する段階は、
前記左向きSAO併合情報のコンテクストに基づいた確率モデルを決定し、前記決定された左向きSAO併合情報の確率モデルを利用したエントロピー復号化を行い、前記左向きSAO併合情報を復元する段階と、
前記上向きSAO併合情報のコンテクストに基づいた確率モデルを決定し、前記決定された上向きSAO併合情報の確率モデルを利用したエントロピー復号化を行い、前記上向きSAO併合情報を復元する段階と、を含み、
前記SAOオンオフ情報を獲得する段階は、前記SAOオンオフ情報のコンテクストに基づいた確率モデルを決定し、前記決定されたSAOオンオフ情報の確率モデルを利用したエントロピー復号化を行い、前記SAOオンオフ情報を復元する段階を含むことを特徴とする付記1に記載のSAO復号化方法。
(付記7)
前記オフセット絶対値情報を獲得する段階は、
前記オフセット絶対値情報のコンテクストに基づいた確率モデルを決定し、前記決定されたオフセット絶対値情報のコンテクストに基づいた確率モデルなしに、エントロピー復号化を行い、前記オフセット絶対値情報を復元する段階を含み、
前記オフセット符号情報及び前記バンド位置情報を獲得する段階は、
前記オフセット符号情報のコンテクストに基づいた確率モデルなしに、エントロピー復号化を行い、前記オフセット符号情報を復元する段階と、
前記バンド位置情報のコンテクストに基づいた確率モデルなしに、エントロピー復号化を行い、前記バンド位置情報を復元する段階と、を含み、
前記エッジクラス情報を獲得する段階は、
前記エッジクラス情報のコンテクストに基づいた確率モデルなしに、エントロピー復号化を行い、前記エッジクラス情報を復元する段階を含むことを特徴とする付記3に記載のSAO復号化方法。
(付記8)
SAO符号化方法において、
最大符号化単位の左向きSAO併合情報及び上向きSAO併合情報に対して、それぞれのコンテクストに基づいたエントロピー符号化を行って生成された前記左向きSAO併合情報の1ビット、及び前記上向きSAO併合情報の1ビットを出力する段階と、
カラー成分別に、SAOオンオフ情報に対して、コンテクストに基づいたエントロピー符号化を行って生成されたSAOオンオフ情報の1ビットを出力する段階と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、カラー成分別に、SAOカテゴリー別オフセット絶対値情報に対して、バイパスモードでエントロピー符号化を行って生成されたオフセット絶対値情報のビット列を出力する段階と、
カラー成分別に、バンド位置情報及びエッジクラス情報のうち一つに対して、バイパスモードでエントロピー符号化を行って生成された残りのビット列を出力する段階と、を含むことを特徴とするSAO符号化方法。
(付記9)
前記SAOオンオフ情報の1ビットを出力する段階は、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、カラー成分別に、エッジバンド区別情報に対して、バイパスモードでエントロピー符号化を行って生成されたエッジバンド区別情報の1ビットをさらに出力する段階を含み、
前記最大符号化単位のSAOタイプ情報のうち最初のビンである前記SAOオンオフ情報に対して、コンテクストに基づいてエントロピー符号化を行い、前記SAOタイプ情報のうち、前記SAOオンオフ情報を除いた残りのビットに対して、バイパスモードでエントロピー符号化を行うことを特徴とする付記8に記載のSAO符号化方法。
(付記10)
前記残りのビット列を出力する段階は、
前記エッジバンド区別情報がバンドタイプを示すものであるならば、カラー成分別に、前記バンド位置情報に対して、バイパッドモードでエントロピー符号化を行って生成された前記バンド位置情報のビット列を出力する段階を含み、
前記バンド位置情報のビット列を出力する段階は、前記SAOカテゴリー別オフセット絶対値情報が0でなければ、オフセット符号情報に対して、バイパッドモードでエントロピー符号化を行って生成された前記オフセット符号情報のビット列と、前記生成されたバンド位置情報のビット列とを出力する段階を含み、
前記バンド位置情報は、前記最大符号化単位のSAOパラメータのうち最後に出力されることを特徴とする付記9に記載のSAO符号化方法。
(付記11)
前記残りのビット列を獲得する段階は、
前記エッジバンド区別情報がエッジタイプを示すものであるならば、カラー成分別に、前記エッジクラス情報に対して、バイパスモードでエントロピー符号化を行って生成された前記エッジクラス情報のビット列を出力する段階を含み、
前記エッジクラス情報は、ルマ成分のためのエッジクラス情報、及び第1クロマ成分のためのエッジクラス情報を含み、前記第1クロマ成分のためのエッジクラス情報は、第2クロマ成分に同一に適用されることを特徴とする付記9に記載のSAO符号化方法。
(付記12)
第1クロマ成分のための前記SAOオンオフ情報、及び前記エッジバンド区別情報は、第2クロマ成分に同一に適用され、
前記左向きSAO併合情報及び上向きSAO併合情報は、前記最大符号化単位のルマ成分、並びに第1クロマ成分及び第2クロマ成分に対して同一に適用されることを特徴とする付記9に記載のSAO符号化方法。
(付記13)
SAO復号化装置において、
最大符号化単位のビットストリームから、コンテクストに基づいてエントロピー符号化された左向きSAO併合情報及び上向きSAO併合情報を獲得し、カラー成分別に、コンテクストに基づいてエントロピー符号化されたSAOオンオフ情報を獲得するSAOコンテクスト復号化部と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたSAOカテゴリー別オフセット絶対値情報を獲得し、カラー成分別に、バイパスモードでエントロピー符号化されたバンド位置情報及びエッジクラス情報のうち一つを獲得するSAOバイパス復号化部と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記獲得された情報を利用して、前記最大符号化単位の復元値を、前記SAOカテゴリー別に、オフセット絶対値情報に基づいて、調整するSAO調整部と、を含むことを特徴とするSAO復号化装置。
(付記14)
SAO符号化装置において、
最大符号化単位に対してSAO動作を遂行するSAO遂行部と、
前記最大符号化単位の左向きSAO併合情報及び上向きSAO併合情報に対して、それぞれのコンテクストに基づいたエントロピー符号化を行い、前記左向きSAO併合情報のビット列、及び上向きSAO併合情報のビット列を生成し、カラー成分別に、SAOオンオフ情報に対して、コンテクストに基づいたエントロピー符号化を行い、前記SAOオンオフ情報の1ビットを生成して出力するSAOコンテクスト符号化部と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、カラー成分別に、SAOカテゴリー別オフセット絶対値情報に対して、バイパスモードでエントロピー符号化を行い、前記オフセット絶対値情報のビット列を生成し、カラー成分別に、バンド位置情報及びエッジクラス情報のうち一つに対して、バイパスモードでエントロピー符号化を行い、残りのビット列を生成して出力するSAOバイパス符号化部と、を含むことを特徴とするSAO符号化装置。
(付記15)
付記1に記載の方法を具現するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体。
SAO(sample adaptive offset)復号化方法において、
最大符号化単位のビットストリームから、コンテクストに基づいてエントロピー符号化された左向きSAO併合情報及び上向きSAO併合情報を獲得する段階と、
前記ビットストリームから、カラー成分別に、コンテクストに基づいてエントロピー符号化されたSAOオンオフ情報を獲得する段階と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたSAOカテゴリー別オフセット絶対値情報を獲得する段階と、
前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたバンド位置情報及びエッジクラス情報のうち一つを獲得する段階と、を含むことを特徴とするSAO復号化方法。
(付記2)
前記SAOオンオフ情報を獲得する段階は、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたエッジバンド区別情報をさらに獲得する段階を含み、
前記最大符号化単位のSAOタイプ情報のうち最初のビンである前記SAOオンオフ情報に対して、コンテクストに基づいてエントロピー復号化を行い、前記SAOタイプ情報のうち、前記SAOオンオフ情報を除いた残りのビットに対して、バイパスモードでエントロピー復号化を行うことを特徴とする付記1に記載のSAO復号化方法。
(付記3)
前記バンド位置情報またはエッジクラス情報を獲得する段階は、
前記獲得されたエッジバンド区別情報がバンドタイプを示すものであるならば、前記ビットストリームから、カラー成分別に、前記バイパッドモードでエントロピー符号化されたバンド位置情報を獲得する段階を含み、
前記バンド位置情報を獲得する段階は、前記SAOカテゴリー別に獲得されたオフセット絶対値情報が0でなければ、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたオフセット符号情報及び前記バンド位置情報を獲得する段階を含み、
前記バンド位置情報は、前記最大符号化単位のSAOパラメータのうち最後に獲得されることを特徴とする付記2に記載のSAO復号化方法。
(付記4)
前記バンド位置情報またはエッジクラス情報を獲得する段階は、
前記獲得されたエッジバンド区別情報がエッジタイプを示すものであるならば、前記ビットストリームから、カラー成分別に、前記バイパスモードでエントロピー符号化されたエッジクラス情報を獲得する段階を含み、
前記エッジクラス情報は、ルマ成分のためのエッジクラス情報、及び第1クロマ成分のためのエッジクラス情報を含み、前記第1クロマ成分のためのエッジクラス情報は、第2クロマ成分に同一に適用されることを特徴とする付記2に記載のSAO復号化方法。
(付記5)
第1クロマ成分のための前記SAOオンオフ情報、及び前記エッジバンド区別情報は、第2クロマ成分に同一に適用され、
前記左向きSAO併合情報及び上向きSAO併合情報は、前記最大符号化単位のルマ成分、並びに第1クロマ成分及び第2クロマ成分に対して同一に適用されることを特徴とする付記2に記載のSAO復号化方法。
(付記6)
前記左向きSAO併合情報及び上向きSAO併合情報を獲得する段階は、
前記左向きSAO併合情報のコンテクストに基づいた確率モデルを決定し、前記決定された左向きSAO併合情報の確率モデルを利用したエントロピー復号化を行い、前記左向きSAO併合情報を復元する段階と、
前記上向きSAO併合情報のコンテクストに基づいた確率モデルを決定し、前記決定された上向きSAO併合情報の確率モデルを利用したエントロピー復号化を行い、前記上向きSAO併合情報を復元する段階と、を含み、
前記SAOオンオフ情報を獲得する段階は、前記SAOオンオフ情報のコンテクストに基づいた確率モデルを決定し、前記決定されたSAOオンオフ情報の確率モデルを利用したエントロピー復号化を行い、前記SAOオンオフ情報を復元する段階を含むことを特徴とする付記1に記載のSAO復号化方法。
(付記7)
前記オフセット絶対値情報を獲得する段階は、
前記オフセット絶対値情報のコンテクストに基づいた確率モデルを決定し、前記決定されたオフセット絶対値情報のコンテクストに基づいた確率モデルなしに、エントロピー復号化を行い、前記オフセット絶対値情報を復元する段階を含み、
前記オフセット符号情報及び前記バンド位置情報を獲得する段階は、
前記オフセット符号情報のコンテクストに基づいた確率モデルなしに、エントロピー復号化を行い、前記オフセット符号情報を復元する段階と、
前記バンド位置情報のコンテクストに基づいた確率モデルなしに、エントロピー復号化を行い、前記バンド位置情報を復元する段階と、を含み、
前記エッジクラス情報を獲得する段階は、
前記エッジクラス情報のコンテクストに基づいた確率モデルなしに、エントロピー復号化を行い、前記エッジクラス情報を復元する段階を含むことを特徴とする付記3に記載のSAO復号化方法。
(付記8)
SAO符号化方法において、
最大符号化単位の左向きSAO併合情報及び上向きSAO併合情報に対して、それぞれのコンテクストに基づいたエントロピー符号化を行って生成された前記左向きSAO併合情報の1ビット、及び前記上向きSAO併合情報の1ビットを出力する段階と、
カラー成分別に、SAOオンオフ情報に対して、コンテクストに基づいたエントロピー符号化を行って生成されたSAOオンオフ情報の1ビットを出力する段階と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、カラー成分別に、SAOカテゴリー別オフセット絶対値情報に対して、バイパスモードでエントロピー符号化を行って生成されたオフセット絶対値情報のビット列を出力する段階と、
カラー成分別に、バンド位置情報及びエッジクラス情報のうち一つに対して、バイパスモードでエントロピー符号化を行って生成された残りのビット列を出力する段階と、を含むことを特徴とするSAO符号化方法。
(付記9)
前記SAOオンオフ情報の1ビットを出力する段階は、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、カラー成分別に、エッジバンド区別情報に対して、バイパスモードでエントロピー符号化を行って生成されたエッジバンド区別情報の1ビットをさらに出力する段階を含み、
前記最大符号化単位のSAOタイプ情報のうち最初のビンである前記SAOオンオフ情報に対して、コンテクストに基づいてエントロピー符号化を行い、前記SAOタイプ情報のうち、前記SAOオンオフ情報を除いた残りのビットに対して、バイパスモードでエントロピー符号化を行うことを特徴とする付記8に記載のSAO符号化方法。
(付記10)
前記残りのビット列を出力する段階は、
前記エッジバンド区別情報がバンドタイプを示すものであるならば、カラー成分別に、前記バンド位置情報に対して、バイパッドモードでエントロピー符号化を行って生成された前記バンド位置情報のビット列を出力する段階を含み、
前記バンド位置情報のビット列を出力する段階は、前記SAOカテゴリー別オフセット絶対値情報が0でなければ、オフセット符号情報に対して、バイパッドモードでエントロピー符号化を行って生成された前記オフセット符号情報のビット列と、前記生成されたバンド位置情報のビット列とを出力する段階を含み、
前記バンド位置情報は、前記最大符号化単位のSAOパラメータのうち最後に出力されることを特徴とする付記9に記載のSAO符号化方法。
(付記11)
前記残りのビット列を獲得する段階は、
前記エッジバンド区別情報がエッジタイプを示すものであるならば、カラー成分別に、前記エッジクラス情報に対して、バイパスモードでエントロピー符号化を行って生成された前記エッジクラス情報のビット列を出力する段階を含み、
前記エッジクラス情報は、ルマ成分のためのエッジクラス情報、及び第1クロマ成分のためのエッジクラス情報を含み、前記第1クロマ成分のためのエッジクラス情報は、第2クロマ成分に同一に適用されることを特徴とする付記9に記載のSAO符号化方法。
(付記12)
第1クロマ成分のための前記SAOオンオフ情報、及び前記エッジバンド区別情報は、第2クロマ成分に同一に適用され、
前記左向きSAO併合情報及び上向きSAO併合情報は、前記最大符号化単位のルマ成分、並びに第1クロマ成分及び第2クロマ成分に対して同一に適用されることを特徴とする付記9に記載のSAO符号化方法。
(付記13)
SAO復号化装置において、
最大符号化単位のビットストリームから、コンテクストに基づいてエントロピー符号化された左向きSAO併合情報及び上向きSAO併合情報を獲得し、カラー成分別に、コンテクストに基づいてエントロピー符号化されたSAOオンオフ情報を獲得するSAOコンテクスト復号化部と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたSAOカテゴリー別オフセット絶対値情報を獲得し、カラー成分別に、バイパスモードでエントロピー符号化されたバンド位置情報及びエッジクラス情報のうち一つを獲得するSAOバイパス復号化部と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記獲得された情報を利用して、前記最大符号化単位の復元値を、前記SAOカテゴリー別に、オフセット絶対値情報に基づいて、調整するSAO調整部と、を含むことを特徴とするSAO復号化装置。
(付記14)
SAO符号化装置において、
最大符号化単位に対してSAO動作を遂行するSAO遂行部と、
前記最大符号化単位の左向きSAO併合情報及び上向きSAO併合情報に対して、それぞれのコンテクストに基づいたエントロピー符号化を行い、前記左向きSAO併合情報のビット列、及び上向きSAO併合情報のビット列を生成し、カラー成分別に、SAOオンオフ情報に対して、コンテクストに基づいたエントロピー符号化を行い、前記SAOオンオフ情報の1ビットを生成して出力するSAOコンテクスト符号化部と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、カラー成分別に、SAOカテゴリー別オフセット絶対値情報に対して、バイパスモードでエントロピー符号化を行い、前記オフセット絶対値情報のビット列を生成し、カラー成分別に、バンド位置情報及びエッジクラス情報のうち一つに対して、バイパスモードでエントロピー符号化を行い、残りのビット列を生成して出力するSAOバイパス符号化部と、を含むことを特徴とするSAO符号化装置。
(付記15)
付記1に記載の方法を具現するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体。
引用文献1.Jun Xu,et al.,AHG6: on SAO signalling,Joint Collaborative Team on Video Coding(JCT-VC)of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 10th Meeting: Stockholm, SE, 11-20 July 2012,2012年 7月14日,JCTVC-J0268_r2.doc
Toru Matsunobu,et al.,AHG5/AHG6: Bypass coding for SAO syntax elements,Joint Collaborative Team on Video Coding(JCT-VC)of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 10th Meeting: Stockholm,Sweden,11-20 July 2012,2012年 7月11日,JCTVC-J0148r1.doc
Guillaume LAROCHE,et al.,Non-CE1: On SAO parameters reduction for Chroma,Joint Collaborative Team on Video Coding(JCT-VC)of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 9th Meeting: Geneva,CH,27 April - 7 May 2012,2012年 4月26日,JCTVC-I0183.docx
Koohyar Minoo, et al.,Coding of SAO merge left and merge up flags,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 10th Meeting: Stockholm,SE,11-20 July 2012,2012年 7月12日,JCTVC-J0355-r2.doc
Claims (4)
- SAO(sample adaptive offset)復号化方法において、
最大符号化単位のビットストリームから、コンテクストに基づいてエントロピー符号化された左向きSAO併合情報及び上向きSAO併合情報を獲得する段階と、
前記ビットストリームから、カラー成分別に、コンテクストに基づいてエントロピー符号化されたSAOオンオフ情報を獲得する段階と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたエッジバンド区別情報を獲得して、カラー成分別にバイパスモードでエントロピー符号化されたSAOカテゴリー別オフセット絶対値情報を獲得する段階と、
前記エッジバンド区別情報がバンドタイプを示せば、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたバンド位置情報を獲得する段階と、
前記エッジバンド区別情報がエッジタイプを示せば、前記ビットストリームからルマ成分のためのエッジクラス情報及びクロマ成分のためのエッジクラス情報のうち一つを獲得する段階と、を含み、
前記獲得されたバンド位置情報は、前記ルマ成分のためのバンド位置情報、Cb成分のためのバンド位置成分及びCr成分のためのバンド位置情報のうち、1つであり、前記Cb成分のためのバンド位置成分及び前記Cr成分のためのバンド位置情報は、別途に獲得され、
前記Cr成分及び前記Cb成分のうち、1つのために前記クロマ成分のためのエッジクラス情報が獲得された場合、前記Cr成分及び前記Cb成分のうち、残りのために前記獲得されたクロマ成分のためのエッジクラス情報が用いられ、
前記左向きSAO併合情報は、前記ルマ成分、前記Cr成分、及び前記Cb成分に対して共通値として適用されることを特徴とするSAO復号化方法。 - SAO符号化方法において、
最大符号化単位の左向きSAO併合情報及び上向きSAO併合情報に対して、それぞれのコンテクストに基づいたエントロピー符号化を行って生成された前記左向きSAO併合情報の1ビット、及び前記上向きSAO併合情報の1ビットを出力する段階と、
カラー成分別に、SAOオンオフ情報に対して、コンテクストに基づいたエントロピー符号化を行って生成されたSAOオンオフ情報の1ビットを出力する段階と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、カラー成分別にエッジバンド区別情報に対してバイパスモードでエントロピー符号化を遂行して生成された前記エッジバンド区別情報のビット列を出力し、カラー成分別に、SAOカテゴリー別オフセット絶対値情報に対して、バイパスモードでエントロピー符号化を行って生成されたオフセット絶対値情報のビット列を出力する段階と、
前記エッジバンド区別情報がバンドタイプを示せば、カラー成分別に、バンド位置情報に対してバイパスモードでエントロピー符号化を遂行して生成された残りのビット列を出力する段階と、
前記エッジバンド区別情報がエッジタイプを示せば、ルマ成分のためのエッジクラス情報及びクロマ成分のためのエッジクラス情報のうち一つに対して、バイパスモードでエントロピー符号化を行って生成された残りのビット列を出力する段階と、を含み、
前記バンド位置情報は、前記ルマ成分のためのバンド位置情報、Cb成分のためのバンド位置成分、及びCr成分のためのバンド位置情報のうち、1つであり、前記Cb成分のためのバンド位置成分及び前記Cr成分のためのバンド位置情報は、別途に符号化され、
前記Cr成分及び前記Cb成分のうち、1つのために前記クロマ成分のためのエッジクラス情報が符号化された場合、前記Cr成分及び前記Cb成分のうち、残りのために獲得されたクロマ成分のためのエッジクラス情報が符号化されず、
前記左向きSAO併合情報は、前記ルマ成分、前記Cr成分、及び前記Cb成分に対して共通値として決定されることを特徴とするSAO符号化方法。 - SAO復号化装置において、
最大符号化単位のビットストリームから、コンテクストに基づいてエントロピー符号化された左向きSAO併合情報及び上向きSAO併合情報を獲得し、カラー成分別に、コンテクストに基づいてエントロピー符号化されたSAOオンオフ情報を獲得するSAOコンテクスト復号化部と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記ビットストリームから、カラー成分別に、バイパスモードでエントロピー符号化されたエッジバンド区別情報を獲得し、カラー成分別にバイパスモードでエントロピー符号化されたSAOカテゴリー別オフセット絶対値情報を獲得し、前記エッジバンド区別情報がバンドタイプを示せば、カラー成分別に、バイパスモードでエントロピー符号化されたバンド位置情報を獲得し、前記エッジバンド区別情報がエッジタイプを示せば、前記ビットストリームからルマ成分のためのエッジクラス情報及びクロマ成分のためのエッジクラス情報のうち一つを獲得するSAOバイパス復号化部と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、前記獲得された情報を利用して、前記最大符号化単位の復元値を、前記SAOカテゴリー別に、オフセット絶対値情報に基づいて、調整するSAO調整部と、を含み、
前記獲得されたバンド位置情報は、前記ルマ成分のためのバンド位置情報、Cb成分のためのバンド位置成分、及びCr成分のためのバンド位置情報のうち、1つであり、前記Cb成分のためのバンド位置成分及び前記Cr成分のためのバンド位置情報は、別途に獲得され、
前記Cr成分及び前記Cb成分のうち、1つのために前記クロマ成分のためのエッジクラス情報が獲得された場合、前記Cr成分及び前記Cb成分のうち、残りのために前記獲得されたクロマ成分のためのエッジクラス情報が用いられ、
前記左向きSAO併合情報は、前記ルマ成分、前記Cr成分、及び前記Cb成分に対して共通値として適用されることを特徴とするSAO復号化装置。 - SAO符号化装置において、
最大符号化単位に対してSAO動作を遂行するSAO遂行部と、
前記最大符号化単位の左向きSAO併合情報及び上向きSAO併合情報に対して、それぞれのコンテクストに基づいたエントロピー符号化を行い、前記左向きSAO併合情報のビット列、及び上向きSAO併合情報のビット列を生成し、カラー成分別に、SAOオンオフ情報に対して、コンテクストに基づいたエントロピー符号化を行い、前記SAOオンオフ情報の1ビットを生成して出力するSAOコンテクスト符号化部と、
前記SAOオンオフ情報が、SAO動作が遂行されるということを示せば、カラー成分別にエッジバンド区別情報に対してバイパスモードでエントロピー符号化を遂行して生成された前記エッジバンド区別情報のビット列を出力し、カラー成分別に、SAOカテゴリー別オフセット絶対値情報に対して、バイパスモードでエントロピー符号化を行い、前記オフセット絶対値情報のビット列を生成し、前記エッジバンド区別情報がバンドタイプを示せば、カラー成分別に、バンド位置情報に対してバイパスモードでエントロピー符号化を遂行して生成された残りのビット列を出力し、前記エッジバンド区別情報がエッジタイプを示せば、ルマ成分のためのエッジクラス情報及びクロマ成分のためのエッジクラス情報及びクロマ成分のためのエッジクラス情報のうち1つに対して、バイパスモードでエントロピー符号化を行い、残りのビット列を生成して出力するSAOバイパス符号化部と、を含み、
前記バンド位置情報は、前記ルマ成分のためのバンド位置情報、Cb成分のためのバンド位置成分及びCr成分のためのバンド位置情報のうち、1つであり、前記Cb成分のためのバンド位置成分及び前記Cr成分のためのバンド位置情報は、別途に決定され、
前記Cr成分及び前記Cb成分のうち、1つのために前記クロマ成分のためのエッジクラス情報が符号化された場合、前記Cr成分及び前記Cb成分のうち、残りのために獲得されたクロマ成分のためのエッジクラス情報が符号化されず、
前記左向きSAO併合情報は、前記ルマ成分、前記Cr成分、及び前記Cb成分に対して共通値として決定されることを特徴とするSAO符号化装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261672166P | 2012-07-16 | 2012-07-16 | |
US61/672,166 | 2012-07-16 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015523005A Division JP6382807B2 (ja) | 2012-07-16 | 2013-07-16 | Sao符号化又は復号化のための方法及び装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018152883A true JP2018152883A (ja) | 2018-09-27 |
Family
ID=49949026
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015523005A Active JP6382807B2 (ja) | 2012-07-16 | 2013-07-16 | Sao符号化又は復号化のための方法及び装置 |
JP2018090790A Pending JP2018152883A (ja) | 2012-07-16 | 2018-05-09 | Sao復号化方法及び装置並びにsao符号化方法及び装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015523005A Active JP6382807B2 (ja) | 2012-07-16 | 2013-07-16 | Sao符号化又は復号化のための方法及び装置 |
Country Status (16)
Country | Link |
---|---|
US (5) | US9787992B2 (ja) |
EP (1) | EP2874391A4 (ja) |
JP (2) | JP6382807B2 (ja) |
KR (1) | KR102165855B1 (ja) |
CN (6) | CN108055544B (ja) |
AU (3) | AU2013290950B2 (ja) |
BR (2) | BR122019027914B1 (ja) |
CA (2) | CA3029323C (ja) |
MX (2) | MX346795B (ja) |
MY (3) | MY201685A (ja) |
PH (5) | PH12015500121A1 (ja) |
RU (3) | RU2675154C1 (ja) |
SG (2) | SG10201703660TA (ja) |
TW (3) | TWI625962B (ja) |
WO (1) | WO2014014251A1 (ja) |
ZA (1) | ZA201501039B (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201119206D0 (en) * | 2011-11-07 | 2011-12-21 | Canon Kk | Method and device for providing compensation offsets for a set of reconstructed samples of an image |
US9253482B2 (en) * | 2011-11-08 | 2016-02-02 | Texas Insturments Incorporated | Method and apparatus for sample adaptive offset without sign coding |
EP2858354B1 (en) | 2012-05-25 | 2022-12-21 | Sun Patent Trust | Video image coding method, video image decoding method, video image coding device, video image decoding device, and video image coding-decoding device |
WO2013175736A1 (ja) | 2012-05-25 | 2013-11-28 | パナソニック株式会社 | 動画像符号化方法、動画像符号化装置、動画像復号方法、動画像復号装置、および、動画像符号化復号装置 |
EP2858357B1 (en) | 2012-06-04 | 2022-07-06 | Sun Patent Trust | Video image encoding method, video image decoding method |
AU2013272989B2 (en) | 2012-06-08 | 2017-05-25 | Sun Patent Trust | Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus |
CN108235014B (zh) * | 2012-06-27 | 2020-08-14 | 太阳专利托管公司 | 图像编码方法和图像编码装置 |
US9510002B2 (en) | 2013-09-09 | 2016-11-29 | Apple Inc. | Chroma quantization in video coding |
CN104980747B (zh) * | 2014-04-04 | 2019-08-09 | 北京三星通信技术研究有限公司 | 对像素标识进行处理的方法和装置 |
WO2016056977A1 (en) | 2014-10-06 | 2016-04-14 | Telefonaktiebolaget L M Ericsson (Publ) | Coding and deriving quantization parameters |
US10057574B2 (en) | 2015-02-11 | 2018-08-21 | Qualcomm Incorporated | Coding tree unit (CTU) level adaptive loop filter (ALF) |
CN106254888B (zh) | 2015-06-09 | 2020-06-02 | 同济大学 | 一种图像编码及解码方法、图像处理设备 |
US20170155905A1 (en) * | 2015-11-30 | 2017-06-01 | Intel Corporation | Efficient intra video/image coding using wavelets and variable size transform coding |
US10602187B2 (en) | 2015-11-30 | 2020-03-24 | Intel Corporation | Efficient, compatible, and scalable intra video/image coding using wavelets and HEVC coding |
CN109997365A (zh) * | 2016-11-29 | 2019-07-09 | 夏普株式会社 | 用信号通知评级信息 |
JP6904156B2 (ja) | 2017-08-10 | 2021-07-14 | 富士通株式会社 | 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム |
CN107707915B (zh) * | 2017-09-30 | 2019-11-12 | 上海兆芯集成电路有限公司 | 采样点自适应偏移滤波的控制方法及其影像处理系统 |
WO2019075638A1 (zh) * | 2017-10-17 | 2019-04-25 | 北京金山云网络技术有限公司 | 编码和解码方法、装置、编码器、解码器及存储介质 |
CN108235021B (zh) * | 2018-01-10 | 2020-06-19 | 北京奇艺世纪科技有限公司 | 一种band模式确定方法及装置 |
GB2574425A (en) * | 2018-06-05 | 2019-12-11 | Canon Kk | Video coding and decoding |
CN112889278B (zh) * | 2018-09-17 | 2024-04-05 | 三星电子株式会社 | 用于编码和解码运动信息的方法及用于编码和解码运动信息的装置 |
SG11202107547YA (en) | 2019-01-11 | 2021-08-30 | Huawei Tech Co Ltd | Encoder, decoder and corresponding methods using dct2 enabled high level flag |
US11949870B2 (en) * | 2019-06-21 | 2024-04-02 | Qualcomm Incorporated | Context modeling for low-frequency non-separable transformation signaling for video coding |
CN112135149B (zh) * | 2019-06-24 | 2023-07-18 | 华为技术有限公司 | 语法元素的熵编码/解码方法、装置以及编解码器 |
US20220107738A1 (en) * | 2020-10-06 | 2022-04-07 | Kioxia Corporation | Read controller and input/output controller |
CN114363613B (zh) * | 2022-01-10 | 2023-11-28 | 北京达佳互联信息技术有限公司 | 滤波方法和滤波装置 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100468844B1 (ko) * | 2002-01-07 | 2005-01-29 | 삼성전자주식회사 | 정지영상 및 동영상을 부호화/복호화하기 위한변환계수들의 최적주사방법 |
KR100703776B1 (ko) * | 2005-04-19 | 2007-04-06 | 삼성전자주식회사 | 향상된 코딩 효율을 갖는 컨텍스트 기반 적응적 산술 코딩및 디코딩 방법과 이를 위한 장치, 이를 포함하는 비디오코딩 및 디코딩 방법과 이를 위한 장치 |
WO2007116551A1 (ja) * | 2006-03-30 | 2007-10-18 | Kabushiki Kaisha Toshiba | 画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法 |
KR101356733B1 (ko) | 2007-03-07 | 2014-02-05 | 삼성전자주식회사 | 컨텍스트 기반 적응적 이진 산술 부호화, 복호화 방법 및장치 |
WO2009089032A2 (en) * | 2008-01-10 | 2009-07-16 | Thomson Licensing | Methods and apparatus for illumination compensation of intra-predicted video |
US8031959B2 (en) * | 2008-02-22 | 2011-10-04 | Himax Technologies Limited | Compression system for a bit-plane |
TWI365423B (en) * | 2008-03-17 | 2012-06-01 | Chunghwa Picture Tubes Ltd | Compression method and decompression method for image data |
KR101314230B1 (ko) * | 2008-07-18 | 2013-10-04 | 삼성전자주식회사 | 화상처리장치 및 그 화상처리방법 |
US9078007B2 (en) * | 2008-10-03 | 2015-07-07 | Qualcomm Incorporated | Digital video coding with interpolation filters and offsets |
US8873626B2 (en) * | 2009-07-02 | 2014-10-28 | Qualcomm Incorporated | Template matching for video coding |
JP5133950B2 (ja) | 2009-07-16 | 2013-01-30 | 日本電信電話株式会社 | コンテクスト適応エントロピ符号化方法および装置,コンテクスト適応エントロピ復号方法および装置,並びにそれらのプログラム |
US9078009B2 (en) * | 2010-02-19 | 2015-07-07 | Skype | Data compression for video utilizing non-translational motion information |
US9094658B2 (en) * | 2010-05-10 | 2015-07-28 | Mediatek Inc. | Method and apparatus of adaptive loop filtering |
US8660174B2 (en) * | 2010-06-15 | 2014-02-25 | Mediatek Inc. | Apparatus and method of adaptive offset for video coding |
US8861617B2 (en) * | 2010-10-05 | 2014-10-14 | Mediatek Inc | Method and apparatus of region-based adaptive loop filtering |
US9813738B2 (en) * | 2010-10-05 | 2017-11-07 | Hfi Innovation Inc. | Method and apparatus of adaptive loop filtering |
US9055305B2 (en) | 2011-01-09 | 2015-06-09 | Mediatek Inc. | Apparatus and method of sample adaptive offset for video coding |
CN103392338A (zh) | 2011-01-03 | 2013-11-13 | 联发科技股份有限公司 | 基于滤波单元的回路滤波方法 |
US9161041B2 (en) * | 2011-01-09 | 2015-10-13 | Mediatek Inc. | Apparatus and method of efficient sample adaptive offset |
CN106454357A (zh) * | 2011-01-09 | 2017-02-22 | 寰发股份有限公司 | 已处理视频数据的样本自适应补偿的方法和装置 |
CN103597827B (zh) * | 2011-06-10 | 2018-08-07 | 寰发股份有限公司 | 可伸缩视频编码方法及其装置 |
US10070152B2 (en) * | 2011-08-24 | 2018-09-04 | Texas Instruments Incorporated | Sample adaptive offset (SAO) parameter signaling |
US9031137B2 (en) * | 2012-05-03 | 2015-05-12 | Texas Instruments Incorporated | Signaling signed band offset values for sample adaptive offset (SAO) filtering in video coding |
AU2013272989B2 (en) * | 2012-06-08 | 2017-05-25 | Sun Patent Trust | Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus |
US10623759B2 (en) * | 2012-06-13 | 2020-04-14 | Sony Corporation | Decoupling enhancements in sample adaptive offset (SAO) for high efficiency video encoder (HEVC) |
KR102166335B1 (ko) * | 2013-04-19 | 2020-10-15 | 삼성전자주식회사 | Sao 파라미터를 시그널링하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치 |
-
2013
- 2013-07-16 TW TW105139995A patent/TWI625962B/zh active
- 2013-07-16 EP EP13819872.6A patent/EP2874391A4/en not_active Withdrawn
- 2013-07-16 WO PCT/KR2013/006343 patent/WO2014014251A1/ko active Application Filing
- 2013-07-16 JP JP2015523005A patent/JP6382807B2/ja active Active
- 2013-07-16 SG SG10201703660TA patent/SG10201703660TA/en unknown
- 2013-07-16 TW TW102125440A patent/TWI568248B/zh active
- 2013-07-16 CN CN201810149566.9A patent/CN108055544B/zh active Active
- 2013-07-16 MX MX2015000763A patent/MX346795B/es active IP Right Grant
- 2013-07-16 CN CN201810149017.1A patent/CN108235036B/zh active Active
- 2013-07-16 CN CN201810149791.2A patent/CN108055545B/zh active Active
- 2013-07-16 MY MYPI2019000576A patent/MY201685A/en unknown
- 2013-07-16 CN CN201810152190.7A patent/CN108055546B/zh active Active
- 2013-07-16 CN CN201380048157.5A patent/CN104641640B/zh active Active
- 2013-07-16 AU AU2013290950A patent/AU2013290950B2/en active Active
- 2013-07-16 BR BR122019027914-4A patent/BR122019027914B1/pt active IP Right Grant
- 2013-07-16 CA CA3029323A patent/CA3029323C/en active Active
- 2013-07-16 SG SG11201500363QA patent/SG11201500363QA/en unknown
- 2013-07-16 BR BR112015001111-0A patent/BR112015001111B1/pt active IP Right Grant
- 2013-07-16 RU RU2018102204A patent/RU2675154C1/ru active
- 2013-07-16 TW TW107113797A patent/TWI656786B/zh active
- 2013-07-16 MY MYPI2018702941A patent/MY184416A/en unknown
- 2013-07-16 CA CA2879440A patent/CA2879440C/en active Active
- 2013-07-16 CN CN201810149642.6A patent/CN108235030B/zh active Active
- 2013-07-16 MX MX2017004114A patent/MX368355B/es unknown
- 2013-07-16 KR KR1020130083586A patent/KR102165855B1/ko active IP Right Grant
- 2013-07-16 MY MYPI2015000109A patent/MY171481A/en unknown
- 2013-07-16 RU RU2015104987A patent/RU2643658C2/ru active
- 2013-07-16 US US14/415,454 patent/US9787992B2/en active Active
-
2015
- 2015-01-20 PH PH12015500121A patent/PH12015500121A1/en unknown
- 2015-02-13 ZA ZA2015/01039A patent/ZA201501039B/en unknown
-
2017
- 2017-01-10 AU AU2017200150A patent/AU2017200150B2/en active Active
- 2017-09-11 US US15/700,979 patent/US10362313B2/en active Active
- 2017-10-06 US US15/727,050 patent/US10021399B2/en active Active
- 2017-10-06 US US15/727,003 patent/US10277903B2/en active Active
- 2017-10-06 US US15/727,074 patent/US10356421B2/en active Active
- 2017-12-11 PH PH12017502273A patent/PH12017502273A1/en unknown
- 2017-12-11 PH PH12017502271A patent/PH12017502271A1/en unknown
- 2017-12-11 PH PH12017502268A patent/PH12017502268A1/en unknown
- 2017-12-11 PH PH12017502274A patent/PH12017502274A1/en unknown
-
2018
- 2018-02-23 AU AU2018201330A patent/AU2018201330B2/en active Active
- 2018-05-09 JP JP2018090790A patent/JP2018152883A/ja active Pending
- 2018-12-10 RU RU2018143583A patent/RU2701080C1/ru active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6034534B1 (ja) | ビデオ復号化方法及びその装置 | |
JP6382807B2 (ja) | Sao符号化又は復号化のための方法及び装置 | |
KR101971226B1 (ko) | 최대 부호화 단위 별로 픽셀 분류에 따른 오프셋 조정을 이용하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치 | |
KR20170078671A (ko) | 다중 오프셋 방식을 적용하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180509 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190516 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190528 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20191217 |