JP2019057954A - ビデオのイントラ予測方法及びその装置 - Google Patents

ビデオのイントラ予測方法及びその装置 Download PDF

Info

Publication number
JP2019057954A
JP2019057954A JP2019007273A JP2019007273A JP2019057954A JP 2019057954 A JP2019057954 A JP 2019057954A JP 2019007273 A JP2019007273 A JP 2019007273A JP 2019007273 A JP2019007273 A JP 2019007273A JP 2019057954 A JP2019057954 A JP 2019057954A
Authority
JP
Japan
Prior art keywords
unit
pixel
peripheral
coding
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019007273A
Other languages
English (en)
Other versions
JP7103961B2 (ja
Inventor
リ,タミー
Lee Tammy
チェン,ジアンル
Jianle Chen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2019057954A publication Critical patent/JP2019057954A/ja
Application granted granted Critical
Publication of JP7103961B2 publication Critical patent/JP7103961B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel

Abstract

【課題】 イントラ予測に利用される周辺ピクセルが制限される制限イントラ予測モードで利用不可能な周辺ピクセルを代替する方法を提供すること。【解決手段】 ビデオのイントラ予測方法及びその装置に係り、該ビデオのイントラ予測方法は、現在ブロックのイントラ予測に利用される所定個数の周辺ピクセルの利用可能性を判断し、利用不可能な第1周辺ピクセルが存在する場合、第1周辺ピクセルを基準にして、既定方向に所定個数の周辺ピクセルを検索し、利用可能な第2周辺ピクセルを検索し、第1周辺ピクセルのピクセル値を、検索された第2周辺ピクセルのピクセル値に代替し、所定位置の第1周辺ピクセルを除き、他の位置の利用不可能な第3周辺ピクセルについては、所定方向にすぐ隣接した周辺ピクセルを利用した代替過程が遂行される。【選択図】 図26

Description

本発明は、ビデオのイントラ予測に係り、さらに具体的には、周辺ピクセルの利用を制限する制限イントラ予測モードで利用不可能な周辺ピクセルを代替し、参照ピクセルとして利用するビデオのイントラ予測方法及びその装置に関する。
MPEG(moving picture experts group)−1、MPEG−2、MPEG−4、H.264/MPEG−4 AVC(advanced video coding)のような映像圧縮方式では、映像を符号化するために、1枚のピクチャをマクロブロックに分ける。そして、インター予測及びイントラ予測で利用可能な全ての符号化モードで、それぞれのマクロブロックを符号化した後、マクロブロックの符号化に所要するビット率と、原マクロブロックと復号化されたマクロブロックとの歪曲程度とにより、符号化モードを一つ選択してマクロブロックを符号化する。
高解像度または高画質のビデオコンテンツを再生、保存することができるハードウェアの開発及び普及によって、高解像度または高画質のビデオコンテンツを効果的に符号化したり復号化するビデオコーデックスの必要性が増大している。既存のビデオコーデックスによれば、ビデオは、所定サイズのマクロブロックに基づいて制限された予測モードによって符号化されている。
本発明が解決しようとする技術的課題は、イントラ予測に利用される周辺ピクセルが制限される制限イントラ予測モードで利用不可能な周辺ピクセルを代替する方法を提供するためのものである。
ビデオのイントラ予測方法は、現在ブロックのイントラ予測に利用される所定個数の周辺ピクセルの利用可能性を判断し、利用不可能な第1周辺ピクセルが存在する場合、第1周辺ピクセルを基準にして、既定方向に所定個数の周辺ピクセルを検索し、利用可能な第2周辺ピクセルを検索し、第1周辺ピクセルのピクセル値を、検索された第2周辺ピクセルのピクセル値に代替する。所定位置の第1周辺ピクセルを除き、他の位置の利用不可能な第3周辺ピクセルについては、所定方向にすぐ隣接した周辺ピクセルを利用した代替過程が遂行される。
本発明によれば、利用不可能な周辺ピクセルを、既定の検索方向に基づいて利用可能な周辺ピクセルを検索し、代替過程に利用することにより、イントラ予測に利用される参照ピクセルを決定する過程の複雑度を低減させることができる。
本発明の一実施形態によるビデオ符号化装置のブロック図である。 本発明の一実施形態によるビデオ復号化装置のブロック図である。 本発明の一実施形態による符号化単位の概念を図示する図面である。 本発明の一実施形態による、符号化単位に基づく映像符号化部のブロック図である。 本発明の一実施形態による、符号化単位に基づく映像復号化部のブロック図である。 本発明の一実施形態による、深度別符号化単位及びパーティションを図示する図面である。 本発明の一実施形態による、符号化単位及び変換単位の関係を図示する図面である。 図8は本発明の一実施形態による深度別符号化情報を図示する図面である。 本発明の一実施形態による深度別符号化単位を図示する図面である。 本発明の一実施形態による、符号化単位、予測単位及び周波数変換単位の関係を図示する図面である。 本発明の一実施形態による、符号化単位、予測単位及び周波数変換単位の関係を図示する図面である。 本発明の一実施形態による、符号化単位、予測単位及び周波数変換単位の関係を図示する図面である。 表1の符号化モード情報による、符号化単位、予測単位及び変換単位の関係を図示する図面である。 本発明の一実施形態による予測単位の大きさによるイントラ予測モードの個数を図示する図面である。 本発明の一実施形態による、多様な方向性を有するイントラ予測モードについて説明するための参照図である。 本発明の一実施形態によって、(dx,dy)の方向性を有する延長線上に位置した周辺ピクセルと現在ピクセルとの関係について説明するための図面である。 本発明の一実施形態によるイントラ予測モード方向を示した図面である。 本発明の一実施形態によるイントラ予測モード方向を示した図面である。 本発明の一実施形態による、33の方向性を有するイントラ予測モードの方向を示した図面である。 本発明の一実施形態による、周辺ブロックの類型によって、現在ブロックのイントラ予測時、利用不可能な周辺ピクセルを示した図面である。 本発明の一実施形態による、利用不可能な周辺ピクセルを代替する過程について説明するための図面である。 本発明の他の実施形態による、利用不可能な周辺ピクセルを代替する過程について説明するための図面である。 本発明のさらに他の実施形態による、利用不可能な周辺ピクセルを代替する過程について説明するための図面である。 本発明の一実施形態によるイントラ予測装置の構成を示す図面である。 現在ブロック周辺のフィルタリングされる周辺ピクセルを示した図面である。 現在ブロックの周辺ピクセルのフィルタリング過程について説明するための参照図である。 本発明の一実施形態によるビデオのイントラ予測方法を示したフローチャートである。 一実施形態によるプログラムが保存されたディスクの物理的構造を例示する図面である。 ディスクを利用してプログラムを記録して判読するためのディスクドライブを図示する図面である。 コンテンツ流通サービス(content distribution service)を提供するためのコンテンツ供給システム(content supply system)の全体的構造を図示する図面である。 一実施形態による本発明のビデオ符号化方法及びビデオ復号化方法が適用される携帯電話の外部構造図示する図面である。 一実施形態による本発明のビデオ符号化方法及びビデオ復号化方法が適用される携帯電話の内部構造を図示する図面である。 本発明による通信システムが適用されたデジタル放送システムを図示する図面である。 本発明の一実施形態によるビデオ符号化装置及びビデオ復号化装置を利用するクラウドコンピューティングシステムのネットワーク構造を図示する図面である。
本発明の一実施形態によるビデオのイントラ予測方法は、前記ビデオを構成するピクチャを階層的構造に分割したブロックのうち現在ブロックのイントラ予測に利用される所定個数の周辺ピクセルの利用可能性を判断する段階と、前記所定個数の周辺ピクセルのうち利用不可能な第1周辺ピクセルが存在する場合、前記第1周辺ピクセルを基準にして、既定方向に前記所定個数の周辺ピクセルを検索し、利用可能な第2周辺ピクセルを検索する段階と、前記第1周辺ピクセルのピクセル値を、前記検索された第2周辺ピクセルのピクセル値に代替する段階と、前記代替された第1周辺ピクセルを含む前記所定個数の周辺ピクセルを利用して、前記現在ブロックに対するイントラ予測を行う段階と、を含むことを特徴とする。
本発明の一実施形態によるビデオのイントラ予測方法において、所定個数の周辺ピクセルの利用可能性を判断する段階は、インター予測された周辺ブロック、または前記現在ブロックが属したスライスと異なるスライスに属した周辺ブロックに含まれた周辺ピクセルを利用不可能であると判断する。
本発明の一実施形態によるビデオのイントラ予測方法において、第1周辺ピクセルは、前記所定個数の周辺ピクセルのうち既定位置のピクセルであり、前記第2周辺ピクセルを検索する段階は、前記第1周辺ピクセルを基準にして、既定方向に前記所定個数の周辺ピクセルを検索し、最初に検索された利用可能な周辺ピクセルを、前記第2周辺ピクセルとして決定することができる。
本発明の一実施形態によるビデオのイントラ予測方法において、前記第1周辺ピクセルは、前記現在ブロックの左上側コーナーに位置した周辺ピクセルであり、前記第2周辺ピクセルを検索する段階は、前記第1周辺ピクセルを基準にして、左側から右側の方向に、前記現在ブロックの上側及び右上側の周辺ピクセルを検索し、前記現在ブロックの上側及び右上側の周辺ピクセルのうち利用可能な第2周辺ピクセルが存在しない場合、前記第1周辺ピクセルを基準にして、上側から下側の方向に、前記現在ブロックの左側及び左下側の周辺ピクセルを検索し、前記第2周辺ピクセルを検索することができる。
本発明の一実施形態によるビデオのイントラ予測方法において、前記第1周辺ピクセルは、前記現在ブロックの左上側コーナーに位置した周辺ピクセルであり、前記第2周辺ピクセルを検索する段階は、前記第1周辺ピクセルを基準にして、上側から下側の方向に、前記現在ブロックの左側及び左下側の周辺ピクセルを検索し、前記現在ブロックの左側及び左下側の周辺ピクセルのうち利用可能な第2周辺ピクセルが存在しない場合、前記第1周辺ピクセルを基準にして、左側から右側の方向に、前記現在ブロックの上側及び右上側の周辺ピクセルを検索し、前記第2周辺ピクセルを検索することができる。
本発明の一実施形態によるビデオのイントラ予測方法において、前記第1周辺ピクセルは、前記現在ブロックの左上側コーナーに位置した周辺ピクセルであり、前記第2周辺ピクセルを検索する段階は、前記第1周辺ピクセルを基準にして、上側から下側の方向に、前記現在ブロックの左側及び左下側の周辺ピクセルを検索し、利用可能な左側周辺ピクセルを決定し、前記第1周辺ピクセルを基準にして、左側から右側の方向に、前記現在ブロックの上側及び右上側の周辺ピクセルを検索し、利用可能な上側周辺ピクセルを決定し、前記検索された利用可能な左側周辺ピクセル及び上側周辺ピクセルの平均値を利用して、前記第1周辺ピクセルのピクセル値を代替することができる。
本発明の他の実施形態によるビデオのイントラ予測方法において、前記第1周辺ピクセルは、前記現在ブロックの左上側コーナーに位置した周辺ピクセルであり、前記第2周辺ピクセルを検索する段階は、前記第1周辺ピクセルを基準にして、上側から下側の方向に、前記現在ブロックの左側及び左下側の周辺ピクセルを検索し、利用可能な左側周辺ピクセルを決定し、前記第1周辺ピクセルを基準にして、左側から右側の方向に、前記現在ブロックの上側及び右上側の周辺ピクセルを検索し、利用可能な上側周辺ピクセルを決定し、前記検索された左側周辺ピクセル及び上側周辺ピクセルのうち、前記第1周辺ピクセルとの距離がさらに近い周辺ピクセルを、前記第2周辺ピクセルとして決定することができる。
本発明のさらに他の実施形態によるビデオのイントラ予測方法において、前記第1周辺ピクセルは、前記現在ブロックの左側及び左下側に位置した周辺ピクセルのうち最左下側に位置した周辺ピクセルであり、前記第2周辺ピクセルを検索する段階は、前記第1周辺ピクセルを基準にして、下側から上側の方向に、前記現在ブロックの左側及び左下側に位置した周辺ピクセルを検索し、前記現在ブロックの左側及び左下側に位置した周辺ピクセルのうち利用可能な第2周辺ピクセルが存在しない場合、前記現在ブロックの上側及び右上側の周辺ピクセルを左側から右側の方向に検索し、前記第2周辺ピクセルを検索することができる。
本発明の一実施形態によるビデオのイントラ予測方法において、前記第1周辺ピクセルは、前記現在ブロックの上側及び右上側に位置した周辺ピクセルのうち最右上側に位置した周辺ピクセルであり、前記第2周辺ピクセルを検索する段階は、前記第1周辺ピクセルを基準にして、右側から左側の方向に、前記現在ブロックの上側及び右上側に位置した周辺ピクセルを検索し、前記現在ブロックの上側及び右上側に位置した周辺ピクセルのうち利用可能な第2周辺ピクセルが存在しない場合、前記現在ブロックの左側及び左下側の周辺ピクセルを上側から下側の方向に検索し、前記第2周辺ピクセルを検索することができる。
本発明の一実施形態によるビデオのイントラ予測方法において、利用不可能な第3周辺ピクセルが存在する場合、前記既定方向に基づいて、以前に検索された隣接した周辺ピクセルのピクセル値を利用して、前記第3周辺ピクセルのピクセル値を代替する段階をさらに含んでもよい。
本発明の一実施形態によるビデオのイントラ予測方法において、前記第1周辺ピクセルは、前記現在ブロックの左上側コーナーに位置した周辺ピクセルであり、前記利用不可能な第3周辺ピクセルが、前記現在ブロックの上側に位置した場合、前記第3周辺ピクセルの左側に隣接した周辺ピクセルを利用して第3周辺ピクセルを代替し、前記利用不可能な第3周辺ピクセルが、前記現在ブロックの左側に位置した場合、前記第3周辺ピクセルの上側に隣接した周辺ピクセルを利用して、第3周辺ピクセルを代替することができる。
本発明の一実施形態によるビデオのイントラ予測方法において、前記第1周辺ピクセルは、前記現在ブロックの最左下側コーナーに位置した周辺ピクセルであり、前記利用不可能な第3周辺ピクセルが、前記現在ブロックの左側に位置した場合、前記第3周辺ピクセルの下側に隣接した周辺ピクセルを利用して、第3周辺ピクセルを代替し、前記利用不可能な第3周辺ピクセルが、前記現在ブロックの上側に位置した場合、前記第3周辺ピクセルの左側に隣接した周辺ピクセルを利用して、第3周辺ピクセルを代替することができる。
本発明の他の実施形態によるビデオのイントラ予測方法において、前記第1周辺ピクセルは、前記現在ブロックの最右上側コーナーに位置した周辺ピクセルであり、前記利用不可能な第3周辺ピクセルが、前記現在ブロックの上側に位置した場合、前記第3周辺ピクセルの右側に隣接した周辺ピクセルを利用して、第3周辺ピクセルを代替し、前記利用不可能な第3周辺ピクセルが、前記現在ブロックの左側に位置した場合、前記第3周辺ピクセルの上側に隣接した周辺ピクセルを利用して、第3周辺ピクセルを代替することができる。
本発明のさらに他の実施形態によるビデオのイントラ予測方法において、前記検索された第2周辺ピクセルのピクセル値に代替する段階は、前記所定個数の周辺ピクセルのうち、前記利用可能な第2周辺ピクセルが存在しない場合、前記第1周辺ピクセルのピクセル値を所定値に代替することができる。
本発明の一実施形態によるビデオのイントラ予測方法において、所定値は、ピクセルのビット深度に基づいて決定された値でもある。
本発明の一実施形態によるビデオのイントラ予測装置は、前記ビデオを構成するピクチャを階層的構造に分割したブロックのうち現在ブロックのイントラ予測に利用される所定個数の周辺ピクセルの利用可能性を判断する利用可能性判断部と、前記所定個数の周辺ピクセルのうち利用不可能な第1周辺ピクセルが存在する場合、前記第1周辺ピクセルを基準にして、既定方向に、前記所定個数の周辺ピクセルを検索し、利用可能な第2周辺ピクセルを検索し、前記第1周辺ピクセルのピクセル値を、前記検索された第2周辺ピクセルのピクセル値に代替する代替部と、前記代替された第1周辺ピクセルを含む前記所定個数の周辺ピクセルを利用して、前記現在ブロックに対するイントラ予測を行うイントラ予測遂行部と、を含むことを特徴とする。
以下、添付された図面を参照し、本発明の望ましい実施形態について具体的に説明する。
図1は、本発明の一実施形態によるビデオ符号化装置のブロック図を図示している。一実施形態によるビデオ符号化装置100は、最大符号化単位分割部110、符号化単位決定部120及び出力部130を含む。
最大符号化単位分割部110は、映像の現在ピクチャのための最大サイズの符号化単位である最大符号化単位に基づいて、現在ピクチャを区画することができる。現在ピクチャが最大符号化単位より大きければ、現在ピクチャの映像データは、少なくとも1つの最大符号化単位に分割される。一実施形態による最大符号化単位は、サイズ32x32,64x64,128x128,256x256などのデータ単位であり、縦横サイズ8より大きい2の累乗である正方形のデータ単位でもある。映像データは、少なくとも1つの最大符号化単位別に符号化単位決定部120に出力される。
一実施形態による符号化単位は、最大サイズ及び最大深度で特徴づけられる。深度とは、最大符号化単位から、符号化単位が空間的に分割された回数を示し、深度が深くなるほど深度別符号化単位は、最大符号化単位から最小符号化単位まで分割される。最大符号化単位の深度が最上位深度であり、最小符号化単位が最下位符号化単位と定義される。最大符号化単位は、深度が深くなるにつれ、深度別符号化単位の大きさは小さくなるので、上位深度の符号化単位は、複数個の下位深度の符号化単位を含んでもよい。
前述のように、符号化単位の最大サイズによって、現在ピクチャの映像データを最大符号化単位に分割し、それぞれの最大符号化単位は、深度別に分割される符号化単位を含んでもよい。一実施形態による最大符号化単位は、深度別に分割されるので、最大符号化単位に含まれた空間領域(spatial domain)の映像データが深度によって階層的に分類される。
最大符号化単位の高さ及び幅を階層的に分割することができる総回数を制限する最大深度及び符号化単位の最大サイズがあらかじめ設定されている。
符号化単位決定部120は、深度ごとに最大符号化単位の領域が分割された少なくとも1つの分割領域を符号化して、少なくとも1つの分割領域別に最終符号化結果が出力される深度を決定する。すなわち、符号化単位決定部120は、現在ピクチャの最大符号化単位ごとに、深度別符号化単位で、映像データを符号化し、最小の符号化誤差が生じる深度を選択し、符号化深度として決定する。決定された符号化深度及び最大符号化単位別映像データは、出力部130に出力される。
最大符号化単位内の映像データは、最大深度以下の少なくとも1つの深度によって、深度別符号化単位に基づいて符号化され、それぞれの深度別符号化単位に基づいた符号化結果が比較される。深度別符号化単位の符号化誤差の比較結果、符号化誤差が最小である深度が選択される。それぞれの最大化符号化単位ごとに、少なくとも1つの符号化深度が決定される。
最大符号化単位の大きさは、深度が深くなるにつれ、符号化単位が階層的に分割されて分割され、符号化単位の個数が増加する。また、1つの最大符号化単位に含まれる同一深度の符号化単位であるとしても、それぞれのデータに係わる符号化誤差を測定し、下位深度への分割いかんが決定される。従って、1つの最大符号化単位に含まれるデータであるとしても、位置によって、深度別符号化誤差が異なるので、位置によって、符号化深度が異なって決定される。従って、1つの最大符号化単位について、符号化深度が一つ以上設定され、最大符号化単位のデータは、一つ以上の符号化深度の符号化単位によって区画される。
従って、一実施形態による符号化単位決定部120は、現在最大符号化単位に含まれるツリー構造による符号化単位を決定する。一実施形態による「ツリー構造による符号化単位」は、現在最大符号化単位に含まれる全ての深度別符号化単位のうち、符号化深度として決定された深度の符号化単位を含む。符号化深度の符号化単位は、最大符号化単位内で同一領域では、深度によって階層的に決定され、他の領域については、独立して決定される。同様に、現在領域に係わる符号化深度は、他の領域に係わる符号化深度と独立して決定される。
一実施形態による最大深度は、最大符号化単位から最小符号化単位までの分割回数と係わる指標である。一実施形態による第1最大深度は、最大符号化単位から最小符号化単位までの全分割回数を示すことができる。一実施形態による第2最大深度は、最大符号化単位から最小符号化単位までの深度レベルの総個数を示すことができる。例えば、最大符号化単位の深度が0であるとするとき、最大符号化単位が1回分割された符号化単位の深度は、1に設定され、2回分割された符号化単位の深度は、2に設定される。その場合、最大符号化単位から4回分割された符号化単位が最小符号化単位であるならば、深度0,1,2,3及び4の深度レベルが存在するので、第1最大深度は、4、第2最大深度は、5に設定される。
最大符号化単位の予測符号化及び周波数変換が行われる。予測符号化及び周波数変換も同様に、最大符号化単位ごとに、最大深度以下の深度ごとに、深度別符号化単位を基に行われる。
最大符号化単位が深度別に分割されるたびに、深度別符号化単位の個数が増加するので、深度が深くなるにつれて生成される全ての深度別符号化単位について、予測符号化及び周波数変換を含んだ符号化が行われなければならない。以下、説明の便宜のために、少なくとも1つの最大符号化単位のうち現在深度の符号化単位を基に、予測符号化及び周波数変換について説明する。
一実施形態によるビデオ符号化装置100は、映像データの符号化のためのデータ単位の大きさまたは形態を多様に選択することができる。映像データの符号化のためには、予測符号化、周波数変換、エントロピー符号化のような段階を経るが、全ての段階にわたって、同一のデータ単位が使用され、段階別にデータ単位が変更されもする。
例えば、ビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位の映像データの予測符号化を行うため、符号化単位と異なるデータ単位を選択することができる。
最大符号化単位の予測符号化のためには、一実施形態による符号化深度の符号化単位、すなわち、それ以上分割されない符号化単位を基に予測符号化が行われる。以下、予測符号化の基盤になるそれ以上分割されない符号化単位を「予測単位」と呼ぶ。予測単位が分割されたパーティションは、予測単位及び予測単位の高さ及び幅のうち少なくとも一つが分割されたデータ単位を含んでもよい。
例えば、サイズ2Nx2N(ただし、Nは、正の整数)の符号化単位が、それ以上分割されない場合、サイズ2Nx2Nの予測単位になって、パーティションの大きさは、2Nx2N,2NxN,Nx2N,NxNなどでもある。一実施形態によるパーティションタイプは、予測単位の高さまたは幅が、対称的な比率に分割された対称的パーティションだけではなく、1:nまたはn:1のように、非対称的な比率に分割されたパーティション、幾何学的な形態に分割されたパーティション、任意的形態のパーティションなどを選択的に含んでもよい。
予測単位の予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも一つである。例えば、イントラモード及びインターモードは、2Nx2N,2NxN,Nx2N,NxNサイズのパーティションに対して遂行される。また、スキップモードは、2Nx2Nサイズのパーティションに対してのみ遂行される。符号化単位以内の1つの予測単位ごとに、独立して符号化が行われ、符号化誤差が最小である予測モードが選択される。
また、一実施形態によるビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位と異なるデータ単位を基に、符号化単位の映像データの周波数変換を行うことができる。
符号化単位の周波数変換のためには、符号化単位より小さいか、あるいはそれと同じ大きさのデータ単位を基に、周波数変換が行われる。例えば、周波数変換のためのデータ単位は、イントラモードのためのデータ単位、及びインターモードのためのデータ単位を含んでもよい。
以下、周波数変換の基盤になるデータ単位を、「変換単位」と呼ぶ。符号化単位と類似した方式で、符号化単位内の変換単位も、再帰的にさらに小サイズの変換単位に分割されながら、符号化単位の残差データが、変換深度によって、ツリー構造による変換単位によって区画される。
一実施形態による変換単位についても、符号化単位の高さ及び幅が分割されて変換単位に至るまでの分割回数を示す変換深度が設定される。例えば、サイズ2Nx2Nの現在符号化単位の変換単位の大きさが、2Nx2Nであるならば、変換深度0、変換単位の大きさがNxNであるならば、変換深度1、変換単位の大きさが、N/2xN/2であるならば、変換深度2に設定される。すなわち、変換単位についても、変換深度によって、ツリー構造による変換単位が設定される。
符号化深度別符号化情報は、符号化深度だけではなく、予測関連情報及び周波数変換関連情報が必要である。従って、符号化単位決定部120は、最小符号化誤差を発生させた符号化深度だけではなく、予測単位をパーティションに分割したパーティションタイプ、予測単位別予測モード、周波数変換のための変換単位の大きさなどを決定することができる。
一実施形態による最大符号化単位のツリー構造による符号化単位及びパーティションの決定方式については、図3ないし図12を参照し、詳細に後述する。
符号化単位決定部120は、深度別符号化単位の符号化誤差を、ラグランジュ乗数(Lagrangian multiplier)基盤の率・歪曲最適化技法(rate-distortion optimization)を利用して測定することができる。
出力部130は、符号化単位決定部120で決定された少なくとも1つの符号化深度に基づいて符号化された最大符号化単位の映像データ及び深度別符号化モードに係わる情報を、ビットストリーム形態で出力する。
符号化された映像データは、映像の残差データの符号化結果でもある。
深度別符号化モードに係わる情報は、符号化深度情報、予測単位のパーティションタイプ情報、予測モード情報、変換単位の大きさ情報などを含んでもよい。
符号化深度情報は、現在深度で符号化せずに、下位深度の符号化単位で符号化するか否かを示す深度別分割情報を利用して定義される。現在符号化単位の現在深度が、符号化深度であるならば、現在符号化単位は、現在深度の符号化単位で符号化されるので、現在深度の分割情報は、それ以上下位深度に分割されないように定義される。一方、現在符号化単位の現在深度が、符号化深度ではないならば、下位深度の符号化単位を利用した符号化を試みなければならないので、現在深度の分割情報は、下位深度の符号化単位に分割されるように定義される。
現在深度が符号化深度ではないならば、下位深度の符号化単位に分割された符号化単位について符号化が行われる。現在深度の符号化単位内に、下位深度の符号化単位が一つ以上存在するので、それぞれの下位深度の符号化単位ごとに、反復的に符号化が行われ、同一深度の符号化単位ごとに、再帰的(recursive)符号化が行われる。
1つの最大符号化単位内で、ツリー構造の符号化単位が決定され、符号化深度の符号化単位ごとに、少なくとも1つの符号化モードに係わる情報が決定されなければならないので、1つの最大符号化単位については、少なくとも1つの符号化モードに係わる情報が決定される。また、最大符号化単位のデータは、深度によって階層的に区画され、位置別に符号化深度が異なることがあるので、データについて、符号化深度及び符号化モードに係わる情報が設定される。
従って、一実施形態による出力部130は、最大符号化単位に含まれている符号化単位、予測単位及び最小単位のうち少なくとも一つについて、当該符号化深度及び符号化モードに係わる符号化情報を割り当てられる。
一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割された大きさの正方形のデータ単位であり、最大符号化単位に含まれる全ての符号化単位、予測単位及び変換単位内に含まれる最大サイズの正方形データ単位でもある。
例えば、出力部130を介して出力される符号化情報は、深度別符号化単位別符号化情報と、予測単位別符号化情報とに分類される。深度別符号化単位別符号化情報は、予測モード情報、パーティションサイズ情報を含んでもよい。予測単位別に伝送される符号化情報は、インターモードの推定方向に係わる情報、インターモードの参照映像インデックスに係わる情報、動きベクトルに係わる情報、イントラモードのクロマ成分に係わる情報、イントラモードの補間方式に係わる情報などを含んでもよい。また、ピクチャ、スライスまたはGOP(group of pictures)別に定義される符号化単位の最大サイズに係わる情報及び最大深度に係わる情報は、ビットストリームのヘッダに挿入される。
ビデオ符号化装置100の最も簡単な形態の実施形態によれば、深度別符号化単位は、1階層上位深度の符号化単位の高さ及び幅を半分にした大きさの符号化単位である。すなわち、現在深度の符号化単位の大きさが2Nx2Nであるならば、下位深度の符号化単位の大きさは、NxNである。また、2Nx2Nサイズの現在符号化単位は、NxNサイズの下位深度符号化単位を最大4個含んでもよい。
従って、一実施形態によるビデオ符号化装置100は、現在ピクチャの特性を考慮して決定された最大符号化単位の大きさ及び最大深度を基に、それぞれの最大符号化単位ごとに、最適の形態及び大きさの符号化単位を決定し、ツリー構造による符号化単位を構成することができる。また、それぞれの最大符号化単位ごとに多様な予測モード、周波数変換方式などで符号化することができるので、多様な映像サイズの符号化単位の映像特性を考慮し、最適の符号化モードが決定される。
従って、映像の解像度が非常に高いか、あるいはデータ量が非常に多い映像を既存マクロブロック単位で符号化するならば、ピクチャ当たりマクロブロックの数が過度に多くなる。それにより、マクロブロックごとに生成される圧縮情報も多くなるので、圧縮情報の伝送負担が大きくなり、データ圧縮効率が低下する傾向がある。従って、一実施形態によるビデオ符号化装置は、映像の大きさを考慮して符号化単位の最大サイズを増大させながら、映像特性を考慮して符号化単位を調節することができるので、映像圧縮効率が上昇する。
図2は、本発明の一実施形態によるビデオ復号化装置のブロック図を図示している。一実施形態によるビデオ復号化装置200は、受信部210、映像データ及び符号化情報抽出部220及び映像データ復号化部230を含む。一実施形態によるビデオ復号化装置200の各種プロセシングのための符号化単位、深度、予測単位、変換単位、各種符号化モードに係わる情報など各種用語の定義は、図1及びビデオ符号化装置100を参照して説明したところと同一である。
受信部210は、符号化されたビデオに係わるビットストリームを受信してパージング(parsing)する。映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位によって、符号化単位ごとに符号化された映像データを抽出し、映像データ復号化部230に出力する。映像データ及び符号化情報抽出部220は、現在ピクチャに係わるヘッダから、現在ピクチャの符号化単位の最大サイズに係わる情報を抽出することができる。
また、映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位に係わる符号化深度及び符号化モードに係わる情報を抽出する。抽出された符号化深度及び符号化モードに係わる情報は、映像データ復号化部230に出力される。すなわち、ビット列の映像データを最大符号化単位に分割し、映像データ復号化部230が、最大符号化単位ごとに、映像データを復号化する。
最大符号化単位別符号化深度及び符号化モードに係わる情報は、一つ以上の符号化深度情報について設定され、符号化深度別符号化モードに係わる情報は、当該符号化単位のパーティションタイプ情報、予測モード情報及び変換単位の大きさ情報などを含んでもよい。また、符号化深度情報として、深度別分割情報が抽出されもする。
映像データ及び符号化情報抽出部220が抽出した最大符号化単位別符号化深度及び符号化モードに係わる情報は、一実施形態によるビデオ符号化装置100のように、符号化端で、最大符号化単位別深度別符号化単位ごとに反復的に符号化を行い、最小符号化誤差を発生させると決定された符号化深度及び符号化モードに係わる情報である。従って、ビデオ復号化装置200は、最小符号化誤差を発生させる符号化方式により、データを復号化して映像を復元することができる。
一実施形態による符号化深度及び符号化モードに係わる符号化情報は、当該符号化単位、予測単位及び最小単位のうち所定データ単位について割り当てられているので、映像データ及び符号化情報抽出部220は、所定データ単位別に、符号化深度及び符号化モードに係わる情報を抽出することができる。所定データ単位別に、当該最大符号化単位の符号化深度及び符号化モードに係わる情報が記録されているならば、同一の符号化深度及び符号化モードに係わる情報を有している所定データ単位は、同一の最大符号化単位に含まれるデータ単位と類推される。
映像データ復号化部230は、最大符号化単位別符号化深度及び符号化モードに係わる情報に基づいて、それぞれの最大符号化単位の映像データを復号化し、現在ピクチャを復元する。すなわち、映像データ復号化部230は、最大符号化単位に含まれるツリー構造による符号化単位のうちそれぞれの符号化単位ごとに、読み取られたパーティションタイプ、予測モード、変換単位に基づいて符号化された映像データを復号化することができる。復号化過程は、イントラ予測及び動き補償を含む予測過程、及び周波数逆変換過程を含んでもよい。
映像データ復号化部230は、符号化深度別符号化単位の予測単位のパーティションタイプ情報及び予測モード情報に基づいて、符号化単位ごとに、それぞれのパーティション及び予測モードによって、イントラ予測または動き補償を行うことができる。
また、映像データ復号化部230は、最大符号化単位別周波数逆変換のために、符号化深度別符号化単位の変換単位のサイズ情報に基づいて、符号化単位ごとに、それぞれの変換単位によって、周波数逆変換を行うことができる。
映像データ復号化部230は、深度別分割情報を利用して、現在最大符号化単位の符号化深度を決定することができる。もし分割情報が、現在深度において、それ以上分割されないということを示しているのであるならば、現在深度が符号化深度である。従って、映像データ復号化部230は、現在最大符号化単位の映像データに対して、現在深度の符号化単位を、予測単位のパーティションタイプ、予測モード及び変換単位サイズ情報を利用して、復号化することができる。
すなわち、符号化単位、予測単位及び最小単位のうち、所定データ単位について設定されている符号化情報を観察し、同一の分割情報を含んだ符号化情報を保有しているデータ単位が集まり、映像データ復号化部230によって、同一の符号化モードで復号化する1つのデータ単位と見なされる。
一実施形態によるビデオ復号化装置200は、符号化過程で、最大符号化単位ごとに再帰的に符号化を行い、最小符号化誤差を発生させた符号化単位に係わる情報を獲得し、現在ピクチャに係わる復号化に利用することができる。すなわち、最大符号化単位ごとに、最適符号化単位として決定されたツリー構造による符号化単位の符号化された映像データの復号化が可能になる。
従って、高い解像度の映像またはデータ量が過度に多い映像でも、符号化端から伝送された最適符号化モードに係わる情報を利用して、映像の特性に適応的に決定された符号化単位の大きさ及び符号化モードによって、効率的に映像データを復号化して復元することができる。
以下、図3ないし図13を参照し、本発明の一実施形態によるツリー構造による符号化単位、予測単位及び変換単位の決定方式について説明する。
図3は、階層的符号化単位の概念を図示している。符号化単位の例は、符号化単位の大きさが幅x高さで表現され、サイズ64x64である符号化単位から、サイズ32x32,16x16,8x8を含んでもよい。サイズ64x64の符号化単位は、サイズ64x64,64x32,32x64,32x32のパーティションに分割され、サイズ32x32の符号化単位は、サイズ32x32,32x16,16x32,16x16のパーティションに分割され、サイズ16x16の符号化単位は、サイズ16x16,16x8,8x16,8x8のパーティションに分割され、サイズ8x8の符号化単位は、サイズ8x8,8x4,4x8,4x4のパーティションに分割される。
ビデオデータ310については、解像度が1920x1080、符号化単位の最大サイズが64、最大深度が2に設定されている。ビデオデータ320については、解像度が1920x1080、符号化単位の最大サイズが64、最大深度が3に設定されている。ビデオデータ330については、解像度が352x288、符号化単位の最大サイズが16、最大深度が1に設定されている。図3に図示された最大深度は、最大符号化単位から最小符号化単位までの全分割回数を示す。
解像度が高いか、あるいはデータ量が多い場合、符号化効率の向上だけではなく、映像特性を正確に反映させるために、符号化サイズの最大サイズが相対的に大きいことが望ましい。従って、ビデオデータ330に比べ、解像度が高いビデオデータ310,320は、符号化サイズの最大サイズが64に選択される。
ビデオデータ310の最大深度が2であるので、ビデオデータ310の符号化単位315は、長軸サイズが64である最大符号化単位から、2回分割されて深度が2階層深くなり、長軸サイズが32,16である符号化単位まで含んでもよい。一方、ビデオデータ330の最大深度が1であるので、ビデオデータ330の符号化単位335は、長軸サイズが16である符号化単位から、1回分割されて深度が1階層深くなり、長軸サイズが8である符号化単位まで含んでもよい。
ビデオデータ320の最大深度が3であるので、ビデオデータ320の符号化単位325は、長軸サイズが64である最大符号化単位から、3回分割されて深度が3階層深くなり長軸サイズが32,16,8である符号化単位まで含んでもよい。深度が深くなるほど、詳細情報の表現能が向上する。
図4は、本発明の一実施形態による符号化単位に基づく映像符号化部のブロック図を図示している。一実施形態による映像符号化部400は、ビデオ符号化装置100の符号化単位決定部120において、映像データを符号化するのに経る作業を含む。すなわち、イントラ予測部410は、現在フレーム405のうちイントラモードの符号化単位についてイントラ予測を行い、動き推定部420及び動き補償部425は、インターモードの現在フレーム405及び参照フレーム495を利用して、インター推定及び動き補償を行う。
イントラ予測部410、動き推定部420及び動き補償部425から出力されたデータは、周波数変換部430及び量子化部440を経て、量子化された変換係数として出力される。量子化された変換係数は、逆量子化部460、周波数逆変換部470を介して、空間領域のデータに復元され、復元された空間領域のデータは、デブロッキング部480及びループ・フィルタリング部490を経て後処理され、参照フレーム495として出力される。量子化された変換係数は、エントロピー符号化部450を経て、ビットストリーム455として出力される。
一実施形態によるビデオ符号化装置100に適用されるためには、映像符号化部400の構成要素であるイントラ予測部410、動き推定部420、動き補償部425、周波数変換部430、量子化部440、エントロピー符号化部450、逆量子化部460、周波数逆変換部470、デブロッキング部480及びループ・フィルタリング部490が、いずれも最大符号化単位ごとに最大深度を考慮し、ツリー構造による符号化単位のうち、それぞれの符号化単位に基づいた作業を遂行しなければならない。
特に、イントラ予測部410、動き推定部420及び動き補償部425は、現在最大符号化単位の最大サイズ及び最大深度を考慮し、ツリー構造による符号化単位のうち、それぞれの符号化単位のパーティション及び予測モードを決定し、周波数変換部430は、ツリー構造による符号化単位のうち、それぞれの符号化単位内の変換単位の大きさを決定しなければならない。
図5は、本発明の一実施形態による符号化単位に基づく映像復号化部のブロック図を図示している。ビットストリーム505がパージング部510を経て、復号化対象である符号化された映像データ、及び復号化のために必要な符号化に係わる情報がパージングされる。符号化された映像データは、エントロピー復号化部520及び逆量子化部530を経て、逆量子化されたデータとして出力され、周波数逆変換部540を経て、空間領域の映像データが復元される。
空間領域の映像データに対して、イントラ予測部550は、イントラモードの符号化単位についてイントラ予測を行い、動き補償部560は、参照フレーム585を共に利用して、インターモードの符号化単位について動き補償を行う。
イントラ予測部550及び動き補償部560を経た空間領域のデータは、デブロッキング部570及びループ・フィルタリング部580を経て後処理され、復元フレーム595として出力される。また、デブロッキング部570及びループ・フィルタリング部580を経て後処理されたデータは、参照フレーム585として出力される。
ビデオ復号化装置200の映像データ復号化部230において映像データを復号化するために、一実施形態による映像復号化部500のパージング部510以降の段階別作業が遂行される。
一実施形態によるビデオ復号化装置200に適用されるためには、映像復号化部500の構成要素であるパージング部510、エントロピー復号化部520、逆量子化部530、周波数逆変換部540、イントラ予測部550、動き補償部560、デブロッキング部570及びループ・フィルタリング部580が、いずれも最大符号化単位ごとに、ツリー構造による符号化単位に基づいて、作業を遂行しなければならない。
特に、イントラ予測部550、動き補償部560は、ツリー構造による符号化単位こごに、それぞれパーティション及び予測モードを決定し、周波数逆変換部540は、符号化単位ごとに、変換単位の大きさを決定しなければならない。
図6は、本発明の一実施形態による深度別符号化単位及びパーティションを図示している。一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200は、映像特性を考慮するために、階層的な符号化単位を使用する。符号化単位の最大高及び最大幅、最大深度は、映像の特性によって、適応的に決定され、ユーザの要求によって多様に設定されもする。既設定の符号化単位の最大サイズによって、深度別符号化単位の大きさが決定される。
一実施形態による符号化単位の階層構造600は、符号化単位の最大高及び最大幅が64であり、最大深度が4である場合を図示している。一実施形態による符号化単位の階層構造600の縦軸に沿って深度が深くなるので、深度別符号化単位の高さ及び幅がそれぞれ分割される。また、符号化単位の階層構造600の横軸に沿って、それぞれの深度別符号化単位の予測符号化の基盤になる予測単位及びパーティションが図示されている。
すなわち、符号化単位610は、符号化単位の階層構造600において最大符号化単位であり、深度が0であり、符号化単位の大きさ、すなわち、高さ及び幅が64x64である。縦軸に沿って深度が深くなり、サイズ32x32である深度1の符号化単位620、サイズ16x16である深度2の符号化単位630、サイズ8x8である深度3の符号化単位640、サイズ4x4である深度4の符号化単位650が存在する。サイズ4x4である深度4の符号化単位650は、最小符号化単位である。
それぞれの深度別に、横軸に沿って、符号化単位の予測単位及びパーティションが配列される。すなわち、深度0のサイズ64x64の符号化単位610が予測単位であるならば、予測単位は、サイズ64x64の符号化単位610に含まれるサイズ64x64のパーティション610、サイズ64x32のパーティション612、サイズ32x64のパーティション614、サイズ32x32のパーティション616に分割される。
同様に、深度1のサイズ32x32の符号化単位620の予測単位は、サイズ32x32の符号化単位620に含まれるサイズ32x32のパーティション620、サイズ32x16のパーティション622、サイズ16x32のパーティション624、サイズ16x16のパーティション626に分割される。
同様に、深度2のサイズ16x16の符号化単位630の予測単位は、サイズ16x16の符号化単位630に含まれるサイズ16x16のパーティション630、サイズ16x8のパーティション632、サイズ8x16のパーティション634、サイズ8x8のパーティション636に分割される。
同様に、深度3のサイズ8x8の符号化単位640の予測単位は、サイズ8x8の符号化単位640に含まれるサイズ8x8のパーティション640、サイズ8x4のパーティション642、サイズ4x8のパーティション644、サイズ4x4のパーティション646に分割される。
最後に、深度4のサイズ4x4の符号化単位650は、最小符号化単位であり、最下位深度の符号化単位であり、当該予測単位も、サイズ4x4のパーティション650だけに設定される。
一実施形態によるビデオ符号化装置100の符号化単位決定部120は、最大符号化単位610の符号化深度を決定するために、最大符号化単位610に含まれるそれぞれの深度の符号化単位ごとに、符号化を行わなければならない。
同一範囲及び同一サイズのデータを含むための深度別符号化単位の個数は、深度が深くなるほど、深度別符号化単位の個数も増加する。例えば、深度1の符号化単位一つを含むデータについて、深度2の符号化単位は、四つが必要である。従って、同一のデータの符号化結果を深度別に比較するために、1つの深度1の符号化単位、及び4つの深度2の符号化単位を利用して、それぞれ符号化されなければならない。
それぞれの深度別符号化のためには、符号化単位の階層構造600の横軸に沿って、深度別符号化単位の予測単位ごとに符号化を行い、当該深度において最小の符号化誤差である代表符号化誤差が選択される。また、符号化単位の階層構造600の縦軸に沿って深度が深くなり、それぞれの深度ごとに符号化を行い、深度別代表符号化誤差を比較し、最小符号化誤差が検索される。最大符号化単位610において、最小符号化誤差が生じる深度及びパーティションが、最大符号化単位610の符号化深度及びパーティションタイプに選択される。
図7は、本発明の一実施形態による、符号化単位及び変換単位の関係を図示している。
一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号化装置200は、最大符号化単位ごとに、最大符号化単位より小さいか、あるいはそれと同じ大きさの符号化単位で、映像を符号化したり、あるいは復号化する。符号化過程のうち、周波数変換のための変換単位の大きさは、それぞれの符号化単位ほど大きくないデータ単位を基に選択される。
例えば、一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号化装置200で、現在符号化単位710が64x64サイズであるとき、32x32サイズの変換単位720を利用して周波数変換が行われる。
また、64x64サイズの符号化単位710のデータを、64x64サイズ以下の32x32,16x16,8x8,4x4サイズの変換単位に、それぞれ周波数変換を行って符号化した後、原本との誤差が最小である変換単位が選択される。
図8は、本発明の一実施形態による深度別符号化情報を図示している。一実施形態によるビデオ符号化装置100の出力部130は、符号化モードに係わる情報であり、それぞれの符号化深度の符号化単位ごとに、パーティションタイプに係わる情報800、予測モードに係わる情報810、変換単位サイズについての情報820を符号化して伝送することができる。
パーティションタイプについての情報800は、現在符号化単位の予測符号化のためのデータ単位として、現在符号化単位の予測単位が分割されたパーティションの形態についての情報を示す。例えば、サイズ2Nx2Nの現在符号化単位CU_0は、サイズ2Nx2Nのパーティション802、サイズ2NxNのパーティション804、サイズNx2Nのパーティション806、サイズNxNのパーティション808のうちいずれか1つのタイプに分割されて利用される。その場合、現在符号化単位のパーティションタイプに係わる情報800は、サイズ2Nx2Nのパーティション802、サイズ2NxNのパーティション804、サイズNx2Nのパーティション806及びサイズNxNのパーティション808のうち一つを示すように設定される。
予測モードに係わる情報810は、それぞれのパーティションの予測モードを示す。例えば、予測モードに係わる情報810を介して、パーティションタイプに係わる情報800が示すパーティションが、イントラモード812、インターモード814及びスキップモード816のうち一つで予測符号化が行われるか否かが設定される。
また、変換単位サイズに係わる情報820は、現在符号化単位をいかなる変換単位を基に、周波数変換を行うかということを示す。例えば、変換単位は、第1イントラ変換単位サイズ822、第2イントラ変換単位サイズ824、第1インター変換単位サイズ826、第2インター変換単位サイズ828のうち一つでもある。
一実施形態によるビデオ復号化装置200の映像データ及び符号化情報抽出部210は、それぞれの深度別符号化単位ごとに、パーティションタイプに係わる情報800、予測モードに係わる情報810、変換単位サイズについての情報820を抽出し、復号化に利用することができる。
図9は、本発明の一実施形態による深度別符号化単位を図示している。
深度の変化を示すために、分割情報が利用される。分割情報は、現在深度の符号化単位が、下位深度の符号化単位に分割されるか否かということを示す。
深度0及び2N_0x2N_0サイズの符号化単位900の予測符号化のための予測単位910は、2N_0x2N_0サイズのパーティションタイプ912、2N_0xN_0サイズのパーティションタイプ914、N_0x2N_0サイズのパーティションタイプ916、N_0xN_0サイズのパーティションタイプ918を含んでもよい。予測単位が対称的な比率に分割されたパーティション912,914,916,918だけが例示されているが、前述のように、パーティションタイプは、それらに限定されるものではなく、非対称的パーティション、任意的形態のパーティション、幾何学的形態のパーティションなどを含んでもよい。
パーティションタイプごとに、1つの2N_0x2N_0サイズのパーティション、2つの2N_0xN_0サイズのパーティション、2つのN_0x2N_0サイズのパーティション、4つのN_0xN_0サイズのパーティションごとに反復的に予測符号化が行われなければならない。サイズ2N_0x2N_0、サイズN_0x2N_0、サイズ2N_0xN_0及びサイズN_0xN_0のパーティションについては、イントラモード及びインターモードで予測符号化が行われる。スキップモードは、サイズ2N_0x2N_0のパーティションについてのみ予測符号化が行われる。
サイズ2N_0x2N_0,2N_0xN_0及びN_0x2N_0のパーティションタイプ912,914,916のうち一つによる符号化誤差が最小であれば、それ以上下位深度に分割する必要ない。
サイズN_0xN_0のパーティションタイプ918による符号化誤差が最小であれば、深度0を1に変更しながら分割し(920)、深度2及びサイズN_0xN_0のパーティションタイプの符号化単位930に対して反復的に符号化を行い、最小符号化誤差を検索していく。
深度1及びサイズ2N_1x2N_1(=N_0xN_0)の符号化単位930の予測符号化のための予測単位940は、サイズ2N_1x2N_1のパーティションタイプ942、サイズ2N_1xN_1のパーティションタイプ944、サイズN_1x2N_1のパーティションタイプ946、サイズN_1xN_1のパーティションタイプ948を含んでもよい。
また、サイズN_1xN_1のパーティションタイプ948による符号化誤差が最小であれば、深度1を深度2に変更しながら分割し(950)、深度2及びサイズN_2xN_2の符号化単位960に対して反復的に符号化を行い、最小符号化誤差を検索していく。
最大深度がdである場合、深度別分割情報は、深度d−1になるまで設定され、分割情報は、深度d−2まで設定される。すなわち、深度d−2から分割され(970)、深度d−1まで符号化が行われる場合、深度d−1及びサイズ2N_(d−1)x2N_(d−1)の符号化単位980の予測符号化のための予測単位990は、サイズ2N_(d−1)x2N_(d−1)のパーティションタイプ992、サイズ2N_(d−1)xN_(d−1)のパーティションタイプ994、サイズN_(d−1)x2N_(d−1)のパーティションタイプ996、サイズN_(d−1)xN_(d−1)のパーティションタイプ998を含んでもよい。
パーティションタイプのうち、1つのサイズ2N_(d−1)x2N_(d−1)のパーティション、2つのサイズ2N_(d−1)xN_(d−1)のパーティション、2つのサイズN_(d−1)x2N_(d−1)のパーティション、4つのサイズN_(d−1)xN_(d−1)のパーティションごとに、反復的に予測符号化を介した符号化が行われ、最小符号化誤差が生じるパーティションタイプが検索される。
サイズN_(d−1)xN_(d−1)のパーティションタイプ998による符号化誤差が最小であるとしても、最大深度がdであるので、深度d−1の符号化単位CU_(d−1)は、それ以上下位深度への分割過程を経ず、現在最大符号化単位900に係わる符号化深度が深度d−1に決定され、パーティションタイプは、N_(d−1)xN_(d−1)に決定される。また、最大深度がdであるので、深度d−1の符号化単位952について、分割情報は設定されない。
データ単位999は、現在最大符号化単位に係わる「最小単位」と呼ばれる。一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割された大きさの正方形のデータ単位でもある。そのような反復的符号化過程を介して、一実施形態によるビデオ符号化装置100は、符号化単位900の深度別符号化誤差を比較し、最小の符号化誤差が生じる深度を選択して符号化深度を決定し、当該パーティションタイプ及び予測モードが、符号化深度の符号化モードに設定される。
かように、深度0,1,…,d−1,dの全ての深度別最小符号化誤差を比較し、誤差が最小である深度が選択されて符号化深度として決定される。符号化深度、予測単位のパーティションタイプ及び予測モードは、符号化モードに係わる情報として符号化されて伝送される。また、深度0から符号化深度に至るまで符号化単位が分割されなければならないので、符号化深度の分割情報だけが「0」に設定され、符号化深度を除いた深度別分割情報は、「1」に設定されなければならない。
一実施形態によるビデオ復号化装置200の映像データ及び符号化情報抽出部220は、符号化単位900に係わる符号化深度及び予測単位に係わる情報を抽出し、符号化単位912を復号化するのに利用することができる。一実施形態によるビデオ復号化装置200は、深度別分割情報を利用して、分割情報が「0」である深度を符号化深度として把握し、当該深度に係わる符号化モードに係わる情報を利用して、復号化に利用することができる。
図10、図11及び図12は、本発明の一実施形態による、符号化単位、予測単位及び周波数変換単位の関係を図示している。符号化単位1010は、最大符号化単位について、一実施形態によるビデオ符号化装置100が決定した符号化深度別符号化単位である。予測単位1060は、符号化単位1010のうち、それぞれの符号化深度別符号化単位の予測単位のパーティションであり、変換単位1070は、それぞれの符号化深度別符号化単位の変換単位である。
深度別符号化単位1010は、最大符号化単位の深度が0であるとすれば、符号化単位1012,1054は、深度が1、符号化単位1014,1016,1018,1028,1050,1052は、深度が2、符号化単位1020,1022,1024,1026,1030,1032,1048は、深度が3、符号化単位1040,1042,1044,1046は、深度が4である。
予測単位1060において、一部パーティション1014,1016,1022,1032,1048,1050,1052,1054は、符号化単位が分割された形態である。すなわち、パーティション1014,1022,1050,1054は、2NxNのパーティションタイプであり、パーティション1016,1048,1052は、Nx2Nのパーティションタイプであり、パーティション1032は、NxNのパーティションタイプである。深度別符号化単位1010の予測単位及びパーティションは、それぞれの符号化単位より小さいか、あるいはそれと同じである。
変換単位1070において、一部の変換単位1052の映像データについては、符号化単位に比べ、小サイズのデータ単位であり、周波数変換または周波数逆変換が行われる。また、変換単位1014,1016,1022,1032,1048,1050,1052,1054は、予測単位1060において、当該予測単位及びパーティションと比較すれば、互いに異なる大きさまたは形態のデータ単位である。すなわち、一実施形態によるビデオ符号化装置100、及び一実施形態に他のビデオ復号化装置200は、同一の符号化単位に係わるイントラ予測/動き推定/動き補償作業、及び周波数変換/逆変換作業であるとしても、それぞれ別個のデータ単位を基に、遂行することができる。
それにより、最大符号化単位ごとに、領域別に階層的な構造の符号化単位ごとに再帰的に符号化が行われ、最適符号化単位が決定されることにより、再帰的ツリー構造による符号化単位が構成される。符号化情報は、符号化単位に係わる分割情報、パーティションタイプ情報、予測モード情報、変換単位サイズ情報を含んでもよい。下記表1は、一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200で設定することができる一例を示している。
一実施形態によるビデオ符号化装置100の出力部130は、ツリー構造による符号化単位に係わる符号化情報を出力し、一実施形態によるビデオ復号化装置200の符号化情報抽出部220は、受信されたビットストリームから、ツリー構造による符号化単位に係わる符号化情報を抽出することができる。
分割情報は、現在符号化単位が、下位深度の符号化単位に分割されるか否かということを示す。現在深度dの分割情報が0であるならば、現在符号化単位が現在符号化単位が下位符号化単位にそれ以上分割されない深度が符号化深度であるので、符号化深度について、パーティションタイプ情報、予測モード、変換単位サイズ情報が定義される。分割情報により、1段階さらに分割されなければならない場合には、分割された4個の下位深度の符号化単位ごとに、独立して符号化が行われなければならない。
予測モードは、イントラモード、インターモード及びスキップモードのうち一つで示すことができる。イントラモード及びインターモードは、全てのパーティションタイプで定義され、スキップモードは、パーティションタイプ2Nx2Nでのみ定義される。
パーティションタイプ情報は、予測単位の高さまたは幅が、対称的な比率に分割された対称的パーティションタイプ2Nx2N,2NxN,Nx2N及びNxNと、非対称的な比率に分割された非対称的パーティションタイプ2NxnU,2NxnD,nLx2N,nRx2Nを示すことができる。非対称的パーティションタイプ2NxnU及び2NxnDは、それぞれ高さが1:3及び3:1に分割された形態であり、非対称的パーティションタイプnLx2N及びnRx2Nは、それぞれ幅が1:3及び3:1に分割された形態を示す。
変換単位サイズは、イントラモードで二種類のサイズ、インターモードで二種類のサイズに設定される。すなわち、変換単位分割情報が0であるならば、変換単位の大きさが、現在符号化単位のサイズ2Nx2Nに設定される。変換単位分割情報が1であるならば、現在符号化単位が分割された大きさの変換単位が設定される。また、サイズ2Nx2Nである現在符号化単位に係わるパーティションタイプが、対称形パーティションタイプであるならば、変換単位の大きさはNxNに、非対称形パーティションタイプであるならば、N/2xN/2に設定される。
一実施形態によるツリー構造による符号化単位の符号化情報は、符号化深度の符号化単位、予測単位及び最小単位単位のうち少なくとも一つに対して割り当てられる。符号化深度の符号化単位は、同一の符号化情報を保有している予測単位及び最小単位を一つ以上含んでもよい。
従って、隣接したデータ単位同士それぞれ保有している符号化情報を確認すれば、同一の符号化深度の符号化単位に含まれるか否かということが確認される。また、データ単位が保有している符号化情報を利用すれば、当該符号化深度の符号化単位を確認することができるので、最大符号化単位内の符号化深度の分布が類推される。
従って、その場合、現在符号化単位が周辺データ単位を参照して予測する場合、現在符号化単位に隣接する深度別符号化単位内のデータ単位の符号化情報が直接参照されて利用される。
他の実施形態で、現在符号化単位が周辺符号化単位を参照して予測符号化が行われる場合、隣接する深度別符号化単位の符号化情報を利用して、深度別符号化単位内で、現在符号化単位に隣接するデータが検索されることにより、周辺符号化単位が参照されもする。
図13は、表1の符号化モード情報による符号化単位、予測単位及び変換単位の関係を図示している。最大符号化単位1300は、符号化深度の符号化単位1302,1304,1306,1312,1314,1316,1318を含む。そのうち1つの符号化単位1318は、符号化深度の符号化単位であるので、分割情報が0に設定される。サイズ2Nx2Nの符号化単位1318のパーティションタイプ情報は、パーティションタイプ2Nx2N 1322,2NxN 1324,Nx2N 1326,NxN 1328,2NxnU 1332,2NxnD 1334,nLx2N 1336及びnRx2N 1338のうち一つに設定される。
パーティションタイプ情報が、対称形パーティションタイプ2Nx2N 1322,2NxN 1324,Nx2N 1326及びNxN 1328のうち一つに設定されている場合、変換単位分割情報(TU size flag)が0であるならば、サイズ2Nx2Nの変換単位1342が設定され、変換単位分割情報が1であるならば、サイズNxNの変換単位1344が設定される。
パーティションタイプ情報が、非対称形パーティションタイプ2NxnU 1332,2NxnD 1334,nLx2N 1336及びnRx2N 1338のうち一つに設定された場合、変換単位分割情報(TU size flag)が0であるならば、サイズ2Nx2Nの変換単位1352が設定され、変換単位分割情報が1であるならば、サイズN/2xN/2の変換単位1354が設定される。
以下、図4の本発明の一実施形態による映像符号化装置100のイントラ予測部410、及び図5の映像復号化装置200のイントラ予測部550で、予測単位について行われるイントラ予測について具体的に説明する。
イントラ予測部410,550は、現在予測単位の予測値を、現在予測単位の周辺ピクセルを利用して獲得するイントラ予測を行う。本発明の一実施形態によるイントラ予測部410,550は、予測単位が16x16以上の大サイズを有することを考慮し、従来技術による限定された方向性を有するイントラ予測モード以外に、(dx,dy)パラメータを利用した多様な方向性を有するイントラ予測モードを付加的に遂行する。本発明の一実施形態による多様な方向性を有するイントラ予測モードについては、後述する。
図14は、本発明の一実施形態による予測単位の大きさによるイントラ予測モードの個数を図示している。
イントラ予測部410,550は、予測単位の大きさにより、予測単位に適用するイントラ予測モードの個数を多様に設定することができる。一例として、図14を参照すれば、イントラ予測される予測単位の大きさをNxNとするとき、2x2,4x4,8x8,16x16,32x32,64x64,128x128サイズの予測単位それぞれについて、実際に遂行されるイントラ予測モードの個数は、それぞれ5,9,9,17,33,5,5個(Example 2の場合)に設定される。このように、予測単位の大きさにより、実際に遂行されるイントラ予測モードの個数を差別化する理由は、予測単位の大きさにより、予測モード情報を符号化するためのオーバーヘッドが異なるからである。すなわち、予測単位の場合、全体映像で占める部分が小さいにもかかわらず、そのような小さい予測単位の予測モードのような付加情報を伝送するためのオーバーヘッドが大きく。従って、小サイズの予測単位を過度に多くの予測モードで符号化する場合、ビット量が増加して圧縮効率が低下する。また、大サイズを有する予測単位、例えば、64x64以上の大きさを有する予測単位は、一般的に、映像の平坦な領域に係わる予測単位として選択される場合が多いので、そのような平坦な領域を符号化するのに多く選択される大サイズの予測単位を過度に多数の予測モードで符号化することも、圧縮効率側面で非効率的である。従って、予測単位の大きさが、所定サイズよりはるかに大きいか、あるいは小さい場合には、相対的に少ない個数のイントラ予測モードのみを適用する。かような予測単位の大きさによって適用されるイントラ予測モードの個数は、図14に限定されるものではなく、多様に設定される。図14に図示された各予測単位の大きさによって適用される予測モードの個数は、一実施形態に過ぎず、各予測単位の大きさによる予測モードの個数は、変更される。また、各予測単位に適用されるイントラ予測モードの個数は、予測単位の大きさにかかわらず、常に一定に設定される。
本発明の一実施形態によるイントラ予測部410,550は、予測単位に適用されるイントラ予測モードでもって、予測単位内のピクセルを中心に、所定の傾度を有するラインを利用して、周辺参照ピクセルを決定し、決定された周辺参照ピクセルを、ピクセルの予測子として利用するイントラ予測モードが含まれる。かようなラインの傾度は、(dx,dy)パラメータ(dx,dyは、整数)を利用して設定される。一例として、33の予測モードを、それぞれmode N(Nは、0から32までの整数)と定義するとき、mode 0は、垂直モード、mode 1は、水平モード、mode 2は、DC(direct current)モード、mode 3は、プレーンモード、mode 32は、プラナー(planar)モードとして設定し、mode 4〜mode 31それぞれは、次の表1に表記されているように、(1,−1)、(1,1)、(1,2)、(2,1)、(1,−2)、(2,1)、(1,−2)、(2,−1)、(2,−11)、(5,−7)、(10,−7)、(11,3)、(4,3)、(1,11)、(1,−1)、(12,−3)、(1,−11)、(1,−7)、(3,−10)、(5,−6)、(7,−6)、(7,−4)、(11,1)、(6,1)、(8,3)、(5,3)、(5,7)、(2,7)、(5,−7)、(4,−3)うち1つの値に表現される(dx,dy)を利用して、tan1(dy/dx)の方向性を有するラインを利用して、周辺参照ピクセルを決定し、決定された周辺参照ピクセルを予測に利用するイントラ予測モードとして定義することができる。
イントラ予測部410,550で利用されるイントラ予測モードの個数は、表2に限定されるものではなく、現在予測単位が色差成分であるか輝度成分であるかということ、現在予測単位の大きさなどの情報に基づいて多様に設定され、また各mode Nがいかなるイントラ予測モードを示すかということも、多様に設定される。一例として、全体イントラ予測モードの個数を36個に設定し、mode 0は、後述されるプラナーモード、mode 1は、DCモード、mode 2〜34は、後述される一例のように、33の方向性を有するイントラ予測モード、mode 35は、色差成分の予測単位について、対応する輝度成分の予測単位を利用したモード(Intra_FromLuma)と定義することもできる。mode 35の輝度成分の予測単位から、対応する色差成分の予測単位を遂行するイントラ予測モード(Intra_FromLuma)は、色差成分の予測単位についてのみ適用され、輝度成分の予測単位のイントラ予測時には、利用されない。
図15は、本発明の一実施形態による多様な方向性を有するイントラ予測モードについて説明するための参照図である。
前述のように、本発明の一実施形態によるイントラ予測部410,550は、複数個の(dx,dy)パラメータを利用して決定されるtan−1(dy/dx)の傾度を有するラインを利用して、周辺参照ピクセルを決定し、決定された周辺参照ピクセルを利用して予測を行うことができる。
図15を参照すれば、現在予測単位内部の予測すべき現在ピクセルPを中心に、表2に表記されたモード別(dx,dy)の値によって決定されるtan−1(dy/dx)の角度を有する延長線150上に位置した周辺ピクセルA,Bを、現在ピクセルPの予測子として利用することができる。このとき、予測子として利用される周辺ピクセルは、以前に符号化されて復元された、現在予測単位の上側、左側、右上側及び左下側の以前予測単位のピクセルであることが望ましい。そのように、多様な方向性を有するイントラ予測モードによって予測符号化を行うことにより、映像の特性によって、さらに効率的な圧縮が可能である。
図15で、延長線150に位置したり、あるいは延長線150に近い周辺ピクセルを利用して、現在ピクセルPの予測子を生成する場合、延長線150は、実際にtan−1(dy/dx)の方向性を有するが、かような延長線150を利用した周辺ピクセル決定のためには、(dy/dx)の除算演算が必要であるので、ハードウェアやソフトウェアで具現するとき、小数点演算を含み、演算量を増加させる要因にもなる。従って、参照ピクセルを選択するための予測方向を、(dx,dy)パラメータを利用して設定するとき、演算量を減少させることができるように、(dx,dy)を設定する必要がある。
図16は、本発明の一実施形態によって、(dx,dy)の方向性を有する延長線上に位置した周辺ピクセルと、現在ピクセルとの関係について説明するための図面である。図16を参照すれば、(j,i)に位置した現在ピクセルをP 1610、現在ピクセルP 1610を通過するtan−1(dy/dx)の方向性、すなわち、傾度を有する延長線上に位置した上側周辺ピクセルをA 1611、左側周辺ピクセルをB 1612と定義する。現在ピクセルP 1610が含まれた予測単位の大きさが、nSxnS(nSは、正の整数)であり、予測単位の各ピクセルの位置は、(0,0)から(nS−1,nS−1)のうち一つであり、x軸上に位置した上側周辺ピクセルの位置を(m,−1)(mは、整数)、y軸上に位置した左側周辺ピクセルの位置を(−1,n)(nは、整数)と仮定する。現在ピクセルP 1610を通過する延長線と出合う上側周辺ピクセルA 1611の位置は、(j+i*dx/dy,−1)、左側周辺ピクセルB 1612の位置は、(−1,i+j*dy/dx)である。従って、現在ピクセルP 1610の予測のために、上側周辺ピクセルA 1611または左側周辺ピクセルB 1612を決定するためには、dx/dyまたはdy/dxのような除算演算が必要である。前述のように、かような除算演算は、演算複雑度が高いので、ソフトウェアまたはハードウェアで具現するとき、演算速度の低下をもたらす。従って、周辺ピクセルを決定するための予測モードの方向性を示すdx及びdyのうち少なくとも1つの値を、2の累乗として決定することができる。すなわち、n、mをそれぞれ整数とするとき、dx及びdyは、それぞれ2^n、2^mでもある。
現在ピクセルP 1610の予測子として、左側周辺ピクセルB 1612が利用され、dxが2^nの値を有する場合、左側周辺ピクセルB 1612の位置である(−1,i+j*dy/dx)を決定するために必要なj*dy/dx演算は、(i*dy)/(2^n)であり、かような2の累乗で除算を行う演算は、(i*dy)>>nのように、シフト演算を介して具現されるので、演算量が減少する。
同様に、現在ピクセルP 1610の予測子として、上側周辺ピクセルA 1611が利用され、dyが2^mの値を有する場合、上側周辺ピクセルAの位置である(j+i*dx/dy,−1)を決定するために必要なi*dx/dy演算は、(i*dx)/(2^m)であり、かような2の累乗で除算を行う演算は、(i*dx)>>mのように、シフト演算を介して具現される。
図17及び図18は、本発明の一実施形態によるイントラ予測モード方向を示した図面である。
一般的に、映像やビデオ信号で示される直線パターンは、垂直方向や水平方向である場合が多い。従って、(dx,dy)のパラメータを利用して、多様な方向性を有するイントラ予測モードを定義するとき、次のように(dx,dy)の値を定義することにより、映像のコーディング効率を向上させることができる。
具体的には、dyが2^mの値に固定された値を有する場合、dxの絶対値は、垂直方向に近い予測方向間の間隔を狭めるように設定され、水平方向に近い予測方向であればあるほど、予測モード間の間隔を広するように設定される。例えば、図17を参照すれば、dyが2^5、すなわち、32の値を有する場合、dxの値を、2、5、9、13、17、21、26、32、−2、−5、−9、−13、−17、−21、−26、−32のように設定することにより、垂直方向に近い予測方向間の間隔は、相対的に狭くなるように設定され、水平方向に近い予測方向であればあるほど、予測モード間の間隔が相対的に広くなるように設定される。
同様に、dxが2^nの値に固定された値を有する場合、dyの絶対値は、水平方向に近い予測方向間の間隔が狭くなるように設定され、垂直方向に近い予測方向であればあるほど、予測モード間の間隔が広くなるように設定される。例えば、図18を参照すれば、dxが2^5、すなわち、32の値を有する場合、dyの値を2、5、9、13、17、21、26、32、−2、−5、−9、−13、−17、−21、−26、−32のように設定することにより、水平方向に近い予測方向間の間隔が狭くなるように設定され、垂直方向に近い予測方向であればあるほど、予測モード間の間隔が広くなるように設定される。
また、dx及びdyのうちいずれか1つの値が固定されたとき、固定されていない残りの値は、予測モード別に大きくなるように設定される。例えば、dyが固定された場合、dx間の間隔が所定値ほど大きくなるように設定される。また、かような増加幅は、水平方向と垂直方向との角度を所定単位に区分し、区分された角度別に設定されもする。例えば、dyが固定された場合、dxの値は、垂直軸との角度が15°以内である区間では、aという増加幅を有し、15°と30°との間では、bという増加幅を有し、30 以上では、cという増加幅を有するように設定される。
一例として、(dx,dy)を利用して、tan−1(dy/dx)の方向性を有する予測モードは、下記表3ないし表5に表記された(dx,dy)パラメータを定義される。
前述のように、(dx,dy)パラメータを利用する各イントラ予測モードは、(j,i)に位置したピクセルの予測子として、左側の周辺ピクセル(−1,i+j*dy/dx)または上側の周辺ピクセル(j+i*dx/dy,−1)を利用する。表2のように、dxまたはdyの値のうち少なくとも一つが2の累乗を有する場合、左側の周辺ピクセル(−1,i+j*dy/dx)及び上側の周辺ピクセル(j+i*dx/dy,−1)の位置は、除算演算なしに、乗算及びシフト演算だけで獲得される。前述の表2による(dx,dy)の値のうち、dxが32である場合のように、dxが2^nの値を有する場合、dxを利用した除算演算は、右側シフト演算で代替されるので、左側の周辺ピクセルの位置は、(i*dy)>>nの値に基づいて、除算演算なしに獲得される。同様に、表2による(dx,dy)の値のうち、dyが32である場合のように、dyが2^mの値を有する場合、dyを利用した除算演算は、右側シフト演算で代替されるので、上側の周辺ピクセルの位置は、(i*dx)>>mの値に基づいて、除算演算なしに獲得される。
図19は、本発明の一実施形態による、33の方向性を有するイントラ予測モードの方向を示した図面である。図19を参照すれば、イントラ予測部410,550は、図示されているような33の方向性を有するイントラ予測モードにより、現在ピクセルの予測子に利用される周辺ピクセルを決定することができる。前述のように、各イントラ予測モードによる方向は、水平方向や垂直方向に近いほど、予測モード間の間隔が狭くなるように設定され、垂直方向や水平方向と遠くなるほど、予測モード間の間隔が広くなるように設定される。
一方、前述の図19に例示されているような多様な方向性を有するイントラ予測モードにより、現在ブロックの参照ピクセルに利用される周辺ピクセルの利用が制限される。例えば、インター予測を介して予測されたインターブロックに含まれた周辺ピクセルである場合、現在ブロックのイントラ予測時に利用が制限される。そのように、インターブロックに含まれた周辺ピクセルの利用を制限する理由は、インターブロックに含まれたエラーの伝播(error propagation)を防止するためである。また、イントラ予測される現在ブロックと異なるスライスに含まれる周辺ブロックは、現在ブロックのイントラ予測時に利用が制限される。他のスライスに含まれた周辺ブロックを、イントラ予測時に利用を制限する理由は、一般的に、映像処理において、スライス単位で映像データをカプセル化(encapsulation)して独立して処理するために、他のスライスに含まれた周辺ブロックのデータは、現在ブロックの参照データとして利用が制限される。従って、本発明の一実施形態によるイントラ予測部410,550は、周辺ピクセルが含まれた周辺ブロックの予測モードまたは周辺ブロックが含まれたスライスが、現在ブロックが属したスライスと同一であるか否かということにより、当該周辺ピクセルを現在ブロックのイントラ予測に利用するか否かということを制限することができる。映像符号化装置400のイントラ予測部410は、インターブロックに含まれた周辺ピクセルを、現在ブロックのイントラ予測に利用するか否かということを示すフラグ(constrained_intra_pred_flag)の値を設定した後、符号化されたビットストリームに、フラグ(constrained_intra_pred_flag)情報を付加することにより、周辺インターブロックに含まれた周辺ピクセルの利用いかんの制限をシグナリングすることができる。例えば、constrained_intra_pred_flagの値が0である場合には、周辺ピクセルが含まれた周辺ブロックの予測モードにかかわりなく、現在ブロックのイントラ予測に利用されるということを示すことができる。constrained_intra_pred_flagの値が1である場合には、インターブロックに含まれた周辺ピクセルに含まれた周辺ピクセルは、現在ブロックのイントラ予測時、利用が制限されるということを示すことができる。また、イントラ予測部410,550は、現在ブロックと異なるスライスに含まれた周辺ブロックのピクセルは、常に現在ブロックのイントラ予測に利用されるものではないと制限することができる。
以下、図20ないし図26を参照し、constrained_intra_pred_flagの値が1である場合、すなわち、インターブロックに含まれた周辺ピクセルは、現在ブロックのイントラ予測時、参照ピクセルとして利用が制限される場合を仮定し、イントラ予測部410,550で、参照ピクセルとして利用が制限された周辺ピクセルを、他の周辺ピクセルに代替する過程について具体的に説明する。また、現在ブロックが属したスライスと異なるスライスに含まれた周辺ブロックのピクセルは、常に現在ブロックのイントラ予測時に利用が制限されるものであると仮定する。
図24は、本発明の一実施形態によるイントラ予測装置の構成を示している。図24のイントラ予測装置2400は、図4及び図5のイントラ予測部410,550に対応する。
図24を参照すれば、イントラ予測装置2400は、利用可能性(availability)判断部2410、代替部2420及びイントラ予測遂行部2430を含む。利用可能性判断部2410は、現在ブロックのイントラ予測に利用される所定個数の周辺ピクセルの利用可能性を判断する。ここで、利用可能性とは、周辺ピクセルが、現在ブロックの参照ピクセルとしてイントラ予測に利用されるか否かということを示す。前述のように、constrained_intra_pred_flagの値が1である場合を仮定するので、インター予測された周辺ブロック、または現在ブロックが属したスライスと異なるスライスに属した周辺ブロックに含まれた周辺ピクセルは、利用不可能であると判断される。従って、利用可能性判断部2410は、現在ブロックと隣接した所定個数の周辺ピクセルのうちインター予測された周辺ブロック、または現在ブロックが属したスライスと異なるスライスに属した周辺ブロックに含まれた周辺ピクセルが存在するか否かということを判断する。周辺ピクセルの個数は、多様な基準によって設定される。例えば、現在ブロックの大きさが、nTxnT(nTは、整数)である場合、現在ブロックの上側及び右上側に位置した2nT個の上側周辺ピクセル、現在ブロックの左側及び左下側に位置した2nT個の左側周辺ピクセル、及び現在ブロックの左上側コーナーに位置した1個の周辺ピクセルを含む総4nT+1個の周辺ピクセルについて、利用可能性いかんが判断される。利用可能性が判断される周辺ピクセルの個数及び位置は、それらに限定されるものではなく、変更される。
もし周辺ピクセルがいずれも利用可能であると判断された場合、符号化側のイントラ予測遂行部2430は、周辺ピクセルをそのまま参照ピクセルとして利用して、図19に例示されているような多様な方向性を有するイントラ予測モードによってイントラ予測を行い、現在ブロックの予測ブロックを生成する。復号化側のイントラ予測遂行部2430は、ビットストリームから抽出された現在ブロックのイントラ予測モードに基づいて、周辺ピクセルをそのまま利用して、現在ブロックに対するイントラ予測を行い、現在ブロックの予測ブロックを生成する。
もし周辺ピクセルが、いずれも利用不可能であると判断された場合、代替部2420は、利用不可能な周辺ピクセルのピクセル値を所定値に代替することができる。ここで、所定値は、ピクセルのビット深度に基づいて決定された値が利用される。ピクセルのビット深度は、1つのピクセルのピクセル値を表現するのに利用されるビット数であり、ビット深度は、8〜14ビットでもある。そのように、可変的なビット深度(BitDepth)は、基本ビット深度(BaseBitDepth)及び可変的なビット深度増加量(increased_bit_depth)を介して、下記数式を介して表現される。
BitDepth=BaseBitDepth+Increased_bit_depth
前述のように、ビット深度が8〜14ビット範囲を有するとすれば、基本ビット深度(BaseBitDepth)は、8の値を有し、ビット深度増加量(increased_bit_depth)は、0〜6の値を有する。代替部2420は、周辺ピクセルがいずれも利用不可能である場合、周辺ピクセルをいずれも(1<<(−1))の値に代替することができる。例えば、ビット深度が8であるとするとき、代替部2420は、周辺ピクセルがいずれも利用不可能である場合、周辺ピクセルをいずれも(1<<(8−1))、すなわち、1x2^7である128のピクセル値を有するように代替することができる。
利用可能性判断部2410で判断した結果、所定個数の周辺ピクセルがいずれも利用不可能である場合ではないが、少なくとも1つの利用不可能な周辺ピクセルが存在する場合、代替部2420は、利用不可能な周辺ピクセルを基準にして、既定方向に所定個数の周辺ピクセルを検索し、利用可能な周辺ピクセルを検索し、利用不可能な周辺ピクセルのピクセル値を、検索された利用可能な周辺ピクセルのピクセル値に代替する。利用不可能な周辺ピクセルを代替する過程については、図20ないし図23を参照して後述する。
イントラ予測遂行部2430は、利用不可能な周辺ピクセルが、利用可能な周辺ピクセルで代替されれば、代替された周辺ピクセル、及び利用可能な原周辺ピクセルを利用して、現在ブロックに対するイントラ予測を行い、現在ブロックの予測ブロックを生成する。
以下、図20ないし図23を参照し、現在ブロックのイントラ予測時、利用不可能な周辺ピクセルを代替する過程について具体的に説明する。
図20は、本発明の一実施形態により、周辺ブロックの類型によって、現在ブロックのイントラ予測時、利用不可能な周辺ピクセルを示した図面である。図20を参照すれば、現在ブロック2000の大きさをnTxnTとするとき、利用可能性判断部2410は、現在ブロックの上側及び右上側に位置した2nT個の上側周辺ピクセルが含まれた周辺ブロックA,B,C,D,Eが、インターブロックであるか、あるいは現在ブロック2000が属したスライスと異なるスライスに含まれたブロックであるかということを判断する。また、利用可能性判断部2410は、現在ブロック2000の左側及び左下側に位置した2nT個の左側周辺ピクセルが含まれた周辺ブロックG,H,I,J,K、及び現在ブロック2000の左上側コーナーに位置した1個の周辺ピクセルを含む周辺ブロックFが、インターブロックであるか、あるいは現在ブロック2000が属したスライスと異なるスライスに含まれたブロックであるかということを判断する。
利用可能性判断部2410は、周辺ブロックAないしKのうち、インターブロックであるか、あるいは現在ブロック2000が属したスライスと異なるスライスに含まれたブロックに含まれた周辺ピクセルを、利用不可能な周辺ピクセルと判断する。図20で、周辺ブロックA,B,D,E,F,H,Iが、インター予測されたインターブロックであるので、利用可能性判断部2410は、インター予測された周辺ブロックA,B,D,E,F,H,Iに含まれた周辺ピクセル2011,2012,2013を利用不可能な周辺ピクセルと判断する。前述のように、代替部2420は、利用不可能な周辺ピクセルを基準にして、既定方向に周辺ピクセルを検索し、利用不可能な周辺ピクセルのピクセル値を、利用可能な周辺ピクセルに代替する過程を遂行する。
具体的には、本発明の実施形態による利用可能性判断部2410は、周辺ピクセルのうち、既定位置の周辺ピクセル(以下、「第1周辺ピクセル」とする)の利用可能性いかんをまず判断する。代替部2420は、第1周辺ピクセルが利用不可能である場合、既定方向に周辺ピクセルを検索し、利用可能な第2周辺ピクセルを検索する。また、代替部2420は、検索された利用可能な第2周辺ピクセルを利用して、第1周辺ピクセルを代替する。
第1周辺ピクセルを除いた残りの利用不可能な周辺ピクセル(以下、「第3周辺ピクセル」とする)は、既定方向に基づいて、以前に処理されて代替されたり、あるいは本来利用可能な周辺ピクセルを利用して代替される。利用不可能な第3周辺ピクセルは、第2周辺ピクセルの検索に利用された検索順序によって順次に代替される。第1周辺ピクセルが利用可能である場合、第1周辺ピクセルの代替過程は、スキップされ、第3周辺ピクセルの代替過程のみ遂行される。
下記の図21ないし図23において、現在ブロック2100,2200,2300の大きさは、nTxnTであり、現在ブロック2100,2200,2300のイントラ予測のために、利用可能性いかんが判断される周辺ピクセルは、P(x,y)(x=−1、y=−1,…,2nT−1;x=0,…,2nT−1、y=1)と仮定する。
図21は、本発明の一実施形態による、利用不可能な周辺ピクセルを代替する過程について説明するための図面である。図21を参照すれば、周辺ピクセルのうち、最初に利用可能性いかんが判断される第1周辺ピクセルが、現在ブロック2100の左上側コーナーに位置した周辺ピクセルP(−1,−1)2110であると仮定する。利用可能性判断部2410は、周辺ピクセルP(−1,−1)2110の利用可能性いかんをまず判断する。代替部2420は、周辺ピクセルP(−1,−1)2110が利用不可能であると判断された場合、周辺ピクセルP(−1,−1)2110を基準にして、既定方向に沿って、順次に周辺ピクセルのうち利用可能な周辺ピクセルを検索し、最初に検索された利用可能な周辺ピクセル(以下、「第2周辺ピクセル」とする)を利用して、第1周辺ピクセルを代替する。例えば、代替部2420は、周辺ピクセルP(−1,−1)2110を基準にして、左側から、右側方向の第1検索方向に沿って、現在ブロック2100の上側及び右上側の周辺ピクセルを検索し、現在ブロック2100の上側及び右上側の周辺ピクセルのうち、利用可能な第2周辺ピクセルが存在しない場合、第1周辺ピクセルP(−1,−1)2110を基準にして、上側から下側の方向に、現在ブロック2100の左側及び左下側の周辺ピクセルを検索し、利用可能な第2周辺ピクセルを検索する。代替部2420は、かような検索方向及び順序によって、最初に検索された利用可能な第2周辺ピクセルを利用して、第1周辺ピクセルであるP(−1,−1)2110を代替する。例えば、上側及び右上側の周辺ピクセルのうち、P(nT−2,−1)2120が最初に検索された利用可能な第2周辺ピクセルであると仮定すれば、代替部2420は、第1周辺ピクセルP(−1,−1)2110のピクセル値を、P(nT−2,−1)2120のピクセル値に代替する。
代替部2420は、第1周辺ピクセルP(−1,−1)2110を除いた残りの利用不可能な第3周辺ピクセルを、既定の検索方向に基づいて、以前に処理されて代替された周辺ピクセル、または本来利用可能な周辺ピクセルに代替する。例えば、代替部2420は、第1周辺ピクセルP(−1,−1)2110を、利用可能な周辺ピクセルP(nT−2,−1)2120で代替した後、利用不可能な次の周辺ピクセルP(0,−1)の値を、第1周辺ピクセルP(−1,−1)2110に代替する。第1周辺ピクセルP(−1,−1)2110は、利用可能な周辺ピクセルP(nT−2,−1)2120に代替されたために、周辺ピクセルP(0,−1)の値も、周辺ピクセルP(nT−2,−1)2120の値と同一の値を有することになる。もし第1周辺ピクセルP(−1,−1)2110が、本来利用可能である場合には、第1周辺ピクセルP(−1,−1)2110の代替過程は、スキップされるので、代替部2420は、本来の第1周辺ピクセルP(−1,−1)2110のピクセル値を利用して、周辺ピクセルP(0,−1)の値を代替する。周辺ピクセルP(1,−1)の値は、以前に処理された周辺ピクセルP(0,−1)の値を利用して代替される。
かような代替過程は、利用不可能な全ての第3周辺ピクセルに対して反復される。図21で、上側に位置した周辺ピクセルのうち、利用可能な周辺ピクセルであるP(nT−2,−1)2120は、代替されずに、本来のピクセル値が維持される。そのように、代替部2420は、上側の利用不可能な周辺ピクセルを、既定の検索方向に沿って、以前に代替されたり、あるいは本来利用可能な周辺ピクセルに代替する。すなわち、代替部2420は、第1周辺ピクセルP(−1,−1)2110、及び本来利用可能な周辺ピクセルを除き、検索方向が左側から右側であるとするとき、利用不可能な第3周辺ピクセルを、すぐ左側の周辺ピクセルの値に代替する。そのように、上側に複数個の第3周辺ピクセルが存在する場合、代替部2420は、左側から右側の方向に、複数個の第3周辺ピクセルそれぞれを、左側の周辺ピクセルを利用して順次に代替する。そのとき、第3周辺ピクセルを代替するのに利用される左側の周辺ピクセルは、以前に代替されたり、あるいは本来利用可能な周辺ピクセルでもある。同様に、代替部2420は、現在ブロック2100の左側及び左下側に位置した周辺ピクセルのうち、利用不可能な第3周辺ピクセルを、すぐ上側の周辺ピクセルの値を利用して代替する。例えば、代替部2420は、利用不可能な周辺ピクセルP(−1,0)の値を、第1周辺ピクセルP(−1,−1)2110に代替する。前述のように、もし第1周辺ピクセルP(−1,−1)2110が、本来利用可能である場合には、第1周辺ピクセルP(−1,−1)2110の代替過程は、スキップされるので、代替部2420は、本来の第1周辺ピクセルP(−1,−1)2110のピクセル値を利用して、周辺ピクセルP(−1,0)の値を代替する。周辺ピクセルP(−1,1)の値は、以前に処理された周辺ピクセルP(−1,0)の値を利用して代替される。前述の上側の第3周辺ピクセルを代替する過程と同様に、左側に、複数個の第3周辺ピクセルが存在する場合、代替部2420は、上側から下側の方向に複数個の第3周辺ピクセルそれぞれを、上側の周辺ピクセルを利用して順次に代替する。そのとき、第3周辺ピクセルを代替するのに利用される上側の周辺ピクセルは、以前に代替されたり、あるいは本来利用可能な周辺ピクセルでもある。
かような代替過程は、利用不可能な左側及び左下側の全ての第3周辺ピクセルに対して反復される。左側に位置した周辺ピクセルのうち、利用可能な周辺ピクセルであるP(−1,nT+1)2130は、代替されずに、本来のピクセル値が維持される。そのように、代替部2420は、左側の利用不可能な周辺ピクセルを、既定の検索方向に沿って、以前に代替されたり、あるいは本来利用可能な周辺ピクセルに代替する。すなわち、検索方向が上側から下側であるとするとき、代替部2420は、利用不可能な第3周辺ピクセルを、すぐ上側の周辺ピクセルの値に代替する。一方、代替部2420は、現在ブロック2100の上側及び左側で利用可能な周辺ピクセルがいずれも検索された場合、検索された上側及び左側で利用可能な周辺ピクセルの平均値を利用して、第1周辺ピクセルP(−1,−1)2110を代替することができる。例えば、図21で、上側周辺ピクセルのうち、最初に検索された利用可能な周辺ピクセルP(nT−2,−1)2120、及び左側周辺ピクセルのうち、最初に検索された利用可能な周辺ピクセルP(−1,nT+1)2130の平均値を利用して、第1周辺ピクセルP(−1,−1)2110を代替することができる。すなわち、周辺ピクセルP(nT−2,−1)2120のピクセル値をPRA、周辺ピクセルP(−1,nT+1)2130のピクセル値をPLBとすれば、次の数式を介して獲得された平均値PTを、第1周辺ピクセルP(−1,−1)2110のピクセル値に代替することができる。
PT=(PRA+PLB+1)>>1
また、代替部2420は、現在ブロック2100の上側及び左側で利用可能な周辺ピクセルがいずれも検索された場合、既定の検索方向に沿って、最初に検索された周辺ピクセルのみを利用するのではなく、第1周辺ピクセルP(−1,−1)2110との距離に基づいて、第1周辺ピクセルP(−1,−1)2110にさらに近い利用可能な周辺ピクセルを、第2周辺ピクセルと決定し、第1周辺ピクセルP(−1,−1)2110を代替することができる。図21で、第1周辺ピクセルP(−1,−1)2110と、上側の利用可能な最初検索された周辺ピクセルP(nT−2,−1)2120との距離は、(nT−2)−(−1)、すなわち、nT−1であり、第1周辺ピクセルP(−1,−1)2110と、左側の利用可能な最初検索された周辺ピクセルP(−1,nT+1)2120との距離は、(nT+1)−(−1)、すなわち、nT+2であるので、代替部2420は、さらに近い上側の周辺ピクセルP(nT−2,−1)2120を利用して、第1周辺ピクセルP(−1,−1)2110を代替することができる。
一方、代替部2420は、現在ブロック2100の第1周辺ピクセルP(−1,−1)2110を代替するための第2周辺ピクセルを検索する過程の複雑度を低減させるために、現在ブロックの上側及び左側の全てのピクセルを検索する代わりに、第1周辺ピクセルP(−1,−1)2110とすぐ隣接したP(−1,0)及びP(0,−1)のみを検索し、P(−1,0)及びP(0,−1)のうち利用可能な隣接周辺ピクセルを利用して、第1周辺ピクセルP(−1,−1)2110を代替することができる。例えば、代替部2420は、P(−1,0)及びP(0,−1)の順序で、またはP(0,−1)及びP(−1,0)の順序で、隣接周辺ピクセルを検索し、まず検索された利用可能な隣接周辺ピクセルの値で、第1周辺ピクセルP(−1,−1)2110を代替することができる。もし代替部2420は、P(−1,0)及びP(0,−1)のうち利用可能な周辺ピクセルが検索されない場合、前述のように、ビット深度に基づく所定の値で、第1周辺ピクセルP(−1,−1)2110を代替することができる。代替部2420は、P(−1,0)及びP(0,−1)がいずれも利用可能である場合、P(−1,0)及びP(0,−1)の平均値を利用して、第1周辺ピクセルP(−1,−1)2110を代替することができる。
一方、前述の代替部2420で行われる上側周辺ピクセル及び左側周辺ピクセル検索の順序及び方向は、変更される。すなわち、代替部2420は、まず現在ブロック2100の左側及び左下側の周辺ピクセルを検索し、利用可能な周辺ピクセルが存在しない場合、次に上側及び右上側の周辺ピクセルを検索することができる。また、代替部2420は、左側及び左下側の周辺ピクセルを検索するとき、上側から下側の方向に利用可能な周辺ピクセルを検索する代わりに、下側から上側の方向に、利用可能な周辺ピクセルを検索することができる。また、代替部2420は、上側及び右上側の周辺ピクセルを検索するとき、左側から右側の方向に利用可能な周辺ピクセルを検索する代わりに、右側から左側の方向に、利用可能な周辺ピクセルを検索することができる。
また、代替部2420は、第1周辺ピクセルP(−1,−1)2110を代替するために、最初に検索された上側または左側の利用可能な周辺ピクセルのうち、最初に検索された周辺ピクセルを利用する代わりに、現在ブロック2100の上側及び右上側、左側及び左上側の周辺ピクセルのうち、利用可能な全ての周辺ピクセルのピクセル値の平均値を利用して、第1周辺ピクセルP(−1,−1)2110を代替することができる。
図22は、本発明の他の実施形態による、利用不可能な周辺ピクセルを代替する過程について説明するための図面である。図22を参照すれば、本発明の他の実施形態において、周辺ピクセルのうち最初に利用可能性いかんが判断される第1周辺ピクセルが、現在ブロック2200の最左下側に位置した周辺ピクセルP(−1,2nT−1)2210であると仮定する。すなわち、利用可能性判断部2410は、周辺ピクセルP(−1,2nT−1)2210の利用可能性いかんをまず判断する。代替部2420は、第1周辺ピクセルP(−1,2nT−1)2210が利用不可能であると判断された場合、P(−1,2nT−1)2210を基準にして、既定方向に沿って、順次に周辺ピクセルのうち、利用可能な周辺ピクセルを検索し、最初に検索された利用可能な第2周辺ピクセルを利用して、第1周辺ピクセルP(−1,2nT−1)2210を代替する。例えば、代替部2420は、第1周辺ピクセルP(−1,2nT−1)2210を基準にして、下側から上側の方向の第1検索方向に沿って、現在ブロック2200の左側及び左下側の周辺ピクセルを検索し、現在ブロック2200の左側及び左下側の周辺ピクセルのうち、利用可能な第2周辺ピクセルが存在しない場合、左側から右側の方向の第2検索方向に沿って、現在ブロック2200の上側及び右上側の周辺ピクセルを検索し、利用可能な第2周辺ピクセルを検索する。代替部2420は、かような検索方向及び順序によって、最初に検索された利用可能な第2周辺ピクセルを利用して、第1周辺ピクセルP(−1,2nT−1)2210を代替する。例えば、検索順序によって、左側の周辺ピクセルのうち、P(−1,nT−2)2220が利用可能な最初に検索された第2周辺ピクセルであるとすれば、代替部2420は、第1周辺ピクセルP(−1,2nT−1)2210のピクセル値を、P(−1,nT−2)2220のピクセル値に代替する。
前述の本発明の一実施形態と同様に、代替部2420は、P(−1,2nT−1)2210を除いた残りの利用不可能な第3周辺ピクセルを、既定の検索方向に基づいて、以前に処理されて代替されたり、あるいは本来利用可能な周辺ピクセルに代替する。例えば、代替部2420は、第1周辺ピクセルP(−1,2nT−1)2210を、利用可能な周辺ピクセルP(−1,nT−2)2220で代替した後、利用不可能な次の周辺ピクセルP(−1,2nT−2)の値は、第1周辺ピクセルP(−1,2nT−1)2210に代替する。もし第1周辺ピクセルP(−1,2nT−1)2210が、本来利用可能である場合には、第1周辺ピクセルP(−1,2nT−1)2210の代替過程は、スキップされるので、代替部2420は、本来の第1周辺ピクセルP(−1,2nT−1)2210のピクセル値を利用して、周辺ピクセルP(−1,2nT−2)の値を代替する。
かような代替過程は、利用不可能な全ての第3周辺ピクセルに対して反復される。図22で、左側及び上側に位置した周辺ピクセルのうち、利用可能な周辺ピクセルであるP(−1,nT−2)2220及びP(nT+1,−1)(2230)は、代替されずに、本来のピクセル値が維持される。そのように、代替部2420は、最左下側の第1周辺ピクセルP(−1,2nT−1)2210を基準にして、下側から上側の方向、左側から右側の方向に、現在ブロック2200の左側及び上側の周辺ピクセルを検索し、利用不可能な第3周辺ピクセルを、すぐ下側の周辺ピクセルまたは左側の周辺ピクセルに代替する。すなわち、代替部2420は、第1周辺ピクセルP(−1,2nT−1)2210、及び本来利用可能な周辺ピクセルを除き、左側及び左下側に位置した利用不可能な第3周辺ピクセルを、すぐ下の周辺ピクセルに代替して、上側及び右上側に位置した利用不可能な第3周辺ピクセルを、すぐ左側の周辺ピクセルに代替する。そのように、左側に位置した複数個の第3周辺ピクセルに対して、代替部2420は、下側から上側の方向に、複数個の第3周辺ピクセルそれぞれを、下側の周辺ピクセルを利用して順次に代替し、上側に位置した複数個の第3周辺ピクセルに対して代替部2420は、左側から右側の方向に、複数個の第3周辺ピクセルそれぞれを、左側の周辺ピクセルを利用して代替する。前述のように、代替に利用される下側または左側の周辺ピクセルは、以前に代替されたり、あるいは本来利用可能な周辺ピクセルでもある。
前述のように、代替部2420で行われる上側周辺ピクセル及び左側周辺ピクセル検索の順序及び方向は、変更されてもよい。すなわち、代替部2420は、まず現在ブロック2200の上側及び右上側の周辺ピクセルを、右側から左側の方向に検索し、利用可能な周辺ピクセルが存在しない場合、左側及び左下側の周辺ピクセルを、上側から下側の方向に検索することにより、第1周辺ピクセルP(−1,2nT−1)2210を代替するための第2周辺ピクセルを検索することができる。
図23は、本発明のさらに他の実施形態による、利用不可能な周辺ピクセルを代替する過程について説明するための図面である。図23を参照すれば、本発明のさらに他の実施形態において、周辺ピクセルのうち、最初に利用可能性いかんが判断される第1周辺ピクセルが、現在ブロック2300の最右上側に位置した周辺ピクセルP(2nT−1,−1)2310であると仮定する。すなわち、利用可能性判断部2410は、周辺ピクセルP(2nT−1,−1)2310の利用可能性いかんをまず判断する。代替部2420は、第1周辺ピクセルP(2nT−1,−1)2310が利用不可能であると判断された場合、P(2nT−1,−1)2310を基準にして、既定方向に沿って、順次に周辺ピクセルのうち、利用可能な周辺ピクセルを検索し、最初に検索された利用可能な第2周辺ピクセルを利用して、第1周辺ピクセルP(2nT−1,−1)2310を代替する。例えば、代替部2420は、第1周辺ピクセルP(2nT−1,−1)2310を基準にして、右側から左側の方向の第1検索方向に沿って、現在ブロック2300の上側及び右上側の周辺ピクセルを検索し、現在ブロック2300の上側及び右上側の周辺ピクセルのうち、利用可能な第2周辺ピクセルが存在しない場合、上側から下側の方向に、現在ブロック2300の左側及び左下側の周辺ピクセルを検索し、利用可能な第2周辺ピクセルを検索する。代替部2420は、かような検索方向及び順序によって、最初に検索された利用可能な第2周辺ピクセルを利用して、第1周辺ピクセルP(2nT−1,−1)2310を代替する。例えば、検索順序によって、上側の周辺ピクセルのうち、P(nT+1,−1)(2320)が利用可能な最初に検索された第2周辺ピクセルであるとすれば、代替部2420は、第1周辺ピクセルP(2nT−1,−1)2310のピクセル値を、P(nT+1,−1)(2320)のピクセル値に代替する。
また、代替部2420は、第1周辺ピクセルP(2nT−1,−1)2310を除いた残りの利用不可能な第3周辺ピクセルを、既定の検索方向に基づいて、以前に処理されて代替されたり、あるいは本来利用可能な周辺ピクセルに代替する。例えば、代替部2420は、第1周辺ピクセルP(2nT−1,−1)2310を、利用可能な周辺ピクセルP(nT+1,−1)(2320)で代替した後、利用不可能な次の周辺ピクセルP(2nT−2,−1)の値は、第1周辺ピクセルP(2nT−1,−1)2310に代替する。
もし第1周辺ピクセルP(2nT−1,−1)2310が、本来利用可能である場合には、第1周辺ピクセルP(2nT−1,−1)2310の代替過程は、スキップされるので、代替部2420は、本来の第1周辺ピクセルP(2nT−1,−1)2310のピクセル値を利用して、周辺ピクセルP(2nT−2,−1)の値を代替する。
かような代替過程は、利用不可能な全ての第3周辺ピクセルに対して反復される。図23で、左側及び上側に位置した周辺ピクセルのうち、利用可能な周辺ピクセルであるP(nT+1,−1)2320及びP(−1,nT−1)2330は、代替されずに、本来のピクセル値が維持される。そのように、代替部2420は、最右上側の第1周辺ピクセルP(2nT−1,−1)2310を基準にして、右側から左側の方向、上側から下側の方向に、現在ブロック2300の上側及び左側の周辺ピクセルを検索し、利用不可能な第3周辺ピクセルを、すぐ右側の周辺ピクセルまたは上側の周辺ピクセルで順次に代替する。すなわち、代替部2420は、第1周辺ピクセルP(2nT−1,−1)2310、及び本来利用可能な周辺ピクセルを除き、上側及び右上側に位置した利用不可能な第3周辺ピクセルを、すぐ左側の周辺ピクセルに代替し、左側及び左下側に位置した利用不可能な第3周辺ピクセルを、すぐ上側の周辺ピクセルで順次に代替する。
前述のように、代替部2420で行われる上側周辺ピクセル及び左側周辺ピクセル検索の順序及び方向は、変更される。すなわち、代替部2420は、まず現在ブロック2300の左側及び左下側の周辺ピクセルを、下側から上側の方向に検索し、利用可能な周辺ピクセルが存在しない場合、上側及び右上側の周辺ピクセルを、左側から右側の方向に検索することにより、第1周辺ピクセルP(2nT−1,−1)2310を代替するための第2周辺ピクセルを検索することができる。
一方、周辺ピクセルのうち、利用不可能な周辺ピクセルを代替する過程が完了すれば、次に、周辺ピクセルに対するフィルタリング過程が遂行される。フィルタリングされた周辺ピクセルを利用するか否かということは、現在ブロックの大きさに基づいて決定される。例えば、フィルタリングされた周辺ピクセルは、現在ブロックの大きさが、16x16以上である場合にのみ利用される。
図25Aは、現在ブロック周辺のフィルタリングされる周辺ピクセルを示した図面である。図25Aを参照すれば、現在ブロック2500の上側のX個の周辺ピクセル2510、及び左側のY個の周辺ピクセル2520に対して、少なくとも1回以上のフィルタリングが行われ、フィルタリングされた周辺ピクセルが、現在ブロック2500のイントラ予測に利用される。ここで、現在ブロック2500の大きさを、nTxnTとすれば、X=2nT、Y=2nTであることが望ましい。
nTxnTサイズの現在ブロック2500の上側と左側とに隣接したX+Y個の原周辺ピクセルが、ContextOrg[n](nは、0からX+Y−1までの整数)であり、左側の周辺ピクセルのうち、最下端の周辺ピクセルがn=0である場合、すなわち、ContextOrg[0]であり、上側の周辺ピクセルのうち、最右側の周辺ピクセルがn=X+Y−1、すなわち、ContextOrg[X+Y−1]であると仮定する。
図25Bは、現在ブロックの周辺ピクセルのフィルタリング過程について説明するための参照図である。図25Bを参照すれば、現在ブロックの上側と左側とに隣接した周辺ピクセルが、ContextOrg[n](nは、0から4nT−1までの整数)であるとすれば、周辺ピクセル間の加重平均値を介して、周辺ピクセルがフィルタリングされる。1回フィルタリングされた周辺ピクセルを、ContextFiltered1[n]とすれば、次の数式のように、周辺ピクセル(ContextOrg[n])に、3タップフィルタを適用してフィルタリングされた周辺ピクセルが獲得される。
ContextFiltered1[n]=(ContextOrg[n−1]+2*ContextOrg[n]+ContextOrg[n+1])/4
同様に、1回フィルタリングされた周辺ピクセル(ContextFiltered1[n])間の加重平均値をさらに計算し、2回フィルタリングされた周辺ピクセル(ContextFiltered2[n])が生成されもする。例えば、次の数式のようにフィルタリングされた周辺ピクセル(ContextFiltered1[n])に、3タップフィルタを適用し、2回フィルタリングされた周辺ピクセルが生成されもする。
ContextFiltered2[n]=(ContextFiltered1[n−1]+2*ContextFiltered1[n]+ContextFiltered1[n+1])/4
フィルタリングに利用されるフィルタ及びフィルタリング回数は、変更されてもよい。
図26は、本発明の一実施形態によるビデオのイントラ予測方法を示したフローチャートである。段階2610で、利用可能性判断部2410は、ビデオを構成するピクチャを階層的構造に分割したブロックのうち、現在ブロックのイントラ予測に利用される所定個数の周辺ピクセルの利用可能性を判断する。前述のように、利用可能性判断部2410は、現在ブロックの所定個数の周辺ピクセルのうち、インター予測された周辺ブロック、または現在ブロックが属したスライスと異なるスライスに属した周辺ブロックに含まれた周辺ピクセルが存在する場合、当該周辺ピクセルを利用不可能な周辺ピクセルと判断する。
段階2620で、代替部2420は、所定個数の周辺ピクセルのうち、利用不可能な第1周辺ピクセルが存在する場合、第1周辺ピクセルを基準にして、既定方向に、所定個数の周辺ピクセルを検索し、利用可能な第2周辺ピクセルを検索する。段階2630で、代替部2420は、第1周辺ピクセルのピクセル値を、検索された第2周辺ピクセルのピクセル値に代替する。もし所定位置の第1周辺ピクセルが利用可能である場合であるならば、本来の第1周辺ピクセルが、現在ブロックのイントラ予測のための参照ピクセルに利用され、代替過程は、スキップされる。そのように、第1周辺ピクセルが利用可能ではなく、第2周辺ピクセルで代替されたり、あるいは本来の第1周辺ピクセルが利用可能なように、代替過程がスキップされた場合、周辺ピクセルのうち、利用不可能な第3周辺ピクセルに対する代替過程が遂行される。
前述のように、本発明の一実施形態による代替部2420は、現在ブロックの最左上側コーナーに位置した第1周辺ピクセルの利用可能性いかんを判断し、第1周辺ピクセルが利用不可能である場合、上側及び右上側の周辺ピクセルを、第1周辺ピクセルを基準にして、左側から右側の方向に検索し、利用可能な第2周辺ピクセルを検索し、上側及び右上側の周辺ピクセルのうち、利用可能な第2周辺ピクセルが存在しない場合には、左側及び左下側の周辺ピクセルを、第1周辺ピクセルを基準にして、上側から下側の方向に検索し、利用可能な第2周辺ピクセルを検索する。本発明の一実施形態による代替部2420は、かような検索方向及び順序によって、最初に検索された利用可能な周辺ピクセルを、第2周辺ピクセルとして決定する。また、代替部2420は、第1周辺ピクセルのピクセル値を、第2周辺ピクセルのピクセル値に代替する。また、代替部2420は、第1周辺ピクセル及び本来利用可能な周辺ピクセルを除き、左側及び左下側に位置した利用不可能な第3周辺ピクセルを、すぐ上側の周辺ピクセルに代替し、上側及び右上側に位置した利用不可能な第3周辺ピクセルを、すぐ左側の周辺ピクセルに代替する。すなわち、代替部2420は、所定位置の第1周辺ピクセルを除き、他の位置の利用不可能な第3周辺ピクセルについては、所定方向にすぐ隣接した周辺ピクセルを利用した代替過程を遂行する。
本発明の他の実施形態による代替部2420は、現在ブロックの最左下側に位置した第1周辺ピクセルの利用可能性いかんを判断し、第1周辺ピクセルが利用不可能である場合、第1周辺ピクセルを基準にして、左側及び左下側の周辺ピクセルを、下側から上側の方向に検索し、最初に検索された利用可能な周辺ピクセルを、第2周辺ピクセルとして決定する。左側及び左下側の周辺ピクセルのうち、利用可能な第2周辺ピクセルが存在しない場合、代替部2420は、左側から右側の方向に、上側及び右上側の周辺ピクセルを検索し、最初に検索された利用可能な周辺ピクセルを、第2周辺ピクセルとして決定する。また、代替部2420は、第1周辺ピクセルのピクセル値を、第2周辺ピクセルのピクセル値に代替する。また、代替部2420は、第1周辺ピクセル及び本来利用可能な周辺ピクセルを除き、左側及び左下側に位置した利用不可能な第3周辺ピクセルを、すぐ下の周辺ピクセルで順次に代替し、上側及び右上側に位置した利用不可能な第3周辺ピクセルを、すぐ左側の周辺ピクセルで順次に代替する。すなわち、代替部2420は、所定位置の第1周辺ピクセルを除き、他の位置の利用不可能な第3周辺ピクセルについては、所定方向にすぐ隣接した周辺ピクセルを利用した代替過程を遂行する。
本発明のさらに他の実施形態による代替部2420は、現在ブロックの最右上側に位置した第1周辺ピクセルの利用可能性いかんを判断し、第1周辺ピクセルが利用不可能である場合、第1周辺ピクセルを基準にして、右側から左側の方向に、上側及び右上側の周辺ピクセルを検索し、最初に検索された利用可能な周辺ピクセルを、第2周辺ピクセルとして決定する。上側及び右上側の周辺ピクセルのうち、利用可能な第2周辺ピクセルが存在しない場合、代替部2420は、左側及び左下側の周辺ピクセルを、上側から下側の方向に検索し、最初に検索された利用可能な周辺ピクセルを、第2周辺ピクセルとして決定する。また、代替部2420は、第1周辺ピクセルのピクセル値を、第2周辺ピクセルのピクセル値に代替する。また、代替部2420は、第1周辺ピクセル及び本来利用可能な周辺ピクセルを除き、上側及び右上側に位置した利用不可能な第3周辺ピクセルを、すぐ右側の周辺ピクセルに代替し、左側及び左下側に位置した利用不可能な第3周辺ピクセルを、すぐ上側の周辺ピクセルに代替する。すなわち、代替部2420は、所定位置の第1周辺ピクセルを除き、他の位置の利用不可能な第3周辺ピクセルについては、所定方向にすぐ隣接した周辺ピクセルを利用した代替過程を遂行する。段階2640で、イントラ予測遂行部2430は、利用可能性いかんによって代替された周辺ピクセル及び原周辺ピクセルを利用して、現在ブロックに対するイントラ予測を行う。
前述の本発明によれば、利用不可能な周辺ピクセルを、既定の検索方向に基づいて、利用可能な周辺ピクセルを検索し、代替過程に利用することにより、イントラ予測に利用される参照ピクセルを決定する過程の複雑度を低減させることができる。
図1ないし図26を参照して説明したイントラ予測方法を具現するためのプログラムは、コンピュータで読み取り可能な記録媒体に保存することにより、独立したコンピュータシステムが、前記記録媒体に保存された実施形態による動作を容易に具現することができる。
一実施形態によるプログラムが保存されるコンピュータで読み取り可能な記録媒体がディスク26000である実施形態について以下で説明する。
図27Aは、一実施形態によるプログラムが保存されたディスク26000の物理的構造を例示している。記録媒体として説明したディスク26000は、ハードドライブ、CD(compact disc)−ROM(read-only memory)ディスク、ブルーレイ(登録商標:Blu-ray)ディスク、DVD(digital versatile disc)でもある。ディスク26000は、多数の同心円のトラックTrにより構成され、トラックTrは、円周方向に沿って、所定個数のセクタSeに分割される。前述の一実施形態によるプログラムを保存するディスク26000において、特定領域に、前述のイントラ予測方法を具現するためのプログラムが割り当てられて保存される。
前述のイントラ予測方法を具現するためのプログラムを保存する記録媒体を利用して達成されたコンピュータシステムについて、図27Bを参照して説明するする。
図27Bは、ディスク26000を利用して、プログラムを記録して判読するためのディスクドライブ26300を図示している。コンピュータシステム26500は、ディスクドライブ26300を利用して、本発明のイントラ予測方法を具現するためのプログラムを、ディスク26000に保存することができる。ディスク26000に保存されたプログラムを、コンピュータシステム26500上で実行するために、ディスクドライブ26300によって、ディスク26000からプログラムが判読され、プログラムがコンピュータシステム26500に伝送される。
図27A及び図27Bで例示されたディスク26000だけではなく、メモリカード、ROMカセット、SSD(solid state drive)にも、本発明のイントラ予測方法を具現するためのプログラムが保存される。
前述の実施形態によるイントラ予測方法が適用されたシステムについて説明する。
図28は、コンテンツ流通サービス(content distribution service)を提供するためのコンテンツ供給システム(content supply system)11000の全体的構造を図示している。通信システムのサービス領域は、所定サイズのセルに分割され、各セルに、ベースステーションになる無線基地局11700,11800,11900,12000が設けられる。
コンテンツ供給システム11000は、複数の独立デバイスを含む。例えば、コンピュータ12100、PDA(personal digital assistant)12200、カメラ12300及び携帯電話12500のような独立デバイスが、インターネットサービス供給者11200、通信網11400及び無線基地局11700,11800,11900,12000を経て、インターネット11100に連結される。
しかし、コンテンツ供給システム11000は、図28に図示された構造のみに限定されるものではなく、デバイスが選択的に連結される。独立デバイスは、無線基地局11700,11800,11900,12000を経ずに、通信網11400に直接連結されもする。
ビデオカメラ12300は、デジタルビデオカメラのように、ビデオ映像を撮影することができる撮像デバイスである。携帯電話12500は、PDC(personal digital communications)、CDMA(code division multiple access)、W−CDMA(wideband code division multiple access)、GSM((登録商標)global system for mobile communications)及びPHS(personal handyphone system)の各方式のような多様なプロトコルのうち、少なくとも1つの通信方式を採択することができる。
ビデオカメラ12300は、無線基地局11900及び通信網11400を経て、ストリーミングサーバ11300に連結される。ストリーミングサーバ11300は、ユーザが、ビデオカメラ12300を使用して伝送したコンテンツを、リアルタイム放送でストリーミング伝送することができる。ビデオカメラ12300から受信されたコンテンツは、ビデオカメラ12300またはストリーミングサーバ11300によって符号化される。ビデオカメラ12300で撮影されたビデオデータは、コンピュータ12100を経て、ストリーミングサーバ11300に伝送されもする。
カメラ12600で撮影されたビデオデータも、コンピュータ12100を経て、ストリーミングサーバ11300に伝送される。カメラ12600は、デジタルカメラのように、静止映像及びビデオ映像をいずれも撮影することができる撮像装置である。カメラ12600から受信されたビデオデータは、カメラ12600またはコンピュータ12100によって符号化される。ビデオ符号化及び復号化のためのソフトウェアは、コンピュータ12100がアクセスすることができるCD−ROMディスク、フロッピー(登録商標)ディスク、ハードディスクドライブ、SSD(solid state drive)、メモリカードのようなコンピュータで読み取り可能な記録媒体に保存される。
また、携帯電話12500に搭載されたカメラによってビデオが撮影された場合、ビデオデータが携帯電話12500から受信される。
ビデオデータは、ビデオカメラ12300、携帯電話12500またはカメラ12600に搭載されたLSI(large scale integrated circuit)システムによって符号化される。
一実施形態によるコンテンツ供給システム11000で、例えば、コンサートの現場録画コンテンツのように、ユーザが、ビデオカメラ12300、カメラ12600、携帯電話12500または他の撮像デバイスを利用して録画したコンテンツが符号化され、ストリーミングサーバ11300に伝送される。ストリーミングサーバ11300は、コンテンツデータを要請した他のクライアントに、該コンテンツデータをストリーミング伝送することができる。
クライアントは、符号化されたコンテンツデータを復号化することができるデバイスであり、例えば、コンピュータ12100、PDA 12200、ビデオカメラ12300または携帯電話12500でもある。従って、コンテンツ供給システム11000は、クライアントをして、符号化されたコンテンツデータを受信して再生させる。また、コンテンツ供給システム11000は、クライアントをして、符号化されたコンテンツデータを受信し、リアルタイムで復号化して再生させ、個人放送(personal broadcasting)を可能にさせる。
コンテンツ供給システム11000に含まれた独立デバイスの符号化動作及び復号化動作に、本発明のイントラ予測方法が適用される。
図29及び図30を参照し、コンテンツ供給システム11000において、携帯電話12500の一実施形態について詳細に説明する。
図29は、一実施形態による本発明のイントラ予測方法が適用される携帯電話12500の外部構造を図示している。携帯電話12500は、機能が制限されておらず、応用プログラムを介して、相当部分の機能を変更したり、あるいは拡張することができるスマトホンでもある。
携帯電話12500は、無線基地局12000とRF(radio frequency)信号を交換するための内蔵アンテナ12510を含み、カメラ12530によって撮影された映像、またはアンテナ12510によって受信されて復号化された映像をディスプレイするためのLCD(liquid crystal display)画面、OLED(organic light emitting diode)画面のようなディスプレイ画面12520を含む。スマートホン12510は、制御ボタン、タッチパネルを含む動作パネル12540を含む。ディスプレイ画面12520がタッチスクリーンである場合、動作パネル12540は、ディスプレイ画面12520のタッチ感知パネルをさらに含む。スマートホン12510は、音声、音響を出力するためのスピーカ12580、または他の形態の音響出力部と、音声、音響が入力されるマイクロホン12550、または他の形態の音響入力部と、を含む。スマートホン12510は、ビデオ映像及び静止映像を撮影するためのCCD(charge coupled device)カメラのようなカメラ12530をさらに含む。また、スマートホン12510は、カメラ12530によって撮影されたり、電子メール(E−mail)でもって受信されたり、あるいは他の形態に獲得されたビデオや静止映像のように、符号化されたり復号化されたデータを保存するための記録媒体12570;及び記録媒体12570を携帯電話12500に装着するためのスロット12560;を含んでもよい。記録媒体12570は、SDカード、またはプラスチックケースに内蔵されたEEPROM(electrically erasable and programmable read only memory)のような他の形態のフラッシュメモリでもある。
図30は、携帯電話12500の内部構造を図示している。ディスプレイ画面12520及び動作パネル12540によって構成された携帯電話12500の各パートを組織的に制御するために、電力供給回路12700、動作入力制御部12640、映像符号化部12720、カメラ・インターフェース12630、LCD制御部12620、映像復号化部12690、マルチプレクサ/デマルチプレクサ(MUX/DEMUX:multiplexer/demultiplexer)12680、記録/判読部12670、変調/復調(modulation/demodulation)部12660及び音響処理部12650が、同期化バス12730を介して中央制御部12710に連結される。
ユーザが電源ボタンを作動させ、「電源オフ」状態から「電源オン」状態に設定されれば、電力供給回路12700は、バッテリパックから、携帯電話12500の各パートに電力を供給することにより、携帯電話12500が動作モードにセッティングされる。
中央制御部12710は、CPU(central processing unit)、ROM及びRAM(random-access memory)を含む。
携帯電話12500が外部に通信データを送信する過程では、中央制御部12710の制御によって、携帯電話12500でデジタル信号が生成される、例えば、音響処理部12650では、デジタル音響信号が生成され、映像符号化部12720では、デジタル映像信号が生成され、動作パネル12540及び動作入力制御部12640を介して、メッセージのテキストデータが生成される。中央制御部12710の制御によって、デジタル信号が変調/復調部12660に伝達されれば、変調/復調部12660は、デジタル信号の周波数帯域を変調し、通信回路12610は、帯域変調されたデジタル音響信号に対して、D/A変換(digital-analog conversion)処理及び周波数変換(frequency conversion)処理を行う。通信回路12610から出力された送信信号は、アンテナ12510を介して、音声通信基地局または無線基地局12000に送出される。
例えば、携帯電話12500が通話モードであるとき、マイクロホン12550によって獲得された音響信号は、中央制御部12710の制御によって、音響処理部12650でデジタル音響信号に変換される。生成されたデジタル音響信号は、変調/復調部12660及び通信回路12610を経て、送信信号に変換され、アンテナ12510を介して送出される。
データ通信モードで、電子メールのようなテキストメッセージが伝送される場合、動作パネル12540を利用して、メッセージのテキストデータが入力され、テキストデータが、動作入力制御部12640を介して、中央制御部12610に伝送される。中央制御部12610の制御により、テキストデータは、変調/復調部12660及び通信回路12610を介して送信信号に変換され、アンテナ12510を介して、無線基地局12000に送出される。
データ通信モードで、映像データを伝送するために、カメラ12530によって撮影された映像データが、カメラ・インターフェース12630を介して、映像符号化部12720に提供される。カメラ12530によって撮影された映像データは、カメラ・インターフェース12630及びLCD制御部12620を介して、ディスプレイ画面12520に直ちにディスプレイされる。
映像符号化部12720の構造は、前述の本発明のビデオ符号化装置の構造と相応する。映像符号化部12720は、カメラ12530から提供された映像データを、前述のビデオ符号化装置100または映像符号化部400のビデオ符号化方式によって符号化し、圧縮符号化された映像データに変換し、符号化された映像データを多重化/逆多重化部12680に出力することができる。カメラ12530の録画中に、携帯電話12500のマイクロホン12550によって獲得された音響信号も、音響処理部12650を経て、デジタル音響データに変換され、デジタル音響データは、多重化/逆多重化部12680に伝達することができる。
多重化/逆多重化部12680は、音響処理部12650から提供された音響データと共に、映像符号化部12720から提供された符号化された映像データを多重化する。多重化されたデータは、変調/復調部12660及び通信回路12610を介して送信信号に変換され、アンテナ12510を介して送出される。
携帯電話12500が外部から通信データを受信する過程では、アンテナ12510を介して受信された信号を、周波数復元(frequency recovery)及びA/D変換(analog-digital conversion)処理を介してデジタル信号を変換する。変調/復調部12660は、デジタル信号の周波数帯域を復調する。帯域復調されたデジタル信号は、種類によって、ビデオ復号化部12690、音響処理部12650またはLCD制御部12620に伝達される。
携帯電話12500は、通話モードであるとき、アンテナ12510を介して受信された信号を増幅し、周波数変換処理及びA/D変換(analog-digital conversion)処理を介して、デジタル音響信号を生成する。受信されたデジタル音響信号は、中央制御部12710の制御によって、変調/復調部12660及び音響処理部12650を経てアナログ音響信号に変換され、アナログ音響信号が、スピーカ12580を介して出力される。
データ通信モードで、インターネットのウェブサイトからアクセスされたビデオファイルのデータが受信される場合、アンテナ12510を介して、無線基地局12000から受信された信号は、変調/復調部12660の処理結果として多重化されたデータを出力し、多重化されたデータは、多重化/逆多重化部12680に伝達される。
アンテナ12510を介して受信された多重化されたデータを復号化するために、多重化/逆多重化部12680は、多重化されたデータを逆多重化し、符号化されたビデオデータストリームと、符号化されたオーディオデータストリームとを分離する。同期化バス12730によって、符号化されたビデオデータストリームは、ビデオ復号化部12690に提供され、符号化されたオーディオデータストリームは、音響処理部12650に提供される。
映像復号化部12690の構造は、前述の本発明のビデオ復号化装置の構造と相応する。映像復号化部12690は、前述のビデオ復号化装置200、または映像復号化部500のビデオ復号化方式を利用して、符号化されたビデオデータを復号化して復元されたビデオデータを生成し、LCD制御部12620を経て、ディスプレイ画面12520に、復元されたビデオデータを提供することができる。
それにより、インターネットのウェブサイトからアクセスされたビデオファイルのビデオデータが、ディスプレイ画面12520でディスプレイされる。それと同時に、音響処理部12650も、オーディオデータをアナログ音響信号に変換して、アナログ音響信号を、スピーカ12580に提供することができる。それにより、インターネットのウェブサイトからアクセスされたビデオファイルに含まれたオーディオデータも、スピーカ12580で再生される。
携帯電話12500または他の形態の通信端末機は、本発明のビデオ符号化装置及びビデオ復号化装置をいずれも含む送受信端末機であるか、前述の本発明のビデオ符号化装置のみを含む送信端末機であるか、あるいは本発明のビデオ復号化装置のみを含む受信端末機でもある。
本発明の通信システムは、図28を参照して説明した構造に限定されるものではない。例えば、図31は、本発明による通信システムが適用されたデジタル放送システムを図示している。図31の一実施形態によるデジタル放送システムは、本発明のビデオ符号化装置及びビデオ復号化装置を利用して、衛星または地上波のネットワークを介して伝送されるデジタル放送を受信することができる。
具体的には、放送局12890は、電波を介してビデオデータストリームを通信衛星または放送衛星12900に伝送する。放送衛星12900は、放送信号を伝送し、放送信号は、家庭にあるアンテナ12860によって、衛星放送受信機に受信される。各家庭において、符号化されたビデオストリームは、TV(television)受信機12810、セットトップボックス(set-top box)12870または他のデバイスによって復号化されて再生される。
再生装置12830において、本発明のビデオ復号化装置が具現されることにより、再生装置12830が、ディスク及びメモリカードのような記録媒体12820に記録された符号化されたビデオストリームを判読して復号化することができる。それによって復元されたビデオ信号は、例えば、モニタ12840で再生される。
衛星/地上波放送のためのアンテナ12860、またはケーブルTV受信のためのケーブルアンテナ12850に連結されたセットトップボックス12870にも、本発明のビデオ復号化装置が搭載される。セットトップボックス12870の出力データも、TVモニタ12880で再生される。
他の例として、セットトップボックス12870の代わりに、TV受信機12810自体に、本発明のビデオ復号化装置が搭載されもする。
適切なアンテナ12910を具備した自動車12920が、衛星12800または無線基地局11700から送出される信号を受信することもできる。自動車12920に搭載された自動車ナビゲーションシステム12930のディスプレイ画面に、復号化されたビデオが再生される。
ビデオ信号は、本発明のビデオ符号化装置によって符号化され、記録媒体に記録されて保存される。具体的には、DVDレコーダによって、映像信号がDVDディスク12960に保存されたり、あるいはハードディスクレコーダ12950によって、ハードディスクに映像信号が保存される。他の例として、ビデオ信号は、SDカード12970に保存されもする。ハードディスクレコーダ12950が、一実施形態による本発明のビデオ復号化装置を具備すれば、DVDディスク12960、SDカード12970または他の形態の記録媒体に記録されたビデオ信号が、モニタ12880で再生される。
自動車ナビゲーションシステム12930は、図30のカメラ12530、カメラ・インターフェース12630及び映像符号化部12720を含まないこともある。例えば、コンピュータ12100及びTV受信機12810も、図30のカメラ12530、カメラ・インターフェース12630及び映像符号化部12720を含まないこともある。
図32は、本発明の一実施形態によるビデオ符号化装置及びビデオ復号化装置を利用するクラウドコンピューティング・システムのネットワーク構造を図示している。
本発明のクラウドコンピューティング・システムは、クラウドコンピューティングサーバ14000、ユーザDB(database)14100、コンピュータ資源14200及びユーザ端末機を含んでなる。
クラウドコンピューティング・システムは、ユーザ端末機の要請によって、インターネットのような情報通信網を介して、コンピュータ資源のオンデマンド・アウトソーシング・サービスを提供する。クラウドコンピューティング環境で、サービス提供者は、互いに異なる物理的な位置に存在するデータセンターのコンピューティング資源を、仮想化技術で統合し、ユーザが必要とするサービスを提供する。サービスユーザは、アプリケーション(application)、ストレージ(storage)、運用体制(OS)、保安(security)のようなコンピュータ資源を、各ユーザ所有の端末にインストールして使用するのではなく、仮想化技術を介して生成された仮想空間上のサービスを、所望の時点で所望するほど選んで使用することができる。
特定サービスユーザのユーザ端末機は、インターネット及び移動通信網を含む情報通信網を介して、クラウドコンピューティングサーバ14000に接続する。ユーザ端末機は、クラウドコンピューティングサーバ14000から、クラウドコンピューティング・サービス、特に、動画再生サービスを提供される。ユーザ端末機は、デスクトップPC(personal computer)14300、スマートTV 14400、スマートホン14500、ノート型パソコン14600、PMP(portable multimedia player)14700、タブレットPC 14800など、インターネット接続が可能な全ての電子機器にもなる。
クラウドコンピューティングサーバ14000は、クラウド網に分散されている多数のコンピュータ資源14200を統合し、ユーザ端末機に提供することができる。多数のコンピュータ資源14200は、さまざまなデータサービスを含み、ユーザ端末機からアップロードされたデータを含んでもよい。かようにクラウドコンピューティングサーバ14000は、多くのところに分散している動画データベースを、仮想化技術で統合し、ユーザ端末機が要求するサービスを提供する。
ユーザDB 14100には、クラウドコンピューティング・サービスに加入していいるユーザ情報が保存される。ここで、ユーザ情報は、ログイン情報、住所、氏名のような個人信用情報を含んでもよい。また、ユーザ情報は、動画のインデックス(index)を含んでもよい。ここで、インデックスは、再生を完了した動画リストや再生中の動画リストや再生中の動画の停止時点などを含んでもよい。
ユーザDB 14100に保存された動画についての情報は、ユーザデバイス間に共有される。従って、例えば、ノート型パソコン14600から再生要請され、ノート型パソコン14600に所定動画サービスを提供した場合、ユーザDB 14100に、所定動画サービスの再生ヒストリーが保存される。スマートホン14500から、同一の動画サービスの再生要請が受信される場合、クラウドコンピューティングサーバ14000は、ユーザDB 14100を参照し、所定動画サービスを見出して再生する。スマートホン14500が、クラウドコンピューティングサーバ14000を介して、動画データストリームを受信する場合、動画データストリームを復号化してビデオを再生する動作は、先に図30を参照して説明した携帯電話12500の動作と同様である。
クラウドコンピュータサーバ14000は、ユーザDB 14100に保存された所定動画サービスの再生ヒストリーを参照することもできる。例えば、クラウドコンピューティングサーバ14000は、ユーザ端末機から、ユーザDB 14100に保存された動画に対する再生要請を受信する。動画が、それ以前に再生中であったのならば、クラウドコンピューティングサーバ14000は、ユーザ端末機への選択によって、最初から再生するか、あるいは以前の停止時点から再生するかということにより、ストリーミング方法が異なる。例えば、ユーザ端末機が、最初から再生するように要請した場合には、クラウドコンピューティングサーバ14000は、ユーザ端末機に、当該動画を最初のフレームからストリーミング伝送する。一方、ユーザ端末機が、以前の停止時点から続けて再生するように要請した場合には、クラウドコンピューティングサーバ14000は、ユーザ端末機に、当該動画を、停止時点のフレームからストリーミング伝送する。
そのとき、ユーザ端末機は、前述の本発明のビデオ復号化装置を含んでもよい。他の例として、ユーザ端末機は、本発明のビデオ符号化装置を含んでもよい。また、ユーザ端末機は、前述の本発明のビデオ符号化装置及びビデオ復号化装置をいずれも含んでもよい。
前述の本発明のビデオ符号化方法及びビデオ復号化方法、本発明のビデオ符号化装置及びビデオ復号化装置が活用される多様な実施形態について、図27Aないし図32で説明した。しかし、図1ないし図26を参照して説明した本発明のビデオ符号化方法及びビデオ復号化方法が、記録媒体に保存されたり、あるいは本発明のビデオ符号化装置及びビデオ復号化装置がデバイスで具現される多様な実施形態は、図27Aないし図32の実施形態に限定されるものではない。
以上、本発明について、その望ましい実施形態を中心に説明した。本発明が属する技術分野で当業者であるならば、本発明が、本発明の本質的な特性から外れない範囲で変形された形態で具現されるということを理解することができるであろう。本発明の範囲は、前述の説明ではなく、特許請求の範囲に示されており、それと同等な範囲内にある全ての差異は、本発明に含まれたものであると解釈されなければならないのである。
上記の実施形態につき以下の付記を残しておく。
(付記1)
ビデオのイントラ予測方法において、
前記ビデオを構成するピクチャを階層的構造に分割したブロックのうち現在ブロックのイントラ予測に利用される所定個数の周辺ピクセルの利用可能性を判断する段階と、
前記所定個数の周辺ピクセルのうち利用不可能な第1周辺ピクセルが存在する場合、前記第1周辺ピクセルを基準にして、既定方向に、前記所定個数の周辺ピクセルを検索し、利用可能な第2周辺ピクセルを検索する段階と、
前記第1周辺ピクセルのピクセル値を、前記検索された第2周辺ピクセルのピクセル値に代替する段階と、
前記代替された第1周辺ピクセルを含む前記所定個数の周辺ピクセルを利用して、前記現在ブロックに対するイントラ予測を行う段階と、を含むことを特徴とするビデオのイントラ予測方法。
(付記2)
前記所定個数の周辺ピクセルの利用可能性を判断する段階は、
インター予測された周辺ブロック、または前記現在ブロックが属したスライスと異なるスライスに属した周辺ブロックに含まれた周辺ピクセルを、利用不可能であると判断することを特徴とする付記1に記載のビデオのイントラ予測方法。
(付記3)
前記第1周辺ピクセルは、前記所定個数の周辺ピクセルのうち既定位置のピクセルであり、
前記第2周辺ピクセルを検索する段階は、
前記第1周辺ピクセルを基準にして、既定方向に、前記所定個数の周辺ピクセルを検索し、最初に検索された利用可能な周辺ピクセルを、前記第2周辺ピクセルとして決定することを特徴とする付記1に記載のビデオのイントラ予測方法。
(付記4)
前記第1周辺ピクセルは、前記現在ブロックの左上側コーナーに位置した周辺ピクセルであり、
前記第2周辺ピクセルを検索する段階は、
前記第1周辺ピクセルを基準にして、左側から右側の方向に、前記現在ブロックの上側及び右上側の周辺ピクセルを検索し、前記現在ブロックの上側及び右上側の周辺ピクセルのうち利用可能な第2周辺ピクセルが存在しない場合、前記第1周辺ピクセルを基準にして、上側から下側の方向に、前記現在ブロックの左側及び左下側の周辺ピクセルを検索し、前記第2周辺ピクセルを検索することを特徴とする付記3に記載のビデオのイントラ予測方法。
(付記5)
前記第1周辺ピクセルは、前記現在ブロックの左上側コーナーに位置した周辺ピクセルであり、
前記第2周辺ピクセルを検索する段階は、
前記第1周辺ピクセルを基準にして、上側から下側の方向に、前記現在ブロックの左側及び左下側の周辺ピクセルを検索し、前記現在ブロックの左側及び左下側の周辺ピクセルのうち利用可能な第2周辺ピクセルが存在しない場合、前記第1周辺ピクセルを基準にして、左側から右側の方向に、前記現在ブロックの上側及び右上側の周辺ピクセルを検索し、前記第2周辺ピクセルを検索することを特徴とする付記3に記載のビデオのイントラ予測方法。
(付記6)
前記第1周辺ピクセルは、前記現在ブロックの左上側コーナーに位置した周辺ピクセルであり、
前記第2周辺ピクセルを検索する段階は、
前記第1周辺ピクセルを基準にして、上側から下側の方向に、前記現在ブロックの左側及び左下側の周辺ピクセルを検索し、利用可能な左側周辺ピクセルを決定し、前記第1周辺ピクセルを基準にして、左側から右側の方向に、前記現在ブロックの上側及び右上側の周辺ピクセルを検索し、利用可能な上側周辺ピクセルを決定し、
前記検索された利用可能な左側周辺ピクセル及び上側周辺ピクセルの平均値を利用して、前記第1周辺ピクセルのピクセル値を代替することを特徴とする付記3に記載のビデオのイントラ予測方法。
(付記7)
前記第1周辺ピクセルは、前記現在ブロックの左上側コーナーに位置した周辺ピクセルであり、
前記第2周辺ピクセルを検索する段階は、
前記第1周辺ピクセルを基準にして、上側から下側の方向に、前記現在ブロックの左側及び左下側の周辺ピクセルを検索し、利用可能な左側周辺ピクセルを決定し、前記第1周辺ピクセルを基準にして、左側から右側の方向に、前記現在ブロックの上側及び右上側の周辺ピクセルを検索し、利用可能な上側周辺ピクセルを決定し、前記検索された左側周辺ピクセル及び上側周辺ピクセルのうち、前記第1周辺ピクセルとの距離がさらに近い周辺ピクセルを、前記第2周辺ピクセルとして決定することを特徴とする付記3に記載のビデオのイントラ予測方法。
(付記8)
前記第1周辺ピクセルは、前記現在ブロックの左側及び左下側に位置した周辺ピクセルのうち最左下側に位置した周辺ピクセルであり、
前記第2周辺ピクセルを検索する段階は、
前記第1周辺ピクセルを基準にして、下側から上側の方向に、前記現在ブロックの左側及び左下側に位置した周辺ピクセルを検索し、前記現在ブロックの左側及び左下側に位置した周辺ピクセルのうち利用可能な第2周辺ピクセルが存在しない場合、前記現在ブロックの上側及び右上側の周辺ピクセルを、左側から右側の方向に検索し、前記第2周辺ピクセルを検索することを特徴とする付記3に記載のビデオのイントラ予測方法。
(付記9)
前記第1周辺ピクセルは、前記現在ブロックの上側及び右上側に位置した周辺ピクセルのうち最右上側に位置した周辺ピクセルであり、
前記第2周辺ピクセルを検索する段階は、
前記第1周辺ピクセルを基準にして、右側から左側の方向に、前記現在ブロックの上側及び右上側に位置した周辺ピクセルを検索し、前記現在ブロックの上側及び右上側に位置した周辺ピクセルのうち利用可能な第2周辺ピクセルが存在しない場合、前記現在ブロックの左側及び左下側の周辺ピクセルを、上側から下側の方向に検索し、前記第2周辺ピクセルを検索することを特徴とする付記3に記載のビデオのイントラ予測方法。
(付記10)
利用不可能な第3周辺ピクセルが存在する場合、前記既定方向に基づいて、以前に検索された隣接した周辺ピクセルのピクセル値を利用して、前記第3周辺ピクセルのピクセル値を代替する段階をさらに含むことを特徴とする付記3に記載のビデオのイントラ予測方法。
(付記11)
前記第1周辺ピクセルは、前記現在ブロックの左上側コーナーに位置した周辺ピクセルであり、
前記利用不可能な第3周辺ピクセルが、前記現在ブロックの上側に位置した場合、最も左側の第3周辺ピクセルから順次に、前記第3周辺ピクセルの左側に隣接した周辺ピクセルを利用して、第3周辺ピクセルを代替し、前記利用不可能な第3周辺ピクセルが、前記現在ブロックの左側に位置した場合、最も上側の第3周辺ピクセルから順次に、前記第3周辺ピクセルの上側に隣接した周辺ピクセルを利用して、第3周辺ピクセルを代替することを特徴とする付記10に記載のビデオのイントラ予測方法。
(付記12)
前記第1周辺ピクセルは、前記現在ブロックの最左下側コーナーに位置した周辺ピクセルであり、
前記利用不可能な第3周辺ピクセルが、前記現在ブロックの左側に位置した場合、最も下側の第3周辺ピクセルから順次に、前記第3周辺ピクセルの下側に隣接した周辺ピクセルを利用して、第3周辺ピクセルを代替し、前記利用不可能な第3周辺ピクセルが、前記現在ブロックの上側に位置した場合、最も左側の第3周辺ピクセルから順次に、前記第3周辺ピクセルの左側に隣接した周辺ピクセルを利用して、第3周辺ピクセルを代替することを特徴とする付記10に記載のビデオのイントラ予測方法。
(付記13)
前記第1周辺ピクセルは、前記現在ブロックの最右上側コーナーに位置した周辺ピクセルであり、
前記利用不可能な第3周辺ピクセルが、前記現在ブロックの上側に位置した場合、最も右側の第3周辺ピクセルから順次に、前記第3周辺ピクセルの右側に隣接した周辺ピクセルを利用して、第3周辺ピクセルを代替し、前記利用不可能な第3周辺ピクセルが、前記現在ブロックの左側に位置した場合、最も上側の第3周辺ピクセルから順次に、前記第3周辺ピクセルの上側に隣接した周辺ピクセルを利用して、第3周辺ピクセルを代替することを特徴とする付記10に記載のビデオのイントラ予測方法。
(付記14)
前記検索された第2周辺ピクセルのピクセル値に代替する段階は、
前記所定個数の周辺ピクセルのうち、前記利用可能な第2周辺ピクセルが存在しない場合、前記第1周辺ピクセルのピクセル値を所定値に代替することを特徴とする付記1に記載のビデオのイントラ予測方法。
(付記15)
ビデオのイントラ予測装置において、
前記ビデオを構成するピクチャを階層的構造に分割したブロックのうち現在ブロックのイントラ予測に利用される所定個数の周辺ピクセルの利用可能性を判断する利用可能性判断部と、
前記所定個数の周辺ピクセルのうち利用不可能な第1周辺ピクセルが存在する場合、前記第1周辺ピクセルを基準にして、既定方向に、前記所定個数の周辺ピクセルを検索し、利用可能な第2周辺ピクセルを検索し、前記第1周辺ピクセルのピクセル値を、前記検索された第2周辺ピクセルのピクセル値に代替する代替部と、
前記代替された第1周辺ピクセルを含む前記所定個数の周辺ピクセルを利用して、前記現在ブロックに対するイントラ予測を行うイントラ予測遂行部と、を含むことを特徴とするビデオのイントラ予測装置。
100 ビデオ符号化装置
110 最大符号化単位分割部、
120 符号化単位決定部
130 出力部
200 ビデオ復号化装置
210 受信部
220 映像データ及び符号化情報抽出部
230 映像データ復号化部
310、320、330 ビデオデータ

Claims (2)

  1. ビデオのイントラ予測方法において、
    前記ビデオを構成するピクチャを階層的構造に分割したブロックのうち現在ブロックのイントラ予測に利用される所定個数の周辺ピクセルの利用可能性を判断する段階と、
    前記所定個数の周辺ピクセルのうち左上側に位置した第1周辺ピクセルが利用不可能な場合、前記現在ブロックの左側に隣接した周辺ピクセルのうち、前記左上側に位置した第1周辺ピクセルの下に位置した利用可能な第2周辺ピクセルのピクセル値に前記第1周辺ピクセルのピクセル値を代替する段階と、
    前記現在ブロックの上側に位置した周辺ピクセルのうち利用不可能な第3周辺ピクセルを前記第3周辺ピクセルの左側に位置した周辺ピクセルのピクセル値に代替する段階と、
    前記代替された周辺ピクセルを含む前記所定個数の周辺ピクセルを利用して、前記現在ブロックに対するイントラ予測を行う段階と、を含み、
    前記現在ブロックの大きさをnT×nT(nTは整数)とするとき、前記周辺ピクセルは、前記現在ブロックの左側に位置した2nT個のピクセル、前記現在ブロックの上側に位置した2nT個のピクセル、及び前記現在ブロックの左上側に位置した1個のピクセルを含む、
    ことを特徴とするビデオの復号方法。
  2. ビデオのイントラ予測装置において、
    前記ビデオを構成するピクチャを階層的構造に分割したブロックのうち現在ブロックのイントラ予測に利用される所定個数の周辺ピクセルの利用可能性を判断する利用可能性判断部と、
    前記所定個数の周辺ピクセルのうち左上側に位置した所定位置の第1周辺ピクセルが利用不可能な場合、前記現在ブロックの左側に隣接した周辺ピクセルのうち、前記左上側に位置した第1周辺ピクセルの下に位置した利用可能な第2周辺ピクセルのピクセル値に前記第1周辺ピクセルのピクセル値を代替し、
    前記現在ブロックの上側に位置した周辺ピクセルのうち利用不可能な第3周辺ピクセルを前記第3周辺ピクセルの左側に位置した周辺ピクセルのピクセル値に代替する代替部と、
    前記代替された周辺ピクセルを含む前記所定個数の周辺ピクセルを利用して、前記現在ブロックに対するイントラ予測を行うイントラ予測遂行部と、を含み、
    前記現在ブロックの大きさをnT×nT(nTは整数)とするとき、前記周辺ピクセルは、前記現在ブロックの左側に位置した2nT個のピクセル、前記現在ブロックの上側に位置した2nT個のピクセル、及び前記現在ブロックの左上側に位置した1個のピクセルを含む、
    ことを特徴とするビデオの復号装置。
JP2019007273A 2011-10-28 2019-01-18 ビデオのイントラ予測方法及びその装置 Active JP7103961B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161552692P 2011-10-28 2011-10-28
US61/552,692 2011-10-28

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016221866A Division JP2017055434A (ja) 2011-10-28 2016-11-14 ビデオのイントラ予測方法及びその装置

Publications (2)

Publication Number Publication Date
JP2019057954A true JP2019057954A (ja) 2019-04-11
JP7103961B2 JP7103961B2 (ja) 2022-07-20

Family

ID=48168118

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2014538720A Pending JP2014531177A (ja) 2011-10-28 2012-10-29 ビデオのイントラ予測方法及びその装置
JP2016221866A Pending JP2017055434A (ja) 2011-10-28 2016-11-14 ビデオのイントラ予測方法及びその装置
JP2019007273A Active JP7103961B2 (ja) 2011-10-28 2019-01-18 ビデオのイントラ予測方法及びその装置

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2014538720A Pending JP2014531177A (ja) 2011-10-28 2012-10-29 ビデオのイントラ予測方法及びその装置
JP2016221866A Pending JP2017055434A (ja) 2011-10-28 2016-11-14 ビデオのイントラ予測方法及びその装置

Country Status (19)

Country Link
US (5) US9621918B2 (ja)
EP (5) EP4231639A3 (ja)
JP (3) JP2014531177A (ja)
KR (5) KR101743245B1 (ja)
CN (5) CN107147908B (ja)
AU (1) AU2012329676B2 (ja)
BR (1) BR112014010189B1 (ja)
DK (1) DK3322183T3 (ja)
ES (3) ES2842027T3 (ja)
HU (3) HUE052957T2 (ja)
IN (1) IN2014MN00940A (ja)
MX (2) MX2014005114A (ja)
MY (3) MY198290A (ja)
PH (4) PH12016502375A1 (ja)
PL (3) PL3322183T3 (ja)
RU (4) RU2588990C2 (ja)
TW (3) TWI572194B (ja)
WO (1) WO2013062389A1 (ja)
ZA (1) ZA201403876B (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110113561A (ko) * 2010-04-09 2011-10-17 한국전자통신연구원 적응적인 필터를 이용한 인트라 예측 부호화/복호화 방법 및 그 장치
US10313682B2 (en) * 2013-08-26 2019-06-04 Qualcomm Incorporated Determining regions when performing intra block copying
US10003818B2 (en) 2013-10-11 2018-06-19 Sony Corporation Video coding system with intra prediction mechanism and method of operation thereof
US10009629B2 (en) 2013-10-11 2018-06-26 Sony Corporation Video coding system with search range and method of operation thereof
WO2015056941A1 (ko) * 2013-10-14 2015-04-23 한국전자통신연구원 다계층 기반의 영상 부호화/복호화 방법 및 장치
WO2015056945A1 (ko) * 2013-10-14 2015-04-23 삼성전자 주식회사 깊이 인트라 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
CN105723712B (zh) 2013-10-14 2019-06-28 韩国电子通信研究院 基于多层的图像编码/解码方法和设备
KR20170023000A (ko) 2014-06-20 2017-03-02 삼성전자주식회사 인터 레이어 비디오 부복호화를 위한 깊이 영상의 예측 모드 전송 방법 및 장치
CN107852492A (zh) * 2015-05-12 2018-03-27 三星电子株式会社 用于对图像进行编码和解码的方法和设备
KR20180030791A (ko) * 2015-07-20 2018-03-26 엘지전자 주식회사 비디오 코딩 시스템에서 인트라 예측 방법 및 장치
WO2017090993A1 (ko) * 2015-11-24 2017-06-01 삼성전자 주식회사 비디오 복호화 방법 및 그 장치 및 비디오 부호화 방법 및 그 장치
WO2018216479A1 (ja) * 2017-05-24 2018-11-29 ソニーセミコンダクタソリューションズ株式会社 画像処理装置および方法、並びにプログラム
CN111373751B (zh) * 2017-08-10 2023-02-28 夏普株式会社 图像滤波装置、图像解码装置以及图像编码装置
CN108171663B (zh) * 2017-12-22 2021-05-25 哈尔滨工业大学 基于特征图最近邻替换的卷积神经网络的图像填充系统
CN110650337B (zh) * 2018-06-26 2022-04-01 中兴通讯股份有限公司 一种图像编码方法、解码方法、编码器、解码器及存储介质
US11159789B2 (en) 2018-10-24 2021-10-26 City University Of Hong Kong Generative adversarial network based intra prediction for video coding
WO2020256483A1 (ko) * 2019-06-21 2020-12-24 삼성전자 주식회사 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR102602007B1 (ko) 2020-12-07 2023-11-15 건국대학교 글로컬산학협력단 연료전지 전해질용 폴리(이사틴-페닐렌)계 고분자, 이를 포함하는 연료전지용 고분자 전해질 및 연료전지
WO2023055220A1 (ko) * 2021-10-01 2023-04-06 주식회사 윌러스표준기술연구소 참조 픽쳐를 기초로 인트라 예측 모드를 결정하는 비디오 신호 처리 방법 및 이를 위한 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012090501A1 (ja) * 2010-12-28 2012-07-05 パナソニック株式会社 動画像復号方法、動画像符号化方法、動画像復号装置、動画像符号化装置及び動画像符号化復号装置

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3539415A1 (de) * 1985-11-07 1987-05-14 Bosch Gmbh Robert Verfahren und schaltungsanordnung zum erkennen und verdecken von fehlern in einem digitalen videosignal
DE10158658A1 (de) 2001-11-30 2003-06-12 Bosch Gmbh Robert Verfahren zur gerichteten Prädiktion eines Bildblockes
JP4724351B2 (ja) * 2002-07-15 2011-07-13 三菱電機株式会社 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、および通信装置
EP1411714B1 (en) * 2002-10-17 2008-11-05 Noritsu Koki Co., Ltd. Conversion correcting method of color image data and photographic processing apparatus implementing the method
KR100679031B1 (ko) 2004-12-03 2007-02-05 삼성전자주식회사 다 계층 기반의 비디오 인코딩 방법, 디코딩 방법 및 상기방법을 이용한 장치
US20060153295A1 (en) * 2005-01-12 2006-07-13 Nokia Corporation Method and system for inter-layer prediction mode coding in scalable video coding
WO2006078454A1 (en) * 2005-01-14 2006-07-27 Thomson Licensing Method and apparatus for intra prediction for rru
WO2006106935A1 (ja) 2005-04-01 2006-10-12 Matsushita Electric Industrial Co., Ltd. 画像復号化装置及び画像復号化方法
US20100232505A1 (en) 2006-02-17 2010-09-16 Thomson Licensing Process for Coding Images Using Intra Prediction Mode
US20070195888A1 (en) * 2006-02-17 2007-08-23 Via Technologies, Inc. Intra-Frame Prediction Processing
KR101311403B1 (ko) 2006-07-04 2013-09-25 삼성전자주식회사 영상의 부호화 방법 및 장치, 복호화 방법 및 장치
KR20110086159A (ko) * 2006-10-10 2011-07-27 니폰덴신뎅와 가부시키가이샤 인트라 예측 부호화 제어 방법 및 장치, 그 프로그램 및 프로그램을 기록한 기억 매체
WO2008051381A2 (en) * 2006-10-24 2008-05-02 Thomson Licensing Picture management for multi-view video coding
US8233537B2 (en) * 2007-03-19 2012-07-31 Texas Instruments Incorporated Efficient implementation of H.264 4 by 4 intra prediction on a VLIW processor
US7953284B2 (en) * 2007-03-29 2011-05-31 James Au Selective information handling for video processing
CN103997655B (zh) * 2007-04-09 2017-05-10 株式会社Ntt都科摩 图像预测编码装置及方法、图像预测解码装置及方法
US8782379B2 (en) * 2007-09-27 2014-07-15 Qualcomm Incorporated H.264 video decoder CABAC core optimization techniques
US8467451B2 (en) 2007-11-07 2013-06-18 Industrial Technology Research Institute Methods for selecting a prediction mode
EP2081386A1 (en) * 2008-01-18 2009-07-22 Panasonic Corporation High precision edge prediction for intracoding
KR20090095316A (ko) 2008-03-05 2009-09-09 삼성전자주식회사 영상 인트라 예측 방법 및 장치
US9338475B2 (en) * 2008-04-16 2016-05-10 Intel Corporation Tone mapping for bit-depth scalable video codec
US20090274211A1 (en) * 2008-04-30 2009-11-05 Omnivision Technologies, Inc. Apparatus and method for high quality intra mode prediction in a video coder
KR101361005B1 (ko) 2008-06-24 2014-02-13 에스케이 텔레콤주식회사 인트라 예측 방법 및 장치와 그를 이용한 영상부호화/복호화 방법 및 장치
CN101365136B (zh) * 2008-09-09 2011-01-26 深圳市同洲电子股份有限公司 帧内预测的方法及装置
TWI386068B (zh) 2008-10-22 2013-02-11 Nippon Telegraph & Telephone 解塊處理方法、解塊處理裝置、解塊處理程式及記錄該程式之可由電腦讀取之記錄媒體
KR101601840B1 (ko) * 2009-02-23 2016-03-22 에스케이 텔레콤주식회사 채널 상관 관계를 이용한 영상 부호화/복호화 장치 및 방법과 그를 위한 컴퓨터로 읽을 수 있는 기록매체
CN101854540B (zh) 2009-04-01 2014-07-02 辉达公司 用于应用h.264视频编码标准的帧内预测方法及装置
JP5158003B2 (ja) * 2009-04-14 2013-03-06 ソニー株式会社 画像符号化装置と画像符号化方法およびコンピュータ・プログラム
JP5597968B2 (ja) 2009-07-01 2014-10-01 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
KR101510108B1 (ko) * 2009-08-17 2015-04-10 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR101452860B1 (ko) 2009-08-17 2014-10-23 삼성전자주식회사 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR101700358B1 (ko) 2009-12-09 2017-01-26 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
CN102118613B (zh) 2009-12-31 2012-11-21 华为技术有限公司 视频解码和编码方法及装置
WO2011126344A2 (en) * 2010-04-09 2011-10-13 Samsung Electronics Co., Ltd. Method and apparatus for generating video packets, method and apparatus for restoring video
US8837577B2 (en) * 2010-07-15 2014-09-16 Sharp Laboratories Of America, Inc. Method of parallel video coding based upon prediction type
WO2012115420A2 (ko) * 2011-02-23 2012-08-30 엘지전자 주식회사 필터링을 이용한 화면 내 예측 방법 및 이러한 방법을 사용하는 장치
WO2012134046A2 (ko) 2011-04-01 2012-10-04 주식회사 아이벡스피티홀딩스 동영상의 부호화 방법
US20120314767A1 (en) * 2011-06-13 2012-12-13 Qualcomm Incorporated Border pixel padding for intra prediction in video coding
CN102186086B (zh) 2011-06-22 2013-06-19 武汉大学 一种基于avs的帧内预测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012090501A1 (ja) * 2010-12-28 2012-07-05 パナソニック株式会社 動画像復号方法、動画像符号化方法、動画像復号装置、動画像符号化装置及び動画像符号化復号装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIANGLIN WANG ET AL.: "AHG16: Padding process simplification", JCTVC-G812_R2.DOC[ONLINE], JPN6019049444, 24 November 2011 (2011-11-24), ISSN: 0004176348 *
YONGBING LIN ET AL.: "CE4 Subset2: Report of Intra Coding Improvements for Slice Boundary Blocks", JCTVC-E283.DOCX[ONLINE], JPN6019049443, 11 March 2011 (2011-03-11), ISSN: 0004176347 *

Also Published As

Publication number Publication date
EP4231639A2 (en) 2023-08-23
CN107197250B (zh) 2019-09-03
TW201332368A (zh) 2013-08-01
CN107222744B (zh) 2020-10-27
RU2619267C1 (ru) 2017-05-15
US20190222850A1 (en) 2019-07-18
JP7103961B2 (ja) 2022-07-20
CN107404649B (zh) 2020-04-10
PH12016502375B1 (en) 2017-01-23
RU2014121400A (ru) 2015-12-10
HUE052957T2 (hu) 2021-05-28
KR101743245B1 (ko) 2017-06-02
ES2842027T3 (es) 2021-07-12
US20200084456A1 (en) 2020-03-12
CN107197250A (zh) 2017-09-22
AU2012329676B2 (en) 2015-02-12
EP3780601C0 (en) 2023-08-16
MX354500B (es) 2018-03-08
IN2014MN00940A (ja) 2015-04-24
KR101844517B1 (ko) 2018-04-02
EP3322183A1 (en) 2018-05-16
AU2012329676A1 (en) 2014-06-12
HUE063723T2 (hu) 2024-01-28
MX2014005114A (es) 2014-08-27
PL3780601T3 (pl) 2023-10-02
HUE048628T2 (hu) 2020-08-28
US9621918B2 (en) 2017-04-11
US20140334542A1 (en) 2014-11-13
BR112014010189B1 (pt) 2022-09-20
EP2773116A1 (en) 2014-09-03
PH12016502377A1 (en) 2017-01-23
MY198290A (en) 2023-08-21
PH12016502376B1 (en) 2017-01-23
EP4231639A3 (en) 2023-08-30
PH12016502374A1 (en) 2017-01-23
RU2654503C1 (ru) 2018-05-21
KR101743246B1 (ko) 2017-06-02
TWI650000B (zh) 2019-02-01
MY170951A (en) 2019-09-20
RU2588990C2 (ru) 2016-07-10
CN107147908A (zh) 2017-09-08
KR20190034172A (ko) 2019-04-01
CN107404649A (zh) 2017-11-28
JP2014531177A (ja) 2014-11-20
CN107222744A (zh) 2017-09-29
PL3588949T3 (pl) 2021-03-08
TWI601414B (zh) 2017-10-01
EP3780601A1 (en) 2021-02-17
KR20180036667A (ko) 2018-04-09
PH12016502375A1 (en) 2017-01-23
DK3322183T3 (da) 2019-09-23
CN104025588B (zh) 2017-08-15
PH12016502376A1 (en) 2017-01-23
KR101962829B1 (ko) 2019-03-27
US20170070736A1 (en) 2017-03-09
ES2748604T3 (es) 2020-03-17
EP3322183B1 (en) 2019-09-11
RU2681956C1 (ru) 2019-03-14
ZA201403876B (en) 2021-05-26
EP3588949A1 (en) 2020-01-01
TW201711476A (zh) 2017-03-16
PH12016502377B1 (en) 2017-01-23
BR112014010189A2 (pt) 2017-04-18
TWI572194B (zh) 2017-02-21
CN104025588A (zh) 2014-09-03
US10506239B2 (en) 2019-12-10
TW201740729A (zh) 2017-11-16
WO2013062389A1 (ko) 2013-05-02
EP2773116A4 (en) 2015-08-12
KR20170063494A (ko) 2017-06-08
JP2017055434A (ja) 2017-03-16
KR20150009498A (ko) 2015-01-26
CN107147908B (zh) 2020-02-07
US20180139454A1 (en) 2018-05-17
KR102082303B1 (ko) 2020-02-27
EP3588949B1 (en) 2020-12-02
MY198281A (en) 2023-08-21
KR20130047650A (ko) 2013-05-08
ES2961199T3 (es) 2024-03-08
US10893277B2 (en) 2021-01-12
EP3780601B1 (en) 2023-08-16
PL3322183T3 (pl) 2019-12-31
US9883191B2 (en) 2018-01-30
US10291919B2 (en) 2019-05-14
PH12016502374B1 (en) 2017-01-23

Similar Documents

Publication Publication Date Title
JP7103961B2 (ja) ビデオのイントラ予測方法及びその装置
JP6622870B2 (ja) ビデオ復号化方法及びその装置
JP2015525547A (ja) ビデオ符号化またはビデオ復号化のための動きベクトル予測方法及びその装置
AU2018200540B2 (en) Method and apparatus for intra prediction of video
AU2015202343B2 (en) Method and apparatus for intra prediction of video

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200313

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201204

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20201204

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20201215

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20201222

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20210219

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20210224

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20211005

C23 Notice of termination of proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C23

Effective date: 20220510

C03 Trial/appeal decision taken

Free format text: JAPANESE INTERMEDIATE CODE: C03

Effective date: 20220607

C30A Notification sent

Free format text: JAPANESE INTERMEDIATE CODE: C3012

Effective date: 20220607

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220707

R150 Certificate of patent or registration of utility model

Ref document number: 7103961

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150