KR20150105231A - A method and an apparatus for processing a multi-view video signal - Google Patents

A method and an apparatus for processing a multi-view video signal Download PDF

Info

Publication number
KR20150105231A
KR20150105231A KR1020150030685A KR20150030685A KR20150105231A KR 20150105231 A KR20150105231 A KR 20150105231A KR 1020150030685 A KR1020150030685 A KR 1020150030685A KR 20150030685 A KR20150030685 A KR 20150030685A KR 20150105231 A KR20150105231 A KR 20150105231A
Authority
KR
South Korea
Prior art keywords
offset
depth
value
string
absolute value
Prior art date
Application number
KR1020150030685A
Other languages
Korean (ko)
Inventor
이배근
김주영
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Publication of KR20150105231A publication Critical patent/KR20150105231A/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • H04N13/0048
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding

Abstract

A method for processing a multi-view video signal according to the present invention includes the steps of: inducing an offset value by using an offset absolute value and offset symbol information; inducing a representative residual depth value with regard to a depth image by considering whether a depth image uses a depth lookup table; and restoring the depth image by using the induced representative residual depth value.

Description

다시점 비디오 신호 처리 방법 및 장치{A METHOD AND AN APPARATUS FOR PROCESSING A MULTI-VIEW VIDEO SIGNAL}TECHNICAL FIELD [0001] The present invention relates to a multi-view video signal processing method and apparatus,

본 발명은 비디오 신호의 코딩 방법 및 장치에 관한 것이다.The present invention relates to a method and apparatus for coding a video signal.

최근 HD(High Definition) 영상 및 UHD(Ultra High Definition) 영상과 같은 고해상도, 고품질의 영상에 대한 수요가 다양한 응용 분야에서 증가하고 있다. 영상 데이터가 고해상도, 고품질이 될수록 기존의 영상 데이터에 비해 상대적으로 데이터량이 증가하기 때문에 기존의 유무선 광대역 회선과 같은 매체를 이용하여 영상 데이터를 전송하거나 기존의 저장 매체를 이용해 저장하는 경우, 전송 비용과 저장 비용이 증가하게 된다. 영상 데이터가 고해상도, 고품질화 됨에 따라 발생하는 이러한 문제들을 해결하기 위해서는 고효율의 영상 압축 기술들이 활용될 수 있다.Recently, the demand for high resolution and high quality images such as high definition (HD) image and ultra high definition (UHD) image is increasing in various applications. As the image data has high resolution and high quality, the amount of data increases relative to the existing image data. Therefore, when the image data is transmitted using a medium such as a wired / wireless broadband line or stored using an existing storage medium, The storage cost is increased. High-efficiency image compression techniques can be utilized to solve such problems as image data becomes high-resolution and high-quality.

영상 압축 기술로 현재 픽쳐의 이전 또는 이후 픽쳐로부터 현재 픽쳐에 포함된 화소값을 예측하는 화면 간 예측 기술, 현재 픽쳐 내의 화소 정보를 이용하여 현재 픽쳐에 포함된 화소값을 예측하는 화면 내 예측 기술, 출현 빈도가 높은 값에 짧은 부호를 할당하고 출현 빈도가 낮은 값에 긴 부호를 할당하는 엔트로피 부호화 기술 등 다양한 기술이 존재하고 이러한 영상 압축 기술을 이용해 영상 데이터를 효과적으로 압축하여 전송 또는 저장할 수 있다.An inter picture prediction technique for predicting a pixel value included in a current picture from a previous or a subsequent picture of a current picture by an image compression technique, an intra picture prediction technique for predicting a pixel value included in a current picture using pixel information in the current picture, There are various techniques such as an entropy encoding technique in which a short code is assigned to a value having a high appearance frequency and a long code is assigned to a value having a low appearance frequency. Image data can be effectively compressed and transmitted or stored using such an image compression technique.

한편, 고해상도 영상에 대한 수요가 증가함과 함께, 새로운 영상 서비스로서 입체 영상 컨텐츠에 대한 수요도 함께 증가하고 있다. 고해상도 및 초고해상도의 입체 영상 콘텐츠를 효과적으로 제공하기 위한 비디오 압축 기술에 대하여 논의가 진행되고 있다.On the other hand, demand for high-resolution images is increasing, and demand for stereoscopic image content as a new image service is also increasing. Video compression techniques are being discussed to effectively provide high resolution and ultra-high resolution stereoscopic content.

본 발명은 다시점 비디오 신호를 인코딩/디코딩함에 있어서, 변이 벡터를 이용하여 시점 간 예측을 수행하는 방법 및 장치를 제공하는 것을 목적으로 한다.It is another object of the present invention to provide a method and apparatus for performing inter-view prediction using a disparity vector in encoding / decoding a multi-view video signal.

본 발명은 다시점 비디오 신호를 인코딩/디코딩함에 있어서, 뎁스 블록의 뎁스 데이터를 이용하여 텍스쳐 블록의 변이 벡터를 유도하는 방법 및 장치를 제공하는 것을 목적으로 한다.An object of the present invention is to provide a method and apparatus for deriving a variation vector of a texture block using depth data of a depth block in encoding / decoding a multi-view video signal.

본 발명은 다시점 비디오 신호를 인코딩/디코딩함에 있어서, 현재 텍스쳐 블록의 이웃 블록으로부터 변이 벡터를 유도하는 방법 및 장치를 제공하는 것을 목적으로 한다.The present invention aims to provide a method and apparatus for deriving a variation vector from a neighboring block of a current texture block in encoding / decoding a multi-view video signal.

본 발명은 다시점 비디오 신호를 인코딩/디코딩함에 있어서, 세그먼트 기반의 뎁스 코딩 기법에 따라 뎁스 영상을 코딩하는 방법 및 장치를 제공하는 것을 목적으로 한다.An object of the present invention is to provide a method and apparatus for coding a depth image according to a segment-based depth coding scheme in encoding / decoding a multi-view video signal.

본 발명은 다시점 비디오 신호를 인코딩/디코딩함에 있어서, 문맥 기반의 적응적 이진 산술 코딩에 기반한 엔트로피 디코딩을 통해 오프셋 절대값을 획득하는 방법 및 장치를 제공하는 것을 목적으로 한다.SUMMARY OF THE INVENTION It is an object of the present invention to provide a method and apparatus for encoding and decoding a multi-view video signal, which obtains an absolute value of an offset through entropy decoding based on context-based adaptive binary arithmetic coding.

본 발명에 따른 멀티 레이어 비디오 신호 디코딩 방법 및 장치는, 비트스트림으로부터 뎁스 영상에 관한 오프셋 절대값 및 오프셋 부호 정보를 획득하고, 상기 오프셋 절대값과 오프셋 부호 정보를 이용하여 오프셋 값을 유도하며, 상기 뎁스 영상이 뎁스 룩업 테이블을 이용하는지 여부를 고려하여 상기 뎁스 영상에 관한 대표 잔여 뎁스 값을 유도하고, 상기 유도된 대표 잔여 뎁스 값을 이용하여 상기 뎁스 영상을 복원하는 것을 특징으로 한다.A method and apparatus for decoding a multi-layer video signal according to the present invention includes the steps of: obtaining an offset absolute value and offset code information with respect to a depth image from a bitstream; deriving an offset value using the offset absolute value and the offset code information; A representative residual depth value of the depth image is derived in consideration of whether or not the depth image uses a depth lookup table, and the depth image is restored using the derived representative residual depth value.

본 발명에 따른 멀티 레이어 비디오 신호 디코딩 방법 및 장치에 있어서, 상기 오프셋 절대값을 획득하는 단계는, 상기 오프셋 절대값에 관한 문맥 모델링에 기반하여 빈 스트링을 생성하고, 상기 생성된 빈 스트링에 대한 역-이진화를 통해 오프셋 절대값을 유도하는 것을 특징으로 한다.In the method and apparatus for decoding a multi-layer video signal according to the present invention, the obtaining of the absolute value of offset may include: generating an empty string based on context modeling of the absolute value of the offset; - deriving the absolute value of the offset through binarization.

본 발명에 따른 멀티 레이어 비디오 신호 디코딩 방법 및 장치에 있어서, 상기 빈 스트링은 접두부 빈 스트링과 접미부 빈 스트링으로 구성되며, 상기 접두부 빈 스트링은 절삭형 단항 이진 부호화에 기반하여 역-이진화되고, 상기 접미부 빈 스트링은 0차 지수 골룸 이진화 부호화에 기반하여 역-이진화되는 것을 특징으로 한다.In the method and apparatus for decoding a multilayer video signal according to the present invention, the bin string is composed of a preamble bin string and a suffix bin string, and the preamble bin string is reverse-binarized based on a cutting type unary binary encoding , And the suffix bin string is reverse-binarized based on the zeroth exponent Golomb binary coding.

본 발명에 따른 멀티 레이어 비디오 신호 디코딩 방법 및 장치에 있어서, 상기 접두부 빈 스트링을 구성하는 빈의 최대 개수(cMax)는 3으로 설정된 것을 특징으로 한다.In the method and apparatus for decoding a multi-layer video signal according to the present invention, the maximum number (cMax) of beans constituting the preamble bin string is set to 3.

본 발명에 따른 멀티 레이어 비디오 신호 인코딩 방법 및 장치는, 뎁스 영상에 관한 오프셋 절대값 및 오프셋 부호 정보를 부호화하고, 상기 오프셋 절대값과 오프셋 부호 정보를 이용하여 오프셋 값을 유도하며, 상기 뎁스 영상이 뎁스 룩업 테이블을 이용하는지 여부를 고려하여 상기 뎁스 영상에 관한 대표 잔여 뎁스 값을 유도하고, 상기 유도된 대표 잔여 뎁스 값을 이용하여 상기 뎁스 영상을 복원하는 것을 특징으로 한다.A method and apparatus for encoding a multi-layer video signal according to the present invention encodes an offset absolute value and offset sign information on a depth image, derives an offset value using the offset absolute value and offset sign information, A representative residual depth value of the depth image is derived in consideration of whether or not a depth lookup table is used, and the depth image is restored using the derived representative residual depth value.

본 발명에 따른 멀티 레이어 비디오 신호 인코딩 방법 및 장치에 있어서, 상기 오프셋 절대값을 부호화하는 단계는, 상기 오프셋 절대값에 대한 이진화를 통해 빈 스트링을 생성하고, 상기 생성된 빈 스트링에 대해 각 빈의 발생 확률에 기반하여 엔트로피 코딩하는 것을 특징으로 한다.In the method and apparatus for encoding a multi-layer video signal according to the present invention, the encoding of the absolute value of offset may include generating an empty string through binarization of the absolute value of the offset, And entropy coding is performed based on the probability of occurrence.

본 발명에 따른 멀티 레이어 비디오 신호 인코딩 방법 및 장치에 있어서, 상기 빈 스트링은 접두부 빈 스트링과 접미부 빈 스트링으로 구성되며, 상기 접두부 빈 스트링은 절삭형 단항 이진 부호화에 기반하여 이진화되고, 상기 접미부 빈 스트링은 0차 지수 골룸 이진화 부호화에 기반하여 이진화되는 것을 특징으로 한다.In the method and apparatus for encoding a multilayer video signal according to the present invention, the bin string is composed of a preamble bin string and a suffix bin string, the preamble bin string is binarized based on a cutting type unary binary encoding, And the suffix bin string is binarized based on the zeroth exponent Golomb binary coding.

본 발명에 따른 멀티 레이어 비디오 신호 인코딩 방법 및 장치에 있어서, 상기 접두부 빈 스트링을 구성하는 빈의 최대 개수(cMax)는 3으로 설정된 것을 특징으로 한다.In the method and apparatus for encoding a multi-layer video signal according to the present invention, the maximum number (cMax) of beans constituting the preamble bin string is set to 3.

본 발명에 의하면, 변이 벡터를 이용하여 시점 간 예측을 효율적으로 수행할 수 있다. According to the present invention, it is possible to efficiently perform inter-view prediction using a disparity vector.

본 발명에 의하면, 현재 뎁스 블록의 뎁스 데이터 또는 이웃 텍스쳐 블록의 변이 벡터로부터 현재 텍스쳐 블록의 변이 벡터를 효과적으로 유도할 수 있다.According to the present invention, the variation vector of the current texture block can be effectively derived from the depth data of the current depth block or the variation vector of the neighboring texture block.

본 발명에 의하면, 세그먼트 기반의 뎁스 코딩 기법에 따라 뎁스 영상의 잔여 뎁스 값을 효율적으로 코딩할 수 있다.According to the present invention, the residual depth value of the depth image can be efficiently coded according to the segment-based depth coding technique.

본 발명에 의하면, 문맥 기반의 적응적 이진 산술 코딩에 기반한 엔트로피 디코딩을 통해 오프셋 절대값을 효과적으로 디코딩할 수 있다.According to the present invention, the absolute value of the offset can be effectively decoded through entropy decoding based on context-based adaptive binary arithmetic coding.

도 1은 본 발명이 적용되는 일실시예로서, 비디오 디코더의 개략적인 블록도를 도시한 것이다.
도 2는 본 발명이 적용되는 일실시예로서, 변이 벡터에 기초하여 시점 간 예측을 수행하는 방법을 도시한 것이다.
도 3은 본 발명이 적용되는 일실시예로서, 뎁스 영상의 뎁스 데이터를 이용하여 현재 텍스쳐 블록의 변이 벡터를 유도하는 방법을 도시한 것이다.
도 4는 본 발명이 적용되는 일실시예로서, 현재 텍스쳐 블록의 공간적/시간적 이웃 블록의 후보를 도시한 것이다.
도 5는 본 발명이 적용되는 일실시예로서, 세그먼트 기반의 뎁스 코딩 기법에 따라 뎁스 영상을 디코딩하는 방법을 도시한 것이다.
도 6은 본 발명이 적용되는 일실시예로서, 문맥 기반의 적응적 이진 산술 코딩(context-based adaptive binary arithmetic coding)에 기반한 엔트로피 디코딩을 통해 오프셋 절대값을 획득하는 방법을 도시한 것이다.
도 7 내지 도 9는 본 발명이 적용되는 일실시예로서, 빈의 최대 개수(cMax)에 따른 오프셋 절대값의 이진화 방법을 도시한 것이다.
FIG. 1 is a schematic block diagram of a video decoder according to an embodiment to which the present invention is applied.
FIG. 2 illustrates a method of performing an inter-view prediction based on a disparity vector according to an embodiment to which the present invention is applied.
FIG. 3 illustrates a method of deriving a variation vector of a current texture block using depth data of a depth image according to an embodiment of the present invention. Referring to FIG.
FIG. 4 illustrates a candidate spatial / temporal neighbor block of a current texture block according to an embodiment of the present invention. Referring to FIG.
FIG. 5 illustrates a method of decoding a depth image according to a segment-based depth coding technique according to an embodiment of the present invention. Referring to FIG.
FIG. 6 illustrates a method of obtaining an absolute value of an offset through entropy decoding based on context-based adaptive binary arithmetic coding according to an embodiment of the present invention. Referring to FIG.
FIGS. 7 to 9 illustrate a method of binarizing an absolute value of an offset according to the maximum number of beans cMax, according to an embodiment to which the present invention is applied.

다시점 비디오 신호 데이터를 압축 부호화 또는 복호화하는 기술은 공간적 중복성, 시간적 중복성 및 시점간 존재하는 중복성을 고려하고 있다. 또한, 다시점 영상의 경우, 3차원 영상을 구현하기 위해 2개 이상의 시점에서 촬영된 다시점 텍스쳐 영상을 코딩할 수 있다. 또한, 필요에 따라 다시점 텍스쳐 영상에 대응하는 뎁스 데이터를 더 코딩할 수도 있다. 뎁스 데이터를 코딩함에 있어서, 공간적 중복성, 시간적 중복성 또는 시점간 중복성을 고려하여 압축 코딩할 수 있음은 물론이다. 뎁스 데이터는 카메라와 해당 화소 간의 거리 정보를 표현한 것이며, 본 명세서 내에서 뎁스 데이터는 뎁스 값, 뎁스 정보, 뎁스 영상, 뎁스 픽쳐, 뎁스 시퀀스, 뎁스 비트스트림 등과 같이 뎁스에 관련된 정보로 유연하게 해석될 수 있다. 또한, 본 명세서에서 코딩이라 함은 인코딩과 디코딩의 개념을 모두 포함할 수 있고, 본 발명의 기술적 사상 및 기술적 범위에 따라 유연하게 해석할 수 있을 것이다.
The technique of compression-encoding or decoding multi-view video signal data considers spatial redundancy, temporal redundancy, and redundancy existing between viewpoints. Also, in case of a multi-view image, a multi-view texture image captured at two or more viewpoints can be coded to realize a three-dimensional image. Further, the depth data corresponding to the multi-viewpoint texture image may be further encoded as needed. In coding the depth data, it is needless to say that compression coding can be performed in consideration of spatial redundancy, temporal redundancy, or inter-view redundancy. The depth data expresses the distance information between the camera and the corresponding pixel. In the present specification, the depth data can be flexibly interpreted as depth-related information such as a depth value, a depth information, a depth image, a depth picture, a depth sequence and a depth bit stream . In the present specification, coding may include both concepts of encoding and decoding, and may be flexibly interpreted according to the technical idea and technical scope of the present invention.

도 1은 본 발명이 적용되는 일실시예로서, 비디오 디코더의 개략적인 블록도를 도시한 것이다.FIG. 1 is a schematic block diagram of a video decoder according to an embodiment to which the present invention is applied.

도 1을 참조하면, 비디오 디코더는 NAL 파싱부(100), 엔트로피 디코딩부(200), 역양자화/역변환부(300), 인트라 예측부(400), 인-루프 필터부(500), 복호 픽쳐 버퍼부(600), 인터 예측부(700)를 포함할 수 있다. 1, the video decoder includes a NAL parsing unit 100, an entropy decoding unit 200, an inverse quantization / inverse transformation unit 300, an intra prediction unit 400, an in-loop filter unit 500, A buffer unit 600, and an inter-prediction unit 700.

NAL 파싱부 (100)는 다시점 텍스쳐 데이터를 포함한 비트스트림을 수신할 수 있다. 또한, 뎁스 데이터가 텍스쳐 데이터의 코딩에 필요한 경우, 인코딩된 뎁스 데이터를 포함한 비트스트림을 더 수신할 수도 있다. 이 때 입력되는 텍스쳐 데이터와 뎁스 데이터는 하나의 비트스트림으로 전송될 수 있고, 또는 별개의 비트스트림으로 전송될 수도 있다. NAL 파싱부(100)는 입력된 비트스트림을 복호화하기 위해 NAL 단위로 파싱을 수행할 수 있다. 입력된 비트스트림이 다시점 관련 데이터(예를 들어, 3-Dimensional Video)인 경우, 입력된 비트스트림은 카메라 파라미터를 더 포함할 수 있다. 카메라 파라미터에는 고유의 카메라 파라미터 (intrinsic camera parameter) 및 비고유의 카메라 파라미터 (extrinsic camera parameter)가 있을 수 있고, 고유의 카메라 파라미터는 초점 거리(focal length), 가로세로비(aspect ratio), 주점(principal point) 등을 포함할 수 있고, 비고유의 카메라 파라미터는 세계 좌표계에서의 카메라의 위치정보 등을 포함할 수 있다.The NAL parsing unit 100 may receive the bitstream including the texture data again. In addition, when depth data is required for coding texture data, a bitstream including encoded depth data may be further received. The texture data and the depth data input at this time may be transmitted in one bit stream or in a separate bit stream. The NAL parsing unit 100 may perform parsing in units of NALs to decode the input bitstream. If the input bitstream is multi-point related data (e.g., 3-Dimensional Video), the input bitstream may further include camera parameters. The camera parameters may include intrinsic camera parameters and extrinsic camera parameters and the unique camera parameters may include focal length, aspect ratio, principal point, etc., and the camera parameter of the note may include position information of the camera in the world coordinate system, and the like.

엔트로피 디코딩부(200)는 엔트로피 디코딩을 통하여 양자화된 변환 계수, 텍스쳐 픽쳐의 예측을 위한 코딩 정보 등을 추출할 수 있다.The entropy decoding unit 200 can extract quantized transform coefficients through entropy decoding, coding information for predicting a texture picture, and the like.

역양자화/역변환부(300)에서는 양자화된 변환 계수에 양자화 파라미터를 적용하여 변환 계수를 획득하고, 변환 계수를 역변환하여 텍스쳐 데이터 또는 뎁스 데이터를 복호화할 수 있다. 여기서, 복호화된 텍스쳐 데이터 또는 뎁스 데이터는 예측 처리에 따른 레지듀얼 데이터를 의미할 수 있다. 또한, 뎁스 블록에 대한 양자화 파라미터는 텍스쳐 데이터의 복잡도를 고려하여 설정될 수 있다. 예를 들어, 뎁스 블록에 대응하는 텍스쳐 블록이 복잡도가 높은 영역인 경우에는 낮은 양자화 파라미터를 설정하고, 복잡도가 낮은 영역인 경우에는 높은 양자화 파라미터를 설정할 수 있다. 텍스쳐 블록의 복잡도는 수학식 1과 같이 복원된 텍스쳐 픽쳐 내에서 서로 인접한 픽셀들 간의 차분값에 기초하여 결정될 수 있다.The inverse quantization / inverse transformation unit 300 can obtain a transform coefficient by applying a quantization parameter to the quantized transform coefficient, and invert the transform coefficient to decode the texture data or the depth data. Here, the decoded texture data or depth data may mean residual data according to prediction processing. In addition, the quantization parameter for the depth block can be set in consideration of the complexity of the texture data. For example, when a texture block corresponding to a depth block is a region with a high complexity, a low quantization parameter may be set, and in the case of a low complexity region, a high quantization parameter may be set. The complexity of the texture block can be determined based on the difference value between adjacent pixels in the reconstructed texture picture as shown in Equation (1).

Figure pat00001
Figure pat00001

수학식 1에서 E는 텍스쳐 데이터의 복잡도를 나타내고, C는 복원된 텍스쳐 데이터를 의미하며, N은 복잡도를 산출하고자 하는 텍스쳐 데이터 영역 내의 픽셀 개수를 의미할 수 있다. 수학식 1을 참조하면, 텍스쳐 데이터의 복잡도는 (x,y) 위치에 대응하는 텍스쳐 데이터와 (x-1,y) 위치에 대응하는 텍스쳐 데이터 간의 차분값 및 (x,y) 위치에 대응하는 텍스쳐 데이터와 (x+1,y) 위치에 대응하는 텍스쳐 데이터 간의 차분값을 이용하여 산출될 수 있다. 또한, 복잡도는 텍스쳐 픽쳐와 텍스쳐 블록에 대해서 각각 산출될 수 있고, 이를 이용하여 아래 수학식 2와 같이 양자화 파라미터를 유도할 수 있다.In Equation (1), E represents the complexity of the texture data, C represents the restored texture data, and N may represent the number of pixels in the texture data region for which the complexity is to be calculated. Referring to Equation 1, the complexity of the texture data corresponds to the difference value between the texture data corresponding to the (x, y) position and the texture data corresponding to the position (x-1, y) Can be calculated using the difference value between the texture data and the texture data corresponding to the position (x + 1, y). In addition, the complexity can be calculated for the texture picture and the texture block, respectively, and the quantization parameter can be derived using Equation (2) below.

Figure pat00002
Figure pat00002

수학식 2를 참조하면, 뎁스 블록에 대한 양자화 파라미터는 텍스쳐 픽쳐의 복잡도와 텍스쳐 블록의 복잡도의 비율에 기초하여 결정될 수 있다. α 및 β는 디코더에서 유도되는 가변적인 정수일 수 있고, 또는 디코더 내에서 기 결정된 정수일 수 있다.Referring to Equation (2), the quantization parameter for the depth block can be determined based on the ratio of the complexity of the texture picture and the complexity of the texture block. [alpha] and [beta] may be a variable integer that is derived from the decoder, or it may be a predetermined integer within the decoder.

인트라 예측부(400)는 현재 텍스쳐 픽쳐 내의 복원된 텍스쳐 데이터를 이용하여 화면 내 예측을 수행할 수 있다. 뎁스 ?쳐에 대해서도 텍스쳐 픽쳐와 동일한 방식으로 화면 내 예측이 수행될 수 있다. 예를 들어, 텍스쳐 픽쳐의 화면 내 예측을 위해 이용되는 코딩 정보를 텝스 픽쳐에서도 동일하게 이용할 수 있다. 여기서, 화면 내 예측을 위해 이용되는 코딩 정보는 인트라 예측 모드, 인트라 예측의 파티션 정보를 포함할 수 있다. The intra prediction unit 400 may perform intra prediction using the restored texture data in the current texture picture. In-depth prediction can also be performed on the depth map in the same manner as the texture picture. For example, the coding information used for intra-picture prediction of the texture picture can be used equally in the tep-picture. Here, the coding information used for intra-picture prediction may include intra-prediction mode and partition information of intra-prediction.

인-루프 필터부(500)는 블록 왜곡 현상을 감소시키기 위해 각각의 코딩된 블록에 인-루프 필터를 적용할 수 있다. 필터는 블록의 가장자리를 부드럽게 하여 디코딩된 픽쳐의 화질을 향상시킬 수 있다. 필터링을 거친 텍스쳐 픽쳐 또는 뎁스 픽쳐들은 출력되거나 참조 픽쳐로 이용하기 위해 복호 픽쳐 버퍼부(600)에 저장될 수 있다. 한편, 텍스쳐 데이터의 특성과 뎁스 데이터의 특성이 서로 상이하기 때문에 동일한 인-루프 필터를 사용하여 텍스쳐 데이터와 뎁스 데이터의 코딩을 수행할 경우, 코딩 효율이 떨어질 수 있다. 따라서, 뎁스 데이터를 위한 별도의 인-루프 필터를 정의할 수도 있다. 이하, 뎁스 데이터를 효율적으로 코딩할 수 있는 인-루프 필터링 방법으로서, 영역 기반의 적응적 루프 필터 (region-based adaptive loop filter)와 트라일래터럴 루프 필터 (trilateral loop filter)를 살펴 보기로 한다.The in-loop filter unit 500 may apply an in-loop filter to each coded block to reduce block distortion. The filter can smooth the edges of the block to improve the picture quality of the decoded picture. The filtered texture or depth pictures may be output or stored in the decoded picture buffer unit 600 for use as a reference picture. On the other hand, when the texture data and the depth data are coded using the same in-loop filter, the coding efficiency may deteriorate because the characteristics of the texture data and the characteristics of the depth data are different from each other. Thus, a separate in-loop filter for depth data may be defined. Hereinafter, an area-based adaptive loop filter and a trilateral loop filter will be described as an in-loop filtering method capable of efficiently coding depth data.

영역 기반의 적응적 루프 필터의 경우, 뎁스 블록의 변화량 (variance)에 기초하여 영역 기반의 적응적 루프 필터를 적용할 지 여부를 결정할 수 있다. 여기서, 뎁스 블록의 변화량은 뎁스 블록 내에서 최대 픽셀값과 최소 픽셀값 간의 차분으로 정의될 수 있다. 뎁스 블록의 변화량과 기결정된 문턱값 간의 비교를 통해서 필터 적용 여부를 결정할 수 있다. 예를 들어, 뎁스 블록의 변화량이 기결정된 문턱값보다 크거나 같은 경우, 뎁스 블록 내의 최대 픽셀값과 최소 픽셀값 간의 차이가 큰 것을 의미하므로 영역 기반의 적응적 루프 필터를 적용하는 것으로 결정할 수 있다. 반대로, 뎁스 변화량이 기결정된 문턱값보다 작은 경우에는 영역 기반의 적응적 루프 필터를 적용하지 아니하는 것으로 결정할 수 있다. 상기 비교 결과에 따라 필터를 적용하는 경우, 필터링된 뎁스 블록의 픽셀값은 소정의 가중치를 이웃 픽셀값에 적용하여 유도될 수 있다. 여기서, 소정의 가중치는 현재 필터링되는 픽셀과 이웃 픽셀 간의 위치 차이 및/또는 현재 필터링되는 픽셀값과 이웃 픽셀값 간의 차분값에 기초하여 결정될 수 있다. 또한, 이웃 픽셀값은 뎁스 블록 내에 포함된 픽셀값 중에서 현재 필터링되는 픽셀값을 제외한 어느 하나를 의미할 수 있다.In the case of an area-based adaptive loop filter, it may be determined whether to apply an area-based adaptive loop filter based on the variance of the depth block. Here, the variation amount of the depth block can be defined as a difference between the maximum pixel value and the minimum pixel value in the depth block. It is possible to decide whether to apply the filter by comparing the variation amount of the depth block with the predetermined threshold value. For example, if the variation of the depth block is greater than or equal to the predetermined threshold value, it means that the difference between the maximum pixel value and the minimum pixel value in the depth block is large, so that it can be determined to apply the area-based adaptive loop filter . Conversely, when the depth variation is smaller than the predetermined threshold value, it can be determined that the area-based adaptive loop filter is not applied. When the filter is applied according to the comparison result, the pixel value of the filtered depth block may be derived by applying a predetermined weight to the neighboring pixel value. Here, the predetermined weight may be determined based on the positional difference between the currently filtered pixel and the neighboring pixel and / or the difference value between the currently filtered pixel value and the neighboring pixel value. In addition, the neighboring pixel value may mean any one of the pixel values included in the depth block excluding the pixel value currently filtered.

본 발명에 따른 트라일래터럴 루프 필터는 영역 기반의 적응적 루프 필터와 유사하나, 텍스쳐 데이터를 추가적으로 고려한다는 점에서 차이가 있다. 구체적으로, 트라일래터럴 루프 필터는 다음의 세가지 조건을 비교하여, 이를 만족하는 이웃 픽셀의 뎁스 데이터를 추출할 수 있다. The Tracheal Loop Filter according to the present invention is similar to the region-based adaptive loop filter, but differs in that it additionally considers the texture data. Specifically, the trilateral loop filter compares the following three conditions and extracts depth data of neighboring pixels satisfying the following three conditions.

조건 1.

Figure pat00003
Condition 1.
Figure pat00003

조건 2.

Figure pat00004
Condition 2.
Figure pat00004

조건 3.

Figure pat00005
Condition 3.
Figure pat00005

조건 1은 뎁스 블록 내의 현재 픽셀(p)와 이웃 픽셀(q) 간의 위치 차이를 기결정된 매개변수

Figure pat00006
과 비교하는 것이고, 조건 2는 현재 픽셀(p)의 뎁스 데이터와 이웃 픽셀(q)의 뎁스 데이터 간의 차분을 기결정된 매개변수 와 비교하는 것이며, 조건 3은 현재 픽셀(p)의 텍스쳐 데이터와 이웃 픽셀(q)의 텍스쳐 데이터 간의 차분을 기결정된 매개변수
Figure pat00008
과 비교하는 것이다.Condition 1 represents the positional difference between the current pixel p and the neighboring pixel q in the depth block as a predetermined parameter
Figure pat00006
And condition 2 is to compare the difference between the depth data of the current pixel p and the depth data of the neighboring pixel q to a predetermined parameter And condition 3 is to compare the difference between the texture data of the current pixel p and the texture data of the neighboring pixel q to a predetermined parameter
Figure pat00008
.

상기 세가지 조건을 만족하는 이웃 픽셀들을 추출하고, 이들 뎁스 데이터의 중간값 또는 평균값으로 현재 픽셀(p)을 필터링할 수 있다.It is possible to extract neighboring pixels satisfying the above three conditions and to filter the current pixel p with an intermediate value or an average value of these depth data.

복호 픽쳐 버퍼부(Decoded Picture Buffer unit)(600)에서는 화면 간 예측을 수행하기 위해서 이전에 코딩된 텍스쳐 픽쳐 또는 뎁스 픽쳐를 저장하거나 개방하는 역할 등을 수행한다. 이 때 복호 픽쳐 버퍼부(600)에 저장하거나 개방하기 위해서 각 픽쳐의 frame_num 과 POC(Picture Order Count)를 이용할 수 있다. 나아가, 뎁스 코딩에 있어서 상기 이전에 코딩된 픽쳐들 중에는 현재 뎁스 픽쳐와 다른 시점에 있는 뎁스 픽쳐들도 있으므로, 이러한 픽쳐들을 참조 픽쳐로서 활용하기 위해서는 뎁스 픽쳐의 시점을 식별하는 시점 식별 정보를 이용할 수도 있다. 복호 픽쳐 버퍼부(600)는 보다 유연하게 화면 간 예측을 실현하기 위하여 적응 메모리 관리 방법(Memory Management Control Operation Method)과 이동 윈도우 방법(Sliding Window Method) 등을 이용하여 참조 픽쳐를 관리할 수 있다. 이는 참조 픽쳐와 비참조 픽쳐의 메모리를 하나의 메모리로 통일하여 관리하고 적은 메모리로 효율적으로 관리하기 위함이다. 뎁스 코딩에 있어서, 뎁스 픽쳐들은 복호 픽쳐 버퍼부 내에서 텍스쳐 픽쳐들과 구별하기 위하여 별도의 표시로 마킹될 수 있고, 상기 마킹 과정에서 각 뎁스 픽쳐를 식별해주기 위한 정보가 이용될 수 있다.A decoded picture buffer unit (600) performs a function of storing or opening a previously coded texture picture or a depth picture to perform inter-picture prediction. At this time, frame_num and picture order count (POC) of each picture can be used to store or open the picture in the decoding picture buffer unit 600. Further, among the previously coded pictures in the depth coding, since there are depth pictures that are different from the current depth picture, in order to utilize such pictures as a reference picture, time identification information for identifying the time of the depth picture may be used have. The decoded picture buffer unit 600 can manage reference pictures using a memory management control operation method and a sliding window method in order to more flexibly perform inter-picture prediction. This is to uniformly manage the memories of the reference picture and the non-reference picture into one memory and efficiently manage them with a small memory. In the depth coding, the depth pictures may be marked with a separate mark in order to distinguish them from the texture pictures in the decoding picture buffer unit, and information for identifying each depth picture in the marking process may be used.

인터 예측부(700)는 복호 픽쳐 버퍼부(600)에 저장된 참조 픽쳐와 모션 정보를 이용하여 현재 블록의 모션 보상을 수행할 수 있다. 본 명세서에서 모션 정보라 함은 모션 벡터, 레퍼런스 인덱스 정보를 포함하는 광의의 개념으로 이해될 수 있다. 또한, 인터 예측부(700)는 모션 보상을 수행하기 위해 시간적 인터 예측을 수행할 수 있다. 시간적 인터 예측이라 함은 현재 텍스쳐 블록과 동일 시점 및 다른 시간대에 위치한 참조 픽쳐 및 현재 텍스쳐 블록의 모션 정보를 이용한 인터 예측을 의미할 수 있다. 또한, 복수 개의 카메라에 의해 촬영된 다시점 영상의 경우, 시간적 인터 예측뿐만 아니라 시점 간 예측을 수행할 수도 있다. 상기 시점 간 예측에 이용되는 모션 정보는 변이 벡터(disparity vector) 또는 인터뷰 모션 벡터(inter-view motion vector)를 포함할 수 있다. 상기 변이 벡터를 이용하여 시점 간 예측을 수행하는 방법에 대해서는 이하 도 2를 참조하여 살펴 보기로 한다.
The inter prediction unit 700 may perform motion compensation of the current block using the reference picture and the motion information stored in the decoding picture buffer unit 600. [ In the present specification, the motion information can be understood as a broad concept including motion vectors and reference index information. In addition, the inter prediction unit 700 may perform temporal inter prediction to perform motion compensation. Temporal inter prediction may refer to inter prediction using motion information of a current texture block and a reference picture located at the same time and at a different time in the current texture block. Also, in the case of a multi-view image captured by a plurality of cameras, temporal inter prediction as well as inter-view prediction may be performed. The motion information used for the inter-view prediction may include a disparity vector or an inter-view motion vector. A method of performing inter-view prediction using the disparity vector will be described with reference to FIG.

도 2는 본 발명이 적용되는 일실시예로서, 변이 벡터에 기초하여 시점 간 예측을 수행하는 방법을 도시한 것이다.FIG. 2 illustrates a method of performing an inter-view prediction based on a disparity vector according to an embodiment to which the present invention is applied.

도 2를 참조하면, 현재 텍스쳐 블록의 변이 벡터(disparity vector)를 유도할 수 있다(S200).Referring to FIG. 2, a disparity vector of a current texture block may be derived (S200).

예를 들어, 현재 텍스쳐 블록에 대응하는 뎁스 영상으로부터 변이 벡터를 유도할 수 있으며, 이는 도 3을 참조하여 자세히 살펴 보도록 한다.For example, the disparity vector may be derived from the depth image corresponding to the current texture block, which will be described in detail with reference to FIG.

또한, 현재 텍스쳐 블록에 공간적으로 인접한 이웃 블록으로부터 유도될 수도 있고, 현재 텍스쳐 블록과 다른 시간대에 위치한 시간적 이웃 블록으로부터 유도될 수도 있다. 현재 텍스쳐 블록의 공간적/시간적 이웃 블록으로부터 변이 벡터를 유도하는 방법에 대해서는 도 4를 참조하여 살펴 보도록 한다.It may also be derived from a neighboring block that is spatially adjacent to the current texture block or may be derived from a temporal neighbor block located at a different time zone from the current texture block. A method of deriving a variation vector from a spatial / temporal neighboring block of a current texture block will be described with reference to FIG.

도 2를 참조하면, S200 단계에서 유도된 변이 벡터를 이용하여 현재 텍스쳐 블록의 시점 간 예측(inter-view prediction)을 수행할 수 있다(S210).Referring to FIG. 2, inter-view prediction of the current texture block may be performed using the transition vector derived in operation S200 (S210).

예를 들어, 변이 벡터에 의해서 특정된 참조 블록의 텍스쳐 데이터를 이용하여 현재 텍스쳐 블록의 텍스쳐 데이터를 예측하거나 복원할 수 있다. 여기서, 참조 블록은 현재 텍스쳐 블록의 시점 간 예측에 이용되는 시점 즉, 참조 시점에 속할 수 있다. 상기 참조 블록은 현재 텍스쳐 블록과 동일 시간대에 위치한 참조 픽쳐에 속할 수 있다.For example, the texture data of the current texture block can be predicted or restored using the texture data of the reference block specified by the variation vector. Here, the reference block may belong to the time point used for the inter-view prediction of the current texture block, that is, the reference point. The reference block may belong to a reference picture located in the same time zone as the current texture block.

또한, 상기 변이 벡터를 이용하여 참조 시점에 속한 참조 블록을 특정하고, 상기 특정된 참조 블록의 시간적 모션 벡터를 이용하여 현재 텍스쳐 블록의 시간적 모션 벡터를 유도할 수도 있다. 여기서, 시간적 모션 벡터는 시간적 인터 예측에 이용되는 모션 벡터를 의미하는 것으로, 시점 간 예측에 이용되는 변이 벡터와 구별될 수 있다.
In addition, a reference block belonging to a reference time point may be specified using the variation vector, and a temporal motion vector of the current texture block may be derived using the temporal motion vector of the specified reference block. Here, the temporal motion vector means a motion vector used for temporal inter prediction, and can be distinguished from a transition vector used for inter-view prediction.

도 3은 본 발명이 적용되는 일실시예로서, 뎁스 영상의 뎁스 데이터를 이용하여 현재 텍스쳐 블록의 변이 벡터를 유도하는 방법을 도시한 것이다.FIG. 3 illustrates a method of deriving a variation vector of a current texture block using depth data of a depth image according to an embodiment of the present invention. Referring to FIG.

도 3을 참조하면, 현재 텍스쳐 블록의 위치 정보에 기초하여 현재 텍스쳐 블록에 대응하는 뎁스 픽쳐 내의 뎁스 블록 (이하, 현재 뎁스 블록이라 한다.)의 위치 정보를 획득할 수 있다(S300).Referring to FIG. 3, position information of a depth block (hereinafter referred to as a current depth block) in a depth picture corresponding to a current texture block may be obtained based on position information of a current texture block (S300).

현재 뎁스 블록의 위치는 뎁스 픽쳐와 현재 픽쳐 간의 공간 해상도를 고려하여 결정될 수 있다. The position of the current depth block can be determined in consideration of the spatial resolution between the depth picture and the current picture.

예를 들어, 뎁스 픽쳐와 현재 픽쳐가 동일한 공간 해상도로 코딩된 경우, 현재 뎁스 블록의 위치는 현재 픽쳐의 현재 텍스쳐 블록과 동일 위치의 블록으로 결정될 수 있다. 한편, 현재 픽쳐와 뎁스 픽쳐가 상이한 공간 해상도로 코딩될 수도 있다. 카메라와 객체 간의 거리 정보를 나타내는 뎁스 정보의 특성상, 공간 해상도를 낮춰서 코딩하더라도 코딩 효율이 크게 떨어지지 아니할 수 있기 때문이다. 따라서, 뎁스 픽쳐의 공간 해상도가 현재 픽쳐보다 낮게 코딩된 경우, 디코더는 현재 뎁스 블록의 위치 정보를 획득하기 전에 뎁스 픽쳐에 대한 업샘플링 과정을 수반할 수 있다. 또한, 업샘플링된 뎁스 픽쳐와 현재 픽쳐 간의 화면비율 (aspect ratio)이 정확히 일치하지 아니하는 경우, 업샘플링된 뎁스 픽쳐 내에서 현재 뎁스 블록의 위치 정보를 획득함에 있어서 오프셋 정보를 추가적으로 고려할 수 있다. 여기서, 오프셋 정보는 상단 오프셋 정보, 좌측 오프셋 정보, 우측 오프셋 정보, 하단 오프셋 정보 중 적어도 하나를 포함할 수 있다. 상단 오프셋 정보는 업샘플링된 뎁스 픽쳐의 상단에 위치한 적어도 하나의 픽셀과 현재 픽쳐의 상단에 위치한 적어도 하나의 픽셀 간의 위치 차이를 나타낼 수 있다. 좌측, 우측, 하단 오프셋 정보 역시 동일한 방식으로 각각 정의될 수 있다.For example, if the depth picture and the current picture are coded with the same spatial resolution, the current depth block may be determined to be the same block as the current texture block of the current picture. On the other hand, the current picture and the depth picture may be coded with different spatial resolutions. Since the depth information indicating the distance information between the camera and the object has the characteristic that the coding efficiency may not decrease significantly even if the spatial resolution is lowered. Thus, if the spatial resolution of the depth picture is coded lower than the current picture, the decoder may involve an upsampling process on the depth picture before acquiring the position information of the current depth block. In addition, when the aspect ratio between the upsampled depth picture and the current picture does not exactly coincide, offset information may be additionally considered in acquiring the position information of the current depth block in the upsampled depth picture. Here, the offset information may include at least one of top offset information, left offset information, right offset information, and bottom offset information. The top offset information may indicate a positional difference between at least one pixel located at the top of the upsampled depth picture and at least one pixel located at the top of the current picture. Left, right, and bottom offset information may also be defined in the same manner, respectively.

도 3을 참조하면, 현재 뎁스 블록의 위치 정보에 해당하는 뎁스 데이터를 획득할 수 있다(S310).Referring to FIG. 3, the depth data corresponding to the position information of the current depth block may be obtained (S310).

현재 뎁스 블록 내에 복수 개의 픽셀이 존재하는 경우, 현재 뎁스 블록의 코너 픽셀(corner pixel)에 대응하는 뎁스 데이터가 이용될 수 있다. 또는, 현재 뎁스 블록의 중앙 픽셀(center pixel)에 대응하는 뎁스 데이터가 이용될 수도 있다. 또는, 복수 개의 픽셀에 대응하는 복수 개의 뎁스 데이터 중에서 최대값, 최소값, 최빈값 중 어느 하나가 선택적으로 이용될 수도 있고, 복수 개의 뎁스 데이터의 평균값이 이용될 수도 있다. If there are a plurality of pixels in the current depth block, the depth data corresponding to the corner pixels of the current depth block may be used. Alternatively, depth data corresponding to the center pixel of the current depth block may be used. Alternatively, one of a maximum value, a minimum value, and a mode value may be selectively used among a plurality of depth data corresponding to a plurality of pixels, or an average value of a plurality of depth data may be used.

도 3을 참조하면, S310 단계에서 획득된 뎁스 데이터를 이용하여 현재 텍스쳐 블록의 변이 벡터를 유도할 수 있다(S320).Referring to FIG. 3, the variation vector of the current texture block may be derived using the depth data obtained in operation S310 (S320).

예를 들어, 현재 텍스쳐 블록의 변이 벡터는 다음 수학식 3과 같이 유도될 수 있다.For example, the transition vector of the current texture block may be derived as: < EMI ID = 3.0 >

Figure pat00009
Figure pat00009

수학식 3을 참조하면, v는 뎁스 데이터를, a는 스케일링 팩터를, f는 변이 벡터를 유도하기 위해 이용되는 오프셋을 나타낸다. 상기 스케일링 팩터 a와 오프셋 f는 비디오 파라미터 세트 또는 슬라이스 헤더에서 시그날링될 수도 있고, 디코더에 기-설정된 값일 수도 있다. n은 비트 쉬프트의 값을 나타내는 변수이며, 이는 변이 벡터의 정확도에 따라 가변적으로 결정될 수 있다.
Referring to Equation (3), v represents depth data, a represents a scaling factor, and f represents an offset used to derive a variation vector. The scaling factor a and the offset f may be signaled in a video parameter set or a slice header, or may be a pre-set value in a decoder. n is a variable indicating the value of the bit shift, which can be variably determined according to the accuracy of the variation vector.

도 4는 본 발명이 적용되는 일실시예로서, 현재 텍스쳐 블록의 공간적/시간적 이웃 블록의 후보를 도시한 것이다.FIG. 4 illustrates a candidate spatial / temporal neighbor block of a current texture block according to an embodiment of the present invention. Referring to FIG.

도 4(a)를 참조하면, 공간적 이웃 블록은 현재 텍스쳐 블록의 좌측 이웃 블록(A1), 상단 이웃 블록(B1), 좌측하단 이웃 블록(A0), 상단우측 이웃 블록(B0) 또는 상단좌측 이웃 블록(B2) 중 적어도 하나를 포함할 수 있다.Referring to FIG. 4A, the spatial neighboring block includes a left neighbor block A1, an upper neighbor block B1, a lower left neighbor block A0, an upper right neighbor block B0, And block B2.

도 4(b)를 참조하면, 시간적 이웃 블록은 현재 텍스쳐 블록과 동일 위치의 블록을 의미할 수 있다. 구체적으로, 시간적 이웃 블록은 현재 텍스쳐 블록과 다른 시간대에 위치한 픽쳐에 속하는 블록으로서, 현재 텍스쳐 블록의 하단우측 픽셀에 대응하는 블록(BR), 현재 텍스쳐 블록의 중앙 픽셀에 대응하는 블록(CT) 또는 현재 텍스쳐 블록의 상단좌측 픽셀에 대응하는 블록(TL) 중 적어도 하나를 포함할 수 있다. Referring to FIG. 4B, the temporally neighboring block may denote a block in the same position as the current texture block. Specifically, the temporal neighboring block is a block belonging to a picture located at a time zone different from the current texture block, and includes a block (BR) corresponding to the lower right pixel of the current texture block, a block (CT) corresponding to the center pixel of the current texture block or And a block TL corresponding to the upper left pixel of the current texture block.

현재 텍스쳐 블록의 변이 벡터는 상기 공간적/시간적 이웃 블록 중 변이 보상된 예측 블록(disparity-compensated prediction block, 이하 DCP 블록이라 함)으로부터 유도될 수 있다. 여기서, DCP 블록은 변이 벡터를 이용한 시점 간 텍스쳐 예측(inter-view texture prediction)을 통해 부호화된 블록을 의미할 수 있다. 다시 말해, DCP 블록은 변이 벡터에 의해 특정된 참조 블록의 텍스쳐 데이터를 이용하여 시점 간 예측을 수행할 수 있다. 이 경우, 현재 텍스쳐 블록의 변이 벡터는 DCP 블록이 시점 간 텍스쳐 예측을 위해 이용한 변이 벡터를 이용하여 예측되거나 복원될 수 있다. The displacement vector of the current texture block may be derived from a disparity-compensated prediction block (hereinafter referred to as a DCP block) among the spatially / temporally neighboring blocks. Here, the DCP block may be a block encoded through inter-view texture prediction using a transition vector. In other words, the DCP block can perform the inter-view prediction using the texture data of the reference block specified by the disparity vector. In this case, the transition vector of the current texture block can be predicted or restored by using the transition vector used for the inter-view texture prediction of the DCP block.

또는, 현재 텍스쳐 블록의 변이 벡터는 상기 공간적 이웃 블록 중 변이 벡터 기반의 모션 보상된 예측 블록(disparity vector based-motion compensation prediction block, 이하 DV-MCP 블록이라 함)으로부터 유도될 수도 있다. 여기서, DV-MCP 블록은 변이 벡터를 이용한 시점 간 모션 예측(inter-view motion prediction)을 통해 부호화된 블록을 의미할 수 있다. 다시 말해, DV-MCP 블록은 변이 벡터에 의해 특정된 참조 블록의 시간적 모션 벡터를 이용하여 시간적 인터 예측을 수행할 수 있다. 이 경우, 현재 텍스쳐 블록의 변이 벡터는 DV-MCP 블록이 참조 블록의 시간적 모션 벡터를 획득하기 위해 이용한 변이 벡터를 이용하여 예측되거나 복원될 수도 있다.Alternatively, the disparity vector of the current texture block may be derived from a disparity vector based motion compensation prediction block (hereinafter referred to as a DV-MCP block) based on the disparity vector among the spatially neighboring blocks. Here, the DV-MCP block may mean a block coded through inter-view motion prediction using a disparity vector. In other words, the DV-MCP block can perform temporal inter prediction using the temporal motion vector of the reference block specified by the disparity vector. In this case, the disparity vector of the current texture block may be predicted or reconstructed using the disparity vector used for obtaining the temporal motion vector of the reference block of the DV-MCP block.

상기 현재 텍스쳐 블록은 기-정의된 우선 순위에 따라 공간적/시간적 이웃 블록이 DCP 블록에 해당하는지를 탐색하고, 최초로 탐색된 DCP 블록으로부터 변이 벡터를 유도할 수 있다. 기-정의된 우선 순위의 예로, 공간적 이웃 블록->시간적 이웃 블록의 우선 순위로 탐색을 수행할 수 있고, 공간적 이웃 블록 중에서는 A1->B1->B0->A0->B2의 우선 순위로 DCP 블록에 해당하는지를 탐색할 수 있다. 다만, 이는 우선 순위의 일실시예에 불과하며, 당업자에게 자명한 범위 내에서 상이하게 결정될 수 있음은 물론이다. The current texture block may be searched for whether a spatial / temporal neighbor block corresponds to a DCP block according to a predefined priority, and a variation vector may be derived from the first searched DCP block. As an example of the predefined priority, a search can be performed with priority of a spatial neighbor block -> temporal neighbor block, and among the spatial neighbor blocks, a priority order of A1-> B1-> B0-> A0-> B2 It is possible to search whether it corresponds to a DCP block. However, it is to be understood that this is merely one embodiment of the priority order and can be determined differently within a range that is obvious to a person skilled in the art.

만일 공간적/시간적 이웃 블록 중 어느 하나도 DCP 블록에 해당하지 아니하는 경우, 해당 공간적 이웃 블록이 DV-MCP 블록에 해당하는지를 추가적으로 탐색하고, 마찬가지로 최초로 탐색된 DV-MCP 블록으로부터 변이 벡터를 유도할 수 있다.
If any of the spatially / temporally neighboring blocks does not correspond to the DCP block, the spatial neighboring block may be additionally searched for whether it corresponds to the DV-MCP block, and the variation vector may be derived from the first searched DV-MCP block .

도 5는 본 발명이 적용되는 일실시예로서, 세그먼트 기반의 뎁스 코딩 기법에 따라 뎁스 영상을 디코딩하는 방법을 도시한 것이다.FIG. 5 illustrates a method of decoding a depth image according to a segment-based depth coding technique according to an embodiment of the present invention. Referring to FIG.

본 발명에서 세그먼트 기반의 뎁스 코딩 기법이라 함은 뎁스 영상(예를 들어, 코딩 블록 또는 예측 블록)에 관한 잔여 뎁스 값들을 개별적으로 부호화하지 아니하고, 이들을 대표하는 하나의 잔여 뎁스 값(이하, 대표 잔여 뎁스 값이라 함)만을 시그날링하는 코딩 기법이다. 하나의 뎁스 영상은 적어도 하나의 세그먼트로 구성될 수 있다. 만일 뎁스 영상이 2개의 이상의 세그먼트로 구성된 경우, 각 세그먼트 별로 상기 대표 잔여 뎁스 값을 시그날링할 수 있다. 여기서, 대표 잔여 뎁스 값은 원본 뎁스 값과 예측 뎁스 값 간의 차이를 평균하여 유도될 수 있다. 예를 들어, 뎁스 영상의 각 픽셀 별로 원본 뎁스 값과 예측 뎁스 값의 차이값을 획득하고, 획득된 차이값들의 평균치를 대표 잔여 뎁스 값으로 정의할 수 있다. 또는, 뎁스 영상의 원본 뎁스 값들의 평균치와 예측 뎁스 값들의 평균치 간의 차이값을 대표 잔여 뎁스 값으로 정의할 수도 있다.In the present invention, the segment-based depth coding technique is a technique in which the residual depth values regarding a depth image (e.g., a coding block or a prediction block) are not separately encoded, and one residual depth value (Hereinafter referred to as " depth value "). One depth image may be composed of at least one segment. If the depth image is composed of two or more segments, the representative residual depth value can be signaled for each segment. Here, the representative residual depth value may be derived by averaging the difference between the original depth value and the predicted depth value. For example, the difference value between the original depth value and the prediction depth value can be obtained for each pixel of the depth image, and the average value of the obtained difference values can be defined as the representative residual depth value. Alternatively, a difference value between the average value of the original depth values of the depth image and the average value of the prediction depth values may be defined as a representative residual depth value.

상술한 세그먼트 기반의 뎁스 코딩 기법을 이용할 경우, 각 픽셀 별로 잔여 뎁스 값을 부호화하는 경우에 비해 잔여 뎁스 값에 관한 비트레이트를 줄일 수 있다.Using the above-described segment-based depth coding scheme, the bit rate for the residual depth value can be reduced compared to the case of encoding the residual depth value for each pixel.

도 5를 참조하면, 비트스트림으로부터 오프셋 절대값(depth_dc_abs) 및 오프셋 부호 정보(depth_dc_sign_flag)를 획득할 수 있다(S500).Referring to FIG. 5, an offset absolute value (depth_dc_abs) and offset sign information (depth_dc_sign_flag) can be obtained from a bitstream (S500).

여기서, 오프셋 절대값과 오프셋 부호 정보는 오프셋 값(DcOffset)을 유도하기 위해 이용되는 신택스이다. 즉, 오프셋 값(DcOffset)은 오프셋 절대값과 오프셋 부호 정보로 코딩될 수 있다. Here, the offset absolute value and the offset code information are the syntax used to derive the offset value DcOffset. That is, the offset value DcOffset can be coded into the offset absolute value and the offset code information.

구체적으로, 오프셋 절대값은 오프셋 값(DcOffset)의 절대값을 의미하고, 오프셋 부호 정보는 오프셋 값(DcOffset)의 부호(sign)를 나타낼 수 있다. 상기 오프셋 절대값은 문맥 기반의 적응적 이진 산술 코딩(context-based adaptive binary arithmetic coding)에 기반한 엔트로피 디코딩을 통해 획득될 수 있으며, 이에 대해서는 도 6 내지 도 9를 참조하여 살펴 보기로 한다.Specifically, the absolute value of the offset means the absolute value of the offset value (DcOffset), and the offset code information can indicate the sign of the offset value (DcOffset). The absolute value of the offset can be obtained through entropy decoding based on context-based adaptive binary arithmetic coding, which will be described with reference to FIGS. 6 to 9. FIG.

도 5를 참조하면, S500 단계에서 획득된 오프셋 절대값과 오프셋 부호 정보를 이용하여 오프셋 값(DcOffset)을 유도할 수 있다(S510).Referring to FIG. 5, an offset value DcOffset may be derived using the offset absolute value and offset sign information obtained in operation S500 (S510).

여기서, 오프셋 값(DcOffset)은 상기 대표 잔여 뎁스 값으로 이용될 수 있다. 또는, 대표 잔여 뎁스 값이 뎁스 룩업 테이블(depth look-up table)을 이용하여 부호화된 경우, 상기 오프셋 값(DcOffset)은 대표 잔여 뎁스 값 자체가 아닌 대표 잔여 뎁스 값에 매핑되는 인덱스로 정의될 수도 있다. 상기 뎁스 룩업 테이블은 비디오 영상의 뎁스 값과 이에 할당된 인덱스 간의 매핑 관계를 정의한 테이블이다. 이와 같이, 뎁스 룩업 테이블을 이용할 경우, 뎁스 값 자체를 부호화하지 아니하고 뎁스 값에 할당된 인덱스만을 부호화함으로써 부호화 효율을 향상시킬 수 있다.Here, the offset value DcOffset may be used as the representative residual depth value. Alternatively, when the representative residual depth value is coded using a depth look-up table, the offset value DcOffset may be defined as an index mapped to the representative residual depth value instead of the representative residual depth value itself have. The depth lookup table defines a mapping relationship between a depth value of a video image and an index assigned to the depth value. In this manner, when the depth lookup table is used, the encoding efficiency can be improved by encoding only the index assigned to the depth value without encoding the depth value itself.

따라서, 대표 잔여 뎁스 값을 부호화하는 과정에서 뎁스 룩업 테이블이 이용되는지 여부에 따라 오프셋 값(DcOffset)으로부터 대표 잔여 뎁스 값을 유도하는 방법이 상이할 것이다.Therefore, the method of deriving the representative residual depth value from the offset value DcOffset depending on whether the depth lookup table is used in the process of encoding the representative residual depth value will be different.

도 5를 참조하면, 뎁스 룩업 테이블이 이용되는지 여부를 확인할 수 있다(S520). Referring to FIG. 5, it can be checked whether a depth lookup table is used (S520).

구체적으로, 뎁스 룩업 테이블이 이용되는지 여부는 뎁스 룩업 테이블 플래그(dlt_flag)를 이용하여 확인할 수 있다. 상기 뎁스 룩업 테이블 플래그는 잔여 뎁스 값을 부호화 또는 복호화 과정에서 뎁스 룩업 테이블이 이용되는지 여부를 나타내기 위해 부호화된 신택스이다. 상기 뎁스 룩업 테이블 플래그는 해당 비디오 영상이 포함된 레이어 또는 시점 별로 부호화될 수 있다. 또는, 상기 뎁스 룩업 테이블 플래그는 해당 비디오 영상이 포함된 시퀀스 또는 슬라이스 별로 부호화될 수도 있다.Specifically, whether a depth lookup table is used can be confirmed by using a depth lookup table flag dlt_flag. The depth lookup table flag is a syntax that is encoded to indicate whether a depth lookup table is used in encoding or decoding a residual depth value. The depth lookup table flag may be encoded for each layer or view including the corresponding video image. Alternatively, the depth lookup table flag may be encoded for each sequence or slice including the corresponding video image.

도 5를 참조하면, 뎁스 룩업 테이블이 이용되는 것으로 확인된 경우, S510 단계에서 유도된 오프셋 값(DcOffset)과 뎁스 룩업 테이블을 이용하여 대표 잔여 뎁스 값을 유도할 수 있다(S530).Referring to FIG. 5, if it is determined that the depth lookup table is used, the representative residual depth value may be derived using the offset value DcOffset derived in step S510 and the depth lookup table in operation S530.

구체적으로, 뎁스 룩업 테이블을 이용하여 상기 오프셋 값(DcOffset)에 대응하는 대표 잔여 뎁스 값을 유도할 수 있다. 예를 들어, 대표 잔여 뎁스 값은 다음 수학식 4와 같이 유도될 수 있다.Specifically, a representative residual depth value corresponding to the offset value (DcOffset) can be derived using a depth lookup table. For example, the representative residual depth value can be derived as shown in the following equation (4).

Figure pat00010
Figure pat00010

상기 수학식 4에서 DltIdxToVal[]는 뎁스 룩업 테이블을 이용하여 인덱스를 뎁스 값으로 변환하는 함수를 의미하고, DltValToIdx[]는 뎁스 룩업 테이블을 이용하여 뎁스 값을 인덱스로 변환하는 함수를 의미한다.In Equation (4), DltIdxToVal [] denotes a function for converting an index into a depth value using a depth lookup table, and DltValToIdx [] denotes a function for converting a depth value into an index using a depth lookup table.

먼저, 뎁스 룩업 테이블을 이용하여 뎁스 영상의 예측 뎁스 값(dcPred)을 이에 대응하는 제1 인덱스(DltValToIdx[dcPred])로 변환할 수 있다. 예를 들어, 뎁스 룩업 테이블에 정의된 뎁스 값들 중에서 상기 예측 뎁스 값(dcPred)과 동일한 뎁스 값 또는 상기 예측 뎁스 값(dcPred)과의 차이를 최소로 하는 뎁스 값을 선택하고, 상기 선택된 뎁스 값에 할당된 인덱스를 제1 인덱스로 결정할 수 있다. 여기서, 예측 뎁스 값(dcPred)은 복원된 뎁스 영상의 코너에 위치한 샘플들의 평균값으로 유도될 수도 있다. 이 경우, 상기 코너에 위치한 샘플들은 뎁스 영상 내의 상단좌측 코너 샘플, 상단우측 코너 샘플, 하단좌측 코너 샘플 및 하단우측 코너 샘플을 포함할 수 있다. 상기 변환된 제1 인덱스(DltValToIdx[dcPred])와 오프셋 값(DcOffset)을 더하여 제2 인덱스를 획득하고, 뎁스 룩업 테이블을 이용하여 제2 인덱스를 이에 대응하는 뎁스 값(이하, 복원 뎁스 값이라 함)으로 변환할 수 있다. 상기 복원 뎁스 값에서 상기 예측 뎁스 값(dcPred)를 뺀 값을 대표 잔여 뎁스 값(dcVal)으로 결정할 수 있다.First, the predictive depth value dcPred of the depth image can be converted into a corresponding first index DltValToIdx [dcPred] using a depth lookup table. For example, a depth value that minimizes the difference between the depth value defined in the depth lookup table and the predicted depth value (dcPred) or the predicted depth value (dcPred) is selected, and the selected depth value The assigned index can be determined as the first index. Here, the prediction depth value dcPred may be derived as an average value of samples located at the corners of the restored depth image. In this case, the samples located at the corners may include upper left corner samples, upper right corner samples, lower left corner samples, and lower right corner samples in the depth image. The second index is obtained by adding the transformed first index DltValToIdx [dcPred] and the offset value DcOffset, and the second index is transformed to a corresponding depth value (hereinafter referred to as a restoration depth value) by using the depth lookup table ). ≪ / RTI > A value obtained by subtracting the prediction depth value dcPred from the restoration depth value may be determined as a representative remaining depth value dcVal.

도 5를 참조하면, 뎁스 룩업 테이블이 이용되지 아니하는 것으로 확인된 경우, S510 단계에서 유도된 오프셋 값(DcOffset)을 이용하여 대표 잔여 뎁스 값을 유도할 수 있다(S540). 예를 들어, 유도된 오프셋 값(DcOffset)을 대표 잔여 뎁스 값으로 설정할 수 있다. Referring to FIG. 5, if it is determined that the depth lookup table is not used, the representative residual depth value may be derived using the offset value DcOffset derived in step S510 (S540). For example, the derived offset value (DcOffset) can be set as the representative residual depth value.

상기 S530 단계 또는 S540 단계에서 유도된 대표 잔여 뎁스 값을 이용하여 뎁스 영상을 복원할 수 있다(S550).
In operation S550, the depth image may be restored using the representative residual depth value derived in operation S530 or S540.

도 6은 본 발명이 적용되는 일실시예로서, 문맥 기반의 적응적 이진 산술 코딩(context-based adaptive binary arithmetic coding)에 기반한 엔트로피 디코딩을 통해 오프셋 절대값을 획득하는 방법을 도시한 것이다.FIG. 6 illustrates a method of obtaining an absolute value of an offset through entropy decoding based on context-based adaptive binary arithmetic coding according to an embodiment of the present invention. Referring to FIG.

도 6을 참조하면, 문맥 기반의 적응적 이진 산술 코딩으로 부호화된 비트스트림에 대해서 정규 코딩 또는 우회 코딩 과정을 거쳐 빈 스트링(bin string)을 생성할 수 있다(S600).Referring to FIG. 6, a bin string may be generated through a normal coding or a bypass coding process on a bitstream encoded by context-based adaptive binary arithmetic coding (S600).

여기서, 정규 코딩은 문맥 모델링을 사용하여 빈(bin)의 확률을 예측하는 적응적 이진 산술 코딩이며, 우회 코딩은 이진화된 빈 스트링을 그대로 비트스트림으로 출력하는 코딩을 의미할 수 있다. 문맥 모델링은 각 빈에 대한 확률 모델링을 의미하며, 현재 부호화된 빈의 값에 따라 확률이 업데이트될 수 있다. 상기 정규 코딩을 통해 부호화된 경우, 오프셋 절대값에 관한 문맥 모델링 즉, 각 비트의 발생 확률에 기반하여 빈 스트링을 생성할 수 있다.Here, the regular coding is adaptive binary arithmetic coding for predicting the probability of a bin using context modeling, and the bypass coding can mean coding for outputting the binarized bin string as a bitstream. Context modeling means probability modeling for each bin, and the probability can be updated according to the value of the currently encoded bin. When encoded through the regular coding, an empty string can be generated based on context modeling of the absolute value of the offset, that is, probability of occurrence of each bit.

S600 단계에서 생성된 빈 스트링에 대해 역-이진화(inverse-binarization)를 통해서 오프셋 절대값을 획득할 수 있다(S610).The absolute value of the offset may be obtained through inverse-binarization of the bin string generated in operation S600 (S610).

여기서, 역-이진화는 인코더에서 수행된 상기 오프셋 절대값에 대한 이진화 과정의 역과정을 의미할 수 있다. 이진화 방법으로는 단항 이진 부호화(unary binarization), 절삭형 단항 이진 부호화(Truncated unary binarization), 단항/0차 지수 골룸 결합형 이진 부호화(Truncated unary/0th order exponential golomb binarization) 등이 이용될 수 있다.Here, the de-binarization may refer to an inverse process of the binarization process on the absolute value of the offset performed in the encoder. Binarization method, and the like unary binary encoding (unary binarization), a cutting-type unary binary encoding (Truncated unary binarization), unary / zero-th order index Gollum coupled binary coding (Truncated unary / zero th order exponential golomb binarization) may be used .

상기 오프셋 절대값에 대한 이진화는 접두부 빈 스트링(prefix bin string)과 접미부 빈 스트링(suffix bin string)의 조합으로 수행될 수 있다. 여기서, 접두부 빈 스트링과 접미부 빈 스트링은 서로 상이한 이진화 방법을 통해 표현될 수 있다. 예를 들어, 접두부 빈 스트링은 절삭형 단항 이진 부호화를 사용할 수 있고, 접미부 빈 스트링은 0차 지수 골룸 이진화 부호화를 사용할 수 있다. 이하, 도 7 내지 도 9를 참조하여 접두부 빈 스트링을 구성하는 빈의 최대 개수(cMax)에 따른 오프셋 절대값의 이진화 과정을 살펴보도록 한다.
The binarization of the absolute value of the offset may be performed by a combination of a prefix bin string and a suffix bin string. Here, the preamble bin string and the suffix bin string can be represented by different binarization methods. For example, the preamble bin string may use a truncated unary binary encoding, and the suffix bin string may use the zeroth exponent golem binarization encoding. Hereinafter, the process of binarizing the absolute value of the offset according to the maximum number cMax of beans constituting the preamble bin string will be described with reference to FIGS.

도 7 내지 도 9는 본 발명이 적용되는 일실시예로서, 빈의 최대 개수(cMax)에 따른 오프셋 절대값의 이진화 방법을 도시한 것이다.FIGS. 7 to 9 illustrate a method of binarizing an absolute value of an offset according to the maximum number of beans cMax, according to an embodiment to which the present invention is applied.

도 7은 빈의 최대 개수(cMax)가 3으로 설정된 경우의 이진화 방법을 도시한 것이다. 도 7을 참조하면, 오프셋 절대값은 접두부 빈 스트링과 접미부 빈 스트링의 결합으로 표현되며, 접두부 빈 스트링과 접미부 빈 스트링은 절삭형 단항 이진 부호화와 0차 지수 골룸 이진화 부호화로 각각 이진화된다.FIG. 7 shows a binarization method when the maximum number of bins cMax is set to 3. Referring to FIG. 7, the absolute value of the offset is represented by a combination of a preamble bin string and a suffix bin string. The preamble bin string and the suffix bin string are binarized by a cutting type unary binary encoding and a zero order exponent Golomb binary encoding, respectively do.

빈의 최대 개수(cMax)가 3으로 설정되고, 오프셋 절대값이 3인 경우, 접두부 빈 스트링은 111로, 접미부 빈 스트링은 0으로 표현될 수 있다. 오프셋 절대값이 3보다 큰 경우, 접두부 빈 스트링은 111로 고정되고, 접미부 빈 스트링은 오프셋 절대값과 빈의 최대 개수의 차이값을 0차 지수 골룸 이진화 부호화 방법에 따라 이진화하여 표현될 수 있다.If the maximum number of bins (cMax) is set to 3 and the offset absolute value is 3, the preamble bin string can be represented by 111 and the suffix bin string can be represented by 0. If the absolute value of the offset is greater than 3, the preamble bin string is fixed at 111, and the suffix bin string can be represented by binarizing the difference value between the absolute value of the offset and the maximum number of beans according to the zero- have.

예를 들어, 오프셋 절대값에 관한 문맥 모델링을 통해서 111101의 빈 스트링이 생성되었다고 가정한다. 이때, 생성된 빈 스트링 111101을 빈의 최대 개수(cMax)에 기초하여 접두부 빈 스트링과 접미부 빈 스트링으로 구분할 수 있다. 여기서, 빈의 최대 개수(cMax)가 3으로 설정되어 있으므로, 접두부 빈 스트링은 111이고, 접미부 빈 스트링은 101이 될 것이다. For example, assume that an empty string of 111101 is generated through context modeling of the absolute value of the offset. At this time, the generated empty string 111101 can be divided into a preamble empty string and a suffix empty string based on the maximum number (cMax) of bins. Here, since the maximum number cMax of bins is set to 3, the preamble bin string will be 111 and the suffix bin string will be 101.

한편, 절삭형 단항 이진 부호화에 따라 이진화된 상기 접두부 빈 스트링 111에 대해 역-이진화를 수행하면 3을 획득하고, 0차 지수 골룸 이진화 부호화에 따라 이진화된 상기 접미부 빈 스트링 101에 대해 역-이진화를 수행하면 2를 획득할 수 있다. 상기 획득된 3과 2를 더하여 오프셋 절대값으로 5를 획득할 수 있다.
Meanwhile, if inverse binarization is performed on the preamble bin string 111 that has been binarized according to the cutting type unary binary encoding, 3 is obtained, and inverse binarization is performed on the binarized suffix bin string 101 according to the zero- Performing binarization can yield 2. The acquired 3 and 2 can be added to obtain 5 as an offset absolute value.

도 8은 빈의 최대 개수(cMax)가 5로 설정된 경우의 이진화 방법을 도시한 것이다. 도 8을 참조하면, 오프셋 절대값은 접두부 빈 스트링과 접미부 빈 스트링의 결합으로 표현되며, 접두부 빈 스트링과 접미부 빈 스트링은 절삭형 단항 이진 부호화와 0차 지수 골룸 이진화 부호화로 각각 이진화된다.FIG. 8 shows a binarization method when the maximum number of beans cMax is set to 5. Referring to FIG. 8, the absolute value of the offset is represented by a combination of a preamble bin string and a suffix bin string. The preamble bin string and the suffix bin string are binarized by a cutting type unary binary encoding and a zero order exponent Golomb binary encoding, respectively do.

빈의 최대 개수(cMax)가 5로 설정되고, 오프셋 절대값이 5인 경우, 접두부 빈 스트링은 11111로, 접미부 빈 스트링은 0으로 표현될 수 있다. 오프셋 절대값이 5보다 큰 경우, 접두부 빈 스트링은 11111로 고정되고, 접미부 빈 스트링은 오프셋 절대값과 빈의 최대 개수의 차이값을 0차 지수 골룸 이진화 부호화 방법에 따라 이진화하여 표현될 수 있다.If the maximum number of bins (cMax) is set to 5 and the offset absolute value is 5, the preamble bin string may be represented by 11111 and the suffix bin string may be represented by 0. If the absolute value of the offset is greater than 5, the preamble bin string is fixed to 11111, and the suffix bin string can be represented by binarizing the difference value between the absolute value of the offset and the maximum number of beans according to the zero- have.

예를 들어, 오프셋 절대값에 관한 문맥 모델링을 통해서 11111100의 빈 스트링이 생성되었다고 가정한다. 이때, 생성된 빈 스트링 11111100을 빈의 최대 개수(cMax)에 기초하여 접두부 빈 스트링과 접미부 빈 스트링으로 구분할 수 있다. 여기서, 빈의 최대 개수(cMax)가 5로 설정되어 있으므로, 접두부 빈 스트링은 11111이고, 접미부 빈 스트링은 100이 될 것이다. For example, assume that an empty string of 11111100 is created through context modeling of the absolute value of the offset. At this time, the generated empty string 11111100 can be divided into a preamble empty string and a suffix empty string based on the maximum number of bins (cMax). Here, since the maximum number of bins cMax is set to 5, the preamble bin string will be 11111 and the suffix bin string will be 100.

한편, 절삭형 단항 이진 부호화에 따라 이진화된 상기 접두부 빈 스트링 11111에 대해 역-이진화를 수행하면 5를 획득하고, 0차 지수 골룸 이진화 부호화에 따라 이진화된 상기 접미부 빈 스트링 100에 대해 역-이진화를 수행하면 1을 획득할 수 있다. 상기 획득된 5와 1을 더하여 오프셋 절대값으로 6을 획득할 수 있다.
On the other hand, by performing inverse-binarization on the preamble bin string 11111 that is binarized according to the cutting type unary binary encoding, 5 is obtained, and the inverse binarization is performed on the binarized suffix bin string 100 according to the zero- You can obtain 1 by performing binarization. The obtained 5 and 1 can be added to obtain 6 as an offset absolute value.

도 9는 빈의 최대 개수(cMax)가 7로 설정된 경우의 이진화 방법을 도시한 것이다. 도 9를 참조하면, 오프셋 절대값은 접두부 빈 스트링과 접미부 빈 스트링의 결합으로 표현되며, 접두부 빈 스트링과 접미부 빈 스트링은 절삭형 단항 이진 부호화와 0차 지수 골룸 이진화 부호화로 각각 이진화된다.FIG. 9 shows a binarization method when the maximum number of bins cMax is set to 7. FIG. Referring to FIG. 9, the absolute value of the offset is represented by a combination of a preamble bin string and a suffix bin string. The preamble bin string and the suffix bin string are binarized by a cutting type unary binary encoding and a zero order exponent Golomb binary encoding, respectively do.

예를 들어, 빈의 최대 개수(cMax)가 7로 설정되고, 오프셋 절대값이 7인 경우, 접두부 빈 스트링은 1111111로, 접미부 빈 스트링은 0으로 표현될 수 있다. 오프셋 절대값이 7보다 큰 경우, 접두부 빈 스트링은 1111111로 고정되고, 접미부 빈 스트링은 오프셋 절대값과 빈의 최대 개수의 차이값을 0차 지수 골룸 이진화 부호화 방법에 따라 이진화하여 표현될 수 있다.For example, if the maximum number of bins (cMax) is set to 7 and the offset absolute value is 7, the preamble bin string may be represented by 1111111 and the suffix bin string may be represented by 0. If the absolute value of the offset is greater than 7, the preamble bin string is fixed to 1111111, and the suffix bin string can be represented by binarizing the difference value between the absolute value of the offset and the maximum number of beans according to the zero- have.

예를 들어, 오프셋 절대값에 관한 문맥 모델링을 통해서 11111111100의 빈 스트링이 생성되었다고 가정한다. 이때, 생성된 빈 스트링 11111111100을 빈의 최대 개수(cMax)에 기초하여 접두부 빈 스트링과 접미부 빈 스트링으로 구분할 수 있다. 여기서, 빈의 최대 개수(cMax)가 7로 설정되어 있으므로, 접두부 빈 스트링은 1111111이고, 접미부 빈 스트링은 100이 될 것이다. For example, assume that an empty string of 11111111100 has been generated through context modeling of the absolute value of the offset. At this time, the generated empty string 11111111100 can be divided into a preamble empty string and a suffix empty string based on the maximum number of beans (cMax). Here, since the maximum number cMax of bins is set to 7, the preamble bin string will be 1111111 and the suffix bin string will be 100.

한편, 절삭형 단항 이진 부호화에 따라 이진화된 상기 접두부 빈 스트링 11111에 대해 역-이진화를 수행하면 7을 획득하고, 0차 지수 골룸 이진화 부호화에 따라 이진화된 상기 접미부 빈 스트링 100에 대해 역-이진화를 수행하면 1을 획득할 수 있다. 상기 획득된 7과 1을 더하여 오프셋 절대값으로 8을 획득할 수 있다.On the other hand, by performing inverse-binarization on the preamble bin string 11111 binarized according to the cutting type unary binary coding, 7 is obtained, and inverse-binarization is performed on the binarized suffix bin string 100 according to the zero- You can obtain 1 by performing binarization. The obtained 7 and 1 can be added to obtain 8 as an offset absolute value.

Claims (15)

비트스트림으로부터 뎁스 영상에 관한 오프셋 절대값 및 오프셋 부호 정보를 획득하는 단계;
상기 오프셋 절대값과 오프셋 부호 정보를 이용하여 오프셋 값을 유도하는 단계;
상기 뎁스 영상이 뎁스 룩업 테이블을 이용하는지 여부를 고려하여 상기 뎁스 영상에 관한 대표 잔여 뎁스 값을 유도하는 단계; 및
상기 유도된 대표 잔여 뎁스 값을 이용하여 상기 뎁스 영상을 복원하는 단계를 포함하는 것을 특징으로 하는 다시점 비디오 신호 디코딩 방법.
Obtaining offset absolute value and offset sign information with respect to the depth image from the bit stream;
Deriving an offset value using the offset absolute value and offset sign information;
Deriving a representative residual depth value of the depth image considering whether the depth image uses a depth lookup table; And
And restoring the depth image using the derived representative residual depth value.
제1항에 있어서, 상기 오프셋 절대값을 획득하는 단계는,
상기 오프셋 절대값에 관한 문맥 모델링에 기반하여 빈 스트링을 생성하는 단계; 및
상기 생성된 빈 스트링에 대한 역-이진화를 통해 오프셋 절대값을 유도하는 단계를 포함하는 것을 특징으로 하는 다시점 비디오 신호 디코딩 방법.
2. The method of claim 1, wherein obtaining the offset absolute value comprises:
Generating an empty string based on context modeling of the absolute value of the offset; And
And deriving an offset absolute value by inverse-binarizing the generated bin string.
제2항에 있어서,
상기 빈 스트링은 접두부 빈 스트링과 접미부 빈 스트링으로 구성되며,
상기 접두부 빈 스트링은 절삭형 단항 이진 부호화에 기반하여 역-이진화되고, 상기 접미부 빈 스트링은 0차 지수 골룸 이진화 부호화에 기반하여 역-이진화되는 것을 특징으로 하는 다시점 비디오 신호 디코딩 방법.
3. The method of claim 2,
The empty string is composed of a preamble empty string and a suffix empty string,
Wherein the preamble bin string is de-binarized based on a truncated unary binary encoding and the suffix bin string is de-binarized based on a zeroth exponent Golomb binary encoding.
제3항에 있어서, 상기 접두부 빈 스트링을 구성하는 빈의 최대 개수(cMax)는 3으로 설정된 것을 특징으로 하는 다시점 비디오 신호 디코딩 방법.4. The method of claim 3, wherein the maximum number of bins (cMax) constituting the preamble bin string is set to three. 비트스트림으로부터 뎁스 영상에 관한 오프셋 절대값 및 오프셋 부호 정보를 획득하는 엔트로피 디코딩부;
상기 오프셋 절대값과 오프셋 부호 정보를 이용하여 오프셋 값을 유도하고, 상기 뎁스 영상이 뎁스 룩업 테이블을 이용하는지 여부를 고려하여 상기 뎁스 영상에 관한 대표 잔여 뎁스 값을 유도하며, 상기 유도된 대표 잔여 뎁스 값을 이용하여 상기 뎁스 영상을 복원하는 뎁스 영상 복원부를 포함하는 것을 특징으로 하는 다시점 비디오 신호 디코딩 장치.
An entropy decoding unit for obtaining an offset absolute value and offset sign information with respect to the depth image from the bit stream;
Deriving an offset value using the offset absolute value and offset sign information, deriving a representative residual depth value of the depth image considering whether the depth image uses a depth lookup table, And a depth image reconstructing unit for reconstructing the depth image using a value of the depth image reconstructing unit.
제1항에 있어서, 상기 엔트로피 디코딩부는,
상기 오프셋 절대값에 관한 문맥 모델링에 기반하여 빈 스트링을 생성하고, 상기 생성된 빈 스트링에 대한 역-이진화를 통해 오프셋 절대값을 유도하는 것을 특징으로 하는 다시점 비디오 신호 디코딩 장치.
The apparatus of claim 1, wherein the entropy decoding unit comprises:
Generates an empty string based on the context modeling of the absolute value of the offset, and derives an absolute value of the offset by inverse-binarizing the generated empty string.
제6항에 있어서,
상기 빈 스트링은 접두부 빈 스트링과 접미부 빈 스트링으로 구성되며,
상기 접두부 빈 스트링은 절삭형 단항 이진 부호화에 기반하여 역-이진화되고, 상기 접미부 빈 스트링은 0차 지수 골룸 이진화 부호화에 기반하여 역-이진화되는 것을 특징으로 하는 다시점 비디오 신호 디코딩 장치.
The method according to claim 6,
The empty string is composed of a preamble empty string and a suffix empty string,
Wherein the preamble bin string is de-binarized based on a truncated unary binary encoding and the suffix bin string is de-binarized based on a zeroth exponent Golomb binary encoding.
제7항에 있어서, 상기 접두부 빈 스트링을 구성하는 빈의 최대 개수(cMax)는 3으로 설정된 것을 특징으로 하는 다시점 비디오 신호 디코딩 장치.8. The multi-view video signal decoding apparatus of claim 7, wherein the maximum number of bins (cMax) constituting the preamble bin string is set to three. 뎁스 영상에 관한 오프셋 절대값 및 오프셋 부호 정보를 부호화하는 단계;
상기 오프셋 절대값과 오프셋 부호 정보를 이용하여 오프셋 값을 유도하는 단계;
상기 뎁스 영상이 뎁스 룩업 테이블을 이용하는지 여부를 고려하여 상기 뎁스 영상에 관한 대표 잔여 뎁스 값을 유도하는 단계; 및
상기 유도된 대표 잔여 뎁스 값을 이용하여 상기 뎁스 영상을 복원하는 단계를 포함하는 것을 특징으로 하는 다시점 비디오 신호 인코딩 방법.
Encoding an offset absolute value and offset sign information on a depth image;
Deriving an offset value using the offset absolute value and offset sign information;
Deriving a representative residual depth value of the depth image considering whether the depth image uses a depth lookup table; And
And restoring the depth image using the derived representative residual depth value.
제1항에 있어서, 상기 오프셋 절대값을 부호화하는 단계는,
상기 오프셋 절대값에 대한 이진화를 통해 빈 스트링을 생성하는 단계; 및
상기 생성된 빈 스트링에 대해 각 빈의 발생 확률에 기반하여 엔트로피 코딩하는 단계를 포함하는 것을 특징으로 하는 다시점 비디오 신호 인코딩 방법.
2. The method of claim 1, wherein encoding the absolute value of the offset comprises:
Generating an empty string through binarization of the absolute value of the offset; And
And entropy coding based on the occurrence probability of each bin for the generated bin string.
제10항에 있어서,
상기 빈 스트링은 접두부 빈 스트링과 접미부 빈 스트링으로 구성되며,
상기 접두부 빈 스트링은 절삭형 단항 이진 부호화에 기반하여 이진화되고, 상기 접미부 빈 스트링은 0차 지수 골룸 이진화 부호화에 기반하여 진화되는 것을 특징으로 하는 다시점 비디오 신호 인코딩 방법.
11. The method of claim 10,
The empty string is composed of a preamble empty string and a suffix empty string,
Wherein the preamble bin string is binarized based on a truncated unary binary encoding and the suffix bin string evolves based on a zeroth exponent Golomb binary encoding.
제11항에 있어서, 상기 접두부 빈 스트링을 구성하는 빈의 최대 개수(cMax)는 3으로 설정된 것을 특징으로 하는 다시점 비디오 신호 인코딩 방법.12. The method of claim 11, wherein the maximum number of bins (cMax) constituting the preamble bin string is set to three. 뎁스 영상에 관한 오프셋 절대값 및 오프셋 부호 정보를 부호화하는 엔트로피 인코딩부; 및
상기 오프셋 절대값과 오프셋 부호 정보를 이용하여 오프셋 값을 유도하고, 상기 뎁스 영상이 뎁스 룩업 테이블을 이용하는지 여부를 고려하여 상기 뎁스 영상에 관한 대표 잔여 뎁스 값을 유도하며, 상기 유도된 대표 잔여 뎁스 값을 이용하여 상기 뎁스 영상을 복원하는 뎁스 영상 복원부를 포함하는 것을 특징으로 하는 다시점 비디오 신호 인코딩 장치.
An entropy encoding unit for encoding the offset absolute value and the offset code information with respect to the depth image; And
Deriving an offset value using the offset absolute value and offset sign information, deriving a representative residual depth value of the depth image considering whether the depth image uses a depth lookup table, And a depth image reconstructing unit that reconstructs the depth image using a value of the depth image reconstructing unit.
제13항에 있어서, 상기 엔트로피 인코딩부는,
상기 오프셋 절대값에 대한 이진화를 통해 빈 스트링을 생성하고, 상기 생성된 빈 스트링에 대해 각 빈의 발생 확률에 기반하여 엔트로피 코딩하는 것을 특징으로 하는 다시점 비디오 신호 인코딩 장치.
14. The apparatus of claim 13, wherein the entropy encoding unit comprises:
Generates an empty string through binarization with respect to the absolute value of the offset, and entropy-codes the generated empty string based on the probability of occurrence of each bin.
제14항에 있어서,
상기 빈 스트링은 접두부 빈 스트링과 접미부 빈 스트링으로 구성되며,
상기 접두부 빈 스트링은 절삭형 단항 이진 부호화에 기반하여 이진화되고, 상기 접미부 빈 스트링은 0차 지수 골룸 이진화 부호화에 기반하여 진화되되,
상기 접두부 빈 스트링을 구성하는 빈의 최대 개수(cMax)는 3으로 설정된 것을 특징으로 하는 다시점 비디오 신호 인코딩 장치.
15. The method of claim 14,
The empty string is composed of a preamble empty string and a suffix empty string,
Wherein the preamble bin string is binarized based on a truncated unary binary encoding and the suffix bin string is evolved based on a zeroth exponent Golomb binary encoding,
Wherein the maximum number of bins (cMax) constituting the preamble bin string is set to three.
KR1020150030685A 2014-03-07 2015-03-05 A method and an apparatus for processing a multi-view video signal KR20150105231A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20140027075 2014-03-07
KR1020140027075 2014-03-07

Publications (1)

Publication Number Publication Date
KR20150105231A true KR20150105231A (en) 2015-09-16

Family

ID=54055568

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150030685A KR20150105231A (en) 2014-03-07 2015-03-05 A method and an apparatus for processing a multi-view video signal

Country Status (2)

Country Link
KR (1) KR20150105231A (en)
WO (1) WO2015133830A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108875463B (en) * 2017-05-16 2022-08-12 富士通株式会社 Multi-view vector processing method and device

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013077650A1 (en) * 2011-11-23 2013-05-30 한국전자통신연구원 Method and apparatus for decoding multi-view video
US20130128971A1 (en) * 2011-11-23 2013-05-23 Qualcomm Incorporated Transforms in video coding
KR101604420B1 (en) * 2011-12-29 2016-03-21 인텔 코포레이션 Variable depth compression
WO2014005248A1 (en) * 2012-07-02 2014-01-09 Qualcomm Incorporated Intra-coding of depth maps for 3d video coding

Also Published As

Publication number Publication date
WO2015133830A1 (en) 2015-09-11

Similar Documents

Publication Publication Date Title
CN108632629B (en) Method of generating merge candidate list for multi-view video signal and decoding apparatus
JP6884598B2 (en) Valid predictions using partition coding
JP2021022947A (en) Effective partition encoding with high degree of freedom of partition
US20140002594A1 (en) Hybrid skip mode for depth map coding and decoding
KR20150110357A (en) A method and an apparatus for processing a multi-view video signal
KR20160004947A (en) A method and an apparatus for processing a multi-view video signal
JP7355860B2 (en) Video or image coding based on luma mapping and chroma scaling
KR20150136017A (en) A method and an apparatus for processing a multi-view video signal
KR20160001647A (en) A method and an apparatus for processing a multi-view video signal
KR20160004946A (en) A method and an apparatus for processing a multi-view video signal
KR102491959B1 (en) Video or picture coding based on luma mapping and chroma scaling
CN113475073A (en) Video or image compilation based on luminance mapping
JP7297950B2 (en) Luma mapping based video or image coding
KR20150105231A (en) A method and an apparatus for processing a multi-view video signal
CN114175651A (en) Video or image coding based on luma mapping and chroma scaling
RU2781435C1 (en) Encoding of videos or images based on brightness display and chroma scaling
KR20150136018A (en) A method and an apparatus for processing a multi-view video signal
RU2804453C2 (en) Encoding video or images based on luminance display and color mapping
RU2811987C1 (en) Encoding video or images based on luminance display and colour mapping
KR20150139450A (en) A method and an apparatus for processing a multi-view video signal
JP7305810B2 (en) Video or image coding based on luma mapping and chroma scaling
CN114391258B (en) Video or image coding based on luminance mapping
KR20150146417A (en) A method and an apparatus for processing a multi-view video signal
KR20160003573A (en) A method and an apparatus for processing a multi-view video signal