KR101675116B1 - 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치 - Google Patents

영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치 Download PDF

Info

Publication number
KR101675116B1
KR101675116B1 KR1020090072403A KR20090072403A KR101675116B1 KR 101675116 B1 KR101675116 B1 KR 101675116B1 KR 1020090072403 A KR1020090072403 A KR 1020090072403A KR 20090072403 A KR20090072403 A KR 20090072403A KR 101675116 B1 KR101675116 B1 KR 101675116B1
Authority
KR
South Korea
Prior art keywords
transform
block
predictor
coefficient
unit
Prior art date
Application number
KR1020090072403A
Other languages
English (en)
Other versions
KR20110014839A (ko
Inventor
알렉산더 알쉰
엘레나 알쉬나
니콜라이 쉬라코프
한우진
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to KR1020090072403A priority Critical patent/KR101675116B1/ko
Priority to EP10806676.2A priority patent/EP2451158B1/en
Priority to CN201080034983.0A priority patent/CN102474599B/zh
Priority to US13/389,042 priority patent/US9014260B2/en
Priority to PCT/KR2010/005187 priority patent/WO2011016702A2/ko
Priority to JP2012523570A priority patent/JP5654594B2/ja
Publication of KR20110014839A publication Critical patent/KR20110014839A/ko
Application granted granted Critical
Publication of KR101675116B1 publication Critical patent/KR101675116B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties

Abstract

변환 블록의 변환 계수들 중 예측될 저주파수 성분의 변환 계수를 소정값으로 치환하고 치환된 변환 계수를 포함하는 변환 블록을 역변환하여 불완전 레지듀얼 블록을 생성하고, 불완전 레지듀얼 블록의 값들을 이용하여 저주파수 성분의 변환 계수를 예측하는 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치가 개시된다.

Description

영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치{Method and apparatus for encoding video, and method and apparatus for decoding video}
본 발명은 영상의 부호화 및 복호화에 관한 것으로, 보다 구체적으로는 주파수 영역에서 영상 데이터를 예측하여 영상의 압축 효율을 향상시키는 영상의 부호화, 복호화 방법 및 장치에 관한 것이다.
고해상도 또는 고화질 비디오 컨텐트를 재생, 저장할 수 있는 하드웨어의 개발 및 보급에 따라, 고해상도 또는 고화질 비디오 컨텐트를 효율적으로 부호화하거나 복호화하는 비디오 코덱의 필요성이 증대하고 있다. 영상 압축의 기본 원리 중 하나는 부호화되는 영상 데이터의 예측값을 생성하고 원 영상 데이터와 예측값의 차이값을 부호화함으로써 부호화되는 영상 데이터의 데이터량을 감소시키는 것이다. MPEG-4 H.264/MPEG-4 AVC(Advanced Video Coding)와 같은 코덱에서는 시간 영역(time domain)에서 인트라 예측 또는 인터 예측을 통해 현재 블록의 예측 블록을 생성하고 현재 블록과 예측 블록 사이의 차이값인 레지듀얼을 변환 및 양자화하여 부호화를 수행한다.
본 발명이 해결하고자 하는 기술적 과제는 주파수 영역에서 저주파수 성분의 변환 계수를 예측함으로써 영상의 압축 효율을 향상시키는 영상의 부호화, 복호화 방법 및 장치를 제공하는 것이다.
본 발명의 일 실시예에 따른 영상의 부호화 방법은 부호화되는 현재 블록과 예측 블록의 차이값인 제 1 레지듀얼 블록을 주파수 영역으로 변환하여 변환 블록을 생성하는 단계; 변환 블록의 변환 계수들 중 예측될 적어도 하나의 저주파수 성분의 변환 계수를 소정값으로 치환하고, 상기 소정값으로 치환된 변환 계수를 포함하는 상기 변환 블록을 역변환하여 제 2 레지듀얼 블록을 생성하는 단계; 상기 제 2 레지듀얼 블록의 값들을 이용하여 상기 예측될 저주파수 성분의 변환 계수의 예측자를 생성하는 단계; 및 상기 저주파수 성분의 변환 계수와 대응되는 상기 예측자 사이의 차이값을 부호화하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 영상의 복호화 방법은 현재 블록과 예측 블록의 차이값인 제 1 레지듀얼 블록을 주파수 영역으로 변환한 변환 블록의 변환 계수들 중 적어도 하나의 저주파수 성분의 변환 계수와 상기 저주파수 성분의 예측자 사이의 차이값과, 상기 저주파수 성분을 제외한 상기 변환 블록의 나머지 변환 계수들을 복원하는 단계; 상기 변환 블록의 저주파수 성분의 변환 계수를 소정값으로 치환하고, 상기 소정값으로 치환된 변환 계수를 포함하는 상기 변환 블록을 역변환하여 제 2 레지듀얼 블록을 생성하는 단계; 상기 제 2 레지듀얼 블록의 값들을 이용하여 상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계; 및 상기 예측자 와 대응되는 상기 차이값을 가산하여 상기 저주파수 성분의 변환 계수를 복원하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 영상의 부호화 장치는 부호화되는 현재 블록과 예측 블록의 차이값인 제 1 레지듀얼 블록을 주파수 영역으로 변환하여 변환 블록을 생성하는 변환부; 변환 블록의 변환 계수들 중 예측될 적어도 하나의 저주파수 성분의 변환 계수를 소정값으로 치환하고, 상기 소정값으로 치환된 변환 계수를 포함하는 상기 변환 블록을 역변환하여 제 2 레지듀얼 블록을 생성하며, 상기 제 2 레지듀얼 블록의 값들을 이용하여 상기 예측될 저주파수 성분의 변환 계수의 예측자를 생성하는 변환 계수 예측부; 및 상기 저주파수 성분의 변환 계수와 대응되는 상기 예측자 사이의 차이값을 계산하는 감산부를 포함하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 영상의 복호화 장치는 현재 블록과 예측 블록의 차이값인 제 1 레지듀얼 블록을 주파수 영역으로 변환한 변환 블록의 변환 계수들 중 적어도 하나의 저주파수 성분의 변환 계수와 상기 저주파수 성분의 예측자 사이의 차이값과, 상기 저주파수 성분을 제외한 상기 변환 블록의 나머지 변환 계수들을 복원하는 변환 계수 정보 복원부; 상기 변환 블록의 저주파수 성분의 변환 계수를 소정값으로 치환하고, 상기 소정값으로 치환된 변환 계수를 포함하는 상기 변환 블록을 역변환하여 제 2 레지듀얼 블록을 생성하며, 상기 제 2 레지듀얼 블록의 값들을 이용하여 상기 저주파수 성분의 변환 계수의 예측자를 생성하는 변환 계수 예측부; 및 상기 예측자와 대응되는 상기 차이값을 가산하여 상기 저주파수 성분의 변환 계수를 복원하는 가산부를 포함하는 것을 특징으로 한다.
본 발명에 따르면 부호화되는 저주파수 성분의 변환 계수의 데이터량을 감소시켜 영상의 압축 효율을 향상시킬 수 있다.
이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들에 따른 영상 부호화 장치 및 영상 복호화 장치, 영상 부호화 방법 및 영상 복호화 방법을 설명한다.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치의 블록도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 영상 부호화 장치(100)는 최대 부호화 단위 분할부(110), 부호화 심도 결정부(120), 영상 데이터 부호화부(130) 및 부호화 정보 부호화부(140)를 포함한다.
최대 부호화 단위 분할부(110)는 최대 크기의 부호화 단위인 최대 부호화 단위에 기반하여 현재 픽처 또는 현재 슬라이스를 분할한다. 현재 픽처 또는 현재 슬라이스는 적어도 하나의 최대 부호화 단위로 분할된다. 분할된 영상 데이터는 적어도 하나의 최대 부호화 단위별로 부호화 심도 결정부(120)로 출력될 수 있다.
본 발명의 일 실시예에 따르면, 최대 부호화 단위 및 심도를 이용해 부호화 단위가 표현될 수 있다. 최대 부호화 단위는 현재 픽처의 부호화 단위 중 크기가 가장 큰 부호화 단위를 나타내며, 심도는 부호화 단위가 계층적으로 축소된 서브 부호화 단위의 크기를 나타낸다. 심도가 커지면서, 부호화 단위는 최대 부호화 단위로부터 최소 부호화 단위까지 축소될 수 있으며, 최대 부호화 단위의 심도는 최소 심도로 정의되고, 최소 부호화 단위의 심도는 최대 심도로 정의될 수 있다. 최 대 부호화 단위는 심도가 커짐에 따라 심도별 부호화 단위의 크기는 감소하므로, k 심도의 서브 부호화 단위는 k+1 이상의 심도를 갖는 복수 개의 서브 부호화 단위를 포함할 수 있다.
전술한 바와 같이 부호화 단위의 최대 크기에 따라, 현재 픽처의 영상 데이터를 최대 부호화 단위로 분할하며, 각각의 최대 부호화 단위는 심도별로 축소되는 부호화 단위들을 포함할 수 있다. 본 발명의 일 실시예에 따른 최대 부호화 단위는 심도별로 축소되므로, 최대 부호화 단위에 포함된 공간 영역(spatial domain)의 영상 데이터가 심도에 따라 계층적으로 분류될 수 있다.
최대 부호화 단위로부터 최상위 부호화 단위까지 현재 부호화 단위의 높이 및 너비를 계층적으로 축소한 총 횟수를 제한하는 최대 심도 및 부호화 단위의 최대 크기가 미리 설정되어 있을 수 있다. 이러한 최대 부호화 단위 및 최대 심도는 픽처 또는 슬라이스 단위로 설정될 수 있다. 즉, 픽처 또는 슬라이스마다 상이한 최대 부호화 단위 및 최대 심도를 갖을 수 있으며, 최대 심도에 따라 최대 영상 부호화 단위에 포함된 최소 부호화 단위 크기를 가변적으로 설정할 수 있다. 이와 같이 픽처 또는 슬라이스마다 최대 부호화 단위 및 최대 심도를 가변적으로 설정할 수 있게 함으로써, 평탄한 영역의 영상은 보다 큰 최대 부호화 단위를 이용하여 부호화함으로써 압축률을 향상시키고, 복잡도가 큰 영상은 보다 작은 크기의 부호화 단위를 이용하여 영상의 압축 효율을 향상시킬 수 있다.
부호화 심도 결정부(120)는 최대 부호화 단위마다 상이한 최대 심도를 결정한다. 최대 심도는 R-D 코스트(Rate-Distortion Cost) 계산에 기초해 결정될 수 있 다. 결정된 최대 심도는 부호화 정보 부호화부(140)로 출력되고, 최대 부호화 단위별 영상 데이터는 영상 데이터 부호화부(130)로 출력된다.
최대 부호화 단위 내의 영상 데이터는 최대 심도 이하의 적어도 하나의 심도에 따라 심도별 부호화 단위에 기반하여 부호화되고, 각각의 심도별 부호화 단위에 기반한 부호화 결과가 비교된다. 심도별 부호화 단위의 부호화 오차의 비교 결과 부호화 오차가 가장 작은 심도가 선택될 수 있다. 각각의 최대화 부호화 단위마다 적어도 하나의 부호화 심도가 결정될 수 있다.
최대 부호화 단위의 크기는 심도가 증가함에 따라 부호화 단위가 계층적으로 분할되어 축소되며 부호화 단위의 개수는 증가한다. 또한, 하나의 최대 부호화 단위에 포함되는 동일한 심도의 부호화 단위들이라 하더라도, 각각의 데이터에 대한 부호화 오차를 측정하고 상위 심도로의 축소 여부가 결정된다. 따라서, 하나의 최대 부호화 단위에 포함되는 데이터라 하더라도 위치에 따라 심도별 부호화 오차가 다르므로 위치에 따라 부호화 심도가 달리 결정될 수 있다. 다시 말해, 최대 부호화 단위는 상이한 심도에 따라 상이한 크기의 서브 부호화 단위로 분할될 수 있다.하나의 최대 부호화 단위에 대해 부호화 심도가 하나 이상 설정될 수 있으며, 최대 부호화 단위의 데이터는 하나 이상의 부호화 심도의 부호화 단위에 따라 분할될 수 있다.
또한, 최대 부호화 단위에 포함된 상이한 크기의 서브 부호화 단위들은 상이한 크기의 처리 단위에 기초해 예측 또는 주파수 변환될 수 있다. 다시 말해, 영상 부호화 장치(100)는 영상 부호화를 위한 복수의 처리 단계들을 다양한 크기 및 다양한 형태의 처리 단위에 기초해 수행할 수 있다. 영상 데이터의 부호화를 위해서는 예측, 주파수 변환, 엔트로피 부호화 등의 처리 단계를 거치는데, 모든 단계에 걸쳐서 동일한 크기의 처리 단위가 이용될 수도 있으며, 단계별로 상이한 크기의 처리 단위를 이용할 수 있다.
예를 들어 영상 부호화 장치(100)는 부호화 단위를 예측하기 위해, 부호화 단위와 다른 처리 단위를 선택할 수 있다. 일 예로, 부호화 단위의 크기가 2Nx2N(단, N은 양의 정수)인 경우, 예측을 위한 처리 단위는 2Nx2N, 2NxN, Nx2N, NxN 등일 수 있다. 다시 말해, 부호화 단위의 높이 또는 너비 중 적어도 하나를 반분하는 형태의 처리 단위를 기반으로 움직임 예측이 수행될 수도 있다. 이하, 예측의 기초가 되는 데이터 단위는 '예측 단위'라 한다.
예측 모드는 인트라 모드, 인터 모드 및 스킵 모드 중 적어도 하나일 수 있으며, 특정 예측 모드는 특정 크기 또는 형태의 예측 단위에 대해서만 수행될 수 있다. 예를 들어, 인트라 모드는 정방형인 2Nx2N, NxN 크기의 예측 단위에 대해서만 수행될 수 있다. 또한, 스킵 모드는 2Nx2N 크기의 예측 단위에 대해서만 수행될 수 있다. 부호화 단위 내부에 복수의 예측 단위가 있다면, 각각의 예측 단위에 대해 예측을 수행하여 부호화 오차가 가장 작은 예측 모드가 선택될 수 있다.
또한, 영상 부호화 장치(100)는 부호화 단위와 다른 크기의 처리 단위에 기초해 영상 데이터를 주파수 변환할 수 있다. 부호화 단위의 주파수 변환을 위해서 부호화 단위보다 작거나 같은 크기의 데이터 단위를 기반으로 주파수 변환이 수행될 수 있다. 이하, 주파수 변환의 기초가 되는 처리 단위를 '변환 단위'라 한다.
부호화 심도 결정부(120)는 라그랑자 곱(Lagrangian Multiplier) 기반의 율-왜곡 최적화 기법(Rate-Distortion Optimization)을 이용하여 심도별 부호화 단위의 부호화 오차를 측정하여 최적의 부호화 오차를 갖는 최대 부호화 단위의 분할 형태를 결정할 수 있다. 다시 말해, 부호화 심도 결정부(120)는 최대 부호화 단위가 어떠한 형태의 복수의 서브 부호화 단위로 분할되는지 결정할 수 있는데, 여기서 복수의 서브 부호화 단위는 심도에 따라 크기가 상이하다.
영상 데이터 부호화부(130)는, 부호화 심도 결정부(120)에서 결정된 적어도 하나의 부호화 심도에 기초하여 최대 부호화 단위의 영상 데이터를 부호화하여 비트스트림을 출력한다. 부호화 심도 결정부(120)에서 최소 부호화 오차를 측정하기 위해 부호화가 이미 수행되었으므로, 이를 이용해 부호화된 데이터 스트림을 출력할 수도 있다.
부호화 정보 부호화부(140)는, 부호화 심도 결정부(120)에서 결정된 적어도 하나의 부호화 심도에 기초하여, 최대 부호화 단위마다 심도별 부호화 모드에 관한 정보를 부호화하여 비트스트림을 출력한다. 심도별 부호화 모드에 관한 정보는, 부호화 심도 정보, 부호화 심도의 부호화 단위의 예측 단위의 분할 타입 정보, 예측 단위별 예측 모드 정보, 변환 단위의 크기 정보 등을 포함할 수 있다.
부호화 심도 정보는, 현재 심도로 부호화하지 않고 상위 심도의 부호화 단위로 부호화할지 여부를 나타내는 심도별 축소 정보를 이용하여 정의될 수 있다. 현재 부호화 단위의 현재 심도가 부호화 심도라면, 현재 부호화 단위는 현재 심도의 부호화 단위로 부호화되므로 현재 심도의 축소 정보는 더 이상 상위 심도로 축소되 지 않도록 정의될 수 있다. 반대로, 현재 부호화 단위의 현재 심도가 부호화 심도가 아니라면 상위 심도의 부호화 단위를 이용한 부호화를 시도해보아야 하므로, 현재 심도의 축소 정보는 상위 심도의 부호화 단위로 축소되도록 정의될 수 있다.
현재 심도가 부호화 심도가 아니라면, 상위 심도의 부호화 단위로 축소된 부호화 단위에 대해 부호화가 수행된다. 현재 심도의 부호화 단위 내에 상위 심도의 부호화 단위가 하나 이상 존재하므로, 각각의 상위 심도의 부호화 단위마다 반복적으로 부호화가 수행되어, 동일한 심도의 부호화 단위마다 재귀적(recursive) 부호화가 수행될 수 있다.
하나의 최대 부호화 단위 안에 적어도 하나의 부호화 심도가 결정되며 부호화 심도마다 적어도 하나의 부호화 모드에 관한 정보가 결정되어야 하므로, 하나의 최대 부호화 단위에 대해서는 적어도 하나의 부호화 모드에 관한 정보가 결정될 수 있다. 또한, 최대 부호화 단위의 데이터는 심도에 따라 계층적으로 분할되어 위치 별로 부호화 심도가 다를 수 있으므로, 데이터에 대해 부호화 심도 및 부호화 모드에 관한 정보가 설정될 수 있다.
따라서, 일 실시예에 따른 부호화 정보 부호화부(140)는, 최대 부호화 단위에 포함되어 있는 최소 부호화 단위마다 해당 부호화 정보를 설정할 수 있다. 즉, 부호화 심도의 부호화 단위는 동일한 부호화 정보를 보유하고 있는 최소 부호화 단위를 하나 이상 포함하고 있다. 이를 이용하여, 인근 최소 부호화 단위들이 동일한 심도별 부호화 정보를 갖고 있다면, 동일한 최대 부호화 단위에 포함되는 최소 부호화 단위일 수 있다.
영상 부호화 장치(100)의 가장 간단한 형태의 실시예에 따르면, 심도별 부호화 단위는 한 계층 하위 심도의 부호화 단위의 높이 및 너비를 반분한 크기의 부호화 단위이다. 즉, 현재 심도(k)의 부호화 단위의 크기가 2Nx2N이라면, 상위 심도(k+1)의 부호화 단위의 크기는 NxN 이다. 따라서, 2Nx2N 크기의 현재 부호화 단위는 NxN 크기의 상위 심도 부호화 단위를 최대 4개 포함할 수 있다.
따라서, 일 실시예에 따른 영상 복호화 장치(100)는 현재 픽처의 특성을 고려하여 결정된 최대 부호화 단위의 크기 및 최대 심도를 기반으로, 각각의 최대 부호화 단위마다 최적의 형태 분할 형태를 결정할 수 있다. 또한, 각각의 최대 부호화 단위마다 다양한 예측 모드, 주파수 변환 방식 등으로 부호화할 수 있으므로, 다양한 영상 크기의 부호화 단위의 영상 특성을 고려하여 최적의 부호화 모드가 결정될 수 있다.
영상의 해상도가 매우 높거나 데이터량이 매우 큰 영상을 종래의 16x16 크기의 매크로블록 단위로 부호화한다면, 픽처당 매크로블록의 수가 과도하게 많아진다. 이에 따라, 매크로블록마다 생성되는 압축 정보도 많아지므로 압축 정보의 전송 부담이 커지고 데이터 압축 효율이 감소하는 경향이 있다. 따라서, 본 발명의 일 실시예에 따른 영상 부호화 장치는, 영상의 크기를 고려하여 부호화 단위의 최대 크기를 증가시키면서, 영상 특성을 고려하여 부호화 단위를 조절할 수 있으므로, 영상 압축 효율이 증대될 수 있다.
도 2 는 본 발명의 일 실시예에 따른 영상 복호화 장치의 블록도를 도시한다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 영상 복호화 장치(200)는 영상 데이터 획득부(210), 부호화 정보 추출부(220) 및 영상 데이터 복호화부(230)를 포함한다.
영상 관련 데이터 획득부(210)는 영상 복호화 장치(200)가 수신한 비트열을 파싱하여, 최대 부호화 단위별로 영상 데이터를 획득하여 영상 데이터 복호화부(230)로 출력한다. 영상 관련 데이터 획득부(210)는 현재 픽처 또는 슬라이스에 대한 헤더로부터 현재 픽처 또는 슬라이스의 최대 부호화 단위에 대한 정보를 추출할 수 있다. 본 발명의 일 실시예에 따른 영상 복호화 장치(200)는 최대 부호화 단위 단위별로 영상 데이터를 복호화한다.
부호화 정보 추출부(220)는 영상 복호화 장치(200)가 수신한 비트열을 파싱하여, 현재 픽처에 대한 헤더로부터 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보를 추출한다. 추출된 부호화 심도 및 부호화 모드에 관한 정보는 영상 데이터 복호화부(230)로 출력된다.
최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보는, 하나 이상의 부호화 심도 정보에 대해 설정될 수 있으며, 부호화 심도별 부호화 모드에 관한 정보는, 부호화 단위별 예측 단위의 분할 타입 정보, 예측 모드 정보 및 변환 단위의 크기 정보 등을 포함할 수 있다. 또한, 부호화 심도 정보로서, 심도별 축소 정보가 추출될 수도 있다.
최대 부호화 단위의 분할 형태에 대한 정보는 최대 부호화 단위에 포함된 심도에 따라 상이한 크기의 서브 부호화 단위에 대한 정보를 포함할 수 있으며, 부호 화 모드에 관한 정보는 서브 부호화 단위별 예측 단위에 대한 정보, 예측 모드에 대한 정보 및 변환 단위에 대한 정보 등을 포함할 수 있다.
영상 데이터 복호화부(230)는 부호화 정보 추출부에서 추출된 정보에 기초하여 각각의 최대 부호화 단위의 영상 데이터를 복호화하여 현재 픽처를 복원한다. 최대 부호화 단위의 분할 형태에 대한 정보에 기초하여, 영상 데이터 복호화부(230)는 최대 부호화 단위에 포함된 서브 부호화 단위를 복호화할 수 있다. 복호화 과정은 인트라 예측 및 움직임 보상을 포함하는 움직임 예측 과정, 및 주파수 역변환 과정을 포함할 수 있다.
영상 데이터 복호화부(230)는 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보에 기초하여 각각의 최대 부호화 단위의 영상 데이터를 복호화하여 현재 픽처를 복원한다. 최대 부호화 단위별 부호화 심도 정보에 기초하여, 영상 데이터 복호화부(230)는 적어도 하나의 부호화 심도의 부호화 단위마다 영상 데이터를 복호화할 수 있다. 복호화 과정은 인트라 예측 및 움직임 보상을 포함하는 예측 과정 및 역변환 과정을 포함할 수 있다.
영상 데이터 복호화부(230)는, 부호화 단위별 예측을 위해 부호화 심도별 부호화 단위의 예측 단위의 분할 타입 정보 및 예측 모드 정보에 기초하여, 부호화 단위마다 각각의 예측 단위 및 예측 모드로 인트라 예측 또는 움직임 보상을 수행할 수 있다. 또한, 영상 데이터 복호화부(230)는, 최대 부호화 단위별 역변환을 위해, 부호화 심도별 부호화 단위의 변환 단위의 크기 정보에 기초하여, 부호화 단위마다 각각의 변환 단위로 역변환을 수행할 수 있다.
영상 데이터 복호화부(230)는 심도별 축소 정보를 이용하는 현재 최대 부호화 단위의 부호화 심도를 결정할 수 있다. 만약, 축소 정보가 현재 심도로 복호화할 것을 나타내고 있다면 현재 심도가 부호화 심도이다. 따라서, 영상 데이터 복호화부(230)는 현재 최대 부호화 단위의 영상 데이터에 대해 현재 심도의 부호화 단위를 예측 단위의 분할 타입, 예측 모드 및 변환 단위 크기 정보를 이용하여 복호화할 수 있다. 즉, 최소 부호화 단위에 대해 설정되어 있는 부호화 정보를 관찰하여, 동일한 축소 정보를 포함한 부호화 정보를 보유하고 있는 최소 부호화 단위를 모아, 하나의 데이터 단위로 복호화할 수 있다.
일 실시예에 따른 영상 복호화 장치(200)는, 부호화 과정에서 최대 부호화 단위마다 재귀적으로 부호화를 수행하여 최소 부호화 오차를 발생시킨 부호화 단위에 대한 정보를 획득하여, 현재 픽처에 대한 복호화에 이용할 수 있다. 즉, 최대 부호화 단위마다 최적 부호화 단위로 영상 데이터의 복호화가 가능해진다. 따라서, 높은 해상도의 영상 또는 데이터량이 과도하게 많은 영상이라도 부호화단으로부터 전송된 최적 부호화 모드에 관한 정보를 이용하여, 영상의 특성에 적응적으로 결정된 부호화 단위의 크기 및 부호화 모드에 따라 효율적으로 영상 데이터를 복호화하여 복원할 수 있다.
도 3은 본 발명의 일 실시예에 따른 계층적 부호화 단위를 도시한다.
도 3을 참조하면, 본 발명에 따른 계층적 부호화 단위는 너비x높이가 64x64인 부호화 단위부터, 32x32, 16x16, 8x8, 및 4x4를 포함할 수 있다. 정사각형 형태의 부호화 단위 이외에도, 너비x높이가 64x32, 32x64, 32x16, 16x32, 16x8, 8x16, 8x4, 4x8인 부호화 단위들이 존재할 수 있다.
도 3에서 비디오 데이터(310)에 대해서는, 해상도는 1920x1080, 최대 부호화 단위의 크기는 64, 최대 심도가 2로 설정되어 있다. 또한, 비디오 데이터(320)에 대해서는, 해상도는 1920x1080, 부호화 단위의 최대 크기는 64, 최대 심도가 4로 설정되어 있다. 또한, 비디오 데이터(330)에 대해서는, 해상도는 352x288, 부호화 단위의 최대 크기는 16, 최대 심도가 2로 설정되어 있다.
해상도가 높거나 데이터량이 많은 경우 압축률 향상뿐만 아니라 영상 특성을 정확히 반영하기 위해 부호화 사이즈의 최대 크기가 상대적으로 큰 것이 바람직하다. 따라서, 비디오 데이터(330)에 비해, 해상도가 높은 비디오 데이터(310, 320)는 부호화 사이즈의 최대 크기가 64로 선택될 수 있다.
최대 심도는 계층적 부호화 단위에서 총 계층수를 나타낸다. 따라서, 비디오 데이터(310)의 최대 심도는 2이므로, 비디오 데이터(310)의 부호화 단위(315)는 장축 크기가 64인 최대 부호화 단위로부터, 심도가 두 계층 증가하여 장축 크기가 32, 16인 부호화 단위들까지 포함할 수 있다. 반면, 비디오 데이터(330)의 최대 심도는 2이므로, 비디오 데이터(330)의 부호화 단위(335)는 장축 크기가 16인 부호화 단위들로부터, 심도가 두 계층 증가하여 장축 크기가 8, 4인 부호화 단위들까지 포함할 수 있다.
비디오 데이터(320)의 최대 심도는 4이므로, 비디오 데이터(320)의 부호화 단위(325)는 장축 크기가 64인 최대 부호화 단위로부터, 심도가 네 계층 증가하여 장축 크기가 32, 16, 8, 4인 부호화 단위들까지 포함할 수 있다.심도가 증가할수록 더 작은 서브 부호화 단위에 기초해 영상을 부호화하므로 보다 세밀한 장면을 포함하고 있는 영상을 부호화하는데 적합해진다.
도 4 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 부호화부의 블록도를 나타낸 것이다.
도 4를 참조하면, 인트라 예측부(410)는 현재 프레임(405) 중 인트라 모드의 예측 단위에 대해 인트라 예측을 수행하고, 움직임 추정부(420) 및 움직임 보상부(425)는 인터 모드의 예측 단위에 대해 현재 프레임(405) 및 참조 프레임(495)을 이용해 인터 예측 및 움직임 보상을 수행한다.
인트라 예측부(410), 움직임 추정부(420) 및 움직임 보상부(425)로부터 출력된 예측 단위에 기초해 레지듀얼 값들이 생성되고, 생성된 레지듀얼 값들은 주파수 변환부(430) 및 양자화부(440)를 거쳐 양자화된 변환 계수로 출력된다.
양자화된 변환 계수는 역양자화부(460), 주파수 역변환부(470)를 통해 다시 레지듀얼 값으로 복원되고, 복원된 레지듀얼 값들은 디블로킹부(480) 및 루프 필터링부(490)를 거쳐 후처리되어 참조 프레임(495)으로 출력된다. 양자화된 변환 계수는 엔트로피 부호화부(450)를 거쳐 비트스트림(455)으로 출력될 수 있다.
본 발명의 일 실시예에 따른 영상 부호화 방법에 따라 부호화하기 위해, 영상 부호화부(400)의 구성 요소들인 인트라 예측부(410), 움직임 추정부(420), 움직임 보상부(425), 주파수 변환부(430), 양자화부(440), 엔트로피 부호화부(450), 역양자화부(460), 주파수 역변환부(470), 디블로킹부(480) 및 루프 필터링부(490)는 모두 최대 부호화 단위, 심도에 따른 서브 부호화 단위, 예측 단위 및 변환 단위에 기초해 영상 부호화 과정들을 처리한다. 특히, 인트라 예측부(410), 움직임 추정부(420) 및 움직임 보상부(425)는 부호화 단위의 최대 크기 및 심도를 고려하여 부호화 단위 내의 예측 단위 및 예측 모드를 결정하며, 주파수 변환부(430)는 부호화 단위의 최대 크기 및 심도를 고려하여 변환 단위의 크기를 고려하여야 한다.
도 5 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 복호화부의 블록도를 나타낸 것이다.
도 5를 참조하면, 비트스트림(505)이 파싱부(510)를 거쳐 복호화 대상인 부호화된 영상 데이터 및 복호화를 위해 필요한 부호화 정보가 파싱된다. 부호화된 영상 데이터는 엔트로피 복호화부(520) 및 역양자화부(530)를 거쳐 역양자화된 데이터로 출력되고, 주파수 역변환부(540)를 거쳐 레지듀얼 값들로 복원된다. 레지듀얼 값들은 인트라 예측부(550)의 인트라 예측의 결과 또는 움직임 보상부(560)의 움직임 보상 결과와 가산되어 부호화 단위 별로 복원된다. 복원된 부호화 단위는 디블로킹부(570) 및 루프 필터링부(580)를 거쳐 다음 부호화 단위 또는 다음 픽처의 예측에 이용된다.
본 발명의 일 실시예에 따른 영상 복호화 방법에 따라 복호화하기 위해 영상 복호화부(400)의 구성 요소들인 파싱부(510), 엔트로피 복호화부(520), 역양자화부(530), 주파수 역변환부(540), 인트라 예측부(550), 움직임 보상부(560), 디블로킹부(570) 및 루프 필터링부(580)가 모두 최대 부호화 단위, 심도에 따른 서브 부호화 단위, 예측 단위 및 변환 단위에 기초해 영상 복호화 과정들을 처리한다. 특히, 인트라 예측부(550), 움직임 보상부(560)는 부호화 단위의 최대 크기 및 심도 를 고려하여 부호화 단위 내의 예측 단위 및 예측 모드를 결정하며, 주파수 역변환부(540)는 부호화 단위의 최대 크기 및 심도를 고려하여 변환 단위의 크기를 고려하여야 한다.
도 6은 본 발명의 일 실시예에 따른 심도별 부호화 단위 및 예측 단위를 도시한다.
일 실시예에 따른 영상 부호화 장치(100) 및 일 실시예에 따른 영상 복호화 장치(200)는 영상 특성을 고려하기 위해 계층적인 부호화 단위를 사용한다. 부호화 단위의 최대 높이 및 너비, 최대 심도는 영상의 특성에 따라 적응적으로 결정될 수도 있으며, 사용자의 요구에 따라 다양하게 설정될 수도 있다. 미리 설정된 부호화 단위의 최대 크기에 따라, 심도별 부호화 단위의 크기가 결정될 수도 있다.
본 발명의 일 실시예에 따른 부호화 단위의 계층 구조(600)는 부호화 단위의 최대 높이 및 너비가 64이며, 최대 심도가 4인 경우를 도시하고 있다. 일 실시예에 따른 부호화 단위의 계층 구조(600)의 세로축을 따라서 심도가 증가하므로 심도별 부호화 단위의 높이 및 너비가 각각 축소된다. 또한, 부호화 단위의 계층 구조(600)의 가로축을 따라, 각각의 심도별 부호화 단위의 예측 기반이 되는 부분적 데이터 단위인 예측 단위가 도시되어 있다.
최대 부호화 단위(610)는 부호화 단위의 계층 구조(600) 중 최대 부호화 단위로서 심도가 0이며, 부호화 단위의 크기, 즉 높이 및 너비가 64x64이다. 세로축을 따라 심도가 증가하며, 크기 32x32인 심도 1의 부호화 단위(620), 크기 16x16인 심도 2의 부호화 단위(630), 크기 8x8인 심도 3의 부호화 단위(640), 크기 4x4인 심도 4의 부호화 단위(650)가 존재한다. 크기 4x4인 심도 4의 부호화 단위(650)는 최소 부호화 단위이다.
또한 도 6을 참조하면, 각각의 심도별로 가로축을 따라, 부호화 단위의 예측 단위로서, 부분적 데이터 단위들이 도시되어 있다. 즉, 심도 0의 크기 64x64의 최대 부호화 단위(610)의 예측 단위는, 크기 64x64의 부호화 단위(610)에 포함되는 크기 64x64의 부분적 데이터 단위(610), 크기 64x32의 부분적 데이터 단위들(612), 크기 32x64의 부분적 데이터 단위들(614), 크기 32x32의 부분적 데이터 단위들(616)일 수 있다.
심도 1의 크기 32x32의 부호화 단위(620)의 예측 단위는, 크기 32x32의 부호화 단위(620)에 포함되는 크기 32x32의 부분적 데이터 단위(620), 크기 32x16의 부분적 데이터 단위들(622), 크기 16x32의 부분적 데이터 단위들(624), 크기 16x16의 부분적 데이터 단위들(626)일 수 있다.
심도 2의 크기 16x16의 부호화 단위(630)의 예측 단위는, 크기 16x16의 부호화 단위(630)에 포함되는 크기 16x16의 부분적 데이터 단위(630), 크기 16x8의 부분적 데이터 단위들(632), 크기 8x16의 부분적 데이터 단위들(634), 크기 8x8의 부분적 데이터 단위들(636)일 수 있다.
심도 3의 크기 8x8의 부호화 단위(640)의 예측 단위는, 크기 8x8의 부호화 단위(640)에 포함되는 크기 8x8의 부분적 데이터 단위(640), 크기 8x4의 부분적 데이터 단위들(642), 크기 4x8의 부분적 데이터 단위들(644), 크기 4x4의 부분적 데이터 단위들(646)일 수 있다.
마지막으로, 심도 4의 크기 4x4의 부호화 단위(650)는 최소 부호화 단위이며 최상위 심도의 부호화 단위이고, 해당 예측 단위도 크기 4x4의 데이터 단위(650)이다.
일 실시예에 따른 영상 부호화 장치의 부호화 심도 결정부(120)는, 최대 부호화 단위(610)의 부호화 심도를 결정하기 위해, 최대 부호화 단위(610)에 포함되는 각각의 심도의 부호화 단위마다 부호화를 수행하여야 한다.
동일한 범위 및 크기의 데이터를 포함하기 위한 심도별 부호화 단위의 개수는, 심도가 증가할수록 심도별 부호화 단위의 개수도 증가한다. 예를 들어, 심도 1의 부호화 단위 한 개가 포함하는 데이터에 대해서, 심도 2의 부호화 단위는 네 개가 필요하다. 따라서, 동일한 데이터의 부호화 결과를 심도별로 비교하기 위해서, 한 개의 심도 1의 부호화 단위 및 네 개의 심도 2의 부호화 단위를 이용하여 각각 부호화되어야 한다.
각각의 심도별 부호화를 위해서는, 부호화 단위의 계층 구조(600)의 가로축을 따라, 심도별 부호화 단위의 예측 단위들마다 부호화를 수행하여, 해당 심도에서 가장 작은 부호화 오차인 대표 부호화 오차가 선택될 수다. 또한, 부호화 단위의 계층 구조(600)의 세로축을 따라 심도를 증가시키며, 각각의 심도마다 부호화를 수행하여, 심도별 대표 부호화 오차를 비교하여 최소 부호화 오차가 검색될 수 있다. 최대 부호화 단위(610) 중 최소 부호화 오차가 발생하는 심도가 최대 부호화 단위(610)의 부호화 심도 및 분할 타입으로 선택될 수 있다.
도 7은 본 발명의 일 실시예에 따른, 부호화 단위 및 변환 단위의 관계를 도 시한다.
본 발명의 일 실시예에 따른 영상 부호화 장치(100) 및 영상 복호화 장치(200)는, 최대 부호화 단위마다 최대 부호화 단위보다 작거나 같은 크기의 부호화 단위로 영상을 분할하여 부호화하거나 복호화한다. 부호화 과정 중 주파수 변환을 위한 변환 단위의 크기는 각각의 부호화 단위보다 크지 않은 데이터 단위를 기반으로 선택될 수 있다. 예를 들어, 현재 부호화 단위(710)가 64x64 크기일 때, 32x32 크기의 변환 단위(720)를 이용하여 주파수 변환이 수행될 수 있다. 또한, 64x64 크기의 부호화 단위(710)의 데이터를 64x64 크기 이하의 32x32, 16x16, 8x8, 4x4 크기의 변환 단위들로 각각 주파수 변환을 수행하여 부호화한 후, 원본과의 오차가 가장 적은 변환 단위가 선택될 수 있다.
도 8은 본 발명의 일 실시예에 따라, 심도별 부호화 정보들을 도시한다.
본 발명의 일 실시예에 따른 영상 부호화 장치(100)의 부호화 정보 부호화부는 부호화 모드에 관한 정보로서, 각각의 부호화 심도의 부호화 단위마다 분할 타입에 관한 정보(800), 예측 모드에 관한 정보(810), 변환 단위 크기에 대한 정보(820)를 부호화하여 전송할 수 있다.
분할 타입에 대한 정보(800)는, 현재 부호화 단위의 움직임 예측을 위해 예측 단위로서, 현재 부호화 단위가 분할된 타입에 대한 정보를 나타낸다. 예를 들어, 심도 0 및 크기 2Nx2N의 현재 부호화 단위 CU_0는, 크기 2Nx2N의 예측 단위(802), 크기 2NxN의 예측 단위(804), 크기 Nx2N의 예측 단위(806), 크기 NxN의 예측 단위(808) 중 어느 하나의 타입으로 분할되어 예측 단위로 이용될 수 있다. 이 경우 현재 부호화 단위의 분할 타입에 관한 정보(800)는 크기 2Nx2N의 예측 단위(802), 크기 2NxN의 예측 단위(804), 크기 Nx2N의 예측 단위(806) 및 크기 NxN의 예측 단위(808) 중 하나를 나타내도록 설정된다.
예측 모드에 관한 정보(810)는, 각각의 예측 단위의 움직임 예측 모드를 나타낸다. 예를 들어 예측 모드에 관한 정보(810)를 통해, 분할 타입에 관한 정보(800)가 가리키는 예측 단위가 인트라 모드(812), 인터 모드(814) 및 스킵 모드(816) 중 하나로 움직임 예측이 수행되는지 여부가 설정될 수 있다.
또한, 변환 단위 크기에 관한 정보(820)는 현재 부호화 단위를 어떠한 변환 단위를 기반으로 주파수 변환을 수행할지 여부를 나타낸다. 예를 들어, 변환 단위는 제 1 인트라 변환 단위 크기(822), 제 2 인트라 변환 단위 크기(824), 제 1 인터 변환 단위 크기(826), 제 2 인트라 변환 단위 크기(828) 중 하나일 수 있다.
본 발명의 일 실시예에 따른 영상 복호화 장치(200)의 부호화 정보 추출부는, 각각의 심도별 부호화 단위마다 분할 타입에 관한 정보(800), 예측 모드에 관한 정보(810), 변환 단위 크기에 대한 정보(820)를 추출하여 복호화에 이용할 수 있다.
도 9 는 본 발명의 일 실시예에 따른 심도별 부호화 단위를 도시한다.
심도의 증가 여부를 나타내기 위해 축소 정보가 이용될 수 있다. 축소 정보는 현재 심도의 부호화 단위가 상위 심도의 부호화 단위로 축소될지 여부를 나타낸다.
심도 0 및 2N_0x2N_0 크기의 부호화 단위의 움직임 예측을 위한 예측 단 위(910)는 2N_0x2N_0 크기의 분할 타입(912), 2N_0xN_0 크기의 분할 타입(914), N_0x2N_0 크기의 분할 타입(916), N_0xN_0 크기의 분할 타입(918)을 포함할 수 있다.
분할 타입마다, 한 개의 2N_0xN_0 크기의 예측 단위, 두 개의 2N_0xN_0 크기의 예측 단위, 두 개의 N_0x2N_0 크기의 예측 단위, 네 개의 N_0xN_0 크기의 예측 단위마다 반복적으로 움직임 예측을 통한 부호화가 수행되어야 한다. 크기 2N_0xN_0 및 크기 N_0xN_0의 예측 단위에 대해서는, 인트라 모드 및 인터 모드로 움직임 예측이 수행될 수 있으며, 크기 N_0x2N_0 및 크기 N_0xN_0의 예측 단위로는 인터 모드로만 움직임 예측이 수행될 수 있다. 스킵 모드는 크기 2N_0xN_0의 예측 단위에 대해서만 수행될 수 있다.
크기 N_0xN_0의 분할 타입(918)에 의한 부호화 오차가 가장 작다면, 심도 0를 1로 증가(920)시키고, 심도 2 및 크기 N_0xN_0의 분할 타입의 부호화 단위들(922, 924, 926, 928)에 대해 반복적으로 최소 부호화 오차를 검색해 나갈 수 있다.
동일한 심도의 부호화 단위들(922, 924, 926, 928)에 대해 부호화가 반복적으로 수행되므로, 이중 하나만 예를 들어 심도 1의 부호화 단위의 부호화를 설명한다. 심도 1 및 크기 2N_1x2N_1 (=N_0xN_0)의 부호화 단위의 움직임 예측을 위한 예측 단위(930)는, 크기 2N_1x2N_1의 분할 타입(932), 크기 2N_1xN_1의 분할 타입(934), 크기 N_1x2N_1의 분할 타입(936), 크기 N_1xN_1의 분할 타입(938)을 포함할 수 있다. 분할 타입마다, 한 개의 크기 2N_1x2N_1의 예측 단위, 두 개의 크기 2N_1xN_1의 예측 단위, 두 개의 크기 N_1x2N_1의 예측 단위, 네 개의 크기 N_1xN_1의 예측 단위마다 반복적으로 움직임 예측을 통한 부호화가 수행되어야 한다.
또한, 크기 N_1xN_1 크기의 분할 타입(938)에 의한 부호화 오차가 가장 작다면, 심도 1을 심도 2로 증가(940)시키면서, 심도 2 및 크기 N_2xN_2의 부호화 단위들(942, 944, 946, 948)에 대해 반복적으로 최소 부호화 오차를 검색해 나갈 수 있다.
최대 심도가 d인 경우, 심도별 축소 정보는 심도 d-1일 때까지 설정될 수 있다. 즉, 심도 d-1 및 크기 2N_(d-1)x2N_(d-1)의 부호화 단위의 움직임 예측을 위한 예측 단위(950)는, 크기 2N_(d-1)x2N_(d-1)의 분할 타입(952), 크기 2N_(d-1)xN_(d-1)의 분할 타입(954), 크기 N_(d-1)x2N_(d-1)의 분할 타입(956), 크기 N_(d-1)xN_(d-1)의 분할 타입(958)을 포함할 수 있다.
분할 타입마다, 한 개의 크기 2N_(d-1)x2N_(d-1)의 예측 단위, 두 개의 크기 2N_(d-1)xN_(d-1)의 예측 단위, 두 개의 크기 N_(d-1)x2N_(d-1)의 예측 단위, 네 개의 크기 N_(d-1)xN_(d-1)의 예측 단위마다 반복적으로 움직임 예측을 통한 부호화가 수행되어야 한다. 최대 심도가 d이므로, 심도 d-1의 부호화 단위(952)는 더 이상 축소 과정을 거치지 않는다.
본 발명의 일 실시예에 따른 영상 부호화 장치(100)는 부호화 단위(912)를 위한 부호화 심도를 결정하기 위해, 심도별 부호화 오차를 비교하여 가장 작은 부호화 오차가 발생하는 심도를 선택한다. 예를 들어, 심도 0의 부호화 단위에 대한 부호화 오차는 분할 타입(912, 914, 916, 918)마다 움직임 예측을 수행하여 부호화 한 후 가장 작은 부호화 오차가 발생하는 예측 단위가 결정된다. 마찬가지로 심도 0, 1, ..., d-1 마다 부호화 오차가 가장 작은 예측 단위가 검색될 수 있다. 심도 d에서는, 크기 2N_dx2N_d의 부호화 단위이면서 예측 단위(960)를 기반으로 한 움직임 예측을 통해 부호화 오차가 결정될 수 있다. 이와 같이 심도 0, 1, ..., d-1, d의 모든 심도별 최소 부호화 오차를 비교하여 오차가 가장 작은 심도가 선택되어 부호화 심도로 결정될 수 있다. 부호화 심도 및 해당 심도의 예측 단위는 부호화 모드에 관한 정보로써 부호화되어 전송될 수 있다. 또한, 심도 0으로부터 부호화 심도에 이르기까지 부호화 단위가 축소되어야 하므로, 부호화 심도의 축소 정보만이 '0'으로 설정되고, 부호화 심도를 제외한 심도별 축소 정보는 '1'로 설정되어야 한다.
본 발명의 일 실시예에 따른 영상 복호화 장치(200)의 부호화 정보 추출부(220)는 부호화 단위(912)에 대한 부호화 심도 및 예측 단위에 관한 정보를 추출하여 부호화 단위(912)를 복호화하는데 이용할 수 있다. 일 실시예에 따른 영상 복호화 장치(200)는 심도별 축소 정보를 이용하여 축소 정보가 '0'인 심도를 부호화 심도로 파악하고, 해당 심도에 대한 부호화 모드에 관한 정보를 이용하여 복호화에 이용할 수 있다.
도 10a 및 10b는 본 발명의 일 실시예에 따른, 부호화 단위, 예측 단위 및 주파수 변환 단위의 관계를 도시한다.
부호화 단위(1010)는, 최대 부호화 단위(1000)에 대해 일 실시예에 따른 영상 부호화 장치(100)가 결정한 부호화 심도별 부호화 단위들이다. 예측 단위(1060) 는 부호화 단위(1010) 중 각각의 부호화 심도별 부호화 단위의 예측 단위들이며, 변환 단위(1070)는 각각의 부호화 심도별 부호화 단위의 변환 단위들이다.
심도별 부호화 단위들(1010)은 최대 부호화 단위(1000)의 심도가 0이라고 하면, 부호화 단위들(1012, 1054)은 심도가 1, 부호화 단위들(1014, 1016, 1018, 1028, 1050, 1052)은 심도가 2, 부호화 단위들(1020, 1022, 1024, 1026, 1030, 1032, 1038)은 심도가 3, 부호화 단위들(1040, 1042, 1044, 1046)은 심도가 4이다.
예측 단위들(1060) 중 일부(1014, 1016, 1022, 1032, 1048, 1050, 1052, 1054)는 부호화 단위가 분할된 타입이다. 즉, 예측 단위(1014, 1022, 1050, 1054)는 2NxN의 분할 타입이며, 예측 단위(1016, 1048, 1052)는 Nx2N의 분할 타입, 예측 단위(1032)는 NxN의 분할 타입이다. 즉, 심도별 부호화 단위들(1010)의 예측 단위는 각각의 부호화 단위보다 작거나 같다.
변환 단위들(1070) 중 일부(1052, 1054)의 영상 데이터에 대해서는 부호화 단위에 비해 작은 크기의 데이터 단위로 주파수 변환 또는 주파수 역변환이 수행된다. 또한, 변환 단위(1014, 1016, 1022, 1032, 1048, 1050, 1052, 1054)는 예측 단위들(1060) 중 해당 예측 단위와 비교해보면, 서로 다른 크기 또는 형태의 데이터 단위이다. 즉, 본 발명의 일 실시예에 따른 영상 부호화 장치(100) 및 영상 복호화 장치(200)는 동일한 부호화 단위에 대한 예측 및 주파수 변환/역변환 작업이라 할지라도, 각각 별개의 데이터 단위를 기반으로 수행할 수 있다.
도 11 은 본 발명의 일 실시예에 따른 부호화 단위별 부호화 정보를 도시한다.
본 발명의 일 실시예에 따른 영상 부호화 장치(100)의 부호화 정보 부호화부(140)는 부호화 단위별 부호화 정보를 부호화하고, 본 발명의 일 실시예에 따른 영상 복호화 장치(200)의 부호화 정보 추출부(220)는 부호화 단위별 부호화 정보를 추출할 수 있다.
부호화 정보는 부호화 단위에 대한 축소 정보, 분할 타입 정보, 예측 모드 정보, 변환 단위 크기 정보를 포함할 수 있다. 도 11에 도시되어 있는 부호화 정보들은 본 발명의 일 실시예에 따른 영상 부호화 장치(100) 및 영상 복호화 장치(200)에서 설정할 수 있는 일 예에 불과하며, 도시된 것에 한정되지 않는다.
축소 정보는 해당 부호화 단위의 부호화 심도를 나타낼 수 있다. 즉, 축소 정보에 따라 더 이상 축소되지 않는 심도가 부호화 심도이므로, 부호화 심도에 대해서 분할 타입 정보, 예측 모드, 변환 단위 크기 정보가 정의될 수 있다. 축소 정보에 따라 한 단계 더 축소되어야 하는 경우에는, 축소된 4개의 상위 심도의 부호화 단위마다 독립적으로 부호화가 수행되어야 한다.
분할 타입 정보는, 부호화 심도의 부호화 단위의 변환 단위의 분할 타입을 2Nx2N, 2NxN, Nx2N 및 NxN 중 하나로 나타낼 수 있다. 예측 모드는, 움직임 예측 모드를 인트라 모드, 인터 모드 및 스킵 모드 중 하나로 나타낼 수 있다. 인트라 모드는 분할 타입 2Nx2N 및 NxN에서만 정의될 수 있으며, 스킵 모드는 분할 타입 2Nx2N에서만 정의될 수 있다. 변환 단위 크기는 인트라 모드에서 두 종류의 크기, 인터 모드에서 두 종류의 크기로 설정될 수 있다.
부호화 단위 내의 최소 부호화 단위마다, 소속되어 있는 부호화 심도의 부호 화 단위별 부호화 정보를 수록하고 있을 수 있다. 따라서, 인접한 최소 부호화 단위들끼리 각각 보유하고 있는 부호화 정보들을 확인하면, 동일한 부호화 심도의 부호화 단위에 포함되는지 여부가 확인될 수 있다. 또한, 최소 부호화 단위가 보유하고 있는 부호화 정보를 이용하면 해당 부호화 심도의 부호화 단위를 확인할 수 있으므로, 최대 부호화 단위 내의 부호화 심도들의 분포가 유추될 수 있다.
이하, 도 4의 본 발명의 일 실시예에 따른 영상 부호화 장치(400)의 주파수 변환부(430) 및 도 5의 영상 복호화 장치(500)의 주파수 역변환부(540)에서 수행되는 주파수 영역에서의 변환 계수의 예측 과정에 대하여 구체적으로 설명한다.
도 12는 본 발명의 일 실시예에 따른 주파수 변환 장치의 구성을 나타낸 블록도이다. 도 12의 주파수 변환 장치(1200)는 도 4의 본 발명의 일 실시예에 따른 영상 부호화 장치(400)의 주파수 변환부(430)로서 이용될 수 있다.
도 12를 참조하면, 본 발명의 일 실시예에 따른 주파수 변환 장치(1200)는 변환부(1210), 변환 계수 예측부(1220) 및 감산부(1230)를 포함한다.
변환부(1210)는 부호화되는 현재 블록과 예측 블록의 차이값인 제 1 레지듀얼 블록을 주파수 영역으로 변환하여 변환 블록을 생성한다. 예측 블록은 도 4의 인트라 예측부(410)에 의한 인트라 예측을 통해 생성되거나 또는 움직임 보상부(425)에 의한 움직임 보상을 통해 생성된다. 제 1 레지듀얼 블록은 현재 블록과 예측 블록의 차이값인 원(oroginal) 레지듀얼 블록을 가리키는 것으로, 후술되는 불완전(incomplete) 레지듀얼 블록을 가리키는 제 2 레지듀얼 블록과 구별되기 위 해 별도로 정의된 것이다. 변환부(1210)는 제 1 레지듀얼 블록에 대한 이산 코사인 변환(discrete cosine transform)을 수행하여 변환 블록을 생성한다.
변환 계수 예측부(1220)는 변환 블록의 변환 계수들 중 예측될 적어도 하나의 저주파수 성분의 변환 계수를 소정값으로 치환하고, 소정값으로 치환된 변환 계수를 포함하는 변환 블록을 역변환하여 제 2 레지듀얼 블록을 생성한다. 그리고, 변환 계수 예측부(1220)는 제 2 레지듀얼 블록의 값들을 이용하여 예측될 저주파수 성분의 변환 계수의 예측자를 생성한다. 구체적인 저주파수 성분의 변환 계수의 예측자를 생성하는 과정에 대하여는 후술하기로 한다.
감산부(1230)는 저주파수 성분의 변환 계수와 대응되는 예측자 사이의 차이값을 계산한다. 본 발명의 일 실시예에 따른 주파수 변환 장치(1200)는 저주파수 성분의 변환 계수는 예측자와의 차이값만을 출력하며, 저주파수 성분의 변환 계수를 제외한 나머지 변환 계수는 원 변환 블록의 변환 계수를 그대로 출력한다. 본 발명의 일 실시예에 따른 주파수 변환 장치(1200)에 의하면 변환 계수들 중 상대적으로 큰 값을 갖는 저주파수 성분의 변환 계수들의 데이터량을 감소시킬 수 있어서, 영상의 압축 효율을 향상시킨다.
이하, 저주파수 성분의 변환 계수들의 예측자를 생성하는 과정에 대하여 상세히 설명한다.
도 13은 본 발명의 일 실시예에 따른 변환 계수 예측 모드들을 나타낸 도면이다.
도 13을 참조하면, 본 발명의 변환 계수 예측 모드(FDP_mode_n(n은 0,1,2,3))는 예측될 변환 계수에 따라서 다음과 같이 분류된다.
1) FDP_mode_0: 변환 블록의 최상측행의 소정 개수(L)의 변환 계수들(1310)를 예측하는 모드
2) FDP_mode_1: 변환 블록의 최좌측열의 소정 개수(L)의 변환 계수들(1320)를 예측하는 모드
3) FDP_mode_2: 변환 블록의 DC(Direct Current) 계수(1330)를 예측하는 모드
4) FDP_mode_3: 변환 블록의 DC 계수, 최상측행 및 최좌측열의 소정 개수(L)의 변환 계수들(1340)를 예측하는 모드
여기서 변환 계수 예측 모드는 현재 블록의 예측 블록의 예측 모드에 따라서 결정될 수 있다. 예를 들어, 예측 블록이 수직 방향의 인트라 예측 모드를 통해 생성된 경우는 FDP_mode_0, 예측 블록이 수평 방향의 인트라 예측 모드를 통해 생성된 경우는 FDP_mode_1, 예측 블록이 DC 모드로 인트라 예측되어 생성된 경우는 FDP_mode_2, 예측 블록이 전술한 인트라 예측 모드와 다른 방향의 예측 모드로 예측된 경우(움직임 보상된 경우 포함 가능)는 FDP_mode_3으로 선택될 수 있다. 이와 같이 예측 모드에 따라서 변환 계수 예측 모드를 선택하는 이유는, 예측 모드의 방향성에 따라서 참조 픽셀과 가까운 레지듀얼 블록의 경계에서는 가까운 주변 픽셀을 참조 픽셀로서 이용하기 때문에 레지듀얼 값이 작아지고, 예측 모드의 방향성에 따라서 참조 픽셀과 떨어진 레지듀얼 블록의 값은 커지는 경향이 있기 때문에 이러한 경향을 반영하기 위한 것이다.
또한, 예측될 변환 계수들의 개수(L)은 다음의 표 1에 표시된 바와 같이 변환 블록의 크기에 따라서 설정될 수 있다.
변환 블록의 크기 변환 계수 예측 길이(L)
4x4 3
8x8 3
16x16 4
32x32 4
64x64 4
변환 블록의 어느 하나의 행 또는 열의 예측될 변환 계수의 개수를 나타내는 변환 계수 예측 길이(L)은 상기 표 1에 표시된 바에 한정되지 않고 변경될 수 있다.
도 14는 본 발명의 일 실시예에 따른 변환 계수들의 예측 과정에서 이용되는 파라메터들의 명칭(nomenclature)을 설명하기 위한 참조도이다.
현재 블록의 크기를 NxM(N,M은 정수)이라고 하면, 예측 블록, 변환 블록, 제 1 레지듀얼 블록 및 2 레지듀얼 블록는 모두 NxM의 크기를 갖는다. 도 14에서는 NxM이 5x5인 경우를 예시하고 있다. 제 1 레지듀얼 블록(1410)의 (x,y)(0≤x≤N-1, 0≤y≤M-1)에 위치한 레지듀얼 값은 res(x,y)로 정의되며, 제 1 레지듀얼 블록(1410)에 대한 이산 코사인 변환을 수행하여 생성된 변환 블록(1420)의 (x,y)에 위치한 변환 계수는 c(x,y)로 정의된다. 또한, 후술되는 제 2 레지듀얼 블록(1430)의 (x,y)에 위치한 값은 f(x,y)로 정의된다. 변환 계수인 c(x,y)의 예측자(1440)는 fdpxy로 정의된다. 특히, 본 발명의 일 실시예에 따르면 모든 변환 계수의 예측자를 생성하는 것이 아니라 최상측행 및 최좌측열의 예측자들(1445) 중 저주파수 성분의 예측자만이 생성된다. 이는 최상측행 및 최좌측열의 변환 계수들이 다른 변환 계수들에 비하여 상대적으로 큰 값을 갖으며, 나머지 고주파수 성분의 변환 계수들은 0에 가까운 값이 많기 때문에 이러한 고주파수 성분의 변환 계수까지 예측하는 경우 예측에 소요되는 연산량에 비하여 압축 효율이 크게 향상되지 않기 때문이다.
이하, 변환 계수 예측 모드에 따른 변환 계수의 예측 과정에 대하여 구체적으로 설명한다.
1. 변환 계수 예측 모드 0( FDP _ mode _0)에 따른 변환 계수의 예측 과정
이산 코사인 변환의 기본 성분 함수(basis_elementnm)는 basis_elementnm=cos(nωxx)cos(mωyy)이며, (n,m) 위치에서의 변환 계수를 coeffnm이라고 하면, 레지듀얼 블록의 res(x,y)는 다음의 수학식 1과 같이 기본 성분 함수(basis_elementnm)와 변환 계수(coeffnm)의 선형 조합(linear combination) 형태로 표현될 수 있다.
Figure 112009048130874-pat00001
여기서, n=m=0인 경우, 즉 "0" 성분의 기본 성분 함수 basis_element00 는 상 수 1의 값을 갖는다. coeff00은 일반적으로 DC 계수라고 불리우며 이산 코사인 변환되는 입력값의 평균값을 나타낸다. DC 계수를 제외한 나머지 변환 계수들은 AC 계수라고 불리운다.
수학식 1의 우측에서 DC 계수와 AC 계수를 분리하여 표현하면 다음의 수학식 2와 같다.
Figure 112009048130874-pat00002
수학식 2에서 n+m>0이라는 조건은 AC 계수에 대한 연산임을 의미한다. 만약, 수학식 2에서 DC 계수 coeff00를 포함하는 변환 블록의 예측하고자 하는 최상측행의 변환 계수의 값을 0으로 설정하고, 역이산 코사인 변환을 수행한 경우 복원된 레지듀얼은 실제 레지듀얼값과 차이가 난다. 이는 예측하고자 하는 최상측행의 변환 계수들의 값을 0으로 설정하였기 때문이다. 본 발명을 설명함에 있어서 이와 같이 변환 계수의 일부 값을 다른 값으로 치환하고, 치환된 변환 블록을 역변환함으로써 생성되는 레지듀얼 블록을 불완전(Incomplete) 레지듀얼 블록 또는 제 2 레지듀얼 블록이라고 부르기로 한다. 불완전 레지듀얼 블록인 제 2 레지듀얼 블록 f(x,y)는 다음의 수학식 3과 같이 표현될 수 있다.
Figure 112009048130874-pat00003
전술한 바와 같이, 불완전 레지듀얼 블록 f(x,y)와 실제 레지듀얼 블록 res(x,y)는 0으로 설정된 변환 계수들로 인해 차이가 발생한다. 일반적으로 변환 계수들 중 DC 계수의 값이 가장 큰 값을 갖는다. 따라서 상기 차이는 대부분 DC 계수의 차이로 인한 것이다. 따라서, res(x,y) 및 f(x,y)로부터 다음의 수학식 4와 같이 DC 계수의 값을 예측할 수 있다.
Figure 112009048130874-pat00004
디코더측에서는 수학식 4를 이용하여 DC 계수를 직접적으로 예측할 수는 없다. 왜냐하면, 복호화시에는 역변환을 통해 주파수 영역의 변환 계수를 시간 영역의 레지듀얼로 변환하게 되는데, 후술되는 바와 같이 본 발명의 일 실시예에 따르면 저주파수 성분의 변환 계수에 대해서는 예측자와의 차이값만이 비트스트림에 포함되어 있어서 레지듀얼 정보 res(x,y)를 바로 복원할 수 없기 때문이다.
수학식 4에서 원 레지듀얼 블록의 정보 res(x,y) 및 불완전 레지듀얼 블록의 정보 f(x,y) 중에서 최상측행의 정보만을 이용하고, 예측 블록의 생성에 수직 방향의 인트라 예측 모드가 적용되어 레지듀얼 블록의 방향성으로 인해서 res(x,0)=0이고, res(0,y)≠0이라고 가정하면 다음의 수학식 5와 같은 DC 계수의 예측자 fdp00를 유도할 수 있다.
Figure 112009048130874-pat00005
fdp0000 )는 DC 계수의 값에 비례하며, 부호만 DC 계수와 반대인 값을 갖는다. 따라서, 수학식 5에 도시된 fdp00를 수직 방향의 인트라 예측 모드로 예측되어 생성된 레지듀얼 블록의 변환 블록의 변환 계수들 중 DC 계수의 예측자로 이용할 수 있다. 구체적으로는 fdp00에 소정의 보정값(corr_factor)을 곱한 값을 예측자로 이용하는 것이 바람직하다. 보정값(corr_factor)에 대해서는 후술한다.
변환 블록의 변환 계수들 중 최상측행의 변환 계수 c(n,0)의 예측자 fdpn0는 다음의 수학식 6과 같이 기본 성분 함수와 최상측행에 대응되는 불완전 레지듀얼 블록 값의 곱(dot product)을 통해 계산될 수 있다.
Figure 112009048130874-pat00006
도 15는 도 13의 변환 계수 예측 모드 0(FDP_mode_0)에 따른 변환 계수의 예측 과정을 설명하기 위한 참조도이다.
변환 계수 예측 모드 0(FDP_mode_0)에서는 최상측행의 변환 계수들 중 소정 개수의 변환 계수가 예측된다. 전술한 바와 같이, 변환 계수 예측 모드 0(FDP_mode_0)는 예측 블록이 수직 방향의 인트라 예측 모드를 통해 생성된 경우 선택되는 것이 바람직하다. 도 15에서는 최상측행의 변환 계수들 중 3개의 변환 계수들 c(0,0), c(1,0), c(2,0)의 예측자를 생성하는 과정을 예시한다.
변환 계수 예측부(1220)는 변환 블록의 변환 계수들 중 예측될 3개의 변환 계수들 c(0,0), c(1,0), c(2,0)을 도면 부호 1505로 표시된 바와 같이 0으로 치환하여 치환된 변환 블록(1500)을 생성한다. 변환 계수 예측부(1220)는 치환된 변환 블록(1500)을 역변환하여 제 2 레지듀얼 블록(1510)을 생성한다.
변환 계수 예측부(1220)은 생성된 제 2 레지듀얼 블록의 최상측행의 값들(1515)를 이용하여 예측될 3개의 변환 계수들 c(0,0), c(1,0), c(2,0)의 예측자들 fdp00, fdp10, fdp20를 생성한다.
구체적으로, 전술한 수학식 5를 이용하여 변환 계수 예측부(1220)는 다음의 수학식;
Figure 112009048130874-pat00007
과 같이 DC 변환 계수인 c(0,0)의 예측자 fdp00를 생성한다.
또한, 변환 계수 예측부(1220)는 전술한 수학식 6을 이용하여 다음의 수학식;
Figure 112009048130874-pat00008
Figure 112009048130874-pat00009
과 같이 나머지 최상측행의 변환 계수들 c(1,0) 및 c(2,0)의 예측자 fdp10 및 fdp20 를 생성한다.
변환 계수 예측부(1220)은 DC 변환 계수인 c(0,0)의 예측자 fdp00, 나머지 최상측행의 변환 계수들 c(1,0) 및 c(2,0)의 예측자 fdp10 및 fdp20를 출력하고, 감산부(1230)은 원 변환 계수와 예측자 사이의 차이값을 계산하여 출력한다.
전술한 바와 같이, 변환 계수 예측부(1220)은 DC 변환 계수인 c(0,0)의 예측자 fdp00, 나머지 최상측행의 변환 계수들 c(1,0) 및 c(2,0)의 예측자 fdp10 및 fdp20에 보정값(corr_factor)을 곱하여 스케일링(scaling) 보정된 예측자를 출력할 수도 있다.
도 16은 변환 계수 예측 모드 0(FDP_mode_0)에 따른 변환 계수의 예측 결과에 따라서 부호화되는 변환 블록을 나타낸 도면이다.
도 16을 참조하면, 변환 블록(1600)의 최상측행의 변환 계수들 중 예측될 변환 계수들(1605)은 그대로 부호화되는 것이 아니라, 변환 계수 예측부(1220)로부터 계산된 예측자와의 차이값만이 부호화된다. 이를 통해 상대적으로 큰 데이터 값을 갖는 저주파수 성분의 변환 계수의 데이터량을 감소시킴으로써 영상의 압축 효율을 향상시킬 수 있다.
2. 변환 계수 예측 모드 1( FDP _ mode _1)에 따른 변환 계수의 예측 과정
원 레지듀얼 블록의 정보 res(x,y) 및 불완전 레지듀얼 블록의 정보 f(x,y) 중에서 최좌측열의 정보만을 이용하고, 예측 블록의 생성에 수평 방향의 인트라 예측 모드가 적용되어 레지듀얼 블록의 방향성으로 인해서 res(0,y)=0이고, res(x,0)≠0이라고 가정한다. 또한, 불완전 레지듀얼 블록 f(x,y)는 변환 블록의 최좌측열의 변환 계수들 중 예측하고자 하는 변환 계수를 0으로 치환한 다음 역변환하여 생성된 것이라고 가정하다. 그러면 전술한 수학식 4로부터 다음의 수학식 7과 같은 DC 계수의 예측자 fdp00를 유도할 수 있다.
Figure 112009048130874-pat00010
전술한 바와 같이 수학식 7의 fdp0000 )는 DC 계수의 값에 비례하며, 부호만 DC 계수와 반대인 값을 갖는다. 따라서, 수학식 7의 fdp00를 수평 방향의 인트 라 예측 모드로 예측되어 생성된 레지듀얼 블록의 변환 블록의 변환 계수들 중 DC 계수의 예측자로 이용할 수 있다. DC 계수의 예측자 fdp00에 소정의 보정값(corr_factor)을 곱한 값을 예측자로 이용하는 것이 바람직하다. 보정값(corr_factor)에 대해서는 후술한다.
변환 블록의 변환 계수들 중 최좌측열의 변환 계수 c(0,m)의 예측자 fdp0m는 다음의 수학식 8과 같이 기본 성분 함수와 최좌측열에 대응되는 불완전 레지듀얼 블록 값의 곱(dot product)을 통해 계산될 수 있다.
Figure 112009048130874-pat00011
도 17은 도 13의 변환 계수 예측 모드 1(FDP_mode_1)에 따른 변환 계수의 예측 과정을 설명하기 위한 참조도이다.
변환 계수 예측 모드 1(FDP_mode_1)에서는 최좌측열의 변환 계수들 중 소정 개수의 변환 계수가 예측된다. 전술한 바와 같이, 변환 계수 예측 모드 1(FDP_mode_1)는 예측 블록이 수평 방향의 인트라 예측 모드를 통해 생성된 경우 선택되는 것이 바람직하다. 도 17에서는 최좌측열의 변환 계수들 중 3개의 변환 계수들 c(0,0), c(0,1), c(0,2)의 예측자를 생성하는 과정을 예시한다.
변환 계수 예측부(1220)는 변환 블록의 변환 계수들 중 예측될 3개의 변환 계수들 c(0,0), c(0,1), c(0,2)을 도면 부호 1705로 표시된 바와 같이 0으로 치환 하여 치환된 변환 블록(1700)을 생성한다. 변환 계수 예측부(1220)는 치환된 변환 블록(1700)을 역변환하여 제 2 레지듀얼 블록(1710)을 생성한다.
변환 계수 예측부(1220)은 생성된 제 2 레지듀얼 블록(1710)의 최좌측열의 값들(1715)를 이용하여 예측될 3개의 변환 계수들 c(0,0), c(0,1), c(0,2)의 예측자들 fdp00, fdp01, fdp02를 생성한다.
구체적으로, 전술한 수학식 7을 이용하여 변환 계수 예측부(1220)는 다음의 수학식;
Figure 112009048130874-pat00012
과 같이 DC 변환 계수인 c(0,0)의 예측자 fdp00를 생성한다.
또한, 변환 계수 예측부(1220)는 전술한 수학식 8을 이용하여 다음의 수학식;
Figure 112009048130874-pat00013
Figure 112009048130874-pat00014
과 같이 나머지 최좌측열의 변환 계수들 c(0,1) 및 c(0,2)의 예측자 fdp01 및 fdp02 를 생성한다.
변환 계수 예측부(1220)은 DC 변환 계수인 c(0,0)의 예측자 fdp00, 나머지 최좌측열의 변환 계수들 c(0,1) 및 c(0,2)의 예측자 fdp01 및 fdp02를 출력하고, 감산부(1230)은 원 변환 계수와 예측자 사이의 차이값을 계산하여 출력한다.
전술한 바와 같이, 변환 계수 예측부(1220)은 DC 변환 계수인 c(0,0)의 예측자 fdp00, 나머지 최좌측열의 변환 계수들 c(0,1) 및 c(0,2)의 예측자 fdp01 및 fdp02에 보정값(corr_factor)을 곱하여 스케일링(scaling) 보정된 예측자를 출력할 수도 있다.
도 18은 변환 계수 예측 모드 1(FDP_mode_1)에 따른 변환 계수의 예측 결과에 따라서 부호화되는 변환 블록을 나타낸 도면이다.
도 18을 참조하면, 변환 블록(1800)의 최좌측열의 변환 계수들 중 예측될 변환 계수들(1805)은 그대로 부호화되는 것이 아니라, 변환 계수 예측부(1220)로부터 계산된 예측자와의 차이값만이 부호화된다. 이를 통해 상대적으로 큰 데이터 값을 갖는 저주파수 성분의 변환 계수의 데이터량을 감소시킴으로써 영상의 압축 효율을 향상시킬 수 있다.
3. 변환 계수 예측 모드 2( FDP _ mode _2)에 따른 변환 계수의 예측 과정
전술한 수학식 2에서 변환 블록의 예측하고자 하는 DC 계수 coeff00의 값을 0으로 설정하고, 역이산 코사인 변환을 수행하여 생성된 불완전 레지듀얼 블록 f(x,y)와 실제 레지듀얼 블록 res(x,y)는 0으로 설정된 DC 계수 coeff00의 값만큼의 차이가 발생한다. 전술한 수학식 4에서 원 레지듀얼 블록의 정보 res(x,y) 및 불완전 레지듀얼 블록의 정보 f(x,y) 중에서 최상측행 및 최좌측열의 정보만을 이용하고, res(x,0)=res(0,y)=0이라고 가정하면 다음의 수학식 9와 같이 DC 계수의 예 측자 fdp00를 계산할 수 있다.
Figure 112009048130874-pat00015
fdp0000 )는 DC 계수의 값에 비례하는 값을 가지며, 부호만 DC 계수와 반대이므로 수학식 9에 도시된 fdp00를 DC 계수의 예측자로 이용할 수 있다. DC 계수의 예측자 fdp00에 소정의 보정값(corr_factor)을 곱한 값을 예측자로 이용하는 것이 바람직하다. 보정값(corr_factor)에 대해서는 후술한다.
도 19은 도 13의 변환 계수 예측 모드 2(FDP_mode_2)에 따른 변환 계수의 예측 과정을 설명하기 위한 참조도이다.
변환 계수 예측 모드 2(FDP_mode_2)에서는 변환 계수들 중 DC 계수만이 예측된다. 전술한 바와 같이, 변환 계수 예측 모드 2(FDP_mode_2)는 예측 블록이 DC 모드를 통해 생성된 경우 선택되는 것이 바람직하다. 도 19에서는 c(0,0)의 예측자를 생성하는 과정을 예시한다.
변환 계수 예측부(1220)는 변환 블록의 변환 계수들 중 예측될 c(0,0)을 도면 부호 1905로 표시된 바와 같이 0으로 치환하여 치환된 변환 블록(1900)을 생성한다. 변환 계수 예측부(1220)는 치환된 변환 블록(1900)을 역변환하여 제 2 레지듀얼 블록(1910)을 생성한다.
변환 계수 예측부(1220)은 생성된 제 2 레지듀얼 블록(1910)의 최상측행 및 최좌측열의 값들(1915)를 이용하여 변환 계수 c(0,0)의 예측자들 fdp00를 생성한다.
구체적으로, 전술한 수학식 9를 이용하여 변환 계수 예측부(1220)는 다음의 수학식;
Figure 112009048130874-pat00016
과 같이 DC 변환 계수인 c(0,0)의 예측자 fdp00를 생성한다.
변환 계수 예측부(1220)은 DC 변환 계수인 c(0,0)의 예측자 fdp00를 출력하고, 감산부(1230)은 원 변환 계수와 예측자 사이의 차이값을 계산하여 출력한다.
전술한 바와 같이, 변환 계수 예측부(1220)은 DC 변환 계수인 c(0,0)의 예측자 fdp00에 보정값(corr_factor)을 곱하여 스케일링(scaling) 보정된 예측자를 출력할 수도 있다.
도 20은 변환 계수 예측 모드 2(FDP_mode_2)에 따른 변환 계수의 예측 결과에 따라서 부호화되는 변환 블록을 나타낸 도면이다.
도 20을 참조하면, 변환 블록(2000)의 예측될 DC 변환 계수(2005)는 그대로 부호화되는 것이 아니라, 변환 계수 예측부(1220)로부터 계산된 예측자와의 차이값만이 부호화된다. 이를 통해 상대적으로 큰 데이터 값을 갖는 DC 성분의 변환 계수의 데이터량을 감소시킴으로써 영상의 압축 효율을 향상시킬 수 있다.
4. 변환 계수 예측 모드 3( FDP _ mode _3)에 따른 변환 계수의 예측 과정
변환 계수 예측 모드 3(FDP_mode_3)은 전술한 변환 계수 예측 모드 0~2와 달리 불완전 레지듀얼 블록의 정보 f(x,y) 뿐만 아니라 예측 블록의 값 pred(x,y) 및 이전에 부호화된 후 복원된 주변 픽셀의 값인 rec(x,-1) 및 rec(-1,y)를 이용하여 변환 블록의 최상측행 및 최좌측열의 변환 계수들을 예측하는 모드이다.
도 21은 도 13의 변환 계수 예측 모드 3(FDP_mode_3)에 따라서 변환 계수들을 예측하는 과정을 개괄한 참조도이다.
도 21을 참조하면, 변환 계수 예측 모드 3(FDP_mode_3)에 따른 변환 계수들을 예측하는 과정은 고주파수 성분의 변환 계수들로부터 DC 계수까지의 주파수 크기에 따라서 순차적으로 예측자를 생성한다.
구체적으로, 변환 블록(2100)의 최상측행 및 최좌측열의 변환 계수들 중 해칭된 저주파수 성분의 변환 계수들(2101 내지 2105)이 변환 계수 예측 모드 3(FDP_mode_3)에 따라서 예측될 변환 계수들이라고 가정한다.
변환 계수 예측부(1220)는 변환 블록의 예측될 저주파수 성분의 변환 계수들(2101 내지 2105)을 모두 0으로 치환한 다음 치환된 변환 블록을 역변환하여 불완전 레지듀얼 블록인 제 2 레지듀얼 블록을 생성한다. 변환 계수 예측부(1220)는 제 2 레지듀얼 블록의 최상측행 및 최좌측열의 값들과 예측 블록의 값 및 주변 픽셀을 이용하여 예측될 저주파수 성분의 변환 계수들(2101 내지 2105) 중에서 상대적으로 가장 큰 고주파수 성분을 갖는 제 1 변환 계수들인 c(2,0)(2101) 및 c(0,2)(2102)의 예측자를 생성한다.
제 1 변환 계수(2101,2102)에 대한 예측자가 생성되면, 변환 계수 예측부(1220)는 변환 블록의 예측될 변환 계수들 중 제 1 변환 계수의 주파수 성분보다 작은 주파수 성분을 갖는 변환 계수들(2111 내지 2113)을 다시 0으로 치환하고, 치환된 변환 블록(2110)을 역변환하여 불완전 레지듀얼 블록인 제 3 레지듀얼 블록을 생성한다. 변환 계수 예측부(1220)는 제 3 레지듀얼 블록의 최상측행 및 최좌측열의 값들과 예측 블록의 값 및 주변 픽셀을 이용하여 변환 계수들(2111 내지 2113) 중에서 상대적으로 가장 큰 주파수 성분을 갖는 제 2 변환 계수(2111,2112)의 예측자를 생성한다.
DC 계수를 제외한 모든 저주파수 성분의 변환 계수들의 예측자가 생성되면, 변환 계수 예측부(1220)는 변환 블록의 변환 계수들 중 DC 계수(2121)만을 0으로 치환하고 치환된 변환 블록(2120)을 역변환하여 불완전 레지듀얼 블록인 제 4 레지듀얼 블록을 생성한다. 변환 계수 예측부(1220)은 제 4 레지듀얼 블록의 최상측행 및 최좌측열의 값들과 예측 블록의 값 및 주변 픽셀을 이용하여 DC 계수(2121)의 예측자를 생성한다.
변환 계수 예측 모드 3(FDP_mode_3)에 따른 변환 계수들을 예측하는 과정을 일반화하면 다음과 같다. 제 2 레지듀얼 블록의 (x,y)(0≤x≤N-1, 0≤y≤M-1)에 위치한 값을 f(x,y), 변환 블록의 (n,m) 위치의 변환 계수의 예측자를 fdpnm, 이산 코사인 변환의 기본 성분 함수(basis_elementnm)는 basis_elementnm=cos(nωxx)cos(mωyy), 예측 블록에서 (x,y)에 위치한 값을 pred(x,y), 현재 블록 이전에 복원된 주 변 블록의 값을 rec(x,-1) 및 rec(-1,y), 제 1 변환 계수는 최상측행 및 최좌측열의 변환 계수들 (0,L) 및 (L,0)(L은 2이상의 정수)에 위치한 변환 계수라고 할 때, 변환 계수 예측부(1220)는 다음의 수학식 10과 같이 파라메터 σ000a 및 σb0를 계산한다.
Figure 112009048130874-pat00017
,
Figure 112009048130874-pat00018
(a는 1부터 L까지의 정수), 및
Figure 112009048130874-pat00019
(b는 1부터 L까지의 정수)
그리고, 변환 계수 예측부(1220)은 계산된 파라메터들 σ000a 및 σb0를 이용하여 상기 제 1 변환 계수에 대응되는 예측자 fdpL0및 fdp0L를 생성한다.
다음 변환 계수 예측부(1220)는 변환 블록의 예측될 변환 계수들 중 제 1 변환 계수의 주파수 성분보다 작은 주파수 성분을 갖는 변환 계수들을 0으로 치환하 고, 치환된 변환 블록을 역변환하여 제 3 레지듀얼 블록을 생성한다. 변환 계수 예측부(1220)는 전술한 수학식 10에서 f(x,y)의 값을 새롭게 생성된 제 3 레지듀얼 블록의 (x,y)에 위치한 값으로 대체하고, 다시 파라메터들 σ000a 및 σb0를 계산할 수 있다. 이 경우 a=1부터 (L-1)까지의 정수값의 범위를 갖으며, b=1 부터 (L-1)까지의 정수값을 갖는다. 그리고, 변환 계수 예측부(1220)은 새롭게 계산된 파라메터들 σ000a 및 σb0를 이용하여 상기 제 2 변환 계수에 대응되는 예측자 fdpL0및 fdp0L를 생성한다. 이러한 예측 과정은 예측될 변환 계수들 중에서 DC 변환 계수를 제외한 나머지 AC 변환 계수들에 대한 예측자가 완료될 때까지 반복된다.
도 22 내지 도 24는 본 발명의 일 실시예에 따라서 변환 계수 예측 모드 3(FDP_mode_3)에 따라서 L=3인 경우의 변환 계수의 예측 과정을 설명하기 위한 참조도이다. 구체적으로 도 22는 제 1 변환 계수에 대응되는 c(0,2), c(2,0)의 예측자를 생성하는 과정을 설명하기 위한 참조도이며, 도 23은 제 2 변환 계수에 대응되는 c(0,1), c(1,0)의 예측자를 생성하는 과정을 설명하기 위한 참조도이며, 도 24는 DC 계수인 c(0,0)의 예측자를 생성하는 과정을 설명하기 위한 참조도이다.
도 22를 참조하면, 변환 계수 예측부(1220)는 변환 블록의 변환 계수들 중 예측될 최상측행 및 최좌측열의 변환 계수들 c(0,0), c(0,1), c(1,0), c(0,2), c(2,0)을 도면 부호 2210로 표시된 바와 같이 0으로 치환하여 치환된 변환 블록(2200)을 생성한다. 변환 계수 예측부(1220)는 치환된 변환 블록(2200)을 역변환하여 제 2 레지듀얼 블록(2210)을 생성한다.
다음 변환 계수 예측부(1220)은 제 2 레지듀얼 블록(2210)의 최상측행 및 최좌측열의 값들(2215), 상측의 주변 픽셀들(2220) 및 좌측의 주변 픽셀들(2230)을 이용하여, 전술한 수학식 10에서 L=2인 경우에 대응되는 다음의 수학식 11과 같이 파라메터들 σ00011002및 σ20 를 계산한다.
Figure 112009048130874-pat00020
Figure 112009048130874-pat00021
변환 계수 예측부(1220)은 제 1 변환 계수인 c(2,0) 및 c(0,2)의 예측자 fdp20및 fdp02를 다음의 수학식 12과 같이 계산한다.
Figure 112009048130874-pat00022
수학식 12에서 파라메터들 σ00011002및 σ20 에 곱하여지는 값들은 실험적으로 결정된 것으로 변경될 수 있다.
도 23을 참조하면, 제 1 변환 계수에 대응되는 예측자 fdp20및 fdp02가 생성된 다음, 변환 계수 예측부(1220)는 예측될 변환 계수들 중 제 1 변환 계수인 c(0,2) 및 c(2,0)의 주파수 성분보다 작은 주파수 성분을 갖는 변환 계수들인 c(0,1), c(1,0) 및 c(0,0)(2310)을 0으로 치환하고, 치환된 변환 블록(2300)을 역변환하여 제 3 레지듀얼 블록을 생성한다. 다음 변환 계수 예측부(1220)은 제 3 레지듀얼 블록(2310)의 최상측행 및 최좌측열의 값들(2315), 상측의 주변 픽셀들(2320) 및 좌측의 주변 픽셀들(2330)을 이용하여, 다음의 수학식 13과 같이 파라메터들 σ0001 및 σ10를 새롭게 계산한다.
Figure 112009048130874-pat00023
Figure 112009048130874-pat00024
변환 계수 예측부(1220)은 제 2 변환 계수인 c(1,0) 및 c(0,1)의 예측자 fdp10및 fdp01를 다음의 수학식 14와 같이 계산한다.
Figure 112009048130874-pat00025
수학식 14에서 파라메터들 σ000110에 곱하여지는 값들은 실험적으로 결정된 것으로 변경될 수 있다.
마지막으로 도 24를 참조하면, 제 2 변환 계수에 대응되는 예측자 fdp10및 fdp01가 생성된 다음, 변환 계수 예측부(1220)는 DC 계수인 c(0,0)(2410)을 0으로 치환하고, 치환된 변환 블록(2400)을 역변환하여 제 4 레지듀얼 블록(2410)을 생성한다. 다음 변환 계수 예측부(1220)은 제 4 레지듀얼 블록(2410)의 최상측행 및 최좌측열의 값들(2415), 상측의 주변 픽셀들(2420) 및 좌측의 주변 픽셀들(2430)을 이용하여, 다음의 수학식 15와 같이 파라메터들 σ00를 새롭게 계산한다.
Figure 112009048130874-pat00026
수학식 15를 통해 계산된 σ00은 바로 DC 변환 계수의 예측자 fdp00으로 이용될 수 있다. 한편, 변환 계수 예측부(1220)는 변환 계수 예측 모드 3(FDP_mode_3)에 따라서 순차적으로 예측된 예측자에 보정값(corr_factor)을 곱하여 스케일링(scaling) 보정된 예측자를 출력할 수도 있다.
도 25는 변환 계수 예측 모드 3(FDP_mode_3)에 따른 변환 계수의 예측 결과에 따라서 부호화되는 변환 블록을 나타낸 도면이다.
도 25를 참조하면, 변환 블록(2500)의 예측될 DC 변환 계수(2510)는 그대로 부호화되는 것이 아니라, 변환 계수 예측부(1220)로부터 순차적으로 계산된 예측자와의 차이값만이 부호화된다. 이를 통해 상대적으로 큰 데이터 값을 갖는 DC 성분의 변환 계수의 데이터량을 감소시킴으로써 영상의 압축 효율을 향상시킬 수 있다.
전술한 바와 같이 변환 계수 예측 모드들에 따라서 생성된 변환 계수의 예측자(fdpnm)에 소정의 보정값(core_factor)를 곱한 후 그 결과값을 최종적인 예측자로 이용할 수 있다. 이러한 보정값(core_factor)은 예측 모드의 방향과 양자화 파라메터(QP)의 값을 고려하여 다음의 표 2와 같이 설정될 수 있다.
Figure 112009048130874-pat00027
도 26은 본 발명의 일 실시예에 따른 영상 부호화 방법을 나타낸 플로우 차트이다.
도 26을 참조하면, 단계 2610에서 부호화되는 현재 블록과 예측 블록의 차이값인 제 1 레지듀얼 블록을 주파수 영역으로 변환하여 변환 블록을 생성한다.
단계 2620에서 변환 블록의 변환 계수들 중 예측될 적어도 하나의 저주파수 성분의 변환 계수를 소정값으로 치환하고, 소정값으로 치환된 변환 계수를 포함하는 변환 블록을 역변환하여 제 2 레지듀얼 블록을 생성한다. 전술한 바와 같이 소정값은 0의 값이 바람직하다.
단계 2630에서 제 2 레지듀얼 블록의 값들을 이용하여 예측될 저주파수 성분의 변환 계수의 예측자를 생성한다. 전술한 바와 같이, 변환 계수 예측부(1220)은 변환 계수 예측 모드(FDP_mode)에 따라서 제 2 레지듀얼 블록의 최상측행 및 최좌측열의 중 적어도 하나와 기본 성분 함수의 선형 조합값을 계산하여 변환 계수의 예측자를 생성한다. 변환 계수 예측 모드 3인 경우에는 이외에도 예측 블록의 값 및 주변 픽셀의 값 역시 변환 계수의 예측에 이용된다.
단계 2640에서, 변환 계수의 예측 결과 생성된 예측자와 실제 변환 계수의 차이값을 계산하고 예측된 저주파수 성분의 변환 계수에 대한 부호화 정보로는 차이값만을 부호화하여 전송하게 된다.
도 27은 본 발명의 일 실시예에 따른 주파수 역변환 장치의 구성을 나타낸 블록도이다. 도 27의 주파수 역변환 장치(2700)은 도 5의 본 발명의 일 실시예에 따른 영상 복호화 장치(500)의 주파수 역변환부(540)로서 이용될 수 있다.
도 27을 참조하면, 본 발명의 일 실시예에 따른 주파수 역변환 장치(2700)는 변환 계수 복원부(2710), 변환 계수 예측부(2720) 및 가산부(2730)를 포함한다.
변환 계수 정보 복원부(2710)는 비트스트림으로부터 현재 블록과 예측 블록의 차이값인 제 1 레지듀얼 블록을 주파수 영역으로 변환한 변환 블록의 변환 계수들 중 예측된 저주파수 성분의 변환 계수와 대응되는 예측자 사이의 차이값에 대한 정보와, 예측된 저주파수 성분의 변환 계수를 제외한 나머지 변환 계수들을 복원한다. 일 예로, 도 16에 도시된 바와 같이 실제 변환 계수와 예측자의 차이값으로 구성된 정보와 예측된 변환 계수를 제외한 나머지 변환 계수에 대한 정보를 복원한다.
변환 계수 예측부(2720)는 현재 변환 블록에 적용된 변환 계수 예측 모드에 따라서, 전술한 도 12의 변환 계수 예측부(1220)와 동일하게 변환 블록의 저주파수 성분의 변환 계수를 소정값으로 치환하고, 소정값으로 치환된 변환 계수를 포함하는 변환 블록을 역변환하여 제 2 레지듀얼 블록을 생성한 다음, 제 2 레지듀얼 블록의 값들을 이용하여 저주파수 성분의 변환 계수의 예측자를 생성한다.
가산부(2730)은 예측자와 대응되는 변환 계수의 복원된 차이값을 가산하여 저주파수 성분의 변환 계수를 복원한다.
도 28은 본 발명의 일 실시예에 따른 영상 복호화 방법을 나타낸 플로우 차트이다.
도 28을 참조하면, 단계 2810에서 현재 블록과 예측 블록의 차이값인 제 1 레지듀얼 블록을 주파수 영역으로 변환한 변환 블록의 변환 계수들 중 적어도 하나의 저주파수 성분의 변환 계수와 저주파수 성분의 예측자 사이의 차이값과, 저주파수 성분을 제외한 변환 블록의 나머지 변환 계수들이 복원된다.
단계 2820에서 변환 블록의 저주파수 성분의 변환 계수를 소정값으로 치환하고, 소정값으로 치환된 변환 계수를 포함하는 변환 블록을 역변환하여 제 2 레지듀얼 블록을 생성한다.
단계 2830에서 제 2 레지듀얼 블록의 값들을 이용하여 저주파수 성분의 변환 계수의 예측자를 생성한다.
단계 2840에서 예측자와 대응되는 차이값을 가산하여 상저주파수 성분의 변환 계수를 복원한다.
본 발명의 일 실시예에 따르면 주파수 영역에서 변환 계수의 예측을 통해 변환 계수들 중에서 상대적으로 데이터량이 저주파수 성분의 변환 계수의 데이터량을 감소시킴으로써 영상의 압축 효율을 향상시킬 수 있다.
본 발명에 따른 영상의 부호화, 복호화 방법은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 포함된. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치의 블록도이다.
도 2 는 본 발명의 일 실시예에 따른 영상 복호화 장치의 블록도를 도시한다.
도 3은 본 발명의 일 실시예에 따른 계층적 부호화 단위를 도시한다.
도 4 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 부호화부의 블록도를 나타낸 것이다.
도 5 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 복호화부의 블록도를 나타낸 것이다.
도 6은 본 발명의 일 실시예에 따른 심도별 부호화 단위 및 예측 단위를 도시한다.
도 7은 본 발명의 일 실시예에 따른, 부호화 단위 및 변환 단위의 관계를 도시한다.
도 8은 본 발명의 일 실시예에 따라, 심도별 부호화 정보들을 도시한다.
도 9 는 본 발명의 일 실시예에 따른 심도별 부호화 단위를 도시한다.
도 10a 및 10b는 본 발명의 일 실시예에 따른, 부호화 단위, 예측 단위 및 주파수 변환 단위의 관계를 도시한다.
도 11 은 본 발명의 일 실시예에 따른 부호화 단위별 부호화 정보를 도시한다.
도 12는 본 발명의 일 실시예에 따른 주파수 변환 장치의 구성을 나타낸 블 록도이다.
도 13은 본 발명의 일 실시예에 따른 변환 계수 예측 모드들을 나타낸 도면이다.
도 14는 본 발명의 일 실시예에 따른 변환 계수들의 예측 과정에서 이용되는 파라메터들의 명칭(nomenclature)을 설명하기 위한 참조도이다.
도 15는 도 13의 변환 계수 예측 모드 0(FDP_mode_0)에 따른 변환 계수의 예측 과정을 설명하기 위한 참조도이다.
도 16은 (FDP_mode_0)에 따른 변환 계수의 예측 결과에 따라서 부호화되는 변환 블록을 나타낸 도면이다.
도 17은 도 13의 변환 계수 예측 모드 1(FDP_mode_1)에 따른 변환 계수의 예측 과정을 설명하기 위한 참조도이다.
도 18은 변환 계수 예측 모드 1(FDP_mode_1)에 따른 변환 계수의 예측 결과에 따라서 부호화되는 변환 블록을 나타낸 도면이다.
도 19은 도 13의 변환 계수 예측 모드 2(FDP_mode_2)에 따른 변환 계수의 예측 과정을 설명하기 위한 참조도이다.
도 20은 변환 계수 예측 모드 2(FDP_mode_2)에 따른 변환 계수의 예측 결과에 따라서 부호화되는 변환 블록을 나타낸 도면이다.
도 21은 도 13의 변환 계수 예측 모드 3(FDP_mode_3)에 따라서 변환 계수들을 예측하는 과정을 개괄한 참조도이다.
도 22 내지 도 24는 본 발명의 일 실시예에 따라서 변환 계수 예측 모드 3(FDP_mode_3)에 따라서 L=3인 경우의 변환 계수의 예측 과정을 설명하기 위한 참조도이다.
도 25는 변환 계수 예측 모드 3(FDP_mode_3)에 따른 변환 계수의 예측 결과에 따라서 부호화되는 변환 블록을 나타낸 도면이다.
도 26은 본 발명의 일 실시예에 따른 영상 부호화 방법을 나타낸 플로우 차트이다.
도 27은 본 발명의 일 실시예에 따른 주파수 역변환 장치의 구성을 나타낸 블록도이다.
도 28은 본 발명의 일 실시예에 따른 영상 복호화 방법을 나타낸 플로우 차트이다.

Claims (30)

  1. 영상의 부호화 방법에 있어서,
    부호화되는 현재 블록과 예측 블록의 차이값인 제 1 레지듀얼 블록을 주파수 영역으로 변환하여 변환 블록을 생성하는 단계;
    변환 블록의 변환 계수들 중 예측될 적어도 하나의 저주파수 성분의 변환 계수를 소정값으로 치환하고, 상기 소정값으로 치환된 변환 계수를 포함하는 상기 변환 블록을 역변환하여 제 2 레지듀얼 블록을 생성하는 단계;
    상기 제 2 레지듀얼 블록의 값들을 이용하여 상기 예측될 저주파수 성분의 변환 계수의 예측자를 생성하는 단계; 및
    상기 저주파수 성분의 변환 계수와 대응되는 상기 예측자 사이의 차이값을 부호화하는 단계를 포함하고,
    상기 예측될 저주파수 성분의 변환 계수는
    상기 예측 블록의 생성에 이용된 예측 모드에 따라서 결정되는 것을 특징으로 하는 영상 부호화 방법.
  2. 제 1항에 있어서,
    상기 소정값은 0인 것을 특징으로 하는 영상 부호화 방법.
  3. 삭제
  4. 제 1항에 있어서,
    상기 예측될 저주파수 성분의 변환 계수는
    상기 예측 블록이 DC 모드로 인트라 예측되어 생성된 경우 DC 변환 계수가 선택되며,
    상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계는
    상기 제 2 레지듀얼 블록의 최상측행 및 최좌측열의 값들을 이용하여 상기 선택된 DC 변환 계수의 예측자를 생성하는 것을 특징으로 하는 영상 부호화 방법.
  5. 제 4항에 있어서,
    상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계는
    상기 현재 블록, 예측 블록, 변환 블록, 제 1 레지듀얼 블록 및 2 레지듀얼 블록의 크기를 NxM(N,M은 정수), 상기 제 2 레지듀얼 블록의 (x,y)(0≤x≤N-1, 0≤y≤M-1)에 위치한 값을 f(x,y), 변환 블록의 (n,m) 위치의 변환 계수의 예측자를 fdpnm이라고 할 때, 다음의 수학식;
    Figure 112009048130874-pat00028
    과 같이 상기 DC 변환 계수의 예측자 fdp00를 생성하는 것을 특징으로 하는 영상 부호화 방법.
  6. 제 1항에 있어서,
    상기 예측될 저주파수 성분의 변환 계수는
    상기 예측 블록이 수직 모드로 인트라 예측되어 생성된 경우 최상측행의 변환 계수들 중 선택되며,
    상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계는
    상기 제 2 레지듀얼 블록의 최상측행의 값들을 이용하여 상기 선택된 최상측행의 변환 계수들의 예측자를 생성하는 것을 특징으로 하는 영상 부호화 방법.
  7. 제 6항에 있어서,
    상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계는
    상기 현재 블록, 예측 블록, 변환 블록, 제 1 레지듀얼 블록 및 2 레지듀얼 블록의 크기를 NxM(N,M은 정수), 상기 제 2 레지듀얼 블록의 (x,y)(0≤x≤N-1, 0≤y≤M-1)에 위치한 값을 f(x,y), 변환 블록의 (n,m) 위치의 변환 계수의 예측자를 fdpnm, 이산 코사인 변환의 기본 성분 함수(basis_elementnm)는 basis_elementnm=cos(nωxx)cos(mωyy)라고 할 때, 다음의 수학식;
    Figure 112016049497688-pat00029
    과 같이 DC 변환 계수의 예측자 fdp00를 생성하며,
    다음의 수학식;
    Figure 112016049497688-pat00030
    과 같이 상기 최상측행의 변환 계수들의 예측자 fdpn0를 생성하는 것을 특징으로 하는 영상 부호화 방법.
  8. 제 1항에 있어서,
    상기 예측될 저주파수 성분의 변환 계수는
    상기 예측 블록이 수평 모드로 인트라 예측되어 생성된 경우 최좌측열의 변환 계수들 중 선택되며,
    상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계는
    상기 제 2 레지듀얼 블록의 최좌측열의 값들을 이용하여 상기 선택된 최좌측열의 변환 계수들의 예측자를 생성하는 것을 특징으로 하는 영상 부호화 방법.
  9. 제 8항에 있어서,
    상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계는
    상기 현재 블록, 예측 블록, 변환 블록, 제 1 레지듀얼 블록 및 2 레지듀얼 블록의 크기를 NxM(N,M은 정수), 상기 제 2 레지듀얼 블록의 (x,y)(0≤x≤N-1, 0≤y≤M-1)에 위치한 값을 f(x,y), 변환 블록의 (n,m) 위치의 변환 계수의 예측자를 fdpnm, 이산 코사인 변환의 기본 성분 함수(basis_elementnm)는 basis_elementnm=cos(nωxx)cos(mωyy)라고 할 때, 다음의 수학식;
    Figure 112016049497688-pat00031
    과 같이 DC 변환 계수의 예측자 fdp00를 생성하며,
    다음의 수학식;
    Figure 112016049497688-pat00032
    과 같이 상기 최좌측열의 변환 계수들의 예측자 fdp0m를 생성하는 것을 특징으로 하는 영상 부호화 방법.
  10. 제 1항에 있어서,
    상기 예측될 저주파수 성분의 변환 계수는 최상측행의 변환 계수들 및 최좌측열의 변환 계수들을 포함하며,
    상기 예측될 저주파수 성분의 변환 계수의 예측자를 생성하는 단계는
    상기 제 2 레지듀얼 블록의 값들, 상기 예측 블록의 값들 및 상기 현재 블록 이전에 복원된 주변 블록의 값을 이용하여 상기 예측될 변환 계수들 중 가장 큰 고주파수 성분을 갖는 제 1 변환 계수의 예측자를 생성하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
  11. 제 10항에 있어서, 상기 제 1 변환 계수의 예측자를 생성하는 단계는
    상기 현재 블록, 예측 블록, 변환 블록, 제 1 레지듀얼 블록 및 2 레지듀얼 블록의 크기를 NxM(N,M은 정수), 상기 제 2 레지듀얼 블록의 (x,y)(0≤x≤N-1, 0≤y≤M-1)에 위치한 값을 f(x,y), 변환 블록의 (n,m) 위치의 변환 계수의 예측자를 fdpnm, 이산 코사인 변환의 기본 성분 함수(basis_elementnm)는 basis_elementnm=cos(nωxx)cos(mωyy), 상기 예측 블록에서 (x,y)에 위치한 값을 pred(x,y), 상기 현재 블록 이전에 복원된 주변 블록의 값을 rec(x,-1) 및 rec(-1,y), 상기 제 1 변환 계수는 상기 최상측행 및 최좌측열의 변환 계수들 (0,L) 및 (L,0)(L은 2이상의 정수)에 위치한 변환 계수라고 할 때, 다음의 수학식들;
    Figure 112009048130874-pat00033
    ,
    Figure 112009048130874-pat00034
    (a는 1부터 L까지의 정수), 및
    Figure 112009048130874-pat00035
    (b는 1부터 L까지의 정수)
    을 이용하여 파라메터들 σ000a 및 σb0를 계산하고, 상기 파라메터들 σ00, σ0a 및 σb0를 이용하여 상기 제 1 변환 계수에 대응되는 예측자 fdpL0및 fdp0L를 생성하는 것을 특징으로 하는 영상 부호화 방법.
  12. 제 10항에 있어서,
    상기 변환 블록의 예측될 변환 계수들 중 상기 제 1 변환 계수의 주파수 성분보다 작은 주파수 성분을 갖는 변환 계수들을 상기 소정값으로 치환하고, 상기 치환된 변환 블록을 역변환하여 제 3 레지듀얼 블록을 생성하는 단계;
    상기 제 3 레지듀얼 블록의 값들, 상기 예측 블록의 값들 및 상기 현재 블록 이전에 복원된 주변 블록의 값을 이용하여 상기 제 1 변환 계수의 주파수 성분보다 작은 주파수 성분을 갖는 변환 계수들 중 가장 큰 주파수 성분을 갖는 제 2 변환 계수의 예측자를 생성하는 단계; 및
    상기 제 1 변환 계수와 대응되는 상기 제 1 변환 계수의 예측자 사이의 차이값 및 상기 제 2 변환 계수와 대응되는 상기 제 2 변환 계수의 예측자 사이의 차이값을 부호화하는 단계를 더 포함하는 것을 특징으로 하는 영상 부호화 방법.
  13. 제 12항에 있어서, 상기 제 2 변환 계수의 예측자를 생성하는 단계는
    상기 현재 블록, 예측 블록, 변환 블록, 제 1 레지듀얼 블록, 제 2 레지듀얼 블록 및 제 3 레지듀얼 블록의 크기를 NxM(N,M은 정수), 상기 제 3 레지듀얼 블록의 (x,y)(0≤x≤N-1, 0≤y≤M-1)에 위치한 값을 f(x,y), 변환 블록의 (n,m) 위치의 변환 계수의 예측자를 fdpnm, 이산 코사인 변환의 기본 성분 함수(basis_elementnm) 는basis_elementnm=cos(nωxx)cos(mωyy), 상기 예측 블록에서 (x,y)에 위치한 값을 pred(x,y), 상기 현재 블록 이전에 복원된 주변 블록의 값을 rec(x,-1) 및 rec(-1,y), 상기 제 1 변환 계수는 상기 최상측행 및 최좌측열의 변환 계수들 (0,L) 및 (L,0)(L은 2이상의 정수), 상기 제 2 변환 계수는 상기 최상측행 및 최좌측열의 변환 계수들 (0,L-1) 및 (L-1,0)(L은 2이상의 정수)에 위치한 변환 계수라고 할 때, 다음의 수학식들;
    Figure 112009048130874-pat00036
    ,
    Figure 112009048130874-pat00037
    (a는 1부터 L-1까지의 정수), 및
    Figure 112009048130874-pat00038
    (b는 1부터 L-1까지의 정수)
    을 이용하여 파라메터들 σ000a 및 σb0를 계산하고, 상기 파라메터들 σ000a 및 σb0를 이용하여 상기 제 2 변환 계수에 대응되는 예측자 fdpL -1, 0및 fdp0 ,L- 1를 생성하는 것을 특징으로 하는 영상 부호화 방법.
  14. 영상의 복호화 방법에 있어서,
    현재 블록과 예측 블록의 차이값인 제 1 레지듀얼 블록을 주파수 영역으로 변환한 변환 블록의 변환 계수들 중 적어도 하나의 저주파수 성분의 변환 계수와 상기 저주파수 성분의 예측자 사이의 차이값과, 상기 저주파수 성분을 제외한 상기 변환 블록의 나머지 변환 계수들을 복원하는 단계;
    상기 변환 블록의 저주파수 성분의 변환 계수를 소정값으로 치환하고, 상기 소정값으로 치환된 변환 계수를 포함하는 상기 변환 블록을 역변환하여 제 2 레지듀얼 블록을 생성하는 단계;
    상기 제 2 레지듀얼 블록의 값들을 이용하여 상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계; 및
    상기 예측자와 대응되는 상기 차이값을 가산하여 상기 저주파수 성분의 변환 계수를 복원하는 단계를 포함하고,
    상기 저주파수 성분의 변환 계수는
    상기 예측 블록의 생성에 이용된 예측 모드에 따라서 결정되는 것을 특징으로 하는 영상 복호화 방법.
  15. 제 14항에 있어서,
    상기 소정값은 0인 것을 특징으로 하는 영상 복호화 방법.
  16. 삭제
  17. 제 14항에 있어서,
    상기 저주파수 성분의 변환 계수는
    상기 예측 블록이 DC 모드로 인트라 예측되어 생성된 경우 DC 변환 계수이며,
    상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계는
    상기 제 2 레지듀얼 블록의 최상측행 및 최좌측열의 값들을 이용하여 상기 DC 변환 계수의 예측자를 생성하는 것을 특징으로 하는 영상 복호화 방법.
  18. 제 17항에 있어서,
    상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계는
    상기 현재 블록, 예측 블록, 변환 블록, 제 1 레지듀얼 블록 및 2 레지듀얼 블록의 크기를 NxM(N,M은 정수), 상기 제 2 레지듀얼 블록의 (x,y)(0≤x≤N-1, 0≤y≤M-1)에 위치한 값을 f(x,y), 변환 블록의 (n,m) 위치의 변환 계수의 예측자를 fdpnm이라고 할 때, 다음의 수학식;
    Figure 112009048130874-pat00039
    과 같이 상기 DC 변환 계수의 예측자 fdp00를 생성하는 것을 특징으로 하는 영상 복호화 방법.
  19. 제 14항에 있어서,
    상기 저주파수 성분의 변환 계수는
    상기 예측 블록이 수직 모드로 인트라 예측되어 생성된 경우 최상측행의 변환 계수들 중 선택되며,
    상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계는
    상기 제 2 레지듀얼 블록의 최상측행의 값들을 이용하여 상기 선택된 최상측행의 변환 계수들의 예측자를 생성하는 것을 특징으로 하는 영상 복호화 방법.
  20. 제 19항에 있어서,
    상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계는
    상기 현재 블록, 예측 블록, 변환 블록, 제 1 레지듀얼 블록 및 2 레지듀얼 블록의 크기를 NxM(N,M은 정수), 상기 제 2 레지듀얼 블록의 (x,y)(0≤x≤N-1, 0≤y≤M-1)에 위치한 값을 f(x,y), 변환 블록의 (n,m) 위치의 변환 계수의 예측자를 fdpnm, 이산 코사인 변환의 기본 성분 함수(basis_elementnm)는 basis_elementnm=cos(nωxx)cos(mωyy)라고 할 때, 다음의 수학식;
    Figure 112016049497688-pat00040
    과 같이 DC 변환 계수의 예측자 fdp00를 생성하며,
    다음의 수학식;
    Figure 112016049497688-pat00041
    과 같이 상기 최상측행의 변환 계수들의 예측자 fdpn0를 생성하는 것을 특징으로 하는 영상 복호화 방법.
  21. 제 14항에 있어서,
    상기 저주파수 성분의 변환 계수는
    상기 예측 블록이 수평 모드로 인트라 예측되어 생성된 경우 최좌측열의 변환 계수들 중 선택되며,
    상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계는
    상기 제 2 레지듀얼 블록의 최좌측열의 값들을 이용하여 상기 선택된 최좌측열의 변환 계수들의 예측자를 생성하는 것을 특징으로 하는 영상 복호화 방법.
  22. 제 21항에 있어서,
    상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계는
    상기 현재 블록, 예측 블록, 변환 블록, 제 1 레지듀얼 블록 및 2 레지듀얼 블록의 크기를 NxM(N,M은 정수), 상기 제 2 레지듀얼 블록의 (x,y)(0≤x≤N-1, 0≤y≤M-1)에 위치한 값을 f(x,y), 변환 블록의 (n,m) 위치의 변환 계수의 예측자를 fdpnm, 이산 코사인 변환의 기본 성분 함수(basis_elementnm)는 basis_elementnm=cos(nωxx)cos(mωyy)라고 할 때, 다음의 수학식;
    Figure 112016049497688-pat00042
    과 같이 DC 변환 계수의 예측자 fdp00를 생성하며,
    다음의 수학식;
    Figure 112016049497688-pat00043
    과 같이 상기 최좌측열의 변환 계수들의 예측자 fdp0m를 생성하는 것을 특징으로 하는 영상 복호화 방법.
  23. 제 14항에 있어서,
    상기 저주파수 성분의 변환 계수는 최상측행의 변환 계수들 및 최좌측열의 변환 계수들을 포함하며,
    상기 저주파수 성분의 변환 계수의 예측자를 생성하는 단계는
    상기 제 2 레지듀얼 블록의 값들, 상기 예측 블록의 값들 및 상기 현재 블록 이전에 복원된 주변 블록의 값을 이용하여 상기 예측자를 생성할 변환 계수들 중 가장 큰 고주파수 성분을 갖는 제 1 변환 계수의 예측자를 생성하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법.
  24. 제 23항에 있어서, 상기 제 1 변환 계수의 예측자를 생성하는 단계는
    상기 현재 블록, 예측 블록, 변환 블록, 제 1 레지듀얼 블록 및 2 레지듀얼 블록의 크기를 NxM(N,M은 정수), 상기 제 2 레지듀얼 블록의 (x,y)(0≤x≤N-1, 0≤y≤M-1)에 위치한 값을 f(x,y), 변환 블록의 (n,m) 위치의 변환 계수의 예측자를 fdpnm, 이산 코사인 변환의 기본 성분 함수(basis_elementnm)는 basis_elementnm=cos(nωxx)cos(mωyy), 상기 예측 블록에서 (x,y)에 위치한 값을 pred(x,y), 상기 현재 블록 이전에 복원된 주변 블록의 값을 rec(x,-1) 및 rec(-1,y), 상기 제 1 변환 계수는 상기 최상측행 및 최좌측열의 변환 계수들 (0,L) 및 (L,0)(L은 2이상의 정수)에 위치한 변환 계수라고 할 때, 다음의 수학식들;
    Figure 112009048130874-pat00044
    ,
    Figure 112009048130874-pat00045
    (a는 1부터 L까지의 정수), 및
    Figure 112009048130874-pat00046
    (b는 1부터 L까지의 정수)
    을 이용하여 파라메터들 σ000a 및 σb0를 계산하고, 상기 파라메터들 σ00, σ0a 및 σb0를 이용하여 상기 제 1 변환 계수에 대응되는 예측자 fdpL0및 fdp0L를 생성하는 것을 특징으로 하는 영상 복호화 방법.
  25. 제 23항에 있어서,
    상기 변환 블록 내 예측자를 생성할 변환 계수들 중 상기 제 1 변환 계수의 주파수 성분보다 작은 주파수 성분을 갖는 변환 계수들을 상기 소정값으로 치환하고, 상기 치환된 변환 블록을 역변환하여 제 3 레지듀얼 블록을 생성하는 단계;
    상기 제 3 레지듀얼 블록의 값들, 상기 예측 블록의 값들 및 상기 현재 블록 이전에 복원된 주변 블록의 값을 이용하여 상기 제 1 변환 계수의 주파수 성분보다 작은 주파수 성분을 갖는 변환 계수들 중 가장 큰 주파수 성분을 갖는 제 2 변환 계수의 예측자를 생성하는 단계; 및
    상기 제 1 변환 계수의 차이값과 대응되는 예측자를 가산하고, 상기 제 2 변환 계수의 차이값과 대응되는 예측자를 가산하여 상기 제 1 변환 계수 및 제 2 변환 계수를 복원하는 단계를 더 포함하는 것을 특징으로 하는 영상 복호화 방법.
  26. 제 25항에 있어서, 상기 제 2 변환 계수의 예측자를 생성하는 단계는
    상기 현재 블록, 예측 블록, 변환 블록, 제 1 레지듀얼 블록, 제 2 레지듀얼 블록 및 제 3 레지듀얼 블록의 크기를 NxM(N,M은 정수), 상기 제 3 레지듀얼 블록의 (x,y)(0≤x≤N-1, 0≤y≤M-1)에 위치한 값을 f(x,y), 변환 블록의 (n,m) 위치의 변환 계수의 예측자를 fdpnm, 이산 코사인 변환의 기본 성분 함수(basis_elementnm) 는 basis_elementnm=cos(nωxx)cos(mωyy), 상기 예측 블록에서 (x,y)에 위치한 값을 pred(x,y), 상기 현재 블록 이전에 복원된 주변 블록의 값을 rec(x,-1) 및 rec(-1,y), 상기 제 1 변환 계수는 상기 최상측행 및 최좌측열의 변환 계수들 (0,L) 및 (L,0)(L은 2이상의 정수), 상기 제 2 변환 계수는 상기 최상측행 및 최좌측열의 변환 계수들 (0,L-1) 및 (L-1,0)(L은 2이상의 정수)에 위치한 변환 계수라고 할 때, 다음의 수학식들;
    Figure 112009048130874-pat00047
    ,
    Figure 112009048130874-pat00048
    (a는 1부터 L-1까지의 정수), 및
    Figure 112009048130874-pat00049
    (b는 1부터 L-1까지의 정수)
    을 이용하여 파라메터들 σ000a 및 σb0를 계산하고, 상기 파라메터들 σ000a 및 σb0를 이용하여 상기 제 2 변환 계수에 대응되는 예측자 fdpL -1, 0및 fdp0 ,L- 1를 생성하는 것을 특징으로 하는 영상 복호화 방법.
  27. 영상의 부호화 장치에 있어서,
    부호화되는 현재 블록과 예측 블록의 차이값인 제 1 레지듀얼 블록을 주파수 영역으로 변환하여 변환 블록을 생성하는 변환부;
    변환 블록의 변환 계수들 중 예측될 적어도 하나의 저주파수 성분의 변환 계수를 소정값으로 치환하고, 상기 소정값으로 치환된 변환 계수를 포함하는 상기 변환 블록을 역변환하여 제 2 레지듀얼 블록을 생성하며, 상기 제 2 레지듀얼 블록의 값들을 이용하여 상기 예측될 저주파수 성분의 변환 계수의 예측자를 생성하는 변환 계수 예측부; 및
    상기 저주파수 성분의 변환 계수와 대응되는 상기 예측자 사이의 차이값을 계산하는 감산부를 포함하고,
    상기 예측될 저주파수 성분의 변환 계수는
    상기 예측 블록의 생성에 이용된 예측 모드에 따라서 결정되는 것을 특징으로 하는 영상 부호화 장치.
  28. 영상의 복호화 장치에 있어서,
    현재 블록과 예측 블록의 차이값인 제 1 레지듀얼 블록을 주파수 영역으로 변환한 변환 블록의 변환 계수들 중 적어도 하나의 저주파수 성분의 변환 계수와 상기 저주파수 성분의 예측자 사이의 차이값과, 상기 저주파수 성분을 제외한 상기 변환 블록의 나머지 변환 계수들을 복원하는 변환 계수 정보 복원부;
    상기 변환 블록의 저주파수 성분의 변환 계수를 소정값으로 치환하고, 상기 소정값으로 치환된 변환 계수를 포함하는 상기 변환 블록을 역변환하여 제 2 레지듀얼 블록을 생성하며, 상기 제 2 레지듀얼 블록의 값들을 이용하여 상기 저주파수 성분의 변환 계수의 예측자를 생성하는 변환 계수 예측부; 및
    상기 예측자와 대응되는 상기 차이값을 가산하여 상기 저주파수 성분의 변환 계수를 복원하는 가산부를 포함하고,
    상기 저주파수 성분의 변환 계수는
    상기 예측 블록의 생성에 이용된 예측 모드에 따라서 결정되는 것을 특징으로 하는 영상 복호화 장치.
  29. 제 1 항 내지 제 2 항 및 제 4 항 내지 제 13 항 중 어느 한 항의 영상 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
  30. 제 14 항 내지 제 15 항 및 제 17 항 내지 제 26 항 중 어느 한 항의 영상 복호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
KR1020090072403A 2009-08-06 2009-08-06 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치 KR101675116B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020090072403A KR101675116B1 (ko) 2009-08-06 2009-08-06 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
EP10806676.2A EP2451158B1 (en) 2009-08-06 2010-08-06 Method of decoding encoded an image and apparatus for encoding an image
CN201080034983.0A CN102474599B (zh) 2009-08-06 2010-08-06 用于对图像进行编码的方法和设备,用于对编码图像进行解码的方法和设备
US13/389,042 US9014260B2 (en) 2009-08-06 2010-08-06 Method and apparatus for encoding images, and method and apparatus for decoding encoded images
PCT/KR2010/005187 WO2011016702A2 (ko) 2009-08-06 2010-08-06 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
JP2012523570A JP5654594B2 (ja) 2009-08-06 2010-08-06 映像の符号化方法及び装置、その復号化方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090072403A KR101675116B1 (ko) 2009-08-06 2009-08-06 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20110014839A KR20110014839A (ko) 2011-02-14
KR101675116B1 true KR101675116B1 (ko) 2016-11-10

Family

ID=43544809

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090072403A KR101675116B1 (ko) 2009-08-06 2009-08-06 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치

Country Status (6)

Country Link
US (1) US9014260B2 (ko)
EP (1) EP2451158B1 (ko)
JP (1) JP5654594B2 (ko)
KR (1) KR101675116B1 (ko)
CN (1) CN102474599B (ko)
WO (1) WO2011016702A2 (ko)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011121938A1 (ja) * 2010-03-31 2011-10-06 株式会社Jvcケンウッド 画像符号化装置、画像符号化方法及び画像符号化プログラム、ならびに画像復号装置、画像復号方法及び画像復号プログラム
CN103069798B (zh) * 2010-06-29 2016-12-21 法国电信 用于在实施变换域估计过程中对至少一个图像进行编码和解码的方法和装置
KR20120035096A (ko) * 2010-10-04 2012-04-13 한국전자통신연구원 쿼드 트리 변환 구조에서 부가 정보의 시그널링 방법 및 장치
JP5592295B2 (ja) * 2011-03-09 2014-09-17 日本電信電話株式会社 画像符号化方法,画像符号化装置,画像復号方法,画像復号装置およびそれらのプログラム
JP5768565B2 (ja) * 2011-07-28 2015-08-26 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
CN104378637B (zh) * 2011-10-18 2017-11-21 株式会社Kt 视频信号解码方法
CN103096053B (zh) * 2011-11-04 2015-10-07 华为技术有限公司 一种变换模式的编解码方法和装置
KR20130050149A (ko) * 2011-11-07 2013-05-15 오수미 인터 모드에서의 예측 블록 생성 방법
US9462275B2 (en) 2012-01-30 2016-10-04 Qualcomm Incorporated Residual quad tree (RQT) coding for video coding
JP5904266B2 (ja) 2012-02-29 2016-04-13 ソニー株式会社 画像処理装置および方法、記録媒体、並びに、プログラム
US9467701B2 (en) * 2012-04-05 2016-10-11 Qualcomm Incorporated Coded block flag coding
US9491461B2 (en) * 2012-09-27 2016-11-08 Qualcomm Incorporated Scalable extensions to HEVC and temporal motion vector prediction
CN102883163B (zh) * 2012-10-08 2014-05-28 华为技术有限公司 用于运动矢量预测的运动矢量列表建立的方法、装置
US9509998B1 (en) * 2013-04-04 2016-11-29 Google Inc. Conditional predictive multi-symbol run-length coding
GB2520002B (en) * 2013-11-04 2018-04-25 British Broadcasting Corp An improved compression algorithm for video compression codecs
FR3014278A1 (fr) * 2013-11-29 2015-06-05 Orange Procede de codage et de decodage d'images, dispositif de codage et de decodage d'images et programmes d'ordinateur correspondants
CN104244006B (zh) * 2014-05-28 2019-02-26 北京大学深圳研究生院 一种基于图像超分辨率的视频编解码方法及装置
CN107113445A (zh) * 2014-11-04 2017-08-29 三星电子株式会社 用于二进制算术编/解码的概率更新方法及使用该方法的熵编/解码器
CN107852507A (zh) 2015-05-12 2018-03-27 三星电子株式会社 用于执行帧内预测的图像解码方法及其装置以及用于执行帧内预测的图像编码方法及其装置
EP3293975A4 (en) 2015-09-08 2018-10-10 Samsung Electronics Co., Ltd. Device and method for entropy encoding and decoding
CN108353179A (zh) 2015-09-10 2018-07-31 三星电子株式会社 编码设备、解码设备及其编码方法和解码方法
KR102469145B1 (ko) 2015-10-13 2022-11-21 삼성전자주식회사 영상을 부호화 또는 복호화하는 방법 및 장치
US11076157B1 (en) * 2016-05-03 2021-07-27 NGCodec Inc. Apparatus and method for rate control in accordance with block and stream analyses
CN117412042A (zh) * 2016-07-13 2024-01-16 韩国电子通信研究院 图像编码/解码方法和装置
US11457239B2 (en) * 2017-11-09 2022-09-27 Google Llc Block artefact reduction
JP2021175035A (ja) * 2020-04-21 2021-11-01 キヤノン株式会社 画像処理装置、画像処理方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5534925A (en) * 1994-05-02 1996-07-09 Cognitech Inc. Image compression by optimal reconstruction
KR100346728B1 (ko) 1996-09-21 2002-10-12 삼성전자 주식회사 이산코사인변환의 dc 계수예측방법 및 이를 이용한 데이터 부호화방법
FR2755527B1 (fr) 1996-11-07 1999-01-08 Thomson Multimedia Sa Procede de prediction compensee en mouvement et codeur utilisant un tel procede
DE69901525T2 (de) 1998-02-13 2003-01-09 Koninkl Philips Electronics Nv Verfahren und vorrichtung zur videokodierung
US6282322B1 (en) * 1998-12-03 2001-08-28 Philips Electronics North America Corp. System and method for compressing and decompressing images
DE69929660T2 (de) * 1999-08-31 2006-08-17 Lucent Technologies Inc. Verfahren und Vorrichtung für Makroblock DC- und AC-Koefficienten-Prädiktion in Videocodierung
KR20030004851A (ko) * 2001-07-06 2003-01-15 김용술 강감 송진 침대
KR101108681B1 (ko) 2005-01-19 2012-01-25 삼성전자주식회사 동영상 코덱에서의 주파수 변환 계수 예측 방법 및 장치,이를 구비한 부호화 및 복호화 장치와 방법
KR101215614B1 (ko) 2005-09-09 2012-12-26 삼성전자주식회사 영상의 부호화 및 복호화 장치와, 그 방법, 및 이를수행하기 위한 프로그램이 기록된 기록 매체
KR100813963B1 (ko) * 2005-09-16 2008-03-14 세종대학교산학협력단 동영상의 무손실 부호화, 복호화 방법 및 장치
JP5089878B2 (ja) 2005-10-28 2012-12-05 パナソニック株式会社 画像符号化装置
KR100750138B1 (ko) * 2005-11-16 2007-08-21 삼성전자주식회사 인간의 시각 특성을 이용한 영상의 부호화, 복호화 방법 및장치
KR100791299B1 (ko) * 2006-04-11 2008-01-04 삼성전자주식회사 다 계층 기반의 비디오 인코딩 방법 및 장치
KR101354151B1 (ko) * 2006-08-24 2014-01-28 삼성전자주식회사 영상 변환 방법 및 장치, 역변환 방법 및 장치
KR101366086B1 (ko) * 2007-01-03 2014-02-21 삼성전자주식회사 잔차 블록의 계수들에 대한 부호화 결정 방법, 장치,인코더 및 디코더
KR101356733B1 (ko) * 2007-03-07 2014-02-05 삼성전자주식회사 컨텍스트 기반 적응적 이진 산술 부호화, 복호화 방법 및장치
KR101370286B1 (ko) * 2007-04-06 2014-03-06 삼성전자주식회사 레지듀얼 블록의 변형을 이용한 영상 부호화, 복호화 방법및 장치
US8077773B2 (en) * 2008-07-19 2011-12-13 Worldplay (Barbados) Inc. Systems and methods for highly efficient video compression using selective retention of relevant visual detail
CN103069798B (zh) * 2010-06-29 2016-12-21 法国电信 用于在实施变换域估计过程中对至少一个图像进行编码和解码的方法和装置

Also Published As

Publication number Publication date
KR20110014839A (ko) 2011-02-14
US9014260B2 (en) 2015-04-21
WO2011016702A3 (ko) 2011-04-21
JP2013501451A (ja) 2013-01-10
US20120195379A1 (en) 2012-08-02
WO2011016702A2 (ko) 2011-02-10
CN102474599A (zh) 2012-05-23
EP2451158A4 (en) 2015-12-23
JP5654594B2 (ja) 2015-01-14
CN102474599B (zh) 2015-06-24
EP2451158A2 (en) 2012-05-09
EP2451158B1 (en) 2020-02-26

Similar Documents

Publication Publication Date Title
KR101675116B1 (ko) 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR101969932B1 (ko) 고정소수점 변환을 위한 비트뎁스 조절을 수반하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
KR101483750B1 (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
EP2890123B1 (en) Method for decoding image by using large transformation units
KR20110047697A (ko) 픽처 경계의 부호화 단위를 부호화, 복호화 하는 방법 및 장치
KR20110112224A (ko) 부호화 모드에 대한 정보를 부호화, 복호화하는 방법 및 장치
KR20110083368A (ko) 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
JP2015130708A (ja) ビデオ復号化方法及びビデオ復号化装置
KR20130088087A (ko) 계층적 데이터 단위의 양자화 파라메터 예측을 포함하는 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101662741B1 (ko) 영상 복호화 방법
KR101618214B1 (ko) 영상 복호화 방법
KR101618766B1 (ko) 영상 복호화 방법 및 장치
KR101525015B1 (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR101489222B1 (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR101464979B1 (ko) 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
KR20180014128A (ko) 영상의 부호화 방법 및 장치, 컴퓨터로 판독가능한 기록매체

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20191030

Year of fee payment: 4