KR101725287B1 - 영상 복호화 방법 및 장치 - Google Patents

영상 복호화 방법 및 장치 Download PDF

Info

Publication number
KR101725287B1
KR101725287B1 KR1020160141164A KR20160141164A KR101725287B1 KR 101725287 B1 KR101725287 B1 KR 101725287B1 KR 1020160141164 A KR1020160141164 A KR 1020160141164A KR 20160141164 A KR20160141164 A KR 20160141164A KR 101725287 B1 KR101725287 B1 KR 101725287B1
Authority
KR
South Korea
Prior art keywords
unit
encoding
depth
intra prediction
mode
Prior art date
Application number
KR1020160141164A
Other languages
English (en)
Other versions
KR20160129802A (ko
Inventor
민정혜
엘레나 알쉬나
한우진
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020160141164A priority Critical patent/KR101725287B1/ko
Publication of KR20160129802A publication Critical patent/KR20160129802A/ko
Application granted granted Critical
Publication of KR101725287B1 publication Critical patent/KR101725287B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Abstract

영상 부호화 단위의 인트라 예측 모드 결정 방법 및 장치가 개시된다. 본 발명에 따르면 휘도 성분의 부호화 단위의 인트라 예측 모드를 포함하는 색차 성분의 부호화 단위의 후보 인트라 예측 모드들을 결정하고, 결정된 후보 인트라 예측 모드들에 따른 색차 성분의 부호화 단위의 코스트를 비교하여 최소 코스트를 갖는 색차 성분의 부호화 단위의 인트라 예측 모드를 결정하는 것을 특징으로 한다.

Description

영상 복호화 방법 및 장치{Method and apparatus for decoding an image}
본 발명은 영상의 부호화 및 복호화에 관한 것으로, 보다 구체적으로는 휘도 성분의 영상 부호화 단위에 대하여 결정된 인트라 예측 모드를 적용하여 색차 성분의 영상 부호화 단위에 대한 인트라 예측을 수행하는 영상의 부호화, 복호화 방법 및 장치에 관한 것이다.
MPEG-1, MPEG-2, MPEG-4, H.264/MPEG-4 AVC(Advanced Video Coding)와 같은 영상 압축 방식에서는 영상을 부호화하기 위해서 하나의 픽처를 매크로 블록으로 나눈다. 그리고, 인터 예측 및 인트라 예측에서 이용가능한 모든 부호화 모드에서 각각의 매크로 블록을 부호화한 다음, 매크로 블록의 부호화에 소요되는 비트율과 원 매크로 블록과 복호화된 매크로 블록과의 왜곡 정도에 따라서 부호화 모드를 하나 선택하여 매크로 블록을 부호화한다.
고해상도 또는 고화질 비디오 컨텐트를 재생, 저장할 수 있는 하드웨어의 개발 및 보급에 따라, 고해상도 또는 고화질 비디오 컨텐트를 효과적으로 부호화하거나 복호화하는 비디오 코덱의 필요성이 증대하고 있다. 기존의 비디오 코덱에 따르면, 비디오는 소정 크기의 매크로블록에 기반하여 제한된 예측 모드에 따라 부호화되고 있다.
본 발명은 다양한 크기의 계층적 부호화 단위에 기반하여 다양한 방향성을 갖는 휘도 성분 영상 부호화 단위의 인트라 예측 모드 결정 방법 및 휘도 성분 영상 부호화 단위에 대하여 결정된 인트라 예측 모드를 포함하는 후보 인트라 예측 모드에 따라서 색차 성분 부호화 단위에 대한 인트라 예측을 수행하는 영상 부호화. 복호화 방법 및 장치를 제공한다.
본 발명의 일 실시예에 따른 영상 복호화 방법은 휘도 블록의 인트라 예측 모드를 가리키는 제 1 정보를 비트스트림으로부터 획득하는 단계; 상기 휘도 블록에 대응되는 색차 블록의 인트라 예측 모드를 가리키는 제 2 정보를 상기 비트스트림으로부터 획득하는 단계; 상기 휘도 블록의 인트라 예측 모드에 기초하여 상기 휘도 블록에 대한 인트라 예측을 수행하는 단계; 및 상기 색차 블록의 인트라 예측 모드에 기초하여 상기 색차 블록에 대한 인트라 예측을 수행하는 단계를 포함하며, 상기 휘도 블록의 인트라 예측 모드는 복수 개의 방향들 중 특정 방향을 포함하며, 상기 특정 방향은 수평 방향의 dx(dx는 정수) 및 수직 방향의 dy(dy는 정수) 중 적어도 하나에 의하여 가리켜지며, 상기 휘도 블록에 대한 인트라 예측을 수행하는 단계는 현재 픽셀의 위치 및 상기 제 1 정보에 기초한 상기 휘도 블록의 인트라 예측 모드가 가리키는 특정 방향에 따라서, 상기 휘도 블록의 좌측 또는 상측에 위치한 주변 픽셀의 개수를 결정하는 단계; 상기 주변 픽셀의 개수가 1개로 결정된 경우, 1개의 주변 픽셀에 기초하여 현재 픽셀의 예측값을 획득하는 단계; 및 상기 주변 픽셀의 개수가 2개로 결정된 경우, 2개의 주변 픽셀들의 가중 평균값에 기초하여 상기 현재 픽셀의 예측값을 획득하는 단계를 포함하며, 상기 가중 평균값은 상기 dx 및 dy 중 적어도 하나와 상기 현재 픽셀의 위치에 기초하여 결정된 가중치를 이용하며, 상기 색차 블록에 대한 인트라 예측을 수행하는 단계는 상기 제 2 정보에 기초하여, 상기 휘도 블록의 인트라 예측 모드를 포함하는 복수 개의 인트라 예측 모드들 중 상기 색차 블록의 인트라 예측 모드를 결정하며, 상기 제 2 정보가 상기 휘도 블록의 인트라 예측 모드와 동일함을 나타낼 경우, 상기 색차 블록의 인트라 예측 모드를 상기 휘도 블록의 인트라 예측 모드와 동일하게 결정하며, 영상은 최대 부호화 단위의 크기에 관한 정보에 따라 복수의 최대 부호화 단위들로 분할되고, 상기 복수의 최대 부호화 단위들 중 하나의 최대 부호화 단위는 축소 정보에 기초하여, 심도를 갖는 다수의 부호화 단위들로 계층적으로 분할되고, 현재 심도의 부호화 단위는 하위 심도의 부호화 단위로부터 분할된 정사각 데이터 단위들 중 하나이고, 상기 축소 정보가 상기 현재 심도에서 분할됨을 나타내는 경우에, 상기 현재 심도의 부호화 단위는 주변 부호화 단위들과 독립적으로, 상위 심도의 부호화 단위들로 분할되고, 상기 축소 정보가 상기 현재 심도에서 분할되지 않음을 나타내는 경우에, 상기 현재 심도의 부호화 단위로부터 적어도 하나의 예측 단위가 획득되며, 상기 휘도 블록은 상기 현재 심도의 부호화 단위로부터 획득된 적어도 하나의 예측 단위 중 하나이며, 상기 현재 심도의 부호화 단위로부터 역변환을 위한 적어도 하나의 변환 단위가 획득되는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 영상 복호화 장치는 휘도 블록의 인트라 예측 모드를 가리키는 제 1 정보 및 상기 휘도 블록에 대응되는 색차 블록의 인트라 예측 모드를 가리키는 제 2 정보를 획득하는 엔트로피 복호화부; 및 상기 휘도 블록의 인트라 예측 모드에 기초하여 상기 휘도 블록에 대한 인트라 예측을 수행하고, 상기 색차 블록의 인트라 예측 모드에 기초하여 상기 색차 블록에 대한 인트라 예측을 수행하는 인트라 예측 수행부를 포함하며, 상기 휘도 블록의 인트라 예측 모드는 복수 개의 방향들 중 특정 방향을 포함하며, 상기 특정 방향은 수평 방향의 dx(dx는 정수) 및 수직 방향의 dy(dy는 정수) 중 적어도 하나에 의하여 가리켜지며, 상기 인트라 예측 수행부는 현재 픽셀의 위치 및 상기 제 1 정보에 기초한 상기 휘도 블록의 인트라 예측 모드가 가리키는 특정 방향에 따라서, 상기 휘도 블록의 좌측 또는 상측에 위치한 주변 픽셀의 개수를 결정하며, 상기 주변 픽셀의 개수가 1개로 결정된 경우, 1개의 주변 픽셀에 기초하여 현재 픽셀의 예측값을 획득하며, 상기 주변 픽셀의 개수가 2개로 결정된 경우, 2개의 주변 픽셀들의 가중 평균값에 기초하여 상기 현재 픽셀의 예측값을 획득하며, 상기 제 2 정보에 기초하여, 상기 휘도 블록의 인트라 예측 모드를 포함하는 복수 개의 인트라 예측 모드들 중 상기 색차 블록의 인트라 예측 모드를 결정하며, 상기 제 2 정보가 상기 휘도 블록의 인트라 예측 모드와 동일함을 나타낼 경우, 상기 색차 블록의 인트라 예측 모드를 상기 휘도 블록의 인트라 예측 모드와 동일하게 결정하며, 상기 가중 평균값은 상기 dx 및 dy 중 적어도 하나와 상기 현재 픽셀의 위치에 기초하여 결정된 가중치를 이용하여 획득되며, 영상은 최대 부호화 단위의 크기에 관한 정보에 따라 복수의 최대 부호화 단위들로 분할되고, 상기 복수의 최대 부호화 단위들 중 하나의 최대 부호화 단위는 축소 정보에 기초하여, 심도를 갖는 다수의 부호화 단위들로 계층적으로 분할되고, 현재 심도의 부호화 단위는 하위 심도의 부호화 단위로부터 분할된 정사각 데이터 단위들 중 하나이고, 상기 축소 정보가 상기 현재 심도에서 분할됨을 나타내는 경우에, 상기 현재 심도의 부호화 단위는 주변 부호화 단위들과 독립적으로, 상위 심도의 부호화 단위들로 분할되고, 상기 축소 정보가 상기 현재 심도에서 분할되지 않음을 나타내는 경우에, 상기 현재 심도의 부호화 단위로부터 적어도 하나의 예측 단위가 획득되며, 상기 휘도 블록은 상기 현재 심도의 부호화 단위로부터 획득된 적어도 하나의 예측 단위 중 하나이며, 상기 현재 심도의 부호화 단위로부터 역변환을 위한 적어도 하나의 변환 단위가 획득되는 것을 특징으로 한다.
본 발명의 실시예들에 따르면 다양한 방향성을 갖는 휘도 성분 영상 부호화 단위에 대하여 결정된 인트라 예측 모드를 색차 성분 영상 부호화 단위에 대한 인트라 예측 모드로써 추가함으로써, 계산량의 큰 증가없이 색차 성분 영상의 예측 효율을 증가시키고 전체적인 영상의 예측 효율을 향상시킨다.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치의 블록도이다.
도 2 는 본 발명의 일 실시예에 따른 영상 복호화 장치의 블록도를 도시한다.
도 3은 본 발명의 일 실시예에 따른 계층적 부호화 단위를 도시한다.
도 4 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 부호화부의 블록도를 나타낸 것이다.
도 5 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 복호화부의 블록도를 나타낸 것이다.
도 6은 본 발명의 일 실시예에 따른 심도별 부호화 단위 및 예측 단위를 도시한다.
도 7은 본 발명의 일 실시예에 따른, 부호화 단위 및 변환 단위의 관계를 도시한다.
도 8은 본 발명의 일 실시예에 따라, 심도별 부호화 정보들을 도시한다.
도 9 는 본 발명의 일 실시예에 따른 심도별 부호화 단위를 도시한다.
도 10a 및 10b는 본 발명의 일 실시예에 따른, 부호화 단위, 예측 단위 및 주파수 변환 단위의 관계를 도시한다.
도 11 은 본 발명의 일 실시예에 따른 부호화 단위별 부호화 정보를 도시한다.
도 12a 내지 도 12c는 본 발명의 일 실시예에 따른 휘도 성분 및 색차 성분 영상의 포맷을 도시한다.
도 13은 본 발명의 일 실시예에 따른 휘도 성분 영상의 부호화 단위의 크기에 따른 인트라 예측 모드들의 개수를 도시한다.
도 14a 내지 도 14c는 본 발명의 일 실시예에 따른 소정 크기의 휘도 성분 부호화 단위에 적용되는 인트라 예측 모드의 일 예를 설명하기 위한 도면이다.
도 15는 본 발명의 일 실시예에 따른 소정 크기의 휘도 성분 부호화 단위에 적용되는 인트라 예측 모드의 다른 예를 설명하기 위한 도면이다.
도 16은 본 발명의 일 실시예에 따른 다양한 방향성을 갖는 휘도 성분 부호화 단위의 인트라 예측 모드들을 설명하기 위한 참조도이다.
도 17은 본 발명의 일 실시예에 따른 쌍선형 모드를 설명하기 위한 참조도이다.
도 18은 본 발명의 일 실시예에 따라서 현재 휘도 성분 부호화 단위의 인트라 예측 모드의 예측값을 생성하는 과정을 설명하기 위한 도면이다.
도 19는 본 발명의 일 실시예에 따라서 서로 다른 크기를 갖는 휘도 성분 부호화 단위들 사이의 인트라 예측 모드의 매핑 과정을 설명하기 위한 참조도이다.
도 20은 본 발명의 일 실시예에 따라서 주변 휘도 성분 부호화 단위의 인트라 예측 모드들을 대표 인트라 예측 모드들 중 하나로 매핑하는 과정을 설명하기 위한 참조도이다.
도 21은 본 발명의 일 실시예에 따라서 색차 성분 부호화 단위에 적용되는 후보 인트라 예측 모드의 일 예를 설명하기 위한 도면이다.
도 22는 본 발명의 일 실시예에 따른 영상의 인트라 예측 장치를 나타낸 블록도이다.
도 23은 본 발명의 일 실시예에 따른 영상 부호화 단위의 인트라 예측 모드 결정 방법을 나타낸 플로우 차트이다.
도 23은 본 발명의 일 실시예에 따른 영상 복호화 단위의 인트라 예측 모드 결정 방법을 나타낸 플로우 차트이다.
이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들에 따른 영상 부호화 장치 및 영상 복호화 장치, 영상 부호화 방법 및 영상 복호화 방법을 설명한다.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치의 블록도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 영상 부호화 장치(100)는 최대 부호화 단위 분할부(110), 부호화 심도 결정부(120), 영상 데이터 부호화부(130) 및 부호화 정보 부호화부(140)를 포함한다.
최대 부호화 단위 분할부(110)는 최대 크기의 부호화 단위인 최대 부호화 단위에 기반하여 현재 픽처 또는 현재 슬라이스를 분할한다. 현재 픽처 또는 현재 슬라이스는 적어도 하나의 최대 부호화 단위로 분할된다. 분할된 영상 데이터는 적어도 하나의 최대 부호화 단위별로 부호화 심도 결정부(120)로 출력될 수 있다.
본 발명의 일 실시예에 따르면, 최대 부호화 단위 및 심도를 이용해 부호화 단위가 표현될 수 있다. 최대 부호화 단위는 현재 픽처의 부호화 단위 중 크기가 가장 큰 부호화 단위를 나타내며, 심도는 부호화 단위가 계층적으로 축소된 서브 부호화 단위의 크기를 나타낸다. 심도가 커지면서, 부호화 단위는 최대 부호화 단위로부터 최소 부호화 단위까지 축소될 수 있으며, 최대 부호화 단위의 심도는 최소 심도로 정의되고, 최소 부호화 단위의 심도는 최대 심도로 정의될 수 있다. 최대 부호화 단위는 심도가 커짐에 따라 심도별 부호화 단위의 크기는 감소하므로, k 심도의 서브 부호화 단위는 k+1 이상의 심도를 갖는 복수 개의 서브 부호화 단위를 포함할 수 있다.
전술한 바와 같이 부호화 단위의 최대 크기에 따라, 현재 픽처의 영상 데이터를 최대 부호화 단위로 분할하며, 각각의 최대 부호화 단위는 심도별로 축소되는 부호화 단위들을 포함할 수 있다. 본 발명의 일 실시예에 따른 최대 부호화 단위는 심도별로 축소되므로, 최대 부호화 단위에 포함된 공간 영역(spatial domain)의 영상 데이터가 심도에 따라 계층적으로 분류될 수 있다.
최대 부호화 단위로부터 최상위 부호화 단위까지 현재 부호화 단위의 높이 및 너비를 계층적으로 축소한 총 횟수를 제한하는 최대 심도 및 부호화 단위의 최대 크기가 미리 설정되어 있을 수 있다. 이러한 최대 부호화 단위 및 최대 심도는 픽처 또는 슬라이스 단위로 설정될 수 있다. 즉, 픽처 또는 슬라이스마다 상이한 최대 부호화 단위 및 최대 심도를 갖을 수 있으며, 최대 심도에 따라 최대 영상 부호화 단위에 포함된 최소 부호화 단위 크기를 가변적으로 설정할 수 있다. 이와 같이 픽처 또는 슬라이스마다 최대 부호화 단위 및 최대 심도를 가변적으로 설정할 수 있게 함으로써, 평탄한 영역의 영상은 보다 큰 최대 부호화 단위를 이용하여 부호화함으로써 압축률을 향상시키고, 복잡도가 큰 영상은 보다 작은 크기의 부호화 단위를 이용하여 영상의 압축 효율을 향상시킬 수 있다.
부호화 심도 결정부(120)는 최대 부호화 단위마다 상이한 최대 심도를 결정한다. 최대 심도는 R-D 코스트(Rate-Distortion Cost) 계산에 기초해 결정될 수 있다. 결정된 최대 심도는 부호화 정보 부호화부(140)로 출력되고, 최대 부호화 단위별 영상 데이터는 영상 데이터 부호화부(130)로 출력된다.
최대 부호화 단위 내의 영상 데이터는 최대 심도 이하의 적어도 하나의 심도에 따라 심도별 부호화 단위에 기반하여 부호화되고, 각각의 심도별 부호화 단위에 기반한 부호화 결과가 비교된다. 심도별 부호화 단위의 부호화 오차의 비교 결과 부호화 오차가 가장 작은 심도가 선택될 수 있다. 각각의 최대화 부호화 단위마다 적어도 하나의 부호화 심도가 결정될 수 있다.
최대 부호화 단위의 크기는 심도가 증가함에 따라 부호화 단위가 계층적으로 분할되어 축소되며 부호화 단위의 개수는 증가한다. 또한, 하나의 최대 부호화 단위에 포함되는 동일한 심도의 부호화 단위들이라 하더라도, 각각의 데이터에 대한 부호화 오차를 측정하고 상위 심도로의 축소 여부가 결정된다. 따라서, 하나의 최대 부호화 단위에 포함되는 데이터라 하더라도 위치에 따라 심도별 부호화 오차가 다르므로 위치에 따라 부호화 심도가 달리 결정될 수 있다. 다시 말해, 최대 부호화 단위는 상이한 심도에 따라 상이한 크기의 서브 부호화 단위로 분할될 수 있다.하나의 최대 부호화 단위에 대해 부호화 심도가 하나 이상 설정될 수 있으며, 최대 부호화 단위의 데이터는 하나 이상의 부호화 심도의 부호화 단위에 따라 분할될 수 있다.
또한, 최대 부호화 단위에 포함된 상이한 크기의 서브 부호화 단위들은 상이한 크기의 처리 단위에 기초해 예측 또는 주파수 변환될 수 있다. 다시 말해, 영상 부호화 장치(100)는 영상 부호화를 위한 복수의 처리 단계들을 다양한 크기 및 다양한 형태의 처리 단위에 기초해 수행할 수 있다. 영상 데이터의 부호화를 위해서는 예측, 주파수 변환, 엔트로피 부호화 등의 처리 단계를 거치는데, 모든 단계에 걸쳐서 동일한 크기의 처리 단위가 이용될 수도 있으며, 단계별로 상이한 크기의 처리 단위를 이용할 수 있다.
예를 들어 영상 부호화 장치(100)는 부호화 단위를 예측하기 위해, 부호화 단위와 다른 처리 단위를 선택할 수 있다. 일 예로, 부호화 단위의 크기가 2Nx2N(단, N은 양의 정수)인 경우, 예측을 위한 처리 단위는 2Nx2N, 2NxN, Nx2N, NxN 등일 수 있다. 다시 말해, 부호화 단위의 높이 또는 너비 중 적어도 하나를 반분하는 형태의 처리 단위를 기반으로 움직임 예측이 수행될 수도 있다. 이하, 예측의 기초가 되는 데이터 단위는 '예측 단위'라 한다.
예측 모드는 인트라 모드, 인터 모드 및 스킵 모드 중 적어도 하나일 수 있으며, 특정 예측 모드는 특정 크기 또는 형태의 예측 단위에 대해서만 수행될 수 있다. 예를 들어, 인트라 모드는 정방형인 2Nx2N, NxN 크기의 예측 단위에 대해서만 수행될 수 있다. 또한, 스킵 모드는 2Nx2N 크기의 예측 단위에 대해서만 수행될 수 있다. 부호화 단위 내부에 복수의 예측 단위가 있다면, 각각의 예측 단위에 대해 예측을 수행하여 부호화 오차가 가장 작은 예측 모드가 선택될 수 있다.
또한, 영상 부호화 장치(100)는 부호화 단위와 다른 크기의 처리 단위에 기초해 영상 데이터를 주파수 변환할 수 있다. 부호화 단위의 주파수 변환을 위해서 부호화 단위보다 작거나 같은 크기의 데이터 단위를 기반으로 주파수 변환이 수행될 수 있다. 이하, 주파수 변환의 기초가 되는 처리 단위를 '변환 단위'라 한다.
부호화 심도 결정부(120)는 라그랑자 곱(Lagrangian Multiplier) 기반의 율-왜곡 최적화 기법(Rate-Distortion Optimization)을 이용하여 심도별 부호화 단위의 부호화 오차를 측정하여 최적의 부호화 오차를 갖는 최대 부호화 단위의 분할 형태를 결정할 수 있다. 다시 말해, 부호화 심도 결정부(120)는 최대 부호화 단위가 어떠한 형태의 복수의 서브 부호화 단위로 분할되는지 결정할 수 있는데, 여기서 복수의 서브 부호화 단위는 심도에 따라 크기가 상이하다.
영상 데이터 부호화부(130)는, 부호화 심도 결정부(120)에서 결정된 적어도 하나의 부호화 심도에 기초하여 최대 부호화 단위의 영상 데이터를 부호화하여 비트스트림을 출력한다. 부호화 심도 결정부(120)에서 최소 부호화 오차를 측정하기 위해 부호화가 이미 수행되었으므로, 이를 이용해 부호화된 데이터 스트림을 출력할 수도 있다.
부호화 정보 부호화부(140)는, 부호화 심도 결정부(120)에서 결정된 적어도 하나의 부호화 심도에 기초하여, 최대 부호화 단위마다 심도별 부호화 모드에 관한 정보를 부호화하여 비트스트림을 출력한다. 심도별 부호화 모드에 관한 정보는, 부호화 심도 정보, 부호화 심도의 부호화 단위의 예측 단위의 분할 타입 정보, 예측 단위별 예측 모드 정보, 변환 단위의 크기 정보 등을 포함할 수 있다.
부호화 심도 정보는, 현재 심도로 부호화하지 않고 상위 심도의 부호화 단위로 부호화할지 여부를 나타내는 심도별 축소 정보를 이용하여 정의될 수 있다. 현재 부호화 단위의 현재 심도가 부호화 심도라면, 현재 부호화 단위는 현재 심도의 부호화 단위로 부호화되므로 현재 심도의 축소 정보는 더 이상 상위 심도로 축소되지 않도록 정의될 수 있다. 반대로, 현재 부호화 단위의 현재 심도가 부호화 심도가 아니라면 상위 심도의 부호화 단위를 이용한 부호화를 시도해보아야 하므로, 현재 심도의 축소 정보는 상위 심도의 부호화 단위로 축소되도록 정의될 수 있다.
현재 심도가 부호화 심도가 아니라면, 상위 심도의 부호화 단위로 축소된 부호화 단위에 대해 부호화가 수행된다. 현재 심도의 부호화 단위 내에 상위 심도의 부호화 단위가 하나 이상 존재하므로, 각각의 상위 심도의 부호화 단위마다 반복적으로 부호화가 수행되어, 동일한 심도의 부호화 단위마다 재귀적(recursive) 부호화가 수행될 수 있다.
하나의 최대 부호화 단위 안에 적어도 하나의 부호화 심도가 결정되며 부호화 심도마다 적어도 하나의 부호화 모드에 관한 정보가 결정되어야 하므로, 하나의 최대 부호화 단위에 대해서는 적어도 하나의 부호화 모드에 관한 정보가 결정될 수 있다. 또한, 최대 부호화 단위의 데이터는 심도에 따라 계층적으로 분할되어 위치 별로 부호화 심도가 다를 수 있으므로, 데이터에 대해 부호화 심도 및 부호화 모드에 관한 정보가 설정될 수 있다.
따라서, 일 실시예에 따른 부호화 정보 부호화부(140)는, 최대 부호화 단위에 포함되어 있는 최소 부호화 단위마다 해당 부호화 정보를 설정할 수 있다. 즉, 부호화 심도의 부호화 단위는 동일한 부호화 정보를 보유하고 있는 최소 부호화 단위를 하나 이상 포함하고 있다. 이를 이용하여, 인근 최소 부호화 단위들이 동일한 심도별 부호화 정보를 갖고 있다면, 동일한 최대 부호화 단위에 포함되는 최소 부호화 단위일 수 있다.
영상 부호화 장치(100)의 가장 간단한 형태의 실시예에 따르면, 심도별 부호화 단위는 한 계층 하위 심도의 부호화 단위의 높이 및 너비를 반분한 크기의 부호화 단위이다. 즉, 현재 심도(k)의 부호화 단위의 크기가 2Nx2N이라면, 상위 심도(k+1)의 부호화 단위의 크기는 NxN 이다. 따라서, 2Nx2N 크기의 현재 부호화 단위는 NxN 크기의 상위 심도 부호화 단위를 최대 4개 포함할 수 있다.
따라서, 일 실시예에 따른 영상 복호화 장치(100)는 현재 픽처의 특성을 고려하여 결정된 최대 부호화 단위의 크기 및 최대 심도를 기반으로, 각각의 최대 부호화 단위마다 최적의 형태 분할 형태를 결정할 수 있다. 또한, 각각의 최대 부호화 단위마다 다양한 예측 모드, 주파수 변환 방식 등으로 부호화할 수 있으므로, 다양한 영상 크기의 부호화 단위의 영상 특성을 고려하여 최적의 부호화 모드가 결정될 수 있다.
영상의 해상도가 매우 높거나 데이터량이 매우 큰 영상을 종래의 16x16 크기의 매크로블록 단위로 부호화한다면, 픽처당 매크로블록의 수가 과도하게 많아진다. 이에 따라, 매크로블록마다 생성되는 압축 정보도 많아지므로 압축 정보의 전송 부담이 커지고 데이터 압축 효율이 감소하는 경향이 있다. 따라서, 본 발명의 일 실시예에 따른 영상 부호화 장치는, 영상의 크기를 고려하여 부호화 단위의 최대 크기를 증가시키면서, 영상 특성을 고려하여 부호화 단위를 조절할 수 있으므로, 영상 압축 효율이 증대될 수 있다.
도 2 는 본 발명의 일 실시예에 따른 영상 복호화 장치의 블록도를 도시한다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 영상 복호화 장치(200)는 영상 데이터 획득부(210), 부호화 정보 추출부(220) 및 영상 데이터 복호화부(230)를 포함한다.
영상 관련 데이터 획득부(210)는 영상 복호화 장치(200)가 수신한 비트열을 파싱하여, 최대 부호화 단위별로 영상 데이터를 획득하여 영상 데이터 복호화부(230)로 출력한다. 영상 관련 데이터 획득부(210)는 현재 픽처 또는 슬라이스에 대한 헤더로부터 현재 픽처 또는 슬라이스의 최대 부호화 단위에 대한 정보를 추출할 수 있다. 본 발명의 일 실시예에 따른 영상 복호화 장치(200)는 최대 부호화 단위 단위별로 영상 데이터를 복호화한다.
부호화 정보 추출부(220)는 영상 복호화 장치(200)가 수신한 비트열을 파싱하여, 현재 픽처에 대한 헤더로부터 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보를 추출한다. 추출된 부호화 심도 및 부호화 모드에 관한 정보는 영상 데이터 복호화부(230)로 출력된다.
최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보는, 하나 이상의 부호화 심도 정보에 대해 설정될 수 있으며, 부호화 심도별 부호화 모드에 관한 정보는, 부호화 단위별 예측 단위의 분할 타입 정보, 예측 모드 정보 및 변환 단위의 크기 정보 등을 포함할 수 있다. 또한, 부호화 심도 정보로서, 심도별 축소 정보가 추출될 수도 있다.
최대 부호화 단위의 분할 형태에 대한 정보는 최대 부호화 단위에 포함된 심도에 따라 상이한 크기의 서브 부호화 단위에 대한 정보를 포함할 수 있으며, 부호화 모드에 관한 정보는 서브 부호화 단위별 예측 단위에 대한 정보, 예측 모드에 대한 정보 및 변환 단위에 대한 정보 등을 포함할 수 있다.
영상 데이터 복호화부(230)는 부호화 정보 추출부에서 추출된 정보에 기초하여 각각의 최대 부호화 단위의 영상 데이터를 복호화하여 현재 픽처를 복원한다. 최대 부호화 단위의 분할 형태에 대한 정보에 기초하여, 영상 데이터 복호화부(230)는 최대 부호화 단위에 포함된 서브 부호화 단위를 복호화할 수 있다. 복호화 과정은 인트라 예측 및 움직임 보상을 포함하는 움직임 예측 과정, 및 주파수 역변환 과정을 포함할 수 있다.
영상 데이터 복호화부(230)는 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보에 기초하여 각각의 최대 부호화 단위의 영상 데이터를 복호화하여 현재 픽처를 복원한다. 최대 부호화 단위별 부호화 심도 정보에 기초하여, 영상 데이터 복호화부(230)는 적어도 하나의 부호화 심도의 부호화 단위마다 영상 데이터를 복호화할 수 있다. 복호화 과정은 인트라 예측 및 움직임 보상을 포함하는 예측 과정 및 역변환 과정을 포함할 수 있다.
영상 데이터 복호화부(230)는, 부호화 단위별 예측을 위해 부호화 심도별 부호화 단위의 예측 단위의 분할 타입 정보 및 예측 모드 정보에 기초하여, 부호화 단위마다 각각의 예측 단위 및 예측 모드로 인트라 예측 또는 움직임 보상을 수행할 수 있다. 또한, 영상 데이터 복호화부(230)는, 최대 부호화 단위별 역변환을 위해, 부호화 심도별 부호화 단위의 변환 단위의 크기 정보에 기초하여, 부호화 단위마다 각각의 변환 단위로 역변환을 수행할 수 있다.
영상 데이터 복호화부(230)는 심도별 축소 정보를 이용하는 현재 최대 부호화 단위의 부호화 심도를 결정할 수 있다. 만약, 축소 정보가 현재 심도로 복호화할 것을 나타내고 있다면 현재 심도가 부호화 심도이다. 따라서, 영상 데이터 복호화부(230)는 현재 최대 부호화 단위의 영상 데이터에 대해 현재 심도의 부호화 단위를 예측 단위의 분할 타입, 예측 모드 및 변환 단위 크기 정보를 이용하여 복호화할 수 있다. 즉, 최소 부호화 단위에 대해 설정되어 있는 부호화 정보를 관찰하여, 동일한 축소 정보를 포함한 부호화 정보를 보유하고 있는 최소 부호화 단위를 모아, 하나의 데이터 단위로 복호화할 수 있다.
일 실시예에 따른 영상 복호화 장치(200)는, 부호화 과정에서 최대 부호화 단위마다 재귀적으로 부호화를 수행하여 최소 부호화 오차를 발생시킨 부호화 단위에 대한 정보를 획득하여, 현재 픽처에 대한 복호화에 이용할 수 있다. 즉, 최대 부호화 단위마다 최적 부호화 단위로 영상 데이터의 복호화가 가능해진다. 따라서, 높은 해상도의 영상 또는 데이터량이 과도하게 많은 영상이라도 부호화단으로부터 전송된 최적 부호화 모드에 관한 정보를 이용하여, 영상의 특성에 적응적으로 결정된 부호화 단위의 크기 및 부호화 모드에 따라 효율적으로 영상 데이터를 복호화하여 복원할 수 있다.
도 3은 본 발명의 일 실시예에 따른 계층적 부호화 단위를 도시한다.
도 3을 참조하면, 본 발명에 따른 계층적 부호화 단위는 너비x높이가 64x64인 부호화 단위부터, 32x32, 16x16, 8x8, 및 4x4를 포함할 수 있다. 정사각형 형태의 부호화 단위 이외에도, 너비x높이가 64x32, 32x64, 32x16, 16x32, 16x8, 8x16, 8x4, 4x8인 부호화 단위들이 존재할 수 있다.
도 3에서 비디오 데이터(310)에 대해서는, 해상도는 1920x1080, 최대 부호화 단위의 크기는 64, 최대 심도가 2로 설정되어 있다. 또한, 비디오 데이터(320)에 대해서는, 해상도는 1920x1080, 부호화 단위의 최대 크기는 64, 최대 심도가 4로 설정되어 있다. 또한, 비디오 데이터(330)에 대해서는, 해상도는 352x288, 부호화 단위의 최대 크기는 16, 최대 심도가 2로 설정되어 있다.
해상도가 높거나 데이터량이 많은 경우 압축률 향상뿐만 아니라 영상 특성을 정확히 반영하기 위해 부호화 사이즈의 최대 크기가 상대적으로 큰 것이 바람직하다. 따라서, 비디오 데이터(330)에 비해, 해상도가 높은 비디오 데이터(310, 320)는 부호화 사이즈의 최대 크기가 64로 선택될 수 있다.
최대 심도는 계층적 부호화 단위에서 총 계층수를 나타낸다. 따라서, 비디오 데이터(310)의 최대 심도는 2이므로, 비디오 데이터(310)의 부호화 단위(315)는 장축 크기가 64인 최대 부호화 단위로부터, 심도가 두 계층 증가하여 장축 크기가 32, 16인 부호화 단위들까지 포함할 수 있다. 반면, 비디오 데이터(330)의 최대 심도는 2이므로, 비디오 데이터(330)의 부호화 단위(335)는 장축 크기가 16인 부호화 단위들로부터, 심도가 두 계층 증가하여 장축 크기가 8, 4인 부호화 단위들까지 포함할 수 있다.
비디오 데이터(320)의 최대 심도는 4이므로, 비디오 데이터(320)의 부호화 단위(325)는 장축 크기가 64인 최대 부호화 단위로부터, 심도가 네 계층 증가하여 장축 크기가 32, 16, 8, 4인 부호화 단위들까지 포함할 수 있다.심도가 증가할수록 더 작은 서브 부호화 단위에 기초해 영상을 부호화하므로 보다 세밀한 장면을 포함하고 있는 영상을 부호화하는데 적합해진다.
도 4 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 부호화부의 블록도를 나타낸 것이다.
도 4를 참조하면, 인트라 예측부(410)는 현재 프레임(405) 중 인트라 모드의 예측 단위에 대해 인트라 예측을 수행하고, 움직임 추정부(420) 및 움직임 보상부(425)는 인터 모드의 예측 단위에 대해 현재 프레임(405) 및 참조 프레임(495)을 이용해 인터 예측 및 움직임 보상을 수행한다.
인트라 예측부(410), 움직임 추정부(420) 및 움직임 보상부(425)로부터 출력된 예측 단위에 기초해 레지듀얼 값들이 생성되고, 생성된 레지듀얼 값들은 주파수 변환부(430) 및 양자화부(440)를 거쳐 양자화된 변환 계수로 출력된다.
양자화된 변환 계수는 역양자화부(460), 주파수 역변환부(470)를 통해 다시 레지듀얼 값으로 복원되고, 복원된 레지듀얼 값들은 디블로킹부(480) 및 루프 필터링부(490)를 거쳐 후처리되어 참조 프레임(495)으로 출력된다. 양자화된 변환 계수는 엔트로피 부호화부(450)를 거쳐 비트스트림(455)으로 출력될 수 있다.
본 발명의 일 실시예에 따른 영상 부호화 방법에 따라 부호화하기 위해, 영상 부호화부(400)의 구성 요소들인 인트라 예측부(410), 움직임 추정부(420), 움직임 보상부(425), 주파수 변환부(430), 양자화부(440), 엔트로피 부호화부(450), 역양자화부(460), 주파수 역변환부(470), 디블로킹부(480) 및 루프 필터링부(490)는 모두 최대 부호화 단위, 심도에 따른 서브 부호화 단위, 예측 단위 및 변환 단위에 기초해 영상 부호화 과정들을 처리한다. 특히, 인트라 예측부(410), 움직임 추정부(420) 및 움직임 보상부(425)는 부호화 단위의 최대 크기 및 심도를 고려하여 부호화 단위 내의 예측 단위 및 예측 모드를 결정하며, 주파수 변환부(430)는 부호화 단위의 최대 크기 및 심도를 고려하여 변환 단위의 크기를 고려하여야 한다. 또한, 후술되는 바와 같이 인트라 예측부(410)는 휘도 성분의 영상 부호화 단위에 대하여 결정된 인트라 예측 모드를 색차 성분의 영상 부호화 단위에 적용하여 인트라 예측을 수행함으로써 색차 성분 영상 부호화 단위에 대한 예측 효율을 향상시킨다.
도 5 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 복호화부의 블록도를 나타낸 것이다.
도 5를 참조하면, 비트스트림(505)이 파싱부(510)를 거쳐 복호화 대상인 부호화된 영상 데이터 및 복호화를 위해 필요한 부호화 정보가 파싱된다. 부호화된 영상 데이터는 엔트로피 복호화부(520) 및 역양자화부(530)를 거쳐 역양자화된 데이터로 출력되고, 주파수 역변환부(540)를 거쳐 레지듀얼 값들로 복원된다. 레지듀얼 값들은 인트라 예측부(550)의 인트라 예측의 결과 또는 움직임 보상부(560)의 움직임 보상 결과와 가산되어 부호화 단위 별로 복원된다. 복원된 부호화 단위는 디블로킹부(570) 및 루프 필터링부(580)를 거쳐 다음 부호화 단위 또는 다음 픽처의 예측에 이용된다.
본 발명의 일 실시예에 따른 영상 복호화 방법에 따라 복호화하기 위해 영상 복호화부(500)의 구성 요소들인 파싱부(510), 엔트로피 복호화부(520), 역양자화부(530), 주파수 역변환부(540), 인트라 예측부(550), 움직임 보상부(560), 디블로킹부(570) 및 루프 필터링부(580)가 모두 최대 부호화 단위, 심도에 따른 서브 부호화 단위, 예측 단위 및 변환 단위에 기초해 영상 복호화 과정들을 처리한다. 특히, 인트라 예측부(550), 움직임 보상부(560)는 부호화 단위의 최대 크기 및 심도를 고려하여 부호화 단위 내의 예측 단위 및 예측 모드를 결정하며, 주파수 역변환부(540)는 부호화 단위의 최대 크기 및 심도를 고려하여 변환 단위의 크기를 고려하여야 한다.
도 6은 본 발명의 일 실시예에 따른 심도별 부호화 단위 및 예측 단위를 도시한다.
일 실시예에 따른 영상 부호화 장치(100) 및 일 실시예에 따른 영상 복호화 장치(200)는 영상 특성을 고려하기 위해 계층적인 부호화 단위를 사용한다. 부호화 단위의 최대 높이 및 너비, 최대 심도는 영상의 특성에 따라 적응적으로 결정될 수도 있으며, 사용자의 요구에 따라 다양하게 설정될 수도 있다. 미리 설정된 부호화 단위의 최대 크기에 따라, 심도별 부호화 단위의 크기가 결정될 수도 있다.
본 발명의 일 실시예에 따른 부호화 단위의 계층 구조(600)는 부호화 단위의 최대 높이 및 너비가 64이며, 최대 심도가 4인 경우를 도시하고 있다. 일 실시예에 따른 부호화 단위의 계층 구조(600)의 세로축을 따라서 심도가 증가하므로 심도별 부호화 단위의 높이 및 너비가 각각 축소된다. 또한, 부호화 단위의 계층 구조(600)의 가로축을 따라, 각각의 심도별 부호화 단위의 예측 기반이 되는 부분적 데이터 단위인 예측 단위가 도시되어 있다.
최대 부호화 단위(610)는 부호화 단위의 계층 구조(600) 중 최대 부호화 단위로서 심도가 0이며, 부호화 단위의 크기, 즉 높이 및 너비가 64x64이다. 세로축을 따라 심도가 증가하며, 크기 32x32인 심도 1의 부호화 단위(620), 크기 16x16인 심도 2의 부호화 단위(630), 크기 8x8인 심도 3의 부호화 단위(640), 크기 4x4인 심도 4의 부호화 단위(650)가 존재한다. 크기 4x4인 심도 4의 부호화 단위(650)는 최소 부호화 단위이다.
또한 도 6을 참조하면, 각각의 심도별로 가로축을 따라, 부호화 단위의 예측 단위로서, 부분적 데이터 단위들이 도시되어 있다. 즉, 심도 0의 크기 64x64의 최대 부호화 단위(610)의 예측 단위는, 크기 64x64의 부호화 단위(610)에 포함되는 크기 64x64의 부분적 데이터 단위(610), 크기 64x32의 부분적 데이터 단위들(612), 크기 32x64의 부분적 데이터 단위들(614), 크기 32x32의 부분적 데이터 단위들(616)일 수 있다.
심도 1의 크기 32x32의 부호화 단위(620)의 예측 단위는, 크기 32x32의 부호화 단위(620)에 포함되는 크기 32x32의 부분적 데이터 단위(620), 크기 32x16의 부분적 데이터 단위들(622), 크기 16x32의 부분적 데이터 단위들(624), 크기 16x16의 부분적 데이터 단위들(626)일 수 있다.
심도 2의 크기 16x16의 부호화 단위(630)의 예측 단위는, 크기 16x16의 부호화 단위(630)에 포함되는 크기 16x16의 부분적 데이터 단위(630), 크기 16x8의 부분적 데이터 단위들(632), 크기 8x16의 부분적 데이터 단위들(634), 크기 8x8의 부분적 데이터 단위들(636)일 수 있다.
심도 3의 크기 8x8의 부호화 단위(640)의 예측 단위는, 크기 8x8의 부호화 단위(640)에 포함되는 크기 8x8의 부분적 데이터 단위(640), 크기 8x4의 부분적 데이터 단위들(642), 크기 4x8의 부분적 데이터 단위들(644), 크기 4x4의 부분적 데이터 단위들(646)일 수 있다.
마지막으로, 심도 4의 크기 4x4의 부호화 단위(650)는 최소 부호화 단위이며 최상위 심도의 부호화 단위이고, 해당 예측 단위도 크기 4x4의 데이터 단위(650)이다.
일 실시예에 따른 영상 부호화 장치의 부호화 심도 결정부(120)는, 최대 부호화 단위(610)의 부호화 심도를 결정하기 위해, 최대 부호화 단위(610)에 포함되는 각각의 심도의 부호화 단위마다 부호화를 수행하여야 한다.
동일한 범위 및 크기의 데이터를 포함하기 위한 심도별 부호화 단위의 개수는, 심도가 증가할수록 심도별 부호화 단위의 개수도 증가한다. 예를 들어, 심도 1의 부호화 단위 한 개가 포함하는 데이터에 대해서, 심도 2의 부호화 단위는 네 개가 필요하다. 따라서, 동일한 데이터의 부호화 결과를 심도별로 비교하기 위해서, 한 개의 심도 1의 부호화 단위 및 네 개의 심도 2의 부호화 단위를 이용하여 각각 부호화되어야 한다.
각각의 심도별 부호화를 위해서는, 부호화 단위의 계층 구조(600)의 가로축을 따라, 심도별 부호화 단위의 예측 단위들마다 부호화를 수행하여, 해당 심도에서 가장 작은 부호화 오차인 대표 부호화 오차가 선택될 수다. 또한, 부호화 단위의 계층 구조(600)의 세로축을 따라 심도를 증가시키며, 각각의 심도마다 부호화를 수행하여, 심도별 대표 부호화 오차를 비교하여 최소 부호화 오차가 검색될 수 있다. 최대 부호화 단위(610) 중 최소 부호화 오차가 발생하는 심도가 최대 부호화 단위(610)의 부호화 심도 및 분할 타입으로 선택될 수 있다.
도 7은 본 발명의 일 실시예에 따른, 부호화 단위 및 변환 단위의 관계를 도시한다.
본 발명의 일 실시예에 따른 영상 부호화 장치(100) 및 영상 복호화 장치(200)는, 최대 부호화 단위마다 최대 부호화 단위보다 작거나 같은 크기의 부호화 단위로 영상을 분할하여 부호화하거나 복호화한다. 부호화 과정 중 주파수 변환을 위한 변환 단위의 크기는 각각의 부호화 단위보다 크지 않은 데이터 단위를 기반으로 선택될 수 있다. 예를 들어, 현재 부호화 단위(710)가 64x64 크기일 때, 32x32 크기의 변환 단위(720)를 이용하여 주파수 변환이 수행될 수 있다. 또한, 64x64 크기의 부호화 단위(710)의 데이터를 64x64 크기 이하의 32x32, 16x16, 8x8, 4x4 크기의 변환 단위들로 각각 주파수 변환을 수행하여 부호화한 후, 원본과의 오차가 가장 적은 변환 단위가 선택될 수 있다.
도 8은 본 발명의 일 실시예에 따라, 심도별 부호화 정보들을 도시한다.
본 발명의 일 실시예에 따른 영상 부호화 장치(100)의 부호화 정보 부호화부는 부호화 모드에 관한 정보로서, 각각의 부호화 심도의 부호화 단위마다 분할 타입에 관한 정보(800), 예측 모드에 관한 정보(810), 변환 단위 크기에 대한 정보(820)를 부호화하여 전송할 수 있다.
분할 타입에 대한 정보(800)는, 현재 부호화 단위의 움직임 예측을 위해 예측 단위로서, 현재 부호화 단위가 분할된 타입에 대한 정보를 나타낸다. 예를 들어, 심도 0 및 크기 2Nx2N의 현재 부호화 단위 CU_0는, 크기 2Nx2N의 예측 단위(802), 크기 2NxN의 예측 단위(804), 크기 Nx2N의 예측 단위(806), 크기 NxN의 예측 단위(808) 중 어느 하나의 타입으로 분할되어 예측 단위로 이용될 수 있다. 이 경우 현재 부호화 단위의 분할 타입에 관한 정보(800)는 크기 2Nx2N의 예측 단위(802), 크기 2NxN의 예측 단위(804), 크기 Nx2N의 예측 단위(806) 및 크기 NxN의 예측 단위(808) 중 하나를 나타내도록 설정된다.
예측 모드에 관한 정보(810)는, 각각의 예측 단위의 움직임 예측 모드를 나타낸다. 예를 들어 예측 모드에 관한 정보(810)를 통해, 분할 타입에 관한 정보(800)가 가리키는 예측 단위가 인트라 모드(812), 인터 모드(814) 및 스킵 모드(816) 중 하나로 움직임 예측이 수행되는지 여부가 설정될 수 있다.
또한, 변환 단위 크기에 관한 정보(820)는 현재 부호화 단위를 어떠한 변환 단위를 기반으로 주파수 변환을 수행할지 여부를 나타낸다. 예를 들어, 변환 단위는 제 1 인트라 변환 단위 크기(822), 제 2 인트라 변환 단위 크기(824), 제 1 인터 변환 단위 크기(826), 제 2 인트라 변환 단위 크기(828) 중 하나일 수 있다.
본 발명의 일 실시예에 따른 영상 복호화 장치(200)의 부호화 정보 추출부는, 각각의 심도별 부호화 단위마다 분할 타입에 관한 정보(800), 예측 모드에 관한 정보(810), 변환 단위 크기에 대한 정보(820)를 추출하여 복호화에 이용할 수 있다.
도 9 는 본 발명의 일 실시예에 따른 심도별 부호화 단위를 도시한다.
심도의 증가 여부를 나타내기 위해 축소 정보가 이용될 수 있다. 축소 정보는 현재 심도의 부호화 단위가 상위 심도의 부호화 단위로 축소될지 여부를 나타낸다.
심도 0 및 2N_0x2N_0 크기의 부호화 단위의 움직임 예측을 위한 예측 단위(910)는 2N_0x2N_0 크기의 분할 타입(912), 2N_0xN_0 크기의 분할 타입(914), N_0x2N_0 크기의 분할 타입(916), N_0xN_0 크기의 분할 타입(918)을 포함할 수 있다.
분할 타입마다, 한 개의 2N_0xN_0 크기의 예측 단위, 두 개의 2N_0xN_0 크기의 예측 단위, 두 개의 N_0x2N_0 크기의 예측 단위, 네 개의 N_0xN_0 크기의 예측 단위마다 반복적으로 움직임 예측을 통한 부호화가 수행되어야 한다. 크기 2N_0xN_0 및 크기 N_0xN_0의 예측 단위에 대해서는, 인트라 모드 및 인터 모드로 움직임 예측이 수행될 수 있으며, 크기 N_0x2N_0 및 크기 N_0xN_0의 예측 단위로는 인터 모드로만 움직임 예측이 수행될 수 있다. 스킵 모드는 크기 2N_0xN_0의 예측 단위에 대해서만 수행될 수 있다.
크기 N_0xN_0의 분할 타입(918)에 의한 부호화 오차가 가장 작다면, 심도 0를 1로 증가(920)시키고, 심도 2 및 크기 N_0xN_0의 분할 타입의 부호화 단위들(922, 924, 926, 928)에 대해 반복적으로 최소 부호화 오차를 검색해 나갈 수 있다.
동일한 심도의 부호화 단위들(922, 924, 926, 928)에 대해 부호화가 반복적으로 수행되므로, 이중 하나만 예를 들어 심도 1의 부호화 단위의 부호화를 설명한다. 심도 1 및 크기 2N_1x2N_1 (=N_0xN_0)의 부호화 단위의 움직임 예측을 위한 예측 단위(930)는, 크기 2N_1x2N_1의 분할 타입(932), 크기 2N_1xN_1의 분할 타입(934), 크기 N_1x2N_1의 분할 타입(936), 크기 N_1xN_1의 분할 타입(938)을 포함할 수 있다. 분할 타입마다, 한 개의 크기 2N_1x2N_1의 예측 단위, 두 개의 크기 2N_1xN_1의 예측 단위, 두 개의 크기 N_1x2N_1의 예측 단위, 네 개의 크기 N_1xN_1의 예측 단위마다 반복적으로 움직임 예측을 통한 부호화가 수행되어야 한다.
또한, 크기 N_1xN_1 크기의 분할 타입(938)에 의한 부호화 오차가 가장 작다면, 심도 1을 심도 2로 증가(940)시키면서, 심도 2 및 크기 N_2xN_2의 부호화 단위들(942, 944, 946, 948)에 대해 반복적으로 최소 부호화 오차를 검색해 나갈 수 있다.
최대 심도가 d인 경우, 심도별 축소 정보는 심도 d-1일 때까지 설정될 수 있다. 즉, 심도 d-1 및 크기 2N_(d-1)x2N_(d-1)의 부호화 단위의 움직임 예측을 위한 예측 단위(950)는, 크기 2N_(d-1)x2N_(d-1)의 분할 타입(952), 크기 2N_(d-1)xN_(d-1)의 분할 타입(954), 크기 N_(d-1)x2N_(d-1)의 분할 타입(956), 크기 N_(d-1)xN_(d-1)의 분할 타입(958)을 포함할 수 있다.
분할 타입마다, 한 개의 크기 2N_(d-1)x2N_(d-1)의 예측 단위, 두 개의 크기 2N_(d-1)xN_(d-1)의 예측 단위, 두 개의 크기 N_(d-1)x2N_(d-1)의 예측 단위, 네 개의 크기 N_(d-1)xN_(d-1)의 예측 단위마다 반복적으로 움직임 예측을 통한 부호화가 수행되어야 한다. 최대 심도가 d이므로, 심도 d-1의 부호화 단위(952)는 더 이상 축소 과정을 거치지 않는다.
본 발명의 일 실시예에 따른 영상 부호화 장치(100)는 부호화 단위(912)를 위한 부호화 심도를 결정하기 위해, 심도별 부호화 오차를 비교하여 가장 작은 부호화 오차가 발생하는 심도를 선택한다. 예를 들어, 심도 0의 부호화 단위에 대한 부호화 오차는 분할 타입(912, 914, 916, 918)마다 움직임 예측을 수행하여 부호화한 후 가장 작은 부호화 오차가 발생하는 예측 단위가 결정된다. 마찬가지로 심도 0, 1, ..., d-1 마다 부호화 오차가 가장 작은 예측 단위가 검색될 수 있다. 심도 d에서는, 크기 2N_dx2N_d의 부호화 단위이면서 예측 단위(960)를 기반으로 한 움직임 예측을 통해 부호화 오차가 결정될 수 있다. 이와 같이 심도 0, 1, ..., d-1, d의 모든 심도별 최소 부호화 오차를 비교하여 오차가 가장 작은 심도가 선택되어 부호화 심도로 결정될 수 있다. 부호화 심도 및 해당 심도의 예측 단위는 부호화 모드에 관한 정보로써 부호화되어 전송될 수 있다. 또한, 심도 0으로부터 부호화 심도에 이르기까지 부호화 단위가 축소되어야 하므로, 부호화 심도의 축소 정보만이 '0'으로 설정되고, 부호화 심도를 제외한 심도별 축소 정보는 '1'로 설정되어야 한다.
본 발명의 일 실시예에 따른 영상 복호화 장치(200)의 부호화 정보 추출부(220)는 부호화 단위(912)에 대한 부호화 심도 및 예측 단위에 관한 정보를 추출하여 부호화 단위(912)를 복호화하는데 이용할 수 있다. 일 실시예에 따른 영상 복호화 장치(200)는 심도별 축소 정보를 이용하여 축소 정보가 '0'인 심도를 부호화 심도로 파악하고, 해당 심도에 대한 부호화 모드에 관한 정보를 이용하여 복호화에 이용할 수 있다.
도 10a 및 10b는 본 발명의 일 실시예에 따른, 부호화 단위, 예측 단위 및 주파수 변환 단위의 관계를 도시한다.
부호화 단위(1010)는, 최대 부호화 단위(1000)에 대해 일 실시예에 따른 영상 부호화 장치(100)가 결정한 부호화 심도별 부호화 단위들이다. 예측 단위(1060)는 부호화 단위(1010) 중 각각의 부호화 심도별 부호화 단위의 예측 단위들이며, 변환 단위(1070)는 각각의 부호화 심도별 부호화 단위의 변환 단위들이다.
심도별 부호화 단위들(1010)은 최대 부호화 단위(1000)의 심도가 0이라고 하면, 부호화 단위들(1012, 1054)은 심도가 1, 부호화 단위들(1014, 1016, 1018, 1028, 1050, 1052)은 심도가 2, 부호화 단위들(1020, 1022, 1024, 1026, 1030, 1032, 1038)은 심도가 3, 부호화 단위들(1040, 1042, 1044, 1046)은 심도가 4이다.
예측 단위들(1060) 중 일부(1014, 1016, 1022, 1032, 1048, 1050, 1052, 1054)는 부호화 단위가 분할된 타입이다. 즉, 예측 단위(1014, 1022, 1050, 1054)는 2NxN의 분할 타입이며, 예측 단위(1016, 1048, 1052)는 Nx2N의 분할 타입, 예측 단위(1032)는 NxN의 분할 타입이다. 즉, 심도별 부호화 단위들(1010)의 예측 단위는 각각의 부호화 단위보다 작거나 같다.
변환 단위들(1070) 중 일부(1052, 1054)의 영상 데이터에 대해서는 부호화 단위에 비해 작은 크기의 데이터 단위로 주파수 변환 또는 주파수 역변환이 수행된다. 또한, 변환 단위(1014, 1016, 1022, 1032, 1048, 1050, 1052, 1054)는 예측 단위들(1060) 중 해당 예측 단위와 비교해보면, 서로 다른 크기 또는 형태의 데이터 단위이다. 즉, 본 발명의 일 실시예에 따른 영상 부호화 장치(100) 및 영상 복호화 장치(200)는 동일한 부호화 단위에 대한 예측 및 주파수 변환/역변환 작업이라 할지라도, 각각 별개의 데이터 단위를 기반으로 수행할 수 있다.
도 11 은 본 발명의 일 실시예에 따른 부호화 단위별 부호화 정보를 도시한다.
본 발명의 일 실시예에 따른 영상 부호화 장치(100)의 부호화 정보 부호화부(140)는 부호화 단위별 부호화 정보를 부호화하고, 본 발명의 일 실시예에 따른 영상 복호화 장치(200)의 부호화 정보 추출부(220)는 부호화 단위별 부호화 정보를 추출할 수 있다.
부호화 정보는 부호화 단위에 대한 축소 정보, 분할 타입 정보, 예측 모드 정보, 변환 단위 크기 정보를 포함할 수 있다. 도 11에 도시되어 있는 부호화 정보들은 본 발명의 일 실시예에 따른 영상 부호화 장치(100) 및 영상 복호화 장치(200)에서 설정할 수 있는 일 예에 불과하며, 도시된 것에 한정되지 않는다.
축소 정보는 해당 부호화 단위의 부호화 심도를 나타낼 수 있다. 즉, 축소 정보에 따라 더 이상 축소되지 않는 심도가 부호화 심도이므로, 부호화 심도에 대해서 분할 타입 정보, 예측 모드, 변환 단위 크기 정보가 정의될 수 있다. 축소 정보에 따라 한 단계 더 축소되어야 하는 경우에는, 축소된 4개의 상위 심도의 부호화 단위마다 독립적으로 부호화가 수행되어야 한다.
분할 타입 정보는, 부호화 심도의 부호화 단위의 변환 단위의 분할 타입을 2Nx2N, 2NxN, Nx2N 및 NxN 중 하나로 나타낼 수 있다. 예측 모드는, 움직임 예측 모드를 인트라 모드, 인터 모드 및 스킵 모드 중 하나로 나타낼 수 있다. 인트라 모드는 분할 타입 2Nx2N 및 NxN에서만 정의될 수 있으며, 스킵 모드는 분할 타입 2Nx2N에서만 정의될 수 있다. 변환 단위 크기는 인트라 모드에서 두 종류의 크기, 인터 모드에서 두 종류의 크기로 설정될 수 있다.
부호화 단위 내의 최소 부호화 단위마다, 소속되어 있는 부호화 심도의 부호화 단위별 부호화 정보를 수록하고 있을 수 있다. 따라서, 인접한 최소 부호화 단위들끼리 각각 보유하고 있는 부호화 정보들을 확인하면, 동일한 부호화 심도의 부호화 단위에 포함되는지 여부가 확인될 수 있다. 또한, 최소 부호화 단위가 보유하고 있는 부호화 정보를 이용하면 해당 부호화 심도의 부호화 단위를 확인할 수 있으므로, 최대 부호화 단위 내의 부호화 심도들의 분포가 유추될 수 있다.
이하, 도 4의 본 발명의 일 실시예에 따른 영상 부호화 장치(100)의 인트라 예측부(410) 및 도 5의 영상 복호화 장치(200)의 인트라 예측부(550)에서 수행되는 인트라 예측에 대하여 구체적으로 설명한다. 이하의 설명에서, 부호화 단위는 영상의 부호화 단계에서 지칭되는 용어이며, 영상의 복호화 단계의 측면에서 부호화 단위는 복호화 단위로 정의될 수 있다. 즉, 부호화 단위와 복호화 단위라는 용어는 영상의 부호화 단계 및 복호화 단계 중 어느 단계에서 지칭되느냐의 차이만 있을 뿐이며 부호화 단계에서의 부호화 단위는 복호화 단계에서의 복호화 단위로 불리울 수 있다. 용어의 통일성을 위하여 특별한 경우를 제외하고는 부호화 단계 및 복호화 단계에서 동일하게 부호화 단위로 통일하여 부르기로 한다.
도 12a 내지 도 12c는 본 발명의 일 실시예에 따른 휘도 성분 및 색차 성분 영상 부호화 단위의 포맷을 도시한다.
한 프레임을 구성하는 각 부호화 단위는 Y, Cb, Cr로 이루어진 세 개의 성분을 이용하여 표현될 수 있다. Y는 밝기 정보를 갖는 휘도(Luminance) 데이터이며, Cb 및 Cr은 색상 정보를 갖는 색차(chrominance) 데이터이다.
일반적으로 사람의 눈은 색상 정보보다는 밝기 정보에 더 민감하다는 사실에 기초하여 색차 데이터는 휘도 데이터에 비하여 적은 양의 데이터로 표현될 수도 있다. 도 12a를 참조하면, 하나의 부호화 단위는 4:2:0 포맷에 의한 경우 HxW(H 및 W는 양의 정수) 휘도 데이터(Y)(1210)와 색차 성분(Cb,Cr)을 1/4로 샘플링한 두 개의 (H/2)x(W/2) 크기의 색차 데이터(Cb,Cr)(1220,1230)로 구성된다. 도 12b를 참조하면, 하나의 부호화 단위는 4:2:2 포맷에 의할 경우 HxW(H 및 W는 양의 정수) 휘도 데이터(Y)(1240)와 색차 성분(Cb,Cr)을 수평 방향으로 1/2 샘플링한 두 개의 Hx(W/2) 크기의 색차 데이터(Cb,Cr)(1250,1260)로 구성된다. 또한, 도 12c를 참조하면, 색차 성분 영상을 보다 정밀하게 표현하기 위하여 하나의 부호화 단위는 4:4:4 포맷에 의한 경우 색차 성분에 대한 샘플링 과정없이 휘도 데이터(Y)(1270)와 색차 데이터(Cb,Cr)(1280,1290)는 모두 HxW 크기의 영상 데이터로 구성된다.
이하의 설명에서, 인트라 예측되는 휘도 성분 부호화 단위 및 색차 성분 부호화 단위는 YCbCr(또는 YUV) 색 공간에서 정의되는 4:2:0, 4:2:2 및 4:4:4의 컬러 포맷의 영상 신호 중 어느 하나인 것으로 가정한다.
본 발명에 따르면 휘도 성분과 색차 성분의 상관 관계를 고려하여, 휘도 성분 부호화 단위에 대하여 결정된 인트라 예측 모드를 색차 성분 부호화 단위에 적용되는 후보 인트라 예측 모드에 포함시킴으로써 색차 성분 부호화 단위에 대한 예측 효율을 향상시키는 것을 특징으로 한다.
도 13은 본 발명의 일 실시예에 따른 휘도 성분 영상 부호화 단위의 크기에 따른 인트라 예측 모드들의 개수를 도시한다.
본 발명의 일 실시예에 따르면 휘도 성분의 부호화 단위(복호화 단계에서는 복호화 단위)의 크기에 따라서 휘도 성분의 부호화 단위에 적용할 인트라 예측 모드들의 개수를 다양하게 설정할 수 있다. 일 예로 도 13을 참조하면 인트라 예측되는 휘도 성분의 부호화 단위의 크기를 NxN이라고 할 때, 2x2, 4x4, 8x8, 16x16, 32x32, 64x64, 128x128 크기의 휘도 성분 부호화 단위 각각에 대하여 실제 수행되는 인트라 예측 모드의 개수는 각각 5, 9, 9, 17, 33, 5, 5개(Example 2의 경우)로 설정될 수 있다. 이와 같이 휘도 성분 부호화 단위의 크기에 따라서 실제 수행되는 인트라 예측 모드의 개수를 차별화하는 이유는 휘도 성분 부호화 단위의 크기에 따라서 예측 모드 정보를 부호화하기 위한 오버헤드가 다르기 때문이다. 다시 말해서, 작은 크기의 휘도 성분 부호화 단위의 경우 전체 영상에서 차지하는 부분이 작음에도 불구하고 이러한 작은 휘도 성분 부호화 단위의 예측 모드 등의 부가 정보를 전송하기 위한 오버헤드가 증가할 수 있다. 따라서, 작은 휘도 성분 부호화 단위를 너무 많은 예측 모드로 부호화하는 경우 비트량이 증가하여 압축 효율이 저하될 수 있다. 또한, 큰 크기를 갖는 휘도 성분 부호화 단위, 예를 들어 64x64 이상의 크기를 갖는 휘도 성분 부호화 단위는 일반적으로 영상의 평탄한 영역에 대한 부호화 단위로서 선택되는 경우가 많기 때문에, 이러한 평탄한 영역을 부호화하는데 많이 선택되는 큰 크기의 부호화 단위를 너무 많은 예측 모드로 부호화하는 것 역시 압축 효율 측면에서 비효율적일 수 있다.
따라서, 본 발명의 일 실시예에 따르면, 휘도 성분 부호화 단위가 크게 N1xN1(2≤N1≤8, N1은 정수), N2xN2(16≤N2≤32, N2는 정수), N3xN3(64≤N3, N3는 정수)의 적어도 3종류의 크기로 분류되며, N1xN1 크기를 갖는 휘도 성분 부호화 단위마다 수행될 인트라 예측 모드의 개수를 A1(A1은 양의 정수), N2xN2 크기를 갖는 휘도 성분 부호화 단위마다 수행될 인트라 예측 모드의 개수를 A2(A2는 양의 정수), N3xN3 크기를 갖는 휘도 성분 부호화 단위마다 수행될 인트라 예측 모드의 개수를 A3(A3는 양의 정수)라고 할 때, A3≤A1≤A2 관계를 만족하도록 각 휘도 성분 부호화 단위의 크기에 따라서 수행될 인트라 예측 모드의 개수를 설정하는 것이 바람직하다. 즉, 현재 픽처가 작은 크기의 휘도 성분 부호화 단위, 중간 크기의 휘도 성분 부호화 단위, 큰 크기의 휘도 성분 부호화 단위로 크게 분류된다고 할 때, 중간 크기의 휘도 성분 부호화 단위가 가장 많은 수의 예측 모드를 갖으며, 작은 크기의 휘도 성분 부호화 단위 및 큰 크기의 휘도 성분 부호화 단위는 상대적으로 보다 작은 수의 예측 모드를 갖도록 설정하는 것이 바람직하다. 다만, 이에 한정되지 않고 작은 크기 및 큰 크기의 부호화 단위에 대하여도 보다 많은 수의 예측 모드를 갖도록 설정할 수도 있을 것이다. 도 13에 도시된 각 부호화 단위의 크기에 따른 예측 모드의 개수는 일 실시예에 불과하며, 각 부호화 단위의 크기에 따른 예측 모드의 개수는 변경될 수 있다.
도 14a는 본 발명의 일 실시예에 따른 소정 크기의 휘도 성분 부호화 단위에 적용되는 인트라 예측 모드의 일 예를 설명하기 위한 도면이다.
도 13 및 도 14a를 참조하면, 일 예로 4×4 크기를 갖는 휘도 성분 부호화 단위의 인트라 예측시에 수직(Vertical) 모드(모드 0), 수평(Horizontal) 모드(모드 1), DC(Direct Current) 모드(모드 2), 대각선 왼쪽(Diagonal Down-Left) 모드(모드 3), 대각선 오른쪽(Diagonal Down-Right) 모드(모드 4), 수직 오른쪽(Vertical-Right) 모드(모드 5), 수평 아래쪽(Horizontal-Down) 모드(모드 6), 수직 왼쪽( Vertical-Left) 모드(모드 7) 및 수평 위쪽(Horizontal-Up) 모드(모드 8)를 갖을 수 있다.
도 14b는 도 14a의 인트라 예측 모드들의 방향을 나타내는 도면이다. 도 14b에서 화살표의 끝에 있는 숫자는 그 방향으로 예측을 수행할 경우 해당 모드값을 나타낸다. 여기서 모드 2는 방향성이 없는 DC 예측 모드로서 도시되어 있지 않다.
도 14c는 도 14a에 도시된 휘도 성분 부호화 단위에 대한 인트라 예측 방법을 도시한 도면이다.
도 14c를 참조하면, 휘도 성분 부호화 단위의 크기에 의하여 결정된 이용가능한 인트라 예측 모드에 따라서 현재 휘도 성분 부호화 단위의 주변 픽셀인 A - M을 이용하여 예측 부호화 단위를 생성한다. 예를 들어, 도 14a의 모드 0, 즉 수직 모드에 따라, 4×4 크기의 현재 부호화 단위를 예측 부호화하는 동작을 설명한다. 먼저 4×4 크기의 현재 부호화 단위의 위쪽에 인접한 화소 A 내지 D의 화소값을 4×4 현재 부호화 단위의 화소값으로 예측한다. 즉, 화소 A의 값을 4×4 현재 부호화 단위의 첫 번째 열에 포함된 4개의 화소값으로, 화소 B의 값을 4×4 현재 부호화 단위의 두 번째 열에 포함된 4개의 화소값으로, 화소 C의 값을 4×4 현재 부호화 단위의 세 번째 열에 포함된 4개의 화소값으로, 화소 D의 값을 4×4 현재 부호화 단위의 네 번째 열에 포함된 4개의 화소값으로 예측한다. 다음, 상기 화소 A 내지 D를 이용하여 예측된 4×4 현재 부호화 단위와 원래의 4×4 현재 부호화 단위에 포함된 화소의 실제값을 감산하여 오차값을 구한 후 그 오차값을 부호화한다.
도 15는 본 발명의 일 실시예에 따른 소정 크기의 휘도 성분 부호화 단위에 적용되는 인트라 예측 모드의 다른 예를 설명하기 위한 도면이다.
도 13 및 도 15를 참조하면, 일 예로 2×2 크기를 갖는 부호화 단위의 인트라 예측시에 수직(Vertical) 모드, 수평(Horizontal) 모드, DC(Direct Current) 모드, 플레인(plane) 모드 및 대각선 오른쪽(Diagonal Down-Right) 모드의 총 5개의 모드가 존재할 수 있다.
한편, 도 13에 도시된 바와 같이 32x32 크기를 갖는 휘도 성분 부호화 단위가 33개의 인트라 예측 모드를 갖는다고 할 때, 33개의 인트라 예측 모드의 방향을 설정할 필요가 있다. 본 발명의 일 실시예에서는 도 14 및 도 15에 도시된 바와 같은 인트라 예측 모드 이외에, 다양한 방향의 인트라 예측 모드를 설정하기 위하여 휘도 성분 부호화 단위 내의 픽셀을 중심으로 참조 픽셀로서 이용될 주변 픽셀을 선택하기 위한 예측 방향을 dx, dy 파라메터를 이용하여 설정한다. 일 예로, 33개의 예측 모드들을 각각 mode N(N은 0부터 32까지의 정수)이라고 정의할 때, mode 0은 수직 모드, mode 1은 수평 모드, mode 2는 DC 모드, mode 3는 플레인 모드로 설정하고 mode 4 ~ mode31 각각은 다음의 표 1에 표기된 바와 같은 (1,-1), (1,1), (1,2), (2,1), (1,-2), (2,1), (1,-2), (2,-1), (2,-11), (5,-7), (10,-7), (11,3), (4,3), (1,11), (1,-1), (12,-3), (1,-11), (1,-7), (3,-10), (5,-6), (7,-6), (7,-4), (11,1), (6,1), (8,3), (5,3), (5,7), (2,7), (5,-7), (4,-3) 중 하나의 값으로 표현되는 (dx, dy)를 이용하여 tan-1(dy/dx)의 방향성을 갖는 예측 모드로 정의할 수 있다.
mode # dx dy mode # dx dy
mode 4 1 -1 mode 18 1 -11
mode 5 1 1 mode 19 1 -7
mode 6 1 2 mode 20 3 -10
mode 7 2 1 mode 21 5 -6
mode 8 1 -2 mode 22 7 -6
mode 9 2 -1 mode 23 7 -4
mode 10 2 -11 mode 24 11 1
mode 11 5 -7 mode 25 6 1
mode 12 10 -7 mode 26 8 3
mode 13 11 3 mode 27 5 3
mode 14 4 3 mode 28 5 7
mode 15 1 11 mode 29 2 7
mode 16 1 -1 mode 30 5 -7
mode 17 12 -3 mode 31 4 -3
mode 0은 수직 모드, mode 1은 수평 모드, mode 2는 DC 모드, mode 3는 플레인 모드, mode 32는 Bi-linear 모드임.
마지막 mode 32는 도 16을 이용하여 후술되는 바와 같이 쌍선형(bilinear) 보간을 이용하는 쌍선형 모드로 설정될 수 있다.
도 16은 본 발명의 일 실시예에 따른 다양한 방향성을 갖는 인트라 예측 모드들을 설명하기 위한 참조도이다.
표 1을 참조하여 전술한 바와 같이, 본 발명의 일 실시예에 따른 인트라 예측 모드들은 복수 개의 (dx, dy) 파라메터들을 이용하여 tan-1(dy/dx)의 다양한 방향성을 갖을수 있다.
도 16을 참조하면, 현재 휘도 성분 부호화 단위 내부의 예측하고자 하는 현재 픽셀(P)을 중심으로 표 1에 표기된 모드별 (dx, dy)의 값에 따라 정해지는 tan-1(dy/dx)의 각도를 갖는 연장선(150) 상에 위치한 주변 픽셀(A, B)를 현재 픽셀(P)의 예측자로 이용할 수 있다. 이 때, 예측자로서 이용되는 주변 픽셀은 이전에 부호화되고 복원된, 현재 휘도 성분 부호화 단위의 상측 및 좌측의 이전 휘도 성분 부호화 단위의 픽셀인 것이 바람직하다. 또한, 연장선(160)이 정수 위치의 주변 픽셀이 아닌 정수 위치 주변 픽셀의 사이를 통과하는 경우 연장선(160)에 더 가까운 주변 픽셀을 현재 픽셀(P)의 예측자로 이용할 수 있다. 또한, 도시된 바와 같이 연장선(160)과 만나는 상측의 주변 픽셀(A) 및 좌측의 주변 픽셀(B)의 두 개의 주변 픽셀이 존재하는 경우 상측의 주변 픽셀(A) 및 좌측의 주변 픽셀(B)의 평균값을 현재 픽셀(P)의 예측자로 이용하거나, 또는 dx*dy 값이 양수인 경우에는 상측의 주변 픽셀(A)을 이용하고 dx*dy 값이 음수인 경우에는 좌측의 주변 픽셀(B)을 이용할 수 있다.
표 1에 표기된 바와 같은 다양한 방향성을 갖는 인트라 예측 모드는 부호화단과 복호화단에서 미리 설정되어서, 각 휘도 성분 부호화 단위마다 설정된 인트라 예측 모드의 해당 인덱스만이 전송되도록 하는 것이 바람직하다.
도 17은 본 발명의 일 실시예에 따른 쌍선형 모드를 설명하기 위한 참조도이다.
도 17을 참조하면, 쌍선형(Bi-linear) 모드는 현재 휘도 성분 부호화 단위 내부의 예측하고자 하는 현재 픽셀(P)를 중심으로 현재 픽셀(P)와 그 상하좌우 경계의 픽셀값, 현재 픽셀(P)의 상하좌우 경계까지의 거리를 고려한 기하 평균값을 계산하여 그 결과값을 현재 픽셀(P)의 예측자로 이용하는 것이다. 즉, 쌍선형 모드에서는 현재 픽셀(P)의 예측자로서 현재 픽셀(P)의 상하좌우 경계에 위치한 픽셀 A(171), 픽셀 B(172), 픽셀 D(176) 및 픽셀 E(177)과 현재 픽셀(P)의 상하좌우 경계까지의 거리의 기하 평균값을 이용한다. 이 때, 쌍선형 모드 역시 인트라 예측 모드 중의 하나이므로 예측시의 참조 픽셀로서 이전에 부호화된 후 복원된 상측과 좌측의 주변 픽셀을 이용하여야 한다. 따라서, 픽셀 A(171) 및 픽셀 B(172)로서 현재 휘도 성분 부호화 단위 내부의 해당 픽셀값을 그대로 이용하는 것이 아니라 상측 및 좌측의 주변 픽셀을 이용하여 생성된 가상의 픽셀값을 이용한다.
구체적으로, 먼저 다음의 수학식 1과 같이 현재 휘도 성분 부호화 단위에 인접한 상측 최좌측의 주변 픽셀(RightUpPixel, 164) 및 좌측 최하측의 주변 픽셀(LeftDownPixel,175)의 평균값을 계산함으로써 현재 휘도 성분 부호화 단위의 우측 최하단 위치의 가상의 픽셀 C(173)을 계산한다.
[수학식 1]
C=0.5(LeftDownPixel+RightUpPixel)
다음 현재 픽셀(P)의 좌측 경계까지의 거리(W1) 및 우측 경계까지의 거리(W2)를 고려하여 현재 픽셀(P)를 하단으로 연장하였을 때 최하측 경계선에 위치하는 가상의 픽셀 A(161)의 값을 다음의 수학식 2와 같이 계산한다.
[수학식 2]
A=(C*W1+LeftDownPixel*W2)/(W1+W2)
유사하게 현재 픽셀(P)의 상측 경계까지의 거리(h1) 및 하측 경계까지의 거리(h2)를 고려하여 현재 픽셀(P)를 우측으로 연장하였을 때 최우측 경계선에 위치하는 가상의 픽셀 B(162)의 값을 다음의 수학식 3과 같이 계산한다.
[수학식 3]
B=(C*h1+RightUpPixel*h2)/(h1+h2)
수학식 1 내지 3을 이용하여 현재 픽셀 P(170)의 하측 경계선상의 가상의 픽셀 A(171) 및 우측 경계선상의 가상의 픽셀 B(172)의 값이 결정되면 A+B+D+E의 평균값을 현재 픽셀 P(170)의 예측자로서 이용할 수 있다. 이와 같은 쌍선형 예측 과정은 현재 휘도 성분 부호화 단위 내부의 모든 픽셀에 대하여 적용되어, 쌍선형 예측 모드에 따른 현재 휘도 성분 부호화 단위의 예측 부호화 단위가 생성된다.
본 발명의 일 실시예에 따르면 휘도 성분 부호화 단위의 크기에 따라서 다양하게 설정된 인트라 예측 모드들에 따라서 예측 부호화를 수행함으로써 영상의 특성에 따라서 보다 효율적인 압축을 가능하게 한다.
한편, 인트라 예측을 통해 부호화된 휘도 성분 부호화 단위를 복호화하기 위해서는 현재 휘도 성분 부호화 단위가 어떠한 인트라 예측 모드를 통해 부호화되었는지에 대한 예측 모드 정보가 필요하다. 따라서, 영상의 부호화시에 현재 휘도 성분 부호화 단위의 인트라 예측 모드에 관한 정보를 비트스트림에 부가하는데, 각 휘도 성분 부호화 단위마다 인트라 예측 모드 정보를 그대로 비트스트림에 부가하는 경우 오버헤드가 증가되어 압축 효율이 낮아질 수 있다.
따라서, 본 발명의 일 실시예에서는 현재 휘도 성분 부호화 단위의 부호화 결과 결정된 현재 휘도 성분 부호화 단위의 인트라 예측 모드에 관한 정보를 그대로 전송하는 것이 아니라, 주변 휘도 성분 부호화 단위로부터 예측된 인트라 예측 모드의 예측값과 실제 인트라 예측 모드의 차이값만을 전송한다.
도 18은 본 발명의 일 실시예에 따라서 현재 휘도 성분 부호화 단위의 인트라 예측 모드의 예측값을 생성하는 과정을 설명하기 위한 도면이다.
도 18을 참조하면, 현재 휘도 성분 부호화 단위를 A(180)라고 할 때, 현재 휘도 성분 부호화 단위 A(180)의 인트라 예측 모드는 주변 휘도 성분 부호화 단위들에서 결정된 인트라 예측 모드로부터 예측될 수 있다. 예를 들어, 현재 휘도 성분 부호화 단위 A(180)의 좌측 휘도 성분 부호화 단위 B(181)의 결정된 인트라 예측 모드가 mode 3이며, 상측 휘도 성분 부호화 단위 C(182)의 인트라 예측 모드가 mode 4라고 하면, 현재 휘도 성분 부호화 단위 A(180)의 인트라 예측 모드는 상측 휘도 성분 부호화 단위 C(182) 및 좌측 휘도 성분 부호화 단위 B(181)의 예측 모드 중 작은값을 갖는 mode 3으로 예측될 수 있다. 만약, 현재 휘도 성분 부호화 단위 A(180)에 대한 실제 인트라 예측 부호화 결과 결정된 인트라 예측 모드가 mode 4라면, 인트라 예측 모드 정보로서 주변 휘도 성분 부호화 단위들로부터 예측된 인트라 예측 모드의 값인 mode 3과의 차이인 1만을 전송하고, 복호화시 전술한 바와 동일한 방법으로 현재 휘도 성분 복호화 단위의 인트라 예측 모드의 예측값을 생성하고 비트스트림을 통해 전송된 모드 차이값을 인트라 예측 모드의 예측값에 가산하여 현재 휘도 성분 복호화 단위에 실제 적용된 인트라 예측 모드 정보를 획득할 수 있다. 전술한 설명에서는 현재 휘도 성분 부호화 단위의 상측 및 좌측에 위치한 주변 부호화 단위만을 이용하는 것을 중심으로 설명하였으나, 이외에도 도 18의 E 및 D와 같은 다른 주변 휘도 성분 부호화 단위를 이용하여 현재 휘도 성분 부호화 단위 A(180)의 인트라 예측 모드를 예측할 수 있을 것이다. 전술한 휘도 성분 부호화 단위의 인트라 예측 모드 과정은 후술되는 색차 성분 부호화 단위에 대하여 결정된 인트라 예측 모드를 예측하는데도 적용될 수 있다.
한편, 휘도 성분 부호화 단위들의 크기에 따라서 실제 수행되는 인트라 예측 모드들이 다르기 때문에 주변 휘도 성분 부호화 단위들로부터 예측된 인트라 예측 모드는 현재 휘도 성분 부호화 단위의 인트라 예측 모드와 매칭되지 않을 수 있다. 따라서, 서로 다른 크기를 갖는 주변 휘도 성분 부호화 단위들로부터 현재 휘도 성분 부호화 단위의 인트라 예측 모드를 예측하기 위해서는 서로 다른 인트라 예측 모드를 갖는 휘도 성분 부호화 단위들 사이의 인트라 예측 모드들을 통일시키는 매핑(mapping) 과정이 필요하다.
도 19는 본 발명의 일 실시예에 따라서 서로 다른 크기를 갖는 휘도 성분 부호화 단위들 사이의 인트라 예측 모드의 매핑 과정을 설명하기 위한 참조도이다.
도 19를 참조하면, 현재 휘도 성분 부호화 단위 A(190)는 16x16 크기, 좌측 휘도 성분 부호화 단위 B(191)는 8x8 크기, 상측 휘도 성분 부호화 단위 C(192)는 4x4의 크기를 갖는다고 가정한다. 또한, 전술한 도 13의 제 1 예와 같이, 4x4, 8x8, 16x16 크기의 휘도 성분 부호화 단위들에서 이용가능한 인트라 예측 모드의 개수는 각각 9, 9, 33개로 차이가 난다고 가정한다. 이 경우, 좌측 휘도 성분 부호화 단위 B(191) 및 상측 휘도 성분 부호화 단위 C(192)에서 이용가능한 인트라 예측 모드와 현재 휘도 성분 부호화 단위 A(190)에서 이용가능한 인트라 예측 모드는 다르기 때문에, 좌측 휘도 성분 부호화 단위 B(191) 및 상측 휘도 성분 부호화 단위 C(192)들로부터 예측된 인트라 예측 모드는 현재 휘도 성분 부호화 단위 A(190)의 인트라 예측 모드의 예측값으로 이용하기에 적합하지 않다. 따라서, 본 발명의 일 실시예에 따르면, 주변 휘도 성분 부호화 단위들 B 및 C(191,192)의 인트라 예측 모드를 소정 개수의 대표 인트라 예측 모드들 중 가장 유사한 방향의 제 1 및 제 2 대표 인트라 예측 모드들로 각각 변경하고 제 1 및 제 2 대표 인트라 예측 모드 중 더 작은 모드값을 갖는 최종적인 대표 인트라 예측 모드로 선택한다. 그리고, 현재 휘도 성분 부호화 단위 A(190)의 크기에 따라 이용가능한 인트라 예측 모드들 중 선택된 대표 인트라 예측 모드와 가장 유사한 방향을 갖는 인트라 예측 모드를 현재 휘도 성분 부호화 단위의 인트라 예측 모드로 예측한다.
도 20은 본 발명의 일 실시예에 따라서 주변 휘도 성분 부호화 단위의 인트라 예측 모드들을 대표 인트라 예측 모드들 중 하나로 매핑하는 과정을 설명하기 위한 참조도이다. 도 20에서는 대표 인트라 예측 모드들로서 수직 모드, 수평 모드, DC(Direct Current) 모드, 대각선 왼쪽 모드, 대각선 오른쪽 모드, 수직 오른쪽 모드, 수직 왼쪽 모드, 수평 위쪽 모드 및 수평 아래쪽 모드들이 설정된 경우를 도시하고 있다. 그러나, 대표 인트라 예측 모드는 도시된 바에 한정되지 않고 다양한 개수의 방향성을 갖도록 설정될 수 있다.
도 20을 참조하면, 미리 소정 개수의 대표 인트라 예측 모드들을 설정하고, 주변 휘도 성분 부호화 단위의 인트라 예측 모드를 가장 유사한 방향의 대표 인트라 예측 모드로 매핑한다. 예를 들어, 상측 휘도 성분 부호화 단위(A)의 결정된 인트라 예측 모드가 MODE_A(200)로 도시된 방향성을 갖으면, 상측 휘도 성분 부호화 단위(A)의 인트라 예측 모드 MODE_A(200)는 9개의 미리 설정된 대표 인트라 예측 모드 1 내지 9 중에서 가장 유사한 방향을 갖는 MODE 1로 매핑된다. 유사하게 좌측 휘도 성분 부호화 단위(B)의 결정된 인트라 예측 모드가 MODE_B(201)로 도시된 방향성을 갖으면, 좌측 휘도 성분 부호화 단위(B)의 인트라 예측 모드 MODE_B(191)는 9개의 미리 설정된 대표 인트라 예측 모드 1 내지 9 중에서 가장 유사한 방향을 갖는 MODE 5로 매핑된다.
다음 제 1 대표 인트라 예측 모드 및 제 2 대표 인트라 예측 모드 중에서 더 작은 모드값을 갖는 인트라 예측 모드가 최종적인 주변 휘도 성분 부호화 단위의 대표 인트라 예측 모드로 선택된다. 이와 같이 더 작은 모드값을 갖는 대표 인트라 예측 모드를 선택하는 이유는 일반적으로 더 자주 발생하는 인트라 예측 모드들에게 더 작은 모드값이 설정되어 있기 때문이다. 즉, 주변 휘도 성분 부호화 단위들로부터 서로 다른 인트라 예측 모드가 예측된 경우 더 작은 모드값을 갖는 인트라 예측 모드가 더 발생 확률이 큰 예측 모드이기 때문에, 서로 다른 예측 모드가 경합하는 경우 현재 휘도 성분 부호화 단위의 예측 모드의 예측자로서 더 작은 모드값을 갖는 예측 모드를 선택하는 것이 바람직하다.
주변 휘도 성분 부호화 단위로부터 대표 인트라 예측 모드가 선택되더라도 대표 인트라 예측 모드를 현재 휘도 성분 부호화 단위의 인트라 예측 모드의 예측자로서 그대로 이용할 수 없는 경우가 있다. 전술한 도 19와 같이 현재 휘도 성분 부호화 단위 A(190)가 33개의 인트라 예측 모드를 갖으며 대표 인트라 예측 모드는 오직 9개의 인트라 예측 모드를 갖는다면, 대표 인트라 예측 모드에 대응되는 현재 휘도 성분 부호화 단위 A(190)의 인트라 예측 모드는 존재하지 않는다. 이와 같은 경우, 전술한 주변 휘도 성분 부호화 단위의 인트라 예측 모드를 대표 인트라 예측 모드로 매핑하는 것과 유사하게, 현재 휘도 성분 부호화 단위의 크기에 따른 인트라 예측 모드들 중 선택된 대표 인트라 예측 모드와 가장 유사한 방향을 갖는 인트라 예측 모드를 현재 휘도 성분 부호화 단위의 인트라 예측 모드 예측자로서 최종적으로 선택할 수 있다. 예를 들어, 도 20에서 주변 휘도 성분 부호화 단위로부터 최종적으로 선택된 대표 인트라 예측 모드가 mode 1이라고 한다면, 현재 휘도 성분 부호화 단위의 크기에 따라 이용가능한 인트라 예측 모드들 중 mode 1과 가장 유사한 방향성을 갖는 인트라 예측 모드가 현재 휘도 성분 부호화 단위의 인트라 예측 모드의 예측자로 최종 선택된다.
도 21은 본 발명의 일 실시예에 따라서 색차 성분 부호화 단위에 적용되는 후보 인트라 예측 모드의 일 예를 설명하기 위한 도면이다.
도 21을 참조하면, 색차 성분 부호화 단위의 인트라 예측시에 적용되는 후보 인트라 예측 모드는 수직(Vertical) 모드, 수평(Horizontal) 모드, DC(Direct Current) 모드, 플레인(plane) 모드에 부가하여 전술한 바와 같이 현재 색차 성분 부호화 단위와 대응되는 휘도 성분 부호화 단위에 대하여 최종적으로 결정된 인트라 예측 모드가 포함된다. 또한, 전술한 바와 같이 인트라 예측되는 휘도 성분 부호화 단위 및 색차 성분 부호화 단위는 YCbCr(또는 YUV) 색 공간에서 정의되는 4:2:0, 4:2:2 및 4:4:4의 컬러 포맷의 영상 신호 중 어느 하나일 수 있다. 휘도 성분 부호화 단위의 인트라 예측 모드는 RD 코스트(Rate-Distortion Cost)와 같은 코스트 계산에 기초하여 이용가능한 복수 개의 인트라 예측 모드 중 최소 코스트를 갖는 인트라 예측 모드가 최종 인트라 예측 모드로 결정된다. 색차 성분 부호화 단위의 인트라 예측 모드는 전술한 수직 모드, 수평 모드, DC 모드, 플레인 모드 및 현재 색차 성분 부호화 단위와 대응되는 휘도 성분 부호화 단위에 대하여 최종적으로 결정된 인트라 예측 모드를 적용하여 각 인트라 예측 모드에 따른 코스트를 계산하고, 최소 코스트를 갖는 인트라 예측 모드가 색차 성분 부호화 단위의 최종 인트라 예측 모드로 결정된다.
도 22는 본 발명의 일 실시예에 따른 영상의 인트라 예측 장치를 나타낸 블록도이다. 본 발명의 일 실시예에 따른 영상의 인트라 예측 장치(2200)는 도 4의 영상 부호화 장치(400)의 인트라 예측부(410) 및 도 5의 영상 복호화 장치(500)의 인트라 예측부(550)로서 동작할 수 있다.
도 22를 참조하면, 인트라 예측 장치(2200)는 휘도 인트라 예측부(2210) 및 색차 인트라 예측부(2220)를 포함한다. 휘도 인트라 예측부(2210)는 전술한 바와 같이 최대 부호화 단위 및 심도에 기초하여 분할된 각 휘도 성분 부호화 단위의 크기에 따라서 현재 휘도 성분 부호화 단위의 크기에 따라서 적용될 인트라 예측 모드 후보들을 선택하고, 결정된 인트라 예측 모드 후보들을 휘도 성분 부호화 단위에 적용하여 각 휘도 성분 부호화 단위에 대한 인트라 예측을 수행한다. 휘도 인트라 예측부(2200)는 인트라 예측 결과 생성된 예측 부호화 단위와 원래 휘도 성분 부호화 단위 사이의 오차값에 따른 코스트에 기초하여 최소 코스트를 갖는 최적의 인트라 예측 모드를 휘도 성분 부호화 단위의 최종 인트라 예측 모드로 결정한다.
색차 인트라 예측부(2220)는 수직 모드, 수평 모드, DC 모드, 플레인 모드 및 현재 색차 성분 부호화 단위와 대응되는 휘도 성분 부호화 단위에 대하여 최종적으로 결정된 인트라 예측 모드를 적용하여 각 인트라 예측 모드에 따른 코스트를 계산하고, 최소 코스트를 갖는 인트라 예측 모드를 색차 성분 부호화 단위의 최종 인트라 예측 모드로 결정한다.
한편, 도 22에 도시된 인트라 예측 장치(2200)가 복호화 장치에 이용되는 경우, 도 5의 엔트로피 복호화부(520)에 의하여 부호화된 비트스트림으로부터 추출된 최대 부호화 단위, 최대 부호화 단위의 계층적 분할 정보인 심도 정보를 이용하여 현재 휘도 성분 및 색차 성분의 복호화 단위의 크기를 결정하고, 현재 휘도 성분 및 색차 성분의 복호화 단위에 적용된 인트라 예측 모드 정보를 이용하여 수행될 인트라 예측 모드를 결정한다. 또한, 인트라 예측 장치(2200)은 추출된 인트라 예측 모드에 따라서 각 휘도 성분 및 색차 성분의 복호화 단위에 대한 인트라 예측를 수행하여 예측 복호화 단위를 생성한다. 예측 복호화 단위는 비트스트림으로부터 복원된 레지듀얼 데이터와 더하여져서 휘도 성분 및 색차 성분의 복호화 단위에 대한 복호화가 수행된다.
도 23은 본 발명의 일 실시예에 따른 영상 부호화 단위에 대한 인트라 예측 모드 결정 방법을 나타낸 플로우 차트이다.
도 23을 참조하면, 단계 2310에서 최대 크기를 갖는 부호화 단위인 최대 부호화 단위 및 최대 부호화 단위의 계층적 분할 정보인 심도에 기초하여 휘도 성분의 현재 픽처를 적어도 하나의 부호화 단위로 분할한다.
단계 2320에서 분할된 휘도 성분의 부호화 단위의 인트라 예측 모드를 결정한다. 전술한 바와 같이, 휘도 성분의 부호화 단위의 인트라 예측 모드는 분할된 각 휘도 성분 부호화 단위의 크기에 따라서 적용될 인트라 예측 모드 후보들을 선택하고, 인트라 예측 모드 후보들을 휘도 성분 부호화 단위에 적용하여 각 휘도 성분 부호화 단위에 대한 인트라 예측을 수행한 다음 최소 코스트를 갖는 최적의 인트라 예측 모드를 휘도 성분 부호화 단위의 최종 인트라 예측 모드로 결정한다.
단계 2330에서 결정된 휘도 성분의 부호화 단위의 인트라 예측 모드를 포함하는 색차 성분의 부호화 단위의 후보 인트라 예측 모드들을 결정한다. 전술한 바와 같이 색차 성분 부호화 단위에 적용되는 후보 인트라 예측 모드들은 대응되는 휘도 성분 부호화 단위에서 결정된 최종 인트라 예측 모드 이외에 수직 모드, 수평 모드, DC 모드, 플레인 모드를 포함한다.
단계 2340에서, 결정된 후보 인트라 예측 모드들에 따른 색차 성분의 부호화 단위의 코스트를 비교하여 최소 코스트를 갖는 색차 성분의 부호화 단위의 인트라 예측 모드를 결정한다.
도 24는 본 발명의 일 실시예에 따른 영상 복호화 단위의 인트라 예측 모드 결정 방법을 나타낸 플로우 차트이다.
도 24를 참조하면, 단계 2410에서 부호화된 비트스트림으로부터 최대 크기를 갖는 부호화 단위인 최대 부호화 단위 및 상기 최대 부호화 단위의 계층적 분할 정보인 심도 정보를 추출한다.
단계 2420에서 추출된 최대 부호화 단위 및 심도에 기초하여 복호화되는 현재 픽처의 휘도 성분 및 색차 성분을 복호화 단위로 분할한다.
단계 2430에서 비트스트림으로부터 분할된 휘도 성분 및 색차 성분의 복호화 단위에 적용된 인트라 예측 모드 정보를 추출한다.
단계 2440에서, 추출된 인트라 예측 모드에 따라서 휘도 성분 및 색차 성분의 복호화 단위에 대한 인트라 예측를 수행하여 휘도 성분 및 색차 성분 복호화 단위를 복호화한다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
100: 영상 부호화 장치 110: 최대 부호화 단위 분할부
120: 부호화 심도 결정부 130: 영상 데이터 부호화부
140: 부호화 정보 부호화부 200:영상 복호화 장치
210: 영상 데이터 획득부 220:부호화 정보 추출부
230;영상 데이터 복호화부 310,320,330: 비디오 데이터
400: 영상 부호화부 410:인트라 예측부
420: 움직임 추정부 425:움직임 보상부
430: 주파수 변환부 440: 양자화부
450: 엔트로피 부호화부 460: 역양자화부
470: 주파수 역변환부 480:디블로킹부
490: 루프 필터링부 500:영상 복호화부
510: 파싱부 520: 엔트로피 복호화부
530: 역양자화부 540: 주파수 역변환부
550: 인트라 예측부 560: 움직임 보상부
570: 디블로킹부 580:루프 필터링부
600: 부호화 단위의 계층 구조 610: 최대 부호화 단위
620: 심도 1의 부호화 단위 630: 심도 2의 부호화 단위
640: 심도 3의 부호화 단위 650: 심도 4의 부호화 단위
2200:인트라 예측 장치 2210:휘도 인트라 예측부(2210)
2220:색차 인트라 예측부

Claims (2)

  1. 휘도 블록의 인트라 예측 모드를 가리키는 제 1 정보를 비트스트림으로부터 획득하는 단계;
    상기 휘도 블록에 대응되는 색차 블록의 인트라 예측 모드를 가리키는 제 2 정보를 상기 비트스트림으로부터 획득하는 단계;
    상기 휘도 블록의 인트라 예측 모드에 기초하여 상기 휘도 블록에 대한 인트라 예측을 수행하는 단계; 및
    상기 색차 블록의 인트라 예측 모드에 기초하여 상기 색차 블록에 대한 인트라 예측을 수행하는 단계를 포함하며,
    상기 휘도 블록의 인트라 예측 모드는 복수 개의 방향들 중 특정 방향을 포함하며, 상기 특정 방향은 수평 방향의 dx(dx는 정수) 및 수직 방향의 dy(dy는 정수) 중 적어도 하나에 의하여 가리켜지며,
    상기 휘도 블록에 대한 인트라 예측을 수행하는 단계는
    현재 픽셀의 위치 및 상기 제 1 정보에 기초한 상기 휘도 블록의 인트라 예측 모드가 가리키는 특정 방향에 따라서, 상기 휘도 블록의 좌측 또는 상측에 위치한 주변 픽셀의 개수를 결정하는 단계;
    상기 주변 픽셀의 개수가 1개로 결정된 경우, 1개의 주변 픽셀에 기초하여 현재 픽셀의 예측값을 획득하는 단계; 및
    상기 주변 픽셀의 개수가 2개로 결정된 경우, 2개의 주변 픽셀들의 가중 평균값에 기초하여 상기 현재 픽셀의 예측값을 획득하는 단계를 포함하며,
    상기 가중 평균값은 상기 dx 및 dy 중 적어도 하나와 상기 현재 픽셀의 위치에 기초하여 결정된 가중치를 이용하며,
    상기 색차 블록에 대한 인트라 예측을 수행하는 단계는
    상기 제 2 정보에 기초하여, 상기 휘도 블록의 인트라 예측 모드를 포함하는 복수 개의 인트라 예측 모드들 중 상기 색차 블록의 인트라 예측 모드를 결정하며, 상기 제 2 정보가 상기 휘도 블록의 인트라 예측 모드와 동일함을 나타낼 경우, 상기 색차 블록의 인트라 예측 모드를 상기 휘도 블록의 인트라 예측 모드와 동일하게 결정하며,
    영상은 최대 부호화 단위의 크기에 관한 정보에 따라 복수의 최대 부호화 단위들로 분할되고,
    상기 복수의 최대 부호화 단위들 중 하나의 최대 부호화 단위는 축소 정보에 기초하여, 심도를 갖는 다수의 부호화 단위들로 계층적으로 분할되고,
    현재 심도의 부호화 단위는 하위 심도의 부호화 단위로부터 분할된 정사각 데이터 단위들 중 하나이고,
    상기 축소 정보가 상기 현재 심도에서 분할됨을 나타내는 경우에, 상기 현재 심도의 부호화 단위는 주변 부호화 단위들과 독립적으로, 상위 심도의 부호화 단위들로 분할되고,
    상기 축소 정보가 상기 현재 심도에서 분할되지 않음을 나타내는 경우에, 상기 현재 심도의 부호화 단위로부터 적어도 하나의 예측 단위가 획득되며,
    상기 휘도 블록은 상기 현재 심도의 부호화 단위로부터 획득된 적어도 하나의 예측 단위 중 하나이며,
    상기 현재 심도의 부호화 단위로부터 역변환을 위한 적어도 하나의 변환 단위가 획득되는 것을 특징으로 하는 영상 복호화 방법.
  2. 휘도 블록의 인트라 예측 모드를 가리키는 제 1 정보 및 상기 휘도 블록에 대응되는 색차 블록의 인트라 예측 모드를 가리키는 제 2 정보를 획득하는 엔트로피 복호화부; 및
    상기 휘도 블록의 인트라 예측 모드에 기초하여 상기 휘도 블록에 대한 인트라 예측을 수행하고, 상기 색차 블록의 인트라 예측 모드에 기초하여 상기 색차 블록에 대한 인트라 예측을 수행하는 인트라 예측 수행부를 포함하며,
    상기 휘도 블록의 인트라 예측 모드는 복수 개의 방향들 중 특정 방향을 포함하며, 상기 특정 방향은 수평 방향의 dx(dx는 정수) 및 수직 방향의 dy(dy는 정수) 중 적어도 하나에 의하여 가리켜지며,
    상기 인트라 예측 수행부는
    현재 픽셀의 위치 및 상기 제 1 정보에 기초한 상기 휘도 블록의 인트라 예측 모드가 가리키는 특정 방향에 따라서, 상기 휘도 블록의 좌측 또는 상측에 위치한 주변 픽셀의 개수를 결정하며,
    상기 주변 픽셀의 개수가 1개로 결정된 경우, 1개의 주변 픽셀에 기초하여 현재 픽셀의 예측값을 획득하며,
    상기 주변 픽셀의 개수가 2개로 결정된 경우, 2개의 주변 픽셀들의 가중 평균값에 기초하여 상기 현재 픽셀의 예측값을 획득하며,
    상기 제 2 정보에 기초하여, 상기 휘도 블록의 인트라 예측 모드를 포함하는 복수 개의 인트라 예측 모드들 중 상기 색차 블록의 인트라 예측 모드를 결정하며, 상기 제 2 정보가 상기 휘도 블록의 인트라 예측 모드와 동일함을 나타낼 경우, 상기 색차 블록의 인트라 예측 모드를 상기 휘도 블록의 인트라 예측 모드와 동일하게 결정하며,
    상기 가중 평균값은 상기 dx 및 dy 중 적어도 하나와 상기 현재 픽셀의 위치에 기초하여 결정된 가중치를 이용하여 획득되며,
    영상은 최대 부호화 단위의 크기에 관한 정보에 따라 복수의 최대 부호화 단위들로 분할되고,
    상기 복수의 최대 부호화 단위들 중 하나의 최대 부호화 단위는 축소 정보에 기초하여, 심도를 갖는 다수의 부호화 단위들로 계층적으로 분할되고,
    현재 심도의 부호화 단위는 하위 심도의 부호화 단위로부터 분할된 정사각 데이터 단위들 중 하나이고,
    상기 축소 정보가 상기 현재 심도에서 분할됨을 나타내는 경우에, 상기 현재 심도의 부호화 단위는 주변 부호화 단위들과 독립적으로, 상위 심도의 부호화 단위들로 분할되고,
    상기 축소 정보가 상기 현재 심도에서 분할되지 않음을 나타내는 경우에, 상기 현재 심도의 부호화 단위로부터 적어도 하나의 예측 단위가 획득되며,
    상기 휘도 블록은 상기 현재 심도의 부호화 단위로부터 획득된 적어도 하나의 예측 단위 중 하나이며,
    상기 현재 심도의 부호화 단위로부터 역변환을 위한 적어도 하나의 변환 단위가 획득되는 것을 특징으로 하는 영상 복호화 장치.
KR1020160141164A 2016-10-27 2016-10-27 영상 복호화 방법 및 장치 KR101725287B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160141164A KR101725287B1 (ko) 2016-10-27 2016-10-27 영상 복호화 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160141164A KR101725287B1 (ko) 2016-10-27 2016-10-27 영상 복호화 방법 및 장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020140148755A Division KR101671933B1 (ko) 2014-10-29 2014-10-29 영상 복호화 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020170043784A Division KR101775030B1 (ko) 2017-04-04 2017-04-04 영상 복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20160129802A KR20160129802A (ko) 2016-11-09
KR101725287B1 true KR101725287B1 (ko) 2017-04-10

Family

ID=57529187

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160141164A KR101725287B1 (ko) 2016-10-27 2016-10-27 영상 복호화 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101725287B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220004765A (ko) 2019-06-24 2022-01-11 엘지전자 주식회사 크로마 변환 블록의 최대 크기 제한을 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008172599A (ja) 2007-01-12 2008-07-24 Mitsubishi Electric Corp 動画像符号化装置、動画像復号装置、動画像符号化方法、および動画像復号方法
JP2009527169A (ja) 2006-02-17 2009-07-23 トムソン ライセンシング イントラ予測モードを使用した画像符号化方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101246915B1 (ko) * 2005-04-18 2013-03-25 삼성전자주식회사 동영상 부호화 또는 복호화 방법 및 장치
KR101291196B1 (ko) * 2008-01-25 2013-07-31 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009527169A (ja) 2006-02-17 2009-07-23 トムソン ライセンシング イントラ予測モードを使用した画像符号化方法
JP2008172599A (ja) 2007-01-12 2008-07-24 Mitsubishi Electric Corp 動画像符号化装置、動画像復号装置、動画像符号化方法、および動画像復号方法

Also Published As

Publication number Publication date
KR20160129802A (ko) 2016-11-09

Similar Documents

Publication Publication Date Title
KR101503269B1 (ko) 영상 부호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치, 및 영상 복호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치
KR101452860B1 (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR101989160B1 (ko) 영상 부호화 방법 및 장치
KR101671935B1 (ko) 영상 복호화 방법 및 장치
KR101607613B1 (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR101883430B1 (ko) 영상 부호화 방법 및 장치, 그 기록매체
KR101725287B1 (ko) 영상 복호화 방법 및 장치
KR101761278B1 (ko) 영상 복호화 방법 및 장치
KR20150045980A (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR101607614B1 (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR101607611B1 (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR101775030B1 (ko) 영상 복호화 방법 및 장치
KR101606683B1 (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR101649276B1 (ko) 영상의 복호화 방법 및 장치
KR101699529B1 (ko) 영상의 복호화 방법 및 장치
KR101703332B1 (ko) 영상의 복호화 방법 및 장치
KR101671934B1 (ko) 영상 복호화 방법 및 장치
KR20150035932A (ko) 영상 부호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치, 및 영상 복호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치
KR101671933B1 (ko) 영상 복호화 방법 및 장치
KR101886259B1 (ko) 영상 부호화 방법 및 장치, 및 부호화된 비트스트림을 포함하는 기록 매체
KR101989997B1 (ko) 영상의 부호화 방법 및 장치, 및 컴퓨터로 판독 가능한 기록 매체
KR101824056B1 (ko) 영상의 복호화 방법 및 장치
KR101606853B1 (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR20150092063A (ko) 영상의 복호화 방법 및 장치
KR101700369B1 (ko) 영상의 복호화 방법 및 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant