KR102323427B1

KR102323427B1 - 영상 부호화 방법 및 장치

Info

Publication number: KR102323427B1
Application number: KR1020210050298A
Authority: KR
Inventors: 최윤식; 이호동; 홍순기
Original assignee: 연세대학교 산학협력단
Priority date: 2012-06-28
Filing date: 2021-04-19
Publication date: 2021-11-09
Also published as: KR102138828B1; KR102244315B1; KR20200090716A; KR20210044765A; KR20190122615A; KR102039039B1; KR20140008984A

Abstract

본 발명은 영상 부호화 방법에 관한 것으로, 보다 상세하게는 현재 코딩유닛의 적어도 하나의 주변 코딩유닛 깊이정보와 임계치를 비교하는 단계와, 상기 비교단계의 결과에 따라 코딩유닛의 분할작업을 수행하는 단계를 포함하여, 코딩과정에서의 복잡도를 감소시킴으로써 고속으로 영상을 부호화할 수 있는 영상 부호화 방법을 제공한다.

Description

영상 부호화 방법 및 장치{Method and Apparatus for image encoding}

본 발명은 영상 부호화 방법 및 장치에 관한 것이다.

H.264/AVC 는 고성능의 압축 효율을 갖는 비디오 압축 표준 기술이다. H.264/AVC 에서는 영상 내의 상관성을 제거하기 위한 화면 내 예측 기술, 영상 간의 상관성을 제거하기 위한 화면 간 예측 기술을 통하여 원본 신호를 예측 부호화할 수 있다. H.264/AVC의 부호화기는 원본 신호와 예측 신호의 차이 값인 차분 값에 대하여 이산 여현 변환 부호화와 양자화를 수행한다. 그리고 양자화된 신호는 지그재그 스캐닝 방법으로 정렬된 후 엔트로피부호화된다.

최근에 ITU-T VCEG(Video Coding Experts Group)와 ISO/IEC MPEG(Moving Picture Experts Group)은 JCT-VC(Joint Collaborative Team on Video Coding)을 구성하여 새로운 영상 압축 표준인 HEVC(High Efficiency Video Coding)의 표준화를 진행 중이며, 이는 기존에 제정된 표준인 H.264/AVC에 비교하여 현재 약 40% 이상의 압축 효율의 향상이 달성되어 있는 것으로 알려져 있다. H.264/AVC와 HEVC는 기본적으로 블록 기반의 영상 부호화기이라는 점은 동일하지만 16x16의 고정된 크기인 MB(Macro Block) 단위의 부호화를 수행하는 H.264/AVC와는 다르게 HEVC는 Common test condition 내에서 최대 64x64 크기로부터 8x8 크기까지의 다양한 크기를 갖는 CU(Coding Unit)의 기반에 따른 부호화를 수행한다.

그러나 현재까지 표준화가 진행된 HEVC는 압축 효율은 우수한 반면, 가능한 모든 크기의 CU에 대해 부호화를 수행하여 가장 압축 효율이 우수한 CU를 선택하는 방식을 사용하므로, 매우 높은 연산 복잡도를 갖고 오랜 부호화 시간을 요구하는 문제점이 있다. 이는 실시간 비디오 감상이나 고화질 컨텐츠 제공에 있어 문제를 야기할 수 있으므로 이를 해결하기 위한 방법이 필요하다.

본 발명은 상기와 같은 문제점을 해결하기 위해 안출된 것으로, 특히 부호화시에 연산을 간단하게 하고, 부호화시간을 단축시키도록 하는 영상 부호화 방법 및 장치을 제공하는 데 그 목적이 있다.

또한, 인코더의 성능을 향상시킴으로써 고속의 인코딩을 통하여 실시간으로 고화질의 화상정보를 제공하도록 하는 영상 부호화 방법 및 장치를 제공하는 데 그 목적이 있다.

상기 목적을 달성하기 위해 안출된 본 발명의 일실시 형태는, 현재 코딩유닛의 적어도 하나의 주변 코딩유닛 깊이정보와 임계치를 비교하는 단계와, 상기 비교단계의 결과에 따라 코딩유닛의 분할작업을 수행하는 단계를 포함하는 영상 부호화 방법을 제공한다.

여기서, 상기 주변 코딩유닛 깊이정보는 현재 코딩유닛의 좌측에 인접한 좌측코딩유닛의 깊이정보와, 상측에 인접한 상측코딩유닛의 깊이정보인 것이 바람직하다.

또한, 상기 주변 코딩유닛의 깊이정보는 이전 프레임에서의 현재 코딩유닛의 깊이정보인 것이 바람직하다.

또한, 상기 주변 코딩유닛의 깊이정보는, 현재 코딩유닛의 좌측에 인접한 좌측코딩유닛의 깊이정보와, 상측에 인접한 상측코딩유닛의 깊이정보와, 이전 프레임에서의 현재 코딩유닛의 깊이정보인 것이 바람직하다.

한편, 상기 코딩유닛의 크기가 64x64인 경우는 비교단계를 수행하지 않을 수도 있다.

또한, 상기 코딩유닛의 크기가 32x32인 경우는 상기 임계치를 1로 설정하고, 16x16인 경우는 임계치를 3으로 설정하는 것이 바람직하다.

상기 방법은, 비교단계의 결과, 상기 주변 코딩유닛 깊이정보가 상기 임계치보다 작은 경우, 다음 최대코딩유닛(Largest Coding Unit)을 부호화하는 단계를 수행하며, 비교단계의 결과, 상기 주변 코딩유닛 깊이정보가 상기 임계치보다 큰 경우, 다음 깊이로 코딩유닛을 부호화하는 단계를 수행하는 단계를 더 포함할 수 있다.

본 발명에 의하면 현재 코딩유닛 주변의 코딩유닛정보를 이용하여 크기가 더 작은 코딩유닛 단위의 부호화 과정을 생략함으로써 인코더의 복잡도를 감소시키는 효과가 있다.

또한, 본 발명에 의하면 고속의 영상코딩이 가능하여 실시간영상, 고화질영상을 보다 효율적으로 제공할 수 있게 된다.

도 1은 본 발명의 일실시예에 따른 영상 부호화 장치를 나타내는 블록도이다.
도 2는 본 발명의 다른 실시예에 따른 영상 복호화 장치의 구성을 나타내는 블록도이다.
도 3은 본 발명의 일실시예에 따른 영상 부호화방법에 사용되는 LCU 분할구조를 도시한 것이다.
도 4는 본 발명의 일실시예에 따른 영상 부호화방법의 CU분할을 도시한 것이다.
도 5는 본 발명의 다른 실시예에 따른 영상 부호화방법의 CU분할을 도시한 것이다.
도 6은 본 발명의 일실시예에 따른 영상 부호화방법을 도시한 순서도이다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다거나 "직접 접속되어"있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.

도 1은 본 발명의 일실시예에 따른 영상 부호화 장치를 나타내는 블록도이다.

도 1을 참조하면, 상기 영상 부호화 장치(100)는 움직임 예측부(111), 움직임 보상부(112), 인트라 예측부(120), 스위치(115), 감산기(125), 변환부(130), 양자화부(140), 엔트로피 부호화부(150), 역양자화부(160),역변환부(170), 가산기(175), 필터부(180) 및 참조영상 버퍼(190)를 포함한다.

영상 부호화 장치(100)는 입력 영상에 대해 인트라(intra) 모드 또는 인터(inter) 모드로 부호화를 수행하고 비트스트림을 출력한다. 이하 본 발명의 실시예에서는 인트라 예측은 화면 내 예측, 인터 예측은 화면 간 예측과 동일한 의미로 사용될 수 있다. 예측 단위에 대한 최적의 예측 방법을 결정하기 위해 예측 단위에 대해 화면 내예측 방법 및 화면 간 예측 방법이 선택적으로 사용될 수 있다. 영상 부호화 장치(100)는 입력 영상의 원본 블록에 대한 예측 블록을 생성한 후, 원본 블록과 예측 블록의 차분을 부호화한다.

화면 내 예측 모드인 경우, 인트라 예측부(120)(또는 화면 내 예측부도 동일한 의미를 가지는 용어로 사용될 수 있다.)는 현재 블록 주변의 이미 부호화된 블록의 화소값을 이용하여 공간적 예측을 수행하여 예측 블록을 생성한다.

화면 간 예측 모드인 경우, 움직임 예측부(111)는, 움직임 예측 과정에서 참조 영상 버퍼(190)에 저장되어 있는 참조 영상에서 입력 블록과 가장 매치가 잘 되는 영역을 찾아 움직임 벡터를 구한다. 움직임 보상부(112)는 움직임 벡터를 이용하여 움직임 보상을 수행함으로써 예측 블록을 생성한다.

감산기(125)는 입력 블록과 생성된 예측 블록의 차분에 의해 잔여 블록(residual block)을 생성한다. 변환부(130)는 잔여 블록에 대해 변환(transform)을 수행하여 변환 계수(transform coefficient)를 출력한다. 그리고 양자화부(140)는 입력된 변환 계수를 양자화 파라미터에 따라 양자화하여 양자화된 계수(quantized coefficient)를 출력한다. 엔트로피 부호화부(150)는 입력된 양자화된 계수를 확률 분포에 따라 엔트로피 부호화하여 비트스트림(bit stream)을 출력한다.

HEVC는 인터 예측 부호화, 즉 화면 간 예측 부호화를 수행하므로, 현재 부호화된 영상은 참조 영상으로 사용되기 위해 복호화되어 저장될 필요가 있다. 따라서 양자화된 계수는 역양자화부(160)에서 역양자화되고 역변환부(170)에서 역변환된다. 역양자화, 역변환된 계수는 가산기(175)를 통해 예측 블록과 더해지고 복원 블록이 생성된다.

복원 블록은 필터부(180)를 거치고, 필터부(180)는 디블록킹 필터(deblocking filter), SAO(Sample Adaptive Offset), ALF(Adaptive Loop Filter) 중 적어도 하나 이상을 복원 블록 또는 복원 픽쳐에 적용할 수 있다. 필터부(180)는 적응적 인루프(in-loop) 필터로 불릴 수도 있다. 디블록킹 필터는 블록 간의 경계에 생긴 블록 왜곡을 제거할 수 있다. SAO는 코딩 에러를 보상하기 위해 화소값에 적정 오프셋(offset) 값을 더해줄 수 있다. ALF는 복원된 영상과 원래의 영상을 비교한 값을 기초로 필터링을 수행할 수 있으며, 고효율이 적용되는 경우에만 수행될 수도 있다. 필터부(180)를 거친 복원 블록은 참조 영상 버퍼(190)에 저장된다.

도 2는 본 발명의 다른 실시예에 따른 영상 복호화 장치의 구성을 나타내는 블록도이다.

도 2를 참조하면, 상기 영상 복호화 장치(200)는 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 인트라 예측부(240), 움직임 보상부(250), 필터부(260) 및 참조 영상 버퍼(270)를 포함한다.

영상 복호화 장치(200)는 부호화기에서 출력된 비트스트림을 입력 받아 인트라 모드 또는 인터 모드로 복호화를 수행하고 재구성된 영상, 즉 복원 영상을 출력한다. 인트라 모드인 경우 화면 내 예측 모드를 사용하여 예측 블록을 생성하고 인터 모드인 경우 화면 간 예측 방법을 사용하여 예측 블록을 생성한다. 영상 복호화 장치(200)는 입력 받은 비트스트림으로부터 잔여 블록(residual block)을 얻고 예측 블록을 생성한 후 잔여 블록과 예측블록을 더하여 재구성된 블록, 즉 복원 블록을 생성한다.

엔트로피 복호화부(210)는 입력된 비트스트림을 확률 분포에 따라 엔트로피 복호화하여 양자화된 계수(quantized coefficient)를 출력한다. 양자화된 계수는 역양자화부(220)에서 역양자화되고 역변환부(230)에서 역변환되며, 양자화된 계수가 역양자화/역변환 된 결과, 잔여 블록(residual block)이 생성된다.

화면 내 예측 모드인 경우, 인트라 예측부(240)(또는 화면 간 예측부)는 현재 블록 주변의 이미 부호화된 블록의 화소값을 이용하여 공간적 예측을 수행하여 예측 블록을 생성한다.

화면 간 예측 모드인 경우, 움직임 보상부(250)는 움직임 벡터 및 참조 영상 버퍼(270)에 저장되어 있는 참조영상을 이용하여 움직임 보상을 수행함으로써 예측 블록을 생성한다.

잔여 블록과 예측 블록은 가산기(255)를 통해 더해지고, 더해진 블록은 필터부(260)를 거친다. 필터부(260)는 디블록킹 필터, SAO, ALF 중 적어도 하나 이상을 복원 블록 또는 복원 픽쳐에 적용할 수 있다. 필터부(260)는 재구성된 영상, 즉 복원 영상을 출력한다. 복원 영상은 참조 영상 버퍼(270)에 저장되어 화면 간 예측에 사용될 수 있다.

부호화/복호화 장치의 예측 성능을 향상시키기 위한 방법에는 보간(interpolation) 영상의 정확도를 높이는 방법과 차신호를 예측하는 방법이 있다. 여기서 차신호란 원본 영상과 예측 영상과의 차이를 나타내는 신호이다.

본 발명에서 “차신호”는 문맥에 따라 “차분 신호”, “잔여 블록” 또는 “차분 블록”으로 대체되어 사용될 수 있으며, 해당 기술분야에서 통상의 지식을 가진 자는 발명의 사상, 본질에 영향을 주지 않는 범위 내에서 이를 구분할 수 있을 것이다.

본 발명의 실시예에서는 설명의 편의상 코딩 유닛(Coding Unit, 이하 'CU'라 함)을 부호화 단위라는 용어로 사용하지만, 부호화 뿐만 아니라 복호화를 수행하는 단위가 될 수도 있다. 이하, 본 발명의 실시예에 따른 도 3 내지 도 6에서 설명하는 영상 부호화 방법은 도 1 및 도 2에서 전술한 각 모듈의 기능에서 맞게 구현될 수 있고 이러한 부호화기 및 복호화기는 본 발명의 권리범위에 포함된다. 즉, 본 발명의 실시예에서 후술할 영상 부호화/복호화 방법은 도 1 및 도 2에서 전술한 영상 부호화기 및 영상 복호화기에 포함된 각 구성부에서 수행될 수 있다. 구성부의 의미는 하드웨어적인 의미 뿐만 아니라 알고리즘을 통해 수행될 수 있는 소프트웨어적인 처리 단위도 포함할 수 있다.

상술한 도 1, 도 2의 실시예에 따른 영상 부호화/복호화에서는, 영상의 효율적인 부호화를 위해, 단일 크기의 매크로블록이 다양한 크기로 확장된 CU 구조가 정의될 수 있다. CU는 비디오 부호화기에서 부호화가 수행되는 하나의 단위로서, 쿼드 트리 구조(Quad Tree Structure)를 기초로 깊이(depth) 정보를 가지고 계층적으로 분할될 수 있다. CU는 8×8, 16×16, 32×32, 64×64 등 다양한 크기를 가질 수 있다. 또한 가장 큰 크기의 CU를 LCU(Largest Coding Unit), 가장 작은 크기의 CU를 SCU(Smallest Coding Unit)라 한다. SCU를 제외한 모든 CU는 split_flag 정보를 할당하여 그 값에 따라 해당 CU가 분할된 영역인지 아닌지를 지시하게 된다. 부호화기는 다양한 비디오 신호 특성에 따라, 부호화 과정에서 LCU의 크기를 조절할 수도 있다.

도 3은 본 발명의 일실시예에 따른 영상 부호화방법에 사용되는 LCU 분할구조를 도시하고 있다.

도 3에 의하면, CU의 크기는 8×8, 16×16, 32×32, 64×64로 분할될 수 있으며, LCU의 크기는 64×64이고, SCU의 크기는 8×8이다.

CU에 대한 분할은 해당 LCU의 영역에 해당하는 영상의 특징에 의해 결정되며, 종래의 HEVC 부호화기는 LCU에서 SCU까지 모든 가능한 크기의 CU 단위 기반의 부호화 수행 후 압축효율이 가장 우수한 CU 구조를 선택하도록 구성되어 있다. CU 구조의 선택은 데이터량과 화질의 관계를 비교하여 가장 효율적인 구조를 찾는 율-왜곡 최적화 기법(Rate-Distortion Optimization)을 사용하여 이루어진다. CU의 크기는 깊이(Depth)정보를 통해 표현되고, 깊이 0의 LCU에서부터 깊이 3의 SCU까지 나타낼 수 있다. 또한, 각 CU별로 1bit의 split_flag를 통해 분할되었는지 여부를 알려줄 수 있다.

도 4는 본 발명의 실시예에 따른 영상 부호화방법의 CU분할을 도시한 예로서, HEVC의 Reference software인 HM-5.0 버전을 이용하여 부호화를 수행한 결과이며, HEVC의 Test Sequence중 하나인 'basketballDrill' 영상을 실제로 부호화 하였을 때 영상이 어떻게 CU단위로 분할되는지에 대한 예를 나타내고 있다.

도 4에서 각각의 사각형은 각 CU를 뜻하며, 가장 큰 사각형은 LCU 자체가 분할되지 않았음을 의미, 가장 작은 사각형은 최고 깊이까지 LCU가 세분화 된 SCU를 나타내고 있다. 즉, 모든 CU 크기에 대해 부호화를 실행한 결과 가장 압축 효율이 뛰어난 분할 구조는 도 4와 같이 나타났다는 것을 의미한다. 대체로 영역의 활동도(activity)가 높거나 움직임이 역동적인 경우 CU가 세분화되고, 반대로 움직임이 적거나 평탄한 영역의 경우는 큰 CU로 부호화를 수행한다

영상 부호화 과정에서 주변 CU들 간의 관계를 도 4를 통해 살펴보면, CU는 주변 CU의 크기와 유사한 경향을 보인다. 즉 해당 CU와 주변 CU의 깊이 정보의 차이가 2 이상 차이나는 급격한 크기 변화는 찾기 어려우며 인접한 CU간에는 비슷한 깊이 정보를 갖는 것이 관찰된다. HEVC 부호화 과정에서의 CU에 대한 코딩 순서는 프레임 내에서 알파벳 Z자 모양으로 진행되기 때문에 주변 CU에 대한 깊이 정보는 좌측 CU(left CU)와 상측 CU(upper CU)가 사용 가능하다.

표 1은 WVGA(832x480 size) 크기의 4가지 HEVC Test Sequence를 low_delay_p 조건에 대하여 QP=22, 27, 32, 37 4가지 상황에 맞춰 시뮬레이션 하여 얻은 최종 CU 분할 구조에 대해 주변 CU(좌측 또는 상측 위치의 CU)와의 차이가 0 또는 1일 확률값을 얻은 결과이다. 표 1에 대한 확률값을 보았을 때 64x64를 제외한 나머지 CU 크기들에 대하여 주변 CU와 현재 CU의 깊이 정보의 차이량 1이하일 경우가 0.9 이상의 높은 확률을 갖는 것을 확인할 수 있으며, 이를 통해 공간적인 주변 CU와 현재 CU간의 크기는 급격히 변하지 않는다는 사실을 알 수 있다. 아래 표1은 CU 크기별 주변 CU와의 깊이 정보 차이가 2 이하일 확률을 나타낸다.

Sequence	CU size
Sequence	64x64	32x32	16x16	8x8
Basketball Drill	0.8706	0.9656	0.9994	0.9970
BQMall	0.8630	0.9380	0.9992	0.9965
PartyScene	0.6900	0.9136	0.9998	0.9994
RaceHorse	0.8008	0.9247	0.9995	0.9984
average	0.8061	0.9354	0.9994	0.9978

도 5는 본 발명의 다른 실시예에 따른 영상 부호화방법의 CU분할을 도시한 예로서, 도 5를 참조하면 도 5는 HEVC의 Test Sequence중 하나인 'BasketballDrill' 시퀀스를 실제로 부호화 하였을 때 CU의 분할에 대한 영상의 일부분을 발췌한 것으로 이를 통하여 현재 프레임과 참조 프레임 간의 CU크기가 유사함을 확인할 수 있다. 즉, 현재 프레임(b)과 참조 프레임(a)간 동일한 위치의 LCU가 깊이정보 차이 1 이하의 비슷한 CU 분할 구조를 갖는다는 것도 확인할 수 있다. 도 4 및 도 5를 통해 살펴본 바와 같이, 현재 CU는 주변 CU와 밀접한 관계가 있다.여기서, 주변 CU는 도 4의 실시예에서 살펴본 공간적 주변 CU인 좌측 CU와 상측 CU와 도 5의 실시예에서 살펴본 시간적 주변 CU를 포함하여 수학식 1과 같이 나타낼 수 있다.

[수학식1]

여기서,

: 주변 CU,

: 좌측 CU

: 상측 CU,

: 시간적 주변 CU

현재 CU와 주변 CU와의 깊이 정보는 큰 차이를 보이지 않으며, 주변 CU의 크기가 클 경우 현재 CU의 크기는 같거나 작은 차이의(0또는 1 내외) 깊이 정보를 갖는 CU 크기일 가능성이 매우 크다. 즉, 현재 CU를 라 하고 주변 CU와의 깊이 정보의 합을 D라고 하였을 때, 이는 수학식 2와 같이 정의할 수 있다.

[수학식2]

수학식 2에서 정의한 D값이 작을수록 이는 부호화가 완료된 주변 CU의 크기가 크다는 것을 의미한다. 주변 CU와 현재 CU의 크기의 차이는 크지 않기 때문에 현재 부호화하는 CU의 크기가 어느 임계치(Threshold) 이하의 D값을 갖을 경우 주변 CU의 크기가 충분히 크다고 할 수 있으며, 그 이하 크기를 갖는 CU에 대해서는 발생 확률이 매우 낮으므로 부호화 과정을 생략해도 부호화 결과에 큰 차이가 없을 것이다.

이상에서 살펴본 바와 같이, CU 깊이 정보는 공간적, 시간적으로 주변 CU와 밀접한 관계가 있기 때문에 부호화 수행에 있어 비슷한 CU 깊이 정보를 갖는 주변 CU에 대한 정보를 잘 이용한다면 해당 CU의 깊이를 미리 예측할 수 있게 되고, 그 결과 계산상의 복잡도를 낮출 수 있다는 결론을 얻을 수 있다. 또한, 부호화하고자 하는 CU의 크기가 어느 임계치 이하의 D값을 갖을 경우 부호화 과정의 생략이 가능하게 되어 고속의 영상 부호화가 가능하게 된다.

도 6은 본 발명의 일실시예에 따른 영상 부호화방법을 도시한 순서도이다.

도 6을 참조하면, 율-왜곡 최적화를 통해 최적모드를 결정하는 단계(S110)와, 임계치와 D값을 비교하는 단계(S120)와, 비교단계(S120)의 결과에 따라 CU분할 후 부호화하는 단계(S130)와, 다음 LCU를 부호화하는 단계(S140)를 포함한다.

율-왜곡 최적화를 통해 최적모드를 결정하는 단계(S110)는 각 CU를 부호화하고, 부호화된 영상에 대하여 율-왜곡 비용을 산출하는 과정이다. 율-왜곡 비용은 부호화된 영상의 왜곡과 데이터율을 모두 고려하여 산출된 값이다. 영상 부호화 장치는 율-왜곡 비용이 낮은 예측 모드를 최적의 예측 모드로 선택하게 된다.

각각 다른 크기의 CU로 분할하여 부호화하는 단계(S130) 이후, 다시 율-왜곡 최적화를 통해 최적모드를 결정하는 단계(S110)가 다시 반복 수행되는 재귀적 과정이다.

본 발명의 일실시예에 따른 영상 부호화방법은, 임계치와 D값을 비교하는 단계(S120)를 통해 압축효율이 결정되기 때문에 임계치를 결정하는 단계가 매우 중요하다. 임계치를 크게 하였을 경우 압축 효율의 감소현상이 일어나지만 고속의 부호화가 수행되며, 임계치를 작게 하면 압축 효율은 보존이 되지만 부호화의 속도 향상 효과가 감소하게 된다.

표 2는 부호화 과정에서 발생할 수 있는 모든 CU 크기인 64x64, 32x32, 16x16, 8x8 크기에 대하여 D값의 확률 밀도 함수(probability density function,,PDF)값을 나타낸다. 부호화 조건은 표 1에서 사용한 조건과 동일하다.

HEVC의 높은 압축 효율을 보존하기 위해서는 허용되는 임계치를 작게 설정 해야 한다. 표 2에 따르면 64x64 크기의 CU에 대해서는 D가 가질 수 있는 최소값인 0의 확률 또한 매우 높으므로, 압축 효율 보존을 위해서는 빠른 CU 깊이 결정 방법에서 64x64 CU 크기는 제외시키는 것이 바람직하다. 반면, 32x32 크기에서는 D=0의 PDF값이 매우 낮으므로 이 경우 1값을 임계치로 설정하여 빠른 CU 깊이 결정 방법을 수행하여도 압축 효율이 높을 것이기 때문에 바람직하다. 16x16 크기의 경우도 마찬가지의 이유로 3의 값을 임계값으로 사용할 경우 압축 효율을 보존시키며 부호화 속도의 향상을 기대할 수 있다. 아래 표 2는 CU size에 따른 D값의 PDF를 나타낸다.

D(CU_curr)	CU size
D(CU_curr)	64x64	32x32	16x16	8x8
0	0.178733	0.000077	0	0
1	0.281027	0.009407	0.000108	0
2	0.235615	0.088288	0.000344	0
3	0.162091	0.267736	0.004863	0.000012
4	0.080105	0.262355	0.032249	0.000208
5	0.039865	0.210848	0.142129	0.001796
6	0.022377	0.104354	0.306077	0.013485
7	0.000094	0.056857	0.346464	0.066986
8	0.000094	0.000077	0.167765	0.257488
9	0	0	0	0.660025

한편, 본 발명의 실시예에 따른 영상 부호화방법의 효과 검증을 위하여 (the HEVC test model software인) HM-5.0 참조 소프트웨어에 제안 방법을 구현하였으며, 원본 HM-5.0 부호화 결과와 압축 효율 및 부호화 시간 측면에 따라 비교하였다. low_delay_p 조건을 사용하였으며, 평가 시퀀스는 HEVC Test Sequence 4가지에 대하여 QP={ 22, 27, 32, 37 } 4가지 상황에 대하여 시뮬레이션 하였다. 원본 HM-5.0을 기준으로 상대적인 결과를 측정, BD-Rate에 의한 압축 효율 변화를 관찰하였다.표 3에서 볼 수 있듯이 본 발명의 실시예에 따른 영상 부호화방법은 부호화기의 평균적 연산량을 9310sec에서 8632sec 까지 약 7.27% 감소시킬 수 있는 반면, 압축 효율 하락은 0.31%로서 압축 효율의 손실이 거의 없으면서도 부호화 속도를 효과적으로 감소시킬 수 있다는 것을 확인할 수 있다. 아래 표 3은 HM-5.0의 방법에 비교한 제안한 방법의 성능 결과이다.

Sequence	QP	HM-5.0			Proposed Method
Sequence	QP	kbps	Y psnr(dB)	encoding time(sec)	kbps	Y psnr(dB)	encoding time(sec)	BD-Rate(%)	Encoding Time Saving ratio(%)
Basketball Drill	22	3954.127	40.2313	10544.294	3962.923	40.222	9858.329	0.55	10.3278
	27	1814.71	37.0832	9564.932	1820.552	37.0747	8674.401
	32	859.42	34.2795	8786.686	861.8896	34.2697	7727.878
	37	438.4184	31.8825	7888.079	439.5768	31.8686	6724.411
BQmall	22	4587.61	40.0975	12127.375	4592.274	40.0961	11391.121	0.52	10.1526
	27	1975.417	37.2956	10914.187	1978.004	37.2894	9924.755
	32	934.9152	34.4257	10042.36	939.1368	34.4144	8861.654
	37	470.64	31.6129	9201.962	471.8352	31.5854	7815.234
PartyScene	22	9346.673	38.2242	11624.99	9345.91	38.2237	11408.216	0.07	4.4443
	27	3716.226	34.3846	10129.876	3719.254	34.3877	9867.292
	32	1563.51	31.0648	9048.42	1564.386	31.0616	8644.687
	37	661.3352	27.9502	8026.486	660.5616	27.9387	7183.871
RaceHorses	22	6127.539	39.9923	9104.682	6132.694	39.9971	8944.073	0.12	3.2775
	27	2374.563	36.2113	8122.996	2377.785	36.2129	7914.524
	32	1020.782	33.0676	7358.795	1021.681	33.0597	7059.057
	37	462.768	30.2441	6476.457	462.1144	30.2417	6127.18
AVERAGE		2519.291	34.8779	9310.1610	2521.911	34.87146	8632.9176	0.31	7.2742

100: 영상 부호화 장치 111: 움직임 예측부
112: 움직임 보상부 120: 인트라 예측부
125: 감산기 130: 변환부
140: 양자화부 150: 엔트로피 부호화부

Claims

비트스트림으로부터, 제1 코딩 블록에 대한 분할 플래그(split_flag)를 복호화하는 단계;
상기 복호화된 분할 플래그를 기반으로, 상기 제1 코딩 블록을 복수의 제2 코딩 블록으로 분할하는 단계;
상기 제2 코딩 블록을 인트라 모드로 복호화하여 예측 블록을 생성하는 단계;
상기 비트스트림을 엔트로피 복호화하여 양자화된 계수(quantized coefficient)를 획득하는 단계;
상기 획득된 양자화된 계수에 역양자화 및 역변환을 수행하여 잔차 블록을 생성하는 단계; 및
상기 예측 블록 및 상기 잔차 블록을 기반으로, 상기 제2 코딩 블록의 복원 블록을 생성하는 단계를 포함하되,
상기 분할 플래그는, 상기 제1 코딩 블록이 복수의 제2 코딩 블록으로 분할되는지 여부를 나타내고,
상기 제1 코딩 블록의 뎁스 정보가 k인 경우, 상기 제2 코딩 블록 각각의 뎁스 정보는 (k+1)로 표현되며,
상기 분할 플래그는, 상기 제1 코딩 블록에 인접한 주변 블록의 깊이 정보 및 상기 제1 코딩 블록의 크기가 소정의 임계치보다 작은지 여부를 고려하여 복호화되고,
상기 제1 코딩 블록의 크기는, 깊이 정보를 통해 표현되며,
상기 임계치는, 복호화 장치에 기-설정된 고정된 값이고, 상기 고정된 값은 2인, 영상 복호화 방법.
제1항에 있어서,
상기 주변 블록은, 상기 제1 코딩 블록의 좌측 주변 블록 또는 상단 주변 블록 중 적어도 하나를 포함하는, 영상 복호화 방법.
제1 코딩 블록에 대한 분할 플래그(split_flag)를 부호화하는 단계;
상기 부호화된 분할 플래그를 기반으로, 상기 제1 코딩 블록을 복수의 제2 코딩 블록으로 분할하는 단계;
상기 제2 코딩 블록을 인트라 모드로 복호화하여 예측 블록을 생성하는 단계;
상기 제2 코딩 블록의 원본 블록과 상기 예측 블록의 차분에 의해 잔차 블록을 생성하는 단계;
상기 생성된 잔차 블록에 대해 변환 및 양자화를 수행하여 양자화된 계수(quantized coefficient)를 획득하는 단계; 및
상기 획득된 양자화된 계수를 부호화하여 비트스트림을 생성하는 단계를 포함하되,
상기 제1 코딩 블록의 뎁스 정보가 k인 경우, 상기 제2 코딩 블록 각각의 뎁스 정보는 (k+1)로 표현되며,
상기 분할 플래그는, 상기 제1 코딩 블록에 인접한 주변 블록의 깊이 정보 및 상기 제1 코딩 블록의 크기가 소정의 임계치보다 작은지 여부를 고려하여 부호화되고,
상기 제1 코딩 블록의 크기는, 깊이 정보를 통해 표현되며,
상기 임계치는, 복호화 장치에 기-설정된 고정된 값이고, 상기 고정된 값은 2인, 영상 부호화 방법.
제3항에 있어서,
상기 주변 블록은, 상기 제1 코딩 블록의 좌측 주변 블록 또는 상단 주변 블록 중 적어도 하나를 포함하는, 영상 부호화 방법.