WO2019009490A1

WO2019009490A1 - 영상을 부호화/복호화 하는 방법 및 그 장치

Info

Publication number: WO2019009490A1
Application number: PCT/KR2018/001542
Authority: WO
Inventors: 김재환; 박영오; 박정훈; 이종석; 전선영; 최광표
Original assignee: 삼성전자 주식회사
Priority date: 2017-07-06
Filing date: 2018-02-06
Publication date: 2019-01-10
Also published as: CN110337813A; KR20200009118A; US20200389658A1; EP3567857A1; KR102285737B1; CN110337813B; US11190784B2

Abstract

일 실시예에 따른 영상을 압축하는 방법에 있어서, 영상에 대한 DNN을 이용한 다운샘플링을 수행하여 압축영상을 결정하는 단계; 압축영상에 기초한 예측을 수행하여 예측신호를 결정하는 단계; 압축영상 및 예측신호에 기초하여 잔차신호를 결정하는 단계; 및 잔차신호에 대한 정보를 포함하는 비트스트림을 생성하는 단계를 포함하고, DNN은, 업샘플링 과정에서 생성되는 정보를 이용한 다운샘플링 과정의 학습을 통해 결정된 네트워크 구조를 가지는 것을 특징으로 하는 영상 압축 방법 및 영상 압축 방법을 수행할 수 있는 영상 압축 장치가 제공될 수 있다. 업샘플링하기 위한 DNN을 이용하여 영상 압축 방법에 의해 압축된 압축영상을 복원하는 영상 복원 방법 및 영상 복원 방법을 수행할 수 있는 영상 복원 장치가 제공될 수 있다.

Description

영상을 부호화/복호화 하는 방법 및 그 장치

일 실시예에 따른 방법 및 장치는 영상의 부호화 또는 복호화 과정 전후에 부호화 및 복호화의 효율 향상을 위하여 원본신호 및 복호화 된 신호를 변경하기 위한 발명이다.

영상 데이터는 소정의 데이터 압축 표준, 예를 들면 MPEG(Moving Picture Expert Group) 표준에 따른 코덱에 의하여 부호화된 후 비트스트림의 형태로 기록매체에 저장되거나 통신 채널을 통해 전송된다.

고해상도 또는 고화질 영상 컨텐트를 재생, 저장할 수 있는 하드웨어의 개발 및 보급에 따라, 고해상도 또는 고화질 영상 컨텐트를 효과적으로 부호화 또는 복호화 하는 코덱(codec)의 필요성이 증대하고 있다. 부호화된 영상 컨텐트는 복호화됨으로써 재생될 수 있다. 최근에는 이러한 고해상도 또는 고화질 영상 컨텐트를 효과적으로 압축하기 위한 방법들이 실시되고 있다. 예를 들면, 부호화 하려는 영상을 임의적 방법으로 처리하는 과정을 통한 효율적 영상 압축 방법이 실시되고 있다.

부호화 하려는 원본영상의 정보량이 많아지는 경우 발생하는 부호화 효율 저하를 방지하고, 이러한 부호화된 영상에 대한 비트스트림을 수신하여 복호화 과정의 효율을 향상시킬 필요가 있다.

일 실시예에 따른 영상을 복원하는 방법에 있어서, 비트스트림으로부터 영상을 다운샘플링(down-sampling)한 압축영상에 대한 잔차신호를 획득하는 단계; 잔차신호 및 예측을 수행하여 획득한 예측신호를 이용하여 압축영상을 복호화하는 단계; 및 복호화된 압축영상에 DNN(Deep Neural Network)을 이용한 압축 업샘플링(up-sampling)을 수행하여 영상을 복원하는 단계를 포함하고, DNN은 다운샘플링 과정에서 생성되는 정보를 이용한 업샘플링 과정의 학습을 통해 미리 결정된 네트워크 구조를 가지는 것을 특징으로 하는 영상 복원 방법이 제공될 수 있다.

일 실시예에 따른 영상을 압축하는 방법에 있어서, 영상에 대한 DNN을 이용한 다운샘플링을 수행하여 압축영상을 결정하는 단계; 압축영상에 기초한 예측을 수행하여 예측신호를 결정하는 단계; 압축영상 및 예측신호에 기초하여 잔차신호를 결정하는 단계; 및 잔차신호에 대한 정보를 포함하는 비트스트림을 생성하는 단계를 포함하고, DNN은, 업샘플링 과정에서 생성되는 정보를 이용한 다운샘플링 과정의 학습을 통해 결정된 네트워크 구조를 가지는 것을 특징으로 하는 영상 압축 방법이 제공될 수 있다.

일 실시예에 따른 영상을 복원하는 장치에 있어서, 비트스트림으로부터 영상을 다운샘플링한 압축영상에 대한 잔차신호를 획득하는 잔차신호 획득부; 및 잔차신호 및 예측을 수행하여 획득한 예측신호를 이용하여 압축영상을 복호화하고, 복호화된 압축영상에 DNN을 이용한 업샘플링을 수행하여 영상을 복원하는 복원부를 포함하고, DNN은 다운샘플링 과정에서 생성되는 정보를 이용한 업샘플링 과정의 학습을 통해 미리 결정된 네트워크 구조를 가지는 것을 특징으로 하는 영상 압축 장치가 제공될 수 있다.

정보량이 많은 영상의 부호화 및 복호화 과정에서 수행되는 데이터 처리량을 줄임으로써 부호화 및 복호화 효율을 향상시킬 수 있다.

도 1a는 일 실시예에 따라 영상을 복원하기 위한 영상 복원 장치에 대한 블록도를 도시한다.

도 1b는 일 실시예에 따라 영상을 압축하기 위한 영상 압축 장치(150)에 대한 블록도를 도시한다.

도 2a는 일 실시예에 따라 영상 복원 장치(100)가 수행할 수 있는 영상 복원 과정을 나타내는 흐름도이다.

도 2b는 일 실시예에 따라 영상 압축 장치(150)가 수행할 수 있는 영상 압축 과정을 나타내는 흐름도이다.

도 3은 일 실시예에 따라 압축된 영상이 부호화 및 복호화 과정을 거쳐 복원되는 과정을 설명하기 위한 도면이다.

도 4a는 DNN에 포함되는 심층 컨볼루셔널 신경망을 설명하기 위한 도면이다.

도 4b 내지 4f는 다양한 컨볼루셔널 신경망(Convolutional Neural Network; CNN)의 예시적인 구조를 나타내는 도면이다.

도 5a는 일 실시예에 따라 DNN을 이용한 공간적 정보의 업샘플링 동작을 설명하기 위한 도면이다.

도 5b는 일 실시예에 따라 DNN을 이용한 공간적 정보의 다운샘플링 동작을 설명하기 위한 도면이다.

도 6은 일 실시예에 따라 업샘플링 또는 다운샘플링 과정에서 이용되는 필터 커널의 종류가 상이할 수 있음을 설명하기 위한 도면이다.

도 7a는 일 실시예에 따라 DNN에 포함되는 복수개의 레이어 중 소정의 레이어에서 복수개의 필터 커널을 이용하여 필터링을 수행하는 특징을 설명하기 위한 도면이다.

도 7b는 일 실시예에 따라 복수개의 크기의 필터 커널로 필터링을 수행하여 결정되는 특성맵들을 이용한 필터링 과정을 설명하기 위한 도면이다.

도 8은 일 실시예에 따라 다운샘플링을 위한 DNN에서 발생하는 손실정보를 나타내기 위한 도면이다.

도 9는 업샘플링을 위한 DNN에서 발생하는 손실정보를 나타내기 위한 도면이다.

도 10은 일 실시예에 따라 현재 부호화 단위가 분할되어 적어도 하나의 부호화 단위가 결정되는 과정을 도시한다.

도 11은 일 실시예에 따라 비-정사각형의 형태인 부호화 단위가 분할되어 적어도 하나의 부호화 단위가 결정되는 과정을 도시한다.

도 12는 일 실시예에 따라 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 부호화 단위가 분할되는 과정을 도시한다.

도 13은 일 실시예에 따라 홀수개의 부호화 단위들 중 소정의 부호화 단위가 결정되는 방법을 도시한다.

도 14는 일 실시예에 따라 현재 부호화 단위가 분할되어 복수개의 부호화 단위들이 결정되는 경우, 복수개의 부호화 단위들이 처리되는 순서를 도시한다.

도 15는 일 실시예에 따라 소정의 순서로 부호화 단위가 처리될 수 없는 경우, 현재 부호화 단위가 홀수개의 부호화 단위로 분할되는 것으로 결정되는 과정을 도시한다.

도 16은 일 실시예에 따라 제1 부호화 단위가 분할되어 적어도 하나의 부호화 단위가 결정되는 과정을 도시한다.

도 17은 일 실시예에 따라 제1 부호화 단위가 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위가 소정의 조건을 만족하는 경우, 제2 부호화 단위가 분할될 수 있는 형태가 제한되는 것을 도시한다.

도 18은 일 실시예에 따라 분할 형태 정보가 4개의 정사각형 형태의 부호화 단위로 분할하는 것을 나타낼 수 없는 경우, 정사각형 형태의 부호화 단위가 분할되는 과정을 도시한다

도 19는 일 실시예에 따라 복수개의 부호화 단위들 간의 처리 순서가 부호화 단위의 분할 과정에 따라 달라질 수 있음을 도시한 것이다.

도 20은 일 실시예에 따라 부호화 단위가 재귀적으로 분할되어 복수개의 부호화 단위가 결정되는 경우, 부호화 단위의 형태 및 크기가 변함에 따라 부호화 단위의 심도가 결정되는 과정을 도시한다.

도 21은 일 실시예에 따라 부호화 단위들의 형태 및 크기에 따라 결정될 수 있는 심도 및 부호화 단위 구분을 위한 인덱스(part index, 이하 PID)를 도시한다.

도 22는 일 실시예에 따라 픽쳐에 포함되는 복수개의 소정의 데이터 단위에 따라 복수개의 부호화 단위들이 결정된 것을 도시한다.

도 23은 일 실시예에 따라 픽쳐에 포함되는 기준 부호화 단위의 결정 순서를 결정하는 기준이 되는 프로세싱 블록을 도시한다.

일 실시예에 따른 영상을 복원하는 방법에 있어서, 비트스트림으로부터 영상을 다운샘플링(down-sampling)한 압축영상에 대한 잔차신호를 획득하는 단계; 잔차신호 및 예측을 수행하여 획득한 예측신호를 이용하여 압축영상을 복호화하는 단계; 및 복호화된 압축영상에 DNN(Deep Neural Network)을 이용한 업샘플링(up-sampling)을 수행하여 영상을 복원하는 단계를 포함하고, DNN은 다운샘플링 과정에서 생성되는 정보를 이용한 업샘플링 과정의 학습을 통해 결정된 네트워크 구조를 가지는 것을 특징으로 하는 영상 복원 방법이 제공될 수 있다.

일 실시예에 따른 영상 복원 방법의 영상을 복원 하는 단계는 복수개의 레이어(hidden layer)를 포함하는 심층 컨볼루셔널 뉴럴 네트워크(Deep Convolutional Neural Network)를 이용하여 업샘플링을 수행하는 단계를 포함할 수 있다.

일 실시예에 따른 영상 복원 방법의 컨볼루셔널 뉴럴 네트워크를 이용하여 업샘플링을 수행하는 단계는, 복수개의 필터 커널들 중 적어도 하나를 이용하여 복수개의 레이어마다 필터링을 수행하여 업샘플링을 수행하는 단계를 포함하고, 복수개의 필터 커널들의 종류는 영상이 다운샘플링될 때 이용된 필터 커널들의 종류와 다른 것을 특징으로 할 수 있다.

일 실시예에 따른 영상 복원 방법의 업샘플링을 수행하는 단계는, DNN의 복수개의 레이어 각각에서 적어도 하나의 필터 커널을 이용하여 필터링을 수행하는 단계를 포함할 수 있다.

일 실시예에 따른 영상 복원 방법의 필터링을 수행하는 단계는, 복수개의 레이어 중 복수개의 필터 커널이 이용되는 레이어에서는 복수개의 필터 커널을 이용하여 필터링을 수행하는 단계; 필터링 결과에 따라 획득된 복수개의 신호들을 연결(concatenate)하는 단계; 및 연결된 신호들을 다음 레이어의 입력으로 이용함으로써 다음 레이어에서 필터링을 수행하는 단계를 포함할 수 있다.

일 실시예에 따른 영상 복원 방법의 복수개의 신호들을 연결하는 단계는 복수개의 신호들을 포함하는 특성맵(feature map)들이 서로 다른 크기를 가지는 경우, 특성맵들의 크기가 동일해지도록 특성맵들에 패딩(padding)을 수행하는 단계; 및 패딩된 특성맵들을 연결(concatenate)하는 단계를 포함할 수 있다.

일 실시예에 따라 영상 복원 방법에서 이용되는 DNN은 업샘플링이 수행됨으로써 복원된 영상과 다운샘플링이 수행되기 전의 원본 영상 간의 비교에 의해 결정되는 적어도 하나의 손실정보의 합이 감소되도록 학습된 것을 특징으로 하고, 적어도 하나의 손실정보 중 일부는 다운샘플링을 위한 DNN의 학습 과정에서 이용되는 것을 특징으로 할 수 있다.

일 실시예에 따른 영상 압축 방법의 압축영상을 결정하는 단계는, 복수개의 레이어를 포함하는 심층 컨볼루셔널 뉴럴 네트워크를 이용하여 압축영상을 결정하는 단계를 포함할 수 있다.

일 실시예에 따른 영상 압축 방법의 압축영상을 결정하는 단계는, 복수개의 레이어마다 복수개의 필터 커널들 중 적어도 하나를 이용하여 필터링을 수행하여 압축영상을 생성하는 단계를 포함할 수 있다.

일 실시예에 따른 영상 압축 방법의 필터링을 수행하는 단계는, 복수개의 레이어 중 복수개의 필터 커널이 이용되는 레이어에서는 복수개의 필터 커널로 필터링을 수행하는 단계; 컨볼루션 결과에 따라 획득된 복수개의 신호들을 연결(concatenate)하는 단계; 및 연결된 신호들을 다음 레이어의 입력으로 이용함으로써 다음 레이어에서 필터링을 수행하는 단계를 포함할 수 있다.

일 실시예에 따른 영상 압축 방법의 비트스트림을 생성하는 단계는, 다운샘플링에 의해 영상의 크기 및 영상의 프레임 레이트(frame rate) 중 적어도 하나가 감축된 정도를 나타내는 샘플링 정보를 포함하는 비트스트림을 생성하는 단계를 포함할 수 있다.

일 실시예에 따른 영상 압축 방법에 있어서, DNN을 이용한 다운샘플링에 의해 발생하는 손실(loss)을 나타내는 적어도 하나의 손실정보의 합이 감소되도록 다운샘플링을 위한 DNN이 학습되는 것을 특징으로 하고, 적어도 하나의 손실정보 중 일부는 압축영상이 복호화 된 후 업샘플링이 수행됨으로써 압축된 영상과 다운샘플링이 수행되기 전의 원본 영상 간의 비교 결과에 기초하여 결정되고, 비교 결과는 업샘플링을 위한 DNN의 학습 과정에서 이용되는 것을 특징으로 할 수 있다.

일 실시예에 따른 영상을 복원하는 장치에 있어서, 비트스트림으로부터 영상을 다운샘플링한 압축영상에 대한 잔차신호를 획득하는 잔차신호 획득부; 및 잔차신호 및 예측을 수행하여 획득한 예측신호를 이용하여 압축영상을 복호화하고, 복호화된 압축영상에 DNN을 이용한 업샘플링을 수행하여 영상을 복원하는 복원부를 포함하고, DNN은 다운샘플링 과정에서 생성되는 정보를 이용한 업샘플링 과정의 학습을 통해 결정된 네트워크 구조를 가지는 것을 특징으로 하는 영상 복원 장치가 제공될 수 있다.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다.

본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.

본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 관련 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.

본 명세서에서의 단수의 표현은 문맥상 명백하게 단수인 것으로 특정하지 않는 한, 복수의 표현을 포함한다.

명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에서 사용되는 "부"라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부"는 어떤 역할들을 수행한다. 그렇지만 "부"는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부"는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부"는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부"들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부"들로 결합되거나 추가적인 구성요소들과 "부"들로 더 분리될 수 있다.

이하, "영상"은 비디오의 정지영상와 같은 정적 이미지이거나 동영상, 즉 비디오 그 자체와 같은 동적 이미지를 나타낼 수 있다.

이하 "신호" 또는 "샘플"은, 영상의 샘플링 위치에 할당된 데이터로서 프로세싱 대상이 되는 데이터를 의미한다. 예를 들어, 공간영역의 영상에서 픽셀값, 변환 영역 상의 변환 계수들이 샘플들일 수 있다. 이러한 적어도 하나의 샘플들을 포함하는 단위를 블록이라고 정의할 수 있다.

아래에서는 첨부한 도면을 참고하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략한다.

도 1a는 일 실시예에 따라 영상을 복원하기 위한 영상 복원 장치(100)에 대한 블록도를 도시한다.

일 실시예에 따라 영상 복원 장치(100)는 비트스트림을 획득하여 부호화된 영상과 관련된 정보를 획득할 수 있는 비트스트림 획득부(110) 및 비트스트림으로부터 획득된 정보를 이용하여 압축된 영상을 복원하는 과정을 수행할 수 있는 복원부(120)를 포함할 수 있다. 일 실시예에 따라 복원부(120)는 비트스트림 획득부(110)에 의해 획득된 비트스트림을 이용하여 영상의 부호화 과정에서 이용된 다양한 정보를 획득할 수 있고, 획득된 정보를 이용하여 영상의 복호화 과정을 거침으로써 영상을 복원할 수 있다.

일 실시예에 따라 복원부(120)는 메모리 및/또는 저장 장치에 저장된 프로그램 명령(program command)을 실행할 수 있다. 복원부(120)는 중앙 처리 장치(Central Processing Unit; CPU), 그래픽 처리 장치(Graphics Processing Unit; GPU)등을 포함하는 적어도 하나의 프로세서(processor)를 포함할 수 있다.

S200단계에서 영상 복원 장치(100)의 비트스트림 획득부(110)는 일 실시예에 따라 비트스트림으로부터 영상을 다운샘플링한 압축영상에 대한 잔차신호를 획득할 수 있다. 일 실시예에 따라 영상 복원 장치(100)가 비트스트림으로부터 획득한 잔차신호는, 영상의 압축 과정에서 다운샘플링된 영상에 기초한 부호화가 수행된 결과일 수 있다.

도 3을 참조하면, 일 실시예에 따라 원본영상(300)은 부호화(304)과정을 거침으로써 주파수 영역으로 변환된 결과인 비트스트림이 생성될 수 있다. 원본신호(300)를 부호화(304)는 하는 과정을 통해 원본신호(300)가 가지는 정보량이 감축될 수 있다. 예를 들면 부호화(304)과정에는 원본신호(300)와 예측신호의 차이에 해당하는 잔차신호 생성과정, 공간 영역 성분인 잔차신호를 주파수 영역 성분으로 변환(transformation)하는 과정, 주파수 영역 성분으로 변환된 잔차신호를 양자화(quantization) 하는 과정 및 양자화된 잔차신호를 엔트로피 부호화 하여 비트스트림을 생성하는 과정 등이 포함될 수 있다. 잔차신호에 대한 비트스트림의 복호화(306)과정이 수행됨으로써 주파수 영역 성분인 잔차신호가 공간 영역 성분으로 변환되고 잔차신호에 기초하여 복원영상(309)이 생성될 수 있다.

부호화하기 위한 영상의 크기가 커짐에 따라 부호화를 위한 정보 처리량이 많아지게 되고 이에 따라 영상의 부호화 및 복호화 효율을 향상시킬 수 있는 과정이 필요하다. 일 실시예에 따르면, 원본영상(300)을 다운샘플링(302)한 압축영상(303)이 생성될 수 있고, 이러한 압축영상(303)에 대한 부호화(304)가 수행될 수 있다. 부호화(304)된 결과를 포함하는 비트스트림이 복호화(306)된 결과, 복호화된 압축영상(307)이 결정될 수 있고, 복호화된 압축영상(307)에 대한 업샘플링(308)이 수행되어 복원영상(309)이 결정될 수 있다. 구체적으로, 다운샘플링(302) 및 업샘플링(308)은 DNN(Deep Neural Network)을 이용하여 수행될 수 있으며, 이러한 DNN을 이용한 다운샘플링(302) 및 업샘플링(308)과정은 다양한 실시예를 통해 후술하도록 한다.

S202단계에서 영상 복원 장치(100)는 일 실시예에 따라 잔차신호 및 예측(prediction)을 수행하여 획득한 예측 신호를 이용하여 압축영상을 복호화할 수 있다. 영상 복원 장치(100)의 복원부(120)는 복호화하려는 압축영상을 소정의 데이터 단위를 기준으로 분할할 수 있다. 예를 들면 복원부(120)는 영상을 복수개의 최대부호화단위로 분할하고, 최대부호화단위를 재귀적으로 분할하여 결정되는 부호화단위를 이용하여 영상을 복호화할 수 있다. 일 실시예에 따라 복원부(120)는 부호화단위에 포함되는 신호를 복호화하기 위하여, 예측과정을 수행할 수 있다. 복원부(120)는 예측과정을 통해 결정되는 예측신호와 S200단계에서 획득한 잔차신호를 가산할 수 있다. 일 실시예에 따라 복원부(120)는 예측신호와 잔차신호를 가산한 결과에 추가적으로 영상을 복호화하기 위한 소정의 과정(예를 들면 인루프 필터링, DPB 저장 과정, 엔트로피 복호화 등)을 수행할 수 있다. 예측 신호 및 잔차 신호를 이용한 영상 복호화 과정에는 해당 기술 분야의 당업자가 용이하게 수행할 수 있는 다양한 과정에 포함될 수 있다.

S204단계에서 영상 복원 장치(100)는 복호화된 압축영상에 DNN을 이용한 업샘플링을 수행하여 영상을 복원할 수 있다. 일 실시예에 따라 S202단계에서 복호화된 영상은 압축영상을 부호화한 정보를 비트스트림으로부터 획득하여 복호화한 결과에 해당할 수 있다. 복원부(120)는 S202단계에서 복호화된 압축영상에 대하여 DNN을 이용한 업샘플링을 수행함으로써 영상을 복원할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 업샘플링을 수행하기 위하여 복수개의 레이어를 포함하는 DNN을 이용할 수 있다. 일 실시예에 따라 복원부(120)는 복수개의 레이어에서 컨볼루션 연산을 수행하기 위하여, 업샘플링을 수행할 수 있는 DNN으로서 심층 컨볼루셔널 신경망(Deep Convolutional Neural Network)을 이용할 수 있다.

일 실시예에 따라 심층 컨볼루셔널 신경망은 복수개의 레이어(예를 들면, 제1 레이어(410) 및 제n 레이어(420)를 포함하는 복수개의 레이어)를 포함할 수 있다. 일 실시예에 따라 심층 컨볼루셔널 신경망을 구성하는 복수개의 레이어 각각에는 필터 커널들을 이용하여 복수의 특성맵(feature map)들을 생성하는 컨볼루션 레이어(Convolution Layer)들과 필터 커널들의 가중치를 조절하는 활성화 레이어(Activation Layer)들이 포함될 수 있다.

컨볼루션 레이어들은 각각 복수개의 노드들을 포함할 수 있다. 일 실시예에 따라 컨볼루션 레이어는 복수개의 필터 커널들을 이용하여, 복수개의 특성맵들을 생성할 수 있다. 컨볼루션 레이어의 노드들이 생성한 특성맵들은 활성화 레이어에 입력될 수 있다. 일 실시예에 따라 복원부(120)는 제1 레이어(410)에 포함된 복수개의 노드(411, 412, 413 등)마다 컨볼루션 연산 및 활성화를 수행할 수 있다. 복원부(120)는 제1 레이어에 포함된 컨볼루션 레이어(CL1_1, CL1_2, …, CL1_a)에서 제1 레이어의 입력신호(예를 들면, 압축신호인 입력(400))에 대한 컨볼루션 연산을 수행할 수 있으며, 각 컨볼루션 레이어(CL1_1, CL1_2, …, CL1_a)에는 서로 다른 필터 커널들이 컨볼루션 연산에 이용될 수 있다. 일 실시예에 따라 각 컨볼루션 레이어(CL1_1, CL1_2, …, CL1_a)에서 컨볼루션 연산된 결과를 활성화 시키기 위하여 각 컨볼루션 레이어와 관련된 활성화 레이어에 컨볼루션 연산된 결과를 입력할 수 있다. 복원부(120)는 컨볼루션 연산 결과를 활성화 시킴으로써 제1 레이어(410)의 복수개의 특성맵들을 결정할 수 있다. 일 실시예에 따라 특정 레이어에서 획득되는 복수개의 특성맵의 개수는 필터 커널의 개수에 비례할 수 있다. 일 실시예에 따라 특정 레이어에서 획득된 특성맵은 다음 레이어의 입력값으로서 이용될 수 있다. 즉, 제1 레이어(410)에서 획득된 특성맵은 제n 레이어(420)(n>1)에 입력되어 컨볼루션 연산 및 활성화가 수행될 수 있다. 이하에서는 설명상의 편의를 위해, 컨볼루션 연산 및 활성화 등을 포함하는 각 레이어에서 수행되는 소정의 신호 처리 과정은 필터링 과정으로 지칭하도록 한다.

일 실시예에 따라 심층 컨볼루션 신경망에 포함되는 복수개의 레이어를 모두 거친 후에는 완전 연결 레이어(Fully Connected Layer)(430)를 거침으로써 출력신호(440)를 획득할 수 있다.

완전 연결 레이어는 제1 레이어(410) 내지 제n 레이어(420)와 연결될 수 있다. 완전 연결 레이어(FC)는 이전 모든 레이어들에 대해 서로 다른 가중치를 부여할 수 있다. 완전 연결 레이어(FC)가 이전 레이어들에 가중치를 부여하는 방식은 학습될 수 있으며 학습되는 방식은 지도 학습 방식을 포함하는 다양한 방식을 포함할 수 있다. 복원부(120)는 학습에 의해 완전 연결 레이어(FC)가 하위 레이어들에 가중치를 부여하는 방식을 변경함으로써, 심층 컨볼루셔널 신경망을 개선할 수 있다.

일 실시예에 따라 활성화 레이어는 컨볼루션 레이어의 출력 결과에 비선형(Non-linear) 특성을 부여할 수 있다. 심층 컨볼루셔널 신경망은 활성화 레이어들을 이용하여 비선형 함수 또는 파라미터를 학습할 수 있다. 활성화 레이어들은 활성화 함수를 이용할 수 있다. 활성화 함수는 시그모이드 함수(sigmoid function), Tanh함수, ReLU(Rectified Linear Unit) 함수 등을 포함할 수 있으나, 이에 한정하여 해석되어서는 안 된다.

심층 컨볼루셔널 신경망은 컨볼루션 레이어들 각각에 포함된 노드들의 가중치들(weights)을 결정할 수 있다. 컨볼루셔널 레이어들 각각에 포함된 노드들은 서로 다른 필터 커널을 이용하여 특성 맵들을 생성할 수 있다. 심층 컨볼루셔널 신경망은 노드들의 가중치들을 조절함으로써, 특성맵들을 생성하는 필터 커널들의 가중치들을 조절할 수 있다.

일 실시예에 따라 복원부(120)는 컨볼루션 레이어들에 포함된 노드들의 가중치를 변경하는 과정을 수행할 수 있다. 복원부(120)가 컨볼루션 레이어들에 포함된 노드들의 가중치를 변경하는 과정을 역전사(Back propagation) 과정이라고 한다. 일 실시예에 따라 복원부(120)는 역전사 과정을 통해, 컨볼루션 신경망을 학습시킬 수 있다.

일 실시예에 따라 복원부(120)는 DNN을 이용하여 다운샘플링된 영상인 압축영상을 복호화한 후, 복호화된 압축 영상을 DNN을 이용하여 업샘플링할 수 있다. 일 실시예에 따라 DNN을 이용한 다운샘플링 또는 업샘플링 과정은 영상의 해상도와 같은 공간적 정보 및 비트레이트와 같은 시간적 정보 중 적어도 하나를 압축 또는 환원시키는 과정에 해당할 수 있다.

도 4b를 참조하면, 다른 실시예에 따른 CNN의 구조가 도시된다.

도 4b의 CNN(450)은 복수개의 평행(parallel)한 레이어들로 구성된 네트워크일 수 있다. 즉, 복수개의 컨볼루션 레이어와 풀링 레이어가 나란히 배열될 수 있다. CNN(450)에서 이전 레이어로부터 출력된 결과는 분리된 복수개의 평행 레이어들에 입력될 수 있다. 분리된 복수개의 평행 레이어들은 각각 상이한 필터를 적용할 수 있다. 예를 들어, 분리된 복수개의 평행 레이어들은 1x1 컨볼루션으로 차원을 줄인 후 3x3, 5x5 등의 컨볼루션을 적용할 수 있다. 다른 레이어에서는 3x3 맥스 풀링을 수행한 후 컨볼루션을 적용할 수도 있다. 1x1 컨볼루션만을 적용하는 레이어는 초기 정보를 유지하는 아이덴티티 루프로서의 기능을 할 수 있다. 컨볼루션을 수행한 복수개의 평행 레이어들은 최종적으로 병합(concatenation)되어 현재 레이어의 계산 결과로서 출력될 수 있다. CNN(450)에 따르면 레이어가 항상 순차적으로 스택(stack)될 필요가 없다. CNN(450)의 구조는 비순차적으로 최적화된 구조의 네트워크가 순차적인 구조의 네트워크보다 오류가 적을 수 있다는 점에 기반한다.

도 4c를 참조하면, 다른 실시예에 따른 CNN의 구조가 도시된다.

도 4c의 CNN(460)은 스킵 레이어(skip layer)의 개념을 사용한 네트워크이다. CNN(460)은 과거 레이어의 입력이 현재 레이어의 출력과 더해지는 구조를 갖는다. CNN(460)에서 과거 레이어와 현재 레이어의 출력이 더해진 결과는 다음 레이어의 입력이 될 수 있다. 일반적인 CNN 구조에서는 다수의 레이어에서 컨볼루션과 풀링 과정을 거치면서 결과값의 크기가 지나치게 작아질 수 있다. 이 경우, 결과값의 정교한(detail) 정보가 사라질 수 있다. CNN(460)은 컨볼루션과 풀링 과정에서 과거의 결과를 재활용함으로써 정교한 부분을 보강할 수 있는 효과가 있다.

도 4d를 참조하면, 다른 실시예에 따른 CNN의 구조가 도시된다.

도 4d의 CNN(470)은 도 4c의 CNN(460)과 마찬가지로 스킵 레이어의 개념을 사용한 네트워크이다. 다만, CNN(470)은 과거의 결과가 임의 위치의 레이어의 입력으로 더해질 수 있다는 점에서 CNN(460)에 비해 레이어들 사이의 관계가 조밀(dense)한 특징을 갖는다. 더 나아가, CNN(470)은 과거 레이어가 컨볼루션 연산을 통해 계산한 결과를 임의 위치의 레이어의 입력 자체로 사용할 수도 있다.

도 4e를 참조하면, 다른 실시예에 따른 CNN의 구조가 도시된다.

도 4e의 CNN(480)은 다층 해상도(multi-resolution)의 피라미드(pyramid) 구조를 사용한 네트워크이다. CNN(480)은 직전의 컨볼루션 레이어의 결과를 여러 단계의 피라미드로 나눌 수 있다. 예를 들어, 1단계에서는 해상도가 스케일링되지 않고, 2단계에는 해상도가 1/2 x 1/2로 스케일링되고, 3단계에서는 해상도가 1/4 x 1/4로 스케일링될 수 있다. 이렇게 얻어진 여러 단계의 결과는 병합(concatenation)되어 완전 연결 레이어(fully connected layer)의 입력으로 사용될 수 있다. 컨볼루션 레이어는 영상의 크기에 영향을 받지 않지만, 완전 연결 레이어(fully connected layer)는 입력 영상의 크기에 제한을 받기 때문에 일반적인 네트워크에서는 입력 영상의 크기가 고정이 될 수 밖에 없었다. 그러나, CNN(480)과 같이 여러 단계의 피라미드 레벨에서 출력되는 특징들을 완전 연결 레이어의 입력으로 사용하고, 피라미드의 출력을 영상의 크기에 관계 없이 사전에 미리 정하면 더 이상 영상의 크기에 제한을 받지 않을 수 있다.

도 4f를 참조하면, 다른 실시예에 따른 CNN의 구조가 도시된다.

도 4f의 CNN(490)은 비선형 함수(ReLu) 이전 또는 이후에 배치 정규화(batch normalization)을 수행하는 구조를 갖는 네트워크이다. 배치 정규화 레이어는 히든 레이어의 앞 단에 위치하며 입력들의 분포를 조절하는 역할을 한다. 또한, 배치 정규화 레이어는 네트워크 내에 흡수된 레이어이므로 역전파(back-propagation)를 통해 관련 변수(스케일, 시프트)를 최적화할 수 있다. 입력의 분포를 개선하는 방식은 각 레이어로 입력되는 데이터에 대하여 평균을 0, 분산을 1로 정규화를 하고, 스케일 변수(γ)를 곱하고, 시프트 변수(β)만큼 더해주는 방식일 수 있다. 이 때, 스케일과 시프트 변수는 학습을 통해 결정될 수 있다. CNN(490)은 컨볼루션 결과를 정규화함으로써 그래디언트 배니싱(gradient vanishing) 또는 그래디언트 익스플로딩(gradient exploding)과 같은 문제점을 방지할 수 있다. 또한, 배치 정규화를 통해 학습 시간이 단축될 수 있으며, 학습의 정확도 개선될 수 있다.

개시된 실시예에서는, 도 4a 내지 4f를 통해 상술한 다양한 구조의 CNN이 적용될 수 있음은 물론이며, 이들의 가능한 조합들 또는 기 공지된 학습 네트워크와의 조합도 적용될 수 있다. 따라서, 상술한 다양한 구조의 CNN은 단지 설명의 편의를 위한 예시에 불과하며, 본 실시예에서는 다양한 방식의 변경된 구조를 갖는 CNN이 사용될 수 있음에 유의하여야 한다.

일 실시예에 따라 복원부(120)는 복호화된 압축영상을 DNN을 이용하여 공간적으로 업샘플링을 수행할 수 있다. 일 실시예에 따라 복원부(120)는 업샘플링을 위하여, 컨볼루션 연산과 관련된 다양한 동작을 수행하기 위한 DNN을 이용할 수 있다. 일 실시예에 따라 복원부(120)는 압축영상의 공간적 성분을 압축되기 전의 원본영상의 공간적 성분에 대응하는 것으로 복원시키기 위하여 DNN을 이용한 업샘플링 동작을 수행할 수 있으며, 이러한 업샘플링 동작은 전치 컨볼루션(Transposed Convolution), 언-풀링(un-pooling) 등의 동작을 포함할 수 있다.

도 5a를 참조하면 복원부(120)는 일 실시예에 따라 압축영상(500)에 포함되는 복수개의 프레임들에 대한 업샘플링을 수행하기 위하여 복수개의 레이어(510, 520, 530)를 포함하는 DNN을 이용할 수 있다. 각 레이어에서는 업샘플링을 위한 전치 컨볼루션이 수행될 수 있다. 복원부(120)는 각 레이어에서 수행되는 전치 컨볼루션 결과에 따라 해상도가 증가한 프레임을 결정할 수 있다. 일 실시예에 따라 복원부(120)는 압축영상(500)의 프레임에 대한 전치 컨볼루션을 제1 레이어(510)에서 수행할 수 있으며, 그 결과 Wu_1 x Hu_1 x Au_1 크기를 가지는 특성맵을 결정할 수 있다. Wu_1 및 Hu_1은 제1 레이어(510)에서 결정된 특성맵의 넓이 및 높이를 나타낼 수 있고 Au_1은 제1 레이어(510)에서 이용되는 필터 커널(512)의 개수에 해당할 수 있다. 일 실시예에 따라 제1 레이어(510)에서 결정되는 특성맵의 넓이(Wu_1) 및 높이(Hu_1)는 제1 레이어(510)에 입력된 압축영상의 프레임의 넓이(W0) 및 높이(H0)보다 크다.

일 실시예에 따라 복원부(120)는 제2 레이어(520)에서 전치 컨볼루션을 수행할 수 있으며, 그 결과 Wu_2 x Hu_2 x Au_2 크기를 가지는 특성맵을 결정할 수 있다. Wu_2 및 Hu_2은 제2 레이어(520)에서 결정된 특성맵 넓이 및 높이를 나타낼 수 있고 Au_2는 제2 레이어(520)에서 이용되는 필터 커널(522)의 개수에 해당할 수 있다. 일 실시예에 따라 제2 레이어(520)의 입력은 제1 레이어(510)의 출력에 해당할 수 있다. 일 실시예에 따라 제2 레이어(520)에서 결정되는 특성맵의 넓이(Wu_2) 및 높이(Hu_2)는 제1 레이어(510)의 특성맵의 넓이(Wu_1) 및 높이(Hu_1)보다 크다.

일 실시예에 따라 복원부(120)는 n개의 레이어를 포함하는 DNN을 이용하여 압축 영상(500)의 업샘플링을 수행할 수 있다. 제n 레이어(530)에서 수행된 업샘플링이 수행되어 결정된 특성맵은 Wu_n x Hu_n x Au_n의 크기를 가질 수 있다. 복원부(120)는 압축영상(500)의 프레임보다 큰 크기를 가지는 제n 레이어의 특성맵을 이용하여 복원영상(540)을 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)의 복원부(120)는 DNN을 이용하여 압축영상을 시간적으로 업샘플링 시킬 수 있다. 일 실시예에 따라 압축영상은 DNN을 이용하여 시간적으로 압축된 영상(예를 들면, 비트레이트가 원본영상에 비해 적은 압축영상)일 수 있다. 일 실시예에 따라 복원부(120)는 DNN(예를 들면, 컨볼루셔널 신경망(Convolutional Neural Network, CNN), 재귀적 신경망(Recurrent Neural Network(RNN)등)을 이용하여 압축영상에 포함된 복수개의 프레임 사이에 추가적인 프레임을 삽입함으로써 시간적 업샘플링을 수행할 수 있다. 일 실시예에 따라 복원부(120)는 압축영상에 포함된 복수개의 프레임 사이에 추가적인 프레임을 추가하기 위하여 입력되는 두 프레임의 비교 결과, 업샘플링 되어야 하는 비트레이트 배율(예를 들면, 30fps에서 60fps로 업샘플링), 두 프레임 사이에 추가되어야 하는 프레임의 개수 등을 고려하여 DNN을 이용한 업샘플링 과정을 수행할 수 있다. 예를 들면, t 시간의 프레임을 복원하기 위하여 복원부(120)는 DNN 입력으로 이전 시간대(t-1, t-2, …)의 프레임 및 이후 시간대(t+1, t+2, …)의 프레임 중 적어도 2개 이상을 이용할 수 있다.

일 실시예에 따라 복원부(120)는 업샘플링에 필요한 프레임의 개수에 따라 미리 결정된 시간대의 프레임을 이용한 시간적 업샘플링을 수행할 수 있다. 예를 들면, 복원부(120)는 t 시간대의 시간적 업샘플링을 위해 필요한 프레임의 개수가 2개이면 t-1, t+1 시간대의 프레임을 이용하여 업샘플링을 수행할 수 있다. 또 다른 예를 들면, 만약 복원부(120)는 t 시간대의 시간적 업샘플링을 위해 필요한 프레임의 개수가 3개이면 t-1, t-2, t+1 시간대 또는 t-1 t+1, t+2 시간대의 프레임을 이용하여 업샘플링을 수행할 수 있다. 또 다른 예를 들면, 만약 복원부(120)는 t 시간대의 시간적 업샘플링을 위해 필요한 프레임의 개수가 3개이면 t-1, t-2, t+1, t+2 시간대의 프레임을 이용하여 업샘플링을 수행할 수 있다.일 실시예에 따라 복원부(120)는 t 시간대의 시간적 업샘플링을 수행하기 위하여, 시간적 업샘플링에 필요한 시간대의 프레임들을 이용할 수 있다. 일 실시예에 따라 복원부(120)는 시간적 업샘플링을 위하여 이용되는 다른 시간대의 프레임들에 대하여 필터링을 수행하여 각 프레임마다의 특성맵을 결정할 수 있다. 복원부(120)는 각 시간대마다 결정된 특성맵들을 연결(concatenate)하여 t 시간대의 프레임에 대한 특성맵으로서 결정할 수 있다. 복원부(120)는 특성맵을 복원하기 위하여 필터링(예를 들면, 컨볼루션 등)을 수행하여 t 시간대의 프레임을 시간적으로 복원할 수 있다. 각 시간대마다의 특성맵들을 연결하는 방법은 상술한 공간적 업샘플링 과정에서 이용된 방법에 대응하는 방법일 수 있다.

일 실시예에 따라 영상 복원 장치(100)의 비트스트림 획득부(110)는 시간적 업샘플링을 필요로 하는 시간대의 프레임이 무엇인지를 나타내는 정보인 시간적 업샘플링 정보를 비트스트림으로부터 획득할 수 있고, 복원부(120)는 획득된 시간적 업샘플링 정보에 기초하여 시간적인 업샘플링을 수행할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 어느 정도로 공간적 및 시간적 업샘플링을 수행하여야 하는지를 나타내는 변경 정보를 비트스트림으로부터 획득하여 업샘플링을 수행할 수 있다. 일 실시예에 따라 복원부(120)는 비트스트림으로부터 획득된 변경정보에 기초하여 압축영상의 해상도를 증가시킬 수 있다. 예를 들면, 획득된 변경정보가 원본영상의 해상도가 압축영상과 2배임을 나타내는 경우, 복원부(120)는 압축영상의 해상도를 2배 증가시키는 업샘플링을 DNN을 이용하여 수행할 수 있다. 또 다른 일 실시예에 따라 복원부(120)는 비트스트림으로부터 획득된 변경정보에 기초하여 원본영상의 비트레이트가 압축영상의 2배를 나타내는 경우, 복원부(120)는 압축영상의 비트레이트를 2배 증가시키는 업샘플링을 DNN을 이용하여 수행할 수 있다. 다만 영상 복원 장치(100)가 획득한 변경 정보에 대하여 상술한 특징은 영상 압축 장치(150)가 영상의 압축한 정도를 나타내는 정보를 포함하는 비트스트림을 생성할 수 있는 특징을 설명하기 위한 실시예에 불과하므로, 변경 정보는 압축된 정도를 나타낼 수 있는 다양한 정보를 포함할 수 있는 것으로 해석되어야 한다.

일 실시예에 따라 영상 복원 장치(100)는 영상 복원 장치(100)의 사항을 고려하여 업샘플링을 수행할 수 있다. 영상 복원 장치(100)의 연산량을 고려하여 업샘플링을 수행함으로써 영상 재생에 최적화된 영상으로 복원할 수 있다. 예를 들면, 영상 복원 장치(100)에 포함된 디스플레이(미도시)가 최대해상도로서 1920x1080의 FHD(Full HD) 해상도만을 지원하고, 압축영상의 해상도가 1280x720인 경우, 복원부(120)는 압축영상의 해상도를 2배 증가시키는 업샘플링을 수행할 수 있다. 또 다른 예를 들면, 영상 복원 장치(100)의 연산량을 고려하였을 때 압축영상의 해상도를 가지는 영상을 60fps로 재생할 수 있는 것으로 결정되는 경우, 복원부(120)는 30fps의 비트레이트를 가지는 압축영상의 비트레이트를 2배 증가시키는 업샘플링을 수행할 수 있다. 또 다른 예를 들면, 영상 복원 장치(100)의 연산량을 고려하였을 때 압축영상의 해상도보다 1.5배 큰 해상도의 영상을 60fps로 재생할 수 있는 것으로 결정되는 경우, 복원부(120)는 30fps의 비트레이트를 가지는 압축영상의 비트레이트를 2배 증가시키고 압축영상의 해상도를 1.5배 증가시키는 업샘플링을 수행할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 DNN을 이용하는 업샘플링을 수행하기 위하여 각 레이어마다 필터 커널을 이용할 수 있으며, 이러한 각 레이어 마다 이용가능한 필터 커널의 종류는 다운샘플링을 위한 필터 커널의 종류와 상이할 수 있다. 즉, 다운샘플링을 위한 DNN과 업샘플링을 위한 DNN에서 포함된 레이어에서 이용되는 필터 커널의 크기 및 개수의 종류가 상이할 수 있다.

일 실시예에 따라 업샘플링을 위한 DNN에 포함되는 m개의 레이어(m은 n과 동일하거나 상이한 정수일 수 있음) 각각에서는 필터 커널이 이용되어 필터링(예를 들면, 전치 컨볼루션(Transposed Convolution) 연산)이 수행될 수 있다. 일 실시예에 따라 업샘플링을 위한 필터링에서 이용될 수 있는 필터 커널의 종류는, 다운샘플링을 위한 필터링에서 이용된 필터 커널의 종류와 상이할 수 있다. 예를 들면, 다운샘플링을 위한 DNN에서 이용된 필터 커널 크기의 종류가 3x3, 3x3, 5x5인 경우라도 복원부(120)는 업샘플링을 위한 DNN에서 이용된 필터 커널 크기의 종류는 3x3, 5x5, 7x7일 수 있다. 일 실시예에 따라 복원부(120)가 DNN의 각 레이어에서 이용할 수 있는 필터 커널의 크기 및 개수의 종류는 다운샘플링을 위한 DNN에서 이용한 필터 커널의 크기 및 개수의 종류와 상이할 수 있다.

일 실시예에 따라 복원부(120)는 각 레이어마다 한 종류의 필터 커널을 이용하여 필터링을 수행할 수 있다. 일 실시예에 따라 DNN의 입력(700)인 압축영상을 복원하기 위하여 복원부(120)는 복수개의 레이어를 포함하는 DNN을 이용할 수 있다. 복원부(120)는 복수개의 레이어 중 제a 레이어(710)에서는 Fw_a x Fh_a의 크기를 가지는 필터 커널(712) A_a개를 이용하여 필터링을 수행하여 W_a x H_a의 크기를 가지는 특성맵 A_a개를 결정할 수 있다.

일 실시예에 따라 복원부(120)는 소정의 레이어에서 복수개의 크기를 가지는 필터 커널을 이용하여 필터링을 수행할 수 있다. 일 실시예에 따라. 복원부(120)는 복수개의 레이어 중 제b 레이어(720)에서는 Fw_b1 x Fh_b1, Fw_b2 x Fh_b2, Fw_b3 x Fh_b3 등의 크기를 가지는 필터 커널(722)을 이용하여 필터링을 수행할 수 있다. 일 실시예에 따라 서로 다른 크기를 가지는 필터 커널들에는 서로 다른 개수의 필터 커널들이 포함될 수 있다. 예를 들면, Fw_b1 x Fh_b1 크기를 가지는 필터 커널은 A_b1개, Fw_b2 x Fh_b2 크기를 가지는 필터 커널은 A_b2개, Fw_b3 x Fh_b3 크기를 가지는 필터 커널은 A_b3개가 필터링에 이용될 수 있다. 일 실시예에 따라 복원부(120)는 복수개의 크기 종류를 가지는 필터 커널들을 이용하여 필터링을 수행함에 따라 이용된 필터 커널의 개수만큼의 특성맵을 결정할 수 있다. 즉, 복원부(120)는 Fw_b1 x Fh_b1, Fw_b2 x Fh_b2, Fw_b3 x Fh_b3의 크기를 가지는 필터 커널(722)들을 이용하여 필터링을 수행함으로써 A_b개의 특성맵을 결정할 수 있고, 이 경우 A_b는 A_b1 + A_b2 + A_b3에 해당할 수 있다. 복원부(120)는 A_b개의 W_b x H_b 크기의 특성맵을 이용한 나머지 복원 과정을 수행함으로써 출력(725)인 복원영상을 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)의 복원부(120)는 임의의 레이어에서 복수개의 크기를 가지는 필터 커널들을 이용하여 특성맵들을 결정할 수 있다. 일 실시예에 따라 복원부(120)는 DNN에 포함되는 복수개의 레이어 중 하나인 제n 레이어(730)에서 복수개의 크기를 가지는 필터커널(732)들을 이용하여 필터링을 수행할 수 있다. 복원부(120)가 필터링(예를 들면, 컨볼루션 연산)을 수행한 결과 복수개의 크기를 가지는 특성맵(740, 742, 744)이 결정될 수 있다. 일 실시예에 따라 제n 레이어에 입력된 특성맵 또는 압축영상의 프레임의 크기가 W_n x H_n인 경우, 복원부(120)는 제n 레이어(730)에서 Fw_n1 x Fh_n1의 크기를 가진 필터 커널을 이용하여 필터링을 수행하여 (W_n ? Fw_n1 + 1) x (H0 ? Fh_n1 + 1) 크기를 가지는 특성맵 A_n1개를 결정할 수 있다. 나아가 복원부(120)는 다른 크기를 필터 커널들을 이용한 필터링을 수행함으로써 (W_n ? Fw_n2 + 1) x (H0 ? Fh_n2 + 1)의 크기를 가지는 특성맵 A_n2개, (W_n ? Fw_n3 + 1) x (H0 ? Fh_n3 + 1)의 크기를 가지는 특성맵 A_n3개 등을 결정할 수 있다.

일 실시예에 따라 복원부(120)는 필터 커널의 크기별로 생성된 특성맵들이 서로 동일한 크기를 가지도록 패딩(padding) 동작을 수행할 수 있다. 일 실시예에 따라 패딩된 특성맵들은 해당 레이어의 입력과 동일한 크기를 가지는 것일 수 있다. 도 7b를 참조하면, 필터 커널의 크기 별로 생성된 복수개의 크기의 특성맵(740, 742, 744)이 제n 레이어(730)에 입력된 특성맵 또는 압축영상의 프레임의 크기인 W_n x H_n와 동일한 크기를 가지도록 특성맵(740, 742, 744)에 패딩을 수행할 수 있다. 이에 따라 패딩된 특성맵(741, 743, 745)들은 서로 동일한 크기(W_n x H_n)를 가질 수 있다. 일 실시예에 따라 복수개의 크기의 필터 커널들이 이용되는 레이어의 입력과 출력은 서로 동일한 평면 크기를 가지는 것을 특징으로 할 수 있다.

일 실시예에 따라 복원부(120)는 복수개의 크기 종류를 가지는 필터 커널들을 이용하여 필터링을 수행함에 따라 이용된 필터 커널의 개수만큼의 특성맵을 결정할 수 있다. 즉, 복원부(120)는 Fw_n1 x Fh_n1, Fw_n2 x Fh_n2, Fw_n3 x Fh_n3의 크기를 가지는 필터 커널(732)들을 이용하여 필터링을 수행하여 특성맵(740, 742, 744)를 결정할 수 있고, 특성맵(740, 742, 744)에 패딩을 수행하여 서로 동일한 크기로 패딩된 특성맵(741, 743, 745)를 결정할 수 있다. 복원부(120)는 패딩된 특성맵(741, 743, 745)을 연결(concatenate)함으로써, 제n 레이어(730)의 출력을 결정할 수 있다. 이에 따라 W_n x H_n 크기의 특성맵을 제n 레이어에 입력하여 필터링을 수행한 결과, W_n x H_n크기를 가지는 특성맵이 A_n1 + A_n2 + A_n3개 출력될 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 영상을 복호화 하고 업샘플링을 수행하기 위하여 다양한 형태의 데이터 단위를 이용할 수 있다. 일 실시예에 따라 복원부(120)에 수행될 수 있는 과정으로서 상술한 다양한 실시예들은 영상의 부호화 과정에서 이용될 수 있는 다양한 데이터 단위들을 기준으로 수행될 수 있다. 일 실시예에 따라 복원부(120)는 비디오, 시퀀스, 프레임, 슬라이스, 슬라이스 세그먼트, 최대부호화단위, 부호화단위, 예측단위, 변환단위, 프로세싱 단위 등을 포함하는 다양한 데이터 단위를 이용하여 영상을 부호화, 업샘플링, 다운샘플링 하는 과정을 수행할 수 있다.

일 실시예에 따라 복원부(120)는 프레임마다 주관적 화질을 결정할 수 있다. 비트스트림 획득부(110)는 얼마나 다운샘플링 되었는지를 나타내는 변경 정보를 픽쳐마다 획득할 수 있다. 일 실시예에 따라 복원부(120)는 다운샘플링 또는 업샘플링을 수행하는 과정을 최대부호화단위마다 수행할 수 있다. 다만 복원부(120)가 소정의 과정을 수행하는 데 이용하는 데이터단위들은 상술한 실시예들에 의해 한정하여 해석되어서는 안되고, 당업자가 이용할 수 있는 범위 내에서 다양한 데이터 단위들이 이용될 수 있는 것으로 해석될 수 있다. 영상 복원 장치(100)가 이용할 수 있는 다양한 데이터 단위들의 특징은 이하의 도 10 내지 도 23을 통해 후술하도록 한다.

이하에서는 영상 복원 장치(100)에서 복원하려는 영상을 압축하는 과정을 수행할 수 있는 영상 압축 장치(150)에 대하여 다양한 실시예를 통해 설명하도록 한다.

일 실시예에 따라 영상 압축 장치(150)는 원본영상을 부호화하고 다운샘플링 과정을 수행하여 압축할 수 있는 압축부(160) 및 압축된 영상에 대한 정보를 포함하는 비트스트림을 생성할 수 있는 비트스트림 생성부(170)를 포함할 수 있다. 일 실시예에 따라 압축부(160)는 메모리 및/또는 저장 장치에 저장된 프로그램 명령(program command)을 실행할 수 있다. 압축부(160)는 중앙 처리 장치(Central Processing Unit; CPU), 그래픽 처리 장치(Graphics Processing Unit; GPU)등을 포함하는 적어도 하나의 프로세서(processor)를 포함할 수 있다.

S210단계에서 영상 압축 장치(150)의 영상에 대한 DNN을 이용한 다운샘플링을 수행하여 압축영상을 결정할 수 있다..

도 3은 일 실시예에 따라 압축된 영상이 부호화 및 복호화 과정을 거쳐 압축되는 과정을 설명하기 위한 도면이다

도 3을 참조하면, 압축부(160)는 원본신호(300)를 부호화(304)는 하는 과정을 통해 원본신호(300)가 가지는 정보량을 감축시킬 수 있다. 예를 들면 부호화(304)과정에는 원본신호(300)와 예측신호의 차이에 해당하는 잔차신호 생성과정, 공간 영역 성분인 잔차신호를 주파수 영역 성분으로 변환(transformation)하는 과정, 주파수 영역 성분으로 변환된 잔차신호를 양자화(quantization) 하는 과정 및 양자화된 잔차신호를 엔트로피 부호화 하여 비트스트림을 생성하는 과정 등이 포함될 수 있다. 잔차신호에 대한 비트스트림의 복호화(306)과정이 수행됨으로써 주파수 영역 성분인 잔차신호가 공간 영역 성분으로 변환되고 잔차신호에 기초하여 압축영상(309)이 생성될 수 있다. 일 실시예에 따라 비트스트림 생성부(170)는 원본영상(300)은 부호화(304)과정을 거침으로써 주파수 영역으로 변환된 결과를 포함하는 비트스트림을 생성할 수 있다.

일 실시예에 따르면, 영상 압축 장치(150)는 원본영상(300)을 다운샘플링(302)하여 압축영상(303)을 생성할 수 있고, 이러한 압축영상(303)에 대한 부호화(304)를 수행할 수 있다. 압축부(160)에서는 오류없는 복호화를 위하여 부호화 과정 뿐만 아니라 이에 대응하는 복호화 과정을 수행할 수 있다. 압축부(160)는 복호화 과정을 수행하여 복호화된 압축영상(307)을 결정할 수 있고, 복호화된 압축영상(307)에 대한 업샘플링(308)을 수행하여 압축영상(309)이 결정될 수 있다. 비트스트림 생성부(170)는 압축영상(309)에 대한 정보를 포함하는 비트스트림을 생성하여 압축영상을 복원할 수 있는 영상 복원 장치(100)로 전달할 수 있다. 일 실시예에 따라, 다운샘플링(302) 및 업샘플링(308)은 DNN(Deep Neural Network)을 이용하여 수행될 수 있으며, 이러한 DNN을 이용한 다운샘플링(302) 및 업샘플링(308)과정은 다양한 실시예를 통해 후술하도록 한다.

S212단계에서 영상 압축 장치(150)는 일 실시예에 따라 잔차신호 및 예측(prediction)을 수행하여 획득한 예측 신호를 이용하여 압축영상을 복호화할 수 있다. 영상 압축 장치(150)의 압축부(160)는 압축하려는 원본영상을 소정의 데이터 단위를 기준으로 분할할 수 있다. 예를 들면 압축부(160)는 영상을 복수개의 최대부호화단위로 분할하고, 최대부호화단위를 재귀적으로 분할하여 결정되는 부호화단위를 이용하여 영상을 복호화할 수 있다. 일 실시예에 따라 압축부(160)는 부호화단위에 포함되는 신호를 복호화하기 위하여, 예측과정을 수행할 수 있다.

S214단계에서 영상 압축 장치는 일 실시예에 따라 압축영상 및 예측신호에 기초하여 잔차신호를 결정할 수 있다. 압축부(160)는 S210단계에서 결정된 압축영상과 S212단계에서 결정된 예측신호를 차분하여 잔차신호를 결정할 수 있다. 일 실시예에 따라 압축부(160)는 잔차신호에 대하여 추가적으로 영상을 부호화하기 위한 소정의 과정(예를 들면 인루프 필터링, DPB 저장 과정, 엔트로피 부호화 등)을 수행할 수 있다. 잔차 신호를 이용한 영상 부호화 과정에는 해당 기술 분야의 당업자가 용이하게 수행할 수 있는 다양한 과정에 포함될 수 있다.

S216단계에서 영상 압축 장치(150)의 비트스트림 생성부(170)는 부호화된 잔차신호와 관련된 정보를 포함하는 비트스트림을 생성할 수 있다.도 4a는 DNN에 포함되는 심층 컨볼루셔널 신경망을 설명하기 위한 도면이다. 일 실시예에 따라 영상 압축 장치(150)는 다운샘플링을 수행하기 위하여 복수개의 레이어를 포함하는 DNN을 이용할 수 있다. 일 실시예에 따라 압축부(160)는 복수개의 레이어에서 컨볼루션 연산을 수행하기 위하여, 다운샘플링을 수행할 수 있는 DNN으로서 심층 컨볼루셔널 신경망(Deep Convolutional Neural Network)을 이용할 수 있다.

컨볼루션 레이어들은 각각 복수개의 노드들을 포함할 수 있다. 일 실시예에 따라 컨볼루션 레이어는 복수개의 필터 커널들을 이용하여, 복수개의 특성맵들을 생성할 수 있다. 컨볼루션 레이어의 노드들이 생성한 특성맵들은 활성화 레이어에 입력될 수 있다. 일 실시예에 따라 압축부(160)는 제1 레이어(410)에 포함된 복수개의 노드(411, 412, 413 등)마다 컨볼루션 연산 및 활성화를 수행할 수 있다. 압축부(160)는 제1 레이어에 포함된 컨볼루션 레이어(CL1_1, CL1_2, …, CL1_a)에서 제1 레이어의 입력신호(예를 들면, 압축신호인 입력(400))에 대한 컨볼루션 연산을 수행할 수 있으며, 각 컨볼루션 레이어(CL1_1, CL1_2, …, CL1_a)에는 서로 다른 필터 커널들이 컨볼루션 연산에 이용될 수 있다. 일 실시예에 따라 각 컨볼루션 레이어(CL1_1, CL1_2, …, CL1_a)에서 컨볼루션 연산된 결과를 활성화 시키기 위하여 각 컨볼루션 레이어와 관련된 활성화 레이어에 컨볼루션 연산된 결과를 입력할 수 있다. 압축부(160)는 컨볼루션 연산 결과를 활성화 시킴으로써 제1 레이어(410)의 복수개의 특성맵들을 결정할 수 있다. 일 실시예에 따라 특정 레이어에서 획득되는 복수개의 특성맵의 개수는 필터 커널의 개수에 비례할 수 있다. 일 실시예에 따라 특정 레이어에서 획득된 특성맵은 다음 레이어의 입력값으로서 이용될 수 있다. 즉, 제1 레이어(410)에서 획득된 특성맵은 제n 레이어(420)(n>1)에 입력되어 컨볼루션 연산 및 활성화가 수행될 수 있다. 이하에서는 설명상의 편의를 위해, 컨볼루션 연산 및 활성화 등을 포함하는 각 레이어에서 수행되는 소정의 신호 처리 과정은 필터링 과정으로 지칭하도록 한다. 일 실시예에 따라 영상 압축 장치(150)가 이용할 수 있는 DNN에 대한 특징은 도 4a에서 상술한 영상 복원 장치(100)가 이용하는 DNN의 특징과 동일하거나 유사한 특징일 수 있으므로 자세한 설명은 생략하도록 한다.

일 실시예에 따라 압축부(160)는 원본영상을 DNN을 이용하여 공간적으로 다운샘플링을 수행할 수 있다. 일 실시예에 따라 압축부(160)는 다운샘플링을 위하여, 컨볼루션 연산과 관련된 다양한 동작을 수행하기 위한 DNN을 이용할 수 있다. 일 실시예에 따라 압축부(160)가 수행하는 다운샘플링 동작은 컨볼루션(Convolution), 풀링(pooling) 등의 동작을 포함할 수 있다.

도 5b를 참조하면 압축부(160)는 일 실시예에 따라 원본영상(550)에 포함되는 복수개의 프레임들에 대한 다운샘플링을 수행하기 위하여 복수개의 레이어(560, 570, 580)를 포함하는 DNN을 이용할 수 있다. 각 레이어에서는 다운샘플링을 위한 컨볼루션이 수행될 수 있다. 압축부(160)는 각 레이어에서 수행되는 컨볼루션 결과에 따라 해상도가 감소한 프레임을 결정할 수 있다. 일 실시예에 따라 압축부(160)는 원본영상(550)의 프레임에 대한 컨볼루션을 제1 레이어(560)에서 수행할 수 있으며, 그 결과 Wd_1 x Hd_1 x Ad_1 크기를 가지는 특성맵을 결정할 수 있다. Wd_1 및 Hd_1은 제1 레이어(560)에서 결정된 특성맵의 넓이 및 높이를 나타낼 수 있고 Ad_1은 제1 레이어(560)에서 이용되는 필터 커널(562)의 개수에 해당할 수 있다. 일 실시예에 따라 제1 레이어(560)에서 결정되는 특성맵의 넓이(Wd_1) 및 높이(Hd_1)는 제1 레이어(560)에 입력된 원본영상의 프레임의 넓이(W0) 및 높이(H0)보다 작다.

일 실시예에 따라 압축부(160)는 제2 레이어(570)에서 컨볼루션을 수행할 수 있으며, 그 결과 Wd_2 x Hd_2 x Ad_2 크기를 가지는 특성맵을 결정할 수 있다. Wd_2 및 Hd_2은 제2 레이어(570)에서 결정된 특성맵 넓이 및 높이를 나타낼 수 있고 Ad_2는 제2 레이어(570)에서 이용되는 필터 커널(572)의 개수에 해당할 수 있다. 일 실시예에 따라 제2 레이어(570)의 입력은 제1 레이어(560)의 출력에 해당할 수 있다. 일 실시예에 따라 제2 레이어(570)에서 결정되는 특성맵의 넓이(Wd_2) 및 높이(Hd_2)는 제1 레이어(560)의 특성맵의 넓이(Wd_1) 및 높이(Hd_1)보다 작다.

일 실시예에 따라 압축부(160)는 n개의 레이어를 포함하는 DNN을 이용하여 원본영상(550)의 다운샘플링을 수행할 수 있다. 제n 레이어(580)에서 수행된 다운샘플링이 수행되어 결정된 특성맵은 Wd_n x Hd_n x Ad_n의 크기를 가질 수 있다. 압축부(160)는 원본영상(550)의 프레임보다 작은 크기를 가지는 제n 레이어의 특성맵을 이용하여 압축영상(540)을 결정할 수 있다.

일 실시예에 따라 영상 압축 장치(150)의 압축부(160)는 DNN을 이용하여 원본영상을 시간적으로 다운샘플링 시킬 수 있다. 일 실시예에 따라 압축영상은 DNN을 이용하여 시간적으로 압축된 영상(예를 들면, 비트레이트가 원본영상에 비해 적은 압축영상)일 수 있다. 일 실시예에 따라 압축부(160)는 DNN(예를 들면, 컨볼루셔널 신경망(Convolutional Neural Network, CNN), 재귀적 신경망(Recurrent Neural Network(RNN)등)을 이용하여 원본영상에 포함된 복수개의 프레임들 가운데 소정의 프레임을 제거하는 시간적 다운샘플링을 수행할 수 있다. 일 실시예에 따라 압축부(160)는 원본영상에 포함된 소정의 프레임을 제거하기 위하여 입력되는 복수개의 프레임들의 비교 결과, 다운샘플링 되어야 하는 비트레이트 배율(예를 들면, 60fps에서 30fps로 다운샘플링), 제거될 프레임의 개수 등을 고려하여 DNN을 이용한 다운샘플링 과정을 수행할 수 있다. 예를 들면, t 시간의 프레임을 제거하기 위하여 복원부(120)는 DNN 입력으로 이전 시간대(t-1, t-2, …)의 프레임 및 이후 시간대(t+1, t+2, …)의 프레임 중 적어도 2개 이상을 이용할 수 있다.

일 실시예에 따라 압축부(160)는 다운샘플링에 필요한 프레임의 개수에 따라 미리 결정된 시간대의 프레임을 이용한 시간적 다운샘플링을 수행할 수 있다. 예를 들면, 압축부(160)는 t 시간대의 시간적 다운샘플링을 위해 필요한 프레임의 개수가 2개이면 t-1, t+1 시간대의 프레임을 이용하여 다운샘플링을 수행할 수 있다. 또 다른 예를 들면, 만약 압축부(160)는 t 시간대의 시간적 다운샘플링을 위해 필요한 프레임의 개수가 3개이면 t-1, t-2, t+1 시간대 또는 t-1 t+1, t+2 시간대의 프레임을 이용하여 t 시간대의 프레임에 대한 다운샘플링을 수행할 수 있다. 또 다른 예를 들면, 만약 압축부(160)는 t 시간대의 프레임에 대한 시간적 다운샘플링을 위해 필요한 프레임의 개수가 3개이면 t-1, t-2, t+1, t+2 시간대의 프레임을 이용하여 다운샘플링을 수행할 수 있다.

일 실시예에 따라 압축부(160)는 t 시간대의 시간적 다운샘플링을 수행하기 위하여, 시간적 업샘플링에 필요한 시간대의 프레임들을 이용할 수 있다. 일 실시예에 따라 복원부(120)는 시간적 다운샘플링을 위하여 이용되는 다른 시간대의 프레임들에 대하여 필터링을 수행하여 각 프레임마다의 특성맵을 결정할 수 있다.

일 실시예에 따라 복원부(120)는 각 시간대마다 결정된 특성맵들의 움직임 정보(예를 들면, global motion vector, local motion vector 등)를 고려하여 복수개의 프레임 중 움직임이 적은 프레임들인 것으로 결정되는 경우, 복수개의 프레임의 사이에 포함되는 프레임을 제거하기 위한 시간적 다운샘플링을 수행할 수 있다.

일 실시예에 따라 복원부(120)는 각 시간대마다 결정된 특성맵을 비교하여 복수개의 시간대의 프레임이 서로 다른 장면(scene)인 것으로 결정되는 경우, 복수개의 시간대의 프레임 사이의 프레임에 대하여는 시간적 다운샘플링을 수행하지 않는 것으로 결정할 수 있다.

일 실시예에 따라 영상 압축 장치(150)의 압축부(160)는 시간적 다운샘플링이 수행될 프레임이 무엇인지를 결정할 수 있고, 비트스트림 생성부(170)는 시간적 다운샘플링이 수행된 시간대의 프레임이 무엇인지를 나타내는 정보인 시간적 다운샘플링 정보를 포함하는 비트스트림을 생성할 수 있다.

일 실시예에 따라 영상 압축 장치(150)는 어느 정도로 공간적 및 시간적 다운샘플링을 수행하여야 하는지를 나타내는 변경정보를 포함하는 비트스트림을 생성할 수 있다. 일 실시예에 따라 압축부(160)가 원본영상의 해상도를 2배 압축시키는 다운샘플링을 수행한 경우, 비트스트림 생성부(170)는 원본영상의 해상도가 압축영상과 2배임을 나타내는 변경정보를 포함하는 비트스트림을 생성할 수 있다. 또 다른 일 실시예에 따라 압축부(160)가 원본영상의 비트레이트를 1/2배로 축소시키는 다운샘플링을 수행하는 경우, 비트스트림 생성부(170)는 압축영상의 비트레이트가 원본영상의 1/2배 축소된 것임을 나타내는 변경정보를 포함하는 비트스트림을 생성할 수 있다. 다만 영상 압축 장치(150)가 생성할 수 있는 비트스트림에 포함된 변경 정보에 대하여 상술한 특징은 영상 압축 장치(150)가 영상의 압축한 정도를 나타내는 정보를 포함하는 비트스트림을 생성할 수 있는 특징을 설명하기 위한 실시예에 불과하므로, 변경 정보는 압축된 정도를 나타낼 수 있는 다양한 정보를 포함할 수 있는 것으로 해석되어야 한다.

일 실시예에 따라 영상 복원 장치(100)는 DNN을 이용하는 업샘플링을 수행하기 위하여 각 레이어마다 필터 커널을 이용할 수 있으며, 이러한 각 레이어 마다 이용가능한 필터 커널의 종류는 다운샘플링에서 이용되는 필터 커널의 종류와 상이할 수도 있다.

일 실시예에 따라 압축부(160)는 다운샘플링된 압축영상(635)를 생성하기 위하여 n개의 레이어(610, 620, 630)를 포함하는 DNN을 이용할 수 있다. 각 레이어에서는 다운샘플링을 위한 과정으로서 필터 커널을 이용한 필터링(예를 들면 컨볼루션(convolution) 연산)이 수행할 수 있다. 각 레이어마다 필터링을 위하여 이용되는 필터 커널(612, 622, 632)의 크기는 적어도 하나의 종류의 크기일 수 있다. 예를 들면, 제1 레이어(610)에서 5x5의 크기를 가지는 Au_1개의 필터 커널을 이용하여 필터링이 수행될 수 있고, 제2 레이어(620)에서 3x3의 크기를 가지는 Au_2개의 필터 커널을 이용하여 필터링이 수행될 수 있고, 제n 레이어(630)에서 3x3의 크기를 가지는 Au_1개의 필터 커널을 이용하여 필터링이 수행될 수 있다. 일 실시예에 따라 압축부(160)는 n개의 레이어를 거치면서 다운샘플링 된 압축영상(635)을 업샘플링 시키기 위하여 DNN을 이용할 수 있다.

일 실시예에 따라 업샘플링을 위한 DNN에 포함되는 m개의 레이어(m은 n과 동일하거나 상이한 정수일 수 있음) 각각에서는 필터 커널이 이용되어 필터링(예를 들면, 전치 컨볼루션(Transposed Convolution) 연산)이 수행될 수 있다. 일 실시예에 따라 업샘플링을 위한 필터링에서 이용될 수 있는 필터 커널의 종류는, 다운샘플링을 위한 필터링에서 이용된 필터 커널의 종류와 상이할 수 있다. 예를 들면, 다운샘플링을 위한 DNN에서 이용된 필터 커널 크기의 종류가 3x3, 3x3, 5x5인 경우라도 압축부(160)는 업샘플링을 위한 DNN에서 이용된 필터 커널 크기의 종류는 3x3, 5x5, 7x7일 수 있다. 일 실시예에 따라 압축부(160)가 DNN의 각 레이어에서 이용할 수 있는 필터 커널의 크기 및 개수의 종류는 다운샘플링을 위한 DNN에서 이용한 필터 커널의 크기 및 개수의 종류와 상이할 수 있다.

즉, 압축부(160)는 다운샘플링을 위한 DNN을 이용하여 원본영상을 다운샘플링할 수 있고, 다운샘플링된 압축영상을 이용하여 부호화된 잔차신호를 생성할 수 있다. 압축부(160)는 잔차신호를 복호화한 후 다시 DNN을 이용한 업샘플링을 수행함으로써 복원신호를 결정할 수 있으며, 다운샘플링 및 업샘플링 과정에서 이용된 DNN들 간의 학습과정은 공유될 수 있다. DNN의 학습과정에 대하여는 이후에 실시예를 통해 후술하도록 한다.도 7a는 일 실시예에 따라 DNN에 포함되는 복수개의 레이어 중 소정의 레이어에서 복수개의 필터 커널을 이용하여 필터링을 수행하는 특징을 설명하기 위한 도면이다.

일 실시예에 따라 압축부(160)는 각 레이어마다 한 종류의 필터 커널을 이용하여 필터링을 수행할 수 있다. 일 실시예에 따라 DNN의 입력(700)인 원본영상을 압축하기 위하여 압축부(160)는 복수개의 레이어를 포함하는 DNN을 이용할 수 있다. 압축부(160)는 복수개의 레이어 중 제a 레이어(710)에서는 Fw_a x Fh_a의 크기를 가지는 필터 커널(712) A_a개를 이용하여 필터링을 수행하여 W_a x H_a의 크기를 가지는 특성맵 A_a개를 결정할 수 있다.

일 실시예에 따라 압축부(160)는 소정의 레이어에서 복수개의 크기를 가지는 필터 커널을 이용하여 필터링을 수행할 수 있다. 일 실시예에 따라. 압축부(160)는 복수개의 레이어 중 제b 레이어(720)에서는 Fw_b1 x Fh_b1, Fw_b2 x Fh_b2, Fw_b3 x Fh_b3 등의 크기를 가지는 필터 커널(722)을 이용하여 필터링을 수행할 수 있다. 일 실시예에 따라 서로 다른 크기를 가지는 필터 커널들에는 서로 다른 개수의 필터 커널들이 포함될 수 있다. 예를 들면, Fw_b1 x Fh_b1 크기를 가지는 필터 커널은 A_b1개, Fw_b2 x Fh_b2 크기를 가지는 필터 커널은 A_b2개, Fw_b3 x Fh_b3 크기를 가지는 필터 커널은 A_b3개가 필터링에 이용될 수 있다. 일 실시예에 따라 압축부(160)는 복수개의 크기 종류를 가지는 필터 커널들을 이용하여 필터링을 수행함에 따라 이용된 필터 커널의 개수만큼의 특성맵을 결정할 수 있다. 즉, 압축부(160)는 Fw_b1 x Fh_b1, Fw_b2 x Fh_b2, Fw_b3 x Fh_b3의 크기를 가지는 필터 커널(722)들을 이용하여 필터링을 수행함으로써 A_b개의 특성맵을 결정할 수 있고, 이 경우 A_b는 A_b1 + A_b2 + A_b3에 해당할 수 있다. 압축부(160)는 A_b개의 W_b x H_b 크기의 특성맵을 이용한 나머지 압축 과정을 수행함으로써 DNN의 출력(725)인 압축영상을 결정할 수 있다.

일 실시예에 따라 영상 압축 장치(150)의 압축부(160)는 임의의 레이어에서 복수개의 크기를 가지는 필터 커널들을 이용하여 특성맵들을 결정할 수 있다. 일 실시예에 따라 압축부(160)는 DNN에 포함되는 복수개의 레이어 중 하나인 제n 레이어(730)에서 복수개의 크기를 가지는 필터커널(732)들을 이용하여 필터링을 수행할 수 있다. 압축부(160)가 필터링(예를 들면, 컨볼루션 연산)을 수행한 결과 복수개의 크기를 가지는 특성맵(740, 742, 744)이 결정될 수 있다. 일 실시예에 따라 제n 레이어에 입력된 특성맵 또는 압축영상의 프레임의 크기가 W_n x H_n인 경우, 압축부(160)는 제n 레이어(730)에서 Fw_n1 x Fh_n1의 크기를 가진 필터 커널을 이용하여 필터링을 수행하여 (W_n ? Fw_n1 + 1) x (H0 ? Fh_n1 + 1) 크기를 가지는 특성맵 A_n1개를 결정할 수 있다. 나아가 압축부(160)는 다른 크기를 필터 커널들을 이용한 필터링을 수행함으로써 (W_n ? Fw_n2 + 1) x (H0 ? Fh_n2 + 1)의 크기를 가지는 특성맵 A_n2개, (W_n ? Fw_n3 + 1) x (H0 ? Fh_n3 + 1)의 크기를 가지는 특성맵 A_n3개 등을 결정할 수 있다.

일 실시예에 따라 압축부(160)는 필터 커널의 크기별로 생성된 특성맵들이 서로 동일한 크기를 가지도록 패딩(padding) 동작을 수행할 수 있다. 일 실시예에 따라 패딩된 특성맵들은 해당 레이어의 입력과 동일한 크기를 가지는 것일 수 있다. 도 7b를 참조하면, 필터 커널의 크기 별로 생성된 복수개의 크기의 특성맵(740, 742, 744)이 제n 레이어(730)에 입력된 특성맵의 크기인 Wd_n x H_n와 동일한 크기를 가지도록 특성맵(740, 742, 744)에 패딩을 수행할 수 있다. 이에 따라 패딩된 특성맵(741, 743, 745)들은 서로 동일한 크기(W_n x H_n)를 가질 수 있다. 일 실시예에 따라 복수개의 크기의 필터 커널들이 이용되는 레이어의 입력과 출력은 서로 동일한 평면 크기를 가지는 것을 특징으로 할 수 있다.

일 실시예에 따라 압축부(160)는 복수개의 크기 종류를 가지는 필터 커널들을 이용하여 필터링을 수행함에 따라 이용된 필터 커널의 개수만큼의 특성맵을 결정할 수 있다. 즉, 압축부(160)는 Fw_n1 x Fh_n1, Fw_n2 x Fh_n2, Fw_n3 x Fh_n3의 크기를 가지는 필터 커널(732)들을 이용하여 필터링을 수행하여 특성맵(740, 742, 744)를 결정할 수 있고, 특성맵(740, 742, 744)에 패딩을 수행하여 서로 동일한 크기로 패딩된 특성맵(741, 743, 745)를 결정할 수 있다. 압축부(160)는 패딩된 특성맵(741, 743, 745)을 연결(concatenate)함으로써, 제n 레이어(730)의 출력을 결정할 수 있다. 이에 따라 W_n x H_n 크기의 특성맵을 제n 레이어에 입력하여 필터링을 수행한 결과, W_n x H_n크기를 가지는 특성맵이 A_n1 + A_n2 + A_n3개 출력될 수 있다.

도 8을 참조하면, 영상 압축 장치(150)의 압축부(160)는 원본영상(800)을 다운샘플링할 수 있는 다운샘플링DNN(806)을 이용하여 다운샘플링된 영상(808)을 결정할 수 있다. 일 실시예에 따라 다운샘플링DNN(806)을 통해 결정된 다운샘플링된 영상(808)은 영상의 구조적 특징(예를 들면, 휘도(hue), 대비(contrast), 히스토그램(histogram) 등)이 원본영상(800)과 비교하였을 때 차이가 클 수 있다. 원본영상(800)에 비해 다운샘플링된 영상(808)이 구조적 특징의 크게 달라지는 경우 부호화 효율이 저하될 수 있다. 부호화 효율 저하 방지를 위해, 일 실시예에 따라 복원부(160)의 구조적 정보 보존부(802)는 원본영상(800)의 상기 구조적 특징을 이용하면서 원본영상(800)보다 공간적으로 크기가 축소된 구조적 복원 영상(804)을 결정할 수 있고, 압축부(160)는 다운샘플링된 영상(808)과 구조적 복원 영상(804)을 서로 비교할 수 있다. 일 실시예에 따라 다운샘플링된 영상(800) 및 구조적 복원 영상(804)은 공간적으로 동일하거나 유사한 해상도를 가지는 것을 특징으로 할 수 있다.

일 실시예에 따라 구조적 정보 보존부(802)는 휘도, 대비, 히스토그램, 영상 압축률, 부호화 품질, 압축 히스토리(history) 정보, 압축할 원본영상의 타입 등 다양한 구조적 특징을 고려하여 구조적 보존 영상(804)를 생성하고, 구조적 보존 영상(804)과의 비교 결과에 따라 다운샘플링된 영상(808)을 생성할 수 있다. 일 실시예에 따라 구조적 정보에는 원본 영상(800)에 기초하여 미리 결정된 정보들이 포함될 수 있으며, 입력되는 신호 또는 파라미터 정보에 기초하여 결정되는 구조적 정보가 포함될 수도 있다.

일 실시예에 따라, 구조적 정보 보존부(802)는 원본 영상(800)의 휘도, 대비, 히스토그램 등의 구조적 특징을 이용하여, 원본 영상(800)의 구조적 특징과 유사한 특징을 가지면서 영상의 공간적 크기 또는 해상도가 축소된 구조적 보존 영상(804)을 생성할 수 있다.

일 실시예에 따라 구조적 정보 보존부(802)는 원본 영상(800)을 엔트로피 부호화 하는 정도를 나타내는 부호화 품질 또는 압축률에 기초하여 구조적 보존 영상(804)을 생성할 수 있다. 예를 들면, 사용자 또는 외부로부터 입력 받은 정보에 기초하여 결정되는 부호화 품질 또는 미리 결정된 부호화 품질에 따라 구조적 보존 영상(804)의 공간적 해상도가 결정될 수 있으며, 이에 따라 다운샘플링 DNN에 의해 수행되는 다운샘플링 결과인 압축 영상의 공간적 해상도가 결정될 수 있다.

일 실시예에 따라 구조적 정보 보존부(802)는 영상 압축 장치(150)에 저장된 압축 히스토리 정보를 이용하여 다운샘플링된 영상(808)을 생성할 수 있다. 일 실시예에 따라 영상 압축 장치(150)는 저장부(미도시)에 저장되어 있거나 외부로부터 수신한 압축 히스토리 정보를 이용하여, 구조적 보존 영상(804)의 공간적 해상도를 결정할 수 있고, 이에 따라 다운샘플링된 영상(808)의 공간적 크기가 결정될 수 있다. 구체적으로, 영상 압축 장치(150)가 이용할 수 있는 압축 히스토리 정보에 따르면, 사용자가 선호하는 부호화 품질 또는 압축률 등이 결정될 수 있으며, 압축 히스토리 정보에 기초하여 결정된 부호화 품질에 따라 구조적 보존 영상(804)의 크기 및 다운샘플링된 영상(808)의 크기가 결정될 수 있다. 예를 들면, 압축 히스토리 정보에 따라 가장 많이 이용된 적이 있는 부호화 품질에 따라 구조적 보존 영상(804)의 크기 및 다운샘플링된 영상(808)의 크기가 결정될 수 있다. 또 다른 예를 들면, 압축 히스토리 정보에 따라 소정의 임계값보다 많이 이용된 적이 있는 부호화 품질에 기초하여(예를 들면, 소정의 임계값보다 많이 이용된 적이 있는 부호화 품질의 평균 품질을 이용) 구조적 보존 영상(804)의 크기 및 다운샘플링된 영상(808)의 크기가 결정될 수 있다.

일 실시예에 따라 구조적 정보 보존부(802)는 원본 영상(800)의 타입에 기초하여 구조적 보존 영상(804)을 생성할 수 있다. 일 실시예에 따라 소정의 영상의 해상도를 n% 축소시키면 이후에 복원하더라도 구조적 정보 또는 영상 품질이 원본영상(800)과 유사할 수 있지만, 소정의 영상과 공간적 해상도가 동일하지만 타입이 다른 영상의 경우 해상도를 m% 축소시켜야만 이후에 복원하더라도 구조적 정보 또는 영상 품질이 원본영상(800)과 유사해질 수도 있다. 구조적 정보 보존부(802)는 이러한 원본 영상(800)의 타입을 고려하여 공간적 해상도를 축소시키는 비율(즉, "축소 정보")을 결정하고, 이에 따라 구조적 보존 영상(804)을 생성할 수 있다.

한편, 축소 정보는 구조적 정보 보존부(802)로부터 결정될 수도 있으나, 사용자의 입력에 따라 임의로 결정될 수도 있다. 일 실시예에 따른 축소 정보는 부호화되어 비트스트림을 통해 전송될 수 있다.

일 실시예에 따른 다운샘플링DNN(806)은 축소 정보에 기초하여 원본 영상(800)을 다운샘플링할 수 있다. 이 때, 다운샘플링을 수행하기 위해 필요한 다운샘플링DNN(806)의 구조는 축소 정보가 나타내는 축소 비율에 따라 상이할 수 있다. 예를 들어, 원본 영상(800)을 최대 비율로 축소하기 위해서는 다운샘플링DNN(806) 내의 전체 레이어가 이용되어야 하는 반면, 원본 영상(800)을 최대 비율보다 작은 비율로 축소할 경우 다운샘플링DNN(806) 내의 일부 레이어는 반드시 이용되지 않아도 될 수 있다.

즉, 일 실시예에 따른 다운샘플링DNN(806)은 레이어의 일부만 이용하여 원본 영상(800)의 축소 정도를 조절할 수 있다. 그리고, 이 때, 다운샘플링DNN(806) 내에서 다운샘플링을 위해 이용되어야 할 레이어는 축소 정보에 기초하여 결정될 수 있다.

일 실시예에 따른 다운샘플링DNN(806)은 영상의 구조적 정보, 압축 비트량, 복원 네트워크를 고려하여 학습된 네트워크이다. 이 때, 다운샘플링DNN(806)의 학습은, 학습을 위해 제공된 입출력 데이터 셋에 기초하여 다운샘플링DNN(806)을 구성하는 복수의 네트워크 노드들의 연결관계 및 가중치가 업데이트되는 방식으로 이루어진다. 따라서, 일 실시예에 따른 다운샘플링DNN(806)은 항시 업데이트 가능한 네트워크일 수 있다.

일 실시예에 따라 압축부(160)는 구조적 복원 영상(804) 및 다운샘플링된 압축영상(808) 간의 차이의 크기(norm)를 나타내는 제1 손실정보(812)를 결정할 수 있다. 일 실시예에 따라 압축부(160)는 다운샘플링된 압축영상(808)에 포함되는 공간적 복잡도를 나타내는 제2 손실정보(814)를 결정할 수 있다. 일 실시예에 따라 압축부(160)는 다운샘플링된 압축영상(808)의 공간적 복잡도를 결정하기 위하여 총 분산(total variance)값을 계산하여 제2 손실정보(814)로서 결정할 수 있다.

일 실시예에 따라 다운샘플링된 영상(908)은 업샘플링DNN(910)을 통해 업샘플링이 수행될 수 있고, 그 결과 복원영상(916)이 결정될 수 있다. 일 실시예에 따라 업샘플링DNN(910)의 입력은 다운샘플링된 영상(908)이거나 또는 다운샘플링된 영상(908)이 부호화된 후 다시 복호화 된 영상일 수 있다.

일 실시예에 따라 압축부(160)는 원본영상(900) 및 복원영상(916)을 비교하여 제3 손실정보(918) 및 제4 손실정보(920)를 결정할 수 있다. 일 실시예에 따라 제3 손실정보(918)는 원본영상(900) 및 복원영상(916)간의 차이에 대한 L¹-norm값을 나타낼 수 있고, 제4 손실정보(920)는 원본영상(900) 및 복원영상(916)간의 차이에 대한 L²-norm값을 나타낼 수 있다. 일 실시예에 따라 L¹-norm은 원본영상(900) 및 복원영상(916)간의 차이를 나타내는 벡터 성분들의 절대값을 합한 결과일 수 있다. 일 실시예에 따라 L²-norm은 원본영상(900) 및 복원영상(916)간의 차이를 나타내는 벡터 성분의 제곱합(sum of squares)의 루트값을 나타낼 수 있다.

일 실시예에 따라 압축부(160)는 업샘플링을 위한 DNN 및 다운샘플링을 위한 DNN을 다음과 같은 수학식1을 통해 학습시킬 수 있다.

수학식 1

일 실시예에 따라 Loss_DS 는 다운샘플링에 의해 발생하는 손실(loss)을 나타내는 적어도 하나의 손실정보의 합에 해당할 수 있다. 일 실시예에 따라 Loss_US 는 다운샘플링된 영상과 다운샘플링이 수행되기 전의 원본 영상 간의 비교에 의해 결정되는 적어도 하나의 손실정보의 합에 해당할 수 있다. 일 실시예에 따라 a, b, c, d는 미리 결정된 소정의 가중치에 해당할 수 있다.

일 실시예에 따라 압축부(160)는 Loss_DS 와 Loss_US 를 결정하기 위하여 임의의 손실정보를 공유할 수 있다. 일 실시예에 따라 압축부(160)는 수학식 1과 같이 제4 손실정보에 기초하여 Loss_DS 와 Loss_US 를 결정할 수 있다. 다만 Loss_DS 와 Loss_US 를 결정하는 과정에서 공유되는 정보가 상술한 실시예에 한정하여 해석되어서는 안되며, 당업자가 용이하게 실시 가능한 범위내에서 다양한 손실정보가 Loss_DS 와 Loss_US 를 결정하는 과정에서 공통적으로 이용될 수 있는 것으로 해석되어야 한다.

일 실시예에 따라 영상 복원 장치(100)의 복원부(120)가 이용할 수 있는 업샘플링을 위한 DNN은 압축영상이 복호화 된 후 업샘플링이 수행됨으로써 복원된 영상과 다운샘플링이 수행되기 전의 원본 영상 간의 비교에 의해 결정되는 적어도 하나의 손실정보의 합이 감소되도록 학습된 것을 특징으로 할 수 있다. 수학식 1을 참조하면, 일 실시예에 따라 복원부(120)는 가중치가 적용된 제3 손실 정보 및 제4 손실정보에 기초하여 Loss_US 가 최소값을 가지도록 학습될 수 있다. 복원부(120)는 Loss_US 가 최소값을 가지도록 업샘플링을 위한 DNN을 학습시킴으로써, 복원 성능을 우선하도록 학습된 DNN을 이용하여 업샘플링을 수행할 수 있다.

일 실시예에 따라 업샘플링을 위한 DNN의 학습 과정에서 이용되는 적어도 하나의 손실정보 중 일부는 다운샘플링을 위한 DNN의 학습 과정에서도 이용된 것일 수 있다. 수학식1을 참조하면, 일 실시예에 따라 Loss_US 가 결정되기 위하여 이용되는 제4 손실정보는 Loss_DS의 결정 과정에서 이용된 손실 정보 중 하나일 수 있다.

또 다른 일 실시예에 따라 영상 압축 장치(150)의 압축부(160)에 의해 이용되는 다운샘플링을 위한 DNN은, 다운샘플링에 의해 발생하는 손실을 나타내는 적어도 하나의 손실정보의 합이 감소되도록 학습된 것일 수 있다. 수학식 1을 참조하면, 일 실시예에 따라 압축부 (160)는 가중치가 적용된 제1 손실 정보 및 제2 손실정보 및 제4 손실정보에 기초하여 Loss_DS 가 최소값을 가지도록 학습될 수 있다. 압축부(160)는 Loss_DS 가 최소값을 가지도록 다운샘플링을 위한 DNN을 학습시킴으로써, 압축 성능 및 복원 성능을 우선하도록 학습된 DNN을 이용하여 다운샘플링을 수행할 수 있다.

일 실시예에 따라 다운샘플링을 위한 DNN의 학습과정에서 이용되는 적어도 하나의 손실정보 중 일부는, 압축영상이 복호화 된 후 업샘플링이 수행됨으로써 복원된 영상과 다운샘플링이 수행되기 전의 원본 영상 간의 비교 결과에 기초하여 결정된 것일 수 있고, 비교 결과는 업샘플링을 위한 DNN의 학습 과정에서 이용되는 것일 수 있다. 수학식 1을 참조하면 제4 손실정보는 다운샘플링을 위한 DNN의 학습과정뿐만 아니라 업샘플링을 위한 DNN의 학습과정에서도 이용된 것일 수 있다.

일 실시예에 따라 압축부(160)에 수행될 수 있는 과정으로서 상술한 다양한 실시예들은 영상의 부호화 과정에서 이용될 수 있는 다양한 데이터 단위들을 기준으로 수행될 수 있다. 일 실시예에 따라 압축부(160)는 비디오, 시퀀스, 프레임, 슬라이스, 슬라이스 세그먼트, 최대부호화단위, 부호화단위, 예측단위, 변환단위, 프로세싱 단위 등을 포함하는 다양한 데이터 단위를 이용하여 영상을 부호화, 다운샘플링, 업샘플링 하는 과정을 수행할 수 있다. 비트스트림 생성부(170)는 원본영상이 다운샘플링을 통해 얼마나 압축되었는지를 나타내는 변경 정보를 포함하는 비트스트림을 픽쳐마다 생성할 수 있다. 일 실시예에 따라 압축부(160)는 다운샘플링 또는 업샘플링을 수행하는 과정을 최대부호화단위마다 수행할 수 있다. 다만 압축부(160)가 소정의 과정을 수행하는 데 이용하는 데이터단위들은 상술한 실시예들에 의해 한정하여 해석되어서는 안되고, 당업자가 이용할 수 있는 범위 내에서 다양한 데이터 단위들이 이용될 수 있는 것으로 해석될 수 있다. 영상 압축 장치(150)가 이용할 수 있는 다양한 데이터 단위들의 특징은 이하의 도 10 내지 도 23을 통해 후술하도록 한다.

한편, 상술한 DNN과 관련된 모델은, 소프트웨어 모듈로 구현될 수 있다. 소프트웨어 모듈(예를 들어, 명령어(instruction)를 포함하는 프로그램 모듈)로 구현되는 경우, DNN 모델은 컴퓨터로 읽을 수 있는 판독 가능한 기록매체에 저장될 수 있다.

또한, DNN 모델은 하드웨어 칩 형태로 집적되어 전술한 영상 복원 장치(100) 또는 영상 압축 장치(150)의 일부가 될 수도 있다. 예를 들어, DNN 모델은 인공 지능을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예를 들어, CPU 또는 애플리케이션 프로세서) 또는 그래픽 전용 프로세서(예를 들어, GPU)의 일부로 제작될 수도 있다.

또한, DNN 모델은 다운로드 가능한 소프트웨어 형태로 제공될 수도 있다. 컴퓨터 프로그램 제품은 제조사 또는 전자 마켓을 통해 전자적으로 배포되는 소프트웨어 프로그램 형태의 상품(예를 들어, 다운로드 가능한 애플리케이션)을 포함할 수 있다. 전자적 배포를 위하여, 소프트웨어 프로그램의 적어도 일부는 저장 매체에 저장되거나, 임시적으로 생성될 수 있다. 이 경우, 저장 매체는 제조사 또는 전자 마켓의 서버, 또는 중계 서버의 저장매체가 될 수 있다.

이하, 도 10 내지 도 23을 참조하여 일 실시예에 따른 영상의 데이터 단위를 결정하는 방법이 상술된다.

도 10은 일 실시예에 따라 영상 복원 장치(100)가 현재 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다.

일 실시예에 따라 영상 복원 장치(100)는 블록 형태 정보를 이용하여 부호화 단위의 형태를 결정할 수 있고, 분할 형태 정보를 이용하여 부호화 단위가 어떤 형태로 분할되는지를 결정할 수 있다. 즉, 영상 복원 장치(100)가 이용하는 블록 형태 정보가 어떤 블록 형태를 나타내는지에 따라 분할 형태 정보가 나타내는 부호화 단위의 분할 방법이 결정될 수 있다.

일 실시예에 따라, 영상 복원 장치(100)는 현재 부호화 단위가 정사각형 형태임을 나타내는 블록 형태 정보를 이용할 수 있다. 예를 들어 영상 복원 장치(100)는 분할 형태 정보에 따라 정사각형의 부호화 단위를 분할하지 않을지, 수직으로 분할할지, 수평으로 분할할지, 4개의 부호화 단위로 분할할지 등을 결정할 수 있다. 도 10을 참조하면, 현재 부호화 단위(1000)의 블록 형태 정보가 정사각형의 형태를 나타내는 경우, 복호화부(1030)는 분할되지 않음을 나타내는 분할 형태 정보에 따라 현재 부호화 단위(1000)와 동일한 크기를 가지는 부호화 단위(1010a)를 분할하지 않거나, 소정의 분할방법을 나타내는 분할 형태 정보에 기초하여 분할된 부호화 단위(1010b, 1010c, 1010d 등)를 결정할 수 있다.

도 10을 참조하면 영상 복원 장치(100)는 일 실시예에 따라 수직방향으로 분할됨을 나타내는 분할 형태 정보에 기초하여 현재 부호화 단위(1000)를 수직방향으로 분할한 두개의 부호화 단위(1010b)를 결정할 수 있다. 영상 복원 장치(100)는 수평방향으로 분할됨을 나타내는 분할 형태 정보에 기초하여 현재 부호화 단위(1000)를 수평방향으로 분할한 두개의 부호화 단위(1010c)를 결정할 수 있다. 영상 복원 장치(100)는 수직방향 및 수평방향으로 분할됨을 나타내는 분할 형태 정보에 기초하여 현재 부호화 단위(1000)를 수직방향 및 수평방향으로 분할한 네개의 부호화 단위(1010d)를 결정할 수 있다. 다만 정사각형의 부호화 단위가 분할될 수 있는 분할 형태는 상술한 형태로 한정하여 해석되어서는 안되고, 분할 형태 정보가 나타낼 수 있는 다양한 형태가 포함될 수 있다. 정사각형의 부호화 단위가 분할되는 소정의 분할 형태들은 이하에서 다양한 실시예를 통해 구체적으로 설명하도록 한다.

도 11은 일 실시예에 따라 영상 복원 장치(100)가 비-정사각형의 형태인 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다.

일 실시예에 따라 영상 복원 장치(100)는 현재 부호화 단위가 비-정사각형 형태임을 나타내는 블록 형태 정보를 이용할 수 있다. 영상 복원 장치(100)는 분할 형태 정보에 따라 비-정사각형의 현재 부호화 단위를 분할하지 않을지 소정의 방법으로 분할할지 여부를 결정할 수 있다. 도 11을 참조하면, 현재 부호화 단위(1100 또는 1150)의 블록 형태 정보가 비-정사각형의 형태를 나타내는 경우, 영상 복원 장치(100)는 분할되지 않음을 나타내는 분할 형태 정보에 따라 현재 부호화 단위(1100 또는 1150)와 동일한 크기를 가지는 부호화 단위(1110 또는 1160)를 분할하지 않거나, 소정의 분할방법을 나타내는 분할 형태 정보에 따라 기초하여 분할된 부호화 단위(1120a, 1120b, 1130a, 1130b, 1130c, 1170a, 1170b, 1180a, 1180b, 1180c)를 결정할 수 있다. 비-정사각형의 부호화 단위가 분할되는 소정의 분할 방법은 이하에서 다양한 실시예를 통해 구체적으로 설명하도록 한다.

일 실시예에 따라 영상 복원 장치(100)는 분할 형태 정보를 이용하여 부호화 단위가 분할되는 형태를 결정할 수 있고, 이 경우 분할 형태 정보는 부호화 단위가 분할되어 생성되는 적어도 하나의 부호화 단위의 개수를 나타낼 수 있다. 도 11를 참조하면 분할 형태 정보가 두개의 부호화 단위로 현재 부호화 단위(1100 또는 1150)가 분할되는 것을 나타내는 경우, 영상 복원 장치(100)는 분할 형태 정보에 기초하여 현재 부호화 단위(1100 또는 1150)를 분할하여 현재 부호화 단위에 포함되는 두개의 부호화 단위(1120a, 11420b, 또는 1170a, 1170b)를 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)가 분할 형태 정보에 기초하여 비-정사각형의 형태의 현재 부호화 단위(1100 또는 1150)를 분할하는 경우, 비-정사각형의 현재 부호화 단위(1100 또는 1150)의 긴 변의 위치를 고려하여 현재 부호화 단위를 분할할 수 있다. 예를 들면, 영상 복원 장치(100)는 현재 부호화 단위(1100 또는 1150)의 형태를 고려하여 현재 부호화 단위(1100 또는 1150)의 긴 변을 분할하는 방향으로 현재 부호화 단위(1100 또는 1150)를 분할하여 복수개의 부호화 단위를 결정할 수 있다.

일 실시예에 따라, 분할 형태 정보가 홀수개의 블록으로 부호화 단위를 분할하는 것을 나타내는 경우, 영상 복원 장치(100)는 현재 부호화 단위(1100 또는 1150)에 포함되는 홀수개의 부호화 단위를 결정할 수 있다. 예를 들면, 분할 형태 정보가 3개의 부호화 단위로 현재 부호화 단위(1100 또는 1150)를 분할하는 것을 나타내는 경우, 영상 복원 장치(100)는 현재 부호화 단위(1100 또는 1150)를 3개의 부호화 단위(1130a, 1130b, 1130c, 1180a, 1180b, 1180c)로 분할할 수 있다. 일 실시예에 따라 영상 복원 장치(100)는 현재 부호화 단위(1100 또는 1150)에 포함되는 홀수개의 부호화 단위를 결정할 수 있으며, 결정된 부호화 단위들의 크기 모두가 동일하지는 않을 수 있다. 예를 들면, 결정된 홀수개의 부호화 단위(1130a, 1130b, 1130c, 1180a, 1180b, 1180c) 중 소정의 부호화 단위(1130b 또는 1180b)의 크기는 다른 부호화 단위(1130a, 1130c, 1180a, 1180c)들과는 다른 크기를 가질 수도 있다. 즉, 현재 부호화 단위(1100 또는 1150)가 분할되어 결정될 수 있는 부호화 단위는 복수의 종류의 크기를 가질 수 있고, 경우에 따라서는 홀수개의 부호화 단위(1130a, 1130b, 1130c, 1180a, 1180b, 1180c)가 각각 서로 다른 크기를 가질 수도 있다.

일 실시예에 따라 분할 형태 정보가 홀수개의 블록으로 부호화 단위가 분할되는 것을 나타내는 경우, 영상 복원 장치(100)는 현재 부호화 단위(1100 또는 1150)에 포함되는 홀수개의 부호화 단위를 결정할 수 있고, 나아가 영상 복원 장치(100)는 분할하여 생성되는 홀수개의 부호화 단위들 중 적어도 하나의 부호화 단위에 대하여 소정의 제한을 둘 수 있다. 도 11을 참조하면 영상 복원 장치(100)는 현재 부호화 단위(1100 또는 1150)가 분할되어 생성된 3개의 부호화 단위(1130a, 1130b, 1130c, 1180a, 1180b, 1180c)들 중 중앙에 위치하는 부호화 단위(1130b, 1180b)에 대한 복호화 과정을 다른 부호화 단위(1130a, 1130c, 1180a, 1180c)와 다르게 할 수 있다. 예를 들면, 영상 복원 장치(100)는 중앙에 위치하는 부호화 단위(1130b, 1180b)에 대하여는 다른 부호화 단위(1130a, 1130c, 1180a, 1180c)와 달리 더 이상 분할되지 않도록 제한하거나, 소정의 횟수만큼만 분할되도록 제한할 수 있다.

도 12는 일 실시예에 따라 영상 복원 장치(100)가 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 부호화 단위를 분할하는 과정을 도시한다.

일 실시예에 따라 영상 복원 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 정사각형 형태의 제1 부호화 단위(1200)를 부호화 단위들로 분할하거나 분할하지 않는 것으로 결정할 수 있다. 일 실시예에 따라 분할 형태 정보가 수평 방향으로 제1 부호화 단위(1200)를 분할하는 것을 나타내는 경우, 영상 복원 장치(100)는 제1 부호화 단위(1200)를 수평 방향으로 분할하여 제2 부호화 단위(1210)를 결정할 수 있다. 일 실시예에 따라 이용되는 제1 부호화 단위, 제2 부호화 단위, 제3 부호화 단위는 부호화 단위 간의 분할 전후 관계를 이해하기 위해 이용된 용어이다. 예를 들면, 제1 부호화 단위를 분할하면 제2 부호화 단위가 결정될 수 있고, 제2 부호화 단위가 분할되면 제3 부호화 단위가 결정될 수 있다. 이하에서는 이용되는 제1 부호화 단위, 제2 부호화 단위 및 제3 부호화 단위의 관계는 상술한 특징에 따르는 것으로 이해될 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 결정된 제2 부호화 단위(1210)를 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 부호화 단위들로 분할하거나 분할하지 않는 것으로 결정할 수 있다. 도 12를 참조하면 영상 복원 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1200)를 분할하여 결정된 비-정사각형의 형태의 제2 부호화 단위(1210)를 적어도 하나의 제3 부호화 단위(1220a, 1220b, 1220c, 1220d 등)로 분할하거나 제2 부호화 단위(1210)를 분할하지 않을 수 있다. 영상 복원 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 획득할 수 있고 영상 복원 장치(100)는 획득한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1200)를 분할하여 다양한 형태의 복수개의 제2 부호화 단위(예를 들면, 1210)를 분할할 수 있으며, 제2 부호화 단위(1210)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1200)가 분할된 방식에 따라 분할될 수 있다. 일 실시예에 따라, 제1 부호화 단위(1200)가 제1 부호화 단위(1200)에 대한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제2 부호화 단위(1210)로 분할된 경우, 제2 부호화 단위(1210) 역시 제2 부호화 단위(1210)에 대한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제3 부호화 단위(예를 들면, 1220a, 1220b, 1220c, 1220d 등)으로 분할될 수 있다. 즉, 부호화 단위는 부호화 단위 각각에 관련된 분할 형태 정보 및 블록 형태 정보 중 적어도 하나에 기초하여 재귀적으로 분할될 수 있다. 따라서 비-정사각형 형태의 부호화 단위에서 정사각형의 부호화 단위가 결정될 수 있고, 이러한 정사각형 형태의 부호화 단위가 재귀적으로 분할되어 비-정사각형 형태의 부호화 단위가 결정될 수도 있다. 도 12를 참조하면, 비-정사각형 형태의 제2 부호화 단위(1210)가 분할되어 결정되는 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d) 중 소정의 부호화 단위(예를 들면, 가운데에 위치하는 부호화 단위 또는 정사각형 형태의 부호화 단위)는 재귀적으로 분할될 수 있다. 일 실시예에 따라 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d) 중 하나인 정사각형 형태의 제3 부호화 단위(1220c)는 수평 방향으로 분할되어 복수개의 제4 부호화 단위로 분할될 수 있다. 복수개의 제4 부호화 단위 중 하나인 비-정사각형 형태의 제4 부호화 단위(1240)는 다시 복수개의 부호화 단위들로 분할될 수 있다. 예를 들면, 비-정사각형 형태의 제4 부호화 단위(1240)는 홀수개의 부호화 단위(1250a, 1250b, 1250c)로 다시 분할될 수도 있다.

부호화 단위의 재귀적 분할에 이용될 수 있는 방법에 대하여는 다양한 실시예를 통해 후술하도록 한다.

일 실시예에 따라 영상 복원 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제3 부호화 단위(1220a, 1220b, 1220c, 1220d 등) 각각을 부호화 단위들로 분할하거나 제2 부호화 단위(1210)를 분할하지 않는 것으로 결정할 수 있다. 영상 복원 장치(100)는 일 실시예에 따라 비-정사각형 형태의 제2 부호화 단위(1210)를 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d)로 분할할 수 있다. 영상 복원 장치(100)는 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d) 중 소정의 제3 부호화 단위에 대하여 소정의 제한을 둘 수 있다. 예를 들면 영상 복원 장치(100)는 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d) 중 가운데에 위치하는 부호화 단위(1220c)에 대하여는 더 이상 분할되지 않는 것으로 제한하거나 또는 설정 가능한 횟수로 분할되어야 하는 것으로 제한할 수 있다. 도 12를 참조하면, 영상 복원 장치(100)는 비-정사각형 형태의 제2 부호화 단위(1210)에 포함되는 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d)들 중 가운데에 위치하는 부호화 단위(1220c)는 더 이상 분할되지 않거나, 소정의 분할 형태로 분할(예를 들면 4개의 부호화 단위로만 분할하거나 제2 부호화 단위(1210)가 분할된 형태에 대응하는 형태로 분할)되는 것으로 제한하거나, 소정의 횟수로만 분할(예를 들면 n회만 분할, n>0)하는 것으로 제한할 수 있다. 다만 가운데에 위치한 부호화 단위(1220c)에 대한 상기 제한은 단순한 실시예들에 불과하므로 상술한 실시예들로 제한되어 해석되어서는 안되고, 가운데에 위치한 부호화 단위(1220c)가 다른 부호화 단위(1220b, 1220d)와 다르게 복호화 될 수 있는 다양한 제한들을 포함하는 것으로 해석되어야 한다.

일 실시예에 따라 영상 복원 장치(100)는 현재 부호화 단위를 분할하기 위해 이용되는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 현재 부호화 단위 내의 소정의 위치에서 획득할 수 있다.

도 13은 일 실시예에 따라 영상 복원 장치(100)가 홀수개의 부호화 단위들 중 소정의 부호화 단위를 결정하기 위한 방법을 도시한다. 도 13을 참조하면, 현재 부호화 단위(1300)의 블록 형태 정보 및 분할 형태 정보 중 적어도 하나는 현재 부호화 단위(1300)에 포함되는 복수개의 샘플 중 소정 위치의 샘플(예를 들면, 가운데에 위치하는 샘플(1340))에서 획득될 수 있다. 다만 이러한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나가 획득될 수 있는 현재 부호화 단위(1300) 내의 소정 위치가 도 13에서 도시하는 가운데 위치로 한정하여 해석되어서는 안되고, 소정 위치에는 현재 부호화 단위(1300)내에 포함될 수 있는 다양한 위치(예를 들면, 최상단, 최하단, 좌측, 우측, 좌측상단, 좌측하단, 우측상단 또는 우측하단 등)가 포함될 수 있는 것으로 해석되어야 한다. 영상 복원 장치(100)는 소정 위치로부터 획득되는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 획득하여 현재 부호화 단위를 다양한 형태 및 크기의 부호화 단위들로 분할하거나 분할하지 않는 것으로 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 현재 부호화 단위가 소정의 개수의 부호화 단위들로 분할된 경우 그 중 하나의 부호화 단위를 선택할 수 있다. 복수개의 부호화 단위들 중 하나를 선택하기 위한 방법은 다양할 수 있으며, 이러한 방법들에 대한 설명은 이하의 다양한 실시예를 통해 후술하도록 한다.

일 실시예에 따라 영상 복원 장치(100) 는 현재 부호화 단위를 복수개의 부호화 단위들로 분할하고, 소정 위치의 부호화 단위를 결정할 수 있다.

도 13은 일 실시예에 따라 영상 복원 장치(100)가 홀수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위한 방법을 도시한다.

일 실시예에 따라 영상 복원 장치(100)는 홀수개의 부호화 단위들 중 가운데에 위치하는 부호화 단위를 결정하기 위하여 홀수개의 부호화 단위들 각각의 위치를 나타내는 정보를 이용할 수 있다. 도 13을 참조하면, 영상 복원 장치(100)는 현재 부호화 단위(1300)를 분할하여 홀수개의 부호화 단위들(1320a, 1320b, 1320c)을 결정할 수 있다. 영상 복원 장치(100)는 홀수개의 부호화 단위들(1320a, 1320b, 1320c)의 위치에 대한 정보를 이용하여 가운데 부호화 단위(1320b)를 결정할 수 있다. 예를 들면 영상 복원 장치(100)는 부호화 단위들(1320a, 1320b, 1320c)에 포함되는 소정의 샘플의 위치를 나타내는 정보에 기초하여 부호화 단위들(1320a, 1320b, 1320c)의 위치를 결정함으로써 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다. 구체적으로, 영상 복원 장치(100)는 부호화 단위들(1320a, 1320b, 1320c)의 좌측 상단의 샘플(1330a, 1330b, 1330c)의 위치를 나타내는 정보에 기초하여 부호화 단위(1320a, 1320b, 1320c)의 위치를 결정함으로써 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다.

일 실시예에 따라 부호화 단위(1320a, 1320b, 1320c)에 각각 포함되는 좌측 상단의 샘플(1330a, 1330b, 1330c)의 위치를 나타내는 정보는 부호화 단위(1320a, 1320b, 1320c)의 픽쳐 내에서의 위치 또는 좌표에 대한 정보를 포함할 수 있다. 일 실시예에 따라 부호화 단위(1320a, 1320b, 1320c)에 각각 포함되는 좌측 상단의 샘플(1330a, 1330b, 1330c)의 위치를 나타내는 정보는 현재 부호화 단위(1300)에 포함되는 부호화단위(1320a, 1320b, 1320c)들의 너비 또는 높이를 나타내는 정보를 포함할 수 있고, 이러한 너비 또는 높이는 부호화 단위(1320a, 1320b, 1320c)의 픽쳐 내에서의 좌표 간의 차이를 나타내는 정보에 해당할 수 있다. 즉, 영상 복원 장치(100)는 부호화 단위(1320a, 1320b, 1320c)의 픽쳐 내에서의 위치 또는 좌표에 대한 정보를 직접이용하거나 좌표간의 차이값에 대응하는 부호화 단위의 너비 또는 높이에 대한 정보를 이용함으로써 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다.

일 실시예에 따라, 상단 부호화 단위(1320a)의 좌측 상단의 샘플(1330a)의 위치를 나타내는 정보는 (xa, ya) 좌표를 나타낼 수 있고, 가운데 부호화 단위(1320b)의 좌측 상단의 샘플(1330b)의 위치를 나타내는 정보는 (xb, yb) 좌표를 나타낼 수 있고, 하단 부호화 단위(1320c)의 좌측 상단의 샘플(1330c)의 위치를 나타내는 정보는 (xc, yc) 좌표를 나타낼 수 있다. 영상 복원 장치(100)는 부호화 단위(1320a, 1320b, 1320c)에 각각 포함되는 좌측 상단의 샘플(1330a, 1330b, 1330c)의 좌표를 이용하여 가운데 부호화 단위(1320b)를 결정할 수 있다. 예를 들면, 좌측 상단의 샘플(1330a, 1330b, 1330c)의 좌표를 오름차순 또는 내림차순으로 정렬하였을 때, 가운데에 위치하는 샘플(1330b)의 좌표인 (xb, yb)를 포함하는 부호화 단위(1320b)를 현재 부호화 단위(1300)가 분할되어 결정된 부호화 단위(1320a, 1320b, 1320c) 중 가운데에 위치하는 부호화 단위로 결정할 수 있다. 다만 좌측 상단의 샘플(1330a, 1330b, 1330c)의 위치를 나타내는 좌표는 픽쳐 내에서의 절대적인 위치를 나타내는 좌표를 나타낼 수 있고, 나아가 상단 부호화 단위(1320a)의 좌측 상단의 샘플(1330a)의 위치를 기준으로, 가운데 부호화 단위(1320b)의 좌측 상단의 샘플(1330b)의 상대적 위치를 나타내는 정보인 (dxb, dyb)좌표, 하단 부호화 단위(1320c)의 좌측 상단의 샘플(1330c)의 상대적 위치를 나타내는 정보인 (dxc, dyc)좌표를 이용할 수도 있다. 또한 부호화 단위에 포함되는 샘플의 위치를 나타내는 정보로서 해당 샘플의 좌표를 이용함으로써 소정 위치의 부호화 단위를 결정하는 방법이 상술한 방법으로 한정하여 해석되어서는 안되고, 샘플의 좌표를 이용할 수 있는 다양한 산술적 방법으로 해석되어야 한다.

일 실시예에 따라 영상 복원 장치(100)는 현재 부호화 단위(1300)를 복수개의 부호화 단위(1320a, 1320b, 1320c)로 분할할 수 있고, 부호화 단위(1320a, 1320b, 1320c)들 중 소정의 기준에 따라 부호화 단위를 선택할 수 있다. 예를 들면, 영상 복원 장치(100)는 부호화 단위(1320a, 1320b, 1320c) 중 크기가 다른 부호화 단위(1320b)를 선택할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 상단 부호화 단위(1320a)의 좌측 상단의 샘플(1330a)의 위치를 나타내는 정보인 (xa, ya) 좌표, 가운데 부호화 단위(1320b)의 좌측 상단의 샘플(1330b)의 위치를 나타내는 정보인 (xb, yb) 좌표, 하단 부호화 단위(1320c)의 좌측 상단의 샘플(1330c)의 위치를 나타내는 정보인 (xc, yc) 좌표를 이용하여 부호화 단위(1320a, 1320b, 1320c) 각각의 너비 또는 높이를 결정할 수 있다. 영상 복원 장치(100)는 부호화 단위(1320a, 1320b, 1320c)의 위치를 나타내는 좌표인 (xa, ya), (xb, yb), (xc, yc)를 이용하여 부호화 단위(1320a, 1320b, 1320c) 각각의 크기를 결정할 수 있다.

일 실시예에 따라, 영상 복원 장치(100)는 상단 부호화 단위(1320a)의 너비를 xb-xa로 결정할 수 있고 높이를 yb-ya로 결정할 수 있다. 일 실시예에 따라 영상 복원 장치(100)는 가운데 부호화 단위(1320b)의 너비를 xc-xb로 결정할 수 있고 높이를 yc-yb로 결정할 수 있다. 일 실시예에 따라 영상 복원 장치(100)는 하단 부호화 단위의 너비 또는 높이는 현재 부호화 단위의 너비 또는 높이와 상단 부호화 단위(1320a) 및 가운데 부호화 단위(1320b)의 너비 및 높이를 이용하여 결정할 수 있다. 영상 복원 장치(100)는 결정된 부호화 단위(1320a, 1320b, 1320c)의 너비 및 높이에 기초하여 다른 부호화 단위와 다른 크기를 갖는 부호화 단위를 결정할 수 있다. 도 13을 참조하면, 영상 복원 장치(100)는 상단 부호화 단위(1320a) 및 하단 부호화 단위(1320c)의 크기와 다른 크기를 가지는 가운데 부호화 단위(1320b)를 소정 위치의 부호화 단위로 결정할 수 있다. 다만 상술한 영상 복원 장치(100)가 다른 부호화 단위와 다른 크기를 갖는 부호화 단위를 결정하는 과정은 샘플 좌표에 기초하여 결정되는 부호화 단위의 크기를 이용하여 소정 위치의 부호화 단위를 결정하는 일 실시예에 불과하므로, 소정의 샘플 좌표에 따라 결정되는 부호화 단위의 크기를 비교하여 소정 위치의 부호화 단위를 결정하는 다양한 과정이 이용될 수 있다.

다만 부호화 단위의 위치를 결정하기 위하여 고려하는 샘플의 위치는 상술한 좌측 상단으로 한정하여 해석되어서는 안되고 부호화 단위에 포함되는 임의의 샘플의 위치에 대한 정보가 이용될 수 있는 것으로 해석될 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 현재 부호화 단위의 형태를 고려하여, 현재 부호화 단위가 분할되어 결정되는 홀수개의 부호화 단위들 중 소정 위치의 부호화 단위를 선택할 수 있다. 예를 들면, 현재 부호화 단위가 너비가 높이보다 긴 비-정사각형 형태라면 영상 복원 장치(100)는 수평 방향에 따라 소정 위치의 부호화 단위를 결정할 수 있다. 즉, 영상 복원 장치(100)는 수평 방향으로 위치를 달리 하는 부호화 단위들 중 하나를 결정하여 해당 부호화 단위에 대한 제한을 둘 수 있다. 현재 부호화 단위가 높이가 너비보다 긴 비-정사각형 형태라면 영상 복원 장치(100)는 수직 방향에 따라 소정 위치의 부호화 단위를 결정할 수 있다. 즉, 영상 복원 장치(100)는 수직 방향으로 위치를 달리 하는 부호화 단위들 중 하나를 결정하여 해당 부호화 단위에 대한 제한을 둘 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 짝수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위하여 짝수개의 부호화 단위들 각각의 위치를 나타내는 정보를 이용할 수 있다. 영상 복원 장치(100)는 현재 부호화 단위를 분할하여 짝수개의 부호화 단위들을 결정할 수 있고 짝수개의 부호화 단위들의 위치에 대한 정보를 이용하여 소정 위치의 부호화 단위를 결정할 수 있다. 이에 대한 구체적인 과정은 도 13에서 상술한 홀수개의 부호화 단위들 중 소정 위치(예를 들면, 가운데 위치)의 부호화 단위를 결정하는 과정에 대응하는 과정일 수 있으므로 생략하도록 한다.

일 실시예에 따라, 비-정사각형 형태의 현재 부호화 단위를 복수개의 부호화 단위로 분할한 경우, 복수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위하여 분할 과정에서 소정 위치의 부호화 단위에 대한 소정의 정보를 이용할 수 있다. 예를 들면 영상 복원 장치(100)는 현재 부호화 단위가 복수개로 분할된 부호화 단위들 중 가운데에 위치하는 부호화 단위를 결정하기 위하여 분할 과정에서 가운데 부호화 단위에 포함된 샘플에 저장된 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용할 수 있다.

도 13을 참조하면 영상 복원 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 현재 부호화 단위(1300)를 복수개의 부호화 단위들(1320a, 1320b, 1320c)로 분할할 수 있으며, 복수개의 부호화 단위들(1320a, 1320b, 1320c) 중 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다. 나아가 영상 복원 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나가 획득되는 위치를 고려하여, 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다. 즉, 현재 부호화 단위(1300)의 블록 형태 정보 및 분할 형태 정보 중 적어도 하나는 현재 부호화 단위(1300)의 가운데에 위치하는 샘플(1340)에서 획득될 수 있으며, 상기 블록 형태 정보 및 상기 분할 형태 정보 중 적어도 하나에 기초하여 현재 부호화 단위(1300)가 복수개의 부호화 단위들(1320a, 1320b, 1320c)로 분할된 경우 상기 샘플(1340)을 포함하는 부호화 단위(1320b)를 가운데에 위치하는 부호화 단위로 결정할 수 있다. 다만 가운데에 위치하는 부호화 단위로 결정하기 위해 이용되는 정보가 블록 형태 정보 및 분할 형태 정보 중 적어도 하나로 한정하여 해석되어서는 안되고, 다양한 종류의 정보가 가운데에 위치하는 부호화 단위를 결정하는 과정에서 이용될 수 있다.

일 실시예에 따라 소정 위치의 부호화 단위를 식별하기 위한 소정의 정보는, 결정하려는 부호화 단위에 포함되는 소정의 샘플에서 획득될 수 있다. 도 13을 참조하면, 영상 복원 장치(100)는 현재 부호화 단위(1300)가 분할되어 결정된 복수개의 부호화 단위들(1320a, 1320b, 1320c) 중 소정 위치의 부호화 단위(예를 들면, 복수개로 분할된 부호화 단위 중 가운데에 위치하는 부호화 단위)를 결정하기 위하여 현재 부호화 단위(1300) 내의 소정 위치의 샘플(예를 들면, 현재 부호화 단위(1300)의 가운데에 위치하는 샘플)에서 획득되는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용할 수 있다. . 즉, 영상 복원 장치(100)는 현재 부호화 단위(1300)의 블록 블록 형태를 고려하여 상기 소정 위치의 샘플을 결정할 수 있고, 영상 복원 장치(100)는 현재 부호화 단위(1300)가 분할되어 결정되는 복수개의 부호화 단위(1320a, 1320b, 1320c)들 중, 소정의 정보(예를 들면, 블록 형태 정보 및 분할 형태 정보 중 적어도 하나)가 획득될 수 있는 샘플이 포함된 부호화 단위(1320b)를 결정하여 소정의 제한을 둘 수 있다. 도 13을 참조하면 일 실시예에 따라 영상 복원 장치(100)는 소정의 정보가 획득될 수 있는 샘플로서 현재 부호화 단위(1300)의 가운데에 위치하는 샘플(1340)을 결정할 수 있고, 영상 복원 장치(100)는 이러한 샘플(1340)이 포함되는 부호화 단위(1320b)를 복호화 과정에서의 소정의 제한을 둘 수 있다. 다만 소정의 정보가 획득될 수 있는 샘플의 위치는 상술한 위치로 한정하여 해석되어서는 안되고, 제한을 두기 위해 결정하려는 부호화 단위(1320b)에 포함되는 임의의 위치의 샘플들로 해석될 수 있다.

일 실시예에 따라 소정의 정보가 획득될 수 있는 샘플의 위치는 현재 부호화 단위(1300)의 형태에 따라 결정될 수 있다. 일 실시예에 따라 블록 형태 정보는 현재 부호화 단위의 형태가 정사각형인지 또는 비-정사각형인지 여부를 결정할 수 있고, 형태에 따라 소정의 정보가 획득될 수 있는 샘플의 위치를 결정할 수 있다. 예를 들면, 영상 복원 장치(100)는 현재 부호화 단위의 너비에 대한 정보 및 높이에 대한 정보 중 적어도 하나를 이용하여 현재 부호화 단위의 너비 및 높이 중 적어도 하나를 반으로 분할하는 경계 상에 위치하는 샘플을 소정의 정보가 획득될 수 있는 샘플로 결정할 수 있다. 또다른 예를 들면, 영상 복원 장치(100)는 현재 부호화 단위에 관련된 블록 형태 정보가 비-정사각형 형태임을 나타내는 경우, 현재 부호화 단위의 긴 변을 반으로 분할하는 경계에 인접하는 샘플 중 하나를 소정의 정보가 획득될 수 있는 샘플로 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 현재 부호화 단위를 복수개의 부호화 단위로 분할한 경우, 복수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위하여, 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용할 수 있다. 일 실시예에 따라 영상 복원 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 부호화 단위에 포함된 소정 위치의 샘플에서 획득할 수 있고, 영상 복원 장치(100)는 현재 부호화 단위가 분할되어 생성된 복수개의 부호화 단위들을 복수개의 부호화 단위 각각에 포함된 소정 위치의 샘플로부터 획득되는 분할 형태 정보 및 블록 형태 정보 중 적어도 하나를 이용하여 분할할 수 있다. 즉, 부호화 단위는 부호화 단위 각각에 포함된 소정 위치의 샘플에서 획득되는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용하여 재귀적으로 분할될 수 있다. 부호화 단위의 재귀적 분할 과정에 대하여는 도 12를 통해 상술하였으므로 자세한 설명은 생략하도록 한다.

일 실시예에 따라 영상 복원 장치(100)는 현재 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정할 수 있고, 이러한 적어도 하나의 부호화 단위가 복호화되는 순서를 소정의 블록(예를 들면, 현재 부호화 단위)에 따라 결정할 수 있다.

도 14는 일 실시예에 따라 영상 복원 장치(100)가 현재 부호화 단위를 분할하여 복수개의 부호화 단위들을 결정하는 경우, 복수개의 부호화 단위들이 처리되는 순서를 도시한다.

일 실시예에 따라 영상 복원 장치(100)는 블록 형태 정보 및 분할 형태 정보에 따라 제1 부호화 단위(1400)를 수직 방향으로 분할하여 제2 부호화 단위(1410a, 1410b)를 결정하거나 제1 부호화 단위(1400)를 수평 방향으로 분할하여 제2 부호화 단위(1430a, 1430b)를 결정하거나 제1 부호화 단위(1400)를 수직 방향 및 수평 방향으로 분할하여 제2 부호화 단위(1450a, 1450b, 1450c, 1450d)를 결정할 수 있다.

도 14를 참조하면, 영상 복원 장치(100)는 제1 부호화 단위(1400)를 수직 방향으로 분할하여 결정된 제2 부호화 단위(1410a, 1410b)를 수평 방향(1410c)으로 처리되도록 순서를 결정할 수 있다. 영상 복원 장치(100)는 제1 부호화 단위(1400)를 수평 방향으로 분할하여 결정된 제2 부호화 단위(1430a, 1430b)의 처리 순서를 수직 방향(1430c)으로 결정할 수 있다. 영상 복원 장치(100)는 제1 부호화 단위(1400)를 수직 방향 및 수평 방향으로 분할하여 결정된 제2 부호화 단위(1450a, 1450b, 1450c, 1450d)를 하나의 행에 위치하는 부호화 단위들이 처리된 후 다음 행에 위치하는 부호화 단위들이 처리되는 소정의 순서(예를 들면, 래스터 스캔 순서((raster scan order) 또는 z 스캔 순서(z scan order)(1450e) 등)에 따라 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 부호화 단위들을 재귀적으로 분할할 수 있다. 도 14를 참조하면, 영상 복원 장치(100)는 제1 부호화 단위(1400)를 분할하여 복수개의 부호화 단위들(1410a, 1410b, 1430a, 1430b, 1450a, 1450b, 1450c, 1450d)을 결정할 수 있고, 결정된 복수개의 부호화 단위들(1410a, 1410b, 1430a, 1430b, 1450a, 1450b, 1450c, 1450d) 각각을 재귀적으로 분할할 수 있다. 복수개의 부호화 단위들(1410a, 1410b, 1430a, 1430b, 1450a, 1450b, 1450c, 1450d)을 분할하는 방법은 제1 부호화 단위(1400)를 분할하는 방법에 대응하는 방법이 될 수 있다. 이에 따라 복수개의 부호화 단위들(1410a, 1410b, 1430a, 1430b, 1450a, 1450b, 1450c, 1450d)은 각각 독립적으로 복수개의 부호화 단위들로 분할될 수 있다. 도 14를 참조하면 영상 복원 장치(100)는 제1 부호화 단위(1400)를 수직 방향으로 분할하여 제2 부호화 단위(1410a, 1410b)를 결정할 수 있고, 나아가 제2 부호화 단위(1410a, 1410b) 각각을 독립적으로 분할하거나 분할하지 않는 것으로 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 좌측의 제2 부호화 단위(1410a)를 수평 방향으로 분할하여 제3 부호화 단위(1420a, 1420b)로 분할할 수 있고, 우측의 제2 부호화 단위(1410b)는 분할하지 않을 수 있다.

일 실시예에 따라 부호화 단위들의 처리 순서는 부호화 단위의 분할 과정에 기초하여 결정될 수 있다. 다시 말해, 분할된 부호화 단위들의 처리 순서는 분할되기 직전의 부호화 단위들의 처리 순서에 기초하여 결정될 수 있다. 영상 복원 장치(100)는 좌측의 제2 부호화 단위(1410a)가 분할되어 결정된 제3 부호화 단위(1420a, 1420b)가 처리되는 순서를 우측의 제2 부호화 단위(1410b)와 독립적으로 결정할 수 있다. 좌측의 제2 부호화 단위(1410a)가 수평 방향으로 분할되어 제3 부호화 단위(1420a, 1420b)가 결정되었으므로 제3 부호화 단위(1420a, 1420b)는 수직 방향(1420c)으로 처리될 수 있다. 또한 좌측의 제2 부호화 단위(1410a) 및 우측의 제2 부호화 단위(1410b)가 처리되는 순서는 수평 방향(1410c)에 해당하므로, 좌측의 제2 부호화 단위(1410a)에 포함되는 제3 부호화 단위(1420a, 1420b)가 수직 방향(1420c)으로 처리된 후에 우측 부호화 단위(1410b)가 처리될 수 있다. 상술한 내용은 부호화 단위들이 각각 분할 전의 부호화 단위에 따라 처리 순서가 결정되는 과정을 설명하기 위한 것이므로, 상술한 실시예에 한정하여 해석되어서는 안되고, 다양한 형태로 분할되어 결정되는 부호화 단위들이 소정의 순서에 따라 독립적으로 처리될 수 있는 다양한 방법으로 이용되는 것으로 해석되어야 한다.

도 15는 일 실시예에 따라 영상 복원 장치(100)가 소정의 순서로 부호화 단위가 처리될 수 없는 경우, 현재 부호화 단위가 홀수개의 부호화 단위로 분할되는 것임을 결정하는 과정을 도시한다.

일 실시예에 따라 영상 복원 장치(100)는 획득된 블록 형태 정보 및 분할 형태 정보에 기초하여 현재 부호화 단위가 홀수개의 부호화 단위들로 분할되는 것을 결정할 수 있다. 도 15를 참조하면 정사각형 형태의 제1 부호화 단위(1500)가 비-정사각형 형태의 제2 부호화 단위(1510a, 1510b)로 분할될 수 있고, 제2 부호화 단위(1510a, 1510b)는 각각 독립적으로 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)로 분할될 수 있다. 일 실시예에 따라 영상 복원 장치(100)는 제2 부호화 단위 중 좌측 부호화 단위(1510a)는 수평 방향으로 분할하여 복수개의 제3 부호화 단위(1520a, 1520b)를 결정할 수 있고, 우측 부호화 단위(1510b)는 홀수개의 제3 부호화 단위(1520c, 1520d, 1520e)로 분할할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 제3 부호화 단위들(1520a, 1520b, 1520c, 1520d, 1520e)이 소정의 순서로 처리될 수 있는지 여부를 판단하여 홀수개로 분할된 부호화 단위가 존재하는지를 결정할 수 있다. 도 15를 참조하면, 영상 복원 장치(100)는 제1 부호화 단위(1500)를 재귀적으로 분할하여 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)를 결정할 수 있다. 영상 복원 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여, 제1 부호화 단위(1500), 제2 부호화 단위(1510a, 1510b) 또는 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)가 분할되는 형태 중 홀수개의 부호화 단위로 분할되는지 여부를 결정할 수 있다. 예를 들면, 제2 부호화 단위(1510a, 1510b) 중 우측에 위치하는 부호화 단위가 홀수개의 제3 부호화 단위(1520c, 1520d, 1520e)로 분할될 수 있다. 제1 부호화 단위(1500)에 포함되는 복수개의 부호화 단위들이 처리되는 순서는 소정의 순서(예를 들면, z-스캔 순서(z-scan order)(1530))가 될 수 있고, 영상 복원 장치(100)는 우측 제2 부호화 단위(1510b)가 홀수개로 분할되어 결정된 제3 부호화 단위(1520c, 1520d, 1520e)가 상기 소정의 순서에 따라 처리될 수 있는 조건을 만족하는지를 판단할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 제1 부호화 단위(1500)에 포함되는 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)가 소정의 순서에 따라 처리될 수 있는 조건을 만족하는지를 결정할 수 있으며, 상기 조건은 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)의 경계에 따라 제2 부호화 단위(1510a, 1510b)의 너비 및 높이 중 적어도 하나를 반으로 분할되는지 여부와 관련된다. 예를 들면 비-정사각형 형태의 좌측 제2 부호화 단위(1510a)의 높이를 반으로 분할하여 결정되는 제3 부호화 단위(1520a, 1520b)는 조건을 만족하지만, 우측 제2 부호화 단위(1510b)를 3개의 부호화 단위로 분할하여 결정되는 제3 부호화 단위(1520c, 1520d, 1520e)들의 경계가 우측 제2 부호화 단위(1510b)의 너비 또는 높이를 반으로 분할하지 못하므로 제3 부호화 단위(1520c, 1520d, 1520e)는 조건을 만족하지 못하는 것으로 결정될 수 있고, 영상 복원 장치(100)는 이러한 조건 불만족의 경우 스캔 순서의 단절(disconnection)로 판단하고, 판단 결과에 기초하여 우측 제2 부호화 단위(1510b)는 홀수개의 부호화 단위로 분할되는 것으로 결정할 수 있다. 일 실시예에 따라 영상 복원 장치(100)는 홀수개의 부호화 단위로 분할되는 경우 분할된 부호화 단위들 중 소정 위치의 부호화 단위에 대하여 소정의 제한을 둘 수 있으며, 이러한 제한 내용 또는 소정 위치 등에 대하여는 다양한 실시예를 통해 상술하였으므로 자세한 설명은 생략하도록 한다.

도 16은 일 실시예에 따라 영상 복원 장치(100)가 제1 부호화 단위(1600)를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다. 일 실시예에 따라 영상 복원 장치(100)는 수신부(210)를 통해 획득한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1600)를 분할할 수 있다. 정사각형 형태의 제1 부호화 단위(1600)는 4개의 정사각형 형태를 가지는 부호화 단위로 분할되거나 또는 비-정사각형 형태의 복수개의 부호화 단위로 분할할 수 있다. 예를 들면 도 16을 참조하면, 블록 형태 정보가 제1 부호화 단위(1600)는 정사각형임을 나타내고 분할 형태 정보가 비-정사각형의 부호화 단위로 분할됨을 나타내는 경우 영상 복원 장치(100)는 제1 부호화 단위(1600)를 복수개의 비-정사각형의 부호화 단위들로 분할할 수 있다. 구체적으로, 분할 형태 정보가 제1 부호화 단위(1600)를 수평 방향 또는 수직 방향으로 분할하여 홀수개의 부호화 단위를 결정하는 것을 나타내는 경우, 영상 복원 장치(100)는 정사각형 형태의 제1 부호화 단위(1600)을 홀수개의 부호화 단위들로서 수직 방향으로 분할되어 결정된 제2 부호화 단위(1610a, 1610b, 1610c) 또는 수평 방향으로 분할되어 결정된 제2 부호화 단위(1620a, 1620b, 1620c)로 분할할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 제1 부호화 단위(1600)에 포함되는 제2 부호화 단위(1610a, 1610b, 1610c, 1620a, 1620b, 1620c)가 소정의 순서에 따라 처리될 수 있는 조건을 만족하는지를 결정할 수 있으며, 상기 조건은 제2 부호화 단위(1610a, 1610b, 1610c, 1620a, 1620b, 1620c)의 경계에 따라 제1 부호화 단위(1600)의 너비 및 높이 중 적어도 하나를 반으로 분할되는지 여부와 관련된다. 도 16를 참조하면 정사각형 형태의 제1 부호화 단위(1600)를 수직 방향으로 분할하여 결정되는 제2 부호화 단위(1610a, 1610b, 1610c)들의 경계가 제1 부호화 단위(1600)의 너비를 반으로 분할하지 못하므로 제1 부호화 단위(1600)는 소정의 순서에 따라 처리될 수 있는 조건을 만족하지 못하는 것으로 결정될 수 있다. 또한 정사각형 형태의 제1 부호화 단위(1600)를 수평 방향으로 분할하여 결정되는 제2 부호화 단위(1620a, 1620b, 1620c)들의 경계가 제1 부호화 단위(1600)의 너비를 반으로 분할하지 못하므로 제1 부호화 단위(1600)는 소정의 순서에 따라 처리될 수 있는 조건을 만족하지 못하는 것으로 결정될 수 있다. 영상 복원 장치(100)는 이러한 조건 불만족의 경우 스캔 순서의 단절(disconnection)로 판단하고, 판단 결과에 기초하여 제1 부호화 단위(1600)는 홀수개의 부호화 단위로 분할되는 것으로 결정할 수 있다. 일 실시예에 따라 영상 복원 장치(100)는 홀수개의 부호화 단위로 분할되는 경우 분할된 부호화 단위들 중 소정 위치의 부호화 단위에 대하여 소정의 제한을 둘 수 있으며, 이러한 제한 내용 또는 소정 위치 등에 대하여는 다양한 실시예를 통해 상술하였으므로 자세한 설명은 생략하도록 한다.

일 실시예에 따라, 영상 복원 장치(100)는 제1 부호화 단위를 분할하여 다양한 형태의 부호화 단위들을 결정할 수 있다.

도 16을 참조하면, 영상 복원 장치(100)는 정사각형 형태의 제1 부호화 단위(1600), 비-정사각형 형태의 제1 부호화 단위(1630 또는 1650)를 다양한 형태의 부호화 단위들로 분할할 수 있다.

도 17은 일 실시예에 따라 영상 복원 장치(100)가 제1 부호화 단위(1700)가 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위가 소정의 조건을 만족하는 경우 제2 부호화 단위가 분할될 수 있는 형태가 제한되는 것을 도시한다.

일 실시예에 따라 영상 복원 장치(100)는 수신부(210)를 통해 획득한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 정사각형 형태의 제1 부호화 단위(1700)를 비-정사각형 형태의 제2 부호화 단위(1710a, 1710b, 1720a, 1720b)로 분할하는 것으로 결정할 수 있다. 제2 부호화 단위(1710a, 1710b, 1720a, 1720b)는 독립적으로 분할될 수 있다. 이에 따라 영상 복원 장치(100)는 제2 부호화 단위(1710a, 1710b, 1720a, 1720b) 각각에 관련된 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 복수개의 부호화 단위로 분할하거나 분할하지 않는 것을 결정할 수 있다. 일 실시예에 따라 영상 복원 장치(100)는 수직 방향으로 제1 부호화 단위(1700)가 분할되어 결정된 비-정사각형 형태의 좌측 제2 부호화 단위(1710a)를 수평 방향으로 분할하여 제3 부호화 단위(1712a, 1712b)를 결정할 수 있다. 다만 영상 복원 장치(100)는 좌측 제2 부호화 단위(1710a)를 수평 방향으로 분할한 경우, 우측 제2 부호화 단위(1710b)는 좌측 제2 부호화 단위(1710a)가 분할된 방향과 동일하게 수평 방향으로 분할될 수 없도록 제한할 수 있다. 만일 우측 제2 부호화 단위(1710b)가 동일한 방향으로 분할되어 제3 부호화 단위(1714a, 1714b)가 결정된 경우, 좌측 제2 부호화 단위(1710a) 및 우측 제2 부호화 단위(1710b)가 수평 방향으로 각각 독립적으로 분할됨으로써 제3 부호화 단위(1712a, 1712b, 1714a, 1714b)가 결정될 수 있다. 하지만 이는 영상 복원 장치(100)가 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1700)를 4개의 정사각형 형태의 제2 부호화 단위(1730a, 1730b, 1730c, 1730d)로 분할한 것과 동일한 결과이며 이는 영상 복호화 측면에서 비효율적일 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 수평 방향으로 제1 부호화 단위(11300)가 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위(1720a 또는 1720b)를 수직 방향으로 분할하여 제3 부호화 단위(1722a, 1722b, 1724a, 1724b)를 결정할 수 있다. 다만 영상 복원 장치(100)는 제2 부호화 단위 중 하나(예를 들면 상단 제2 부호화 단위(1720a))를 수직 방향으로 분할한 경우, 상술한 이유에 따라 다른 제2 부호화 단위(예를 들면 하단 부호화 단위(1720b))는 상단 제2 부호화 단위(1720a)가 분할된 방향과 동일하게 수직 방향으로 분할될 수 없도록 제한할 수 있다.

도 18은 일 실시예에 따라 분할 형태 정보가 4개의 정사각형 형태의 부호화 단위로 분할하는 것을 나타낼 수 없는 경우, 영상 복원 장치(100)가 정사각형 형태의 부호화 단위를 분할하는 과정을 도시한다.

일 실시예에 따라 영상 복원 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1800)를 분할하여 제2 부호화 단위(1810a, 1810b, 1820a, 1820b 등)를 결정할 수 있다. 분할 형태 정보에는 부호화 단위가 분할될 수 있는 다양한 형태에 대한 정보가 포함될 수 있으나, 다양한 형태에 대한 정보에는 정사각형 형태의 4개의 부호화 단위로 분할하기 위한 정보가 포함될 수 없는 경우가 있다. 이러한 분할 형태 정보에 따르면, 영상 복원 장치(100)는 정사각형 형태의 제1 부호화 단위(1800)를 4개의 정사각형 형태의 제2 부호화 단위(1830a, 1830b, 1830c, 1830d)로 분할하지 못한다. 분할 형태 정보에 기초하여 영상 복원 장치(100)는 비-정사각형 형태의 제2 부호화 단위(1810a, 1810b, 1820a, 1820b 등)를 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 비-정사각형 형태의 제2 부호화 단위(1810a, 1810b, 1820a, 1820b 등)를 각각 독립적으로 분할할 수 있다. 재귀적인 방법을 통해 제2 부호화 단위(1810a, 1810b, 1820a, 1820b 등) 각각이 소정의 순서대로 분할될 수 있으며, 이는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1800)가 분할되는 방법에 대응하는 분할 방법일 수 있다.

예를 들면 영상 복원 장치(100)는 좌측 제2 부호화 단위(1810a)가 수평 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1812a, 1812b)를 결정할 수 있고, 우측 제2 부호화 단위(1810b)가 수평 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1814a, 1814b)를 결정할 수 있다. 나아가 영상 복원 장치(100)는 좌측 제2 부호화 단위(1810a) 및 우측 제2 부호화 단위(1810b) 모두 수평 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1816a, 1816b, 1816c, 1816d)를 결정할 수도 있다. 이러한 경우 제1 부호화 단위(1800)가 4개의 정사각형 형태의 제2 부호화 단위(1830a, 1830b, 1830c, 1830d)로 분할된 것과 동일한 형태로 부호화 단위가 결정될 수 있다.

또 다른 예를 들면 영상 복원 장치(100)는 상단 제2 부호화 단위(1820a)가 수직 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1822a, 1822b)를 결정할 수 있고, 하단 제2 부호화 단위(1820b)가 수직 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1824a, 1824b)를 결정할 수 있다. 나아가 영상 복원 장치(100)는 상단 제2 부호화 단위(1820a) 및 하단 제2 부호화 단위(1820b) 모두 수직 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1822a, 1822b, 1824a, 1824b)를 결정할 수도 있다. 이러한 경우 제1 부호화 단위(1800)가 4개의 정사각형 형태의 제2 부호화 단위(1830a, 1830b, 1830c, 1830d)로 분할된 것과 동일한 형태로 부호화 단위가 결정될 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 블록 형태 정보 및 분할 형태 정보에 기초하여 제1 부호화 단위(1900)를 분할할 수 있다. 블록 형태 정보가 정사각형 형태를 나타내고, 분할 형태 정보가 제1 부호화 단위(1900)가 수평 방향 및 수직 방향 중 적어도 하나의 방향으로 분할됨을 나타내는 경우, 영상 복원 장치(100)는 제1 부호화 단위(1900)를 분할하여 제2 부호화 단위(예를 들면, 1910a, 1910b, 1920a, 1920b, 1930a, 1930b, 1930c, 1930d 등)를 결정할 수 있다. 도 19를 참조하면 제1 부호화 단위1900)가 수평 방향 또는 수직 방향만으로 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위(1910a, 1910b, 1920a, 1920b)는 각각에 대한 블록 형태 정보 및 분할 형태 정보에 기초하여 독립적으로 분할될 수 있다. 예를 들면 영상 복원 장치(100)는 제1 부호화 단위(1900)가 수직 방향으로 분할되어 생성된 제2 부호화 단위(1910a, 1910b)를 수평 방향으로 각각 분할하여 제3 부호화 단위(1916a, 1916b, 1916c, 1916d)를 결정할 수 있고, 제1 부호화 단위(1900)가 수평 방향으로 분할되어 생성된 제2 부호화 단위(1920a, 1920b)를 수평 방향으로 각각 분할하여 제3 부호화 단위(1926a, 1926b, 1926c, 1926d)를 결정할 수 있다. 이러한 제2 부호화 단위(1910a, 1910b, 1920a, 1920b)의 분할 과정은 도 17과 관련하여 상술하였으므로 자세한 설명은 생략하도록 한다.

일 실시예에 따라 영상 복원 장치(100)는 소정의 순서에 따라 부호화 단위를 처리할 수 있다. 소정의 순서에 따른 부호화 단위의 처리에 대한 특징은 도 14과 관련하여 상술하였으므로 자세한 설명은 생략하도록 한다. 도 19를 참조하면 영상 복원 장치(100)는 정사각형 형태의 제1 부호화 단위(1900)를 분할하여 4개의 정사각형 형태의 제3 부호화 단위(1916a, 1916b, 1916c, 1916d, 1926a, 1926b, 1926c, 1926d)를 결정할 수 있다. 일 실시예에 따라 영상 복원 장치(100)는 제1 부호화 단위(1900)가 분할되는 형태에 따라 제3 부호화 단위(1916a, 1916b, 1916c, 1916d, 1926a, 1926b, 1926c, 1926d)의 처리 순서를 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 수직 방향으로 분할되어 생성된 제2 부호화 단위(1910a, 1910b)를 수평 방향으로 각각 분할하여 제3 부호화 단위(1916a, 1916b, 1916c, 1916d)를 결정할 수 있고, 영상 복원 장치(100)는 좌측 제2 부호화 단위(1910a)에 포함되는 제3 부호화 단위(1916a, 1916b)를 수직 방향으로 먼저 처리한 후, 우측 제2 부호화 단위(1910b)에 포함되는 제3 부호화 단위(1916c, 1916d)를 수직 방향으로 처리하는 순서(1917)에 따라 제3 부호화 단위(1916a, 1916b, 1916c, 1916d)를 처리할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 수평 방향으로 분할되어 생성된 제2 부호화 단위(1920a, 1920b)를 수직 방향으로 각각 분할하여 제3 부호화 단위(1926a, 1926b, 1926c, 1926d)를 결정할 수 있고, 영상 복원 장치(100)는 상단 제2 부호화 단위(1920a)에 포함되는 제3 부호화 단위(1926a, 1926b)를 수평 방향으로 먼저 처리한 후, 하단 제2 부호화 단위(1920b)에 포함되는 제3 부호화 단위(1926c, 1926d)를 수평 방향으로 처리하는 순서(1927)에 따라 제3 부호화 단위(1926a, 1926b, 1926c, 1926d)를 처리할 수 있다.

도 19를 참조하면, 제2 부호화 단위(1910a, 1910b, 1920a, 1920b)가 각각 분할되어 정사각형 형태의 제3 부호화 단위(1916a, 1916b, 1916c, 1916d, 1926a, 1926b, 1926c, 1926d)가 결정될 수 있다. 수직 방향으로 분할되어 결정된 제2 부호화 단위(1910a, 1910b) 및 수평 방향으로 분할되어 결정된 제2 부호화 단위(1920a, 1920b)는 서로 다른 형태로 분할된 것이지만, 이후에 결정되는 제3 부호화 단위(1916a, 1916b, 1916c, 1916d, 1926a, 1926b, 1926c, 1926d)에 따르면 결국 동일한 형태의 부호화 단위들로 제1 부호화 단위(1900)가 분할된 결과가 된다. 이에 따라 영상 복원 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 상이한 과정을 통해 재귀적으로 부호화 단위를 분할함으로써 결과적으로 동일한 형태의 부호화 단위들을 결정하더라도, 동일한 형태로 결정된 복수개의 부호화 단위들을 서로 다른 순서로 처리할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 부호화 단위의 심도를 소정의 기준에 따라 결정할 수 있다. 예를 들면 소정의 기준은 부호화 단위의 긴 변의 길이가 될 수 있다. 영상 복원 장치(100)는 현재 부호화 단위의 긴 변의 길이가 분할되기 전의 부호화 단위의 긴 변의 길이보다 2n (n>0) 배로 분할된 경우, 현재 부호화 단위의 심도는 분할되기 전의 부호화 단위의 심도보다 n만큼 심도가 증가된 것으로 결정할 수 있다. 이하에서는 심도가 증가된 부호화 단위를 하위 심도의 부호화 단위로 표현하도록 한다.

도 20을 참조하면, 일 실시예에 따라 정사각형 형태임을 나타내는 블록 형태 정보(예를 들면 블록 형태 정보는 ′0: SQUARE′를 나타낼 수 있음)에 기초하여 영상 복원 장치(100)는 정사각형 형태인 제1 부호화 단위(2000)를 분할하여 하위 심도의 제2 부호화 단위(2002), 제3 부호화 단위(2004) 등을 결정할 수 있다. 정사각형 형태의 제1 부호화 단위(2000)의 크기를 2Nx2N이라고 한다면, 제1 부호화 단위(2000)의 너비 및 높이를 1/2¹배로 분할하여 결정된 제2 부호화 단위(2002)는 NxN의 크기를 가질 수 있다. 나아가 제2 부호화 단위(2002)의 너비 및 높이를 1/2크기로 분할하여 결정된 제3 부호화 단위(2004)는 N/2xN/2의 크기를 가질 수 있다. 이 경우 제3 부호화 단위(2004)의 너비 및 높이는 제1 부호화 단위(2000)의 1/2²배에 해당한다. 제1 부호화 단위(2000)의 심도가 D인 경우 제1 부호화 단위(2000)의 너비 및 높이의 1/2¹배인 제2 부호화 단위(2002)의 심도는 D+1일 수 있고, 제1 부호화 단위(2000)의 너비 및 높이의 1/2²배인 제3 부호화 단위(2004)의 심도는 D+2일 수 있다.

일 실시예에 따라 비-정사각형 형태를 나타내는 블록 형태 정보(예를 들면 블록 형태 정보는, 높이가 너비보다 긴 비-정사각형임을 나타내는 ′1: NS_VER′ 또는 너비가 높이보다 긴 비-정사각형임을 나타내는 ′2: NS_HOR′를 나타낼 수 있음)에 기초하여, 영상 복원 장치(100)는 비-정사각형 형태인 제1 부호화 단위(2010 또는 2020)를 분할하여 하위 심도의 제2 부호화 단위(2012 또는 2022), 제3 부호화 단위(2014 또는 2024) 등을 결정할 수 있다.

영상 복원 장치(100)는 Nx2N 크기의 제1 부호화 단위(2010)의 너비 및 높이 중 적어도 하나를 분할하여 제2 부호화 단위(예를 들면, 2002, 2012, 2022 등)를 결정할 수 있다. 즉, 영상 복원 장치(100)는 제1 부호화 단위(2010)를 수평 방향으로 분할하여 NxN 크기의 제2 부호화 단위(2002) 또는 NxN/2 크기의 제2 부호화 단위(2022)를 결정할 수 있고, 수평 방향 및 수직 방향으로 분할하여 N/2xN 크기의 제2 부호화 단위(2012)를 결정할 수도 있다.

일 실시예에 따라 영상 복원 장치(100)는 2NxN 크기의 제1 부호화 단위(2020) 의 너비 및 높이 중 적어도 하나를 분할하여 제2 부호화 단위(예를 들면, 2002, 2012, 2022 등)를 결정할 수도 있다. 즉, 영상 복원 장치(100)는 제1 부호화 단위(2020)를 수직 방향으로 분할하여 NxN 크기의 제2 부호화 단위(2002) 또는 N/2xN 크기의 제2 부호화 단위(2012)를 결정할 수 있고, 수평 방향 및 수직 방향으로 분할하여 NxN/2 크기의 제2 부호화 단위(2022)를 결정할 수도 있다.

일 실시예에 따라 영상 복원 장치(100)는 NxN 크기의 제2 부호화 단위(2002) 의 너비 및 높이 중 적어도 하나를 분할하여 제3 부호화 단위(예를 들면, 2004, 2014, 2024 등)를 결정할 수도 있다. 즉, 영상 복원 장치(100)는 제2 부호화 단위(2002)를 수직 방향 및 수평 방향으로 분할하여 N/2xN/2 크기의 제3 부호화 단위(2004)를 결정하거나 N/2²xN/2 크기의 제3 부호화 단위(2014)를 결정하거나 N/2xN/2² 크기의 제3 부호화 단위(2024)를 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 N/2xN 크기의 제2 부호화 단위(2012)의 너비 및 높이 중 적어도 하나를 분할하여 제3 부호화 단위(예를 들면, 2004, 2014, 2024 등)를 결정할 수도 있다. 즉, 영상 복원 장치(100)는 제2 부호화 단위(2012)를 수평 방향으로 분할하여 N/2xN/2 크기의 제3 부호화 단위(2004) 또는 N/2xN/2² 크기의 제3 부호화 단위(2024)를 결정하거나 수직 방향 및 수평 방향으로 분할하여 N/2²xN/2 크기의 제3 부호화 단위(2014)를 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 NxN/2 크기의 제2 부호화 단위(2014)의 너비 및 높이 중 적어도 하나를 분할하여 제3 부호화 단위(예를 들면, 2004, 2014, 2024 등)를 결정할 수도 있다. 즉, 영상 복원 장치(100)는 제2 부호화 단위(2012)를 수직 방향으로 분할하여 N/2xN/2 크기의 제3 부호화 단위(2004) 또는 N/2²xN/2 크기의 제3 부호화 단위(2014)를 결정하거나 수직 방향 및 수평 방향으로 분할하여 N/2xN/2²크기의 제3 부호화 단위(2024)를 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 정사각형 형태의 부호화 단위(예를 들면, 2000, 2002, 2004)를 수평 방향 또는 수직 방향으로 분할할 수 있다. 예를 들면, 2Nx2N 크기의 제1 부호화 단위(2000)를 수직 방향으로 분할하여 Nx2N 크기의 제1 부호화 단위(2010)를 결정하거나 수평 방향으로 분할하여 2NxN 크기의 제1 부호화 단위(2020)를 결정할 수 있다. 일 실시예에 따라 심도가 부호화 단위의 가장 긴 변의 길이에 기초하여 결정되는 경우, 2Nx2N 크기의 제1 부호화 단위(2000, 2002 또는 2004)가 수평 방향 또는 수직 방향으로 분할되어 결정되는 부호화 단위의 심도는 제1 부호화 단위(2000, 2002 또는 2004)의 심도와 동일할 수 있다.

일 실시예에 따라 제3 부호화 단위(2014 또는 2024)의 너비 및 높이는 제1 부호화 단위(2010 또는 2020)의 1/2²배에 해당할 수 있다. 제1 부호화 단위(2010 또는 2020)의 심도가 D인 경우 제1 부호화 단위(2010 또는 2020)의 너비 및 높이의 1/2배인 제2 부호화 단위(2012 또는 2014)의 심도는 D+1일 수 있고, 제1 부호화 단위(2010 또는 2020)의 너비 및 높이의 1/2²배인 제3 부호화 단위(2014 또는 2024)의 심도는 D+2일 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 정사각형 형태의 제1 부호화 단위(2100)를 분할하여 다양한 형태의 제2 부호화 단위를 결정할 수 있다. 도 21를 참조하면, 영상 복원 장치(100)는 분할 형태 정보에 따라 제1 부호화 단위(2100)를 수직 방향 및 수평 방향 중 적어도 하나의 방향으로 분할하여 제2 부호화 단위(2102a, 2102b, 2104a, 2104b, 2106a, 2106b, 2106c, 2106d)를 결정할 수 있다. 즉, 영상 복원 장치(100)는 제1 부호화 단위(2100)에 대한 분할 형태 정보에 기초하여 제2 부호화 단위(2102a, 2102b, 2104a, 2104b, 2106a, 2106b, 2106c, 2106d)를 결정할 수 있다.

일 실시예에 따라 정사각형 형태의 제1 부호화 단위(2100)에 대한 분할 형태 정보에 따라 결정되는 제2 부호화 단위(2102a, 2102b, 2104a, 2104b, 2106a, 2106b, 2106c, 2106d)는 긴 변의 길이에 기초하여 심도가 결정될 수 있다. 예를 들면, 정사각형 형태의 제1 부호화 단위(2100)의 한 변의 길이와 비-정사각형 형태의 제2 부호화 단위(2102a, 2102b, 2104a, 2104b)의 긴 변의 길이가 동일하므로, 제1 부호화 단위(2100)와 비-정사각형 형태의 제2 부호화 단위(2102a, 2102b, 2104a, 2104b)의 심도는 D로 동일하다고 볼 수 있다. 이에 반해 영상 복원 장치(100)가 분할 형태 정보에 기초하여 제1 부호화 단위(2100)를 4개의 정사각형 형태의 제2 부호화 단위(2106a, 2106b, 2106c, 2106d)로 분할한 경우, 정사각형 형태의 제2 부호화 단위(2106a, 2106b, 2106c, 2106d)의 한 변의 길이는 제1 부호화 단위(2100)의 한 변의 길이의 1/2배 이므로, 제2 부호화 단위(2106a, 2106b, 2106c, 2106d)의 심도는 제1 부호화 단위(2100)의 심도인 D보다 한 심도 하위인 D+1의 심도일 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 높이가 너비보다 긴 형태의 제1 부호화 단위(2110)를 분할 형태 정보에 따라 수평 방향으로 분할하여 복수개의 제2 부호화 단위(2112a, 2112b, 2114a, 2114b, 2114c)로 분할할 수 있다. 일 실시예에 따라 영상 복원 장치(100)는 너비가 높이보다 긴 형태의 제1 부호화 단위(2120)를 분할 형태 정보에 따라 수직 방향으로 분할하여 복수개의 제2 부호화 단위(2122a, 2122b, 2124a, 2124b, 2124c)로 분할할 수 있다.

일 실시예에 따라 비-정사각형 형태의 제1 부호화 단위(2110 또는 2120)에 대한 분할 형태 정보에 따라 결정되는 제2 부호화 단위(2112a, 2112b, 2114a, 2114b, 2116a, 2116b, 2116c, 2116d)는 긴 변의 길이에 기초하여 심도가 결정될 수 있다. 예를 들면, 정사각형 형태의 제2 부호화 단위(2112a, 2112b)의 한 변의 길이는 높이가 너비보다 긴 비-정사각형 형태의 제1 부호화 단위(2110)의 한 변의 길이의 1/2배이므로, 정사각형 형태의 제2 부호화 단위(2102a, 2102b, 2104a, 2104b)의 심도는 비-정사각형 형태의 제1 부호화 단위(2110)의 심도 D보다 한 심도 하위의 심도인 D+1이다.

나아가 영상 복원 장치(100)가 분할 형태 정보에 기초하여 비-정사각형 형태의 제1 부호화 단위(2110)를 홀수개의 제2 부호화 단위(2114a, 2114b, 2114c)로 분할할 수 있다. 홀수개의 제2 부호화 단위(2114a, 2114b, 2114c)는 비-정사각형 형태의 제2 부호화 단위(2114a, 2114c) 및 정사각형 형태의 제2 부호화 단위(2114b)를 포함할 수 있다. 이 경우 비-정사각형 형태의 제2 부호화 단위(2114a, 2114c)의 긴 변의 길이 및 정사각형 형태의 제2 부호화 단위(2114b)의 한 변의 길이는 제1 부호화 단위(2110)의 한 변의 길이의 1/2배 이므로, 제2 부호화 단위(2114a, 2114b, 2114c)의 심도는 제1 부호화 단위(2110)의 심도인 D보다 한 심도 하위인 D+1의 심도일 수 있다. 영상 복원 장치(100)는 제1 부호화 단위(2110)와 관련된 부호화 단위들의 심도를 결정하는 상기 방식에 대응하는 방식으로, 너비가 높이보다 긴 비-정사각형 형태의 제1 부호화 단위(2120)와 관련된 부호화 단위들의 심도를 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 분할된 부호화 단위들의 구분을 위한 인덱스(PID)를 결정함에 있어서, 홀수개로 분할된 부호화 단위들이 서로 동일한 크기가 아닌 경우, 부호화 단위들 간의 크기 비율에 기초하여 인덱스를 결정할 수 있다. 도 21를 참조하면, 홀수개로 분할된 부호화 단위들(2114a, 2114b, 2114c) 중 가운데에 위치하는 부호화 단위(2114b)는 다른 부호화 단위들(2114a, 2114c)와 너비는 동일하지만 높이가 다른 부호화 단위들(2114a, 2114c)의 높이의 두 배일 수 있다. 즉, 이 경우 가운데에 위치하는 부호화 단위(2114b)는 다른 부호화 단위들(2114a, 2114c)의 두 개를 포함할 수 있다. 따라서, 스캔 순서에 따라 가운데에 위치하는 부호화 단위(2114b)의 인덱스(PID)가 1이라면 그 다음 순서에 위치하는 부호화 단위(2114c)는 인덱스가 2가 증가한 3일수 있다. 즉 인덱스의 값의 불연속성이 존재할 수 있다. 일 실시예에 따라 영상 복원 장치(100)는 이러한 분할된 부호화 단위들 간의 구분을 위한 인덱스의 불연속성의 존재 여부에 기초하여 홀수개로 분할된 부호화 단위들이 서로 동일한 크기가 아닌지 여부를 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 현재 부호화 단위로부터 분할되어 결정된 복수개의 부호화 단위들을 구분하기 위한 인덱스의 값에 기초하여 특정 분할 형태로 분할된 것인지를 결정할 수 있다. 도 21를 참조하면 영상 복원 장치(100)는 높이가 너비보다 긴 직사각형 형태의 제1 부호화 단위(2110)를 분할하여 짝수개의 부호화 단위(2112a, 2112b)를 결정하거나 홀수개의 부호화 단위(2114a, 2114b, 2114c)를 결정할 수 있다. 영상 복원 장치(100)는 복수개의 부호화 단위 각각을 구분하기 위하여 각 부호화 단위를 나타내는 인덱스(PID)를 이용할 수 있다. 일 실시예에 따라 PID는 각각의 부호화 단위의 소정 위치의 샘플(예를 들면, 좌측 상단 샘플)에서 획득될 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 부호화 단위의 구분을 위한 인덱스를 이용하여 분할되어 결정된 부호화 단위들 중 소정 위치의 부호화 단위를 결정할 수 있다. 일 실시예에 따라 높이가 너비보다 긴 직사각형 형태의 제1 부호화 단위(2110)에 대한 분할 형태 정보가 3개의 부호화 단위로 분할됨을 나타내는 경우 영상 복원 장치(100)는 제1 부호화 단위(2110)를 3개의 부호화 단위(2114a, 2114b, 2114c)로 분할할 수 있다. 영상 복원 장치(100)는 3개의 부호화 단위(2114a, 2114b, 2114c) 각각에 대한 인덱스를 할당할 수 있다. 영상 복원 장치(100)는 홀수개로 분할된 부호화 단위 중 가운데 부호화 단위를 결정하기 위하여 각 부호화 단위에 대한 인덱스를 비교할 수 있다. 영상 복원 장치(100)는 부호화 단위들의 인덱스에 기초하여 인덱스들 중 가운데 값에 해당하는 인덱스를 갖는 부호화 단위(2114b)를, 제1 부호화 단위(2110)가 분할되어 결정된 부호화 단위 중 가운데 위치의 부호화 단위로서 결정할 수 있다. 일 실시예에 따라 영상 복원 장치(100)는 분할된 부호화 단위들의 구분을 위한 인덱스를 결정함에 있어서, 부호화 단위들이 서로 동일한 크기가 아닌 경우, 부호화 단위들 간의 크기 비율에 기초하여 인덱스를 결정할 수 있다. 도 21를 참조하면, 제1 부호화 단위(2110)가 분할되어 생성된 부호화 단위(2114b)는 다른 부호화 단위들(2114a, 2114c)와 너비는 동일하지만 높이가 다른 부호화 단위들(2114a, 2114c)의 높이의 두 배일 수 있다. 이 경우 가운데에 위치하는 부호화 단위(2114b)의 인덱스(PID)가 1이라면 그 다음 순서에 위치하는 부호화 단위(2114c)는 인덱스가 2가 증가한 3일수 있다. 이러한 경우처럼 균일하게 인덱스가 증가하다가 증가폭이 달라지는 경우, 영상 복원 장치(100)는 다른 부호화 단위들과 다른 크기를 가지는 부호화 단위를 포함하는 복수개의 부호화 단위로 분할된 것으로 결정할 수 있다, 일 실시예에 따라 분할 형태 정보가 홀수개의 부호화 단위로 분할됨을 나타내는 경우, 영상 복원 장치(100)는 홀수개의 부호화 단위 중 소정 위치의 부호화 단위(예를 들면 가운데 부호화 단위)가 다른 부호화 단위와 크기가 다른 형태로 현재 부호화 단위를 분할할 수 있다. 이 경우 영상 복원 장치(100)는 부호화 단위에 대한 인덱스(PID)를 이용하여 다른 크기를 가지는 가운데 부호화 단위를 결정할 수 있다. 다만 상술한 인덱스, 결정하고자 하는 소정 위치의 부호화 단위의 크기 또는 위치는 일 실시예를 설명하기 위해 특정한 것이므로 이에 한정하여 해석되어서는 안되며, 다양한 인덱스, 부호화 단위의 위치 및 크기가 이용될 수 있는 것으로 해석되어야 한다.

일 실시예에 따라 영상 복원 장치(100)는 부호화 단위의 재귀적인 분할이 시작되는 소정의 데이터 단위를 이용할 수 있다.

일 실시예에 따라 소정의 데이터 단위는 부호화 단위가 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용하여 재귀적으로 분할되기 시작하는 데이터 단위로 정의될 수 있다. 즉, 현재 픽쳐를 분할하는 복수개의 부호화 단위들이 결정되는 과정에서 이용되는 최상위 심도의 부호화 단위에 해당할 수 있다. 이하에서는 설명 상 편의를 위해 이러한 소정의 데이터 단위를 기준 데이터 단위라고 지칭하도록 한다.

일 실시예에 따라 기준 데이터 단위는 소정의 크기 및 형태를 나타낼 수 있다. 일 실시예에 따라, 기준 부호화 단위는 MxN의 샘플들을 포함할 수 있다. 여기서 M 및 N은 서로 동일할 수도 있으며, 2의 승수로 표현되는 정수일 수 있다. 즉, 기준 데이터 단위는 정사각형 또는 비-정사각형의 형태를 나타낼 수 있으며, 이후에 정수개의 부호화 단위로 분할될 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 현재 픽쳐를 복수개의 기준 데이터 단위로 분할할 수 있다. 일 실시예에 따라 영상 복원 장치(100)는 현재 픽쳐를 분할하는 복수개의 기준 데이터 단위를 각각의 기준 데이터 단위에 대한 분할 정보를 이용하여 분할할 수 있다. 이러한 기준 데이터 단위의 분할 과정은 쿼드 트리(quad-tree)구조를 이용한 분할 과정에 대응될 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 현재 픽쳐에 포함되는 기준 데이터 단위가 가질 수 있는 최소 크기를 미리 결정할 수 있다. 이에 따라, 영상 복원 장치(100)는 최소 크기 이상의 크기를 갖는 다양한 크기의 기준 데이터 단위를 결정할 수 있고, 결정된 기준 데이터 단위를 기준으로 블록 형태 정보 및 분할 형태 정보를 이용하여 적어도 하나의 부호화 단위를 결정할 수 있다.

도 22를 참조하면, 영상 복원 장치(100)는 정사각형 형태의 기준 부호화 단위(2200)를 이용할 수 있고, 또는 비-정사각형 형태의 기준 부호화 단위(2202)를 이용할 수도 있다. 일 실시예에 따라 기준 부호화 단위의 형태 및 크기는 적어도 하나의 기준 부호화 단위를 포함할 수 있는 다양한 데이터 단위(예를 들면, 시퀀스(sequence), 픽쳐(picture), 슬라이스(slice), 슬라이스 세그먼트(slice segment), 최대부호화단위 등)에 따라 결정될 수 있다.

일 실시예에 따라 영상 복원 장치(100)의 수신부(210)는 기준 부호화 단위의 형태에 대한 정보 및 기준 부호화 단위의 크기에 대한 정보 중 적어도 하나를 상기 다양한 데이터 단위마다 비트스트림으로부터 획득할 수 있다. 정사각형 형태의 기준 부호화 단위(2200)에 포함되는 적어도 하나의 부호화 단위가 결정되는 과정은 도 10의 현재 부호화 단위(300)가 분할되는 과정을 통해 상술하였고, 비-정사각형 형태의 기준 부호화 단위(2200)에 포함되는 적어도 하나의 부호화 단위가 결정되는 과정은 도 11의 현재 부호화 단위(1100 또는 1150)가 분할되는 과정을 통해 상술하였으므로 자세한 설명은 생략하도록 한다.

일 실시예에 따라 영상 복원 장치(100)는 소정의 조건에 기초하여 미리 결정되는 일부 데이터 단위에 따라 기준 부호화 단위의 크기 및 형태를 결정하기 위하여, 기준 부호화 단위의 크기 및 형태를 식별하기 위한 인덱스를 이용할 수 있다. 즉, 수신부(210)는 비트스트림으로부터 상기 다양한 데이터 단위(예를 들면, 시퀀스, 픽쳐, 슬라이스, 슬라이스 세그먼트, 최대부호화단위 등) 중 소정의 조건(예를 들면 슬라이스 이하의 크기를 갖는 데이터 단위)을 만족하는 데이터 단위로서 슬라이스, 슬라이스 세그먼트, 최대부호화 단위 등 마다, 기준 부호화 단위의 크기 및 형태의 식별을 위한 인덱스만을 획득할 수 있다. 영상 복원 장치(100)는 인덱스를 이용함으로써 상기 소정의 조건을 만족하는 데이터 단위마다 기준 데이터 단위의 크기 및 형태를 결정할 수 있다. 기준 부호화 단위의 형태에 대한 정보 및 기준 부호화 단위의 크기에 대한 정보를 상대적으로 작은 크기의 데이터 단위마다 비트스트림으로부터 획득하여 이용하는 경우, 비트스트림의 이용 효율이 좋지 않을 수 있으므로, 기준 부호화 단위의 형태에 대한 정보 및 기준 부호화 단위의 크기에 대한 정보를 직접 획득하는 대신 상기 인덱스만을 획득하여 이용할 수 있다. 이 경우 기준 부호화 단위의 크기 및 형태를 나타내는 인덱스에 대응하는 기준 부호화 단위의 크기 및 형태 중 적어도 하나는 미리 결정되어 있을 수 있다. 즉, 영상 복원 장치(100)는 미리 결정된 기준 부호화 단위의 크기 및 형태 중 적어도 하나를 인덱스에 따라 선택함으로써, 인덱스 획득의 기준이 되는 데이터 단위에 포함되는 기준 부호화 단위의 크기 및 형태 중 적어도 하나를 결정할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 하나의 최대 부호화 단위에 포함하는 적어도 하나의 기준 부호화 단위를 이용할 수 있다. 즉, 영상을 분할하는 최대 부호화 단위에는 적어도 하나의 기준 부호화 단위가 포함될 수 있고, 각각의 기준 부호화 단위의 재귀적인 분할 과정을 통해 부호화 단위가 결정될 수 있다. 일 실시예에 따라 최대 부호화 단위의 너비 및 높이 중 적어도 하나는 기준 부호화 단위의 너비 및 높이 중 적어도 하나의 정수배에 해당할 수 있다. 일 실시예에 따라 기준 부호화 단위의 크기는 최대부호화단위를 쿼드 트리 구조에 따라 n번 분할한 크기일 수 있다. 즉, 영상 복원 장치(100)는 최대부호화단위를 쿼드 트리 구조에 따라 n 번 분할하여 기준 부호화 단위를 결정할 수 있고, 다양한 실시예들에 따라 기준 부호화 단위를 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 분할할 수 있다.

도 23은 일 실시예에 따라 픽쳐(2300)에 포함되는 기준 부호화 단위의 결정 순서를 결정하는 기준이 되는 프로세싱 블록을 도시한다.

일 실시예에 따라 영상 복원 장치(100)는 픽쳐를 분할하는 적어도 하나의 프로세싱 블록을 결정할 수 있다. 프로세싱 블록이란, 영상을 분할하는 적어도 하나의 기준 부호화 단위를 포함하는 데이터 단위로서, 프로세싱 블록에 포함되는 적어도 하나의 기준 부호화 단위는 특정 순서대로 결정될 수 있다. 즉, 각각의 프로세싱 블록에서 결정되는 적어도 하나의 기준 부호화 단위의 결정 순서는 기준 부호화 단위가 결정될 수 있는 다양한 순서의 종류 중 하나에 해당할 수 있으며, 각각의 프로세싱 블록에서 결정되는 기준 부호화 단위 결정 순서는 프로세싱 블록마다 상이할 수 있다. 프로세싱 블록마다 결정되는 기준 부호화 단위의 결정 순서는 래스터 스캔(raster scan), Z 스캔(Z-scan), N 스캔(N-scan), 우상향 대각 스캔(up-right diagonal scan), 수평적 스캔(horizontal scan), 수직적 스캔(vertical scan) 등 다양한 순서 중 하나일 수 있으나, 결정될 수 있는 순서는 상기 스캔 순서들에 한정하여 해석되어서는 안 된다.

일 실시예에 따라 영상 복원 장치(100)는 프로세싱 블록의 크기에 대한 정보를 획득하여 영상에 포함되는 적어도 하나의 프로세싱 블록의 크기를 결정할 수 있다. 영상 복원 장치(100)는 프로세싱 블록의 크기에 대한 정보를 비트스트림으로부터 획득하여 영상에 포함되는 적어도 하나의 프로세싱 블록의 크기를 결정할 수 있다. 이러한 프로세싱 블록의 크기는 프로세싱 블록의 크기에 대한 정보가 나타내는 데이터 단위의 소정의 크기일 수 있다.

일 실시예에 따라 영상 복원 장치(100)의 수신부(210)는 비트스트림으로부터 프로세싱 블록의 크기에 대한 정보를 특정의 데이터 단위마다 획득할 수 있다. 예를 들면 프로세싱 블록의 크기에 대한 정보는 영상, 시퀀스, 픽쳐, 슬라이스, 슬라이스 세그먼트 등의 데이터 단위로 비트스트림으로부터 획득될 수 있다. 즉 수신부(210)는 상기 여러 데이터 단위마다 비트스트림으로부터 프로세싱 블록의 크기에 대한 정보를 획득할 수 있고 영상 복원 장치(100)는 획득된 프로세싱 블록의 크기에 대한 정보를 이용하여 픽쳐를 분할하는 적어도 하나의 프로세싱 블록의 크기를 결정할 수 있으며, 이러한 프로세싱 블록의 크기는 기준 부호화 단위의 정수배의 크기일 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 픽쳐(2300)에 포함되는 프로세싱 블록(2302, 2312)의 크기를 결정할 수 있다. 예를 들면, 영상 복원 장치(100)는 비트스트림으로부터 획득된 프로세싱 블록의 크기에 대한 정보에 기초하여 프로세싱 블록의 크기를 결정할 수 있다. 도 23을 참조하면, 영상 복원 장치(100)는 일 실시예에 따라 프로세싱 블록(2302, 2312)의 가로크기를 기준 부호화 단위 가로크기의 4배, 세로크기를 기준 부호화 단위의 세로크기의 4배로 결정할 수 있다. 영상 복원 장치(100)는 적어도 하나의 프로세싱 블록 내에서 적어도 하나의 기준 부호화 단위가 결정되는 순서를 결정할 수 있다.

일 실시예에 따라, 영상 복원 장치(100)는 프로세싱 블록의 크기에 기초하여 픽쳐(2300)에 포함되는 각각의 프로세싱 블록(2302, 2312)을 결정할 수 있고, 프로세싱 블록(2302, 2312)에 포함되는 적어도 하나의 기준 부호화 단위의 결정 순서를 결정할 수 있다. 일 실시예에 따라 기준 부호화 단위의 결정은 기준 부호화 단위의 크기의 결정을 포함할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 비트스트림으로부터 적어도 하나의 프로세싱 블록에 포함되는 적어도 하나의 기준 부호화 단위의 결정 순서에 대한 정보를 획득할 수 있고, 획득한 결정 순서에 대한 정보에 기초하여 적어도 하나의 기준 부호화 단위가 결정되는 순서를 결정할 수 있다. 결정 순서에 대한 정보는 프로세싱 블록 내에서 기준 부호화 단위들이 결정되는 순서 또는 방향으로 정의될 수 있다. 즉, 기준 부호화 단위들이 결정되는 순서는 각각의 프로세싱 블록마다 독립적으로 결정될 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 특정 데이터 단위마다 기준 부호화 단위의 결정 순서에 대한 정보를 비트스트림으로부터 획득할 수 있다. 예를 들면, 수신부(210)는 기준 부호화 단위의 결정 순서에 대한 정보를 영상, 시퀀스, 픽쳐, 슬라이스, 슬라이스 세그먼트, 프로세싱 블록 등의 데이터 단위로마다 비트스트림으로부터 획득할 수 있다. 기준 부호화 단위의 결정 순서에 대한 정보는 프로세싱 블록 내에서의 기준 부호화 단위 결정 순서를 나타내므로, 결정 순서에 대한 정보는 정수개의 프로세싱 블록을 포함하는 특정 데이터 단위 마다 획득될 수 있다.

영상 복원 장치(100)는 일 실시예에 따라 결정된 순서에 기초하여 적어도 하나의 기준 부호화 단위를 결정할 수 있다.

일 실시예에 따라 수신부(210)는 비트스트림으로부터 프로세싱 블록(2302, 2312)과 관련된 정보로서, 기준 부호화 단위 결정 순서에 대한 정보를 획득할 수 있고, 영상 복원 장치(100)는 상기 프로세싱 블록(2302, 2312)에 포함된 적어도 하나의 기준 부호화 단위를 결정하는 순서를 결정하고 부호화 단위의 결정 순서에 따라 픽쳐(2300)에 포함되는 적어도 하나의 기준 부호화 단위를 결정할 수 있다. 도 23을 참조하면, 영상 복원 장치(100)는 각각의 프로세싱 블록(2302, 2312)과 관련된 적어도 하나의 기준 부호화 단위의 결정 순서(2304, 2314)를 결정할 수 있다. 예를 들면, 기준 부호화 단위의 결정 순서에 대한 정보가 프로세싱 블록마다 획득되는 경우, 각각의 프로세싱 블록(2302, 2312)과 관련된 기준 부호화 단위 결정 순서는 프로세싱 블록마다 상이할 수 있다. 프로세싱 블록(2302)과 관련된 기준 부호화 단위 결정 순서(2304)가 래스터 스캔(raster scan)순서인 경우, 프로세싱 블록(2302)에 포함되는 기준 부호화 단위는 래스터 스캔 순서에 따라 결정될 수 있다. 이에 반해 다른 프로세싱 블록(2312)과 관련된 기준 부호화 단위 결정 순서(2314)가 래스터 스캔 순서의 역순인 경우, 프로세싱 블록(2312)에 포함되는 기준 부호화 단위는 래스터 스캔 순서의 역순에 따라 결정될 수 있다.

영상 복원 장치(100)는 일 실시예에 따라, 결정된 적어도 하나의 기준 부호화 단위를 복호화할 수 있다. 영상 복원 장치(100)는 상술한 실시예를 통해 결정된 기준 부호화 단위에 기초하여 영상을 복호화 할 수 있다. 기준 부호화 단위를 복호화 하는 방법은 영상을 복호화 하는 다양한 방법들을 포함할 수 있다.

일 실시예에 따라 영상 복원 장치(100)는 현재 부호화 단위의 형태를 나타내는 블록 형태 정보 또는 현재 부호화 단위를 분할하는 방법을 나타내는 분할 형태 정보를 비트스트림으로부터 획득하여 이용할 수 있다. 블록 형태 정보 또는 분할 형태 정보는 다양한 데이터 단위와 관련된 비트스트림에 포함될 수 있다. 예를 들면, 영상 복원 장치(100)는 시퀀스 파라미터 세트(sequence parameter set), 픽쳐 파라미터 세트(picture parameter set), 비디오 파라미터 세트(video parameter set), 슬라이스 헤더(slice header), 슬라이스 세그먼트 헤더(slice segment header)에 포함된 블록 형태 정보 또는 분할 형태 정보를 이용할 수 있다. 나아가, 영상 복원 장치(100)는 최대 부호화 단위, 기준 부호화 단위, 프로세싱 블록마다 비트스트림으로부터 블록 형태 정보 또는 분할 형태 정보에 대응하는 신택스를 비트스트림으로부터 획득하여 이용할 수 있다.

이제까지 다양한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.

Claims

영상을 복원하는 방법에 있어서,

비트스트림으로부터 상기 영상을 다운샘플링(down-sampling)한 압축영상에 대한 잔차신호를 획득하는 단계;

상기 잔차신호 및 예측을 수행하여 획득한 예측신호를 이용하여 압축 상기 압축영상을 복호화하는 단계; 및

상기 복호화된 압축영상에 DNN(Deep Neural Network)을 이용한 업샘플링(up-sampling)을 수행하여 상기 영상을 복원하는 단계를 포함하고,

상기 DNN은 다운샘플링 과정에서 생성되는 정보를 이용한 업샘플링 과정의 학습을 통해 미리 결정된 네트워크 구조를 가지는 것을 특징으로 하는 영상 복원 방법.
제 1 항에 있어서, 상기 영상을 복원하는 단계는

복수개의 레이어(hidden layer)를 포함하는 심층 컨볼루셔널 뉴럴 네트워크(Deep Convolutional Neural Network)를 이용하여 업샘플링을 수행하는 단계를 포함하는 영상 복원 방법.
제 2 항에 있어서, 상기 심층 컨볼루셔널 뉴럴 네트워크를 이용하여 업샘플링을 수행하는 단계는,

복수개의 필터 커널들 중 적어도 하나를 이용하여 상기 복수개의 레이어마다 필터링을 수행하여 상기 업샘플링을 수행하는 단계를 포함하고

상기 복수개의 필터 커널들의 종류는 상기 영상이 다운샘플링될 때 이용된 필터 커널들의 종류와 다른 것을 특징으로 하는 영상 복원 방법.
제 2 항에 있어서, 상기 영상을 복원하는 단계는,

상기 DNN의 복수개의 레이어 각각에서 적어도 하나의 필터 커널을 이용하여 필터링을 수행하는 단계를 포함하는 영상 복원 방법.
제 1 항에 있어서,

상기 DNN은 업샘플링이 수행됨으로써 복원된 영상과 다운샘플링이 수행되기 전의 원본 영상 간의 비교에 의해 결정되는 적어도 하나의 손실정보의 합이 감소되도록 학습된 것을 특징으로 하고,

상기 적어도 하나의 손실정보 중 일부는 다운샘플링을 위한 DNN의 학습 과정에서 이용되는 것을 특징으로 하는 영상 복원 방법.
제 5 항에 있어서,

다운샘플링을 위한 DNN은, 다운샘플링 되기 전의 원본영상과 상기 원본 영상의 구조적 특징에 기초하여 공간적 크기가 축소된 구조적 복원 영상 간의 차이에 기초하여 결정되는 적어도 하나의 손실정보의 합이 감소되도록 학습된 것을 특징으로 하고,

상기 압축영상은 상기 학습과정이 수행된 다운샘플링을 위한 DNN에 의해 다운샘플링된 영상인 것을 특징으로 하는 영상 복원 방법.
제 6 항에 있어서,

상기 구조적 특징은 원본영상의 휘도, 대비, 히스토그램, 부호화 품질, 압축 히스토리 정보 및 상기 원본영상의 타입 중 적어도 하나를 포함하는 것을 특징으로 하는 영상 복원 방법.
영상을 압축하는 방법에 있어서,

상기 영상에 대한 DNN을 이용한 다운샘플링을 수행하여 압축영상을 결정하는 단계;

상기 압축영상에 기초한 예측을 수행하여 예측신호를 결정하는 단계;

상기 압축영상 및 예측신호에 기초하여 잔차신호를 결정하는 단계; 및

상기 잔차신호에 대한 정보를 포함하는 비트스트림을 생성하는 단계를 포함하고,

상기 DNN은, 업샘플링 과정에서 생성되는 정보를 이용한 다운샘플링 과정의 학습을 통해 미리 결정된 네트워크 구조를 가지는 것을 특징으로 하는 영상 압축 방법.
제 8 항에 있어서, 상기 압축영상을 결정하는 단계는,

복수개의 레이어를 포함하는 심층 컨볼루셔널 뉴럴 네트워크를 이용하여 상기 압축영상을 결정하는 단계를 포함하는 영상 압축 방법.
제 9 항에 있어서, 상기 압축영상을 결정하는 단계는,

상기 복수개의 레이어마다 복수개의 필터 커널들 중 적어도 하나를 이용하여 필터링을 수행하여 상기 압축영상을 생성하는 단계를 포함하는 영상 압축 방법.
제 10 항에 있어서, 상기 필터링을 수행하는 단계는,

상기 복수개의 레이어 중 복수개의 필터 커널이 이용되는 레이어에서는 상기 복수개의 필터 커널로 필터링을 수행하는 단계;

상기 필터링 결과에 따라 획득된 복수개의 신호들을 연결(concatenate)하는 단계; 및

상기 연결된 신호들을 다음 레이어의 입력으로 이용함으로써 다음 레이어에서 필터링을 수행하는 단계를 포함하는 영상 압축 방법.
제 8 항에 있어서, 상기 비트스트림을 생성하는 단계는,

상기 다운샘플링에 의해 상기 영상의 크기 및 영상의 프레임 레이트(frame rate) 중 적어도 하나가 감축된 정도를 나타내는 샘플링 정보를 포함하는 비트스트림을 생성하는 단계를 포함하는 것을 특징으로 하는 영상 압축 방법.
제 9 항에 있어서,

상기 DNN을 이용한 다운샘플링에 의해 발생하는 손실(loss)을 나타내는 적어도 하나의 손실정보의 합이 감소되도록 상기 DNN이 학습되는 것을 특징으로 하고,

상기 적어도 하나의 손실정보 중 일부는 업샘플링이 수행됨으로써 복원된 영상과 다운샘플링이 수행되기 전의 원본 영상 간의 비교 결과에 기초하여 결정되고,

상기 비교 결과는 업샘플링을 위한 DNN의 학습 과정에서 이용되는 것을 특징으로 하는 영상 압축 방법.
제 13 항에 있어서,

상기 비교 결과는 상기 업샘플링을 위한 DNN의 학습 과정에서 이용되는 것을 특징으로 하는 영상 압축 방법.
영상을 복원하는 장치에 있어서,

비트스트림으로부터 상기 영상을 다운샘플링한 압축영상에 대한 잔차신호를 획득하는 잔차신호 획득부; 및

상기 잔차신호 및 예측을 수행하여 획득한 예측신호를 이용하여 상기 압축영상을 복호화하고, 상기 복호화된 압축영상에 DNN을 이용한 상기 업샘플링을 수행하여 상기 영상을 복원하는 복원부를 포함하고,

상기 DNN은 다운샘플링 과정에서 생성되는 정보를 이용한 업샘플링 과정의 학습을 통해 미리 결정된 네트워크 구조를 가지는 것을 특징으로 하는 영상 복원 장치.