WO2017047897A1

WO2017047897A1 - Hdr 양자화 혹은 마스킹 방법 및 장치

Info

Publication number: WO2017047897A1
Application number: PCT/KR2016/004195
Authority: WO
Inventors: 류호찬
Original assignee: 디지털인사이트주식회사
Priority date: 2015-09-15
Filing date: 2016-04-22
Publication date: 2017-03-23
Also published as: KR20180064411A

Abstract

잔차신호 스케일링부, 역양자화를 선택적으로 수행할 수 있는 역양자화부 및 역변환을 선택적으로 수행할 수 있는 역변환부를 포함하는 비디오 복호화 장치에서, 상기 비디오 복호화 장치는 부가정보 및 예측블록의 밝기 정보를 사용하여 가중함수를 판단하는 가중함수 판단부 및 가중함수 판단부에서 결정된 정보를 이용해 잔차블록의 값을 조절하는 스케일링부를 더 포함한다. 상기 비디오 복호화 장치는 HDR 영상 복호화를 효율적으로 수행하는 것을 목적으로 한다.

Description

HDR 양자화 혹은 마스킹 방법 및 장치

본 발명은 영상 부호화 및 복호화 기술에 관한 것으로, 더욱 상세하게는 HDR 영상을 양자화 혹은 마스킹하는 방법 및 기술에 관한 것이다.

4K-UHD, 8K-UHD급의 고해상도 비디오에 대한 시장의 수요가 늘어남에 따라, 고해상도 비디오를 효율적으로 압축할 수 있는 압축 표준이 필요하게 되었다. 이러한 시장의 요구에 따라 ISO/IEC의 MPEG (Moving Picture Expert Group)과 ITU-T의 VCEG (Video Coding Expert Group)이 공동으로 JCT-VC (Joint Collaborative Team on Video Coding)를 결성하여, HEVC (High Efficiency Video Coding)이라는 차세대 비디오 압축 표준이 2013년 1월 개발이 완료되었다. HEVC 개발이 완료됨에따라, 고해상도의 영상 서비스 수요와 고품질의 영상 서비스 수요가 증가하였다.

본 발명의 일부 실시예는 효과적으로 HDR (High Dynamic Range) 영상을 부호화 및 복호화하기 위하여 잔차신호를 스케일링 하는 방법 및 장치를 제공하는 것을 그 목적으로 한다.

다만 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시예에 따른 영상 복호화 장치는, 입력 값으로 들어오는 HDR 영상의 부호화된 비트스트림을 복호화함에 있어, 부가정보로 전송된 파라미터와 예측블록의 밝기정보를 이용해 잔차신호를 스케일링(Scaling)하여 효율적으로 HDR 비트스트림에 대한 복호화를 수행한다.

전술한 본 발명의 과제 해결 수단에 의하면, 복호화기에서 잔차신호를 스케일링을 통해 원본영상에 더 가까운 HDR 복원영상을 얻을 수 있다.

도 1은 본 발명의 일 실시예에 따른 잔차신호 스케일링부를 포함하는 복호화 장치를 도시한다.

도 2는 본 발명의 일 실시예에 따른 잔차신호 스케일링부를 도시한 도면이다.

도 3은 본 발명의 일 실시예에 따른 잔차신호 스케일링부에서 결정되는 가중함수에 대해 도시한 도면이다.

도 4는 본 발명의 일 실시예에 따른 잔차신호 스케일링부를 포함하는 복호화기 장치에서, 잔차신호 스케일링부의 동작 순서를 나타낸 순서도이다.

도 5는 본 발명의 일 실시예에 따른 잔차신호 스케일링된 블록과 잔차신호 스케일링 되지 않은 블록에서 de-blocking 필터가 다르게 취해져야 함을 도시한 도면이다.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

명세서 전체에서, 어떤 부분이 다른 부분과 연결되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 전기적으로 연결되어 있는 경우도 포함한다. 또한, 어떤 부분이 어떤 구성요소를 포함한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.

본원 명세서 전체에서, 어떤 부분이 어떤 구성요소를 포함한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다. 본원 명세서 전체에서 사용되는 정도의 용어 ~(하는) 단계 또는 ~의 단계는 ~를 위한 단계를 의미하지 않는다.

또한, 제 1, 제 2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

덧붙여, 본 발명의 실시예에 나타나는 구성부들은 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 기술되고, 각 구성부 중 적어도 두 개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수 개의 구성부로 나뉘어져 기능을 수행할 수 있다. 이러한 각 구성부의 통합된 실시 예 및 분리된 실시 예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리 범위에 포함된다.

먼저, 본 출원에서 사용되는 용어를 간략히 설명하면 다음과 같다.

이하에서 후술할 복호화 장치(Video Decoding Apparatus)는 개인용 컴퓨터(PC, Personal Computer), 노트북 컴퓨터, 휴대형 멀티미디어 플레이어(PMP, Portable Multimedia Player), 무선 통신 단말기(Wireless Communication Terminal), 스마트 폰(Smart Phone), TV 응용 서버와 서비스 서버 등 서버 단말기에 포함된 장치일 수 있으며, 각종 기기 등과 같은 사용자 단말기, 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신 장치, 영상을 복호화하거나 복호화를 위해 화면 간 또는 화면 내 예측하기 위한 각종 프로그램과 데이터를 저장하기 위한 메모리, 프로그램을 실행하여 연산 및 제어하기 위한 마이크로프로세서 등을 구비하는 다양한 장치를 의미할 수 있다.

또한, 부호화기에 의해 비트스트림(bitstream)으로 부호화된 영상은 실시간 또는 비실시간으로 인터넷, 근거리 무선 통신망, 무선랜망, 와이브로망, 이동통신망 등의 유무선 통신망 등을 통하거나 케이블, 범용 직렬 버스(USB, Universal Serial Bus) 등과 같은 다양한 통신 인터페이스를 통해 영상 복호화 장치로 전송되어 복호화되어 영상으로 복원되고 재생될 수 있다.

다이나믹 레인지(DR, Dynamic Range)의 일반적인 의미는 계측시스템에서 동시에 계측할 수 있는 최대, 최소의 신호의 차를 말한다. 영상 처리 및 비디오 압축 분야에서 다이나믹 레인지는 영상을 표현할 수 있는 밝기의 범위를 말할 수 있다.

스탠다드 다이나믹 레인지(SDR, Standard Dynamic Range)는 1,000:1의 명암비와 100nit의 최대 밝기를 가지며, 일반적으로 표준명암비라 불린다.

하이 다이나믹 레인지(HDR, High Dynamic Range)는 일반적으로 100,000:1 이상의 고명암비를 의미하며 4,000nits의 최대 밝기를 갖는다. 또한, 인간의 눈이 휘도 순응(Luminance adaptation) 없이 볼 수 있는 밝기 범위에 해당한다.

EDR(Enhanced Dynamic Range)은 SDR과 HDR 중간 수준의 명암비(1,000:1 이상 ~ 100,000:1 미만)를 의미하며, 최대 밝기 1,000nits를 갖는다.

또한, 본 출원에서 사용하는 HDR 영상이란 하이 다이나믹 레인지를 갖는 영상을 의미하며, SDR 영상과 대조되는 개념으로 HDR 및 EDR의 다이나믹 레인지를 갖는 영상을 포함할 수 있다.

통상적으로 동영상은 일련의 픽쳐(Picture)들로 구성될 수 있으며, 각 픽쳐들은 블록(Block)과 같은 코딩 유닛(coding unit)으로 분할될 수 있다. 또한, 이하에 기재된 픽쳐라는 용어는 영상(Image), 프레임(Frame) 등과 같은 동등한 의미를 갖는 다른 용어로 대치되어 사용될 수 있음을 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 이해할 수 있을 것이다.

이하, 첨부한 도면들을 참조하여, 본 발명의 실시 예를 보다 상세하게 설명하고자 한다. 본 발명을 설명함에 있어 동일한 구성요소에 대해서 중복된 설명은 생략한다.

잔차신호 스케일링부를 포함하는 복호화 장치는 엔트로피 복호화부(110), 역양자화 또는 역변환부(115, 120, 125), 잔차신호 스케일링부(140), 화면 내 또는 화면 간 예측부(135), 루프 필터부(150), 복원 영상 저장부(155)를 포함한다.

복호화기의 입력으로 비트스트림(105)이 주어지면 엔트로피 복호화부(110), 역양자화 또는 역변환부를 통해 잔차신호와 부가정보를 얻을 수 있다. 잔차신호를 얻기위해 영양자화부와 역변환부는 모두 수행(115)될 수 있거나, 역양자화부만 수행(120)되거나, 역변환부만 수행(125)될 수 있다. 역양자화 또는 역변환을 통해 얻은 잔차신호와 엔트로피 복호화를 통해 얻은 파라미터(130), 그리고 화면 내 예측 부 또는 화면간 예측부 (135)를 통해 얻은 예측블록의 밝기 정보를 이용해 잔차신호 스케일링부(140)에서 잔차신호를 스케일링한다. 스케일링된 잔차신호는 예측블록과 더해지고(145), 루프 필터부(150)를 거쳐 복원 영상 저장부(155)에 저장되어 참조영상으로 쓰이거나 복원영상(160)으로 출력된다.

잔차신호 스케일링부는 가중함수 판단부(230)와 스케일링부(250)으로 구분될 수 있다. 가중함수 판단부(230)에서는 역양자화 또는 역변환을 통해 얻은 예측블록(210)의 밝기 정보와 엔트로피 복호화를 통해 얻은 spatial scaling parameter(220)를 이용하여 가중함수를 판단하고, 이를 이용해 scaling factor(240)를 구한다. 스케일링부(250)에서는 가중함수 판단부(230)에서 결정된 scaling factor(240)를 이용해 잔차블록(260)을 스케일링하여 스케일링된 잔차신호(270)을 얻는다.

복호화기의 부가정보로 전달되는 spatial scaling parameter는 블록(block), 슬라이스(slice), 프레임(frame), 시퀀스(sequence) 등의 단위로 전송될 수 있으며, spatial scaling parameter 간에 예측을 수행하여 잔차 정보만을 전송할 수 있다.

가중함수 판단을 위해 잔차신호 스케일링부로 전달되는 부가정보에는 가중함수의 모양을 결정할 수 있는 정보가 포함될 수 있다. 일 실시예로 도3과 같이 복호화기로 전달된 부가정보에 의해 픽셀의 밝기 정보(310)에 의한 함수의 출력 값(320)이 픽셀의 밝기 정보 구간에 따라 다르게 결정 될 수 있다.

먼저 화면 내 예측 또는 화면 간 예측을 통해 얻은 예측블록의 평균 밝기 값을 판단(410)한다. 그리고 부가정보로 전달된 파라미터와 예측 블록의 평균 밝기 값을 이용해 가중함수를 결정(420)한다. 결정된 가중함수를 이용해 잔차신호의 스케일링 정도를 계산(430)하여 잔차신호 스케일링을 수행(440)한다.

도 5는 본 발명의 일 실시예에 따른 잔차신호 스케일링된 블록과 잔차신호 스케일링 되지 않은 블록에서 디블록킹(de-blocking) 필터가 다르게 취해져야 함을 도시한 도면이다.

잔차신호 스케일링이 적용된 블록(510)은 공간 도메인(spatial domain)에서 양자화된 블록이고, 잔차신호 스케일링이 적용되지 않은 블록(520)은 주파수 도메인(frequency domain)에서 양자화된 블록이므로, 두 블록의 경계에서 취해지는 디블록킹(de-blocking) 필터(530)는 이를 고려하여 취해져야 한다.

비디오 부/복호화 관련산업으로 방송장비 제조, 단말제조 등 제조업체나 원천기술 관련 산업에서 이용가능

해당없음.

Claims

비디오 복호화 장치에 있어서.

HDR 영상의 복호화를 위해 잔차신호 스케일링부를 사용하는 비디오 복호화 장치;

상기 복호화 장치에서 역양자화를 선택적으로 수행할 수 있는 역양자화부를 포함하는 복호화 장치; 및

상기 복호화 장치에서 역변환을 선택적으로 수행할 수 있는 역변환부를 포함하는 복호화 장치.
제 1항의 복호화 장치에 있어서.

부가정보 및 예측블록의 밝기기 정보를 사용하여 가중함수를 판단하는 가중함수 판단부; 및

상기 가중함수 판단부에서 결정된 정보를 이용해 잔차블록의 값을 조절하는 스케일링부; 및

상기 가중함수 판단부에서 사용되는 부가정보를 블록(block), 슬라이스(slice), 프레임(frame), 시퀀스(sequence) 단위로 전송하는 방법; 및

상기 가중함수 판단부에서 사용되는 부가정보를 예측하여 사용하는 방법.
제 1항의 복호화 장치에 있어서.

잔차신호 스케일링 여부에 따라 다르게 수행되는 디블록킹(de-blocking) 필터를 포함하는 루프 필터부.