KR20210126940A - 3차원 영상 생성을 위한 2차원 영상의 부호화 및 복호화 장치 - Google Patents

3차원 영상 생성을 위한 2차원 영상의 부호화 및 복호화 장치 Download PDF

Info

Publication number
KR20210126940A
KR20210126940A KR1020200044652A KR20200044652A KR20210126940A KR 20210126940 A KR20210126940 A KR 20210126940A KR 1020200044652 A KR1020200044652 A KR 1020200044652A KR 20200044652 A KR20200044652 A KR 20200044652A KR 20210126940 A KR20210126940 A KR 20210126940A
Authority
KR
South Korea
Prior art keywords
image
prediction
unit
prediction mode
encoding
Prior art date
Application number
KR1020200044652A
Other languages
English (en)
Inventor
정순흥
임한신
서정일
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020200044652A priority Critical patent/KR20210126940A/ko
Publication of KR20210126940A publication Critical patent/KR20210126940A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

3차원 영상 생성을 위한 2차원 영상의 부호화 및 복호화 장치가 개시된다.
본 개시의 일 실시예에 따른 3차원 영상 생성을 위한 2차원 영상의 복호화 장치는 영상에 대한 화면 내 예측 및 화면 간 예측 중 적어도 어느 하나의 제1 예측 모드 및 상기 3차원 영상이 소정 관점에서 2차원으로 투사된 프로젝션 화면과 상기 영상 간의 예측에 의한 제 2 예측 모드 중 적어도 어느 하나에 의해 비트스트림을 복호화하는 복호화부, 및 상기 제 1 및 제 2 예측 모드 중 선택된 예측 모드에 따라 상기 영상을 복원하도록 상기 복호화된 비트스트림을 처리하는 복원부를 포함한다.

Description

3차원 영상 생성을 위한 2차원 영상의 부호화 및 복호화 장치{DEVICE FOR ENCODING AND DECODING FOR 2D IMAGE FOR 3D IMAGE GENERATION}
본 개시는 3차원 영상 생성을 위한 2차원 영상의 부호화 및 복호화 장치에 대한 것이며, 보다 구체적으로는 3차원 영상 제작에 활용되는 2차원 영상의 압축 효율을 향상시키는 3차원 영상 생성을 위한 2차원 영상의 부호화 및 복호화 장치에 대한 것이다.
3차원 영상을 생성하기 위한 기술 개발이 활발하게 진행되고 있으며, 최근 ISO/IEC 국제 표준화 단체에서는 3차원 동영상을 압축하기 위한 표준 초안이 발행되었다. 이러한 3차원 영상은 카메라를 이용하여 얻어진 복수개의 영상이나, 라이다(LiDAR) 센서 또는 RGB-D 센서로 획득된 정보를 활용하여 생성될 수 있다.
구체적으로, 복수개의 영상을 사용하여 제작된 3차원 영상에서 생성된 희소 공간 데이터는 입력 영상들이 획득된 카메라의 위치로서 입력 영상에서 특징점을 추출, 표현하고 영상간 매칭을 통하여 3차원 공간 정보를 계산할 수 있다. 또한, 생성된 3차원 영상으로부터 입력 영상에 대응되는 2차원 영상을 생성(프로젝션)할 수도 있다.
한편, 3차원 동영상 압축에 대한 표준은 최종적으로 생성된 3차원 영상에 대한 압축에 초점이 맞추어져 있다. 그러나, 입력 영상으로 사용된 2차원 영상 정보가 필요한 경우도 있으며, 예를 들면 3차원 영상의 소정 관점에 해당하는 위치에서 바라보는 2차원 영상이 필요한 경우 등이다. 따라서, 입력 영상의 용량이 증가하게 되면 3차원 영상 생성을 위한 대량의 2차원 영상을 효율적으로 압축하기 위한 방안이 필요하다.
본 개시의 기술적 과제는 3차원 영상 제작에 활용되는 2차원 영상의 압축 효율을 향상시키는 3차원 영상 생성을 위한 2차원 영상의 부호화 및 복호화 장치를 제공하는 것이다.
본 개시에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 개시의 일 양상에 따르면, 3차원 영상 생성을 위한 2차원 영상의 부호화 장치가 제공될 수 있다. 상기 3차원 영상 생성을 위한 2차원 영상의 부호화 장치 는 입력 영상에 대하여 화면 내(intra) 예측 및 화면 간(inter) 예측 중 적어도 어느 하나의 제1 예측 모드로 예측을 수행하는 제 1 예측 모드부 및 상기 3차원 영상이 소정 관점(view point)에서 2차원으로 투사된 프로젝션 화면과 상기 입력 영상 간의 예측에 의한 제 2 예측 모드로 상기 입력 영상에 대하여 예측을 수행하는 제 2 예측 모드부를 가지며, 상기 제 1 및 제 2 예측 모드부에 따라 처리된 상기 입력 영상 중에 높은 압축 효율을 갖는 예측 모드에 기초하여 상기 입력 영상을 처리하는 예측부, 및 상기 선택된 예측 모드에 따라 처리된 입력 영상을 부호화하는 부호화부를 포함한다.
본 개시의 다른 실시예에 따르면, 상기 입력 영상이 상기 제 2 예측 모드부에 의해 처리되는 경우에, 상기 부호화부는 상기 입력 영상의 부호화시에 상기 프로젝션 화면의 소정 관점과 관련된 위치 및 방향을 규정하는 카메라의 외부 파라미터 및 상기 카메라의 고유 속성과 관련된 내부 파라미터를 상기 부호화된 입력 영상에 포함시킬 수 있다.
본 개시의 또 다른 실시예에 따르면, 상기 예측부는 상기 제 1 및 제 2 예측 모드부에 의해 처리된 상기 입력 영상에 기초하여 생성된 잔차 블록의 사이즈가 작은 예측 모드가 상기 높은 압축 효율을 갖는 것으로 판단할 수 있다.
본 개시의 또 다른 실시예에 따르면, 상기 제 2 예측 모드부는 상기 입력 영상과 가장 높은 매칭도를 갖는 상기 프로젝션 화면 및 상기 프로젝션 화면 내의 영역에 기초하여 예측 블록을 생성할 수 있다.
본 개시의 또 다른 실시예에 따르면, 상기 입력 영상은 상기 3차원 영상을 생성하기 위한 복수 관점에서 획득된 정지 영상 또는 동영상일 수 있다.
본 개시의 다른 양상에 따르면, 3차원 영상 생성을 위한 2차원 영상의 복호화 장치가 제공될 수 있다. 상기 3차원 영상 생성을 위한 2차원 영상의 복호화 장치는 영상에 대한 화면 내 예측 및 화면 간 예측 중 적어도 어느 하나의 제1 예측 모드 및 상기 3차원 영상이 소정 관점에서 2차원으로 투사된 프로젝션 화면과 상기 영상 간의 예측에 의한 제 2 예측 모드 중 적어도 어느 하나에 의해 비트스트림을 복호화하는 복호화부, 및 상기 제 1 및 제 2 예측 모드 중 선택된 예측 모드에 따라 상기 영상을 복원하도록 상기 복호화된 비트스트림을 처리하는 복원부를 포함한다.
본 개시의 다른 실시예에 따르면, 상기 제 2 예측 모드부에 의해 상기 비트스트림을 처리하는 경우에, 상기 복원부는 상기 영상의 부호화시에 포함된 상기 프로젝션 화면의 소정 관점과 관련된 위치 및 방향을 규정하는 카메라의 외부 파라미터 및 상기 카메라의 고유 속성과 관련된 내부 파라미터에 기반하여 상기 복호화된 비트스트림을 처리할 수 있다.
본 개시의 또 다른 실시예에 따르면, 상기 영상은 상기 3차원 영상을 생성하기 위한 복수 관점에서 획득된 정지 영상 또는 동영상으로 복원될 수 있다.
본 개시에 대하여 위에서 간략하게 요약된 특징들은 후술하는 본 개시의 상세한 설명의 예시적인 양상일 뿐이며, 본 개시의 범위를 제한하는 것은 아니다.
본 개시에 따르면, 3차원 영상 제작에 활용되는 2차원 영상의 압축 효율을 향상시키는 3차원 영상 생성을 위한 2차원 영상의 부호화 및 복호화 장치가 제공될 수 있다.
본 개시에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 3차원 영상 생성을 위한 2차원 영상의 부호화 장치를 나타내는 블록도이다.
도 2는 다양한 관점에서 실제 촬영된 2차원 영상에 기반하여 생성된 3차원 영상을 예시한 도면이다.
도 3은 본 발명의 다른 실시예에 따른 3차원 영상 생성을 위한 2차원 영상의 부호화 방법을 설명하기 위한 순서도이다.
도 4는 본 발명의 또 다른 실시예에 따른 3차원 영상 생성을 위한 2차원 영상의 복호화 장치를 나타내는 블록도이다.
이하에서는 첨부한 도면을 참고로 하여 본 개시의 실시 예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나, 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다.
본 개시의 실시 예를 설명함에 있어서 공지 구성 또는 기능에 대한 구체적인 설명이 본 개시의 요지를 흐릴 수 있다고 판단되는 경우에는 그에 대한 상세한 설명은 생략한다. 그리고, 도면에서 본 개시에 대한 설명과 관계없는 부분은 생략하였으며, 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
본 개시에 있어서, 어떤 구성요소가 다른 구성요소와 "연결", "결합" 또는 "접속"되어 있다고 할 때, 이는 직접적인 연결관계뿐만 아니라, 그 중간에 또 다른 구성요소가 존재하는 간접적인 연결관계도 포함할 수 있다. 또한 어떤 구성요소가 다른 구성요소를 "포함한다" 또는 "가진다"고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 배제하는 것이 아니라 또 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
본 개시에 있어서, 제1, 제2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용되며, 특별히 언급되지 않는 한 구성요소들간의 순서 또는 중요도 등을 한정하지 않는다. 따라서, 본 개시의 범위 내에서 일 실시 예에서의 제1 구성요소는 다른 실시 예에서 제2 구성요소라고 칭할 수도 있고, 마찬가지로 일 실시 예에서의 제2 구성요소를 다른 실시 예에서 제1 구성요소라고 칭할 수도 있다.
본 개시에 있어서, 서로 구별되는 구성요소들은 각각의 특징을 명확하게 설명하기 위함이며, 구성요소들이 반드시 분리되는 것을 의미하지는 않는다. 즉, 복수의 구성요소가 통합되어 하나의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있고, 하나의 구성요소가 분산되어 복수의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있다. 따라서, 별도로 언급하지 않더라도 이와 같이 통합된 또는 분산된 실시 예도 본 개시의 범위에 포함된다.
본 개시에 있어서, 다양한 실시 예에서 설명하는 구성요소들이 반드시 필수적인 구성요소들은 의미하는 것은 아니며, 일부는 선택적인 구성요소일 수 있다. 따라서, 일 실시 예에서 설명하는 구성요소들의 부분집합으로 구성되는 실시 예도 본 개시의 범위에 포함된다. 또한, 다양한 실시 예에서 설명하는 구성요소들에 추가적으로 다른 구성요소를 포함하는 실시 예도 본 개시의 범위에 포함된다.
우선, 설명의 편의를 도모하고 발명을 이해를 돕기 위해, 본 명세서에서 사용되는 용어들에 대하여 간략하게 설명한다.
유닛(unit)은 영상 부호화 및 복호화의 단위를 의미한다. 다시 말하면, 영상 부호화/복호화에 있어서 부호화 단위 혹은 복호화 단위라 함은, 하나의 영상을 세분화된 유닛으로 분할하여 부호화 혹은 복호화 할 때 그 분할된 단위를 말한다. 블록(block), 매크로 블록, 부호화 유닛(coding unit) 또는 예측 유닛(prediction unit) 또는 변환 유닛(transform unit) 또는 부호화 블록(coding block) 또는 예측 블록(prediction block) 또는 변환 블록(transform block) 등으로 부를 수 있다. 하나의 유닛은 크기가 더 작은 하위 유닛으로 분할될 수 있다.
변환 유닛(transform unit)은 변환, 역변환, 양자화, 역양자화, 변환 계수 부호화/복호화와 같이 잔차 블록(residual block)의 부호화/복호화를 수행함에 있어 기본 유닛 혹은 단위 유닛이며, 하나의 변환 유닛은 분할되어 크기가 다수의 작은 변환 유닛으로 분할될 수 있다. 또한, 변환 블록과 동일한 의미로 사용될 수 있으며, 휘도와 색차 신호에 대한 변환 블록에 관련된 구문 요소(syntax element)가 포함된 형태를 변환 유닛이라 지칭할 수도 있다.
양자화 행렬(quantization matrix)은 영상의 주관적 화질 혹은 객관적 화질을 향상시키기 위해서 양자화 혹은 역양자화 과정에서 이용되는 행렬을 의미한다. 양자화 행렬은 스케일링 리스트(scaling list)라고도 불린다.
양자화/역양자화에 사용되는 양자화 행렬은 비트스트림(bitstream)으로 전송될 수도 있고, 영상 부호화 장치 및/혹은 영상 복호화 장치가 이미 보유한 기본 행렬(default matrix)이 사용될 수도 있다. 전송되는 양자화 행렬의 정보는 시퀀스 파라미터 세트(SPS: sequence parameter set) 또는 픽처 파라미터 세트(PPS: picture parameter set)을 통해 양자화 행렬의 크기 혹은 양자화 행렬이 적용되는 변환 블록 크기 별로 일괄 전송될 수 있다. 예컨대, 4x4 변환 블록을 위한 4x4 양자화 행렬들이 전송되고, 8x8 변환 블록을 위한 8x8 행렬들이 전송되고, 16x16 변환 블록을 위한 16x16 행렬들이 전송되고, 32x32 변환 블록을 위한 32x32 행렬들이 전송될 수 있다.
현재 블록에 적용되는 양자화 행렬은 (1) 동일한 크기의 양자화 행렬을 복사하여 획득될 수도 있고, (2) 양자화 행렬 내 이전 행렬 계수(matrix coefficient)로부터 예측에 의해 생성될 수도 있다. 동일한 크기의 행렬은 이전에 부호화 혹은 복호화 혹은 사용된 양자화 행렬일 수도 있고, 참조 양자화 행렬일 수도 있으며 기본 양자화 행렬일 수도 있다. 혹은 이전에 부호화 혹은 복호화 혹은 사용된 양자화 행렬, 참조 양자화 행렬, 기본 양자화 행렬 중 적어도 둘을 포함하는 조합으로부터 선택적으로 결정될 수도 있다.
파라미터 세트(parameter set)는 비트스트림 내의 구조 중 헤더 정보에 해당하며, 시퀀스 파라미터 세트, 픽처 파라미터 세트, 적응 파라미터 세트(adaptation parameter set) 등을 통칭하는 의미를 가진다.
양자화 매개변수(quantization parameter)는 양자화 및 역양자화에서 사용되는 값으로서, 양자화 매개변수는 양자화 스텝 크기(step size)에 매핑된 값일 수 있다.
기본 행렬은 영상 부호화 장치 및/혹은 영상 복호화 장치에서 미리 정의되어 있는 소정의 양자화 행렬을 의미할 수 있으며, 본 명세서에서 후술될 기본 양자화 행렬은 기본 행렬과 동일한 의미로 사용될 수 있다. 비-기본 행렬(non-default matrix)은 영상 부호화 장치 및/혹은 영상 복호화 장치에서 미리 정의되지 않고, 영상 부호화 장치에서 영상 복호화 장치로 전송되는 즉, 사용자에 의해서 전송/수신되는 양자화 행렬을 의미할 수 있으며, 본 명세서에서 후술될 비-기본 양자화 행렬은 비-기본 행렬과 동일한 의미로 사용될 수 있다.
이하, 첨부한 도면을 참조하여 본 개시의 실시 예들에 대해서 설명한다.
도 1은 본 발명의 일 실시예에 따른 3차원 영상 생성을 위한 2차원 영상의 부호화 장치를 나타내는 블록도이다.
도 1을 참조하면, 2차원 영상 부호화 장치(100)는 3차원 영상 생성에 활용될 예정이거나 3차원 영상 생성에 활용된 2차원 영상들을 부호화하는 장치이다. 2차원 영상 부호화 장치(100)의 입력 영상은 3차원 영상을 생성하기 위한 복수 관점(view points)에서 획득된 정지 영상 또는 동영상인일 수 있다.
2차원 영상 부호화 장치(100)는 예측부(110), 스위치(117), 예측부(110), 변환부(130), 양자화부(140), 엔트로피 부호화부(150), 역양자화부(160), 역변환부(170), 가산기(175), 필터부(180) 및 디코딩 픽처 버퍼(190)를 포함한다.
예측부(110)는 제 1 예측 모드부(111) 및 제 2 예측 모드부(116)를 포함한다. 제 1 예측 모드부(111)는 입력 영상에 대하여 화면 내(intra) 예측 및 화면 간(inter) 예측 중 적어도 어느 하나의 제1 예측 모드로 예측을 수행한다. 제 2 예측 모드부(116)는 3차원 영상이 소정 관점에서 2차원으로 투사된 프로젝션 화면과 입력 영상 간의 예측에 의한 제 2 예측 모드로 입력 영상에 대하여 예측을 수행한다.
제 1 예측 모드부(111)는 움직임 예측부(113)와 움직임 보상부(114)를 갖는 화면 간 예측부(112) 및 화면 내 예측부(115)를 포함한다.
2차원 영상 부호화 장치(100)는 입력 영상에 대해 인트라(intra) 모드, 인터(inter) 모드 또는 제 2 예측 모드로 부호화를 수행하고 비트스트림을 출력할 수 있다. 인트라 예측은 화면 내 예측, 인터 예측은 화면 간 예측을 의미한다. 인트라 모드인 경우 스위치(117)가 인트라로 전환되고, 인터 모드인 경우 스위치(117)가 인터로 전환될 수 있으며, 제 2 예측 모드인 경우, 스위치(117)가 제 2 예측 모드부(116)로 전환될 수 있다. 2차원 영상 부호화 장치(100)는 입력 영상의 입력 블록에 대한 예측 블록을 생성한 후, 입력 블록과 예측 블록의 차분을 부호화할 수 있다. 이때, 입력 영상은 원 영상(original picture)를 의미할 수 있다.
인트라 모드인 경우, 화면 내 예측부(115)는 현재 블록 주변의 이미 부호화된 블록의 픽셀값을 이용하여 공간적 예측을 수행하여 예측 블록을 생성할 수 있다.
인터 모드인 경우, 움직임 예측부(113)는, 움직임 예측 과정에서 디코딩 픽처 버퍼(190)에 저장되어 있는 참조 영상에서 입력 블록과 가장 매치가 잘 되는 영역을 찾아 움직임 벡터를 구할 수 있다. 움직임 보상부(114)는 움직임 벡터를 이용하여 움직임 보상을 수행함으로써 예측 블록을 생성할 수 있다. 여기서, 움직임 벡터는 인터 예측에 사용되는 2차원 벡터이며, 현재 블록과 참조 영상 내 블록 사이의 오프셋을 나타낼 수 있다.
제 2 예측 모드부(116)는 입력 영상과 가장 높은 매칭도를 갖는 프로젝션 화면 및 프로젝션 화면 내의 영역에 기초하여 예측 블록을 생성할 수 있다.
구체적으로, 제 2 예측 모드부(116)는 외부에서 생성된 3차원 영상에서 복수의 관점으로 투사된 프로젝션 화면을 수신하며, 수신된 프로젝션 화면과 입력 영상 간의 예측을 수행한다.
도 2는 다양한 관점에서 실제 촬영된 2차원 영상에 기반하여 생성된 3차원 영상을 예시한 도면이다. 도 2를 참조하면, 실제 카메라로 촬영된 복수개의 2차원 영상은 다양한 위치와 촬영 방향/각도에 따라 획득되며, 위치 및 방향을 규정하는 카메라의 외부 파라미터 및 내부 파라미터 및 영상 간의 특징점 매칭에 기초하여 3차원 공간 정보를 계산하여, 도 2의 우측과 같이 3차원 영상이 외부에서 생성된다. 여기서 내부 파라미터는 실제 촬영된 카메라의 고유 속성과 관련된 값으로서, 초점 위치, 렌즈왜곡 파라미터 및 센서 포맷 크기 중 적어도 하나일 수 있다.
제 2 예측 모드부(116)로 전송되는 프로젝션 화면은 도 2의 외부에서 생성된 3차원 영상에 대해 소정 관점에서 2차원으로 투사된 프로젝션 영상이다. 다양한 위치와 방향으로 실제 촬영된 입력 영상과 높은 유사성을 가지므로, 입력 영상과 프로젝션 화면 간의 예측을 통한 부호화는 제 1 예측 모드로 입력 영상을 처리하여 부호화하는 경우보다 우수한 압축 효율을 가질 개연성이 있다. 여기서, 프로젝션 화면도 3차원 영상에서 가상의 관점으로 투사될 때에 이용된 가상의 위치와 방향을 규정하는 카메라의 외부 파라미터 및 가상의 관점으로 투사될 때 이용되는 카메라의 고유 속성과 관련된 값을 포함한다.
제 2 예측 모드부(116)는 입력 영상의 내, 외부 파라미터 및 프로젝션 화면의 내, 외부 파라미터를 활용하여 예측을 수행한다.
감산기(125)는 입력 블록과 생성된 예측 블록의 차분에 의해 잔차 블록을 생성할 수 있다.
예측부(110)는 감산기(120)와 연계하여, 화면 내 예측, 화면 간 예측 및 제 2 예측 모드에 따라 처리된 입력 영상 중에 높은 압축 효율을 갖는 예측 모드를 판정한다. 구체적으로, 입력 영상이 정지 영상일 경우, 예측부(110)는 화면 내 예측 및 제 2 예측 모드 중 높은 압축 효율을 나타내는 예측 모드를 판정한다. 입력 영상이 동영상일 경우에, 예측부(110)는 화면 내 예측, 화면 간 예측 및 제 2 예측 모드 중 높은 압축 효율을 나타내는 예측 모드를 판정한다. 예측부(110)는 제 1 및 제 2 예측 모드부(116)에 의해 처리된 입력 영상에 기초하여 생성된 잔차 블록의 사이즈가 작은 예측 모드가 높은 압축 효율을 갖는 것으로 판단한다. 잔차 블록의 사이즈는 생성되는 잔차 블록의 개수와 각 블록마다의 용량이 합산된 값일 수 있다.
예측부(110)는 높은 압축 효율을 갖는 예측 모드에 기초하여 입력 영상을 처리하며, 최종 판정된 예측 모드와 관련된 정보를 후속 과정의 변환부(130), 양자화부(140) 및 엔트로피 부호화부(150)에 전달한다.
변환부(130)는 잔차 블록에 대해 변환(transform)을 수행하여 변환 계수(transform coefficient)를 출력할 수 있다. 그리고 양자화부(140)는 입력된 변환 계수를 양자화 매개변수와 양자화 행렬 중 적어도 하나를 이용하여 양자화하여 양자화된 계수(quantized coefficient)를 출력할 수 있다. 이때, 양자화 행렬은 영상 부호화 장치에 입력되어질 수 있으며, 입력되어진 양자화 행렬이 영상 부호화 장치에서 사용되기로 결정될 수 있다.
엔트로피 부호화부(150)는, 양자화부(140)에서 산출된 값들 또는 부호화 과정에서 산출된 부호화 파라미터 값 등을 기초로 엔트로피 부호화를 수행하여 비트스트림(bit stream)을 출력할 수 있다.
입력 영상이 제 2 예측 모드부(116)에 의해 처리되는 경우에, 엔트로피 부호화부(150)는 입력 영상의 부호화시에 프로젝션 화면의 소정 관점과 관련된 카메라의 외부 파라미터 및 내부 파라미터를 부호화된 입력 영상에 포함시킴과 아울러서, 제 2 예측 모드에 따른 부호화 모드의 정보도 포함시킨다.
엔트로피 부호화가 적용되는 경우, 높은 발생 확률을 갖는 심볼(symbol)에 적은 수의 비트가 할당되고 낮은 발생 확률을 갖는 심볼에 많은 수의 비트가 할당되어 심볼이 표현됨으로써, 부호화 대상 심볼들에 대한 비트열의 크기가 감소될 수 있다. 따라서 엔트로피 부호화를 통해서 영상 부호화의 압축 성능이 높아질 수 있다. 엔트로피 부호화부(150)는 엔트로피 부호화를 위해 지수-골롬 코드(Exponential-Golomb Code), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 부호화 방법을 사용할 수 있다.
도 1의 실시예에 따른 2차원 영상 부호화 장치(100)는 인터 예측 부호화, 즉 화면 간 예측 부호화를 수행하므로, 현재 부호화된 영상은 참조 영상으로 사용되기 위해 복호화되어 저장될 필요가 있다. 따라서 양자화된 계수는 역양자화부(160)에서 역양자화되고 역변환부(170)에서 역변환된다. 역양자화 및 역변환된 계수는 복원된 잔차 블록이 되어 가산기(175)를 통해 예측 블록과 더해지고 복원 블록이 생성된다.
복원 블록은 필터부(180)를 거치고, 필터부(180)는 디블록킹 필터(deblocking filter; 181), SAO(Sample Adaptive Offset; 182), ALF(Adaptive Loop Filter) 중 적어도 하나 이상을 복원 블록 또는 복원 픽처에 적용할 수 있다. 필터부(180)는 인루프(in-loop) 필터로 불릴 수도 있다. 디블록킹 필터는 블록 간의 경계에 생긴 블록 왜곡을 제거할 수 있다. SAO는 코딩 에러를 보상하기 위해 픽셀값에 적정 오프셋(offset) 값을 더해줄 수 있다. ALF는 복원된 영상과 원래의 영상을 비교한 값을 기초로 필터링을 수행할 수 있다. 필터부(180)를 거친 복원 블록은 디코딩 픽처 버퍼(190)에 저장될 수 있다.
본 실시예에 따르면, 3차원 영상 제작에 활용되는 2차원 영상의 압축 효율이 향상되어, 기존의 영상 부호화 장치에 비해 우수한 압축 성능이 발현될 수 있다.
도 3은 본 발명의 다른 실시예에 따른 3차원 영상 생성을 위한 2차원 영상의 부호화 방법을 설명하기 위한 순서도이다.
도 3을 참조하면, 예측부(110)는 제 1 예측 모드부(111) 및 제 2 예측 모드부(116)를 통해 입력 영상에 대해 예측 처리를 수행한다(S305).
제 1 예측 모드부(111)는 화면 내 예측부(110)와 화면 간 예측부(110)를 통해 입력 영상에 대해 화면 내 예측 및 화면 간 예측 중 적어도 어느 하나의 제1 예측 모드로 예측을 수행하여 예측 블록을 생성한다.
또한, 제 2 예측 모드부(116)는 3차원 영상이 소정 관점에서 2차원으로 투사된 프로젝션 화면과 입력 영상 간의 예측에 의한 제 2 예측 모드로 입력 영상에 대하여 예측을 수행하여, 예측 블록을 생성한다.
구체적으로, 제 2 예측 모드부(116)는 외부에서 생성된 3차원 영상에서 복수의 관점으로 투사된 프로젝션 화면을 수신하며, 수신된 프로젝션 화면과 입력 영상 간의 예측을 수행한다. 또한, 제 2 예측 모드부(116)는 입력 영상과 가장 높은 매칭도를 갖는 프로젝션 화면 및 프로젝션 화면 내의 영역에 기초하여 예측 블록을 생성할 수 있다. 제 2 예측 모드부(116)는 입력 영상의 내, 외부 파라미터 및 프로젝션 화면의 내, 외부 파라미터를 활용하여 예측을 수행한다.
다음으로, 예측부(110)는 감산기(120)와 연계하여, 화면 내 예측, 화면 간 예측 및 제 2 예측 모드에 따라 처리된 입력 영상 중에 높은 압축 효율을 갖는 예측 모드를 판정하고, 예측 모드에 따라 입력 영상을 처리한다(S310).
구체적으로, 입력 영상이 정지 영상일 경우, 예측부(110)는 화면 내 예측 및 제 2 예측 모드 중 높은 압축 효율을 나타내는 예측 모드를 판정한다. 입력 영상이 동영상일 경우에, 예측부(110)는 화면 내 예측, 화면 간 예측 및 제 2 예측 모드 중 높은 압축 효율을 나타내는 예측 모드를 판정한다. 예측부(110)는 제 1 및 제 2 예측 모드부(116)에 의해 처리된 입력 영상에 기초하여 생성된 잔차 블록의 사이즈가 작은 예측 모드가 높은 압축 효율을 갖는 것으로 판단한다. 잔차 블록의 사이즈는 생성되는 잔차 블록의 개수와 각 블록마다의 용량이 합산된 값일 수 있다.
예측부(110)는 판정된 예측 모드에 따라 입력 영상에 대한 예측 블록을 생성하고, 예측부(110)는 높은 압축 효율을 갖는 예측 모드에 기초하여 입력 영상을 처리하며, 최종 판정된 예측 모드와 관련된 정보를 후속 과정의 변환부(130), 양자화부(140) 및 엔트로피 부호화부(150)에 전달한다.
이어서, 엔트로피 부호화부(150)는 선택된 예측 모드에 따라 처리된 입력 영상을 부호화한다(S315).
변환부(130)는 잔차 블록에 대해 변환(transform)을 수행하여 변환 계수(transform coefficient)를 출력할 수 있다. 그리고 양자화부(140)는 입력된 변환 계수를 양자화 매개변수와 양자화 행렬 중 적어도 하나를 이용하여 양자화하여 양자화된 계수(quantized coefficient)를 출력할 수 있다. 이때, 양자화 행렬은 영상 부호화 장치에 입력되어질 수 있으며, 입력되어진 양자화 행렬이 영상 부호화 장치에서 사용되기로 결정될 수 있다.
엔트로피 부호화부(150)는, 양자화부(140)에서 산출된 값들 또는 부호화 과정에서 산출된 부호화 파라미터 값 등을 기초로 엔트로피 부호화를 수행하여 비트스트림(bit stream)을 출력할 수 있다.
입력 영상이 제 2 예측 모드부(116)에 의해 처리되는 경우에, 엔트로피 부호화부(150)는 입력 영상의 부호화시에 프로젝션 화면의 소정 관점과 관련된 카메라의 외부 파라미터 및 내부 파라미터를 부호화된 입력 영상에 포함시킴과 아울러서, 제 2 예측 모드에 따른 부호화 모드의 정보도 포함시킨다.
도 4는 본 발명의 또 다른 실시예에 따른 3차원 영상 생성을 위한 2차원 영상의 복호화 장치를 나타내는 블록도이다.
도 4를 참조하면, 3차원 영상 생성을 위한 2차원 영상 복호화 장치(200)는 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 가산기(235), 복원부(240)를 포함한다.
복원부(240)는 화면 내 예측부(244)와 움직임 보상부(246)를 갖는 제 1 예측 모드부(111), 제 2 예측 모드부(116), 필터부(260) 및 디코딩 픽처 버퍼(270)를 포함한다.
영상 복호화 장치(200)는 2차원 영상 부호화 장치에서 출력된 비트스트림을 입력 받아 제 1 예측 모드에서의 화면 내 모드, 화면 간 모드 또는 제 2 예측 모드로 복호화를 수행하고 재구성된 영상, 즉 복원 영상을 출력할 수 있다. 화면 내 모드로서의 인트라 모드인 경우 스위치가 인트라로 전환되고, 화면 간 모드으로서의 인터 모드인 경우 스위치가 인터로 전환될 수 있으며, 제 2 예측 모드인 경우 스위치가 제 2 예측 모드부(250)로 전환될 수 있다. 2차원 영상 복호화 장치(200)는 입력 받은 비트스트림으로부터 복원된 잔차 블록(reconstructed residual block)을 얻고 예측 블록을 생성한 후 복원된 잔차 블록과 예측 블록을 더하여 재구성된 블록, 즉 복원 블록을 생성할 수 있다.
엔트로피 복호화부(210)는, 입력된 비트스트림을 확률 분포에 따라 엔트로피 복호화하여, 양자화된 계수(quantized coefficient) 형태의 심볼을 포함한 심볼들을 생성할 수 있다. 여기서, 엔트로피 복호화부(210)는 비트스트림의 부호화 방식, 즉 화면 내 모드, 화면 간 모드 및 제 2 예측 모드 중 적어도 어느 하나에 따라 비트스트림을 복호화한다. 엔트로피 복호화 방법은 상술한 엔트로피 부호화 방법과 유사하다.
엔트로피 복호화 방법이 적용되는 경우, 높은 발생 확률을 갖는 심볼에 적은 수의 비트가 할당되고 낮은 발생 확률을 갖는 심볼에 많은 수의 비트가 할당되어 심볼이 표현됨으로써, 각 심볼들에 대한 비트열의 크기가 감소될 수 있다.
양자화된 계수는 역양자화부(220)에서 양자화 매개변수를 이용해서 역양자화되고 역변환부(230)에서 역변환되며, 양자화된 계수가 역양자화/역변환된 결과, 복원된 잔차 블록이 생성될 수 있다.
역양자화에 사용되는 양자화 행렬은 스케일링 리스트라고도 불린다. 역양자화부(220)는 양자화된 계수에 양자화 행렬을 적용하여 역양자화된 계수를 생성할 수 있다.
이때 역양자화부(220)는 영상 부호화 장치에서 적용된 양자화에 대응하여 역양자화를 수행할 수 있다. 예컨대, 역양자화부(220)는 영상 부호화 장치에서 적용된 양자화 행렬을 양자화된 계수에 역으로 적용하여 역양자화를 수행할 수 있다.
영상 복호화 장치(200)에서 역양자화에 사용되는 양자화 행렬은 비트스트림으로부터 수신될 수도 있고, 영상 부호화 장치 및/혹은 영상 복호화 장치가 이미 보유한 기본 행렬이 사용될 수도 있다. 전송되는 양자화 행렬의 정보는 시퀀스 파라미터 세트 또는 픽처 파라미터 세트를 통해 양자화 행렬 크기 혹은 양자화 행렬이 적용되는 변환 블록 크기 별로 일괄 수신될 수 있다. 예컨대, 4x4 변환 블록을 위한 4x4 양자화 행렬들이 수신되고, 8x8 변환 블록을 위한 8x8 행렬들이 수신되고, 16x16 변환 블록을 위한 16x16 행렬들이 수신되고, 32x32 변환 블록을 위한 32x32 행렬들이 수신될 수 있다.
인트라 모드인 경우, 화면 내 예측부(244)는 현재 블록 주변의 이미 복호화된 블록의 픽셀값을 이용하여 공간적 예측을 수행하여 예측 블록을 생성할 수 있다. 인터 모드인 경우, 움직임 보상부(246)는 움직임 벡터 및 디코딩 픽처 버퍼(270)에 저장되어 있는 참조 영상을 이용하여 움직임 보상을 수행함으로써 예측 블록을 생성할 수 있다. 제 2 예측 모드인 경우, 제 2 예측 모드부(250)는 외부로부터 수신된 프로젝션 화면을 이용하여 예측 블록을 생성할 수 있다. 프로젝션 화면은 부호화 장치(100)에서 설명된 것과 실질적으로 동일하다. 또한, 복원부(240)의 제 2 예측 모드부(250)에 의해 비트스트림을 처리하는 경우에, 제 2 예측 모드부(116)는 영상의 부호화시에 포함된 프로젝션 화면의 소정 관점과 관련된 카메라의 외부 파라미터 및 내부 파라미터에 기반하여 복호화된 비트스트림을 처리한다.
복원된 잔차 블록과 예측 블록은 가산기(235)를 통해 더해지고, 더해진 블록은 필터부(260)를 거칠 수 있다. 필터부(260)는 디블록킹 필터, SAO, ALF 중 적어도 하나 이상을 복원 블록 또는 복원 픽처에 적용할 수 있다. 필터부(260)는 재구성된 영상, 즉 복원 영상을 출력할 수 있다. 복원 영상은 3차원 영상을 생성하기 위한 복수 관점에서 획득된 정지 영상 또는 동영상으로 복원될 수 있다. 복원 영상은 디코딩 픽처 버퍼(270)에 저장되어 인터 예측에 사용될 수 있다.
본 개시의 예시적인 방법들은 설명의 명확성을 위해서 동작의 시리즈로 표현되어 있지만, 이는 단계가 수행되는 순서를 제한하기 위한 것은 아니며, 필요한 경우에는 각각의 단계가 동시에 또는 상이한 순서로 수행될 수도 있다. 본 개시에 따른 방법을 구현하기 위해서, 예시하는 단계에 추가적으로 다른 단계를 포함하거나, 일부의 단계를 제외하고 나머지 단계를 포함하거나, 또는 일부의 단계를 제외하고 추가적인 다른 단계를 포함할 수도 있다.
본 개시의 다양한 실시 예는 모든 가능한 조합을 나열한 것이 아니고 본 개시의 대표적인 양상을 설명하기 위한 것이며, 다양한 실시 예에서 설명하는 사항들은 독립적으로 적용되거나 또는 둘 이상의 조합으로 적용될 수도 있다.
또한, 본 개시의 다양한 실시 예는 하드웨어, 펌웨어(firmware), 소프트웨어, 또는 그들의 결합 등에 의해 구현될 수 있다. 하드웨어에 의한 구현의 경우, 하나 또는 그 이상의 ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 범용 프로세서(general processor), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.
본 개시의 범위는 다양한 실시 예의 방법에 따른 동작이 장치 또는 컴퓨터 상에서 실행되도록 하는 소프트웨어 또는 머신-실행가능한 명령들(예를 들어, 운영체제, 애플리케이션, 펌웨어(firmware), 프로그램 등), 및 이러한 소프트웨어 또는 명령 등이 저장되어 장치 또는 컴퓨터 상에서 실행 가능한 비-일시적 컴퓨터-판독가능 매체(non-transitory computer-readable medium)를 포함한다.
100: 3차원 영상 생성을 위한 2차원 영상 부호화 장치
110: 예측부 111: 제 1 예측 모드부
112: 화면 간 예측부 115: 화면 내 예측부
116: 제 2 예측 모드부 120: 감산기
130: 변환부 140: 양자화부
150: 엔트로피 부호화부 160: 역양자화부
170: 역변환부 175: 가산기
180: 필터부 190: 디코딩 픽처 버퍼
200: 3차원 영상 생성을 위한 2차원 영상 복호화 장치
210: 엔트로피 복호화부 220: 역양자화부
230: 역변환부 240: 복원부
242: 제 1 예측 모드부 250: 제 2 예측 모드부
260: 필터부

Claims (1)

  1. 3차원 영상 생성을 위한 2차원 영상의 복호화 장치에 있어서,
    영상에 대한 화면 내 예측 및 화면 간 예측 중 적어도 어느 하나의 제1 예측 모드 및 상기 3차원 영상이 소정 관점(view point)에서 2차원으로 투사된 프로젝션 화면과 상기 영상 간의 예측에 의한 제 2 예측 모드 중 적어도 어느 하나에 의해 비트스트림을 복호화하는 복호화부; 및
    상기 제 1 및 제 2 예측 모드 중 선택된 예측 모드에 따라 상기 영상을 복원하도록 상기 복호화된 비트스트림을 처리하는 복원부를 포함하는 2차원 영상의 복호화 장치.
KR1020200044652A 2020-04-13 2020-04-13 3차원 영상 생성을 위한 2차원 영상의 부호화 및 복호화 장치 KR20210126940A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200044652A KR20210126940A (ko) 2020-04-13 2020-04-13 3차원 영상 생성을 위한 2차원 영상의 부호화 및 복호화 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200044652A KR20210126940A (ko) 2020-04-13 2020-04-13 3차원 영상 생성을 위한 2차원 영상의 부호화 및 복호화 장치

Publications (1)

Publication Number Publication Date
KR20210126940A true KR20210126940A (ko) 2021-10-21

Family

ID=78268939

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200044652A KR20210126940A (ko) 2020-04-13 2020-04-13 3차원 영상 생성을 위한 2차원 영상의 부호화 및 복호화 장치

Country Status (1)

Country Link
KR (1) KR20210126940A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116686011A (zh) * 2021-12-03 2023-09-01 腾讯美国有限责任公司 基于图表的网格压缩方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116686011A (zh) * 2021-12-03 2023-09-01 腾讯美国有限责任公司 基于图表的网格压缩方法和装置

Similar Documents

Publication Publication Date Title
KR102165340B1 (ko) 색차 성분 양자화 매개 변수 결정 방법 및 이러한 방법을 사용하는 장치
TWI700919B (zh) 視訊編解碼方法/裝置及相應地存儲介質
JP5777080B2 (ja) 合成ビデオのためのロスレス・コード化および関連するシグナリング方法
CN106170092B (zh) 用于无损编码的快速编码方法
JP7343669B2 (ja) Vvcにおける色変換のための方法及び機器
US11909963B2 (en) Image encoding method, decoding method, encoder, and decoder
CN112040229B (zh) 视频解码方法、视频解码器及计算机可读存储介质
JP2021516493A (ja) マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置
JP2022540536A (ja) ビデオコーディング方法並びに装置及びコンピュータプログラム
JP7413557B2 (ja) サインデータハイディング関連映像デコーディング方法及びその装置
TW202126044A (zh) 視訊編碼或解碼系統中的視訊處理方法和裝置
CN113785573A (zh) 编码器、解码器和使用自适应环路滤波器的对应方法
US20210014489A1 (en) Intra prediction device, image encoding device, image decoding device and program
US20240089440A1 (en) Image decoding device, method, and non-transitory computer-readable storage medium
KR101646072B1 (ko) 동영상 데이터 암호화 장치 및 방법
US20240089448A1 (en) Image encoding apparatus, image decoding apparatus, control methods thereof, and non-transitory computer-readable storage medium
KR20210126940A (ko) 3차원 영상 생성을 위한 2차원 영상의 부호화 및 복호화 장치
CN112868241A (zh) 视频编码器、视频解码器及方法
TW202029758A (zh) 利用圖塊分組進行視訊資料編碼的方法及裝置
US10757433B2 (en) Method and apparatus for inserting additional data into video stream without degrading picture quality
CN114424554A (zh) 色度qp偏移表指示和推导的方法和装置
KR20140004018A (ko) 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
WO2021131463A1 (ja) 画像復号装置、画像復号方法及びプログラム
CN110944177B (zh) 视频解码方法及视频解码器,视频编码方法及视频编码器
CN113330741B (zh) 从帧内子划分译码模式工具限制子分区的尺寸的编码器、解码器、及对应方法

Legal Events

Date Code Title Description
A201 Request for examination