KR101910873B1 - 예측 모드 맵을 이용한 비디오 코딩의 부호화 방법 및 복호화 방법 - Google Patents

예측 모드 맵을 이용한 비디오 코딩의 부호화 방법 및 복호화 방법 Download PDF

Info

Publication number
KR101910873B1
KR101910873B1 KR1020160175269A KR20160175269A KR101910873B1 KR 101910873 B1 KR101910873 B1 KR 101910873B1 KR 1020160175269 A KR1020160175269 A KR 1020160175269A KR 20160175269 A KR20160175269 A KR 20160175269A KR 101910873 B1 KR101910873 B1 KR 101910873B1
Authority
KR
South Korea
Prior art keywords
prediction mode
mode map
prediction
map
video coding
Prior art date
Application number
KR1020160175269A
Other languages
English (en)
Other versions
KR20170077803A (ko
Inventor
이상윤
김성완
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Publication of KR20170077803A publication Critical patent/KR20170077803A/ko
Application granted granted Critical
Publication of KR101910873B1 publication Critical patent/KR101910873B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 실시예들은 화면 내 예측을 수행하는 비디오 코딩의 부호화 및 복호화 과정에서 비선형 또는 복잡한 형태의 텍스처를 갖는 영상에 최적화된 맵 기반의 예측 모드를 추가 생성함으로써, 부호화 효율을 향상시킬 수 있는 비디오 코딩의 부호화 방법 및 복호화 방법을 제공한다.

Description

예측 모드 맵을 이용한 비디오 코딩의 부호화 방법 및 복호화 방법 {Encoding and Decoding Method for Video Coding Using Predictive Mode Map}
본 실시예가 속하는 기술 분야는 화면 내 예측을 수행하는 비디오 코딩의 부호화 방법 및 복호화 방법에 관한 것이다.
이 부분에 기술된 내용은 단순히 본 실시예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.
고효율 비디오 코딩(High Efficiency Video Coding, HEVC, H.265)은 2013년 국제 표준화가 완료된 동영상 압축 부호화 기법이다.
고효율 비디오 코딩은 각 입력 영상을 부호화 트리 유닛(Coding Tree Unit)이라 부르는 일정 크기의 블록 단위로 분할한다. 분할된 각 부호화 유닛은 영상 내 예측(Intra Prediction) 및 영상 간 예측(Inter Prediction) 기법을 통하여 블록의 중복되는 정보를 효율적으로 손실 없이 제거한다. 이후 차 영상(Residual Image)을 이산 코사인 변환(Discrete Cosine Transform)을 거쳐 주파수 영역으로 변환한 뒤, 양자화 과정을 거쳐 시각적 화질 열화를 최소화하면서 효율적으로 손실 압축한다. 이렇게 압축 부호화된 영상 정보 및 예측 정보는 이진 산술 부호화(Binary Arithmetic Coding) 과정을 거쳐 다시 압축되어 최종적으로 부호화된 비트열을 출력하게 된다. 이러한 부호화기의 구조는 도 1a에 도식되어 있다.
도 1a에 도시된 바와 같이, 부호화 트리 유닛은 최대 4단계에 걸쳐 각각 4분할될 수 있으며, 부호화 효율이 가장 좋은 분할을 선택하게 된다. 이를 쿼드트리 구조(Quadtree Structure)라고 하며, 분할된 각각의 조각은 부호화 유닛(Coding Unit)이라고 한다. 이러한 분할 구조는 도 1b에 도식되어 있다. 도 1b는 고효율 비디오 코딩의 쿼드트리 구조를 나타낸 도면이다. 도 1b에 도시된 바와 같이, 경우에 따라서는 분할되지 않은 부호화 트리 유닛이 하나의 부호화 유닛을 형성할 수도 있다.
도 1c를 참조하면, HEVC의 화면 내 예측은 35개의 예측 모드를 지원한다. 35개의 예측 모드는 영상 평균값을 이용하는 DC모드, 그라디언트와 유사한 패턴을 생성하는 PLANAR 모드, 및 33개의 방향성 예측 모드들로 구성되어 있다. 여기에서 방향성 모드란 줄무늬와 같은 형태로 일정한 방향성을 지는 패턴을 표현하는 것에 최적화된 기술을 의미한다. 이러한 예측 모드는 도 1c에 도식되어 있다.
도 1c에 도시된 바와 같이, 35개의 예측 모드는 모두 일정한 방향성 또는 평탄한 영상을 가정하고 있으며, 이외의 영상을 부호화하는데 있어서는 그 효율이 낮은 문제가 있다.
본 발명의 실시예들은 화면 내 예측을 수행하는 비디오 코딩의 부호화 및 복호화 과정에서 기존의 예측 모드들과 상이한 맵 기반의 예측 모드를 추가 생성함으로써, 비선형 또는 복잡한 형태의 텍스처를 갖는 영상을 효율적으로 부호화하는 데 주된 목적이 있다.
본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론할 수 있는 범위 내에서 추가적으로 고려될 수 있다.
본 실시예의 일 측면에 의하면, 비디오 코딩의 부호화 장치에 의한 비디오 코딩의 부호화 방법에 있어서, 입력 영상으로부터 예측 블록을 생성하기 위한 예측 모드 맵을 생성하는 단계, 상기 예측 모드 맵을 훈련하는 단계, 및 상기 훈련된 예측 모드 맵에 기반하여, 상기 입력 영상을 부호화하여 비트열을 출력하는 단계, 상기 부호화된 비트열, 상기 예측 모드 맵의 교체여부에 관한 정보, 및 상기 예측 모드 맵 중 적어도 하나를 전송하는 단계를 포함하는 비디오 코딩의 부호화 방법을 제공한다.
본 실시예의 다른 측면에 의하면, 비디오 코딩의 복호화 장치에 의한 비디오 코딩의 복호화 방법에 있어서, 부호화된 비트열 및 예측 모드 맵을 수신하는 단계, 및 상기 수신된 예측 모드 맵을 이용하여 예측 블록을 생성하는 단계를 포함하는 비디오 코딩의 복호화 방법을 제공한다.
본 실시예의 또 다른 측면에 의하면 입력 영상으로부터 예측 블록을 생성하기 위한 예측 모드 맵을 생성하고, 상기 예측 모드 맵을 훈련하고, 상기 훈련된 예측 모드 맵에 기반하여 상기 입력 영상을 부호화하여 비트열을 출력하고, 상기 부호화된 비트열, 상기 예측 모드 맵의 교체여부에 관한 정보, 및 상기 예측 모드 맵을 전송하는 비디오 코딩의 부호화 장치, 및 상기 부호화된 비트열 및 상기 예측 모드 맵을 수신하고, 상기 수신된 예측 모드 맵을 이용하여 상기 예측 블록을 생성하는 비디오 코딩의 복호화 장치를 포함하는 예측 모드 맵을 이용한 비디오 코딩의 부호화 및 복호화 시스템을 제공한다.
이상에서 설명한 바와 같이 본 발명의 실시예들에 의하면, 정지영상 또는 동영상을 압축하는 과정에서 비선형 또는 복잡한 형태의 텍스처를 갖는 영상에 최적화된 예측 모드를 추가 생성함으로써, 부호화 효율을 향상시킬 수 있는 효과가 있다.
여기에서 명시적으로 언급되지 않은 효과라 하더라도, 본 발명의 기술적 특징에 의해 기대되는 이하의 명세서에서 기재된 효과 및 그 잠정적인 효과는 본 발명의 명세서에 기재된 것과 같이 취급된다.
도 1a는 고효율 비디오 코딩의 표준 부호화기의 블록 다이어그램을 나타낸 도면이다.
도 1b는 고효율 비디오 코딩의 쿼드트리 구조를 나타낸 도면이다.
도 1c는 고효율 비디오 코딩의 영상 내 예측에서 사용 가능한 예측 방향을 나타낸 도면이다.
도 2는 본 발명의 실시예들에 따른 비디오 코딩의 부호화 및 복호화 시스템을 예시한 도면이다.
도 3은 본 발명의 일 실시예에 따른 비디오 코딩의 부호화 장치가 생성한 예측 모드 맵 및 참조 픽셀을 예시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 비디오 코딩의 부호화 장치가 예측 모드 맵을 훈련하는 동작을 예시한 흐름도이다.
도 5는 본 발명의 다른 실시예에 따른 비디오 코딩의 부호화 방법을 예시한 흐름도이다.
도 6은 본 발명의 또 다른 실시예에 따른 비디오 코딩의 복호화 방법을 예시한 흐름도이다.
이하, 본 발명을 설명함에 있어서 관련된 공지기능에 대하여 이 분야의 기술자에게 자명한 사항으로서 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하고, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다.
도 2는 본 발명의 실시예들에 따른 비디오 코딩의 부호화 및 복호화 시스템을 예시한 도면이다. 도 2에 도시된 바와 같이, 비디오 코딩의 부호화 및 복호화 시스템은 비디오 코딩의 부호화 장치(210) 및 비디오 코딩의 복호화 장치(220)를 포함한다. 비디오 코딩의 부호화 및 복호화 시스템은 도 1에서 예시적으로 도시한 다양한 구성요소들 중에서 일부 구성요소를 생략하거나 다른 구성요소를 추가로 포함할 수 있다.
비디오 코딩의 부호화 장치(210)는 입력 영상으로부터 예측 블록을 생성하기 위한 예측 모드 맵을 생성한다. 비디오 코딩의 부호화 장치(210)는 예측 모드 맵을 훈련하고, 훈련된 예측 모드 맵에 기반하여 입력 영상을 부호화하여 비트열을 출력한다. 비디오 코딩의 부호화 장치(210)는 부호화된 비트열, 예측 모드 맵의 교체여부에 관한 정보, 및 예측 모드 맵 중 적어도 하나를 비디오 코딩의 복호화 장치(220)로 전송한다.
비디오 코딩의 복호화 장치(220)는 비디오 코딩의 부호화 장치(210)로부터 부호화된 비트열 및 예측 모드 맵을 수신한다. 비디오 코딩의 복호화 장치(220)는 수신된 예측 모드 맵을 이용하여 예측 블록을 생성한다.
도 3을 참조하여, 비디오 코딩의 부호화 장치가 예측 모드 맵을 생성하고, 비디오 코딩의 복호화 장치가 예측 모드 맵에 기반하여 예측 블록을 생성하는 동작을 설명한다. 도 3은 본 발명의 일 실시예에 따른 비디오 코딩의 부호화 장치가 생성한 예측 모드 맵 및 참조 픽셀을 예시한 도면이다.
비디오 코딩의 부호화 장치(210)는 입력 영상의 프레임을 소정의 크기를 갖는 예측 블록들로 분할한다. 비디오 코딩의 부호화 장치(210)는 분할된 예측 블록(330)의 크기와 동일한 크기를 갖는 예측 모드 맵(310)을 생성한다. 비디오 코딩의 부호화 장치(210)는 분할된 예측 블록으로부터 소정의 거리에 위치한 픽셀들을 참조 픽셀들(320)로 설정한다. 예측 블록의 크기가 NxN(N은 자연수)이면, 참조 픽셀들(320) 및 예측 블록(330)의 크기는 (1+N)x(1+N)의 크기를 갖는다. 참조 픽셀들(320)은 예측 블록(330)의 상단 및 좌측에 위치할 수 있다.
예측 모드 맵(310)의 크기가 NxN(N은 자연수)이면, 예측 모드 맵의 원소들은 (2N+1)의 개수 범위 내에서, 참조 픽셀들의 픽셀 값 중 하나와 매칭한다. 예측 모드 맵(310)은 NxN크기의 블록에 대하여 N1 내지 N2의 범위를 가진다. 기본적으로 -N 내지 +N의 범위를 가질 수 있고, 각 값은 상단과 좌측의 픽셀값에 해당할 수 있다.
비디오 코딩의 복호화 장치(220)는 예측 모드 맵의 원소에 대응하는 참조 픽셀의 픽셀 값 또는 참조 픽셀들의 관계식을 참조하여 예측 픽셀들을 생성하여 예측 블록을 생성한다. 여기서, 참조 픽셀들의 관계식은 참조 픽셀들의 평균값, 상단의 평균값, 좌측의 평균값 등이 될 수 있으며, 이는 예시일 뿐이며 이에 한정되는 것은 아니고 구현되는 설계에 따라 적합한 관계식이 사용될 수 있음은 물론이다.
비디오 코딩의 복호화 장치(220)는 NxN 블록 내의 픽셀값을 연산하기 위하여 좌측 인접 N픽셀, 상단 인접 N 픽셀, 그리고 좌상단의 1픽셀을 이용한다. 해당 픽셀의 값 들과 예측 모드에 정의된 식에 따라 NxN 블록의 픽셀 값을 생성하도록 한다.
도 4를 참조하여, 비디오 코딩의 부호화 장치가 예측 모드 맵을 훈련하는 동작을 설명한다. 도 4는 본 발명의 일 실시예에 따른 비디오 코딩의 부호화 장치가 예측 모드 맵을 훈련하는 동작을 예시한 흐름도이다.
단계 S410에서, 비디오 코딩의 부호화 장치는 블록 단위로 영상을 분할한다. 단계 S420에서, 비디오 코딩의 부호화 장치는 초기 예측 모드 맵을 생성한다. 단계 S420에서, 비디오 코딩의 부호화 장치는 난수를 생성하거나 이전 훈련의 결과를 사용할 수 있다.
단계 S430에서, 비디오 코딩의 부호화 장치는 예측 모드 맵에 기반하여 예측 블록을 생성한다. 비디오 코딩의 부호화 장치는 예측 모드 맵의 원소에 대응하는 참조 픽셀의 픽셀 값 또는 참조 픽셀들의 관계식을 참조하여 예측 픽셀들을 생성하여 예측 블록을 생성한다.
단계 S440에서, 비디오 코딩의 부호화 장치는 예측 모드 맵에 대한 성능을 평가한다.
단계 S450에서, 비디오 코딩의 부호화 장치는 종료 조건에 따라 예측 모드 맵에 대한 훈련을 종료하거나 예측 모드 맵을 업데이트한다. 비디오 코딩의 부호화 장치는 예측 블록의 성능을 평가한 횟수가 기 설정된 횟수를 초과하거나 성능 평가 지표인 이득값이 개선되지 않으면, 예측 블록의 성능을 평가하는 과정을 종료한다. 단계 S460에서, 비디오 코딩의 부호화 장치는 예측 모드 맵을 업데이트한다.
아래 표 1과 같이 표현된 의사 코드를 참조하여, 비디오 코딩의 부호화 장치가 예측 블록의 부호화 성능을 평가하는 동작을 설명한다.
Figure 112016125421297-pat00001
비디오 코딩의 부호화 장치는 (i) 예측 모드 맵에 기반하여 생성한 예측 블록 및 (ii) DC 모드, Planar 모드, Vertical 모드, 또는 Horizontal 모드로부터 생성한 예측 블록 간에 비교한다. 소정의 블록에 대하여 특정 예측 모드를 사용하여 예측하였을 때, 오차를 검증한다. 오차 검증은 오차제곱합(Sum of Square for Error, SSE) 등의 선형회귀기법을 이용하여 산출될 수 있다. 예측 모드 맵에 기반하여 생성한 예측 블록이 상기 검증한 오차에 관하여 최소값을 가지면, 이득값을 누적하여 예측 블록의 성능을 평가한다.
비디오 코딩의 부호화 장치는 예측 블록의 성능을 평가한 횟수가 기 설정된 횟수를 초과하거나 이득값이 개선되지 않으면, 상기 예측 블록의 성능을 평가하는 과정을 종료한다.
이하에서는 비디오 코딩의 부호화 장치가 예측 모드 맵을 업데이트하는 동작을 설명한다. 예측 모드 맵을 업데이트하는 과정은 유전 알고리즘이나 몬테카를로 기법과 같은 계산 모델 또는 그리디 기법 등을 적용할 수 있다.
비디오 코딩의 부호화 장치는 예측 모드 맵의 각각의 원소에 대하여, (2N+1)의 개수 범위 내에서 매칭된 참조 픽셀들의 픽셀 값 중에서 이득값이 가장 최소가 되도록 예측 모드 맵을 산출하여, 예측 모드 맵을 업데이트한다. 즉, NxN크기의 블록을 갖는 예측 모드 맵의 원소는 N1 내지 N2의 범위를 갖고, 벡터화된 예측 모드 맵 M의 위치 i에 대하여 N1 값 내지 N2 값 중에서 이득값이 가장 최소가 되는 Mi값을 찾는다. 그리고, 위치 i를 다음 위치로 이동한다. 위차 i가 끝에 도달하면 다시 처음으로 돌아가 과정을 반복한다.
비디오 코딩의 부호화 장치는 예측 모드 맵의 모든 원소에 대하여, 산출한 예측 모드 맵이 이전의 예측 모드 맵과 동일하면, 예측 모드 맵을 업데이트하는 과정을 종료한다. 즉, i가 마지막 위치에 도달하고, M이 이전과 동일하여 업데이트가 없을 때이다.
아래 표 2과 같이 표현된 의사 코드를 참조하여, 비디오 코딩의 부호화 장치가 예측 모드 맵을 전송하는 동작을 설명한다.
Figure 112016125421297-pat00002
생성된 예측 모드 맵의 정수값은 값의 범위에 따라 n-bit FLC(Fixed Length Code)를 사용하여 전송할 수 있다. 각 프레임에서 첫 번째 모드가 사용될 때, 맵의 갱신 또는 초기화는 플래그를 사용한다. 맵 기반 예측 모드가 사용되면, 표 2와 같은 형태의 구문이 추가적으로 전송된다.
표 2에서 사용되는 구문(Syntax)은 크게 네 가지이고, log_size_minus_2, is_map_set, renew_map, 및 map으로 구성된다.
첫 번째 구문인 log_size_minus_2는 블록 크기의 로그값을 이용하여 정규화한 것이다. HEVC를 기준으로 4x4는 0, 8x8은 1의 순으로 설정될 수 있다.
두 번째 구문인 is_map_set은 기존에 맵이 전송되었는지를 나타내는 플래그이다. 플래그는 자동으로 산출되며, 해당 프레임 내에서 모드가 사용되지 않을 경우 계속 0으로 남아있게 된다.
세 번째 구문인 renew_map은 부호화 장치의 판단에 따라 예측 모드 맵의 전송이 필요하다고 판단되면, 예측 모드 맵을 전송한다. 예컨대, 0일 경우 갱신하지 않고, 1일 경우 영구적으로 갱신하고, 2일 경우 해당 블록에서만 갱신하도록 설정할 수 있다.
네 번째 구문인 map은 각 픽셀 위치 i에 대하여 어떤 방법으로 예측을 할지 나타내는 숫자값이다. map 값은 참조 픽셀의 위치 또는 수식을 나타낼 수 있다.
도 5는 본 발명의 다른 실시예에 따른 비디오 코딩의 부호화 방법을 예시한 흐름도이다.
단계 S510에서, 비디오 코딩의 부호화 장치는 입력 영상으로부터 예측 블록을 생성하기 위한 예측 모드 맵을 생성한다. 예측 모드 맵을 생성하는 단계(S510)는 입력 영상의 프레임을 소정의 크기를 갖는 예측 블록들로 분할하고, 분할된 예측 블록의 크기와 동일한 크기를 갖는 예측 모드 맵을 생성한다. 상기 예측 모드 맵을 생성하는 단계는,
예측 모드 맵을 생성하는 단계(S510)는 분할된 예측 블록으로부터 소정의 거리에 위치한 픽셀들을 참조 픽셀들로 설정하고, 예측 블록의 크기가 NxN(N은 자연수)이면, 참조 픽셀들 및 예측 블록의 크기는 (1+N)x(1+N)의 크기를 갖는다. 참조 픽셀들은 예측 블록의 상단 및 좌측에 위치할 수 있다.
예측 모드 맵을 생성하는 단계(S510)는 예측 모드 맵의 크기가 NxN(N은 자연수)이면, 예측 모드 맵의 원소들은 (2N+1)의 개수 범위 내에서, 참조 픽셀들의 픽셀 값 중 하나와 매칭시킨다. 또는, 참조 픽셀들의 픽셀 값의 관계식으로 산출될 수 있다.
단계 S520에서, 비디오 코딩의 부호화 장치는 예측 모드 맵을 훈련한다. 예측 모드 맵을 훈련하는 단계(S520)는 예측 모드 맵의 원소에 대응하는 참조 픽셀의 픽셀 값 또는 참조 픽셀들의 관계식을 참조하여 예측 픽셀들을 생성하고 예측 블록을 생성할 수 있다.
예측 모드 맵을 훈련하는 단계(S520)는 (i) 예측 모드 맵에 기반하여 생성한 예측 블록 및 (ii) DC 모드, Planar 모드, Vertical 모드, 또는 Horizontal 모드로부터 생성한 예측 블록 간에 비교하여, 오차를 검증하고, 예측 모드 맵에 기반하여 생성한 예측 블록이 검증한 오차에 관하여 최소값을 가지면, 이득값을 누적하여 예측 블록의 성능을 평가할 수 있다.
예측 모드 맵을 훈련하는 단계(S520)는 예측 블록의 성능을 평가한 횟수가 기 설정된 횟수를 초과하거나 이득값이 개선되지 않으면, 예측 블록의 성능을 평가하는 과정을 종료한다.
예측 모드 맵을 훈련하는 단계(S520)는 예측 모드 맵의 각각의 원소에 대하여, (2N+1)의 개수 범위 내에서 매칭된 참조 픽셀들의 픽셀 값 중에서 이득값이 가장 최소가 되도록 예측 모드 맵을 산출하여, 예측 모드 맵을 업데이트하는 단계를 추가로 포함할 수 있다. 예측 모드 맵을 업데이트하는 단계는 예측 모드 맵의 모든 원소에 대하여, 산출한 예측 모드 맵이 이전의 예측 모드 맵과 동일하면, 예측 모드 맵을 업데이트하는 과정을 종료한다.
단계 S530에서, 비디오 코딩의 부호화 장치는 훈련된 예측 모드 맵에 기반하여, 입력 영상을 부호화하여 비트열을 출력한다. 단계 S540에서, 비디오 코딩의 부호화 장치는 부호화된 비트열, 예측 모드 맵의 교체여부에 관한 정보, 및 예측 모드 맵 중 적어도 하나를 전송한다.
도 6은 본 발명의 또 다른 실시예에 따른 비디오 코딩의 복호화 방법을 예시한 흐름도이다.
단계 S610에서, 비디오 코딩의 복호화 장치는 부호화된 비트열 및 예측 모드 맵을 수신한다. 여기서, 예측 모드 맵의 크기가 NxN(N은 자연수)이면, 참조 픽셀들 및 예측 블록의 크기는 (1+N)x(1+N)의 크기를 갖고, 참조 픽셀들은 예측 블록의 상단 및 좌측에 위치할 수 있다.
단계 S620에서, 비디오 코딩의 복호화 장치는 수신된 예측 모드 맵을 이용하여 예측 블록을 생성한다. 예측 블록을 생성하는 단계(S620)는 예측 모드 맵의 원소에 대응하는 참조 픽셀의 픽셀 값 또는 참조 픽셀들의 관계식을 참조하여 예측 픽셀들을 생성하고 예측 블록들을 생성한다. NxN 블록 내의 픽셀값을 연산하기 위하여 좌측 인접 N픽셀, 상단 인접 N 픽셀, 그리고 좌상단의 1픽셀을 이용한다. 해당 픽셀의 값 들과 예측 모드에 정의된 식에 따라 NxN 블록의 픽셀 값을 생성하도록 한다.
비디오 코딩의 복호화 방법은 예측 모드 맵의 교체여부에 관한 정보 및 새로운 예측 모드 맵을 수신하고, 예측 모드 맵의 교체여부에 관한 정보에 따라 새로운 예측 모드 맵을 이용하여 예측 블록을 생성하는 단계를 추가로 포함할 수 있다.
본 실시예들에 의하면, 정지영상 또는 동영상을 압축하는 과정에서 비선형 또는 복잡한 형태의 텍스처를 갖는 영상에 최적화된 맵 기반의 예측 모드를 추가 생성함으로써, 부호화 효율을 향상시킬 수 있는 효과가 있다.
비디오 코딩의 부호화 장치 및 복호화 장치는 하드웨어, 펌웨어, 소프트웨어 또는 이들의 조합에 의해 로직회로 내에서 구현될 수 있고, 범용 또는 특정 목적 컴퓨터를 이용하여 구현될 수도 있다. 장치는 고정배선형(Hardwired) 기기, 필드 프로그램 가능한 게이트 어레이(Field Programmable Gate Array, FPGA), 주문형 반도체(Application Specific Integrated Circuit, ASIC) 등을 이용하여 구현될 수 있다. 또한, 장치는 하나 이상의 프로세서 및 컨트롤러를 포함한 시스템온칩(System on Chip, SoC)으로 구현될 수 있다.
비디오 코딩의 부호화 장치 및 복호화 장치는 하드웨어적 요소가 마련된 컴퓨팅 디바이스 또는 서버에 소프트웨어, 하드웨어, 또는 이들의 조합하는 형태로 탑재될 수 있다. 컴퓨팅 디바이스 또는 서버는 각종 기기 또는 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신장치, 프로그램을 실행하기 위한 데이터를 저장하는 메모리, 프로그램을 실행하여 연산 및 명령하기 위한 마이크로프로세서 등을 전부 또는 일부 포함한 다양한 장치를 의미할 수 있다.
본 실시예들에 따른 동작은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능한 매체에 기록될 수 있다. 컴퓨터 판독 가능한 매체는 실행을 위해 프로세서에 명령어를 제공하는 데 참여한 임의의 매체를 나타낸다. 컴퓨터 판독 가능한 매체는 프로그램 명령, 데이터 파일, 데이터 구조 또는 이들의 조합을 포함할 수 있다. 예를 들면, 자기 매체, 광기록 매체, 메모리 등이 있을 수 있다. 컴퓨터 프로그램은 네트워크로 연결된 컴퓨터 시스템 상에 분산되어 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 본 실시예를 구현하기 위한 기능적인(Functional) 프로그램, 코드, 및 코드 세그먼트들은 본 실시예가 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있을 것이다.
본 실시예들은 본 실시예의 기술 사상을 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
210: 비디오 코딩의 부호화 장치
220: 비디오 코딩의 복호화 장치

Claims (16)

  1. 비디오 코딩의 부호화 장치에 의한 비디오 코딩의 부호화 방법에 있어서,
    입력 영상으로부터 예측 블록을 생성하기 위한 예측 모드 맵을 생성하는 단계;
    상기 예측 모드 맵을 훈련하는 단계; 및
    상기 훈련된 예측 모드 맵에 기반하여, 상기 입력 영상을 부호화하여 비트열을 출력하는 단계;
    상기 예측 모드 맵의 전송여부에 관한 정보에 따라 상기 예측 모드 맵을 선택적으로 전송하는 단계를 포함하며,
    상기 예측 모드 맵의 전송여부에 관한 정보는 (i) 맵 유지에 관한 제1 플래그 정보, (ii) 맵의 영구적인 교체에 관한 제2 플래그 정보, (iii) 해당 블록에 대하여 맵의 일시적인 교체에 관한 제3 플래그 정보를 포함하는 것을 특징으로 하는 비디오 코딩의 부호화 방법.
  2. 제1항에 있어서,
    상기 예측 모드 맵을 생성하는 단계는,
    상기 입력 영상의 프레임을 소정의 크기를 갖는 예측 블록들로 분할하고,
    상기 분할된 예측 블록의 크기와 동일한 크기를 갖는 상기 예측 모드 맵을 생성하는 것을 특징으로 하는 비디오 코딩의 부호화 방법.
  3. 삭제
  4. 삭제
  5. 제2항에 있어서,
    상기 예측 모드 맵을 생성하는 단계는,
    상기 분할된 예측 블록으로부터 기 설정된 거리에 위치하는 픽셀들을 참조 픽셀들로 설정하고,
    상기 예측 모드 맵의 크기가 NxN(N은 자연수)이면, 상기 예측 모드 맵의 원소들은 (2N+1)의 개수 범위 내에서, 상기 참조 픽셀들의 픽셀 값 중 하나와 매칭하는 것을 특징으로 하는 비디오 코딩의 부호화 방법.
  6. 제1항에 있어서,
    상기 예측 모드 맵을 훈련하는 단계는,
    상기 예측 모드 맵의 원소에 대응하는 참조 픽셀의 픽셀 값 또는 상기 참조 픽셀들의 관계식을 참조하여 예측 픽셀들을 생성하고 상기 예측 블록을 생성하는 것을 특징으로 하는 비디오 코딩의 부호화 방법.
  7. 제6항에 있어서,
    상기 예측 모드 맵을 훈련하는 단계는,
    (i) 상기 예측 모드 맵에 기반하여 생성한 예측 블록 및 (ii) DC 모드, Planar 모드, Vertical 모드, 또는 Horizontal 모드로부터 생성한 예측 블록 간에 비교하여, 오차를 검증하고, 상기 예측 모드 맵에 기반하여 생성한 예측 블록이 상기 검증한 오차에 관하여 최소값을 가지면, 이득값을 누적하여 상기 예측 블록의 성능을 평가하는 것을 특징으로 하는 비디오 코딩의 부호화 방법.
  8. 제7항에 있어서,
    상기 예측 모드 맵을 훈련하는 단계는,
    상기 예측 블록의 성능을 평가한 횟수가 기 설정된 횟수를 초과하거나 상기 이득값이 개선되지 않으면, 상기 예측 블록의 성능을 평가하는 과정을 종료하는 것을 특징으로 하는 비디오 코딩의 부호화 방법.
  9. 제7항에 있어서,
    상기 예측 모드 맵을 훈련하는 단계는,
    상기 예측 모드 맵의 각각의 원소에 대하여, (2N+1)의 개수 범위 내에서 매칭된 참조 픽셀들의 픽셀 값 중에서 상기 이득값이 가장 최소가 되도록 상기 예측 모드 맵을 산출하여, 상기 예측 모드 맵을 업데이트하는 단계를 추가로 포함하는 것을 특징으로 하는 비디오 코딩의 부호화 방법.
  10. 제9항에 있어서,
    상기 예측 모드 맵을 업데이트하는 단계는,
    상기 예측 모드 맵의 모든 원소에 대하여, 상기 산출한 예측 모드 맵이 이전의 예측 모드 맵과 동일하면, 상기 예측 모드 맵을 업데이트하는 과정을 종료하는 것을 특징으로 하는 비디오 코딩의 부호화 방법.
  11. 비디오 코딩의 복호화 장치에 의한 비디오 코딩의 복호화 방법에 있어서,
    예측 모드 맵의 전송여부에 관한 정보에 따라 상기 예측 모드 맵을 선택적으로 수신하는 단계; 및
    상기 수신된 예측 모드 맵을 이용하여 예측 블록을 생성하는 단계를 포함하며,
    상기 예측 모드 맵의 전송여부에 관한 정보는 (i) 맵 유지에 관한 제1 플래그 정보, (ii) 맵의 영구적인 교체에 관한 제2 플래그 정보, (iii) 해당 블록에 대하여 맵의 일시적인 교체에 관한 제3 플래그 정보를 포함하는 것을 특징으로 하는 비디오 코딩의 복호화 방법.
  12. 삭제
  13. 제11항에 있어서,
    상기 예측 블록을 생성하는 단계는,
    상기 예측 모드 맵의 원소에 대응하는 참조 픽셀의 픽셀 값 또는 상기 참조 픽셀들의 관계식을 참조하여 예측 픽셀들을 생성하고 상기 예측 블록들을 생성하는 것을 특징으로 하는 비디오 코딩의 복호화 방법.
  14. 삭제
  15. 입력 영상으로부터 예측 블록을 생성하기 위한 예측 모드 맵을 생성하고, 상기 예측 모드 맵을 훈련하고, 상기 훈련된 예측 모드 맵에 기반하여 상기 입력 영상을 입력 영상으로부터 예측 블록을 생성하기 위한 예측 모드 맵을 생성하고, 상기 예측 모드 맵을 훈련하고, 상기 훈련된 예측 모드 맵에 기반하여 상기 입력 영상을 부호화하여 비트열을 출력하고, 상기 예측 모드 맵의 전송여부에 관한 정보에 따라 상기 예측 모드 맵을 선택적으로 전송하는 비디오 코딩의 부호화 장치; 및
    상기 예측 모드 맵의 전송여부에 관한 정보에 따라 상기 예측 모드 맵을 선택적으로 수신하고, 상기 수신된 예측 모드 맵을 이용하여 상기 예측 블록을 생성하는 비디오 코딩의 복호화 장치를 포함하며,
    상기 예측 모드 맵의 전송여부에 관한 정보는 (i) 맵 유지에 관한 제1 플래그 정보, (ii) 맵의 영구적인 교체에 관한 제2 플래그 정보, (iii) 해당 블록에 대하여 맵의 일시적인 교체에 관한 제3 플래그 정보를 포함하는 것을 특징으로 하는 예측 모드 맵을 이용한 비디오 코딩의 부호화 및 복호화 시스템.
  16. 삭제
KR1020160175269A 2015-12-28 2016-12-21 예측 모드 맵을 이용한 비디오 코딩의 부호화 방법 및 복호화 방법 KR101910873B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20150187703 2015-12-28
KR1020150187703 2015-12-28

Publications (2)

Publication Number Publication Date
KR20170077803A KR20170077803A (ko) 2017-07-06
KR101910873B1 true KR101910873B1 (ko) 2018-10-23

Family

ID=59354119

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160175269A KR101910873B1 (ko) 2015-12-28 2016-12-21 예측 모드 맵을 이용한 비디오 코딩의 부호화 방법 및 복호화 방법

Country Status (1)

Country Link
KR (1) KR101910873B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108184114B (zh) * 2018-01-06 2021-08-31 北京航空航天大学 一种基于支持向量机SVM的P帧中Intra预测模式快速判定方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100750128B1 (ko) * 2005-09-06 2007-08-21 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치
CA2676709C (en) * 2007-02-23 2013-06-25 Nippon Telegraph And Telephone Corporation Video encoding method and decoding method, apparatuses therefor, programs therefor, and storage media which store the programs
KR101510108B1 (ko) * 2009-08-17 2015-04-10 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치

Also Published As

Publication number Publication date
KR20170077803A (ko) 2017-07-06

Similar Documents

Publication Publication Date Title
JP5937206B2 (ja) ビデオデータをコンテキスト適応型コーディングすること
WO2018119241A1 (en) Low-complexity sign prediction for video coding
JP2018530245A5 (ko)
CN103597838B (zh) 对末位有效系数的位置进行编码和解码的方法和设备
CN103703776A (zh) 在视频译码中的系数扫描
KR101791158B1 (ko) 계층적 가변 블록 변환이 가능한 부호화 방법 및 장치 그리고 복호화 방법 및 장치
JP2018506905A5 (ko)
KR20110112180A (ko) 저복잡도 엔트로피 부호화/복호화 방법 및 장치
RU2014133154A (ru) Определение контекстов для кодирования данных коэффициентов преобразования при кодировании видео
RU2014133791A (ru) Повышение пропускной способности для кодирования уровня коэффициентов cabac
RU2016104528A (ru) Инициализация параметра райса для кодирования на уровне коэффициентов в процессе кодирования видео
JP2016515786A5 (ko)
CN102598663A (zh) 通过使用旋转变换对图像编码和解码的方法和设备
RU2013119914A (ru) Статистическое кодирование коэффициентов, используя объединенную контекстную модель
RU2016125260A (ru) Предсказание вектора блока в кодировании/декодировании видео и изображений
JP2013513333A5 (ko)
JP2015507431A5 (ko)
KR20140031370A (ko) 변환 계수 레벨 코딩을 위한 컨텍스트 모델링 기술들
JP2014523186A (ja) エントロピー符号化/復号化方法及びその装置
TW201345265A (zh) 藉由預測階層資料單元的量子化參數對視訊進行編碼/解碼的方法及其裝置
JP6698142B2 (ja) ビデオデータを符号化するための方法及び装置
JP2015019152A5 (ko)
US20180199058A1 (en) Video encoding and decoding method and device
KR101910873B1 (ko) 예측 모드 맵을 이용한 비디오 코딩의 부호화 방법 및 복호화 방법
TW202032995A (zh) 圖像編碼及解碼技術

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant