KR101574391B1 - 영상 부호화 방법 및 그 장치 - Google Patents

영상 부호화 방법 및 그 장치 Download PDF

Info

Publication number
KR101574391B1
KR101574391B1 KR1020130129280A KR20130129280A KR101574391B1 KR 101574391 B1 KR101574391 B1 KR 101574391B1 KR 1020130129280 A KR1020130129280 A KR 1020130129280A KR 20130129280 A KR20130129280 A KR 20130129280A KR 101574391 B1 KR101574391 B1 KR 101574391B1
Authority
KR
South Korea
Prior art keywords
macroblock
image
structural similarity
quantization
step size
Prior art date
Application number
KR1020130129280A
Other languages
English (en)
Other versions
KR20150050635A (ko
Inventor
이상훈
김학섭
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Priority to KR1020130129280A priority Critical patent/KR101574391B1/ko
Publication of KR20150050635A publication Critical patent/KR20150050635A/ko
Application granted granted Critical
Publication of KR101574391B1 publication Critical patent/KR101574391B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

영상 부호화 방법 및 그 장치가 개시된다. 영상 부호화 장치는 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정하는 양자화 스텝 사이즈 결정부; 매크로블록내 기준값을 기준으로 상기 결정된 양자화 스텝 사이즈를 반영하여 상기 매크로블록내의 픽셀에 대한 양자화 레벨을 결정하는 양자화 레벨 결정부; 및 상기 결정된 양자화 레벨에 따라 상기 매크로블록내의 픽셀을 양자화하여 부호화하는 부호화부를 포함한다.

Description

영상 부호화 방법 및 그 장치{Method and apparatus for image coding}
본 발명은 영상처리에 관한 것으로, 보다 상세하게 주어진 트래픽 상황에서 일정 비트레이트를 만족시키면서 QoS가 보장될 수 있는 고성능 저지연 영상 부호화 방법 및 그 장치에 관한 것이다.
종래에는 블록 절단 부호화(BTC: block truncation coding, 이하 BTC라 칭함)은 영상 부호화시 계산량을 획기적으로 줄일 수 있어 많은 곳에서 활용되었다. 이러한 BTC 방식은 영상을 블록으로 나누고 각 블록을 2개의 값으로 매핑하여 데이터량을 줄일 수 있다. 즉, 블록내의 픽셀값들을 양자화 기준점(T)를 기준으로 기준점을 초과하는 값과 기준점 이하의 값으로 구분하여 부호화하는 방식이다.
이를 수식으로 나타내면 수 1과 같다.
Figure 112013098125227-pat00001
여기서, Zi는 i번째 픽셀에 대응하는 코드값을 나타낸다. BTC 방식의 경우 일반적으로 양자화 기준점은 블록내의 모든 픽셀값들의 평균값으로 설정되고, 양자화 레벨은 수 2와 같이 계산된다.
Figure 112013098125227-pat00002
여기서, M은 양자화 기준점보다 작은 픽셀값들의 개수를 나타내고, N은 전체 픽셀 개수를 나타낸다.
이러한 BTC 방식은 블록의 사이즈와 콘텐츠의 복잡도에 따라 성능이 크게 달라지며, 매우 복잡한 영상을 부호화하는 경우 블록 사이즈가 고정되어 많은 화질 열화를 유발하는 문제점이 있다.
본 발명은 이산 웨이블릿 트랜스폼을 기반으로 영상의 주파수적 특성을 고려하여 영상 부호화에 따른 부호화 효율을 높일 수 있는 영상 부호화 방법 및 그 장치를 제공하기 위한 것이다.
또한, 본 발명은 트래픽 상황에 대해 일정한 비트레이트를 만족시키면서 QoS를 보정할 수 있는 고성능 저지연 영상 부호화 방법 및 그 장치를 제공하기 위한 것이다.
또한, 본 발명은 영상의 구조적 유사도(SSIM: Structural similarity)를 고려하여 시각적 화질을 개선할 수 있는 영상 부호화 방법 및 그 장치를 제공하기 위한 것이다.
본 발명의 일 측면에 따르면, 영상의 구조적 유사도(SSIM: Structural similarity)를 고려하여 시각적 화질을 개선할 수 있는 영상 부호화 장치가 제공된다.
본 발명의 일 실시예에 따르면, 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정하는 양자화 스텝 사이즈 결정부; 매크로블록내 기준값을 기준으로 상기 결정된 양자화 스텝 사이즈를 반영하여 상기 매크로블록내의 픽셀에 대한 양자화 레벨을 결정하는 양자화 레벨 결정부; 및 상기 결정된 양자화 레벨에 따라 상기 매크로블록내의 픽셀을 양자화하여 부호화하는 부호화부를 포함하는 영상 부호화 장치가 제공될 수 있다.
상기 기준값은 상기 매크로블록내에 포함된 픽셀값들의 중간값일 수 있다.
상기 구조적 유사도는 SSIM(Structural similarity)를 이용하여 도출될 수 있다.
상기 양자화 스텝 사이즈를 하기 수식을 이용하여 결정되되,
Figure 112013098125227-pat00003
여기서,
Figure 112013098125227-pat00004
이되,
상기 xi는 i번째 픽셀의 픽셀값을 나타내고, ki는 i번째 픽셀에 할당되는 바이너리의 인덱스를 나타내며,
Figure 112013098125227-pat00005
는 매크로블록내 픽셀들의 평균값을 나타내며,
Figure 112013098125227-pat00006
는 매크로블록내 픽셀들의 분산을 나타낸다.
상기 레벨 결정부는 하기 수식을 이용하여 양자화 레벨을 결정하되,
Figure 112013098125227-pat00007
여기서,
Figure 112013098125227-pat00008
는 상기 기준값을 나타내고, 상기
Figure 112013098125227-pat00009
는 픽셀값들의 분포를 균등하게 분할했을 때 가장 빈도수가 많은 바이너리의 인덱스를 나타내고,
Figure 112013098125227-pat00010
는 양자화 스텝 사이즈를 나타낸다.
상기 영상을 프레임 단위로 이산 웨이블릿 트랜스폼 변환을 수행하는 변환부를 더 포함하되, 상기 양자화 스텝 사이즈 및 상기 양자화 레벨은 상기 변환된 영상을 이용하여 결정될 수 있다.
본 발명의 다른 실시예에 따르면, 입력 영상을 이산 웨이블릿 트랜스폼 변환하는 변환부; 및 상기 변환된 영상을 매크로블록 단위로 상이한 복수의 부호화 방식으로 각각 부호화하여 구조적 유사도(SSIM)가 최적인 부호화 방식으로 부호화하는 부호화부를 포함하는 영상 부호화 장치가 제공될 수 있다.
상기 복수의 부호화 방식은 스킵 모드, 평균값 매핑 모드 및 구조적 유사도 기반 양자화 모드를 포함할 수 있다.
상기 스킵 모드는 상기 매크로블록 내의 픽셀값을 모두 "0"으로 매핑하여 부호화는 것이며, 상기 평균값 매핑 모드는 상기 매크로블록내의 픽셀값들을 평균값으로 매핑하여 부호화하는 것이며, 상기 구조적 유사도 기반 양자화 모드는 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정한 후 매크로블록내 기준값을 기준으로 상기 결정된 양자화 스텝 사이즈를 반영하여 상기 매크로블록내의 픽셀에 대한 양자화 레벨을 결정하여 양자화하는 방식이다.
상기 복수의 부호화 방식은 병렬적으로 수행될 수 있다.
본 발명의 다른 측면에 따르면, 영상의 구조적 유사도(SSIM: Structural similarity)를 고려하여 시각적 화질을 개선할 수 있는 영상 부호화 방법이 제공된다.
본 발명의 일 실시예에 따르면, 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정하는 단계; 매크로블록내 기준값을 기준으로 상기 결정된 양자화 스텝 사이즈를 반영하여 상기 매크로블록내의 픽셀에 대한 양자화 레벨을 결정하는 단계; 및 상기 결정된 양자화 레벨에 따라 상기 매크로블록내의 픽셀을 양자화하여 부호화하는 단계를 포함하는 영상 처리 방법이 제공될 수 있다.
본 발명의 다른 실시예에 따르면, 입력 영상을 이산 웨이블릿 트랜스폼 변환하는 단계; 및 상기 변환된 영상을 매크로블록 단위로 복수의 부호화 방식으로 각각 부호화하여 구조적 유사도(SSIM)가 최적인 부호화 방식으로 부호화하는 단계를 포함하는 영상 부호화 방법이 제공될 수 있다.
본 발명의 일 실시예에 따른 영상 부호화 방법 및 그 장치를 제공함으로써, 이산 웨이블릿 트랜스폼을 기반으로 영상의 주파수적 특성을 고려하여 영상 부호화에 따른 부호화 효율을 높일 수 있는 이점이 있다.
또한, 본 발명은 트래픽 상황에 대해 일정한 비트레이트를 만족시키면서 QoS를 보정할 수 있는 고성능 저지연 영상 전송이 가능케 할 수 있는 이점도 있다.
또한, 본 발명은 영상의 구조적 유사도(SSIM: Structural similarity)를 고려하여 시각적 화질을 개선할 수 있는 이점도 있다.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 방법을 나타낸 순서도.
도 2는 DWT 변환 특성을 설명하기 위해 도시한 도면.
도 3은 종래와 본 발명의 일 실시예에 따른 양자화 레벨을 비교하기 위해 도시한 그래프.
도 4는 본 발명의 일 실시예에 따른 영상 부호화 장치의 내부 구성을 개략적으로 도시한 블록도.
도 5는 본 발명의 일 실시예에 따른 부호화부의 내부 구성을 나타낸 블록도.
도 6은 본 발명의 일 실시예에 따른 SAQC의 부호화 유닛의 구성을 개략적으로 도시한 블록도.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
본 발명은 이산 웨이블릿 트랜스폼에 기반한 영상의 주파수적 특성을 고려하고, 영상의 구조적 유사도가 최대가 될 수 있도록 양자화 스텝 사이즈 및 양자화 레벨을 결정하여 영상을 부호화할 수 있는 영상 부호화에 관한 것이다. 이를 통해, 본 발명은 시각적 화질을 개선할 수 있다.
이하, 본 발명의 실시예를 첨부한 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 방법을 나타낸 순서도이고, 도 2는 DWT 변환 특성을 설명하기 위해 도시한 도면이고, 도 3은 종래와 본 발명의 일 실시예에 따른 양자화 레벨을 비교하기 위해 도시한 그래프이다.
단계 110에서 영상 부호화 장치(100)는 영상을 프레임 단위로 이산 웨이블릿 트랜스폼(DWT: discrete wavelet transform- 이하 DWT라 칭하기로 함) 변환을 수행한다. 도 2에는 DWT 변환된 프레임의 각 영역을 개략적으로 도시한 것이다. 도 2는 DWT를 1회 수행한 프레임의 각 영역을 나타낸 것이다. 1차 DWT 변환된 프레임의 각 영역은 도 2에 도시된 바와 같이, LL, LH, HL, HH 4개의 영역으로 나뉘게 된다. 이때, LL 영역은 영상내의 저주파 성분들이 모이게 되고, LH 및 HL 영역은 각각 가로축과 세로축 방향의 고주파 성분들이 모이게 된다. 그리고, HH 영역에는 대각선 방향의 고주파 성분들이 모이게 된다.
도 2에서 보여지는 바와 같이, DWT 변환된 영상은 LL 영역에 높은 평균값 및 표준편차를 갖게 된다. 이를 통해, DWT 변환된 영상의 LL 영역에 가장 많은 정보가 있음을 알 수 있다. 그리고, LH, HL 및 HH 영역에는 영상에 대한 정보가 크게 줄어들어 대부분 0에 가까운 값을 갖는 것을 알 수 있다.
단계 115에서 영상 부호화 장치(100)는 DWT 변환된 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정한다.
본 발명의 일 실시예에 따르면, 영상의 구조적 유사도는 SSIM(Structural similarity)에 의해 계산될 수 있다. 이해와 설명의 편의를 도모하기 위해 SSIM에 대해 간략하게 설명하기로 한다.
SSIM은 원 영상(original image)과 왜곡 영상간의 구조적 유사도를 계산하여 화질을 평가하는 것으로, 수 3에 의해 계산될 수 있다.
Figure 112013098125227-pat00011
여기서,
Figure 112015033690933-pat00012
은 원 영상(original image의 매크로블록내 픽셀들의 평균값을 나타내고,
Figure 112015033690933-pat00013
는 부호화된 영상의 매크로블록내 픽셀들의 평균을 나타낸다. 또한,
Figure 112015033690933-pat00014
는 원 영상의 매크로블록내 픽셀들의 분산을 나타내고,
Figure 112015033690933-pat00015
는 부호화된 영상의 매크로블록내 픽셀들의 분산을 나타내고,
Figure 112015033690933-pat00016
는 원 영상과 부호화된 영상간의 상관계를 나타낸다. 또한,
Figure 112015033690933-pat00017
Figure 112015033690933-pat00018
는 두 영상간의 구조적 유사도 계산시 "0"으로 나눠지는 것을 예방하기 위한 상수이다.
본 발명의 일 실시예에 따른 영상 부호화 장치(100)는 매크로블록내의 기준값(즉, 픽셀값들의 중간값)을 기준으로 양자화 레벨을 결정하므로, 상술한 수 3의 첫번째 텀(first term)은 1이 된다.
이로 인해, 본 발명의 일 실시예에 따른 영상 부호화에 따른 SSIM은 수 4에 의해 계산될 수 있다.
Figure 112013098125227-pat00019
본 발명의 일 실시예에 따른 양자화 레벨은 하기에서 보다 상세히 설명하겠지만, 매크로블록내의 픽셀의 평균값을 기준값으로 하여 양자화 레벨이 결정된다.
이에, 수 4에 양자화 레벨 수식을 대입하면 수 5와 같이 표현될 수 있다.
Figure 112013098125227-pat00020
여기서, ki는 i번째 픽셀에 할당되는 바이너리의 인덱스(이산값)을 나타내고, xi는 i번째 픽셀의 픽셀값을 나타내며,
Figure 112013098125227-pat00021
는 매크로블록내의 픽셀들의 평균값을 나타내고,
Figure 112013098125227-pat00022
는 매크로블록내의 픽셀들의 분산을 나타내고, N은 매크로블록내의 픽셀 개수를 나타낸다.
따라서, 영상 부호화 장치(100)는 영상의 구조적 유사도가 최대가 될 수 있도록 하기 수 6을 이용하여 양자화 스텝 사이즈를 결정할 수 있다.
Figure 112013098125227-pat00023
단계 120에서 영상 부호화 장치(100)는 DWT 변환된 프레임의 매크로블록내의 기준값을 기반으로 결정된 양자화 스텝 사이즈를 반영하여 양자화 레벨을 결정한다. 여기서, 기준값은 매크로블록내의 픽셀값들의 중간값을 나타낸다.
예를 들어, 영상 부호화 장치(100)는 수 7을 이용하여 양자화 레벨을 결정할 수 있다.
Figure 112013098125227-pat00024
여기서,
Figure 112013098125227-pat00025
는 매크로블록내 픽셀값들의 중간값을 나타내고,
Figure 112013098125227-pat00026
는 픽셀값들의 분포를 균등하게 분할했을 때 가장 빈도수가 많은 바이너리의 인덱스를 나타내며,
Figure 112013098125227-pat00027
는 양자화 스텝 사이즈를 나타낸다.
도 3에는 종래의 적응적 양자화 방법과 본 발명의 일 실시예에 따른 양자화 레벨을 비교한 그래프이다.
종래의 적응적 양자화 방법(AQC)의 경우 최소값과 최대값을 균등하게 분할하여 양자화 스텝 사이즈를 결정하고, 최소값으로부터 양자화 레벨을 결정하여 도 3에 도시된 바와 같이, 픽셀값들이 한곳에 몰려있고 상이한 픽셀이 먼 곳에 있을 때 매우 비효율적인 단점이 있다.
본 발명의 일 실시예에 따른 양자화 레벨은 픽셀의 최소값이 아닌 중간값을 기준값으로 하여 양자화 레벨을 결정하므로, 픽셀 분포를 고려하여 효율적으로 양자화 레벨이 결정되는 것을 알 수 있다.
양자화 레벨이 결정되면, i번째 픽셀값의 양자화된 코드는 하기 수 8을 이용하여 계산될 수 있다. 하기 수 8은 3비트를 이용하여 양자화 레벨이 8인 경우를 가정한 경우의 양자화 바이너리(코드)를 나타낸 것이다.
Figure 112013098125227-pat00028
단계 125에서 영상 부호화 장치(100)는 결정된 양자화 레벨에 따라 매크로블록내의 픽셀값을 양자화하여 부호화한다.
도 4는 본 발명의 일 실시예에 따른 영상 부호화 장치의 내부 구성을 개략적으로 도시한 블록도이고, 도 5는 본 발명의 일 실시예에 따른 부호화부의 내부 구성을 나타낸 블록도이다.
도 4를 참조하면, 본 발명의 일 실시예에 따른 영상 부호화 장치(100)는 변환부(410) 및 부호화부(420)를 포함하여 구성된다.
변환부(410)는 영상을 입력받고, 입력된 영상을 이산 웨이블릿 트랜스폼(DWT: discrete wavelet transform, 이하 DWT라 칭하기로 함)을 수행하기 위한 수단이다. 변환부(410)는 입력받은 영상에 대해 프레임 단위로 DWT를 수행할 수 있다. 이미 전술한 바와 같이, DWT 변환된 프레임의 LL 영역에 가장 많은 정보가 있음을 알 수 있다. 그리고, LH, HL 및 HH 영역에는 영상에 대한 정보가 크게 줄어들어 대부분 0에 가까운 값을 갖는 것을 알 수 있다.
이에 따라, 부호화부(420)는 변환부(410)에 의해 DWT 변환된 각 프레임의 각 영역의 특성을 이용하여 적응적으로 부호화할 수 있다.
도 5에는 부호화부(420)의 세부 구성이 개략적으로 도시되어 있다. 도 5를 참조하면, 부호화부(420)는 부호화 유닛(510), 계산부(515) 및 모드 선택부(520)를 포함한다.
부호화 유닛(510)은 미리 정해진 부호화 방식에 따라 DWT 변환된 프레임을 부호화기 위한 수단이다. 도 5에 도시된 바와 같이, 부호화 유닛(510)은 각각 상이한 복수의 부호화 유닛을 각각 포함한다.
복수의 부호화 유닛 중 어느 하나는 스킵 부호화 유닛이고, 다른 하나는 평균값 매핑 부호화 유닛이며, 또 다른 하나는 구조적 유사도 기반 적응적 양자화 부호화 유닛(SAQC: SSIM based adaptive quantization coding, 이하 SAQC라 칭하기로 함)이다.
스킵 부호화 유닛은 매크로블록내 모든 픽셀의 값을 "0"으로 매핑하여 부호화하는 것으로 압축율이 매우 높으나, 화질 열화가 가장 심한 단점이 잇다.
평균값 매핑 부호화 유닛(mean mapping)은 매크로블록내의 모든 픽셀을 평균값으로 매핑하는 것으로, 평균값 매핑 모드 또한 압축율이 높은 이점이 있다.
스킵 부호화 및 평균값 매핑은 DWT 변환된 프레임의 각 영역에서 LH, HL 및 HH 영역과 같이 고주파 성분이 많은 영역에서 시각적 화질 열화를 최소화하며 높은 압축율을 보일 수 있다.
SAQC는 구조적 유사도에 기반하여 매크로블록을 픽셀 분포를 고려한 양자화 스텝 사이즈 및 양자화 레벨에 따라 매크로블록을 부호화하기 위한 수단이다.
SAQC는 DWT 변환된 프레임의 각 영역에서 가장 많은 영상 정보를 가지고 있는 LL 영역의 경우 시각적 화질 열화를 최소화하여 효과적인 압축 효율을 얻을 수 있는 이점이 있다.
상이한 복수의 부호화 유닛(510)은 병렬로 동작될 수 있다.
계산부(515)는 각 부호화 유닛(510)에 따른 부호화에 결과에 따라 구조적 유사도(SSIM)을 각각 계산하기 위한 수단이다.
구조적 유사도(SSIM)에 대해서는 이미 전술한 바와 동일하므로 중복되는 설명은 생략하기로 한다.
모드 선택부(520)는 계산부(515)에 의해 계산된 구조적 유사도가 최적인 부호화를 해당 매크로블록의 부호화 방식으로 선택하기 위한 수단이다.
예를 들어, 모드 선택부(520)는 DWT 변환된 프레임의 각 영역의 첫번째 프레임을 대상으로 구조적 유사도가 최적인 부호화 방식을 선택한 후 해당 영역 전체에 대해 동일한 부호화 유닛에 의해 부호화 되도록 제어할 수도 있다.
도 6은 본 발명의 일 실시예에 따른 SAQC의 부호화 유닛의 구성을 개략적으로 도시한 블록도이다.
도 6을 참조하면, 본 발명의 일 실시예에 따른 SAQC의 부호화 유닛은 양자화 스텝 사이즈 결정부(610), 양자화 레벨 결정부(615) 및 양자화부(620)를 포함하여 구성된다.
양자화 스텝 사이즈 결정부(610)는 영상의 구조적 유사도(SSIM)가 최대가 되도록 양자화 스텝 사이즈를 결정하기 위한 수단이다. 이는 이미 도 1에서 설명한 바와 동일하므로 중복되는 설명은 생략하기로 한다.
양자화 레벨 결정부(615)는 매크로블록내의 픽셀값들의 중간값을 기준값으로 결정된 양자화 스텝 사이즈를 반영하여 양자화 레벨을 결정하기 위한 수단이다. 양자화 레벨 결정부(615)는 매크로블록내의 픽셀값들의 중간값을 기준값으로 양자화 스텝 사이즈를 반영하여 결정되므로, 픽셀 분포를 고려하여 양자화 레벨을 결정할 수 있는 이점이 있다.
양자화부(620)는 결정된 양자화 레벨에 따라 상기 매크로블록내의 픽셀을 양자화하여 부호화하기 위한 수단이다.
한편, 본 발명의 실시예에 따른 영상 부호화 방법은 다양한 전자적으로 정보를 처리하는 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 저장 매체에 기록될 수 있다. 저장 매체는 프로그램 명령, 데이터 파일, 데이터 구조등을 단독으로 또는 조합하여 포함할 수 있다.
저장 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 소프트웨어 분야 당업자에게 공지되어 사용 가능한 것일 수도 있다. 저장 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 전자적으로 정보를 처리하는 장치, 예를 들어, 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
410: DWT(discrete wavelet transform)
420: 부호화부

Claims (14)

  1. 원영상과 변환된 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정하는 양자화 스텝 사이즈 결정부-상기 구조적 유사도는 SSIM(Structural similarity)를 이용하여 도출됨;
    상기 변환된 영상의 매크로블록내 기준값을 기준으로 상기 결정된 양자화 스텝 사이즈를 반영하여 상기 매크로블록내의 픽셀에 대한 양자화 레벨을 결정하는 양자화 레벨 결정부; 및
    상기 결정된 양자화 레벨에 따라 상기 매크로블록내의 픽셀을 양자화하여 부호화하는 부호화부를 포함하는 영상 부호화 장치.
  2. 제1 항에 있어서,
    상기 기준값은 상기 매크로블록내에 포함된 픽셀값들의 중간값인 것을 특징으로 하는 영상 부호화 장치.
  3. 삭제
  4. 삭제
  5. 제1 항에 있어서,
    상기 레벨 결정부는 하기 수식을 이용하여 양자화 레벨을 결정하는 것을 특징으로 하는 영상 부호화 장치.
    Figure 112015033690933-pat00033

    여기서,
    Figure 112015033690933-pat00034
    는 상기 기준값을 나타내고, 상기
    Figure 112015033690933-pat00035
    는 픽셀값들의 분포를 균등하게 분할했을 때 가장 빈도수가 많은 바이너리의 인덱스를 나타내고,
    Figure 112015033690933-pat00036
    는 양자화 스텝 사이즈를 나타냄.
  6. 제1 항에 있어서,
    상기 영상을 프레임 단위로 이산 웨이블릿 트랜스폼 변환을 수행하는 변환부를 더 포함하되,
    상기 양자화 스텝 사이즈 및 상기 양자화 레벨은 상기 변환된 영상을 이용하여 결정되는 것을 특징으로 하는 영상 부호화 장치.
  7. 원 영상과 변환된 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정하는 단계-상기 구조적 유사도는 SSIM(Structural similarity)를 이용하여 도출됨;
    상기 변환된 영상의 매크로블록내 기준값을 기준으로 상기 결정된 양자화 스텝 사이즈를 반영하여 상기 매크로블록내의 픽셀에 대한 양자화 레벨을 결정하는 단계; 및
    상기 결정된 양자화 레벨에 따라 상기 매크로블록내의 픽셀을 양자화하여 부호화하는 단계를 포함하는 영상 처리 방법.
  8. 입력 영상을 이산 웨이블릿 트랜스폼 변환하는 변환부; 및
    상기 변환된 영상을 매크로블록 단위로 상이한 복수의 부호화 방식으로 각각 부호화하여 상기 입력 영상과 상기 변환된 영상의 구조적 유사도가 최대가 되는 부호화 방식으로 부호화하는 부호화부를 포함하되,
    상기 구조적 유사도는 SSIM(Structural similarity)를 이용하여 도출되는 것을 특징으로 하는 영상 부호화 장치.
  9. 제8 항에 있어서,
    상기 복수의 부호화 방식은 스킵 모드, 평균값 매핑 모드 및 구조적 유사도 기반 양자화 모드를 포함하는 것을 특징으로 하는 영상 부호화 장치.
  10. 제9 항에 있어서,
    상기 구조적 유사도 기반 양자화 모드는 상기 입력 영상과 상기 변환된 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정한 후 상기 변환된 영상의 매크로블록내 기준값을 기준으로 상기 결정된 양자화 스텝 사이즈를 반영하여 상기 매크로블록내의 픽셀에 대한 양자화 레벨을 결정하여 양자화하는 방식인 것을 특징으로 하는 영상 부호화 장치.
  11. 제10 항에 있어서,
    상기 기준값은 상기 매크로블록내의 중간값인 것을 특징으로 하는 영상 부호화 장치.
  12. 제8 항에 있어서,
    상기 복수의 부호화 방식은 병렬적으로 수행되는 것을 특징으로 하는 영상 부호화 장치.
  13. 삭제
  14. 제7 항의 방법을 수행하기 위한 프로그램을 기록한 기록매체.
KR1020130129280A 2013-10-29 2013-10-29 영상 부호화 방법 및 그 장치 KR101574391B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130129280A KR101574391B1 (ko) 2013-10-29 2013-10-29 영상 부호화 방법 및 그 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130129280A KR101574391B1 (ko) 2013-10-29 2013-10-29 영상 부호화 방법 및 그 장치

Publications (2)

Publication Number Publication Date
KR20150050635A KR20150050635A (ko) 2015-05-11
KR101574391B1 true KR101574391B1 (ko) 2015-12-08

Family

ID=53388328

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130129280A KR101574391B1 (ko) 2013-10-29 2013-10-29 영상 부호화 방법 및 그 장치

Country Status (1)

Country Link
KR (1) KR101574391B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102658314B1 (ko) * 2016-08-31 2024-04-16 엘지디스플레이 주식회사 데이터 클리핑 장치 및 이를 포함하는 표시 장치

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009206567A (ja) 2008-02-26 2009-09-10 Kyocera Mita Corp 画像処理装置
JP2012114786A (ja) 2010-11-26 2012-06-14 Kyocera Document Solutions Inc 画像処理装置、画像処理方法、及び画像処理プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009206567A (ja) 2008-02-26 2009-09-10 Kyocera Mita Corp 画像処理装置
JP2012114786A (ja) 2010-11-26 2012-06-14 Kyocera Document Solutions Inc 画像処理装置、画像処理方法、及び画像処理プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Discrete wavelet transform-based structural similarity for image quality assessment, Chun-Ling Yang et al, ICIP 2008, pp.377-380.

Also Published As

Publication number Publication date
KR20150050635A (ko) 2015-05-11

Similar Documents

Publication Publication Date Title
US9547886B2 (en) Method and apparatus for performing interpolation based on transform and inverse transform
JP5027936B2 (ja) 適応スキャン順序付けのための方法、記録媒体、プログラム、及び処理装置。
US10003792B2 (en) Video encoder for images
RU2559738C2 (ru) Способ и устройство для кодирования/декодирования вектора движения
US8224100B2 (en) Method and device for intra prediction coding and decoding of image
RU2597484C2 (ru) Способ и устройство кодирования и декодирования изображения с использованием внутрикадрового предсказания
US8767823B2 (en) Method and apparatus for frame memory compression
US20140307780A1 (en) Method for Video Coding Using Blocks Partitioned According to Edge Orientations
US20060126955A1 (en) Spatial extrapolation of pixel values in intraframe video coding and decoding
US9538173B2 (en) Method and apparatus for encoding/decoding image by using adaptive loop filter on frequency domain using conversion
KR20110135787A (ko) 엣지-적응 변환을 이용한 영상 부호화/복호화 시스템 및 방법
JP2013524679A (ja) 適応的係数スキャン順序を利用した映像の符号化方法、復号化方法及びその装置
CN103891278A (zh) 图像编码以及解码方法、装置、程序
JP2008167449A (ja) 映像の符号化、復号化方法及び装置
TW202032995A (zh) 圖像編碼及解碼技術
US6999628B2 (en) Tarp filter
KR101574391B1 (ko) 영상 부호화 방법 및 그 장치
US8811474B2 (en) Encoder and encoding method using coded block pattern estimation
US8139880B2 (en) Lifting-based directional lapped transforms
US20210377523A1 (en) Encoding device, encoding method, decoding device, and decoding method
KR20150096353A (ko) 이미지 인코딩 시스템, 디코딩 시스템 및 그 제공방법
KR101583870B1 (ko) 이미지 인코딩 시스템, 디코딩 시스템 및 그 제공방법
JP7393819B2 (ja) 画像処理システム、符号化装置、復号装置、画像処理方法、画像処理プログラム、符号化方法、符号化プログラム、復号方法、及び復号プログラム
JP5412901B2 (ja) 復号化装置、画像処理装置、復号化方法及びプログラム
KR101525325B1 (ko) 인트라 예측 모드 결정 방법 및 그 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
FPAY Annual fee payment

Payment date: 20181126

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20191126

Year of fee payment: 5