KR100846870B1 - 다수의 기본 블록들의 다차원 구성을 통한 다단계 변환장치 및 그 방법 - Google Patents

다수의 기본 블록들의 다차원 구성을 통한 다단계 변환장치 및 그 방법 Download PDF

Info

Publication number
KR100846870B1
KR100846870B1 KR1020060095786A KR20060095786A KR100846870B1 KR 100846870 B1 KR100846870 B1 KR 100846870B1 KR 1020060095786 A KR1020060095786 A KR 1020060095786A KR 20060095786 A KR20060095786 A KR 20060095786A KR 100846870 B1 KR100846870 B1 KR 100846870B1
Authority
KR
South Korea
Prior art keywords
blocks
dimensional
dct
transform
image data
Prior art date
Application number
KR1020060095786A
Other languages
English (en)
Other versions
KR20080005043A (ko
Inventor
정세윤
최해철
서정일
백승권
장인선
김재곤
문경애
장대영
홍진우
김진웅
안창범
오승준
심동규
박호종
이영렬
전수열
Original Assignee
한국전자통신연구원
광운대학교 산학협력단
세종대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원, 광운대학교 산학협력단, 세종대학교산학협력단 filed Critical 한국전자통신연구원
Priority to PCT/KR2007/000927 priority Critical patent/WO2008004742A1/en
Priority to US12/307,408 priority patent/US8582657B2/en
Publication of KR20080005043A publication Critical patent/KR20080005043A/ko
Application granted granted Critical
Publication of KR100846870B1 publication Critical patent/KR100846870B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 다수의 기본 블록들의 다차원 구성을 통한 다단계 변환 장치 및 그 방법에 관한 것이다. 본 발명은 블록 단위의 원영상 또는 차영상의 DCT 변환계수를 사용하는 비디오 데이터 압축의 성능을 향상시키기 위하여 인접한 블록들의 변환 계수들을 모아서 추가적인 변환을 수행함으로써, 압축 효율을 향상시키기 위한, 다수의 기본 블록들의 다차원 구성을 통한 다단계 변환 장치 및 그 방법을 제공하는데 그 목적이 있다.
본 발명은 입력되는 영상데이터를 DCT 변환하고, 상기 DCT 변환된 소정크기의 블록 R개(R은 2이상의 자연수)를 선택하는 단계; 상기 선택된 R개의 각 블록에서 동일한 주파수의 변환계수들을 1차원으로 배열하는 단계; 및 상기 1차원으로 배열된 변환계수들을 다시 일차원 변환하는 단계;를 포함하는 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 방법을 개시한다.
다차원 변환, 다단계 변환, 다차원 구성, 이차원 변환

Description

다수의 기본 블록들의 다차원 구성을 통한 다단계 변환 장치 및 그 방법{Apparatus and method of multi-stage, multi-dimensional transform based on multiple unit blocks}
도 1 은 본 발명이 적용되는 영상부호화 장치의 개략적인 구성도,
도 2 는 본 발명의 일실시예에 따라 이차원으로 변환된 P x Q 블록들을 R 개 선택하여 각각의 주파수 별로 다시 일차원 (R)으로 배열하여 일차원 변환 과정을 보여주는 도면,
도 3 은 도 2의 배열을 위하여 R 개의 블록을 선택하는 예를 보여주는 도면,
도 4 는 본 발명의 일실시예에 따라 이차원으로 변환된 P x Q 블록들을 U x V 개 선택하여 각각의 주파수 별로 다시 이차원 (U x V)으로 배열하여 이차원 변환하는 과정을 보여주는 도면,
도 5 는 본 발명의 일실시예 따라 사차원으로 변환된 P x Q 개의 U x V 블록들을 선택하여 이차원 역변환(U x V)을 적용하여 얻어진 주파수 데이터를 다시 이차원 (P x Q)으로 재배열하는 과정을 보여주는 도면,
도 6은 에너지 압축 효율을 살펴보기 위하여 'Foreman' 이라는 비디오 시퀀스에 대하여 기존의 방식(2-D)과 제안한 발명의 실시 예 (3-D, 4-D)를 적용한 DCT 계수들의 정규화된 분산에 대한 설명도이다.
본 발명은 다수의 기본 블록들의 다차원 구성을 통한 다단계 변환 장치 및 그 방법에 관한 것으로, 보다 상세하게는 작은 블록 크기를 사용하여 움직임 추정의 효율을 높이는 한편, 작은 블록 크기에 따라 상대적으로 취약한 공간 상관도를 효과적으로 활용하기 위하여 블록 단위의 변환된 계수들을 주파수 별로 정의된 형태로 배열하여 추가적인 다차원 변환을 적용함으로써 공간주파수의 활용도를 높일 수 있는, 다수의 기본 블록들의 다차원 구성을 통한 다단계 변환 장치 및 그 방법에 관한 것이다.
종래의 비디오 데이터를 압축하는 인코딩 및 디코딩에 있어서, 소정 크기의 블록에 대한 인트라 예측이나 움직임 추정 수행 후, 원 영상 또는 차분 영상을 효과적으로 인코딩하기 위하여 DCT 변환을 적용하는데, 이때 블록의 크기가 작아지면 움직임 추정은 용이하나, 공간 상관도의 활용은 줄어들며, 블록의 크기가 커지면 공간 상관도는 잘 활용할 수 있으나, 상대적으로 움직임 추정에 에러가 커진다는 문제점이 있다.
본 발명은 상기 문제점을 해결하기 위하여 제안된 것으로, 블록 단위의 원영상 또는 차영상의 DCT 변환계수를 사용하는 비디오 데이터 압축의 성능을 향상시키기 위하여 인접한 블록들의 변환 계수들을 모아서 추가적인 변환을 수행함으로써, 압축 효율을 향상시키기 위한, 다수의 기본 블록들의 다차원 구성을 통한 다단계 변환 장치 및 그 방법을 제공하는데 그 목적이 있다.
본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
상기 목적을 달성하기 위한 본 발명은, 입력되는 영상데이터를 DCT 변환하고, 상기 DCT 변환된 소정크기의 블록 R개(R은 2이상의 자연수)를 선택하는 단계; 상기 선택된 R개의 각 블록에서 동일한 주파수의 변환계수들을 1차원으로 배열하는 단계; 및 상기 1차원으로 배열된 변환계수들을 다시 일차원 변환하는 단계;를 포함하는 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 방법을 개신한다.
또한, 본 발명은 입력되는 영상데이터를 DCT 변환하고, 상기 DCT 변환된 소정크기의 블록 U×V개(U, V는 2이상의 자연수)를 선택하는 단계; 상기 선택된 U×V 개의 각 블록에서 동일한 주파수의 변환계수들을 2차원으로 배열하는 단계; 및 상기 2차원으로 배열된 변환계수들을 다시 이차원 변환하는 단계;를 포함하는 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 방법을 개시한다.
본 발명에 따른 장치는, 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 장치로서, 입력되는 영상데이터를 DCT 변환하고, 상기 DCT 변환된 소정크기의 블록 R개(R은 2이상의 자연수)를 선택하는 블록선택수단; 상기 선택된 R개의 각 블록에서 동일한 주파수의 변환계수들을 1차원으로 배열하는 변환계수 배열수단; 및 상기 1차원으로 배열된 변환계수들을 다시 일차원 변환하는 변환수단;을 포함한다.
또한 본 발명에 따른 장치는, 입력되는 영상데이터를 DCT 변환하고, 상기 DCT 변환된 소정크기의 블록 U×V개(U, V는 2이상의 자연수)를 선택하는 블록선택수단; 상기 선택된 U×V개의 각 블록에서 동일한 주파수의 변환계수들을 2차원으로 배열하는 변환계수 배열수단; 및 상기 2차원으로 배열된 변환계수들을 다시 이차원 변환하는 변환수단;을 포함한다.
본 발명에 따라 다단계 변환된 영상데이터는, 역변환을 적용하여 2차원으로 배열된 동일한 주파수의 변환계수들을 획득하는 단계; 상기 2차원으로 배열된 동일한 주파수의 변환계수들을 재배열하는 단계; 및 상기 재배열된 데이터에 다시 역변환을 수행하는 단계를 통해 복원된다.
본 발명은, 영상 데이터를 부호화하는 인코더에서, 원영상 또는 차영상의 P x Q 블록에 대한 변환 방법에서, 다수의 P x Q 블록을 다차원으로 재구성하여 다차원 변환을 수행하는 방법과 그 장치를 제안하였다.
또한, 본 발명은, P x Q 블록의 크기가 작아지면 움직임 보정이 용이해져 차영상의 에러가 줄어드는 반면, 공간 상관도의 활용은 떨어지는 면이 있다. 본 발명은 작은 P x Q 블록을 사용하여 움직임 보정의 효율을 높이는 반면, 공간 상관도의 활용을 높이기 위하여 다수의 P x Q 블록을 다차원으로 재구성하여 다차원 변환을 수행하는 방법을 제시하였다. 다차원 변환을 이용한 결과 기존의 이차원 압축에 비하여 에너지 압축 성능에 개선이 있음을 확인하였다.
본 발명은 비디오 데이터를 압축하는 인코딩 및 디코딩에 관한 것으로, 소정 크기의 블록에 대한 인트라 예측이나 움직임 추정 수행 후, 원 영상 또는 차분 영상을 효과적으로 인코딩하기 위하여 DCT 변환을 적용한다. 이때. 블록의 크기가 작아지면 움직임 추정은 용이하나, 공간 상관도의 활용은 줄어들며, 블록의 크기가 커지면 공간 상관도는 잘 활용할 수 있으나, 상대적으로 움직임 추정에 에러가 커진다. 본 발명은 이러한 문제를 해결하여 코딩의 효율을 높이기 위한 것으로, 작은 블록 크기를 사용하여 움직임 추정의 효율을 높이는 한편, 작은 블록 크기에 따라 상대적으로 취약한 공간 상관도를 효과적으로 활용하기 위하여 블록 단위의 변환된 계수들을 주파수 별로 정의된 형태로 배열하여 추가적인 다차원 변환을 적용함으로써 공간주파수의 활용도를 높이는 방법과 그 장치에 관한 것이다.
비디오 압축은 멀티미디어 응용의 핵심 요소 기술이다. 비디오 신호는 공간과 시간 축에서 많은 중복된 정보를 가지고 있는데, 비디오 압축은 이러한 신호의 중복성을 제거함으로써 정보의 손실없이 압축을 이룰 수 있다. 비디오 압축을 위해서는 세계 표준화 기구에 의해 제정된 H.264 또는 MPEG-4 AVC 등의 권고안들이 광범위하게 사용되고 있다.
동영상 데이터의 인코딩 및 디코딩을 위하여 마련된 H.264 표준에 따르면, 대부분의 영상부호화는 소정 크기의 블록 단위로 이루어진다. 공간적 중복성을 제거하는 인트라 예측, 또는 시간적 중복성을 제거하는 움직임 예측을 거친 후 원래 영상과 예측 영상간의 차이를 DCT 변환한다. 움직임 예측의 효율성을 향상시키기 위하여 블록 크기가 줄어들 경우 (예를 들면 4x4) 인접한 블록 간의 DCT 계수들 사이에도 상관도가 존재하게 된다. 본 발명은 인접한 블록들의 DCT 계수들을 재배열하여 추가적인 DCT 변환을 적용하여 공간 상관도를 추가적으로 제거하는 방법을 제안하였다. 제안된 다차원 다단계 변환 방법을 통하여 변환 계수의 에너지 압축 효율을 높임으로써 코딩의 압축률 향상을 얻을 수 있다.
본 발명은 블록 단위의 원영상 또는 차영상의 DCT 변환계수를 사용하는 비디오 데이터 압축의 성능을 향상시키기 위하여 인접한 블록들의 변환 계수들을 모아서 추가적인 변환을 수행함으로써 압축 효율을 향상시키고자하는 것이다. 특히 움직임 추정의 효율 향상을 위하여 블록의 크기가 작을 때 인접한 블록 간에 잔류 상관도가 높아 제안된 발명에 의한 에너지 압축 효과가 높아진다.
본 발명은, 다차원, 다단계 변환방식을 사용함으로써 종래의 이차원 변환방 식에 비하여 에너지 압축 효율을 높이고, 이를 채용한 코딩 방식의 성능을 향상시킬 수 있다. 오늘날 대부분의 국제표준에서 채택하고 있는 변환 기반의 코딩방법은 움직임 추정, 변환 및 양자화, 엔트로피 코딩으로 구성되어 있는데 작은 크기의 블록을 사용하여 움직임 추정을 정확히 하고, 본 발명에서 제안하는 다차원 다단계 변환기법을 사용하여 공간 상관도를 효과적으로 제거하면 인코딩할 신호는 시간적 공간적 상관도가 거의 제거된 랜덤한 신호에 가깝게 된다. 따라서, 전체 코딩의 성능은 변환방식의 성능에 의하여 결정된다. 추가적으로, 다차원 다단계 변환 방식으로 공간 상관도를 효과적으로 활용함으로써, 코딩 알고리즘이 간단해지고, 엔트로피 코딩에서 공간상관도를 활용하기 위한 컨텍스트가 단순해지는 잇점도 있다.
상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.
도 1 은 본 밞명이 적용되는 영상부호화 장치의 개략적인 구성도이다.
도 1에 도시된 바와 같이, 입력되는 현재프레임으로부터 소정크기 (예를 들어 4x4)의 블록에 대해서 부호화 하기위해 인트라 예측부(100) 또는 움직임 보상 부(110)를 통하여 차분 영상(120)을 생성한다. 이 차분 영상은 이차원 변환과 양자기(130)를 거친 후 엔트로피 코딩(140)을 거쳐 전송된다. 양자기를 거친 변환계수는 역양자기와 역변환(150)을 거치면 수신단에서 얻어지는 영상이 재구성되며, 이것을 움직임 예측부에서 사용한다. 본 발명은 도 1의 변환(130) 및 역변환부(150)에 관한 것으로, 기존의 2차원 변환방식의 효율성을 높이기 위한 다차원, 다단계 변환방식을 제안한다. 상기 변환부(130)의 동작은 2차원 변환(1단계 변환)후 동일한 주파수 별로 배열한 후 추가적인 변환(2단계 변환)을 적용한다. 상기 역변환부(150)에서는 2단계에 대한 역변환 후, 블록을 재배치하여 다시 1단계에 대한 역변환을 수행한다.
도 2는 도 1의 변환부의 구성을 보여주는 도면이다.
도 2를 참조하면, 변환부(150)는 이차원 변환된 영상데이터에서 소정 크기의 블록을 선택하는 블록선택부(151), 소정 방법에 따라 동일한 주파수를 갖는 변환계수를 배열하는 변환계수 배열부(153), 상기 배열된 변환계수들을 다시 변환하는 변환부(155)를 포함하여 구성된다.
도 3은 2차원으로 변환된 P x Q 블록(1단계 변환)을 R 개 선택하여 각 블록에서 동일한 주파수를 선택하여 1차원으로 배열한 후, 일차원 변환 (R-point)을 수행하는 방법을 보여준다(편의상 3-D DCT로 명명).
도 3을 참조하면, 먼저, 블록선택부(151)는 입력되는 영상데이터를 DCT 변환 하고, 상기 DCT 변환된 소정크기의 블록 R개(R은 2이상의 자연수)를 선택한다. 다음에 변환계수 배열부(153)는 상기 선택된 R개의 각 블록에서 동일한 주파수의 변환계수들을 1차원으로 배열한다. 그 다음에 변환부(155)는 상기 1차원으로 배열된 변환계수들을 다시 일차원 변환하여 3차원 DCT를 수행한다. 도 3에서 변환 계수 a는 P x Q 블록의 (0, 0) 위치에 해당하는 dc를 나타내며, R 개의 P x Q 블록에서 얻은 dc 들을 일렬로 배치한 후 다시 일차원 변환을 적용하게 된다.
도 4는 상기 도 2에서 기술한 R 개의 블록을 선택하는 방법을 나타낸 예로써, 가로방향, 세로방향, 또는 인접한 사각형에서 선택하는 예를 나타낸다.
도 5는 기존의 2차원으로 변환된 P x Q 블록(1단계 변환)을 U x V 선택하여 각각의 블록에서 동일한 주파수들을 선택하여 U x V 의 2차원 형태로 배열한 후, 다시 이차원 변환 (U x V)하는 과정을 보여준다(편의상 4-D DCT로 명명).
도 5를 참조하면, 먼저, 블록선택부(151)는 입력되는 영상데이터를 DCT 변환하고, 상기 DCT 변환된 소정크기의 블록 U×V개(U, V는 2이상의 자연수)를 선택한다. 다음에 변환계수 배열부(153)는 상기 선택된 U×V개의 각 블록에서 동일한 주파수의 변환계수들을 2차원으로 배열한다. 그 다음에 변환부(155)는 상기 2차원으로 배열된 변환계수들을 다시 이차원 변환하여 4차원 DCT를 수행한다.
상기 도 3과 도 5를 통해 설명한 바와 같이, 본 발명에서 다차원 변환은 1단 계에서 2차원 변환을 적용한 후, 주파수 별로 재배열 과정을 거친 다음, 2단계에서 1차원 혹은 더 높은 차원의 변환을 수행함으로써 궁극적으로 3차원 이상의 변환을 실현하는 것을 의미한다. 다단계 변환은 다차원 변환을 구현하는 방법으로, 여러 단계의 2차원 또는 1차원 변환을 결합하여 다차원 변환을 실현하는 방법이다. P × Q 블록의 크기가 상대적으로 작을 경우, 인접한 블록들에서 동일한 주파수 성분들은 서로 비슷한 값을 가질 확률이 높아진다. 따라서 인접한 블록들의 변환 계수들을 동일한 주파수 별로 배열하여 추가적인 변환을 적용함으로써 압축 성능을 향상시킨다.
도 6은 본 발명의 일실시예 따라 다수의 기본블록들의 다차원 구성을 통한 다단계 변환된 영상의 복원 방법을 설명하기 위한 도면이다.
다단계 변환된 영상의 복원은 상기 도 3 또는 도 5에서 설명한 과정의 역으로 수행된다. 즉, 도 6에서 인코딩된 데이터(도 5의 왼쪽 상단)에 수학적으로 정의된 U × V 역변환을 적용하여 도 6의 왼쪽 하단에 보인 P × Q 개의 주파수 별 데이터를 얻는다. 주파수 데이터를 인코더(변환부)에서 배열한 방법의 역으로 인접한 블록들에 배치하여 도 6의 오른쪽에 보인 U x V 개의 P x Q 블록을 얻는다. 재배치된 데이터에 다시 이차원 역변환(P x Q)을 적용하면 복원영상이 얻어진다.
도 7은 상기 도 2 내지 도 5를 통해 설명한 다차원, 다단계 변환 방식으로 얻어지는 변환 계수들의 에너지 압축 효율을 기존의 2차원 변환 계수들의 압축효율 과 비교하여 나타낸 그래프이다. 이를 위하여 도 6의 가로축은 ac 주파수를 log 스케일로 나타내었고, 세로축은 'Foreman'이라는 비디오 시퀀스에 대하여 각 변환 계수들의 분산값을 정규화시켜 나타내었다. 도 7에서 모든 차원의 변환 크기들을 4로 하여 실시 예를 보였다(P = Q = U = V = R = 4).
도 7에서 서로 다른 차원의 변환 계수들의 특성을 직접적으로 비교하기는 용이하지 않기 때문에 코딩 효율 관점에서 비교하였다. 즉, 4-D DCT의 경우 P x Q 블록을 U ×V 개 모아서 코딩하는 반면, 3-D DCT의 경우는 P × Q 블록을 U 개 모아서 코딩을 하고, 기존의 이차원 변환은 1개의 P ×Q 블록을 코딩한다. 따라서 동일한 크기의 비디오 데이터를 전송하기 위하여 4-D DCT의 경우 P×Q×U×V 개의 변환계수를 1회 코딩할 때, 3-D DCT는 P×Q×U 개의 계수를 V회 반복하여 코딩하며, 2-D DCT의 경우는 PxQ 개의 계수를 UxV회 반복하여 코딩하게 된다. 따라서, 도 5는 반복적인 코딩을 고려하여 P × Q ×U × V 블록의 코딩 계수들의 정규화된 분산을 나타내었다. 도 5에서 2-D 및 3-D 의 그래프에서 구간적으로 평탄한 것은 반복적인 코딩의 통계적 특성이 동일하기 때문이다.
도 7에서 에너지 압축 효율이 높을수록 그래프는 아래쪽으로 이동하게 된다. 도 5에서 보면 본 발명에서 제안한 4-D DCT와 3-D DCT가 기존의 2-D DCT에 비하여 에너지 압축 효율이 뛰어남을 알 수 있다.
이하, 실시 예를 통해 성능향상 결과를 보다 상세하게 살펴보기로 한다.
H.264에서 실험영상으로 권고하는 영상을 이용하여 본 발명에서 제안하는 다차원 다단계 변환 방식의 에너지 압축 효율을 살펴보았다. H.264 코덱은 JM 9.4 Encoder Baseline Profile을 사용하였다. 각각의 주파수성분은 독립적이라고 가정하고 분산을 구하여 에너지 압축 효율 정도를 판단하였다. 하기의 [표 1]은 실험조건을 설명하기 위한 것이다.
Figure 112006071552347-pat00001
하기의 [표 2]는 각각의 비디오 시퀀스에 대하여 기존의 H.264의 이차원 변환방식(2-D)과 본 발명에서 제안된 다차원 다단계 방식(3-D, 4-D)을 적용하였을 때 정규화된 분산의 누적값이 전체의 90%, 95%, 99% 에 도달하는 주파수 성분을 나타내었다. 상대적으로 작은 주파수 성분들로 전체 에너지의 대부분을 나타낼 수 있다면 에너지 압축 효율이 높다고 볼 수 있다. 하기의 [표 2]에 나타나 있듯이, 본 발명에서 제안한 방식(3-D와 4-D)이 기존의 2-D 방식에 비하여 훨씬 작은 주파수 성분들로 전체에너지의 대부분을 포함하는 것을 알 수 있다. 예를 들면, 'Foreman'의 경우 전체 에너지의 90%를 나타내는데, 기존의 H.264에서 사용하고 있는 2-D 방식의 경우, 84개의 주파수 성분이 필요하나, 3-D의 경우 59개, 4-D의 경우 41개만 필요하다. 또한 전체 에너지의 95%를 나타내는데, 기존의 2-D 방식의 경우, 126개의 주파수 성분이 필요하나, 3-D의 경우 106개, 4-D의 경우 63개만 필요하다. 이러한 에너지 압축 성능은 전체 코딩의 압축 성능과 직결된다. 따라서 본 발명에서 제안하는 다차원 다단계 변환방식은 기존의 이차원 방식에 비하여 에너지 압축 효율이 월등히 뛰어남을 알 수 있으며, 이러한 변환 방식을 채택할 경우 기존의 코딩보다 상당한 성능 향상을 이룰 수 있다.
Figure 112006071552347-pat00002
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.
상기와 같은 본 발명은, 다차원, 다단계 변환방식을 사용함으로써 기존의 이차원 변환방식에 비하여 에너지 압축 효율을 높이고, 이를 채용한 코딩 방식의 성능을 향상시킬 수 있는 효과가 있다.
또한, 본 발명은, 다차원 다단계 변환기법을 사용하여 공간 상관도를 효과적으로 제거함으로써, 인코딩할 신호가 시간적 공간적 상관도가 거의 제거된 랜덤한 신호에 가깝게 될수 있는 효과가 있다.
또한, 본 발명은, 추가적으로 다차원 다단계 변환 방식으로 공간 상관도를 효과적으로 활용함으로써, 코딩 알고리즘이 간단해지고, 엔트로피 코딩에서 공간상관도를 활용하기 위한 컨텍스트가 단순해질 수 있는 효과가 있다.

Claims (12)

  1. 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 방법으로서,
    입력되는 영상데이터를 DCT 변환하고, 상기 DCT 변환된 영상 데이터에서 P×Q 블록(P와 Q는 2 이상의 자연수)을 R개(R은 2이상의 자연수) 선택하는 단계;
    상기 선택된 R개의 각 블록에서 동일한 주파수의 변환계수들을 1차원으로 배열하는 단계; 및
    상기 1차원으로 배열된 변환계수들을 다시 일차원 변환하는 단계;를 포함하는 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 방법.
  2. 제1항에 있어서, 상기 R개 블록은,
    상기 DCT 변환된 영상 데이터에서 가로방향으로 선택하는 것을 특징으로하는 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 방법.
  3. 제1항에 있어서, 상기 R개 블록은,
    상기 DCT 변환된 영상 데이터에서 세로방향으로 선택하는 것을 특징으로하는 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 방법.
  4. 제1항에 있어서, 상기 R개 블록은,
    상기 DCT 변환된 영상 데이터에서 대각선 방향으로 선택하는 것을 특징으로하는 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 방법.
  5. 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 방법으로서,
    입력되는 영상데이터를 DCT 변환하고, 상기 DCT 변환된 영상 데이터에서 P×Q 블록(P와 Q는 2 이상의 자연수)을 U×V개(U, V는 2이상의 자연수) 선택하는 단계;
    상기 선택된 U×V개의 각 블록에서 동일한 주파수의 변환계수들을 2차원으로 배열하는 단계; 및
    상기 2차원으로 배열된 변환계수들을 다시 이차원 변환하는 단계;를 포함하는 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 방법.
  6. 다수의 기본블록들의 다차원 구성을 통한 다단계 변환된 영상의 복원 방법으로서,
    다단계 변환된 영상데이터에 대하여 역변환을 적용하여, 2차원으로 배열된 동일한 주파수의 변환계수들을 획득하는 단계;
    상기 2차원으로 배열된 동일한 주파수의 변환계수들을 재배열하는 단계; 및
    상기 재배열된 변환계수에 대해 다시 역변환을 수행하는 단계를 포함하는 다단계 변환된 영상의 복원 방법.
  7. 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 장치로서,
    입력되는 영상데이터를 DCT 변환하고, 상기 DCT 변환된 영상 데이터에서 P×Q 블록(P와 Q는 2 이상의 자연수)을 R개(R은 2이상의 자연수) 선택하는 블록선택수단;
    상기 선택된 R개의 각 블록에서 동일한 주파수의 변환계수들을 1차원으로 배열하는 변환계수 배열수단; 및
    상기 1차원으로 배열된 변환계수들을 다시 일차원 변환하는 변환수단;을 포함하는 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 장치.
  8. 제7항에 있어서, 상기 블록선택수단은,
    상기 DCT 변환된 영상 데이터에서 가로방향으로 상기 R개 블록을 선택하는 것을 특징으로하는 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 장치.
  9. 제7항에 있어서, 상기 블록선택수단은,
    상기 DCT 변환된 영상 데이터에서 세로방향으로 상기 R개 블록을 선택하는 것을 특징으로하는 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 장치.
  10. 제7항에 있어서, 상기 블록선택수단은,
    상기 DCT 변환된 영상 데이터에서 대각선 방향으로 상기 R개 블록을 선택하는 것을 특징으로하는 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 장치.
  11. 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 장치로서,
    입력되는 영상데이터를 DCT 변환하고, 상기 DCT 변환된 영상 데이터에서 P×Q 블록(P와 Q는 2 이상의 자연수)을 U×V개(U, V는 2이상의 자연수) 선택하는 블록선택수단;
    상기 선택된 U×V개의 각 블록에서 동일한 주파수의 변환계수들을 2차원으로 배열하는 변환계수 배열수단; 및
    상기 2차원으로 배열된 변환계수들을 다시 이차원 변환하는 변환수단;을 포함하는 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 장치.
  12. 다수의 기본블록들의 다차원 구성을 통한 다단계 변환된 영상의 복원 장치로서,
    다단계 변환된 영상데이터에 대하여 역변환을 적용하여, 2차원으로 배열된 동일한 주파수의 변환계수들을 획득하는 변환계수 획득수단;
    상기 2차원으로 배열된 동일한 주파수의 변환계수들을 재배열하는 변환계수 재배열 수단; 및
    상기 재배열된 변환계수에 대해 다시 역변환을 수행하는 역변환수단;을 포함하는 다단계 변환된 영상의 복원 장치.
KR1020060095786A 2006-07-06 2006-09-29 다수의 기본 블록들의 다차원 구성을 통한 다단계 변환장치 및 그 방법 KR100846870B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/KR2007/000927 WO2008004742A1 (en) 2006-07-06 2007-02-22 Multi-dimensional and multi-stage transforming apparatus and method
US12/307,408 US8582657B2 (en) 2006-07-06 2007-02-22 Multi-dimensional and multi-stage transforming apparatus and method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020060063623 2006-07-06
KR20060063623 2006-07-06

Publications (2)

Publication Number Publication Date
KR20080005043A KR20080005043A (ko) 2008-01-10
KR100846870B1 true KR100846870B1 (ko) 2008-07-16

Family

ID=39215604

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060095786A KR100846870B1 (ko) 2006-07-06 2006-09-29 다수의 기본 블록들의 다차원 구성을 통한 다단계 변환장치 및 그 방법

Country Status (2)

Country Link
US (1) US8582657B2 (ko)
KR (1) KR100846870B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101370706B1 (ko) * 2012-06-29 2014-03-12 인텔렉추얼디스커버리 주식회사 영상 부호화기의 전처리 장치 및 방법
KR101724124B1 (ko) * 2015-12-10 2017-04-06 (주) 솔텍시스템 다차원 배열 데이터 압축 장치 및 방법
WO2017104115A1 (ja) * 2015-12-14 2017-06-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置及び三次元データ復号装置
CN107018420B (zh) * 2017-05-08 2019-07-12 电子科技大学 一种低功耗二维离散余弦变换方法及其电路

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970014350A (ko) * 1995-08-29 1997-03-29 김광호 영상신호 부호화장치
KR970057974A (ko) * 1995-12-23 1997-07-31 배순훈 블럭별 상관 관계에 의한 부호화 장치
KR20000052346A (ko) * 1998-10-16 2000-08-25 이데이 노부유끼 신호 처리 장치와 방법, 기록 장치, 재생 장치, 기록 및 재생 장치, 및 스트림 처리 장치와 방법
KR20020095013A (ko) * 1996-05-28 2002-12-20 마쯔시다덴기산교 가부시키가이샤 화상예측 복호화 장치 및 그 방법과 화상예측 부호화 장치 및 그 방법

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3071205B2 (ja) * 1990-01-23 2000-07-31 オリンパス光学工業株式会社 画像データの符号化装置および符号化方法
US5126962A (en) * 1990-07-11 1992-06-30 Massachusetts Institute Of Technology Discrete cosine transform processing system
EP0587783B1 (en) * 1991-06-04 1997-10-15 Qualcomm, Inc. Adaptive block size image compression system
JPH0563996A (ja) * 1991-09-02 1993-03-12 Ricoh Co Ltd 画像処理装置
KR960006761B1 (ko) 1991-12-07 1996-05-23 삼성전자주식회사 변환방식의 적응적 선택에 의한 변환부호화 및 복호화방법
KR950008914B1 (ko) 1991-12-30 1995-08-09 삼성전자주식회사 Ac계수의 구간별 변환 방법
JP3652380B2 (ja) 1993-09-20 2005-05-25 沖電気工業株式会社 離散コサイン変換装置及び逆離散コサイン変換装置
KR0135364B1 (ko) 1994-10-08 1998-04-22 홍두표 블럭-적응 스캔을 이용한 디씨티(dct) 블럭의 부호화 방법 및 그 장치
JPH09200762A (ja) * 1995-12-29 1997-07-31 Daewoo Electron Co Ltd 映像信号符号化方法及びその装置
JPH1083388A (ja) 1996-05-20 1998-03-31 Matsushita Electric Ind Co Ltd 直交変換装置
US6189021B1 (en) 1998-09-15 2001-02-13 Winbond Electronics Corp. Method for forming two-dimensional discrete cosine transform and its inverse involving a reduced number of multiplication operations
KR100530566B1 (ko) 1998-10-02 2006-05-17 주식회사 팬택앤큐리텔 적응적 변환방법을 이용하는 영상압축 부호화 및 복호화 장치및 그 방법
US6956903B2 (en) 2001-05-29 2005-10-18 Intel Corporation Method and apparatus for three-dimensional wavelet transform
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
US7376280B2 (en) * 2002-07-14 2008-05-20 Apple Inc Video encoding and decoding
KR100697516B1 (ko) 2004-10-27 2007-03-20 엘지전자 주식회사 3차원 웨이블릿 변환 기반의 동영상 코딩 방법
US7471850B2 (en) * 2004-12-17 2008-12-30 Microsoft Corporation Reversible transform for lossy and lossless 2-D data compression
US8654833B2 (en) * 2007-09-26 2014-02-18 Qualcomm Incorporated Efficient transformation techniques for video coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970014350A (ko) * 1995-08-29 1997-03-29 김광호 영상신호 부호화장치
KR970057974A (ko) * 1995-12-23 1997-07-31 배순훈 블럭별 상관 관계에 의한 부호화 장치
KR20020095013A (ko) * 1996-05-28 2002-12-20 마쯔시다덴기산교 가부시키가이샤 화상예측 복호화 장치 및 그 방법과 화상예측 부호화 장치 및 그 방법
KR20000052346A (ko) * 1998-10-16 2000-08-25 이데이 노부유끼 신호 처리 장치와 방법, 기록 장치, 재생 장치, 기록 및 재생 장치, 및 스트림 처리 장치와 방법

Also Published As

Publication number Publication date
US20100046613A1 (en) 2010-02-25
US8582657B2 (en) 2013-11-12
KR20080005043A (ko) 2008-01-10

Similar Documents

Publication Publication Date Title
JP5700970B2 (ja) 画像シーケンスを表す符号化データストリームの復号方法と画像シーケンスの符号化方法
JP3118237B1 (ja) 画像予測復号化方法
JP5270757B2 (ja) 係数ブロックにおける有意な係数の位置の符号化によるビデオ符号化
KR101351714B1 (ko) 비트 스트림 복호 방법
Zhang et al. Spatially directional predictive coding for block-based compressive sensing of natural images
JP2010528555A (ja) ビデオ信号の処理方法および装置
KR100846870B1 (ko) 다수의 기본 블록들의 다차원 구성을 통한 다단계 변환장치 및 그 방법
KR100834757B1 (ko) 엔트로피 부호화 효율을 향상시키는 방법 및 그 방법을이용한 비디오 인코더 및 비디오 디코더
KR20110045912A (ko) 적응적인 해상도 기반의 영상 부호화/복호화 방법 및 장치
EP1841235A1 (en) Video compression by adaptive 2D transformation in spatial and temporal direction
US20090304292A1 (en) Encoding and decoding methods, devices implementing said methods and bitstream
JP6309188B2 (ja) 画素ブロックを符号化して再構成する方法及び対応する装置
KR100801967B1 (ko) 문맥 기반 적응적 가변 길이 부호화 인코더 및 디코더,문맥 기반 적응성 가변 길이 부호화하는 방법과 복호화하는방법 및 이를 이용한 동영상 전송 시스템.
Zhao et al. Compressive-sensed image coding via stripe-based DPCM
KR101512643B1 (ko) 동영상 부호화 장치 및 이를 위한 영상 신호의 2차원 정렬 변환 장치 및 방법, 및 이를 위한 기록 매체
JP2013110747A5 (ko)
JP2013503534A (ja) 画像シーケンスを符号化するための方法
Letaief et al. Real time HEVC video compression using Hybrid DWT-DCT algorithm on an FPGA
CN106688235B (zh) 非因果预测的信号编码方法、解码方法
KR20110070687A (ko) 다차원 변환 및 양자화가 가능한 부호화 장치 및 방법, 그리고, 복호화 장치 및 방법
JP2002359852A (ja) 画像予測復号化装置及び方法
Elarabi et al. Hybrid wavelet-DCT intra prediction for H. 264/AVC interactive encoder
JP2022112364A (ja) イメージング装置及び測定符号化装置
JP3343553B1 (ja) 画像予測符号化装置及び方法
JP2002335532A (ja) 画像予測復号化方法及び画像予測符号化装置

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120607

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20130624

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee