WO2011155714A2

WO2011155714A2 - 엣지-적응 변환을 이용한 영상 부호화/복호화 시스템 및 방법

Info

Publication number: WO2011155714A2
Application number: PCT/KR2011/003665
Authority: WO
Inventors: 이재준; 위호천; 고드윈센; 김우식; 안토니오오르테가; 써닐나랑; 박두식
Original assignee: 삼성전자주식회사; 유니버시티 오브 써던 캘리포니아
Priority date: 2010-06-11
Filing date: 2011-05-18
Publication date: 2011-12-15
Also published as: EP2582140A4; WO2011155714A3; US20130272422A1; KR20110135787A; EP2582140A2

Abstract

엣지-적응 변환을 이용한 영상 부호화/복호화 시스템 및 방법이 개시된다. 부호화 시스템은 엣지-적응 변환을 이용하여 입력된 영상을 부호화하거나 또는 엣지-적응 변환 및 이산 코사인 변환 중 하나를 선택적으로 이용하여 입력된 영상을 부호화한다.

Description

엣지-적응 변환을 이용한 영상 부호화/복호화 시스템 및 방법

본 발명의 실시예들은 엣지-적응 변환을 이용한 영상 부호화/복호화 시스템 및 방법에 관한 것이다.

종래의 부호화 방법에 대한 일례로, 이산 코사인 변환(Discrete Cosine Transform, DCT)을 들 수 있다. 이산 코사인 변환은 시간축의 화상 신호를 주파수축으로 변환하는 계수로서 이산적 코사인 함수를 사용하는 직교 변환 부호화 방식이다. ITU-T에서 원격 화상 회의 전화용 부호화 방식 H.261의 화상 압축 기술로 채택되었으며, 동화상 압축의 국제 표준인 MPEG에 채용되어 현재는 영상의 고능률 부호화와 압축 기술의 주류가 되었다. 이산 코사인 변환에서는 시간축의 화상 신호를 몇 개의 신호 전력이 큰 주파수 영역과 작은 영역으로 분해하여 변환하는데, 화상 신호의 전력은 저주파수 영역에 집중되어 있기 때문에 적절한 비트 배분으로 양자화하면 전체의 비트 수를 적게 하여 데이터를 압축할 수 있다.

본 명세서에서는 보다 효율적으로 영상을 부호화/복호화할 수 있는 시스템 및 방법이 제안된다.

입력된 영상의 화소를 예측 부호화하는 예측 부호화부, 입력된 영상에서 엣지의 위치를 나타내는 정보를 생성하는 엣지 맵 생성부, 생성된 정보에 기초하여 그래프를 생성하는 그래프 생성부, 그래프에 기초하여 예측 부호화된 화소를 변환하는 변환부 및 생성된 정보를 부호화하는 엣지 맵 부호화부를 포함하는 부호화 시스템 이 제공된다.

일측에 따르면, 변환부는 그래프의 라플라시안의 고유 행렬에 기초하여 생성된 엣지-적응 변환을 통해 예측 부호화된 화소를 변환할 수 있다.

다른 측면에 따르면, 변환부는 예측 부호화된 화소 중 공통된 엣지 구조의 고정된 집합에 대한 화소에 대해 미리 계산되어 저장된 변환에 기초하여 엣지 적응 변환을 생성하고, 생성된 엣지 적응 변환을 이용하여 예측 부호화된 화소를 변환할 수 있다.

또 다른 측면에 따르면, 변환부는 그래프의 연결된 요소 각각에 대한 변환에 기초하여 엣지 적응 변환을 생성하고, 생성된 엣지 적응 변환을 이용하여 예측 부호화된 화소를 변환할 수 있다.

입력된 영상의 화소를 예측 부호화하는 예측 부호화부, 최적 모드를 선택하는 최적 모드 결정부 및 최적 모드로 엣지-적응 변환에 대한 모드가 선택된 경우, 예측 부호화된 화소에 대해 엣지-적응 변환을 수행하는 엣지 적응 변환부를 포함하고, 최적 모드는 엣지-적응 변환 및 이산 코사인 변환 각각의 율-왜곡 비용에 기초하여 선택되는, 부호화 시스템이 제공된다.

입력된 비트스트림을 엔트로피 복호화하여 화소를 복호화하는 엔트로피 복호화부, 입력된 비트스트림에서 엣지의 위치를 나타내는 정보를 복호화하는 정보 복호화부, 복호화된 정보에 기초하여 그래프를 생성하는 그래프 생성부 및 그래프에 기초하여 엔트로피 복호화된 화소를 역변환하는 역변환부를 포함하는 복호화 시스템이 제공된다.

입력된 비트스트림을 엔트로피 복호화하여 화소를 복호화하는 엔트로피 복호화부 및 변환 모드가 엣지-적응 변환에 대한 모드인 경우, 엔트로피 복호화된 화소를 엣지-적응 역변환을 수행하는 엣지-적응 역변환부를 포함하고, 변환 모드는 엣지-적응 변환 및 이산 코사인 변환 각각의 율-왜곡 비용에 기초하여 부호화 시스템에서 결정되는, 복호화 시스템이 제공된다.

엣지-적응 변환을 이용하여 영상을 부호화 및 복호화할 수 있다.

엣지-적응 변환 및 이산 코사인 변환 중 하나를 선택적으로 이용함으로써, 비트율 및/또는 왜곡을 줄일 수 있다.

도 1은 본 발명의 일실시예에 있어서, 부호화 시스템의 내부 구성을 설명하기 위한 블록도이다.

도 2는 본 발명의 일실시예에 있어서, 복수의 화소를 나타낸 일례이다.

도 3은 본 발명의 다른 실시예에 있어서, 부호화 시스템의 내부 구성을 설명하기 위한 블록도이다.

도 4는 본 발명의 일실시예에 있어서, 복호화 시스템의 내부 구성을 설명하기 위한 블록도이다.

도 5는 본 발명의 다른 실시예에 있어서, 복호화 시스템의 내부 구성을 설명하기 위한 블록도이다.

도 6은 본 발명의 일실시예에 있어서, 부호화 방법을 도시한 흐름도이다.

도 7은 본 발명의 다른 실시예에 있어서, 부호화 방법을 도시한 흐름도이다.

도 8은 본 발명의 일실시예에 있어서, 복호화 방법을 도시한 흐름도이다.

도 9는 본 발명의 다른 실시예에 있어서, 복호화 방법을 도시한 흐름도이다.

이하에서, 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다.

본 발명의 실시예들에 따른 엣지-적응 변환(Edge-Adaptive Transform, EAT)은 독립적으로 이용될 수도 있으나 이산 코사인 변환(Discrete Cosine Transform, DCT)과 결합되어 이용될 수도 있다. 이때, 엣지-적응 변환에서는, 입력된 영상에 대한 적어도 하나의 블록을 위해, 엣지의 위치를 나타내는 정보가 생성될 수 있다. 일례로, 엣지의 위치를 나타내는 정보로서 엣지 맵이 생성될 수 있다. 또한, 엣지 맵에 기초하여 그래프가 생성될 수 있고, 생성된 그래프를 이용하여 변환이 구성(construct)될 수 있다.

엣지-적응 변환과 이산 코사인 변환을 결합하여 이용하는 실시예에서, 만약 엣지-적응 변환 계수(엣지 맵을 부호화하기 위해 필요한 비트율을 포함하는)를 위한 율-왜곡(Rate-Distortion, RD) 비용이 이산 코사인 변환 계수를 위한 율-왜곡 비용보다 작다면, 엣지-적응 변환이 이용될 수 있다. 이때, 엣지 맵이 부호화되어 부가 정보로서 복호화 시스템으로 전송될 수 있다. 이 경우, 복호화 시스템은 영상에 대한 적어도 하나의 블록을 위해, 변환 계수와 엣지 맵을 수신하여 비트스트림을 복호화할 수 있다. 이때, 복호화 시스템은 역변환, 역양자화 및 예측 보상을 수행할 수 있다.

도 1은 본 발명의 일실시예에 있어서, 부호화 시스템의 내부 구성을 설명하기 위한 블록도이다. 본 실시예에 따른 부호화 시스템(100)은 엣지-적응 변환을 독립적으로 이용한다. 이때, 도 1에 나타난 바와 같이 부호화 시스템(100)은 예측 부호화부(110), 엣지-적응 변환부(120), 양자화부(130), 엔트로피 부호화부(140), 역양자화부(150) 및 역변환부(160)를 포함할 수 있다.

예측 부호화부(110)는 입력된 영상의 화소를 예측 부호화한다. 예를 들어, 예측 부호화부(110)는 사전에 부호화된 블록들로부터 얻어지는 재구성된 화소를 통해 이미지나 비디오 프레임과 같은 입력된 영상에서 화소의 블록 각각을 예측할 수 있고, 이때 예측 부호화된 화소의 블록으로부터 잔여(residual) 블록이 생성될 수 있다. 재구성된 화소는 역양자화부(150) 및 역변환부(160)를 통해 얻어질 수 있다. 역양자화부(150) 및 역변환부(160)에 대해서는 이후 더욱 자세히 설명한다. 본 명세서에서 블록은 일례로, N x N 크기의 화소 집합으로 구성될 수 있다.

엣지-적응 변환부(120)는 예측 부호화된 화소에 엣지-적응 변환을 수행한다. 이를 위해, 엣지-적응 변환부(120)는 도 1에 도시된 바와 같이, 엣지 맵 생성부(121), 그래프 생성부(122), 변환부(123) 및 엣지 맵 부호화부(124)를 포함한다.

엣지 맵 생성부(121)는 입력된 영상에서 엣지의 위치를 나타내는 정보를 생성한다. 일례로, 엣지 맵 생성부(121)는 상술한 잔여 블록에서 엣지의 위치를 찾아 엣지의 위치를 나타내는 이진 엣지 맵을 생성할 수 있다.

그래프 생성부(122)는 생성된 정보에 기초하여 그래프를 생성한다. 이때, 그래프 생성부(122)는 상술한 잔여 블록에 포함된 화소들 중 서로 이웃한 화소간에 엣지가 없는 화소들의 연결하여 그래프를 생성할 수 있다.

예를 들어, 4개 또는 8개의 서로 연결된 이웃 화소들에 의해 그래프가 생성될 수 있다. 이러한 그래프는 인접 행렬(adjacency matrix) A를 통해 나타낼 수 있다. 여기서, 만약 화소 'i' 및 'j'가 서로 이웃한 화소이고, 엣지에 의해 분리되지 않는다면, 인접 행렬 A는 'A(i, j) = A(j, i) = 1'의 조건을 만족할 수 있다. 만약, 화소 'i' 및 'j'가 서로 이웃한 화소가 아니거나 엣지에 의해 분리된다면, 인접 행렬 A는 A(i, j) = A(j, i) = 0의 조건을 만족할 수 있다.

다른 예로, 인접 행렬 A에서 연결된 화소를 위한 1의 값은 연결된 화소간 거리에 따른 값으로 대체될 수도 있다. 수평 또는 수직 방향으로 인접한 화소들이 대각 방향으로 인접한 화소들보다 서로 더 가깝기 때문에 이러한 화소간 거리에 따라 기선정된 값이 1 대신 이용될 수도 있다.

인접 행렬 A로부터 차수 행렬(degree matrix) D가 계산될 수 있다. 여기서, 차수 행렬 D는 D(i, j)가 인접 행렬 A의 i-번째 열에서 값이 '0'이 아닌 항목의 수를 값으로 갖는 조건을 만족할 수 있다. 또한, 모든 'i≠j'에 대해 'D(i, j) = 0'의 조건을 만족할 수 있다.

변환부(123)는 그래프에 기초하여 예측 부호화된 화소를 변환한다. 예를 들어, 변환부(123)는 그래프의 라플라시안(Laplacian)의 고유 벡터(eigenvectors)를 이용함으로써, 그래프에 엣지-적응 변환을 구성할 수 있다. 그래프의 라플라시안을 나타내는 행렬 L은 차수 행렬과 인접 행렬간의 차이값으로서 계산될 수 있다. 예를 들어, 그래프의 라플라시안은 아래 수학식 1과 같이 계산될 수 있다.

행렬 L은 대칭 행렬(symmetric matrix)이기 때문에, 행렬 L의 고유 벡터는 잘 알려진 사이클릭 재코비 방법(cyclic Jacobi method)을 이용하여 계산될 수 있다.

도 2는 본 발명의 일실시예에 있어서, 복수의 화소를 나타낸 일례이다. 도 2에서 네 개의 원(210 내지 240)은 각각 4개의 화소를 나타낸다. 또한, 선(250)은 화소 1, 2(210, 220) 와 화소 3, 4(230, 240)를 가로지르는 엣지를 나타낸다. 이 경우, 인접 행렬 A, 차수 행렬 D 및 라플라시안에 대한 행렬 L은 아래 수학식 2 내지 수학식 4와 같이 표현될 수 있다.

이 경우, 사이클릭 재코비 방법을 통해 라플라시안의 고유 행렬이 계산될 수 있고, 계산된 고유 행렬을 이용하여 엣지-적응 변환을 위한 계수가 아래 수학식 5와 같이 구성될 수 있다.

여기서, 'E ^t'는 엣지-적응 변환을 위한 계수를 의미할 수 있다.

다시 도 1을 참조하면, 계산 복잡성을 피하기 위해, 가장 유명한 엣지 배치(edge configuration)에 따라 미리 계산된(pre-computed) 변환의 집합이 저장될 수 있다. 또한, 더 간단한 대체 변환(예를 들어, 하 웨이블렛 변환(Harr wavelet transform))이 그래프를 연결된 요소들로 나누어 각각의 연결된 요소에서 서로 다른 변환이 지원되도록 하는데 이용될 수도 있다. 예를 들어, 4x4 크기의 블록을 위한 그래프는 각각 8개의 화소를 갖는, 2개의 연결된 요소들로 구성될 수 있다. 2x2 영상 블록에 대한 엣지 적응 변환은 2x2블록을 각 열을 연결하여 4x1 벡터로 만들어서 위의 'E ^t'와의 곱셈으로 얻을 수 있다. 이때, 각각의 요소에서 화소들에 3-레벨 하 웨이블렛 변환이 수행될 수 있다.

엣지 맵 부호화부(124)는 생성된 정보를 부호화한다. 즉, 엣지 맵 생성부(121)에서 생성된 정보가 엣지 맵 부호화부(124)에서 부호화되어 입력된 영상에 대해 생성되는 비트스트림에 포함될 수 있고, 비트스트림과 함께 복호화를 위한 시스템으로 전송될 수 있다. 이때, 상술한 바와 같이 엣지 맵 생성부(121)에서 생성된 정보는 일례로, 엣지 맵을 포함할 수 있다.

양자화부(130)는 변환된 화소를 양자화하고, 엔트로피 부호화부(140)는 양자화된 화소를 엔트로피 부호화하여 비트스트림을 생성한다. 이때, 생성된 비트스트림에 엣지 맵 부호화부(124)를 통해 부호화된 엣지 맵과 부호화된 변환 계수가 포함되거나 또는 비트스트림과 함께 복호화를 위한 시스템으로 전송될 수 있다.

또한, 양자화된 화소는 역양자화부(150) 및 역변환부(160)를 통해 재구성될 수 있고, 예측 부호화부(110)에서 입력된 영상의 화소를 예측 부호화하는데 이용될 수 있다.

도 3은 본 발명의 다른 실시예에 있어서, 부호화 시스템의 내부 구성을 설명하기 위한 블록도이다. 본 실시예에 따른 부호화 시스템(300)은 하이브리드 변환을 수행할 수 있다. 예를 들어, 부호화 시스템(300)은 율-왜곡 비용에 기초하여 엣지-적응 변환과 이산 코사인 변환 중 하나를 선택하도록 구성될 수 있다. 이러한 부호화 시스템(300)은 도 3에 도시된 바와 같이 예측 부호화부(310), 최적 모드 결정부(320), DCT(330), EAT(340), 양자화부(350), 엔트로피 부호화부(360), 역양자화부(370) 및 역변환부(380)를 포함할 수 있다. 여기서, EAT(340)는 도 1을 통해 설명한 엣지-적응 변환부(120)에 대응될 수 있고, DCT(330)는 이산 코사인 변환을 수행하는 블록에 대응될 수 있다. 또한, 예측 부호화부(310), 양자화부(350), 엔트로피 부호화부(360), 역양자화부(370) 및 역변환부(380)는 도 1을 통해 설명한 예측 부호화부(110), 양자화부(130), 엔트로피 부호화부(140), 역양자화부(150) 및 역변환부(160)에 각각 대응될 수 있다. 이에 반복적인 설명은 생략한다.

입력된 영상은 예측 부호화부(310)를 통해 예측 부호화될 수 있고, 예측 부호화된 화소의 블록으로부터 잔여 블록이 생성될 수 있다.

최적 모드 결정부(320)는 이산 코사인 변환에 대한 모드와 엣지-적응 변환에 대한 모드 중 하나의 모드를 선택한다. 이를 위해, 최적 모드 결정부(320)는 이산 코사인 변환과 엣지-적응 변환 각각의 비트율과 왜곡을 계산할 수 있다. 또한, 최적 모드 결정부(320)는 각각 계산된 비트율과 왜곡을 통해 이산 코사인 변환과 엣지-적응 변환 각각의 율-왜곡 비용을 계산할 수 있다.

예를 들어, 이산 코사인 변환을 이용하는 경우와 엣지-적응 변환을 이용하는 경우 각각을 위해, 그리고 정해진 양자화 단계 크기 Q를 위해, Q를 이용하여 변환 계수가 양자화될 수 있고, 양자화된 변환 계수를 위한 비율 R(비트율) 및 왜곡 D가 계산될 수 있다. 이산 코사인 변환을 위한 율-왜곡 비용은 'D_dct + λ(Q) R_dct'로서 계산될 수 있다. 여기서, 'D_dct'는 이산 코사인 변환을 위한 왜곡을, 'R_dct'는 이산 코사인 변환의 양자화된 변환 계수를 위한 비율을 각각 의미할 수 있다. 또한, 람다 값은 정해진 Q에 따라 정해질 수 있다. 엣지-적응 변환을 위해, 엣지 맵이 부호화될 수 있고, 비율 'R_edges'가 계산될 수 있다. 이때, 엣지-적응 변환을 위한 율-왜곡 비용은 'D_eat + (Q) (R_eat + R_edges)'로서 계산될 수 있다. 여기서, 'Deat'는 엣지-적응 변환을 위한 왜곡을, 'Reat'는 엣지-적응 변환의 양자화된 변환 계수를 위한 비율을 각각 의미할 수 있다.

이때, 엣지-적응 변환을 위한 율-왜곡 비율이 이산 코사인 변환을 위한 율-왜곡 비율보다 작은 경우, EAT(340)가 동작할 수 있고, 엣지-적응 변환을 위한 율-왜곡 비율이 이산 코사인 변환을 위한 율-왜곡 비율보다 작지 않은 경우에는 DCT(330)가 동작할 수 있다. 즉, 최적 모드 결정부(320)는 엣지-적응 변환에 대한 모드 및 이산 코사인 변환에 대한 모드 중 최적 모드를 선택할 수 있고, 선택된 최적 모드에 따라 EAT(340) 및 DCT(330) 중 하나가 선택적으로 동작할 수 있다. EAT(340)를 통해 예측 부호화된 화소를 변환하는 경우에는 엣지 맵에 대한 정보가 부호화되어 비트스트림에 포함되거나 비트스트림과 함께 복호화를 위한 시스템으로 더 전송될 수 있다. 반면, DCT(330)를 통해 예측 부호화된 화소를 변환하는 경우에는 엣지 맵이 이용되지 않기 때문에 엣지에 대한 정보는 부호화되거나 전송되지 않는다. 또한, 최적 모드 결정부(320)에서 선택된 최적 모드에 대한 정보 역시 부호화되어 복호화를 위한 시스템으로 전송될 수 있다. DCT(330)나 EAT(340)를 통해 변환된 화소는 양자화부(350)로 전달되어 양자화될 수 있다.

도 4는 본 발명의 일실시예에 있어서, 복호화 시스템의 내부 구성을 설명하기 위한 블록도이다. 본 실시예에 따른 복호화 시스템(400)은 도 1을 통해 설명한 부호화 시스템(100)으로부터 비트스트림을 수신할 수 있다. 복호화 시스템(400)은 도 4에 도시된 바와 같이, 엔트로피 복호화부(410), 역양자화부(420), 역변환부(430), 엣지 맵 복호화부(440), 그래픽 생성부(450) 및 예측 보정부(460)를 포함할 수 있다.

엔트로피 복호화부(410)는 입력된 비트스트림을 엔트로피 복호화하여 화소를 복호화한다. 즉, 부호화 시스템(100)에서 화소를 엔트로피 부호화하여 비트스트림이 생성될 수 있고, 비트스트림이 복호화 시스템(400)으로 전송되는 경우, 엔트로피 복호화부(410)는 입력되는 비트스트림을 엔트로피 복호화함으로써, 화소를 복호화할 수 있다.

역양자화부(420)는 엔트로피 복호화된 화소를 역양자화한다. 도 4에 따른 실시예에서 역양자화부(420)는 엔트로피 복호화부(410)의 출력을 입력으로 받지만, 필요에 따라 역변환부(430)의 출력을 입력으로 받을 수 있다. 전자의 경우 역양자화부(420)의 출력은 역변환부(430)의 입력으로서 전달되고, 후자의 경우 역양자화부(420)의 출력은 예측 보정부(460)로 전달될 수 있다.

역변환부(430)는 복호화된 화소를 역변환한다. 이때, 역변환부(430)는 엣지 맵 복호화부(440) 및 그래픽 생성부(450)를 통해 생성된 그래픽에 기초하여 복호화된 화소를 역변환할 수 있다. 예를 들어, 역변환부(430)는 그래프의 라플라시안의 고유 행렬에 기초하여 생성된 엣지-적응 변환을 생성할 수 있고, 생성된 엣지-적응 변환을 통해 복호화된 화소를 역변환할 수 있다.

엣지 맵 복호화부(440)는 입력된 비트스트림에서 엣지의 위치를 나타내는 정보를 복호화한다. 여기서, 엣지의 위치를 나타내는 정보는 비트스트림에 포함된 엣지 맵을 포함할 수 있다.

그래프 생성부(450)는 복호화된 정보에 기초하여 그래프를 생성한다. 즉, 역변환부(430)는 그래프 생성부(450)를 통해 생성된 그래프에 기초하여 복호화된 화소를 역변환할 수 있다. 이때, 그래프를 생성하는 방법은 도 1을 통해 설명한 방법과 동일할 수 있다.

예측 보정부(460)는 이전 화소에 대한 예측값을 통해 현재 입력되는 변환된 화소의 화소값을 보상하여 영상의 화소를 재구성한다.

도 5는 본 발명의 다른 실시예에 있어서, 복호화 시스템의 내부 구성을 설명하기 위한 블록도이다. 본 실시예에 따른 복호화 시스템(500)은 도 3을 통해 설명한 부호화 시스템(300)으로부터 비트스트림을 수신할 수 있다. 복호화 시스템(500)은 도 5에 도시된 바와 같이, 엔트로피 복호화부(510), 역양자화부(520), 역 DCT(530), 역 EAT(540), 엣지 맵 복호화부(550) 그래픽 생성부(560) 및 예측 보정부(570)를 포함할 수 있다. 여기서, 엔트로피 복호화부(510), 역양자화부(520), 엣지 맵 복호화부(550), 그래픽 생성부(560) 및 예측 보정부(570)는 도 4를 통해 설명한 엔트로피 복호화부(410), 역양자화부(420), 엣지 맵 복호화부(440), 그래픽 생성부(450) 및 예측 보정부(460)에 각각 대응될 수 있다. 따라서, 반복적인 설명은 생략한다. 또한, 도 4를 통해 설명한 바와 대응되도록, 다른 실시예에서의 역양자화부(520)는 역 DCT(530) 및 역 EAT(540)의 출력을 입력으로 받도록 구성될 수도 있다.

엔트로피 복호화된 화소는 역 DCT(530) 또는 역 EAT(540)로 입력될 수 있다. 이때, 엔트로피 복호화된 화소가 역 DCT(530) 및 역 EAT(540) 중 어디로 입력되는 가는 비트스트림에 포함된 또는 비트스트림과 함께 수신되는 변환 모드에 따라 결정될 수 있다. 여기서 변환 모드는 도 3을 통해 설명한 최적 모드에 대응될 수 있다. 즉, 도 3을 통해 설명한 부호화 시스템(300)에서 엣지-적응 변환 및 이산 코사인 변환 중 어느 변환을 통해 화소를 변환하였는가에 따라 역 엣지-적응 변환을 이용하는 역 EAT(540) 및 역 이산 코사인 변환을 이용하는 역 DCT(530) 중 하나가 선택될 수 있다.

이때, EAT(540)는 그래픽 생성부(560)를 통해 생성된 그래픽에 기초하여 엔트로피 복호화된 화소를 역변환할 수 있다.

도 6은 본 발명의 일실시예에 있어서, 부호화 방법을 도시한 흐름도이다. 본 실시예에 따른 부호화 방법은 도 1을 통해 설명한 부호화 시스템(100)에 의해 각각의 단계가 수행될 수 있다.

단계(610)에서 부호화 시스템(100)은 입력된 영상의 화소를 예측 부호화 한다. 예를 들어, 부호화 시스템(100)은 사전에 부호화된 블록들로부터 얻어지는 재구성된 화소를 통해 이미지나 비디오 프레임과 같은 입력된 영상에서 화소의 블록 각각을 예측할 수 있고, 이때 예측 부호화된 화소의 블록으로부터 잔여 블록이 생성될 수 있다.

단계(620)에서 부호화 시스템(100)은 입력된 영상에서 엣지의 위치를 나타내는 정보를 생성한다. 일례로, 부호화 시스템(100)은 상술한 잔여 블록에서 엣지의 위치를 찾아 엣지의 위치를 나타내는 이진 엣지 맵을 생성할 수 있다.

단계(630)에서 부호화 시스템(100)은 생성된 정보에 기초하여 그래프를 생성한다. 이때, 부호화 시스템(100)은 상술한 잔여 블록에 포함된 화소들 중 서로 이웃한 화소간에 엣지가 없는 화소들의 연결하여 그래프를 생성할 수 있다.

단계(640)에서 부호화 시스템(100)은 그래프에 기초하여 예측 부호화된 화소를 변환한다. 예를 들어, 부호화 시스템(100)은 그래프의 라플라시안의 고유 벡터를 이용함으로써, 그래프에 엣지-적응 변환을 구성할 수 있다. 그래프의 라플라시안을 나타내는 행렬 L은 차수 행렬과 인접 행렬간의 차이값으로서 계산될 수 있다. 또는 부호화 시스템(100)은 예측 부호화된 화소 중 공통된 엣지 구조의 고정된 집합에 대한 화소에 대해 미리 계산되어 저장된 변환에 기초하여 엣지 적응 변환을 생성하거나 그래프의 연결된 요소 각각에 대한 변환에 기초하여 엣지 적응 변환을 생성할 수 있다.

단계(650)에서 부호화 시스템(100)은 변환된 화소를 양자화한다.

단계(660)에서 부호화 시스템(100)은 양자화된 화소를 엔트로피 부호화한다. 이때, 엔트로피 부호화의 결과로 비트스트림이 생성될 수 있다.

단계(670)에서 부호화 시스템(100)은 생성된 정보를 부호화한다. 즉, 부호화 시스템(100)은 엣지 맵을 부호화할 수 있다. 부호화된 엣지 맵은 비트스트림에 포함되거나 비트스트림과 함께 전송될 수 있다.

도 7은 본 발명의 다른 실시예에 있어서, 부호화 방법을 도시한 흐름도이다. 본 실시예에 따른 부호화 방법은 도 3을 통해 설명한 부호화 시스템(300)에 의해 각각의 단계가 수행될 수 있다.

단계(710)에서 부호화 시스템(300)은 입력된 영상의 화소를 예측 부호화 한다. 예를 들어, 부호화 시스템(100)은 사전에 부호화된 블록들로부터 얻어지는 재구성된 화소를 통해 이미지나 비디오 프레임과 같은 입력된 영상에서 화소의 블록 각각을 예측할 수 있고, 이때 예측 부호화된 화소의 블록으로부터 잔여 블록이 생성될 수 있다.

단계(720)에서 부호화 시스템(300)은 최적 모드를 선택할 수 있다. 이때, 부호화 시스템(300)은 이산 코사인 변환에 대한 모드와 엣지-적응 변환에 대한 모드 중 하나의 모드를 선택할 수 있다. 이를 위해, 부호화 시스템(300)은 이산 코사인 변환과 엣지-적응 변환 각각의 비트율과 왜곡을 계산할 수 있다. 또한, 부호화 시스템(300)은 각각 계산된 비트율과 왜곡을 통해 이산 코사인 변환과 엣지-적응 변환 각각의 율-왜곡 비용을 계산할 수 있다. 이때, 엣지-적응 변환을 위한 율-왜곡 비율이 이산 코사인 변환을 위한 율-왜곡 비율보다 작은 경우, 엣지-적응 변환에 대한 모드가 최적 모드로 선택될 수 있고, 엣지-적응 변환을 위한 율-왜곡 비율이 이산 코사인 변환을 위한 율-왜곡 비율보다 작지 않은 경우에는 이산 코사인 변환을 위한 모드가 최적 모드로 선택될 수 있다.

단계(730)에서 부호화 시스템(300)은 최적 모드가 엣지-적응 변환을 위한 모드인 경우 단계(741)을 수행하고, 엣지-적응 변환 모드가 아닌 경우 즉, 이산 코사인 변환을 위한 모드인 경우 단계(750)를 수행한다.

단계(741)에서 부호화 시스템(300)은 입력된 영상에서 엣지의 위치를 나타내는 정보 생성한다. 일례로, 부호화 시스템(300)은 상술한 잔여 블록에서 엣지의 위치를 찾아 엣지의 위치를 나타내는 이진 엣지 맵을 생성할 수 있다.

단계(742)에서 부호화 시스템(300)은 생성된 정보에 기초하여 그래프를 생성한다. 이때, 부호화 시스템(300)은 잔여 블록에 포함된 화소들 중 서로 이웃한 화소간에 엣지가 없는 화소들의 연결하여 그래프를 생성할 수 있다.

단계(743)에서 부호화 시스템(300)은 그래프에 기초하여 예측 부호화된 화소를 변환한다. 예를 들어, 부호화 시스템(300)은 그래프의 라플라시안의 고유 벡터를 이용함으로써, 그래프에 엣지-적응 변환을 구성할 수 있다. 그래프의 라플라시안을 나타내는 행렬 L은 차수 행렬과 인접 행렬간의 차이값으로서 계산될 수 있다. 또는 부호화 시스템(300)은 예측 부호화된 화소 중 공통된 엣지 구조의 고정된 집합에 대한 화소에 대해 미리 계산되어 저장된 변환에 기초하여 엣지 적응 변환을 생성하거나 그래프의 연결된 요소 각각에 대한 변환에 기초하여 엣지 적응 변환을 생성할 수 있다.

단계(744)에서 부호화 시스템(300)은 생성된 정보를 부호화한다. 즉, 부호화 시스템(300)은 엣지 맵을 부호화할 수 있다. 부호화된 엣지 맵은 비트스트림에 포함되거나 비트스트림과 함께 전송될 수 있다.

단계(750)에서 부호화 시스템(300)은 예측 부호화된 화소를 이산 코사인 변환한다.

단계(760)에서 부호화 시스템(300)은 변환된 화소를 양자화한다.

단계(770)에서 부호화 시스템(300)은 양자화된 화소를 엔트로피 부호화한다. 이때, 엔트로피 부호화의 결과로서 비트스트림이 생성될 수 있다. 생성된 비트스트림에는 최적 모드에 대한 정보와 부호화된 엣지 맵에 대한 정보가 포함될 수 있다.

도 8은 본 발명의 일실시예에 있어서, 복호화 방법을 도시한 흐름도이다. 본 실시예에 따른 복호화 방법은 도 4를 통해 설명한 복호화 시스템(400)에 의해 각각의 단계가 수행될 수 있다.

단계(810)에서 부호화 시스템(400)은 입력된 비트스트림을 엔트로피 복호화하여 화소를 복호화한다. 즉, 부호화 시스템(100)에서 화소를 엔트로피 부호화하여 비트스트림이 생성될 수 있고, 비트스트림이 복호화 시스템(400)으로 전송되는 경우, 복호화 시스템(400)은 입력되는 비트스트림을 엔트로피 복호화함으로써, 화소를 복호화할 수 있다.

단계(820)에서 부호화 시스템(400)은 입력된 비트스트림에서 엣지의 위치를 나타내는 정보를 복호화한다. 여기서, 엣지의 위치를 나타내는 정보는 비트스트림에 포함된 엣지 맵을 포함할 수 있다.

단계(830)에서 부호화 시스템(400)은 복호화된 정보에 기초하여 그래프를 생성한다. 이때, 부호화 시스템(400)은 복호화된 화소에 대한 잔여 블록에 포함된 화소들 중 서로 이웃한 화소간에 엣지가 없는 화소들의 연결하여 그래프를 생성할 수 있다.

단계(840)에서 부호화 시스템(400)은 그래프에 기초하여 복호화된 화소를 역변환한다. 이때, 부호화 시스템(400)은 그래프의 라플라시안의 고유 행렬에 기초하여 생성된 엣지-적응 변환을 생성할 수 있고, 생성된 엣지-적응 변환을 통해 복호화된 화소를 역변환할 수 있다. 이때, 부호화 시스템(400)은 예측 부호화된 화소 중 공통된 엣지 구조의 고정된 집합에 대한 화소에 대해 미리 계산되어 저장된 변환에 기초하여 엣지 적응 변환을 생성하거나 그래프의 연결된 요소 각각에 대한 변환에 기초하여 엣지 적응 변환을 생성할 수도 있다.

단계(850)에서 부호화 시스템(400)은 역변환된 화소를 역양자화한다.

단계(860)에서 부호화 시스템(400)은 양자화된 화소를 예측 보상한다. 이때, 부호화 시스템(400)은 이전 화소에 대한 예측값을 통해 현재 입력되는 변환된 화소의 화소값을 보상하여 영상의 화소를 재구성할 수 있다.

도 9는 본 발명의 다른 실시예에 있어서, 복호화 방법을 도시한 흐름도이다. 본 실시예에 따른 복호화 방법은 도 5를 통해 설명한 복호화 시스템(500)에 의해 각각의 단계가 수행될 수 있다.

단계(910)에서 부호화 시스템(500)은 입력된 비트스트림을 엔트로피 복호화하여 화소를 복호화한다.

단계(920)에서 부호화 시스템(500)은 엔트로피 복호화된 화소를 역양자화한다.

단계(930)에서 부호화 시스템(500)은 변환 모드가 엣지-적응 변환을 위한 모드인 경우 단계(941)을 수행하고, 변환 모드가 이산 코사인 변환을 위한 모드인 경우 단계(950)를 수행한다.

단계(941)에서 부호화 시스템(500)은 입력된 비트스트림에서 엣지의 위치를 나타내는 정보를 복호화한다. 일례로, 부호화 시스템(500)은 엔트로피 복호화된 화소에 대한 잔여 블록에서 엣지의 위치를 찾아 엣지의 위치를 나타내는 이진 엣지 맵을 생성할 수 있다.

단계(942)에서 부호화 시스템(500)은 생성된 정보에 기초하여 그래프를 생성한다. 이때, 부호화 시스템(500)은 잔여 블록에 포함된 화소들 중 서로 이웃한 화소간에 엣지가 없는 화소들의 연결하여 그래프를 생성할 수 있다.

단계(943)에서 부호화 시스템(500)은 그래프에 기초하여 예측 부호화된 화소를 변환한다. 이때, 부호화 시스템(500)은 그래프의 라플라시안의 고유 행렬에 기초하여 생성된 엣지-적응 변환을 생성할 수 있고, 생성된 엣지-적응 변환을 통해 복호화된 화소를 역변환할 수 있다. 이때, 부호화 시스템(500)은 예측 부호화된 화소 중 공통된 엣지 구조의 고정된 집합에 대한 화소에 대해 미리 계산되어 저장된 변환에 기초하여 엣지 적응 변환을 생성하거나 그래프의 연결된 요소 각각에 대한 변환에 기초하여 엣지 적응 변환을 생성할 수도 있다.

단계(950)에서 부호화 시스템(500)은 복호화된 화소를 역 이산 코사인 변환한다.

단계(960)에서 부호화 시스템(500)은 변환된 화소를 예측 보상한다. 이때, 부호화 시스템(500)은 이전 화소에 대한 예측값을 통해 현재 입력되는 변환된 화소의 화소값을 보상하여 영상의 화소를 재구성할 수 있다.

도 6 내지 도 9에서 생략된 내용은 도 1 내지 도 5의 내용을 참조할 수 있다.

이와 같이, 본 발명의 실시예들에 따르면, 엣지-적응 변환을 이용하여 영상을 부호화 및 복호화할 수 있다. 또한, 엣지-적응 변환 및 이산 코사인 변환 중 하나를 선택적으로 이용함으로써, 비트율 및/또는 왜곡을 줄일 수 있다.

또한, 본 발명의 실시예들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 일실시예들의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.

Claims

입력된 영상의 화소를 예측 부호화하는 예측 부호화부;

상기 입력된 영상에서 엣지의 위치를 나타내는 정보를 생성하는 엣지 맵 생성부;

상기 생성된 정보에 기초하여 그래프를 생성하는 그래프 생성부;

상기 그래프에 기초하여 상기 예측 부호화된 화소를 변환하는 변환부; 및

상기 생성된 정보를 부호화하는 엣지 맵 부호화부

를 포함하는 부호화 시스템.
제1항에 있어서,

상기 변환부는,

상기 그래프의 라플라시안의 고유 행렬에 기초하여 생성된 엣지-적응 변환을 통해 상기 예측 부호화된 화소를 변환하는, 부호화 시스템.
제1항에 있어서,

상기 변환부는,

상기 예측 부호화된 화소 중 공통된 엣지 구조의 고정된 집합에 대한 화소에 대해 미리 계산되어 저장된 변환에 기초하여 엣지 적응 변환을 생성하고, 생성된 엣지 적응 변환을 이용하여 상기 예측 부호화된 화소를 변환하는, 부호화 시스템.
제3항에 있어서,

상기 변환부는,

상기 그래프의 연결된 요소 각각에 대한 변환에 기초하여 엣지 적응 변환을 생성하고, 생성된 엣지 적응 변환을 이용하여 상기 예측 부호화된 화소를 변환하는, 부호화 시스템.
제1항에 있어서,

상기 엣지 맵 생성부는,

상기 예측 부호화된 화소에 대한 잔여(residual) 블록에서 엣지의 위치를 찾아 엣지의 위치를 나타내는 엣지 맵을 생성하는, 부호화 시스템.
제1항에 있어서,

상기 그래프 생성부는,

상기 예측 부호화된 화소에 대한 잔여 블록에 포함된 화소 중 서로 이웃한 화소간에 엣지가 존재하지 않는 화소를 연결하여 상기 그래프를 생성하는, 부호화 시스템.
제1항에 있어서,

상기 그래프 생성부는,

상기 예측 부호화된 화소에 대한 잔여 블록에 포함된 화소 중 서로 이웃한 화소간에 엣지가 존재하지 않는 화소에 대한 정보를 나타내는 인접 행렬에 기초하여 상기 그래프를 생성하는, 부호화 시스템.
입력된 영상의 화소를 예측 부호화하는 예측 부호화부;

최적 모드를 선택하는 최적 모드 결정부; 및

상기 최적 모드로 엣지-적응 변환에 대한 모드가 선택된 경우, 상기 예측 부호화된 화소에 대해 엣지-적응 변환을 수행하는 엣지 적응 변환부

를 포함하고,

상기 최적 모드는 상기 엣지-적응 변환 및 이산 코사인 변환 각각의 율-왜곡 비용에 기초하여 선택되는, 부호화 시스템.
제8항에 있어서,

상기 최적 모드는 상기 엣지-적응 변환에 대한 모드 및 이산 코사인 변환(Discrete Cosine Transform)에 대한 모드 중 하나의 모드를 포함하는, 부호화 시스템.
제8항에 있어서,

상기 엣지 적응 변환부는,

상기 입력된 영상에서 엣지의 위치를 나타내는 정보를 생성하는 엣지 맵 생성부;

상기 생성된 정보에 기초하여 그래프를 생성하는 그래프 생성부;

상기 그래프에 기초하여 상기 예측 부호화된 화소를 변환하는 변환부; 및

상기 생성된 정보를 부호화하는 엣지 맵 부호화부

를 포함하는, 부호화 시스템.
제8항에 있어서,

상기 엣지-적응 변환의 율-왜곡 비용은 엣지-적응 변환을 위한 왜곡, 엣지-적응 변환을 위한 비트율 및 상기 엣지-적응 변환에 이용되는 부호화된 엣지 맵을 위한 비트율에 기초하여 계산되는, 부호화 시스템.
입력된 비트스트림을 엔트로피 복호화하여 화소를 복호화하는 엔트로피 복호화부;

상기 입력된 비트스트림에서 엣지의 위치를 나타내는 정보를 복호화하는 정보 복호화부;

상기 복호화된 정보에 기초하여 그래프를 생성하는 그래프 생성부; 및

상기 그래프에 기초하여 엔트로피 복호화된 화소를 역변환하는 역변환부

를 포함하는 복호화 시스템.
제12항에 있어서,

상기 그래프 생성부는,

상기 예측 부호화된 화소에 대한 잔여 블록에 포함된 화소 중 서로 이웃한 화소간에 엣지가 존재하지 않는 화소를 연결하여 상기 그래프를 생성하는, 복호화 시스템.
입력된 비트스트림을 엔트로피 복호화하여 화소를 복호화하는 엔트로피 복호화부; 및

변환 모드가 엣지-적응 변환에 대한 모드인 경우, 상기 엔트로피 복호화된 화소를 엣지-적응 역변환을 수행하는 엣지-적응 역변환부

를 포함하고,

상기 변환 모드는 상기 엣지-적응 변환 및 이산 코사인 변환 각각의 율-왜곡 비용에 기초하여 부호화 시스템에서 결정되는, 복호화 시스템.
제14항에 있어서,

상기 엣지-적응 변환의 율-왜곡 비용은 상기 엣지-적응 변환을 위한 왜곡, 상기 엣지-적응 변환을 위한 비트율 및 상기 엣지-적응 변환에 이용되는 부호화된 엣지 맵을 위한 비트율에 기초하여 상기 부호화 시스템에서 계산되는, 복호화 시스템.
입력된 영상의 화소를 예측 부호화하는 단계;

상기 입력된 영상에서 엣지의 위치를 나타내는 정보를 생성하는 단계;

상기 생성된 정보에 기초하여 그래프를 생성하는 단계;

상기 그래프에 기초하여 상기 예측 부호화된 화소를 변환하는 단계; 및

상기 생성된 정보를 부호화하는 단계

를 포함하는 부호화 방법.
입력된 영상의 화소를 예측 부호화하는 단계;

최적 모드를 선택하는 단계; 및

상기 최적 모드로 엣지-적응 변환에 대한 모드가 선택된 경우, 상기 예측 부호화된 화소에 대해 엣지-적응 변환을 수행하는 단계

를 포함하고,

상기 최적 모드는 상기 엣지-적응 변환 및 이산 코사인 변환 각각의 율-왜곡 비용에 기초하여 선택되는, 부호화 방법.
입력된 비트스트림을 엔트로피 복호화하여 화소를 복호화하는 단계;

상기 입력된 비트스트림에서 엣지의 위치를 나타내는 정보를 복호화하는 단계;

상기 복호화된 정보에 기초하여 그래프를 생성하는 단계; 및

상기 그래프에 기초하여 엔트로피 복호화된 화소를 역변환하는 단계

를 포함하는 복호화 방법.
입력된 비트스트림을 엔트로피 복호화하여 화소를 복호화하는 단계; 및

변환 모드가 엣지-적응 변환에 대한 모드인 경우, 상기 엔트로피 복호화된 화소를 엣지-적응 역변환을 수행하는 단계

를 포함하고,

상기 변환 모드는 상기 엣지-적응 변환 및 이산 코사인 변환 각각의 율-왜곡 비용에 기초하여 부호화 시스템에서 결정되는, 복호화 방법.
제16항 내지 제19항 중 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.