KR20150068402A

KR20150068402A - 동영상 압축 방법

Info

Publication number: KR20150068402A
Application number: KR1020157010193A
Authority: KR
Inventors: 일란 바-온; 올레그 코스텐코
Original assignee: 뉴메리 엘티디.
Priority date: 2012-10-07
Filing date: 2013-09-30
Publication date: 2015-06-19
Also published as: EP2904807A4; EP2904807A2; IL238006B; JP2015536108A; US10334256B2; US20150256837A1; CA2886174A1; WO2014053982A3; IL238006A0; CA2886174C; IN2015DN02570A; CN104704839A; WO2014053982A2

Abstract

본 발명은, 동영상을 인코딩하도록 구성된 인코딩부와, 상기 인코딩된 동영상을 재구성하도록 구성된 재구성부 - 상기 재구성부는 디코딩 데이터의 비트 스트림을 생성함 - 와, 디코딩 데이터의 비트 스트림을 수신하고, 상기 비트 스트림내의 동영상을 디코딩하도록 구성된 디코딩부를 포함하는 동영상 코덱이다.

Description

동영상 압축 방법{VIDEO COMPRESSION METHOD}

본 발명은 동영상 압축의 분야에 관한 것이다.

관련 출원에 관한 상호 참조

본 특허 출원은 2012년 10월 7일에 출원된 미국 가특허 출원 일련 번호 61/710,723으로부터 우선권을 주장하고, 이와 관련되며, 미국 가특허 출원은 그 전체가 본원에 참조로서 포함된다.

원시 동영상 파일은 엄청 많은 공간을 소모한다. 예를 들어, 초당 60 프레임(fps), 1920x1080 픽셀의 프레임 해상도, 컬러 농도 3 및 컬러당 8비트를 가진 고화질(HD) 영화는,

1,920*1,080*60*3 = 초당 373,248,000 바이트를 소모한다.

그리고 이러한 영화를 두 시간 보는 것은,

373,248,000*7,200 = 2,687,385,600,000 바이트

3 테라 바이트(Tbytes)를 소모한다.

일반 DVD 디스크, 즉, 4.7 기가 바이트(Gbyte) 디스크에 영화를 저장하려면, 우리는,

2,687 / 4.7

600 DVD 디스크가 필요하다.

그리고, 인터넷으로 이 영화를 전송하기 위해서는, 다시 말해, 빠른 100Mbps 채널을 통해 전송하려면, 우리는,

2,687,386 * 8 / 100

2,149,908초

60 시간이 소요된다.

동영상 압축은 지각된 품질에 영향을 주지 않으면서 동영상 크기를 줄이는 기술 분야이다.

동영상 콘텐츠는 항상 최고의 장비와 최고의 사진 촬영기로 찍히지는 않는다. 이러한 경우에, 동영상 개선(video enhancement)으로도 알려진 디지털 이미지 프로세싱이 동영상의 가시적 품질을 실질적으로 향상시킬 수 있고, 동영상 압축 프로세스에 도움이 될 수 있다. 동영상 개성을 위해 더욱 알려진 방법 중 일부는 다음과 같은 동영상 프리프로세싱(preprocessing) 툴(tool)을 사용한다.

디- 인터레이싱 ( De - interlacing ) 인터레이스된 영화는 빠르게 움직이는 물체를 녹화할 때 문제가 발생할 수 있다. 움직이는 물체는 "짝수" 화면에서 한 곳에 있고, "홀수" 화면에서 다른 곳에 있을 수 있어서, 매우 혼란스러운 "손상된" 화면을 생성할 수 있다.

디- 블록킹 ( De - blocking ) 블록형 인공물은 현재 MPEG의 낮은 품질 고도로 압축된 동영상의 부작용이다. 디-블록킹은 이러한 동영상의 품질을 많이 증가시킨다.

샤프닝(Sharpening)은 텍스쳐와 세부사항을 강조하는데, 대부분 디지털 이미지를 포스트프로세싱 할 때 중요하다. "언샤프 마스ㅋ(unsharp mask)"가 이미지를 선명하게 하는데 실제로 사용된다.

디- 노이징 ( De - noising ) 노이즈의 어떤 정도는 "신호"를 송신 또는 수신하는 어떠한 전자 장치에 항상 존재한다. 텔레비젼에서, 이러한 신호는 케이블을 통해 송신되거나 안테나에서 수신되는 방송 데이터이다. 디지털 카메라에서, 이 신호는 카메라 센서를 치는 광이다. 동영상 디-노이징은 동영상 신호로부터의 노이즈를 제거하는 프로세스이다.

스태빌라이제이션(Stabilization)은 카메라의 움직임과 관련된 흔들림(blurring)을 줄이는데 사용된다. 구체적으로, 이는 카메라 또는 그 밖의 이미징 장치의 팬(pan) 또는 틸트(tilt)를 보상한다. 동영상 카메라를 사용하여, 카메라의 흔들림은 녹화된 동영상에서 가시적인 프레임 투 프레임 지터(frame-to-frame jitter)를 야기한다.

카메라 캘리브레이션(Camera Calibration)은 안정하고 신뢰성 있는 이미지를 얻기 위해 중요하다. 동기식으로 작동하거나 부정확하게 조절된 카메라는 흐릿하거나 혼란스러운 이미지를 생성할 수 있다.

이러한 툴은 동영상 품질을 많이 개선시키고, 압축 프로세스에 도움을 줄 수 있다. 여기서, 우리는 이러한 문제를 무시하고, 동영상은 원하는 대로 이미 프리프로세싱되었다고 가정한다. 좀 더 자세한 사항은 참조 문헌 [1]을 참조한다.

디지털 동영상은, 동영상, 오디오 및 컨트롤과 같은 복수의 스트림으로 구성되고, 이는 함께 동일한 컨테이너 파일(container file) 내에 저장된다. 예를 들어, 공통의 컨테이너 포맷은 AVI(Audio Video Interlaced), WMV(Windows Media Video), FLV(Flash Video), MOV(Apple Quick Time Movie)이다. 동영상 스트림 자체는 다른 스트림 또는 컨테이너 타입과 대개 독립적이고, 많은 다양한 포맷으로 표현될 수 있다. Apple iTunes나 Microsoft Windows Media Player와 같은 미디어 플레이어는 해당 Codec ( Encoder / Decoder ) 소프트웨어를 사용하여 스크린상에 동영상을 디스플레이한다.

디스플레이된 동영상은 원시 RGB 색 공간 포맷으로 대개 표현되는데, 이는 사람 시각 시스템도 유사한 방식, 즉, 사람 눈 칼라 비전은 빨강, 초록 및 파랑 컬러 센서에 기초하여 작동하기 때문이다. 원시 RGB 파일(100)은 도 1에 개략적으로 도시되는데, 이는 헤더 섹션(120) 이후의 프레임(130)을 포함한다. 헤더(120)는 가령, n - 로우의 수, m - 컬럼의 수, 그리고 N - 프레임의 수와 같은 동영상 파라미터를 포함한다. 프레임(130)은 n * m 픽셀값을 포함하고, 각각은 R, G 및 B에 대한 트리플릿(triplet)이다.

원시 YUV 색 공간 포맷은 동영상 표현을 위한 또 다른 매우 유용한 포맷이다. 여기서, Y는 동영상의 검정색과 흰색의 표현에 해당하고, U 및 V에 추가된 색차(color difference)에 해당한다. RGB에서 YUV로 또는 그 반대로 전환하기 위한 많은 유사한 공식들이 있다. 이들 중 하나(참고 문헌 [2] 참조)는 도 2에 예시되는데, 여기서, RGB에서 YUV로의 변환 공식은 유닛(210)에서 주어지고, YUV에서 RGB로의 변환 공식은 유닛(220)에서 주어진다. 원시 YUV 파일(300)은 도 3에 개략적으로 도시되는데, 이는 도 1의 유닛(120)과 같은 헤더 섹션(310), 이후에 이어지는 Y 프레임(320), U 프레임(330) 및 V 프레임(340)을 포함한다. Y, U 및 V 구성에 대한 전형적인 프레임이 도시된다. 다음에 이어지는 것은, 우리는 일반성(w.l.g.)의 손실 없이 컨테이터 파일의 동영상 스트림 부분만을 고려하고, 우리는 YUV 색 공간 표현을 가정한다.

카메라는 영화 동안에 뷰의 각도를 많이 변화시킬 수 있다. 영화의 컷이라고도 불리는 장면의 이러한 변화는 이들의 모양과 콘텐츠에 의해 구별된다(참고 문헌 [3] 참조). 압축의 면에서, 이는 우리가 컷들 사이에 약간의 중복(redundancy)을 가지고 있다는 의미이다.

컷 파일(400)은 도 4에 개략적으로 도시되는데, 이는 헤더 섹션(410)에 이어서 컷(420)을 포함한다. 헤더는 다음과 같다.

n은 로우의 수이고, m은 컬럼의 수이다.

N은 프레임의 수이고, M은 컷의 수이다.

파일의 각각의 컷은 도 3의 유닛(300)에서 주어진 YUV 파일 포멧과 동일한 구성을 가진다. 간결성을 위해, 우리는 이제부터, 각각의 이러한 컷의 오직 하나의 이러한 구성에 대해 고려할 것이다. 모든 구성으로의 일반성이 간단하다.

잔물결과 다중잔물결(참고문헌 [4] 참조)은 이하의 응용분야에서 우리가 사용하는 중요한 수학적 툴이다. 전형적인 이산 웨이블릿 변환(DWT) 필터는 도 5에 도시되는데, 한 쌍의 로우 패스와 하이 패스 분석 필터가 유닛(510)에 도시되고, 한 쌍의 로우 패스와 하이 패스 분석 필터가 유닛(520)에 도시된다. 예를 들어, 일차원 Haar 변환이 유닛(530)에 도시된다.

일반적으로, 우리는 도 6에 도시된 바와 같이, m > 1 필터를 가지고, 분석 필터는 유닛(610)에 도시되고, 합성 필터는 유닛(620)에 도시된다. 예를 들어, 2D Haar 변환은 유닛(630)에 도시된다. 좀 더 일반적으로, 필터는 이산 멀티웨이블릿 변환(DMWT)에 관한 것일 수 있다.

정수의 래티스(lattice,

)는 유클리드 공간

내의 정수의 n-튜플의 세트이다. 프레임은 래티스(

) 상의 직사각형 그리드(grid)로서 표현될 수 있고,

상의 큐빅 그리드로서 동영상으로 표현될 수 있다. 그 자체로 래티시인 래티스의 서브세트는 서브-래티스로 불린다.

의 서브-래티스의 예시는 도 7에 주어진다. 퀸컹스(Quincunx) 서브-래티스는 유닛(710)에 도시된다. 하얀 동그란 점은 짝수의 서브-래티스에 해당하고, 어두운 동그란 점은 홀수의 서브-래티스에 해당한다. 다이애딕(Dyadic) 서브-래티스는 유닛(720)에 유사하게 도시된다. 퀸컹스 서브-래티스는 유닛(715) 내의 딜레이션 매트릭스(dilation matrix)에 의해 결정되고, 다이애딕 서브-래티스는 유닛(725)의 딜레이션 매트릭스에 의해 결정된다. 서브-래티스의 수는 퀸컹스 경우에는 2, 다이애딕에서는 4인 해당 딜레이션 매트릭스의 판별식에 의해 결정된다. 다운-샘플링(Down-sampling)은 주어진 래티스로부터 서브-래티스를 추출하는 프로세스에 관한 것이다. 예를 들어, 우리는 도 8에서 다이애딕 다운 샘플링을 디스플레이한다. 입력 신호는 유닛(810)에 주어지고, 시간 다운 샘플링은 유닛(820)에 주어지며, 공간 다운 샘플링은 유닛(830)에 주어지고, 결합된 공간 및 시간 다운 샘플링은 유닛(840)에 주어진다.

본 발명의 태양에 따르면, 동영상을 인코딩하는 방법이 제공되는데, 상기 방법은, 동영상을 수신하는 단계와, 상기 수신된 동영상에 대해 수축 연산(shrink operation)을 수행하는 단계 - 상기 수축 연산은, 상기 동영상으로부터 제1 더 낮은 해상도 동영상을 생성하는 단계 및 추가적인 N-1 더 낮은 해상도 동영상을 순차적으로 생성하는 단계를 포함하고, 상기 추가적인 더 낮은 해상도 동영상의 각각은 상기 이전의 더 낮은 해상도 동영상으로부터 생성됨 - 와, 가장 낮은 해상도 동영상을 압축하는 단계와, 상기 가장 낮은 해상도 압축된 동영상을 압축해제함에 의해 가장 낮은 해상도 재구성된 동영상을 생성하는 단계와, 상기 가장 낮은 해상도 재구성된 동영상에 제1 상승 연산을 수행하는 단계 - 상기 제1 상승 연산은 N 개의 더 높은 해상도 재구성된 동영상을 순차적으로 생성하는 단계를 포함하고, 상기 더 높은 해상도 재구성된 동영상의 각각은, 상기 더 낮은 해상도 재구성된 동영상으로부터 더 높은 해상도 동영상을 생성하는 단계와 상기 각각의 더 낮은 해상도 동영상과 상기 생성된 더 높은 해상도 동영상 사이의 나머지(residual)를 계산하는 단계와, 상기 계산된 나머지를 압축하는 단계와 상기 압축된 나머지를 압축해제하는 단계와 상기 압축해제된 나머지와 상기 생성된 더 높은 해상도 동영상을 결합하여 각각의 더 높은 해상도 재구성된 동영상을 생성하는 단계에 의하여, 상기 이전의 더 낮은 해상도 재구성된 동영상으로부터 생성됨 - 와, 상기 가장 낮은 해상도 압축된 동영상, 상기 압축된 나머지 및 상기 N을 포함하는 제어 정보를 포함하는 비트 스트림을 제공하는 단계를 포함한다.

비트 스트림은 로우 패스 분석 필터를 포함하고, 더 낮은 해상도 동영상을 생성하는 단계는 로우 패스 분석 필터를 동영상에 적용하는 단계를 포함할 수 있다.

비트 스트림은, 흔들림 연산자 및 다운 샘플링 연산자를 포함하고, 더 낮은 해상도 동영상을 생성하는 단계는 흔들림 연산자를 동영상에 적용하는 단계와 다운 샘플링 연산자를 흔들림 연산의 결과에 적용하는 단계를 포함할 수 있다.

비트 스트림은 흔들림 연산자 및 다운 샘플링 연산자를 포함할 수 있고, 상기 로우 패스 분석 필터는 상기 흔들림 연산자 및 다운 샘플링 연산자로부터 계산된다.

비트 스트림은 로우 패스 합성 필터를 포함할 수 있고, 더 높은 해상도 동영상을 생성하는 단계는 로우 패스 합성 필터를 더 낮은 해상도 재구성된 동영상에 적용하는 단계를 포함한다.

비트 스트림은 업 샘플링 연산자, 보간 연산자, 오라클 연산자 및 흔들림 방지 연산자를 포함할 수 있고, 더 높은 해상도 동영상을 생성하는 단계는, a. 업 샘플링 연산자에 이어서 보간 연산자를 더 낮은 해상도 재구성된 동영상에 적용하는 단계와, b. 오라클 연산자를 보간 연산자의 결과에 적용하는 단계와, c. 흔들림 방지 연산자를 오라클 연산자의 결과에 적용하는 단계를 포함한다.

비트 스트림은 업 샘플링 연산자, 보간 연산자, 오라클 연산자 및 흔들림 방지 연산자를 포함할 수 있고, 상기 로우 패스 합성 필터가 상기 업 샘플링 연산자, 보간 연산자, 오라클 연산자 및 흔들림 방지 연산자로부터 계산될 수 있다.

나머지를 계산하는 단계는, 각각의 더 낮은 해상도 동영상과 더 높은 해상도 동영상간의 차이값을 계산하는 단계를 포함할 수 있다.

비트 스트림은 하이 패스 분석 필터를 포함할 수 있고, 나머지를 계산하는 단계는 하이 패스 분석 필터를 계산된 차이값에 적용하는 단계를 추가적으로 포함할 수 있다.

하이 패스 분석 필터는 상기 계산된 차이값으로부터 계산될 수 있다.

더 높은 해상도 재구성된 동영상을 계산하는 단계는 압축해제된 나머지를 더 높은 해상도 동영상에 추가하는 단계를 포함할 수 있다.

비트 스트림은 하이 패스 합성 필터를 포함할 수 있고, 더 높은 해상도 재구성된 동영상을 생성하는 단계는 하이 패스 합성 필터를 각각의 압축해제된 나머지에 적용하는 단계 및 결과를 더 높은 해상도 동영상에 추가하는 단계를 포함할 수 있다.

하이 패스 합성 필터는 로우 패스 분석 필터 및 하이 패스 분석 필터 및 로우 패스 합성 필터로부터 계산될 수 있다.

본 발명의 또 다른 태양에 따르면, 상기 방법에 따라 인코딩된 동영상을 디코딩하는 방법이 제공되는데, 상기 디코딩하는 방법은, 상기 가장 낮은 해상도 압축된 동영상, 상기 압축된 나머지 및 상기 제어 정보를 포함하는 상기 비트스트림을 수신하고 프로세싱하는 단계; 상기 가장 낮은 해상도 압축된 동영상을 압축해제함에 의해 가장 낮은 해상도 재구성된 동영상을 생성하는 단계; 및 상기 가장 낮은 해상도 재구성된 동영상에 제2 상승 연산을 수행하는 단계 - 상기 제2 상승 연산은 N 개의 더 높은 해상도 재구성된 동영상을 순차적으로 생성하는 단계를 포함하고, 상기 더 높은 해상도 재구성된 동영상의 각각은, 상기 더 낮은 해상도 재구성된 동영상으로부터 더 높은 해상도 동영상을 생성하는 단계와 상기 각각의 더 낮은 해상도 동영상과 상기 생성된 더 높은 해상도 동영상 사이의 나머지(residual)를 디코딩하는 단계와, 상기 디코딩된 나머지와 상기 생성된 더 높은 해상도 동영상을 결합하여 각각의 더 높은 해상도 재구성된 동영상을 생성하는 단계에 의하여, 상기 이전의 더 낮은 해상도 재구성된 동영상으로부터 생성됨 - 를 포함한다.

비트 스트림은 로우 패스 합성 필터를 포함할 수 있고, 더 높은 해상도 동영상을 생성하는 단계는 로우 패스 합성 필터를 더 낮은 해상도 재구성된 동영상에 적용하는 단계를 포함할 수 있다.

비트 스트림은 업 샘플링 연산자, 보간 연산자, 오라클 연산자 및 흔들림 방지 연산자를 포함하고, 더 높은 해상도 동영상을 생성하는 단계는, a. 업 샘플링 연산자에 이어서 보간 연산자를 더 낮은 해상도 재구성된 동영상에 적용하는 단계와, b. 오라클 연산자를 보간 연산자의 결과에 적용하는 단계와, c. 흔들림 방지 연산자를 오라클 연산자의 결과에 적용하는 단계를 포함할 수 있다.

본 발명의 또 다른 태양에 따르면, 동영상 코덱이 제공되는데, 상기 동영상 코덱은 동영상을 인코딩하도록 구성된 인코딩부와, 상기 인코딩된 동영상을 재구성하도록 구성된 재구성부 - 상기 재구성부는 디코딩 데이터의 비트 스트림을 생성함 - 와, 디코딩 데이터의 비트 스트림을 수신하고, 상기 비트 스트림내의 동영상을 디코딩하도록 구성된 디코딩부를 포함한다.

인코딩부는, 동영상을 수신하고, 상기 수신된 동영상에 대해 수축 연산을 수행하도록 구성될 수 있고, 상기 수축 연산은 상기 동영상으로부터 제1 더 낮은 해상도 동영상을 생성하는 단계와, 추가적인 N - 1 더 낮은 해상도 동영상을 순차적으로 생성하는 단계 - 상기 추가적인 더 낮은 해상도 동영상의 각각은 상기 이전의 더 낮은 해상도 동영상으로부터 생성됨 - 및 가장 낮은 해상도 동영상을 압축하는 단계를 포함한다.

재구성부는, 상기 가장 낮은 해상도 압축된 동영상을 압축해제함에 의해 가장 낮은 해상도 재구성된 동영상을 생성하고, 상기 가장 낮은 해상도 재구성된 동영상에 제1 상승 연산을 수행 - 상기 제1 상승 연산은 N 개의 더 높은 해상도 재구성된 동영상을 순차적으로 생성하는 단계를 포함하고, 상기 더 높은 해상도 재구성된 동영상의 각각은, 상기 더 낮은 해상도 재구성된 동영상으로부터 더 높은 해상도 동영상을 생성하는 단계와 상기 각각의 더 낮은 해상도 동영상과 상기 생성된 더 높은 해상도 동영상 사이의 나머지(residual)를 계산하는 단계와, 상기 계산된 나머지를 압축하는 단계와 상기 압축된 나머지를 압축해제하는 단계와 상기 압축해제된 나머지와 상기 생성된 더 높은 해상도 동영상을 결합하여 각각의 더 높은 해상도 재구성된 동영상을 생성하는 단계에 의하여, 상기 이전의 더 낮은 해상도 재구성된 동영상으로부터 생성됨 - 하되, 상기 비트 스트림은 상기 압축된 가장 낮은 해상도 동영상, 상기 압축된 나머지 및 상기 N을 포함하는 제어 정보를 포함한다.

디코딩부는, 상기 가장 낮은 해상도 압축된 동영상, 상기 압축된 나머지 및 상기 제어 정보를 포함하는 상기 비트 스트림을 수신하고 프로세싱하고, 상기 가장 낮은 해상도 압축된 동영상을 압축해제함에 의해 가장 낮은 해상도 재구성된 동영상을 생성하며, 상기 가장 낮은 해상도 재구성된 동영상에 제2 상승 연산을 수행 - 상기 제2 상승 연산은 N 개의 더 높은 해상도 재구성된 동영상을 순차적으로 생성하는 단계를 포함하고, 상기 더 높은 해상도 재구성된 동영상의 각각은, 상기 더 낮은 해상도 재구성된 동영상으로부터 더 높은 해상도 동영상을 생성하는 단계와 상기 각각의 더 낮은 해상도 동영상과 상기 생성된 더 높은 해상도 동영상 사이의 나머지(residual)를 디코딩하는 단계와, 상기 디코딩된 나머지와 상기 생성된 더 높은 해상도 동영상을 결합하여 각각의 더 높은 해상도 재구성된 동영상을 생성하는 단계에 의하여, 상기 이전의 더 낮은 해상도 재구성된 동영상으로부터 생성됨 - 하도록 구성될 수 있다.

본 발명의 또 다른 태양에 따르면, 상기 방법에 따라 인코딩된 동영상을 디코딩하는 방법이 제공되는데, 상기 디코딩부는 상기 재구성된 더 높은 해상도 동영상을 분석하도록 구성된다.

디코딩부는 상기 재구성된 동영상의 모션 필드(motion field)를 계산하도록 구성될 수 있다.

디코딩부는 상기 재구성된 동영상의 물체 인식을 수행하도록 구성될 수 있다.

본 발명을 더욱 잘 이해하고, 어떻게 동일한 효과를 수행될 수 있는지를 나타내기 위하여, 도면을 참조하여 순전히 예로서 참조될 것이다.
이제 도면을 자세히 참조하면, 내용은 본 발명의 바람직한 실시예의 예시로서, 그리고 설명을 위한 논의에 의해 나타나고, 본 발명의 원리 및 개념적인 태양의 설명을 용이하게 이해하고 유용하다고 믿는 것을 제공하기 위해 제시된다. 이와 관련하여, 본 발명의 기본적인 이해를 위해 필요한 것보다 더 자세히 본 발명의 구조적인 세부 사항을 나타내지 않고, 도면과 함께 설명에 의해, 본 발명의 여러 형태가 실제로 어떻게 구현될 수 있는지를 기술 분야의 당업자에게 명백하게 될 것이다.
도 1은 원시 RGB 파일을 기술한다.
도 2는 RGB 포맷과 YUV 포맷간의 변형을 기술한다.
도 3은 원시 YUV 파일을 기술한다.
도 4는 컷 파일을 기술한다.
도 5는 2-방법의 이산 웨이블릿 변형 필터를 기술한다.
도 6은 m-방법의 이산 웨이블릿 변형 필터를 기술한다.
도 7은 래티스 및 서브-래티스를 기술한다.
도 8은 다이애딕 다운 샘플링을 기술한다.
도 9는 새로운 코덱의 순서도이다.
도 10은 인코더의 순서도이다.
도 11은 비트 스트림을 기술한다.
도 12는 디코더의 순서도이다.
도 13은 M 코덱을 기술한다.
도 14은 M 코덱을 기술한다.
도 15은 M 코덱을 기술한다.
도 16은 O 코덱 파라미터를 기술한다.
도 17은 O 코덱을 기술한다.
도 18은 O 코덱을 기술한다.
도 19는 OM 코덱을 기술한다.
도 20은 OM 코덱을 기술한다.

본 발명은, H.264와 같은 표준 MPEG 방법과 달리, 최신 컴퓨터 비전과 수학적 방법을 사용하여, 인코더와 디코더 모두에서 동영상의 분석으로부터 이익을 얻는 동영상 압축의 새로운 기술을 제공한다. 예를 들어, 모션 필드 계산 및 물체 인식(참고문헌 [1] 및 [7] 참조)은 인코더와 디코더 모두에서 동영상을 재구성하는데 사용될 수 있다.

새로운 제너릭 코덱( Codec )의 개략도는 도 9에 도시된다. 이 코덱은 두 개의 주요 부분, 인코더( Encoder )와 디코더( Decoder )로 구성된다. 인코더(1000)는 동영상(Y)을 비트 스트림( Bit Stream )(1100)으로 압축하고, 디코더(1200)는 비트 스트 림을 재구성된 동영상(

)으로 압축해제한다. 인코더로부터의 출력이고 디코더로의 입력인 비트 스트림(1100)은 압축된 동영상을 나타낸다. 비트 스트림은 디스크상에 저장되거나 네트워크로 전송될 수 있다. Y 및

는 이하 설명 전반에 걸쳐 "동영상"으로 언급된다. Y는 상기 설명된 바와 같이 컷의 성분이라는 점을 유의한다.

다음에 이어지는 것은, 우리는 인코더(1000)(도 10 참조), 비트 스트림(1100)(도 11 참조) 및 디코더(1200)(도 12 참조)를 기술한다.

인코더(1000)는 다음과 같이 세 개의 단계를 가진다.

단계 I( Stage I) (E) 은 다음과 같이 N 반복으로 구성된다.

Y₀ ≡ Y를 정의하자. 그리고 나서, 동영상 (Y_k)는 반복 k = 0,…,N-1로의 입력이고, 동영상(Y_k ₊₁)은 반복 k = 0,…,N-1의 출력이다. 여기서, 동영상(Y_k ₊₁)은 동영상(Y_k)의 더 낮은 해상도, 더 거친 표현이다. 더 낮은 해상도는 공간적으로 더 낮은 해상도, 시간적으로 더 낮은 해상도 또는 공간적 및 시간적으로 더 낮은 해상도를 의미한다. 우리는 동영상 해상도를 낮추는 이러한 연산을 수축( Shrin k ) 연산이라고 부른다. 이러한 반복의 수, 다시 말해 N은 인코더( Encoder )에 의해 결정된다.

단계 II ( Stage II ) (E) 는 압축( Compress ) 및 압축해제( Decompress ) 연산으로 구성된다. 압축 연산은 특허 [1]의 예시에서 논의된 바와 같이, 동영상을 압축하기 위한 어떤 방법을 말한다. 압축해제 연산은 압축된 동영상으로부터 원래의 동영상으로 재구성하는 반대 연산을 말한다. Y_N을 단계 I (E) 이후의 결과 동영상으로 표시하고, 우리는 압축된 동영상을 F_N으로, 압축해제된 동영상을

으로 표시한다. 동영상(

)은 압축 방법의 품질에 의해 방해된(hamper) 동영상(Y_N)의 재구성이다. 손실 없는 압축의 경우에, 재구성된 동영상(

)은 Y_N과 정확히 동일하다. 그러나, 실제로, 압축 프로세스는 손실이 있고,

는 Y_N과 동일하지 않다. 대개, 압축이 강할수록, 동영상은 더욱 상이하고, 더 많은 왜곡이 존재한다. 우수한 압축 방법은 재구성된 동영상의 품질을 주시하면서, 압축된 동영상의 크기를 최소로 한다. 압축된 동영상(F_N)은 비트 스트림(1100)에 포함된다는 것을 또한 유의한다.

단계 III ( Stage III ) (E)는 다음과 같이, N 백워드 반복을 포함하는 제1 상승 연산으로 구성된다.

반복 k = N -1,…, 0 에서, 이전의 반복(또는 k = N - 1의 경우에서의 단계)로부터 재구성된 동영상(

)은 입력이고, 출력은 재구성된 동영상(

)이며, 이는 동영성(Y_k)와 (공간적 및 시간적으로) 동일한 해상도를 가진다. 그러므로, 최종 동영상(

)은 초기 동영상(Y₀)의 재구성이다(상기 단계 I (E) 참조).

를 얻기 위하여, 우리는 다음 단계를 따른다.

1) 우선, 우리는 동영상(

)을 동영상(Y_k)와 동일한 해상도인 더 높은 해상도 동영상(

)으로 치수를 조절한다. 우리는 동영상 해상도를 높이는 이러한 연산을 Expand 연산이라고 한다.

2) 다음으로, 우리는 동영상(Y_k)과 확장된 동영상(

) 간의 나머지(Residual, R_k)를 계산한다. 우리는 나머지를 계산하는 이러한 연산을 Resultant 연산이라고 한다.

3) 마지막으로, 우리는 나머지(R_k)를 E_k로 압축한다. 여기서, 다시 압축에 의해, 우리는 상기 단계 II (E)에서 논의되었던 임의의 유효한 압축 방법을 의미한다. 우리는 나머지를 압축하는 이러한 연산을 Encode 연산이라고 한다. 압축된 나머지(Ek)는 비트 스트림(1100)으로 포함된다는 것도 유의한다.

Encoder의 다음 단계는 Decoder에서 행해진 연산을 시뮬레이트한다.

4) 우리는 압축된 나머지(E_k)를 재구성된 나머지(

)로 압축해제한다. 우리는 압축된 나머지를 압축해제하는 이러한 연산을 Decode 연산이라고 한다.

5) 우리는 확장된 동영상(

)과 재구성된 나머지(

)를 결합하여 재구성된 동영상(

)을 얻는다. 우리는 확장된 동영상과 재구성된 나머지를 결합하는 이러한 연산을 Assemble 연산이라고 한다. Assemble 연산은 Resultant 연산의 반대의 뜻이다.

비트 스트림(1100)은 다음 구성을 포함한다.

ctrl, Encoder에는 알려져 있으나 Decoder에서는 알려지지 않은 추가적인 정보이며, 이는 비트 스트림을 압축해제하기 위해 필요로 한다. 예를 들어, Encoder에 의해 결정되는 반복의 수(N)는 ctrl의 일부이다. ctrl은 압축된 형태로 전송된다는 것도 유의한다.

압축된 동영상(F_N)

압축된 나머지: E_k, k = N - 1,…, 0.

Decoder(1200)는 다음과 같은 두 개의 단계를 가진다.

단계 I ( Stage I) (D) 는 Process 및 Decompress 연산으로 구성된다. Process 연산은 ctrl 정보를 복원하고 필요한 파라미터, 가령, 디코딩을 위해 요구되는 반복 수(N)와 같은 필요한 파라미터를 설정한다. Decompress 연산은, Encoder의 Stage II (E)에서 행해진 바와 같이, F_N을 동영상(

)으로 압축해제한다.

단계 II ( Stage II ) (D) 는 다음과 같이, N 백워드 반복을 포함하는 제2 상승 연산으로 구성된다.

반복 k = N - 1,…,0 에서, 이전의 반복(또는 k = N - 1의 경우에서의 단계)로부터 재구성된 동영상(

)은 입력이고, 출력은 재구성된 동영상(

)이다. 이는 다음과 방법으로 행해진다(또한 Encoder의 단계 III (E) 참조).

1) Decode 연산을 사용하여 압축된 나머지(E_k)를 재구성된 나머지(R_k)로 압축해제한다.

2) Assemble 연산을 사용하여 확장된 동영상(

)과 재구성된 나머지(

)를 결합하여 재구성된 동영상(

)을 얻는다.

본 발명을 더욱 명확하게 하기 위하여, 여기서 우리는 제너릭 코덱의 어떤 가능한 실행예를 기술한다. 이들은 M 코덱, O 코덱 및 OM 코덱이다. 그러나, 많은 그 밖의 실싱예도 가능하고 이들 예에 의해 배제되지 않는다는 것을 유의한다.

실시예 I: 다중잔물결 (M) 코덱( The Multiwavelet (M) Codec)

M 코덱은 도 13에 유닛(1310)에 도시된 바와 같이, DMWT 필터라 불리는, m_k 다중잔물결 필터의 각각의 세트에 의해 지배된다. 이들의 역할은 다음에 설명된다.

Encoder(1000)에서,

단계 I ( Stage I) (E) 반복 k = N -1,…, 0에서, Shrink 연산은 로우 패스 분석 필터(

)에 의해 결정된다. 다시 말해, 우리는 필터(

)를 Y_k에 적용하여 Y_k+1을 얻는다(도 13의 유닛(1320) 참조).

단계 II ( Stage II ) (E) 는 이전과 같이 일반적이다.

단계 III ( Stage III ) (E) 반복 k = N - 1,…, 0에서,

1) Expand 연산은 로우 패스 합성 필터(

)에 의해 결정된다. 다시 말해, 우리는 필터(

)를

에 적용하여

를 얻는다(도 13의 유닛(1330) 참조).

2) Resultant 연산은 m_k - 1에 하이 패스 분석 필터(

)에 의해 결정된다.

우선, Y_k와

간의 차이점, 즉, D_k가 계산된다(도 14의 유닛(1410) 참조).

그리고 나서, j = 1,…, m_k - 1에 대하여, 우리는

를 D_k에 적용하여 각각의 나머지 구성(

)을 얻는다(유닛(1420) 참조).

3) 우리는 j = 1,…, m_k - 1에 대하여, 나머지(

)를

로 인코딩한다(유닛(1430) 참조).

4) 우리는 j = 1,…, m_k - 1에 대하여,

로부터 재구성된 나머지(

)를 디코딩한다(도 15의 유닛(1510) 참조).

5) Assemble 연산은 m_k - 1 하이 패스 합성 필터(

)에 의해 결정된다.

j = 1,…, m_k - 1에 대하여, 우리는

를

에 적용하여 구성

를 얻는다(유닛(1520) 참조).

그리고 나서, 우리는 합산에 의해

를 재구성한다.

유닛(1530) 참조.

비트 스트림(1100)에서,

ctrl 정보는 N에 더하여 DMWT 필터를 포함한다.

디코더(1200)에서,

단계 I (D) 는 이전과 같이, Process 연산과 Decompres s 연산으로 구성된다.

단계 II (D) 는 반복 k = N - 1,…,0에서,

1) 우리는 j = 1,…, m_k - 1에 대하여,

로부터 재구성된 나머지(

)를 디코딩한다(도 15의 유닛(1510) 참조).

2) 우리는 상기 단계 III (E)에서와 같은 Assemble 연산을 사용하여 동영상(

)을 재구성한다. 다시 말해, 상기 단계 5에서와 같이, 우리는

를

에 적용하여 구성

를 얻고, 이들 구성을

와 합산하여

를 얻는다(유닛(1520 및 1530) 참조).

실시예 II : 오라클(O) 코덱( The Oracle Codec )

O 코덱은 각각의 세트의 파라미터에 의해 지배된다(도 16 참조). 이러한 세트는 흔들림/흔들림 방지 인버스 연산자(유닛(1610) 참조), 다운 샘플링/업 샘플링 반대 연산자 및 보간 연산자(유닛(1620) 참조), 및 오라클 연산자(유닛(1630) 참조)를 포함한다. 그들의 역할을 이하에 기술된다.

인코더(1000)에서,

단계 I (E) k = 0,…, N - 1에서,

Shrink 연산은 각각의 흔들림 및 다운 샘플링 연산자에 의해 결정된다. 다시 말해, 우리는 흔들림 연산자(B^(k))를 Y_k에 적용하여 Z_k를 생성하고, 다운 샘플링 연산자(

)를 Z_k에 적용하여 Y_k ₊₁을 생성한다(도 17의 유닛(1710) 참조).

단계 II (E) 는 이전과 같이 일반적이다.

단계 III (E) k = 0,…, N - 1에서,

1) Expand 연산은 각각의 업 샘프링, 보간법, 오라클 및 흔들림 방지 연산자에 의해 결정된다. 다시 말해, 우리는 업 샘플링 연산자(

)에 이어서 보간 연산자(I^(k))를 적용하여 동영상(

)을 생성한다. 그리고 나서, 우리는 오라클 연산자(O^(k))를

에 적용하여 단계 I (E)의 동영상(Z_k)의 재구성된 버전인

를 생성한다.

를 기초하여 Z_k에 대한 최고의 근사치(

)를 재구성하는 오라클 연산은 초해상도(참고 문헌 [5] 참조) 및 압축된 센싱(참고 문헌 [6] 참조)과 같은 이러한 방법을 사용할 수 있다. 마지막으로, 우리는 흔들림 방지 연산자(

)를

에 적용하여

를 생성한다(유닛(1720) 참조).

2) Resultant 연산은 간단히 차분 연산이다. 다시 말해, 나머지(R_k)는 Y_k와

간의 차이이다. 그리고 나서, 우리는 나머지(R_k)를 E_k로 인코딩한다(도 18의 유닛(1810) 참조).

3) 그리고 나서, 우리는 E_k로부터 재구성된 나머지(

)을 디코딩한다. Assemble 연산이 단순히 합산 연산이어서, 우리는

를

에 추가하여 동영상(

)를 얻는다(유닛(1820) 참조).

비트 스트림(1100)에서,

ctrl 정보는 N에 더하여 도 16에서의 파라미터를 포함한다.

디코더(1200)에서,

단계 II (D) 는 반복 k = N - 1,…,0에서,

1) 우리는 상기 단계 III (E)의 스텝 1에서와 같이, Expand 연산을 사용하여 동영상(

)로부터 동영상(

)를 재구성한다(유닛(1720) 참조).

2) 우리는 Decode 연산을 사용하여

를 얻고, 상기 단계 III (E)의 스텝 3에서와 같이 Assemble 연산을 사용하여

와

로부터

를 재구성한다(유닛(1820) 참조).

실시예 III : 오라클 다중잔물결( OM ) 코덱( The Oracle Multiwavelet Codec )

우리는 다음과 같이 Oracle Codec과 Multiwavelet Codec을 결합한다.

우리는 O Codec 파라미터(도 16 참조)에 기초하여 m_k 다중잔물결 필터(유닛(1310) 참조)를 정의한다. 우리는 결과적인 방법을 OM Codec이라고 한다.

우리는 이제 주어진 O Codec으로 파라미터에서 DMWT를 어떻게 얻는지를 기술한다.

1) 우리는 로우 패스 분석 필터(

)를 형성하여, 결과적인 Shrink 방법은 주어진 O Codec Shrink 방법을 근사화한다(도 19의 유닛(1910) 참조).

2) 우리는 로우 패스 합성 필터(

)를 형성하여, 결과적인 Expand 방법은 주어진 O Codec Expand 방법을 근사화한다(도 19의 유닛(1920) 참조).

3) 우리는 한 세트의 m_k - 1 하이 패스 분석 필터(

)를

소멸시키는(annihilate) 다중잔물결 필터로 정의한다.

4) 우리는

를 설정함에 의해 한 세트의 DMWT 필터를 완성한다. 이는 우리가 잔물결의 수학적 이론을 사용하여 행한다(참고 문헌 [4] 및 특허 문헌 [2] 참조).

ctrl 정보는 도 16에서와 같이 파라미터를 포함하고, 해당 DMWT 필터는 도 19에서와 같이 N을 포함한다.

OM Codec의 순서도는 도 20에 도시된다. Encoder 순서도는 유닛(2010)에 도시되고, Decoder는 유닛(2020)에 도시된다. 이하의 문헌은 본 출원에서 참조되고, 이는 모두 본원에 참조로서 포함된다.

특허 문헌

[1] Man Bar-On and Oleg Kostenko, A Method And A System For Wavelet Based Processing, WO/2008/081459.

[2] Man Bar-On, Method And Apparatus For A Multidimensional Discrete Multiwavelet Transform, US 8,331 ,708 B2, Dec. 11 , 2012.

참고 문헌

[1] "Computer Vision, A Modern Approach", D. Forsyth and J. Ponce, 2012.

[2] "ITU-R Recommendation BT. 709", http://en.wikipedia.org/wiki/Rec._709

[3] "Cut by Cut", G. Chandler, 2012.

[4] "Wavelets and Multiwavelets", Fritz Keinert, 2004.

[5] "Super-Resolution Imaging", P. Milanfar, Sep. 2010.

[6] "Compressed Sensing, Theory and Applications", Y.C.EIdar et al., June 2012.

[7] "Optical flow", http://en.wikipedia.org/wiki/Optical_flow.

Claims

동영상을 인코딩하는 방법에 있어서, 상기 방법은
동영상을 수신하는 단계와,
상기 수신된 동영상에 대해 수축 연산(shrink operation)을 수행하는 단계 - 상기 수축 연산은, 상기 동영상으로부터 제1 더 낮은 해상도 동영상을 생성하는 단계 및 추가적인 N-1 더 낮은 해상도 동영상을 순차적으로 생성하는 단계를 포함하고, 상기 추가적인 더 낮은 해상도 동영상의 각각은 상기 이전의 더 낮은 해상도 동영상으로부터 생성됨 - 와,
가장 낮은 해상도 동영상을 압축하는 단계와,
상기 가장 낮은 해상도 압축된 동영상을 압축해제함에 의해 가장 낮은 해상도 재구성된 동영상을 생성하는 단계와,
상기 가장 낮은 해상도 재구성된 동영상에 제1 상승 연산을 수행하는 단계 - 상기 제1 상승 연산은 N 개의 더 높은 해상도 재구성된 동영상을 순차적으로 생성하는 단계를 포함하고, 상기 더 높은 해상도 재구성된 동영상의 각각은, 상기 더 낮은 해상도 재구성된 동영상으로부터 더 높은 해상도 동영상을 생성하는 단계와 상기 각각의 더 낮은 해상도 동영상과 상기 생성된 더 높은 해상도 동영상 사이의 나머지(residual)를 계산하는 단계와, 상기 계산된 나머지를 압축하는 단계와 상기 압축된 나머지를 압축해제하는 단계와 상기 압축해제된 나머지와 상기 생성된 더 높은 해상도 동영상을 결합하여 각각의 더 높은 해상도 재구성된 동영상을 생성하는 단계에 의하여, 상기 이전의 더 낮은 해상도 재구성된 동영상으로부터 생성됨 - 와,
상기 가장 낮은 해상도 압축된 동영상, 상기 압축된 나머지 및 상기 N을 포함하는 제어 정보를 포함하는 비트 스트림을 제공하는 단계를 포함하는 것을 특징으로 하는 동영상을 인코딩하는 방법.
제 1 항에 있어서, 상기 비트 스트림은 로우 패스 분석 필터를 포함하고, 더 낮은 해상도 동영상을 생성하는 단계는 로우 패스 분석 필터를 동영상에 적용하는 단계를 포함하는 것을 특징으로 하는 동영상을 인코딩하는 방법.
제 1 항에 있어서, 상기 비트 스트림은, 흔들림 연산자 및 다운 샘플링 연산자를 포함하고, 더 낮은 해상도 동영상을 생성하는 단계는 흔들림 연산자를 동영상에 적용하는 단계와 다운 샘플링 연산자를 흔들림 연산의 결과에 적용하는 단계를 포함하는 것을 특징으로 하는 동영상을 인코딩하는 방법.
제 2 항에 있어서, 상기 비트 스트림은 흔들림 연산자 및 다운 샘플링 연산자를 포함하고, 상기 로우 패스 분석 필터는 상기 흔들림 연산자 및 다운 샘플링 연산자로부터 계산된 것을 특징으로 하는 동영상을 인코딩하는 방법.
제 1 항에 있어서, 상기 비트 스트림은 로우 패스 합성 필터를 포함하고, 더 높은 해상도 동영상을 생성하는 단계는 로우 패스 합성 필터를 더 낮은 해상도 재구성된 동영상에 적용하는 단계를 포함하는 것을 특징으로 하는 동영상을 인코딩하는 방법.
제 1 항에 있어서, 상기 비트 스트림은 업 샘플링 연산자, 보간 연산자, 오라클 연산자 및 흔들림 방지 연산자를 포함하고, 더 높은 해상도 동영상을 생성하는 단계는,
a. 업 샘플링 연산자에 이어서 보간 연산자를 더 낮은 해상도 재구성된 동영상에 적용하는 단계와,
b. 오라클 연산자를 보간 연산자의 결과에 적용하는 단계와,
c. 흔들림 방지 연산자를 오라클 연산자의 결과에 적용하는 단계를 포함하는 것을 특징으로 하는 동영상을 인코딩하는 방법.
제 5 항에 있어서, 상기 비트 스트림은 업 샘플링 연산자, 보간 연산자, 오라클 연산자 및 흔들림 방지 연산자를 포함하고, 상기 로우 패스 합성 필터가 상기 업 샘플링 연산자, 보간 연산자, 오라클 연산자 및 흔들림 방지 연산자로부터 계산되는 것을 특징으로 하는 동영상을 인코딩하는 방법.
제 1 항에 있어서, 나머지를 계산하는 단계는, 각각의 더 낮은 해상도 동영상과 더 높은 해상도 동영상간의 차이값을 계산하는 단계를 포함하는 것을 특징으로 하는 동영상을 인코딩하는 방법.
제 8 항에 있어서, 상기 비트 스트림은 하이 패스 분석 필터를 포함하고, 나머지를 계산하는 단계는 하이 패스 분석 필터를 계산된 차이값에 적용하는 단계를 추가적으로 포함하는 것을 특징으로 하는 동영상을 인코딩하는 방법.
제 9 항에 있어서, 상기 하이 패스 분석 필터는 상기 계산된 차이값으로부터 계산되는 것을 특징으로 하는 동영상을 인코딩하는 방법.
제 1 항에 있어서, 더 높은 해상도 재구성된 동영상을 계산하는 단계는 압축해제된 나머지를 더 높은 해상도 동영상에 추가하는 단계를 포함하는 것을 특징으로 하는 동영상을 인코딩하는 방법.
제 1 항에 있어서, 상기 비트 스트림은 하이 패스 합성 필터를 포함하고, 더 높은 해상도 재구성된 동영상을 생성하는 단계는 하이 패스 합성 필터를 각각의 압축해제된 나머지에 적용하는 단계 및 결과를 더 높은 해상도 동영상에 추가하는 단계를 포함하는 것을 특징으로 하는 동영상을 인코딩하는 방법.
제 12 항에 있어서, 상기 하이 패스 합성 필터는 로우 패스 분석 필터 및 하이 패스 분석 필터 및 로우 패스 합성 필터로부터 계산되는 것을 특징으로 하는 동영상을 인코딩하는 방법.
제 1 항으로부터의 방법에 따라 인코딩된 동영상을 디코딩하는 방법에 있어서, 상기 디코딩하는 방법은,
상기 가장 낮은 해상도 압축된 동영상, 상기 압축된 나머지 및 상기 제어 정보를 포함하는 상기 비트스트림을 수신하고 프로세싱하는 단계;
상기 가장 낮은 해상도 압축된 동영상을 압축해제함에 의해 가장 낮은 해상도 재구성된 동영상을 생성하는 단계; 및
상기 가장 낮은 해상도 재구성된 동영상에 제2 상승 연산을 수행하는 단계 - 상기 제2 상승 연산은 N 개의 더 높은 해상도 재구성된 동영상을 순차적으로 생성하는 단계를 포함하고, 상기 더 높은 해상도 재구성된 동영상의 각각은, 상기 더 낮은 해상도 재구성된 동영상으로부터 더 높은 해상도 동영상을 생성하는 단계와 상기 각각의 더 낮은 해상도 동영상과 상기 생성된 더 높은 해상도 동영상 사이의 나머지(residual)를 디코딩하는 단계와, 상기 디코딩된 나머지와 상기 생성된 더 높은 해상도 동영상을 결합하여 각각의 더 높은 해상도 재구성된 동영상을 생성하는 단계에 의하여, 상기 이전의 더 낮은 해상도 재구성된 동영상으로부터 생성됨 - 를 포함하는 것을 특징으로 하는 디코딩하는 방법.
제 14 항에 있어서, 상기 비트 스트림은 로우 패스 합성 필터를 포함하고, 더 높은 해상도 동영상을 생성하는 단계는 로우 패스 합성 필터를 더 낮은 해상도 재구성된 동영상에 적용하는 단계를 포함하는 것을 특징으로 하는 디코딩하는 방법.
제 14 항에 있어서, 상기 비트 스트림은 업 샘플링 연산자, 보간 연산자, 오라클 연산자 및 흔들림 방지 연산자를 포함하고, 더 높은 해상도 동영상을 생성하는 단계는,
a. 업 샘플링 연산자에 이어서 보간 연산자를 더 낮은 해상도 재구성된 동영상에 적용하는 단계와,
b. 오라클 연산자를 보간 연산자의 결과에 적용하는 단계와,
c. 흔들림 방지 연산자를 오라클 연산자의 결과에 적용하는 단계를 포함하는 것을 특징으로 하는 디코딩하는 방법.
제 15 항에 있어서, 상기 비트 스트림은 업 샘플링 연산자, 보간 연산자, 오라클 연산자 및 흔들림 방지 연산자를 포함하고, 상기 로우 패스 합성 필터가 상기 업 샘플링 연산자, 보간 연산자, 오라클 연산자 및 흔들림 방지 연산자로부터 계산되는 것을 특징으로 하는 디코딩하는 방법.
제 14 항에 있어서, 더 높은 해상도 재구성된 동영상을 계산하는 단계는 압축해제된 나머지를 더 높은 해상도 동영상에 추가하는 단계를 포함하는 것을 특징으로 하는 디코딩하는 방법.
제 14 항에 있어서, 상기 비트 스트림은 하이 패스 합성 필터를 포함하고, 더 높은 해상도 재구성된 동영상을 생성하는 단계는 하이 패스 합성 필터를 각각의 압축해제된 나머지에 적용하는 단계 및 결과를 더 높은 해상도 동영상에 추가하는 단계를 포함하는 것을 특징으로 하는 디코딩하는 방법.
제 19 항에 있어서, 상기 하이 패스 합성 필터는 로우 패스 분석 필터 및 하이 패스 분석 필터 및 로우 패스 합성 필터로부터 계산되는 것을 특징으로 하는 디코딩하는 방법.
동영상 코덱에 있어서, 상기 동영상 코덱은,
동영상을 인코딩하도록 구성된 인코딩부와,
상기 인코딩된 동영상을 재구성하도록 구성된 재구성부 - 상기 재구성부는 디코딩 데이터의 비트 스트림을 생성함 - 와,
디코딩 데이터의 비트 스트림을 수신하고, 상기 비트 스트림내의 동영상을 디코딩하도록 구성된 디코딩부를 포함하는 것을 특징으로 하는 동영상 코덱.
제 21 항에 있어서, 상기 인코딩부는,
동영상을 수신하고,
상기 수신된 동영상에 대해 수축 연산을 수행하도록 구성되고, 상기 수축 연산은 상기 동영상으로부터 제1 더 낮은 해상도 동영상을 생성하는 단계와, 추가적인 N - 1 더 낮은 해상도 동영상을 순차적으로 생성하는 단계 - 상기 추가적인 더 낮은 해상도 동영상의 각각은 상기 이전의 더 낮은 해상도 동영상으로부터 생성됨 - 및 가장 낮은 해상도 동영상을 압축하는 단계를 포함하는 것을 특징으로 하는 동영상 코덱.
제 22 항에 있어서, 상기 재구성부는,
상기 가장 낮은 해상도 압축된 동영상을 압축해제함에 의해 가장 낮은 해상도 재구성된 동영상을 생성하고,
상기 가장 낮은 해상도 재구성된 동영상에 제1 상승 연산을 수행 - 상기 제1 상승 연산은 N 개의 더 높은 해상도 재구성된 동영상을 순차적으로 생성하는 단계를 포함하고, 상기 더 높은 해상도 재구성된 동영상의 각각은, 상기 더 낮은 해상도 재구성된 동영상으로부터 더 높은 해상도 동영상을 생성하는 단계와 상기 각각의 더 낮은 해상도 동영상과 상기 생성된 더 높은 해상도 동영상 사이의 나머지(residual)를 계산하는 단계와, 상기 계산된 나머지를 압축하는 단계와 상기 압축된 나머지를 압축해제하는 단계와 상기 압축해제된 나머지와 상기 생성된 더 높은 해상도 동영상을 결합하여 각각의 더 높은 해상도 재구성된 동영상을 생성하는 단계에 의하여, 상기 이전의 더 낮은 해상도 재구성된 동영상으로부터 생성됨 - 하되,
상기 비트 스트림은 상기 압축된 가장 낮은 해상도 동영상, 상기 압축된 나머지 및 상기 N을 포함하는 제어 정보를 포함하는 것을 특징으로 하는 동영상 코덱.
제 23 항에 있어서, 상기 디코딩부는,
상기 가장 낮은 해상도 압축된 동영상, 상기 압축된 나머지 및 상기 제어 정보를 포함하는 상기 비트 스트림을 수신하고 프로세싱하고,
상기 가장 낮은 해상도 압축된 동영상을 압축해제함에 의해 가장 낮은 해상도 재구성된 동영상을 생성하며,
상기 가장 낮은 해상도 재구성된 동영상에 제2 상승 연산을 수행 - 상기 제2 상승 연산은 N 개의 더 높은 해상도 재구성된 동영상을 순차적으로 생성하는 단계를 포함하고, 상기 더 높은 해상도 재구성된 동영상의 각각은, 상기 더 낮은 해상도 재구성된 동영상으로부터 더 높은 해상도 동영상을 생성하는 단계와 상기 각각의 더 낮은 해상도 동영상과 상기 생성된 더 높은 해상도 동영상 사이의 나머지(residual)를 디코딩하는 단계와, 상기 디코딩된 나머지와 상기 생성된 더 높은 해상도 동영상을 결합하여 각각의 더 높은 해상도 재구성된 동영상을 생성하는 단계에 의하여, 상기 이전의 더 낮은 해상도 재구성된 동영상으로부터 생성됨 - 하도록 구성된 것을 특징으로 하는 동영상 코덱.
제 1 항의 방법에 따라 인코딩된 동영상을 디코딩하는 방법에 있어서, 상기 디코딩부는 상기 재구성된 더 높은 해상도 동영상을 분석하도록 구성된 것을 특징으로 하는 동영상을 디코딩하는 방법.
제 25 항에 있어서, 상기 디코딩부는 상기 재구성된 동영상의 모션 필드(motion field)를 계산하도록 구성된 것을 특징으로 하는 동영상을 디코딩하는 방법.
제 25 항에 있어서, 상기 디코딩부는 상기 재구성된 동영상의 물체 인식을 수행하도록 구성된 것을 특징으로 하는 동영상을 디코딩하는 방법.