KR20060060000A - 비디오 엔코딩 및 디코딩 방법들 및 장치들 - Google Patents
비디오 엔코딩 및 디코딩 방법들 및 장치들 Download PDFInfo
- Publication number
- KR20060060000A KR20060060000A KR1020067002370A KR20067002370A KR20060060000A KR 20060060000 A KR20060060000 A KR 20060060000A KR 1020067002370 A KR1020067002370 A KR 1020067002370A KR 20067002370 A KR20067002370 A KR 20067002370A KR 20060060000 A KR20060060000 A KR 20060060000A
- Authority
- KR
- South Korea
- Prior art keywords
- block
- motion
- blocks
- frame
- generating
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000013598 vector Substances 0.000 claims abstract description 18
- 230000006835 compression Effects 0.000 abstract description 4
- 238000007906 compression Methods 0.000 abstract description 4
- 230000000903 blocking effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/97—Matching pursuit coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은 비디오 압축 분야에 관한 것으로서, 특히, 각 프레임은 임의의 크기로 세분된 프레임들의 입력 시퀀스에 적용되는 비디오 엔코딩 방법에 관한 것이다. 이 방법은 현재 프레임의 블록들의 적어도 일부에 대해서: 각 현재 원래 프레임 및 이전 재구성된 프레임으로부터 얻어진 각 모션-보상된 프레임들을 블록 마다 발생시키는 단계; 상기 모션-보상된 프레임들로부터 잔류 신호들을 발생시키는 단계; 발생된 잔류 신호들 각각을 원자들(atoms)이라 불리는 코딩된 딕셔너리 함수들(dictionary functions)로 분해하는 일치 추적 알고리즘(matching pursuit algorithm)을 사용하는 단계로서, 상기 현재 프레임의 다른 블록들은 다른 코딩 기술들에 의해 처리되는, 상기 일치 추적 알고리즘을 사용하는 단계;출력 코딩된 비트스트림을 발생시키기 위하여, 모션 보상 단계동안 결정된 상기 모션 벡터들 및 상기 원자들을 코딩하는 단계를 포함하며; 상기 방법은 임의의 원자가 한번에 단지 하나의 블록(B)에 대해서만 작용하도록 하는데, 상기 블록-제한(block-restriction)은 다음 2D 공간 도메인 연산, 즉
에 따라서, 잔류 신호(f)의 재구성이 인덱싱 파라미터(indexing parameter)(γn)에 대응하는 블록(B)으로 제한 되는 기초 함수(gγn|B)로 이루어진 딕셔너리로부터 얻어지도록 한다.
모션-보상된 프레임, 딕셔너리 함수, 블록-제한, 픽셀, 인덱싱 파리미터
Description
본 발명은 일반적으로 비디오 압축 분야에 관한 것이며, 특히, 예를 들면, MPEG 군(MPEG-1, MPEG-2, MPEG-4)의 비디오 표준들 및 ITU H26X 군(H.261, H.263 및 익스텐션들)의 비디오 코딩 권장들(video coding recommendations)에 관한 것이다. 특히, 본 발명은 프레임들의 입력 시퀀스에 적용되는 비디오 엔코딩 방법에 관한 것이며, 여기서 각 프레임은 임의의 크기의 블록들로 세분되며, 상기 방법은 적어도 현재 프레임의 상기 블록들에 대해서:
- 각 현재 원래 프레임 및 이전 재구성된 프레임으로부터 각각 얻어진 모션-보상된 프레임들을 블록마다 발생시키는 단계;
- 상기 모션-보상된 프레임들로부터 잔류 신호들을 발생시키는 단계;
- 상기 발생된 잔류 신호들 각각을 원자들(atoms)이라 불리는 코딩된 딕셔너리 함수들(dictionary functions)로 분해하는 소위 일치 추적(MP) 알고리즘(matching pursuit algorithm)을 사용하는 단계로서, 상기 현재 프레임의 다른 블록들은 다른 코딩 기술들에 의해 처리되는, 상기 일치 추적 알고리즘을 사용하는 단계;
- 출력 코딩된 비트스트림을 발생시키기 위하여, 모션 보상 단계동안 결정된 상기 모션 벡터들 및 상기 원자들을 코딩하는 단계를 포함한다.
또한, 본 발명은 대응하는 비디오 디코딩 방법 및 상기 엔코딩 및 디코딩 방법들을 실행하기 위한 엔코딩 및 디코딩 장치들에 관한 것이다.
현재 비디오 표준들(비디오 코딩 MPEG-4 표준 및 H.264 권장에 이르기까지), 하나의 루미넌스 채널 및 2개의 크로미넌스 채널들의 견지에서 기술된 비디오는 각 채널에 적용되는 2가지 코딩 모드들: 즉, 각 영상 내의 픽셀들(화소들)의 공간적 용장성(spatial redundancy)를 주어진 채널에서 사용하는 "인트라" 모드 및 분리된 영상들(또는 프레임들) 간의 시간적 용장성(temporal redundancy)를 사용하는 "인터" 모드에 의해 압축될 수 있다. 모션 보상 동작에 의존하는 인터 모드는 하나의(또는 그 이상) 영상(들)로부터 또 다른 한 영상까지 픽셀들의 모션을 엔코딩함으로써 하나의(또는 그 이상) 이전 디코딩된 영상(들)로부터 영상을 묘사(describe)한다. 통상적으로, 코딩될 현재 영상은 독립 블록들(예를 들어, MPEG-4에서 8×8 또는 16×16 픽셀들의 크기 또는 H.264에서 4×4, 4×8, 8×4, 8×8, 8×16, 16×8 및 16×16의 크기)로 세분되는데, 이들 각각은 모션 벡터를 할당받는다(3개의 채널들은 이와 같은 모션 디스크립션(motion description)을 공유한다). 그 후, 상기 영상의 예측은 각 블록에 관련된 모션 벡터들의 세트에 따라서 기준 영상으로부터 픽셀 블록들을 변위시킴으로써 재구성될 수 있다. 최종적으로, 엔코딩될 현재 블록 및 이의 모션-보상된 예측 간의 차 또는 잔류 신호는 인트라 모드에서 엔코딩될 수 있다(MPEG-4 경우 8×8 이산 코사인 변환들- 또는 DCT들 또는 주요 레벨 프로필 경 우 H.264에 대한 4×4 DCT들).
DCT는 아마도 가장 폭넓게 사용되는 변환인데, 그 이유는 특히 중간 및 고 비트레이트들에서 각종 다양한 코딩 상황들에서 양호한 압축 효율을 제공하기 때문이다. 그러나, 저 비트레이트들에서, 하이브리드 모션 압축된 DCT 구조는 2가지 이유 때문에 아티팩트 없는 시퀀스를 전달할 수 없다. 첫번째, 모션-보상된 인터 예측 그리드(motion-compensated inter prediction grid)의 구조는 아티팩트들을 블록킹하면서 가시적이다. 게다가, DCT 기초 함수들의 블록 에지들은 영상 그리드 내에서 가시적인데, 그 이유는 너무 적은 계수들이 양자화, 즉 지나치게 대충적으로 양자화되어 이들 블록킹 아티팩트들을 구성하고 영상 내에서 스무드한 오브젝트들을 재구성하기 때문이다.
R.Neff. 및 A.Zakhor가 IEEE Transactions on Circuits and Systems for Video Technology, vol.7, n°1, February 1997, pp.158-171에 "Very low bit-rate video coding based on matching pursuits"라는 명칭으로 발표한 문헌에 10년전에 개발된 기술인 소위 일치 추적(MP) 알고리즘(S.G.Mallet 및 Z.Zhang이 IEEE Transactions on Signal Processing, vol. 41, n° 12, December 1993, pp. 3397-3414에 "Matching pursuits with time-frequency dictionaries"라는 명칭으로 발표한 문헌을 참조하라)을 토대로 한 비디오 압축 알고리즘을 포함하는 새로운 모션-보상된 시스템을 설명한다. 상기 기술은 임의의 함수 또는 신호(예를 들어, 영상, 비디오,...)를 시간과 주파수 둘 다에서 그리고 소위 원자들에서 양호하게 국부화된 기초 함수들의 용장 딕셔너리에 속하는 파형들의 선형 확장으로 반복적으로 분 해하는 방법을 제공한다. 시간-주파수 원자들의 일반적인 군(family)은 실수 및 연속적으로 미분될 수 있다라고 추정되는 단일 함수 을 스케일링, 트랜스레이팅 및 변조함으로써 생성될 수 있다. 이들 딕셔너리 함수들은 다음과 같이 지정될 수 있다.
γ(=감마)는 각 특정 딕셔너리 원소(또는 원자)에 관련된 인덱싱 파라미터이다. 제1 인용 문헌에 서술된 바와 같이, 함수들 gγ(t)이 단위 놈(norm), 즉 <gγ(t), gγ(t)>=1을 갖는다면, 1차원 시간 신호(f(t))의 분해는 γ를 선택함으로써 시작되어 다음 내적의 절대값을 최대화한다.
여기서 p는 딕셔너리 함수 gγ(t) 상으로 신호(f(t))에 대한 확장 계수라 칭한다. 그 후, 잔류 신호(R)는 다음과 같이 계산되고,
이 잔류 신호는 원래 신호(f(t))와 동일한 방법으로 확장된다. 원자는 실제로 각 쌍(γk, pk)에 제공된 명칭(name)이며, 여기서 k는 일치 추적 절차에서 반복 랭크(rank)이다. 이 반복 절차의 총 M개의 스테이지(각 스테이지 n은 γn, 확장 계수(pn) 및 다음 스테이지로 통과되는 잔류 (Rn) 의해 규정된 딕셔너리 구조를 산출 한다), 원래 신호(f(t))는 이에 따라서 얻어진 딕셔너리 원소들의 선형 조합인 신호 에 의해 근사화된다. 반복적인 절차는 규정된 조건이 부합, 예를 들어, 확장 계수들의 세트 수가 발생되거나 이 잔류를 위한 일부 에너지 임계값이 도달될 때 중지된다.
상술된 제1 문헌에서, 저 비트레이트들에서 DCT 알고리즘보다 양호하게 수행되는 상기 MP 알고리즘을 기반으로 하는 시스템을 설명하면, 원래 영상들은 예측된/변위된 블록들(그러므로 블록들의 에지들은 스무드되고 블록 그리드는 덜 가시적이다)의 경계들을 블렌드함으로써 블록킹 아티팩트들을 피하거나 감소시키는 중첩된 블록-모션 보상이라 불리는 도구를 사용하여 우선 모션-보상된다. 모션 예측 영상이 형성된 후, 원래 영상으로부터 감산되어 모션 잔류를 발생시킨다. 그 후, 상기 잔류는 기초 딕셔너리(상기 딕셔너리 도1에 도시된 2D 분리가능한 가버(Gabor) 함수들의 오버컴플리트 수집으로 이루어진다)의 적절한 선택에 의해 2차원(2D) 도메인으로 확장되는 MP 알고리즘을 사용하여 코딩된다.
그 후, 잔류 신호(f)는 M 딕셔너리 원소들의 선형 조합에 의해 재구성된다.
상기 쌍들은 원자들이다. 이 문헌의 저자들에 의해 설명된 작업에서, 영상의 원자의 가능한 위치에 배치되는 것은 제한되지 않는다(도2 참조). 딕셔너리를 형성하는 2D 가버 함수들은 전형적인 가우스 윈도우와 관련하여 규정된다.
1차원(1D) 이산 가버 함수는 스케일링되며, 변조된 가우스 윈도우로서 규정된다.
상수 는 가 단위 놈으로 이루어지고 가 정의 스케일, 변조 주파수 및 위상 시프트 각각으로 이루어진 트리플이되도록 선택된다. S는 모든 이와 같은 트리플들 의 세트이고, 딕셔너리의 2D 분리가능한 가버 함수들은 다음 항을 갖는다.
1D 기초 세트(또는 딕셔너리)를 형성하는 것으로서 문헌에 표시된 관련 크기 들(픽셀들) 및 이용가능한 딕셔너리 트리플들의 세트가 다음 표1에 나타나 있다.
이 파라미터 세트를 얻기 위하여, 모션 잔류 영상들의 트레인닝 세트는 훨씬많은 파라미터 트리플들의 세트로부터 도출된 딕셔너리를 사용하여 분해된다. 트레인닝 영상들에 가장 종종 일치되는 딕셔너리 원소들은 감소된 세트에 유지된다. 얻어진 딕셔너리는 특히, 원자들이 놓이는 블록의 경계들로 원자들의 영향이 제한될 때 원자들은 모션 잔류 영상의 구조와 자유롭게 일치할 수 있도록 설계된다(블록-제한들 없이 블록 분할된 영상에 배치된 원자의 예를 도시한 도2 참조).
그러나, 인용 문헌에 서술된 방법은 여러 가지 제한들을 겪는다. 첫번째 제약은 가버 딕셔너리의 연속 구조와 관련된다. 원자들이 임의의 제한 없이 모든 픽셀 위치들에 배치될 수 있음으로 여러 모션-보상된 블록들을 스팬하기 때문에, MP 알고리즘은 제한된 수의 스무드 원자들을 지닌 잔류 신호에서 블록킹 아티팩트들을 표시할 수 없다. 그 이유는 블록킹 아티팩트들을 제한하기 위하여 일종의 중첩된 모션 추정을 가져야할 필요가 있기 때문이다. 전통적인 블록-기반으로 한 모션 보상(즉, 중첩 윈도우 없음)이 사용되는 경우, 스무드 기초 함수들은 블록킹 아티팩트들을 구성하는데 적절하지 않을 수 있다(실제로, 최근 코딩 이득들이 잔류 코딩 변환의 크기가 모션 보상된 블록의 크기와 일치될 때 행해질 수 있다는 것을 보여준다). 세번째, 코딩된 프레임에서 인트라 및 인터 블록들을 결합하는 것이 어렵다(인용된 문헌에서, 가버 기초 함수들의 스무드 구조에 의해 나쁘게 모델링되는 인트라 및 인터 모드에서 코딩된 블록들의 경계에 대한 불연속성을 피하도록 하기 위하여 DCT 인트라 매크로블록이 존재하지 않는다).
그러므로, 본 발명의 목적은 상기 제약들이 더이상 존재하지 않는 비디오 엔코딩 방법을 제공하는 것이다.
이를 위하여, 본 발명은 상기 설명의 서두부에 규정되고 상기 MP 알고리즘을 사용할 때, 임의의 원자가 한번에 단지 한 블록(B)에 대해서만 작용할 때 잔류 신호(f)가 다음 2D 공간 도메인 연산에 따라서 인덱싱 파라미터(γn)에 대응하는 블록(B)으로 제한되는 기초 함수들 로 이루어진 딕셔너리로부터 잔류 신호(f)의 재구성이 얻어진다는 사실을 상기 블록-제한이 유도하도록 하는 비디오 엔코딩 방법에 관한 것이다.
이 방법의 주요 관심사항은 MP 원자들이 모션-보상된 블록들로 제한된다는 사실에 있다. 블록 경계들에 걸쳐서 간섭이 존재하지 않기 때문에, 잔류 신호들의 블록키 구조(blocky structure)를 더욱 양호하게 모델링하여 교호적인 MP 및 DCT 변환들의 가능성을 제공하고 동일한 코딩 비용을 위한 딕셔너리 다이버시티를 암시적을 증분시킨다. 이는 또한 블록킹 아티팩트들을 제한하기 위한 중첩된 모션 보상에 의존할 필요성을 피하게 한다.
본 발명의 또 다른 목적은 상기 엔코딩 방법을 실행하도록 하는 비디오 엔코딩 장치를 제공하는 것이다.
본 발명의 또한 다른 목적은 상기 비디오 엔코딩 방법 및 장치에 의해 코딩된 신호들을 디코딩하도록 하는 비디오 디코딩 방법 및 장치를 제공하는 것이다.
본 발명이 지금부터 예로서 첨부 도면을 참조하여 설명될 것이다.
도1은 일치 추적 알고리즘의 구현방식에 사용되는 2D 가버 딕셔너리의 400 기초 함수를 가시화한 도면.
도2는 블록-제한들 없이 블록-분할된 영상에 배치된 원자의 예를 도시한 도면.
도3은 본 발명을 따른 하이브리드 비디오 코더의 예를 도시한 도면.
도4는 MP 추적 알고리즘을 구현하는 비디오 엔코딩 장치의 예를 도시한 도면.
도5는 한번에 블록에 대해서만 작용하고 모션-보상된 그리드로 한정되는 원자로 블록-제한된 일치 추적 잔류 코딩의 경우를 도시한 도면.
도6은 본 발명을 따른 하이브리드 비디오 디코더의 예를 도시한 도면.
도7은 MP 알고리즘을 구현하는 비디오 디코딩 장치의 예를 도시한 도면.
다수의 코딩 엔진들을 사용하는 하이브리드 비디오 코더를 구현하는 비디오 엔코딩 장치의 간단화된 블록도가 도3에 도시되어 있다. 여러 코딩 엔진들은 소정의 코딩 기술들을 구현하는데, 예를 들어 코딩 엔진(31)은 INTRA-DCT 코딩 방법을 구현하며, 제2의 코딩 엔진(32)은 INTER-DCT 코딩 방법을 구현하며, 제3 코딩 엔진(33)은 일치 추적 알고리즘을 구현한다. 입력 비디오 시퀀스의 각 프레임은 블록 파티셔너 장치(34)에 의해 수신되는데("비디오 신호"), 상기 장치는 영상을 다양한 크기의 개별적인 블록들로 분할하고 어느 코딩 엔진이 현재 원래 블록을 처리할지를 결정한다. 블록 위치, 크기 및 선택된 코딩 엔진을 표시하는 이 결정들은 코딩 장치(35)에 의해 비트스크림내로 삽입된다. 그 후, 현재 원래 신호 블록은 선택된 코딩 엔진(도3에 도시된 상황에서 엔진(33))으로 전달된다(도3에 도시된 상황에서 엔진(33)).
일치 추적 코딩 엔진은 MP 추적 알고리즘을 구현하는 비디오 엔코딩 장치의 일예를 도시한 도4의 간단화된 블록도로서 또한 도시될 것이다. 코딩 엔진(33)에 할당된 입력 비디오 시퀀스의 각 원래 신호 블록들은 모션 보상 수단(41)에 의해 한 측상에서 수신되어 모션 벡터들(상기 모션 벡터들은 종래에 블록 일치 알고리즘을 사용하여 발견된다)을 결정하고 이에 따라서 얻어진 벡터들은 모션 벡터 코딩 수단(42)에 의해 코딩되는데, 상기 코딩된 벡터들은 멀티플렉서(43)에 전달된다(도시되지 않았지만 참조됨). 다른 한 측상에서 감산기(44)는 자신의 출력 상에 현재 영상 및 이의 예측 간의 잔류 신호를 전달한다. 그 후, 상기 잔류 신호는 원자들로 분해되고(원자들의 딕셔너리는 (47)로 표시됨) 이에 따라서 결정된 원자 파라미터들(모듈 45)은 코딩된다(모듈 46). 그 후, 코딩된 모션 벡터들 및 원자 파라미터들은 시퀀스의 각 프레임에 대한 규정된 조건에 일치하도록 전송되는 비트스트림을 형성한다.
이 엔코딩 엔진(33)은 다음 단계들을 포함하는 입력 비트스트림을 코딩하는 방법을 실행한다. 우선, 대부분의 코딩 구조에서처럼, 입력 시퀀스의 원래 프레임들은 모션 보상된다(각 프레임은 이전 재구성된 프레임을 토대로 모션-보상되고, 상기 모션-보상된 단계 동안 결정된 모션 벡터들은 이들의 나중 전송 관점에서 저장된다). 그 후, 잔류 신호들은 현재 프레임 및 관련된 모션-보상된 예측 간의 차에 의해 발생된다. 그 후, 상기 잔류 신호들 각각은 2D 분리가능한 가버 함수들의 콜렉션으로 이루어진 함수들의 딕셔너리와 비교되어 인덱싱 파라미터(γn), 확장 계수(p(n)) 및 이 반복 절차의 다음 단계로 통과되는 잔류 Rn(t)-p.gγ(t)로 규정된 딕셔너리 구조(gγ(t))를 발생시킨다. 원자 파라미터들이 발견되면, 이들 파라미터들은 코딩(이전 결정된 모션 벡터들과 함께)될 수 있음으로, 이에 따라서 얻어진 코딩된 신호들은 디코더로 전송되는 비트스트림을 형성한다
본 발명을 따른 기술적인 해법은 원자들이 놓이는 블록의 경계들로 원자들의 영향을 한정하는 것을 포함한다. 이 블록-제한은 원자가 도5에 도시된 바와 같이 모션-보상 그리드내로 한정되는 단지 하나의 블록에 대해서 단지 한번 작용하도록 하는 것을 의미한다. 이 블록 제한은 다음 방식으로 신호 일치 추적 알고리즘을 수정한다.
모션 보상 후 M×N 픽셀들의 크기의 블록(B)에서 2D 잔류의 MP 분해를 얻고 B로 제한된 MP 딕셔너리를 G|B 라 표시하면, 상기 딕셔너리의 원소들 gγn|B은 관계식(9) 및 (10)에 의해 얻어진다.
이 경우에, gγn|B가 반드시 단위 놈을 가질 필요가 없기 때문에, pn은 다음과 같이 재가중될 필요가 있다.
이 방법의 관심사항은 실제로 단일 원자가 여러 블록들을 스팬할 수 없기 때문에, 블록 에지들에서 고주파수 불연속성들을 처리할 필요가 없다는 것이다. 대신에, 블록-크기 종속 딕셔너리들을 설계함으로써 블록 경계들 및 심지어 블록 크기들로 적응될 수 있다. 게다가, 중첩된 모션 보상은 MP 효율성을 유지하도록 더 이상 강제되지 않기 때문에, 전통적인 모션 보상이 사용될 수 있다.
상술된 엔코딩 장치의 바람직한 실시예는 대응하는 디코딩 장치에 의해 수신되는 비트스트림을 전송한다. 본 발명을 따르고 다수의 디코딩 엔진들을 사용하는 하이브리드 비디오 디코더를 구현하는 비디오 디코딩 장치의 간단화된 블록도는 도6에 도시되어 있다. 전송된 비트스트림은 현재 블록 위치, 이의 크기를 디코딩하는 블록 파티션 디코딩 장치(64), 및 디코딩 방법에 의해 한 측 상에서 수신된다. 디코딩 방법이 제공되면, 그 후, 비트스트림 원소들은 도6의 경우에 대응하는 디코딩 엔진(61 또는 62 또는 63)으로 전달되고, 이는 할당된 블록들을 차례로 디코딩하고 비디오 신호 재구성된 블록을 출력한다. 이용가능한 디코딩 엔진들은 예를 들어 INTRA-DCT 블록 디코더(61), INTER-DCT 블록 디코더(62) 및 일치 추적 블록 디코더(63)일 수 있다.
일치 추적 디코딩 엔진의 예는 MP 알고리즘을 구현하는 비디오 디코딩 장치의 예를 도시한 도7에 또한 도시된다. 비트스트림 원소들은 엔트로피 디코더 장치 (71)에 의해 수신되는데, 이는 디코딩된 잔류 신호를 형성하기 위하여 할당된 비디오 블록 내의 디코딩된 위치에서 일치 추적 기능들을 재구성하는 원자 장치(72)(원자들의 딕셔너리는 (73)으로 표시됨)로 디코딩된 원자 파라미터들을 전달한다. 엔트로피 디코더 장치는 또한, 이전 재구성된 비디오 신호들로부터 모션 예측 신호를 형성하기 위하여 모션 보상 장치(74)로 공급되는 출력 모션 벡터들이다. 그 후, 모션 예측 및 재구성된 잔류 신호는 가산기(75)에서 합산되어 비디오 신호 재구성된 블록을 발생시킨다.
Claims (5)
- 각 프레임이 임의 크기의 블록들로 세분되는 프레임들의 입력 시퀀스에 적용되는 비디오 엔코딩 방법으로서, 상기 방법은 현재 프레임의 상기 블록들의 적어도 일부에 대해서:각 현재 원래 프레임 및 이전 재구성된 프레임으로부터 얻어진 각 모션-보상된 프레임들을 블록마다 발생시키는 단계;상기 모션-보상된 프레임들로부터 잔류 신호들을 발생시키는 단계;상기 발생된 잔류 신호들 각각을 원자들(atoms)이라 불리는 코딩된 딕셔너리 함수들(coded dictionary functions)로 분해하는 소위 일치 추적(matching pursuit; MP) 알고리즘을 사용하는 단계로서, 상기 현재 프레임의 다른 블록들은 다른 코딩 기술들에 의해 처리되는, 상기 일치 추적 알고리즘을 사용하는 단계;출력 코딩된 비트스트림을 발생시키기 위하여, 모션 보상 단계동안 결정된 상기 모션 벡터들 및 상기 원자들을 코딩하는 단계를 포함하며;상기 방법은 상기 MP 알고리즘을 사용할 때, 임의의 원자가 한번에 단지 하나의 블록(B)에 대해서만 작용하도록 하며, 상기 블록-제한(block-restriction)은 다음 2D 공간 도메인 연산, 즉
- 각 프레임이 임의 크기의 블록들로 세분되는 프레임들의 입력 시퀀스에 적용되는 비디오 엔코딩 장치로서, 상기 장치는 현재 프레임의 상기 블록들의 적어도 일부에 적용되고,각 현재 원래 프레임 및 이전 재구성된 프레임로부터 얻어진 각 모션 보상된 프레임들을 블록마다, 모션 보상 단계에 의해 발생시키는 수단;상기 모션-보상된 프레임들로부터 잔류 신호들을 발생시키는 수단;상기 발생된 잔류 신호들 각각을 원자들이라 불리는 코딩된 딕셔너리 함수들로 분해하는 소위 일치 추적(MP) 알고리즘을 사용하는 수단으로서, 상기 현재 프레임의 다른 블록들은 다른 코딩 기술들에 의해 처리되는, 상기 일치 추적 알고리즘을 사용하는 수단;출력 코딩된 비트스트림을 발생시키기 위하여, 모션 보상 단계동안 결정된 상기 모션 벡터들 및 상기 원자들을 각 관련된 블록에 대해서 코딩하는 수단을 포함하며;상기 장치는 상기 MP 알고리즘을 사용할 때, 임의의 원자가 한번에 단지 하나의 블록(B)에 대해서만 작용하도록 하며, 상기 블록-제한은 다음 2D 공간 도메인 연산, 즉
- 제1항을 따른 비디오 코딩 방법에 의해 코딩된 비트스트림에 적용되는 비디오 디코딩 방법으로서, 상기 디코딩 방법은 관련된 블록들에 대해서:- 상기 코드 비트스트림 내에 포함되는 모션 벡터들 및 상기 코딩된 원자 파라미터들을 디코딩하는 단계;- 상기 디코딩된 원자 파라미터들로부터 상기 잔류 신호들을 재구성하는 단계;- 상기 디코딩된 모션 벡터들로부터 모션 보상된 신호들을 발생시키는 단계;- 상기 잔류 신호들과 상기 모션 보상된 신호의 합에 의해 비디오 신호 재구성된 블록들을 발생시키는 단계를 포함하는, 비디오 디코딩 방법.
- 제2항을 따른 비디오 엔코딩 장치에 의해 코딩된 비트스트림에 적용되는 비디오 디코딩 장치로서, 상기 디코딩 장치는 상기 관련된 블록들에 적용되고,- 상기 코드 비트스트림 내에 포함되는 모션 벡터들 및 상기 코딩된 원자 파라미터들을 디코딩하는 수단;- 상기 디코딩된 원자 파라미터들로부터 상기 잔류 신호들을 재구성하는 수단;- 상기 디코딩된 모션 벡터들로부터 모션 보상된 신호들을 발생시키는 수단;- 상기 잔류 신호들과 상기 모션 보상된 신호의 합에 의해 비디오 신호 재구성된 블록들을 발생시키는 수단을 포함하는, 비디오 디코딩 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03300081 | 2003-08-05 | ||
EP03300081.1 | 2003-08-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20060060000A true KR20060060000A (ko) | 2006-06-02 |
Family
ID=34112504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020067002370A KR20060060000A (ko) | 2003-08-05 | 2004-07-14 | 비디오 엔코딩 및 디코딩 방법들 및 장치들 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7746929B2 (ko) |
EP (1) | EP1654706B1 (ko) |
JP (1) | JP2007501555A (ko) |
KR (1) | KR20060060000A (ko) |
CN (1) | CN100469142C (ko) |
WO (1) | WO2005013201A1 (ko) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7813573B2 (en) * | 2005-09-08 | 2010-10-12 | Monro Donald M | Data coding and decoding with replicated matching pursuits |
KR20090073112A (ko) * | 2006-09-22 | 2009-07-02 | 톰슨 라이센싱 | 다중 경로 비디오 코딩 및 디코딩을 위한 방법 및 장치 |
US10194175B2 (en) * | 2007-02-23 | 2019-01-29 | Xylon Llc | Video coding with embedded motion |
CN101453656B (zh) * | 2007-11-29 | 2011-06-01 | 华为技术有限公司 | 视频编码、解码方法及装置和视频编解码系统 |
FR2940491B1 (fr) * | 2008-12-23 | 2011-03-18 | Thales Sa | Systeme de procede interactif pour la transmission sur un reseau bas debit d'images clefs selectionnees dans un flux video |
FR2943236A1 (fr) * | 2009-03-18 | 2010-09-24 | Imra Europ Sas | Procede de surveillance d'un parametre biologique d'une personne au moyen de capteurs |
FR2943234B1 (fr) * | 2009-03-18 | 2012-09-28 | Imra Europe Sas | Procede de surveillance d'un parametre biologique d'un occupant d'un siege avec reduction de bruit |
EP2534840A1 (en) * | 2010-02-11 | 2012-12-19 | Thomson Licensing | Method for coding and for reconstruction of a block of an image sequence |
CA2815330A1 (en) | 2010-11-09 | 2012-05-18 | Cellzome Limited | Pyridine compounds and aza analogues thereof as tyk2 inhibitors |
WO2012140821A1 (ja) | 2011-04-12 | 2012-10-18 | パナソニック株式会社 | 動画像符号化方法、動画像符号化装置、動画像復号化方法、動画像復号化装置、および動画像符号化復号化装置 |
EP4224861A1 (en) | 2011-05-24 | 2023-08-09 | Sun Patent Trust | Image encoding method, image encoding apparatus, image decoding method, and image decoding apparatus |
US9485518B2 (en) | 2011-05-27 | 2016-11-01 | Sun Patent Trust | Decoding method and apparatus with candidate motion vectors |
US9615107B2 (en) | 2011-05-27 | 2017-04-04 | Sun Patent Trust | Image coding method, image coding apparatus, image decoding method, image decoding apparatus, and image coding and decoding apparatus |
SG194746A1 (en) | 2011-05-31 | 2013-12-30 | Kaba Gmbh | Image encoding method, image encoding device, image decoding method, image decoding device, and image encoding/decoding device |
EP3629583B1 (en) | 2011-05-31 | 2023-10-25 | Sun Patent Trust | Video decoding method, video decoding device |
MY181718A (en) | 2011-06-30 | 2021-01-05 | Sun Patent Trust | Image decoding method, image encoding method, image decoding device, image encoding device, and image encoding/decoding device |
EP2741499A4 (en) | 2011-08-03 | 2014-12-10 | Panasonic Ip Corp America | VIDEO CODING METHOD, VIDEO CODING METHOD, VIDEO CODING DEVICE, VIDEO ENCODING DEVICE AND VIDEO ENCODING / DECODING DEVICE |
IN2014CN02602A (ko) | 2011-10-19 | 2015-08-07 | Panasonic Corp | |
US9288484B1 (en) * | 2012-08-30 | 2016-03-15 | Google Inc. | Sparse coding dictionary priming |
US9300906B2 (en) | 2013-03-29 | 2016-03-29 | Google Inc. | Pull frame interpolation |
US9286653B2 (en) | 2014-08-06 | 2016-03-15 | Google Inc. | System and method for increasing the bit depth of images |
US10904565B2 (en) * | 2017-06-23 | 2021-01-26 | Qualcomm Incorporated | Memory-bandwidth-efficient design for bi-directional optical flow (BIO) |
US11396806B2 (en) | 2018-11-06 | 2022-07-26 | Halliburton Energy Services, Inc. | Downhole signal compression and surface reconstruction |
WO2020096572A1 (en) | 2018-11-06 | 2020-05-14 | Halliburton Energy Services, Inc. | Dictionary generation for downhole signal compression |
EP3933167A1 (en) | 2018-11-06 | 2022-01-05 | Halliburton Energy Services Inc. | Subsurface measurement compression and reconstruction |
CN111556612B (zh) * | 2020-06-04 | 2022-02-18 | 黄萍 | 一种电源线载波驱动led灯体的压缩灰度控制码协议 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5699121A (en) * | 1995-09-21 | 1997-12-16 | Regents Of The University Of California | Method and apparatus for compression of low bit rate video signals |
EP0797895A1 (en) | 1995-10-18 | 1997-10-01 | Koninklijke Philips Electronics N.V. | Method of encoding video images |
US6148106A (en) * | 1998-06-30 | 2000-11-14 | The United States Of America As Represented By The Secretary Of The Navy | Classification of images using a dictionary of compressed time-frequency atoms |
CN1183767C (zh) | 1999-12-28 | 2005-01-05 | 皇家菲利浦电子有限公司 | 基于匹配追踪算法的视频编码方法 |
EP1404133A4 (en) * | 2001-06-29 | 2010-04-21 | Ntt Docomo Inc | IMAGE ENCODER, IMAGE DECODER, IMAGE ENCODING METHOD, AND IMAGE DECODING METHOD |
EP2458865A3 (en) * | 2001-06-29 | 2014-10-01 | NTT DoCoMo, Inc. | Apparatuses for image coding and decoding |
US7003039B2 (en) * | 2001-07-18 | 2006-02-21 | Avideh Zakhor | Dictionary generation method for video and image compression |
US20030103523A1 (en) * | 2001-11-30 | 2003-06-05 | International Business Machines Corporation | System and method for equal perceptual relevance packetization of data for multimedia delivery |
US7242812B2 (en) * | 2003-06-26 | 2007-07-10 | Academia Sinica | Coding and decoding of video data |
-
2004
- 2004-07-14 KR KR1020067002370A patent/KR20060060000A/ko not_active Application Discontinuation
- 2004-07-14 CN CNB2004800224420A patent/CN100469142C/zh not_active Expired - Fee Related
- 2004-07-14 US US10/567,224 patent/US7746929B2/en not_active Expired - Fee Related
- 2004-07-14 WO PCT/IB2004/002476 patent/WO2005013201A1/en active Application Filing
- 2004-07-14 EP EP04744127A patent/EP1654706B1/en not_active Not-in-force
- 2004-07-14 JP JP2006522427A patent/JP2007501555A/ja not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
CN1833259A (zh) | 2006-09-13 |
US20060209963A1 (en) | 2006-09-21 |
US7746929B2 (en) | 2010-06-29 |
EP1654706B1 (en) | 2012-10-10 |
EP1654706A1 (en) | 2006-05-10 |
CN100469142C (zh) | 2009-03-11 |
WO2005013201A1 (en) | 2005-02-10 |
JP2007501555A (ja) | 2007-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20060060000A (ko) | 비디오 엔코딩 및 디코딩 방법들 및 장치들 | |
Han et al. | Jointly optimized spatial prediction and block transform for video and image coding | |
EP1656644B1 (en) | Video encoding and decoding methods and corresponding devices | |
EP2460355B1 (en) | Method for decoding a stream of coded data representative of a sequence of images and method for coding a sequence of images | |
US20040105586A1 (en) | Method and apparatus for estimating and controlling the number of bits output from a video coder | |
Banham et al. | A selective update approach to matching pursuits video coding | |
Choy et al. | Reduction of block-transform image coding artifacts by using local statistics of transform coefficients | |
JP5909149B2 (ja) | 色変換装置、符号化器および復号器ならびにそれらのプログラム | |
Neff et al. | Very low bit-rate video coding using matching pursuits | |
JP6309188B2 (ja) | 画素ブロックを符号化して再構成する方法及び対応する装置 | |
US10104389B2 (en) | Apparatus, method and non-transitory medium storing program for encoding moving picture | |
US9781446B2 (en) | Method for coding and method for decoding a block of an image and corresponding coding and decoding devices | |
JP2013110747A5 (ko) | ||
KR100367468B1 (ko) | 픽셀들을 가지는 디지털화 된 화상에서 동작을추정하기위한 방법 및 장치 | |
KR101419689B1 (ko) | H.264/avc 복호기에서 역양자화 및 역변환을 수행하는 복호화 장치 및 이를 이용한 복호화 방법 | |
Chan et al. | Discrete tchebichef transform for versatile video coding | |
Moon et al. | A new low-complexity integer distortion estimation method for H. 264/AVC encoder | |
KR101997003B1 (ko) | 픽셀 블록을 코딩하고 재구성하기 위한 방법 및 대응하는 디바이스들 | |
WO2011098488A1 (en) | Method for coding and for reconstruction of a block of an image sequence | |
Kuo et al. | Multiresolution video coding based on Kalman filtering motion estimation | |
US20160050441A1 (en) | Video encoding apparatus, video decoding apparatus, video encoding method, video decoding method, and computer program | |
JP2018032900A (ja) | 映像符号化装置及び映像復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
N231 | Notification of change of applicant | ||
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |