KR20060060000A - 비디오 엔코딩 및 디코딩 방법들 및 장치들 - Google Patents

비디오 엔코딩 및 디코딩 방법들 및 장치들 Download PDF

Info

Publication number
KR20060060000A
KR20060060000A KR1020067002370A KR20067002370A KR20060060000A KR 20060060000 A KR20060060000 A KR 20060060000A KR 1020067002370 A KR1020067002370 A KR 1020067002370A KR 20067002370 A KR20067002370 A KR 20067002370A KR 20060060000 A KR20060060000 A KR 20060060000A
Authority
KR
South Korea
Prior art keywords
block
motion
blocks
frame
generating
Prior art date
Application number
KR1020067002370A
Other languages
English (en)
Inventor
스텝판 바렌테
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34112504&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR20060060000(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20060060000A publication Critical patent/KR20060060000A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/97Matching pursuit coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 비디오 압축 분야에 관한 것으로서, 특히, 각 프레임은 임의의 크기로 세분된 프레임들의 입력 시퀀스에 적용되는 비디오 엔코딩 방법에 관한 것이다. 이 방법은 현재 프레임의 블록들의 적어도 일부에 대해서: 각 현재 원래 프레임 및 이전 재구성된 프레임으로부터 얻어진 각 모션-보상된 프레임들을 블록 마다 발생시키는 단계; 상기 모션-보상된 프레임들로부터 잔류 신호들을 발생시키는 단계; 발생된 잔류 신호들 각각을 원자들(atoms)이라 불리는 코딩된 딕셔너리 함수들(dictionary functions)로 분해하는 일치 추적 알고리즘(matching pursuit algorithm)을 사용하는 단계로서, 상기 현재 프레임의 다른 블록들은 다른 코딩 기술들에 의해 처리되는, 상기 일치 추적 알고리즘을 사용하는 단계;출력 코딩된 비트스트림을 발생시키기 위하여, 모션 보상 단계동안 결정된 상기 모션 벡터들 및 상기 원자들을 코딩하는 단계를 포함하며; 상기 방법은 임의의 원자가 한번에 단지 하나의 블록(B)에 대해서만 작용하도록 하는데, 상기 블록-제한(block-restriction)은 다음 2D 공간 도메인 연산, 즉
Figure 112006008193269-PCT00027
에 따라서, 잔류 신호(f)의 재구성이 인덱싱 파라미터(indexing parameter)(γn)에 대응하는 블록(B)으로 제한 되는 기초 함수(gγnB)로 이루어진 딕셔너리로부터 얻어지도록 한다.
모션-보상된 프레임, 딕셔너리 함수, 블록-제한, 픽셀, 인덱싱 파리미터

Description

비디오 엔코딩 및 디코딩 방법들 및 장치들{Video encoding and decoding methods and corresponding devices}
본 발명은 일반적으로 비디오 압축 분야에 관한 것이며, 특히, 예를 들면, MPEG 군(MPEG-1, MPEG-2, MPEG-4)의 비디오 표준들 및 ITU H26X 군(H.261, H.263 및 익스텐션들)의 비디오 코딩 권장들(video coding recommendations)에 관한 것이다. 특히, 본 발명은 프레임들의 입력 시퀀스에 적용되는 비디오 엔코딩 방법에 관한 것이며, 여기서 각 프레임은 임의의 크기의 블록들로 세분되며, 상기 방법은 적어도 현재 프레임의 상기 블록들에 대해서:
- 각 현재 원래 프레임 및 이전 재구성된 프레임으로부터 각각 얻어진 모션-보상된 프레임들을 블록마다 발생시키는 단계;
- 상기 모션-보상된 프레임들로부터 잔류 신호들을 발생시키는 단계;
- 상기 발생된 잔류 신호들 각각을 원자들(atoms)이라 불리는 코딩된 딕셔너리 함수들(dictionary functions)로 분해하는 소위 일치 추적(MP) 알고리즘(matching pursuit algorithm)을 사용하는 단계로서, 상기 현재 프레임의 다른 블록들은 다른 코딩 기술들에 의해 처리되는, 상기 일치 추적 알고리즘을 사용하는 단계;
- 출력 코딩된 비트스트림을 발생시키기 위하여, 모션 보상 단계동안 결정된 상기 모션 벡터들 및 상기 원자들을 코딩하는 단계를 포함한다.
또한, 본 발명은 대응하는 비디오 디코딩 방법 및 상기 엔코딩 및 디코딩 방법들을 실행하기 위한 엔코딩 및 디코딩 장치들에 관한 것이다.
현재 비디오 표준들(비디오 코딩 MPEG-4 표준 및 H.264 권장에 이르기까지), 하나의 루미넌스 채널 및 2개의 크로미넌스 채널들의 견지에서 기술된 비디오는 각 채널에 적용되는 2가지 코딩 모드들: 즉, 각 영상 내의 픽셀들(화소들)의 공간적 용장성(spatial redundancy)를 주어진 채널에서 사용하는 "인트라" 모드 및 분리된 영상들(또는 프레임들) 간의 시간적 용장성(temporal redundancy)를 사용하는 "인터" 모드에 의해 압축될 수 있다. 모션 보상 동작에 의존하는 인터 모드는 하나의(또는 그 이상) 영상(들)로부터 또 다른 한 영상까지 픽셀들의 모션을 엔코딩함으로써 하나의(또는 그 이상) 이전 디코딩된 영상(들)로부터 영상을 묘사(describe)한다. 통상적으로, 코딩될 현재 영상은 독립 블록들(예를 들어, MPEG-4에서 8×8 또는 16×16 픽셀들의 크기 또는 H.264에서 4×4, 4×8, 8×4, 8×8, 8×16, 16×8 및 16×16의 크기)로 세분되는데, 이들 각각은 모션 벡터를 할당받는다(3개의 채널들은 이와 같은 모션 디스크립션(motion description)을 공유한다). 그 후, 상기 영상의 예측은 각 블록에 관련된 모션 벡터들의 세트에 따라서 기준 영상으로부터 픽셀 블록들을 변위시킴으로써 재구성될 수 있다. 최종적으로, 엔코딩될 현재 블록 및 이의 모션-보상된 예측 간의 차 또는 잔류 신호는 인트라 모드에서 엔코딩될 수 있다(MPEG-4 경우 8×8 이산 코사인 변환들- 또는 DCT들 또는 주요 레벨 프로필 경 우 H.264에 대한 4×4 DCT들).
DCT는 아마도 가장 폭넓게 사용되는 변환인데, 그 이유는 특히 중간 및 고 비트레이트들에서 각종 다양한 코딩 상황들에서 양호한 압축 효율을 제공하기 때문이다. 그러나, 저 비트레이트들에서, 하이브리드 모션 압축된 DCT 구조는 2가지 이유 때문에 아티팩트 없는 시퀀스를 전달할 수 없다. 첫번째, 모션-보상된 인터 예측 그리드(motion-compensated inter prediction grid)의 구조는 아티팩트들을 블록킹하면서 가시적이다. 게다가, DCT 기초 함수들의 블록 에지들은 영상 그리드 내에서 가시적인데, 그 이유는 너무 적은 계수들이 양자화, 즉 지나치게 대충적으로 양자화되어 이들 블록킹 아티팩트들을 구성하고 영상 내에서 스무드한 오브젝트들을 재구성하기 때문이다.
R.Neff. 및 A.Zakhor가 IEEE Transactions on Circuits and Systems for Video Technology, vol.7, n°1, February 1997, pp.158-171에 "Very low bit-rate video coding based on matching pursuits"라는 명칭으로 발표한 문헌에 10년전에 개발된 기술인 소위 일치 추적(MP) 알고리즘(S.G.Mallet 및 Z.Zhang이 IEEE Transactions on Signal Processing, vol. 41, n° 12, December 1993, pp. 3397-3414에 "Matching pursuits with time-frequency dictionaries"라는 명칭으로 발표한 문헌을 참조하라)을 토대로 한 비디오 압축 알고리즘을 포함하는 새로운 모션-보상된 시스템을 설명한다. 상기 기술은 임의의 함수 또는 신호(예를 들어, 영상, 비디오,...)를 시간과 주파수 둘 다에서 그리고 소위 원자들에서 양호하게 국부화된 기초 함수들의 용장 딕셔너리에 속하는 파형들의 선형 확장으로 반복적으로 분 해하는 방법을 제공한다. 시간-주파수 원자들의 일반적인 군(family)은 실수 및 연속적으로 미분될 수 있다라고 추정되는 단일 함수
Figure 112006008193269-PCT00001
을 스케일링, 트랜스레이팅 및 변조함으로써 생성될 수 있다. 이들 딕셔너리 함수들은 다음과 같이 지정될 수 있다.
Figure 112006008193269-PCT00002
γ(=감마)는 각 특정 딕셔너리 원소(또는 원자)에 관련된 인덱싱 파라미터이다. 제1 인용 문헌에 서술된 바와 같이, 함수들 gγ(t)이 단위 놈(norm), 즉 <gγ(t), gγ(t)>=1을 갖는다면, 1차원 시간 신호(f(t))의 분해는 γ를 선택함으로써 시작되어 다음 내적의 절대값을 최대화한다.
Figure 112006008193269-PCT00003
여기서 p는 딕셔너리 함수 gγ(t) 상으로 신호(f(t))에 대한 확장 계수라 칭한다. 그 후, 잔류 신호(R)는 다음과 같이 계산되고,
Figure 112006008193269-PCT00004
이 잔류 신호는 원래 신호(f(t))와 동일한 방법으로 확장된다. 원자는 실제로 각 쌍(γk, pk)에 제공된 명칭(name)이며, 여기서 k는 일치 추적 절차에서 반복 랭크(rank)이다. 이 반복 절차의 총 M개의 스테이지(각 스테이지 n은 γn, 확장 계수(pn) 및 다음 스테이지로 통과되는 잔류 (Rn) 의해 규정된 딕셔너리 구조를 산출 한다), 원래 신호(f(t))는 이에 따라서 얻어진 딕셔너리 원소들의 선형 조합인 신호
Figure 112006008193269-PCT00005
에 의해 근사화된다. 반복적인 절차는 규정된 조건이 부합, 예를 들어, 확장 계수들의 세트 수가 발생되거나 이 잔류를 위한 일부 에너지 임계값이 도달될 때 중지된다.
상술된 제1 문헌에서, 저 비트레이트들에서 DCT 알고리즘보다 양호하게 수행되는 상기 MP 알고리즘을 기반으로 하는 시스템을 설명하면, 원래 영상들은 예측된/변위된 블록들(그러므로 블록들의 에지들은 스무드되고 블록 그리드는 덜 가시적이다)의 경계들을 블렌드함으로써 블록킹 아티팩트들을 피하거나 감소시키는 중첩된 블록-모션 보상이라 불리는 도구를 사용하여 우선 모션-보상된다. 모션 예측 영상이 형성된 후, 원래 영상으로부터 감산되어 모션 잔류를 발생시킨다. 그 후, 상기 잔류는 기초 딕셔너리(상기 딕셔너리 도1에 도시된 2D 분리가능한 가버(Gabor) 함수들의 오버컴플리트 수집으로 이루어진다)의 적절한 선택에 의해 2차원(2D) 도메인으로 확장되는 MP 알고리즘을 사용하여 코딩된다.
그 후, 잔류 신호(f)는 M 딕셔너리 원소들의 선형 조합에 의해 재구성된다.
Figure 112006008193269-PCT00006
딕셔너리 기초 함수들이 단위 놈을 갖는 경우,
Figure 112006008193269-PCT00007
은 기초 함수 (g□n) 및 반복적으로 갱신된 잔류 간의 양자화된 내적 <, >이다. 즉:
Figure 112006008193269-PCT00008
상기 쌍들
Figure 112006008193269-PCT00009
은 원자들이다. 이 문헌의 저자들에 의해 설명된 작업에서, 영상의 원자의 가능한 위치에 배치되는 것은 제한되지 않는다(도2 참조). 딕셔너리를 형성하는 2D 가버 함수들은 전형적인 가우스 윈도우와 관련하여 규정된다.
Figure 112006008193269-PCT00010
1차원(1D) 이산 가버 함수는 스케일링되며, 변조된 가우스 윈도우로서 규정된다.
Figure 112006008193269-PCT00011
여기서
Figure 112006008193269-PCT00012
이다.
상수
Figure 112006008193269-PCT00013
Figure 112006008193269-PCT00014
가 단위 놈으로 이루어지고
Figure 112006008193269-PCT00015
가 정의 스케일, 변조 주파수 및 위상 시프트 각각으로 이루어진 트리플이되도록 선택된다. S는 모든 이와 같은 트리플들
Figure 112006008193269-PCT00016
의 세트이고, 딕셔너리의 2D 분리가능한 가버 함수들은 다음 항을 갖는다.
Figure 112006008193269-PCT00017
1D 기초 세트(또는 딕셔너리)를 형성하는 것으로서 문헌에 표시된 관련 크기 들(픽셀들) 및 이용가능한 딕셔너리 트리플들의 세트가 다음 표1에 나타나 있다.
Figure 112006008193269-PCT00018
이 파라미터 세트를 얻기 위하여, 모션 잔류 영상들의 트레인닝 세트는 훨씬많은 파라미터 트리플들의 세트로부터 도출된 딕셔너리를 사용하여 분해된다. 트레인닝 영상들에 가장 종종 일치되는 딕셔너리 원소들은 감소된 세트에 유지된다. 얻어진 딕셔너리는 특히, 원자들이 놓이는 블록의 경계들로 원자들의 영향이 제한될 때 원자들은 모션 잔류 영상의 구조와 자유롭게 일치할 수 있도록 설계된다(블록-제한들 없이 블록 분할된 영상에 배치된 원자의 예를 도시한 도2 참조).
그러나, 인용 문헌에 서술된 방법은 여러 가지 제한들을 겪는다. 첫번째 제약은 가버 딕셔너리의 연속 구조와 관련된다. 원자들이 임의의 제한 없이 모든 픽셀 위치들에 배치될 수 있음으로 여러 모션-보상된 블록들을 스팬하기 때문에, MP 알고리즘은 제한된 수의 스무드 원자들을 지닌 잔류 신호에서 블록킹 아티팩트들을 표시할 수 없다. 그 이유는 블록킹 아티팩트들을 제한하기 위하여 일종의 중첩된 모션 추정을 가져야할 필요가 있기 때문이다. 전통적인 블록-기반으로 한 모션 보상(즉, 중첩 윈도우 없음)이 사용되는 경우, 스무드 기초 함수들은 블록킹 아티팩트들을 구성하는데 적절하지 않을 수 있다(실제로, 최근 코딩 이득들이 잔류 코딩 변환의 크기가 모션 보상된 블록의 크기와 일치될 때 행해질 수 있다는 것을 보여준다). 세번째, 코딩된 프레임에서 인트라 및 인터 블록들을 결합하는 것이 어렵다(인용된 문헌에서, 가버 기초 함수들의 스무드 구조에 의해 나쁘게 모델링되는 인트라 및 인터 모드에서 코딩된 블록들의 경계에 대한 불연속성을 피하도록 하기 위하여 DCT 인트라 매크로블록이 존재하지 않는다).
그러므로, 본 발명의 목적은 상기 제약들이 더이상 존재하지 않는 비디오 엔코딩 방법을 제공하는 것이다.
이를 위하여, 본 발명은 상기 설명의 서두부에 규정되고 상기 MP 알고리즘을 사용할 때, 임의의 원자가 한번에 단지 한 블록(B)에 대해서만 작용할 때 잔류 신호(f)가 다음 2D 공간 도메인 연산에 따라서 인덱싱 파라미터(γn)에 대응하는 블록(B)으로 제한되는 기초 함수들
Figure 112006008193269-PCT00019
로 이루어진 딕셔너리로부터 잔류 신호(f)의 재구성이 얻어진다는 사실을 상기 블록-제한이 유도하도록 하는 비디오 엔코딩 방법에 관한 것이다.
Figure 112006008193269-PCT00020
이 방법의 주요 관심사항은 MP 원자들이 모션-보상된 블록들로 제한된다는 사실에 있다. 블록 경계들에 걸쳐서 간섭이 존재하지 않기 때문에, 잔류 신호들의 블록키 구조(blocky structure)를 더욱 양호하게 모델링하여 교호적인 MP 및 DCT 변환들의 가능성을 제공하고 동일한 코딩 비용을 위한 딕셔너리 다이버시티를 암시적을 증분시킨다. 이는 또한 블록킹 아티팩트들을 제한하기 위한 중첩된 모션 보상에 의존할 필요성을 피하게 한다.
본 발명의 또 다른 목적은 상기 엔코딩 방법을 실행하도록 하는 비디오 엔코딩 장치를 제공하는 것이다.
본 발명의 또한 다른 목적은 상기 비디오 엔코딩 방법 및 장치에 의해 코딩된 신호들을 디코딩하도록 하는 비디오 디코딩 방법 및 장치를 제공하는 것이다.
본 발명이 지금부터 예로서 첨부 도면을 참조하여 설명될 것이다.
도1은 일치 추적 알고리즘의 구현방식에 사용되는 2D 가버 딕셔너리의 400 기초 함수를 가시화한 도면.
도2는 블록-제한들 없이 블록-분할된 영상에 배치된 원자의 예를 도시한 도면.
도3은 본 발명을 따른 하이브리드 비디오 코더의 예를 도시한 도면.
도4는 MP 추적 알고리즘을 구현하는 비디오 엔코딩 장치의 예를 도시한 도면.
도5는 한번에 블록에 대해서만 작용하고 모션-보상된 그리드로 한정되는 원자로 블록-제한된 일치 추적 잔류 코딩의 경우를 도시한 도면.
도6은 본 발명을 따른 하이브리드 비디오 디코더의 예를 도시한 도면.
도7은 MP 알고리즘을 구현하는 비디오 디코딩 장치의 예를 도시한 도면.
다수의 코딩 엔진들을 사용하는 하이브리드 비디오 코더를 구현하는 비디오 엔코딩 장치의 간단화된 블록도가 도3에 도시되어 있다. 여러 코딩 엔진들은 소정의 코딩 기술들을 구현하는데, 예를 들어 코딩 엔진(31)은 INTRA-DCT 코딩 방법을 구현하며, 제2의 코딩 엔진(32)은 INTER-DCT 코딩 방법을 구현하며, 제3 코딩 엔진(33)은 일치 추적 알고리즘을 구현한다. 입력 비디오 시퀀스의 각 프레임은 블록 파티셔너 장치(34)에 의해 수신되는데("비디오 신호"), 상기 장치는 영상을 다양한 크기의 개별적인 블록들로 분할하고 어느 코딩 엔진이 현재 원래 블록을 처리할지를 결정한다. 블록 위치, 크기 및 선택된 코딩 엔진을 표시하는 이 결정들은 코딩 장치(35)에 의해 비트스크림내로 삽입된다. 그 후, 현재 원래 신호 블록은 선택된 코딩 엔진(도3에 도시된 상황에서 엔진(33))으로 전달된다(도3에 도시된 상황에서 엔진(33)).
일치 추적 코딩 엔진은 MP 추적 알고리즘을 구현하는 비디오 엔코딩 장치의 일예를 도시한 도4의 간단화된 블록도로서 또한 도시될 것이다. 코딩 엔진(33)에 할당된 입력 비디오 시퀀스의 각 원래 신호 블록들은 모션 보상 수단(41)에 의해 한 측상에서 수신되어 모션 벡터들(상기 모션 벡터들은 종래에 블록 일치 알고리즘을 사용하여 발견된다)을 결정하고 이에 따라서 얻어진 벡터들은 모션 벡터 코딩 수단(42)에 의해 코딩되는데, 상기 코딩된 벡터들은 멀티플렉서(43)에 전달된다(도시되지 않았지만 참조됨). 다른 한 측상에서 감산기(44)는 자신의 출력 상에 현재 영상 및 이의 예측 간의 잔류 신호를 전달한다. 그 후, 상기 잔류 신호는 원자들로 분해되고(원자들의 딕셔너리는 (47)로 표시됨) 이에 따라서 결정된 원자 파라미터들(모듈 45)은 코딩된다(모듈 46). 그 후, 코딩된 모션 벡터들 및 원자 파라미터들은 시퀀스의 각 프레임에 대한 규정된 조건에 일치하도록 전송되는 비트스트림을 형성한다.
이 엔코딩 엔진(33)은 다음 단계들을 포함하는 입력 비트스트림을 코딩하는 방법을 실행한다. 우선, 대부분의 코딩 구조에서처럼, 입력 시퀀스의 원래 프레임들은 모션 보상된다(각 프레임은 이전 재구성된 프레임을 토대로 모션-보상되고, 상기 모션-보상된 단계 동안 결정된 모션 벡터들은 이들의 나중 전송 관점에서 저장된다). 그 후, 잔류 신호들은 현재 프레임 및 관련된 모션-보상된 예측 간의 차에 의해 발생된다. 그 후, 상기 잔류 신호들 각각은 2D 분리가능한 가버 함수들의 콜렉션으로 이루어진 함수들의 딕셔너리와 비교되어 인덱싱 파라미터(γn), 확장 계수(p(n)) 및 이 반복 절차의 다음 단계로 통과되는 잔류 Rn(t)-p.gγ(t)로 규정된 딕셔너리 구조(gγ(t))를 발생시킨다. 원자 파라미터들이 발견되면, 이들 파라미터들은 코딩(이전 결정된 모션 벡터들과 함께)될 수 있음으로, 이에 따라서 얻어진 코딩된 신호들은 디코더로 전송되는 비트스트림을 형성한다
본 발명을 따른 기술적인 해법은 원자들이 놓이는 블록의 경계들로 원자들의 영향을 한정하는 것을 포함한다. 이 블록-제한은 원자가 도5에 도시된 바와 같이 모션-보상 그리드내로 한정되는 단지 하나의 블록에 대해서 단지 한번 작용하도록 하는 것을 의미한다. 이 블록 제한은 다음 방식으로 신호 일치 추적 알고리즘을 수정한다.
모션 보상 후 M×N 픽셀들의 크기의 블록(B)에서 2D 잔류의 MP 분해를 얻고 B로 제한된 MP 딕셔너리를 G|B 라 표시하면, 상기 딕셔너리의 원소들 gγnB은 관계식(9) 및 (10)에 의해 얻어진다.
Figure 112006008193269-PCT00021
Figure 112006008193269-PCT00022
이 경우에, gγnB가 반드시 단위 놈을 가질 필요가 없기 때문에, pn은 다음과 같이 재가중될 필요가 있다.
Figure 112006008193269-PCT00023
이 방법의 관심사항은 실제로 단일 원자가 여러 블록들을 스팬할 수 없기 때문에, 블록 에지들에서 고주파수 불연속성들을 처리할 필요가 없다는 것이다. 대신에, 블록-크기 종속 딕셔너리들을 설계함으로써 블록 경계들 및 심지어 블록 크기들로 적응될 수 있다. 게다가, 중첩된 모션 보상은 MP 효율성을 유지하도록 더 이상 강제되지 않기 때문에, 전통적인 모션 보상이 사용될 수 있다.
상술된 엔코딩 장치의 바람직한 실시예는 대응하는 디코딩 장치에 의해 수신되는 비트스트림을 전송한다. 본 발명을 따르고 다수의 디코딩 엔진들을 사용하는 하이브리드 비디오 디코더를 구현하는 비디오 디코딩 장치의 간단화된 블록도는 도6에 도시되어 있다. 전송된 비트스트림은 현재 블록 위치, 이의 크기를 디코딩하는 블록 파티션 디코딩 장치(64), 및 디코딩 방법에 의해 한 측 상에서 수신된다. 디코딩 방법이 제공되면, 그 후, 비트스트림 원소들은 도6의 경우에 대응하는 디코딩 엔진(61 또는 62 또는 63)으로 전달되고, 이는 할당된 블록들을 차례로 디코딩하고 비디오 신호 재구성된 블록을 출력한다. 이용가능한 디코딩 엔진들은 예를 들어 INTRA-DCT 블록 디코더(61), INTER-DCT 블록 디코더(62) 및 일치 추적 블록 디코더(63)일 수 있다.
일치 추적 디코딩 엔진의 예는 MP 알고리즘을 구현하는 비디오 디코딩 장치의 예를 도시한 도7에 또한 도시된다. 비트스트림 원소들은 엔트로피 디코더 장치 (71)에 의해 수신되는데, 이는 디코딩된 잔류 신호를 형성하기 위하여 할당된 비디오 블록 내의 디코딩된 위치에서 일치 추적 기능들을 재구성하는 원자 장치(72)(원자들의 딕셔너리는 (73)으로 표시됨)로 디코딩된 원자 파라미터들을 전달한다. 엔트로피 디코더 장치는 또한, 이전 재구성된 비디오 신호들로부터 모션 예측 신호를 형성하기 위하여 모션 보상 장치(74)로 공급되는 출력 모션 벡터들이다. 그 후, 모션 예측 및 재구성된 잔류 신호는 가산기(75)에서 합산되어 비디오 신호 재구성된 블록을 발생시킨다.

Claims (5)

  1. 각 프레임이 임의 크기의 블록들로 세분되는 프레임들의 입력 시퀀스에 적용되는 비디오 엔코딩 방법으로서, 상기 방법은 현재 프레임의 상기 블록들의 적어도 일부에 대해서:
    각 현재 원래 프레임 및 이전 재구성된 프레임으로부터 얻어진 각 모션-보상된 프레임들을 블록마다 발생시키는 단계;
    상기 모션-보상된 프레임들로부터 잔류 신호들을 발생시키는 단계;
    상기 발생된 잔류 신호들 각각을 원자들(atoms)이라 불리는 코딩된 딕셔너리 함수들(coded dictionary functions)로 분해하는 소위 일치 추적(matching pursuit; MP) 알고리즘을 사용하는 단계로서, 상기 현재 프레임의 다른 블록들은 다른 코딩 기술들에 의해 처리되는, 상기 일치 추적 알고리즘을 사용하는 단계;
    출력 코딩된 비트스트림을 발생시키기 위하여, 모션 보상 단계동안 결정된 상기 모션 벡터들 및 상기 원자들을 코딩하는 단계를 포함하며;
    상기 방법은 상기 MP 알고리즘을 사용할 때, 임의의 원자가 한번에 단지 하나의 블록(B)에 대해서만 작용하도록 하며, 상기 블록-제한(block-restriction)은 다음 2D 공간 도메인 연산, 즉
    Figure 112006008193269-PCT00024
    에 따라, 잔류 신호(f)의 재 구성이 인덱싱 파라미터(γn)에 대응하는 블록(B)으로 제한되는 기초 함수(gγnB)로 이루어진 딕셔너리로부터 얻어지는, 비디오 엔코딩 방법.
  2. 각 프레임이 임의 크기의 블록들로 세분되는 프레임들의 입력 시퀀스에 적용되는 비디오 엔코딩 장치로서, 상기 장치는 현재 프레임의 상기 블록들의 적어도 일부에 적용되고,
    각 현재 원래 프레임 및 이전 재구성된 프레임로부터 얻어진 각 모션 보상된 프레임들을 블록마다, 모션 보상 단계에 의해 발생시키는 수단;
    상기 모션-보상된 프레임들로부터 잔류 신호들을 발생시키는 수단;
    상기 발생된 잔류 신호들 각각을 원자들이라 불리는 코딩된 딕셔너리 함수들로 분해하는 소위 일치 추적(MP) 알고리즘을 사용하는 수단으로서, 상기 현재 프레임의 다른 블록들은 다른 코딩 기술들에 의해 처리되는, 상기 일치 추적 알고리즘을 사용하는 수단;
    출력 코딩된 비트스트림을 발생시키기 위하여, 모션 보상 단계동안 결정된 상기 모션 벡터들 및 상기 원자들을 각 관련된 블록에 대해서 코딩하는 수단을 포함하며;
    상기 장치는 상기 MP 알고리즘을 사용할 때, 임의의 원자가 한번에 단지 하나의 블록(B)에 대해서만 작용하도록 하며, 상기 블록-제한은 다음 2D 공간 도메인 연산, 즉
    Figure 112006008193269-PCT00025
    에 따라서, 잔류 신호(f)의 재구성이 인덱싱 파라미터(γn)에 대응하는 블록(B)으로 제한되는 기초 함수(gγnB)로 이루어진 딕셔너리로부터 얻어지는 비디오 엔코딩 장치.
  3. 제2항에 있어서, 딕셔너리 원소의 상기 양자화된 내적 (pn)은,
    Figure 112006008193269-PCT00026
    과 같이 재가중(reweight)되는 비디오 엔코딩 장치.
  4. 제1항을 따른 비디오 코딩 방법에 의해 코딩된 비트스트림에 적용되는 비디오 디코딩 방법으로서, 상기 디코딩 방법은 관련된 블록들에 대해서:
    - 상기 코드 비트스트림 내에 포함되는 모션 벡터들 및 상기 코딩된 원자 파라미터들을 디코딩하는 단계;
    - 상기 디코딩된 원자 파라미터들로부터 상기 잔류 신호들을 재구성하는 단계;
    - 상기 디코딩된 모션 벡터들로부터 모션 보상된 신호들을 발생시키는 단계;
    - 상기 잔류 신호들과 상기 모션 보상된 신호의 합에 의해 비디오 신호 재구성된 블록들을 발생시키는 단계를 포함하는, 비디오 디코딩 방법.
  5. 제2항을 따른 비디오 엔코딩 장치에 의해 코딩된 비트스트림에 적용되는 비디오 디코딩 장치로서, 상기 디코딩 장치는 상기 관련된 블록들에 적용되고,
    - 상기 코드 비트스트림 내에 포함되는 모션 벡터들 및 상기 코딩된 원자 파라미터들을 디코딩하는 수단;
    - 상기 디코딩된 원자 파라미터들로부터 상기 잔류 신호들을 재구성하는 수단;
    - 상기 디코딩된 모션 벡터들로부터 모션 보상된 신호들을 발생시키는 수단;
    - 상기 잔류 신호들과 상기 모션 보상된 신호의 합에 의해 비디오 신호 재구성된 블록들을 발생시키는 수단을 포함하는, 비디오 디코딩 방법.
KR1020067002370A 2003-08-05 2004-07-14 비디오 엔코딩 및 디코딩 방법들 및 장치들 KR20060060000A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03300081 2003-08-05
EP03300081.1 2003-08-05

Publications (1)

Publication Number Publication Date
KR20060060000A true KR20060060000A (ko) 2006-06-02

Family

ID=34112504

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067002370A KR20060060000A (ko) 2003-08-05 2004-07-14 비디오 엔코딩 및 디코딩 방법들 및 장치들

Country Status (6)

Country Link
US (1) US7746929B2 (ko)
EP (1) EP1654706B1 (ko)
JP (1) JP2007501555A (ko)
KR (1) KR20060060000A (ko)
CN (1) CN100469142C (ko)
WO (1) WO2005013201A1 (ko)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7813573B2 (en) * 2005-09-08 2010-10-12 Monro Donald M Data coding and decoding with replicated matching pursuits
KR20090073112A (ko) * 2006-09-22 2009-07-02 톰슨 라이센싱 다중 경로 비디오 코딩 및 디코딩을 위한 방법 및 장치
US10194175B2 (en) * 2007-02-23 2019-01-29 Xylon Llc Video coding with embedded motion
CN101453656B (zh) * 2007-11-29 2011-06-01 华为技术有限公司 视频编码、解码方法及装置和视频编解码系统
FR2940491B1 (fr) * 2008-12-23 2011-03-18 Thales Sa Systeme de procede interactif pour la transmission sur un reseau bas debit d'images clefs selectionnees dans un flux video
FR2943236A1 (fr) * 2009-03-18 2010-09-24 Imra Europ Sas Procede de surveillance d'un parametre biologique d'une personne au moyen de capteurs
FR2943234B1 (fr) * 2009-03-18 2012-09-28 Imra Europe Sas Procede de surveillance d'un parametre biologique d'un occupant d'un siege avec reduction de bruit
EP2534840A1 (en) * 2010-02-11 2012-12-19 Thomson Licensing Method for coding and for reconstruction of a block of an image sequence
CA2815330A1 (en) 2010-11-09 2012-05-18 Cellzome Limited Pyridine compounds and aza analogues thereof as tyk2 inhibitors
WO2012140821A1 (ja) 2011-04-12 2012-10-18 パナソニック株式会社 動画像符号化方法、動画像符号化装置、動画像復号化方法、動画像復号化装置、および動画像符号化復号化装置
EP4224861A1 (en) 2011-05-24 2023-08-09 Sun Patent Trust Image encoding method, image encoding apparatus, image decoding method, and image decoding apparatus
US9485518B2 (en) 2011-05-27 2016-11-01 Sun Patent Trust Decoding method and apparatus with candidate motion vectors
US9615107B2 (en) 2011-05-27 2017-04-04 Sun Patent Trust Image coding method, image coding apparatus, image decoding method, image decoding apparatus, and image coding and decoding apparatus
SG194746A1 (en) 2011-05-31 2013-12-30 Kaba Gmbh Image encoding method, image encoding device, image decoding method, image decoding device, and image encoding/decoding device
EP3629583B1 (en) 2011-05-31 2023-10-25 Sun Patent Trust Video decoding method, video decoding device
MY181718A (en) 2011-06-30 2021-01-05 Sun Patent Trust Image decoding method, image encoding method, image decoding device, image encoding device, and image encoding/decoding device
EP2741499A4 (en) 2011-08-03 2014-12-10 Panasonic Ip Corp America VIDEO CODING METHOD, VIDEO CODING METHOD, VIDEO CODING DEVICE, VIDEO ENCODING DEVICE AND VIDEO ENCODING / DECODING DEVICE
IN2014CN02602A (ko) 2011-10-19 2015-08-07 Panasonic Corp
US9288484B1 (en) * 2012-08-30 2016-03-15 Google Inc. Sparse coding dictionary priming
US9300906B2 (en) 2013-03-29 2016-03-29 Google Inc. Pull frame interpolation
US9286653B2 (en) 2014-08-06 2016-03-15 Google Inc. System and method for increasing the bit depth of images
US10904565B2 (en) * 2017-06-23 2021-01-26 Qualcomm Incorporated Memory-bandwidth-efficient design for bi-directional optical flow (BIO)
US11396806B2 (en) 2018-11-06 2022-07-26 Halliburton Energy Services, Inc. Downhole signal compression and surface reconstruction
WO2020096572A1 (en) 2018-11-06 2020-05-14 Halliburton Energy Services, Inc. Dictionary generation for downhole signal compression
EP3933167A1 (en) 2018-11-06 2022-01-05 Halliburton Energy Services Inc. Subsurface measurement compression and reconstruction
CN111556612B (zh) * 2020-06-04 2022-02-18 黄萍 一种电源线载波驱动led灯体的压缩灰度控制码协议

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5699121A (en) * 1995-09-21 1997-12-16 Regents Of The University Of California Method and apparatus for compression of low bit rate video signals
EP0797895A1 (en) 1995-10-18 1997-10-01 Koninklijke Philips Electronics N.V. Method of encoding video images
US6148106A (en) * 1998-06-30 2000-11-14 The United States Of America As Represented By The Secretary Of The Navy Classification of images using a dictionary of compressed time-frequency atoms
CN1183767C (zh) 1999-12-28 2005-01-05 皇家菲利浦电子有限公司 基于匹配追踪算法的视频编码方法
EP1404133A4 (en) * 2001-06-29 2010-04-21 Ntt Docomo Inc IMAGE ENCODER, IMAGE DECODER, IMAGE ENCODING METHOD, AND IMAGE DECODING METHOD
EP2458865A3 (en) * 2001-06-29 2014-10-01 NTT DoCoMo, Inc. Apparatuses for image coding and decoding
US7003039B2 (en) * 2001-07-18 2006-02-21 Avideh Zakhor Dictionary generation method for video and image compression
US20030103523A1 (en) * 2001-11-30 2003-06-05 International Business Machines Corporation System and method for equal perceptual relevance packetization of data for multimedia delivery
US7242812B2 (en) * 2003-06-26 2007-07-10 Academia Sinica Coding and decoding of video data

Also Published As

Publication number Publication date
CN1833259A (zh) 2006-09-13
US20060209963A1 (en) 2006-09-21
US7746929B2 (en) 2010-06-29
EP1654706B1 (en) 2012-10-10
EP1654706A1 (en) 2006-05-10
CN100469142C (zh) 2009-03-11
WO2005013201A1 (en) 2005-02-10
JP2007501555A (ja) 2007-01-25

Similar Documents

Publication Publication Date Title
KR20060060000A (ko) 비디오 엔코딩 및 디코딩 방법들 및 장치들
Han et al. Jointly optimized spatial prediction and block transform for video and image coding
EP1656644B1 (en) Video encoding and decoding methods and corresponding devices
EP2460355B1 (en) Method for decoding a stream of coded data representative of a sequence of images and method for coding a sequence of images
US20040105586A1 (en) Method and apparatus for estimating and controlling the number of bits output from a video coder
Banham et al. A selective update approach to matching pursuits video coding
Choy et al. Reduction of block-transform image coding artifacts by using local statistics of transform coefficients
JP5909149B2 (ja) 色変換装置、符号化器および復号器ならびにそれらのプログラム
Neff et al. Very low bit-rate video coding using matching pursuits
JP6309188B2 (ja) 画素ブロックを符号化して再構成する方法及び対応する装置
US10104389B2 (en) Apparatus, method and non-transitory medium storing program for encoding moving picture
US9781446B2 (en) Method for coding and method for decoding a block of an image and corresponding coding and decoding devices
JP2013110747A5 (ko)
KR100367468B1 (ko) 픽셀들을 가지는 디지털화 된 화상에서 동작을추정하기위한 방법 및 장치
KR101419689B1 (ko) H.264/avc 복호기에서 역양자화 및 역변환을 수행하는 복호화 장치 및 이를 이용한 복호화 방법
Chan et al. Discrete tchebichef transform for versatile video coding
Moon et al. A new low-complexity integer distortion estimation method for H. 264/AVC encoder
KR101997003B1 (ko) 픽셀 블록을 코딩하고 재구성하기 위한 방법 및 대응하는 디바이스들
WO2011098488A1 (en) Method for coding and for reconstruction of a block of an image sequence
Kuo et al. Multiresolution video coding based on Kalman filtering motion estimation
US20160050441A1 (en) Video encoding apparatus, video decoding apparatus, video encoding method, video decoding method, and computer program
JP2018032900A (ja) 映像符号化装置及び映像復号装置

Legal Events

Date Code Title Description
N231 Notification of change of applicant
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid