KR20150128664A - 픽셀의 2개의 블록을 비교하기 위한 방법 및 장치 - Google Patents

픽셀의 2개의 블록을 비교하기 위한 방법 및 장치 Download PDF

Info

Publication number
KR20150128664A
KR20150128664A KR1020157021426A KR20157021426A KR20150128664A KR 20150128664 A KR20150128664 A KR 20150128664A KR 1020157021426 A KR1020157021426 A KR 1020157021426A KR 20157021426 A KR20157021426 A KR 20157021426A KR 20150128664 A KR20150128664 A KR 20150128664A
Authority
KR
South Korea
Prior art keywords
block
pixels
signature
signature vector
vector
Prior art date
Application number
KR1020157021426A
Other languages
English (en)
Inventor
빈첸초 리구오리
Original Assignee
빈첸초 리구오리
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2013900077A external-priority patent/AU2013900077A0/en
Application filed by 빈첸초 리구오리 filed Critical 빈첸초 리구오리
Publication of KR20150128664A publication Critical patent/KR20150128664A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/547Motion estimation performed in a transform domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Abstract

현재 프레임 내의 픽셀의 제1 블록 B1과 참조 프레임 내의 픽셀의 제2 블록 B2를 비교하기 위해 데이터 처리 시스템을 동작하기 위한 방법이 제공된다. 제1 시그니처 벡터 V1 및 제2 시그니처 벡터 V2가 제1 블록 및 제2 블록에 생성된다. 거리 함수 D(V1,V2)를 이용하여 제1 및 제2 시그니처 벡터 사이의 거리가 측정되어, 블록의 유사성의 비교를 제공한다. 시그니처 벡터는, D(B1,B2)<D(B1,B3)이면, D(V1,V2)<D(V1,V3)이 되도록 선택되고, 여기서 B3은 상기 참조 프레임 내의 픽셀의 제3 블록이다. 또한, 평균적으로, 시그니처 벡터를 사용하여 2개의 블록을 비교하는 계산 작업량은 블록을 직접 비교함으로써 부과되는 계산 작업량보다 적다.

Description

픽셀의 2개의 블록을 비교하기 위한 방법 및 장치{METHOD AND APPARATUS FOR COMPARING TWO BLOCKS OF PIXELS}
본 출원은 2013년 1월 9일자로 출원된 호주 가출원 제2013900077호로부터의 우선권을 주장하고, 상기 문헌은 참조로 본 명세서에 원용된다.
이미지 인식 및 이미지 압축에 있어서의 다수의 문제는 상이한 이미지로부터 취해진 픽셀의 2개의 블록을 비교하는 것에 의존한다. 예를 들면, 비디오 전송 및 압축 스키마(scheme)에서, 연속 프레임 사이의 중복은 비디오의 대역폭 및 저장 요건을 감소시키는 데 이용된다. 블록 모션 예측 스키마에서, 각 프레임은 복수의 일정한 사이즈 블록으로 분할된다. 전송될 프레임은 우선 현재 프레임 내의 대응하는 블록과 가장 근접하게 매칭하는 참조 프레임 내의 블록을 검색함으로써 이미 송신된 참조 프레임의 블록에 관해서 부호화된다. 다음에, 현재 블록은 참조 프레임 내의 블록 더하기 차분 블록(difference block)으로 표현된다. 참조 블록이 현재 블록과근접하게 매칭되면, 차분 블록은 상당히 적은 정보를 가지며, 따라서 현재 블록이 소망의 정확도로 수신기에서 여전히 재구성될 수 있게 하는 손실 고압축 이미지 압축 스키마(lossy high compression image compression scheme)를 사용하여 부호화될 수 있다.
유사하게, 이미지 인식 시스템에서, 라이브러리(library) 내의 객체로부터의 픽셀의 블록은 이미지 내의 픽셀의 블록과 비교되어, 라이브러리 객체가 이미지 내에 있는지를 결정하여야 한다. 또, 라이브러리 객체로부터의 픽셀의 블록은 이미지 내의 다수의 위치에서 유사한 사이즈의 블록에 대해 매칭되어, 객체가 이미지 내에 있는지 및 이미지 내에서의 그러한 객체의 위치를 결정하여야 한다.
마지막으로, 입체 시각화 시스템(stereoscopic vision system)에서, 하나의 뷰(view)로부터의 픽셀의 블록은 제2 위치로부터의 픽셀의 블록과 비교되어, 양쪽 뷰에 존재하는 객체를 식별하고 객체의 3차원 위치를 결정하여야 한다.
픽셀의 2개의 블록 사이의 유사성을 판정하기 위한 2개의 통상 사용되는 알고리즘은 픽셀의 차이의 절댓값의 합 또는 픽셀의 차이의 제곱의 합을 계산한다. 이러한 알고리즘을 사용하여 픽셀의 2개의 nxn 블록을 비교할 때의 계산 작업량은 차수 n2을갖는다. 처리되는 이미지가 픽셀의 NxN 어레이이면, 매칭 프로세스는 제1 이미지의 현재 블록에 대응하는 제2 이미지의 대응하는 블록을 검색하기 위해 거의 (N-n)2회 반복되어야 한다. 따라서, 이러한 타입의 상관 비교는 전형적으로 n에 따른 계산 작업량의 빠른 증가 때문에 비교적 작은 블록 사이즈에 제한되거나, 또는 검색 구역이 어떤 다른 메커니즘에 의해 제한되어야 한다.
본 발명은 현재 프레임 내의 픽셀의 제1 블록 B1과 참조 프레임 내의 픽셀의 제2 블록 B2를 비교하기 위해 데이터 처리 시스템을 동작하기 위한 방법을 포함한다. 상기 방법은 제1 블록 및 제2 블록에 대한 제1 시그니처 벡터 V1 및 제2 시그니처 벡터 V2를 각각 생성하는 단계를 포함한다. 거리 함수 D(V1,V2)를 이용하여 제1 및 제2 시그니처 벡터 사이의 거리가 측정되어, 블록의 유사성의 비교를 제공한다. 시그니처 벡터는, D(B1,B2)<D(B1,B3)이면, D(V1,V2)<D(V1,V3)이 되도록 선택되고, 여기서 B3은 상기 참조 프레임 내의 픽셀의 제3 블록이며, 그에 따라 D(B1,B2)를 계산하는 것은 데이터 처리 시스템에 제1 계산 작업량을 부과하고, D(V1,V2)를 계산하는 것은 데이터 처리 시스템에 제2 계산 작업량을 부과한다. 데이터 처리에서 V1 및 V2를 생성함으로써 부과되는 계산 작업량과 제2 계산 작업량의 합은 평균적으로 제1 계산 작업량보다 적다.
본 발명의 하나의 양상에 있어서, 제1 시그니처 벡터를 생성하는 단계는 제1 시그니처 벡터의 성분을 생성하기 위해 선형 변환을 사용하여 제1 블록을 변환하는 단계를 포함한다. 이러한 성분은 바람직하게는 제1 공간 주파수 한계 미만인 공간 주파수 내의 제1 블록의 일부분에서의 파워(power)이다. 시그니처 벡터의 성분 중 하나는, 제로보다 큰 낮은 공간 주파수 차단을 갖는 제1 공간 주파수 대역에 있어서의 공간 주파수 내의 제1 블록의 일부분에서의 파워를 측정하도록 선택될 수도 있다.
본 발명의 다른 양상에 있어서, 선형 변환은 웨이블릿 변환(wavelet transformation)이다.
본 발명의 다른 양상에 있어서, 참조 프레임 내의 제3 블록에 대한 제3 시그니처 벡터 V3이 생성된다. 제3 시그니처 벡터는 제2 시그니처 벡터를 갱신함으로써 생성된다. 데이터 처리 시스템은 제1 시그니처 벡터와 제3 시그니처 벡터 사이의 거리를 제1 시그니처 벡터와 제2 시그니처 벡터 사이의 거리와 비교하여 제2 및 제3 블록 중 어느 것이 제1 블록에 보다 양호하게 매칭되는지를 결정한다.
본 발명의 또 다른 양상에 있어서, 참조 프레임은 픽셀의 복수의 행 및 열을 포함하고, 제3 블록은 제2 블록과 동일한 참조 프레임의 행 또는 열에 위치되고, 제2 블록과 공통으로 픽셀을 갖는다.
도 1은 현재 프레임 및 참조 프레임 사이의 블록의 매칭을 도시한다.
도 2는 참조 프레임 내의 일련의 블록에 대한 현재 프레임 내의 하나의 블록의 매칭을 위한 장치를 도시한다.
도 3은 2차원 웨이블릿 변환을 이용하는 이미지의 변환을 도시한다.
도 4는 도 3에 대해 논의된 웨이블릿 변환의 종류를 이용하는 이미지 블록의 변환을 도시한다.
도 5는 본 발명의 하나의 실시예에 따른 비디오 압축 엔진을 도시한다.
도 6은 스테레오 시차 매칭을 수행하기 위한 엔진을 도시한다.
본 발명은, 현재 프레임으로 지칭되는 제1 프레임 내의 픽셀의 nxn 블록이 참조 프레임으로 지칭되는 제2 프레임에 있어서의 일부 타깃 영역 내의 동일한 사이즈의 모든 가능한 블록에 대해 매칭되어야 하는 경우에 봉착하는 문제의 면에서 보다 용이하게 이해될 수 있다. 이제 문제의 매칭 프로세스를 도시하는 도 1을 참조하자. 현재 프레임은 20으로 지시되어 있다. 현재 프레임(20) 내의 픽셀의 블록(21)은 참조 프레임(25) 내의 복수의 타깃 블록에 대해 매칭되어야 한다. 전형적인 타깃 블록이 22로 지시되어 있다. 도면을 간략화하기 위해 타깃 블록이 비중첩 상태로 도시되어 있지만, 일반적으로 일련의 타깃 블록이 서로 중첩하여 전형적으로 이미지 내의 하나의 픽셀의 거리만큼 서로 변위된다는 것이 이해되어야 한다. 도 1에 도시된 예가 동일한 수평선을 따라 시프팅된 타깃 블록을 갖지만, 보다 일반적인 경우에, 타깃 블록이 수평 및 수직 방향 모두에서 서로에 대해 시프팅될 수 있다는 것이 이해되어야 한다.
여기에서, 이미지가 NxN 픽셀 이미지이고, 여기서 N >> n인 것으로 가정한다. 전체 참조 프레임이 검색되면, 그러한 검색의 계산 코스트(computational cost)는 대략 N2Cb(n)이다. 여기서, Cb(n)은 2개의 단일 nxn 블록을 비교하는 계산 코스트이다. 전술한 바와 같이, 각 블록에서의 대응하는 픽셀의 차이의 합을 이용하는 것과 같은, 블록 사이의 관계를 판정하는 비교는 n2에 비례하는 코스트를 갖는다. 따라서, 계산 작업량을 감소시키기 위해서, 작은 값의 n, 예컨대 n=16이 흔히 사용된다.
일반적으로, 특정 응용에 따라 달라지는 2개의 프레임 사이에 매칭될 수 있는 어떤 최적 사이즈의 블록이 있다. 블록이 너무 작으면, 현재 프레임 내의 다수의 상이한 블록을 매칭하고, 그러한 매칭은 노이즈의 존재에 의해 부정적인 영향을 받을 수 있다. 다른 극단으로, 큰 블록은, 장면(scene)이 그러한 매칭을 불가능하게 하기에 충분하게 변했을 수 있을 때, 참조 이미지 내의 어떠한 블록과도 매칭될 수 없다. 이러한 2개의 극단 사이에는, 노이즈의 영향을 받지 않고 우연한 매칭의 가능성을 감소시키기에 충분히 크고, 그런데도 프레임의 부분이 참조 프레임 및 현재 프레임에 대응하는 시간 사이에서 객체의 모션으로 인해 변하는 경우에도 현재 프레임 내의 대응하는 블록을 검색하는 양호한 확률을 갖기에 충분히 작은 블록 사이즈가 있다. 전술한 것과 같은 직접 상관 방법을 이용함으로써 부과된 계산 작업량 제한(constraint)은 블록을 너무 작게 할 수 있다.
본 발명은 비교될 각각의 블록을 나타내는 시그니처 벡터(signature vector)를 규정함으로써 현재 프레임 내의 픽셀의 블록을 참조 프레임 내의 일련의 타깃 블록과 비교할 때의 평균 계산 작업량을 감소시킨다. 그리고 비교는 픽셀의 대응하는 블록보다는 시그니처 벡터에 실행된다. 본 발명에 있어서, 시그니처 벡터의 성분의 수는 nxn 블록에 대해 n2보다 훨씬 작다. 따라서, 2개의 시그니처 벡터를 비교하는 코스트는 종래 기술의 스키마에서 2개의 블록을 비교하는 코스트보다 상당히 적다. 그러나 종래 기술보다 개선하기 위해, 본 발명의 시그니처는 2개의 추가적인 조건을 만족해야 한다.
D(V1,V2)(여기서, V1 및 V2가 2개의 벡터임)에 의해 2개의 벡터 사이의 차이를 측정하는 함수를 표시하자. 이러한 함수는 하기의 논의에서 거리 함수로서 지칭될 것이다. 예를 들면,
Figure pct00001
여기서, Nv는 각 벡터에서의 성분의 수이다. 하기의 논의를 간략화하기 위해서, 다른 시사가 없다면 이러한 특정 함수가 가정될 것이다. 그러나 2개의 벡터 사이의 차이를 측정하는 데 사용될 수 있는 다수의 다른 함수가 있다는 것이 이해되어야 한다. 예를 들면, 벡터의 성분 사이의 차이의 제곱을 합산하는 거리 함수는 또한 통상 2개의 벡터 사이의 거리를 측정하는 데 사용된다. 블록 B 곱하기 V(B)를 나타내는 시그니처 벡터를 표시하자.
참조 프레임 내의 2개의 블록 B2 및 B3에 매칭될 현재 프레임 내의 블록 B1을 고려하자. 첫째로, 블록을 나타내는 시그니처 벡터는 그러한 블록에 대한 평균적으로 양호한 프록시(proxy)이어야 한다. 즉, 블록에 직접 적용된 거리 함수가 제한 D(B1,B2)<D(B1,B3)을 만족시키면, 평균적으로 D(V(B1),V(B2))<D(V(B1),V(B3))이다.
둘째로, 참조 프레임의 검색 구역 내의 모든 가능한 블록에 대해 현재 프레임 내의 블록을 비교할 때의 평균 계산 작업량은 블록을 직접 비교하는 작업량보다 적어야 한다. 이제, 참조 프레임 내의 일련의 블록에 대한 현재 프레임 내의 하나의 블록의 매칭을 도시하는 도 2를 참조하자. 처음에, 현재 블록(31)을 나타내는 시그니처 벡터가 32로 지시된 바와 같이 생성된다. 시그니처 벡터(32)는 그러한 블록에 대해 참조 프레임에서 테스트 될 일련의 블록 전체에 대해서 한번의 계산만이 요구된다. 따라서, 그러한 시그니처 벡터를 생성할 때의 작업량은 참조 프레임에서의 모든 타깃 블록 비교에 걸쳐서 분할될 수 있고, 프로세스에 상당한 계산 작업량을 부과하지 않는다. 참조 프레임 내의 각 타깃 블록(33)에 대해, 시그니처 벡터(34)가 생성되어야 한다.
픽셀의 블록의 작은 부분만을 이용하고, 따라서 계산 작업량의 요구된 감소를 제공할 수 있는 다수의 시그니처 벡터 정의가 있다. 예를 들면, 블록의 사전결정된 위치에서의 몇 개의 픽셀의 합에 의해 생성된 각 성분을 갖는 시그니처 벡터는, 계산적으로 저가이고 픽셀의 서브그룹을 바로 선택하는 것보다 노이즈를 덜 받는 시그니처 벡터의 성분을 제공할 수 있다. 시그니처의 모든 성분을 제공하도록 가산되어야 하는 픽셀의 총수가 n2보다 훨씬 적기만 하면, 제2 요건이 충족될 수 있다.
또한, 하기에서 상세하게 설명되는 바와 같이, 블록에 대한 시그니처를 생성하는 데 요구되는 작업량은 35로 지시된 바와 같은 이전 블록에 대해 계산된 시그니처 벡터를 사용함으로써 시그니처 벡터의 일부 선택에 대해 크게 감소될 수 있다. 예를 들면, 어레이 Ix,y에 의해 나타내진 이미지에 (tx,ty)의 기준 어드레스(base address)를 갖는 픽셀의 nxn 블록을 고려하자. 시그니처 벡터 Vi(tx,ty)의 i번째 성분이 단지 블록의 i번째 열(column)에서의 픽셀의 열의 픽셀 값의 합인, 이러한 블록에 대한 n-성분 시그니처 벡터를 정의하자. 즉, i=0 내지 n-1에 대해서,
Figure pct00002
가 된다. (tx+1,ty)에 위치된 블록에 대한 시그니처 벡터는, i=0 내지 n-2에 대해서,
Figure pct00003
Figure pct00004
에 의해 주어진 성분을 갖는다. 따라서, 다음 블록에 대한 시그니처 벡터는, 단지 이전의 시그니처 벡터의 성분이 시프팅된 상태의 이전 시그니처이며, 최종 성분은 블록을 한 픽셀 시프팅함으로써 도입되는 새로운 열 내의 픽셀의 합에 의해 대체된다. 시그니처 벡터의 성분이 원형 버퍼(circular buffer)에 저장되면, 시프트 동작은 그러한 버퍼 내의 포인터(pointer)를 변경함으로써 수행될 수 있다. 따라서, 새로운 시그니처 벡터를 생성하는 작업은 본질적으로 새로운 열 내의 픽셀을 합산하는 데 요구되는 n 가산이다. 2개의 시그니처 벡터를 비교하는 작업은 n에 비례한다. 따라서, 본 발명의 시그니처 벡터 방법을 사용하여 블록을 비교하는 작업량은 차수 n2인, 블록을 직접 비교하는 작업과 대조적으로, 차수 n이다.
2개의 시그니처 벡터가 생성되면, 이들 사이의 거리가 36으로 지시된 바와 같은 프로세서에 의해 계산된다. 거리의 최솟값은 그러한 최솟값이 생성된 참조 프레임 내의 블록의 위치와 함께 프로세서에 저장된다.
본 발명의 다른 양상에 있어서, 시그니처 벡터의 성분은 픽셀의 블록의 선형 변환의 변환 계수로부터 유도된다. 전술한 열 합산 알고리즘은 그러한 선형 변환의 일례이다. 이미지 압축 알고리즘에 사용된 변환도 선형 변환이고 추가적인 이점을 제공한다. 종래의 이미지 압축 알고리즘에서, 우선 2차원 기저 함수의 세트를 사용하여 픽쳐(picture)를 전개식(expansion)에 피팅함으로써 픽쳐가 압축된다. 기저 함수의 특정 세트는 특정 이미지 압축 알고리즘에 따라 달라진다. 전개식에서의 기저 함수의 계수는 이미지 압축에서의 변환된 이미지의 "픽셀"이 된다.
픽셀의블록의 "에너지"를 블록에 걸쳐서의 픽셀 값의 제곱의 합에 의해 정의하자. 이미지 변환은 이미지의 에너지를 변환된 이미지의 픽셀의 서브세트 내로 집중시킨다. 즉, 픽셀당 이러한 서브세트의 총 에너지는, 평균적으로, 원본 이미지 내의 픽셀당 평균 에너지보다 크다(즉, 픽셀 세기의 제곱의 합이 원본 이미지 내의 픽셀의 총수로 나누어짐). 본 발명은 최대의 에너지를 갖는 변환된 픽셀이 또한 시그니처 벡터를 구성하기 위한 양호한 후보라는 관찰에 기초한다. 이러한 변환된 픽셀은 노이즈에 의해 덜 영향을 받고 인간 관찰자에게 관심 있는 정보를 제시한다. 일반적으로, 이미지 압축 변환은 이미지의 상이한 공간 주파수를 나타내는 복수의 변환된 이미지를 제공하는 것으로 보일 수 있다. 본 발명의 하나의 양상에 있어서, 상이한 공간 주파수 대역을 갖는 변환된 이미지로부터의 변환된 "픽셀"의 서브세트는 픽셀의 블록에 대한 시그니처 벡터를 구성하는 데 사용된다.
일반적으로, 이미지 압축에 사용되는 변환은 가역적이다. 즉, 픽쳐는 원 계수가 충분한 정확도로 계산되었다면 계수로 곱해진 기저 함수를 합산함으로써 회복될 수 있다. 상당한 이미지 압축은 재구성된 이미지에 에러를 도입하는 변환 계수를 근사시킴으로써 얻어진다. 본 발명에서는, 블록을 나타내는 시그니처 벡터로부터 이미지를 재구성할 필요가 없으며, 따라서 본 발명은 이미지의 재구성을 제공하지 않는 변환 또는 근사를 이용할 수 있다. 변환은 픽쳐에서의 가장 관심 있는 정보를 변환 계수의 서브세트 내로 집중시키는 데 사용되고, 그리고 이러한 변환 계수에는 인간 관찰자에게 덜 관심 있는 정보와 연관된 것보다 양호한 근사치가 제공된다. 본 발명은 인간 관찰자에게 가장 관심 있는 정보가 있는 픽셀의 블록의 변환된 이미지의 픽셀이 픽셀의 블록을 나타내는 시그니처의 성분을 생성하기 위한 양호한 후보인 픽셀일 수도 있다는 관찰을 활용한다.
이미지 압축 응용에서, 변환된 이미지의 모든 계수가 계산되어야 한다. 그러나 본 발명에서는, 시그니처 벡터의 성분을 계산하는 데 사용되는 계수만이 계산될 필요가 있다. 따라서, 계수를 계산하는 계산 작업량은 계수를 근사하기 전에 전체 이미지를 변환할 필요가 있는 것보다 상당히 적다. 또한, 하기에서 보다 상세하게 설명되는 바와 같이, 새로운 블록의 픽셀로부터 계수를 직접 계산하는 것보다는 이전에 계산된 계수를 갱신함으로써, 관심 있는 계수가 서로에 대해 오프셋 된 픽셀의 연속 블록에 대해 계산될 수 있게 하는 변환이 계산 작업량을 더욱 감소시킬 수 있다.
하나의 종류의 이미지 압축 알고리즘은 웨이블릿(wavelet)으로 지칭되는 기저 함수의 세트를 이용한다. 이미지의 웨이블릿 변환에서, 원본 이미지는 이미지의 상이한 부분에 있어서 다양한 공간 주파수 범위를 나타내는 다수의 변환된 이미지로 변환된다. 이미지의 변환은 전형적으로 복수의 필터를 이용하여 픽셀의 행 및 열을 필터링함으로써 수행된다. 가장 단순한 경우에, 2개의 필터가 사용된다. 첫 번째는 낮은 공간 주파수를 강조하는 저역 필터(low-pass filter)이고, 두 번째는 이미지의 높은 공간 주파수를 강조하는 고역 필터(high pass filter)이다. 이제, 2차원 웨이블릿 변환을 사용한 이미지의 변환을 도시하는 도 3을 참조하자. 변환은 원본 이미지(41)의 픽셀의 수평선을 2개의 필터로 우선 필터링하여 절반의 픽셀 수를 각각 갖는 서브이미지(42, 43)를 생성함으로써 통상 수행된다. 서브이미지(42)는 수평 방향으로 낮은 공간 주파수를 강조하고, 서브이미지(43)는 수평 방향으로 높은 공간 주파수를 나타낸다. 객체의 에지가 높은 공간 주파수를 가지기 때문에, 서브이미지(43)는 수평 방향으로 이동함으로써 교차되는 원본 이미지의 에지의 맵(map)과 유사하다. 이들 서브이미지 각각은 각 서브이미지 내의 픽셀의 열을 2개의 필터를 통해 필터링함으로써 다시 필터링되어 44 내지 47로 지시된 4개의 서브이미지에 이른다. 서브이미지(44)는 낮은 공간 주파수를 강조하고, 나머지 서브이미지는 상이한 배향을 갖는 에지를 강조한다.
다양한 서브이미지 내의 "픽셀"은 실제로 2차원 기저 함수를 이용한 원본 이미지에의 피팅의 계수이다. 특정 기저 함수는 웨이블릿 변환의 상세내용에 따라 달라지며, 픽셀의 행 및 열을 처리하는 데 사용된 필터의 필터 계수를 결정한다. 변환이 사실상 선형이므로, 변환된 이미지 내의 임의의 "픽셀"이 원본 이미지 내의 픽셀의 가중합(weighted sum)으로부터 얻어질 수 있다는 것을 주목하기에 충분하다.
직교 변환에 대해, 임의의 주어진 이미지 계수, 즉 변환된 이미지 내의 "픽셀"이 하기 형태의 식으로부터 계산될 수 있다.
Figure pct00005
여기서, 파라미터 wi,j,m,n은 특정 변환에 따라 달라지는 가중 팩터이다. (m,n)이 전체 이미지에 걸쳐서 변하지만, 변환은 가중 팩터가 관심 있는 각 계수에 대한 소수의 픽셀에 대해서만 제로가 아니도록 선택될 수 있다. 계수당 단지 소수의 픽셀에서의 계산 작업량의 감소는 일부 가중 팩터를 제로로 설정함으로써 더욱 향상될 수 있다. 이러한 접근법은 시그니처를 생성하기 위한 이미지 압축 상황에서 허용되지 않지만, 이러한 근사는 계산 작업량을 더욱 감소시키면서 픽셀의 2개의 블록을 비교하기 위한 적절한 시그니처를 제공할 수 있다.
전술한바와 같이, 매칭 프로세스는 현재 프레임 내의 블록을 참조 프레임 내의 다수의 상이한 블록에 매칭하는 것을 포함한다. 참조 프레임 내의 블록은 보통 하나의 픽셀의 오프셋에 의해 서로로부터 변위된다. 가중 팩터가 1 또는 0인 경우를 고려하자. 각 열 내의 픽셀을 가산함으로써 픽셀의 블록을 변환하는 상기에 주어진 예는 그러한 변환의 일례이다. 유사하게, 하알(Haar) 기저 함수를 사용하여 웨이블릿 변환을 수행하는 데 사용되는 낮은 주파수 필터는 이러한 제한을 만족시킨다. 하알 기저의 높은 주파수 필터는 계수가 0, 1 또는 -1인 특성을 갖는다.
비제로(non-zero) 가중 팩터가 모두 동일한 변환을 사용하여 시그니처 벡터의 성분이 변환된 이미지의 계수로부터 계산되는 경우를 고려하자. 표기를 간략화하기 위해서, 위치 t=(tx,ty)에서 블록에 대해 계산될 때 문제의 계수는 하기의 형태로 기재될 수 있다:
Figure pct00006
여기서, K는 상수이고, wm,n(t)은 1 또는 0이다. 비제로인 값은 t에 의해 결정되는 위치를 갖는 이미지 내의 픽셀의 블록에 제한된다. 블록 t로부터 현재 이미지의 우측으로 하나의 픽셀만큼 변위되는 블록 (t+1)을 고려하자. 이러한 블록에 대응하는 원본 이미지 내의 픽셀의 블록은 동일한 사이즈를 갖지만, 우측으로 하나의 픽셀만큼 변위되어 있다. 원본 이미지 내의 이러한 픽셀의 블록은 픽셀의 2개의 열만큼 블록 t와 상이하다. 즉,
Figure pct00007
여기서, Cn+1은 블록 (t+1)에 포함되는 픽셀의 새로운 열 내의 픽셀의 합이고, C1은 블록 (t+1)에 포함되지 않는 블록 (t)에서의 픽셀의 열 내의 픽셀의 합이다. 열의 합이 블록마다 저장되면, 연속 시그니처는 픽셀의 새로운 열의 합에 의해 이전의 계수를 갱신함으로써 계산될 수 있다. 이러한 동작은 시그니처 벡터의 계수를 결정하는 원본 이미지 내의 픽셀의 블록의 사이즈에서 선형인 계산 복잡성을 갖는다.
이러한 예에서는, 시그니처 벡터의 성분이 원본 이미지의 하알-기반 변환의 낮은 공간 주파수 성분으로부터 계산되었다. 그러나 시그니처 성분은 또한 변환된 이미지 내의 높은 주파수 픽셀에 기초할 수도 있다. 이러한 경우에, 성분은 여전히 식 (6)에 나타낸 형태로 기재될 수 있지만, wm,n(t)는 이제 또한 -1의 값을 가질 수 있다. (t+1)번째 블록에 대한 성분은 여전히 블록 (t)에 대한 성분에 대해 보정 형태로 기재될 수 있지만, 추가적인 열이 이제 A(t)로부터 가산 및 감산되어야 한다.
시그니처 벡터의 성분이 전술한 타입의 변환 계수일 수 있지만, 흔히 그러한 성분을 나타내는 데 요구되는 비트(bit)의 수를 감소시키는 것이 유리하다. 2개의 시그니처 벡터 사이의 거리를 계산하는 데 요구되는 계산 작업량 및 계산 하드웨어는 성분을 나타내는 데 요구되는 비트의 수 및 성분의 형태(정수, 부동(floating) 등)에 따라 달라진다. 정수 연산은 부동소수점 연산보다 저가의 하드웨어로 실행될 수 있으며, 계산이 더 짧은 시간에 완료될 수 있다. 따라서, 정수 시그니처 벡터 성분이 바람직하다. 또한, 성분을 나타내는 데에는 보다 작은 정수를 필요로 하는 성분이 바람직하다. 변환 계산이 멀티 코어를 지원하는 컴퓨팅 플랫폼에서 병렬적으로 실행될 수 있다는 것에 주목해야 한다. 따라서, 계산 작업량을 감소시키는 것은 또한 실시간 응용에 중요할 수 있는 전체 매칭 속도를 향상시킬 수도 있다.
±1로 표시될 수 있는 값을 갖는 비제로 가중 함수를 이용하는 변환은, 대부분의 이미지 표현에 사용된 픽셀 값이 정수이기 때문에 그러한 변환이 정수 연산으로 실행될 수 있으므로, 바람직하다는 것에 주목해야 한다. 모든 가중치가 ±C인 임의의 변환(여기서, C는 상수임)이 C에 의한 곱셈으로 이어지는 ±1의 가중치를 사용하여 계산될 수 있다는 것에 주의해야 한다. 또한, 하기에 보다 상세하게 설명되는 바와 같이, C에 의한 곱셈은 계수의 양자화(quantization) 동안에 변환 계수를 근사하는 데 사용되는 계산에 포함될 수 있다.
전술한 변환의 사용의 경우에도, 변환 계수를 나타내는 데 요구되는 비트의 수는 시그니처 벡터를 사용하여 블록을 매칭하는 데 요구되는 수보다 훨씬 클 수 있다. 12-비트 픽셀 값을 갖는 이미지를 고려하자. 시그니처 벡터의 성분으로서 사용될 변환값에 이르도록 변환이 16 픽셀을 함께 가산하면, 성분은 표현하는 데 16 비트를 필요로 한다. ±1인 가중치를 사용하는 변환에서는, 변환 계수는 음수뿐만 아니라 양수일 수 있다. 8-비트 정수에 기초한 연산은 더 적은 계산 하드웨어를 요구한다. 비트의 수는 시그니처 벡터의 성분에 이르도록 변환 계수를 양자화함으로써 감소될 수 있다. 양자화는 변환에 의해 얻어진 값을 어떤 사전결정된 범위 내의 정수로 매핑(mapping)한다. 상기 예에서, 변환 계수의 16-비트 표현은 8-비트 정수로 매핑될 수 있다. 변환 계수가 16-비트의 부호 정수로 표현되면, 양자화는 부호 비트를 유지하면서 비트를 정수로부터 시프팅시킴으로써 수행될 수 있다. 따라서, 변환 계수의 양자화를 수반하는 계산 작업은 변환 계수를 생성하는 작업량에 비하여 적다.
시그니처 벡터 성분은 또한 변환 계수를 조합함으로써 구성될 수도 있다. 예를 들면, 시그니처 계수는 전술한 타입의 2개 이상의 변환 계수의 가중합으로 구성될 수 있다. 변환 계수의 임의의 선형 함수는 전술한 식 (5)를 만족하는 새로운 변환 계수를 얻도록 전개될 수 있다는 것에 주목해야 한다.
양자화 후의 시그니처 벡터 성분을 나타내는 데 요구되는 비트의 수는 성분의 엔트로피 부호화(entropy coding)를 사용함으로써 더욱 감소될 수 있다. 엔트로피 부호화는 양자화된 값이 상이한 수의 비트를 갖는 코드에 의해 대체되는 무손실 압축 스키마이다. 가장 많이 사용되는 양자화된 값은 적게 나타나는 양자화된 값보다 적은 비트를 갖는 할당된 코드이다.
양자화 프로세스는 또한 시그니처 벡터 레벨에서 적용될 수도 있다. 즉, 변환 계수로부터 얻어진 시그니처 벡터의 범위는 보다 적은 가능한 벡터를 갖는 사전결정된 세트의 벡터에 매핑될 수 있다. 다음에, 양자화된 벡터는 블록 매칭 알고리즘에 사용된다. 각각의 시그니처 벡터는 Nv 차원 공간의 점을 나타내는 것으로 보일 수 있다. 벡터 양자화에서는, 격자점의 세트가 공간에 규정된다. 다음에, 시그니처 벡터는 그러한 벡터에 가장 근접한 격자점에 의해 대체된다. 양자화된 벡터의 세트는 코드의 세트에 매핑되어 양자화된 벡터를 특정화하는 데 요구되는 비트를 더욱 감소시킬 수 있다. 다음에, 양자화된 벡터는 별도의 메모리에 저장되고, 코드를 통해 검색될 수 있다. 격자점의 세트를 생성하고 시그니처 벡터에 가장 근접하게 근사하는 격자점을 결정할 때의 계산 작업량은 일반적인 경우에 격자점의 최적 세트가, 가능한 시그니처 벡터의 분포에 의존하므로 과도할 수 있다.
벡터 양자화를 수행할 때의 계산 작업량은 피라미드 벡터 양자화(Pyramid Vector Quantization)에 의해 감소될 수 있다. 이러한 타입의 양자화가 본 기술분야에 알려져 있으므로, 여기서는 상세하게 논의되지 않는다. 보다 상세한 설명을 위해, T. R. Fisher의 "피라미드 벡터 양자화기(A Pyramid Vector Quantizer)"(IEEE Transactions on Information Theory, vol. IT-32, NO. 4, July 1986)를 참조하라. 본 설명을 위해, 본 방법은 이미지 변환에서 생성된 계수에 잘 매칭되는 사전결정된 세트의 격자점을 제공한다는 것을 주목하기에 충분하다. 본 방법은 정규화 벡터에서 동작하고 격자점의 사전결정된 세트 중 하나에 각 벡터를 할당하며, 각 격자점은 특유의 식별자(identifier)를 갖는다. 정규화 벡터를 고려하면, 본 발명은 식별자를 제공하고, 반대로 식별자를 고려하면, 본 발명은 정규화 벡터를 가져온다. 벡터 양자화를 수행하는 추가적인 작업량이 각 블록을 나타내는 시그니처 벡터 사이의 거리를 바로 측정하는 것보다 상당한 개선을 제공하는지는 특정 응용에 따라 달라진다.
식별자가 피라미드 벡터 양자화 알고리즘에 의해 생성된 코드와 유사한 것에 주목해야 한다. 이들 식별자의 이점은 부호화된 벡터를 용이하게 해독하는 데 있으며, 이는 모든 식별자 코드가 동일한 길이를 갖는 것에서 기인한다. 엔트로피 부호화에 의해 제공된 코드는 다양한 길이를 가지며, 따라서 해독 프로세스를 복잡하게 한다.
피라미드 벡터 양자화 스키마는 정규화 벡터를 생성하고, 따라서 정규화가 최종 벡터의 개별 성분으로서 사용될 수 있거나, 단지 정규화 벡터가 비교될 수 있다. 정규화 벡터는 상이한 이미지가 상이한 조도 레벨(illumination level)을 갖는 매칭 문제에 유용할 수 있다.
전술한 바와 같이, 시그니처 성분은 매칭될 이미지 블록의 선형 변환으로부터 시작해서 생성될 수 있다. 이제, 도 3에 대해 상기에서 논의된 웨이블릿 변환의 종류를 이용하는 이미지 블록의 변환을 도시하는 도 4를 참조하자. 도 4에 도시된 경우에 있어서, 낮은 주파수 변환 계수는 다시 동일한 쌍의 필터를 사용하여 변환되어 최종 변환된 이미지가 71 내지 77로 지시된 7개의 "서브이미지"를 갖는다. 75 내지 77로 지시된서브이미지는 웨이블릿 변환의 제1 적용에 의해 생성된 높은 공간 주파수 서브이미지이다. 71 내지 74로 지시된 서브이미지는 원래의 낮은 공간 주파수 서브이미지를 재차 처리함으로써 생성된 서브이미지이다. 따라서, 서브이미지(71)는 블록에 대한 낮은 공간 주파수 계수이고, 나머지 서브이미지는 인간 관찰자에게 가치가 낮은 정보를 가지는 다양한 높은 공간 주파수 계수이다. 낮은 공간 주파수 서브이미지로부터의 픽셀 중 몇 개의"픽셀"이 81로 지시된 바와 같은 시그니처 벡터(80)의 성분이 되도록 선택된다. 유사하게, 높은 공간 주파수 서브이미지(72, 73)로부터의 하나 이상의 계수는 또한 82 및 83으로 지시된 바와 같은 시그니처 벡터(80)의 성분으로 선택된다. 픽셀은 시그니처 벡터의 성분의 수를 줄이도록 조합될 수 있다. 유사하게, 높은 공간 주파수 성분(75, 76)으로부터의 계수는 또한, 84 및 85로 지시된 바와 같은 시그니처 벡터(80)의 성분을 형성하도록 결합된다. 성분은 문제의 픽셀의 임의의 함수로부터 계산될 수 있다. 그러나 계산 작업량을 줄이기 위해서는 선형 조합이 바람직하다. 시그니처 벡터의 성분은 전술한 바와 같이 개별 성분을 양자화하거나 벡터를 양자화함으로써 더욱 감소될 수 있다.
예를 들면, 현재 이미지 내의 픽셀의 8x8 블록이 참조 이미지 내의 일련의 8x8 블록에 대해 매칭되어야 하는 경우를 고려하자. 각 이미지의 2개 레벨의 하알 분해가 사용되면, 71로 지시된 낮은 공간 주파수 영역은 4개의 계수를 갖는다. 또한, 72 및 73으로 지시된 2개의 높은 공간 주파수 영역도 4개의 계수를 갖는다. 하나의 실시예에서, 서브이미지(71)로부터의 4개의 계수는 시그니처 벡터의 성분으로서 선택된다. 또한, 2개의 성분은 이러한 영역의 2개의 2x2 구역 내의 성분을서로 가산함으로써 높은 공간 주파수 서브이미지(73)로부터 생성된다. 유사하게, 2개의 추가적인 성분은 그러한 영역의 2개의 2x2 구역 내의 성분을 서로 가산함으로써 높은 공간 주파수 서브이미지(72)로부터 생성된다. 그 결과로 생성된 시그니처 벡터는 8개의 성분을 갖는다. 이 성분은 이들 8개의 성분 각각을 양자화함으로써 더욱 감소될 수 있다. 성분이 정수 레지스터(integer register)에 유지되면, 양자화는 레지스터에서의 간단한 시프트 동작에 의해 수행될 수 있다. 보다 복잡한 양자화 스키마가 또한 이용될 수도 있다.
시그니처 벡터의 생성이 이미지 압축 시스템에 사용되는 타입의 2개 레벨의 하알 변환의 면에서 설명되었지만, 전체 8x8 시작 블록이 하알 변환을 받을 필요는 없다. 하알 변환은 선형 변환이고, 따라서 압축된 이미지의 계수가 모두 계산될 필요는 없다. 선택된 계수는 상기에서 식 (5)에 주어진 형태의 원본 이미지의 변환의 면에서 기재될 수 있다. 하알 변환의 경우에, 가중 계수는 모든 계수가 1 또는 0의 절댓값을 갖도록 선택될 수 있다. 또한, 높은 공간 주파수 서브이미지(72, 73)로부터 조합된 계수는, 덧셈이 또한 선형 연산이므로, 식 (5)에 나타낸 형태의 관계를 사용하여 직접 계산될 수 있다는 것에 주목해야 한다. 시그니처 벡터가 알려진 이전 블록으로부터 하나의 픽셀만큼 변위되는 블록에 대한 시그니처 벡터는 이전에 계산된 시그니처 벡터를 갱신함으로써 계산될 수 있으며, 이것은 참조 이미지 내의 연속 블록에 대한 시그니처 벡터를 생성할 때의 평균 계산 작업량을 더욱 감소시킨다는 것에 또한 주목해야 한다.
이미지 블록이 시그니처로부터 재구성되는 것을 허용하는 정확도를 시그니처가 가질 필요가 없기 때문에, 시그니처 벡터의 각 구성요소를 나타내는 데 사용되는 비트의 수는 시그니처 벡터 내의 비트의 총수를 최소화하도록 선택될 수 있다. 시그니처 벡터가 전술한 제한을 만족시키기만 하면, 설계자는 성분당 비트의 수를 자유롭게 설정하여 다른 설계 기준을 최적화한다. 이와 관련하여, 2개의 시그니처 벡터 사이의 거리를 측정하는 것에 수반된 계산은 특수 목적 하드웨어에서 병렬적으로 작동될 수 있다는 것에 주목해야 한다. 시그니처 벡터 내의 한 쌍의 대응하는 성분 사이의 차이는 임의의 다른 쌍 사이의 차이에 의존하지 않으며, 따라서 이러한 계산은 병렬적으로 행해질 수 있다. 특수 목적 하드웨어의 일 형태는 2개의 시그니처 벡터 사이의 차이를 계산하는 엔진을 구성하기 위한 프로그램 가능한 게이트 어레이(gate array)를 포함한다. 한 쌍의 성분을 비교하는 데 요구되는 게이트의 수는 성분을 나타내는 데 사용되는 비트의 수에 의해 결정된다. 따라서, 각 성분을 나타내는 데 요구되는 비트의 수를 최소화함으로써, 보다 적은 게이트가 특수 목적 하드웨어에 이용될 수 있으며, 그에 따라 특수 목적 하드웨어의 코스트를 저감시킨다.
시그니처 블록 거리 계산이 일반 목적 컴퓨터에서 수행되면, 그러한 컴퓨터에 대해 벡터 계산에 최적화된 시그니처 벡터를 선택하는 것이 유리하다. 예를 들면, 각 성분이 8 비트인 8개 또는 16개의 성분을 갖는 2개의 벡터 사이의 거리를 계산하는 단일 하드웨어 명령은 다수의 일반 목적 컴퓨터에서 이용 가능하다. 이러한 경우에, 성분을 8 비트 미만으로 감소시키는 것은 상당한 이점을 제공하지는 않는다.
전술한 바와 같이, 참조 프레임 내의 다수의 블록에 대해 현재 프레임 내의 블록을 매칭하는 문제는 다수의 중요한 응용에서 발생한다. 모션 추정 인터-예측(inter-predication)의 경우에, 현재 프레임 내의 블록에 대해 가장 잘 매칭되는 참조 프레임 내의 블록은 2개의 프레임 내의 동일한 객체로부터일 필요는 없다. 복수의 객체가 존재하는 동일한 장면을 갖는 일련의 2개의 프레임을 고려하면, 블록 매칭의 목적은 수신기에 송신될 수 있는 현재 블록에 대한 근사치를 제공하는 것이다. 그러한 근사치는 현재 블록으로부터 감산되어, 원본 블록이 압축되는 경우에 요구되는 것보다 적은 비트로 압축될 수 있는 나머지 블록을 생성하고, 재구성된 이미지의 소망 레벨의 정확도를 수신기에 제공한다. 최적의 블록 사이즈는 이미지를 재구성하도록 전송되어야 하는 비트를 최소화하는 사이즈이다.
인터-예측 스키마 내의 근사 블록이 참조 프레임 이미지 내의 현재 블록에 대응하는 블록일 필요는 없다. 동일한 장면의 2개의 프레임을 고려하고, 현재 프레임 내의 현재 블록의 위치를 (x1,y1)로 나타내자. 프레임 사이의 장면의 변화 또는 노이즈가 없을 때, 참조 프레임 내의 이러한 블록에 대한 최상의 매칭은 (x1,y1)에서의 블록일 것으로 예상된다. 그러나 장면의 변화 또는 노이즈 때문에, 현재 블록에 대한 최상의 매칭은 (x2,y2)에 있을 수 있다. 압축 스키마가 현재 블록에 대한 근사로서 최상의 블록 매칭만을 사용하기 때문에, 블록이 2개의 프레임에 있어서의 대응하는 블록이 아니라는 것은 문제가 되지 않는다.
그와 대조적으로, 스테레오 시차 매칭(stereo disparity matching)에서, 서로 변위되고 동일한 장면을 바라보는 카메라로부터 동시에 촬영된 2개의 프레임은 장면의 3차원 재구성을 제공하도록 처리된다. 이러한 경우에, 매칭 알고리즘은 참조 프레임 내의 복수의 블록에 대해 현재 프레임 내의 픽셀의 블록을 매칭함으로써 현재 프레임 상의 객체를 참조 프레임 내의 객체와 동일시하고자 한다. 블록은 매칭하는 블록이 동일한 객체의 동일 부분을 나타내는 것을 보장하기에 충분한 크기여야 한다. 본 발명은 특히 그러한 매칭에 매우 적합하다. 다시 도 1을 참조하자. 스테레오 시차 매칭에서, 21로 지시된 픽셀의 블록은 동일한 수평 주사선(23) 상에 위치되는 참조 프레임(25) 내의 시퀀스에 대해 매칭된다. 즉, 카메라가 장면에 대해 동일한 높이에 있는 것으로 가정한다. 따라서, 매칭될 일련의 블록은 수평 방향으로 하나의 픽셀만큼 서로 상이하다.
각각의 8x8 블록에 대한 시그니처 벡터가 도 4에 도시된 바와 같은 2개 레벨의 하알 변환으로부터 유도되는 경우를 고려하자. 이러한 경우에, 변환된 이미지에서의 4개의 낮은 공간 주파수 계수가 71에 있다. 또한, 4개의 높은 공간 주파수 계수의 3개의 블록이 72 내지 74에 있다. 이러한 예에서, 블록에 대한 시그니처 벡터는 시그니처 벡터의 제1의 4개 성분으로서의 4개의 낮은 공간 주파수 성분, 높은 공간 주파수 서브이미지(72)로부터의 4개의 높은 공간 주파수 성분, 및 영역(74)으로부터의 4개의 높은 공간 주파수 성분을 사용함으로써 구성되어 12 성분의 시그니처 벡터를 제공한다. 시그니처 벡터의 각 성분은 원본 이미지 내의 4개의 픽셀이 가산 또는 감산 되는 것을 요구한다. 가산 및 감산이 동일한 계산 작업량에 부과되므로, 이러한 동작은 본 예에서 "가산(add)"으로 지칭된다. 따라서, 시그니처 벡터를 생성하는 코스트는 식 (5)에서의 가중치가 모두 동일한 절댓값을 갖는 경우에 약 48 가산을 갖는다. 일반적인 경우에, 가중치는 동일한 절댓값을 갖지 않으며, 따라서 48 가산 및 48 곱셈이 요구된다.
주어진 수평선상에서의 참조 프레임 내의 각 블록에 대한 시그니처 벡터는 단지 한번의 계산만이 요구된다. 유사하게, 현재 프레임 내의 각 블록에 대한 시그니처 벡터는 단지 한 번의 계산만이 요구된다. 각 프레임 내에 M 블록이 있다고 가정하자. 2M 시그니처 벡터를 계산하는 계산 작업량은 2M*48 가산이다. 참조 프레임 내의 각 블록에 대해 현재 프레임 내의 각 블록을 비교하는 작업은 M2*C이며, 여기서 C는 2개의 시그니처를 비교하는 코스트이다. 절대 차이의 합이 사용되면, C는 약 48 가산을 갖는다(차이를 형성하는 하나의 가산 및 성분의 절댓값을 합산하는 하나의 가산). 따라서, 본 발명의 시그니처 벡터를 사용하는 코스트는 대략 48M2 + 48M 가산이다. 문제의 블록이 종래 기술의 방법을 사용하여 매칭되면, 2개의 8x8 블록을 비교하는 코스트는 128 가산이다. 모든 블록을 매칭하는 코스트는 128M2이다. 8x8 블록에 대해서도, 본 발명의 시그니처 벡터 접근법은 상당히 덜한 계산 강도를 갖는다. 블록의 사이즈가 증가함에 따라, 차이는 훨씬 더 커진다.
스테레오 시차 매칭을 위한 최적의 블록 사이즈는 장면 내의 상이한 객체로부터의 2개의 블록이 서로 우연히 매칭하지 않는 것을 보장하기에 충분해야 한다. 전술한 바와 같이, 직접 블록 매칭 알고리즘을 사용하여 블록을 매칭하는 계산 작업량은 블록 사이즈의 제곱으로 증가한다. 따라서, 직접 방법은 흔히 차선의 블록 사이즈에 제한된다. 이와 대조적으로, 본 발명에서는, 시그니처 벡터의 사이즈는 블록의 사이즈에 따라 반드시 이러한 속도로 증가하지는 않으며, 따라서 본 발명은 훨씬더 큰 블록으로 작업할 수 있다.
전술한 바와 같이, 본 발명은 또한 비디오 압축에 이용되는 모션 추정 절차에 이용될 수도 있다. 이러한 절차는 또한 인터-예측 또는 인트라-예측(intra-prediction)으로 알려져 있다. 비디오 압축에 있어서, 전송될 다음 이미지는 복수의 블록으로 나누어지고, 이러한 복수의 블록은 별도로 압축된 후에 전송된다. 각 블록에 대해, 예측 블록이 식별된다. 블록은 이전에 전송된 프레임, 또는 수신기에 이미 송신된 현재 프레임의 부분에 기초할 수 있다. 전자의 경우가 인터-예측으로 지칭되고, 후자의 경우가 인트라-예측으로 지칭된다. 선택된 블록은 전송을 위해 현재 부호화되고 있는 블록을 가장 잘 근사하는 블록이다. 예측 블록은 인트라-예측의 타입 또는 이전 프레임 내의 블록의 위치를 식별하는 적은 비트로 수신기에 전송될 수 있다. 다음에, 예측 블록은 현재 블록으로부터 감산 되어 잔여 블록(residual block)을 생성하고, 그 후에 잔여 블록은 일부 형태의 이미지 변환 및 양자화 절차를 사용하여 압축된다. 예측 블록이 현재 블록에 대해 양호하게 매칭되면, 잔여 블록에서의 픽셀 값의 범위는 현재 블록에서의 픽셀 값의 범위보다 훨씬 작으며, 따라서 어떤 사전결정된 정확도로 수신기에서 현재 블록을 재구성하도록 전송되어야 하는 비트의 수가 상당히 감소된다.
이제, 본 발명의 하나의 실시예에 따른 비디오 압축 엔진을 도시하는 도 5를 참조하자. 전송을 위해 부호화될 픽셀의 블록은 엔진에 입력 포트를 제공하는 라인(60) 상에 수신된다. 처음에, 인트라-블록 생성기는 이미 송신된 현재 프레임의 블록에 기초한 잠재적인 예측 블록을 생성하고, 이들 블록을 예측 블록 라이브러리(51)에 저장한다. 또한, 예측 블록 라이브러리(51)는 부호화 동작에 사용될 인터-프레임 예측 블록을 생성할 때 사용하기 위한 이전에 송신된 프레임을 포함한다. 시그니처 벡터는 라인(60) 상의 현재 블록을 위한 시그니처 생성기(52)에 의해 생성된다. 컨트롤러(50)는 시그니처 비교기(54)를 사용하여 예측 블록 라이브러리(51) 내의 각각의 블록에 대한 시그니처를 현재 블록에 대한 시그니처와 비교하고, 최상의 시그니처 매칭에 대응하는 블록을 선택하고 그 블록을 버퍼(55)에 배치한다. 인트라-예측이 사용되면, 인트라-예측 블록은 비교의 시작 전에 인트라-블록 생성기(53)에 의해 예측 블록 라이브러리(51)에 추가된다. 다음에, 잔여 블록은 버퍼(55) 내의 블록을 현재 블록으로부터 감산함으로써 생성된다. 다음에, 잔여 블록은 전술한 것과 유사한 방식으로 변환/양자화기(56)에 의해 변환 및 양자화된다. 전형적으로, 변환/양자화기(56)의 출력은 부호화된 이미지를 송신 또는 저장하는 데 요구되는 대역폭을 더욱 감소시키기 위해 수신기에 전송되기 전에 57로 지시된 바와 같은 엔트로피 부호화와 같은 무손실 부호화 스키마를 사용하여 부호화된다. 변환/양자화기(56) 및 부호화기(57)는 시그니처 벡터를 비교하기보다는 블록을 비교하는 것에 의존하는 이미지 압축기에 사용되는 종래의 구성요소이다.
다음 프레임에 대한 예측 프레임을 제공하기 위해, 수신기에 송신된 현재 블록이 재생성된다. 변환/양자화기(56)의 출력은 역변환/양자화기(58)에 의해 변환되고, 현재 블록이 수신기에서 재생성될 때 현재 블록의 복사를 제공하도록 예측 블록에 추가된다. 다음에, 이러한 블록은 향후 사용을 위해 예측 블록 라이브러리(51)에 저장된다. 선택적으로, 이러한 블록에 대한 시그니처는 또한 시그니처 생성기(59)에 의해 생성되어 예측 블록 라이브러리(51)에 저장될 수도 있다.
시그니처 벡터 사이의 비교를 행하기 위해서, 예측 블록 라이브러리(51)는 모든 가능한 블록에 대한 시그니처 벡터를 포함하여야 하거나, 또는 하드웨어는 요청에 따라 그러한 시그니처 벡터를 생성해야 한다. 가능한 인터-예측 블록의 수는 참조 프레임 내의 픽셀의 수와 대략 동일하다. 전술한 바와 같이, 각각의 현재 블록의 시그니처 벡터는 그러한 블록이 향후 사용을 위해 예측 블록 라이브러리(51)에 부호화되어 저장될 때 시그니처 생성기(59)에 의해 생성될 수 있다. 그러나 인터-예측 블록이 임의의 픽셀 상에서 시작할 수 있으므로, 전송을 위해 부호화되는 블록보다 더욱 많은 잠재적인 인터-예측 블록이 있다.
본 발명의 하나의 양상에 있어서, 예측 블록 라이브러리(51)에 저장되지 않은 인터-예측 블록에 대한 시그니처 벡터는 처음에 그 블록에 대한 시그니처 벡터가 요청될 때 생성된다. 다음에, 시그니처 벡터는 향후 사용을 위해 저장된다. 각각의 인터-예측 블록 시그니처 벡터가 현재 프레임의 부호화 동안에 다수 회 사용되므로, 이들 벡터를 생성하기 위한 평균 계산 작업량은 비교적 적다. 그러나 참조 프레임에 대한 시그니처 벡터의 전체 수를 저장하는 데 요구되는 메모리는 참조 프레임을 저장하는 데 요구되는 메모리의 대략 Nv 배이고, 여기서 Nv는 각 시그니처 벡터의 성분의 수이며, 비트/성분의 수는 참조 프레임 내의 각 픽셀에 사용되는 비트의 수와 실질적으로 동일한 것으로 가정한다.
추가적인 메모리를 피하기 위해서, 각각의 잠재적인 인터-예측 블록에 대한 시그니처 벡터는, 그러한 블록이 요청될 때, 참조 프레임의 픽셀로부터 시그니처 벡터를 계산하는 작업보다 적은 작업이 계산하는 데 필요하면서도 높은 메모리 요건을 부과하지 않는 알고리즘을 사용함으로써 생성될 수 있다. 하기의 논의를 간략화하기 위해서, 전송 동안에 부호화되는 블록과 일치하는 이미지 내의 픽셀의 블록은 "부호화된" 블록으로 지칭된다. 전술한 바와 같이, 본 발명의 하나의 양상에 있어서, 참조 프레임 내의 각각의 부호화된 블록에 대한 시그니처 벡터는 그러한 블록이 이전 프레임에서 전송을 위해 부호화될 때 시그니처 생성기(59)에 의해 생성된다. 부호화된 블록의 수는 잠재적인 인터-예측 블록의 수의 적은 일부분이다. 예를 들면, 8x8 블록이 부호화되면, 잠재적인 인터-예측 블록의 수는 부호화된 블록의 수의 64배이다. 따라서, 부호화된 블록에 대한 시그니처 벡터를 저장하는 데 요구되는 메모리는 참조 프레임을 저장하는 데 요구되는 것보다 훨씬 적다.
본 발명의 하나의 양상에 있어서, 시그니처 벡터의 성분은, 부호화된 블록의 시작 위치 사이에서 시작하는 블록에 대한 시그니처 벡터가 그러한 블록에 가장 근접한 부호화된 블록의 시그니처 벡터를 보간(interpolating) 함으로써 근사될 수 있도록 선택된다. 이러한 경우에, 계산 작업량은 상당히 감소하고, 저장 요건도 또한 상당히 감소한다. 시그니처 벡터의 성분이 웨이블릿 변환과 같은 이미지 압축 변환의 낮은 공간 주파수 성분이면, 이 성분은 인접한 픽셀의 블록의 양의 가중합이므로 웨이블릿 변환의 정확한 선택을 위해 이러한 특성을 가지며, 부호화된 블록의 시작 픽셀과 상이한 픽셀에서 시작하는 블록은 부호화된 블록과 공통으로 상당한 수의 픽셀을 여전히 가지며, 따라서 변환 계수는 블록의 시작 위치의 함수로서 천천히 변한다.
도 5에 도시된 블록도는 특수 목적 하드웨어 또는 일반 목적 데이터 처리 시스템 또는 이들 양쪽의 조합에 의해 실행될 수 있다는 것에 주목해야 한다. 특정 블록이 상기의 논의를 간략화하기 위해 도시되어 있다. 그러나 다양한 기능이 일반 목적 데이터 처리 시스템 또는 컨트롤러에서 작동하는 소프트웨어, 또는 상이한 블록에 포함될 수 있다.
이제, 스테레오 시차 매칭을 수행하기 위한 엔진을 도시하는 도 6을 참조하자. 본 논의를 위해, 현재 프레임은 좌측 이미지로서 지칭되고, 참조 프레임은 우측 이미지로서 지칭되지만, 이러한 이미지들은 교환될 수 있다. 전술한 바와 같이, 스테레오 시차 매칭에서, 좌측 이미지 내의 주어진 수평선상에 중심설정된 각 블록은 우측 이미지 내의 동일한 수평선상의 각 블록에 대해 매칭된다. 따라서, 이미지를 통과하는 임의의 주어진 수평선에 대해, 픽셀의 블록이 규정되고 대응하는 라인 버퍼 내로 들어간다. 좌측 및 우측 이미지에 대한 라인 버퍼는 각각 61 및 62로 지시되어 있다. 시그니처는 시그니처 생성기에 의해 각 블록에 대해 생성되고, 이 시그니처 생성기는 63 및 64로 지시되어 있다. 시그니처를 저장하는 데 요구되는 공간을 감소시키기 위해서, 시그니처는 대응하는 시그니처 메모리에 저장되기 전에 부호화될 수 있다. 좌측 이미지에 대한 시그니처 메모리는 65로 지시되고, 우측 이미지에 대한 시그니처 메모리는 66으로 지시되어 있다. 예를 들면, 벡터 양자화된 신호의 경우에, 시그니처 벡터 자체보다는 시그니처 벡터에 대한 레이블(label)이 시그니처 메모리에 저장될 수 있다. 컨트롤러(91)는 좌측 시그니처 메모리(65)에 저장된 동일한 수평선상의 블록에 대응하는 모든 시그니처와 우측 시그니처 메모리(66)로부터의 시그니처를 매칭한다. 시그니처가 부호화되면, 시그니처 해독기는 시그니처 메모리에 저장된 해독된 형태로부터 실제 신호 벡터를 생성한다. 시그니처 해독기는 67 및 68로 지시되어 있다. 그리고 시그니처 벡터 사이의 거리는 거리 측정 모듈(69)을 사용하여 계산된다. 컨트롤러(91)는 시그니처 벡터가 서로 가장 근접하는 2개의 이미지로부터 블록의 트랙을 유지한다. 게다가, 컨트롤러(91)는 또한 시그니처를 생성하고 이들 시그니처를 저장 및 검색하는 다양한 모듈을 작동시킨다. 도면을 간략화하기 위해서, 컨트롤러(91)와 다양한 모듈 사이의 연결은 생략되었다.
본 발명은 다양한 이미지 인식 시스템의 계산 작업량을 개선하는 데 이용될 수 있다. 하나의 종류의 시스템에 있어서, 객체는 이 객체 내의 "불변(invariant)"점의 세트에 의해 특징지어진다. 불변점은, 실제로, 표준 배향 및 스케일로 변환된 후에 블록의 중심 근방의 픽셀을 강조하도록 가중치가 부여된 픽셀의 블록이다. 라이브러리 내의 각 객체에 대해, 그러한 객체와 연관된 불변점이 저장된다. 알려지지 않은 장면을 가정하면, 그러한 장면 내의 픽셀의 블록은, 이 블록을 유사하게 회전, 축척 및 가중치 부여한 후에, 라이브러리 내의 불변점과 비교된다. 다음에, 매칭되는 블록의 리스트는 라이브러리 내의 임의의 객체가 장면 내에 존재하는지를 결정하기 위해 라이브러리 내의 각 객체와 연관된 블록의 리스트와 비교된다. 본 발명의 면에서, 참조 "프레임"은 라이브러리 내의 블록의 컬렉션(collection)이다. 현재 프레임 내의 블록이 유사하게 회전, 축척 및 가중치 부여된 후에, 현재 프레임 내의 각 블록은 라이브러리 내의 모든 블록과 비교된다.
본 발명은 비교를 행할 때의 작업량을 감소시킨다. 우선, 시그니처는 참조 블록에 대한 에너지 집중 변환을 사용함으로써 참조 프레임 내의 각 블록과 연관될 수 있다. 이러한 계산은 단지 한 번만 행해질 필요가 있으며, 시그니처는 라이브러리의 일부분이 된다. 다음에, 시그니처는 유사한 회전, 측정 및 가중치 부여 동작 후에 알려지지 않은 이미지 내의 비교될 각 블록에 대해 생성된다. 이제, 비교는 블록을 직접 매칭하기보다는 시그니처 벡터를 사용함으로써 실행될 수 있다. 이러한 경우에, 비교될 픽셀 블록의 사이즈는 불변점 라이브러리에 의해 설정되고, 전형적으로 인터-예측에 사용되는 블록의 사이즈보다 훨씬 더 크다. 따라서, 본 발명은 특히 그러한 비교에 매우 적합하다.
전술한 바와 같이, 본 발명은 다양한 하드웨어 실시예에서 실행될 수 있다. 일반적으로, 본 발명은, 현재 프레임 내의 블록과 가장 근접하게 매칭하는 참조 프레임 내의 블록을 결정하기 위해 현재 프레임 내의 각 블록이 참조 프레임 내의 복수의 블록과 비교되어야 하는 응용에 매우 적합하다. 현재 프레임 및 참조 프레임 내의 블록에 사용되는 명칭을 차별화하는 것이 유용하다. 일반적으로, 현재 프레임 내의 픽셀의 제1 블록 C1은 참조 프레임 내의 픽셀의 제2 블록 R1과 비교된다. 장치는 시그니처 프로세서 및 거리 측정 프로세서를 포함한다. 시그니처 프로세서는 어느 프레임 내의 픽셀의 블록으로부터 시그니처 벡터를 생성한다. 예를 들면, 시그니처 프로세서는 제1 블록에 대한 제1 시그니처 벡터 VC1 및 제2 블록에 대한 제2 시그니처 벡터 VR1을 생성한다. 거리 측정 프로세서는 동일한 거리를 갖는 임의의 2개의 벡터 상에 동작한다. 거리 측정 프로세서는 거리 함수 D(V1,V2)를 사용하여 2개의 벡터 V1과 V2 사이의 거리를 측정한다. 거리 함수 및 시그니처 벡터는,
D(C1,R1)<D(C1,R2)이면, D(VC1,VR1)<D(VC1,VR2)
가 되도록 선택되며, 여기서 R2는 상기 참조 프레임 내의 픽셀의 제3 블록이다. 또한, D(C1,R1)을 계산하는 것은 상기 장치에 제1 계산 작업량을 부과하고, D(VC1,VR1)을 계산하는 것은 제2 계산 작업량을 부과하고, 시그니처 벡터를 생성하는 것은 또한 제3 계산 작업량을 부과한다. 시그니처 벡터 및 거리 함수는 제2 계산 작업량과 제3 계산 작업량의 합이 제1 계산 작업량보다 적도록 선택된다.
또한, 상기 장치는, 시그니처 프로세서가 참조 프레임 내의 픽셀의 각각의 블록에 대응하는 참조 시그니처 벡터를 생성하게 하고, 픽셀의 그러한 블록에 대응하는 참조 시그니처 벡터와 VR1 사이의 거리를 측정함으로써, 참조 프레임 내의 픽셀의 복수의 블록 각각과 픽셀의 제1 블록을 비교하는 컨트롤러를 포함한다.
전술한 바와 같이, 상기 장치는 이미지 압축을 위한 스테레오 시차 시스템 및 모션 보상 시스템(motion compensation system)을 포함하는 다수의 시스템에 포함될 수 있다.
본 발명의 전술한 실시예는 본 발명의 다양한 양상을 예시하도록 제공되었다. 그러나, 상이한 특정 실시예에 나타난 본 발명의 상이한 양상이 본 발명의 다른 실시예를 제공하도록 조합될 수 있다는 것이 이해되어야 한다. 또한, 본 발명에 대한 다양한 변형이 상기의 설명 및 첨부 도면으로부터 명백해질 것이다. 따라서, 본 발명은 하기의 청구범위의 범위에 의해서만 제한되어야 한다.

Claims (25)

  1. 현재 프레임 내의 픽셀의 제1 블록 B1과 참조 프레임 내의 픽셀의 제2 블록 B2를 비교하기 위해 데이터 처리 시스템을 동작하기 위한 방법에 있어서,
    상기 제1 블록에 대한 제1 시그니처 벡터 V1을 생성하는 단계,
    상기 제2 블록에 대한 제2 시그니처 벡터 V2를 생성하는 단계, 및
    거리 함수 D(V1,V2)를 이용하여 제1 및 제2 시그니처 벡터 사이의 거리를 측정하는 단계를 포함하며, 상기 시그니처 벡터 및 거리 함수는,
    D(B1,B2)<D(B1,B3)이면, D(V1,V2)<D(V1,V3)이 되도록 선택되고, 여기서 B3은 상기 참조 프레임 내의 픽셀의 제3 블록이며,
    D(B1,B2)를 계산하는 것은 상기 데이터 처리 시스템에 제1 계산 작업량을 부과하고, D(V1,V2)를 계산하는 것은 상기 데이터 처리 시스템에 제2 계산 작업량을 부과하며, 상기 데이터 처리에서 V1 및 V2를 생성함으로써 부과되는 계산 작업량과 상기 제2 계산 작업량의 합은 평균적으로 상기 제1 계산 작업량보다 적은, 방법.
  2. 제1항에 있어서, 상기 제1 시그니처 벡터를 생성하는 단계는 상기 제1 시그니처 벡터의 성분을 생성하기 위해 선형 변환을 사용하여 상기 제1 블록을 변환하는 단계를 포함하는, 방법.
  3. 제2항에 있어서, 제2 시그니처 벡터를 생성하기 위해 상기 제1 시그니처 벡터를 양자화하는 단계를 추가로 포함하는, 방법.
  4. 제3항에 있어서, 상기 양자화하는 단계는 벡터 양자화를 포함하는, 방법.
  5. 제4항에 있어서, 상기 벡터 양자화는 피라미드 벡터 양자화를 포함하는, 방법.
  6. 제3항에 있어서, 상기 양자화는 상기 제1 시그니처 벡터의 각 성분을 별도로 양자화하는 단계를 포함하는, 방법.
  7. 제3항에 있어서, 상기 제2 시그니처 벡터를 특정화하는 데 요구되는 비트의 수를 감소시키기 위해 상기 제2 시그니처 벡터를 부호화하는 단계를 추가로 포함하는, 방법.
  8. 제2항에 있어서, 상기 성분은 제1 공간 주파수 한계 미만인 공간 주파수 내의 상기 제1 블록의 일부분에서의 파워인, 방법.
  9. 제2항에 있어서, 상기 성분은 제로보다 큰 낮은 공간 주파수 한계를 갖는 제1 공간 주파수 대역에 있어서의 공간 주파수 내의 상기 제1 블록의 일부분에서의 파워인, 방법.
  10. 제2항에 있어서, 상기 선형 변환은 웨이블릿 변환인, 방법.
  11. 제10항에 있어서, 상기 웨이블릿 변환은 하알 변환인, 방법.
  12. 제1항에 있어서, 상기 참조 프레임 내의 제3 블록에 대한 제3 시그니처 벡터 V3을, 상기 제2 시그니처 벡터를 갱신함으로써 생성하는 단계, 및 상기 제1 시그니처 벡터와 제3 시그니처 벡터 사이의 거리를 상기 제1 시그니처 벡터와 제2 시그니처 벡터 사이의 거리와 비교하는 단계를 추가로 포함하는, 방법.
  13. 제12항에 있어서, 상기 참조 프레임은 픽셀의 복수의 행 및 열을 포함하고, 상기 제3 블록은 상기 제2 블록과 동일한 상기 참조 프레임의 행에 위치되고, 상기 제2 블록과 공통으로 픽셀을 갖는, 방법.
  14. 제12항에 있어서, 상기 참조 프레임은 픽셀의 복수의 행 및 열을 포함하고, 상기 제3 블록은 상기 제2 블록과 동일한 상기 참조 프레임의 열에 위치되고, 상기 제2 블록과 공통으로 픽셀을 갖는, 방법.
  15. 제1항에 있어서, 상기 참조 프레임 내의 픽셀의 상이한 블록에 대응하는 복수의 시그니처 벡터를 생성하는 단계로서, 상기 참조 프레임 내의 픽셀의 각 블록 및 상기 현재 프레임 내의 상기 블록은 다수의 픽셀에 의해 특징지어지고, 상기 참조 프레임에서의 상기 블록 내의 다수의 픽셀은 상기 제1 블록 내의 다수의 픽셀과 동일한, 상기 복수의 시그니처 벡터를 생성하는 단계,
    상기 참조 내의 상기 블록에 대응하는 상기 시그니처 벡터 각각과 상기 제1 시그니처 벡터 사이의 거리를 측정하는 단계, 및
    상기 참조 내의 어느 블록이 상기 제1 시그니처 벡터에 가장 근접한 시그니처 벡터를 갖는지를 식별하는 단계를 추가로 포함하는, 방법.
  16. 현재 프레임 내의 픽셀의 제1 블록 C1과 참조 프레임 내의 픽셀의 제2 블록 R1을 비교하는 장치에 있어서,
    픽셀의 블록으로부터 시그니처 벡터를 생성하고, 상기 제1 블록에 대한 제1 시그니처 벡터 VC1 및 상기 제2 블록에 대한 제2 시그니처 벡터 VR1을 생성하는 시그니처 프로세서, 및
    거리 함수 D(V1,V2)를 이용하여 2개의 벡터 V1 및 V2 사이의 거리를 측정하는 거리 측정 프로세서를 포함하며,
    D(C1,R1)<D(C1,R2)이면, D(VC1,VR1)<D(VC1,VR2)가 되고, 여기서 R2는 상기 참조 프레임 내의 픽셀의 제3 블록이며,
    D(C1,R1)을 계산하는 것은 제1 계산 작업량을 부과하고, D(VC1,VR1)을 계산하는 것은 제2 계산 작업량을 부과하고, VC1 및 VR1을 생성함으로써 부과되는 계산 작업량과 상기 제2 계산 작업량의 합은 상기 제1 계산 작업량보다 적은, 장치.
  17. 제16항에 있어서, 상기 시그니처 프로세서가 상기 참조 프레임 내의 픽셀의 각각의 블록에 대응하는 참조 시그니처 벡터를 생성하게 하고, 픽셀의 그러한 블록에 대응하는 상기 참조 시그니처 벡터와 VR1 사이의 거리를 측정함으로써, 참조 프레임 내의 픽셀의 복수의 블록 각각과 픽셀의 상기 제1 블록을 비교하는 컨트롤러를 추가로 포함하는, 장치.
  18. 제16항에 있어서, 상기 시그니처 프로세서는 상기 시그니처 벡터의 성분을 생성하기 위해 선형 변환을 사용하여 상기 제1 블록을 변환함으로써 픽셀의 블록에 대한 시그니처를 생성하는, 장치.
  19. 제18항에 있어서, 상기 성분은 제1 공간 주파수 한계 미만인 공간 주파수 내의 픽셀의 상기 블록의 일부분에서의 파워인, 장치.
  20. 제18항에 있어서, 상기 선형 변환은 웨이블릿 변환인, 장치.
  21. 제20항에 있어서, 상기 웨이블릿 변환은 하알 변환인, 장치.
  22. 제17항에 있어서, 상기 시그니처 프로세서는, 상기 현재 프레임 또는 참조 프레임 내의 픽셀의 블록 중 하나에 대한 시그니처 벡터를, 그러한 블록 내의 픽셀로부터 단독으로 상기 시그니처 벡터를 생성하기보다는, 상기 현재 프레임 또는 참조 프레임 내의 픽셀의 다른 블록에 대해 생성된 시그니처 벡터를 갱신함으로써 생성하는, 장치.
  23. 제17항에 있어서, 상기 시그니처 프로세서는 이미 생성된 복수의 시그니처 벡터를 보간함으로써 상기 시그니처 벡터를 생성하는, 장치.
  24. 압축될 현재 프레임으로부터 픽셀의 블록을 수용하는 포트,
    수용된 픽셀의 블록으로부터 현재 시그니처 벡터를 생성하는 시그니처 생성기,
    참조 프레임으로부터의 픽셀의 복수의 블록을 포함하는 라이브러리로서, 상기 라이브러리는 복수의 라이브러리 시그니처 벡터를 포함하고, 하나의 이러한 라이브러리 시그니처 벡터는 상기 라이브러리 내의 픽셀의 복수의 블록 각각에 대응하는, 라이브러리, 및
    거리 함수를 사용하여 상기 라이브러리 내의 각 시그니처와 상기 현재 시그니처 벡터 사이의 거리를 측정함으로써 상기 라이브러리로부터 픽셀의 매칭 블록을 선택하는 컨트롤러로서, 픽셀의 상기 매칭 블록은 상기 거리 함수에 의해 측정될 때 상기 라이브러리의 시그니처 벡터가 상기 현재 시그니처 벡터에 가장 근접하는 상기 라이브러리 내의 픽셀의 블록이고, 상기 시그니처 생성기 및 상기 거리 함수는, 시그니처 벡터를 매칭함으로써 부과되는 계산 작업량이 상기 거리 함수를 이용하여 수신된 블록 중 하나와 상기 라이브러리 내의 각각의 블록을 매칭함으로써 부과된 계산 작업량보다 적도록 선택되는, 장치.
  25. 제24항에 있어서, 픽셀의 상기 매칭 블록을 이용하여 픽셀의 수신된 블록을 부호화하는 압축 프로세서를 추가로 포함하고, 상기 픽셀의 부호화된 블록은 픽셀의 상기 매칭 블록을 특정화하는 정보를 포함하는, 장치.
KR1020157021426A 2013-01-09 2014-01-08 픽셀의 2개의 블록을 비교하기 위한 방법 및 장치 KR20150128664A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2013900077A AU2013900077A0 (en) 2013-01-09 Compact Signatures for Fast Signal Comparison
AU2013900077 2013-01-09
PCT/AU2014/000006 WO2014107762A1 (en) 2013-01-09 2014-01-08 Method and apparatus for comparing two blocks of pixels

Publications (1)

Publication Number Publication Date
KR20150128664A true KR20150128664A (ko) 2015-11-18

Family

ID=51166429

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157021426A KR20150128664A (ko) 2013-01-09 2014-01-08 픽셀의 2개의 블록을 비교하기 위한 방법 및 장치

Country Status (5)

Country Link
US (1) US20150296207A1 (ko)
EP (1) EP2944085A4 (ko)
KR (1) KR20150128664A (ko)
CN (1) CN104937938A (ko)
WO (1) WO2014107762A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016029243A1 (en) * 2014-08-26 2016-03-03 Vincenzo Liguori Video compression system that utilizes compact signature vectors for inter and intra prediction
JP6274067B2 (ja) * 2014-10-03 2018-02-07 ソニー株式会社 情報処理装置および情報処理方法
CN109493295B (zh) * 2018-10-31 2022-02-11 泰山学院 一种非局部哈尔变换图像去噪方法
US11575896B2 (en) * 2019-12-16 2023-02-07 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6625216B1 (en) * 1999-01-27 2003-09-23 Matsushita Electic Industrial Co., Ltd. Motion estimation using orthogonal transform-domain block matching
DE69934605T2 (de) * 1999-11-29 2007-10-11 Sony Corp. Verfahren und Vorrichtung zur Bearbeitung von Videosignalen durch Charakteristischen Punkten Extraktion im komprimierten Bereich.
CN1298171C (zh) * 2001-09-18 2007-01-31 松下电器产业株式会社 图像的编码方法和图像的译码方法
JP4053282B2 (ja) * 2001-11-14 2008-02-27 富士重工業株式会社 画像処理装置および画像処理方法
US7231090B2 (en) * 2002-10-29 2007-06-12 Winbond Electronics Corp. Method for performing motion estimation with Walsh-Hadamard transform (WHT)
KR100829169B1 (ko) * 2006-07-07 2008-05-13 주식회사 리버트론 H.264 코딩의 압축모드 예측 장치 및 방법
CN100463525C (zh) * 2006-12-11 2009-02-18 浙江大学 计算复杂度可动态调整的视频编码方法和装置
KR101003105B1 (ko) * 2008-01-29 2010-12-21 한국전자통신연구원 어파인 변환 기반의 움직임 보상을 이용한 비디오 부호화 및 복호화 방법 및 장치
KR100987581B1 (ko) * 2009-02-26 2010-10-12 한양대학교 산학협력단 고속 움직임 추정을 위한 부분 블록정합 방법
JP2012253482A (ja) * 2011-06-01 2012-12-20 Sony Corp 画像処理装置および方法、記録媒体、並びにプログラム

Also Published As

Publication number Publication date
CN104937938A (zh) 2015-09-23
WO2014107762A1 (en) 2014-07-17
EP2944085A1 (en) 2015-11-18
EP2944085A4 (en) 2016-02-17
US20150296207A1 (en) 2015-10-15

Similar Documents

Publication Publication Date Title
US11546627B2 (en) Moving picture decoding method and moving picture encoding method
CN108028941B (zh) 用于通过超像素编码和解码数字图像的方法和装置
CN113678466A (zh) 用于预测点云属性编码的方法和设备
US5917943A (en) Image processing apparatus and method
US20100114871A1 (en) Distance Quantization in Computing Distance in High Dimensional Space
US20150296207A1 (en) Method and Apparatus for Comparing Two Blocks of Pixels
Dardouri et al. Dynamic neural network for lossy-to-lossless image coding
CN114651270A (zh) 通过时间可变形卷积进行深度环路滤波
WO2013013977A1 (en) A method for coding a sequence of digital images
WO2022131948A1 (en) Devices and methods for sequential coding for point cloud compression
Ismail et al. Spiral architecture based hybrid fractal image compression
Rizkallah et al. Prediction and sampling with local graph transforms for quasi-lossless light field compression
Emara et al. Image compression using advanced optimization algorithms
Saudagar Minimize the percentage of noise in biomedical images using neural networks
CN106780331B (zh) 一种新的基于邻域嵌入的超分辨率方法
Daribo et al. Dynamic compression of curve-based point cloud
Jilani Saudagar A case study of evaluation factors for biomedical images using neural networks
RU2646358C2 (ru) Способ устранения избыточности при сжатии последовательности изображений
Liu et al. Spatio-temporal depth data reconstruction from a subset of samples
WO2024078925A1 (en) Motion coding for dynamic meshes using intra- and inter-frame graph fourier transforms
Lee et al. Compression scheme by use of motion-compensated residual image transformed from elemental image array in three-dimensional integral imaging
WO2016029243A1 (en) Video compression system that utilizes compact signature vectors for inter and intra prediction
WO2015182692A1 (ja) 動画像符号化装置及び動画像復号装置並びに方法
Cosman et al. Combining vector quantization and histogram equalization
Schmalz Digital Images: Compression

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid