KR20140057282A - 디지털 이미지들의 시퀀스를 코딩하기 위한 방법 - Google Patents

디지털 이미지들의 시퀀스를 코딩하기 위한 방법 Download PDF

Info

Publication number
KR20140057282A
KR20140057282A KR1020147004738A KR20147004738A KR20140057282A KR 20140057282 A KR20140057282 A KR 20140057282A KR 1020147004738 A KR1020147004738 A KR 1020147004738A KR 20147004738 A KR20147004738 A KR 20147004738A KR 20140057282 A KR20140057282 A KR 20140057282A
Authority
KR
South Korea
Prior art keywords
sequence
image
coding
motion
images
Prior art date
Application number
KR1020147004738A
Other languages
English (en)
Inventor
안드레아스 바인리히
페터 아몬
안드레아스 후테르
안드레 카웁
Original Assignee
지멘스 악티엔게젤샤프트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 지멘스 악티엔게젤샤프트 filed Critical 지멘스 악티엔게젤샤프트
Publication of KR20140057282A publication Critical patent/KR20140057282A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법을 지칭하고, 각각의 이미지는 동일한 이미지 포맷을 갖고, 픽셀 값들이 할당된 다수의 픽셀들을 포함하고, 여기서 제1 이미지(I1)와 제2 이미지(I2) 사이의 움직임 파라미터들(MP)이 결정되고, 여기서 상기 움직임 파라미터들(MP)에 기초하여, 이미지들의 시퀀스(S)를 코딩하기 위해 움직임 보상(MC)이 수행되고, 여기서 상기 움직임 파라미터들(MP)은 이미지들의 코딩된 시퀀스(CS) 내에 포함된다. 제1 이미지(I1)와 제2 이미지(I2) 사이의 움직임 파라미터들(MP)은, 이미지 포맷 내의 복수의 이미지 포지션들에 대한 스칼라 값들을 갖는 스칼라장(
Figure pct00091
)을 포함하고, 여기서 스칼라장(
Figure pct00092
)은, 상기 스칼라장(
Figure pct00093
)으로부터 도출된 기울기 벡터들(MV)이 움직임 보상(MC)을 위한 움직임 벡터들에 대응하도록 결정된다.

Description

디지털 이미지들의 시퀀스를 코딩하기 위한 방법{A METHOD FOR CODING A SEQUENCE OF DIGITAL IMAGES}
본 발명은 디지털 이미지들의 시퀀스를 코딩하기 위한 방법 뿐만 아니라 디코딩하기 위한 대응하는 방법에 관한 것이다. 또한, 본 발명은 코딩 장치 및 디코딩 장치 뿐만 아니라 이미지들의 시퀀스를 코딩 및 디코딩하기 위한 시스템에 관련된다.
이미지들의 빠르고 효율적인 송신 및 저장을 위해, 이미지들의 공간적, 시간적 및 확률적 중복(redundancy)들을 활용하기 위하여 압축 알고리즘들이 사용된다. 비디오 코딩에서, 블록-기반 과도기적 움직임 예측 및 시간 방향으로의 보상을 이용할 때 공간적 변화(variation)들을 감소시키려고 애쓰는 블록-기반 움직임 보상 기술들이 알려져 있다. 그렇게 하기 위해, 이미지 시퀀스 내의 이전 이미지에 관련된 현재 이미지 내에 몇몇의 픽셀들을 포함하는 미리정의된 블록들의 움직임이 결정되고, 강도 차이 기준(intensity difference norm)이 최소화된다. 예측을 위한 이 움직임 정보를 이용하여, 훨씬 더 적은 변화를 포함하는 잔류 오차(residual error)만이, 디코더에서의 무손실 재구성을 획득하기 위하여 전송되어야 한다. 블록-기반 방법들은, 디코딩된 이미지 내의 블록 경계들에 블록 인공물(artifact)들을 생성하는 단점을 갖는다. 블록-기반 움직임 보상의 몇몇의 개선들, 예컨대 블록-크기 적응, 인트라-코딩(intra-coding)의 적응식 선택, 다수의 선행 및 후속 이미지로부터의 가중된 예측, 인-루프(in-loop) 필터링 등등이 종래 기술에서 설명된다.
블록-기반 움직임 보상 외에, 픽셀-기반 움직임 보상을 위한 방식들이 또한 있다. 이러한 움직임 보상에 의해, 픽셀-기반 움직임 벡터장들을 이용하여 임의적인 움직임이 설명될 수 있다. 이러한 방법들은, 움직임 벡터들의 많은 개수 때문에, 많은 부차적인 정보가 디코더에 전송되어야 하는 단점을 갖는다. 이러한 부차적인 정보를 감소시키기 위하여, 문서 [1]은, 각자의 예측 능력에 대한 중요한 움직임 벡터들만이 코딩되는, 조밀(dense) 움직임 벡터장들의 스파스(sparse) 표현을 설명한다.
본 발명의 목적은, 높은 코딩 효율성을 갖는, 디지털 이미지들의 시퀀스를 코딩하기 위한 방법을 제공, 즉 높은 압축 레이트로 우수한 품질의 디코딩된 이미지들을 제공하는 것이다.
이 목적은 독립 청구항들에 따라 해결된다. 바람직한 실시예들이 종속 청구항들에서 정의된다.
본 발명의 방법은 디지털 이미지들의 시퀀스를 코딩하기 위해 사용되고, 여기서 각각의 이미지는 동일한 이미지 포맷을 갖고, 픽셀 값들이 할당된 다수의 픽셀들을 포함한다. 동일한 이미지 포맷 때문에, 이미지 포맷 내의 각각의 픽셀은 각각의 이미지 내의 미리결정된 픽셀에 대응한다. 본 발명의 방법에 따라, 제1 이미지와 제2 이미지 사이의 움직임 파라미터들이 결정되고, 여기서 상기 움직임 파라미터들에 기초하여, 이미지들의 시퀀스를 코딩하기 위해 움직임 보상이 수행되고, 여기서 상기 움직임 파라미터들은 이미지들의 코딩된 시퀀스 내에 포함된다. 용어 "이미지"는 광범위하게 해석될 것이고, 픽셀들의 임의적인 어레이, 예컨대 2-차원 또는 3-차원 또는 더 고차원의 픽셀들의 어레이를 지칭할 수 있다.
본 발명에 따른 방법은 새로운 부류의 움직임 파라미터들에 의해 특징지어진다. 즉, 제1 이미지와 제2 이미지 사이의 움직임 파라미터들은 움직임 벡터들 대신에 스칼라장을 포함하고, 여기서 상기 스칼라장은 이미지 포맷 내의 복수의 이미지 포지션들에 대한 스칼라 값들을 갖는다. 그러한 이미지 포지션들은 픽셀 포지션들에 대응할 필요가 없다. 아래에 설명되는 바람직한 실시예에서, 스칼라장은, 이미지 포맷 내의 픽셀들의 개수보다 더 적은 다수의 이미지 포지션들에서 알려진 스칼라 값들을 포함한다. 본 발명에 따른 스칼라장은, 스칼라장으로부터 도출된 기울기 벡터들이 움직임 보상을 위한 움직임 벡터들에 대응하도록, 즉 기울기 벡터들이 움직임 벡터들과 동일하거나, 또는 기울기 벡터들을 팩터(factor)로 곱함으로써 움직임 벡터들이 결정될 수 있도록 결정된다. 기울기 벡터가 이미지 내에서 스칼라장의 잘-알려진 기울기에 의해 표현된다. 스칼라장의 정의 때문에, 기울기 벡터는 종래 기술 코딩 기술들에서 정의된 바와 같은 움직임 벡터에 대응한다.
본 발명의 코딩 방법은, 움직임 벡터들 대신에, 스칼라장이 이미지들의 코딩된 시퀀스 내에 포함되고, 따라서 부차적인 정보가 감소되고 더 높은 코딩 효율성이 야기된다는 장점을 갖는다. 또한, 본 발명의 방식이 이미지 블록들에 기초하지 않기 때문에, 블록킹 인공물들이 제거된다. 이는, 상관해제(decorrelation) 방법들이 코딩된 비트스트림 내의 정보, 예컨대 예측 코딩에서 계산된 예측 오차에 적용되는 경우에, 더 우수한 압축을 야기한다.
본 발명은, 이미지들의 특정 시퀀스들 내의 움직임 벡터들이 스칼라장에 기초하여 표현될 수 있다는 깨달음에 기초한다. 이러한 장은 바람직하게, 제2 이미지의 픽셀 값들과 제1의 움직임-보상된 이미지의 픽셀 값들 사이의 잔류 오차를 최소화시키는 스칼라장을 검색함으로써 결정되고, 여기서 제1의 움직임-보상된 이미지는 스칼라장으로부터 도출된 기울기 벡터들에 기초하여 결정된다. 즉, 스칼라장은 잔류 오차를 최소화시키는 최적화 문제의 솔루션에 기초하여 결정된다. 그러나, 실제 구현들에서, 절대 최소치가 반드시 발견되는 것은 아니다. 코딩 노력에 따라, 또한 차선-솔루션이 스칼라장에 대해 사용될 수 있다. 그럼에도 불구하고, 이러한 솔루션은 또한, 잔류 오차를 최소화시키는 스칼라장에 대한 검색에 의해 발견된다.
바람직한 실시예에서, 잔류 오차는 제2 이미지와 제1 이미지 사이의 절대 픽셀 값 차이들의 합에 의해 표현되고, 여기서 각각의 절대 픽셀 값 차이는 제2 이미지 내의 제2 픽셀 포지션의 픽셀 값과 제1 이미지 내의 제1 픽셀 포지션의 픽셀 값 사이의 절대 차이에 대응하고, 상기 제1 픽셀 포지션은 상기 제2 픽셀 포지션에서의 스칼라장의 샘플링된 버전의 기울기 벡터에 의해 보상된 제2 픽셀 포지션에 대응한다. 용어 "절대 차이"는 광범위하게 해석될 것이고, 예컨대 제곱된 차이들을 또한 포함할 수 있다. 특히 바람직한 실시예에서, 스칼라장은 이미지 포맷 내의 픽셀들의 개수보다 더 적은 이미지 포지션들에 대한 스칼라 값들을 포함하고, 여기서 스칼라장의 샘플링된 버전은, 스칼라장의 업-샘플링(up-sampling)된 버전을 보간함으로써 결정된다. 이러한 실시예에서, 감소된 개수의 스칼라 값들을 포함하는 스칼라장의 사용 때문에 디코딩을 위해 전송될 부차적인 정보가 감소된다. 위의 실시예의 바람직한 변형에서, 스칼라장의 업-샘플링된 버전은, 윈도우잉(windowing)된 사인 함수, 특히 Lanczos 필터에 의해 보간된다. 다른 보간 기술들, 예컨대 스플라인 보간이 또한 사용될 수 있다.
본 발명에서 사용되는 스칼라장을 결정하기 위하여, 비-선형 최소 제곱법(non-linear least squares) 문제들에 대한 잘-알려진 솔버(solver)들, 예컨대 (반복) Gauss-Newton 알고리즘 및/또는 Levenberg-Marquardt 알고리즘이 사용될 수 있다. 본 발명의 다른 실시예에서, 움직임 파라미터들(즉, 스칼라장)은 변환 및/또는 데이터 압축, 특히 DCT(Discrete Cosine Transformation) 및/또는 Karhunen-Loeve 변환 및/또는 예측 코딩 및/또는 엔트로피 코딩을 겪는다. 이러한 실시예 때문에, 코딩 효율성이 향상된다.
본 발명의 방법에서 수행되는 움직임 보상은 잘-알려진 코딩 기술들에 대해 사용될 수 있다. 특히, 움직임-보상은 예측 코딩에 대해 수행될 수 있고, 여기서 도출된 기울기 벡터들에 의해 보상되는 제1 이미지와 제2 이미지 사이의 잔류 오차가 결정되고, 바람직하게 데이터 압축, 특히 공간적 예측 코딩 및/또는 웨이블릿 분해와 같은 전체 이미지 변환 및/또는 엔트로피 코딩을 겪는다. 그럼에도 불구하고, 움직임 보상은 또한, 움직임-보상된 시간적 필터링과 결합될 수 있다.
바람직한 실시예에서, 본 발명에 의해 코딩된 이미지들의 시퀀스는 시간적으로 그 후의 이미지들을 참조한다. 그럼에도 불구하고, 본 발명은 공간적으로 그 후의 이미지들의 시퀀스에 또한 적용가능하다.
특히 바람직한 실시예에서, 이미지들의 시퀀스는 의료 데이터, 즉 의료 이미징 디바이스에 의해, 특히 CT(Computed Tomography) 장비 및/또는 MRT(Magnetic Resonance Tomography) 장비에 의해 생성된 데이터에 기초한다. 이러한 실시예에서, 이미지들의 시퀀스는 바람직하게, 인간 또는 동물 조직, 특히 인간 또는 동물의 기관, 예컨대 심장을 포함하는 조직 내의 슬라이스들의 시간적 또는 공간적 시퀀스이다.
위의 방법 외에, 본 발명은 디지털 이미지들의 시퀀스를 코딩하기 위한 장치를 또한 포함하고, 각각의 이미지는 동일한 이미지 포맷을 갖고, 픽셀 값들이 할당된 다수의 픽셀들을 포함한다. 장치는, 제1 이미지와 제2 이미지 사이의 움직임 파라미터들을 결정하기 위한 수단을 포함하고, 상기 움직임 파라미터들은 이미지들의 시퀀스를 코딩하기 위해 수행되는 움직임 보상을 위한 수단 내에서 사용되고, 여기서 상기 움직임 파라미터들은 이미지들의 코딩된 시퀀스 내에 포함된다. 이러한 장치에서, 움직임 파라미터들을 결정하기 위한 수단은 이미지 포맷 내의 복수의 이미지 포지션들에 대한 스칼라 값들을 갖는 스칼라장을 결정하기 위한 수단을 포함하고, 여기서 스칼라장은 스칼라장으로부터 도출된 기울기 벡터들이 움직임 보상을 위한 움직임 벡터들에 대응하도록 결정된다. 장치는 바람직하게, 본 발명에 따른 방법의 바람직한 실시예들 중 하나 또는 그 초과를 수행하기 위해 배열된다.
또한, 본 발명은 본 발명의 코딩 방법 또는 이러한 코딩 방법의 하나 또는 그 초과의 바람직한 실시예들에 의해 코딩되는 디지털 이미지들의 시퀀스를 디코딩하기 위한 방법에 관련된다. 이러한 디코딩 방법에서, 이미지들의 코딩된 시퀀스 내에서 대응하는 제1 이미지 및 제2 이미지에 대한 하나 또는 그 초과의 스칼라장들이 추출되고, 각각의 추출된 스칼라장으로부터 기울기 벡터들이 도출되고, 여기서 움직임 보상은 도출된 기울기 벡터들에 기초하여 수행되고, 이미지들의 디코딩된 시퀀스가 야기된다.
또한, 본 발명은 본 발명의 코딩 방법 또는 본 발명에 따른 코딩 방법의 하나 또는 그 초과의 바람직한 실시예들에 의해 코딩되는 디지털 이미지들의 시퀀스를 디코딩하기 위한 장치에 관련된다. 장치는, 이미지들의 코딩된 시퀀스 내에서 대응하는 제1 이미지 및 제2 이미지에 대한 하나 또는 그 초과의 스칼라장들을 추출하기 위한 수단, 각각의 추출된 스칼라장으로부터 기울기 벡터들을 도출하기 위한 수단 및 도출된 기울기 벡터들에 기초하여 움직임 보상을 수행하기 위한 수단을 포함하고, 이미지들의 디코딩된 시퀀스가 야기된다.
또한, 본 발명은 위에서 설명된 코딩 장치 및 위에서 설명된 디코딩 장치를 포함하는, 이미지들의 시퀀스를 코딩 및 디코딩하기 위한 시스템을 포함한다.
본 발명의 실시예들은 동반된 도면들에 대하여 이제 상세히 설명될 것이다.
도 1은 본 발명의 실시예에 따른 코딩 방법을 예시하는 블록도를 도시한다.
도 2는 본 발명의 실시예에 따른 디코딩 방법을 예시하는 블록도를 도시한다.
도 3은 종래 기술 방법들과 비교할 때 본 발명의 실시예에 따른 코딩의 품질을 예시하는 도면들을 도시한다.
도 4는 본 발명의 실시예에 기초한 코딩 및 디코딩을 위한 시스템을 예시하는 블록도이다.
아래에서는, 본 발명의 실시예가 CT 장비에 의해 찍힌 의료 이미지들의 시퀀스에 대하여 설명될 것이고, 여기서 각각의 이미지는 인간 조직 내의 복수의 복셀들의 볼륨을 표현하는 소위 슬라이스이다. 이미지들의 시퀀스가 시간적 시퀀스여서, 그 후의 이미지들은 인간 조직 내의 동일한 포지션이지만 상이한 시점들에 찍힌 이미지들을 지칭한다. 따라서, 이미지들은 픽셀들의 시간적으로 후속하는 2-차원 어레이들을 지칭한다. 그러나, 본 발명은 픽셀들의 3-차원 어레이들 및/또는 인간 조직으로부터 찍힌 공간적으로 후속하는 슬라이스들의 시퀀스에 또한 적용가능하다.
각각의 슬라이스 내의 복셀들은 시간에 따라 움직이는 인간 기관들의 조직 밀도들을 표현하고, 여기서 조직 밀도들은 복셀들의 각각의 픽셀 값들에 의해 표현된다. 본 발명의 일 실시예에서, 인간 심장의 생리적 근육 조직에 대한 변형가능한 움직임을 나타내는 심장 CT 데이터의 시간적 시퀀스가 본 발명에 기초하여 코딩된다. 원리적으로, 본 발명은 이미지들의 시퀀스가 변형가능한 움직임을 포함하는 임의적인 종류의 데이터에 적용가능하다. 종래 기술과 반대로, 본 발명은, 이전 이미지 내의 어느 포지션으로부터 블록들이 시프트되었는지를 나타내는 움직임 벡터들을 이용하는 블록-기반 움직임 보상에 기초하지 않는다. 대신에, 두 개의 시간적으로 후속하는 이미지들 사이의 조직 변형을 표현하기 위해 파라미터들의 세트가 정의된다. 그런 다음, 이러한 파라미터들은 저-에너지 예측 오차 이미지를 야기하도록 최적화된다.
그렇게 하기 위해, 후속 슬라이스들 사이의 움직임 보상을 위해 사용되는 밀도 움직임 벡터장을 도출하기 위하여 스칼라장이 사용된다. 조밀 움직임 벡터장
Figure pct00001
은 시퀀스의 시간적으로 후속하는 (제2) 이미지의 이미지 함수
Figure pct00002
내의 각각의 복셀 포지션
Figure pct00003
에 대해 나타내고, 여기서 복셀의 그레이 레벨은 (제1) 선행 이미지의 시간적으로 선행하는 이미지 함수
Figure pct00004
내에 위치되었다. 따라서, 조밀 움직임 벡터장의 벡터들은
Figure pct00005
로부터
Figure pct00006
로의 복셀 시프트를 나타내는 네거티브 벡터들이다. 가독성을 위해, 애매성이 없을 때, 위의 함수들의 파라미터
Figure pct00007
는 생략될 것이다.
Figure pct00008
가 흐름장(flow field)으로서 보일 때, 각각의 포지션에서의 그 소스 또는 싱크(sink) 특성이 발산
Figure pct00009
을 이용하여 계산될 수 있고, 여기서
Figure pct00010
는 미분 연산자이고,
Figure pct00011
는 내적을 표기하고, 슬라이스 도메인
Figure pct00012
은 슬라이스의 복셀 포지션들 전부를 포함한다. 본 명세서에서 설명되는 바와 같은 방법에서 프로세싱되는 이미지들에서,
Figure pct00013
는 조직의 변형을 설명한다. 결과로서, 발산은, 소스 및 싱크 특성 대신에, 국부적 조직 팽창 및 수축에 대한 측정치(measure)로서 해석될 수 있다. 다른 벡터장 특성은
Figure pct00014
로 불리고, 상기
Figure pct00015
은 흐름장 내의 특정 포지션에 있는 물체가 얼마나 많이 회전하기 시작하는지를 설명한다.
예컨대 심장 획득(heart acquisition)들에서의 조직 움직임은, 팽창 또는 수축만 할 수 있고 서로에 대해 각자의 포지션들을 시프트할 수 없는 근육 세포들에 의해 유발된다. 그러므로, 벡터장
Figure pct00016
Figure pct00017
Figure pct00018
내의 각각의 포지션에서 0이다. 그러한 벡터장들은 보존적 또는 비회전으로 불린다. 벡터 계산으로부터, 보존적 벡터장들이 포텐셜
Figure pct00019
로 불리는 스칼라 함수의 기울기로서 완벽하게 표현될 수 있음이 알려져 있고:
Figure pct00020
따라서, (1)을 이용하여,
Figure pct00021
이다.
근육 수축들은 조직의 국부적 이웃들에서 비슷한데, 즉 근육 수축들은 슬라이스 도메인 사이에서 느리게만 변한다. 그 이유는, 그러한 수축들이 뉴런들로부터의 조악하게(coarsely) 위치된 전기 임펄스들만에 의해 개시되기 때문이다. 슬라이스 도메인 사이에서의
Figure pct00022
의 변화 레벨은 자신의 기울기 크기에 의해 표현될 수 있다
Figure pct00023
.
결과로서, 본 명세서에서 설명되는 바와 같은 방법에 의해 코딩되는 이미지들 내에서, 스칼라 포텐셜 장
Figure pct00024
이 결정될 수 있고, 이러한 장의 기울기에 기초하여, 조밀 움직임 벡터장이 도출될 수 있다.
본 명세서에서 설명되는 바와 같은 본 발명의 실시예에서, 이러한 포텐셜 장의 다운-샘플링된 버전
Figure pct00025
이 결정되고 움직임 보상을 위해 사용된다. 그러한 다운-샘플링된 버전이 사용될 수 있는데, 그 이유는 근육 변형이 국부적 구역들에서 유사하여, 매우 평탄한 함수인 포텐셜 함수가 야기되기 때문이다.
Figure pct00026
를 결정한 이후, 움직임 벡터장
Figure pct00027
Figure pct00028
로부터, 업-샘플링하고
Figure pct00029
로 보간하고 그 이후 기울기
Figure pct00030
를 계산할 때, 재구성될 수 있다(방정식 (2)와 비교하라). 본 명세서에서 설명되는 바와 같은 실시예에서, 이상적인 사인 보간 커넬(kernel)의 윈도우잉 버전인, 세 개의 로브(lobe)들을 갖는 2-D Lanczos 필터
Figure pct00031
가 사용된다. 후속 픽셀들의 거리가 1이고 업-샘플링된 함수 내의 샘플링 지점들 사이의 거리가 d 픽셀들인 픽셀 도메인에서, 보간 커넬은 아래와 같이 기록될 수 있는데:
Figure pct00032
여기서,
Figure pct00033
이다.
Lanczos 필터는 제2 차수(second order)로 미분 가능하고, 그러므로 평탄함과 계산의 복잡성 사이의 트레이드-오프이다.
상기에 따라, 본 명세서에 설명되는 본 발명의 주요 목적은,
Figure pct00034
를 근사화하기 위하여
Figure pct00035
의 최선 변형에 대한 변형 파라미터들(즉, 다운-샘플링된 포텐셜 장)
Figure pct00036
를 찾는 것이다. 이를 달성하기 위해, 반복 최적화 알고리즘이 구현된다. 이러한 알고리즘은
Figure pct00037
를 바로 계산하는 것이 아니라, 각자의 유발된 예측 오차에 대해, 이러한 오차가 최소치를 달성할 때까지 상이한 가능한 함수들
Figure pct00038
을 체크한다. 수학적으로, 이는, 제곱된 차이들의 합의 최소화를 야기하고, 따라서
Figure pct00039
Figure pct00040
의 변형 사이의 MSE(mean squared error)를 야기하는데, 즉 :
Figure pct00041
이다.
여기서,
Figure pct00042
Figure pct00043
의 업-샘플링된 버전이고,
Figure pct00044
은 컨볼루션을 표기한다. 본 명세서에 설명되는 바와 같은 실시예에서, 최소화 문제는 비-선형 최소 제곱법 문제들에 대한 잘-알려진 반복 Gauss-Newton 알고리즘에 의해 풀린다. 그러나, 다른 알고리즘들, 예컨대 잘-알려진 Levenberg-Marquardt 알고리즘이 사용될 수 있다. 블록-기반 움직임 추정으로부터의 움직임 벡터 성분들과 반대로, 다운-샘플링된 포텐셜 함수가 강하게 상관되고, 그래서 추가 상관해제를 위해, 바람직한 실시예에서 부가의 변환 또는 공간적 예측이 적용된다. 또한, 기울기 계산이 비-정수 벡터들을 생성하기 때문에, 블록-기반 움직임 보상과 대조적으로,
Figure pct00045
에서의 쌍일차(bilinear) 보간을 이용한 움직임 보상이 부가의 저장 요구들 없이 서브-복셀의 정확한 움직임을 표현하는
Figure pct00046
를 허용한다.
본 명세서에서 설명되는 실시예에서 사용되는 Gauss-Newton 알고리즘에서, Jacobian 행렬이 계산되고, 상기 Jacobian 행렬은 차원 행렬 (픽셀들의 개수) × (파라미터들의 개수)로 되는, 파라미터들 각각에 대한 픽셀 값들의 편도함수들을 포함한다. 파라미터들은 다운-샘플링된 스칼라장
Figure pct00047
에 따라 이미지 내의 샘플링 지점들의 개수에 의해 표현된다. 전향 차분들을 이용하여 도함수들이 계산되는데, 즉 각각의 추정 단계에서, 잔류 오차에 관한 각각의 파라미터에 대한 영향이 이러한 파라미터가 소량만큼 증가될 때 계산된다. 이러한 잔류 오차의 변화는 하나의 열로서 행렬에 삽입된다. 이러한 행렬로부터 그리고 현재 잔류 오차 이미지로부터, 추정 방법은, 파라미터들의 세트가, 파라미터들의 최선 세트 및 그에 따른 최소 잔류 오차 이미지로 수렴되기 위하여 이 단계에서 얼마나 변화될 것인지를 계산하고, 고정된 개수의 파라미터들이 제공된다.
그 이후, 파라미터들이 따라서 변화되고, 다음 차례의 반복 동안에, 잔류가 새로 계산된다. 특히 효율적인 구현을 위해, 잔류 오차의 변화는, 최적화 단계 사이즈로 가중된 채로, 업-샘플링 필터의 기울기가 파라미터 포지션에서 재구성된 벡터장에 부가되도록 계산될 수 있다. 이러한 부가가 벡터장을 변화시키는(즉, 이러한 기울기가 0과 동일하지 않은) 포지션들에서, 움직임 보상이 다시 수행되고, 이러한 새로운 추정과 파라미터 변화가 없는 추정의 차이가 스파스 Jacobian 행렬에 삽입된다.
바람직한 실시예에 따라, 스칼라 포텐셜 장
Figure pct00048
이 아래의 의사 코드에 기초하여 계산된다:
Figure pct00049
위의 의사 코드에 따라, 소수의 파라미터들만이 정의되고, 그래서 최적화는 매우 견고하다. 의사 코드에서의 최적화가 라인 4에서 시작하는 루프에 포함된다. 중요한 선택은
Figure pct00050
내의 값들의 개수, 즉 각각의 이미지 내에서 다운-샘플링된 스칼라 장
Figure pct00051
의 샘플링 지점들의 개수이다. 이러한 개수는 움직임 정보의 양을 스케일링한다.
Figure pct00052
의 사이즈를 증가시키는 것은 예측 오차 정보를 감소시킨다. 그러나, 이러한 트레이드-오프에 대한 결정은,
Figure pct00053
와 예측 오차 둘 다에 대한 그 후의 코딩 방법들에 따라 좌우된다. 발명자들에 의해 수행된 테스트들에서, 최적화 단계 사이즈가 0.2가 되도록 선택된 반면에, 반복들의 개수는 최대 100으로 제한되었다. 이는, 정확한 근사화들을 위한 우수한 선택이다. 더 낮은 계산의 복잡성을 위해, 반복들의 최대 개수가 감소될 수 있는 동안에 단계 사이즈가 또한 증가될 수 있다.
위의 의사 코드에서의 Gauss-Newton 최적화를 위해, Jacobian 행렬이 앞서 설명된 바와 같이 계산되어야 한다. Jacobian 행렬은, 전향 차분들을 이용하여 획득된다. 이는, 각각의 반복에서, 방정식 (6)의 차이에 대한
Figure pct00054
내의 값
Figure pct00055
의 작은 증가의 영향(의사 코드의 라인 11을 보라)이 각각의 값
Figure pct00056
(즉, 샘플링 포지션 i에서의 스칼라 함수의 값)에 대해 계산됨을 의미한다. 그러나, 성능 이유들로, 라인 15에서의 이러한 차이는 Lanczos 필터가 동작하는 현재 샘플링 포지션 주위의 범위 내에서만 평가된다. 더 멀리 있는 포지션들에서, 차이는 어떻든 0인데, 그 이유는
Figure pct00057
내의 값의 변화가 국부적 영향만을 갖기 때문이다. 따라서, 움직임 보상이 이러한 국부적 이웃으로만 제약될 수 있다. 다른 성능 이득은, 초기화 동안 이미 사전에
Figure pct00058
내의 국부적 변화를 계산함으로써 달성된다. 그렇게 하기 위해, 위의 의사 알고리즘의 라인 10 내지 13이,
Figure pct00059
내의 대응하는 구역에의 이러한 변화 함수의 단순한 부가로 교체된다. 이것은 가능한데, 그 이유는 Lanczos 필터링 및 기울기 계산이 선형 연산들이고 따라서 고정된 단계 사이즈에 대해 변화가 일정하기 때문이다. 또한, Jacobian은 스파스 행렬이고, 그래서 Jacobian은 구현에서 보통 말하는 그렇게 취급되어야 하는데, 즉 메모리 내에 0들이 저장되지 않아야 하고 0들과의 곱셈들이 계산되지 않아야 한다. 궁극적으로, 수치적 안정성을 위해, 물론 라인 17에서의 인버전(inversion)이 명시적으로 수행되는 것이 아니라 선형 방정식들의 시스템이 풀려야 한다. 그 외에, 예컨대 단일-강도 배경들을 갖는 몇몇의 데이터 세트들에 대해, 인버전은 불량 조건이고 그래서 규칙화를 요구한다.
도 1은 스칼라장
Figure pct00060
의 위에서 설명된 추정에 기초한 이미지들의 시퀀스의 전체 코딩을 예시하는 블록도를 도시한다. 스칼라 포텐셜 장에 기초하여 움직임 벡터들을 계산하기 위한 변형가능한 움직임 추정을 지칭하는 이 도면의 부분이 블록(DME) 내에 포함된다. 코딩 방법의 입력은 도 1에서 S로서 표기된 이미지들의 시퀀스이다. 시퀀스 내의 제2 이미지(I2)를 코딩하기 위하여, 선행하는 제1 이미지(I1)가 사용되고, 상기 제1 이미지(I1)는 버퍼(z)로부터 취해진다. 그러한 제1 이미지 및 제2 이미지에 기초하여, 위에서 설명된 파라미터 추정(PE)이 수행되고, 스칼라 포텐셜 함수
Figure pct00061
의 다운-샘플링된 값들을 표현하는 움직임 파라미터들(MP)이 야기된다. 도 1의 실시예에서, 그러한 파라미터들은 예컨대 DCT를 통해 변환된다. 저장을 위해, 단계(PE)에서 수행된 최적화로부터의 부동 소수점 값들이 선택적으로 정수들로 양자화될 수 있다. 샘플링 지점들 사이의 훨씬 먼 거리, 예컨대 16개 복셀들 때문에, 움직임 벡터 정확성에 대한 이러한 양자화의 영향은 서브-복셀 범위 내에만 있고, 미미하게만 예측 오차에 영향을 끼친다. 그 이후, 변환(T)으로부터 생긴 움직임 정보(MI)가 엔트로피 코더(EC)에 의해 무손실로 코딩되고, 이미지들의 코딩된 시퀀스(CS)의 일부를 형성한다.
도 1의 실시예에 따라, 픽처(I2)와 픽처(I1) 사이의 잔류 오차의 예측 코딩이 수행된다. 그렇게 하기 위해, 움직임 정보(MI)는 인버스 변환(IT)을 겪고, 재구성된 스칼라장
Figure pct00062
이 야기된다. 이러한 스칼라장은 업-샘플링 및 Lanczos 필터링(LU)을 겪는데, 즉 방정식 (6)으로부터의 수식
Figure pct00063
의 값이 구해진다. 이는, 보간 및 업-샘플링된 스칼라장
Figure pct00064
를 야기한다. 이러한 스칼라장에 기초하여, 기울기 벡터들이 단계(GC)에서 계산된다. 이러한 계산은 각각의 픽셀에 대한 대응하는 움직임 벡터들(MV)을 제공한다. 이러한 움직임 벡터들에 기초하여, 제1 이미지(I1)에 대한 움직임 보상(MC)이 수행되고, 움직임-보상된 제1 이미지(I1')가 야기된다. 그 이후, I2와 I1' 사이의 차이가 계산되고, 엔트로피 인코더(EC)에서 엔트로피 인코딩되는 잔류 오차(RE)가 야기된다. 이러한 잔류 오차(RE)는 또한, 코딩된 이미지들의 시퀀스(CS)를 표현하는 비트스트림의 일부이다. 본 발명의 다른 실시예에서, 잔류 오차는 부가적으로, 엔트로피 코딩 이전에 예컨대 웨이블릿 코딩에 기초하여 또는 JPEG-LS에 기초한 예측 코딩에 기초하여 코딩될 수 있다.
도 2는 도 1의 코딩 방법에 의해 생성된 코딩된 비트스트림(CS)을 디코딩하는 프로세스를 설명하는 블록도를 도시한다. 움직임 벡터들을 디코딩하기 위한 단계들은 블록(MD) 내에 포함된다. 처음에는, 엔트로피 디코딩이 코딩된 비트스트림에 적용되고, 변환된 포텐셜 함수
Figure pct00065
를 포함하는 움직임 정보(MI)가 야기된다. 이러한 움직임 정보는 인버스 변환(IT)을 겪고, 다운-샘플링된 스칼라 포텐셜 함수
Figure pct00066
를 포함하는 움직임 파라미터들(MP)이 야기된다. 이러한 움직임 파라미터들은 도 1과 유사하게 Lanczos 업-샘플링(LU)을 겪고, 업-샘플링된 스칼라 포텐셜 장
Figure pct00067
이 야기되며, 그 이후 상기 업-샘플링된 스칼라 포텐셜 장
Figure pct00068
은 또한 도 1과 유사하게 기울기 계산(GC)을 겪는다. 결과적으로, 움직임 벡터들(MV)이 재구성된다. 그러한 움직임 벡터들은, 스토리지(z)로부터 취해진 이전 이미지(I1)에 기초하여 움직임-보상된 예측 이미지(I1')를 계산하기 위해 움직임 보상(MC)에서 사용된다. 이러한 예측 이미지(I1')는, 엔트로피 디코딩(ED)에 의해 획득된 잔류 오차(RE)와 결합된다. 결과적으로, 디코딩된 이미지(I2) 및 그에 따른 디코딩된 비트스트림(S)이 생성된다.
도 3은 인간 심장의 CT 이미지들을 코딩하기 위해 사용되는 본 발명의 실시예의 결과들을 도시한다. 도 3은 두 개의 도면들(D1 및 D2)을 포함하고, 여기서 도면들 둘 다의 가로 좌표 PV(parameter values)는 픽셀/복셀마다 스칼라 포텐셜 함수
Figure pct00069
의 값들의 개수를 표현한다. 도면들 둘 다의 라인(L1)은 본 발명의 실시예를 지칭하고, 라인(L2)은 종래 기술에 따른 블록-기반 움직임 보상을 지칭하고, 라인(L3)은 0 움직임 벡터들을 이용한 코딩을 지칭한다. 도면(D1)에서, 파라미터 값들(PV)에 따라 좌우되는 PSNR(peak signal-to-noise ratio)에 기초한 예측 품질이 도시된다. PSNR의 값이 더 높을수록, 예측 품질이 더 우수하다. 분명히, 본 발명의 방법의 예측 품질은 블록-기반 움직임 보상의 예측 품질과 유사하다. 도면(D2)에서, 예측 오차(RE)가 전체-슬라이스 DCT를 겪도록 한 이후의 변환 코딩 이득이 도시된다. 본 발명에 따른 코딩 방법에서의 블록 인공물들의 부재로 인해, 블록-기반 움직임 보상과 비교할 때 현저하게 더 높은 이득이 달성된다.
앞서 말한 것에서 설명된 바와 같은 본 발명은 몇몇의 옵션들에 의해 개선될 수 있다. 포텐셜 장의 파라미터들(즉, 다운-샘플링된 값들)을 추정하기 위한 단계에서, 장 내의 파라미터 개수 및 샘플링 포지션들이 또한, 파라미터 상관을 감소시키고 최소 움직임 정보를 이용하여 근사화를 추가로 개선하기 위하여 최적화를 겪을 수 있다. 이는, 불규칙적 샘플링 그리드를 야기한다. 그러한 그리드를 이용할 때, 샘플링 포지션들은 코딩된 비트스트림 내에서 전송되어야 하고, 이는 문서 [1]의 방법과 유사하게 수행될 수 있다. 그곳에, 단순한 실행-레벨 인코딩 또는 대안적으로 최적 루트 계산과 같은 더욱 복잡한 알고리즘들이 적용된다.
포텐셜 함수
Figure pct00070
의 추정을 개선하기 위하여, Lanczos 필터 대신에, 특히 픽셀 데이터의 움직임이 평탄한 구조를 갖는다면, 더 높은 차수의 보간 방식들이 사용될 수 있다.
추가 개선에서, 데이터가 CT 재구성들에서와 같이 상관된 잡음을 포함한다면, 움직임 보상에 앞서 잡음제거(denoising)가 수행될 수 있고, 여기서 잡음은 이러한 상관을 활용할 수 있는 알고리즘과 별개로 코딩되고, 그래서 변형은 그러한 상관들을 제거하지 않는다. 잡음이 상관되지 않더라도, 적어도 인-루프 잡음제거가 유용할 수 있다. 대안에서, 잡음제거된 데이터로부터 생성된 움직임 정보를 이용하여 본래 이미지 데이터를 코딩하면서, 잡음제거된 이미지 데이터가 움직임 추정을 위해 사용될 수 있다. 또한, 본 발명 자체의 알고리즘이 잡음제거를 위해 사용될 수 있다. 그러므로, 이웃하는 프레임들로부터의 변형들이, 잡음제거된 현재 프레임을 획득하기 위해 평균화될 수 있다.
도 1의 실시예에서 설명된 바와 같은 잔류 오차를 결정하기 위한 예측 코딩을 이용하는 대신에, 코딩하기 위한 상이한 방식들, 특히 움직임-보상된 시간적 필터링이 적용될 수 있다. 그렇게 하기 위해, 현재 프레임의 변형을 이용하여 이전 프레임을 추정하는 부가 정보 없이, 이미 전송된 움직임으로부터 인버스 변형이 도출될 수 있다. 이는, 조밀 움직임 벡터장의 재구성뿐만 아니라 네거티브 벡터들이 가리키는 포지션들에서의 상기 네거티브 벡터들의 포지셔닝, 그리고 궁극적으로, 인버팅된 벡터장을 규칙적 그리드 포지션들로 보간하기 위하여, Delaunay 삼각분할(triangulation)을 포함한다.
앞서 말한 것에서 설명된 바와 같은 본 발명은 몇몇의 장점들을 갖는다. 특히, 특정 데이터 세트들의 변형가능한 움직임이 동일한 잔류 오차로 더 적은 움직임 정보를 이용하여 표현될 수 있고, 이는 적절한 코더의 더 우수한 압축 성능을 야기한다. 코딩 정보(예컨대, 예측 코딩에서의 잔류 오차)가 더 우수한 에너지 압축을 위해 웨이블릿 변환과 같이 전체-이미지 변환을 겪는 경우, 본 발명의 방법에서 대략 동일한 잔류 오차로 블록킹 인공물들이 완벽하게 제거된다는 것이 유리하다.
포텐셜 장에 의한 움직임의 표현은 또한 몇몇의 다른 고유의 장점들을 갖는다. 상기 장점들은, 양자화와 같이 작은 변화들에 대한 파라미터 표현의 견고함을 포함한다. 기울기 계산으로부터 생긴 부동 소수점 벡터들로 인해, 움직임 벡터들에 대한 임의적인 서브-픽셀 정확성이 달성될 수 있다. 다른 장점은, 블록-기반 방식들에서 가능하지 않은 파라미터 샘플링 지점들의 선택을 통한 움직임 정보의 거의 임의적인 확장성(scalability)이다. 또한, 본 방법은 시간 방향에서 뿐만 아니라 다차원 데이터 세트들의 임의적인 공간적 방향에서도 사용될 수 있고 뿐만 아니라 볼륨 데이터를 변형시키기 위해 사용될 수 있다.
본 발명 및 그 선택적 개선들은 인코더 및/또는 디코더에 의해 구현될 수 있다. 본 발명의 방법 단계들은 인코더 및/또는 디코더 내의 모듈들에 의해 구현되고, 이로써 상기 모듈들은 소프트웨어로, 하드웨어로, 또는 소프트웨어 및 하드웨어의 결합으로 구현될 수 있다. 예컨대, 특정 방법 단계들은 프로세서 유닛에 부착된 메모리 내에 프로그램 코드로서 저장될 수 있다. 프로세서 유닛은 메모리 밖으로 프로그램 코드를 읽고, 프로그램 코드에 의한 본 발명의 방법 단계들을 실행한다. 부가하여, 인코더/디코더로부터의 데이터의 교환 및/또는 인코더/디코더로의 데이터의 교환을 지원하기 위해 입력 및/또는 출력 모듈이 프로세서 및/또는 메모리에 부착될 수 있다.
도 4는 인코더(COD) 및 디코더(DEC)에 기초하여 이미지들의 시퀀스를 인코딩 및 디코딩하기 위한 시스템의 예를 도시한다. 인코더(COD)는 코딩될 디지털 이미지들의 시퀀스(S)를 수신한다. 인코더는 시퀀스 내의 제1 이미지와 제2 이미지 사이의 움직임 파라미터들을 결정하기 위한 수단을 포함하고, 상기 움직임 파라미터들은, 상기 이미지들의 시퀀스를 코딩하기 위해 수행되는 움직임 보상을 위한 수단(M2)에서 사용된다. 움직임 파라미터들은 이미지들의 코딩된 시퀀스(CS) 내에 포함되고, 상기 이미지들의 코딩된 시퀀스(CS)는 디코더(DEC)에 전송된다. 수단(M1)은 복수의 이미지 포지션들에 대한 스칼라 값들을 갖는 스칼라장을 결정하기 위한 수단(M3)을 포함하고, 여기서 스칼라장은, 제2 이미지의 픽셀 값들과 제1의 움직임-보상된 이미지의 픽셀 값들 사이의 잔류 오차를 최소화시키는 스칼라장을 검색함으로써 결정되고, 여기서 상기 제1의 움직임-보상된 이미지는 상기에서 설명된 바와 같이 스칼라장으로부터 도출된 기울기 벡터들에 기초하여 결정된다.
디코더(DEC)는 이미지들의 코딩된 시퀀스(CS) 내에서 스칼라장을 추출하기 위한 수단(M4), 추출된 스칼라장으로부터 기울기 벡터들을 도출하기 위한 수단(M5), 및 도출된 기울기 벡터들에 기초하여 움직임 보상을 수행하기 위한 수단(M6)을 포함한다.
Figure pct00071

Claims (17)

  1. 디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법으로서,
    각각의 이미지는 동일한 이미지 포맷을 갖고, 픽셀 값들이 할당된 다수의 픽셀들을 포함하고, 제1 이미지(I1)와 제2 이미지(I2) 사이의 움직임 파라미터들(MP)이 결정되고, 상기 움직임 파라미터들(MP)에 기초하여, 상기 이미지들의 시퀀스(S)를 코딩하기 위해 움직임 보상(MC)이 수행되고, 상기 움직임 파라미터들(MP)은 이미지들의 코딩된 시퀀스(CS) 내에 포함되고,
    제1 이미지(I1)와 제2 이미지(I2) 사이의 상기 움직임 파라미터들(MP)은, 상기 이미지 포맷 내의 복수의 이미지 포지션들에 대한 스칼라 값들을 갖는 스칼라장(
    Figure pct00072
    )을 포함하고, 상기 스칼라장(
    Figure pct00073
    )은 상기 스칼라장(
    Figure pct00074
    )으로부터 도출된 기울기 벡터들(MV)이 상기 움직임 보상(MC)을 위한 움직임 벡터들에 대응하도록 결정되는,
    디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법.
  2. 제 1 항에 있어서,
    상기 스칼라장(
    Figure pct00075
    )은, 상기 제2 이미지(I2)의 픽셀 값들과 제1의 움직임-보상된 이미지의 픽셀 값들 사이의 잔류 오차를 최소화시키는 스칼라장(
    Figure pct00076
    )을 검색함으로써 결정되고, 상기 제1의 움직임-보상된 이미지는 상기 스칼라장(
    Figure pct00077
    )으로부터 도출된 기울기 벡터들(MV)에 기초하여 결정되는,
    디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법.
  3. 제 2 항에 있어서,
    상기 잔류 오차는 상기 제2 이미지(I2)와 상기 제1 이미지(I1) 사이의 절대 픽셀 값 차이들의 합에 의해 표현되고, 각각의 절대 픽셀 값 차이는 상기 제2 이미지(I2) 내의 제2 픽셀 포지션의 픽셀 값과 상기 제1 이미지(I1) 내의 제1 픽셀 포지션의 픽셀 값 사이의 절대 차이에 대응하고, 상기 제1 픽셀 포지션은 상기 제2 픽셀 포지션에서의 상기 스칼라장(
    Figure pct00078
    )의 샘플링된 버전의 상기 기울기 벡터(MV)에 의해 보상된 제2 픽셀 포지션에 대응하는,
    디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 스칼라장(
    Figure pct00079
    )은 상기 이미지 포맷 내의 픽셀들의 개수보다 더 적은 이미지 포지션들에 대한 스칼라 값들을 포함하고, 상기 스칼라장(
    Figure pct00080
    )의 샘플링된 버전은, 상기 스칼라장(
    Figure pct00081
    )의 업-샘플링된 버전을 보간함으로써 결정되는,
    디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법.
  5. 제 4 항에 있어서,
    상기 업-샘플링된 버전은 윈도우잉된 사인 함수, 특히 Lanczos 필터에 의해 보간되는,
    디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
    상기 스칼라장(
    Figure pct00082
    )은 비-선형 최소 제곱법 문제들에 대한 솔버(solver)에 의해, 특히 Gauss-Newton 알고리즘 및/또는 Levenberg-Marquardt 알고리즘에 의해 결정되는,
    디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법.
  7. 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
    상기 움직임 파라미터들(MP)은 변환 및/또는 데이터 압축, 특히 DCT(Discrete Cosine Transformation) 및/또는 Karhunen-Loeve 변환 및/또는 예측 코딩 및/또는 엔트로피 코딩을 겪는,
    디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법.
  8. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
    상기 움직임-보상(MC)이 예측 코딩을 위해 수행되고, 상기 스칼라장(
    Figure pct00083
    )으로부터 도출된 상기 기울기 벡터들(MV)에 의해 보상되는 상기 제1 이미지(I1)와 상기 제2 이미지(I2) 사이의 상기 잔류 오차(RE)가 결정되고, 바람직하게 데이터 압축, 특히 공간적 예측 코딩 및/또는 전체-이미지 변환 및/또는 엔트로피 코딩을 겪는,
    디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법.
  9. 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 움직임-보상(MC)은 움직임-보상된 시간적 필터링을 위해 수행되는,
    디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법.
  10. 제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
    상기 이미지들의 시퀀스(S)는 시간적으로 그 후의 이미지들 또는 공간적으로 그 후의 이미지들을 참조하는,
    디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법.
  11. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 이미지들의 시퀀스(S)는 의료 이미징 디바이스에 의해, 특히 CT 장비 및/또는 MRT 장비에 의해 생성된,
    디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법.
  12. 제 11 항에 있어서,
    상기 이미지들의 시퀀스(S)는 인간 또는 동물 조직, 특히 인간 또는 동물 기관을 포함하는 조직 내의 슬라이스들의 시간적 또는 공간적 시퀀스인,
    디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법.
  13. 디지털 이미지들의 시퀀스(S)를 코딩하기 위한 장치로서,
    각각의 이미지는 동일한 이미지 포맷을 갖고, 픽셀 값들이 할당된 다수의 픽셀들을 포함하고, 상기 장치는,
    제1 이미지(I1)와 제2 이미지(I2) 사이의 움직임 파라미터들(MP)을 결정하기 위한 수단(M1) ― 상기 움직임 파라미터들(MP)은 상기 이미지들의 시퀀스(S)를 코딩하기 위해 수행되는 움직임 보상(MC)을 위한 수단(M2) 내에서 사용되고, 상기 움직임 파라미터들(MP)은 이미지들의 코딩된 시퀀스(CS) 내에 포함됨 ―
    을 포함하고,
    상기 움직임 파라미터들(MP)을 결정하기 위한 수단(M1)은 상기 이미지 포맷 내의 복수의 이미지 포지션들에 대한 스칼라 값들을 갖는 스칼라장(
    Figure pct00084
    )을 결정하기 위한 수단(M3)을 포함하고, 상기 스칼라장(
    Figure pct00085
    )은 상기 스칼라장()으로부터 도출된 기울기 벡터들(MV)이 상기 움직임 보상(MC)을 위한 움직임 벡터들에 대응하도록 결정된,
    디지털 이미지들의 시퀀스(S)를 코딩하기 위한 장치.
  14. 제 13 항에 있어서,
    상기 장치(COD)는 제 2 항 내지 제 12 항 중 어느 한 항에 따른 방법을 수행하기 위해 배열된,
    디지털 이미지들의 시퀀스(S)를 코딩하기 위한 장치.
  15. 제 1 항 내지 제 12 항 중 어느 한 항에 따른 방법에 의해 코딩되는 디지털 이미지들의 시퀀스(CS)를 디코딩하기 위한 방법으로서,
    상기 이미지들의 코딩된 시퀀스(CS) 내에서 대응하는 제1 이미지(I1) 및 제2 이미지(I2)에 대한 하나 또는 그 초과의 스칼라장들(
    Figure pct00087
    )이 추출되고, 각각의 추출된 스칼라장(
    Figure pct00088
    )으로부터 기울기 벡터들(MV)이 도출되고, 움직임 보상(MC)이 도출된 기울기 벡터들(MV)에 기초하여 수행되고, 상기 이미지들의 디코딩된 시퀀스(S)가 야기되는,
    디지털 이미지들의 시퀀스(CS)를 디코딩하기 위한 방법.
  16. 제 1 항 내지 제 12 항 중 어느 한 항에 따른 방법에 의해 코딩되는 디지털 이미지들의 시퀀스를 디코딩하기 위한 장치로서,
    상기 이미지들의 코딩된 시퀀스(CS) 내에서 대응하는 제1 이미지(I1) 및 제2 이미지(I2)에 대한 하나 또는 그 초과의 스칼라장들(
    Figure pct00089
    )을 추출하기 위한 수단(M4), 각각의 추출된 스칼라장(
    Figure pct00090
    )으로부터 기울기 벡터들(MV)을 도출하기 위한 수단(M5) 및 도출된 기울기 벡터들(MV)에 기초하여 움직임 보상을 수행하기 위한 수단(MC)을 포함하고, 이미지들의 디코딩된 시퀀스(S)가 야기되는,
    디지털 이미지들의 시퀀스를 디코딩하기 위한 장치.
  17. 제 13 항 또는 제 14 항에 따른 장치와 제 16 항에 따른 장치를 포함하는 이미지들의 시퀀스(S)를 코딩 및 디코딩하기 위한 시스템.
KR1020147004738A 2011-07-25 2012-07-11 디지털 이미지들의 시퀀스를 코딩하기 위한 방법 KR20140057282A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP11175227 2011-07-25
EP11175227.5 2011-07-25
EP12153221A EP2552115A1 (en) 2011-07-25 2012-01-31 A method for coding a sequence of digital images
EP12153221.2 2012-01-31
PCT/EP2012/063548 WO2013013977A1 (en) 2011-07-25 2012-07-11 A method for coding a sequence of digital images

Publications (1)

Publication Number Publication Date
KR20140057282A true KR20140057282A (ko) 2014-05-12

Family

ID=45557937

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147004738A KR20140057282A (ko) 2011-07-25 2012-07-11 디지털 이미지들의 시퀀스를 코딩하기 위한 방법

Country Status (5)

Country Link
US (1) US9258561B2 (ko)
EP (1) EP2552115A1 (ko)
KR (1) KR20140057282A (ko)
CN (1) CN103688544B (ko)
WO (1) WO2013013977A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018169288A1 (ko) * 2017-03-13 2018-09-20 한국전자통신연구원 비디오 부/복호화를 위한 비정형 블록 기반 움직임 예측 및 보상 방법 및 그 장치

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2552115A1 (en) 2011-07-25 2013-01-30 Siemens Aktiengesellschaft A method for coding a sequence of digital images
US9442904B2 (en) * 2012-12-21 2016-09-13 Vmware, Inc. Systems and methods for applying a residual error image
US10542961B2 (en) 2015-06-15 2020-01-28 The Research Foundation For The State University Of New York System and method for infrasonic cardiac monitoring
US20210052186A1 (en) * 2018-03-20 2021-02-25 The Medical College Of Wisconsin, Inc. Method for real-time motion monitoring and dose accumulation in magnetic resonance guided therapies using simultaneous orthogonal plane imaging
WO2020054784A1 (ja) * 2018-09-11 2020-03-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法および復号方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7961963B2 (en) * 2005-03-18 2011-06-14 Sharp Laboratories Of America, Inc. Methods and systems for extended spatial scalability with picture-level adaptation
JP4808067B2 (ja) * 2006-04-24 2011-11-02 富士通株式会社 画像圧縮装置、画像圧縮プログラム、画像圧縮方法
US7945117B2 (en) * 2006-08-22 2011-05-17 Siemens Medical Solutions Usa, Inc. Methods and systems for registration of images
US8891831B2 (en) * 2010-12-14 2014-11-18 The United States Of America, As Represented By The Secretary Of The Navy Method and apparatus for conservative motion estimation from multi-image sequences
EP2552115A1 (en) 2011-07-25 2013-01-30 Siemens Aktiengesellschaft A method for coding a sequence of digital images

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018169288A1 (ko) * 2017-03-13 2018-09-20 한국전자통신연구원 비디오 부/복호화를 위한 비정형 블록 기반 움직임 예측 및 보상 방법 및 그 장치

Also Published As

Publication number Publication date
WO2013013977A1 (en) 2013-01-31
CN103688544B (zh) 2018-02-02
EP2552115A1 (en) 2013-01-30
US9258561B2 (en) 2016-02-09
CN103688544A (zh) 2014-03-26
US20140286589A1 (en) 2014-09-25

Similar Documents

Publication Publication Date Title
KR101901355B1 (ko) 최적화 함수를 이용하여 그래프 기반 예측을 수행하는 방법 및 장치
TWI681670B (zh) 影像處理方法、設備及系統
KR20140057282A (ko) 디지털 이미지들의 시퀀스를 코딩하기 위한 방법
JP4906864B2 (ja) スケーラブルビデオコーディング方法
US20140049607A1 (en) Devices and Methods for Sparse Representation of Dense Motion Vector Fields for Compression of Visual Pixel Data
TWI452907B (zh) 最佳化之解區塊濾波器
JP2004229315A (ja) 直交変換−ドメインブロックマッチングを用いる動き推定
JP2009510869A5 (ko)
KR20220070326A (ko) 비디오 코딩을 위한 변형 가능한 콘볼루션에 의한 예측 프레임 생성
CN108235020A (zh) 一种面向量化分块压缩感知的螺旋式逐块测量值预测方法
CN111724307B (zh) 一种基于最大后验概率和非局部低秩先验的图像超分辨重建方法,终端及可读存储介质
Trocan et al. Compressed sensing of multiview images using disparity compensation
US20110090963A1 (en) Method and apparatus for zoom motion estimation
JP5345138B2 (ja) 多格子スパース性ベースのフィルタリングのための方法及び装置
US10666960B2 (en) Method and device for performing graph-based transform using generalized graph parameter
CN114651270A (zh) 通过时间可变形卷积进行深度环路滤波
KR100208375B1 (ko) 동화상 부호화 방법 및 장치
Schnurrer et al. Analysis of displacement compensation methods for wavelet lifting of medical 3-D thorax CT volume data
JP5931747B2 (ja) 画像シーケンスのブロックの符号化および復元の方法
Weinlich et al. Representation of deformable motion for compression of dynamic cardiac image data
Zhao et al. Depth Coding Based on Compressed Sensing with Optimized Measurement and Quantization.
Park et al. Spatially adaptive high-resolution image reconstruction of low-resolution DCT-based compressed images
KR20110054425A (ko) 적응적 보간 필터를 이용한 부호화 장치, 그 방법 및 복호화 장치
US20240073425A1 (en) Image encoding apparatus and image decoding apparatus both based on artificial intelligence, and image encoding method and image decoding method performed by the image encoding apparatus and the image decoding apparatus
Thirumalai et al. Motion estimation from compressed linear measurements

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid