KR20140057282A - 디지털 이미지들의 시퀀스를 코딩하기 위한 방법 - Google Patents
디지털 이미지들의 시퀀스를 코딩하기 위한 방법 Download PDFInfo
- Publication number
- KR20140057282A KR20140057282A KR1020147004738A KR20147004738A KR20140057282A KR 20140057282 A KR20140057282 A KR 20140057282A KR 1020147004738 A KR1020147004738 A KR 1020147004738A KR 20147004738 A KR20147004738 A KR 20147004738A KR 20140057282 A KR20140057282 A KR 20140057282A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- image
- coding
- motion
- images
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/53—Multi-resolution motion estimation; Hierarchical motion estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/537—Motion estimation other than block-based
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
- H04N19/615—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 발명은 디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법을 지칭하고, 각각의 이미지는 동일한 이미지 포맷을 갖고, 픽셀 값들이 할당된 다수의 픽셀들을 포함하고, 여기서 제1 이미지(I1)와 제2 이미지(I2) 사이의 움직임 파라미터들(MP)이 결정되고, 여기서 상기 움직임 파라미터들(MP)에 기초하여, 이미지들의 시퀀스(S)를 코딩하기 위해 움직임 보상(MC)이 수행되고, 여기서 상기 움직임 파라미터들(MP)은 이미지들의 코딩된 시퀀스(CS) 내에 포함된다. 제1 이미지(I1)와 제2 이미지(I2) 사이의 움직임 파라미터들(MP)은, 이미지 포맷 내의 복수의 이미지 포지션들에 대한 스칼라 값들을 갖는 스칼라장()을 포함하고, 여기서 스칼라장()은, 상기 스칼라장()으로부터 도출된 기울기 벡터들(MV)이 움직임 보상(MC)을 위한 움직임 벡터들에 대응하도록 결정된다.
Description
본 발명은 디지털 이미지들의 시퀀스를 코딩하기 위한 방법 뿐만 아니라 디코딩하기 위한 대응하는 방법에 관한 것이다. 또한, 본 발명은 코딩 장치 및 디코딩 장치 뿐만 아니라 이미지들의 시퀀스를 코딩 및 디코딩하기 위한 시스템에 관련된다.
이미지들의 빠르고 효율적인 송신 및 저장을 위해, 이미지들의 공간적, 시간적 및 확률적 중복(redundancy)들을 활용하기 위하여 압축 알고리즘들이 사용된다. 비디오 코딩에서, 블록-기반 과도기적 움직임 예측 및 시간 방향으로의 보상을 이용할 때 공간적 변화(variation)들을 감소시키려고 애쓰는 블록-기반 움직임 보상 기술들이 알려져 있다. 그렇게 하기 위해, 이미지 시퀀스 내의 이전 이미지에 관련된 현재 이미지 내에 몇몇의 픽셀들을 포함하는 미리정의된 블록들의 움직임이 결정되고, 강도 차이 기준(intensity difference norm)이 최소화된다. 예측을 위한 이 움직임 정보를 이용하여, 훨씬 더 적은 변화를 포함하는 잔류 오차(residual error)만이, 디코더에서의 무손실 재구성을 획득하기 위하여 전송되어야 한다. 블록-기반 방법들은, 디코딩된 이미지 내의 블록 경계들에 블록 인공물(artifact)들을 생성하는 단점을 갖는다. 블록-기반 움직임 보상의 몇몇의 개선들, 예컨대 블록-크기 적응, 인트라-코딩(intra-coding)의 적응식 선택, 다수의 선행 및 후속 이미지로부터의 가중된 예측, 인-루프(in-loop) 필터링 등등이 종래 기술에서 설명된다.
블록-기반 움직임 보상 외에, 픽셀-기반 움직임 보상을 위한 방식들이 또한 있다. 이러한 움직임 보상에 의해, 픽셀-기반 움직임 벡터장들을 이용하여 임의적인 움직임이 설명될 수 있다. 이러한 방법들은, 움직임 벡터들의 많은 개수 때문에, 많은 부차적인 정보가 디코더에 전송되어야 하는 단점을 갖는다. 이러한 부차적인 정보를 감소시키기 위하여, 문서 [1]은, 각자의 예측 능력에 대한 중요한 움직임 벡터들만이 코딩되는, 조밀(dense) 움직임 벡터장들의 스파스(sparse) 표현을 설명한다.
본 발명의 목적은, 높은 코딩 효율성을 갖는, 디지털 이미지들의 시퀀스를 코딩하기 위한 방법을 제공, 즉 높은 압축 레이트로 우수한 품질의 디코딩된 이미지들을 제공하는 것이다.
이 목적은 독립 청구항들에 따라 해결된다. 바람직한 실시예들이 종속 청구항들에서 정의된다.
본 발명의 방법은 디지털 이미지들의 시퀀스를 코딩하기 위해 사용되고, 여기서 각각의 이미지는 동일한 이미지 포맷을 갖고, 픽셀 값들이 할당된 다수의 픽셀들을 포함한다. 동일한 이미지 포맷 때문에, 이미지 포맷 내의 각각의 픽셀은 각각의 이미지 내의 미리결정된 픽셀에 대응한다. 본 발명의 방법에 따라, 제1 이미지와 제2 이미지 사이의 움직임 파라미터들이 결정되고, 여기서 상기 움직임 파라미터들에 기초하여, 이미지들의 시퀀스를 코딩하기 위해 움직임 보상이 수행되고, 여기서 상기 움직임 파라미터들은 이미지들의 코딩된 시퀀스 내에 포함된다. 용어 "이미지"는 광범위하게 해석될 것이고, 픽셀들의 임의적인 어레이, 예컨대 2-차원 또는 3-차원 또는 더 고차원의 픽셀들의 어레이를 지칭할 수 있다.
본 발명에 따른 방법은 새로운 부류의 움직임 파라미터들에 의해 특징지어진다. 즉, 제1 이미지와 제2 이미지 사이의 움직임 파라미터들은 움직임 벡터들 대신에 스칼라장을 포함하고, 여기서 상기 스칼라장은 이미지 포맷 내의 복수의 이미지 포지션들에 대한 스칼라 값들을 갖는다. 그러한 이미지 포지션들은 픽셀 포지션들에 대응할 필요가 없다. 아래에 설명되는 바람직한 실시예에서, 스칼라장은, 이미지 포맷 내의 픽셀들의 개수보다 더 적은 다수의 이미지 포지션들에서 알려진 스칼라 값들을 포함한다. 본 발명에 따른 스칼라장은, 스칼라장으로부터 도출된 기울기 벡터들이 움직임 보상을 위한 움직임 벡터들에 대응하도록, 즉 기울기 벡터들이 움직임 벡터들과 동일하거나, 또는 기울기 벡터들을 팩터(factor)로 곱함으로써 움직임 벡터들이 결정될 수 있도록 결정된다. 기울기 벡터가 이미지 내에서 스칼라장의 잘-알려진 기울기에 의해 표현된다. 스칼라장의 정의 때문에, 기울기 벡터는 종래 기술 코딩 기술들에서 정의된 바와 같은 움직임 벡터에 대응한다.
본 발명의 코딩 방법은, 움직임 벡터들 대신에, 스칼라장이 이미지들의 코딩된 시퀀스 내에 포함되고, 따라서 부차적인 정보가 감소되고 더 높은 코딩 효율성이 야기된다는 장점을 갖는다. 또한, 본 발명의 방식이 이미지 블록들에 기초하지 않기 때문에, 블록킹 인공물들이 제거된다. 이는, 상관해제(decorrelation) 방법들이 코딩된 비트스트림 내의 정보, 예컨대 예측 코딩에서 계산된 예측 오차에 적용되는 경우에, 더 우수한 압축을 야기한다.
본 발명은, 이미지들의 특정 시퀀스들 내의 움직임 벡터들이 스칼라장에 기초하여 표현될 수 있다는 깨달음에 기초한다. 이러한 장은 바람직하게, 제2 이미지의 픽셀 값들과 제1의 움직임-보상된 이미지의 픽셀 값들 사이의 잔류 오차를 최소화시키는 스칼라장을 검색함으로써 결정되고, 여기서 제1의 움직임-보상된 이미지는 스칼라장으로부터 도출된 기울기 벡터들에 기초하여 결정된다. 즉, 스칼라장은 잔류 오차를 최소화시키는 최적화 문제의 솔루션에 기초하여 결정된다. 그러나, 실제 구현들에서, 절대 최소치가 반드시 발견되는 것은 아니다. 코딩 노력에 따라, 또한 차선-솔루션이 스칼라장에 대해 사용될 수 있다. 그럼에도 불구하고, 이러한 솔루션은 또한, 잔류 오차를 최소화시키는 스칼라장에 대한 검색에 의해 발견된다.
바람직한 실시예에서, 잔류 오차는 제2 이미지와 제1 이미지 사이의 절대 픽셀 값 차이들의 합에 의해 표현되고, 여기서 각각의 절대 픽셀 값 차이는 제2 이미지 내의 제2 픽셀 포지션의 픽셀 값과 제1 이미지 내의 제1 픽셀 포지션의 픽셀 값 사이의 절대 차이에 대응하고, 상기 제1 픽셀 포지션은 상기 제2 픽셀 포지션에서의 스칼라장의 샘플링된 버전의 기울기 벡터에 의해 보상된 제2 픽셀 포지션에 대응한다. 용어 "절대 차이"는 광범위하게 해석될 것이고, 예컨대 제곱된 차이들을 또한 포함할 수 있다. 특히 바람직한 실시예에서, 스칼라장은 이미지 포맷 내의 픽셀들의 개수보다 더 적은 이미지 포지션들에 대한 스칼라 값들을 포함하고, 여기서 스칼라장의 샘플링된 버전은, 스칼라장의 업-샘플링(up-sampling)된 버전을 보간함으로써 결정된다. 이러한 실시예에서, 감소된 개수의 스칼라 값들을 포함하는 스칼라장의 사용 때문에 디코딩을 위해 전송될 부차적인 정보가 감소된다. 위의 실시예의 바람직한 변형에서, 스칼라장의 업-샘플링된 버전은, 윈도우잉(windowing)된 사인 함수, 특히 Lanczos 필터에 의해 보간된다. 다른 보간 기술들, 예컨대 스플라인 보간이 또한 사용될 수 있다.
본 발명에서 사용되는 스칼라장을 결정하기 위하여, 비-선형 최소 제곱법(non-linear least squares) 문제들에 대한 잘-알려진 솔버(solver)들, 예컨대 (반복) Gauss-Newton 알고리즘 및/또는 Levenberg-Marquardt 알고리즘이 사용될 수 있다. 본 발명의 다른 실시예에서, 움직임 파라미터들(즉, 스칼라장)은 변환 및/또는 데이터 압축, 특히 DCT(Discrete Cosine Transformation) 및/또는 Karhunen-Loeve 변환 및/또는 예측 코딩 및/또는 엔트로피 코딩을 겪는다. 이러한 실시예 때문에, 코딩 효율성이 향상된다.
본 발명의 방법에서 수행되는 움직임 보상은 잘-알려진 코딩 기술들에 대해 사용될 수 있다. 특히, 움직임-보상은 예측 코딩에 대해 수행될 수 있고, 여기서 도출된 기울기 벡터들에 의해 보상되는 제1 이미지와 제2 이미지 사이의 잔류 오차가 결정되고, 바람직하게 데이터 압축, 특히 공간적 예측 코딩 및/또는 웨이블릿 분해와 같은 전체 이미지 변환 및/또는 엔트로피 코딩을 겪는다. 그럼에도 불구하고, 움직임 보상은 또한, 움직임-보상된 시간적 필터링과 결합될 수 있다.
바람직한 실시예에서, 본 발명에 의해 코딩된 이미지들의 시퀀스는 시간적으로 그 후의 이미지들을 참조한다. 그럼에도 불구하고, 본 발명은 공간적으로 그 후의 이미지들의 시퀀스에 또한 적용가능하다.
특히 바람직한 실시예에서, 이미지들의 시퀀스는 의료 데이터, 즉 의료 이미징 디바이스에 의해, 특히 CT(Computed Tomography) 장비 및/또는 MRT(Magnetic Resonance Tomography) 장비에 의해 생성된 데이터에 기초한다. 이러한 실시예에서, 이미지들의 시퀀스는 바람직하게, 인간 또는 동물 조직, 특히 인간 또는 동물의 기관, 예컨대 심장을 포함하는 조직 내의 슬라이스들의 시간적 또는 공간적 시퀀스이다.
위의 방법 외에, 본 발명은 디지털 이미지들의 시퀀스를 코딩하기 위한 장치를 또한 포함하고, 각각의 이미지는 동일한 이미지 포맷을 갖고, 픽셀 값들이 할당된 다수의 픽셀들을 포함한다. 장치는, 제1 이미지와 제2 이미지 사이의 움직임 파라미터들을 결정하기 위한 수단을 포함하고, 상기 움직임 파라미터들은 이미지들의 시퀀스를 코딩하기 위해 수행되는 움직임 보상을 위한 수단 내에서 사용되고, 여기서 상기 움직임 파라미터들은 이미지들의 코딩된 시퀀스 내에 포함된다. 이러한 장치에서, 움직임 파라미터들을 결정하기 위한 수단은 이미지 포맷 내의 복수의 이미지 포지션들에 대한 스칼라 값들을 갖는 스칼라장을 결정하기 위한 수단을 포함하고, 여기서 스칼라장은 스칼라장으로부터 도출된 기울기 벡터들이 움직임 보상을 위한 움직임 벡터들에 대응하도록 결정된다. 장치는 바람직하게, 본 발명에 따른 방법의 바람직한 실시예들 중 하나 또는 그 초과를 수행하기 위해 배열된다.
또한, 본 발명은 본 발명의 코딩 방법 또는 이러한 코딩 방법의 하나 또는 그 초과의 바람직한 실시예들에 의해 코딩되는 디지털 이미지들의 시퀀스를 디코딩하기 위한 방법에 관련된다. 이러한 디코딩 방법에서, 이미지들의 코딩된 시퀀스 내에서 대응하는 제1 이미지 및 제2 이미지에 대한 하나 또는 그 초과의 스칼라장들이 추출되고, 각각의 추출된 스칼라장으로부터 기울기 벡터들이 도출되고, 여기서 움직임 보상은 도출된 기울기 벡터들에 기초하여 수행되고, 이미지들의 디코딩된 시퀀스가 야기된다.
또한, 본 발명은 본 발명의 코딩 방법 또는 본 발명에 따른 코딩 방법의 하나 또는 그 초과의 바람직한 실시예들에 의해 코딩되는 디지털 이미지들의 시퀀스를 디코딩하기 위한 장치에 관련된다. 장치는, 이미지들의 코딩된 시퀀스 내에서 대응하는 제1 이미지 및 제2 이미지에 대한 하나 또는 그 초과의 스칼라장들을 추출하기 위한 수단, 각각의 추출된 스칼라장으로부터 기울기 벡터들을 도출하기 위한 수단 및 도출된 기울기 벡터들에 기초하여 움직임 보상을 수행하기 위한 수단을 포함하고, 이미지들의 디코딩된 시퀀스가 야기된다.
또한, 본 발명은 위에서 설명된 코딩 장치 및 위에서 설명된 디코딩 장치를 포함하는, 이미지들의 시퀀스를 코딩 및 디코딩하기 위한 시스템을 포함한다.
본 발명의 실시예들은 동반된 도면들에 대하여 이제 상세히 설명될 것이다.
도 1은 본 발명의 실시예에 따른 코딩 방법을 예시하는 블록도를 도시한다.
도 2는 본 발명의 실시예에 따른 디코딩 방법을 예시하는 블록도를 도시한다.
도 3은 종래 기술 방법들과 비교할 때 본 발명의 실시예에 따른 코딩의 품질을 예시하는 도면들을 도시한다.
도 4는 본 발명의 실시예에 기초한 코딩 및 디코딩을 위한 시스템을 예시하는 블록도이다.
도 1은 본 발명의 실시예에 따른 코딩 방법을 예시하는 블록도를 도시한다.
도 2는 본 발명의 실시예에 따른 디코딩 방법을 예시하는 블록도를 도시한다.
도 3은 종래 기술 방법들과 비교할 때 본 발명의 실시예에 따른 코딩의 품질을 예시하는 도면들을 도시한다.
도 4는 본 발명의 실시예에 기초한 코딩 및 디코딩을 위한 시스템을 예시하는 블록도이다.
아래에서는, 본 발명의 실시예가 CT 장비에 의해 찍힌 의료 이미지들의 시퀀스에 대하여 설명될 것이고, 여기서 각각의 이미지는 인간 조직 내의 복수의 복셀들의 볼륨을 표현하는 소위 슬라이스이다. 이미지들의 시퀀스가 시간적 시퀀스여서, 그 후의 이미지들은 인간 조직 내의 동일한 포지션이지만 상이한 시점들에 찍힌 이미지들을 지칭한다. 따라서, 이미지들은 픽셀들의 시간적으로 후속하는 2-차원 어레이들을 지칭한다. 그러나, 본 발명은 픽셀들의 3-차원 어레이들 및/또는 인간 조직으로부터 찍힌 공간적으로 후속하는 슬라이스들의 시퀀스에 또한 적용가능하다.
각각의 슬라이스 내의 복셀들은 시간에 따라 움직이는 인간 기관들의 조직 밀도들을 표현하고, 여기서 조직 밀도들은 복셀들의 각각의 픽셀 값들에 의해 표현된다. 본 발명의 일 실시예에서, 인간 심장의 생리적 근육 조직에 대한 변형가능한 움직임을 나타내는 심장 CT 데이터의 시간적 시퀀스가 본 발명에 기초하여 코딩된다. 원리적으로, 본 발명은 이미지들의 시퀀스가 변형가능한 움직임을 포함하는 임의적인 종류의 데이터에 적용가능하다. 종래 기술과 반대로, 본 발명은, 이전 이미지 내의 어느 포지션으로부터 블록들이 시프트되었는지를 나타내는 움직임 벡터들을 이용하는 블록-기반 움직임 보상에 기초하지 않는다. 대신에, 두 개의 시간적으로 후속하는 이미지들 사이의 조직 변형을 표현하기 위해 파라미터들의 세트가 정의된다. 그런 다음, 이러한 파라미터들은 저-에너지 예측 오차 이미지를 야기하도록 최적화된다.
그렇게 하기 위해, 후속 슬라이스들 사이의 움직임 보상을 위해 사용되는 밀도 움직임 벡터장을 도출하기 위하여 스칼라장이 사용된다. 조밀 움직임 벡터장 은 시퀀스의 시간적으로 후속하는 (제2) 이미지의 이미지 함수 내의 각각의 복셀 포지션 에 대해 나타내고, 여기서 복셀의 그레이 레벨은 (제1) 선행 이미지의 시간적으로 선행하는 이미지 함수 내에 위치되었다. 따라서, 조밀 움직임 벡터장의 벡터들은 로부터 로의 복셀 시프트를 나타내는 네거티브 벡터들이다. 가독성을 위해, 애매성이 없을 때, 위의 함수들의 파라미터 는 생략될 것이다. 가 흐름장(flow field)으로서 보일 때, 각각의 포지션에서의 그 소스 또는 싱크(sink) 특성이 발산
을 이용하여 계산될 수 있고, 여기서 는 미분 연산자이고, 는 내적을 표기하고, 슬라이스 도메인 은 슬라이스의 복셀 포지션들 전부를 포함한다. 본 명세서에서 설명되는 바와 같은 방법에서 프로세싱되는 이미지들에서, 는 조직의 변형을 설명한다. 결과로서, 발산은, 소스 및 싱크 특성 대신에, 국부적 조직 팽창 및 수축에 대한 측정치(measure)로서 해석될 수 있다. 다른 벡터장 특성은 로 불리고, 상기 은 흐름장 내의 특정 포지션에 있는 물체가 얼마나 많이 회전하기 시작하는지를 설명한다.
예컨대 심장 획득(heart acquisition)들에서의 조직 움직임은, 팽창 또는 수축만 할 수 있고 서로에 대해 각자의 포지션들을 시프트할 수 없는 근육 세포들에 의해 유발된다. 그러므로, 벡터장 의 은 내의 각각의 포지션에서 0이다. 그러한 벡터장들은 보존적 또는 비회전으로 불린다. 벡터 계산으로부터, 보존적 벡터장들이 포텐셜 로 불리는 스칼라 함수의 기울기로서 완벽하게 표현될 수 있음이 알려져 있고:
따라서, (1)을 이용하여,
근육 수축들은 조직의 국부적 이웃들에서 비슷한데, 즉 근육 수축들은 슬라이스 도메인 사이에서 느리게만 변한다. 그 이유는, 그러한 수축들이 뉴런들로부터의 조악하게(coarsely) 위치된 전기 임펄스들만에 의해 개시되기 때문이다. 슬라이스 도메인 사이에서의 의 변화 레벨은 자신의 기울기 크기에 의해 표현될 수 있다
결과로서, 본 명세서에서 설명되는 바와 같은 방법에 의해 코딩되는 이미지들 내에서, 스칼라 포텐셜 장 이 결정될 수 있고, 이러한 장의 기울기에 기초하여, 조밀 움직임 벡터장이 도출될 수 있다.
본 명세서에서 설명되는 바와 같은 본 발명의 실시예에서, 이러한 포텐셜 장의 다운-샘플링된 버전 이 결정되고 움직임 보상을 위해 사용된다. 그러한 다운-샘플링된 버전이 사용될 수 있는데, 그 이유는 근육 변형이 국부적 구역들에서 유사하여, 매우 평탄한 함수인 포텐셜 함수가 야기되기 때문이다. 를 결정한 이후, 움직임 벡터장 가 로부터, 업-샘플링하고 로 보간하고 그 이후 기울기 를 계산할 때, 재구성될 수 있다(방정식 (2)와 비교하라). 본 명세서에서 설명되는 바와 같은 실시예에서, 이상적인 사인 보간 커넬(kernel)의 윈도우잉 버전인, 세 개의 로브(lobe)들을 갖는 2-D Lanczos 필터 가 사용된다. 후속 픽셀들의 거리가 1이고 업-샘플링된 함수 내의 샘플링 지점들 사이의 거리가 d 픽셀들인 픽셀 도메인에서, 보간 커넬은 아래와 같이 기록될 수 있는데:
Lanczos 필터는 제2 차수(second order)로 미분 가능하고, 그러므로 평탄함과 계산의 복잡성 사이의 트레이드-오프이다.
상기에 따라, 본 명세서에 설명되는 본 발명의 주요 목적은, 를 근사화하기 위하여 의 최선 변형에 대한 변형 파라미터들(즉, 다운-샘플링된 포텐셜 장) 를 찾는 것이다. 이를 달성하기 위해, 반복 최적화 알고리즘이 구현된다. 이러한 알고리즘은 를 바로 계산하는 것이 아니라, 각자의 유발된 예측 오차에 대해, 이러한 오차가 최소치를 달성할 때까지 상이한 가능한 함수들 을 체크한다. 수학적으로, 이는, 제곱된 차이들의 합의 최소화를 야기하고, 따라서 와 의 변형 사이의 MSE(mean squared error)를 야기하는데, 즉 :
여기서, 는 의 업-샘플링된 버전이고, 은 컨볼루션을 표기한다. 본 명세서에 설명되는 바와 같은 실시예에서, 최소화 문제는 비-선형 최소 제곱법 문제들에 대한 잘-알려진 반복 Gauss-Newton 알고리즘에 의해 풀린다. 그러나, 다른 알고리즘들, 예컨대 잘-알려진 Levenberg-Marquardt 알고리즘이 사용될 수 있다. 블록-기반 움직임 추정으로부터의 움직임 벡터 성분들과 반대로, 다운-샘플링된 포텐셜 함수가 강하게 상관되고, 그래서 추가 상관해제를 위해, 바람직한 실시예에서 부가의 변환 또는 공간적 예측이 적용된다. 또한, 기울기 계산이 비-정수 벡터들을 생성하기 때문에, 블록-기반 움직임 보상과 대조적으로, 에서의 쌍일차(bilinear) 보간을 이용한 움직임 보상이 부가의 저장 요구들 없이 서브-복셀의 정확한 움직임을 표현하는 를 허용한다.
본 명세서에서 설명되는 실시예에서 사용되는 Gauss-Newton 알고리즘에서, Jacobian 행렬이 계산되고, 상기 Jacobian 행렬은 차원 행렬 (픽셀들의 개수) × (파라미터들의 개수)로 되는, 파라미터들 각각에 대한 픽셀 값들의 편도함수들을 포함한다. 파라미터들은 다운-샘플링된 스칼라장 에 따라 이미지 내의 샘플링 지점들의 개수에 의해 표현된다. 전향 차분들을 이용하여 도함수들이 계산되는데, 즉 각각의 추정 단계에서, 잔류 오차에 관한 각각의 파라미터에 대한 영향이 이러한 파라미터가 소량만큼 증가될 때 계산된다. 이러한 잔류 오차의 변화는 하나의 열로서 행렬에 삽입된다. 이러한 행렬로부터 그리고 현재 잔류 오차 이미지로부터, 추정 방법은, 파라미터들의 세트가, 파라미터들의 최선 세트 및 그에 따른 최소 잔류 오차 이미지로 수렴되기 위하여 이 단계에서 얼마나 변화될 것인지를 계산하고, 고정된 개수의 파라미터들이 제공된다.
그 이후, 파라미터들이 따라서 변화되고, 다음 차례의 반복 동안에, 잔류가 새로 계산된다. 특히 효율적인 구현을 위해, 잔류 오차의 변화는, 최적화 단계 사이즈로 가중된 채로, 업-샘플링 필터의 기울기가 파라미터 포지션에서 재구성된 벡터장에 부가되도록 계산될 수 있다. 이러한 부가가 벡터장을 변화시키는(즉, 이러한 기울기가 0과 동일하지 않은) 포지션들에서, 움직임 보상이 다시 수행되고, 이러한 새로운 추정과 파라미터 변화가 없는 추정의 차이가 스파스 Jacobian 행렬에 삽입된다.
위의 의사 코드에 따라, 소수의 파라미터들만이 정의되고, 그래서 최적화는 매우 견고하다. 의사 코드에서의 최적화가 라인 4에서 시작하는 루프에 포함된다. 중요한 선택은 내의 값들의 개수, 즉 각각의 이미지 내에서 다운-샘플링된 스칼라 장 의 샘플링 지점들의 개수이다. 이러한 개수는 움직임 정보의 양을 스케일링한다. 의 사이즈를 증가시키는 것은 예측 오차 정보를 감소시킨다. 그러나, 이러한 트레이드-오프에 대한 결정은, 와 예측 오차 둘 다에 대한 그 후의 코딩 방법들에 따라 좌우된다. 발명자들에 의해 수행된 테스트들에서, 최적화 단계 사이즈가 0.2가 되도록 선택된 반면에, 반복들의 개수는 최대 100으로 제한되었다. 이는, 정확한 근사화들을 위한 우수한 선택이다. 더 낮은 계산의 복잡성을 위해, 반복들의 최대 개수가 감소될 수 있는 동안에 단계 사이즈가 또한 증가될 수 있다.
위의 의사 코드에서의 Gauss-Newton 최적화를 위해, Jacobian 행렬이 앞서 설명된 바와 같이 계산되어야 한다. Jacobian 행렬은, 전향 차분들을 이용하여 획득된다. 이는, 각각의 반복에서, 방정식 (6)의 차이에 대한 내의 값 의 작은 증가의 영향(의사 코드의 라인 11을 보라)이 각각의 값 (즉, 샘플링 포지션 i에서의 스칼라 함수의 값)에 대해 계산됨을 의미한다. 그러나, 성능 이유들로, 라인 15에서의 이러한 차이는 Lanczos 필터가 동작하는 현재 샘플링 포지션 주위의 범위 내에서만 평가된다. 더 멀리 있는 포지션들에서, 차이는 어떻든 0인데, 그 이유는 내의 값의 변화가 국부적 영향만을 갖기 때문이다. 따라서, 움직임 보상이 이러한 국부적 이웃으로만 제약될 수 있다. 다른 성능 이득은, 초기화 동안 이미 사전에 내의 국부적 변화를 계산함으로써 달성된다. 그렇게 하기 위해, 위의 의사 알고리즘의 라인 10 내지 13이, 내의 대응하는 구역에의 이러한 변화 함수의 단순한 부가로 교체된다. 이것은 가능한데, 그 이유는 Lanczos 필터링 및 기울기 계산이 선형 연산들이고 따라서 고정된 단계 사이즈에 대해 변화가 일정하기 때문이다. 또한, Jacobian은 스파스 행렬이고, 그래서 Jacobian은 구현에서 보통 말하는 그렇게 취급되어야 하는데, 즉 메모리 내에 0들이 저장되지 않아야 하고 0들과의 곱셈들이 계산되지 않아야 한다. 궁극적으로, 수치적 안정성을 위해, 물론 라인 17에서의 인버전(inversion)이 명시적으로 수행되는 것이 아니라 선형 방정식들의 시스템이 풀려야 한다. 그 외에, 예컨대 단일-강도 배경들을 갖는 몇몇의 데이터 세트들에 대해, 인버전은 불량 조건이고 그래서 규칙화를 요구한다.
도 1은 스칼라장 의 위에서 설명된 추정에 기초한 이미지들의 시퀀스의 전체 코딩을 예시하는 블록도를 도시한다. 스칼라 포텐셜 장에 기초하여 움직임 벡터들을 계산하기 위한 변형가능한 움직임 추정을 지칭하는 이 도면의 부분이 블록(DME) 내에 포함된다. 코딩 방법의 입력은 도 1에서 S로서 표기된 이미지들의 시퀀스이다. 시퀀스 내의 제2 이미지(I2)를 코딩하기 위하여, 선행하는 제1 이미지(I1)가 사용되고, 상기 제1 이미지(I1)는 버퍼(z)로부터 취해진다. 그러한 제1 이미지 및 제2 이미지에 기초하여, 위에서 설명된 파라미터 추정(PE)이 수행되고, 스칼라 포텐셜 함수 의 다운-샘플링된 값들을 표현하는 움직임 파라미터들(MP)이 야기된다. 도 1의 실시예에서, 그러한 파라미터들은 예컨대 DCT를 통해 변환된다. 저장을 위해, 단계(PE)에서 수행된 최적화로부터의 부동 소수점 값들이 선택적으로 정수들로 양자화될 수 있다. 샘플링 지점들 사이의 훨씬 먼 거리, 예컨대 16개 복셀들 때문에, 움직임 벡터 정확성에 대한 이러한 양자화의 영향은 서브-복셀 범위 내에만 있고, 미미하게만 예측 오차에 영향을 끼친다. 그 이후, 변환(T)으로부터 생긴 움직임 정보(MI)가 엔트로피 코더(EC)에 의해 무손실로 코딩되고, 이미지들의 코딩된 시퀀스(CS)의 일부를 형성한다.
도 1의 실시예에 따라, 픽처(I2)와 픽처(I1) 사이의 잔류 오차의 예측 코딩이 수행된다. 그렇게 하기 위해, 움직임 정보(MI)는 인버스 변환(IT)을 겪고, 재구성된 스칼라장 이 야기된다. 이러한 스칼라장은 업-샘플링 및 Lanczos 필터링(LU)을 겪는데, 즉 방정식 (6)으로부터의 수식 의 값이 구해진다. 이는, 보간 및 업-샘플링된 스칼라장 를 야기한다. 이러한 스칼라장에 기초하여, 기울기 벡터들이 단계(GC)에서 계산된다. 이러한 계산은 각각의 픽셀에 대한 대응하는 움직임 벡터들(MV)을 제공한다. 이러한 움직임 벡터들에 기초하여, 제1 이미지(I1)에 대한 움직임 보상(MC)이 수행되고, 움직임-보상된 제1 이미지(I1')가 야기된다. 그 이후, I2와 I1' 사이의 차이가 계산되고, 엔트로피 인코더(EC)에서 엔트로피 인코딩되는 잔류 오차(RE)가 야기된다. 이러한 잔류 오차(RE)는 또한, 코딩된 이미지들의 시퀀스(CS)를 표현하는 비트스트림의 일부이다. 본 발명의 다른 실시예에서, 잔류 오차는 부가적으로, 엔트로피 코딩 이전에 예컨대 웨이블릿 코딩에 기초하여 또는 JPEG-LS에 기초한 예측 코딩에 기초하여 코딩될 수 있다.
도 2는 도 1의 코딩 방법에 의해 생성된 코딩된 비트스트림(CS)을 디코딩하는 프로세스를 설명하는 블록도를 도시한다. 움직임 벡터들을 디코딩하기 위한 단계들은 블록(MD) 내에 포함된다. 처음에는, 엔트로피 디코딩이 코딩된 비트스트림에 적용되고, 변환된 포텐셜 함수 를 포함하는 움직임 정보(MI)가 야기된다. 이러한 움직임 정보는 인버스 변환(IT)을 겪고, 다운-샘플링된 스칼라 포텐셜 함수 를 포함하는 움직임 파라미터들(MP)이 야기된다. 이러한 움직임 파라미터들은 도 1과 유사하게 Lanczos 업-샘플링(LU)을 겪고, 업-샘플링된 스칼라 포텐셜 장 이 야기되며, 그 이후 상기 업-샘플링된 스칼라 포텐셜 장 은 또한 도 1과 유사하게 기울기 계산(GC)을 겪는다. 결과적으로, 움직임 벡터들(MV)이 재구성된다. 그러한 움직임 벡터들은, 스토리지(z)로부터 취해진 이전 이미지(I1)에 기초하여 움직임-보상된 예측 이미지(I1')를 계산하기 위해 움직임 보상(MC)에서 사용된다. 이러한 예측 이미지(I1')는, 엔트로피 디코딩(ED)에 의해 획득된 잔류 오차(RE)와 결합된다. 결과적으로, 디코딩된 이미지(I2) 및 그에 따른 디코딩된 비트스트림(S)이 생성된다.
도 3은 인간 심장의 CT 이미지들을 코딩하기 위해 사용되는 본 발명의 실시예의 결과들을 도시한다. 도 3은 두 개의 도면들(D1 및 D2)을 포함하고, 여기서 도면들 둘 다의 가로 좌표 PV(parameter values)는 픽셀/복셀마다 스칼라 포텐셜 함수 의 값들의 개수를 표현한다. 도면들 둘 다의 라인(L1)은 본 발명의 실시예를 지칭하고, 라인(L2)은 종래 기술에 따른 블록-기반 움직임 보상을 지칭하고, 라인(L3)은 0 움직임 벡터들을 이용한 코딩을 지칭한다. 도면(D1)에서, 파라미터 값들(PV)에 따라 좌우되는 PSNR(peak signal-to-noise ratio)에 기초한 예측 품질이 도시된다. PSNR의 값이 더 높을수록, 예측 품질이 더 우수하다. 분명히, 본 발명의 방법의 예측 품질은 블록-기반 움직임 보상의 예측 품질과 유사하다. 도면(D2)에서, 예측 오차(RE)가 전체-슬라이스 DCT를 겪도록 한 이후의 변환 코딩 이득이 도시된다. 본 발명에 따른 코딩 방법에서의 블록 인공물들의 부재로 인해, 블록-기반 움직임 보상과 비교할 때 현저하게 더 높은 이득이 달성된다.
앞서 말한 것에서 설명된 바와 같은 본 발명은 몇몇의 옵션들에 의해 개선될 수 있다. 포텐셜 장의 파라미터들(즉, 다운-샘플링된 값들)을 추정하기 위한 단계에서, 장 내의 파라미터 개수 및 샘플링 포지션들이 또한, 파라미터 상관을 감소시키고 최소 움직임 정보를 이용하여 근사화를 추가로 개선하기 위하여 최적화를 겪을 수 있다. 이는, 불규칙적 샘플링 그리드를 야기한다. 그러한 그리드를 이용할 때, 샘플링 포지션들은 코딩된 비트스트림 내에서 전송되어야 하고, 이는 문서 [1]의 방법과 유사하게 수행될 수 있다. 그곳에, 단순한 실행-레벨 인코딩 또는 대안적으로 최적 루트 계산과 같은 더욱 복잡한 알고리즘들이 적용된다.
추가 개선에서, 데이터가 CT 재구성들에서와 같이 상관된 잡음을 포함한다면, 움직임 보상에 앞서 잡음제거(denoising)가 수행될 수 있고, 여기서 잡음은 이러한 상관을 활용할 수 있는 알고리즘과 별개로 코딩되고, 그래서 변형은 그러한 상관들을 제거하지 않는다. 잡음이 상관되지 않더라도, 적어도 인-루프 잡음제거가 유용할 수 있다. 대안에서, 잡음제거된 데이터로부터 생성된 움직임 정보를 이용하여 본래 이미지 데이터를 코딩하면서, 잡음제거된 이미지 데이터가 움직임 추정을 위해 사용될 수 있다. 또한, 본 발명 자체의 알고리즘이 잡음제거를 위해 사용될 수 있다. 그러므로, 이웃하는 프레임들로부터의 변형들이, 잡음제거된 현재 프레임을 획득하기 위해 평균화될 수 있다.
도 1의 실시예에서 설명된 바와 같은 잔류 오차를 결정하기 위한 예측 코딩을 이용하는 대신에, 코딩하기 위한 상이한 방식들, 특히 움직임-보상된 시간적 필터링이 적용될 수 있다. 그렇게 하기 위해, 현재 프레임의 변형을 이용하여 이전 프레임을 추정하는 부가 정보 없이, 이미 전송된 움직임으로부터 인버스 변형이 도출될 수 있다. 이는, 조밀 움직임 벡터장의 재구성뿐만 아니라 네거티브 벡터들이 가리키는 포지션들에서의 상기 네거티브 벡터들의 포지셔닝, 그리고 궁극적으로, 인버팅된 벡터장을 규칙적 그리드 포지션들로 보간하기 위하여, Delaunay 삼각분할(triangulation)을 포함한다.
앞서 말한 것에서 설명된 바와 같은 본 발명은 몇몇의 장점들을 갖는다. 특히, 특정 데이터 세트들의 변형가능한 움직임이 동일한 잔류 오차로 더 적은 움직임 정보를 이용하여 표현될 수 있고, 이는 적절한 코더의 더 우수한 압축 성능을 야기한다. 코딩 정보(예컨대, 예측 코딩에서의 잔류 오차)가 더 우수한 에너지 압축을 위해 웨이블릿 변환과 같이 전체-이미지 변환을 겪는 경우, 본 발명의 방법에서 대략 동일한 잔류 오차로 블록킹 인공물들이 완벽하게 제거된다는 것이 유리하다.
포텐셜 장에 의한 움직임의 표현은 또한 몇몇의 다른 고유의 장점들을 갖는다. 상기 장점들은, 양자화와 같이 작은 변화들에 대한 파라미터 표현의 견고함을 포함한다. 기울기 계산으로부터 생긴 부동 소수점 벡터들로 인해, 움직임 벡터들에 대한 임의적인 서브-픽셀 정확성이 달성될 수 있다. 다른 장점은, 블록-기반 방식들에서 가능하지 않은 파라미터 샘플링 지점들의 선택을 통한 움직임 정보의 거의 임의적인 확장성(scalability)이다. 또한, 본 방법은 시간 방향에서 뿐만 아니라 다차원 데이터 세트들의 임의적인 공간적 방향에서도 사용될 수 있고 뿐만 아니라 볼륨 데이터를 변형시키기 위해 사용될 수 있다.
본 발명 및 그 선택적 개선들은 인코더 및/또는 디코더에 의해 구현될 수 있다. 본 발명의 방법 단계들은 인코더 및/또는 디코더 내의 모듈들에 의해 구현되고, 이로써 상기 모듈들은 소프트웨어로, 하드웨어로, 또는 소프트웨어 및 하드웨어의 결합으로 구현될 수 있다. 예컨대, 특정 방법 단계들은 프로세서 유닛에 부착된 메모리 내에 프로그램 코드로서 저장될 수 있다. 프로세서 유닛은 메모리 밖으로 프로그램 코드를 읽고, 프로그램 코드에 의한 본 발명의 방법 단계들을 실행한다. 부가하여, 인코더/디코더로부터의 데이터의 교환 및/또는 인코더/디코더로의 데이터의 교환을 지원하기 위해 입력 및/또는 출력 모듈이 프로세서 및/또는 메모리에 부착될 수 있다.
도 4는 인코더(COD) 및 디코더(DEC)에 기초하여 이미지들의 시퀀스를 인코딩 및 디코딩하기 위한 시스템의 예를 도시한다. 인코더(COD)는 코딩될 디지털 이미지들의 시퀀스(S)를 수신한다. 인코더는 시퀀스 내의 제1 이미지와 제2 이미지 사이의 움직임 파라미터들을 결정하기 위한 수단을 포함하고, 상기 움직임 파라미터들은, 상기 이미지들의 시퀀스를 코딩하기 위해 수행되는 움직임 보상을 위한 수단(M2)에서 사용된다. 움직임 파라미터들은 이미지들의 코딩된 시퀀스(CS) 내에 포함되고, 상기 이미지들의 코딩된 시퀀스(CS)는 디코더(DEC)에 전송된다. 수단(M1)은 복수의 이미지 포지션들에 대한 스칼라 값들을 갖는 스칼라장을 결정하기 위한 수단(M3)을 포함하고, 여기서 스칼라장은, 제2 이미지의 픽셀 값들과 제1의 움직임-보상된 이미지의 픽셀 값들 사이의 잔류 오차를 최소화시키는 스칼라장을 검색함으로써 결정되고, 여기서 상기 제1의 움직임-보상된 이미지는 상기에서 설명된 바와 같이 스칼라장으로부터 도출된 기울기 벡터들에 기초하여 결정된다.
디코더(DEC)는 이미지들의 코딩된 시퀀스(CS) 내에서 스칼라장을 추출하기 위한 수단(M4), 추출된 스칼라장으로부터 기울기 벡터들을 도출하기 위한 수단(M5), 및 도출된 기울기 벡터들에 기초하여 움직임 보상을 수행하기 위한 수단(M6)을 포함한다.
Claims (17)
- 디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법으로서,
각각의 이미지는 동일한 이미지 포맷을 갖고, 픽셀 값들이 할당된 다수의 픽셀들을 포함하고, 제1 이미지(I1)와 제2 이미지(I2) 사이의 움직임 파라미터들(MP)이 결정되고, 상기 움직임 파라미터들(MP)에 기초하여, 상기 이미지들의 시퀀스(S)를 코딩하기 위해 움직임 보상(MC)이 수행되고, 상기 움직임 파라미터들(MP)은 이미지들의 코딩된 시퀀스(CS) 내에 포함되고,
제1 이미지(I1)와 제2 이미지(I2) 사이의 상기 움직임 파라미터들(MP)은, 상기 이미지 포맷 내의 복수의 이미지 포지션들에 대한 스칼라 값들을 갖는 스칼라장()을 포함하고, 상기 스칼라장()은 상기 스칼라장()으로부터 도출된 기울기 벡터들(MV)이 상기 움직임 보상(MC)을 위한 움직임 벡터들에 대응하도록 결정되는,
디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법. - 제 4 항에 있어서,
상기 업-샘플링된 버전은 윈도우잉된 사인 함수, 특히 Lanczos 필터에 의해 보간되는,
디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법. - 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
상기 움직임 파라미터들(MP)은 변환 및/또는 데이터 압축, 특히 DCT(Discrete Cosine Transformation) 및/또는 Karhunen-Loeve 변환 및/또는 예측 코딩 및/또는 엔트로피 코딩을 겪는,
디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법. - 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
상기 움직임-보상(MC)은 움직임-보상된 시간적 필터링을 위해 수행되는,
디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법. - 제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
상기 이미지들의 시퀀스(S)는 시간적으로 그 후의 이미지들 또는 공간적으로 그 후의 이미지들을 참조하는,
디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법. - 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
상기 이미지들의 시퀀스(S)는 의료 이미징 디바이스에 의해, 특히 CT 장비 및/또는 MRT 장비에 의해 생성된,
디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법. - 제 11 항에 있어서,
상기 이미지들의 시퀀스(S)는 인간 또는 동물 조직, 특히 인간 또는 동물 기관을 포함하는 조직 내의 슬라이스들의 시간적 또는 공간적 시퀀스인,
디지털 이미지들의 시퀀스(S)를 코딩하기 위한 방법. - 디지털 이미지들의 시퀀스(S)를 코딩하기 위한 장치로서,
각각의 이미지는 동일한 이미지 포맷을 갖고, 픽셀 값들이 할당된 다수의 픽셀들을 포함하고, 상기 장치는,
제1 이미지(I1)와 제2 이미지(I2) 사이의 움직임 파라미터들(MP)을 결정하기 위한 수단(M1) ― 상기 움직임 파라미터들(MP)은 상기 이미지들의 시퀀스(S)를 코딩하기 위해 수행되는 움직임 보상(MC)을 위한 수단(M2) 내에서 사용되고, 상기 움직임 파라미터들(MP)은 이미지들의 코딩된 시퀀스(CS) 내에 포함됨 ―
을 포함하고,
상기 움직임 파라미터들(MP)을 결정하기 위한 수단(M1)은 상기 이미지 포맷 내의 복수의 이미지 포지션들에 대한 스칼라 값들을 갖는 스칼라장()을 결정하기 위한 수단(M3)을 포함하고, 상기 스칼라장()은 상기 스칼라장()으로부터 도출된 기울기 벡터들(MV)이 상기 움직임 보상(MC)을 위한 움직임 벡터들에 대응하도록 결정된,
디지털 이미지들의 시퀀스(S)를 코딩하기 위한 장치. - 제 13 항에 있어서,
상기 장치(COD)는 제 2 항 내지 제 12 항 중 어느 한 항에 따른 방법을 수행하기 위해 배열된,
디지털 이미지들의 시퀀스(S)를 코딩하기 위한 장치. - 제 1 항 내지 제 12 항 중 어느 한 항에 따른 방법에 의해 코딩되는 디지털 이미지들의 시퀀스를 디코딩하기 위한 장치로서,
상기 이미지들의 코딩된 시퀀스(CS) 내에서 대응하는 제1 이미지(I1) 및 제2 이미지(I2)에 대한 하나 또는 그 초과의 스칼라장들()을 추출하기 위한 수단(M4), 각각의 추출된 스칼라장()으로부터 기울기 벡터들(MV)을 도출하기 위한 수단(M5) 및 도출된 기울기 벡터들(MV)에 기초하여 움직임 보상을 수행하기 위한 수단(MC)을 포함하고, 이미지들의 디코딩된 시퀀스(S)가 야기되는,
디지털 이미지들의 시퀀스를 디코딩하기 위한 장치. - 제 13 항 또는 제 14 항에 따른 장치와 제 16 항에 따른 장치를 포함하는 이미지들의 시퀀스(S)를 코딩 및 디코딩하기 위한 시스템.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP11175227 | 2011-07-25 | ||
EP11175227.5 | 2011-07-25 | ||
EP12153221A EP2552115A1 (en) | 2011-07-25 | 2012-01-31 | A method for coding a sequence of digital images |
EP12153221.2 | 2012-01-31 | ||
PCT/EP2012/063548 WO2013013977A1 (en) | 2011-07-25 | 2012-07-11 | A method for coding a sequence of digital images |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20140057282A true KR20140057282A (ko) | 2014-05-12 |
Family
ID=45557937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147004738A KR20140057282A (ko) | 2011-07-25 | 2012-07-11 | 디지털 이미지들의 시퀀스를 코딩하기 위한 방법 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9258561B2 (ko) |
EP (1) | EP2552115A1 (ko) |
KR (1) | KR20140057282A (ko) |
CN (1) | CN103688544B (ko) |
WO (1) | WO2013013977A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018169288A1 (ko) * | 2017-03-13 | 2018-09-20 | 한국전자통신연구원 | 비디오 부/복호화를 위한 비정형 블록 기반 움직임 예측 및 보상 방법 및 그 장치 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2552115A1 (en) | 2011-07-25 | 2013-01-30 | Siemens Aktiengesellschaft | A method for coding a sequence of digital images |
US9442904B2 (en) * | 2012-12-21 | 2016-09-13 | Vmware, Inc. | Systems and methods for applying a residual error image |
US10542961B2 (en) | 2015-06-15 | 2020-01-28 | The Research Foundation For The State University Of New York | System and method for infrasonic cardiac monitoring |
US20210052186A1 (en) * | 2018-03-20 | 2021-02-25 | The Medical College Of Wisconsin, Inc. | Method for real-time motion monitoring and dose accumulation in magnetic resonance guided therapies using simultaneous orthogonal plane imaging |
WO2020054784A1 (ja) * | 2018-09-11 | 2020-03-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法および復号方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7961963B2 (en) * | 2005-03-18 | 2011-06-14 | Sharp Laboratories Of America, Inc. | Methods and systems for extended spatial scalability with picture-level adaptation |
JP4808067B2 (ja) * | 2006-04-24 | 2011-11-02 | 富士通株式会社 | 画像圧縮装置、画像圧縮プログラム、画像圧縮方法 |
US7945117B2 (en) * | 2006-08-22 | 2011-05-17 | Siemens Medical Solutions Usa, Inc. | Methods and systems for registration of images |
US8891831B2 (en) * | 2010-12-14 | 2014-11-18 | The United States Of America, As Represented By The Secretary Of The Navy | Method and apparatus for conservative motion estimation from multi-image sequences |
EP2552115A1 (en) | 2011-07-25 | 2013-01-30 | Siemens Aktiengesellschaft | A method for coding a sequence of digital images |
-
2012
- 2012-01-31 EP EP12153221A patent/EP2552115A1/en not_active Withdrawn
- 2012-07-11 US US14/235,234 patent/US9258561B2/en not_active Expired - Fee Related
- 2012-07-11 CN CN201280036836.6A patent/CN103688544B/zh not_active Expired - Fee Related
- 2012-07-11 KR KR1020147004738A patent/KR20140057282A/ko not_active Application Discontinuation
- 2012-07-11 WO PCT/EP2012/063548 patent/WO2013013977A1/en active Application Filing
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018169288A1 (ko) * | 2017-03-13 | 2018-09-20 | 한국전자통신연구원 | 비디오 부/복호화를 위한 비정형 블록 기반 움직임 예측 및 보상 방법 및 그 장치 |
Also Published As
Publication number | Publication date |
---|---|
WO2013013977A1 (en) | 2013-01-31 |
CN103688544B (zh) | 2018-02-02 |
EP2552115A1 (en) | 2013-01-30 |
US9258561B2 (en) | 2016-02-09 |
CN103688544A (zh) | 2014-03-26 |
US20140286589A1 (en) | 2014-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101901355B1 (ko) | 최적화 함수를 이용하여 그래프 기반 예측을 수행하는 방법 및 장치 | |
TWI681670B (zh) | 影像處理方法、設備及系統 | |
KR20140057282A (ko) | 디지털 이미지들의 시퀀스를 코딩하기 위한 방법 | |
JP4906864B2 (ja) | スケーラブルビデオコーディング方法 | |
US20140049607A1 (en) | Devices and Methods for Sparse Representation of Dense Motion Vector Fields for Compression of Visual Pixel Data | |
TWI452907B (zh) | 最佳化之解區塊濾波器 | |
JP2004229315A (ja) | 直交変換−ドメインブロックマッチングを用いる動き推定 | |
JP2009510869A5 (ko) | ||
KR20220070326A (ko) | 비디오 코딩을 위한 변형 가능한 콘볼루션에 의한 예측 프레임 생성 | |
CN108235020A (zh) | 一种面向量化分块压缩感知的螺旋式逐块测量值预测方法 | |
CN111724307B (zh) | 一种基于最大后验概率和非局部低秩先验的图像超分辨重建方法,终端及可读存储介质 | |
Trocan et al. | Compressed sensing of multiview images using disparity compensation | |
US20110090963A1 (en) | Method and apparatus for zoom motion estimation | |
JP5345138B2 (ja) | 多格子スパース性ベースのフィルタリングのための方法及び装置 | |
US10666960B2 (en) | Method and device for performing graph-based transform using generalized graph parameter | |
CN114651270A (zh) | 通过时间可变形卷积进行深度环路滤波 | |
KR100208375B1 (ko) | 동화상 부호화 방법 및 장치 | |
Schnurrer et al. | Analysis of displacement compensation methods for wavelet lifting of medical 3-D thorax CT volume data | |
JP5931747B2 (ja) | 画像シーケンスのブロックの符号化および復元の方法 | |
Weinlich et al. | Representation of deformable motion for compression of dynamic cardiac image data | |
Zhao et al. | Depth Coding Based on Compressed Sensing with Optimized Measurement and Quantization. | |
Park et al. | Spatially adaptive high-resolution image reconstruction of low-resolution DCT-based compressed images | |
KR20110054425A (ko) | 적응적 보간 필터를 이용한 부호화 장치, 그 방법 및 복호화 장치 | |
US20240073425A1 (en) | Image encoding apparatus and image decoding apparatus both based on artificial intelligence, and image encoding method and image decoding method performed by the image encoding apparatus and the image decoding apparatus | |
Thirumalai et al. | Motion estimation from compressed linear measurements |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |