KR20070032633A

KR20070032633A - 멀티미디어 데이터에 적용되는 코딩 방법

Info

Publication number: KR20070032633A
Application number: KR1020067020875A
Authority: KR
Inventors: 마우로 바르비에리; 드제브데트 브라제로빅
Original assignee: 코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date: 2004-04-08
Filing date: 2005-04-04
Publication date: 2007-03-22
Also published as: WO2005099274A1; CN1943247A; JP2007533197A; EP1751986A1; US20080267290A1

Abstract

본 발명은 인접하는 블럭들로 세분된 매크로블럭들 자체로 분할되는 연속된 프레임들을 포함하는 비디오 스트림의 형태로 이용가능한 디지털 비디오 데이터를 코딩하기 위한 코딩 방법에 관한 것이다. 상기 프레임들은 적어도, 인트라 코딩 모드에 따라 무관하게 코딩되는 I-프레임들, 상기 I-프레임들 사이에서 시간적으로 배치되고 적어도 이전의 I-프레임 또는 P-프레임으로부터 예측되는 P-프레임들, 및 I-프레임과 P-프레임 사이 또는 두 개의 P-프레임들 사이에 시간적으로 배치되고 적어도 배치되는 두 개의 프레임들로부터 양방향으로 예측되는 B-프레임들의 형태로 코딩된다. 본 발명에 따르면, 코딩 방법은, 미리 결정된 인트라 예측 모드에 따라 코딩되거나 또는 코딩되지 않는 사실을 특징화하는 코딩 파라미터들과 관련된 현재 프레임의 모든 연속된 매크로블럭들을 캡처링하기 위해 제공된 구조화 단계; 상기 현재 프레임에 대해 상기 파라미터들과 관련된 통계치들(statistics)을 전달하는 계산 단계; 상기 통계치들을 분석하고, 상기 인트라 예측 모드를 나타내거나 또는 나타내지 않는 상기 현재 프레임의 블럭들의 수를 결정하도록 제공된 분석 단계; 상기 현재 프레임의 블럭들의 수가 주어진 임계치보다 클 때마다, 단색이거나 또는 반복 패턴을 가진 이미지 또는 이미지의 서브-영역의 발생을 검출하도록 제공된 검출 단계; 단색 또는 반복 패턴을 갖는 이미지들 또는 서브-이미지들의 상기 발생의 디스크립션 데이터를 생성하도록 제공된 디스크립션 단계; 얻어진 상기 디스크립션 데이터 및 오리지널 디지털 비디오 데이터를 인코딩하도록 제공된 코딩 단계를 포함한다.

디지털 미디어 데이터, 디지털 비디오 데이터, MPEC-7, H.264/AVC.

Description

멀티미디어 데이터에 적용되는 코딩 방법{Coding method applied to multimedia data}

본 발명은 매크로블럭들(macroblocks)로 분할되는 연속된 프레임들로 구성된 비디오 스트림의 형태로 이용가능한 디지털 비디오 데이터를 코딩하기 위한 코딩 방법에 관한 것으로서, 상기 프레임들은 적어도, 인트라 코딩 모드에 따라 무관하게 코딩되는 I-프레임들, 또는 상기 I-프레임들 사이에서 시간적으로 배치되고 적어도 이전의 I-프레임 또는 P-프레임으로부터 예측되는 P-프레임들, 또는 I-프레임과 P-프레임 사이 또는 두 개의 P-프레임들 사이에 시간적으로 배치되고 적어도 배치되는 두 개의 프레임들로부터 양방향으로 예측되는 B-프레임들의 형태로 코딩된다.

또한, 본 발명은 컴퓨터-판독가능한 저장 매체에 저장도록 제공된 대응하는 컴퓨터-실행가능한 처리 단계들에 관한 것이고, 상기 코딩 방법에서 정의된 단계들을 포함하고, 이러한 코딩 방법에 따라 디지털 비디오 데이터를 인코딩함으로써 생성된 전달가능한 코딩된 신호에 관한 것이다.

이제, 디지털 방송 서비스들이 더욱 이용가능함에 따라, 일반적으로 정보 기술 전문가들이 아닌, 유저들에 의해서 멀티미디어 정보 리소스들의 좋은 활용이 유 용한 것으로서 나타난다. 상기 멀티미디어 정보는, 스트리밍, 압축 및 유저 상호작용과 같은 동작들면에서 조정되도록 의도된 내추럴(natural) 및 씬세틱(synthetic) 오디오, 비쥬얼 및 오브젝트 데이터로 일반적으로 구성되고, MPEG-4 표준은 가장 부합한 해법들 중의 하나로서 상기 동작들을 수행하도록 하는 다수의 기능성들을 제공한다. MPEG-4의 가장 중요한 관점은 오브젝트의 개념에 의해 상호작용을 지원하는 것이다: 씬(scene)의 오브젝트들이 독립적으로 인코딩되고, 소위 요소리 스트리밍들이라 불리는 여러 비트스트림들로서 압축된 형태로 동시에 저장되고 전송된다. MPEG-4의 명세들은 이러한 요소리 스트림들(오디오, 비디오,등)을 식별 및 설명하고, 씬 디스크립션(scene description)을 얻기 위해 적당한 방법으로 그들을 결합시키고, 의미있는 멀티미디어 씬을 구성하여 최종 유저에게 제공할 의도로 오브젝트 디스크립션 프레임워크(object description framework)를 포함한다: MPEG-4는 오브젝트가 오디오-비쥬얼 씬의 임의의 구성요소를 나타낸는 오브젝트들의 합성으로서 멀티미디어 데이터를 설계한다. 그러나, 상기 표준의 큰 성과는 현재 더욱 더 많은 정보가 디지털 형태로 이용가능하다는 사실에 기여한다. 따라서, 올바른 정보를 찾고 선택하는 것은, 예를 들어, 상기 컨텐트와 관련된 결정들을 하기 위해 상기 정보의 컨텐트에 관한 정보를 필요로 하는 어떤 특정한 목적을 위해 오디오-비쥬얼 데이터를 동작하는 자동화된 시스템들이 인간 유저들에 대해 더 어려워지게 된다.

아직 고정되지 않은 MPEG-7 표준의 목표는 상기 컨텐트를 설명할 것이다. 즉, 스피치, 오디오, 비디오, 정지 화상, 3D 모델들, 또는 다른 것들만큼 다른 멀 티미디어 재료들을 설명하는 표준화된 방식, 또는, 이러한 요소들이 어떻게 멀티미디어 문서에 결합되는지 설명하는 방식을 찾는다. 따라서, MPEG-7은 디스크립터들 D라 불리우는 다수의 표준 요소들을 정의하도록 의도되고(각각의 디스크립터는 예를 들어, 이미지의 컬러, 오브젝트의 움직임, 영화의 제목,등의 컨텐트의 특정한 특색들을 특징화 할 수 있다), 디스크립션 설계들(description schemes)(DS)(디스크립션 설계들은 디스크립터들의 구조 및 관계들을 정의)을 정의하고, 디스크립션 정의 언어 DDL(description definition language)( 디스크립터들 및 디스크립션 설계들을 특정하도록 의도된)를 정의하고, 이러한 디스크립션들을 위한 코딩 설계들을 정의하도록 의도된다. 도 1은 이러한 MPEG-7 표준 요소들 및 이들 관계의 도해적 개요를 나타낸다. 디스크립터들 및 디스크립션 설계들을 표준화하는 것이 필요한지 여부는 여전히 MPEG에서 논의중이다. 그러나, 적어도 가장 넓게 사용되는 세트가 표준화될 것 같다.

따라서, 본 발명의 목적은 MPEG-7 표준에 관하여 매우 유용하도록 의도된 새로운 디스크립터(descriptor)를 제안하는 것이다.

상기 목적을 위해, 본 발명은 설명의 서두에서 정의된 것처럼 코딩 방법에 관한 것이고, 아래의 단계들,

- 현재 프레임의 모든 연속된 매크로블럭들에 대해 미리 결정된 인트라 예측 모드에 따라 코딩되거나 또는 코딩되지 않는 사실을 특징화하는 관련된 코딩 파라미터들을 캡처링하도록 제공된 구조화 단계;

- 상기 현재 프레임에 대해 상기 파라미터들과 관련된 통계치들(statistics)을 전달하는 계산 단계;

- 상기 통계치들을 분석하고, 상기 인트라 예측 모드를 나타내거나 또는 나타내지 않는 상기 현재 프레임의 블럭들의 수를 결정하도록 제공된 분석 단계;

- 상기 현재 프레임의 블럭들의 수가 주어진 임계치보다 클 때마다, 단색이거나 또는 반복 패턴을 가진 이미지 또는 이미지의 서브-영역의 발생을 검출하도록 제공된 검출 단계;

- 단색 또는 반복 패턴을 갖는 이미지들 또는 서브-이미지들의 상기 발생의 디스크립션 데이터를 생성하도록 제공된 디스크립션 단계;

- 얻어진 상기 디스크립션 데이터 및 오리지널 디지털 비디오 데이터를 인코딩하도록 제공된 코딩 단계를 포함하는 것을 특징으로 한다.

본 발명의 다른 목적은 상기 방법을 수행하도록 하는 일련의 컴퓨터-실행가능한 처리 단계들을 제안하는 것이다.

상기 목적을 위해, 본 발명은 -매크로블럭들로 분할되는 연속된 프레임들로 구성된 비디오 스트림의 형태로 이용가능한 디지털 비디오 데이터 코딩을 위해 제공된 인코딩 장치에 사용을 위해, 상기 프레임들은 적어도, 상기 인트라 코딩 모드에 따라 무관하게 코딩되는 I-프레임들, 상기 I-프레임들 사이에서 시간적으로 배치되고 적어도 이전의 I 또는 P-프레임으로부터 예측되는 P-프레임들, 및 I-프레임과 P-프레임 사이 또는 두 개의 P-프레임들 사이에 시간적으로 배치되고 적어도 배치되는 두 개의 프레임들로부터 양방향으로 예측되는 B-프레임들로 코딩됨- 컴퓨터-판독가능한 저장 매체에 저장되도록 제공된 컴퓨터-실행가능한 처리 단계들에 관한 것이고, 아래의 단계들,

- 상기 파라미터들과 관련된 상기 현재 프레임 통계치들을 전달하는 계산 단계;

- 상기 블럭들의 수가 주어진 임계치보다 클 때마다, 단색이거나 또는 반복 패턴을 가진 이미지 또는 이미지의 서브-영역의 발생을 검출하도록 제공된 검출 단계;

- 얻어진 디스크립션 데이터 및 오리지널 디지털 비디오 데이터를 인코딩하도록 제공된 코딩 단계를 포함한다.

본 발명은 첨부된 도면들을 참조하여 예를 통해 기술될 것이다.

도 1은, 유저들이 다른 디스크립터들(표준에서, 또는 가능한, 표준이 아닌 경우 중 어느 하나)을 배치할 수 있는 MPEG-7 환경을 정의하기 위해, MPEC-7 표준 요소들 및 이들 관계의 도해적 개요를 나타낸 도면.

도 2 및 3은 멀티미디어 데이터를 인코딩 및 디코딩하도록 하는 코딩 및 디코딩 방법을 예시한 도면.

도 2에 예시된, 본 발명에 따른 다수의 멀티미디어 데이터를 코딩하는 방법은 다음 단계들: 이용가능한 멀티미디어 데이터를 하나 또는 여러 비트스트림들로 변환하는 획득 단계(acquisition step)(CONV), 분석 및 세그먼테이션에 의해 상기 비트스트림(들)에서 다른 레벨들의 정보를 캡처링하는 구조화 단계(SEGM), 정보의 얻어진 레벨들의 디스크립션 데이터를 생성하는 디스크립션 단계(description step), 얻어진 디스크립션 데이터를 인코딩하도록 하는 코딩 단계(COD)를 포함한다. 더 정확하게, 디스크립션 단계는 상기 다수의 멀티미디어 데이터와 관련된 디스크립터들의 세트를 저장하도록 제공된 규정 서브-단계(DESC)와, 오리지널 멀티미디어 데이터에 기초하여 구조화 단계에서 얻어진 정보의 매 레벨에 따라, 코딩될 디스크립션 데이터를 선택하는 디스크립션 서브-단계(DESC)를 포함한다. 그 후, 코딩된 데이터는 전송 및 저장된다. 도 3에 예시된, 대응하는 디코딩 방법은, 상기 설명된 코딩 방법에 의해 코딩된 신호를 디코딩하는 단계(DECOD), 이에 의해 얻어진 디코딩된 신호를 저장하는 하는 단계(STOR), 유저(USER)에 의해 보내진 탐색 명령을 기초로 하여, 상기 디코딩된 신호에 의해 구성된 데이터들 사이에서 탐색하는 단계, 저장된 데이터에서 상기 탐색의 검색 결과를 상기 유저에게 다시 보내는 단계들을 포함하고 있다.

모든 가능한 멀티미디어 컨텐트와 관련해 저장된 디스크립터들 사이에서, 본 발명에 따라 제안된 하나는, 권고 H.264/AVC로서 ITU-T와, 국제 표준 14496-10(MPEG-4 Part 10)Advanced Video Coding(AVC)로서 ISO/IEC에 의해 2003년에 공식적으로 승인될 것으로 기대된 미래 표준 H.264/AVC에 기초한다. 상기 새로운 표준은 MPEG-2와 같은 확립된 표준들로부터 널리 알려져 있는 블럭-기반 움직임 보상 변환 코딩과 완전히 동일한 원리들을 채용한다. 그러므로, H.264 신택스(syntax)는 헤더들(픽처-, 슬라이스-, 및 매크로블럭 헤더들과 같은) 및 데이터(움직임 벡터들, 블럭 변환 계수들, 양자화 크기 등)의 통상의 계층으로서 조직화된다. 데이터 구조화(예를 들어, I, P, 또는 B 화상들, 인트라 및 인터 매크로블럭들)에 관해 알려진 개념들의 대부분은 유지되지만, 일부 새로운 개념들이 또한 헤더와 데이터 레벨 둘 다에 도입된다. 주로 H.264/AVC는 비디오 데이터의 컨텐트를 효율적으로 나타내도록 정의되는 비디오 코딩 레이어(VCL)(Video Coding Layer)와, 데이터를 포맷하여 높은 레벨(운송) 시스템에 의하여 전송하는데 적당한 방법으로 헤더 정보를 제공하는 네트워크 앱스트랙션 레이어(NAL)(Network Abstraction Layer)를 분리된다.

데이터 레벨에서의 H.264/AVC의 주된 특성들 중 하나는 16 ×16 매크로블럭들(매크로블럭 MB은 휘도의 16 ×16 매크로블럭 및 대응하는 색도의 8 ×8 블럭들을 포함하지만, 예를 들어, 움직임 추정과 같은 많은 동작들은 실제로 휘도만 취하며 이 결과들을 색도에 투영한다)의 보다 정교한 분할 및 조작을 이용하는 것이다. 따라서, 움직임 보상 처리는 샘플 그리드(sample grid)의 1/4 까지의 움직임 벡터 정확성을 이용하는 4 ×4 크기 정도의 작은 MB의 세그먼테이션들을 형성할 수 있다. 또한, 샘플 블럭의 움직임 보상 예측을 대한 선택 처리는, 단지 인접 화상들 대신에, 저장되어 이전에 디코딩된 다수의 화상들을 포함할 수 있다. 인트라 코딩의 경우조차, 이제는 인접 블럭들로부터 이전의 디코딩된 샘플들을 사용하여 블럭을 예측하는 것이 가능하다(공간-기반 예측에 대한 규칙들은 소위 인트라 예측 모드들에 의해 설명된다). 이러한 관점은 본 명세서에서 정의된 발명과 특히 관련되며, 이하 설명에서 강조될 것이다. 움직임 보상 또는 공간-기반 예측 이후에, 결과 예측 에러는, 전형적인 8 ×8 크기 대신에, 4 ×4 크기에 기초하여 일반적으로 변환 및 양자화된다. H.264/AVC 표준은, 대부분 고정되거나 화상 레벨에 또는 화상 레벨 위에 변경될 수 있는 다른 코딩 스테이지들에서 다른 특정한 구현들(예를 들어, 엔트로피 코딩)을 여전히 사용한다.

이전의 표준들의 경우처럼, H.264/AVC는, 인접한 이미지들로부터 시간적인 예측의 사용 없이, 이미지 블럭이 인트라 모드에서 코딩되도록 한다. H.264/AVC 인트라 코딩의 신형은 공간 예측의 사용이고, 동일한 화상에서 이전에 인코딩 및 재구성된 샘플들로부터 형성된 블럭 P에 의해 인트라 블럭을 예측하도록 한다. 이러한 예측 블럭 P는 인코딩 이전에 실제 이미지 블럭으로부터 감산될 것이며, 이는 실제 이미지 블럭이 직접 인코딩되는 현존하는 표준들(예를 들어, MPEG-2, MPEG-4 ASP)과는 다르다. 인트라 모드의 선택은 디코더로의 시그널링되어야 하는데, 이를 위해 H.264는 효율적인 인코딩 절차를 정의한다(중심 사상은 인접한 4 ×4 블럭들의 모드들이 종종 고도로 상관되는 관찰을 이용하여 4 ×4 모드들의 개별적인 인코 딩을 피하는 것이다).

계산, 통신들 및 디지털 데이터 저장에서의 최근의 진보들은, 전문가 및 고객 환경에서 계속적으로 증가하는 용량 및 컨텐트 다양성으로 특징을 나타내는 대용량 디지털 파일 보관소(archives)의 대단한 성장으로 이끌었다. 그러므로, 관심 있는 저장된 정보를 빠르게 검색하는 효율적인 방법들을 찾는 것이 상당히 중요하다. 비조직화되어 저장된 테라바이트들을 통해 데이터를 수동으로 검색하는 것이 지루하고 시간 소모적이기 때문에, 자동화된 시스템들에 의해 정보 탐색 및 검색 작업들을 수행할 필요가 증가한다. 비구조화된 비디오 컨텐트의 대용량 보관소에서 탐색 및 검색은 컨텐트 분석 기술들을 사용하여 컨텐트가 분류된 후에 통상 수행된다. 이들 기술들은 비디오 컨텐트의 디스크립션, 비디오 재료의 주해들(annotations)(이러한 주해들은 컬러 및 텍스처와 같은 저 레벨 신호 관련 특성으로부터 및 얼굴들의 존재 및 위치와 같은 고 레벨 정보로 변화한다)을 비디오 컨테트의 디스크립션을 고려하여 자동으로 생성을 위한 알고리즘을 포함한다.

중요한 컨텐트 디스크립터는 소위 단색 또는 "유니컬러" 프레임 인디케이터("unicolour" frame indicator)라고 불린다. 동일한 컬러로 전체적으로 채워진다면 프레임은 단색으로 간주된다(실제로, 생성에서 전달할 때 발생한 신호 체인(sign chain)에서의 잡음 때문에, 단색 프레임은 예를 들어, 푸른색(blue), 어두운 회색(dark gray) 또는 검정색(black)과 같은 하나의 단색의 인지할 수 없는 변화들을 종종 제공한다). 단색 프레임들을 검출하는 것은 많은 컨텐트 기반의 검색 응용들에서 중요한 단계이다. 예를 들어, 특허출원공보 US2002/0186768에 기술된 것처럼, 상업용 검출기들 및 프로그램 경계 검출기들은 상업용 광고들로부터의 프로그램들로부터 두 개의 연속된 프로그램들 또는 하나의 프로그램을 분리하기 위해 방송국들에 의해 삽입된 일반적으로 검정색인 단색 프레임들의 존재의 식별에 의존한다. 단색 프레임 검출은 컨텐트의 비쥬얼 테이블로부터 정보 가치가 없는 키프레임들을 필터링하는데 또한 사용된다.

공개될 H.264/MPEC-4 AVC 표준에 대한 큰 응용 범위로 인해, H.264/AVC 비디오 컨텐트 분석을 위한 효율적인 해법들에 대한 요구가 증가할 것이다. 최근 몇년 동안, 여러 효율적 컨텐트 분석 알고리즘들 및 방법들은 압축된 영역에서 거의 배타적으로 작용하는 MPEG-2 비디오로 증명되었다. 하나의 방법으로, H.264/AVC가 상기에서 본 것처럼 MPEG-2 신택스의 상위집합(superset)을 열거하기 때문에, 대부분의 방법들은 H.264/AVC로 연장될 수 있다. 그러나, MPEG-2의 제한들로 인하여, 현존하는 방법들 중 일부는 충분하거나 또는, 신뢰할만한 수행을 할 수 없는데, 이는 픽셀 또는 오디오 도메인에서 동작하는 부가적이면서 종종 비용이 많이 드는 방법들을 포함함으로써, 전형적으로 다루어지는 결함(deficiency)이다.

2004년 4월 8일에 출원된 출원번호 04300189.0(PHFR040040)의 유럽 특허 출원은 상기 결함을 피하는 방법을 제안한다. 더 정확하게, 상기 유럽 특허 출원은 인접하는 블럭들로 세분된 매크로블럭들 자체로 분할되는 연속된 프레임들을 포함하는 비디오 스트림의 형태로 이용가능한 디지털 코딩된 비디오 데이터에 적용되는 검출 방법(및 대응하는 검출 장치)에 관한 것으로서, 상기 프레임들은 적어도, 동일한 프레임에서 적어도 이전에 인코딩 및 재구성된 샘플들로부터 형성된 블럭으로 부터 직접 또는 공간 예측에 의해 임의의 다른 프레임과 무관하게 코딩된 I-프레임들, 상기 I-프레임들 사이에서 시간적으로 배치되고 적어도 이전의 I-프레임 또는 P-프레임으로부터 예측되는 P-프레임들, 및 I-프레임 및 P-프레임 사이 또는 두 개의 P-프레임들 사이에서 시간적으로 배치되고 적어도 배치되는 두 개의 프레임들로부터 양방향으로 예측된 B-프레임들을 포함하고, 상기 검출 방법은 아래의 단계들,

- 코딩되었는지의 여부를 미리 결정된 인트라 예측 모드에 따라 현재 프레임의 연속된 블럭 각각에 대하여 결정하는 단계;

- 상기 인트라 예측 모드와 관련된 통계치들의 전달하기 위하여, 현재 프레임의 모든 연속된 블럭들에 대한 유사한 정보를 수집하는 단계;

- 상기 인트라 예측 모드를 나타내거나 또는 나타내지 않는 상기 현재 프레임의 블럭들의 수를 결정하기 위해 상기 통계치들을 분석하는 단계;

- 상기 블럭들의 수가 주어진 임계치보다 클 때마다, 단색이거나 또는 반복 패턴을 가진 이미지 또는 이미지의 서브-영역의 발생을 검출하도록 제공된 검출 단계;를 더 포함한다.

상기 유럽 특허 출원에 개시된 기술적인 해법의 원리는, H.264/AVC의 혁신적인 코딩 도구들인 인트라 예측 모드들이 단색 프레임 검출 목적용으로 편리하게 사용될 수 있는 사실에 기초한다. 주요 사상은 이미지를 구성하는 매크로-블럭들을 위한 인트라 예측 모드의 분배를 관찰하는 것이다. 블럭들의 대부분이 동일 또는 유사한 예측 모드를 나타낼 때 단색 이미지 또는 서브-이미지가 검출된다: 이러한 블럭들의 수는 예를 들어, 고정된 임계치와 비교될 수 있다. 이미지(또는 서브-이 미지)내의 대부분의 블럭들은 특정한 인트라 예측 모드에 따라 인코딩되고, 그 이미지(또는 서브-이미지)는 매우 낮은 공간 변화를 나타내고, 단색 또는 반복 패턴을 포함한다(컨텐트의 테이블의 생성에 대한 상기 알고리즘의 초기에 언급한 응용 또는 키프레임 추출에 있어서, 이미지들 또는 서브-이미지들-단색의 형태들 및 반복 패턴은 모두 버려져야 한다).

MPEG-7 표준 드래프트 ISO/IEC 1/SC 29 N 4242 (2001년 10월 23일)에 따르면, 도구들이 멀티미디어 컨텐트의 특징들, 특히 디스크립터들 D 및 디스크립션 설계들(DS)을 기술하도록 열거되었다.

이 후, 본 발명에 따른 코딩 방법의 정의는 아래와 같다. 코딩될 디지털 비디오 데이터는 인접하는 블럭들로 세분된 매크로블럭들 자체로 분할되는 연속된 프레임들을 포함하는 비디오 스트림의 형태로 이용가능하고, 상기 프레임들은 적어도, 인트라 코딩 모드에 따라 무관하게 코딩되는 I-프레임들, 상기 I-프레임들 사이에서 시간적으로 배치되고 적어도 이전의 I-프레임 또는 P-프레임으로부터 예측되는 P-프레임들, 및 I-프레임과 P-프레임 사이 또는 두 개의 P-프레임들 사이에 시간적으로 배치되고 적어도 배치되는 두 개의 프레임들로부터 양방향으로 예측되는 B-프레임들의 형태로 코딩된다. 상기 코딩 방법은 이하의 단계들,

- 상기 현재 프레임에 대해, 상기 파라미터들과 관련된 통계치들을 전달하는 계산 단계;

- 상기 현재 프레임의 블럭들의 수가 주어진 임계치보다 클 때마다, 단색 또는 반복 패턴을 가진 이미지 또는 이미지의 서브-영역의 발생을 검출하도록 제공된 검출 단계;

- 단색 또는 반복 패턴을 갖는 이미지들 또는 이미지들의 서브-이미지들의 발생들의 디스크립션 데이터를 생성하도록 제공된 디스크립션 단계;

- 얻어진 상기 디스크립션 데이터 및 오리지널 디지털 비디오 데이터를 인코딩하도록 제공된 자체 코딩 단계를 더 포함한다.

상기 단계들은, 본 발명에 따라, 인접하는 블럭들로 세분된 매크로블럭들 자체로 분할되는 연속된 프레임들을 포함하는 비디오 스트림의 형태로 이용가능한 디지털 비디오 데이터를 코딩하기 위한 인코딩 장치에 의해 구현될 수 있고, 상기 프레임들은, 적어도 상기 인트라 코딩 모드에 따라 무관하게 코딩된 I-프레임들, 상기 I-프레임들 사이에서 시간적으로 배치되고 적어도 이전의 I-프레임 또는 P-프레임으로부터 예측되는 P-프레임들, 및 I-프레임 및 P-프레임 사이 또는 두 개의 P-프레임들 사이에서 시간적으로 배치되고 적어도 배치되는 두 개의 프레임들로부터 양방향으로 예측된 B-프레임들의 형태로 코딩되고, 상기 인코딩 장치는,

- 현재 프레임의 모든 연속된 매크로블럭들에 대해 미리 결정된 인트라 예측 모드에 따라 코딩되거나 또는 코딩되지 않는 사실을 특징화하는 관련된 코딩 파라 미터들을 캡처링하도록 제공된 구조화 수단;

- 상기 현재 프레임에 대해, 상기 파라미터들과 관련된 통계치들을 전달하는 계산 수단;

- 상기 통계치들을 분석하고, 상기 인트라 예측 모드를 나타내거나 또는 나타내지 않는 상기 현재 프레임의 블럭들의 수를 결정하도록 제공된 분석 수단;

- 상기 현재 프레임의 블럭들의 수가 주어진 임계치보다 클 때마다, 단색이거나 또는 반복 패턴을 가진 이미지 또는 이미지의 서브-영역의 발생을 검출하도록 제공된 검출 수단;

- 단색 또는 반복 패턴을 갖는 이미지들 또는 서브-이미지들의 발생들의 디스크립션 데이터를 발생시키도록 제공되는 디스크립션 수단;

- 얻어진 상기 디스크립션 데이터 및 오리지널 디지털 비디오 데이터를 인코딩하도록 제공된 코딩 수단을 포함한다.

본 발명에 따른 코딩 방법의 단계들은 컴퓨터-판독가능한 저장 매체에 저장된 컴퓨터-실행가능한 처리 단계들에 의하여 또한 구현될 수 있고,

- 상기 파라미터들과 관련된 상기 현재 프레임 통계치들을 전달하는 단계;

- 상기 인트라 예측 모드를 나타내거나 나타내지 않는 상기 현재 프레임의 블럭들의 수를 결정하기 위해 상기 통계치들을 분석하는 단계;

- 상기 현재 프레임의 블럭들의 수가 주어진 임계치보다 클 때마다, 단색이거나 또는 반복 패턴을 가진 이미지 또는 이미지의 서브-영역의 발생을 검출하도록 제공된 검출 단계를 포함한다.

이러한 단계들 후에, 상기 이미지들 또는 서브-이미지들의 발생들의 디스크립션 데이터를 생성하도록 제공된 디스크립션 단계와, 얻어진 디스크립션 데이터 및 오리지널 디지털 비디오 데이터를 인코딩하도록 제공된 결합된 코딩 단계가 뒤따른다.

본 발명은 상기 인코딩 장치의 출력에 이용가능하고 이전에 설명된 코딩 방법에 따라 디지털 비디오 데이터를 인코딩함으로써 생성된 신호와 같은 전송 가능한 코딩된 신호에 또한 관련이 있다.

본 발명은 앞에 언급한 실시예에 한정되지 않고, 첨부된 청구항들에서 정의된 것처럼 본 발명의 정신과 범위로부터 벗어나지 않고 변화들과 수정들이 있을 수 있다고 본 명세서에서 나타나 있음이 분명하다.

예를 들어, 본 명세서 또는 청구항들에 사용된 "매크로블럭" 및 "블럭"이라는 단어들은 예컨대 MPEG-2 또는 MPEG-4와 같은 표준들에서 사용된 것으로서 프레임의 직사각형 서브-영역들의 계층뿐만 아니라 불규칙한 형태의 블럭들에 기초한 인코딩 또는 디코딩 설계들에서 마주치는 프레임의 임의의 형태인 서브-영역들의 임의의 종류들을 설명하도록 의도하였음을 유의할 수 있다.

하드웨어 또는 소프트웨어, 또는 둘 다의 아이템들에 의해 구현하는 기능들의 다수의 방법이 있음을 유의해야 함이 분명하다. 이 점에 있어서, 도면들은 매우 도식적이고, 도면이 다른 블럭들로써 다른 기능들을 나타낼 때, 여러 기능들을 수행하는 하드웨어 또는 소프트웨어의 하나의 아이템을 결코 배제하지 않는다. 기능을 수행하는 하드웨어 또는 소프트웨어, 또는 둘 다의 아이템들의 조합을 배제하지도 않는다.

"포함하는"("comprising")이라는 단어는 청구항에 열거된 것 이상의 다른 구성 요소들 및 단계들의 예시를 배제하지 않음을 나타낸다. 요소 또는 단계 앞의 "a" 또는 "an"라는 단어는 다수의 이러한 구성 요소들 및 단계들의 예시를 배제하지 않는다.

Claims

인접하는 블럭들로 세분된 매크로블럭들 자체로 분할되는 연속된 프레임들을 포함하는 비디오 스트림의 형태로 이용가능한 디지털 비디오 데이터를 코딩하기 위한 코딩 방법으로서,

상기 프레임들은 적어도, 인트라 코딩 모드에 따라 무관하게 코딩되는 I-프레임들, 상기 I-프레임들 사이에서 시간적으로 배치되고 적어도 이전의 I-프레임 또는 P-프레임으로부터 예측되는 P-프레임들, 및 I-프레임과 P-프레임 사이 또는 두 개의 P-프레임들 사이에 시간적으로 배치되고 적어도 배치되는 두 개의 프레임들로부터 양방향으로 예측되는 B-프레임들의 형태로 코딩되는, 상기 디지털 비디오 데이터 코딩 방법에 있어서,

- 현재 프레임의 모든 연속된 매크로블럭들에 대해 미리 결정된 인트라 예측 모드에 따라 코딩되거나 또는 코딩되지 않는 사실을 특징화하는 관련된 코딩 파라미터들을 캡처링하도록 제공된 구조화 단계;

- 상기 현재 프레임에 대해, 상기 파라미터들과 관련된 통계치들(statistics)을 전달하는 계산 단계;

- 상기 통계치들을 분석하고, 상기 인트라 예측 모드를 나타내거나 또는 나타내지 않는 상기 현재 프레임의 블럭들의 수를 결정하도록 제공된 분석 단계;

- 상기 현재 프레임의 블럭들의 수가 주어진 임계치보다 클 때마다, 단색이거나 또는 반복 패턴을 가진 이미지 또는 이미지의 서브-영역의 발생을 검출하도록 제공된 검출 단계;

- 단색 또는 반복 패턴을 갖는 이미지들 또는 서브-이미지들의 상기 발생의 디스크립션(description) 데이터를 생성하도록 제공된 디스크립션 단계;

- 얻어진 상기 디스크립션 데이터 및 오리지널 디지털 비디오 데이터를 인코딩하도록 제공된 코딩 단계를 포함하는, 디지털 비디오 데이터 코딩 방법.
인접하는 블럭들로 세분된 매크로블럭들 자체로 분할되는 연속된 프레임들을 포함하는 비디오 스트림의 형태로 이용가능한 디지털 비디오 데이터를 코딩하기 위한 인코딩 장치로서,

상기 프레임들은 적어도, 인트라 코딩 모드에 따라 무관하게 코딩되는 I-프레임들, 상기 I-프레임들 사이에서 시간적으로 배치되고 적어도 이전의 I-프레임 또는 P-프레임으로부터 예측되는 P-프레임들, 및 I-프레임과 P-프레임 사이 또는 두 개의 P-프레임들 사이에 시간적으로 배치되고 적어도 배치되는 두 개의 프레임들로부터 양방향으로 예측되는 B-프레임들의 형태로 코딩되는, 상기 디지털 비디오 데이터 인코딩 장치에 있어서,

- 현재 프레임의 모든 연속된 매크로블럭들에 대해 미리 결정된 인트라 예측 모드에 따라 코딩되거나 또는 코딩되지 않는 사실을 특징화하는 관련된 코딩 파라미터들을 캡처링하도록 제공된 구조화 수단;

- 상기 현재 프레임에 대해, 상기 파라미터들과 관련된 통계치들을 전달하는 계산 수단;

- 상기 통계치들을 분석하고, 상기 인트라 예측 모드를 나타내거나 또는 나타내지 않는 상기 현재 프레임의 블럭들의 수를 결정하도록 제공된 분석 수단;

- 상기 현재 프레임의 블럭들의 수가 주어진 임계치보다 클 때마다, 단색이거나 또는 반복 패턴을 가진 이미지 또는 이미지의 서브-영역의 발생을 검출하도록 제공된 검출 수단;

- 단색 또는 반복 패턴을 갖는 이미지들 또는 서브-이미지들의 상기 발생의 디스크립션 데이터를 생성하도록 제공된 디스크립션 수단;

- 얻어진 상기 디스크립션 데이터 및 오리지널 디지털 비디오 데이터를 인코딩하도록 제공된 코딩 수단을 포함하는, 디지털 비디오 데이터 인코딩 장치.
인접하는 블럭들로 세분된 매크로블럭들 자체로 분할되는 연속된 프레임들을 포함하는 비디오 스트림의 형태로 이용가능한 디지털 비디오 데이터를 코딩하기 위한 인코딩 장치에 사용하기 위해, 상기 프레임들은 적어도, 인트라 코딩 모드에 따라 무관하게 코딩되는 I-프레임들, 상기 I-프레임들 사이에서 시간적으로 배치되고 적어도 이전의 I-프레임 또는 P-프레임으로부터 예측되는 P-프레임들, 및 I-프레임과 P-프레임 사이 또는 두 개의 P-프레임들 사이에 시간적으로 배치되고 적어도 배치되는 두 개의 프레임들로부터 양방향으로 예측되는 B-프레임들의 형태로 코딩되는, 상기 디지털 비디오 데이터 인코딩 장치에 있어서,

- 현재 프레임의 모든 연속된 매크로블럭들에 대해 미리 결정된 인트라 예측 모드에 따라 코딩되거나 또는 코딩되지 않는 사실을 특징화하는 관련된 코딩 파 라미터들 캡처링하도록 제공된 구조화 수단;

- 상기 현재 프레임에 대해 상기 파라미터들과 관련된 통계치들을 전달하는 계산 수단;

- 상기 통계치들을 분석하고, 상기 인트라 예측 모드를 나타내거나 또는 나타내지 않는 상기 현재 프레임의 블럭들의 수를 결정하도록 제공된 수단;

- 상기 현재 프레임의 블럭들의 수가 주어진 임계치보다 클 때마다, 단색이거나 또는 반복 패턴을 가진 이미지 또는 이미지의 서브-영역의 발생을 검출하도록 제공된 검출 수단;

- 단색 또는 반복 패턴을 갖는 이미지들 또는 서브-이미지들의 상기 발생의 디스크립션 데이터를 생성하도록 제공된 디스크립션 수단;

- 얻어진 상기 디스크립션 데이터 및 오리지널 디지털 비디오 데이터를 인코딩하도록 제공된 코딩 수단을 포함하는, 디지털 비디오 데이터 인코딩 장치.
디지털 비디오 데이터 코딩 장치를 위한 컴퓨터 프로그램 제품에 있어서,

상기 코딩 장치에 로딩될 때 제 3 항에 청구된 것과 같은 단계들을 수행하도록 하는 일련의 명령들을 포함하는 컴퓨터 프로그램 제품.
제 1 항에 청구된 것과 같은 코딩 방법에 따라 디지털 비디오 데이터를 인코딩함으로써 생성된 전달가능한 코딩된 신호.