KR20130140098A - 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 및 화상 부호화 복호 장치 - Google Patents

화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 및 화상 부호화 복호 장치 Download PDF

Info

Publication number
KR20130140098A
KR20130140098A KR1020137016639A KR20137016639A KR20130140098A KR 20130140098 A KR20130140098 A KR 20130140098A KR 1020137016639 A KR1020137016639 A KR 1020137016639A KR 20137016639 A KR20137016639 A KR 20137016639A KR 20130140098 A KR20130140098 A KR 20130140098A
Authority
KR
South Korea
Prior art keywords
context
coefficients
decoding
group
groups
Prior art date
Application number
KR1020137016639A
Other languages
English (en)
Other versions
KR101888218B1 (ko
Inventor
히사오 사사이
다카히로 니시
요우지 시바하라
도시야스 스기오
Original Assignee
파나소닉 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파나소닉 주식회사 filed Critical 파나소닉 주식회사
Publication of KR20130140098A publication Critical patent/KR20130140098A/ko
Application granted granted Critical
Publication of KR101888218B1 publication Critical patent/KR101888218B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • H03M7/4012Binary arithmetic codes
    • H03M7/4018Context adapative binary arithmetic codes [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

화상 부호화 방법은, 주파수 성분마다의 복수의 계수를 포함하는 블록을, 복수의 계수의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하고, 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정하는 콘텍스트 결정 단계(S201, S202)와, 2치화된 복수의 계수 각각을, 상기 계수가 속하는 그룹에 대응지어진 콘텍스트의 확률 정보에 따라서 2치 산술 부호화하는 2치 산술 부호화 단계(S203)와, 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 그룹에 속하는 계수에 기초하여 갱신하는 갱신 단계(S204)를 포함하며, 콘텍스트 결정 단계(S202)에서는, 복수의 그룹 각각에 속하는 상기 계수의 수가 편중되도록, 블록을 복수의 그룹으로 구분한다.

Description

화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 및 화상 부호화 복호 장치{IMAGE-ENCODING METHOD, IMAGE-DECODING METHOD, IMAGE-ENCODING DEVICE, IMAGE-DECODING DEVICE, AND IMAGE-ENCODING/DECODING DEVICE}
본 발명은, 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 및 화상 부호화 복호 장치에 관한 것이며, 특히, 산술 부호화 및 산술 복호를 행하는 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 및 화상 부호화 복호 장치에 관한 것이다.
영상 데이터의 압축을 위해, 복수의 영상 부호화 규격이 개발되어 있다. 이러한 영상 부호화 규격은, 예를 들면 H.26x로 나타내는 ITU-T(국제 전기 통신 연합 전기 통신 표준화 부문) 규격, 및, MPEG-x로 나타내는 ISO/IEC 규격이다. 최신이며 또한 가장 진보된 영상 부호화 규격은, 현재, H.264/AVC, 또는 MPEG-4 AVC로 나타내는 규격이다(비특허 문헌 1 및 비특허 문헌 2 참조).
H.264/AVC 규격으로는, 크게 나누면, 예측, 변환, 양자화, 엔트로피 부호화라는 처리로 구성된다. 이 중에서 엔트로피 부호화는, 예측에 이용되는 정보나, 양자화된 정보로부터 장황한 정보를 삭감한다. 엔트로피 부호화로서는, 가변길이 부호화, 적응 부호화, 고정길이 부호화 등이 알려져 있다. 가변길이 부호화에는, 허프만 부호화, 런 렝스 부호화, 산술 부호화 등이 있다.
이 중, 산술 부호화는, 심볼의 발생 확률을 계산하면서 출력 부호를 결정하는 방식이다. 즉, 산술 부호화에서는, 화상 데이터의 특징에 대응하는 콘텍스트마다의 심볼 발생 확률을 이용하여 화상 데이터의 부호화를 행하고, 또한 부호화할 때마다 심볼 발생 확률을 갱신한다. 따라서, 화상 데이터의 특징에 따라 부호가 결정되기 때문에, 고정된 부호화 테이블을 사용하는 허프만 부호화 등에 비해, 부호화 효율이 높은 것이 알려져 있다.
ISO/IEC 14496-10 「MPEG-4 Part10 Advanced Video Coding」 Thomas Wiegand et al, "Overview of the H.264/AVC Video Coding Standard", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, JULY 2003, PP.1-19.
그러나, 종래의 산술 부호화에서는, 부호화 효율이 충분하지 않다는 과제가 있다.
본 발명은, 상기의 과제를 감안하여 이루어진 것이며, 부호화 효율을 향상시킨 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 및 화상 부호화 복호 장치를 제공하는 것을 목적으로 한다.
본 발명의 일양태에 관련된 화상 부호화 방법은, 화상 데이터를 블록마다 부호화하는 방법이다. 구체적으로는, 화상 부호화 방법은, 주파수 성분마다의 복수의 계수를 포함하는 상기 블록을, 상기 복수의 계수의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하고, 상기 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정하는 콘텍스트 결정 단계와, 2치화된 상기 복수의 계수 각각을, 상기 계수가 속하는 상기 그룹에 대응지어진 상기 콘텍스트의 확률 정보에 따라서 2치 산술 부호화하는 2치 산술 부호화 단계와, 상기 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 상기 그룹에 속하는 상기 계수에 기초하여 갱신하는 갱신 단계를 포함한다. 그리고, 상기 콘텍스트 결정 단계에서는, 상기 복수의 그룹 각각에 속하는 상기 계수의 수가 편중되도록, 상기 블록을 상기 복수의 그룹으로 구분한다.
상기 구성과 같이, 계수의 종류에 따라 블록을 복수의 그룹으로 구분하고, 각 그룹에 대응하는 콘텍스트의 확률 정보에 따라서, 2치 산술 부호화를 행함으로써, 부호화 효율이 향상된다.
또, 상기 콘텍스트 결정 단계에서는, 직류 성분을 포함하는 제1 그룹에 속하는 상기 계수의 수가, 다른 그룹에 속하는 상기 계수의 수 이하가 되도록, 상기 블록을 상기 복수의 그룹으로 구분해도 된다.
또한, 상기 콘텍스트 결정 단계에서는, 가장 높은 주파수 성분을 포함하는 제2 그룹에 속하는 상기 계수의 수보다, 상기 제1 및 제2 그룹 사이의 제3 그룹에 속하는 상기 계수의 수가 많아지도록, 상기 블록을 상기 복수의 그룹으로 구분해도 된다.
또, 상기 복수의 계수는, 복수의 양자화 계수 각각이 제로인지 아닌지를 나타내는 제1 플래그와, 스캔순으로 마지막에 비제로가 되는 양자화 계수의 위치를 나타내는 제2 플래그를 포함해도 된다.
본 발명의 일양태에 관련된 화상 복호 방법은, 부호화 화상 데이터를 블록마다 복호하는 방법이다. 구체적으로는, 화상 복호 방법은, 상기 부호화 화상 데이터의 일부인 복호 대상 신호를 포함하는 상기 블록을, 상기 복호 대상 신호의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하고, 상기 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정하는 콘텍스트 결정 단계와, 상기 복호 대상 신호를, 상기 복호 대상 신호가 속하는 상기 그룹에 대응지어진 상기 콘텍스트의 확률 정보에 따라서 2치 산술 복호함으로써, 2치화된 계수를 생성하는 2치 산술 복호 단계와, 상기 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 상기 그룹에 속하는 상기 계수에 기초하여 갱신하는 갱신 단계를 포함한다. 그리고, 상기 콘텍스트 결정 단계에서는, 상기 복수의 그룹 각각에 속하는 상기 계수의 수가 편중되도록, 상기 블록을 상기 복수의 그룹으로 구분한다.
또, 상기 콘텍스트 결정 단계에서는, 직류 성분을 포함하는 제1 그룹에 속하는 상기 계수의 수가, 다른 그룹에 속하는 상기 계수의 수 이하가 되도록, 상기 블록을 상기 복수의 그룹으로 구분해도 된다.
또한, 상기 콘텍스트 결정 단계에서는, 가장 높은 주파수 성분을 포함하는 제2 그룹에 속하는 상기 계수의 수보다, 상기 제1 및 제2 그룹 사이의 제3 그룹에 속하는 상기 계수의 수가 많아지도록, 상기 블록을 상기 복수의 그룹으로 구분해도 된다.
또, 상기 복수의 계수는, 복수의 양자화 계수 각각이 제로인지 아닌지를 나타내는 제1 플래그와, 스캔순으로 마지막에 비제로가 되는 양자화 계수의 위치를 나타내는 제2 플래그를 포함해도 된다.
본 발명의 일양태에 관련된 화상 부호화 장치는, 화상 데이터를 블록마다 부호화한다. 구체적으로는, 화상 부호화 장치는, 주파수 성분마다의 복수의 계수를 포함하는 상기 블록을, 상기 복수의 계수의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하고, 상기 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정하는 콘텍스트 결정부와, 2치화된 상기 복수의 계수 각각을, 상기 계수가 속하는 상기 그룹에 대응지어진 상기 콘텍스트의 확률 정보에 따라서 2치 산술 부호화하는 2치 산술 부호화부와, 상기 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 상기 그룹에 속하는 상기 계수에 기초하여 갱신하는 갱신부를 구비한다. 그리고, 상기 콘텍스트 결정부는, 상기 복수의 그룹 각각에 속하는 상기 계수의 수가 편중되도록, 상기 블록을 상기 복수의 그룹으로 구분한다.
본 발명의 일양태에 관련된 화상 복호 장치는, 부호화 화상 데이터를 블록마다 복호한다. 구체적으로는, 화상 복호 장치는, 상기 부호화 화상 데이터의 일부인 복호 대상 신호를 포함하는 상기 블록을, 상기 복호 대상 신호의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하고, 상기 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정하는 콘텍스트 결정부와, 상기 복호 대상 신호를, 상기 복호 대상 신호가 속하는 상기 그룹에 대응지어진 상기 콘텍스트의 확률 정보에 따라서 2치 산술 복호함으로써, 2치화된 계수를 생성하는 2치 산술 복호부와, 상기 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 상기 그룹에 속하는 상기 계수에 기초하여 갱신하는 갱신부를 구비한다. 그리고, 상기 콘텍스트 결정부는, 상기 복수의 그룹 각각에 속하는 상기 계수의 수가 편중되도록, 상기 블록을 상기 복수의 그룹으로 구분한다.
본 발명의 일양태에 관련된 화상 부호화 복호 장치는, 화상 데이터를 블록마다 부호화하여 부호화 화상 데이터를 생성하는 화상 부호화 장치와, 상기 부호화 화상 데이터를 블록마다 복호하는 화상 복호 장치를 구비한다. 상기 화상 부호화 장치는, 주파수 성분마다의 복수의 계수를 포함하는 상기 블록을, 상기 복수의 계수의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하고, 상기 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정하는 제1 콘텍스트 결정부와, 2치화된 상기 복수의 계수 각각을, 상기 계수가 속하는 상기 그룹에 대응지어진 상기 콘텍스트의 확률 정보에 따라서 2치 산술 부호화하는 2치 산술 부호화부와, 상기 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 상기 그룹에 속하는 상기 계수에 기초하여 갱신하는 제1 갱신부를 구비한다. 상기 화상 복호 장치는, 상기 부호화 화상 데이터의 일부인 복호 대상 신호를 포함하는 상기 블록을, 상기 복호 대상 신호의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하고, 상기 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정하는 제2 콘텍스트 결정부와, 상기 복호 대상 신호를, 상기 복호 대상 신호가 속하는 상기 그룹에 대응지어진 상기 콘텍스트의 확률 정보에 따라서 2치 산술 복호함으로써, 2치화된 계수를 생성하는 2치 산술 복호부와, 상기 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 상기 그룹에 속하는 상기 계수에 기초하여 갱신하는 제2 갱신부를 구비한다. 그리고, 상기 제1 및 제2 콘텍스트 결정부는, 상기 복수의 그룹 각각에 속하는 상기 계수의 수가 편중되도록, 상기 블록을 상기 복수의 그룹으로 구분한다.
본 발명에 의하면, 그룹마다 적절한 콘텍스트를 이용하여 부호열을 생성하여, 복호 장치에 있어서도 대응하는 콘텍스트를 이용하여 복호하는 것이 가능해진다.
도 1은, 비교예에 관련된 산술 부호화 방법을 나타내는 플로차트이다.
도 2는, 비교예에 관련된 산술 부호화 장치의 구성을 나타내는 블럭도이다.
도 3은, 본 발명의 실시의 형태 1에 관련된 산술 부호화부의 구성의 일례를 나타내는 블럭도이다.
도 4는, 본 발명의 실시의 형태 1에 관련된 심볼 발생 확률 테이블의 일례를 나타내는 도이다.
도 5는, 본 발명의 실시의 형태 1에 관련된 콘텍스트 테이블(부호화되는 맵핑 정보)의 예를 나타내는 도이다.
도 6은, 본 발명의 실시의 형태 1에 관련된 산술 부호화 방법의 일례를 나타내는 플로차트이다.
도 7은, 본 발명의 실시의 형태 1에 관련된 산술 부호화 방법의 일례를 나타내는 플로차트이다.
도 8은, 본 발명의 실시의 형태 1에 관련된 콘텍스트 구분 제어의 일례를 나타내는 플로차트이다.
도 9a는, 블록에 대해 설정된 그룹의 모식도이다.
도 9b는, 8x8 블록의 각 그룹에 포함되는 계수의 예를 나타내는 도이다.
도 9c는, 4x4 블록의 각 그룹에 포함되는 계수의 예를 나타내는 도이다.
도 10은, 본 발명의 실시의 형태 1에 관련된 화상 부호화 장치의 구성의 일례를 나타내는 블럭도이다.
도 11은, 본 발명의 실시의 형태 2에 관련된 산술 복호부의 구성의 일례를 나타내는 블럭도이다.
도 12는, 본 발명의 실시의 형태 2에 관련된 산술 복호 방법의 일례를 나타내는 플로차트이다.
도 13은, 본 발명의 실시의 형태 2에 관련된 산술 복호 방법의 일례를 나타내는 플로차트이다.
도 14는, 본 발명의 실시의 형태 2에 관련된 화상 복호 장치의 구성의 일례를 나타내는 블럭도이다.
도 15는, 본 발명의 실시의 형태 3에 관련된 부호화 방법의 개념을 설명하는 도이다.
도 16은, 제어 파라미터와 도 5에 나타내는 맵핑 정보의 대응 관계를 설명하는 도이다.
도 17은, 본 발명의 실시의 형태 3에 관련된 맵핑 정보의 다른 표현예를 설명하는 도이다.
도 18은, 컨텐츠 전송 서비스를 실현하는 컨텐츠 공급 시스템의 전체 구성도이다.
도 19는, 디지털 방송용 시스템의 전체 구성도이다.
도 20은, 텔레비전의 구성예를 나타내는 블럭도이다.
도 21은, 광디스크인 기록 미디어에 정보의 읽고 쓰기를 행하는 정보 재생/기록부의 구성예를 나타내는 블럭도이다.
도 22는, 광디스크인 기록 미디어의 구조예를 나타내는 도이다.
도 23은, (a) 휴대 전화의 일례를 나타내는 도, (b) 휴대 전화의 구성예를 나타내는 블럭도이다.
도 24는, 다중화 데이터의 구성을 나타내는 도이다.
도 25는, 각 스트림이 다중화 데이터에 있어서 어떻게 다중화되고 있는지를 모식적으로 나타내는 도이다.
도 26은, PES 패킷열에, 비디오 스트림이 어떻게 기억되는지를 더 상세하게 나타낸 도이다.
도 27은, 다중화 데이터에 있어서의 TS패킷과 소스 패킷의 구조를 나타내는 도이다.
도 28은, PMT의 데이터 구성을 나타내는 도이다.
도 29는, 다중화 데이터 정보의 내부 구성을 나타내는 도이다.
도 30은, 스트림 속성 정보의 내부 구성을 나타내는 도이다.
도 31은, 영상 데이터를 식별하는 단계를 나타내는 도이다.
도 32는, 각 실시의 형태의 동화상 부호화 방법 및 동화상 복호화 방법을 실현하는 집적회로의 구성예를 나타내는 블럭도이다.
도 33은, 구동 주파수를 전환하는 구성을 나타내는 도이다.
도 34는, 영상 데이터를 식별하여, 구동 주파수를 전환하는 단계를 나타내는 도이다.
도 35는, 영상 데이터의 규격과 구동 주파수를 대응지은 룩업 테이블의 일례를 나타내는 도이다.
도 36은, (a) 신호 처리부의 모듈을 공유화하는 구성의 일례를 나타내는 도, (b) 신호 처리부의 모듈을 공유화하는 구성의 다른 일례를 나타내는 도이다.
우선, 본 발명의 비교예에 관련된 산술 부호화 처리의 동작을 참조하면서, 본 발명에 이른 경위를 설명한다.
우선, 도 1을 이용하여, 비교예에 관련된 산술 부호화의 흐름을 이하에 설명한다.
부호화 대상 신호가, 예를 들면 양자화 계수와 같은 블록 사이즈가 관계하는 신호의 경우, 블록 사이즈의 판정이 행해진다. 산술 부호화가 개시되면, 우선, 신호의 종별에 따라, 미리 결정된 수법으로 2치화(Binarization)가 행해진다(S11). 다음에, 블록 사이즈의 정보를 포함하는 신호의 종별에 따른 콘텍스트 제어 처리가 행해진다(S12). 콘텍스트 제어 처리에서는, 신호의 종별에 대응한 심볼 발생 확률을, 복수의 심볼 발생 확률을 기억하고 있는 메모리로부터 독출하여 출력한다. 다음에, 단계 S12에서 출력된 심볼 발생 확률을 이용하여, 처리 대상의 정보에 산술 부호화를 행하고, 결과를 출력 신호로서 출력한다(S13).
그리고, 단계 S11에서 산출된 2치화 정보에 기초하여, 대응하는 심볼 발생 확률의 값을 갱신하여, 심볼 발생 확률로서 기억한다(S14). 처리 대상의 정보의 산술 부호화가 완료되면, 또, 다음의 처리 대상의 정보의 산술 부호화를 행한다.
도 2는, 종래의 H.264/AVC의 산술 부호화의 처리를 나타낸 산술 부호화부의 구성을 나타내는 블럭도이다. 도 2에 나타내는 바와 같이, 산술 부호화부(10)는, 2치화부(11)와, 심볼 발생 확률 기억부(12)와, 콘텍스트 제어부(13)와, 2치 산술 부호화기(14)를 포함하고 있다.
산술 부호화부(10)에는, 부호화 대상 신호인 입력 신호 SI와, 상기 입력 신호 SI의 종별을 나타내는 신호 종별 정보 SE가 입력된다. 2치화부(11)는, 신호 종별 정보 SE에 기초하여, 입력 신호 SI를 “0”, “1”의 2치의 정보(심볼)로 변환하여, 2치 신호 BIN으로서 2치 산술 부호화기(14)와 콘텍스트 제어부(13)에 출력한다.
콘텍스트 제어부(13)는, 신호 종별 정보 SE에 대응하는 콘텍스트의 심볼 발생 확률 PE를, 심볼 발생 확률 기억부(12)에 출력한다. 또, 콘텍스트 제어부(13)는, 2치화부(11)로부터 취득한 입력 신호 SI에 대응하는 2치 신호 BIN에 기초하여, 신호 종별 정보 SE에 대응하는 콘텍스트의 심볼 발생 확률 PE의 갱신 처리를 행하고, 갱신 결과를 심볼 발생 확률 기억부(12)에 기억한다.
2치 산술 부호화기(14)는, 심볼 발생 확률 PE에 기초하여, 2치 신호 BIN에 산술 부호화 처리를 행하고, 출력 비트 정보 OB를 생성하여 출력한다.
이 산술 부호화 기술에서는, 콘텍스트 제어부(13)에 있어서, 대상 신호의 정보 종별의 단위마다 심볼 발생 확률을 1개 도출한다. 예를 들면, H.264의 것에서는, 산술 부호화부(10)가 구별하는 정보 종별로서, 양자화 계수의 위치(주파수 성분)가 있다. 이 경우, 산술 부호화부(10)는, 양자화 계수의 위치마다(주파수 성분마다) 다른 심볼 발생 확률 등의 콘텍스트를 적용한다. 예를 들면, 4×4의 사이즈의 양자화 계수이면 16개의 위치(주파수 성분)가 존재하고, 산술 부호화부(10)는, 양자화 계수의 위치마다 다른 콘텍스트를 사용하여 산술 부호화를 행하고 있다.
발명자들은, 어떤 종류의 정보 종별의 산술 부호화에 있어서는 정보 종별의 단위(최소단위)가 아닌, 어느 정도 복수의 정보 종별을 집약하여 콘텍스트를 이용하는 것이, 부호화 효율이 향상되는 것을 깨달았다. 세밀한 그룹마다(예를 들면, 최소의 단위인 신호의 종별마다) 1개의 콘텍스트를 설정한 경우, 그 그룹에 대한 심볼 발생 확률의 갱신 처리의 발생 빈도가 저하되어, 산술 부호화의 이점인 화상 데이터의 특징에 적응시킨 제어가 곤란해진다. 그 결과, 부호화 효율이 악화된다.
또한, 이 검토를 해 나가는데 있어서, 공통의 콘텍스트가 적용되는 1그룹의 길이(또는 크기)를 어느 정도로 하는지는, 원칙적으로 화상 데이터에 의존하여 가변으로 하고 싶다. 그러나, 집약의 최적의 단위 또는 집약의 단위와 대응하는 콘텍스트의 대응 관계를 나타내는 정보가, 기존의 정보 정의에는 존재하지 않는 것을 깨달았다. 또한, 발명자들은, 몇가지의 정보 종별에 대해서, 최적의 그룹의 길이가 소정의 제어 파라미터 단위로 결정될 수 있는 것을 열거할 수 있는 것을 깨달았다.
이하, 본 발명의 실시의 형태에 대해서, 도면을 참조하면서 설명한다.
(실시의 형태 1)
본 발명의 실시의 형태 1에 관련된 화상 부호화 방법의 개요에 대해서 설명한다. 본 실시의 형태의 화상 부호화 방법에서는, 부호화 대상이 되는 신호의 종별을 주파수 성분에 기초하여 소정수의 그룹으로 분류하고, 분류된 소정수의 그룹의 각각에 대해 미리 신호의 종별마다 준비된 심볼 발생 확률을 이용하여 산술 부호화가 행해진다. 그리고, 신호의 종별(혹은 그룹의 종별)과 적용되는 심볼 발생 확률 등의 콘텍스트의 대응 관계를 나타내는 맵핑 정보를, 부호화 스트림에 더하여 출력한다.
이것에 의해, 각 그룹에 포함되는 계수를 부호화할 때에, 공통된 통계 정보에 기초하는 심볼 발생 확률을 사용하여 산술 부호화할 수 있으므로, 부호화 효율의 향상이 가능해진다. 또한, 1개의 그룹에 포함되는 1 이상의 계수를 공통의 콘텍스트를 이용하여 부호화함으로써, 계수마다 다른 콘텍스트를 이용하여 부호화하는 경우보다 콘텍스트의 수를 줄일 수 있다. 따라서, 실장 시의 메모리 사이즈를 삭감하는 것이 가능해진다. 또한, 상기 그룹을 변경하는 경우여도, 복호 장치에서는 변경을 적용한 복호를 행할 수 있다.
이상이, 본 실시의 형태의 산술 부호화 방법의 개요에 대한 설명이다.
다음에, 본 실시의 형태의 산술 부호화 방법을 행하는 산술 부호화부의 구성에 대해서 설명한다. 도 3은, 본 발명의 실시의 형태 1에 관련된 산술 부호화부(100)의 구성의 일례를 나타내는 블럭도이다. 또한, 후술하는 바와 같이, 본 발명의 실시의 형태 1에 관련된 산술 부호화부(100)는, 화상 데이터를 압축 부호화하는 화상 부호화 장치의 일부에 상당한다.
도 3에 나타내는 바와 같이, 산술 부호화부(100)는, 2치화부(101)와, 심볼 발생 확률 기억부(102)와, 콘텍스트 제어부(103)와, 2치 산술 부호화기(104)와, 콘텍스트 구분 제어부(105)를 구비한다.
산술 부호화부(100)는, 부호화 대상 신호인 입력 신호 SI를 산술 부호화함으로써, 출력 신호 OB를 생성하여 출력한다. 또, 산술 부호화부(100)에는, 입력 신호 SI의 종별을 나타내는 신호 종별 정보 SE가 입력된다. 입력 신호 SI가 양자화 계수에 관련하는 신호인 경우, 신호 종별 정보 SE는 계수 위치를 나타내는 정보를 포함한다.
또한, 입력 신호 SI는, 화상 데이터의 부호화 대상 신호이며, 예를 들면, 화상 데이터가 변환 및 양자화되어 생성된 양자화 계수를 나타내는 신호이다. 또한, 입력 신호 SI는, 양자화 계수 그 자체가 아닌, 양자화 계수를 생성하기 위해 이용한 정보여도 된다.
신호 종별 정보 SE는, 입력 신호 SI가 매크로 블록에 포함되는 복수의 양자화 계수 중 하나인 경우에, 상기 양자화 계수의 매크로 블록 내에 있어서의 위치(계수 위치)를 나타내는 정보여도 된다.
또, 입력 신호 SI는, 양자화 계수의 주위의 양자화 계수가 제로인지 비제로인지를 나타내는 정보를 포함해도 된다. 보다 구체적으로는, 입력 신호 SI는, 매크로 블록의 직류 성분의 양자화 계수가 제로인지 비제로인지를 나타내는 정보를 포함해도 된다.
또한, 입력 신호 SI는, 복수의 양자화 계수를 어느 특정의 순서로 스캔하는 경우에 있어서, 양자화 계수가 비제로 계수인 경우에, 그 비제로 계수가 스캔순으로 마지막 비제로 계수인지 어떤지를 나타내는 신호를 포함해도 된다.
2치화부(101)는, 부호화 대상 신호를 2치화함으로써, 2치 신호를 생성한다. 구체적으로는, 2치화부(101)는, 입력 신호 SI와 신호 종별 정보 SE에 기초하여, 입력 신호 SI의 2치화(Binarization)를 행함으로써, 2치 신호 BIN을 생성한다. 보다 구체적으로는, 2치화부(101)는, 입력 신호 SI의 각 처리 단위에 포함되는 주파수 영역의 계수를 2치화함으로써, 2치 신호를 생성한다.
또한, 처리 단위란, 공간 영역 혹은 주파수 영역에 있어서 화상을 분할함으로써 얻어지는 블록이다. 이 처리 단위마다 부호화에 관한 처리가 행해진다. 예를 들면, 처리 단위는, 변환 단위(TU:Transform Unit)이다. 또한, 이하에서는, 처리 단위를, 매크로 블록으로 표현하는 경우도 있지만, 처리 단위는, 매크로 블록에 제한될 필요는 없다.
심볼 발생 확률 기억부(102)는, 복수의 심볼 발생 확률을 유지하는 메모리 등이다. 예를 들면, 심볼 발생 확률 기억부(102)는, 심볼 발생 확률 테이블을 유지한다. 심볼 발생 확률 테이블은, 콘텍스트와 확률 정보를 대응지은 테이블이다. 심볼 발생 확률 테이블의 상세에 대해서는, 다음에 설명한다.
또, 심볼 발생 확률 기억부(102)는, 콘텍스트 테이블을 유지한다. 콘텍스트 테이블은, 부호화 대상 신호의 종별과 콘텍스트를 대응지은 테이블이다. 콘텍스트 테이블의 상세에 대해서는, 다음에 설명한다.
콘텍스트 제어부(103)는, 부호화 대상 신호의 종별에 기초하여, 상기 부호화 대상 신호의 콘텍스트를 결정한다. 구체적으로는, 콘텍스트 제어부(103)는, 우선, 신호 종별 정보 SE를 취득함과 함께, 콘텍스트 구분 제어부(105)로부터 제어 신호 CTRS를 취득한다. 그리고, 콘텍스트 제어부(103)는, 취득한 신호 종별 정보 SE 및 제어 신호 CTRS에 기초하여, 콘텍스트 테이블을 참조함으로써, 부호화 대상 신호의 콘텍스트를 결정한다.
이 때, 콘텍스트 제어부(103)는, 제어 신호 CTRS에 의해 지정된 그룹에 기초하여 콘텍스트를 결정한다. 여기서, 1개의 그룹이 복수의 계수를 포함하는 경우, 콘텍스트 제어부(103)는, 그들 복수의 계수에 공통의 콘텍스트를 결정한다. 즉, 콘텍스트 제어부(103)는, 제어 신호 CTRS가 나타내는 그룹에 포함되는 복수의 계수에 대해 공통의 콘텍스트를, 2치 신호를 위한 콘텍스트로서 결정한다.
또한, 콘텍스트 제어부(103)가, 콘텍스트 테이블을 유지하고 있어도 된다. 이 콘텍스트 테이블을 복원하기 위한 맵핑 정보(mapping Info)는, 후술하는 엔트로피 부호화부(220)에 의해 부호화되고, 부호화 스트림에 더해져 출력된다. 또한, 맵핑 정보란, 예를 들면, 제1 콘텍스트가 공통으로 적용되는 정보 종별의 집합, 제2 콘텍스트가 공통으로 적용되는 정보 종별의 집합, 및 제n 콘텍스트가 공통으로 적용되는 정보 종별의 집합과, 각 콘텍스트의 대응 관계를 나타내는 정보이다.
콘텍스트 구분 제어부(105)의 동작에 대해서는, 다음에 설명한다.
또한, 콘텍스트 제어부(103)는, 결정한 콘텍스트에 대응하는 부호화 확률 정보를 결정한다. 즉, 콘텍스트 제어부(103)는, 심볼 발생 확률 테이블을 참조함으로써, 심볼 발생 확률 기억부(102)에 기억되어 있는 복수의 심볼 발생 확률 중 어느 심볼 발생 확률을 사용하는지를 결정한다. 부호화 확률 정보는, 2치 신호의 산술 부호화에 이용하는 확률 정보이다. 또한, 부호화 확률 정보는, 예를 들면, 심볼 발생 확률의 값을 나타내는 인덱스, 또는, 심볼 발생 확률의 값이다. 또한, 이하에 있어서, 부호화 확률 정보를 간단히 확률 정보로 표기하는 경우가 있다.
이와 같이, 콘텍스트 제어부(103)는, 결정한 콘텍스트에 대응하는 심볼 발생 확률을 심볼 발생 확률 기억부(102)로부터 독출하여, 2치 산술 부호화기(104)에 출력한다.
2치 산술 부호화기(104)는, 부호화 확률 정보를 이용하여 2치 신호를 산술 부호화한다. 구체적으로는, 2치 산술 부호화기(104)는, 심볼 발생 확률 기억부(102)가 출력하는 심볼 발생 확률 PE를 이용하여, 2치화부(101)가 생성한 2치 신호 BIN의 산술 부호화를 행한다.
이상이, 본 실시의 형태의 산술 부호화부(100)의 구성에 대한 설명이다.
여기서, 심볼 발생 확률 기억부(102)가 유지하는 심볼 발생 확률 테이블에 대해서 설명한다. 도 4는, 본 발명의 실시의 형태 1에 관련된 심볼 발생 확률 테이블의 일례를 나타내는 도이다.
심볼 발생 확률 테이블은, 콘텍스트와 심볼 발생 확률을 대응지은 테이블이다. 도 4에 있어서의 인덱스(ctxIdx)는, 콘텍스트를 나타내는 인덱스이다. 구체적으로는, 인덱스는, 부호화 중의 매크로 블록의 주변의 정보, 블록 내의 이미 부호화를 마친 정보, 또는 부호화하는 비트 위치에 따라 정해진다.
각 인덱스가 나타내는 엔트리는, 심볼 발생 확률을 나타내는 확률 정보(pStateIdx)와, 발생 확률이 높은 심볼(Most Probable Symbol)을 나타내는 심볼(valMPS)을 포함하고 있다. 이들은, H.264 규격에 나타내어지는 것과 동등하다. 즉, pStateIdx는, 심볼 발생 확률의 값을 나타내는 인덱스이다. 심볼 발생 확률 기억부(102)는, 또한, pStateIdx에 대응하는 심볼 발생 확률의 값을 나타내는 테이블을 유지하고 있다.
또한, 여기에서는, 심볼 발생 확률 테이블은, 심볼 발생 확률을 나타내는 인덱스(pStateIdx)와 콘텍스트(ctxIdx)를 대응지어 관리하고 있지만, 콘텍스트와 심볼 발생 확률의 값을 직접 대응지어 관리해도 된다. 예를 들면, 심볼 발생 확률의 값을 16비트 정밀도(0-65535)로 나타냄으로써, 상기 테이블로 관리하는 것보다도 상세한 값을 취급할 수 있다. 이 때문에, 부호화 효율을 향상시킬 수 있다. 이후, 심볼 발생 확률을 값으로 하여 관리하는 방법으로 설명한다.
다음에, 심볼 발생 확률 기억부(102)가 유지하는 콘텍스트 테이블에 대해서 설명한다. 도 5는, 본 발명의 실시의 형태 1에 관련된 콘텍스트 테이블의 일례를 나타내는 도이다.
콘텍스트 테이블은, 복수의 종별과 콘텍스트를 대응지은 테이블이다. 입력 신호 SI가 양자화 계수에 관련하는 신호이며, 또한 신호 종별 정보 SE가 블록 내에 있어서의 양자화 계수 위치를 나타내는 정보를 나타내는 경우, 콘텍스트 구분 제어부(105)는, 부호화 대상 신호의 종별에 대응지어져 있는 콘텍스트 테이블을 선택한다. 도 5에 나타내는 콘텍스트 테이블에 있어서, 신호 종별 정보 SE의 번호는, 스캔 순서에 대응하고 있다. 즉, 도 5의 신호 종별 정보 SE는, 번호 0이 직류 성분(DC)의 계수를 나타내고, 번호가 커짐에 따라, 고주파수 성분의 계수를 나타내는 예이다.
또, 동일한 콘텍스트에 대응지어지는 계수(신호 종별 정보 SE의 번호)의 집합이 1개의 그룹에 상당한다. 즉, 도 5에서는, 동일한 그룹에 포함되는 모든 계수에 대해 공통의 콘텍스트가 설정되어 있다.
예를 들면, 도 5의 (a)에 있어서, 신호 종별 정보 SE의 번호 0~2는, 제1 그룹에 포함되는 계수인 것을 나타낸다. 또한, 제1 그룹에 포함되는 복수의 계수에 대해 공통의 콘텍스트(콘텍스트 인덱스“0”의 콘텍스트)가 설정되어 있다. 또, 신호 종별 정보 SE의 번호 3~n은, 제2 그룹에 포함되는 계수이며, 콘텍스트 인덱스“1”의 콘텍스트가 설정되어 있다. 또한, 신호 종별 정보 SE가 나타내는 계수 위치가, 어느 일정한 위치를 넘은 경우, 도 5의 (b)에 나타내는 바와 같이, 일정한 위치(신호 종별 정보 SE≥20)를 넘은 모든 계수 위치는, 제4 그룹에 포함되는 계수이며, 콘텍스트 인덱스“3”이 설정되어 있다. 또한, 도 5에서는, 제3 그룹의 도시를 생략하고 있다.
이 콘텍스트 테이블은, 정보 종별과 콘텍스트의 대응 관계를 나타내는 것이며, 맵핑 정보로서 부호열에 더해진다.
도 5의 (c)는, 맵핑 정보의 다른 부호화의 예를 나타내는 도이다. 도 5의 (c)에는, 맵핑 정보의 인덱스(4x4mapIdx)와, 각각의 인덱스에 대응하는 맵핑 정보가 나타나 있다. 맵핑 정보는, 정보 종별 SE로서 4×4의 양자화 계수의 위치(주파수 성분 0~15)와 대응하는 콘텍스트의 대응 관계를 나타낸다. 이 경우, 부호화 장치 및 복호화 장치에서는, 4x4mapping Info의 각각을 로컬로 유지한다. 엔트로피 부호화부는, 4x4mapIdx의 0~n 중 어느 하나의 값을 부호화하여 부호열에 더하게 된다.
예를 들면, 4x4mapIdx=0의 예에서는, 주파수 성분 0(제1 그룹)에 콘텍스트 0이 대응지어지고, 주파수 성분 1~2(제2 그룹)에 콘텍스트 1이 대응지어지며, 주파수 성분 3~9(제3 그룹)에 콘텍스트 2가 대응지어지고, 주파수 성분 10~15(제4 그룹)에 콘텍스트 3이 대응지어져 있다. 즉, DC성분을 포함하는 제1 그룹이 가장 작고, 제3 그룹이 가장 큰 예이다.
또, 4x4mapIdx=1의 예에서는, 주파수 성분 0~2(제1 그룹)에 콘텍스트 0이 대응지어지고, 주파수 성분 3~5(제2 그룹)에 콘텍스트 1이 대응지어지며, 주파수 성분 6~15(제3 그룹)에 콘텍스트 2가 대응지어져 있다. 즉, DC성분을 포함하는 제1 그룹이 가장 작고, 가장 높은 주파수 성분 15를 포함하는 제3 그룹이 가장 큰 예이다.
또, 4x4mapIdx=2의 예에서는, 주파수 성분 0~3(제1 그룹)에 콘텍스트 0이 대응지어지고, 주파수 성분 4~15(제2 그룹)에 콘텍스트 1이 대응지어져 있다. 또, 4x4mapIdx=k의 예에서는, 주파수 성분 0(제1 그룹)에 콘텍스트 0이 대응지어지고, 주파수 성분 1~15(제2 그룹)에 콘텍스트 1이 대응지어져 있다. 이들은, DC성분을 포함하는 제1 그룹이 가장 작고, 가장 높은 주파수 성분 15를 포함하는 제2 그룹이 가장 큰 예이다.
상기의 각 예와 같이, 각 그룹의 크기(각 그룹에 속하는 계수의 수)가 편중되도록, 그룹화하는 것이 바람직하다. 주파수 성분마다의 계수의 특성에 따라, 적절한 크기의 그룹으로 구분할 수 있다. 예를 들면, DC성분의 계수는 비제로가 될 확률이 높기 때문에, DC성분을 포함하는 그룹은 상대적으로 작게 하는 것이 바람직하다. 한편, 높은 주파수 성분의 계수는 제로가 될 확률이 높기 때문에, 이러한 주파수 성분을 포함하는 그룹은 상대적으로 크게 하는 것이 바람직하다.
한편, 4x4mapIdx=n의 예에서는, 주파수 성분 0~15와 콘텍스트 0~15가 일대일로 대응지어져 있다. 즉, 모든 그룹의 크기가 공통되어 있는 예이다.
도 5에 나타내는 바와 같은 콘텍스트 테이블을 참조함으로써, 콘텍스트 제어부(103)는, 1개의 그룹에 포함되는 2치화된 복수의 계수에 대해, 2치 신호를 산술 부호화하기 위한 콘텍스트를 결정한다.
또한, 「블록을 복수의 그룹으로 구분하고, 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정한다」란, 예를 들면, 도 5의 (c)과 같이 미리 준비된 복수의 패턴(블록의 그룹화 및 각 그룹과 콘텍스트의 대응 관계의 패턴) 중 하나를 선택하는 것을 포함하는 것으로 한다.
다음에, 도 3에 나타낸 산술 부호화부(100)가 행하는 산술 부호화 방법을, 도 6에 나타내는 플로차트에 따라서 설명한다. 도 6은, 본 발명의 실시의 형태 1에 관련된 산술 부호화 방법의 일례를 나타내는 플로차트이다. 또, 도 6은, 부호화 대상 신호가 1개의 블록에 대응하는 양자화 계수군이며, 1개의 블록에 대응하는 양자화 계수군 중, 각 계수가 제로 계수인지, 비제로 계수인지를 나타내는 정보를 부호화하는 경우의 산술 부호화 방법을 나타내고 있다.
도 6에 나타내는 바와 같이, 우선, 2치화부(101)는, 부호화 대상이 되는 입력 신호 SI에 포함되는 복수의 양자화 계수 각각의 2치화를 실시한다(S101). 구체적으로는, 2치화부(101)는, 입력 신호 SI에 포함되는 복수의 양자화 계수를, 미리 결정된 스캔순서(예를 들어, 지그재그 스캔순)에 의해 독출한다. 그 경우에, 2치화부(101)는, 양자화 계수가 0이 아닌(즉, 양자화 계수가 비제로 계수이다) 경우와 제로인(즉, 양자화 계수가 제로 계수이다) 경우를, “0” 또는 “1”로 표현함으로써 2치화를 행한다. 구체적으로는, 2치화부(101)는, 이 양자화 계수가 비제로 계수인지를 나타내는 신호를, 2치 신호로서 생성한다. 여기서 생성되는 2치 신호는, SignificantFlag로 불린다.
여기서, 양자화 계수가 비제로 계수인 경우, 2치화부(101)는, 상기 서술한 스캔순서로 독출한 비제로 계수 이후에 아직 비제로 계수가 있는지 없는지를 “0” 또는 “1”로 표현함으로써, 2치 신호를 생성한다. 여기서 생성되는 2치 신호는, LastFlag로 불린다.
이러한 2치 신호를 생성함으로써, 스캔순으로 마지막 비제로 계수 이후에 스캔되는 제로 계수의 SignificantFlag를 부호화할 필요가 없어지기 때문에, 정보량을 삭감할 수 있다.
다음에, 산술 부호화부(100)는, 2치 신호의 하나인 SignificantFlag에 대해 산술 부호화를 실시한다(S102). 또한, 산술 부호화에 대해서는, 예를 들면, H.264와 동일한 방법이어도 된다. 다음에, 산술 부호화부(100)는, 부호화 대상의 계수가 제로 계수인지 아닌지를 판단한다(S103).
부호화 대상의 계수가 제로 계수가 아니면(S103에서 NO), 산술 부호화부(100)는, 다음의 SignificantFlag에 대한 처리를 행한다. 한편, 부호화 대상의 계수가 비제로 계수이면(S103에서 YES), 산술 부호화부(100)는, 그 비제로 계수가 스캔순으로 마지막 비제로 계수인지 어떤지를 나타내는 LastFlag에 대해 산술 부호화를 실시한다(S104). 또한, 산술 부호화의 상세에 대해서는, 다음에 상세하게 설명한다.
다음에, 산술 부호화부(100)는, 부호화 대상의 계수가 스캔순으로 마지막 비제로 계수인지 아닌지를 판단한다(S105). 그리고, 부호화 대상의 계수가 스캔순으로 마지막 비제로 계수가 아니면(S105에서 NO), 산술 부호화부(100)는, 다음의 SignificantFlag에 대한 처리를 행한다. 한편, 부호화 대상의 계수가 스캔순으로 마지막 비제로 계수이면(S105에서 YES), 산술 부호화부(100)는, 비제로 계수의 계수치(레벨)의 정보에 대한 부호화를 실시한다(S106). 여기서, 비제로 계수의 계수 레벨에 대한 부호화(구체적으로는, 2치화 및 산술 부호화) 방법에 대해서는, 예를 들면 H.264와 동일한 방법으로 한다.
도 7은, 본 발명의 실시의 형태 1에 관련된 산술 부호화 방법의 일례를 나타내는 플로차트이다. 예를 들면, 도 7의 산술 부호화 방법은, 도 6에서 나타내는 산술 부호화 단계(도 6의 S102, S104)에 대응한다.
도 7의 산술 부호화 방법은, 우선, 주파수 성분마다의 복수의 계수를 포함하는 블록을, 복수의 계수의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하고, 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정한다(S201, S202). 다음에, 2치화된 복수의 계수 각각을, 상기 계수가 속하는 그룹에 대응지어진 콘텍스트의 확률 정보에 따라서 2치 산술 부호화한다(S203). 그리고, 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 그룹에 속하는 계수에 기초하여 갱신한다(S204).
구체적으로는, 콘텍스트 구분 제어부(105)는, 우선, 위치 정보를 포함하는 신호 종별 정보 SE를 취득한다(S201). 다음에, 콘텍스트 구분 제어부(105)는, 취득한 위치 정보에 기초하여, 부호화 대상 신호의 그룹을 결정하고, 결정한 그룹을 특정하기 위한 제어 신호 CTRS를 콘텍스트 제어부(103)에 출력한다. 콘텍스트 제어부(103)는, 부호화 대상 신호의 종별에 관련지어져 있는 콘텍스트 테이블을 참조하여, 콘텍스트 구분 제어부(105)로부터 얻어지는 제어 신호 CTRS가 나타내는 그룹에 대응하는 콘텍스트를, 입력 신호 SI에 대응하는 콘텍스트로서 결정한다(S202). 또한, 콘텍스트 구분 제어부(105)의 동작의 상세에 대해서는, 다음에 상세하게 설명한다.
다음에, 심볼 발생 확률 기억부(102)는, 콘텍스트 제어부(103)에 의해 결정된 콘텍스트에 대응하는 심볼 발생 확률을 독출하여, 부호화 확률 정보로서 2치 산술 부호화기(104)에 출력한다.
2치 산술 부호화기(104)는, 부호화 확률 정보를 이용하여 2치 신호를 산술 부호화한다(S203). 구체적으로는, 2치 산술 부호화기(104)는, 심볼 발생 확률 기억부(102)로부터 취득한 심볼 발생 확률을 이용하여, H.264 규격에 나타내어지는 방법에 의해, 2치화부(101)로부터 취득한 2치 신호의 산술 부호화를 행한다.
콘텍스트 제어부(103)는, 2치화부(101)에 의해 생성된 2치 신호에 기초하여, 확률 정보를 갱신한다(S204). 구체적으로는, 콘텍스트 제어부(103)는, 심볼 발생 확률 기억부(102)에 기억된 심볼 발생 확률 중, 부호화 대상 신호의 콘텍스트에 대응하는 심볼 발생 확률을, 2치화부(101)로부터 취득하는 2치 신호에 따라 갱신한다. 또한, 심볼 발생 확률의 갱신은, 예를 들면 H.264 규격에 나타내어지는 방법에 의해 행한다.
다음에, 콘텍스트 구분 제어부(105)의 동작(도 7의 단계 S201~S202에 대응)에 대해서, 도 8, 및 도 9a~도 9c를 이용하여 설명한다. 도 8은, 본 발명의 실시의 형태 1에 관련된 콘텍스트 구분 제어부(105)의 동작의 일례를 나타내는 플로차트이다. 도 9a~도 9c는, 본 발명의 실시의 형태 1에 관련된 콘텍스트 구분 제어부(105)의 동작을 설명하기 위한 모식도이다.
콘텍스트 구분 제어부(105)는, 예를 들면, 상기 서술한 LastFlag를 부호화하는 경우에 다음과 같이 동작한다.
콘텍스트 구분 제어부(105)는, 부호화 대상인 LastFlag의 계수 위치 정보를 취득한다(S301). 다음에, 콘텍스트 구분 제어부(105)는, 이하의 단계 S302~S308에 나타내는 바와 같이, LastFlag의 계수 위치 정보로부터 취득할 수 있는 주파수 성분에 기초하여, 상기 LastFlag의 콘텍스트를 판단한다.
양자화 계수는, 화상 신호가 주파수 변환되어, 양자화된 후의 신호이다. 따라서, 계수 위치는, 주파수 변환된 양자화 계수의 주파수 성분과 대응한다. 예를 들면, 저주파수 성분에 대응하는 양자화 계수는 좌측 위에 위치하고, 고주파수 성분에 대응하는 양자화 계수는 우측 아래에 위치한다.
복수의 양자화 계수는, 상기 서술한 바와 같이 특정의 스캔순서로 독출된다. 여기서 스캔순서란, 예를 들면, H.264와 동일하게 블록을 우측 위로부터 좌측 아래 방향으로 차례차례 독출하고, 블록의 끝에서 독출하는 방향을 전환하는 지그재그 스캔으로 불리는 방법이어도 된다. 이 스캔에 의해, 각각의 위치의 양자화 계수는, 대응하는 주파수 성분에 대한 연속성을 가진 1차원 배열로 순차적으로 기억된다.
이와 같이, 정보 종별 SE는, 어떠한 성질에 따라, 소정수의 정보 종별의 집합(제1 그룹, 제2 그룹, 제3 그룹, 및 제4 그룹)으로 구분된다. 예를 들면, 본 실시의 형태의 경우는, 소정의 주파수 성분 F0보다 저주파수 성분의 영역에 위치하는 양자화 계수의 정보의 집합은, 제1 그룹으로 분류된다. 또, 주파수 성분 F0 이상이며 주파수 성분 F1보다 낮은 주파수 성분의 영역에 위치하는 양자화 계수의 정보의 집합은, 제2 그룹으로 분류된다. 또, 주파수 성분 F1 이상이며 주파수 성분 F2보다 낮은 주파수 성분의 영역에 위치하는 양자화 계수의 정보의 집합은, 제3 그룹으로 분류된다. 또한, 주파수 성분 F2 이상의 영역에 위치하는 양자화 계수의 정보의 집합은, 제4 그룹으로 분류된다.
다음에, 스캔에 의해 생성된 1차원 배열에 대해, 제1~제n그룹에 대응하는 콘텍스트(제1 콘텍스트, 제2 콘텍스트,···제n 콘텍스트)가 설정된다.
구체적으로는, 부호화 대상의 LastFlag가 미리 결정된 주파수 성분 F0보다 낮은 주파수 성분의 영역에 포함되는 경우, 즉, 제1 그룹에 포함되는 경우(S302에서 YES), 콘텍스트 구분 제어부(105)는, 이 LastFlag에 대해 주파수 성분 F0에 대응하는 제1 콘텍스트를 설정한다(S303).
한편, 부호화 대상의 LastFlag가 주파수 성분 F0보다 높은 주파수 성분의 영역에 포함되는 경우(S302에서 NO), 콘텍스트 구분 제어부(105)는, 부호화 대상의 LastFlag에 대응하는 주파수 성분과, 주파수 성분 F0보다 높은 주파수 성분 F1의 비교를 행한다(S304). 그리고, 이 LastFlag가 주파수 성분 F1보다 낮은 주파수 성분의 영역에 포함되는 경우, 즉, 제2 그룹에 포함되는 경우(S304에서 YES), 콘텍스트 구분 제어부(105)는, 이 LastFlag에 대해 주파수 성분 F1에 대응하는 제2 콘텍스트를 설정한다(S305).
한편, 부호화 대상의 LastFlag가 주파수 성분 F1보다 높은 주파수 성분의 영역에 포함되는 경우(S304에서 NO), 콘텍스트 구분 제어부(105)는, 부호화 대상의 LastFlag에 대응하는 주파수 성분과, 주파수 성분 F1보다 높은 주파수 성분 F2의 비교를 행한다(S306). 그리고, 이 LastFlag가 주파수 성분 F2보다 낮은 주파수 성분의 영역에 포함되는 경우, 즉, 제3 그룹에 포함되는 경우(S306에서 YES), 콘텍스트 구분 제어부(105)는, 이 LastFlag에 대해 주파수 성분 F2에 대응하는 제3 콘텍스트를 설정한다(S307).
한편, 부호화 대상의 LastFlag가 주파수 성분 F2보다 높은 주파수 성분의 영역에 포함되는 경우, 즉, 제4 그룹에 포함되는 경우(S306에서 NO), 콘텍스트 구분 제어부(105)는, 이 LastFlag에 대해 고주파수 성분용의 제4 콘텍스트를 설정한다(S308). 여기서 설정된 콘텍스트의 특정 정보는, 제어 신호 CTRS로서 콘텍스트 제어부(103) 등에 대해 출력된다.
또한, 직류 성분을 포함하는 저주파수 성분은, 화상의 특징이 가장 나타나기 쉬운 신호이다. 또한, 직류 성분을 포함하는 저주파수 성분에는, SignificantFlag 및 LastFlag 양쪽이 2치 신호로서 존재하는 빈도가 높다. 이 때문에, 직류 성분을 포함하는 저주파수 성분은, 통계 정보를 취득하기 쉬운 주파수 성분이라고 할 수 있다. 그 때문에, 고주파수 성분의 영역에 위치하는 그룹과 비교해, 저주파수 성분의 영역에 위치하는 그룹을 작게 함으로써, 보다 화상의 특징에 맞춘 통계 정보를 이용한 산술 부호화가 가능해지므로, 부호화 효율을 향상시킬 수 있다.
도 9a~도 9c를 이용하여 더 상세하게 설명한다. 도 9a는, 블록에 대해 설정된 그룹의 모식도이다. 도 9b는, 8x8 블록의 각 그룹에 포함되는 계수의 예를 나타내는 도이다. 도 9c는, 4x4 블록의 각 그룹에 포함되는 계수의 예를 나타내는 도이다. 도 9a~도 9c의 주파수 성분 F0, F1, F2는, 각각 도 8의 단계 S302, S304, S306에 있어서의 비교치를 나타낸다.
도 9a에 나타내는 정사각형은, 처리 단위인 블록을 나타낸다. 블록 내에는, 좌측 위로부터 우측 아래로 주파수 성분이 높아지도록 계수가 배치되어 있다. 여기에서는, 주파수 성분 F0, F1, F2가 각각 결정되어 있다.
그리고, 주파수 성분 F0보다 작은 주파수 성분의 영역(제1 그룹)에 대해, 제1 콘텍스트가 설정된다. 또, 주파수 성분 F0과 주파수 성분 F1로 둘러싸이는 영역(제2 그룹)에 대해, 제2 콘텍스트가 설정된다. 또, 주파수 성분 F1과 주파수 성분 F2로 둘러싸이는 영역(제3 그룹)에 대해, 제3 콘텍스트 F2가 설정된다. 또한, 주파수 성분 F2보다 높은 주파수 성분의 영역(제4 그룹)에 대해, 고주파수 전용의 제4 콘텍스트가 설정된다.
콘텍스트 구분 제어부(105)는, LastFlag의 부호화 시에, LastFlag에 대응하는 계수가 어느 그룹에 포함되는지를 판정함으로써, 상기 LastFlag의 콘텍스트를 결정할 수 있다.
또한, 도 9a에 나타내는 바와 같이, 저주파수 성분에 대한 제1 그룹은, 고주파수 영역에 대응하는 제2~제4 그룹보다 작게 구획되어 있다. 이것은, 저주파수 성분의 양자화 계수는, 고주파수 성분의 양자화 계수와 비교해 비제로가 되는 경우가 많기 때문에, 이와 같이 그룹을 설정함으로써, 통계 정보를 적절한 밸런스로 이용할 수 있다. 이것에 의해, 부호화 효율을 높일 수 있다.
도 9b는, 구체적으로 8x8 사이즈의 계수 블록에 대해 도 9a와 같은 그룹을 적응시킨 경우의 예이다. 이 경우, 좌측 위의 3개의 계수(제1 그룹)에 대해 제1 콘텍스트를, 주파수 성분 F0과 주파수 성분 F1로 둘러싸인 영역(제2 그룹)의 계수에 대해 제2 콘텍스트를, 주파수 성분 F1과 주파수 성분 F2로 둘러싸인 영역(제3 그룹)의 계수에 대해 제3 콘텍스트를, 마지막에 주파수 성분 F2보다 고역의 계수(제4 그룹)의 계수에 대해 고주파수 전용의 제4 콘텍스트를, 각각 설정한다. 또한, 8x8 이상의 계수 블록에 대해서도 동일하게 행한다.
도 9b의 예에서는, DC성분을 포함하는 제1 그룹은 3개의 계수를 포함하고, 제2 그룹은 12개의 계수를 포함하며, 제3 그룹은 34개의 계수를 포함하고, 가장 높은 주파수 성분을 포함하는 제4 그룹은 15개의 계수를 포함한다. 즉, 제1 그룹에 속하는 계수의 수는, 다른 그룹에 속하는 계수의 수 이하이다. 또, 제1 및 제4 그룹 사이의 제3 그룹에 속하는 계수의 수는, 다른 그룹에 속하는 계수의 수보다 많아져 있다.
한편, 도 9c는, 4x4 사이즈의 계수 블록에 대해, 도 9a와 같은 그룹을 적응시킨 경우의 예이다. 이 경우도, 도 9b의 경우와 동일하지만, 제1 그룹에 포함되는 계수는, 직류 성분(DC)의 계수 만이 된다.
또한, 여기서 나타낸 구분의 방법은 일례이며, 상기의 예에 한정되지 않는다. 예를 들면, 저주파수 영역의 계수를 포함하는 그룹이 작고(속하는 계수가 적다), 고주파수 영역의 계수를 포함하는 그룹이 커지도록(속하는 계수가 많다), 각 그룹의 크기를 설정해도 된다. 또, 그룹수 및 그룹의 경계 위치는 이것에 한정되지 않는다. 예를 들면, 가장 저주파수의 영역에 위치하는 그룹은, 1개의 계수 만을 포함하는 그룹이어도 된다. 또 예를 들면, 그룹수는 2개여도 된다.
또한, 본 발명에서는, 도 5에 나타내는 콘텍스트 테이블을 맵핑 정보로서 부호화하지만, 이 주파수 성분 F0, F1, F2 등을, 딜리미터 정보로서 비트 스트림의 소정의 단위(슬라이스, 픽처에 대응하는 단위 등)마다 기록해도 된다.
본 발명의 실시의 형태 1에 관련된 산술 부호화부(100)는, 화상 데이터를 압축 부호화하는 화상 부호화 장치에 구비된다. 도 10은, 본 발명의 실시의 형태 1에 관련된 화상 부호화 장치(200)의 구성의 일례를 나타내는 블럭도이다.
화상 부호화 장치(200)는, 화상 데이터를 압축 부호화한다. 예를 들면, 화상 부호화 장치(200)에는, 화상 데이터가 블록마다 입력 신호로서 입력된다. 화상 부호화 장치(200)는, 입력된 입력 신호에, 변환, 양자화 및 가변길이 부호화를 행함으로써, 부호화 신호를 생성한다.
도 10에 나타내는 바와 같이, 화상 부호화 장치(200)는, 감산기(205)와, 변환·양자화부(210)와, 엔트로피 부호화부(220)와, 역양자화·역변환부(230)와, 가산기(235)와, 디블로킹 필터(240)와, 메모리(250)와, 인트라 예측부(260)와, 움직임 검출부(270)와, 움직임 보상부(280)와, 인트라/인터 전환 스위치(290)를 구비한다.
감산기(205)는, 입력 신호와 예측 신호의 차분, 즉, 예측 오차를 산출한다.
변환·양자화부(210)는, 공간 영역의 예측 오차를 주파수 변환함으로써, 주파수 영역의 변환 계수를 생성한다. 예를 들면, 변환·양자화부(210)는, 예측 오차에 DCT(Discrete Cosine Transform) 변환을 행함으로써, 변환 계수를 생성한다. 또한, 변환·양자화부(210)는, 주파수 영역의 변환 계수를 양자화함으로써, 양자화 계수를 생성한다.
엔트로피 부호화부(220)는, 양자화 계수를 가변길이 부호화함으로써, 부호화 신호를 생성한다. 또, 엔트로피 부호화부(220)는, 움직임 검출부(270)에 의해 검출된 움직임 데이터(예를 들면, 움직임 벡터)를 부호화하고, 부호화 신호에 포함하여 출력한다.
역양자화·역변환부(230)는, 양자화 계수를 역양자화함으로써, 변환 계수를 복원한다. 또한, 역양자화·역변환부(230)는, 복원한 변환 계수를 역변환함으로써, 예측 오차를 복원한다. 또한, 복원된 예측 오차는, 양자화에 의해 정보가 없어져 있으므로, 감산기(205)가 생성하는 예측 오차와는 엄밀하게는 일치하지 않는다. 즉, 복원된 예측 오차는, 양자화 오차를 포함하고 있다.
가산기(235)는, 복원된 예측 오차와 예측 신호를 가산함으로써, 로컬 복호 화상을 생성한다.
디블로킹 필터(240)는, 생성된 로컬 복호 화상에 디블로킹 필터 처리를 행한다.
메모리(250)는, 움직임 보상에 이용되는 참조 화상을 기억하기 위한 메모리이다. 구체적으로는, 메모리(250)는, 디블로킹 필터 처리가 실시된 로컬 복호 화상을 기억한다.
인트라 예측부(260)는, 인트라 예측을 행함으로써, 예측 신호(인트라 예측 신호)를 생성한다. 구체적으로는, 인트라 예측부(260)는, 가산기(235)에 의해 생성된 로컬 복호 화상에 있어서의, 부호화 대상 블록(입력 신호)의 주위의 화상을 참조하여 인트라 예측을 행함으로써, 인트라 예측 신호를 생성한다.
움직임 검출부(270)는, 입력 신호와, 메모리(250)에 기억된 참조 화상 사이의 움직임 데이터(예를 들면, 움직임 벡터)를 검출한다.
움직임 보상부(280)는, 검출된 움직임 데이터에 기초하여 움직임 보상을 행함으로써, 예측 신호(인터 예측 신호)를 생성한다.
인트라/인터 전환 스위치(290)는, 인트라 예측 신호 및 인터 예측 신호 중 어느 하나를 선택하고, 선택한 신호를 예측 신호로서 감산기(205) 및 가산기(235)에 출력한다.
이상의 구성에 의해, 본 발명의 실시의 형태 1에 관련된 화상 부호화 장치(200)는, 화상 데이터를 압축 부호화한다.
또한, 도 10에 있어서, 본 발명의 실시의 형태 1에 관련된 산술 부호화부(100)는, 엔트로피 부호화부(220)에 구비된다. 즉, 산술 부호화부(100)는, 입력 신호 SI로서 양자화 계수를 2치화 및 산술 부호화한다. 또, 신호 종별 정보 SE는, 양자화 계수의 계수 위치, 도 10에 나타내는 움직임 데이터, 또는, 인트라 예측부(260)가 이용한 인트라 예측 방향 등을 나타내는 정보이다.
이상과 같이, 본 발명의 실시의 형태 1에 관련된 화상 부호화 장치 및 화상 부호화 방법에 의하면, 부호화 대상 신호의 종별에 관련지어져 있는 콘텍스트를, 양자화 계수의 주파수 성분에 따라 적절히 결정하여, 산술 부호화에 이용하는 부호화 확률 정보를 산출한다.
또한, 화상 부호화 장치측에서, 부호화 대상 신호의 종별에 따른 그룹의 적절한 구분의 방법을 전환한 경우여도, 부호열에 부가된 맵핑 정보로부터 그룹과 콘텍스트의 대응을, 화상 복호 장치측에서 파악하는 것이 가능해진다.
이들에 의해, 콘텍스트의 수를 삭감하면서, 전체의 통계 정보를 반영한 확률 정보를 부호화 확률 정보로서 이용할 수 있으므로, 부호화 효율을 높일 수 있다. 즉, 콘텍스트마다 보존되는 메모리 사이즈를 축소하면서, 부호화 효율을 높일 수 있다.
또한, 상기 실시의 형태에서는, 도 3에 나타내는 맵핑 정보를 부호화하고, 부호화한 맵핑 정보를 부호열에 더하는 것으로 했지만, 맵핑 정보로서는, 그룹과 콘텍스트의 대응 관계를 재현할 수 있는 정보이면 된다.
(실시의 형태 2)
다음에, 본 발명의 실시의 형태 2의 산술 복호 방법의 개요에 대해서 설명한다. 본 실시의 형태의 화상 복호 방법에서는, 실시의 형태 1에 관련된 화상 부호화 방법에 의해 부호화된 부호화 화상 데이터를 복호한다. 구체적으로는, 부호화 스트림으로부터 콘텍스트 테이블 재현 정보(맵핑 정보)를 추출한다. 다음에, 재현한 콘텍스트 테이블을 이용하여, 소정의 정보 종별에 대응하는 콘텍스트를 설정한다. 그리고, 설정한 콘텍스트를 이용하여 소정의 정보 종별을 산술 복호화한다.
다음에, 본 실시의 형태의 산술 복호 방법을 행하는 산술 복호부의 구성에 대해서 설명한다. 도 11은, 본 발명의 실시의 형태 2에 관련된 산술 복호부(300)의 구성의 일례를 나타내는 블럭도이다. 또한, 후술하는 바와 같이, 본 발명의 실시의 형태 2에 관련된 산술 복호부(300)는, 압축 부호화된 부호화 화상 데이터를 복호하는 화상 복호 장치의 일부에 상당한다.
도 11에 나타내는 바와 같이, 산술 복호부(300)는, 2치 산술 복호기(301)와, 심볼 발생 확률 기억부(302)와, 콘텍스트 제어부(303)와, 다식화부(304)와, 콘텍스트 구분 제어부(305)를 구비한다.
산술 복호부(300)는, 복호 대상 신호인 입력 스트림 IS를 산술 복호함으로써, 화상 데이터를 복원하여 출력한다. 또, 산술 복호부(300)에는, 입력 스트림 IS의 종별을 나타내는 신호 종별 정보 SE와, 실시의 형태 1에서 부호화된 맵핑 정보(mapping Info)가 입력된다.
입력 스트림 IS는, 부호화 화상 데이터(복호 대상 신호)이며, 예를 들면, 화상 데이터가 압축 부호화되어 생성된 양자화 계수를 나타내는 신호이다. 즉, 실시의 형태 1에 관련된 입력 신호 SI가 산술 부호화되어 생성된 신호에 상당한다.
신호 종별 정보 SE는, 복호 대상 신호의 종별 정보의 일례이다. 구체적으로는, 신호 종별 정보 SE는, 입력 스트림 IS의 종별을 나타내는 정보이다. 보다 구체적으로는, 신호 종별 정보 SE는, 실시의 형태 1에 관련된 신호 종별 정보 SE와 동일하다. 즉, 입력 스트림 IS가 변환 계수에 관련하는 신호(예를 들면 양자화 계수)인 경우, 신호 종별 정보 SE는, 상기 변환 계수의 처리 단위의 위치(계수 위치)를 나타내는 위치 정보이다.
2치 산술 복호기(301)는, 복호 확률 정보(심볼 발생 확률)를 이용하여 복호 대상 신호를 산술 복호함으로써, 2치 신호를 생성한다. 구체적으로는, 2치 산술 복호기(301)는, 심볼 발생 확률 기억부(302)가 출력하는 심볼 발생 확률을 이용하여, 입력 스트림 IS를 산술 복호함으로써, 출력 2치 신호 OBIN을 생성한다.
심볼 발생 확률 기억부(302)는, 복수의 심볼 발생 확률을 유지하는 메모리 등이다. 예를 들면, 심볼 발생 확률 기억부(302)는, 심볼 발생 확률 테이블을 유지한다. 심볼 발생 확률 테이블은, 콘텍스트와 확률 정보를 대응지은 테이블이다. 심볼 발생 확률 테이블은, 예를 들면, 도 4에 나타내는 테이블이다. 심볼 발생 확률 테이블의 상세는, 실시의 형태 1과 동일하다.
또, 심볼 발생 확률 기억부(302)는, 부호화된 맵핑 정보로 지정되는 콘텍스트 테이블을 유지한다. 콘텍스트 테이블은, 복호 대상 신호의 종별과 콘텍스트를 대응지은 테이블이며, 예를 들면, 도 5에 나타내는 테이블이다. 콘텍스트 테이블의 상세는, 실시의 형태 1과 동일하다.
콘텍스트 제어부(303)는, 부호화된 맵핑 정보(mapping mapping Info)에 기초하여, 복호 대상 신호의 종별에 대응하는 콘텍스트를 결정한다. 구체적으로는, 콘텍스트 제어부(303)는, 우선, 신호 종별 정보 SE를 취득함과 함께, 콘텍스트 구분 제어부(305)로부터 제어 신호 CTRS를 취득한다. 그리고, 콘텍스트 제어부(303)는, 취득한 입력 스트림 IS의 종별을 나타내는 신호 종별 정보 SE 및 제어 신호 CTRS에 기초하여, 콘텍스트 테이블을 참조함으로써, 복호 대상 신호의 종별에 관련지어져 있는 콘텍스트를 결정한다.
이 때, 콘텍스트 제어부(303)는, 제어 신호 CTRS에서 지정된 그룹에 기초하여, 콘텍스트를 결정한다. 여기서, 1개의 그룹이 복수의 계수를 포함하는 경우, 콘텍스트 제어부(303)는, 그들 복수의 계수에 공통의 콘텍스트를 결정한다.
또한, 콘텍스트 제어부(303)가, 콘텍스트 테이블을 유지하고 있어도 된다. 여기서 콘텍스트 구분 제어부(305)의 동작에 대해서는, 다음에 설명한다.
또한, 콘텍스트 제어부(303)는, 결정한 콘텍스트에 대응하는 복호 확률 정보를 결정한다. 즉, 콘텍스트 제어부(303)는, 심볼 발생 확률 테이블을 참조함으로써, 심볼 발생 확률 기억부(302)에 기억되어 있는 복수의 심볼 발생 확률 중 어느 심볼 발생 확률을 사용하는지를 결정한다.
복호 확률 정보는, 산술 부호화된 2치 신호의 산술 복호에 이용하는 확률 정보이다. 또한, 복호 확률 정보는, 예를 들면, 심볼 발생 확률의 값을 나타내는 인덱스, 또는, 심볼 발생 확률의 값이다. 또한, 이하에 있어서, 복호 확률 정보를 간단히 확률 정보라고 표기하는 경우가 있다.
이와 같이, 콘텍스트 제어부(303)는, 결정한 콘텍스트에 대응하는 심볼 발생 확률을 심볼 발생 확률 기억부(302)로부터 독출하여, 2치 산술 복호기(301)에 출력한다. 또한, 콘텍스트 제어부(303)의 구체적인 동작은, 실시의 형태 1에 관련된 콘텍스트 제어부(103)와 동일하다.
다식화부(304)는, 2치 산술 복호기(301)에 의해 생성된 출력 2치 신호 OBIN을 다식화함으로써, 화상 데이터를 복원한다. 또한, 다식화의 방식은, 신호 종별 정보 SE에 기초하여 결정된다.
이상이, 본 실시의 형태의 산술 복호부(300)의 구성에 대한 설명이다.
다음에, 도 11에 나타낸 산술 복호부(300)가 행하는 산술 복호 방법을, 도 12 및 도 13에 나타내는 플로차트에 따라서 설명한다. 도 12는, 본 발명의 실시의 형태 2에 관련된 산술 복호 방법의 일례를 나타내는 플로차트이다. 또, 도 12는, 복호 대상 신호가 1개의 블록에 대응하는 양자화 계수군이며, 1개의 블록에 포함되는 각 계수가 제로 계수인지, 비제로 계수인지를 나타내는 정보를 복호하는 경우의 산술 복호 방법을 나타내고 있다.
도 12에 나타내는 바와 같이, 우선, 산술 복호부(300)는, 복호 대상이 되는 입력 스트림 IS를 취득한다(S401). 구체적으로는, 입력 스트림 IS에는, 미리 결정된 스캔순서에 의해 스캔된 양자화 계수가 부호화되어 있다. 그 경우에, 양자화 계수가 0은 아닌(비제로 계수) 경우와 제로(제로 계수)인 경우를, “0” 또는 “1”로 표현하는 2치 신호가 부호화되어 있다. 이 양자화 계수가 비제로 계수인지 아닌지를 나타내는 신호를 SignificantFlag라고 부른다.
여기서, 양자화 계수가 비제로 계수인 경우에는, 상기 서술한 스캔순서로 그 비제로 계수 이후에 아직 비제로 계수가 있는지 없는지를 “0” 또는 “1”로 표현하는 2치 신호가 부호화되어 있다. 여기서, 이 2치 신호를 LastFlag라고 부른다. 이 LastFlag는, 스캔순으로 마지막 비제로 계수의 위치를 나타내는 정보이다. 이러한 방법에서 부호화된 신호를 복호하는 경우에 대해서 설명한다.
다음에, 산술 복호부(300)는, SignificantFlag에 대해 산술 복호를 실시한다(S402). 또한, 산술 복호에 대해서는, 예를 들면 H.264와 동일한 방법이어도 된다. 다음에, 산술 복호부(300)는, 복호한 신호가 제로 계수인지 아닌지를 판단한다(S403).
복호한 신호가 제로 계수인 것을 나타내고 있으면(S403에서 NO), 산술 복호부(300)는, 다음의 SignificantFlag에 대한 처리를 행한다. 한편, 복호 대상의 계수가 비제로 계수인 것을 나타내고 있으면(S403에서 YES), 산술 복호부(300)는, 그 비제로 계수가 스캔순으로 마지막 비제로 계수인지 어떤지를 나타내는 LastFlag에 대해 산술 복호를 실시한다(S404). 또한, 산술 복호의 상세에 대해서는, 다음에 상세하게 설명한다.
다음에, 산술 복호부(300)는, 복호 대상의 계수가 스캔순으로 마지막 비제로 계수인지 아닌지를 판단한다(S405). 그리고, 복호 대상의 계수가 스캔순으로 마지막 비제로 계수인 것을 나타내지 않으면(S405에서 NO), 산술 복호부(300)는, 다음의 SignificantFlag에 대한 처리를 행한다. 한편, 복호 대상의 계수가 스캔순으로 마지막 비제로 계수인 것을 나타내고 있으면(S405에서 YES), 산술 복호부(300)는, 비제로 계수의 계수치(계수 레벨)의 정보에 대한 복호를 실시한다(S406). 여기서, 비제로 계수의 계수 레벨에 대한 복호의 방법에 대해서는, 예를 들면 H.264와 동일한 방법으로 한다.
또, 도 13은, 복호 대상 신호의 산술 복호를 나타내고 있다.
도 13의 산술 복호 방법은, 우선, 부호화 화상 데이터의 일부인 복호 대상 신호를 포함하는 블록을, 복호 대상 신호의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하여, 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정한다(S501, S502). 다음에, 복호 대상 신호를, 상기 복호 대상 신호가 속하는 그룹에 대응지어진 콘텍스트의 확률 정보에 따라서 2치 산술 복호함으로써, 2치화된 계수를 생성한다(S503). 그리고, 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 그룹에 속하는 계수에 기초하여 갱신한다(S504).
예를 들면, 복호 대상 신호로서, 상기 서술한 LastFlag의 하나의 값을 복호하는 예를 설명한다. 구체적으로는, 도 13에 나타내는 바와 같이, 본 실시의 형태의 산술 복호 방법에 있어서, 콘텍스트 구분 제어부(305)는, 우선, 위치 정보를 포함하는 신호 종별 정보 SE를 취득한다(S501).
다음에, 콘텍스트 구분 제어부(305)는, 취득된 위치 정보에 기초하여, 계수가 어느 그룹에 포함되는지를 판별하고, 판별한 그룹을 나타내는 제어 신호 CTRS를 출력한다. 콘텍스트 제어부(303)는, 콘텍스트 구분 제어부(305)로부터 얻어지는 제어 신호 CTRS가 나타내는 그룹에 대응하는 콘텍스트를, 복호 대상 신호에 대응하는 콘텍스트로서 선택한다(S502). 즉, 콘텍스트 제어부(303)는, 심볼 발생 확률 기억부(302)에 기억되어 있는 복수의 콘텍스트 중에서, 복호 대상 신호를 산술 복호하기 위한 콘텍스트를 선택한다.
다음에, 심볼 발생 확률 기억부(302)는, 콘텍스트 제어부(303)에 의해 결정된 콘텍스트에 대응하는 심볼 발생 확률을 독출하여, 2치 산술 복호기(301)에 출력한다.
2치 산술 복호기(301)는, 복호 확률 정보(심볼 발생 확률)를 이용하여 복호 대상 신호를 산술 복호함으로써, 출력 2치 신호 OBIN을 생성한다(S503). 구체적으로는, 2치 산술 복호기(301)는, 심볼 발생 확률 기억부(302)로부터 출력된 심볼 발생 확률을 이용하여, H.264 규격에 나타내어지는 방법에 의해, 복호 대상 신호의 산술 복호를 행한다.
또한, 콘텍스트 구분 제어부(305), 콘텍스트 제어부(303)의 동작의 상세는, 실시의 형태 1에 관련된 부호화 시의 콘텍스트 제어와 동일하게 행한다.
콘텍스트 제어부(303)는, 출력 2치 신호 OBIN에 기초하여, 확률 정보를 갱신한다(S504). 구체적으로는, 콘텍스트 제어부(303)는, 2치 산술 복호기(301)에 의해 생성된 출력 2치 신호 OBIN에 따라, 복호 대상 신호의 콘텍스트에 대응하는 심볼 발생 확률을 갱신한다. 갱신의 방법에 대해서는, 실시의 형태 1과 동일하다.
다식화부(304)는, 출력 2치 신호 OBIN을 다식화함으로써, 화상 데이터를 복원한다.
상기의 방법을 취함으로써, 부호화 효율을 향상시킨 부호화 신호를 복호하는 것이 가능하게 된다.
또한, 본 발명의 실시의 형태 2에 관련된 산술 복호부(300)는, 압축 부호화된 부호화 화상 데이터를 복호하는 화상 복호 장치에 구비된다. 도 14는, 본 발명의 실시의 형태 2에 관련된 화상 복호 장치(400)의 구성의 일례를 나타내는 블럭도이다.
화상 복호 장치(400)는, 압축 부호화된 부호화 화상 데이터를 복호한다. 예를 들면, 화상 복호 장치(400)는, 부호화 화상 데이터가 블록마다 복호 대상 신호로서 입력된다. 화상 복호 장치(400)는, 입력된 복호 대상 신호에, 가변길이 복호, 역양자화, 및 역변환을 행함으로써, 화상 데이터를 복원한다.
도 14에 나타내는 바와 같이, 화상 복호 장치(400)는, 엔트로피 복호부(410)와, 역양자화·역변환부(420)와, 가산기(425)와, 디블로킹 필터(430)와, 메모리(440)와, 인트라 예측부(450)와, 움직임 보상부(460)와, 인트라/인터 전환 스위치(470)를 구비한다.
엔트로피 복호부(410)는, 입력 신호(입력 스트림)를 가변길이 복호함으로써, 양자화 계수를 복원한다. 또한, 여기서, 입력 신호(입력 스트림)는, 복호 대상 신호이며, 부호화 화상 데이터의 블록마다의 데이터에 상당한다. 또, 엔트로피 복호부(410)는, 입력 신호로부터 움직임 데이터를 취득하고, 취득한 움직임 데이터를 움직임 보상부(460)에 출력한다.
역양자화·역변환부(420)는, 엔트로피 복호부(410)에 의해 복원된 양자화 계수를 역양자화함으로써, 변환 계수를 복원한다. 그리고, 역양자화·역변환부(420)는, 복원한 변환 계수를 역변환함으로써, 예측 오차를 복원한다.
가산기(425)는, 복원된 예측 오차와 예측 신호를 가산함으로써, 복호 화상을 생성한다.
디블로킹 필터(430)는, 생성된 복호 화상에 디블로킹 필터 처리를 행한다. 디블로킹 필터 처리된 복호 화상은, 복호 신호로서 출력된다.
메모리(440)는, 움직임 보상에 이용되는 참조 화상을 기억하기 위한 메모리이다. 구체적으로는, 메모리(440)는, 디블로킹 필터 처리가 실시된 복호 화상을 기억한다.
인트라 예측부(450)는, 인트라 예측을 행함으로써, 예측 신호(인트라 예측 신호)를 생성한다. 구체적으로는, 인트라 예측부(450)는, 가산기(425)에 의해 생성된 복호 화상에 있어서의, 복호 대상 블록(입력 신호)의 주위의 화상을 참조하여 인트라 예측을 행함으로써, 인트라 예측 신호를 생성한다.
움직임 보상부(460)는, 엔트로피 복호부(410)로부터 출력된 움직임 데이터에 기초하여 움직임 보상을 행함으로써, 예측 신호(인터 예측 신호)를 생성한다.
인트라/인터 전환 스위치(470)는, 인트라 예측 신호 및 인터 예측 신호 중 어느 하나를 선택하고, 선택한 신호를 예측 신호로서 가산기(425)에 출력한다.
이상의 구성에 의해, 본 발명의 실시의 형태 2에 관련된 화상 복호 장치(400)는, 압축 부호화된 부호화 화상 데이터를 복호한다.
또한, 도 14에 있어서, 본 발명의 실시의 형태 2에 관련된 산술 복호부(300)는, 엔트로피 복호부(410)에 구비된다. 즉, 산술 복호부(300)는, 입력 스트림 IS로서, 예측 부호화가 실행된 부호화 화상 데이터를 산술 복호 및 다식화한다. 또, 신호 종별 정보 SE는, 양자화 계수의 위치, 움직임 데이터, 또는 인트라 예측부(450)가 이용하는 인트라 예측 방향 등을 나타내는 정보이다.
또한, 도 3에 나타내는 바와 같은 콘텍스트 테이블을 재현하기 위한 정보(CodedCTRS)는, 부호화 장치측에서 부호화되는 단위마다 취득되는 것은 말할 필요도 없다. 예를 들면, 부호화 측에 있어서, 슬라이스, 픽처에 대응하는 단위로, 부호화 스트림에 이 정보를 포함하는 경우는, 이 단위로 이 정보가 취득된다.
이상과 같이, 본 발명의 실시의 형태 2에 관련된 화상 복호 장치 및 화상 복호 방법에 의하면, 양자화 계수의 주파수 성분에 따라 적절한 콘텍스트를 결정하여, 산술 복호화에 이용하는 복호 확률 정보를 취득한다. 구체적으로는, 부호화된 맵핑 정보로부터, 정보 종별과 콘텍스트의 대응 관계를 취득한다.
이것에 의해, 부호화 효율이 향상된 신호를 올바르게 복호할 수 있다. 구체적으로는, 실시의 형태 1에 나타낸 바와 같이, 복호 대상 신호를, 양자화 계수의 주파수 성분에 따라 통계적으로 밸런스가 잡힌 형태로 그룹화할 수 있다. 이 때문에, 콘텍스트의 수를 삭감하면서, 적절한 통계 정보를 반영한 확률 정보를 복호 확률 정보로서 이용할 수 있으므로, 부호화 효율을 높일 수 있다.
이와 같이 하여 부호화 효율이 향상된 신호를, 본 발명의 실시의 형태 2에 관련된 화상 복호 장치 및 화상 복호 방법은, 올바르게 복호할 수 있다.
(실시의 형태 3)
실시의 형태 3의 부호화 방법에서는, 실시의 형태 1의 부호화 방법에 있어서, 정보 종별의 그룹으로서, 소정의 제어 파라미터의 설정 단위마다 그룹을 결정한다.
도 15는, 제어 파라미터(또는 파라미터의 값)의 배분에 대응시켜 정보 종별의 집합의 그룹화를 행하는 의미를 개념적으로 설명하는 도이다.
도 15에 있어서, C00~C33은, 정보 종별의 예인 16개의 주파수 계수(Coeffs)를 나타낸다. 또, 도 15에 있어서, Controlling params#1은, 제어 파라미터의 배분의 예이다. 여기서의 제어 파라미터는, C00~C33을 양자화하는 값(주파수 계수를 제산하는 값)이다.
예를 들면, C00은 값 1로 제산하고, C10, C01, C02, C20, C22는 값 10으로 제산하며, 나머지의 주파수 계수는 값 100으로 제산한다. 그래서, C00을 1개의 그룹으로 하고, C10, C01, C02, C20, C22를 1개의 그룹으로 하며, 나머지의 주파수 계수를 1개의 그룹으로 한다.
이와 같은 제어 파라미터의 배분의 경우, 제산한 결과가 소정의 값이 될 확률은, 제어 파라미터의 배분에 영향을 받는다. 예를 들면, 우측 아래 삼각의 위치에 있는 계수에 대해서는, 0이 될 확률이 다른 것보다 높아진다.
또, Controlling params#2는, 제어 파라미터의 배분의 제2예이다. 이 예에서는, C00, C10, C20, C30, C01, C11을 값 10으로 양자화(제산)하고, 다른 주파수 계수를 값 100으로 양자화한다. 이 경우도, C00, C10, C20, C30, C01, C11을 1개의 그룹으로 하고, 다른 주파수 계수를 다른 그룹으로 한다. 그리고, 그 각 그룹 내에서 공통의 콘텍스트를 적용하는 것에는, 콘텍스트수의 삭감(선택되는 빈도의 향상)의 면에서, 효과가 기대된다.
도 16은, 제어 파라미터의 예로서의 양자화 매트릭스에 대응하는 콘텍스트 맵핑 정보의 예를 나타내는 도이다.
도 16의 (a)는, 제1 양자화 매트릭스(q_matrix_idx==1)와, 이 매트릭스에 대응하는 맵핑 정보를 나타낸다. 도면 중의 화살표는, 양자화된 계수의 스캔순서의 예를 나타낸다. 제1 양자화 매트릭스는, 양자화하기 위한 값으로서, 각각 14, 16, 18을 대응하는 위치의 계수에 적용한다. 구체적으로는, 스캔순서로 1번째 (SE=0)의 계수에 14를, 2번째~14번째의 계수(SE=1~13)에 16을, 다른 계수에 18을 적용한다.
도 3의 콘텍스트 구분 제어부(105)(또는 콘텍스트 제어부(103))는, 이 제1 양자화 매트릭스(또는, 제1 양자화 매트릭스를 지정하는 인덱스)에 대응시킨 맵핑 정보(CtxIdx와 SE의 대응)를 1개 결정한다. 이 예에서는, 4x4mapIdx==i로 나타내는 맵핑 정보를 이용한다.
도 16의 (b)는, 제2 양자화 매트릭스(q_matrix_idx==2)와, 이 매트릭스에 대응하는 맵핑 정보를 나타낸다. 도 16의 (b)는, 도 16의 (a)와 비교해, 양자화하기 위한 값 14, 16, 18이 적용되는 정보 종별 SE의 그룹의 경계가 상이하다.
또한, 도 16의 (c)는, 본 실시의 형태의 엔트로피 부호화부가 출력하는 맵핑 정보를 나타낸다. 본 실시의 형태의 맵핑 정보는, 적용되는 양자화 매트릭스와 대응하는 맵핑 정보의 세트로 나타내며, 이 맵핑 정보가 부호열에 더해진다.
실시의 형태 2에 있어서의 복호 장치는, 이 맵핑 정보를 기초로, 복호 대상의 양자화 계수를 복원하기 위한 양자화 매트릭스 식별자(q_matrix_id)로부터, 맵핑 정보를 특정하는 식별자(4x4mapIdx)를 취득하여, 산술 복호를 위한 콘텍스트를 특정한다.
이와 같이, 본 실시의 형태의 부호화 방법에 의하면, 정보 종별의 그룹과 콘텍스트의 대응 관계를 나타내는 맵핑 정보는, 양자화 매트릭스에 대응지어져 결정된다.
이와 같이, 소정의 제어 정보와 대응지어져 맵핑 정보가 부호화되기 때문에, 각 그룹에 적용하는 콘텍스트의 유효성을 유지하면서, 맵핑 정보 자체의 부호화에 관련된 부호량을 삭감할 수 있다.
또한, 상기의 예에서는, 맵핑 정보의 식별자로부터 사전에 유지하고 있는 맵핑 정보를 도출하는 것으로 했지만, 소정의 양자화 매트릭스에 대응지어진 맵핑 정보 자체를 부호화해도 된다. 또한, 양자화 매트릭스를 특정하기 위한 정보로서는, 양자화 매트릭스(스케일링 매트릭스), 양자화 오프셋(오프셋치), 양자화 매트릭스 인덱스 등이 있지만, 모두 양자화 매트릭스를 특정하는 정보로서 적용할 수 있다.
또, 제어 파라미터의 하나예로서 양자화 매트릭스를 설명했지만, 공통의 콘텍스트가 적용되는 그룹에 영향을 미치는 제어 파라미터(그룹, 값의 배치)이면, 효과를 발휘한다.
또, 양자화 파라미터의 그룹과, 공통되는 콘텍스트가 적용되는 그룹(공통되는 CtxIdx가 적용되는 그룹)이란, 엄밀하게 1대 1이 아니어도 된다. 예를 들면, 도 17의 (a)는, 양자화 파라미터 20, 15, 20이 적용되는 3개의 정보 종별 SE를 집약하여, 1개의 콘텍스트 CtxIDX를 적용하는 경우를 나타내고 있다.
또, 정보 종별 SE가 양자화 매트릭스인 경우, 정보 종별의 식별자와 맵핑 정보의 대응 관계를 나타내는 표는, 스캔순서에 의해 그 나열이 변경되는 것이어도 된다. 예를 들면, 도 17의 (b)는, 통상의 스캔순서와는 다른 스캔순서로 계수가 부호화된 경우에, 맵핑 정보에 있어서의 SE와 CtxIdx의 열의 나열도 스캔순서에 따라 결정되고 있는 것을 나타내는 도이다. 이와 같이 바꾸어 나열한 경우, CtxIdx에도 동일한 값이 연속해서 적용되게 되어, 맵핑 정보 자체의 부호량을 삭감할 수 있다.
(실시의 형태 4)
상기 각 실시의 형태에서 나타낸 동화상 부호화 방법(화상 부호화 방법) 또는 동화상 복호화 방법(화상 복호 방법)의 구성을 실현하기 위한 프로그램을 기억 미디어에 기록함으로써, 상기 각 실시의 형태에서 나타낸 처리를 독립된 컴퓨터 시스템에 있어서 간단하게 실시하는 것이 가능해진다. 기억 미디어는, 자기 디스크, 광디스크, 광자기 디스크, IC카드, 반도체 메모리 등, 프로그램을 기록할 수 있는 것이면 된다.
또한 여기서, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법(화상 부호화 방법)이나 동화상 복호화 방법(화상 복호 방법)의 응용예와 그것을 이용한 시스템을 설명한다. 상기 시스템은, 화상 부호화 방법을 이용한 화상 부호화 장치, 및 화상 복호 방법을 이용한 화상 복호 장치로 이루어지는 화상 부호화 복호 장치를 가지는 것을 특징으로 한다. 시스템에 있어서의 다른 구성에 대해서, 경우에 따라 적절히 변경할 수 있다.
도 18은, 컨텐츠 전송 서비스를 실현하는 컨텐츠 공급 시스템 ex100의 전체 구성을 나타내는 도이다. 통신 서비스의 제공 에리어를 원하는 크기로 분할하여, 각 셀 내에 각각 고정 무선국인 기지국 ex106, ex107, ex108, ex109, ex110이 설치되어 있다.
이 컨텐츠 공급 시스템 ex100은, 인터넷 ex101에 인터넷 서비스 프로바이더 ex102 및 전화망 ex104, 및 기지국 ex106으로부터 ex110을 통하여, 컴퓨터 ex111, PDA(Personal Digital Assistant) ex112, 카메라 ex113, 휴대 전화 ex114, 게임기 ex115 등의 각 기기가 접속된다.
그러나, 컨텐츠 공급 시스템 ex100은 도 18과 같은 구성에 한정되지 않고, 어느 하나의 요소를 조합하여 접속하도록 해도 된다. 또, 고정 무선국인 기지국 ex106으로부터 ex110을 통하지 않고, 각 기기가 전화망 ex104에 직접 접속되어도 된다. 또, 각 기기가 근거리 무선 등을 통하여 직접 서로 접속되어 있어도 된다.
카메라 ex113은 디지털 비디오 카메라 등의 동영상 촬영이 가능한 기기이며, 카메라 ex116은 디지탈카메라 등의 정지화상 촬영, 동영상 촬영이 가능한 기기이다. 또, 휴대 전화 ex114는, GSM(등록상표:Global System for Mobile Communications) 방식, CDMA(Code Division Multiple Access) 방식, W-CDMA(Wideband-Code Division Multiple Access) 방식, 혹은 LTE(Long Term Evolution) 방식, HSPA(High Speed Packet Access)의 휴대 전화기, 또는 PHS(Personal Handyphone System) 등이며, 이 중 어느 하나여도 상관없다.
컨텐츠 공급 시스템 ex100에서는, 카메라 ex113 등이 기지국 ex109, 전화망 ex104를 통해서 스트리밍 서버 ex103에 접속됨으로써, 라이브 전송 등이 가능하게 된다. 라이브 전송에서는, 사용자가 카메라 ex113을 이용하여 촬영하는 컨텐츠(예를 들면, 음악 라이브의 영상 등)에 대해 상기 각 실시의 형태에서 설명한 바와 같이 부호화 처리를 행하여(즉, 본 발명의 화상 부호화 장치로서 기능한다), 스트리밍 서버 ex103에 송신한다. 한편, 스트리밍 서버 ex103은 요구가 있었던 클라이언트에 대해 송신된 컨텐츠 데이터를 스트림 전송한다. 클라이언트로서는, 상기 부호화 처리된 데이터를 복호화하는 것이 가능한, 컴퓨터 ex111, PDA ex112, 카메라 ex113, 휴대 전화 ex114, 게임기 ex115 등이 있다. 전송된 데이터를 수신한 각 기기에서는, 수신한 데이터를 복호화 처리하여 재생한다(즉, 본 발명의 화상 복호 장치로서 기능한다).
또한, 촬영한 데이터의 부호화 처리는 카메라 ex113으로 행해도, 데이터의 송신 처리를 하는 스트리밍 서버 ex103으로 행해도 되고, 서로 분담해서 행해도 된다. 마찬가지로 전송된 데이터의 복호화 처리는 클라이언트로 행해도, 스트리밍 서버 ex103으로 행해도 되고, 서로 분담해서 행해도 된다. 또, 카메라 ex113에 한정되지 않고, 카메라 ex116으로 촬영한 정지 화상 및/또는 동화상 데이터를, 컴퓨터 ex111을 통하여 스트리밍 서버 ex103에 송신해도 된다. 이 경우의 부호화 처리는 카메라 ex116, 컴퓨터 ex111, 스트리밍 서버 ex103 중 어느 하나로 행해도 되고, 서로 분담해서 행해도 된다.
또, 이들 부호화·복호화 처리는, 일반적으로 컴퓨터 ex111이나 각 기기가 가지는 LSI ex500에 있어서 처리한다. LSI ex500은, 원 칩이어도 복수 칩으로 이루어지는 구성이어도 된다. 또한, 동화상 부호화·복호화용의 소프트웨어를 컴퓨터 ex111 등으로 판독 가능한 어떠한 기록 미디어(CD-ROM, 플렉시블 디스크, 하드 디스크 등)에 넣고, 그 소프트웨어를 이용하여 부호화·복호화 처리를 행해도 된다. 또한, 휴대 전화 ex114가 카메라가 달린 경우에는, 그 카메라로 취득한 동영상 데이터를 송신해도 된다. 이 때의 동영상 데이터는 휴대 전화 ex114가 가지는 LSI ex500으로 부호화 처리된 데이터이다.
또, 스트리밍 서버 ex103은 복수의 서버나 복수의 컴퓨터이며, 데이터를 분산하여 처리하거나 기록하거나 전송하는 것이어도 된다.
이상과 같이 하여, 컨텐츠 공급 시스템 ex100에서는, 부호화된 데이터를 클라이언트가 수신하여 재생할 수 있다. 이와 같이 컨텐츠 공급 시스템 ex100에서는, 사용자가 송신한 정보를 실시간으로 클라이언트가 수신하고 복호화하여, 재생할 수 있어, 특별한 권리나 설비를 갖지 않은 사용자라도 개인 방송을 실현할 수 있다.
또한, 컨텐츠 공급 시스템 ex100의 예에 한정되지 않고, 도 19에 나타내는 바와 같이, 디지털 방송용 시스템 ex200에도, 상기 각 실시의 형태의 적어도 동화상 부호화 장치(화상 부호화 장치) 또는 동화상 복호화 장치(화상 복호 장치) 중 어느 하나를 넣을 수 있다. 구체적으로는, 방송국 ex201에서는 영상 데이터에 음악 데이터 등이 다중화된 다중화 데이터가 전파를 통하여 통신 또는 위성 ex202에 전송된다. 이 영상 데이터는 상기 각 실시의 형태에서 설명한 동화상 부호화 방법에 의해 부호화된 데이터이다(즉, 본 발명의 화상 부호화 장치에 의해 부호화된 데이터이다). 이것을 받은 방송위성 ex202는, 방송용의 전파를 발신하고, 이 전파를 위성방송의 수신이 가능한 가정의 안테나 ex204가 수신한다. 수신한 다중화 데이터를, 텔레비전(수신기) ex300 또는 셋탑 박스(STB) ex217 등의 장치가 복호화하여 재생한다(즉, 본 발명의 화상 복호 장치로서 기능한다).
또, DVD, BD 등의 기록 미디어 ex215에 기록한 다중화 데이터를 판독 복호화하거나, 또는 기록 미디어 ex215에 영상 신호를 부호화하고, 또한 경우에 따라서는 음악 신호와 다중화하여 기입하는 리더/레코더 ex218에도 상기 각 실시의 형태에서 나타낸 동화상 복호화 장치 또는 동화상 부호화 장치를 실장하는 것이 가능하다. 이 경우, 재생된 영상 신호는 모니터 ex219에 표시되어, 다중화 데이터가 기록된 기록 미디어 ex215에 의해 다른 장치나 시스템에 있어서 영상 신호를 재생할 수 있다. 또, 케이블 테레비용의 케이블 ex203 또는 위성/지상파 방송의 안테나 ex204에 접속된 셋탑 박스 ex217 내에 동화상 복호화 장치를 실장하고, 이것을 텔레비전의 모니터 ex219에 표시해도 된다. 이 때 셋탑 박스가 아닌, 텔레비전 내에 동화상 복호화 장치를 넣어도 된다.
도 20은, 상기 각 실시의 형태에서 설명한 동화상 복호화 방법 및 동화상 부호화 방법을 이용한 텔레비전(수신기) ex300을 나타내는 도이다. 텔레비전 ex300은, 상기 방송을 수신하는 안테나 ex204 또는 케이블 ex203 등을 통하여 영상 데이터에 음성 데이터가 다중화된 다중화 데이터를 취득, 또는 출력하는 튜너 ex301과, 수신한 다중화 데이터를 복조하거나, 또는 외부에 송신하는 다중화 데이터로 변조하는 변조/복조부 ex302와, 복조한 다중화 데이터를 영상 데이터와, 음성 데이터로 분리하거나, 또는 신호 처리부 ex306에서 부호화된 영상 데이터, 음성 데이터를 다중화하는 다중/분리부 ex303을 구비한다.
또, 텔레비전 ex300은, 음성 데이터, 영상 데이터 각각을 복호화하거나, 또는 각각의 정보를 부호화하는 음성 신호 처리부 ex304, 영상 신호 처리부 ex305(본 발명의 화상 부호화 장치 또는 화상 복호 장치로서 기능한다)를 가지는 신호 처리부 ex306과, 복호화한 음성 신호를 출력하는 스피커 ex307, 복호화한 영상 신호를 표시하는 디스플레이 등의 표시부 ex308을 가지는 출력부 ex309를 가진다. 또한, 텔레비전 ex300은, 사용자 조작의 입력을 받아들이는 조작 입력부 ex312 등을 가지는 인터페이스부 ex317을 가진다. 또한, 텔레비전 ex300은, 각 부를 통괄적으로 제어하는 제어부 ex310, 각 부에 전력을 공급하는 전원 회로부 ex311을 가진다. 인터페이스부 ex317은, 조작 입력부 ex312 이외에, 리더/레코더 ex218 등의 외부 기기와 접속되는 브리지 ex313, SD카드 등의 기록 미디어 ex216을 장착 가능하게 하기 위한 슬롯부 ex314, 하드 디스크 등의 외부 기록 미디어와 접속하기 위한 드라이버 ex315, 전화망과 접속하는 모뎀 ex316 등을 가지고 있어도 된다. 또한 기록 미디어 ex216은, 기억하는 불휘발성/휘발성의 반도체 메모리 소자에 의해 전기적으로 정보의 기록을 가능하게 한 것이다. 텔레비전 ex300의 각 부는 동기 버스를 통하여 서로 접속되어 있다.
우선, 텔레비전 ex300이 안테나 ex204 등에 의해 외부로부터 취득한 다중화 데이터를 복호화하여, 재생하는 구성에 대해서 설명한다. 텔레비전 ex300은, 리모트 컨트롤러 ex220 등으로부터의 사용자 조작을 받아, CPU 등을 가지는 제어부 ex310의 제어에 기초하여, 변조/복조부 ex302에서 복조한 다중화 데이터를 다중/분리부 ex303에서 분리한다. 또한 텔레비전 ex300은, 분리한 음성 데이터를 음성 신호 처리부 ex304에서 복호화하고, 분리한 영상 데이터를 영상 신호 처리부 ex305에서 상기 각 실시의 형태에서 설명한 복호화 방법을 이용하여 복호화한다. 복호화한 음성 신호, 영상 신호는, 각각 출력부 ex309로부터 외부를 향해 출력된다. 출력할 때에는, 음성 신호와 영상 신호가 동기하여 재생되도록, 버퍼 ex318, ex319 등에 일단 이들 신호를 축적하면 된다. 또, 텔레비전 ex300은, 방송 등으로부터가 아닌, 자기/광디스크, SD카드 등의 기록 미디어 ex215, ex216으로부터 다중화 데이터를 독출해도 된다. 다음에, 텔레비전 ex300이 음성 신호나 영상 신호를 부호화하고, 외부에 송신 또는 기록 미디어 등에 기입하는 구성에 대해서 설명한다. 텔레비전 ex300은, 리모트 컨트롤러 ex220 등으로부터의 사용자 조작을 받아, 제어부 ex310의 제어에 기초하여, 음성 신호 처리부 ex304에서 음성 신호를 부호화하고, 영상 신호 처리부 ex305에서 영상 신호를 상기 각 실시의 형태에서 설명한 부호화 방법을 이용하여 부호화한다. 부호화한 음성 신호, 영상 신호는 다중/분리부 ex303에서 다중화되어 외부로 출력된다. 다중화할 때에는, 음성 신호와 영상 신호가 동기하도록, 버퍼 ex320, ex321 등에 일단 이들 신호를 축적하면 된다. 또한, 버퍼 ex318, ex319, ex320, ex321은 도시하고 있는 바와 같이 복수 구비하고 있어도 되고, 1개 이상의 버퍼를 공유하는 구성이어도 된다. 또한, 도시하고 있는 것 이외에, 예를 들면 변조/복조부 ex302나 다중/분리부 ex303의 사이 등에서도 시스템의 오버플로우, 언더플로우를 피하는 완충재로서 버퍼에 데이터를 축적하는 것으로 해도 된다.
또, 텔레비전 ex300은, 방송 등이나 기록 미디어 등으로부터 음성 데이터, 영상 데이터를 취득하는 것 이외에, 마이크나 카메라의 AV입력을 받아들이는 구성을 구비하여, 그들로부터 취득한 데이터에 대해 부호화 처리를 행해도 된다. 또한, 여기에서는 텔레비전 ex300은 상기의 부호화 처리, 다중화, 및 외부 출력이 가능한 구성으로서 설명했지만, 이들 처리를 행하지 못하고, 상기 수신, 복호화 처리, 외부 출력 만이 가능한 구성이어도 된다.
또, 리더/레코더 ex218에서 기록 미디어로부터 다중화 데이터를 독출하거나, 또는 기입하는 경우에는, 상기 복호화 처리 또는 부호화 처리는 텔레비전 ex300, 리더/레코더 ex218 중 어느 하나에서 행해도 되고, 텔레비전 ex300과 리더/레코더 ex218이 서로 분담해서 행해도 된다.
일례로서, 광디스크로부터 데이터의 읽어들임 또는 기입을 하는 경우의 정보 재생/기록부 ex400의 구성을 도 21에 나타낸다. 정보 재생/기록부 ex400은, 이하에 설명하는 요소 ex401, ex402, ex403, ex404, ex405, ex406, ex407을 구비한다. 광헤드 ex401은, 광디스크인 기록 미디어 ex215의 기록면에 레이저 스폿을 조사하여 정보를 기입하고, 기록 미디어 ex215의 기록면으로부터의 반사광을 검출하여 정보를 읽어들인다. 변조 기록부 ex402는, 광헤드 ex401에 내장된 반도체 레이저를 전기적으로 구동하여 기록 데이터에 따라 레이저광의 변조를 행한다. 재생 복조부 ex403은, 광헤드 ex401에 내장된 포토디텍터에 의해 기록면으로부터의 반사광을 전기적으로 검출한 재생 신호를 증폭하여, 기록 미디어 ex215에 기록된 신호 성분을 분리하여 복조하고, 필요한 정보를 재생한다. 버퍼 ex404는, 기록 미디어 ex215에 기록하기 위한 정보 및 기록 미디어 ex215로부터 재생한 정보를 일시적으로 유지한다. 디스크 모터 ex405는 기록 미디어 ex215를 회전시킨다. 서보 제어부 ex406은, 디스크 모터 ex405의 회전 구동을 제어하면서 광헤드 ex401을 소정의 정보 트럭으로 이동시켜, 레이저 스폿의 추종 처리를 행한다. 시스템 제어부 ex407은, 정보 재생/기록부 ex400 전체의 제어를 행한다. 상기의 읽어냄이나 기입의 처리는 시스템 제어부 ex407이, 버퍼 ex404에 유지된 각종 정보를 이용하여, 또 필요에 따라 새로운 정보의 생성·추가를 행함과 함께, 변조 기록부 ex402, 재생 복조부 ex403, 서보 제어부 ex406을 협조 동작시키면서, 광헤드 ex401을 통하여, 정보의 기록 재생을 행함으로써 실현된다. 시스템 제어부 ex407은 예를 들면 마이크로 프로세서로 구성되며, 독출 기입의 프로그램을 실행함으로써 그들 처리를 실행한다.
이상에서는, 광헤드 ex401은 레이저 스폿을 조사하는 것으로 설명했지만, 근접장광을 이용하여 보다 고밀도의 기록을 행하는 구성이어도 된다.
도 22에 광디스크인 기록 미디어 ex215의 모식도를 나타낸다. 기록 미디어 ex215의 기록면에는 안내 홈(그루브)이 스파이럴 형상으로 형성되고, 정보 트럭 ex230에는, 미리 그루브의 형상의 변화에 의해 디스크 상의 절대 위치를 나타내는 번지 정보가 기록되어 있다. 이 번지 정보는 데이터를 기록하는 단위인 기록 블록 ex231의 위치를 특정하기 위한 정보를 포함하며, 기록이나 재생을 행하는 장치에 있어서 정보 트럭 ex230을 재생하여 번지 정보를 판독함으로써 기록 블록을 특정할 수 있다. 또, 기록 미디어 ex215는, 데이터 기록 영역 ex233, 내주 영역 ex232, 외주 영역 ex234를 포함하고 있다. 사용자 데이터를 기록하기 위해 이용하는 영역이 데이터 기록 영역 ex233이며, 데이터 기록 영역 ex233보다 내주 또는 외주에 배치되어 있는 내주 영역 ex232와 외주 영역 ex234는, 사용자 데이터의 기록 이외의 특정 용도에 이용된다. 정보 재생/기록부 ex400은, 이러한 기록 미디어 ex215의 데이터 기록 영역 ex233에 대해, 부호화된 음성 데이터, 영상 데이터 또는 그들의 데이터를 다중화한 다중화 데이터의 읽고 쓰기를 행한다.
이상에서는, 1층의 DVD, BD 등의 광디스크를 예로 들어 설명했지만, 이들에 한정된 것이 아니라, 다층 구조이며 표면 이외에도 기록 가능한 광디스크여도 된다. 또, 디스크의 동일한 장소에 다양한 다른 파장의 색 광을 이용하여 정보를 기록하거나, 다양한 각도로부터 다른 정보의 층을 기록하거나, 다차원적인 기록/재생을 행하는 구조의 광디스크여도 된다.
또, 디지털 방송용 시스템 ex200에 있어서, 안테나 ex205를 가지는 차 ex210에서 위성 ex202 등으로부터 데이터를 수신하여, 차 ex210이 가지는 카 내비게이션 ex211 등의 표시장치에 동영상을 재생하는 것도 가능하다. 또한, 카 내비게이션 ex211의 구성은 예를 들면 도 20에 나타내는 구성 중, GPS 수신부를 더한 구성을 생각할 수 있으며, 동일한 것을 컴퓨터 ex111이나 휴대 전화 ex114 등에서도 생각할 수 있다.
도 23(a)는, 상기 실시의 형태에서 설명한 동화상 복호화 방법 및 동화상 부호화 방법을 이용한 휴대 전화 ex114를 나타내는 도이다. 휴대 전화 ex114는, 기지국 ex110과의 사이에서 전파를 송수신하기 위한 안테나 ex350, 영상, 정지화상을 찍는 것이 가능한 카메라부 ex365, 카메라부 ex365로 촬상한 영상, 안테나 ex350으로 수신한 영상 등이 복호화된 데이터를 표시하는 액정 디스플레이 등의 표시부 ex358을 구비한다. 휴대 전화 ex114는, 또한, 조작 키부 ex366을 가지는 본체부, 음성을 출력하기 위한 스피커 등인 음성 출력부 ex357, 음성을 입력하기 위한 마이크 등인 음성 입력부 ex356, 촬영한 영상, 정지화상, 녹음한 음성, 또는 수신한 영상, 정지화상, 메일 등의 부호화된 데이터 혹은 복호화된 데이터를 보존하는 메모리부 ex367, 또는 동일하게 데이터를 보존하는 기록 미디어와의 인터페이스부인 슬롯부 ex364를 구비한다.
또한, 휴대 전화 ex114의 구성예에 대해서, 도 23(b)를 이용하여 설명한다. 휴대 전화 ex114는, 표시부 ex358 및 조작 키부 ex366을 구비한 본체부의 각 부를 통괄적으로 제어하는 주제어부 ex360에 대해, 전원 회로부 ex361, 조작 입력 제어부 ex362, 영상 신호 처리부 ex355, 카메라 인터페이스부 ex363, LCD(Liquid Crystal Display) 제어부 ex359, 변조/복조부 ex352, 다중/분리부 ex353, 음성 신호 처리부 ex354, 슬롯부 ex364, 메모리부 ex367이 버스 ex370을 통하여 서로 접속되어 있다.
전원 회로부 ex361은, 사용자의 조작에 의해 종화 및 전원 키가 온 상태로 되면, 배터리 팩으로부터 각 부에 대해 전력을 공급함으로써 휴대 전화 ex114를 동작 가능한 상태로 기동한다.
휴대 전화 ex114는, CPU, ROM, RAM 등을 가지는 주제어부 ex360의 제어에 기초하여, 음성 통화 모드 시에 음성 입력부 ex356에서 수음한 음성 신호를 음성 신호 처리부 ex354에서 디지털 음성 신호로 변환하고, 이것을 변조/복조부 ex352에서 스펙트럼 확산 처리하고, 송신/수신부 ex351에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나 ex350을 통하여 송신한다. 또 휴대 전화 ex114는, 음성 통화 모드 시에 안테나 ex350을 통하여 수신한 수신 데이터를 증폭하여 주파수 변환 처리 및 아날로그 디지털 변환 처리를 실시하고, 변조/복조부 ex352에서 스펙트럼 역확산 처리하여, 음성 신호 처리부 ex354에서 아날로그 음성 신호로 변환한 후, 이것을 음성 출력부 ex357로부터 출력한다.
또한 데이터 통신 모드 시에 전자 메일을 송신하는 경우, 본체부의 조작 키부 ex366 등의 조작에 의해 입력된 전자 메일의 텍스트 데이터는 조작 입력 제어부 ex362를 통하여 주제어부 ex360에 송출된다. 주제어부 ex360은, 텍스트 데이터를 변조/복조부 ex352에서 스펙트럼 확산 처리를 하고, 송신/수신부 ex351에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나 ex350을 통하여 기지국 ex110에 송신한다. 전자 메일을 수신하는 경우는, 수신한 데이터에 대해 이 거의 반대의 처리가 행해져, 표시부 ex358에 출력된다.
데이터 통신 모드 시에 영상, 정지화상, 또는 영상과 음성을 송신하는 경우, 영상 신호 처리부 ex355는, 카메라부 ex365로부터 공급된 영상 신호를 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법에 의해 압축 부호화하고(즉, 본 발명의 화상 부호화 장치로서 기능한다), 부호화된 영상 데이터를 다중/분리부 ex353에 송출한다. 또, 음성 신호 처리부 ex354는, 영상, 정지화상 등을 카메라부 ex365에서 촬상 중에 음성 입력부 ex356에서 수음한 음성 신호를 부호화하고, 부호화된 음성 데이터를 다중/분리부 ex353에 송출한다.
다중/분리부 ex353은, 영상 신호 처리부 ex355로부터 공급된 부호화된 영상 데이터와 음성 신호 처리부 ex354로부터 공급된 부호화된 음성 데이터를 소정의 방식으로 다중화하여, 그 결과 얻어지는 다중화 데이터를 변조/복조부(변조/복조 회로부) ex352에서 스펙트럼 확산 처리를 하고, 송신/수신부 ex351에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나 ex350을 통하여 송신한다.
데이터 통신 모드 시에 홈 페이지 등에 링크된 동화상 파일의 데이터를 수신하는 경우, 또는 영상 및 혹은 음성이 첨부된 전자 메일을 수신하는 경우, 안테나 ex350을 통하여 수신된 다중화 데이터를 복호화하기 위해, 다중/분리부 ex353은, 다중화 데이터를 분리함으로써 영상 데이터의 비트 스트림과 음성 데이터의 비트 스트림으로 나누어, 동기 버스 ex370을 통하여 부호화된 영상 데이터를 영상 신호 처리부 ex355에 공급함과 함께, 부호화된 음성 데이터를 음성 신호 처리부 ex354에 공급한다. 영상 신호 처리부 ex355는, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법에 대응한 동화상 복호화 방법에 의해 복호화함으로써 영상 신호를 복호하고(즉, 본 발명의 화상 복호 장치로서 기능한다), LCD 제어부 ex359를 통하여 표시부 ex358로부터, 예를 들면 홈 페이지에 링크된 동화상 파일에 포함되는 영상, 정지화상이 표시된다. 또 음성 신호 처리부 ex354는, 음성 신호를 복호하여, 음성 출력부 ex357로부터 음성이 출력된다.
또, 상기 휴대 전화 ex114 등의 단말은, 텔레비전 ex300과 마찬가지로, 부호화기·복호화기를 모두 가지는 송수신형 단말 외에, 부호화기뿐인 송신 단말, 복호화기뿐인 수신 단말이라는 세가지의 실장 형식을 생각할 수 있다. 또한, 디지털 방송용 시스템 ex200에 있어서, 영상 데이터에 음악 데이터 등이 다중화된 다중화 데이터를 수신, 송신하는 것으로서 설명했지만, 음성 데이터 이외에 영상에 관련하는 문자 데이터 등이 다중화된 데이터여도 되고, 다중화 데이터가 아닌 영상 데이터 자체여도 된다.
이와 같이, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 혹은 동화상 복호화 방법을 상기 서술한 어느 하나의 기기·시스템에 이용하는 것은 가능하며, 그렇게 함으로써, 상기 각 실시의 형태에서 설명한 효과를 얻을 수 있다.
또, 본 발명은 이와 같은 상기 실시의 형태에 한정되는 것이 아닌, 본 발명의 범위를 일탈하는 일 없이 다양한 변형 또는 수정이 가능하다.
(실시의 형태 5)
상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치와, MPEG-2, MPEG4-AVC, VC-1등 다른 규격에 준거한 동화상 부호화 방법 또는 장치를, 필요에 따라 적절히 전환함으로써, 영상 데이터를 생성하는 것도 가능하다.
여기서, 각각 다른 규격에 준거하는 복수의 영상 데이터를 생성한 경우, 복호할 때에, 각각의 규격에 대응한 복호 방법을 선택할 필요가 있다. 그러나, 복호하는 영상 데이터가, 어느 규격에 준거하는 것인지 식별할 수 없기 때문에, 적절한 복호 방법을 선택할 수 없다는 과제가 생긴다.
이 과제를 해결하기 위해, 영상 데이터에 음성 데이터 등을 다중화한 다중화 데이터는, 영상 데이터가 어느 규격에 준거하는 것인지를 나타내는 식별 정보를 포함하는 구성으로 한다. 상기 각 실시의 형태에서 나타내는 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터를 포함하는 다중화 데이터의 구체적인 구성을 이하 설명한다. 다중화 데이터는, MPEG-2 트랜스포트 스트림 형식의 디지털 스트림이다.
도 24는, 다중화 데이터의 구성을 나타내는 도이다. 도 24에 나타내는 바와 같이 다중화 데이터는, 비디오 스트림, 오디오 스트림, 프리젠테이션 그래픽스 스트림(PG), 인터랙티브 그래픽스 스트림 중, 1개 이상을 다중화함으로써 얻을 수 있다. 비디오 스트림은 영화의 주영상 및 부영상을, 오디오 스트림(IG)은 영화의 주음성 부분과 그 주음성과 믹싱하는 부음성을, 프리젠테이션 그래픽스 스트림은, 영화의 자막을 각각 나타내고 있다. 여기서 주영상이란 화면에 표시되는 통상의 영상을 나타내며, 부영상이란 주영상 중에 작은 화면으로 표시하는 영상이다. 또, 인터랙티브 그래픽스 스트림은, 화면 상에 GUI 부품을 배치함으로써 작성되는 대화 화면을 나타내고 있다. 비디오 스트림은, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거한 동화상 부호화 방법 또는 장치에 의해 부호화되어 있다. 오디오 스트림은, 돌비 AC-3, Dolby Digital Plus, MLP, DTS, DTS-HD, 또는, 리니어 PCM 등의 방식으로 부호화되어 있다.
다중화 데이터에 포함되는 각 스트림은 PID에 의해 식별된다. 예를 들면, 영화의 영상에 이용하는 비디오 스트림에는 0x1011이, 오디오 스트림에는 0x1100에서 0x111F까지가, 프리젠테이션 그래픽스에는 0x1200에서 0x121F까지가, 인터랙티브 그래픽스 스트림에는 0x1400에서 0x141F까지가, 영화의 부영상에 이용하는 비디오 스트림에는 0x1B00에서 0x1B1F까지, 주음성과 믹싱하는 부음성에 이용하는 오디오 스트림에는 0x1A00에서 0x1A1F가, 각각 할당되어 있다.
도 25는, 다중화 데이터가 어떻게 다중화되는지를 모식적에서 나타내는 도이다. 우선, 복수의 비디오 프레임으로 이루어지는 비디오 스트림 ex235, 복수의 오디오 프레임으로 이루어지는 오디오 스트림 ex238을, 각각 PES 패킷열 ex236 및 ex239로 변환하고, TS패킷 ex237 및 ex240으로 변환한다. 마찬가지로 프리젠테이션 그래픽스 스트림 ex241 및 인터랙티브 그래픽스 ex244의 데이터를 각각 PES 패킷열 ex242 및 ex245로 변환하고, 또한 TS패킷 ex243 및 ex246으로 변환한다. 다중화 데이터 ex247은 이들 TS패킷을 1개의 스트림에 다중화함으로써 구성된다.
도 26은, PES 패킷열에, 비디오 스트림이 어떻게 기억되는지를 더 상세하게 나타내고 있다. 도 26에 있어서의 제1단은 비디오 스트림의 비디오 프레임열을 나타낸다. 제2단은, PES 패킷열을 나타낸다. 도 26의 화살표 yy1, yy2, yy3, yy4로 나타내는 바와 같이, 비디오 스트림에 있어서의 복수의 Video Presentation Unit인 I픽처, B픽처, P픽처는, 픽처마다 분할되어, PES 패킷의 페이로드에 기억된다. 각 PES 패킷은 PES 헤더를 가지며, PES 헤더에는, 픽처의 표시 시각인 PTS(Presentation Time-Stamp)나 픽처의 복호 시각인 DTS(Decoding Time-Stamp)가 기억된다.
도 27은, 다중화 데이터에 최종적으로 기입되는 TS패킷의 형식을 나타내고 있다. TS패킷은, 스트림을 식별하는 PID 등의 정보를 가지는 4Byte의 TS헤더와 데이터를 기억하는 184Byte의 TS페이로드로 구성되는 188Byte 고정길이의 패킷이며, 상기 PES 패킷은 분할되어 TS페이로드에 기억된다. BD-ROM의 경우, TS패킷에는, 4Byte의 TP_Extra_Header가 부여되며, 192Byte의 소스 패킷을 구성하여, 다중화 데이터에 기입된다. TP_Extra_Header에는 ATS(Arrival_Time_Stamp) 등의 정보가 기재된다. ATS는 상기 TS패킷의 디코더의 PID 필터로의 전송 개시 시각을 나타낸다. 다중화 데이터에는 도 27 하단에 나타내는 바와 같이 소스 패킷이 늘어서게 되고, 다중화 데이터의 선두로부터 인크리먼트하는 번호는 SPN(소스 패킷 넘버)로 불린다.
또, 다중화 데이터에 포함되는 TS패킷에는, 영상·음성·자막 등의 각 스트림 이외에도 PAT(Program Association Table), PMT(Program Map Table), PCR(Program Clock Reference) 등이 있다. PAT는 다중화 데이터 중에 이용되는 PMT의 PID가 무엇인지를 나타내고, PAT 자신의 PID는 0으로 등록된다. PMT는, 다중화 데이터 중에 포함되는 영상·음성·자막 등의 각 스트림의 PID와 각 PID에 대응하는 스트림의 속성 정보를 가지며, 또 다중화 데이터에 관한 각종 디스크립터를 가진다. 디스크립터에는 다중화 데이터의 카피를 허가·불허가를 지시하는 카피 컨트롤 정보 등이 있다. PCR는, ATS의 시간축인 ATC(Arrival Time Clock)와 PTS·DTS의 시간축인 STC(System Time Clock)의 동기를 취하기 위해, 그 PCR 패킷이 디코더에 전송되는 ATS에 대응하는 STC 시간의 정보를 가진다.
도 28은 PMT의 데이터 구조를 상세하게 설명하는 도이다. PMT의 선두에는, 그 PMT에 포함되는 데이터의 길이 등을 적은 PMT 헤더가 배치된다. 그 뒤에는, 다중화 데이터에 관한 디스크립터가 복수 배치된다. 상기 카피 컨트롤 정보 등이, 디스크립터로서 기재된다. 디스크립터 뒤에는, 다중화 데이터에 포함되는 각 스트림에 관한 스트림 정보가 복수 배치된다. 스트림 정보는, 스트림의 압축 코덱 등을 식별하기 위해 스트림 타입, 스트림의 PID, 스트림의 속성 정보(프레임 레이트, 종횡비 등)가 기재된 스트림 디스크립터로 구성된다. 스트림 디스크립터는 다중화 데이터에 존재하는 스트림의 수만큼 존재한다.
기록 매체 등에 기록하는 경우에는, 상기 다중화 데이터는, 다중화 데이터 정보 파일과 함께 기록된다.
다중화 데이터 정보 파일은, 도 29에 나타내는 바와 같이 다중화 데이터의 관리 정보이며, 다중화 데이터와 1대 1로 대응하여, 다중화 데이터 정보, 스트림 속성 정보와 엔트리 맵으로 구성된다.
다중화 데이터 정보는 도 29에 나타내는 바와 같이 시스템 레이트, 재생 개시 시각, 재생 종료 시각으로 구성되어 있다. 시스템 레이트는 다중화 데이터의, 후술하는 시스템 타겟 디코더의 PID 필터로의 최대 전송 레이트를 나타낸다. 다중화 데이터 중에 포함되는 ATS의 간격은 시스템 레이트 이하가 되도록 설정되어 있다. 재생 개시 시각은 다중화 데이터의 선두의 비디오 프레임의 PTS이며, 재생 종료 시각은 다중화 데이터의 종단의 비디오 프레임의 PTS에 1프레임 분의 재생 간격을 더한 것이 설정된다.
스트림 속성 정보는 도 30에 나타내는 바와 같이, 다중화 데이터에 포함되는 각 스트림에 대한 속성 정보가, PID마다 등록된다. 속성 정보는 비디오 스트림, 오디오 스트림, 프리젠테이션 그래픽스 스트림, 인터랙티브 그래픽스 스트림마다 다른 정보를 가진다. 비디오 스트림 속성 정보는, 그 비디오 스트림이 어떠한 압축 코덱으로 압축되었는지, 비디오 스트림을 구성하는 개개의 픽처 데이터의 해상도가 어느 정도인지, 종횡비는 어느 정도인지, 프레임 레이트는 어느 정도인지 등의 정보를 가진다. 오디오 스트림 속성 정보는, 그 오디오 스트림이 어떠한 압축 코덱으로 압축되었는지, 그 오디오 스트림에 포함되는 채널수는 몇인지, 무슨 언어에 대응하는지, 샘플링 주파수가 어느 정도인지 등의 정보를 가진다. 이러한 정보는, 플레이어가 재생하기 전의 디코더의 초기화 등에 이용된다.
본 실시의 형태에 있어서는, 상기 다중화 데이터 중, PMT에 포함되는 스트림 타입을 이용한다. 또, 기록 매체에 다중화 데이터가 기록되어 있는 경우에는, 다중화 데이터 정보로 포함되는, 비디오 스트림 속성 정보를 이용한다. 구체적으로는, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 있어서, PMT에 포함되는 스트림 타입, 또는, 비디오 스트림 속성 정보에 대해, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터인 것을 나타내는 고유의 정보를 설정하는 단계 또는 수단을 설치한다. 이 구성에 의해, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성한 영상 데이터와, 다른 규격에 준거하는 영상 데이터를 식별하는 것이 가능하게 된다.
또, 본 실시의 형태에 있어서의 동화상 복호화 방법의 단계를 도 31에 나타낸다. 단계 exS100에 있어서, 다중화 데이터로부터 PMT에 포함되는 스트림 타입, 또는, 다중화 데이터 정보로 포함되는 비디오 스트림 속성 정보를 취득한다. 다음에, 단계 exS101에 있어서, 스트림 타입, 또는, 비디오 스트림 속성 정보가 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 다중화 데이터인 것을 나타내고 있는지 아닌지를 판단한다. 그리고, 스트림 타입, 또는, 비디오 스트림 속성 정보가 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 것이라고 판단된 경우에는, 단계 exS102에 있어서, 상기 각 실시의 형태에서 나타낸 동화상 복호 방법에 의해 복호를 행한다. 또, 스트림 타입, 또는, 비디오 스트림 속성 정보가, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 것임을 나타내고 있는 경우에는, 단계 exS103에 있어서, 종래의 규격에 준거한 동화상 복호 방법에 의해 복호를 행한다.
이와 같이, 스트림 타입, 또는, 비디오 스트림 속성 정보에 새로운 고유치를 설정함으로써, 복호할 때에, 상기 각 실시의 형태에서 나타낸 동화상 복호화 방법 또는 장치로 복호 가능한지를 판단할 수 있다. 따라서, 다른 규격에 준거하는 다중화 데이터가 입력된 경우여도, 적절한 복호화 방법 또는 장치를 선택할 수 있기 때문에, 에러를 일으키지 않고 복호하는 것이 가능해진다. 또, 본 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치, 또는, 동화상 복호 방법 또는 장치를, 상기 서술한 어느 하나의 기기·시스템에 이용하는 것도 가능하다.
(실시의 형태 6)
상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 및 장치, 동화상 복호화 방법 및 장치는, 전형적으로는 집적회로인 LSI로 실현된다. 일례로서, 도 32에 1칩화된 LSI ex500의 구성을 나타낸다. LSI ex500은, 이하에 설명하는 요소 ex501, ex502, ex503, ex504, ex505, ex506, ex507, ex508, ex509를 구비하고, 각 요소는 버스 ex510을 통하여 접속하고 있다. 전원 회로부 ex505는 전원이 온 상태인 경우에 각 부에 대해 전력을 공급함으로써 동작 가능한 상태로 기동한다.
예를 들면 부호화 처리를 행하는 경우에는, LSI ex500은, CPU ex502, 메모리 컨트롤러 ex503, 스트림 컨트롤러 ex504, 구동 주파수 제어부 ex512 등을 가지는 제어부 ex501의 제어에 기초하여, AV I/O ex509에 의해 마이크 ex117이나 카메라 ex113 등으로부터 AV신호를 입력한다. 입력된 AV신호는, 일단 SDRAM 등의 외부의 메모리 ex511에 축적된다. 제어부 ex501의 제어에 기초하여, 축적된 데이터는 처리량이나 처리 속도에 따라 적절히 복수회로 나누어져 신호 처리부 ex507에 보내지고, 신호 처리부 ex507에 있어서 음성 신호의 부호화 및/또는 영상 신호의 부호화가 행해진다. 여기서 영상 신호의 부호화 처리는 상기 각 실시의 형태에서 설명한 부호화 처리이다. 신호 처리부 ex507에서는 또한, 경우에 따라 부호화된 음성 데이터와 부호화된 영상 데이터를 다중화하는 등의 처리를 행하고, 스트림 I/O ex506으로부터 외부로 출력한다. 이 출력된 다중화 데이터는, 기지국 ex107을 향해 송신되거나, 또는 기록 미디어 ex215에 기입된다. 또한, 다중화할 때에는 동기하도록, 일단 버퍼 ex508에 데이터를 축적하면 된다.
또한, 상기에서는, 메모리 ex511이 LSI ex500의 외부의 구성으로서 설명했지만, LSI ex500의 내부에 포함되는 구성이어도 된다. 버퍼 ex508도 1개에 한정된 것이 아닌, 복수의 버퍼를 구비하고 있어도 된다. 또, LSI ex500은 1칩화되어도 되고, 복수 칩화되어도 된다.
또, 상기에서는, 제어부 ex501이, CPU ex502, 메모리 컨트롤러 ex503, 스트림 컨트롤러 ex504, 구동 주파수 제어부 ex512 등을 가지는 것으로 하고 있지만, 제어부 ex501의 구성은, 이 구성에 한정되지 않는다. 예를 들면, 신호 처리부 ex507이 CPU를 더 구비하는 구성이어도 된다. 신호 처리부 ex507의 내부에도 CPU를 설치함으로써, 처리 속도를 보다 향상시키는 것이 가능하게 된다. 또, 다른 예로서, CPU ex502가 신호 처리부 ex507, 또는 신호 처리부 ex507의 일부인 예를 들면 음성 신호 처리부를 구비하는 구성이어도 된다. 이러한 경우에는, 제어부 ex501은, 신호 처리부 ex507, 또는 그 일부를 가지는 CPU ex502를 구비하는 구성이 된다.
또한, 여기에서는, LSI로 했지만, 집적도의 차이에 의해, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI라 호칭되기도 한다.
또, 집적 회로화의 수법은 LSI에 한정되는 것이 아닌, 전용 회로 또는 범용 프로세서로 실현되어도 된다. LSI 제조 후에, 프로그램하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속이나 설정을 재구성 가능한 리컨피규러블·프로세서를 이용해도 된다.
또한, 반도체 기술의 진보 또는 파생되는 다른 기술에 의해 LSI로 치환되는 집적 회로화의 기술이 등장하면, 당연, 그 기술을 이용하여 기능 블록의 집적화를 행해도 된다. 바이오 기술의 적응 등이 가능성으로서 있을 수 있다.
(실시의 형태 7)
상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터를 복호하는 경우, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터를 복호하는 경우에 비해, 처리량이 증가하는 것을 생각할 수 있다. 그 때문에, LSI ex500에 있어서, 종래의 규격에 준거하는 영상 데이터를 복호할 때의 CPU ex502의 구동 주파수보다 높은 구동 주파수로 설정할 필요가 있다. 그러나, 구동 주파수를 높게 하면, 소비 전력이 높아진다는 과제가 생긴다.
이 과제를 해결하기 위해, 텔레비전 ex300, LSI ex500 등의 동화상 복호화 장치는, 영상 데이터가 어느 규격에 준거하는 것인지를 식별하여, 규격에 따라 구동 주파수를 전환하는 구성으로 한다. 도 33은, 본 실시의 형태에 있어서의 구성 ex800을 나타내고 있다. 구동 주파수 전환부 ex803은, 영상 데이터가, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 것인 경우에는, 구동 주파수를 높게 설정한다. 그리고, 상기 각 실시의 형태에서 나타낸 동화상 복호화 방법을 실행하는 복호 처리부 ex801에 대해, 영상 데이터를 복호하도록 지시한다. 한편, 영상 데이터가, 종래의 규격에 준거하는 영상 데이터인 경우에는, 영상 데이터가, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 것인 경우에 비해, 구동 주파수를 낮게 설정한다. 그리고, 종래의 규격에 준거하는 복호 처리부 ex802에 대해, 영상 데이터를 복호하도록 지시한다.
보다 구체적으로는, 구동 주파수 전환부 ex803은, 도 32의 CPU ex502와 구동 주파수 제어부 ex512로 구성된다. 또, 상기 각 실시의 형태에서 나타낸 동화상 복호화 방법을 실행하는 복호 처리부 ex801, 및, 종래의 규격에 준거하는 복호 처리부 ex802는, 도 32의 신호 처리부 ex507에 해당한다. CPU ex502는, 영상 데이터가 어느 규격에 준거하는 것인지를 식별한다. 그리고, CPU ex502로부터의 신호에 기초하여, 구동 주파수 제어부 ex512는, 구동 주파수를 설정한다. 또, CPU ex502로부터의 신호에 기초하여, 신호 처리부 ex507은, 영상 데이터의 복호를 행한다. 여기서, 영상 데이터의 식별에는, 예를 들면, 실시의 형태 5에 기재한 식별 정보를 이용하는 것을 생각할 수 있다. 식별 정보에 관해서는, 실시의 형태 5에 기재한 것에 한정되지 않으며, 영상 데이터가 어느 규격에 준거하는지 식별할 수 있는 정보이면 된다. 예를 들면, 영상 데이터가 텔레비전에 이용되는 것인지, 디스크에 이용되는 것인지 등을 식별하는 외부 신호에 기초하여, 영상 데이터가 어느 규격에 준거하는 것인지 식별 가능한 경우에는, 이러한 외부 신호에 기초하여 식별해도 된다. 또, CPU ex502에 있어서의 구동 주파수의 선택은, 예를 들면, 도 35와 같은 영상 데이터의 규격과, 구동 주파수를 대응지은 룩업 테이블에 기초하여 행하는 것을 생각할 수 있다. 룩업 테이블을, 버퍼 ex508이나, LSI의 내부 메모리에 기억해 두고, CPU ex502가 이 룩업 테이블을 참조함으로써, 구동 주파수를 선택하는 것이 가능하다.
도 34는, 본 실시의 형태의 방법을 실시하는 단계를 나타내고 있다. 우선, 단계 exS200에서는, 신호 처리부 ex507에 있어서, 다중화 데이터로부터 식별 정보를 취득한다. 다음에, 단계 exS201에서는, CPU ex502에 있어서, 식별 정보에 기초하여 영상 데이터가 상기 각 실시의 형태에서 나타낸 부호화 방법 또는 장치에 의해 생성된 것인지 아닌지를 식별한다. 영상 데이터가 상기 각 실시의 형태에서 나타낸 부호화 방법 또는 장치에 의해 생성된 것인 경우에는, 단계 exS202에 있어서, 구동 주파수를 높게 설정하는 신호를, CPU ex502가 구동 주파수 제어부 ex512에 보낸다. 그리고, 구동 주파수 제어부 ex512에 있어서, 높은 구동 주파수로 설정된다. 한편, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터인 것을 나타내고 있는 경우에는, 단계 exS203에 있어서, 구동 주파수를 낮게 설정하는 신호를, CPU ex502가 구동 주파수 제어부 ex512에 보낸다. 그리고, 구동 주파수 제어부 ex512에 있어서, 영상 데이터가 상기 각 실시의 형태에서 나타낸 부호화 방법 또는 장치에 의해 생성된 것인 경우에 비해, 낮은 구동 주파수로 설정된다.
또한, 구동 주파수의 전환에 연동하여, LSI ex500 또는 LSI ex500을 포함하는 장치에 부여하는 전압을 변경함으로써, 전력 절약 효과를 보다 높이는 것이 가능하다. 예를 들면, 구동 주파수를 낮게 설정하는 경우에는, 이것에 수반하여, 구동 주파수를 높게 설정하고 있는 경우에 비해, LSI ex500 또는 LSI ex500을 포함하는 장치에 부여하는 전압을 낮게 설정하는 것을 생각할 수 있다.
또, 구동 주파수의 설정 방법은, 복호할 때의 처리량이 큰 경우에, 구동 주파수를 높게 설정하고, 복호할 때의 처리량이 작은 경우에, 구동 주파수를 낮게 설정하면 되며, 상기 서술한 설정 방법에 한정되지 않는다. 예를 들면, MPEG4-AVC 규격에 준거하는 영상 데이터를 복호하는 처리량이, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터를 복호하는 처리량보다 큰 경우에는, 구동 주파수의 설정을 상기 서술한 경우의 반대로 하는 것을 생각할 수 있다.
또한, 구동 주파수의 설정 방법은, 구동 주파수를 낮게 하는 구성에 한정되지 않는다. 예를 들면, 식별 정보가, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터인 것을 나타내고 있는 경우에는, LSI ex500 또는 LSI ex500을 포함하는 장치에 부여하는 전압을 높게 설정하고, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터인 것을 나타내고 있는 경우에는, LSI ex500 또는 LSI ex500을 포함하는 장치에 부여하는 전압을 낮게 설정하는 것도 생각할 수 있다. 또, 다른 예로서는, 식별 정보가, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터인 것을 나타내고 있는 경우에는, CPU ex502의 구동을 정지시키지 않고, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터인 것을 나타내고 있는 경우에는, 처리에 여유가 있기 때문에, CPU ex502의 구동을 일시 정지시키는 것도 생각할 수 있다. 식별 정보가, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터인 것을 나타내고 있는 경우여도, 처리에 여유가 있으면, CPU ex502의 구동을 일시 정지시키는 것도 생각할 수 있다. 이 경우는, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터인 것을 나타내고 있는 경우에 비해, 정지시간을 짧게 설정하는 것을 생각할 수 있다.
이와 같이, 영상 데이터가 준거하는 규격에 따라, 구동 주파수를 전환함으로써, 전력 절약화를 도모하는 것이 가능하게 된다. 또, 전지를 이용하여 LSI ex500 또는 LSI ex500을 포함하는 장치를 구동하고 있는 경우에는, 전력 절약화에 수반하여, 전지의 수명을 길게 하는 것이 가능하다.
(실시의 형태 8)
TV나, 휴대 전화 등, 상기 서술한 기기·시스템에는, 다른 규격에 준거하는 복수의 영상 데이터가 입력되는 경우가 있다. 이와 같이, 다른 규격에 준거하는 복수의 영상 데이터가 입력된 경우에도 복호할 수 있도록 하기 위해, LSI ex500의 신호 처리부 ex507이 복수의 규격에 대응하고 있을 필요가 있다. 그러나, 각각의 규격에 대응하는 신호 처리부 ex507을 개별적으로 이용하면, LSI ex500의 회로 규모가 커지고, 또, 비용이 증가한다는 과제가 생긴다.
이 과제를 해결하기 위해, 상기 각 실시의 형태에서 나타낸 동화상 복호 방법을 실행하기 위한 복호 처리부와, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 복호 처리부를 일부 공유화하는 구성으로 한다. 이 구성예를 도 36(a)의 ex900에 나타낸다. 예를 들면, 상기 각 실시의 형태에서 나타낸 동화상 복호 방법과, MPEG4-AVC 규격에 준거하는 동화상 복호 방법은, 엔트로피 부호화, 역양자화, 디블로킹·필터, 움직임 보상 등의 처리에 있어서 처리 내용이 일부 공통된다. 공통되는 처리 내용에 대해서는, MPEG4-AVC 규격에 대응하는 복호 처리부 ex902를 공유하고, MPEG4-AVC 규격에 대응하지 않는, 본 발명 특유의 다른 처리 내용에 대해서는, 전용의 복호 처리부 ex901을 이용한다는 구성을 생각할 수 있다. 특히, 본 발명은, 역양자화에 특징을 가지고 있기 때문에, 예를 들면, 역양자화에 대해서는 전용의 복호 처리부 ex901을 이용하고, 그 이외의 엔트로피 부호화, 디블로킹·필터, 움직임 보상 중 어느 하나, 또는, 모든 처리에 대해서는, 복호 처리부를 공유하는 것을 생각할 수 있다. 복호 처리부의 공유화에 관해서는, 공통되는 처리 내용에 대해서는, 상기 각 실시의 형태에서 나타낸 동화상 복호화 방법을 실행하기 위한 복호 처리부를 공유하고, MPEG4-AVC 규격에 특유의 처리 내용에 대해서는, 전용의 복호 처리부를 이용하는 구성이어도 된다.
또, 처리를 일부 공유화하는 다른 예를 도 36(b)의 ex1000에 나타낸다. 이 예에서는, 본 발명에 특유의 처리 내용에 대응한 전용의 복호 처리부 ex1001과, 다른 종래 규격에 특유의 처리 내용에 대응한 전용의 복호 처리부 ex1002와, 본 발명의 동화상 복호 방법과 다른 종래 규격의 동화상 복호 방법에 공통되는 처리 내용에 대응한 공용의 복호 처리부 ex1003을 이용하는 구성으로 하고 있다. 여기서, 전용의 복호 처리부 ex1001, ex1002는, 반드시 본 발명, 또는, 다른 종래 규격에 특유의 처리 내용에 특화된 것이 아닌, 다른 범용 처리를 실행할 수 있는 것이어도 된다. 또, 본 실시의 형태의 구성을, LSI ex500으로 실장하는 것도 가능하다.
이와 같이, 본 발명의 동화상 복호 방법과, 종래의 규격의 동화상 복호 방법으로 공통되는 처리 내용에 대해서, 복호 처리부를 공유함으로써, LSI의 회로 규모를 작게 하고, 또한, 비용을 저감하는 것이 가능하다.
<산업상의 이용 가능성>
본 발명은, 화상 부호화 장치 및 화상 복호 장치에 유리하게 이용된다.
10, 100 산술 부호화부 11, 101 2치화부
12, 102, 302 심볼 발생 확률 기억부 13, 103, 303 콘텍스트 제어부
14, 104 2치 산술 부호화기
105, 305 콘텍스트 구분 제어부 200 화상 부호화 장치
205 감산기 210 변환·양자화부
220 엔트로피 부호화부 230, 420 역양자화·역변환부
235, 425 가산기 240, 430 디블로킹 필터
250, 440 메모리 260, 450 인트라 예측부
270 움직임 검출부 280, 460 움직임 보상부
290, 470 인트라/인터 전환 스위치 300 산술 복호부
301 2치 산술 복호기 304 다식화부
400 화상 복호 장치 410 엔트로피 복호부

Claims (11)

  1. 화상 데이터를 블록마다 부호화하는 화상 부호화 방법으로서,
    주파수 성분마다의 복수의 계수를 포함하는 상기 블록을, 상기 복수의 계수의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하고, 상기 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정하는 콘텍스트 결정 단계와,
    2치화된 상기 복수의 계수 각각을, 상기 계수가 속하는 상기 그룹에 대응지어진 상기 콘텍스트의 확률 정보에 따라서 2치 산술 부호화하는 2치 산술 부호화 단계와,
    상기 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 상기 그룹에 속하는 상기 계수에 기초하여 갱신하는 갱신 단계를 포함하며,
    상기 콘텍스트 결정 단계에서는, 상기 복수의 그룹 각각에 속하는 상기 계수의 수가 편중되도록, 상기 블록을 상기 복수의 그룹으로 구분하는, 화상 부호화 방법.
  2. 청구항 1에 있어서,
    상기 콘텍스트 결정 단계에서는, 직류 성분을 포함하는 제1 그룹에 속하는 상기 계수의 수가, 다른 그룹에 속하는 상기 계수의 수 이하가 되도록, 상기 블록을 상기 복수의 그룹으로 구분하는, 화상 부호화 방법.
  3. 청구항 2에 있어서,
    상기 콘텍스트 결정 단계에서는, 또한, 가장 높은 주파수 성분을 포함하는 제2 그룹에 속하는 상기 계수의 수보다, 상기 제1 및 제2 그룹 사이의 제3 그룹에 속하는 상기 계수의 수가 많아지도록, 상기 블록을 상기 복수의 그룹으로 구분하는, 화상 부호화 방법.
  4. 청구항 1 내지 청구항 3 중 어느 한 항에 있어서,
    상기 복수의 계수는, 복수의 양자화 계수 각각이 제로인지 아닌지를 나타내는 제1 플래그와, 스캔순으로 마지막에 비제로가 되는 양자화 계수의 위치를 나타내는 제2 플래그를 포함하는, 화상 부호화 방법.
  5. 부호화 화상 데이터를 블록마다 복호하는 화상 복호 방법으로서,
    상기 부호화 화상 데이터의 일부인 복호 대상 신호를 포함하는 상기 블록을, 상기 복호 대상 신호의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하고, 상기 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정하는 콘텍스트 결정 단계와,
    상기 복호 대상 신호를, 상기 복호 대상 신호가 속하는 상기 그룹에 대응지어진 상기 콘텍스트의 확률 정보에 따라서 2치 산술 복호함으로써, 2치화된 계수를 생성하는 2치 산술 복호 단계와,
    상기 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 상기 그룹에 속하는 상기 계수에 기초하여 갱신하는 갱신 단계를 포함하며,
    상기 콘텍스트 결정 단계에서는, 상기 복수의 그룹 각각에 속하는 상기 계수의 수가 편중되도록, 상기 블록을 상기 복수의 그룹으로 구분하는, 화상 복호 방법.
  6. 청구항 5에 있어서,
    상기 콘텍스트 결정 단계에서는, 직류 성분을 포함하는 제1 그룹에 속하는 상기 계수의 수가, 다른 그룹에 속하는 상기 계수의 수 이하가 되도록, 상기 블록을 상기 복수의 그룹으로 구분하는, 화상 복호 방법.
  7. 청구항 6에 있어서,
    상기 콘텍스트 결정 단계에서는, 또한, 가장 높은 주파수 성분을 포함하는 제2 그룹에 속하는 상기 계수의 수보다, 상기 제1 및 제2 그룹 사이의 제3 그룹에 속하는 상기 계수의 수가 많아지도록, 상기 블록을 상기 복수의 그룹으로 구분하는, 화상 복호 방법.
  8. 청구항 5 내지 청구항 7 중 어느 한 항에 있어서,
    상기 복수의 계수는, 복수의 양자화 계수 각각이 제로인지 아닌지를 나타내는 제1 플래그와, 스캔순으로 마지막에 비제로가 되는 양자화 계수의 위치를 나타내는 제2 플래그를 포함하는, 화상 복호 방법.
  9. 화상 데이터를 블록마다 부호화하는 화상 부호화 장치로서,
    주파수 성분마다의 복수의 계수를 포함하는 상기 블록을, 상기 복수의 계수의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하고, 상기 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정하는 콘텍스트 결정부와,
    2치화된 상기 복수의 계수 각각을, 상기 계수가 속하는 상기 그룹에 대응지어진 상기 콘텍스트의 확률 정보에 따라서 2치 산술 부호화하는 2치 산술 부호화부와,
    상기 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 상기 그룹에 속하는 상기 계수에 기초하여 갱신하는 갱신부를 구비하고,
    상기 콘텍스트 결정부는, 상기 복수의 그룹 각각에 속하는 상기 계수의 수가 편중되도록, 상기 블록을 상기 복수의 그룹으로 구분하는, 화상 부호화 장치.
  10. 부호화 화상 데이터를 블록마다 복호하는 화상 복호 장치로서,
    상기 부호화 화상 데이터의 일부인 복호 대상 신호를 포함하는 상기 블록을, 상기 복호 대상 신호의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하고, 상기 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정하는 콘텍스트 결정부와,
    상기 복호 대상 신호를, 상기 복호 대상 신호가 속하는 상기 그룹에 대응지어진 상기 콘텍스트의 확률 정보에 따라서 2치 산술 복호함으로써, 2치화된 계수를 생성하는 2치 산술 복호부와,
    상기 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 상기 그룹에 속하는 상기 계수에 기초하여 갱신하는 갱신부를 구비하고,
    상기 콘텍스트 결정부는, 상기 복수의 그룹 각각에 속하는 상기 계수의 수가 편중되도록, 상기 블록을 상기 복수의 그룹으로 구분하는, 화상 복호 장치.
  11. 화상 데이터를 블록마다 부호화하여 부호화 화상 데이터를 생성하는 화상 부호화 장치와,
    상기 부호화 화상 데이터를 블록마다 복호하는 화상 복호 장치를 구비하는 화상 부호화 복호 장치로서,
    상기 화상 부호화 장치는,
    주파수 성분마다의 복수의 계수를 포함하는 상기 블록을, 상기 복수의 계수의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하고, 상기 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정하는 제1 콘텍스트 결정부와,
    2치화된 상기 복수의 계수 각각을, 상기 계수가 속하는 상기 그룹에 대응지어진 상기 콘텍스트의 확률 정보에 따라서 2치 산술 부호화하는 2치 산술 부호화부와,
    상기 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 상기 그룹에 속하는 상기 계수에 기초하여 갱신하는 제1 갱신부를 구비하고,
    상기 화상 복호 장치는,
    상기 부호화 화상 데이터의 일부인 복호 대상 신호를 포함하는 상기 블록을, 상기 복호 대상 신호의 종류에 따라 주파수 성분의 범위마다 복수의 그룹으로 구분하고, 상기 복수의 그룹과 복수의 콘텍스트의 대응 관계를 결정하는 제2 콘텍스트 결정부와,
    상기 복호 대상 신호를, 상기 복호 대상 신호가 속하는 상기 그룹에 대응지어진 상기 콘텍스트의 확률 정보에 따라서 2치 산술 복호함으로써, 2치화된 계수를 생성하는 2치 산술 복호부와,
    상기 복수의 콘텍스트의 확률 정보 각각을, 상기 콘텍스트에 대응지어진 상기 그룹에 속하는 상기 계수에 기초하여 갱신하는 제2 갱신부를 구비하고,
    상기 제1 및 제2 콘텍스트 결정부는, 상기 복수의 그룹 각각에 속하는 상기 계수의 수가 편중되도록, 상기 블록을 상기 복수의 그룹으로 구분하는, 화상 부호화 복호 장치.
KR1020137016639A 2011-01-19 2012-01-18 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 및 화상 부호화 복호 장치 KR101888218B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161434015P 2011-01-19 2011-01-19
US61/434,015 2011-01-19
PCT/JP2012/000265 WO2012098868A1 (ja) 2011-01-19 2012-01-18 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及び画像符号化復号装置

Publications (2)

Publication Number Publication Date
KR20130140098A true KR20130140098A (ko) 2013-12-23
KR101888218B1 KR101888218B1 (ko) 2018-08-13

Family

ID=46515504

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137016639A KR101888218B1 (ko) 2011-01-19 2012-01-18 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 및 화상 부호화 복호 장치

Country Status (3)

Country Link
US (2) US10075706B2 (ko)
KR (1) KR101888218B1 (ko)
WO (1) WO2012098868A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012098868A1 (ja) * 2011-01-19 2012-07-26 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及び画像符号化復号装置
US9124872B2 (en) 2012-04-16 2015-09-01 Qualcomm Incorporated Coefficient groups and coefficient coding for coefficient scans
TWI561060B (en) * 2015-01-15 2016-12-01 Mstar Semiconductor Inc Signal processing apparatus and signal processing method including quantization or inverse-quantization process
CN116915998A (zh) 2016-04-29 2023-10-20 世宗大学校产学协力团 视频信号编码/解码方法和设备
CN109328461B (zh) 2016-04-29 2023-09-05 世宗大学校产学协力团 视频信号编码/解码方法和设备
US20190208225A1 (en) * 2018-01-02 2019-07-04 Qualcomm Incorporated Sign prediction in video coding

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7251371B2 (en) * 2001-11-16 2007-07-31 Ntt Docomo, Inc. Image encoding method, image decoding method, image encoder, image decoder, program, computer data signal, and image transmission system
US20070237240A1 (en) * 2006-04-06 2007-10-11 Samsung Electronics Co., Ltd. Video coding method and apparatus supporting independent parsing

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5666161A (en) * 1993-04-26 1997-09-09 Hitachi, Ltd. Method and apparatus for creating less amount of compressd image data from compressed still image data and system for transmitting compressed image data through transmission line
ATE352826T1 (de) * 2002-05-02 2007-02-15 Fraunhofer Ges Forschung Arithmetische codierung von transformationskoeffizienten
KR100529540B1 (ko) * 2003-01-07 2005-11-17 주식회사 이시티 웨이블릿 변환을 이용한 영상압축방법
US8483282B2 (en) * 2007-10-12 2013-07-09 Qualcomm, Incorporated Entropy coding of interleaved sub-blocks of a video block
US8891615B2 (en) * 2008-01-08 2014-11-18 Qualcomm Incorporated Quantization based on rate-distortion modeling for CABAC coders
WO2012098868A1 (ja) * 2011-01-19 2012-07-26 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及び画像符号化復号装置
CN107277552B (zh) * 2011-12-21 2019-10-29 太阳专利托管公司 图像编码方法及装置、图像解码方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7251371B2 (en) * 2001-11-16 2007-07-31 Ntt Docomo, Inc. Image encoding method, image decoding method, image encoder, image decoder, program, computer data signal, and image transmission system
US20070237240A1 (en) * 2006-04-06 2007-10-11 Samsung Electronics Co., Ltd. Video coding method and apparatus supporting independent parsing

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ISO/IEC 14496-10 「MPEG-4 Part10 Advanced Video Coding」
Thomas Wiegand et al, "Overview of the H.264/AVC Video Coding Standard", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, JULY 2003, PP.1-19.

Also Published As

Publication number Publication date
US10075706B2 (en) 2018-09-11
US20130272427A1 (en) 2013-10-17
US20180352234A1 (en) 2018-12-06
KR101888218B1 (ko) 2018-08-13
US10587879B2 (en) 2020-03-10
WO2012098868A1 (ja) 2012-07-26

Similar Documents

Publication Publication Date Title
JP6531924B2 (ja) 動画像復号方法及び動画像復号装置
JP6210396B2 (ja) 復号方法および復号装置
TWI572193B (zh) An image coding method, an image coding apparatus, an image decoding method, an image decoding apparatus, and an image coding / decoding apparatus
KR102107644B1 (ko) 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 및 화상 부호화 복호 장치
KR102071574B1 (ko) 화상 부호화 방법, 화상 부호화 장치, 화상 복호화 방법, 화상 복호화 장치, 및 화상 부호화 복호화 장치
WO2012096185A1 (ja) 画像符号化方法、画像符号化装置、画像復号方法、画像復号装置、および画像符号化復号装置
JP6489337B2 (ja) 算術復号方法および算術符号化方法
KR102130046B1 (ko) 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치 및 화상 부호화 복호 장치
JPWO2014038130A1 (ja) 画像符号化方法および画像符号化装置
KR101888218B1 (ko) 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 및 화상 부호화 복호 장치
WO2011129090A1 (ja) 符号化歪み除去方法、符号化方法、復号化方法、符号化歪み除去装置、符号化装置、および復号化装置
WO2015177966A1 (ja) 画像符号化方法及び画像符号化装置
WO2012077349A1 (ja) 画像符号化方法および画像復号化方法
WO2012105267A1 (ja) 画像符号化方法
WO2011135829A1 (ja) 符号化方法及び復号方法

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant