KR102442406B1 - 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 - Google Patents

부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 Download PDF

Info

Publication number
KR102442406B1
KR102442406B1 KR1020187032854A KR20187032854A KR102442406B1 KR 102442406 B1 KR102442406 B1 KR 102442406B1 KR 1020187032854 A KR1020187032854 A KR 1020187032854A KR 20187032854 A KR20187032854 A KR 20187032854A KR 102442406 B1 KR102442406 B1 KR 102442406B1
Authority
KR
South Korea
Prior art keywords
encoding
binarized data
arithmetic
bit string
unit
Prior art date
Application number
KR1020187032854A
Other languages
English (en)
Other versions
KR20190008224A (ko
Inventor
다카히로 니시
다다마사 도마
기요후미 아베
Original Assignee
파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 filed Critical 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카
Publication of KR20190008224A publication Critical patent/KR20190008224A/ko
Application granted granted Critical
Publication of KR102442406B1 publication Critical patent/KR102442406B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

부호화 장치(100)는, 화상 정보를 부호화하는 부호화 장치로서, 메모리(162)와, 메모리(162)에 액세스 가능한 회로(160)를 구비하고, 메모리(162)에 액세스 가능한 회로(160)는, 화상 정보로부터 산술 부호화를 위한 2치화에 따라 2치화 데이터열을 도출하고, 2치화 데이터열을 포함하고, 또한, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보를 포함하는 비트열을 출력하고, 비트열의 출력에 있어서, 산술 부호화가 적용되어 있지 않은 2치화 데이터열을 포함하고, 또한, 2치화 데이터열에 대해 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 적용 정보로서 포함하는 비트열을 출력한다.

Description

부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
본 발명은 화상 정보를 부호화하는 부호화 장치 등에 관한 것이다.
종래의 부호화 방식인 H.265에서는, 화상 정보를 효율적으로 부호화하기 위해, 산술 부호화가 사용되고 있다.
H.265(ISO/IEC 23008-2 HEVC(High Efficiency Video Coding))
그러나, 산술 부호화 또는 산술 복호에 의해 발생하는 처리 지연에 의해, 화상 정보의 부호화 또는 복호를 단시간에 실시하는 것이 곤란한 경우가 있다.
그래서, 본 발명은, 산술 부호화 등에 의해 발생하는 처리 지연의 삭감을 지원할 수 있는 부호화 장치 등을 제공한다.
본 발명의 일 양태에 관련된 부호화 장치는, 화상 정보를 부호화하는 부호화 장치로서, 메모리와, 상기 메모리에 액세스 가능한 회로를 구비하고, 상기 메모리에 액세스 가능한 상기 회로는, 상기 화상 정보로부터, 가변 발생 확률에 따라 행해지는 콘텍스트 적응 산술 부호화와, 고정 발생 확률에 따라 행해지는 바이패스 산술 부호화를 포함하는 산술 부호화를 위한 2치화에 따라 2치화 데이터열을 도출하고, 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보를 포함하는 비트열을 출력하고, 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열을 출력한다. 또한, 본 발명은, 화상 정보를 부호화하는 부호화 장치로서, 메모리와, 상기 메모리에 액세스 가능한 회로를 구비하고, 상기 메모리에 액세스 가능한 상기 회로는, 상기 화상 정보로부터, 가변 발생 확률에 따라 행해지는 콘텍스트 적응 산술 부호화와, 고정 발생 확률에 따라 행해지는 바이패스 산술 부호화를 포함하는 산술 부호화를 위한 2치화에 따라 2치화 데이터열을 도출하고, 상기 2치화 데이터열을 포함하는 비트열을 출력하고, (i) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열을 포함하는 상기 비트열을 출력하는 제1 동작과, (ii) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열을 포함하는 상기 비트열을 출력하는 제2 동작을 전환하며, 부호화 규격으로 정해진 복수의 프로파일 중 소정의 프로파일이 상기 화상 정보의 부호화에 이용되는 경우, 상기 제1 동작과 상기 제2 동작 중 한쪽으로 동작이 고정되며, 상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되지 않은 경우, 상기 비트열은, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지 여부를 나타내는 적용 정보를 포함하며, 상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되는 경우, 상기 비트열은, 상기 적용 정보를 포함하지 않는, 부호화 장치를 제공한다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 장치, 방법, 집적 회로, 컴퓨터 프로그램, 또는, 컴퓨터 판독 가능한 CD-ROM 등의 비일시적인 기록 매체로 실현되어도 되고, 시스템, 장치, 방법, 집적 회로, 컴퓨터 프로그램, 및, 기록 매체의 임의인 조합으로 실현되어도 된다.
본 발명의 일 양태에 관련된 부호화 장치 등은, 산술 부호화 등에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다.
도 1은, 실시형태 1에 관련된 부호화 장치의 기능 구성을 나타내는 블록도이다.
도 2는, 실시형태 1에 있어서의 블록 분할의 일례를 나타내는 도면이다.
도 3은, 각 변환 타입에 대응하는 변환 기저 함수를 나타내는 표이다.
도 4A는, ALF에서 사용되는 필터의 형상의 일례를 나타내는 도면이다.
도 4B는, ALF에서 사용되는 필터의 형상의 다른 일례를 나타내는 도면이다.
도 4C는, ALF에서 사용되는 필터의 형상의 다른 일례를 나타내는 도면이다.
도 5는, 인트라 예측에 있어서의 67개의 인트라 예측 모드를 나타내는 도면이다.
도 6은, 움직임 궤도에 따른 2개의 블록간에서의 패턴 매칭(바이래터럴 매칭)을 설명하기 위한 도면이다.
도 7은, 커런트 픽처 내의 템플릿과 참조 픽처 내의 블록 사이에서의 패턴 매칭(템플릿 매칭)을 설명하기 위한 도면이다.
도 8은, 등속 직선 운동을 가정한 모델을 설명하기 위한 도면이다.
도 9는, 복수의 인접 블록의 움직임 벡터에 기초하는 서브 블록 단위의 움직임 벡터의 도출을 설명하기 위한 도면이다.
도 10은, 실시형태 1에 관련된 복호 장치의 기능 구성을 나타내는 블록도이다.
도 11은, 실시형태 1에 관련된 부호화 장치에 있어서의 엔트로피 부호화부의 상세한 기능 구성을 나타내는 블록도이다.
도 12는, 실시형태 1에 관련된 복호 장치에 있어서의 엔트로피 복호부의 상세한 기능 구성을 나타내는 블록도이다.
도 13은, 실시형태 1에 관련된 부호화 장치 및 복호 장치를 포함하는 코덱 시스템의 기능 구성을 나타내는 블록도이다.
도 14는, 실시형태 1에 관련된 부호화 장치의 실장예를 나타내는 블록도이다.
도 15는, 실시형태 1에 관련된 부호화 장치의 제1 부호화 동작예를 나타내는 플로우 차트이다.
도 16은, 실시형태 1에 관련된 부호화 장치의 제2 부호화 동작예를 나타내는 플로우 차트이다.
도 17은, 실시형태 1에 관련된 복호 장치의 실장예를 나타내는 블록도이다.
도 18은, 실시형태 1에 관련된 복호 장치의 제1 복호 동작예를 나타내는 플로우 차트이다.
도 19는, 실시형태 1에 관련된 복호 장치의 제2 복호 동작예를 나타내는 플로우 차트이다.
도 20은, 컨텐츠 배신(配信) 서비스를 실현하는 컨텐츠 공급 시스템의 전체 구성도이다.
도 21은, 스케일러블 부호화시의 부호화 구조의 일례를 나타내는 도면이다.
도 22는, 스케일러블 부호화시의 부호화 구조의 일례를 나타내는 도면이다.
도 23은, web 페이지의 표시 화면예를 나타내는 도면이다.
도 24는, web 페이지의 표시 화면예를 나타내는 도면이다.
도 25는, 스마트폰의 일례를 나타내는 도면이다.
도 26은, 스마트폰의 구성예를 나타내는 블록도이다.
(본 발명의 기초가 된 지견)
종래의 부호화 방식인 H.265에서는, 화상 정보를 효율적으로 부호화하기 위해, 산술 부호화가 사용되고 있다. 구체적으로는, CABAC라고 불리는 콘텍스트 적응형 2치 산술 부호화 방식이 채용되고 있다.
예를 들어, 콘텍스트 적응형 2치 산술 부호화 방식에서는, 2치화에 의해, 다치 신호가 0 또는 1로 표현되는 값의 데이터열인 2치화 데이터열로 변환된다. 그리고, 데이터 종별 등의 콘텍스트에 따라 0 또는 1의 발생 확률이 소정의 복수의 발생 확률 중에서 선택되고, 선택된 발생 확률에 따라 2치화 데이터열에 대해 2치 산술 부호화가 적용된다. 그리고, 2치화 데이터열에 포함되는 0 또는 1의 값에 따라 발생 확률이 갱신된다.
즉, 콘텍스트 적응형 2치 산술 부호화 방식에서는, 가변의 발생 확률에 따라 2치 산술 부호화가 실시된다. 또, 콘텍스트 적응형 2치 산술 부호화 방식에서는, 특정한 데이터 종별 등에 대해, 고정의 발생 확률에 따라 2치 산술 부호화가 실시된다.
이와 같은 산술 부호화에 의해, 높은 부호화 효율이 얻어진다. 바꿔 말하면, 이와 같은 산술 부호화에 의해, 높은 압축률이 얻어진다.
그러나, 이와 같은 산술 부호화, 및, 이와 같은 산술 부호화에 대응하는 산술 복호에서는, 복잡한 처리가 사용되어, 처리 지연이 발생한다. 따라서, 단시간에 화상 정보의 부호화 또는 복호를 실시하는 것이 곤란하다.
그래서, 본 발명의 일 양태에 관련된 부호화 장치는, 화상 정보를 부호화하는 부호화 장치로서, 메모리와, 상기 메모리에 액세스 가능한 회로를 구비하고, 상기 메모리에 액세스 가능한 상기 회로는, 상기 화상 정보로부터 산술 부호화를 위한 2치화에 따라 2치화 데이터열을 도출하고, 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보를 포함하는 비트열을 출력하고, 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열을 출력한다.
이로써, 부호화 장치는, 산술 부호화를 스킵할 수 있다. 따라서, 부호화 장치는, 산술 부호화에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다. 또, 부호화 장치는, 산술 부호화에 관한 2치화의 자원을 유효하게 활용할 수 있다. 또, 부호화 장치는, 산술 부호화의 적용 상태가 적용 정보에 의해 식별 가능한 비트열을 출력할 수 있다.
예를 들어, 상기 회로는, (i) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열을 출력하는 제1 동작과, (ii) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열을 출력하는 제2 동작을 전환해도 된다.
이로써, 부호화 장치는, 산술 부호화를 실시하는지의 여부를 적응적으로 전환할 수 있고, 산술 부호화를 적응적으로 스킵할 수 있다.
또, 예를 들어, 상기 회로는, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지의 여부를 1 이상의 픽처를 포함하는 단위로 포괄적으로 나타내는 상기 적용 정보를 포함하는 상기 비트열을 출력해도 된다.
이로써, 부호화 장치는, 적용 정보에 관한 부호량 및 처리량의 증가를 억제할 수 있다.
또, 본 발명의 일 양태에 관련된 부호화 장치는, 화상 정보를 부호화하는 부호화 장치로서, 메모리와, 상기 메모리에 액세스 가능한 회로를 구비하고, 상기 메모리에 액세스 가능한 상기 회로는, 상기 화상 정보로부터 산술 부호화를 위한 2치화에 따라 2치화 데이터열을 도출하고, 상기 2치화 데이터열을 포함하는 비트열을 출력하고, (i) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열을 포함하는 상기 비트열을 출력하는 제1 동작과, (ii) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열을 포함하는 상기 비트열을 출력하는 제2 동작을 전환하는 부호화 장치이어도 된다.
이로써, 부호화 장치는, 산술 부호화를 실시하는지의 여부를 적응적으로 전환할 수 있고, 산술 부호화를 적응적으로 스킵할 수 있다. 따라서, 부호화 장치는, 산술 부호화에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다. 또, 부호화 장치는, 산술 부호화에 관한 2치화의 자원을 유효하게 활용할 수 있다.
예를 들어, 상기 회로는, 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보를 포함하는 상기 비트열을 출력하고, (i) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열을 출력하는 상기 제1 동작과, (ii) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열을 출력하는 상기 제2 동작을 전환해도 된다.
이로써, 부호화 장치는, 산술 부호화의 적용 상태가 적용 정보에 의해 식별 가능한 비트열을 출력할 수 있다.
또, 예를 들어, 상기 회로는, 1 이상의 픽처를 포함하는 단위로 포괄적으로, 상기 제1 동작과 상기 제2 동작을 전환해도 된다.
이로써, 부호화 장치는, 산술 부호화의 적용 상태의 전환에 관한 처리량의 증가를 억제할 수 있다.
또, 본 발명의 일 양태에 관련된 복호 장치는, 화상 정보를 복호하는 복호 장치로서, 메모리와, 상기 메모리에 액세스 가능한 회로를 구비하고, 상기 메모리에 액세스 가능한 상기 회로는, 상기 화상 정보로부터 산술 부호화를 위한 2치화에 따라 도출된 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보를 포함하는 비트열을 취득하고, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열로부터, 상기 화상 정보를 도출한다.
이로써, 복호 장치는, 산술 복호를 스킵할 수 있다. 따라서, 복호 장치는, 산술 복호에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다. 또, 복호 장치는, 산술 복호에 관한 역2치화의 자원을 유효하게 활용할 수 있다. 또, 복호 장치는, 산술 부호화의 적용 상태가 적용 정보에 의해 식별 가능한 비트열로부터 화상 정보를 도출할 수 있다.
예를 들어, 상기 회로는, (i) 상기 화상 정보의 도출에 있어서, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 제1 동작과, (ii) 상기 화상 정보의 도출에 있어서, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 제2 동작을 전환해도 된다.
이로써, 복호 장치는, 산술 복호를 실시하는지의 여부를 적응적으로 전환할 수 있고, 산술 복호를 적응적으로 스킵할 수 있다.
또, 예를 들어, 상기 회로는, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지의 여부를 1 이상의 픽처를 포함하는 단위로 포괄적으로 나타내는 상기 적용 정보를 포함하는 상기 비트열을 취득해도 된다.
이로써, 복호 장치는, 적용 정보에 관한 부호량 및 처리량의 증가를 억제할 수 있다.
또, 본 발명의 일 양태에 관련된 복호 장치는, 화상 정보를 복호하는 복호 장치로서, 메모리와, 상기 메모리에 액세스 가능한 회로를 구비하고, 상기 메모리에 액세스 가능한 상기 회로는, 상기 화상 정보로부터 산술 부호화를 위한 2치화에 따라 도출된 2치화 데이터열을 포함하는 비트열을 취득하고, 상기 2치화 데이터열로부터 상기 화상 정보를 도출하고, (i) 상기 화상 정보의 도출에 있어서, 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 제1 동작과, (ii) 상기 화상 정보의 도출에 있어서, 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 제2 동작을 전환하는 복호 장치이어도 된다.
이로써, 복호 장치는, 산술 복호를 실시하는지의 여부를 적응적으로 전환할 수 있고, 산술 복호를 적응적으로 스킵할 수 있다. 따라서, 복호 장치는, 산술 복호에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다. 또, 복호 장치는, 산술 복호에 관한 역2치화의 자원을 유효하게 활용할 수 있다.
예를 들어, 상기 회로는, 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보를 포함하는 상기 비트열을 취득하고, (i) 상기 화상 정보의 도출에 있어서, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 상기 제1 동작과, (ii) 상기 화상 정보의 도출에 있어서, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 상기 제2 동작을 전환해도 된다.
이로써, 복호 장치는, 산술 부호화의 적용 상태가 적용 정보에 의해 식별 가능한 비트열을 취득하고, 화상 정보를 도출할 수 있다.
또, 예를 들어, 상기 회로는, 1 이상의 픽처를 포함하는 단위로 포괄적으로, 상기 제1 동작과 상기 제2 동작을 전환해도 된다.
이로써, 복호 장치는, 산술 부호화의 적용 상태의 전환에 관한 처리량의 증가를 억제할 수 있다.
또, 본 발명의 일 양태에 관련된 부호화 방법은, 화상 정보를 부호화하는 부호화 방법으로서, 상기 화상 정보로부터 산술 부호화를 위한 2치화에 따라 2치화 데이터열을 도출하고, 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보를 포함하는 비트열을 출력하고, 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열을 출력한다.
이로써, 이 부호화 방법을 실행하는 장치 등은, 산술 부호화를 스킵할 수 있다. 따라서, 이 부호화 방법을 실행하는 장치 등은, 산술 부호화에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다. 또, 이 부호화 방법을 실행하는 장치 등은, 산술 부호화에 관한 2치화의 자원을 유효하게 활용할 수 있다. 또, 이 부호화 방법을 실행하는 장치 등은, 산술 부호화의 적용 상태가 적용 정보에 의해 식별 가능한 비트열을 출력할 수 있다.
또, 본 발명의 일 양태에 관련된 부호화 방법은, 화상 정보를 부호화하는 부호화 방법으로서, 상기 화상 정보로부터 산술 부호화를 위한 2치화에 따라 2치화 데이터열을 도출하고, 상기 2치화 데이터열을 포함하는 비트열을 출력하고, (i) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열을 포함하는 상기 비트열을 출력하는 제1 동작과, (ii) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열을 포함하는 상기 비트열을 출력하는 제2 동작을 전환하는 부호화 방법이어도 된다.
이로써, 이 부호화 방법을 실행하는 장치 등은, 산술 부호화를 실시하는지의 여부를 적응적으로 전환할 수 있고, 산술 부호화를 적응적으로 스킵할 수 있다. 따라서, 이 부호화 방법을 실행하는 장치 등은, 산술 부호화에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다. 또, 이 부호화 방법을 실행하는 장치 등은, 산술 부호화에 관한 2치화의 자원을 유효하게 활용할 수 있다.
또, 본 발명의 일 양태에 관련된 복호 방법은, 화상 정보를 복호하는 복호 방법으로서, 상기 화상 정보로부터 산술 부호화를 위한 2치화에 따라 도출된 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보를 포함하는 비트열을 취득하고, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열로부터, 상기 화상 정보를 도출한다.
이로써, 이 복호 방법을 실행하는 장치 등은, 산술 복호를 스킵할 수 있다. 따라서, 이 복호 방법을 실행하는 장치 등은, 산술 복호에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다. 또, 이 복호 방법을 실행하는 장치 등은, 산술 복호에 관한 역2치화의 자원을 유효하게 활용할 수 있다. 또, 이 복호 방법을 실행하는 장치 등은, 산술 부호화의 적용 상태가 적용 정보에 의해 식별 가능한 비트열을 취득하고, 화상 정보를 도출할 수 있다.
또, 본 발명의 일 양태에 관련된 복호 방법은, 화상 정보를 복호하는 복호 방법으로서, 상기 화상 정보로부터 산술 부호화를 위한 2치화에 따라 도출된 2치화 데이터열을 포함하는 비트열을 취득하고, 상기 2치화 데이터열로부터 상기 화상 정보를 도출하고, (i) 상기 화상 정보의 도출에 있어서, 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 제1 동작과, (ii) 상기 화상 정보의 도출에 있어서, 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 제2 동작을 전환하는 복호 방법이어도 된다.
이로써, 이 복호 방법을 실행하는 장치 등은, 산술 복호를 실시하는지의 여부를 적응적으로 전환할 수 있고, 산술 복호를 적응적으로 스킵할 수 있다. 따라서, 이 복호 방법을 실행하는 장치 등은, 산술 복호에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다. 또, 이 복호 방법을 실행하는 장치 등은, 산술 복호에 관한 역2치화의 자원을 유효하게 활용할 수 있다.
또한 이들의 포괄적 또는 구체적인 양태는, 시스템, 장치, 방법, 집적 회로, 컴퓨터 프로그램, 또는, 컴퓨터 판독 가능한 CD-ROM 등의 비일시적인 기록 매체로 실현되어도 되고, 시스템, 장치, 방법, 집적 회로, 컴퓨터 프로그램, 및, 기록 매체의 임의인 조합으로 실현되어도 된다.
이하, 실시형태에 대해 도면을 참조하면서 구체적으로 설명한다.
또한, 이하에서 설명하는 실시형태는, 모두 포괄적 또는 구체적인 예를 나타내는 것이다. 이하의 실시형태에서 나타내는 수치, 형상, 재료, 구성 요소, 구성 요소의 배치 위치 및 접속 형태, 스텝, 스텝의 순서 등은 일례이고, 청구의 범위를 한정하는 주지는 아니다. 또, 이하의 실시형태에 있어서의 구성 요소 중, 최상위 개념을 나타내는 독립 청구항에 기재되지 않은 구성 요소에 대해서는, 임의의 구성 요소로서 설명된다.
(실시형태 1)
[부호화 장치의 개요]
먼저, 실시형태 1에 관련된 부호화 장치의 개요를 설명한다. 도 1은, 실시형태 1에 관련된 부호화 장치(100)의 기능 구성을 나타내는 블록도이다. 부호화 장치(100)는, 동화상/화상을 블록 단위로 부호화하는 동화상/화상 부호화 장치이다.
도 1에 나타내는 바와 같이, 부호화 장치(100)는, 화상을 블록 단위로 부호화하는 장치로서, 분할부(102)와, 감산부(104)와, 변환부(106)와, 양자화부(108)와, 엔트로피 부호화부(110)와, 역양자화부(112)와, 역변환부(114)와, 가산부(116)와, 블록 메모리(118)와, 루프 필터부(120)와, 프레임 메모리(122)와, 인트라 예측부(124)와, 인터 예측부(126)와, 예측 제어부(128)를 구비한다.
부호화 장치(100)는, 예를 들어, 범용 프로세서 및 메모리에 의해 실현된다. 이 경우, 메모리에 격납된 소프트웨어 프로그램이 프로세서에 의해 실행되었을 때, 프로세서는, 분할부(102), 감산부(104), 변환부(106), 양자화부(108), 엔트로피 부호화부(110), 역양자화부(112), 역변환부(114), 가산부(116), 루프 필터부(120), 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)로서 기능한다. 또, 부호화 장치(100)는, 분할부(102), 감산부(104), 변환부(106), 양자화부(108), 엔트로피 부호화부(110), 역양자화부(112), 역변환부(114), 가산부(116), 루프 필터부(120), 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)에 대응하는 전용의 1 이상의 전자 회로로서 실현되어도 된다.
이하에, 부호화 장치(100)에 포함되는 각 구성 요소에 대해 설명한다.
[분할부]
분할부(102)는, 입력 동화상에 포함되는 각 픽처를 복수의 블록으로 분할하고, 각 블록을 감산부(104)에 출력한다. 예를 들어, 분할부(102)는, 먼저, 픽처를 고정 사이즈(예를 들어 128x128)의 블록으로 분할한다. 이 고정 사이즈의 블록은, 부호화 트리 유닛(CTU)이라고 불리는 경우가 있다. 그리고, 분할부(102)는, 재귀적인 사분목(quadtree) 및/또는 이분목(binary tree) 블록 분할에 기초하여, 고정 사이즈의 블록의 각각을 가변 사이즈(예를 들어 64x64 이하)의 블록으로 분할한다. 이 가변 사이즈의 블록은, 부호화 유닛(CU), 예측 유닛(PU) 혹은 변환 유닛(TU)이라고 불리는 경우가 있다. 또한, 본 실시형태에서는, CU, PU 및 TU는 구별될 필요는 없고, 픽처 내의 일부 또는 모든 블록이 CU, PU, TU의 처리 단위가 되어도 된다.
도 2는, 실시형태 1에 있어서의 블록 분할의 일례를 나타내는 도면이다. 도 2에 있어서, 실선은 사분목 블록 분할에 의한 블록 경계를 나타내고, 파선은 이분목 블록 분할에 의한 블록 경계를 나타낸다.
여기서는, 블록(10)은, 128x128 화소의 정방형 블록(128x128 블록)이다. 이 128x128 블록(10)은, 먼저, 4개의 정방형의 64x64 블록으로 분할된다(사분목 블록 분할).
좌측 상단의 64x64 블록은, 추가로 2개의 사각형의 32x64 블록으로 수직으로 분할되고, 좌측의 32x64 블록은 추가로 2개의 사각형의 16x64 블록으로 수직으로 분할된다(이분목 블록 분할). 그 결과, 좌측 상단의 64x64 블록은, 2개의 16x64 블록(11, 12)과, 32x64 블록(13)으로 분할된다.
우측 상단의 64x64 블록은, 2개의 사각형의 64x32 블록(14, 15)으로 수평으로 분할된다(이분목 블록 분할).
좌측 하단의 64x64 블록은, 4개의 정방형의 32x32 블록으로 분할된다(사분목 블록 분할). 4개의 32x32 블록 중 좌측 상단의 블록 및 우측 하단의 블록은 추가로 분할된다. 좌측 상단의 32x32 블록은, 2개의 사각형의 16x32 블록으로 수직으로 분할되고, 우측의 16x32 블록은 추가로 2개의 16x16 블록으로 수평으로 분할된다(이분목 블록 분할). 우측 하단의 32x32 블록은, 2개의 32x16 블록으로 수평으로 분할된다(이분목 블록 분할). 그 결과, 좌측 하단의 64x64 블록은, 16x32 블록(16)과, 2개의 16x16 블록(17, 18)과, 2개의 32x32 블록(19, 20)과, 2개의 32x16 블록(21, 22)으로 분할된다.
우측 하단의 64x64 블록(23)은 분할되지 않는다.
이상과 같이, 도 2에서는, 블록(10)은, 재귀적인 사분목 및 이분목 블록 분할에 기초하여, 13개의 가변 사이즈의 블록(11∼23)으로 분할된다. 이와 같은 분할은, QTBT(quad-tree plus binary tree) 분할이라고 불리는 경우가 있다.
또한, 도 2에서는, 1개의 블록이 4개 또는 2개의 블록으로 분할되어 있었지만(사분목 또는 이분목 블록 분할), 분할은 이것에 한정되지 않는다. 예를 들어, 1개의 블록이 3개의 블록으로 분할되어도 된다(삼분목 블록 분할). 이와 같은 삼분목 블록 분할을 포함하는 분할은, MBT(multi type tree) 분할이라고 불리는 경우가 있다.
[감산부]
감산부(104)는, 분할부(102)에 의해 분할된 블록 단위로 원신호(원샘플)로부터 예측 신호(예측 샘플)를 감산한다. 요컨대, 감산부(104)는, 부호화 대상 블록(이하, 커런트 블록이라고 한다)의 예측 오차(잔차라고도 한다)를 산출한다. 그리고, 감산부(104)는, 산출된 예측 오차를 변환부(106)에 출력한다.
원신호는, 부호화 장치(100)의 입력 신호이고, 동화상을 구성하는 각 픽처의 화상을 나타내는 신호(예를 들어 휘도(luma) 신호 및 2개의 색차(chroma) 신호)이다. 이하에 있어서, 화상을 나타내는 신호를 샘플이라고도 하는 경우도 있다.
[변환부]
변환부(106)는, 공간 영역의 예측 오차를 주파수 영역의 변환 계수로 변환하고, 변환 계수를 양자화부(108)에 출력한다. 구체적으로는, 변환부(106)는, 예를 들어 공간 영역의 예측 오차에 대해 미리 정해진 이산 코사인 변환(DCT) 또는 이산 사인 변환(DST)을 실시한다.
또한, 변환부(106)는, 복수의 변환 타입 중에서 적응적으로 변환 타입을 선택하고, 선택된 변환 타입에 대응하는 변환 기저 함수(transform basis function)를 사용하여, 예측 오차를 변환 계수로 변환해도 된다. 이와 같은 변환은, EMT(explicit multiple core transform) 또는 AMT(adaptive multiple transform)이라고 불리는 경우가 있다.
복수의 변환 타입은, 예를 들어, DCT-II, DCT-V, DCT-VIII, DST-I 및 DST-VII을 포함한다. 도 3은, 각 변환 타입에 대응하는 변환 기저 함수를 나타내는 표이다. 도 3에 있어서 N은 입력 화소의 수를 나타낸다. 이들 복수의 변환 타입 중에서의 변환 타입의 선택은, 예를 들어, 예측의 종류(인트라 예측 및 인터 예측)에 의존해도 되고, 인트라 예측 모드에 의존해도 된다.
이와 같은 EMT 또는 AMT를 적용하는지의 여부를 나타내는 정보(예를 들어 AMT 플래그라고 불린다) 및 선택된 변환 타입을 나타내는 정보는, CU 레벨로 신호화된다. 또한, 이들 정보의 신호화는, CU 레벨에 한정될 필요는 없고, 다른 레벨(예를 들어, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.
또, 변환부(106)는, 변환 계수(변환 결과)를 재변환해도 된다. 이와 같은 재변환은, AST(adaptive secondary transform) 또는 NSST(non-separable secondary transform)라고 불리는 경우가 있다. 예를 들어, 변환부(106)는, 인트라 예측 오차에 대응하는 변환 계수의 블록에 포함되는 서브 블록(예를 들어 4x4 서브 블록)마다 재변환을 실시한다. NSST를 적용하는지의 여부를 나타내는 정보 및 NSST에 사용되는 변환 행렬에 관한 정보는, CU 레벨로 신호화된다. 또한, 이들 정보의 신호화는, CU 레벨에 한정될 필요는 없고, 다른 레벨(예를 들어, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.
[양자화부]
양자화부(108)는, 변환부(106)로부터 출력된 변환 계수를 양자화한다. 구체적으로는, 양자화부(108)는, 커런트 블록의 변환 계수를 소정의 주사 순서로 주사하고, 주사된 변환 계수에 대응하는 양자화 파라미터(QP)에 기초하여 당해 변환 계수를 양자화한다. 그리고, 양자화부(108)는, 커런트 블록의 양자화된 변환 계수(이하, 양자화 계수라고 한다)를 엔트로피 부호화부(110) 및 역양자화부(112)에 출력한다.
소정의 순서는, 변환 계수의 양자화/역양자화를 위한 순서이다. 예를 들어, 소정의 주사 순서는, 주파수의 오름차순(저주파로부터 고주파의 순서) 또는 내림차순(고주파로부터 저주파의 순서)으로 정의된다.
양자화 파라미터란, 양자화 스텝(양자화폭)을 정의하는 파라미터이다. 예를 들어, 양자화 파라미터의 값이 증가하면 양자화 스텝도 증가한다. 요컨대, 양자화 파라미터의 값이 증가하면 양자화 오차가 증대된다.
[엔트로피 부호화부]
엔트로피 부호화부(110)는, 양자화부(108)로부터의 입력인 양자화 계수를 가변 길이 부호화함으로써 부호화 신호(부호화 비트스트림)를 생성한다. 구체적으로는, 엔트로피 부호화부(110)는, 예를 들어, 양자화 계수를 2치화하고, 2치 신호를 산술 부호화한다.
[역양자화부]
역양자화부(112)는, 양자화부(108)로부터의 입력인 양자화 계수를 역양자화한다. 구체적으로는, 역양자화부(112)는, 커런트 블록의 양자화 계수를 소정의 주사 순서로 역양자화한다. 그리고, 역양자화부(112)는, 커런트 블록의 역양자화된 변환 계수를 역변환부(114)에 출력한다.
[역변환부]
역변환부(114)는, 역양자화부(112)로부터의 입력인 변환 계수를 역변환함으로써 예측 오차를 복원한다. 구체적으로는, 역변환부(114)는, 변환 계수에 대해, 변환부(106)에 의한 변환에 대응하는 역변환을 실시함으로써, 커런트 블록의 예측 오차를 복원한다. 그리고, 역변환부(114)는, 복원된 예측 오차를 가산부(116)에 출력한다.
또한, 복원된 예측 오차는, 양자화에 의해 정보가 없어져 있으므로, 감산부(104)가 산출한 예측 오차와 일치하지 않는다. 즉, 복원된 예측 오차에는, 양자화 오차가 포함되어 있다.
[가산부]
가산부(116)는, 역변환부(114)로부터의 입력인 예측 오차와 예측 제어부(128)로부터의 입력인 예측 신호를 가산함으로써 커런트 블록을 재구성한다. 그리고, 가산부(116)는, 재구성된 블록을 블록 메모리(118) 및 루프 필터부(120)에 출력한다. 재구성 블록은, 로컬 복호 블록이라고 불리는 경우도 있다.
[블록 메모리]
블록 메모리(118)는, 인트라 예측으로 참조되는 블록이고 부호화 대상 픽처(이하, 커런트 픽처라고 한다) 내의 블록을 격납하기 위한 기억부이다. 구체적으로는, 블록 메모리(118)는, 가산부(116)로부터 출력된 재구성 블록을 격납한다.
[루프 필터부]
루프 필터부(120)는, 가산부(116)에 의해 재구성된 블록에 루프 필터를 실시하고, 필터된 재구성 블록을 프레임 메모리(122)에 출력한다. 루프 필터란, 부호화 루프 내에서 사용되는 필터(인루프 필터)이고, 예를 들어, 디블로킹·필터(DF), 샘플 어뎁티브 오프셋(SAO) 및 어뎁티브 루프 필터(ALF) 등을 포함한다.
ALF에서는, 부호화 변형을 제거하기 위한 최소 제곱 오차 필터가 적용되고, 예를 들어 커런트 블록 내의 2x2 서브 블록마다, 국소적인 구배(gradient)의 방향 및 활성도(activity)에 기초하여 복수의 필터 중에서 선택된 1개의 필터가 적용된다.
구체적으로는, 먼저, 서브 블록(예를 들어 2x2 서브 블록)이 복수의 클래스(예를 들어 15 또는 25 클래스)로 분류된다. 서브 블록의 분류는, 구배의 방향 및 활성도에 기초하여 실시된다. 예를 들어, 구배의 방향값(D)(예를 들어 0∼2 또는 0∼4)과 구배의 활성값(A)(예를 들어 0∼4)을 사용하여 분류값(C)(예를 들어 C=5D+A)이 산출된다. 그리고, 분류값(C)에 기초하여, 서브 블록이 복수의 클래스(예를 들어 15 또는 25 클래스)로 분류된다.
구배의 방향값(D)은, 예를 들어, 복수의 방향(예를 들어 수평, 수직 및 2개의 대각 방향)의 구배를 비교함으로써 도출된다. 또, 구배의 활성값(A)은, 예를 들어, 복수의 방향의 구배를 가산하고, 가산 결과를 양자화함으로써 도출된다.
이와 같은 분류의 결과에 기초하여, 복수의 필터 중에서 서브 블록을 위한 필터가 결정된다.
ALF에서 사용되는 필터의 형상으로는 예를 들어 원대칭 형상이 이용된다. 도 4A∼도 4C는, ALF에서 사용되는 필터의 형상의 복수의 예를 나타내는 도면이다. 도 4A는, 5x5 다이아몬드 형상 필터를 나타내고, 도 4B는, 7x7 다이아몬드 형상 필터를 나타내고, 도 4C는, 9x9 다이아몬드 형상 필터를 나타낸다. 필터의 형상을 나타내는 정보는, 픽처 레벨로 신호화된다. 또한, 필터의 형상을 나타내는 정보의 신호화는, 픽처 레벨에 한정될 필요는 없고, 다른 레벨(예를 들어, 시퀀스 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 CU 레벨)이어도 된다.
ALF의 온/오프는, 예를 들어, 픽처 레벨 또는 CU 레벨로 결정된다. 예를 들어, 휘도에 대해서는 CU 레벨로 ALF를 적용하는지의 여부가 결정되고, 색차에 대해서는 픽처 레벨로 ALF를 적용하는지의 여부가 결정된다. ALF의 온/오프를 나타내는 정보는, 픽처 레벨 또는 CU 레벨로 신호화된다. 또한, ALF의 온/오프를 나타내는 정보의 신호화는, 픽처 레벨 또는 CU 레벨에 한정될 필요는 없고, 다른 레벨(예를 들어, 시퀀스 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.
선택 가능한 복수의 필터(예를 들어 15 또는 25까지의 필터)의 계수 세트는, 픽처 레벨로 신호화된다. 또한, 계수 세트의 신호화는, 픽처 레벨에 한정될 필요는 없고, 다른 레벨(예를 들어, 시퀀스 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨, CU 레벨 또는 서브 블록 레벨)이어도 된다.
[프레임 메모리]
프레임 메모리(122)는, 인터 예측에 사용되는 참조 픽처를 격납하기 위한 기억부이고, 프레임 버퍼라고 불리는 경우도 있다. 구체적으로는, 프레임 메모리(122)는, 루프 필터부(120)에 의해 필터된 재구성 블록을 격납한다.
[인트라 예측부]
인트라 예측부(124)는, 블록 메모리(118)에 격납된 커런트 픽처 내의 블록을 참조하여 커런트 블록의 인트라 예측(화면 내 예측이라고도 한다)을 실시함으로써, 예측 신호(인트라 예측 신호)를 생성한다. 구체적으로는, 인트라 예측부(124)는, 커런트 블록에 인접하는 블록의 샘플(예를 들어 휘도값, 색차값)을 참조하여 인트라 예측을 실시함으로써 인트라 예측 신호를 생성하고, 인트라 예측 신호를 예측 제어부(128)에 출력한다.
예를 들어, 인트라 예측부(124)는, 미리 규정된 복수의 인트라 예측 모드 중 하나를 사용하여 인트라 예측을 실시한다. 복수의 인트라 예측 모드는, 1 이상의 비방향성 예측 모드와, 복수의 방향성 예측 모드를 포함한다.
1 이상의 비방향성 예측 모드는, 예를 들어 H.265/HEVC(High-Efficiency Video Coding) 규격(비특허문헌 1)으로 규정된 Planar 예측 모드 및 DC 예측 모드를 포함한다.
복수의 방향성 예측 모드는, 예를 들어 H.265/HEVC 규격으로 규정된 33방향의 예측 모드를 포함한다. 또한, 복수의 방향성 예측 모드는, 33방향에 더하여 추가로 32방향의 예측 모드(합계로 65개의 방향성 예측 모드)를 포함해도 된다. 도 5는, 인트라 예측에 있어서의 67개의 인트라 예측 모드(2개의 비방향성 예측 모드 및 65개의 방향성 예측 모드)를 나타내는 도면이다. 실선 화살표는, H.265/HEVC 규격으로 규정된 33방향을 나타내고, 파선 화살표는, 추가된 32방향을 나타낸다.
또한, 색차 블록의 인트라 예측에 있어서, 휘도 블록이 참조되어도 된다. 요컨대, 커런트 블록의 휘도 성분에 기초하여, 커런트 블록의 색차 성분이 예측되어도 된다. 이와 같은 인트라 예측은, CCLM(cross-component linear model) 예측이라고 불리는 경우가 있다. 이와 같은 휘도 블록을 참조하는 색차 블록의 인트라 예측 모드(예를 들어 CCLM 모드라고 불린다)는, 색차 블록의 인트라 예측 모드의 하나로서 더해져도 된다.
인트라 예측부(124)는, 수평/수직 방향의 참조 화소의 구배에 기초하여 인트라 예측 후의 화소값을 보정해도 된다. 이와 같은 보정을 수반하는 인트라 예측은, PDPC(position dependent intra prediction combination)라고 불리는 경우가 있다. PDPC의 적용의 유무를 나타내는 정보(예를 들어 PDPC 플래그라고 불린다)는, 예를 들어 CU 레벨로 신호화된다. 또한, 이 정보의 신호화는, CU 레벨에 한정될 필요는 없고, 다른 레벨(예를 들어, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.
[인터 예측부]
인터 예측부(126)는, 프레임 메모리(122)에 격납된 참조 픽처이고 커런트 픽처와는 상이한 참조 픽처를 참조하여 커런트 블록의 인터 예측(화면간 예측이라고도 한다)을 실시함으로써, 예측 신호(인터 예측 신호)를 생성한다. 인터 예측은, 커런트 블록 또는 커런트 블록 내의 서브 블록(예를 들어 4x4 블록)의 단위로 실시된다. 예를 들어, 인터 예측부(126)는, 커런트 블록 또는 서브 블록에 대해 참조 픽처 내에서 움직임 탐색(motion estimation)을 실시한다. 그리고, 인터 예측부(126)는, 움직임 탐색에 의해 얻어진 움직임 정보(예를 들어 움직임 벡터)를 사용하여 움직임 보상을 실시함으로써 커런트 블록 또는 서브 블록의 인터 예측 신호를 생성한다. 그리고, 인터 예측부(126)는, 생성된 인터 예측 신호를 예측 제어부(128)에 출력한다.
움직임 보상에 사용된 움직임 정보는 신호화된다. 움직임 벡터의 신호화에는, 예측 움직임 벡터(motion vector predictor)가 사용되어도 된다. 요컨대, 움직임 벡터와 예측 움직임 벡터 사이의 차분이 신호화되어도 된다.
또한, 움직임 탐색에 의해 얻어진 커런트 블록의 움직임 정보뿐만 아니라, 인접 블록의 움직임 정보도 사용하여, 인터 예측 신호가 생성되어도 된다. 구체적으로는, 움직임 탐색에 의해 얻어진 움직임 정보에 기초하는 예측 신호와, 인접 블록의 움직임 정보에 기초하는 예측 신호를 가중치 가산함으로써, 커런트 블록 내의 서브 블록 단위로 인터 예측 신호가 생성되어도 된다. 이와 같은 인터 예측(움직임 보상)은, OBMC(overlapped block motion compensation)라고 불리는 경우가 있다.
이와 같은 OBMC 모드에서는, OBMC를 위한 서브 블록의 사이즈를 나타내는 정보(예를 들어 OBMC 블록 사이즈라고 불린다)는, 시퀀스 레벨로 신호화된다. 또, OBMC 모드를 적용하는지의 여부를 나타내는 정보(예를 들어 OBMC 플래그라고 불린다)는, CU 레벨로 신호화된다. 또한, 이들 정보의 신호화의 레벨은, 시퀀스 레벨 및 CU 레벨에 한정될 필요는 없고, 다른 레벨(예를 들어 픽처 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.
또한, 움직임 정보는 신호화되지 않고, 복호 장치측에서 도출되어도 된다. 예를 들어, H.265/HEVC 규격으로 규정된 머지 모드가 사용되어도 된다. 또 예를 들어, 복호 장치측에서 움직임 탐색을 실시함으로써 움직임 정보가 도출되어도 된다. 이 경우, 커런트 블록의 화소값을 사용하지 않고 움직임 탐색이 실시된다.
여기서, 복호 장치측에서 움직임 탐색을 실시하는 모드에 대해 설명한다. 이 복호 장치측에서 움직임 탐색을 실시하는 모드는, PMMVD(pattern matched motion vector derivation) 모드 또는 FRUC(flame rate up-conversion) 모드라고 불리는 경우가 있다.
먼저, 머지 리스트에 포함되는 후보의 하나가 패턴 매칭에 의한 탐색의 개시 위치로서 선택된다. 패턴 매칭으로는, 제1 패턴 매칭 또는 제2 패턴 매칭이 사용된다. 제1 패턴 매칭 및 제2 패턴 매칭은, 각각, 바이래터럴 매칭(bilateral matching) 및 템플릿 매칭(template matching)이라고 불리는 경우가 있다.
제1 패턴 매칭에서는, 상이한 2개의 참조 픽처 내의 2개의 블록이며 커런트 블록의 움직임 궤도(motion trajectory) 에 따른 2개의 블록 사이에서 패턴 매칭이 실시된다.
도 6은, 움직임 궤도에 따른 2개의 블록간에서의 패턴 매칭(바이래터럴 매칭)을 설명하기 위한 도면이다. 도 6에 나타내는 바와 같이, 제1 패턴 매칭에서는, 커런트 블록(Cur block)의 움직임 궤도에 따른 2개의 블록이며 상이한 2개의 참조 픽처(Ref0, Ref1) 내의 2개의 블록의 페어 중에서 가장 매치하는 페어를 탐색함으로써 2개의 움직임 벡터(MV0, MV1)가 도출된다.
연속적인 움직임 궤도의 가정하에서는, 2개의 참조 블록을 가리키는 움직임 벡터(MV0, MV1)는, 커런트 픽처(Cur Pic)와 2개의 참조 픽처(Ref0, Ref1) 사이의 시간적인 거리(TD0, TD1)에 대해 비례한다. 예를 들어, 커런트 픽처가 시간적으로 2개의 참조 픽처 사이에 위치하고, 커런트 픽처로부터 2개의 참조 픽처에의 시간적인 거리가 동일한 경우, 제1 패턴 매칭에서는, 경영 (鏡映) 대칭인 쌍방향의 움직임 벡터가 도출된다.
제2 패턴 매칭에서는, 커런트 픽처 내의 템플릿(커런트 픽처 내에서 커런트 블록에 인접하는 블록(예를 들어 상측 및/또는 좌측 인접 블록))과 참조 픽처 내의 블록 사이에서 패턴 매칭이 실시된다.
도 7은, 커런트 픽처 내의 템플릿과 참조 픽처 내의 블록 사이에서의 패턴 매칭(템플릿 매칭)을 설명하기 위한 도면이다. 도 7에 나타내는 바와 같이, 제2 패턴 매칭에서는, 커런트 픽처(Cur Pic) 내에서 커런트 블록(Cur block)에 인접하는 블록과 가장 매치하는 블록을 참조 픽처(Ref0) 내에서 탐색함으로써 커런트 블록의 움직임 벡터가 도출된다.
이와 같은 FRUC 모드를 적용하는지의 여부를 나타내는 정보(예를 들어 FRUC 플래그라고 불린다)는, CU 레벨로 신호화된다. 또, FRUC 모드가 적용되는 경우(예를 들어 FRUC 플래그가 진(眞)인 경우), 패턴 매칭의 방법(제1 패턴 매칭 또는 제2 패턴 매칭)을 나타내는 정보(예를 들어 FRUC 모드 플래그라고 불린다)가 CU 레벨로 신호화된다. 또한, 이들 정보의 신호화는, CU 레벨에 한정될 필요는 없고, 다른 레벨(예를 들어, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.
또한, 움직임 탐색과는 상이한 방법으로, 복호 장치측에서 움직임 정보가 도출되어도 된다. 예를 들어, 등속 직선 운동을 가정한 모델에 기초하여, 화소 단위로 주변 화소값을 사용하여 움직임 벡터의 보정량이 산출되어도 된다.
여기서, 등속 직선 운동을 가정한 모델에 기초하여 움직임 벡터를 도출하는 모드에 대해 설명한다. 이 모드는, BIO(bi-directional optical flow) 모드라고 불리는 경우가 있다.
도 8은, 등속 직선 운동을 가정한 모델을 설명하기 위한 도면이다. 도 8에 있어서, (vx, vy)는, 속도 벡터를 나타내고, τ0, τ1은, 각각, 커런트 픽처(Cur Pic)와 2개의 참조 픽처(Ref0, Ref1) 사이의 시간적인 거리를 나타낸다. (MVx0, MVy0)은, 참조 픽처 Ref0에 대응하는 움직임 벡터를 나타내고, (MVx1, MVy1)은, 참조 픽처 Ref1에 대응하는 움직임 벡터를 나타낸다.
이 때 속도 벡터(vx, vy)의 등속 직선 운동의 가정하에서는, (MVx0, MVy0) 및 (MVx1, MVy1)은, 각각, (vxτ0, vyτ0) 및 (-vxτ1, -vyτ1)로 표시되고, 이하의 옵티컬 플로우 등식 (1)이 성립된다.
Figure 112018112570380-pct00001
여기서, I(k)는, 움직임 보상 후의 참조 화상 k(k=0, 1)의 휘도값을 나타낸다. 이 옵티컬 플로우 등식은, (i) 휘도값의 시간 미분과, (ii) 수평 방향의 속도 및 참조 화상의 공간 구배의 수평 성분의 곱과, (iii) 수직 방향의 속도 및 참조 화상의 공간 구배의 수직 성분의 곱의 합이, 제로와 동일한 것을 나타낸다. 이 옵티컬 플로우 등식과 에르미트 보간(Hermite interpolation)의 조합에 기초하여, 머지 리스트 등으로부터 얻어지는 블록 단위의 움직임 벡터가 화소 단위로 보정된다.
또한, 등속 직선 운동을 가정한 모델에 기초하는 움직임 벡터의 도출과는 상이한 방법으로, 복호 장치측에서 움직임 벡터가 도출되어도 된다. 예를 들어, 복수의 인접 블록의 움직임 벡터에 기초하여 서브 블록 단위로 움직임 벡터가 도출되어도 된다.
여기서, 복수의 인접 블록의 움직임 벡터에 기초하여 서브 블록 단위로 움직임 벡터를 도출하는 모드에 대해 설명한다. 이 모드는, 아핀 움직임 보상 예측(affine motion compensation prediction) 모드라고 불리는 경우가 있다.
도 9는, 복수의 인접 블록의 움직임 벡터에 기초하는 서브 블록 단위의 움직임 벡터의 도출을 설명하기 위한 도면이다. 도 9에 있어서, 커런트 블록은, 16의 4x4 서브 블록을 포함한다. 여기서는, 인접 블록의 움직임 벡터에 기초하여 커런트 블록의 좌측 상각단 제어 포인트의 움직임 벡터(v0)가 도출되고, 인접 서브 블록의 움직임 벡터에 기초하여 커런트 블록의 우측 상단각 제어 포인트의 움직임 벡터(v1)가 도출된다. 그리고, 2개의 움직임 벡터(v0 및 v1)를 사용하여, 이하의 식 (2)에 의해, 커런트 블록 내의 각 서브 블록의 움직임 벡터(vx, vy)가 도출된다.
Figure 112018112570380-pct00002
여기서, x 및 y는, 각각, 서브 블록의 수평 위치 및 수직 위치를 나타내고, w는, 미리 정해진 중량 계수를 나타낸다.
이와 같은 아핀 움직임 보상 예측 모드에서는, 좌측 상단 및 우측 상단각 제어 포인트의 움직임 벡터의 도출 방법이 상이한 몇 개의 모드를 포함해도 된다. 이와 같은 아핀 움직임 보상 예측 모드를 나타내는 정보(예를 들어 아핀 플래그라고 불린다)는, CU 레벨로 신호화된다. 또한, 이 아핀 움직임 보상 예측 모드를 나타내는 정보의 신호화는, CU 레벨에 한정될 필요는 없고, 다른 레벨(예를 들어, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.
[예측 제어부]
예측 제어부(128)는, 인트라 예측 신호 및 인터 예측 신호 중 어느 것을 선택하고, 선택한 신호를 예측 신호로서 감산부(104) 및 가산부(116)에 출력한다.
[복호 장치의 개요]
다음으로, 상기의 부호화 장치(100)로부터 출력된 부호화 신호(부호화 비트스트림)를 복호 가능한 복호 장치의 개요에 대해 설명한다. 도 10은, 실시형태 1에 관련된 복호 장치(200)의 기능 구성을 나타내는 블록도이다. 복호 장치(200)는, 동화상/화상을 블록 단위로 복호하는 동화상/화상 복호 장치이다.
도 10에 나타내는 바와 같이, 복호 장치(200)는, 엔트로피 복호부(202)와, 역양자화부(204)와, 역변환부(206)와, 가산부(208)와, 블록 메모리(210)와, 루프 필터부(212)와, 프레임 메모리(214)와, 인트라 예측부(216)와, 인터 예측부(218)와, 예측 제어부(220)를 구비한다.
복호 장치(200)는, 예를 들어, 범용 프로세서 및 메모리에 의해 실현된다. 이 경우, 메모리에 격납된 소프트웨어 프로그램이 프로세서에 의해 실행되었을 때, 프로세서는, 엔트로피 복호부(202), 역양자화부(204), 역변환부(206), 가산부(208), 루프 필터부(212), 인트라 예측부(216), 인터 예측부(218) 및 예측 제어부(220)로서 기능한다. 또, 복호 장치(200)는, 엔트로피 복호부(202), 역양자화부(204), 역변환부(206), 가산부(208), 루프 필터부(212), 인트라 예측부(216), 인터 예측부(218) 및 예측 제어부(220)에 대응하는 전용의 1 이상의 전자 회로로서 실현되어도 된다.
이하에, 복호 장치(200)에 포함되는 각 구성 요소에 대해 설명한다.
[엔트로피 복호부]
엔트로피 복호부(202)는, 부호화 비트스트림을 엔트로피 복호한다. 구체적으로는, 엔트로피 복호부(202)는, 예를 들어, 부호화 비트스트림으로부터 2치 신호로 산술 복호한다. 그리고, 엔트로피 복호부(202)는, 2치 신호를 다치화(debinarize)한다. 이로써, 엔트로피 복호부(202)는, 블록 단위로 양자화 계수를 역양자화부(204)에 출력한다.
[역양자화부]
역양자화부(204)는, 엔트로피 복호부(202)로부터의 입력인 복호 대상 블록(이하, 커런트 블록이라고 한다)의 양자화 계수를 역양자화한다. 구체적으로는, 역양자화부(204)는, 커런트 블록의 양자화 계수의 각각에 대해, 당해 양자화 계수에 대응하는 양자화 파라미터에 기초하여 당해 양자화 계수를 역양자화한다. 그리고, 역양자화부(204)는, 커런트 블록의 역양자화된 양자화 계수(요컨대 변환 계수)를 역변환부(206)에 출력한다.
[역변환부]
역변환부(206)는, 역양자화부(204)로부터의 입력인 변환 계수를 역변환함으로써 예측 오차를 복원한다.
예를 들어 부호화 비트스트림으로부터 해독된 정보가 EMT 또는 AMT를 적용하는 것을 나타내는 경우(예를 들어 AMT 플래그가 진), 역변환부(206)는, 해독된 변환 타입을 나타내는 정보에 기초하여 커런트 블록의 변환 계수를 역변환한다.
또 예를 들어, 부호화 비트스트림으로부터 해독된 정보가 NSST를 적용하는 것을 나타내는 경우, 역변환부(206)는, 변환된 변환 계수(변환 결과)를 재변환한다.
[가산부]
가산부(208)는, 역변환부(206)로부터의 입력인 예측 오차와 예측 제어부(220)로부터의 입력인 예측 신호를 가산함으로써 커런트 블록을 재구성한다. 그리고, 가산부(208)는, 재구성된 블록을 블록 메모리(210) 및 루프 필터부(212)에 출력한다.
[블록 메모리]
블록 메모리(210)는, 인트라 예측으로 참조되는 블록이며 복호 대상 픽처(이하, 커런트 픽처라고 한다) 내의 블록을 격납하기 위한 기억부이다. 구체적으로는, 블록 메모리(210)는, 가산부(208)로부터 출력된 재구성 블록을 격납한다.
[루프 필터부]
루프 필터부(212)는, 가산부(208)에 의해 재구성된 블록에 루프 필터를 실시하고, 필터된 재구성 블록을 프레임 메모리(214) 및 표시 장치 등에 출력한다.
부호화 비트스트림으로부터 해독된 ALF의 온/오프를 나타내는 정보가 ALF의 온을 나타내는 경우, 국소적인 구배의 방향 및 활성도에 기초하여 복수의 필터 중에서 1개의 필터가 선택되고, 선택된 필터가 재구성 블록에 적용된다.
[프레임 메모리]
프레임 메모리(214)는, 인터 예측에 사용되는 참조 픽처를 격납하기 위한 기억부이고, 프레임 버퍼라고 불리는 경우도 있다. 구체적으로는, 프레임 메모리(214)는, 루프 필터부(212)에 의해 필터된 재구성 블록을 격납한다.
[인트라 예측부]
인트라 예측부(216)는, 부호화 비트스트림으로부터 해독된 인트라 예측 모드에 기초하여, 블록 메모리(210)에 격납된 커런트 픽처 내의 블록을 참조하여 인트라 예측을 실시함으로써, 예측 신호(인트라 예측 신호)를 생성한다. 구체적으로는, 인트라 예측부(216)는, 커런트 블록에 인접하는 블록의 샘플(예를 들어 휘도값, 색차값)을 참조하여 인트라 예측을 실시함으로써 인트라 예측 신호를 생성하고, 인트라 예측 신호를 예측 제어부(220)에 출력한다.
또한, 색차 블록의 인트라 예측에 있어서 휘도 블록을 참조하는 인트라 예측 모드가 선택되어 있는 경우에는, 인트라 예측부(216)는, 커런트 블록의 휘도 성분에 기초하여, 커런트 블록의 색차 성분을 예측해도 된다.
또, 부호화 비트스트림으로부터 해독된 정보가 PDPC의 적용을 나타내는 경우, 인트라 예측부(216)는, 수평/수직 방향의 참조 화소의 구배에 기초하여 인트라 예측 후의 화소값을 보정한다.
[인터 예측부]
인터 예측부(218)는, 프레임 메모리(214)에 격납된 참조 픽처를 참조하여, 커런트 블록을 예측한다. 예측은, 커런트 블록 또는 커런트 블록 내의 서브 블록(예를 들어 4x4 블록)의 단위로 실시된다. 예를 들어, 인터 예측부(126)는, 부호화 비트스트림으로부터 해독된 움직임 정보(예를 들어 움직임 벡터)를 사용하여 움직임 보상을 실시함으로써 커런트 블록 또는 서브 블록의 인터 예측 신호를 생성하고, 인터 예측 신호를 예측 제어부(128)에 출력한다.
또한, 부호화 비트스트림으로부터 해독된 정보가 OBMC 모드를 적용하는 것을 나타내는 경우, 인터 예측부(218)는, 움직임 탐색에 의해 얻어진 커런트 블록의 움직임 정보뿐만 아니라, 인접 블록의 움직임 정보도 사용하여, 인터 예측 신호를 생성한다.
또, 부호화 비트스트림으로부터 해독된 정보가 FRUC 모드를 적용하는 것을 나타내는 경우, 인터 예측부(218)는, 부호화 스트림으로부터 해독된 패턴 매칭의 방법(바이래터럴 매칭 또는 템플릿 매칭)에 따라 움직임 탐색을 실시함으로써 움직임 정보를 도출한다. 그리고, 인터 예측부(218)는, 도출된 움직임 정보를 사용하여 움직임 보상을 실시한다.
또, 인터 예측부(218)는, BIO 모드가 적용되는 경우에, 등속 직선 운동을 가정한 모델에 기초하여 움직임 벡터를 도출한다. 또, 부호화 비트스트림으로부터 해독된 정보가 아핀 움직임 보상 예측 모드를 적용하는 것을 나타내는 경우에는, 인터 예측부(218)는, 복수의 인접 블록의 움직임 벡터에 기초하여 서브 블록 단위로 움직임 벡터를 도출한다.
[예측 제어부]
예측 제어부(220)는, 인트라 예측 신호 및 인터 예측 신호 중 어느 것을 선택하고, 선택한 신호를 예측 신호로서 가산부(208)에 출력한다.
[부호화 장치에 있어서의 엔트로피 부호화부의 상세]
도 11은, 실시형태 1에 관련된 부호화 장치(100)에 있어서의 엔트로피 부호화부(110)의 상세한 기능 구성을 나타내는 블록도이다. 엔트로피 부호화부(110)는, 양자화부(108)로부터 출력되는 양자화 계수에 대해 가변 길이 부호화를 적용함으로써, 비트열을 생성하고, 생성된 비트열을 출력한다. 이 비트열은, 부호화된 화상 정보에 대응하여, 부호화 신호, 부호화 비트스트림 또는 부호화 비트열이라고도 불린다.
도 11의 예에 있어서, 엔트로피 부호화부(110)는, 2치화부(132)와, 전환부(134)와, 중간 버퍼(136)와, 산술 부호화부(138)와, 전환부(140)와, 다중화부(142)를 구비한다. 그리고, 엔트로피 부호화부(110)는, 비트열을 생성하고, 생성된 비트열을 출력함으로써, 생성된 비트열을 출력 버퍼(144)에 격납한다. 출력 버퍼(144)에 격납된 비트열은, 적절히, 출력 버퍼(144)로부터 출력된다. 엔트로피 부호화부(110)는, 출력 버퍼(144)를 포함하고 있어도 된다.
[엔트로피 부호화부에 있어서의 2치화부]
2치화부(132)는, 양자화 계수 등을 2치화한다. 구체적으로는, 2치화부(132)는, 양자화된 주파수 변환 계수 등을 예를 들어 0 또는 1로 표현되는 값의 데이터열로 변환하고, 얻어진 데이터열을 출력한다. 이하, 이 데이터열을 2치화 데이터열이라고도 부른다. 또, 2치화부(132)에 의해 실시되는 2치화는, 산술 부호화를 위한 2치화이고, 보다 구체적으로는 2치 산술 부호화를 실시하기 위한 2치화이다. 즉, 2치화부(132)는, 산술 부호화를 위한 2치화에 따라 화상 정보의 2치화 데이터열을 도출한다.
또한, 2치화의 방식으로서, 유너리·바이너리제이션, 트런케이티드·유너리·바이너리제이션, 유너리/k차 지수 골룸·결합 바이너리제이션, 고정 길이 바이너리제이션, 및, 표 참조 등이 있다.
또, 예를 들어, 2치화부(132)에 있어서의 2치화, 및, 산술 부호화부(138)에 있어서의 산술 부호화에 의해, 콘텍스트 적응형 2치 산술 부호화 방식의 엔트로피 부호화가 실시된다. 콘텍스트 적응형 2치 산술 부호화 방식은, CABAC라고도 불린다. 2치화부(132)에 의해 실시되는 2치화는, 콘텍스트 적응형 2치 산술 부호화 방식을 위한 2치화라고도 표현될 수 있다.
[엔트로피 부호화부에 있어서의 전환부]
전환부(134 및 140)는, 모드 정보에 따라 연동하여 동작하고, 2치화 데이터열에 대해 산술 부호화를 적용하는지의 여부를 전환한다. 예를 들어, 전환부(134 및 140)는, 부호화 장치(100)의 외부로부터 부여되는 모드 정보에 따라, 2치화 데이터열에 대해 산술 부호화를 적용하는지의 여부를 전환한다. 모드 정보는, 사용자 또는 상위 시스템 등으로부터 지시로서 부여되어도 된다.
예를 들어, 이 모드 정보는, 제1 모드 및 제2 모드를 선택적으로 나타낸다. 즉, 모드 정보는, 제1 모드 및 제2 모드 중에서 선택되는 한쪽의 모드를 나타낸다. 그리고, 예를 들어, 제1 모드에서는, 2치화 데이터열에 대해 산술 부호화가 적용되고, 제2 모드에서는, 2치화 데이터열에 대해 산술 부호화가 적용되지 않는다.
구체적으로는, 모드 정보가 제1 모드를 나타내는 경우, 전환부(134)는, 2치화부(132)로부터 출력되는 2치화 데이터열을 중간 버퍼(136)에 출력함으로써, 2치화 데이터열을 중간 버퍼(136)에 격납한다. 그리고, 산술 부호화부(138)는, 중간 버퍼(136)에 격납된 2치화 데이터열에 대해, 산술 부호화를 적용하고, 산술 부호화가 적용된 2치화 데이터열을 출력한다. 전환부(140)는, 산술 부호화부(138)로부터 출력된 2치화 데이터열을 다중화부(142)에 출력한다.
한편, 모드 정보가 제2 모드를 나타내는 경우, 전환부(134)는, 2치화부(132)로부터 출력되는 2치화 데이터열을 그대로 전환부(140)에 출력한다. 그리고, 전환부(140)는, 전환부(134)로부터 출력된 2치화 데이터열을 다중화부(142)에 출력한다. 즉, 산술 부호화가 바이패스된다. 또한, 산술 부호화의 일 양태인 바이패스 산술 부호화와의 혼동을 피하기 위해, 산술 부호화를 바이패스하는 것을, 산술 부호화를 스킵한다고 표현하는 경우가 있다.
모드 정보 및 모드는, 지연 모드 정보 및 지연 모드라고도 표현될 수 있다. 구체적으로는, 제1 모드는, 통상 모드이고, 제2 모드는, 저지연 모드이다. 그리고, 제2 모드에서는, 제1 모드보다 처리 지연이 삭감된다.
[엔트로피 부호화부에 있어서의 중간 버퍼]
중간 버퍼(136)는, 2치화 데이터열을 격납하기 위한 기억부이고, 중간 메모리라고도 불린다. 산술 부호화부(138)에서 실시되는 산술 부호화에서는, 지연이 발생한다. 또, 지연량은, 2치화 데이터열의 내용에 따라 흔들린다. 중간 버퍼(136)에 의해, 지연량의 흔들림이 흡수되어, 후속의 처리가 원활하게 실시된다. 또한, 중간 버퍼(136) 등의 기억부에 데이터를 입력하는 것은, 기억부에 데이터를 격납하는 것에 대응하고, 기억부로부터 데이터를 출력하는 것은, 기억부로부터 데이터를 판독 출력하는 것에 대응한다.
[엔트로피 부호화부에 있어서의 산술 부호화부]
산술 부호화부(138)는, 산술 부호화를 실시한다. 구체적으로는, 산술 부호화부(138)는, 중간 버퍼(136)에 격납된 2치화 데이터열을 판독 출력하고, 2치화 데이터열에 대해 산술 부호화를 적용한다. 산술 부호화부(138)는, 콘텍스트 적응형 2치 산술 부호화 방식에 대응하는 산술 부호화를 2치화 데이터열에 대해 적용해도 된다.
예를 들어, 산술 부호화부(138)는, 데이터 종별 등의 콘텍스트에 따라 값의 발생 확률을 선택하고, 선택된 발생 확률에 따라 산술 부호화를 실시하고, 산술 부호화의 결과에 따라 발생 확률을 갱신한다. 요컨대, 산술 부호화부(138)는, 가변의 발생 확률에 따라, 산술 부호화를 실시한다. 가변의 발생 확률에 따라 실시되는 산술 부호화는, 콘텍스트 적응 산술 부호화라고도 불린다.
또, 산술 부호화부(138)는, 특정한 데이터 종별 등에 대해, 고정의 발생 확률에 따라 산술 부호화를 실시해도 된다. 구체적으로는, 산술 부호화부(138)는, 0 또는 1의 발생 확률로서 50%의 발생 확률에 따라 산술 부호화를 실시해도 된다. 고정의 발생 확률에 따라 실시되는 산술 부호화는, 바이패스 산술 부호화라고도 불린다.
[엔트로피 부호화부에 있어서의 다중화부]
다중화부(142)는, 모드 정보와, 2치화 데이터열을 다중화하여, 모드 정보 및 2치화 데이터열을 포함하는 비트열을 생성한다. 그리고, 다중화부(142)는, 비트열을 출력 버퍼(144)에 출력함으로써, 비트열을 출력 버퍼(144)에 격납한다. 출력 버퍼(144)에 격납된 비트열은, 적절히, 출력 버퍼(144)로부터 출력된다. 즉, 다중화부(142)는, 출력 버퍼(144)를 통하여 비트열을 출력한다.
예를 들어, 모드 정보는, 상위의 파라미터로서 비트열에 포함되어 있어도 된다. 구체적으로는, 모드 정보는, 비트열에 있어서의 SPS(시퀀스·파라미터·세트)에 포함되어도 되고, 비트열에 있어서의 PPS(픽처·파라미터·세트)에 포함되어 있어도 되고, 비트열에 있어서의 슬라이스 헤더에 포함되어 있어도 된다. 비트열에 포함되는 모드 정보는, 1 이상의 비트로 표현된다.
그리고, 2치화 데이터열은, 슬라이스 데이터에 포함되어 있어도 된다. 여기서, 2치화 데이터열은, 산술 부호화가 적용된 2치화 데이터열이어도 되고, 산술 부호화가 적용되어 있지 않은 2치화 데이터열이어도 된다.
또, 비트열에 포함되는 모드 정보는, 비트열에 포함되는 2치화 데이터열에 대해 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보라고도 표현될 수 있다. 바꿔 말하면, 모드 정보가, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보로서, 비트열에 포함되어도 된다. 이 적용 정보는, 산술 부호화가 적용되어 있는 2치화 데이터열을 비트열이 포함하는가, 산술 부호화가 적용되어 있지 않은 2치화 데이터열을 비트열이 포함하는가를 나타낼 수 있다.
또한, 상위 시스템에서 모드 정보가 교환되는 경우, 또는, 모드 정보가 미리 정해져 있는 경우 등에 있어서, 모드 정보가 비트열에 포함되지 않아도 된다. 요컨대, 이 경우, 다중화가 실시되지 않아도 된다.
[출력 버퍼]
출력 버퍼(144)는, 비트열을 격납하기 위한 기억부이고, CPB(Coded Picture Buffer:부호화 픽처 버퍼), 또는, 출력 메모리라고도 불린다. 부호화 장치(100)가 화상 정보를 부호화함으로써 얻어지는 비트열은, 출력 버퍼(144)에 격납된다. 그리고, 출력 버퍼(144)에 격납된 비트열은, 적절히 출력되고, 예를 들어 부호화 오디오 신호 등과 다중화된다.
[복호 장치에 있어서의 엔트로피 복호부의 상세]
도 12는, 실시형태 1에 관련된 복호 장치(200)에 있어서의 엔트로피 복호부(202)의 상세한 기능 구성을 나타내는 블록도이다. 엔트로피 복호부(202)는, 입력 버퍼(232)를 통하여 입력되는 비트열에 대해 엔트로피 복호를 실시함으로써, 양자화 계수 등을 도출한다. 이 비트열은, 예를 들어, 부호화 장치(100)에 의해 생성된 비트열이며, 상기 서술한 데이터 구성을 가질 수 있다.
도 12의 예에 있어서, 엔트로피 복호부(202)는, 분리부(234)와, 전환부(236)와, 산술 복호부(238)와, 중간 버퍼(240)와, 전환부(242)와, 역2치화부(244)를 구비한다. 엔트로피 복호부(202)는, 입력 버퍼(232)를 포함하고 있어도 된다.
[입력 버퍼]
입력 버퍼(232)는, 비트열을 격납하기 위한 기억부이고, CPB, 또는, 입력 메모리라고도 불린다. 복호 장치(200)에 의해 복호되는 비트열은, 예를 들어 부호화 오디오 신호 등으로부터 분리되어, 입력 버퍼(232)에 격납된다. 그리고, 복호 장치(200)는, 입력 버퍼(232)에 격납된 비트열을 판독 출력하여, 비트열을 복호한다.
[엔트로피 복호부에 있어서의 분리부]
분리부(234)는, 입력 버퍼(232)로부터 비트열을 취득하고, 비트열로부터 모드 정보와 2치화 데이터열을 분리하고, 모드 정보와 2치화 데이터열을 출력한다. 요컨대, 분리부(234)는, 입력 버퍼(232)를 통하여, 모드 정보와 2치화 데이터열을 포함하는 비트열을 취득하고, 비트열에 포함되는 모드 정보와 2치화 데이터열을 출력한다. 2치화 데이터열은, 산술 부호화가 적용된 2치화 데이터열이어도 되고, 산술 부호화가 적용되어 있지 않은 2치화 데이터열이어도 된다.
상기 서술한 바와 같이, 모드 정보는, 비트열에 포함되는 2치화 데이터열에 대해 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보라고도 표현될 수 있다. 그리고, 상위 시스템에서 모드 정보가 교환되는 경우, 또는, 모드 정보가 미리 정해져 있는 경우 등에 있어서, 모드 정보가 비트열에 포함되지 않아도 된다. 이 경우, 모드 정보의 분리 및 출력이 실시되지 않아도 된다. 또, 모드 정보는, 복호 장치(200)의 외부로부터, 구체적으로는 사용자 또는 상위 시스템 등으로부터 지시로서 부여되어도 된다.
[엔트로피 복호부에 있어서의 전환부]
전환부(236 및 242)는, 분리부(234) 등으로부터 얻어지는 모드 정보에 따라 연동하여 동작하고, 2치화 데이터열에 대해 산술 복호를 적용하는지의 여부를 전환한다. 예를 들어, 모드 정보가 선택적으로 나타내는 제1 모드 및 제2 모드 중, 제1 모드에서는, 2치화 데이터열에 대해 산술 복호가 적용되고, 제2 모드에서는, 2치화 데이터열에 대해 산술 복호가 적용되지 않는다.
구체적으로는, 모드 정보가 제1 모드를 나타내는 경우, 전환부(236)는, 분리부(234)로부터 출력되는 2치화 데이터열을 산술 복호부(238)에 출력한다. 그리고, 산술 복호부(238)는, 2치화 데이터열에 대해 산술 복호를 적용하고, 산술 복호가 적용된 2치화 데이터열을 출력함으로써, 산술 복호가 적용된 2치화 데이터열을 중간 버퍼(240)에 격납한다. 전환부(242)는, 중간 버퍼(240)에 격납된 2치화 데이터열을 적절히 취득하고, 중간 버퍼(240)로부터 취득된 2치화 데이터열을 역2치화부(244)에 출력한다.
한편, 모드 정보가 제2 모드를 나타내는 경우, 전환부(236)는, 분리부(234)로부터 출력되는 2치화 데이터열을 그대로 전환부(242)에 출력한다. 그리고, 전환부(242)는, 전환부(236)로부터 출력된 2치화 데이터열을 역2치화부(244)에 출력한다. 요컨대, 산술 복호가 바이패스된다. 또한, 산술 부호화의 일 양태인 바이패스 산술 복호와의 혼동을 피하기 위해, 산술 복호를 바이패스하는 것을, 산술 복호를 스킵한다고 표현하는 경우가 있다.
[엔트로피 복호부에 있어서의 산술 복호부]
산술 복호부(238)는, 산술 복호를 실시한다. 구체적으로는, 산술 복호부(238)는, 산술 부호화가 적용된 2치화 데이터열에 대해 산술 복호를 적용하고, 산술 복호가 적용된 2치화 데이터열을 출력함으로써, 산술 복호가 적용된 2치화 데이터열을 중간 버퍼(240)에 격납한다. 산술 복호가 적용된 2치화 데이터열은, 산술 부호화가 적용되어 있지 않은 원래의 2치화 데이터열에 대응한다. 산술 부호화부(138)는, 콘텍스트 적응형 2치 산술 부호화 방식에 대응하는 산술 복호를 2치화 데이터열에 대해 적용해도 된다.
예를 들어, 산술 복호부(238)는, 데이터 종별 등의 콘텍스트에 따라 값의 발생 확률을 선택하고, 선택된 발생 확률에 따라 산술 복호를 실시하고, 산술 복호의 결과에 따라 발생 확률을 갱신한다. 요컨대, 산술 복호부(238)는, 가변의 발생 확률에 따라, 산술 복호를 실시한다. 가변의 발생 확률에 따라 실시되는 산술 복호는, 콘텍스트 적응 산술 복호라고도 불린다.
또, 산술 복호부(238)는, 특정한 데이터 종별 등에 대해, 고정의 발생 확률에 따라 산술 복호를 실시해도 된다. 구체적으로는, 산술 복호부(238)는, 0 또는 1의 발생 확률로서 50%의 발생 확률에 따라 산술 복호를 실시해도 된다. 고정의 발생 확률에 따라 실시되는 산술 복호는, 바이패스 산술 복호라고도 불린다.
[엔트로피 복호부에 있어서의 중간 버퍼]
중간 버퍼(240)는, 산술 복호된 2치화 데이터열을 격납하기 위한 기억부이고, 중간 메모리라고도 불린다. 산술 복호부(238)에서 실시되는 산술 복호에서는, 지연이 발생한다. 또, 지연량은, 2치화 데이터열의 내용에 따라 흔들린다. 중간 버퍼(240)에 의해, 지연량의 흔들림이 흡수되어, 후속의 처리가 원활하게 실시된다.
[엔트로피 복호부에 있어서의 역2치화부]
역2치화부(244)는, 2치화 데이터열에 대해 역2치화를 실시함으로써, 양자화 계수 등을 도출한다. 구체적으로는, 역2치화부(244)는, 예를 들어 0 또는 1 로 표현되는 값의 2치화 데이터열을 양자화된 주파수 변환 계수 등으로 변환하고, 양자화된 주파수 변환 계수 등을 역양자화부(204)에 출력한다. 또, 역2치화부(244)에 의해 실시되는 역2치화는, 산술 부호화를 위한 2치화에 대응하는 역2치화이고, 보다 구체적으로는 2치 산술 부호화를 실시하기 위한 2치화에 대응하는 역2치화이다.
또, 예를 들어, 산술 복호부(238)에 있어서의 산술 복호, 및, 역2치화부(244)에 있어서의 역2치화에 의해, 콘텍스트 적응형 2치 산술 부호화 방식의 엔트로피 복호가 실시된다. 즉, 역2치화부(244)는, 콘텍스트 적응형 2치 산술 부호화 방식에 따른 역2치화를 실시해도 된다. 또, 역2치화는 다치화라고도 불린다.
[코덱 시스템]
도 13은, 실시형태 1에 관련된 부호화 장치(100) 및 복호 장치(200)를 포함하는 코덱 시스템(300)의 기능 구성을 나타내는 블록도이다. 코덱 시스템(300)은, 송신 장치(150) 및 수신 장치(250)를 구비하고, 화상 정보의 부호화, 송신, 수신 및 복호를 실시한다. 송신 장치(150)는, 송신 제어부(152), 부호화 장치(100) 및 출력 버퍼(144)를 구비하고, 화상 정보의 부호화 및 송신을 실시한다. 수신 장치(250)는, 수신 제어부 (252), 입력 버퍼(232) 및 복호 장치(200)를 구비하고, 부호화된 화상 정보의 수신 및 복호를 실시한다.
예를 들어, 화상 정보의 전송, 요컨대 화상 정보의 송수신이 개시되기 전에, 송신 장치(150)와 수신 장치(250) 사이에서, 코덱 능력에 관한 정보의 교환이 실시된다. 코덱 능력은, 화상 정보의 부호화 및 복호에 관련하는 능력을 의미한다. 이로써, 상기 서술한 제1 모드 또는 제2 모드 등을 포함하는 부호화 방식이 결정된다.
도 13의 예에서는, 화상 정보의 송수신이 개시되기 전에, 송신 제어부(152)와 수신 제어부 (252)가, 부호화 장치(100) 및 복호 장치(200)의 코덱 능력에 관한 정보의 교환을 실시한다. 그리고, 송신 제어부(152)와 수신 제어부(252)가, 제1 모드 또는 제2 모드 등을 포함하는 부호화 방식을 결정한다.
예를 들어, 부호화 장치(100) 및 복호 장치(200)의 양방에 있어서 서포트되는 모드에 따라, 산술 부호화가 실시되는 제1 모드, 또는, 산술 부호화가 실시되지 않는 제2 모드가, 부호화 및 복호에 사용되는 모드로서 결정되어도 된다. 제1 모드 및 제2 모드의 양방이 서포트되는 경우, 미리 정해진 우선 순위에 따라, 제1 모드 또는 제2 모드가, 부호화 및 복호에 사용되는 모드로서 결정되어도 된다.
예를 들어, 제1 모드에서는, 처리 지연이 발생하지만, 부호량의 증가, 또는, 화질의 열화가 억제된다. 제2 모드에서는, 처리 지연이 억제되지만, 부호량의 증가, 또는, 화질의 열화가 발생한다. 따라서, 부호량의 증가, 또는, 화질의 열화를 억제하는 것이 우선되는 환경에 있어서, 제1 모드가 제2 모드보다 우선되는 모드로서 미리 정해져 있어도 된다. 또, 처리 지연을 억제하는 것이 우선되는 환경에 있어서, 제2 모드가 제1 모드보다 우선되는 모드로서 미리 정해져 있어도 된다.
송신 제어부(152)는, 결정된 부호화 방식을 부호화 장치(100)에 통지하고, 수신 제어부(252)는, 결정된 부호화 방식을 복호 장치(200)에 통지한다. 부호화 장치(100)는, 통지된 부호화 방식에 따라, 화상 정보를 부호화하고, 복호 장치(200)는, 통지된 부호화 방식에 대응하는 복호 방법으로, 화상 정보를 복호한다.
예를 들어, 송신 제어부(152)는, 제1 모드 및 제2 모드 중에서 결정된 모드를 나타내는 모드 정보를 지시로서 부호화 장치(100)에 통지한다. 수신 제어부 (252)는, 제1 모드 및 제2 모드 중에서 결정된 동일한 모드를 나타내는 모드 정보를 지시로서 복호 장치(200)에 통지한다.
부호화 장치(100)는, 지시로서 통지된 모드 정보에 따라, 산술 부호화가 적용되어 있는 2치화 데이터열, 또는, 산술 부호화가 적용되어 있지 않은 2치화 데이터열을 슬라이스 데이터에 포함하는 비트열을 출력한다. 복호 장치(200)는, 지시로서 통지된 모드 정보에 따라, 비트열의 슬라이스 데이터에 포함되고 산술 부호화가 적용되어 있는 2치화 데이터열, 또는, 비트열의 슬라이스 데이터에 포함되고 산술 부호화가 적용되어 있지 않은 2치화 데이터열로부터 화상 정보를 도출한다.
또한, 코덱 시스템(300)에 있어서, 제1 모드 또는 제2 모드 등을 포함하는 부호화 방식이 고정적으로 사용되는 경우, 코덱 능력의 교환은 실시되지 않아도 된다. 송신 제어부(152) 및 수신 제어부(252)는, 제1 모드 또는 제2 모드 등을 포함하는 부호화 방식을 고정적으로 부호화 장치(100) 및 복호 장치(200)에 통지해도 된다. 혹은, 부호화 장치(100) 및 복호 장치(200)가, 제1 모드 또는 제2 모드 등을 포함하는 부호화 방식을 내부의 파라미터로서 고정적으로 유지하고 있어도 된다.
또, 부호화 규격으로 정해지는 복수의 프로파일 중, 소정의 프로파일에서는, 부호화 및 복호에 사용되는 모드가, 제1 모드 및 제2 모드 중 한쪽의 모드에 항상 고정되어도 된다.
또, 모드 정보는, 상위의 파라미터로서, 비트열에 있어서의 SPS, PPS 또는 슬라이스 헤더 등에 포함되어도 된다. 이로써, 복호 장치(200)는, 비트열에 포함되는 모드 정보에 따라, 비트열에 포함되는 2치화 데이터열에 대해 산술 복호를 적용하는지의 여부를 전환할 수 있다.
또, H.265로 규정되는 저지연 HRD 모드를 나타내는 low_delay_hrd_flag 등이 모드 정보로서 사용되어도 된다. 혹은, 모드 정보는, low_delay_hrd_flag 등과는 다른 정보이어도 된다. 이 경우, 산술 부호화의 적용과, HRD 모드가 따로따로 전환되기 때문에, 보다 유연하게 지연량을 상위층의 애플리케이션 등에 적합시키는 것이 가능하다.
[부호화 장치의 실장예]
도 14는, 실시형태 1에 관련된 부호화 장치(100)의 실장예를 나타내는 블록도이다. 부호화 장치(100)는, 회로(160) 및 메모리(162)를 구비한다. 예를 들어, 도 1 및 도 11에 나타낸 부호화 장치(100)의 복수의 구성 요소는, 도 14에 나타낸 회로(160) 및 메모리(162)에 의해 실장된다.
회로(160)는, 정보 처리를 실시하는 회로이고, 메모리(162)에 액세스 가능한 회로이다. 예를 들어, 회로(160)는, 화상 정보를 부호화하는 전용 또는 범용의 전자 회로이다. 회로(160)는, CPU와 같은 프로세서이어도 된다. 또, 회로(160)는, 복수의 전자 회로의 집합체이어도 된다. 또, 예를 들어, 회로(160)는, 도 1 및 도 11에 나타낸 부호화 장치(100)의 복수의 구성 요소 중, 정보를 기억하기 위한 구성 요소를 제외한, 복수의 구성 요소의 역할을 해도 된다.
메모리(162)는, 회로(160)가 화상 정보를 부호화하기 위한 정보가 기억되는 범용 또는 전용의 메모리이다. 메모리(162)는, 전자 회로이어도 되고, 회로(160)에 접속되어 있어도 된다. 또, 메모리(162)는, 복수의 전자 회로의 집합체이어도 된다. 또, 메모리(162)는, 자기 디스크 또는 광 디스크 등이어도 되고, 스토리지 또는 기록 매체 등으로 표현되어도 된다. 또, 메모리(162)는, 불휘발성 메모리이어도 되고, 휘발성 메모리이어도 된다.
예를 들어, 메모리(162)에는, 부호화되는 화상 정보가 기억되어도 되고, 부호화된 화상 정보에 대응하는 비트열이 기억되어도 된다. 또, 메모리(162)에는, 회로(160)가 화상 정보를 부호화하기 위한 프로그램이 기억되어 있어도 된다.
또, 예를 들어, 회로(160)는, 도 1 및 도 11에 나타낸 부호화 장치(100)의 복수의 구성 요소 중, 정보를 기억하기 위한 구성 요소의 역할을 해도 된다. 구체적으로는, 메모리(162)는, 도 1에 나타낸 블록 메모리(118) 및 프레임 메모리(122)의 역할을 해도 되고, 도 11에 나타낸 중간 버퍼(136)의 역할을 해도 된다.
또한, 부호화 장치(100)에 있어서, 도 1 및 도 11 등에 나타낸 복수의 구성 요소 모두가 실장되지 않아도 되고, 상기 서술된 복수의 처리 모두가 실시되지 않아도 된다. 도 1 및 도 11 등에 나타낸 복수의 구성 요소의 일부는, 다른 장치에 포함되어 있어도 되고, 상기 서술된 복수의 처리의 일부는, 다른 장치에 의해 실행되어도 된다.
그리고, 부호화 장치(100)에 있어서, 도 1 및 도 11 등에 나타낸 복수의 구성 요소 중 일부가 실장되고, 상기 서술된 복수의 처리의 일부가 실시됨으로써, 산술 부호화에 의해 발생하는 처리 지연의 삭감이 지원되어도 된다.
[부호화 장치의 제1 부호화 동작예]
도 15는, 실시형태 1에 관련된 부호화 장치(100)의 제1 부호화 동작예를 나타내는 플로우 차트이다. 예를 들어, 도 15에 나타낸 동작이, 도 14에 나타낸 부호화 장치(100)의 회로(160)에 의해 실시됨으로써, 화상 정보가 부호화된다.
도 15와 같이, 먼저, 회로(160)는, 화상 정보로부터 산술 부호화를 위한 2치화에 따라 2치화 데이터열을 도출한다(S101). 또한, 화상 정보는, 화상을 나타내는 정보이다. 구체적으로는, 화상 정보는, 상기 서술된 변환, 양자화 및 예측 등을 실시함으로써 화상으로부터 얻어지는 양자화 계수를 나타내는 정보이어도 된다. 혹은, 화상 정보는, 상기 서술된 변환, 양자화 및 예측 등을 실시하지 않고 화상으로부터 얻어지는 화소값을 나타내는 정보이어도 된다.
그리고, 회로(160)는, 산술 부호화가 적용되어 있지 않은 2치화 데이터열을 포함하는 비트열을 출력한다(S102).
구체적으로는, 회로(160)는, 2치화 데이터열을 포함하고, 또한, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보를 포함하는 비트열을 출력한다. 그 때, 회로(160)는, 산술 부호화가 적용되어 있지 않은 2치화 데이터열을 포함하고, 또한, 2치화 데이터열에 대해 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 적용 정보로서 포함하는 비트열을 출력한다.
이로써, 부호화 장치(100)는, 산술 부호화를 스킵할 수 있다. 따라서, 부호화 장치(100)는, 산술 부호화에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다. 또, 부호화 장치(100)는, 산술 부호화에 관한 2치화의 자원을 유효하게 활용할 수 있다. 또, 부호화 장치(100)는, 산술 부호화의 적용 상태가 적용 정보에 의해 식별 가능한 비트열을 출력할 수 있다.
또한, 부호화 장치(100)가 실시하는 동작에 관해, 상기 서술된 변환, 양자화 및 예측 등의 다른 동작이 한정되지 않아도 된다. 예를 들어, 부호화 장치(100)는, 다른 동작을 실시하지 않아도 된다. 부호화 장치(100)가 실시하는 동작에 관해, 다른 동작이 한정되지 않아도, 부호화 장치(100)는, 산술 부호화에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다.
혹은, 예를 들어, 회로(160)는, 제1 동작과 제2 동작을 전환해도 된다. 제1 동작에 있어서, 회로(160)는, 산술 부호화가 적용되어 있는 2치화 데이터열을 포함하고, 또한, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는 것을 나타내는 정보를 적용 정보로서 포함하는 비트열을 출력한다. 제2 동작에 있어서, 회로(160)는, 산술 부호화가 적용되어 있지 않은 2치화 데이터열을 포함하고, 또한, 2치화 데이터열에 대해 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 적용 정보로서 포함하는 비트열을 출력한다.
이로써, 부호화 장치(100)는, 산술 부호화를 실시하는지의 여부를 적응적으로 전환할 수 있고, 산술 부호화를 적응적으로 스킵할 수 있다. 또, 회로(160)는, 제1 동작과 제2 동작을 전환함으로써, 제1 동작 및 제2 동작의 양방을 상이한 타이밍에 실시할 수 있다. 또한, 회로(160)에 의해 실시되는 제1 동작 및 제2 동작은, 각각, 제1 출력 동작 및 제2 출력 동작으로도 표현될 수 있다.
또, 예를 들어, 회로(160)는, 1 이상의 픽처를 포함하는 단위로 포괄적으로, 제1 동작과 제2 동작을 전환해도 된다. 이로써, 부호화 장치(100)는, 산술 부호화의 적용 상태의 전환에 관한 처리량의 증가를 억제할 수 있다.
또, 예를 들어, 회로(160)는, 부호화 장치(100)의 외부로부터 부여되는 정보에 따라, 제1 동작과 제2 동작을 전환해도 되고, 부호화 장치(100)의 내부에 유지되어 있는 정보에 따라, 제1 동작과 제2 동작을 전환해도 된다. 이로써, 회로(160)는, 부호화 장치(100)의 외부 또는 내부의 정보에 따라, 적절히 제1 동작과 제2 동작을 전환할 수 있다.
또, 예를 들어, 회로(160)는, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는지의 여부를 1 이상의 픽처를 포함하는 단위로 포괄적으로 나타내는 적용 정보를 포함하는 비트열을 출력해도 된다. 바꿔 말하면, 적용 정보는, 산술 부호화가 적용되어 있는 2치화 데이터열을 비트열이 포함하는가, 산술 부호화가 적용되어 있지 않은 2치화 데이터열을 비트열이 포함하는가를 1 이상의 픽처를 포함하는 단위로 포괄적으로 나타내도 된다. 이로써, 부호화 장치(100)는, 적용 정보에 관한 부호량 및 처리량의 증가를 억제할 수 있다.
[부호화 장치의 제2 부호화 동작예]
도 16은, 실시형태 1에 관련된 부호화 장치(100)의 제2 부호화 동작예를 나타내는 플로우 차트이다. 예를 들어, 도 16에 나타낸 동작이, 도 14에 나타낸 부호화 장치(100)의 회로(160)에 의해 실시됨으로써, 화상 정보가 부호화된다.
도 16과 같이, 먼저, 회로(160)는, 화상 정보로부터 산술 부호화를 위한 2치화에 따라 2치화 데이터열을 도출한다(S111). 이 동작은, 도 15의 도출 처리(S101)와 동일하다.
그리고, 회로(160)는, 제1 동작과 제2 동작을 전환한다(S112). 제1 동작에 있어서, 회로(160)는, 산술 부호화가 적용되어 있는 2치화 데이터열을 포함하는 비트열을 출력한다(S113). 제2 동작에 있어서, 회로(160)는, 산술 부호화가 적용되어 있지 않은 2치화 데이터열을 포함하는 비트열을 출력한다(S114).
이로써, 부호화 장치(100)는, 산술 부호화를 실시하는지의 여부를 적응적으로 전환할 수 있고, 산술 부호화를 적응적으로 스킵할 수 있다. 따라서, 부호화 장치(100)는, 산술 부호화에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다. 또, 부호화 장치(100)는, 산술 부호화에 관한 2치화의 자원을 유효하게 활용할 수 있다. 또, 회로(160)는, 제1 동작과 제2 동작을 전환함으로써, 제1 동작 및 제2 동작의 양방을 상이한 타이밍에 실시할 수 있다.
또한, 부호화 장치(100)가 실시하는 동작에 관해, 상기 서술된 변환, 양자화 및 예측 등의 다른 동작이 한정되지 않아도 된다. 예를 들어, 부호화 장치(100)는, 다른 동작을 실시하지 않아도 된다. 부호화 장치(100)가 실시하는 동작에 관해, 다른 동작이 한정되지 않아도, 부호화 장치(100)는, 산술 부호화에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다.
혹은, 예를 들어, 회로(160)는, 2치화 데이터열을 포함하고, 또한, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보를 포함하는 비트열을 출력해도 된다.
그리고, 제1 동작에 있어서, 회로(160)는, 산술 부호화가 적용되어 있는 2치화 데이터열을 포함하고, 또한, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는 것을 나타내는 정보를 적용 정보로서 포함하는 비트열을 출력해도 된다. 그리고, 제2 동작에 있어서, 회로(160)는, 산술 부호화가 적용되어 있지 않은 2치화 데이터열을 포함하고, 또한, 2치화 데이터열에 대해 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 적용 정보로서 포함하는 비트열을 출력해도 된다.
이로써, 부호화 장치(100)는, 산술 부호화의 적용 상태가 적용 정보에 의해 식별 가능한 비트열을 출력할 수 있다.
또, 예를 들어, 회로(160)는, 제1 부호화 동작예와 동일하게, 부호화 장치(100)의 외부로부터 부여되는 정보에 따라, 제1 동작과 제2 동작을 전환해도 되고, 부호화 장치(100)의 내부에 유지되어 있는 정보에 따라, 제1 동작과 제2 동작을 전환해도 된다.
또, 예를 들어, 회로(160)는, 제1 부호화 동작예와 동일하게, 1 이상의 픽처를 포함하는 단위로 포괄적으로, 제1 동작과 제2 동작을 전환해도 된다. 또, 예를 들어, 회로(160)는, 제1 부호화 동작예와 동일하게, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는지의 여부를 1 이상의 픽처를 포함하는 단위로 포괄적으로 나타내는 적용 정보를 포함하는 비트열을 출력해도 된다.
[복호 장치의 실장예]
도 17은, 실시형태 1에 관련된 복호 장치(200)의 실장예를 나타내는 블록도이다. 복호 장치(200)는, 회로(260) 및 메모리(262)를 구비한다. 예를 들어, 도 10 및 도 12에 나타낸 복호 장치(200)의 복수의 구성 요소는, 도 17에 나타낸 회로(260) 및 메모리(262)에 의해 실장된다.
회로(260)는, 정보 처리를 실시하는 회로이고, 메모리(262)에 액세스 가능한 회로이다. 예를 들어, 회로(260)는, 화상 정보를 복호하는 범용 또는 전용의 전자 회로이다. 회로(260)는, CPU와 같은 프로세서이어도 된다. 또, 회로(260)는, 복수의 전자 회로의 집합체이어도 된다. 또, 예를 들어, 회로(260)는, 도 10 및 도 12에 나타낸 복호 장치(200)의 복수의 구성 요소 중, 정보를 기억하기 위한 구성 요소를 제외한, 복수의 구성 요소의 역할을 해도 된다.
메모리(262)는, 회로(260)가 화상 정보를 복호하기 위한 정보가 기억되는 범용 또는 전용의 메모리이다. 메모리(262)는, 전자 회로이어도 되고, 회로(260)에 접속되어 있어도 된다. 또, 메모리(262)는, 복수의 전자 회로의 집합체이어도 된다. 또, 메모리(262)는, 자기 디스크 또는 광 디스크 등이어도 되고, 스토리지 또는 기록 매체 등으로 표현되어도 된다. 또, 메모리(262)는, 불휘발성 메모리이어도 되고, 휘발성 메모리이어도 된다.
예를 들어, 메모리(262)에는, 부호화된 화상 정보에 대응하는 비트열이 기억되어도 되고, 복호된 비트열에 대응하는 화상 정보가 기억되어도 된다. 또, 메모리(262)에는, 회로(260)이 화상 정보를 복호하기 위한 프로그램이 기억되어 있어도 된다.
또, 예를 들어, 회로(260)는, 도 10 및 도 12에 나타낸 복호 장치(200)의 복수의 구성 요소 중, 정보를 기억하기 위한 구성 요소의 역할을 해도 된다. 구체적으로는, 메모리(262)는, 도 10에 나타낸 블록 메모리(210) 및 프레임 메모리(214)의 역할을 해도 되고, 도 12에 나타낸 중간 버퍼(240)의 역할을 해도 된다.
또한, 복호 장치(200)에 있어서, 도 10 및 도 12 등에 나타낸 복수의 구성 요소 모두가 실장되지 않아도 되고, 상기 서술된 복수의 처리 모두가 실시되지 않아도 된다. 도 10 및 도 12 등에 나타낸 복수의 구성 요소의 일부는, 다른 장치에 포함되어 있어도 되고, 상기 서술된 복수의 처리의 일부는, 다른 장치에 의해 실행되어도 된다.
그리고, 복호 장치(200)에 있어서, 도 10 및 도 12 등에 나타낸 복수의 구성 요소 중 일부가 실장되고, 상기 서술된 복수의 처리의 일부가 실시됨으로써, 산술 복호에 의해 발생하는 처리 지연의 삭감이 지원되어도 된다.
[복호 장치의 제1 복호 동작예]
도 18은, 실시형태 1에 관련된 복호 장치(200)의 제1 복호 동작예를 나타내는 플로우 차트이다. 예를 들어, 도 18에 나타낸 동작이, 도 17에 나타낸 복호 장치(200)의 회로(260)에 의해 실시됨으로써, 화상 정보가 복호된다.
도 18과 같이, 먼저, 회로(260)는, 화상 정보로부터 산술 부호화를 위한 2치화에 따라 도출된 2치화 데이터열을 포함하는 비트열을 취득한다(S201). 구체적으로는, 회로(260)는, 화상 정보로부터 산술 부호화를 위한 2치화에 따라 도출된 2치화 데이터열을 포함하고, 또한, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보를 포함하는 비트열을 취득한다.
그리고, 회로(260)는, 산술 부호화되어 있지 않은 2치화 데이터열로부터 화상 정보를 도출한다(S202). 구체적으로는, 회로(260)는, 2치화 데이터열에 대해 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 적용 정보로서 포함하는 비트열에 포함되는 2치화 데이터열이며, 산술 부호화가 적용되어 있지 않은 2치화 데이터열로부터 화상 정보를 도출한다.
이로써, 복호 장치(200)는, 산술 복호를 스킵할 수 있다. 따라서, 복호 장치(200)는, 산술 복호에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다. 또, 복호 장치(200)는, 산술 복호에 관한 역2치화의 자원을 유효하게 활용할 수 있다. 또, 복호 장치(200)는, 산술 부호화의 적용 상태가 적용 정보에 의해 식별 가능한 비트열을 취득하고, 화상 정보를 도출할 수 있다.
또한, 복호 장치(200)가 실시하는 동작에 관해, 상기 서술된 변환, 양자화 및 예측 등의 다른 동작이 한정되지 않아도 된다. 예를 들어, 복호 장치(200)는, 다른 동작을 실시하지 않아도 된다. 복호 장치(200)가 실시하는 동작에 관해, 다른 동작이 한정되지 않아도, 복호 장치(200)는, 산술 복호에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다.
혹은, 예를 들어, 회로(260)는, 제1 동작과 제2 동작을 전환해도 된다. 제1 동작에 있어서, 회로(260)는, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는 것을 나타내는 정보를 적용 정보로서 포함하는 비트열에 포함되고, 산술 부호화가 적용되어 있는 2치화 데이터열로부터, 화상 정보를 도출한다. 제2 동작에 있어서, 회로(260)는, 2치화 데이터열에 대해 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 적용 정보로서 포함하는 비트열에 포함되고, 산술 부호화가 적용되어 있지 않은 2치화 데이터열로부터, 화상 정보를 도출한다.
이로써, 복호 장치(200)는, 산술 복호를 실시하는지의 여부를 적응적으로 전환할 수 있고, 산술 복호를 적응적으로 스킵할 수 있다. 또, 복호 장치(200)는, 적용 정보에 따라, 제1 동작과 제2 동작을 전환할 수 있다. 또, 회로(260)는, 제1 동작과 제2 동작을 전환함으로써, 제1 동작 및 제2 동작의 양방을 상이한 타이밍에 실시할 수 있다. 또한, 회로(260)에 의해 실시되는 제1 동작 및 제2 동작은, 각각, 제1 도출 동작 및 제2 도출 동작으로도 표현될 수 있다.
또, 예를 들어, 회로(260)는, 복호 장치(200)의 외부로부터 부여되는 정보에 따라, 제1 동작과 제2 동작을 전환해도 되고, 복호 장치(200)의 내부에 유지되어 있는 정보에 따라, 제1 동작과 제2 동작을 전환해도 된다. 이로써, 회로(260)는, 복호 장치(200)의 외부 또는 내부의 정보에 따라, 적절히 제1 동작과 제2 동작을 전환할 수 있다.
또, 예를 들어, 회로(260)는, 1 이상의 픽처를 포함하는 단위로 포괄적으로, 제1 동작과 제2 동작을 전환해도 된다. 이로써, 복호 장치(200)는, 산술 부호화의 적용 상태의 전환에 관한 처리량의 증가를 억제할 수 있다.
또, 예를 들어, 회로(260)는, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는지의 여부를 1 이상의 픽처를 포함하는 단위로 포괄적으로 나타내는 적용 정보를 포함하는 비트열을 취득해도 된다. 바꿔 말하면, 적용 정보는, 산술 부호화가 적용되어 있는 2치화 데이터열을 비트열이 포함하는가, 산술 부호화가 적용되어 있지 않은 2치화 데이터열을 비트열이 포함하는가를 1 이상의 픽처를 포함하는 단위로 포괄적으로 나타내도 된다. 이로써, 복호 장치(200)는, 적용 정보에 관한 부호량 및 처리량의 증가를 억제할 수 있다.
[복호 장치의 제2 복호 동작예]
도 19는, 실시형태 1에 관련된 복호 장치(200)의 제2 복호 동작예를 나타내는 플로우 차트이다. 예를 들어, 도 19에 나타낸 동작이, 도 17에 나타낸 복호 장치(200)의 회로(260)에 의해 실시됨으로써, 화상 정보가 복호된다.
도 19와 같이, 먼저, 회로(260)는, 화상 정보로부터 산술 부호화를 위한 2치화에 따라 도출된 2치화 데이터열을 포함하는 비트열을 취득한다(S211).
그리고, 회로(260)는, 제1 동작과 제2 동작을 전환한다(S212). 제1 동작에 있어서, 회로(260)는, 비트열에 포함되고 산술 부호화가 적용되어 있는 2치화 데이터열로부터, 화상 정보를 도출한다(S213). 제2 동작에 있어서, 회로(260)는, 비트열에 포함되고 산술 부호화가 적용되어 있지 않은 2치화 데이터열로부터, 화상 정보를 도출한다(S214).
이로써, 복호 장치(200)는, 산술 복호를 실시하는지의 여부를 적응적으로 전환할 수 있고, 산술 복호를 적응적으로 스킵할 수 있다. 따라서, 복호 장치(200)는, 산술 복호에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다. 또, 복호 장치(200)는, 산술 복호에 관한 역2치화의 자원을 유효하게 활용할 수 있다. 또, 회로(260)는, 제1 동작과 제2 동작을 전환함으로써, 제1 동작 및 제2 동작의 양방을 상이한 타이밍에 실시할 수 있다.
또한, 복호 장치(200)가 실시하는 동작에 관해, 상기 서술된 변환, 양자화 및 예측 등의 다른 동작이 한정되지 않아도 된다. 예를 들어, 복호 장치(200)는, 다른 동작을 실시하지 않아도 된다. 복호 장치(200)가 실시하는 동작에 관해, 다른 동작이 한정되지 않아도, 복호 장치(200)는, 산술 복호에 의해 발생하는 처리 지연의 삭감을 지원할 수 있다.
혹은, 예를 들어, 회로(260)는, 2치화 데이터열을 포함하고, 또한, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보를 포함하는 비트열을 취득해도 된다.
그리고, 제1 동작에 있어서, 회로(260)는, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는 것을 나타내는 정보를 적용 정보로서 포함하는 비트열에 포함되고, 산술 부호화가 적용되어 있는 2치화 데이터열로부터, 화상 정보를 도출해도 된다. 그리고, 제2 동작에 있어서, 회로(260)는, 2치화 데이터열에 대해 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 적용 정보로서 포함하는 비트열에 포함되고, 산술 부호화가 적용되어 있지 않은 2치화 데이터열로부터, 화상 정보를 도출해도 된다.
이로써, 복호 장치(200)는, 산술 부호화의 적용 상태가 적용 정보에 의해 식별 가능한 비트열을 취득하고, 화상 정보를 도출할 수 있다. 또, 복호 장치(200)는, 적용 정보에 따라, 제1 동작과 제2 동작을 전환할 수 있다.
또, 예를 들어, 회로(260)는, 제1 복호 동작예와 동일하게, 복호 장치(200)의 외부로부터 부여되는 정보에 따라, 제1 동작과 제2 동작을 전환해도 되고, 복호 장치(200)의 내부에 유지되어 있는 정보에 따라, 제1 동작과 제2 동작을 전환해도 된다.
또, 예를 들어, 회로(260)는, 제1 복호 동작예와 동일하게, 1 이상의 픽처를 포함하는 단위로 포괄적으로, 제1 동작과 제2 동작을 전환해도 된다. 또, 예를 들어, 회로(260)는, 제1 복호 동작예와 동일하게, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는지의 여부를 1 이상의 픽처를 포함하는 단위로 포괄적으로 나타내는 적용 정보를 포함하는 비트열을 취득해도 된다.
[보충]
본 실시형태에 있어서의 부호화 장치(100) 및 복호 장치(200)는, 특히, 단시간에 부호화 및 복호를 실시하는 것이 요구되는 리얼타임 통신 시스템 등에 유용하다. 구체적으로는, 부호화 장치(100) 및 복호 장치(200)는, TV 회의 시스템 또는 전자 미러 등에 유용하다. 예를 들어, 이들 시스템 환경에 있어서, 산술 부호화 및 산술 복호가 실시되지 않는 제2 모드가 사용된다.
또, 기본적으로, 1 이상의 픽처를 포함하는 단위로 포괄적으로, 산술 부호화의 적용 유무의 전환이 실시된다. 그러나, 보다 미세한 단위로, 산술 부호화의 적용 유무의 전환이 실시되어도 된다. 예를 들어, 특정한 데이터 종별에 있어서, 산술 부호화 및 산술 복호가 스킵되어도 된다. 보다 구체적으로는, 바이패스 산술 부호화 및 바이패스 산술 복호 대신에, 산술 부호화 및 산술 복호의 스킵이 실시되어도 된다.
또, 예를 들어, 콘텍스트 산술 부호화와, 바이패스 산술 부호화와, 산술 부호화의 스킵의 전환이 실시되어도 된다. 동일하게, 콘텍스트 산술 복호와, 바이패스 산술 복호와, 산술 복호의 스킵의 전환이 실시되어도 된다.
또, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보는, 1비트의 플래그에 의해 표현되어도 되고, 다른 형식으로 표현되어도 된다. 예를 들어, 2치화 데이터열에 대해 산술 부호화가 적용되어 있는 것을 나타내는 정보가, 비트열에 추가됨으로써, 비트열은, 추가된 정보를 적용 정보로서 포함할 수 있다. 혹은, 2치화 데이터열에 대해 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보가, 비트열에 추가됨으로써, 비트열은, 추가된 정보를 적용 정보로서 포함할 수 있다.
또, 적용 정보는, 다른 정보와 공통의 정보로서, 비트열에 포함되어도 된다. 예를 들어, 픽처의 종별을 나타내는 정보가 비트열에 포함되고, 또한, 픽처의 종별에 의해 산술 부호화의 적용 유무가 전환되는 경우, 픽처의 종별을 나타내는 정보가 적용 정보이어도 된다.
또, 본 실시형태에 있어서의 부호화 장치(100) 및 복호 장치(200)는, 각각, 화상 부호화 장치 및 화상 복호 장치로서 이용될 수 있다. 혹은, 부호화 장치(100) 및 복호 장치(200)는, 각각, 엔트로피 부호화 장치 및 엔트로피 복호 장치로서 이용될 수 있다. 즉, 부호화 장치(100) 및 복호 장치(200)는, 각각, 엔트로피 부호화부(110) 및 엔트로피 복호부(202)에만 대응하고 있어도 된다.
또, 본 실시형태에 있어서, 각 구성 요소는, 전용의 하드웨어로 구성되거나, 각 구성 요소에 적합한 소프트웨어 프로그램을 실행함으로써 실현되어도 된다. 각 구성 요소는, CPU 또는 프로세서 등의 프로그램 실행부가, 하드디스크 또는 반도체 메모리 등의 기록 매체에 기록된 소프트웨어 프로그램을 판독 출력하여 실행함으로써 실현되어도 된다.
구체적으로는, 부호화 장치(100) 및 복호 장치(200)의 각각은, 처리 회로(Processing Circuitry)와, 당해 처리 회로에 전기적으로 접속된, 당해 처리 회로로부터 액세스 가능한 기억 장치(Storage)를 구비하고 있어도 된다. 예를 들어, 처리 회로는 회로(160 또는 260)에 대응하고, 기억 장치는 메모리(162 또는 262)에 대응한다.
처리 회로는, 전용의 하드웨어 및 프로그램 실행부 중 적어도 한쪽을 포함하고, 기억 장치를 사용하여 처리를 실행한다. 또, 기억 장치는, 처리 회로가 프로그램 실행부를 포함하는 경우에는, 당해 프로그램 실행부에 의해 실행되는 소프트웨어 프로그램을 기억한다.
여기서, 본 실시형태의 부호화 장치(100) 또는 복호 장치(200) 등을 실현하는 소프트웨어는, 다음과 같은 프로그램이다.
즉, 이 프로그램은, 컴퓨터에, 화상 정보를 부호화하는 부호화 방법으로서, 상기 화상 정보로부터 산술 부호화를 위한 2치화에 따라 2치화 데이터열을 도출하고, 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보를 포함하는 비트열을 출력하고, 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열을 출력하는 부호화 방법을 실행시킨다.
혹은, 이 프로그램은, 컴퓨터에, 화상 정보를 부호화하는 부호화 방법으로서, 상기 화상 정보로부터 산술 부호화를 위한 2치화에 따라 2치화 데이터열을 도출하고, 상기 2치화 데이터열을 포함하는 비트열을 출력하고, (i) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열을 포함하는 상기 비트열을 출력하는 제1 동작과, (ii) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열을 포함하는 상기 비트열을 출력하는 제2 동작을 전환하는 부호화 방법을 실행시킨다.
혹은, 이 프로그램은, 컴퓨터에, 화상 정보를 복호하는 복호 방법으로서, 상기 화상 정보로부터 산술 부호화를 위한 2치화에 따라 도출된 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지의 여부를 나타내는 적용 정보를 포함하는 비트열을 취득하고, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 복호 방법을 실행시킨다.
혹은, 이 프로그램은, 컴퓨터에, 화상 정보를 복호하는 복호 방법으로서, 상기 화상 정보로부터 산술 부호화를 위한 2치화에 따라 도출된 2치화 데이터열을 포함하는 비트열을 취득하고, 상기 2치화 데이터열로부터 상기 화상 정보를 도출하고, (i) 상기 화상 정보의 도출에 있어서, 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 제1 동작과, (ii) 상기 화상 정보의 도출에 있어서, 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 제2 동작을 전환하는 복호 방법을 실행시킨다.
또, 각 구성 요소는, 상기 서술한 바와 같이, 회로이어도 된다. 이들 회로는, 전체적으로 1개의 회로를 구성해도 되고, 각각 다른 회로이어도 된다. 또, 각 구성 요소는, 범용적인 프로세서로 실현되어도 되고, 전용의 프로세서로 실현되어도 된다.
또, 특정한 구성 요소가 실행하는 처리를 다른 구성 요소가 실행해도 된다. 또, 처리를 실행하는 차례가 변경되어도 되고, 복수의 처리가 병행하여 실행되어도 된다. 또, 부호화 복호 장치가, 부호화 장치(100) 및 복호 장치(200)를 구비하고 있어도 된다.
설명에 이용된 제1 및 제2 등의 서수는, 적절히 교체되어도 된다. 또, 구성 요소 등에 대해, 서수가 새롭게 부여되어도 되고, 제거되어도 된다.
이상, 하나 또는 복수의 양태에 관련된 부호화 장치(100) 및 복호 장치(200)에 대해, 실시형태에 기초하여 설명했지만, 본 발명은, 이 실시형태에 한정되는 것은 아니다. 본 발명의 취지를 일탈하지 않는 한, 당업자가 생각해 낸 각종 변형을 본 실시형태에 실시한 것이나, 상이한 실시형태에 있어서의 구성 요소를 조합하여 구축되는 형태도, 하나 또는 복수의 양태의 범위 내에 포함되어도 된다.
(실시형태 2)
이상의 각 실시형태에 있어서, 기능 블록의 각각은, 통상, MPU 및 메모리 등에 의해 실현 가능하다. 또, 기능 블록의 각각에 의한 처리는, 통상, 프로세서 등의 프로그램 실행부가, ROM 등의 기록 매체에 기록된 소프트웨어(프로그램)를 판독 출력하여 실행함으로써 실현된다. 당해 소프트웨어는 다운로드 등에 의해 배포되어도 되고, 반도체 메모리 등의 기록 매체에 기록하여 배포되어도 된다. 또한, 각 기능 블록을 하드웨어(전용 회로)에 의해 실현하는 것도 당연히 가능하다.
또, 각 실시형태에 있어서 설명한 처리는, 단일 장치(시스템)를 사용하여 집중 처리함으로써 실현해도 되고, 또는, 복수의 장치를 사용하여 분산 처리함으로써 실현해도 된다. 또, 상기 프로그램을 실행하는 프로세서는, 단수이어도 되고, 복수이어도 된다. 즉, 집중 처리를 실시해도 되고, 또는 분산 처리를 실시해도 된다.
본 발명은 이상의 실시예에 한정되는 일 없이, 여러 가지 변경이 가능하고, 그것들도 본 발명의 범위 내에 포함된다.
또한 여기서, 상기 각 실시형태에서 나타낸 동화상 부호화 방법(화상 부호화 방법) 또는 동화상 복호화 방법(화상 복호 방법)의 응용예와 그것을 사용한 시스템을 설명한다. 당해 시스템은, 화상 부호화 방법을 사용한 화상 부호화 장치, 화상 복호 방법을 사용한 화상 복호 장치, 및 양방을 구비하는 화상 부호화 복호 장치를 갖는 것을 특징으로 한다. 시스템에 있어서의 다른 구성에 대해, 경우에 따라 적절히 변경할 수 있다.
[사용예]
도 20은, 컨텐츠 배신 서비스를 실현하는 컨텐츠 공급 시스템(ex100)의 전체 구성을 나타내는 도면이다. 통신 서비스의 제공 에어리어를 원하는 크기로 분할하고, 각 셀 내에 각각 고정 무선국인 기지국(ex106, ex107, ex108, ex109, ex110)이 설치되어 있다.
이 컨텐츠 공급 시스템(ex100)에서는, 인터넷(ex101)에, 인터넷 서비스 프로바이더(ex102) 또는 통신망(ex104), 및 기지국(ex106∼ex110)을 통하여, 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 및 스마트폰(ex115) 등의 각 기기가 접속된다. 당해 컨텐츠 공급 시스템(ex100)은, 상기 중 어느 요소를 조합하여 접속하도록 해도 된다. 고정 무선국인 기지국(ex106∼ex110)을 통하지 않고, 각 기기가 전화망 또는 근거리 무선 등을 통하여 직접적 또는 간접적으로 서로 접속되어 있어도 된다. 또, 스트리밍 서버(ex103)는, 인터넷(ex101) 등을 통하여, 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 및 스마트폰(ex115) 등의 각 기기와 접속된다. 또, 스트리밍 서버(ex103)는, 위성(ex116)을 통하여, 비행기(ex117) 내의 핫 스폿 내의 단말 등과 접속된다.
또한, 기지국(ex106∼ex110) 대신에, 무선 액세스 포인트 또는 핫 스폿 등이 사용되어도 된다. 또, 스트리밍 서버(ex103)는, 인터넷(ex101) 또는 인터넷 서비스 프로바이더(ex102)를 통하지 않고 직접 통신망(ex104)과 접속되어도 되고, 위성(ex116)을 통하지 않고 직접 비행기(ex117)와 접속되어도 된다.
카메라(ex113)는 디지털 카메라 등의 정지 화상 촬영, 및 동영상 촬영이 가능한 기기이다. 또, 스마트폰(ex115)은, 일반적으로 2G, 3G, 3.9G, 4G, 그리고 향후는 5G라고 불리는 이동 통신 시스템의 방식에 대응한 스마트폰기, 휴대 전화기, 또는 PHS(Personal Handyphone System) 등이다.
가전(ex118)은, 냉장고, 또는 가정용 연료 전지 코제너레이션 시스템에 포함되는 기기 등이다.
컨텐츠 공급 시스템(ex100)에서는, 촬영 기능을 갖는 단말이 기지국(ex106) 등을 통하여 스트리밍 서버(ex103)에 접속됨으로써, 라이브 배신 등이 가능해진다. 라이브 배신에서는, 단말(컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 스마트폰(ex115), 및 비행기(ex117) 내의 단말 등)은, 사용자가 당해 단말을 사용하여 촬영한 정지 화상 또는 동영상 컨텐츠에 대해 상기 각 실시형태에서 설명한 부호화 처리를 실시하고, 부호화에 의해 얻어진 영상 데이터와, 영상에 대응하는 소리를 부호화한 소리 데이터와 다중화하고, 얻어진 데이터를 스트리밍 서버(ex103)에 송신한다. 즉, 각 단말은, 본 발명의 일 양태에 관련된 화상 부호화 장치로서 기능한다.
한편, 스트리밍 서버(ex103)는 요구가 있던 클라이언트에 대해 송신된 컨텐츠 데이터를 스트림 배신한다. 클라이언트는, 상기 부호화 처리된 데이터를 복호화하는 것이 가능한, 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 스마트폰(ex115), 또는 비행기(ex117) 내의 단말 등이다. 배신된 데이터를 수신한 각 기기는, 수신한 데이터를 복호화 처리하여 재생한다. 즉, 각 기기는, 본 발명의 일 양태에 관련된 화상 복호 장치로서 기능한다.
[분산 처리]
또, 스트리밍 서버(ex103)는 복수의 서버 또는 복수의 컴퓨터이며, 데이터를 분산하여 처리하거나 기록하거나 배신하는 것이어도 된다. 예를 들어, 스트리밍 서버(ex103)는, CDN(Contents Delivery Network)에 의해 실현되고, 세계 중에 분산된 다수의 에지 서버와 에지 서버간을 잇는 네트워크에 의해 컨텐츠 배신이 실현되어 있어도 된다. CDN에서는, 클라이언트에 따라 물리적으로 가까운 에지 서버가 동적으로 할당된다. 그리고, 당해 에지 서버에 컨텐츠가 캐시 및 배신됨으로써 지연을 줄일 수 있다. 또, 어떠한 에러가 발생했을 경우 또는 트래픽의 증가 등에 의해 통신 상태가 바뀌는 경우에 복수의 에지 서버로 처리를 분산하거나, 다른 에지 서버에 배신 주체를 전환하건, 장해가 생긴 네트워크의 부분을 우회하여 배신을 계속할 수 있으므로, 고속이고 또한 안정적인 배신이 실현될 수 있다.
또, 배신 자체의 분산 처리에 머무르지 않고, 촬영한 데이터의 부호화 처리를 각 단말에서 실시해도 되고, 서버측에서 실시해도 되고, 서로 분담하여 실시해도 된다. 일례로서, 일반적으로 부호화 처리에서는, 처리 루프가 2번 실시된다. 첫 번째의 루프에서 프레임 또는 신 단위에서의 화상의 복잡함, 또는, 부호량이 검출된다. 또, 두 번째의 루프에서는 화질을 유지하여 부호화 효율을 향상시키는 처리가 실시된다. 예를 들어, 단말이 첫 번째의 부호화 처리를 실시하고, 컨텐츠를 수취한 서버측이 두 번째의 부호화 처리를 실시함으로써, 각 단말에서의 처리 부하를 줄이면서도 컨텐츠의 질과 효율을 향상시킬 수 있다. 이 경우, 거의 실시간으로 수신하여 복호하는 요구가 있으면, 단말이 실행된 첫 번째의 부호화가 끝난 데이터를 다른 단말에서 수신하여 재생할 수도 있으므로, 보다 유연한 리얼타임 배신도 가능해진다.
다른 예로서, 카메라(ex113) 등은, 화상으로부터 특징량 추출을 실시하고, 특징량에 관한 데이터를 메타데이터로서 압축하여 서버에 송신한다. 서버는, 예를 들어 특징량으로부터 오브젝트의 중요성을 판단하여 양자화 정밀도를 전환하는 등, 화상의 의미에 따른 압축을 실시한다. 특징량 데이터는 서버에서의 재차의 압축시의 움직임 벡터 예측의 정밀도 및 효율 향상에 특히 유효하다. 또, 단말에서 VLC(가변 길이 부호화) 등의 간이적인 부호화를 실시하고, 서버에서 CABAC(콘텍스트 적응형 2치 산술 부호화 방식) 등 처리 부하가 큰 부호화를 실시해도 된다.
또 다른 예로서, 스타디움, 쇼핑몰, 또는 공장 등에 있어서는, 복수의 단말에 의해 거의 동일한 신이 촬영된 복수의 영상 데이터가 존재하는 경우가 있다. 이 경우에는, 촬영을 실시한 복수의 단말과, 필요에 따라 촬영을 하고 있지 않은 다른 단말 및 서버를 사용하여, 예를 들어 GOP(Group of Picture) 단위, 픽처 단위, 또는 픽처를 분할한 타일 단위 등으로 부호화 처리를 각각 할당하여 분산 처리를 실시한다. 이로써, 지연을 줄여, 보다 리얼타임성을 실현할 수 있다.
또, 복수의 영상 데이터는 거의 동일 신이기 때문에, 각 단말에서 촬영된 영상 데이터를 서로 참조할 수 있도록, 서버에서 관리 및/또는 지시를 해도 된다. 또는, 각 단말로부터의 부호화가 끝난 데이터를, 서버가 수신하여해 복수의 데이터간에서 참조 관계를 변경, 또는 픽처 자체를 보정 혹은 교체하여 다시 부호화해도 된다. 이로써, 하나하나의 데이터의 질과 효율을 높인 스트림을 생성할 수 있다.
또, 서버는, 영상 데이터의 부호화 방식을 변경하는 트랜스코드를 실시한 후에 영상 데이터를 배신해도 된다. 예를 들어, 서버는, MPEG계의 부호화 방식을 VP계로 변환해도 되고, H.264를 H.265로 변환해도 된다.
이와 같이, 부호화 처리는, 단말, 또는 1 이상의 서버에 의해 실시하는 것이 가능하다. 따라서, 이하에서는, 처리를 실시하는 주체로서 「서버」 또는 「단말」등의 기재를 사용하지만, 서버에서 실시되는 처리의 일부 또는 모두가 단말에서 실시되어도 되고, 단말에서 실시되는 처리의 일부 또는 모두가 서버에서 실시되어도 된다. 또, 이들에 관해서는 복호 처리에 대해서도 동일하다.
[3D, 멀티앵글]
최근에는, 서로 거의 동기한 복수의 카메라(ex113) 및/또는 스마트폰(ex115) 등의 단말에 의해 촬영된 상이한 신, 또는, 동일 신을 상이한 앵글로 촬영한 화상 혹은 영상을 통합하여 이용하는 경우도 많아지고 있다. 각 단말에서 촬영한 영상은, 별도로 취득한 단말간의 상대적인 위치 관계, 또는, 영상에 포함되는 특징점이 일치하는 영역 등에 기초하여 통합된다.
서버는, 2차원의 동화상을 부호화할뿐만 아니라, 동화상의 신 해석 등에 기초하여 자동적으로, 또는, 사용자가 지정한 시각에 있어서, 정지 화상을 부호화하고, 수신 단말에 송신해도 된다. 서버는, 또한 촬영 단말간의 상대적인 위치 관계를 취득할 수 있는 경우에는, 2차원의 동화상뿐만 아니라, 동일 신이 상이한 앵글로부터 촬영된 영상에 기초하여, 당해 신의 3차원 형상을 생성할 수 있다. 또한, 서버는, 포인트 클라우드 등에 의해 생성한 3차원의 데이터를 별도로 부호화해도 되고, 3차원 데이터를 사용하여 인물 또는 오브젝트를 인식 혹은 추적한 결과에 기초하여, 수신 단말에 송신하는 영상을, 복수의 단말에서 촬영한 영상에서 선택, 또는, 재구성하여 생성해도 된다.
이와 같이 하여, 사용자는, 각 촬영 단말에 대응하는 각 영상을 임의로 선택하여 신을 즐길 수도 있고, 복수 화상 또는 영상을 사용하여 재구성된 3차원 데이터로부터 임의 시점의 영상을 잘라낸 컨텐츠를 즐길 수도 있다. 또한 영상과 동일하게 소리도 복수의 상이한 앵글로부터 수음(收音)되고, 서버는, 영상에 맞춰 특정한 앵글 또는 공간으로부터의 소리를 영상과 다중화하여 송신해도 된다.
또, 최근에는 Virtual Reality(VR) 및 Augmented Reality(AR) 등, 현실 세계와 가상 세계를 대응시킨 컨텐츠도 보급해 오고 있다. VR 화상의 경우, 서버는, 오른쪽 눈용 및 왼쪽 눈용의 시점 화상을 각각 제조하고, Multi-View Coding(MVC) 등에 의해 각 시점 영상간에서 참조를 허용하는 부호화를 실시해도 되고, 서로 참조하지 않고 다른 스트림으로서 부호화해도 된다. 다른 스트림의 복호시에는, 사용자의 시점에 따라 가상적인 3차원 공간이 재현되도록 서로 동기시켜 재생하면 된다.
AR 화상의 경우에는, 서버는, 현실 공간의 카메라 정보에, 가상 공간상의 가상 물체 정보를, 3차원적 위치 또는 사용자의 시점의 움직임에 기초하여 중첩한다. 복호 장치는, 가상 물체 정보 및 3차원 데이터를 취득 또는 유지하고, 사용자의 시점의 움직임에 따라 2차원 화상을 생성하고, 순조롭게 연결함으로써 중첩 데이터를 제조해도 된다. 또는, 복호 장치는 가상 물체 정보의 의뢰에 더하여 사용자의 시점의 움직임을 서버에 송신하고, 서버는, 서버에 유지되는 3차원 데이터로부터 수신한 시점의 움직임에 맞춰 중첩 데이터를 제조하고, 중첩 데이터를 부호화하고 복호 장치에 배신해도 된다. 또한, 중첩 데이터는, RGB 이외에 투과도를 나타내는 α값을 갖고, 서버는, 3차원 데이터로부터 제조된 오브젝트 이외의 부분의 α값이 0 등으로 설정되고, 당해 부분이 투과하는 상태에서 부호화해도 된다. 혹은, 서버는, 크로마키와 같이 소정의 값의 RGB값을 배경으로 설정하고, 오브젝트 이외의 부분은 배경색으로 한 데이터를 생성해도 된다.
동일하게 배신된 데이터의 복호 처리는 클라이언트인 각 단말에서 실시해도 되고, 서버측에서 실시해도 되고, 서로 분담하여 실시해도 된다. 일례로서, 어느 단말이, 일단 서버에 수신 리퀘스트를 보내고, 그 리퀘스트에 따른 컨텐츠를 다른 단말에서 수신하여 복호 처리를 실시하고, 디스플레이를 갖는 장치에 복호가 끝난 신호가 송신되어도 된다. 통신 가능한 단말 자체의 성능에 상관없이 처리를 분산시켜 적절한 컨텐츠를 선택함으로써 화질이 양호한 데이터를 재생할 수 있다. 또, 다른 예로서 큰 사이즈의 화상 데이터를 TV 등으로 수신하면서, 감상자의 개인 단말에 픽처가 분할된 타일 등 일부의 영역이 복호되어 표시되어도 된다. 이로써, 전체 이미지를 공유화하면서, 자신의 담당 분야 또는 보다 상세하게 확인하고자 하는 영역을 수중에서 확인할 수 있다.
또 앞으로는, 실내외에 관계없이 근거리, 중거리, 또는 장거리의 무선 통신이 복수 사용 가능한 상황하에서, MPEG-DASH 등의 배신 시스템 규격을 이용하여, 접속 중인 통신에 대해 적절한 데이터를 전환하면서 심리스로 컨텐츠를 수신하는 것이 예상된다. 이로써, 사용자는, 자신의 단말뿐만 아니라 실내외에 설치된 디스플레이 등의 복호 장치 또는 표시 장치를 자유롭게 선택하면서 실시간으로 전환된다. 또, 자신의 위치 정보 등에 기초하여, 복호하는 단말 및 표시하는 단말을 전환하면서 복호를 실시할 수 있다. 이로써, 목적지에의 이동 중에, 표시 가능한 디바이스가 매립된 옆의 건물의 벽면 또는 지면의 일부에 지도 정보를 표시시키면서 이동하는 것도 가능해진다. 또, 부호화 데이터가 수신 단말로부터 단시간에 액세스할 수 있는 서버에 캐시되어 있는, 또는, 컨텐츠·딜리버리·서비스에 있어서의 에지 서버에 카피되어 있는 등의, 네트워크상에서의 부호화 데이터에의 액세스 용이성에 기초하여, 수신 데이터의 비트 레이트를 전환하는 것도 가능하다.
[스케일러블 부호화]
컨텐츠의 전환에 관해, 도 21에 나타내는, 상기 각 실시형태에서 나타낸 동화상 부호화 방법을 응용하여 압축 부호화된 스케일러블한 스트림을 사용하여 설명한다. 서버는, 개별 스트림으로서 내용은 동일하고 질이 상이한 스트림을 복수 가지고 있어도 상관없지만, 도시된 바와 같이 레이어로 나누어 부호화를 실시함으로써 실현되는 시간적/공간적 스케일러블한 스트림의 특징을 살려, 컨텐츠를 전환하는 구성이어도 된다. 요컨대, 복호측이 성능이라는 내적 요인과 통신 대역의 상태 등의 외적 요인에 따라 어느 레이어까지 복호하는가를 결정함으로써, 복호측은, 저해상도의 컨텐츠와 고해상도의 컨텐츠를 자유롭게 전환하여 복호할 수 있다. 예를 들어 이동 중에 스마트폰(ex115)으로 시청하고 있던 영상의 계속을, 귀가 후에 인터넷 TV 등의 기기로 시청하고자 하는 경우에는, 당해 기기는, 동일한 스트림을 상이한 레이어까지 복호하면 되므로, 서버측의 부담을 경감시킬 수 있다.
또한 상기와 같이, 레이어마다 픽처가 부호화되어 있고, 베이스 레이어의 상위에 인헨스먼트 레이어가 존재하는 스케일러빌리티를 실현하는 구성 이외에, 인헨스먼트 레이어가 화상의 통계 정보 등에 기초하는 메타 정보를 포함하고, 복호측이, 메타 정보에 기초하여 베이스 레이어의 픽처를 초해상함으로써 고화질화된 컨텐츠를 생성해도 된다. 초해상이란, 동일 해상도에 있어서의 SN비의 향상, 및, 해상도의 확대 중 어느 것이어도 된다. 메타 정보는, 초해상 처리에 사용하는 선형 혹은 비선형의 필터 계수를 특정하기 위한 정보, 또는, 초해상 처리에 사용하는 필터 처리, 기계 학습 혹은 최소 제곱 연산에 있어서의 파라미터값을 특정하는 정보 등을 포함한다.
또는, 화상 내의 오브젝트 등의 이유에 따라 픽처가 타일 등으로 분할되어 있고, 복호측이, 복호하는 타일을 선택함으로써 일부의 영역만을 복호하는 구성이어도 된다. 또, 오브젝트의 속성(인물, 차, 볼 등)과 영상 내의 위치(동일 화상에 있어서의 좌표 위치 등)를 메타 정보로서 격납함으로써, 복호측은, 메타 정보에 기초하여 원하는 오브젝트의 위치를 특정하고, 그 오브젝트를 포함하는 타일을 결정할 수 있다. 예를 들어, 도 22에 나타내는 바와 같이, 메타 정보는, HEVC에 있어서의 SEI 메시지 등 화소 데이터와는 상이한 데이터 격납 구조를 사용하여 격납된다. 이 메타 정보는, 예를 들어, 메인 오브젝트의 위치, 사이즈, 또는 색채 등을 나타낸다.
또, 스트림, 시퀀스 또는 랜덤 액세스 단위 등, 복수의 픽처로 구성되는 단위로 메타 정보가 격납되어도 된다. 이로써, 복호측은, 특정 인물이 영상 내에 출현하는 시각 등을 취득할 수 있고, 픽처 단위의 정보와 합함으로써, 오브젝트가 존재하는 픽처, 및, 픽처 내에서의 오브젝트의 위치를 특정할 수 있다.
[Web 페이지의 최적화]
도 23은, 컴퓨터(ex111) 등에 있어서의 web 페이지의 표시 화면예를 나타내는 도면이다. 도 24는, 스마트폰(ex115) 등에 있어서의 web 페이지의 표시 화면예를 나타내는 도면이다. 도 23 및 도 24에 나타내는 바와 같이 web 페이지가, 화상 컨텐츠에의 링크인 링크 화상을 복수 포함하는 경우가 있고, 열람하는 디바이스에 따라 그 보이는 방식은 상이하다. 화면 상에 복수의 링크 화상이 보이는 경우에는, 사용자가 명시적으로 링크 화상을 선택할 때까지, 또는 화면의 중앙 부근에 링크 화상이 가까워지는 혹은 링크 화상의 전체가 화면 내에 들어갈 때까지는, 표시 장치(복호 장치)는, 링크 화상으로서 각 컨텐츠가 갖는 정지 화상 또는 I 픽처를 표시하거나, 복수의 정지 화상 또는 I 픽처 등으로 gif 애니메이션과 같은 영상을 표시하거나, 베이스 레이어만 수신하여 영상을 복호 및 표시하거나 한다.
사용자에 의해 링크 화상이 선택되었을 경우, 표시 장치는, 베이스 레이어를 최우선으로 하여 복호한다. 또한, web 페이지를 구성하는 HTML에 스케일러블한 컨텐츠인 것을 나타내는 정보가 있으면, 표시 장치는, 인헨스먼트 레이어까지 복호해도 된다. 또, 리얼타임성을 담보하기 위해, 선택되기 전 또는 통신 대역이 매우 엄격한 경우에는, 표시 장치는, 전방 참조의 픽처(I픽처, P픽처, 전방 참조만의 B픽처)만을 복호 및 표시함으로써, 선두 픽처의 복호 시각과 표시 시각 사이의 지연(컨텐츠의 복호 개시로부터 표시 개시까지의 지연)을 저감시킬 수 있다. 또, 표시 장치는, 픽처의 참조 관계를 억지로 무시하고 모든 B픽처 및 P픽처를 전방 참조로 하여 조잡하게 복호하고, 시간이 지나 수신한 픽처가 증가함에 따라 정상적인 복호를 실시해도 된다.
[자동 주행]
또, 차의 자동 주행 또는 주행 지원을 위해 2차원 또는 3차원의 지도 정보 등의 정지 화상 또는 영상 데이터를 송수신하는 경우, 수신 단말은, 1 이상의 레이어에 속하는 화상 데이터에 더하여, 메타 정보로서 기후 또는 공사의 정보 등도 수신하고, 이들을 대응시켜 복호해도 된다. 또한, 메타 정보는, 레이어에 속해도 되고, 단순히 화상 데이터와 다중화되어도 된다.
이 경우, 수신 단말을 포함하는 차, 드론 또는 비행기 등이 이동하기 때문에, 수신 단말은, 당해 수신 단말의 위치 정보를 수신 요구시에 송신함으로써, 기지국(ex106∼ex110)을 전환하면서 심리스한 수신 및 복호를 실현할 수 있다. 또, 수신 단말은, 사용자의 선택, 사용자의 상황 또는 통신 대역의 상태에 따라, 메타 정보를 어느 정도 수신할지, 또는 지도 정보를 어느 정도 갱신해갈지를 동적으로 전환하는 것이 가능해진다.
이상과 같이 하여, 컨텐츠 공급 시스템(ex100)에서는, 사용자가 송신한 부호화된 정보를 실시간으로 클라이언트가 수신하여 복호하고, 재생할 수 있다.
[개인 컨텐츠의 배신]
또, 컨텐츠 공급 시스템(ex100)에서는, 영상 배신업자에 의한 고화질이고 장시간의 컨텐츠뿐만 아니라, 개인에 의한 저화질이고 단시간의 컨텐츠의 유니캐스트, 또는 멀티캐스트 배신이 가능하다. 또, 이와 같은 개인의 컨텐츠는 앞으로도 증가해 갈 것으로 생각된다. 개인 컨텐츠를 보다 우수한 컨텐츠로 하기 위해, 서버는, 편집 처리를 실시하고 나서 부호화 처리를 실시해도 된다. 이것은 예를 들어, 이하와 같은 구성으로 실현될 수 있다.
촬영시에 리얼타임 또는 축적하여 촬영 후에, 서버는, 원화(原畵) 또는 부호화가 끝난 데이터로부터 촬영 에러, 신 탐색, 의미의 해석, 및 오브젝트 검출 등의 인식 처리를 실시한다. 그리고, 서버는, 인식 결과에 기초하여 수동 또는 자동으로, 핀트 어긋남 또는 손떨림 등을 보정하거나, 명도가 다른 픽처에 비해 낮은 또는 초점이 맞지 않은 신 등의 중요성이 낮은 신을 삭제하거나, 오브젝트의 에지를 강조하거나, 색조를 변화시키는 등의 편집을 실시한다. 서버는, 편집 결과에 기초하여 편집 후의 데이터를 부호화한다. 또 촬영 시각이 지나치게 길면 시청률이 낮아지는 것도 알려져 있으며, 서버는, 촬영 시간에 따라 특정한 시간 범위 내의 컨텐츠가 되도록 상기와 같이 중요성이 낮은 신뿐만 아니라 움직임이 적은 신 등을, 화상 처리 결과에 기초하여 자동으로 클립해도 된다. 또는, 서버는, 신의 의미 해석의 결과에 기초하여 다이제스트를 생성하고 부호화해도 된다.
또한, 개인 컨텐츠에는, 그대로는 저작권, 저작자 인격권, 또는 초상권 등의 침해가 되는 것이 비추어져 있는 케이스도 있고, 공유하는 범위가 의도한 범위를 초과하여 버리는 등 개인에게 있어 문제인 경우도 있다. 따라서, 예를 들어, 서버는, 화면 주변부의 사람의 얼굴, 또는 집안 등을 억지로 초점이 맞지 않는 화상으로 변경하여 부호화해도 된다. 또, 서버는, 부호화 대상 화상 내에, 미리 등록한 인물과는 상이한 인물의 얼굴이 비추어져 있는지의 여부를 인식하고, 비추어져 있는 경우에는, 얼굴 부분에 모자이크 처리하는 등의 처리를 실시해도 된다. 또는, 부호화의 전처리 또는 후처리로서, 저작권 등의 관점에서 사용자가 화상을 가공하고자 하는 인물 또는 배경 영역을 지정하고, 서버는, 지정된 영역을 다른 영상으로 치환하거나, 또는 초점을 흐리게 하는 등의 처리를 실시하는 것도 가능하다. 인물이면, 동화상에 있어서 인물을 트래킹하면서, 얼굴 부분의 영상을 치환할 수 있다.
또, 데이터량이 작은 개인 컨텐츠의 시청은 리얼타임성의 요구가 강하기 때문에, 대역폭에 따라 다르기도 하지만, 복호 장치는, 먼저 베이스 레이어를 최우선으로 수신하여 복호 및 재생을 실시한다. 복호 장치는, 이 사이에 인헨스먼트 레이어를 수신하고, 재생이 루프되는 경우 등 2회 이상 재생되는 경우에, 인헨스먼트 레이어도 포함하여 고화질의 영상을 재생해도 된다. 이와 같이 스케일러블한 부호화가 실시되어 있는 스트림이면, 미선택시 또는 보기 시작하는 단계에서는 조잡한 동영상이지만, 서서히 스트림이 스마트해져 화상이 양호해지는 체험을 제공할 수 있다. 스케일러블 부호화 이외에도, 1회째에 재생되는 조잡한 스트림과, 1회째의 동영상을 참조하여 부호화되는 2회째의 스트림이 1개의 스트림으로서 구성되어 있어도 동일한 체험을 제공할 수 있다.
[그 밖의 사용예]
또, 이들 부호화 또는 복호 처리는, 일반적으로 각 단말이 갖는 LSI(ex500)에 있어서 처리된다. LSI(ex500)는, 원 칩이어도 되고 복수 칩으로 이루어지는 구성이어도 된다. 또한, 동화상 부호화 또는 복호용의 소프트웨어를 컴퓨터(ex111) 등으로 판독 가능한 어떠한 기록 미디어(CD-ROM, 플렉시블 디스크, 또는 하드 디스크 등)에 장착하고, 그 소프트웨어를 사용하여 부호화 또는 복호 처리를 실시해도 된다. 또한 스마트폰(ex115)이 카메라가 부착된 경우에는, 그 카메라로 취득한 동영상 데이터를 송신해도 된다. 이 때의 동영상 데이터는 스마트폰(ex115)이 갖는 LSI(ex500)로 부호화 처리된 데이터이다.
또한, LSI(ex500)는, 애플리케이션 소프트를 다운로드하여 액티베이트하는 구성이어도 된다. 이 경우, 단말은, 먼저, 당해 단말이 컨텐츠의 부호화 방식에 대응하고 있는가, 또는, 특정 서비스의 실행 능력을 갖는가를 판정한다. 단말이 컨텐츠의 부호화 방식에 대응하고 있지 않은 경우, 또는, 특정 서비스의 실행 능력을 갖지 않는 경우, 단말은, 코덱 또는 애플리케이션 소프트를 다운로드하고, 그 후, 컨텐츠 취득 및 재생한다.
또, 인터넷(ex101)을 통한 컨텐츠 공급 시스템(ex100)에 한정되지 않고, 디지털 방송용 시스템에도 상기 각 실시형태의 적어도 동화상 부호화 장치(화상 부호화 장치) 또는 동화상 복호화 장치(화상 복호 장치) 중 어느 것을 장착할 수 있다. 위성 등을 이용하여 방송용의 전파에 영상과 소리가 다중화된 다중화 데이터를 실어 송수신하기 때문에, 컨텐츠 공급 시스템(ex100)의 유니캐스트가 용이한 구성에 대해 멀티캐스트용이라는 차이가 있지만 부호화 처리 및 복호 처리에 관해서는 동일한 응용이 가능하다.
[하드웨어 구성]
도 25는, 스마트폰(ex115)을 나타내는 도면이다. 또, 도 26은, 스마트폰(ex115)의 구성예를 나타내는 도면이다. 스마트폰(ex115)은, 기지국(ex110)과의 사이에서 전파를 송수신하기 위한 안테나(ex450)와, 영상 및 정지 화상을 찍는 것이 가능한 카메라부(ex465)와, 카메라부(ex465)에서 촬상한 영상, 및 안테나(ex450)에서 수신한 영상 등이 복호된 데이터를 표시하는 표시부(ex458)를 구비한다. 스마트폰(ex115)은, 추가로 터치 패널 등인 조작부(ex466)와, 음성 또는 음향을 출력하기 위한 스피커 등인 음성 출력부(ex457)와, 음성을 입력하기 위한 마이크 등인 음성 입력부(ex456)와, 촬영한 영상 혹은 정지 화상, 녹음한 음성, 수신한 영상 혹은 정지 화상, 메일 등의 부호화된 데이터, 또는, 복호화된 데이터를 보존 가능한 메모리부(ex467)와, 사용자를 특정하고, 네트워크를 비롯하여 각종 데이터에의 액세스의 인증을 하기 위한 SIM(ex468)과의 인터페이스부인 슬롯부(ex464)를 구비한다. 또한, 메모리부(ex467) 대신에 외부에 부착된 메모리가 사용되어도 된다.
또, 표시부(ex458) 및 조작부(ex466) 등을 통괄적으로 제어하는 주제어부(ex460)와, 전원 회로부(ex461), 조작 입력 제어부(ex462), 영상 신호 처리부(ex455), 카메라 인터페이스부(ex463), 디스플레이 제어부(ex459), 변조/복조부(ex452), 다중/분리부(ex453), 음성 신호 처리부(ex454), 슬롯부(ex464), 및 메모리부(ex467)가 버스(ex470)를 통하여 접속되어 있다.
전원 회로부(ex461)는, 사용자의 조작에 의해 전원 키가 온 상태가 되면, 배터리 팩으로부터 각 부에 대해 전력을 공급함으로써 스마트폰(ex115)을 동작 가능한 상태로 기동시킨다.
스마트폰(ex115)은, CPU, ROM 및 RAM 등을 갖는 주제어부(ex460)의 제어에 기초하여, 통화 및 데이터 통신 등의 처리를 실시한다. 통화시에는, 음성 입력부(ex456)에서 수음한 음성 신호를 음성 신호 처리부(ex454)에서 디지털 음성 신호로 변환하고, 이것을 변조/복조부(ex452)에서 스펙트럼 확산 처리하고, 송신/수신부(ex451)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나(ex450)를 통하여 송신한다. 또 수신 데이터를 증폭시켜 주파수 변환 처리 및 아날로그 디지털 변환 처리를 실시하고, 변조/복조부(ex452)에서 스펙트럼 역확산 처리하고, 음성 신호 처리부(ex454)에서 아날로그 음성 신호로 변환한 후, 이것을 음성 출력부(ex457)로부터 출력한다. 데이터 통신 모드시에는, 본체부의 조작부(ex466) 등의 조작에 의해 텍스트, 정지 화상, 또는 영상 데이터가 조작 입력 제어부(ex462)를 통하여 주제어부(ex460)에 송출되고, 동일하게 송수신 처리가 실시된다. 데이터 통신 모드시에 영상, 정지 화상, 또는 영상과 음성을 송신하는 경우, 영상 신호 처리부(ex455)는, 메모리부(ex467)에 보존되어 있는 영상 신호 또는 카메라부(ex465)로부터 입력된 영상 신호를 상기 각 실시형태에서 나타낸 동화상 부호화 방법에 의해 압축 부호화하고, 부호화된 영상 데이터를 다중/분리부(ex453)에 송출한다. 또, 음성 신호 처리부(ex454)는, 영상 또는 정지 화상 등을 카메라부(ex465)에서 촬상 중에 음성 입력부(ex456)에서 수음한 음성 신호를 부호화하고, 부호화된 음성 데이터를 다중/분리부(ex453)에 송출한다. 다중/분리부(ex453)는, 부호화가 끝난 영상 데이터와 부호화가 끝난 음성 데이터를 소정의 방식으로 다중화하고, 변조/복조부(변조/복조 회로부) (ex452), 및 송신/수신부(ex451)에서 변조 처리 및 변환 처리를 실시하여 안테나(ex450)를 통하여 송신한다.
전자 메일 또는 채팅에 첨부된 영상, 또는 웹페이지 등에 링크된 영상을 수신했을 경우, 안테나(ex450)를 통하여 수신된 다중화 데이터를 복호하기 위해, 다중/분리부(ex453)는, 다중화 데이터를 분리함으로써, 다중화 데이터를 영상 데이터의 비트스트림과 음성 데이터의 비트스트림으로 나누고, 동기 버스(ex470)를 통하여 부호화된 영상 데이터를 영상 신호 처리부(ex455)에 공급함과 함께, 부호화된 음성 데이터를 음성 신호 처리부(ex454)에 공급한다. 영상 신호 처리부(ex455)는, 상기 각 실시형태에서 나타낸 동화상 부호화 방법에 대응한 동화상 복호화 방법에 의해 영상 신호를 복호하고, 디스플레이 제어부(ex459)를 통하여 표시부(ex458)로부터, 링크된 동화상 파일에 포함되는 영상 또는 정지 화상이 표시된다. 또 음성 신호 처리부(ex454)는, 음성 신호를 복호하고, 음성 출력부(ex457)로부터 음성이 출력된다. 또한 리얼타임 스트리밍이 보급되어 있기 때문에, 사용자의 상황에 따라서는 음성의 재생이 사회적으로 적격하지 않은 장소에서도 일어날 수 있다. 그 때문에, 초기값으로는, 음성 신호는 재생하지 않고 영상 데이터만을 재생하는 구성쪽이 바람직하다. 사용자가 영상 데이터를 클릭하는 등 조작을 실시한 경우에만 음성을 동기하여 재생해도 된다.
또 여기서는 스마트폰(ex115)을 예로 설명했지만, 단말로는 부호화기 및 복호화기를 양방 갖는 송수신형 단말 외에, 부호화기만을 갖는 송신 단말, 및, 복호화기만을 갖는 수신 단말이라는 3 방법의 실장 형식이 생각된다. 또한 디지털 방송용 시스템에 있어서, 영상 데이터에 음성 데이터 등이 다중화된 다중화 데이터를 수신 또는 송신하는 것으로서 설명했지만, 다중화 데이터에는, 음성 데이터 이외에 영상에 관련되는 문자 데이터 등이 다중화되어도 되고, 다중화 데이터가 아니라 영상 데이터 자체가 수신 또는 송신되어도 된다.
또한, CPU를 포함하는 주제어부(ex460)가 부호화 또는 복호 처리를 제어하는 것으로서 설명했지만, 단말은 GPU를 구비하는 경우도 많다. 따라서, CPU와 GPU에서 공통화된 메모리, 또는 공통으로 사용할 수 있도록 어드레스가 관리되어 있는 메모리에 의해, GPU의 성능을 살려 넓은 영역을 일괄적으로 처리하는 구성이어도 된다. 이로써 부호화 시간을 단축할 수 있고, 리얼타임성을 확보하고, 저지연을 실현할 수 있다. 특히 움직임 탐색, 디블록 필터, SAO(Sample Adaptive Offset), 및 변환·양자화의 처리를, CPU 가 아니라, GPU로 픽처 등의 단위로 일괄적으로 실시하면 효율적이다.
본 발명은, 예를 들어, 텔레비전 수상기, 디지털 비디오 리코더, 카 내비게이션, 휴대 전화, 디지털 카메라, 디지털 비디오 카메라, TV 회의 시스템, 또는, 전자 미러 등에 이용 가능하다.
100 부호화 장치
102 분할부
104 감산부
106 변환부
108 양자화부
110 엔트로피 부호화부
112, 204 역양자화부
114, 206 역변환부
116, 208 가산부
118, 210 블록 메모리
120, 212 루프 필터부
122, 214 프레임 메모리
124, 216 인트라 예측부
126, 218 인터 예측부
128, 220 예측 제어부
132 2치화부
134, 140, 236, 242 전환부
136, 240 중간 버퍼
138 산술 부호화부
142 다중화부
144 출력 버퍼
150 송신 장치
152 송신 제어부
160, 260 회로
162, 262 메모리
200 복호 장치
202 엔트로피 복호부
232 입력 버퍼
234 분리부
238 산술 복호부
244 역2치화부
250 수신 장치
252 수신 제어부
300 코덱 시스템

Claims (20)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 화상 정보를 부호화하는 부호화 장치로서,
    메모리와,
    상기 메모리에 액세스 가능한 회로를 구비하고,
    상기 메모리에 액세스 가능한 상기 회로는,
    상기 화상 정보로부터, 가변 발생 확률에 따라 행해지는 콘텍스트 적응 산술 부호화와, 고정 발생 확률에 따라 행해지는 바이패스 산술 부호화를 포함하는 산술 부호화를 위한 2치화에 따라 2치화 데이터열을 도출하고,
    상기 2치화 데이터열을 포함하는 비트열을 출력하고,
    (i) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열을 포함하는 상기 비트열을 출력하는 제1 동작과, (ii) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열을 포함하는 상기 비트열을 출력하는 제2 동작을 전환하며,
    부호화 규격으로 정해진 복수의 프로파일 중 소정의 프로파일이 상기 화상 정보의 부호화에 이용되는 경우, 상기 제1 동작과 상기 제2 동작 중 한쪽으로 동작이 고정되며,
    상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되지 않은 경우, 상기 비트열은, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지 여부를 나타내는 적용 정보를 포함하며,
    상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되는 경우, 상기 비트열은, 상기 적용 정보를 포함하지 않는,
    부호화 장치.
  6. 청구항 5에 있어서,
    상기 회로는, 상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되지 않은 경우,
    상기 2치화 데이터열을 포함하고, 또한, 상기 적용 정보를 포함하는 상기 비트열을 출력하고,
    (i) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열을 출력하는 상기 제1 동작과, (ii) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열을 포함하고, 또한, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열을 출력하는 상기 제2 동작을 전환하는, 부호화 장치.
  7. 청구항 5 또는 청구항 6 에 있어서,
    상기 회로는, 상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되지 않은 경우, 1 이상의 픽처를 포함하는 단위로 포괄적으로, 상기 제1 동작과 상기 제2 동작을 전환하는, 부호화 장치.
  8. 청구항 5 또는 청구항 6에 있어서,
    상기 회로는, 상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되지 않은 경우, 1 이상의 슬라이스를 포함하는 단위로 포괄적으로, 상기 제1 동작과 상기 제2 동작을 전환하는, 부호화 장치.
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 화상 정보를 복호하는 복호 장치로서,
    메모리와,
    상기 메모리에 액세스 가능한 회로를 구비하고,
    상기 메모리에 액세스 가능한 상기 회로는,
    상기 화상 정보로부터, 가변 발생 확률에 따라 행해지는 콘텍스트 적응 산술 부호화와, 고정 발생 확률에 따라 행해지는 바이패스 산술 부호화를 포함하는 산술 부호화를 위한 2치화에 따라 도출된 2치화 데이터열을 포함하는 비트열을 취득하고,
    상기 2치화 데이터열로부터 상기 화상 정보를 도출하고,
    (i) 상기 화상 정보의 도출에 있어서, 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 제1 동작과, (ii) 상기 화상 정보의 도출에 있어서, 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 제2 동작을 전환하며,
    부호화 규격으로 정해진 복수의 프로파일 중 소정의 프로파일이 상기 화상 정보의 복호에 이용되는 경우, 상기 제1 동작과 상기 제2 동작 중 한쪽으로 동작이 고정되며,
    상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되지 않은 경우, 상기 비트열은, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지 여부를 나타내는 적용 정보를 포함하며,
    상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되는 경우, 상기 비트열은, 상기 적용 정보를 포함하지 않는,
    복호 장치.
  14. 청구항 13에 있어서,
    상기 회로는, 상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되지 않은 경우,
    상기 2치화 데이터열을 포함하고, 또한, 상기 적용 정보를 포함하는 상기 비트열을 취득하고,
    (i) 상기 화상 정보의 도출에 있어서, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 상기 제1 동작과, (ii) 상기 화상 정보의 도출에 있어서, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있지 않은 것을 나타내는 정보를 상기 적용 정보로서 포함하는 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 상기 제2 동작을 전환하는, 복호 장치.
  15. 청구항 13 또는 청구항 14에 있어서,
    상기 회로는, 상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되지 않은 경우, 1 이상의 픽처를 포함하는 단위로 포괄적으로, 상기 제1 동작과 상기 제2 동작을 전환하는, 복호 장치.
  16. 청구항 13 또는 청구항 14에 있어서,
    상기 회로는, 상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되지 않은 경우, 1 이상의 슬라이스를 포함하는 단위로 포괄적으로, 상기 제1 동작과 상기 제2 동작을 전환하는, 복호 장치.
  17. 삭제
  18. 화상 정보를 부호화하는 부호화 방법으로서,
    상기 화상 정보로부터, 가변 발생 확률에 따라 행해지는 콘텍스트 적응 산술 부호화와, 고정 발생 확률에 따라 행해지는 바이패스 산술 부호화를 포함하는 산술 부호화를 위한 2치화에 따라 2치화 데이터열을 도출하고,
    상기 2치화 데이터열을 포함하는 비트열을 출력하고,
    (i) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열을 포함하는 상기 비트열을 출력하는 제1 동작과, (ii) 상기 비트열의 출력에 있어서, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열을 포함하는 상기 비트열을 출력하는 제2 동작을 전환하며,
    부호화 규격으로 정해진 복수의 프로파일 중 소정의 프로파일이 상기 화상 정보의 부호화에 이용되는 경우, 상기 제1 동작과 상기 제2 동작 중 한쪽으로 동작이 고정되며,
    상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되지 않은 경우, 상기 비트열은, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지 여부를 나타내는 적용 정보를 포함하며,
    상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되는 경우, 상기 비트열은, 상기 적용 정보를 포함하지 않는,
    부호화 방법.
  19. 삭제
  20. 화상 정보를 복호하는 복호 방법으로서,
    상기 화상 정보로부터, 가변 발생 확률에 따라 행해지는 콘텍스트 적응 산술 부호화와, 고정 발생 확률에 따라 행해지는 바이패스 산술 부호화를 포함하는 산술 부호화를 위한 2치화에 따라 도출된 2치화 데이터열을 포함하는 비트열을 취득하고,
    상기 2치화 데이터열로부터 상기 화상 정보를 도출하고,
    (i) 상기 화상 정보의 도출에 있어서, 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있는 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 제1 동작과, (ii) 상기 화상 정보의 도출에 있어서, 상기 비트열에 포함되는 상기 2치화 데이터열이며, 상기 산술 부호화가 적용되어 있지 않은 상기 2치화 데이터열로부터, 상기 화상 정보를 도출하는 제2 동작을 전환하며,
    부호화 규격으로 정해진 복수의 프로파일 중 소정의 프로파일이 상기 화상 정보의 복호에 이용되는 경우, 상기 제1 동작과 상기 제2 동작 중 한쪽으로 동작이 고정되며,
    상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되지 않은 경우, 상기 비트열은, 상기 2치화 데이터열에 대해 상기 산술 부호화가 적용되어 있는지 여부를 나타내는 적용 정보를 포함하며,
    상기 제1 동작과 상기 제2 동작 중 한쪽으로 상기 동작이 고정되는 경우, 상기 비트열은, 상기 적용 정보를 포함하지 않는,
    복호 방법.
KR1020187032854A 2016-05-20 2017-05-10 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 KR102442406B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662339212P 2016-05-20 2016-05-20
US62/339,212 2016-05-20
PCT/JP2017/017629 WO2017199800A1 (ja) 2016-05-20 2017-05-10 符号化装置、復号装置、符号化方法及び復号方法

Publications (2)

Publication Number Publication Date
KR20190008224A KR20190008224A (ko) 2019-01-23
KR102442406B1 true KR102442406B1 (ko) 2022-09-13

Family

ID=60325771

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187032854A KR102442406B1 (ko) 2016-05-20 2017-05-10 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법

Country Status (7)

Country Link
US (1) US11166026B2 (ko)
EP (1) EP3461131A1 (ko)
JP (1) JP7199221B2 (ko)
KR (1) KR102442406B1 (ko)
CN (1) CN109155863B (ko)
TW (1) TWI729135B (ko)
WO (1) WO2017199800A1 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190387271A1 (en) * 2017-01-30 2019-12-19 Sony Corporation Image processing apparatus, image processing method, and program
WO2019138981A1 (ja) * 2018-01-12 2019-07-18 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法および復号方法
EP3861736A4 (en) 2018-11-06 2022-03-30 Beijing Bytedance Network Technology Co., Ltd. POSITION DEPENDENT INTRAPREDICTION
WO2020108591A1 (en) 2018-12-01 2020-06-04 Beijing Bytedance Network Technology Co., Ltd. Parameter derivation for intra prediction
CN111247798B (zh) * 2019-01-10 2022-03-15 深圳市大疆创新科技有限公司 对三维数据点集进行编码或解码的方法和设备
KR20230003269A (ko) * 2019-02-22 2023-01-05 엘지전자 주식회사 영상 코딩 시스템에서 cclm 예측에 기반한 영상 디코딩 방법 및 그 장치
JP7123268B2 (ja) 2019-02-24 2022-08-22 北京字節跳動網絡技術有限公司 イントラ予測のためのパラメータ導出
WO2020184848A1 (ko) * 2019-03-13 2020-09-17 엘지전자 주식회사 Dmvr 기반의 인터 예측 방법 및 장치
EP3745725A4 (en) 2019-03-22 2020-12-02 LG Electronics Inc. -1- METHOD AND DEVICE FOR INTERPRDICTION BASED ON DMVR AND BDOF
US11140409B2 (en) 2019-03-22 2021-10-05 Lg Electronics Inc. DMVR and BDOF based inter prediction method and apparatus thereof
WO2020197084A1 (ko) * 2019-03-22 2020-10-01 엘지전자 주식회사 Dmvr 기반의 인터 예측 방법 및 장치
JP7079377B2 (ja) * 2019-03-25 2022-06-01 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
GB201905400D0 (en) * 2019-04-16 2019-05-29 V Nova Int Ltd Video coding technology
CN118632029A (zh) * 2019-05-20 2024-09-10 松下电器(美国)知识产权公司 编码方法和解码方法
WO2021006196A1 (ja) * 2019-07-10 2021-01-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
CN114145020A (zh) * 2019-08-29 2022-03-04 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法和解码方法
JP7431549B2 (ja) * 2019-10-01 2024-02-15 キヤノン株式会社 符号化装置、撮像装置、制御方法、及びプログラム
US11357020B2 (en) 2020-02-06 2022-06-07 International Business Machines Corporation Connecting computer processing systems and transmitting data
US11405766B2 (en) 2020-02-06 2022-08-02 International Business Machines Corporation Connecting computer processing systems and transmitting data
US11290575B2 (en) * 2020-02-06 2022-03-29 International Business Machines Corporation Connecting computer processing systems and transmitting data

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130177069A1 (en) * 2012-01-09 2013-07-11 Texas Instruments Incorporated Context Adaptive Binary Arithmetic Coding (CABAC) with Scalable Throughput and Coding Efficiency
JP2015504256A (ja) 2012-01-19 2015-02-05 シャープ株式会社 Hevcにおけるcabacの高スループット符号化

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3337365B2 (ja) * 1996-01-23 2002-10-21 株式会社リコー 多値画像データ伝送装置
CN102892001A (zh) * 2004-11-09 2013-01-23 松下电器产业株式会社 转换成中间格式的两步算术解码
US20060126744A1 (en) * 2004-12-10 2006-06-15 Liang Peng Two pass architecture for H.264 CABAC decoding process
KR100776195B1 (ko) * 2005-08-09 2007-11-16 (주)씨앤에스 테크놀로지 빠른 cavlc를 위한 h.264 디코딩 방법
CN100466739C (zh) * 2005-10-12 2009-03-04 华为技术有限公司 Cabac解码系统及方法
JP4878262B2 (ja) * 2006-10-31 2012-02-15 キヤノン株式会社 エントロピー符号化装置
JP4785706B2 (ja) * 2006-11-01 2011-10-05 キヤノン株式会社 復号装置及び復号方法
US7839311B2 (en) * 2007-08-31 2010-11-23 Qualcomm Incorporated Architecture for multi-stage decoding of a CABAC bitstream
US8805099B2 (en) * 2011-06-22 2014-08-12 Panasonic Intellectual Property Corporation Of America Image decoding method and image coding method
JP2013009167A (ja) * 2011-06-24 2013-01-10 Mitsubishi Electric Corp エントロピー符号化装置、エントロピー復号装置、エントロピー符号化方法及びエントロピー復号方法
US9088796B2 (en) * 2011-11-07 2015-07-21 Sharp Kabushiki Kaisha Video decoder with enhanced CABAC decoding
JP5521083B2 (ja) * 2013-04-18 2014-06-11 パナソニック株式会社 画像符号化装置
JP6139774B2 (ja) * 2013-07-15 2017-05-31 ホアウェイ・テクノロジーズ・カンパニー・リミテッド Hevcにおけるcabacのための変換スキップされたブロックのための修正コーディング
US20190020877A1 (en) * 2016-01-21 2019-01-17 Sony Corporation Image processing apparatus and method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130177069A1 (en) * 2012-01-09 2013-07-11 Texas Instruments Incorporated Context Adaptive Binary Arithmetic Coding (CABAC) with Scalable Throughput and Coding Efficiency
JP2015504256A (ja) 2012-01-19 2015-02-05 シャープ株式会社 Hevcにおけるcabacの高スループット符号化

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Ryoji Hattori, et al. Fast bypass mode for CABAC, 2012 Picture Coding Symposium, IEEE, 2012-06-08, pp. 417-420

Also Published As

Publication number Publication date
KR20190008224A (ko) 2019-01-23
CN109155863A (zh) 2019-01-04
JP7199221B2 (ja) 2023-01-05
EP3461131A4 (en) 2019-03-27
US20190089958A1 (en) 2019-03-21
EP3461131A1 (en) 2019-03-27
CN109155863B (zh) 2022-09-20
TW201806392A (zh) 2018-02-16
TWI729135B (zh) 2021-06-01
WO2017199800A1 (ja) 2017-11-23
US11166026B2 (en) 2021-11-02
JPWO2017199800A1 (ja) 2019-03-14

Similar Documents

Publication Publication Date Title
KR102442406B1 (ko) 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
JP6994868B2 (ja) 符号化装置、復号装置、符号化方法、および復号方法
KR102577599B1 (ko) 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
JP7568875B2 (ja) 符号化装置、復号装置及び非一時的記憶媒体
JP7509975B2 (ja) 符号化装置及び復号装置
KR102679928B1 (ko) 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
KR102399384B1 (ko) 부호화 장치, 부호화 방법, 복호 장치 및 복호 방법
KR20200053482A (ko) 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
KR102470053B1 (ko) 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
JP7529740B2 (ja) 復号装置及び符号化装置
JP7314382B2 (ja) 復号装置
JP7389282B2 (ja) 復号装置、及び、復号方法
KR20210046679A (ko) 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
KR20210011378A (ko) 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
KR102720927B1 (ko) 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
KR20240154105A (ko) 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant