KR102517615B1 - 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치 및 화상 복호 장치 - Google Patents

화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치 및 화상 복호 장치 Download PDF

Info

Publication number
KR102517615B1
KR102517615B1 KR1020177035512A KR20177035512A KR102517615B1 KR 102517615 B1 KR102517615 B1 KR 102517615B1 KR 1020177035512 A KR1020177035512 A KR 1020177035512A KR 20177035512 A KR20177035512 A KR 20177035512A KR 102517615 B1 KR102517615 B1 KR 102517615B1
Authority
KR
South Korea
Prior art keywords
image
parameter
filter
prediction
block
Prior art date
Application number
KR1020177035512A
Other languages
English (en)
Other versions
KR20180018544A (ko
Inventor
겐고 데라다
다카히로 니시
다다마사 도마
사토시 요시카와
Original Assignee
파나소닉 아이피 매니지먼트 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파나소닉 아이피 매니지먼트 가부시키가이샤 filed Critical 파나소닉 아이피 매니지먼트 가부시키가이샤
Publication of KR20180018544A publication Critical patent/KR20180018544A/ko
Application granted granted Critical
Publication of KR102517615B1 publication Critical patent/KR102517615B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/002Image coding using neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

이 화상 부호화 방법에서는, 인트라 예측, 인터 예측 및 루프 내 필터 중 적어도 하나에 있어서, 입출력의 관계가 비선형이 되는 비선형 처리를 행하여 블록을 포함하는 화상을 부호화하고(S11), 그 비선형 처리에 이용되는 비선형 필터의 연산 파라미터를 부호화한다(S12).

Description

화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치 및 화상 복호 장치
본 개시는, 화상 부호화 방법 및 화상 복호 방법에 관한 것이다.
화상(동화상을 포함한다)을 부호화하는 화상 부호화 방법, 또는, 화상을 복호하는 화상 복호 방법에 관한 기술로서 비특허 문헌 1에 기재된 기술이 있다.
Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 12th Meeting: Geneva, CH, 14-23 Jan. 2013 JCTVC-L1003_v34.doc, High Efficiency Video Coding (HEVC) text specification draft 10 (for FDIS & Last Call) http://phenix.it-sudparis.eu/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v34.zip
그러나, 종래 기술에 따른 화상 부호화 방법 또는 화상 복호 방법에 있어서, 비효율적인 처리가 이용되는 경우가 있다.
따라서, 본 개시는, 화상을 효율적으로 부호화하는 화상 부호화 방법, 또는, 화상을 효율적으로 복호하는 화상 복호 방법을 제공한다.
본 개시된 일 양태에 따른 화상 부호화 방법은, 픽처를 블록마다 변환하고, 루프 내 필터를 이용하여 변환이 완료된 상기 블록을 재구축하고, 상기 픽처 내의 화소를 이용한 인트라 예측 또는 다른 픽처 내의 화소를 이용한 인터 예측을 이용하여 상기 재구축된 블록을 예측하고, 상기 블록을 부호화하는 화상 부호화 방법으로서, 상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터 중 적어도 하나에 있어서, 입출력의 관계가 비선형이 되는 비선형 처리를 행하여 상기 블록을 포함하는 화상을 부호화하고, 상기 비선형 처리에 이용되는 비선형 필터의 연산 파라미터를 부호화한다.
또한, 이 포괄적 또는 구체적인 양태는, 시스템, 장치, 집적 회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록 매체로 실현되어도 되고, 시스템, 장치, 집적 회로, 컴퓨터 프로그램 및 기록 매체의 임의인 조합으로 실현되어도 된다.
본 개시된 화상 부호화 방법은, 화상을 효율적으로 부호화할 수 있다.
도 1은, 실시의 형태 1에 있어서의 화상 부호화 장치의 구성을 나타내는 블록도이다.
도 2는, 실시의 형태 1에 있어서의 화상 부호화 장치에 의한 화상 부호화의 전체의 처리를 나타내는 플로우 차트이다.
도 3은, 도 2의 단계 S111에 있어서의 블록 부호화의 상세를 나타내는 플로우 차트이다.
도 4는, 도 3의 단계 S121에 있어서의 인트라 예측 블록 생성의 상세를 나타내는 플로우 차트이다.
도 5는, 도 3의 단계 S122에 있어서의 인터 예측 블록 생성의 상세를 나타내는 플로우 차트이다.
도 6은, 도 3의 단계 S131에 있어서의 루프 내 필터의 상세를 나타내는 플로우 차트이다.
도 7은, 도 2의 단계 S106에 있어서의 NN 인트라 예측 파라미터 결정의 상세를 나타내는 플로우 차트이다.
도 8은, 도 2의 단계 S108에 있어서의 NN 인터 예측 파라미터 결정의 상세를 나타내는 플로우 차트이다.
도 9는, 도 2의 단계 S110에 있어서의 NN 루프 내 필터 파라미터 결정의 상세를 나타내는 플로우 차트이다.
도 10은, 실시의 형태 1에 있어서의, NN 인트라 예측의 참조 화소와 부호화 대상 블록과의 관계를 나타내는 도면이다.
도 11은, 실시의 형태 1에 있어서의, NN 인터 예측의 참조 화소와 부호화 대상 블록의 관계를 나타내는 도면이다.
도 12는, 실시의 형태 1에 있어서의 NN 루프 내 필터의 일례를 나타내는 도면이다.
도 13은, 실시의 형태 1에 있어서의 NN 인트라 예측의 일례를 나타내는 도면이다.
도 14는, 실시의 형태 1에 있어서의 NN 인터 예측의 일례를 나타내는 도면이다.
도 15는, 실시의 형태 1에 있어서의 SPS(시퀀스 파라미터 세트)에 관한 신택스를 나타내는 도면이다.
도 16은, 실시의 형태 1에 있어서의 NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터에서 사용하는 파라미터 정보의 신택스를 나타내는 도면이다.
도 17은, 실시의 형태 1에 있어서의 PPS(픽처 파라미터 세트)의 신택스를 나타내는 도면이다.
도 18은, 실시의 형태 1에 있어서의 슬라이스 헤더의 신택스를 나타내는 도면이다.
도 19는, 실시의 형태 1에 있어서의 NN 인트라 예측의 파라미터 데이터의 신택스를 나타내는 도면이다.
도 20은, 실시의 형태 1에 있어서의 NN 인터 예측의 파라미터 데이터의 신택스를 나타내는 도면이다.
도 21은, 실시의 형태 1에 있어서의 NN 루프 내 필터의 파라미터 데이터의 신택스를 나타내는 도면이다.
도 22는, 실시의 형태 1에 있어서의 CU(부호화 블록)의 신택스를 나타내는 도면이다.
도 23은, 실시의 형태 1에 있어서의 CU의 신택스의 변형예로서, NN 인트라 예측 모드를 고정 인트라 예측 모드와 머지한 신택스를 나타내는 도면이다.
도 24는, 실시의 형태 1에 있어서의 CU의 신택스의 변형예에 있어서의, intra_pred_mode와, 예측 타입과, 고정 인트라 예측 모드와, NN 인트라 예측 모드와의 관계의 예를 나타내는 도면이다.
도 25는, 실시의 형태 1에 있어서의 CU의 신택스의 변형예에 있어서의, intra_pred_mode와, 예측 타입과, 고정 인트라 예측 모드와, NN 인트라 예측 모드와의 관계의 다른 예를 나타내는 도면이다.
도 26은, 실시의 형태 1에 있어서의 CU의 신택스의 다른 변형예로서, MV의 소수 정밀도로 NN 인터 예측 모드를 추출하는 예를 나타내는 도면이다.
도 27은, 실시의 형태 1에 있어서의, 프로파일 및 요구에 따라, NN의 유효/무효를 전환하는 처리를 나타내는 플로우 차트이다.
도 28은, 실시의 형태 1에 있어서의, 프로파일 및 요구에 따라, 파라미터 등을 설정하는 처리를 나타내는 플로우 차트이다.
도 29는, 실시의 형태 2에 있어서의 화상 복호 장치의 구성을 나타내는 블록도이다.
도 30은, 실시의 형태 2에 있어서의 화상 복호 장치에 의한 화상 복호의 전체의 처리를 나타내는 플로우 차트이다.
도 31은, 도 30의 단계 S227에 있어서의 블록 복호의 상세를 나타내는 플로우 차트이다.
도 32는, 도 31의 단계 S235에 있어서의 인트라 보상 블록 생성의 상세를 나타내는 플로우 차트이다.
도 33은, 도 31의 단계 S236에 있어서의 인터 보상 블록 생성의 상세를 나타내는 플로우 차트이다.
도 34는, 도 31의 단계 S238에 있어서의 루프 내 필터의 상세를 나타내는 플로우 차트이다.
도 35는, 실시의 형태 3에 있어서의 화상 부호화 장치의 구성을 나타내는 블록도이다.
도 36은, 실시의 형태 3에 있어서의 인트라 예측부 및 NN 처리 전환부에 의한 인트라 예측 블록 생성의 상세를 나타내는 플로우 차트이다.
도 37은, 실시의 형태 3에 있어서의 인터 예측부 및 NN 처리 전환부에 의한 인터 예측 블록 생성의 상세를 나타내는 플로우 차트이다.
도 38은, 실시의 형태 3에 있어서의 루프 내 필터부 및 NN 처리 전환부에 의한 루프 내 필터의 상세를 나타내는 플로우 차트이다.
도 39는, 실시의 형태 3에 있어서의 변환부에 의한 주파수 변환의 상세를 나타내는 플로우 차트이다.
도 40은, 실시의 형태 3에 있어서의 NN 인트라 예측 파라미터 결정부에 의한 NN 인트라 예측 파라미터 결정의 상세를 나타내는 플로우 차트이다.
도 41은, 실시의 형태 3에 있어서의 NN 인터 예측 파라미터 결정부에 의한 NN 인터 예측 파라미터 결정의 상세를 나타내는 플로우 차트이다.
도 42는, 실시의 형태 3에 있어서의 NN 루프 내 필터 파라미터 결정부에 의한 NN 루프 내 필터 파라미터 결정의 상세를 나타내는 플로우 차트이다.
도 43은, 실시의 형태 3에 있어서의 CU 신택스를 나타내는 도면이다.
도 44는, 실시의 형태 4에 있어서의 화상 복호 장치의 구성을 나타내는 블록도이다.
도 45는, 실시의 형태 4에 있어서의 인트라 보상부 및 NN 처리 전환부에 의한 인트라 보상 블록 생성의 상세를 나타내는 플로우 차트이다.
도 46은, 실시의 형태 4에 있어서의 인터 보상부 및 NN 처리 전환부에 의한 인터 보상 블록 생성의 상세를 나타내는 플로우 차트이다.
도 47은, 실시의 형태 4에 있어서의 루프 내 필터부 및 NN 처리 전환부에 의한 루프 내 필터의 상세를 나타내는 플로우 차트이다.
도 48은, 실시의 형태 4에 있어서의 역변환부에 의한 역주파수 변환의 상세를 나타내는 플로우 차트이다.
도 49는, 실시의 형태 5에 있어서의 화상 부호화 장치의 구성을 나타내는 블록도이다.
도 50은, 도 59의 단계 S492에 있어서의 NN 인트라 예측 파라미터 부호화의 상세를 나타내는 플로우 차트이다.
도 51은, 도 50의 단계 S405에 있어서의 파라미터 비참조 타입 부호화의 상세를 나타내는 플로우 차트이다.
도 52는, 도 50의 단계 S406에 있어서의 파라미터 참조 타입 부호화의 상세를 나타내는 플로우 차트이다.
도 53은, 도 52의 단계 S430에 있어서의 파라미터 참조 타입 계층수 부호화의 상세를 나타내는 플로우 차트이다.
도 54는, 도 52의 단계 S447에 있어서의 파라미터 참조 타입 노드수 부호화의 상세를 나타내는 플로우 차트이다.
도 55는, 도 52의 단계 S449에 있어서의 파라미터 참조 타입 바이어스치 부호화의 상세를 나타내는 플로우 차트이다.
도 56은, 도 52의 단계 S451에 있어서의 파라미터 참조 타입 가중 계수 부호화의 상세를 나타내는 플로우 차트이다.
도 57은, 실시의 형태 5에 있어서의 NN 인트라 예측의 파라미터 데이터의 신택스를 나타내는 도면이다.
도 58은, 실시의 형태 5에 있어서의 NN 인트라 예측의 파라미터 데이터의 신택스를 나타내는 도면이다.
도 59는, 실시의 형태 5에 있어서의 화상 부호화 장치에 의한 화상 부호화의 전체의 처리를 나타내는 플로우 차트이다.
도 60은, 실시의 형태 6에 있어서의 화상 복호 장치의 구성을 나타내는 블록도이다.
도 61은, 도 68의 단계 S602에 있어서의 NN 인트라 예측 파라미터 복호의 상세를 나타내는 플로우 차트이다.
도 62는, 도 61의 단계 S505에 있어서의 파라미터 비참조 타입 복호의 상세를 나타내는 플로우 차트이다.
도 63은, 도 61의 단계 S506에 있어서의 파라미터 참조 타입 복호의 상세를 나타내는 플로우 차트이다.
도 64는, 도 63의 단계 S540에 있어서의 파라미터 참조 타입 계층수 복호의 상세를 나타내는 플로우 차트이다.
도 65는, 도 63의 단계 S547에 있어서의 파라미터 참조 타입 노드수 복호의 상세를 나타내는 플로우 차트이다.
도 66은, 도 63의 단계 S549에 있어서의 파라미터 참조 타입 바이어스치 복호의 상세를 나타내는 플로우 차트이다.
도 67은, 도 63의 단계 S551에 있어서의 파라미터 참조 타입 가중 계수 복호의 상세를 나타내는 플로우 차트이다.
도 68은, 실시의 형태 6에 있어서의 화상 복호 장치에 의한 화상 복호의 전체의 처리를 나타내는 플로우 차트이다.
도 69a는, 본 개시된 일 양태에 따른 화상 부호화 장치의 블록도이다.
도 69b는, 본 개시된 일 양태에 따른 화상 부호화 방법의 플로우 차트이다.
도 70a는, 본 개시된 일 양태에 따른 화상 복호 장치의 블록도이다.
도 70b는, 본 개시된 일 양태에 따른 화상 복호 방법의 플로우 차트이다.
도 71은, 컨텐츠 전송 서비스를 실현하는 컨텐츠 공급 시스템의 전체 구성도이다.
도 72는, 디지털 방송용 시스템의 전체 구성도이다.
도 73은, 텔레비전의 구성예를 나타내는 블록도이다.
도 74는, 광디스크인 기록 미디어에 정보의 읽고 쓰기를 행하는 정보 재생/기록부의 구성예를 나타내는 블록도이다.
도 75는, 광디스크인 기록 미디어의 구조예를 나타내는 도면이다.
도 76a는, 휴대 전화의 일례를 나타내는 도면이다.
도 76b는, 휴대 전화의 구성예를 나타내는 블록도이다.
도 77은, 다중화 데이터의 구성을 나타내는 도면이다.
도 78은, 각 스트림이 다중화 데이터에 있어서 어떻게 다중화되고 있는지를 모식적으로 나타내는 도면이다.
도 79는, PES 패킷열에, 비디오 스트림이 어떻게 저장될지를 더욱 상세하게 나타낸 도면이다.
도 80은, 다중화 데이터에 있어서의 TS 패킷과 소스 패킷의 구조를 나타내는 도면이다.
도 81은, PMT의 데이터 구성을 나타내는 도면이다.
도 82는, 다중화 데이터 정보의 내부 구성을 나타내는 도면이다.
도 83은, 스트림 속성 정보의 내부 구성을 나타내는 도면이다.
도 84는, 영상 데이터를 식별하는 단계를 나타내는 도면이다.
도 85는, 각 실시의 형태의 동화상 부호화 방법 및 동화상 복호화 방법을 실현하는 집적 회로의 구성예를 나타내는 블록도이다.
도 86은, 구동 주파수를 전환하는 구성을 나타내는 도면이다.
도 87은, 영상 데이터를 식별하여 구동 주파수를 전환하는 단계를 나타내는 도면이다.
도 88은, 영상 데이터의 규격과 구동 주파수를 대응시킨 룩업 테이블의 일례를 나타내는 도면이다.
도 89a는, 신호 처리부의 모듈을 공유화하는 구성의 일례를 나타내는 도면이다.
도 89b는, 신호 처리부의 모듈을 공유화하는 구성의 다른 일례를 나타내는 도면이다.
(본 개시의 기초가 된 지견)
본 발명자는, 「배경 기술」의 란에 있어서 기재한, 화상을 부호화하는 화상 부호화 장치, 또는 화상을 복호하는 화상 복호 장치에 관해서, 이하의 문제가 생기는 것을 찾아냈다.
최근, 디지털 영상 기기의 기술 진보가 현저하고, 비디오 카메라나 텔레비전 튜너로부터 입력된 영상 신호(시계열 순서로 나열한 복수의 픽처)를 압축 부호화하여, DVD나 하드 디스크 등의 기록 미디어에 기록할 기회가 증가하고 있다. 화상 부호화 규격으로서는 H.264/AVC(MPEG-4 AVC)가 있지만, 차세대의 표준 규격으로서 HEVC(High Efficiency Video Coding) 규격(비특허 문헌 1)이 규격화되었다.
HEVC 규격(비특허 문헌 1)에 있어서의 화상 부호화 방법은, 부호화 화상을 예측하는 단계, 예측 화상과 부호화 대상 화상의 차분을 구하는 단계, 차분 화상을 주파수 계수로 변환하는 단계, 주파수 계수를 양자화하는 단계, 주파수 계수나 예측 정보를 산술 부호화하는 단계, 부호화한 화상을 복호하는 단계, 및, 복호한 화상에 대해서 필터 처리를 실시하는 루프 내 필터 단계로 구성된다. 예측 단계에서는, 화면 내로부터 예측하는 인트라 예측과, 화면간에서 예측하는 인터 예측이 있다. 인트라 예측, 인터 예측, 및 루프 내 필터는, 모두 주변 화소의 가중 선형합으로 표현되는 필터로 실현되고, 필터 계산에는 수패턴의 고정의 필터 계수를 사용한다.
그러나, 선형 필터 또는 고정의 필터 계수에서는, 예측 화상과 부호화 대상 화상과의 오차를 작게 할 수 없는 경우가 있고, 그 경우에 부호량이 커지거나, 혹은 화질이 열화된다는 과제가 있었다.
이하, 실시의 형태에 대해서, 도면을 참조하면서 구체적으로 설명한다. 또한, 이하에서 설명하는 실시의 형태는, 모두 포괄적 또는 구체적인 예를 나타내는 것이다. 이하의 실시의 형태에서 나타나는 수치, 형상, 재료, 구성 요소, 구성 요소의 배치 위치 및 접속 형태, 단계, 단계의 순서 등은 일례이며, 본 개시를 한정하는 주지는 아니다.
(실시의 형태 1)
<전체 구성>
도 1은, 본 실시의 형태에 있어서의 화상 부호화 장치의 구성을 나타내는 블록도이다.
본 실시의 형태에 있어서의 화상 부호화 장치(100)는, 블록 분할부(101), 감산부(102), 변환부(103), 양자화부(104), 가변길이 부호화부(105), 역변환부(106), 역양자화부(107), 가산부(108), NN 파라미터 결정부(109), 인트라 예측부(110), 인터 예측부(111), 프레임 메모리(112), 및 루프 내 필터부(113)를 구비한다. 또한, 본 개시에 있어서, NN은 뉴럴 네트워크를 의미한다. 이하, 이러한 구성 요소의 처리를, 플로우 차트 등을 이용하여 설명한다.
<동작(전체)>
도 2는, 화상 부호화 장치(100)에 의한 화상 부호화의 전체의 처리를 나타내는 플로우 차트이다.
우선, NN 파라미터 결정부(109)는, 부호화 대상 화상 또는 부호화 대상 화상군(시퀀스)을 분석하고, NN 인트라 예측 파라미터 전환 단위, NN 인터 예측 파라미터 전환 단위, 및 NN 루프 내 필터 파라미터 전환 단위(이하, 이들을 총칭하여 NN 파라미터 전환 단위라고 한다)를 결정한다(S101, S102, S103). 예를 들면, NN 파라미터 결정부(109)는, 화상의 각 블록의 화소 분산 또는 평균치 등을 구하고, 부호화 순서로 블록의 경향이 상이한 타이밍을 파라미터 전환 타이밍으로 설정한다. NN 파라미터 전환 단위로서는, CU, CTU, 슬라이스, 타일, 픽처, 또는 GOP가 있다.
다음에, 블록 분할부(101)는 입력 화상을 블록으로 분할하고, 블록을 순차 감산부(102)와 인트라 예측부(110)와 인터 예측부(111)에 출력한다(S104).
다음에, NN 인트라 예측 파라미터 결정부(109a)는, 부호화 대상 블록의 타이밍이 NN 인트라 예측 파라미터 전환 타이밍인지 어떤지를 판정하고, NN 인트라 예측 파라미터 전환 타이밍이면, NN 인트라 예측 파라미터를 결정한다(S105, S106). 동일하게 NN 인터 예측 파라미터 결정부(109b)는, 부호화 대상 블록의 타이밍이 NN 인터 예측 파라미터 전환 타이밍인지 어떤지를 판정하고, NN 인터 예측 파라미터 전환 타이밍이면, NN 인터 예측 파라미터를 결정한다(S107, S108). 동일하게, NN 루프 내 필터 파라미터 결정부(109c)는, 부호화 대상 블록의 타이밍이 NN 루프 내 필터 파라미터 전환 타이밍인지 어떤지를 판정하고, NN 루프 내 필터 파라미터 전환 타이밍이면 NN 루프 내 필터 파라미터를 결정한다(S109, S110). 각각의 파라미터의 결정에 관한 상세는 후술한다. 다음에, 화상 부호화 장치(100)는 블록을 부호화하고(S111), 부호화 대상 화상 내의 전체 블록의 부호화가 완료하기까지 단계 S105부터 S111을 반복한다(S112).
또한, NN 파라미터 전환 단위는, NN 인트라 예측, NN 인터 예측, NN 루프 내 필터 중 적어도 2개의 사이에서 동일하게 해도 된다. 예를 들면, NN 인트라 예측 및 NN 인터 예측에서는, NN 파라미터 전환 단위를 슬라이스로 하고, NN 루프 내 필터에서는 NN 파라미터 전환 단위를 픽처로 해도 된다.
또, 전술의 NN 인트라 예측 파라미터 전환 타이밍 등의 파라미터 전환 타이밍은, 직전에 부호화된 블록을 포함하는 NN 파라미터 전환 단위와는 상이한 새로운 NN 파라미터 전환 단위에 포함되는 블록이 부호화 대상 블록으로서 부호화되는 타이밍이다.
<동작(블록 부호화 플로우)>
도 3은, 도 2의 단계 S111에 있어서의 블록 부호화의 상세를 나타내는 플로우 차트이다.
우선, 인트라 예측부(110) 및 인터 예측부(111)는 인트라 예측 블록 및 인터 예측 블록을 생성한다(S121, S122). 상세는 후술한다.
다음에, 화상 부호화 장치(100)는, 인트라 예측 블록 및 인터 예측 블록 중 어느 하나를 선택하는 것에 의해서, 예측 블록을 결정한다(S123). 감산부(102)는, 부호화 대상 블록으로부터 예측 블록을 감산하여 차분 블록을 생성한다(S124). 변환부(103)는, 차분 블록을 주파수 변환하고(S125), 양자화부(104)는, 주파수 변환에 의해서 얻어진 복수의 주파수 계수를 양자화한다(S126). 가변길이 부호화부(105)는, 양자화에 의해서 얻어진 복수의 양자화치를 가변길이 부호화하는 것에 의해서 부호열을 생성한다(S127). 또, 역양자화부(107)는, 양자화에 의해서 얻어진 복수의 양자화치를 역양자화하고(S128), 역변환부(106)는 그 역양자화에 의해서 얻어진 복수의 주파수 계수를 역주파수 변환한다(S129). 가산부(108)는, 역주파수 변환에 의해서 얻어진 복호 차분 블록에 예측 블록을 가산하는 것에 의해서, 복원 블록을 생성한다(S130). 또, 루프 내 필터부(113)는, 복원 블록에 대해서 루프 내 필터를 실시하고, 프레임 메모리(112)에 저장한다(S131). 루프 내 필터에 대해서는 후술한다.
<동작(인트라 예측 블록 생성 플로우)>
도 4는, 도 3의 단계 S121에 있어서의 인트라 예측 블록 생성의 상세를 나타내는 플로우 차트이다. 또한, 이 인트라 예측 블록 생성은, 인트라 예측부(110)에 의해서 행해진다.
우선, 고정 인트라 예측부(110b)는, 고정 필터에 의한 인트라 예측을 실시한다(S141). 이것은 종래의 HEVC와 동일하기 때문에, 설명을 생략한다.
다음에, NN 인트라 예측부(110a)는, NN 인트라 예측 모드가 유효한지 여부를 판정하고(S142), 유효하면, 인트라 예측을 실시한다(S143). NN 인트라 예측부(110a)는, NN 인트라 예측 파라미터 결정부(109Aa)에 의해서 결정한 파라미터를, 인트라 예측에 이용한다. 상세는 후술하지만, 파라미터는 클래스마다 존재하고, NN 인트라 예측부(110a)는, 1 클래스를 1 모드로서 사용하며, 예측 정밀도가 높고(예측 화상과 부호화 대상 화상과의 차이가 작다), 예측 모드 식별자의 부호량이 작은 예측 모드를 선택하여 이용함으로써 NN 인트라 예측의 결과를 얻는다. 다음에, 인트라 예측부(110)는 NN 인트라 예측 평가치와 고정 인트라 예측 평가치를 비교한다(S144). 그리고, 인트라 예측부(110)은, NN 인트라 예측 평가치가 큰 경우는, NN 인트라 예측 결과를 인트라 예측 블록으로 설정하고(S145), 그렇지 않은 경우는, 고정 인트라 예측 결과를 인트라 예측 블록으로 설정한다(S146). 평가치는, 예측 화상(인트라 예측 블록)과 부호화 대상 화상(부호화 대상 블록)의 차이가 작으면 큰 값이 되고, 또, 예측에 필요한 파라미터(NN 인트라 예측의 경우는 필요한 가중 계수 또는 바이어스치 등)의 부호량이 작을수록 큰 값이 된다.
<동작(인터 예측 블록 생성 플로우)>
도 5는, 도 3의 단계 S122에 있어서의 인터 예측 블록 생성의 상세를 나타내는 플로우 차트이다. 이 도 5의 플로우 차트에 있어서의 단계 S151~S156는, 도 4의 인트라 예측 블록 생성의 플로우 차트에 있어서의 단계 S141~S146과 거의 동일하고, NN 인트라 예측 및 고정 인트라 예측을, NN 인터 예측 및 고정 인터 예측로 바꿔 읽는 것만이므로 설명을 생략한다.
<동작(루프 내 필터 플로우)>
도 6은, 도 3의 단계 S131에 있어서의 루프 내 필터의 상세를 나타내는 플로우 차트이다. 이 도 6의 플로우 차트에 있어서의 단계 S161~S164는, 도 4의 인트라 예측 블록 생성의 플로우 차트에 있어서의 단계 S141~S144와 거의 동일하고, NN 인트라 예측 및 고정 인트라 예측을, NN 루프 내 필터 및 고정 루프 내 필터에 바꿔 읽는 것만이므로 설명을 생략한다. 도 6의 플로우 차트에 있어서의 단계 S165 및 S166에서는, 루프 내 필터부(113)는, 평가치가 좋은 쪽의 필터 결과를 프레임 메모리(112)에 저장한다.
<동작(NN 인트라 예측 파라미터 결정 플로우)>
도 7은, 도 2의 단계 S106에 있어서의 NN 인트라 예측 파라미터 결정의 상세를 나타내는 플로우 차트이다.
우선, NN 인트라 예측 파라미터 결정부(109a)는, NN 인트라 예측 파라미터 전환 단위 내의 복수의 부호화 대상 블록의 각각을 복수 클래스 중 어느 하나의 클래스로 분류한다(S171). 예를 들면, NN 인트라 예측 파라미터 전환 단위가 픽처이면, NN 인트라 예측 파라미터 결정부(109a)는, 픽처 내의 부호화 대상 블록을 분류한다. 분류는, 블록의 특징 정보를 이용하여 실시된다. 예를 들면, 부호화 대상 블록은, 화소 분산 또는 화소의 분포를 이용하여 분류된다.
다음에, NN 인트라 예측 파라미터 결정부(109a)는, 분류한 클래스마다 NN 인트라 예측의 파라미터를 결정한다(S172). 상세를 도 10과 도 13을 이용하여 설명한다.
도 10의 (a)는, NN 인트라 예측의 참조 화소와 부호화 대상 블록과의 관계를 나타내는 도면이다. 하나의 사각은 1 화소를 나타낸다. 이와 같이, NN 인트라 예측 파라미터 결정부(109a)는, 부호화 대상 블록의 상측 옆의 화소와 좌측 옆의 화소를 참조 화소로서 사용한다.
도 13은, NN 인트라 예측의 일례를 나타내는 도면이다. 이 NN 인트라 예측은, 뉴럴 네트워크의 구성을 취하고, 좌단의 11개의 원은 입력하는 참조 화소를 나타내며, 도 10의 (a)의 참조 화소 0~참조 화소 10에 대응한다. 우단의 16개의 원은, 출력하는 예측 화소를 나타내고, 도 10의 (a)의 부호화 대상 블록 위치의 번호 0~15에 대응하는 예측 화소이다. 도 7의 단계 S172의 NN 인트라 예측의 파라미터 결정에서는, NN 인트라 예측 파라미터 결정부(109a)는, 도 13에 나타내는 뉴럴 네트워크의 계층수, 노드수, 가중 계수, 및 바이어스치를 결정한다. 계층수(nn_intra_layer_num[k])는, 모드(클래스) k에 있어서의 계층수, 즉 도 13의 가로 방향의 단수이다. 노드수(nn_intra_node_num[k][])는, 각 계층의 세로 방향의 노드의 개수이다. 예를 들면, 노드수(nn_intra_node_num[k][0])는, 모드(클래스) k에 있어서의 제0 계층의 노드수(도 13의 예에서는, 노드수는 4)이다. 가중 계수(nn_intra_w[k][][][])는, 모드(클래스) k에 있어서의 각 노드의 입력치에 곱셈하는 계수이다. 예를 들면, 가중 계수(nn_intra_w[k][0][0][2])는, 모드(클래스) k에 있어서의 제0 계층의 제0번째의 노드(n[k][0][0])에 대한 제2번째의 입력치(참조 화소 2 또는 입력 노드 r2의 값)에 곱셈하는 계수이다. 바이어스치(nn_intra_bias[k][][])는, 입력치의 가중합에 가산하는 값이다. 예를 들면, 바이어스치(nn_intra_bias[k][1][1])는, 모드(클래스) k에 있어서의 제1 계층의 제1번째의 노드(n[k][1][1])에 있어서, 입력치(입력 노드 n[k][0][0]~n[k][0][3]의 각 값)의 가중합에 가산하는 값이다. 각 노드의 출력치는 다음의 식으로 표현할 수 있다.
[수 1]
Figure 112017122533941-pct00001
여기서, w는 가중 계수, bias는 바이어스치, n는 노드의 출력치, n'는 노드 출력치 계산시의 일시적인 변수이다. 또, intra_pred_ref_pixel_num는 참조 화소수를 나타내고, 이 예에서는 11이다. 또한, intra_pred_ref_pixel_num는, 모드(k) 또는 예측 화소수에 따라 상이해도 된다. 또, nn_intra_node_num는, 노드수를 나타내고, 이 예에서는 제1 계층에 있어서 4이며, 제2 계층에 있어서 3이다. 또, [k]는 클래스(모드)를 나타낸다. 도 7의 단계 S171의 분류에서, 각 블록을 3개의 클래스로 나눈 경우는, NN 인트라 예측 파라미터 결정부(109a)는, 3개의 클래스의 각각에서, 도 13과 같은 네트워크 구성을 구축하고, [k]는 0~2의 값을 취하게 된다.
도 7의 단계 S172의 NN 인트라 예측 파라미터의 결정에서는, NN 인트라 예측 파라미터 결정부(109a)는, 동일한 클래스의 부호화 대상 블록과 그 참조 화소(주변 화소)의 페어를 교사(敎師) 데이터로서 학습하고, 참조 화소로부터 부호화 대상 블록을 생성(예측)하는 가중 계수 및 바이어스치를 산출한다. 보다 구체적으로는, NN 인트라 예측 파라미터 결정부(109a)는, 참조 화소를 입력하고, 출력하는 예측 화소가 부호화 대상 블록에 가까워지도록(오차가 작아지도록) 오차 역전파법 등을 이용하여 가중 계수와 바이어스치를 갱신해 가며, 입력 데이터(동일한 클래스의 부호화 대상 블록과 그 주변 화소의 페어군)에 대해서 가장 예측 오차가 작아지는 가중 계수 및 바이어스치를 산출한다. NN 인트라 예측 파라미터 결정부(109a)는, 이러한 처리를, 계층수 및 노드수를 변경한 복수 패턴으로 실시하고, 예측 정밀도가 높은, 계층수, 노드수, 가중 계수 및 바이어스치의 조합을 찾아낸다. 또한, 계층수, 노드수, 가중 계수 및 바이어스치는 부호화되어 부호열에 삽입되기 때문에, NN 인트라 예측 파라미터 결정부(109a)는, 예측 정밀도뿐만이 아니라 계층수, 노드수, 가중 계수 및 바이어스치의 부호량도 고려하여 최적인 조합을 이끌어낸다. NN 인트라 예측 파라미터 결정부(109a)는, 단계 S172의 처리를 모든 클래스에 대해서 실시한다(S173).
<동작(NN 인터 예측 파라미터 결정 플로우)>
도 8은, 도 2의 단계 S108에 있어서의 NN 인터 예측 파라미터 결정의 상세를 나타내는 플로우 차트이다.
우선, NN 인터 예측 파라미터 결정부(109b)는, 부호화 대상 블록마다 참조 화상 내로부터 가장 상관이 높은 참조 블록을 추출하고, 이것을 NN 인터 예측 파라미터 전환 단위 내의 전체 부호화 대상 블록으로 실시한다(S181, S182). NN 인터 예측 파라미터 결정부(109b)는, 상관 계산에는, 예를 들면 화소의 차분 절대치합을 이용하여 차분 절대치합이 작은 블록을 상관이 높은 블록으로서 추출한다.
다음에, NN 인터 예측 파라미터 결정부(109b)는, 부호화 대상 블록과 그 참조 블록의 상관에 따라, 복수의 부호화 대상 블록의 각각을 복수 클래스 중 어느 하나의 클래스로 분류한다(S183). 예를 들면, NN 인터 예측 파라미터 결정부(109b)는, 화소의 차분 절대치합이 작은 것과 큰 것을 분류하거나 화소 마다의 차분의 분산 또는 평균 등을 이용하여 분류한다.
다음에, NN 인터 예측 파라미터 결정부(109b)는, 분류한 클래스마다, NN 인터 예측의 파라미터를 결정한다(S184). 상세를 도 11과 도 14를 이용하여 설명한다.
도 11은, NN 인터 예측의 참조 화소와 부호화 대상 블록의 관계를 나타내는 도면이다. 하나의 사각은 1 화소를 나타낸다. 도 11과 같이, NN 인터 예측 파라미터 결정부(109b)는, 부호화 대상 블록의 1 화소의 예측에 13 화소의 참조 화상 내의 화소를 이용한다. 여기서, 움직임 벡터는 참조 화상 내에서 가장 상관이 높은 블록 위치를 가리키기 위한 정보이다. NN 인터 예측 파라미터 결정부(109b)는, 가장 상관이 높은 블록 위치의 주변 화소를 참조 화소로서 사용한다.
도 14는, NN 인터 예측의 일례를 나타내는 도면이다. 이 NN 네트워크 예측은, NN 인트라 예측과 동일하게, 뉴럴 네트워크의 구성을 취하고, 좌단의 13개의 원은 입력하는 참조 화소를 나타내며, 도 11의 참조 화소 0~참조 화소 12에 대응한다. 우단의 1개의 원은 출력하는 예측 화소를 나타내고, 도 11의 부호화 대상 블록 위치의 번호 0에 대응하는 예측 화소이다. 도 8의 단계 S184의 NN 인터 예측의 파라미터 결정에서는, NN 인터 예측 파라미터 결정부(109b)는, 도 14에 나타내는 뉴럴 네트워크의 계층수, 노드수, 가중 계수, 및 바이어스치를 결정한다. 계층수, 노드수, 가중 계수, 바이어스치 및 각 노드의 출력치의 계산 방법은, 도 13과 동일하기 때문에, 설명을 생략한다. 단, NN 인트라 예측과는 상이하게, NN 인터 예측 파라미터 결정부(109b)는 13개의 참조 화소를 입력하고, 1 화소의 예측 화소를 생성한다. 4×4 블록의 예측 화소를 생성하고자 하는 경우는, NN 인터 예측 파라미터 결정부(109b)는, 참조 화소 위치를 1 화소씩 늦추면서 도 14의 뉴럴 네트워크에 입력하고, 16회 반복하여 16개의 예측 화소를 생성하게 된다. 도 8의 단계 S184의 NN 인터 예측의 파라미터 결정에서는, NN 인터 예측 파라미터 결정부(109b)는, 동일한 클래스의 부호화 대상 화소와 그 참조 화소의 페어를 교사 데이터로서 학습하고, 참조 화소로부터 부호화 대상 화소를 생성(예측)하는 계층수, 노드수, 가중 계수 및 바이어스치를 산출한다. NN 인터 예측 파라미터 결정부(109b)는, 단계 S184의 처리를 모든 클래스에 대해서 실시한다(S185).
<동작(NN 루프 내 필터 파라미터 결정 플로우)>
도 9는, 도 2의 단계 S110에 있어서의 NN 루프 내 필터 파라미터 결정의 상세를 나타내는 플로우 차트이다. 또, 도 12는, NN 루프 내 필터의 일례를 나타내는 도면이다. 또한, 도 9의 플로우 차트에 있어서 NN 루프 내 필터 파라미터 결정부(109c)가 행하는 단계 S191~S193의 처리는, 도 7에 나타내는 NN 인트라 예측 파라미터 결정의 플로우 차트에 있어서의 단계 S171~S173의 처리와 동일하다. 따라서, 도 9의 플로우 차트의 설명을 생략한다. 단, NN 루프 내 필터 파라미터 결정부(109c)는, 도 12에 나타내는 바와 같이 부호화 대상 화소의 주변의 13 화소를 참조 화소로서 사용한다. 또, NN 루프 내 필터의 네트워크 구성은, NN 인터 예측과 동일하게, 도 14와 동일한 구성을 취한다. NN 루프 내 필터 파라미터 결정부(109c)는, NN 인터 예측과 동일하게, 클래스마다 참조 화소와 부호화 대상 화소를 교사 데이터로서 학습하고, 참조 화소로부터 부호화 대상 화소를 생성하는 계층수, 노드수, 가중 계수, 및 바이어스치를 산출한다.
<신택스 구성>
도 15~도 22를 이용하여, NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터에 관해서, 부호화하는 정보를 설명한다.
도 15는, SPS(시퀀스 파라미터 세트)에 관한 신택스를 나타내는 도면이다. nn_intra_pred_enabled_flag, nn_inter_pred_enabled_flag, 및 nn_ilf_enabled_flag는 각각 NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터가 유효한지 어떤지를 나타내는 플래그(유효/무효 정보)이다. 즉, 이러한 유효/무효 정보는, 도 4의 단계 S142, 도 5의 단계 S152 또는 도 6의 단계 S162에 있어서, 처리가 유효한지 여부를 판정하기 위한 정보이다. 또, 이러한 유효/무효 정보는, PPS에 존재해도 되고, 슬라이스 헤더 또는 CTU(Coding Tree Unit)에 존재해도 된다.
도 16은, NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터에서 사용하는 파라미터 정보의 신택스를 나타내는 도면이다. nps_id는, 이 데이터 세트에 관한 식별자이다. 화상 부호화 장치(100)는 NN 인트라 예측, NN 인터 예측, 또는 NN 루프 내 필터를 행하는 경우는, nps_id를 지정함으로써, 필요한 연산 파라미터를 취득한다. nps_nn_intra_pred_data_present_flag, nps_nn_inter_pred_data_present_flag, 및 nps_nn_ilf_data_present_flag는 각각, NN 인트라 예측의 파라미터(nn_intra_pred_parameter_data()), NN 인터 예측의 파라미터(nn_inter_pred_parameter_data()), 및 NN 루프 내 필터의 파라미터(nn_ilf_parameter_data())를 이 신택스 내에 포함하고 있는지 어떤지룰 나타내는 플래그이다. 이러한 플래그가 1인 경우는, 가변길이 부호화부(105)는, 후술하는 nn_intra_pred_parameter_data(), nn_inter_pred_parameter_data(), 및 nn_ilf_parameter_data()에 의해서, NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터에 사용하는, 계층수, 노드수, 가중 계수, 및 바이어스치에 관한 정보(연산 파라미터)를 부호화한다.
도 17은, PPS(픽처 파라미터 세트)의 신택스를 나타내는 도면이다. nn_intra_pred_enabled_flag, nn_inter_pred_enabled_flag, 및 nn_ilf_enabled_flag 중 어느 하나가 1인 경우, 즉 NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터 중 어느 하나가 유효한 경우에, 가변길이 부호화부(105)는 pps_nps_id를 부호화한다. 화상 부호화 장치(100)는, 이 PPS를 사용하는 픽처에서는, pps_nps_id와 일치하는 nps_id의 연산 파라미터를 이용하여, NN 인트라 예측, NN 인터 예측, 또는 NN 루프 내 필터를 실시한다.
도 18은, 슬라이스 헤더의 신택스를 나타내는 도면이다. nn_intra_pred_enabled_flag, nn_inter_pred_enabled_flag, 및 nn_ilf_enabled_flag 중 어느 하나가 1인 경우, 즉 NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터 중 어느 하나가 유효한 경우에, 가변길이 부호화부(105)는, slice_nps_id를 부호화한다. 화상 부호화 장치(100)는, 이 슬라이스 헤더를 사용하는 슬라이스에서는, slice_nps_id와 일치하는 nps_id의 연산 파라미터를 이용하여, NN 인트라 예측, NN 인터 예측, 또는 NN 루프 내 필터를 실시한다. 또한, 화상 부호화 장치(100)는 pps_nps_id와 slice_nps_id가 상이한 값인 경우는 slice_nps_id의 값을 우선하여 사용한다.
도 19는, NN 인트라 예측의 파라미터 데이터의 신택스를 나타내는 도면이다. nn_intra_mode_num는, NN 인트라 예측의 모드수를 나타내고, 도 7의 단계 S171에 있어서 분류한 클래스수에 대응한다. nn_intra_layer_num[k]는, NN 인트라 예측의 계층수를 나타내고, [k]는 NN 인트라 예측의 k번째의 모드인 것을 나타낸다. nn_intra_node_num[k][i]는, k번째의 모드의 i번째의 계층의 노드수를 나타낸다. nn_intra_bias[k][i][j]는, k번째의 모드의 i번째의 계층의 j번째의 노드의 바이어스치를 나타낸다. nn_intra_w[k][i][j][m]는, k번째의 모드의 i번째의 계층의 j번째의 노드의 m번째의 입력의 가중 계수를 나타낸다. 이와 같이, 가변길이 부호화부(105)는, 도 19의 신택스에 의해서, 도 13의 네트워크 구성의 파라미터 정보(연산 파라미터)를 부호화한다.
도 20은, NN 인터 예측의 파라미터 데이터의 신택스를 나타내는 도면이다. 도 21은, NN 루프 내 필터의 파라미터 데이터의 신택스를 나타내는 도면이다. 가변길이 부호화부(105)는, 도 19의 NN 인트라 예측과 동일하게, 도 14의 네트워크 구성의 파라미터 정보를 부호화한다.
도 22는, CU(부호화 블록)의 신택스를 나타내는 도면이다. intra_pred_type는, NN 인트라 예측 및 고정 인트라 예측의 어느 것을 사용했는지를 나타내는 정보이다. 가변길이 부호화부(105)는, 도 4의 S144에서 NN 인트라 예측의 평가치가 큰 경우는, NN_INTRA_PRED를 나타내는 intra_pred_type를 부호화하고, 고정 인트라 예측의 평가치가 큰 경우는, FIXED_INTRA_PRED를 나타내는 intra_pred_type를 부호화한다. 또한, nn_intra_pred_enabled_flag에 의해서 NN 인트라 예측이 무효인 경우는, 가변길이 부호화부(105)는 intra_pred_type를 부호화하지 않는다. 이 경우, 디코드측에서는 항상 고정 인트라 예측을 실시하도록 동작한다. 또, NN 인트라 예측을 사용한 경우는, 가변길이 부호화부(105)는 nn_intra_pred_mode로서 NN 인트라 예측의 모드를 부호화한다. 고정 인트라 예측을 사용한 경우는, 가변길이 부호화부(105)는, fixed_intra_pred_mode로서 고정 인트라 예측의 모드를 부호화한다. nn_intra_pred_mode는, 도 4의 S143의 NN 인트라 예측에서 어느 클래스(모드)의 연산 파라미터를 선택했는지를 나타내는 정보이며, 도 13의 [k]에 대응한다. 또, fixed_intra_pred_mode는, HEVC의 인트라 예측의 예측 방향에 대응하고, 고정 인트라 예측부(110b)는, 복수개 있는 필터 계수 세트를 fixed_intra_pred_mode에 의해서 전환한다.
또, inter_pred_type는, NN 인터 예측 및 고정 인터 예측의 어느 것을 사용했는지를 나타내는 정보이다. 가변길이 부호화부(105)는, 도 5의 S154에서 NN 인터 예측의 평가치가 큰 경우는, NN_INTER_PRED를 나타내는 inter_pred_type를 부호화하고, 고정 인터 예측의 평가치가 큰 경우는, FIXED_INTER_PRED를 나타내는 inter_pred_type를 부호화한다. 또한, nn_inter_pred_enabled_flag에 의해서 NN 인터 예측이 유효하지 않은 경우는, 가변길이 부호화부(105)는, inter_pred_type를 부호화하지 않는다. 이 경우, 디코드측에서는 항상 고정 인터 예측을 실시하도록 동작한다. 또, NN 인터 예측을 사용한 경우는, 가변길이 부호화부(105)는, nn_inter_pred_mode로서 NN 인터 예측의 모드를 부호화한다. nn_inter_pred_mode는, 도 5의 S153의 NN 인터 예측에서 어느 클래스(모드)의 연산 파라미터를 선택했는지를 나타내는 정보이며, 도 14의 [k]에 대응한다. 또, prediction_unit()에서는, 가변길이 부호화부(105)는, HEVC와 동일하게 움직임 벡터나 참조 화상 인덱스를 부호화한다.
또, ilf_type는, NN 루프 내 필터 및 고정 루프 내 필터의 어느 것을 사용했는지를 나타내는 정보이다. 가변길이 부호화부(105)는, 도 6의 S164에서 NN 루프 내 필터의 평가치가 큰 경우는, NN_ILF를 나타내는 ilf_type를 부호화하고, 고정 루프 내 필터의 평가치가 큰 경우는, FIXED_ILF를 나타내는 ilf_type를 부호화한다. 또한, nn_ilf_enabled_flag에 의해서 NN 루프 내 필터가 유효하지 않은 경우는, 가변길이 부호화부(105)는 ilf_type를 부호화하지 않는다. 이 경우, 디코드측에서는 항상 고정 루프 내 필터를 실시하도록 동작한다. 또, NN 루프 내 필터를 사용한 경우는, 가변길이 부호화부(105)는, nn_ilf_mode로서 NN 루프 내 필터의 모드를 부호화한다. nn_ilf_mode는, 도 6의 S163의 NN 루프 내 필터에서 어느 클래스(모드)의 연산 파라미터를 선택했는지를 나타내는 정보이며, 도 14의 [k]에 대응한다.
<효과>
이상, 본 실시의 형태에 따르면, 부호화 대상 화상에 특화한 예측 화소 생성 또는 루프 내 필터를 실시할 수 있고, 예측 오차 삭감, 또는 대상 화상에 접근하는 루프 내 필터 처리가 가능해지고, 부호화 효율을 향상시킬 수 있다. 보다 구체적으로는, 부호화 대상 화소와 참조 화소의 관계성을 뉴럴 네트워크에 의해 학습시킴으로써, 참조 화소로부터 정밀도 좋게 부호화 대상 화소를 생성할 수 있게 되고, 예측 정밀도의 향상, 및 노이즈 저감이 도모된다. 인트라 예측에 있어서는, 주변 화소에는 없는 오브젝트가 부호화 대상 블록 내에 출현한 경우, 종래의 HEVC에서는 예측이 곤란했지만, NN 인트라 예측에서는, 미리 그러한 데이터도 교사 데이터로서 학습하고 있기 때문에, 예측이 가능해진다. 또, 인터 예측에 있어서는, HEVC의 소수 화소 생성 수법은, 어떠한 입력 화상에서도 대응 가능하도록 범용적인 필터 처리가 되고 있고, 입력 화상에 따라서는 소수 화소의 예측 정밀도가 낮은 경우가 있다. 그러나, 본 실시의 형태에 따르면, NN 인터 예측에서는 입력 화상을 이용하여 학습하기 때문에, 입력 화상에 매치한 필터 처리로 할 수 있고 예측 정밀도를 향상 가능하다. 또, 루프 내 필터도 동일하게 NN 루프 내 필터에서는 입력 화상에 특화한 필터 연산을 구축할 수 있고, 보다 노이즈를 삭감한 원화상에 가까운 화상을 생성할 수 있다.
또한, 도 2에서 나타낸 대로, NN 파라미터 전환 단위는, NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터에 있어서 따로따로 설정 가능하게 되어 있지만, 모두 동일, 혹은 일부 동일해도 된다. 예를 들면, NN 인트라 예측 및 NN 인터 예측에서는, NN 파라미터 전환 단위를 슬라이스 단위로 하고, NN 루프 내 필터에서는, NN 파라미터 전환 단위를 픽처 단위라고 해도 된다. 그렇게 함으로써, 전환 타이밍의 판정을 통일화할 수 있고 전환하기 위한 정보(부호량)도 적게 할 수 있다.
또, NN 파라미터 전환 단위는 복수 픽처에 걸치는 GOP 등이어도 된다. 이와 같이, NN 파라미터 전환 단위를 크게 함으로써, 전환을 위한 식별자 정보의 부호량을 작게 할 수 있고, 또, 부호화해야 하는 NN 파라미터의 종류도 적어져 NN의 파라미터의 부호량을 삭감할 수 있다. 또, GOP 단위로 전환하는 경우, NN 파라미터 결정부(109)는, 복수 픽처를 입력하고, 그러한 픽처의 블록으로부터 학습하여 NN의 파라미터를 결정해도 되고, 대표적인 화상의 블록만을 사용하여 파라미터를 결정해도 된다. 그렇게 함으로써, 학습 시간(파라미터 결정 처리량)을 줄일 수 있고, 또, 선두 픽처만을 학습에 사용하여 파라미터를 결정하는 것에 의해서, 그 이후의 픽처의 입력을 기다리지 않고 하고 부호화를 시작할 수 있다. 그 결과, 부호열을 출력하기까지의 지연을 줄일 수 있다.
또, NN 인트라 예측 모드, NN 인터 예측 모드, 또는 NN 루프 내 필터 등의 NN(뉴럴 네트워크)의 유효/무효를, 프로파일에 따라서 변경해도 되고, 사용자가 지정해도 된다. 또, 사용하는 어플리케이션의 요구에 따라 변경하도록 해도 된다.
도 27은, 프로파일 및 요구에 따라, NN의 유효/무효를 전환하는 처리를 나타내는 플로우 차트이다.
예를 들면, 도 27의 단계 S201~S204에 나타내는 바와 같이, 화상 부호화 장치(100)는, 리얼타임 요구가 있는 경우, 및, 저연산량을 위한 프로파일인 경우에는, NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터를 무효로 하도록 해도 된다. 리얼타임 요구가 있는 어플리케이션이란, 예를 들면 TV 전화 등이며, 반대로 리얼타임 요구가 없는 어플리케이션에는, 예를 들면 인터넷 전송에 이용하는 영화 컨텐츠 등의 압축이 있다. NN의 예측 및 루프 내 필터에서는, 미리 부호화 대상 데이터를 학습시킬 필요가 있기 때문에, 2 패스 부호화와 같이, 입력 화상을 부호화 전에 주사할 필요가 있다. 그 때문에 화상이 입력되고 나서 부호열을 출력하기까지의 지연이, 고정의 필터에 비해 커진다. 그 때문에, 리얼 타임성을 중시하는 어플리케이션 또는 프로파일의 경우는, NN을 무효로 하는 것에 의해서 저지연으로 하고, 반대로 압축 성능을 올리고 싶은 경우는 NN을 유효하게 하는 것에 의해서 압축율을 올리는 등, 상황에 따라 NN의 유효/무효를 전환하는 것이 가능해진다.
또, 도 8에 나타내는 NN 인터 예측 파라미터의 결정에서는, NN 인터 예측 파라미터 결정부(109b)는, 부호화 대상 블록과 참조 블록과의 상관에 따라서, 부호화 대상 블록을 복수 클래스 중 어느 하나의 클래스로 분류하고 있다. 그러나, NN 인터 예측 파라미터 결정부(109b)는, 참조 화상 내에서 상관이 높은 블록 위치를 가리키기 위한 정보인 움직임 벡터의 소수 정밀도 정보를 이용하여 부호화 대상 블록을 분류해도 된다. 예를 들면, NN 인터 예측 파라미터 결정부(109b)는, 부호화 대상 블록의 움직임 벡터의 x성분 및 y성분이 모두 정수 화소 정밀도인 경우에는, 그 부호화 대상 블록을 클래스 0으로 분류하고, x성분 및 y성분이 모두 1/2 화소 정밀도인 경우에는, 그 부호화 대상 블록을 클래스 1로 분류해도 된다.
또, 본 실시의 형태에서는, 학습 데이터를 복수 클래스로 분류하고, 각 클래스로 뉴럴 네트워크의 파라미터를 결정하며, 각 클래스의 뉴럴 네트워크를 1 모드로 하여 선택 가능하게 하고 있다. 그러나, 본 개시에서는, 거기에 한정하지 않고 1 모드만으로 해도 된다. 즉, 복수 클래스로 분류하지 않고, NN 인트라 예측, NN 인터 예측 및 NN 루프 내 필터의 각각의 뉴럴 네트워크를 1 모드로 해도 된다. 그 경우는, 도 22에 나타내는 CU 신택스의 nn_intra_pred_mode, nn_inter_pred_mode, 및 nn_ilf_mode는 항상 고정의 수치가 되기 때문에, 불필요해지는 것은 말할 필요도 없다.
또, NN 파라미터 결정부(109)는, 계층수, 노드수, 가중 계수, 및 바이어스치를 연산 파라미터로서 결정하지만, 어플리케이션의 요구 또는 프로파일에 따라 계층수 또는 노드수의 최대치를 설정해도 되고, 고정치로 해도 된다.
도 28은, 프로파일 및 요구에 따라, 파라미터 등을 설정하는 처리를 나타내는 플로우 차트이다.
예를 들면, 도 28의 단계 S211~S213에 나타내는 바와 같이, NN 파라미터 결정부(109)는, 리얼 타임성이 요구되는 어플리케이션 및 저연산량을 위한 프로파일 시에는, 뉴럴 네트워크에 있어서의 계층수의 최대치를 2로 설정하고, 노드수의 최대치를 6으로 설정한다. 계층수 및 노드수를 제한함으로써, 화상 부호화 장치(100)의 파라미터 결정을 위한 계산량과, 화상 부호화 장치(100) 및 화상 복호 장치에 있어서의 NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터 처리의 계산량을 억제할 수 있다. 그 결과, 저지연이 요구되는 어플리케이션 또는 저스펙의 화상 복호 장치에 있어서는 유익하다. 또, 화상 부호화 장치(100)를 조작하는 사용자가 제한치를 설정해도 된다. 그렇게 하는 것에 의해서 인코더 처리량, 또는 부호열이 출력될 때까지의 지연을, 사용자가 제어할 수 있다.
또, 도 13 및 도 14에 나타내는 뉴럴 네트워크의 구성예는, 복수 계층이 되어 있지만, 1 계층의 구성이라도 좋고, 예를 들면, 단순한 가중 선형합의 구성으로 해도 좋다. 그렇게 하는 것에 의해서 구성을 심플하게 하여 저처리량으로 할 수 있음과 더불어, 부호화해야 할 파라미터 정보도 줄일 수 있고, 입력 화상에 따라서는 그렇게 한쪽이 효율적인 경우가 있다. 최소의 구성에서는 각 참조 화소에 곱셈하는 가중 계수만을 부호화하면 좋다.
또, 화상 부호화 장치(100)는, 파라미터 결정시에 사용하는 참조 화소, 혹은, NN 인트라 예측, NN 인터 예측, 또는 NN 루프 내 필터에 사용하는 참조 화소에 대해서, 전처리를 실시하고 나서 그러한 참조 화소를 뉴럴 네트워크에 입력해도 된다. 전처리는, 로패스 필터, 합성곱 연산, 풀링, 또는 샘플링 등이다. 그렇게 함으로써, 참조 화소가 보다 일반화한 데이터가 되고, 예측 정밀도 또는 루프 내 필터 성능을 향상시킬 수 있는 경우가 있다. 또, 사전 처리에 필요한 연산 파라미터도 별도 부호열에 포함시켜도 된다.
또, 화상 부호화 장치(100)는, 파라미터 결정 시에 사용하는 학습 데이터로서 예측 오차 또는 부호화 노이즈가 커지기 쉬운 영역만을 사용해도 된다. 예를 들면, 대상 화상 내의 에지 영역 또는 복잡성이 높은 영역만을 학습 데이터로 해도 된다. 예측 오차 또는 부호화 노이즈가 작은 영역에서는, 고정 인트라 예측, 고정 인터 예측, 또는 고정 루프 내 필터로도 성능이 충분한 경우가 많다. 그 때문에, 그 영역에서는, 고정 인트라 예측, 고정 인터 예측, 또는 고정 루프 내 필터를 사용하면 되고, NN의 처리를, 그 이외의, 예측 오차 또는 부호화 노이즈가 커지기 쉬운 영역에만 적용하면 된다. 그 때문에, 학습 데이터로서 예측 오차 또는 부호화 노이즈가 커지기 쉬운 영역만을 사용하는 쪽이, 그러한 케이스의 예측 정밀도 또는 루프 내 필터 성능을 향상시키기 쉽다. 또, 학습 데이터의 경향을 좁힘으로써, 보다 적은 모드로 고성능인 예측 또는 루프 내 필터를 실현할 수 있고 부호화해야 할 NN의 파라미터량을 삭감 가능하다.
또, NN 인트라 예측에 이용하는 참조 화소는, 도 10의 (a)의 11 화소에 한정되지 않는다. 예를 들면, 도 10의 (b)와 같이 보다 많은 참조 화소를 사용해도 된다. 반대로, NN 인트라 예측에 이용하는 참조 화소는 11 화소보다 적어도 된다. 참조 화소를 많게 하는(광범위하게 하는) 것에 따라, 예측 정밀도가 오르는 경우가 있다. 단, NN 인트라 예측에 필요한 파라미터량은 증가하는 경향이기 때문에, NN 인트라 예측의 모드에 의해서 전환하도록 해도 된다. 또, 본 실시의 형태에서는, 4×4 블록 사이즈의 예측 및 루프 내 필터를 예로 설명하고 있지만, HEVC와 같이 8×8 또는 16×16 사이즈로도 동일하게 처리하고, 블록 사이즈가 커질수록 참조 화소수를 늘리는 것은 말할 필요도 없다.
또, NN 인터 예측에 이용하는 참조 화소도 이와 같이 도 11의 (a)의 13 화소에 한정되지 않는다. 예를 들면, 도 11의 (b)와 같이 보다 많은 참조 화소를 사용해도 된다. 또, 사용하는 참조 화소 위치로부터 이루어지는 형상은, 도 11의 (a)와 같은 능형상의 형태라도 좋고, 도 11의 (b)와 같은 정방형 또는 장방형이어도 된다. 참조 화소를 많게 하는(광범위하게 하는) 것에 따라, 예측 정밀도가 오르는 경우가 있다. 단, NN 인터 예측에 필요한 파라미터량은 증가하는 경향이기 때문에, NN 인터 예측의 모드에 의해서 전환하도록 해도 된다. 능형상으로 하는 것에 의해서, 어느 정도의 범위를 유지하면서, 상관이 낮은 것 같은 화소를 참조 화소로부터 제거할 수 있고, 예측 성능을 유지하면서 필요한 파라미터량을 줄일 수 있다.
또, NN 루프 내 필터에 이용하는 참조 화소도 동일하게 도 12의 (a)의 13 화소에 한정되지 않는다. 예를 들면, 도 12의 (b)와 같이 보다 많은 참조 화소를 사용해도 된다. 또, 사용하는 참조 화소 위치로 이루어지는 형상은, 도 12의 (a)와 같은 능형상의 형태라도 되고, 도 12의 (b)와 같은 정방형 또는 장방형이라도 된다. 참조 화소를 많게 하는(광범위하게 하는) 것에 따라, 루프 내 필터 성능이 오르는 경우가 있다. 단, NN 루프 내 필터에 필요한 파라미터량은 증가하는 경향이기 때문에, NN 루프 내 필터의 모드에 의해서 전환하도록 해도 된다.
또, 도 13 및 도 14에서 나타낸 뉴럴 네트워크에서는, 활성화 함수의 f(x)로서 시그모이드 함수를 사용하고 있다. 그러나, 본 개시에서는, 거기에 한정하지 않고 다음과 같은 함수를 사용해도 된다.
f(x)=1 for x>0
f(x)=0 for x=0
f(x)=-1 for x<0
또, 본 실시의 형태에서는, 시그모이드 함수에 관해서도 처리량을 삭감하기 위해서, 룩업 테이블을 이용한 테이블 빼기 등을 이용하거나, 보다 계산량이 작은 근사식에 시그모이드 함수를 치환하여 사용하거나 해도 된다. 또, 본 실시의 형태에서는, 뉴럴 네트워크를 이용하고 있지만, 거기에 한정하지 않고 참조 화소로부터 예측 화소 또는 루프 내 필터 결과를 산출하는 구성이면, 단순한 가중 선형합이어도 되고, 가산, 감산, 곱셈, 또는 나눗셈 등의 프리미티브한 연산을 조합하여 실현된 비선형 필터라도 된다. 또, 도 13 및 도 14에 나타내는 예에서는, 참조 화소의 모두가 1 계층째의 노드의 모두에 결합하고 있지만, 거기에 한정하지 않고 결합하고 있지 않은 참조 화소 또는 노드가 있어도 된다. 참조 화소가 2 계층째 이후의 노드에 직접 결합하고 있는 구성이어도 된다.
또, 본 실시의 형태에서는, NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터의 유효 플래그는 SPS로 부호화되지만, PPS에 존재해도 되고, 슬라이스 헤더, CTU 또는 CU에 존재해도 된다.
또, 가변길이 부호화부(105)는, 도 16에 나타내는 nn_parameter_set_rbsp()를, 시퀀스 선두, GOP 선두, 또는 픽처 선두에서, 사용하는 파라미터 세트로서 정리하여 부호화해도 된다. 또, 화상 부호화 장치(100)는, nps_id를 사용하지 않고, NN 인트라 예측, NN 인터 예측, 또는 NN 루프 내 필터를 사용할 때에, 직전에 부호화한 NN 파라미터를 사용해도 된다. 정리하여 부호화하면, 블록마다의 부호량의 불균일을 억제할 수 있고 레이트 제어 등을 하기 쉽다. 또, 도 17 및 도 18에 나타내는 pps_nps_id 또는 slice_nps_id를 이용하여 파라미터를 지정함으로써 중복된 파라미터를 부호화하지 않아 되고, 부호량 삭감 효과가 있다.
또, NN 인트라 예측과 고정 인트라 예측의 모드를 통일적으로 취급하도록 해도 된다. 구체적으로는, NN 인트라 예측이나 고정 인트라 예측의 어느 것을 사용하는가 하는 타입 정보(intra_pred_type)를 마련하지 않고, 특정한 인트라 예측 모드인 경우에 NN 인트라 예측을 이용하도록 해도 된다.
도 23은, CU의 신택스의 변형예로서, NN 인트라 예측 모드를 고정 인트라 예측 모드와 머지한 신택스를 나타내는 도면이다. 도 24는, CU의 신택스의 변형예에 있어서의, intra_pred_mode와, 예측 타입과, 고정 인트라 예측 모드와, NN 인트라 예측 모드와의 관계의 예를 나타내는 도면이다. 도 25는, CU의 신택스의 변형예에 있어서의, intra_pred_mode와, 예측 타입과, 고정 인트라 예측 모드와, NN 인트라 예측 모드와의 관계의 다른 예를 나타내는 도면이다.
도 23 및 도 24에 나타내는 예에서는, 인트라 예측부(110)는, 인트라 예측 모드(intra_pred_mode)가 34 이하인 경우는 고정 인트라 예측을 사용하고, 35 이상인 경우는 NN 인트라 예측을 사용한다. 35 이상인 경우는, 인트라 예측 모드(intra_pred_mode)로부터 35 감산한 수치가 NN 인트라 예측의 모드(nn_intra_pred_mode)가 된다. 이렇게 함으로써, 인트라 예측의 타입 정보(intra_pred_type)가 불필요해지고, 부호량 뿐만이 아니라, 판정 처리도 불필요해진다. 또, 도 25와 같이, 인트라 예측 모드(intra_pred_mode)가 1인 경우에는 NN 인트라 예측을 사용하도록 해도 된다. 이 경우, 고정 인트라 예측의 모드 1이 무효가 되고, 그 대신에 NN 인트라 예측의 모드 0이 유효해진된다. 그렇게 함으로써, 인트라 예측의 모드의 총수를 바꾸지 않고 NN 인트라 예측을 도입할 수 있다. 즉, 인트라 예측 모드의 부호량을 늘리지 않고, NN 인트라 예측을 도입할 수 있다. 또, 이것은, NN 인트라 예측을 도입함으로써, 고정 인트라 예측의 일부의 모드가 불필요해지는 케이스를 고려하고 있다. 고정 인트라 예측의 모드 0은 Planar 예측, 모드 1은 DC 예측으로 말해지는 모드이며, DC 예측은 평탄한 화상의 경우에 선택되기 쉽다. 그러나, 평탄한 화상의 경우는 Planar 예측에서도 동일한 예측 화상을 생성할 수 있고, 그 경우에는, DC 예측 모드는 장황한 모드가 된다. NN 인트라 예측을 도입하는 경우는 고정 인트라 예측의 DC 예측 모드를 무효로 하고, DC 예측 모드가 지정된 경우는 NN 인트라 예측을 사용한다고 한 쪽이 효과적인 경우가 있다.
또, 인터 예측부(111)는 NN 인터 예측의 모드를 움직임 벡터(MV)로부터 도출해도 된다.
도 26은, CU의 신택스의 다른 변형예로서, MV의 소수 정밀도로 NN 인터 예측 모드를 추출하는 예를 나타내는 도면이다.
도 26의 예에 나타내는 바와 같이, 인터 예측부(111)는, MV의 소수 화소 정밀도 정보로부터 NN 인터 예측의 모드를 도출하고 있다. HEVC에서는 MV의 하위 2비트는 소수 화소 위치를 나타내고, 하위 2비트가 00인 경우는 정수 화소 위치, 01인 경우는 1/4 화소 위치, 10인 경우는 1/2 화소 위치, 11인 경우는 3/4 화소 위치를 나타낸다. 도 26의 예에서는, 인터 예측부(111)는, x성분 및 y성분의 소수 화소 위치에 따라 NN 인터 예측의 모드를 전환하고, 뉴럴 네트워크의 구성(파라미터)을 전환한다. MV의 소수 화소 위치에 따라서 주변 화소로부터의 예측 계산을 전환할 수 있고, NN 인터 예측 모드(nn_inter_pred_mode)를 부호화할 필요가 없으며, 부호량을 삭감할 수 있다. 또, MV의 소수 화소 위치에 따라서 예측 계산을 전환한 쪽이, 예측 정밀도가 높아지기 때문에, 이 방법에 따라 예측 정밀도를 향상시킬 수 있다.
또한, 본 실시예에 있어서의 처리는, 소프트웨어로 실현해도 된다. 그리고, 이 소프트웨어를 다운로드 등에 의해 배포해도 된다. 또, 이 소프트웨어를 CD-ROM 등의 기록 매체에 기록하여 유포해도 된다. 또한, 이것은, 본 명세서에 있어서의 다른 실시예에 있어서도 당해한다.
(실시의 형태 2)
<전체 구성>
도 29는, 본 실시의 형태에 있어서의 화상 복호 장치의 구성을 나타내는 블록도이다.
본 실시의 형태에 있어서의 화상 복호 장치(200)는, 가변길이 복호부(201), 역양자화부(202), 역변환부(203), 가산부(204), 인트라 보상부(205), 인터 보상부(206), 프레임 메모리(207), 및 루프 내 필터부(208)를 구비한다. 이하, 이러한 구성 요소의 처리를, 플로우 차트 등을 이용하여 설명한다.
<동작(전체)>
도 30은, 화상 복호 장치(200)에 의한 화상 복호의 전체의 처리를 나타내는 플로우 차트이다.
우선, 인트라 보상부(205)는, 복호 대상 블록의 타이밍이 NN 인트라 예측 파라미터 전환 타이밍인지 어떤지를 판정한다(S221). 그리고, 인트라 보상부(205)는, NN 인트라 예측 파라미터 전환 타이밍이면, 부호열 내에 있는 NN 인트라 예측 파라미터를 취득하고, NN 인트라 보상부(205a)로 설정한다(S222). 동일하게 인터 보상부(206)는, 복호 대상 블록의 타이밍이 NN 인터 예측 파라미터 전환 타이밍인지 어떤지를 판정한다(S223). 그리고, 인터 보상부(206)는, NN 인터 예측 파라미터 전환 타이밍이면, 부호열 내에 있는 NN 인터 예측 파라미터를 취득하고, NN 인터 보상부(206a)로 설정한다(S224). 동일하게 루프 내 필터부(208)는, 복호 대상 블록의 타이밍이 NN 루프 내 필터 파라미터 전환 타이밍인지 어떤지를 판정한다(S225). 그리고, 루프 내 필터부(208)는, NN 루프 내 필터 파라미터 전환 타이밍이면, 부호열 내에 있는 NN 루프 내 필터 파라미터를 취득하고, NN 루프 내 필터부(208a)로 설정한다(S226). 다음에, 화상 복호 장치(200)는, 복호 대상 블록을 복호하고(S227), 복호 대상 화상 내의 전체 블록의 복호가 완료하기까지 단계 S221~S227의 처리를 반복한다(S228).
또한, 상술의 NN 인트라 예측 파라미터 전환 타이밍 등의 파라미터 전환 타이밍은, 직전에 복호된 블록을 포함하는 NN 파라미터 전환 단위와는 상이한 새로운 NN 파라미터 전환 단위에 포함되는 블록이 복호 대상 블록으로서 복호되는 타이밍이다.
<동작(블록 복호 플로우)>
도 31은, 도 30의 단계 S227에 있어서의 블록 복호의 상세를 나타내는 플로우 차트이다.
우선, 가변길이 복호부(201)는, 부호열을 가변길이 복호하고, 주파수 변환 및 양자화한 블록을 취득한다(S231).
다음에, 역양자화부(202)는, 그 취득된 블록에 대해서 역양자화를 행하고(S232), 역변환부(203)는 역양자화된 블록에 대해서 역주파수 변환을 행한다(233).
다음에, 화상 복호 장치(200)는, 복호 대상 블록이 인트라 예측 및 인터 예측의 어디에서 부호화되었는지를 부호열 내의 정보로부터 판정한다(S234). 인트라 예측의 경우는, 인트라 보상부(205)는, 인트라 보상 블록을 생성하고(S235), 인터 예측의 경우는, 인터 보상부(206)는 인터 보상 블록을 생성한다(S236).
다음에, 가산부(204)는, 인트라 보상 블록 및 인터 보상 블록 중 어느 하나의 보상 블록과, 역주파수 변환한 결과를 가산하는 것에 의해서, 복원 블록을 생성한다(S237). 루프 내 필터부(208)는 복원 블록에 대해서 루프 내 필터를 실시하고, 프레임 메모리(207)에 저장하여 화상 출력한다(S238).
<동작(인트라 보상 블록 생성 플로우)>
도 32는, 도 31의 단계 S235에 있어서의 인트라 보상 블록 생성의 상세를 나타내는 플로우 차트이다.
우선, 인트라 보상부(205)는, NN 인트라 예측 모드가 유효한지 무효한지, NN 인트라 예측 모드를 부호화에서 사용했는지 어떤지를 부호열 내의 정보를 이용하여 판정한다(S241, S242). 여기서, NN 인트라 예측 모드가 유효하고, 또한 NN 인트라 예측 모드로 부호화되고 있는 경우에는, NN 인트라 보상부(205a)는, NN 인트라 보상을 행하는 것에 의해서, 인트라 보상 블록을 생성한다(S243). 그렇지 않은 경우는, 고정 인트라 보상부(205b)는, 고정 인트라 보상을 행하는 것에 의해서, 인트라 보상 블록을 생성한다(S244).
NN 인트라 보상 블록의 생성은, 실시의 형태 1과 동일하게, 도 10의 참조 화소를 사용하고, 도 13의 뉴럴 네트워크를 이용하여 실현한다. 또, NN 인트라 보상에서 사용하는 파라미터는, 도 30의 단계 S222에서 설정한, 부호열에 포함되는 파라미터이다. 신택스는, 실시의 형태 1과 동일하게, 도 15~도 26의 구성을 취한다. NN 인트라 보상부(205a)는, NN 인트라 보상에서 사용하는 파라미터로서 pps_nps_id 또는 slice_nps_id에 의해서 지정된 파라미터이며, pps_nps_id 또는 slice_nps_id에 일치하는 nps_id를 가지는 nn_parameter_set_rbsp()의 부호열 내의 파라미터(계층수, 노드수, 가중 계수, 바이어스치)를 취득하여 사용한다. 파라미터는, NN 인트라 예측의 모드마다 존재하고, NN 인트라 보상부(205a)는, 부호열 내에 포함되는 NN 인트라 예측 모드(nn_intra_pred_mode)를 이용하여 그 파라미터를 전환한다.
<동작(인터 보상 블록 생성 플로우)>
도 33은, 도 31의 단계 S236에 있어서의 인터 보상 블록 생성의 상세를 나타내는 플로우 차트이다. 이 도 33의 플로우 차트에 있어서의 단계 S251~S254는, 도 32의 인트라 보상 블록 생성의 플로우 차트에 있어서의 단계 S241~S244와 거의 동일하고, NN 인트라 예측 및 고정 인트라 예측을 NN 인터 예측 및 고정 인터 예측으로 바꿔 읽는 것만이므로 설명을 생략한다.
NN 인터 보상 블록 생성은, 실시의 형태 1과 동일하게, 도 11의 참조 화소를 사용하여, 도 14의 뉴럴 네트워크를 이용하여 실현한다. 또, NN 인터 보상에서 사용하는 파라미터는, 도 30의 단계 S224에서 설정한 부호열에 포함되는 파라미터이다. 신택스는, 실시의 형태 1과 동일하게, 도 15~도 26의 구성을 취한다. NN 인터 보상부(206a)는, NN 인터 보상에서 사용하는 파라미터로서 pps_nps_id 또는 slice_nps_id에 의해서 지정된 파라미터이며, pps_nps_id 또는 slice_nps_id에 일치하는 nps_id를 가지는 nn_parameter_set_rbsp()의 부호열 내의 파라미터(계층수, 노드수, 가중 계수, 바이어스치)를 취득하여 사용한다. 파라미터는, NN 인터 예측의 모드마다 존재하고, NN 인터 보상부(206a)는, 부호열 내에 포함되는 NN 인터 예측 모드(nn_inter_pred_mode)를 이용하여 그 파라미터를 전환한다.
<동작(루프 내 필터 플로우)>
도 34는, 도 31의 단계 S238에 있어서의 루프 내 필터의 상세를 나타내는 플로우 차트이다. 이 도 34의 플로우 차트에 있어서의 단계 S261~S264는, 도 32의 인트라 보상 블록 생성의 플로우 차트에 있어서의 단계 S241~S244와 거의 동일하고, NN 인트라 예측 및 고정 인트라 예측을 NN 루프 내 필터 및 고정 루프 내 필터로 바꿔 읽는 것만이므로 설명을 생략한다.
NN 루프 내 필터는, 실시의 형태 1과 동일하게, 도 12의 참조 화소를 사용하여, 도 14의 뉴럴 네트워크를 이용하여 실현한다. 또, NN 루프 내 필터에서 사용하는 파라미터는, 도 30의 S226에서 설정한 부호열에 포함되는 파라미터이다. 신택스는, 실시의 형태 1과 동일하게, 도 15~도 26의 구성을 취한다. NN 루프 내 필터부(208a)는, NN 루프 내 필터에서 사용하는 파라미터로서 pps_nps_id 또는 slice_nps_id에 의해서 지정된 파라미터이며, pps_nps_id 또는 slice_nps_id와 일치한 nps_id를 가지는 nn_parameter_set_rbsp()의 부호열 내의 파라미터(계층수, 노드수, 가중 계수, 바이어스치)를 취득하여 사용한다. 파라미터는, NN 루프 내 필터의 모드마다 존재하고, NN 루프 내 필터부(208a)는, 부호열 내에 포함되는 NN 루프 내 필터 모드(nn_ilf_mode)를 이용하여 그 파라미터를 전환한다.
<효과>
실시의 형태 1과 동일하기 때문에, 설명을 생략한다.
<실시의 형태 1 및 2의 정리>
본 개시된 제1 양태(1)에 따른 화상의 부호화 또는 복호의 방법에서는, 비선형 필터의 연산 파라미터를 부호화 또는 복호하고, 그 연산 파라미터를 이용하여 대상 화상을 부호화 또는 복호한다. 또한, 이 비선형 필터는, 복수의 화소치의 가중합인 선형 필터 이외의 필터이다.
또, 본 개시된 제2 양태(1-1)에 따른 방법에서는, 제1 양태에 따른 방법에 있어서, 인트라 예측, 인터 예측, 및 루프 내 필터 중 적어도 하나에서 상기 비선형 필터를 사용해도 된다.
또, 본 개시된 제3 양태(1-2)에 따른 방법에서는, 제1 양태에 따른 방법에 있어서, 상기 비선형 필터는 뉴럴 네트워크를 포함하는 구성이며, 연산 파라미터로서 적어도 노드간의 가중 계수를 부호화 또는 복호해도 된다.
또, 본 개시된 제4 양태(1-2-1)에 따른 방법에서는, 제3 양태에 따른 방법에 있어서, 부호화 또는 복호하는 상기 연산 파라미터는 계층수 또는 노드수의 정보를 포함해도 된다.
또, 본 개시된 제5 양태(1-2-1-1)에 따른 방법에서는, 제4 양태에 따른 방법에 있어서, 프로파일에 의해 계층수 또는 노드수의 최대치를 규정해도 된다.
또, 본 개시된 제6 양태(1-3)에 따른 방법에서는, 제1 양태에 따른 방법에 있어서, 고정 파라미터의 선형 필터와 상기 비선형 필터의 어느 것의 필터를 사용하는지 하는 전환 정보를 부호화 또는 복호하고, 그 정보에 따라서 선형 필터와 비선형 필터 중 어느 것을 사용할지를 전환해도 된다.
또, 본 개시된 제7 양태(1-3-1)에 따른 방법에서는, 제6 양태에 따른 방법에 있어서, 복수의 모드 중에서 1개 혹은 복수의 모드를, 상기 비선형 필터를 사용하는 모드로 하고, 그 모드를 사용하는 경우는 상기 비선형 필터를 사용하여 대상 화상을 부호화 또는 복호해도 된다.
또, 본 개시된 제8 양태(1-4)에 따른 방법에서는, 제1 양태에 따른 방법에 있어서, 블록, 슬라이스, 타일, 픽처 및 GOP 중 적어도 하나로 상기 비선형 필터의 연산 파라미터를 전환해도 된다.
또, 본 개시된 제9 양태(1-4-1)에 따른 방법에서는, 제8 양태에 따른 방법에 있어서, 시퀀스 선두, GOP 선두, 및 픽처 선두 중 적어도 어느 하나로 상기 비선형 필터의 연산 파라미터를 부호화 또는 복호하고, 상기 비선형 필터 사용시에는 상기 연산 파라미터 중의 적어도 하나를 식별자에 의해 지정하여 사용해도 된다.
또, 본 개시된 제10 양태(1-5)에 따른 방법에서는, 제1 양태에 따른 방법에 있어서, 상기 비선형 필터의 유효/무효 정보를 부호화 또는 복호해도 된다.
또, 본 개시된 제11 양태(1-5-1)에 따른 방법에서는, 제10 양태에 따른 방법에 있어서, 프로파일에 의해서 상기 비선형 필터의 유효/무효 정보를 전환해도 된다.
또, 본 개시된 제12 양태(1-5-2)에 따른 방법에서는, 제10 양태에 따른 방법에 있어서, 저지연 요구가 있는 어플리케이션에서는 상기 비선형 필터를 무효로 해도 된다.
또, 본 개시된 제13 양태(1-6)에 따른 방법에서는, 제1 양태에 따른 방법에 있어서, 상기 비선형 필터의 모드를 복수 구비하고, 어느 모드를 사용하는지를 나타내는 정보를 부호화 또는 복호하고, 혹은 부호열 내의 정보로부터 어느 모드를 사용하는지를 나타내는 정보를 추출해도 된다.
여기서, 본 개시된 제14 양태(2)에 따른 화상의 부호화 또는 복호의 방법에서는, 인트라 예측에 이용하는 연산 파라미터를 부호화 또는 복호한다.
또, 본 개시된 제15 양태(2-1)에 따른 방법에서는, 제14 양태에 따른 방법에 있어서, 상기 연산 파라미터는 선형 필터 및 비선형 필터 중 어느 하나의 연산 파라미터여도 된다.
또, 본 개시된 제16 양태(2-2)에 따른 방법에서는, 제14 양태에 따른 방법에 있어서, 상기 연산 파라미터를 이용한 인트라 예측은 단층 또는 복수층의 뉴럴 네트워크를 포함하는 구성이며, 연산 파라미터로서 적어도 노드간의 가중 계수를 부호화 또는 복호해도 된다.
또, 본 개시된 제17 양태(2-2-1)에 따른 방법에서는, 제16 양태에 따른 방법에 있어서, 부호화 또는 복호하는 상기 연산 파라미터는 계층수 또는 노드수의 정보를 포함해도 된다.
또, 본 개시된 제18 양태(2-2-1-1)에 따른 방법에서는, 제17 양태에 따른 방법에 있어서, 프로파일에 의해 계층수 또는 노드수의 최대치를 규정해도 된다.
또, 본 개시된 제19 양태(2-3)에 따른 방법에서는, 제14 양태에 따른 방법에 있어서, 고정 파라미터의 인트라 예측과 상기 연산 파라미터에 의한 인트라 예측 중 어느 인트라 예측을 사용하는지 하는 전환 정보를 부호화 또는 복호하고, 그 정보에 따라서 고정 파라미터의 인트라 예측과 상기 연산 파라미터에 의한 인트라 예측 중 어느 인트라 예측을 사용하는지를 전환해도 좋다.
또, 본 개시된 제20 양태(2-3-1)에 따른 방법에서는, 제19 양태에 따른 방법에 있어서, 복수의 모드 중에서 1개 혹은 복수의 모드를, 상기 연산 파라미터를 이용한 인트라 예측의 모드로 하고, 그 모드를 사용하는 경우는 상기 연산 파라미터를 이용한 인트라 예측에 의해서 대상 화상을 부호화 또는 복호해도 된다.
또, 본 개시된 제21 양태(2-4)에 따른 방법에서는, 제14 양태에 따른 방법에 있어서, 블록, 슬라이스, 타일, 픽처 및 GOP 중 적어도 하나로 인트라 예측의 상기 연산 파라미터를 전환해도 된다.
또, 본 개시된 제22 양태(2-4-1)에 따른 방법에서는, 제21 양태에 따른 방법에 있어서, 시퀀스 선두, GOP 선두, 및 픽처 선두 중 적어도 어느 하나로 인트라 예측의 상기 연산 파라미터를 부호화 또는 복호하고, 연산 파라미터를 이용한 인트라 예측시에는, 상기 부호화 또는 복호한 연산 파라미터 중의 적어도 하나를 식별자에 의해 지정하여 사용해도 된다.
또, 본 개시된 제23 양태(2-5)에 따른 방법에서는, 제14 양태에 따른 방법에 있어서, 상기 연산 파라미터를 이용한 인트라 예측의 유효/무효 정보를 부호화 또는 복호해도 된다.
또, 본 개시된 제24 양태(2-5-1)에 따른 방법에서는, 제23 양태에 따른 방법에 있어서, 프로파일에 의해서 상기 연산 파라미터를 이용한 인트라 예측의 유효/무효 정보를 전환해도 된다.
또, 본 개시된 제25 양태(2-5-2)에 따른 방법에서는, 제23 양태에 따른 방법에 있어서, 저지연 요구가 있는 어플리케이션에서는 상기 연산 파라미터를 이용한 인트라 예측을 무효로 해도 된다.
또, 본 개시된 제26 양태(2-6)에 따른 방법에서는, 제14 양태에 따른 방법에 있어서, 상기 연산 파라미터를 이용한 인트라 예측의 모드를 복수 구비하고, 어느 모드를 사용하는지를 나타내는 정보를 부호화 또는 복호하고, 혹은 부호열 내의 정보로부터 어느 모드를 사용하는지를 나타내는 정보를 추출해도 된다.
여기서, 본 개시된 제27 양태(3)에 따른 화상 부호화 방법에서는, 선형 필터 또는 비선형 필터의 연산 파라미터를 부호화하고, 그 연산 파라미터를 이용하여 대상 화상을 부호화하는 인코더에 있어서, 부호화 대상 화상을 교사 데이터로서 학습하여 상기 연산 파라미터를 결정한다.
또, 본 개시된 제28 양태(3-1)에 따른 화상 부호화 방법에서는, 제27 양태에 따른 화상 부호화 방법에 있어서, 상기 연산 파라미터를 이용하는 모드를 복수 구비하고, 부호화 대상 화상 또는 블록의 특징으로 모드마다의 학습 데이터를 결정하고, 모드마다 연산 파라미터를 결정해도 된다.
또, 본 개시된 제29 양태(3-2)에 따른 화상 부호화 방법에서는, 제27 양태에 따른 방법에 있어서, 부호화 대상 화상 중, 복잡성이 높은 영역만을 학습 데이터로서 사용해도 된다.
(실시의 형태 3)
<전체 구성>
도 35는, 본 실시의 형태에 있어서의 화상 부호화 장치의 구성을 나타내는 블록도이다.
본 실시의 형태에 있어서의 화상 부호화 장치(300)는, 실시의 형태 1에 있어서의 화상 부호화 장치(100)에 있어서의 변환부(103) 및 NN 파라미터 결정부(109A) 이외의 각 구성 요소를 구비한다. 또한, 화상 부호화 장치(300)는, 변환부(103) 및 NN 파라미터 결정부(109) 대신에 변환부(103A) 및 NN 파라미터 결정부(109A)를 구비함과 더불어 NN 처리 전환부(115)를 구비한다.
<동작(전체), 동작(블록 부호화 플로우)>
화상 부호화 장치(300)에 의한 화상 부호화의 전체의 플로우와 블록 부호화의 플로우란, 실시의 형태 1에 있어서의 도 2 및 도 3의 각각에 나타내는 플로우와 거의 동일하다. 단, 화상 부호화 장치(300)에 있어서의 블록 분할부(101)는, 도 2에 있어서의 블록 분할(S104)에 있어서, 입력 화상을 4×4 블록, 8×8 블록, 16×16 블록, 및 32×32 블록 등의 여러종류의 사이즈의 블록으로 분할한다. 블록 분할부(101)는, 입력 화상 내의 오브젝트의 사이즈 또는 화소치의 복잡성 등의 특징을 이용하여, 어느 하나의 사이즈의 블록으로 분할한다. 또, 화상 부호화 장치(300)에 있어서 실험적으로 예측 또는 가변길이 부호화를 실시하고, 블록 분할부(101)는 부호화 성능이 좋은 사이즈의 블록으로 분할해도 된다. 화상 부호화 장치(300)는, 예측 등을 포함하는 블록 부호화를, 복수 종류의 사이즈의 블록에 대해서 실시한다.
<동작(인트라 예측 블록 생성 플로우)>
도 36은, 인트라 예측부(110) 및 NN 처리 전환부(115)에 의한 인트라 예측 블록 생성의 상세를 나타내는 플로우 차트이다.
실시의 형태 3에 있어서의 인트라 예측부(110)에 의한 인트라 예측 블록 생성의 플로우는, 거의 실시의 형태 1의 도 4에 나타내는 플로우와 동일하지만, 본 실시의 형태와 실시의 형태 1과 상이한 것은, NN 인트라 예측(S143)을 행하는 조건이다. 실시의 형태 3에서는, 인트라 예측부(110)는, NN 처리 전환부(115)에 의한 제어에 의해서, 예측 블록 사이즈가 4×4인 경우 또한, 휘도 성분에 대한 예측으로밖에, NN 인트라 예측부(110a)에 의한 NN 인트라 예측을 실시하지 않는다(S277, S278). 그렇지 않은 경우는, 인트라 예측부(110)는, 항상 고정 인트라 예측부(110b)에 의한 고정 인트라 예측을 실시한다. 이와 같이, NN 처리 전환부(115)는, 예측 블록 사이즈가 4×4인지 여부를 판정함과 함께(S277), 예측 대상이 휘도 성분인지 여부를 판정한다(S278). 그리고, NN 처리 전환부(115)는, 예측 블록 사이즈가 4×4인 경우 또한, 휘도 성분에 대한 예측의 경우에만, 인트라 예측부(110)에 대해서 NN 인트라 예측으로의 전환을 지시한다.
<동작(인터 예측 블록 생성 플로우)>
도 37은, 인터 예측부(111) 및 NN 처리 전환부(115)에 의한 인터 예측 블록 생성의 상세를 나타내는 플로우 차트이다.
실시의 형태 3에 있어서의 인터 예측부(111)에 의한 인터 예측 블록 생성의 플로우는, 거의 실시의 형태 1의 도 5에 나타내는 플로우와 동일하지만, 본 실시의 형태와 실시의 형태 1과 상이한 것은, NN 인터 예측(S153)을 행하는 조건이다. 실시의 형태 3에서는, 인터 예측부(111)는, NN 처리 전환부(115)에 의한 제어에 의해서, 휘도 성분에 대한 예측으로 밖에, NN 인터 예측부(111a)에 의한 NN 인터 예측을 실시하지 않는다(S288). 그렇지 않은 경우는, 인터 예측부(111)는, 항상 고정 인터 예측부(111b)에 의한 고정 인터 예측을 실시한다.
이와 같이, NN 처리 전환부(115)는, 예측 대상이 휘도 성분인지 여부를 판정한다(S288). 그리고, NN 처리 전환부(115)는, 휘도 성분에 대한 예측의 경우에만, 인터 예측부(111)에 대해서 NN 인터 예측으로의 전환을 지시한다.
<동작(루프 내 필터 플로우)>
도 38은, 루프 내 필터부(113) 및 NN 처리 전환부(115)에 의한 루프 내 필터의 상세를 나타내는 플로우 차트이다.
실시의 형태 3에 있어서의 루프 내 필터부(113)에 의한 루프 내 필터의 플로우는, 거의 실시의 형태 1의 도 6에 나타내는 플로우와 동일하지만, 본 실시의 형태와 실시의 형태 1에서 상이한 것은, NN 루프 내 필터(S163)를 행하는 조건이다. 실시의 형태 3에서는, 루프 내 필터부(113)는, NN 처리 전환부(115)에 의한 제어에 의해서, 휘도 성분에 대한 루프 내 필터로밖에, NN 루프 내 필터부(113a)에 의한 NN 루프 내 필터를 실시하지 않는다(S298). 그렇지 않은 경우는, 루프 내 필터부(113)는, 항상 고정 루프 내 필터부(113b)에 의한 고정 루프 내 필터를 실시한다.
이와 같이, NN 처리 전환부(115)는, 예측 대상이 휘도 성분인지 여부를 판정한다(S298). 그리고, NN 처리 전환부(115)는, 휘도 성분에 대한 예측의 경우에만, 루프 내 필터부(113)에 대해서 NN 루프 내 필터로의 전환을 지시한다.
<동작(주파수 변환 플로우)>
도 39는, 변환부(103A)에 의한 주파수 변환의 상세를 나타내는 플로우 차트이다.
우선, 변환부(103A)는, 예측 블록 결정(도 3의 S123)에서 선택한 예측 블록이, NN 인트라 예측 혹은 NN 인터 예측에서 생성된 블록인지 어떤지를 판정한다(S301). 그리고, 어느 하나의 예측으로 생성된 블록이던 경우는, KL 변환부(103Aa)는, KL 변환(카르넨·레베 변환)에 의해서 주파수 변환을 행한다(S302). 그 이외의 경우는, 고정 변환부(103Ab)는, HEVC와 동일하게 이산 코사인 변환 등의 고정의 변환 행렬을 이용한 주파수 변환(고정 변환)을 행한다(S303). KL 변환은 변환 행렬을 화상마다 변경하는 변환이다.
<동작(NN 인트라 예측 파라미터 결정 플로우, NN 인터 예측 파라미터 결정 플로우, NN 루프 내 필터 파라미터 결정 플로우)>
도 40, 도 41, 도 42를 참조하면서, NN 파라미터 결정부(109A)의 처리에 대해서 설명한다.
도 40은, NN 인트라 예측 파라미터 결정부(109Aa)에 의한 NN 인트라 예측 파라미터 결정의 상세를 나타내는 플로우 차트이다. 도 41은, NN 인터 예측 파라미터 결정부(109Ab)에 의한 NN 인터 예측 파라미터 결정의 상세를 나타내는 플로우 차트이다. 도 42는, NN 루프 내 필터 파라미터 결정부(109Ac)에 의한 NN 루프 내 필터 파라미터 결정의 상세를 나타내는 플로우 차트이다.
실시의 형태 3에 있어서의 상기 각 파라미터 결정의 플로우는, 거의 실시의 형태 1의 도 7, 도 8, 및 도 9에 나타내는 플로우와 동일하지만, 본 실시의 형태와 실시의 형태 1에서는 학습 데이터에 사용하는 데이터가 상이하다. NN 인트라 예측 파라미터 결정부(109Aa)는, 도 40에 나타내는 바와 같이, NN 인트라 예측 파라미터 결정에 사용하는 학습 데이터로서 4×4 사이즈로 휘도 성분의 부호화 대상 블록을 클래스로 분류하여 학습한다(S311). 또, NN 인터 예측 파라미터 결정부(109Ab)는, 도 41에 나타내는 바와 같이, NN 인터 예측 파라미터 결정에 사용하는 학습 데이터로서 휘도 성분의 부호화 대상 블록을 대상으로 한다(S321, S323). 또, NN 루프 내 필터 파라미터 결정부(109Ac)는, NN 루프 내 필터 파라미터 결정에 사용하는 학습 데이터로서 휘도 성분의 부호화 대상 블록을 대상으로 한다(S331).
<신택스 구성>
실시의 형태 3에 있어서의 신택스 구성은, CU 신택스만 실시의 형태 1과 상이하다.
도 43은, 본 실시의 형태에 있어서의 CU 신택스를 나타내는 도면이다.
실시의 형태 3에서는, 가변길이 부호화부(105)는, NN 인트라 예측 및 고정 인트라 예측 중 어느 것을 사용할지 라는 정보(intra_pred_type)를, NN 인트라 예측이 유효(nn_intra_pred_enabled_flag가 1)하고 그리고 예측 블록 사이즈가 4×4인 경우만 부호화한다. 그렇지 않은 경우는, 화상 부호화 장치(300)는 고정 인트라 예측을 사용하도록 동작한다. 즉, 4×4의 예측 블록 사이즈가 아니면 NN 인트라 예측을 사용할 수 없도록 하고 있다. 또, fixed_intra_pred_mode_chroma는, 색차 성분의 고정 인트라 예측의 예측 모드를 나타내고, 색차 성분의 경우는 고정 인트라 예측의 모드 밖에 지정할 수 없도록 하고 있다.
또, nn_intra_pred_parameter_data()는, 4×4 사이즈의 예측 블록 그리고 휘도 성분용의 NN 인트라 예측용의 파라미터이며, 그 이외(8×8 사이즈 이상의 예측 블록 또는 색차 성분)용의 파라미터는 존재(부호화)하지 않는다.
또, nn_inter_pred_parameter_data()는, 휘도 성분용의 NN 인터 예측의 파라미터이고, nn_ilf_parameter_data()는, 휘도 성분용의 NN 루프 내 필터의 파라미터이며, 색차 성분용의 파라미터는 존재(부호화)하지 않는다.
<효과>
이상, 본 실시의 형태에 따르면, NN 인트라 예측에서 사용하는 파라미터의 부호량을 줄일 수 있다. 보다 구체적으로는, 4×4 사이즈의 예측 블록으로밖에 NN 인트라 예측을 실시하지 않는다. 즉, 8×8 사이즈 이상의 예측 블록에서는 NN 인트라 예측을 사용하지 않기 때문에, 그들용의 파라미터가 불필요해진다. 일반적으로 큰 예측 블록 사이즈는, 평탄한 영역에서 선택되는 경우가 많고, 그 경우는 고정 파라미터의 인트라 예측으로도 예측 잔차를 줄일 수 있는 경우가 많다. 그 때문에, 큰 예측 블록 사이즈에서는 작은 예측 블록 사이즈에 비해 NN 인트라 예측을 사용할 필요성이 적다. 또, 큰 예측 블록 사이즈에서는 인접하는 주변 화소수가 많기 때문에, 일반적으로 참조 화소수를 많게 하지 않으면 예측 정밀도를 높이기 어렵고, 참조 화소수가 많아지면 입력하는 노드수가 많아지므로 가중 계수 등의 NN 인트라 예측용의 파라미터량이 많아진다. 반대로 작은 예측 블록 사이즈는 복잡성이 높은 영역에서 선택되는 경우가 많고, 복잡성이 높은 영역에서는 고정 파라미터의 인트라 예측에서는 예측 오차가 커지기 쉽다. 또, 작은 예측 블록 사이즈에서는, 인접하는 주변 화소수가 적기 때문에, 적은 참조 화소로도 예측 정밀도를 높일 가능성이 있다. 이러한 것으로부터, 작은 예측 블록 사이즈에서만 NN 인트라 예측을 유효하게 하고, 작은 예측 블록 사이즈용의 파라미터만을 부호화하는 것에 의해서, 예측 성능의 저하를 억제하면서 파라미터 데이터량을 삭감할 수 있어 부호화 효율을 향상시킬 수 있다. 또, 큰 예측 블록 사이즈의 NN 인트라 예측이 불필요해지기 때문에, 그 파라미터를 결정하는 화상 부호화 장치(300)의 계산량(처리 시간)도 삭감할 수 있다.
또, NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터에서 사용하는 파라미터의 부호량을 줄일 수 있다. 보다 구체적으로는, 휘도 성분의 신호에 대해서 밖에 NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터를 실시하지 않는다. 즉, 색차 성분의 신호에는 NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터를 사용하지 않기 때문에, 그들용의 파라미터가 불필요해진다. 일반적으로 화상의 색차 성분의 복잡도는 작고, 고정 파라미터의 NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터로도, 예측 잔차를 줄일 수 있거나 노이즈를 삭감할 수 있거나 하는 경우가 많다. 그 때문에, 색차 성분은 휘도 성분에 비해 NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터를 사용할 필요성이 적다. 이것으로부터, 휘도 성분에서만 NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터를 유효하게 하고, 휘도 성분용의 파라미터만을 부호화하는 것에 의해서, 예측 정밀도의 저하나 노이즈 증가를 억제하면서 파라미터 데이터량을 삭감할 수 있고 부호화 효율을 향상시킬 수 있다. 또, 색차 성분의 NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터가 불필요하게 되므로, 그 파라미터를 결정하는 화상 부호화 장치(300)의 계산량(처리 시간)도 삭감할 수 있다.
또, NN 인트라 예측 또는 NN 인터 예측을 이용한 경우는 고정의 예측을 이용한 경우와는 예측 잔차의 경향이 상이하다. 예를 들면, 고정 인트라 예측을 이용한 경우에는 주변 화소에 존재하지 않는 오브젝트가 부호화 대상 블록 내에 출현했을 경우에 급격하게 예측 오차가 커지는 케이스가 있다. 그러나, NN 인트라 예측에서는 그러한 케이스도 커버할 수 있도록 뉴럴 네트워크를 구축해 두면, 급격하게 예측 오차가 커지는 케이스는 적다. 그 때문에, NN 인트라 예측 또는 NN 인터 예측을 이용한 경우에는 주파수 변환 방식을 전환하고, NN의 예측을 이용한 경우에는 그 예측 잔차에 적합한 방식의 변환을 이용하는 것에 의해서 부호화 효율을 향상시킬 수 있다.
또한, 본 실시의 형태에서는 KL 변환을 이용하고 있지만, 거기에 한정하지 않고 NN 인트라 예측 또는 NN 인터 예측을 이용한 경우에 고정의 예측을 이용했을 때와는 상이한 변환 방법을 사용하면 되고, 예를 들면 고정의 변환 행렬을 이용한 변환이어도 된다. 또, KL 변환을 이용하는 등, 그 변환에서 이용하는 변환 행렬 등의 파라미터를 별도 부호화해도 된다. 또, NN 인트라 예측 또는 NN 인터 예측을 이용한 경우에 변환을 전환하도록 하고 있지만, NN 인트라 예측을 이용한 경우만 전환하도록 해도 되고, NN 인터 예측을 이용한 경우만 전환하도록 해도 된다.
또, 4×4의 예측 블록 사이즈 때에만 NN 인트라 예측을 이용하도록 하고 있지만, 거기에 한정하지 않고 예를 들면 8×8 이하의 사이즈에서는 NN 인트라 예측을 허가하고, 16×16 이상의 사이즈에서는 NN 인트라 예측을 금지로 해도 된다.
또한, 본 실시의 형태에 있어서의 역변환부(106)는, 변환부(103A)의 변환에 대응하는 역변환을 행한다.
(실시의 형태 4)
<전체 구성>
도 44는, 본 실시의 형태에 있어서의 화상 복호 장치의 구성을 나타내는 블록도이다.
본 실시의 형태에 있어서의 화상 복호 장치(400)는, 실시의 형태 2에 있어서의 화상 복호 장치(200)에 있어서의 역변환부(203) 이외의 각 구성 요소를 구비한다. 또한, 화상 복호 장치(400)는, 역변환부(203) 대신에 역변환부(203A)를 구비함과 함께 NN 처리 전환부(210)를 구비한다.
<동작(전체), 동작(블록 복호 플로우)>
화상 복호 장치(400)에 의한 화상 복호의 전체 플로우와 블록 복호의 플로우는, 실시의 형태 2에 있어서의 도 30 및 도 31에 나타내는 플로우와 거의 동일하다. 단, 화상 복호 장치(400)에 있어서의 복호 대상 블록에는, 4×4 블록, 8×8 블록, 16×16 블록, 및 32×32 블록 등의 여러 종류의 사이즈의 블록이 있다. 화상 복호 장치(400)는, 블록 사이즈를, 부호열 내에 있는 정보를 이용하여 결정한다. 또, 화상 복호 장치(400)는, 예측 등을 포함하는 블록 복호를, 복수 종류의 사이즈의 블록에 대해서 실시한다.
<동작(인트라 보상 블록 생성 플로우)>
도 45는, 인트라 보상부(205) 및 NN 처리 전환부(210)에 의한 인트라 보상 블록 생성의 상세를 나타내는 플로우 차트이다.
실시의 형태 4에 있어서의 인트라 보상부(205)에 의한 인트라 보상 블록 생성의 플로우는, 거의 실시의 형태 2의 도 32에 나타내는 플로우와 동일하지만, 본 실시의 형태와 실시의 형태 2에서 상이한 것은, NN 인트라 보상(S243)을 행하는 조건이다. 실시의 형태 4에서는, 인트라 보상부(205)는, NN 처리 전환부(210)에 의한 제어에 의해서, 예측 블록 사이즈가 4×4인 경우 그리고, 휘도 성분에 대한 보상으로 밖에, NN 인트라 보상부(205a)에 의한 NN 인트라 보상을 실시하지 않는다(S341, S342). 그렇지 않은 경우는, 인트라 보상부(205)는, 항상 고정 인트라 보상부(205b)에 의한 고정 인트라 보상을 실시한다. 이와 같이, NN 처리 전환부(210)는, 예측 블록 사이즈가 4×4인지 여부를 판정함과 더불어(S341), 보상 대상이 휘도 성분인지 여부를 판정한다(S342). 그리고, NN 처리 전환부(210)는, 예측 블록 사이즈가 4×4인 경우 또한, 휘도 성분에 대한 보상의 경우에만, 인트라 보상부(205)에 대해서 NN 인트라 보상으로의 전환을 지시한다.
<동작(인터 보상 블록 생성 플로우)>
도 46은, 인터 보상부(206) 및 NN 처리 전환부(210)에 의한 인터 보상 블록 생성의 상세를 나타내는 플로우 차트이다.
실시의 형태 4에 있어서의 인터 보상부(206)에 의한 인터 보상 블록 생성의 플로우는, 거의 실시의 형태 2의 도 33에 나타내는 플로우와 동일하지만, 본 실시의 형태와 실시의 형태 2에서 상이한 것은, NN 인터 보상(S253)을 행하는 조건이다. 실시의 형태 4에서는, 인터 보상부(206)는, NN 처리 전환부(210)에 의한 제어에 의해서, 휘도 성분에 대한 보상으로 밖에, NN 인터 보상부(206a)에 의한 NN 인터 보상을 실시하지 않는다(S351). 그렇지 않은 경우는, 인터 보상부(206)는, 항상 고정 인터 보상부(206b)에 의한 고정 인터 보상을 실시한다. 이와 같이, NN 처리 전환부(210)는, 보상 대상이 휘도 성분인지 여부를 판정한다(S351). 그리고, NN 처리 전환부(210)는, 휘도 성분에 대한 보상의 경우에만, 인터 보상부(206)에 대해서 NN 인터 보상으로의 전환을 지시한다.
<동작(루프 내 필터 플로우)>
도 47은, 루프 내 필터부(208) 및 NN 처리 전환부(210)에 의한 루프 내 필터의 상세를 나타내는 플로우 차트이다.
실시의 형태 4에 있어서의 루프 내 필터부(208)에 의한 루프 내 필터의 플로우는, 거의 실시의 형태 2의 도 34에 나타내는 플로우와 동일하지만, 본 실시의 형태와 실시의 형태 2에서 상이한 것은, NN 루프 내 필터(S263)를 행하는 조건이다. 실시의 형태 4에서는, 루프 내 필터부(208)는, NN 처리 전환부(210)에 의한 제어에 의해서, 휘도 성분에 대한 루프 내 필터로 밖에, NN 루프 내 필터부(208a)에 의한 NN 루프 내 필터를 실시하지 않는다(S361). 그렇지 않은 경우는, 루프 내 필터부(208)는, 항상 고정 루프 내 필터부(208b)에 의한 고정 루프 내 필터를 실시한다. 이와 같이, NN 처리 전환부(210)는, 루프 내 필터의 대상이 휘도 성분인지 여부를 판정한다(S361). 그리고, NN 처리 전환부(210)는, 휘도 성분에 대한 루프 내 필터인 경우에만, 루프 내 필터부(208)에 대해서 NN 루프 내 필터로의 전환을 지시한다.
<동작(주파수 변환 플로우)>
도 48은, 역변환부(203A)에 의한 역주파수 변환의 상세를 나타내는 플로우 차트이다.
우선, 역변환부(203A)는, 부호열 내에 있는 정보로부터, 예측 블록이 NN 인터 예측 또는 NN 인트라 예측으로 생성되었는지를 판정한다(S371). 그리고, 어느 하나의 예측으로 생성된 블록이던 경우는, 역KL 변환부(203Aa)는, 역KL 변환(카르넨·레베 변환)에 의해서 역주파수 변환을 행한다(S372). 그 이외의 경우는, 역고정 변환부(203Ab)는, HEVC와 동일하게 역이산 코사인 변환 등의 고정의 변환 행렬을 이용한 역주파수 변환(역고정 변환)을 행한다(S373).
<효과>
실시의 형태 3와 동일하기 때문에, 설명을 생략한다.
<실시의 형태 3 및 4의 정리>
본 개시된 제1 양태(1)에 따른 화상의 부호화 또는 복호의 방법에서는, 인트라 예측에 이용하는 연산 파라미터를 부호화 또는 복호한다.
또, 본 개시된 제2 양태(1-1)에 따른 방법에서는, 제1 양태에 따른 방법에 있어서, 인트라 예측의 예측 블록 사이즈가 특정 사이즈 이하인 경우만 상기 연산 파라미터를 이용한 인트라 예측을 이용하고, 그 이외의 예측 블록 사이즈의 경우는 고정 파라미터의 인트라 예측을 행해도 된다.
또, 본 개시된 제3 양태(1-2)에 따른 방법에서는, 제1 양태에 따른 방법에 있어서, 고정 파라미터의 인트라 예측과 상기 연산 파라미터에 의한 인트라 예측을 전환할 수 있는 인코더 또는 디코더에 있어서, 상기 연산 파라미터에 의한 인트라 예측을 사용한 경우는 변환 또는 역변환 방법을 전환해도 된다.
또, 본 개시된 제4 양태(1-2-1)에 따른 방법에서는, 제3 양태에 따른 방법에 있어서, 상기 연산 파라미터에 의한 인트라 예측을 사용한 경우는 변경 가능한 변환 행렬을 이용한 변환 또는 역변환을 행해도 된다.
여기서, 본 개시된 제5 양태(2)에 따른 화상의 부호화 또는 복호의 방법에서는, 비선형 필터의 연산 파라미터를 부호화 또는 복호하고, 그 연산 파라미터를 이용하여 대상 화상을 부호화 또는 복호한다.
또, 본 개시된 제6 양태(2-1)에 따른 방법에서는, 제5 양태에 따른 방법에 있어서, 휘도 성분용의 연산 파라미터만을 부호화 또는 복호하고, 휘도 성분은 상기 비선형 필터를 사용하며, 색차 성분은 선형 필터를 사용하여 대상 화상을 부호화 또는 복호해도 된다.
또, 본 개시된 제7 양태(2-2)에 따른 방법에서는, 제5 양태에 따른 방법에 있어서, 인트라 예측 및 인터 예측 중 적어도 하나에서 상기 비선형 필터를 사용하고, 예측 블록이 비선형 필터를 이용하여 작성한 경우, 변환 또는 역변환 방법을 전환해도 된다.
또, 본 개시된 제8 양태(2-2-1)에 따른 방법에서는, 제7 양태에 따른 방법에 있어서, 예측 블록이 비선형 필터를 이용하여 작성한 경우는, 변경 가능한 변환 행렬을 이용한 변환 또는 역변환을 행해도 된다.
(실시의 형태 5)
<전체 구성>
도 49는, 본 실시의 형태에 있어서의 화상 부호화 장치의 구성을 나타내는 블록도이다.
본 실시의 형태에 있어서의 화상 부호화 장치(500)는, 실시의 형태 1에 있어서의 화상 부호화 장치(100)의 각 구성 요소를 구비하고, 또한, NN 파라미터 부호화부(120)를 구비한다.
<동작(전체)>
도 59는, 화상 부호화 장치(500)에 의한 화상 부호화의 전체의 처리를 나타내는 플로우 차트이다.
실시의 형태 5에서는, 화상 부호화 장치(500)는, 실시의 형태 1의 도 2에 나타내는 플로우에 포함되는 각 단계 S101~S112를 행하고, 또한, 단계 S491, S492, S493, 및 S494를 행한다. 즉, 실시의 형태 5에서는, 화상 부호화 장치(500)는, NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터 중 어느 하나의 파라미터 전환 타이밍 시(S491)에, 단계 S492~S494 중 어느 하나의 단계를 행한다. 단계 S492~S494의 각각에서는, NN 파라미터 부호화부(120)가, 실시의 형태 1과는 상이한 특수한 NN 인트라 예측 파라미터 부호화, NN 인터 예측 파라미터 부호화, 또는 NN 루프 내 필터 파라미터 부호화를 행한다.
<동작(NN 인트라 예측 파라미터 부호화 플로우)>
도 50은, 도 59의 단계 S492에 있어서의 NN 인트라 예측 파라미터 부호화의 상세를 나타내는 플로우 차트이다.
우선, NN 파라미터 부호화부(120)는, NN 인트라 예측의 예측 모드수(nn_intra_mode_num)를 부호화한다(S401).
다음에, NN 파라미터 부호화부(120)는, 각 예측 모드에서, 단계 S403~S407의 처리를 행한다(S402). 여기에서 k는, 처리 대상의 예측 모드를 나타내고, 0부터 「예측 모드수-1」까지 1씩 증가하는 변수이다.
구체적으로는, NN 파라미터 부호화부(120)는, 예측 모드 k의 파라미터 참조 타입과 참조하는 파라미터 등을 결정한다(S407). 파라미터 참조 타입은, NN 인트라 예측 파라미터를 어떻게 부호화하는지 하는 정보이며, 3개의 타입이 있다. 1번째의 타입은, 다른 예측 모드의 파라미터를 참조하여, 그것과의 차분을 부호화하는 방법이다(모드 참조 타입). 2번째의 타입은, 1개 전의 계층 또는 1개 전의 노드의 정보를 참조하여, 그것과의 차분을 부호화하는 방법이다(직전 참조 타입). 3번째의 타입은 아무것도 참조하지 않고, 값을 직접 부호화하는 방법이다(비참조 타입). 또, 모드 참조 타입에서는, 이미 부호화한 예측 모드의 파라미터를 참조할 뿐만 아니라, 미리 규정되고 있는 프리셋의 NN 인트라 예측 파라미터를 참조할 수도 있다. 또, 규정되고 있는 NN 인트라 예측 파라미터는 복수 종류 존재하고, 선택적으로 사용할 수 있다. 단계 S407에서는, NN 파라미터 부호화부(120)는, 파라미터 참조 타입을 결정함과 함께, 모드 참조 타입의 경우는, 어느 예측 모드의 파라미터를 참조하는가 하는 참조 모드 정보(nn_intra_param_ref_mode)와, 프리셋을 사용하는가 하는 정보(프리셋 사용 모드 ON/OFF)와, 프리셋의 파라미터를 사용하는 경우는 어느 프리셋을 사용하는가 하는 프리셋 ID(nn_intra_param_ref_preset_id)를 정한다. 정하는 방법은, 부호화하는 NN 인트라 예측 파라미터와 가장 파라미터가 유사한 것을 선택해도 되고, 실험적으로 부호화해 보아 부호량이 가장 작은 것을 선택해도 된다.
다음에, NN 파라미터 부호화부(120)는, 단계 S407에서 결정한 예측 모드 k의 파라미터 참조 타입(nn_intra_param_ref_type[k])을 부호화한다(S403).
다음에, NN 파라미터 부호화부(120)는, 파라미터 참조 타입이 비참조 타입인지 여부를 판정하고(S404), 비참조 타입의 경우에는, 파라미터 비참조 타입 부호화를 실시한다(S405). 한편, 비참조 타입이 아닌 경우(모드 참조 타입 또는 직전 참조 타입의 경우)에는, NN 파라미터 부호화부(120)는, 파라미터 참조 타입 부호화를 실시한다(S406).
또한, 참조 모드 정보에 의해서 나타나는, 참조하는 파라미터를 포함하는 모드(참조 모드)는, 예측 모드 k와 동일한 구조에 한정된다. 즉, 참조 모드와 예측 모드 k는, 동일한 계층수, 동일한 노드수, 동일한 참조 화소수, 및 동일한 출력 화소수를 가진다. 또, 이 참조 모드를 나타내는 참조 모드 정보(nn_intra_param_ref_mode)는, 예측 모드 k로부터 몇 개전의 모드가 참조 모드인지를 나타내고, 그 디폴트치는 0이다.
<동작(파라미터 비참조 타입 부호화 플로우)>
도 51은, 도 50의 단계 S405에 있어서의 파라미터 비참조 타입 부호화의 상세를 나타내는 플로우 차트이다.
우선, NN 파라미터 부호화부(120)는, 예측 모드 k의 계층수(nn_intra_layer_num[k])를 부호화하고(S411), 이후의 처리를 계층수만큼 반복한다(S412). 여기서 i는, 처리 대상의 계층을 나타내고, 0부터 「계층수-1」까지 1씩 증가하는 변수이다.
다음에, NN 파라미터 부호화부(120)는, 계층 i가 최초의 계층인지 여부를 판정하고(S413), 최초의 계층이면, 입력 노드수(input_node_num)에 참조 화소수를 설정한다(S414). 한편, 최초의 계층이 아니면, NN 파라미터 부호화부(120)는, 입력 노드수(input_node_num)에 직전의 계층의 노드수(nn_intra_node_num[k][i-1])를 설정한다(S415). 도 13을 예로 설명하면, 계층 i가 n[k][0][x]의 계층(i=0)이던 경우는, NN 파라미터 부호화부(120)는, 입력 노드수에 참조 화소수인 11을 설정한다. 만약 계층 i가 n[k][1][x]의 계층(i=1)이던 경우는, NN 파라미터 부호화부(120)는, 직전의 계층의 노드수인 4를 입력 노드수로 설정한다. 입력 노드수는 이후의 처리에서 사용하는 변수이다.
다음에, NN 파라미터 부호화부(120)는, 계층 i가 최후의 계층인지 여부를 판정하고(S416), 최후의 계층인 경우는, 노드수(nn_intra_node_num[k][i])에 예측 화소수(출력 화소수)(도 13의 예에서는 16)를 설정한다(S417). 한편, 최후의 계층이 아닌 경우는, NN 파라미터 부호화부(120)는 노드수를 부호화한다(S418).
다음에, NN 파라미터 부호화부(120)는, 노드수만큼의 바이어스치(nn_intra_bias[k][i][j])를 부호화하고(S419, S420), 노드수와 입력 노드수만큼의 가중 계수(nn_intra_w[k][i][j][m])를 부호화한다(S421, S422). 여기서 j는, 처리 대상의 노드를 나타내고, 0부터 「계층 i의 노드수-1」까지 1씩 증가하는 변수이다. 또, m은, 처리 대상의 입력 노드를 나타내고, 0부터 「계층 i의 노드 j의 입력 노드수-1」까지 1씩 증가하는 변수이다. 입력 노드란, 처리 대상의 노드에 값을 입력하는 노드이며, 예를 들면 도 13의 n[k][0][0]의 입력 노드는, 참조 화소 0~참조 화소 11의 12개 있다.
<동작(파라미터 참조 타입 부호화 플로우)>
도 52는, 도 50의 단계 S406에 있어서의 파라미터 참조 타입 부호화의 상세를 나타내는 플로우 차트이다.
우선, NN 파라미터 부호화부(120)는, 예측 모드 k의 파라미터 참조 타입이 모드 참조 타입인지 여부를 판정하고(S431), 모드 참조 타입이면, 다시, 프리셋 사용 모드인지 어떤지를 판정하고(S432), 프리셋 사용 모드이면, 참조 모드 델타에 0을 설정한다(S433). 그리고, NN 파라미터 부호화부(120)는, 참조 모드 델타를 부호화하고(S436), 사용하는 프리셋의 ID를 부호화한다(S436, S437). 만약, 프리셋 사용 모드가 아닌 경우는, NN 파라미터 부호화부(120)는, k부터 참조 모드(nn_intra_param_ref_mode)를 감산하여 참조 모드 델타를 산출한 후(S434), 참조 모드 델타를 부호화한다(S435). 여기서 설명한 대로, 프리셋 사용 모드가 ON인지 OFF인지는 직접 부호화되지 않는다. 화상 복호 장치는, 참조 모드 델타가 0이면 프리셋 사용 모드를 ON이라고 판정할 수 있다. 또, 파라미터 참조 타입이 직전 참조 타입이면(S431의 No), NN 파라미터 부호화부(120)는, 단계 S432~S437의 처리를 행하지 않는다.
다음에, NN 파라미터 부호화부(120)는, 파라미터 참조 타입으로 계층수를 부호화한다(S440). 상세한 것은 후술한다.
다음에, NN 파라미터 부호화부(120)는, 계층수의 분만큼 이하의 처리를 반복한다(S441). 여기서, i는, 처리 대상의 계층을 나타내고, 0부터 「계층수-1」까지 1씩 증가하는 변수이다.
구체적으로는, NN 파라미터 부호화부(120)는, 계층 i가 최초의 계층인지 여부를 판정하고(S442), 최초의 계층이면, 입력 노드수(input_node_num)에 참조 화소수를 설정한다(S443). 한편, 최초의 계층이 아니면, NN 파라미터 부호화부(120)는 입력 노드수(input_node_num)에 직전의 계층의 노드수(nn_intra_node_num[k][i-1])를 설정한다(S444).
다음에, NN 파라미터 부호화부(120)는, 계층 i가 최후의 계층인지 여부를 판정하고(S445), 최후의 계층인 경우는, 노드수(nn_intra_node_num[k][i])에 예측 화소수(출력 화소수)를 설정한다(S446). 한편, 최후의 계층이 아닌 경우는, NN 파라미터 부호화부(120)는, 파라미터 참조 타입으로 노드수를 부호화한다(S447). 노드수의 부호화에 대한 상세는 후술한다.
다음에, NN 파라미터 부호화부(120)는, 노드수만큼의 바이어스치를 부호화하고(S448, S449), 노드수와 입력 노드수만큼의 가중 계수를 파라미터 참조 타입으로 부호화한다(S450, S451). 여기서, j는, 처리 대상의 노드를 나타내고, 0부터 「계층 i의 노드수-1」까지 1씩 증가하는 변수이다. 또, m은, 처리 대상의 입력 노드를 나타내고, 0부터 「계층 i의 노드 j의 입력 노드수-1」까지 1씩 증가하는 변수이다. 단계 S449에 있어서의 바이어스치의 부호화(파라미터 참조 타입 바이어스치 부호화)와, 단계 S451에 있어서의 가중 계수의 부호화(파라미터 참조 타입 가중 계수 부호화)에 대해서는 후술한다.
<동작(파라미터 참조 타입 계층수 부호화 플로우)>
도 53은, 도 52의 단계 S440에 있어서의 파라미터 참조 타입 계층수 부호화의 상세를 나타내는 플로우 차트이다.
NN 파라미터 부호화부(120)는, 예측 모드 k의 파라미터 참조 타입이 모드 참조 타입인지 여부를 판정하고(S431), 모드 참조 타입이 아니면(직전 참조 타입이면) 예측 모드 k의 계층수를 부호화한다(S465). 모드 참조 타입이면, 화상 복호 장치는, 참조하는 예측 모드의 파라미터 또는 프리셋의 파라미터로부터 계층수를 취득할 수 있으므로, NN 파라미터 부호화부(120)는 그 계층수를 부호화는 하지 않는다.
<동작(파라미터 참조 타입 노드수 부호화 플로우)>
도 54는, 도 52의 단계 S447에 있어서의 파라미터 참조 타입 노드수 부호화의 상세를 나타내는 플로우 차트이다.
NN 파라미터 부호화부(120)는, 예측 모드 k의 파라미터 참조 타입이 모드 참조 타입인지 여부를 판정하고(S431), 모드 참조 타입이 아니면(직전 참조 타입이면) 예측 모드 k의 계층 i의 노드수 델타를 부호화한다(S462~S465). 구체적으로는, NN 파라미터 부호화부(120)는, 계층 i가 최초의 계층인지 여부를 판정한다(S462). 여기서, 계층 i가 최초의 계층이면, NN 파라미터 부호화부(120)는, 참조 화소수로부터 예측 모드 k의 계층 i의 노드수를 감산하는 것에 의해서, 예측 모드 k의 계층 i의 노드수 델타를 산출하고(S463), 그 노드수 델타를 부호화한다(S465). 한편, 계층 i가 최초의 계층이 아니면, NN 파라미터 부호화부(120)는, 직전의 계층의 노드수로부터 예측 모드 k의 계층 i의 노드수를 감산하는 것에 의해서, 예측 모드 k의 계층 i의 노드수 델타를 산출하고(S464), 그 노드수 델타를 부호화한다(S465).
<동작(파라미터 참조 타입 바이어스치 부호화 플로우)>
도 55는, 도 52의 단계 S449에 있어서의 파라미터 참조 타입 바이어스치 부호화의 상세를 나타내는 플로우 차트이다.
NN 파라미터 부호화부(120)는, 참조 바이어스치로부터 예측 모드 k의 계층 i의 노드 j의 바이어스치를 감산하는 것에 의해서, 바이어스치 델타를 산출하고(S478), 그 값을 예측 모드 k의 계층 i의 노드 j의 바이어스치 델타로서 부호화한다(S479). 참조 바이어스치는 조건에 따라서 상이하다. 즉, NN 파라미터 부호화부(120)는, 예측 모드 k의 파라미터 참조 타입이 모드 참조 타입인지 여부를 판정하고(S431), 모드 참조 타입이면, 다시, 프리셋 사용 모드인지 어떤지를 판정한다(S432). 여기서, 파라미터 참조 타입이 모드 참조 타입이고 프리셋 사용 모드 ON의 경우이면, NN 파라미터 부호화부(120)는, 프리셋 ID의 프리셋에 있어서의 계층 i의 노드 j의 바이어스치를 참조 바이어스치로 설정한다(S473). 반대로, 파라미터 참조 타입이 모드 참조 타입이어도, 프리셋 사용 모드 OFF의 경우는, NN 파라미터 부호화부(120)는, 참조하는 예측 모드(참조 모드)에 있어서의 계층 i의 노드 j의 바이어스치를 참조 바이어스치로 설정한다(S474). 또, NN 파라미터 부호화부(120)는, 예측 모드 k의 파라미터 참조 타입이 직전 참조 타입인 경우에는, 노드 j가 계층 i에서 최초의 노드인지 여부를 판정하고(S475), 최초의 노드이면, 계층 i의 디폴트 바이어스치를 참조 바이어스치로 설정한다(S476). 한편, 최초의 노드이면, NN 파라미터 부호화부(120)는, 직전의 노드의 바이어스치를 참조 바이어스치로 설정한다(S477). 여기서, 최초의 노드란, 도 13에서 설명하면 n[k][x][0]의 노드이며, 각 계층에서 가장 위에 있는 노드이다. 또, 직전의 노드란, 도 13 상에서는 동일한 계층에서 하나 위에 있는 노드이며, n[k][x][1]의 직전의 노드는 n[k][x][0]이다. 또, 디폴트 바이어스치란 미리 규정해 둔 바이어스치이다.
<동작(파라미터 참조 타입 가중 계수 부호화 플로우)>
도 56은, 도 52의 단계 S451에 있어서의 파라미터 참조 타입 가중 계수 부호화의 상세를 나타내는 플로우 차트이다.
NN 파라미터 부호화부(120)는, 참조 가중 계수로부터, 예측 모드 k의 계층 i의 노드 j의 입력 노드 m의 가중 계수를 감산하는 것에 의해서, 가중 계수 델타를 산출하고(S488), 그 값을 예측 모드 k의 계층 i의 노드 j의 입력 노드 m의 가중 계수로서 부호화한다(S489). 참조 가중 계수는 조건에 따라서 상이하다. 즉, NN 파라미터 부호화부(120)는 예측 모드 k의 파라미터 참조 타입이 모드 참조 타입인지 여부를 판정하고(S431), 모드 참조 타입이면, 다시, 프리셋 사용 모드인지 어떤지를 판정한다(S432). 여기서, 파라미터 참조 타입이 모드 참조 타입이며, 프리셋 사용 모드 ON의 경우이면, NN 파라미터 부호화부(120)는, 프리셋 ID의 프리셋에 있어서의 계층 i의 노드 j의 입력 노드 m의 가중 계수를 참조 가중 계수로 설정한다(S483). 반대로, 파라미터 참조 타입이 모드 참조 타입이어도, 프리셋 사용 모드 OFF의 경우는, NN 파라미터 부호화부(120)는 참조하는 예측 모드(참조 모드)에 있어서의 계층 i의 노드 j의 입력 노드 m의 가중 계수를 참조 가중 계수로 설정한다(S484). 또, NN 파라미터 부호화부(120)는, 예측 모드 k의 파라미터 참조 타입이 직전 참조 타입인 경우에는, 입력 노드 m이 노드 j에서 최초의 입력 노드인지 여부를 판정하고(S485), 최초의 입력 노드이면, 계층 i의 노드 j의 디폴트 가중 계수를 참조 가중 계수로 설정한다(S486). 한편, 최초의 입력 노드가 아니면, NN 파라미터 부호화부(120)는, 직전의 입력 노드의 가중 계수를 참조 가중 계수로 설정한다(S487). 여기서, 최초의 입력 노드란, 도 13에서 설명하면 n[k][0][0]에 있어서는 참조 화소 0인 것이고, 입력 노드 중 맨 위에 있는 노드이다. 또, 직전의 입력 노드란, 도 13 상에서는 입력 노드중 하나 위에 있는 노드이며, n[k][0][0]에 있어서는 참조 화소 1의 직전의 입력 노드는 참조 화소 0이다. 또, 디폴트 가중 계수란 미리 규정해 둔 가중 계수이다.
<동작(NN 인터 예측 파라미터 부호화 플로우), 동작(NN 루프 내 필터 파라미터 부호화 플로우)>
도 59의 단계 S493 및 S494에 있어서의 NN 인터 예측 파라미터 부호화 및 NN 루프 내 필터 파라미터 부호화의 각각의 플로우는, 도 50~도 56에 나타내는 NN 인트라 예측 파라미터 부호화의 플로우와 동일하고, NN 인트라 예측을 NN 인터 예측 또는 NN 루프 내 필터로 바꿔 읽는 것만이므로 설명을 생략한다.
<신택스 구성>
본 실시의 형태에 있어서의 각 신택스는, 실시의 형태 1의 도 15~도 26에 나타내는 각 신택스 중 NN 인트라 예측의 파라미터 데이터의 신택스(도 19), NN 인터 예측의 파라미터 데이터의 신택스(도 20), 및 NN 루프 내 필터의 파라미터 데이터의 신택스(도 21)만이 상이하다. 본 실시의 형태에서는, 도 19~도 21에 나타내는 신택스 대신에, 도 57 및 도 58에 나타내는 신택스를 사용한다. 다른 신택스는 동일하다. 또한, Descriptor의 ae(v)는 컨택스트 적응형 2값 산술 부호화(CABAC)로 부호화하는 것을 나타낸다.
실시의 형태 5에서는 전술한 것처럼 NN 파라미터를 부호화하는 방법이 3가지 있고, 그 점이 실시의 형태 1과 상이하다. 도 57의 nn_intra_param_ref_type가 그 타입을 나타내는 정보이며, nn_intra_param_ref_type가 NN_INTRA_PARAM_NO_REF인 경우는 비참조 타입이며, NN 파라미터 부호화부(120)는, 실시의 형태 1과 동일하게 파라미터치 그 자체를 부호화한다. 또, nn_intra_param_ref_type가 NN_INTRA_PARAM_REF_MODE인 경우는 모드 참조 타입이며, NN 파라미터 부호화부(120)는, 참조하는 예측 모드 정보를 부호화하고, 참조하는 예측 모드의 파라미터치를 이용하여 NN 파라미터를 부호화한다. 또, nn_intra_param_ref_type가 그 이외의 경우는 직전 참조 타입이고, NN 파라미터 부호화부(120)는, 직전에 부호화한 노드의 값 또는 디폴트치를 이용하여 NN 파라미터(연산 파라미터)를 부호화한다. 또, 모드 참조 타입의 경우는, 미리 규정한 복수의 프리셋의 값을 사용할 수 있다. 모드 참조 타입의 경우, 참조하는 예측 모드(참조 모드)는, 처리 대상의 예측 모드치로부터의 차분(nn_intra_param_ref_mode_delta)으로 지정되고, 그 차분이 0인 경우는 프리셋 사용 모드인 것을 의미한다. 프리셋을 사용하는 경우는 nn_intra_param_ref_preset_id에 의해서 어느 프리셋을 사용하는지를 식별한다. 또, 파라미터를 참조하는 경우에도, NN 파라미터 부호화부(120)는 바이어스치 또는 가중 계수의 값을 카피하는 것이 아니라, 참조하는 값과의 차분(nn_intra_bias_delta, nn_intra_w_delta)을 부호화한다. 바이어스치 또는 가중 계수의 값이, 참조하는 파라미터, 프리셋, 또는 디폴트치와 다소 상이해도, 효율적으로 파라미터를 보낼 수 있다.
또한, NN 인터 예측 파라미터 또는 NN 루프 내 필터 파라미터의 신택스는 도 57 및 도 58에 나타내는 NN 인트라 예측 파라미터의 신택스와 동일하고, intra_pred를 inter_pred 또는 ilf로 바꿔 읽는 것만이므로 설명을 생략한다.
<효과>
이상, 본 실시의 형태에 의하면, NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터의 파라미터의 부호량을 줄일 수 있고, 부호화 효율을 향상시킬 수 있다. 보다 구체적으로는, 다른 예측 모드의 파라미터를 참조하고, 그것과의 차분을 부호화하는 것에 의해서 정보량을 삭감하고 있다. 이것은 NN의 파라미터는 예측 모드가 상이해도 값은 유사하다는 특징을 발견한 것에 기초하고 있다.
또, 다른 예측 모드의 파라미터뿐만 아니라, 미리 복수의 프리셋을 규정해 두고, 그들의 어느 하나와 유사한 파라미터의 경우는 그것과의 차분을 보내는 것에 의해서 부호량을 삭감하고 있다. 이 프리셋에는 범용적인 화상에 적용할 수 있는 파라미터를 규정해 두는 것에 의해서, 파라미터를 부호화하지 않아도 어느 정도의 부호화 효율을 실현할 수 있고, 부호화해야 하는 파라미터의 정보량을 줄일 수 있다.
또, 직전 참조 타입의 부호화 방법을 마련하여, 직전에 부호화한 파라미터와의 차분을 부호화하도록 하고, 파라미터의 부호량을 삭감하고 있다. 이것은 NN의 파라미터는 직전의 노드나 직전의 입력 노드와의 상관이 높다는 특징을 발견한 것에 의거하고 있다.
또, 최초의 노드 또는 입력 노드의 경우에는, 디폴트치로부터의 차분을 부호화하는 것에 의해서 부호량을 삭감하고 있다. 이것은 NN의 파라미터는 어느 정도, 값에 편향이 있어, 디폴트치를 마련한 쪽이 부호량을 줄일 수 있는 것을 발견한 것에 의거하고 있다.
또, 참조하는 예측 모드에 특정치를 지정한 경우는 프리셋의 파라미터를 참조하도록 전환하고 있고, 그렇게 하는 것에 의해서, 다른 예측 모드의 파라미터를 참조하는 것인지, 프리셋의 파라미터를 참조하는 것인지를 전환하기 위한 부호량을 줄이고 있다. 보다 구체적으로는, 참조 모드 델타가 0인 경우에는 프리셋의 파라미터를 참조하도록 하고 있다. 참조 모드 델타는 처리 대상의 예측 모드로부터의 차분에서 참조하는 예측 모드를 지정하는 변수이지만, 그것이 0이 되는 것은 이상한 케이스(에러)이다. 본 실시의 형태에서는 0이 될 수 없는 것을 이용하여, 0의 경우에는 다른 참조 방법으로 전환하는 것에 의해서 부호량을 유효 활용하고 있다.
또한, 본 실시의 형태에서는 컨택스트 적응형 2값 산술 부호화(CABAC)로 파라미터 정보를 부호화하지만, 그에 한정하는 것이 아니고 다른 가변길이 부호화 방법을 이용해도 된다. 예를 들면 골룸 부호화를 이용해도 된다.
또, 프리셋을 사용할지 어떨지의 정보를 참조 모드 델타가 0인지 어떤지에 의해서 판정하고 있지만, 그에 한정하는 것은 아니고 프리셋을 사용한다는 정보(예를 들면 도 57의 ref_preset_flag)를 별도로 부호화해도 된다.
또, 참조하는 예측 모드 또는 프리셋과의 차분을 부호화하고 있지만, 그에 한정하는 것은 아니고 차분 정보를 부호화하지 않고, 참조하는 예측 모드나 프리셋의 값을 그대로 카피하여 파라미터치로서 사용해도 된다.
또, 프리셋을 복수 구비하는 구성으로 하고 있지만, 그에 한정하는 것은 아니고 1개만으로 해도 된다. 그 경우는 어느 프리셋을 참조하는가 라는 식별자의 정보(예를 들면 도 57의 nn_intra_param_ref_preset_id)가 불필요해지는 것은 말할 필요도 없다.
(실시의 형태 6)
<전체 구성>
도 60은, 본 실시의 형태에 있어서의 화상 복호 장치의 구성을 나타내는 블록도이다.
본 실시의 형태에 있어서의 화상 복호 장치(600)는, 실시의 형태 2에 있어서의 화상 복호 장치(200)의 각 구성 요소를 구비하고, 또한, NN 파라미터 복호부(220)를 구비한다.
<동작(전체)>
도 68은, 화상 복호 장치(600)에 의한 화상 복호의 전체의 처리를 나타내는 플로우 차트이다.
실시의 형태 6에서는, 화상 복호 장치(600)는, 실시의 형태 2의 도 30에 나타내는 플로우에 포함되는 각 단계 S221~S228를 행하고, 또한, 단계 S601, S602, S603, 및 S604를 행한다. 즉, 실시의 형태 6에서는, 화상 복호 장치(600)는, NN 인트라 예측, NN 인터 예측, 및 NN 루프 내 필터 중 어느 하나의 파라미터 전환 타이밍 시(S601)에, 단계 S602~S604 중 어느 하나의 단계를 행한다. 단계 S602~S604의 각각에서는, NN 파라미터 복호부(220)가, 실시의 형태 2와는 상이한 특수한 NN 인트라 예측 파라미터 복호, NN 인터 예측 파라미터 복호, 또는 NN 루프 내 필터 파라미터 복호를 행한다.
<동작(NN 인트라 예측 파라미터 복호 플로우)>
도 61은, 도 68의 단계 S602에 있어서의 NN 인트라 예측 파라미터 복호의 상세를 나타내는 플로우 차트이다.
우선, NN 파라미터 복호부(220)는, NN 인트라 예측의 예측 모드수(nn_intra_mode_num)를 복호한다(S501).
다음에, NN 파라미터 복호부(220)는, 각 예측 모드에서, 단계 S503~S506의 처리를 행한다(S502). 여기서 k는, 처리 대상의 예측 모드를 나타내고, 0부터 「예측 모드수-1」까지 1씩 증가하는 변수이다.
구체적으로는, NN 파라미터 복호부(220)는, 예측 모드 k의 파라미터 참조 타입(nn_intra_param_ref_type[k])을 복호한다(S503).
다음에, NN 파라미터 복호부(220)는 파라미터 참조 타입이 비참조 타입인지 여부를 판정하고(S504), 비참조 타입의 경우에는, 파라미터 비참조 타입 복호를 실시한다(S505), 한편, 비참조 타입이 아닌 경우(모드 참조 타입 또는 직전 참조 타입인 경우)에는, NN 파라미터 복호부(220)는 파라미터 참조 타입 복호를 실시한다(S506).
<동작(파라미터 비참조 타입 복호 플로우)>
도 62는, 도 61의 단계 S505에 있어서의 파라미터 비참조 타입 복호의 상세를 나타내는 플로우 차트이다.
우선, NN 파라미터 복호부(220)는, 예측 모드 k의 계층수(nn_intra_layer_num[k])를 복호하고(S511), 이후의 처리를 계층수만큼 반복한다(S512). 여기서, i는 처리 대상의 계층을 나타내고, 0부터 「계층수-1」까지 1씩 증가하는 변수이다.
다음에, NN 파라미터 복호부(220)는, 계층 i가 최초의 계층인지 여부를 판정하고(S513), 최초의 계층이면, 입력 노드수(input_node_num)에 참조 화소수를 설정한다(S514). 한편, 최초의 계층이 아니면, NN 파라미터 복호부(220)는, 입력 노드수(input_node_num)에 직전의 계층의 노드수(nn_intra_node_num[k][i-1])를 설정한다(S515). 도 13을 예로 설명하면, 계층 i가 n[k][0][x]의 계층(i=0)이던 경우는, NN 파라미터 복호부(220)는 입력 노드수에 참조 화소수인 11을 설정한다. 만약 계층 i가 n[k][1][x]의 계층(i=1)이던 경우는, NN 파라미터 복호부(220)는, 직전의 계층의 노드수인 4를 입력 노드수로 설정한다. 입력 노드수는 이후의 처리에서 사용하는 변수이다.
다음에, NN 파라미터 복호부(220)는, 계층 i가 최후의 계층인지 여부를 판정하고(S516), 최후의 계층인 경우는, 노드수(nn_intra_node_num[k][i])에 예측 화소수(출력 화소수)(도 13의 예에서는 16)를 설정한다(S517). 한편, 최후의 계층이 아닌 경우는, NN 파라미터 복호부(220)는 노드수를 복호한다(S518).
다음에, NN 파라미터 복호부(220)는, 노드수만큼의 바이어스치(nn_intra_bias[k][i][j])를 복호하고(S519, S520), 노드수와 입력 노드수만큼의 가중 계수(nn_intra_w[k][i][j][m])를 복호한다(S521, S522). 여기서 j는, 처리 대상의 노드를 나타내고, 0부터 「계층 i의 노드수-1」까지 1씩 증가하는 변수이다. 또, m은, 처리 대상의 입력 노드를 나타내고, 0부터 「계층 i의 노드 j의 입력 노드수-1」까지 1씩 증가하는 변수이다. 입력 노드란, 처리 대상의 노드에 값을 입력하는 노드이며, 예를 들면 도 13의 n[k][0][0]의 입력 노드는, 참조 화소 0~참조 화소 11의 12개 있다.
<동작(파라미터 참조 타입 복호 플로우)>
도 63은, 도 61의 단계 S506에 있어서의 파라미터 참조 타입 복호의 상세를 나타내는 플로우 차트이다.
우선, NN 파라미터 복호부(220)는, 예측 모드 k의 파라미터 참조 타입이 모드 참조 타입인지 여부를 판정하고(S531), 모드 참조 타입이면, 참조 모드 델타(nn_intra_param_ref_mode_delta)를 복호한다(S532). 그리고, NN 파라미터 복호부(220)는, 참조 모드 델타가 0인지 여부를 판정하여(S533), 0이면, 프리셋 사용 모드를 ON으로 하고(S534), 0이 아니면, 프리셋 사용 모드를 OFF로 한다(S535).
다음에, NN 파라미터 복호부(220)는, 프리셋 사용 모드가 ON인지 여부를 판정하고(S536), ON이면, 사용하는 프리셋의 ID(nn_intra_param_ref_preset_id)를 복호(S537)한다. 한편, ON이 아니면, NN 파라미터 복호부(220)는 k부터 참조 모드 델타를 감산함으로써 참조 모드(nn_intra_param_ref_mode)를 산출한다(S538). 파라미터 참조 타입이 직전 참조 타입이면(S531의 No), NN 파라미터 복호부(220)는, 단계 S532~S538의 처리를 행하지 않는다.
다음에, NN 파라미터 복호부(220)는, 파라미터 참조 타입으로 계층수를 복호한다(S540). 상세한 것은 후술한다.
다음에, NN 파라미터 복호부(220)는 계층수의 분만큼 이하의 처리를 반복한다(S541). 여기서 i는 처리 대상의 계층을 나타내고, 0부터 「계층수-1」까지 1씩 증가하는 변수이다.
구체적으로는, NN 파라미터 복호부(220)는, 계층 i가 최초의 계층인지 여부를 판정하고(S542), 최초의 계층이면, 입력 노드수(input_node_num)에 참조 화소수를 설정한다(S543). 한편, 최초의 계층이 아니면, NN 파라미터 복호부(220)는, 입력 노드수(input_node_num)에 직전의 계층의 노드수(nn_intra_node_num[k][i-1])를 설정한다(S544).
다음에, NN 파라미터 복호부(220)는, 계층 i가 최후의 계층인지 여부를 판정하고(S545), 최후의 계층인 경우는, 노드수(nn_intra_node_num[k][i])에 예측 화소수(출력 화소수)를 설정한다(S546). 한편, 최후의 계층이 아닌 경우는, NN 파라미터 복호부(220)는, 파라미터 참조 타입으로 노드수를 복호한다(S547). 노드수의 복호에 대한 상세한 것은 후술한다.
다음에, NN 파라미터 복호부(220)는, 노드수분의 바이어스치를 복호하고(S548, S549), 노드수와 입력 노드수분의 가중 계수를 파라미터 참조 타입으로 복호한다(S550, S551). 여기서, j는, 처리 대상의 노드를 나타내고, 0부터 「계층 i의 노드수-1」까지 1씩 증가하는 변수이다. 또, m은, 처리 대상의 입력 노드를 나타내고, 0부터 「계층 i의 노드 j의 입력 노드수-1」까지 1씩 증가하는 변수이다. 단계 S549에 있어서의 바이어스치의 부호화(파라미터 참조 타입 바이어스치 복호)와 단계 S551의 가중 계수의 복호(파라미터 참조 타입 가중 계수 복호)에 대해서는 후술한다.
<동작(파라미터 참조 타입 계층수 복호 플로우)>
도 64는, 도 63의 단계 S540에 있어서의 파라미터 참조 타입 계층수 복호의 상세를 나타내는 플로우 차트이다.
우선, NN 파라미터 복호부(220)는, 예측 모드 k의 파라미터 참조 타입이 모드 참조 타입인지 여부를 판정하고(S531), 모드 참조 타입이면, 다시, 프리셋 사용 모드가 ON인지 여부를 판정한다(S536). 여기서, 프리셋 사용 모드가 ON이면, NN 파라미터 복호부(220)는, 프리셋 ID가 가리키는 프리셋의 계층수를 예측 모드 k의 계층수로 설정한다(S563). 한편, 프리셋 사용 모드가 OFF인 경우는, NN 파라미터 복호부(220)는, 참조하는 예측 모드의 계층수를 예측 모드 k의 계층수로 설정한다(S564).
또, 예측 모드 k의 파라미터 참조 타입이 직접 참조 타입인 경우는(S531의 No), NN 파라미터 복호부(220)는 예측 모드 k의 계층수를 복호한다(S565).
본 처리에서는, 모드 참조 타입의 경우는, NN 파라미터 복호부(220)는, 계층수를 복호하지 않고, 프리셋 혹은 다른 예측 모드의 정보로부터 계층수를 취득한다.
<동작(파라미터 참조 타입 노드수 복호 플로우)>
도 65는, 도 63의 단계 S547에 있어서의 파라미터 참조 타입 노드수 복호의 상세를 나타내는 플로우 차트이다.
우선, NN 파라미터 복호부(220)는, 예측 모드 k의 파라미터 참조 타입이 모드 참조 타입인지 여부를 판정하고(S531), 모드 참조 타입이면, 다시, 프리셋 사용 모드가 ON인지 여부를 판정한다(S536). 여기서, 프리셋 사용 모드가 ON이면, NN 파라미터 복호부(220)는, 프리셋 ID가 가리키는 프리셋의 노드수를 예측 모드 k의 계층 i의 노드수로 설정한다(S573). 한편, 프리셋 사용 모드가 OFF인 경우는, NN 파라미터 복호부(220)는, 참조하는 예측 모드의 노드수를 예측 모드 k의 계층 i의 노드수로 설정한다(S574).
또, 예측 모드 k의 파라미터 참조 타입이 직접 참조 타입인 경우는(S531의 No), NN 파라미터 복호부(220)는 예측 모드 k의 계층 i의 노드수 델타를 복호한다(S575). 그리고, NN 파라미터 복호부(220)는, 계층 i가 최초의 계층인지 여부를 판정하고(S576), 최초의 계층이면, 참조 화소수로부터, 단계 S575에서 복호한 노드수 델타를 감산하고, 그 감산 결과를 예측 모드 k의 계층 i의 노드수로 설정한다(S577). 만약, 계층 i가 최초의 계층이 아니면, NN 파라미터 복호부(220)는, 직전의 계층의 노드수로부터, 단계 S575에서 복호한 노드수 델타를 감산하고, 그 감산 결과를 예측 모드 k의 계층 i의 노드수로 설정한다(S578).
본 처리에서는, 모드 참조 타입인 경우는, NN 파라미터 복호부(220)는 노드수를 복호하지 않고, 프리셋 혹은 다른 예측 모드의 정보로부터 노드수를 취득한다.
<동작(파라미터 참조 타입 바이어스치 복호 플로우)>
도 66은, 도 63의 단계 S549에 있어서의 파라미터 참조 타입 바이어스치 복호의 상세를 나타내는 플로우 차트이다.
우선, NN 파라미터 복호부(220)는, 예측 모드 k의 계층 i의 노드 j의 바이어스치 델타를 복호한다(S581).
다음에, NN 파라미터 복호부(220)는, 예측 모드 k의 파라미터 참조 타입이 모드 참조 타입인지 여부를 판정하고(S531), 모드 참조 타입이면, 다시, 프리셋 사용 모드가 ON 인지 여부를 판정한다(S536). 여기서, 프리셋 사용 모드가 ON 이면, NN 파라미터 복호부(220)는, 프리셋 ID가 가리키는 프리셋의 바이어스치를 참조 바이어스치로 설정한다(S584). 한편, 프리셋 사용 모드가 OFF인 경우는, NN 파라미터 복호부(220)는, 참조하는 예측 모드의 바이어스치를 참조 바이어스치로 설정한다(S585).
또, 예측 모드 k의 파라미터 참조 타입이 직접 참조 타입인 경우(S531의 No), NN 파라미터 복호부(220)는, 노드 j가 계층 i에서 최초의 노드인지 여부를 판정한다(S586). 최초의 노드이면, NN 파라미터 복호부(220)는, 계층 i의 디폴트 바이어스치를 참조 바이어스치로 설정하고(S587), 최초의 노드가 아니라면, 직전의 노드의 바이어스치를 참조 바이어스치로 설정한다(S588).
다음에, NN 파라미터 복호부(220)는, 참조 바이어스치로부터, 단계 S581에서 복호한 바이어스치 델타를 감산하고, 그 감산 결과를 예측 모드 k의 계층 i의 노드 j의 바이어스치로 설정한다(S589).
<동작(파라미터 참조 타입 가중 계수 복호 플로우)>
도 67은, 도 63의 단계 S551에 있어서의 파라미터 참조 타입 가중 계수 복호의 상세를 나타내는 플로우 차트이다.
우선, NN 파라미터 복호부(220)는, 예측 모드 k의 계층 i의 노드 j의 입력 노드 m의 가중 계수 델타를 복호한다(S591).
다음에, NN 파라미터 복호부(220)는, 예측 모드 k의 파라미터 참조 타입이 모드 참조 타입인지 여부를 판정하고(S531), 모드 참조 타입이면, 다시, 프리셋 사용 모드가 ON인지 여부를 판정한다(S536). 여기서, 프리셋 사용 모드가 ON이면, NN 파라미터 복호부(220)는, 프리셋 ID가 가리키는 프리셋의 참조 가중 계수를 참조 가중 계수로 설정한다(S594). 한편, 프리셋 사용 모드가 OFF인 경우는, NN 파라미터 복호부(220)는, 참조하는 예측 모드의 가중 계수를 참조 가중 계수로 설정한다(S595).
또, 예측 모드 k의 파라미터 참조 타입이 직접 참조 타입인 경우(S531의 No), NN 파라미터 복호부(220)는 입력 노드 m이 노드 j에서 최초의 입력 노드인지 여부를 판정한다(S596). 최초의 입력 노드이면, NN 파라미터 복호부(220)는, 계층 i의 노드 j의 디폴트 가중 계수를 참조 가중 계수로 설정하고(S597), 최초의 입력 노드가 아니라면, 직전의 입력 노드의 가중 계수를 참조 가중 계수로 설정한다(S598).
다음에, NN 파라미터 복호부(220)는, 참조 가중 계수로부터, 단계 S591에서 복호한 가중 계수 델타를 감산하고, 그 감산 결과를 예측 모드 k의 계층 i의 노드 j의 입력 노드 m의 가중 계수로 설정한다(S599).
<동작(NN 인터 예측 파라미터 부호화 플로우), 동작(NN 루프 내 필터 파라미터 부호화 플로우)>
도 68의 단계 S603 및 S604에 있어서의 NN 인터 예측 파라미터 복호 및 NN 루프 내 필터 파라미터 복호의 각각의 플로우는, 도 61~도 67에 나타내는 NN 인트라 예측 파라미터 복호의 플로우와 동일하고, NN 인트라 예측을 NN 인터 예측 또는 NN 루프 내 필터로 바꾸어 읽는 것만이므로 설명을 생략한다.
<신택스 구성>
본 실시의 형태에 있어서의 각 신택스는, 실시의 형태 5의 도 57 및 도 58에 나타내는 각 신택스과 동일하기 때문에, 설명을 생략한다. 또, 도 57 및 도 58은 NN 인트라 예측 파라미터의 신택스이지만, NN 인터 예측 파라미터 및 NN 루프 내 필터 파라미터의 신택스도 동일하고, intra_pred를 inter_pred와 ilf로 바꾸어 읽는 것만이므로 설명을 생략한다.
<효과>
실시의 형태 5와 동일하기 때문에, 설명을 생략한다.
<실시의 형태 5 및 6의 정리>
본 개시된 제1 양태(1)에 따른 화상의 부호화 또는 복호의 방법에서는, 비선형 필터의 연산 파라미터를 부호화 또는 복호하고, 그 연산 파라미터를 이용하여 대상 화상을 부호화 또는 복호한다.
또, 본 개시된 제2 양태(1-1)에 따른 방법에서는, 제1 양태에 따른 방법에 있어서, 부호화 또는 복호 완료된 연산 파라미터를 참조하여, 연산 파라미터를 부호화 또는 복호해도 된다.
또, 본 개시된 제3 양태(1-1-1)에 따른 방법에서는, 제2 양태에 따른 방법에 있어서, 상기 연산 파라미터를 이용한 처리를 복수 모드 구비하고, 연산 파라미터는 부호화 또는 복호 완료된 다른 모드의 연산 파라미터를 참조하여, 부호화 또는 복호해도 된다.
또, 본 개시된 제4 양태(1-1-2)에 따른 방법에서는, 제2 양태에 따른 방법에 있어서, 직전에 부호화 또는 복호한 연산 파라미터를 참조하여, 연산 파라미터를 부호화 또는 복호해도 된다.
또, 본 개시된 제5 양태(1-1-3)에 따른 방법에서는, 제2 양태에 따른 방법에 있어서, 참조하는 데이터와의 차분치를 부호화 또는 복호해도 된다.
또, 본 개시된 제6 양태(1-2)에 따른 방법에서는, 제1 양태에 따른 방법에 있어서, 특정의 연산 파라미터를 규정하고, 그것을 참조하여 연산 파라미터를 부호화 또는 복호해도 된다.
또, 본 개시된 제7 양태(1-2-1)에 따른 방법에서는, 제6 양태에 따른 방법에 있어서, 복수의 연산 파라미터를 규정하고, 그들 중의 하나를 지정하기 위한 식별자를 부호화 또는 복호하고, 지정한 연산 파라미터를 참조하여 연산 파라미터를 부호화 또는 복호해도 된다.
또, 본 개시된 제8 양태(1-2-2)에 따른 방법에서는, 제6 양태에 따른 방법에 있어서, 참조하는 데이터와의 차분치를 부호화 또는 복호해도 된다.
여기서, 본 개시된 제9 양태(2)에 따른 화상의 부호화 또는 복호의 방법에서는, 인트라 예측에 이용하는 연산 파라미터를 부호화 또는 복호한다.
또, 본 개시된 제10 양태(2-1)에 따른 방법에서는, 제9 양태에 따른 방법에 있어서, 부호화 또는 복호 완료된 연산 파라미터를 참조하여, 연산 파라미터를 부호화 또는 복호해도 된다.
또, 본 개시된 제11 양태(2-1-1)에 따른 방법에서는, 제10 양태에 따른 방법에 있어서, 상기 연산 파라미터를 이용한 처리를 복수 모드 구비하고, 연산 파라미터는 부호화 또는 복호 완료된 다른 모드의 연산 파라미터를 참조하여, 부호화 또는 복호해도 된다.
또, 본 개시된 제12 양태(2-1-2)에 따른 방법에서는, 제10 양태에 따른 방법에 있어서, 직전에 부호화 또는 복호한 연산 파라미터를 참조하여, 연산 파라미터를 부호화 또는 복호해도 된다.
또, 본 개시된 제13 양태(2-1-3)에 따른 방법에서는, 제10 양태에 따른 방법에 있어서, 참조하는 데이터와의 차분치를 부호화 또는 복호해도 된다.
또, 본 개시된 제14 양태(2-2)에 따른 방법에서는, 제9 양태에 따른 방법에 있어서, 특정의 연산 파라미터를 규정하고, 그것을 참조하여 연산 파라미터를 부호화 또는 복호해도 된다.
또, 본 개시된 제15 양태(2-2-1)에 따른 방법에서는, 제14 양태에 따른 방법에 있어서, 복수의 연산 파라미터를 규정하고, 그들 중의 하나를 지정하기 위한 식별자를 부호화 또는 복호하고, 지정한 연산 파라미터를 참조하여 연산 파라미터를 부호화 또는 복호해도 된다.
또, 본 개시된 제16 양태(2-2-2)에 따른 방법에서는, 제14 양태에 따른 방법에 있어서, 참조하는 데이터와의 차분치를 부호화 또는 복호해도 된다.
이상의 각 실시예에 있어서, 기능 블록의 각각은, 통상, MPU나 메모리 등에 의해서 실현 가능하다. 또, 기능 블록의 각각에 의한 처리는, 통상, 소프트웨어(프로그램)에 의해서 실현할 수 있고, 당해 소프트웨어는 ROM 등의 기록 매체에 기록되어 있다. 그리고, 이러한 소프트웨어를 다운로드 등에 의해 배포해도 되고, CD-ROM 등의 기록 매체에 기록하여 배포해도 된다. 또한, 각 기능 블록을 하드웨어(전용 회로)에 의해서 실현하는 것도, 당연히 가능하다.
또, 각 실시예에 있어서 설명한 처리는, 단일의 장치(시스템)를 이용하여 집중 처리하는 것에 의해서 실현해도 되고, 혹은, 복수의 장치를 이용하여 분산 처리하는 것에 의해서 실현해도 된다. 또, 상기 프로그램을 실행하는 컴퓨터는, 단수여도 되고, 복수여도 된다. 즉, 집중 처리를 행해도 되고, 혹은 분산 처리를 행해도 된다.
본 개시는, 이상의 실시예에 한정되지 않고, 여러 가지의 변경이 가능하고, 그들도 본 개시된 범위 내에 포함되는 것인 것은 말할 필요도 없다.
<실시의 형태 1~6의 정리>
도 69a는, 본 개시된 일 양태에 따른 화상 부호화 장치의 블록도이다.
화상 부호화 장치(10)는, 상기 각 실시의 형태에 있어서의 화상 부호화 장치(100, 300, 500)에 대응하고, 픽처를 블록마다 변환하며, 루프 내 필터를 이용하여 변환이 완료된 블록을 재구축하고, 그 픽처 내의 화소를 이용한 인트라 예측 또는 다른 픽처 내의 화소를 이용한 인터 예측을 이용하여, 재구축된 블록을 예측하고, 그 블록을 부호화한다. 또, 이 화상 부호화 장치(10)는, 화상 부호화부(11)와 파라미터 부호화부(12)를 구비한다.
화상 부호화부(11)는 인트라 예측, 인터 예측 및 루프 내 필터 중 적어도 하나에 있어서, 입출력의 관계가 비선형이 되는 비선형 처리를 행하여 상기 블록을 포함하는 화상을 부호화한다. 파라미터 부호화부(12)는, 그 비선형 처리에 이용되는 비선형 필터의 연산 파라미터를 부호화한다.
도 69b는, 본 개시된 일 양태에 따른 화상 부호화 방법의 플로우 차트이다.
화상 부호화 방법은, 픽처를 블록마다 변환하고, 루프 내 필터를 이용하여 변환이 완료된 블록을 재구축하고, 그 픽처 내의 화소를 이용한 인트라 예측 또는 다른 픽처 내의 화소를 이용한 인터 예측을 이용하여 재구축된 블록을 예측하며, 그 블록을 부호화하는 방법으로서, 단계 S11과 단계 S12를 포함한다. 단계 S11에서는, 인트라 예측, 인터 예측 및 루프 내 필터 중 적어도 하나에 있어서, 입출력의 관계가 비선형이 되는 비선형 처리를 행하여 상기 블록을 포함하는 화상을 부호화한다. 단계 S12에서는, 그 비선형 처리에 이용되는 비선형 필터의 연산 파라미터를 부호화한다.
이와 같이, 본 개시된 일 양태에 따른 화상 부호화 장치 및 화상 부호화 방법에서는, 비선형 필터를 이용하는 것에 의해서, 화상을 효율적으로 부호화할 수 있다.
여기서, 예를 들면, 비선형 필터는 뉴럴 네트워크를 포함하고, 연산 파라미터의 부호화에서는 뉴럴 네트워크에 포함되는 각 노드간의 가중 계수를 연산 파라미터로서 부호화해도 된다. 또, 예를 들면, 그 연산 파라미터의 부호화에서는, 또한, 뉴럴 네트워크의 계층수 또는 노드수를 연산 파라미터로서 부호화해도 된다.
또, 화상의 부호화에서는, 부호화되는 상기 화상의 프로파일에 따라, 뉴럴 네트워크의 계층수 또는 노드수의 최대치를 규정하고, 규정된 최대치 이하의 계층수 또는 노드수의 뉴럴 네트워크를 이용한 비선형 처리를 행해도 된다.
이것에 의해, 예를 들면 도 28에 나타내는 바와 같이, 프로파일에 따라 계층수 또는 노드수가 제한되기 때문에, 비선형 처리의 계산량을 억제할 수 있고 저지연을 실현할 수 있다.
또, 화상 부호화 방법에서는, 또한, 고정 파라미터를 가지는 선형 필터와 상기 비선형 필터 중 어느 하나를, 사용되어야 할 필터로서 나타내는 전환 정보를 부호화하고, 화상의 부호화에서는, 화상의 부호화에 이용되는 처리를, 상기 전환 정보에 따라서, 상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터 중 적어도 하나에 있어서, 상기 비선형 필터를 이용한 상기 비선형 처리와, 상기 선형 필터를 이용한 선형 처리로 전환해도 된다.
예를 들면, 전환 정보는, 도 22에 나타내는, intra_pred_type, inter_pred_type, 또는 ilf_type이다. 선형 처리는, 종래의 인트라 예측, 인터 예측 및 루프 내 필터 중 적어도 하나이며, 고정된 파라미터(가중 계수 등)를 가지는 선형 필터를 이용한다.
이것에 의해, 비선형 처리와 선형 처리가 변환되기 때문에, 부호량과 화상의 왜곡(화질)에 의해서 정의되는 평가치가 높은 처리를 선택할 수 있고, 부호량 및 화질 열화를 모두 억제할 수 있다.
또, 비선형 처리는, 상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터를 포함하는 복수의 모드 중 어느 하나의 모드에 대응지어지고, 화상의 부호화에서는, 그 모드가 지정되는 경우에 비선형 처리를 행하여 화상을 부호화해도 된다.
이것에 의해, 예를 들면 도 22에 나타내는 nn_intra_pred_mode, nn_inter_pred_mode, 및 nn_ilf_mode 등의 모드를 지정하는 것에 의해서, 그 모드에 대응하는 적절한 비선형 처리를 행할 수 있다.
또, 화상 부호화 방법에서는, 또한, 지정된 모드를 나타내는 정보를 부호화해도 된다.
이것에 의해, 예를 들면 도 22~도 26에 나타내는 바와 같이, 모드를 나타내는 정보가 부호화되기 때문에, 그 모드를 화상 복호 장치에 통지할 수 있고 적절하게 화상을 복호할 수 있다.
또, 화상 부호화 방법에서는, 또한, 상기 화상에 포함되는 블록, 슬라이스, 타일, 픽처 또는 GOP(Group Of Picture)인 화상 단위마다, 상기 연산 파라미터를 전환하고, 상기 화상의 부호화에서는, 상기 화상 단위에 대해서 전환된 연산 파라미터를 가지는 상기 비선형 필터를 이용한 비선형 처리를 행하여, 상기 화상 단위를 부호화해도 된다. 예를 들면, 연산 파라미터의 부호화에서는, 화상에 포함되는, 시퀀스, GOP 및 픽처 중 적어도 하나의 선두에 있어서, 복수의 비선형 필터의 각각에 대응하는, 제1 식별자에 관련시켜진 연산 파라미터를 부호화하고, 화상의 부호화에서는, 화상 단위마다, 제1 식별자에 의해서 연산 파라미터를 지정하고, 지정된 연산 파라미터의 비선형 필터를 이용한 비선형 처리를 행하여 화상을 부호화한다.
예를 들면, 도 16~도 18에 나타내는 바와 같이, 화상 단위마다, pps_nps_id 또는 slice_nps_id 등의 제1 식별자에 의해서, 그 제1 식별자와 동일한 nps_id에 관련시켜진 연산 파라미터(nn_intra_pred_parameter_data(), nn_inter_pred_parameter_data() 또는 nn_ilf_parameter_data())가 지정된다. 이것에 의해, 연산 파라미터를 화상 단위마다 적절하게 이용할 수 있다.
또, 화상 부호화 방법에서는, 또한, 비선형 필터가 유효인지 무효인지를 나타내는 유효/무효 정보를 부호화하고, 화상의 부호화에서는, 그 유효/무효 정보가 유효를 나타내는 경우에, 비선형 처리를 행해도 된다.
예를 들면, 도 15에 나타내는 nn_intra_pred_enabled_flag 등의 플래그인 유효/무효 정보가 부호화되고, 그 플래그가 유효를 나타내는 경우에, NN 인트라 예측 등의 비선형 처리가 행해진다. 이것에 의해, 화상 복호 장치는, 유효/무효 정보가 무효를 나타내는 경우에는, 연산 파라미터 등에 대한 처리를 생략할 수 있고, 간단하게 화상을 복호할 수 있다.
또, 화상 부호화 방법에서는, 또한, 부호화되는 화상의 프로파일에 따라, 유효/무효 정보에 의해서 나타나는 내용을 전환해도 된다.
이것에 의해, 프로파일에 따라 비선형 처리를 행하는지 여부를 선택할 수 있다.
또, 화상 부호화 방법에서는, 또한, 화상을 취급하는 어플리케이션 프로그램에 있어서, 화상 처리에 대해서 저지연의 요구가 있는 경우에는, 유효/무효 정보에 의해서 나타나는 내용을 무효로 전환해도 된다.
이것에 의해, 저지연의 요구가 있는 어플리케이션 프로그램에서는, 비선형 처리 대신에, 고정 파라미터를 가지는 선형 필터를 이용한 인트라 예측 등의 선형 처리를 행할 수 있고, 그 요구에 따른 화상의 부호화를 실현할 수 있다.
또, 화상 부호화 방법에서는, 또한, 그 화상을 교사 데이터로서 이용하여 학습하는 것에 의해서 연산 파라미터를 결정해도 된다. 예를 들면, 그 화상 부호화 방법에서는, 또한, 화상에 포함되는 블록마다, 당해 블록의 특징에 따라, 당해 블록을 복수의 클래스 중 어느 하나의 클래스로 분류하고, 연산 파라미터의 결정에서는, 그 클래스마다, 당해 클래스로 분류된 적어도 하나의 블록과 그 적어도 하나의 블록의 각각의 주변 화소를 교사 데이터로서 이용하여 학습하는 것에 의해서, 당해 클래스에 대응하는 연산 파라미터를 결정한다.
이것에 의해, 예를 들면 도 7~도 14에 나타내는 바와 같이, 연산 파라미터를, 부호화 대상의 화상에 최적화할 수 있고, 화상을 보다 효율적으로 부호화할 수 있다.
또, 연산 파라미터의 결정에서는, 화상 가운데, 미리 정해진 기준보다 복잡성이 높은 영역만을 이용하여 학습하는 것에 의해서, 연산 파라미터를 결정해도 된다.
이것에 의해, 비선형 처리의 정밀도 또는 성능을 저하시키지 않고 학습의 범위를 좁힐 수 있고, 비선형 필터의 연산 파라미터량을 삭감할 수 있다.
또, 변환에서는, 화상에 있어서의 공간 영역으로부터 주파수 영역으로의 변환을 행하고, 비선형 필터를 이용한 인트라 예측 또는 인터 예측이 행해지는지, 선형 필터를 이용한 인트라 예측 또는 인터 예측이 행해지는지에 따라서, 그 변환의 방법을 전환해도 된다. 예를 들면, 그 변환에서는, 비선형 필터를 이용한 인트라 예측이 행해지는 경우에는, 변환의 방법을, 변경 가능한 변환 행렬을 이용한 방법으로 전환, 변경 가능한 변환 행렬을 이용한 방법에 따라서 변환을 행한다.
예를 들면 도 39에 나타내는 바와 같이, 비선형 필터를 이용한 인트라 예측(NN 인트라 예측)이 행해지는 경우에는, KL 변환 등의, 변경 가능한 변환 행렬을 이용한 방법에 따라 변환이 행해지고, 선형 필터를 이용한 인트라 예측(종래의 인트라 예측)이 행해지는 경우에는, 이산 코사인 변환 등의 고정 변환에 의해서 변환이 행해진다. 이것에 의해, NN 인트라 예측과 같은 비선형 처리가 행해지는 경우에는, 그 비선형 처리에 적합한 변환을 행할 수 있고, 부호화 효율을 향상시킬 수 있다.
또, 화상의 부호화에서는, 화상에 포함되는 블록이 소정의 사이즈 이하인 경우에는, 비선형 필터를 이용한 인트라 예측을 비선형 처리로 하여 그 블록에 대해서 행하고, 블록이 소정의 사이즈보다 큰 경우에는, 고정 파라미터의 선형 필터를 이용한 인트라 예측을 그 블록에 대해서 행해도 된다.
예를 들면 도 36에 나타내는 바와 같이, 화상에 포함되는 블록(예측 블록)이 4×4 화소의 사이즈 이하인 경우에는, NN 인트라 예측이 예측 블록에 대해서 행해지고, 4×4 화소의 사이즈보다 큰 경우에는 고정 인트라 예측이 예측 블록에 대해서 행해진다. 이것에 의해, 예측 성능의 저하를 억제하면서 연산 파라미터의 데이터량을 삭감할 수 있어 부호화 효율을 향상시킬 수 있다.
또, 화상의 부호화에서는, 화상 중 휘도 성분에 대해서 비선형 처리를 행하고, 화상 중 색차 성분에 대해서는 인트라 예측, 인터 예측 및 루프 내 필터 중 적어도 하나에 있어서, 입출력 관계가 선형이 되는 선형 처리를 행해도 된다.
예를 들면 도 36~도 38에 나타내는 바와 같이, 휘도 성분에 대해서는, NN 인트라 예측, NN 인터 예측, 또는 NN 루프 내 필터가 행해지고, 색차 성분에 대해서는 고정 인트라 예측, 고정 인터 예측, 또는 고정 루프 내 필터가 행해진다. 또한, 고정 인트라 예측, 고정 인터 예측, 및 고정 루프 내 필터의 각각은, 고정 파라미터를 가지는 선형 필터를 이용하여 행해지는 종래의 인터 예측, 인트라 예측 또는 루프 내 필터이다. 이것에 의해, 예측 정밀도의 저하나 노이즈 증가를 억제하면서 연산 파라미터의 데이터량을 삭감시킬 수 있고 부호화 효율을 향상시킬 수 있다.
또, 연산 파라미터의 부호화에서는, 부호화 대상의 상기 연산 파라미터와는 상이한 부호화 완료된 연산 파라미터를 참조하여, 부호화 대상의 상기 연산 파라미터를 부호화해도 된다. 구체적으로는, 연산 파라미터의 부호화에서는, 부호화 대상의 연산 파라미터와 부호화 완료된 연산 파라미터와의 차분을 부호화한다.
이것에 의해, 예를 들면 도 54~도 56에 나타내는 바와 같이, 연산 파라미터를 효율적으로 부호화할 수 있다.
또, 비선형 처리에는, 복수의 모드가 있고, 부호화 완료된 연산 파라미터는, 부호화 대상의 연산 파라미터에 대응하는 비선형 처리의 모드와는 상이한 다른 모드의 비선형 처리의 부호화 완료된 연산 파라미터여도 된다.
이것에 의해, 예를 들면 도 56의 단계 S484 및 S488에 나타내는 바와 같이, 연산 파라미터(가중 계수)를 효율적으로 부호화할 수 있다. 또한, 단계 S484에 있어서의 참조 모드의 계층 i의 노드 j의 입력 노드 m의 가중 계수는, 부호화 완료된 연산 파라미터이다.
또, 부호화 완료된 연산 파라미터는, 부호화 대상의 연산 파라미터의 직전에 부호화된 연산 파라미터여도 된다.
이것에 의해, 예를 들면 도 56의 단계 S487 및 S488에 나타내는 바와 같이, 연산 파라미터(가중 계수)를 효율적으로 부호화할 수 있다. 또한, 단계 S487에 있어서의 직전의 입력 노드의 가중 계수는, 부호화 대상의 연산 파라미터의 직전에 부호화된 연산 파라미터이다.
또, 연산 파라미터의 부호화에서는, 미리 규정된 파라미터인 규정 파라미터를 참조하여, 부호화 대상의 연산 파라미터를 부호화해도 된다.
이것에 의해, 예를 들면 도 56의 단계 S483 및 S488에 나타내는 바와 같이, 연산 파라미터(가중 계수)를 효율적으로 부호화할 수 있다. 또한, 단계 S483에 있어서의 프리셋 ID의 프리셋의 계층 i의 노드 j의 입력 노드 m의 가중 계수는, 미리 규정된 파라미터인 규정 파라미터이다.
또, 연산 파라미터의 부호화에서는, 미리 정해진 복수의 파라미터 중 어느 하나의 파라미터를, 당해 파라미터의 제2 식별자를 이용하여 지정하고, 지정된 파라미터를 규정 파라미터로서 참조하며, 화상 부호화 방법에서는, 또한, 그 제2 식별자를 부호화해도 된다.
예를 들면, 도 52의 단계 S437에 있어서, 프리셋 ID가 제2 식별자로서 지정되어 부호화된다. 이것에 의해, 적절한 규정 파라미터를 선택할 수 있고 연산 파라미터를 보다 효율적으로 부호화할 수 있다.
도 70a는, 본 개시된 일 양태에 따른 화상 복호 장치의 블록도이다.
화상 복호 장치(20)는, 상기 각 실시의 형태에 있어서의 화상 복호 장치(200, 400, 600)에 대응하고, 부호화 픽처를 블록마다 역변환하며, 루프 내 필터를 이용하여 역변환이 완료된 상기 블록을 재구축하고, 상기 부호화 픽처 내의 복호 완료된 화소를 이용한 인트라 예측 또는 다른 부호화 픽처 내의 복호 완료된 화소를 이용한 인터 예측을 이용하여, 상기 재구축된 블록을 예측하고, 그 블록을 복호한다. 또, 이 화상 복호 장치(20)는 파라미터 복호부(21)와 화상 복호부(22)를 구비한다.
파라미터 복호부(21)는, 비선형 필터의 연산 파라미터를 복호한다. 화상 복호부(22)는, 인트라 예측, 인터 예측 및 루프 내 필터 중 적어도 하나에 있어서, 복호된 연산 파라미터를 가지는 비선형 필터를 이용한, 입출력의 관계가 비선형이 되는 비선형 처리를 행하여 그 블록을 포함하는 화상을 복호한다.
도 70b는, 본 개시된 일 양태에 따른 화상 복호 방법의 플로우 차트이다.
화상 복호 방법은, 부호화 픽처를 블록마다 역변환하고, 루프 내 필터를 이용하여 역변환이 완료된 상기 블록을 재구축하며, 상기 부호화 픽처 내의 복호 완료된 화소를 이용한 인트라 예측 또는 다른 부호화 픽처 내의 복호 완료된 화소를 이용한 인터 예측을 이용하여, 상기 재구축된 블록을 예측하고, 그 블록을 복호하는 방법으로서, 단계 S21과 단계 S22를 포함한다. 단계 S21에서는, 비선형 필터의 연산 파라미터를 복호한다. 단계 S22에서는, 인트라 예측, 인터 예측 및 루프 내 필터 중 적어도 하나에 있어서, 복호된 연산 파라미터를 가지는 비선형 필터를 이용한, 입출력의 관계가 비선형이 되는 비선형 처리를 행하여 그 블록을 포함하는 화상을 복호한다.
이와 같이, 본 개시된 일 양태에 따른 화상 복호 장치 및 화상 복호 방법에서는, 비선형 필터를 이용하는 것에 의해서, 효율적으로 부호화된 화상을 적절하게 복호할 수 있다.
여기서, 예를 들면, 비선형 필터는 뉴럴 네트워크를 포함하고, 연산 파라미터의 복호에서는 뉴럴 네트워크에 포함되는 각 노드간의 가중 계수를 연산 파라미터로서 복호해도 된다. 또, 예를 들면, 연산 파라미터의 복호에서는, 또한, 뉴럴 네트워크의 계층수 또는 노드수를 연산 파라미터로서 복호해도 된다.
또, 화상 복호 방법에서는, 또한, 고정 파라미터를 가지는 선형 필터와 비선형 필터 중 어느 한쪽을, 사용되어야 할 필터로서 나타내는 전환 정보를 복호하고, 화상의 복호에서는, 화상의 복호에 이용되는 처리를, 전환 정보에 따라서, 인트라 예측, 인터 예측 및 루프 내 필터 중 적어도 하나에 있어서, 비선형 필터를 이용한 비선형 처리와 선형 필터를 이용한 선형 처리로 전환해도 된다.
예를 들면, 전환 정보는, 도 22에 나타내는, intra_pred_type, inter_pred_type, 또는 ilf_type이다. 선형 처리는, 종래의 인트라 예측, 인터 예측 및 루프 내 필터 중 적어도 하나이며, 고정된 파라미터(가중 계수 등)를 가지는 선형 필터를 이용한다.
이것에 의해, 비선형 처리와 선형 처리가 변환되기 때문에, 부호량과 화상의 왜곡(화질)에 의해서 정의되는 평가치가 높은 처리를 선택할 수 있고, 부호량 및 화질 열화를 모두 억제할 수 있다.
또, 비선형 처리는, 복수의 모드 중 어느 하나의 모드에 대응지어지고, 화상의 복호에서는, 모드가 지정되는 경우에, 비선형 처리를 행하여 화상을 복호해도 된다.
이것에 의해, 예를 들면 도 22에 나타내는 nn_intra_pred_mode, nn_inter_pred_mode, 및 nn_ilf_mode 등의 모드가 지정되는 것에 의해서, 그 모드에 대응하는 적절한 비선형 처리를 행할 수 있다.
또, 화상 복호 방법에서는, 또한, 지정된 모드를 나타내는 정보를 복호해도 된다.
이것에 의해, 예를 들면 도 22~도 26에 나타내는 바와 같이, 모드를 나타내는 정보가 복호되기 때문에, 화상 부호화 장치로부터 통지되는 그 모드에 따라서, 적절하게 화상을 복호할 수 있다.
또, 화상 복호 방법에서는, 또한, 화상에 포함되는 블록, 슬라이스, 타일, 픽처 또는 GOP(Group Of Picture)인 화상 단위마다, 연산 파라미터를 전환하고, 화상의 복호에서는, 화상 단위에 대해서 전환된 연산 파라미터를 가지는 비선형 필터를 이용한 비선형 처리를 행하여, 화상 단위를 복호해도 된다. 예를 들면, 연산 파라미터의 복호에서는, 화상에 포함되는, 시퀀스, GOP 및 픽처 중 적어도 하나의 선두에 있어서, 복수의 비선형 필터의 각각에 대응하는, 제1 식별자에 관련시켜진 연산 파라미터를 복호하고, 화상의 복호에서는 화상 단위마다, 그 제1 식별자에 의해서 연산 파라미터를 지정하며, 지정된 연산 파라미터의 비선형 필터를 이용한 비선형 처리를 행하여 화상을 복호한다.
예를 들면, 도 16~도 18에 나타내는 바와 같이, 화상 단위마다, pps_nps_id 또는 slice_nps_id 등의 제1 식별자에 의해서, 그 제1 식별자와 동일한 nps_id에 관련시켜진 연산 파라미터(nn_intra_pred_parameter_data(), nn_inter_pred_parameter_data() 또는 nn_ilf_parameter_data())가 지정된다. 이것에 의해, 연산 파라미터를 화상 단위마다 적절하게 이용할 수 있다.
또, 화상 복호 방법에서는, 또한, 비선형 필터가 유효인지 무효인지를 나타내는 유효/무효 정보를 복호하고, 화상의 복호에서는, 그 유효/무효 정보가 유효를 나타내는 경우에, 비선형 처리를 행해도 된다.
예를 들면, 도 15에 나타내는 nn_intra_pred_enabled_flag 등의 플래그인 유효/무효 정보가 복호되고, 그 플래그가 유효를 나타내는 경우에, NN 인트라 예측 등의 비선형 처리가 행해진다. 이것에 의해, 화상 복호 장치는, 유효/무효 정보가 무효를 나타내는 경우에는, 연산 파라미터 등에 대한 처리를 생략할 수 있고 간단하게 화상을 복호할 수 있다.
또, 역변환에서는, 화상에 있어서의 주파수 영역으로부터 공간 영역으로의 역변환을 행하고, 비선형 필터를 이용한 인트라 예측 또는 인터 예측이 행해지는지, 선형 필터를 이용한 인트라 예측 또는 인터 예측이 행해지는지에 따라서, 역변환의 방법을 전환해도 좋다. 예를 들면, 역변환에서는, 비선형 필터를 이용한 인트라 예측이 행해지는 경우에는, 역변환의 방법을, 변경 가능한 변환 행렬을 이용한 방법으로 전환하고, 변경 가능한 변환 행렬을 이용한 방법에 따라서 역변환을 행해도 된다.
예를 들면 도 48에 나타내는 바와 같이, 비선형 필터를 이용한 인트라 예측(NN 인트라 예측)이 행해지는 경우에는, 역KL 변환 등의, 변경 가능한 변환 행렬을 이용한 방법에 따라 변환이 행해지고, 선형 필터를 이용한 인트라 예측(종래의 인트라 예측)이 행해지는 경우에는, 역이산 코사인 변환 등의 역고정 변환에 의해서 역변환이 행해진다. 이것에 의해, NN 인트라 예측과 같은 비선형 처리가 행해지는 경우에는, 그 비선형 처리에 적합한 역변환을 행할 수 있고 부호화 효율을 향상시킬 수 있다.
또, 화상의 복호에서는, 화상에 포함되는 블록이 소정의 사이즈 이하인 경우에는, 비선형 필터를 이용한 인트라 예측을 비선형 처리로서 그 블록에 대해서 행하고, 블록이 소정의 사이즈보다 큰 경우에는 고정 파라미터의 선형 필터를 이용한 인트라 예측을 그 블록에 대해서 행해도 된다.
예를 들면 도 45에 나타내는 바와 같이, 화상에 포함되는 블록(예측 블록)이 4×4 화소의 사이즈 이하인 경우에는, NN 인트라 예측이 예측 블록에 대해서 행해지고, 4×4 화소의 사이즈보다 큰 경우에는, 고정 인트라 예측이 예측 블록에 대해서 행해진다. 이것에 의해, 예측 성능의 저하를 억제하면서 연산 파라미터의 데이터량을 삭감할 수 있어 부호화 효율을 향상시킬 수 있다.
또, 화상의 복호에서는, 화상 중 휘도 성분에 대해서 비선형 처리를 행하고, 화상 중 색차 성분에 대해서는 인트라 예측, 인터 예측 및 루프 내 필터 중 적어도 하나에 있어서, 입출력 관계가 선형이 되는 선형 처리를 행해도 된다.
예를 들면 도 45~도 47에 나타내는 바와 같이, 휘도 성분에 대해서는, NN 인트라 예측, NN 인터 예측, 또는 NN 루프 내 필터가 행해지고, 색차 성분에 대해서는, 고정 인트라 예측, 고정 인터 예측, 또는 고정 루프 내 필터가 행해진다. 또한, 고정 인트라 예측, 고정 인터 예측, 및 고정 루프 내 필터의 각각은, 고정 파라미터를 가지는 선형 필터를 이용하여 행해지는 종래의 인터 예측, 인트라 예측 또는 루프 내 필터이다. 이것에 의해, 예측 정밀도의 저하나 노이즈 증가를 억제하면서 연산 파라미터의 데이터량을 삭감할 수 있고 부호화 효율을 향상시킬 수 있다.
또, 연산 파라미터의 복호에서는, 복호 대상의 연산 파라미터와는 상이한 복호 완료된 연산 파라미터를 참조하여, 복호 대상의 연산 파라미터를 복호해도 된다. 구체적으로는, 연산 파라미터의 복호에서는, 복호 대상의 연산 파라미터와 복호 완료된 연산 파라미터와의 차분을 복호한다.
이것에 의해, 예를 들면 도 65~도 67에 나타내는 바와 같이, 연산 파라미터를 효율적으로 복호할 수 있다.
또, 비선형 처리에는, 복수의 모드가 있고, 복호 완료된 연산 파라미터는, 복호 대상의 연산 파라미터에 대응하는 비선형 처리의 모드와는 상이한 다른 모드의 비선형 처리의 복호 완료된 연산 파라미터여도 된다.
이것에 의해, 예를 들면 도 67의 단계 S595 및 S599에 나타내는 바와 같이, 연산 파라미터(가중 계수)를 효율적으로 복호할 수 있다. 또한, 단계 S595에 있어서의 참조 모드의 계층 i의 노드 j의 입력 노드 m의 가중 계수는, 복호 완료된 연산 파라미터이다.
또, 복호 완료된 연산 파라미터는, 복호 대상의 연산 파라미터의 직전에 복호된 연산 파라미터여도 된다.
이것에 의해, 예를 들면 도 67의 단계 S598 및 S599에 나타내는 바와 같이, 연산 파라미터(가중 계수)를 효율적으로 복호할 수 있다. 또한, 단계 S598에 있어서의 직전의 입력 노드의 가중 계수는, 복호 완료된 연산 파라미터이다.
또, 연산 파라미터의 복호에서는, 미리 규정된 파라미터인 규정 파라미터를 참조하여, 복호 대상의 연산 파라미터를 복호해도 된다.
이것에 의해, 예를 들면 도 67의 단계 S594 및 S599에 나타내는 바와 같이, 연산 파라미터(가중 계수)를 효율적으로 복호할 수 있다. 또한, 단계 S594에 있어서의 프리셋 ID의 프리셋의 계층 i의 노드 j의 입력 노드 m의 가중 계수는, 미리 규정된 파라미터인 규정 파라미터이다.
또, 화상 복호 방법에서는, 또한, 제2 식별자를 복호하고, 연산 파라미터의 복호에서는, 미리 정해진 복수의 파라미터 중 어느 하나의 파라미터를, 그 제2 식별자를 이용하여 지정하고, 지정된 파라미터를 규정 파라미터로서 참조해도 된다.
예를 들면, 도 63의 단계 S537에 있어서, 프리셋 ID가 제2 식별자로서 복호된다. 이것에 의해, 적절한 규정 파라미터를 선택할 수 있고, 연산 파라미터를 보다 효율적으로 복호할 수 있다.
또한, 이러한 포괄적 또는 구체적인 양태는, 시스템, 방법, 장치, 집적 회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록 매체로 실현되어도 되고, 시스템, 방법, 장치, 집적 회로, 컴퓨터 프로그램 및 기록 매체의 임의인 조합으로 실현되어도 된다.
(실시의 형태 7)
상기 각 실시의 형태에서 나타낸 동화상 부호화 방법(화상 부호화 방법) 또는 동화상 복호화 방법(화상 복호 방법)의 구성을 실현하기 위한 프로그램을 기억 미디어에 기록함으로써, 상기 각 실시의 형태에서 나타낸 처리를 독립한 컴퓨터 시스템에 있어서 간단하게 실시하는 것이 가능해진다. 기억 미디어는, 자기 디스크, 광디스크, 광자기 디스크, IC 카드, 반도체 메모리 등, 프로그램을 기록할 수 있는 것이면 괜찮다.
또한 여기에서, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법(화상 부호화 방법)이나 동화상 복호화 방법(화상 복호 방법)의 응용예와 그것을 이용한 시스템을 설명한다. 당해 시스템은, 화상 부호화 방법을 이용한 화상 부호화 장치, 및 화상 복호 방법을 이용한 화상 복호 장치로 이루어지는 화상 부호화 복호 장치를 가지는 것을 특징으로 한다. 시스템에 있어서의 다른 구성에 대해서, 경우에 따라 적절하게 변경할 수 있다.
도 71은, 컨텐츠 전송 서비스를 실현하는 컨텐츠 공급 시스템(ex100)의 전체 구성을 나타내는 도면이다. 통신 서비스의 제공 에리어를 원하는 크기로 분할하고, 각 셀 내에 각각 고정 무선국인 기지국(ex106, ex107, ex108, ex109, ex110)이 설치되어 있다.
이 컨텐츠 공급 시스템(ex100)은, 인터넷(ex101)에 인터넷 서비스 프로바이더(ex102) 및 전화망(ex104), 및 기지국(ex106부터 ex110)을 개재하여, 컴퓨터(ex111), PDA(Personal Digital Assistant)(ex112), 카메라(ex113), 휴대 전화(ex114), 게임기(ex115) 등의 각 기기가 접속된다.
그러나, 컨텐츠 공급 시스템(ex100)은 도 71과 같은 구성에 한정되지 않고, 어느 하나의 요소를 조합하여 접속하도록 해도 된다. 또, 고정 무선국인 기지국(ex106부터 ex110)을 개재하지 않고, 각 기기가 전화망(ex104)에 직접 접속되어도 된다. 또, 각 기기가 근거리 무선 등을 개재하여 직접 서로 접속되어 있어도 된다.
카메라(ex113)는 디지털 비디오 카메라 등의 동영상 촬영이 가능한 기기이며, 카메라(ex116)는 디지털카메라 등의 정지 화상 촬영, 동영상 촬영이 가능한 기기이다. 또, 휴대 전화(ex114)는, GSM(등록상표)(Global System for Mobile Communications) 방식, CDMA(Code Division Multiple Access) 방식, W-CDMA(Wideband-Code Division Multiple Access) 방식, 혹은 LTE(Long Term Evolution) 방식, HSPA(High Speed Packet Access)의 휴대 전화기, 또는 PHS(Personal Handyphone System) 등이며, 어느 하나라도 상관없다.
컨텐츠 공급 시스템(ex100)에서는, 카메라(ex113) 등이 기지국(ex109), 전화망(ex104)을 통해서 스트리밍 서버(ex103)에 접속됨으로써, 라이브 전송 등이 가능해진다. 라이브 전송에서는, 사용자가 카메라(ex113)를 이용하여 촬영하는 컨텐츠(예를 들면, 음악 라이브의 영상 등)에 대해서 상기 각 실시의 형태에서 설명한 바와 같이 부호화 처리를 행하여(즉, 본 개시된 일 양태에 따른 화상 부호화 장치로서 기능한다), 스트리밍 서버(ex103)에 송신한다. 한편, 스트리밍 서버(ex103)는 요구가 있던 클라이언트에 대해서 송신된 컨텐츠 데이터를 스트림 전송한다. 클라이언트로서는, 상기 부호화 처리된 데이터를 복호화하는 것이 가능한, 컴퓨터(ex111), PDA(ex112), 카메라(ex113), 휴대 전화(ex114), 게임기(ex115) 등이 있다. 전송된 데이터를 수신한 각 기기에서는, 수신한 데이터를 복호화 처리하여 재생한다(즉, 본 개시된 일 양태에 따른 화상 복호 장치로서 기능한다).
또한, 촬영한 데이터의 부호화 처리는 카메라(ex113)에서 행해도, 데이터의 송신 처리를 하는 스트리밍 서버(ex103)에서 행해도 되고, 서로 분담하여 행해도 된다. 동일하게 전송된 데이터의 복호화 처리는 클라이언트에서 행해도, 스트리밍 서버(ex103)에서 행해도 되고, 서로 분담해서 행해도 된다. 또, 카메라(ex113)에 한정하지 않고, 카메라(ex116)로 촬영한 정지 화상 및/또는 동화상 데이터를, 컴퓨터(ex111)를 개재하여 스트리밍 서버(ex103)에 송신해도 된다. 이 경우의 부호화 처리는 카메라(ex116), 컴퓨터(ex111), 스트리밍 서버(ex103) 중 어느 하나에서 행해도 되고, 서로 분담하여 행해도 된다.
또, 이들 부호화·복호화 처리는, 일반적으로 컴퓨터(ex111)나 각 기기가 가지는 LSI(ex500)에 있어서 처리한다. LSI(ex500)는, 원칩이어도 복수칩으로 이루어지는 구성이어도 된다. 또한, 동화상 부호화·복호화용의 소프트웨어를 컴퓨터(ex111) 등으로 판독 가능한 어떠한 기록 미디어(CD-ROM, 플랙시블 디스크, 하드 디스크 등)에 내장하고, 그 소프트웨어를 이용하여 부호화·복호화 처리를 행해도 된다. 또한, 휴대 전화(ex114)가 카메라 부착인 경우에는, 그 카메라로 취득한 동영상 데이터를 송신해도 된다. 이때의 동영상 데이터는 휴대 전화(ex114)가 가지는 LSI(ex500)로 부호화 처리된 데이터이다.
또, 스트리밍 서버(ex103)는 복수의 서버나 복수의 컴퓨터로서, 데이터를 분산하여 처리하거나 기록하거나 전송하는 것이어도 된다.
이상과 같이 하여, 컨텐츠 공급 시스템(ex100)에서는, 부호화된 데이터를 클라이언트가 수신하여 재생할 수 있다. 이와 같이 컨텐츠 공급 시스템(ex100)에서는, 사용자가 송신한 정보를 실시간으로 클라이언트가 수신하여 복호화하고, 재생할 수 있어 특별한 권리나 설비를 갖지 않는 사용자라도 개인 방송을 실현할 수 있다.
또한, 컨텐츠 공급 시스템(ex100)의 예에 한정하지 않고, 도 72에 나타내는 바와 같이, 디지털 방송용 시스템(ex200)에도, 상기 각 실시의 형태의 적어도 동화상 부호화 장치(화상 부호화 장치) 또는 동화상 복호화 장치(화상 복호 장치) 중 어느 하나를 내장할 수 있다. 구체적으로는, 방송국(ex201)에서는 영상 데이터에 음악 데이터 등이 다중화된 다중화 데이터가 전파를 개재하여 통신 또는 위성(ex202)에 전송된다. 이 영상 데이터는 상기 각 실시의 형태에서 설명한 동화상 부호화 방법에 의해 부호화된 데이터이다(즉, 본 개시된 일 양태에 따른 화상 부호화 장치에 의해서 부호화된 데이터이다). 이것을 받은 방송 위성(ex202)은, 방송용의 전파를 발신하고, 이 전파를 위성 방송의 수신이 가능한 가정의 안테나(ex204)가 수신한다. 수신한 다중화 데이터를, 텔레비전(수신기)(ex300) 또는 셋탑 박스(STB)(ex217) 등의 장치가 복호화하여 재생한다(즉, 본 개시된 일 양태에 따른 화상 복호 장치로서 기능한다).
또, DVD, BD 등의 기록 미디어(ex215)에 기록한 다중화 데이터를 판독하여 복호화하거나, 또는 기록 미디어(ex215)에 영상 신호를 부호화하고, 또한 경우에 따라서는 음악 신호와 다중화하여 기록하는 리더/레코더(ex218)에도 상기 각 실시의 형태에서 나타낸 동화상 복호화 장치 또는 동화상 부호화 장치를 실장하는 것이 가능하다. 이 경우, 재생된 영상 신호는 모니터(ex219)에 표시되고, 다중화 데이터가 기록된 기록 미디어(ex215)에 의해 다른 장치나 시스템에 있어서 영상 신호를 재생할 수 있다. 또, 케이블 텔레비전용 케이블(ex203) 또는 위성/지상파 방송의 안테나(ex204)에 접속된 셋탑 박스(ex217) 내에 동화상 복호화 장치를 실장하고, 이것을 텔레비전의 모니터(ex219)로 표시해도 된다. 이때 셋탑 박스가 아니고, 텔레비전 내에 동화상 복호화 장치를 내장해도 된다.
도 73은, 상기 각 실시의 형태에서 설명한 동화상 복호화 방법 및 동화상 부호화 방법을 이용한 텔레비전(수신기)(ex300)을 나타내는 도면이다. 텔레비전(ex300)은, 상기 방송을 수신하는 안테나(ex204) 또는 케이블(ex203) 등을 개재하여 영상 데이터에 음성 데이터가 다중화된 다중화 데이터를 취득하고, 또는 출력하는 튜너(ex301)와 수신한 다중화 데이터를 복조하거나, 또는 외부로 송신하는 다중화 데이터에 변조하는 변조/복조부(ex302)와, 복조한 다중화 데이터를 영상 데이터와 음성 데이터로 분리하거나, 또는 신호 처리부(ex306)에서 부호화된 영상 데이터, 음성 데이터를 다중화하는 다중/분리부(ex303)를 구비한다.
또, 텔레비전(ex300)은, 음성 데이터, 영상 데이터 각각을 복호화하거나, 또는 각각의 정보를 부호화하는 음성 신호 처리부(ex304), 영상 신호 처리부(ex305)(본 개시된 일 양태에 따른 화상 부호화 장치 또는 화상 복호 장치로서 기능한다)를 가지는 신호 처리부(ex306)와, 복호화한 음성 신호를 출력하는 스피커(ex307), 복호화한 영상 신호를 표시하는 디스플레이 등의 표시부(ex308)를 가지는 출력부(ex309)를 가진다. 또한, 텔레비전(ex300)은 사용자 조작의 입력을 접수하는 조작 입력부(ex312) 등을 가지는 인터페이스부(ex317)를 가진다. 또한, 텔레비전(ex300)은 각부를 통괄적으로 제어하는 제어부(ex310), 각부에 전력을 공급하는 전원 회로부(ex311)를 가진다. 인터페이스부(ex317)는, 조작 입력부(ex312) 이외에, 리더/레코더(ex218) 등의 외부 기기와 접속되는 브릿지(ex313), SD 카드 등의 기록 미디어(ex216)를 장착 가능하게 하기 위한 슬롯부(ex314), 하드 디스크 등의 외부 기록 미디어와 접속하기 위한 드라이버(ex315), 전화망과 접속하는 모뎀(ex316) 등을 가지고 있어도 된다. 또한 기록 미디어(ex216)는, 저장하는 불휘발성/휘발성의 반도체 메모리 소자에 의해 전기적으로 정보의 기록을 가능하게 한 것이다. 텔레비전(ex300)의 각부는 동기 버스를 개재하여 서로 접속되고 있다.
우선, 텔레비전(ex300)이 안테나(ex204) 등에 의해 외부로부터 취득한 다중화 데이터를 복호화하고, 재생하는 구성에 대해 설명한다. 텔레비전(ex300)은, 리모트 콘트롤러(ex220) 등으로부터의 사용자 조작을 받아 CPU 등을 가지는 제어부(ex310)의 제어에 의거하여, 변조/복조부(ex302)에서 복조한 다중화 데이터를 다중/분리부(ex303)에서 분리한다. 또한 텔레비전(ex300)은, 분리한 음성 데이터를 음성 신호 처리부(ex304)에서 복호화하고, 분리한 영상 데이터를 영상 신호 처리부(ex305)에서 상기 각 실시의 형태에서 설명한 복호화 방법을 이용하여 복호화한다. 복호화한 음성 신호, 영상 신호는, 각각 출력부(ex309)로부터 외부를 향해서 출력된다. 출력할 때, 음성 신호와 영상 신호가 동기하여 재생하도록, 버퍼(ex318, ex319) 등에 일단 이러한 신호를 축적하면 된다. 또, 텔레비전(ex300)은, 방송 등으로부터가 아니라, 자기/광디스크, SD 카드 등의 기록 미디어(ex215, ex216)로부터 다중화 데이터를 읽어내도 된다. 다음에, 텔레비전(ex300)이 음성 신호나 영상 신호를 부호화하고, 외부로 송신 또는 기록 미디어 등에 기록하는 구성에 대해 설명한다. 텔레비전(ex300)은, 리모트 콘트롤러(ex220) 등으로부터의 사용자 조작을 받아, 제어부(ex310)의 제어에 의거하여, 음성 신호 처리부(ex304)에서 음성 신호를 부호화하며, 영상 신호 처리부(ex305)에서 영상 신호를 상기 각 실시의 형태에서 설명한 부호화 방법을 이용하여 부호화한다. 부호화한 음성 신호, 영상 신호는 다중/분리부(ex303)에서 다중화되어 외부로 출력된다. 다중화할 때, 음성 신호와 영상 신호가 동기하도록 버퍼(ex320, ex321) 등에 일단 이러한 신호를 축적하면 된다. 또한, 버퍼(ex318, ex319, ex320, ex321)는 도시하고 있듯이 복수 구비하고 있어도 되고, 하나 이상의 버퍼를 공유하는 구성이어도 된다. 또한, 도시하고 있는 이외에, 예를 들면 변조/복조부(ex302)나 다중/분리부(ex303)의 사이 등에서도 시스템의 오버 플로우, 언더 플로우를 피하는 완충재로서 버퍼에 데이터를 축적하는 것으로 해도 된다.
또, 텔레비전(ex300)은, 방송 등이나 기록 미디어 등으로부터 음성 데이터, 영상 데이터를 취득하는 것 외에, 마이크나 카메라의 AV 입력을 받아들이는 구성을 구비하고, 그들로부터 취득한 데이터에 대해서 부호화 처리를 행해도 된다. 또한, 여기에서는 텔레비전(ex300)은 상기의 부호화 처리, 다중화, 및 외부 출력을 행할 수 있는 구성으로서 설명했지만, 이러한 처리를 행할 수 없고, 상기 수신, 복호화 처리, 외부 출력만이 가능한 구성이어도 된다.
또, 리더/레코더(ex218)에서 기록 미디어로부터 다중화 데이터를 독출하거나, 또는 기록하는 경우에는, 상기 복호화 처리 또는 부호화 처리는 텔레비전(ex300), 리더/레코더(ex218) 중 어느 하나에서 행해도 되고, 텔레비전(ex300)과 리더/레코더(ex218)가 서로 분담하여 행해도 된다.
일례로서 광디스크로부터 데이터의 독출 또는 기록을 하는 경우의 정보 재생/기록부(ex400)의 구성을 도 74에 나타낸다. 정보 재생/기록부(ex400)는, 이하에 설명하는 요소(ex401, ex402, ex403, ex404, ex405, ex406, ex407)를 구비한다. 광헤드(ex401)는, 광디스크인 기록 미디어(ex215)의 기록면에 레이저 스폿을 조사하여 정보를 기입하고, 기록 미디어(ex215)의 기록면으로부터의 반사광을 검출하여 정보를 독출한다. 변조 기록부(ex402)는, 광헤드(ex401)에 내장된 반도체 레이저를 전기적으로 구동하여 기록 데이터에 따라 레이저광의 변조를 행한다. 재생 복조부(ex403)는, 광헤드(ex401)에 내장된 포토디텍터에 의해 기록면으로부터의 반사광을 전기적으로 검출한 재생 신호를 증폭하고, 기록 미디어(ex215)에 기록된 신호 성분을 분리하여 복조해 필요한 정보를 재생한다. 버퍼(ex404)는, 기록 미디어(ex215)에 기록하기 위한 정보 및 기록 미디어(ex215)로부터 재생한 정보를 일시적으로 유지한다. 디스크 모터(ex405)는 기록 미디어(ex215)를 회전시킨다. 서보 제어부(ex406)는, 디스크 모터(ex405)의 회전 구동을 제어하면서 광헤드(ex401)를 소정의 정보 트랙으로 이동시키고, 레이저 스폿의 추종 처리를 행한다. 시스템 제어부(ex407)는, 정보 재생/기록부(ex400) 전체의 제어를 행한다. 상기의 독출이나 기입의 처리는 시스템 제어부(ex407)가, 버퍼(ex404)에 유지된 각종 정보를 이용하여, 또 필요에 따라 새로운 정보의 생성·추가를 행함과 더뷸어, 변조 기록부(ex402), 재생 복조부(ex403), 서보 제어부(ex406)를 협조 동작시키면서, 광헤드(ex401)를 통하여, 정보의 기록 재생을 행함으로써 실현된다. 시스템 제어부(ex407)는 예를 들면 마이크로 프로세서로 구성되고, 독출 기입의 프로그램을 실행함으로써 그러한 처리를 실행한다.
이상에서는, 광헤드(ex401)는 레이저 스폿을 조사한다고 하여 설명했지만, 근접장광을 이용하여 보다 고밀도인 기록을 행하는 구성이어도 된다.
도 75에 광디스크인 기록 미디어(ex215)의 모식도를 나타낸다. 기록 미디어(ex215)의 기록면에는 안내 홈(그루브)이 스파이럴형상으로 형성되고, 정보 트랙(ex230)에는, 미리 그루브의 형상의 변화에 의해서 디스크상의 절대 위치를 나타내는 번지 정보가 기록되어 있다. 이 번지 정보는 데이터를 기록하는 단위인 기록 블록(ex231)의 위치를 특정하기 위한 정보를 포함하고, 기록이나 재생을 행하는 장치에 있어서 정보 트랙(ex230)을 재생하여 번지 정보를 판독함으로써 기록 블록을 특정할 수 있다. 또, 기록 미디어(ex215)는, 데이터 기록 영역(ex233), 내주 영역(ex232), 외주 영역(ex234)을 포함하고 있다. 사용자 데이터를 기록하기 위해서 이용하는 영역이 데이터 기록 영역(ex233)이며, 데이터 기록 영역(ex233)보다 내주 또는 외주에 배치되어 있는 내주 영역(ex232)과 외주 영역(ex234)은, 사용자 데이터의 기록 이외의 특정 용도로 이용된다. 정보 재생/기록부(ex400)는, 이러한 기록 미디어(ex215)의 데이터 기록 영역(ex233)에 대해서, 부호화된 음성 데이터, 영상 데이터 또는 그러한 데이터를 다중화한 다중화 데이터의 읽고 쓰기를 행한다.
이상에서는, 1층의 DVD, BD 등의 광디스크를 예로 들어 설명했지만, 이들에 한정한 것은 아니고, 다층 구조이며 표면 이외에도 기록 가능한 광디스크여도 괜찮다. 또, 디스크의 동일한 장소에 다양한 상이한 파장의 색의 광을 이용하여 정보를 기록하거나, 다양한 각도로부터 상이한 정보의 층을 기록하거나, 다차원적인 기록/재생을 행하는 구조의 광디스크여도 괜찮다.
또, 디지털 방송용 시스템(ex200)에 있어서, 안테나(ex205)를 가지는 차(ex210)와 위성(ex202) 등으로부터 데이터를 수신하고, 차(ex210)가 가지는 카 내비게이션(car navigation)(ex211) 등의 표시 장치에 동영상을 재생하는 것도 가능하다. 또한, 카 내비게이션(car navigation)(ex211)의 구성은 예를 들면 도 73에 나타내는 구성 가운데, GPS 수신부를 더한 구성을 생각할 수 있고, 동일한 것이 컴퓨터(ex111)나 휴대 전화(ex114) 등에서도 생각된다.
도 76a는, 상기 실시의 형태에서 설명한 동화상 복호화 방법 및 동화상 부호화 방법을 이용한 휴대 전화(ex114)를 나타내는 도면이다. 휴대 전화(ex114)는, 기지국(ex110)과의 사이에 전파를 송수신하기 위한 안테나(ex350), 영상, 정지 화상을 찍는 것이 가능한 카메라부(ex365), 카메라부(ex365)로 촬상한 영상, 안테나(ex350)로 수신한 영상 등이 복호화된 데이터를 표시하는 액정 디스플레이 등의 표시부(ex358)를 구비한다. 휴대 전화(ex114)는, 또한, 조작 키부(ex366)를 가지는 본체부, 음성을 출력하기 위한 스피커 등인 음성 출력부(ex357), 음성을 입력하기 위한 마이크 등인 음성 입력부(ex356), 촬영한 영상, 정지 화상, 녹음한 음성, 또는 수신한 영상, 정지 화상, 메일 등의 부호화된 데이터 혹은 복호화된 데이터를 보존하는 메모리부(ex367), 또는 동일하게 데이터를 보존하는 기록 미디어와의 인터페이스부인 슬롯부(ex364)를 구비한다.
또한, 휴대 전화(ex114)의 구성예에 대해서, 도 76b를 이용하여 설명한다. 휴대 전화(ex114)는, 표시부(ex358) 및 조작 키부(ex366)를 구비한 본체부의 각부를 통괄적으로 제어하는 주제어부(ex360)에 대해서, 전원 회로부(ex361), 조작 입력 제어부(ex362), 영상 신호 처리부(ex355), 카메라 인터페이스부(ex363), LCD(Liquid Crystal Display) 제어부(ex359), 변조/복조부(ex352), 다중/분리부(ex353), 음성 신호 처리부(ex354), 슬롯부(ex364), 메모리부(ex367)가 버스(ex370)를 개재하여 서로 접속되고 있다.
전원 회로부(ex361)는, 사용자의 조작에 의해 종화 및 전원 키가 온 상태로 되면, 배터리 팩으로부터 각부에 대해서 전력을 공급함으로써 휴대 전화(ex114)를 동작 가능한 상태로 기동한다.
휴대 전화(ex114)는, CPU, ROM, RAM 등을 가지는 주제어부(ex360)의 제어에 의거하여, 음성 통화 모드시에 음성 입력부(ex356)에서 수음(收音)한 음성 신호를 음성 신호 처리부(ex354)에서 디지털 음성 신호로 변환하고, 이것을 변조/복조부(ex352)에서 스펙트럼 확산 처리하여, 송신/수신부(ex351)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나(ex350)를 개재하여 송신한다. 또 휴대 전화(ex114)는, 음성 통화 모드시에 안테나(ex350)를 개재하여 수신한 수신 데이터를 증폭하여 주파수 변환 처리 및 아날로그 디지털 변환 처리를 실시하고, 변조/복조부(ex352)에서 스펙트럼 역확산 처리하며, 음성 신호 처리부(ex354)에서 아날로그 음성 신호로 변환한 후, 이것을 음성 출력부(ex357)로부터 출력한다.
또한 데이터 통신 모드시에 전자 메일을 송신하는 경우, 본체부의 조작 키부(ex366) 등의 조작에 의해서 입력된 전자 메일의 텍스트 데이터는 조작 입력 제어부(ex362)를 개재하여 주제어부(ex360)에 송출된다. 주제어부(ex360)는, 텍스트 데이터를 변조/복조부(ex352)에서 스펙트럼 확산 처리를 하고, 송신/수신부(ex351)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 행한 후에 안테나(ex350)를 개재하여 기지국(ex110)에 송신한다. 전자 메일을 수신하는 경우는, 수신한 데이터에 대해서 이 거의 반대의 처리가 행해지고 표시부(ex358)에 출력된다.
데이터 통신 모드시에 영상, 정지 화상, 또는 영상과 음성을 송신하는 경우, 영상 신호 처리부(ex355)는, 카메라부(ex365)로부터 공급된 영상 신호를 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법에 의해 압축 부호화하고(즉, 본 개시된 일 양태에 따른 화상 부호화 장치로서 기능한다), 부호화된 영상 데이터를 다중/분리부(ex353)에 송출한다. 또, 음성 신호 처리부(ex354)는, 영상, 정지 화상 등을 카메라부(ex365)에서 촬상 중에 음성 입력부(ex356)에서 수음한 음성 신호를 부호화하고, 부호화된 음성 데이터를 다중/분리부(ex353)에 송출한다.
다중/분리부(ex353)는, 영상 신호 처리부(ex355)로부터 공급된 부호화된 영상 데이터와 음성 신호 처리부(ex354)로부터 공급된 부호화된 음성 데이터를 소정의 방식으로 다중화하고, 그 결과 얻어지는 다중화 데이터를 변조/복조부(변조/복조 회로부)(ex352)에서 스펙트럼 확산 처리를 하고, 송신/수신부(ex351)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나(ex350)를 개재하여 송신한다.
데이터 통신 모드시에 홈페이지 등에 링크된 동화상 파일의 데이터를 수신하는 경우, 또는 영상 및 혹은 음성이 첨부된 전자 메일을 수신하는 경우, 안테나(ex350)를 개재하여 수신된 다중화 데이터를 복호화하기 위해서, 다중/분리부(ex353)는 다중화 데이터를 분리함으로써 영상 데이터의 비트 스트림과 음성 데이터의 비트 스트림으로 나누어 동기 버스(ex370)를 개재하여 부호화된 영상 데이터를 영상 신호 처리부(ex355)에 공급함과 더불어, 부호화된 음성 데이터를 음성 신호 처리부(ex354)에 공급한다. 영상 신호 처리부(ex355)는, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법에 대응한 동화상 복호화 방법에 따라 복호화함으로써 영상 신호를 복호하고(즉, 본 개시된 일 양태에 따른 화상 복호 장치로서 기능한다), LCD 제어부(ex359)를 개재하여 표시부(ex358)로부터, 예를 들면 홈페이지에 링크된 동화상 파일에 포함되는 영상, 정지 화상이 표시된다. 또 음성 신호 처리부(ex354)는, 음성 신호를 복호하고, 음성 출력부(ex357)로부터 음성이 출력된다.
또, 상기 휴대 전화(ex114) 등의 단말은, 텔레비전(ex300)과 동일하게, 부호화기·복호화기를 모두 가지는 송수신형 단말 외에, 부호화기만의 송신 단말, 복호화기만의 수신 단말이라고 하는 3가지의 실장 형식이 생각된다. 또한, 디지털 방송용 시스템(ex200)에 있어서, 영상 데이터에 음악 데이터 등이 다중화된 다중화 데이터를 수신, 송신한다고 하여 설명했지만, 음성 데이터 이외에 영상에 관련된 문자 데이터 등이 다중화된 데이터여도 되고, 다중화 데이터는 아니라 영상 데이터 자체여도 된다.
이와 같이, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 혹은 동화상 복호화 방법을 상술한 어느 하나의 기기·시스템에 이용하는 것은 가능하고, 그렇게 함으로써, 상기 각 실시의 형태에서 설명한 효과를 얻을 수 있다.
또, 본 개시는 이러한 상기 실시의 형태에 한정되는 것이 아니며, 본 개시된 범위를 일탈하지 않고 여러 가지의 변형 또는 수정이 가능하다.
(실시의 형태 8)
상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치와 MPEG-2, MPEG4-AVC, VC-1 등 상이한 규격에 준거한 동화상 부호화 방법 또는 장치를, 필요에 따라서 적절히 변환함으로써, 영상 데이터를 생성하는 것도 가능하다.
여기서, 각각 상이한 규격에 준거하는 복수의 영상 데이터를 생성한 경우, 복호할 때에, 각각의 규격에 대응한 복호 방법을 선택할 필요가 있다. 그러나, 복호하는 영상 데이터가, 어느 규격에 준거하는 것인지 식별할 수 없기 때문에, 적절한 복호 방법을 선택할 수 없다는 과제를 일으킨다.
이 과제를 해결하기 위해서, 영상 데이터에 음성 데이터 등을 다중화한 다중화 데이터는, 영상 데이터가 어느 규격에 준거하는 것인지를 나타내는 식별 정보를 포함하는 구성으로 한다. 상기 각 실시의 형태에서 나타내는 동화상 부호화 방법 또는 장치에 의해서 생성된 영상 데이터를 포함하는 다중화 데이터의 구체적인 구성을 이하 설명한다. 다중화 데이터는, MPEG-2 트랜스포트 스트림 형식의 디지털 스트림이다.
도 77은, 다중화 데이터의 구성을 나타내는 도면이다. 도 77에 나타내는 바와 같이 다중화 데이터는, 비디오 스트림, 오디오 스트림, 프레젠테이션 그래픽스 스트림(PG), 인터랙티브 그래픽스 스트림 중, 하나 이상을 다중화함으로써 얻어진다. 비디오 스트림은 영화의 주영상 및 부영상을, 오디오 스트림(IG)은 영화의 주음성 부분과 그 주음성과 믹싱하는 부음성을, 프레젠테이션 그래픽스 스트림은 영화의 자막을 각각 나타내고 있다. 여기서 주영상이란 화면에 표시되는 통상의 영상을 나타내고, 부영상이란 주영상 안에 작은 화면으로 표시하는 영상이다. 또, 인터랙티브 그래픽스 스트림은, 화면상에 GUI 부품을 배치함으로써 작성되는 대화 화면을 나타내고 있다. 비디오 스트림은, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거한 동화상 부호화 방법 또는 장치에 의해서 부호화되어 있다. 오디오 스트림은, 돌비 AC-3, Dolby Digital Plus, MLP, DTS, DTS-HD, 또는, 리니어 PCM 등의 방식으로 부호화되어 있다.
다중화 데이터에 포함되는 각 스트림은 PID에 의해서 식별된다. 예를 들면, 영화의 영상에 이용하는 비디오 스트림에는 0x1011이, 오디오 스트림에는 0x1100부터 0x111F까지가, 프레젠테이션 그래픽스에는 0x1200부터 0x121F까지가, 인터랙티브 그래픽스 스트림에는 0x1400부터 0x141F까지가, 영화의 부영상에 이용하는 비디오 스트림에는 0x1B00부터 0x1B1F까지, 주음성과 믹싱하는 부음성에 이용하는 오디오 스트림에는 0x1A00부터 0x1A1F가, 각각 할당되어 있다.
도 78은, 다중화 데이터가 어떻게 다중화될지를 모식적으로 나타내는 도면이다. 우선, 복수의 비디오 프레임으로 이루어지는 비디오 스트림(ex235), 복수의 오디오 프레임으로 이루어지는 오디오 스트림(ex238)을, 각각 PES 패킷열(ex236 및 ex239)로 변환하고, TS 패킷(ex237 및 ex240)으로 변환한다. 동일하게 프레젠테이션 그래픽스 스트림(ex241) 및 인터랙티브 그래픽스(ex244)의 데이터를 각각 PES 패킷열(ex242 및 ex245)로 변환하고, 또한 TS 패킷(ex243 및 ex246)으로 변환한다. 다중화 데이터(ex247)는 이러한 TS 패킷을 1개의 스트림에 다중화함으로써 구성된다.
도 79는, PES 패킷열에, 비디오 스트림이 어떻게 저장되는지를 더욱 상세하게 나타내고 있다. 도 79에 있어서의 제1단째는 비디오 스트림의 비디오 프레임열을 나타낸다. 제2단째는, PES 패킷열을 나타낸다. 도 79의 화살표 yy1, yy2, yy3, yy4에 나타내는 바와 같이, 비디오 스트림에 있어서의 복수의 Video Presentation Unit인 픽처, B픽처, P픽처는, 픽처마다 분할되고 PES 패킷의 페이로드에 저장된다. 각 PES 패킷은 PES 헤더를 갖고, PES 헤더에는, 픽처의 표시 시각인 PTS(Presentation Time-Stamp)나 픽처의 복호 시각인 DTS(Decoding Time-Stamp)가 저장된다.
도 80은, 다중화 데이터에 최종적으로 기입되는 TS 패킷의 형식을 나타내고 있다. TS 패킷은, 스트림을 식별하는 PID 등의 정보를 가지는 4 Byte의 TS 헤더와 데이터를 저장하는 184 Byte의 TS 페이로드으로 구성되는 188 Byte 고정길이의 패킷이며, 상기 PES 패킷은 분할되어 TS 페이로드에 저장된다. BD-ROM의 경우, TS 패킷에는, 4 Byte의 TP_Extra_Header가 부여되고 192 Byte의 소스 패킷을 구성하며 다중화 데이터에 기입된다. TP_Extra_Header에는 ATS(Arrival_Time_Stamp) 등의 정보가 기재된다. ATS는 당해 TS 패킷의 디코더의 PID 필터로의 전송 개시 시각을 나타낸다. 다중화 데이터에는 도 80 하단에 나타내는 바와 같이 소스 패킷이 나열되게 되고, 다중화 데이터의 선두로부터 인크리먼트(increment)하는 번호는 SPN(소스 패킷 넘버)으로 불린다.
또, 다중화 데이터에 포함되는 TS 패킷에는, 영상·음성·자막 등의 각 스트림 이외에도 PAT(Program Association Table), PMT(Program Map Table), PCR(Program Clock Reference) 등이 있다. PAT는 다중화 데이터 중에 이용되는 PMT의 PID가 무엇인지를 나타내고, PAT 자신의 PID는 0으로 등록된다. PMT는, 다중화 데이터 중에 포함되는 영상·음성·자막 등의 각 스트림의 PID와 각 PID에 대응하는 스트림의 속성 정보를 갖고, 또 다중화 데이터에 관한 각종 디스크립터를 가진다. 디스크립터에는 다중화 데이터의 카피를 허가·불허가를 지시하는 카피 컨트롤 정보 등이 있다. PCR는, ATS의 시간축인 ATC(Arrival Time Clock)와 PTS·DTS의 시간축인 STC(System Time Clock)의 동기를 취하기 위해, 그 PCR 패킷이 디코더에 전송되는 ATS에 대응하는 STC 시간의 정보를 가진다.
도 81은 PMT의 데이터 구조를 상세하게 설명하는 도면이다. PMT의 선두에는, 그 PMT에 포함되는 데이터의 길이 등을 적은 PMT 헤더가 배치된다. 그 뒤에는, 다중화 데이터에 관한 디스크립터가 복수 배치된다. 상기 카피 컨트롤 정보 등이, 디스크립터로서 기재된다. 디스크립터의 뒤에는, 다중화 데이터에 포함되는 각 스트림에 관한 스트림 정보가 복수 배치된다. 스트림 정보는, 스트림의 압축 코덱 등을 식별하기 위해서 스트림 타입, 스트림의 PID, 스트림의 속성 정보(프레임 레이트, 어스펙트비 등)가 기재된 스트림 디스크립터로 구성된다. 스트림 디스크립터는 다중화 데이터에 존재하는 스트림의 수만큼 존재한다.
기록 매체 등에 기록하는 경우에는, 상기 다중화 데이터는, 다중화 데이터 정보 파일과 함께 기록된다.
다중화 데이터 정보 파일은, 도 82에 나타내는 바와 같이 다중화 데이터의 관리 정보이며, 다중화 데이터와 1대 1로 대응하고, 다중화 데이터 정보, 스트림 속성 정보와 엔트리 맵으로 구성된다.
다중화 데이터 정보는 도 82에 나타내는 바와 같이 시스템 레이트, 재생 개시 시각, 재생 종료 시각으로 구성되어 있다. 시스템 레이트는 다중화 데이터의, 후술하는 시스템 타겟 디코더의 PID 필터로의 최대 전송 레이트를 나타낸다. 다중화 데이터 중에 포함되는 ATS의 간격은 시스템 레이트 이하가 되도록 설정되어 있다. 재생 개시 시각은 다중화 데이터의 선두의 비디오 프레임의 PTS이며, 재생 종료 시각은 다중화 데이터의 종단의 비디오 프레임의 PTS에 1 프레임 분의 재생 간격을 더한 것이 설정된다.
스트림 속성 정보는 도 83에 나타내는 바와 같이, 다중화 데이터에 포함되는 각 스트림에 대한 속성 정보가, PID마다 등록된다. 속성 정보는 비디오 스트림, 오디오 스트림, 프레젠테이션 그래픽스 스트림, 인터랙티브 그래픽스 스트림마다 상이한 정보를 가진다. 비디오 스트림 속성 정보는, 그 비디오 스트림이 어떠한 압축 코덱으로 압축되었는지, 비디오 스트림을 구성하는 개개의 픽처 데이터의 해상도가 어느 정도인지, 어스펙트비는 어느 정도인지, 프레임 레이트는 어느 정도인지 등의 정보를 가진다. 오디오 스트림 속성 정보는, 그 오디오 스트림이 어떠한 압축 코덱으로 압축되었는지, 그 오디오 스트림에 포함되는 채널수는 몇인지, 어떤 언어에 대응하는지, 샘플링 주파수가 어느 정도인지 등의 정보를 가진다. 이러한 정보는, 플레이어가 재생하기 전의 디코더의 초기화 등에 이용된다.
본 실시의 형태에 있어서는, 상기 다중화 데이터 중, PMT에 포함되는 스트림 타입을 이용한다. 또, 기록 매체에 다중화 데이터가 기록되어 있는 경우에는, 다중화 데이터 정보에 포함되는, 비디오 스트림 속성 정보를 이용한다. 구체적으로는, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 있어서, PMT에 포함되는 스트림 타입, 또는, 비디오 스트림 속성 정보에 대해, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해서 생성된 영상 데이터인 것을 나타내는 고유의 정보를 설정하는 단계 또는 수단을 설치한다. 이 구성에 의해, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해서 생성한 영상 데이터와, 다른 규격에 준거하는 영상 데이터를 식별하는 것이 가능해진다.
또, 본 실시의 형태에 있어서의 동화상 복호화 방법의 단계를 도 84에 나타낸다. 단계 exS100에 있어서, 다중화 데이터로부터 PMT에 포함되는 스트림 타입, 또는, 다중화 데이터 정보에 포함되는 비디오 스트림 속성 정보를 취득한다. 다음에, 단계 exS101에 있어서, 스트림 타입, 또는, 비디오 스트림 속성 정보가 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해서 생성된 다중화 데이터인 것을 나타내고 있는지 여부를 판단한다. 그리고, 스트림 타입, 또는, 비디오 스트림 속성 정보가 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해서 생성된 것이라고 판단된 경우에는, 단계 exS102에 있어서, 상기 각 실시의 형태에서 나타낸 동화상 복호 방법에 의해 복호를 행한다. 또, 스트림 타입, 또는, 비디오 스트림 속성 정보가, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 것인을 나타내고 있는 경우에는, 단계 exS103에 있어서, 종래의 규격에 준거한 동화상 복호 방법에 의해 복호를 행한다.
이와 같이, 스트림 타입, 또는, 비디오 스트림 속성 정보에 새로운 고유값을 설정함으로써, 복호할 때에, 상기 각 실시의 형태에서 나타낸 동화상 복호화 방법 또는 장치에서 복호 가능한지를 판단할 수 있다. 따라서, 상이한 규격에 준거하는 다중화 데이터가 입력된 경우라도, 적절한 복호화 방법 또는 장치를 선택할 수 있기 때문에, 에러를 일으키지 않고 복호하는 것이 가능해진다. 또, 본 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치, 또는, 동화상 복호 방법 또는 장치를, 상술한 어느 하나의 기기·시스템에 이용하는 것도 가능하다.
(실시의 형태 9)
상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 및 장치, 동화상 복호화 방법 및 장치는, 전형적으로는 집적 회로인 LSI로 실현된다. 일례로서 도 85에 1 칩화된 LSI(ex500)의 구성을 나타낸다. LSI(ex500)는 이하에 설명하는 요소(ex501, ex502, ex503, ex504, ex505, ex506, ex507, ex508, ex509)를 구비하고, 각 요소는 버스(ex510)를 개재하여 접속하고 있다. 전원 회로부(ex505)는 전원이 온 상태인 경우에 각부에 대해서 전력을 공급함으로써 동작 가능한 상태로 기동한다.
예를 들면 부호화 처리를 행하는 경우에는, LSI(ex500)는 CPU(ex502), 메모리 컨트롤러(ex503), 스트림 컨트롤러(ex504), 구동 주파수 제어부(ex512) 등을 가지는 제어부(ex501)의 제어에 의거하여, AVI/O(ex509)에 의해 마이크(ex117)나 카메라(ex113) 등으로부터 AV 신호를 입력한다. 입력된 AV 신호는, 일단 SDRAM 등의 외부의 메모리(ex511)에 축적된다. 제어부(ex501)의 제어에 의거하여, 축적한 데이터는 처리량이나 처리 속도에 따라 적당히 여러 차례로 나누는 등 되어 신호 처리부(ex507)에 보내지고, 신호 처리부(ex507)에 있어서 음성 신호의 부호화 및/또는 영상 신호의 부호화가 행해진다. 여기서 영상 신호의 부호화 처리는 상기 각 실시의 형태에서 설명한 부호화 처리이다. 신호 처리부(ex507)에서는 또한, 경우에 따라 부호화된 음성 데이터와 부호화된 영상 데이터를 다중화하는 등의 처리를 행하고, 스트림 I/O(ex506)로부터 외부에 출력한다. 이 출력된 다중화 데이터는, 기지국(ex107)을 향해 송신되거나 또는 기록 미디어(ex215)에 기입되거나 한다. 또한, 다중화할 때 동기하도록, 일단 버퍼(ex508)에 데이터를 축적하면 된다.
또한, 상기에서는, 메모리(ex511)가 LSI(ex500)의 외부의 구성으로서 설명했지만, LSI(ex500)의 내부에 포함되는 구성이어도 된다. 버퍼(ex508)도 1개에 한정한 것은 아니고, 복수의 버퍼를 구비하고 있어도 된다. 또, LSI(ex500)는 1칩화되어도 되고, 복수칩화되어도 된다.
또, 상기에서는, 제어부(ex501)가, CPU(ex502), 메모리 컨트롤러(ex503), 스트림 컨트롤러(ex504), 구동 주파수 제어부(ex512) 등을 가진다고 하고 있지만, 제어부(ex501)의 구성은, 이 구성에 한정되지 않는다. 예를 들면, 신호 처리부(ex507)가 더 CPU를 구비하는 구성이어도 된다. 신호 처리부(ex507)의 내부에도 CPU를 설치함으로써, 처리 속도를 보다 향상시키는 것이 가능해진다. 또, 다른 예로서 CPU(ex502)가 신호 처리부(ex507), 또는 신호 처리부(ex507)의 일부인 예를 들면 음성 신호 처리부를 구비하는 구성이어도 된다. 이러한 경우에는, 제어부(ex501)는, 신호 처리부(ex507), 또는 그 일부를 가지는 CPU(ex502)를 구비하는 구성이 된다.
또한, 여기에서는, LSI로 했지만, 집적도의 차이에 의해, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI라고 호칭되기도 한다.
또, 집적 회로화의 수법은 LSI에 한정하는 것이 아니고, 전용 회로 또는 범용 프로세서로 실현되어도 된다. LSI 제조 후에, 프로그램하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속이나 설정을 재구성 가능한 리컨피규러블·프로세서를 이용해도 된다. 이러한 프로그래머블·로직·디바이스는, 전형적으로는, 소프트웨어 또는 펌 웨어를 구성하는 프로그램을, 로드하거나 또는 메모리 등으로부터 읽어냄으로써, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법, 또는 동화상 복호화 방법을 실행할 수 있다.
또, 반도체 기술의 진보 또는 파생하는 별도 기술에 의해 LSI에 치환되는 집적 회로화의 기술이 등장하면, 당연히, 그 기술을 이용하여 기능 블록의 집적화를 행해도 된다. 바이오 기술의 적응 등을 가능성으로서 있을 수 있다.
(실시의 형태 10)
상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해서 생성된 영상 데이터를 복호하는 경우, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터를 복호하는 경우에 비해, 처리량이 증가하는 것을 생각할 수 있다. 그 때문에, LSI(ex500)에 있어서, 종래의 규격에 준거하는 영상 데이터를 복호할 때의 CPU(ex502)의 구동 주파수보다 높은 구동 주파수로 설정할 필요가 있다. 그러나, 구동 주파수를 높게 하면, 소비 전력이 높아진다는 과제가 생긴다.
이 과제를 해결하기 위해서, 텔레비전(ex300), LSI(ex500) 등의 동화상 복호화 장치는, 영상 데이터가 어느 규격에 준거하는 것인지를 식별하고, 규격에 따라 구동 주파수를 변환 구성으로 한다. 도 86은, 본 실시의 형태에 있어서의 구성 ex800를 나타내고 있다. 구동 주파수 전환부(ex803)는, 영상 데이터가, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해서 생성된 것인 경우에는, 구동 주파수를 높게 설정한다. 그리고, 상기 각 실시의 형태에서 나타낸 동화상 복호화 방법을 실행하는 복호 처리부(ex801)에 대해서, 영상 데이터를 복호하도록 지시한다. 한편, 영상 데이터가, 종래의 규격에 준거하는 영상 데이터인 경우에는, 영상 데이터가, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해서 생성된 것인 경우에 비해, 구동 주파수를 낮게 설정한다. 그리고, 종래의 규격에 준거하는 복호 처리부(ex802)에 대해, 영상 데이터를 복호하도록 지시한다.
보다 구체적으로는, 구동 주파수 전환부(ex803)는, 도 85의 CPU(ex502)와 구동 주파수 제어부(ex512)로 구성된다. 또, 상기 각 실시의 형태에서 나타낸 동화상 복호화 방법을 실행하는 복호 처리부(ex801), 및, 종래의 규격에 준거하는 복호 처리부(ex802)는, 도 85의 신호 처리부(ex507)에 당해한다. CPU(ex502)는, 영상 데이터가 어느 규격에 준거하는 것인지를 식별한다. 그리고, CPU(ex502)로부터의 신호에 의거하여, 구동 주파수 제어부(ex512)는 구동 주파수를 설정한다. 또, CPU(ex502)로부터의 신호에 의거하여, 신호 처리부(ex507)는, 영상 데이터의 복호를 행한다. 여기서, 영상 데이터의 식별에는, 예를 들면, 실시의 형태 8에서 기재한 식별 정보를 이용하는 것을 생각할 수 있다. 식별 정보에 관해서는, 실시의 형태 8에서 기재한 것에 한정되지 않고, 영상 데이터가 어느 규격에 준거할지 식별할 수 있는 정보이면 좋다. 예를 들면, 영상 데이터가 텔레비전에 이용되는 것인지, 디스크에 이용되는 것인지 등을 식별하는 외부 신호에 의거하여, 영상 데이터가 어느 규격에 준거하는 것인지 식별 가능한 경우에는, 이러한 외부 신호에 의거하여 식별해도 된다. 또, CPU(ex502)에 있어서의 구동 주파수의 선택은, 예를 들면, 도 88과 같은 영상 데이터의 규격과, 구동 주파수를 대응시킨 룩업 테이블에 의거하여 행하는 것을 생각할 수 있다. 룩업 테이블을, 버퍼(ex508)나, LSI의 내부 메모리에 저장해 두고, CPU(ex502)가 이 룩업 테이블을 참조함으로써, 구동 주파수를 선택하는 것이 가능하다.
도 87은, 본 실시의 형태의 방법을 실시하는 단계를 나타내고 있다. 우선, 단계 exS200에서는, 신호 처리부(ex507)에 있어서, 다중화 데이터로부터 식별 정보를 취득한다. 다음에, 단계 exS201에서는, CPU(ex502)에 있어서, 식별 정보에 의거하여 영상 데이터가 상기 각 실시의 형태에서 나타낸 부호화 방법 또는 장치에 의해서 생성된 것인지 여부를 식별한다. 영상 데이터가 상기 각 실시의 형태에서 나타낸 부호화 방법 또는 장치에 의해서 생성된 것인 경우에는, 단계 exS202 에 있어서, 구동 주파수를 높게 설정하는 신호를, CPU(ex502)가 구동 주파수 제어부(ex512)로 보낸다. 그리고, 구동 주파수 제어부(ex512)에 있어서, 높은 구동 주파수로 설정된다. 한편, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터인 것을 나타내고 있는 경우에는, 단계 exS203 에 있어서, 구동 주파수를 낮게 설정하는 신호를, CPU(ex502)가 구동 주파수 제어부(ex512)로 보낸다. 그리고, 구동 주파수 제어부(ex512)에 있어서, 영상 데이터가 상기 각 실시의 형태에서 나타낸 부호화 방법 또는 장치에 의해서 생성된 것인 경우에 비해, 낮은 구동 주파수로 설정된다.
또한, 구동 주파수의 전환에 연동하여, LSI(ex500) 또는 LSI(ex500)를 포함한 장치에 부여하는 전압을 변경함으로써, 전력 절약 효과를 보다 높이는 것이 가능하다. 예를 들면, 구동 주파수를 낮게 설정하는 경우에는, 이것에 수반하여, 구동 주파수를 높게 설정하고 있는 경우에 비해, LSI(ex500) 또는 LSI(ex500)를 포함하는 장치에 부여하는 전압을 낮게 설정하는 것이 생각된다.
또, 구동 주파수의 설정 방법은, 복호할 때의 처리량이 큰 경우에, 구동 주파수를 높게 설정하고, 복호할 때의 처리량이 작은 경우에, 구동 주파수를 낮게 설정하면 되고, 전술한 설정 방법에 한정되지 않는다. 예를 들면, MPEG4-AVC 규격에 준거한 영상 데이터를 복호하는 처리량이, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터를 복호하는 처리량보다 큰 경우에는, 구동 주파수의 설정을 상술한 경우의 반대로 하는 것을 생각할 수 있다.
또한, 구동 주파수의 설정 방법은, 구동 주파수를 낮게 하는 구성에 한정되지 않는다. 예를 들면, 식별 정보가, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해서 생성된 영상 데이터인 것을 나타내고 있는 경우에는, LSI(ex500) 또는 LSI(ex500)를 포함하는 장치에 부여하는 전압을 높게 설정하고, 종래의 MPEG-2, MPEG4-AVC, VC-1등의 규격에 준거하는 영상 데이터인 것을 나타내고 있는 경우에는, LSI(ex500) 또는 LSI(ex500)를 포함하는 장치에 부여하는 전압을 낮게 설정하는 것도 생각된다. 또, 다른 예로서는, 식별 정보가, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해서 생성된 영상 데이터인 것을 나타내고 있는 경우에는, CPU(ex502)의 구동을 정지시키지 않고, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터인 것을 나타내고 있는 경우에는, 처리에 여유가 있기 때문에, CPU(ex502)의 구동을 일시 정지시키는 것도 생각된다. 식별 정보가, 상기 각 실시의 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해서 생성된 영상 데이터인 것을 나타내고 있는 경우라도, 처리에 여유가 있으면, CPU(ex502)의 구동을 일시 정지시키는 것도 생각할 수 있다. 이 경우는, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터인 것을 나타내고 있는 경우에 비해, 정지 시간을 짧게 설정하는 것이 생각된다.
이와 같이, 영상 데이터가 준거하는 규격에 따라, 구동 주파수를 전환함으로써, 전력 절약화를 도모하는 것이 가능해진다. 또, 전지를 이용하여 LSI(ex500) 또는 LSI(ex500)를 포함하는 장치를 구동하고 있는 경우에는, 전력 절약화에 수반하여 전지의 수명을 길게 하는 것이 가능하다.
(실시의 형태 11)
텔레비전이나, 휴대 전화 등, 전술한 기기·시스템에는, 상이한 규격에 준거하는 복수의 영상 데이터가 입력되는 경우가 있다. 이와 같이, 상이한 규격에 준거하는 복수의 영상 데이터가 입력된 경우에도 복호할 수 있듯이 하기 위해서, LSI(ex500)의 신호 처리부(ex507)가 복수의 규격에 대응하고 있을 필요가 있다. 그러나, 각각의 규격에 대응하는 신호 처리부(ex507)를 개별적으로 이용하면, LSI(ex500)의 회로 규모가 커지고, 또, 비용이 증가한다는 과제가 생긴다.
이 과제를 해결하기 위해서, 상기 각 실시의 형태에서 나타낸 동화상 복호 방법을 실행하기 위한 복호 처리부와, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 복호 처리부를 일부 공유화하는 구성으로 한다. 이 구성예를 도 89a의 ex900에 나타낸다. 예를 들면, 상기 각 실시의 형태에서 나타낸 동화상 복호 방법과 MPEG4-AVC 규격에 준거하는 동화상 복호 방법이란, 엔트로피 부호화, 역양자화, 디블로킹·필터, 움직임 보상 등의 처리에 있어서 처리 내용이 일부 공통된다. 공통되는 처리 내용에 대해서는, MPEG4-AVC 규격에 대응하는 복호 처리부(ex902)를 공유하고, MPEG4-AVC 규격에 대응하지 않는, 본 개시된 일 양태에 특유의 다른 처리 내용에 대해서는, 전용의 복호 처리부(ex901)를 이용한다는 구성이 생각된다. 복호 처리부의 공유화에 관해서는, 공통되는 처리 내용에 대해서는, 상기 각 실시의 형태에서 나타낸 동화상 복호화 방법을 실행하기 위한 복호 처리부를 공유하고, MPEG4-AVC 규격에 특유의 처리 내용에 대해서는, 전용의 복호 처리부를 이용하는 구성이어도 된다.
또, 처리를 일부 공유화하는 다른 예를 도 89 B의 ex1000에 나타낸다. 이 예에서는, 본 개시된 이 양태에 특유의 처리 내용에 대응한 전용의 복호 처리부(ex1001)와, 다른 종래 규격에 특유의 처리 내용에 대응한 전용의 복호 처리부(ex1002)와, 본 개시된 일 양태에 따른 동화상 복호 방법과 다른 종래 규격의 동화상 복호 방법에 공통되는 처리 내용에 대응한 공용의 복호 처리부(ex1003)를 이용하는 구성으로 하고 있다. 여기서, 전용의 복호 처리부(ex1001, ex1002)는, 반드시 본 개시된 일 양태, 또는, 다른 종래 규격에 특유의 처리 내용에 특화한 것이 아니고, 다른 범용 처리를 실행할 수 있는 것이어도 된다. 또, 본 실시의 형태의 구성을, LSI(ex500)에서 실장하는 것도 가능하다.
이와 같이, 본 개시된 일 양태에 따른 동화상 복호 방법과, 종래의 규격의 동화상 복호 방법으로 공통되는 처리 내용에 대해, 복호 처리부를 공유함으로써, LSI의 회로 규모를 작게 하고, 또한, 코스트를 저감시키는 것이 가능하다.
본 개시는, 화상을 효율적으로 부호화할 수 있다는 효과를 나타내고, 예를 들면, 텔레비전, 디지털 비디오 레코더, 카 내비게이션, 휴대 전화, 디지털카메라, 디지털 비디오 카메라 등의 정보 표시 기기나 촬상 기기에 이용 가능하고, 이용 가치가 높다.
100, 300, 500 : 화상 부호화 장치 101 : 블록 분할부
102 : 감산부 103, 103A : 변환부
103Aa : KL 변환부 103ab : 고정 변환부
104 : 양자화부 105 :가변길이 부호화부
106 : 역변환부 107 : 역양자화부
108 : 가산부 109, 109A : NN 파라미터 결정부
109a, 109Aa : NN 인트라 예측 파라미터 결정부,
109b, 109Ab : NN 인터 예측 파라미터 결정부
109c, 109Ac : NN 루프 내 필터 파라미터 결정부
110 : 인트라 예측부 110a : NN 인트라 예측부
110b : 고정 인트라 예측부 111 : 인터 예측부
111a : NN 인터 예측부 111b : 고정 인터 예측부
112 : 프레임 메모리 113 : 루프 내 필터부,
113a : NN 루프 내 필터부 113b : 고정 루프 내 필터부
115 : NN 처리 전환부 120 : NN 파라미터 부호화부,
200, 400, 600 : 화상 복호 장치 201 : 가변길이 복호부,
202 : 역양자화부 203, 203A : 역변환부
203Aa : 역KL 변환부 203Ab : 역고정 변환부
204 : 가산부 205 : 인트라 보상부
205a : NN 인트라 보상부 205b : 고정 인트라 보상부
206 : 인터 보상부 206a : NN 인터 보상부
206b : 고정 인터 보상부 207 : 프레임 메모리
208 : 루프 내 필터부 208a : NN 루프 내 필터부
208b : 고정 루프 내 필터부 210 : NN 처리 전환부
220 : NN 파라미터 복호부

Claims (29)

  1. 픽처를 블록마다 변환하고,
    루프 내 필터를 이용하여 상기 변환이 완료된 상기 블록을 재구축하고,
    상기 픽처 내의 화소를 이용한 인트라 예측 또는 다른 픽처 내의 화소를 이용한 인터 예측을 이용하여, 상기 재구축된 블록을 예측하며,
    상기 블록을 부호화하는 화상 부호화 방법으로서,
    상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터 중 적어도 하나에 있어서, 뉴럴 네트워크를 포함하는 필터 처리를 행하여 상기 블록을 포함하는 화상을 부호화하며,
    고정 파라미터를 가지는 선형 필터와 비선형 필터 중 어느 한쪽을, 사용되어야 할 필터로서 나타내는 전환 정보를 부호화하고,
    상기 비선형 필터가 유효한지 무효한지를 나타내는 유효/무효 정보를 부호화하고,
    상기 화상의 부호화에서는,
    상기 화상의 부호화에 이용되는 처리를, 상기 전환 정보에 따라서, 상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터 중 적어도 하나에 있어서, 상기 비선형 필터를 이용한 상기 비선형 처리와, 상기 선형 필터를 이용한 선형 처리로 전환하며,
    상기 유효/무효 정보가 유효를 나타내는 경우에, 상기 비선형 처리를 행하는,
    화상 부호화 방법.
  2. 청구항 1에 있어서,
    상기 필터 처리는 입출력의 관계가 비선형이 되는 비선형 처리로서,
    상기 비선형 처리에 이용되는 비선형 필터의 연산 파라미터를 나타내는 정보를 부호화하는, 화상 부호화 방법.
  3. 청구항 2에 있어서,
    상기 연산 파라미터의 부호화에서는,
    상기 뉴럴 네트워크에 포함되는 각 노드간의 가중 계수를 상기 연산 파라미터로서 부호화하는, 화상 부호화 방법.
  4. 청구항 3에 있어서,
    상기 연산 파라미터의 부호화에서는,
    또한, 상기 뉴럴 네트워크의 계층수 또는 노드수를 연산 파라미터로서 부호화하는, 화상 부호화 방법.
  5. 청구항 4에 있어서,
    상기 화상의 부호화에서는,
    부호화되는 상기 화상의 프로파일에 따라, 상기 뉴럴 네트워크의 계층수 또는 노드수의 최대치를 규정하고, 규정된 상기 최대치 이하의 계층수 또는 노드수의 상기 뉴럴 네트워크를 이용한 상기 비선형 처리를 행하는, 화상 부호화 방법.
  6. 삭제
  7. 청구항 1에 있어서,
    상기 비선형 처리는, 상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터를 포함하는 복수의 모드 중 어느 하나의 모드에 대응지어지고,
    상기 화상의 부호화에서는,
    상기 모드가 지정되는 경우에, 상기 비선형 처리를 행하여 상기 화상을 부호화하는, 화상 부호화 방법.
  8. 청구항 2 내지 청구항 5 중 어느 한 항에 있어서,
    상기 화상 부호화 방법에서는, 또한,
    상기 화상에 포함되는 블록, 슬라이스, 타일, 픽처 또는 GOP(Group Of Picture)인 화상 단위마다, 상기 연산 파라미터를 전환하고,
    상기 화상의 부호화에서는,
    상기 화상 단위에 대해서 전환된 연산 파라미터를 가지는 상기 비선형 필터를 이용한 비선형 처리를 행하여, 상기 화상 단위를 부호화하는, 화상 부호화 방법.
  9. 삭제
  10. 청구항 2 내지 청구항 5 중 어느 한 항에 있어서,
    상기 화상 부호화 방법에서는, 또한,
    상기 화상에 포함되는 블록마다, 당해 블록의 특징에 따라 당해 블록을 복수의 클래스 중 어느 하나의 클래스로 분류하고,
    상기 클래스마다, 당해 클래스로 분류된 적어도 하나의 블록과, 상기 적어도 하나의 블록의 각각의 주변 화소를 교사 데이터로서 이용하여 학습하는 것에 의해서, 당해 클래스에 대응하는 상기 연산 파라미터를 결정하는, 화상 부호화 방법.
  11. 청구항 10에 있어서,
    상기 연산 파라미터의 결정에서는,
    상기 화상 중 미리 정해진 기준보다도 복잡성이 높은 영역만을 이용하여 학습하는 것에 의해서, 상기 연산 파라미터를 결정하는, 화상 부호화 방법.
  12. 청구항 2 내지 청구항 5 중 어느 한 항에 있어서,
    상기 변환에서는, 상기 화상에 있어서의 공간 영역으로부터 주파수 영역으로의 변환을 행하고,
    상기 비선형 필터를 이용한 인트라 예측이 행해지는 경우에는, 상기 변환의 방법을, 변경 가능한 변환 행렬을 이용한 방법으로 전환하고, 상기 변경 가능한 변환 행렬을 이용한 방법에 따라서 변환을 행하는, 화상 부호화 방법.
  13. 청구항 2 내지 청구항 5 중 어느 한 항에 있어서,
    상기 화상의 부호화에서는,
    상기 화상에 포함되는 블록이 소정의 사이즈 이하인 경우에는, 상기 비선형 필터를 이용한 인트라 예측을 상기 비선형 처리로서 상기 블록에 대해서 행하고,
    상기 블록이 상기 소정의 사이즈보다도 큰 경우에는, 고정 파라미터의 선형 필터를 이용한 인트라 예측을 상기 블록에 대해서 행하는, 화상 부호화 방법.
  14. 청구항 2 내지 청구항 5 중 어느 한 항에 있어서,
    상기 화상의 부호화에서는,
    상기 화상 중 휘도 성분에 대해서 상기 비선형 처리를 행하고, 상기 화상 중 색차 성분에 대해서는, 상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터 중 적어도 하나에 있어서, 입출력 관계가 선형이 되는 선형 처리를 행하는, 화상 부호화 방법.
  15. 청구항 2 내지 청구항 5 중 어느 한 항에 있어서,
    상기 연산 파라미터의 부호화에서는,
    미리 정해진 파라미터인 규정 파라미터를 참조하여 부호화 대상의 상기 연산 파라미터를 부호화하는, 화상 부호화 방법.
  16. 부호화 픽처를 블록마다 역변환하고,
    루프 내 필터를 이용하여 상기 역변환이 완료된 상기 블록을 재구축하고,
    상기 부호화 픽처 내의 복호가 완료된 화소를 이용한 인트라 예측 또는 다른 부호화 픽처 내의 복호가 완료된 화소를 이용한 인터 예측을 이용하여, 상기 재구축된 블록을 예측하며,
    상기 블록을 복호하는 화상 복호 방법으로서,
    상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터 중 적어도 하나에 있어서, 뉴럴 네트워크를 포함하는 필터 처리를 행하여 상기 블록을 포함하는 화상을 복호하며,
    고정 파라미터를 가지는 선형 필터와 상기 비선형 필터 중 어느 한쪽을, 사용되어야 할 필터로서 나타내는 전환 정보를 복호하고,
    상기 비선형 필터가 유효한지 무효한지를 나타내는 유효/무효 정보를 복호하고,
    상기 화상의 복호에서는,
    상기 화상의 복호에 이용되는 처리를, 상기 전환 정보에 따라서, 상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터 중 적어도 하나에 있어서, 상기 비선형 필터를 이용한 상기 비선형 처리와, 상기 선형 필터를 이용한 선형 처리로 전환하고,
    상기 유효/무효 정보가 유효를 나타내는 경우에, 상기 비선형 처리를 행하는, 화상 복호 방법.
  17. 청구항 16에 있어서,
    비선형 필터의 연산 파라미터를 나타내는 정보를 복호하고,
    복호된 상기 연산 파라미터를 갖는 상기 비선형 필터를 이용한, 입출력의 관계가 비선형이 되는 비선형 처리를 행하여 상기 블록을 포함하는 화상을 복호하는, 화상 복호 방법.
  18. 청구항 17에 있어서,
    상기 연산 파라미터의 복호에서는,
    상기 뉴럴 네트워크에 포함되는 각 노드간의 가중 계수를 상기 연산 파라미터로서 복호하는, 화상 복호 방법.
  19. 청구항 18에 있어서,
    상기 연산 파라미터의 복호에서는,
    또한, 상기 뉴럴 네트워크의 계층수 또는 노드수를 연산 파라미터로서 복호하는, 화상 복호 방법.
  20. 삭제
  21. 청구항 16에 있어서,
    상기 비선형 처리는, 상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터를 포함하는 복수의 모드 중 어느 하나의 모드에 대응지어지고,
    상기 화상의 복호에서는,
    상기 모드가 지정되는 경우에, 상기 비선형 처리를 행하여 상기 화상을 복호하는, 화상 복호 방법.
  22. 청구항 17 내지 청구항 19 중 어느 한 항에 있어서,
    상기 화상 복호 방법에서는, 또한,
    상기 화상에 포함되는 블록, 슬라이스, 타일, 픽처 또는 GOP(Group Of Picture)인 화상 단위마다, 상기 연산 파라미터를 전환하고,
    상기 화상의 복호에서는,
    상기 화상 단위에 대해서 전환된 연산 파라미터를 가지는 상기 비선형 필터를 이용한 비선형 처리를 행하여 상기 화상 단위를 복호하는, 화상 복호 방법.
  23. 삭제
  24. 청구항 17 내지 청구항 19 중 어느 한 항에 있어서,
    상기 역변환에서는,
    상기 비선형 필터를 이용한 인트라 예측이 행해지는 경우에는, 상기 역변환의 방법을, 변경 가능한 변환 행렬을 이용한 방법으로 전환하고, 상기 변경 가능한 변환 행렬을 이용한 방법에 따라서 역변환을 행하는, 화상 복호 방법.
  25. 청구항 17 내지 청구항 19 중 어느 한 항에 있어서,
    상기 화상의 복호에서는,
    상기 화상에 포함되는 블록이 소정의 사이즈 이하인 경우에는, 상기 비선형 필터를 이용한 인트라 예측을 상기 비선형 처리로서 상기 블록에 대해서 행하고,
    상기 블록이 상기 소정의 사이즈보다도 큰 경우에는, 고정 파라미터의 선형 필터를 이용한 인트라 예측을 상기 블록에 대해서 행하는, 화상 복호 방법.
  26. 청구항 17 내지 청구항 19 중 어느 한 항에 있어서,
    상기 화상의 복호에서는,
    상기 화상 중 휘도 성분에 대해서 상기 비선형 처리를 행하고, 상기 화상 중 색차 성분에 대해서는, 상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터 중 적어도 하나에 있어서, 입출력 관계가 선형이 되는 선형 처리를 행하는, 화상 복호 방법.
  27. 청구항 17 내지 청구항 19 중 어느 한 항에 있어서,
    상기 연산 파라미터의 복호에서는,
    미리 정해진 파라미터인 규정 파라미터를 참조하여, 복호 대상의 상기 연산 파라미터를 복호하는, 화상 복호 방법.
  28. 픽처를 블록마다 변환하고,
    루프 내 필터를 이용하여 상기 변환이 완료된 상기 블록을 재구축하고,
    상기 픽처 내의 화소를 이용한 인트라 예측 또는 다른 픽처 내의 화소를 이용한 인터 예측을 이용하여, 상기 재구축된 블록을 예측하며,
    상기 블록을 부호화하는 화상 부호화 장치로서,
    상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터 중 적어도 하나에 있어서, 뉴럴 네트워크를 포함하는 필터 처리를 행하여 상기 블록을 포함하는 화상을 부호화하는 화상 부호화부를 구비하며,
    고정 파라미터를 가지는 선형 필터와 비선형 필터 중 어느 한쪽을, 사용되어야 할 필터로서 나타내는 전환 정보를 부호화하고,
    상기 비선형 필터가 유효한지 무효한지를 나타내는 유효/무효 정보를 부호화하고,
    상기 화상의 부호화에서는,
    상기 화상의 부호화에 이용되는 처리를, 상기 전환 정보에 따라서, 상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터 중 적어도 하나에 있어서, 상기 비선형 필터를 이용한 상기 비선형 처리와, 상기 선형 필터를 이용한 선형 처리로 전환하며,
    상기 유효/무효 정보가 유효를 나타내는 경우에, 상기 비선형 처리를 행하는,
    화상 부호화 장치.
  29. 부호화 픽처를 블록마다 역변환하고,
    루프 내 필터를 이용하여 상기 역변환이 완료된 상기 블록을 재구축하고,
    상기 부호화 픽처 내의 복호가 완료된 화소를 이용한 인트라 예측 또는 다른 부호화 픽처 내의 복호가 완료된 화소를 이용한 인터 예측을 이용하여, 상기 재구축된 블록을 예측하며,
    상기 블록을 복호하는 화상 복호 장치로서,
    상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터 중 적어도 하나에 있어서, 뉴럴 네트워크를 포함하는 필터 처리를 행하여 상기 블록을 포함하는 화상을 복호하는 화상 복호부를 구비하며,
    고정 파라미터를 가지는 선형 필터와 상기 비선형 필터 중 어느 한쪽을, 사용되어야 할 필터로서 나타내는 전환 정보를 복호하고,
    상기 비선형 필터가 유효한지 무효한지를 나타내는 유효/무효 정보를 복호하고,
    상기 화상의 복호에서는,
    상기 화상의 복호에 이용되는 처리를, 상기 전환 정보에 따라서, 상기 인트라 예측, 상기 인터 예측 및 상기 루프 내 필터 중 적어도 하나에 있어서, 상기 비선형 필터를 이용한 상기 비선형 처리와, 상기 선형 필터를 이용한 선형 처리로 전환하고,
    상기 유효/무효 정보가 유효를 나타내는 경우에, 상기 비선형 처리를 행하는, 화상 복호 장치.
KR1020177035512A 2015-06-12 2016-03-18 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치 및 화상 복호 장치 KR102517615B1 (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201562174864P 2015-06-12 2015-06-12
US201562174789P 2015-06-12 2015-06-12
US62/174,864 2015-06-12
US62/174,789 2015-06-12
US201562175583P 2015-06-15 2015-06-15
US62/175,583 2015-06-15
JP2016021372 2016-02-05
JPJP-P-2016-021372 2016-02-05
PCT/JP2016/001582 WO2016199330A1 (ja) 2015-06-12 2016-03-18 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置

Publications (2)

Publication Number Publication Date
KR20180018544A KR20180018544A (ko) 2018-02-21
KR102517615B1 true KR102517615B1 (ko) 2023-04-04

Family

ID=57503234

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177035512A KR102517615B1 (ko) 2015-06-12 2016-03-18 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치 및 화상 복호 장치

Country Status (6)

Country Link
US (1) US10681380B2 (ko)
EP (1) EP3310058B1 (ko)
JP (1) JP6715466B2 (ko)
KR (1) KR102517615B1 (ko)
CN (1) CN107736027B (ko)
WO (1) WO2016199330A1 (ko)

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2996269A1 (en) 2014-09-09 2016-03-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio splicing concept
US11196992B2 (en) 2015-09-03 2021-12-07 Mediatek Inc. Method and apparatus of neural network based processing in video coding
JP6941943B2 (ja) * 2017-02-01 2021-09-29 日本放送協会 予測装置およびプログラム
JP2018125718A (ja) * 2017-02-01 2018-08-09 日本放送協会 モード予測情報生成装置およびプログラム
WO2018163011A1 (ja) * 2017-03-09 2018-09-13 株式会社半導体エネルギー研究所 半導体装置および放送システム
JP7179718B2 (ja) * 2017-04-11 2022-11-29 株式会社半導体エネルギー研究所 半導体装置、撮像装置及び表示システム
WO2018199051A1 (ja) * 2017-04-25 2018-11-01 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法および復号方法
US10630978B2 (en) * 2017-05-12 2020-04-21 Blackberry Limited Methods and devices for intra-coding in video compression
WO2018218249A1 (en) * 2017-05-26 2018-11-29 Google Llc Tiled image compression using neural networks
JP2018201117A (ja) * 2017-05-26 2018-12-20 日本電気株式会社 映像符号化装置、映像符号化方法およびプログラム
WO2019009448A1 (ko) 2017-07-06 2019-01-10 삼성전자 주식회사 영상을 부호화 또는 복호화하는 방법 및 장치
DE112018003456T5 (de) * 2017-07-07 2020-03-19 Semiconductor Energy Laboratory Co., Ltd. Anzeigesystem und Betriebsverfahren des Anzeigesystems
CN111373751B (zh) * 2017-08-10 2023-02-28 夏普株式会社 图像滤波装置、图像解码装置以及图像编码装置
US11363302B2 (en) 2017-10-12 2022-06-14 Mediatek Inc. Method and apparatus of neural network for video coding
CN117768643A (zh) * 2017-10-13 2024-03-26 弗劳恩霍夫应用研究促进协会 用于逐块图片编码的帧内预测模式概念
KR102535361B1 (ko) 2017-10-19 2023-05-24 삼성전자주식회사 머신 러닝을 사용하는 영상 부호화기 및 그것의 데이터 처리 방법
JP2019087778A (ja) * 2017-11-01 2019-06-06 日本放送協会 画像復元フィルタ及び学習装置
US20200296358A1 (en) * 2017-11-02 2020-09-17 Samsung Electronics Co., Ltd. Method and device for encoding image according to low-quality coding mode, and method and device for decoding mage
JP6889653B2 (ja) * 2017-11-24 2021-06-18 Kddi株式会社 動画像圧縮装置及び動画像圧縮方法
WO2019115865A1 (en) * 2017-12-13 2019-06-20 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
US10841577B2 (en) * 2018-02-08 2020-11-17 Electronics And Telecommunications Research Institute Method and apparatus for video encoding and video decoding based on neural network
EP3750320B1 (en) * 2018-02-09 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Adaptive in-loop filter with multiple feature-based classifications
US20190289327A1 (en) * 2018-03-13 2019-09-19 Mediatek Inc. Method and Apparatus of Loop Filtering for VR360 Videos
KR20230057481A (ko) * 2018-03-29 2023-04-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 블록 단위의 화상 코딩을 위한 인트라 예측 모드 개념
WO2019201239A1 (en) * 2018-04-17 2019-10-24 Mediatek Inc. Method and apparatus of neural network for video coding
EP3562162A1 (en) 2018-04-27 2019-10-30 InterDigital VC Holdings, Inc. Method and apparatus for video encoding and decoding based on neural network implementation of cabac
DE102018110383A1 (de) * 2018-04-30 2019-10-31 Basler Ag Verfahren und Vorrichtung zum Kodieren von Bilddaten
JP2019201332A (ja) * 2018-05-16 2019-11-21 シャープ株式会社 画像符号化装置、画像復号装置、及び画像符号化システム
JP2020005201A (ja) * 2018-06-29 2020-01-09 日本放送協会 送信装置及び受信装置
WO2020008104A1 (en) * 2018-07-02 2020-01-09 Nokia Technologies Oy A method, an apparatus and a computer program product for image compression
GB2575628A (en) * 2018-07-09 2020-01-22 Nokia Technologies Oy Video processing
EP3850840A1 (en) * 2018-09-13 2021-07-21 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Affine linear weighted intra predictions
US11062210B2 (en) 2018-10-02 2021-07-13 Nokia Technologies Oy Method and apparatus for training a neural network used for denoising
JP7089303B2 (ja) * 2018-10-10 2022-06-22 株式会社アクセル 推論装置、処理システム、推論方法及び推論プログラム
US11159789B2 (en) * 2018-10-24 2021-10-26 City University Of Hong Kong Generative adversarial network based intra prediction for video coding
US11601644B2 (en) * 2018-12-11 2023-03-07 Google Llc Image and video coding using machine learning prediction coding models
BR112021011929A2 (pt) * 2018-12-20 2021-09-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Unidade de armazenamento não transitória, decodificador para decodificação e codificador para codificação de uma figura a partir de um fluxo contínuo de dados e método de decodificação e codificação
GB2580173B (en) * 2018-12-21 2022-07-27 Canon Kk A filter
KR20200082227A (ko) * 2018-12-28 2020-07-08 한국전자통신연구원 오디오 신호를 위한 손실 함수 결정 방법 및 손실 함수 결정 장치
US11240492B2 (en) * 2019-01-22 2022-02-01 Apple Inc. Neural network based residual coding and prediction for predictive coding
CN113711594A (zh) * 2019-02-15 2021-11-26 诺基亚技术有限公司 用于视频编码和解码的装置、方法和计算机程序
JP7256874B2 (ja) 2019-03-08 2023-04-12 キヤノン株式会社 アダプティブループフィルタ
EP3938965A4 (en) * 2019-03-14 2022-12-28 Nokia Technologies Oy DEVICE, METHOD AND COMPUTER PROGRAM FOR TRAINING A NEURAL NETWORK
US20220188633A1 (en) * 2019-03-15 2022-06-16 Interdigital Vc Holdings, Inc. Low displacement rank based deep neural network compression
WO2020187587A1 (en) * 2019-03-15 2020-09-24 Dolby International Ab Method and apparatus for updating a neural network
KR20220007853A (ko) * 2019-03-18 2022-01-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 신경망의 매개변수를 압축하기 위한 방법 및 장치
WO2020207493A1 (en) 2019-04-12 2020-10-15 Beijing Bytedance Network Technology Co., Ltd. Transform coding based on matrix-based intra prediction
WO2020211807A1 (en) 2019-04-16 2020-10-22 Beijing Bytedance Network Technology Co., Ltd. Matrix derivation in intra coding mode
WO2020221373A1 (en) 2019-05-01 2020-11-05 Beijing Bytedance Network Technology Co., Ltd. Matrix-based intra prediction using filtering
CN117097912A (zh) 2019-05-01 2023-11-21 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的上下文编码
EP3954115A4 (en) 2019-05-22 2023-04-19 Beijing Bytedance Network Technology Co., Ltd. MATRIX-BASED INTRAPREDICTION USING UPSAMPLING
JP7318314B2 (ja) 2019-05-30 2023-08-01 富士通株式会社 符号化プログラム、復号プログラム、符号化装置、復号装置、符号化方法及び復号方法
CN114051735A (zh) * 2019-05-31 2022-02-15 北京字节跳动网络技术有限公司 基于矩阵的帧内预测中的一步下采样过程
EP3963885A4 (en) 2019-06-05 2022-12-14 Beijing Bytedance Network Technology Co., Ltd. DETERMINING CONTEXT FOR MATRIX-BASED INTRAPREDICTION
US11412262B2 (en) * 2019-06-24 2022-08-09 Qualcomm Incorporated Nonlinear extensions of adaptive loop filtering for video coding
CA3150069C (en) * 2019-09-27 2024-04-09 Akira Minezawa Data processing device, data processing system, and data processing method
CN114641997A (zh) 2019-10-28 2022-06-17 北京字节跳动网络技术有限公司 基于颜色分量的语法信令通知和解析
JP2021072539A (ja) * 2019-10-30 2021-05-06 キヤノン株式会社 画像符号化装置、復号装置、伝送システム、及びその制御方法
US11671110B2 (en) 2019-11-22 2023-06-06 Tencent America LLC Method and apparatus for neural network model compression/decompression
EP4107945A1 (en) * 2020-02-21 2022-12-28 InterDigital VC Holdings France Neural network-based intra prediction for video encoding or decoding
US20230110503A1 (en) * 2020-02-24 2023-04-13 Nokia Technologies Oy Method, an apparatus and a computer program product for video encoding and video decoding
CN111541894B (zh) * 2020-04-21 2021-04-20 电子科技大学 一种基于边缘增强残差网络的环路滤波方法
WO2021254812A1 (en) * 2020-06-18 2021-12-23 Interdigital Vc Holdings France, Sas Adapting the transform process to neural network-based intra prediction mode
US11765376B2 (en) * 2020-10-08 2023-09-19 Tencent America LLC Pruning methods and apparatuses for neural network based video coding
US11889112B2 (en) * 2021-04-30 2024-01-30 Tencent America LLC Block-wise content-adaptive online training in neural image compression
CN118077197A (zh) * 2021-10-08 2024-05-24 瑞典爱立信有限公司 组合用于视频编码和/或解码的去块滤波和另一滤波
WO2023194650A1 (en) * 2022-04-04 2023-10-12 Nokia Technologies Oy A method, an apparatus and a computer program product for video coding
CN117639792A (zh) * 2023-11-27 2024-03-01 浙江大学 一种基于码表聚类的深度学习模型压缩方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070286287A1 (en) * 2006-06-13 2007-12-13 Industry-University Cooperation Foundation Sogang University Method and apparatus for improving quality of composite video signal and method and apparatus for removing artifact of composite video signal
US20090034622A1 (en) * 2007-08-01 2009-02-05 Her Majesty The Queen In Right Of Canada Represented By The Minister Of Industry Learning Filters For Enhancing The Quality Of Block Coded Still And Video Images

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5041916A (en) * 1989-02-07 1991-08-20 Matsushita Electric Industrial Co., Ltd. Color image data compression and recovery apparatus based on neural networks
JPH03198593A (ja) * 1989-12-27 1991-08-29 Nippon Television Network Corp テレビジョン方式
EP0551524A4 (en) * 1991-08-05 1994-08-10 Kawasaki Steel Co Signal processor and learning method thereof
JP2788811B2 (ja) * 1992-01-10 1998-08-20 シャープ株式会社 ブロック歪補正器
KR0139154B1 (ko) * 1994-07-08 1998-06-15 김광호 신경망을 이용한 부호화방법 및 그 장치
US5598354A (en) * 1994-12-16 1997-01-28 California Institute Of Technology Motion video compression system with neural network having winner-take-all function
HUP0301368A3 (en) * 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
US20050129306A1 (en) * 2003-12-12 2005-06-16 Xianglin Wang Method and apparatus for image deinterlacing using neural networks
US8218634B2 (en) 2005-01-13 2012-07-10 Ntt Docomo, Inc. Nonlinear, in-the-loop, denoising filter for quantization noise removal for hybrid video compression
EP1880364A1 (en) * 2005-05-12 2008-01-23 Bracco Imaging S.P.A. Method for coding pixels or voxels of a digital image and a method for processing digital images
JP4384130B2 (ja) * 2006-03-28 2009-12-16 株式会社東芝 動画像復号方法及び装置
BRPI0714233A2 (pt) * 2006-07-18 2013-01-15 Thomson Licensing mÉtodos e aparelho para filtragem de referÊncia adaptativa
JP2009111691A (ja) * 2007-10-30 2009-05-21 Hitachi Ltd 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
CN101626506B (zh) * 2008-07-10 2011-06-01 华为技术有限公司 一种视频码流的质量评估方法、装置及系统
US8311111B2 (en) * 2008-09-11 2012-11-13 Google Inc. System and method for decoding using parallel processing
US9479786B2 (en) * 2008-09-26 2016-10-25 Dolby Laboratories Licensing Corporation Complexity allocation for video and image coding applications
US20120183041A1 (en) * 2011-01-14 2012-07-19 Sony Corporation Interpolation filter for intra prediction of hevc
JP2013012895A (ja) * 2011-06-29 2013-01-17 Nippon Telegr & Teleph Corp <Ntt> 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラム
KR102111917B1 (ko) * 2011-06-30 2020-05-18 미쓰비시덴키 가부시키가이샤 화상 부호화 장치, 화상 복호 장치, 화상 부호화 방법, 화상 복호 방법 및 기억 매체
CA2870067C (en) * 2012-04-16 2017-01-17 Nokia Corporation Video coding and decoding using multiple parameter sets which are identified in video unit headers
US8819525B1 (en) * 2012-06-14 2014-08-26 Google Inc. Error concealment guided robustness
US10567806B2 (en) * 2013-11-15 2020-02-18 Mediatek Inc. Method of block-based adaptive loop filtering
EP4087247A1 (en) * 2014-02-26 2022-11-09 Dolby Laboratories Licensing Corp. Luminance based coding tools for video compression
US10034005B2 (en) * 2015-06-05 2018-07-24 Sony Corporation Banding prediction for video encoding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070286287A1 (en) * 2006-06-13 2007-12-13 Industry-University Cooperation Foundation Sogang University Method and apparatus for improving quality of composite video signal and method and apparatus for removing artifact of composite video signal
US20090034622A1 (en) * 2007-08-01 2009-02-05 Her Majesty The Queen In Right Of Canada Represented By The Minister Of Industry Learning Filters For Enhancing The Quality Of Block Coded Still And Video Images

Also Published As

Publication number Publication date
EP3310058B1 (en) 2023-02-22
CN107736027B (zh) 2021-06-01
EP3310058A1 (en) 2018-04-18
KR20180018544A (ko) 2018-02-21
JP6715466B2 (ja) 2020-07-01
EP3310058A4 (en) 2018-06-20
WO2016199330A1 (ja) 2016-12-15
JPWO2016199330A1 (ja) 2018-04-05
US10681380B2 (en) 2020-06-09
US20180184123A1 (en) 2018-06-28
CN107736027A (zh) 2018-02-23

Similar Documents

Publication Publication Date Title
KR102517615B1 (ko) 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치 및 화상 복호 장치
JP6216021B2 (ja) フィルタ方法及び画像処理システム
KR102094939B1 (ko) 화상 처리 방법 및 화상 처리 장치
AU2017203193B2 (en) Filtering method, moving picture coding apparatus, moving picture decoding apparatus, and moving picture coding and decoding apparatus
CA2876567C (en) Image coding and decoding of slice boundaries wherein loop filtering of top and left slice boundaries is controlled by a boundary control flag
EP2665264B1 (en) Image encoding method, image decoding method, image encoding device, image decoding device, and image encoding/decoding device
JP2013526199A (ja) 予測誤差から導出されるブロック形状を用いた予測符号化
JP2024059908A (ja) 画像復号装置、画像符号化装置及びビットストリーム生成装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant