KR102179087B1 - 복호 장치 및 복호 방법 - Google Patents

복호 장치 및 복호 방법 Download PDF

Info

Publication number
KR102179087B1
KR102179087B1 KR1020147035471A KR20147035471A KR102179087B1 KR 102179087 B1 KR102179087 B1 KR 102179087B1 KR 1020147035471 A KR1020147035471 A KR 1020147035471A KR 20147035471 A KR20147035471 A KR 20147035471A KR 102179087 B1 KR102179087 B1 KR 102179087B1
Authority
KR
South Korea
Prior art keywords
image
unit
information
rps
flag
Prior art date
Application number
KR1020147035471A
Other languages
English (en)
Other versions
KR20150032257A (ko
Inventor
슈오 루
가즈시 사토
Original Assignee
벨로스 미디어 인터내셔널 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 벨로스 미디어 인터내셔널 리미티드 filed Critical 벨로스 미디어 인터내셔널 리미티드
Publication of KR20150032257A publication Critical patent/KR20150032257A/ko
Application granted granted Critical
Publication of KR102179087B1 publication Critical patent/KR102179087B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)

Abstract

본 기술은 참조 화상을 특정하는 정보에 관한 정보의 정보량을 삭감할 수 있도록 하는 복호 장치 및 복호 방법에 관한 것이다. 수취부는, 부호화 대상의 화상이 GOP(Group of Picture)의 선두의 화상 이외의 화상인 경우에 전송되어 오는, 부호화 대상의 화상보다 부호화순으로 앞의 화상인 전화상의, 예측 화상의 생성에 사용되는 참조 화상을 특정하는 참조 화상 특정 정보를, 부호화 대상의 화상의 참조 화상 특정 정보로서 사용할 것인지를 나타내는 inter_ref_pic_set_prediction_flag를 수취한다. 본 기술은 예를 들어 HEVC(High Efficiency Video Coding) 방식의 복호 장치에 적용할 수 있다.

Description

복호 장치 및 복호 방법{DECODING DEVICE, AND DECODING METHOD}
본 기술은 복호 장치 및 복호 방법에 관한 것이며, 특히, 참조 화상을 특정하는 정보에 관한 정보의 정보량을 삭감할 수 있도록 한 복호 장치 및 복호 방법에 관한 것이다.
최근, 화상 정보를 디지털로서 취급하고, 그때, 효율이 높은 정보의 전송, 축적을 목적으로 하여, 화상 정보 특유의 용장성을 이용하여, 이산 코사인 변환 등의 직교 변환과 움직임 보상에 의해 압축하는 MPEG(Moving Picture Experts Group phase) 등의 방식에 준거한 장치가, 방송국 등의 정보 배신(配信) 및 일반 가정에 있어서의 정보 수신의 양쪽에 있어서 점차 보급되고 있다.
특히, MPEG2(ISO/IEC 13818-2) 방식은 범용 화상 부호화 방식으로서 정의되어 있으며, 비월 주사 화상 및 순차 주사 화상의 양쪽 및 표준 해상도 화상 및 고정밀 화상을 망라하는 표준으로, 프로페셔널 용도 및 컨슈머 용도의 광범위한 애플리케이션에 현재 널리 사용되고 있다. MPEG2 방식을 사용함으로써, 예를 들어 720×480화소를 갖는 표준 해상도의 비월 주사 화상이면 4 내지 8Mbps, 1920×1088화소를 갖는 고해상도의 비월 주사 화상이면 18 내지 22MBps의 부호량(비트 레이트)을 할당함으로써, 높은 압축률과 양호한 화질의 실현이 가능하다.
MPEG2는 주로 방송용에 적합한 고화질 부호화를 대상으로 한 것이었지만, MPEG1보다 낮은 부호량(비트 레이트), 즉 보다 높은 압축률의 부호화 방식에는 대응하지 못하였다. 휴대 단말기의 보급에 의해, 향후 그와 같은 부호화 방식의 요구는 높아질 것으로 생각되며, 이것에 대응하여 MPEG4 부호화 방식의 표준화가 행해졌다. MPEG4의 화상 부호화 방식에 관해서는 1998년 12월에 ISO/IEC 14496-2로서 규격이 국제 표준으로 승인되었다.
또한, 최근, 당초 텔레비전 회의용 화상 부호화를 목적으로 하여, H.26L(ITU-T Q6/16 VCEG)이라는 표준의 규격화가 진행되고 있다. H.26L은 MPEG2나 MPEG4와 같은 종래의 부호화 방식에 비해, 그 부호화, 복호화에 보다 많은 연산량이 요구되지만, 보다 높은 부호화 효율이 실현되는 것으로 알려져 있다.
또한, 현재, MPEG4의 활동의 일환으로서, 이 H.26L을 베이스로, H.26L에서는 서포트되지 않는 기능도 도입되어, 보다 높은 부호화 효율을 실현하는 표준화가 Joint Model of Enhanced-Compression Video Coding으로서 행해지고 있다. 이 표준화는 2003년 3월에 H.264 및 MPEG-4 Part10(AVC(Advanced Video Coding))이라는 이름 하에 국제 표준화되었다.
또한, 그 확장으로서, RGB나 4:2:2, 4:4:4 등의, 업무용으로 필요한 부호화 툴이나, MPEG-2에서 규정된 8×8DCT나 양자화 매트릭스도 포함한 FRExt(Fidelity Range Extension)의 표준화가 2005년 2월에 완료되고, 이에 의해, AVC는 영화에 포함되는 필름 노이즈도 양호하게 표현하는 것이 가능한 부호화 방식으로 되어, Blu-Ray(등록 상표) Disc 등의 폭넓은 애플리케이션에 사용되는 단계에 이르렀다.
그러나, 요즘, 하이비전 화상의 4배인 4000×2000화소 정도의 화상을 압축하고 싶다거나, 혹은, 인터넷과 같은 한정된 전송 용량의 환경에 있어서, 하이비전 화상을 배신하고 싶다는 등의, 한층 더한 고압축률 부호화에 대한 요구가 높아지고 있다. 이 때문에, ITU-T 산하의 VCEG(Video Coding Expert Group)에 있어서, 부호화 효율의 개선에 관한 검토가 계속해서 행해지고 있다.
그런데, HEVC(High Efficiency Video Coding) 방식에 있어서는, 복호 장치에 있어서 참조 화상을 특정하는 참조 화상 특정 정보를 인식하기 위한 Short-term reference picture set(이하, RPS라 함)가 SPS(Sequence Parameter Set)에 포함되어 있다(예를 들어, 비특허문헌 1 참조).
도 1은 RPS의 신택스의 일례를 도시하는 도면이다.
도 1의 제2행째에 나타내는 바와 같이, RPS에는 inter_ref_pic_set_prediction_flag가 포함된다. inter_ref_pic_set_prediction_flag는 부호화 대상의 화상의 GOP(Group of Picture) 내의 부호화 대상의 화상보다 부호화순으로 앞의 화상인 전화상(前畵像)의 참조 화상을 특정하는 참조 화상 특정 정보를, 부호화 대상의 화상의 참조 화상 특정 정보로서 사용할 것인지를 나타내는 참조 정보이다.
inter_ref_pic_set_prediction_flag는 전화상의 참조 화상을 특정하는 참조 화상 특정 정보를 부호화 대상의 화상의 참조 화상 특정 정보로서 사용하는 것을 나타내는 경우 1이고, 전화상의 참조 화상을 특정하는 참조 화상 특정 정보를 부호화 대상의 화상의 참조 화상 특정 정보로서 사용하지 않는 것을 나타내는 경우 0이다.
도 1의 제3행째 및 제4행째에 나타내는 바와 같이, inter_ref_pic_set_prediction_flag가 1인 경우, RPS에는 전화상을 특정하는 전화상 특정 정보인 delta_idx_minus1이 포함된다. delta_idx_minus1은, 구체적으로는, 부호화 대상의 화상의 부호화 번호(Coding Order)로부터 전화상의 부호화 번호를 감산한 값으로부터 1을 감산한 값이다. 여기서, 부호화 번호란, GOP 내의 각 화상에 대하여, 부호화순으로 작은 값부터 부여되는 번호이다.
또한, 도 1의 제13 내지 제23행째에 나타내는 바와 같이, inter_ref_pic_set_prediction_flag가 0인 경우, RPS에는 참조 화상 특정 정보가 포함된다.
도 2는 inter_ref_pic_set_prediction_flag와 delta_idx_minus1의 일례를 도시하는 도면이다.
도 2의 예에서는, 부호화 번호가 N인 부호화 대상의 화상의 참조 화상 특정 정보가, 부호화 대상의 화상보다 부호화순으로 하나 전의 부호화 번호가 N-1인 전화상의 참조 화상 특정 정보와 동일하다.
이 경우, inter_ref_pic_set_prediction_flag는 전화상의 참조 화상 특정 정보를 부호화 대상의 화상의 참조 화상 특정 정보로서 사용하는 것을 나타내는 1로 된다. 또한, delta_idx_minus1은, 부호화 대상의 화상의 부호화 번호인 N으로부터 전화상의 부호화 번호인 N-1을 감산하고, 그 결과 얻어지는 값 1로부터 1을 더 감산한 값 0으로 된다.
Benjamin Bross, Woo-Jin Han, Jens-Rainer Ohm, Gary J. Sullivan, Thomas Wiegand, "High efficiency video coding(HEVC) text specification draft 7", JCTVC-I1003_d4, 2012.4.27-5.7
그러나, RPS 등의 참조 화상 특정 정보에 관한 정보의 정보량은 충분히 삭감되지 못하고 있다.
본 기술은 이러한 상황을 감안하여 이루어진 것이며, 참조 화상을 특정하는 정보에 관한 정보의 정보량을 삭감할 수 있도록 하는 것이다.
본 기술의 일 측면의 복호 장치는, 부호화 대상의 화상이 GOP(Group of Picture)의 선두의 화상 이외의 화상인 경우에 전송되어 오는, 상기 부호화 대상의 화상보다 부호화순으로 앞의 화상인 전화상의, 예측 화상의 생성에 사용되는 참조 화상을 특정하는 참조 화상 특정 정보를, 상기 부호화 대상의 화상의 상기 참조 화상 특정 정보로서 사용할 것인지를 나타내는 참조 정보를 수취하는 수취부와, 상기 수취부에 의해 상기 참조 정보가 수취된 경우, 그 참조 정보에 기초하여, 복호 대상의 화상의 상기 참조 화상 특정 정보를 생성하고, 상기 수취부에 의해 상기 참조 정보가 수취되지 않는 경우, 상기 전화상의 상기 참조 화상 특정 정보를 상기 부호화 대상의 화상의 상기 참조 화상 특정 정보로서 사용하지 않는 것을 나타내는 참조 정보에 기초하여, 복호 대상의 화상의 상기 참조 화상 특정 정보를 생성하는 참조 화상 설정부와, 상기 참조 화상 설정부에 의해 생성된 상기 참조 화상 특정 정보에 의해 특정되는 상기 참조 화상을 사용하여, 예측 화상을 생성하는 예측 화상 생성부를 구비하는 복호 장치이다.
본 기술의 일 측면의 복호 방법은 본 기술의 일 측면의 복호 장치에 대응한다.
본 기술의 일 측면에 있어서는, 부호화 대상의 화상이 GOP(Group of Picture)의 선두의 화상 이외의 화상인 경우에 전송되어 오는, 상기 부호화 대상의 화상보다 부호화순으로 앞의 화상인 전화상의, 예측 화상의 생성에 사용되는 참조 화상을 특정하는 참조 화상 특정 정보를, 상기 부호화 대상의 화상의 상기 참조 화상 특정 정보로서 사용할 것인지를 나타내는 참조 정보가 수취되고, 상기 참조 정보가 수취된 경우, 그 참조 정보에 기초하여, 복호 대상의 화상의 상기 참조 화상 특정 정보가 생성되고, 상기 참조 정보가 수취되지 않는 경우, 상기 전화상의 상기 참조 화상 특정 정보를 상기 부호화 대상의 화상의 상기 참조 화상 특정 정보로서 사용하지 않는 것을 나타내는 참조 정보에 기초하여, 복호 대상의 화상의 상기 참조 화상 특정 정보가 생성되고, 상기 참조 화상 특정 정보에 의해 특정되는 상기 참조 화상을 사용하여, 예측 화상이 생성된다.
또한, 본 기술의 일 측면의 복호 장치는 컴퓨터에 프로그램을 실행시킴으로써 실현할 수 있다.
또한, 본 기술의 일 측면의 복호 장치를 실현하기 위해서, 컴퓨터에 실행시키는 프로그램은 전송 매체를 통해서 전송함으로써, 또는, 기록 매체에 기록하여, 제공할 수 있다.
본 기술에 의하면, 참조 화상을 특정하는 정보에 관한 정보의 정보량을 삭감한 부호화 스트림을 복호할 수 있다.
도 1은 RPS의 신택스의 일례를 도시하는 도면이다.
도 2는 inter_ref_pic_set_prediction_flag와 delta_idx_minus1의 일례를 도시하는 도면이다.
도 3은 본 기술을 적용한 부호화 장치의 제1 실시 형태의 구성예를 도시하는 블록도이다.
도 4는 도 3의 부호화부의 구성예를 도시하는 블록도이다.
도 5는 도 3의 설정부(12)에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 6은 RPS의 신택스의 예를 도시하는 도면이다.
도 7은 도 3의 설정부(12)에 의해 설정되는 RPS의 정보량을 설명하는 도면이다.
도 8은 종래의 RPS의 정보량을 설명하는 도면이다.
도 9는 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 10은 도 3의 부호화 장치의 생성 처리를 설명하는 흐름도이다.
도 11은 도 10의 RPS 설정 처리의 상세를 설명하는 흐름도이다.
도 12는 도 10의 부호화 처리의 상세를 설명하는 흐름도이다.
도 13은 도 10의 부호화 처리의 상세를 설명하는 흐름도이다.
도 14는 도 12의 RPS 인덱스 결정 처리의 상세를 설명하는 흐름도이다.
도 15는 본 기술을 적용한 복호 장치의 제1 실시 형태의 구성예를 도시하는 블록도이다.
도 16은 도 15의 복호부의 구성예를 도시하는 블록도이다.
도 17은 도 15의 복호 장치에 의한 수취 처리를 설명하는 흐름도이다.
도 18은 도 17의 RPS 설정 처리의 상세를 설명하는 흐름도이다.
도 19는 도 17의 복호 처리의 상세를 설명하는 흐름도이다.
도 20은 본 기술을 적용한 부호화 장치의 제2 실시 형태의 구성예를 도시하는 블록도이다.
도 21은 도 20의 설정부에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 22는 도 21의 RPS의 신택스의 예를 도시하는 도면이다.
도 23은 도 20의 설정부에 의해 설정되는 RPS의 정보량을 설명하는 도면이다.
도 24는 도 20의 설정부에 의해 설정되는 RPS의 정보량을 설명하는 도면이다.
도 25는 종래의 RPS의 정보량을 설명하는 도면이다.
도 26은 도 20의 부호화 장치의 RPS 설정 처리의 상세를 설명하는 흐름도이다.
도 27은 본 기술을 적용한 복호 장치의 제2 실시 형태의 구성예를 도시하는 블록도이다.
도 28은 도 27의 복호 장치의 RPS 설정 처리의 상세를 설명하는 흐름도이다.
도 29는 본 기술을 적용한 부호화 장치의 제3 실시 형태의 구성예를 도시하는 블록도이다.
도 30은 도 29의 설정부에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 31은 도 30의 RPS의 신택스의 예를 도시하는 도면이다.
도 32는 도 29의 설정부에 의해 설정되는 RPS의 정보량을 설명하는 도면이다.
도 33은 도 29의 부호화 장치의 RPS 설정 처리의 상세를 설명하는 흐름도이다.
도 34는 본 기술을 적용한 복호 장치의 제3 실시 형태의 구성예를 도시하는 블록도이다.
도 35는 도 34의 복호 장치의 RPS 설정 처리의 상세를 설명하는 흐름도이다.
도 36은 본 기술을 적용한 부호화 장치의 제4 실시 형태의 구성예를 도시하는 블록도이다.
도 37은 도 36의 부호화부의 구성예를 도시하는 블록도이다.
도 38은 도 36의 설정부에 의해 설정되는 PPS의 신택스의 예를 도시하는 도면이다.
도 39는 도 36의 설정부에 의해 설정되는 PPS의 신택스의 예를 도시하는 도면이다.
도 40은 종래의 HEVC 방식에 있어서의 PPS의 신택스의 예를 도시하는 도면이다.
도 41은 종래의 HEVC 방식에 있어서의 PPS의 신택스의 예를 도시하는 도면이다.
도 42는 도 37의 가역 부호화부에 의해 부가되는 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 43은 도 37의 가역 부호화부에 의해 부가되는 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 44는 도 37의 가역 부호화부에 의해 부가되는 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 45는 종래의 HEVC 방식에 있어서의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 46은 종래의 HEVC 방식에 있어서의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 47은 종래의 HEVC 방식에 있어서의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 48은 도 36의 부호화 장치의 생성 처리를 설명하는 흐름도이다.
도 49는 도 48의 부호화 처리의 상세를 설명하는 흐름도이다.
도 50은 도 48의 부호화 처리의 상세를 설명하는 흐름도이다.
도 51은 도 48의 PPS 설정 처리의 상세를 설명하는 흐름도이다.
도 52는 본 기술을 적용한 복호 장치의 제4 실시 형태의 구성예를 도시하는 블록도이다.
도 53은 도 52의 복호부의 구성예를 도시하는 블록도이다.
도 54는 도 52의 복호 장치에 의한 수취 처리를 설명하는 흐름도이다.
도 55는 도 54의 복호 처리의 상세를 설명하는 흐름도이다.
도 56은 다시점 화상 부호화 방식의 예를 도시하는 도면이다.
도 57은 본 기술을 적용한 다시점 화상 부호화 장치의 주된 구성예를 도시하는 도면이다.
도 58은 본 기술을 적용한 다시점 화상 복호 장치의 주된 구성예를 도시하는 도면이다.
도 59는 계층 화상 부호화 방식의 예를 도시하는 도면이다.
도 60은 본 기술을 적용한 계층 화상 부호화 장치의 주된 구성예를 도시하는 도면이다.
도 61은 본 기술을 적용한 계층 화상 복호 장치의 주된 구성예를 도시하는 도면이다.
도 62는 컴퓨터의 하드웨어 구성예를 도시하는 블록도이다.
도 63은 본 기술을 적용한 텔레비전 장치의 개략 구성예를 도시하는 도면이다.
도 64는 본 기술을 적용한 휴대 전화기의 개략 구성예를 도시하는 도면이다.
도 65는 본 기술을 적용한 기록 재생 장치의 개략 구성예를 도시하는 도면이다.
도 66은 본 기술을 적용한 촬상 장치의 개략 구성예를 도시하는 도면이다.
도 67은 스케일러블 부호화 이용의 일례를 도시하는 블록도이다.
도 68은 스케일러블 부호화 이용의 다른 예를 도시하는 블록도이다.
도 69는 스케일러블 부호화 이용의 또 다른 예를 도시하는 블록도이다.
도 70은 본 기술을 적용한 비디오 세트의 개략적인 구성의 일례를 도시하는 도면이다.
도 71은 본 기술을 적용한 비디오 프로세서의 개략적인 구성의 일례를 도시하는 도면이다.
도 72는 본 기술을 적용한 비디오 프로세서의 개략적인 구성의 다른 예를 도시하는 도면이다.
<제1 실시 형태>
(부호화 장치의 제1 실시 형태의 구성예)
도 3은 본 기술을 적용한 부호화 장치의 제1 실시 형태의 구성예를 도시하는 블록도이다.
도 3의 부호화 장치(10)는 부호화부(11), 설정부(12) 및 전송부(13)에 의해 구성되며, 화상을 HEVC 방식으로 부호화한다.
구체적으로는, 부호화 장치(10)의 부호화부(11)에는 프레임 단위의 화상이 입력 신호로서 입력된다. 부호화부(11)는 설정부(12)로부터 공급되는 RPS를 참조하여, 입력 신호를 HEVC 방식으로 부호화하고, 그 결과 얻어지는 부호화 데이터를 설정부(12)에 공급한다.
설정부(12)는, inter_ref_pic_set_prediction_flag를 포함하지 않고, 참조 화상 특정 정보를 포함하는 RPS와, inter_ref_pic_set_prediction_flag와, 참조 화상 특정 정보 또는 delta_idx_minus1을 포함하는 RPS를 설정한다. 설정부(12)는, 각 RPS에, 그 RPS(참조 화상 정보)를 특정하는 참조 화상 정보 특정 정보로서의 인덱스를 부여한다. 여기에서는, inter_ref_pic_set_prediction_flag를 포함하지 않고, 참조 화상 특정 정보를 포함하는 RPS의 인덱스로서 0이 부여되는 것으로 한다.
설정부(12)는 인덱스가 부여된 RPS를 부호화부(11)에 공급한다. 설정부(12)는 RPS를 포함하는 SPS, PPS(Picture Parameter Set) 등을 설정한다.
설정부(12)는 설정된 SPS 및 PPS와, 부호화부(11)로부터 공급되는 부호화 데이터로부터 부호화 스트림을 생성한다. 설정부(12)는 부호화 스트림을 전송부(13)에 공급한다.
전송부(13)는 설정부(12)로부터 공급되는 부호화 스트림을 후술하는 복호 장치에 전송한다.
(부호화부의 구성예)
도 4는 도 3의 부호화부(11)의 구성예를 도시하는 블록도이다.
도 4의 부호화부(11)는 A/D 변환부(31), 화면 재배열 버퍼(32), 연산부(33), 직교 변환부(34), 양자화부(35), 가역 부호화부(36), 축적 버퍼(37), 역양자화부(38), 역직교 변환부(39), 가산부(40), 디블록 필터(41), 적응 오프셋 필터(42), 적응 루프 필터(43), 프레임 메모리(44), 스위치(45), 인트라 예측부(46), 움직임 예측ㆍ보상부(47), 예측 화상 선택부(48), 참조 화상 설정부(49) 및 레이트 제어부(50)에 의해 구성된다.
구체적으로는, 부호화부(11)의 A/D 변환부(31)는 입력 신호로서 입력된 프레임 단위의 화상을 A/D 변환하고, 화면 재배열 버퍼(32)에 출력하여 기억시킨다. 화면 재배열 버퍼(32)는, 기억한 표시의 순서의 프레임 단위의 화상을, GOP 구조에 따라서, 부호화를 위한 순서로 재배열하고, 연산부(33), 인트라 예측부(46) 및 움직임 예측ㆍ보상부(47)에 출력한다.
연산부(33)는 부호화부로서 기능하고, 예측 화상 선택부(48)로부터 공급되는 예측 화상과, 화면 재배열 버퍼(32)로부터 출력된 부호화 대상의 화상의 차분을 연산함으로써 부호화를 행한다. 구체적으로는, 연산부(33)는, 화면 재배열 버퍼(32)로부터 출력된 부호화 대상의 화상으로부터, 예측 화상 선택부(48)로부터 공급되는 예측 화상을 감산함으로써 부호화를 행한다. 연산부(33)는, 그 결과 얻어지는 화상을, 잔차 정보로서 직교 변환부(34)에 출력한다. 또한, 예측 화상 선택부(48)로부터 예측 화상이 공급되지 않는 경우, 연산부(33)는 화면 재배열 버퍼(32)로부터 판독된 화상을 그대로 잔차 정보로서 직교 변환부(34)에 출력한다.
직교 변환부(34)는 연산부(33)로부터의 잔차 정보를 직교 변환하여, 직교 변환 계수를 생성한다. 직교 변환부(34)는 생성된 직교 변환 계수를 양자화부(35)에 공급한다.
양자화부(35)는, 직교 변환부(34)로부터 공급되는 직교 변환 계수에 대하여, 레이트 제어부(50)로부터 공급되는 양자화 파라미터를 사용하여 양자화를 행한다. 양자화부(35)는, 그 결과 얻어지는 계수를 가역 부호화부(36)에 입력한다.
가역 부호화부(36)는 최적 인트라 예측 모드를 나타내는 정보(이하, 인트라 예측 모드 정보라 함)를 인트라 예측부(46)로부터 취득한다. 또한, 가역 부호화부(36)는 최적 인터 예측 모드를 나타내는 정보(이하, 인터 예측 모드 정보라 함), 움직임 벡터 등을 움직임 예측ㆍ보상부(47)로부터 취득한다. 또한, 가역 부호화부(36)는 참조 화상 설정부(49)로부터 RPS의 인덱스 또는 RPS 등을 취득하고, 레이트 제어부(50)로부터 양자화 파라미터를 취득한다.
또한, 가역 부호화부(36)는 적응 오프셋 필터(42)로부터 저장 플래그, 인덱스 또는 오프셋 및 종류 정보를 오프셋 필터 정보로서 취득하고, 적응 루프 필터(43)로부터 필터 계수를 취득한다.
가역 부호화부(36)는, 양자화부(35)로부터 공급되는 양자화된 계수에 대하여, 가변 길이 부호화(예를 들어, CAVLC(Context-Adaptive Variable Length Coding) 등), 산술 부호화(예를 들어, CABAC(Context-Adaptive Binary Arithmetic Coding) 등) 등의 가역 부호화를 행한다.
또한, 가역 부호화부(36)는 인트라 예측 모드 정보, 또는, 인터 예측 모드 정보, 움직임 벡터, RPS의 인덱스 또는 RPS 등, 양자화 파라미터, 오프셋 필터 정보 및 필터 계수를, 부호화에 관한 부호화 정보로서 가역 부호화한다. 가역 부호화부(36)는, 가역 부호화된 부호화 정보와 계수를, 부호화 데이터로서 축적 버퍼(37)에 공급하여, 축적시킨다. 또한, 가역 부호화된 부호화 정보는 가역 부호화된 계수의 헤더 정보(슬라이스 헤더)로 되어도 된다.
축적 버퍼(37)는, 가역 부호화부(36)로부터 공급되는 부호화 데이터를, 일시적으로 기억한다. 또한, 축적 버퍼(37)는 기억하고 있는 부호화 데이터를 도 3의 설정부(12)에 공급한다.
또한, 양자화부(35)로부터 출력된, 양자화된 계수는 역양자화부(38)에도 입력된다. 역양자화부(38)는, 양자화부(35)에 의해 양자화된 계수에 대하여, 레이트 제어부(50)로부터 공급되는 양자화 파라미터를 사용하여 역양자화를 행하고, 그 결과 얻어지는 직교 변환 계수를 역직교 변환부(39)에 공급한다.
역직교 변환부(39)는 역양자화부(38)로부터 공급되는 직교 변환 계수에 대하여 역직교 변환을 행한다. 역직교 변환부(39)는 역직교 변환의 결과 얻어지는 잔차 정보를 가산부(40)에 공급한다.
가산부(40)는, 역직교 변환부(39)로부터 공급되는 잔차 정보와, 예측 화상 선택부(48)로부터 공급되는 예측 화상을 가산하여, 국부적으로 복호된 화상을 얻는다. 또한, 예측 화상 선택부(48)로부터 예측 화상이 공급되지 않는 경우, 가산부(40)는 역직교 변환부(39)로부터 공급되는 잔차 정보를 국부적으로 복호된 화상이라 한다. 가산부(40)는 국부적으로 복호된 화상을 디블록 필터(41)에 공급함과 함께, 프레임 메모리(44)에 공급하여 축적시킨다.
디블록 필터(41)는, 가산부(40)로부터 공급되는 국부적으로 복호된 화상에 대하여, 블록 왜곡을 제거하는 적응 디블록 필터 처리를 행하고, 그 결과 얻어지는 화상을 적응 오프셋 필터(42)에 공급한다.
적응 오프셋 필터(42)는, 디블록 필터(41)에 의한 적응 디블록 필터 처리 후의 화상에 대하여, 주로 링잉을 제거하는 적응 오프셋 필터(SAO : Sample adaptive offset) 처리를 행한다.
구체적으로는, 적응 오프셋 필터(42)는, 최대의 부호화 단위인 LCU(Largest Coding Unit)마다 적응 오프셋 필터 처리의 종류를 결정하고, 그 적응 오프셋 필터 처리에서 사용되는 오프셋을 구한다. 적응 오프셋 필터(42)는, 구해진 오프셋을 사용하여, 적응 디블록 필터 처리 후의 화상에 대하여, 결정된 종류의 적응 오프셋 필터 처리를 행한다. 그리고, 적응 오프셋 필터(42)는 적응 오프셋 필터 처리 후의 화상을 적응 루프 필터(43)에 공급한다.
또한, 적응 오프셋 필터(42)는 오프셋을 저장하는 버퍼를 갖고 있다. 적응 오프셋 필터(42)는 LCU마다 적응 디블록 필터 처리에 사용된 오프셋이 이미 버퍼에 저장되어 있는지 여부를 판정한다.
적응 오프셋 필터(42)는 적응 디블록 필터 처리에 사용된 오프셋이 이미 버퍼에 저장되어 있다고 판정한 경우, 오프셋이 버퍼에 저장되어 있는지를 나타내는 저장 플래그를, 오프셋이 버퍼에 저장되어 있는 것을 나타내는 값(여기서는 1)으로 설정한다.
그리고, 적응 오프셋 필터(42)는, LCU마다, 1로 설정된 저장 플래그, 버퍼에 있어서의 오프셋의 저장 위치를 나타내는 인덱스 및 행해진 적응 오프셋 필터 처리의 종류를 나타내는 종류 정보를 가역 부호화부(36)에 공급한다.
한편, 적응 오프셋 필터(42)는, 적응 디블록 필터 처리에 사용된 오프셋이 아직 버퍼에 저장되지 못한 경우, 그 오프셋을 순서대로 버퍼에 저장한다. 또한, 적응 오프셋 필터(42)는, 저장 플래그를, 오프셋이 버퍼에 저장되지 못한 것을 나타내는 값(여기서는 0)으로 설정한다. 그리고, 적응 오프셋 필터(42)는, LCU마다, 0으로 설정된 저장 플래그, 오프셋 및 종류 정보를 가역 부호화부(36)에 공급한다.
적응 루프 필터(43)는, 적응 오프셋 필터(42)로부터 공급되는 적응 오프셋 필터 처리 후의 화상에 대하여, 예를 들어 LCU마다, 적응 루프 필터(ALF : Adaptive Loop Filter) 처리를 행한다. 적응 루프 필터 처리로서는, 예를 들어 2차원의 위너 필터(Wiener Filter)에 의한 처리가 사용된다. 물론, 위너 필터 이외의 필터가 사용되어도 된다.
구체적으로는, 적응 루프 필터(43)는, LCU마다, 화면 재배열 버퍼(32)로부터 출력되는 화상인 원화상과 적응 루프 필터 처리 후의 화상 잔차가 최소로 되도록, 적응 루프 필터 처리에서 사용되는 필터 계수를 산출한다. 그리고, 적응 루프 필터(43)는, 적응 오프셋 필터 처리 후의 화상에 대하여, 산출된 필터 계수를 사용하여, LCU마다 적응 루프 필터 처리를 행한다.
적응 루프 필터(43)는 적응 루프 필터 처리 후의 화상을 프레임 메모리(44)에 공급한다. 또한, 적응 루프 필터(43)는 필터 계수를 가역 부호화부(36)에 공급한다.
또한, 여기에서는, 적응 루프 필터 처리는, LCU마다 행해지는 것으로 하지만, 적응 루프 필터 처리의 처리 단위는 LCU에 한정되지 않는다. 단, 적응 오프셋 필터(42)와 적응 루프 필터(43)의 처리 단위를 맞춤으로써, 처리를 효율적으로 행할 수 있다.
프레임 메모리(44)는 적응 루프 필터(43)로부터 공급되는 화상과, 가산부(40)로부터 공급되는 화상을 축적한다. 프레임 메모리(44)에 축적된 화상은, 참조 화상으로서 스위치(45)를 통하여 인트라 예측부(46) 또는 움직임 예측ㆍ보상부(47)에 출력된다.
인트라 예측부(46)는, 프레임 메모리(44)로부터 스위치(45)를 통하여 판독된 참조 화상을 사용하여, 후보로 되는 모든 인트라 예측 모드의 인트라 예측 처리를 행한다.
또한, 인트라 예측부(46)는, 화면 재배열 버퍼(32)로부터 판독된 화상과, 인트라 예측 처리의 결과 생성되는 예측 화상에 기초하여, 후보로 되는 모든 인트라 예측 모드에 대하여 비용 함수값(상세는 후술함)을 산출한다. 그리고, 인트라 예측부(46)는 비용 함수값이 최소로 되는 인트라 예측 모드를, 최적 인트라 예측 모드로 결정한다.
인트라 예측부(46)는, 최적 인트라 예측 모드에서 생성된 예측 화상, 및, 대응하는 비용 함수값을, 예측 화상 선택부(48)에 공급한다. 인트라 예측부(46)는, 예측 화상 선택부(48)로부터 최적 인트라 예측 모드에서 생성된 예측 화상의 선택이 통지된 경우, 인트라 예측 모드 정보를 가역 부호화부(36)에 공급한다.
또한, 비용 함수값은 RD(Rate Distortion) 비용이라고도 하고, 예를 들어 H.264/AVC 방식에 있어서의 참조 소프트웨어인 JM(Joint Model)에서 정해져 있는 바와 같은, High Complexity 모드나, Low Complexity 모드 중 어느 하나의 방법에 기초하여 산출된다.
구체적으로는, 비용 함수값의 산출 방법으로서 High Complexity 모드가 채용되는 경우, 후보로 되는 모든 예측 모드에 대하여, 임시로 복호까지가 행해지고, 다음 수학식 1로 나타내어지는 비용 함수값이 각 예측 모드에 대하여 산출된다.
Figure 112014122679310-pct00001
D는 원 화상과 복호 화상의 차분(왜곡), R은 직교 변환의 계수까지 포함한 발생 부호량, λ는 양자화 파라미터 QP의 함수로서 주어지는 라그랑즈 승수이다.
한편, 비용 함수값의 산출 방법으로서 Low Complexity 모드가 채용되는 경우, 후보로 되는 모든 예측 모드에 대하여, 예측 화상의 생성 및 부호화 정보의 부호량의 산출이 행해지고, 다음 수학식 2로 나타내어지는 비용 함수가 각 예측 모드에 대하여 산출된다.
Figure 112014122679310-pct00002
D는 원화상과 예측 화상의 차분(왜곡), Header_Bit는 부호화 정보의 부호량, QPtoQuant는 양자화 파라미터 QP의 함수로서 주어지는 함수이다.
Low Complexity 모드에서는, 모든 예측 모드에 대하여, 예측 화상을 생성하기만 하면 되고, 복호 화상을 생성할 필요가 없기 때문에, 연산량이 적어도 된다.
움직임 예측ㆍ보상부(47)는 후보로 되는 모든 인터 예측 모드의 움직임 예측ㆍ보상 처리를 행한다. 구체적으로는, 움직임 예측ㆍ보상부(47)는 화면 재배열 버퍼(32)로부터 공급되는 화상과, 프레임 메모리(44)로부터 스위치(45)를 통해서 판독되는 참조 화상에 기초하여, 후보로 되는 모든 인터 예측 모드의 움직임 벡터를 검출한다. 그리고, 움직임 예측ㆍ보상부(47)는, 예측 화상 생성부로서 기능하고, 그 움직임 벡터에 기초하여 참조 화상에 보상 처리를 실시하여, 예측 화상을 생성한다.
이때, 움직임 예측ㆍ보상부(47)는, 화면 재배열 버퍼(32)로부터 공급되는 화상과 예측 화상에 기초하여, 후보로 되는 모든 인터 예측 모드에 대하여 비용 함수값을 산출하고, 비용 함수값이 최소로 되는 인터 예측 모드를 최적 인터 예측 모드로 결정한다. 그리고, 움직임 예측ㆍ보상부(47)는, 최적 인터 예측 모드의 비용 함수값과, 대응하는 예측 화상을 예측 화상 선택부(48)에 공급한다. 또한, 움직임 예측ㆍ보상부(47)는, 예측 화상 선택부(48)로부터 최적 인터 예측 모드에서 생성된 예측 화상의 선택이 통지된 경우, 인터 예측 모드 정보, 대응하는 움직임 벡터 등을 가역 부호화부(36)에 출력하고, 참조 화상 특정 정보를 참조 화상 설정부(49)에 출력한다.
예측 화상 선택부(48)는, 인트라 예측부(46) 및 움직임 예측ㆍ보상부(47)로부터 공급되는 비용 함수값에 기초하여, 최적 인트라 예측 모드와 최적 인터 예측 모드 중, 대응하는 비용 함수값이 작은 쪽을 최적 예측 모드로 결정한다. 그리고, 예측 화상 선택부(48)는, 최적 예측 모드의 예측 화상을, 연산부(33) 및 가산부(40)에 공급한다. 또한, 예측 화상 선택부(48)는, 최적 예측 모드의 예측 화상의 선택을 인트라 예측부(46) 또는 움직임 예측ㆍ보상부(47)에 통지한다.
참조 화상 설정부(49)는, 움직임 예측ㆍ보상부(47)로부터 공급되는 참조 화상 특정 정보를 GOP분만큼 유지한다. 참조 화상 설정부(49)는, 부호화 대상의 화상이 GOP의 선두의 화상인 경우, RPS의 인덱스로서의 0과, 부호화 대상의 화상의 RPS가 SPS에 포함되는 RPS인 것을 나타내는 RPS 플래그를 가역 부호화부(36)에 공급한다.
한편, 부호화 대상의 화상이 GOP의 선두의 화상 이외의 화상인 경우, 참조 화상 설정부(49)는, 유지되어 있는 전화상의 참조 화상 특정 정보와, 부호화 대상의 화상의 참조 화상 특정 정보를 비교하고, 비교 결과에 기초하여inter_ref_pic_set_prediction_flag와 delta_idx_minus1을 결정한다. 그리고, 참조 화상 설정부(49)는, 결정된 inter_ref_pic_set_prediction_flag와, 부호화 대상의 화상의 참조 화상 특정 정보 또는 delta_idx_minus1을 포함하는 RPS를, 부호화 대상의 화상의 RPS라 한다.
그리고, 참조 화상 설정부(49)는, 부호화 대상의 화상의 RPS와 동일한 RPS가 설정부(12)로부터 공급되고 있는 경우, 그 RPS의 인덱스와, 부호화 대상의 화상의 RPS가 SPS에 포함되는 RPS인 것을 나타내는 RPS 플래그를 가역 부호화부(36)에 공급한다. 한편, 부호화 대상의 화상의 RPS와 동일한 RPS가 설정부(12)로부터 공급되지 않는 경우, 참조 화상 설정부(49)는, 부호화 대상의 화상의 RPS와, 부호화 대상의 화상의 RPS가 SPS에 포함되는 RPS가 아닌 것을 나타내는 RPS 플래그를 가역 부호화부(36)에 공급한다.
레이트 제어부(50)는, 축적 버퍼(37)에 축적된 부호화 데이터에 기초하여, 오버플로우 혹은 언더플로우가 발생하지 않도록, 양자화부(35)에서 사용되는 양자화 파라미터를 결정한다. 레이트 제어부(50)는, 결정된 양자화 파라미터를, 양자화부(35), 가역 부호화부(36) 및 역양자화부(38)에 공급한다.
(SPS의 신택스의 예)
도 5는 도 3의 설정부(12)에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 5의 제18행째에 나타내는 바와 같이, SPS에는 각 인덱스(i)의 RPS가 포함된다.
(RPS의 신택스의 예)
도 6은 RPS의 신택스의 예를 도시하는 도면이다.
또한, 도시는 생략하지만, 도 6의 제6행째 이후의 기술은 도 1의 제3행째 이후의 기술과 마찬가지이다.
도 6의 제2행째와 제3행째에 나타내는 바와 같이, 인덱스(idx)가 0인 RPS에는 inter_ref_pic_set_prediction_flag가 포함되지 않고, inter_ref_pic_set_prediction_flag가 0인 경우에 포함되는 참조 화상 특정 정보가 포함된다.
한편, 제4행째 및 제5행째에 나타내는 바와 같이, 인덱스(idx)가 0 이외인 RPS에는 inter_ref_pic_set_prediction_flag가 포함된다. 그리고, inter_ref_pic_set_prediction_flag가 0인 경우 참조 화상 특정 정보가 포함되고, inter_ref_pic_set_prediction_flag가 1인 경우 delta_idx_minus1이 포함된다.
(본 기술의 효과의 설명)
도 7은 도 3의 설정부(12)에 의해 설정되는 RPS의 정보량을 설명하는 도면이며, 도 8은 종래의 RPS의 정보량을 설명하는 도면이다.
도 7과 도 8의 예에서는, GOP 내의 선두로부터 2번째의 픽처와 8번째의 픽처의 참조 화상 특정 정보가, 부호화순으로 하나 전의 픽처의 참조 화상 특정 정보와 동일하다.
이 경우, 도 7에 도시한 바와 같이, 설정부(12)는 인덱스가 0인 RPS로서, GOP의 선두의 픽처의 참조 화상 특정 정보를 설정한다. 또한, 설정부(12)는, 예를 들어 인덱스가 1인 RPS로서, inter_ref_pic_set_prediction_flag로서의 1과, delta_idx_minus1로서의 0을 설정한다. 그리고, GOP의 선두의 픽처의 RPS의 인덱스가 0으로 되고, 2번째의 픽처와 8번째의 픽처의 RPS의 인덱스가 1로 된다.
이에 반해, 도 8에 도시한 바와 같이, 종래의 경우, 예를 들어 인덱스가 0인 RPS로서, inter_ref_pic_set_prediction_flag로서의 0과 GOP의 선두의 픽처의 참조 화상 특정 정보가 설정된다. 또한, 설정부(12)의 경우와 마찬가지로, 인덱스가 1인 RPS가 설정된다. 그리고, GOP의 선두의 픽처의 인덱스가 0으로 되고, 2번째의 픽처와 8번째의 픽처의 RPS의 인덱스가 1로 된다.
이상과 같이, 설정부(12)는, 선두의 픽처의 RPS로서 사용되는 인덱스가 0인 RPS로서 inter_ref_pic_set_prediction_flag를 설정하지 않는다. 즉, GOP의 선두의 픽처는, 자신보다 부호화순으로 앞의 픽처가 존재하지 않기 때문에, inter_ref_pic_set_prediction_flag는 반드시 0으로 된다. 따라서, 설정부(12)는, 선두의 픽처의 RPS로서 사용되는 인덱스가 0인 RPS로서 inter_ref_pic_set_prediction_flag를 설정하지 않고, inter_ref_pic_set_prediction_flag가 0인 것으로서 참조 화상 특정 정보만을 설정한다. 그 결과, 종래의 경우에 비해, 선두의 픽처의 inter_ref_pic_set_prediction_flag분만큼 RPS의 정보량을 삭감할 수 있다.
(슬라이스 헤더의 신택스의 예)
도 9는 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 9의 제5행째에 나타내는 바와 같이, 슬라이스 헤더에는 대응하는 계수의 RPS 플래그(short_term_ref_pic_set_sps_flag)가 포함된다. 또한, 도 9의 제6행째와 제7행째에 나타내는 바와 같이, RPS 플래그가, 부호화 대상의 화상의 RPS가 SPS에 포함되는 RPS가 아닌 것을 나타내는 0인 경우, 슬라이스 헤더에는 대응하는 계수의 RPS가 short_term_ref_pic_set(num_short_term_ref_pic_sets)로서 포함된다.
도 9의 제8행째 및 제9행째에 나타내는 바와 같이, RPS 플래그가, 부호화 대상의 화상의 RPS가 SPS에 포함되는 RPS인 것을 나타내는 1인 경우, 슬라이스 헤더에는, 대응하는 계수의 RPS의 인덱스가 short_term_ref_pic_set_idx로서 포함된다.
(부호화 장치의 처리의 설명)
도 10은 도 3의 부호화 장치(10)의 생성 처리를 설명하는 흐름도이다.
도 10의 스텝 S11에 있어서, 부호화 장치(10)의 설정부(12)는, RPS를 설정하는 RPS 설정 처리를 행한다. 이 RPS 설정 처리의 상세는, 후술하는 도 11을 참조하여 후술한다. 스텝 S12에 있어서, 부호화부(11)는 외부로부터 입력 신호로서 입력되는 프레임 단위의 화상을 HEVC 방식으로 부호화하는 부호화 처리를 행한다. 이 부호화 처리의 상세는 후술하는 도 12 및 도 13을 참조하여 설명한다.
스텝 S13에 있어서, 설정부(12)는 인덱스가 부여된 RPS를 포함하는 SPS를 설정한다. 스텝 S14에 있어서, 설정부(12)는 PPS를 설정한다. 스텝 S15에 있어서, 설정부(12)는 설정된 SPS 및 PPS와, 부호화부(11)로부터 공급되는 부호화 데이터로부터, 부호화 스트림을 생성한다. 설정부(12)는 부호화 스트림을 전송부(13)에 공급한다.
스텝 S16에 있어서, 전송부(13)는 설정부(12)로부터 공급되는 부호화 스트림을, 후술하는 복호 장치에 전송하고, 처리를 종료한다.
도 11은 도 10의 스텝 S11의 RPS 설정 처리의 상세를 설명하는 흐름도이다.
도 11의 스텝 S21에 있어서, 설정부(12)는 RPS의 인덱스 i를 0으로 설정한다. 스텝 S22에 있어서, RPS의 인덱스 i가 0인지 여부를 판정한다. 스텝 S22에서 RPS의 인덱스 i가 0이라고 판정된 경우, 스텝 S23에 있어서, 설정부(12)는 inter_ref_pic_set_prediction_flag를 0으로 설정하고, 처리를 스텝 S25로 진행시킨다.
스텝 S22에서 RPS의 인덱스 i가 0이 아니라고 판정된 경우, 설정부(12)는, 스텝 S24에 있어서, 설정부(12)는, 인덱스 i의 RPS로서, inter_ref_pic_set_prediction_flag를 설정하고, 처리를 스텝 S25로 진행시킨다.
스텝 S25에 있어서, 설정부(12)는, inter_ref_pic_set_prediction_flag가 1인지 여부를 판정한다. 스텝 S25에서 inter_ref_pic_set_prediction_flag가 1이라고 판정된 경우, 스텝 S26에 있어서, 설정부(12)는 인덱스 i의 RPS로서 delta_idx_minus1을 설정하고, 처리를 스텝 S28로 진행시킨다.
한편, 스텝 S25에서 inter_ref_pic_set_prediction_flag가 1이 아니라고 판정된 경우, 즉 inter_ref_pic_set_prediction_flag가 0인 경우, 스텝 S27에 있어서, 설정부(12)는 참조 화상 특정 정보를 설정하고, 처리를 스텝 S28로 진행시킨다.
스텝 S28에 있어서, 설정부(12)는 인덱스 i를 1만큼 인크리먼트한다. 스텝 S29에 있어서, 설정부(12)는, 인덱스 i가 SPS에 포함시키는 RPS의 수 num_short_term_ref_pic_sets 이상인지 여부를 판정한다.
스텝 S29에서 인덱스 i가 수 num_short_term_ref_pic_sets 이상이 아니라고 판정된 경우, 처리는 스텝 S22로 되돌아가서, 인덱스 i가 수 num_short_term_ref_pic_sets 이상으로 될 때까지, 스텝 S22 내지 S29의 처리가 반복된다.
한편, 스텝 S29에서 인덱스 i가 수 num_short_term_ref_pic_sets 이상이라고 판정된 경우, 처리는 도 10의 스텝 S11로 되돌아가서, 스텝 S12로 진행된다.
도 12 및 도 13은 도 10의 스텝 S12의 부호화 처리의 상세를 설명하는 흐름도이다.
도 12의 스텝 S31에 있어서, 부호화부(11)의 A/D 변환부(31)는, 입력 신호로서 입력된 프레임 단위의 화상을 A/D 변환하고, 화면 재배열 버퍼(32)에 출력하여 기억시킨다.
스텝 S32에 있어서, 화면 재배열 버퍼(32)는, 기억한 표시의 순서의 프레임의 화상을, GOP 구조에 따라서, 부호화를 위한 순서로 재배열한다. 화면 재배열 버퍼(32)는, 재배열 후의 프레임 단위의 화상을, 연산부(33), 인트라 예측부(46) 및 움직임 예측ㆍ보상부(47)에 공급한다.
스텝 S33에 있어서, 인트라 예측부(46)는, 후보로 되는 모든 인트라 예측 모드의 인트라 예측 처리를 행한다. 또한, 인트라 예측부(46)는, 화면 재배열 버퍼(32)로부터 판독된 화상과, 인트라 예측 처리의 결과 생성되는 예측 화상에 기초하여, 후보로 되는 모든 인트라 예측 모드에 대하여 비용 함수값을 산출한다. 그리고, 인트라 예측부(46)는, 비용 함수값이 최소로 되는 인트라 예측 모드를, 최적 인트라 예측 모드로 결정한다. 인트라 예측부(46)는, 최적 인트라 예측 모드에서 생성된 예측 화상, 및, 대응하는 비용 함수값을, 예측 화상 선택부(48)에 공급한다.
또한, 움직임 예측ㆍ보상부(47)는, 후보로 되는 모든 인터 예측 모드의 움직임 예측ㆍ보상 처리를 행한다. 또한, 움직임 예측ㆍ보상부(47)는, 화면 재배열 버퍼(32)로부터 공급되는 화상과 예측 화상에 기초하여, 후보로 되는 모든 인터 예측 모드에 대하여 비용 함수값을 산출하고, 비용 함수값이 최소로 되는 인터 예측 모드를 최적 인터 예측 모드로 결정한다. 그리고, 움직임 예측ㆍ보상부(47)는, 최적 인터 예측 모드의 비용 함수값과, 대응하는 예측 화상을 예측 화상 선택부(48)에 공급한다.
스텝 S34에 있어서, 예측 화상 선택부(48)는, 스텝 S33의 처리에 의해 인트라 예측부(46) 및 움직임 예측ㆍ보상부(47)로부터 공급되는 비용 함수값에 기초하여, 최적 인트라 예측 모드와 최적 인터 예측 모드 중 비용 함수값이 최소로 되는 쪽을 최적 예측 모드로 결정한다. 그리고, 예측 화상 선택부(48)는, 최적 예측 모드의 예측 화상을, 연산부(33) 및 가산부(40)에 공급한다.
스텝 S35에 있어서, 예측 화상 선택부(48)는, 최적 예측 모드가 최적 인터 예측 모드인지 여부를 판정한다. 스텝 S35에서 최적 예측 모드가 최적 인터 예측 모드라고 판정된 경우, 예측 화상 선택부(48)는 최적 인터 예측 모드에서 생성된 예측 화상의 선택을 움직임 예측ㆍ보상부(47)에 통지한다.
그리고, 스텝 S36에 있어서, 움직임 예측ㆍ보상부(47)는, 인터 예측 모드 정보와, 대응하는 움직임 벡터를 가역 부호화부(36)에 공급한다. 움직임 예측ㆍ보상부(47)는 참조 화상 특정 정보를 참조 화상 설정부(49)에 공급한다.
스텝 S37에 있어서, 참조 화상 설정부(49)는 RPS의 인덱스를 결정하는 RPS 인덱스 결정 처리를 행한다. 이 RPS 인덱스 결정 처리의 상세는 후술하는 도 14를 참조하여 설명한다.
한편, 스텝 S35에서 최적 예측 모드가 최적 인터 예측 모드가 아니라고 판정된 경우, 즉 최적 예측 모드가 최적 인트라 예측 모드인 경우, 예측 화상 선택부(48)는 최적 인트라 예측 모드에서 생성된 예측 화상의 선택을 인트라 예측부(46)에 통지한다. 그리고, 스텝 S38에 있어서, 인트라 예측부(46)는 인트라 예측 모드 정보를 가역 부호화부(36)에 공급하고, 처리를 스텝 S39로 진행시킨다.
스텝 S39에 있어서, 연산부(33)는, 화면 재배열 버퍼(32)로부터 공급되는 화상으로부터, 예측 화상 선택부(48)로부터 공급되는 예측 화상을 감산함으로써 부호화를 행한다. 연산부(33)는, 그 결과 얻어지는 화상을, 잔차 정보로서 직교 변환부(34)에 출력한다.
스텝 S40에 있어서, 직교 변환부(34)는 연산부(33)로부터의 잔차 정보에 대하여 직교 변환을 실시하고, 그 결과 얻어지는 직교 변환 계수를 양자화부(35)에 공급한다.
스텝 S41에 있어서, 양자화부(35)는 레이트 제어부(50)로부터 공급되는 양자화 파라미터를 사용하여 직교 변환부(34)로부터 공급되는 계수를 양자화한다. 양자화된 계수는 가역 부호화부(36)와 역양자화부(38)에 입력된다.
도 13의 스텝 S42에 있어서, 역양자화부(38)는, 레이트 제어부(50)로부터 공급되는 양자화 파라미터를 사용하여, 양자화부(35)로부터 공급되는 양자화된 계수를 역양자화하고, 그 결과 얻어지는 직교 변환 계수를 역직교 변환부(39)에 공급한다.
스텝 S43에 있어서, 역직교 변환부(39)는, 역양자화부(38)로부터 공급되는 직교 변환 계수에 대하여 역직교 변환을 실시하고, 그 결과 얻어지는 잔차 정보를 가산부(40)에 공급한다.
스텝 S44에 있어서, 가산부(40)는 역직교 변환부(39)로부터 공급되는 잔차 정보와, 예측 화상 선택부(48)로부터 공급되는 예측 화상을 가산하여, 국부적으로 복호된 화상을 얻는다. 가산부(40)는 얻어진 화상을 디블록 필터(41)에 공급함과 함께, 프레임 메모리(44)에 공급한다.
스텝 S45에 있어서, 디블록 필터(41)는, 가산부(40)로부터 공급되는 국부적으로 복호된 화상에 대하여, 디블로킹 필터 처리를 행한다. 디블록 필터(41)는 그 결과 얻어지는 화상을 적응 오프셋 필터(42)에 공급한다.
스텝 S46에 있어서, 적응 오프셋 필터(42)는, 디블록 필터(41)로부터 공급되는 화상에 대하여, LCU마다 적응 오프셋 필터 처리를 행한다. 적응 오프셋 필터(42)는, 그 결과 얻어지는 화상을 적응 루프 필터(43)에 공급한다. 또한, 적응 오프셋 필터(42)는, LCU마다, 저장 플래그, 인덱스 또는 오프셋 및 종류 정보를, 오프셋 필터 정보로서 가역 부호화부(36)에 공급한다.
스텝 S47에 있어서, 적응 루프 필터(43)는, 적응 오프셋 필터(42)로부터 공급되는 화상에 대하여, LCU마다 적응 루프 필터 처리를 행한다. 적응 루프 필터(43)는, 그 결과 얻어지는 화상을 프레임 메모리(44)에 공급한다. 또한, 적응 루프 필터(43)는, 적응 루프 필터 처리에서 사용된 필터 계수를 가역 부호화부(36)에 공급한다.
스텝 S48에 있어서, 프레임 메모리(44)는, 적응 루프 필터(43)로부터 공급되는 화상과 가산부(40)로부터 공급되는 화상을 축적한다. 프레임 메모리(44)에 축적된 화상은, 참조 화상으로서 스위치(45)를 통해서 인트라 예측부(46) 또는 움직임 예측ㆍ보상부(47)에 출력된다.
스텝 S49에 있어서, 가역 부호화부(36)는, 인트라 예측 모드 정보 또는 인터 예측 모드 정보, 움직임 벡터, RPS의 인덱스 또는 RPS 등, 레이트 제어부(50)로부터의 양자화 파라미터, 오프셋 필터 정보 및 필터 계수를, 부호화 정보로서 가역 부호화한다.
스텝 S50에 있어서, 가역 부호화부(36)는 양자화부(35)로부터 공급되는 양자화된 계수를 가역 부호화한다. 그리고, 가역 부호화부(36)는, 스텝 S49의 처리에서 가역 부호화된 부호화 정보와 가역 부호화된 계수로부터, 부호화 데이터를 생성한다.
스텝 S51에 있어서, 축적 버퍼(37)는 가역 부호화부(36)로부터 공급되는 부호화 데이터를 일시적으로 축적한다.
스텝 S52에 있어서, 레이트 제어부(50)는, 축적 버퍼(37)에 축적된 부호화 데이터에 기초하여, 오버플로우 혹은 언더플로우가 발생하지 않도록, 양자화부(35)에서 사용되는 양자화 파라미터를 결정한다. 레이트 제어부(50)는, 결정된 양자화 파라미터를, 양자화부(35), 가역 부호화부(36) 및 역양자화부(38)에 공급한다.
스텝 S53에 있어서, 축적 버퍼(37)는, 기억하고 있는 부호화 데이터를, 도 3의 설정부(12)에 출력한다.
또한, 도 12 및 도 13의 부호화 처리에서는 설명을 간단화하기 위해서, 항상, 인트라 예측 처리와 움직임 예측ㆍ보상 처리가 행해지도록 하였지만, 실제로는 픽처 타입 등에 따라서 어느 한쪽만이 행해지는 경우도 있다.
도 14는 도 12의 스텝 S37의 RPS 인덱스 결정 처리의 상세를 설명하는 흐름도이다.
도 14의 스텝 S71에 있어서, 참조 화상 설정부(49)는, 움직임 예측ㆍ보상부(47)로부터 공급되는 참조 화상 특정 정보를 GOP분만큼 유지한다. 스텝 S72에 있어서, 참조 화상 설정부(49)는 부호화 대상의 화상이 GOP의 선두의 화상인지 여부를 판정한다.
스텝 S72에서 부호화 대상의 화상이 GOP의 선두의 화상이라고 판정된 경우, 스텝 S73에 있어서, 참조 화상 설정부(49)는 RPS 플래그를 1로 설정한다. 스텝 S74에 있어서, 참조 화상 설정부(49)는 RPS의 인덱스를 0으로 설정하고, 처리를 스텝 S79로 진행시킨다.
한편, 스텝 S72에서 부호화 대상의 화상이 GOP의 선두의 화상 이외의 화상이라고 판정된 경우, 스텝 S75에 있어서, 참조 화상 설정부(49)는 부호화 대상의 화상의 RPS를 생성한다.
구체적으로는, 참조 화상 설정부(49)는, 유지되어 있는 전화상의 참조 화상 특정 정보와, 부호화 대상의 화상의 참조 화상 특정 정보가 동일한지 여부를 판정한다. 참조 화상 설정부(49)는, 유지되어 있는 전화상의 참조 화상 특정 정보와, 부호화 대상의 화상의 참조 화상 특정 정보가 동일하다고 판정된 경우, inter_ref_pic_set_prediction_flag로서 1을 포함하고, delta_idx_minus1을 포함하는 부호화 대상의 화상의 RPS를 생성한다.
한편, 유지되어 있는 전화상의 참조 화상 특정 정보와, 부호화 대상의 화상의 참조 화상 특정 정보가 동일하지 않다고 판정된 경우, 참조 화상 설정부(49)는 inter_ref_pic_set_prediction_flag로서 0을 포함하는 부호화 대상의 화상의 RPS를 생성한다.
스텝 S76에 있어서, 참조 화상 설정부(49)는 부호화 대상의 화상의 RPS가 설정부(12)로부터 공급되는 SPS에 포함되는 RPS와 동일한지 여부를 판정한다. 스텝 S76에서 부호화 대상의 화상의 RPS가 SPS에 포함되는 RPS와 동일하다고 판정된 경우, 스텝 S77에 있어서, 참조 화상 설정부(49)는 RPS 플래그를 1로 설정한다.
스텝 S78에 있어서, 참조 화상 설정부(49)는 부호화 대상의 화상의 RPS와 동일한 SPS에 포함되는 RPS의 인덱스를 인식하고, 처리를 스텝 S79로 진행시킨다. 스텝 S79에 있어서, 참조 화상 설정부(49)는, 스텝 S73 또는 스텝 S77에서 설정된 RPS 플래그와, 스텝 S74에서 설정된 RPS의 인덱스 또는 스텝 S78에서 인식된 RPS의 인덱스를 가역 부호화부(36)에 공급한다. 그리고, 처리는 도 12의 스텝 S37로 되돌아가서, 스텝 S39으로 진행된다.
한편, 스텝 S76에서 부호화 대상의 화상의 RPS가 SPS에 포함되는 RPS와 동일하지 않다고 판정된 경우, 참조 화상 설정부(49)는 RPS 플래그를 0으로 설정한다. 스텝 S81에 있어서, 참조 화상 설정부(49)는, 스텝 S80에서 설정된 RPS 플래그와 스텝 S75에서 생성된 RPS를 가역 부호화부(36)에 공급한다. 그리고, 처리는 도 12의 스텝 S37로 되돌아가서, 스텝 S39로 진행된다.
이상과 같이, 부호화 장치(10)는, 부호화 대상의 화상이 GOP의 선두의 화상 이외의 화상인 경우, inter_ref_pic_set_prediction_flag를 전송한다. 즉, 부호화 장치(10)는, 부호화 대상의 화상이 GOP의 선두의 화상인 경우, inter_ref_pic_set_prediction_flag를 전송하지 않는다. 따라서, GOP의 선두의 화상의 inter_ref_pic_set_prediction_flag분만큼, 참조 화상 특정 정보에 관한 RPS의 정보량을 삭감할 수 있다.
(복호 장치의 제1 실시 형태의 구성예)
도 15는 도 3의 부호화 장치(10)로부터 전송되는 부호화 스트림을 복호하는, 본 기술을 적용한 복호 장치의 제1 실시 형태의 구성예를 도시하는 블록도이다.
도 15의 복호 장치(110)는 수취부(111), 추출부(112) 및 복호부(113)에 의해 구성된다.
복호 장치(110)의 수취부(111)는, 도 3의 부호화 장치(10)로부터 전송되어 오는 부호화 스트림을 수취하여, 추출부(112)에 공급한다.
추출부(112)는, 수취부(111)로부터 공급되는 부호화 스트림으로부터, SPS, PPS, 부호화 데이터 등을 추출한다. 추출부(112)는 부호화 데이터를 복호부(113)에 공급한다. 또한, 추출부(112)는, SPS에 기초하여, 각 RPS의 inter_ref_pic_set_prediction_flag와 delta_idx_minus1 또는 참조 화상 특정 정보를 취득하여, 복호부(113)에 공급한다. 또한, 추출부(112)는, SPS에 포함되는 RPS 이외의 정보나 PPS 등도, 필요에 따라서 복호부(113)에 공급한다.
복호부(113)는, 추출부(112)로부터 공급되는 각 RPS의 inter_ref_pic_set_prediction_flag와 delta_idx_minus1 또는 참조 화상 특정 정보에 기초하여, 추출부(112)로부터 공급되는 부호화 데이터를 HEVC 방식으로 복호한다. 이때, 복호부(113)는 필요에 따라서 SPS에 포함되는 RPS 이외의 정보나 PPS 등도 참조한다. 복호부(113)는, 복호의 결과 얻어지는 화상을, 출력 신호로서 출력한다.
(복호부의 구성예)
도 16은 도 15의 복호부(113)의 구성예를 도시하는 블록도이다.
도 16의 복호부(113)는, 축적 버퍼(131), 가역 복호부(132), 역양자화부(133), 역직교 변환부(134), 가산부(135), 디블록 필터(136), 적응 오프셋 필터(137), 적응 루프 필터(138), 화면 재배열 버퍼(139), D/A 변환부(140), 프레임 메모리(141), 스위치(142), 인트라 예측부(143), 참조 화상 설정부(144), 움직임 보상부(145) 및 스위치(146)에 의해 구성된다.
복호부(113)의 축적 버퍼(131)는 도 15의 추출부(112)로부터 부호화 데이터를 수취하여, 축적한다. 축적 버퍼(131)는 축적되어 있는 부호화 데이터를 가역 복호부(132)에 공급한다.
가역 복호부(132)는, 축적 버퍼(131)로부터의 부호화 데이터에 대하여, 가변 길이 복호나, 산술 복호 등의 가역 복호를 실시함으로써, 양자화된 계수와 부호화 정보를 얻는다. 가역 복호부(132)는 양자화된 계수를 역양자화부(133)에 공급한다. 또한, 가역 복호부(132)는 부호화 정보로서의 인트라 예측 모드 정보 등을 인트라 예측부(143)에 공급하고, 움직임 벡터, 인터 예측 모드 정보 등을 움직임 보상부(145)에 공급한다. 가역 복호부(132)는 부호화 정보로서의 RPS 플래그와 RPS의 인덱스 또는 RPS를 참조 화상 설정부(144)에 공급한다.
또한, 가역 복호부(132)는, 부호화 정보로서의 인트라 예측 모드 정보 또는 인터 예측 모드 정보를 스위치(146)에 공급한다. 가역 복호부(132)는 부호화 정보로서의 오프셋 필터 정보를 적응 오프셋 필터(137)에 공급하고, 필터 계수를 적응 루프 필터(138)에 공급한다.
역양자화부(133), 역직교 변환부(134), 가산부(135), 디블록 필터(136), 적응 오프셋 필터(137), 적응 루프 필터(138), 프레임 메모리(141), 스위치(142), 인트라 예측부(143), 및, 움직임 보상부(145)는, 도 4의 역양자화부(38), 역직교 변환부(39), 가산부(40), 디블록 필터(41), 적응 오프셋 필터(42), 적응 루프 필터(43), 프레임 메모리(44), 스위치(45), 인트라 예측부(46), 및, 움직임 예측ㆍ보상부(47)와 각각 마찬가지의 처리를 행하고, 이에 의해, 화상이 복호된다.
구체적으로는, 역양자화부(133)는 가역 복호부(132)로부터의 양자화된 계수를 역양자화하고, 그 결과 얻어지는 직교 변환 계수를 역직교 변환부(134)에 공급한다.
역직교 변환부(134)는, 역양자화부(133)로부터의 직교 변환 계수에 대하여 역직교 변환을 행한다. 역직교 변환부(134)는 역직교 변환의 결과 얻어지는 잔차 정보를 가산부(135)에 공급한다.
가산부(135)는 복호부로서 기능하고, 역직교 변환부(134)로부터 공급되는 복호 대상의 화상으로서의 잔차 정보와, 스위치(146)로부터 공급되는 예측 화상을 가산함으로써, 복호를 행한다. 가산부(135)는 복호의 결과 얻어지는 화상을 디블록 필터(136)에 공급함과 함께, 프레임 메모리(141)에 공급한다. 또한, 스위치(146)로부터 예측 화상이 공급되지 않는 경우, 가산부(135)는, 역직교 변환부(134)로부터 공급되는 잔차 정보인 화상을 복호의 결과 얻어지는 화상으로서, 디블록 필터(136)에 공급함과 함께, 프레임 메모리(141)에 공급하여 축적시킨다.
디블록 필터(136)는 가산부(135)로부터 공급되는 화상에 대하여 적응 디블록 필터 처리를 행하고, 그 결과 얻어지는 화상을 적응 오프셋 필터(137)에 공급한다.
적응 오프셋 필터(137)는 가역 복호부(132)로부터 공급되는 오프셋을 순서대로 저장하는 버퍼를 갖는다. 또한, 적응 오프셋 필터(137)는, LCU마다, 가역 복호부(132)로부터 공급되는 오프셋 필터 정보에 기초하여, 디블록 필터(136)에 의한 적응 디블록 필터 처리 후의 화상에 대하여, 적응 오프셋 필터 처리를 행한다.
구체적으로는, 오프셋 필터 정보에 포함되는 저장 플래그가 0인 경우, 적응 오프셋 필터(137)는, LCU 단위의 디블록 필터 처리 후의 화상에 대하여, 그 오프셋 필터 정보에 포함되는 오프셋을 사용하여, 종류 정보가 나타내는 종류의 적응 오프셋 필터 처리를 행한다.
한편, 오프셋 필터 정보에 포함되는 저장 플래그가 1인 경우, 적응 오프셋 필터(137)는, LCU 단위의 디블록 필터 처리 후의 화상에 대하여, 그 오프셋 필터 정보에 포함되는 인덱스가 나타내는 위치에 저장되는 오프셋을 판독한다. 그리고, 적응 오프셋 필터(137)는, 판독된 오프셋을 사용하여, 종류 정보가 나타내는 종류의 적응 오프셋 필터 처리를 행한다. 적응 오프셋 필터(137)는, 적응 오프셋 필터 처리 후의 화상을, 적응 루프 필터(138)에 공급한다.
적응 루프 필터(138)는, 적응 오프셋 필터(137)로부터 공급되는 화상에 대하여, 가역 복호부(132)로부터 공급되는 필터 계수를 사용하여, LCU마다 적응 루프 필터 처리를 행한다. 적응 루프 필터(138)는, 그 결과 얻어지는 화상을 프레임 메모리(141) 및 화면 재배열 버퍼(139)에 공급한다.
화면 재배열 버퍼(139)는 적응 루프 필터(138)로부터 공급되는 화상을 프레임 단위로 기억한다. 화면 재배열 버퍼(139)는, 기억한 부호화를 위한 순서의 프레임 단위의 화상을, 원래의 표시의 순서로 재배열하여, D/A 변환부(140)에 공급한다.
D/A 변환부(140)는 화면 재배열 버퍼(139)로부터 공급되는 프레임 단위의 화상을 D/A 변환하여, 출력 신호로서 출력한다. 프레임 메모리(141)는 적응 루프 필터(138)로부터 공급되는 화상과 가산부(135)로부터 공급되는 화상을 축적한다. 프레임 메모리(141)에 축적된 화상은 참조 화상으로서 판독되고, 스위치(142)를 통해서 움직임 보상부(145) 또는 인트라 예측부(143)에 공급된다.
인트라 예측부(143)는, 프레임 메모리(141)로부터 스위치(142)를 통해서 판독된 참조 화상을 사용하여, 가역 복호부(132)로부터 공급되는 인트라 예측 모드 정보가 나타내는 인트라 예측 모드의 인트라 예측 처리를 행한다. 인트라 예측부(143)는 그 결과 생성되는 예측 화상을 스위치(146)에 공급한다.
참조 화상 설정부(144)는, 도 15의 추출부(112)로부터 공급되는 각 RPS의 inter_ref_pic_set_prediction_flag와 delta_idx_minus1 또는 참조 화상 특정 정보를 RPS 정보로서 유지한다. 또한, 참조 화상 설정부(144)는, 가역 복호부(132)로부터 공급되는 RPS 플래그 및 RPS의 인덱스 또는 RPS, 및, 각 RPS의 RPS 정보에 기초하여, 복호 대상의 화상의 참조 화상 특정 정보를 생성한다. 참조 화상 설정부(144)는 생성된 참조 화상 특정 정보를 움직임 보상부(145)에 공급함과 함께, 유지한다.
움직임 보상부(145)는, 참조 화상 설정부(144)로부터 공급되는 참조 화상 특정 정보에 기초하여, 프레임 메모리(141)로부터 스위치(142)를 통해서, 참조 화상 특정 정보에 의해 특정되는 참조 화상을 판독한다. 움직임 보상부(145)는, 예측 화상 생성부로서 기능하고, 움직임 벡터와 참조 화상을 사용하여, 인터 예측 모드 정보가 나타내는 최적 인터 예측 모드의 움직임 보상 처리를 행한다. 움직임 보상부(145)는 그 결과 생성되는 예측 화상을 스위치(146)에 공급한다.
스위치(146)는, 가역 복호부(132)로부터 인트라 예측 모드 정보가 공급된 경우, 인트라 예측부(143)로부터 공급되는 예측 화상을 가산부(135)에 공급한다. 한편, 가역 복호부(132)로부터 인터 예측 모드 정보가 공급된 경우, 스위치(146)는 움직임 보상부(145)로부터 공급되는 예측 화상을 가산부(135)에 공급한다.
(복호 장치의 처리의 설명)
도 17은 도 15의 복호 장치(110)에 의한 수취 처리를 설명하는 흐름도이다.
도 17의 스텝 S111에 있어서, 복호 장치(110)의 수취부(111)는 도 3의 부호화 장치(10)로부터 전송되어 오는 부호화 스트림을 수취하여, 추출부(112)에 공급한다.
스텝 S112에 있어서, 추출부(112)는 수취부(111)로부터 공급되는 부호화 스트림으로부터, SPS, PPS, 부호화 데이터 등을 추출한다. 추출부(112)는 부호화 데이터를 복호부(113)에 공급한다. 또한, 추출부(112)는 SPS에 포함되는 RPS 이외의 정보나 PPS 등도, 필요에 따라서 복호부(113)에 공급한다.
스텝 S113에 있어서, 추출부(112)는, SPS에 기초하여, 각 RPS의 inter_ref_pic_set_prediction_flag와 delta_idx_minus1 또는 참조 화상 특정 정보를 RPS 정보로서 취득하고, 복호부(113)에 공급한다.
스텝 S114에 있어서, 복호부(113)는, 추출부(112)로부터 공급되는 각 RPS의 RPS 정보에 기초하여, 추출부(112)로부터 공급되는 부호화 데이터를 HEVC 방식으로 복호하는 복호 처리를 행한다. 이 복호 처리의 상세는 후술하는 도 19를 참조하여 설명한다. 그리고, 처리는 종료된다.
도 18은 도 17의 스텝 S113의 RPS 설정 처리의 상세를 설명하는 흐름도이다.
도 18의 스텝 S120에 있어서, 추출부(112)는 SPS(도 5)에 포함되는 num_short_term_ref_pic_sets를 취득한다. 스텝 S121에 있어서, 추출부(112)는 생성하는 RPS 정보에 대응하는 RPS의 인덱스 i를 0으로 설정한다. 스텝 S122에 있어서, RPS의 인덱스 i가 0인지 여부를 판정한다.
스텝 S122에서 인덱스 i가 0이라고 판정된 경우, 스텝 S123에 있어서, 추출부(112)는 인덱스 i의 RPS의 RPS 정보에 포함되는 inter_ref_pic_set_prediction_flag를 0으로 설정하고, 처리를 스텝 S125로 진행시킨다.
한편, 스텝 S122에서 인덱스 i가 0이 아니라고 판정된 경우, 스텝 S124에 있어서, 추출부(112)는 SPS에 포함되는 인덱스 i의 RPS에 포함되는 inter_ref_pic_set_prediction_flag를 취득한다. 그리고, 추출부(112)는, 취득된 inter_ref_pic_set_prediction_flag를, 인덱스 i의 RPS의 RPS 정보에 포함되는 inter_ref_pic_set_prediction_flag로서 설정하고, 처리를 스텝 S125로 진행시킨다.
스텝 S125에 있어서, 추출부(112)는 inter_ref_pic_set_prediction_flag가 1인지 여부를 판정한다. 스텝 S125에서 inter_ref_pic_set_prediction_flag가 1이라고 판정된 경우, 스텝 S126에 있어서, 추출부(112)는 SPS에 포함되는 인덱스 i의 RPS에 포함되는 delta_idx_minus1을 취득한다. 그리고, 추출부(112)는, 취득된 delta_idx_minus1을 인덱스 i의 RPS의 RPS 정보에 포함되는 delta_idx_minus1로서 설정하고, 처리를 스텝 S128로 진행시킨다.
한편, 스텝 S125에서 inter_ref_pic_set_prediction_flag가 1이 아니라고 판정된 경우, 스텝 S127에 있어서, 추출부(112)는 SPS에 포함되는 인덱스 i의 RPS에 포함되는 참조 화상 특정 정보를 취득한다. 그리고, 추출부(112)는, 취득된 참조 화상 특정 정보를 인덱스 i의 RPS의 RPS 정보에 포함되는 참조 화상 특정 정보로서 설정하고, 처리를 스텝 S128로 진행시킨다.
스텝 S128에 있어서, 추출부(112)는 인덱스 i를 1만큼 인크리먼트한다. 스텝 S129에 있어서, 추출부(112)는, 인덱스 i가, 스텝 S120에서 취득된 num_short_term_ref_pic_sets 이상인지 여부를 판정한다.
스텝 S129에서 인덱스 i가 num_short_term_ref_pic_sets 이상이 아니라고 판정된 경우, 처리는 스텝 S122로 되돌아가서, 인덱스 i가 num_short_term_ref_pic_sets 이상으로 될 때까지, 스텝 S122 내지 S129의 처리가 반복된다.
한편, 스텝 S129에서 인덱스 i가 num_short_term_ref_pic_sets 이상이라고 판정된 경우, 스텝 S130에 있어서, 추출부(112)는 설정된 num_short_term_ref_pic_sets개의 RPS의 RPS 정보를 공급한다. 그리고, 처리는 도 17의 스텝 S113으로 되돌아가서, 스텝 S114로 진행된다.
도 19는 도 17의 스텝 S114의 복호 처리의 상세를 설명하는 흐름도이다.
도 19의 스텝 S131에 있어서, 복호부(113)의 축적 버퍼(131)는 도 15의 추출부(112)로부터 프레임 단위의 부호화 데이터를 수취하여, 축적한다. 축적 버퍼(131)는 축적되어 있는 부호화 데이터를 가역 복호부(132)에 공급한다.
스텝 S132에 있어서, 가역 복호부(132)는 축적 버퍼(131)로부터의 부호화 데이터를 가역 복호하여, 양자화된 계수와 부호화 정보를 얻는다. 가역 복호부(132)는 양자화된 계수를 역양자화부(133)에 공급한다. 또한, 가역 복호부(132)는 부호화 정보로서의 인트라 예측 모드 정보 등을 인트라 예측부(143)에 공급하고, 움직임 벡터, 인터 예측 모드 정보, RPS 플래그와 RPS의 인덱스 또는 RPS 등을 움직임 보상부(145)에 공급한다.
또한, 가역 복호부(132)는 부호화 정보로서의 인트라 예측 모드 정보 또는 인터 예측 모드 정보를 스위치(146)에 공급한다. 가역 복호부(132)는 부호화 정보로서의 오프셋 필터 정보를 적응 오프셋 필터(137)에 공급하고, 필터 계수를 적응 루프 필터(138)에 공급한다.
스텝 S133에 있어서, 역양자화부(133)는 가역 복호부(132)로부터의 양자화된 계수를 역양자화하고, 그 결과 얻어지는 직교 변환 계수를 역직교 변환부(134)에 공급한다.
스텝 S134에 있어서, 움직임 보상부(145)는 가역 복호부(132)로부터 인터 예측 모드 정보가 공급되었는지 여부를 판정한다. 스텝 S134에서 인터 예측 모드 정보가 공급되었다고 판정된 경우, 처리는 스텝 S135로 진행된다.
스텝 S135에 있어서, 참조 화상 설정부(144)는, 추출부(112)로부터 공급되는 각 RPS의 RPS 정보와, 가역 복호부(132)로부터 공급되는 RPS 플래그 및 RPS의 인덱스 또는 RPS에 기초하여, 복호 대상의 화상의 참조 화상 특정 정보를 생성하고, 유지한다.
구체적으로는, 참조 화상 설정부(144)는 추출부(112)로부터 공급되는 각 RPS의 RPS 정보를 유지하고 있다. 참조 화상 설정부(144)는 RPS 플래그가 1인 경우, 유지하고 있는 RPS 정보 중 RPS의 인덱스의 RPS 정보를 판독한다. 그리고, 참조 화상 설정부(144)는, 판독된 RPS 정보에 포함되는 inter_ref_pic_set_prediction_flag가 0인 경우, RPS 정보에 포함되는 참조 화상 특정 정보를 복호 대상의 화상의 참조 화상 특정 정보로서 생성하고, 유지한다.
한편, 참조 화상 설정부(144)는, inter_ref_pic_set_prediction_flag가 1인 경우, 유지하고 있는 참조 화상 특정 정보 중, RPS 정보에 포함되는 delta_idx_minus1에 의해 특정되는 전화상의 참조 화상 특정 정보를 판독한다. 그리고, 참조 화상 설정부(144)는, 판독된 전화상의 참조 화상 특정 정보를, 복호 대상의 화상의 참조 화상 특정 정보로서 생성하고, 유지한다.
또한, 참조 화상 설정부(144)는, RPS 플래그가 0이고, RPS 플래그와 함께 가역 복호부(132)로부터 공급되는 RPS에 포함되는 inter_ref_pic_set_prediction_flag가 0인 경우, RPS에 포함되는 참조 화상 특정 정보를 복호 대상의 화상의 참조 화상 특정 정보로서 생성하고, 유지한다. 한편, 참조 화상 설정부(144)는, inter_ref_pic_set_prediction_flag가 1인 경우, 유지하고 있는 참조 화상 특정 정보 중, RPS에 포함되는 delta_idx_minus1에 의해 특정되는 전화상의 참조 화상 특정 정보를 판독한다. 그리고, 참조 화상 설정부(144)는, 판독된 전화상의 참조 화상 특정 정보를, 복호 대상의 화상의 참조 화상 특정 정보로서 생성하고, 유지한다.
스텝 S136에 있어서, 움직임 보상부(145)는, 참조 화상 설정부(144)로부터 공급되는 참조 화상 특정 정보에 기초하여 참조 화상을 판독하고, 움직임 벡터와 참조 화상을 사용하여, 인터 예측 모드 정보가 나타내는 최적 인터 예측 모드의 움직임 보상 처리를 행한다. 움직임 보상부(145)는, 그 결과 생성되는 예측 화상을, 스위치(146)를 통해서 가산부(135)에 공급하고, 처리를 스텝 S138로 진행시킨다.
한편, 스텝 S134에서 인터 예측 모드 정보가 공급되지 않았다고 판정된 경우, 즉 인트라 예측 모드 정보가 인트라 예측부(143)에 공급된 경우, 처리는 스텝 S137로 진행된다.
스텝 S137에 있어서, 인트라 예측부(143)는, 프레임 메모리(141)로부터 스위치(142)를 통해서 판독된 참조 화상을 사용하여, 인트라 예측 모드 정보가 나타내는 인트라 예측 모드의 인트라 예측 처리를 행한다. 인트라 예측부(143)는, 인트라 예측 처리의 결과 생성되는 예측 화상을, 스위치(146)를 통해서 가산부(135)에 공급하고, 처리를 스텝 S138로 진행시킨다.
스텝 S138에 있어서, 역직교 변환부(134)는, 역양자화부(133)로부터의 직교 변환 계수에 대하여 역직교 변환을 실시하고, 그 결과 얻어지는 잔차 정보를 가산부(135)에 공급한다.
스텝 S139에 있어서, 가산부(135)는 역직교 변환부(134)로부터 공급되는 잔차 정보와, 스위치(146)로부터 공급되는 예측 화상을 가산한다. 가산부(135)는 그 결과 얻어지는 화상을 디블록 필터(136)에 공급함과 함께, 프레임 메모리(141)에 공급한다.
스텝 S140에 있어서, 디블록 필터(136)는 가산부(135)로부터 공급되는 화상에 대하여 디블로킹 필터 처리를 행하여, 블록 왜곡을 제거한다. 디블록 필터(136)는, 그 결과 얻어지는 화상을 적응 오프셋 필터(137)에 공급한다,
스텝 S141에 있어서, 적응 오프셋 필터(137)는, 가역 복호부(132)로부터 공급되는 오프셋 필터 정보에 기초하여, 디블록 필터(136)에 의한 디블록 필터 처리 후의 화상에 대하여, LCU마다 적응 오프셋 필터 처리를 행한다. 적응 오프셋 필터(137)는 적응 오프셋 필터 처리 후의 화상을, 적응 루프 필터(138)에 공급한다.
스텝 S142에 있어서, 적응 루프 필터(138)는, 적응 오프셋 필터(137)로부터 공급되는 화상에 대하여, 가역 복호부(132)로부터 공급되는 필터 계수를 사용하여, LCU마다 적응 루프 필터 처리를 행한다. 적응 루프 필터(138)는, 그 결과 얻어지는 화상을 프레임 메모리(141) 및 화면 재배열 버퍼(139)에 공급한다.
스텝 S143에 있어서, 프레임 메모리(141)는 가산부(135)로부터 공급되는 화상과, 적응 루프 필터(138)로부터 공급되는 화상을 축적한다. 프레임 메모리(141)에 축적된 화상은, 참조 화상으로서 스위치(142)를 통해서 움직임 보상부(145) 또는 인트라 예측부(143)에 공급된다.
스텝 S144에 있어서, 화면 재배열 버퍼(139)는 적응 루프 필터(138)로부터 공급되는 화상을 프레임 단위로 기억하고, 기억한 부호화를 위한 순서의 프레임 단위의 화상을 원래의 표시의 순서로 재배열하여, D/A 변환부(140)에 공급한다.
스텝 S145에 있어서, D/A 변환부(140)는, 화면 재배열 버퍼(139)로부터 공급되는 프레임 단위의 화상을 D/A 변환하여, 출력 신호로서 출력한다. 그리고, 처리는 도 17의 스텝 S114로 되돌아가서, 종료된다.
이상과 같이, 복호 장치(110)는, 부호화 대상의 화상이 GOP의 선두의 화상 이외의 화상인 경우에 전송되어 오는 inter_ref_pic_set_prediction_flag를 수취하고, inter_ref_pic_set_prediction_flag를 수취한 경우, 그inter_ref_pic_set_prediction_flag에 기초하여, 복호 대상의 화상의 참조 화상 특정 정보를 생성한다. 한편, 복호 장치(110)는 inter_ref_pic_set_prediction_flag를 수취하지 못하는 경우, inter_ref_pic_set_prediction_flag로서의 0에 기초하여 복호 대상의 화상의 참조 화상 특정 정보를 생성한다.
그 결과, 복호 장치(110)는 GOP의 선두의 화상의 inter_ref_pic_set_prediction_flag분만큼 RPS의 정보량을 삭감한 부호화 스트림을 복호할 수 있다.
<제2 실시 형태>
(부호화 장치의 제2 실시 형태의 구성예)
도 20은 본 기술을 적용한 부호화 장치의 제2 실시 형태의 구성예를 도시하는 블록도이다.
또한, 도 20의 구성 중, 도 3의 구성과 동일한 것에는 동일한 부호를 부여하고 있으며, 설명은 반복되므로 생략한다.
도 20의 부호화 장치(150)의 구성은, 설정부(12) 대신에 설정부(151)가 설치되어 있는 점이, 도 3의 부호화 장치(10)의 구성과 상이하다. 부호화 장치(150)는 inter_ref_pic_set_prediction_flag와 delta_idx_minus1을 GOP 단위로 공유화 가능하도록 SPS를 설정한다.
구체적으로는, 설정부(151)는, 필요에 따라서 inter_ref_pic_set_prediction_flag, delta_idx_minus1, 참조 화상 특정 정보 등을 포함하는 RPS를 설정하고, 각 RPS에 인덱스를 부여한다. 설정부(151)는 인덱스가 부여된 RPS를 부호화부(11)에 공급한다. 또한, 설정부(151)는 RPS와 GOP 내의 모든 픽처에 있어서 inter_ref_pic_set_prediction_flag가 0인지를 나타내는 참조 불가 정보를 포함하고, 필요에 따라서 GOP 내의 모든 픽처에 있어서 공통의 delta_idx_minus1을 포함하는 SPS를 설정한다. 설정부(151)는 PPS 등을 설정한다.
또한, 설정부(151)는, 도 3의 설정부(12)와 마찬가지로, 설정된 SPS 및 PPS와, 부호화부(11)로부터 공급되는 부호화 데이터로부터, 부호화 스트림을 생성한다. 설정부(151)는, 설정부(12)와 마찬가지로, 부호화 스트림을 전송부(13)에 공급한다.
(SPS의 신택스의 예)
도 21은 도 20의 설정부(151)에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 21의 제4행째에 나타내는 바와 같이, SPS에는, 참조 불가 정보(disable_rps_prediction_flag)가 포함된다. 또한, 제5행째 및 제6행째에 나타내는 바와 같이, 참조 불가 정보가, GOP 내의 모든 픽처에 있어서 inter_ref_pic_set_prediction_flag가 0인 것을 나타내지 않는 0인 경우, SPS에는 GOP 내의 모든 픽처에 있어서 delta_idx_minus1이 동일한지를 나타내는 동일 정보(unified_rps_prediction_control_present_flag)가 포함된다.
또한, 제7행째 및 제8행째에 나타내는 바와 같이, 동일 정보가, GOP 내의 모든 픽처에 있어서 delta_idx_minus1이 동일한 것을 나타내는 1인 경우, SPS에는 GOP 내의 모든 픽처에 있어서 공통의 delta_idx_minus1인 unified_delta_idx_minus1이 포함된다. 또한, 제11행째에 나타내는 바와 같이, SPS에는 각 인덱스(i)의 RPS가 포함된다.
(RPS의 신택스의 예)
도 22는 RPS의 신택스의 예를 도시하는 도면이다.
또한, 도시는 생략하지만, 도 22의 제11행째 이후의 기술은 도 1의 제5행째 이후의 기술과 마찬가지이다.
도 22의 제2행째와 제3행째에 나타내는 바와 같이, disable_rps_prediction_flag가 1인 경우, RPS에는 inter_ref_pic_set_prediction_flag가 포함되지 않고, inter_ref_pic_set_prediction_flag가 0인 경우에 포함되는 참조 화상 특정 정보가 포함된다.
한편, 제4행째 및 제5행째에 나타내는 바와 같이, disable_rps_prediction_flag가 0인 경우, RPS에는, inter_ref_pic_set_prediction_flag가 포함된다. 그리고, 제6행째 내지 제8행째에 나타내는 바와 같이, inter_ref_pic_set_prediction_flag와 unified_rps_prediction_control_present_flag가 1인 경우, RPS에는 delta_idx_minus1은 포함되지 않고, delta_idx_minus1은 unified_delta_idx_minus1로 된다.
또한, 제9행째 및 제10행째에 나타내는 바와 같이, inter_ref_pic_set_prediction_flag가 1이고, unified_rps_prediction_control_present_flag가 0인 경우, RPS에는 delta_idx_minus1이 포함된다.
(본 기술의 효과의 설명)
도 23 및 도 24는 도 20의 설정부(151)에 의해 설정되는 RPS의 정보량을 설명하는 도면이고, 도 25는 종래의 RPS의 정보량을 설명하는 도면이다.
도 23의 예에서는, GOP 내의 선두로부터 2번째의 픽처와 8번째의 픽처의 참조 화상 특정 정보가, 부호화순으로 하나 전의 픽처의 참조 화상 특정 정보와 동일하다.
이 경우, 도 23에 도시한 바와 같이, 설정부(151)는 disable_rps_prediction_flag로서 0을 설정하고, unified_rps_prediction_control_present_flag로서 1을 설정한다. 또한, 설정부(151)는 unified_delta_idx_minus1로서 0을 설정한다.
또한, 설정부(151)는, 예를 들어 인덱스가 0인 RPS로서, inter_ref_pic_set_prediction_flag로서의 0과, GOP의 선두의 픽처의 참조 화상 특정 정보를 설정한다. 또한, 설정부(151)는, 인덱스가 1인 RPS로서, inter_ref_pic_set_prediction_flag로서의 1을 설정한다. 그리고, GOP의 선두의 픽처의 RPS의 인덱스가 0으로 되고, 2번째의 픽처와 8번째의 픽처의 RPS의 인덱스가 1로 된다.
이와 같이, 설정부(151)는 GOP 내의 모든 픽처에 공통의 delta_idx_minus1을 unified_delta_idx_minus1로서 설정한다. 따라서, 설정부(151)는 delta_idx_minus1을 GOP 단위로 설정할 수 있다.
또한, 도 24와 도 25의 예에서는, GOP 내의 모든 픽처의 참조 화상 특정 정보가, 부호화순으로 앞의 픽처의 참조 화상 특정 정보와 동일하지 않다.
이 경우, 도 24에 도시한 바와 같이, 설정부(151)는 disable_rps_prediction_flag로서 1을 설정하고, GOP 내의 각 픽처에 대응하는 RPS로서, 그 픽처의 참조 화상 특정 정보를 설정한다. 이에 반해, 종래의 경우, 도 25에 도시한 바와 같이, GOP 내의 각 픽처에 대응하는 RPS로서, inter_ref_pic_set_prediction_flag로서의 0과, 그 픽처의 참조 화상 특정 정보가 설정된다.
이와 같이, 설정부(151)는, GOP 내의 모든 픽처에 공통의 inter_ref_pic_set_prediction_flag로서의 0을, disable_rps_prediction_flag로서 설정한다. 따라서, disable_rps_prediction_flag가 1인 경우, 종래의 경우에 비해, inter_ref_pic_set_prediction_flag분만큼 RPS의 정보량을 삭감할 수 있다.
(부호화 장치의 처리의 설명)
도 20의 부호화 장치(150)의 생성 처리는, RPS 설정 처리를 제외하고 도 10의 생성 처리와 마찬가지이므로, 이하에서는 RPS 설정 처리에 대해서만 설명한다.
도 26은 부호화 장치(150)의 설정부(151)의 RPS 설정 처리의 상세를 설명하는 흐름도이다.
도 26의 스텝 S161에 있어서, 설정부(151)는 SPS로서 disable_rps_prediction_flag를 설정한다. 스텝 S162에 있어서, 설정부(151)는 disable_rps_prediction_flag가 1인지 여부를 판정한다. 스텝 S162에서 disable_rps_prediction_flag가 1이 아니라고 판정된 경우, 스텝 S163에 있어서, 설정부(151)는 SPS로서 unified_rps_prediction_control_present_flag를 설정한다.
스텝 S164에 있어서, 설정부(151)는 unified_rps_prediction_control_present_flag가 1인지 여부를 판정한다. 스텝 S164에서 unified_rps_prediction_control_present_flag가 1이라고 판정된 경우, 스텝 S165에 있어서, 설정부(151)는 SPS로서 unified_delta_idx_minus1을 설정하고, 처리를 스텝 S166으로 진행시킨다.
스텝 S162에서 disable_rps_prediction_flag가 1이라고 판정된 경우, 또는, 스텝 S164에서 unified_rps_prediction_control_present_flag가 0이라고 판정된 경우, 처리는 스텝 S166으로 진행된다.
스텝 S166에 있어서, 설정부(151)는 RPS의 인덱스 i를 0으로 설정한다. 스텝 S167에 있어서, 설정부(151)는 disable_rps_prediction_flag가 1인지 여부를 판정한다. 스텝 S167에서 disable_rps_prediction_flag가 1이라고 판정된 경우, 스텝 S168에 있어서, 설정부(151)는 inter_ref_pic_set_prediction_flag를 0으로 설정하고, 처리를 스텝 S170으로 진행시킨다.
한편, 스텝 S167에서 disable_rps_prediction_flag가 1이 아니라고 판정된 경우, 스텝 S169에 있어서, 설정부(151)는 인덱스 i의 RPS로서 inter_ref_pic_set_prediction_flag를 설정하고, 처리를 스텝 S170으로 진행시킨다.
스텝 S170에 있어서, 설정부(151)는 inter_ref_pic_set_prediction_flag가 1인지 여부를 판정한다. 스텝 S170에서 inter_ref_pic_set_prediction_flag가 1이라고 판정된 경우, 스텝 S171에 있어서, 설정부(151)는 unified_rps_prediction_control_present_flag가 1인지 여부를 판정한다.
스텝 S171에서 unified_rps_prediction_control_present_flag가 1이라고 판정된 경우, 처리는 스텝 S174로 진행된다. 한편, 스텝 S171에서 unified_rps_prediction_control_present_flag가 1이 아니라고 판정된 경우, 스텝 S172에 있어서, 설정부(151)는 인덱스 i의 RPS로서 delta_idx_minus1을 설정하고, 처리를 스텝 S174로 진행시킨다.
또한, 스텝 S170에서 inter_ref_pic_set_prediction_flag가 1이 아니라고 판정된 경우, 스텝 S173에 있어서, 설정부(151)는 인덱스 i의 RPS로서 참조 화상 특정 정보를 설정하고, 처리를 스텝 S174로 진행시킨다.
스텝 S174에 있어서, 설정부(151)는 인덱스 i를 1만큼 인크리먼트한다. 스텝 S175에 있어서, 설정부(151)는 인덱스 i가 SPS에 포함시키는 RPS의 수 num_short_term_ref_pic_sets 이상인지 여부를 판정한다.
스텝 S175에서 인덱스 i가 수 num_short_term_ref_pic_sets 이상이 아니라고 판정된 경우, 처리는 스텝 S167로 되돌아가서, 인덱스 i가 수 num_short_term_ref_pic_sets 이상으로 될 때까지, 스텝 S167 내지 S175의 처리가 반복된다.
한편, 스텝 S175에서 인덱스 i가 수 num_short_term_ref_pic_sets 이상이라고 판정된 경우, RPS 설정 처리는 종료된다.
이상과 같이, 부호화 장치(150)는 disable_rps_prediction_flag를 설정하므로, disable_rps_prediction_flag가 1인 경우, 종래의 경우에 비해, inter_ref_pic_set_prediction_flag분만큼 참조 화상 특정 정보에 관한 RPS의 정보량을 삭감할 수 있다. 또한, inter_ref_pic_set_prediction_flag를 GOP 단위로 설정할 수 있다.
또한, 부호화 장치(150)는 GOP 내의 모든 픽처에 공통의 delta_idx_minus1을 unified_delta_idx_minus1로서 설정하므로, delta_idx_minus1을 GOP 단위로 설정할 수 있다.
(복호 장치의 제2 실시 형태의 구성예)
도 27은 도 20의 부호화 장치(150)로부터 전송되는 부호화 스트림을 복호하는, 본 기술을 적용한 복호 장치의 제2 실시 형태의 구성예를 도시하는 블록도이다.
또한, 도 27의 구성 중, 도 15의 구성과 동일한 것에는 동일한 부호를 부여하고 있으며, 설명은 반복되므로 생략한다.
도 27의 복호 장치(170)의 구성은, 추출부(112) 대신에 추출부(171)가 설치되어 있는 점이, 도 15의 복호 장치(110)의 구성과 상이하다. 복호 장치(170)는 도 21의 SPS에 기초하여 각 RPS의 RPS 정보를 설정한다.
구체적으로는, 복호 장치(170)의 추출부(171)는, 도 15의 추출부(112)와 마찬가지로, 수취부(111)로부터 공급되는 부호화 스트림으로부터, SPS, PPS, 부호화 데이터 등을 추출한다. 추출부(171)는, 추출부(112)와 마찬가지로, 부호화 데이터를 복호부(113)에 공급한다. 또한, 추출부(171)는, 도 21의 SPS에 기초하여, 각 RPS의 RPS 정보를 취득하고, 복호부(113)에 공급한다. 또한, 추출부(171)는, 추출부(112)와 마찬가지로, SPS에 포함되는 RPS 이외의 정보나 PPS 등도, 필요에 따라서 복호부(113)에 공급한다.
(복호 장치의 처리의 설명)
도 27의 복호 장치(170)의 수취 처리는, RPS 설정 처리를 제외하고, 도 17의 수취 처리와 마찬가지이므로, 이하에서는 RPS 설정 처리에 대해서만 설명한다.
도 28은 도 27의 복호 장치(170)의 RPS 설정 처리의 상세를 설명하는 흐름도이다.
도 28의 스텝 S191에 있어서, 추출부(171)는 SPS(도 21)에 포함되는 num_short_term_ref_pic_sets를 취득한다. 스텝 S192에 있어서, 추출부(171)는 SPS에 포함되는 disable_rps_prediction_flag를 취득한다. 스텝 S193에 있어서, 추출부(171)는 취득된 disable_rps_prediction_flag가 1인지 여부를 판정한다.
스텝 S193에서 disable_rps_prediction_flag가 1이 아니라고 판정된 경우, 스텝 S194에 있어서, 추출부(171)는 SPS에 포함되는 unified_rps_prediction_control_present_flag를 취득한다. 스텝 S195에 있어서, 추출부(171)는 취득된 unified_rps_prediction_control_present_flag가 1인지 여부를 판정한다.
스텝 S195에서 unified_rps_prediction_control_present_flag가 1이라고 판정된 경우, 추출부(171)는 SPS에 포함되는 unified_delta_idx_minus1을 취득하고, 처리를 스텝 S197로 진행시킨다.
한편, 스텝 S195에서 unified_delta_idx_minus1이 1이 아니라고 판정된 경우, 처리는 스텝 S197로 진행된다. 또한, 스텝 S193에서 disable_rps_prediction_flag가 1이라고 판정된 경우, 처리는 스텝 S197로 진행된다.
스텝 S197에 있어서, 추출부(171)는 생성하는 RPS 정보에 대응하는 RPS의 인덱스 i를 0으로 설정한다. 스텝 S198에 있어서, 추출부(171)는 스텝 S192에서 취득된 disable_rps_prediction_flag가 1인지 여부를 판정한다.
스텝 S198에서 disable_rps_prediction_flag가 1이라고 판정된 경우, 스텝 S199에 있어서, 추출부(171)는 인덱스 i의 RPS의 RPS 정보에 포함되는 inter_ref_pic_set_prediction_flag를 0으로 설정하고, 처리를 스텝 S201로 진행시킨다.
한편, 스텝 S198에서 disable_rps_prediction_flag가 1이 아니라고 판정된 경우, 스텝 S200에 있어서, 추출부(171)는 SPS에 포함되는 인덱스 i의 RPS에 포함되는 inter_ref_pic_set_prediction_flag를 취득한다. 그리고, 추출부(171)는, 취득된 inter_ref_pic_set_prediction_flag를, 인덱스 i의 RPS의 RPS 정보에 포함되는 inter_ref_pic_set_prediction_flag로서 설정하고, 처리를 스텝 S201로 진행시킨다.
스텝 S201에 있어서, 추출부(171)는 inter_ref_pic_set_prediction_flag가 1인지 여부를 판정한다. 스텝 S201에서 inter_ref_pic_set_prediction_flag가 1이라고 판정된 경우, 스텝 S202에 있어서, 추출부(171)는 스텝 S194에서 취득된 unified_rps_prediction_control_present_flag가 1인지 여부를 판정한다.
스텝 S202에서 unified_rps_prediction_control_present_flag가 1이라고 판정된 경우, 처리는 스텝 S203으로 진행된다. 스텝 S203에 있어서, 추출부(171)는, 스텝 S196에서 취득된 unified_delta_idx_minus1을, 인덱스 i의 RPS의 RPS 정보에 포함되는 unified_delta_idx_minus1로서 설정하고, 처리를 스텝 S206으로 진행시킨다.
한편, 스텝 S202에서 unified_rps_prediction_control_present_flag가 1이 아니라고 판정된 경우, 스텝 S204에 있어서, 추출부(171)는 SPS에 포함되는 인덱스 i의 RPS에 포함되는 delta_idx_minus1을 취득한다. 그리고, 추출부(171)는, 취득된 delta_idx_minus1을 인덱스 i의 RPS의 RPS 정보에 포함되는 delta_idx_minus1로서 설정하고, 처리를 스텝 S206으로 진행시킨다.
한편, 스텝 S201에서 inter_ref_pic_set_prediction_flag가 1이 아니라고 판정된 경우, 스텝 S205에 있어서, 추출부(171)는 SPS에 포함되는 인덱스 i의 RPS에 포함되는 참조 화상 특정 정보를 취득한다. 그리고, 추출부(171)는, 취득된 참조 화상 특정 정보를 인덱스 i의 RPS의 RPS 정보에 포함되는 참조 화상 특정 정보로 서 설정하고, 처리를 스텝 S206으로 진행시킨다.
스텝 S206 내지 S208의 처리는 도 18의 스텝 S128 내지 S130의 처리와 마찬가지이므로, 설명은 생략한다.
이상과 같이, 복호 장치(170)는 disable_rps_prediction_flag를 수취하고, disable_rps_prediction_flag에 기초하여 복호 대상의 화상의 참조 화상 특정 정보를 생성한다. 그 결과, 복호 장치(170)는, disable_rps_prediction_flag가 1인 경우에 inter_ref_pic_set_prediction_flag분만큼 RPS의 정보량을 삭감한 부호화 스트림을 복호할 수 있다.
또한, 복호 장치(170)는 GOP 내의 모든 픽처에 공통의 delta_idx_minus1을 unified_delta_idx_minus1로서 수취하고, unified_delta_idx_minus1에 기초하여 복호 대상의 화상의 참조 화상 특정 정보를 생성한다. 그 결과, 복호 장치(170)는 delta_idx_minus1을 GOP 단위로 설정한 부호화 스트림을 복호할 수 있다.
<제3 실시 형태>
(부호화 장치의 제3 실시 형태의 구성예)
도 29는 본 기술을 적용한 부호화 장치의 제3 실시 형태의 구성예를 도시하는 블록도이다.
또한, 도 29의 구성 중, 도 3의 구성과 동일한 것에는 동일한 부호를 부여하고 있으며, 설명은 반복되므로 생략한다.
도 29의 부호화 장치(190)의 구성은, 설정부(12) 대신에 설정부(191)가 설치되어 있는 점이, 도 3의 부호화 장치(10)의 구성과 상이하다. 부호화 장치(190)는 도 3의 부호화 장치(10)와 도 20의 부호화 장치(150)를 조합한 것이다.
구체적으로는, 부호화 장치(190)의 설정부(191)는 inter_ref_pic_set_prediction_flag를 포함하지 않고, 참조 화상 특정 정보를 포함하는 RPS와, 필요에 따라서 inter_ref_pic_set_prediction_flag, delta_idx_minus1, 참조 화상 특정 정보 등을 포함하는 RPS를 포함하는 RPS를 설정한다. 또한, 설정부(191)는 각 RPS에 인덱스를 부여한다. 여기에서는, inter_ref_pic_set_prediction_flag를 포함하지 않고, 참조 화상 특정 정보를 포함하는 RPS의 인덱스로서 0이 부여되는 것으로 한다.
설정부(191)는 인덱스가 부여된 RPS를 부호화부(11)에 공급한다. 또한, 설정부(191)는 RPS와 disable_rps_prediction_flag를 포함하고, 필요에 따라서 unified_rps_prediction_control_present_flag나 unified_delta_idx_minus1을 포함하는 SPS를 설정한다. 설정부(191)는 PPS 등을 설정한다.
또한, 설정부(191)는, 도 3의 설정부(12)와 마찬가지로, 설정된 SPS 및 PPS와, 부호화부(11)로부터 공급되는 부호화 데이터로부터, 부호화 스트림을 생성한다. 설정부(191)는, 설정부(12)와 마찬가지로, 부호화 스트림을 전송부(13)에 공급한다.
(SPS의 신택스의 예)
도 30은 도 29의 설정부(191)에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 30의 구성은 도 21의 구성과 동일하므로, 설명은 생략한다.
(RPS의 신택스의 예)
도 31은 RPS의 신택스의 예를 도시하는 도면이다.
또한, 도시는 생략하지만, 도 31의 제11행째 이후의 기술은 도 1의 제5행째 이후의 기술과 마찬가지이다.
도 31의 제2행째와 제3행째에 나타내는 바와 같이, 인덱스(idx)가 0인 경우, 또는, disable_rps_prediction_flag가 1인 경우, RPS에는, inter_ref_pic_set_prediction_flag가 포함되지 않고, inter_ref_pic_set_prediction_flag가 0인 경우에 포함되는 참조 화상 특정 정보가 포함된다.
제4행째 내지 제10행째의 기술은 도 22의 제4행째 내지 제10행째의 기술과 마찬가지이므로, 설명은 생략한다.
(본 기술의 효과의 설명)
도 32는 도 29의 설정부(191)에 의해 설정되는 RPS의 정보량을 설명하는 도면이다.
도 32의 예에서는, GOP 내의 선두로부터 2번째의 픽처와 8번째의 픽처의 참조 화상 특정 정보가, 부호화순으로 하나 전의 픽처의 참조 화상 특정 정보와 동일하다.
이 경우, 도 32에 도시한 바와 같이, 설정부(191)는 disable_rps_prediction_flag로서 0을 설정하고, unified_rps_prediction_control_present_flag로서 1을 설정한다. 또한, 설정부(191)는 unified_delta_idx_minus1로서 0을 설정한다.
또한, 설정부(191)는, 예를 들어 인덱스가 0인 RPS로서, GOP의 선두의 픽처의 참조 화상 특정 정보를 설정한다. 또한, 설정부(191)는, 인덱스가 1인 RPS로서, inter_ref_pic_set_prediction_flag로서의 1을 설정한다. 그리고, GOP의 선두의 픽처의 RPS의 인덱스가 0으로 되고, 2번째의 픽처와 8번째의 픽처의 RPS의 인덱스가 1로 된다.
이와 같이, 설정부(191)는, 선두의 픽처의 RPS로서 사용되는 인덱스가 0인 RPS로서 inter_ref_pic_set_prediction_flag를 설정하지 않는다. 따라서, 도 8에 도시한 종래의 경우에 비해, 선두의 픽처의 inter_ref_pic_set_prediction_flag분만큼 RPS의 정보량을 삭감할 수 있다.
또한, 설정부(191)는 GOP 내의 모든 픽처에 공통의 delta_idx_minus1을 unified_delta_idx_minus1로서 설정한다. 따라서, delta_idx_minus1을 GOP 단위로 설정할 수 있다.
또한, 도시는 생략하지만, 설정부(191)는, GOP 내의 모든 픽처에 공통의inter_ref_pic_set_prediction_flag로서의 0을, disable_rps_prediction_flag로서 설정한다. 따라서, disable_rps_prediction_flag가 1인 경우, 종래의 경우에 비해, 선두의 픽처 이외의 픽처의 inter_ref_pic_set_prediction_flag분만큼 RPS의 정보량을 삭감할 수 있다.
(부호화 장치의 처리의 설명)
도 29의 부호화 장치(190)의 생성 처리는, RPS 설정 처리를 제외하고 도 10의 생성 처리와 마찬가지이므로, 이하에서는 RPS 설정 처리에 대해서만 설명한다.
도 33은 부호화 장치(190)의 설정부(191)의 RPS 설정 처리의 상세를 설명하는 흐름도이다.
도 33의 스텝 S221 내지 S226의 처리는 도 26의 스텝 S161 내지 S166의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S227에 있어서, 설정부(191)는, disable_rps_prediction_flag가 1인지, 또는, 인덱스 i가 0인지를 판정한다. 스텝 S227에서 disable_rps_prediction_flag가 1이거나, 또는, 인덱스 i가 0이라고 판정된 경우, 처리는 스텝 S228로 진행된다. 한편, 스텝 S227에서 disable_rps_prediction_flag가 1이 아니고, 또한, 인덱스 i가 0이 아니라고 판정된 경우, 처리는 스텝 S229로 진행된다.
스텝 S228 내지 S235의 처리는 도 26의 스텝 S168 내지 S175의 처리와 마찬가지이므로, 설명은 생략한다.
(복호 장치의 제3 실시 형태의 구성예)
도 34는 도 29의 부호화 장치(190)로부터 전송되는 부호화 스트림을 복호하는, 본 기술을 적용한 복호 장치의 제3 실시 형태의 구성예를 도시하는 블록도이다.
또한, 도 34의 구성 중, 도 15의 구성과 동일한 것에는 동일한 부호를 부여하고 있으며, 설명은 반복되므로 생략한다.
도 34의 복호 장치(210)의 구성은, 추출부(112) 대신에 추출부(211)가 설치되어 있는 점이 도 15의 복호 장치(110)의 구성과 상이하다. 복호 장치(210)는 도 31의 RPS를 포함하는 도 30의 SPS에 기초하여 각 RPS의 RPS 정보를 설정한다.
구체적으로는, 복호 장치(210)의 추출부(211)는, 도 15의 추출부(112)와 마찬가지로, 수취부(111)로부터 공급되는 부호화 스트림으로부터, SPS, PPS, 부호화 데이터 등을 추출한다. 추출부(211)는, 추출부(112)와 마찬가지로, 부호화 데이터를 복호부(113)에 공급한다. 또한, 추출부(211)는, 도 31의 RPS를 포함하는 도 30의 SPS에 기초하여 각 RPS의 RPS 정보를 취득하고, 복호부(113)에 공급한다. 또한, 추출부(211)는, 추출부(112)와 마찬가지로, SPS에 포함되는 RPS 이외의 정보나 PPS 등도, 필요에 따라서 복호부(113)에 공급한다.
(복호 장치의 처리의 설명)
도 34의 복호 장치(210)의 수취 처리는, RPS 설정 처리를 제외하고, 도 17의 수취 처리와 마찬가지이므로, 이하에서는 RPS 설정 처리에 대해서만 설명한다.
도 35는 도 34의 복호 장치(210)의 RPS 설정 처리의 상세를 설명하는 흐름도이다.
도 35의 스텝 S251 내지 S257의 처리는 도 28의 스텝 S191 내지 S197의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S258에 있어서, 추출부(211)는, 스텝 S252에서 취득된 disable_rps_prediction_flag가 1인지, 또는, 인덱스 i가 0인지 여부를 판정한다.
스텝 S258에서 disable_rps_prediction_flag가 1이거나, 또는, 인덱스 i가 0이라고 판정된 경우, 처리는 스텝 S259로 진행된다. 한편, 스텝 S258에서 disable_rps_prediction_flag가 1이 아니고, 또한, 인덱스 i가 0이 아니라고 판정된 경우, 처리는 스텝 S260으로 진행된다.
스텝 S259 내지 S268의 처리는 도 28의 스텝 S199 내지 S208의 처리와 마찬가지이므로, 설명은 생략한다.
<제4 실시 형태>
(부호화 장치의 제4 실시 형태의 구성예)
도 36은 본 기술을 적용한 부호화 장치의 제4 실시 형태의 구성예를 도시하는 블록도이다.
또한, 도 36의 구성 중, 도 3의 구성과 동일한 것에는 동일한 부호를 부여하고 있으며, 설명은 반복되므로 생략한다.
도 36의 부호화 장치(230)의 구성은, 부호화부(11) 대신에 부호화부(231)가 설치되어 있는 점, 및, 설정부(12) 대신에 설정부(232)가 설치되어 있는 점이 도 3의 부호화 장치(10)의 구성과 상이하다. 부호화 장치(230)는, 픽처 내의 슬라이스의 종류에 따라서, 그 슬라이스의 종류에 불필요한 참조 화상에 관한 정보를 설정하지 않는다.
구체적으로는, 부호화 장치(230)의 부호화부(231)에는, 프레임 단위의 화상이 입력 신호로서 입력된다. 부호화부(231)는, 설정부(232)로부터 공급되는 RPS, PPS 등을 참조하여, 입력 신호를 HEVC 방식으로 부호화한다. 이때, 부호화부(231)는, 필요에 따라서, 인터 예측에 있어서의 참조 화상에 대하여 가중치 부여 예측(Weighted Prediction)을 행한다.
가중치 부여 예측이란, 참조 화상에 대하여 가중치 부여를 행하여 예측 화상을 생성하는 처리이다. 구체적으로는, 예를 들어 부호화 대상의 프레임 X보다 부호화순으로 앞의 2개의 프레임 Y1과 프레임 Y0의 복호 화상이 참조 화상으로서 사용되는 경우, 가중치 부여 예측에서는, 프레임 X의 예측 화상 X'가 이하의 수학식 3에 의해 구해진다.
Figure 112014122679310-pct00003
또한, 수학식 3에 있어서, w0과 w1은 가중 계수이고, d는 오프셋값이다. 이 가중 계수와 오프셋값은 부호화 스트림에 포함시켜져 전송된다.
가중치 부여 예측을 행함으로써, 페이드 인, 페이드 아웃, 크로스페이드 등에 의해, 참조 화상과 부호화 대상의 화상의 사이에서 휘도의 변화가 발생하는 경우라도, 예측 화상과 부호화 대상의 화상의 차분을 삭감할 수 있다. 그 결과, 부호화 효율을 향상시킬 수 있다.
이에 반해, 가중치 부여 예측이 행해지지 않은 경우, 페이드 인, 페이드 아웃, 크로스페이드 등에 의해 참조 화상과 부호화 대상의 화상의 사이에서 발생하는 휘도의 변화가 그대로 예측 화상과 부호화 대상의 화상의 차분으로 되어, 부호화 효율이 나쁘다.
부호화부(231)는 부호화의 결과 얻어지는 부호화 데이터를 설정부(232)에 공급한다.
설정부(232)는, 도 3의 설정부(12)와 마찬가지로, inter_ref_pic_set_prediction_flag를 포함하지 않고, 참조 화상 특정 정보를 포함하는 RPS와, inter_ref_pic_set_prediction_flag와, 참조 화상 특정 정보 또는 delta_idx_minus1을 포함하는 RPS를 설정한다. 설정부(232)는 설정부(12)와 마찬가지로, 각 RPS에 인덱스를 부여한다.
설정부(232)는 RPS를 포함하는 SPS, PPS 등을 설정한다. 설정부(232)는 인덱스가 부여된 RPS와 PPS를 부호화부(231)에 공급한다. 설정부(232)는, 설정된 SPS 및 PPS와, 부호화부(231)로부터 공급되는 부호화 데이터로부터, 부호화 스트림을 생성한다. 설정부(232)는 부호화 스트림을 전송부(13)에 공급한다.
(부호화부의 구성예)
도 37은 도 36의 부호화부(231)의 구성예를 도시하는 블록도이다.
또한, 도 37의 구성 중, 도 4의 구성과 동일한 것에는 동일한 부호를 부여하고 있으며, 설명은 반복되므로 생략한다.
도 37의 부호화부(231)의 구성은 움직임 예측ㆍ보상부(47) 대신에 움직임 예측ㆍ보상부(251)가 설치되고, 가역 부호화부(36) 대신에 가역 부호화부(252)가 설치되어 있는 점이 도 4의 부호화부(11)의 구성과 상이하다.
움직임 예측ㆍ보상부(251)는, 도 36의 설정부(232)로부터 공급되는 PPS에 기초하여, 후보로 되는 모든 인터 예측 모드의 가중치 부여 예측을 사용한 움직임 예측ㆍ보상 처리를 행한다. 구체적으로는, 움직임 예측ㆍ보상부(251)는, 화면 재배열 버퍼(32)로부터 공급되는 화상과, 프레임 메모리(44)로부터 스위치(45)를 통해서 판독되는 참조 화상에 기초하여, 후보로 되는 모든 인터 예측 모드의 움직임 벡터를 검출한다. 그리고, 움직임 예측ㆍ보상부(251)는, 검출된 움직임 벡터에 기초하여 참조 화상에 보상 처리를 실시한다.
그리고, 움직임 예측ㆍ보상부(251)는, 가중치 부여 예측에 있어서의 가중 계수와 오프셋값을 포함하는 가중치 부여 정보를 산출한다. 움직임 예측ㆍ보상부(251)는 생성부로서 기능하고, 산출된 가중치 부여 정보에 기초하여 보상 처리 후의 참조 화상에 대하여 가중치 부여 예측을 행하여, 예측 화상을 생성한다.
이때, 움직임 예측ㆍ보상부(251)는, 도 4의 움직임 예측ㆍ보상부(47)와 마찬가지로, 화면 재배열 버퍼(32)로부터 공급되는 화상과 예측 화상에 기초하여, 후보로 되는 모든 인터 예측 모드에 대하여 비용 함수값을 산출한다. 그리고, 움직임 예측ㆍ보상부(251)는, 움직임 예측ㆍ보상부(47)와 마찬가지로, 비용 함수값이 최소로 되는 인터 예측 모드를 최적 인터 예측 모드로 결정한다.
그리고, 움직임 예측ㆍ보상부(251)는, 움직임 예측ㆍ보상부(47)와 마찬가지로, 최적 인터 예측 모드의 비용 함수값과, 대응하는 예측 화상을 예측 화상 선택부(48)에 공급한다. 또한, 움직임 예측ㆍ보상부(251)는, 예측 화상 선택부(48)로부터 최적 인터 예측 모드에서 생성된 예측 화상의 선택이 통지된 경우, 인터 예측 모드 정보, 대응하는 움직임 벡터, 가중치 부여 정보 등을 가역 부호화부(252)에 출력한다. 또한, 움직임 예측ㆍ보상부(251)는 참조 화상 특정 정보를 참조 화상 설정부(49)에 출력한다.
가역 부호화부(252)는, 도 36의 설정부(232)로부터 공급되는 PPS에 기초하여, 부호화 대상의 화상의 슬라이스의 종류를 나타내는 슬라이스 타입을 생성한다. 또한, 가역 부호화부(252)는, 도 4의 가역 부호화부(36)와 마찬가지로, 인트라 예측 모드 정보를 인트라 예측부(46)로부터 취득한다. 또한, 가역 부호화부(252)는, 인터 예측 모드 정보, 움직임 벡터, 가중치 부여 정보 등을 움직임 예측ㆍ보상부(251)로부터 취득한다. 또한, 가역 부호화부(252)는, 가역 부호화부(36)와 마찬가지로, 참조 화상 설정부(49)로부터, RPS의 인덱스 또는 RPS 등을 취득하고, 레이트 제어부(50)로부터 양자화 파라미터를 취득한다.
또한, 가역 부호화부(252)는, 가역 부호화부(36)와 마찬가지로, 적응 오프셋 필터(42)로부터 저장 플래그, 인덱스 또는 오프셋 및 종류 정보를 오프셋 필터 정보로서 취득하고, 적응 루프 필터(43)로부터 필터 계수를 취득한다.
가역 부호화부(252)는, 가역 부호화부(36)와 마찬가지로, 양자화부(35)로부터 공급되는 양자화된 계수에 대하여 가역 부호화를 행한다. 또한, 가역 부호화부(252)는 슬라이스 타입, 인트라 예측 모드 정보, 또는, 인터 예측 모드 정보, 움직임 벡터, 가중치 부여 정보, RPS의 인덱스 또는 RPS 등, 양자화 파라미터, 오프셋 필터 정보 및 필터 계수를, 부호화 정보로서 가역 부호화한다.
가역 부호화부(252)는, 가역 부호화된 부호화 정보를 슬라이스 헤더로서, 가역 부호화된 계수에 부가하여, 부호화 데이터를 생성한다. 가역 부호화부(252)는 부호화 데이터를 축적 버퍼(37)에 공급하여, 축적시킨다.
(PPS의 신택스의 예)
도 38과 도 39는 도 36의 설정부(232)에 의해 설정되는 PPS의 신택스의 예를 도시하는 도면이며, 도 40과 도 41은 종래의 HEVC 방식에 있어서의 PPS의 신택스의 예를 도시하는 도면이다.
도 38의 제6행째에 나타내는 바와 같이, 설정부(232)에 의해 설정되는 PPS에는, 대응하는 픽처 내의 모든 슬라이스의 종류가 동일한지 여부를 나타내는 통일 플래그(unified_slice_type_flag)가 포함된다. 또한, 제7행째와 제8행째에 나타내는 바와 같이, 통일 플래그가 1인 경우, PPS에는, 대응하는 픽처 내의 모든 슬라이스의 종류가 I 슬라이스인지 여부를 나타내는 I 플래그(all_intra_slice_flag)가 포함된다.
또한, 제9행째 및 제10행째에 나타내는 바와 같이, I 플래그가 1이 아닌 경우, 즉 픽처 내에 P 슬라이스 또는 B 슬라이스가 포함되는 경우, PPS에는, 대응하는 픽처 내에 B 슬라이스가 없는지 여부를 나타내는 B 없음 플래그(no_b_slice_flag)가 포함된다.
그리고, 제11행째와 제12행째에 나타내는 바와 같이, I 플래그가 1이 아닌 경우, PPS에는, 대응하는 픽처보다도 표시 시각이 빠른 참조 화상을 사용한 전방 방향의 예측(L0 예측)에 있어서의 RPS의 최대수인 RPSL0수(num_ref_idx_l0_default_active_minus1)가 참조 화상에 관한 정보로서 포함된다.
또한, 제13행째와 제14행째에 나타내는 바와 같이, B 없음 플래그가 0인 경우, 즉, 픽처 내에 B 슬라이스가 포함되는 경우, PPS에는 대응하는 픽처보다도 표시 시각이 늦은 참조 화상을 사용한 후방 방향의 예측(L1 예측)에 있어서의 RPS의 최대수인 RPSL1수(num_ref_idx_l1_default_active_minus1)가 참조 화상에 관한 정보로서 포함된다.
제25행째와 제26행째에 나타내는 바와 같이, I 플래그가 1이 아닌 경우, PPS에는, P 슬라이스에 대하여 가중치 부여 예측을 행할지 여부를 나타내는 P 예측 플래그(weighted_pred_flag)가 참조 화상에 관한 정보로서 포함된다. 또한, B 없음 플래그가 1이 아닌 경우, PPS에는, B 슬라이스에 대하여 가중치 부여 예측을 행할지 여부를 나타내는 B 예측 플래그(weighted_bipred_flag)가 참조 화상에 관한 정보로서 포함된다.
이상과 같이, 도 38과 도 39의 PPS에서는, 대응하는 픽처가 I 슬라이스만을 포함하는 경우, RPSL0수, RPSL1수, P 예측 플래그 및 B 예측 플래그가 설정되지 않는다. 또한, 대응하는 픽처가 I 슬라이스 이외의 슬라이스를 포함하는 경우, RPSL1수와 B 예측 플래그가 설정되지 않는다. 따라서, 픽처 내의 슬라이스의 종류에 상관없이, 모든 픽처에 대하여, RPSL0수, RPSL1수, P 예측 플래그 및 B 예측 플래그가 설정되는 경우에 비해, 부호화 효율을 향상시킬 수 있다.
또한, 복호 장치에서는, 픽처가 I 슬라이스만을 포함하는 경우, RPSL0수와 RPSL1수가 0이라고 인식되고, 픽처가 I 슬라이스 이외의 슬라이스를 포함하는 경우, RPSL1수가 0이라고 인식된다.
이에 반해, 도 40과 도 41에 도시한 종래의 HEVC 방식의 PPS에서는, 도 40의 6행째, 7행째, 17행째 및 18행째에 나타내는 바와 같이, 픽처 내의 슬라이스의 종류에 상관없이, RPSL0수, RPSL1수, P 예측 플래그 및 B 예측 플래그가 설정된다.
또한, 픽처가 B 슬라이스만을 포함하는 경우, P 예측 플래그는 설정되지 않도록 해도 된다.
(슬라이스 헤더의 신택스의 예)
도 42 내지 도 44는 도 37의 가역 부호화부(252)에 의해 부가되는 슬라이스 헤더의 신택스의 예를 도시하는 도면이며, 도 45 내지 도 47은 종래의 HEVC 방식에 있어서의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 42의 제2행째에 나타내는 바와 같이, 가역 부호화부(252)에 의해 부가되는 슬라이스 헤더에는, 대응하는 슬라이스가 픽처 내의 선두의 슬라이스인지 여부를 나타내는 선두 플래그(first_slice_in_pic_flag)가 포함된다. 또한, 제11행째와 제12행째에 나타내는 바와 같이, 통일 플래그가 0인 경우, 또는, 통일 플래그가 1이고, 또한, 선두 플래그가 0인 경우, 슬라이스 헤더에는 대응하는 슬라이스의 슬라이스 타입(slice_type)이 포함된다.
즉, 도 42 내지 도 44의 슬라이스 헤더에는, 픽처 내의 슬라이스의 종류가 동일하지 않은 경우, 또는, 픽처 내의 슬라이스의 종류가 동일하고, 또한, 대응하는 슬라이스가 픽처 내의 선두의 슬라이스인 경우, 슬라이스 타입이 설정된다.
그러나, 도 42 내지 도 44의 슬라이스 헤더에는, 픽처 내의 슬라이스의 종류가 동일하고, 또한, 대응하는 슬라이스가 픽처 내의 선두 이외의 슬라이스인 경우, 슬라이스 타입은 설정되지 않는다. 이 경우, 선두의 슬라이스의 슬라이스 헤더에 포함되는 슬라이스 타입이, 선두 이외의 슬라이스의 슬라이스 타입으로 된다.
따라서, 픽처 내의 모든 슬라이스의 슬라이스 타입이 동일한지 여부에 상관없이, 모든 슬라이스의 슬라이스 타입이 설정되는 경우에 비해, 부호화 효율을 향상시킬 수 있다.
이에 반해, 도 45 내지 도 47에 도시한 종래의 HEVC 방식에 있어서의 슬라이스 헤더에는, 도 45의 제11행째에 나타내는 바와 같이, 픽처 내의 모든 슬라이스의 슬라이스 타입이 동일한지 여부에 상관없이, 모든 슬라이스의 슬라이스 타입이 설정된다.
(부호화 장치의 처리의 설명)
도 48은 도 36의 부호화 장치(230)의 생성 처리를 설명하는 흐름도이다.
도 48의 스텝 S281에 있어서, 부호화 장치(230)의 설정부(232)는 도 11의 RPS 설정 처리를 행한다. 스텝 S282에 있어서, 부호화부(231)는 외부로부터 입력 신호로서 입력되는 프레임 단위의 화상을 HEVC 방식으로 부호화하는 부호화 처리를 행한다. 이 부호화 처리의 상세는 후술하는 도 49 및 도 50을 참조하여 설명한다.
스텝 S283에 있어서, 설정부(232)는 인덱스가 부여된 RPS를 포함하는 SPS를 설정한다. 스텝 S284에 있어서, 설정부(232)는 PPS를 설정하는 PPS 설정 처리를 행한다. 이 PPS 설정 처리의 상세는 후술하는 도 51을 참조하여 설명한다.
스텝 S285 및 스텝 S286의 처리는 도 10의 스텝 S15 및 S16의 처리와 마찬가지이므로, 설명은 생략한다.
도 49 및 도 50은 도 48의 스텝 S282의 부호화 처리의 상세를 설명하는 흐름도이다.
도 49의 스텝 S301 및 S302의 처리는 도 12의 스텝 S31 및 S32의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S303에 있어서, 움직임 예측ㆍ보상부(251)는 도 36의 설정부(232)로부터 공급되는 PPS에 포함되는 P 예측 플래그 또는 B 예측 플래그에 기초하여, 가중치 부여 예측을 행할지 여부를 판정한다.
구체적으로는, 부호화 대상의 화상이 P 슬라이스인 경우, P 예측 플래그가 1일 때, 움직임 예측ㆍ보상부(251)는 가중치 부여 예측을 행한다고 판정한다. 또한, 부호화 대상의 화상이 B 슬라이스인 경우, B 예측 플래그가 1일 때, 움직임 예측ㆍ보상부(251)는 가중치 부여 예측을 행한다고 판정한다. 또한, 부호화 대상의 화상이 I 슬라이스인 경우, 스텝 S303의 처리를 스킵하고, 스텝 S304로 진행한다.
스텝 S303에서 가중치 부여 예측을 행한다고 판정된 경우, 스텝 S304에 있어서, 인트라 예측부(46)는 후보로 되는 모든 인트라 예측 모드의 인트라 예측 처리를 행한다. 또한, 인트라 예측부(46)는 화면 재배열 버퍼(32)로부터 판독된 화상과, 인트라 예측 처리의 결과 생성되는 예측 화상에 기초하여, 후보로 되는 모든 인트라 예측 모드에 대하여 비용 함수값을 산출한다. 그리고, 인트라 예측부(46)는, 비용 함수값이 최소로 되는 인트라 예측 모드를, 최적 인트라 예측 모드로 결정한다. 인트라 예측부(46)는, 최적 인트라 예측 모드에서 생성된 예측 화상, 및, 대응하는 비용 함수값을, 예측 화상 선택부(48)에 공급한다.
또한, 움직임 예측ㆍ보상부(251)는, 후보로 되는 모든 인터 예측 모드의 가중치 부여 예측을 사용한 움직임 예측ㆍ보상 처리를 행한다. 또한, 움직임 예측ㆍ보상부(251)는, 화면 재배열 버퍼(32)로부터 공급되는 화상과 예측 화상에 기초하여, 후보로 되는 모든 인터 예측 모드에 대하여 비용 함수값을 산출하고, 비용 함수값이 최소로 되는 인터 예측 모드를 최적 인터 예측 모드로 결정한다. 그리고, 움직임 예측ㆍ보상부(251)는 최적 인터 예측 모드의 비용 함수값과, 대응하는 예측 화상을 예측 화상 선택부(48)에 공급한다.
단, 부호화 대상의 화상이 I 슬라이스인 경우, 움직임 예측ㆍ보상 처리는 행해지지 않는다. 스텝 S304의 처리 후, 처리는 스텝 S306으로 진행된다.
한편, 스텝 S303에서 가중치 부여 예측을 행하지 않는다고 판정된 경우, 스텝 S305에 있어서, 인트라 예측부(46)는 스텝 S304의 처리와 마찬가지의 처리를 행한다.
또한, 움직임 예측ㆍ보상부(251)는 후보로 되는 모든 인터 예측 모드의 움직임 예측ㆍ보상 처리를 행한다. 또한, 움직임 예측ㆍ보상부(251)는, 화면 재배열 버퍼(32)로부터 공급되는 화상과 예측 화상에 기초하여, 후보로 되는 모든 인터 예측 모드에 대하여 비용 함수값을 산출하고, 비용 함수값이 최소로 되는 인터 예측 모드를 최적 인터 예측 모드로 결정한다. 그리고, 움직임 예측ㆍ보상부(251)는, 최적 인터 예측 모드의 비용 함수값과, 대응하는 예측 화상을 예측 화상 선택부(48)에 공급한다. 그리고, 처리는 스텝 S306으로 진행된다.
스텝 S306 내지 S308의 처리는 도 12의 스텝 S34 내지 S36의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S308의 처리 후, 스텝 S309에 있어서, 움직임 예측ㆍ보상부(251)는 움직임 예측ㆍ보상 처리에 있어서 가중치 부여 예측을 행하였는지 여부를 판정한다. 스텝 S309에서 가중치 부여 예측을 행하였다고 판정된 경우, 스텝 S310에 있어서, 움직임 예측ㆍ보상부(251)는 가중치 부여 예측에 있어서의 가중치 부여 정보를 가역 부호화부(252)에 공급한다. 그리고, 스텝 S311로 진행한다.
스텝 S311 내지 S322의 처리는, 도 12 및 도 13의 스텝 S37 내지 S48의 처리와 마찬가지이므로, 설명은 생략한다.
도 50의 스텝 S323에 있어서, 가역 부호화부(252)는, 도 36의 설정부(232)로부터 공급되는 PPS에 포함되는 통일 플래그가 0인지, 또는, 통일 플래그와 선두 플래그가 1인지 여부를 판정한다.
스텝 S323에서 통일 플래그가 0이거나, 또는, 통일 플래그와 선두 플래그가 1이라고 판정된 경우, 스텝 S324에 있어서, 가역 부호화부(252)는 부호화 대상의 화상의 슬라이스 타입을 생성한다. 그리고, 처리는 스텝 S325로 진행된다.
한편, 스텝 S323에서 통일 플래그가 0이 아니고, 또한, 통일 플래그와 선두 플래그가 1이 아니라고 판정된 경우, 처리는 스텝 S325로 진행된다.
스텝 S325에 있어서, 가역 부호화부(252)는, 슬라이스 타입, 인트라 예측 모드 정보 또는, 인터 예측 모드 정보, 움직임 벡터, 가중치 부여 정보, RPS의 인덱스 또는 RPS 등, 레이트 제어부(50)로부터의 양자화 파라미터, 오프셋 필터 정보 및 필터 계수를, 부호화 정보로서 가역 부호화한다.
스텝 S326 내지 S329의 처리는 도 13의 스텝 S50 내지 S53의 처리와 마찬가지이므로, 설명은 생략한다.
도 51은 도 48의 스텝 S284의 PPS 설정 처리의 상세를 설명하는 흐름도이다. 이 PPS 설정 처리는 픽처 단위로 행해진다.
도 51의 스텝 S331에 있어서, 설정부(232)는 픽처 내의 모든 슬라이스의 종류는 동일한지 여부를 판정한다. 스텝 S331에서 픽처 내의 모든 슬라이스의 종류가 동일하다고 판정된 경우, 스텝 S332에 있어서, 설정부(232)는 통일 플래그를 1로 설정하고, PPS에 포함시킨다.
스텝 S333에 있어서, 설정부(232)는 픽처 내의 모든 슬라이스의 종류는 I 슬라이스인지 여부를 판정한다. 스텝 S333에서 픽처 내의 모든 슬라이스의 종류가 I 슬라이스라고 판정된 경우, 스텝 S334에 있어서, 설정부(232)는 I 플래그를 1로 설정하여 PPS에 포함시키고, 처리를 스텝 S337로 진행시킨다.
한편, 스텝 S333에서 픽처 내의 모든 슬라이스의 종류가 I 슬라이스가 아니라고 판정된 경우, 스텝 S335에 있어서, 설정부(232)는 I 플래그를 0으로 설정하여 PPS에 포함시키고, 처리를 스텝 S337로 진행시킨다.
한편, 스텝 S331에서 픽처 내의 모든 슬라이스의 종류가 동일하지 않다고 판정된 경우, 스텝 S336에 있어서, 설정부(232)는 통일 플래그를 0으로 설정하여 PPS에 포함시키고, 처리를 스텝 S337로 진행시킨다.
스텝 S337에 있어서, 설정부(232)는 I 플래그가 1이 아닌지 여부를 판정한다. 스텝 S337에서 I 플래그가 1이 아니라고 판정된 경우, 스텝 S338에 있어서, 설정부(232)는 PPS에 포함되는 RPSL0수와 P 예측 플래그를 설정하고, PPS에 포함시킨다.
스텝 S339에 있어서, 설정부(232)는 픽처 내에 B 슬라이스가 포함되는지 여부를 판정한다. 스텝 S339에서 픽처 내에 B 슬라이스가 포함된다고 판정된 경우, 스텝 S340에 있어서, 설정부(232)는 PPS에 포함되는 B 없음 플래그를 0으로 설정하고, PPS에 포함시킨다. 스텝 S341에 있어서, 설정부(232)는 PPS에 포함되는 RPSL1수와 B 예측 플래그를 설정하고, PPS에 포함시킨다. 그리고, 처리는 도 48의 스텝 S284로 되돌아가서, 스텝 S285로 진행된다.
한편, 스텝 S339에서 픽처 내에 B 슬라이스가 포함되어 있지 않다고 판정된 경우, 스텝 S342에 있어서, 설정부(232)는 B 없음 플래그를 1로 설정하고, PPS에 포함시킨다. 그리고, 처리는 도 48의 스텝 S284로 되돌아가서, 스텝 S285로 진행된다.
또한, 스텝 S337에서 I 플래그가 1이라고 판정된 경우, 처리는 도 48의 스텝 S284로 되돌아가서, 스텝 S285로 진행된다.
이상과 같이, 부호화 장치(230)는 픽처 내의 슬라이스의 종류에 따라서 참조 화상에 관한 정보를 설정하므로, 참조 화상에 관한 정보의 정보량을 삭감하여, 부호화 효율을 향상시킬 수 있다. 또한, 부호화 장치(230)는 픽처 내의 모든 슬라이스의 종류가 동일한지 여부에 의해 슬라이스 타입을 설정하므로, 슬라이스 타입의 정보량을 삭감하여, 부호화 효율을 향상시킬 수 있다.
(복호 장치의 제4 실시 형태의 구성예)
도 52는 도 36의 부호화 장치(230)로부터 전송되는 부호화 스트림을 복호하는, 본 기술을 적용한 복호 장치의 제4 실시 형태의 구성예를 도시하는 블록도이다.
또한, 도 52의 구성 중, 도 15의 구성과 동일한 것에는 동일한 부호를 부여하고 있으며, 설명은 반복되므로 생략한다.
도 52의 복호 장치(270)의 구성은, 복호부(113) 대신에 복호부(271)가 설치되는 점이 도 15의 구성과 상이하다. 복호 장치(270)는, 필요에 따라서, 움직임 보상 처리 시에 가중치 부여 예측을 행한다.
구체적으로는, 복호 장치(270)의 복호부(271)는 추출부(112)로부터 공급되는 각 RPS의 inter_ref_pic_set_prediction_flag와 delta_idx_minus1 또는 참조 화상 특정 정보에 기초하여, 추출부(112)로부터 공급되는 부호화 데이터를 HEVC 방식으로 복호한다. 이때, 복호부(271)는, 필요에 따라서 SPS에 포함되는 RPS 이외의 정보나 PPS 등도 참조한다. 또한, 복호부(271)는, 필요에 따라서, 움직임 보상 처리 시에 가중치 부여 예측을 행한다. 복호부(271)는, 복호의 결과 얻어지는 화상을, 출력 신호로서 출력한다.
(복호부의 구성예)
도 53은 도 52의 복호부(271)의 구성예를 도시하는 블록도이다.
또한, 도 53의 구성 중, 도 16의 구성과 동일한 것에는 동일한 부호를 부여하고 있으며, 설명은 반복되므로 생략한다.
도 53의 복호부(271)의 구성은, 가역 복호부(132) 대신에 가역 복호부(291)가 설치되는 점, 및, 움직임 보상부(145) 대신에 움직임 보상부(292)가 설치되는 점이 도 16의 구성과 상이하다.
복호부(271)의 가역 복호부(291)는, 도 16의 가역 복호부(132)와 마찬가지로, 축적 버퍼(131)로부터의 부호화 데이터에 대하여 가역 복호를 실시함으로써, 양자화된 계수와 부호화 정보를 얻는다. 가역 복호부(291)는, 가역 복호부(132)와 마찬가지로, 양자화된 계수를 역양자화부(133)에 공급한다. 또한, 가역 복호부(291)는, 부호화 정보로서의 인트라 예측 모드 정보 등을 인트라 예측부(143)에 공급하고, 움직임 벡터, 인터 예측 모드 정보, 가중치 부여 정보 등을 움직임 보상부(292)에 공급한다. 가역 복호부(291)는, 가역 복호부(132)와 마찬가지로, 부호화 정보로서의 RPS 플래그와 RPS의 인덱스 또는 RPS를 참조 화상 설정부(144)에 공급한다.
또한, 가역 복호부(291)는, 가역 복호부(132)와 마찬가지로, 부호화 정보로서의 인트라 예측 모드 정보 또는 인터 예측 모드 정보를 스위치(146)에 공급한다. 가역 복호부(291)는, 가역 복호부(132)와 마찬가지로, 부호화 정보로서의 오프셋 필터 정보를 적응 오프셋 필터(137)에 공급하고, 필터 계수를 적응 루프 필터(138)에 공급한다.
움직임 보상부(292)는, 도 16의 움직임 보상부(145)와 마찬가지로, 참조 화상 설정부(144)로부터 공급되는 참조 화상 특정 정보에 기초하여, 프레임 메모리(141)로부터 스위치(142)를 통해서, 참조 화상 특정 정보에 의해 특정되는 참조 화상을 판독한다.
또한, 움직임 보상부(292)는, 추출부(112)로부터 공급되는 PPS에 포함되는 P 예측 플래그 또는 B 예측 플래그에 기초하여, 도 37의 움직임 예측ㆍ보상부(251)와 마찬가지로, 가중치 부여 예측을 행할지 여부를 판정한다.
움직임 보상부(292)는 생성부로서 기능하고, 가중치 부여 예측을 행한다고 판정한 경우, 움직임 벡터와 참조 화상을 사용하여, 인터 예측 모드 정보가 나타내는 최적 인터 예측 모드의 가중치 부여 예측을 사용한 움직임 보상 처리를 행한다. 이때, 움직임 보상부(292)는, 필요에 따라서, 부호화 대상의 화상의 슬라이스가 P 슬라이스인 경우 RPSL0수를 참조하고, 부호화 대상의 화상의 슬라이스가 B 슬라이스인 경우 RPSL0수와 RPSL1수를 참조한다.
한편, 움직임 보상부(292)는, 가중치 부여 예측을 행하지 않는다고 판정한 경우, 움직임 보상부(145)와 마찬가지로, 최적 인터 예측 모드의 움직임 보상 처리를 행한다. 움직임 보상부(292)는 그 결과 생성되는 예측 화상을 스위치(146)에 공급한다.
(복호 장치의 처리의 설명)
도 54는 도 52의 복호 장치(270)에 의한 수취 처리를 설명하는 흐름도이다.
도 54의 스텝 S351 내지 S353의 처리는 도 17의 스텝 S111 내지 S113의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S354에 있어서, 복호부(271)는 추출부(112)로부터 공급되는 각 RPS의 RPS 정보와 PPS에 기초하여 복호 처리를 행한다. 이 복호 처리의 상세는 후술하는 도 55를 참조하여 설명한다. 그리고, 처리는 종료된다.
도 55는 도 54의 스텝 S354의 복호 처리의 상세를 설명하는 흐름도이다.
도 55의 스텝 S361에 있어서, 복호부(271)의 축적 버퍼(131)는, 도 52의 추출부(112)로부터 프레임 단위의 부호화 데이터를 수취하여, 축적한다. 축적 버퍼(131)는 축적되어 있는 부호화 데이터를 가역 복호부(291)에 공급한다.
스텝 S362에 있어서, 가역 복호부(291)는 축적 버퍼(131)로부터의 부호화 데이터를 가역 복호하여, 양자화된 계수와 부호화 정보를 얻는다. 가역 복호부(291)는 양자화된 계수를 역양자화부(133)에 공급한다. 또한, 가역 복호부(291)는 부호화 정보로서의 인트라 예측 모드 정보 등을 인트라 예측부(143)에 공급하고, 움직임 벡터, 인터 예측 모드 정보, 가중치 부여 정보, RPS 플래그와 RPS의 인덱스 또는 RPS 등을 움직임 보상부(292)에 공급한다.
또한, 가역 복호부(291)는 부호화 정보로서의 인트라 예측 모드 정보 또는 인터 예측 모드 정보를 스위치(146)에 공급한다. 가역 복호부(291)는 부호화 정보로서의 오프셋 필터 정보를 적응 오프셋 필터(137)에 공급하고, 필터 계수를 적응 루프 필터(138)에 공급한다.
스텝 S363 내지 S365의 처리는 도 19의 스텝 S133 내지 S135의 처리와 마찬가지이므로, 설명은 생략한다. 스텝 S366에 있어서, 움직임 보상부(292)는, 도 52의 추출부(112)로부터 공급되는 PPS에 포함되는 P 예측 플래그 또는 B 예측 플래그에 기초하여, 도 37의 움직임 예측ㆍ보상부(251)와 마찬가지로, 가중치 부여 예측을 행할지 여부를 판정한다.
스텝 S366에서 가중치 부여 예측을 행한다고 판정된 경우, 스텝 S367에 있어서, 움직임 보상부(292)는 참조 화상 설정부(144)로부터 공급되는 참조 화상 특정 정보에 기초하여 참조 화상을 판독하고, 움직임 벡터와 참조 화상을 사용하여, 인터 예측 모드 정보가 나타내는 최적 인터 예측 모드의 가중치 부여 예측을 사용한 움직임 보상 처리를 행한다.
이때, 필요에 따라서, 부호화 대상의 화상의 슬라이스가 P 슬라이스인 경우 RPSL0수를 참조하고, 부호화 대상의 화상의 슬라이스가 B 슬라이스인 경우 RPSL0수와 RPSL1수를 참조한다. 움직임 보상부(292)는, 그 결과 생성되는 예측 화상을, 스위치(146)를 통해서 가산부(135)에 공급하고, 처리를 스텝 S370으로 진행시킨다.
한편, 스텝 S366에서 가중치 부여 예측을 행하지 않는다고 판정된 경우, 스텝 S368에 있어서, 움직임 보상부(292)는 참조 화상 설정부(144)로부터 공급되는 참조 화상 특정 정보에 기초하여 참조 화상을 판독하고, 움직임 벡터와 참조 화상을 사용하여, 인터 예측 모드 정보가 나타내는 최적 인터 예측 모드의 움직임 보상 처리를 행한다. 움직임 보상부(292)는, 그 결과 생성되는 예측 화상을, 스위치(146)를 통해서 가산부(135)에 공급하고, 처리를 스텝 S370으로 진행시킨다.
스텝 S369 내지 S377의 처리는 도 19의 스텝 S137 내지 S145의 처리와 마찬가지이므로, 설명은 생략한다.
이상과 같이, 복호 장치(270)는 픽처 내의 슬라이스의 종류에 따라서 참조 화상에 관한 정보를 설정함으로써 부호화 효율이 향상된 부호화 스트림을 복호할 수 있다.
또한, 제4 실시 형태에서는, 참조 화상에 관한 정보는 RPSL0수, RPSL1수, P 예측 플래그 및 B 예측 플래그인 것으로 하였지만, 이것에 한정되지 않는다.
<다시점 화상 부호화ㆍ다시점 화상 복호에의 적용>
상술한 일련의 처리는 다시점 화상 부호화ㆍ다시점 화상 복호에 적용할 수 있다. 도 56은 다시점 화상 부호화 방식의 일례를 도시한다.
도 56에 도시된 바와 같이, 다시점 화상은, 복수의 시점의 화상을 포함하고, 그 복수의 시점 중 소정의 하나의 시점의 화상이 베이스 뷰의 화상으로 지정되어 있다. 베이스 뷰의 화상 이외의 각 시점의 화상은 논베이스 뷰의 화상으로서 취급된다.
도 56과 같은 다시점 화상 부호화를 행하는 경우, 각 뷰(동일 뷰)에 있어서, 양자화 파라미터의 차분을 취할 수도 있다:
Figure 112014122679310-pct00004
다시점 화상 부호화를 행하는 경우, 각 뷰(상이한 뷰)에 있어서, 양자화 파라미터의 차분을 취할 수도 있다:
Figure 112014122679310-pct00005
이 경우, 상기 (1) 내지 (4)를 조합하여 사용할 수도 있다. 예를 들어, 논베이스 뷰에서는, 베이스 뷰와 논베이스 뷰 사이에 있어서 슬라이스 레벨로 양자화 파라미터의 차분을 취하는 방법(3-1과 2-3을 조합함), 베이스 뷰와 논베이스 뷰 사이에 있어서 LCU 레벨로 양자화 파라미터의 차분을 취하는 방법(3-2와 2-1을 조합함)이 생각된다. 이와 같이, 차분을 반복하여 적용함으로써, 다시점 부호화를 행한 경우에 있어서도 부호화 효율을 향상시킬 수 있다.
상술한 방법과 마찬가지로, 상기의 각 dQP에 대하여, 값이 0이 아닌 dQP가 존재하는지 여부를 식별하는 플래그를 세트할 수도 있다.
<다시점 화상 부호화 장치>
도 57은 상술한 다시점 화상 부호화를 행하는 다시점 화상 부호화 장치를 도시하는 도면이다. 도 57에 도시된 바와 같이, 다시점 화상 부호화 장치(600)는 부호화부(601), 부호화부(602) 및 다중화부(603)를 갖는다.
부호화부(601)는 베이스 뷰 화상을 부호화하여, 베이스 뷰 화상 부호화 스트림을 생성한다. 부호화부(602)는 논베이스 뷰 화상을 부호화하여, 논베이스 뷰 화상 부호화 스트림을 생성한다. 다중화부(603)는 부호화부(601)에 있어서 생성된 베이스 뷰 화상 부호화 스트림과, 부호화부(602)에 있어서 생성된 논베이스 뷰 화상 부호화 스트림을 다중화하여, 다시점 화상 부호화 스트림을 생성한다.
이 다시점 화상 부호화 장치(600)의 부호화부(601) 및 부호화부(602)에 대하여, 부호화 장치(10(150, 190))를 적용할 수 있다. 이 경우, 다시점 화상 부호화 장치(600)는, 부호화부(601)가 설정하는 양자화 파라미터와 부호화부(602)가 설정하는 양자화 파라미터의 차분값을 설정하여, 전송시킨다.
<다시점 화상 복호 장치>
도 58은 상술한 다시점 화상 복호를 행하는 다시점 화상 복호 장치를 도시하는 도면이다. 도 58에 도시된 바와 같이, 다시점 화상 복호 장치(610)는 역다중화부(611), 복호부(612) 및 복호부(613)를 갖는다.
역다중화부(611)는 베이스 뷰 화상 부호화 스트림과 논베이스 뷰 화상 부호화 스트림이 다중화된 다시점 화상 부호화 스트림을 역다중화하여, 베이스 뷰 화상 부호화 스트림과, 논베이스 뷰 화상 부호화 스트림을 추출한다. 복호부(612)는 역다중화부(611)에 의해 추출된 베이스 뷰 화상 부호화 스트림을 복호하여, 베이스 뷰 화상을 얻는다. 복호부(613)는 역다중화부(611)에 의해 추출된 논베이스 뷰 화상 부호화 스트림을 복호하여, 논베이스 뷰 화상을 얻는다.
이 다시점 화상 복호 장치(610)의 복호부(612) 및 복호부(613)에 대하여, 복호 장치(110(170, 210))를 적용할 수 있다. 이 경우, 다시점 화상 복호 장치(610)는, 부호화부(601)가 설정하는 양자화 파라미터와 부호화부(602)가 설정하는 양자화 파라미터의 차분값으로부터 양자화 파라미터를 설정하여, 역양자화를 행한다.
<계층 화상 부호화ㆍ계층 화상 복호에의 적용>
상술한 일련의 처리는 계층 화상 부호화ㆍ계층 화상 복호에 적용할 수 있다. 도 59는 계층 화상 부호화 방식의 일례를 도시한다.
도 59에 도시된 바와 같이, 계층 화상은 복수의 계층(해상도)의 화상을 포함하고, 그 복수의 해상도 중 소정의 하나의 계층의 화상이 베이스 레이어의 화상으로 지정되어 있다. 베이스 레이어의 화상 이외의 각 계층의 화상은 논베이스 레이어의 화상으로서 취급된다.
도 59와 같은 계층 화상 부호화(공간 스케일러빌리티)를 행하는 경우, 각 레이어(동일 레이어)에 있어서, 양자화 파라미터의 차분을 취할 수도 있다:
Figure 112014122679310-pct00006
계층 부호화를 행하는 경우, 각 레이어(상이한 레이어)에 있어서, 양자화 파라미터의 차분을 취할 수도 있다:
Figure 112014122679310-pct00007
이 경우, 상기 (1) 내지 (4)를 조합하여 사용할 수도 있다. 예를 들어, 논베이스 레이어에서는 베이스 레이어와 논베이스 레이어 사이에 있어서 슬라이스 레벨로 양자화 파라미터의 차분을 취하는 방법(3-1과 2-3을 조합함), 베이스 레이어와 논베이스 레이어 사이에 있어서 LCU 레벨로 양자화 파라미터의 차분을 취하는 방법(3-2와 2-1을 조합함)이 생각된다. 이와 같이, 차분을 반복하여 적용함으로써, 계층 부호화를 행한 경우에 있어서도 부호화 효율을 향상시킬 수 있다.
상술한 방법과 마찬가지로, 상기의 각 dQP에 대하여, 값이 0이 아닌 dQP가 존재하는지 여부를 식별하는 플래그를 세트할 수도 있다.
<계층 화상 부호화 장치>
도 60은 상술한 계층 화상 부호화를 행하는 계층 화상 부호화 장치를 도시하는 도면이다. 도 60에 도시된 바와 같이, 계층 화상 부호화 장치(620)는 부호화부(621), 부호화부(622) 및 다중화부(623)를 갖는다.
부호화부(621)는 베이스 레이어 화상을 부호화하여, 베이스 레이어 화상 부호화 스트림을 생성한다. 부호화부(622)는 논베이스 레이어 화상을 부호화하여, 논베이스 레이어 화상 부호화 스트림을 생성한다. 다중화부(623)는 부호화부(621)에 있어서 생성된 베이스 레이어 화상 부호화 스트림과, 부호화부(622)에 있어서 생성된 논베이스 레이어 화상 부호화 스트림을 다중화하여, 계층 화상 부호화 스트림을 생성한다.
이 계층 화상 부호화 장치(620)의 부호화부(621) 및 부호화부(622)에 대하여, 부호화 장치(10(150, 190))를 적용할 수 있다. 이 경우, 계층 화상 부호화 장치(620)는 부호화부(621)가 설정하는 양자화 파라미터와 부호화부(622)가 설정하는 양자화 파라미터의 차분값을 설정하여, 전송시킨다.
<계층 화상 복호 장치>
도 61은 상술한 계층 화상 복호를 행하는 계층 화상 복호 장치를 도시하는 도면이다. 도 61에 도시된 바와 같이, 계층 화상 복호 장치(630)는 역다중화부(631), 복호부(632) 및 복호부(633)를 갖는다.
역다중화부(631)는 베이스 레이어 화상 부호화 스트림과 논베이스 레이어 화상 부호화 스트림이 다중화된 계층 화상 부호화 스트림을 역다중화하여, 베이스 레이어 화상 부호화 스트림과, 논베이스 레이어 화상 부호화 스트림을 추출한다. 복호부(632)는 역다중화부(631)에 의해 추출된 베이스 레이어 화상 부호화 스트림을 복호하여, 베이스 레이어 화상을 얻는다. 복호부(633)는 역다중화부(631)에 의해 추출된 논베이스 레이어 화상 부호화 스트림을 복호하여, 논베이스 레이어 화상을 얻는다.
이 계층 화상 복호 장치(630)의 복호부(632) 및 복호부(633)에 대하여, 복호 장치(110(170, 210))를 적용할 수 있다. 이 경우, 계층 화상 복호 장치(630)는 부호화부(621)가 설정하는 양자화 파라미터와 부호화부(622)가 설정하는 양자화 파라미터의 차분값으로부터 양자화 파라미터 설정하여, 역양자화를 행한다.
<본 기술을 적용한 컴퓨터의 설명>
상술한 일련의 처리는 하드웨어에 의해 실행할 수도 있고, 소프트웨어에 의해 실행할 수도 있다. 일련의 처리를 소프트웨어에 의해 실행하는 경우에는, 그 소프트웨어를 구성하는 프로그램이 컴퓨터에 인스톨된다. 여기서, 컴퓨터에는 전용의 하드웨어에 내장되어 있는 컴퓨터나, 각종 프로그램을 인스톨함으로써, 각종 기능을 실행하는 것이 가능한, 예를 들어 범용의 퍼스널 컴퓨터 등이 포함된다.
도 62는 상술한 일련의 처리를 프로그램에 의해 실행하는 컴퓨터의 하드웨어 구성예를 도시하는 블록도이다.
컴퓨터에 있어서, CPU(Central Processing Unit)(801), ROM(Read Only Memory)(802), RAM(Random Access Memory)(803)은 버스(804)에 의해 서로 접속되어 있다.
버스(804)에는, 또한, 입출력 인터페이스(805)가 접속되어 있다. 입출력 인터페이스(805)에는 입력부(806), 출력부(807), 기억부(808), 통신부(809) 및 드라이브(810)가 접속되어 있다.
입력부(806)는 키보드, 마우스, 마이크로폰 등을 포함한다. 출력부(807)는 디스플레이, 스피커 등을 포함한다. 기억부(808)는 하드디스크나 불휘발성의 메모리 등을 포함한다. 통신부(809)는 네트워크 인터페이스 등을 포함한다. 드라이브(810)는 자기 디스크, 광 디스크, 광자기 디스크, 또는 반도체 메모리 등의 리무버블 미디어(811)를 구동한다.
이상과 같이 구성되는 컴퓨터에서는, CPU(801)가, 예를 들어 기억부(808)에 기억되어 있는 프로그램을, 입출력 인터페이스(805) 및 버스(804)를 통해서, RAM(803)에 로드하여 실행함으로써, 상술한 일련의 처리가 행해진다.
컴퓨터(CPU(801))가 실행하는 프로그램은, 예를 들어 패키지 미디어 등으로서의 리무버블 미디어(811)에 기록하여 제공할 수 있다. 또한, 프로그램은 로컬 에리어 네트워크, 인터넷, 디지털 위성 방송 등의, 유선 또는 무선의 전송 매체를 통해서 제공할 수 있다.
컴퓨터에서는, 프로그램은 리무버블 미디어(811)를 드라이브(810)에 장착함으로써, 입출력 인터페이스(805)를 통해서 기억부(808)에 인스톨할 수 있다. 또한, 프로그램은 유선 또는 무선의 전송 매체를 통해서, 통신부(809)에서 수신하고, 기억부(808)에 인스톨할 수 있다. 그 밖에, 프로그램은 ROM(802)이나 기억부(808)에 미리 인스톨해 둘 수 있다.
또한, 컴퓨터가 실행하는 프로그램은 본 명세서에서 설명하는 순서에 따라서 시계열로 처리가 행해지는 프로그램이어도 되고, 병렬로, 혹은 호출이 행해졌을 때 등의 필요한 타이밍에 처리가 행해지는 프로그램이어도 된다.
<텔레비전 장치의 구성예>
도 63은 본 기술을 적용한 텔레비전 장치의 개략 구성을 예시하고 있다. 텔레비전 장치(900)는 안테나(901), 튜너(902), 디멀티플렉서(903), 디코더(904), 영상 신호 처리부(905), 표시부(906), 음성 신호 처리부(907), 스피커(908), 외부 인터페이스부(909)를 갖고 있다. 또한, 텔레비전 장치(900)는 제어부(910), 유저 인터페이스부(911) 등을 갖고 있다.
튜너(902)는 안테나(901)에 의해 수신된 방송파 신호로부터 원하는 채널을 선국하여 복조를 행하고, 얻어진 부호화 비트 스트림을 디멀티플렉서(903)에 출력한다.
디멀티플렉서(903)는 부호화 비트 스트림으로부터 시청 대상인 프로그램의 영상이나 음성의 패킷을 추출하고, 추출한 패킷의 데이터를 디코더(904)에 출력한다. 또한, 디멀티플렉서(903)는 EPG(Electronic Program Guide) 등의 데이터의 패킷을 제어부(910)에 공급한다. 또한, 스크램블이 행해져 있는 경우, 디멀티플렉서 등에서 스크램블의 해제를 행한다.
디코더(904)는 패킷의 복호화 처리를 행하고, 복호 처리화에 의해 생성된 영상 데이터를 영상 신호 처리부(905), 음성 데이터를 음성 신호 처리부(907)에 출력한다.
영상 신호 처리부(905)는, 영상 데이터에 대하여, 노이즈 제거나 유저 설정에 따른 영상 처리 등을 행한다. 영상 신호 처리부(905)는, 표시부(906)에 표시시키는 프로그램의 영상 데이터나, 네트워크를 통해서 공급되는 애플리케이션에 기초하는 처리에 의한 화상 데이터 등을 생성한다. 또한, 영상 신호 처리부(905)는 항목의 선택 등의 메뉴 화면 등을 표시하기 위한 영상 데이터를 생성하고, 그것을 프로그램의 영상 데이터에 중첩한다. 영상 신호 처리부(905)는, 이와 같이 하여 생성한 영상 데이터에 기초하여 구동 신호를 생성하여 표시부(906)를 구동한다.
표시부(906)는, 영상 신호 처리부(905)로부터의 구동 신호에 기초하여 표시 디바이스(예를 들어 액정 표시 소자 등)를 구동하여, 프로그램의 영상 등을 표시시킨다.
음성 신호 처리부(907)는, 음성 데이터에 대하여 노이즈 제거 등의 소정의 처리를 실시하고, 처리 후의 음성 데이터의 D/A 변환 처리나 증폭 처리를 행하여 스피커(908)에 공급함으로써 음성 출력을 행한다.
외부 인터페이스부(909)는 외부 기기나 네트워크와 접속하기 위한 인터페이스이며, 영상 데이터나 음성 데이터 등의 데이터 송수신을 행한다.
제어부(910)에는 유저 인터페이스부(911)가 접속되어 있다. 유저 인터페이스부(911)는 조작 스위치나 리모트 컨트롤 신호 수신부 등으로 구성되어 있고, 유저 조작에 따른 조작 신호를 제어부(910)에 공급한다.
제어부(910)는 CPU(Central Processing Unit)나 메모리 등을 사용하여 구성되어 있다. 메모리는 CPU에 의해 실행되는 프로그램이나 CPU가 처리를 행하는 데 있어서 필요한 각종 데이터, EPG 데이터, 네트워크를 통해서 취득된 데이터 등을 기억한다. 메모리에 기억되어 있는 프로그램은 텔레비전 장치(900)의 기동 시 등의 소정 타이밍에 CPU에 의해 판독되어 실행된다. CPU는 프로그램을 실행함으로써, 텔레비전 장치(900)가 유저 조작에 따른 동작으로 되도록 각 부를 제어한다.
또한, 텔레비전 장치(900)에서는, 튜너(902), 디멀티플렉서(903), 영상 신호 처리부(905), 음성 신호 처리부(907), 외부 인터페이스부(909) 등과 제어부(910)를 접속하기 위해서 버스(912)가 설치되어 있다.
이와 같이 구성된 텔레비전 장치에서는 디코더(904)에 본원의 복호 장치(복호 방법)의 기능이 설치된다. 이 때문에, 참조 화상을 특정하는 정보에 관한 정보의 정보량을 삭감한 부호화 스트림을 복호할 수 있다.
<휴대 전화기의 구성예>
도 64는 본 기술을 적용한 휴대 전화기의 개략 구성을 예시하고 있다. 휴대 전화기(920)는 통신부(922), 음성 코덱(923), 카메라부(926), 화상 처리부(927), 다중 분리부(928), 기록 재생부(929), 표시부(930), 제어부(931)를 갖고 있다. 이들은 버스(933)를 통해서 서로 접속되어 있다.
또한, 통신부(922)에는 안테나(921)가 접속되어 있고, 음성 코덱(923)에는 스피커(924)와 마이크로폰(925)이 접속되어 있다. 또한 제어부(931)에는 조작부(932)가 접속되어 있다.
휴대 전화기(920)는, 음성 통화 모드나 데이터 통신 모드 등의 각종 모드에서, 음성 신호의 송수신, 전자 메일이나 화상 데이터의 송수신, 화상 촬영 또는 데이터 기록 등의 각종 동작을 행한다.
음성 통화 모드에서, 마이크로폰(925)에 의해 생성된 음성 신호는, 음성 코덱(923)에 의해 음성 데이터로의 변환이나 데이터 압축이 행해져 통신부(922)에 공급된다. 통신부(922)는 음성 데이터의 변조 처리나 주파수 변환 처리 등을 행하여, 송신 신호를 생성한다. 또한, 통신부(922)는 송신 신호를 안테나(921)에 공급하여 도시하지 않은 기지국에 송신한다. 또한, 통신부(922)는 안테나(921)로 수신한 수신 신호의 증폭이나 주파수 변환 처리 및 복조 처리 등을 행하고, 얻어진 음성 데이터를 음성 코덱(923)에 공급한다. 음성 코덱(923)은 음성 데이터의 데이터 신장이나 아날로그 음성 신호로의 변환을 행하여 스피커(924)에 출력한다.
또한, 데이터 통신 모드에서, 메일 송신을 행하는 경우, 제어부(931)는 조작부(932)의 조작에 의해 입력된 문자 데이터를 접수하여, 입력된 문자를 표시부(930)에 표시한다. 또한, 제어부(931)는, 조작부(932)에 있어서의 유저 지시 등에 기초하여 메일 데이터를 생성하여 통신부(922)에 공급한다. 통신부(922)는, 메일 데이터의 변조 처리나 주파수 변환 처리 등을 행하고, 얻어진 송신 신호를 안테나(921)로부터 송신한다. 또한, 통신부(922)는, 안테나(921)로 수신한 수신 신호의 증폭이나 주파수 변환 처리 및 복조 처리 등을 행하여, 메일 데이터를 복원한다. 이 메일 데이터를, 표시부(930)에 공급하여, 메일 내용의 표시를 행한다.
또한, 휴대 전화기(920)는, 수신한 메일 데이터를, 기록 재생부(929)에서 기억 매체에 기억시키는 것도 가능하다. 기억 매체는 재기입 가능한 임의의 기억 매체이다. 예를 들어, 기억 매체는 RAM이나 내장형 플래시 메모리 등의 반도체 메모리, 하드디스크, 자기 디스크, 광자기 디스크, 광 디스크, USB 메모리 또는 메모리 카드 등의 리무버블 미디어이다.
데이터 통신 모드에서 화상 데이터를 송신하는 경우, 카메라부(926)에서 생성된 화상 데이터를 화상 처리부(927)에 공급한다. 화상 처리부(927)는 화상 데이터의 부호화 처리를 행하여, 부호화 데이터를 생성한다.
다중 분리부(928)는 화상 처리부(927)에서 생성된 부호화 데이터와, 음성 코덱(923)으로부터 공급된 음성 데이터를 소정의 방식으로 다중화하여 통신부(922)에 공급한다. 통신부(922)는 다중화 데이터의 변조 처리나 주파수 변환 처리 등을 행하고, 얻어진 송신 신호를 안테나(921)로부터 송신한다. 또한, 통신부(922)는 안테나(921)로 수신한 수신 신호의 증폭이나 주파수 변환 처리 및 복조 처리 등을 행하여, 다중화 데이터를 복원한다. 이 다중화 데이터를 다중 분리부(928)에 공급한다. 다중 분리부(928)는 다중화 데이터의 분리를 행하여, 부호화 데이터를 화상 처리부(927), 음성 데이터를 음성 코덱(923)에 공급한다. 화상 처리부(927)는 부호화 데이터의 복호화 처리를 행하여, 화상 데이터를 생성한다. 이 화상 데이터를 표시부(930)에 공급하여, 수신한 화상의 표시를 행한다. 음성 코덱(923)은 음성 데이터를 아날로그 음성 신호로 변환하여 스피커(924)에 공급하여, 수신한 음성을 출력한다.
이와 같이 구성된 휴대 전화 장치에서는, 화상 처리부(927)에 본원의 부호화 장치 및 복호 장치(부호화 방법 및 복호 방법)의 기능이 설치된다. 이 때문에, 참조 화상을 특정하는 정보에 관한 정보의 정보량을 삭감한 부호화 스트림을 복호할 수 있다.
<기록 재생 장치의 구성예>
도 65는 본 기술을 적용한 기록 재생 장치의 개략 구성을 예시하고 있다. 기록 재생 장치(940)는, 예를 들어 수신한 방송 프로그램의 오디오 데이터와 비디오 데이터를 기록 매체에 기록하고, 그 기록된 데이터를 유저의 지시에 따른 타이밍에 유저에게 제공한다. 또한, 기록 재생 장치(940)는 예를 들어 다른 장치로부터 오디오 데이터나 비디오 데이터를 취득하고, 그들을 기록 매체에 기록시킬 수도 있다. 또한, 기록 재생 장치(940)는 기록 매체에 기록되어 있는 오디오 데이터나 비디오 데이터를 복호하여 출력함으로써, 모니터 장치 등에 있어서 화상 표시나 음성 출력을 행할 수 있도록 한다.
기록 재생 장치(940)는 튜너(941), 외부 인터페이스부(942), 인코더(943), HDD(Hard Disk Drive)부(944), 디스크 드라이브(945), 셀렉터(946), 디코더(947), OSD(On-Screen Display)부(948), 제어부(949), 유저 인터페이스부(950)를 갖고 있다.
튜너(941)는 도시하지 않은 안테나로 수신된 방송 신호로부터 원하는 채널을 선국한다. 튜너(941)는 원하는 채널의 수신 신호를 복조하여 얻어진 부호화 비트 스트림을 셀렉터(946)에 출력한다.
외부 인터페이스부(942)는 IEEE1394 인터페이스, 네트워크 인터페이스부, USB 인터페이스, 플래시 메모리 인터페이스 등 중 적어도 어느 하나로 구성되어 있다. 외부 인터페이스부(942)는 외부 기기나 네트워크, 메모리 카드 등과 접속하기 위한 인터페이스이며, 기록하는 영상 데이터나 음성 데이터 등의 데이터 수신을 행한다.
인코더(943)는 외부 인터페이스부(942)로부터 공급된 영상 데이터나 음성 데이터가 부호화되어 있지 않을 때 소정의 방식으로 부호화를 행하고, 부호화 비트 스트림을 셀렉터(946)에 출력한다.
HDD부(944)는 영상이나 음성 등의 콘텐츠 데이터, 각종 프로그램이나 그 밖의 데이터 등을 내장의 하드디스크에 기록하고, 또한 재생 시 등에 그들을 당해 하드디스크로부터 판독한다.
디스크 드라이브(945)는 장착되어 있는 광 디스크에 대한 신호의 기록 및 재생을 행한다. 광 디스크, 예를 들어 DVD 디스크(DVD-Video, DVD-RAM, DVD-R, DVD-RW, DVD+R, DVD+RW 등)나 Blu-ray(등록 상표) 디스크 등이다.
셀렉터(946)는, 영상이나 음성의 기록 시에는 튜너(941) 또는 인코더(943)로부터의 어느 하나의 부호화 비트 스트림을 선택하여, HDD부(944)나 디스크 드라이브(945) 중 어느 하나에 공급한다. 또한, 셀렉터(946)는, 영상이나 음성의 재생 시에, HDD부(944) 또는 디스크 드라이브(945)로부터 출력된 부호화 비트 스트림을 디코더(947)에 공급한다.
디코더(947)는 부호화 비트 스트림의 복호화 처리를 행한다. 디코더(947)는 복호 처리화를 행함으로써 생성된 영상 데이터를 OSD부(948)에 공급한다. 또한, 디코더(947)는 복호 처리화를 행함으로써 생성된 음성 데이터를 출력한다.
OSD부(948)는 항목의 선택 등의 메뉴 화면 등을 표시하기 위한 영상 데이터를 생성하고, 그것을 디코더(947)로부터 출력된 영상 데이터에 중첩하여 출력한다.
제어부(949)에는 유저 인터페이스부(950)가 접속되어 있다. 유저 인터페이스부(950)는 조작 스위치나 리모트 컨트롤 신호 수신부 등으로 구성되어 있고, 유저 조작에 따른 조작 신호를 제어부(949)에 공급한다.
제어부(949)는 CPU나 메모리 등을 사용하여 구성되어 있다. 메모리는 CPU에 의해 실행되는 프로그램이나 CPU가 처리를 행하는 데 있어서 필요한 각종 데이터를 기억한다. 메모리에 기억되어 있는 프로그램은 기록 재생 장치(940)의 기동 시 등의 소정 타이밍에 CPU에 의해 판독되어 실행된다. CPU는 프로그램을 실행함으로써, 기록 재생 장치(940)가 유저 조작에 따른 동작으로 되도록 각 부를 제어한다.
이와 같이 구성된 기록 재생 장치에서는, 디코더(947)에 본원의 복호 장치(복호 방법)의 기능이 설치된다. 이 때문에, 참조 화상을 특정하는 정보에 관한 정보의 정보량을 삭감한 부호화 스트림을 복호할 수 있다.
<촬상 장치의 구성예>
도 66은 본 기술을 적용한 촬상 장치의 개략 구성을 예시하고 있다. 촬상 장치(960)는 피사체를 촬상하여, 피사체의 화상을 표시부에 표시시키거나, 그것을 화상 데이터로 하여 기록 매체에 기록한다.
촬상 장치(960)는 광학 블록(961), 촬상부(962), 카메라 신호 처리부(963), 화상 데이터 처리부(964), 표시부(965), 외부 인터페이스부(966), 메모리부(967), 미디어 드라이브(968), OSD부(969), 제어부(970)를 갖고 있다. 또한, 제어부(970)에는 유저 인터페이스부(971)가 접속되어 있다. 또한, 화상 데이터 처리부(964)나 외부 인터페이스부(966), 메모리부(967), 미디어 드라이브(968), OSD부(969), 제어부(970) 등은 버스(972)를 통해서 접속되어 있다.
광학 블록(961)은 포커스 렌즈나 조리개 기구 등을 사용하여 구성되어 있다. 광학 블록(961)은 피사체의 광학상을 촬상부(962)의 촬상면에 결상시킨다. 촬상부(962)는 CCD 또는 CMOS 이미지 센서를 사용하여 구성되어 있고, 광전 변환에 의해 광학상에 따른 전기 신호를 생성하여 카메라 신호 처리부(963)에 공급한다.
카메라 신호 처리부(963)는 촬상부(962)로부터 공급된 전기 신호에 대하여 니 보정이나 감마 보정, 색 보정 등의 다양한 카메라 신호 처리를 행한다. 카메라 신호 처리부(963)는 카메라 신호 처리 후의 화상 데이터를 화상 데이터 처리부(964)에 공급한다.
화상 데이터 처리부(964)는 카메라 신호 처리부(963)로부터 공급된 화상 데이터의 부호화 처리를 행한다. 화상 데이터 처리부(964)는 부호화 처리를 행함으로써 생성된 부호화 데이터를 외부 인터페이스부(966)나 미디어 드라이브(968)에 공급한다. 또한, 화상 데이터 처리부(964)는 외부 인터페이스부(966)나 미디어 드라이브(968)로부터 공급된 부호화 데이터의 복호화 처리를 행한다. 화상 데이터 처리부(964)는 복호화 처리를 행함으로써 생성된 화상 데이터를 표시부(965)에 공급한다. 또한, 화상 데이터 처리부(964)는 카메라 신호 처리부(963)로부터 공급된 화상 데이터를 표시부(965)에 공급하는 처리나, OSD부(969)로부터 취득한 표시용 데이터를, 화상 데이터에 중첩시켜 표시부(965)에 공급한다.
OSD부(969)는 기호, 문자 또는 도형을 포함하는 메뉴 화면이나 아이콘 등의 표시용 데이터를 생성하여 화상 데이터 처리부(964)에 출력한다.
외부 인터페이스부(966)는 예를 들어 USB 입출력 단자 등으로 구성되며, 화상의 인쇄를 행하는 경우에, 프린터와 접속된다. 또한, 외부 인터페이스부(966)에는 필요에 따라서 드라이브가 접속되고, 자기 디스크, 광 디스크 등의 리무버블 미디어가 적절히 장착되며, 그들로부터 판독된 컴퓨터 프로그램이, 필요에 따라서, 인스톨된다. 또한, 외부 인터페이스부(966)는 LAN이나 인터넷 등의 소정의 네트워크에 접속되는 네트워크 인터페이스를 갖는다. 제어부(970)는, 예를 들어 유저 인터페이스부(971)로부터의 지시에 따라서, 미디어 드라이브(968)로부터 부호화 데이터를 판독하고, 그것을 외부 인터페이스부(966)로부터, 네트워크를 통해서 접속되는 다른 장치에 공급시킬 수 있다. 또한, 제어부(970)는, 네트워크를 통해서 다른 장치로부터 공급되는 부호화 데이터나 화상 데이터를, 외부 인터페이스부(966)를 통해서 취득하고, 그것을 화상 데이터 처리부(964)에 공급하거나 할 수 있다.
미디어 드라이브(968)에 의해 구동되는 기록 미디어로서는, 예를 들어 자기 디스크, 광자기 디스크, 광 디스크 또는 반도체 메모리 등의, 판독 기입 가능한 임의의 리무버블 미디어가 사용된다. 또한, 기록 미디어는 리무버블 미디어로서의 종류도 임의이며, 테이프 디바이스이어도 되고, 디스크이어도 되고, 메모리 카드이어도 된다. 물론, 비접촉 IC(Integrated Circuit) 카드 등이어도 된다.
또한, 미디어 드라이브(968)와 기록 미디어를 일체화하여, 예를 들어 내장형 하드디스크 드라이브나 SSD(Solid State Drive) 등과 같이, 비가반성의 기억 매체에 의해 구성되도록 해도 된다.
제어부(970)는 CPU를 사용하여 구성되어 있다. 메모리부(967)는 제어부(970)에 의해 실행되는 프로그램이나 제어부(970)가 처리를 행하는 데 있어서 필요한 각종 데이터 등을 기억한다. 메모리부(967)에 기억되어 있는 프로그램은, 촬상 장치(960)의 기동 시 등의 소정 타이밍에 제어부(970)에 의해 판독되어 실행된다. 제어부(970)는 프로그램을 실행함으로써, 촬상 장치(960)가 유저 조작에 따른 동작으로 되도록 각 부를 제어한다.
이와 같이 구성된 촬상 장치에서는, 화상 데이터 처리부(964)에 본원의 부호화 장치 및 복호 장치(부호화 방법 및 복호 방법)의 기능이 설치된다. 이 때문에, 참조 화상을 특정하는 정보에 관한 정보의 정보량을 삭감할 수 있다. 또한, 참조 화상을 특정하는 정보에 관한 정보의 정보량을 삭감한 부호화 스트림을 복호할 수 있다.
<계층 부호화의 응용예>
(제1 시스템)
다음에, 계층 부호화(스케일러블 부호화)된 스케일러블 부호화 데이터의 구체적인 이용예에 대해서 설명한다. 스케일러블 부호화는, 예를 들어 도 67에 도시된 예와 같이, 전송하는 데이터의 선택을 위해서 이용된다.
도 67에 도시된 데이터 전송 시스템(1000)에 있어서, 배신 서버(1002)는, 스케일러블 부호화 데이터 기억부(1001)에 기억되어 있는 스케일러블 부호화 데이터를 판독하고, 네트워크(1003)를 통해서, 퍼스널 컴퓨터(1004), AV 기기(1005), 태블릿 디바이스(1006) 및 휴대 전화기(1007) 등의 단말 장치에 배신한다.
그때, 배신 서버(1002)는, 단말 장치의 능력이나 통신 환경 등에 따라서, 적절한 품질의 부호화 데이터를 선택해서 전송한다. 배신 서버(1002)가 불필요하게 고품질의 데이터를 전송해도, 단말 장치에 있어서 고화질의 화상이 얻어진다고는 할 수 없고, 지연이나 오버플로우의 발생 요인으로 될 우려가 있다. 또한, 불필요하게 통신 대역을 점유하거나, 단말 장치의 부하를 불필요하게 증대시키거나 해 버릴 우려도 있다. 반대로, 배신 서버(1002)가 불필요하게 저품질의 데이터를 전송해도, 단말 장치에 있어서 충분한 화질의 화상을 얻을 수 없을 우려가 있다. 그 때문에, 배신 서버(1002)는, 스케일러블 부호화 데이터 기억부(1001)에 기억되어 있는 스케일러블 부호화 데이터를, 적절히, 단말 장치의 능력이나 통신 환경 등에 대하여 적절한 품질의 부호화 데이터로서 판독하고, 전송한다.
예를 들어, 스케일러블 부호화 데이터 기억부(1001)는, 스케일러블하게 부호화된 스케일러블 부호화 데이터(BL+EL)(1011)를 기억한다고 하자. 이 스케일러블 부호화 데이터(BL+EL)(1011)는 베이스 레이어와 인핸스먼트 레이어의 양쪽을 포함하는 부호화 데이터이며, 복호함으로써, 베이스 레이어의 화상 및 인핸스먼트 레이어의 화상의 양쪽을 얻을 수 있는 데이터이다.
배신 서버(1002)는, 데이터를 전송하는 단말 장치의 능력이나 통신 환경 등에 따라서, 적절한 레이어를 선택하고, 그 레이어의 데이터를 판독한다. 예를 들어, 배신 서버(1002)는, 처리 능력이 높은 퍼스널 컴퓨터(1004)나 태블릿 디바이스(1006)에 대해서는, 고품질의 스케일러블 부호화 데이터(BL+EL)(1011)를 스케일러블 부호화 데이터 기억부(1001)로부터 판독하고, 그대로 전송한다. 이에 반해, 예를 들어 배신 서버(1002)는, 처리 능력이 낮은 AV 기기(1005)나 휴대 전화기(1007)에 대해서는, 스케일러블 부호화 데이터(BL+EL)(1011)로부터 베이스 레이어의 데이터를 추출하고, 스케일러블 부호화 데이터(BL+EL)(1011)와 동일한 콘텐츠의 데이터이지만, 스케일러블 부호화 데이터(BL+EL)(1011)보다도 저품질의 스케일러블 부호화 데이터(BL)(1012)로서 전송한다.
이와 같이 스케일러블 부호화 데이터를 사용함으로써, 데이터량을 용이하게 조정할 수 있으므로, 지연이나 오버플로우의 발생을 억제하거나, 단말 장치나 통신 매체의 부하의 불필요한 증대를 억제하거나 할 수 있다. 또한, 스케일러블 부호화 데이터(BL+EL)(1011)는 레이어간의 용장성이 저감되어 있으므로, 각 레이어의 부호화 데이터를 개별의 데이터로 하는 경우보다도 그 데이터량을 저감시킬 수 있다. 따라서, 스케일러블 부호화 데이터 기억부(1001)의 기억 영역을 보다 효율적으로 사용할 수 있다.
또한, 퍼스널 컴퓨터(1004) 내지 휴대 전화기(1007)와 같이, 단말 장치에는 다양한 장치를 적용할 수 있으므로, 단말 장치의 하드웨어의 성능은 장치에 따라 상이하다. 또한, 단말 장치가 실행하는 애플리케이션도 다양하므로, 그 소프트웨어의 능력도 다양하다. 또한, 통신 매체로 되는 네트워크(1003)도, 예를 들어 인터넷이나 LAN(Local Area Network) 등, 유선 혹은 무선, 또는 그 양쪽을 포함하는 모든 통신 회선망을 적용할 수 있어, 그 데이터 전송 능력은 다양하다. 또한, 다른 통신 등에 의해서도 변화할 우려가 있다.
따라서, 배신 서버(1002)는, 데이터 전송을 개시하기 전에, 데이터의 전송처로 되는 단말 장치와 통신을 행하여, 단말 장치의 하드웨어 성능이나, 단말 장치가 실행하는 애플리케이션(소프트웨어)의 성능 등과 같은 단말 장치의 능력에 관한 정보, 및, 네트워크(1003)의 이용 가능 대역폭 등의 통신 환경에 관한 정보를 얻도록 해도 된다. 그리고, 배신 서버(1002)가, 여기에서 얻은 정보를 기초로, 적절한 레이어를 선택하도록 해도 된다.
또한, 레이어의 추출은 단말 장치에 있어서 행하도록 해도 된다. 예를 들어, 퍼스널 컴퓨터(1004)가, 전송된 스케일러블 부호화 데이터(BL+EL)(1011)를 복호하여, 베이스 레이어의 화상을 표시해도 되고, 인핸스먼트 레이어의 화상을 표시해도 된다. 또한, 예를 들어 퍼스널 컴퓨터(1004)가, 전송된 스케일러블 부호화 데이터(BL+EL)(1011)로부터, 베이스 레이어의 스케일러블 부호화 데이터(BL)(1012)를 추출하여, 기억하거나, 다른 장치에 전송하거나, 복호하여 베이스 레이어의 화상을 표시하거나 하도록 해도 된다.
물론, 스케일러블 부호화 데이터 기억부(1001), 배신 서버(1002), 네트워크(1003) 및 단말 장치의 수는 모두 임의이다. 또한, 이상에 있어서는, 배신 서버(1002)가 데이터를 단말 장치에 전송하는 예에 대해서 설명하였지만, 이용예는 이것에 한정되지 않는다. 데이터 전송 시스템(1000)은, 스케일러블 부호화된 부호화 데이터를 단말 장치에 전송할 때, 단말 장치의 능력이나 통신 환경 등에 따라서, 적절한 레이어를 선택해서 전송하는 시스템이면, 임의의 시스템에 적용할 수 있다.
(제2 시스템)
또한, 스케일러블 부호화는, 예를 들어 도 68에 도시된 예와 같이, 복수의 통신 매체를 통한 전송을 위해서 이용된다.
도 68에 도시된 데이터 전송 시스템(1100)에 있어서, 방송국(1101)은, 지상파 방송(1111)에 의해, 베이스 레이어의 스케일러블 부호화 데이터(BL)(1121)를 전송한다. 또한, 방송국(1101)은, 유선 혹은 무선 또는 그 양쪽의 통신망을 포함하는 임의의 네트워크(1112)를 통해서, 인핸스먼트 레이어의 스케일러블 부호화 데이터(EL)(1122)를 전송한다(예를 들어 패킷화하여 전송한다).
단말 장치(1102)는, 방송국(1101)이 방송하는 지상파 방송(1111)의 수신 기능을 갖고, 이 지상파 방송(1111)을 통해서 전송되는 베이스 레이어의 스케일러블 부호화 데이터(BL)(1121)를 수취한다. 또한, 단말 장치(1102)는 네트워크(1112)를 통한 통신을 행하는 통신 기능을 더 갖고, 이 네트워크(1112)를 통해서 전송되는 인핸스먼트 레이어의 스케일러블 부호화 데이터(EL)(1122)를 수취한다.
단말 장치(1102)는, 예를 들어 유저 지시 등에 따라서, 지상파 방송(1111)을 통해서 취득한 베이스 레이어의 스케일러블 부호화 데이터(BL)(1121)를, 복호해서 베이스 레이어의 화상을 얻거나, 기억하거나, 다른 장치에 전송하거나 한다.
또한, 단말 장치(1102)는, 예를 들어 유저 지시 등에 따라서, 지상파 방송(1111)을 통해서 취득한 베이스 레이어의 스케일러블 부호화 데이터(BL)(1121)와, 네트워크(1112)를 통해서 취득한 인핸스먼트 레이어의 스케일러블 부호화 데이터(EL)(1122)를 합성하여, 스케일러블 부호화 데이터(BL+EL)를 얻거나, 그것을 복호해서 인핸스먼트 레이어의 화상을 얻거나, 기억하거나, 다른 장치에 전송하거나 한다.
이상과 같이, 스케일러블 부호화 데이터는, 예를 들어 레이어마다 상이한 통신 매체를 통해서 전송시킬 수 있다. 따라서, 부하를 분산시킬 수 있어, 지연이나 오버플로우의 발생을 억제할 수 있다.
또한, 상황에 따라서, 전송에 사용하는 통신 매체를, 레이어마다 선택할 수 있도록 해도 된다. 예를 들어, 데이터량이 비교적 많은 베이스 레이어의 스케일러블 부호화 데이터(BL)(1121)를 대역폭이 넓은 통신 매체를 통해서 전송시키고, 데이터량이 비교적 적은 인핸스먼트 레이어의 스케일러블 부호화 데이터(EL)(1122)를 대역폭이 좁은 통신 매체를 통해서 전송시키도록 해도 된다. 또한, 예를 들어 인핸스먼트 레이어의 스케일러블 부호화 데이터(EL)(1122)를 전송하는 통신 매체를, 네트워크(1112)로 할 것인지, 지상파 방송(1111)으로 할 것인지를, 네트워크(1112)의 이용 가능 대역폭에 따라서 전환하도록 해도 된다. 물론, 임의의 레이어의 데이터에 대해서도 마찬가지이다.
이와 같이 제어함으로써, 데이터 전송에 있어서의 부하의 증대를 보다 억제할 수 있다.
물론, 레이어수는 임의이며, 전송에 이용하는 통신 매체의 수도 임의이다. 또한, 데이터 배신처로 되는 단말 장치(1102)의 수도 임의이다. 또한, 이상에 있어서는, 방송국(1101)으로부터의 방송을 예로 설명하였지만, 이용예는 이것에 한정되지 않는다. 데이터 전송 시스템(1100)은, 스케일러블 부호화된 부호화 데이터를 레이어를 단위로 하여 복수로 분할하고, 복수의 회선을 통해서 전송하는 시스템이면, 임의의 시스템에 적용할 수 있다.
(제3 시스템)
또한, 스케일러블 부호화는, 예를 들어 도 69에 도시된 예와 같이, 부호화 데이터의 기억에 이용된다.
도 69에 도시된 촬상 시스템(1200)에 있어서, 촬상 장치(1201)는 피사체(1211)를 촬상해서 얻어진 화상 데이터를 스케일러블 부호화하고, 스케일러블 부호화 데이터(BL+EL)(1221)로서, 스케일러블 부호화 데이터 기억 장치(1202)에 공급한다.
스케일러블 부호화 데이터 기억 장치(1202)는, 촬상 장치(1201)로부터 공급되는 스케일러블 부호화 데이터(BL+EL)(1221)를, 상황에 따른 품질로 기억한다. 예를 들어, 통상 시의 경우, 스케일러블 부호화 데이터 기억 장치(1202)는, 스케일러블 부호화 데이터(BL+EL)(1221)로부터 베이스 레이어의 데이터를 추출하고, 저 품질이며 데이터량이 적은 베이스 레이어의 스케일러블 부호화 데이터(BL)(1222)로서 기억한다. 이에 반해, 예를 들어 주목 시의 경우, 스케일러블 부호화 데이터 기억 장치(1202)는, 고품질이며 데이터량이 많은 스케일러블 부호화 데이터(BL+EL)(1221) 그대로 기억한다.
이와 같이 함으로써, 스케일러블 부호화 데이터 기억 장치(1202)는, 필요한 경우만, 화상을 고화질로 보존할 수 있으므로, 화질 열화에 의한 화상의 가치의 저감을 억제하면서, 데이터량의 증대를 억제할 수 있어, 기억 영역의 이용 효율을 향상시킬 수 있다.
예를 들어, 촬상 장치(1201)가 감시 카메라인 것으로 하자. 촬상 화상에 감시 대상(예를 들어 침입자)이 찍혀 있지 않은 경우(통상 시의 경우), 촬상 화상의 내용은 중요하지 않을 가능성이 높으므로, 데이터량의 저감이 우선되어, 그 화상 데이터(스케일러블 부호화 데이터)는 저품질로 기억된다. 이에 반해, 촬상 화상에 감시 대상이 피사체(1211)로서 찍혀 있는 경우(주목 시의 경우), 그 촬상 화상의 내용은 중요할 가능성이 높으므로, 화질이 우선되어, 그 화상 데이터(스케일러블 부호화 데이터)는 고품질로 기억된다.
또한, 통상 시인지 주목 시인지는, 예를 들어 스케일러블 부호화 데이터 기억 장치(1202)가 화상을 해석함으로써 판정해도 된다. 또한, 촬상 장치(1201)가 판정하고, 그 판정 결과를 스케일러블 부호화 데이터 기억 장치(1202)에 전송하도록 해도 된다.
또한, 통상 시인지 주목 시인지의 판정 기준은 임의이며, 판정 기준으로 하는 화상의 내용은 임의이다. 물론, 화상의 내용 이외의 조건을 판정 기준으로 할 수도 있다. 예를 들어, 수록한 음성의 크기나 파형 등에 따라서 전환하도록 해도 되고, 소정 시간마다 전환하도록 해도 되고, 유저 지시 등의 외부로부터의 지시에 의해 전환하도록 해도 된다.
또한, 이상에 있어서는, 통상 시와 주목 시의 2개의 상태를 전환하는 예를 설명하였지만, 상태의 수는 임의이며, 예를 들어 통상 시, 약간 주목 시, 주목 시, 매우 주목 시 등과 같이, 3개 이상의 상태를 전환하도록 해도 된다. 단, 이 전환하는 상태의 상한수는 스케일러블 부호화 데이터의 레이어수에 의존한다.
또한, 촬상 장치(1201)가, 스케일러블 부호화의 레이어수를, 상태에 따라서 결정하도록 해도 된다. 예를 들어, 통상 시의 경우, 촬상 장치(1201)가, 저품질이며 데이터량이 적은 베이스 레이어의 스케일러블 부호화 데이터(BL)(1222)를 생성하여, 스케일러블 부호화 데이터 기억 장치(1202)에 공급하도록 해도 된다. 또한, 예를 들어 주목 시의 경우, 촬상 장치(1201)가, 고품질이며 데이터량이 많은 베이스 레이어의 스케일러블 부호화 데이터(BL+EL)(1221)를 생성하여, 스케일러블 부호화 데이터 기억 장치(1202)에 공급하도록 해도 된다.
이상에 있어서는, 감시 카메라를 예로 설명하였지만, 이 촬상 시스템(1200)의 용도는 임의이며, 감시 카메라에 한정되지 않는다.
또한, LCU란, 최대 사이즈의 CU(Coding Unit)이며, CTU(Coding Tree Unit)는 LCU의 CTB(Coding Tree Block)와, 그 LCU 베이스(레벨)로 처리할 때의 파라미터를 포함하는 단위이다. 또한, CTU를 구성하는 CU는 CB(Coding Block)와, 그 CU 베이스(레벨)로 처리할 때의 파라미터를 포함하는 단위이다.
<실시의 그 밖의 예>
이상에 있어서 본 기술을 적용하는 장치나 시스템 등의 예를 설명하였지만, 본 기술은 이에 한정되지 않고, 이러한 장치 또는 시스템을 구성하는 장치에 탑재하는 모든 구성, 예를 들어 시스템 LSI(Large Scale Integration) 등으로서의 프로세서, 복수의 프로세서 등을 사용하는 모듈, 복수의 모듈 등을 사용하는 유닛, 유닛에 또한 그 밖의 기능을 부가한 세트 등(즉, 장치의 일부 구성)으로서 실시할 수도 있다.
(비디오 세트의 구성예)
본 기술을 세트로서 실시하는 경우의 예에 대해서, 도 70을 참조하여 설명한다. 도 70은 본 기술을 적용한 비디오 세트의 개략적인 구성의 일례를 도시하고 있다.
최근, 전자 기기의 다기능화가 진행되고 있으며, 그 개발이나 제조에 있어서, 그 일부의 구성을 판매나 제공 등으로서 실시하는 경우, 1기능을 갖는 구성으로서 실시를 행하는 경우뿐만 아니라, 관련되는 기능을 갖는 복수의 구성을 조합하여, 복수의 기능을 갖는 1세트로서 실시를 행하는 경우도 많이 볼 수 있게 되었다.
도 70에 도시된 비디오 세트(1300)는 이러한 다기능화된 구성이며, 화상의 부호화나 복호(어느 한쪽이어도 되고, 양쪽이어도 됨)에 관한 기능을 갖는 디바이스에, 그 기능에 관련되는 그 밖의 기능을 갖는 디바이스를 조합한 것이다.
도 70에 도시된 바와 같이, 비디오 세트(1300)는 비디오 모듈(1311), 외부 메모리(1312), 파워 매니지먼트 모듈(1313) 및 프론트 엔드 모듈(1314) 등의 모듈군과, 커넥티비티(1321), 카메라(1322) 및 센서(1323) 등의 관련되는 기능을 갖는 디바이스를 갖는다.
모듈은 서로 관련되는 몇 가지의 부품적 기능을 통합하여, 통일성이 있는 기능을 가진 부품으로 한 것이다. 구체적인 물리적 구성은 임의이지만, 예를 들어 각각 기능을 갖는 복수의 프로세서, 저항이나 콘덴서 등의 전자 회로 소자, 그 밖의 디바이스 등을 배선 기판 등에 배치하여 일체화한 것이 생각된다. 또한, 모듈에 다른 모듈이나 프로세서 등을 조합하여 새로운 모듈로 하는 것도 생각된다.
도 70의 예의 경우, 비디오 모듈(1311)은 화상 처리에 관한 기능을 갖는 구성을 조합한 것이며, 어플리케이션 프로세서, 비디오 프로세서, 브로드밴드 모뎀(1333) 및 RF 모듈(1334)을 갖는다.
프로세서는, 소정의 기능을 갖는 구성을 SoC(System On a Chip)에 의해 반도체 칩에 집적한 것이며, 예를 들어 시스템 LSI(Large Scale Integration) 등이라 칭해지는 것도 있다. 이 소정의 기능을 갖는 구성은, 논리 회로(하드웨어 구성)이어도 되고, CPU, ROM, RAM 등과, 그들을 사용하여 실행되는 프로그램(소프트웨어 구성)이어도 되고, 그 양쪽을 조합한 것이어도 된다. 예를 들어, 프로세서가, 논리 회로와 CPU, ROM, RAM 등을 갖고, 기능의 일부를 논리 회로(하드웨어 구성)에 의해 실현하고, 그 밖의 기능을 CPU에 있어서 실행되는 프로그램(소프트웨어 구성)에 의해 실현하도록 해도 된다.
도 70의 어플리케이션 프로세서(1331)는 화상 처리에 관한 애플리케이션을 실행하는 프로세서이다. 이 어플리케이션 프로세서(1331)에 있어서 실행되는 애플리케이션은 소정의 기능을 실현하기 위해서, 연산 처리를 행할 뿐만 아니라, 예를 들어 비디오 프로세서(1332) 등, 비디오 모듈(1311) 내외의 구성을 필요에 따라서 제어할 수도 있다.
비디오 프로세서(1332)는 화상의 부호화ㆍ복호(그 한쪽 혹은 양쪽)에 관한 기능을 갖는 프로세서이다.
브로드밴드 모뎀(1333)은 인터넷이나 공중 전화 회선망 등의 광대역의 회선을 통해서 행해지는 유선 혹은 무선(또는 그 양쪽)의 광대역 통신에 관한 처리를 행하는 프로세서(혹은 모듈)이다. 예를 들어, 브로드밴드 모뎀(1333)은, 송신하는 데이터(디지털 신호)를 디지털 변조하거나 하여 아날로그 신호로 변환하거나, 수신한 아날로그 신호를 복조하여 데이터(디지털 신호)로 변환하거나 한다. 예를 들어, 브로드밴드 모뎀(1333)은 비디오 프로세서(1332)가 처리하는 화상 데이터나 화상 데이터가 부호화된 스트림, 어플리케이션 프로그램, 설정 데이터 등, 임의의 정보를 디지털 변조ㆍ복조할 수 있다.
RF 모듈(1334)은, 안테나를 통해서 송수신되는 RF(Radio Frequency) 신호에 대하여, 주파수 변환, 변복조, 증폭, 필터 처리 등을 행하는 모듈이다. 예를 들어, RF 모듈(1334)은 브로드밴드 모뎀(1333)에 의해 생성된 기저 대역 신호에 대하여 주파수 변환 등을 행하여 RF 신호를 생성한다. 또한, 예를 들어 RF 모듈(1334)은 프론트 엔드 모듈(1314)을 통해서 수신된 RF 신호에 대하여 주파수 변환 등을 행하여 기저 대역 신호를 생성한다.
또한, 도 70에 있어서 점선(1341)으로 나타내어진 바와 같이, 어플리케이션 프로세서(1331)와 비디오 프로세서(1332)를 일체화하여, 하나의 프로세서로서 구성되도록 해도 된다.
외부 메모리(1312)는, 비디오 모듈(1311)의 외부에 설치된, 비디오 모듈(1311)에 의해 이용되는 기억 디바이스를 갖는 모듈이다. 이 외부 메모리(1312)의 기억 디바이스는, 어떤 물리 구성에 의해 실현하도록 해도 되지만, 일반적으로 프레임 단위의 화상 데이터와 같은 대용량의 데이터의 저장에 이용되는 경우가 많으므로, 예를 들어 DRAM(Dynamic Random Access Memory)과 같은 비교적 염가이며 대용량의 반도체 메모리에 의해 실현하는 것이 바람직하다.
파워 매니지먼트 모듈(1313)은 비디오 모듈(1311)(비디오 모듈(1311) 내의 각 구성)에의 전력 공급을 관리하고, 제어한다.
프론트 엔드 모듈(1314)은 RF 모듈(1334)에 대하여 프론트 엔드 기능(안테나측의 송수신단의 회로)을 제공하는 모듈이다. 도 70에 도시된 바와 같이, 프론트 엔드 모듈(1314)은, 예를 들어 안테나부(1351), 필터(1352) 및 증폭부(1353)를 갖는다.
안테나부(1351)는 무선 신호를 송수신하는 안테나 및 그 주변의 구성을 갖는다. 안테나부(1351)는 증폭부(1353)로부터 공급되는 신호를 무선 신호로서 송신하고, 수신한 무선 신호를 전기 신호(RF 신호)로서 필터(1352)에 공급한다. 필터(1352)는 안테나부(1351)를 통해서 수신된 RF 신호에 대하여 필터 처리 등을 행하고, 처리 후의 RF 신호를 RF 모듈(1334)에 공급한다. 증폭부(1353)는 RF 모듈(1334)로부터 공급되는 RF 신호를 증폭하여, 안테나부(1351)에 공급한다.
커넥티비티(1321)는 외부와의 접속에 관한 기능을 갖는 모듈이다. 커넥티비티(1321)의 물리 구성은 임의이다. 예를 들어, 커넥티비티(1321)는 브로드밴드 모뎀(1333)이 대응하는 통신 규격 이외의 통신 기능을 갖는 구성이나, 외부 입출력 단자 등을 갖는다.
예를 들어, 커넥티비티(1321)가 Bluetooth(등록 상표), IEEE 802.11(예를 들어 Wi-Fi(Wireless Fidelity, 등록 상표)), NFC(Near Field Communication), IrDA(InfraRed Data Association) 등의 무선 통신 규격에 준거하는 통신 기능을 갖는 모듈이나, 그 규격에 준거한 신호를 송수신하는 안테나 등을 갖도록 해도 된다. 또한, 예를 들어 커넥티비티(1321)가 USB(Universal Serial Bus), HDMI(등록 상표)(High-Definition Multimedia Interface) 등의 유선 통신 규격에 준거하는 통신 기능을 갖는 모듈이나, 그 규격에 준거한 단자를 갖도록 해도 된다. 또한, 예를 들어 커넥티비티(1321)가 아날로그 입출력 단자 등의 그 밖의 데이터(신호) 전송 기능 등을 갖도록 해도 된다.
또한, 커넥티비티(1321)가 데이터(신호)의 전송처의 디바이스를 포함하도록 해도 된다. 예를 들어, 커넥티비티(1321)가 자기 디스크, 광 디스크, 광자기 디스크 또는 반도체 메모리 등의 기록 매체에 대하여 데이터의 판독이나 기입을 행하는 드라이브(리무버블 미디어의 드라이브뿐만 아니라, 하드디스크, SSD(Solid State Drive), NAS(Network Attached Storage) 등도 포함함)를 갖도록 해도 된다. 또한, 커넥티비티(1321)가 화상이나 음성의 출력 디바이스(모니터나 스피커 등)를 갖도록 해도 된다.
카메라(1322)는 피사체를 촬상하고, 피사체의 화상 데이터를 얻는 기능을 갖는 모듈이다. 카메라(1322)의 촬상에 의해 얻어진 화상 데이터는, 예를 들어 비디오 프로세서(1332)에 공급되어 부호화된다.
센서(1323)는, 예를 들어 음성 센서, 초음파 센서, 광 센서, 조도 센서, 적외선 센서, 이미지 센서, 회전 센서, 각도 센서, 각속도 센서, 속도 센서, 가속도 센서, 경사 센서, 자기 식별 센서, 충격 센서, 온도 센서 등, 임의의 센서 기능을 갖는 모듈이다. 센서(1323)에 의해 검출된 데이터는, 예를 들어 어플리케이션 프로세서(1331)에 공급되어 애플리케이션 등에 의해 이용된다.
이상에 있어서 모듈로서 설명한 구성을 프로세서로서 실현하도록 해도 되고, 반대로 프로세서로서 설명한 구성을 모듈로서 실현하도록 해도 된다.
이상과 같은 구성의 비디오 세트(1300)에 있어서, 후술하는 바와 같이 비디오 프로세서(1332)에 본 기술을 적용할 수 있다. 따라서, 비디오 세트(1300)는 본 기술을 적용한 세트로서 실시할 수 있다.
(비디오 프로세서의 구성예)
도 71은 본 기술을 적용한 비디오 프로세서(1332)(도 70)의 개략적인 구성의 일례를 도시하고 있다.
도 71의 예의 경우, 비디오 프로세서(1332)는 비디오 신호 및 오디오 신호의 입력을 받아 이들을 소정의 방식으로 부호화하는 기능과, 부호화된 비디오 데이터 및 오디오 데이터를 복호하여, 비디오 신호 및 오디오 신호를 재생 출력하는 기능을 갖는다.
도 71에 도시된 바와 같이, 비디오 프로세서(1332)는 비디오 입력 처리부(1401), 제1 화상 확대 축소부(1402), 제2 화상 확대 축소부(1403), 비디오 출력 처리부(1404), 프레임 메모리(1405) 및 메모리 제어부(1406)를 갖는다. 또한, 비디오 프로세서(1332)는 인코드ㆍ디코드 엔진(1407), 비디오 ES(Elementary Stream) 버퍼(1408A 및 1408B), 및, 오디오 ES 버퍼(1409A 및 1409B)를 갖는다. 또한, 비디오 프로세서(1332)는 오디오 인코더(1410), 오디오 디코더(1411), 다중화부(MUX(Multiplexer))(1412), 역다중화부(DMUX(Demultiplexer))(1413) 및 스트림 버퍼(1414)를 갖는다.
비디오 입력 처리부(1401)는, 예를 들어 커넥티비티(1321)(도 70) 등으로부터 입력된 비디오 신호를 취득하여, 디지털 화상 데이터로 변환한다. 제1 화상 확대 축소부(1402)는 화상 데이터에 대하여 포맷 변환이나 화상의 확대 축소 처리 등을 행한다. 제2 화상 확대 축소부(1403)는, 화상 데이터에 대하여, 비디오 출력 처리부(1404)를 통해서 출력처에서의 포맷에 따라서 화상의 확대 축소 처리를 행하거나, 제1 화상 확대 축소부(1402)와 마찬가지의 포맷 변환이나 화상의 확대 축소 처리 등을 행하거나 한다. 비디오 출력 처리부(1404)는 화상 데이터에 대하여, 포맷 변환이나 아날로그 신호로의 변환 등을 행하여, 재생된 비디오 신호로서 예를 들어 커넥티비티(1321)(도 70) 등에 출력한다.
프레임 메모리(1405)는 비디오 입력 처리부(1401), 제1 화상 확대 축소부(1402), 제2 화상 확대 축소부(1403), 비디오 출력 처리부(1404) 및 인코드ㆍ디코드 엔진(1407)에 의해 공용되는 화상 데이터용 메모리이다. 프레임 메모리(1405)는, 예를 들어 DRAM 등의 반도체 메모리로서 실현된다.
메모리 제어부(1406)는 인코드ㆍ디코드 엔진(1407)으로부터의 동기 신호를 받아, 액세스 관리 테이블(1406A)에 기입된 프레임 메모리(1405)에의 액세스 스케줄에 따라서 프레임 메모리(1405)에 대한 기입ㆍ판독의 액세스를 제어한다. 액세스 관리 테이블(1406A)은 인코드ㆍ디코드 엔진(1407), 제1 화상 확대 축소부(1402), 제2 화상 확대 축소부(1403) 등에서 실행되는 처리에 따라서, 메모리 제어부(1406)에 의해 갱신된다.
인코드ㆍ디코드 엔진(1407)은 화상 데이터의 인코드 처리, 및, 화상 데이터가 부호화된 데이터인 비디오 스트림의 디코드 처리를 행한다. 예를 들어, 인코드ㆍ디코드 엔진(1407)은 프레임 메모리(1405)로부터 판독한 화상 데이터를 부호화하여, 비디오 스트림으로서 비디오 ES 버퍼(1408A)에 순차적으로 기입한다. 또한, 예를 들어 비디오 ES 버퍼(1408B)로부터 비디오 스트림을 순차적으로 판독하여 복호하여, 화상 데이터로서 프레임 메모리(1405)에 순차적으로 기입한다. 인코드ㆍ디코드 엔진(1407)은, 이들의 부호화나 복호에 있어서, 프레임 메모리(1405)를 작업 영역으로서 사용한다. 또한, 인코드ㆍ디코드 엔진(1407)은, 예를 들어 매크로 블록마다의 처리를 개시하는 타이밍에, 메모리 제어부(1406)에 대하여 동기 신호를 출력한다.
비디오 ES 버퍼(1408A)는 인코드ㆍ디코드 엔진(1407)에 의해 생성된 비디오 스트림을 버퍼링하여, 다중화부(MUX)(1412)에 공급한다. 비디오 ES 버퍼(1408B)는 역다중화부(DMUX)(1413)로부터 공급된 비디오 스트림을 버퍼링하여, 인코드ㆍ디코드 엔진(1407)에 공급한다.
오디오 ES 버퍼(1409A)는 오디오 인코더(1410)에 의해 생성된 오디오 스트림을 버퍼링하여, 다중화부(MUX)(1412)에 공급한다. 오디오 ES 버퍼(1409B)는 역다중화부(DMUX)(1413)로부터 공급된 오디오 스트림을 버퍼링하여, 오디오 디코더(1411)에 공급한다.
오디오 인코더(1410)는, 예를 들어 커넥티비티(1321)(도 70) 등으로부터 입력된 오디오 신호를 예를 들어 디지털 변환하고, 예를 들어 MPEG 오디오 방식이나 AC3(AudioCode number 3) 방식 등의 소정의 방식으로 부호화한다. 오디오 인코더(1410)는 오디오 신호가 부호화된 데이터인 오디오 스트림을 오디오 ES 버퍼(1409A)에 순차적으로 기입한다. 오디오 디코더(1411)는 오디오 ES 버퍼(1409B)로부터 공급된 오디오 스트림을 복호하고, 예를 들어 아날로그 신호로의 변환 등을 행하여, 재생된 오디오 신호로서 예를 들어 커넥티비티(1321)(도 70) 등에 공급한다.
다중화부(MUX)(1412)는 비디오 스트림과 오디오 스트림을 다중화한다. 이 다중화의 방법(즉, 다중화에 의해 생성되는 비트 스트림의 포맷)은 임의이다. 또한, 이 다중화 시에, 다중화부(MUX)(1412)는 소정의 헤더 정보 등을 비트 스트림에 부가할 수도 있다. 즉, 다중화부(MUX)(1412)는 다중화에 의해 스트림의 포맷을 변환할 수 있다. 예를 들어, 다중화부(MUX)(1412)는 비디오 스트림과 오디오 스트림을 다중화함으로써, 전송용 포맷의 비트 스트림인 트랜스포트 스트림으로 변환한다. 또한, 예를 들어 다중화부(MUX)(1412)는 비디오 스트림과 오디오 스트림을 다중화함으로써, 기록용 파일 포맷의 데이터(파일 데이터)로 변환한다.
역다중화부(DMUX)(1413)는, 다중화부(MUX)(1412)에 의한 다중화에 대응하는 방법에 의해, 비디오 스트림과 오디오 스트림이 다중화된 비트 스트림을 역다중화한다. 즉, 역다중화부(DMUX)(1413)는 스트림 버퍼(1414)로부터 판독된 비트 스트림으로부터 비디오 스트림과 오디오 스트림을 추출한다(비디오 스트림과 오디오 스트림을 분리한다). 즉, 역다중화부(DMUX)(1413)는 역다중화에 의해 스트림의 포맷을 변환(다중화부(MUX)(1412)에 의한 변환의 역변환)할 수 있다. 예를 들어, 역다중화부(DMUX)(1413)는, 예를 들어 커넥티비티(1321)나 브로드밴드 모뎀(1333) 등(모두 도 70)으로부터 공급된 트랜스포트 스트림을, 스트림 버퍼(1414)를 통해서 취득하고, 역다중화함으로써, 비디오 스트림과 오디오 스트림으로 변환할 수 있다. 또한, 예를 들어 역다중화부(DMUX)(1413)는 예를 들어 커넥티비티(1321)에 의해(도 70) 각종 기록 매체로부터 판독된 파일 데이터를, 스트림 버퍼(1414)를 통해서 취득하고, 역다중화함으로써, 비디오 스트림과 오디오 스트림으로 변환할 수 있다.
스트림 버퍼(1414)는 비트 스트림을 버퍼링한다. 예를 들어, 스트림 버퍼(1414)는 다중화부(MUX)(1412)로부터 공급된 트랜스포트 스트림을 버퍼링하고, 소정의 타이밍에 있어서, 혹은 외부로부터의 요구 등에 기초하여, 예를 들어 커넥티비티(1321)나 브로드밴드 모뎀(1333)(모두 도 70) 등에 공급한다.
또한, 예를 들어 스트림 버퍼(1414)는 다중화부(MUX)(1412)로부터 공급된 파일 데이터를 버퍼링하고, 소정의 타이밍에 있어서, 혹은 외부로부터의 요구 등에 기초하여, 예를 들어 커넥티비티(1321)(도 70) 등에 공급하여, 각종 기록 매체에 기록시킨다.
또한, 스트림 버퍼(1414)는, 예를 들어 커넥티비티(1321)나 브로드밴드 모뎀(1333) 등(모두 도 70)을 통해서 취득한 트랜스포트 스트림을 버퍼링하고, 소정의 타이밍에 있어서, 혹은 외부로부터의 요구 등에 기초하여, 역다중화부(DMUX)(1413)에 공급한다.
또한, 스트림 버퍼(1414)는, 예를 들어 커넥티비티(1321)(도 70) 등에 있어서 각종 기록 매체로부터 판독된 파일 데이터를 버퍼링하고, 소정의 타이밍에 있어서, 혹은 외부로부터의 요구 등에 기초하여, 역다중화부(DMUX)(1413)에 공급한다.
다음에, 이와 같은 구성의 비디오 프로세서(1332)의 동작의 예에 대해서 설명한다. 예를 들어, 커넥티비티(1321)(도 70) 등으로부터 비디오 프로세서(1332)에 입력된 비디오 신호는, 비디오 입력 처리부(1401)에 있어서 4:2:2Y/Cb/Cr 방식 등의 소정의 방식의 디지털 화상 데이터로 변환되어, 프레임 메모리(1405)에 순차적으로 기입된다. 이 디지털 화상 데이터는, 제1 화상 확대 축소부(1402) 또는 제2 화상 확대 축소부(1403)에 판독되어, 4:2:0Y/Cb/Cr 방식 등의 소정의 방식으로의 포맷 변환 및 확대 축소 처리가 행해지고, 다시 프레임 메모리(1405)에 기입된다. 이 화상 데이터는 인코드ㆍ디코드 엔진(1407)에 의해 부호화되고, 비디오 스트림으로서 비디오 ES 버퍼(1408A)에 기입된다.
또한, 커넥티비티(1321)(도 70) 등으로부터 비디오 프로세서(1332)에 입력된 오디오 신호는 오디오 인코더(1410)에 의해 부호화되고, 오디오 스트림으로서, 오디오 ES 버퍼(1409A)에 기입된다.
비디오 ES 버퍼(1408A)의 비디오 스트림과, 오디오 ES 버퍼(1409A)의 오디오 스트림은 다중화부(MUX)(1412)에 판독되어 다중화되어, 트랜스포트 스트림 혹은 파일 데이터 등으로 변환된다. 다중화부(MUX)(1412)에 의해 생성된 트랜스포트 스트림은, 스트림 버퍼(1414)에 버퍼된 후, 예를 들어 커넥티비티(1321)나 브로드밴드 모뎀(1333)(모두 도 70) 등을 통해서 외부 네트워크에 출력된다. 또한, 다중화부(MUX)(1412)에 의해 생성된 파일 데이터는, 스트림 버퍼(1414)에 버퍼된 후, 예를 들어 커넥티비티(1321)(도 70) 등에 출력되어, 각종 기록 매체에 기록된다.
또한, 예를 들어 커넥티비티(1321)나 브로드밴드 모뎀(1333)(모두 도 70) 등을 통해서 외부 네트워크로부터 비디오 프로세서(1332)에 입력된 트랜스포트 스트림은, 스트림 버퍼(1414)에 버퍼된 후, 역다중화부(DMUX)(1413)에 의해 역다중화된다. 또한, 예를 들어 커넥티비티(1321)(도 70) 등에 있어서 각종 기록 매체로부터 판독되어, 비디오 프로세서(1332)에 입력된 파일 데이터는, 스트림 버퍼(1414)에 버퍼된 후, 역다중화부(DMUX)(1413)에 의해 역다중화된다. 즉, 비디오 프로세서(1332)에 입력된 트랜스포트 스트림 또는 파일 데이터는, 역다중화부(DMUX)(1413)에 의해 비디오 스트림과 오디오 스트림으로 분리된다.
오디오 스트림은 오디오 ES 버퍼(1409B)를 통해서 오디오 디코더(1411)에 공급되어, 복호되어 오디오 신호가 재생된다. 또한, 비디오 스트림은 비디오 ES 버퍼(1408B)에 기입된 후, 인코드ㆍ디코드 엔진(1407)에 의해 순차적으로 판독되어 복호되어 프레임 메모리(1405)에 기입된다. 복호된 화상 데이터는 제2 화상 확대 축소부(1403)에 의해 확대 축소 처리되어, 프레임 메모리(1405)에 기입된다. 그리고, 복호된 화상 데이터는 비디오 출력 처리부(1404)에 판독되어, 4:2:2Y/Cb/Cr 방식 등의 소정의 방식으로 포맷 변환되고, 또한 아날로그 신호로 변환되어, 비디오 신호가 재생 출력된다.
이와 같이 구성되는 비디오 프로세서(1332)에 본 기술을 적용하는 경우, 인코드ㆍ디코드 엔진(1407)에, 상술한 각 실시 형태에 따른 본 기술을 적용하면 된다. 즉, 예를 들어 인코드ㆍ디코드 엔진(1407)이, 부호화 장치(10)나 복호 장치(110)의 기능을 갖도록 하면 된다. 또한, 예를 들어 인코드ㆍ디코드 엔진(1407)이, 부호화 장치(150)나 복호 장치(170), 부호화 장치(190)나 복호 장치(210), 부호화 장치(230)나 복호 장치(270)의 기능을 갖도록 해도 된다. 또한, 예를 들어 인코드ㆍ디코드 엔진(1407)이 다시점 화상 부호화 장치(600)나 다시점 화상 복호 장치(610)의 기능을 갖도록 해도 된다. 이와 같이 함으로써, 비디오 프로세서(1332)는 도 1 내지 도 61을 참조하여 상술한 효과와 마찬가지의 효과를 얻을 수 있다.
또한, 인코드ㆍ디코드 엔진(1407)에 있어서, 본 기술(즉, 상술한 각 실시 형태에 관한 화상 부호화 장치나 화상 복호 장치의 기능)은 논리 회로 등의 하드웨어에 의해 실현하도록 해도 되고, 내장 프로그램 등의 소프트웨어에 의해 실현하도록 해도 되고, 그들의 양쪽에 의해 실현하도록 해도 된다.
(비디오 프로세서의 다른 구성예)
도 72는 본 기술을 적용한 비디오 프로세서(1332)(도 70)의 개략적인 구성의 다른 예를 도시하고 있다. 도 72의 예의 경우, 비디오 프로세서(1332)는 비디오 데이터를 소정의 방식으로 부호화ㆍ복호하는 기능을 갖는다.
보다 구체적으로는, 도 72에 도시된 바와 같이, 비디오 프로세서(1332)는 제어부(1511), 디스플레이 인터페이스(1512), 디스플레이 엔진(1513), 화상 처리 엔진(1514) 및 내부 메모리(1515)를 갖는다. 또한, 비디오 프로세서(1332)는 코덱 엔진(1516), 메모리 인터페이스(1517), 다중화ㆍ역다중화부(MUX DMUX)(1518), 네트워크 인터페이스(1519) 및 비디오 인터페이스(1520)를 갖는다.
제어부(1511)는 디스플레이 인터페이스(1512), 디스플레이 엔진(1513), 화상 처리 엔진(1514) 및 코덱 엔진(1516) 등, 비디오 프로세서(1332) 내의 각 처리부의 동작을 제어한다.
도 72에 도시된 바와 같이, 제어부(1511)는, 예를 들어 메인 CPU(1531), 서브 CPU(1532) 및 시스템 컨트롤러(1533)를 갖는다. 메인 CPU(1531)는 비디오 프로세서(1332) 내의 각 처리부의 동작을 제어하기 위한 프로그램 등을 실행한다. 메인 CPU(1531)는 그 프로그램 등에 따라서 제어 신호를 생성하고, 각 처리부에 공급한다(즉, 각 처리부의 동작을 제어한다). 서브 CPU(1532)는 메인 CPU(1531)의 보조적인 역할을 한다. 예를 들어, 서브 CPU(1532)는 메인 CPU(1531)가 실행하는 프로그램 등의 자(子)프로세스나 서브 루틴 등을 실행한다. 시스템 컨트롤러(1533)는, 메인 CPU(1531) 및 서브 CPU(1532)가 실행하는 프로그램을 지정하는 등, 메인 CPU(1531) 및 서브 CPU(1532)의 동작을 제어한다.
디스플레이 인터페이스(1512)는, 제어부(1511)의 제어 하에서, 화상 데이터를 예를 들어 커넥티비티(1321)(도 70) 등에 출력한다. 예를 들어, 디스플레이 인터페이스(1512)는 디지털 데이터의 화상 데이터를 아날로그 신호로 변환하고, 재생된 비디오 신호로서 또는 디지털 데이터의 화상 데이터 상태 그대로, 커넥티비티(1321)(도 70)의 모니터 장치 등에 출력한다.
디스플레이 엔진(1513)은, 제어부(1511)의 제어 하에서, 화상 데이터에 대하여, 그 화상을 표시시키는 모니터 장치 등의 하드웨어 스펙에 맞추도록, 포맷 변환, 사이즈 변환, 색 영역 변환 등의 각종 변환 처리를 행한다.
화상 처리 엔진(1514)은, 제어부(1511)의 제어 하에서, 화상 데이터에 대하여, 예를 들어 화질 개선을 위한 필터 처리 등, 소정의 화상 처리를 실시한다.
내부 메모리(1515)는 디스플레이 엔진(1513), 화상 처리 엔진(1514) 및 코덱 엔진(1516)에 의해 공용되는, 비디오 프로세서(1332)의 내부에 설치된 메모리이다. 내부 메모리(1515)는, 예를 들어 디스플레이 엔진(1513), 화상 처리 엔진(1514) 및 코덱 엔진(1516) 사이에서 행해지는 데이터의 수수에 이용된다. 예를 들어, 내부 메모리(1515)는, 디스플레이 엔진(1513), 화상 처리 엔진(1514) 또는 코덱 엔진(1516)으로부터 공급되는 데이터를 저장하고, 필요에 따라서(예를 들어, 요구에 따라서), 그 데이터를, 디스플레이 엔진(1513), 화상 처리 엔진(1514) 또는 코덱 엔진(1516)에 공급한다. 이 내부 메모리(1515)는 어떤 기억 디바이스에 의해 실현하도록 해도 되지만, 일반적으로 블록 단위의 화상 데이터나 파라미터 등과 같은 소용량의 데이터의 저장에 이용하는 경우가 많으므로, 예를 들어 SRAM(Static Random Access Memory)과 같은 비교적(예를 들어 외부 메모리(1312)와 비교하여) 소용량이지만 응답 속도가 고속인 반도체 메모리에 의해 실현하는 것이 바람직하다.
코덱 엔진(1516)은 화상 데이터의 부호화나 복호에 관한 처리를 행한다. 이 코덱 엔진(1516)이 대응하는 부호화ㆍ복호의 방식은 임의이며, 그 수는 하나어도 되고, 복수이어도 된다. 예를 들어, 코덱 엔진(1516)은 복수의 부호화ㆍ복호 방식의 코덱 기능을 구비하고, 그 중에서 선택된 것에 의해 화상 데이터의 부호화 혹은 부호화 데이터의 복호를 행하도록 해도 된다.
도 72에 도시된 예에 있어서, 코덱 엔진(1516)은, 코덱에 관한 처리의 기능 블록으로서, 예를 들어 MPEG-2 Video(1541), AVC/H.264(1542), HEVC/H.265(1543), HEVC/H.265(Scalable)(1544), HEVC/H.265(Multi-view)(1545) 및 MPEG-DASH(1551)를 갖는다.
MPEG-2 Video(1541)는 화상 데이터를 MPEG-2 방식으로 부호화하거나 복호하거나 하는 기능 블록이다. AVC/H.264(1542)는 화상 데이터를 AVC 방식으로 부호화하거나 복호하거나 하는 기능 블록이다. HEVC/H.265(1543)는 화상 데이터를 HEVC 방식으로 부호화하거나 복호하거나 하는 기능 블록이다. HEVC/H.265(Scalable)(1544)는, 화상 데이터를 HEVC 방식으로 스케일러블 부호화하거나 스케일러블 복호하거나 하는 기능 블록이다. HEVC/H.265(Multi-view)(1545)는 화상 데이터를 HEVC 방식으로 다시점 부호화하거나 다시점 복호하거나 하는 기능 블록이다.
MPEG-DASH(1551)는 화상 데이터를 MPEG-DASH(MPEG-Dynamic Adaptive Streaming over HTTP) 방식으로 송수신하는 기능 블록이다. MPEG-DASH는 HTTP(HyperText Transfer Protocol)를 사용하여 비디오의 스트리밍을 행하는 기술이며, 미리 준비된 해상도 등이 서로 다른 복수의 부호화 데이터 중에서 적절한 것을 세그먼트 단위로 선택하여 전송하는 것을 특징의 하나로 한다. MPEG-DASH(1551)는, 규격에 준거하는 스트림의 생성이나 그 스트림의 전송 제어 등을 행하고, 화상 데이터의 부호화ㆍ복호에 대해서는 상술한 MPEG-2 Video(1541) 내지HEVC/H.265(Multi-view)(1545)를 이용한다.
메모리 인터페이스(1517)는 외부 메모리(1312)용 인터페이스이다. 화상 처리 엔진(1514)이나 코덱 엔진(1516)으로부터 공급되는 데이터는, 메모리 인터페이스(1517)를 통해서 외부 메모리(1312)에 공급된다. 또한, 외부 메모리(1312)로부터 판독된 데이터는, 메모리 인터페이스(1517)를 통해서 비디오 프로세서(1332)(화상 처리 엔진(1514) 혹은 코덱 엔진(1516))에 공급된다.
다중화ㆍ역다중화부(MUX DMUX)(1518)는 부호화 데이터의 비트 스트림, 화상 데이터, 비디오 신호 등, 화상에 관한 각종 데이터의 다중화나 역다중화를 행한다. 이 다중화ㆍ역다중화의 방법은 임의이다. 예를 들어, 다중화 시에, 다중화ㆍ역다중화부(MUX DMUX)(1518)는 복수의 데이터를 하나로 통합할 뿐만 아니라, 소정의 헤더 정보 등을 그 데이터에 부가할 수도 있다. 또한, 역다중화 시에, 다중화ㆍ역다중화부(MUX DMUX)(1518)는 하나의 데이터를 복수로 분할할 뿐만 아니라, 분할한 각 데이터에 소정의 헤더 정보 등을 부가할 수도 있다. 즉, 다중화ㆍ역다중화부(MUX DMUX)(1518)는 다중화ㆍ역다중화에 의해 데이터의 포맷을 변환할 수 있다. 예를 들어, 다중화ㆍ역다중화부(MUX DMUX)(1518)는 비트 스트림을 다중화함으로써, 전송용 포맷의 비트 스트림인 트랜스포트 스트림이나, 기록용 파일 포맷의 데이터(파일 데이터)로 변환할 수 있다. 물론, 역다중화에 의해 그 역변환도 가능하다.
네트워크 인터페이스(1519)는, 예를 들어 브로드밴드 모뎀(1333)이나 커넥티비티(1321)(모두 도 70) 등을 위한 인터페이스이다. 비디오 인터페이스(1520)는, 예를 들어 커넥티비티(1321)나 카메라(1322)(모두 도 70) 등을 위한 인터페이스이다.
다음에, 이와 같은 비디오 프로세서(1332)의 동작의 예에 대해서 설명한다. 예를 들어, 커넥티비티(1321)나 브로드밴드 모뎀(1333)(모두 도 70) 등을 통해서 외부 네트워크로부터 트랜스포트 스트림을 수신하면, 그 트랜스포트 스트림은 네트워크 인터페이스(1519)를 통해서 다중화ㆍ역다중화부(MUX DMUX)(1518)에 공급되어 역다중화되고, 코덱 엔진(1516)에 의해 복호된다. 코덱 엔진(1516)의 복호에 의해 얻어진 화상 데이터는, 예를 들어 화상 처리 엔진(1514)에 의해 소정의 화상 처리가 실시되고, 디스플레이 엔진(1513)에 의해 소정의 변환이 행해지고, 디스플레이 인터페이스(1512)를 통해서 예를 들어 커넥티비티(1321)(도 70) 등에 공급되어, 그 화상이 모니터에 표시된다. 또한, 예를 들어 코덱 엔진(1516)의 복호에 의해 얻어진 화상 데이터는, 코덱 엔진(1516)에 의해 재부호화되고, 다중화ㆍ역다중화부(MUX DMUX)(1518)에 의해 다중화되어 파일 데이터로 변환되고, 비디오 인터페이스(1520)를 통해서 예를 들어 커넥티비티(1321)(도 70) 등에 출력되어, 각종 기록 매체에 기록된다.
또한, 예를 들어 커넥티비티(1321)(도 70) 등에 의해 도시하지 않은 기록 매체로부터 판독된, 화상 데이터가 부호화된 부호화 데이터의 파일 데이터는, 비디오 인터페이스(1520)를 통해서 다중화ㆍ역다중화부(MUX DMUX)(1518)에 공급되어 역다중화되고, 코덱 엔진(1516)에 의해 복호된다. 코덱 엔진(1516)의 복호에 의해 얻어진 화상 데이터는, 화상 처리 엔진(1514)에 의해 소정의 화상 처리가 실시되고, 디스플레이 엔진(1513)에 의해 소정의 변환이 행해지고, 디스플레이 인터페이스(1512)를 통해서 예를 들어 커넥티비티(1321)(도 70) 등에 공급되어, 그 화상이 모니터에 표시된다. 또한, 예를 들어 코덱 엔진(1516)의 복호에 의해 얻어진 화상 데이터는, 코덱 엔진(1516)에 의해 재부호화되고, 다중화ㆍ역다중화부(MUX DMUX)(1518)에 의해 다중화되어 트랜스포트 스트림으로 변환되고, 네트워크 인터페이스(1519)를 통해서 예를 들어 커넥티비티(1321)나 브로드밴드 모뎀(1333)(모두 도 70) 등에 공급되어 도시하지 않은 다른 장치에 전송된다.
또한, 비디오 프로세서(1332) 내의 각 처리부의 사이에서의 화상 데이터나 그 밖의 데이터의 수수는, 예를 들어 내부 메모리(1515)나 외부 메모리(1312)를 이용하여 행해진다. 또한, 파워 매니지먼트 모듈(1313)은, 예를 들어 제어부(1511)에의 전력 공급을 제어한다.
이와 같이 구성되는 비디오 프로세서(1332)에 본 기술을 적용하는 경우, 코덱 엔진(1516)에, 상술한 각 실시 형태에 따른 본 기술을 적용하면 된다. 즉, 예를 들어 코덱 엔진(1516)이, 부호화 장치(10)나 복호 장치(110)를 실현하는 기능 블록을 갖도록 하면 된다. 또한, 예를 들어 코덱 엔진(1516)이 부호화 장치(150)나 복호 장치(170), 부호화 장치(190)나 복호 장치(210), 부호화 장치(230)나 복호 장치(270)를 실현하는 기능 블록을 갖도록 해도 된다. 또한, 예를 들어 코덱 엔진(1516)이, 다시점 화상 부호화 장치(600)나 다시점 화상 복호 장치(610)의 기능을 갖도록 해도 된다. 이와 같이 함으로써, 비디오 프로세서(1332)는 도 1 내지 도 61을 참조하여 상술한 효과와 마찬가지의 효과를 얻을 수 있다.
또한, 코덱 엔진(1516)에 있어서, 본 기술(즉, 상술한 각 실시 형태에 따른 화상 부호화 장치나 화상 복호 장치의 기능)은 논리 회로 등의 하드웨어에 의해 실현하도록 해도 되고, 내장 프로그램 등의 소프트웨어에 의해 실현하도록 해도 되고, 그들의 양쪽에 의해 실현하도록 해도 된다.
이상으로 비디오 프로세서(1332)의 구성을 2예 나타냈지만, 비디오 프로세서(1332)의 구성은 임의이며, 상술한 2예 이외의 것이어도 된다. 또한, 이 비디오 프로세서(1332)는 하나의 반도체 칩으로서 구성되도록 해도 되지만, 복수의 반도체 칩으로서 구성되도록 해도 된다. 예를 들어, 복수의 반도체를 적층하는 3차원 적층 LSI로 해도 된다. 또한, 복수의 LSI에 의해 실현되도록 해도 된다.
(장치에의 적용예)
비디오 세트(1300)는 화상 데이터를 처리하는 각종 장치에 내장할 수 있다. 예를 들어, 비디오 세트(1300)는 텔레비전 장치(900)(도 63), 휴대 전화기(920)(도 64), 기록 재생 장치(940)(도 65), 촬상 장치(960)(도 66) 등에 내장할 수 있다. 비디오 세트(1300)를 내장함으로써, 그 장치는 도 1 내지 도 61을 참조하여 상술한 효과와 마찬가지의 효과를 얻을 수 있다.
또한, 비디오 세트(1300)는, 예를 들어 도 67의 데이터 전송 시스템(1000)에 있어서의 퍼스널 컴퓨터(1004), AV 기기(1005), 태블릿 디바이스(1006) 및 휴대 전화기(1007) 등의 단말 장치, 도 68의 데이터 전송 시스템(1100)에 있어서의 방송국(1101) 및 단말 장치(1102), 및, 도 69의 촬상 시스템(1200)에 있어서의 촬상 장치(1201) 및 스케일러블 부호화 데이터 기억 장치(1202) 등에도 내장할 수 있다. 비디오 세트(1300)를 내장함으로써, 그 장치는 도 1 내지 도 61을 참조하여 상술한 효과와 마찬가지의 효과를 얻을 수 있다.
또한, 상술한 비디오 세트(1300)의 각 구성의 일부라도, 비디오 프로세서(1332)를 포함하는 것이면, 본 기술을 적용한 구성으로서 실시할 수 있다. 예를 들어, 비디오 프로세서(1332)만을 본 기술을 적용한 비디오 프로세서로서 실시할 수 있다. 또한, 예를 들어 상술한 바와 같이 점선(1341)에 의해 나타내어지는 프로세서나 비디오 모듈(1311) 등을 본 기술을 적용한 프로세서나 모듈 등으로서 실시할 수 있다. 또한, 예를 들어 비디오 모듈(1311), 외부 메모리(1312), 파워 매니지먼트 모듈(1313) 및 프론트 엔드 모듈(1314)을 조합하여, 본 기술을 적용한 비디오 유닛(1361)으로서 실시할 수도 있다. 어느 구성의 경우라도, 도 1 내지 도 61을 참조하여 상술한 효과와 마찬가지의 효과를 얻을 수 있다.
즉, 비디오 프로세서(1332)를 포함하는 것이면 어떤 구성이라도, 비디오 세트(1300)의 경우와 마찬가지로, 화상 데이터를 처리하는 각종 장치에 내장할 수 있다. 예를 들어, 비디오 프로세서(1332), 점선(1341)에 의해 나타내어지는 프로세서, 비디오 모듈(1311), 또는, 비디오 유닛(1361)을, 텔레비전 장치(900)(도 63), 휴대 전화기(920)(도 64), 기록 재생 장치(940)(도 65), 촬상 장치(960)(도 66), 도 67의 데이터 전송 시스템(1000)에 있어서의 퍼스널 컴퓨터(1004), AV 기기(1005), 태블릿 디바이스(1006) 및 휴대 전화기(1007) 등의 단말 장치, 도 68의 데이터 전송 시스템(1100)에 있어서의 방송국(1101) 및 단말 장치(1102), 및, 도 69의 촬상 시스템(1200)에 있어서의 촬상 장치(1201) 및 스케일러블 부호화 데이터 기억 장치(1202) 등에 내장할 수 있다. 그리고, 본 기술을 적용한 어느 하나의 구성을 내장함으로써, 그 장치는, 비디오 세트(1300)의 경우와 마찬가지로, 도 1 내지 도 61을 참조하여 상술한 효과와 마찬가지의 효과를 얻을 수 있다.
본 명세서에서는, 각종 정보가, 부호화 스트림에 다중화되어, 부호화측으로부터 복호측으로 전송되는 예에 대해서 설명하였다. 그러나, 이들 정보를 전송하는 방법은 이러한 예에 한정되지 않는다. 예를 들어, 이들 정보는 부호화 비트 스트림에 다중화되지 않고, 부호화 비트 스트림과 관련지어진 별개의 데이터로서 전송되거나 또는 기록되어도 된다. 여기서, 「관련짓다」라는 용어는, 비트 스트림에 포함되는 화상(슬라이스 혹은 블록 등, 화상의 일부이어도 됨)과 당해 화상에 대응하는 정보를 복호 시에 링크시킬 수 있도록 하는 것을 의미한다. 즉, 정보는 화상(또는 비트 스트림)과는 다른 전송로 상에서 전송되어도 된다. 또한, 정보는 화상(또는 비트 스트림)과는 다른 기록 매체(또는 동일한 기록 매체의 다른 기록 에리어)에 기록되어도 된다. 또한, 정보와 화상(또는 비트 스트림)은, 예를 들어 복수 프레임, 1프레임, 또는 프레임 내의 일부분 등의 임의의 단위로 서로 관련지어져도 된다.
본 기술은, MPEG, H.26x 등과 같이, 이산 코사인 변환 등의 직교 변환과 움직임 보상에 의해 압축된 화상 정보(비트 스트림)를, 위성 방송, 케이블 TV, 인터넷, 휴대 전화 등의 네트워크 미디어를 통해서 송수신할 때, 혹은 광, 자기 디스크, 플래시 메모리와 같은 기억 미디어 상에서 처리할 때 사용되는 장치에 적용할 수 있다.
또한, 본 기술은 미리 준비된 해상도 등이 서로 다른 복수의 부호화 데이터 중에서 적절한 것을 세그먼트 단위로 선택하여 사용하는, 예를 들어 MPEG DASH 등과 같은 HTTP 스트리밍에도 적용할 수 있다.
또한, 본 기술에 있어서의 부호화 방식은 HEVC 방식 이외의 부호화 방식이어도 된다.
또한, 본 기술의 실시 형태는 상술한 실시 형태에 한정되는 것은 아니고, 본 기술의 요지를 일탈하지 않는 범위에서 다양한 변경이 가능하다.
또한, 본 기술은 이하와 같은 구성도 취할 수 있다.
(1)
부호화 대상의 화상이 GOP(Group of Picture)의 선두의 화상 이외의 화상인 경우에 전송되어 오는, 상기 부호화 대상의 화상보다 부호화순으로 앞의 화상인 전화상의, 예측 화상의 생성에 사용되는 참조 화상을 특정하는 참조 화상 특정 정보를, 상기 부호화 대상의 화상의 상기 참조 화상 특정 정보로서 사용할 것인지를 나타내는 참조 정보를 수취하는 수취부와,
상기 수취부에 의해 상기 참조 정보가 수취된 경우, 그 참조 정보에 기초하여, 복호 대상의 화상의 상기 참조 화상 특정 정보를 생성하고, 상기 수취부에 의해 상기 참조 정보가 수취되지 않는 경우, 상기 전화상의 상기 참조 화상 특정 정보를 상기 부호화 대상의 화상의 상기 참조 화상 특정 정보로서 사용하지 않는 것을 나타내는 참조 정보에 기초하여, 복호 대상의 화상의 상기 참조 화상 특정 정보를 생성하는 참조 화상 설정부와,
상기 참조 화상 설정부에 의해 생성된 상기 참조 화상 특정 정보에 의해 특정되는 상기 참조 화상을 사용하여, 예측 화상을 생성하는 예측 화상 생성부
를 구비하는 복호 장치.
(2)
상기 수취부는, 상기 참조 정보가, 상기 전화상의 상기 참조 화상 특정 정보를 상기 부호화 대상의 화상의 상기 참조 화상 특정 정보로서 사용하는 것을 나타내는 경우, 상기 전화상을 특정하는 전화상 특정 정보를 수취하고,
상기 참조 화상 설정부는, 상기 수취부에 의해 수취된 상기 전화상 특정 정보에 의해 특정되는 상기 전화상의 상기 참조 화상 특정 정보를, 상기 복호 대상의 화상의 상기 참조 화상 특정 정보로서 생성하는 상기 (1)에 기재된 복호 장치.
(3)
상기 수취부는, 상기 참조 정보가, 상기 전화상의 상기 참조 화상 특정 정보를 상기 부호화 대상의 화상의 상기 참조 화상 특정 정보로서 사용하지 않는 것을 나타내는 경우, 상기 부호화 대상의 화상의 상기 참조 화상 특정 정보를 수취하고,
상기 참조 화상 설정부는, 상기 수취부에 의해 수취된 상기 참조 화상 특정 정보를, 상기 복호 대상의 화상의 상기 참조 화상 특정 정보로서 생성하는 상기 (2)에 기재된 복호 장치.
(4)
상기 수취부는, 상기 참조 정보와, 상기 전화상 특정 정보 또는 상기 참조 화상 특정 정보를 포함하는, 복수의 참조 화상 정보를 수취함과 함께, 상기 부호화 대상의 화상이 GOP(Group of Picture)의 선두의 화상 이외의 화상인 경우에 전송되어 오는, 상기 복수의 참조 화상 정보 중, 상기 부호화 대상의 화상의 상기 참조 화상 정보를 특정하는 참조 화상 정보 특정 정보를 수취하고,
상기 참조 화상 설정부는, 상기 수취부에 의해 수취된 상기 참조 화상 정보 특정 정보에 의해 특정되는 상기 참조 화상 정보에 포함되는 상기 참조 정보에 기초하여, 상기 복호 대상의 화상의 상기 참조 화상 특정 정보를 생성하는 상기 (3)에 기재된 복호 장치.
(5)
상기 수취부는, 상기 참조 화상 특정 정보를 포함하는 선두용 참조 화상 정보를 상기 참조 화상 정보로서 수취함과 함께, 상기 부호화 대상의 화상이 GOP(Group of Picture)의 선두의 화상인 경우에 전송되어 오는, 상기 선두용 참조 화상 정보를 특정하는 상기 참조 화상 정보 특정 정보를 수취하고,
상기 참조 화상 설정부는, 상기 수취부에 의해 수취된 상기 참조 화상 정보 특정 정보에 의해 특정되는 상기 선두용 참조 화상 정보에 포함되는 상기 참조 화상 특정 정보에 기초하여, 상기 복호 대상의 화상의 상기 참조 화상 특정 정보를 생성하는 상기 (4)에 기재된 복호 장치.
(6)
복호 장치가,
부호화 대상의 화상이 GOP(Group of Picture)의 선두의 화상 이외의 화상인 경우에 전송되어 오는, 상기 부호화 대상의 화상보다 부호화순으로 앞의 화상인 전화상의, 예측 화상의 생성에 사용되는 참조 화상을 특정하는 참조 화상 특정 정보를, 상기 부호화 대상의 화상의 상기 참조 화상 특정 정보로서 사용할 것인지를 나타내는 참조 정보를 수취하는 수취 스텝과,
상기 수취 스텝의 처리에 의해 상기 참조 정보가 수취된 경우, 그 참조 정보에 기초하여, 복호 대상의 화상의 상기 참조 화상 특정 정보를 생성하고, 상기 수취 스텝의 처리에 의해 상기 참조 정보가 수취되지 않는 경우, 상기 전화상의 상기 참조 화상 특정 정보를 상기 부호화 대상의 화상의 상기 참조 화상 특정 정보로서 사용하지 않는 것을 나타내는 참조 정보에 기초하여, 복호 대상의 화상의 상기 참조 화상 특정 정보를 생성하는 참조 화상 설정 스텝과,
상기 참조 화상 설정 스텝의 처리에 의해 생성된 상기 참조 화상 특정 정보에 의해 특정되는 상기 참조 화상을 사용하여, 예측 화상을 생성하는 예측 화상 생성 스텝
을 포함하는 복호 방법.
10 : 부호화 장치
12 : 설정부
13 : 전송부
33 : 연산부
47 : 움직임 예측ㆍ보상부
110 : 복호 장치
111 : 수취부
135 : 가산부
144 : 참조 화상 설정부
145 : 움직임 보상부
150 : 부호화 장치
170 : 복호 장치
190 : 부호화 장치
210 : 복호 장치
230 : 부호화 장치
232 : 설정부
251 : 움직임 예측ㆍ보상부
270 : 복호 장치
292 : 움직임 보상부

Claims (6)

  1. 복호 장치에 있어서,
    회로부를 포함하고, 상기 회로부는,
    참조 정보 플래그의 값을 수취할지 여부를 결정하고 - 상기 참조 정보 플래그의 값은, 전(前) 참조 화상 특정 정보가 복호 대상의 화상(current decoding image)의 참조 화상 특정 정보로서 사용되는지 여부를 나타내며, 그에 따라 상기 전 참조 화상 특정 정보는 전화상(前畵像)의 참조 화상을 특정하고, 상기 전화상은 상기 복호 대상의 화상보다 복호화순으로 앞의 화상이고, 상기 참조 정보 플래그의 값은, 상기 복호 대상의 화상이 GOP(Group of Picture)의 선두의 화상 이외의 화상인 경우에만 수취됨 - ,
    ⅰ) 상기 참조 정보 플래그의 값이 수취되는 경우, 수취된 상기 참조 정보 플래그의 값, 또는 ⅱ) 상기 참조 정보 플래그의 값이 수취되지 않는 경우, 상기 전 참조 화상 특정 정보가 부호화 대상의 화상의 참조 화상 특정 정보로서 사용되지 않는 것을 나타내도록 상기 참조 정보 플래그의 값을 설정하는 것에 기초하여, 생성된 참조 화상 특정 정보로서, 상기 복호 대상의 화상의 상기 참조 화상 특정 정보를 생성하고,
    상기 복호 대상의 화상의 상기 생성된 참조 화상 특정 정보에 의해 특정되는 참조 화상을 사용하여 예측 화상을 생성하도록 구성된 것인, 복호 장치.
  2. 제1항에 있어서,
    상기 회로부는 또한,
    상기 참조 정보 플래그의 값이, 상기 전 참조 화상 특정 정보가 상기 부호화 대상의 화상의 상기 참조 화상 특정 정보로서 사용되는 것을 나타내는 경우,
    상기 전화상을 특정하는 전화상 특정 정보를 수취하고,
    상기 복호 대상의 화상의 상기 생성된 참조 화상 특정 정보로서 상기 전화상 특정 정보에 의해 특정되는 상기 전 참조 화상 특정 정보를 사용하여, 상기 복호 대상의 화상의 상기 참조 화상 특정 정보를 생성하도록 구성되는 것인, 복호 장치.
  3. 제1항에 있어서,
    상기 회로부는 또한,
    상기 참조 정보 플래그의 값이, 상기 전 참조 화상 특정 정보가 상기 복호 대상의 화상의 상기 참조 화상 특정 정보로서 사용되지 않는 것을 나타내는 경우,
    상기 부호화 대상의 화상의 상기 참조 화상 특정 정보를 수취하고,
    상기 복호 대상의 화상의 상기 생성된 참조 화상 특정 정보로서 수취된 상기 참조 화상 특정 정보를 사용하여, 상기 복호 대상의 화상의 상기 참조 화상 특정 정보를 생성하도록 구성되는 것인, 복호 장치.
  4. 복호 방법에 있어서, 복호 장치에 의해,
    참조 정보 플래그의 값을 수취할지 여부를 결정하는 단계 - 상기 참조 정보 플래그의 값은, 전(前) 참조 화상 특정 정보가 복호 대상의 화상의 참조 화상 특정 정보로서 사용되는지 여부를 나타내며, 그에 따라 상기 전 참조 화상 특정 정보는 전화상(前畵像)의 참조 화상을 특정하고, 상기 전화상은 상기 복호 대상의 화상보다 복호화순으로 앞의 화상이고, 상기 참조 정보 플래그의 값은, 상기 복호 대상의 화상이 GOP(Group of Picture)의 선두의 화상 이외의 화상인 경우에만 수취됨 - ;
    ⅰ) 상기 참조 정보 플래그의 값이 수취되는 경우, 수취된 상기 참조 정보 플래그의 값, 또는 ⅱ) 상기 참조 정보 플래그의 값이 수취되지 않는 경우, 상기 전 참조 화상 특정 정보가 부호화 대상의 화상의 참조 화상 특정 정보로서 사용되지 않는 것을 나타내도록 상기 참조 정보 플래그의 값을 설정하는 것에 기초하여, 생성된 참조 화상 특정 정보로서, 상기 복호 대상의 화상의 상기 참조 화상 특정 정보를 생성하는 단계; 및
    상기 복호 대상의 화상의 상기 생성된 참조 화상 특정 정보에 의해 특정되는 참조 화상을 사용하여 예측 화상을 생성하는 단계
    를 포함하는, 복호 방법.
  5. 제4항에 있어서,
    상기 참조 정보 플래그의 값이, 상기 전 참조 화상 특정 정보가 상기 부호화 대상의 화상의 상기 참조 화상 특정 정보로서 사용되는 것을 나타내는 경우,
    상기 전화상을 특정하는 전화상 특정 정보를 수취하는 단계, 및
    상기 복호 대상의 화상의 상기 생성된 참조 화상 특정 정보로서 상기 전화상 특정 정보에 의해 특정되는 상기 전 참조 화상 특정 정보를 사용하여, 상기 복호 대상의 화상의 상기 참조 화상 특정 정보를 생성하는 단계
    를 더 포함하는, 복호 방법.
  6. 제4항에 있어서,
    상기 참조 정보 플래그의 값이, 상기 전 참조 화상 특정 정보가 상기 복호 대상의 화상의 상기 참조 화상 특정 정보로서 사용되지 않는 것을 나타내는 경우,
    상기 부호화 대상의 화상의 상기 참조 화상 특정 정보를 수취하는 단계, 및
    상기 복호 대상의 화상의 상기 생성된 참조 화상 특정 정보로서 수취된 상기 참조 화상 특정 정보를 사용하여, 상기 복호 대상의 화상의 상기 참조 화상 특정 정보를 생성하는 단계
    를 더 포함하는, 복호 방법.
KR1020147035471A 2012-06-29 2013-06-21 복호 장치 및 복호 방법 KR102179087B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2012147883 2012-06-29
JPJP-P-2012-147883 2012-06-29
JPJP-P-2012-218097 2012-09-28
JP2012218097 2012-09-28
PCT/JP2013/067111 WO2014002898A1 (ja) 2012-06-29 2013-06-21 復号装置および復号方法

Publications (2)

Publication Number Publication Date
KR20150032257A KR20150032257A (ko) 2015-03-25
KR102179087B1 true KR102179087B1 (ko) 2020-11-18

Family

ID=49778143

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020147035471A KR102179087B1 (ko) 2012-06-29 2013-06-21 복호 장치 및 복호 방법
KR1020147035476A KR102165220B1 (ko) 2012-06-29 2013-06-21 부호화 장치 및 부호화 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020147035476A KR102165220B1 (ko) 2012-06-29 2013-06-21 부호화 장치 및 부호화 방법

Country Status (16)

Country Link
US (5) US10623765B2 (ko)
EP (2) EP2869559A4 (ko)
JP (6) JP6182719B2 (ko)
KR (2) KR102179087B1 (ko)
CN (4) CN104380752B (ko)
AR (1) AR091570A1 (ko)
AU (3) AU2013281947B2 (ko)
BR (2) BR112014032227B1 (ko)
CA (2) CA2875243C (ko)
MX (3) MX342499B (ko)
MY (3) MY190544A (ko)
RU (3) RU2643490C2 (ko)
SG (4) SG11201408571RA (ko)
TW (5) TWI644564B (ko)
WO (2) WO2014002898A1 (ko)
ZA (1) ZA201409038B (ko)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7295609B2 (en) 2001-11-30 2007-11-13 Sony Corporation Method and apparatus for coding image information, method and apparatus for decoding image information, method and apparatus for coding and decoding image information, and system of coding and transmitting image information
JP5359657B2 (ja) * 2009-07-31 2013-12-04 ソニー株式会社 画像符号化装置および方法、記録媒体、並びにプログラム
JP5914962B2 (ja) 2010-04-09 2016-05-11 ソニー株式会社 画像処理装置および方法、プログラム、並びに、記録媒体
TWI600318B (zh) 2010-05-18 2017-09-21 Sony Corp Image processing apparatus and image processing method
BR122020013775B1 (pt) 2010-06-04 2022-04-19 Sony Corporation. Aparelho e método de processamento de imagem
AU2011339460B2 (en) 2010-12-07 2015-10-29 Sony Corporation Image processing device and image processing method
KR101962591B1 (ko) 2010-12-07 2019-03-26 소니 주식회사 화상 처리 장치, 화상 처리 방법 및 기록 매체
JP5741076B2 (ja) 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
CN103780912B (zh) 2011-02-10 2017-11-24 威勒斯媒体国际有限公司 图像处理装置和图像处理方法
KR102032940B1 (ko) 2011-03-11 2019-10-16 소니 주식회사 화상 처리 장치, 화상 처리 방법 및 컴퓨터 판독가능 기록 매체
TWI530161B (zh) 2011-06-07 2016-04-11 Sony Corp Image processing apparatus and method
BR122015001053B1 (pt) 2011-06-28 2019-07-09 Sony Corporation Dispositivo e método de processamento de imagem
JP5907367B2 (ja) 2011-06-28 2016-04-26 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
US9153037B2 (en) * 2012-01-18 2015-10-06 Panasonic Intellectual Property Management Co., Ltd. Image decoding device, image encoding device, image decoding method, and image encoding method
JP6182719B2 (ja) 2012-06-29 2017-08-23 ヴェロス メディア インターナショナル リミテッドVelos Media International Limited 符号化装置および符号化方法
DK2868082T3 (en) 2012-06-29 2016-09-12 ERICSSON TELEFON AB L M (publ) Coding and decoding video sequences comprehensive referencebilledsæt
WO2016200100A1 (ko) * 2015-06-10 2016-12-15 삼성전자 주식회사 적응적 가중치 예측을 위한 신택스 시그널링을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치
CN105681563B (zh) * 2016-01-26 2019-04-09 深圳市美贝壳科技有限公司 智能硬件设备图片分享权限的实现方法
CN106254869A (zh) * 2016-08-25 2016-12-21 腾讯科技(深圳)有限公司 一种视频数据的编解码方法、装置和系统
CN108347602B (zh) * 2017-01-22 2021-07-30 上海澜至半导体有限公司 用于无损压缩视频数据的方法和装置
CN109410558B (zh) * 2018-06-20 2023-12-12 深圳市宏芯达科技有限公司 一种红外码智能压缩芯片
US11152992B2 (en) * 2018-12-21 2021-10-19 Qualcomm Incorporated Beam switch related information feedback in wireless communications
CN110365983B (zh) * 2019-09-02 2019-12-13 珠海亿智电子科技有限公司 一种基于人眼视觉系统的宏块级码率控制方法及装置
MX2022005366A (es) * 2019-11-05 2022-06-23 Lg Electronics Inc Metodo y aparato de codificacion de imagenes/video con base en tipo de segmento.
US11902584B2 (en) * 2019-12-19 2024-02-13 Tencent America LLC Signaling of picture header parameters
EP4091322A4 (en) 2020-02-19 2023-04-26 ByteDance Inc. SIGNALING OF PREDICTION WEIGHTS IN GENERAL CONSTRAINT INFORMATION OF A BITSTREAM

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2660139B1 (fr) * 1990-03-23 1995-08-25 France Etat Procede de codage et de transmission a au moins deux niveaux de qualite d'images numeriques appartenant a une sequence d'images, et dispositifs correspondants.
EP1237376B1 (en) 1997-06-09 2015-08-05 Hitachi, Ltd. Image information recording medium
US6697426B1 (en) * 2000-03-17 2004-02-24 Koninklijke Philips Electronics N.V. Reduction of layer-decoding complexity by reordering the transmission of enhancement layer frames
DE60332175D1 (de) * 2002-01-22 2010-05-27 Microsoft Corp Verfahren und System zur Verhinderung von Startkode-Emulation und Stopfdaten
CN101483772B (zh) * 2002-04-12 2011-05-25 松下电器产业株式会社 图像编码方法及图像编码装置
DK1742479T3 (da) * 2002-07-11 2009-12-14 Panasonic Corp Multihypotese B-billede virtuel displaybuffer med lån af plads i H.264 post-dekoder bufferen
ES2524117T3 (es) * 2002-08-08 2014-12-04 Panasonic Intellectual Property Corporation Of America Procedimiento de codificación y procedimiento de descodificación de imágenes en movimiento
CN1751518B (zh) * 2003-02-18 2010-12-01 诺基亚有限公司 图像编码方法
PL214807B1 (pl) 2003-04-14 2013-09-30 Adb Polska Sp Sposób laczenia w ukladzie przetwarzajacym strumienie MPEG pakietów kilku wejsciowych strumieni MPEG w jeden transportowy strumien wyjsciowy z jednoczesna korekcja oznaczen czasowych
CN100531396C (zh) * 2003-07-24 2009-08-19 日本电信电话株式会社 图像编码装置和方法以及图像解码装置和方法
JP3675464B2 (ja) * 2003-10-29 2005-07-27 ソニー株式会社 動画像符号化装置および動画像符号化制御方法
CN1898965B (zh) * 2003-12-25 2012-04-18 日本电气株式会社 运动图象编码方法和装置
US20050201471A1 (en) 2004-02-13 2005-09-15 Nokia Corporation Picture decoding method
ATE524924T1 (de) * 2004-04-28 2011-09-15 Panasonic Corp Strömungserzeugungsvorrichtung, strömungserzeugungsverfahren, kodierungsvorrichtung, kodierungsvorrichtung, aufzeichnungsmedium und programm dafür
TWI252695B (en) * 2004-07-21 2006-04-01 Realtek Semiconductor Corp Block-based motion estimation method
US20060083298A1 (en) 2004-10-14 2006-04-20 Nokia Corporation Reference picture management in video coding
JP4656912B2 (ja) * 2004-10-29 2011-03-23 三洋電機株式会社 画像符号化装置
JP4769717B2 (ja) * 2005-01-17 2011-09-07 パナソニック株式会社 画像復号化方法
JP4854046B2 (ja) * 2005-04-06 2012-01-11 トムソン ライセンシング エンハンスメント層ビデオ・データを符号化する方法および装置
JP2007110348A (ja) * 2005-10-12 2007-04-26 Ntt Docomo Inc 動画像符号化装置、動画像復号化装置、動画像符号化方法、動画像復号化方法、動画像符号化プログラム、および動画像復号化プログラム
EP1949702A2 (en) 2005-10-12 2008-07-30 Thomson Licensing Methods and apparatus for weighted prediction in scalable video encoding and decoding
EP1806930A1 (en) * 2006-01-10 2007-07-11 Thomson Licensing Method and apparatus for constructing reference picture lists for scalable video
JP4763549B2 (ja) * 2006-08-18 2011-08-31 富士通セミコンダクター株式会社 フレーム間予測処理装置、画像符号化装置、及び画像復号化装置
US20080095228A1 (en) * 2006-10-20 2008-04-24 Nokia Corporation System and method for providing picture output indications in video coding
JP4999859B2 (ja) * 2006-10-30 2012-08-15 日本電信電話株式会社 予測参照情報生成方法、動画像符号化及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体
EP2123052B1 (en) 2007-01-18 2010-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Quality scalable video data stream
WO2008102805A1 (ja) * 2007-02-23 2008-08-28 Nippon Telegraph And Telephone Corporation 映像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体
JP2009055519A (ja) * 2007-08-29 2009-03-12 Sony Corp 符号化処理装置、符号化処理方法、復号処理装置、及び、復号処理方法
US8782379B2 (en) * 2007-09-27 2014-07-15 Qualcomm Incorporated H.264 video decoder CABAC core optimization techniques
US8416858B2 (en) * 2008-02-29 2013-04-09 Cisco Technology, Inc. Signalling picture encoding schemes and associated picture properties
JP2010258738A (ja) * 2009-04-24 2010-11-11 Sony Corp 画像処理装置および方法、並びにプログラム
JP5282692B2 (ja) * 2009-07-27 2013-09-04 ソニー株式会社 画像符号化装置と画像符号化方法
CN101969544A (zh) 2009-07-27 2011-02-09 谢正旭 预收视数据调查方法
TW201121331A (en) * 2009-12-10 2011-06-16 Novatek Microelectronics Corp Picture decoder
US20120276348A1 (en) * 2010-01-07 2012-11-01 Clausi Robert N Resilient flooring compositions
JP2011199396A (ja) * 2010-03-17 2011-10-06 Ntt Docomo Inc 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム
JP5241771B2 (ja) 2010-06-08 2013-07-17 サントリーホールディングス株式会社 グルコース誘導性不活化/分解耐性トランスポーター遺伝子及びその用途
CA2803449C (en) 2010-07-02 2013-12-10 Librestream Technologies Inc. Adaptive frame rate control for video in a resource limited system
US9300970B2 (en) * 2010-07-09 2016-03-29 Samsung Electronics Co., Ltd. Methods and apparatuses for encoding and decoding motion vector
WO2012023281A1 (ja) * 2010-08-17 2012-02-23 パナソニック株式会社 動画像復号方法、動画像符号化方法、動画像復号装置、及び、動画像符号化装置
US8873627B2 (en) 2010-12-07 2014-10-28 Mediatek Inc Method and apparatus of video coding using picture structure with low-delay hierarchical B group
JP2012147127A (ja) * 2011-01-07 2012-08-02 Sony Corp 画像処理装置および方法
AP3858A (en) * 2011-06-30 2016-10-31 Ericsson Telefon Ab L M Reference picture signalling
US20130094774A1 (en) * 2011-10-13 2013-04-18 Sharp Laboratories Of America, Inc. Tracking a reference picture based on a designated picture on an electronic device
US8805098B2 (en) 2012-01-19 2014-08-12 Sharp Laboratories Of America, Inc. Inter reference picture set signaling and prediction on an electronic device
US8693793B2 (en) * 2012-01-19 2014-04-08 Sharp Laboratories Of America, Inc. Reducing reference picture set signal overhead on an electronic device
US8867852B2 (en) * 2012-01-19 2014-10-21 Sharp Kabushiki Kaisha Decoding a picture based on a reference picture set on an electronic device
US9210430B2 (en) * 2012-01-19 2015-12-08 Sharp Kabushiki Kaisha Reference picture set signaling and restriction on an electronic device
AU2013210955B2 (en) * 2012-01-20 2017-11-09 Nokia Technologies Oy Method for video coding and an apparatus, a computer-program product, a system, and a module for the same
JP6110410B2 (ja) 2012-01-31 2017-04-05 ヴィド スケール インコーポレイテッド スケーラブルな高効率ビデオコーディング(hevc)のための参照ピクチャセット(rps)シグナリング
US9369710B2 (en) * 2012-02-06 2016-06-14 Qualcomm Incorporated Reference picture list modification for video coding
CN104255031B (zh) 2012-02-29 2017-12-22 Lg 电子株式会社 层间预测方法和使用层间预测方法的装置
EP2830313B1 (en) * 2012-04-16 2019-10-16 Samsung Electronics Co., Ltd. Method and apparatus for determining reference picture set of image
US9516308B2 (en) 2012-04-27 2016-12-06 Qualcomm Incorporated Parameter set updates in video coding
JP5950726B2 (ja) 2012-06-28 2016-07-13 株式会社Nttドコモ 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム、動画像予測復号方法、動画像予測復号装置及び動画像予測復号プログラム
JP6182719B2 (ja) 2012-06-29 2017-08-23 ヴェロス メディア インターナショナル リミテッドVelos Media International Limited 符号化装置および符号化方法
DK2868082T3 (en) 2012-06-29 2016-09-12 ERICSSON TELEFON AB L M (publ) Coding and decoding video sequences comprehensive referencebilledsæt
JPWO2014002900A1 (ja) 2012-06-29 2016-05-30 ソニー株式会社 画像処理装置および画像処理方法
US9635369B2 (en) 2012-07-02 2017-04-25 Qualcomm Incorporated Video parameter set including HRD parameters
KR101678321B1 (ko) 2012-07-02 2016-11-21 노키아 테크놀로지스 오와이 비디오 코딩을 위한 방법 및 장치
US20140092988A1 (en) * 2012-09-28 2014-04-03 Sharp Laboratories Of America, Inc. Systems and methods for reference picture set extension
US9756335B2 (en) * 2013-07-02 2017-09-05 Qualcomm Incorporated Optimizations on inter-layer prediction signalling for multi-layer video coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Bross B et al: "High Efficiency Video Coding (HEVC) text specification draft 7", JCTVC-I1003, version 1, 10 May 2012.*
TK Tan, "AHG 21: Inter reference picture set prediction syntax and semantics,", JCTVC-G198r2, 2011.11.24, p.1-10.

Also Published As

Publication number Publication date
AU2013281946B2 (en) 2017-03-02
JP6823151B2 (ja) 2021-01-27
JP6182718B2 (ja) 2017-08-23
KR102165220B1 (ko) 2020-10-14
CN104396256B (zh) 2018-11-06
ZA201409038B (en) 2015-08-26
SG11201408589RA (en) 2015-01-29
MX2014016002A (es) 2015-04-13
WO2014002898A1 (ja) 2014-01-03
BR112014032228B1 (pt) 2023-01-17
US10623765B2 (en) 2020-04-14
TWI644564B (zh) 2018-12-11
JP6636122B2 (ja) 2020-01-29
CN109040762B (zh) 2022-04-15
RU2643490C2 (ru) 2018-02-01
TWI574554B (zh) 2017-03-11
JP2017195620A (ja) 2017-10-26
EP2869560A4 (en) 2016-09-07
TWI694715B (zh) 2020-05-21
EP2869559A4 (en) 2016-09-07
KR20150032257A (ko) 2015-03-25
WO2014002899A1 (ja) 2014-01-03
BR112014032227A2 (pt) 2017-06-27
TW201601520A (zh) 2016-01-01
US8811480B2 (en) 2014-08-19
SG11201408571RA (en) 2015-01-29
JPWO2014002899A1 (ja) 2016-05-30
MX2014015993A (es) 2015-03-20
TWI749530B (zh) 2021-12-11
MX342499B (es) 2016-10-03
BR112014032228A2 (pt) 2017-06-27
TW201717642A (zh) 2017-05-16
EP2869559A1 (en) 2015-05-06
AU2018201321B2 (en) 2020-02-27
JP2017195619A (ja) 2017-10-26
MX352958B (es) 2017-12-15
CN109040762A (zh) 2018-12-18
JP2019024273A (ja) 2019-02-14
SG10201909372YA (en) 2019-11-28
RU2642364C2 (ru) 2018-01-24
CA2875213A1 (en) 2014-01-03
AU2013281946A1 (en) 2014-12-04
SG10201610882XA (en) 2017-02-27
CA2875243A1 (en) 2014-01-03
JP6182719B2 (ja) 2017-08-23
MY171975A (en) 2019-11-09
JPWO2014002898A1 (ja) 2016-05-30
US10958930B2 (en) 2021-03-23
EP2869560A1 (en) 2015-05-06
CN109068141A (zh) 2018-12-21
MY170355A (en) 2019-07-23
CN104396256A (zh) 2015-03-04
KR20150032258A (ko) 2015-03-25
TW201907726A (zh) 2019-02-16
MX342497B (es) 2016-10-03
BR112014032227B1 (pt) 2023-01-24
CA2875213C (en) 2020-12-15
CN104380752A (zh) 2015-02-25
RU2018101252A (ru) 2019-02-21
JP2020039187A (ja) 2020-03-12
US20150092846A1 (en) 2015-04-02
RU2014152105A (ru) 2016-07-20
US20190149839A1 (en) 2019-05-16
US20150139324A1 (en) 2015-05-21
AU2013281947B2 (en) 2017-12-14
MY190544A (en) 2022-04-27
RU2018101252A3 (ko) 2021-06-17
TW201414313A (zh) 2014-04-01
JP6442566B2 (ja) 2018-12-19
RU2752695C2 (ru) 2021-07-30
US11399197B2 (en) 2022-07-26
TWI513199B (zh) 2015-12-11
JP6442565B2 (ja) 2018-12-19
RU2014152104A (ru) 2016-07-20
CA2875243C (en) 2022-11-22
AU2018201321A1 (en) 2018-03-15
TW202032990A (zh) 2020-09-01
US20210160534A1 (en) 2021-05-27
US20140003510A1 (en) 2014-01-02
AU2013281947A1 (en) 2014-12-04
US10595036B2 (en) 2020-03-17
AR091570A1 (es) 2015-02-11
CN104380752B (zh) 2018-10-23

Similar Documents

Publication Publication Date Title
JP6823151B2 (ja) 符号化装置および符号化方法
KR102407030B1 (ko) 화상 부호화 장치 및 방법 및 화상 복호 장치 및 방법
KR102242722B1 (ko) 디코딩 디바이스, 디코딩 방법, 인코딩 디바이스, 및 인코딩 방법
KR20160031461A (ko) 화상 복호 장치 및 방법
JP2015005899A (ja) 復号装置および復号方法、並びに、符号化装置および符号化方法
KR102197557B1 (ko) 화상 처리 장치 및 방법
KR102338669B1 (ko) 화상 처리 장치 및 방법, 및 기록 매체
WO2015098563A1 (ja) 画像符号化装置および方法、並びに画像復号装置および方法
WO2014203762A1 (ja) 復号装置および復号方法、並びに、符号化装置および符号化方法

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant