KR102073304B1 - 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치, 프로그램 및 집적 회로 - Google Patents

화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치, 프로그램 및 집적 회로 Download PDF

Info

Publication number
KR102073304B1
KR102073304B1 KR1020197006808A KR20197006808A KR102073304B1 KR 102073304 B1 KR102073304 B1 KR 102073304B1 KR 1020197006808 A KR1020197006808 A KR 1020197006808A KR 20197006808 A KR20197006808 A KR 20197006808A KR 102073304 B1 KR102073304 B1 KR 102073304B1
Authority
KR
South Korea
Prior art keywords
unit
information
image
picture
decoding
Prior art date
Application number
KR1020197006808A
Other languages
English (en)
Other versions
KR20190026984A (ko
Inventor
히사오 사사이
다카히로 니시
요우지 시바하라
총 순 림
빅토르 와하다니아
수안 징
슈 몬 텟 나잉
Original Assignee
선 페이턴트 트러스트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 선 페이턴트 트러스트 filed Critical 선 페이턴트 트러스트
Publication of KR20190026984A publication Critical patent/KR20190026984A/ko
Application granted granted Critical
Publication of KR102073304B1 publication Critical patent/KR102073304B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation

Abstract

화질의 향상 및 부호화 효율의 향상의 양립을 도모할 수 있는 화상 복호 방법은, 동화상을 부호화함으로써 생성된, 복수의 처리 단위와, 그 복수의 처리 단위에 대한 헤더를 포함하는 부호화 스트림을 복호하는 화상 복호 방법으로서, 그 복수의 처리 단위 중 적어도 하나의 처리 단위는, 복수의 보다 작은 처리 단위로 분할되도록 계층화되어 있고, 화상 복호 방법은, 헤더에 저장되어 있는 계층 깊이 정보를 해석함으로써, 복호에 필요한 파라미터가 저장되어 있는 처리 단위가 있는 계층을 특정하고(S101), 특정된 계층에 있는 처리 단위에 저장되어 있는 파라미터를 이용하여, 그 처리 단위를 복호한다(S102).

Description

화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치, 프로그램 및 집적 회로{IMAGE DECODING METHOD, IMAGE ENCODING METHOD, IMAGE DECODING DEVICE, IMAGE ENCODING DEVICE, PROGRAMME, AND INTEGRATED CIRCUIT}
본 발명은, 멀티미디어 데이터에 포함되는 화상 또는 동화상을 부호화하는 화상 부호화 방법, 및, 부호화된 화상 또는 동화상을 복호하는 화상 복호 방법 등에 관한 것이다.
MPEG-1, MPEG-2, MPEG-4 또는 MPEG-4 AVC 등의 동화상 압축 규격에서는, 통상, 압축된 픽쳐는 매크로 블록으로 불리는 직사각형 단위로 분할된다. 매크로 블록은, 통상, 복수의 화상 샘플인 이차원 블록으로서 정의된다. 이 복수의 화상 샘플은, 휘도 샘플에 대해서 폭 16픽셀 및 높이 16픽셀로 이루어진다. 매크로 블록의 압축률은, 매크로 블록의 각각에 있어서, 양자화 스케일 파라미터에 의해서 제어된다. 이 양자화 스케일 파라미터는, 모든 주파수 계수에 대해서 적용되는 양자화의 레벨을 정하고 있다. 이 양자화 스케일 파라미터는, 통상, 부호화순으로 직전의 매크로 블록의 양자화 스케일 파라미터와의 차분치로서 부호화되고, 압축된 매크로 블록의 헤더에 저장된다.
예를 들면, MPEG 규격 단체에 의한 고효율 동화상 부호화(HEVC) 규격 등의 개발 중의 새로운 동화상 규격에서는, 큰 단위로 픽쳐를 분할함으로써, 압축 동화상의 부호화 효율을 향상할 수 있는 것이 제안되어 있다(예를 들면, 비특허 문헌 1 참조). 즉, 픽쳐를 부호화 단위(CU:Coding Unit)로 분할할 수 있고, 그 부호화 단위를 매크로 블록보다 큰 사이즈로 할 수 있다. 예를 들면, 부호화 단위는, 휘도 샘플에 대해서 128×128 픽셀로 이루어지고, 매크로 블록보다 64배 정도 크다.
또, 부호화 효율의 향상을 도모하기 위해, 큰 부호화 단위를, 보다 작은 단위(서브 부호화 단위)로 분할할 수 있다. 부호화 단위 또는 서브 부호화 단위는 3개의 주성분을 갖는다. 이들 주성분은, 부호화 단위 헤더, 예측 단위(PU:Prediction Unit) 및 변환 단위(TU:Transform Unit)이다.
도 1은, 부호화 단위를 갖는 압축된 픽쳐의 구성을 나타내는 도면이다.
이 도 1에 나타내는 바와 같이, 픽쳐(D100)는 헤더(이하, 픽쳐 헤더라고 한다)와 보디로 이루어진다. 픽쳐 헤더는 픽쳐에 관한 파라미터(픽쳐 파라미터)를 포함하고, 보디는 픽쳐의 복수의 압축 샘플을 포함한다. 또, 보디는 부호화 단위(D102, D104) 등의 복수의 부호화 단위로 이루어지고, 그들 부호화 단위 중 몇개는 서브 부호화 단위로 분할된다. 예를 들면, 부호화 단위(D102)는 복수의 서브 부호화 단위(D106)로 분할되고, 또한, 서브 부호화 단위(D106)는 보다 작은 복수의 서브 부호화 단위(D108)로 분할된다. 부호화 단위(D104) 또는 서브 부호화 단위(D108)는 3개의 주성분을 갖는다. 구체적으로는, 부호화 단위(D104)는, 3개의 주성분으로서, 부호화 단위 헤더(D116), 예측 단위(D118) 및 변환 단위(D120)를 갖는다. 서브 부호화 단위(D108)는 3개의 주성분으로서, 서브 부호화 단위 헤더(D110), 예측 단위(D112) 및 변환 단위(D114)를 갖는다. 도 1에 나타내는 바와 같이, 변환 단위(D120)는 복수가 작은 서브 변환 단위(D122)로 분할되고, 서브 변환 단위(D122)는 복수의 보다 작은 서브 변환 단위(D124)로 분할된다. 가장 작은 변환 단위(서브 변환 단위)(D114, D124)는 블록의 양자화된 계수를 가지며, 이들 양자화된 계수의 역양자화에는, 양자화 스케일 파라미터가 필요하게 된다.
"Test Model under Consideration" Joint Collaborative Team on Video Coding(JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 2nd Meeting:Geneva, CH, 21-28 July, 2010, Document:JCTVC-B205
그러나, 상기 비특허 문헌 1의 화상 복호 방법 및 화상 부호화 방법에서는, 화질의 향상 및 부호화 효율의 향상의 양립을 도모할 수 없다는 문제가 있다. 즉, 복호 또는 복호화에 필요한 양자화 스케일 파라미터 등의 파라미터는, 픽쳐(D100)의 보디 전체에 대해서 그 파라미터가 적용되도록 픽쳐 헤더에 저장된다. 그 결과, 서브 부호화 단위, 예측 단위, 서브 예측 단위, 변환 단위, 또는 서브 변환 단위 등의 작은 처리 단위마다 화질을 조정할 수 없다. 또, 항상 최소의 처리 단위마다 파라미터가 적용되도록, 각 처리 단위에 파라미터가 저장되면, 부호량이 많아져 버린다.
그래서, 본 발명은, 이러한 문제를 감안하여 이루어진 것으로써, 화질의 향상 및 부호화 효율의 향상의 양립을 도모할 수 있는 화상 복호 방법 및 화상 부호화 방법을 제공하는 것을 목적으로 한다.
상기 목적을 달성하기 위해서, 본 발명의 일형태에 관련되는 화상 복호 방법은, 동화상을 부호화함으로써 생성된 복수의 처리 단위와, 상기 복수의 처리 단위에 대한 헤더를 포함하는 부호화 스트림을 복호하는 화상 복호 방법으로서, 상기 복수의 처리 단위 중 적어도 하나의 처리 단위는, 복수의 보다 작은 처리 단위로 분할되도록 계층화되어 있고, 상기 화상 복호 방법은, 상기 헤더에 저장되어 있는 계층 깊이 정보를 해석함으로써, 복호에 필요한 파라미터가 저장되어 있는 처리 단위가 있는 계층을 특정하고, 특정된 계층에 있는 상기 처리 단위에 저장되어 있는 상기 파라미터를 이용하여, 상기 처리 단위를 복호한다.
이로 인해, 처리 단위가 계층화되고, 하위의 계층에 있는 작은 처리 단위에 파라미터가 저장되어 있는 경우에는, 작은 처리 단위마다 다른 파라미터를 적용하여 그들 처리 단위를 복호할 수 있다. 그 결과, 화질을 향상할 수 있다. 또, 복호에 필요한 파라미터가 저장되어 있는 처리 단위가 있는 계층이, 계층 깊이 정보를 해석함으로써 특정되기 때문에, 그 계층은 최하위의 계층에 한정되지 않고, 임의의 계층으로 설정되는 것이 가능하다. 따라서, 최하위의 계층에 있는 최소의 처리 단위마다 파라미터가 저장되어 있는 경우보다, 부호화 스트림에 포함되는 모든 파라미터의 부호량을 억제할 수 있고, 부호화 효율을 향상할 수 있다. 이로 인해, 화질의 향상 및 부호화 효율의 향상의 양립을 도모할 수 있다. 또, 계층 깊이 정보를 해석함으로써, 파라미터가 저장되어 있는 처리 단위가 있는 계층이 특정되기 때문에, 파라미터가 저장되어 있는 처리 단위를 검색하는 처리 부담을 경감할 수 있다.
또, 상기 부호화 스트림은 직교 변환 및 양자화를 수반하는 부호화에 의해 생성되고, 상기 처리 단위는, 상위로부터 하위를 향해 처리 단위가 보다 작아지도록 계층화되어 있고, 최상위의 계층에는 가장 큰 처리 단위로서 부호화 단위가 있고, 상기 최상위의 계층보다 깊은 하위의 계층에는 상기 부호화 단위보다 작은 처리 단위로서 변환 단위가 있고, 상기 파라미터는 상기 변환 단위에 적용되는 양자화 파라미터이며, 상기 계층 깊이 정보는, 상기 최상위의 계층보다 깊은 하위의 계층을 나타내고, 상기 양자화 파라미터가 저장되어 있는 처리 단위가 있는 계층을 특정할 때에는, 상기 계층 깊이 정보에 의해 나타내어지는 계층, 또는 상기 계층보다 상위의 계층이며 상기 최상위의 계층 이외의 계층을 특정해도 된다.
이로 인해, 양자화 파라미터에 의한 양자화에 있어서의 화질의 향상과, 양자화 파라미터에 있어서의 부호화 효율의 향상의 양립을 도모할 수 있다.
또, 상기 헤더는, 상기 복수의 처리 단위로 이루어지는 픽쳐에 대한 픽쳐 헤더이며, 상기 계층 깊이 정보는 상기 픽쳐 헤더에 저장되어 있어도 된다.
이로 인해, 복호에 필요한 파라미터가 저장되어 있는 처리 단위가 있는 계층을, 픽쳐 전체에 대해서 공통의 계층으로서 특정할 수 있다.
또, 상기 처리 단위를 복호할 때에는, 상기 처리 단위 내에 있어서, 상기 직교 변환 및 양자화에 의해 생성된 변환 계수의 뒤에 배치되어 있는 상기 양자화 파라미터를 이용해도 된다.
이로 인해, 변환 계수가 있는 경우에만 양자화 파라미터가 저장되어 있기 때문에, 변환 계수가 없는 경우에는 양자화 파라미터가 저장되어 있지 않고, 부호화 효율의 향상을 도모할 수 있다.
또, 상기 목적을 달성하기 위해서, 본 발명의 일형태에 관련되는 화상 부호화 방법은, 동화상을 부호화함으로써, 복수의 처리 단위와, 상기 복수의 처리 단위에 대한 헤더를 포함하는 부호화 스트림을 생성하는 화상 부호화 방법으로서, 상기 복수의 처리 단위 중 적어도 하나의 처리 단위는, 복수의 보다 작은 처리 단위로 분할되도록 계층화되어 있고, 상기 화상 부호화 방법은, 상기 동화상을 부호화하고, 복호에 필요한 파라미터가 저장되어 있는 처리 단위가 있는 계층을 특정하기 위한 계층 깊이 정보를, 상기 헤더에 기록하고, 상기 계층 깊이 정보에 의해 특정되는 계층에 있는 상기 처리 단위에 상기 파라미터를 기록한다.
이로 인해, 처리 단위가 계층화되어 있는 경우에는, 하위의 계층에 있는 작은 처리 단위마다 다른 파라미터를 기록할 수 있다. 그 결과, 화상 복호 장치에서는, 작은 처리 단위마다 다른 파라미터를 적용하여 그들 처리 단위를 복호할 수 있고, 그 결과, 화질을 향상할 수 있다. 또, 복호에 필요한 파라미터가 저장되어 있는 처리 단위가 있는 계층을 특정하기 위한 계층 깊이 정보가 헤더에 기록됨으로써, 그 계층을 화상 복호 장치에 통지할 수 있다. 따라서, 그 계층을 최하위의 계층으로 한정하지 않고, 임의의 계층으로 설정할 수 있다. 따라서, 최하위의 계층에 있는 최소의 처리 단위마다 파라미터가 저장되어 있는 경우보다, 부호화 스트림에 포함되는 모든 파라미터의 부호량을 억제할 수 있고, 부호화 효율을 향상할 수 있다. 이로 인해, 화질의 향상 및 부호화 효율의 향상의 양립을 도모할 수 있다.
또, 상기 동화상을 부호화 할 때에는, 상기 동화상에 대해서 직교 변환 및 양자화를 행하고, 상기 처리 단위는, 상위로부터 하위를 향해 처리 단위가 보다 작아지도록 계층화되어 있고, 최상위의 계층에는 가장 큰 처리 단위로서 부호화 단위가 있고, 상기 최상위의 계층보다 깊은 하위의 계층에는 상기 부호화 단위보다 작은 처리 단위로서 변환 단위가 있고, 상기 파라미터는 상기 변환 단위에 적용되는 양자화 파라미터이며, 상기 계층 깊이 정보는, 상기 최상위의 계층보다 하위의 계층을 나타내고, 상기 양자화 파라미터를 기록할 때에는, 상기 계층 깊이 정보에 의해 나타내어지는 계층, 또는 상기 계층보다 상위의 계층이며 상기 최상위의 계층 이외의 계층에 있는 처리 단위에, 상기 파라미터를 기록해도 된다.
이로 인해, 양자화 파라미터에 의한 양자화에 있어서의 화질의 향상과, 양자화 파라미터에 있어서의 부호화 효율의 향상의 양립을 도모할 수 있다.
또, 상기 헤더는, 상기 복수의 처리 단위로 이루어지는 픽쳐에 대한 픽쳐 헤더이며, 상기 계층 깊이 정보를 기록할 때에는, 상기 계층 깊이 정보를 상기 픽쳐 헤더에 기록해도 된다.
이로 인해, 복호에 필요한 파라미터가 저장되어 있는 처리 단위가 있는 계층을, 픽쳐 전체에 대해서 공통으로 설정할 수 있다.
또, 상기 양자화 파라미터를 기록할 때에는, 상기 처리 단위 내에 있어서, 상기 직교 변환 및 양자화에 의해 생성된 변화 계수의 뒤에, 상기 양자화 파라미터를 기록해도 된다.
이로 인해, 변환 계수가 있는 경우에만 양자화 파라미터를 기록할 수 있고, 부호화 효율의 향상을 도모할 수 있다.
또한, 본 발명은, 이러한 화상 복호 방법 및 화상 부호화 방법으로서 실현하는 것이 가능할 뿐만 아니라, 그들 방법에 의해 화상을 복호 또는 부호화하는 장치, 집적 회로, 그들 방법에 의해 화상을 복호 또는 부호화하는 프로그램, 그 프로그램을 저장하는 기록 매체로서도 실현할 수 있다.
본 발명의 화상 복호 방법 및 화상 부호화 방법은, 화질의 향상 및 부호화 효율의 향상의 양립을 도모할 수 있다.
도 1은, 종래의 부호화 스트림의 구성을 나타내는 도면이다.
도 2는, 본 발명의 실시의 형태 1에 있어서의 화상 부호화 장치의 구성을 나타내는 블럭도이다.
도 3은, 본 발명의 실시의 형태 1에 있어서의 화상 복호 장치의 구성을 나타내는 블럭도이다.
도 4는, 다계층 블록 구조를 설명하기 위한 설명도이다.
도 5는, TMuC의 소프트웨어에 의해 생성되는 부호화 스트림의 구성을 나타내는 도면이다.
도 6A는, 본 발명의 실시의 형태 1에 있어서의 부호화 스트림의 구성을 나타내는 도면이다.
도 6B는, 본 발명의 실시의 형태 1에 있어서의 부호화 스트림의 구성을 나타내는 도면이다.
도 6C는, 본 발명의 실시의 형태 1에 있어서의 부호화 스트림의 구성을 나타내는 도면이다.
도 7은, 본 발명의 실시의 형태 1에 있어서의 다른 부호화 스트림의 구성을 나타내는 도면이다.
도 8A는, 본 발명의 실시의 형태 1에 있어서의 또 다른 부호화 스트림의 구성을 나타내는 도면이다.
도 8B는, 본 발명의 실시의 형태 1에 있어서의 또 다른 부호화 스트림의 구성을 나타내는 도면이다.
도 9A는, 본 발명의 실시의 형태 1에 있어서의 Max_quantization_unit_hierarchy_depth의 저장 위치를 나타내는 도면이다.
도 9B는, 본 발명의 실시의 형태 1에 있어서의 Max_quantization_unit_hierarchy_depth의 저장 위치를 나타내는 도면이다.
도 10A는, 본 발명의 실시의 형태 1에 있어서의 델타 양자화 스케일 파라미터를 나타내는 도면이다.
도 10B는, 본 발명의 실시의 형태 1에 있어서의 양자화 데드 존 오프셋 파라미터를 나타내는 도면이다.
도 10C는, 본 발명의 실시의 형태 1에 있어서의 인덱스를 나타내는 도면이다.
도 10D는, 본 발명의 실시의 형태 1에 있어서의 양자화 오프셋 파라미터를 나타내는 도면이다.
도 11은, 본 발명의 실시의 형태 1에 있어서의 화상 복호 장치에 의한 델타 QP의 복호를 나타내는 플로차트이다.
도 12는, 본 발명의 실시의 형태 1에 있어서의 화상 복호 장치에 의한 QP의 산출을 나타내는 플로차트이다.
도 13은, 본 발명의 실시의 형태 1에 있어서의 제1 변형예에 관련된 화상 복호 장치에 의한 복호를 나타내는 플로차트이다.
도 14는, 본 발명의 실시의 형태 1에 있어서의 제1 변형예에 관련된 화상 부호화 장치에 의한 부호화를 나타내는 플로차트이다.
도 15A는, 본 발명의 실시의 형태 1에 있어서의 제2 변형예에 관련된 화상 복호 장치에 의한 복호를 나타내는 플로차트이다.
도 15B는, 본 발명의 실시의 형태 1에 있어서의 제2 변형예에 관련된 화상 복호 장치에 의한 복호를 나타내는 플로차트이다.
도 16A는, 본 발명의 실시의 형태 1에 있어서의 제2 변형예에 관련된 화상 부호화 장치에 의한 부호화를 나타내는 플로차트이다.
도 16B는, 본 발명의 실시의 형태 1에 있어서의 제2 변형예에 관련된 화상 부호화 장치에 의한 부호화를 나타내는 플로차트이다.
도 17A는, 본 발명의 화상 복호 방법을 나타내는 플로차트이다.
도 17B는, 본 발명의 화상 부호화 방법을 나타내는 플로차트이다.
도 18A는, 본 발명의 실시의 형태 1에 있어서의 시퀀스 헤더의 신택스를 나타내는 도면이다.
도 18B는, 본 발명의 실시의 형태 1에 있어서의 픽쳐 헤더의 신택스를 나타내는 도면이다.
도 18C는, 본 발명의 실시의 형태 1에 있어서의 슬라이스 헤더의 신택스를 나타내는 도면이다.
도 19A는, 본 발명의 실시의 형태 1에 있어서의 부호화 단위(CU)의 신택스를 나타내는 도면이다.
도 19B는, 본 발명의 실시의 형태 1에 있어서의 예측 단위(PU)의 신택스를 나타내는 도면이다.
도 19C는, 본 발명의 실시의 형태 1에 있어서의 변환 단위(TU)의 신택스를 나타내는 도면이다.
도 20은, 컨텐츠 전송 서비스를 실현하는 컨텐츠 공급 시스템의 전체 구성도이다.
도 21은, 디지털 방송용 시스템의 전체 구성도이다.
도 22는, 텔레비전의 구성예를 나타내는 블럭도이다.
도 23은, 광디스크인 기록 미디어에 정보의 읽고 쓰기를 행하는 정보 재생/기록부의 구성예를 나타내는 블럭도이다.
도 24는, 광디스크인 기록 미디어의 구조예를 나타내는 도면이다.
도 25A는, 휴대 전화의 일례를 나타내는 도면이다.
도 25B는, 휴대 전화의 구성예를 나타내는 블럭도이다.
도 26은, 다중화 데이터의 구성을 나타내는 도면이다.
도 27은, 각 스트림이 다중화 데이터에 있어서 어떻게 다중화되어 있는지를 모식적으로 나타내는 도면이다.
도 28은, PES 패킷열에, 비디오 스트림이 어떻게 저장되는지를 더 자세하게 나타낸 도면이다.
도 29는, 다중화 데이터에 있어서의 TS 패킷과 소스 패킷의 구조를 나타내는 도면이다.
도 30은, PMT의 데이터 구성을 나타내는 도면이다.
도 31은, 다중화 데이터 정보의 내부 구성을 나타내는 도면이다.
도 32는, 스트림 속성 정보의 내부 구성을 나타내는 도면이다.
도 33은, 영상 데이터를 식별하는 단계를 나타내는 도면이다.
도 34는, 각 실시의 형태의 동화상 부호화 방법 및 동화상 복호 방법을 실현하는 집적 회로의 구성예를 나타내는 블럭도이다.
도 35는, 구동 주파수를 전환하는 구성을 나타내는 도면이다.
도 36은, 영상 데이터를 식별하고, 구동 주파수를 전환하는 단계를 나타내는 도면이다.
도 37은, 영상 데이터의 규격과 구동 주파수를 대응시킨 룩업 테이블의 일례를 나타내는 도면이다.
도 38A는, 신호 처리부의 모듈을 공유화하는 구성의 일례를 나타내는 도면이다.
도 38B는, 신호 처리부의 모듈을 공유화하는 구성의 다른 일례를 나타내는 도면이다.
이하, 본 발명의 실시의 형태에 대해서 도면을 이용하여 설명한다.
(실시의 형태 1)
도 2는, 본 실시의 형태에 있어서의 화상 부호화 장치의 구성을 나타내는 블럭도이다.
화상 부호화 장치(1000)는, 부호화 처리부(1100)와 부호화 제어부(1200)를 구비한다.
부호화 처리부(1100)는, 동화상을 블록마다 부호화함으로써 부호화 스트림을 생성한다. 이러한 부호화 처리부(1100)는, 감산기(1101), 직교 변환부(1102), 양자화부(1103), 엔트로피 부호화부(1104), 역양자화부(1105), 역직교 변환부(1106), 가산기(1107), 디블로킹 필터(1108), 메모리(1109), 면내 예측부(1110), 움직임 보상부(1111), 움직임 검출부(1112), 및 스위치(1113)를 구비한다.
감산기(1101)는, 동화상을 취득함과 더불어, 스위치(1113)로부터 예측 화상을 취득한다. 그리고, 감산기(1101)는, 그 동화상에 포함되는 부호화 대상 블록으로부터 예측 화상을 감산함으로써 차분 화상을 생성한다.
직교 변환부(1102)는, 감산기(1101)에 의해 생성된 차분 화상에 대해서 예를 들면 이산 코사인 변환 등의 직교 변환을 행함으로써, 그 차분 화상을 복수의 주파수 계수로 이루어지는 계수 블록으로 변환한다. 양자화부(1103)는, 그 계수 블록에 포함되는 각 주파수 계수를 양자화함으로써, 양자화된 계수 블록을 생성한다.
엔트로피 부호화부(1104)는, 양자화부(1103)에 의해서 양자화된 계수 블록과, 움직임 검출부(1112)에 의해서 검출된 움직임 벡터를 엔트로피 부호화(가변 길이 부호화)함으로써 부호화 스트림을 생성한다.
역양자화부(1105)는, 양자화부(1103)에 의해서 양자화된 계수 블록을 역양자화한다. 역직교 변환부(1106)는, 그 역양자화된 계수 블록에 포함되는 각 주파수 계수에 대해서 역이산 코사인 변환 등의 역직교 변환을 행함으로써, 복호 차분 화상을 생성한다.
가산기(1107)는, 스위치(1113)로부터 예측 화상을 취득하고, 그 예측 화상과, 역직교 변환부(1106)에 의해 생성된 복호 차분 화상을 가산함으로써 국소 복호 화상을 생성한다.
디블로킹 필터(1108)는, 가산기(1107)에 의해 생성된 국소 복호 화상의 블록 왜곡을 제거하고, 그 국소 복호 화상을 메모리(1109)에 저장한다.
면내 예측부(1110)는, 가산기(1107)에 의해 생성된 국소 복호 화상을 이용하여 부호화 대상 블록에 대해서 면내 예측을 행함으로써 예측 화상을 생성한다.
움직임 검출부(1112)는, 동화상에 포함되는 부호화 대상 블록에 대해서 움직임 벡터를 검출하고, 그 검출된 움직임 벡터를 움직임 보상부(1111)와 엔트로피 부호화부(1104)에 출력한다.
움직임 보상부(1111)는, 메모리(1109)에 저장되어 있는 화상을 참조 화상으로서 참조함과 더불어, 움직임 검출부(1112)에 의해서 검출된 움직임 벡터를 이용함으로써, 부호화 대상 블록에 대해서 움직임 보상을 행한다. 움직임 보상부(1111)는, 이러한 움직임 보상에 의해 부호화 대상 블록에 대한 예측 화상을 생성한다.
스위치(1113)는, 부호화 대상 블록이 면내 예측 부호화되는 경우에는, 면내 예측부(1110)에 의해 생성된 예측 화상을 감산기(1101) 및 가산기(1107)에 출력한다. 한편, 스위치(1113)는, 부호화 대상 블록이 화면간 예측 부호화되는 경우에는, 움직임 보상부(1111)에 의해 생성된 예측 화상을 감산기(1101) 및 가산기(1107)에 출력한다.
부호화 제어부(1200)는, 부호화 처리부(1100)를 제어한다. 구체적으로는, 부호화 제어부(1200)는, 양자화 파라미터가 저장되는 처리 단위와, 그 처리 단위가 있는 장소를 특정하기 위한 계층 깊이 정보를 결정한다. 양자화 파라미터는, 양자화부(1103)에 의한 양자화 및 역양자화부(1105)에 의한 역양자화에 이용되는 파라미터이다. 본 실시의 형태에 있어서의 처리 단위는 계층화되고, 어느 한 계층의 처리 단위가 상술의 블록에 상당한다. 계층 깊이 정보는, 예를 들면, 양자화 파라미터가 저장되어 있는 처리 단위가 있는 계층을 특정하기 위한 파라미터이다. 부호화 제어부(1200)는, 엔트로피 부호화부(1104)에 대해서, 양자화 파라미터를 상술의 결정된 처리 단위에 저장하도록 지시함과 더불어, 계층 깊이 정보를 부호화 스트림의 헤더(예를 들면 시퀀스 헤더 또는 픽쳐 헤더)에 저장하도록 지시한다.
도 3은, 본 실시의 형태에 있어서의 화상 복호 장치의 구성을 나타내는 블럭도이다.
화상 복호 장치(2000)는, 복호 처리부(2100)와 복호 제어부(2200)를 구비한다.
복호 처리부(2100)는, 부호화 스트림을 블록마다 복호함으로써 복호 화상을 생성한다. 이러한 복호 처리부(2100)는, 엔트로피 복호부(2101), 역양자화부(2102), 역직교 변환부(2103), 가산기(2104), 디블로킹 필터(2105), 메모리(2106), 면내 예측부(2107), 움직임 보상부(2108), 및 스위치(2109)를 구비한다.
엔트로피 복호부(2101)는, 부호화 스트림을 취득하고, 그 부호화 스트림을 엔트로피 복호(가변 길이 복호)한다.
역양자화부(2102)는, 엔트로피 복호부(2101)에 의한 엔트로피 복호에 의해 생성된, 양자화된 계수 블록을 역양자화한다. 역직교 변환부(2103)는, 그 역양자화된 계수 블록에 포함되는 각 주파수 계수에 대해서 역이산 코사인 변환 등의 역직교 변환을 행함으로써, 복호 차분 화상을 생성한다.
가산기(2104)는, 스위치(2109)로부터 예측 화상을 취득하고, 그 예측 화상과, 역직교 변환부(2103)에 의해 생성된 복호 차분 화상을 가산함으로써 복호 화상을 생성한다.
디블로킹 필터(2105)는, 가산기(2104)에 의해 생성된 복호 화상의 블록 왜곡을 제거하고, 그 복호 화상을 메모리(2106)에 저장함과 더불어, 그 복호 화상을 출력한다.
면내 예측부(1110)는, 가산기(2104)에 의해 생성된 복호 화상을 이용하여 복호 대상 블록에 대해서 면내 예측을 행함으로써 예측 화상을 생성한다.
움직임 보상부(2108)는, 메모리(2106)에 저장되어 있는 화상을 참조 화상으로서 참조함과 더불어, 엔트로피 복호부(2101)에 의한 엔트로피 복호에 의해 생성된 움직임 벡터를 이용함으로써, 복호 대상 블록에 대해서 움직임 보상를 행한다. 움직임 보상부(2108)는, 이러한 움직임 보상에 의해서 복호 대상 블록에 대한 예측 화상을 생성한다.
스위치(2109)는, 복호 대상 블록이 면내 예측 부호화되어 있는 경우에는, 면내 예측부(2107)에 의해 생성된 예측 화상을 가산기(2104)에 출력한다. 한편, 스위치(2109)는, 복호 대상 블록이 화면간 예측 부호화되어 있는 경우에는, 움직임 보상부(2108)에 의해 생성된 예측 화상을 가산기(2104)에 출력한다.
복호 제어부(2200)는, 복호 처리부(2100)를 제어한다. 구체적으로는, 복호 제어부(2200)는, 엔트로피 복호부(2101)에 의한 엔트로피 복호의 결과에 기초하여, 부호화 스트림의 헤더(예를 들면 시퀀스 헤더 또는 픽쳐 헤더)에 저장되어 있는 계층 깊이 정보를 해석한다. 그리고, 복호 제어부(2200)는, 그 계층 깊이 정보에 기초하여, 양자화 파라미터가 저장되어 있는 처리 단위의 계층을 특정하고, 그 계층에 있는 처리 단위에 포함되는 양자화 파라미터를 해석한다. 복호 제어부(2200)는, 그 해석된 양자화 파라미터를 이용한 역양자화를 역양자화부(2102)에 지시한다.
도 4는, 계층화된 처리 단위(다계층 블록 구조)를 설명하기 위한 설명도이다.
부호화 처리부(1100)는, 동화상을 처리 단위마다 부호화하고, 복호 처리부(2100)는, 부호화 스트림을 처리 단위마다 복호한다. 이 처리 단위는, 복수의 작은 처리 단위로 분할되고, 그 작은 처리 단위가 또한 복수의 보다 작은 처리 단위로 분할되도록 계층화되어 있다. 또한, 처리 단위가 작을 수록, 그 처리 단위가 있는 계층은 깊고, 하위에 있고, 그 계층을 나타내는 값은 크다. 반대로, 처리 단위가 클수록, 그 처리 단위가 있는 계층은 얕고, 상위에 있고, 그 계층을 나타내는 값은 작다.
처리 단위에는, 부호화 단위(CU)와 예측 단위(PU)와 변환 단위(TU)가 있다. CU는 최대 128×128 화소로 이루어지는 블록이며, 종래의 매크로 블록에 상당하는 단위이다. PU는, 화면간 예측의 기본 단위이다. TU는, 직교 변환의 기본 단위이며, 그 TU의 사이즈는 PU와 같거나, PU보다 한 계층 작은 사이즈이다. CU는, 예를 들면 4개의 서브 CU로 분할되고, 그 중 하나의 서브 CU는, 그 서브 CU와 같은 사이즈의 PU 및 TU를 포함한다(이 경우, PU와 TU는 서로 겹친 상태에 있다). 예를 들면, 그 PU는 또한 4개의 서브 PU로 분할되고, TU도 또한 4개의 서브 TU로 분할된다. 또한, 처리 단위가 복수의 작은 처리 단위로 분할되는 경우, 그 작은 처리 단위를 서브 처리 단위라고 한다. 예를 들면, 처리 단위가 CU인 경우에서는, 서브 처리 단위는 서브 CU이며, 처리 단위가 PU인 경우에서는, 서브 처리 단위는 서브 PU이며, 처리 단위가 TU인 경우에서는, 서브 처리 단위는 서브 TU이다.
구체적으로는, 이하와 같다.
픽쳐는 슬라이스로 분할된다. 슬라이스는 최대 부호화 단위의 시퀀스이다. 최대 부호화 단위의 위치는, 최대 부호화 단위 어드레스 lcuAddr에 의해 나타내어진다.
최대 부호화 단위를 포함하는 각각의 부호화 단위는, 4개의 부호화 단위로 분할된다. 그 결과, 부호화 단위의 크기의 쿼트트리 분할이 구성된다. 부호화 단위의 위치는, 최대 부호화 단위의 좌상단의 샘플(화소 또는 계수)을 기점으로 한 부호화 단위 인덱스 cuIdx에 의해 나타내어진다.
부호화 단위의 분할이 허가되어 있지 않은 경우, 그 부호화 단위는 예측 단위로서 취급된다. 부호화 단위와 마찬가지로, 예측 단위의 위치는, 최대 부호화 단위의 좌상단의 샘플을 기점으로 한 예측 단위 인덱스 puIdx에 의해 나타내어진다.
예측 단위는 복수의 파티션(예측 단위 파티션 또는 서브 PU)을 포함하고 있어도 된다. 예측 단위 파티션은, 예측 단위의 좌상단의 샘플을 기점으로 한 예측 단위 파티션 인덱스 puPartIdx에 의해서 나타내어진다.
예측 단위는 복수의 변환 단위를 포함하고 있어도 된다. 부호화 단위와 마찬가지로, 변환 단위는 4개의 작은 사이즈의 변환 단위(서브 변환 단위)로 분할되어도 된다. 이것은, 잔차 신호의 쿼트트리 분할을 허가한다. 변환 단위의 위치는, 예측 단위의 좌상단의 샘플을 기점으로 한 변환 단위 인덱스 tuIdx에 의해 나타내어진다.
여기서, 각 처리 단위의 정의는 이하와 같다.
CTB(coding tree block):정방형 영역의 쿼트트리 분할을 특정하기 위한 기본 단위. CTB는 정방형의 다양한 사이즈를 갖는다.
LCTB(largest coding tree block):슬라이스에 있어서 허가되는 가장 큰 사이즈의 CTB. 슬라이스는 중복되지 않는 복수의 LCTB로 이루어진다.
SCTB(smallest coding tree block):슬라이스에 있어서 허가되는 가장 작은 사이즈의 CTB. SCTB를 보다 작은 CTB로 분할하는 것은 허가되어 있지 않다.
PU(prediction unit):예측 처리를 특정하기 위한 기본 단위. PU의 사이즈는, 분할이 허가되어 있지 않은 CU의 사이즈와 같다. CU에서는, CU를 4개의 정방형 영역으로 분할하는 것이 허가되어 있는 반면에, PU에서는, PU를 임의의 형상의 복수의 파티션으로 분할할 수 있다.
TU(transform unit):변환 및 양자화를 특정하기 위한 기본 단위.
CU(coding unit):CTB와 동일.
LCU(largest coding unit):가장 큰 CTB와 동일.
SCU(smallest coding unit):가장 작은 CTB와 동일.
또, 양자화 파라미터는, 델타 양자화 스케일 파라미터(delta QP 또는 QP delta), 양자화 오프셋 파라미터, 인덱스(Qmatrix select idc) 및 양자화 데드 존 오프셋 파라미터 중 적어도 하나를 포함한다. 또한, 인덱스는, 복수의 양자화 스케일 매트릭스로부터 하나를 선택하기 위한 것이다.
델타 양자화 스케일 파라미터(delta QP or QP delta)는, 변환 계수에 적용되어야 할 양자화 스케일 파라미터와, 시퀀스 헤더 또는 슬라이스 헤더로 지정되는 양자화 스케일 파라미터(또는, Z주사순으로 직전의 양자화 스케일 파라미터)의 차분이다.
양자화 오프셋 파라미터는, 양자화 오프셋으로도 불리고, 양자화를 행할 때의 신호의 라운딩법의 조정치(오프셋치)이다. 따라서, 화상 부호화 장치(1000)는, 양자화를 행할 때에는, 그 양자화 오프셋을 부호화하고, 화상 복호 장치(2000)는, 그 부호화된 양자화 오프셋을 복호한다. 그리고, 화상 복호 장치(2000)는, 변환 계수를 역양자화할 때에는, 그 양자화 오프셋을 이용한 보정을 행한다.
인덱스(Qmatrix select idc)는, 적응 양자화 매트릭스로도 불리고, 복수의 양자화 스케일링 매트릭스로부터 어느 양자화 스케일링 매트릭스를 이용하는지를 나타내는 인덱스이다. 또, Qmatrix select idc는, 하나의 양자화 스케일링 매트릭스밖에 없는 경우에는, 그 양자화 스케일링 매트릭스를 사용하는지의 여부를 나타낸다. 또한, 적응용 양자화 매트릭스는 블록 단위(처리 단위)로 제어 가능하다.
양자화 데드 존 오프셋 파라미터는, 적응 데드 존으로도 불리고, 데드 존을 블록마다 적응적으로 변경하기 위한 제어 정보이다. 데드 존은, 주파수 계수가 양자화에 의해 0이 되는 폭(양자화 후에 +1 또는 -1이 되기 직전의 폭)이다.
도 5는, TMuC의 소프트웨어에 의해 생성되는 부호화 스트림의 구성을 나타내는 도면이다.
Test Model Under Consideration(TMuC)의 소프트웨어에 의해 생성되는 부호화 스트림에서는, 델타 QP는 LCU에 저장된다. 즉, 이 부호화 스트림에서는, 큰 처리 단위인 LCU에 포함되는 모든 계수에 대해서, 델타 QP 등의 동일한 양자화 파라미터가 적용된다. 그 결과, 화상의 세부에 대해서 양자화 파라미터를 조정하지 못하고, 화질이 저하해 버린다.
그래서, 본 실시의 형태의 화상 부호화 장치(1000)에 의해 생성되고, 화상 복호 장치(2000)에 의해 복호되는 부호화 스트림에서는, LCU보다 깊은 하위의 계층에 있는 처리 단위에 양자화 파라미터가 저장된다.
도 6A, 도 6B 및 도 6C는, 본 실시의 형태에 있어서의 부호화 스트림의 구성을 나타내는 도면이다.
도 6A에 나타내는 바와 같이, 본 실시의 형태에 있어서의 부호화 스트림에서는, LCU가 4개의 서브 CU로 분할되고, 서브 CU마다, 그 서브 CU에 적용되는 델타 QP가 그 서브 CU에 저장된다. 즉, LCU가 1계층째이면, LCU로부터 2계층째의 하위의 CU에 델타 QP가 저장된다. 또, 서브 CU 내에 있어서, 델타 QP는 그 서브 CU에 포함되는 모든 변환 계수의 뒤에 배치된다.
또한, 본 실시의 형태에 있어서의 부호화 스트림에서는, 델타 QP가 저장되어 있는 최하위의 처리 단위의 계층을 나타내는 계층 깊이 정보(Max_quantization_unit_hierarchy_depth)가 시퀀스 헤더에 저장된다. 예를 들면, Max_quantization_unit_hierarchy_depth=2이다.
화상 부호화 장치(1000)는, 이러한 부호화 스트림을 생성하여 출력한다. 한편, 화상 복호 장치(2000)는, 부호화 스트림의 시퀀스 헤더에 저장되어 있는 계층 깊이 정보(Max_quantization_unit_hierarchy_depth)를 해석함으로써, 델타 QP가 저장되어 있는 처리 단위(2계층째에 있는 서브 CU)를 특정하고, 그 처리 단위에 저장되어 있는 델타 QP를 해석한다. 그리고, 화상 복호 장치(2000)는, 그 델타 QP를, 그 델타 QP를 저장하고 있는 서브 CU의 각 변환 계수에 적용함으로써, 역양자화를 행한다.
또, 도 6B에 나타내는 바와 같이, 델타 QP 대신에 Qmatrix select idc가 저장되고 있어도 된다. 또한 도 6C에 나타내는 바와 같이, 델타 QP 및 Qmatrix select idc 등을 포함하는 양자화 파라미터가 저장되어 있어도 된다.
도 7은, 본 실시의 형태에 있어서의 다른 부호화 스트림의 구성을 나타내는 도면이다.
도 6A~도 6C에 나타내는 부호화 스트림에서는, 양자화 파라미터는 2계층째에 있는 서브 CU에 저장되어 있지만, 도 7에 나타내는 바와 같이, 보다 깊은 3계층째(Max_quantization_unit_hierarchy_depth=3)에 있는 서브 CU 또는 서브 TU에 양자화 파라미터가 저장되어 있어도 된다.
도 8A 및 도 8B는, 본 실시의 형태에 있어서의 또 다른 부호화 스트림의 구성을 나타내는 도면이다.
도 8A에 나타내는 부호화 스트림에서는, TU 또는 서브 TU에, 그 TU 또는 서브 TU에 적용되는 델타 QP가 저장된다. 또, TU 또는 서브 TU 내에 있어서, 델타 QP는 그 TU 또는 서브 TU에 포함되는 모든 변환 계수의 뒤에 배치된다.
또, 도 8B에 나타내는 바와 같이, 델타 QP 이외의 양자화 파라미터나, 델타 QP 및 Qmatrix select idc 등을 포함하는 양자화 파라미터가 양자화 유닛으로서 저장되어 있어도 된다.
도 9A 및 도 9B는, Max_quantization_unit_hierarchy_depth의 저장 위치를 나타내는 도면이다.
Max_quantization_unit_hierarchy_depth D300는, 도 9A에 나타내는 바와 같이, 시퀀스 헤더에 저장되어 있다. 또는, Max_quantization_unit_hierarchy_depth D302는, 도 9B에 나타내는 바와 같이, 픽쳐 헤더에 저장되어 있다. 즉, 화상 부호화 장치(1000)는, 복수의 처리 단위로 이루어지는 픽쳐에 대한 픽쳐 헤더에 계층 깊이 정보를 기록한다. 그 결과, 그 픽쳐 헤더에 계층 깊이 정보가 저장된다.
도 10A~도 10D는, 양자화 파라미터의 종류를 설명하기 위한 설명도이다.
양자화 파라미터 또는 양자화 유닛(D600)에는, 도 10A~도 10D에 나타내는 바와 같이, 델타 양자화 스케일 파라미터(D602), 양자화 데드 존 오프셋 파라미터(D604), 인덱스(D606), 및 양자화 오프셋 파라미터(D608) 중 적어도 하나가 포함된다. 또한, 델타 양자화 스케일 파라미터(D602)는 델타 QP이며, 인덱스(D606)는 Qmatrix select idc(적응 양자화 매트릭스)이다.
도 11은, 화상 복호 장치(2000)에 의한 델타 QP의 복호를 나타내는 플로차트이다.
우선, 화상 복호 장치(2000)는, 헤더에 저장되어 있는 계층 깊이 정보(Max_quantization_unit_hierarchy_depth)를 복호하고(단계 S1), 최소의 양자화의 처리 단위(minimum quantization unit)의 사이즈를 결정한다(단계 S2). 다음에, 화상 복호 장치(2000)는, 복호 대상의 CU가 그 사이즈인지의 여부를 판별한다(단계 S3). 여기서, 복호 대상의 CU가 minimum quantization unit의 사이즈라고 판별되면(단계 S3의 Yes), 화상 복호 장치(2000)는, 그 CU에 저장되어 있는 델타 QP를 복호한다(단계 S4). 한편, 복호 대상의 CU가 minimum quantization unit의 사이즈가 아니라고 판별되면(단계 S3의 No), 화상 복호 장치(2000)는, 또한 복호 대상의 CU의 플래그(split_coding_unit flag)가 0이며, 한편, 복호 대상의 CU의 사이즈가 minimum quantization unit의 사이즈보다 큰지의 여부를 판별한다(단계 S5). 또한, 상술의 split_coding_unit flag가 0이면, 그 플래그는 CU를 더 분할할 수 없는 것을 나타내고, split_coding_unit flag가 1이면, 그 플래그는 CU를 더 분할할 수 있는 것을 나타낸다. 즉, 화상 복호 장치(2000)는, 단계 S5에 있어서, 그 복호 대상의 CU를 더 분할하지 못하고, 또한, 복호 대상의 CU가 계층 깊이 정보에 의해 나타내어지는 계층보다 상위에 있는지의 여부를 판별한다. 여기서, 플래그가 0이며 복호 대상의 CU의 사이즈가 크다고 판별되면(단계 S5의 Yes), 화상 복호 장치(2000)는, 그 복호 대상의 CU에 저장되어 있는 델타 QP를 복호한다(단계 S6).
도 12는, 화상 복호 장치(2000)에 의한 QP(양자화 스케일 파라미터)의 산출을 나타내는 플로차트이다.
우선, 화상 복호 장치(2000)는, 4분할된 처리 단위에 있어서의 각 TU의 coded_block_flag(CBF)를 모두 더함으로써, 복호 대상의 CU에 포함되는 휘도와 색 차에 대한 TU가 부호화되어 있는지의 여부를 결정한다(단계 S11 및 S12). 또한, 각 TU에는, 변환 계수가 있는지의 여부를 나타내는 플래그인 상술의 coded_block_flag가 저장되어 있다. 여기서, 부호화되어 있다고 판별되면(단계 S12의 Yes), 화상 복호 장치(2000)는 TU에 포함되는 델타 QP를 복호한다(단계 S14). 한편, 부호화되어 있지 않다고 판별되면(단계 S12의 No), 화상 복호 장치(2000)는, 델타 QP를 0으로 설정한다(단계 S13). 또한, 화상 복호 장치(2000)는, Z주사순으로 직전의 CU의 QP를 결정하고(단계 S15), 복호 대상의 CU의 QP를 산출한다(단계 S16).
이와 같이 본 실시의 형태에 있어서의 화상 부호화 장치(1000)에서는, 처리 단위가 계층화되어 있는 경우에는, 하위의 계층에 있는 작은 처리 단위마다 다른 파라미터(예를 들면, 양자화 파라미터)를 기록할 수 있다. 그 결과, 화상 복호 장치(2000)에서는, 작은 처리 단위마다 다른 파라미터를 적용하여 그들 처리 단위를 복호할 수 있고, 그 결과, 화질을 향상할 수 있다. 또, 복호에 필요한 파라미터가 저장되어 있는 처리 단위가 있는 계층을 특정하기 위한 계층 깊이 정보가 헤더에 기록됨으로써, 그 계층을 화상 복호 장치(2000)에 통지할 수 있다. 따라서, 그 계층을 최하위의 계층으로 한정하지 않고, 임의의 계층으로 설정할 수 있다. 따라서, 최하위의 계층에 있는 최소의 처리 단위마다 파라미터가 저장되어 있는 경우보다, 부호화 스트림에 포함되는 모든 파라미터의 부호량을 억제할 수 있고, 부호화 효율을 향상할 수 있다. 이로 인해, 화질의 향상 및 부호화 효율의 향상의 양립을 도모할 수 있다. 또, 화상 복호 장치(2000)는, 계층 깊이 정보를 해석함으로써, 파라미터가 저장되어 있는 처리 단위가 있는 계층을 특정하기 위해, 파라미터가 저장되어 있는 처리 단위를 검색하는 처리 부담을 경감할 수 있고, 또한, 화상 부호화 장치(1000)에 의해 생성된 부호화 스트림을 적절히 복호할 수 있다. 또한, 본 실시의 형태에서는, 파라미터의 일례로서 양자화 파라미터를 들었지만, 파라미터는 어떠한 것이어도 된다.
(변형예 1)
도 13은, 본 실시의 형태에 있어서의 제1 변형예에 관련된 화상 복호 장치(2000)에 의한 복호를 나타내는 플로차트이다.
화상 복호 장치(2000)는, 우선, 픽쳐 헤더에 저장되어 있는 계층 깊이 정보(Max_quantization_unit_hierarchy_depth)를 해석하고(단계 S700), CU의 플래그를 해석한다(단계 S702). 다음에, 화상 복호 장치(2000)는, 그 해석된 플래그에 기초하여 CU를 보다 작은 복수의 서브 CU로 분할한다(단계 S704). 그리고, 화상 복호 장치(2000)는, 그 서브 CU의 계층을 결정하고(단계 S706), 그 결정된 계층이, Max_quantization_unit_hierarchy_depth에 의해서 나타내어지는 계층에 일치하는지의 여부를 판별한다(단계 S708).
여기서, 일치한다고 판별되면(단계 S708의 Yes), 화상 복호 장치(2000)는, 그 서브 CU에 저장되어 있는 양자화 파라미터를 해석하고(단계 S710), 그 해석된 양자화 파라미터에 의한 역양자화를 행함으로써, 그 서브 CU를 복호한다(단계 S712).
한편, 단계 S708에서 일치하지 않는다고 판별되면(단계 S708의 No), 화상 복호 장치(2000)는, 그 서브 CU를 4개의 보다 작은 서브 CU로 더 분할할 수 없는지를, 상술의 해석된 플래그에 기초하여 판별한다(단계 S714). 여기서, 할 수 없다고 판별되면(단계 S714의 Yes), 화상 복호 장치(2000)는, 그 서브 CU에 대해서 상술의 단계 S710 및 S712의 처리를 실행한다. 한편, 할 수 있다고 판별되면(단계 S714의 No), 화상 복호 장치(2000)는, 그들 4개의 보다 작은 서브 CU 중에서 어느 하나의 서브 CU를 선택하고(단계 S716), 그 선택된 서브 CU에 대해서 단계 S706으로부터의 처리를 실행한다.
도 14는, 본 실시의 형태에 있어서의 제1 변형예에 관련된 화상 부호화 장치(1000)에 의한 부호화를 나타내는 플로차트이다.
화상 부호화 장치(1000)는, 우선, 계층 깊이 정보(Max_quantization_unit_hierarchy_depth)를 픽쳐 헤더에 기록하고(단계 S800), CU를 분할하기 위한 최적의 사이즈를 결정한다(단계 S802). 다음에, 화상 부호화 장치(1000)는, 그 결정된 사이즈의 처리 단위로 CU를 분할하기 위한 플래그를 그 CU에 기록한다(단계 S804). 그리고, 화상 부호화 장치(1000)는, 부호화 대상의 처리 단위(CU 또는 서브 CU)의 계층을 결정하고(단계 S806), 그 결정된 계층이, 먼저 기록된 Max_quantization_unit_hierarchy_depth에 의해서 나타내어지는 계층에 일치하는지의 여부를 판별한다(단계 S808).
여기서, 일치한다고 판별되면(단계 S808의 Yes), 화상 부호화 장치(1000)는, 그 처리 단위(CU 또는 서브 CU)에 양자화 파라미터를 기록하고(단계 S810), 그 기록된 양자화 파라미터에 의한 양자화를 행함으로써, 그 처리 단위를 부호화한다(단계 S812). 또한, 화상 부호화 장치(1000)는, 그 기록된 양자화 파라미터에 의한 역양자화를 행함으로써, 그 부호화된 처리 단위를 복호한다(단계 S814).
한편, 단계 S808에서 일치하지 않는다고 판별되면(단계 S808의 No), 화상 부호화 장치(1000)는, 그 처리 단위를 4개의 보다 작은 서브 CU로 더 분할할 수 없는지를, 상술의 플래그에 기초하여 판별한다(단계 S816). 여기서, 할 수 없다고 판별되면(단계 S816의 Yes), 화상 부호화 장치(1000)는, 그 처리 단위에 대해서 상술의 단계 S810으로부터의 처리를 실행한다. 한편, 할 수 있다고 판별되면(단계 S816의 No), 화상 부호화 장치(1000)는, 그들 4개의 보다 작은 서브 CU 중에서 어느 하나의 서브 CU를 선택하고(단계 S818), 그 선택된 서브 CU에 대해서 단계 S806으로부터의 처리를 실행한다.
(변형예 2)
도 15A 및 도 15B는, 본 실시의 형태에 있어서의 제2 변형예에 관련된 화상 복호 장치(2000)에 의한 복호를 나타내는 플로차트이다.
화상 복호 장치(2000)는, 우선, 픽쳐 헤더에 저장되어 있는 계층 깊이 정보(Max_quantization_unit_hierarchy_depth)를 해석하고(단계 S900), CU의 플래그를 해석한다(단계 S902). 다음에, 화상 복호 장치(2000)는, 그 해석된 플래그에 기초하여 CU를 보다 작은 복수의 서브 CU로 분할한다(단계 S904). 그리고, 화상 복호 장치(2000)는, 그 서브 CU의 계층을 결정하고(단계 S906), 그 결정된 계층이, Max_quantization_unit_hierarchy_depth에 의해 나타내어지는 계층에 일치하는지의 여부를 판별한다(단계 S908).
여기서, 일치한다고 판별되면(단계 S908의 Yes), 화상 복호 장치(2000)는, 그 서브 CU(처리 단위)에 저장되어 있는 양자화 파라미터를 해석하고(단계 S910), 그 해석된 양자화 파라미터에 의한 역양자화를 행함으로써, 그 서브 CU(처리 단위)를 복호한다(단계 S912).
한편, 단계 S908에서 일치하지 않는다고 판별되면(단계 S908의 No), 화상 복호 장치(2000)는, 그 서브 CU를 4개의 보다 작은 서브 CU로 더 분할할 수 없는지를, 상술의 해석된 플래그에 기초하여 판별한다(단계 S914). 여기서, 할 수 있다고 판별되면(단계 S914의 No), 화상 복호 장치(2000)는, 그들 4개의 보다 작은 서브 CU 중에서 어느 하나의 서브 CU를 선택하고(단계 S928), 그 선택된 서브 CU에 대해서 단계 S906로부터의 처리를 실행한다.
한편, 단계 S914에서, 할 수 없다고 판별되면(단계 S914의 Yes), 화상 복호 장치(2000)는, 서브 CU 내의 TU에 있는 변환 분할 플래그를 해석하고(단계 S916), 그 해석된 변환 분할 플래그에 기초하여, TU를 보다 작은 처리 단위인 복수의 서브 TU로 분할한다(단계 S918). 또한, 화상 복호 장치(2000)는, 그 서브 TU에 대해서 LCU로부터의 계층을 결정하고(단계 S920), 그 결정된 계층이, Max_quantization_unit_hierarchy_depth에 의해서 나타내어지는 계층에 일치하는지의 여부를 판별한다(단계 S922).
여기서, 일치한다고 판별되면(단계 S922의 Yes), 화상 복호 장치(2000)는, 그 서브 TU에 대해서 단계 S910로부터의 처리를 실행한다. 한편, 단계 S922에서 일치하지 않는다고 판별되면(단계 S922의 No), 화상 복호 장치(2000)는, 그 서브 TU를 4개의 보다 작은 서브 TU로 더 분할할 수 없는지를, 상술의 해석된 변환 분할 플래그에 기초하여 판별한다(단계 S926). 여기서, 할 수 있다고 판별되면(단계 S926의 No), 화상 복호 장치(2000)는, 그들 4개의 보다 작은 서브 TU 중에서 어느 하나의 서브 TU를 선택하고(단계 S924), 그 선택된 서브 TU에 대해서 단계 S920으로부터의 처리를 실행한다. 한편, 할 수 없다고 판별되면(단계 S926의 Yes), 화상 복호 장치(2000)는, 단계 S910으로부터의 처리를 실행한다.
도 16A 및 도 16B는, 본 실시의 형태에 있어서의 제2 변형예에 관련된 화상 부호화 장치(1000)에 의한 부호화를 나타내는 플로차트이다.
화상 부호화 장치(1000)는, 우선, 계층 깊이 정보(Max_quantization_unit_hierarchy_depth)를 픽쳐 헤더에 기록하고(단계 S1000), CU를 분할하기 위한 최적의 사이즈를 결정한다(단계 S1002). 다음에, 화상 부호화 장치(1000)는, 그 결정된 사이즈의 처리 단위에 CU를 분할하기 위한 플래그를 그 CU에 기록한다(단계 S1004). 그리고, 화상 부호화 장치(1000)는, 부호화 대상의 처리 단위(CU 또는 서브 CU)의 계층을 결정하고(단계 S1006), 그 결정된 계층이, 먼저 기록된 Max_quantization_unit_hierarchy_depth에 의해서 나타내어지는 계층에 일치하는지의 여부를 판별한다(단계 S1008).
여기서, 일치한다고 판별되면(단계 S1008의 Yes), 화상 부호화 장치(1000)는, 그 처리 단위(CU 또는 서브 CU)에 양자화 파라미터를 기록하고(단계 S1010), 그 기록된 양자화 파라미터에 의한 양자화를 행함으로써, 그 처리 단위를 부호화한다(단계 S1030). 또한 화상 부호화 장치(1000)는, 그 기록된 양자화 파라미터에 의한 역양자화를 행함으로써, 그 부호화된 처리 단위를 복호한다(단계 S1012).
한편, 단계 S1008에서 일치하지 않는다고 판별되면(단계 S1008의 No), 화상 부호화 장치(1000)는, 그 처리 단위를 4개의 보다 작은 서브 CU로 더 분할할 수 없는지를, 상술의 플래그에 기초하여 판별한다(단계 S1014). 여기서, 할 수 있다고 판별되면(단계 S1014의 No), 화상 부호화 장치(1000)는, 그들 4개의 보다 작은 서브 CU 중에서 어느 하나의 서브 CU를 선택하고(단계 S1028), 그 선택된 서브 CU에 대해서 단계 S1006으로부터의 처리를 실행한다.
한편, 단계 S1014에서, 할 수 없다고 판별되면(단계 S1014의 Yes), 화상 부호화 장치(1000)는, 처리 단위(CU 또는 서브 CU) 내의 TU를 분할하기 위한 최적의 사이즈를 결정하고(단계 S1016), 그 결정된 사이즈의 처리 단위로 TU를 분할하기 위한 플래그(변환 분할 플래그)를 그 TU에 기록한다(단계 S1018). 다음에, 화상 부호화 장치(1000)는, 부호화 대상의 처리 단위(TU 또는 서브 TU)에 대해서 LCU로부터의 계층을 결정하고(단계 S1020), 그 결정된 계층이, 먼저 기록된 Max_quantization_unit_hierarchy_depth에 의해 나타내어지는 계층에 일치하는지의 여부를 판별한다(단계 S10022).
여기서, 일치한다고 판별되면(단계 S1022의 Yes), 화상 부호화 장치(1000)는, 그 처리 단위(TU 또는 서브 TU)에 대해서 단계 S1010으로부터의 처리를 실행한다(단계 S1010). 한편, 단계 S1022에서 일치하지 않는다고 판별되면(단계 S1022의 No), 화상 부호화 장치(1000)는, 그 처리 단위(TU 또는 서브 TU)를 4개의 보다 작은 서브 TU로 더 분할할 수 없는지를, 상술의 변환 분할 플래그에 기초하여 판별한다(단계 S1026). 여기서, 할 수 있다고 판별되면(단계 S1026의 No), 화상 부호화 장치(1000)는, 그들 4개의 보다 작은 서브 TU 중에서 어느 하나의 서브 TU를 선택하고(단계 S1024), 그 선택된 서브 TU에 대해서 단계 S1020으로부터의 처리를 실행한다. 한편, 단계 S1026에서, 할 수 없다고 판별되면(단계 S1026의 Yes), 화상 부호화 장치(1000)는, 단계 S1010으로부터의 처리를 실행한다. 즉, 화상 부호화 장치(1000)는, 그 처리 단위(TU 또는 서브 TU)에 양자화 파라미터를 기록(단계 S1010), 그 기록된 양자화 파라미터에 의한 양자화를 행함으로써, 그 처리 단위를 부호화한다(단계 S1030). 또한 화상 부호화 장치(1000)는, 그 기록된 양자화 파라미터에 의한 역양자화를 행함으로써, 그 부호화된 처리 단위를 복호한다(단계 S1012).
여기서, 본 발명에 있어서의 과제 및 해결 수단은, 이하와 같다고도 할 수 있다.
즉, 픽쳐를 큰 부호화 단위로 분할함으로써, 부호화 효율을 향상할 수 있다. 그러나, 양자화 파라미터가, 큰 부호화 단위에 대해서 설정되면, 그 부호화 단위가 큰 사이즈이기 때문에, 화상 부호화 장치에 있어서, 픽쳐의 사이즈를 조정하는 유연성이 없어진다. 양자화 파라미터는, 양자화 스케일 파라미터, 양자화 오프셋 파라미터, 및 인덱스 중 적어도 하나를 포함한다. 또한, 인덱스는, 복수의 양자화 스케일 매트릭스 중에서 하나의 양자화 스케일 매트릭스를 선택하기 위한 것이다.
예를 들면, TV 회의나 방범 카메라 등의 저지연이 요구되는 비디오 기기에서는, 하나의 픽쳐의 최대 사이즈를 조정 가능한 것이, 동화상의 부호화 및 복호화에 요구되는 중요한 특징이다. 이로 인해, 픽쳐의 가장 작은 단위로 양자화 파라미터를 조정하는 것이 필요하다. 한편, 그 외의 비디오 기기에서는, 상술과 같은 특징은 요구되지 않고, 그들 양자화 파라미터를 송신하기 위한 오버헤드를 저감함으로써 부호화 효율의 향상을 도모할 수 있다.
여기서, 부호화 단위, 예측 단위 및 변환 단위는 HEVC 규격의 기본 단위이다. 양자화 스케일 파라미터인 QP는, 차분치(델타치)의 역스케일링 처리를 위해서 사용되는 파라미터이며, 부호화 단위의 레벨로 송신된다. HEVC의 TMuC(Test Model Under Consideration) 사양에서는, 그 델타 양자화 스케일 파라미터는 송신되지 않는다. 그러나, 소프트웨어에서는, 델타 양자화 스케일 파라미터는 가장 큰 부호화 단위의 양자화의 마지막에 송신된다. 그러나, 예측 단위인 PU가 스킵되면, 부호화 단위인 CU의 깊이가 0이며, Y블록, U블록 및 V블록은 부호화되지 않는다.
즉, 이하와 같은 2개의 과제(과제 1 및 2)가 있다.
과제 1:부호화 델타 양자화 스케일 파라미터가, 최대 부호화 단위의 레벨 만큼으로 제한되어 있다. 저지연 또는 정비트 레이트의 비디오 기기에는, 부호화 단위마다 비트를 조정하는 것은 어려울지도 모른다. 바꾸어 말하면, TMuC 사양 및 소프트웨어에 있어서는, 정보의 저장 위치에 대한 제한이 어렵고, 양자화 파라미터를 최대 CU 단위로밖에 전송할 수 없다. 그 결과, 보다 작은 단위(처리 단위)로 양자화 파라미터를 컨트롤할 수 없다.
과제 2:변환 단위인 TU가 부호화되지 않을 때에는, 양자화 파라미터는 필요로 되지 않는다. 그러나, 현재의 기술에서는, TU와 PU가 스킵되는 경우만을 체크하고 있다. TU와 PU는 분리되어 있기 때문에, QP 델타의 송신은 TU에만 의존한다. 또, 변환 계수(공간 영역의 화상이 직교 변환 및 양자화되어 생성된 계수)가 없는 경우라도, 그 변환 계수에 대해서 불필요한 양자화 파라미터를 전송할 필요가 있다. 그 결과, 부호화된 화상을 나타내는 부호화 스트림이 중복되어 버린다.
상기 과제를 해결하기 위해서, 최대 부호화 단위마다 양자화 파라미터를 송신하는 새로운 방법을 제공한다. 이 송신 방법에서는, 화상 부호화 장치에 있어서, 블록의 세세한 레이트 제어의 기능성과, 높은 부호화 효율을 양립하기 위해서, 부호화 단위에 양자화 파라미터가 포함되어 송신되는 레벨을 선택할 수 있다.
이 발명의 새로운 점은, 데이터 레이트의 보다 좋은 제어를 위해서, 픽쳐의 최대 부호화 단위에 있어서의 양자화 파라미터의 위치를 결정한다는, 화상 부호화 장치에 있어서의 보다 높은 유연성 또는 기능성이다. 이 기능성은, 종래에는 없고, 최대 부호화 단위 및 양자화 파라미터를 이용하는 것과 조합함으로써, 부호화 동화상의 화질 향상을 도모할 수 있다. 이 발명의 새로운 점은, 부호화 단위에 있어서의 양자화 파라미터의 위치이다. 특히, 종래에서는, 예를 들면 매크로 블록 등의 부호화 단위의 헤더에 양자화 파라미터가 포함된다. 그러나, 본 발명에서는, 양자화 파라미터는, 블록에 관한 예측 및 차분 정보가 부호화된 후에, 부호화 단위의 마지막에 부호화된다.
즉, 상술의 과제 1 및 과제 2에 대해서는, 이하와 같은 해결 수단(해결 수단 1 및 해결 수단 2)을 생각할 수 있다.
해결 수단 1:작은 CU 레벨로 델타 QP를 송신하기 위해서, 헤더(시퀀스 파라미터 세트/픽쳐 파라미터 세트/슬라이스 헤더)에 계층 깊이 정보를 삽입한다. 즉, 화상 부호화 장치는, 최대 CU보다 깊은 계층에 있는 작은 단위(처리 단위)에 양자화 파라미터를 저장하고, 그 처리 단위가 있는 계층(계층의 깊이)을 특정하기 위한 계층 깊이 정보를 시퀀스 헤더 또는 픽쳐 헤더 등의 헤더에 저장한다. 화상 복호 장치는, 그 헤더에 있는 계층 깊이 정보를 해석하여 계층(계층의 깊이)을 특정하고, 그 특정된 계층에 있는 처리 단위에 저장되어 있는 양자화 파라미터를 해석한다. 여기서, 계층 깊이 정보는, 양자화 파라미터를 저장하고 있는 처리 단위가 존재할 수 있는 가장 깊은(가장 하위에 있는) 계층을 나타내고 있어도 된다. 이 경우, 화상 복호 장치는, 그 계층 깊이 정보에 의해서 나타내어지는 최하위의 계층, 또는 그 계층보다 상위의 계층이며 최상위의 계층 이외의 계층을 특정한다. 또, 계층 깊이 정보는, 미리 정해진 계층의 CU(예를 들면, 최하위의 계층에 있는 CU)에 양자화 파라미터가 저장되어 있는지의 여부를 나타내는 플래그여도 된다.
해결 수단 2:델타 QP의 송신을 스킵하기 위해서, TU 부호화 블록 플래그 또는 패턴을 체크하는 새로운 조건을 도입한다. 또, 화상 부호화 장치는, 양자화 파라미터를 전송할 때에는, TU 내의 마지막에 양자화 파라미터를 배치한다. 이로 인해, 화상 복호 장치는, 양자화 파라미터가 불필요한 경우(예를 들면 변환 계수가 없는 경우)를 판단할 수 있다. 그 결과, 화상 부호화 장치는 불필요한 양자화 파라미터를 전송할 필요가 없고, 부호량을 삭감할 수 있다.
이상, 본 발명의 화상 복호 방법 및 화상 부호화 방법에 대해서, 상기 실시의 형태 및 그 변형예를 이용하여 설명했지만, 본 발명은 이것들에 한정되는 것은 아니다.
예를 들면, 상기 실시의 형태 1 및 그 변형예에 있어서의 화상 복호 방법에서는, 도 11의 단계 S3 및 S5 등의 처리를 포함하고 있지만, 본 발명은 그들 처리가 없어도, 상술의 효과를 나타낼 수 있다.
도 17A는, 본 발명의 화상 복호 방법을 나타내는 플로차트이다.
본 발명의 화상 복호 방법은, 동화상을 부호화함으로써 생성된, 복수의 처리 단위와, 그 복수의 처리 단위에 대한 헤더를 포함하는 부호화 스트림을 복호하는 화상 복호 방법이다. 여기서, 그 복수의 처리 단위 중 적어도 하나의 처리 단위는, 복수의 보다 작은 처리 단위로 분할되도록 계층화되어 있다. 이 화상 복호 방법에서는, 우선, 헤더에 저장되어 있는 계층 깊이 정보를 해석함으로써, 복호에 필요한 파라미터가 저장되어 있는 처리 단위가 있는 계층을 특정한다(단계 S101). 다음에, 특정된 계층에 있는 처리 단위에 저장되어 있는 파라미터를 이용하여, 그 처리 단위를 복호한다(단계 S102).
이러한, 단계 S101 및 S102의 처리를 행함으로서, 실시의 형태 1과 같은 효과를 나타낼 수 있고, 그 외의 처리는 본 발명에 있어서 필수의 처리는 아니다. 또, 본 발명의 화상 복호 장치는, 단계 S101 및 S102의 각각의 처리를 실행하는 구성 요소를 구비함으로써, 실시의 형태 1과 같은 효과를 나타낼 수 있고, 그 외의 구성 요소는 본 발명에 있어서 필수의 구성 요소는 아니다. 또한, 실시의 형태 1의 화상 복호 장치(2000)에서는, 복호 제어부(2200)가 단계 S101의 처리를 실행하고, 복호 처리부(2100)가 단계 S102의 처리를 실행한다.
또, 상기 실시의 형태 1 및 그 변형예에 있어서의 화상 부호화 방법에서는, 도 14의 단계 S804 등의 처리를 포함하고 있지만, 본 발명은 그러한 처리가 없어도, 상술의 효과를 나타낼 수 있다.
도 17B는, 본 발명의 화상 부호화 방법을 나타내는 플로차트이다.
본 발명의 화상 부호화 방법은, 동화상을 부호화함으로써, 복수의 처리 단위와, 그 복수의 처리 단위에 대한 헤더를 포함하는 부호화 스트림을 생성하는 화상 부호화 방법이다. 여기서, 그 복수의 처리 단위 중 적어도 하나의 처리 단위는, 복수의 보다 작은 처리 단위로 분할되도록 계층화되어 있다. 이 화상 부호화 방법에서는, 우선, 동화상을 부호화한다(단계 S111). 다음에, 복호에 필요한 파라미터가 저장되어 있는 처리 단위가 있는 계층을 특정하기 위한 계층 깊이 정보를, 그 헤더에 기록한다(단계 S112). 또한, 계층 깊이 정보에 의해 특정되는 계층에 있는 처리 단위에, 그 파라미터를 기록한다(단계 S113).
이러한, 단계 S111~S113의 처리를 행함으로써, 실시의 형태 1과 같은 효과를 나타낼 수 있고, 그 외의 처리는 본 발명에 있어서 필수의 처리는 아니다. 또, 본 발명의 화상 부호화 장치는, 단계 S111~S113의 각각의 처리를 실행하는 구성 요소를 구비함으로써, 실시의 형태 1과 같은 효과를 나타낼 수 있고, 그 외의 구성 요소는 본 발명에 있어서 필수의 구성 요소는 아니다. 또한, 실시의 형태 1의 화상 부호화 장치(1000)에서는, 부호화 제어부(1200)에 의한 제어에 기초하여 엔트로피 부호화부(1104)가 단계 S111~S113의 처리를 실행한다.
또한, 본 발명에 관련된 헤더의 신택스은, 도 18A~도 18C에 나타내는 바와 같고, 본 발명에 관련된 처리 단위(CU, PU 및 TU)의 신택스는, 도 19A~도 19C에 나타내는 바와 같다.
도 18A는, 시퀀스 헤더의 신택스를 나타내는 도면이다. 이 시퀀스 헤더에서는, 예를 들면, 참조할 수 있는 최대의 참조 프레임수(max_num_ref_frames), 및 픽쳐의 사이즈(pic_widht_in_luma_samples, pic_height_in_luma_samples) 등이 규정되어 있다.
도 18B는, 픽쳐 헤더의 신택스를 나타내는 도면이다. 이 픽쳐 헤더에서는, 신택스의 일부 d1에 나타내는 바와 같이, 참조 방향(전방향 및 후방향)마다 참조 인덱스를 유지할 수 있는 수가 규정되어 있음과 더불어, 초기 QP(초기 QP에서 26을 뺀 수)가 규정되어 있다.
도 18C는, 슬라이스 헤더의 신택스를 나타내는 도면이다. 이 슬라이스 헤더는, 신택스의 일부 d2에 나타내는 바와 같이, 상술의 참조 인덱스가 유지할 수 있는 수를 슬라이스마다 개서 가능하게 구성되어 있다. 또, 이 슬라이스 헤더에는, 신택스의 다른 부분 d3에 나타내는 바와 같이, 상술의 픽쳐 헤더에 규정된 초기 QP로부터의 QP의 차분치가 규정되어 있다.
도 19A는, CU의 신택스를 나타내는 도면이다. 이 CU에서는, 신택스의 일부 d4 및 d5에 나타내는 바와 같이, 그 CU에 대한 PU 및 TU가 규정되어 있다.
도 19B는, PU의 신택스를 나타내는 도면이다. 이 PU는, 신택스의 일부 d6 및 d8에 나타내는 바와 같이, 참조 방향마다 참조 인덱스를 가지며, 또한 신택스의 다른 부분 d7 및 d9에 나타내는 바와 같이, 참조 방향마다 적응 움직임 벡터 해상도 전환 플래그(mvres)를 갖고 있다.
도 19 C는, TU의 신택스를 나타내는 도면이다. 이 TU는, 신택스의 일부 d10에 나타내는 바와 같이, 차분 화상이 직교 변환되어 양자화된 계수(변환 계수)를 갖는다.
(실시의 형태 2)
상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 화상 복호 방법의 구성을 실현하기 위한 프로그램을 기억 미디어에 기록함으로써, 상기 각 실시의 형태에서 나타낸 처리를 독립된 컴퓨터 시스템에 있어서 간단하게 실시하는 것이 가능해진다. 기억 미디어는, 자기 디스크, 광디스크, 광자기 디스크, IC 카드, 반도체 메모리 등, 프로그램을 기록할 수 있는 것이면 된다.
또한 여기서, 상기 각 실시의 형태에서 나타낸 화상 부호화 방법이나 화상 복호 방법의 응용예와 그것을 이용한 시스템을 설명한다.
도 20은, 컨텐츠 전송 서비스를 실현하는 컨텐츠 공급 시스템 ex100의 전체 구성을 나타내는 도면이다. 통신 서비스의 제공 영역을 원하는 크기로 분할하고, 각 셀 내에 각각 고정 무선국인 기지국(ex106, ex107, ex108, ex109, ex110)이 설치되어 있다.
이 컨텐츠 공급 시스템(ex100)은, 인터넷(ex101)에 인터넷 서비스 프로바이더(ex102) 및 전화망(ex104), 및 기지국(ex106 내지 ex110)을 통해, 컴퓨터(ex111), PDA(Personal Digital Assistant)(ex112), 카메라(ex113), 휴대 전화(ex114), 게임기(ex115) 등의 각 기기가 접속된다.
그러나, 컨텐츠 공급 시스템(ex100)은 도 20과 같은 구성으로 한정되지 않고, 몇 개의 요소를 조합하여 접속하도록 해도 된다. 또, 고정 무선국인 기지국(ex106 내지 ex110)을 통하지 않고, 각 기기가 전화망(ex104)에 직접 접속되어도 된다. 또, 각 기기가 근거리 무선 등을 통해 직접 서로 접속되어 있어도 된다.
카메라(ex113)는 디지털 비디오 카메라 등의 동화상 촬영이 가능한 기기이며, 카메라(ex116)는 디지털 카메라 등의 정지화상 촬영, 동화상 촬영이 가능한 기기이다. 또, 휴대 전화(ex114)는, GSM(Global System for Mobile Communications) 방식, CDMA(Code Division Multiple Access) 방식, W-CDMA(Wideband-Code Division Multiple Access) 방식, 혹은 LTE(Long Term Evolution) 방식, HSPA(High Speed Packet Access)의 휴대 전화기, 또는 PHS(Personal Handyphone System) 등이며, 어느 것이어도 상관없다.
컨텐츠 공급 시스템(ex100)에서는, 카메라(ex113) 등이 기지국(ex109), 전화망(ex104)을 통해서 스트리밍 서버(ex103)에 접속됨으로써, 라이브 전송 등이 가능해진다. 라이브 전송에서는, 유저가 카메라(ex113)를 이용하여 촬영하는 컨텐츠(예를 들면, 음악 라이브의 영상 등)에 대해서 상기 각 실시의 형태에서 설명한 바와 같이 부호화 처리를 행하고, 스트리밍 서버(ex103)에 송신한다. 한편, 스트리밍 서버(ex103)는 요구가 있던 클라이언트에 대해서 송신된 컨텐츠 데이터를 스트림 전송한다. 클라이언트로서는, 상기 부호화 처리된 데이터를 복호하는 것이 가능한, 컴퓨터(ex111), PDA(ex112), 카메라(ex113), 휴대 전화(ex114), 게임기(ex115) 등이 있다. 전송된 데이터를 수신한 각 기기에서는, 수신한 데이터를 복호 처리하여 재생한다.
또한, 촬영한 데이터의 부호화 처리는 카메라(ex113)로 행해도, 데이터의 송신 처리를 하는 스트리밍 서버(ex103)로 행해도 되고, 서로 분담하여 행해도 된다. 마찬가지로 전송된 데이터의 복호 처리는 클라이언트로 행해도, 스트리밍 서버(ex103)로 행해도 되고, 서로 분담하여 행해도 된다. 또, 카메라(ex113)에 한정되지 않고, 카메라(ex116)로 촬영한 정지화상 및/또는 동화상 데이터를, 컴퓨터(ex111)를 통해 스트리밍 서버(ex103)에 송신해도 된다. 이 경우의 부호화 처리는 카메라(ex116), 컴퓨터(ex111), 스트리밍 서버(ex103) 중 어느 것으로 행해도 되고, 서로 분담해서 행해도 된다.
또, 이들 부호화·복호 처리는, 일반적으로 컴퓨터(ex111)나 각 기기가 갖는 LSI(ex500)에 있어서 처리한다. LSI(ex500)는, 원칩이어도 복수 칩으로 이루어지는 구성이어도 된다. 또한, 동화상 부호화·복호용의 소프트웨어를 컴퓨터(ex111) 등으로 판독 가능한 어떠한 기록 미디어(CD-ROM, 플렉시블 디스크, 하드 디스크 등)에 짜넣고, 그 소프트웨어를 이용하여 부호화·복호 처리를 행해도 된다. 또한, 휴대 전화(ex114)가 카메라가 달린 경우에는, 그 카메라로 취득한 동화상 데이터를 송신해도 된다. 이 때의 동화상 데이터는 휴대 전화(ex114)가 갖는 LSI(ex500)로 부호화 처리된 데이터이다.
또, 스트리밍 서버(ex103)는 복수의 서버나 복수의 컴퓨터이며, 데이터를 분산하여 처리하거나 기록하거나 전송하는 것이어도 된다.
이상과 같이 하여, 컨텐츠 공급 시스템(ex100)에서는, 부호화된 데이터를 클라이언트가 수신하여 재생할 수 있다. 이와 같이 컨텐츠 공급 시스템(ex100)에서는, 유저가 송신한 정보를 리얼타임으로 클라이언트가 수신하여 복호하고, 재생할 수 있고, 특별한 권리나 설비를 갖지 않는 유저라도 개인 방송을 실현할 수 있다.
또한, 컨텐츠 공급 시스템(ex100)의 예에 한정하지 않고, 도 21에 나타내는 바와 같이, 디지털 방송용 시스템(ex200)에도, 상기 각 실시의 형태의 적어도 화상 부호화 장치 또는 화상 복호 장치 중 어느 하나를 짜넣을 수 있다. 구체적으로는, 방송국(ex201)에서는 영상 데이터에 음악 데이터 등이 다중화된 다중화 데이터가 전파를 통해 통신 또는 위성(ex202)에 전송된다. 이 영상 데이터는 상기 각 실시의 형태에서 설명한 화상 부호화 방법에 의해 부호화된 데이터이다. 이것을 받은 방송 위성(ex202)은, 방송용의 전파를 발신하고, 이 전파를 위성 방송의 수신이 가능한 가정의 안테나(ex204)가 수신한다. 수신한 다중화 데이터를, 텔레비전(수신기)(ex300) 또는 셋톱 박스(STB)(ex217) 등의 장치가 복호하여 재생한다.
또, DVD, BD 등의 기록 미디어(ex215)에 기록한 다중화 데이터를 판독하고 복호하는, 또는 기록 미디어(ex215)에 영상 신호를 부호화하고, 또 경우에 따라서는 음악 신호와 다중화하여 기록하는 리더/레코더(ex218)에도 상기 각 실시의 형태에서 나타낸 화상 복호 장치 또는 화상 부호화 장치를 실장하는 것이 가능하다. 이 경우, 재생된 영상 신호는 모니터(ex219)에 표시되고, 다중화 데이터가 기록된 기록 미디어(ex215)에 의해 다른 장치나 시스템에 있어서 영상 신호를 재생할 수 있다. 또, 케이블 텔레비전용의 케이블(ex203) 또는 위성/지상파 방송의 안테나(ex204)에 접속된 셋톱 박스(ex217) 내에 화상 복호 장치를 실장하고, 이것을 텔레비전의 모니터(ex219)로 표시해도 된다. 이 때 셋톱 박스가 아니라, 텔레비전 내에 화상 복호 장치를 짜넣어도 된다.
도 22는, 상기 각 실시의 형태에서 설명한 화상 복호 방법 및 화상 부호화 방법을 이용한 텔레비전(수신기)(ex300)을 나타내는 도면이다. 텔레비전(ex300)은, 상기 방송을 수신하는 안테나(ex204) 또는 케이블(ex203) 등을 통해 영상 데이터에 음성 데이터가 다중화된 다중화 데이터를 취득, 또는 출력하는 튜너(ex301)와, 수신한 다중화 데이터를 복조하는, 또는 외부에 송신하는 다중화 데이터로 변조하는 변조/복조부(ex302)와, 복조한 다중화 데이터를 영상 데이터와, 음성 데이터로 분리하는, 또는 신호 처리부(ex306)에서 부호화된 영상 데이터, 음성 데이터를 다중화하는 다중/분리부(ex303)를 구비한다.
또, 텔레비전(ex300)은, 음성 데이터, 영상 데이터 각각을 복호하는, 또는 각각의 정보를 부호화하는 음성 신호 처리부(ex304), 영상 신호 처리부(ex305)를 갖는 신호 처리부(ex306)와, 복호한 음성 신호를 출력하는 스피커(ex307), 복호한 영상 신호를 표시하는 디스플레이 등의 표시부(ex308)를 갖는 출력부(ex309)를 갖는다. 또한 텔레비전(ex300)은, 유저 조작의 입력을 접수하는 조작 입력부(ex312) 등을 갖는 인터페이스부(ex317)를 갖는다. 또한 텔레비전(ex300)은, 각부를 통괄적으로 제어하는 제어부(ex310), 각부에 전력을 공급하는 전원 회로부(ex311)를 갖는다. 인터페이스부(ex317)는, 조작 입력부(ex312) 이외에, 리더/레코더(ex218) 등의 외부 기기와 접속되는 브리지(ex313), SD 카드 등의 기록 미디어(ex216)를 장착 가능하게 하기 위한 슬롯부(ex314), 하드 디스크 등의 외부 기록 미디어와 접속하기 위한 드라이버(ex315), 전화망과 접속하는 모뎀(ex316) 등을 갖고 있어도 된다. 또한 기록 미디어(ex216)는, 저장하는 불휘발성/휘발성의 반도체 메모리 소자에 의해 전기적으로 정보의 기록을 가능하게 한 것이다. 텔레비전(ex300)의 각부는 동기 버스를 통해 서로 접속되어 있다.
우선, 텔레비전(ex300)이 안테나(ex204) 등에 의해 외부로부터 취득한 다중화 데이터를 복호하고, 재생하는 구성에 대해 설명한다. 텔레비전(ex300)은, 리모트 콘트롤러(ex220) 등으로부터의 유저 조작을 받고, CPU 등을 갖는 제어부(ex310)의 제어에 기초하여, 변조/복조부(ex302)에서 복조한 다중화 데이터를 다중/분리부(ex303)에서 분리한다. 또한 텔레비전(ex300)은, 분리한 음성 데이터를 음성 신호 처리부(ex304)에서 복호하고, 분리한 영상 데이터를 영상 신호 처리부(ex305)에서 상기 각 실시의 형태에서 설명한 복호 방법을 이용하여 복호한다. 복호한 음성 신호, 영상 신호는, 각각 출력부(ex309)로부터 외부를 향해서 출력된다. 출력할 때에는, 음성 신호와 영상 신호가 동기하여 재생하도록, 버퍼(ex318, ex319) 등에 일단 이들 신호를 축적하면 된다. 또, 텔레비전(ex300)은, 방송 등으로부터가 아닌, 자기/광디스크, SD 카드 등의 기록 미디어(ex215, ex216)로부터 다중화 데이터를 독출해도 된다. 다음에, 텔레비전(ex300)이 음성 신호나 영상 신호를 부호화하고, 외부에 송신 또는 기록 미디어 등에 기록하는 구성에 대해 설명한다. 텔레비전(ex300)은, 리모트 콘트롤러(ex220) 등으로부터의 유저 조작을 받고, 제어부(ex310)의 제어에 기초하여, 음성 신호 처리부(ex304)에서 음성 신호를 부호화 하고, 영상 신호 처리부(ex305)에서 영상 신호를 상기 각 실시의 형태에서 설명한 부호화 방법을 이용하여 부호화한다. 부호화한 음성 신호, 영상 신호는 다중/분리부(ex303)에서 다중화되어 외부에 출력된다. 다중화할 때에는, 음성 신호와 영상 신호가 동기하도록, 버퍼(ex320, ex321) 등에 일단 이들 신호를 축적하면 된다. 또한, 버퍼(ex318, ex319, ex320, ex321)는 도시하고 있는 바와 같이 복수 구비하고 있어도 되고, 하나 이상의 버퍼를 공유하는 구성이어도 된다. 또한, 도시하고 있는 이외에, 예를 들면 변조/복조부(ex302)나 다중/분리부(ex303)의 사이 등에서도 시스템의 오버플로우, 언더플로우를 피하는 완충재로서 버퍼에 데이터를 축적하는 것으로 해도 된다.
또, 텔레비전(ex300)은, 방송 등이나 기록 미디어 등으로부터 음성 데이터, 영상 데이터를 취득하는 이외에, 마이크나 카메라의 AV 입력을 접수하는 구성을 구비하고, 그들로부터 취득한 데이터에 대해서 부호화 처리를 행해도 된다. 또한, 여기에서는 텔레비전(ex300)은 상기의 부호화 처리, 다중화, 및 외부 출력을 할 수 있는 구성으로서 설명했지만, 이들 처리를 행하지는 못하고, 상기 수신, 복호 처리, 외부 출력만이 가능한 구성이어도 된다.
또, 리더/레코더(ex218)에서 기록 미디어로부터 다중화 데이터를 독출하는, 또는 기록하는 경우에는, 상기 복호 처리 또는 부호화 처리는 텔레비전(ex300), 리더/레코더(ex218) 중 어느 것으로 행해도 되고, 텔레비전(ex300)과 리더/레코더(ex218)가 서로 분담하여 행해도 된다.
일례로서, 광디스크로부터 데이터의 읽어 들임 또는 기록을 하는 경우의 정보 재생/기록부(ex400)의 구성을 도 23에 나타낸다. 정보 재생/기록부(ex400)는, 이하에 설명하는 요소(ex401, ex402, ex403, ex404, ex405, ex406, ex407)를 구비한다. 광헤드(ex401)는, 광디스크인 기록 미디어(ex215)의 기록면에 레이저 스폿을 조사하여 정보를 기록하고, 기록 미디어(ex215)의 기록면으로부터의 반사광을 검출하여 정보를 읽어들인다. 변조 기록부(ex402)는, 광헤드(ex401)에 내장된 반도체 레이저를 전기적으로 구동하고 기록 데이터에 따라 레이저광의 변조를 행한다. 재생 복조부(ex403)는, 광헤드(ex401)에 내장된 포토디텍터에 의해 기록면으로부터의 반사광을 전기적으로 검출한 재생 신호를 증폭하고, 기록 미디어(ex215)에 기록된 신호 성분을 분리하여 복조하고, 필요한 정보를 재생한다. 버퍼(ex404)는, 기록 미디어(ex215)에 기록하기 위한 정보 및 기록 미디어(ex215)로부터 재생한 정보를 일시적으로 유지한다. 디스크 모터(ex405)는 기록 미디어(ex215)를 회전시킨다. 서보 제어부(ex406)는, 디스크 모터(ex405)의 회전 구동을 제어하면서 광헤드(ex401)를 소정의 정보 트랙으로 이동시키고, 레이저 스폿의 추종 처리를 행한다. 시스템 제어부(ex407)는, 정보 재생/기록부(ex400) 전체의 제어를 행한다. 상기의 독출이나 기록의 처리는 시스템 제어부(ex407)가, 버퍼(ex404)에 유지된 각종 정보를 이용하여, 또 필요에 따라서 새로운 정보의 생성·추가를 행함과 더불어, 변조 기록부(ex402), 재생 복조부(ex403), 서보 제어부(ex406)를 협조 동작시키면서, 광헤드(ex401)를 통해, 정보의 기록 재생을 행함으로써 실현된다. 시스템 제어부(ex407)는 예를 들면 마이크로 프로세서로 구성되고, 독출 기록의 프로그램을 실행함으로써 그들 처리를 실행한다.
이상에서는, 광헤드(ex401)는 레이저 스폿을 조사한다고 설명했지만, 근접장광을 이용하여 보다 고밀도의 기록을 행하는 구성이어도 된다.
도 24에 광디스크인 기록 미디어(ex215)의 모식도를 나타낸다. 기록 미디어(ex215)의 기록면에는 안내 홈(그루브)이 나선 형상으로 형성되고, 정보 트랙(ex230)에는, 미리 그루브의 형상의 변화에 따라 디스크 상의 절대 위치를 나타내는 번지 정보가 기록되어 있다. 이 번지 정보는 데이터를 기록하는 단위인 기록 블록(ex231)의 위치를 특정하기 위한 정보를 포함하고, 기록이나 재생을 행하는 장치에 있어서 정보 트랙(ex230)을 재생하고 번지 정보를 판독함으로써 기록 블록을 특정할 수 있다. 또, 기록 미디어(ex215)는, 데이터 기록 영역(ex233), 내주 영역(ex232), 외주 영역(ex234)을 포함하고 있다. 유저 데이터를 기록하기 위해서 이용하는 영역이 데이터 기록 영역(ex233)이며, 데이터 기록 영역(ex233)보다 내주 또는 외주에 배치되어 있는 내주 영역(ex232)과 외주 영역(ex234)은, 유저 데이터의 기록 이외의 특정 용도에 이용된다. 정보 재생/기록부(ex400)는, 이러한 기록 미디어(ex215)의 데이터 기록 영역(ex233)에 대해서, 부호화된 음성 데이터, 영상 데이터 또는 그들 데이터를 다중화한 다중화 데이터의 읽고 쓰기를 행한다.
이상에서는, 한 층의 DVD, BD 등의 광디스크를 예로 들어 설명했지만, 이들에 한정한 것이 아니며, 다층 구조이며 표면 이외에도 기록 가능한 광디스크여도 된다. 또, 디스크의 같은 장소에 여러 다른 파장 색의 광을 이용하여 정보를 기록하거나, 다양한 각도에서 다른 정보의 층을 기록하는 등, 다차원적인 기록/재생을 행하는 구조의 광디스크여도 된다.
또, 디지털 방송용 시스템(ex200)에 있어서, 안테나(ex205)를 갖는 차(ex210)에서 위성(ex202) 등으로부터 데이터를 수신하고, 차(ex210)가 갖는 카 내비게이션(ex211) 등의 표시 장치에 동화상을 재생하는 것도 가능하다. 또한, 카 내비게이션(ex211)의 구성은 예를 들면 도 22에 나타내는 구성 중, GPS 수신부를 더한 구성을 생각할 수 있고, 동일한 것이 컴퓨터(ex111)나 휴대 전화(ex114) 등에서도 생각할 수 있다.
도 25A는, 상기 실시의 형태에서 설명한 화상 복호 방법 및 화상 부호화 방법을 이용한 휴대 전화(ex114)를 나타내는 도면이다. 휴대 전화(ex114)는, 기지국(ex110)과의 사이에서 전파를 송수신하기 위한 안테나(ex350), 영상, 정지화상을 찍는 것이 가능한 카메라부(ex365), 카메라부(ex365)에서 촬상한 영상, 안테나(ex350)에서 수신한 영상 등이 복호된 데이터를 표시하는 액정 디스플레이 등의 표시부(ex358)를 구비한다. 휴대 전화(ex114)는, 또한 조작 키부(ex366)를 갖는 본체부, 음성을 출력하기 위한 스피커 등인 음성 출력부(ex357), 음성을 입력하기 위한 마이크 등인 음성 입력부(ex356), 촬영한 영상, 정지화상, 녹음한 음성, 또는 수신한 영상, 정지화상, 메일 등의 부호화된 데이터 혹은 복호된 데이터를 보존하는 메모리부(ex367), 또는 마찬가지로 데이터를 보존하는 기록 미디어와의 인터페이스부인 슬롯부(ex364)를 구비한다.
또한, 휴대 전화(ex114)의 구성예에 대해서, 도 25B를 이용하여 설명한다. 휴대 전화(ex114)는, 표시부(ex358) 및 조작 키부(ex366)를 구비한 본체부의 각부를 통괄적으로 제어하는 주제어부(ex360)에 대해서, 전원 회로부(ex361), 조작 입력 제어부(ex362), 영상 신호 처리부(ex355), 카메라 인터페이스부(ex363), LCD(Liquid Crystal Display) 제어부(ex359), 변조/복조부(ex352), 다중/분리부(ex353), 음성 신호 처리부(ex354), 슬롯부(ex364), 메모리부(ex367)가 버스(ex370)를 통해 서로 접속되어 있다.
전원 회로부(ex361)는, 유저의 조작에 의해 통화 종료 및 전원 키가 온 상태가 되면, 배터리 팩으로부터 각부에 대해서 전력을 공급함으로써 휴대 전화(ex114)를 동작 가능한 상태로 기동한다.
휴대 전화(ex114)는, CPU, ROM, RAM 등을 갖는 주제어부(ex360)의 제어에 기초하여, 음성 통화 모드시에 음성 입력부(ex356)에서 수음한 음성 신호를 음성 신호 처리부(ex354)에서 디지털 음성 신호로 변환하고, 이것을 변조/복조부(ex352)에서 스펙트럼 확산 처리하고, 송신/수신부(ex351)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 더한 후에 안테나(ex350)를 통해 송신한다. 또 휴대 전화(ex114)는, 음성 통화 모드시에 안테나(ex350)를 통해 수신한 수신 데이터를 증폭하여 주파수 변환 처리 및 아날로그 디지털 변환 처리를 실시하고, 변조/복조부(ex352)에서 스펙트럼 역확산 처리하고, 음성 신호 처리부(ex354)에서 아날로그 음성 신호로 변환한 후, 이것을 음성 출력부(ex357)로부터 출력한다.
또한 데이터 통신 모드시에 전자 메일을 송신하는 경우, 본체부의 조작 키부(ex366) 등의 조작에 의해서 입력된 전자 메일의 텍스트 데이터는 조작 입력 제어부(ex362)를 통해 주제어부(ex360)에 송출된다. 주제어부(ex360)는, 텍스트 데이터를 변조/복조부(ex352)에서 스펙트럼 확산 처리를 하고, 송신/수신부(ex351)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나(ex350)를 통해 기지국(ex110)에 송신한다. 전자 메일을 수신하는 경우는, 수신한 데이터에 대해서 이 거의 반대의 처리가 행해지고, 표시부(ex358)에 출력된다.
데이터 통신 모드시에 영상, 정지화상, 또는 영상과 음성을 송신하는 경우, 영상 신호 처리부(ex355)는, 카메라부(ex365)로부터 공급된 영상 신호를 상기 각 실시의 형태에서 나타낸 화상 부호화 방법에 의해 압축 부호화하고, 부호화된 영상 데이터를 다중/분리부(ex353)에 송출한다. 또, 음성 신호 처리부(ex354)는, 영상, 정지화상 등을 카메라부(ex365)에서 촬상 중에 음성 입력부(ex356)에서 수음한 음성 신호를 부호화하고, 부호화된 음성 데이터를 다중/분리부(ex353)에 송출한다.
다중/분리부(ex353)는, 영상 신호 처리부(ex355)로부터 공급된 부호화된 영상 데이터와 음성 신호 처리부(ex354)로부터 공급된 부호화된 음성 데이터를 소정의 방식으로 다중화하고, 그 결과 얻어지는 다중화 데이터를 변조/복조부(변조/복조 회로부)(ex352)에서 스펙트럼 확산 처리를 하고, 송신/수신부(ex351)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나(ex350)를 통해 송신한다.
데이터 통신 모드시에 홈 페이지 등에 링크된 동화상 파일의 데이터를 수신하는 경우, 또는 영상 및 혹은 음성이 첨부된 전자 메일을 수신하는 경우, 안테나(ex350)를 통해 수신된 다중화 데이터를 복호하기 위해서, 다중/분리부(ex353)는, 다중화 데이터를 분리함으로써 영상 데이터의 비트 스트림과 음성 데이터의 비트 스트림으로 나누고, 동기 버스(ex370)를 통해 부호화된 영상 데이터를 영상 신호 처리부(ex355)에 공급함과 더불어, 부호화된 음성 데이터를 음성 신호 처리부(ex354)에 공급한다. 영상 신호 처리부(ex355)는, 상기 각 실시의 형태에서 나타낸 화상 부호화 방법에 대응한 화상 복호 방법에 의해 복호함으로써 영상 신호를 복호하고, LCD 제어부(ex359)를 통해 표시부(ex358)로부터, 예를 들면 홈 페이지에 링크된 동화상 파일에 포함되는 영상, 정지화상이 표시된다. 또 음성 신호 처리부(ex354)는, 음성 신호를 복호하고, 음성 출력부(ex357)로부터 음성이 출력된다.
또, 상기 휴대 전화(ex114) 등의 단말은, 텔레비전(ex300)과 마찬가지로, 부호화기·복호기를 모두 갖는 송수신형 단말 외에, 부호화기만의 송신 단말, 복호기만의 수신 단말이라는 3가지의 실장 형식을 생각할 수 있다. 또한 디지털 방송용 시스템(ex200)에 있어서, 영상 데이터에 음악 데이터 등이 다중화된 다중화 데이터를 수신, 송신한다고 설명했지만, 음성 데이터 이외에 영상에 관련된 문자 데이터 등이 다중화된 데이터여도 되고, 다중화 데이터가 아닌 영상 데이터 자체여도 된다.
이와 같이, 상기 각 실시의 형태에서 나타낸 화상 부호화 방법 혹은 화상 복호 방법을 상술한 모든 기기·시스템에 이용하는 것이 가능하며, 그렇게 함으로써, 상기 각 실시의 형태에서 설명한 효과를 얻을 수 있다.
또, 본 발명은 이러한 상기 실시의 형태에 한정되는 것이 아니라, 본 발명의 범위를 일탈하지 않고 여러 가지의 변형 또는 수정이 가능하다.
(실시의 형태 3)
상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치와, MPEG-2, MPEG4-AVC, VC-1 등 다른 규격에 준거한 동화상 부호화 방법 또는 장치를, 필요에 따라서 적절히 전환함으로써, 영상 데이터를 생성하는 것도 가능하다.
여기서, 각각 다른 규격에 준거하는 복수의 영상 데이터를 생성한 경우, 복호할 때에, 각각의 규격에 대응한 복호 방법을 선택할 필요가 있다. 그러나, 복호하는 영상 데이터가, 어느 규격에 준거하는 것인지 식별할 수 없기 때문에, 적절한 복호 방법을 선택할 수 없다는 과제가 발생한다.
이 과제를 해결하기 위해서, 영상 데이터에 음성 데이터 등을 다중화한 다중화 데이터는, 영상 데이터가 어느 규격에 준거하는 것인지를 나타내는 식별 정보를 포함하는 구성으로 한다. 상기 각 실시의 형태에서 나타내는 화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터를 포함하는 다중화 데이터의 구체적인 구성을 이하에 설명한다. 다중화 데이터는, MPEG-2 트랜스포트 스트림 형식의 디지털 스트림이다.
도 26은, 다중화 데이터의 구성을 나타내는 도면이다. 도 26에 나타내는 바와이 다중화 데이터는, 비디오 스트림, 오디오 스트림, 프리젠테이션 그래픽스 스트림(PG), 인터랙티브 그래픽스 스트림 중, 하나 이상을 다중화함으로써 얻을 수 있다. 비디오 스트림은 영화의 주영상 및 부영상을, 오디오 스트림(IG)은 영화의 주음성 부분과 그 주음성과 믹싱하는 부음성을, 프리젠테이션 그래픽스 스트림은, 영화의 자막을 각각 나타내고 있다. 여기서 주영상이란 화면에 표시되는 통상의 영상을 나타내고, 부영상이란 주영상 중에 작은 화면으로 표시하는 영상이다. 또, 인터랙티브 그래픽스 스트림은, 화면 상에 GUI 부품을 배치함으로써 작성되는 대화 화면을 나타내고 있다. 비디오 스트림은, 상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거한 동화상 부호화 방법 또는 장치에 의해 부호화되어 있다. 오디오 스트림은, 돌비 AC-3, Dolby Digital Plus, MLP, DTS, DTS-HD, 또는, 리니어 PCM 등의 방식으로 부호화되어 있다.
다중화 데이터에 포함되는 각 스트림은 PID에 의해 식별된다. 예를 들면, 영화의 영상에 이용하는 비디오 스트림에는 0x1011이, 오디오 스트림에는 0x1100에서 0x111F까지가, 프리젠테이션 그래픽스에는 0x1200에서 0x121F까지가, 인터랙티브 그래픽스 스트림에는 0x1400에서 0x141F까지가, 영화의 부영상에 이용하는 비디오 스트림에는 0x1B00에서 0x1B1F까지, 주음성과 믹싱하는 부음성에 이용하는 오디오 스트림에는 0x1A00에서 0x1A1F가, 각각 할당되어 있다.
도 27은, 다중화 데이터가 어떻게 다중화되는지를 모식적으로 나타내는 도면이다. 우선, 복수의 비디오 프레임으로 이루어지는 비디오 스트림(ex235), 복수의 오디오 프레임으로 이루어지는 오디오 스트림(ex238)를, 각각 PES 패킷열(ex236 및 ex239)로 변환하고, TS 패킷(ex237 및 ex240)으로 변환한다. 마찬가지로 프리젠테이션 그래픽스 스트림(ex241) 및 인터랙티브 그래픽스(ex244)의 데이터를 각각 PES 패킷열(x242 및 ex245)로 변환하고, 또한 TS 패킷(ex243 및 ex246)으로 변환한다. 다중화 데이터(ex247)는 이들 TS 패킷을 하나의 스트림으로 다중화함으로써 구성된다.
도 28은, PES 패킷열에, 비디오 스트림이 어떻게 저장되는 지를 더 자세하게 나타내고 있다. 도 28에 있어서의 제1 단째는 비디오 스트림의 비디오 프레임열을 나타낸다. 제2 단째는, PES 패킷열을 나타낸다. 도 28의 화살표(yy1, yy2, yy3, yy4)에 나타내는 바와 같이, 비디오 스트림에 있어서의 복수의 Video Presentation Unit인 I 픽쳐, B 픽쳐, P 픽쳐는, 픽쳐마다 분할되고, PES 패킷의 페이로드에 저장된다. 각 PES 패킷은 PES 헤더를 가지며, PES 헤더에는, 픽쳐의 표시 시각인 PTS(Presentation Time-Stamp)나 픽쳐의 복호 시각인 DTS(Decoding Time-Stamp)가 저장된다.
도 29는, 다중화 데이터에 최종적으로 기록되는 TS 패킷의 형식을 나타내고 있다. TS 패킷은, 스트림을 식별하는 PID 등의 정보를 갖는 4Byte의 TS 헤더와 데이터를 저장하는 184Byte의 TS 페이로드로 구성되는 188Byte 고정 길이의 패킷이며, 상기 PES 패킷은 분할되어 TS 페이로드에 저장된다. BD-ROM의 경우, TS 패킷에는, 4Byte의 TP_Extra_Header가 부여되고, 192Byte의 소스 패킷을 구성하고, 다중화 데이터에 기록된다. TP_Extra_Header에는 ATS(Arrival_Time_Stamp) 등의 정보가 기재된다. ATS는 상기 TS 패킷의 디코더의 PID 필터에의 전송 개시 시각을 나타낸다. 다중화 데이터에는 도 29 하단에 나타내는 바와 같이 소스 패킷이 늘어서게 되고, 다중화 데이터의 선두로부터 증가(increment)하는 번호는 SPN(소스 패킷 넘버)으로 불린다.
또, 다중화 데이터에 포함되는 TS 패킷에는, 영상·음성·자막 등의 각 스트림 이외에도 PAT(Program Association Table), PMT(Program Map Table), PCR(Program Clock Reference) 등이 있다. PAT는 다중화 데이터 중에 이용되는 PMT의 PID가 무엇인지을 나타내고, PAT 자신의 PID는 0으로 등록된다. PMT는, 다중화 데이터 중에 포함되는 영상·음성·자막 등의 각 스트림의 PID와 각 PID에 대응하는 스트림의 속성 정보를 가지며, 또 다중화 데이터에 관한 각종 디스크립터를 갖는다. 디스크립터에는 다중화 데이터의 카피를 허가·불허가를 지시하는 카피 컨트롤 정보 등이 있다. PCR은, ATS의 시간축인 ATC(Arrival Time Clock)와 PTS·DTS의 시간축인 STC(System Time Clock)의 동기를 취하기 위해서, 그 PCR 패킷이 디코더에 전송되는 ATS에 대응하는 STC 시간의 정보를 갖는다.
도 30은 PMT의 데이터 구조를 자세하게 설명하는 도면이다. PMT의 선두에는, 그 PMT에 포함되는 데이터의 길이 등을 기록한 PMT 헤더가 배치된다. 그 뒤에는, 다중화 데이터에 관한 디스크립터가 복수 배치된다. 상기 카피 컨트롤 정보 등이, 디스크립터로서 기재된다. 디스크립터의 뒤에는, 다중화 데이터에 포함되는 각 스트림에 관한 스트림 정보가 복수 배치된다. 스트림 정보는, 스트림의 압축 코덱 등을 식별하기 위해 스트림 타입, 스트림의 PID, 스트림의 속성 정보(프레임 레이트, 종횡비 등)가 기재된 스트림 디스크립터로 구성된다. 스트림 디스크립터는 다중화 데이터에 존재하는 스트림의 수만큼 존재한다.
기록 매체 등에 기록하는 경우에는, 상기 다중화 데이터는, 다중화 데이터 정보 파일과 함께 기록된다.
다중화 데이터 정보 파일은, 도 31에 나타내는 바와 같이 다중화 데이터의 관리 정보이며, 다중화 데이터와 1대 1로 대응하고, 다중화 데이터 정보, 스트림 속성 정보와 엔트리 맵으로 구성된다.
다중화 데이터 정보는 도 31에 나타내는 바와 같이 시스템 레이트, 재생 개시 시각, 재생 종료 시각으로 구성되어 있다. 시스템 레이트는 다중화 데이터의, 후술하는 시스템 타겟 디코더의 PID 필터에의 최대 전송 레이트를 나타낸다. 다중화 데이터 중에 포함되는 ATS의 간격은 시스템 레이트 이하가 되도록 설정되어 있다. 재생 개시 시각은 다중화 데이터의 선두의 비디오 프레임의 PTS이며, 재생 종료 시각은 다중화 데이터의 종단의 비디오 프레임의 PTS에 1프레임분의 재생 간격을 더한 것이 설정된다.
스트림 속성 정보는 도 32에 나타내는 바와 같이, 다중화 데이터에 포함되는 각 스트림에 대한 속성 정보가, PID마다 등록된다. 속성 정보는 비디오 스트림, 오디오 스트림, 프리젠테이션 그래픽스 스트림, 인터랙티브 그래픽스 스트림마다 다른 정보를 갖는다. 비디오 스트림 속성 정보는, 그 비디오 스트림이 어떠한 압축 코덱으로 압축되었는지, 비디오 스트림을 구성하는 개개의 픽쳐 데이터의 해상도가 어느 정도인지, 종횡비는 어느 정도인지, 프레임 레이트는 어느 정도인지 등의 정보를 갖는다. 오디오 스트림 속성 정보는, 그 오디오 스트림이 어떠한 압축 코덱으로 압축되었는지, 그 오디오 스트림에 포함되는 채널수는 몇인지, 어떤 언어에 대응하는지, 샘플링 주파수가 어느 정도인지 등의 정보를 갖는다. 이들 정보는, 플레이어가 재생하기 전의 디코더의 초기화 등에 이용된다.
본 실시의 형태에 있어서는, 상기 다중화 데이터 중, PMT에 포함되는 스트림 타입을 이용한다. 또, 기록 매체에 다중화 데이터가 기록되어 있는 경우에는, 다중화 데이터 정보에 포함되는, 비디오 스트림 속성 정보를 이용한다. 구체적으로는, 상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치에 있어서, PMT에 포함되는 스트림 타입, 또는, 비디오 스트림 속성 정보에 대해, 상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터인 것을 나타내는 고유의 정보를 설정하는 단계 또는 수단을 설치한다. 이 구성에 의해, 상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치에 의해 생성한 영상 데이터와, 다른 규격에 준거하는 영상 데이터를 식별하는 것이 가능해진다.
또, 본 실시의 형태에 있어서의 화상 복호 방법의 단계를 도 33에 나타낸다. 단계 exS100에 있어서, 다중화 데이터로부터 PMT에 포함되는 스트림 타입, 또는, 다중화 데이터 정보에 포함되는 비디오 스트림 속성 정보를 취득한다. 다음에, 단계 exS101에 있어서, 스트림 타입, 또는, 비디오 스트림 속성 정보가 상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치에 의해 생성된 다중화 데이터인 것을 나타내고 있는지의 여부를 판단한다. 그리고, 스트림 타입, 또는, 비디오 스트림 속성 정보가 상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치에 의해 생성된 것이라고 판단된 경우에는, 단계 exS102에 있어서, 상기 각 실시의 형태에서 나타낸 화상 복호 방법에 의해 복호를 행한다. 또, 스트림 타입, 또는, 비디오 스트림 속성 정보가, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 것임을 나타내고 있는 경우에는, 단계 exS103에 있어서, 종래의 규격에 준거한 동화상 복호 방법에 의해 복호를 행한다.
이와 같이, 스트림 타입, 또는, 비디오 스트림 속성 정보에 새로운 고유치를 설정함으로써, 복호할 때에, 상기 각 실시의 형태에서 나타낸 화상 복호 방법 또는 장치에서 복호 가능한지를 판단할 수 있다. 따라서, 다른 규격에 준거하는 다중화 데이터가 입력된 경우라도, 적절한 복호 방법 또는 장치를 선택할 수 있기 때문에, 에러를 일으키지 않고 복호하는 것이 가능해진다. 또, 본 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치, 또는, 화상 복호 방법 또는 장치를, 상술한 모든 기기·시스템에 이용하는 것도 가능하다.
(실시의 형태 4)
상기 각 실시의 형태에서 나타낸 화상 부호화 방법 및 장치, 화상 복호 방법 및 장치는, 전형적으로는 집적 회로인 LSI에서 실현된다. 일례로서, 도 34에 1칩화된 LSI(ex500)의 구성을 나타낸다. LSI(ex500)는, 이하에 설명하는 요소(ex501, ex502, ex503, ex504, ex505, ex506, ex507, ex508, ex509)를 구비하고, 각 요소는 버스(ex510)를 통해 접속되어 있다. 전원 회로부(ex505)는 전원이 온 상태인 경우에 각부에 대해서 전력을 공급함으로써 동작 가능한 상태로 기동한다.
예를 들면 부호화 처리를 행하는 경우에는, LSI(ex500)는, CPU(ex502), 메모리 컨트롤러(ex503), 스트림 컨트롤러(ex504), 구동 주파수 제어부(ex512) 등을 갖는 제어부(ex501)의 제어에 기초하여, AV I/O(ex509)에 의해 마이크(ex117)나 카메라(ex113) 등으로부터 AV 신호를 입력한다. 입력된 AV 신호는, 일단 SDRAM 등의 외부의 메모리(ex511)에 축적된다. 제어부(ex501)의 제어에 기초하여, 축적한 데이터는 처리량이나 처리 속도에 따라 적절히 복수회로 나누어져 신호 처리부(ex507)에 보내지고, 신호 처리부(ex507)에 있어서 음성 신호의 부호화 및/또는 영상 신호의 부호화가 행해진다. 여기서 영상 신호의 부호화 처리는 상기 각 실시의 형태에서 설명한 부호화 처리이다. 신호 처리부(ex507)에서는 또한, 경우에 따라 부호화 된 음성 데이터와 부호화된 영상 데이터를 다중화하는 등의 처리를 행하고, 스트림 I/O(ex506)으로부터 외부로 출력한다. 이 출력된 다중화 데이터는, 기지국(ex107)을 향해 송신되거나 또는 기록 미디어(ex215)에 기록된다. 또한 다중화할 때에는 동기하도록, 일단 버퍼(ex508)에 데이터를 축적하면 된다.
또한, 상기에서는, 메모리(ex511)가 LSI(ex500)의 외부의 구성으로서 설명했지만, LSI(ex500)의 내부에 포함되는 구성이어도 된다. 버퍼(ex508)도 하나로 한정한 것은 아니며, 복수의 버퍼를 구비하고 있어도 된다. 또, LSI(ex500)는 1 칩화되어도 되고, 복수 칩화되어도 된다.
또, 상기에서는, 제어부(ex501)가, CPU(ex502), 메모리 컨트롤러(ex503), 스트림 컨트롤러(ex504), 구동 주파수 제어부(ex512) 등을 갖는다고 하고 있지만, 제어부(ex501)의 구성은, 이 구성에 한정되지 않는다. 예를 들면, 신호 처리부(ex507)가 CPU를 더 구비하는 구성이어도 된다. 신호 처리부(ex507)의 내부에도 CPU를 설치함으로써, 처리 속도를 보다 향상시키는 것이 가능해진다. 또, 다른 예로서, CPU(ex502)가 신호 처리부(ex507), 또는 신호 처리부(ex507)의 일부인 예를 들면 음성 신호 처리부를 구비하는 구성이어도 된다. 이러한 경우에는, 제어부(ex501)는, 신호 처리부(ex507), 또는 그 일부를 갖는 CPU(ex502)를 구비하는 구성이 된다.
또한, 여기에서는, LSI로 했지만, 집적도의 차이에 따라, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI로 호칭되기도 한다.
또, 집적 회로화의 수법은 LSI에 한정하는 것은 아니며, 전용 회로 또는 범용 프로세서로 실현되어도 된다. LSI 제조 후에, 프로그램하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속이나 설정을 재구성 가능한 리컨피규러블 프로세서를 이용해도 된다.
또한, 반도체 기술의 진보 또는 파생되는 다른 기술에 의해 LSI로 치환되는 집적 회로화의 기술이 등장하면, 당연히 그 기술을 이용하여 기능 블록의 집적화를 행해도 된다. 바이오 기술의 적응 등이 가능성으로서 있을 수 있다.
(실시의 형태 5)
상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터를 복호하는 경우, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터를 복호하는 경우에 비해, 처리량이 증가하는 것을 생각할 수 있다. 그 때문에, LSI(ex500)에 있어서, 종래의 규격에 준거하는 영상 데이터를 복호할 때의 CPU(ex502)의 구동 주파수보다 높은 구동 주파수로 설정할 필요가 있다. 그러나, 구동 주파수를 높게 하면, 소비 전력이 높아진다는 과제가 발생한다.
이 과제를 해결하기 위해, 텔레비전(ex300), LSI(ex500) 등의 동화상 복호 장치는, 영상 데이터가 어느 규격에 준거하는 것인지를 식별하고, 규격에 따라 구동 주파수를 전환하는 구성으로 한다. 도 35는, 본 실시의 형태에 있어서의 구성(ex800)을 나타내고 있다. 구동 주파수 변환부(ex803)는, 영상 데이터가, 상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치에 의해 생성된 것인 경우에는, 구동 주파수를 높게 설정한다. 그리고, 상기 각 실시의 형태에서 나타낸 화상 복호 방법을 실행하는 복호 처리부(ex801)에 대해서, 영상 데이터를 복호하도록 지시한다. 한편, 영상 데이터가, 종래의 규격에 준거하는 영상 데이터인 경우에는, 영상 데이터가, 상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치에 의해 생성된 것인 경우에 비해, 구동 주파수를 낮게 설정한다. 그리고, 종래의 규격에 준거하는 복호 처리부(ex802)에 대해서, 영상 데이터를 복호하도록 지시한다.
보다 구체적으로는, 구동 주파수 변환부(ex803)는, 도 34의 CPU(ex502)와 구동 주파수 제어부(ex512)로 구성된다. 또, 상기 각 실시의 형태에서 나타낸 화상 복호 방법을 실행하는 복호 처리부(ex801), 및, 종래의 규격에 준거하는 복호 처리부(ex802)는, 도 34의 신호 처리부(ex507)에 해당한다. CPU(ex502)는, 영상 데이터가 어느 규격에 준거하는 것인지를 식별한다. 그리고, CPU(ex502)로부터의 신호에 기초하여, 구동 주파수 제어부(ex512)는 구동 주파수를 설정한다. 또, CPU(ex502)로부터의 신호에 기초하여, 신호 처리부(ex507)는 영상 데이터의 복호를 행한다. 여기서, 영상 데이터의 식별에는, 예를 들면, 실시의 형태 3에서 기재한 식별 정보를 이용하는 것을 생각할 수 있다. 식별 정보에 관해서는, 실시의 형태 3에서 기재한 것에 한정되지 않고, 영상 데이터가 어느 규격에 준거하는지를 식별할 수 있는 정보이면 된다. 예를 들면, 영상 데이터가 텔레비전에 이용되는 것인지, 디스크에 이용되는 것인지 등을 식별하는 외부 신호에 기초하여, 영상 데이터가 어느 규격에 준거하는 것이지 식별 가능한 경우에는, 이들 외부 신호에 기초하여 식별해도 된다. 또, CPU(ex502)에 있어서의 구동 주파수의 선택은, 예를 들면, 도 37과 같은 영상 데이터의 규격과, 구동 주파수를 대응시킨 룩업 테이블에 기초하여 행하는 것을 생각할 수 있다. 룩업 테이블을, 버퍼(ex508)나, LSI의 내부 메모리에 저장해 두고, CPU(ex502)가 이 룩업 테이블을 참조함으로써, 구동 주파수를 선택하는 것이 가능하다.
도 36은, 본 실시의 형태의 방법을 실시하는 단계를 나타내고 있다. 우선, 단계 exS200에서는, 신호 처리부(ex507)에 있어서, 다중화 데이터로부터 식별 정보를 취득한다. 다음에, 단계 exS201에서는, CPU(ex502)에 있어서, 식별 정보에 기초하여 영상 데이터가 상기 각 실시의 형태에서 나타낸 부호화 방법 또는 장치에 의해 생성된 것인지의 여부를 식별한다. 영상 데이터가 상기 각 실시의 형태에서 나타낸 부호화 방법 또는 장치에 의해 생성된 것인 경우에는, 단계 exS202에 있어서, 구동 주파수를 높게 설정하는 신호를, CPU(ex502)가 구동 주파수 제어부(ex512)에 보낸다. 그리고, 구동 주파수 제어부(ex512)에 있어서, 높은 구동 주파수로 설정된다. 한편, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터인 것을 나타내고 있는 경우에는, 단계 exS203에 있어서, 구동 주파수를 낮게 설정하는 신호를, CPU(ex502)가 구동 주파수 제어부(ex512)에 보낸다. 그리고, 구동 주파수 제어부(ex512)에 있어서, 영상 데이터가 상기 각 실시의 형태에서 나타낸 부호화 방법 또는 장치에 의해 생성된 것인 경우에 비해, 낮은 구동 주파수로 설정된다.
또한 구동 주파수의 전환에 연동하여, LSI(ex500) 또는 LSI(ex500)를 포함하는 장치에 부여하는 전압을 변경함으로써, 전력 절약 효과를 더 높이는 것이 가능하다. 예를 들면, 구동 주파수를 낮게 설정하는 경우에는, 이에 수반하여, 구동 주파수를 높게 설정하고 있는 경우에 비해, LSI(ex500) 또는 LSI(ex500)를 포함하는 장치에 부여하는 전압을 낮게 설정하는 것을 생각할 수 있다.
또, 구동 주파수의 설정 방법은, 복호할 때의 처리량이 큰 경우에, 구동 주파수를 높게 설정하고, 복호할 때의 처리량이 작은 경우에, 구동 주파수를 낮게 설정하면 되고, 상술한 설정 방법으로 한정되지 않는다. 예를 들면, MPEG4-AVC 규격에 준거하는 영상 데이터를 복호하는 처리량의 쪽이, 상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터를 복호하는 처리량보다 큰 경우에는, 구동 주파수의 설정을 상술한 경우의 반대로 하는 것을 생각할 수 있다.
또한, 구동 주파수의 설정 방법은, 구동 주파수를 낮게 하는 구성에 한정되지 않는다. 예를 들면, 식별 정보가, 상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터인 것을 나타내고 있는 경우에는, LSI(ex500) 또는 LSI(ex500)를 포함하는 장치에 부여하는 전압을 높게 설정하고, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터인 것을 나타내고 있는 경우에는, LSI(ex500) 또는 LSI(ex500)를 포함하는 장치에 부여하는 전압을 낮게 설정하는 것도 생각할 수 있다. 또, 다른 예로서는, 식별 정보가, 상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터인 것을 나타내고 있는 경우에는, CPU(ex502)의 구동을 정지시키지 않고, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터인 것을 나타내고 있는 경우에는, 처리에 여유가 있기 때문에, CPU(ex502)의 구동을 일시 정지시키는 것도 생각할 수 있다. 식별 정보가, 상기 각 실시의 형태에서 나타낸 화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터인 것을 나타내고 있는 경우라도, 처리에 여유가 있으면, CPU(ex502)의 구동을 일시 정지시키는 것도 생각할 수 있다. 이 경우는, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터인 것을 나타내고 있는 경우에 비해, 정지 시간을 짧게 설정하는 것을 생각할 수 있다.
이와 같이, 영상 데이터가 준거하는 규격에 따라, 구동 주파수를 전환함으로써, 전력 절약화를 도모하는 것이 가능해진다. 또, 전지를 이용하여 LSI(ex500) 또는 LSI(ex500)를 포함하는 장치를 구동하고 있는 경우에는, 전력 절약화에 따라, 전지의 수명을 길게 하는 것이 가능하다.
(실시의 형태 6)
텔레비전이나, 휴대 전화 등, 상술한 기기·시스템에는, 다른 규격에 준거하는 복수의 영상 데이터가 입력되는 경우가 있다. 이와 같이, 다른 규격에 준거하는 복수의 영상 데이터가 입력된 경우에도 복호할 수 있도록 하기 위해, LSI(ex500)의 신호 처리부(ex507)가 복수의 규격에 대응하고 있을 필요가 있다. 그러나, 각각의 규격에 대응하는 신호 처리부(ex507)를 개별로 이용하면, LSI(ex500)의 회로 규모가 커지고, 또, 코스트가 증가한다는 과제가 발생한다.
이 과제를 해결하기 위해서, 상기 각 실시의 형태에서 나타낸 화상 복호 방법을 실행하기 위한 복호 처리부와, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 복호 처리부를 일부 공유화하는 구성으로 한다. 이 구성예를 도 38A의 ex900에 나타낸다. 예를 들면, 상기 각 실시의 형태에서 나타낸 화상 복호 방법과 MPEG4-AVC 규격에 준거하는 동화상 복호 방법은, 엔트로피 부호화, 역양자화, 디블로킹 필터, 움직임 보상 등의 처리에 있어서 처리 내용이 일부 공통된다. 공통되는 처리 내용에 대해서는, MPEG4-AVC 규격에 대응하는 복호 처리부(ex902)를 공유하고, MPEG4-AVC 규격에 대응하지 않는, 본 발명 특유의 다른 처리 내용에 대해서는, 전용의 복호 처리부(ex901)를 이용한다는 구성을 생각할 수 있다. 복호 처리부의 공유화에 관해서는, 공통되는 처리 내용에 대해서는, 상기 각 실시의 형태에서 나타낸 화상 복호 방법을 실행하기 위한 복호 처리부를 공유하고, MPEG4-AVC 규격에 특유의 처리 내용에 대해서는, 전용의 복호 처리부를 이용하는 구성이어도 된다.
또, 처리를 일부 공유화하는 다른 예를 도 38B의 ex1000에 나타낸다. 이 예에서는, 본 발명에 특유의 처리 내용에 대응한 전용의 복호 처리부(ex1001)와, 다른 종래 규격에 특유의 처리 내용에 대응한 전용의 복호 처리부(ex1002)와, 본 발명의 화상 복호 방법과 다른 종래 규격의 동화상 복호 방법에 공통되는 처리 내용에 대응한 공용의 복호 처리부(ex1003)를 이용하는 구성으로 하고 있다. 여기서, 전용의 복호 처리부(ex1001, ex1002)는, 반드시 본 발명, 또는, 다른 종래 규격에 특유의 처리 내용으로 특화한 것은 아니며, 다른 범용 처리를 실행할 수 있는 것이어도 된다. 또, 본 실시의 형태의 구성을, LSI(ex500)에서 실장하는 것도 가능하다.
이와 같이, 본 발명의 화상 복호 방법과, 종래의 규격의 동화상 복호 방법에서 공통되는 처리 내용에 대해서, 복호 처리부를 공유함으로써, LSI의 회로 규모를 작게 하면서 비용을 저감하는 것이 가능하다.
[산업상의 이용 가능성]
본 발명에 관련되는 화상 복호 방법 및 화상 부호화 방법은, 화질의 향상 및 부호화 효율의 향상의 양립을 도모할 수 있다는 효과를 나타내고, 예를 들면, 비디오 카메라, 동화상의 촬영 및 재생 기능을 갖는 휴대 전화, 퍼스널 컴퓨터, 또는 녹화 재생 장치 등에 적용할 수 있다.
1000 화상 부호화 장치
1100 부호화 처리부
1101 감산기
1102 직교 변환부
1103 양자화부
1104 엔트로피 부호화부
1105 역양자화부
1106 역직교 변환부
1107 가산기
1108 디블로킹 필터
1109 메모리
1110 면내 예측부
1111 움직임 보상부
1112 움직임 검출부
1113 스위치
1200 부호화 제어부
2000 화상 복호 장치
2100 복호 처리부
2101 엔트로피 복호부
2102 역양자화부
2103 역직교 변환부
2104 가산기
2105 디블로킹 필터
2106 메모리
2107 면내 예측부
2108 움직임 보상부
2109 스위치
2200 복호 제어부

Claims (3)

  1. 부호화 스트림으로부터 블록-바이-블록(block-by-block) 방식으로 화상을 복호하기 위한 복호 방법으로서, 상기 화상은 복수의 단위들을 포함하고, 상기 단위들의 각각은 상기 단위들보다 작은 복수의 블록들을 각각 포함하며, 상기 복호 방법은,
    양자화 파라미터에 대응하는 제1 정보를 읽는 단계 - 상기 제1 정보는 픽쳐에 포함된 복수의 블록들을 위해 사용됨 - ;
    현재 블록을 포함하는 현재 픽쳐의 제2 정보와 상기 현재 픽쳐에 포함된 상기 현재 블록의 제3 정보를 사용하여, 현재 단위의 양자화 파라미터에 대응하는 제4 정보가 상기 현재 블록을 위해 사용되었는지 여부를 판단하는 단계 - 상기 제2 정보는 픽쳐-바이-픽쳐(picture-by-picture) 방식 상의 정보이며, 상기 제3 정보는 픽쳐-바이-픽쳐(picture-by-picture) 방식 상의 정보가 아님 - ; 및
    상기 제4 정보가 상기 현재 블록을 위해 사용된 것으로 판단된 경우, 상기 현재 블록을 상기 제1 정보와 상기 제4 정보를 사용하여 복호하는 단계를 포함하며,
    상기 제4 정보는 상기 현재 단위에 포함된 복수의 블록들 모두를 위해 사용되는, 복호 방법.
  2. 부호화 스트림으로부터 블록-바이-블록(block-by-block) 방식으로 화상을 복호하기 위한 복호 장치로서, 상기 화상은 복수의 단위들을 포함하고, 상기 단위들의 각각은 상기 단위들보다 작은 복수의 블록들을 각각 포함하며, 상기 복호 장치는,
    프로세서; 및
    실행 가능한 지시들을 저장하고 있는 비휘발성 메모리를 포함하며, 상기 실행가능한 지시들이 실행될 경우 상기 프로세서로 하여금:
    양자화 파라미터에 대응하는 제1 정보를 읽는 단계 - 상기 제1 정보는 픽쳐에 포함된 복수의 블록들을 위해 사용됨 - ;
    현재 블록을 포함하는 현재 픽쳐의 제2 정보와 상기 현재 픽쳐에 포함된 상기 현재 블록의 제3 정보를 사용하여, 현재 단위의 양자화 파라미터에 대응하는 제4 정보가 상기 현재 블록을 위해 사용되었는지 여부를 판단하는 단계 - 상기 제2 정보는 픽쳐-바이-픽쳐(picture-by-picture) 방식 상의 정보이며, 상기 제3 정보는 픽쳐-바이-픽쳐(picture-by-picture) 방식 상의 정보가 아님 - ; 및
    상기 제4 정보가 상기 현재 블록을 위해 사용된 것으로 판단된 경우, 상기 현재 블록을 상기 제1 정보와 상기 제4 정보를 사용하여 복호하는 단계를 수행하도록 하며,
    상기 제4 정보는 상기 현재 단위에 포함된 복수의 블록들 모두를 위해 사용되는, 복호 장치.
  3. 부호화 스트림으로부터 블록-바이-블록(block-by-block) 방식으로 화상을 복호하기 위한 복호 장치로서, 상기 화상은 복수의 단위들을 포함하고, 상기 단위들의 각각은 상기 단위들보다 작은 복수의 블록들을 각각 포함하며, 상기 복호 장치는,
    (i) 양자화 파라미터에 대응하는 제1 정보를 읽고 - 상기 제1 정보는 픽쳐에 포함된 복수의 블록들을 위해 사용됨 - ;
    (ii) 현재 블록을 포함하는 현재 픽쳐의 제2 정보와 상기 현재 픽쳐에 포함된 상기 현재 블록의 제3 정보를 사용하여, 현재 단위의 양자화 파라미터에 대응하는 제4 정보가 상기 현재 블록을 위해 사용되었는지 여부를 판단하도록 - 상기 제2 정보는 픽쳐-바이-픽쳐(picture-by-picture) 방식 상의 정보이며, 상기 제3 정보는 픽쳐-바이-픽쳐(picture-by-picture) 방식 상의 정보가 아님 - 구성된 복호 제어부; 및
    상기 제4 정보가 상기 현재 블록을 위해 사용된 것으로 판단된 경우, 상기 현재 블록을 상기 제1 정보와 상기 제4 정보를 사용하여 복호하도록 구성된 복호 처리부를 포함하며,
    상기 제4 정보는 상기 현재 단위에 포함된 복수의 블록들 모두를 위해 사용되는, 복호 장치.
KR1020197006808A 2010-09-30 2011-09-29 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치, 프로그램 및 집적 회로 KR102073304B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US38822110P 2010-09-30 2010-09-30
US61/388,221 2010-09-30
PCT/JP2011/005507 WO2012042890A1 (ja) 2010-09-30 2011-09-29 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、プログラムおよび集積回路

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020137002254A Division KR101959091B1 (ko) 2010-09-30 2011-09-29 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치, 프로그램 및 집적 회로

Publications (2)

Publication Number Publication Date
KR20190026984A KR20190026984A (ko) 2019-03-13
KR102073304B1 true KR102073304B1 (ko) 2020-02-04

Family

ID=45892379

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020137002254A KR101959091B1 (ko) 2010-09-30 2011-09-29 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치, 프로그램 및 집적 회로
KR1020197006808A KR102073304B1 (ko) 2010-09-30 2011-09-29 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치, 프로그램 및 집적 회로

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020137002254A KR101959091B1 (ko) 2010-09-30 2011-09-29 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치, 프로그램 및 집적 회로

Country Status (14)

Country Link
US (8) US9749630B2 (ko)
EP (3) EP3125562B1 (ko)
JP (6) JP5894922B2 (ko)
KR (2) KR101959091B1 (ko)
CN (2) CN103125117B (ko)
AU (1) AU2011310239B2 (ko)
BR (1) BR112013004112A2 (ko)
CA (1) CA2808795C (ko)
MX (1) MX2013001774A (ko)
RU (1) RU2595625C2 (ko)
SG (1) SG188255A1 (ko)
TW (2) TWI625054B (ko)
WO (1) WO2012042890A1 (ko)
ZA (1) ZA201301335B (ko)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110274162A1 (en) 2010-05-04 2011-11-10 Minhua Zhou Coding Unit Quantization Parameters in Video Coding
WO2011142279A1 (ja) * 2010-05-13 2011-11-17 シャープ株式会社 符号化装置、復号装置、およびデータ構造
KR20120016980A (ko) 2010-08-17 2012-02-27 한국전자통신연구원 영상 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
JP5707412B2 (ja) 2010-09-29 2015-04-30 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、プログラムおよび集積回路
SG188255A1 (en) 2010-09-30 2013-04-30 Panasonic Corp Image decoding method, image coding method, image decoding apparatus, image coding apparatus, program, and integrated circuit
KR20120035096A (ko) * 2010-10-04 2012-04-13 한국전자통신연구원 쿼드 트리 변환 구조에서 부가 정보의 시그널링 방법 및 장치
US20120114034A1 (en) * 2010-11-08 2012-05-10 Mediatek Inc. Method and Apparatus of Delta Quantization Parameter Processing for High Efficiency Video Coding
EP2664147B1 (en) 2011-01-13 2020-03-11 Canon Kabushiki Kaisha Image coding apparatus, image coding method, and program, and image decoding apparatus, image decoding method, and program
KR101442127B1 (ko) * 2011-06-21 2014-09-25 인텔렉추얼디스커버리 주식회사 쿼드트리 구조 기반의 적응적 양자화 파라미터 부호화 및 복호화 방법 및 장치
US20140241422A1 (en) * 2011-06-28 2014-08-28 Samsung Electronics Co., Ltd. Method and apparatus for image encoding and decoding using adaptive quantization parameter differential
JP2013223036A (ja) * 2012-04-13 2013-10-28 Canon Inc 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US9521410B2 (en) * 2012-04-26 2016-12-13 Qualcomm Incorporated Quantization parameter (QP) coding in video coding
GB2501517A (en) * 2012-04-27 2013-10-30 Canon Kk Scalable Encoding and Decoding of a Digital Image
US9749645B2 (en) 2012-06-22 2017-08-29 Microsoft Technology Licensing, Llc Coded-block-flag coding and derivation
EP2866441B1 (en) * 2012-06-26 2021-09-01 Mitsubishi Electric Corporation Moving image encoding and decoding devices and methods
US20140056347A1 (en) 2012-08-23 2014-02-27 Microsoft Corporation Non-Transform Coding
CA2894637A1 (en) * 2012-12-18 2014-06-26 Sony Corporation Image processing device and image processing method
CN104079941B (zh) * 2013-03-27 2017-08-25 中兴通讯股份有限公司 一种深度信息编解码方法、装置及视频处理播放设备
US9294766B2 (en) 2013-09-09 2016-03-22 Apple Inc. Chroma quantization in video coding
WO2015196334A1 (en) * 2014-06-23 2015-12-30 Mediatek Singapore Pte. Ltd. Methods for signaling of sub-pu syntax element in multi-view and 3d video coding
CN105519120B (zh) * 2014-06-20 2019-03-22 寰发股份有限公司 用于视频数据的三维或多视图视频编码的分区模式编码方法
US10218957B2 (en) 2014-06-20 2019-02-26 Hfi Innovation Inc. Method of sub-PU syntax signaling and illumination compensation for 3D and multi-view video coding
KR102545015B1 (ko) * 2015-12-14 2023-06-19 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 포인트 클라우드 삼차원 데이터 부호화 방법, 포인트 클라우드 삼차원 데이터 복호 방법, 포인트 클라우드 삼차원 데이터 부호화 장치 및 포인트 클라우드 삼차원 데이터 복호 장치
KR102569476B1 (ko) * 2016-10-11 2023-08-24 엘지전자 주식회사 영상 코딩 시스템에서 인트라 예측에 따른 영상 디코딩 방법 및 장치
CN111052741A (zh) 2017-09-06 2020-04-21 佳稳电子有限公司 基于有效传送的差分量化参数的影像编码/解码方法及装置
JP7033013B2 (ja) * 2018-06-15 2022-03-09 キヤノン株式会社 画像符号化装置、画像復号装置、及び、それらの制御方法、並びに、プログラム
CN109874011B (zh) 2018-12-28 2020-06-09 杭州海康威视数字技术股份有限公司 编码方法、解码方法及装置
EP3937500A4 (en) * 2019-03-06 2022-12-14 Electronics and Telecommunications Research Institute METHOD AND DEVICE FOR ENCODING/DECODING IMAGES AND AND RECORDING MEDIUM WITH RECORDED BITSTREAM
US11570439B2 (en) * 2019-05-15 2023-01-31 Hyundai Motor Company Inverse quantization device and method used in video decoding device
US11934554B2 (en) 2021-05-17 2024-03-19 Bank Of America Corporation Information security by preventing unauthorized data access

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5122875A (en) 1991-02-27 1992-06-16 General Electric Company An HDTV compression system
JP3732867B2 (ja) * 1995-03-09 2006-01-11 株式会社ルネサステクノロジ 画像伸張装置
US5949911A (en) * 1997-05-16 1999-09-07 Teralogic, Inc. System and method for scalable coding of sparse data sets
DE69815159T2 (de) 1998-03-20 2004-04-08 Stmicroelectronics Asia Pacific Pte Ltd. Kodierung von bewegten bildern mit globaler konstanter bitrate
US6041143A (en) * 1998-04-14 2000-03-21 Teralogic Incorporated Multiresolution compressed image management system and method
WO2001030039A1 (en) 1999-10-15 2001-04-26 Nortel Networks Limited Wireless parallel communications system and method therefor
EP1830577A1 (en) 2002-01-18 2007-09-05 Kabushiki Kaisha Toshiba Video decoding method and apparatus
JP2004007563A (ja) 2002-04-19 2004-01-08 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
FI115589B (fi) 2003-10-14 2005-05-31 Nokia Corp Redundanttien kuvien koodaaminen ja dekoodaaminen
CN100568974C (zh) * 2004-09-08 2009-12-09 松下电器产业株式会社 动态图像编码方法及动态图像解码方法
US8340172B2 (en) 2004-11-29 2012-12-25 Qualcomm Incorporated Rate control techniques for video encoding using parametric equations
US8823821B2 (en) 2004-12-17 2014-09-02 Mitsubishi Electric Research Laboratories, Inc. Method and system for processing multiview videos for view synthesis using motion vector predictor list
JP4146444B2 (ja) 2005-03-16 2008-09-10 株式会社東芝 動画像符号化の方法及び装置
EP1867166B1 (de) * 2005-03-30 2014-12-03 Nokia Solutions and Networks GmbH & Co. KG Verfahren und anordnung zum speichern und wiedergeben von tv-sendungen
EP1915870B1 (en) 2005-07-21 2017-03-08 Thomson Licensing Method and apparatus for weighted prediction for scalable video coding
KR20070038396A (ko) 2005-10-05 2007-04-10 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
EP1932363B1 (en) 2005-10-05 2016-05-18 LG Electronics Inc. Method and apparatus for reconstructing image blocks
RU2340114C1 (ru) 2005-11-18 2008-11-27 Сони Корпорейшн Устройство и способ кодирования, устройство и способ декодирования и система передачи
TW200746655A (en) 2005-11-18 2007-12-16 Sony Corp Encoding device and method, decoding device and method, and transmission system
JP5513740B2 (ja) 2006-03-27 2014-06-04 パナソニック株式会社 画像復号化装置、画像符号化装置、画像復号化方法、画像符号化方法、プログラムおよび集積回路
EP1841230A1 (en) * 2006-03-27 2007-10-03 Matsushita Electric Industrial Co., Ltd. Adaptive wiener filter for video coding
KR101382101B1 (ko) 2006-08-25 2014-04-07 톰슨 라이센싱 감소된 해상도의 파티셔닝을 위한 방법 및 장치
JP5413191B2 (ja) 2007-03-20 2014-02-12 富士通株式会社 動画像符号化方法及び装置並びに動画像復号装置
DE102007014329A1 (de) 2007-03-26 2008-10-02 Robert Bosch Gmbh Verfahren zum Erfassen einer elektrischen Potentialdifferenz an einer piezoelektrischen Aktoreinheit und Schaltungsanordnung zur Durchführung des Verfahrens
CA2680140A1 (en) * 2007-04-16 2008-11-06 Kabushiki Kaisha Toshiba Image encoding and decoding method and apparatus
US8238428B2 (en) 2007-04-17 2012-08-07 Qualcomm Incorporated Pixel-by-pixel weighting for intra-frame coding
RU2340144C1 (ru) 2007-06-26 2008-12-10 Олег Иванович Квасенков Способ предпосевной обработки семян
US20090076828A1 (en) * 2007-08-27 2009-03-19 Texas Instruments Incorporated System and method of data encoding
EP2051527A1 (en) 2007-10-15 2009-04-22 Thomson Licensing Enhancement layer residual prediction for bit depth scalability using hierarchical LUTs
EP2215844A2 (en) 2007-10-15 2010-08-11 Nokia Corporation Motion skip and single-loop encoding for multi-view video content
JP2009290498A (ja) * 2008-05-29 2009-12-10 Renesas Technology Corp 画像符号化装置及び画像符号化方法
JP4768779B2 (ja) * 2008-06-02 2011-09-07 株式会社東芝 動画像符号化/復号化の方法及び装置
US8897359B2 (en) * 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
KR20090129926A (ko) 2008-06-13 2009-12-17 삼성전자주식회사 영상 부호화 방법 및 그 장치, 영상 복호화 방법 및 그 장치
US8325796B2 (en) * 2008-09-11 2012-12-04 Google Inc. System and method for video coding using adaptive segmentation
JP5568465B2 (ja) * 2008-09-18 2014-08-06 パナソニック株式会社 画像復号装置、画像符号化装置、画像復号方法、画像符号化方法およびプログラム
JP5222958B2 (ja) * 2008-12-16 2013-06-26 株式会社日立製作所 動画像符号化装置、動画像符号化方法、動画像復号化装置および動画像復号化方法
TWI463878B (zh) 2009-02-19 2014-12-01 Sony Corp Image processing apparatus and method
US8693539B2 (en) 2009-03-26 2014-04-08 Panasonic Corporation Coding method, error detecting method, decoding method, coding apparatus, error detecting apparatus, and decoding apparatus
KR101751559B1 (ko) 2009-10-30 2017-06-27 선 페이턴트 트러스트 복호방법, 복호장치, 부호화 방법 및 부호화 장치
KR20110050283A (ko) 2009-11-06 2011-05-13 삼성전자주식회사 다중 참조 영상을 이용한 고속 움직임 추정 방법
US20110274162A1 (en) * 2010-05-04 2011-11-10 Minhua Zhou Coding Unit Quantization Parameters in Video Coding
US20110194613A1 (en) 2010-02-11 2011-08-11 Qualcomm Incorporated Video coding with large macroblocks
US20110249743A1 (en) 2010-04-09 2011-10-13 Jie Zhao Super-block for high performance video coding
US9247247B2 (en) 2010-04-13 2016-01-26 Samsung Electronics Co., Ltd. Video-encoding method and video-encoding apparatus using prediction units based on encoding units determined in accordance with a tree structure, and video-decoding method and video-decoding apparatus using prediction units based on encoding units determined in accordance with a tree structure
CN106454376B (zh) 2010-04-13 2019-10-01 Ge视频压缩有限责任公司 解码器、重建数组的方法、编码器、编码方法及数据流
WO2011142279A1 (ja) 2010-05-13 2011-11-17 シャープ株式会社 符号化装置、復号装置、およびデータ構造
CN105245895B (zh) 2010-06-04 2019-02-26 索尼公司 图像处理设备和方法
US20110317757A1 (en) * 2010-06-25 2011-12-29 Qualcomm Incorporated Intra prediction mode signaling for finer spatial prediction directions
US20120051431A1 (en) 2010-08-25 2012-03-01 Qualcomm Incorporated Motion direction based adaptive motion vector resolution signaling for video coding
SG188255A1 (en) * 2010-09-30 2013-04-30 Panasonic Corp Image decoding method, image coding method, image decoding apparatus, image coding apparatus, program, and integrated circuit
US8654860B2 (en) 2010-11-01 2014-02-18 Mediatek Inc. Apparatus and method for high efficiency video coding using flexible slice structure
JP2013009165A (ja) 2011-06-24 2013-01-10 Mitsubishi Electric Corp 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
US20140056356A1 (en) 2012-08-21 2014-02-27 Motorola Mobility Llc Method and apparatus for efficient signaling of weighted prediction in advanced coding schemes

Also Published As

Publication number Publication date
US20170295371A1 (en) 2017-10-12
EP3944624A1 (en) 2022-01-26
JP2017153137A (ja) 2017-08-31
US20160366412A1 (en) 2016-12-15
RU2013107607A (ru) 2014-11-10
CN107071429B (zh) 2019-12-10
JP2021132407A (ja) 2021-09-09
JPWO2012042890A1 (ja) 2014-02-06
JP2016131379A (ja) 2016-07-21
US20230336726A1 (en) 2023-10-19
WO2012042890A1 (ja) 2012-04-05
AU2011310239A1 (en) 2013-03-07
KR20190026984A (ko) 2019-03-13
JP2022097644A (ja) 2022-06-30
BR112013004112A2 (pt) 2016-06-28
US20180309993A1 (en) 2018-10-25
US9749630B2 (en) 2017-08-29
JP6145952B2 (ja) 2017-06-14
ZA201301335B (en) 2014-08-27
US20220201303A1 (en) 2022-06-23
AU2011310239B2 (en) 2015-12-03
CN103125117B (zh) 2016-10-26
EP3125562B1 (en) 2022-04-06
CN103125117A (zh) 2013-05-29
RU2595625C2 (ru) 2016-08-27
JP6928847B2 (ja) 2021-09-01
JP2019030023A (ja) 2019-02-21
CN107071429A (zh) 2017-08-18
US11310500B2 (en) 2022-04-19
US10038905B2 (en) 2018-07-31
EP2624560B1 (en) 2016-11-02
EP3125562A1 (en) 2017-02-01
US20200195928A1 (en) 2020-06-18
TW201720155A (zh) 2017-06-01
CA2808795A1 (en) 2012-04-05
EP2624560A1 (en) 2013-08-07
CA2808795C (en) 2018-10-30
JP5894922B2 (ja) 2016-03-30
US9743087B2 (en) 2017-08-22
US10616579B2 (en) 2020-04-07
JP7325573B2 (ja) 2023-08-14
US11729389B2 (en) 2023-08-15
MX2013001774A (es) 2013-03-18
EP2624560A4 (en) 2015-01-14
KR20130094778A (ko) 2013-08-26
TWI625054B (zh) 2018-05-21
TW201220853A (en) 2012-05-16
TWI569628B (zh) 2017-02-01
KR101959091B1 (ko) 2019-03-15
SG188255A1 (en) 2013-04-30
US20130156099A1 (en) 2013-06-20
JP7113250B2 (ja) 2022-08-05

Similar Documents

Publication Publication Date Title
JP7325573B2 (ja) 復号装置および符号化装置
JP7108844B2 (ja) 復号方法、符号化方法、復号装置、符号化装置およびプログラム
JP5855570B2 (ja) 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、プログラムおよび集積回路
KR102030977B1 (ko) 필터 방법, 동화상 부호화 장치, 동화상 복호 장치 및 동화상 부호화 복호 장치
KR102030211B1 (ko) 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 및 부호화 복호 장치
KR20140043734A (ko) 필터 방법, 복호 방법, 및 부호화 방법
KR20190097303A (ko) 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 화상 부호화 복호 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant