JPWO2016088160A1 - 画像復号装置、画像処理システム、及び画像復号方法 - Google Patents

画像復号装置、画像処理システム、及び画像復号方法 Download PDF

Info

Publication number
JPWO2016088160A1
JPWO2016088160A1 JP2016562094A JP2016562094A JPWO2016088160A1 JP WO2016088160 A1 JPWO2016088160 A1 JP WO2016088160A1 JP 2016562094 A JP2016562094 A JP 2016562094A JP 2016562094 A JP2016562094 A JP 2016562094A JP WO2016088160 A1 JPWO2016088160 A1 JP WO2016088160A1
Authority
JP
Japan
Prior art keywords
image
encoded
encoding
decoding
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016562094A
Other languages
English (en)
Inventor
数井 君彦
君彦 数井
智規 久保田
智規 久保田
智史 島田
智史 島田
幸二 山田
幸二 山田
健士郎 武内
健士郎 武内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2016088160A1 publication Critical patent/JPWO2016088160A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

画像復号装置は、不可逆符号化により符号化した第1の符号化ストリームを、画像符号化装置に対して要求し、第1の符号化ストリームを復号して、符号化対象画像を符号化した第1の符号化画像から第1の復号画像を生成し、第1の復号画像を出力する。次に、画像復号装置は、画像符号化装置に対して第2の符号化ストリームを要求する。第2の符号化ストリームは、符号化対象画像に対して、第1の符号化画像を復号した局所復号画像を参照画像として用い、大きさが0の動きベクトルを用いるインター予測を適用して、予測誤差を可逆符号化により符号化した第2の符号化画像を含む。そして、画像復号装置は、第2の符号化ストリームを復号して、第2の符号化画像から第2の復号画像を生成し、第1の復号画像と第2の復号画像とを加算した加算結果を用いて、第1の復号画像に対応する第3の復号画像を生成し、第3の復号画像を出力する。

Description

本発明は、画像復号装置、画像処理システム、及び画像復号方法に関する。
動画像データは、非常に大きなデータ量を有することが多い。このため、送信装置から受信装置へ動画像データを送信する場合や、動画像データを記憶装置に格納する場合には、動画像データの圧縮符号化が行われる。
代表的な動画像符号化標準が、International Organization for Standardization/International Electrotechnical Commission(ISO/IEC) によって策定されている。動画像符号化標準は、International Telecommunication Union Telecommunication Standardization Sector(ITU-T)によっても策定されている。
これらの符号化標準としては、例えば、Moving Picture Experts Group phase 2(MPEG-2, ITU-T H.262 | ISO/IEC 13818-2)及びAdvanced Video Coding (AVC, ITU-T H.264 | ISO/IEC 14496-10) が知られている。さらに、High Efficiency Video Coding (HEVC, ITU-T H.265 | ISO/IEC 23008-2)も知られている。
上述した動画像符号化標準は、インター予測符号化とイントラ予測符号化の2つの符号化方式を採用している。インター予測符号化は、動画像中の1枚のピクチャに対応する符号化対象画像を符号化済み画像の情報を用いて符号化する符号化方式であり、イントラ予測符号化は、符号化対象画像が持つ情報のみを用いて符号化対象画像を符号化する符号化方式である。
動画像データの圧縮符号化は、圧縮符号化前の画像と伸張復号後の画像とが完全一致するか否かという観点で、ロスレス符号化とロッシー符号化とに分類される。ロスレス符号化は、圧縮符号化前の画像と伸張復号後の画像とが完全一致する、可逆符号化であり、ロッシー符号化は、それらが完全一致しない不可逆符号化である。ロッシー符号化は、符号化画像の情報量をロスレス符号化よりも多く削減できるが、情報量の削減度が増加するにつれて、元画像と復号画像との誤差が増加する。
上述したH.264及びHEVCは、ロスレス符号化とロッシー符号化の両方に対応している。これらの符号化標準は、周波数変換の1つである離散コサイン変換(DCT)により空間方向の冗長性を除去することで、高い圧縮効率を実現している。しかし、規定されるDCTが非可逆演算であるため、ロスレス符号化時にはDCTが行われないように規定されている。
動画像符号化以外にも、静止画像の符号化方式であるJoint Photographic Experts Group 2000(JPEG 2000, ISO/IEC 15444)及びJPEG-LS(ISO/IEC 14495)は、ロスレス符号化とロッシー符号化の両方に対応している。JPEG 2000は、周波数変換の1つである離散ウェーブレット変換(DWT)により、DCTと同様に冗長性を除去している。JPEG 2000のDWTは可逆演算であるため、ロスレス符号化時にもDWTが行われる。
ディジタル入力信号をスケーラブル符号化し、基本階層符号と1以上の拡張階層符号とを生成する符号化装置も知られている(例えば、特許文献1を参照)。この符号化装置は、基本階層符号をロスレス符号化し、ロスレス符号を生成し、ロスレス符号と拡張階層符号との複数種類の組合せの中から、単位時間当たりの符号量が利用伝送帯域以下であって、かつ、単位時間当たりの符号量が最も大きい組合せを選択する。
特開2012−88502号公報
ロスレス符号化は、例えば、画像データの原本性を保証する分野で適用される。具体的には、医療分野等で、画像データに対してロスレス符号化が適用されることがある。コンピュータ断層撮影(CT)装置等の検査装置(モダリティ装置)で撮影された医用画像には保存義務があり、診断用途にはロスレス符号化が推奨されている。ただし、遠隔地で一時的に医用画像を参照する場合は、データ伝送時間の短縮のために、より情報量の少ないロッシー符号化が許容される場合がある。
医用画像の圧縮符号化においては、JPEG 2000のような静止画像符号化方式が広く利用されている。この理由は、医療分野の従来の主要な用途である診断や原本保存で適用されるロスレス符号化において、JPEG 2000が高い圧縮性能を示すことにある。
AVCのロスレス符号化モードは、周波数変換が適用されないため、圧縮性能はJPEG 2000に劣る。この性能差は、1枚毎の画像のイントラ予測符号化だけでなく、連続する画像列(例えば、マルチスライスCT画像)のインター予測符号化時においても同様である。動画像符号化方式は、ロスレス符号化時において、インター予測符号化の圧縮性能とイントラ予測符号化の圧縮性能とが同等となることが多い。
例えば、医療分野では、各病院で撮影された医用画像を、通信ネットワークを介して地域内で共用することで、出先でも患者が適切な治療を受けられるようにすること等、医療の質を高める取り組みが進められている。この場合、診断や原本保存の用途に加え、遠隔地での参照の用途にも対応するために、医用画像に対してロスレス符号化とロッシー符号化の両方を適用することが望ましい。
画像符号化装置において、1つの医用画像に対してロスレス符号化とロッシー符号化とを個別に適用すると、2つの圧縮画像が生成され、1つの符号化方式のみを取り扱う場合に比べてデータ量が増加する。医療分野では、沢山の患者の医用画像を取り扱うため、このデータ量の増加が大きな問題となる。例えば、1つの医用画像に対する2つの圧縮画像を画像符号化装置から画像復号装置へ伝送すると、通信ネットワークのリソースが大量に消費されてしまう。
なお、かかる問題は、医用画像をロスレス符号化及びロッシー符号化により符号化する場合に限らず、他の画像を符号化する場合においても生ずるものである。
1つの側面において、本発明の目的は、画像を可逆符号化及び不可逆符号化により符号化して画像符号化装置から画像復号装置へ伝送する場合に、通信ネットワークを有効利用することである。
1つの案では、画像復号装置は、受信部、第1の復号部、記憶部、第2の復号部、生成部、及び復号制御部を含む。
受信部は、複数の符号化対象画像を不可逆符号化により符号化した第1の符号化ストリームと、第2の符号化ストリームとを、画像符号化装置から受信する。画像符号化装置は、複数の符号化対象画像のうち1つの符号化対象画像に対して、1つの符号化対象画像を符号化した第1の符号化画像を復号した局所復号画像を参照画像として用い、大きさが0の動きベクトルを用いるインター予測を適用する。第2の符号化ストリームは、インター予測を適用して予測誤差を可逆符号化により符号化した第2の符号化画像を含む。
第1の復号部は、第1の符号化ストリームを復号して、第1の符号化画像から第1の復号画像を生成し、記憶部は、第1の復号画像を記憶する。第2の復号部は、第2の符号化ストリームを復号して、第2の符号化画像から第2の復号画像を生成する。生成部は、第1の復号画像と第2の復号画像とを加算した加算結果を用いて、第1の復号画像に対応する第3の復号画像を生成する。
復号制御部は、第1の復号画像を出力する場合、画像符号化装置に対して第1の符号化ストリームを要求し、第1の復号画像を第1の復号部に生成させ、第1の復号画像を記憶部に記憶させ、第1の復号画像を出力する。また、復号制御部は、第1の復号画像を出力した後に第3の復号画像を出力する場合、画像符号化装置に対して第2の符号化ストリームを要求し、第2の復号画像を第2の復号部に生成させ、第3の復号画像を生成部に生成させ、第3の復号画像を出力する。
実施形態によれば、画像を可逆符号化及び不可逆符号化により符号化して画像符号化装置から画像復号装置へ伝送する場合に、通信ネットワークを有効利用することができる。
画像処理システムの構成図である。 画像符号化装置の構成図である。 画像復号装置の構成図である。 復号部及び生成部の構成図である。 符号化データを示す図である。 画像符号化処理のフローチャートである。 画像復号処理のフローチャートである。 情報処理装置の構成図である。
以下、図面を参照しながら、実施形態を詳細に説明する。
実施形態の画像符号化装置は、入力される動画像信号を、HEVC規格に基づいて画像(ピクチャ)単位で符号化する。このとき、HEVCの階層符号化機能(Scalable HEVC, SHVC)を利用して、各画像に対して品質階層符号化(Quality Scalable Video Coding)が適用される。この品質階層符号化は、ロッシー符号化する基本レイヤ(ベースレイヤ)と、ロスレス符号化する拡張レイヤ(エンハンスメントレイヤ)の2つのレイヤからなる。
図1は、1つの基本レイヤと1つの拡張レイヤとの2レイヤの場合の品質階層符号化を行う画像処理システムの構成例を示している。品質階層符号化においては、1つの拡張レイヤの代わりに、複数の拡張レイヤを用いてもよい。
図1の画像処理システムは、画像符号化装置1001及び画像復号装置1002を含む。画像符号化装置1001と画像復号装置1002は、例えば、通信ネットワークを介して通信することができる。画像符号化装置1001は、基本レイヤの符号化部1100及び拡張レイヤの符号化部1200を含み、画像復号装置1002は、基本レイヤの復号部1300及び拡張レイヤの復号部1400を含む。
符号化部1100は、減算部1101、予測誤差符号化部1102、予測誤差復号部1103、加算部1104、復号画像バッファ1105、及び予測画像生成部1106を含む。
減算部1101は、入力される動画像に含まれる符号化対象画像の画素値から、予測画像生成部1106が生成する予測画像の画素値(予測値)を減算して、符号化対象画像と予測画像との差分である予測誤差を生成する。予測誤差符号化部1102は、減算部1101が生成する予測誤差を符号化する。予測誤差符号化部1102における符号化は、エントロピー符号化を含む。符号化された予測誤差は、基本レイヤの符号化画像として出力され、基本レイヤの符号化画像を含む符号化ストリームが画像復号装置1002へ送信される。
予測誤差復号部1103は、符号化された予測誤差を復号して、減算部1101が生成する予測誤差に符号化歪が重畳された予測誤差を生成する。加算部1104は、符号化歪が重畳された予測誤差に、予測画像生成部1106が生成する予測画像の画素値を加算して、歪のある局所復号画像を生成する。復号画像バッファ1105は、加算部1104が生成する局所復号画像を格納する。
予測画像生成部1106は、復号画像バッファ1105に格納された局所復号画像から予測値を生成する。予測画像生成部1106において適用される予測モードは、基本レイヤの符号化対象画像の符号化済み画素値から予測値を生成するイントラ予測モード、又は基本レイヤの符号化済み画像を参照画像とするインター予測モードのいずれかである。
符号化部1200は、減算部1201、予測誤差符号化部1202、予測誤差復号部1203、加算部1204、復号画像バッファ1205、及び予測画像生成部1206を含む。
減算部1201は、符号化対象画像の画素値から、予測画像生成部1206が生成する予測値を減算して、符号化対象画像と予測画像との差分である予測誤差を生成する。予測誤差符号化部1202は、減算部1201が生成する予測誤差を符号化する。予測誤差符号化部1202における符号化は、エントロピー符号化を含む。符号化された予測誤差は、拡張レイヤの符号化画像として出力され、拡張レイヤの符号化画像を含む符号化ストリームが画像復号装置1002へ送信される。
予測誤差復号部1203は、符号化された予測誤差を復号して、減算部1201が生成する予測誤差と同一の歪のない予測誤差を生成する。加算部1204は、歪のない予測誤差に、予測画像生成部1206が生成する予測値を加算して、局所復号画像を生成する。復号画像バッファ1205は、加算部1204が生成する局所復号画像を格納するとともに、復号画像バッファ1105に格納された基本レイヤの歪のある局所復号画像も格納する。
予測画像生成部1206は、復号画像バッファ1205に格納された局所復号画像から予測値を生成する。予測画像生成部1206において適用される予測モードは、基本レイヤの符号化対象画像の符号化済み画素値から予測値を生成するイントラ予測モード、又はインター予測モードのいずれかである。インター予測モードでは、基本レイヤの符号化済み画像又は拡張レイヤの符号化済み画像が参照画像として用いられる。
復号部1300は、予測誤差復号部1301、加算部1302、復号画像バッファ1303、及び予測画像生成部1304を含む。
予測誤差復号部1301は、符号化部1100から出力される基本レイヤの符号化ストリームに含まれる符号化画像を復号して、符号化歪が重畳された予測誤差を生成する。加算部1302は、符号化歪が重畳された予測誤差に、予測画像生成部1304が生成する予測値を加算して、歪のある復号画像を生成する。
復号画像バッファ1303は、加算部1302が生成する復号画像を格納する。この復号画像は、ロッシー動画像として出力され、画面上に表示される。予測画像生成部1304は、復号画像バッファ1303に格納された復号画像から、インター予測画像又はイントラ予測画像を生成する。
復号部1400は、予測誤差復号部1401、加算部1402、復号画像バッファ1403、及び予測画像生成部1404を含む。
予測誤差復号部1401は、符号化部1200から出力される拡張レイヤの符号化ストリームに含まれる符号化画像を復号して、歪のない予測誤差を生成する。加算部1402は、歪のない予測誤差に、予測画像生成部1404が生成する予測値を加算して、歪のない復号画像を生成する。
復号画像バッファ1403は、加算部1402が生成する復号画像を格納する。この復号画像は、ロスレス動画像として出力され、画面上に表示される。復号画像バッファ1403は、復号画像バッファ1303に格納された基本レイヤの歪のある復号画像も格納する。予測画像生成部1404は、復号画像バッファ1403に格納された復号画像から、インター予測画像又はイントラ予測画像を生成する。
通常の動画像の階層符号化では、画像復号装置1002の仕様に対応する品質の動画像を画像符号化装置1001から画像復号装置1002へ送信することを想定している。この場合、基本レイヤの復号画像よりも高品質な復号画像を提供するために、基本レイヤの符号化と拡張レイヤの符号化とが同時に行われ、基本レイヤの符号化ストリームと拡張レイヤの符号化ストリームとが同時に送信される。
これに対して、マルチスライスCT画像は、人体を数ミリ毎に撮影したスライス画像であり、通常の動画像とは異なってフレームレートが低い。このようなマルチスライスCT画像を表示する場合、医師は、まず、頭頂部のスライス画像から足先のスライス画像まであたかも1つの連続した動画像であるかのように連続的に観察し、その後、胸部等の注目するスライス画像を詳細に確認することが多い。
連続観察時には、人間の視覚特性が落ちるため、ロッシー動画像でも十分である。とりわけ、連続観察時には複数スライス分の符号化ストリームが画像符号化装置1001から画像復号装置1002へ伝送されるが、基本レイヤの符号化ストリームのみを伝送することで、伝送レートが削減され、通信ネットワークを有効利用することが可能になる。
そこで、実施形態の画像符号化装置1001は、拡張レイヤの符号化において、符号化対象画像内のすべてのCoding Unit(CU)をインター予測符号化する。CUは、AVC規格等でのマクロブロックに相当する。そして、画像符号化装置1001は、同じ符号化対象画像を基本レイヤで符号化したときの局所復号画像のみを、インター予測における参照画像として用いる。
以下の説明において、符号化画像は、画面全体に対応する符号化対象画像を符号化した結果を表すこともあり、符号化対象画像内のCUを符号化した結果を表すこともある。また、復号画像は、符号化対象画像に対応する符号化画像を復号した結果を表すこともあり、CUに対応する符号化画像を復号した結果を表すこともある。
実施形態の画像復号装置1002は、遠隔地での参照等の用途で受信データのデータ量を削減する場合には、基本レイヤのロッシー符号化画像のみを受信し、ロッシー符号化画像を伸張復号して、画面上に表示する。
一方、診断等の用途でロスレス画像を表示する場合には、画像復号装置1002は、基本レイヤと拡張レイヤの両方の符号化画像を受信し、ロスレス符号化画像を伸張復号する。このとき、基本レイヤと拡張レイヤとを独立に復号することで、画像復号装置1002の回路規模を削減することができる。
画像復号装置1002は、基本レイヤを復号して歪のある復号画像を生成した後に拡張レイヤを基本レイヤなしで復号することで、基本レイヤの復号画像と拡張レイヤの復号画像とを生成する。基本レイヤの復号画像は、元画像に対して符号化歪が重畳された画像であり、拡張レイヤの復号画像は、元画像に重畳された符号化歪を正負反転させた誤差を表す画像である。ロスレス画像を表示する場合、画像復号装置1002は、基本レイヤのロッシー復号画像と拡張レイヤの復号画像とを加算した結果を表示する。
HEVCの階層符号化(SHVC)は、MPEG−2やAVC等の階層符号化とは異なり、拡張レイヤでのCUの復号処理は、基本レイヤでの復号処理と同等である。拡張レイヤの圧縮効率を向上させるため、基本レイヤの情報(符号化モード、復号画素値等)が参照されるが、SHVCでは、復号画素値のみが参照可能になっている。とりわけ、基本レイヤの復号画像を、拡張レイヤの参照画像の1つとして取り扱うことで、復号画素値の参照が可能になる。
参照画像情報等の画像レベルのパラメータの復号処理は、基本レイヤと拡張レイヤとで若干異なるものの、CUの復号処理においては、基本レイヤを処理する回路と拡張レイヤを処理する回路とを共用できる。
SHVC規格上は、拡張レイヤにおいても、CU毎にインター予測符号化とイントラ予測符号化とを切り替えることが可能である。さらに、インター予測符号化では、拡張レイヤでの他画像の復号画像と、基本レイヤでの同一画像に対応する復号画像又は他画像に対応する復号画像とを、CU毎に切り替えて参照画像として用いることが可能である。
しかし、実施形態の拡張レイヤの符号化では、画像内のすべてのCUがインター予測符号化され、かつ、基本レイヤでの同一画像に対応する復号画像のみが参照画像として用いられる。これにより、拡張レイヤのみを用いて、基本レイヤの復号画像に含まれる符号化歪を復元することが可能になる。SHVC規格上は基本レイヤと拡張レイヤとを併せて復号することが規定されているが、このような拡張レイヤの符号化を採用することで、規定された条件を緩和できる。
より具体的に説明すると、拡張レイヤのすべてのCUの符号化モードとして、基本レイヤでの同一画像に対応する復号画像を参照画像として用い、大きさが0の動きベクトルを用いるインター予測符号化モードを採用する。このようなインター予測符号化を行った場合、拡張レイヤでの各CUの符号化画素値は、元画像の画素値と、ロッシー符号化画像を復号した復号画素値との差分そのものになる。
さらに、HEVC規格では、伝送エラー等により復号画像バッファに参照画像が存在しない場合の動作が厳密に規定されている。具体的には、輝度及び色差成分が画面全体で中間値となる画像を参照画像として用いることが規定されている。例えば、8ビット画像の場合、中間値は128となる。これにより、基本レイヤなしで拡張レイヤを復号した場合でも、その復号結果を一意に決めることができる。
したがって、実施形態の拡張レイヤを基本レイヤなしで復号した場合、ロッシー符号化による符号化歪を正負反転させた値に中間値を加算した加算結果が生成される。そこで、画像復号装置1002は、基本レイヤの復号画像に対して、得られた加算結果を加算し、画面一様に中間値を減算することで、元画像を完全に復元することが可能になる。
例えば、元画像のある画素の画素値Aが基本レイヤでロッシー符号化され、復号により復号画素値A’が得られた場合、ロッシー符号化による符号化歪はA’−Aである。一方、拡張レイヤのロスレス符号化では、基本レイヤでの同一画像に対応する復号画像が参照され、大きさが0の動きベクトルが用いられるため、すべてのCUにおいてロッシー符号化時の復号画素値そのものが予測画像の画素値として用いられる。したがって、拡張レイヤでは、A−A’がロスレス符号化される。
ここで、基本レイヤなしで拡張レイヤを復号すると、A−A’に中間値Bが加算された値A−A’+Bが得られる。そして、復号画素値A’に値A−A’+Bを加算するとA+Bとなり、A+Bから中間値Bを減算することで、元の画素値Aが復元される。
図2は、実施形態の画像符号化装置の構成例を示している。図1の画像符号化装置100は、ロッシー符号化制御部110、符号化部111、ロッシー符号化ヘッダ生成部112、ロスレス符号化制御部120、符号化部121、ロスレス符号化ヘッダ生成部122、多重化部130、及び送信部140を含む。符号化部111及び符号化部121は、それぞれ、図1の符号化部1100及び符号化部1200に対応する。
そして、画像符号化装置100は、動画像に含まれる各フレームに対して、ロッシーな基本レイヤとロスレスな拡張レイヤの2レイヤからなる品質階層符号化を行い、符号化ストリームを出力する。各フレームに対応する符号化対象画像は、カラー画像であってもよく、モノクロ画像であってもよい。カラー画像の場合、画素値はRGB形式であってもよく、色差形式であってもよい。色差形式は4:4:4、4:2:2、4:2:0、又は4:0:0であってもよい。
画像符号化装置100は、例えば、ハードウェア回路として実装することができる。この場合、画像符号化装置100は、各構成要素を個別の回路として含んでいてもよく、1つの集積回路であってもよい。
ロッシー符号化制御部110は、符号化部111及びロッシー符号化ヘッダ生成部112を制御する制御信号を出力する。この制御信号は、各符号化対象画像の符号化モード、量子化パラメータ等を指定する信号である。符号化モードは、例えば、イントラ予測符号化のみ、又はイントラ予測符号化とインター予測符号化との混在を示す。インター予測符号化で参照される参照画像としては、基本レイヤの局所復号画像が指定される。
符号化部111は、符号化対象画像に対してロッシー符号化を適用し、CU毎の基本レイヤの符号化画像を生成して出力する。生成される符号化画像は、HEVC規格の単一レイヤ符号化規定に準拠する。
ロッシー符号化ヘッダ生成部112は、HEVC規格の単一レイヤ符号化規定に準拠したロッシー符号化時のスライス、画像、及びシーケンス単位の符号化パラメータを生成して出力する。
ロスレス符号化制御部120は、符号化部121及びロスレス符号化ヘッダ生成部122を制御する制御信号を出力する。この制御信号は、各符号化対象画像の符号化モード、ロスレス符号化等を指定する信号である。符号化モードは、例えば、すべてのCUでイントラ予測符号化のみ、又はすべてのCUで、符号化部111が出力する同一画像に対応する復号画像を参照画像とするインター予測符号化のみを示す。
符号化部121は、各符号化対象画像に対してロスレス符号化を適用し、CU毎の拡張レイヤの符号化画像を生成して出力する。生成される符号化画像は、HEVC規格の単一レイヤ符号化規定に準拠する。
ロスレス符号化ヘッダ生成部122は、HEVC規格の複数レイヤ符号化規定に準拠したロスレス符号化時のスライス、画像、及びシーケンス単位の符号化パラメータを生成して出力する。
多重化部130は、ロッシー符号化ヘッダ生成部112、符号化部111、ロスレス符号化ヘッダ生成部122、及び符号化部121の出力を多重化して、2レイヤ品質階層符号化動画像の符号化データを生成する。
送信部140は、多重化部130が出力する符号化データ(符号化画像及び符号化パラメータ)を蓄積し、符号化ストリームとして記憶する。そして、送信部140は、画像復号装置からの要求に応じて、基本レイヤの符号化ストリームのみ、拡張レイヤの符号化ストリームのみ、又は基本レイヤの符号化ストリームと拡張レイヤの符号化ストリームの両方を、画像復号装置へ送信する。
図3は、実施形態の画像復号装置の構成例を示している。図3の画像復号装置200は、復号制御部210、受信部211、復号部220、復号部221、記憶部222、及び生成部223を含む。復号部220及び復号部221は、それぞれ、図1の復号部1300及び復号部1400に対応する。
画像復号装置200は、例えば、ハードウェア回路として実装することができる。この場合、画像復号装置200は、各構成要素を個別の回路として含んでいてもよく、1つの集積回路であってもよい。
復号制御部210は、符号化ストリームをロッシー復号又はロスレス復号して復号画像を画面上に表示するために、画像復号装置200の各構成要素を制御する制御信号を出力する。図3では、復号制御部210から受信部211、復号部220、復号部221、記憶部222、及び生成部223へ出力される制御信号は省略されている。
復号制御部210は、ロッシー復号画像を表示する場合、画像符号化装置100に対して基本レイヤの符号化ストリームのみを要求し、受信部211は、基本レイヤの符号化ストリームを受信して、復号部220へ出力する。
一方、ロスレス復号画像を表示する場合、復号制御部210は、画像符号化装置100に対して、拡張レイヤの符号化ストリームのみ、又は基本レイヤと拡張レイヤの両方の符号化ストリームを要求する。そして、受信部211は、基本レイヤの符号化ストリームを受信すると、受信した符号化ストリームを復号部220へ出力し、拡張レイヤの符号化ストリームを受信すると、受信した符号化ストリームを復号部221へ出力する。
復号制御部210は、画像符号化装置100に対して、所定の単位で符号化ストリームを要求することができる。復号制御部210は、所定の単位として、時間幅を指定することもでき、特定の画像を指定することもできる。
復号部220は、基本レイヤの符号化ストリームに含まれる符号化画像を復号し、ロッシー復号画像を生成して出力する。復号部221は、拡張レイヤの符号化ストリームに含まれる符号化画像を復号し、符号化歪を表す復号画像を生成して出力する。
記憶部222は、復号部220が出力するロッシー復号画像を記憶し、復号制御部210は、記憶部222が記憶するロッシー復号画像列をロッシー動画像として画面上に表示する制御を行う。
生成部223は、同じ元画像に対応する、記憶部222が記憶するロッシー復号画像の画素値と、復号部221が出力する復号画像の画素値とを加算する。そして、生成部223は、得られた加算結果から中間値等に対応する所定の画素値を減算してロスレス復号画像を生成し、復号制御部210は、ロスレス復号画像列をロスレス動画像として画面上に表示する制御を行う。
ロッシー動画像が表示された後、オペレータ、アプリケーションプログラム等から1つの画像の詳細情報の表示を要求されることがある。この場合、復号制御部210は、拡張レイヤの符号化ストリームに含まれる符号化画像のうち、要求された画像に対応する特定の符号化画像のみを、画像符号化装置100に対して要求してもよい。
例えば、医師がマルチスライスCT画像の頭頂部のスライス画像から足先のスライス画像までを連続した動画像として観察するとき、復号制御部210は、基本レイヤの符号化ストリームのみを画像符号化装置100に対して要求する。そして、画像符号化装置100から画像復号装置200へ基本レイヤの符号化ストリームのみが伝送される。これにより、基本レイヤと拡張レイヤの両方の符号化ストリームを伝送する場合よりも、伝送レートが削減される。
次に、医師が胸部等の注目するスライス画像を詳細に確認するとき、復号制御部210は、医師から指定されたスライス画像に対応する拡張レイヤの符号化画像のみを画像符号化装置100に対して要求する。そして、画像符号化装置100から画像復号装置200へ拡張レイヤの符号化画像のみが伝送される。画像復号装置200は、拡張レイヤの符号化画像のみを単体で復号した後に、保存されているロッシー復号画像と加算することで、ロッシー復号を再度行うことなく、ロスレス復号画像を表示することができる。
図2の画像符号化装置100及び図3の画像復号装置200によれば、以下のような効果が得られる。
(1)ロッシー復号画像とロスレス復号画像とを柔軟かつ簡単に切り替えることができ、画像符号化装置と画像復号装置との間の通信ネットワークを有効利用することが可能になる。
基本レイヤの符号化ストリームと拡張レイヤの符号化ストリームとを異なるタイミングで伝送することができるため、両方の符号化ストリームを同時に伝送する場合よりも、伝送レートが削減される。
(2)品質階層符号化により、ロスレス符号化とロッシー符号化の両方に対応できる。とりわけ、符号化パラメータ及び符号化画像はSHVCに完全準拠であるため、SHVC準拠の画像復号装置により正常に復号可能である。
(3)HEVCの品質階層符号化を適用することで、HEVCで単純にロスレス符号化する場合やJPEG 2000等の静止画符号化によりロスレス符号化する場合よりも、総情報量(基本レイヤの情報量と拡張レイヤの情報量との和)を削減することができる。
例えば、精度が12ビット、色差形式が4:0:0のマルチスライスCT画像(512画素×512画素)の場合、15%程度の情報量を削減できる。この場合、ロッシー符号化の量子化パラメータは0近辺に設定されるが、量子化パラメータ0を用いたときの量子化歪の大きさは、量子化パラメータの最小値−24を用いたときの量子化歪の大きさの16倍である。また、ロッシー符号化にはインター予測符号化が適用される。
12ビット信号のMost Significant Bit(MSB)成分は、画像内及び画像間で高い相関性があるため、インター予測符号化と周波数変換とを適用することで情報量を大幅に削減できる。一方、符号化歪として残る、12ビット信号のLeast Significant Bit(LSB)成分は、画像内及び画像間での相関性が低いため、HEVCのロスレス符号化で十分であると言える。
(4)画像復号装置の回路構成を簡単化できる。具体的には、基本レイヤのCUのための復号回路と、拡張レイヤのCUのための復号回路とを共用できる。
図2の画像符号化装置100及び図3の画像復号装置200は、様々な用途に利用される。例えば、画像符号化装置100又は画像復号装置200を、ビデオカメラ、動画像送信装置、動画像受信装置、テレビ電話システム、コンピュータ、又は携帯電話機に組み込むことも可能である。
図4は、図3の復号部221及び生成部223の構成例を示している。図4の復号部221は、予測誤差復号部2401、加算部2402、及び中間色画像生成部2403を含む。
予測誤差復号部2401は、図1の予測誤差復号部1401に対応し、CU毎に拡張レイヤの符号化画像を復号して、基本レイヤの符号化歪を正負反転させた値に対応する復号結果を生成する。
中間色画像生成部2403は、すべての画素の画素値が中間値である、仮想的な中間色画像を生成する。HEVC規格では、復号画像バッファに参照画像が存在しない場合、この中間色画像が復号画像バッファに挿入され、参照画像として用いられる。例えば、符号化対象画像がNビットの精度を持つ場合、(Y,Cb,Cr)=(2^(N−1),2^(N−1),2^(N−1))を中間値として用いることができる。
加算部2402は、図3の加算部1402に対応し、予測誤差復号部2401が生成する復号結果と、中間色画像生成部2403が生成する中間色画像の画素値とをCU単位で加算し、加算結果を復号画像の画素値として出力する。これにより、予測誤差復号部2401が生成する復号結果が負の値であっても、復号部221から正の画素値を有する復号画像を出力することができる。
生成部223は、加算部2501、減算部2502、及び中間色画像生成部2503を含む。加算部2501は、記憶部222が記憶するロッシー復号画像の画素値と、復号部221が出力する復号画像の画素値とを画像単位で加算し、加算結果を出力する。中間色画像生成部2503は、中間色画像生成部2403と同様に、中間色画像を生成する。減算部2502は、加算部2501が出力する加算結果から、中間色画像生成部2503が生成する中間色画像の画素値を画像単位で減算して、拡張レイヤのロスレス復号画像を生成する。
拡張レイヤのすべてのCUに対して、基本レイヤでの同一画像に対応する復号画像が参照され、動きベクトルが0になる、という条件の下では、生成部223が出力するロスレス復号画像は、図1の復号部1400が出力するロスレス復号画像と完全に一致する。
図4の構成によれば、図1の復号画像バッファ1403及び予測画像生成部1404を省略することができ、ロスレス復号画像を生成するための復号部221の構成が簡略化される。これにより、画像復号装置200において符号化ストリームを受信する処理の負荷が軽減される。
図5は、基本レイヤ又は拡張レイヤにおける、1つの符号化対象画像に対応する符号化データの例を示している。図5の符号化データ2000は、Video Parameter Set(VPS)2010、Sequence Parameter Set(SPS)2011、Picture Parameter Set(PPS)2012、及びSlice Segmentヘッダ(SLICE)2013を含む。符号化データ2000は、さらにCoded Tree Unit(CTU)2014を含む。
VPS2010は、レイヤのパラメータを記述する。基本レイヤの場合、少なくとも再引き込みを開始する符号化画像には、VPS2010が付加される。拡張レイヤの場合は、すべての符号化画像にVPS2010が付加される。
VPS2010に含まれるパラメータは、基本レイヤと拡張レイヤとで共通である。このうち、品質階層符号化に関するパラメータとして、例えば、以下のようなものが用いられる。
VpsBaseLayerInternalFlag:基本レイヤのパラメータであり、符号化動画像に含まれることを示す値‘1’が設定される。
VpsBaseLayerAvailableFlag:基本レイヤの符号化画像が符号化動画像に含まれることを示す値‘1’が設定される。
VpsMaxLayersMinus1:2レイヤを示す値‘1’が設定される。
ProfileTierLevel:拡張レイヤの階層符号化プロファイル(MainScalableプロファイル等)と、基本レイヤの単一レイヤ符号化プロファイル(Mainプロファイル等)を記述する。
ScalabilityMaskFlag[i]:iが0の場合のみ、2レイヤに相当する値‘1’が設定される。
DimensionIdLenMinus[0]:2レイヤに相当する値‘0’が設定される。
VpsNuhLayerIdPresentFlag:拡張レイヤのNuhLayerIdを記述するために、値‘1’が設定される。
LayerIdInNuh:拡張レイヤのNuhLayerIdとして、値‘1’が設定される。
DimensionId[1][0]:品質階層符号化を示す値‘2’が設定される。
DirectDependencyFlag[1][0]:拡張レイヤが基本レイヤを参照することを示す値‘1’が設定される。
VpsNumProfileTierLevelMinus1:2レイヤに相当する値‘1’が設定される。
MaxOneActiveRefLayerFlag:2レイヤのみであるため、値‘1’が設定される。
SPS2011は、各レイヤにおけるシーケンスで共通のパラメータを記述する。基本レイヤの場合、少なくとも再引き込みを開始する符号化画像には、SPS2011が付加される。拡張レイヤの場合は、すべての符号化画像にSPS2011が付加される。
SPS2011に含まれるパラメータは、基本レイヤと拡張レイヤとで異なる。品質階層符号化に関するパラメータとして、例えば、以下のようなものが用いられる。
NumShortTermRefPicSets:拡張レイヤの場合のみ、拡張レイヤ間での参照を行わないことを示す値‘0’が設定される。
LongTermRefPicsPresentFlag:値‘0’が設定される。VPSパラメータにより、デフォルトで基本レイヤの復号画像は、拡張レイヤの参照画像となる。
PPS2012は、各レイヤにおける複数の画像で共通のパラメータを記述する。基本レイヤの場合、少なくとも再引き込みを開始する符号化画像には、PPS2012が付加する。拡張レイヤの場合は、すべての符号化画像にPPS2012が付加される。
PPS2012に含まれるパラメータは、基本レイヤと拡張レイヤとで異なる。品質階層符号化に関するパラメータとして、例えば、以下のようなものが用いられる。
InitQpMinus26:拡張レイヤの場合、量子化パラメータQPが最小値であることを示す値が設定される。この値は画像のビット精度に依存し、例えば、8ビット画像の場合は‘−26’が設定される。
CuQpDeltaEnabledFlag:拡張レイヤの場合、量子化を行わないため、値‘0’が設定される。
TransquantBypassEnableFlag:拡張レイヤの場合、ロスレス符号化を行うことを示す値‘1’が設定される。
Slice Segmentヘッダ2013は、スライス共通のパラメータを記述する。各符号化画像に1つ以上のSlice Segmentヘッダ2013が付加される。
Slice Segmentヘッダ2013に含まれるパラメータは、基本レイヤと拡張レイヤとで異なる。品質階層符号化に関するパラメータとして、例えば、以下のようなものが用いられる。
SliceType:拡張レイヤの場合のみ、Pピクチャを示す値‘1’が常に設定される。
ShortTermRefPicSetSpsFlag:拡張レイヤの場合のみ、SPS2011を参照することを示す値‘1’が設定される。
InterLayerPredEnabledFlag:拡張レイヤの場合のみ、レイヤ間の参照を行うことを示す値‘1’が設定される。
SliceQpDelta:拡張レイヤの場合のみ、ロスレス符号化を行うことを示す値‘0’が設定される。
CTU2014は、符号化対象画像内のCTUの数だけ出現する。各CTUは、64画素×64画素のブロックであり、1つ又は複数のCUを含む。各CUは、CUの符号化画像とパラメータとを含む。
各CUに含まれるパラメータは、基本レイヤと拡張レイヤとで異なる。品質階層符号化に関するパラメータとして、例えば、以下のようなものが用いられる。以下の設定は、拡張レイヤのすべてのCUに対して適用される。
CuTransquantBypassFlag:拡張レイヤの場合のみ、ロスレス符号化することを示す値‘1’が設定される。
PredModeFlag:拡張レイヤの場合のみ、インター予測モードを示す値‘0’が設定される。
PredictionUnit:拡張レイヤの場合のみ、RefIdxが0となる参照画像(参照ピクチャ)を参照し、復号される動きベクトルが(0,0)となるように設定される。RefIdxが0の参照画像としては、基本レイヤでの同一画像に対応する復号画像が割り当てられる。
図6は、図2の画像符号化装置100が行う画像符号化処理の例を示すフローチャートである。この画像符号化処理は、符号化対象動画像に含まれる、時刻tにおける符号化対象画像をロッシー符号化及びロスレス符号化する処理である。
まず、ロッシー符号化ヘッダ生成部112は、基本レイヤの符号化パラメータを設定する(ステップS101)。このとき、ロッシー符号化ヘッダ生成部112は、オペレータ、アプリケーションプログラム等から指定された画像品質(ビットレート、量子化パラメータ等)に従って、符号化対象画像内の各CUの符号化モード及び符号化パラメータを決定する。
符号化モードは、単一レイヤ符号化方式であり、イントラ予測符号化又は基本レイヤの復号画像のみを参照するインター予測符号化のいずれかである。符号化パラメータは、ロッシー符号化のパラメータであり、量子化パラメータは少なくとも最小値(8ビット画像の場合は0)以上に設定される。また、TransquantBypassEnableFlag又はCuTransquantBypassFlagが0に設定される。
次に、符号化部111は、符号化対象画像をロッシー符号化して、基本レイヤの符号化画像と、時刻tにおける局所復号画像LR(t)とを生成する(ステップS102)。
次に、ロスレス符号化ヘッダ生成部122は、拡張レイヤの符号化パラメータを設定する(ステップS103)。このとき、ロスレス符号化ヘッダ生成部122は、符号化対象画像全体の参照画像リストとして、基本レイヤの局所復号画像LR(t)のみを設定する。この設定は、NumShortTermRefPicSetsを0に設定し、LongTermRefPicsPresentFlagを0に設定することで実現できる。
符号化対象画像内の各CUの符号化モードは、常にインター予測符号化であり、参照画像のRefIdxは0に設定され(基本レイヤの局所復号画像LR(t)に相当する)、動きベクトル(MVx,MVy)は(0,0)に設定される。また、TransquantBypassEnableFlag及びCuTransquantBypassFlagは1に設定される。
次に、符号化部121は、符号化対象画像をロスレス符号化して、拡張レイヤの符号化画像を生成する(ステップS104)。
図7は、図3の画像復号装置200が行う画像復号処理の例を示すフローチャートである。この画像復号処理は、時刻tにおける符号化画像を復号して、復号画像を画面上に表示する処理である。
まず、復号制御部210は、時刻tにおける基本レイヤのロッシー復号画像P(t)が記憶部222に保存されているか否かをチェックする(ステップS201)。例えば、基本レイヤの符号化ストリームを先に受信し、基本レイヤのロッシー復号画像が既に表示されている場合、ロッシー復号画像P(t)は記憶部222に保存されている。一方、基本レイヤの符号化ストリームを未だ受信していない場合、ロッシー復号画像P(t)は記憶部222に保存されていない。
ロッシー復号画像P(t)が保存されていない場合(ステップS201,NO)、復号制御部210は、ロッシー復号画像P(t)を生成するための基本レイヤの符号化ストリームを、画像符号化装置100に対して要求する(ステップS202)。そして、受信部211は、画像符号化装置100から送信される符号化ストリームを受信する。次に、復号部220は、受信した符号化ストリームに含まれる符号化画像を復号して、ロッシー復号画像P(t)を生成し、ロッシー復号画像P(t)を記憶部222に保存する(ステップS203)。
一方、ロッシー復号画像P(t)が保存されている場合(ステップS201,YES)、復号制御部210は、記憶部222からロッシー復号画像P(t)を取得する(ステップS204)。
次に、復号制御部210は、オペレータ、アプリケーションプログラム等から指示された表示モードが、ロッシー表示又はロスレス表示のいずれであるかをチェックする(ステップS205)。
表示モードがロッシー表示である場合(ステップS205,YES)、復号制御部210は、ロッシー復号画像P(t)を画面上に表示する制御を行う(ステップS206)。
一方、表示モードがロスレス表示である場合、復号制御部210は、時刻tにおける拡張レイヤの符号化データを、画像符号化装置100に対して要求する(ステップS207)。そして、受信部211は、画像符号化装置100から送信される符号化データを受信する。
次に、復号部221は、受信した符号化データに含まれる符号化画像を復号して、時刻tにおける符号化歪を表す拡張レイヤの復号画像Q(t)を生成する(ステップS208)。次に、生成部223は、ロッシー復号画像P(t)と復号画像Q(t)とを加算し、加算結果から所定の画素値を減算することで、時刻tにおける拡張レイヤのロスレス復号画像R(t)を生成する(ステップS209)。そして、復号制御部210は、ロスレス復号画像R(t)を画面上に表示する制御を行う(ステップS210)。
図3の画像処理ステムと図2の画像符号化装置100と図3及び図4の画像復号装置200の構成は一例に過ぎず、画像符号化装置及び画像復号装置の用途や条件に応じて一部の構成要素を省略又は変更してもよい。
例えば、図1の画像復号装置1002として図3の画像復号装置200の構成を採用する場合、図1の復号画像バッファ1403及び予測画像生成部1404を省略することができる。
図4の中間色画像生成部2403及び中間色画像生成部2503の代わりに、すべての画素の画素値が中間値以外の固定値である画像を生成する画像生成部を用いてもよい。また、加算部2501が、直接、記憶部222が記憶するロッシー復号画像の画素値と、予測誤差復号部2401が生成する復号結果とを加算して、拡張レイヤのロスレス復号画像を生成することも可能である。この場合、加算部2402、中間色画像生成部2403、減算部2502、及び中間色画像生成部2503を省略することができる。
2レイヤの品質階層符号化を行う代わりに、3レイヤ以上の品質階層符号化を行ってもよい。また、HEVCの品質階層符号化の代わりに、不可逆符号化により符号化した符号化ストリームと可逆符号化により符号化した符号化ストリームとを生成する、他の符号化方式を用いても構わない。
図6及び図7に示したフローチャートは一例に過ぎず、画像符号化装置及び画像復号装置の構成や条件に応じて一部の処理を省略又は変更してもよい。例えば、図6の画像符号化処理において、基本レイヤと拡張レイヤの符号化パラメータがあらかじめ設定されている場合、ステップS101及びステップS104の処理を省略することができる。
図7のステップS209において、加算部2501が、直接、記憶部222が記憶するロッシー復号画像の画素値と、予測誤差復号部2401が生成する復号結果とを加算して、拡張レイヤのロスレス復号画像を生成してもよい。
符号化対象画像は、医用画像に限定されるものではなく、不可逆符号化と可逆符号化の両方が適用される他の画像であってもよい。
図1の画像符号化装置1001、画像復号装置1002、図2の画像符号化装置100、及び図3の画像復号装置200は、ハードウェア回路として実装することもでき、図8に示すような情報処理装置(コンピュータ)を用いて実現することもできる。
図8の情報処理装置は、Central Processing Unit(CPU)801、メモリ802、入力装置803、出力装置804、補助記憶装置805、媒体駆動装置806、及びネットワーク接続装置807を備える。これらの構成要素はバス808により互いに接続されている。
メモリ802は、例えば、Read Only Memory(ROM)、Random Access Memory(RAM)、フラッシュメモリ等の半導体メモリであり、画像符号化処理又は画像復号処理に用いられるプログラム及びデータを格納する。メモリ802は、図1の復号画像バッファ1105、復号画像バッファ1205、復号画像バッファ1303、又は復号画像バッファ1403として用いることができる。メモリ802は、図3の記憶部222として用いることもできる。
CPU801(プロセッサ)は、例えば、メモリ802を利用してプログラムを実行することにより、図1の符号化部1100、減算部1101、予測誤差符号化部1102、予測誤差復号部1103、加算部1104、及び予測画像生成部1106として動作する。CPU801は、図1の符号化部1200、減算部1201、予測誤差符号化部1202、予測誤差復号部1203、加算部1204、及び予測画像生成部1206としても動作する。
CPU801は、図1の復号部1300、予測誤差復号部1301、加算部1302、予測画像生成部1304、復号部1400、予測誤差復号部1401、加算部1402、及び予測画像生成部1404としても動作する。
CPU801は、図2のロッシー符号化制御部110、符号化部111、ロッシー符号化ヘッダ生成部112、ロスレス符号化制御部120、符号化部121、ロスレス符号化ヘッダ生成部122、及び多重化部130としても動作する。CPU801は、図3の復号制御部210、復号部220、復号部221、及び生成部223、図4の予測誤差復号部2401、加算部2402、中間色画像生成部2403、加算部2501、減算部2502、及び中間色画像生成部2503としても動作する。
入力装置803は、例えば、キーボード、ポインティングデバイス等であり、ユーザ又はオペレータからの指示や情報の入力に用いられる。出力装置804は、例えば、表示装置、プリンタ、スピーカ等であり、ユーザ又はオペレータへの問い合わせや処理結果の出力に用いられる。処理結果には、ロッシー復号画像又はロスレス復号画像が含まれる。
補助記憶装置805は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。補助記憶装置805は、ハードディスクドライブであってもよい。補助記憶装置805は、図3の記憶部222として用いることができる。情報処理装置は、補助記憶装置805にプログラム及びデータを格納しておき、それらをメモリ802にロードして使用することもできる。
媒体駆動装置806は、可搬型記録媒体809を駆動し、その記録内容にアクセスする。可搬型記録媒体809は、メモリデバイス、フレキシブルディスク、光ディスク、光磁気ディスク等である。可搬型記録媒体809は、Compact Disk Read Only Memory(CD−ROM)、Digital Versatile Disk(DVD)、又はUniversal Serial Bus(USB)メモリであってもよい。ユーザ又はオペレータは、この可搬型記録媒体809にプログラム及びデータを格納しておき、それらをメモリ802にロードして使用することができる。
このように、処理に用いられるプログラム及びデータを格納するコンピュータ読み取り可能な記録媒体には、メモリ802、補助記憶装置805、及び可搬型記録媒体809のような、物理的な(非一時的な)記録媒体が含まれる。
ネットワーク接続装置807は、Local Area Network(LAN)、インターネット等の通信ネットワークに接続され、通信に伴うデータ変換を行う通信インタフェースである。ネットワーク接続装置807は、図2の送信部140又は図3の受信部211として用いることができる。情報処理装置は、プログラム及びデータを外部の装置からネットワーク接続装置807を介して受け取り、それらをメモリ802にロードして使用することもできる。
なお、情報処理装置が図8のすべての構成要素を含む必要はなく、用途や条件に応じて一部の構成要素を省略することも可能である。例えば、ユーザ又はオペレータとのインタフェースが不要の場合は、入力装置803及び出力装置804を省略してもよい。また、情報処理装置が可搬型記録媒体809にアクセスしない場合は、媒体駆動装置806を省略してもよい。
開示の実施形態とその利点について詳しく説明したが、当業者は、特許請求の範囲に明確に記載した本発明の範囲から逸脱することなく、様々な変更、追加、省略をすることができるであろう。

Claims (9)

  1. 複数の符号化対象画像を不可逆符号化により符号化した第1の符号化ストリームを画像符号化装置から受信するとともに、前記複数の符号化対象画像のうち1つの符号化対象画像に対して、前記1つの符号化対象画像を符号化した第1の符号化画像を復号した局所復号画像を参照画像として用い、大きさが0の動きベクトルを用いるインター予測を適用して、予測誤差を可逆符号化により符号化した第2の符号化画像を含む第2の符号化ストリームを、前記画像符号化装置から受信する受信部と、
    前記第1の符号化ストリームを復号して、前記第1の符号化画像から第1の復号画像を生成する第1の復号部と、
    前記第1の復号画像を記憶する記憶部と、
    前記第2の符号化ストリームを復号して、前記第2の符号化画像から第2の復号画像を生成する第2の復号部と、
    前記第1の復号画像と前記第2の復号画像とを加算した加算結果を用いて、前記第1の復号画像に対応する第3の復号画像を生成する生成部と、
    前記第1の復号画像を出力する場合、前記画像符号化装置に対して前記第1の符号化ストリームを要求し、前記第1の復号画像を前記第1の復号部に生成させ、前記第1の復号画像を前記記憶部に記憶させ、前記第1の復号画像を出力し、前記第1の復号画像を出力した後に前記第3の復号画像を出力する場合、前記画像符号化装置に対して前記第2の符号化ストリームを要求し、前記第2の復号画像を前記第2の復号部に生成させ、前記第3の復号画像を前記生成部に生成させ、前記第3の復号画像を出力する復号制御部と、
    を備えることを特徴とする画像復号装置。
  2. 前記第2の復号部は、前記第2の符号化画像を復号した復号結果と所定の画素値とを加算することで、正の画素値を有する前記第2の復号画像を生成し、前記生成部は、前記加算結果から前記所定の画素値を減算することで、前記第3の復号画像を生成することを特徴とする請求項1記載の画像復号装置。
  3. 前記第1の符号化画像は、前記第1の符号化ストリームに含まれる複数の符号化画像のうち、詳細情報の出力が要求された画像に対応する符号化画像であり、前記復号制御部は、前記第1の復号画像を出力した後に前記第3の復号画像を出力する場合、前記第2の符号化ストリームに含まれる複数の符号化画像のうち、前記第1の符号化画像に対応する前記第2の符号化画像を、前記画像符号化装置に対して要求することを特徴とする請求項1又は2記載の画像復号装置。
  4. 画像符号化装置と画像復号装置とを備える画像処理システムであって、
    前記画像符号化装置は、
    複数の符号化対象画像を不可逆符号化により符号化して、前記複数の符号化対象画像のうち1つの符号化対象画像を符号化した第1の符号化画像を含む、複数の符号化画像を生成する第1の符号化部と、
    前記1つの符号化対象画像に対して、前記第1の符号化画像を復号した局所復号画像を参照画像として用い、大きさが0の動きベクトルを用いるインター予測を適用して予測誤差を可逆符号化により符号化した第2の符号化画像を含む、複数の符号化画像を生成する第2の符号化部と、
    前記第1の符号化部により生成される前記複数の符号化画像を含む第1の符号化ストリームと、前記第2の符号化部により生成される前記複数の符号化画像を含む第2の符号化ストリームとを記憶し、前記第1の符号化ストリームと前記第2の符号化ストリームとを前記画像復号装置へ送信する送信部と、
    を含み、
    前記画像復号装置は、
    前記第1の符号化ストリームと前記第2の符号化ストリームとを前記画像符号化装置から受信する受信部と、
    前記第1の符号化ストリームを復号して、前記第1の符号化画像から第1の復号画像を生成する第1の復号部と、
    前記第1の復号画像を記憶する記憶部と、
    前記第2の符号化ストリームを復号して、前記第2の符号化画像から第2の復号画像を生成する第2の復号部と、
    前記第1の復号画像と前記第2の復号画像とを加算した加算結果を用いて、前記第1の復号画像に対応する第3の復号画像を生成する生成部と、
    前記第1の復号画像を出力する場合、前記画像符号化装置に対して前記第1の符号化ストリームを要求し、前記第1の復号画像を前記第1の復号部に生成させ、前記第1の復号画像を前記記憶部に記憶させ、前記第1の復号画像を出力し、前記第1の復号画像を出力した後に前記第3の復号画像を出力する場合、前記画像符号化装置に対して前記第2の符号化ストリームを要求し、前記第2の復号画像を前記第2の復号部に生成させ、前記第3の復号画像を前記生成部に生成させ、前記第3の復号画像を出力する復号制御部と、
    を含むことを特徴とする画像処理システム。
  5. 前記第2の復号部は、前記第2の符号化画像を復号した復号結果と所定の画素値とを加算することで、正の画素値を有する前記第2の復号画像を生成し、前記生成部は、前記加算結果から前記所定の画素値を減算することで、前記第3の復号画像を生成することを特徴とする請求項4記載の画像処理システム。
  6. 前記第1の符号化画像は、前記第1の符号化部により生成される前記複数の符号化画像のうち、詳細情報の出力が要求された画像に対応する符号化画像であり、前記復号制御部は、前記第1の復号画像を出力した後に前記第3の復号画像を出力する場合、前記第2の符号化部により生成される前記複数の符号化画像のうち、前記第1の符号化画像に対応する前記第2の符号化画像を、前記画像符号化装置に対して要求することを特徴とする請求項4又は5記載の画像処理システム。
  7. 複数の符号化対象画像を不可逆符号化により符号化して、前記複数の符号化対象画像のうち1つの符号化対象画像を符号化した第1の符号化画像を含む、第1の符号化ストリームを生成する画像符号化装置に対して、前記第1の符号化ストリームを要求し、
    前記第1の符号化ストリームを前記画像符号化装置から受信し、
    前記第1の符号化ストリームを復号して、前記第1の符号化画像から第1の復号画像を生成し、
    前記第1の復号画像を記憶部に記憶させ、
    前記第1の復号画像を出力し、
    前記1つの符号化対象画像に対して、前記第1の符号化画像を復号した局所復号画像を参照画像として用い、大きさが0の動きベクトルを用いるインター予測を適用して、予測誤差を可逆符号化により符号化した第2の符号化画像を含む第2の符号化ストリームを、前記画像符号化装置に対して要求し、
    前記第2の符号化ストリームを前記画像符号化装置から受信し、
    前記第2の符号化ストリームを復号して、前記第2の符号化画像から第2の復号画像を生成し、
    前記第1の復号画像と前記第2の復号画像とを加算した加算結果を用いて、前記第1の復号画像に対応する第3の復号画像を生成し、
    前記第3の復号画像を出力する、
    ことを特徴とする画像復号方法。
  8. 前記第2の復号画像を生成する処理は、前記第2の符号化画像を復号した復号結果と所定の画素値とを加算することで、正の画素値を有する前記第2の復号画像を生成し、前記第3の復号画像を生成する処理は、前記加算結果から前記所定の画素値を減算することで、前記第3の復号画像を生成することを特徴とする請求項7記載の画像復号方法。
  9. 前記第1の符号化画像は、前記第1の符号化ストリームに含まれる複数の符号化画像のうち、詳細情報の出力が要求された画像に対応する符号化画像であり、前記第2の符号化ストリームを前記画像符号化装置に対して要求する処理は、前記第2の符号化ストリームに含まれる複数の符号化画像のうち、前記第1の符号化画像に対応する前記第2の符号化画像を要求することを特徴とする請求項7又は8記載の画像復号方法。
JP2016562094A 2014-12-01 2014-12-01 画像復号装置、画像処理システム、及び画像復号方法 Pending JPWO2016088160A1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/081689 WO2016088160A1 (ja) 2014-12-01 2014-12-01 画像復号装置、画像処理システム、及び画像復号方法

Publications (1)

Publication Number Publication Date
JPWO2016088160A1 true JPWO2016088160A1 (ja) 2017-09-21

Family

ID=56091141

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016562094A Pending JPWO2016088160A1 (ja) 2014-12-01 2014-12-01 画像復号装置、画像処理システム、及び画像復号方法

Country Status (3)

Country Link
US (1) US20170264913A1 (ja)
JP (1) JPWO2016088160A1 (ja)
WO (1) WO2016088160A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11206417B2 (en) * 2019-05-30 2021-12-21 Tencent America LLC Method and apparatus for video coding

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09172643A (ja) * 1995-12-19 1997-06-30 Kokusai Denshin Denwa Co Ltd <Kdd> 階層符号化装置
WO2014107720A1 (en) * 2013-01-07 2014-07-10 Vid Scale, Inc. Motion information signaling for scalable video coding

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3236821B2 (ja) * 1998-07-22 2001-12-10 ケイディーディーアイ株式会社 静止画像の階層符号化伝送方法および階層復号化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09172643A (ja) * 1995-12-19 1997-06-30 Kokusai Denshin Denwa Co Ltd <Kdd> 階層符号化装置
WO2014107720A1 (en) * 2013-01-07 2014-07-10 Vid Scale, Inc. Motion information signaling for scalable video coding

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JIANLE CHEN, JILL BOYCE, YAN YE, MISKA M. HANNUKSELA, SHVC TEST MODEL 2 (SHM 2), JPN6015004716, 6 June 2013 (2013-06-06), pages 1 - 2, ISSN: 0003792760 *
KIRAN MISRA 5750 NW PACIFIC RIM BLVD CAMAS, WA 98607 USA: "Description of scalable video coding technology proposal by Sharp (proposal 1)[online]", JCTVC-K JCTVC-K0031_R1, JPN6018016604, 19 October 2012 (2012-10-19), ISSN: 0003792763 *
RECOMMENDATION ITU-T H.265 (04/2013) HIGH EFFICIENCY VIDEO CODING, JPN6015004718, April 2013 (2013-04-01), pages 100, ISSN: 0003792761 *
大久保 榮, H.265/HEVC教科書 初版 H.265/HEVC TEXTBOOK, vol. 第1版, JPN6018016600, 21 October 2013 (2013-10-21), pages 315 - 317, ISSN: 0003792762 *

Also Published As

Publication number Publication date
WO2016088160A1 (ja) 2016-06-09
US20170264913A1 (en) 2017-09-14

Similar Documents

Publication Publication Date Title
JP6274299B2 (ja) 映像復号装置及び映像復号方法
JP4991699B2 (ja) ビデオ信号のスケーラブルなエンコーディング方法およびデコーディング方法
US8385412B2 (en) Method and apparatus for inter-layer residue prediction for scalable video
CN112042200B (zh) 视频解码的方法和装置
JP2022521515A (ja) 交差成分フィルタリングのための方法、装置、およびプログラム
JP7124222B2 (ja) Vvcにおける色変換のための方法及び機器
JP2022059032A (ja) ビデオエンコーディング及びデコーディングのための方法、装置、コンピュータプログラム、及び非一時的なコンピュータ可読媒体
US20160198175A1 (en) Image encoding device, image encoding method and program, image decoding device, and image decoding method and program
JP7297918B2 (ja) ビデオ符号化のための色変換
JP7357736B2 (ja) 符号化装置、復号装置、及びプログラム
CN106028031B (zh) 视频编码装置和方法、视频解码装置和方法
JP6457248B2 (ja) 画像復号装置、画像符号化装置および画像復号方法
JP2024019542A (ja) 復号装置、プログラム、及び復号方法
JP2017183910A (ja) 画像符号化装置及び画像符号化方法
WO2016088160A1 (ja) 画像復号装置、画像処理システム、及び画像復号方法
JP2023553996A (ja) 成分間変換係数レベル復元におけるオフセットの導出
JP2023522704A (ja) ビデオコーディングのための方法および装置、およびコンピュータプログラム
JP7366216B2 (ja) 符号化装置、復号装置、及びプログラム
WO2021100450A1 (ja) イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム
JP2023521324A (ja) ビデオフィルタリングのための方法および装置
JP2023531866A (ja) ビデオコーディングのための方法、装置、非一時的コンピュータ可読記憶媒体およびコンピュータプログラム
JP2013017085A (ja) 画像符号化装置及び画像符号化方法
JP2011166357A (ja) 画像符号化装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170531

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180420

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180515