JPWO2013115025A1 - 符号化装置および符号化方法、並びに、復号装置および復号方法 - Google Patents

符号化装置および符号化方法、並びに、復号装置および復号方法 Download PDF

Info

Publication number
JPWO2013115025A1
JPWO2013115025A1 JP2013556335A JP2013556335A JPWO2013115025A1 JP WO2013115025 A1 JPWO2013115025 A1 JP WO2013115025A1 JP 2013556335 A JP2013556335 A JP 2013556335A JP 2013556335 A JP2013556335 A JP 2013556335A JP WO2013115025 A1 JPWO2013115025 A1 JP WO2013115025A1
Authority
JP
Japan
Prior art keywords
unit
depth image
encoding
parameter set
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013556335A
Other languages
English (en)
Other versions
JP5975301B2 (ja
Inventor
しのぶ 服部
しのぶ 服部
裕音 櫻井
裕音 櫻井
良知 高橋
良知 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2013115025A1 publication Critical patent/JPWO2013115025A1/ja
Application granted granted Critical
Publication of JP5975301B2 publication Critical patent/JP5975301B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/172Processing image signals image signals comprising non-image signal components, e.g. headers or format information
    • H04N13/178Metadata, e.g. disparity information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

本技術は、デプス画像に関する情報を符号化ストリームに含める際に符号化ストリームの符号量を削減することができるようにする符号化装置および符号化方法、並びに、復号装置および復号方法に関する。DPS符号化部は、デプス画像に関する情報であるデプス画像情報をシーケンスパラメータセットおよびピクチャパラメータセットとは異なるDPSとして設定する。スライス符号化部は、デプス画像を符号化し、符号化データを生成する。また、スライス符号化部は、DPSと符号化データとを含む符号化ストリームを伝送する。本技術は、例えば、多視点の画像の符号化装置に適用することができる。

Description

本技術は、符号化装置および符号化方法、並びに、復号装置および復号方法に関し、特に、デプス画像に関する情報を符号化ストリームに含める際に符号化ストリームの符号量を削減することができるようにした符号化装置および符号化方法、並びに、復号装置および復号方法に関する。
近年、3D画像が注目されている。この3D画像の視聴方式としては、2視点の画像のうちの一方の画像の表示時に左目用のシャッタが開き、他方の画像の表示時に右目用のシャッタが開くメガネを装着して、交互に表示される2視点の画像を見る方式(以下、メガネ有り方式という)が一般的である。
しかしながら、このようなメガネ有り方式では、視聴者は、3D画像の表示装置とは別にメガネを購入する必要があり、視聴者の購買意欲は低下する。また、視聴者は、視聴時にメガネを装着する必要があるため、煩わしい。従って、メガネを装着せずに3D画像を視聴可能な視聴方式(以下、メガネ無し方式という)の需要が高まっている。
メガネ無し方式では、3視点以上の視点の画像が、視点ごとに視認可能な角度が異なるように表示され、視聴者が、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
メガネ無し方式の3D画像の表示方法としては、所定の視点のカラー画像とデプス画像を取得し、そのカラー画像とデプス画像を用いて所定の視点以外の視点を含む多視点のカラー画像を生成し、表示する方法が考案されている。なお、多視点とは、3視点以上の視点である。
また、多視点のカラー画像とデプス画像を符号化する方法として、カラー画像とデプス画像を別々に符号化する方法が提案されている(例えば、特許文献1参照)。
"Draft Call for Proposals on 3D Video Coding Technology",INTERNATIONAL ORGANISATION FOR STANDARDISATION ORGANISATION INTERNATIONALE DE NORMALISATION ISO/IEC JTC1/SC29/WG11 CODING OF MOVING PICTURES AND AUDIO,MPEG2010/N11679 Guangzhou,China,October 2010
しかしながら、デプス画像に関する情報を符号化ストリームに含める際に符号化ストリームの符号量を削減することは考えられていなかった。
本技術は、このような状況に鑑みてなされたものであり、デプス画像に関する情報を符号化ストリームに含める際に符号化ストリームの符号量を削減することができるようにするものである。
本技術の第1の側面の符号化装置は、デプス画像に関する情報であるデプス画像情報をシーケンスパラメータセットおよびピクチャパラメータセットとは異なるパラメータセットとして設定する設定部と、前記デプス画像を符号化し、符号化データを生成する符号化部と、前記設定部により設定された前記パラメータセットと前記符号化部により生成された前記符号化データとを含む符号化ストリームを伝送する伝送部とを備える符号化装置である。
本技術の第1の側面の符号化方法は、本技術の第1の側面の符号化装置に対応する。
本技術の第1の側面においては、デプス画像に関する情報であるデプス画像情報がシーケンスパラメータセットおよびピクチャパラメータセットとは異なるパラメータセットとして設定され、前記デプス画像が符号化されて、符号化データが生成され、前記パラメータセットと前記符号化データとを含む符号化ストリームが伝送される。
本技術の第2の側面の復号装置は、デプス画像に関する情報であるデプス画像情報が設定されたシーケンスパラメータセットおよびピクチャパラメータセットとは異なるパラメータセットと、前記デプス画像の符号化データとを含む符号化ストリームから、前記パラメータセットと前記符号化データを取得する取得部と、前記取得部により取得された前記パラメータセットから前記デプス画像情報をパースするパース処理部と、前記取得部により取得された前記符号化データを復号する復号部とを備える復号装置である。
本技術の第2の側面の復号方法は、本技術の第2の側面の復号装置に対応する。
本技術の第2の側面においては、デプス画像に関する情報であるデプス画像情報が設定されたシーケンスパラメータセットおよびピクチャパラメータセットとは異なるパラメータセットと、前記デプス画像の符号化データとを含む符号化ストリームから、前記パラメータセットと前記符号化データが取得され、前記パラメータセットから前記デプス画像情報がパースされ、前記符号化データが復号される。
なお、第1の側面の符号化装置および第2の側面の復号装置は、コンピュータにプログラムを実行させることにより実現することができる。
また、第1の側面の符号化装置および第2の側面の復号装置を実現するために、コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。
本技術の第1の側面によれば、デプス画像に関する情報を符号化ストリームに含める際に符号化ストリームの符号量を削減することができる。
また、本技術の第2の側面によれば、デプス画像に関する情報を符号化ストリームに含める際に符号化ストリームの符号量が削減された符号化ストリームを復号することができる。
視差と奥行きについて説明する図である。 本技術を適用した符号化装置の一実施の形態の構成例を示すブロック図である。 図2の多視点画像符号化部の構成例を示すブロック図である。 符号化ストリームの構成例を示す図である。 DPSのシンタックスの例を示す図である。 スライスヘッダのシンタックスの例を示す図である。 図2の符号化装置の符号化処理を説明するフローチャートである。 図7の多視点符号化処理の詳細を説明するフローチャートである。 図8のDPS生成処理の詳細を説明するフローチャートである。 本技術を適用した復号装置の一実施の形態の構成例を示すブロック図である。 図10の多視点画像復号部の構成例を示すブロック図である。 図10の復号装置の復号処理を説明するフローチャートである。 図12の多視点復号処理の詳細を説明するフローチャートである。 図13の生成処理の詳細を説明するフローチャートである。 拡張SPSのシンタックスの例を示す図である。 拡張SPSのシンタックスの他の例を示す図である。 拡張slice_layerの定義を説明する図である。 拡張slice_layerのシンタックスの例を示す図である。 拡張スライスヘッダのシンタックスの例を示す図である。 拡張スライスヘッダのシンタックスの他の例を示す図である。 NALユニットのシンタックスの例を示す図である。 slice_layerのシンタックスの例を示す図である。 符号化ストリームの他の構成例を示す図である。 コンピュータの一実施の形態の構成例を示す図である。 本技術を適用したテレビジョン装置の概略構成例を示す図である。 本技術を適用した携帯電話機の概略構成例を示す図である。 本技術を適用した記録再生装置の概略構成例を示す図である。 本技術を適用した撮像装置の概略構成例を示す図である。
<本明細書におけるデプス画像(視差関連画像)の説明>
図1は、視差と奥行きについて説明する図である。
図1に示すように、被写体Mのカラー画像が、位置C1に配置されたカメラc1と位置C2に配置されたカメラc2により撮影される場合、被写体Mの、カメラc1(カメラc2)からの奥行方向の距離である奥行きZは、以下の式(a)で定義される。
Figure 2013115025
なお、Lは、位置C1と位置C2の水平方向の距離(以下、カメラ間距離という)である。また、dは、カメラc1で撮影されたカラー画像上の被写体Mの位置の、カラー画像の中心からの水平方向の距離u1から、カメラc2で撮影されたカラー画像上の被写体Mの位置の、カラー画像の中心からの水平方向の距離u2を減算した値、即ち視差である。さらに、fは、カメラc1の焦点距離であり、式(a)では、カメラc1とカメラc2の焦点距離は同一であるものとしている。
式(a)に示すように、視差dと奥行きZは、一意に変換可能である。従って、本明細書では、カメラc1とカメラc2により撮影された2視点のカラー画像の視差dを表す画像と奥行きZを表す画像とを総称して、デプス画像とする。
なお、デプス画像は、視差dまたは奥行きZを表す画像であればよく、デプス画像の画素値としては、視差dまたは奥行きZそのものではなく、視差dを正規化した値、奥行きZの逆数1/Zを正規化した値等を採用することができる。
視差dを8bit(0〜255)で正規化した値Iは、以下の式(b)により求めることができる。なお、視差dの正規化ビット数は8bitに限定されず、10bit,12bitなど他のビット数にすることも可能である。
Figure 2013115025
なお、式(b)において、Dmaxは、視差dの最大値であり、Dminは、視差dの最小値である。最大値Dmaxと最小値Dminは、1画面単位で設定されてもよいし、複数画面単位で設定されてもよい。
また、奥行きZの逆数1/Zを8bit(0〜255)で正規化した値yは、以下の式(c)により求めることができる。なお、奥行きZの逆数1/Zの正規化ビット数は8bitに限定されず、10bit,12bitなど他のビット数にすることも可能である。
Figure 2013115025
なお、式(c)において、Zfarは、奥行きZの最大値であり、Znearは、奥行きZの最小値である。最大値Zfarと最小値Znearは、1画面単位で設定されてもよいし、複数画面単位で設定されてもよい。
このように、本明細書では、視差dと奥行きZとは一意に変換可能であることを考慮して、視差dを正規化した値Iを画素値とする画像と、奥行きZの逆数1/Zを正規化した値yを画素値とする画像とを総称して、デプス画像とする。ここでは、デプス画像のカラーフォーマットは、YUV420又はYUV400であるものとするが、他のカラーフォーマットにすることも可能である。
なお、デプス画像の画素値としてではなく、値I又は値yの情報自体に着目する場合には、値I又は値yを、デプス情報(視差関連値)とする。更に、値I又は値yをマッピングしたものをデプスマップとする。
<一実施の形態>
<符号化装置の一実施の形態の構成例>
図2は、本技術を適用した符号化装置の一実施の形態の構成例を示すブロック図である。
図2の符号化装置50は、多視点カラー画像撮像部51、多視点カラー画像補正部52、多視点デプス画像生成部53、デプス画像情報生成部54、および多視点画像符号化部55により構成される。符号化装置50は、デプス画像に関する情報であるデプス画像情報(符号化パラメータ)を伝送する。
具体的には、符号化装置50の多視点カラー画像撮像部51は、多視点のカラー画像を撮像し、多視点カラー画像として多視点カラー画像補正部52に供給する。また、多視点カラー画像撮像部51は、各視点の外部パラメータ、デプス最大値(視差関連最大値)、およびデプス最小値(視差関連最小値)(詳細は後述する)を生成する。多視点カラー画像撮像部51は、外部パラメータ、デプス最大値、およびデプス最小値をデプス画像情報生成部54に供給するとともに、デプス最大値とデプス最小値を多視点デプス画像生成部53に供給する。
なお、外部パラメータは、多視点カラー画像撮像部11の水平方向の位置を定義するパラメータである。また、デプス最大値とは、多視点デプス画像生成部53により生成されるデプス画像が奥行きZを表す画像である場合、奥行きZの最大値Zfarであり、視差dを表す画像である場合、視差dの最大値Dmaxである。また、デプス最小値とは、多視点デプス画像生成部53により生成されるデプス画像が奥行きZを表す画像である場合、奥行きZの最小値Znearであり、視差dを表す画像である場合、視差dの最小値Dminである。
多視点カラー画像補正部52は、多視点カラー画像撮像部51から供給される多視点カラー画像に対して、色補正、輝度補正、歪み補正等を行う。これにより、補正後の多視点カラー画像における多視点カラー画像撮像部51の水平方向(X方向)の焦点距離は、全視点で共通となる。多視点カラー画像補正部52は、補正後の多視点カラー画像を多視点補正カラー画像として多視点デプス画像生成部53と多視点画像符号化部55に供給する。
多視点デプス画像生成部53は、多視点カラー画像撮像部51から供給されるデプス最大値とデプス最小値に基づいて、多視点カラー画像補正部52から供給される多視点補正カラー画像から、多視点のデプス画像を生成する。具体的には、多視点デプス画像生成部53は、多視点の各視点について、多視点補正カラー画像から各画素の視差関連値を求め、その視差関連値をデプス最大値とデプス最小値に基づいて正規化する。そして、多視点デプス画像生成部53は、多視点の各視点について、正規化された各画素の視差関連値をデプス画像の各画素の画素値とするデプス画像を生成する。
また、多視点デプス画像生成部53は、生成された多視点のデプス画像を多視点デプス画像として多視点画像符号化部55に供給する。
デプス画像情報生成部54は、各視点のデプス画像情報を生成する。具体的には、デプス画像情報生成部54は、多視点カラー画像撮像部51から供給される各視点の外部パラメータに基づいて、各視点のカメラ間距離を求める。カメラ間距離とは、多視点デプス画像に対応する各視点のカラー画像を撮像するときの多視点カラー画像撮像部51の水平方向の位置と、そのカラー画像とデプス画像に対応する視差を有するカラー画像を撮像するときの多視点カラー画像撮像部51の水平方向の位置の距離である。
デプス画像情報生成部54は、多視点カラー画像撮像部51からの各視点のデプス最大値およびデプス最小値、並びに各視点のカメラ間距離を各視点のデプス画像情報とする。デプス画像情報生成部54は、各視点のデプス画像情報を多視点画像符号化部55に供給する。
多視点画像符号化部55は、多視点カラー画像補正部52からの多視点補正カラー画像と多視点デプス画像生成部53からの多視点デプス画像をHEVC(High Efficiency Video Coding)方式に準じた方式で符号化する。なお、HEVC方式については、2011年8月現在、Draftとして、Thomas Wiegand,Woo-jin Han,Benjamin Bross,Jens-Rainer Ohm,GaryJ.Sullivian,"WD3:Working Draft3 of High-Efficiency Video Coding",JCTVC-E603_d5(version5),2011年5月20日が発行されている。
また、多視点画像符号化部55は、デプス画像情報生成部54から供給される各視点のデプス画像情報を視点ごとに差分符号化し、差分符号化結果を含むNAL(Network Abstraction Layer)ユニットであるDPS(Depth Parameter Set)(DRPS)等を生成する。そして、多視点画像符号化部55は、符号化された多視点補正カラー画像および多視点デプス画像、DPS等からなるビットストリームを、符号化ストリーム(符号化ビットストリーム)として伝送する。
以上のように、多視点画像符号化部55は、デプス画像情報を差分符号化して伝送するので、デプス画像情報の符号量を削減することができる。快適な3D画像を提供するために、デプス画像情報はピクチャ間で大きく変化させない可能性が高いため、差分符号化を行うことは符号量の削減において有効である。
また、多視点画像符号化部55は、デプス画像情報をDPSに含めて伝送するので、スライスヘッダに含めて伝送する場合のように同一のデプス画像情報が重複して伝送される事態を防止することができる。その結果、デプス画像情報の符号量をより削減することができる。
<多視点画像符号化部の構成例>
図3は、図2の多視点画像符号化部55の構成例を示すブロック図である。
図3の多視点画像符号化部55は、SPS符号化部61、PPS符号化部62、DPS符号化部63、スライスヘッダ符号化部64、およびスライス符号化部65により構成される。
多視点画像符号化部55のSPS符号化部61は、シーケンス単位でSPSを生成し、PPS符号化部62に供給する。PPS符号化部62は、ピクチャ単位でPPSを生成し、SPS符号化部61から供給されるSPSに付加してスライスヘッダ符号化部64に供給する。
DPS符号化部63は、図2のデプス画像情報生成部54から供給される各視点のデプス画像情報に基づいて、各視点のデプス画像のスライスごとにデプス画像情報を差分符号化する。具体的には、DPS符号化部63は、処理対象のスライスのタイプがイントラタイプである場合、そのスライスのデプス画像情報をそのまま差分符号化結果とする。一方、処理対象のスライスのタイプがインタータイプである場合、DPS符号化部63は、そのスライスのデプス画像情報と、そのスライスより1つ前のスライスのデプス画像情報との差分を、差分符号化結果とする。
また、DPS符号化部63は、設定部として機能し、デプス画像情報の差分符号化結果を含むDPSがまだ生成されていない場合、その差分符号化結果をDPS内に設定する。また、DPS符号化部63は、そのDPSにDPSを一意に識別するID(識別番号)であるDPS_id(インデックス識別子)を付与し、DPS内に設定する。そして、DPS符号化部63は、デプス画像情報の差分符号化結果とDPS_idが設定されたDPSをスライスヘッダ符号化部64に供給する。
一方、DPS符号化部63は、デプス画像情報の差分符号化結果を含むDPSが既に生成されている場合、そのDPSのDPS_idをスライスヘッダ符号化部64に供給する。
スライスヘッダ符号化部64は、設定部として機能し、DPS符号化部63から供給されるDPSのDPS_idまたはDPS_idを、対応する視点のデプス画像のスライスのスライスヘッダ内に設定する。また、スライスヘッダ符号化部64は、多視点カラー画像のスライスヘッダを生成する。スライスヘッダ符号化部64は、DPS符号化部63から供給されるDPSと多視点デプス画像および多視点カラー画像のスライスヘッダとを、PPS符号化部62から供給されるSPSが付加されたPPSにさらに付加し、スライス符号化部65に供給する。
スライス符号化部65は、符号化部として機能し、多視点カラー画像補正部52からの多視点補正カラー画像と多視点デプス画像生成部53からの多視点デプス画像を、スライス単位でHEVC方式に準じた方式で符号化する。このとき、スライス符号化部65は、スライスヘッダ符号化部64から供給されるスライスヘッダに含まれるDPS_idのDPSに含まれるデプス画像情報を用いる。
スライス符号化部65は、スライスヘッダ符号化部64から供給されるSPS,PPS、およびDPSが付加されたスライスヘッダに、符号化の結果得られるスライス単位の符号化データを付加して符号化ストリームを生成する。スライス符号化部65は、伝送部として機能し、符号化ストリームを伝送する。
<符号化ストリームの構成例>
図4は、符号化ストリームの構成例を示す図である。
図4では、説明の便宜上、多視点デプス画像のスライスの符号化データのみを記載しているが、実際には、符号化ストリームには、多視点カラー画像のスライスの符号化データも配置される。
図4に示すように、符号化ストリームには、シーケンス単位のSPS、ピクチャ単位のPPS、スライス単位のDPS、スライスヘッダが付加されたスライス単位の符号化データが順に配置される。
図4の例では、0番目のPPSであるPPS#0に対応するピクチャのスライスのうちのイントラタイプのスライスのデプス最小値が10であり、デプス最大値が50であり、カメラ間距離が100である。従って、そのスライスのデプス画像情報の差分符号化結果として、デプス最小値「10」、デプス最大値「50」、およびカメラ間距離「100」そのものが生成される。そして、この差分符号化結果を含むDPSはまだ生成されていないため、この差分符号化結果を含むDPSが符号化ストリームに設定され、DPS_idとして、例えば0が付与される。そして、DPS_idとしての0がスライスヘッダに含まれる。
また、図4の例では、PPS#0に対応するピクチャのスライスのうちの1番目のインタータイプのスライスのデプス最小値が9であり、デプス最大値が48であり、カメラ間距離が105である。従って、そのスライスのデプス画像情報の差分符号化結果として、そのスライスのデプス最小値「9」から、符号化順で1つ前のイントラタイプのスライスのデプス最小値「10」を減算した差分「-1」が生成される。同様に、デプス最大値の差分「-2」とカメラ間距離の差分「5」が、デプス画像情報の差分符号化結果として生成される。
そして、この差分符号化結果を含むDPSはまだ生成されていないため、この差分符号化結果を含むDPSが符号化ストリームに設定され、DPS_idとして、例えば1が付与される。そして、DPS_idとしての1がスライスヘッダに含まれる。
さらに、図4の例では、PPS#0に対応するピクチャのスライスのうちの2番目のインタータイプのスライスのデプス最小値が7であり、デプス最大値が47であり、カメラ間距離が110である。従って、そのスライスのデプス画像情報の差分符号化結果として、そのスライスのデプス最小値「7」から、符号化順で1つ前の1番目のインタータイプのスライスのデプス最小値「9」を減算した差分「-2」が生成される。同様に、デプス最大値の差分「-1」とカメラ間距離の差分「5」がデプス画像情報の差分符号化結果として生成される。
そして、この差分符号化結果を含むDPSはまだ生成されていないため、この差分符号化結果を含むDPSが符号化ストリームに設定され、DPS_idとして、例えば2が付与される。そして、DPS_idとしての2がスライスヘッダに含まれる。
また、図4の例では、1番目のPPSであるPPS#1に対応するピクチャの3つのインタータイプのスライスのデプス画像情報の差分符号化結果は、PPS#0に対応するピクチャのスライスのうちの2番目のインタータイプのスライスのデプス画像情報の差分符号化結果と同一である。従って、この3つのインタータイプのスライスに対してDPSは設定されず、そのスライスのスライスヘッダにDPS_idとしての2が含まれる。
<DPSのシンタックスの例>
図5は、DPSのシンタックスの例を示す図である。
図5の第2行目に示すように、DPSには、そのDPSに付与されたDPS_id(depth_parameter_set_id)が含まれる。また、第14行目に示すように、DPSには、デプス最大値およびデプス最小値(depth_ranges)が含まれる。さらに、第17行目に示すように、DPSには、カメラ間距離(vsp_param)が含まれる。
<スライスヘッダのシンタックスの例>
図6は、スライスヘッダのシンタックスの例を示す図である。
図6の第3行目乃至第7行目に示すように、スライスヘッダが付加されるスライス単位の符号化データのNALユニットのタイプnal_unit_typeが、3DVC(3次元映像符号化)方式で符号化されたことを表す21である場合、即ちスライスヘッダがデプス画像のスライスヘッダである場合、スライスのタイプslice_typeがインタータイプであるときには、スライスヘッダには、デプス画像に対して重み付け予測を行うかどうかを表すフラグが含まれる。
具体的には、スライスのタイプslice_typeがPであるとき(slice_type==P)、スライスヘッダには、前または後ろ方向の重み付け予測を行うかどうかを表すフラグdepth_weighted_pred_flagが含まれる。一方、スライスのタイプslice_typeがBである(slice_type==B)とき、スライスヘッダには、前および後ろ方向の重み付け予測を行うかどうかを表すフラグdepth_weighted_bipred_flagが含まれる。
また、第8行目乃至第10行目に示すように、重み付け予測を行う場合、スライスヘッダには、DPS_id(depth_parameter_set_id)が含まれる。具体的には、スライスのタイプslice_typeがPであり、フラグdepth_weighted_pred_flagが1である場合、または、スライスのタイプslice_typeがBであり、フラグdepth_weighted_bipred_flagが1である場合、DPS_id(depth_parameter_set_id)が含まれる。
なお、図示は省略しているが、スライスの符号化データのNALユニットのタイプnal_unit_typeが値21である場合、スライスのタイプslice_typeがIであるときについても、DPS_idが含まれることとなる。
図6のシンタックスは、第3行目乃至第10行目のNALユニットのタイプnal_unit_typeが21である場合の記述を除いて、既存のスライスヘッダのシンタックスと同様である。即ち、デプス画像のスライスヘッダ内のフラグdepth_weighted_pred_flagまたはフラグdepth_weighted_bipred_flag、DPS_id以外の情報は、カラー画像のスライスヘッダ内の情報と同一である。従って、既存の符号化ストリームとの間で、完全に互換性を保つことができる。
また、スライスヘッダにフラグdepth_weighted_pred_flagとフラグdepth_weighted_bipred_flagが含められるので、スライス単位で、フラグdepth_weighted_pred_flagとフラグdepth_weighted_bipred_flagを設定することができる。
<符号化装置の処理の説明>
図7は、図2の符号化装置50の符号化処理を説明するフローチャートである。
図7のステップS10において、符号化装置50の多視点カラー画像撮像部51は、多視点のカラー画像を撮像し、多視点カラー画像として多視点カラー画像補正部52に供給する。
ステップS11において、多視点カラー画像撮像部51は、各視点の外部パラメータ、デプス最大値、およびデプス最小値を生成する。多視点カラー画像撮像部51は、外部パラメータ、デプス最大値、およびデプス最小値をデプス画像情報生成部54に供給するとともに、デプス最大値とデプス最小値を多視点デプス画像生成部53に供給する。
ステップS12において、多視点カラー画像補正部52は、多視点カラー画像撮像部51から供給される多視点カラー画像に対して、色補正、輝度補正、歪み補正等を行う。多視点カラー画像補正部52は、補正後の多視点カラー画像を多視点補正カラー画像として多視点デプス画像生成部53と多視点画像符号化部55に供給する。
ステップS13において、多視点デプス画像生成部53は、多視点カラー画像撮像部51から供給されるデプス最大値とデプス最小値に基づいて、多視点カラー画像補正部52から供給される多視点補正カラー画像から、多視点のデプス画像を生成する。そして、多視点デプス画像生成部53は、生成された多視点のデプス画像を多視点デプス画像として多視点画像符号化部55に供給する。
ステップS14において、デプス画像情報生成部54は、各視点のデプス画像情報を生成し、多視点画像符号化部55に供給する。
ステップS15において、多視点画像符号化部55は、多視点補正カラー画像および多視点デプス画像をHEVC方式に準じた方式で符号化する多視点符号化処理を行う。この多視点符号化処理の詳細は、後述する図8を参照して説明する。
ステップS16において、多視点画像符号化部55は、ステップS15の結果生成される符号化ストリームを伝送し、処理を終了する。
図8は、図7のステップS15の多視点符号化処理の詳細を説明するフローチャートである。
図8のステップS31において、多視点画像符号化部55のSPS符号化部61(図3)は、シーケンス単位のSPSを生成し、PPS符号化部62に供給する。
ステップS32において、PPS符号化部62は、ピクチャ単位のPPSを生成し、SPS符号化部61から供給されるSPSに付加してスライスヘッダ符号化部64に供給する。以降のステップS33乃至S37の処理は、各視点のスライス単位で行われる。
ステップS33において、DPS符号化部63は、処理対象の視点のスライス(以下、対象視点スライスという)のDPSを生成するDPS生成処理を行う。このDPS生成処理の詳細は、後述する図9を参照して説明する。
ステップS34において、スライスヘッダ符号化部64は、DPS符号化部63から供給されるDPSのDPS_idまたはDPS_idを含む対象視点スライスのデプス画像のスライスヘッダを生成する。
ステップS35において、スライスヘッダ符号化部64は、対象視点スライスの補正カラー画像のスライスヘッダを生成する。そして、スライスヘッダ符号化部64は、DPSと多視点デプス画像および多視点カラー画像のスライスヘッダとを、PPS符号化部62から供給されるSPSが付加されたPPSにさらに付加し、スライス符号化部65に供給する。
ステップS36において、スライス符号化部65は、スライスヘッダ符号化部64から供給される対象視点スライスのデプス画像のスライスヘッダに含まれるDPS_idのDPSに含まれるデプス画像情報を用いて、多視点デプス画像生成部53から供給される対象視点スライスのデプス画像を、HEVC方式に準じた3DVC方式で符号化する。
ステップS37において、スライス符号化部65は、多視点デプス画像生成部53から供給される対象視点スライスの補正カラー画像を、HEVC方式に準じた方式で符号化する。スライス符号化部65は、スライスヘッダ符号化部64から供給されるSPS,PPS、およびDPSが付加されたスライスヘッダに、ステップS36およびS37の符号化の結果得られるスライス単位の符号化データを付加して符号化ストリームを生成する。そして、処理は、図7のステップS15に戻り、ステップS16に進む。
図9は、図8のステップS33のDPS生成処理の詳細を説明するフローチャートである。
図9のステップS51において、DPS符号化部63は、対象視点スライスのタイプがイントラタイプであるかどうかを判定する。ステップS51で対象視点スライスのタイプがイントラタイプであると判定された場合、処理はステップS52に進む。
ステップS52において、DPS符号化部63は、図2のデプス画像情報生成部54から供給される対象視点スライスのデプス画像情報を含むDPSが既に生成されているかどうかを判定する。
ステップS52でDPSが既に生成されていないと判定された場合、ステップS53において、DPS符号化部63は、対象視点スライスのデプス画像情報を差分符号化結果として含むDPSを生成し、処理をステップS57に進める。
一方、ステップS51で対象視点スライスのタイプがイントラタイプではないと判定された場合、即ち対象視点スライスのタイプがインタータイプである場合、処理はステップS54に進む。
ステップS54において、DPS符号化部63は、対象視点スライスのデプス画像情報と、対象視点スライスの符号化順で1つ前の同一視点のスライスのデプス画像情報との差分を差分符号化結果として求めることにより、差分符号化を行う。
ステップS55において、DPS符号化部63は、ステップS54で求められた差分符号化結果を含むDPSが既に生成されているかどうかを判定する。ステップS55でDPSが既に生成されていないと判定された場合、ステップS56において、DPS符号化部63は、ステップS54で求められた差分符号化結果を含むDPSを生成し、処理をステップS57に進める。
ステップS57において、DPS符号化部63は、ステップS53またはステップS56で生成されたDPSにDPS_idを付与し、DPSに含める。DPS符号化部63は、DPS_idを含むDPSを保持する。保持されたDPSは、ステップS52およびステップS55の判定時に用いられる。
ステップS58において、DPS符号化部63は、DPS_idを含むDPSをスライスヘッダ符号化部64に出力する。そして、処理は図8のステップS33に戻り、ステップS34に進む。
一方、ステップS52でDPSが既に生成されていると判定された場合、ステップS59において、DPS符号化部63は、そのDPSのDPS_idをステップS57で保持されたDPSから検出し、スライスヘッダ符号化部64に出力する。そして、処理は図8のステップS33に戻り、ステップS34に進む。
また、ステップS55でDPSが既に生成されていると判定された場合、ステップS60において、DPS符号化部63は、そのDPSのDPS_idをステップS57で保持されたDPSから検出し、スライスヘッダ符号化部64に出力する。そして、処理は図8のステップS33に戻り、ステップS34に進む。
以上のように、符号化装置50は、デプス画像情報をDPS内に設定し、符号化ストリームに含めて伝送するので、スライス間でデプス画像情報を共有することができる。その結果、デプス画像情報をスライスヘッダ等に含めて伝送する場合に比べて、デプス画像情報の冗長性が低下し、符号量を削減することができる。
また、符号化装置50は、SPSやPPSといった既存のパラメータセットとは異なるDPSにデプス画像情報を設定して符号化ストリームを生成するので、既存の符号化ストリームと互換性を有する符号化ストリームを生成することができる。
さらに、符号化装置50が、DPS_idをDPSの設定順に付与する場合、復号側で、DPSに含まれるDPS_idに基づいて伝送中にDPSがロスしたことを検出することができる。従って、この場合、符号化装置50は、エラー耐性の高い伝送を行うことができる
なお、符号化装置50では、多視点デプス画像が多視点補正カラー画像から生成されたが、多視点カラー画像の撮像時に、視差dや奥行きZを検出するセンサにより生成されてもよい。
<復号装置の一実施の形態の構成例>
図10は、図2の符号化装置50から伝送される符号化ストリームを復号する、本技術を適用した復号装置の一実施の形態の構成例を示すブロック図である。
図10の復号装置80は、多視点画像復号部81、視点合成部82、および多視点画像表示部83により構成される。
復号装置80の多視点画像復号部81は、図2の符号化装置50から伝送されてくる符号化ストリームを受け取る。多視点画像復号部81は、受け取られた符号化ストリームから、SPS,PPS,DPS、スライスヘッダ、スライス単位の符号化データ等を抽出する。そして、多視点画像復号部81は、視点ごとに、スライスヘッダに含まれるDPS_idで特定されるDPSを用いて、そのスライスヘッダに対応するスライスのデプス画像の符号化データを、図2の多視点画像符号化部55の符号化方式に対応する方式で復号し、デプス画像を生成する。また、多視点画像復号部81は、多視点カラー画像のスライス単位の符号化データを、多視点画像符号化部55の符号化方式に対応する方式で復号し、多視点補正カラー画像を生成する。多視点画像復号部81は、生成された多視点補正カラー画像および多視点デプス画像を視点合成部82に供給する。
視点合成部82は、多視点画像復号部81からの多視点デプス画像に対して、多視点画像表示部83に対応する視点数の視点(以下、表示視点という)へのワーピング処理(詳細は後述する)を行う。このとき、デプス画像情報が用いられるようにしてもよい。
なお、ワーピング処理とは、ある視点の画像から別の視点の画像へ幾何変換する処理である。また、表示視点には、多視点カラー画像に対応する視点以外の視点が含まれる。
また、視点合成部82は、ワーピング処理の結果得られる表示視点のデプス画像を用いて、多視点画像復号部81から供給される多視点補正カラー画像に対して、表示視点へのワーピング処理を行う。このとき、デプス画像情報が用いられるようにしてもよい。視点合成部82は、ワーピング処理の結果得られる表示視点のカラー画像を、多視点合成カラー画像として多視点画像表示部83に供給する。
多視点画像表示部83は、視点合成部82から供給される多視点合成カラー画像を、視点ごとに視認可能な角度が異なるように表示する。視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに複数の視点から3D画像を見ることができる。
<多視点画像復号部の構成例>
図11は、図10の多視点画像復号部81の構成例を示すブロック図である。
図11の多視点画像復号部81は、SPS復号部101、PPS復号部102、DPS復号部103、スライスヘッダ復号部104、およびスライス復号部105により構成される。
多視点画像復号部81のSPS復号部101は、図2の符号化装置50から伝送されてくる符号化ストリームを受け取る。SPS復号部101は、その符号化ストリームからSPSを抽出する。SPS復号部101は、抽出されたSPSと符号化ストリームをPPS復号部102とDPS復号部103に供給する。
PPS復号部102は、SPS復号部101から供給される符号化ストリームからPPSを抽出する。PPS復号部102は、抽出されたPPSと、SPS復号部101から供給される符号化ストリームをスライスヘッダ復号部104に供給する。DPS復号部103は、取得部として機能し、SPS復号部101から供給される符号化ストリームからDPSを取得する。また、DPS復号部103は、パース処理部として機能し、DPSからデプス画像情報をパース(抽出)し、保持する。このデプス画像情報は、必要に応じて視点合成部82に供給される。
スライスヘッダ復号部104は、PPS復号部102から供給される符号化ストリームからスライスヘッダを抽出する。スライスヘッダ復号部104は、スライスヘッダに含まれるDPS_idで特定されるDPSのデプス画像情報を、DPS復号部103から読み出す。スライスヘッダ復号部104は、SPS,PPS、スライスヘッダ、DPS、および符号化ストリームをスライス復号部105に供給する。
スライス復号部105は、取得部として機能し、スライスヘッダ復号部104から供給される符号化ストリームからスライス単位の符号化データを取得する。また、スライス復号部105は、生成部として機能し、スライスヘッダ復号部104から供給されるDPSに含まれる差分符号化結果を、そのDPSに対応するスライスのスライスタイプに基づいて復号する。
具体的には、スライス復号部105は、DPSに対応するスライスのスライスタイプがイントラタイプである場合、そのDPSに含まれる差分符号化結果をそのまま復号結果とすることにより復号を行う。一方、DPSに対応するスライスのスライスタイプがインタータイプである場合、スライス復号部105は、そのDPSに含まれる差分符号化結果と、保持している符号化順で1つ前のスライスのデプス画像情報とを加算し、その結果得られる加算値を復号結果とする。スライス復号部105は、復号結果をデプス画像情報として保持する。
また、スライス復号部105は、スライスヘッダ復号部104から供給されるSPS,PPS、およびスライスヘッダ、並びにデプス画像情報に基づいて、スライス符号化部65(図3)における符号化方式に対応する方式で、スライス単位の符号化データを復号する。スライスヘッダ復号部104は、復号の結果得られる多視点補正カラー画像と多視点デプス画像を、図10の視点合成部82に供給する。
<復号装置の処理の説明>
図12は、図10の復号装置80の復号処理を説明するフローチャートである。この復号処理は、例えば、図2の符号化装置50から符号化ストリームが伝送されてきたとき、開始される。
図12のステップS61において、復号装置80の多視点画像復号部81は、図2の符号化装置50から伝送されてくる符号化ストリームを受け取る。
ステップS62において、多視点画像復号部81は、受け取られた符号化ストリームを復号する多視点復号処理を行う。この多視点復号処理の詳細は、後述する図13を参照して説明する。
ステップS63において、視点合成部82は、多視点画像復号部81から供給される多視点補正カラー画像と多視点デプス画像を用いて、多視点合成カラー画像を生成する。
ステップS64において、多視点画像表示部83は、視点合成部82から供給される多視点合成カラー画像を、視点ごとに視認可能な角度が異なるように表示し、処理を終了する。
図13は、図12のステップS62の多視点復号処理の詳細を説明するフローチャートである。
図13のステップS71において、多視点画像復号部81のSPS復号部101は、受け取られた符号化ストリームからSPSを抽出する。SPS復号部101は、抽出されたSPSと符号化ストリームをPPS復号部102とDPS復号部103に供給する。
ステップS72において、PPS復号部102は、SPS復号部101から供給される符号化ストリームからPPSを抽出する。PPS復号部102は、抽出されたPPSと、SPS復号部101から供給されるSPSおよび符号化ストリームとをスライスヘッダ復号部104に供給する。
ステップS73において、DPS復号部103は、SPS復号部101から供給される符号化ストリームからDPSを抽出し、DPSからデプス画像情報をパースし、保持する。以降のステップS74乃至S77の処理は、各視点のスライス単位で行われる。ステップS74において、スライスヘッダ復号部104は、PPS復号部102から供給される符号化ストリームから対象視点スライスのスライスヘッダを抽出する。
ステップS75において、スライスヘッダ復号部104は、ステップS74で抽出されたスライスヘッダに含まれるDPS_idで特定されるDPSのデプス画像情報を、DPS復号部103から読み出す。スライスヘッダ復号部104は、SPSおよびPPS、対象視点スライスのスライスヘッダおよびDPS、並びに符号化ストリームをスライス復号部105に供給する。
ステップS76において、スライス復号部105は、スライスヘッダ復号部104から供給されるDPSに含まれる差分符号化結果を復号し、デプス画像情報を生成する生成処理を行う。この生成処理の詳細は、後述する図14を参照して説明する。
ステップS77において、スライス復号部105は、スライスヘッダ復号部104から供給される符号化ストリームから、対象視点スライスの符号化データを抽出する。
ステップS78において、スライス復号部105は、スライスヘッダ復号部104から供給されるSPS,PPS、およびスライスヘッダ、並びに、デプス画像情報に基づいて、スライス符号化部65(図3)における符号化方式に対応する方式で、対象視点スライスの符号化データを復号する。スライス復号部105は、復号の結果得られる補正カラー画像とデプス画像を、図10の視点合成部82に供給する。そして、処理は、図12のステップS62に戻り、ステップS63に進む。
図14は、図13のステップS76の生成処理の詳細を説明するフローチャートである。
ステップS91において、スライス復号部105は、対象視点スライスのタイプがイントラタイプであるかどうかを判定する。ステップS91で対象視点スライスのタイプがイントラタイプであると判定された場合、処理はステップS92に進む。
ステップS92において、スライス復号部105は、スライスヘッダ復号部104から供給されるDPSに含まれるデプス最小値の差分符号化結果を、復号結果のデプス画像情報のデプス最小値とするとともに、保持する。
ステップS93において、スライス復号部105は、スライスヘッダ復号部104から供給されるDPSに含まれるデプス最大値の差分符号化結果を、復号結果のデプス画像情報のデプス最大値とするとともに、保持する。
ステップS94において、スライス復号部105は、スライスヘッダ復号部104から供給されるDPSに含まれるカメラ間距離の差分符号化結果を、復号結果のデプス画像情報のカメラ間距離とするとともに、保持する。そして、処理は図13のステップS76に戻り、ステップS77に進む。
一方、ステップS91で対象視点スライスのタイプがイントラタイプではないと判定された場合、即ち対象視点スライスのタイプがインタータイプである場合、処理はステップS95に進む。
ステップS95において、スライス復号部105は、スライスヘッダ復号部104から供給されるDPSに含まれるデプス最小値の差分符号化結果を、保持されている符号化順で1つ前のスライスのデプス最小値に加算することにより、復号する。スライス復号部105は、復号の結果得られるデプス画像情報のデプス最小値を保持する。
ステップS96において、スライス復号部105は、スライスヘッダ復号部104から供給されるDPSに含まれるデプス最大値の差分符号化結果を、保持されている符号化順で1つ前のスライスのデプス最大値に加算することにより、復号する。スライス復号部105は、復号の結果得られるデプス画像情報のデプス最大値を保持する。
ステップS97において、スライス復号部105は、スライスヘッダ復号部104から供給されるDPSに含まれるカメラ間距離の差分符号化結果を、保持されている符号化順で1つ前のスライスのカメラ間距離に加算することにより、復号する。スライス復号部105は、復号の結果得られるデプス画像情報のカメラ間距離を保持する。そして、処理は図13のステップS76に戻り、ステップS77に進む。
以上のように、復号装置80は、デプス画像情報がDPS内に設定されることにより符号量が削減された符号化ストリームを復号することができる。また、デプス画像情報が符号化ストリームに含まれるので、復号装置80は、デプス画像情報を符号化時に用いた符号化ストリームを復号することが可能になる。
また、SPSやPPSといった既存のパラメータセットとは異なるDPSにデプス画像情報が含められるので、ワーピング処理等のポスト処理時にデプス画像情報を容易に用いることができる。さらに、DPSはスライス単位の符号化データより前にまとめて配置されるので、視点合成部82は復号前にデプス画像情報をまとめて取得することができる。
なお、デプス画像情報は、多視点デプス画像の符号化や復号に用いられなくてもよい。
また、上述した実施の形態では、スライスヘッダにDPS_idが含まれるようにしたが、例えばデプス画像情報がシーケンス単位(GOP(group of pictures)単位)で設定される場合、既存のSPSを拡張し、拡張されたSPS(以下、拡張SPSという)にDPS_idを含めるようにしてもよい。
この場合、拡張SPSのシンタックスは、例えば、図15に示すようになる。即ち、拡張SPSは、第2行目に示すように、DPSが存在していることを識別するフラグdepth_range_present_flag(識別情報)を含み、第3行目に示すように、フラグdepth_range_present_flagが1である場合にDPS_id(depth_parameter_set_id)を含む。
また、この場合、図16の第5行目および第6行目に示すように、フラグdepth_weighted_pred_flagとフラグdepth_weighted_bipred_flagをシーケンス単位で設定し、拡張SPSに含めるようにすることもできる。
また、既存のSPSではなく、既存のスライスヘッダを拡張し、拡張されたスライスヘッダ(以下、拡張スライスヘッダという)にDPS_idを含めるようにすることもできる。
この場合、例えば、slice_layerが拡張され、図17に示すように、NALユニットのタイプnal_unit_typeが21であるNALユニット、即ち3DVC方式で符号化された符号化データのNALユニットのslice_layerとして、拡張されたslice_layer(slice_layer_3dvc_extension_rbsp)(以下、拡張slice_layerという)が定義される。なお、図17に示すように、DPSのNALユニットのタイプnal_unit_typeは、SPSやPPS等の既存のNALユニットとは異なる16である。
また、図18に示すように、拡張slice_layer(slice_layer_3dvc_extension_rbsp)の符号化データが、拡張スライスヘッダ(slice_header_3dvc_extension)とスライス単位の符号化データ(slice_data)により構成されることが定義される。
拡張スライスヘッダ(slice_header_3dvc_extension)のシンタックスは、例えば、図19に示すようになる。即ち、図19の第2乃至第4行目に示すように、拡張スライスヘッダ(slice_header_3dvc_extension)は、既存のスライスヘッダ(slice_header)だけでなく、フラグdepth_weighted_pred_flagまたはdepth_weighted_bipred_flagが1である場合にDPS_id(depth_parameter_set_id)も含む。
なお、拡張スライスヘッダ(slice_header_3dvc_extension)には、図20に示すように、フラグdepth_weighted_pred_flagまたはdepth_weighted_bipred_flagが含まれるようにしてもよい。
図19や図20に示すように、拡張スライスヘッダには、既存のスライスヘッダも含まれるため、既存の符号化ストリームとの間で、完全に互換性を保つことができる。
また、図17および図18に示したようにslice_layerを拡張するのではなく、既存のslice_layerで拡張スライスヘッダ(slice_header_3dvc_extension)を定義することも可能である。
この場合、図21の第15行目および第16行目に示すように、NALユニットには、NALユニットのタイプnal_unit_typeが21である場合、3DVC方式用のNALユニットであるかどうかを表すフラグ3dvc_extension_flagが含まれる。
また、図22の第6行目乃至第8行目に示すように、フラグ3dvc_extension_flagが3DVC方式用のNALユニットであることを表す1である場合、slice_layerの符号化データは、拡張スライスヘッダ(slice_header_3dvc_extension)とスライス単位の符号化データ(slice_data)により構成されることが定義される。
さらに、上述した実施の形態では、図4に示したように、DPSをスライス間で共有し、スライスヘッダに、対応するスライスのDPSのDPS_idを含めるようにしたが、図23に示すように、スライス毎にDPSを設定し、各スライスの符号化データにDPSを付加するようにしてもよい。この場合、DPSにはDPS_idが付与されず、スライスヘッダには、DPS_idが含まれない。
<本技術を適用したコンピュータの説明>
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
そこで、図24は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
プログラムは、コンピュータに内蔵されている記録媒体としての記憶部808やROM(Read Only Memory)802に予め記録しておくことができる。
あるいはまた、プログラムは、リムーバブルメディア811に格納(記録)しておくことができる。このようなリムーバブルメディア811は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブルメディア811としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。
なお、プログラムは、上述したようなリムーバブルメディア811からドライブ810を介してコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵する記憶部808にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。
コンピュータは、CPU(Central Processing Unit)801を内蔵しており、CPU801には、バス804を介して、入出力インタフェース805が接続されている。
CPU801は、入出力インタフェース805を介して、ユーザによって、入力部806が操作等されることにより指令が入力されると、それに従って、ROM802に格納されているプログラムを実行する。あるいは、CPU801は、記憶部808に格納されたプログラムを、RAM(Random Access Memory)803にロードして実行する。
これにより、CPU801は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU801は、その処理結果を、必要に応じて、例えば、入出力インタフェース805を介して、出力部807から出力、あるいは、通信部809から送信、さらには、記憶部808に記録等させる。
なお、入力部806は、キーボードや、マウス、マイク等で構成される。また、出力部807は、LCD(Liquid Crystal Display)やスピーカ等で構成される。
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。
また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
本技術は、衛星放送、ケーブルTV(テレビジョン)、インターネット、および携帯電話機などのネットワークメディアを介して通信する際に、あるいは、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる符号化装置や復号装置に適用することができる。
また、上述した符号化装置や復号装置は、任意の電子機器に適用することができる。以下にその例について説明する。
<テレビジョン装置の構成例>
図25は、本技術を適用したテレビジョン装置の概略構成を例示している。テレビジョン装置900は、アンテナ901、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、表示部906、音声信号処理部907、スピーカ908、外部インタフェース部909を有している。さらに、テレビジョン装置900は、制御部910、ユーザインタフェース部911等を有している。
チューナ902は、アンテナ901で受信された放送波信号から所望のチャンネルを選局して復調を行い、得られた符号化ストリームをデマルチプレクサ903に出力する。
デマルチプレクサ903は、符号化ストリームから視聴対象である番組の映像や音声のパケットを抽出して、抽出したパケットのデータをデコーダ904に出力する。また、デマルチプレクサ903は、EPG(Electronic Program Guide)等のデータのパケットを制御部910に供給する。なお、スクランブルが行われている場合、デマルチプレクサ等でスクランブルの解除を行う。
デコーダ904は、パケットの復号化処理を行い、復号処理化によって生成された映像データを映像信号処理部905、音声データを音声信号処理部907に出力する。
映像信号処理部905は、映像データに対して、ノイズ除去やユーザ設定に応じた映像処理等を行う。映像信号処理部905は、表示部906に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成する。また、映像信号処理部905は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それを番組の映像データに重畳する。映像信号処理部905は、このようにして生成した映像データに基づいて駆動信号を生成して表示部906を駆動する。
表示部906は、映像信号処理部905からの駆動信号に基づき表示デバイス(例えば液晶表示素子等)を駆動して、番組の映像などを表示させる。
音声信号処理部907は、音声データに対してノイズ除去などの所定の処理を施し、処理後の音声データのD/A変換処理や増幅処理を行いスピーカ908に供給することで音声出力を行う。
外部インタフェース部909は、外部機器やネットワークと接続するためのインタフェースであり、映像データや音声データ等のデータ送受信を行う。
制御部910にはユーザインタフェース部911が接続されている。ユーザインタフェース部911は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部910に供給する。
制御部910は、CPU(Central Processing Unit)やメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータ、EPGデータ、ネットワークを介して取得されたデータ等を記憶する。メモリに記憶されているプログラムは、テレビジョン装置900の起動時などの所定タイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、テレビジョン装置900がユーザ操作に応じた動作となるように各部を制御する。
なお、テレビジョン装置900では、チューナ902、デマルチプレクサ903、映像信号処理部905、音声信号処理部907、外部インタフェース部909等と制御部910を接続するためバス912が設けられている。
このように構成されたテレビジョン装置では、デコーダ904に本願の復号装置(復号方法)の機能が設けられる。このため、デプス画像に関する情報を符号化ストリームに含める際に符号化ストリームの符号量が削減された符号化ストリームを復号することができる。
<携帯電話機の構成例>
図26は、本技術を適用した携帯電話機の概略構成を例示している。携帯電話機920は、通信部922、音声コーデック923、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、制御部931を有している。これらは、バス933を介して互いに接続されている。
また、通信部922にはアンテナ921が接続されており、音声コーデック923には、スピーカ924とマイクロホン925が接続されている。さらに制御部931には、操作部932が接続されている。
携帯電話機920は、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。
音声通話モードにおいて、マイクロホン925で生成された音声信号は、音声コーデック923で音声データへの変換やデータ圧縮が行われて通信部922に供給される。通信部922は、音声データの変調処理や周波数変換処理等を行い、送信信号を生成する。また、通信部922は、送信信号をアンテナ921に供給して図示しない基地局へ送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、得られた音声データを音声コーデック923に供給する。音声コーデック923は、音声データのデータ伸張やアナログ音声信号への変換を行いスピーカ924に出力する。
また、データ通信モードにおいて、メール送信を行う場合、制御部931は、操作部932の操作によって入力された文字データを受け付けて、入力された文字を表示部930に表示する。また、制御部931は、操作部932におけるユーザ指示等に基づいてメールデータを生成して通信部922に供給する。通信部922は、メールデータの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ921から送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、メールデータを復元する。このメールデータを、表示部930に供給して、メール内容の表示を行う。
なお、携帯電話機920は、受信したメールデータを、記録再生部929で記憶媒体に記憶させることも可能である。記憶媒体は、書き換え可能な任意の記憶媒体である。例えば、記憶媒体は、RAMや内蔵型フラッシュメモリ等の半導体メモリ、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカード等のリムーバブルメディアである。
データ通信モードにおいて画像データを送信する場合、カメラ部926で生成された画像データを、画像処理部927に供給する。画像処理部927は、画像データの符号化処理を行い、符号化データを生成する。
多重分離部928は、画像処理部927で生成された符号化データと、音声コーデック923から供給された音声データを所定の方式で多重化して通信部922に供給する。通信部922は、多重化データの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ921から送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、多重化データを復元する。この多重化データを多重分離部928に供給する。多重分離部928は、多重化データの分離を行い、符号化データを画像処理部927、音声データを音声コーデック923に供給する。画像処理部927は、符号化データの復号化処理を行い、画像データを生成する。この画像データを表示部930に供給して、受信した画像の表示を行う。音声コーデック923は、音声データをアナログ音声信号に変換してスピーカ924に供給して、受信した音声を出力する。
このように構成された携帯電話装置では、画像処理部927に本願の符号化装置(符号化方法)および復号装置(復号方法)の機能が設けられる。このため、デプス画像に関する情報を符号化ストリームに含める際に符号化ストリームの符号量を削減することができる。また、デプス画像に関する情報を符号化ストリームに含める際に符号化ストリームの符号量が削減された符号化ストリームを復号することができる。
<記録再生装置の構成例>
図27は、本技術を適用した記録再生装置の概略構成を例示している。記録再生装置940は、例えば受信した放送番組のオーディオデータとビデオデータを、記録媒体に記録して、その記録されたデータをユーザの指示に応じたタイミングでユーザに提供する。また、記録再生装置940は、例えば他の装置からオーディオデータやビデオデータを取得し、それらを記録媒体に記録させることもできる。さらに、記録再生装置940は、記録媒体に記録されているオーディオデータやビデオデータを復号して出力することで、モニタ装置等において画像表示や音声出力を行うことができるようにする。
記録再生装置940は、チューナ941、外部インタフェース部942、エンコーダ943、HDD(Hard Disk Drive)部944、ディスクドライブ945、セレクタ946、デコーダ947、OSD(On-Screen Display)部948、制御部949、ユーザインタフェース部950を有している。
チューナ941は、図示しないアンテナで受信された放送信号から所望のチャンネルを選局する。チューナ941は、所望のチャンネルの受信信号を復調して得られた符号化ビットストリームをセレクタ946に出力する。
外部インタフェース部942は、IEEE1394インタフェース、ネットワークインタフェース部、USBインタフェース、フラッシュメモリインタフェース等の少なくともいずれかで構成されている。外部インタフェース部942は、外部機器やネットワーク、メモリカード等と接続するためのインタフェースであり、記録する映像データや音声データ等のデータ受信を行う。
エンコーダ943は、外部インタフェース部942から供給された映像データや音声データが符号化されていないとき所定の方式で符号化を行い、符号化ビットストリームをセレクタ946に出力する。
HDD部944は、映像や音声等のコンテンツデータ、各種プログラムやその他のデータ等を内蔵のハードディスクに記録し、また再生時等にそれらを当該ハードディスクから読み出す。
ディスクドライブ945は、装着されている光ディスクに対する信号の記録および再生を行う。光ディスク、例えばDVDディスク(DVD−Video、DVD−RAM、DVD−R、DVD−RW、DVD+R、DVD+RW等)やBlu−rayディスク等である。
セレクタ946は、映像や音声の記録時には、チューナ941またはエンコーダ943からのいずれかの符号化ビットストリームを選択して、HDD部944やディスクドライブ945のいずれかに供給する。また、セレクタ946は、映像や音声の再生時に、HDD部944またはディスクドライブ945から出力された符号化ビットストリームをデコーダ947に供給する。
デコーダ947は、符号化ビットストリームの復号化処理を行う。デコーダ947は、復号処理化を行うことにより生成された映像データをOSD部948に供給する。また、デコーダ947は、復号処理化を行うことにより生成された音声データを出力する。
OSD部948は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それをデコーダ947から出力された映像データに重畳して出力する。
制御部949には、ユーザインタフェース部950が接続されている。ユーザインタフェース部950は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部949に供給する。
制御部949は、CPUやメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータを記憶する。メモリに記憶されているプログラムは、記録再生装置940の起動時などの所定タイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、記録再生装置940がユーザ操作に応じた動作となるように各部を制御する。
このように構成された記録再生装置では、デコーダ947に本願の復号装置(復号方法)の機能が設けられる。このため、デプス画像に関する情報を符号化ストリームに含める際に符号化ストリームの符号量が削減された符号化ストリームを復号することができる。
<撮像装置の構成例>
図28は、本技術を適用した撮像装置の概略構成を例示している。撮像装置960は、被写体を撮像し、被写体の画像を表示部に表示させたり、それを画像データとして、記録媒体に記録する。
撮像装置960は、光学ブロック961、撮像部962、カメラ信号処理部963、画像データ処理部964、表示部965、外部インタフェース部966、メモリ部967、メディアドライブ968、OSD部969、制御部970を有している。また、制御部970には、ユーザインタフェース部971が接続されている。さらに、画像データ処理部964や外部インタフェース部966、メモリ部967、メディアドライブ968、OSD部969、制御部970等は、バス972を介して接続されている。
光学ブロック961は、フォーカスレンズや絞り機構等を用いて構成されている。光学ブロック961は、被写体の光学像を撮像部962の撮像面に結像させる。撮像部962は、CCDまたはCMOSイメージセンサを用いて構成されており、光電変換によって光学像に応じた電気信号を生成してカメラ信号処理部963に供給する。
カメラ信号処理部963は、撮像部962から供給された電気信号に対してニー補正やガンマ補正、色補正等の種々のカメラ信号処理を行う。カメラ信号処理部963は、カメラ信号処理後の画像データを画像データ処理部964に供給する。
画像データ処理部964は、カメラ信号処理部963から供給された画像データの符号化処理を行う。画像データ処理部964は、符号化処理を行うことにより生成された符号化データを外部インタフェース部966やメディアドライブ968に供給する。また、画像データ処理部964は、外部インタフェース部966やメディアドライブ968から供給された符号化データの復号化処理を行う。画像データ処理部964は、復号化処理を行うことにより生成された画像データを表示部965に供給する。また、画像データ処理部964は、カメラ信号処理部963から供給された画像データを表示部965に供給する処理や、OSD部969から取得した表示用データを、画像データに重畳させて表示部965に供給する。
OSD部969は、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを生成して画像データ処理部964に出力する。
外部インタフェース部966は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタと接続される。また、外部インタフェース部966には、必要に応じてドライブが接続され、磁気ディスク、光ディスク等のリムーバブルメディアが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、インストールされる。さらに、外部インタフェース部966は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。制御部970は、例えば、ユーザインタフェース部971からの指示にしたがって、メモリ部967から符号化データを読み出し、それを外部インタフェース部966から、ネットワークを介して接続される他の装置に供給させることができる。また、制御部970は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース部966を介して取得し、それを画像データ処理部964に供給したりすることができる。
メディアドライブ968で駆動される記録メディアとしては、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアが用いられる。また、記録メディアは、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ICカード等であってもよい。
また、メディアドライブ968と記録メディアを一体化し、例えば、内蔵型ハードディスクドライブやSSD(Solid State Drive)等のように、非可搬性の記憶媒体により構成されるようにしてもよい。
制御部970は、CPUやメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータ等を記憶する。メモリに記憶されているプログラムは、撮像装置960の起動時などの所定タイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、撮像装置960がユーザ操作に応じた動作となるように各部を制御する。
このように構成された撮像装置では、画像データ処理部964に本願の符号化装置(符号化方法)および復号装置(復号方法)の機能が設けられる。このため、デプス画像に関する情報を符号化ストリームに含める際に符号化ストリームの符号量を削減することができる。また、デプス画像に関する情報を符号化ストリームに含める際に符号化ストリームの符号量が削減された符号化ストリームを復号することができる。
本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
なお、本技術は、以下のような構成もとることができる。
(1)
デプス画像に関する情報であるデプス画像情報をシーケンスパラメータセットおよびピクチャパラメータセットとは異なるパラメータセットとして設定する設定部と、
前記デプス画像を符号化し、符号化データを生成する符号化部と、
前記設定部により設定された前記パラメータセットと前記符号化部により生成された前記符号化データとを含む符号化ストリームを伝送する伝送部と
を備える符号化装置。
(2)
前記設定部は、前記パラメータセットに前記パラメータセットを一意に識別するIDを設定し、
前記伝送部は、前記デプス画像に対応する前記IDを含む前記符号化ストリームを伝送する
前記(1)に記載の符号化装置。
(3)
前記設定部は、スライス単位の前記デプス画像に対応する前記IDを、そのデプス画像のスライスヘッダに設定し、
前記伝送部は、前記設定部により設定された前記スライスヘッダを含む前記符号化ストリームを伝送する
前記(2)に記載の符号化装置。
(4)
前記設定部は、前記デプス画像情報を差分符号化し、前記デプス画像情報の差分符号化結果を前記パラメータセットとして設定する
前記(1)乃至(3)のいずれかに記載の符号化装置。
(5)
前記符号化部は、前記デプス画像情報を用いて前記デプス画像を符号化する
前記(1)乃至(4)のいずれかに記載の符号化装置。
(6)
前記デプス画像情報は、前記デプス画像の画素値の最大値および最小値と、前記デプス画像を撮影するカメラ間の距離とを含む
前記(1)乃至(5)のいずれかに記載の符号化装置。
(7)
前記パラメータセットには、シーケンスパラメータセットおよびピクチャパラメータセットとは異なるNAL(Network Abstraction Layer)ユニットタイプが設定される
前記(1)乃至(6)のいずれかに記載の符号化装置。
(8)
前記設定部は、前記デプス画像情報が存在することを識別する識別情報を設定し、
前記伝送部は、前記設定部により設定された前記識別情報を含む前記符号化ストリームを伝送する
前記(1)乃至(7)のいずれかに記載の符号化装置。
(9)
符号化装置が、
デプス画像に関する情報であるデプス画像情報をシーケンスパラメータセットおよびピクチャパラメータセットとは異なるパラメータセットとして設定する設定ステップと、
前記デプス画像を符号化し、符号化データを生成する符号化ステップと、
前記設定ステップの処理により設定された前記パラメータセットと前記符号化ステップの処理により生成された前記符号化データとを含む符号化ストリームを伝送する伝送ステップと
を含む符号化方法。
(10)
デプス画像に関する情報であるデプス画像情報が設定されたシーケンスパラメータセットおよびピクチャパラメータセットとは異なるパラメータセットと、前記デプス画像の符号化データとを含む符号化ストリームから、前記パラメータセットと前記符号化データを取得する取得部と、
前記取得部により取得された前記パラメータセットから前記デプス画像情報をパースするパース処理部と、
前記取得部により取得された前記符号化データを復号する復号部と
を備える復号装置。
(11)
前記パラメータセットには、前記パラメータセットを一意に識別するIDが設定されており、
前記符号化ストリームは、前記デプス画像に対応する前記IDを含む
前記(10)に記載の復号装置。
(12)
前記符号化ストリームは、スライス単位の前記デプス画像に対応する前記IDが設定されたスライスヘッダを含む
前記(11)に記載の復号装置。
(13)
前記デプス画像情報の差分符号化結果を復号して前記デプス画像情報を生成する生成部
をさらに備え、
前記符号化ストリームは、前記デプス画像情報の差分符号化結果が設定された前記パラメータセットを含み、
前記生成部は、前記パラメータセットとして設定された前記デプス画像情報の差分符号化結果を復号して前記デプス画像情報を生成する
前記(10)乃至(12)のいずれかに記載の復号装置。
(14)
前記復号部は、前記パース処理部によりパースされた前記デプス画像情報を用いて前記符号化データを復号する
前記(10)乃至(13)のいずれかに記載の復号装置。
(15)
前記デプス画像情報は、前記デプス画像の画素値の最大値および最小値と、前記デプス画像を撮影するカメラ間の距離とを含む
前記(10)乃至(14)のいずれかに記載の復号装置。
(16)
前記パラメータセットには、シーケンスパラメータセットおよびピクチャパラメータセットとは異なるNAL(Network Abstraction Layer)ユニットタイプが設定される
前記(10)乃至(15)のいずれかに記載の復号装置。
(17)
前記符号化ストリームは、前記デプス画像情報が存在することを識別する識別情報を含む
前記(10)乃至(16)のいずれかに記載の復号装置。
(18)
復号装置が、
デプス画像に関する情報であるデプス画像情報が設定されたシーケンスパラメータセットおよびピクチャパラメータセットとは異なるパラメータセットと、前記デプス画像の符号化データとを含む符号化ストリームから、前記パラメータセットと前記符号化データを取得する取得ステップと、
前記取得ステップの処理により取得された前記パラメータセットから前記デプス画像情報をパースするパース処理ステップと、
前記取得ステップの処理により取得された前記符号化データを復号する復号ステップと
を含む復号方法。
50 符号化装置, 51 多視点カラー画像撮像部, 52 多視点カラー画像補正部, 53 多視点デプス画像生成部, 54 デプス画像情報生成部, 55 多視点画像符号化部, 61 SPS符号化部, 62 PPS符号化部, 63 DPS符号化部, 64 スライスヘッダ符号化部, 65 スライス符号化部, 80 復号装置, 81 多視点画像復号部, 82 視点合成部, 101 SPS復号部, 102 PPS復号部, 103 DPS復号部, 104 スライスヘッダ復号部, 105 スライス復号部

Claims (18)

  1. デプス画像に関する情報であるデプス画像情報をシーケンスパラメータセットおよびピクチャパラメータセットとは異なるパラメータセットとして設定する設定部と、
    前記デプス画像を符号化し、符号化データを生成する符号化部と、
    前記設定部により設定された前記パラメータセットと前記符号化部により生成された前記符号化データとを含む符号化ストリームを伝送する伝送部と
    を備える符号化装置。
  2. 前記設定部は、前記パラメータセットに前記パラメータセットを一意に識別するIDを設定し、
    前記伝送部は、前記デプス画像に対応する前記IDを含む前記符号化ストリームを伝送する
    請求項1に記載の符号化装置。
  3. 前記設定部は、スライス単位の前記デプス画像に対応する前記IDを、そのデプス画像のスライスヘッダに設定し、
    前記伝送部は、前記設定部により設定された前記スライスヘッダを含む前記符号化ストリームを伝送する
    請求項2に記載の符号化装置。
  4. 前記設定部は、前記デプス画像情報を差分符号化し、前記デプス画像情報の差分符号化結果を前記パラメータセットとして設定する
    請求項1に記載の符号化装置。
  5. 前記符号化部は、前記デプス画像情報を用いて前記デプス画像を符号化する
    請求項1に記載の符号化装置。
  6. 前記デプス画像情報は、前記デプス画像の画素値の最大値および最小値と、前記デプス画像を撮影するカメラ間の距離とを含む
    請求項1に記載の符号化装置。
  7. 前記パラメータセットには、シーケンスパラメータセットおよびピクチャパラメータセットとは異なるNAL(Network Abstraction Layer)ユニットタイプが設定される
    請求項1に記載の符号化装置。
  8. 前記設定部は、前記デプス画像情報が存在することを識別する識別情報を設定し、
    前記伝送部は、前記設定部により設定された前記識別情報を含む前記符号化ストリームを伝送する
    請求項1に記載の符号化装置。
  9. 符号化装置が、
    デプス画像に関する情報であるデプス画像情報をシーケンスパラメータセットおよびピクチャパラメータセットとは異なるパラメータセットとして設定する設定ステップと、
    前記デプス画像を符号化し、符号化データを生成する符号化ステップと、
    前記設定ステップの処理により設定された前記パラメータセットと前記符号化ステップの処理により生成された前記符号化データとを含む符号化ストリームを伝送する伝送ステップと
    を含む符号化方法。
  10. デプス画像に関する情報であるデプス画像情報が設定されたシーケンスパラメータセットおよびピクチャパラメータセットとは異なるパラメータセットと、前記デプス画像の符号化データとを含む符号化ストリームから、前記パラメータセットと前記符号化データを取得する取得部と、
    前記取得部により取得された前記パラメータセットから前記デプス画像情報をパースするパース処理部と、
    前記取得部により取得された前記符号化データを復号する復号部と
    を備える復号装置。
  11. 前記パラメータセットには、前記パラメータセットを一意に識別するIDが設定されており、
    前記符号化ストリームは、前記デプス画像に対応する前記IDを含む
    請求項10に記載の復号装置。
  12. 前記符号化ストリームは、スライス単位の前記デプス画像に対応する前記IDが設定されたスライスヘッダを含む
    請求項11に記載の復号装置。
  13. 前記デプス画像情報の差分符号化結果を復号して前記デプス画像情報を生成する生成部
    をさらに備え、
    前記符号化ストリームは、前記デプス画像情報の差分符号化結果が設定された前記パラメータセットを含み、
    前記生成部は、前記パラメータセットとして設定された前記デプス画像情報の差分符号化結果を復号して前記デプス画像情報を生成する
    請求項10に記載の復号装置。
  14. 前記復号部は、前記パース処理部によりパースされた前記デプス画像情報を用いて前記符号化データを復号する
    請求項10に記載の復号装置。
  15. 前記デプス画像情報は、前記デプス画像の画素値の最大値および最小値と、前記デプス画像を撮影するカメラ間の距離とを含む
    請求項10に記載の復号装置。
  16. 前記パラメータセットには、シーケンスパラメータセットおよびピクチャパラメータセットとは異なるNAL(Network Abstraction Layer)ユニットタイプが設定される
    請求項10に記載の復号装置。
  17. 前記符号化ストリームは、前記デプス画像情報が存在することを識別する識別情報を含む
    請求項10に記載の復号装置。
  18. 復号装置が、
    デプス画像に関する情報であるデプス画像情報が設定されたシーケンスパラメータセットおよびピクチャパラメータセットとは異なるパラメータセットと、前記デプス画像の符号化データとを含む符号化ストリームから、前記パラメータセットと前記符号化データを取得する取得ステップと、
    前記取得ステップの処理により取得された前記パラメータセットから前記デプス画像情報をパースするパース処理ステップと、
    前記取得ステップの処理により取得された前記符号化データを復号する復号ステップと
    を含む復号方法。
JP2013556335A 2012-01-31 2013-01-23 符号化装置、符号化方法、プログラム、および記録媒体 Expired - Fee Related JP5975301B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012019025 2012-01-31
JP2012019025 2012-01-31
PCT/JP2013/051265 WO2013115025A1 (ja) 2012-01-31 2013-01-23 符号化装置および符号化方法、並びに、復号装置および復号方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016141552A Division JP6206559B2 (ja) 2012-01-31 2016-07-19 復号装置、復号方法、プログラム、および記録媒体

Publications (2)

Publication Number Publication Date
JPWO2013115025A1 true JPWO2013115025A1 (ja) 2015-05-11
JP5975301B2 JP5975301B2 (ja) 2016-08-23

Family

ID=48905067

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013556335A Expired - Fee Related JP5975301B2 (ja) 2012-01-31 2013-01-23 符号化装置、符号化方法、プログラム、および記録媒体
JP2016141552A Expired - Fee Related JP6206559B2 (ja) 2012-01-31 2016-07-19 復号装置、復号方法、プログラム、および記録媒体

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2016141552A Expired - Fee Related JP6206559B2 (ja) 2012-01-31 2016-07-19 復号装置、復号方法、プログラム、および記録媒体

Country Status (13)

Country Link
US (2) US10085007B2 (ja)
EP (1) EP2811741A4 (ja)
JP (2) JP5975301B2 (ja)
KR (1) KR20140123051A (ja)
CN (2) CN104683813B (ja)
AU (1) AU2013216395A1 (ja)
BR (1) BR112014018291A8 (ja)
CA (1) CA2860750A1 (ja)
MX (1) MX2014008979A (ja)
PH (1) PH12014501683A1 (ja)
RU (1) RU2014130727A (ja)
TW (1) TW201342884A (ja)
WO (1) WO2013115025A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9479775B2 (en) 2012-02-01 2016-10-25 Nokia Technologies Oy Method and apparatus for video coding

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013198059A (ja) * 2012-03-22 2013-09-30 Sharp Corp 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム
WO2015053593A1 (ko) * 2013-10-12 2015-04-16 삼성전자 주식회사 부가 영상을 부호화하기 위한 스케일러블 비디오 부호화 방법 및 장치, 부가 영상을 복호화하기 위한 스케일러블 비디오 복호화 방법 및 장치
WO2015057038A1 (ko) * 2013-10-18 2015-04-23 엘지전자 주식회사 멀티-뷰 비디오의 디코딩 방법 및 장치
CN108616748A (zh) * 2017-01-06 2018-10-02 科通环宇(北京)科技有限公司 一种码流及其封装方法、解码方法及装置
US11348265B1 (en) 2017-09-15 2022-05-31 Snap Inc. Computing a point cloud from stitched images
CN112544084B (zh) * 2018-05-15 2024-03-01 夏普株式会社 图像编码装置、编码流提取装置以及图像解码装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008518516A (ja) * 2004-10-21 2008-05-29 ソニー エレクトロニクス インコーポレーテッド 先進のビデオコーデックファイルフォーマットにおけるFRExt(FIDELITYRANGEEXTENSIONS)のサポート
JP2009531966A (ja) * 2006-03-29 2009-09-03 トムソン ライセンシング マルチビュービデオ符号化方法および装置
JP2010522494A (ja) * 2007-03-23 2010-07-01 エルジー エレクトロニクス インコーポレイティド ビデオ信号のデコーディング/エンコーディング方法及び装置
JP2010157824A (ja) * 2008-12-26 2010-07-15 Victor Co Of Japan Ltd 画像符号化装置、画像符号化方法およびそのプログラム
JP2010525724A (ja) * 2007-04-25 2010-07-22 エルジー エレクトロニクス インコーポレイティド ビデオ信号をデコーディング/エンコーディングする方法および装置
JP2011244481A (ja) * 2002-04-25 2011-12-01 Sharp Corp 画像データ復号装置および画像データ復号方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101416149A (zh) 2004-10-21 2009-04-22 索尼电子有限公司 以高级视频编解码器文件格式支持保真度范围扩展
US20070098083A1 (en) 2005-10-20 2007-05-03 Visharam Mohammed Z Supporting fidelity range extensions in advanced video codec file format
KR101244911B1 (ko) * 2005-10-11 2013-03-18 삼성전자주식회사 카메라 파라미터를 이용한 다시점 동영상 부호화 및 복호화장치 및 방법과 이를 수행하기 위한 프로그램이 기록된기록매체
CN101669367A (zh) 2007-03-02 2010-03-10 Lg电子株式会社 用于解码/编码视频信号的方法及设备
CN102265617A (zh) * 2008-12-26 2011-11-30 日本胜利株式会社 图像编码装置、图像编码方法及其程序、以及图像解码装置、图像解码方法及其程序
JP2010157826A (ja) * 2008-12-26 2010-07-15 Victor Co Of Japan Ltd 画像復号装置、画像符復号方法およびそのプログラム
KR101619450B1 (ko) * 2009-01-12 2016-05-10 엘지전자 주식회사 뎁스 정보를 이용한 비디오 신호 처리 방법 및 장치
US8457155B2 (en) * 2009-09-11 2013-06-04 Nokia Corporation Encoding and decoding a multi-view video signal
US20140321546A1 (en) * 2011-08-31 2014-10-30 Sony Corporation Image processing apparatus and image processing method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011244481A (ja) * 2002-04-25 2011-12-01 Sharp Corp 画像データ復号装置および画像データ復号方法
JP2008518516A (ja) * 2004-10-21 2008-05-29 ソニー エレクトロニクス インコーポレーテッド 先進のビデオコーデックファイルフォーマットにおけるFRExt(FIDELITYRANGEEXTENSIONS)のサポート
JP2009531966A (ja) * 2006-03-29 2009-09-03 トムソン ライセンシング マルチビュービデオ符号化方法および装置
JP2010522494A (ja) * 2007-03-23 2010-07-01 エルジー エレクトロニクス インコーポレイティド ビデオ信号のデコーディング/エンコーディング方法及び装置
JP2010525724A (ja) * 2007-04-25 2010-07-22 エルジー エレクトロニクス インコーポレイティド ビデオ信号をデコーディング/エンコーディングする方法および装置
JP2010157824A (ja) * 2008-12-26 2010-07-15 Victor Co Of Japan Ltd 画像符号化装置、画像符号化方法およびそのプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9479775B2 (en) 2012-02-01 2016-10-25 Nokia Technologies Oy Method and apparatus for video coding
US10397610B2 (en) 2012-02-01 2019-08-27 Nokia Technologies Oy Method and apparatus for video coding

Also Published As

Publication number Publication date
BR112014018291A8 (pt) 2017-07-11
CA2860750A1 (en) 2013-08-08
WO2013115025A1 (ja) 2013-08-08
BR112014018291A2 (ja) 2017-06-20
CN104067615A (zh) 2014-09-24
JP2016195456A (ja) 2016-11-17
US10205927B2 (en) 2019-02-12
TW201342884A (zh) 2013-10-16
US10085007B2 (en) 2018-09-25
CN104067615B (zh) 2017-10-24
AU2013216395A1 (en) 2014-07-10
US20180343437A1 (en) 2018-11-29
CN104683813B (zh) 2017-10-10
JP5975301B2 (ja) 2016-08-23
KR20140123051A (ko) 2014-10-21
US20150042753A1 (en) 2015-02-12
RU2014130727A (ru) 2016-02-10
PH12014501683A1 (en) 2014-11-10
EP2811741A4 (en) 2015-06-24
MX2014008979A (es) 2014-08-27
EP2811741A1 (en) 2014-12-10
CN104683813A (zh) 2015-06-03
JP6206559B2 (ja) 2017-10-04

Similar Documents

Publication Publication Date Title
JP6365635B2 (ja) 画像処理装置および画像処理方法
JP6206559B2 (ja) 復号装置、復号方法、プログラム、および記録媒体
WO2012128069A1 (ja) 画像処理装置および画像処理方法
US9235749B2 (en) Image processing device and image processing method
WO2012111756A1 (ja) 画像処理装置および画像処理方法
WO2012111757A1 (ja) 画像処理装置および画像処理方法
US9338430B2 (en) Encoding device, encoding method, decoding device, and decoding method
WO2012111755A1 (ja) 画像処理装置および画像処理方法
US9762884B2 (en) Encoding device, encoding method, decoding device, and decoding method for encoding multiple viewpoints for compatibility with existing mode allowing fewer viewpoints
US9900595B2 (en) Encoding device, encoding method, decoding device, and decoding method

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160520

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160623

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160706

R151 Written notification of patent or utility model registration

Ref document number: 5975301

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees