JPWO2012029886A1 - 符号化装置および符号化方法、並びに復号装置および復号方法 - Google Patents

符号化装置および符号化方法、並びに復号装置および復号方法 Download PDF

Info

Publication number
JPWO2012029886A1
JPWO2012029886A1 JP2012531953A JP2012531953A JPWO2012029886A1 JP WO2012029886 A1 JPWO2012029886 A1 JP WO2012029886A1 JP 2012531953 A JP2012531953 A JP 2012531953A JP 2012531953 A JP2012531953 A JP 2012531953A JP WO2012029886 A1 JPWO2012029886 A1 JP WO2012029886A1
Authority
JP
Japan
Prior art keywords
image
auxiliary
unit
parallax
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2012531953A
Other languages
English (en)
Inventor
しのぶ 服部
しのぶ 服部
良知 高橋
良知 高橋
潤 米満
潤 米満
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2012029886A1 publication Critical patent/JPWO2012029886A1/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/194Transmission of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

本技術は、多視点の画像に対して符号化を行う場合において、互換性を確保する際に用いる視点の画像の画質を劣化させずに情報量を抑制することができるようにする符号化装置および符号化方法、並びに復号装置および復号方法に関する。互換用エンコーダは、互換画像である画像A1を符号化して互換ストリームを生成する。画像変換部は、補助画像である画像B1と画像C1を低解像度化する。補助用エンコーダは、低解像度化された補助画像を符号化して、補助画像の符号化ストリームを生成する。多重化部は、互換ストリームと補助画像の符号化ストリームを伝送する。本技術は、例えば、多視点方式の3D画像を符号化する符号化装置に適用することができる。

Description

本技術は、符号化装置および符号化方法、並びに復号装置および復号方法に関し、特に、多視点の画像に対して符号化を行う場合において、互換性を確保する際に用いる視点の画像の画質を劣化させずに情報量を抑制することができるようにした符号化装置および符号化方法、並びに復号装置および復号方法に関する。
現在、3D画像の視聴方式としては、2視点の画像のうちの一方の画像の表示時に左目用のシャッタが開き、他方の画像の表示時に右目用のシャッタが開くメガネを装着して、交互に表示される2視点の画像を見る方式(以下、2視点方式という)が一般的である。
しかしながら、このような2視点方式では、視聴者は、3D画像の表示装置とは別にメガネを購入する必要があり、視聴者の購買意欲は低下する。また、視聴者は、視聴時にメガネを装着する必要があるため、煩わしい。従って、メガネを装着せずに3D画像を視聴可能な視聴方式(以下、多視点方式という)の需要が高まっている。
多視点方式では、多視点の画像が、視点ごとに視認可能な角度が異なるように表示され、視聴者が、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
多視点方式の視聴を提供する表示装置は、例えば、2視点方式用の2視点の画像から多視点方式用の多視点の画像を生成し、表示する。具体的には、表示装置は、画像の視差推定技術(Depth Estimation)を用いて、2視点方式用の2視点の画像の視差(depth)を求める。そして、表示装置は、2視点の画像の視差を利用した多視点画像の生成技術(View Generation)および合成技術(View Synthesis)を用いて、2視点方式用の2視点の画像に対応する視点に隣接する多視点の画像の合成画像を生成し、表示する。
ところで、既存の符号化方式としては、AVC(Advanced Video Coding)やMVC(Multiview Video Coding)方式がある。
図1は、2D画像をAVC方式で符号化し、復号する画像処理システムの一例を示す図である。
図1の画像処理システム10は、撮影部11、AVCエンコーダ12、およびAVCデコーダ13により構成される。
画像処理システム10の撮影部11は、所定の視点の画像Aを撮影し、AVCエンコーダ12に供給する。AVCエンコーダ12は、撮影部11から供給される画像AをAVC方式で符号化し、AVCデコーダ13に供給する。AVCデコーダ13は、AVCエンコーダ12から供給される符号化後の画像Aを、AVC方式に対応する方式で復号する。AVCデコーダ13は、復号の結果得られる画像Aを出力して表示させる。これにより、視聴者は、2D画像を見ることができる。
図2は、2視点の画像をAVC方式で符号化し、復号する画像処理システムの一例を示す図である。
図2の画像処理システム20は、撮影部21A、撮影部21B、AVCエンコーダ22、およびAVCデコーダ23により構成される。
撮影部21Aは、所定の視点の画像Aを撮影して解像度を半分にし、画面の左半分の画像としてAVCエンコーダ22に供給する。また、撮影部21Bは、画像Aとは異なる視点の画像Bを撮影して解像度を半分にし、画面の右半分の画像としてAVCエンコーダ22に供給する。AVCエンコーダ22は、左半分が、解像度が半分にされた画像A(以下、1/2解像度画像Aという)からなり、右半分が、解像度が半分にされた画像B(以下、1/2解像度画像Bという)からなる画像を、AVC方式で符号化し、AVCデコーダ23に供給する。
AVCデコーダ23は、AVCエンコーダ22から供給される符号化後の画像を、AVC方式に対応する方式で復号する。AVCデコーダ23は、復号の結果得られる画像を出力し、1/2解像度画像Aと1/2解像度画像Bを交互に表示させる。このとき、視聴者は、例えば1/2解像度画像Aの表示時に左目用のシャッタが開き、1/2解像度画像Bの表示時に右目用のシャッタが開くメガネを装着し、1/2解像度画像Aを左目だけで見て、1/2解像度画像Bを右目だけで見る。これにより、視聴者は、3D画像を見ることができる。
図3は、2視点の画像をMVC方式で符号化し、復号する画像処理システムの一例を示す図である。
図3の画像処理システム30は、撮影部31A、撮影部31B、MVCエンコーダ32、およびMVCデコーダ33により構成される。
撮影部31Aは、所定の視点の画像Aを撮影してMVCエンコーダ32に供給する。また、撮影部31Bは、画像Aとは異なる視点の画像Bを撮影してMVCエンコーダ32に供給する。MVCエンコーダ32は、撮影部31Aから供給される画像Aをベース画像としてAVC方式で符号化し、撮影部31Bから供給される画像Bをディペンデント画像としてMVC方式で符号化する。MVCエンコーダ32は、符号化後の画像Aおよび画像BをMVCデコーダ33に供給する。
MVCデコーダ33は、MVCエンコーダ32から供給される符号化後の画像Aおよび画像Bを、MVC方式に対応する方式で復号する。MVCデコーダ33は、復号の結果得られる画像Aと画像Bを出力して交互に表示させる。このとき、視聴者は、例えば画像Aの表示時に左目のシャッタが開き、画像Bの表示時に右目のシャッタが開くメガネを装着し、画像Aを左目だけで見て、画像Bを右目だけで見る。これにより、視聴者は、3D画像を見ることができる。
図4は、2視点の画像をMVC方式で符号化し、復号して多視点の画像を生成する画像処理システムの一例を示す図である。
図4の画像処理システム40は、撮影部31A、撮影部31B、MVCエンコーダ32、MVCデコーダ33、視差検出部41、および画像生成部42により構成される。なお、図4において、図3と同一のものには同一の符号を付してあり、説明は適宜省略する。
画像処理システム40の視差検出部41には、MVCデコーダ33による復号の結果得られる画像Aおよび画像Bが供給される。視差検出部41は、その画像Aおよび画像Bを用いて、画像Aおよび画像Bの各画素の視差を検出する。そして、視差検出部41は、画像Aの各画素の視差を表す視差画像A’と、画像Bの各画素の視差を表す視差画像B’を生成し、画像生成部42に供給する。画像生成部42は、MVCデコーダ33による復号の結果得られる画像Aおよび画像B、並びに、画像生成部42から供給される視差画像A’および視差画像B’を用いて、図示せぬ表示装置に対応する視点数の多視点の画像を生成する。そして、画像生成部42は、生成された各視点の画像の解像度を1/視点数の解像度に変換して合成し、出力して表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
一方、多視点の画像を符号化する方式も考案されている(例えば、特許文献1参照)。
特開2008−182669号公報
しかしながら、多視点の画像を符号化する方式であって、互換性を確保する際に用いる視点の画像(例えば、1視点の画像または2視点の画像)の画質を劣化させずに情報量を抑制する方式はなかった。
本技術は、このような状況に鑑みてなされたものであり、多視点の画像に対して符号化を行う場合において、互換性を確保する際に用いる視点の画像の画質を劣化させずに情報量を抑制することができるようにするものである。
本技術の第1の側面の符号化装置は、多視点の画像から互換画像を指定し、指定した前記互換画像を符号化して第1の符号化ストリームを生成する互換画像符号化部と、前記互換画像から多視点画像を生成する際に用いる補助画像を低解像度化する画像変換部と、前記画像変換部により低解像度化された前記補助画像を符号化して、第2の符号化ストリームを生成する補助画像符号化部と、前記互換画像符号化部により生成された前記第1の符号化ストリームと、前記補助画像符号化部により生成された前記第2の符号化ストリームとを伝送する伝送部とを備える符号化装置である。
本技術の第1の側面の符号化方法は、本技術の第1の側面の符号化装置に対応する。
本技術の第1の側面においては、多視点の画像から互換画像が指定され、指定された前記互換画像が符号化されて第1の符号化ストリームが生成され、前記互換画像から多視点画像を生成する際に用いる補助画像が低解像度化され、低解像度化された前記補助画像が符号化されて、第2の符号化ストリームが生成され、前記第1の符号化ストリームと前記第2の符号化ストリームとが伝送される。
本技術の第2の側面の復号装置は、多視点の画像から指定された互換画像が符号化された結果得られる第1の符号化ストリームと、前記互換画像から多視点画像を生成する際に用いる補助画像が低解像度化され、符号化された結果得られる第2の符号化ストリームとを受け取る受け取り部と、前記受け取り部により受け取られた前記第1の符号化ストリームを復号する互換画像復号部と、前記受け取り部により受け取られた前記第2の符号化ストリームを復号する補助画像復号部と、前記補助画像復号部による復号の結果得られる低解像度化された前記補助画像を高解像度化する画像変換部とを備える復号装置である。
本技術の第2の側面の復号方法は、本技術の第2の側面の復号装置に対応する。
本技術の第2の側面においては、多視点の画像から指定された互換画像が符号化された結果得られる第1の符号化ストリームと、前記互換画像から多視点画像を生成する際に用いる補助画像が低解像度化され、符号化された結果得られる第2の符号化ストリームとが受け取られ、前記第1の符号化ストリームが復号され、前記第2の符号化ストリームが復号され、復号の結果得られる低解像度化された前記補助画像が高解像度化される。
なお、第1の側面の符号化装置および第2の側面の復号装置は、コンピュータにプログラムを実行させることにより実現することができる。
また、第1の側面の符号化装置および第2の側面の復号装置を実現するために、コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。
本技術の第1の側面によれば、多視点の画像に対して符号化を行う場合において、互換性を確保する際に用いる視点の画像の画質を劣化させずに情報量を抑制することができる。
また、本技術の第2の側面によれば、互換性を確保する際に用いる視点の画像の画質を劣化させずに情報量を抑制するように符号化された多視点の画像を復号することができる。
2D画像をAVC方式で符号化し、復号する画像処理システムの一例を示す図である。 2視点の画像をAVC方式で符号化し、復号する画像処理システムの一例を示す図である。 2視点の画像をMVC方式で符号化し、復号する画像処理システムの一例を示す図である。 2視点の画像をMVC方式で符号化し、復号して多視点の画像を生成する画像処理システムの一例を示す図である。 本技術を適用した符号化装置の第1実施の形態の構成例を示すブロック図である。 互換情報と視差画像情報の記述例を示す図である。 互換情報の詳細記述例を示す図である。 視差画像情報の詳細記述例を示す図である。 視点間距離情報の記述例を示す図である。 図5の符号化装置による符号化処理を説明するフローチャートである。 図5の符号化装置による符号化処理を説明するフローチャートである。 図5の符号化装置に対応する復号装置の構成例を示す図である。 図12の復号装置による復号処理を説明するフローチャートである。 本技術を適用した符号化装置の第2実施の形態の構成例を示すブロック図である。 図14の符号化装置による符号化処理を説明するフローチャートである。 図14の符号化装置による符号化処理を説明するフローチャートである。 図14の符号化装置に対応する復号装置の構成例を示す図である。 図17の復号装置による復号処理を説明するフローチャートである。 本技術を適用した符号化装置の第3実施の形態の構成例を示すブロック図である。 図19の符号化装置による符号化処理を説明するフローチャートである。 図19の符号化装置による符号化処理を説明するフローチャートである。 図19の符号化装置に対応する復号装置の構成例を示す図である。 図22の復号装置による復号処理を説明するフローチャートである。 互換情報および視差画像情報の他の記述例を示す図である。 互換情報の他の詳細記述例を示す図である。 視差画像情報の他の詳細記述例を示す図である。 視点間距離情報の他の記述例を示す図である。 本技術を適用した符号化装置の第4実施の形態の構成例を示すブロック図である。 視差画像情報のさらに他の記述例を示す図である。 図28の符号化装置による符号化処理を説明するフローチャートである。 図28の符号化装置による符号化処理を説明するフローチャートである。 図28の符号化装置に対応する復号装置の構成例を示す図である。 図32の復号装置による復号処理を説明するフローチャートである。 視差画像情報のさらに他の記述例を示す図である。 本技術を適用した符号化装置の第5実施の形態の構成例を示すブロック図である。 視差画像情報の詳細記述例を示す図である。 視差画像情報の詳細記述例を示す図である。 図35の符号化装置による符号化処理を説明するフローチャートである。 図35の符号化装置による符号化処理を説明するフローチャートである。 図35の符号化装置に対応する復号装置の構成例を示す図である。 図40の復号装置による復号処理を説明するフローチャートである。 本技術を適用した符号化装置の第6実施の形態の構成例を示すブロック図である。 図42の符号化装置による符号化処理を説明するフローチャートである。 図42の符号化装置による符号化処理を説明するフローチャートである。 図42の符号化装置に対応する復号装置の構成例を示す図である。 図45の復号装置による復号処理を説明するフローチャートである。 符号化対象の多重化パターンの例を示す図である。 多重化による効果の特徴を示す図である。 符号化対象の多重化パターンの他の例を示す図である。 符号化対象の多重化パターンのさらに他の例を示す図である。 本技術を適用した符号化装置の第7実施の形態の構成例を示すブロック図である。 図51の符号化装置による符号化処理を説明するフローチャートである。 図51の符号化装置による符号化処理を説明するフローチャートである。 図51の符号化装置に対応する復号装置の構成例を示す図である。 図54の復号装置による復号処理を説明するフローチャートである。 ビットストリームの構成例を示す図である。 図56の視差画像用の3DV方式のSubset SPSの記述例を示す図である。 図57の視差画像用拡張情報の記述例を示す図である。 図57の視差画像用VUI拡張情報の記述例を示す図である。 3DV方式の符号化データのNALヘッダの記述例を示す図である。 図60の視差画像用ヘッダ拡張情報の記述例を示す図である。 図56の3DV方式のSEIの記述例を示す図である。 ビットストリームの他の構成例を示す図である。 図63の画像用の3DV方式のSubset SPSの記述例を示す図である。 3DV方式がHEVC方式に準じた方式である場合のビットストリームの構成例を示す図である。 図65のSPSの記述例を示す図である。 図66のSubset SPSの記述例を示す図である。 図67のSubset SPSのVUI情報の記述例を示す図である。 図65の3DV方式のSEIの記述例を示す図である。 コンピュータの一実施の形態の構成例を示す図である。 本技術を適用したテレビジョン装置の概略構成を示す図である。 本技術を適用した携帯電話機の概略構成を示す図である。 本技術を適用した記録再生装置の概略構成を示す図である。 本技術を適用した撮像装置の概略構成を示す図である。
<第1実施の形態>
[符号化装置の第1実施の形態の構成例]
図5は、本技術を適用した符号化装置の第1実施の形態の構成例を示すブロック図である。
図5の符号化装置50は、撮影部51A乃至51C、画像変換部52、視差画像生成部53、画像情報生成部54、互換情報生成部55、視点間距離情報生成部56、視差画像情報生成部57、エンコーダ58、および多重化部59により構成される。
符号化装置50は、多視点の画像のうちの1視点の画像を2D画像として既存の符号化方式で符号化することにより、既存の2D画像を符号化する符号化装置との互換性を確保する。
なお、以下では、多視点の画像のうちの、既存の符号化装置との互換性を確保するために既存の符号化方式で符号化される画像を互換画像といい、互換画像を用いて互換画像の視点数より多い視点の画像を生成するための画像を補助画像という。
符号化装置50において、撮影部51Aは、所定の視点のHD(High Definition)画像を画像A1として撮影し、画像変換部52、視差画像生成部53、および視点間距離情報生成部56に供給する。撮影部51Bは、撮影部51Aから距離Δd1ABだけ水平方向に離れた位置で、画像A1とは異なる視点のHD画像を画像B1として撮影し、画像変換部52、視差画像生成部53、および視点間距離情報生成部56に供給する。撮影部51Cは、撮影部51Aから距離Δd1ACだけ撮影部51Bとは反対の水平方向に離れた位置で、画像A1および画像B1とは異なる視点のHD画像を画像C1として撮影し、画像変換部52、視差画像生成部53、および視点間距離情報生成部56に供給する。
なお、画像B1と画像C1に対応する視点は、3D画像として知覚可能な画像の視点のうち、より外側の視点である。これにより、符号化装置50に対応する復号装置は、画像A1乃至画像C1を用いて、画像B1および画像C1の視点より内側の視点の画像を補間することで、多視点の画像を生成することができる。その結果、内側の視点の画像を用いて外側の視点の画像を補間する場合に比べて、多視点の画像を高精度に生成することができる。距離Δd1ABと距離Δd1ACは、固定であってもよいし、時間ごとに変化するようにしてもよい。
画像変換部52は、撮影部51A乃至撮影部51Cのうちの水平方向の位置が内側にある撮影部51Aから供給される画像A1を互換画像に決定する。画像変換部52は、互換画像として画像A1を指定する情報を互換情報生成部55に供給する。そして、画像変換部52は、互換画像である画像A1をそのままエンコーダ58に供給する。
また、画像変換部52は、画像A1以外の画像B1および画像C1を補助画像とし、所定の多重化方式で多重化する。具体的には、例えば多重化方式がサイドバイサイド方式である場合、画像変換部52(画像変換部)は、画像B1および画像C1の解像度を半分にする。そして、画像変換部52(多重化部)は、解像度が半分にされた画像B1(以下、1/2解像度画像B1という)が画面の左半分の画像となり、解像度が半分にされた画像C1(以下、1/2解像度画像C1という)が画面の右半分の画像となるように、1/2解像度画像B1および1/2解像度画像C1を多重化する。画像変換部52は、多重化の結果得られる多重化画像をエンコーダ58に供給し、補助画像の多重化方式を示す情報を画像情報生成部54に供給する。
視差画像生成部53は、撮影部51A乃至撮影部51Cから供給される画像A1乃至画像C1を用いて、画像A1乃至画像C1の各画素の視差を検出する。視差画像生成部53は、互換画像である画像A1の各画素の視差を表す視差画像A1’を生成し、そのままエンコーダ58に供給する。また、視差画像生成部53(多重化部)は、補助画像である画像B1の各画素の視差を表す視差画像B1’と、補助画像である画像C1の各画素の視差を表す視差画像C1’を生成し、所定の多重化方式で多重化する。視差画像生成部53は、その結果得られる多重化画像をエンコーダ58に供給する。視差画像生成部53は、補助画像の視差画像の多重化方式を示す情報を視差画像情報生成部57に供給する。
画像情報生成部54は、画像変換部52から供給される情報に基づいて、補助画像の多重化方式を示す情報などを、互換画像および補助画像に関する情報である画像情報として生成し、エンコーダ58に供給する。
互換情報生成部55は、画像変換部52から供給される情報に基づいて、互換画像を指定する情報、互換モードなどを、互換に関する情報である互換情報として生成し、エンコーダ58に供給する。
なお、互換モードとは、互換画像の符号化方法を表すモードである。互換モードとしては、例えば、1視点の互換画像をAVC方式で符号化する符号化方法を表すモノモード(mono)、2視点の互換画像を多重化し、AVC方式で符号化する符号化方法を表すフレームパッキングモード(frame packing)、2視点の互換画像をMVC方式で符号化する符号化方法を表すステレオモード(stereo)などがある。
視点間距離情報生成部56は、撮影部51A乃至撮影部51Cから供給される画像A1乃至画像C1を用いて、画像A1乃至画像C1のうちの2枚の画像の視点間の距離(以下、視点間距離という)を検出する。例えば、視点間距離情報生成部56は、撮影部51Aと撮影部51Bの間の水平方向の距離Δd1AB、および、撮影部51Aと撮影部51Cの間の水平方向の距離Δd1ACを視点間距離として検出する。視点間距離情報生成部56は、視点間距離を表す情報などを、視点間距離に関する情報である視点間距離情報として生成し、エンコーダ58に供給する。
視差画像情報生成部57は、視差画像生成部53から供給される情報に基づいて、補助画像の視差画像の多重化方式を示す情報などを、視差画像に関する情報である視差画像情報として生成し、エンコーダ58に供給する。
エンコーダ58は、互換用エンコーダ61と補助用エンコーダ62により構成される。互換用エンコーダ61(互換画像符号化部)は、画像変換部52から供給される互換画像と補助画像の多重化画像から互換画像である画像A1を指定し、画像A1を既存のAVC方式で符号化して各種の情報を付加し、その結果得られる符号化ストリームを互換ストリーム(第1の符号化ストリーム)として多重化部59に供給する。
補助用エンコーダ62(補助画像符号化部、視差画像符号化部)は、画像変換部52からの補助画像の多重化画像、並びに視差画像生成部53からの互換画像の視差画像A1’および補助画像の視差画像の多重化画像を所定の方式で符号化する。なお、補助用エンコーダ62における符号化方式としては、AVC方式、MVC方式、MPEG2(Moving Picture Experts Group phase 2)方式などを用いることができる。
また、補助用エンコーダ62は、符号化の結果得られる符号化画像(第2のストリーム、視差符号化ストリーム)に、画像情報生成部54からの画像情報、互換情報生成部55からの互換情報、視点間距離情報生成部56からの視点間距離情報、および視差画像情報生成部57からの視差画像情報などを付加して、符号化ストリームを生成する。補助用エンコーダ62は、その符号化ストリームを補助ストリームとして多重化部59に供給する。
多重化部59は、互換用エンコーダ61から供給される互換ストリームと補助用エンコーダ62から供給される補助ストリームから、それぞれTS(Transport Stream)を生成し、多重化する。多重化部59(伝送部)は、多重化の結果得られる多重化ストリームを送信する。
[補助ストリーム内の情報の記述例]
図6乃至図8は、符号化方式としてAVC方式またはMVC方式が用いられた場合の補助ストリーム内の互換情報と視差画像情報の記述例を示す図である。
図6に示すように、互換情報(3DV_view_structure)と視差画像情報(depth_map_structure)は、補助ストリーム内のSEI(Supplemental Enhancement Information)に配置される。
互換情報(3DV_view_structure)としては、図7に示すように、符号化の対象となる画像の視点(view)の数(num_of_views)、互換モード(compatible mode)、互換画像を指定する情報(compatible_view)などが記述される。
また、視差画像情報(depth_map_structure)としては、図8に示すように、視差画像(depth map)の数(num_of_depth_map)、視差画像が多重化されているかどうかを表すフラグ(is_frame_packing)、視差画像の多重化方式(frame_packing_mode)、多重化されている視差画像を指定する情報(comb_frame_packing_views)などが記述される。多重化方式としては、サイドバイサイド方式(SBS)、トップアンドボトム方式(TOB)などがある。トップアンドボトム方式とは、多重化される2枚の画像のうちの一方の画像が画面の上半分の画像とされ、他方の画像が画面の下半分の画像とされる方式である。
なお、画像情報は、視差画像ではなく、互換画像および補助画像についての情報であること以外視差画像情報と同様であるので、図示は省略する。
図9は、符号化方式としてAVC方式またはMVC方式が用いられた場合の補助ストリーム内の視点間距離情報の記述例を示す図である。
図9に示すように、視点間距離情報(3DV_view_info)は、互換情報、視差画像情報、および画像情報と同様に、補助ストリーム内のSEIに配置される。
視点間距離情報(3DV_view_info)としては、図9に示すように、符号化の対象となる画像の視点の数(num_of_views)、検出された視点間距離の数(num_of_view_distance)、視点間距離に対応する2枚の画像の組み合わせ(view[0,1])、その組み合わせに対応する視点間距離(view_distance[view_distance_id])などが記述される。
[符号化装置の処理の説明]
図10および図11は、図5の符号化装置50による符号化処理を説明するフローチャートである。この符号化処理は、例えば、撮影部51A乃至撮影部51Cから画像A1乃至画像C1が出力されたとき開始される。
図10のステップS11において、視点間距離情報生成部56は、撮影部51A乃至撮影部51Cから供給される画像A1乃至画像C1を用いて、距離Δd1ABと距離Δd1ACを視点間距離として検出する。
ステップS12において、視点間距離情報生成部56は、ステップS11で検出された視点間距離を表す情報などを視点間距離情報として生成し、エンコーダ58に入力する。
ステップS13において、画像変換部52は、撮影部51A乃至撮影部51Cのうちの水平方向の位置が内側にある撮影部51Aから供給される画像A1を互換画像に決定し、補助画像の多重化方式を決定する。画像変換部52は、互換画像として画像A1を指定する情報を互換情報生成部55に供給し、補助画像の多重化方式を画像情報生成部54に供給する。
ステップS14において、互換情報生成部55は、画像変換部52から供給される情報に基づいて、互換画像として画像A1を指定する情報、互換モードとしてのモノモードなどを互換情報として生成し、エンコーダ58に入力する。
ステップS15において、画像情報生成部54は、画像変換部52から供給される情報に基づいて、補助画像の多重化方式を示す情報などを画像情報として生成し、エンコーダ58に入力する。
ステップS16において、画像変換部52は、画像A1以外の画像B1および画像C1を補助画像として、ステップS13で決定された補助画像の多重化方式に基づいて補助画像を多重化し、補助画像の多重化画像を得る。
ステップS17において、画像変換部52は、互換画像である画像A1と補助画像の多重化画像をエンコーダ58に入力する。
図11のステップS18において、視差画像生成部53は、撮影部51A乃至撮影部51Cから供給される画像A1乃至画像C1を用いて画像A1乃至画像C1の各画素の視差を検出し、視差画像A1’乃至視差画像C1’を生成する。
ステップS19において、視差画像生成部53は、補助画像の視差画像の多重化方式を決定し、その多重化方式を示す情報を視差画像情報生成部57に供給する。
ステップS20において、視差画像情報生成部57は、視差画像生成部53から供給される情報に基づいて、補助画像の視差画像の多重化方式を示す情報などを、視差画像情報として生成し、エンコーダ58に入力する。
ステップS21において、視差画像生成部53は、ステップS19で決定された補助画像の視差画像の多重化方式に基づいて、補助画像の視差画像を多重化し、補助画像の視差画像の多重化画像を得る。
ステップS22において、視差画像生成部53は、互換画像の視差画像A1'と補助画像の視差画像の多重化画像をエンコーダ58に入力する。
ステップS23において、エンコーダ58の互換用エンコーダ61は、画像変換部52から供給される互換画像である画像A1を既存のAVC方式で符号化し、その結果得られる符号化ストリームを互換ストリームとして多重化部59に供給する。
ステップS24において、補助用エンコーダ62は、画像変換部52からの補助画像の多重化画像、並びに視差画像生成部53からの互換画像の視差画像A1’および補助画像の視差画像の多重化画像を所定の方式で符号化する。
ステップS25において、補助用エンコーダ62は、ステップS24の処理による符号化の結果得られる符号化画像に、画像情報生成部54からの画像情報、互換情報生成部55からの互換情報、視点間距離情報生成部56からの視点間距離情報、および視差画像情報生成部57からの視差画像情報などを付加して、符号化ストリームを生成する。補助用エンコーダ62は、その符号化ストリームを補助ストリームとして多重化部59に供給する。
ステップS26において、多重化部59は、互換用エンコーダ61から供給される互換ストリームと、補助用エンコーダ62から供給される補助ストリームから、それぞれTSを生成し、多重化して送信する。そして、処理は終了する。
以上のように、符号化装置50は、多視点の画像のうちの1視点の画像を互換画像とし、既存の符号化方式で符号化するので、既存の2D画像を符号化する符号化装置との互換性を確保することができる。即ち、符号化装置50は、多視点の画像に対して、既存の符号化方式との互換性を有する方式で符号化を行うことができる。
また、符号化装置50は、3視点の画像A1乃至C1を符号化するので、符号化装置50に対応する復号装置は、3視点の画像A1乃至C1から多視点の画像を生成することができる。これにより、復号装置は、2視点の画像から生成する場合に比べて、生成可能な画像の視点が限られず、また、より精度の高い多視点の画像を生成することができる。
さらに、符号化装置50は、補助画像の解像度を低解像度化して符号化するので、低解像度化せずに符号化する場合に比べて、符号化処理および復号処理の処理コストを軽減することができる。例えば、2視点の補助画像が低解像度化されずに符号化される場合、符号化処理や復号処理の処理コストは、2枚のHD画像に対する符号化処理や復号処理の処理コストと等価であるが、符号化装置50による2視点の補助画像に対する符号化処理の処理コストは、1枚のHD画像に対する符号化処理や復号処理の処理コストと等価になる。その結果、復号装置における復号処理の性能が多視点の画像の画質に大きな影響を及ぼすことを防止することができる。
なお、符号化装置50に対応する復号装置は、後述するように、多視点の画像を合成する際、その多視点の画像の視点数の逆数倍に解像度を低下させるため、符号化装置50による補助画像の低解像度化は、合成後の多視点の画像の画質に影響を与えない。
また、符号化装置50は、補助画像の解像度を半分にして符号化し、補助画像の視差画像を半分にして符号化するので、符号化対象の情報量は、AVC方式における4HD画像分(1080ix4)程度にすることができる。
ここで、現在の多視点の画像を表示する表示装置と、それに伴う復号装置の処理速度、消費電力に対する処理パフォーマンス、伝送データレート、伝送帯域幅、メモリのバンド幅、メモリのアクセス速度などを総合的に鑑みると、復号装置で処理可能な情報量として妥当な値は、現状のMVC方式におけるHD画像分の2倍程度、即ちAVC方式における4HD画像分程度であると考えられる。従って、符号化対象の情報量がAVC方式における4HD画像分(1080ix4)程度である符号化装置50に対応する復号装置(復号方法)は、妥当な処理コスト、合理的なアプローチで実現することができる。
また、符号化装置50では、符号化対象の情報量がAVC方式における4HD画像分(1080ix4)程度に削減されるので、使用可能な帯域に制限のあるBDや放送のアプリケーションで容易に扱うことができる。
さらに、符号化装置50は、視差画像を生成し、符号化ストリームに含めて送信するので、符号化装置50に対応する復号装置は、多視点の画像を生成するために視差画像を生成する必要がなく、復号装置の処理の負荷を軽減することができる。その結果、復号装置のコストを低減することができる。また、復号装置の視差検出の性能が多視点の画像の画質に大きな影響を及ぼすことを防止することができる。
本技術は、上述したような表示装置や復号装置の状況を鑑みて、妥当な処理コスト・合理的な実現手法を考慮した制約を前提にして、互換情報等の各種の情報を有効活用することにより、既存フォーマットとの互換性を確保しつつ、多視点画像の生成を効率的・高画質に実現することに主眼を置いている。
[復号装置の構成例]
図12は、図5の符号化装置50から送信される多重化ストリームを復号する復号装置の構成例を示す図である。
図12の復号装置120は、分離部121、デコーダ122、画像情報取得部123、視点間距離情報取得部124、視差画像情報取得部125、互換情報取得部126、および画像生成部127により構成される。復号装置120は、符号化装置50から送信される多重化ストリームを復号して、1視点の画像または多視点の画像を生成し、図示せぬ表示装置に表示させる。
具体的には、復号装置120の分離部121(受け取り部)は、符号化装置50から送信されてくる多重化ストリームを受信し、TSごとに分離する。分離部121は、分離されたTSから互換ストリームと補助ストリームを抽出し、デコーダ122に供給する。
デコーダ122は、互換用デコーダ131と補助用デコーダ132により構成される。デコーダ122の互換用デコーダ131(互換画像復号部)は、補助用デコーダ132から供給される互換ストリームを特定するための情報に基づいて、分離部121から供給される互換ストリームと補助ストリームのうち、互換ストリームを識別する。互換用デコーダ131は、互換ストリームに含まれる符号化された互換画像をAVC方式に対応する方式で復号し、その結果得られる画像A1を画像生成部127に供給する。
補助用デコーダ132は、分離部121から供給される補助ストリームに含まれる互換情報に基づいて、互換ストリームを特定するための情報を互換用デコーダ131に供給する。補助用デコーダ132は、互換情報に基づいて、分離部121から供給される互換ストリームと補助ストリームのうち、補助ストリームを識別する。補助用デコーダ132(補助画像復号部)は、分離部121から供給される補助ストリームに含まれる符号化された補助画像の多重化画像、互換画像の視差画像A1’、および補助画像の視差画像の多重化画像を、図5の補助用エンコーダ62に対応する方式で復号する。
補助用デコーダ132は、復号の結果得られる補助画像の多重化画像、互換画像の視差画像A1’、および補助画像の視差画像の多重化画像を画像生成部127に供給する。また、補助用デコーダ132は、補助ストリームに含まれる画像情報を画像情報取得部123に供給し、視点間距離情報を視点間距離情報取得部124に供給する。さらに、補助用デコーダ132は、補助ストリームに含まれる視差画像情報を視差画像情報取得部125に供給し、互換情報を互換情報取得部126に供給する。
画像情報取得部123は、補助用デコーダ132から供給される画像情報を取得し、画像生成部127に供給する。視点間距離情報取得部124は、補助用デコーダ132から供給される視点間距離情報を取得し、画像生成部127に供給する。
視差画像情報取得部125は、補助用デコーダ132から供給される視差画像情報を取得し、画像生成部127に供給する。互換情報取得部126は、補助用デコーダ132から供給される互換情報を取得し、画像生成部127に供給する。
画像生成部127は、視聴者からの表示指令に応じて、画像を出力し、図示せぬ表示装置に表示させる。具体的には、画像生成部127は、視聴者からの多視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報、視点間距離情報取得部124からの視点間距離情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像、補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像を用いて、図示せぬ表示装置に対応する3以上の視点数の、互換画像や補助画像の解像度の半分の解像度の画像を生成する。
より詳細には、画像生成部127(分離部)は、視差画像情報取得部125からの視差画像情報に含まれる補助画像の視差画像の多重化方式を示す情報に基づいて、補助画像の視差画像の多重化画像から、各補助画像の視差画像を分離する。また、画像生成部127は、画像情報取得部123からの画像情報に含まれる補助画像の多重化方式を示す情報に基づいて、補助画像の多重化画像から、各補助画像を分離する。
さらに、画像生成部127は、視点間距離情報と図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。そして、画像生成部127は、互換画像、各補助画像、互換画像の視差画像、および各補助画像の視差画像を用いて、位置が決定された各視点の画像を生成する。そして、画像生成部127は、生成された各視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
また、画像生成部127は、視聴者からの2D画像の表示指令に応じて、デコーダ122の互換用デコーダ131から供給される互換画像である画像A1を出力して、図示せぬ表示装置に表示させる。これにより、視聴者は、2D画像を見ることができる。
[復号装置の処理の説明]
図13は、図12の復号装置120による復号処理を説明するフローチャートである。この復号処理は、例えば、図5の符号化装置50から送信される多重化ストリームが復号装置120に入力されたとき、開始される。
図13のステップS31において、復号装置120の分離部121は、符号化装置50から送信されてくる多重化ストリームを受信し、TSごとに分離する。分離部121は、分離されたTSから互換ストリームと補助ストリームを抽出し、デコーダ122に供給する。デコーダ122の補助用デコーダ132は、分離部121から供給される補助ストリームに含まれる互換情報に基づいて、互換ストリームを特定するための情報を互換用デコーダ131に供給する。
ステップS32において、互換用デコーダ131は、補助用デコーダ132から供給される互換ストリームを特定するための情報に基づいて、分離部121から供給される互換ストリームと補助ストリームのうち、互換ストリームを識別する。
ステップS33において、互換用デコーダ131は、互換ストリームに含まれる互換画像をAVC方式に対応する方式で復号し、その結果得られる画像A1を画像生成部127に供給する。
ステップS34において、画像生成部127は、視聴者から2D画像の表示が指令されたかどうかを判定する。ステップS34で視聴者から2D画像の表示が指令されていないと判定された場合、即ち視聴者から多視点方式の3D画像の表示が指令された場合、補助用デコーダ132は、互換情報に基づいて、分離部121から供給される互換ストリームと補助ストリームのうちの補助ストリームを識別する。
そして、ステップS35において、補助用デコーダ132は、補助ストリームに含まれる符号化された補助画像の多重化画像、互換画像の視差画像A1’、および補助画像の視差画像の多重化画像を、図5の補助用エンコーダ62に対応する方式で復号する。補助用デコーダ132は、復号の結果得られる補助画像の多重化画像、互換画像の視差画像A1’、および補助画像の視差画像の多重化画像を画像生成部127に供給する。また、補助用デコーダ132は、補助ストリームに含まれる画像情報を画像情報取得部123に供給し、視点間距離情報を視点間距離情報取得部124に供給する。さらに、補助用デコーダ132は、補助ストリームに含まれる視差画像情報を視差画像情報取得部125に供給し、互換情報を互換情報取得部126に供給する。
ステップS36において、画像情報取得部123は、補助用デコーダ132から供給される画像情報を取得し、画像生成部127に入力する。ステップS37において、視点間距離情報取得部124は、補助用デコーダ132から供給される視点間距離情報を取得し、画像生成部127に入力する。
ステップS38において、視差画像情報取得部125は、補助用デコーダ132から供給される視差画像情報を取得し、画像生成部127に入力する。ステップS39において、互換情報取得部126は、補助用デコーダ132から供給される互換情報を取得し、画像生成部127に入力する。
ステップS40において、画像生成部127は、視点間距離情報取得部124からの視点間距離情報と、図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。例えば、視点間距離情報に含まれる視点間距離が狭い場合には、画像生成部127は、画像B1と画像C1の視点より外側の視点の位置も、生成する多視点の3D画像の視点の位置に決定する。一方、視点間距離情報に含まれる視点間距離が広い場合には、画像生成部127は、画像B1と画像C1の視点より内側の視点の位置のみを、生成する多視点の3D画像の視点の位置として決定する。
ステップS41において、画像生成部127は、ステップS40で決定された各視点の位置、画像情報取得部123からの画像情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像、補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像を用いて、各視点の、互換画像や補助画像の半分の解像度の画像を生成する。
ステップS42において、画像生成部127は、ステップS41で生成された各視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換し、変換後の各視点の画像を視点の位置に基づいて合成する。
ステップS43において、画像生成部127は、ステップS42の処理により得られる合成後の多視点の画像を図示せぬ表示装置に出力し、視点ごとに視認可能な角度が異なるように表示させる。そして、処理は終了する。
一方、ステップS34で視聴者から2D画像の表示が指令されたと判定された場合、ステップS44において、画像生成部127は、互換用デコーダ131から供給される互換画像である画像A1を図示せぬ表示装置に出力し、表示させる。そして、処理は終了する。
なお、復号装置120との互換性を有する互換ストリームのみを復号可能な復号装置では、補助ストリームのTSは無視され、ステップS33およびS44の処理のみが行われる。
以上のように、復号装置120は、符号化装置50により既存の方式との互換性を有する方式で符号化された互換ストリームと補助ストリームを復号することができる。
また、復号装置120は、1視点の互換画像と2視点の補助画像を用いて多視点の画像を生成するので、符号化装置50は、多視点の画像を生成するための撮影部として、既存の1視点の互換画像を撮影する撮影部51Aのほかに、2台の撮影部51Bと撮影部51Cのみを用意するだけでよい。従って、多視点の画像を生成するための撮影部の設置を容易に、かつ、低コストで行うことができる。
<第2実施の形態>
[符号化装置の第2実施の形態の構成例]
図14は、本技術を適用した符号化装置の第2実施の形態の構成例を示すブロック図である。
図14に示す構成のうち、図5の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図14の符号化装置140の構成は、主に、撮影部51A乃至撮影部51C、画像変換部52、視差画像生成部53、視点間距離情報生成部56、エンコーダ58の代わりに撮影部141A乃至撮影部141D、画像変換部142、視差画像生成部143、視点間距離情報生成部144、エンコーダ145が設けられている点が図5の構成と異なる。
符号化装置140は、多視点の画像のうちの2視点の画像を互換画像としてAVC方式で符号化を行うことにより、既存の2視点方式の3D画像を符号化する符号化装置との互換性を確保する。
具体的には、符号化装置140の撮影部141Aは、所定の視点のHD画像を画像A2として撮影し、画像変換部142、視差画像生成部143、および視点間距離情報生成部144に供給する。撮影部141Bは、撮影部141Aから距離Δd2ABだけ水平方向に離れた位置で、画像A2とは異なる視点のHD画像を画像B2として撮影し、画像変換部142、視差画像生成部143、および視点間距離情報生成部144に供給する。
撮影部141Cは、撮影部141Bから距離Δd2BCだけ撮影部141Aとは反対の水平方向に離れた位置で、画像A2および画像B2とは異なる視点のHD画像を画像C2として撮影し、画像変換部142、視差画像生成部143、および視点間距離情報生成部144に供給する。撮影部141Dは、撮影部141Aから距離Δd2ADだけ撮影部141Bとは反対の水平方向に離れた位置で、画像A2乃至画像C2とは異なる視点のHD画像を画像D2として撮影し、画像変換部142、視差画像生成部143、および視点間距離情報生成部144に供給する。
なお、画像C2と画像D2に対応する視点は、3D画像として知覚可能な画像の視点のうち、より外側の視点である。これにより、符号化装置140に対応する復号装置は、画像A2乃至画像D2を用いて、画像C2および画像D2の視点より内側の視点の画像を補間することで、多視点の画像を生成することができる。その結果、内側の視点の画像を用いて外側の視点の画像を補間する場合に比べて、多視点の画像を高精度に生成することができる。距離Δd2AB、距離Δd2BC、および距離Δd2ADは、固定であってもよいし、時間ごとに変化するようにしてもよい。
画像変換部142は、撮影部141A乃至撮影部141Dのうちの水平方向の位置が内側にある撮影部141Aから供給される画像A2と撮影部141Bから供給される画像B2を互換画像に決定する。そして、画像変換部142は、互換画像である画像A2および画像B2を所定の多重化方式で多重化し、エンコーダ145に供給する。また、画像変換部142は、互換画像として画像A2および画像B2を指定する情報を互換情報生成部55に供給する。
また、画像変換部142は、画像A2および画像B2以外の画像C2および画像D2を補助画像とし、所定の多重化方式で多重化する。画像変換部142は、多重化の結果得られる多重化画像をエンコーダ145に供給する。画像変換部142は、互換画像と補助画像の多重化方式を示す情報を画像情報生成部54に供給する。
視差画像生成部143は、撮影部141A乃至撮影部141Dから供給される画像A2乃至画像D2を用いて、画像A2乃至画像D2の各画素の視差を検出する。視差画像生成部143は、互換画像である画像A2の各画素の視差を表す視差画像A2’と、画像B2の各画素の視差を表す視差画像B2’を生成し、所定の多重化方式で多重化する。視差画像生成部143は、その結果得られる多重化画像をエンコーダ145に供給する。
また、視差画像生成部143は、補助画像である画像C2の各画素の視差を表す視差画像C2’と、補助画像である画像D2の各画素の視差を表す視差画像D2’を生成し、所定の多重化方式で多重化する。視差画像生成部143は、その結果得られる多重化画像をエンコーダ145に供給する。視差画像生成部143は、互換画像および補助画像の視差画像の多重化方式を示す情報を視差画像情報生成部57に供給する。
視点間距離情報生成部144は、撮影部141A乃至撮影部141Dから供給される画像A2乃至画像D2を用いて、画像A2乃至画像D2の視点間距離を検出する。例えば、視点間距離情報生成部144は、撮影部141Aと撮影部141Bの間の水平方向の距離Δd2AB、撮影部141Bと撮影部141Cの間の水平方向の距離Δd2BC、撮影部141Aと撮影部141Dの間の水平方向の距離Δd2ADを視点間距離として検出する。視点間距離情報生成部144は、視点間距離を表す情報などを視点間距離情報として生成し、エンコーダ145に供給する。
エンコーダ145は、互換用エンコーダ151と補助用エンコーダ152により構成される。互換用エンコーダ151は、画像変換部142から供給される互換画像の多重化画像と補助画像の多重化画像から互換画像の多重化画像を指定し、既存のAVC方式で符号化して各種の情報を付加し、その結果得られる符号化ストリームを互換ストリームとして多重化部59に供給する。
補助用エンコーダ152は、画像変換部142からの補助画像の多重化画像、並びに視差画像生成部143からの互換画像の視差画像の多重化画像および補助画像の視差画像の多重化画像を所定の方式で符号化する。なお、補助用エンコーダ152における符号化方式としては、例えば、AVC方式、MVC方式などを用いることができる。
また、補助用エンコーダ152は、符号化の結果得られる符号化画像に、画像情報生成部54からの画像情報、互換情報生成部55からの互換情報、視点間距離情報生成部144からの視点間距離情報、および視差画像情報生成部57からの視差画像情報などを付加して、符号化ストリームを生成する。補助用エンコーダ152は、その符号化ストリームを補助ストリームとして多重化部59に供給する。
[符号化装置の処理の説明]
図15および図16は、図14の符号化装置140による符号化処理を説明するフローチャートである。この符号化処理は、例えば、撮影部141A乃至撮影部141Dから画像A2乃至画像D2が出力されたとき開始される。
図15のステップS51において、視点間距離情報生成部144は、撮影部141A乃至撮影部141Dから供給される画像A2乃至画像D2を用いて、距離Δd2AB、距離Δd2BC、距離Δd2ADを視点間距離として検出する。
ステップS52において、視点間距離情報生成部144は、ステップS51で検出された視点間距離を表す情報などを視点間距離情報として生成し、エンコーダ145に入力する。
ステップS53において、画像変換部142は、撮影部141A乃至撮影部141Dのうちの水平方向の位置が内側にある撮影部141Aから供給される画像A2と、撮影部141Bから供給される画像B2を互換画像に決定し、互換画像および補助画像の多重化方式を決定する。画像変換部142は、互換画像として画像A2および画像B2を指定する情報を互換情報生成部55に供給し、互換画像および補助画像の多重化方式を画像情報生成部54に供給する。
ステップS54において、互換情報生成部55は、画像変換部142から供給される情報に基づいて、互換画像として画像A2および画像B2を指定する情報、互換モードとしてのフレームパッキングモードなどを互換情報として生成し、エンコーダ145に入力する。
ステップS55において、画像変換部142は、ステップS53で決定された互換画像の多重化方式に基づいて互換画像である画像A2と画像B2を多重化し、エンコーダ145に供給する。
ステップS56において、画像情報生成部54は、画像変換部142から供給される情報に基づいて、互換画像および補助画像の多重化方式を示す情報などを画像情報として生成し、エンコーダ145に入力する。
ステップS57において、画像変換部142は、画像A2および画像B2以外の画像C2および画像D2を補助画像として、ステップS53で決定された補助画像の多重化方式に基づいて補助画像を多重化し、補助画像の多重化画像を得る。
ステップS58において、画像変換部142は、互換画像の多重化画像と補助画像の多重化画像をエンコーダ145に入力する。
図16のステップS59において、視差画像生成部143は、撮影部141A乃至撮影部141Dから供給される画像A2乃至画像D2を用いて画像A2乃至画像D2の各画素の視差を検出し、視差画像A2’乃至視差画像D2’を生成する。
ステップS60において、視差画像生成部143は、互換画像の視差画像と補助画像の視差画像の多重化方式を決定し、その多重化方式を示す情報を視差画像情報生成部57に供給する。
ステップS61において、視差画像情報生成部57は、視差画像生成部143から供給される情報に基づいて、互換画像の視差画像と補助画像の視差画像の多重化方式を示す情報などを、視差画像情報として生成し、エンコーダ145に入力する。
ステップS62において、視差画像生成部143は、ステップS60で決定された互換画像の視差画像の多重化方式に基づいて、互換画像の視差画像A2’と視差画像B2’を多重化し、補助画像の視差画像の多重化方式に基づいて補助画像の視差画像C2’と視差画像D2’を多重化する。
ステップS63において、視差画像生成部143は、ステップS62の多重化の結果得られる互換画像の視差画像の多重化画像と補助画像の視差画像の多重化画像をエンコーダ145に入力する。
ステップS64において、エンコーダ145の互換用エンコーダ151は、画像変換部142から供給される互換画像の多重化画像を既存のAVC方式で符号化し、その結果得られる符号化ストリームを互換ストリームとして多重化部59に供給する。
ステップS65において、補助用エンコーダ152は、画像変換部142からの補助画像の多重化画像、並びに、視差画像生成部53からの互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を所定の方式で符号化する。そして、処理はステップS66に進む。
ステップS66およびS67の処理は、図11のステップS25およびS26の処理と同様であるので、説明は省略する。
以上のように、符号化装置140は、多視点の画像のうちの2視点の画像を互換画像とし、既存の符号化方式で符号化するので、既存の2視点方式の3D画像を符号化する符号化装置との互換性を確保することができる。
また、符号化装置140は、4視点の画像A2乃至D2を符号化するので、符号化装置140に対応する復号装置は、4視点の画像A2乃至D2から多視点の画像を生成することができる。これにより、復号装置は、2視点の画像から生成する場合に比べて、生成可能な画像の視点が限られず、また、より精度の高い多視点の画像を生成することができる。
[復号装置の構成例]
図17は、図14の符号化装置140から送信される多重化ストリームを復号する復号装置の構成例を示す図である。
図17に示す構成のうち、図12の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図17の復号装置170の構成は、主に、画像生成部127の代わりに画像生成部171が設けられている点が図12の構成と異なる。復号装置170は、符号化装置140から送信される多重化ストリームを復号して、2視点の画像または多視点の画像を生成し、図示せぬ表示装置に表示させる。
具体的には、復号装置170の画像生成部171は、視聴者からの表示指令に応じて、画像を出力し、図示せぬ表示装置に表示させる。詳細には、画像生成部171は、視聴者からの多視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報、視点間距離情報取得部124からの視点間距離情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像の多重化画像、補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を用いて、図示せぬ表示装置に対応する3以上の視点数の、互換画像や補助画像の解像度の半分の解像度の画像を生成する。
より詳細には、画像生成部171は、視差画像情報取得部125からの視差画像情報に含まれる補助画像の視差画像の多重化方式を示す情報に基づいて、補助画像の視差画像の多重化画像から、各補助画像の視差画像を分離する。また、画像生成部171は、視差画像情報に含まれる互換画像の視差画像の多重化方式を示す情報に基づいて、互換画像の視差画像の多重化画像から、各互換画像の視差画像を分離する。
さらに、画像生成部171は、画像情報取得部123からの画像情報に含まれる補助画像の多重化方式を示す情報に基づいて、補助画像の多重化画像から、各補助画像を分離する。また、画像生成部171は、画像情報に含まれる互換画像の多重化方式を示す情報に基づいて、互換画像の多重化画像から、各互換画像を分離する。
また、画像生成部171は、視点間距離情報と図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。そして、画像生成部171は、各互換画像、各補助画像、各互換画像の視差画像、および各補助画像の視差画像を用いて、位置が決定された各視点の画像を生成する。そして、画像生成部171は、生成された多視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
また、画像生成部171は、視聴者からの2視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報に基づいて、デコーダ122から供給される互換画像の多重化画像を、互換画像の解像度の半分の解像度の画像A2と画像B2に分離する。そして、画像生成部171は、分離された互換画像の解像度の半分の解像度の画像A2と画像B2を交互に出力して、図示せぬ表示装置に表示させる。このとき、視聴者は、画像A2の表示時に左目用のシャッタまたは右目用のシャッタの一方が開き、画像B2の表示時に他方が開くメガネを装着して、表示装置に交互に表示される画像A2と画像B2を見ることにより、3D画像を見ることができる。
[復号装置の処理の説明]
図18は、図17の復号装置170による復号処理を説明するフローチャートである。この復号処理は、例えば、図14の符号化装置140から送信される多重化ストリームが復号装置170に入力されたとき、開始される。
図18のステップS81乃至S83の処理は、図13のステップS31乃至S33の処理と同様であるので、説明は省略する。
ステップS83の処理後、ステップS84において、画像生成部171は、視聴者から2視点方式の3D画像の表示が指令されたかどうかを判定する。ステップS84で視聴者から2視点方式の3D画像の表示が指令されていないと判定された場合、即ち多視点方式の3D画像の表示が指令された場合、処理はステップS85に進む。ステップS85乃至S93の処理は、図13のステップS35乃至S43の処理と同様であり、説明は省略する。
一方、ステップS84で視聴者から2視点方式の3D画像の表示が指令されたと判定された場合、処理はステップS94に進む。
ステップS94において、画像生成部171は、画像情報取得部123から供給される画像情報に含まれる互換画像の多重化方式を示す情報に基づいて、互換用デコーダ131による復号の結果得られる互換画像の多重化画像を分離する。
ステップS95において、画像生成部171は、分離された互換画像の解像度の半分の解像度の互換画像である画像A2および画像B2を、交互に図示せぬ表示装置に出力し、表示させる。そして、処理は終了する。
なお、復号装置170との互換性を有する互換ストリームのみを復号可能な復号装置では、補助ストリームのTSは無視され、ステップS83,S94、およびS95の処理のみが行われる。但し、この場合、ステップS94の処理では、画像情報に含まれる互換画像の多重化方式ではなく、予め決められた互換画像の多重化方式に基づいて互換画像の多重化画像が分離される。
以上のように、復号装置170は、符号化装置140により既存の方式との互換性を有する方式で符号化された互換ストリームと補助ストリームを復号することができる。
また、復号装置170は、2視点の互換画像と2視点の補助画像を用いて多視点の画像を生成するので、符号化装置140は、多視点の画像を生成するための撮影部として、既存の2視点の互換画像を撮影する撮影部141Aおよび撮影部141Bのほかに、2台の撮影部141Cと撮影部141Dのみを用意するだけでよい。従って、多視点の画像を生成するための撮影部の設置を容易に、かつ、低コストで行うことができる。
<第3実施の形態>
[符号化装置の第3実施の形態の構成例]
図19は、本技術を適用した符号化装置の第3実施の形態の構成例を示すブロック図である。
図19に示す構成のうち、図5や図14の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図19の符号化装置180の構成は、主に、画像変換部142、エンコーダ145の代わりに画像変換部181、エンコーダ182が設けられている点が図14の構成と異なる。符号化装置180は、多視点の画像のうちの2視点の画像を互換画像として、MVC方式で符号化を行うことにより、既存の2視点方式の3D画像を符号化する符号化装置との互換性を確保する。
具体的には、符号化装置180の画像変換部181は、図14の画像変換部142と同様に、撮影部141A乃至撮影部141Dのうちの水平方向の位置が内側にある撮影部141Aから供給される画像A2と撮影部141Bから供給される画像B2を互換画像に決定する。そして、画像変換部181は、互換画像である画像A2および画像B2を、そのままエンコーダ182に供給する。また、画像変換部181は、画像変換部142と同様に、互換画像として画像A2および画像B2を指定する情報を互換情報生成部55に供給する。
また、画像変換部181は、画像変換部142と同様に、画像A2および画像B2以外の画像C2および画像D2を補助画像とし、所定の多重化方式で多重化する。画像変換部181は、多重化の結果得られる多重化画像をエンコーダ182に供給し、補助画像の多重化方式を示す情報を画像情報生成部54に供給する。
エンコーダ182は、互換用エンコーダ191と補助用エンコーダ152により構成される。エンコーダ182の互換用エンコーダ191は、画像変換部181から供給される互換画像と補助画像の多重化画像から互換画像を指定し、互換画像のうちの画像A2をベース画像として既存のAVC方式で符号化し、画像B2をディペンデント画像として既存のMVC方式で符号化する。互換用エンコーダ191は、その結果得られる符号化画像に各種の情報を付加して符号化ストリームを生成し、その符号化ストリームを互換ストリームとして多重化部59に供給する。
[符号化装置の処理の説明]
図20および図21は、図19の符号化装置180による符号化処理を説明するフローチャートである。この符号化処理は、例えば、撮影部141A乃至撮影部141Dから画像A2乃至画像D2が出力されたとき開始される。
図20のステップS111およびS112の処理は、図15のステップS51およびS52の処理と同様であるので、説明は省略する。
ステップS112の処理後、ステップS113において、画像変換部181は、撮影部141A乃至撮影部141Dのうちの水平方向の位置が内側にある撮影部141Aから供給される画像A2と、撮影部141Bから供給される画像B2を互換画像に決定し、補助画像の多重化方式を決定する。画像変換部181は、互換画像として画像A2および画像B2を指定する情報を互換情報生成部55に供給し、補助画像の多重化方式を画像情報生成部54に供給する。そして、処理はステップS114に進む。
ステップS114乃至S117の処理は、図10のステップS14乃至S17の処理と同様であるので、説明は省略する。ステップS118乃至S122の処理は、図16のステップS59乃至S63の処理と同様であるので、説明は省略する。
ステップS122の処理後、ステップS123において、エンコーダ182の互換用エンコーダ191は、画像変換部181から供給される互換画像のうちの画像A2をベース画像として既存のAVC方式で符号化し、画像B2をディペンデント画像として既存のMVC方式で符号化する。互換用エンコーダ191は、その結果得られる符号化画像に各種の情報を付加して符号化ストリームを生成し、その符号化ストリームを互換ストリームとして多重化部59に供給する。そして、処理はステップS124に進む。
ステップS124乃至S126の処理は、図16のステップS65乃至S67の処理と同様であるので、説明は省略する。
以上のように、符号化装置180は、多視点の画像のうちの2視点の画像を互換画像とし、既存の符号化方式で符号化するので、既存の2視点方式の3D画像を符号化する符号化装置との互換性を確保することができる。
[復号装置の構成例]
図22は、図19の符号化装置180から送信される多重化ストリームを復号する復号装置の構成例を示す図である。
図22に示す構成のうち、図12の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図22の復号装置200の構成は、主に、デコーダ122、画像生成部127の代わりにデコーダ201、画像生成部202が設けられている点が図12の構成と異なる。復号装置200は、符号化装置180から送信される多重化ストリームを復号して、2視点の画像または多視点の画像を生成し、図示せぬ表示装置に表示させる。
具体的には、復号装置200のデコーダ201は、互換用デコーダ211と補助用デコーダ132により構成される。デコーダ201の互換用デコーダ211は、図12の互換用デコーダ131と同様に、補助用デコーダ132から供給される互換ストリームを特定するための情報に基づいて、分離部121から供給される互換ストリームと補助ストリームのうちの互換ストリームを識別する。互換用デコーダ211は、互換ストリームに含まれる符号化された互換画像をMVC方式に対応する方式で復号し、その結果得られる画像A2と画像B2を画像生成部202に供給する。
画像生成部202は、視聴者からの表示指令に応じて、画像を出力し、図示せぬ表示装置に表示させる。詳細には、画像生成部202は、視聴者からの多視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報、視点間距離情報取得部124からの視点間距離情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像、補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を用いて、図示せぬ表示装置に対応する3以上の視点数の、互換画像や補助画像の解像度の半分の解像度の画像を生成する。
より詳細には、画像生成部202は、視差画像情報取得部125からの視差画像情報に含まれる補助画像の視差画像の多重化方式を示す情報に基づいて、補助画像の視差画像の多重化画像から、各補助画像の視差画像を分離する。また、画像生成部202は、視差画像情報に含まれる互換画像の視差画像の多重化方式を示す情報に基づいて、互換画像の視差画像の多重化画像から、各互換画像の視差画像を分離する。
さらに、画像生成部202は、画像情報取得部123からの画像情報に含まれる補助画像の多重化方式を示す情報に基づいて、補助画像の多重化画像から、各補助画像を分離する。また、画像生成部202は、視点間距離情報と図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。そして、画像生成部202は、各互換画像、各補助画像、各互換画像の視差画像、および各補助画像の視差画像を用いて、位置が決定された各視点の画像を生成する。そして、画像生成部202は、画像生成部127と同様に、生成された多視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
また、画像生成部202は、視聴者からの2視点方式の3D画像の表示指令に応じて、デコーダ122から供給される互換画像としての画像A2と画像B2を交互に出力して、図示せぬ表示装置に表示させる。このとき、視聴者は、画像A2の表示時に左目用のシャッタまたは右目用のシャッタの一方が開き、画像B2の表示時に他方が開くメガネを装着して、表示装置に交互に表示される画像A2と画像B2を見ることにより、3D画像を見ることができる。
[復号装置の処理の説明]
図23は、図22の復号装置200による復号処理を説明するフローチャートである。この復号処理は、例えば、図19の符号化装置180から送信される多重化ストリームが復号装置200に入力されたとき、開始される。
図23のステップS141乃至S153の処理は、図18のステップS81乃至S93の処理と同様であるので説明は省略する。
ステップS144で視聴者から2視点方式の3D画像の表示が指令されたと判定された場合、処理はステップS154に進む。ステップS154において、画像生成部202は、互換用デコーダ211による復号の結果得られる互換画像である画像A2および画像B2を、交互に図示せぬ表示装置に出力し、表示させる。そして、処理は終了する。
なお、復号装置200との互換性を有する互換ストリームのみを復号可能な復号装置では、補助ストリームのTSは無視され、ステップS143およびS154の処理のみが行われる。
以上のように、復号装置200は、符号化装置180により既存の方式との互換性を有する方式で符号化された互換ストリームと補助ストリームを復号することができる。
<互換情報、視差画像情報、画像情報、および視点間距離情報の他の配置例> 上述した説明では、補助ストリームに、互換情報、視差画像情報、画像情報、および視点間距離情報が含まれたが、TSに含まれるようにしてもよい。この場合、例えば、補助ストリームのTSのパケット内のPMT(Program Map Table)やSIT(Selection Information Table)のディスクリプタに互換情報、視差画像情報、画像情報、および視点間距離情報が記述される。
図24乃至図26は、互換情報、視差画像情報、画像情報、および視点間距離情報がPMTのディスクリプタに記述される場合の互換情報および視差画像情報の記述例を示す図である。
図24に示すように、互換情報および視差画像情報がPMTのディスクリプタに記述される場合、PMTのディスクリプタとして、互換情報が配置されるディスクリプタ(3DV_view_structure_descriptor)、視差画像情報が配置されるディスクリプタ(depth_map_structure_descriptor)が設けられる。
そして、ディスクリプタ(3DV_view_structure_descriptor)には、図25に示すように、ディスクリプタタグ(descriptor_tag)、ディスクリプタ長(descriptor_length)に続いて、互換情報として、符号化の対象となる画像の視点の数(num_of_views)、互換モード(compatible mode)、互換画像を指定する情報(compatible_view)などが記述される。
また、ディスクリプタ(depth_map_structure_descriptor)には、図26に示すように、ディスクリプタタグ、ディスクリプタ長に続いて、視差画像情報として、視差画像の数(num_of_depth_map)、視差画像が多重化されているかどうかを表すフラグ(is_frame_packing)、視差画像の多重化方式(frame_packing_mode)、多重化されている視差画像を指定する情報(comb_frame_packing_views)などが記述される。
なお、画像情報は、視差画像ではなく、互換画像および補助画像についての情報であること以外視差画像情報と同様であるので、図示は省略する。
図27は、互換情報、視差画像情報、画像情報、および視点間距離情報がPMTのディスクリプタに記述される場合の視点間距離情報の記述例を示す図である。
図27に示すように、視点間距離情報がPMTのディスクリプタに記述される場合、PMTのディスクリプタとして、視点間距離情報が配置されるディスクリプタ(3DV_view_info_descriptor)が設けられる。
そして、ディスクリプタ(3DV_view_info_descriptor)には、ディスクリプタタグ、ディスクリプタ長に続いて、視点間距離情報として、符号化の対象となる画像の視点の数(num_of_views)、検出された視点間距離の数(num_of_view_distance)、視点間距離に対応する2枚の画像の組み合わせ(view[0,1])、その組み合わせに対応する視点間距離(view_distance[view_distance_id])などが記述される。
本技術の復号装置は、例えば、テレビジョン受像機などの表示装置や再生装置に適用することができる。
なお、符号化装置や復号装置の第1乃至第3実施の形態は組み合わせられてもよい。この場合、復号装置は、互換情報に含まれる互換モードによって、互換用デコーダを選択する。
また、第1乃至第3実施の形態では、補助画像および視差画像の解像度が低解像度化され、多重化されたが、低解像度化されるだけで、多重化されなくてもよい。また、視差画像の解像度は低解像度化されなくてもよい。
なお、画像情報、視点間距離情報、視差画像情報、および互換情報は、符号化されずに、符号化ストリームとは別系統で伝送されるようにしてもよい。また、画像情報、視点間距離情報、視差画像情報、および互換情報は、符号化されて、符号化ストリームとは別系統で伝送されるようにしてもよい。
また、画像情報、視点間距離情報、視差画像情報、および互換情報は、符号化されずに、符号化ストリームの上述した以外の領域(ヘッダ、ユーザデータ等)に記述されることもできるし、符号化されて符号化ストリームの所定の領域に記述されることもできる。さらに、画像情報、視点間距離情報、視差画像情報、および互換情報は、符号化ストリームとは別の補助情報として伝送することもできる。
<第4実施の形態>
[符号化装置の第4実施の形態の構成例]
図28は、本技術を適用した符号化装置の第4実施の形態の構成例を示すブロック図である。
図28に示す構成のうち、図5の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図28の符号化装置300の構成は、主に、画像変換部52、視差画像生成部53、画像情報生成部54、視差画像情報生成部57、エンコーダ58の代わりに画像変換部301、視差画像生成部302、画像情報生成部303、視差画像情報生成部304、エンコーダ305が設けられている点が図5の構成と異なる。
符号化装置300は、低解像度化された補助画像および補助画像の視差画像を多重化せずに符号化し、補助画像および補助画像の視差画像の符号化時の解像度が互換画像の解像度と異なっていることを示す情報などを伝送する。
具体的には、符号化装置300の画像変換部301は、図5の画像変換部52と同様に、撮影部51Aから供給される画像A1を互換画像に決定する。画像変換部301は、画像変換部52と同様に、互換画像として画像A1を指定する情報を互換情報生成部55に供給する。そして、画像変換部301は、画像変換部52と同様に、互換画像である画像A1をそのままエンコーダ305に供給する。
また、画像変換部301は、画像A1以外の画像B1および画像C1を補助画像とし、水平方向の解像度を半分にする。そして、画像変換部301は、その結果得られる1/2解像度画像B1と1/2解像度画像C1をエンコーダ305に供給する。また、画像変換部301は、補助画像の解像度の変換方式を示す情報と、補助画像の符号化時の解像度が互換画像の解像度とは異なっていることを示す情報とを、画像情報生成部303に供給する。
視差画像生成部302は、図5の視差画像生成部53と同様に、撮影部51A乃至撮影部51Cから供給される画像A1乃至画像C1を用いて、画像A1乃至画像C1の各画素の視差を検出する。視差画像生成部302は、視差画像生成部53と同様に、視差画像A1’を生成し、そのままエンコーダ305に供給する。また、視差画像生成部302は、視差画像B1’と視差画像C1’を生成し、水平方向の解像度を半分にする。視差画像生成部302は、その結果得られる、解像度が半分にされた視差画像B1’(以下、1/2解像度画像B1’という)と視差画像C1’(以下、1/2解像度画像C1’という)をエンコーダ305に供給する。また、視差画像生成部302は、補助画像の視差画像の解像度の変換方式を示す情報と、補助画像の視差画像の符号化時の解像度が互換画像の解像度とは異なっていることを示す情報とを、視差画像情報生成部304に供給する。
画像情報生成部303(設定部)は、画像変換部301から供給される情報に基づいて、補助画像の解像度の変換方式を示す情報、補助画像の符号化時の解像度が互換画像の解像度とは異なっているかどうかを示す情報(補助画像解像度識別情報)などを画像情報として生成する。
画像情報生成部303は、その画像情報をエンコーダ305に供給する。
視差画像情報生成部304は、視差画像生成部302から供給される情報に基づいて、補助画像の視差画像の解像度の変換方式を示す情報、視差画像の符号化時の解像度が互換画像の解像度とは異なっているかどうかを示す情報(補助視差画像変換方式情報)などを視差画像情報として生成する。視差画像情報生成部304は、その視差画像情報をエンコーダ305に供給する。
エンコーダ305は、互換用エンコーダ61と補助用エンコーダ311により構成される。補助用エンコーダ311は、画像変換部301からの1/2解像度画像B1および1/2解像度画像C1、並びに、視差画像生成部302からの互換画像の視差画像A1’,1/2解像度画像B1’、1/2解像度画像C1’を所定の方式で符号化する。なお、補助用エンコーダ311における符号化方式としては、AVC方式、MVC方式、MPEG2方式に準じた方式などを用いることができる。
また、補助用エンコーダ311は、図5の補助用エンコーダ62と同様に、符号化の結果得られる符号化画像に、画像情報生成部303からの画像情報、互換情報生成部55からの互換情報、視点間距離情報生成部56からの視点間距離情報、および視差画像情報生成部304からの視差画像情報などを付加して、符号化ストリームを生成する。補助用エンコーダ311は、その符号化ストリームを補助ストリームとして多重化部59に供給する。
[視差画像情報の記述例]
図29は、図28の符号化装置300における、符号化方式としてAVC方式またはMVC方式に準じた方式が用いられた場合の補助ストリーム内の視差画像情報の記述例を示す図である。
図29に示すように、視差画像情報(depth_map_structure)としては、視差画像の数(num_of_depth_map)、視差画像が多重化されているかどうかを表すフラグ(is_frame_packing)、視差画像の解像度の変換方式(decimation_mode)、低解像度化されている視差画像を指定する情報(comb_ decimated_views)、符号化時の解像度が互換画像の解像度と異なっているかどうかを表すフラグである符号化解像度フラグ(is_decimated)(補助視差画像解像度識別情報)などが記述される。解像度の変換方式としては、水平方向の解像度を半分にする水平1/2方式、垂直方向の解像度を半分にする垂直1/2方式、水平方向および垂直方向の解像度をそれぞれ半分にする水平垂直1/4方式などがある。
なお、符号化装置300における画像情報は、視差画像ではなく、互換画像および補助画像についての情報であること以外視差画像情報と同様であるので、図示は省略する。
[符号化装置の処理の説明]
図30および図31は、図28の符号化装置300による符号化処理を説明するフローチャートである。この符号化処理は、例えば、撮影部51A乃至撮影部51Cから画像A1乃至画像C1が出力されたとき開始される。
図30および図31の符号化処理は、多重化方式の代わりに解像度の変換方式が決定され、補助画像および補助画像の視差画像が多重化されない点を除いて、図10および図11の符号化処理と同一である。
具体的には、図30のステップS211およびS212の処理は、図10のステップS11およびS12の処理と同様であり、ステップS213において、画像変換部301は、撮影部51Aから供給される画像A1を互換画像に決定し、補助画像の解像度の変換方式を決定する。画像変換部301は、互換画像として画像A1を指定する情報を互換情報生成部55に供給し、補助画像の解像度の変換方式を画像情報生成部303に供給する。また、画像変換部301は、補助画像を多重化しないことを決定し、補助画像の符号化時の解像度が互換画像の解像度とは異なっていることを示す情報を、画像情報生成部303に供給する。
そして、ステップS214およびS215の処理は、図10のステップS14およびS15の処理と同様であり、ステップS216において、画像変換部301は、画像A1以外の画像B1および画像C1を補助画像として、ステップS213で決定された補助画像の解像度の変換方式に基づいて補助画像を低解像度化する。ステップS217において、画像変換部301は、互換画像である画像A1と低解像度化された補助画像をエンコーダ305に入力する。
図31のステップS218の処理は、図11のステップS18の処理と同様であり、ステップS219において、視差画像生成部302は、補助画像の視差画像の解像度の変換方式を決定し、その変換方式を示す情報を視差画像情報生成部304に供給する。また、視差画像生成部302は、補助画像の視差画像を多重化しないことを決定し、補助画像の視差画像の符号化時の解像度が互換画像の解像度とは異なっていることを示す情報を、視差画像情報生成部304に供給する。
ステップS220の処理は、図11のステップS20の処理と同様であり、ステップS221において、視差画像生成部302は、ステップS219で決定された補助画像の視差画像の解像度の変換方式に基づいて、補助画像の視差画像を低解像度化する。ステップS222において、視差画像生成部302は、互換画像の視差画像A1'と低解像度化された補助画像の視差画像をエンコーダ305に入力する。
ステップS223乃至S226の処理は、図11のステップS23乃至S26の処理と同様である。
以上のように、符号化装置300は、補助画像や視差画像を低解像度化するので、圧縮レートを上げずに、符号化結果の情報量を抑制することができる。その結果、圧縮レートの上昇により圧縮歪みの影響が増大し、画質が劣化することを防止することができる。また、互換画像は低解像度化されないので、互換画像の画質を高画質に保つことができる。このことは、符号化装置50、符号化装置140、および符号化装置180についても同様である。
[復号装置の構成例]
図32は、図28の符号化装置300から送信される多重化ストリームを復号する復号装置の構成例を示す図である。
図32に示す構成のうち、図12の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図32の復号装置320の構成は、主に、デコーダ122、画像生成部127の代わりにデコーダ321、画像生成部322が設けられている点が図12の構成と異なる。復号装置320は、符号化装置300から送信される多重化ストリームを復号して、1視点の画像または多視点の画像を生成し、図示せぬ表示装置に表示させる。
具体的には、復号装置320のデコーダ321は、互換用デコーダ131と補助用デコーダ331により構成される。補助用デコーダ331は、図12の補助用デコーダ132と同様に、分離部121から供給される補助ストリームに含まれる互換情報に基づいて、互換ストリームを特定するための情報を互換用デコーダ131に供給する。補助用デコーダ331は、補助用デコーダ132と同様に、互換情報に基づいて、分離部121から供給される互換ストリームと補助ストリームのうち、補助ストリームを識別する。
補助用デコーダ331は、補助ストリームに含まれる画像情報および視差画像情報に基づいて、補助ストリームに含まれる符号化された補助画像としての1/2解像度画像B1および1/2解像度画像C1、互換画像の視差画像A1’、並びに補助画像の視差画像としての1/2解像度画像B1’および1/2解像度画像C1’を、図28の補助用エンコーダ311に対応する方式で復号する。
補助用デコーダ331は、復号の結果得られる低解像度化された補助画像、互換画像の視差画像A1’、および低解像度化された補助画像の視差画像を画像生成部322に供給する。また、補助用デコーダ331は、補助用デコーダ132と同様に、補助ストリームに含まれる画像情報を画像情報取得部123に供給し、視点間距離情報を視点間距離情報取得部124に供給する。さらに、補助用デコーダ331は、補助用デコーダ132と同様に、補助ストリームに含まれる視差画像情報を視差画像情報取得部125に供給し、互換情報を互換情報取得部126に供給する。
画像生成部322は、視聴者からの表示指令に応じて、画像を出力し、図示せぬ表示装置に表示させる。具体的には、画像生成部322は、視聴者からの多視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報、視点間距離情報取得部124からの視点間距離情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像、低解像度化された補助画像、互換画像の視差画像、および低解像度化された補助画像の視差画像を用いて、図示せぬ表示装置に対応する3以上の視点数の、互換画像の解像度と同一の解像度の画像を生成する。
より詳細には、画像生成部322(画像変換部)は、視差画像情報取得部125からの視差画像情報に含まれる解像度の変換方式と視差画像の符号化時の解像度が互換画像の解像度とは異なっているかどうかを示す情報に基づいて、低解像度化された補助画像の視差画像を高解像度化し、互換画像と同一の解像度の補助画像の視差画像を得る。また、画像生成部322は、画像情報取得部123からの画像情報に含まれる解像度の変換方式と補助画像の符号化時の解像度が互換画像の解像度とは異なっているかどうかを示す情報に基づいて、低解像度化された補助画像を高解像度化し、互換画像と同一の解像度の補助画像を得る。
さらに、画像生成部322は、視点間距離情報と図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。そして、画像生成部322は、互換画像、並びに、互換画像と同一の解像度の各補助画像、互換画像の視差画像、および各補助画像の視差画像を用いて、位置が決定された各視点の画像を生成する。そして、画像生成部322は、生成された各視点の画像の解像度を、互換画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
また、画像生成部322は、視聴者からの2D画像の表示指令に応じて、デコーダ321の互換用デコーダ131から供給される互換画像である画像A1を出力して、図示せぬ表示装置に表示させる。これにより、視聴者は、2D画像を見ることができる。
[復号装置の処理の説明]
図33は、図32の復号装置320による復号処理を説明するフローチャートである。この復号処理は、例えば、図28の符号化装置300から送信される多重化ストリームが復号装置320に入力されたとき、開始される。
図33の復号処理は、補助ストリームに含まれる画像情報と視差画像情報に基づいて、補助画像および視差画像を復号する点、および、画像情報と視差画像情報に基づいて補助画像および補助画像の視差画像を高解像度化する点を除いて、図13の復号処理と同一である。
具体的には、図33のステップS231乃至S234の処理は、図13のステップS31乃至S34の処理と同様であり、ステップS235において、補助用デコーダ331は、補助ストリームに含まれる画像情報および視差画像情報に基づいて、補助ストリームに含まれる符号化された補助画像、互換画像の視差画像A1’、および補助画像の視差画像を、図28の補助用エンコーダ311に対応する方式で復号する。
具体的には、補助用デコーダ331は、画像情報に含まれる符号化解像度フラグが符号化時の解像度が互換画像の解像度と異なることを表すフラグである場合、解像度の変換方式に基づいて、符号化対象の解像度を設定する。例えば、解像度の変換方式が水平1/2方式である場合、符号化対象の解像度として、互換画像の水平方向の解像度を半分にした解像度が設定される。一方、補助用デコーダ331は、画像情報に含まれる符号化解像度フラグが符号化時の解像度が互換画像の解像度と異ならないことを表すフラグである場合、符号化対象の解像度を互換画像の解像度と同一の解像度に設定する。同様に、補助用デコーダ331は、視差画像情報に含まれる符号化解像度フラグに基づいて、符号化対象の解像度を設定する。
補助用デコーダ331は、設定された符号化対象の解像度に基づいて、補助画像、互換画像の視差画像A1’、補助画像の視差画像を復号する。補助用デコーダ331は、復号の結果得られる、補助画像、互換画像の視差画像A1’、および低解像度化された補助画像の視差画像を画像生成部322に供給する。また、補助用デコーダ331は、補助ストリームに含まれる画像情報を画像情報取得部123に供給し、視点間距離情報を視点間距離情報取得部124に供給する。さらに、補助用デコーダ331は、補助ストリームに含まれる視差画像情報を視差画像情報取得部125に供給し、互換情報を互換情報取得部126に供給する。
ステップS236乃至S239の処理は、図13のステップS36乃至S39の処理と同様であり、ステップS240において、画像生成部322は、画像情報取得部123からの画像情報に含まれる解像度の変換方式と補助画像の符号化時の解像度が互換画像の解像度とは異なっているかどうかを示す情報に基づいて、低解像度化された補助画像を高解像度化し、互換画像と同一の解像度の補助画像を得る。
ステップS241において、画像生成部322は、視差画像情報取得部125からの視差画像情報に含まれる解像度の変換方式と補助画像の視差画像の符号化時の解像度が互換画像の解像度とは異なっているかどうかを示す情報に基づいて、低解像度化された補助画像の視差画像を高解像度化し、互換画像と同一の解像度の補助画像の視差画像を得る。
ステップS242の処理は、図13のステップS40の処理と同様であり、ステップS243において、画像生成部322は、ステップS242で決定された各視点の位置、互換情報取得部126からの互換情報等に基づいて、互換画像、並びに、互換画像と同一の解像度の補助画像、互換画像の視差画像、および補助画像の視差画像を用いて、各視点の、互換画像と同一の解像度の画像を生成する。
ステップS244乃至S246の処理は、図13のステップS42乃至S44の処理と同様である。
なお、復号装置320との互換性を有する互換ストリームのみを復号可能な復号装置では、補助ストリームのTSは無視され、ステップS233およびS246の処理のみが行われる。
以上のように、復号装置320は、符号化装置300により既存の方式との互換性を有する方式で符号化された互換ストリームと補助ストリームを復号することができる。
[視差画像情報の他の配置例]
上述した説明では、第4の実施の形態において、補助ストリームに、互換情報、視差画像情報、画像情報、および視点間距離情報が含まれたが、第1乃至第3の実施の形態と同様に、TSに含まれるようにしてもよい。この場合、例えば、補助ストリームのTSのパケット内のPMTやSITのディスクリプタに互換情報、視差画像情報、画像情報、および視点間距離情報が記述される。
図34は、互換情報、視差画像情報、画像情報、および視点間距離情報がPMTのディスクリプタに記述される場合の視差画像情報が配置されるディスクリプタ(depth_map_structure_descriptor)の記述例を示す図である。
図34に示すように、ディスクリプタ(depth_map_structure_descriptor)には、ディスクリプタタグ、ディスクリプタ長に続いて、視差画像情報として、視差画像の数(num_of_depth_map)、視差画像が多重化されているかどうかを表すフラグ(is_frame_packing)、視差画像の解像度の変換方式(decimation_mode)、低解像度化されている視差画像を指定する情報(comb_ decimated_views)、符号化解像度フラグ(is_decimated)などが記述される。
なお、第4実施の形態では、補助画像および補助画像の視差画像が多重化されないものとしたが、多重化されてもよい。この場合、画像情報および視差画像情報には、多重化方式を示す情報および多重化されている視差画像を指定する情報が含まれる。そして、復号装置320は、画像情報および視差画像情報に基づいて、復号の結果得られる補助画像および補助画像の視差画像を分離し、分離された補助画像および補助画像の視差画像を高解像度化して、各視点の画像の生成に用いる。
また、第4実施の形態は、第1実施の形態における画像情報および視差画像情報に符号化解像度フラグ等が含まれるものであったが、第2および第3実施の形態における画像情報および視差画像情報にも同様に符号化解像度フラグ等を含めることができる。さらに、第4実施の形態では、各視点の画像を生成する際に、補助画像と補助画像の視差画像が高解像度化されたが、各視点の画像を生成する際の解像度変換は、その生成に用いられる全ての画像が同一の解像度となるような変換であれば、いずれの画像を高解像度化または低解像度化する変換であってもよい。第1乃至第3実施の形態においても、第4実施の形態と同様に、各視点の画像を生成する際に解像度変換が行われる。第1乃至第3実施の形態では、互換画像の半分の解像度の各視点の画像が生成されたが、第4実施の形態と同様に、互換画像と同一の解像度の各視点の画像が生成されるようにしてもよい。
<第5実施の形態>
[符号化装置の第5実施の形態の構成例]
図35は、本技術を適用した符号化装置の第5実施の形態の構成例を示すブロック図である。
図35に示す構成のうち、図14の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図35の符号化装置440の構成は、主に、視差画像生成部143、エンコーダ145の代わりに、視差画像生成部441、エンコーダ442が設けられている点が図14の構成と異なる。符号化装置440は、互換画像の視差画像を空間方向に多重化するのではなく、時間方向に多重化して符号化する。
具体的には、符号化装置440の視差画像生成部441は、撮影部141A乃至撮影部141Dから供給される画像A2乃至画像D2を用いて、画像A2乃至画像D2の各画素の視差を検出する。視差画像生成部441は、検出結果に基づいて、互換画像である画像A2の視差画像A2’および画像B2の視差画像B2’、並びに、補助画像である画像C2の視差画像C2’および画像D2の視差画像D2’を生成する。
また、視差画像生成部441は、図14の視差画像生成部143と同様に、視差画像C2’と視差画像D2’を、所定の多重化方式で空間方向に多重化する。さらに、視差画像生成部441は、視差画像A2’、視差画像B2’、および補助画像の視差画像の多重化画像を、時間方向に多重化する。視差画像生成部441は、その結果得られる、1フレーム時間内に1フレーム分の視差画像A2’、視差画像B2’、および補助画像の視差画像の多重化画像が存在する多重化画像を、時間多重化画像としてエンコーダ442に供給する。
また、視差画像生成部441は、補助画像の視差画像の多重化方式と、互換画像および補助画像の視差画像の多重化方式としての時間方向に多重化する方式(以下、フレームシーケンシャル方式という)とを示す情報を、視差画像情報生成部57に供給する。
エンコーダ442は、互換用エンコーダ151と補助用エンコーダ451により構成される。エンコーダ442の補助用エンコーダ451は、画像変換部142からの補助画像の多重化画像と視差画像生成部441からの時間多重化画像を3DV方式で符号化する。なお、3DV方式とは、AVC方式やMVC方式に準じた多視点方式での表示用の画像を符号化するための方式である。補助用エンコーダ451は、その結果得られる符号化ストリームを補助ストリームとして多重化部443に供給する。
多重化部443は、互換用エンコーダ151からの互換ストリーム、補助用エンコーダ451からの補助ストリーム、画像情報生成部54からの画像情報、互換情報生成部55からの互換情報、視点間距離情報生成部56からの視点間距離情報、および視差画像情報生成部57からの視差画像情報などを用いて、TSを生成する。多重化部443は、生成されたTSを多重化し、その結果得られる多重化ストリームを送信する。
なお、以下では、画像情報、互換情報、視点間距離情報、および視差画像情報をまとめて補助情報という。
[視差画像情報の記述例]
図36は、補助情報がPMTのディスクリプタに記述される場合の、図35の符号化装置440における視差画像情報の記述例を示す図である。
図36に示すように、視差画像情報が配置されるディスクリプタ(depth_map_structure_descriptor)には、図25の場合と同様に、ディスクリプタタグ(descriptor_tag)、ディスクリプタ長(descriptor_length)に続いて、視差画像情報が記述される。また、視差画像情報としては、図25の場合と同様に、視差画像の数(num_of_depth_map)、視差画像が多重化されているかどうかを表すフラグ(is_frame_packing)、視差画像の多重化方式(frame_packing_mode)、多重化されている視差画像を指定する情報(comb_frame_packing_views)などが記述される。但し、視差画像の多重化方式としては、サイドバイサイド方式(SBS)やトップアンドボトム方式(TOB)だけでなく、フレームシーケンシャル方式も記述される。
なお、図35の符号化装置440では、補助情報がTSに含まれるものとするが、補助情報は補助ストリームに含まれるようにしてもよい。
図37は、補助情報が補助ストリームに含まれる場合の、補助ストリーム内の視差画像情報の記述例を示す図である。
この場合、図6に示したように、視差画像情報(depth_map_structure)は、例えば、補助ストリーム内のSEIに配置される。
また、視差画像情報(depth_map_structure)としては、図37に示すように、視差画像(depth map)の数(num_of_depth_map)、視差画像が多重化されているかどうかを表すフラグ(is_frame_packing)、視差画像の多重化方式(frame_packing_mode)、多重化されている視差画像を指定する情報(comb_frame_packing_views)などが記述される。但し、視差画像の多重化方式としては、図36の場合と同様に、サイドバイサイド方式(SBS)やトップアンドボトム方式(TOB)だけでなく、フレームシーケンシャル方式も記述される。
なお、図示は省略するが、画像情報は、視差画像ではなく、互換画像および補助画像についての情報であること以外視差画像情報と同様である。
[符号化装置の処理の説明]
図38および図39は、図35の符号化装置440による符号化処理を説明するフローチャートである。この符号化処理は、例えば、撮影部141A乃至撮影部141Dから画像A2乃至画像D2が出力されたとき開始される。
図38および図39のステップS451乃至S455の処理は、図15および図16のステップS51乃至S55の処理と同様であるので、説明は省略する。
ステップS456において、画像情報生成部54は、画像変換部142から供給される情報に基づいて、互換画像および補助画像の多重化方式を示す情報などを画像情報として生成し、多重化部443に入力する。そして、処理は、ステップS457に進む。
ステップS457乃至S459の処理は、図15および図16のステップS57乃至S59の処理と同様であるので、説明は省略する。
図39のステップS460において、視差画像生成部441は、補助画像の視差画像の多重化方式と、互換画像の視差画像および補助画像の視差画像の多重化画像の多重化方式を決定し、その多重化方式を示す情報を視差画像情報生成部57に供給する。
ステップS461において、視差画像情報生成部57は、視差画像生成部441から供給される情報に基づいて、補助画像の視差画像の多重化方式と、互換画像の視差画像および補助画像の視差画像の多重化画像の多重化方式を示す情報などを、視差画像情報として生成し、多重化部443に入力する。
ステップS462において、視差画像生成部441は、ステップS460で決定された多重化方式に基づいて、補助画像の視差画像C2’と視差画像D2’を空間方向に多重化し、互換画像の視差画像A2’および視差画像B2’と補助画像の視差画像の多重化画像を時間方向に多重化する。
ステップS463において、視差画像生成部441は、ステップS462の多重化の結果得られる時間多重化画像をエンコーダ442に入力する。
ステップS464において、エンコーダ442の互換用エンコーダ151は、画像変換部142から供給される互換画像の多重化画像を既存のAVC方式で符号化し、その結果得られる符号化ストリームを互換ストリームとして多重化部443に供給する。
ステップS465において、補助用エンコーダ451は、画像変換部142からの補助画像の多重化画像と視差画像生成部441からの時間多重化画像を、3DV方式で符号化する。補助用エンコーダ451は、符号化の結果得られる符号化ストリームを補助用ストリームとして多重化部443に供給する。
ステップS466において、多重化部443は、互換用エンコーダ151から供給される互換ストリーム、補助用エンコーダ451から供給される補助ストリーム、および補助情報からTSを生成して、多重化し、その結果得られる多重化ストリームを送信する。この多重化ストリームは、例えばBD等に記録されたり、放送用ストリームとして送信されたりする。そして、処理は終了する。
[復号装置の構成例]
図40は、図35の符号化装置440から送信される多重化ストリームを復号する復号装置の構成例を示す図である。
図40に示す構成のうち、図17の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図40の復号装置460の構成は、主に、分離部121、デコーダ122、画像生成部171の代わりに、分離部461、デコーダ462、画像生成部463が設けられている点が図17の構成と異なる。復号装置460は、符号化装置440から送信される多重化ストリームを復号し、2視点の画像または多視点の画像を生成して、図示せぬ表示装置に表示させる。
具体的には、復号装置460の分離部461は、符号化装置440から送信されてくる多重化ストリームを受信し、TSごとに分離する。分離部461は、分離されたTSから互換ストリームと補助ストリームを抽出し、デコーダ462に供給する。また、分離部461は、TSに含まれる補助情報を抽出し、補助情報のうちの画像情報を画像情報取得部123に供給し、視点距離情報を視点間距離情報取得部124に供給する。さらに、分離部461は、補助情報のうちの視差画像情報を視差画像情報取得部125に供給し、互換情報を互換情報取得部126とデコーダ462に供給する。
デコーダ462は、互換用デコーダ471と補助用デコーダ472により構成される。デコーダ462の互換用デコーダ471は、分離部461から供給される互換情報に基づいて、分離部461から供給される互換ストリームと補助ストリームのうち、互換ストリームを識別する。互換用デコーダ471は、互換ストリームに含まれる符号化された互換画像をAVC方式に対応する方式で復号し、その結果得られる互換画像の多重化画像を画像生成部463に供給する。
補助用デコーダ472は、分離部461から供給される互換情報に基づいて、分離部461から供給される互換ストリームと補助ストリームのうち、補助ストリームを識別する。補助用デコーダ472は、分離部461から供給される補助ストリームに含まれる符号化された補助画像の多重化画像と時間多重化画像を、図35の補助用エンコーダ451に対応する方式で復号する。補助用デコーダ472は、復号の結果得られる補助画像の多重化画像と時間多重化画像を画像生成部463に供給する。
画像生成部463は、視聴者からの表示指令に応じて画像を出力し、図示せぬ表示装置に表示させる。詳細には、画像生成部463は、視聴者からの多視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報、視点間距離情報取得部124からの視点間距離情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像の多重化画像、補助画像の多重化画像、および時間多重化画像を用いて、図示せぬ表示装置に対応する3以上の視点数の、互換画像や補助画像の解像度の半分の解像度の画像を生成する。
より詳細には、画像生成部463は、視差画像情報取得部125からの視差画像情報に含まれる互換画像の視差画像と補助画像の視差画像の多重化画像の多重化方式としてフレームシーケンシャル方式を示す情報に基づいて、時間多重化画像から、互換画像の視差画像である視差画像A2’および視差画像B2’、並びに、補助画像の視差画像の多重化画像を分離する。そして、画像生成部463は、視差画像情報に含まれる補助画像の視差画像の多重化方式に基づいて、補助画像の視差画像の多重化画像から、視差画像C2’と視差画像D2’を分離する。
さらに、画像生成部463は、図17の画像生成部171と同様に、画像情報取得部123からの画像情報に含まれる補助画像の多重化方式を示す情報に基づいて、補助画像の多重化画像から、各補助画像を分離する。また、画像生成部463は、画像生成部171と同様に、画像情報に含まれる互換画像の多重化方式を示す情報に基づいて、互換画像の多重化画像から、各互換画像を分離する。
また、画像生成部463は、画像生成部171と同様に、視点間距離情報と図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。そして、画像生成部463は、画像生成部171と同様に、各互換画像、各補助画像、各互換画像の視差画像、および各補助画像の視差画像を用いて、位置が決定された各視点の画像を生成する。そして、画像生成部463は、画像生成部171と同様に、生成された多視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
また、画像生成部463は、画像生成部171と同様に、視聴者からの2視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報に基づいて、デコーダ462から供給される互換画像の多重化画像を、互換画像の解像度の半分の解像度の画像A2と画像B2に分離する。そして、画像生成部463は、画像生成部171と同様に、分離された互換画像の解像度の半分の解像度の画像A2と画像B2を交互に出力して、図示せぬ表示装置に表示させる。このとき、視聴者は、画像A2の表示時に左目用のシャッタまたは右目用のシャッタの一方が開き、画像B2の表示時に他方が開くメガネを装着して、表示装置に交互に表示される画像A2と画像B2を見ることにより、3D画像を見ることができる。
[復号処理の説明]
図41は、図40の復号装置460による復号処理を説明するフローチャートである。この復号処理は、例えば、図35の符号化装置440から送信される多重化ストリームが復号装置460に入力されたとき、開始される。
図41のステップS471において、復号装置460の分離部461は、符号化装置50から送信されてくる多重化ストリームを受信し、TSごとに分離する。そして、分離部461は、分離されたTSに含まれる互換ストリームと補助ストリームをデコーダ462に供給する。また、分離部461は、TSに含まれる補助情報を抽出し、補助情報のうちの画像情報を画像情報取得部123に供給し、視点距離情報を視点間距離情報取得部124に供給する。さらに、分離部461は、補助情報のうちの視差画像情報を視差画像情報取得部125に供給し、互換情報を互換情報取得部126とデコーダ462に供給する。
ステップS472において、互換用デコーダ471は、分離部461から供給される互換情報に基づいて、分離部461から供給される互換ストリームと補助ストリームのうち、互換ストリームを識別する。
ステップS473において、互換用デコーダ471は、互換ストリームに含まれる互換画像をAVC方式に対応する方式で復号し、その結果得られる互換画像の多重化画像を画像生成部463に供給する。
ステップS474において、画像生成部463は、視聴者から2視点方式の3D画像の表示が指令されたかどうかを判定する。ステップS474で視聴者から2視点方式の3D画像の表示が指令されていないと判定された場合、即ち視聴者から多視点方式の3D画像の表示が指令された場合、補助用デコーダ472は、互換情報に基づいて、分離部461から供給される互換ストリームと補助ストリームのうちの補助ストリームを識別する。
そして、ステップS475において、補助用デコーダ472は、補助ストリームから符号化された補助画像の多重化画像と時間多重化画像を抽出し、図2の補助用エンコーダ62に対応する方式で復号する。補助用デコーダ472は、復号の結果得られる補助画像の多重化画像と時間多重化画像を画像生成部127に供給し、処理をステップS476に進める。
ステップS476において、画像情報取得部123は、分離部461から供給される画像情報を取得し、画像生成部463に入力する。ステップS477において、視点間距離情報取得部124は、分離部461から供給される視点間距離情報を取得し、画像生成部463に入力する。
ステップS478において、視差画像情報取得部125は、分離部461から供給される視差画像情報を取得し、画像生成部463に入力する。ステップS479において、互換情報取得部126は、分離部461から供給される互換情報を取得し、画像生成部463に入力する。
ステップS480において、画像生成部463は、視点間距離情報取得部124からの視点間距離情報と、図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。
ステップS481において、画像生成部463は、ステップS480で決定された各視点の位置、画像情報取得部123からの画像情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像の多重化画像、補助画像の多重化画像、および時間多重化画像を用いて、各視点の、互換画像や補助画像の半分の解像度の画像を生成する。
ステップS482およびS483は、図18のステップS92およびS93と同様であるので、説明は省略する。
ステップS474で視聴者から2視点方式の3D画像の表示が指令されたと判定された場合、ステップS484において、画像情報取得部123は、分離部461から供給される画像情報を取得し、画像生成部463に入力する。
ステップS485およびステップS486の処理は、図18のステップS94およびS95の処理と同様であるので、説明は省略する。
なお、復号装置460との互換性を有する互換ストリームのみを復号可能な復号装置では、補助ストリームは無視され、ステップS473,S484、およびS485の処理のみが行われる。但し、この場合、ステップS484の処理では、予め決められた多重化方式に基づいて、互換画像の多重化画像が分離される。
<第6実施の形態>
[符号化装置の第6実施の形態の構成例]
図42は、本技術を適用した符号化装置の第6実施の形態の構成例を示すブロック図である。
図42に示す構成のうち、図35の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図42の符号化装置480の構成は、主に、視差画像生成部143、エンコーダ145、視差画像情報生成部57の代わりに視差画像生成部481、エンコーダ482、視差画像情報生成部483が設けられている点が図35の構成と異なる。符号化装置480は、互換画像に共通の視差値を表す共通視差画像と補助画像の共通視差画像を符号化する。
具体的には、符号化装置480の視差画像生成部481は、撮影部141A乃至撮影部141Dから供給される画像A2乃至画像D2を用いて、画像A2と画像B2の間の各画素の視差を検出し、画像C2と画像D2の間の各画素の視差を検出する。視差画像生成部481は、画像A2と画像B2の間の各画素の視差を表す視差値からなる視差画像を、互換画像の共通視差画像AB2’として生成し、エンコーダ482に供給する。また、視差画像生成部481は、画像C2と画像D2の間の各画素の視差を表す視差値からなる視差画像を、補助画像の共通視差画像CD2’として生成し、エンコーダ482に供給する。
また、視差画像生成部481は、互換画像および補助画像の視差画像が共通視差画像であることを示す情報を視差画像情報生成部483に供給する。
エンコーダ482は、互換用エンコーダ151と補助用エンコーダ491により構成される。補助用エンコーダ491は、画像変換部142からの補助画像の多重化画像、並びに視差画像生成部481からの互換画像の共通視差画像AB2’および補助画像の共通視差画像CD2’を3DV方式で符号化する。補助用エンコーダ491は、その結果得られる符号化ストリームを補助ストリームとして多重化部443に供給する。
視差画像情報生成部483は、視差画像生成部53から供給される情報に基づいて、互換画像と補助画像の視差画像が共通視差画像であることを示す情報などを、視差画像情報として生成し、多重化部443に供給する。
[符号化装置の処理の説明]
図43および図44は、図42の符号化装置480による符号化処理を説明するフローチャートである。この符号化処理は、例えば、撮影部141A乃至撮影部141Dから画像A2乃至画像D2が出力されたとき開始される。
図43のステップS491乃至S498の処理は、図38のステップS451乃至S458の処理と同様であるので、説明は省略する。
図44のステップS499において、視差画像生成部481は、撮影部141A乃至撮影部141Dから供給される画像A2乃至画像D2を用いて、画像A2と画像B2間の各画素の視差と、画像C2と画像D2の各画素の視差を検出する。そして、視差画像生成部481は、画像A2と画像B2の間の各画素の視差を表す視差値からなる共通視差画像AB2’と、画像C2と画像D2の間の各画素の視差を表す視差値からなる共通視差画像CD2’を生成する。
ステップS500において、視差画像情報生成部483は、視差画像生成部481から供給される情報に基づいて、互換画像と補助画像の視差画像が共通視差画像であることを示す情報などを、視差画像情報として生成し、多重化部443に入力する。
ステップS501において、視差画像生成部481は、ステップS499で生成された補助画像の共通視差画像CD2’と互換画像の共通視差画像AB2’をエンコーダ482に入力する。
ステップS502において、エンコーダ482の互換用エンコーダ151は、画像変換部142から供給される互換画像の多重化画像を既存のAVC方式で符号化し、その結果得られる符号化ストリームを互換ストリームとして多重化部443に供給する。
ステップS503において、補助用エンコーダ491は、画像変換部142からの補助画像の多重化画像、並びに、視差画像生成部481からの互換画像の共通視差画像、および補助画像の共通視差画像を3DV方式で符号化する。補助用エンコーダ491は、符号化の結果得られる符号化ストリームを補助用ストリームとして多重化部443に供給する。
ステップS504において、多重化部443は、互換用エンコーダ151から供給される互換ストリーム、補助用エンコーダ491から供給される補助ストリーム、および補助情報からTSを生成して、多重化し、その結果得られる多重化ストリームを送信する。この多重化ストリームは、例えばBD等に記録されたり、放送用ストリームとして送信されたりする。そして、処理は終了する。
[復号装置の構成例]
図45は、図42の符号化装置480から送信される多重化ストリームを復号する復号装置の構成例を示す図である。
図45に示す構成のうち、図40の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図45の復号装置500の構成は、主に、デコーダ122、画像生成部171の代わりに、デコーダ501、画像生成部502が設けられている点が図40の構成と異なる。復号装置500は、符号化装置480から送信される多重化ストリームを復号し、2視点の画像または多視点の画像を生成して、図示せぬ表示装置に表示させる。
具体的には、復号装置500のデコーダ501は、互換用デコーダ471と補助用デコーダ511により構成される。デコーダ501の補助用デコーダ511は、分離部461から供給される互換情報に基づいて、分離部461から供給される互換ストリームと補助ストリームのうち、互換ストリームを識別する。また、補助用デコーダ511は、補助ストリームに含まれる符号化された補助画像の多重化画像、互換画像の共通視差画像AB2’、および補助画像の共通視差画像CD2’を、図42の補助用エンコーダ491に対応する方式で復号する。補助用デコーダ511は、復号の結果得られる補助画像の多重化画像、共通視差画像AB2’、および共通視差画像CD2’を画像生成部502に供給する。
画像生成部502は、視聴者からの表示指令に応じて、画像を出力し、図示せぬ表示装置に表示させる。詳細には、画像生成部502は、視聴者からの多視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報、視点間距離情報取得部124からの視点間距離情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像の多重化画像、補助画像の多重化画像、共通視差画像AB2’、および共通視差画像CD2’を用いて、図示せぬ表示装置に対応する3以上の視点数の、互換画像や補助画像の解像度の半分の解像度の画像を生成する。
より詳細には、画像生成部502は、視差画像情報取得部125からの視差画像情報に含まれる互換画像と補助画像の視差画像が共通視差画像であることを示す情報に基づいて、共通視差画像AB2’と共通視差画像CD2’をそのままにする。
また、画像生成部502は、図17の画像生成部171と同様に、画像情報取得部123からの画像情報に含まれる補助画像の多重化方式を示す情報に基づいて、補助画像の多重化画像から、各補助画像を分離する。さらに、画像生成部502は、画像生成部171と同様に、画像情報に含まれる互換画像の多重化方式を示す情報に基づいて、互換画像の多重化画像から、各互換画像を分離する。
また、画像生成部502は、画像生成部171と同様に、視点間距離情報と図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。そして、画像生成部502は、各互換画像、各補助画像、共通視差画像AB2’、および共通視差画像CD2’を用いて、位置が決定された各視点の画像を生成する。そして、画像生成部502は、画像生成部171と同様に、生成された多視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
また、画像生成部502は、画像生成部171と同様に、視聴者からの2視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報に基づいて、デコーダ501から供給される互換画像の多重化画像を、互換画像の解像度の半分の解像度の画像A2と画像B2に分離する。そして、画像生成部502は、画像生成部171と同様に、分離された互換画像の解像度の半分の解像度の画像A2と画像B2を交互に出力して、図示せぬ表示装置に表示させる。このとき、視聴者は、画像A2の表示時に左目用のシャッタまたは右目用のシャッタの一方が開き、画像B2の表示時に他方が開くメガネを装着して、表示装置に交互に表示される画像A2と画像B2を見ることにより、3D画像を見ることができる。
[復号装置の処理の説明]
図46は、図45の復号装置500による復号処理を説明するフローチャートである。この復号処理は、例えば、図42の符号化装置480から送信される多重化ストリームが復号装置500に入力されたとき、開始される。
図46のステップS511乃至S514の処理は、図41のステップS471乃至S474の処理と同様であるので、説明は省略する。
ステップS515において、補助用デコーダ511は、補助ストリームから符号化された補助画像の多重化画像、互換画像の共通視差画像AB2’、および補助画像の共通視差画像CD2’を抽出し、図42の補助用エンコーダ491における符号化方式に対応する方式で復号する。補助用デコーダ511は、復号の結果得られる補助画像の多重化画像、共通視差画像AB2’、および共通視差画像CD2’を画像生成部502に供給する。
ステップS516乃至S520の処理は、図41のステップS476乃至S480の処理と同様であるので、説明は省略する。
ステップS520の処理後、ステップS521において、画像生成部502は、ステップS519で決定された各視点の位置、画像情報取得部123からの画像情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像、補助画像の多重化画像、共通視差画像AB2’、および共通視差画像CD2'を用いて、各視点の、互換画像や補助画像の半分の解像度の画像を生成する。
ステップS522乃至S526の処理は、図41のステップS482乃至S486の処理と同様であるので、説明は省略する。
なお、符号化装置440および符号化装置480は、符号化装置140と同様に2視点の互換画像を多重化して符号化したが、図19の符号化装置180と同様に2視点の互換画像を多重化せずに符号化するようにしてもよい。また、符号化装置440および符号化装置480は、図5の符号化装置50と同様に、1視点の互換画像を符号化するようにしてもよい。
また、符号化装置140と符号化装置180は、互換画像と補助画像の視差画像を多重化せずに符号化するようにしてもよい。さらに、符号化装置50は、補助画像の視差画像を多重化せずに符号化するようにしてもよい。
<符号化対象の多重化パターンの例>
図47は、互換画像の視点数が2であり、補助画像の視点数が2である場合の、符号化対象の多重化パターンの例を示す図である。
図47の(1)に示すように、図14の符号化装置140は、互換画像である画像A2と画像B2を空間方向に多重化し、AVC方式で符号化する。また、符号化装置140は、補助画像である画像C2と画像D2、互換画像の視差画像である視差画像A2’と視差画像B2’、並びに、補助画像の視差画像である視差画像C2’と視差画像D2’をそれぞれ空間方向に多重化して、MVC方式に準ずる3DV方式で符号化する。
なお、符号化装置140は、図47の(2)に示すように、視差画像A2’乃至D2’を多重化せず、MVC方式に準ずる3DV方式で符号化するようにしてもよい。さらに、図47の(3)に示すように、図42の符号化装置480は、互換画像の視差画像である視差画像A2’と視差画像B2’の代わりに、共通視差画像AB2’を符号化し、補助画像の視差画像である視差画像C2’と視差画像D2’の代わりに、共通視差画像CD2’を符号化する。
また、図47の(4)に示すように、図35の符号化装置440は、互換画像の視差画像である視差画像A2’と視差画像B2’を空間方向に多重化せず、視差画像A2’、視差画像B2’、および補助画像の視差画像の多重化画像をフレームシーケンシャル方式で多重化し、MVC方式に準ずる3DV方式で符号化する。
さらに、図47の(5)に示すように、図19の符号化装置180は、互換画像である画像A2と画像B2を多重化せずに、画像A2をAVC方式で符号化し、画像B2を、画像A2をベースビューとしたMVC方式で符号化する。また、符号化装置180は、補助画像である画像C2と画像D2、互換画像の視差画像である視差画像A2’と視差画像B2’、並びに、補助画像の視差画像である視差画像C2’と視差画像D2’をそれぞれ空間方向に多重化し、MVC方式に準ずる3DV方式で符号化する。
なお、符号化装置180は、図47の(6)に示すように、視差画像A2’乃至D2’を多重化せず、MVC方式に準ずる3DV方式で符号化するようにしてもよい。また、符号化装置180は、図47の(7)に示すように、符号化装置480と同様に、視差画像A2’と視差画像B2’の代わりに共通視差画像AB2’を符号化し、視差画像C2’と視差画像D2’の代わりに共通視差画像CD2’を符号化するようにしてもよい。
さらに、符号化装置180は、図47の(8)に示すように、符号化装置440と同様に、視差画像A2’と視差画像B2’を空間方向に多重化せず、視差画像A2’、視差画像B2’、および補助画像の視差画像の多重化画像をフレームシーケンシャル方式で多重化し、MVC方式に準ずる3DV方式で符号化するようにすることもできる。
図48は、図47の(1)乃至(8)に示した多重化パターンでの多重化による効果の特徴を示す図である。
図48の表では、効果の項目「互換性」、「画質」、および「データ量」が設けられ、図47の(1)乃至(8)に示した多重化パターンにおける各項目の効果の度合が表されている。なお、図48の表において、丸は、効果があることを表し、二重丸は、顕著な効果があることを表す。
図47の(1)に示した多重化パターンで多重化が行われる場合、互換画像の多重化方式および符号化方式が既存の方式と同一となり、互換性が確保される。また、視差画像が、互換画像と同様に空間方向に多重化されるので、例えば、復号装置側に用意されている互換画像を分離する分離部を用いて視差画像を分離することができる。従って、復号装置側で視差画像を分離できることが保証される。よって、この場合、互換性において顕著な効果があり、図48の項目「互換性」に対応して二重丸が記述されている。
また、図47の(2)に示した多重化パターンで多重化が行われる場合、互換画像の多重化方式および符号化方式が既存の方式と同一となり、互換性が確保される。また、視差画像の解像度が多重化前の画像と同一の解像度であるので精度が高い。その結果、復号装置において、視差画像を用いて生成される所定の視点の画像の精度が向上する。従って、この場合、互換性と、視差画像を用いて生成される画像の画質とにおいて効果があり、図48の項目「互換性」と「画質」に対応して丸が記述されている。
さらに、図47の(3)に示した多重化パターンで多重化が行われる場合、互換画像の符号化方式および多重化方式が既存の方式と同一となり、互換性が確保される。また、多重化前の画像と同一の解像度の互換画像および補助画像の視差画像のデータ量が、2視点分の視差画像のデータ量に削減される。従って、この場合、互換性とデータ量において効果があり、図48の項目「互換性」と「データ量」に対応して丸が記述されている。
また、図47の(4)に示した多重化パターンで多重化が行われる場合、互換画像の符号化方式および多重化方式が既存の方式と同一となり、互換性が確保される。また、視差画像が時間方向に多重化されるので、各時刻における視差画像のデータ量が、図47の(3)の場合に比べてより削減され、伝送可能なデータ量が増加する。従って、多重化前の画像と同一の解像度の視差画像を伝送可能なほど伝送帯域に余裕がない状況であっても、多重化前の画像と同一の解像度の視差画像を伝送することができるので、復号装置において、視差画像を用いて生成される所定の視点の画像の精度が向上する。よって、この場合、互換性と視差画像を用いて生成される画像の画質に効果があり、データ量において顕著な効果がある。従って、図48の項目「互換性」と「画質」に対応して丸が記述され、「データ量」に対応して二重丸が記述されている。
図47の(1)乃至(4)に示した多重化パターンでの多重化は、例えば、放送、ATSC(Advanced Television Systems Committee)2.0規格等に準拠したIP(Internet Protocol)と融合した放送である次世代放送、またはインターネット配信のアプリケーション用の画像を符号化対象とするときに行われる。
さらに、図47の(5)に示した多重化パターンで多重化が行われる場合、互換画像の符号化方式および多重化方式が既存の方式と同一となり、互換性が確保される。また、各視差画像の解像度が画像の解像度の半分であるので、互換画像および補助画像の視差画像のデータ量が、2視点分の視差画像のデータ量に削減される。従って、この場合、互換性とデータ量に効果があり、図48の項目「互換性」と「データ量」に対応して丸が記述されている。
また、図47の(6)に示した多重化パターンで多重化が行われる場合、図47の(2)と同様に、互換性が確保されるとともに、復号装置において視差画像を用いて生成される所定の視点の画像の精度が向上する。従って、この場合、互換性と視差画像を用いて生成される画像の画質に効果があり、図48の項目「互換性」と「画質」に対応して丸が記述されている。
また、図47の(7)に示した多重化パターンで多重化が行われる場合、図47の(3)と同様に、互換性が確保されるとともに、視差画像のデータ量が削減される。従って、この場合、互換性とデータ量に効果があり、図48の項目「互換性」と「データ量」に対応して丸が記述されている。
図47の(8)に示した多重化パターンで多重化が行われる場合、図47の(4)と同様に、互換性が確保される。また、図47の(4)と同様に、各時刻における視差画像のデータ量が、図47の(7)の場合に比べてより削減され、その結果、復号装置において視差画像を用いて生成される所定の視点の画像の精度が向上する。従って、この場合、互換性と視差画像を用いて生成される画像の画質に効果があり、データ量において顕著な効果がある。よって、図48の項目「互換性」と「画質」に対応して丸が記述され、「データ量」に対応して二重丸が記述されている。
また、図47の(5)、(7)、および(8)に示した多重化パターンでの多重化は、例えば、BD、放送、次世代放送、またはインターネット配信のアプリケーション用の画像を符号化対象とするときに行われる。さらに、図47の(6)に示した多重化パターンでの多重化は、例えば、BD、次世代放送、またはインターネット配信のアプリケーション用の画像を符号化対象とするときに行われる。
図49は、互換画像の視点数が1であり、補助画像の視点数が2である場合の、符号化対象の多重化パターンの例を示す図である。
図49の(1)に示すように、図5の符号化装置50は、互換画像である画像A1をAVC方式で符号化する。また、符号化装置50は、補助画像である画像B1と画像C1、および、補助画像の視差画像である視差画像B1’と視差画像C1’をそれぞれ時間方向に多重化する。そして、符号化装置50は、互換画像の視差画像である視差画像A1’、補助画像の多重化画像、および補助画像の視差画像の多重化画像を、MVC方式に準ずる3DV方式で符号化する。
なお、符号化装置50は、図49の(2)に示すように、視差画像A1’乃至C1’を多重化せず、MVC方式に準ずる3DV方式で符号化するようにしてもよい。また、図49の(3)に示すように、符号化装置50は、符号化装置480と同様に、補助画像の視差画像の多重化画像の代わりに、補助画像である画像Bと画像Cの共通視差画像BC1’を符号化するようにすることもできる。
さらに、図49の(4)に示すように、符号化装置50は、符号化装置440と同様に、視差画像B1’と視差画像C1’を空間方向に多重化せず、視差画像A1’乃至視差画像C1’をフレームシーケンシャル方式で多重化し、MVC方式に準ずる3DV方式で符号化するようにすることもできる。
なお、図49の(1)乃至(4)に示した多重化パターンでの多重化による効果、および、その多重化パターンでの多重化を行うときの符号化対象は、それぞれ、図47の(5)乃至(8)に示した多重化パターンでの多重化による効果および符号化対象と同様である。但し、図49の(1)に示した多重化パターンでの多重化では、互換画像の視差画像の解像度は互換画像と同一であるので、この多重化による効果としての視差画像のデータ量の削減は、補助画像の視差画像についてのみの効果である。
図50は、互換画像の視点数が2であり、補助画像の視点数が0である場合の、符号化対象の多重化パターンの例を示す図である。
互換画像の視点数が2であり、補助画像の視点数が0である場合、図50の(1)に示すように、図14の符号化装置140の場合と同様に、互換画像である画像A2と画像B2が空間方向に多重化されて、AVC方式で符号化される。また、互換画像の視差画像である視差画像A2’と視差画像B2’が空間方向に多重化されて、AVC方式に準ずる3DV方式で符号化される。
なお、図50の(2)に示すように、視差画像A2’と視差画像B2’は多重化されず、MVC方式に準ずる3DV方式で符号化されるようにしてもよい。また、図50の(3)に示すように、符号化装置480の場合と同様に、視差画像A2’と視差画像B2’の代わりに共通視差画像AB2’が符号化されるようにすることもできる。
また、図50の(4)に示すように、符号化装置440の場合と同様に、視差画像A2’と視差画像B2’が、時間方向に多重化されるのではなく、フレームシーケンシャル方式で多重化され、符号化されるようにすることもできる。
さらに、図50の(5)に示すように、符号化装置180の場合と同様に、互換画像である画像A2と画像B2が多重化されずに、画像A2がAVC方式で符号化されるとともに、画像B2が、画像A2をベースビューとしたMVC方式で符号化されるようにすることもできる。
また、この場合、図50の(6)に示すように、図50の(2)と同様に、視差画像が多重化されずに符号化されたり、図50の(7)に示すように、図50の(3)と同様に、共通視差画像AB2’が符号化されたりするようにすることもできる。また、図50の(8)に示すように、図50の(4)と同様に、互換画像の視差画像がフレームシーケンシャル方式で多重化され、符号化されるようにすることもできる。
なお、図49の(1)乃至(8)に示した多重化パターンでの多重化による効果、および、その多重化パターンでの多重化を行うときの符号化対象は、それぞれ、図47の(1)乃至(8)に示した多重化パターンでの多重化による効果および符号化対象と同一である。
また、上述した説明では、フレームシーケンシャル方式で多重化される視差画像の解像度は、多重化前の画像と同一の解像度であったが、多重化前の画像の解像度より低下させるようにしてもよい。また、補助画像も、視差画像と同様にフレームシーケンシャル方式で多重化されるようにしてもよい。
さらに、上述した説明では、符号化装置において、画像の多重化方式を示す情報と視差画像の多重化方式を示す情報が伝送されたが、図47、図49、および図50に示した多重化パターンを識別する情報を伝送するようにしてもよい。
また、符号化装置は、符号化対象の画像に対応するアプリケーションを識別するフラグを伝送するようにしてもよい。
<第7実施の形態>
[符号化装置の第7実施の形態の構成例]
図51は、本技術を適用した符号化装置の第7実施の形態の構成例を示すブロック図である。
図51に示す構成のうち、図35の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図51の符号化装置520の構成は、主に、エンコーダ145、多重化部443の代わりにエンコーダ523、伝送部524が設けられている点、および、多重化部521と多重化情報生成部522が新たに設けられている点が図35の構成と異なる。
符号化装置520は、互換画像の多重化画像、補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像をフレームシーケンシャル方式で多重化し、符号化する。
具体的には、符号化装置520の多重化部521は、画像変換部142による多重化の結果得られる互換画像および補助画像の多重化画像、並びに、視差画像生成部143による多重化の結果得られる互換画像および補助画像の視差画像の多重化画像を、フレームシーケンシャル方式で多重化する。
そして、多重化部521は、多重化の結果得られる、1フレーム時間内に、互換画像の多重化画像、互換画像の視差画像の多重化画像、補助画像の多重化画像、および補助画像の視差画像の多重化画像が順に存在する多重化画像を、時間方向多重化画像としてエンコーダ523に供給する。
また、多重化部521は、互換画像および補助画像の多重化画像、並びに、互換画像および補助画像の視差画像の多重化画像が、フレームシーケンシャル方式で多重化されていること、時間多重化画像内の画像の配置順等を示す情報を、多重化情報生成部522およびエンコーダ523に供給する。
多重化情報生成部522は、多重化部521から供給される情報に基づいて、その情報などを、互換画像および補助画像、並びに、互換画像および補助画像の視差画像の多重化に関する全体多重化情報として生成し、伝送部524に供給する。
エンコーダ523は、互換用エンコーダ531と補助用エンコーダ532により構成される。エンコーダ523は、多重化部521から供給される情報に基づいて、多重化部521から供給される時間多重化画像のうちの互換画像の多重化画像を指定し、互換画像の多重化画像を互換用エンコーダ531に供給する。また、エンコーダ523は、多重化部521から供給される情報に基づいて、時間多重化画像のうちの補助画像の多重化画像並びに互換画像および補助画像の視差画像の多重化画像を、補助用エンコーダ532に供給する。
エンコーダ523の互換用エンコーダ531は、時間多重化画像のうちの、互換画像の多重化画像を既存のAVC方式で符号化する。補助用エンコーダ532は、時間多重化画像のうちの補助画像の多重化画像並びに互換画像および補助画像の視差画像の多重化画像を、3DV方式で符号化する。このとき、補助画像の多重化画像は、互換画像の多重化画像を参照して符号化され、補助画像の視差画像の多重化画像は、互換画像の視差画像の多重化画像を参照して符号化される。
エンコーダ523は、互換用エンコーダ531または補助用エンコーダ532で符号化された結果得られる時間多重化画像の符号化データからなるビットストリームを伝送部524に供給する。
伝送部524は、エンコーダ523から供給されるビットストリーム、画像情報生成部54からの画像情報、互換情報生成部55からの互換情報、視点間距離情報生成部144からの視点間距離情報、視差画像情報生成部57からの視差画像情報、多重化情報生成部522からの全体多重化情報などを用いて、TSを生成する。多重化部443は、生成されたTSを送信する。
[符号化装置の処理の説明]
図52および図53は、図51の符号化装置520による符号化処理を説明するフローチャートである。この符号化処理は、例えば、撮影部141A乃至撮影部141Dから画像A2乃至画像D2が出力されたとき開始される。
図52のステップS531乃至S537の処理は、図38のステップS451乃至S457の処理と同様であるので、説明は省略する。
ステップS537の処理後、ステップS538において、画像変換部142は、互換画像の多重化画像と補助画像の多重化画像を多重化部521に入力し、処理を図53のステップS539に進める。
図53のステップS539乃至S542の処理は、図39のステップS459乃至S462の処理と同様であるので、説明は省略する。
ステップS543の処理後、ステップS544において、多重化部521は、画像変換部142による多重化の結果得られる互換画像および補助画像の多重化画像、並びに、視差画像生成部143による多重化の結果得られる互換画像および補助画像の視差画像の多重化画像を、フレームシーケンシャル方式で多重化する。多重化部521は、多重化の結果得られる多重化画像を、時間方向多重化画像としてエンコーダ523に供給する。
また、多重化部521は、互換画像および補助画像の多重化画像並びに視差画像の多重化画像がフレームシーケンシャル方式で多重化されていること、時間多重化画像内の画像の配置順等を示す情報を、多重化情報生成部522およびエンコーダ523に供給する。
ステップS545において、多重化情報生成部522は、多重化部521から供給される情報に基づいて、その情報などを全体多重化情報として生成し、伝送部524に入力する。
ステップS546において、互換用エンコーダ531は、エンコーダ523によって多重化部521からの情報に基づいて入力される、時間多重化画像のうちの互換画像の多重化画像を既存のAVC方式で符号化する。
ステップS547において、補助用エンコーダ532は、エンコーダ523によって多重化部521からの情報に基づいて入力される、時間多重化画像のうちの補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を、3DV方式で符号化する。エンコーダ523は、ステップS546およびS547の符号化の結果得られる時間多重化画像の符号化データからなるビットストリームを伝送部524に供給する。
ステップS548において、伝送部524は、エンコーダ523からのビットストリーム、補助情報、および多重化情報生成部522からの全体多重化情報からTSを生成し、送信する。このTSは、例えばBD等に記録されたり、放送用ストリームとして送信されたりする。そして、処理は終了する。
以上のように、符号化装置520は、互換画像の多重化画像、補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像の符号化データから1本のビットストリームを生成する。従って、1本のビットストリームのみを復号可能なデコーダを有する復号装置において、符号化装置520により生成されたビットストリームを復号することができる。
なお、上述した説明では、互換画像の視差画像、補助画像、および補助画像の視差画像が、互換画像の符号化方式に準ずる3DV方式で符号化されるものとしたが、互換画像の符号化方式に準じないMPEG2(Moving Picture Experts Group phase 2)方式等で符号化されるようにしてもよい。
[復号装置の構成例]
図54は、図51の符号化装置520から送信されるTSを復号する復号装置の構成例を示す図である。
図54に示す構成のうち、図40の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図54の復号装置540の構成は、主に、分離部121、デコーダ122、画像生成部171の代わりに受信部541、デコーダ542、画像生成部544が設けられている点、および、多重化情報取得部543が新たに設けられている点が図40の構成と異なる。復号装置540は、符号化装置520から送信されるTSに含まれる時間多重化画像のビットストリームを復号し、2視点の画像または多視点の画像を生成して、図示せぬ表示装置に表示させる。
具体的には、復号装置540の受信部541は、符号化装置520から送信されてくるTSを受信する。受信部541は、TSに含まれる時間多重化画像のビットストリームを抽出し、デコーダ542に供給する。また、受信部541は、TSに含まれる補助情報を抽出し、補助情報のうちの画像情報を画像情報取得部123に供給し、視点距離情報を視点間距離情報取得部124に供給する。さらに、受信部541は、補助情報のうちの視差画像情報を視差画像情報取得部125に供給し、互換情報を互換情報取得部126とデコーダ501に供給する。また、受信部541は、TSに含まれる全体多重化情報を抽出し、多重化情報取得部543に供給する。
デコーダ542は、互換用デコーダ551と補助用デコーダ552により構成される。デコーダ542の互換用デコーダ551は、分離部461から供給される互換情報に基づいて、受信部541から供給されるビットストリームから互換画像の多重化画像の符号化データを抽出する。互換用デコーダ551は、抽出された互換画像の多重化画像の符号化データをAVC方式に対応する方式で復号し、画像生成部544に供給する。
補助用デコーダ552は、分離部461から供給される互換情報に基づいて、受信部541から供給されるビットストリームから補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像の符号化データを抽出する。補助用デコーダ552は、抽出された補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像の符号化データを、図51の補助用エンコーダ532における符号化方式に対応する方式で復号し、画像生成部544に供給する。
多重化情報取得部543は、受信部541から供給される全体多重化情報を取得し、画像生成部544に供給する。
画像生成部544は、視聴者からの表示指令に応じて、画像を出力し、図示せぬ表示装置に表示させる。具体的には、画像生成部544は、視聴者からの多視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報、視点間距離情報取得部124からの視点間距離情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報、多重化情報取得部543からの全体多重化情報等に基づいて、互換画像の多重化画像、補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を用いて、図示せぬ表示装置に対応する3以上の視点数の、互換画像や補助画像の解像度の半分の解像度の画像を生成する。
より詳細には、画像生成部544は、多重化情報取得部543からの全体多重化情報に基づいて、補助用デコーダ552から供給される補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を識別する。また、画像生成部544は、図17の画像生成部171と同様に、視差画像情報取得部125からの視差画像情報に含まれる補助画像の視差画像の多重化方式を示す情報に基づいて、補助画像の視差画像の多重化画像から、各補助画像の視差画像を分離する。また、画像生成部544は、画像生成部171と同様に、視差画像情報に含まれる互換画像の視差画像の多重化方式を示す情報に基づいて、互換画像の視差画像の多重化画像から、各互換画像の視差画像を分離する。
さらに、画像生成部544は、画像生成部171と同様に、画像情報取得部123からの画像情報に含まれる補助画像の多重化方式を示す情報に基づいて、補助画像の多重化画像から、各補助画像を分離する。また、画像生成部544は、画像生成部171と同様に、画像情報に含まれる互換画像の多重化方式を示す情報に基づいて、互換画像の多重化画像から、各互換画像を分離する。
また、画像生成部544は、画像生成部171と同様に、視点間距離情報と図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。そして、画像生成部544は、画像生成部171と同様に、各互換画像、各補助画像、各互換画像の視差画像、および各補助画像の視差画像を用いて、位置が決定された各視点の画像を生成する。そして、画像生成部544は、生成された多視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
また、画像生成部544は、画像生成部171と同様に、視聴者からの2視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報に基づいて、デコーダ542から供給される互換画像の多重化画像を、互換画像の解像度の半分の解像度の画像A2と画像B2に分離する。そして、画像生成部544は、画像生成部171と同様に、分離された互換画像の解像度の半分の解像度の画像A2と画像B2を交互に出力して、図示せぬ表示装置に表示させる。このとき、視聴者は、画像A2の表示時に左目用のシャッタまたは右目用のシャッタの一方が開き、画像B2の表示時に他方が開くメガネを装着して、表示装置に交互に表示される画像A2と画像B2を見ることにより、3D画像を見ることができる。
[復号装置の処理の説明]
図55は、図54の復号装置540による復号処理を説明するフローチャートである。この復号処理は、例えば、図51の符号化装置520から送信されるTSが復号装置540に入力されたとき、開始される。
図55のステップS551において、復号装置540の受信部541は、符号化装置520から送信されてくるTSを受信する。受信部541は、TSに含まれるビットストリームを抽出し、デコーダ542に供給する。また、受信部541は、TSに含まれる補助情報を抽出し、補助情報のうちの画像情報を画像情報取得部123に供給し、視点距離情報を視点間距離情報取得部124に供給する。さらに、受信部541は、補助情報のうちの視差画像情報を視差画像情報取得部125に供給し、互換情報を互換情報取得部126に供給する。また、受信部541は、TSに含まれる全体多重化情報を抽出し、多重化情報取得部543に供給する。
ステップS552において、画像生成部544は、図41のステップS474の処理と同様に、視聴者から2視点方式の3D画像の表示が指令されたかどうかを判定する。ステップS552で視聴者から2視点方式の3D画像の表示が指令されていないと判定された場合、即ち多視点方式の3D画像の表示が指令された場合、処理はステップS553に進む。
ステップS553において、デコーダ542の互換用デコーダ551は、受信部541から供給される互換情報に基づいて、ビットストリームから互換画像の多重化画像の符号化データを抽出し、AVC方式に対応する方式で復号する。そして、互換用デコーダ551は、復号の結果得られる互換画像の多重化画像を画像生成部544に供給する。
ステップS554において、補助用デコーダ552は、受信部541から供給される互換情報に基づいて、ビットストリームから補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像の符号化データを抽出し、図51の補助用エンコーダ532に対応する方式で復号する。補助用デコーダ552は、復号の結果得られる補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を画像生成部544に供給し、処理をステップS555に進める。
ステップS555乃至S558の処理は、図41のステップS476乃至S479の処理と同様であるので、説明は省略する。
ステップS558の処理後、ステップS559において、多重化情報取得部543は、受信部541から供給される全体多重化情報を取得し、画像生成部544に入力する。
ステップS560において、画像生成部544は、図41のステップS480の処理と同様に、視点間距離情報取得部124からの視点間距離情報と、図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。
ステップS561において、画像生成部544は、ステップS560で決定された各視点の位置、画像情報取得部123からの画像情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報、多重化情報取得部543からの全体多重化情報等に基づいて、互換画像の多重化画像、補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を用いて、各視点の、互換画像や補助画像の半分の解像度の画像を生成する。そして、処理はステップS562に進む。
ステップS562およびS563の処理は、図41のステップS482およびS483の処理と同様であるので、説明は省略する。
ステップS552で視聴者から2視点方式の3D画像の表示が指令されたと判定された場合、ステップS564において、互換用デコーダ551は、受信部541から供給される互換情報に基づいて、ビットストリームから互換画像の多重化画像の符号化データを抽出し、AVC方式に対応する方式で復号する。そして、互換用デコーダ551は、復号の結果得られる互換画像の多重化画像を画像生成部544に供給する。
ステップS565乃至S567の処理は、図41のステップS484乃至S486の処理と同様であるので、説明は省略する。
なお、復号装置540との互換性を有する互換画像のみを復号可能な復号装置では、処理可能な互換画像の符号化データ以外の符号化データが無視され、ステップS564,S566、およびS567の処理が行われる。但し、この場合、ステップS566の処理では、予め決められた多重化方式に基づいて、互換画像の多重化画像が分離される。
以上のように、復号装置540は、互換画像の多重化画像、補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像の符号化データから生成された1本のビットストリームを復号することができる。
<本実施の形態におけるビットストリーム>
[ビットストリームの構成例]
図56は、本実施の形態で生成されるアクセスユニット単位のビットストリーム(符号化ストリーム)の構成例を示す図である。
なお、図56の例では、互換画像が1920×1080画素のL画像とR画像であり、補助画像が1920×1080画素のO画像である。また、L視差画像、R視差画像、およびO視差画像のサイズは、960×1080画素である。さらに、L画像はAVC方式で符号化され、R画像はMVC方式で符号化され、O画像、L視差画像、R視差画像、およびO視差画像は3DV方式で符号化される。また、L画像、R画像、O画像、L視差画像、R視差画像、O視差画像のビューIDは、それぞれ、0,1,2,3,4,5である。なお、ビューIDとは、各視点の画像および視差画像に固有のIDである。
図56に示すように、アクセスユニット単位のビットストリームには、例えば、先頭から順に、アクセスユニットデリミタ(AUD),SPS(Sequence Parameter Set)、画像用のMVC方式のSubset SPS(SubsetSPS1)、視差画像用の3DV方式のSubset SPS(Subset SPS2),PPS(Picture Parameter Set),AVC方式のSEI,MVC方式のSEI,3DV方式のSEI、符号化データのNAL(Network Abstraction Layer)ユニットが配置される。
アクセスユニットデリミタのNALユニットは、アクセスユニットの境界を表すNALユニットである。SPSのNALユニットは、AVC方式で定義されるプロファイルのうちのL画像のプロファイルを表すprofile_idc(図56の例では100)を含むSPSのNALユニットである。画像用のSubset SPSのNALユニットは、MVC方式で定義されるプロファイルのうちのR画像およびO画像のプロファイルを表すprofile_idc(図56の例では128)を含むSubset SPSのNALユニットである。視差画像用のSubset SPSのNALユニットは、3DV方式で視差画像用のプロファイルとして定義されるプロファイルのうちの、L視差画像、R視差画像、およびO視差画像のプロファイルを表すprofile_idc(図56の例では138)を含むSubset SPSのNALユニットである。
AVC方式のSEIのNALユニットは、L画像のSEIのNALユニットである。MVC方式のSEIのNALユニットは、L画像とR画像のSEIのNALユニットである。3DV方式のSEIのNALユニットは、L画像、R画像、O画像、L視差画像、R視差画像、およびO視差画像のSEIのNALユニットである。
符号化データのNALユニットとしては、先頭から順に、L画像の符号化データ、デリミタ(MVC DD)、R画像の符号化データ、デリミタ(3DV DD)、O画像の符号化データ、デリミタ(3DV DD)、L視差画像の符号化データ、デリミタ(3DV DD)、R視差画像の符号化データ、デリミタ(3DV DD)、O視差画像の符号化データのNALユニットが配置される。
L画像の符号化データのNALユニットには、NALユニットのタイプとしてAVC方式のピクチャであることを表す1または5を含むNALヘッダが付加される。また、デリミタ(MVC DD)のNALユニットは、MVC方式の符号化データの先頭を表すNALユニットである。R画像の符号化データのNALユニットには、NALユニットのタイプとしてMVC方式の符号化データを表す20を含むNALヘッダが付加される。また、デリミタ(3DV DD)のNALユニットは、3DV方式の符号化データの先頭を表すNALユニットである。また、O画像、L視差画像、R視差画像、およびO視差画像の符号化データのNALユニットには、NALユニットのタイプとして3DV方式の符号化データを表す21を含むNALヘッダが付加される。
[視差画像用の3DV方式のSubset SPSの記述例]
図57は、図56の視差画像用の3DV方式のSubset SPSの記述例を示す図である。
図57に示すように、視差画像用の3DV方式のSubset SPSには、L視差画像、R視差画像、およびO視差画像のプロファイルを表すprofile_idc(図57の例では138)を含むSPS(seq_parameter_set_data)と、3DV方式で定義されているprofile_idcごとの情報とが記述されている。
具体的には、視差画像用の3DV方式のSubset SPSには、profile_idcが138であるときの情報として、視差画像用拡張情報(seq_parameter_set_depth_extension)、視差画像用VUI拡張情報が含まれるかどうかを表す視差画像用VUI情報フラグ(depth_vui_parameters_present_flag)等が記述される。また、視差画像用VUI情報フラグが、視差画像用VUI拡張情報が含まれることを表す場合には、視差画像用VUI拡張情報(depth_vui_parameters__extension)も記述される。
なお、視差画像用の3DV方式のSubset SPSを復号時に参照する場合、即ち、L視差画像、R視差画像、およびO視差画像を復号する場合、IDRピクチャの復号時と同様に、参照画像はリセットされる。
図58は、図57の視差画像用拡張情報の記述例を示す図である。
図58に示すように、視差画像用拡張情報は、MVC方式のSubset SPS内の拡張情報(seq_parameter_set_mvc_extension)と同様に記述される情報と、各視差画像に対応する画像のビューID(ref_view_id)とからなる。
なお、図58では、MVC方式のSubset SPS内の拡張情報と同様に記述される情報は展開されて視差画像用拡張情報に含められる。従って、各視差画像のビューID(view_id)と、各視差画像に対応する画像のビューIDとを、視差画像ごとにまとめて記述することができる。即ち、視差画像の数を表す情報(num_views_minus1)を記述し、その数だけ、視差画像のビューIDと、その視差画像に対応する画像のビューIDを読み出させる記述を行うことができる。
これに対して、MVC方式のSubset SPS内の拡張情報と同様に記述される情報が展開されずに視差画像用拡張情報に含められる場合、視差画像用拡張情報のほかに、視差画像の数を表す情報を記述し、その数だけ、視差画像に対応する画像のビューIDを読み出させる記述を行う必要がある。その結果、視差画像の数を表す情報の記述と、その数だけ情報を読み出させる記述が重複する。
従って、図58に示すように、MVC方式のSubset SPS内の拡張情報と同様に記述される情報が展開されて視差画像用拡張情報に含められる場合、その情報が展開されずに視差画像用拡張情報に含められる場合に比べて、視差画像用拡張情報のデータ量を削減することができる。
図59は、図57の視差画像用VUI拡張情報の記述例を示す図である。
図59に示すように、視差画像用VUI拡張情報は、以下の点を除いて、MVC方式のVUI拡張情報(mvc_vui_parameters__extension)と同様に記述される。即ち、視差画像用VUI情報には、視差画像の各画素の、その視差画像に対応する画像上の位置のタイプを表す位置タイプが含まれるかどうかを表す位置タイプフラグ(depth_loc_info_present_flag)と解像度変換前の視差画像のサイズを表す変換前サイズ情報が含まれるかどうかを表す変換前サイズ情報フラグ(video_src_info_present_flag)が含まれる。また、位置タイプフラグが、位置タイプが含まれることを表す場合、視差画像用VUI情報には位置タイプも含まれ、変換前サイズ情報フラグが、変換前サイズ情報が含まれることを表す場合、視差画像用VUI情報には変換前サイズ情報も含まれる。
位置タイプは、トップフィールドの位置タイプ(depth_sample_loc_type_top_field)とボトムフィールドの位置タイプ(depth_sample_loc_type_bottom_field)からなる。トップフィールドおよびボトムフィールドの位置タイプは、それぞれ、MVC方式のVUI拡張情報に含まれるトップフィールドの位置タイプ(chroma_sample_loc_type_top_field)やボトムフィールドの位置タイプ(chroma_sample_loc_type_bottom_field)と同様に記述される。
また、変換前サイズ情報は、解像度変換前の視差画像の横方向のマクロブロック数を表す情報(pic_width_in_mbs_minus1)および縦方向のマクロブロック数を表す情報(pic_height_in_mbs_minus1)、アスペクト比を表すアスペクト情報が含まれるかどうかを表すアスペクト比フラグ(aspect_ratio_info_present_flag)等により構成される。なお、アスペクト比フラグが、アスペクト情報が含まれることを表す場合、変換前サイズ情報にはアスペクト情報も含まれる。
アスペクト情報は、アスペクト比に固有のIDであるアスペクト比ID(aspect_ratio_idc)等からなる。なお、このアスペクト比IDは、予め定義されているアスペクト比に付与されるほか、定義されていないアスペクト比全体に対しても付与される。そして、アスペクト情報に含まれるアスペクト比IDが、定義されていないアスペクト比全体に対して付与されたアスペクト比ID(Extended_SAR)である場合、アスペクト情報には、解像度変換前の視差画像のアスペクト比における横方向の値(sar_width)と縦方向の値(sar_height)も含まれる。
[3DV方式の符号化データのNALヘッダの記述例]
図60は、NALユニットタイプとして21を含む、3DV方式の符号化データのNALユニットのNALヘッダの記述例を示す図である。
図60に示すように、3DV方式の符号化データのNALヘッダには、NALユニットタイプが21であるときの情報として、視差画像用ヘッダ拡張情報が含まれているかどうかを表す視差画像用ヘッダ拡張情報フラグ(depth_extension_flag)等が記述される。ここで、視差画像用ヘッダ拡張情報は、3DV方式の視差画像の符号化データのNALヘッダに記述されるものである。
視差画像用ヘッダ拡張情報フラグが、視差画像用ヘッダ拡張情報が含まれていることを表す場合、3DV方式の符号化データのNALヘッダには、視差画像用ヘッダ拡張情報(nal_unit_header_depth_extension)も記述される。一方、視差画像用ヘッダ拡張情報フラグが、視差画像用ヘッダ拡張情報が含まれていないことを表す場合、3DV方式の符号化データのNALヘッダには、MVC方式用ヘッダ拡張情報(nal_unit_header_mvc_extension)も記述される。
図61は、図60の視差画像用ヘッダ拡張情報の記述例を示す図である。
図61に示すように、視差画像用ヘッダ拡張情報は、視差画像に対応する画像のビューID(ref_view_id)を含む点を除いて、MVC方式用ヘッダ拡張情報と同様に構成される。
[3DV方式のSEIの記述例]
図62は、図56の3DV方式のSEIの記述例を示す図である。
図62に示すように、3DV方式のSEIは、MVC方式のSEIと同様に、SEIのメッセージが記述される。
即ち、3DV方式のSEIには、オペレーションポイントを指定するかどうかを表すオペレーションポイントフラグ(operation_point_flag)が記述され、オペレーションポイントフラグが、オペレーションポイントを指定しないことを表す場合、アクセスユニット内の全ての画像および視差画像にSEIのメッセージを適応するかどうかを表す全コンポーネントフラグ(all_view_components_in_au_flag)が記述される。また、全コンポーネントフラグが、アクセスユニット内の全ての画像および視差画像に適応しないことを表す場合、SEIのメッセージを適応する画像および視差画像のビューIDの数(num_view_components_minus1)とビューID(sei_view_id)が記述される。
一方、オペレーションポイントフラグが、オペレーションポイントを指定することを表す場合、SEIのメッセージを適応するオペレーションポイントのうちの適応対象の画像および視差画像のビューID(sei_op_view_id)と、そのオペレーションポイントの番号(sei_op_temporal_id)とが記述される。そして、SEIのメッセージ(sei_rbsp)が記述される。なお、3DV方式のSEIでは、複数のSEIのメッセージを記述することが可能である。
なお、図56の例では、R画像とO画像のプロファイルが同一であるものとしたが、異なるようにすることもできる。
[ビットストリームの他の構成例]
図63は、図56においてR画像とO画像のプロファイルが異なる場合のアクセスユニット単位のビットストリームの構成例を示す図である。
図63のビットストリームの構成は、画像用のMVC方式のSubset SPSと視差画像用の3DV方式のSubset SPSのほかに、画像用の3DV方式のSubset SPSが配置される点が、図56のビットストリームの構成と異なっている。
画像用のMVC方式のSubset SPSのNALユニット(Subset SPS1)は、MVC方式で定義されるプロファイルのうちのR画像のプロファイルを表すprofile_idc(図63の例では128)を含むSubset SPSのNALユニットである。画像用の3DV方式のSubset SPS(Subset SPS2)のNALユニットは、3DV方式で画像用のプロファイルとして定義されるプロファイルのうちのO画像のプロファイルを表すprofile_idc(図63の例では148)を含むSubset SPSのNALユニットである。視差画像用のSubset SPS(Subset SPS3)のNALユニットは、3DV方式で視差画像用のプロファイルとして定義されるプロファイルのうちの、L視差画像、R視差画像、およびO視差画像のプロファイルを表すprofile_idc(図63の例では138)を含むSubset SPSのNALユニットである。
[画像用の3DV方式のSubset SPSの記述例]
図64は、図63の画像用の3DV方式のSubset SPSの記述例を示す図である。
図64に示すように、画像用の3DV方式のSubset SPSは、画像Oのプロファイルを表すprofile_idc(図64の例では148)を含むSPS(seq_parameter_set_data)と、3DV方式で定義されているprofile_idcごとの情報とが記述されている。
具体的には、画像用の3DV方式のSubset SPSには、profile_idcが148であるときの情報として、MVC方式のSubset SPSと同様に、MVC方式の拡張情報(seq_parameter_set_mvc_extension)、MVC方式のVUI拡張情報が含まれるかどうかを表すMVC方式VUI情報フラグ(mvc_vui_parameters_present_flag)等が記述される。また、MVC方式VUI情報フラグが、MVC方式のVUI拡張情報が含まれることを表す場合には、MVC方式のVUI拡張情報(mvc_vui_parameters_extension)も記述される。また、profile_idcが138であるときの情報としては、図57と同様の情報が記述される。
なお、3DV方式は、AVC方式やMVC方式ではなく、HEVC(High Efficiency Video Coding)方式に準じた多視点方式での表示用の画像を符号化するための方式であるようにしてもよい。この場合のビットストリームについて以下に説明する。なお、本明細書では、HEVC方式が、HEVC Working Draft:Thomas Wiegand,Woo-jin Han,Benjamin Bross,Jens-Rainer Ohm,Gary J. Sullivian,“WD3:Working Draft3 of High-Efficiency Video Coding”,JCTVc-E603_d5(version5),2011年5月20日の記載に基づくものであるとする。
<3DV方式がHEVC方式に準じた方式である場合のビットストリーム>
[ビットストリームの構成例]
図65は、3DV方式がHEVC方式に準じた方式である場合のアクセスユニット単位のビットストリームの構成例を示す図である。
なお、図65の例では、図56の例と同様のL視点画像、R視点画像、およびO視点画像が符号化対象とされ、L画像がAVC方式で符号化され、L視差画像、R視点画像、およびO視点画像が3DV方式で符号化される。
図65のビットストリームは、画像用の3DV方式のSubset SPS(SubsetSPS1)と視差画像用の3DV方式のSubset SPS(Subset SPS2)をSPS内に記述可能である点、HEVC方式のSEIと3DV方式のSEIのNALユニットに、それぞれ別のNALユニットのタイプを含むNALヘッダが付加される点が、図56のビットストリームと異なっている。
図65のビットストリームでは、画像用の3DV方式のSubset SPSと視差画像用の3DV方式のSubset SPSをSPS内にのみ記述させたり、SPSとは別に記述させたり、SPSに記述させるとともにSPSとは別に記述させたりすることができる。なお、画像用の3DV方式のSubset SPSと視差画像用の3DV方式のSubset SPSが、SPSと別に記述されることは、BD規格に準拠して、HEVC方式の符号化データと3DV方式の符号化データを別のES(Elementary Stream)として生成する場合に好適である。
また、図65のビットストリームでは、HEVC方式のSEIのNALユニットと3DV方式のSEIのNALユニットに付加されるNALヘッダに含まれるNALユニットのタイプが異なるため、復号時にHEVC方式のSEIや3DV方式のSEIのNALユニットを容易に抽出することができる。
[SPSの記述例]
図66は、図65のSPSの記述例を示す図である。
図66のSPSの記述は、Subset SPSの情報が含まれるかどうかを表すSubset SPS情報フラグ(subset_seq_present_flag)が記述される点、および、Subset SPS情報フラグがSubset SPSの情報が含まれることを表す場合にSubset SPSの情報が記述される点を除いて、HEVC方式のSPSの記述と同様である。
図66に示すように、Subset SPSの情報は、Subset SPSの数(num_subset_seq)と、Subset SPSを含むかどうかを表すSubset SPSフラグ(subset_seq_info_present_flag)を含む。また、Subset SPSフラグが、Subset SPSを含むことを表す場合、Subset SPSの情報には、Subset SPS(subset_seq_parameter_set_data)も含まれる。
以上のように、Subset SPSの情報としてSubset SPSの数が記述されるので、復号時にSPSの記述を読み出すだけで、Subset SPSが存在するかどうかを認識することができる。また、Subset SPSフラグが記述されるので、Subset SPSをSPS内に記述せずにSPSとは別に記述することができ、Subset SPSの記述の重複を防止することができる。
[Subset SPSの記述例]
図67は、図66のSubset SPSの記述例を示す図である。
図67のSubset SPSの記述は、Subset SPSを適応する画像および視差画像のビューIDの数(num_subset_seq_views)、Subset SPSの適応対象が視差画像であるかどうかを表す視差画像用フラグ(depth_extension_flag)、およびSubset SPSの適応時にSPSを無効にするかどうかを表す無効フラグ(seq_param_override_flag)が記述される点を除いて、HEVC方式のSPSの記述と同様である。
視差画像用フラグが、Subset SPSの適応対象が視差画像であることを表す場合、Subset SPSには、適応対象の視差画像に対応する画像のビューID(ref_view_id)が記述される。また、無効フラグが、Subset SPSの適応時にSPSを無効にすることを表す場合、Subset SPSには、SPSと同様に、プロファイルを表す情報(subset_seq_profile_idc)等が記述される。
また、Subset SPSの記述のうちのSPSの記述と同様の記述としては、例えば、適応する画像および視差画像がクロッピングされているかどうかを表す情報(subset_seq_frame_cropping_flag)、VUI情報(subset_seq_vui_parameters)を含むかどうかを表すVUI情報フラグ(subset_seq_vui_parameters_present_flag)等がある。VUI情報フラグがVUI情報を含むことを表す場合、SPSと同様にVUI情報も記述される。一方、VUI情報フラグがVUI情報を含まないことを表す場合、SPSと同様にVUI情報が記述されない。この場合、VUI情報としてはSPSのVUI情報が適応される。
[Subset SPSのVUI情報の記述例]
図68は、図67のSubset SPSのVUI情報の記述例を示す図である。
図68のSubset SPSのVUI情報の記述は、適応対象の変換前サイズ情報が含まれるかどうかを表す変換前サイズ情報フラグ(video_src_info_present_flag)が記述される点を除いて、HEVC方式のSPSのVUI情報の記述と同様である。
なお、変換前サイズ情報フラグが適応対象の変換前サイズ情報が含まれることを表す場合、図68のVUI情報には、変換前サイズ情報が記述される。即ち、解像度変換前の適応対象の横方向のマクロブロック数を表す情報(src_pic_width_in_mbs_minus1)および縦方向のマクロブロック数を表す情報(src_pic_height_in_mbs_minus1)、アスペクト比を表すアスペクト情報が含まれるかどうかを表すアスペクト比フラグ(src_aspect_ratio_info_present_flag)等が記述される。
そして、アスペクト比フラグが、アスペクト情報が含まれることを表す場合、変換前サイズ情報には、アスペクト比ID(src_aspect_ratio_idc)等からなるアスペクト情報も含まれる。そして、アスペクト情報に含まれるアスペクト比IDが、定義されていないアスペクト比全体に対して付与されたアスペクト比ID(Extended_SAR)である場合、アスペクト情報には、解像度変換前の適応対象のアスペクト比における横方向の値(sar_width)と縦方向の値(sar_height)も含まれる。
なお、図68のSubset SPSのVUI情報は、SPSのVUI情報と異なる点だけ記述されるようにしてもよい。この場合、Subset SPSのVUI情報のうちの記述されない情報については、SPSのVUI情報に含まれる情報が適用される。
[SEIの記述例]
図69は、図65の3DV方式のSEIの記述例を示す図である。
図69の3DV方式のSEIの記述は、SEIメッセージのタイプ(nesting_type)、全コンポーネントフラグ(all_view_components_in_au_flag)等が記述される点を除いて、SEIメッセージのタイプのSEIメッセージの記述と同様である。
SEIメッセージのタイプとしては、MVC方式のSEIメッセージ、3DV方式のSEIメッセージ、ユーザにより定義されたSEIメッセージなどがある。また、全コンポーネントフラグが、アクセスユニット内の全ての画像および視差画像に適応しないことを表す場合、3DV方式のSEIには、SEIのメッセージを適応する画像および視差画像のビューIDの数(num_view_components_minus1)と、その数だけのビューID(nesting_sei_view_id)も記述される。
<第8実施の形態>
[本技術を適用したコンピュータの説明]
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
そこで、図70は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
プログラムは、コンピュータに内蔵されている記録媒体としての記憶部808やROM(Read Only Memory)802に予め記録しておくことができる。
あるいはまた、プログラムは、リムーバブルメディア811に格納(記録)しておくことができる。このようなリムーバブルメディア811は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブルメディア811としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。
なお、プログラムは、上述したようなリムーバブルメディア811からドライブ810を介してコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵する記憶部808にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。
コンピュータは、CPU(Central Processing Unit)801を内蔵しており、CPU801には、バス804を介して、入出力インタフェース805が接続されている。
CPU801は、入出力インタフェース805を介して、ユーザによって、入力部806が操作等されることにより指令が入力されると、それに従って、ROM802に格納されているプログラムを実行する。あるいは、CPU801は、記憶部808に格納されたプログラムを、RAM(Random Access Memory)803にロードして実行する。
これにより、CPU801は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU801は、その処理結果を、必要に応じて、例えば、入出力インタフェース805を介して、出力部807から出力、あるいは、通信部809から送信、さらには、記憶部808に記録等させる。
なお、入力部806は、キーボードや、マウス、マイク等で構成される。また、出力部807は、LCD(Liquid Crystal Display)やスピーカ等で構成される。
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。
また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
本技術は、衛星放送、ケーブルTV(テレビジョン)、インターネット、および携帯電話機などのネットワークメディアを介して受信する際に、あるいは、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる符号化装置および復号装置に適用することができる。
また、上述した符号化装置および復号装置は、任意の電子機器に適用することができる。以下にその例について説明する。
<第9実施の形態>
[テレビジョン装置の構成例]
図71は、本技術を適用したテレビジョン装置の概略構成を例示している。テレビジョン装置900は、アンテナ901、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、表示部906、音声信号処理部907、スピーカ908、外部インタフェース部909を有している。さらに、テレビジョン装置900は、制御部910、ユーザインタフェース部911等を有している。
チューナ902は、アンテナ901で受信された放送波信号から所望のチャンネルを選局して復調を行い、得られた符号化ビットストリームをデマルチプレクサ903に出力する。
デマルチプレクサ903は、符号化ビットストリームから視聴対象である番組の映像や音声のパケットを抽出して、抽出したパケットのデータをデコーダ904に出力する。また、デマルチプレクサ903は、EPG(Electronic Program Guide)等のデータのパケットを制御部910に供給する。なお、スクランブルが行われている場合、デマルチプレクサ等でスクランブルの解除を行う。
デコーダ904は、パケットの復号化処理を行い、復号処理化によって生成された映像データを映像信号処理部905、音声データを音声信号処理部907に出力する。
映像信号処理部905は、映像データに対して、ノイズ除去やユーザ設定に応じた映像処理等を行う。映像信号処理部905は、表示部906に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成する。また、映像信号処理部905は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それを番組の映像データに重畳する。映像信号処理部905は、このようにして生成した映像データに基づいて駆動信号を生成して表示部906を駆動する。
表示部906は、映像信号処理部905からの駆動信号に基づき表示デバイス(例えば液晶表示素子等)を駆動して、番組の映像などを表示させる。
音声信号処理部907は、音声データに対してノイズ除去などの所定の処理を施し、処理後の音声データのD/A変換処理や増幅処理を行いスピーカ908に供給することで音声出力を行う。
外部インタフェース部909は、外部機器やネットワークと接続するためのインタフェースであり、映像データや音声データ等のデータ送受信を行う。
制御部910にはユーザインタフェース部911が接続されている。ユーザインタフェース部911は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部910に供給する。
制御部910は、CPU(Central Processing Unit)やメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータ、EPGデータ、ネットワークを介して取得されたデータ等を記憶する。メモリに記憶されているプログラムは、テレビジョン装置900の起動時などの所定タイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、テレビジョン装置900がユーザ操作に応じた動作となるように各部を制御する。
なお、テレビジョン装置900では、チューナ902、デマルチプレクサ903、映像信号処理部905、音声信号処理部907、外部インタフェース部909等と制御部910を接続するためバス912が設けられている。
このように構成されたテレビジョン装置では、デコーダ904に本願の復号装置(復号方法)の機能が設けられる。このため、多視点の画像に対して、既存の方式との互換性を有する方式で復号を行うことができる。
<第10実施の形態>
[携帯電話機の構成例]
図72は、本技術を適用した携帯電話機の概略構成を例示している。携帯電話機920は、通信部922、音声コーデック923、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、制御部931を有している。これらは、バス933を介して互いに接続されている。
また、通信部922にはアンテナ921が接続されており、音声コーデック923には、スピーカ924とマイクロホン925が接続されている。さらに制御部931には、操作部932が接続されている。
携帯電話機920は、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。
音声通話モードにおいて、マイクロホン925で生成された音声信号は、音声コーデック923で音声データへの変換やデータ圧縮が行われて通信部922に供給される。通信部922は、音声データの変調処理や周波数変換処理等を行い、送信信号を生成する。また、通信部922は、送信信号をアンテナ921に供給して図示しない基地局へ送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、得られた音声データを音声コーデック923に供給する。音声コーデック923は、音声データのデータ伸張やアナログ音声信号への変換を行いスピーカ924に出力する。
また、データ通信モードにおいて、メール送信を行う場合、制御部931は、操作部932の操作によって入力された文字データを受け付けて、入力された文字を表示部930に表示する。また、制御部931は、操作部932におけるユーザ指示等に基づいてメールデータを生成して通信部922に供給する。通信部922は、メールデータの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ921から送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、メールデータを復元する。このメールデータを、表示部930に供給して、メール内容の表示を行う。
なお、携帯電話機920は、受信したメールデータを、記録再生部929で記憶媒体に記憶させることも可能である。記憶媒体は、書き換え可能な任意の記憶媒体である。例えば、記憶媒体は、RAMや内蔵型フラッシュメモリ等の半導体メモリ、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカード等のリムーバブルメディアである。
データ通信モードにおいて画像データを送信する場合、カメラ部926で生成された画像データを、画像処理部927に供給する。画像処理部927は、画像データの符号化処理を行い、符号化データを生成する。
多重分離部928は、画像処理部927で生成された符号化データと、音声コーデック923から供給された音声データを所定の方式で多重化して通信部922に供給する。通信部922は、多重化データの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ921から送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、多重化データを復元する。この多重化データを多重分離部928に供給する。多重分離部928は、多重化データの分離を行い、符号化データを画像処理部927、音声データを音声コーデック923に供給する。画像処理部927は、符号化データの復号化処理を行い、画像データを生成する。この画像データを表示部930に供給して、受信した画像の表示を行う。音声コーデック923は、音声データをアナログ音声信号に変換してスピーカ924に供給して、受信した音声を出力する。
このように構成された携帯電話装置では、画像処理部927に本願の復号装置(復号方法)の機能が設けられる。このため、画像データの通信において、符号化ストリームを復号化して復号画像データを生成するとき、多視点の画像に対して、既存の方式との互換性を有する方式で復号を行うことができる。
<第11実施の形態>
[記録再生装置の構成例]
図73は、本技術を適用した記録再生装置の概略構成を例示している。記録再生装置940は、例えば受信した放送番組のオーディオデータとビデオデータを、記録媒体に記録して、その記録されたデータをユーザの指示に応じたタイミングでユーザに提供する。また、記録再生装置940は、例えば他の装置からオーディオデータやビデオデータを取得し、それらを記録媒体に記録させることもできる。さらに、記録再生装置940は、記録媒体に記録されているオーディオデータやビデオデータを復号して出力することで、モニタ装置等において画像表示や音声出力を行うことができるようにする。
記録再生装置940は、チューナ941、外部インタフェース部942、エンコーダ943、HDD(Hard Disk Drive)部944、ディスクドライブ945、セレクタ946、デコーダ947、OSD(On-Screen Display)部948、制御部949、ユーザインタフェース部950を有している。
チューナ941は、図示しないアンテナで受信された放送信号から所望のチャンネルを選局する。チューナ941は、所望のチャンネルの受信信号を復調して得られた符号化ビットストリームをセレクタ946に出力する。
外部インタフェース部942は、IEEE1394インタフェース、ネットワークインタフェース部、USBインタフェース、フラッシュメモリインタフェース等の少なくともいずれかで構成されている。外部インタフェース部942は、外部機器やネットワーク、メモリカード等と接続するためのインタフェースであり、記録する映像データや音声データ等のデータ受信を行う。
エンコーダ943は、外部インタフェース部942から供給された映像データや音声データが符号化されていないとき所定の方式で符号化を行い、符号化ビットストリームをセレクタ946に出力する。
HDD部944は、映像や音声等のコンテンツデータ、各種プログラムやその他のデータ等を内蔵のハードディスクに記録し、また再生時等にそれらを当該ハードディスクから読み出す。
ディスクドライブ945は、装着されている光ディスクに対する信号の記録および再生を行う。光ディスク、例えばDVDディスク(DVD−Video、DVD−RAM、DVD−R、DVD−RW、DVD+R、DVD+RW等)やBlu−rayディスク等である。
セレクタ946は、映像や音声の記録時には、チューナ941またはエンコーダ943からのいずれかの符号化ビットストリームを選択して、HDD部944やディスクドライブ945のいずれかに供給する。また、セレクタ946は、映像や音声の再生時に、HDD部944またはディスクドライブ945から出力された符号化ビットストリームをデコーダ947に供給する。
デコーダ947は、符号化ビットストリームの復号化処理を行う。デコーダ947は、復号処理化を行うことにより生成された映像データをOSD部948に供給する。また、デコーダ947は、復号処理化を行うことにより生成された音声データを出力する。
OSD部948は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それをデコーダ947から出力された映像データに重畳して出力する。
制御部949には、ユーザインタフェース部950が接続されている。ユーザインタフェース部950は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部949に供給する。
制御部949は、CPUやメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータを記憶する。メモリに記憶されているプログラムは、記録再生装置940の起動時などの所定タイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、記録再生装置940がユーザ操作に応じた動作となるように各部を制御する。
このように構成された記録再生装置では、エンコーダ943に本願の符号化装置(符号化方法)の機能が設けられる。このため、符号化ストリームを復号化して復号画像データを生成するとき、多視点の画像に対して、既存の方式との互換性を有する方式で符号化を行うことができる。
<第12実施の形態>
[撮像装置の構成例]
図74は、本技術を適用した撮像装置の概略構成を例示している。撮像装置960は、被写体を撮像し、被写体の画像を表示部に表示させたり、それを画像データとして、記録媒体に記録する。
撮像装置960は、光学ブロック961、撮像部962、カメラ信号処理部963、画像データ処理部964、表示部965、外部インタフェース部966、メモリ部967、メディアドライブ968、OSD部969、制御部970を有している。また、制御部970には、ユーザインタフェース部971が接続されている。さらに、画像データ処理部964や外部インタフェース部966、メモリ部967、メディアドライブ968、OSD部969、制御部970等は、バス972を介して接続されている。
光学ブロック961は、フォーカスレンズや絞り機構等を用いて構成されている。光学ブロック961は、被写体の光学像を撮像部962の撮像面に結像させる。撮像部962は、CCDまたはCMOSイメージセンサを用いて構成されており、光電変換によって光学像に応じた電気信号を生成してカメラ信号処理部963に供給する。
カメラ信号処理部963は、撮像部962から供給された電気信号に対してニー補正やガンマ補正、色補正等の種々のカメラ信号処理を行う。カメラ信号処理部963は、カメラ信号処理後の画像データを画像データ処理部964に供給する。
画像データ処理部964は、カメラ信号処理部963から供給された画像データの符号化処理を行う。画像データ処理部964は、符号化処理を行うことにより生成された符号化データを外部インタフェース部966やメディアドライブ968に供給する。また、画像データ処理部964は、外部インタフェース部966やメディアドライブ968から供給された符号化データの復号化処理を行う。画像データ処理部964は、復号化処理を行うことにより生成された画像データを表示部965に供給する。また、画像データ処理部964は、カメラ信号処理部963から供給された画像データを表示部965に供給する処理や、OSD部969から取得した表示用データを、画像データに重畳させて表示部965に供給する。
OSD部969は、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを生成して画像データ処理部964に出力する。
外部インタフェース部966は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタと接続される。また、外部インタフェース部966には、必要に応じてドライブが接続され、磁気ディスク、光ディスク等のリムーバブルメディアが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、インストールされる。さらに、外部インタフェース部966は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。制御部970は、例えば、ユーザインタフェース部971からの指示にしたがって、メモリ部967から符号化データを読み出し、それを外部インタフェース部966から、ネットワークを介して接続される他の装置に供給させることができる。また、制御部970は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース部966を介して取得し、それを画像データ処理部964に供給したりすることができる。
メディアドライブ968で駆動される記録メディアとしては、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアが用いられる。また、記録メディアは、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ICカード等であってもよい。
また、メディアドライブ968と記録メディアを一体化し、例えば、内蔵型ハードディスクドライブやSSD(Solid State Drive)等のように、非可搬性の記憶媒体により構成されるようにしてもよい。
制御部970は、CPUやメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータ等を記憶する。メモリに記憶されているプログラムは、撮像装置960の起動時などの所定タイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、撮像装置960がユーザ操作に応じた動作となるように各部を制御する。
このように構成された撮像装置では、画像データ処理部964に本願の復号装置(復号方法)の機能が設けられる。このため、メモリ部967や記録メディア等に記録された符号化データを復号化して復号画像データを生成するとき、多視点の画像に対して、既存の方式との互換性を有する方式で復号を行うことができる。
なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
50 符号化装置, 52 画像変換部, 53 視差画像生成部, 55 互換情報生成部, 56 視点間距離情報生成部, 59 多重化部, 61 互換用エンコーダ, 62 補助用エンコーダ, 120 復号装置, 121 分離部, 127 画像生成部, 131 互換用デコーダ, 132 補助用デコーダ, 140 符号化装置, 142 画像変換部, 143 視差画像生成部, 144 視点間距離情報生成部, 151 互換用エンコーダ, 152 補助用エンコーダ, 170 復号装置, 171 画像生成部, 180 符号化装置, 181 画像変換部, 191 互換用エンコーダ, 200 復号装置, 202 画像生成部, 211 互換用デコーダ

Claims (18)

  1. 多視点の画像から互換画像を指定し、指定した前記互換画像を符号化して第1の符号化ストリームを生成する互換画像符号化部と、
    前記互換画像から多視点画像を生成する際に用いる補助画像を低解像度化する画像変換部と、
    前記画像変換部により低解像度化された前記補助画像を符号化して、第2の符号化ストリームを生成する補助画像符号化部と、
    前記互換画像符号化部により生成された前記第1の符号化ストリームと、前記補助画像符号化部により生成された前記第2の符号化ストリームとを伝送する伝送部と
    を備える符号化装置。
  2. 前記補助画像を符号化する際の解像度が前記互換画像の解像度と異なることを識別する補助画像解像度識別情報を設定する設定部
    をさらに備え、
    前記伝送部は、前記設定部により設定された前記補助画像解像度識別情報を伝送する
    請求項1に記載の符号化装置。
  3. 前記設定部は、前記補助画像の解像度の変換方式を示す補助画像変換方式情報を設定し、
    前記伝送部は、前記設定部により設定された前記補助画像変換方式情報を伝送する
    請求項2に記載の符号化装置。
  4. 前記補助画像の視差を表す補助視差画像を符号化する視差画像符号化部
    をさらに備え、
    前記画像変換部は、前記補助視差画像を低解像度化し、
    前記視差画像符号化部は、前記画像変換部により低解像度化された前記補助視差画像を符号化する
    請求項1に記載の符号化装置。
  5. 前記補助視差画像を符号化する際の解像度が前記互換画像の解像度と異なることを識別する補助視差画像解像度識別情報を設定する設定部
    をさらに備え、
    前記伝送部は、前記設定部により設定された前記補助視差画像解像度識別情報を伝送する
    請求項4に記載の符号化装置。
  6. 前記設定部は、前記補助視差画像の解像度の変換方式を示す補助視差画像変換方式情報を設定し
    前記伝送部は、前記設定部により設定された前記補助視差画像変換方式情報を伝送する
    請求項5に記載の符号化装置。
  7. 前記画像変換部により低解像度化された前記補助視差画像を多重化する多重化部と、
    前記補助視差画像の多重化方式を示す補助視差画像多重化方式情報を設定する設定部と
    をさらに備え、
    前記視差画像符号化部は、前記多重化部により多重化された前記補助視差画像を符号化し、
    前記伝送部は、前記設定部により設定された前記補助視差画像多重化方式情報を伝送する
    請求項4に記載の符号化装置。
  8. 前記画像変換部は、低解像度化された前記補助画像を多重化し、
    前記設定部は、前記補助画像の多重化方式を示す補助画像多重化方式情報を設定し、
    前記補助画像符号化部は、前記画像変換部により多重化された前記補助画像を符号化し、
    前記伝送部は、前記設定部により設定された前記補助画像多重化方式情報を伝送する
    請求項2に記載の符号化装置。
  9. 符号化装置が、
    多視点の画像から互換画像を指定し、指定した前記互換画像を符号化して第1の符号化ストリームを生成する互換画像符号化ステップと、
    前記互換画像から多視点画像を生成する際に用いる補助画像を低解像度化する画像変換ステップと、
    前記画像変換ステップの処理により低解像度化された前記補助画像を符号化して、第2の符号化ストリームを生成する補助画像符号化ステップと、
    前記互換画像符号化ステップの処理により生成された前記第1の符号化ストリームと、前記補助画像符号化ステップの処理により生成された前記第2の符号化ストリームとを伝送する伝送ステップと
    を含む符号化方法。
  10. 多視点の画像から指定された互換画像が符号化された結果得られる第1の符号化ストリームと、前記互換画像から多視点画像を生成する際に用いる補助画像が低解像度化され、符号化された結果得られる第2の符号化ストリームとを受け取る受け取り部と、
    前記受け取り部により受け取られた前記第1の符号化ストリームを復号する互換画像復号部と、
    前記受け取り部により受け取られた前記第2の符号化ストリームを復号する補助画像復号部と、
    前記補助画像復号部による復号の結果得られる低解像度化された前記補助画像を高解像度化する画像変換部と
    を備える復号装置。
  11. 前記受け取り部は、前記補助画像を符号化する際の解像度が前記互換画像の解像度と異なることを識別する補助画像解像度識別情報を受け取り、
    前記画像変換部は、前記受け取り部により受け取られた前記補助画像解像度識別情報に基づいて、低解像度化された前記補助画像を高解像度化する
    請求項10に記載の復号装置。
  12. 前記受け取り部は、前記補助画像の解像度の変換方式を示す補助画像変換方式情報を受け取り、
    前記画像変換部は、前記受け取り部により受け取られた前記補助画像変換方式情報に基づいて、低解像度化された前記補助画像を高解像度化する
    請求項11に記載の復号装置。
  13. 前記補助画像の視差を表す補助視差画像が低解像度化され、符号化された結果得られる視差符号化ストリームを復号する視差画像復号部
    をさらに備え、
    前記受け取り部は、前記視差符号化ストリームを受け取り、
    前記画像変換部は、前記視差画像復号部による復号の結果得られる低解像度化された前記補助視差画像を高解像度化する
    請求項10に記載の復号装置。
  14. 前記受け取り部は、前記補助視差画像を符号化する際の解像度が前記互換画像の解像度と異なることを識別する補助視差画像解像度識別情報を受け取り、
    前記画像変換部は、前記受け取り部により受け取られた前記補助視差画像解像度識別情報に基づいて、低解像度化された前記補助視差画像を高解像度化する
    請求項13に記載の復号装置。
  15. 前記受け取り部は、前記補助視差画像の解像度の変換方式を示す補助視差画像変換方式情報を受け取り、
    前記画像変換部は、前記受け取り部により受け取られた前記補助視差画像変換方式情報に基づいて、低解像度化された前記補助視差画像を高解像度化する
    請求項14に記載の復号装置。
  16. 多重化された前記補助視差画像を分離する分離部
    をさらに備え、
    前記視差符号化ストリームは、低解像度化され、多重化された前記補助視差画像が符号化された結果得られ、
    前記受け取り部は、前記補助視差画像の多重化方式を示す補助視差画像多重化方式情報を受け取り、
    前記分離部は、前記受け取り部により受け取られた前記補助視差画像多重化方式情報に基づいて、前記視差画像復号部による復号の結果得られる、低解像度化され、多重化された前記補助視差画像を分離し、
    前記画像変換部は、前記分離部による分離の結果得られる低解像度化された前記補助視差画像を高解像度化する
    請求項13に記載の復号装置。
  17. 前記第2の符号化ストリームは、低解像度化され、多重化された前記補助画像が符号化された結果得られ、
    前記受け取り部は、前記補助画像の多重化方式を示す補助画像多重化方式情報を受け取り、
    前記分離部は、前記受け取り部により受け取られた前記補助画像多重化方式情報に基づいて、前記補助画像復号部による復号の結果得られる、低解像度化され、多重化された前記補助画像を分離し、
    前記画像変換部は、前記分離部による分離の結果得られる低解像度化された前記補助画像を高解像度化する
    請求項11に記載の復号装置。
  18. 復号装置が、
    多視点の画像から指定された互換画像が符号化された結果得られる第1の符号化ストリームと、前記互換画像から多視点画像を生成する際に用いる補助画像が低解像度化され、符号化された結果得られる第2の符号化ストリームとを受け取る受け取りステップと、
    前記受け取りステップの処理により受け取られた前記第1の符号化ストリームを復号する互換画像復号ステップと、
    前記受け取りステップの処理により受け取られた前記第2の符号化ストリームを復号する補助画像復号ステップと、
    前記補助画像復号ステップの処理による復号の結果得られる低解像度化された前記補助画像を高解像度化する画像変換ステップと
    を含む復号方法。
JP2012531953A 2010-09-03 2011-08-31 符号化装置および符号化方法、並びに復号装置および復号方法 Abandoned JPWO2012029886A1 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2010198350 2010-09-03
JP2010198350 2010-09-03
JP2010228277 2010-10-08
JP2010228277 2010-10-08
JP2011131678 2011-06-13
JP2011131678 2011-06-13
PCT/JP2011/069843 WO2012029886A1 (ja) 2010-09-03 2011-08-31 符号化装置および符号化方法、並びに復号装置および復号方法

Publications (1)

Publication Number Publication Date
JPWO2012029886A1 true JPWO2012029886A1 (ja) 2013-10-31

Family

ID=45772963

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012531953A Abandoned JPWO2012029886A1 (ja) 2010-09-03 2011-08-31 符号化装置および符号化方法、並びに復号装置および復号方法

Country Status (11)

Country Link
US (1) US9338430B2 (ja)
EP (1) EP2592839A4 (ja)
JP (1) JPWO2012029886A1 (ja)
KR (1) KR20130108259A (ja)
CN (1) CN103069816A (ja)
AU (1) AU2011296956A1 (ja)
BR (1) BR112013004452A2 (ja)
CA (1) CA2806783A1 (ja)
MX (1) MX2013002135A (ja)
RU (1) RU2013108074A (ja)
WO (1) WO2012029886A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112013004454A2 (pt) * 2010-09-03 2016-06-07 Sony Corp dispositivos e métodos de codificação e de decodificação
US20140085418A1 (en) * 2011-05-16 2014-03-27 Sony Corporation Image processing device and image processing method
KR102009049B1 (ko) 2011-11-11 2019-08-08 소니 주식회사 송신 장치, 송신 방법, 수신 장치 및 수신 방법
KR101715784B1 (ko) * 2012-04-16 2017-03-13 노키아 테크놀로지스 오와이 비디오 코딩 방법 및 장치
CN103379332A (zh) * 2012-04-25 2013-10-30 浙江大学 三维视频序列辅助信息的解码方法、编码方法及装置
JP6379036B2 (ja) * 2012-08-24 2018-08-22 アイキューブド研究所株式会社 送信装置、画像送信方法、および画像送受信方法
US20150373354A1 (en) * 2013-01-07 2015-12-24 Samsung Electronics Co., Ltd. Method and device for encoding/decoding image so that image is compatible with multiple codecs
JP2015076765A (ja) * 2013-10-09 2015-04-20 キヤノン株式会社 画像処理装置及びその制御方法、並びに、コンピュータプログラム
US10284858B2 (en) * 2013-10-15 2019-05-07 Qualcomm Incorporated Support of multi-mode extraction for multi-layer video codecs
WO2016140060A1 (ja) * 2015-03-05 2016-09-09 ソニー株式会社 画像処理装置および画像処理方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0870473A (ja) 1994-08-29 1996-03-12 Nippon Telegr & Teleph Corp <Ntt> 距離情報を用いた立体画像の通信方式
JP2000308089A (ja) * 1999-04-16 2000-11-02 Nippon Hoso Kyokai <Nhk> 立体画像符号化装置および復号化装置
JP4793366B2 (ja) 2006-10-13 2011-10-12 日本ビクター株式会社 多視点画像符号化装置、多視点画像符号化方法、多視点画像符号化プログラム、多視点画像復号装置、多視点画像復号方法、及び多視点画像復号プログラム
WO2008054100A1 (en) 2006-11-01 2008-05-08 Electronics And Telecommunications Research Institute Method and apparatus for decoding metadata used for playing stereoscopic contents
KR101362941B1 (ko) * 2006-11-01 2014-02-17 한국전자통신연구원 스테레오스코픽 콘텐츠 재생에 이용되는 메타 데이터의복호화 방법 및 장치
WO2008108566A1 (en) * 2007-03-02 2008-09-12 Lg Electronics Inc. A method and an apparatus for decoding/encoding a video signal
CN101669370B (zh) 2007-04-25 2012-12-12 汤姆逊许可证公司 具有下采样参考图片的视角间预测
KR100918862B1 (ko) 2007-10-19 2009-09-28 광주과학기술원 참조영상을 이용한 깊이영상 생성방법 및 그 장치, 생성된깊이영상을 부호화/복호화하는 방법 및 이를 위한인코더/디코더, 그리고 상기 방법에 따라 생성되는 영상을기록하는 기록매체
JP4984184B2 (ja) 2009-04-08 2012-07-25 ソニー株式会社 再生装置および再生方法
CN101668205B (zh) * 2009-09-25 2011-04-20 南京邮电大学 基于残差宏块自适应下采样立体视频压缩编码方法
CN101729892B (zh) 2009-11-27 2011-07-27 宁波大学 一种非对称立体视频编码方法
US9025933B2 (en) 2010-02-12 2015-05-05 Sony Corporation Information processing device, information processing method, playback device, playback method, program and recording medium
WO2012012584A1 (en) * 2010-07-21 2012-01-26 Dolby Laboratories Licensing Corporation Systems and methods for multi-layered frame-compatible video delivery

Also Published As

Publication number Publication date
EP2592839A4 (en) 2014-08-06
US20130141535A1 (en) 2013-06-06
AU2011296956A1 (en) 2013-02-14
CN103069816A (zh) 2013-04-24
KR20130108259A (ko) 2013-10-02
RU2013108074A (ru) 2014-08-27
EP2592839A1 (en) 2013-05-15
MX2013002135A (es) 2013-04-03
WO2012029886A1 (ja) 2012-03-08
CA2806783A1 (en) 2012-03-08
BR112013004452A2 (pt) 2016-06-07
US9338430B2 (en) 2016-05-10

Similar Documents

Publication Publication Date Title
WO2012029886A1 (ja) 符号化装置および符号化方法、並びに復号装置および復号方法
US9667941B2 (en) Encoding device, encoding method, decoding device, and decoding method
WO2012111756A1 (ja) 画像処理装置および画像処理方法
WO2012111757A1 (ja) 画像処理装置および画像処理方法
WO2012070500A1 (ja) 符号化装置および符号化方法、並びに、復号装置および復号方法
WO2012029883A1 (ja) 符号化装置および符号化方法、並びに復号装置および復号方法
JPWO2012147622A1 (ja) 画像処理装置、及び、画像処理方法
JP6206559B2 (ja) 復号装置、復号方法、プログラム、および記録媒体
WO2012029885A1 (ja) 画像処理装置および方法
WO2012111755A1 (ja) 画像処理装置および画像処理方法
JPWO2012128069A1 (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140711

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20150402